JP4859891B2 - Server, system and method for providing information related to contents - Google Patents
Server, system and method for providing information related to contents Download PDFInfo
- Publication number
- JP4859891B2 JP4859891B2 JP2008206596A JP2008206596A JP4859891B2 JP 4859891 B2 JP4859891 B2 JP 4859891B2 JP 2008206596 A JP2008206596 A JP 2008206596A JP 2008206596 A JP2008206596 A JP 2008206596A JP 4859891 B2 JP4859891 B2 JP 4859891B2
- Authority
- JP
- Japan
- Prior art keywords
- web page
- eco
- server
- page
- phrase
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
本発明は、端末で閲覧されるコンテンツに関連する情報を提供するサーバ、システム及び方法に関する。 The present invention Rusa over bus provides information related to the content to be viewed on the terminal, to a system and method.
従来、インターネットによる情報配信の形態として、例えば、入力された検索キーワードに関連する広告を検索結果ページに表示させる検索連動型広告や、Webページのコンテンツを解析し、コンテンツの内容に関連した広告をWebページに表示させるコンテンツマッチ型広告等のサービスが知られている。 Conventionally, as a form of information distribution via the Internet, for example, a search-linked advertisement that displays an advertisement related to an input search keyword on a search result page, or an advertisement related to the contents of a content by analyzing the contents of a web page Services such as content-matching advertisements to be displayed on Web pages are known.
このような状況において、より適切な広告配信を行うために、様々な方法が提案されている。例えば、特許文献1では、コンテンツのキーワードに加えて、クリック状況や流行等の条件に合わせて広告を提供する方法が提案されている。
ところで、近年、エコ(環境保全)に関する人々の関心が急速に高まってきている。そのため、環境に優しいエコ商品や行動が推奨され、多くの人々に共通の需要として、このようなエコに関する情報の提供が望まれている。 By the way, in recent years, people's interest in ecology (environmental conservation) has been rapidly increasing. Therefore, eco-friendly eco-products and behaviors are recommended, and it is desired to provide such eco-related information as a common demand for many people.
しかしながら、従来のコンテンツマッチ型広告では、ユーザ個人の嗜好に連動した情報を提供するのみで、コンテンツに表れない需要に連動した情報(例えば、上記のエコに関する情報)を提供することは難しかった。 However, in the conventional content match-type advertisement, it is difficult to provide information linked to demand that does not appear in the content (for example, information related to the above-described ecology) only by providing information linked to individual user preferences.
そこで本発明は、コンテンツに連動し、かつ、エコに関する情報を提供できるサーバ、システム及び方法を提供することを目的とする。 The present invention, in conjunction with the content, and aims to provide a server capable of providing information about the eco, systems and methods.
本発明では、以下のような解決手段を提供する。 The present invention provides the following solutions.
(1) 端末で閲覧されるコンテンツに関連する情報を提供するサーバであって、
前記コンテンツの特徴語を抽出する特徴語抽出手段と、
エコ分野に関する語句が含まれるWebページへのリンクデータと関連付けて、予め記憶されたエコの度合いを示すエコ・ウェイト、及び当該Webページの特徴語を参照する参照手段と、
前記特徴語抽出手段により抽出された特徴語と前記参照手段により参照された特徴語とが所定以上の一致度を持ち、かつ、所定値以上の前記エコ・ウェイトが付与された前記Webページを抽出するページ抽出手段と、
前記ページ抽出手段により抽出された前記Webページへのリンクデータを、前記コンテンツに付加し、前記端末へ送信する送信手段と、を備えるサーバ。
(1) A server that provides information related to content viewed on a terminal,
Feature word extraction means for extracting feature words of the content;
Reference means for referring to the eco-weight indicating the degree of eco stored in advance and the characteristic word of the web page in association with the link data to the web page including the phrase related to the eco field,
The reference feature word having a predetermined or higher degree of coincidence by the feature word and said reference means extracted by the feature word extraction means and extracting the Web page that a predetermined value or more of the Eco weights were granted Page extraction means to
Server and a transmission means for the link data to the Web pages extracted by the page extraction unit, it added to the content, and transmits to the terminal.
このような構成によれば、当該サーバは、コンテンツの特徴語を抽出し、エコ分野に関する語句が含まれるWebページへのリンクデータと関連付けて、予め記憶されたエコの度合いを示すエコ・ウェイト、及び当該Webページの特徴語を参照し、抽出されたコンテンツの特徴語と参照されたWebページの特徴語とが所定以上の一致度を持ち、かつ、所定値以上のエコ・ウェイトが付与されたWebページを抽出し、抽出されたWebページへのリンクデータを、コンテンツに付加し、端末へ送信する。 According to such a configuration, the server extracts feature words of the content, associates with link data to a Web page including a phrase related to the eco field, and stores an eco weight indicating a degree of eco stored in advance . and with reference to the feature words of the Web page, the feature words of Web pages that have been referenced with the characteristic word of the extracted content have more than predetermined matching degree, and a predetermined value or more eco weights were granted A Web page is extracted, link data to the extracted Web page is added to the content, and transmitted to the terminal.
このことにより、当該サーバは、コンテンツと特徴語が一致又は類似し、かつ、エコの度合いが高いWebページを抽出し、コンテンツに付加してユーザに提供することができる。したがって、例えば、ユーザが閲覧しているWebページ(コンテンツ)の内容に連動し、かつ、エコに関する情報(エコ商品やエコな行動等)が推薦情報として表示される。その結果、ユーザは、コンテンツに表れない暗黙の需要に応えたエコ情報を得ることができる。 As a result, the server can extract a Web page whose content and feature word match or are similar and have a high degree of ecology, add it to the content, and provide it to the user. Thus, for example, in conjunction with the contents of the Web page (content) that the user is browsing, and information about the eco (eco-products and eco-friendly behavior, etc.) are displayed as the recommendation information. As a result, the user can obtain eco information that meets the implicit demand that does not appear in the content.
(2) 前記エコ分野に関する語句と、当該語句に対するウェイトとを関連付けて記憶する語句記憶手段と、
前記Webページのテキストデータを解析し、当該Webページに含まれる語句を抽出する解析手段と、
前記解析手段により抽出された語句それぞれについて、前記語句記憶手段により記憶された前記ウェイトを参照し、当該Webページに対する前記エコ・ウェイトを算出する算出手段と、
前記算出手段により算出された前記エコ・ウェイト及び前記Webページの特徴語を、当該Webページへのリンクデータと関連付けて記憶するページ記憶手段と、をさらに備える(1)に記載のサーバ。
(2) a phrase storage means for storing a phrase related to the eco field and a weight for the phrase in association with each other;
Analyzing means for analyzing text data of the Web page and extracting a phrase included in the Web page;
For each word extracted by said analyzing means, with reference to the weight stored by the phrase storage unit, a calculation means for calculating the eco-weights for the Web page,
The server according to feature words of the Eco weight and the Web page that is calculated by the calculation means, the further comprises a page memory means for storing in association with the link data to the Web page, the (1).
このような構成によれば、当該サーバは、エコ分野に関する語句と、当該語句に対するウェイトとを関連付けて記憶し、Webページのテキストデータを解析し、当該Webページに含まれる語句を抽出し、抽出された語句それぞれについて、記憶されたウェイトを参照し、当該Webページに対するエコ・ウェイトを算出し、算出されたエコ・ウェイト及びWebページの特徴語を、当該Webページへのリンクデータと関連付けて記憶する。 According to such a configuration, the server stores the phrase related to the eco field and the weight for the phrase in association with each other, analyzes the text data of the Web page, extracts the phrase included in the Web page, and extracts it. For each word / phrase, the stored weight is referred to, an eco-weight for the Web page is calculated, and the calculated eco-weight and the Web page characteristic word are stored in association with link data to the Web page. To do.
このことにより、当該サーバは、エコ分野に関する語句をウェイトと共に記憶するので、Webページに含まれる当該語句のウェイトの積算値等により、当該Webページに付与されるエコ・ウェイトを算出することができる。したがって、当該サーバは、Webページのエコの度合いを示すエコ・ウェイトを、自動的に算出して記憶することができる。 As a result, the server stores words related to the eco field together with weights, so that the eco weight given to the Web page can be calculated from the integrated value of the weights of the words included in the Web page. . Therefore, the server can automatically calculate and store the eco weight indicating the eco level of the Web page.
(3) 複数の前記Webページを定期的に参照し、当該Webページのテキストデータを取得する取得手段をさらに備える(2)に記載のサーバ。 (3) a plurality of the Web page with reference periodically, according to further comprising acquisition means for acquiring text data of the Web page (2) server.
このような構成によれば、当該サーバは、複数のWebページを定期的に参照(クロール)するので、予めエコ情報の候補としてのWebページを収集し、当該Webページのテキストデータに基づいて、エコ・ウェイトを算出することができる。したがって、ユーザが閲覧するコンテンツに対して、即座に適切なエコ関連情報を提供できる可能性がある。 According to such a configuration, the server periodically refers to (crawls) a plurality of Web pages, so the Web pages as eco-information candidates are collected in advance, and based on the text data of the Web page, Eco-weight can be calculated. Therefore, there is a possibility that appropriate eco-related information can be immediately provided for the content browsed by the user.
(4) 前記参照手段は、前記Webページの特徴語それぞれに対する重要度を示すインデキシング・ウェイトをさらに参照し、
前記ページ抽出手段は、前記一致度に基づいて算出される前記インデキシング・ウェイトの総合ポイント及び前記エコ・ウェイトに関する、所定の条件を満たす前記Webページを抽出することを特徴とする(1)から(3)のいずれかに記載のサーバ。
(4) The reference means further refers to an indexing weight indicating an importance level for each feature word of the Web page,
The page extraction unit, the total point of the indexing weights calculated based on the identity and about the eco-weights, from and extracts a predetermined condition is satisfied the Web page (1) ( The server according to any one of 3).
このような構成によれば、当該サーバは、Webページの特徴語それぞれに対する重要度を示すインデキシング・ウェイトをさらに参照し、特徴語の一致度に基づいて算出されるインデキシング・ウェイトの総合ポイント及びエコ・ウェイトに関する、所定の条件を満たすWebページを抽出する。 According to such a configuration, the server further refers to the indexing weight indicating the degree of importance for each feature word of the Web page, and the indexing weight total point and ecology calculated based on the matching degree of the feature word -Web pages that satisfy a predetermined condition regarding weights are extracted.
このことにより、当該サーバは、一致又は類似した特徴語のインデキシング・ウェイトを積算する等して算出された総合ポイントと、エコ・ウェイトと、に関して所定の条件を予め設定しておくことにより、この条件を満たすWebページを提供することができる。したがって、当該サーバは、コンテンツマッチによる評価と、エコ度による評価と、を適宜調整して、提供する情報の種類や優先度を設定することができる。 As a result, the server sets a predetermined condition in advance for the total points calculated by adding up the indexing weights of the matching or similar feature words and the eco-weights. A Web page that satisfies a condition can be provided. Therefore, the server can appropriately adjust the evaluation based on the content match and the evaluation based on the eco level to set the type and priority of the information to be provided.
(5) 前記送信手段は、前記Webページへのリンクデータと共に、当該Webページから抽出されたテキストデータを、当該リンクデータのタイトルとして送信することを特徴とする(1)から(4)のいずれかに記載のサーバ。 (5) The transmission means transmits text data extracted from the Web page together with link data to the Web page as a title of the link data. The server described in Crab.
このような構成によれば、当該サーバは、端末へ送信されるリンクデータに対して、Webページから抽出されたタイトル情報を付加して送信する。したがって、ユーザは、提供されたWebページの内容をすぐに把握することができるので、必要な情報を容易に選択し、詳細情報を取得できる。 According to such a configuration, the server adds the title information extracted from the Web page to the link data transmitted to the terminal and transmits the link data. Therefore, the user can immediately grasp the contents of the provided web page, and can easily select necessary information and acquire detailed information.
(6) 前記送信手段は、前記Webページから、前記エコ分野に関する語句を含む当該語句の近辺のテキストデータを抽出して送信することを特徴とする(5)に記載のサーバ。 (6) The server according to (5), wherein the transmission unit extracts and transmits text data in the vicinity of the phrase including the phrase related to the eco field from the Web page.
このような構成によれば、当該サーバは、端末へ送信されるリンクデータに付加されるタイトル情報として、エコ分野に関する語句を含む当該語句の近辺のテキストデータを抽出する。したがって、ユーザは、提供されたリンクが、エコに関するどのような情報であるかをすぐに把握することができる。したがって、ユーザは、必要な情報を容易に選択し、エコに関する詳細情報を取得できる。 According to such a configuration, the server extracts text data in the vicinity of the phrase including the phrase related to the eco field as title information added to the link data transmitted to the terminal. Therefore, the user can immediately grasp what kind of information the provided link is about ecology. Therefore, the user can easily select necessary information and acquire detailed information on ecology.
(7) Webページを検索する検索サーバと、端末で閲覧されるコンテンツに関連する情報を提供する配信サーバと、を備えたシステムであって、
前記検索サーバは、
エコ分野に関する語句と、当該語句に対するウェイトとを関連付けて記憶する語句記憶手段と、
複数の前記Webページを定期的に参照し、当該Webページのテキストデータを取得する取得手段と、
前記Webページのテキストデータを解析し、当該Webページに含まれる語句を抽出する解析手段と、
前記解析手段により抽出された語句それぞれについて、前記語句記憶手段により記憶された前記ウェイトを参照し、当該Webページにおける総合ポイントとして、エコの度合いを示すエコ・ウェイトを算出する算出手段と、
前記算出手段により算出された前記エコ・ウェイト及び前記Webページの特徴語を、当該Webページへのリンクデータと関連付けて記憶するページ記憶手段と、を備え、
前記配信サーバは、
前記コンテンツの特徴語を抽出する特徴語抽出手段と、
前記ページ記憶手段により記憶された前記エコ・ウェイト及び前記Webページの特徴語を参照する参照手段と、
前記特徴語抽出手段により抽出された特徴語と前記参照手段により参照された特徴語とが所定以上の一致度を持ち、かつ所定値以上の前記エコ・ウェイトが付与された前記Webページを抽出するページ抽出手段と、
前記ページ抽出手段により抽出された前記Webページへのリンクデータを、前記コンテンツに付加し、前記端末へ送信する送信手段と、を備えるシステム。
(7) A system comprising: a search server that searches for a web page; and a distribution server that provides information related to content viewed on a terminal,
The search server
A phrase storage means for storing a phrase related to the eco field and a weight for the phrase in association with each other;
Obtaining means for periodically referring to the plurality of the Web page, acquires the text data of the Web page,
Analyzing means for analyzing text data of the Web page and extracting a phrase included in the Web page;
For each word extracted by said analyzing means, with reference to the weight stored by the phrase storage unit, as a general point in the Web page, a calculation means for calculating the eco-weights indicating the degree of eco,
The feature word of the Eco weight and the Web page that is calculated by the calculation means comprises a page memory means for storing in association with the link data to the Web page, and
The distribution server
Feature word extraction means for extracting feature words of the content;
A reference means for referring to the feature words of the Eco weight and the Web page stored by said page memory means,
The reference feature word having a predetermined or higher degree of coincidence and the predetermined value or more of the Eco weights extracts the Web page that is provided by the characteristic word and the reference unit extracted by the feature word extraction means Page extraction means;
System comprising a transmission unit for the linked data to the Web pages extracted by the page extraction unit, added to the content, and transmits to the terminal.
このような構成によれば、当該システムを運用することにより、(1)〜(3)と同様の効果が期待できる。 According to such a configuration, the same effects as (1) to (3) can be expected by operating the system.
(8) 端末で閲覧されるコンテンツに関連する情報をコンピュータが提供する方法であって、
前記コンテンツの特徴語を抽出する特徴語抽出ステップと、
エコ分野に関する語句が含まれるWebページへのリンクデータと関連付けて、予め記憶されたエコの度合いを示すエコ・ウェイト、及び当該Webページの特徴語を参照する参照ステップと、
前記特徴語抽出ステップにより抽出された特徴語と前記参照ステップにより参照された特徴語とが所定以上の一致度を持ち、かつ、所定値以上の前記エコ・ウェイトが付与された前記Webページを抽出するページ抽出ステップと、
前記ページ抽出ステップにより抽出された前記Webページへのリンクデータを、前記コンテンツに付加し、前記端末へ送信する送信ステップと、を含む方法。
( 8 ) A method in which a computer provides information related to content viewed on a terminal,
A feature word extraction step for extracting feature words of the content;
A reference step of referring to an eco-weight indicating a degree of eco stored in advance and a characteristic word of the web page in association with link data to a web page including a phrase related to the eco field;
Wherein and the feature word extraction feature word referenced by the reference step and the characteristic word extracted by the step has a predetermined or higher degree of coincidence, and extracts the Web page that a predetermined value or more of the Eco weights were granted A page extraction step to
Method comprising: a transmission step of the link data to the Web pages extracted by the page extraction step adds to the content, and transmits to the terminal.
このような構成によれば、当該方法を実行することにより、(1)と同様の効果が期待できる。 According to such a configuration, the same effect as in (1) can be expected by executing the method.
本発明によれば、ユーザが閲覧するコンテンツに連動し、かつ、エコに関する情報を提供することができる。 According to the present invention, in conjunction with the content that the user is viewing, and can provide information about the eco.
以下、本発明の実施形態について図を参照しながら説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
[システム全体構成]
図1は、本実施形態に係るシステム1の構成を示す図である。システム1では、本発明のサーバとしての配信サーバ10と、検索サーバ20と、ユーザの端末30と、コンテンツサーバ40と、がネットワークを介して接続されている。
[Entire system configuration]
FIG. 1 is a diagram illustrating a configuration of a
検索サーバ20は、コンテンツサーバ40にて管理されているWebページにアクセスし、このWebページのエコの度合いを示す指標(エコ・ウェイト)と共に、エコ情報として、このWebページへのリンクデータを記憶する。
The
配信サーバ10は、端末30から、ユーザが閲覧要求を行ったWebページのコンテンツデータを受信する。そして、配信サーバ10は、受信したコンテンツデータに関連したエコ情報を検索サーバ20により記憶された情報から抽出し、Webページに付加して端末30へ送信する。これにより、エコ・ウェイトの高い有用な情報が、自動的に配信される。
The
なお、配信サーバ10によるコンテンツデータの受信及びエコ情報の送信は、当該コンテンツを管理する図示しないサーバを介して行われることとしてよい。
The
[ハードウェア構成]
図2は、本実施形態に係る各サーバ(配信サーバ10及び検索サーバ20)のハードウェア構成を示す図である。各サーバは、制御部300を構成するCPU(Central Processing Unit)310(マルチプロセッサ構成ではCPU320等複数のCPUが追加されてもよい)、バスライン200、通信I/F(I/F:インタフェース)330、メインメモリ340、BIOS(Basic Input Output System)350、I/Oコントローラ360、ハードディスク370、光ディスクドライブ380及び半導体メモリ390を備える。なお、ハードディスク370、光ディスクドライブ380及び半導体メモリ390はまとめて記憶装置410と呼ばれる。
[Hardware configuration]
FIG. 2 is a diagram illustrating a hardware configuration of each server (the
制御部300は、各サーバを統括的に制御する部分であり、ハードディスク370に記憶された各種プログラムを適宜読み出して実行することにより、上述したハードウェアと協働し、本発明に係る各種機能を実現している。
通信I/F330は、各サーバが、ネットワークを介して、他の装置と情報を送受信する場合のネットワーク・アダプタである。通信I/F330は、モデム、ケーブル・モデム及びイーサネット(登録商標)・アダプタを含んでよい。
The communication I /
BIOS350は、各サーバの起動時にCPU310が実行するブートプログラムや、各サーバのハードウェアに依存するプログラム等を記録する。
The
I/Oコントローラ360には、ハードディスク370、光ディスクドライブ380及び半導体メモリ390等の記憶装置410を接続することができる。
A
ハードディスク370は、本ハードウェアを各サーバとして機能させるための各種プログラム、本発明の機能を実行するプログラム及び後述するテーブル等を記憶する。なお、各サーバは、外部に別途設けたハードディスク(図示せず)を外部記憶装置として利用することもできる。
光ディスクドライブ380としては、例えば、DVD−ROMドライブ、CD−ROMドライブ、DVD−RAMドライブ及びCD−RAMドライブを使用することができる。この場合は各ドライブに対応した光ディスク400を使用する。光ディスク400から光ディスクドライブ380によりプログラム又はデータを読み取り、I/Oコントローラ360を介してメインメモリ340又はハードディスク370に提供することもできる。
As the
なお、本発明でいうコンピュータとは、記憶装置、制御部等を備えた情報処理装置をいい、各サーバは、記憶装置410、制御部300等を備えた情報処理装置により構成され、この情報処理装置は、本発明のコンピュータの概念に含まれる。
Note that the computer in the present invention refers to an information processing device including a storage device, a control unit, and the like, and each server includes an information processing device including a
[機能構成]
図3は、本実施形態に係る配信サーバ10及び検索サーバ20の機能構成を示す図である。
[Function configuration]
FIG. 3 is a diagram illustrating a functional configuration of the
配信サーバ10は、特徴語抽出手段としての特徴語抽出部11と、参照手段及びページ抽出手段としてのエコ情報抽出部12と、送信手段としてのエコ情報送信部13と、を備える(詳細は後述する)。
The
そして、検索サーバ20の制御部300は、取得手段としてのクロール部21と、解析手段としての解析部22と、算出手段としてのエコ・ウェイト付与部23と、を備える。また、検索サーバ20の記憶装置410は、語句記憶手段としてのエコ辞書DB24と、ページ記憶手段としてのエコページDB25と、を備える。
The
クロール部21は、インターネット上に存在する多数のコンテンツサーバ40により公開されているWebページへ定期的にアクセスし、参照したWebページのテキストデータを取得する。なお、クロール部21は、同一のWebページに対しても定期的にアクセスすることにより、Webページが更新された場合にも、更新された新しいデータを取得することができる。
The
解析部22は、クロール部21により取得したWebページのテキストデータを形態素解析し、このWebページに含まれる語句を抽出する。
The
エコ・ウェイト付与部23は、解析部22により抽出された語句それぞれについて、エコ辞書DB24を参照し、語句毎に予め定められたウェイトを取得する。そして、エコ・ウェイト付与部23は、このウェイトの総合ポイントとして、Webページに対するエコの度合いを示すエコ・ウェイトを算出して、エコページDB25に記憶する。
The
図4は、本実施形態に係るエコ辞書DB24に格納されたエコ用語テーブルを示す図である。エコ用語テーブルには、エコ分野に関する語句(エコ用語)と関連付けて、エコの度合いを評価するウェイトが予め記憶される。
FIG. 4 is a diagram showing an eco term table stored in the
図5は、本実施形態に係るエコページDB25に格納されたエコページテーブルを示す図である。エコページテーブルには、WebページへのリンクデータとしてのURLと関連付けて、Webページから抽出された特徴語と、Webページのエコ・ウェイトと、Webページの内容を示すタイトルと、が記憶される。
FIG. 5 is a diagram showing an eco page table stored in the
ここで、特徴語は、ユーザの端末30から取得するコンテンツとのマッチングにより関連するWebページを選択するための語句である。この特徴語は、例えば、語句の出現頻度に基づく指標であるTF(Term Frequency)・IDF(Inverse Document Frequency)等に基づいて抽出されたものであってよい。
Here, the feature word is a phrase for selecting a related Web page by matching with content acquired from the
また、この特徴語と共に、それぞれの重要度を示すインデキシング・ウェイトが記憶される。このインデキシング・ウェイトは、上記のTF・IDF等の指標であってよく、あるいは、Webページ上でのフォントや位置、属性(タイトル、本文等)等に基づく値であってもよい。そして、このインデキシング・ウェイトの総合ポイントにより、コンテンツマッチの際のWebページの優先度が決定される。 Also, with this feature words, indexing weights indicating each priority is stored. This indexing weight may be an index such as the above-described TF / IDF, or may be a value based on the font, position, attribute (title, text, etc.) on the Web page. Then, the priority of the Web page at the time of content matching is determined by the total points of the indexing weight.
エコ・ウェイトは、エコ用語テーブル(図4)に規定されたウェイトを、Webページ内での出現回数に基づいて合計した値であってよい。また、Webページ上でのフォントや位置、属性(タイトル、本文等)等に基づいて重み付けをした値であってもよい。 The eco-weight may be a value obtained by adding the weights defined in the eco-term table (FIG. 4) based on the number of appearances in the web page. Further, it may be a value weighted based on the font, position, attribute (title, text, etc.) on the Web page.
タイトルは、Webページに明示的に記載されたタイトル文字列であってもよいし、表示位置やフォント等により他と区別された文字列を抽出してもよい。また、Webページ中のエコ用語の近辺の文字列を抽出してもよく、このことにより、エコ分野に関するWebページ上での話題が示される。この場合、例えば、最もウェイトが大きいエコ用語の前後から所定文字数の文字列を抽出する。 The title may be a title character string explicitly described on the Web page, or a character string distinguished from others by a display position, a font, or the like may be extracted. In addition, a character string in the vicinity of the eco term in the web page may be extracted, and this indicates a topic on the web page related to the eco field. In this case, for example, a character string having a predetermined number of characters is extracted from before and after the eco term having the largest weight.
図3に戻り、配信サーバ10の特徴語抽出部11は、ユーザの端末30において閲覧要求がなされたWebページのコンテンツデータを受信し、このコンテンツデータから特徴語を抽出する。なお、特徴語は、TF・IDF等の指標に基づいて抽出されたものであってよい。
Returning to FIG. 3, the feature
エコ情報抽出部12は、エコページDB25に記憶されたWebページ毎の特徴語及びエコ・ウェイトを参照し、特徴語抽出部11により抽出された特徴語とのマッチングと、エコ・ウェイトの大小とに基づいて、関連したWebページを抽出する。
Eco
具体的には、マッチング(一致又は類似)した特徴語のインデキシング・ウェイトの総合ポイント(例えば、合計値)が所定値以上であり、かつ、エコ・ウェイトが所定値以上であるWebページを抽出することとしてよい。これにより、端末30にて閲覧されるコンテンツに関連し、かつ、エコに関するWebページが抽出される。 Specifically, a Web page in which the total points (for example, the total value) of the indexing weights of matched (matched or similar) feature words is equal to or greater than a predetermined value and the eco-weight is equal to or greater than a predetermined value is extracted. That's good. As a result, related to the content being viewed by the terminal 30, and, Web pages about Eco is extracted.
エコ情報送信部13は、エコ情報抽出部12により抽出されたWebページへのリンクデータ(URL)をタイトルと共に、受信したコンテンツデータに付加して端末30へ送信する。
The eco
図6は、本実施形態に係る端末30における画面表示例を示す図である。端末30では、「電話機」に関するWebページが閲覧されている。このとき、ページの下部には、コンテンツの特徴語である「電話機」によりマッチングした関連Webページへのリンクのリストが表示される。これらの関連Webページは、エコ・ウェイトの大きなものから優先的に表示されている。ユーザは、このリストから選択することにより、リンク先の関連Webページを閲覧することができる。 FIG. 6 is a diagram illustrating a screen display example in the terminal 30 according to the present embodiment. On the terminal 30, a web page related to “telephone” is browsed. At this time, at the bottom of the page, a list of links to related web pages matched by “phone” which is a feature word of the content is displayed. These related Web pages are preferentially displayed in descending order of eco-weight. By selecting from this list, the user can view the linked related Web page.
[処理フロー]
図7は、本実施形態に係る検索サーバ20の制御部300における処理の流れを示すフローチャートである。
[Processing flow]
FIG. 7 is a flowchart showing a flow of processing in the
ステップS11では、検索サーバ20は、コンテンツサーバ40をクロールすることにより、Webページそれぞれのテキストデータを取得する。
In step S <b> 11, the
ステップS12では、検索サーバ20は、ステップS11にて取得したテキストデータに対して形態素解析を行い、語句に分割する。
In step S12, the
ステップS13では、検索サーバ20は、ステップS12にて分割された語句の中から、エコ用語テーブル(図4)に記憶されているエコ用語と、Webページを特徴付ける特徴語と、を抽出する。
In step S13, the
ステップS14では、検索サーバ20は、ステップS13にて抽出されたエコ用語それぞれに設定されたウェイトを集計して、Webページに付与するエコ・ウェイトを算出する。
In step S14, the
ステップS15では、検索サーバ20は、ステップS11にて取得したテキストデータの中から、Webページへのリンクのタイトルとなる情報を抽出する。
In step S15, the
ステップS16では、検索サーバ20は、エコに関するページ情報として、ステップS13にて抽出した特徴語、ステップS14にて算出したエコ・ウェイト、及びステップS15にて取得したタイトル情報と共に、Webページへのリンクデータ(URL)を記憶する。
In step S16, the
図8は、本実施形態に係る配信サーバ10の制御部300における処理の流れを示すフローチャートである。
FIG. 8 is a flowchart showing the flow of processing in the
ステップS21では、配信サーバ10は、ユーザの端末30から、閲覧要求のあったWebページのコンテンツデータを受信する。
In step S <b> 21, the
ステップS22では、配信サーバ10は、ステップS21にて受信したコンテンツデータの中から、コンテンツを特徴付ける特徴語を抽出する。
In step S22, the
ステップS23では、配信サーバ10は、ステップS22にて抽出した特徴語と、図7のステップS16にて記憶されたエコに関するページ情報とのマッチングを行う。すなわち、エコページテーブル(図5)の特徴語のうち、コンテンツデータから抽出された語句とマッチング(一致又は類似)した特徴語のインデキシング・ウェイトを取得する。
In step S23, the
ステップS24では、配信サーバ10は、ステップS23にて取得したインデキシング・ウェイトを集計した総合ポイントを算出する。
In step S24, the
ステップS25では、配信サーバ10は、ステップS24にて算出したインデキシング・ウェイトの総合ポイント、及びエコ・ウェイトに関して、所定の条件を満たすWebページ(エコページ)を抽出する。
In step S25, the
ステップS26では、配信サーバ10は、ステップS25にて抽出したWebページ(エコページ)へのリンクを、インデキシング・ウェイトの総合ポイント又はエコ・ウェイトに基づいて順位付けする。そして、配信サーバ10は、順位付けしたリンクを、ステップS21にて受信したコンテンツデータにタイトルと共に付加し、端末30へ送信する。
In step S <b> 26, the
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限るものではない。また、本発明の実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本発明の実施形態に記載されたものに限定されるものではない。 As mentioned above, although embodiment of this invention was described, this invention is not restricted to embodiment mentioned above. The effects described in the embodiments of the present invention are only the most preferable effects resulting from the present invention, and the effects of the present invention are limited to those described in the embodiments of the present invention. is not.
本実施形態では、配信サーバ10及び検索サーバ20を備えるシステム1を説明したが、これには限られない。例えば、配信サーバ10及び検索サーバ20の機能を備える単一のサーバにて本発明を実現してもよい。また、配信サーバ10又は検索サーバ20の機能の一部を、データベースサーバやWebサーバ等、他のサーバに分散させてもよい。
In this embodiment, although the
1 システム
10 配信サーバ
11 特徴語抽出部
12 エコ情報抽出部
13 エコ情報送信部
20 検索サーバ
21 クロール部
22 解析部
23 エコ・ウェイト付与部
24 エコ辞書DB
25 エコページDB
30 端末
40 コンテンツサーバ
300 制御部
410 記憶装置
DESCRIPTION OF
25 Ecopage DB
30 terminal 40
Claims (8)
前記コンテンツの特徴語を抽出する特徴語抽出手段と、
エコ分野に関する語句が含まれるWebページへのリンクデータと関連付けて、予め記憶されたエコの度合いを示すエコ・ウェイト、及び当該Webページの特徴語を参照する参照手段と、
前記特徴語抽出手段により抽出された特徴語と前記参照手段により参照された特徴語とが所定以上の一致度を持ち、かつ、所定値以上の前記エコ・ウェイトが付与された前記Webページを抽出するページ抽出手段と、
前記ページ抽出手段により抽出された前記Webページへのリンクデータを、前記コンテンツに付加し、前記端末へ送信する送信手段と、を備えるサーバ。 A server that provides information related to content viewed on a terminal,
Feature word extraction means for extracting feature words of the content;
Reference means for referring to the eco-weight indicating the degree of eco stored in advance and the characteristic word of the web page in association with the link data to the web page including the phrase related to the eco field,
The reference feature word having a predetermined or higher degree of coincidence by the feature word and said reference means extracted by the feature word extraction means and extracting the Web page that a predetermined value or more of the Eco weights were granted Page extraction means to
Server and a transmission means for the link data to the Web pages extracted by the page extraction unit, it added to the content, and transmits to the terminal.
前記Webページのテキストデータを解析し、当該Webページに含まれる語句を抽出する解析手段と、
前記解析手段により抽出された語句それぞれについて、前記語句記憶手段により記憶された前記ウェイトを参照し、当該Webページに対する前記エコ・ウェイトを算出する算出手段と、
前記算出手段により算出された前記エコ・ウェイト及び前記Webページの特徴語を、当該Webページへのリンクデータと関連付けて記憶するページ記憶手段と、をさらに備える請求項1に記載のサーバ。 A phrase storage means for storing a phrase related to the eco field and a weight for the phrase in association with each other;
Analyzing means for analyzing text data of the Web page and extracting a phrase included in the Web page;
For each word extracted by said analyzing means, with reference to the weight stored by the phrase storage unit, a calculation means for calculating the eco-weights for the Web page,
The server of claim 1, the Eco weights calculated and the characteristic word of the Web page, further comprising a page memory means for storing in association with the link data to the Web page, the by the calculation means.
前記ページ抽出手段は、前記一致度に基づいて算出される前記インデキシング・ウェイトの総合ポイント及び前記エコ・ウェイトに関する、所定の条件を満たす前記Webページを抽出することを特徴とする請求項1から請求項3のいずれかに記載のサーバ。 The reference means further refers to an indexing weight indicating importance for each feature word of the Web page;
The page extraction unit, according claim 1, wherein the related total points of the indexing weights calculated based on the identity and the Eco weights, extracts a predetermined condition is satisfied the Web pages Item 4. The server according to item 3.
前記検索サーバは、
エコ分野に関する語句と、当該語句に対するウェイトとを関連付けて記憶する語句記憶手段と、
複数の前記Webページを定期的に参照し、当該Webページのテキストデータを取得する取得手段と、
前記Webページのテキストデータを解析し、当該Webページに含まれる語句を抽出する解析手段と、
前記解析手段により抽出された語句それぞれについて、前記語句記憶手段により記憶された前記ウェイトを参照し、当該Webページにおける総合ポイントとして、エコの度合いを示すエコ・ウェイトを算出する算出手段と、
前記算出手段により算出された前記エコ・ウェイト及び前記Webページの特徴語を、当該Webページへのリンクデータと関連付けて記憶するページ記憶手段と、を備え、
前記配信サーバは、
前記コンテンツの特徴語を抽出する特徴語抽出手段と、
前記ページ記憶手段により記憶された前記エコ・ウェイト及び前記Webページの特徴語を参照する参照手段と、
前記特徴語抽出手段により抽出された特徴語と前記参照手段により参照された特徴語とが所定以上の一致度を持ち、かつ所定値以上の前記エコ・ウェイトが付与された前記Webページを抽出するページ抽出手段と、
前記ページ抽出手段により抽出された前記Webページへのリンクデータを、前記コンテンツに付加し、前記端末へ送信する送信手段と、を備えるシステム。 A system comprising: a search server that searches for a web page; and a distribution server that provides information related to content viewed on a terminal,
The search server
A phrase storage means for storing a phrase related to the eco field and a weight for the phrase in association with each other;
Obtaining means for periodically referring to the plurality of the Web page, acquires the text data of the Web page,
Analyzing means for analyzing text data of the Web page and extracting a phrase included in the Web page;
For each word extracted by said analyzing means, with reference to the weight stored by the phrase storage unit, as a general point in the Web page, a calculation means for calculating the eco-weights indicating the degree of eco,
The feature word of the Eco weight and the Web page that is calculated by the calculation means comprises a page memory means for storing in association with the link data to the Web page, and
The distribution server
Feature word extraction means for extracting feature words of the content;
A reference means for referring to the feature words of the Eco weight and the Web page stored by said page memory means,
The reference feature word having a predetermined or higher degree of coincidence and the predetermined value or more of the Eco weights extracts the Web page that is provided by the characteristic word and the reference unit extracted by the feature word extraction means Page extraction means;
System comprising a transmission unit for the linked data to the Web pages extracted by the page extraction unit, added to the content, and transmits to the terminal.
前記コンテンツの特徴語を抽出する特徴語抽出ステップと、
エコ分野に関する語句が含まれるWebページへのリンクデータと関連付けて、予め記憶されたエコの度合いを示すエコ・ウェイト、及び当該Webページの特徴語を参照する参照ステップと、
前記特徴語抽出ステップにより抽出された特徴語と前記参照ステップにより参照された特徴語とが所定以上の一致度を持ち、かつ、所定値以上の前記エコ・ウェイトが付与された前記Webページを抽出するページ抽出ステップと、
前記ページ抽出ステップにより抽出された前記Webページへのリンクデータを、前記コンテンツに付加し、前記端末へ送信する送信ステップと、を含む方法。 A method in which a computer provides information related to content viewed on a terminal,
A feature word extraction step for extracting feature words of the content;
A reference step of referring to an eco-weight indicating a degree of eco stored in advance and a characteristic word of the web page in association with link data to a web page including a phrase related to the eco field;
Wherein and the feature word extraction feature word referenced by the reference step and the characteristic word extracted by the step has a predetermined or higher degree of coincidence, and extracts the Web page that a predetermined value or more of the Eco weights were granted A page extraction step to
Method comprising: a transmission step of the link data to the Web pages extracted by the page extraction step adds to the content, and transmits to the terminal.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008206596A JP4859891B2 (en) | 2008-08-11 | 2008-08-11 | Server, system and method for providing information related to contents |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008206596A JP4859891B2 (en) | 2008-08-11 | 2008-08-11 | Server, system and method for providing information related to contents |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010044476A JP2010044476A (en) | 2010-02-25 |
JP4859891B2 true JP4859891B2 (en) | 2012-01-25 |
Family
ID=42015831
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008206596A Expired - Fee Related JP4859891B2 (en) | 2008-08-11 | 2008-08-11 | Server, system and method for providing information related to contents |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4859891B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6398993B2 (en) * | 2013-12-17 | 2018-10-03 | 日本電気株式会社 | Information providing system, information processing device, information providing method, terminal device, and computer-readable recording medium |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09203648A (en) * | 1996-01-26 | 1997-08-05 | Matsushita Electric Works Ltd | Method for evaluating environment load of product |
JPH10269237A (en) * | 1997-03-27 | 1998-10-09 | Hitachi Ltd | Document browsing system |
JP2001014210A (en) * | 1999-06-25 | 2001-01-19 | Just Syst Corp | Information collection system |
JP2002197118A (en) * | 2000-12-15 | 2002-07-12 | Internatl Business Mach Corp <Ibm> | Information access method, information access system and storage medium |
JP2002245061A (en) * | 2001-02-14 | 2002-08-30 | Seiko Epson Corp | Keyword extraction |
JP2004310661A (en) * | 2003-04-10 | 2004-11-04 | Japan Science & Technology Agency | Recycling technology retrieval system |
-
2008
- 2008-08-11 JP JP2008206596A patent/JP4859891B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010044476A (en) | 2010-02-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5572596B2 (en) | Personalize the ordering of place content in search results | |
US7475074B2 (en) | Web search system and method thereof | |
US8667037B1 (en) | Identification and ranking of news stories of interest | |
US20090259646A1 (en) | Method for Calculating Score for Search Query | |
KR101060594B1 (en) | Keyword Extraction and Association Network Configuration for Document Data | |
JP4848388B2 (en) | How to calculate a score for a search query | |
US20080082486A1 (en) | Platform for user discovery experience | |
JP4962945B2 (en) | Bookmark / tag setting device | |
JP4962986B2 (en) | Method, server, and program for classifying content data into categories | |
JP5084858B2 (en) | Summary creation device, summary creation method and program | |
JP2007188352A (en) | Page reranking apparatus, and page reranking program | |
CA2919983A1 (en) | Method and apparatus for automatic website optimization | |
JP2011154467A (en) | Retrieval result ranking method and system | |
KR101324460B1 (en) | Information provision device, information provision method, and information recording medium | |
JP2010026792A (en) | Server, method and program for storing information about delivered advertising | |
US9064014B2 (en) | Information provisioning device, information provisioning method, program, and information recording medium | |
JP2003173352A (en) | Retrieval log analysis method and device, document information retrieval method and device, retrieval log analysis program, document information retrieval program and storage medium | |
JP4859891B2 (en) | Server, system and method for providing information related to contents | |
KR101308821B1 (en) | Keyword extraction system for search engines and extracting method thereof | |
KR101180371B1 (en) | Folksonomy-based personalized web search method and system for performing the method | |
JP5072792B2 (en) | Retrieval method, program and server for preferentially displaying pages according to amount of information | |
JP2008112310A (en) | Retrieval device, information retrieval system, retrieval method, retrieval program and recording medium | |
JP5389683B2 (en) | Important keyword extraction apparatus, method and program | |
JP5084859B2 (en) | Information processing apparatus, data extraction method, and program | |
JP5903370B2 (en) | Information search apparatus, information search method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110929 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111004 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111101 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4859891 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141111 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
LAPS | Cancellation because of no payment of annual fees | ||
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |