JP5014386B2 - Content search device - Google Patents

Content search device Download PDF

Info

Publication number
JP5014386B2
JP5014386B2 JP2009187356A JP2009187356A JP5014386B2 JP 5014386 B2 JP5014386 B2 JP 5014386B2 JP 2009187356 A JP2009187356 A JP 2009187356A JP 2009187356 A JP2009187356 A JP 2009187356A JP 5014386 B2 JP5014386 B2 JP 5014386B2
Authority
JP
Japan
Prior art keywords
search
content
query
index
unit time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009187356A
Other languages
Japanese (ja)
Other versions
JP2011039835A (en
Inventor
健一 山本
智晃 西方
充 佐藤
健吾 海老原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2009187356A priority Critical patent/JP5014386B2/en
Publication of JP2011039835A publication Critical patent/JP2011039835A/en
Application granted granted Critical
Publication of JP5014386B2 publication Critical patent/JP5014386B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明はコンテンツ検索装置に関し、特に、特定の検索キーの注目度の急上昇に応答して検索ランクを調整可能なコンテンツ検索装置に関する。   The present invention relates to a content search apparatus, and more particularly, to a content search apparatus that can adjust a search rank in response to a sudden increase in the degree of attention of a specific search key.

近年、ブログやSNS(ソーシャル・ネットワーキング・サービス)、質問回答型コンテンツ、電子掲示板、クチコミ評価サービス等に代表されるCGM(コンシューマ・ジェネレイテッド・メディア)あるいはUGC(ユーザ・ジェネレィテッド・コンテンツ)と呼ばれるサービスあるいはコンテンツが注目されている。例えば、質問回答型コンテンツを提供するサービスとしては、非特許文献1のようなものが知られている。これによれば、ユーザの疑問や知りたいことを投稿として受付けて公開し、公開された質問に対する回答を他のユーザから受付け、質問及びこれと対応する回答を含むウェブページ、並びに当該ウェブページに含まれる用語等を抽出した検索インデックスが生成されるとしている。従って、このようなサービスによれば、投稿者を含むユーザ同士が相互に知恵や知識を教え合うことが可能である。加えて、任意のユーザから受付けた、特定の話題等を抽出するための検索キーワードを含むクエリに基づいて、関連度の高い順に、質問及び対応する回答を含むウェブページへのリンク情報等を提供することにより、投稿者以外のユーザも、特定の知恵や知識を知る機会を得ることが可能である。   In recent years, with CGM (Consumer Generated Media) or UGC (User Generated Content) represented by blogs, SNS (Social Networking Service), question answering contents, electronic bulletin boards, word-of-mouth evaluation services, etc. The called service or content is drawing attention. For example, as a service for providing question answer type content, a service such as Non-Patent Document 1 is known. According to this, a user's question and what he wants to know are accepted as a post and published, and an answer to the published question is accepted from another user, and the web page including the question and the corresponding answer is displayed on the web page. It is assumed that a search index is generated by extracting included terms and the like. Therefore, according to such a service, users including posters can mutually share wisdom and knowledge. In addition, based on a query including a search keyword for extracting a specific topic received from an arbitrary user, link information to a web page including a question and a corresponding answer is provided in descending order of relevance. By doing so, users other than the poster can also get an opportunity to know specific wisdom and knowledge.

前述のようなサービスにおいては、質問又は回答を投稿するユーザは、質問又は回答を随時投稿しうる。従って、職業上の新聞記者等による、取材及び記事作成のための準備期間等は不要である。例えば、偶然、何らかの話題性を有する事物の近傍に居合わせたユーザが、当該事物についての質問等を、携帯電話又はネットワーク接続したパーソナル・コンピュータ等の通信手段を用いて、前述のような質問回答型コンテンツを提供するサービスに投稿することがありうる。換言すれば、前述のような質問回答型コンテンツを提供するサービスは、当該サービスが蓄積する情報の更新頻度に注目すれば、テレビ又は新聞等のマスコミに匹敵するか、又はより迅速でありうる。   In the service as described above, a user who posts a question or answer can post a question or answer at any time. Therefore, there is no need for a preparation period for interviews and article creation by professional newspaper reporters. For example, a user who is in the vicinity of an object having some topicality by chance uses a communication means such as a mobile phone or a personal computer connected to a network to ask a question about the object. It is possible to post to a service that provides content. In other words, a service that provides question-and-answer type content as described above may be comparable to or faster than a mass media such as a television or a newspaper if attention is paid to the update frequency of information accumulated by the service.

ヤフージャパン株式会社、「Yahoo!知恵袋」[online]、平成21年、[平成21年6月29日検索]、インターネット、<URL:http://chiebukuro.yahoo.co.jp/>Yahoo Japan Corporation, “Yahoo! Wisdom Bag” [online], 2009, [Search June 29, 2009], Internet, <URL: http://chiebukuro.yahoo.co.jp/>

ところで、上述の質問回答型コンテンツを提供するサービス等のUGCにおいては、上述のようにマスコミによる情報伝達よりも迅速にコンテンツが提供される可能性がある一方で、単に検索クエリに応答して関連するコンテンツを検索結果として抽出するだけでは、そのコンテンツの新鮮さ(以下、鮮度とも呼称)を反映した検索を行うことはできない。例えば、ユーザが、注目度が急上昇していると思われるキーワード等を用いて、話題として早く知りたいと望むことの検索を試みても、従来の質問回答型コンテンツを提供するサービスにおいては、以前に蓄積された投稿及び鮮度の高い投稿が、いずれも検索対象となり、必ずしも話題の新しさが検索結果に反映されていなかった。   By the way, in UGC, such as the service which provides the above-mentioned question answer type content, there is a possibility that the content may be provided more quickly than the information transmission by the media as described above. A search that reflects the freshness of the content (hereinafter also referred to as freshness) cannot be performed simply by extracting the content to be retrieved as a search result. For example, even if a user tries to search for what he / she wants to know quickly as a topic by using a keyword or the like that is likely to have a sharp increase in attention, Posts accumulated in the post and posts with high freshness were both search targets, and the newness of the topic was not necessarily reflected in the search results.

本発明は、検索キーの注目度が急上昇することに応答して、当該検索キーによって抽出されるコンテンツについては鮮度を優先して検索結果に反映することが可能な、コンテンツ検索装置を提供することを目的とする。   The present invention provides a content search apparatus capable of reflecting the content extracted by a search key with priority on freshness in a search result in response to a sudden increase in the attention level of the search key. With the goal.

本発明では、以下のような解決手段を提供する。   The present invention provides the following solutions.

(1) ユーザ端末から受信した検索クエリに基づいて検索インデックス・データベースからコンテンツを検索するコンテンツ検索装置であって、検索クエリの単位時間あたりの受信件数からその前の当該単位時間あたりの受信件数を減じて算出する変動数及び当該単位時間あたりの受信件数をその前の当該単位時間あたりの受信件数で除して算出する変動率に基づく比較インデックスを算出する比較インデックス算出手段と、比較インデックスが高いほど、コンテンツについて、コンテンツの投稿を受信した時からの経過時間の短さを示す鮮度に係る重みづけを大きくする重みづけ調整手段と、重みづけに基づいて、検索インデックス・データベースからコンテンツを検索するコンテンツ検索手段と、を備える、コンテンツ検索装置。 (1) A content search apparatus for searching for content from a search index database based on a search query received from a user terminal, wherein the number of received queries per unit time is calculated from the number of received queries per unit time. Comparison index calculation means for calculating a comparison index based on the fluctuation rate calculated by dividing the number of fluctuations calculated by subtracting and the number of receptions per unit time by the previous number of receptions per unit time, and the comparison index is high The content is searched from the search index database based on the weight adjustment means for increasing the weight related to the freshness indicating the shortness of the elapsed time from when the content posting is received, and the weight. And a content search device.

本発明に係るコンテンツ検索装置は、検索のためのインデックスを格納するための検索インデックス・データベースを備え、ユーザ端末から受信した検索クエリに基づいて、ウェブ・コンテンツを検索する。検索対象のウェブ・コンテンツとしては、ブログ、SNS、質問回答型コンテンツ、電子掲示板、クチコミ評価サービス等に代表されるCGM、あるいはUGCと呼ばれるサービスあるいはコンテンツが挙げられるが、これらに限定しない。   The content search apparatus according to the present invention includes a search index database for storing an index for search, and searches web content based on a search query received from a user terminal. Examples of web contents to be searched include, but are not limited to, services or contents called CGM represented by blogs, SNS, question answering contents, electronic bulletin boards, word-of-mouth evaluation services, etc., or UGC.

比較インデックス算出手段が算出する比較インデックスは、当技術分野においてバースト度とも呼ばれ、特定の検索クエリに対する注目度の急激な上昇を反映する数値として知られている。換言すれば、この比較インデックスは、特定の検索クエリに対する注目度を表している。検索クエリは、キーワード、キー画像等の任意の形態の検索キーを含むことができる。すなわち、本発明に係るコンテンツ検索装置は、例えば、特定のキーワード等の注目度が急激に上昇している場合に、比較インデックス算出手段を用いて、その特定のキーワードに対する注目度を表す比較インデックスをより大きな値とすることができる。注目度を表す比較インデックスは、検索クエリの単位時間あたりの受信件数からその前の当該単位時間あたりの受信件数を減じて算出する変動数及び当該単位時間あたりの受信件数をその前の当該単位時間あたりの受信件数で除して算出する変動率に基づいて正規化することにより、生成することができる。   The comparison index calculated by the comparison index calculation means is also called a burst degree in this technical field, and is known as a numerical value that reflects a rapid increase in the degree of attention to a specific search query. In other words, this comparison index represents the degree of attention to a specific search query. The search query can include a search key of any form such as a keyword and a key image. That is, the content search apparatus according to the present invention uses, for example, a comparison index calculation unit to calculate a comparison index representing the degree of attention to a specific keyword when the degree of attention of a specific keyword or the like is rapidly increasing. It can be a larger value. The comparison index indicating the degree of attention is the number of fluctuations calculated by subtracting the number of received messages per unit time from the number of received messages per unit time of the search query and the number of received messages per unit time before that unit time. It can be generated by normalizing based on the fluctuation rate calculated by dividing by the number of receptions per hit.

重みづけ調整手段が調整する重みづけは、例えば、検索結果における順位付けのための評価項目のうちで、コンテンツの投稿からの経過時間の短さ、換言すれば新鮮さに係る重みづけである。順位付けのための評価項目は、個別の検索クエリとの関連性、個別の検索クエリとは独立した定数、及び重みづけ調整手段が重みづけを調整することが可能な新鮮さを表す数値等から構成することができる。本発明に係るコンテンツ検索装置は、この新鮮さを表す数値等に対する重みづけを調整することにより、ある検索クエリに対する注目度を表す比較インデックスの急激な上昇が発生している状況を、検索結果の順位付けに反映させることが可能である。重みづけ調整手段が動作する頻度、周期等は何でもよい。重みづけは、コンテンツの新鮮さと対応していればよく、コンテンツの新鮮さと重みづけとの関係は、連続して単調であってもよく、ある範囲のコンテンツの新鮮さを所定の重みづけと対応させる等の不連続な関係であってもよい。   The weighting adjusted by the weighting adjusting means is, for example, a weighting related to the shortness of the elapsed time from the posting of the content, in other words, the freshness among the evaluation items for ranking in the search result. Evaluation items for ranking include relevance with individual search queries, constants independent of individual search queries, and numerical values representing freshness with which the weight adjustment means can adjust the weight. Can be configured. The content search apparatus according to the present invention adjusts the weighting for the numerical value representing the freshness, etc., so that a situation in which the comparison index representing the degree of attention with respect to a certain search query has rapidly increased is displayed. It can be reflected in ranking. Any frequency, period, etc., of the weight adjustment means may be used. The weighting only needs to correspond to the freshness of the content, and the relationship between the freshness of the content and the weighting may be continuously monotonous, and the freshness of a range of content corresponds to the predetermined weighting. It may be a discontinuous relationship.

コンテンツ検索手段は、検索インデックス・データベースを用いて、検索クエリをインデックスに含むコンテンツを検索する。検索したコンテンツには、検索クエリに対する前述の評価項目が算出される。従って、検索クエリに対する注目度を表す比較インデックスが急激に上昇している状況においては、検索結果の順位付けは、主に新鮮さを表す数値等に依存しうる。すなわち、コンテンツ検索手段は、より鮮度の高いコンテンツを上位に含む検索結果を生成することができる。   The content search means uses the search index database to search for content that includes the search query in the index. For the retrieved content, the aforementioned evaluation items for the search query are calculated. Accordingly, in a situation where the comparison index representing the degree of attention to the search query is rapidly increasing, the ranking of the search results can depend mainly on a numerical value representing freshness. In other words, the content search means can generate a search result that includes content with higher freshness at the top.

このようにすることで、本発明に係るコンテンツ検索装置は、特定の検索クエリの注目度が急上昇することに応答して、当該検索クエリによって抽出されるコンテンツについて、鮮度を優先して検索結果に反映することが可能である。従って、本発明に係るコンテンツ検索装置によれば、ユーザは、質問回答型コンテンツ等のUGC、CGMを提供する検索サービス等の速報性を活用することが可能になる。   By doing in this way, the content search device according to the present invention responds to the sudden increase in the degree of attention of a specific search query, and the content extracted by the search query gives priority to freshness as a search result. It is possible to reflect. Therefore, according to the content search apparatus according to the present invention, the user can utilize the promptness of a search service that provides UGC and CGM such as question answer type content.

(2) 前記比較インデックス算出手段は、検索クエリの単位時間あたりの受信件数の変動数と当該受信件数の変動率との積により比較インデックスを算出する、(1)に記載のコンテンツ検索装置。 (2) The content search device according to (1), wherein the comparison index calculation unit calculates a comparison index based on a product of a fluctuation number of received cases per unit time of a search query and a fluctuation rate of the received number.

本発明に係るコンテンツ検索装置の比較インデックス算出手段は、例えば、検索クエリのログ記録等を参照し、特定の検索クエリの注目度を表す比較インデックスを算出することができる。この比較インデックスは、検索クエリの単位時間あたりの受信件数の変動数と当該受信件数の変動率との積により正規化して算出することができる。検索クエリのログ記録としては、当技術分野に公知のログ記録のための任意の手法により、ユーザ端末から受信した検索クエリの経時的な記録を蓄積してもよい。単位時間としては、例えば、1分、3分、10分、30分、1時間、2時間、3時間、6時間等、任意の時間を設定することができる。   The comparison index calculation means of the content search device according to the present invention can calculate a comparison index representing the degree of attention of a specific search query with reference to, for example, a log record of the search query. This comparison index can be calculated by normalizing the product of the number of changes in the number of received messages per unit time of the search query and the rate of change in the number of received messages. As a search query log record, a record over time of a search query received from a user terminal may be accumulated by any method for log recording known in the art. As the unit time, for example, an arbitrary time such as 1 minute, 3 minutes, 10 minutes, 30 minutes, 1 hour, 2 hours, 3 hours, 6 hours or the like can be set.

このようにすることで、本発明に係るコンテンツ検索装置は、特定の検索クエリ受信件数とその上昇率との両者を用いて、注目度を表す比較インデックスを算出することができる。従って、単に上昇率だけが増加している検索クエリの記録等は、必ずしも多人数のユーザからの注目を集めているとは限らない検索クエリとして扱うことができる。すなわち、本発明に係るコンテンツ検索装置は、多人数のユーザからの注目が急激に上昇している検索クエリに基づいて、コンテンツを検索することが可能である。   By doing in this way, the content search device according to the present invention can calculate a comparison index representing the degree of attention using both the specific number of received search queries and the rate of increase thereof. Therefore, a record of a search query in which only the increase rate is increased can be treated as a search query that does not necessarily attract attention from a large number of users. In other words, the content search apparatus according to the present invention can search for content based on a search query that is rapidly attracting attention from a large number of users.

(3) ユーザ端末から受信した検索クエリに基づいて単位時間あたりの受信件数からその前の当該単位時間あたりの受信件数を減じて算出する変動数及び当該単位時間あたりの受信件数をその前の当該単位時間あたりの受信件数で除して算出する変動率に基づいて比較インデックスを算出する比較インデックス算出ステップと、比較インデックスが高いほど、コンテンツについて、コンテンツの投稿を受信した時からの経過時間の短さを示す鮮度に係る重みづけを大きくする重みづけ調整ステップと、重みづけに基づいて、検索インデックス・データベースからコンテンツを検索するコンテンツ検索ステップと、を含む、コンテンツ検索方法。 (3) Based on the search query received from the user terminal, subtract the number of receptions per unit time from the number of receptions per unit time and calculate the number of fluctuations and the number of receptions per unit time before that A comparison index calculation step for calculating a comparison index based on a fluctuation rate calculated by dividing by the number of received messages per unit time, and the higher the comparison index, the shorter the elapsed time from the time when the content posting was received. A content search method, comprising: a weight adjustment step for increasing weighting related to freshness indicating the content; and a content search step for searching content from a search index database based on the weighting.

このような方法によれば、当該方法を実施することにより、(1)と同様の効果が期待できる。本発明に係るコンテンツ検索方法は、例えば、コンピュータを用いて実行するコンテンツ検索プログラムとして提供することができる。   According to such a method, the same effect as in (1) can be expected by performing the method. The content search method according to the present invention can be provided as, for example, a content search program executed using a computer.

本発明によれば、特定の検索キーの注目度が急上昇することに応答して、当該検索キーによって抽出されるコンテンツについて、鮮度を優先して検索結果に反映することが可能な、コンテンツ検索装置を提供することが可能になる。従って、本発明によれば、ユーザは、質問回答型コンテンツ等のUGC、CGMを提供する検索サービス等の、速報性を活用することが可能になる。   According to the present invention, in response to a sudden increase in the degree of attention of a specific search key, a content search device capable of reflecting the content extracted by the search key in search results with priority on freshness. It becomes possible to provide. Therefore, according to the present invention, it becomes possible for the user to utilize the quick report property such as a search service that provides UGC and CGM such as question answer type content.

本発明の一実施形態に係る、コンテンツ検索装置100を含む全体構成を例示する図である。It is a figure which illustrates the whole structure containing the content search device 100 based on one Embodiment of this invention. 本発明の一実施形態に係る、注目度を表す比較インデックスの算出に用いられる、単位時間あたりの特定クエリの受信件数の例を示す図である。It is a figure which shows the example of the reception number of the specific query per unit time used for calculation of the comparison index showing the attention degree based on one Embodiment of this invention. 本発明の一実施形態に係る、コンテンツ検索方法を示すフロー図である。It is a flowchart which shows the content search method based on one Embodiment of this invention. 本発明の一実施形態に係る、クエリログDB110のデータ構造を示す図である。It is a figure which shows the data structure of query log DB110 based on one Embodiment of this invention. 本発明の一実施形態に係る、フレッシュネス調整設定テーブル120のデータ構造を示す図である。It is a figure which shows the data structure of the freshness adjustment setting table 120 based on one Embodiment of this invention. 本発明の一実施形態に係る、検索インデックスDB130のデータ構造を示す図である。It is a figure which shows the data structure of search index DB130 based on one Embodiment of this invention. 本発明の一実施形態に係る、コンテンツ検索表示400及び450を例示する図である。FIG. 4 is a diagram illustrating content search displays 400 and 450 according to one embodiment of the present invention.

以下、本発明の実施形態について図を参照しながら説明する。なお、これはあくまでも一例であって、本発明の技術的範囲はこれに限られるものではない。   Hereinafter, embodiments of the present invention will be described with reference to the drawings. This is merely an example, and the technical scope of the present invention is not limited to this.

本実施形態は、コンピュータ及びその周辺装置に適用される。本実施形態における各部は、コンピュータ及びその周辺装置が備えるハードウェア並びに該ハードウェアを制御するソフトウェアによって構成される。   This embodiment is applied to a computer and its peripheral devices. Each unit in the present embodiment is configured by hardware included in a computer and its peripheral devices, and software that controls the hardware.

上記ハードウェアには、制御部としてのCPU(Central Processing Unit)の他、記憶部、通信装置、表示装置及び入力装置が含まれる。記憶部としては、例えば、メモリ(RAM:Random Access Memory、ROM:Read Only Memory等)、ハードディスクドライブ(HDD:Hard Disk Drive)、及び光ディスク(CD:Compact Disk、DVD:Digital Versatile Disk等)ドライブが挙げられる。通信装置としては、例えば、各種有線及び無線インターフェース装置が挙げられる。表示装置としては、例えば、液晶ディスプレイ、プラズマディスプレイ等の各種ディスプレイが挙げられる。入力装置としては、例えば、キーボード及びポインティング・デバイス(マウス、トラッキングボール等)が挙げられる。   The hardware includes a storage unit, a communication device, a display device, and an input device in addition to a CPU (Central Processing Unit) as a control unit. Examples of the storage unit include a memory (RAM: Random Access Memory, ROM: Read Only Memory, etc.), a hard disk drive (HDD: Hard Disk Drive), and an optical disk (CD: Compact Disc, DVD: Digital Versatile Drive, etc.). Can be mentioned. Examples of the communication device include various wired and wireless interface devices. Examples of the display device include various displays such as a liquid crystal display and a plasma display. Examples of the input device include a keyboard and a pointing device (mouse, tracking ball, etc.).

上記ソフトウェアには、上記ハードウェアを制御するコンピュータ・プログラムやデータが含まれる。コンピュータ・プログラムやデータは、記憶部により記憶され、制御部により適宜実行、参照される。また、コンピュータ・プログラムやデータは、通信回線を介して配布されることも可能であり、CD−ROM等のコンピュータ可読媒体に記録して配布されることも可能である。   The software includes a computer program and data for controlling the hardware. The computer program and data are stored in the storage unit, and are appropriately executed and referenced by the control unit. The computer program and data can be distributed via a communication line, or can be recorded on a computer-readable medium such as a CD-ROM and distributed.

[全体構成]
図1は、本発明の一実施形態に係る、コンテンツ検索装置100を説明するための全体構成を例示する図である。
[overall structure]
FIG. 1 is a diagram illustrating an overall configuration for explaining a content search apparatus 100 according to an embodiment of the present invention.

コンテンツ検索装置100は、比較インデックス算出手段としての比較インデックス算出部220、重みづけ調整手段としての重みづけ調整部230、及びコンテンツ検索手段としてのコンテンツ検索部240を備える。さらに、コンテンツ検索装置100は、クエリ受信部210、及び検索結果出力部250を備えることができる。また、コンテンツ検索装置100は、検索クエリ及び検索されるコンテンツの情報等を格納するために、クエリログDB(データベース)110、フレッシュネス調整設定テーブル120、検索インデックスDB130と通信可能に接続する。さらに、コンテンツ検索装置100は、ネットワーク180を介して、ユーザ端末160、及びウェブ・コンテンツ170と通信可能に接続する。   The content search apparatus 100 includes a comparison index calculation unit 220 as a comparison index calculation unit, a weight adjustment unit 230 as a weight adjustment unit, and a content search unit 240 as a content search unit. Furthermore, the content search apparatus 100 can include a query receiving unit 210 and a search result output unit 250. In addition, the content search apparatus 100 is communicably connected to a query log DB (database) 110, a freshness adjustment setting table 120, and a search index DB 130 in order to store a search query, information on searched content, and the like. Furthermore, the content search apparatus 100 is connected to the user terminal 160 and the web content 170 via the network 180 so as to be communicable.

ネットワーク180は、好適にはインターネット等の広域ネットワークである。ウェブ・コンテンツ170は、ネットワーク180を介してアクセス可能な、各種のコンテンツを表している。例えば、ウェブ・コンテンツ170は、質問回答型のコンテンツを含むCGM、UGC等であるが、これらに限定しない。ユーザ端末160は、携帯電話又はネットワーク接続可能なパーソナル・コンピュータ等であり、典型的には、ブラウザを動作させてウェブ・コンテンツ170にアクセスすることが可能な端末装置である。   The network 180 is preferably a wide area network such as the Internet. Web content 170 represents various types of content that can be accessed via the network 180. For example, the web content 170 is CGM, UGC, or the like including question answer type content, but is not limited thereto. The user terminal 160 is a mobile phone or a personal computer that can be connected to a network, and is typically a terminal device that can access the web content 170 by operating a browser.

クエリログDB110は、検索クエリの履歴を格納するために用いられる。フレッシュネス調整設定テーブル120は、検索されるコンテンツの投稿からの時間の短さ、すなわち新鮮さを、より強調するための数値を格納するために用いられる。検索インデックスDB130は、ウェブ・コンテンツ170にアクセスするためのリンク情報を、検索のためのインデックスと関連付けて蓄積するデータベースである。検索インデックスDB130は、例えば、質問回答型コンテンツ等のUGC、CGMを提供する検索サービスが備え、コンテンツ検索部240が個々のコンテンツを検索するために用いることが可能なインデックス、個々のコンテンツの識別子、リンク情報としてのURL等を、相互に関連付けて格納するために用いられる。さらに、検索インデックスDB130は、コンテンツ検索部240による検索結果を順序づけるための評価項目を、個々のコンテンツに対応するフィールドとして備えてもよい。   The query log DB 110 is used for storing a history of search queries. The freshness adjustment setting table 120 is used to store a numerical value for further emphasizing a short time from posting of the content to be searched, that is, freshness. The search index DB 130 is a database that stores link information for accessing the web content 170 in association with an index for search. The search index DB 130 includes, for example, a search service that provides UGC and CGM such as question answer type content, and an index that can be used by the content search unit 240 to search individual content, an identifier of each content, It is used to store URLs as link information in association with each other. Further, the search index DB 130 may include evaluation items for ordering search results by the content search unit 240 as fields corresponding to individual contents.

なお、クエリログDB110、フレッシュネス調整設定テーブル120、及び検索インデックスDB130の形態は、コンテンツ検索装置100に通信可能に接続される記憶媒体等でもよく、独立したデータベース装置等でもよい。これらの構成要素は、コンテンツ検索装置100に内蔵されてもよく、いずれかを単独のデータベース装置として構成し、ネットワーク180を経由してコンテンツ検索装置100に接続してもよい。   The forms of the query log DB 110, the freshness adjustment setting table 120, and the search index DB 130 may be a storage medium that is communicably connected to the content search apparatus 100, or may be an independent database apparatus. These components may be incorporated in the content search device 100, or any one of them may be configured as a single database device and connected to the content search device 100 via the network 180.

クエリ受信部210は、携帯電話又はネットワーク接続されたパーソナル・コンピュータ等のユーザ端末からの検索クエリを受信する。このような検索クエリは、通常はインターネット等の広域ネットワークを含むネットワーク180を介する通信データであり、語句、短文、ネットワーク資源へのリンク情報、論理演算子等を任意に含むことができる。クエリ受信部210は、受信した検索クエリから、必要に応じて、キーワード等の検索キーを抽出する。さらに、クエリ受信部210は、受信した検索クエリの全体又は一部を、クエリログDB110に記録する。   The query receiving unit 210 receives a search query from a user terminal such as a mobile phone or a network-connected personal computer. Such a search query is usually communication data via the network 180 including a wide area network such as the Internet, and can optionally include words, short sentences, link information to network resources, logical operators, and the like. The query receiving unit 210 extracts a search key such as a keyword from the received search query as necessary. Further, the query receiving unit 210 records all or part of the received search query in the query log DB 110.

比較インデックス算出部220は、クエリログDB110を参照し、特定の検索クエリについて、注目度を表す比較インデックスを算出する。この注目度を表す比較インデックスは、当技術分野においてバースト度とも呼ばれる。検索クエリは、語句に限らず、短文等でもよく、論理演算子を含む複数の語句等でもよい。一実施形態において、注目度を表す比較インデックスは、クエリログDB110に記録された特定の検索クエリが、所定の単位時間において増加又は減少したことを表す変動数、及びその比率である変動率から、例えば、変動数及び変動率の積として算出される。算出した比較インデックスは、当該検索クエリに関連付けて、クエリログDB110に格納してもよい。   The comparison index calculation unit 220 refers to the query log DB 110 and calculates a comparison index representing the degree of attention for a specific search query. The comparison index representing the degree of attention is also called a burst degree in the art. The search query is not limited to a word or phrase, and may be a short sentence or the like, or a plurality of words or phrases including a logical operator. In one embodiment, the comparison index representing the degree of attention is obtained from, for example, the number of fluctuations indicating that a specific search query recorded in the query log DB 110 has increased or decreased in a predetermined unit time, and a fluctuation rate that is a ratio thereof. Calculated as the product of the number of fluctuations and the fluctuation rate. The calculated comparison index may be stored in the query log DB 110 in association with the search query.

比較インデックス算出部220による変動数及び変動率の算出、並びにクエリログDB110への格納は、クエリ受信部210が検索クエリを受信することに応答して、逐次実施してもよく、所定の単位時間の範囲に含まれる検索クエリの全体に対して、変動数及び変動率の算出を実施してもよい。   The calculation of the number of fluctuations and the fluctuation rate by the comparison index calculation unit 220 and the storage in the query log DB 110 may be performed sequentially in response to the query reception unit 210 receiving a search query. The number of fluctuations and the fluctuation rate may be calculated for the entire search query included in the range.

特定の検索クエリの受信件数が急上昇する状況においては、当該検索クエリの変動数及び変動率が共に増加することになる。しかしながら、受信件数の変動があまりない検索クエリについては、変動数及び変動率はゼロに近い値のままである。従って、比較インデックス算出部220の動作により、注目度の急上昇により受信件数が急増している検索クエリに対する変動数及び変動率は、注目度の変動があまりない検索クエリよりも、大きな値となりうる。   In a situation where the number of received specific search queries increases rapidly, both the number of fluctuations and the fluctuation rate of the search queries increase. However, for a search query in which there is not much fluctuation in the number of received messages, the fluctuation number and the fluctuation rate remain close to zero. Therefore, due to the operation of the comparison index calculation unit 220, the number of fluctuations and the fluctuation rate for a search query in which the number of received messages has increased rapidly due to a sharp increase in the degree of attention can be larger than that of a search query with little fluctuation in the degree of attention.

重みづけ調整部230は、任意のコンテンツに対して、投稿からの経過時間の短さを表す鮮度に係る重みづけを調整するために用いられる。この重みづけの調整は、投稿からの経過時間が短いほど、換言すれば、検索されるコンテンツの鮮度が高いほど、検索結果の順位を順序づけるための評価項目のうちで新鮮さを反映している項目の重みづけを大きくするようにする。投稿からの経過時間は、特定のコンテンツの全体が更新された時点からの経過時間でもよく、特定のコンテンツに含まれる記事、画像又は部分的な投稿に付随するタイムスタンプ等の情報に基づく経過時間等でもよい。新鮮さを反映する評価項目は、例えば、検索インデックスDB130に、検索対象となりうるコンテンツごとに、当該コンテンツの新鮮さを含む数値を格納するためのフィールドとして設けることができる。重みづけの調整の詳細は、検索インデックスDB130におけるデータ構造の例を示して後述する。   The weight adjustment unit 230 is used to adjust the weight related to the freshness representing the shortness of the elapsed time from posting to any content. This weighting adjustment reflects the freshness among the evaluation items for ordering the ranking of the search results as the elapsed time from posting is short, in other words, the freshness of the searched content is high. Try to increase the weight of the items. The elapsed time from posting may be the elapsed time from the time when the entire specific content is updated, or the elapsed time based on information such as an article, image or partial post included in the specific content Etc. For example, the evaluation item reflecting the freshness can be provided in the search index DB 130 as a field for storing a numerical value including the freshness of the content for each content that can be searched. Details of the adjustment of the weighting will be described later with reference to an example of a data structure in the search index DB 130.

コンテンツ検索部240は、検索クエリをインデックスに含むコンテンツを、検索インデックスDB130を用いて検索する。検索結果は、検索結果の順位を順序づけるための評価項目の合計値等に従って、順序づけられる。特定の検索クエリの受信件数が急上昇する状況においては、前述の重みづけ調整部230によって新鮮さを反映する評価項目の重みづけが大きくなるため、鮮度の高いコンテンツほど上位となるように順序づけられる。   The content search unit 240 uses the search index DB 130 to search for content that includes the search query in the index. The search results are ordered according to the total value of the evaluation items for ordering the ranking of the search results. In a situation where the number of received specific search queries rapidly increases, the weighting of the evaluation items reflecting freshness is increased by the above-described weighting adjustment unit 230, so that the content with higher freshness is ordered higher.

検索結果出力部250は、コンテンツ検索部240によって検索されたコンテンツの情報、すなわち典型的にはコンテンツにアクセスするためのリンク情報及びコンテンツのタイトル又は一部の内容等の情報を出力する。この出力は、データ通信としてユーザに提供され、ユーザは、鮮度の高い順に列挙された様式において、検索結果を得ることができる。   The search result output unit 250 outputs information on the content searched by the content search unit 240, that is, typically link information for accessing the content and information such as the title of the content or part of the content. This output is provided to the user as a data communication, and the user can obtain search results in a manner listed in the order of freshness.

このようにすることで、本発明に係るコンテンツ検索装置100は、注目度が上昇している検索クエリをインデックスに含むコンテンツの中から、より新鮮であるコンテンツほど上位となるよう順序づけたコンテンツ検索結果を、自動的に生成することが可能である。従って、本発明に係るコンテンツ検索装置100によれば、ユーザ自らが投稿して形成されるコンテンツの鮮度を優先して検索結果に反映させることが可能なサービス等を提供することが可能になり、速報性の高い検索サービス等を提供することが可能になる。特に、携帯電話等を携行するユーザが、任意の時点でコンテンツ検索装置100に接続する機会を得られる場合には、本発明により、職業上の記者等による原稿作成を介する従来のテレビや新聞等の媒体と比較して、より速報性の高い検索サービス等を提供することが可能になる。   By doing in this way, the content search apparatus 100 according to the present invention is a content search result that is ordered so that the fresher content is higher in the content including the search query whose degree of attention is increasing in the index. Can be automatically generated. Therefore, according to the content search device 100 according to the present invention, it is possible to provide a service or the like that can reflect the freshness of the content that the user himself / herself posts and forms in the search result with priority. It becomes possible to provide a search service or the like with high promptness. In particular, when a user carrying a mobile phone or the like can get an opportunity to connect to the content search apparatus 100 at an arbitrary time, according to the present invention, a conventional television, newspaper, or the like through manuscript preparation by a professional reporter or the like. Compared to other media, it is possible to provide a search service or the like with higher speed.

[注目度を表す比較インデックス]
図2に、本発明の一実施形態に係る、注目度を表す比較インデックスの算出に用いられる、単位時間あたりの特定クエリの受信件数の例を示す。図2は、時間の経過に対する特定クエリの受信件数を、棒グラフとして表している図である。ここで、受信件数は、例えば、コンテンツ検索装置100のクエリ受信部210が受信した検索クエリの件数である。横軸は所定の単位時間ごとの時間の経過に対応し、縦軸は特定クエリの受信件数に対応する。図2には、12個の棒グラフとして、単位時間ごとの特定クエリの受信件数が示される。例えば、一つの単位時間が30分である場合には、これらの12個の全体の経過時間は6時間である。また、それぞれの棒グラフは、新しい順に、nからn12の記号を用いて区別される。以下の説明では、これらのnからn12の記号は、対応する単位時間における特定クエリの受信件数を表すものとする。
[Comparison index indicating the degree of attention]
FIG. 2 shows an example of the number of received specific queries per unit time used for calculating a comparison index representing the degree of attention according to an embodiment of the present invention. FIG. 2 is a diagram representing the number of received specific queries over time as a bar graph. Here, the number of received cases is, for example, the number of search queries received by the query receiving unit 210 of the content search apparatus 100. The horizontal axis corresponds to the passage of time for each predetermined unit time, and the vertical axis corresponds to the number of received specific queries. FIG. 2 shows the number of received specific queries per unit time as twelve bar graphs. For example, if one unit time is 30 minutes, the total elapsed time of these 12 pieces is 6 hours. Each bar graph is distinguished from the newest one using the symbols n 1 to n 12 . In the following description, these n 1 to n 12 symbols represent the number of received specific queries in the corresponding unit time.

変動数は、一例として、直前の単位時間における特定クエリの受信件数に対する数の変化として算出することができる。この場合に、棒グラフnが表す特定クエリの受信件数に対応する変動数は、(n−n)である。他の単位時間においても同様であり、例えば、棒グラフnが表す単位時間における特定クエリの受信件数に対応する変動数は、(n−n)である。 For example, the number of fluctuations can be calculated as a change in the number with respect to the number of received specific queries in the immediately preceding unit time. In this case, the number of fluctuations corresponding to the number of received specific queries represented by the bar graph n 1 is (n 1 −n 2 ). The same applies to other unit times. For example, the number of fluctuations corresponding to the number of received specific queries in the unit time represented by the bar graph n 7 is (n 7 −n 8 ).

変動率は、一例として、直前の単位時間における特定クエリの受信件数に対する比率として算出することができる。すなわち、変動率は、単位時間あたりの受信件数をその前の単位時間あたりの受信件数で除して算出することができる。この場合に、棒グラフnが表す特定クエリの受信件数に対応する変動率は、(n−n)/nである。 For example, the fluctuation rate can be calculated as a ratio to the number of received specific queries in the unit time immediately before. That is, the fluctuation rate can be calculated by dividing the number of receptions per unit time by the previous number of receptions per unit time. In this case, the rate of change corresponding to the number of received specific queries represented by the bar graph n 1 is (n 1 −n 2 ) / n 2 .

注目度を表す比較インデックスは、上述のように算出される変動数と変動率との積として算出することができる。例えば、棒グラフnが表す特定クエリの受信件数に対応する比較インデックスは、(n−n/nである。このように算出される比較インデックスは、当技術分野においてバースト度とも呼ばれる。 The comparison index representing the degree of attention can be calculated as the product of the number of changes and the rate of change calculated as described above. For example, the comparison index corresponding to the number of received specific queries represented by the bar graph n 1 is (n 1 −n 2 ) 2 / n 2 . The comparison index calculated in this way is also called a burst degree in the art.

図2に示す例においては、棒グラフnが表す特定クエリの受信件数は、他の棒グラフnからn12と比較して、突出して多い。従って、上述のように算出される変動数、変動率、及び注目度を表す比較インデックスは、棒グラフnに対して大きな値であり、他の棒グラフnからn12に対しては相対的に小さな値になりうる。 In the example illustrated in FIG. 2, the number of received specific queries represented by the bar graph n 1 is prominently larger than the other bar graphs n 2 to n 12 . Therefore, the comparison index representing the number of fluctuations, the fluctuation rate, and the degree of attention calculated as described above is a large value with respect to the bar graph n 1 and relatively relative to the other bar graphs n 2 to n 12 . Can be a small value.

すなわち、特定の検索クエリに対する注目度が急上昇している状況においては、棒グラフnに対する算出と同様に、所定の単位時間における当該検索クエリの変動数、変動率、及び注目度を表す比較インデックスは、いずれも大きな値になりうる。対照的に、注目度の急上昇がない状況においては、棒グラフnからn12のいずれかに対する算出と同様に、当該検索クエリの変動数、変動率、及び注目度を表す比較インデックスは相対的に小さな値になりうる。 That is, in a situation where the degree of attention with respect to a specific search query is rapidly increasing, the comparison index representing the number of changes, the rate of change, and the degree of attention of the search query in a predetermined unit time is similar to the calculation for the bar graph n 1 . , Both can be large. In contrast, in a situation where there is no sudden rise in the degree of attention, the comparison index representing the number of fluctuations, the fluctuation rate, and the degree of attention of the search query is relatively similar to the calculation for any of the bar graphs n 2 to n 12. Can be a small value.

上述においては、変動率を、直前の一つの単位時間における特定クエリの受信件数に対する比率として説明したが、これに限らず、変動率の基準は、直前の二つの単位時間における受信件数の平均、直前の三つの単位時間における受信件数の加重平均、あるいは時間を単位とする所定の過去の期間における受信件数の平均等でもよい。さらに、変動率には、所定の有効数字による端数処理等を適宜実施してもよい。また変動数又は変動率には、移動平均による平滑化等を適宜実施してもよい。   In the above description, the fluctuation rate has been described as a ratio to the number of received specific queries in the immediately preceding unit time. However, the present invention is not limited to this. It may be a weighted average of the number of receptions in the last three unit times, or an average of the number of receptions in a predetermined past period in units of time. Furthermore, a fraction processing with a predetermined significant number may be appropriately performed on the variation rate. Further, smoothing by moving average or the like may be appropriately performed on the number of fluctuations or the fluctuation rate.

このようにして、特定クエリの受信件数に対する変動数、変動率、及び注目度を表す比較インデックスを算出することにより、コンテンツ検索装置100は、特定の検索クエリに対する注目度が急上昇している状況を数値化し、後述の検索結果における重みづけの調整を含むコンテンツ検索のために、数値化した情報を用いることができる。   In this way, by calculating the comparison index representing the number of changes, the rate of change, and the degree of attention with respect to the number of received specific queries, the content search apparatus 100 can detect a situation in which the degree of attention with respect to a specific search query has increased rapidly. The digitized information can be used for content search including digitization and adjustment of weights in search results described later.

[コンテンツ検索方法のフロー図]
図3に、本発明の一実施形態に係る、コンテンツ検索方法を示すフロー図を示す。以下、図1に示したコンテンツ検索装置100の動作として、本発明に係るコンテンツ検索方法の諸段階を説明する。
[Flow diagram of content search method]
FIG. 3 is a flowchart showing a content search method according to an embodiment of the present invention. Hereinafter, steps of the content search method according to the present invention will be described as operations of the content search apparatus 100 shown in FIG.

ステップS110において、コンテンツ検索装置100は、ユーザ端末からの検索クエリを受信する。典型的なユーザ端末は、携帯電話又はネットワーク接続されたパーソナル・コンピュータ等である。受信した検索クエリは、コンテンツ検索装置100に接続又は内蔵されるクエリログDB110に記録される。   In step S110, the content search device 100 receives a search query from a user terminal. A typical user terminal is a mobile phone or a personal computer connected to a network. The received search query is recorded in the query log DB 110 connected to or built in the content search device 100.

ステップS120において、コンテンツ検索装置100は、注目度を表す比較インデックスを算出する。比較インデックスは、クエリログDB110に記録された特定の検索クエリが、所定の単位時間において増加又は減少したことを表す変動数、及びその比率である変動率から、例えば、変動数及び変動率の積として算出することができる。算出した比較インデックスは、当該検索クエリに関連付けてクエリログDB110に格納してもよい。コンテンツ検索装置100は、受信した検索クエリの注目度が急上昇している状況においては、当該検索クエリに対して大きな比較インデックスを生成しうる。   In step S120, the content search device 100 calculates a comparison index representing the degree of attention. The comparison index is, for example, the product of the number of changes and the rate of change from the number of changes that indicate that the specific search query recorded in the query log DB 110 has increased or decreased in a predetermined unit time and the rate of change that is the ratio. Can be calculated. The calculated comparison index may be stored in the query log DB 110 in association with the search query. The content search device 100 can generate a large comparison index for the search query in a situation where the degree of attention of the received search query is rapidly increasing.

ステップS130において、コンテンツ検索装置100は、検索されるコンテンツの投稿からの経過時間の短さを表す、投稿の新鮮さを重みづけとして表すための情報を調整する。具体的には、この重みづけは、検索インデックスDB130において、検索結果の順位を順序づけるために設けられる評価項目としてのフィールドの一部に格納される。コンテンツ検索装置100は、前述のステップS120において大きな比較インデックスが生じている検索クエリをインデックスとして含むコンテンツについて、このステップS130において、重みづけの値を大きくするように動作する。   In step S <b> 130, the content search apparatus 100 adjusts information for expressing the freshness of the post as a weight, which indicates a short elapsed time from the post of the searched content. Specifically, this weighting is stored in a part of the field as an evaluation item provided for ordering the order of the search results in the search index DB 130. The content search apparatus 100 operates so as to increase the weighting value in step S130 for the content including the search query in which a large comparison index is generated in step S120 described above as an index.

ステップS140において、コンテンツ検索装置100は、検索クエリに基づいて、検索インデックスDB130を用いてコンテンツを検索する。前述のステップS130において重みづけが調整されることにより、受信した検索クエリの注目度が急上昇している状況においては、当該検索クエリをインデックスに含むコンテンツのうちで、投稿からの経過時間の短いものほど重みづけが大きくなる。従って、コンテンツ検索装置100は、ステップS120において、より大きな比較インデックスが生成された検索クエリをインデックスに含むコンテンツほど、より上位にランキングするように、コンテンツを順序づけた検索結果を生成する。   In step S140, the content search device 100 searches for content using the search index DB 130 based on the search query. In the situation where the attention level of the received search query is rapidly increasing due to the weighting being adjusted in the above-described step S130, the content including the search query in the index has a short elapsed time since posting. The greater the weight. Therefore, in step S120, the content search device 100 generates a search result in which the content is ordered so that the content including the search query in which the larger comparison index is generated is ranked higher.

ステップS150において、コンテンツ検索装置100は、検索されたコンテンツの情報を出力する。ユーザは、検索クエリをインデックスに含むコンテンツのうちから、鮮度の高い順に順序づけられた検索結果を得ることができる。   In step S150, the content search device 100 outputs information on the searched content. The user can obtain search results that are ordered in descending order of freshness from the content that includes the search query in the index.

このようにすることで、本発明に係るコンテンツ検索方法は、注目度が急上昇している検索クエリをインデックスに含むコンテンツの中から、より新鮮であるコンテンツほど上位となるよう順序づけたコンテンツ検索結果を、自動的に生成することが可能である。従って、本発明に係るコンテンツ検索方法によれば、ユーザ自らが投稿して形成されるコンテンツの鮮度を優先して検索結果に反映させることが可能なサービス等を提供することが可能になり、速報性の高い検索サービス等を提供することが可能になる。   By doing in this way, the content search method according to the present invention provides content search results that are ordered so that the fresher content is higher in the content including the search query that is rapidly gaining attention in the index. Can be generated automatically. Therefore, according to the content search method of the present invention, it is possible to provide a service or the like that can reflect the freshness of content formed by the user himself / herself and reflect it in the search result. It is possible to provide a search service with high characteristics.

[クエリログDB110の構造]
図4に、本発明の一実施形態に係る、クエリログDB110のデータ構造を示す。一例として、クエリログDB110のデータ構造は、クエリID312、クエリ314、変動数316、及び変動率318を、相互に関連付けてクエリログDB110に格納するために用いられる。
[Structure of query log DB 110]
FIG. 4 shows the data structure of the query log DB 110 according to an embodiment of the present invention. As an example, the data structure of the query log DB 110 is used to store the query ID 312, the query 314, the variation number 316, and the variation rate 318 in the query log DB 110 in association with each other.

クエリID312は、本発明の一実施形態に係るコンテンツ検索装置100が、ユーザ端末160から受信した検索クエリを識別するための、識別子として用いられる。クエリ314は、クエリID312によって識別可能な検索クエリであれば何でもよく、任意の形態の検索キー、リンク情報、又は論理演算子を含む複数の語句等でもよい。典型的には、クエリ314は、検索クエリに含まれるキーワード等である。図4には、一例として、クエリID312が「122」である検索クエリは、クエリ314が「六本木」であり、クエリID312が「123」である検索クエリは、クエリ314が「公園」であることを示している。コンテンツ検索装置100は、例えば、受信した検索クエリからキーワードを抽出し、個々のキーワードごとにクエリ314を設け、それぞれのクエリ314をクエリID312により識別してもよい。さらに、クエリログDB110には、特定のクエリID312に関連付けられる追加の情報等を格納するために、追加のフィールドを適宜設けてもよい。   The query ID 312 is used as an identifier for identifying the search query received from the user terminal 160 by the content search device 100 according to an embodiment of the present invention. The query 314 may be any search query that can be identified by the query ID 312, and may be any form of search key, link information, or a plurality of phrases including logical operators. Typically, the query 314 is a keyword or the like included in the search query. In FIG. 4, as an example, a search query whose query ID 312 is “122” has a query 314 of “Roppongi”, and a search query whose query ID 312 is “123” has a query 314 of “park”. Is shown. For example, the content search apparatus 100 may extract a keyword from the received search query, provide a query 314 for each keyword, and identify each query 314 by the query ID 312. Furthermore, in the query log DB 110, an additional field may be provided as appropriate in order to store additional information associated with the specific query ID 312.

変動数316は、所定の単位時間において、特定のクエリID312に関連付けられるクエリ314が変動した数を記録するために用いられる。変動数316は、符号付き整数等の形式でもよく、増加又は減少を表す記号等を併用してもよい。例えば、所定の単位時間における増加を正の整数として、減少を負の整数として表してもよい。単位時間としては、例えば、1分、3分、10分、30分、1時間、2時間、3時間、6時間等、任意の時間の単位を用いることができる。図4に示す例においては、クエリID312が「122」である検索クエリは、所定の単位時間において12321件だけ増加したことが記録されている。この記録には、正の数であることを示す符号「+」等を伴ってもよい。一方、クエリID312が「123」である検索クエリは、所定の単位時間において23件だけ減少したことが、符号「−」と共に記録されている。   The variation number 316 is used to record the number of variations of the query 314 associated with the specific query ID 312 in a predetermined unit time. The variation number 316 may be in the form of a signed integer or the like, or may be used in combination with a symbol representing increase or decrease. For example, an increase in a predetermined unit time may be expressed as a positive integer, and a decrease may be expressed as a negative integer. As the unit time, any unit of time such as 1 minute, 3 minutes, 10 minutes, 30 minutes, 1 hour, 2 hours, 3 hours, 6 hours, etc. can be used. In the example shown in FIG. 4, it is recorded that the search query whose query ID 312 is “122” has increased by 12321 in a predetermined unit time. This recording may be accompanied by a sign “+” or the like indicating a positive number. On the other hand, a search query with a query ID 312 of “123” is recorded with a sign “−” that it has been reduced by 23 in a predetermined unit time.

変動数316は、単位時間ごとの変動数を格納する配列でもよい。例えば、1時間単位の単位時間ごとの数値を、配列の形式で変動数316に格納してもよい。さらに、変動数316には、移動平均による平滑化等を適宜実施してもよい。   The variation number 316 may be an array that stores the variation number per unit time. For example, numerical values for each unit time in units of one hour may be stored in the variation number 316 in the form of an array. Further, the fluctuation number 316 may be appropriately smoothed by a moving average.

変動率318は、前述の変動数316の比率を記録するために用いられる。変動率318は、符号付き実数等の形式でもよく、上昇又は下降を表す記号等を併用してもよい。比率の基準は任意に設定できる。例えば、所定の過去の期間にわたる単位時間ごとの変動数316を平均した数を、比較の基準として用いて、最近の単位時間における変動数316の比率として変動率318を算出してもよい。所定の過去の期間は、例えば、12時間、1日、2日、3日、1週間、2週間、1ヶ月等、任意の期間を用いることができる。あるいは、比率の基準は、前回(直前の一つ)の単位時間、直前の二つの単位時間の平均、直前の三つの単位時間からの加重平均等でもよい。   The variation rate 318 is used to record the ratio of the above-described variation number 316. The fluctuation rate 318 may be in the form of a signed real number or the like, or may be used in combination with a symbol representing ascending or descending. Ratio criteria can be set arbitrarily. For example, the rate of change 318 may be calculated as a ratio of the number of changes 316 in the latest unit time using the average of the numbers of changes 316 per unit time over a predetermined past period as a reference for comparison. As the predetermined past period, for example, an arbitrary period such as 12 hours, 1 day, 2 days, 3 days, 1 week, 2 weeks, or 1 month can be used. Alternatively, the ratio criterion may be the previous (one immediately preceding) unit time, the average of the two previous unit times, the weighted average from the three previous unit times, or the like.

変動率318は、変動数316と同様に、単位時間ごとの変動数を格納する配列でもよい。例えば、1時間単位の単位時間ごとの数値を、配列の形式で変動率318に格納してもよい。さらに、変動率318には、所定の有効数字による端数処理等を適宜実施してもよい。符号についても、変動数316と同様である。   Similar to the fluctuation number 316, the fluctuation rate 318 may be an array that stores the fluctuation number per unit time. For example, numerical values for each unit time in units of one hour may be stored in the variation rate 318 in the form of an array. Further, the rate of change 318 may be appropriately subjected to fraction processing with a predetermined significant figure. The sign is also the same as the variation number 316.

このようにすることで、本発明の一実施形態に係るコンテンツ検索装置100は、クエリログDB110を用いて、ユーザ端末160から受信した検索クエリごとに、単位時間あたりの変動数316及び変動率318を算出して記録することが可能である。   By doing in this way, the content search device 100 according to an embodiment of the present invention uses the query log DB 110 to obtain the number of changes 316 and the rate of change 318 per unit time for each search query received from the user terminal 160. It is possible to calculate and record.

[フレッシュネス調整設定テーブル120の構造]
図5に、本発明の一実施形態に係る、フレッシュネス調整設定テーブル120のデータ構造を示す。一例として、フレッシュネス調整設定テーブル120のデータ構造は、倍率ID322、比較インデックス範囲324、及び倍率326を、相互に関連付けるために用いられる。
[Structure of Freshness Adjustment Setting Table 120]
FIG. 5 shows the data structure of the freshness adjustment setting table 120 according to an embodiment of the present invention. As an example, the data structure of the freshness adjustment setting table 120 is used to associate the magnification ID 322, the comparison index range 324, and the magnification 326 with each other.

倍率ID322は、比較インデックス範囲324及び倍率326の関連付けを識別するための識別子として用いられる。倍率326は、倍率ID322によって識別される比較インデックス範囲324ごとに、後述する重みづけを調整するための数値を格納している。   The magnification ID 322 is used as an identifier for identifying the association between the comparison index range 324 and the magnification 326. The magnification 326 stores a numerical value for adjusting weighting to be described later for each comparison index range 324 identified by the magnification ID 322.

比較インデックス範囲324は、前述のクエリログDB110データ構造に含まれる、単位時間あたりの変動数316と変動率318との積の範囲を表す。一例として、図5には、比較インデックス範囲324として、倍率ID322が「001」である比較インデックス範囲324は10以上10000未満の数値の範囲であり、倍率ID322が「002」である比較インデックス範囲324は10000以上50000未満の数値の範囲であることが示されている。これら以外の比較インデックス範囲324についても、適宜設計することができる。例えば、図5に示した例において、比較インデックス範囲324が10未満の場合には、倍率326をゼロとするように、倍率ID322が「999」である比較インデックス範囲324を割り当ててもよい。   The comparison index range 324 represents a product range of the number of fluctuations 316 per unit time and the fluctuation rate 318 included in the above-described query log DB 110 data structure. As an example, in FIG. 5, as the comparison index range 324, the comparison index range 324 whose magnification ID 322 is “001” is a numerical value range from 10 to less than 10,000, and the comparison index range 324 whose magnification ID 322 is “002”. Is shown to be in the numerical range of 10,000 or more and less than 50,000. The comparison index range 324 other than these can also be designed as appropriate. For example, in the example illustrated in FIG. 5, when the comparison index range 324 is less than 10, the comparison index range 324 whose magnification ID 322 is “999” may be assigned so that the magnification 326 is zero.

前述の図4に示した、クエリID312が「122」である検索クエリ「六本木」に注目すると、ある単位時間における変動数316及び変動率318は、それぞれ+12321及び+255%であることが示されている。本発明の一実施形態に係るコンテンツ検索装置100は、前述の比較インデックス算出部220を用いて、このような変動数316と変動率318との積として、当該単位時間における比較インデックスを31418.55(すなわち、12321×2.55)と算出することができる。この例においては、算出された比較インデックスは、図5に示すフレッシュネス調整設定テーブル120のデータ構造において、倍率ID322が「002」である比較インデックス範囲324の範囲に該当する。従って、この比較インデックス範囲324の範囲に対応する倍率326は、図5の例においては「×100」である。   If attention is paid to the search query “Roppongi” whose query ID 312 is “122” shown in FIG. 4 above, it is shown that the number of changes 316 and the rate of change 318 in a certain unit time are +12321 and + 255%, respectively. Yes. The content search apparatus 100 according to an embodiment of the present invention uses the above-described comparison index calculation unit 220 to set the comparison index in the unit time as 31418.55 as the product of the variation number 316 and the variation rate 318. (That is, 12321 × 2.55). In this example, the calculated comparison index corresponds to the range of the comparison index range 324 in which the magnification ID 322 is “002” in the data structure of the freshness adjustment setting table 120 shown in FIG. Therefore, the magnification 326 corresponding to the range of the comparison index range 324 is “× 100” in the example of FIG.

倍率326の数値は、例えば、比較インデックス範囲324がより大きな数値の範囲を含むほど、大きくしてもよい。すなわち、特定の検索クエリの注目度が急上昇する状況において、単位時間あたりの変動数316及び変動率318が、以前よりも急激に大きな値になったことを、倍率326の数値によって、さらに強調することが可能である。倍率326の数値は、この例に限定せず、適宜設定できる。   The numerical value of the magnification 326 may be increased, for example, as the comparison index range 324 includes a larger numerical range. That is, in a situation where the degree of attention of a specific search query increases rapidly, the fact that the number of fluctuations 316 and the fluctuation rate 318 per unit time have become larger values than before is further emphasized by the numerical value of the magnification 326. It is possible. The numerical value of the magnification 326 is not limited to this example and can be set as appropriate.

このようにすることで、本発明の一実施形態に係るコンテンツ検索装置100は、フレッシュネス調整設定テーブル120を用いて、変動数316と変動率318との積としての注目度を表す比較インデックスに対応して、特定の検索クエリの注目度が急上昇する状況をさらに強調するための倍率326を、自動的に設定できる。   By doing in this way, the content search apparatus 100 according to an embodiment of the present invention uses the freshness adjustment setting table 120 to support a comparison index that represents the degree of attention as the product of the number of changes 316 and the rate of change 318. Thus, the magnification 326 for further emphasizing the situation where the degree of attention of a specific search query increases rapidly can be automatically set.

[検索インデックスDB130の構造]
図6に、本発明の一実施形態に係る、検索インデックスDB130のデータ構造を示す。図6(a)は、ある単位時間における検索インデックスDB130のデータ構造に格納された情報の例を示す図であり、図6(b)は別の単位時間における同様の情報の例を示す図である。すなわち、図6(a)及び図6(b)はデータ構造としては同一である。図6(a)及び図6(b)に示す検索インデックスDB130のデータ構造は、ページID342、URL346、インデックス・キーワード348、静的ランク350、動的ランク352、フレッシュネスランク354、及び総合ランク356を、相互に関連付けて検索インデックスDB130に格納するために用いられる。さらに、検索インデックスDB130には、特定のページID342に関連付けられる追加の情報等を格納するために、追加のフィールドを適宜設けてもよい。
[Structure of search index DB 130]
FIG. 6 shows the data structure of the search index DB 130 according to an embodiment of the present invention. FIG. 6A is a diagram illustrating an example of information stored in the data structure of the search index DB 130 in a certain unit time, and FIG. 6B is a diagram illustrating an example of similar information in another unit time. is there. That is, FIG. 6A and FIG. 6B have the same data structure. The data structure of the search index DB 130 shown in FIGS. 6A and 6B includes a page ID 342, a URL 346, an index keyword 348, a static rank 350, a dynamic rank 352, a freshness rank 354, and an overall rank 356. Are used to store them in the search index DB 130 in association with each other. Further, in the search index DB 130, an additional field may be provided as appropriate in order to store additional information associated with a specific page ID 342.

ページID342は、検索インデックスDB130に格納される、相互に関連付けられる情報を識別するための識別子として用いられる。URL346は、検索対象であるコンテンツを含む特定のコンテンツを参照するためのリンク情報としての、URL(Uniform Resource Locator、統一資源位置指定子)であり、必要に応じて、当技術分野に公知のタグ情報等を追加して含んでもよい。すなわち、ページID342は、本発明の一実施形態に係るコンテンツ検索装置100が、コンテンツに関連付けられるURL346を識別するための識別子でありうる。コンテンツとしては、例えば、ブログ、SNS、質問回答型コンテンツ、電子掲示板、クチコミ評価サービス等に代表されるCGM、あるいはUGCと呼ばれるサービスあるいはコンテンツが挙げられるが、これらに限定しない。   The page ID 342 is used as an identifier for identifying information associated with each other stored in the search index DB 130. The URL 346 is a URL (Uniform Resource Locator) as link information for referring to specific content including the content to be searched, and a tag known in the art as necessary. Additional information may be included. That is, the page ID 342 may be an identifier for the content search device 100 according to an embodiment of the present invention to identify the URL 346 associated with the content. Examples of the content include, but are not limited to, a service or content called CGM represented by blog, SNS, question answering content, electronic bulletin board, word-of-mouth evaluation service, or UGC, or UGC.

インデックス・キーワード348は、URL346によって参照される特定のコンテンツに含まれる、キーワード等の検索キーである。インデックス・キーワード348は、配列等でもよい。図6(a)に示す例においては、インデックス・キーワード348に格納されている「火事、六本木」等の語句は、ページID342が「XYZ」であるコンテンツに含まれる語句である。   The index keyword 348 is a search key such as a keyword included in the specific content referred to by the URL 346. The index keyword 348 may be an array or the like. In the example shown in FIG. 6A, a phrase such as “fire, Roppongi” stored in the index keyword 348 is a phrase included in the content whose page ID 342 is “XYZ”.

静的ランク350、動的ランク352、フレッシュネスランク354、及び総合ランク356は、特定の検索クエリに対する検索結果の生成において、複数のコンテンツを順序づけるために用いられる。   Static rank 350, dynamic rank 352, freshness rank 354, and overall rank 356 are used to order multiple content in generating search results for a particular search query.

静的ランク350は、検索クエリに対する総合ランク356の算出における定数として用いることが可能な値であり、個々の検索クエリとは独立して適宜設定することができる。動的ランク352は、検索クエリに対する関連性の高さを表すことが可能な値であり、個々の検索クエリに対して変化しうる。フレッシュネスランク354は、ページID342に対応するコンテンツが投稿されてから経過した時間の短さを表す値であり、典型的には、経過時間が短いほど大きな値でありうる。換言すれば、フレッシュネスランク354は、ページID342に対応するコンテンツの内容の新鮮さを表している。総合ランク356は、静的ランク350、動的ランク352、及びフレッシュネスランク354の合計である。   The static rank 350 is a value that can be used as a constant in the calculation of the overall rank 356 for the search query, and can be set as appropriate independently of each search query. The dynamic rank 352 is a value that can represent a high degree of relevance to the search query, and can change for each search query. The freshness rank 354 is a value that represents the short time that has elapsed since the content corresponding to the page ID 342 was posted. Typically, the freshness rank 354 can be a larger value as the elapsed time is shorter. In other words, the freshness rank 354 represents the freshness of the content corresponding to the page ID 342. The overall rank 356 is the sum of the static rank 350, the dynamic rank 352, and the freshness rank 354.

図6(a)に示す例は、特定のキーワードに対する注目度の急上昇がない状況を反映したものである。図6(a)に示す例においては、ページID342が「XYZ」であるコンテンツは、静的ランク350の値が12であり、投稿からの新鮮さを表すフレッシュネスランク354の値が10である。同様に、ページID342が「PQR」であるコンテンツについては、それぞれの値は13及び2である。ここで、本発明の一実施形態に係るコンテンツ検索装置100が、何らかの検索クエリを受信すると、当該検索クエリに対する関連性として、動的ランク352の値が決定される。ページID342が「XYZ」及び「PQR」のコンテンツについては、それぞれ12及び30という値が、例示されている。従って、当該検索クエリに対する総合ランク356の値として、それぞれのコンテンツに対して、34及び45という値が算出される。総合ランク356の値の大小関係から、コンテンツ検索装置100は、当該検索クエリに対する検索結果において、ページID342が「PQR」であるコンテンツを、ページID342が「XYZ」であるコンテンツよりも、上位に順序づける。   The example shown in FIG. 6A reflects a situation where there is no sudden increase in the degree of attention to a specific keyword. In the example illustrated in FIG. 6A, the content whose page ID 342 is “XYZ” has a static rank 350 value of 12 and a freshness rank 354 value of 10 indicating freshness from a post. Similarly, for the content whose page ID 342 is “PQR”, the values are 13 and 2, respectively. Here, when the content search apparatus 100 according to an embodiment of the present invention receives some search query, the value of the dynamic rank 352 is determined as the relevance to the search query. For the contents with the page ID 342 of “XYZ” and “PQR”, values of 12 and 30 are exemplified. Therefore, values of 34 and 45 are calculated for each content as the value of the overall rank 356 for the search query. Based on the magnitude relationship between the values of the overall rank 356, the content search apparatus 100 orders the content with the page ID 342 “PQR” higher than the content with the page ID 342 “XYZ” in the search result for the search query. The

図6(b)に示す例は、「六本木」という特定のキーワードに対する注目度が急上昇している状況を反映したものである。データ構造は、図6(a)の例と同一である。本発明の一実施形態に係るコンテンツ検索装置100は、以下のようにしてフレッシュネスランク354に対する重みづけを実施し、特定のキーワードに対する注目度が急上昇している状況を検索結果に反映することができる。   The example illustrated in FIG. 6B reflects a situation in which the degree of attention with respect to a specific keyword “Roppongi” is rapidly increasing. The data structure is the same as the example of FIG. The content search apparatus 100 according to an embodiment of the present invention weights the freshness rank 354 as follows, and can reflect a situation in which the degree of attention to a specific keyword is rapidly increasing in a search result. .

「六本木」というキーワードに対する注目度が急上昇したことは、図4に示したクエリログDB110のデータ構造において、「六本木」というキーワードに対応する、クエリID312が「122」である変動数316及び変動率318が、所定の単位時間内に増加することとして表される。例えば、変動数316の値は+12321であり、変動率318の値は+255%である。   The sharp increase in the degree of attention with respect to the keyword “Roppongi” is that the number of changes 316 and the rate of change 318 corresponding to the keyword “Roppongi” in which the query ID 312 is “122” in the data structure of the query log DB 110 shown in FIG. Is expressed as increasing within a predetermined unit time. For example, the value of the variation number 316 is +12321, and the value of the variation rate 318 is + 255%.

このような状況において、本発明の一実施形態に係るコンテンツ検索装置100は、変動数316及び変動率318が増加したキーワードについて、図5に示したフレッシュネス調整設定テーブル120のデータ構造に含まれる倍率326を決定し、図6(b)のフレッシュネスランク354を、次式に従って更新する。

Figure 0005014386
式中、FRNEWは更新後のフレッシュネスランク、FROLDは更新前のフレッシュネスランクである。Mは、図5に示した倍率326から選択される。すなわち、Mの値は、所定の単位時間における特定の検索クエリの変動数316と変動率318との積である注目度を表す比較インデックスに従って、比較インデックス範囲324に対応する倍率326として選択される。FROLDは、変動率318の比較の基準に対応するフレッシュネスランク354でもよい。 In such a situation, the content search apparatus 100 according to an embodiment of the present invention uses the scaling factor included in the data structure of the freshness adjustment setting table 120 illustrated in FIG. 5 for the keywords with the increased number of changes 316 and the change rate 318. 326 is determined, and the freshness rank 354 of FIG. 6B is updated according to the following equation.
Figure 0005014386
In the formula, FR NEW is the freshness rank after update, and FR OLD is the freshness rank before update. M is selected from the magnification 326 shown in FIG. That is, the value of M is selected as the magnification 326 corresponding to the comparison index range 324 according to the comparison index representing the degree of attention that is the product of the number of changes 316 and the rate of change 318 of a specific search query in a predetermined unit time. . The FR OLD may be a freshness rank 354 corresponding to a reference for comparison of the rate of change 318.

本発明の一実施形態に係るコンテンツ検索装置100は、図5のフレッシュネス調整設定テーブル120のデータ構造を参照し、変動数316と変動率318との積である注目度を表す比較インデックスの値が31418.55(すなわち、12321×2.55)であることから、対応する比較インデックス範囲324の倍率ID322が「002」であることを判定できる。さらに、コンテンツ検索装置100は、この倍率ID322に関連付けられる倍率326が「×100」であることを判定できる。従って、コンテンツ検索装置100は、図6(b)に示すフレッシュネスランク354について、ページID342が「XYZ」及び「PQR」であるそれぞれのコンテンツごとに、以前の値を100倍した値を、更新後のフレッシュネスランク354の値として格納することができる。具体的には、ページID342が「XYZ」及び「PQR」のコンテンツの更新後のフレッシュネスランク354は、それぞれ1000及び200である。   The content search apparatus 100 according to an embodiment of the present invention refers to the data structure of the freshness adjustment setting table 120 in FIG. 5, and the value of the comparison index representing the degree of attention, which is the product of the fluctuation number 316 and the fluctuation rate 318, is obtained. Since it is 31418.55 (that is, 12321 × 2.55), it can be determined that the magnification ID 322 of the corresponding comparison index range 324 is “002”. Furthermore, the content search apparatus 100 can determine that the magnification 326 associated with the magnification ID 322 is “× 100”. Therefore, the content search apparatus 100 updates the value obtained by multiplying the previous value by 100 for each content whose page ID 342 is “XYZ” and “PQR” for the freshness rank 354 shown in FIG. Can be stored as the value of the freshness rank 354. Specifically, the freshness ranks 354 after updating the contents whose page IDs 342 are “XYZ” and “PQR” are 1000 and 200, respectively.

このように、「六本木」というキーワードに対する注目度が急上昇している状況においては、コンテンツ検索装置100は、図6(b)に例示するフレッシュネスランク354の値を更新する。換言すれば、図6(b)に例示する総合ランク356を構成している、静的ランク350、動的ランク352、及びフレッシュネスランク354のうちから、フレッシュネスランク354の重みづけが変更される。すなわち、コンテンツ検索装置100は、鮮度の高いコンテンツほど、フレッシュネスランク354の重みづけを大きくするように動作する。   In this manner, in a situation where the degree of attention to the keyword “Roppongi” is rapidly increasing, the content search apparatus 100 updates the value of the freshness rank 354 illustrated in FIG. In other words, the weight of the freshness rank 354 is changed from the static rank 350, the dynamic rank 352, and the freshness rank 354 constituting the general rank 356 illustrated in FIG. In other words, the content search apparatus 100 operates so that the freshness rank 354 is weighted more as the freshness content is higher.

更新された総合ランク356の値は、ページID342が「XYZ」及び「PQR」のコンテンツに対して、それぞれ1024及び243である。従って、図6(b)に示す例においては、本発明の一実施形態に係るコンテンツ検索装置100は、ページID342が「XYZ」であるコンテンツを、当該検索クエリに対する検索結果の出力において、ページID342が「PQR」であるコンテンツよりも上位に順序づけることができる。   The updated value of the overall rank 356 is 1024 and 243 for contents whose page IDs 342 are “XYZ” and “PQR”, respectively. Therefore, in the example shown in FIG. 6B, the content search apparatus 100 according to an embodiment of the present invention uses the page ID 342 in the output of the search result for the search query to the content whose page ID 342 is “XYZ”. Can be ordered higher than the content having “PQR”.

このようにすることで、本発明の一実施形態に係るコンテンツ検索装置100は、特定のキーワードに対する注目度が急上昇している状況において、鮮度の高いコンテンツほど、フレッシュネスランク354の重みづけを大きくするように動作し、検索結果の出力に含まれるコンテンツの順位を順序づけることが可能である。   By doing in this way, the content search device 100 according to an embodiment of the present invention increases the weight of the freshness rank 354 for a fresher content in a situation where the degree of attention to a specific keyword is rapidly increasing. It is possible to order the order of contents included in the output of search results.

[コンテンツ検索表示の例]
図7に、本発明の一実施形態に係る、コンテンツ検索表示400及び450の例を示す。コンテンツ検索表示400及び450は、いずれも、本発明の一実施形態に係るコンテンツ検索装置100のユーザ・インタフェースとしての機能を有し、表示領域410の範囲内に、クエリ入力領域420、検索ボタン430、検索結果表示領域440及び490を含む。検索結果表示領域440及び490には、例えば、検索結果として抽出された質問回答型コンテンツの見出し等が表示される。これらの構成要素は、例えば、適切な表示装置(図示せず)に表示される画像要素であり、ユーザは、適宜ポインティング・デバイス(図示せず)等を用いて、入力箇所の選択、又は検索開始の指示等を行うことができる。
[Example of content search display]
FIG. 7 shows examples of content search displays 400 and 450 according to an embodiment of the present invention. Each of the content search displays 400 and 450 has a function as a user interface of the content search apparatus 100 according to an embodiment of the present invention, and a query input area 420 and a search button 430 are within the display area 410. Search result display areas 440 and 490. In the search result display areas 440 and 490, for example, headings of question answer type contents extracted as search results are displayed. These components are, for example, image elements displayed on an appropriate display device (not shown), and the user selects or searches for an input location using a pointing device (not shown) or the like as appropriate. A start instruction or the like can be given.

例示のコンテンツ検索表示400及び450の差異は、特定の検索クエリに対する注目度が急上昇している状況の有無である。コンテンツ検索表示400は、注目度が急上昇している検索クエリが存在する状況において、本発明の一実施形態に係るコンテンツ検索装置100が、当該検索クエリをインデックスに含むコンテンツを検索結果の上位に順序づけることを表している例である。対照的に、コンテンツ検索表示450は、そのような注目度の急上昇のない状況における検索結果の表示の例である。   The difference between the exemplary content search displays 400 and 450 is whether or not there is a situation where the degree of attention to a specific search query is rapidly increasing. In the content search display 400, in a situation where there is a search query whose degree of attention is rapidly increasing, the content search device 100 according to an embodiment of the present invention orders the content including the search query as an index in the higher order of the search results. It is an example showing that. In contrast, the content search display 450 is an example of display of search results in a situation where there is no such rapid increase in attention.

まず、特定の検索クエリに対する注目度の急上昇がない状況における、コンテンツ検索表示450について説明する。ユーザは、クエリ入力領域420に検索語を入力し、検索ボタン430をクリックする。すると、コンテンツ検索装置100は、この検索語を検索クエリとして受信し、受信した検索クエリに対して、検索インデックスDB140における総合ランク356の高いコンテンツを上位に順位付けた検索結果を生成する。生成された検索結果は、検索結果表示領域490に表示される。受信した検索クエリに対する注目度の急上昇がない状況では、総合ランク356の大小は、主に動的ランク352の値に依存する。すなわち、コンテンツ検索装置100は、主に関連性に従って、検索結果表示領域490に表示される検索結果の順序づけを行う。これは、本発明を用いない、検索クエリとの関連性に基づく検索結果を生成するコンテンツ検索の実施装置等と同様である。例えば、検索結果は、検索クエリに含まれる地名又は近傍における地理案内、観光情報、年中行事等の、比較的長い時間にわたって当該地名に対して一定の関連性を有しているコンテンツ等が、上位に順序づけられたものでありうる。   First, the content search display 450 in a situation where there is no sudden increase in the degree of attention to a specific search query will be described. The user inputs a search term in the query input area 420 and clicks the search button 430. Then, the content search apparatus 100 receives this search term as a search query, and generates a search result in which content with a higher overall rank 356 in the search index DB 140 is ranked higher than the received search query. The generated search result is displayed in the search result display area 490. In a situation where there is no sudden rise in the degree of attention to the received search query, the magnitude of the overall rank 356 mainly depends on the value of the dynamic rank 352. That is, the content search apparatus 100 orders the search results displayed in the search result display area 490 mainly according to the relevance. This is the same as the content search execution apparatus that generates a search result based on the relevance to the search query without using the present invention. For example, the search results include a place name included in the search query or content having a certain relevance to the place name over a relatively long period of time, such as geographic information in the vicinity, sightseeing information, annual events, etc. It can be ordered higher.

次いで、特定の検索クエリに対する注目度が急上昇している状況における、コンテンツ検索表示400について説明する。コンテンツ検索装置100は、前述と同様に、検索クエリを受信する。受信した検索クエリに対する注目度が急上昇している状況では、フレッシュネス調整設定テーブル120に基づいて、フレッシュネスランク354を強調するように倍率426が選択される。次いで、そのような検索クエリをインデックスに含む検索インデックスDB140の情報のフレッシュネスランク354は、倍率426を用いて更新される。例えば、当該フレッシュネスランク354の値は、10倍、100倍、1000倍等の値に更新される。従って、総合ランク356の大小は、主に更新されたフレッシュネスランク354の値に依存する。すなわち、コンテンツ検索装置100は、注目度が急上昇している検索クエリをインデックスに含んでいることに従って、検索結果表示領域440に表示される検索結果の順序づけを行う。   Next, the content search display 400 in a situation where the degree of attention with respect to a specific search query is rapidly increasing will be described. The content search device 100 receives the search query as described above. In a situation where the degree of attention with respect to the received search query is rapidly increasing, the magnification 426 is selected so as to emphasize the freshness rank 354 based on the freshness adjustment setting table 120. Next, the freshness rank 354 of the information in the search index DB 140 including such a search query in the index is updated using the magnification 426. For example, the value of the freshness rank 354 is updated to a value such as 10 times, 100 times, or 1000 times. Therefore, the overall rank 356 depends mainly on the updated freshness rank 354 value. That is, the content search apparatus 100 orders the search results displayed in the search result display area 440 according to the fact that a search query whose degree of attention is rapidly increasing is included in the index.

例えば、コンテンツ検索装置100が、地名等を検索クエリとして受信する場合を考える。当該地名に対する注目度が急上昇している状況においては、当該地名に対する単位時間あたりの注目度を表す比較インデックス(変動数316と変動率318との積)が増大しうる。従って、コンテンツ検索装置100は、フレッシュネス調整設定テーブル120に基づいて、10倍、100倍、1000倍等の倍率326を選択する。次いで、コンテンツ検索装置100は、当該地名をインデックスに含む検索インデックスDB140の情報のフレッシュネスランク354を、選択された倍率326を用いて更新する。例えば、フレッシュネスランク354の値は、10倍、100倍、1000倍等の値に更新される。従って、総合ランク356は、主にフレッシュネスランク354に依存するようになり、コンテンツ検索装置100は、注目度が急上昇している地名を含むコンテンツのうちから、投稿からの経過時間が短いものを上位に順序づけた検索結果を生成することが可能である。   For example, consider a case where the content search apparatus 100 receives a place name or the like as a search query. In a situation where the degree of attention to the place name is rapidly increasing, the comparison index (product of the number of changes 316 and the rate of change 318) representing the degree of attention per unit time for the place name may increase. Therefore, the content search apparatus 100 selects a magnification 326 such as 10 times, 100 times, 1000 times, or the like based on the freshness adjustment setting table 120. Next, the content search apparatus 100 updates the freshness rank 354 of the information in the search index DB 140 that includes the place name in the index using the selected magnification 326. For example, the value of the freshness rank 354 is updated to a value such as 10 times, 100 times, or 1000 times. Therefore, the overall rank 356 mainly depends on the freshness rank 354, and the content search apparatus 100 ranks the content including the place name whose attention level is rapidly increasing from the content having a short elapsed time since posting. It is possible to generate search results ordered in order.

例えば、検索結果は、検索クエリに含まれる地名又は近傍における、ユーザが遭遇した出来事についての投稿を含むコンテンツの見出し等を、当該コンテンツの投稿からの経過時間の短さ、すなわち投稿の鮮度に従って順序づけたものとなりうる。具体的なコンテンツとしては、ブログ、SNS、質問回答型コンテンツ、電子掲示板、クチコミ評価サービス等に代表されるCGM、あるいはUGCと呼ばれるサービスあるいはコンテンツが挙げられる。   For example, the search results are ordered according to the shortness of elapsed time since posting of the content, that is, the freshness of the posting, such as a headline of the content including a post about the event that the user encountered in the place name or the vicinity included in the search query. It can be a thing. Specific contents include services or contents called CGM or UGC represented by blogs, SNS, question answering contents, electronic bulletin boards, word-of-mouth evaluation services, and the like.

このようにすることで、本発明の一実施形態に係るコンテンツ検索装置100は、特定の検索クエリをインデックスに含むコンテンツに対して、コンテンツの投稿からの経過時間の短さに従って順序づけた検索結果を生成し、生成した検索結果を検索結果表示領域440を介してユーザに提供することが可能である。従って、本発明に係るコンテンツ検索装置100を用いることにより、ユーザ自らが投稿して形成されるコンテンツの鮮度を優先して検索結果に反映させることが可能なサービス等を提供することが可能になり、速報性の高い検索サービス等を提供することが可能になる。   By doing in this way, the content search apparatus 100 according to an embodiment of the present invention retrieves search results that are ordered according to the shortness of the elapsed time from the content posting to the content that includes the specific search query in the index. The generated search result can be provided to the user via the search result display area 440. Therefore, by using the content search apparatus 100 according to the present invention, it is possible to provide a service that can preferentially reflect the freshness of content that is created by the user himself / herself to be reflected in the search result. Thus, it becomes possible to provide a search service or the like with high speed information.

上述のようなコンテンツ検索表示400及び450は、典型的には、いずれも携帯電話又はネットワーク接続されたパーソナル・コンピュータ等を含むユーザ端末が適宜備えるディスプレイ装置(図示せず)等の画面レイアウトである。本発明の一実施形態に係るコンテンツ検索装置100は、これに限定せず、プリンタ装置(図示せず)を用いて作成可能な印刷物等の形態として、コンテンツ検索表示400及び450を提供してもよい。   The content search displays 400 and 450 as described above are typically screen layouts such as a display device (not shown) appropriately provided in a user terminal including a mobile phone or a network-connected personal computer. . The content search apparatus 100 according to an embodiment of the present invention is not limited to this, and the content search displays 400 and 450 may be provided as forms of printed matter that can be created using a printer device (not shown). Good.

図7には、ユーザがクエリ入力領域420に検索クエリを入力する例を示したが、本発明に係るコンテンツ検索装置100はこれに限らず、予め何らかの予約語をクエリ入力領域420等に用意して動作してもよい。このような予約語は、ユーザから可読でもよく、不可視でもよい。例えば、予約語としては、質問回答型コンテンツの話題を分類可能なジャンル名、コミュニティの参加者をユーザとする質問回答型コンテンツにおける当該コミュニティに特徴的な話題の語句等が挙げられるが、限定しない。あるいは、コンテンツ検索装置100は、クエリログDB110に記録された、変動数316又は変動率318が急上昇している検索クエリに含まれる語句から、予約語として用いる語句を選択してもよい。このようにすることで、コンテンツ検索装置100は、ユーザが予約語から選択して検索クエリを指定することに応答して、上述の動作を実施することが可能である。あるいは、コンテンツ検索装置100は、クエリ入力領域420にユーザからの入力が何もない状態であっても、単に検索ボタン430のクリック等によって検索開始が指示されることに応答して、いずれかの予約語を検索クエリとして上述の動作を実施し、検索結果を生成してもよい。注目度を表す比較インデックス(変動数316と変動率318との積)を用いて、予約語を順序づけてよい。   FIG. 7 shows an example in which a user inputs a search query in the query input area 420. However, the content search apparatus 100 according to the present invention is not limited to this, and some reserved words are prepared in the query input area 420 and the like in advance. May operate. Such reserved words may be readable by the user or invisible. For example, reserved words include, but are not limited to, genre names that can categorize topics of question answer type content, words of topics characteristic of the community in question answer type content with community participants as users, etc. . Alternatively, the content search apparatus 100 may select a word / phrase to be used as a reserved word from words / phrases included in a search query recorded in the query log DB 110 and having a rapidly increasing fluctuation number 316 or fluctuation rate 318. By doing in this way, the content search device 100 can perform the above-described operation in response to the user selecting from reserved words and specifying a search query. Alternatively, the content search device 100 responds to an instruction to start a search by simply clicking the search button 430 or the like even if there is no input from the user in the query input area 420. The above operation may be performed using a reserved word as a search query to generate a search result. The reserved words may be ordered using a comparison index representing the degree of attention (product of the variation number 316 and the variation rate 318).

さらに、本発明に係るコンテンツ検索装置100は、前述の予約語に加えて、所定の期間が経過するごとに検索を開始してもよい。所定の期間は、例えば、ユーザが最後に検索を実施してからの経過時間等であるが、限定しない。所定の期間は、例えば、コンテンツ検索装置100に公知のRTC(リアルタイムクロック)を内蔵して計測してもよく、RTCを標準装備しているパーソナル・コンピュータ等をコンテンツ検索装置100として用いて計測してもよい。このようにすることで、本発明の一実施形態に係るコンテンツ検索装置100は、クエリ入力領域420にユーザからの入力がなく、ユーザからの検索開始の指示がない状態であっても、予約語を検索クエリとして定期的又は周期的に上述の動作を実施し、検索結果を生成することが可能である。このような実施形態は、例えば、地域性や趣味等の特定の関心に基づくコミュニティのための質問応答型コンテンツ等を検索対象として、検索クエリの急増等の様式で注目度が急上昇している話題を含む投稿を、投稿の新しい順に、周期的に列挙するサービス等として実装することが可能である。従って、本発明の一実施形態に係るコンテンツ検索装置100は、何らかの話題に対する注目度の急上昇に基づいて、機械動作により、鮮度の高いコンテンツの見出し等を、定期的又は周期的にユーザに提供することが可能な、速報性のある情報媒体の提供手段として機能することが可能である。   Furthermore, the content search apparatus 100 according to the present invention may start a search every time a predetermined period elapses in addition to the reserved words described above. The predetermined period is, for example, an elapsed time since the user last performed a search, but is not limited. The predetermined period may be measured, for example, by incorporating a known RTC (real time clock) in the content search device 100, or using a personal computer or the like equipped with an RTC as a standard as the content search device 100. May be. By doing in this way, the content search device 100 according to an embodiment of the present invention can use a reserved word even when there is no input from the user in the query input area 420 and there is no search start instruction from the user. As a search query, the above-described operation can be performed periodically or periodically to generate a search result. In such an embodiment, for example, a topic whose interest is rapidly increasing in a form such as a rapid increase in a search query for a question answering type content for a community based on a specific interest such as a locality or a hobby. Can be implemented as a service that periodically enumerates posts that include Therefore, the content search apparatus 100 according to an embodiment of the present invention provides a user with a headline of fresh content or the like periodically or periodically by a machine operation based on a sudden rise in the degree of attention to a certain topic. Therefore, it is possible to function as a means for providing an information medium with rapid reporting capability.

以上、本発明の実施形態を用いて説明したが、本発明の技術的範囲は上記実施形態に記載の範囲には限定されない。上記実施形態に、多様な変更又は改良を加えることができる。そのような変更又は改良を加えた形態も本発明の技術的範囲に含まれうることが、特許請求の範囲の記載から明らかである。   As mentioned above, although demonstrated using embodiment of this invention, the technical scope of this invention is not limited to the range as described in the said embodiment. Various modifications or improvements can be added to the above embodiment. It is apparent from the scope of the claims that the embodiments added with such changes or improvements can also be included in the technical scope of the present invention.

100 コンテンツ検索装置
110 クエリログDB
120 フレッシュネス調整設定テーブル
130 検索インデックスDB
160 ユーザ端末
170 ウェブ・コンテンツ
180 ネットワーク
210 クエリ受信部
220 比較インデックス算出部
230 重みづけ調整部
240 コンテンツ検索部
250 検索結果出力部
400、450 コンテンツ検索表示
1000 情報処理装置
100 content search device 110 query log DB
120 Freshness adjustment setting table 130 Search index DB
160 User terminal 170 Web content 180 Network 210 Query reception unit 220 Comparison index calculation unit 230 Weight adjustment unit 240 Content search unit 250 Search result output unit 400, 450 Content search display 1000 Information processing apparatus

Claims (3)

ユーザ端末から受信した検索クエリに基づいて検索インデックス・データベースからコンテンツを検索するコンテンツ検索装置であって、
前記検索クエリの単位時間あたりの受信件数からその前の当該単位時間あたりの受信件数を減じて算出する変動数及び当該単位時間あたりの受信件数をその前の当該単位時間あたりの受信件数で除して算出する変動率に基づく比較インデックスを算出する比較インデックス算出手段と、
前記比較インデックスが高いほど、前記コンテンツについて、コンテンツの投稿を受信した時からの経過時間の短さを示す鮮度に係る重みづけを大きくする重みづけ調整手段と、
前記重みづけに基づいて、前記検索インデックス・データベースからコンテンツを検索するコンテンツ検索手段と、を備える、コンテンツ検索装置。
A content search device for searching for content from a search index database based on a search query received from a user terminal,
The number of fluctuations calculated by subtracting the number of receptions per unit time before the number of receptions per unit time of the search query and the number of receptions per unit time are divided by the number of receptions per unit time before that. A comparison index calculation means for calculating a comparison index based on the fluctuation rate calculated in
Weight adjustment means for increasing the weight related to the freshness indicating the shorter elapsed time from when the content posting is received, as the comparison index is higher;
A content search device comprising: content search means for searching for content from the search index database based on the weighting.
前記比較インデックス算出手段は、前記検索クエリの単位時間あたりの受信件数の変動数と当該受信件数の変動率との積により前記比較インデックスを算出する、請求項1に記載のコンテンツ検索装置。   The content search apparatus according to claim 1, wherein the comparison index calculation unit calculates the comparison index based on a product of a fluctuation number of the number of receptions per unit time of the search query and a fluctuation rate of the reception number. ユーザ端末から受信した検索クエリに基づいて検索インデックス・データベースからコンテンツを検索するコンテンツ検索方法であって、
前記検索クエリの単位時間あたりの受信件数からその前の当該単位時間あたりの受信件数を減じて算出する変動数及び当該単位時間あたりの受信件数をその前の当該単位時間あたりの受信件数で除して算出する変動率に基づく比較インデックスを算出する比較インデックス算出ステップと、
前記比較インデックスが高いほど、前記コンテンツについて、コンテンツの投稿を受信した時からの経過時間の短さを示す鮮度に係る重みづけを大きくする重みづけ調整ステップと、
前記重みづけに基づいて、前記検索インデックス・データベースからコンテンツを検索するコンテンツ検索ステップと、を含む、コンテンツ検索方法。
A content search method for searching content from a search index database based on a search query received from a user terminal,
The number of fluctuations calculated by subtracting the number of receptions per unit time before the number of receptions per unit time of the search query and the number of receptions per unit time are divided by the number of receptions per unit time before that. A comparison index calculating step for calculating a comparison index based on the fluctuation rate calculated in
A weight adjustment step for increasing the weight related to the freshness indicating the shortness of the elapsed time from the time of receiving the content posting, as the comparison index is higher,
And a content search step of searching for content from the search index database based on the weighting.
JP2009187356A 2009-08-12 2009-08-12 Content search device Active JP5014386B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009187356A JP5014386B2 (en) 2009-08-12 2009-08-12 Content search device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009187356A JP5014386B2 (en) 2009-08-12 2009-08-12 Content search device

Publications (2)

Publication Number Publication Date
JP2011039835A JP2011039835A (en) 2011-02-24
JP5014386B2 true JP5014386B2 (en) 2012-08-29

Family

ID=43767529

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009187356A Active JP5014386B2 (en) 2009-08-12 2009-08-12 Content search device

Country Status (1)

Country Link
JP (1) JP5014386B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6434230B2 (en) * 2014-06-18 2018-12-05 株式会社ミツトヨ Seismic observation system and seismometer
WO2022038662A1 (en) * 2020-08-17 2022-02-24 日本電信電話株式会社 Information processing method, information processing device, and program
JP6990757B1 (en) 2020-11-19 2022-01-12 ヤフー株式会社 Generator, generation method and generation program

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7346839B2 (en) * 2003-09-30 2008-03-18 Google Inc. Information retrieval based on historical data
JP2008204416A (en) * 2007-02-19 2008-09-04 Yasuhiro Yamazaki Advanced information acquisition system

Also Published As

Publication number Publication date
JP2011039835A (en) 2011-02-24

Similar Documents

Publication Publication Date Title
US9390144B2 (en) Objective and subjective ranking of comments
US9032289B1 (en) Providing suggestions to users to write comments
JP5572596B2 (en) Personalize the ordering of place content in search results
CA2702439C (en) Method and apparatus for scoring electronic documents
US9996620B2 (en) Continuous content refinement of topics of user interest
JP5608286B2 (en) Infinite browsing
KR20080068921A (en) Displaying compact and expanded data items
EP2350885A2 (en) Providing search results
KR20050049750A (en) On-line advertising system and method
EP1969543A2 (en) Computer method and system for publishing content on a global computer network
JP6184840B2 (en) Information processing apparatus and display priority determination method
US20090106257A1 (en) Multiple-link shortcuts based on contextual analysis of web page objects
US11036817B2 (en) Filtering and scoring of web content
KR20050050016A (en) On-line advertising system and method
JP4859893B2 (en) Advertisement distribution apparatus, advertisement distribution method, and advertisement distribution control program
JP5014386B2 (en) Content search device
JP6270085B1 (en) Information processing apparatus, information processing system, information processing method, and program
JP5364220B1 (en) Information processing apparatus, information processing method, and information processing program
KR101132431B1 (en) System and method for providing interest information
JP6604608B2 (en) Information processing apparatus, information processing method, and information processing program
JP5386548B2 (en) Soaring word extraction apparatus and method
JP5519406B2 (en) Server apparatus, genre score calculation method, and program
JP2020129350A (en) Information processing device, information processing method, and information processing program
Husain et al. A Survey on Improving the Web Search Ranking by User Behavior Information
JP2009043063A (en) Content distribution server and method

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20120312

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120427

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120515

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120605

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150615

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5014386

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350