JP5493983B2 - Search device - Google Patents

Search device Download PDF

Info

Publication number
JP5493983B2
JP5493983B2 JP2010037188A JP2010037188A JP5493983B2 JP 5493983 B2 JP5493983 B2 JP 5493983B2 JP 2010037188 A JP2010037188 A JP 2010037188A JP 2010037188 A JP2010037188 A JP 2010037188A JP 5493983 B2 JP5493983 B2 JP 5493983B2
Authority
JP
Japan
Prior art keywords
browsing
search
document
degree information
score
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010037188A
Other languages
Japanese (ja)
Other versions
JP2011175342A (en
Inventor
康之 友永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2010037188A priority Critical patent/JP5493983B2/en
Publication of JP2011175342A publication Critical patent/JP2011175342A/en
Application granted granted Critical
Publication of JP5493983B2 publication Critical patent/JP5493983B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、検索結果をランキング付けする機能を有する検索装置に関する。   The present invention relates to a search device having a function of ranking search results.

検索者から入力された検索条件に合致する文書を検索する検索装置において、検索結果の一覧を表示する際のランキング手法が各種提案ないし実用化されている。その内の一つに、検索者の閲覧行動に基づく手法がある。   In a search device that searches for a document that matches a search condition input by a searcher, various ranking methods for displaying a list of search results have been proposed or put into practical use. One of them is based on the browsing behavior of searchers.

検索者の閲覧行動に基づいて検索結果をランキング付けする手法を用いた検索装置の一例が特許文献1に記載されている。特許文献1に記載された検索装置は、検索対象となる各文書ごとに、その文書の閲覧の程度情報をサーバ装置が記憶している。文書の閲覧の程度情報としては、その文書の閲覧時間、一定期間におけるその文書の表示頻度などが用いられている。これらの閲覧の程度は、検索者の使用するクライアント装置側で測定されて、サーバ装置へ送信されるようになっている。そして、サーバ装置は、検索者から指定された検索条件に合致する文書を検索した際、検索した各文書ごとに、上記記憶している閲覧の程度情報に基づいて、閲覧の程度が高いほど重要な文書である、という考え方の下にランキング付けを行う。   An example of a search device using a technique for ranking search results based on a searcher's browsing behavior is described in Patent Document 1. In the search device described in Patent Document 1, for each document to be searched, the server device stores information on the degree of browsing of the document. As the document browsing degree information, the browsing time of the document, the display frequency of the document in a certain period, and the like are used. The degree of browsing is measured on the client device side used by the searcher and transmitted to the server device. When the server device searches for a document that matches the search condition specified by the searcher, the higher the degree of browsing, the more important it is for each searched document based on the stored browsing degree information. Ranking based on the idea that the documents are

特開2008−52579号公報JP 2008-52579 A

一般に検索された文書の重要度は、検索者の検索意図によって変化する。例えば、X社、Y社、Z社など各社の携帯電話を主に紹介している文書B1の場合、各社の携帯電話の情報を知りたい検索者U1にとっては重要であるが、X社の事業全般を知りたい検索者U2にとってはあまり重要ではない。反対に、X社の事業全般についての説明が主であり、X社の携帯電話に関して少しだけ触れている文書B2の場合、逆の結果、つまり検索者U2にとって重要であるが、検索者U1にはあまり重要でない。   In general, the importance of a searched document varies depending on the search intention of the searcher. For example, in the case of document B1, which mainly introduces mobile phones of companies such as Company X, Company Y, Company Z, etc., it is important for searcher U1 who wants to know information about the mobile phones of each company, but the business of Company X It is not so important for the searcher U2 who wants to know the whole. On the other hand, in the case of the document B2, which mainly describes the business of the company X and touches a little about the mobile phone of the company X, the opposite result, that is important for the searcher U2, is the searcher U1. Is not very important.

しかるに、上述した特許文献1では、検索者の閲覧意図と閲覧行動とを考慮したランキング付けが行えない。例えば上述した例で説明すれば、検索者U1が閲覧した文書B1、B2の閲覧時間を例えば100秒、5秒、検索者U2が閲覧した文書B1、B2の閲覧時間を例えば5秒、200秒とすると、特許文献1では、文書B1の閲覧時間を105秒、文書B2の閲覧時間を205秒として管理する。そして、後の任意の検索者による検索時に、文書B1、B2が検索結果に含まれた場合に、文書B2の閲覧の程度が文書B1より高いので、検索者の検索意図にかかわらず文書B2を文書B1より重要な文書としてランキング付けする。この結果、各社の携帯電話の情報を知りたい検索者に対して、正しくないランキング付けとなってしまう。   However, in Patent Document 1 described above, ranking in consideration of a searcher's browsing intention and browsing behavior cannot be performed. For example, in the example described above, the browsing time of the documents B1 and B2 browsed by the searcher U1 is 100 seconds and 5 seconds, for example, and the browsing time of the documents B1 and B2 browsed by the searcher U2 is 5 seconds and 200 seconds, for example. Then, in patent document 1, the browsing time of document B1 is managed as 105 seconds, and the browsing time of document B2 is managed as 205 seconds. When documents B1 and B2 are included in the search results at the time of a later search by any searcher, since the degree of browsing of the document B2 is higher than the document B1, the document B2 is selected regardless of the searcher's search intention. Ranking as a document more important than document B1. As a result, the ranking is incorrect for the searcher who wants to know the information on the mobile phone of each company.

本発明の目的は、上述した課題、すなわち検索意図が違うと検索者の閲覧行動に基づくランキング付けは間違ったものになってしまう、という課題を解決する検索装置を提供することにある。   An object of the present invention is to provide a search device that solves the above-described problem, that is, the ranking based on the browsing behavior of a searcher becomes wrong if the search intention is different.

本発明の一形態にかかる検索装置は、文書の閲覧程度情報を検索条件別に記憶する閲覧程度情報記憶手段と、指定された検索条件に合致する文書を検索し、該検索した文書ごとに、上記指定された検索条件と同じ検索条件に対応して上記閲覧程度情報記憶手段に記憶されている閲覧程度情報を考慮してスコアを算出し、該算出したスコアでランキング付けした検索結果を出力する検索手段とを備える。   A search device according to an aspect of the present invention searches a browsing degree information storage unit that stores document browsing degree information for each search condition, searches for a document that matches a specified search condition, and stores the above information for each searched document. A search that calculates the score in consideration of the browsing degree information stored in the browsing degree information storage means corresponding to the same search condition as the specified search condition, and outputs the search result ranked by the calculated score Means.

本発明は上述したように構成されているため、検索者の検索意図と閲覧行動とに基づいて検索結果をランキング付けすることができる。   Since this invention is comprised as mentioned above, a search result can be ranked based on a searcher's search intention and browsing action.

本発明の第1の実施形態のブロック図である。It is a block diagram of a 1st embodiment of the present invention. 本発明の第2の実施形態のブロック図である。It is a block diagram of the 2nd Embodiment of this invention. 本発明の第2の実施形態における閲覧行動ログの構成例を示す図である。It is a figure which shows the structural example of the browsing action log in the 2nd Embodiment of this invention. 本発明の第2の実施形態における閲覧時間ログの構成例を示す図である。It is a figure which shows the structural example of the browsing time log in the 2nd Embodiment of this invention. 本発明の第2の実施形態における閲覧時間ログ生成プログラムの動作例を示すフローチャートである。It is a flowchart which shows the operation example of the browsing time log production | generation program in the 2nd Embodiment of this invention. 本発明の第2の実施形態における文書情報のスコア計算手順の一例を示す図である。It is a figure which shows an example of the score calculation procedure of the document information in the 2nd Embodiment of this invention. 本発明の第2の実施形態における文書情報のスコア計算式を示す図である。It is a figure which shows the score calculation formula of the document information in the 2nd Embodiment of this invention.

次に本発明の実施の形態について図面を参照して詳細に説明する。
[第1の実施形態]
図1を参照すると、本発明の第1の実施形態にかかる検索装置100は、一般的にはサーバ装置から構成され、ユーザから入力される検索条件に合致する文書を検索し、検索結果をランキング付けしてユーザに返却する機能を有している。この検索装置100は、閲覧程度情報記憶手段110と、検索手段120と、閲覧履歴記憶手段130と、閲覧程度情報算出手段140とを備えている。
Next, embodiments of the present invention will be described in detail with reference to the drawings.
[First embodiment]
Referring to FIG. 1, a search device 100 according to the first embodiment of the present invention is generally configured from a server device, searches for documents that match a search condition input by a user, and ranks the search results. And has a function of returning it to the user. The search device 100 includes a browsing degree information storage unit 110, a searching unit 120, a browsing history storage unit 130, and a browsing level information calculation unit 140.

閲覧程度情報記憶手段110は、文書の閲覧程度情報を検索条件別に記憶する機能を有する。検索条件とは、例えば、検索者が検索要求時に入力する検索キーワードである。文書の閲覧程度情報とは、その文書が閲覧された程度を表す情報であり、例えば、その文書の閲覧時間である。ただし、文書の閲覧程度情報は、文書の閲覧時間にのみ限定されず、他の種類の情報、例えば文書が閲覧された回数であってもよい。   The browsing degree information storage unit 110 has a function of storing document browsing degree information according to search conditions. The search condition is, for example, a search keyword that the searcher inputs when making a search request. The document browsing degree information is information indicating the degree to which the document is browsed, and is, for example, the browsing time of the document. However, the document browsing degree information is not limited to the document browsing time, but may be other types of information, for example, the number of times the document is browsed.

検索手段120は、ユーザから指定された検索条件に合致する文書を検索する機能と、検索した文書ごとに、指定された検索条件と同じ検索条件に対応して閲覧程度情報記憶手段110に記憶されている閲覧程度情報を考慮してスコアを算出する機能と、算出したスコアでランキング付けした検索結果を出力する機能とを有する。   The search means 120 is stored in the browsing degree information storage means 110 corresponding to the search condition that is the same as the specified search condition for each searched document and the function for searching for documents that match the search conditions specified by the user. And a function for calculating a score in consideration of the browsing degree information, and a function for outputting a search result ranked by the calculated score.

検索手段120が検索の対象とする文書或いはそのインデックスは、検索装置100内の記憶装置あるいは検索装置100からアクセス可能な外部の記憶装置に記憶されている。検索装置100が企業内検索(Enterprise Search)を行う装置である場合、検索の対象となる文書は、データベース内のデータ、ファイルサーバ内のデータや、業務アプリケーションなど、様々な形態の構造データ、非構造データが含まれる。また検索装置100がインターネット検索を行う装置である場合、検索の対象となるコンテンツは、ウェブサイトのページなどが含まれる。   The document to be searched by the search unit 120 or its index is stored in a storage device in the search device 100 or an external storage device accessible from the search device 100. When the search device 100 is a device that performs an enterprise search (Enterprise Search), documents to be searched for include various types of structural data such as data in a database, data in a file server, and business applications. Contains structural data. When the search device 100 is a device that performs an Internet search, the content to be searched includes website pages and the like.

検索手段120は、検索したコンテンツのスコアを算出する際、検索した文書ごとに、上記指定された検索条件と同じ検索条件に対応して閲覧程度情報記憶手段110に記憶されている閲覧程度情報を考慮した補正スコアを算出し、この算出した補正スコアを考慮して上記スコアを算出してよい。   When the search means 120 calculates the score of the searched content, the search degree information stored in the read degree information storage means 110 corresponding to the same search condition as the specified search condition is obtained for each searched document. A correction score that is taken into account may be calculated, and the score may be calculated in consideration of the calculated correction score.

また検索手段120は、検索したコンテンツのスコアを算出する際、検索した文書ごとに、仮スコアと、上記指定された検索条件と同じ検索条件に対応して閲覧程度情報記憶手段110に記憶されている閲覧程度情報を考慮した補正スコアとを算出し、この算出した仮スコアと補正スコアとから上記スコアを算出してよい。その際、算出した仮スコアから補正スコアを減算することにより上記スコアを算出してよい。仮スコアは、任意のスコアリングアルゴリズムで算出することができる。   Further, when calculating the score of the searched content, the search unit 120 stores, for each searched document, the temporary score and the browsing degree information storage unit 110 corresponding to the same search condition as the specified search condition. It is also possible to calculate a correction score in consideration of the browsing degree information being stored, and calculate the score from the calculated temporary score and correction score. At that time, the score may be calculated by subtracting the correction score from the calculated provisional score. The provisional score can be calculated by an arbitrary scoring algorithm.

閲覧履歴記憶手段130は、文書の閲覧履歴を記憶する機能を有する。文書の閲覧履歴は、例えば、閲覧された文書を一意に識別するための識別子と、その文書が検索された際の検索条件とを少なくとも含む。また、閲覧程度情報として、閲覧時間を用いる場合、閲覧履歴は、閲覧時間を算出する基礎となる閲覧時刻を含む。   The browsing history storage unit 130 has a function of storing a browsing history of a document. The document browsing history includes, for example, at least an identifier for uniquely identifying the browsed document and a search condition when the document is searched. Moreover, when browsing time is used as browsing degree information, browsing history contains the browsing time used as the foundation which calculates browsing time.

閲覧程度情報算出手段140は、閲覧履歴記憶手段130に記憶された文書の閲覧履歴からその文書の閲覧程度情報を算出して、閲覧程度情報記憶手段110に記憶する機能を有している。閲覧程度情報算出手段140は、新たな閲覧履歴が閲覧履歴記憶手段130に記憶される都度、閲覧程度情報を算出してもよいし、一定時間毎にその期間内に新たに蓄積された閲覧履歴から閲覧程度情報を算出するようにしてもよい。   The browsing degree information calculating unit 140 has a function of calculating the browsing degree information of the document from the browsing history of the document stored in the browsing history storage unit 130 and storing it in the browsing degree information storage unit 110. The browsing degree information calculating unit 140 may calculate the browsing degree information each time a new browsing history is stored in the browsing history storage unit 130, or the browsing history newly accumulated within a certain period of time. You may make it calculate browsing degree information from.

次に本実施形態の動作を説明する。   Next, the operation of this embodiment will be described.

ユーザから図示しないクライアント端末などの端末を通じて、検索キーワードなどの検索条件を指定した検索要求が入力されると、検索装置100の検索手段120は、検索条件に合致する文書を検索する。   When a search request specifying a search condition such as a search keyword is input from a user terminal such as a client terminal (not shown), the search unit 120 of the search device 100 searches for a document that matches the search condition.

次に検索手段120は、検索した文書ごとに、今回の検索要求で指定された検索条件と同じ検索条件に対応して閲覧程度情報記憶手段110に記憶されている閲覧程度情報を考慮してスコアを算出する。   Next, the search unit 120 scores for each searched document in consideration of the browsing degree information stored in the browsing degree information storage unit 110 corresponding to the same search condition specified in the current search request. Is calculated.

次に検索手段120は、上記算出したスコアで検索結果をソートし、検索要求を行ったユーザの端末へ送信する。これにより、検索要求を行ったユーザの端末の画面に、ランキング付けされた検索結果が表示される。   Next, the search means 120 sorts the search results by the calculated score, and transmits it to the terminal of the user who made the search request. Thereby, the ranked search result is displayed on the screen of the terminal of the user who has made the search request.

その後にユーザが、検索結果中の何れかの文書を閲覧すると、その閲覧された文書の識別子と上記検索条件とを含む閲覧履歴が閲覧履歴記憶手段130に記録される。そして、閲覧程度情報算出手段140は、閲覧履歴記憶手段130に記録された閲覧履歴に基づいて、閲覧程度情報を算出し、閲覧程度情報記憶手段110に記憶する。これにより、新たな閲覧が行われるのに従って、閲覧程度情報記憶手段110中の閲覧程度情報が更新されていく。   Thereafter, when the user browses any document in the search result, a browsing history including the identifier of the browsed document and the search condition is recorded in the browsing history storage unit 130. The browsing degree information calculating unit 140 calculates browsing degree information based on the browsing history recorded in the browsing history storage unit 130 and stores the browsing degree information in the browsing degree information storage unit 110. Thereby, the browsing degree information in the browsing degree information storage means 110 is updated as new browsing is performed.

次に、本実施形態の効果を説明する。   Next, the effect of this embodiment will be described.

一般に検索条件は、検索者の検索意図を表現している。このため、文書の閲覧程度情報を検索条件別に記録することで、検索意図別に閲覧程度情報を管理することができる。そして、指定された検索条件と同じ検索条件に対応して閲覧程度情報記憶手段110に記憶されている閲覧程度情報を考慮してスコアを算出し、この算出したスコアでランキング付けすることにより、検索者の検索意図と閲覧行動とに基づいて、検索結果をランキング付けすることが可能になる。   In general, the search condition expresses the search intention of the searcher. For this reason, the browsing degree information can be managed for each search intention by recording the browsing degree information of the document for each search condition. Then, the score is calculated in consideration of the browsing degree information stored in the browsing degree information storage unit 110 corresponding to the same search condition as the designated search condition, and the ranking is performed by the calculated score, thereby performing the search. The search results can be ranked based on the search intention and browsing behavior of the person.

[第2の実施形態]
次に、本発明の第2の実施形態について図面を参照して詳細に説明する。
[Second Embodiment]
Next, a second embodiment of the present invention will be described in detail with reference to the drawings.

[構成]
図2を参照すると、本発明の第2の実施形態は、端末装置1と、検索システム2とから構成されている。また、検索システム2は、検索サーバ21と、スコアリングサーバ22と、ウェブサーバ23と、ログサーバ24とを備えている。図1との関係では、検索サーバ21、ウェブサーバ23、およびスコアリングサーバ22のスコア計算機能部分が検索手段120に相当し、ログサーバ24が閲覧履歴記憶手段130に相当し、閲覧時間ログ生成プログラム222が閲覧程度情報算出手段140に相当し、閲覧時間ログ221が閲覧程度情報記憶手段110に相当する。
[Constitution]
Referring to FIG. 2, the second embodiment of the present invention includes a terminal device 1 and a search system 2. The search system 2 includes a search server 21, a scoring server 22, a web server 23, and a log server 24. In the relationship with FIG. 1, the score calculation function part of the search server 21, the web server 23, and the scoring server 22 corresponds to the search unit 120, the log server 24 corresponds to the browsing history storage unit 130, and browsing time log generation The program 222 corresponds to the browsing degree information calculation unit 140, and the browsing time log 221 corresponds to the browsing degree information storage unit 110.

端末装置1は、パーソナルコンピュータ等のコンピュータで構成され、ウェブブラウザ11を備えている。ウェブブラウザ11は、HTTPプロトコルを介して、検索サーバ21への検索式の送信およびウェブサーバ23からの検索結果画面231の受信を行う。   The terminal device 1 is configured by a computer such as a personal computer and includes a web browser 11. The web browser 11 transmits a search expression to the search server 21 and receives a search result screen 231 from the web server 23 via the HTTP protocol.

検索サーバ21は、ウェブブラウザ11が送信した検索式を受信し、検索式に合致する文書を検索インデックス211から探索し、スコアリングサーバ22から検索結果として得た文書毎のスコアを取得後、検索結果をウェブサーバ23に送信する。   The search server 21 receives the search formula transmitted by the web browser 11, searches the search index 211 for a document that matches the search formula, acquires the score for each document obtained as a search result from the scoring server 22, and then searches The result is transmitted to the web server 23.

スコアリングサーバ22は、検索サーバ21が送信した文書情報を受信し、閲覧時間ログ221をもとに文書のスコアを計算し、検索サーバ21に送信する。また、閲覧時間ログ生成プログラム222を使用して、ログサーバ24が収集した閲覧行動ログ241から閲覧時間ログ221を生成する。   The scoring server 22 receives the document information transmitted from the search server 21, calculates the document score based on the browsing time log 221, and transmits the document score to the search server 21. In addition, the browsing time log 221 is generated from the browsing action log 241 collected by the log server 24 using the browsing time log generation program 222.

ウェブサーバ23は、検索サーバ21から検索結果を受信し、検索結果から検索結果画面231(ウェブ文書)を生成し、ウェブブラウザ11に送信する。   The web server 23 receives the search result from the search server 21, generates a search result screen 231 (web document) from the search result, and transmits it to the web browser 11.

ログサーバ24は、ウェブブラウザ11が送信するリンク232のクリック情報を受信し、閲覧行動ログ241に格納する。   The log server 24 receives the click information of the link 232 transmitted by the web browser 11 and stores it in the browsing action log 241.

[動作]
次に、図2から図7を参照して本実施形態の動作について詳細に説明する。
[Operation]
Next, the operation of this embodiment will be described in detail with reference to FIGS.

本実施形態の動作は、大きく分けて、検索者の閲覧行動を収集し閲覧行動ログ241を作成するフェーズと、作成した閲覧行動ログ241から閲覧時間ログ221を作成するフェーズと、作成した閲覧時間ログ221をもとに検索結果画面231に表示する検索結果をランキング付けするフェーズとからなる。   The operation of the present embodiment is broadly divided into a phase in which browsing behaviors of searchers are collected and a browsing behavior log 241 is created, a phase in which a browsing time log 221 is created from the created browsing behavior log 241, and created browsing time. This phase includes a phase for ranking search results displayed on the search result screen 231 based on the log 221.

はじめに、検索者の閲覧行動を収集し閲覧行動ログ241を作成するフェーズについて説明する。   First, the phase in which the browsing behavior of the searcher is collected and the browsing behavior log 241 is created will be described.

検索者が、ウェブサーバ23から受信した検索結果231に含まれる検索対象文書へのリンク232をクリックすると、周知の技術により、リンク先の文書がウェブブラウザ11に表示される。これにより、検索者は検索対象文書の内容を閲覧することができる。本実施形態の場合、ウェブブラウザ11は、上記クリック時にクリック情報をログサーバ24へ送信する。クリック情報には、クリックされたURL、クリックされた時刻、検索者がその検索結果を得るのに使用した検索式、およびウェブサーバ23がウェブブラウザ11に発行したセッションID(ウェブサーバがウェブブラウザを識別するために、各ウェブブラウザに発行する一意なハッシュ値)が含まれる。検索者がクリックしたウェブ文書のURL等の所定の情報を含むクリック情報を収集する方法は、ウェブ文書にあらかじめJavascriptを埋め込むことで実現することができる。   When the searcher clicks the link 232 to the search target document included in the search result 231 received from the web server 23, the linked document is displayed on the web browser 11 by a known technique. Thereby, the searcher can browse the contents of the search target document. In the case of this embodiment, the web browser 11 transmits click information to the log server 24 at the time of the click. The click information includes the clicked URL, the click time, the search formula used by the searcher to obtain the search result, and the session ID issued by the web server 23 to the web browser 11 (the web server identifies the web browser). In order to identify, a unique hash value issued to each web browser) is included. A method of collecting click information including predetermined information such as a URL of a web document clicked by a searcher can be realized by embedding Javascript in the web document in advance.

ログサーバ24は、ウェブブラウザ11から受信した検索者のクリック情報を受信し、閲覧行動ログ241に記録する。閲覧行動ログの記録例を図3に示す。図3の1行が一つの閲覧行動ログのレコードに相当する。閲覧行動ログ中の文書URL、検索式およびセッションIDは、ウェブブラウザ11から受信したクリック情報から取得する。また、閲覧行動ログ中のログ記録時刻は、クリック情報中のクリックされた時刻から取得しても良いし、ウェブブラウザ11から検索者のクリック情報を受信した時刻を記録するようにしても良い。   The log server 24 receives the searcher's click information received from the web browser 11 and records it in the browsing action log 241. A recording example of the browsing action log is shown in FIG. One row in FIG. 3 corresponds to one browsing action log record. The document URL, search expression, and session ID in the browsing action log are acquired from the click information received from the web browser 11. Further, the log recording time in the browsing action log may be acquired from the clicked time in the click information, or the time when the searcher's click information is received from the web browser 11 may be recorded.

次に、作成した閲覧行動ログ241から閲覧時間ログ221を作成するフェーズについて説明する。   Next, a phase in which the browsing time log 221 is created from the created browsing behavior log 241 will be described.

閲覧時間ログ221は、図4に示すように、検索式および文書URLの対に対する総閲覧時間を保持するデータ構造であり、閲覧時間ログ生成プログラム222を使用して閲覧行動ログ241から作成する。   As shown in FIG. 4, the browsing time log 221 has a data structure that holds the total browsing time for a pair of search expression and document URL, and is created from the browsing behavior log 241 using the browsing time log generation program 222.

閲覧時間ログ生成プログラム222の動作仕様を図5に示す。閲覧時間ログ生成プログラム222は、閲覧行動ログ241の1行目から処理を開始し、各行毎にレコード(セッションID、ログ記録時刻、検索式、文書URL)を取得して処理を行い、最終行で処理を終了する(図5のステップA1、A2、A10、A11)。   The operation specification of the browsing time log generation program 222 is shown in FIG. The browsing time log generation program 222 starts processing from the first line of the browsing action log 241, acquires a record (session ID, log recording time, search expression, document URL) for each line, performs processing, and performs the final line. Then, the process ends (steps A1, A2, A10, A11 in FIG. 5).

各行毎の処理では、はじめに、閲覧行動ログ241から取得したレコード(以下、レコードX)の位置を開始位置として、レコードのセッションIDおよび検索式が合致する直近のレコード(以下、レコードY)を探索する(ステップA3)。レコードYが存在する場合、レコードXとレコードYのログ記録時刻の差(以下、時間T)を計算する(ステップA5)。時間Tは、レコードXの文書URLの閲覧時間の近似値として使用する。レコードYが存在しない場合、時間Tにはゼロを設定する(ステップA6)。レコードYが存在しない原因としては、検索者が最後にクリックした検索結果画面231のリンク232がレコードXの場合、または検索者のクリック情報が何らかの理由によりログサーバ24に送信されなかった場合などが考えられる。   In the process for each row, first, the position of the record (hereinafter referred to as record X) acquired from the browsing action log 241 is used as the start position, and the nearest record (hereinafter referred to as record Y) that matches the session ID and search formula of the record is searched (Step A3). When the record Y exists, the difference between the log recording times of the record X and the record Y (hereinafter, time T) is calculated (step A5). The time T is used as an approximate value of the browsing time of the document URL of the record X. If record Y does not exist, time T is set to zero (step A6). The reason why the record Y does not exist is when the link 232 of the search result screen 231 that the searcher last clicked is the record X, or when the click information of the searcher is not transmitted to the log server 24 for some reason. Conceivable.

次に、閲覧時間ログ221から、レコードXの検索式および文書URLに合致するレコード(以下、レコードZ)を探索する(ステップA7)。レコードZが存在する場合、レコードZの総閲覧時間に時刻Tを加算する(ステップA8)。レコードZが存在しない場合、閲覧時間ログ221にレコードZを追加し、総閲覧時間に時間Tを設定する。   Next, the record (hereinafter referred to as record Z) that matches the search formula of record X and the document URL is searched from the browsing time log 221 (step A7). When the record Z exists, the time T is added to the total browsing time of the record Z (step A8). When the record Z does not exist, the record Z is added to the browsing time log 221 and the time T is set as the total browsing time.

以上の処理の結果、閲覧時間ログ221には、検索式および文書URLの対に対する総閲覧時間が算出される。   As a result of the above processing, the total browsing time for the search expression and document URL pair is calculated in the browsing time log 221.

最後に、作成した閲覧時間ログ221をもとに検索結果画面231に表示する検索結果をランキング付けするフェーズについて説明する。   Finally, a phase for ranking the search results displayed on the search result screen 231 based on the created browsing time log 221 will be described.

ウェブブラウザ11は、検索式を検索サーバ21に送信する。検索サーバ21は、検索式を受信し、検索式に合致する文書情報の一覧を検索インデックス211から取得する。次に、検索サーバ21は、取得した文書情報毎に、検索式および文書URLをスコアリングサーバ22に送信する。   The web browser 11 transmits the search formula to the search server 21. The search server 21 receives the search formula and acquires a list of document information that matches the search formula from the search index 211. Next, the search server 21 transmits a search expression and a document URL to the scoring server 22 for each acquired document information.

スコアリングサーバ22は、検索式および文書URLを受信し、文書URLのスコアを計算し(計算方法の詳細は後述する)、検索サーバ21に送信する。検索サーバ21は、文書情報の一覧および文書情報毎のスコアをウェブサーバ23に送信する。ウェブサーバ23は、検索結果の文書情報一覧をスコアの降順にソートし、検索結果画面231を生成し、ウェブブラウザ11に送信する。   The scoring server 22 receives the search formula and the document URL, calculates the score of the document URL (details of the calculation method will be described later), and transmits it to the search server 21. The search server 21 transmits a list of document information and a score for each document information to the web server 23. The web server 23 sorts the document information list of the search results in descending order of the scores, generates a search result screen 231, and transmits it to the web browser 11.

スコアリングサーバ22が、検索式および文書URLをもとに、文書情報のスコアを計算する際の動作仕様を図6に示す。スコアリングサーバ22は、閲覧時間ログ221から、検索サーバ21から受信した検索式および文書URLに合致するレコード(以下、レコードV)を探索する(図6のステップB1)。   FIG. 6 shows the operation specifications when the scoring server 22 calculates the score of the document information based on the search formula and the document URL. The scoring server 22 searches the browsing time log 221 for a record (hereinafter, record V) that matches the search formula and document URL received from the search server 21 (step B1 in FIG. 6).

レコードVが存在する場合、レコードVの総閲覧時間を使用して、図7の式E1を計算する(ステップB2、B3、B5)。レコードVが存在しない場合、総閲覧時間を0として、図7の式E1を計算する(ステップB2、B4、B5)。   When the record V exists, the total browsing time of the record V is used to calculate the equation E1 in FIG. 7 (steps B2, B3, B5). When the record V does not exist, the total browsing time is set to 0 and the formula E1 in FIG. 7 is calculated (steps B2, B4, and B5).

式E1は、検索式qに対する文書URLLのスコアscore(q,L)を、検索式qに対する文書URLLの仮スコアf(q,L)から、補正スコアu(q,L)を減算して計算することを示している。仮スコアf(q,L)は、汎用的なスコアリングエンジンなどを利用して算出することができる。また、全文書に対して同じスコアを仮スコアとして付与しておいてもよい。   The expression E1 is calculated by subtracting the score score (q, L) of the document URLL for the search expression q from the provisional score f (q, L) of the document URLL for the search expression q. It shows that The provisional score f (q, L) can be calculated using a general-purpose scoring engine or the like. Further, the same score may be assigned as a temporary score to all documents.

補正スコアu(q,L)は、図7の式E2により、検索式qに対する文書URLLの総閲覧時間TqLと、重み値α、βとを用いて計算される。補正スコアu(q,L)は、総閲覧時間TqLが大きくなるほど小さくなる傾向を示す。 The correction score u (q, L) is calculated by using the total browsing time T qL of the document URL L for the search formula q and the weight values α and β by the formula E2 in FIG. The corrected score u (q, L) tends to decrease as the total browsing time T qL increases.

スコアリングサーバ22は、式E1を計算して得た値を、文書のスコアとして検索サーバ21に返却する。   The scoring server 22 returns the value obtained by calculating the expression E1 to the search server 21 as the score of the document.

このように本実施形態では、検索者による総閲覧時間の短い文書ほど有用でない文書である確率が高いという仮定に基づき、検索者による総閲覧時間の短さに応じて、検索システムが返却する検索結果のランキングを下降させることで、検索者による総閲覧時間の長い文書ほど検索結果の上位に表示されるようにする。これにより、検索者の閲覧行動を反映した検索結果のランキング付けを実現することができる。   As described above, in the present embodiment, based on the assumption that a document having a shorter total browsing time by a searcher has a higher probability of being a less useful document, a search returned by the search system according to the short total browsing time by the searcher. By lowering the ranking of results, a document with a longer total browsing time by a searcher is displayed at the top of the search results. Thereby, ranking of the search result reflecting the searcher's browsing behavior can be realized.

以上本発明の実施形態について説明したが、本発明は以上の実施形態にのみ限定されず、その他各種の付加変更が可能である。また、本発明の検索装置は、その有する機能をハードウェア的に実現することは勿論、コンピュータとプログラムとで実現することができる。プログラムは、磁気ディスクや半導体メモリ等のコンピュータ可読記録媒体に記録されて提供され、コンピュータの立ち上げ時などにコンピュータに読み取られ、そのコンピュータの動作を制御することにより、そのコンピュータを前述した各実施形態における検索装置、検索システムとして機能させる。   Although the embodiment of the present invention has been described above, the present invention is not limited to the above embodiment, and various other additions and modifications can be made. In addition, the search device of the present invention can be realized by a computer and a program as well as the functions of the search device according to hardware. The program is provided by being recorded on a computer-readable recording medium such as a magnetic disk or a semiconductor memory, and is read by the computer when the computer is started up, etc. Function as a search device and a search system.

本発明によれば、さまざまな検索対象(ファイルサーバ、ウェブサーバ、データベース、Lotus Notes、業務アプリケーションなど)に格納された文書を横断的に検索する必要のある、企業内検索システムにおける検索結果のランキング方法という用途などに適用できる。   According to the present invention, the ranking of search results in an in-house search system that needs to search across documents stored in various search targets (file server, web server, database, Lotus Notes, business application, etc.). It can be applied to a method.

1 端末装置
2 検索システム
11 ウェブブラウザ
21 検索サーバ
22 スコアリングサーバ
23 ウェブサーバ
24 ログサーバ
100 検索装置
110 閲覧程度情報記憶手段
120 検索手段
130 閲覧履歴記憶手段
140 閲覧程度情報算出手段
DESCRIPTION OF SYMBOLS 1 Terminal device 2 Search system 11 Web browser 21 Search server 22 Scoring server 23 Web server 24 Log server 100 Search device 110 Browse degree information storage means 120 Search means 130 Browse history storage means 140 Browse degree information calculation means

Claims (8)

文書の閲覧総時間を含む閲覧程度情報を検索条件別に記憶する閲覧程度情報記憶手段と、
指定された検索条件に合致する文書を検索し、該検索した文書ごとに、前記指定された検索条件と同じ検索条件に対応して前記閲覧程度情報記憶手段に記憶されている閲覧程度情報を考慮してスコアを算出し、該算出したスコアでランキング付けした検索結果を出力する検索手段と
を備えることを特徴とする検索装置。
Browsing degree information storage means for storing browsing degree information including the total browsing time of a document according to search conditions;
A document that matches the specified search condition is searched, and for each searched document, the browsing degree information stored in the browsing degree information storage unit corresponding to the same search condition as the specified search condition is considered. And a search unit that calculates a score and outputs search results ranked by the calculated score.
前記検索手段は、前記検索した文書ごとに、前記指定された検索条件と同じ検索条件に対応して前記閲覧程度情報記憶手段に記憶されている閲覧程度情報を考慮した補正スコアを算出し、該算出した補正スコアを考慮して前記スコアを算出する
ことを特徴とする請求項1に記載の検索装置。
The search means calculates, for each searched document, a correction score that takes into consideration the browsing degree information stored in the browsing degree information storage means corresponding to the same search condition as the specified search condition, The search device according to claim 1, wherein the score is calculated in consideration of the calculated correction score.
前記検索手段は、前記検索した文書ごとに、仮スコアと、前記指定された検索条件と同じ検索条件に対応して前記閲覧程度情報記憶手段に記憶されている閲覧程度情報を考慮した補正スコアとを算出し、前記算出した仮スコアと前記補正スコアとから前記スコアを算出する
ことを特徴とする請求項1または2に記載の検索装置。
The search means includes, for each searched document, a provisional score and a correction score that takes into consideration the browsing degree information stored in the browsing degree information storage means corresponding to the same search condition as the specified search condition, The search device according to claim 1, wherein the score is calculated from the calculated temporary score and the corrected score.
前記検索手段は、前記検索した文書ごとに、仮スコアと、前記指定された検索条件と同じ検索条件に対応して前記閲覧程度情報記憶手段に記憶されている閲覧程度情報を考慮した補正スコアとを算出し、前記算出した仮スコアから前記補正スコアを減算することにより前記スコアを算出する
ことを特徴とする請求項1乃至3の何れか1項に記載の検索装置。
The search means includes, for each searched document, a provisional score and a correction score that takes into consideration the browsing degree information stored in the browsing degree information storage means corresponding to the same search condition as the specified search condition, 4. The search device according to claim 1, wherein the score is calculated by subtracting the correction score from the calculated temporary score. 5.
前記文書の閲覧履歴を記憶する閲覧履歴記憶手段と、
前記閲覧履歴記憶手段に記憶された前記文書の閲覧履歴から前記文書の閲覧程度情報を算出して前記閲覧程度情報記憶手段に記憶する閲覧程度情報算出手段と
を備えることを特徴とする請求項1乃至4の何れか1項に記載の検索装置。
Browsing history storage means for storing the browsing history of the document;
2. A browsing degree information calculation unit that calculates browsing degree information of the document from the browsing history of the document stored in the browsing history storage unit and stores the browsing degree information in the browsing degree information storage unit. 5. The search device according to any one of items 4 to 4.
前記閲覧程度情報は、閲覧総回数を含む
ことを特徴とする請求項1乃至の何れか1項に記載の検索装置。
The search device according to any one of claims 1 to 5 , wherein the browsing degree information includes a total number of browsing times.
文書の閲覧総時間を含む閲覧程度情報を検索条件別に記憶する閲覧程度情報記憶手段と、検索手段とを備えた検索装置で実行する検索方法であって、
前記検索手段が、指定された検索条件に合致する文書を検索し、該検索した文書ごとに、前記指定された検索条件と同じ検索条件に対応して前記閲覧程度情報記憶手段に記憶されている閲覧程度情報を考慮してスコアを算出し、該算出したスコアでランキング付けした検索結果を出力する
ことを特徴とする検索方法。
A search method that is executed by a search device including a browsing degree information storage unit that stores browsing degree information including a total browsing time of a document for each search condition, and a searching unit,
The search means searches for a document that matches the specified search condition, and is stored in the browsing degree information storage means for each searched document corresponding to the same search condition as the specified search condition. A search method characterized by calculating a score in consideration of browsing degree information and outputting a search result ranked by the calculated score.
文書の閲覧総時間を含む閲覧程度情報を検索条件別に記憶する閲覧程度情報記憶手段を有するコンピュータを、
指定された検索条件に合致する文書を検索し、該検索した文書ごとに、前記指定された検索条件と同じ検索条件に対応して前記閲覧程度情報記憶手段に記憶されている閲覧程度情報を考慮してスコアを算出し、該算出したスコアでランキング付けした検索結果を出力する検索手段
として機能させるためのプログラム。
A computer having browsing degree information storage means for storing browsing degree information including a total browsing time of a document for each search condition,
A document that matches the specified search condition is searched, and for each searched document, the browsing degree information stored in the browsing degree information storage unit corresponding to the same search condition as the specified search condition is considered. And a program for functioning as search means for calculating a score and outputting a search result ranked by the calculated score.
JP2010037188A 2010-02-23 2010-02-23 Search device Active JP5493983B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010037188A JP5493983B2 (en) 2010-02-23 2010-02-23 Search device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010037188A JP5493983B2 (en) 2010-02-23 2010-02-23 Search device

Publications (2)

Publication Number Publication Date
JP2011175342A JP2011175342A (en) 2011-09-08
JP5493983B2 true JP5493983B2 (en) 2014-05-14

Family

ID=44688152

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010037188A Active JP5493983B2 (en) 2010-02-23 2010-02-23 Search device

Country Status (1)

Country Link
JP (1) JP5493983B2 (en)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005242760A (en) * 2004-02-27 2005-09-08 Toppan Forms Co Ltd Information retrieval support method, and information retrieval support system and server using method
JP2006252179A (en) * 2005-03-10 2006-09-21 Nippon Telegr & Teleph Corp <Ntt> Advertisement presentation in internet advertising service, management method, advertisement management server, program and storage medium for storing the same program
JP2006309509A (en) * 2005-04-28 2006-11-09 Nippon Telegr & Teleph Corp <Ntt> Browsing screen reusing device, browsing screen reusing program, and storage medium
JP2008217240A (en) * 2007-03-01 2008-09-18 Ricoh Co Ltd Document search apparatus, method, and program
JP4868245B2 (en) * 2007-08-17 2012-02-01 ヤフー株式会社 SEARCH SYSTEM, SEARCH DEVICE, AND SEARCH METHOD
JP5136208B2 (en) * 2008-05-23 2013-02-06 ブラザー工業株式会社 Content distributed storage system, content storage method, node device, and node processing program

Also Published As

Publication number Publication date
JP2011175342A (en) 2011-09-08

Similar Documents

Publication Publication Date Title
KR101016683B1 (en) Systems and methods for providing search results
RU2335013C2 (en) Methods and systems for improving search ranging with application of information about article
KR101361182B1 (en) Systems for and methods of finding relevant documents by analyzing tags
KR100923505B1 (en) Ranking system based on user&#39;s attention and the method thereof
US20120095834A1 (en) Systems and methods for using a behavior history of a user to augment content of a webpage
US9201964B2 (en) Identifying related entities
US9594809B2 (en) System and method for compiling search results using information regarding length of time users spend interacting with individual search results
CN103617278A (en) Control method and device for address bar searching
JP2006099341A (en) Update history generation device and program
JP5418295B2 (en) Search device
JP4912384B2 (en) Document search device, document search method, and document search program
US20150269268A1 (en) Search server and search method
JP5493983B2 (en) Search device
JP5488031B2 (en) Search device
JP2010244187A (en) Document retrieval system and method
JP5777663B2 (en) Search support device and search support program
JP5813559B2 (en) Search condition presentation device, method, and program
JP2011022624A (en) System, method, server and program for retrieving web page
JP5519406B2 (en) Server apparatus, genre score calculation method, and program
JP2011100407A (en) Retrieval system, and display method in retrieval system
JP6042162B2 (en) Web search device, web search method and program
JP2012128802A (en) Retrieval algorithm evaluation system
TWI620080B (en) User behavior based document classification system and method
JP2011198319A (en) Retrieval apparatus
JP5286162B2 (en) Information search server, information search method, and information search program

Legal Events

Date Code Title Description
RD07 Notification of extinguishment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7427

Effective date: 20120717

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130111

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131011

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131015

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131127

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140204

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140217

R150 Certificate of patent or registration of utility model

Ref document number: 5493983

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150