JP4453437B2 - 検索キーワード順位付け方法及び装置及びプログラム - Google Patents

検索キーワード順位付け方法及び装置及びプログラム Download PDF

Info

Publication number
JP4453437B2
JP4453437B2 JP2004141532A JP2004141532A JP4453437B2 JP 4453437 B2 JP4453437 B2 JP 4453437B2 JP 2004141532 A JP2004141532 A JP 2004141532A JP 2004141532 A JP2004141532 A JP 2004141532A JP 4453437 B2 JP4453437 B2 JP 4453437B2
Authority
JP
Japan
Prior art keywords
search
category
document
search keyword
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2004141532A
Other languages
English (en)
Other versions
JP2005322165A (ja
Inventor
晴美 川島
二大 大橋
吉秀 佐藤
雅且 大久保
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2004141532A priority Critical patent/JP4453437B2/ja
Publication of JP2005322165A publication Critical patent/JP2005322165A/ja
Application granted granted Critical
Publication of JP4453437B2 publication Critical patent/JP4453437B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、検索キーワード順位付け方法及び装置及びプログラムに係り、特に、インターネット等のネットワークに接続された1つ以上の検索エンジンから、利用者が検索要求した検索キーワードと検索結果から参照要求した文書の識別情報とを含むログ情報を収集し、一定期間毎に検索キーワードを順位付けて表示する検索キーワード提示方法及び装置及びプログラムに関する。詳しくは、入力された検索キーワードをカテゴリ分類して表示し、表示した検索キーワードから検索キーワードに付随するカテゴリ及び時間情報で限定された情報を検索することのできる検索キーワード順位付け方法及び装置及びプログラムに関する。
インターネットなどのネットワーク上で公開されている情報を検索する手段として、従来からキーワード検索が利用されている。入力される検索キーワードは、利用者が検索した時刻において関心を持っているキーワードであり、検索頻度の高いキーワードや、検索頻度が急に増えている注目キーワードをランキング表示することで、世の中の話題や関心を提供しようとする技術がある。
検索キーワードを収集する期間としては、1週間単位(例えば、非特許文献1参照)、1時間単位(例えば、非特許文献2参照)などがある。1週間単位での検索キーワードランキングサービスは、収集するだけでなく、収集した検索キーワードを既存のカテゴリに分類し、ランキング表示している。検索キーワードをカテゴリ分類して表示することは、検索キーワードを見る利用者にとって、興味のあるカテゴリの検索キーワードが容易に見つけられる利点があるが、検索キーワードを人手でカテゴリ分類しているため、時間がかかる。
また、これらの技術において表示された検索キーワードをクリックすると、クリックされた検索キーワードで検索を実行した結果が表示されるだけである。検索結果を適合度の高い順に表示する場合、検索キーワードを収集した期間に関心が高かった情報以外の情報が、高い適合度を持つ場合があり、関心の高かった情報を特定するのが困難である。また、検索結果を更新時刻の新しい順に表示する場合、検索キーワードを収集した期間より新しい期間の情報が先に表示されてしまい、過去に遡って関心の高かった情報を探し出さなければならない。
また、クリックした検索キーワードの検索結果は、複数のカテゴリに属する情報を含んでおり、カテゴリ分類して表示された検索キーワードをクリックした場合でも、検索キーワードが属するカテゴリ以外の情報が含まれてしまう。
例えば、カテゴリ「スポーツ」に検索キーワード「ダイエー」が表示されている場合を例にとる。この場合「ダイエー」をクリックした人は、野球のダイエーに関係した情報を期待している。しかし、これらの従来技術では、「ダイエー」をクリックして表示される検索結果には、ダイエーの店舗情報などが含まれてしまう。
http://www.infoseek.co.jp/Keyword?pg=ranking.html http://www.nifty.com/search/shun/
上記のように、従来の技術では、収集した検索キーワードをランキング表示する場合に、短期間で自動的に検索キーワードをカテゴリ分類することができないという問題がある。また、表示された検索キーワードから、検索キーワードが収集された期間において、関心の高かった情報を的確に表示することができないという問題がある。
本発明は、上記の点に鑑みなされたもので、短時間で自動的に検索キーワードをカテゴリ分類でき、検索キーワードに付随するカテゴリ及び時間情報に限定した精度の高い情報を提供することが可能な検索キーワード順位付け方法及び装置及びプログラムを提供することを目的とする。
本発明は、利用者が検索要求した検索キーワードと検索結果から参照要求した文書の識別情報とを含むログ情報を収集し、一定期間毎に検索キーワードを順位付けてカテゴリ別に表示するための検索キーワード順序付け方法であって、
カテゴリ適合度算出部が、
利用者が検索要求した検索キーワードと検索時刻と該利用者を特定する利用者識別情報を蓄積する検索ログ蓄積手段から、指定された期間における検索ログ情報を読み出すステップと、
カテゴリ適合度算出部が、
読み出した各検索ログ情報に対して、利用者が検索結果から参照要求した文書の文書識別情報と、参照時刻、利用者識別情報、及び検索結果を表示する元となった検索キーワードを含む参照ログ情報とを蓄積する参照ログ蓄積手段から、検索キーワード及び利用者識別情報が一致する参照ログ情報を取得するステップと、
カテゴリ適合度算出部が、
取得した各参照ログ情報に含まれる文書識別情報に基づいて、文書識別情報とカテゴリ及び文書の時間情報とが対応付けられて蓄積された文書情報蓄積手段を検索して文書のカテゴリを取得し、検索キーワードの利用者別カテゴリ適合度を算出するステップと、
ランキング部が、
算出した検索キーワードの利用者別カテゴリ適合度から、該検索キーワードのカテゴリごとに使用人数を求める、または、カテゴリ別に各検索キーワードのカテゴリ適合度を加算し、各検索キーワードのカテゴリ別の利用度を算出するステップと、
ランキング部が、
算出された各検索キーワードのカテゴリ別の利用度を用いて、カテゴリ毎に検索キーワードの順位付けを行うステップと、からなる。
また、上記の検索キーワード順位付け方法において、表示制御部が、順位付けされた検索キーワードをカテゴリ別に表示手段に表示するステップと、
文書情報検索部が、表示手段に表示された検索キーワードから1つの検索キーワードが選択されると、選択された検索キーワードの期間及びカテゴリから、該検索キーワードを含む文書でカテゴリが一致し、かつ、文書の時間情報が期間以前である文書を文書情報蓄積手段から検索し、検索結果を表示手段に表示するステップと、を更に行う。
本発明は、利用者が検索要求した検索キーワードと検索結果から参照要求した文書の識別情報とを含むログ情報を収集し、一定期間毎に検索キーワードを順位付けてカテゴリ別に表示するための検索キーワード順位付け装置であって、
利用者が検索要求した検索キーワードと検索時刻と該利用者を特定する利用者識別情報を含む検索ログ情報を蓄積する検索ログ蓄積手段と、
文書識別情報とカテゴリ及び文書の時間情報とが対応付けられて蓄積された文書情報蓄積手段と、
利用者が検索結果から参照要求した文書の文書識別情報と、参照時刻、利用者識別情報、及び検索結果を表示する元となった検索キーワードを含む参照ログ情報とを蓄積する参照ログ蓄積手段と、
検索ログ蓄積手段から、指定された期間における検索ログ情報を読み出す検索ログ読み出し手段と、
読み出した各検索ログ情報に対して、参照ログ蓄積手段から、検索キーワード及び利用者識別情報が一致する参照ログ情報を取得する参照ログ取得手段と、
取得した各参照ログ情報に含まれる文書識別情報に基づいて、文書情報蓄積手段を検索して文書のカテゴリを取得し、検索キーワードの利用者別カテゴリ適合度を算出するカテゴリ適合度算出手段と、
算出した検索キーワードの利用者別カテゴリ適合度から、該検索キーワードのカテゴリ毎に使用人数を求める、または、カテゴリ別に各検索キーワードのカテゴリ適合度を加算し、各検索キーワードのカテゴリ別の利用度を算出し、検索キーワード蓄積手段15に蓄積する利用度算出手段と、
算出した各検索キーワードのカテゴリ別の利用度を用いて、カテゴリ毎に検索キーワードの順位付けを行うランキング手段と、を有する。
上記の検索キーワード順位付け装置は、予め文書識別情報と文書の時間情報とを対応付けて文書情報蓄積手段に蓄積しておき、利用者が参照要求した文書をカテゴリ分類し、分類結果のカテゴリを文書情報蓄積手段に追加する手段を有する。

上記の検索キーワード順位付け装置は、ランキング手段で順位付けされた検索キーワードをカテゴリ別に表示手段に表示する表示制御手段と、
表示手段に表示された検索キーワードから1つの検索キーワードが選択されると、選択された検索キーワードの期間及びカテゴリから、該検索キーワードを含む文書でカテゴリが一致し、かつ、文書の時間情報が期間以前である文書を文書情報蓄積手段から検索し、検索結果を表示手段に表示する手段と、を更に有する。
本発明は、利用者が検索要求した検索キーワードと検索結果から参照要求した文書の識別情報とを含むログ情報を収集し、一定期間毎に検索キーワードを順位付けてカテゴリ別に表示するための検索キーワード順位付けプログラムであって、
請求項3または4記載の検索キーワード順位付け装置を構成する各手段としてコンピュータを機能させるための検索キーワード順位付けプログラムである。
上述のように、本発明では、利用者が検索要求した検索キーワードと検索結果から参照要求した文書の識別情報とを含むログ情報を収集し、一定期間毎に検索キーワードを順位付けて表示する際に、検索結果から参照された文書のカテゴリを利用することで、短期間で自動的に検索キーワードをカテゴリ分類することができる。
また、予め全ての文書をカテゴリ分類するのではなく、利用者が参照要求した文書の未をカテゴリ分類することにより、処理の効率化を図ることができる。
また、表示された検索キーワードからユーザが興味のある検索キーワードを選択すると、検索キーワードに付随するカテゴリ及び時間情報に限定した精度の高い情報を提供することができる。
以下、図面を用いて本発明の実施の形態について説明する。
[第1の実施の形態]
は、本発明の第1の実施の形態における検索キーワード提示システムの構成を示す。
同図に示す検索キーワード提示システムは、カテゴリ適合度算出部11、文書情報蓄積部12、ランキング部13、文書情報検索部14を有する検索キーワード提示装置10と、当該検索キーワード提示装置10に接続されるログ情報蓄積部20、入出力制御部30、出力装置40、及び入力装置50から構成される。
ログ情報蓄積部20は、検索エンジンを利用する利用者が検索要求した検索キーワードと検索結果から参照要求した文書の識別情報を含むログ情報を蓄積する。ここで、検索要求とは、検索キーワードを入力し、検索を実行するためのボタンをクリックすることを指し、ボタンをクリックすることにより検索エンジンに検索を要求するメッセージが送信される。また、参照要求とは、利用者が検索結果のリストから、文書へのハイパーリンクをクリックして文書を参照することを指し、ハイパーリンクをクリックすることにより検索エンジンに文書の参照を要求するメッセージが送信される。検索エンジンでは、検索要求及び参照要求のメッセージを受信し、ログ情報として記録している。ログ情報の例を図に示す。ログ情報蓄積部20には、ユーザID201,検索/参照時刻202、検索キーワード203、参照文書ID204が蓄積される。ユーザID201は、ユーザを識別する情報であり、参照文書ID204は、参照された文書を識別する情報である。参照文書ID204が空欄のログ情報は、検索エンジンが検索要求のメッセージを受信した際に記録したログ情報であり、参照文書ID204が記載されているログ情報は、参照要求のメッセージを受信した際に記録したログ情報である。
文書情報蓄積部12は、予めカテゴリ分類された文書を時間情報と対応付けて蓄積している。文書情報蓄積部12の例を図に示す。文書情報蓄積部12には、文書ID121,時間情報122、カテゴリ123、文書情報124が蓄積される。文書ID121は、文書を識別する情報、時間情報122は、文書が作成/更新された時刻あるいは文書が収集された時刻であり、カテゴリ123は、文書が分類されたカテゴリであり、カテゴリ一致度と共に蓄積している例である。カテゴリ一致度は、全てのカテゴリに対するカテゴリ一致度を加算すると1になる値であり、閾値以上のカテゴリ一致度を持つカテゴリが存在する場合に、そのカテゴリに文書が分類される。カテゴリ123は、閾値以上のカテゴリ一致度を持つカテゴリとそのカテゴリ一致度が蓄積されている。
カテゴリ適合度算出部11は、検索キーワード毎にカテゴリ適合度を算出する。カテゴリ適合度は、利用者が検索キーワードを入力して検索した結果から、参照した文書のカテゴリを取得することにより、利用者がどのカテゴリに関心があったかを示す値である。
ランキング部13は、検索キーワード毎のカテゴリ適合度と検索キーワードの使用回数から検索キーワードのカテゴリ別の利用度を計算し、順序付けを行う。ここで、検索キーワードのカテゴリ別の利用度とは、検索キーワードのカテゴリ適合度に、当該検索キーワードの使用回数により重み付けした値である。
文書情報検索部14は、条件を指定して文書情報蓄積部12の検索を行い、検索結果を返送する。
次に、上記のシステムにおける検索キーワード表示処理の流れを説明する。
は、本発明の第1の実施の形態における検索キーワード表示処理のフローチャートである。
カテゴリ適合度算出部11は、ユーザから指定された期間に基づいて、ログ情報蓄積部20からログ情報を読み出す(ステップ101)。読み出したログ情報から順に1つのログ情報を取り出し(ステップ103)、参照文書IDが存在するかどうかを調べ、存在する場合には(ステップ104、Yes)、参照文書IDが一致する文書を文書情報蓄積部12から検索し、検索された文書のカテゴリを取得する(ステップ105)。検索キーワード毎に使用回数を加算していく(ステップ106)。読み出した全てのログ情報を処理し終えたら(ステップ102、Yes)、検索キーワード毎にカテゴリ適合度を算出する(ステップ107)。
カテゴリ適合度は、検索キーワードkを入力して検索した結果から参照した文書のカテゴリを用いて求めることができる。
検索キーワードkの検索結果から参照した文書をDk,j(j=1〜J),カテゴリをC(n=1〜N)、文書Dk,jが属するカテゴリを示すカテゴリベクトル(*はベクトル)を、
k,j=(Yj,1,…,Yj,N
で表すこととする。Yj,iは、文書Dk,jがカテゴリCに属する時1の値、属さないとき0の値をとる。また、各文書は少なくとも1つのカテゴリに属する。
このカテゴリベクトルを用いて検索キーワードkのカテゴリ適合度ベクトルCFを次式で求めることができる。なお、以下で用いられる「*」は、ベクトルを示すものとする。
Figure 0004453437
このCFk,iが、検索キーワードkのカテゴリCiにおけるカテゴリ適合度である。例えば、図において、2004年1月20日10時から10時15分の間に、検索キーワード「イラク」に対して参照された文書が、文書ID00000200と文書ID00000400の2文書だとする。この場合のカテゴリ適合度ベクトルは、カテゴリ「海外ニュース」におけるカテゴリ適合度=(1+1)/2=1、それ以外のカテゴリにおける適合度=0をとるベクトルになる。
また、別のカテゴリ適合度の算出方法として、利用者が参照した文書のカテゴリ一致度を用いる方法もある。上記の式(1)のカテゴリベクトルY*k,j=(Yj,1,…,Yj,N)の代わりに、カテゴリ一致度ベクトルZ*k,j=(Zj,1,…,Zj,N)を使用してカテゴリ適合度を算出する。ここで、Zj,iは文書Dk,jにおけるカテゴリCに対するカテゴリ一致度である。カテゴリ一致度を用いると、1つの文書が複数のカテゴリに属する場合にカテゴリ一致度の高いカテゴリ程、カテゴリ適合度を高くすることができ、精度の高いカテゴリ適合度を算出することが可能である。
次に、ランキング部13は、カテゴリ適合度算出部11で算出された検索キーワードのカテゴリ適合度に検索キーワードの使用回数Sを乗算し、カテゴリ別の利用度(利用度ベクトルCC )を求める。ここで、CCk,iが、検索キーワードkのカテゴリCにおけるカテゴリ利用度である。
CC =CF×S=(CCk,1,…,CCk,N) 式(2)
検索キーワード全てに対してカテゴリ別の利用度を求め(ステップ108)、カテゴリ内で検索キーワードの順位付けを行い、順位付けされた上記の検索キーワードを入出力制御部30に送信し、表示を指示する(ステップ109)。
順序付けの方法としては、ログ情報を読み出した期間の中で、利用度の多い順に順位付けする方法、あるいは、読み出した期間より前の期間におけるカテゴリ別の利用度を保存しておき、利用度の増加率が大きい順に順位付けする方法等がある。
次に、検索キーワード選択処理について説明する。
は、本発明の第1の実施の形態における検索キーワード選択処理のフローチャートである。
ユーザが入力装置50から検索キーワードをクリックすると(ステップ201)、入出力制御部30は、クリックされた検索キーワードと期間、カテゴリを文書情報検索部14に通知する(ステップ202)。
文書情報検索部14は、検索キーワード、期間、カテゴリを入力とし、検索キーワードを含む文書で、カテゴリが一致し、かつ、文書の時間情報が期間以前である文書を文書情報蓄積部12から検索する。検索結果を入出力制御部30に送り、入出力制御部30は検索結果を出力装置40に表示する(ステップ203)。
このように、本実施の形態においては、検索要求された検索キーワードのカテゴリ別の利用度を、検索結果から参照された文書のカテゴリを利用して求め、カテゴリ毎に検索キーワードの順位付けを行うことで、短期間で自動的に検索キーワードをカテゴリ分類することが可能となる。
また、上記の図、図のフローチャートの動作をプログラムとして構築し、検索キーワード提示装置として利用されるコンピュータにインストールする、または、ネットワークを介して取得し、インストールして、CPU等の制御手段に実行させることも可能である。
[第2の実施の形態]
前述の第1の実施の形態においては、検索キーワードの使用回数を用いてカテゴリ別の利用度を算出する例を示した。そのため、同一の利用者が複数回同じ検索キーワードを使用すると、使用した回数だけカウントされ、利用度が高くなっていた。しかし、世の中の多くの人々が関心を寄せている検索キーワードを提示する目的のためには、検索キーワードの使用回数ではなく、使用人数をカウントする方が適している。本実施の形態では、検索キーワードの使用人数を算出して、カテゴリ別の順位付けを行う例を説明する。
は、本発明の第2の実施の形態における検索キーワード検索システムの構成を示す。
第1の実施の形態で示した図と同一機能を有するブロックには、同一符号を付与した。
に示す検索キーワードシステムは、ログ情報蓄積部20、検索キーワード提示装置10、入出力制御部30、出力装置40、入力装置50から構成される。
ログ情報蓄積部20は、検索キーワード提示装置10に接続され、利用者が検索要求した検索キーワードと検索時刻と利用者を特定する利用者識別情報を含む検索ログ情報を蓄積する検索ログ蓄積部21と、利用者が検索結果から参照要求した文書の文書識別情報と、参照時刻、利用者識別情報、及び検索結果を表示する元となった検索キーワードを含む参照ログ情報とを蓄積する参照ログ蓄積部22とから構成される。
検索ログ蓄積部21と参照ログ蓄積部22は、以降の説明で検索ログ情報と参照ログ情報を明確に区別するために別々の蓄積部として構成したが、図の例で示したように、検索ログ情報と参照ログ情報が混ざった形で蓄積されていてもよい。
検索キーワード提示装置10は、カテゴリ適合度算出部11、検索キーワード蓄積部15、ランキング部13、文書情報蓄積部12、文書情報検索部14から構成される。
カテゴリ適合度算出部11は、利用者別に検索キーワードのカテゴリ適合度を算出し、検索キーワード蓄積部15に蓄積する。
ランキング部13は、各検索キーワードの利用者別カテゴリ適合度から、検索キーワードのカテゴリ別の利用度を計算する。
文書情報検索部14は、条件を指定して文書情報蓄積部12の検索を行い、検索結果を返送する。
次に、上記の構成における検索キーワード表示処理の動作を説明する。
は、本発明の第2の実施の形態における検索キーワード表示処理のフローチャートである。
カテゴリ適合度算出部11は、ユーザにより指定された期間に基づいて検索ログ蓄積部21から検索ログ情報を読み出す(ステップ301)。読み出した検索ログ情報から順に1つの検索ログ情報を取り出し(ステップ303)、検索キーワード及びユーザIDが一致する参照ログ情報を参照ログ蓄積部22から検索して取得する(ステップ304)。検索結果の参照ログ情報が検索できた場合は(ステップ305、Yes)、参照ログ情報を1つずつ取り出し(ステップ307)、参照文書IDが一致する文書を文書情報蓄積部12から検索し、検索された文書のカテゴリを取得する(ステップ308)。参照ログ情報が検索できなかった場合は(ステップ305、No)、次の検索ログ情報の処理に移る。検索結果の参照ログ情報を全て処理し終えたら(ステップ306,No)、カテゴリ適合度を算出し、ユーザID、検索時刻、検索キーワード、カテゴリ適合度を対応付けて検索キーワード蓄積部15に蓄積する(ステップ309)。ここでのカテゴリ適合度は、第1の実施の形態とは異なり、利用者毎に算出する。利用者pが、検索キーワードkの検索結果から参照した文書を、Dk,p,m(m=1〜M)、カテゴリをC(n=1〜N)、文書Dk,p,mが属するカテゴリを表すカテゴリベクトルを
k,p,m=(Ym,1,…,Ym,N
で表す。Ym,iは、文書Dp,k,mがカテゴリCに属するとき1の値、属さないとき0の値をとる。また、各文書は少なくとも1つのカテゴリに属する。
このカテゴリベクトルを用いて検索キーワードkの利用者pにおけるカテゴリ適合度ベクトルCF k,pを次式で求めることができる。
Figure 0004453437
このCFk,p,iが、検索キーワードkの利用者pにおけるカテゴリCのカテゴリ適合度である。
に、検索キーワード蓄積部15の例を示す。検索キーワード蓄積部15には、ユーザID151、検索時刻152、検索キーワード153、カテゴリ適度度154が蓄積される。ユーザID151は、利用者を識別する情報であり、検索時刻152は、検索要求された時刻、検索キーワード153は、利用者が検索要求した検索キーワード、カテゴリ適合度154は、カテゴリ適合度算出部11で算出されたカテゴリ適合度であり、カテゴリ毎に蓄積している。例えば、検索キーワード「松井」について、図を参照すると、ユーザID00000001の利用者は、参照文書ID00000100の文書を参照している。参照文書ID00000100の文書は図の文書情報蓄積部12の例から、カテゴリ「スポーツ」に属する文書であることがわかる。そこで、上記式によりカテゴリ適合度を求めると、カテゴリ「スポーツ」におけるカテゴリ適合度=1、それ以外のカテゴリにおけるカテゴリ適合度=0となる。同じ検索語「松井」であっても、ユーザID00000003の利用者は、参照文書ID00000300の文書を参照しており、参照文書ID00000300の文書は、カテゴリ「スポーツ」とカテゴリ「芸能」に属する。そのため、
カテゴリ「スポーツ」におけるカテゴリ適合度=1/(1+1)/1=0.5
カテゴリ「芸能」におけるカテゴリ適合度=1(1+1)/1=0.5
それ以外のカテゴリにおけるカテゴリ適合度=0
となる。
また、別のカテゴリ適合度の算出方法として、利用者が参照した文書のカテゴリ一致度を用いる方法もある。式(3)のカテゴリベクトルYk,p,m=(Ym,1,…,Ym,n)の代わりに、カテゴリ一致度ベクトルZk,p,m=(Zm,1,…,Zm,N)を使用してカテゴリ適合度を算出する。ここで、Zm,iは文書Dk,p,mにおけるカテゴリCのカテゴリ一致度である。カテゴリ一致度を用いると、カテゴリ一致度の高いカテゴリ程、カテゴリ適合度を高くすることができ、精度の高いカテゴリ適合度を算出することが可能である。例えば、図のユーザID0000003の利用者における検索キーワード「松井」のカテゴリ適合度を算出する例を説明する。参照文書ID00000300のカテゴリ一致度は、カテゴリ「スポーツ」が0.3、カテゴリ「芸能」が0.5である。そのため、
カテゴリ「スポーツ」におけるカテゴリ適合度=0.3/(0.5+0.3)/1=0.375
カテゴリ「芸能」におけるカテゴリ適合度=0.5/(0.5+0.3)/1=0.625
それ以外のカテゴリにおけるカテゴリ適合度=0
となり、カテゴリ一致度の高いカテゴリ「芸能」のカテゴリ適合度が高くなる。
次に、ランキング部13は、検索キーワード蓄積部15に蓄積された利用者毎の検索キーワードのカテゴリ適合度を、指定した期間分読み出し(ステップ310)、カテゴリ別に各検索キーワードのカテゴリ適合度が0以外の数をカウントし(即ち利用人数をカウントし)、カテゴリ別の利用度とする(ステップ311)。
また、利用者の各カテゴリに対する関心の高さをより正確に表す値として、カテゴリ別に各検索キーワードのカテゴリ適合度を加算した値を求め、カテゴリ別の利用度としてもよい。
続いて、検索キーワードの順位付けを行い、上位の検索キーワードを入出力制御部30に送信し、入出力制御部30は、出力装置40に表示を指示する(ステップ312)。順位付けの方法としては、利用度の多い順に順位付けする方法、あるいは、読み出した期間より前の期間におけるカテゴリ別の利用度を保存しておき、利用度の増加率が大きい順に順位付けする方法等がある。
このように、本実施の形態においては、カテゴリ別に検索キーワードの利用人数を求めて順位付けを行うため、多くの利用者が関心を寄せている検索キーワードに高い順位を与えることができる。
本実施の形態における検索キーワード選択処理は、第1の実施の形態における検索キーワード選択処理と同じであるため、説明を省略する。
以上の説明においては、説明を容易するため各文書が予めカテゴリに分類されている例を説明したが、利用者により選択された参照文書IDから文書のカテゴリ分類を行い、カテゴリを決定する処理を追加する構成としてもよい。この場合、全ての文書をカテゴリ分類する必要がなく文書蓄積時の処理量が軽減される。
また、本発明は、上記の図のフローチャートの動作をプログラムとして構築し、検索キーワード提示装置として利用されるコンピュータにインストールする、または、ネットワークを介して取得し、インストールして、CPU等の制御手段に実行させることも可能である。
なお、本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において、種々変更・応用が可能である。
本発明は、インターネット等のネットワーク上で公開されている情報を検索するための技術に適用可能である。
本発明の第1の実施の形態における検索キーワード提示システムの構成図である。 本発明の第1の実施の形態におけるログ情報蓄積部の一例を示す図である。 本発明の第1の実施の形態における文書情報蓄積部の一例を示す図である。 本発明の第1の実施の形態における検索キーワード表示処理のフローチャートである。 本発明の第1の実施の形態における検索キーワード選択処理のフローチャートである。 本発明の第2の実施の形態における検索キーワード提示システムの構成図である。 本発明の第2の実施の形態における検索キーワードの表示処理のフローチャートである。 本発明の第2の実施の形態における検索キーワード蓄積部の一例を示す図である。
符号の説明
10 検索キーワード提示装置
11 テゴリ適合度算出部
12 書情報蓄積部
13 ンキング部
14 文書情報検索部
15 検索キーワード蓄積部
20 ログ情報蓄積部
21 検索ログ蓄積部
22 参照ログ蓄積部
30 出力制御部
40 力装置
50 入力装置
121 文書ID
122 時間情報
123 カテゴリ
124 文書情報
151 ユーザID
152 検索時刻
153 検索キーワード
154 カテゴリ適合度
201 ユーザID
202 検索/参照時刻
203 検索キーワード
204 参照文書ID

Claims (6)

  1. 利用者が検索要求した検索キーワードと検索結果から参照要求した文書の識別情報とを含むログ情報を収集し、一定期間毎に検索キーワードを順位付けてカテゴリ別に表示するための検索キーワード順序付け方法であって、
    カテゴリ適合度算出部が、
    利用者が検索要求した検索キーワードと検索時刻と該利用者を特定する利用者識別情報を蓄積する検索ログ蓄積手段から、指定された期間における検索ログ情報を読み出すステップと、
    カテゴリ適合度算出部が、
    読み出した各検索ログ情報に対して、利用者が検索結果から参照要求した文書の文書識別情報と、参照時刻、利用者識別情報、及び検索結果を表示する元となった検索キーワードを含む参照ログ情報とを蓄積する参照ログ蓄積手段から、検索キーワード及び利用者識別情報が一致する参照ログ情報を取得するステップと、
    カテゴリ適合度算出部が、
    取得した各参照ログ情報に含まれる文書識別情報に基づいて、文書識別情報とカテゴリ及び文書の時間情報とが対応付けられて蓄積された文書情報蓄積手段を検索して文書のカテゴリを取得し、前記検索キーワードの利用者別カテゴリ適合度を算出するステップと、
    ランキング部が、
    算出した前記検索キーワードの利用者別カテゴリ適合度から、該検索キーワードのカテゴリごとに使用人数を求める、または、カテゴリ別に各検索キーワードのカテゴリ適合度を加算し、各検索キーワードのカテゴリ別の利用度を算出するステップと、
    ランキング部が、
    算出された前記各検索キーワードのカテゴリ別の利用度を用いて、カテゴリ毎に検索キーワードの順位付けを行うステップと、
    からなることを特徴とする検索キーワード順位付け方法。
  2. 表示制御部が、
    順位付けされた前記検索キーワードをカテゴリ別に表示手段に表示するステップと、
    文書情報検索部が、
    前記表示手段に表示された前記検索キーワードから1つの検索キーワードが選択されると、選択された前記検索キーワードの期間及びカテゴリから、該検索キーワードを含む文書でカテゴリが一致し、かつ、文書の時間情報が前記期間以前である文書を前記文書情報蓄積手段から検索し、検索結果を前記表示手段に表示するステップと、
    を更に行うことを特徴とする請求項1記載の検索キーワード順位付け方法。
  3. 利用者が検索要求した検索キーワードと検索結果から参照要求した文書の識別情報とを含むログ情報を収集し、一定期間毎に検索キーワードを順位付けてカテゴリ別に表示するための検索キーワード順位付け装置であって、
    利用者が検索要求した検索キーワードと検索時刻と該利用者を特定する利用者識別情報を含む検索ログ情報を蓄積する検索ログ蓄積手段と、
    文書識別情報とカテゴリ及び文書の時間情報とが対応付けられて蓄積された文書情報蓄積手段と、
    利用者が検索結果から参照要求した文書の文書識別情報と、参照時刻、利用者識別情報、及び検索結果を表示する元となった検索キーワードを含む参照ログ情報とを蓄積する参照ログ蓄積手段と、
    前記検索ログ蓄積手段から、指定された期間における検索ログ情報を読み出す検索ログ読み出し手段と、
    読み出した各検索ログ情報に対して、前記参照ログ蓄積手段から、検索キーワード及び利用者識別情報が一致する参照ログ情報を取得する参照ログ取得手段と、
    取得した各参照ログ情報に含まれる文書識別情報に基づいて、前記文書情報蓄積手段を検索して文書のカテゴリを取得し、前記検索キーワードの利用者別カテゴリ適合度を算出するカテゴリ適合度算出手段と、
    算出した前記検索キーワードの利用者別カテゴリ適合度から、該検索キーワードのカテゴリ毎に使用人数を求める、または、カテゴリ別に各検索キーワードのカテゴリ適合度を加算し、各検索キーワードのカテゴリ別の利用度を算出し、検索キーワード蓄積手段に蓄積する利用度算出手段と、
    算出した前記各検索キーワードのカテゴリ別の利用度を用いて、カテゴリ毎に検索キーワードの順位付けを行うランキング手段と、
    を有することを特徴とする検索キーワード順位付け装置。
  4. 予め文書識別情報と文書の時間情報とを対応付けて前記文書情報蓄積手段に蓄積しておき、前記利用者が参照要求した文書をカテゴリ分類し、分類結果のカテゴリを前記文書情報蓄積手段に追加する手段を有することを特徴とする請求項3記載の検索キーワード順位付け装置。
  5. 前記ランキング手段で順位付けされた前記検索キーワードをカテゴリ別に表示手段に表示する表示制御手段と、
    前記表示手段に表示された前記検索キーワードから1つの検索キーワードが選択されると、選択された前記検索キーワードの期間及びカテゴリから、該検索キーワードを含む文書でカテゴリが一致し、かつ、文書の時間情報が前記期間以前である文書を前記文書情報蓄積手段から検索し、検索結果を前記表示手段に表示する手段と、
    を更に有することを特徴とする請求項3または4記載の検索キーワード順位付け装置。
  6. 利用者が検索要求した検索キーワードと検索結果から参照要求した文書の識別情報とを含むログ情報を収集し、一定期間毎に検索キーワードを順位付けてカテゴリ別に表示するための検索キーワード順位付けプログラムであって、
    請求項3乃至5のいずれか1項に記載の検索キーワード順位付け装置を構成する各手段としてコンピュータを機能させるための検索キーワード順位付けプログラム。
JP2004141532A 2004-05-11 2004-05-11 検索キーワード順位付け方法及び装置及びプログラム Expired - Lifetime JP4453437B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004141532A JP4453437B2 (ja) 2004-05-11 2004-05-11 検索キーワード順位付け方法及び装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004141532A JP4453437B2 (ja) 2004-05-11 2004-05-11 検索キーワード順位付け方法及び装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2005322165A JP2005322165A (ja) 2005-11-17
JP4453437B2 true JP4453437B2 (ja) 2010-04-21

Family

ID=35469390

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004141532A Expired - Lifetime JP4453437B2 (ja) 2004-05-11 2004-05-11 検索キーワード順位付け方法及び装置及びプログラム

Country Status (1)

Country Link
JP (1) JP4453437B2 (ja)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7921094B2 (en) 2007-02-28 2011-04-05 Brother Kogyo Kabushiki Kaisha Network system and communication device
JP4862727B2 (ja) 2007-03-29 2012-01-25 ブラザー工業株式会社 ネットワークシステム、通信装置及びコンピュータプログラム
KR100892851B1 (ko) * 2007-05-31 2009-04-10 엔에이치엔(주) 키워드 추천 방법 및 그 시스템
KR100898459B1 (ko) * 2007-08-10 2009-05-21 엔에이치엔(주) 질의 분류 방법 및 그 시스템
KR100898458B1 (ko) * 2007-08-10 2009-05-21 엔에이치엔(주) 정보 검색 방법 및 그 시스템
KR100930455B1 (ko) 2007-09-06 2009-12-08 엔에이치엔(주) 쿼리별 검색 컬렉션 생성 방법 및 시스템
KR101049889B1 (ko) * 2007-10-22 2011-07-19 주식회사 이베이지마켓 검색을 통한 행태분석에 기반한 키워드 그룹에 대하여광고를 수주하고 타겟 광고하는 웹 사이트 운영 방법 및온라인 시스템
JP2009122337A (ja) * 2007-11-14 2009-06-04 Dainippon Printing Co Ltd クイズ問題作成装置
JP4388128B1 (ja) 2008-08-29 2009-12-24 株式会社東芝 情報提供サーバ、情報提供方法及び情報提供システム
JP5412899B2 (ja) * 2009-03-16 2014-02-12 コニカミノルタ株式会社 画像データ管理装置、画像データ識別情報変更方法、コンピュータプログラム
JP2011048646A (ja) * 2009-08-27 2011-03-10 Nifty Corp 検索装置、方法及びプログラム
JP5199968B2 (ja) * 2009-09-07 2013-05-15 日本電信電話株式会社 キーワードタイプ判定装置、キーワードタイプ判定方法およびキーワードタイプ判定プログラム
JP5414614B2 (ja) * 2010-05-14 2014-02-12 日本電信電話株式会社 キーワードタイプ判定装置及びプログラム
JP5581857B2 (ja) * 2010-07-07 2014-09-03 日本電気株式会社 情報検索装置、情報検索方法および情報検索プログラム
JP5720133B2 (ja) * 2010-07-13 2015-05-20 ソニー株式会社 情報処理装置、情報処理方法およびコンピュータプログラム
US8250077B2 (en) 2010-07-28 2012-08-21 Yahoo! Inc. System and method for television search assistant
CN102810104B (zh) * 2011-06-03 2015-05-20 阿里巴巴集团控股有限公司 信息调整方法及装置
JP5898126B2 (ja) * 2013-05-31 2016-04-06 弥生株式会社 クラウドコンピューティングによる仕訳解析サービスを提供する仕訳解析センターシステム
JP6040136B2 (ja) * 2013-10-16 2016-12-07 日本電信電話株式会社 特徴スコア計算装置、特徴スコア計算方法及び特徴スコア計算プログラム
JP6664599B2 (ja) * 2015-08-25 2020-03-13 ヤフー株式会社 曖昧性評価装置、曖昧性評価方法、及び曖昧性評価プログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4025443B2 (ja) * 1998-12-04 2007-12-19 富士通株式会社 文書データ提供装置及び文書データ提供方法
JP3563682B2 (ja) * 2000-09-12 2004-09-08 日本電信電話株式会社 次検索候補単語提示方法および装置と次検索候補単語提示プログラムを記録した記録媒体
JP2003006195A (ja) * 2001-06-21 2003-01-10 Nec System Technologies Ltd キーワード情報通知方式及びその方法
JP2003167891A (ja) * 2001-11-29 2003-06-13 Nippon Telegr & Teleph Corp <Ntt> 単語重要度算出方法、装置、プログラム、および記録媒体

Also Published As

Publication number Publication date
JP2005322165A (ja) 2005-11-17

Similar Documents

Publication Publication Date Title
JP4453437B2 (ja) 検索キーワード順位付け方法及び装置及びプログラム
US8140541B2 (en) Time-weighted scoring system and method
US7966324B2 (en) Personalizing a search results page based on search history
KR101792587B1 (ko) 컨텐츠에 대한 선호도 예측 방법 및 장치와, 샘플 컨텐츠 선정 방법 및 장치
JP5673336B2 (ja) 情報処理方法、表示方法、情報処理装置、表示装置、情報処理プログラム、表示プログラム
JP2011154467A (ja) 検索結果順位付け方法および検索結果順位付けシステム
JP2013149140A (ja) 情報処理装置、及び、情報処理方法
JP5228584B2 (ja) 興味情報特定システム、興味情報特定方法、および興味情報特定用プログラム
JP2005107688A (ja) 情報表示方法及びシステム及び情報表示プログラム
JP2006053616A (ja) サーバ装置、webサイト推奨方法およびプログラム
JP5579140B2 (ja) 文書検索装置及び方法及びプログラム
JP2015166978A (ja) 画像検索装置及び画像検索プログラム
US20140059062A1 (en) Incremental updating of query-to-resource mapping
JP4891638B2 (ja) 目的データをカテゴリに分類する方法
JP5321258B2 (ja) 情報収集システムおよび情報収集方法ならびにそのプログラム
CN108170664B (zh) 基于重点关键词的关键词拓展方法和装置
JP2010003134A (ja) 検索キーワードを推薦するサーバ、方法、およびプログラム
JP2000331020A (ja) 情報参照方法,情報参照装置および情報参照プログラムを格納した記憶媒体
JP2017079080A (ja) 情報処理装置、情報処理方法、情報処理プログラム
KR101958555B1 (ko) 검색 결과 제공 장치 및 방법
JP5803912B2 (ja) 情報提供装置、システム、方法、及びプログラム
JP6065061B2 (ja) 情報処理装置、端末装置、情報処理方法、表示方法、情報処理プログラム、及び表示プログラム
JP2005010848A (ja) 情報検索装置、情報検索方法、情報検索プログラム、及び記録媒体
JP5801243B2 (ja) 特徴キーワード推薦装置及び方法及びプログラム
JP2022111544A (ja) 情報処理システム、及び情報処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060720

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090811

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091013

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091117

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091201

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100112

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100125

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130212

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4453437

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term