JP2007241451A - 情報収集支援装置 - Google Patents

情報収集支援装置 Download PDF

Info

Publication number
JP2007241451A
JP2007241451A JP2006060078A JP2006060078A JP2007241451A JP 2007241451 A JP2007241451 A JP 2007241451A JP 2006060078 A JP2006060078 A JP 2006060078A JP 2006060078 A JP2006060078 A JP 2006060078A JP 2007241451 A JP2007241451 A JP 2007241451A
Authority
JP
Japan
Prior art keywords
information
document
keyword
user
keyword information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006060078A
Other languages
English (en)
Inventor
Takashi Isozaki
隆司 磯崎
Sukeji Kato
典司 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2006060078A priority Critical patent/JP2007241451A/ja
Priority to US11/503,177 priority patent/US20070208684A1/en
Publication of JP2007241451A publication Critical patent/JP2007241451A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/313Selection or weighting of terms for indexing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】利用者の行動の全体が反映された判断基準で、重要なキーワードを提示できる情報収集支援装置を提供する。
【解決手段】情報収集に利用するキーワード情報を提示する情報収集支援装置であって、利用者による過去の作業の対象となったドキュメントから抽出したキーワード情報候補を保持するとともに、当該キーワード情報候補に係る評価要因を含む、予め定められた複数の評価要因の各々について、利用者ごとの確率重み情報を関連づけて記憶しており、作業の対象となったドキュメントに対する利用者の作業の指示に基づいて当該確率重み情報を補正し、当該評価要因の確率重み情報を用いて所定のドキュメント群から選択されるドキュメントに関連するキーワード情報を出力する情報収集支援装置である。
【選択図】図1

Description

本発明は、ウェブページの検索エンジン等に用いるキーワードを提供させる情報収集支援装置に関する。
近年では、インターネットをはじめとする情報提供のインフラストラクチャーが整備されるとともに、これらのインフラストラクチャーによって提供される情報を検索する技術が研究されている。例えば、インターネット上で提供されるウェブページを検索の対象として、入力されたキーワードを含むウェブページの一覧を提供するサービスがある。
ところが、利用者が所望の情報が提供されているウェブページを見いだすためには、このキーワードの選定が重要となるのに、利用者が必ずしも適切なキーワードを選定できるものではない。そこで利用者所望の情報に係るキーワードを推定し、推定したキーワードを利用して検索したドキュメントを提示するエージェントシステム等が望まれている。
例えば、非特許文献1には、ウェブページ等からキーワードを抽出する技術が開示されている。
松尾豊,石塚満、「語の共起の統計情報に基づく文書からのキーワード抽出アルゴリズム」、人工知能学会誌、2002年、第17巻、第3号、217ページ 松尾豊,福田隼人,石塚満、「ユーザ個人の閲覧履歴からのキーワード抽出によるブラウジング支援」、人工知能学会誌、2003年、第18巻、第4号、203ページ 特開2002−73677号公報
しかしながら、上記従来のキーワード抽出技術では、利用者ごとのキーワードを抽出できない。そこで、利用者の閲覧したウェブページからキーワードを抽出することとすれば、利用者ごとのキーワード抽出は可能となる(例えば非特許文献2)。また、ウェブページの閲覧時間を基に利用者の興味ある分野のキーワードを抽出することも考えられている(特許文献1)。
しかし、こうしたキーワード抽出の方法だけでは、抽出されるキーワードの確率的な重要性が必ずしも高くならない。例えばあるウェブページを長時間閲覧してしまうと、当該ウェブページから抽出されるキーワードの重要性が高くなりすぎて、以後閲覧したウェブページのキーワードが提示されなくなる。
本発明は上記実情に鑑みて為されたもので、利用者の行動特性により、利用者にとって重要なドキュメントであるか否かの判定基準を調整するとともに、重要と判断されるドキュメント群から重要性の高いキーワードを推定するので、特定のドキュメントの重要性が、キーワードの重要性に直接に関係せず、利用者の行動の全体が反映された判断基準で、重要なキーワードを提示できる情報収集支援装置を提供することを、その目的の一つとする。
上記従来例の問題点を解決するための本発明は、情報収集に利用するキーワード情報を提示する情報収集支援装置であって、利用者による過去の作業の対象となったドキュメントから抽出したキーワード情報候補を保持する保持手段と、前記キーワード情報候補に係る評価要因を含む、予め定められた複数の評価要因の各々について、利用者ごとの確率重み情報を関連づけて記憶する手段と、作業の対象となったドキュメントに対する利用者の作業に基づいて、前記確率重み情報を補正する補正手段と、を含み、前記評価要因の確率重み情報を用いて所定のドキュメント群から選択されるドキュメントに関連するキーワード情報を出力することを特徴としている。
ここで前記キーワード情報候補に係る評価要因には、複数のキーワード候補に関わる評価要因を含んでもよい。
さらに、本発明の一態様は、情報収集に利用するキーワード情報を提示する情報収集支援方法であって、利用者による過去の作業の対象となったドキュメントから抽出したキーワード情報候補を保持する保持手段と、前記キーワード情報候補に係る評価要因を含む、予め定められた複数の評価要因の各々について、利用者ごとの確率重み情報を関連づけて記憶する手段とを備えたコンピュータに、作業の対象となったドキュメントに対する利用者の作業に基づいて、前記確率重み情報を補正する工程と、前記評価要因の確率重み情報を用いて所定のドキュメント群から選択されるドキュメントに関連するキーワード情報を出力する工程と、を実行させることを特徴としている。
さらに本発明の別の態様は、情報収集に利用するキーワード情報を提示するプログラムであって、利用者による過去の作業の対象となったドキュメントから抽出したキーワード情報候補を保持する保持手段と、前記キーワード情報候補に係る評価要因を含む、予め定められた複数の評価要因の各々について、利用者ごとの確率重み情報を関連づけて記憶する手段とを備えたコンピュータに、作業の対象となったドキュメントに対する利用者の作業に基づいて、前記確率重み情報を補正する手順と、前記評価要因の確率重み情報を用いて所定のドキュメント群から選択されるドキュメントに関連するキーワード情報を出力する手順と、を実行させることを特徴としている。
本発明の実施の形態について図面を参照しながら説明する。本発明の実施の形態に係る情報収集支援装置1は、図1に示すように、制御部11、記憶部12、ストレージ部13、操作部14、表示部15及びネットワークインタフェース(NIC)部16を含んで構成されている。
制御部11は、CPU等のプログラム制御デバイスであり、記憶部12に格納されているプログラムに従って動作する。この制御部11は、利用者を、例えばユーザ名やパスワードなどを用いて認証し、電子メールとして送受信されるドキュメントや、ウェブサーバから取得されるドキュメントや、ストレージ部13に格納されたドキュメント等について、認証した利用者からの要求に基づいて、作成、閲覧、削除、転送等の処理を実行する。制御部11は、こうしたドキュメントに対する利用者の作業をログとして記録しておく。
またこの制御部11は、利用者が作成、閲覧等したドキュメントについて、予め定めた評価要因に基づく評価値を算出する。後に述べるように、この評価要因の各々には、利用者ごとに確率重み情報が設定される。制御部11は、利用者ごとのドキュメントに対する作業のログに基づいて、評価要因ごとの確率重み情報を補正する。
さらに制御部11は、設定された評価要因ごとの確率重み情報を用いて、予め定められた抽出対象ドキュメントの一部を選択し、当該選択した抽出対象ドキュメントからキーワード情報を抽出する処理を行う。ここで抽出されたキーワード情報が、利用者の注目ドキュメントに関わるキーワードとして利用者に提示されることになる。
なお、制御部11は、さらにここで抽出したキーワード情報を用いて、別途ドキュメント群を取得して提示するなどの処理を行ってもよい。これら制御部11によって実行される処理の具体的な内容については後に詳しく述べる。
記憶部12は、RAMやROM等の記憶素子を含んで構成される。この記憶部12は、制御部11によって実行されるプログラムが格納される。また、この記憶部12は、制御部11のワークメモリとしても動作する。
ストレージ部13は、ハードディスクデバイス等であり、種々のドキュメントが格納される。また、このストレージ部13には、利用者が作業の対象としたドキュメントから抽出されたキーワード情報のリストが、キーワード情報候補群として格納される。
操作部14は、キーボードやマウス等であり、利用者から入力される指示操作の内容を制御部11に出力する。表示部15は、ディスプレイ等であり、制御部11から入力される指示に従って情報を表示出力する。
NIC部16は、ネットワークに接続され、制御部11から入力される指示に従って、ネットワークを介して情報を送出する。またこのNIC部16は、ネットワークを介して受信される情報を制御部11に出力する。本実施の形態では、このNIC部16は、インターネットに接続されているものとし、インターネットを介してアクセス可能となる検索エンジン(例えばグーグル(商標)など)に対してキーワードの情報を送信し、当該キーワードの情報に基づいて検索されたドキュメントの一覧や、ドキュメントの実体情報などを受信して、制御部11に出力する。
[ドキュメントの評価要因]
本実施の形態では、所定のキーワード情報を含むとの条件や、過去に重要と設定されたドキュメントとの類似度が閾値以上であるとの条件、格納されている場所に関する条件、作成者の条件などを評価要因とする。そして利用者ごとに、各評価要因を満足するときにドキュメントが重要であると判断する確率を表す確率重み情報を関連づけて、評価要因データベースとしてストレージ部13に格納する(図2)。この評価要因データベースにより概念的に図3に示すようなベイジアンネットワークが形成される。
本実施の形態の制御部11は、利用者が作業の対象としたドキュメントからキーワード情報を抽出し、その少なくとも一部を、ストレージ部13に格納されたキーワード情報候補リストに追記している。そして評価要因データベースには、このキーワード情報候補リストに属するキーワード情報候補に係る評価要因を含む。
なお、ここで少なくとも一部としたのは、抽出されたキーワード情報のすべてをキーワード情報候補リストに含めるのではなく、例えば抽出頻度が比較的高いキーワード情報であって、ストレージ部13に格納された全ドキュメント中の抽出頻度が比較的低いキーワード情報(いわゆるTF/IDFの値が所定しきい値より高いキーワード情報など)について限定してキーワード情報候補リストに含めることとしても構わないためである。
また、このキーワード情報候補リストには、図4に示すように、利用者ごとに、重要と判断されたドキュメントに出現した回数と、非重要と判断されたドキュメントに出現した回数とを関連づけて、出現回数データベースとして保持する。ここでドキュメントの重要/非重要の判断については、次に述べる。
[制御部の処理]
次に制御部11の処理の内容について説明する。制御部11は、予め利用者を認証して、利用者を特定する情報を取得しておく。
利用者が電子メールのドキュメントを作成したり、受信して閲覧したり、またウェブサーバ上のドキュメントを取得して閲覧したりといった作業を行うごとに、制御部11は、これらの作業の対象となったドキュメントの重要度を、評価要因データベースに記録されている、認証した利用者に関する確率重み情報から推定する。
そして、認証した利用者にとって当該ドキュメントが重要であるとの確率を演算し、重要であるとされる確率が予め定めた閾値を超える場合に、当該ドキュメントを重要ドキュメントと判断する。また、重要であるとされる確率が上記予め定めた閾値を超えない場合に、当該ドキュメントを非重要ドキュメントと判断する。
制御部11は、利用者が作業の対象としたドキュメントのうち、重要であると判断したドキュメントの数と、非重要と判断したドキュメントの数とをカウントして、図5に示すように、利用者ごとに、重要または非重要と判断したドキュメントの数の情報を格納しておく。
制御部11は、また、この作業の対象となったドキュメントから、キーワード情報候補リストに含まれる各キーワード情報を検索する。そして検索の結果、見いだされたキーワード情報については、出現回数データベースにおいて、当該キーワード情報に関連づけられている出現回数の情報を「1」だけインクリメントする。すなわち、作業の対象となっているドキュメントが重要と判断されていれば、重要と判断されたドキュメントに出現した回数を「1」だけインクリメントする。また、作業の対象となっているドキュメントが非重要と判断されていれば、非重要と判断されたドキュメントに出現した回数を「1」だけインクリメントする。
そして制御部11は、このドキュメントに対する利用者の操作の結果から、評価要因データベースに記録されている確率重み情報を更新する処理を行う。この処理は、例えば、International Conference on Computational Intelligence for Modelling Control and Automation - CIMCA'2005にて発表されたT.Isozaki, K. Horiuchi and H.Kashimura, “A New E-mail Agent Architecture Based on Semi-supervised Bayesian Networks” で発明者らによって発表された、ベイジアンネットワークを利用したプロファイリングと振る舞いの二段階半教師付き学習方式による処理と同様のもので構わないので、ここでの詳細な説明を省略する(なお、当該論文は、追ってIEEEより刊行予定である)。
利用者が、キーワードを提示するよう指示すると、制御部11は、この指示を受けて、図6に示す処理を開始し、評価要因データベースに記録されている、当該利用者の確率重み情報を用いて、予め定めたドキュメント群(抽出対象ドキュメントの群)から重要と判断されるドキュメントを選択する。ここでは、ストレージ部13に格納されているドキュメント(例えばウェブサーバからダウンロードしたドキュメントや、利用者自身が作成したドキュメント、受信ないし送信した電子メールのドキュメントが蓄積されているものとする)のそれぞれを抽出対象ドキュメントとして、この抽出対象ドキュメントから、評価要因データベースに記録されている、当該利用者の確率重み情報を用いて、重要と判断されるドキュメントを選択する。
すなわち、制御部11は、抽出対象ドキュメントのそれぞれについて、評価要因データベースに含まれる各評価要因とのネットワークを作成し、各抽出対象ドキュメントが、重要と判断される確率を算出する。つまり、ここでは各評価要因に関連づけられた確率重み情報から各抽出対象ドキュメントが重要であると判断される確率を演算することになる。そして、この抽出対象ドキュメント群のうちから、重要であると判断される確率が所定の閾値を超える抽出対象ドキュメントを、重要ドキュメント例として特定する(S1)。
一方、ベイズの定理は、AであるときにBであるとされる確率と、BであるときにAである確率とを関連づける定理であるので、このベイズの定理を用いると、重要ドキュメント例として特定されているドキュメントが重要であると判断される確率から、各評価要因の生起確率が演算される。
制御部11は、こうしてベイズの定理を用いて、特定した重要ドキュメント例ごとに、当該重要ドキュメント例が重要であると判断される確率を用い、各評価要因が生起している確率を算出し、各評価要因について、重要ドキュメント例ごとに演算された生起確率を累算し、この累算の結果を評価要因の重要度とする(S2)。
制御部11は、評価要因のうち、キーワード情報に係る評価要因について、それぞれの重要度をキーとして、重要度が高いものから低いものへと並べ替える(S3)。そして、上位所定個数の評価要因に係るキーワード情報を、提示対象として抽出する(S4)。
制御部11は、ここで抽出した提示対象のキーワード情報を、例えば表示部15に出力してもよい。また、制御部11は、この提示対象のキーワード情報を用いて、NIC部16に対して、インターネットを介してアクセス可能となる検索エンジン(例えばグーグル(商標)など)に対して当該提示対象となったキーワード情報を送信させる。そしてNIC部16から当該キーワード情報に基づいて検索されたドキュメントの実体情報の入力を受けて、ストレージ部13に格納する。この格納されたドキュメントも、抽出対象ドキュメントとして扱われる。また、制御部11は、ここで検索の結果として得られたドキュメント群を表示部15に表示する。
また、評価要因としては複数のキーワード情報が共起することの条件を含んでもよい。この場合、例えばN個のキーワード情報候補について、n個までのキーワード情報の組み合わせが共起する場合を評価要因としてしまうと、その組み合わせ数が膨大となり、処理負担が大きくなる。
そこで、共起するとの条件に含めるキーワード情報を、キーワード情報候補のうちから予め絞り込んでおく。例えば、過去の作業の結果から、重要と判断されているドキュメントに含まれているキーワード情報を、第2候補として取り出し、この第2候補についての組み合わせについて、共起するとの条件に関わる評価要因を設定すればよい。
ここで第2候補として取り出す条件は、例えば、各キーワード情報について、
Figure 2007241451
の値を演算し、この値をキーとして大きい順にソートし、その上位所定個数を取り出して、第2候補とすればよい。
制御部11は、例えばこの第2候補に含まれるキーワード情報の任意の2個の組み合わせについて、双方のキーワード情報を含むとの条件の評価要因を設定する。
すなわち本実施の形態の情報収集支援装置1は、次のように動作する。利用者は、通常、この情報収集支援装置1を用いて、ドキュメントを作成(例えばワードプロセッサ文書を作成したり、電子メールのドキュメントを作成したりといった作業)したり、ドキュメントをウェブサーバや、ドキュメント管理システムから取得し、あるいは電子メールにて受信して閲覧、転送、削除するなどの種々の作業を実行している。制御部11は、これらの作業の内容をログとして記録している。
また情報収集支援装置1は、所定のドキュメント群を抽出対象ドキュメントとして、これら抽出対象ドキュメントについて、予め定められた評価要因に基づいて、それぞれ重要と判断される確率を算定するためのベイジアンネットワークを形成し、その情報を保持している。
情報収集支援装置1は、また、利用者の作業のログに基づいて、利用者ごとに、各評価要因に関わる確率重み情報を更新して、ベイジアンネットワークのパラメータを更新している。
利用者が、キーワードの提示を求めると、情報収集支援装置1は、その提示を求めた時点のベイジアンネットワークのパラメータを用い、抽出対象ドキュメントのうち、重要と判断される確率の高いものから順に所定数個または、重要と判断される確率が予め定めた閾値より高いものを、重要ドキュメント例として選択する。
そして情報収集支援装置1は、当該選択された重要ドキュメント例に対してベイジアンネットワーク上で関連づけられている評価要因について、各評価要因が生起している確率に基づいて、各評価要因の重要度を算出する。そして評価要因のうち、キーワード情報に関わるものを、その重要度の高いものから順に所定数個、または重要度が予め定めた閾値より高いものを選択して、利用者に提示し、またはネットワーク上でのドキュメント検索のキーワードとして利用する。
このように本実施の形態によると、利用者の行動特性により、利用者にとって重要なドキュメントであるか否かの判定基準を調整する。そして、こうして利用者の行動の全体として形成されたベイジアンネットワークを用いて重要と判断されるドキュメント群(重要ドキュメント例)から、重要性の高いキーワードを推定する。このため特定のドキュメントの重要性が、キーワードの重要性に直接に関係せず、利用者の全体的な行動に基づいて重要なキーワードを提示できる。
なお、本実施の形態において、利用者の作業のログには、それぞれの作業が行われた日時を関連づけておき、当該関連づけられた日時からの経過時間によって、評価要因に関連づけられた確率重み情報への影響を低減してもよい。この方法は、脳における長期記憶の減衰に相当する影響を模したものである。同様に、関連づけられた日時が比較的最近であれば、この影響の減衰を急激にし、長期的には漸近的に「0」となるよう減衰させてもよい。これにより短期記憶の減衰に相当する影響を模すことができる。例えば当該減衰率を、時刻に係る指数関数の逆数状に設定して、各作業ログについて評価要因の確率重み情報の更新量mに、この減衰率αを乗じて、αmとし、このαmだけ確率重み情報を更新することとしてもよい。
さらに、抽出対象ドキュメントが、電子メールとその他、あるいは、ウェブサーバから取得したデータ、技術情報、社内文書、などと分類されている場合は、各分類ごとに評価要因を異ならせてもよい。
利用者は、この情報収集支援装置によって提示されたキーワードを用いて、情報収集を行うことができるようになる。
本発明の実施の形態に係る情報収集支援装置の構成例を表すブロック図である。 本発明の実施の形態に係る情報収集支援装置の評価要因データベースの例を表す説明図である。 本発明の実施の形態に係る情報収集支援装置が用いるベイジアンネットワークの概要例を表す説明図である。 本発明の実施の形態に係る情報収集支援装置のキーワード情報候補の出現回数を保持するデータベースの例を表す説明図である。 本発明の実施の形態に係る情報収集支援装置での重要ドキュメント、非重要ドキュメントの数を保持するデータベースの例を表す説明図である。 本発明の実施の形態に係る情報収集支援装置の処理例を表すフローチャート図である。
符号の説明
1 情報収集支援装置、11 制御部、12 記憶部、13 ストレージ部、14 操作部、15 表示部、16 ネットワークインタフェース部。

Claims (4)

  1. 情報収集に利用するキーワード情報を提示する情報収集支援装置であって、
    利用者による過去の作業の対象となったドキュメントから抽出したキーワード情報候補を保持する保持手段と、
    前記キーワード情報候補に係る評価要因を含む、予め定められた複数の評価要因の各々について、利用者ごとの確率重み情報を関連づけて記憶する手段と、
    作業の対象となったドキュメントに対する利用者の作業に基づいて、前記確率重み情報を補正する補正手段と、
    を含み、
    前記評価要因の確率重み情報を用いて所定のドキュメント群から選択されるドキュメントに関連するキーワード情報を出力することを特徴とする情報収集支援装置。
  2. 請求項1に記載の情報収集支援装置であって、
    前記キーワード情報候補に係る評価要因には、複数のキーワード候補に関わる評価要因を含むことを特徴とする情報収集支援装置。
  3. 情報収集に利用するキーワード情報を提示する情報収集支援方法であって、
    利用者による過去の作業の対象となったドキュメントから抽出したキーワード情報候補を保持する保持手段と、前記キーワード情報候補に係る評価要因を含む、予め定められた複数の評価要因の各々について、利用者ごとの確率重み情報を関連づけて記憶する手段とを備えたコンピュータに、
    作業の対象となったドキュメントに対する利用者の作業に基づいて、前記確率重み情報を補正する工程と、
    前記評価要因の確率重み情報を用いて所定のドキュメント群から選択されるドキュメントに関連するキーワード情報を出力する工程と、
    を実行させることを特徴とする情報収集支援方法。
  4. 情報収集に利用するキーワード情報を提示するプログラムであって、
    利用者による過去の作業の対象となったドキュメントから抽出したキーワード情報候補を保持する保持手段と、前記キーワード情報候補に係る評価要因を含む、予め定められた複数の評価要因の各々について、利用者ごとの確率重み情報を関連づけて記憶する手段とを備えたコンピュータに、
    作業の対象となったドキュメントに対する利用者の作業に基づいて、前記確率重み情報を補正する手順と、
    前記評価要因の確率重み情報を用いて所定のドキュメント群から選択されるドキュメントに関連するキーワード情報を出力する手順と、
    を実行させることを特徴とするプログラム。
JP2006060078A 2006-03-06 2006-03-06 情報収集支援装置 Pending JP2007241451A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2006060078A JP2007241451A (ja) 2006-03-06 2006-03-06 情報収集支援装置
US11/503,177 US20070208684A1 (en) 2006-03-06 2006-08-14 Information collection support apparatus, method of information collection support, computer readable medium, and computer data signal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006060078A JP2007241451A (ja) 2006-03-06 2006-03-06 情報収集支援装置

Publications (1)

Publication Number Publication Date
JP2007241451A true JP2007241451A (ja) 2007-09-20

Family

ID=38472550

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006060078A Pending JP2007241451A (ja) 2006-03-06 2006-03-06 情報収集支援装置

Country Status (2)

Country Link
US (1) US20070208684A1 (ja)
JP (1) JP2007241451A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012033167A (ja) * 2010-07-29 2012-02-16 Nhn Corp 文書順位決定システムおよび方法
JP2012512465A (ja) * 2008-12-12 2012-05-31 アティジオ リミテッド ライアビリティ カンパニー 関心領域についての判定情報を使用した勧告の提供
JP2017508214A (ja) * 2014-03-21 2017-03-23 アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited 検索推奨の提供
JP2018195118A (ja) * 2017-05-18 2018-12-06 日本電信電話株式会社 路面データ収集装置、方法、及びプログラム

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7523110B2 (en) * 2005-03-03 2009-04-21 Gravic, Inc. High availability designated winner data replication
US7933890B2 (en) 2006-03-31 2011-04-26 Google Inc. Propagating useful information among related web pages, such as web pages of a website
US9355110B1 (en) * 2011-07-14 2016-05-31 Google Inc. Dynamic presentation of data items based on prioritized associations
US9146980B1 (en) 2013-06-24 2015-09-29 Google Inc. Temporal content selection
US11222056B2 (en) * 2017-11-13 2022-01-11 International Business Machines Corporation Gathering information on user interactions with natural language processor (NLP) items to order presentation of NLP items in documents
CN112784234B (zh) * 2021-01-29 2023-08-04 北京译泰教育科技有限公司 一种供应商管理方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6507841B2 (en) * 1998-02-20 2003-01-14 Hewlett-Packard Company Methods of and apparatus for refining descriptors
JP2000029902A (ja) * 1998-07-15 2000-01-28 Nec Corp 構造化文書分類装置およびこの構造化文書分類装置をコンピュータで実現するプログラムを記録した記録媒体、並びに、構造化文書検索システムおよびこの構造化文書検索システムをコンピュータで実現するプログラムを記録した記録媒体
JP3573688B2 (ja) * 2000-06-28 2004-10-06 松下電器産業株式会社 類似文書検索装置及び関連キーワード抽出装置
US7269546B2 (en) * 2001-05-09 2007-09-11 International Business Machines Corporation System and method of finding documents related to other documents and of finding related words in response to a query to refine a search
US7289985B2 (en) * 2004-04-15 2007-10-30 Microsoft Corporation Enhanced document retrieval
US7698267B2 (en) * 2004-08-27 2010-04-13 The Regents Of The University Of California Searching digital information and databases
US7653627B2 (en) * 2005-05-13 2010-01-26 Microsoft Corporation System and method for utilizing the content of an online conversation to select advertising content and/or other relevant information for display

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012512465A (ja) * 2008-12-12 2012-05-31 アティジオ リミテッド ライアビリティ カンパニー 関心領域についての判定情報を使用した勧告の提供
JP2012033167A (ja) * 2010-07-29 2012-02-16 Nhn Corp 文書順位決定システムおよび方法
JP2017508214A (ja) * 2014-03-21 2017-03-23 アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited 検索推奨の提供
JP2018195118A (ja) * 2017-05-18 2018-12-06 日本電信電話株式会社 路面データ収集装置、方法、及びプログラム

Also Published As

Publication number Publication date
US20070208684A1 (en) 2007-09-06

Similar Documents

Publication Publication Date Title
JP2007241451A (ja) 情報収集支援装置
KR101721338B1 (ko) 검색 엔진 및 그의 구현 방법
US9031885B2 (en) Technologies for encouraging search engine switching based on behavior patterns
US9594826B2 (en) Co-selected image classification
US9633140B2 (en) Automated contextual information retrieval based on multi-tiered user modeling and dynamic retrieval strategy
US8886641B2 (en) Incorporating recency in network search using machine learning
US8244720B2 (en) Ranking blog documents
US9171078B2 (en) Automatic recommendation of vertical search engines
JP5454357B2 (ja) 情報処理装置および方法、並びに、プログラム
US20100241647A1 (en) Context-Aware Query Recommendations
US8019758B2 (en) Generation of a blended classification model
US20100262610A1 (en) Identifying Subject Matter Experts
US20100198802A1 (en) System and method for optimizing search objects submitted to a data resource
US8566351B2 (en) System and program for generating boolean search formulas
US20110219299A1 (en) Method and system of providing completion suggestion to a partial linguistic element
KR101659064B1 (ko) 사용자 피드백을 이용하여 컨텐츠에 대한 평가 점수를 산출하기 위한 방법 및 장치
WO2021210992A9 (en) Systems and methods for determining entity attribute representations
JP2018206361A (ja) ユーザ指向トピック選択及びブラウジングのためのシステム及び方法、複数のコンテンツ項目を表示する方法、プログラム、及びコンピューティングデバイス
US11741191B1 (en) Privacy-sensitive training of user interaction prediction models
JP5194731B2 (ja) 文書関連度算出システム、文書関連度算出方法および文書関連度算出プログラム
JP5228584B2 (ja) 興味情報特定システム、興味情報特定方法、および興味情報特定用プログラム
CN114846463A (zh) 可重复查询的识别和发布
JP4853915B2 (ja) 検索システム
JP2006185167A (ja) ファイル検索方法、ファイル検索装置、および、ファイル検索プログラム
JP2010015394A (ja) リンク先提示装置およびコンピュータプログラム

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20071113

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20071115