JP2007025925A - 関連記述提示システム - Google Patents

関連記述提示システム Download PDF

Info

Publication number
JP2007025925A
JP2007025925A JP2005205124A JP2005205124A JP2007025925A JP 2007025925 A JP2007025925 A JP 2007025925A JP 2005205124 A JP2005205124 A JP 2005205124A JP 2005205124 A JP2005205124 A JP 2005205124A JP 2007025925 A JP2007025925 A JP 2007025925A
Authority
JP
Japan
Prior art keywords
user
word
search
history
description
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005205124A
Other languages
English (en)
Inventor
Yasuhide Miura
康秀 三浦
Toshiya Yamada
敏哉 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2005205124A priority Critical patent/JP2007025925A/ja
Publication of JP2007025925A publication Critical patent/JP2007025925A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 閲覧ユーザがシステムを通して閲覧した文書に一度も出現したことがない単語について、閲覧ユーザにとって必要性のある単語を予め自動検索して当該単語に関連する記述を提示する。
【解決手段】 ユーザ端末装置2によって閲覧されている文書中の単語について、未知語判定手段15が、判定対象単語か否かを判定し、検索判定手段16が、閲覧ユーザの関連ユーザを特定して当該関連ユーザにより判定対象単語について所定の条件を満たす検索がなされたかを判定し、検索制御手段22が、関連ユーザにより検索されたと判定された判定対象単語に関連する関連記述を検索手段18により記述管理手段13から検索させ、提示手段17が、当該関連記述を閲覧ユーザに提示するためにユーザ端末装置2へ提供する。
【選択図】 図2

Description

ユーザが閲覧している文書中に出現する単語が所定の条件を満たすときに当該単語に関する記述を検索して当該ユーザに提示する関連記述提示システムに関する。
ユーザは或る単語の意味が分からないときは、辞書を引くことで当該単語の意味の理解を図っている。そこで、ユーザが文書を閲覧しているときに閲覧文書中の単語について予め辞書引きして意味情報を保持しておく自動辞書引きシステムを用いると、閲覧ユーザが単語の意味を所望するときに速やかに当該単語の意味情報を提示することができるため便利である。
ここで、例えば、閲覧文書に出現する全単語について辞書引きして提示することもできるが、閲覧ユーザが所望する単語の意味情報が他の単語の意味情報に埋もれてしまって見つけ難くなるため、閲覧ユーザの邪魔をすることになり好ましくない。
したがって、自動辞書引きシステムにおいては意味情報を提示する単語を如何にして選出するかが重要となる。
そこで、意味情報を提示する単語を選出する方法として、当該閲覧ユーザが過去に検索したことがあるか否かに基づいて辞書引きする単語を選出する方法が提案されている。
例えば、閲覧文書に表出する単語を辞書データベースから辞書引きして基本用語集を作成し、当該基本用語集から閲覧ユーザの語学レベルに応じたクラス属性が付加された単語を抽出してクラス別単語を作成し、当該クラス別単語に対して、過去に閲覧ユーザが手動で辞書引きしたことによって「追加単語」とされた単語が表出単語であれば追加し、又、過去に閲覧ユーザに「削除単語」とされた単語を削除して閲覧ユーザ用の用語集を作成して表示する発明が提案されている(特許文献1参照。)。
特開2002−366018号公報。
上記の従来技術では、自動辞書引きシステムを通して閲覧ユーザが過去に閲覧した文書に出現した単語については、そのときに閲覧ユーザによってなされた検索の履歴を記録しておき、当該履歴に基づいて選出した単語の意味情報を提示している。
しかしながら、閲覧ユーザが自動辞書引きシステムを通して閲覧した文書に一度も出現したことがない単語については、前記履歴がないため処理することができない。そのような単語は閲覧ユーザが知らないと仮定して意味情報を提示することもできるが、閲覧ユーザが知らないとは限らないため閲覧ユーザの邪魔になりかねない。
本発明は、上記従来の事情に鑑みなされたもので、閲覧ユーザが自動辞書引きシステムを通して閲覧した文書に一度も出現したことがない単語について、閲覧ユーザに関連情報を提示する単語を適切に選出することを目的とする。
本発明は、ユーザが閲覧している文書中に出現する出現単語について、閲覧ユーザに関連付けられた他のユーザにより検索されていたときには当該単語に関連する記述を当該閲覧ユーザへ提示する関連記述提示システム、関連記述提示システムを構成する関連記述提示装置、関連記述提示システムを構成するユーザ端末装置、関連記述提示装置をコンピュータにより構成するプログラム、ユーザ端末装置をコンピュータにより構成するプログラム、関連記述提示システムにより実施される方法といった種々な態様で実現される。
例えば、本発明の関連記述提示システムは、記述管理手段と、検索手段と、履歴管理手段と、ユーザ管理手段と、ユーザ識別手段と、未知語判定手段と、検索判定手段と、提示手段と、を備えており、記述管理手段は単語と当該単語に関連する関連記述とを対応付けて管理し、検索手段は閲覧文書中に出現する単語について記述管理手段から関連記述を検索し、履歴管理手段は記述管理手段で管理された単語に関して、ユーザが閲覧した文書中に出現したか否かの出現単語履歴と当該出現単語に対して関連記述の検索がなされたか否かの検索履歴とをユーザ毎に管理し、ユーザ管理手段は複数のユーザ同士を予め関連付けて管理している。そして、ユーザ識別手段が文書を閲覧しているユーザを識別し、未知語判定手段が、閲覧文書中に出現する単語の内で前記記述管理手段により管理されている単語について、出現単語履歴及び検索履歴を参照して、当該閲覧ユーザに出現した出現単語が判定対象単語か否かを判定し、検索判定手段が、未知語判定手段により判定対象単語であると判定されたときに、ユーザ管理手段を参照して当該閲覧ユーザに関連付けられた関連ユーザを特定し、当該関連ユーザにより当該単語について所定の条件を満たす検索がなされたかを出現単語履歴及び検索履歴を参照して判定し、検索判定手段により前記判定対象単語について関連ユーザにより所定の条件を満たす検索がなされたと判定されたときに、提示手段が記述管理手段に管理された当該判定対象単語に対応する関連記述を閲覧ユーザに提示する。
すなわち、本発明は、例えば、閲覧ユーザと同じような検索傾向を有するユーザを関連付けておき、閲覧ユーザに対して出現した単語が当該関連ユーザにより検索されたのであれば閲覧ユーザも同様な検索を行うであろうと想定できるため、閲覧ユーザに当該単語の関連記述を提示するものであり、閲覧ユーザに対して出現した出現単語について、当該閲覧ユーザにとって必要性があるとみなされる単語に対応する関連記述だけを提示する。
本発明の関連記述提示システムは、種々な構成で実現することができる。
例えば、通信回線を介して接続される関連記述提示装置とユーザ端末装置とを備え、関連記述提示装置は、ユーザ識別手段と、記述管理手段と、検索手段と、履歴管理手段と、ユーザ管理手段と、未知語判定手段と、検索判定手段と、提示手段とを備えて、当該ユーザ識別手段は通信回線を介してユーザ端末装置から文書を閲覧するユーザの識別情報を取得し、提示手段は前記関連記述を閲覧ユーザに提示するために通信回線を介して前記ユーザ端末装置に提供するようにしてもよい。
また、例えば、上記のような関連記述提示装置を用いずに、通信回線を介して接続される複数のユーザ端末装置を備え、ユーザ端末装置は、ユーザ識別手段と、記述管理手段と、検索手段と、履歴管理手段と、ユーザ管理手段と、未知語判定手段と、検索判定手段と、提示手段とを備えて、各ユーザ端末装置の履歴管理手段は、自装置の検索手段による検索履歴を自装置の閲覧ユーザと対応付けて検索履歴に管理するとともに、当該検索履歴を当該閲覧ユーザに対応付けて通信回線を介して他のユーザ端末装置へ提供し、また、他のユーザ端末装置から取得した検索履歴を当該他の端末装置の閲覧ユーザに対応付けて検索履歴に管理するようにしてもよい。
記述管理手段が単語に対応付けて管理する関連記述に記録させる内容に応じて、関連記述提示システムを種々の用途に用いることができる。例えば、関連記述に単語の説明を記録管理する記述管理手段を用いると本システムは自動辞書引きシステムとなり、また、例えば、関連記述に単語を含む文書のURLを記録管理する記述管理手段を用いると自動Web検索システムとなる。
ユーザ管理手段は、例えば、同じ職場、同じ技術分野等の、同様な知識、必要性、検索傾向等を有するユーザ同士を関連するユーザとして関連付けて管理している。
このユーザ管理手段を備えることにより、検索判定手段が、閲覧ユーザと同じような検索傾向を有する関連ユーザを特定して当該関連ユーザにより判定対象単語の検索がなされたかを判定でき、関連ユーザにより検索がなされたときは閲覧ユーザも同様な検索を行うと想定できる。
なお、ユーザ管理手段が閲覧ユーザに関連付けるユーザは、ユーザのグループであってもよい。
未知語判定手段が判定対象単語と判定する単語は、典型的には閲覧ユーザに対して初めて出現した単語であるが、これに限らず、例えば、過去に閲覧ユーザに対して出現したことがあるが、その出現からの時間経過が非常に大きい単語、或いは出現回数が非常に少ない単語等の、閲覧ユーザが単語の意味や内容(関連記述)を知っているか不明な単語を含めることが好ましい。
検索手段は、提示手段による関連記述の提示前までに、検索判定手段にて関連ユーザにより検索がなされたと判定された単語についての検索を行っておけばよい。
すなわち、例えば、提示手段が、検索判定手段により関連ユーザにより検索がなされたと判定された単語について検索手段に関連記述の検索を行わせる検索制御手段を備えてもよいし、また、例えば、提示手段が、検索手段により出願単語について予め検索された関連記述の中から、関連ユーザにより検索がなされたと判定された単語に該当する関連記述を閲覧ユーザに提示するために選択する選択制御手段を備えてもよい。
提示手段は、ユーザ端末の備える画面へ関連記述を表示出力させても、ユーザ端末がプリンタ装置を備えるときは当該装置により紙へ関連記述を印字出力させてもよく、閲覧ユーザが把握可能な態様であれば提示方法は問わない。
また、検索判定手段による判定後に関連記述を速やかに提示してもよく、閲覧ユーザによる関連記述の提示指示の入力を受け付けるインターフェースを備えて、閲覧ユーザにより入力された提示指示に応じて関連記述を提示してもよい。
また、出現単語履歴に出現単語の出現回数を含め、検索履歴に当該出現単語に対する検索回数を含めるようにして、検索判定手段の所定の条件が、判定対象単語の関連ユーザにおける出現回数と検索回数との比が予め設定された基準値を上回るときに検索がなされたと判定するものでもよい。
このように出現回数に対する検索回数の比(すなわち、検索頻度)を用いて判定を行うことにより、検索の必要性を正確に判定することができる。
基準値は、関連記述提示システムに固有に設定されていてもよく、各閲覧ユーザが任意に設定できるようにしてもよく、設定方法は問わない。
また、検索履歴に出現単語に対して検索がなされた時間情報を含ませ、検索判定手段の所定の条件として、文書を閲覧している現在時間から所定の時間内に関連ユーザにより検索されていたときに検索がなされたと判定するものでもよい。
これにより、例えば、閲覧ユーザが5年前に検索していたことを以って検索がなされたとすることは適切な判定とはいえず、参照対象とする検索履歴を現在時間から所定の時間内(例えば、3月)に絞り込むことで不適当な検索履歴を対象外とすることができる。
所定の時間は、関連記述提示システムに固有に設定されていてもよく、各閲覧ユーザが任意に設定できるようにしてもよく、設定方法は問わない。
また、文書は予め定められた幾つかの分類のいずれかに属すようにしてもよく、ユーザ管理手段は各分類毎に複数のユーザ同士を関連付けて管理し、検索判定手段はユーザ管理手段を参照して閲覧文書の属する分類において閲覧ユーザに関連付けられた関連ユーザを特定するものでもよい。
これにより、検索判定手段は閲覧文書の分類毎に適切な関連ユーザが特定できるため、より適切な検索判定を行うことができる。
また、閲覧文書中に出現する単語の内で記述管理手段により管理されている単語を出現単語履歴に追加して管理させ、検索手段により関連記述の検索が行われた単語を検索履歴に追加して管理させる履歴更新手段を更に備えてもよい。
これにより、ユーザが文書を閲覧する度に出現単語履歴と検索履歴とに新規な単語を随時追加して更新されるため、検索判定手段が更新された履歴に基づいて適切な検索判定を行うことができる。
また、ユーザ同士の関連付けを職場等に基づいて行う他、ユーザの検索傾向に基づいて関連付けるようにしてもよい。例えば、出現単語に対する検索回数が含まれた検索履歴を参照して、いずれかのユーザに検索されたことがある単語を次元とし、各次元の要素を対応する前記単語の各ユーザによる検索回数として作成した特徴ベクトルをユーザ毎に関連付けてユーザ管理手段に管理させるユーザ関連更新手段を更に備え、閲覧ユーザの特徴ベクトルとの余弦が所定の範囲内である特徴ベクトルが関連付けられたユーザを関連ユーザとして検索判定を行ってもよい。
これにより、検索履歴が更新されるに応じて特徴ベクトルを更新してユーザ管理手段に管理させることで、最新の検索傾向に基づいて類似するユーザ同士が関連付けられるため、検索判定手段は適切な検索判定を行うことができる。
ここで、単語を次元とする特徴ベクトルをそのまま用いると、例えば、10万単語次元の特徴ベクトルのように非常に大きな次元となってしまうことがあるが当該特徴ベクトルには不要な情報も多く含まれているため、公知技術である特異値分解、単語クラスタリング、主成分分析等の次元圧縮処理を行って特徴ベクトルの次元数を少なくしておくことが望ましい。
本発明によると、閲覧ユーザが関連記述提示システムを通して閲覧した文書に出現した単語について、閲覧ユーザと類似性を有する関連ユーザにより検索がなされたと判定されたことに応じて当該単語に対応する関連記述の提示を行うため、閲覧ユーザの必要性に沿った提示を行うことができる。
発明を一実施例に基づいて具体的に説明する。
図1には本発明の一例に係る関連記述提示システムを示してあり、関連記述提示装置1と複数のユーザ端末装置2とがネットワーク3を介して接続されている。
関連記述提示装置1は、ユーザ端末装置2によって閲覧されている文書中の所定の条件を満たす単語について、当該単語に関連する関連記述を検索してユーザ端末装置2に提供する装置である。
図2には関連記述提示装置1の備える機能手段と、ユーザ端末装置2の備える機能手段とが示してある。
関連記述提示装置1は、ネットワーク通信を行うための通信手段10、ユーザが過去に閲覧した文書に出現した単語に関する履歴を管理する履歴管理手段11、複数のユーザ同士を予め関連付けて管理するユーザ管理手段12、単語と当該単語に関連する関連記述とを対応付けて管理する記述管理手段13、ユーザ端末装置2によって文書を閲覧しているユーザを識別するユーザ識別手段14、ユーザ端末装置2によって閲覧されている文書中の出現単語が判定対象単語か否かを判定する未知語判定手段15、閲覧ユーザの関連ユーザを特定して当該関連ユーザにより判定対象単語について所定の条件を満たす検索がなされたかを判定する検索判定手段16、検索がなされたと判定された判定対象単語に対応する関連記述を閲覧ユーザに提示するためにネットワーク3を介してユーザ端末装置2に提供する提示手段17、単語に関連する関連記述を記述管理手段13から検索する検索手段18、閲覧ユーザの操作に応じた履歴を履歴管理手段11に追加して管理させる履歴更新手段20、履歴管理手段11に基づいてユーザ同士を関連付けしてユーザ管理手段12に管理させるユーザ関連更新手段21を備えている。
また、ユーザ端末装置2は、ネットワーク通信を行うための通信手段30、関連記述提示装置2からネットワーク3を介して取得した関連記述を表示する画面31を備えている。
本例においては、関連記述提示装置1及びユーザ端末装置2の本発明に係る機能手段は、コンピュータが本発明に係るプログラムを実行することによりを構成しているが、それぞれを専用の回路機能として構成するようにしてもよい。
記述管理手段13に単語と当該単語の説明とを対応付けて管理させることで、関連記述提示システムを自動辞書引きシステムとして用いる場合について説明する。
図3に本例における記述管理手段13を示してあり、本例では、複数の「単語」と当該単語の関連記述である「説明」とが記録されており、例えば、単語“budget”と関連記述としての説明“経費...”とが対応付けられており、単語“budget”について辞書引きすると説明“経費...”を得ることができる。
また、図3に本例における履歴管理手段11を示してあり、本例では、ユーザを識別する「ユーザID」、閲覧文書に出現する単語である「辞書引き単語」、辞書引きされたか否かを示す「辞書引き属性」(1:辞書引きされた、0:辞書引きされなかった)、辞書引きされた「日時」(辞書引きされなかったときは閲覧文書を閉じた日時)が記録されており、各ユーザに対して過去に出現した全単語についての履歴が記録されている。
図3に示してある履歴管理手段11によると、例えば、ユーザID“1”のユーザが閲覧文書中の単語“budget”を“2005/3/3 17:30”に辞書引きし、ユーザID“1”のユーザが閲覧文書中の単語“vector”を辞書引きせずに“2005/3/4 10:30”に閲覧文書を閉じたことが分かる。
また、図3に本例におけるユーザ管理手段12を示してあり、本例では、複数のユーザを識別する「ユーザID」、ユーザIDに対応する「ユーザ名」、関連するユーザを特定するために用いる「特徴ベクトル」が記録される。
図3に示してあるユーザ管理手段12によると、例えば、ユーザID“1”にユーザ名“Miura”と特徴ベクトル“[2,1,0,0,5,12,・・・]”とが対応付けて記録され、当該特徴ベクトルとの余弦が所定の範囲内となる特徴ベクトルを有する他のユーザが関連ユーザとして設定される。
ユーザ識別手段14は、ユーザ端末装置2が文書を所定のアプリケーション(例えば、Webブラウザ、ワードプロセッサー、メーラー等)を用いて画面31に表示したことに応じて、ユーザ端末装置2から送信されたユーザ識別情報(例えば、ユーザIDやユーザ名)に基づいてユーザ管理手段12を参照して、閲覧ユーザを識別してユーザIDを取得する。
ユーザ識別情報は、ユーザ端末装置2を操作しているユーザを特定できればよく、例えば、ユーザ端末装置2毎に割り当てられていても、ユーザが本システムを利用するときに入力してもよい。
未知語判定手段15は、閲覧ユーザが閲覧している文書に出現した出現単語が判定対象単語か否かを判定する。
本例の未知語判定手段15は、閲覧ユーザに対して初めて出現した単語を判定対象単語と判定するものであり、ユーザ端末装置2からユーザ識別情報とともに閲覧文書データを取得すると、当該閲覧文書データに対して形態素解析等を施すことにより単語を抽出する。そして、抽出した単語のうちの記述管理手段13に記録されている単語を選出し、選出した単語について閲覧ユーザによる履歴が履歴管理手段11に存在しないかを判定する。存在しないと判定された単語が閲覧ユーザに対して初めて出現した単語であり判定対象単語である。
なお、閲覧ユーザに対して初めて出現した単語のみを判定対象単語とするのに限らず、例えば、閲覧ユーザに対する出現回数が少ない単語や前回の出現からの時間経過が大きいために忘却している可能性のある単語のように閲覧ユーザが知っているか不明な単語や、閲覧ユーザに対する出現頻度は少ないが類似する単語が多い等の理由で頻繁に検索されている単語も閲覧ユーザが知らないとみなして判定対象単語としてもよい。この場合には、例えば、履歴管理手段11に各単語の出現回数や出現した時間情報を付加した履歴を記録しておき、出現単語について閲覧ユーザに過去に所定回数以下しか出現していない場合や所定期間以上出現していない場合に判定対象単語と判定する方法や、出現単語について閲覧ユーザによる検索が短期間(所定期間以内)で連続しており且つ閲覧ユーザに対する過去の出現回数も所定回数以下の場合に判定対象単語と判定する方法等を用いることができる。
また、本例ではユーザ端末装置2から閲覧文書データを取得して判定処理を行っているが、画面31に表示される閲覧文書が関連記述提示装置1を介してユーザ端末装置2に提供されるものである場合は、未知語判定手段15はユーザ端末装置2から当該閲覧文書についての情報を得ることなく処理可能である。
検索判定手段16は、未知語判定手段15によって判定対象単語であると判定されたことに応じて、ユーザ管理手段12を参照して閲覧ユーザの関連ユーザを特定するとともに、履歴管理手段11を参照して判定対象単語について当該関連ユーザにより後述するように所定の条件を満たす辞書引きがなされたかを判定し、辞書引きがなされたと判定した判定対象単語には辞書引きラベルを付与する。
なお、上記の例では、関連ユーザを判定し、判定された関連ユーザが判定対象単語について過去に辞書引きしたかを判定する手順としているが、この手順を逆としてもよい。更に、図4に基づいて後述するように、出現単語の有無に基づいて関連ユーザを絞り込む処理を加えてもよい。
なお、本例では、判定対象単語の履歴が記録されたユーザが存在しない場合は、判定対象単語に辞書引きラベルを常に付与するようにしているが、このような場合は辞書引きラベルを常に付与しないようにしてもよい。
提示手段17は、検索判定手段16によって辞書引きラベルが付与された単語について記述管理手段13に管理された説明を、閲覧ユーザに提示するためにネットワーク3を介してユーザ端末装置2に提供する。
本例の提示手段17は検索制御手段22を備えており、検索制御手段22は、辞書引きラベルが付与された単語について、検索手段18により記述管理手段13を参照して当該単語に対応する説明を取得させる。すなわち、検索判定手段16によって絞り込まれた単語のみが辞書引きされるため、効率的な自動辞書引き処理を行える。
ユーザ端末装置2は、関連記述提示装置1からネットワーク3を介して閲覧文書中の出現単語に対応する説明を取得すると、当該説明を画面31に表示出力する。説明の表示出力は、当該説明の受信後に速やかに行ってもよいし、図4に基づいて後述するように閲覧ユーザによる提示指示を待って表示出力するようにしてもよい。なお、ユーザ端末装置2がプリンタ装置を備えるときは当該プリンタ装置により紙へ印字出力してもよい。
ここで、検索判定手段16における所定の条件としては、種々な条件を用いることができ、本例における所定の条件としては、現在時間から所定の時間内における出現回数と辞書引き回数との比が予め設定された基準値を上回るときに辞書引きがなされたと判定する。
出現回数は、履歴管理手段11に記録された関連ユーザによる判定対象単語の出現履歴(すなわち、図3の「辞書引き単語」に判定対象単語がある履歴)の個数の合計より算出し、辞書引き回数は、判定対象単語の履歴のうちの辞書引きされた履歴(辞書引き属性:1)の個数の合計より算出している。
例えば、図5に示してある履歴管理手段11が記録する履歴を例に説明すると、判定対象単語“budget”が関連ユーザ“1”によって所定の時間内(例えば、1週間内)に3回出現しており、うち2回は辞書引きされており(辞書引き属性:1)、1回は辞書引きされていない(辞書引き属性:0)ため、所定の時間内における出現回数と辞書引き回数との比は、2回(辞書引き回数)/3回(出現回数)=約0.67となり、基準値(例えば、0.5)を上回るため、関連ユーザにより辞書引きがなされたと判定する。
なお、例えば、検索回数が所定回数を上回るときに検索がなされたと判定することも考えられるが、一度でも所定回数を上回ると、その後は常に検索がなされたと判定されてしまうが、出現回数と検索回数との比が基準値を上回るときに検索がなされたとすることで、上記のような弊害を防ぐことができる。
また、対象とする履歴を所定の時間内の履歴に絞り込むことで不適当な履歴を対象外とすることができ、より適切な判定ができるようにしている。
また、本例においては、「現在時間から所定の時間内に」と「出現回数と辞書引き回数との比が予め設定された基準値を上回るとき」といった2つの条件を組み合わせて用いているが、それぞれを別々に用いてもよい。
また、他の条件を用いてもよく、例えば、関連ユーザによる判定対象単語の過去10回前までの辞書引きしたか否かの履歴を学習器SVMにより学習し、関連ユーザに次回判定対象単語が出現したとき関連ユーザが辞書引きするか否かを推定させ、その推定結果を判定に用いてもよいし、例えば、3人の関連ユーザの最新の履歴を参照して2人以上が辞書引きしていたときは辞書引きがなされたと判定する多数決方式としてもよい。
図4には、本例に係る自動辞書引きの処理フローを示してある。
ユーザがユーザ端末装置2の画面31に文書を表示させると(ステップS1)、関連記述提示装置1がユーザ端末装置2から閲覧している文書データ及び閲覧ユーザIDを取得して、ユーザ識別手段14がユーザ端末装置2を操作している閲覧ユーザを特定する(ステップS2)。また、未知語判定手段15が、閲覧文書データからテキストを抽出し(ステップS3)、当該テキストに対して形態素解析等を用いて単語を抽出する(ステップS4)。
そして、前記抽出された各単語について以下の辞書引き判定処理を行う。
未知語判定手段15は、前記抽出した単語の閲覧ユーザによる履歴が履歴管理手段11に存在するか判定する(ステップS6)。履歴が存在しないときは当該ユーザにとって初めて出現した単語であるので、検索判定手段16が、履歴管理手段11を参照して(ステップS7)、履歴管理手段11に当該出現単語の履歴がある(すなわち、図3の「辞書引き単語」にある)ユーザが存在するか判定し(ステップS8)、1人以上のユーザが見つかったときは、そのユーザの中から関連ユーザをユーザ管理手段12を参照して特定し(ステップS9)、特定された関連ユーザについて履歴管理手段11を参照して所定の条件を満たす辞書引きがなされたかを判定して、辞書引きがなされたことがあると判定されたときには当該単語に辞書引き処理を行うための辞書引きラベルを付与する(ステップS10)。
辞書引き判定処理が行われていない単語が残っているか判定し(ステップS11)、残っているときは、再びステップS6から繰り返し、ステップS4にて抽出された全ての単語について辞書引き判定処理を行う。
なお、ステップS6において、辞書引き判定処理を行っている単語の閲覧ユーザによる履歴が履歴管理手段11に存在するときは、閲覧ユーザについて履歴管理手段11を参照して所定の条件を満たす辞書引きがなされたかを判定して、辞書引きがされたことがあると判定されたときには当該単語に辞書引きラベルを付与する(ステップS10)。すなわち、本例では、閲覧ユーザに対して再度の辞書引きを行う。
また、ステップS8において、辞書引き判定処理を行っている単語の履歴が履歴管理手段11に存在するユーザが見つからなかったときは、当該単語に辞書引きラベルを付与する(ステップS12)。すなわち、本例では、この場合においても閲覧ユーザに対して辞書引きを行う。
ステップS11において、辞書引き判定処理が行われていない単語が残っていないと判定されたときは、辞書引きラベルが付与された単語について提示手段17が備える検索制御手段22により検索手段18に辞書引きを指示し、検索手段18が当該単語について記述管理手段13を参照して対応する説明を取得する(ステップS13)。そして、提示手段32が、当該説明へのリンクを付加した閲覧文書を作成して(ステップS14)、ネットワーク3を介してユーザ端末装置2に提供する。
ユーザ端末装置2は、リンクが付加された閲覧文書を関連記述提示装置1から取得すると画面31に表示し(ステップS15)、閲覧ユーザが当該文書中のリンクをクリックしたことに応じて当該リンクに対応する説明を表示する。
このような自動辞書引き処理を行うことによって、閲覧ユーザが閲覧する文書中に含まれる単語について、閲覧ユーザの関連ユーザにより辞書引きがなされた単語を予め辞書引きしておいて閲覧ユーザに提示することができる。
したがって、閲覧ユーザが閲覧文書中の単語に対応する説明を所望するときに、速やかに当該単語に対応する説明を提示できるため、閲覧ユーザは効率よく文書内容を把握できるようになる。
ここで、予め辞書引きしておく単語を正しく選出するためには、履歴管理手段11が管理する履歴を常に新しい状態としておくことが好ましい。
そこで、本例の関連記述提示装置1は、閲覧ユーザによる検索の履歴を履歴管理手段11に記録する履歴更新手段20を備えている。
履歴更新手段20は、未知語判定手段15により抽出された判定対象単語、すなわち閲覧ユーザにとっての未知語、および閲覧ユーザからの指示に基づいて検索手段18が辞書引き処理を行った単語を履歴管理手段11に記録するものである。
図6には、履歴更新手段20による履歴更新の処理フローを示してある。
ユーザ端末装置2の画面31に表示されている閲覧文書について(ステップS21)、履歴更新手段20がイベントの発生を待機し(ステップS22)、閲覧文書中の単語に対して上記のようにシステムによる自動辞書引き処理がなされた場合には、当該辞書引きされた単語を検出し(ステップS23)、当該単語を辞書引きされた(辞書引き属性:1)とする自動辞書引きの履歴を履歴管理手段11に記録する(ステップS26)。
閲覧文書が閉じられていないとき(ステップS27)は、閲覧ユーザによる操作イベントが発生するまで再び待機する(ステップS22)。
ステップS22において、履歴更新手段20が、閲覧ユーザからの指示に基づいて検索手段18が辞書引き処理を行った場合には、当該辞書引きされた単語を検出し(ステップS24)、当該単語を辞書引きされた(辞書引き属性:1)とする手動辞書引きの履歴を履歴管理手段11に記録する(ステップS26)。
また、ステップS22において、閲覧ユーザが閲覧文書を閉じた場合には、記述管理手段13に登録された単語のうちの履歴管理手段11に未だ登録されていない単語を検出し、(ステップS25)、辞書引きされなかった(辞書引き属性:0)として履歴管理手段11に記録する(ステップS26)。
その後、閲覧文書が閉じられたことに応じて(ステップS27)、履歴更新処理を終了する(ステップS28)。
上記の例では、検索手段18により辞書引きがなされたことにより「辞書引き属性」を“1”として、当該単語が辞書引きされたものとして履歴管理手段11に管理したが、本発明では、辞書引きされた単語が実際に閲覧ユーザに提示されたことを条件に辞書引きされた単語として履歴管理手段11に記録管理するようにしてもよい。例えば、ユーザの指示に応じて辞書引き結果を閲覧ユーザに提示するようにして、その提示とともに「辞書引き属性」を“1”として履歴管理手段11に記録管理する。
上記のように、検索手段18により辞書引きされなかった単語について、ユーザ端末装置2から入力されたユーザ指示を検索手段18に入力して辞書引き(手動辞書引き)し、ユーザ端末装置2により辞書引き結果を閲覧ユーザに提示するようにしてもよい。
このような履歴更新手段20を備えることにより、閲覧ユーザの関連ユーザが本システムを通して文書を閲覧するときも履歴が更新されるため、ある時点においては関連ユーザに対しても出現したことがなかった単語であっても、その後における関連ユーザによる文書閲覧において出現した場合に辞書引きした(或いは、辞書引きしなかった)履歴に基づいて自動辞書引きするか否かを判定できるようになる。
したがって、本システムを通して文書を閲覧して辞書引きを行う毎に自動辞書引きの判定性能が向上し、閲覧ユーザが所望する単語の説明を速やかに提示できるため、閲覧ユーザは快適に文書を閲覧することができるようになる。
ここで、本例の関連記述提示装置1は、履歴管理手段11の履歴を参照して、ユーザに検索されたことがある単語について各ユーザが辞書引きした回数に基づく特徴ベクトルを作成してユーザ管理手段12に更新するユーザ関連更新手段21を備えている。
図8には、ユーザ関連更新手段21によって作成された特徴ベクトルの一例が示してある。図示の例では、あるユーザによって単語“政府”を5回、単語“国際”を2回辞書引きされた(辞書引き属性:1)ことが分かる。
この特徴ベクトルはユーザの辞書引き傾向を特徴付けているが、ユーザに辞書引きされたことがある単語を次元としたベクトルであるため、場合によっては非常に大きな次元のベクトルとなってしまう。辞書引きの傾向を特徴付けていない単語(例えば、全ユーザが辞書引きした単語)であっても表現されているため無駄な次元を多数含んだ特徴ベクトルにとなってしまうで、辞書引きの傾向を特徴付けていない単語の次元を削除等して特徴ベクトルの次元数を小さくしておくことが望ましい。
本例では、図8に示した特徴ベクトルに対して特異値分解して次元圧縮しており、例えば、図9に示すようにユーザの辞書引き傾向を特徴ベクトル“[1.5、−0.6,2.1,・・・]”として表現することができる。
すなわち、特徴ベクトルの各次元値はそれぞれ特異値分解により近似された辞書引きされた単語の辞書引き回数を示しており、したがって、ユーザの辞書引き傾向を表している。なお、各ユーザの特徴ベクトルの各次元は互いに同じ単語であり、これによって、同じ単語群について各ユーザがどのような傾向で辞書引きしたかが表現されている。
そして、特徴ベクトル同士が所定の類似範囲にあるか否かは、これら特徴ベクトルが所定の余弦値の範囲にあるか否かで捉えることができるので、各ユーザの特徴を特徴ベクトルで表現する場合には、検索判定手段16は特徴ベクトル同士が所定の余弦値範囲内にあるユーザ同士を関連関係があるとして判定することができる。
図7には、本例に係るユーザ関連更新の処理フローを示してある。
ユーザ関連更新手段21が起動されると(ステップS31)、ユーザ関連更新手段21は、ユーザ管理手段12を参照してユーザを1人ずつ選択してユーザIDを取得する(ステップS32)。
そして、ユーザ関連更新手段21は、ユーザIDに対応する履歴を履歴管理手段11から取得し(ステップS33)、辞書引きされた(辞書引き属性:1)履歴の個数(すなわち、辞書引き回数)に基づいた特徴ベクトルを作成し(ステップS34)、作成された特徴ベクトルを特異値分解して次元圧縮を施し(ステップS35)、次元圧縮された特徴ベクトルをユーザ管理手段12のユーザIDに関連付けて記録する(ステップS37)。
ユーザ関連更新手段21は、ユーザ管理手段12の管理する全ユーザに対して処理を行ったかを調べ(ステップS38)、まだ処理を行っていないユーザが残っていれば、そのユーザのユーザIDを取得して(ステップS39)、ユーザ関連更新処理を行う(ステップS33)。ステップS38において、まだ処理を行っていないユーザが残っていなければ終了する(ステップS40)。
なお、履歴管理手段11の履歴のうち辞書引きされた履歴に基づいて特徴ベクトルを作成する例を用いて説明したが、辞書引きされなかった(辞書引き属性:0)履歴に基づいて特徴ベクトルを作成してもよい。すなわち、辞書引きされなかった単語もユーザの辞書引き傾向を特徴付けているといえるため、辞書引きされなかった履歴に基づく特徴ベクトルが類似するユーザを関連ユーザとすることができる。
ここで、閲覧ユーザに辞書引き傾向が似ているユーザが閲覧する文書の分類毎に異なることがある。例えば、ユーザAとユーザBとは化学系の分類の文書における辞書引き傾向は似ているがコンピュータ系の分類においては似ておらず、ユーザAとユーザCとは化学系の分類においては似ていないがコンピュータ系の分類においては似ている場合のように、閲覧する文書の分類毎に辞書引き傾向が似ているユーザが異なる場合は、閲覧ユーザが閲覧する文書の属する分類に応じて適切な関連ユーザを特定できることが望ましい。
そこで、ユーザ管理手段12は、文書の属する分類を識別する文書クラスタID(例えば、1:レポート、2:新聞、3:特許、等)毎にユーザ同士を関連付けておけばよく、文書クラスタID毎に特徴ベクトルを作成して各ユーザに対応付けてユーザ関連更新手段21に記録すればよい。
上記のように文書群をクラスタ化して管理する場合には、検索判定手段16は、ユーザ管理手段12を参照して閲覧文書の属する分類における関連ユーザを特定することができるようになり、当該関連ユーザに辞書引きがなされたかを判定することで、より適切な自動辞書引きを行えるようになる。
なお、文書クラスタIDは閲覧ユーザが文書を閲覧するときに指定入力してもよいし、文書に応じた文書クラスタIDを特定するクラスタリング装置を用意して用いてもよい。
上記の例では、辞書引き傾向を示す特徴ベクトルに基づいてユーザ同士を関連付けてユーザ管理手段12に設定しているが、他の方法によってユーザ同士を関連付けてもよい。例えば、各ユーザが所属する部署の識別情報をユーザ管理手段12に記録して当該識別情報が一致するユーザ同士を関連ユーザと設定してもよく、各ユーザが有する知識や必要性等が共通するユーザ同士を関連付けるようにしてもよい。
図2に示した実施例では、提示手段17の検索制御手段22で辞書引きラベルが付与された単語のみを検索手段18により辞書引き処理させたが、提示手段17に閲覧ユーザに提示する説明を選択する選択制御手段23を備えた構成としてもよい。
例えば、検索判定手段16による判定前に閲覧文書中の全ての出現単語についてバックグラウンドで検索手段18に辞書引き処理を行わせておき、選択制御手段23が、検索判定手段16にて辞書引きラベルが付与された単語に該当する説明のみを選び出してユーザ端末装置2へ提供するようにしてもよい。これにより、検索判定手段16による判定後に提示手段17によって速やかに単語の説明を提示できるようになる。
なお、上記のように予め全ての出現単語を辞書引きしておく場合には、辞書引きされた単語の説明を閲覧ユーザに提示されたことを条件に、辞書引きされた単語として履歴管理手段11に記録管理すればよい。
これまで、記述管理手段13に単語と当該単語の説明とを対応付けて管理させることで、関連記述提示システムを自動辞書引きシステムとして用いる場合について説明してきたが、記述管理手段13に単語と当該単語を含む文書のURLを管理させることで関連記述提示システムを自動Web検索システムとして動作させることもできる。
このときは、履歴管理手段11は、閲覧ユーザが閲覧した文書に出現する単語で記述管理手段13に管理される単語の出現単語履歴と、当該出現単語を含む文書の検索がなされたか否かの検索履歴とをユーザ毎に管理する。
未知語判定手段15は、ユーザ端末装置2によって画面31に表示された閲覧文書について形態素解析等をして得た単語のうちで記述管理手段13に管理されている単語に関して、ユーザ識別手段14により識別された閲覧ユーザの検索履歴が履歴管理手段11に存在するか否かを判定し、履歴管理手段11に存在しない単語を判定対象単語と判定する。
そして、検索判定手段16は、未知語判定手段15によって判定対象単語と判定された各単語について、ユーザ管理手段12を参照して閲覧ユーザの関連ユーザを特定するとともに、履歴管理手段11を参照して判定対象単語について関連ユーザにより所定の条件を満たす検索がなされたかを判定し、検索がなされたと判定された判定対象単語には辞書引きラベルを付与する。
提示手段17は、検索判定手段16によって辞書引きラベルが付与された単語について検索制御手段22により検索手段18に検索を指示して記述管理手段13から当該単語を含む文書のURLを取得する。そして、閲覧ユーザに提示するためにネットワーク3を介してユーザ端末装置2へ提供する。
ユーザ端末装置2は、当該URLを取得すると画面31に表示出力し、或いは、ユーザ端末装置2が備えるプリンタ装置により印字出力する。
これにより、閲覧ユーザが閲覧する文書中に含まれる単語について、閲覧ユーザの関連ユーザにより検索がなされた単語を予め検索しておいて閲覧ユーザに提示することができるようになる。
したがって、閲覧ユーザが閲覧文書中の単語を含む文書の閲覧を所望するときに速やかに単語を含む文書のURLを提示できるため、閲覧ユーザは当該URLの文書を参考にできるため閲覧文書内容の理解をし易くなる。
これまで、関連記述提示装置1とユーザ端末装置2とが図2に示したような機能手段を備えた例に基づいて説明を行ってきたが、本発明における関連記述提示システムは他の態様によっても実施することができる。
上記の例では、関連記述提示装置1が記述管理手段13を備えているが、例えば、記述管理手段13をネットワーク3に接続された他のサーバが備えたデータベースに構成してもよいし、Web上のオンライン検索サービスを利用するものであってもよい。
また、例えば、関連記述提示装置1が通信手段10、履歴管理手段11、ユーザ管理手段12、記述管理手段13を備え、ユーザ端末装置が通信手段30、ユーザ識別手段14、未知語判定手段15、検索判定手段16、提示手段17、検索手段18、画面31を備え、提示手段17が検索制御手段22を備えた態様としてもよい。
このときは、ユーザ識別手段14が文書を閲覧しているユーザを識別し、未知語判定手段15が、ネットワーク3を介して記述管理手段13と履歴管理手段11とを参照して、閲覧文書中に出現する単語の内で記述管理手段13により管理されている単語について、当該閲覧ユーザに対して初めて出現した判定対象単語を判定し、検索判定手段16が、ネットワーク3を介してユーザ管理手段12を参照して、閲覧ユーザに関連付けられた関連ユーザを特定して、当該関連ユーザにより当該単語について所定の条件を満たす検索がなされたかを履歴管理手段11を参照して判定し、当該関連ユーザにより検索されたと判定された単語について検索制御手段22が検索手段18に検索を行わせる。検索手段18は、ネットワーク3を介して記述管理手段13から当該単語に関連する関連記述を取得し、提示手段17は画面31に当該取得した関連記述を表示出力する。
なお、関連記述提示装置1とユーザ端末装置2とが備える各機能手段の配置は、上記説明した例に限られるものではなく、ネットワーク3を介して各機能手段が必要な情報のやりとりを行うことによって、その他の種々な態様においても本発明を実施することができる。
また、例えば、図10に示すように、関連記述提示装置1を用いずに複数のユーザ端末装置2間で本発明を実施することも可能である。
このときは、複数のユーザ端末装置2をネットワーク3を介して接続し、ユーザ端末装置2は、履歴管理手段11、ユーザ管理手段12、記述管理手段13、ユーザ識別手段14、未知語判定手段15、検索判定手段16、提示手段17、検索手段18、履歴更新手段20、通信手段30、画面31を備える。
ここで、本例の履歴更新手段20は、上記の例で説明した自装置内での更新処理機能に加えて、自装置の検索手段18による出現単語履歴及び検索履歴を自装置の閲覧ユーザと対応付けて履歴管理手段11に管理させるとともに、当該出現単語履歴及び検索履歴を当該閲覧ユーザに対応付けて通信手段30を介して他のユーザ端末装置2へ提供し、また、他のユーザ端末装置2から通信手段30を介して取得した出現単語履歴及び検索履歴を当該他のユーザ端末装置2の閲覧ユーザに対応付けて履歴管理手段11に管理させる。
これにより、各ユーザ端末装置2の履歴管理手段11が管理する出現単語履歴及び検索履歴と、他のユーザ端末装置2の履歴管理手段11が管理する出現単語履歴及び検索履歴との同期をとることができるため、適切な検索判定を継続して行うことができる。
図10に示すシステム構成によると、ユーザ端末装置2により閲覧されている文書について、当該ユーザ端末装置2による処理によって、当該文書中に含まれている未知語について関連ユーザが辞書引きを行っているかの判定を未知語判定手段15及び検索判定手段16が自己の履歴管理手段11及びユーザ管理手段12に基づいて行い、この判定に応じて提示手段17の備える検索制御手段22により検索手段18に自己の記述管理手段13から対応する単語の関連記述を検索させて画面31に提示する。そして、この辞書引き処理の出現単語履歴及び検索履歴は履歴更新手段20により通信手段30を介して他のユーザ端末装置2へ送信され、複数のユーザ端末装置2が自己の履歴管理手段11及びユーザ管理手段12に保持する情報が同期される。
本発明の一実施例に係る関連記述提示システムの構成を示す図である。 本発明の一実施例に係る関連記述提示装置及びユーザ端末装置の機能構成を示す図である。 本発明の一実施例に係る関連記述提示に用いるデータを説明する図である。 本発明の一実施例に係る自動辞書引きの処理手順を説明する図である。 本発明の一実施例に係る辞書引き判定を説明する図である。 本発明の一実施例に係る履歴更新の処理手順を説明する図である。 本発明の一実施例に係るユーザ関連更新の処理手順を説明する図である 本発明の一実施例に係る特徴ベクトルを説明する図である。 本発明の一実施例に係る特徴ベクトルを説明する図である。 本発明の一実施例に係るユーザ端末装置の機能構成を示す図である。
符号の説明
1:関連記述提示装置、 2:ユーザ端末装置、
11:履歴管理手段、 12:ユーザ管理手段、
13:記述管理手段、 14:ユーザ識別手段、
15:未知語判定手段、 16:検索判定手段、
17:提示手段、 18:検索手段、
20:履歴更新手段、 21:ユーザ関連更新手段

Claims (15)

  1. ユーザが閲覧している文書中に出現する単語について、当該単語に関連する記述を当該閲覧ユーザへ提示する関連記述提示システムであって、
    文書を閲覧しているユーザを識別するユーザ識別手段と、
    単語と当該単語に関連する関連記述とを対応付けて管理する記述管理手段と、
    閲覧文書中に出現する単語について記述管理手段から関連記述を検索する検索手段と、
    記述管理手段で管理された単語に関して、ユーザが閲覧した文書中に出現したか否かの出現単語履歴と当該出現単語に対して関連記述の検索がなされたか否かの検索履歴とをユーザ毎に管理する履歴管理手段と、
    複数のユーザ同士を予め関連付けて管理するユーザ管理手段と、
    閲覧文書中に出現する単語の内で記述管理手段により管理されている単語について、出現単語履歴及び検索履歴を参照して、当該閲覧ユーザに対して出現した当該出現単語が判定対象単語か否かを判定する未知語判定手段と、
    未知語判定手段により判定対象単語であると判定されたことに応じて、ユーザ管理手段を参照して当該閲覧ユーザに関連付けられた関連ユーザを特定するとともに、当該関連ユーザにより当該単語について所定の条件を満たす検索がなされたかを出現単語履歴及び検索履歴を参照して判定する検索判定手段と、
    検索判定手段により前記判定対象単語について関連ユーザにより前記所定の条件を満たす検索がなされたと判定されたときに、前記記述管理手段に管理された当該判定対象単語に対応する関連記述を閲覧ユーザに提示する提示手段と、
    を備えたことを特徴とする関連記述提示システム。
  2. 請求項1に記載の関連記述提示システムにおいて、
    通信回線を介して接続される関連記述提示装置とユーザ端末装置とを備え、
    前記関連記述提示装置は、前記ユーザ識別手段と、前記記述管理手段と、前記検索手段と、前記履歴管理手段と、前記ユーザ管理手段と、前記未知語判定手段と、前記検索判定手段と、前記提示手段とを備え、
    当該ユーザ識別手段は、通信回線を介して前記ユーザ端末装置から文書を閲覧するユーザの識別情報を取得し、
    当該提示手段は、前記関連記述を閲覧ユーザに提示するために通信回線を介して前記ユーザ端末装置に提供することを特徴とする関連記述提示システム。
  3. 請求項1に記載の関連記述提示システムにおいて、
    通信回線を介して接続される複数のユーザ端末装置を備え、
    前記ユーザ端末装置は、前記ユーザ識別手段と、前記記述管理手段と、前記検索手段と、前記履歴管理手段と、前記ユーザ管理手段と、前記未知語判定手段と、前記検索判定手段と、前記提示手段とを備え、
    各ユーザ端末装置の履歴管理手段は、自装置の検索手段による検索履歴を自装置の閲覧ユーザと対応付けて検索履歴に管理するとともに、当該検索履歴を当該閲覧ユーザに対応付けて通信回線を介して他のユーザ端末装置へ提供し、また、他のユーザ端末装置から取得した検索履歴を当該他の端末装置の閲覧ユーザに対応付けて検索履歴に管理することを特徴とする関連記述提示システム。
  4. 請求項1乃至請求項3のいずれか1項に記載の関連記述提示システムにおいて、
    前記提示手段は、前記検索判定手段による判定結果に応じて、前記判定対象単語について前記検索手段に関連記述の検索を行わせる検索制御手段を備えることを特徴とする関連記述提示システム。
  5. 請求項1乃至請求項3のいずれか1項に記載の関連記述提示システムにおいて、
    前記提示手段は、前記検索判定手段による判定結果に応じて、前記検索手段により前記出願単語について予め検索された関連記述の中から、前記判定対象単語に該当する関連記述を閲覧ユーザに提示するために選択する選択制御手段を備えることを特徴とする関連記述提示システム。
  6. 請求項1乃至請求項5のいずれか1項に記載の関連記述提示システムにおいて、
    前記出現単語履歴は前記出現単語の出現回数が含まれ、前記検索履歴は当該出現単語に対する検索回数が含まれており、
    前記所定の条件としては、前記判定対象単語の関連ユーザにおける出現回数と検索回数との比が予め設定された基準値を上回るときに検索がなされたと判定することを特徴とする関連記述提示システム。
  7. 請求項1乃至請求項5のいずれか1項に記載の関連記述提示システムにおいて、
    前記検索履歴は前記出現単語に対して検索がなされた時間情報が含まれおり、
    前記所定の条件としては、文書を閲覧している現在時間から所定の時間内に関連ユーザにより検索されていたときに検索がなされたと判定することを特徴とする関連記述提示システム。
  8. 請求項1乃至請求項7のいずれか1項に記載の関連記述提示システムにおいて、
    文書は予め定められた幾つかの分類のいずれかに属しており、
    ユーザ管理手段は、各分類毎に複数のユーザ同士を関連付けて管理し、
    検索判定手段は、ユーザ管理手段を参照して閲覧文書の属する分類において前記閲覧ユーザに関連付けられた関連ユーザを特定することを特徴とする関連記述提示システム。
  9. 請求項1乃至請求項8のいずれか1項に記載の関連記述提示システムにおいて、
    閲覧文書中に出現する単語の内で記述管理手段により管理されている単語を出現単語履歴に追加して管理させ、検索手段により関連記述の検索が行われた単語を検索履歴に追加して管理させる履歴更新手段を備えたことを特徴とする関連記述提示システム。
  10. 請求項1乃至請求項9のいずれか1項に記載の関連記述提示システムにおいて、
    前記検索履歴は前記出現単語に対する検索回数が含まれており、
    検索履歴を参照して、いずれかのユーザに検索されたことがある単語を次元とし、各次元の要素を対応する前記単語の各ユーザによる検索回数として作成した特徴ベクトルをユーザ毎に関連付けてユーザ管理手段に管理させるユーザ関連更新手段を備え、
    前記関連ユーザは、閲覧ユーザの特徴ベクトルとの余弦が所定の範囲内である特徴ベクトルが関連付けられたユーザであることを特徴とする関連記述提示システム。
  11. 文書を表示する機能と単語に関連する関連記述を提示する機能とを備えたユーザ端末装置と通信回線を介して接続される関連記述提示装置であって、
    文書を閲覧するユーザの識別情報をユーザ端末装置から通信回線を介して取得してユーザを識別するユーザ識別手段と、
    単語と当該単語に関連する関連記述とを対応付けて管理する記述管理手段と、
    閲覧文書中に出現する単語について記述管理手段から関連記述を検索する検索手段と、
    記述管理手段で管理された単語に関して、ユーザが閲覧した文書中に出現したか否かの出現単語履歴と当該出現単語に対して関連記述の検索がなされたか否かの検索履歴とをユーザ毎に管理する履歴管理手段と、
    複数のユーザ同士を予め関連付けて管理するユーザ管理手段と、
    ユーザ端末装置に表示される閲覧文書中に出現する単語の内で記述管理手段により管理されている単語について、出現単語履歴及び検索履歴を参照して、当該閲覧ユーザに対して出現した当該出現単語が判定対象単語か否かを判定する未知語判定手段と、
    未知語判定手段により判定対象単語であると判定されたことに応じて、ユーザ管理手段を参照して当該閲覧ユーザに関連付けられた関連ユーザを特定するとともに、当該関連ユーザにより当該単語について所定の条件を満たす検索がなされたかを出現単語履歴及び検索履歴を参照して判定する検索判定手段と、
    検索判定手段により前記判定対象単語について関連ユーザにより前記所定の条件を満たす検索がなされたと判定されたときに、前記記述管理手段に管理された当該判定対象単語に対応する関連記述を閲覧ユーザに提示するために通信回線を介して前記ユーザ端末装置に提供する提示手段と、
    を備えたことを特徴とする関連記述提示装置。
  12. 他のユーザ端末装置と通信回線を介して接続されて、文書を閲覧しているユーザに対して文書中の単語に関連する記述を提示するユーザ端末装置であって、
    自装置により文書を閲覧しているユーザを識別するユーザ識別手段と、
    単語と当該単語に関連する関連記述とを対応付けて管理する記述管理手段と、
    閲覧文書中に出現する単語について記述管理手段から関連記述を検索する検索手段と、
    記述管理手段で管理された単語に関して、ユーザが閲覧した文書中に出現したか否かの出現単語履歴と当該出現単語に対して関連記述の検索がなされたか否かの検索履歴とをユーザ毎に管理する履歴管理手段と、
    複数のユーザ同士を予め関連付けて管理するユーザ管理手段と、
    自装置に表示される閲覧文書中に出現する単語の内で記述管理手段により管理されている単語について、出現単語履歴及び検索履歴を参照して、当該閲覧ユーザに対して出現した当該出現単語が判定対象単語か否かを判定する未知語判定手段と、
    未知語判定手段により判定対象単語であると判定されたことに応じて、ユーザ管理手段を参照して当該閲覧ユーザに関連付けられた関連ユーザを特定するとともに、当該関連ユーザにより当該単語について所定の条件を満たす検索がなされたかを出現単語履歴及び検索履歴を参照して判定する検索判定手段と、
    検索判定手段により前記判定対象単語について関連ユーザにより前記所定の条件を満たす検索がなされたと判定されたときに、前記記述管理手段に管理された当該判定対象単語について関連記述を閲覧ユーザに提示する提示手段と、を備え、
    前記履歴管理手段は、更に、自装置の検索手段による検索履歴を自装置の閲覧ユーザと対応付けて検索履歴に管理するとともに、当該検索履歴を当該閲覧ユーザに対応付けて通信回線を介して他のユーザ端末装置へ提供し、また、他のユーザ端末装置から取得した検索履歴を当該他の端末装置の閲覧ユーザに対応付けて検索履歴に管理することを特徴とするユーザ端末装置。
  13. 文書を表示する機能と単語に関連する関連記述を提示する機能とを備えたユーザ端末装置と通信回線を介して接続される関連記述提示装置を、コンピュータにより構成するプログラムであって、
    文書を閲覧するユーザの識別情報をユーザ端末装置から通信回線を介して取得してユーザを識別するユーザ識別手段と、
    単語と当該単語に関連する関連記述とを対応付けて管理する記述管理手段と、
    閲覧文書中に出現する単語について記述管理手段から関連記述を検索する検索手段と、
    記述管理手段で管理された単語に関して、ユーザが閲覧した文書中に出現したか否かの出現単語履歴と当該出現単語に対して関連記述の検索がなされたか否かの検索履歴とをユーザ毎に管理する履歴管理手段と、
    複数のユーザ同士を予め関連付けて管理するユーザ管理手段と、
    ユーザ端末装置に表示される閲覧文書中に出現する単語の内で記述管理手段により管理されている単語について、出現単語履歴及び検索履歴を参照して、当該閲覧ユーザに対して出現した当該出現単語が判定対象単語か否かを判定する未知語判定手段と、
    未知語判定手段により判定対象単語であると判定されたことに応じて、ユーザ管理手段を参照して当該閲覧ユーザに関連付けられた関連ユーザを特定するとともに、当該関連ユーザにより当該単語について所定の条件を満たす検索がなされたかを出現単語履歴及び検索履歴を参照して判定する検索判定手段と、
    検索判定手段により前記判定対象単語について関連ユーザにより前記所定の条件を満たす検索がなされたと判定されたときに、前記記述管理手段に管理された当該判定対象単語に対応する関連記述を閲覧ユーザに提示するために通信回線を介して前記ユーザ端末装置に提供する提示手段と、
    を備えたことを特徴とする関連記述提示プログラム。
  14. 他のユーザ端末装置と通信回線を介して接続されて、文書を閲覧しているユーザに対して文書中の単語に関連する記述を提示するユーザ端末装置を、コンピュータにより構成するプログラムであって、
    自装置により文書を閲覧しているユーザを識別するユーザ識別手段と、
    単語と当該単語に関連する関連記述とを対応付けて管理する記述管理手段と、
    閲覧文書中に出現する単語について記述管理手段から関連記述を検索する検索手段と、
    記述管理手段で管理された単語に関して、ユーザが閲覧した文書中に出現したか否かの出現単語履歴と当該出現単語に対して関連記述の検索がなされたか否かの検索履歴とをユーザ毎に管理する履歴管理手段と、
    複数のユーザ同士を予め関連付けて管理するユーザ管理手段と、
    自装置に表示される閲覧文書中に出現する単語の内で記述管理手段により管理されている単語について、出現単語履歴及び検索履歴を参照して、当該閲覧ユーザに対して出現した当該出現単語が判定対象単語か否かを判定する未知語判定手段と、
    未知語判定手段により判定対象単語であると判定されたことに応じて、ユーザ管理手段を参照して当該閲覧ユーザに関連付けられた関連ユーザを特定するとともに、当該関連ユーザにより当該単語について所定の条件を満たす検索がなされたかを出現単語履歴及び検索履歴を参照して判定する検索判定手段と、
    検索判定手段により前記判定対象単語について関連ユーザにより前記所定の条件を満たす検索がなされたと判定されたときに、前記記述管理手段に管理された当該判定対象単語について関連記述を閲覧ユーザに提示する提示手段と、を備え、
    前記履歴管理手段は、更に、自装置の検索手段による検索履歴を自装置の閲覧ユーザと対応付けて検索履歴に管理するとともに、当該検索履歴を当該閲覧ユーザに対応付けて通信回線を介して他のユーザ端末装置へ提供し、また、他のユーザ端末装置から取得した検索履歴を当該他の端末装置の閲覧ユーザに対応付けて検索履歴に管理することを特徴とするユーザ端末プログラム。
  15. ユーザが閲覧している文書中に出現する単語について、当該単語に関連する記述を当該閲覧ユーザへ提示する関連記述提示システムにより実施される方法であって、
    前記関連記述提示システムは、記述管理手段と、履歴管理手段と、ユーザ管理手段と、ユーザ識別手段と、未知語判定手段と、検索判定手段と、検索手段と、提示手段と、を備え、
    前記記述管理手段は、単語と当該単語に関連する関連記述とを対応付けて管理し、
    前記検索手段は、閲覧文書中に出現する単語について記述管理手段から関連記述を検索し、
    前記履歴管理手段は、記述管理手段で管理された単語に関して、ユーザが閲覧した文書中に出現したか否かの出現単語履歴と当該出現単語に対して関連記述の検索がなされたか否かの検索履歴とをユーザ毎に管理し、
    前記ユーザ管理手段は、複数のユーザ同士を予め関連付けて管理しており、
    前記ユーザ識別手段が、文書を閲覧しているユーザを識別し、
    前記未知語判定手段が、閲覧文書中に出現する単語の内で前記記述管理手段により管理されている単語について、出現単語履歴及び検索履歴を参照して、当該閲覧ユーザに対して出現した当該出現単語が判定対象単語か否かを判定し、
    前記検索判定手段が、前記未知語判定手段により判定対象単語であると判定されたことに応じて、前記ユーザ管理手段を参照して当該閲覧ユーザに関連付けられた関連ユーザを特定し、当該関連ユーザにより当該単語について所定の条件を満たす検索がなされたかを出現単語履歴及び検索履歴を参照して判定し、
    前記提示手段が、前記検索判定手段により前記判定対象単語について関連ユーザにより前記所定の条件を満たす検索がなされたと判定されたときに、前記記述管理手段に管理された当該判定対象単語について関連記述を閲覧ユーザに提示することを特徴とする関連記述提示方法。
JP2005205124A 2005-07-14 2005-07-14 関連記述提示システム Pending JP2007025925A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005205124A JP2007025925A (ja) 2005-07-14 2005-07-14 関連記述提示システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005205124A JP2007025925A (ja) 2005-07-14 2005-07-14 関連記述提示システム

Publications (1)

Publication Number Publication Date
JP2007025925A true JP2007025925A (ja) 2007-02-01

Family

ID=37786616

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005205124A Pending JP2007025925A (ja) 2005-07-14 2005-07-14 関連記述提示システム

Country Status (1)

Country Link
JP (1) JP2007025925A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009042968A (ja) * 2007-08-08 2009-02-26 Nec Corp 情報選別システム、情報選別方法及び情報選別用プログラム
JP2010092286A (ja) * 2008-10-08 2010-04-22 Yahoo Japan Corp 知識dbを利用した検索方法
JP2010218343A (ja) * 2009-03-18 2010-09-30 Konica Minolta Business Technologies Inc 情報提供方法、情報提供装置、およびコンピュータプログラム
WO2012118087A1 (ja) * 2011-03-03 2012-09-07 日本電気株式会社 レコメンダシステム、レコメンド方法、及びプログラム
JP2014513828A (ja) * 2011-03-16 2014-06-05 クアルコム,インコーポレイテッド 自動会話支援
JP2016045796A (ja) * 2014-08-25 2016-04-04 Kddi株式会社 相手方ユーザからの対話文章に対して支援情報を明示する端末、プログラム及び方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009042968A (ja) * 2007-08-08 2009-02-26 Nec Corp 情報選別システム、情報選別方法及び情報選別用プログラム
JP2010092286A (ja) * 2008-10-08 2010-04-22 Yahoo Japan Corp 知識dbを利用した検索方法
JP2010218343A (ja) * 2009-03-18 2010-09-30 Konica Minolta Business Technologies Inc 情報提供方法、情報提供装置、およびコンピュータプログラム
WO2012118087A1 (ja) * 2011-03-03 2012-09-07 日本電気株式会社 レコメンダシステム、レコメンド方法、及びプログラム
JPWO2012118087A1 (ja) * 2011-03-03 2014-07-07 日本電気株式会社 レコメンダシステム、レコメンド方法、及びプログラム
JP5962926B2 (ja) * 2011-03-03 2016-08-03 日本電気株式会社 レコメンダシステム、レコメンド方法、及びプログラム
US9569499B2 (en) 2011-03-03 2017-02-14 Nec Corporation Method and apparatus for recommending content on the internet by evaluating users having similar preference tendencies
JP2014513828A (ja) * 2011-03-16 2014-06-05 クアルコム,インコーポレイテッド 自動会話支援
JP2016045796A (ja) * 2014-08-25 2016-04-04 Kddi株式会社 相手方ユーザからの対話文章に対して支援情報を明示する端末、プログラム及び方法

Similar Documents

Publication Publication Date Title
US7954045B2 (en) Recommendatory information provision system
JP5105802B2 (ja) 情報処理装置
US20070022135A1 (en) Systems and methods for organizing and annotating an information search
US20140143250A1 (en) Centralized Tracking of User Interest Information from Distributed Information Sources
KR101073358B1 (ko) 태그 기반 정보 검색 장치, 방법 및 태그 관리 방법
KR101520194B1 (ko) 조사 세션 탐지에 기초한 조사 도구 액세스
US8244719B2 (en) Computer method and apparatus providing social preview in tag selection
US20060190684A1 (en) Reverse value attribute extraction
JP2007025925A (ja) 関連記述提示システム
US20150095356A1 (en) Automatic keyword tracking and association
JP2009169924A (ja) 特徴的キーワード検出装置、特徴的キーワード検出方法、プログラムおよび記録媒体
JP5627332B2 (ja) データ検索装置及びその制御方法、コンピュータプログラム
CA2805964A1 (en) Information provision device, information provision method, program, and information recording medium
US20150082248A1 (en) Dynamic Glyph-Based Search
US9064014B2 (en) Information provisioning device, information provisioning method, program, and information recording medium
JP7125322B2 (ja) 属性抽出装置および属性抽出方法
JP2012256268A (ja) 広告配信装置及び広告配信プログラム
JP2002049638A (ja) 文書情報検索装置、方法、文書情報検索プログラム及び文書情報検索プログラムを格納したコンピュータ可読の記録媒体
KR20210080000A (ko) 딥러닝 기반 이미지 자동 태깅을 통한 사용자 맞춤형 뉴스 제공 방법 및 뉴스 제공 서버
JP5616473B2 (ja) 情報処理装置および情報処理方法
JP2000172710A (ja) 情報取得装置及び情報取得プログラムを記録した記録媒体
JP2008123115A (ja) 情報検索システム、情報検索方法及びプログラム
JP4550876B2 (ja) 構造化文書検索システム及びプログラム
JP2006338114A (ja) データ管理装置およびデータ管理方法
JP2005056154A (ja) 文書検索装置

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20070928

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20071024