JP2014048888A

JP2014048888A - 単語重要度算出装置、単語重要度算出方法、およびコンピュータプログラム

Info

Publication number: JP2014048888A
Application number: JP2012191170A
Authority: JP
Inventors: Yoshimi Moriwaki; 香美森脇; Satoshi Izushi; 聡史出石; Yoichi Kawabuchi; 洋一河渕
Original assignee: Konica Minolta Inc
Current assignee: Konica Minolta Inc
Priority date: 2012-08-31
Filing date: 2012-08-31
Publication date: 2014-03-17
Anticipated expiration: 2032-08-31
Also published as: JP5949340B2

Abstract

【課題】文書に含まれる単語ごとの、ユーザにとっての重要性の度合いを、従来よりも精度よく求める。
【解決手段】プロファイル管理サーバ１に、次の手段を設ける。ユーザの、文書の閲覧中の各時刻における文書に対する興味の度合いである興味度を示すプロファイルデータ６ＰＤを取得する興味度データ取得部１０２。興味度の変化のパターンを検知する変化パターン判定部１０６。検知されたパターンに基づいて、文書に含まれる単語ごとの、ユーザにとっての重要性の度合いである重要度を算出する、重要度調整部１０７。
【選択図】図３

Description

本発明は、ユーザにとっての単語の重要性の度合いを算出する装置および方法などに関する。

従来、ユーザが関心または興味を持っている事項を表わす単語を、ユーザのプロファイルとして取り扱うことがある。さらに、単語ごとに、ユーザにとっての重要性の度合いを表わす重要度を算出しデータベースなどに登録しておくことがある。

単語を１つずつ入力することは、面倒である。そこで、ユーザが閲覧した文書の中から単語を抽出することが、考えられる。

また、ユーザが情報を閲覧しているときの生体情報を検出し、ユーザにとっての、この情報の有用性を、生体情報に基づいて判別する技術が、提案されている（特許文献１）。

特開２００９−１９９４６９号公報

特許文献１に記載される技術は、心理情報に基づいてユーザにとっての情報の有用性を判別する概念に過ぎない。精度の高いプロファイルを作成するためには、文書に含まれる単語ごとの重要性の度合いをできるだけ正確に求める必要がある。

本発明は、このような問題点に鑑み、文書に含まれる単語ごとの、ユーザにとっての重要性の度合いを、従来よりも精度よく求めることを、目的とする。

本発明の一形態に係る単語重要度算出装置は、ユーザの、文書の閲覧中の各時刻における前記文書に対する興味の度合いである興味度を入力する、興味度入力手段と、入力された前記興味度の変化のパターンを検知する、変化パターン検知手段と、検知された前記パターンに基づいて、前記文書に含まれる単語ごとの、前記ユーザにとっての重要性の度合いである重要度を算出する、重要度算出手段と、を有する。

好ましくは、前記変化パターン検知手段は、前記パターンとして、第一の長さの時間における前記興味度の変化率が第一の率以上である第一のパターンおよび前記第一の長さよりも長い第二の長さの時間における前記興味度の変化率が前記第二の率よりも小さい第二の率以上である第二のパターンのうちの少なくともいずれかを検知し、前記重要度算出手段は、前記第一のパターンが検知された場合は、前記重要度として、前記第二のパターンのみ検知された場合よりも、高い度数を算出する。

または、前記重要度算出手段は、前記単語それぞれの重要度を、当該単語が前記文書に表れる頻度に応じて算出する。

または、前記重要度算出手段は、前記各時刻における前記興味度の中間値が所定の値以上である場合に、前記単語それぞれの前記重要度を算出し、そうでない場合は、算出しない。

または、前記重要度算出手段は、前記単語のうちの前記文書の中の前記ユーザが注目した部分に含まれる単語の前記重要度として、他の単語の前記重要度よりも高い度数を算出する。

または、前記重要度算出手段は、前記単語のうちの所定の書式で表わされる単語の前記重要度として、他の単語の前記重要度よりも高い度数を算出する。または、前記単語のうちの前記文書の中の所定の欄に表われる単語の前記重要度として、他の単語の前記重要度よりも高い度数を算出する。

または、検知された前記パターンに基づいて、前記文書に含まれる複数の単語同士からなるペアごとの、前記ユーザにとっての重要性の度合いであるペア重要度を算出する、ペア重要度算出手段、を有する。

または、前記ペア重要度算出手段は、前記第一のパターンが検知された場合は、前記ペア重要度として、前記第二のパターンのみ検知された場合よりも、高い度数を算出する。

または、前記ペア重要度算出手段は、前記ペアのうちの前記文書の中の前記ユーザが注目した部分に含まれるペアの前記ペア重要度として、他のペアの前記ペア重要度よりも高い度数を算出する。

または、前記単語ごとの前記重要度および前記ペアごとの前記ペア重要度を示すプロファイルデータを記憶するプロファイルデータ記憶手段と、前記ユーザが指定した検索クエリーを前記プロファイルデータに基づいて補正し、当該補正した検索クエリーに基づいて情報を検索する処理を行う検索処理手段と、を有する。

本発明によると、文書に含まれる単語ごとの、ユーザにとっての重要性の度合いを、従来よりも精度よく求めることができる。

文書管理システムの全体的な構成の例を示す図である。プロファイル管理サーバのハードウェア構成の例を示す図である。プロファイル管理サーバの機能的構成の例を示す図である。端末装置のハードウェア構成の例を示す図である。端末装置の機能的構成の例を示す図である。各時刻の興味度データの例を示す図である。必要部分抽出処理の流れの例を説明するフローチャートである。変化パターンと重要性特性との関係の例を示す図である。変化パターンごとの重み付けの方法の例を示す図である。プロファイルデータの例を示す図である。端末装置の全体的な処理の流れの例を説明するフローチャートである。プロファイル管理サーバの全体的な処理の流れの例を説明するフローチャートである。重要度調整処理の流れの例を説明するフローチャートである。端末装置の機能的構成の変形例を示す図である。重要度調整処理の流れの変形例を説明するフローチャートである。必要部分抽出処理の流れの変形例を説明するフローチャートである。変化率と所定の値との関係を定義するテーブルの例を示す図である。

図１は、文書管理システム１ＳＹの全体的な構成の例を示す図である。図２は、プロファイル管理サーバ１のハードウェア構成の例を示す図である。図３は、プロファイル管理サーバ１の機能的構成の例を示す図である。図４は、端末装置２のハードウェア構成の例を示す図である。図５は、端末装置２の機能的構成の例を示す図である。

文書管理システム１ＳＹは、図１に示すように、プロファイル管理サーバ１、端末装置２、ドキュメントサーバ３、画像形成装置４、および通信回線５などによって構成される。

文書管理システム１ＳＹは、種々の情報、特に文書を管理しユーザに提供するためのシステムである。文書管理システム１ＳＹは、企業、役所、または学校などの組織に設置され、組織のメンバーによって用いられる。以下、ある企業において文書管理システム１ＳＹが用いられる場合を例に説明する。したがって、この企業の従業員が文書管理システム１ＳＹのユーザである。各ユーザには、ユニークなＩＤ（identification）であるユーザコードが１つずつ与えられている。

プロファイル管理サーバ１、端末装置２、ドキュメントサーバ３、および画像形成装置４は、通信回線５を介して通信を行うことができる。通信回線５として、固定電話回線、携帯電話網、ＰＨＳ（Personal Handy-phone System）回線、専用線、インターネット、またはいわゆるＬＡＮ（Local Area Network）回線などが用いられる。ＬＡＮ回線の全部または一部として、無線ＬＡＮの回線を用いることができる。

プロファイル管理サーバ１は、ユーザごとのプロファイルを管理する。プロファイルとして、特に、ユーザに関連する単語を管理する。また、ユーザに関連する単語をキーワードとして用いて文書の検索を支援する。これらについては、後に詳細に説明する。

プロファイル管理サーバ１は、図２に示すように、ＣＰＵ（Central Processing Unit）１０ａ、ＲＡＭ（Random Access Memory）１０ｂ、ＲＯＭ（Read Only Memory）１０ｃ、ハードディスク１０ｄ、およびＮＩＣ（Network Interface Card）１０ｅなどによって構成される。

ＮＩＣ１０ｅは、端末装置２、ドキュメントサーバ３、および画像形成装置４のほか、インターネット上のウェブサーバなどと通信を行うための装置である。

ＲＯＭ１０ｃまたはハードディスク１０ｄには、図３に示す文書データ収集部１０１、興味度データ取得部１０２、必要部分抽出部１０３、単語重要度算出部１０４、ペア重要度算出部１０５、変化パターン判定部１０６、重要度調整部１０７、プロファイルデータ生成部１０８、検索処理部１０９、文書データ記憶部１２１、興味度データ記憶部１２２、およびプロファイルデータ記憶部１２３などの機能を実現するためのプログラムが記憶されている。このプログラムは、プロファイルの管理および情報の検索のためのものである。このプログラムは、必要に応じてＲＡＭ１０ｂにロードされ、ＣＰＵ１０ａによって実行される。

図１に戻って、端末装置２は、文書（ドキュメント）の作成および編集を行ったり、プロファイル管理サーバ１、ドキュメントサーバ３、および画像形成装置４などが提供する種々のサービスを受けたりするための装置である。端末装置２として、パーソナルコンピュータ、タブレットコンピュータ（タブレットＰＣ）、携帯電話端末、またはスマートフォンなどが用いられる。以下、端末装置２としてタブレットコンピュータが用いられる場合を例に説明する。

端末装置２は、図４に示すように、ＣＰＵ２０ａ、ＲＡＭ２０ｂ、フラッシュメモリ２０ｃ、タッチパネルディスプレイ２０ｄ、操作ボタン群２０ｅ、無線ＬＡＮ通信装置２０ｆ、近距離無線通信装置２０ｇ、携帯電話通信装置２０ｈ、マイクロフォン２０ｉ、スピーカ２０ｊ、デジタルカメラ２０ｋ、およびジャイロセンサ２０ｍなどによって構成される。

タッチパネルディスプレイ２０ｄは、ユーザに対してメッセージを与えるための画面、処理の結果を示す画面、またはユーザが指示を入力するための画面などを表示する。また、タッチパネルディスプレイ２０ｄは、タッチされた位置を検知し、ＣＰＵ２０ａにその位置を通知する。

操作ボタン群２０ｅは、いわゆるホーム画面に戻るためのボタン、音量を調整するためのボタン、および電源のオン／オフを切り換えるためのボタンなどによって構成される。

無線ＬＡＮ通信装置２０ｆ、近距離無線通信装置２０ｇ、および携帯電話通信装置２０ｈは、いずれも、無線によって他の装置と通信を行うための装置である。ただし、それぞれ、通信の方式などが異なる。

無線ＬＡＮ通信装置２０ｆは、無線ＬＡＮの規格、つまり、ＩＥＥＥ（Institute of Electrical and Electronics Engineers）８０２．１１の規格に基づいて通信を行う。

近距離無線通信装置２０ｇは、近距離無線通信の規格に基づいて通信を行う。例えば、Ｂｌｕｅｔｏｏｔｈ（登録商標）またはＺｉｇＢｅｅなどの規格に基づいて通信を行う。また、ワイヤレスキーボード、ワイヤレスマウス、エアペン（Air Pen）、視線追従型ヘッドマウントディスプレイ、赤外線カメラ、およびジェスチャコントローラなどを、近距離無線通信装置２０ｇを介して端末装置２に接続することもできる。なお、ジェスチャコントローラは、深度センサまたはジャイロセンサなどを有し、ユーザがジェスチャによって本体（本例では、端末装置２）をコントロールするための入力装置である。ジェスチャコントローラとして、マイクロソフト社のＫｉｎｅｃｔまたはリープモーション社のＬＥＡＰなどが用いられる。

携帯電話通信装置２０ｈは、ＣＤＭＡ（Code Division Multiple Access）２０００またはＷ−ＣＤＭＡ（Wideband-CDMA）などの規格に基づいて通信を行う。

マイクロフォン２０ｉは、集音し音声データを生成する。スピーカ２０ｊは、音声データに基づいて音声を出力する。デジタルカメラ２０ｋは、画像を撮影し画像データを生成する。動画像を撮影し動画像の画像データを生成することも、できる。ジャイロセンサ２０ｍは、端末装置２の姿勢を検知する。

フラッシュメモリ２０ｃには、文書（ドキュメント）の作成用のアプリケーション（例えば、ワープロソフト）がインストールされている。そのほか、メーラ、ウェブブラウザ、スケジューラ、メッセンジャ、ＩＰ電話アプリケーション、および声紋判別アプリケーションなどのアプリケーションがインストールされている。

さらに、フラッシュメモリ２０ｃには、図５に示す閲覧開始操作検知部２０１、文書データ提供部２０２、興味度検出部２０３、興味度変化データ記憶部２０４、閲覧終了操作検知部２０５、全体興味度算出部２０６、興味度データ提供部２０７、および検索クライアント２０８などの機能を実現するためのプログラムが記憶されている。

これらのプログラムは、必要に応じてＲＡＭ２０ｂにロードされ、ＣＰＵ２０ａによって実行される。

図１に戻って、ドキュメントサーバ３は、文書のデータを管理する。ドキュメントサーバ３として、複数台のサーバが設けられている。特に、ドキュメントサーバ３１は、ファイルサーバであって、ワープロソフトなどのアプリケーションによって作成された文書のデータをファイル単位で管理する。ドキュメントサーバ３２は、ウェブサーバであって、文書のデータをウェブページの単位で管理する。

画像形成装置４は、コピー、ＰＣプリント、ファックス、およびスキャナなどの機能を集約した装置である。一般に、「複合機」または「ＭＦＰ（Multi Function Peripherals）」などと呼ばれることがある。

「ＰＣプリント」は、端末装置２から受信した画像データに基づいて画像を用紙に印刷する機能である。「ネットワークプリンティング」または「ネットワークプリント」などと呼ばれることもある。

次に、図３に示すプロファイル管理サーバ１の各部および図５に示す端末装置２の各部について、プロファイルの生成のためのデータの収集の処理、プロファイルの生成の処理、および情報の検索の処理に大別して説明する。

〔プロファイルの生成のためのデータの収集の処理〕
図６は、各時刻の興味度データ６ＫＡの例を示す図である。

ユーザが文書を端末装置２によって使用し始めるタイミングが、プロファイルの生成のために必要なデータを収集する処理の開始のタイミングである。

端末装置２において、閲覧開始操作検知部２０１は、ユーザが文書の閲覧を開始する操作を行ったことを検知する。

閲覧を開始する操作の検知は、キーロガーによって実現することができる。なお、キーロガーは、キーボード、マウス、またはタッチパネルディスプレイによる入力を随時、監視するエージェントである。すなわち、閲覧開始操作検知部２０１は、キーロガーによってユーザが行った操作の手順を検知し、検知した操作の手順と所定の操作の手順とをマッチングする。そして、両者が一致すれば、閲覧を開始する操作が行われたと、検知する。所定の操作の手順は、例えば、所定のアプリケーションを起動し、ファイルのオープンのコマンドを入力し、文書のデータを選択する、という操作の手順である。この例によると、閲覧開始操作検知部２０１は、ユーザが選択した文書のデータをも検知することができる。

また、このような操作によって端末装置２において、従来通り、アプリケーションが起動し、ユーザによって選択された文書のデータがドキュメントサーバ３からダウンロードされまたは端末装置２のデータベースから読み出され、そして、文書が表示される。これにより、ユーザは、文書を閲覧することができる。

文書データ提供部２０２は、閲覧開始操作検知部２０１によって検知された文書のデータを、このユーザのユーザコードと対応付けてプロファイル管理サーバ１へ送信する。以下、ユーザが選択した文書を「カレント文書」と記載し、カレント文書のデータを「文書データ６ＤＣ」と記載する。

プロファイル管理サーバ１の文書データ収集部１０１（図３参照）は、端末装置２から送信されてきた文書データ６ＤＣを取得し、文書データ記憶部１２１に記憶させる。

端末装置２の興味度検出部２０３は、カレント文書に対するユーザの興味の強さの度合いを表わす興味度ＲＩを検出する。興味度ＲＩは、例えば次の方法によって検出することができる。

１つ目の方法は、ユーザの視線に基づいて検出する方法である。具体的には、デジタルカメラ２０ｋまたは視線追従型ヘッドマウントディスプレイによってユーザの顔を撮影し視線およびその動きを検出する。また、予め、視線がカレント文書の画面に定まっている時間（凝視している時間）が長いほど高い興味度を導く関数またはテーブルを用意しておく。そして、ユーザの視線に基づいてカレント文書の画面に定まっている時間を算出し、関数またはテーブルに基づいて興味度ＲＩを検出する。視線に基づく興味度の検出の公知の技術として、特開平１１−８５７６２号公報に記載される技術がある。

２つ目の方法は、ユーザの姿勢に基づいて検出する方法である。具体的には、デジタルカメラ２０ｋによってユーザと対象の物体（本例では、カレント文書の画面）との距離を計測する。また、予め、距離（ユーザと対象の物体との距離）と興味度との関係を表わす関数またはテーブルを用意しておく。そして、計測した距離および関数またはテーブルに基づいて興味度ＲＩを検出する。または、距離の変化量に基づいて興味度を検出する方法を用いてもよい。

３つ目の方法は、生体情報に基づいて検出する方法である。具体的には、デジタルカメラ２０ｋ、視線追従型ヘッドマウントディスプレイ、または赤外線カメラによってユーザの眼球の運動および瞬きのほか、瞳孔の大きさを検出する。また、眼球の運動、瞬きの回数もしくは頻度、または瞳孔の大きさもしくはその変化と興味度との関係を表わす関数またはテーブルを予め用意しておく。そして、検出したこれらの情報および関数またはテーブルに基づいて興味度ＲＩを検出する。人間の目に関する情報に基づいて興味度を検出する公知の技術の例として、ＷＯ２００８／０７２７３９号公報に記載される技術がある。

これらの方法によると、ユーザがカレント文書を閲覧している様子を撮影するだけでよいので、ユーザの作業（ワーク）を阻害することなく、興味度ＲＩをリアルタイムに検出することができる。

なお、上記３つ以外の方法によって興味度ＲＩを検出してもよい。または、精度を高めるために、複数の方法を組み合わせても用いてもよい。

興味度検出部２０３は、ユーザがカレント文書の閲覧を開始してから終了するまでの間、所定の時間（例えば、１〜１０秒）ごとに興味度ＲＩを検出する。

検出された興味度ＲＩは、その時点の時刻と対応付けられて、興味度データ６ＫＡとして興味度変化データ記憶部２０４に記憶される。つまり、興味度変化データ記憶部２０４には、図６のような、時刻ごとの興味度ＲＩ、つまり、興味度ＲＩの変化のデータが、記憶される。

閲覧終了操作検知部２０５は、ユーザがカレント文書の閲覧を終了する操作を行ったことを検知する。

閲覧を終了する操作の検知も、閲覧を開始する操作の検知と同様に、キーロガーによって実現することができる。すなわち、閲覧終了操作検知部２０５は、キーロガーによってユーザが行った操作を検知し、検知した操作と所定の操作とをマッチングする。そして、両者が一致すれば、閲覧を終了する操作が行われたと、検知する。所定の操作は、例えば、所定のアプリケーションの終了のコマンドの入力、文書のファイルを閉じるコマンドの入力、または他の文書のファイルをオープンするコマンドの入力、または他のアプリケーションへの切換えなどの操作などである。

全体興味度算出部２０６は、カレント文書の閲覧の終了の操作が閲覧終了操作検知部２０５によって検知されると、興味度変化データ記憶部２０４に記憶されている、各時刻の興味度データ６ＫＡに基づいて、閲覧中の全体的な興味の度合いを表わす全体興味度ＲＥを算出する。例えば、各興味度データ６ＫＡに示される興味度ＲＩの平均値を全体興味度ＲＥとして算出する。または、これらの興味度ＲＩのうちの最大値と最小値との中間値（例えば、ちょうど真ん中の値）を全体興味度ＲＥとして算出してもよい。

興味度データ提供部２０７は、興味度データ６Ｋを生成し、プロファイル管理サーバ１へ送信する。興味度データ６Ｋには、閲覧が終了したことを示す信号、全体興味度算出部２０６によって算出された全体興味度ＲＥ、興味度検出部２０３によって検出された各時刻の興味度ＲＩ、および閲覧者（ユーザ）のユーザコードが示されている。

プロファイル管理サーバ１において、興味度データ取得部１０２は、端末装置２から送信されてきた興味度データ６Ｋを取得し、興味度データ記憶部１２２に記憶させる。

〔プロファイルの生成の処理〕
図７は、必要部分抽出処理の流れの例を説明するフローチャートである。図８は、変化パターンと重要性特性との関係の例を示す図である。図９は、変化パターンごとの重み付けの方法の例を示す図である。図１０は、プロファイルデータ６ＰＤの例を示す図である。

必要部分抽出部１０３は、興味度データ取得部１０２によって興味度データ６Ｋが取得されると、カレント文書の中からプロファイルの生成に必要な部分を抽出する処理を、例えば図７に示す手順で実行する。

必要部分抽出部１０３は、興味度データ６Ｋに示される全体興味度ＲＥと閾値αとを比較する（＃７０１）。全体興味度ＲＥが閾値α以上である場合は（＃７０２でＹｅｓ）、文書データ記憶部１２１から文書データ６ＤＣを読み出す（＃７０３）。そして、文書データ６ＤＣに基づいて、プロファイルの生成のために必要でない部分をカレント文書から削除する（＃７０４）。

例えば、必要部分抽出部１０３は、カレント文書が電子メールである場合は、電子メールのヘッダおよびレターヘッドを削除する。カレント文書がウェブページである場合は、ウェブページのバナー広告を削除する。または、ウェブページの必要な部分と不要な部分とを、領域判別に関する公知の技術によって区別し、不要な部分を削除してもよい。公知の技術として、エバーノート社のＷｅｂクリッパまたはＣｌｅａｌｙで採用されている技術が用いられる。

このようにして、カレント文書から抽出された必要な部分のデータを、以下、「必要部分データ６ＨＢ」と記載する。

そして、必要部分抽出部１０３は、必要部分データ６ＨＢを文書データ記憶部１２１に保存する（＃７０５）。

一方、全体興味度ＲＥが閾値α未満である場合は（＃７０２でＮｏ）、必要部分抽出部１０３は、ステップ＃７０３以降の処理を中止する。次に説明する単語重要度算出部１０４などによる処理も中止され、必要部分抽出部１０３は、次の興味度データ６Ｋが受信されるのを待つ。

単語重要度算出部１０４は、必要部分データ６ＨＢに示される文書（必要な部分）から単語を抽出し、単語ごとの重要性の度合い（以下、「重要度Ｗ」と記載する。）を算出する。

抽出の処理は、例えば、次の方法で行うことができる。必要部分データ６ＨＢに示される文書が英語またはフランス語などで記述されている場合は、単語抽出部１０５は、スペースまたは改行のコードに基づいて単語同士を切り分け抽出すればよい。日本語で記述されている場合は、形態素解析の技術を用いて単語を抽出する。この技術を実装しているソフトウェアとして、奈良先端科学技術大学院大学の松本裕治研究室の茶筅（ＣｈａＳｅｎ）および工藤拓氏のＭｅｃａｂが挙げられる。これらのソフトウェアによって形態素解析を行うことによって、単語を抽出すればよい。

一方、重要度Ｗの算出は、例えば、次の方法で行うことができる。１つ目の方法は、パターンマッチングによる方法である。この方法は、「○○は調査すべきである」のような、よく使う重要な言い回しのテンプレートを予め登録しておく。そして、「○○」に該当する該当する単語に、該当する回数に応じて所定の点数を与えることによって、重要度Ｗを算出する。

２つ目の方法は、文書に単語が出現する回数に応じて算出する方法である。例えば、
ＴＦ−ＩＤＦ（Term Frequency Inverse Document Frequency）法による方法である。この方法によると、次に示す式に基づいて重要度を算出する。

「ｎ_i,j」は、単語ｉの、文書ｊにおける出現回数である。｜Ｄ｜は、文書の総数である。｜｛ｄ：ｄ∋ｔ_i｝は、単語ｉを含む文書の総数である。上述の式の「ｉｄｆ」は、一般語フィルタとして働く。そして、多くの文書に出現する単語（一般語）の重要度を下げる役割を果たす。

ペア重要度算出部１０５は、必要部分データ６ＨＢに示される文書（必要な部分）から複数の単語からなるペアを抽出し、ペアごとの重要性の度合い（以下、「ペア重要度Ｓ」と記載する。）を算出する。

ペアは、単語重要度算出部１０４によって抽出された単語同士を任意に組み合わせることによって、抽出することができる。ただし、この方法によると、非常に多くのペアが抽出され得るが、単語同士の関連性が低いペアが含まれることがある。そこで、１つの塊、例えば、１つのセンテンスまたは１つの段落などに含まれる単語同士をペアとして抽出してもよい。以下、２つの単語が１つのペアをなす場合を例に説明する。

ペア重要度Ｓの算出は、例えば、次の方法で行うことができる。単語重要度算出部１０４は、抽出したペアを構成する２つの単語同士の、文書内における距離を求める。そして、所定の関数またはテーブルに基づいて、その距離に応じた重要度を算出する。所定の関数またはテーブルには、距離が短いほど重要度が高くなるように、距離と重要度との関係が定義されている。

例えば、「南部地方｜で｜は、｜気候｜を｜活かし｜た｜特産品｜で｜村おこし｜の｜協力者｜を｜募集し｜て｜いる。」というセンテンスの中から「南部地方」および「気候」のペアが抽出されたとする。なお、「｜」は、単語と単語との区切りの記号である。句読点などの記号は、無視する。このペアを構成する２つの単語の距離（いわゆるワード距離）は、自らを含め、４ワードである。よって、ペア重要度算出部１０５は、このペアのペア重要度Ｓを、４ワードに対応する重要度を所定の関数またはテーブルから導くことによって、算出する。同様に、「南部地方」と「特産品」との距離は、８ワードである。よって、ペア重要度算出部１０５は、両単語のペアのペア重要度Ｓを、８ワードに対応する重要度を所定の関数またはテーブルから導くことによって、算出する。

または、ペア重要度算出部１０５は、シソーラス（分類辞典）を参照し、両単語の持つ意味的な繋がりに基づいて重要度を求めても算出してもよい。

これらの方法は、ペアを構成する両単語の関係性の度合いを、ペアの重要度として算出していると、言える。

同一の単語が複数抽出された場合は、同一のペアが複数回、出現する。例えば、ＷＤ１という単語が２つ抽出され、ＷＤ２という単語が３つ抽出された場合は、２×３、つまり、６回、両単語のペアが出現する。このような場合は、２つの単語同士の距離が最も近いときの重要度をペア重要度Ｓとして採用すればよい。または、それぞれの重要度の平均値を取ってもよい。または、出現回数の多さに応じた重要度をペア重要度Ｓとして採用してもよい。つまり、出現回数が多いほどペア重要度Ｓを大きくしてもよい。

または、ペア重要度算出部１０５は、上記の演算を行わず、すべてのペアのペア重要度Ｓを一律に所定の値（ただし、「０」以外の値。例えば、「１」）に決めてもよい。

変化パターン判定部１０６は、ユーザの興味度ＲＩの変化に表れるパターン（以下、「変化パターン」と記載する。）を、次のように判定する。

変化パターン判定部１０６は、例えば１〜１０秒程度の短い時間Ｌａに急激に興味度ＲＩが上昇するパターン（以下、「急上昇パターン」と記載する。）が表れているか否かを、次のように判別する。カレント文書の閲覧中の各時刻から時間Ｌａの経過後までの興味度ＲＩの変化率を算出する。つまり、例えば、ある時刻Ｔ１における変化率として、時刻Ｔ１の時間Ｌａ前における興味度ＲＩから時刻Ｔ１における興味度ＲＩへの増加量を時間Ｌａで割った値を、算出する。そして、変化率が閾値βａ以上である時刻があれば、変化パターンとして急上昇パターンが表れていると、判定する。

さらに、変化パターン判定部１０６は、例えば１０秒〜１分程度の長い時間Ｌｂに興味度ＲＩが上昇するパターン（以下、「緩上昇パターン」と記載する。）が表れているか否かを、次のように判別する。カレント文書の閲覧中の各時刻から時間Ｌｂの経過後までの興味度ＲＩの変化率を算出する。つまり、例えば、ある時刻Ｔ１における変化率として、時刻Ｔ１の時間Ｌｂ前における興味度ＲＩから時刻Ｔ１における興味度ＲＩへの増加量を時間Ｌｂで割った値を、算出する。そして、変化率が閾値βｂ以上である時刻があれば、変化パターンとして緩上昇パターンが表れていると、判定する。ただし、閾値βａ＞閾値βｂ、である。

また、急上昇パターンおよび緩上昇パターンのいずれも表れていない場合は、変化パターン判定部１０６は、変化パターンとして「上昇小パターン」が表れていると、判定する。

なお、時間ＬａおよびＬｂの長さは、ユーザの読書のスピードなどに応じて適宜、変更することができる。ただし、時間Ｌａ＜時間Ｌｂ、である。閾値βａおよびβｂも、適宜、変更することができる。

重要度調整部１０７は、単語重要度算出部１０４によって算出された各単語の重要度Ｗおよびペア重要度算出部１０５によって算出された各ペアのペア重要度Ｓを、変化パターン判定部１０６によって判定された変化パターンに基づいて調整する。

ところで、一般に、文書の中のユーザにとっての重要な部分は、変化パターンに応じて、重要性について図８に示すような特性を有することが多い。

つまり、変化パターンとして急上昇パターンが表れる場合は、ユーザの目に留まった単語自体が重要であることが多い。一方、緩上昇パターンが表れる場合は、単語自体よりも全体的な内容が重要であることが多い。また、どちらの場合も、単語同士のペアが重要であることが多い。

そこで、重要度調整部１０７は、このような傾向に鑑み、図９に示すように、各単語の重要度Ｗおよび各ペアのペア重要度Ｓを調整する。

つまり、変化パターンが急上昇パターンであると変化パターン判定部１０６によって判定された場合は、重要度調整部１０７は、各単語の重要度Ｗに所定の値γａ（γａ＞０）を加える。さらに、各ペアのペア重要度Ｓに所定の値γｂ（γｂ＞０）を加える。または、各ペアのペア重要度Ｓに所定の値γｃ（γｃ＞１）を掛けてもよい。

または、変化パターンが急上昇パターンではなく緩上昇パターンであると変化パターン判定部１０６によって判定された場合は、重要度調整部１０７は、各ペアのペア重要度Ｓに所定の値γｄ（γｄ＞０）を加える。または、各ペアのペア重要度Ｓに所定の値γｅ（γｅ＞１）を掛けてもよい。

なお、所定の値γｂ＞所定の値γｄ、である。また、所定の値γｃ＞所定の値γｅ、である。つまり、急上昇パターンが出現するときのほうが、急上昇パターンが出現せず緩上昇パターンが出現するときよりも、増加量を多くする。

また、ほぼ同時に目に留まった単語同士は、全体的な内容を表わす単語同士よりも、直接的な結び付きが大きい。そこで、ほぼ同時に目に留まった単語同士のペアに対する増加量をより大きくしてもよい。

変化パターンが上昇小パターンであると変化パターン判定部１０６によって判定された場合は、重要度調整部１０７は、重要度Ｗの調整もペア重要度Ｓの調整も、行わない。

プロファイルデータ生成部１０８は、ユーザのプロファイルデータ６ＰＤを生成する。プロファイルデータ６ＰＤには、図１０のように、単語ごとの重要度Ｗおよび識別子（単語コード）と、ペアごとのペア重要度Ｓおよび識別子（ペアコード）などが示される。これらの単語およびペアは、そのユーザの特徴を表わす重要なキーワードであると、言える。なお、ペアを構成する単語を「南部地方−特産品」のように文字で表わす代わりに「ＷＤ０００１−ＷＤ０００２」のように単語コードで表わしてもよい。

生成されたプロファイルデータ６ＰＤは、そのユーザのユーザコードと対応付けられてプロファイルデータ記憶部１２３に記憶される。

なお、そのユーザのプロファイルデータ６ＰＤが既にプロファイルデータ記憶部１２３に記憶されている場合は、プロファイルデータ生成部１０８は、そのプロファイルデータ６ＰＤを更新してもよい。更新の処理は、例えば次のように行うことができる。

既にプロファイルデータ６ＰＤに示される単語については、プロファイルデータ生成部１０８は、その単語の重要度Ｗを例えば次の式に基づいて算出し直す。
Ｗｉ＝（１−Ｐ）・Ｗ０ｉ＋Ｐ・Ｗ１ｉ
ただし、０≦Ｐ≦１、である。Ｗ０ｉは、既存のプロファイルデータ６ＰＤに示される単語ｉの重要度である。Ｗ１ｉは、今回算出された単語ｉの重要度である。

Ｐの値は、任意に設定することができる。過去の閲覧の際の結果を重要視するのであれば、Ｐの値を小さくすればよいし、今回の閲覧の際の結果を重要視するのであれば、Ｐの値を大きくすればよい。過去の閲覧の際の結果を全く考慮しないのであれば、Ｐを「１」にすればよい。

既存のペアのペア重要度Ｓも同様の方法で算出し直せばよい。つまり、次の式に基づいて算出し直せばよい。
Ｓｋ＝（１−Ｑ）・Ｓ０ｋ＋Ｑ・Ｓ１ｋ
ただし、０≦Ｑ≦１、である。Ｓｋ０は、既存のプロファイルデータ６ＰＤに示されるペアｋｎのペア重要度Ｓである。Ｓｋ１は、今回算出されたペア重要度Ｓである。

そして、プロファイルデータ生成部１０８は、単語ｉの重要度Ｗを、算出し直したＷｉに書き換え、ペアｋのペア重要度Ｓを、算出し直したペア重要度Ｓｋに書き換える。

上の各式によると、重要度Ｗおよびペア重要度Ｓは、次のように更新される。「南部地方」のこれまでの重要度Ｗが「６」であり、今回算出された重要度Ｗが「５」であり、Ｐが「０．３」である場合は、これらの値に基づいて重要度Ｗを算出し直すと、
Ｗ＝（１−０．３）・６＋０．３・５＝５．７
になる。

また、「南部地方」と「特産品」とのペアのペア重要度Ｓが「９」であり、今回算出されたペア重要度Ｓが「１０」であり、Ｑが「０．３」である場合は、これらの値に基づいてペア重要度Ｓを算出し直すと、
Ｓ＝（１−０．３）・９＋０．３・１０＝９．３
になる。

なお、初めて抽出された単語については、プロファイルデータ生成部１０８は、今回算出されたペア重要度Ｓおよび新しい単語コードとともにプロファイルデータ６ＰＤに追記する。また、初めて抽出されたペアのペア重要度Ｓについても同様に、今回算出されたペア重要度Ｓおよび新しいペアコードとともにプロファイルデータ６ＰＤに追記する。

〔情報の検索の処理〕
検索処理部１０９は、情報の検索の処理を、プロファイルデータ６ＰＤを用いて例えば次のように実行する。

ユーザが端末装置２に所定のコマンドを入力すると、検索クライアント２０８（図５参照）が起動する。なお、検索クライアント２０８は、検索処理部１０９による検索のサービスを受けるクライアントのモジュールである。

検索クライアント２０８は、検索のキーワード（以下、「検索キー」と記載する。）を入力するための入力画面をタッチパネルディスプレイ２０ｄに表示させる。そして、ユーザが入力した検索キーおよびこのユーザのユーザコードを示す検索要求データ６ＱＤをプロファイル管理サーバ１へ送信する。

プロファイル管理サーバ１において、検索処理部１０９は、検索要求データ６ＱＤを取得すると、検索要求データ６ＱＤに示される検索キーを次のように補正する。検索要求データ６ＱＤに示されるユーザコードのプロファイルデータ６ＰＤをプロファイルデータ記憶部１２３から読み出す。そして、検索要求データ６ＱＤに示される検索キー（単語）がプロファイルデータ６ＰＤに示される場合は、この検索キーとのペア重要度Ｓが最も高い単語を選出する。

例えば、検索キーが「南部地方」であり、「南部地方」と各単語との関連度が図１０に示す通りである場合は、ペア重要度Ｓの最も高い「村おこし」を選出する。

検索処理部１０９は、この検索キーと選出した単語との組合せ（例えば、「南部地方」および「村おこし」）を検索クエリとして用いて検索を行う。検索は、プロファイル管理サーバ１に備わっている検索エンジンを用いてもよいし、他の装置（例えば、ドキュメントサーバ３２）の検索エンジンを用いてもよい。また、この検索キーと選出した単語とをＡＮＤで繋いでもよいし、ＯＲで繋いでもよい。つまり、いわゆるＡＮＤ検索を行ってもよいし、いわゆるＯＲ検索を行ってもよい。

なお、検索キーがプロファイルデータ６ＰＤに示されない場合は、検索処理部１０９は、従来通り、端末装置２からの検索キーのみを検索クエリとして用いて検索を行う。

そして、検索処理部１０９は、検索結果を示す検索結果データ６ＡＤを、要求元である端末装置２へ送信する。

端末装置２において、検索クライアント２０８は、検索結果データ６ＡＤを受信すると、検索結果をタッチパネルディスプレイ２０ｄに表示させる。

または、検索処理部１０９は、検索要求データ６ＱＤに示される検索キー（単語）がプロファイルデータ６ＰＤに示される場合に、この検索キーとのペア重要度Ｓが所定の値以上であり、かつ、重要度Ｗが最も高い単語を選出し補足してもよい。

または、検索処理部１０９は、上述のいずれかの方法で選出した単語を、検索要求データ６ＱＤに示される単語と置き換えて、検索してもよい。

図１１は、端末装置２の全体的な処理の流れの例を説明するフローチャートである。図１２は、プロファイル管理サーバ１の全体的な処理の流れの例を説明するフローチャートである。図１３は、重要度調整処理の流れの例を説明するフローチャートである。

次に、プロファイル管理サーバ１および端末装置２の全体的な処理の流れを、フローチャートを参照しながら説明する。

端末装置２は、カレント文書の閲覧の開始の操作を検知すると（図１１の＃８５１でＹｅｓ）、文書データ６ＤＣをプロファイル管理サーバ１へ送信する（＃８５２）。さらに、所定の時間ごとに興味度ＲＩを検出し記録する（＃８５３）。

そして、端末装置２は、カレント文書の閲覧の終了の操作を検知すると（＃８５４でＹｅｓ）、全体興味度ＲＥを算出し（＃８５５）、全体興味度ＲＥおよび各時刻の興味度ＲＩなどを示すデータ、つまり、興味度データ６Ｋを生成し、プロファイル管理サーバ１へ送信する（＃８５６）。

または、端末装置２は、検索キーを受け付けると（＃８５７でＹｅｓ）、この検索キーなどを示すデータつまり検索要求データ６ＱＤを生成し、プロファイル管理サーバ１へ送信する（＃８５８）。その後、プロファイル管理サーバ１から検索結果データ６ＡＤを受信すると、検索の結果を表示する（＃８５９）。

なお、図１１に記載する全体的な処理は、最初から最後まで通しで行われるとは、限らない。端末装置２に対して行われた操作または入力されたデータなどに応じて、一部の処理が適宜、実行される。例えば、コマンド判別手段によって操作またはデータに基づいてコマンドを判別し、コマンドに対応するモジュールに対してディスパッチすればよい。図１２についても、同様である。

一方、プロファイル管理サーバ１は、端末装置２からデータを受信すると（図１２の＃８０１）、そのデータの種類に応じて次の処理を実行する。

文書データ６ＤＣを受信した場合は（＃８０２でＹｅｓ）、プロファイル管理サーバ１は、それを記憶しておく（＃８０３）。

または、興味度データ６Ｋを受信した場合は（＃８０４でＹｅｓ）、プロファイル管理サーバ１は、興味度データ６Ｋを記憶し（＃８０５）、プロファイルの生成に必要な部分をカレント文書の中から抽出する処理を実行する（＃８０６）。この処理の手順は、前に図７で説明した通りである。なお、この処理において、全体興味度ＲＥと閾値αとを比較した結果、全体興味度ＲＥが閾値α未満であることが分かった場合は（＃８０７でＮｏ）、プロファイルの生成のための以降の処理（＃８０８〜＃８１２）を中止する。

プロファイル管理サーバ１は、プロファイルの生成に必要な部分の中から単語を抽出し、それぞれの単語の重み付けを行う（＃８０８）。つまり、それぞれの単語の重要度Ｗを算出する。

また、プロファイル管理サーバ１は、プロファイルの生成に必要な部分の中から複数の単語のペアを抽出し、それぞれのペアの重み付けを行う（＃８０９）。つまり、それぞれのペアのペア重要度Ｓを算出する。

重要度Ｗおよびペア重要度Ｓを算出する処理と前後してまたは並行して、プロファイル管理サーバ１は、変化パターンを判定する（＃８１０）。

判定した変化パターンに応じて、プロファイル管理サーバ１は、ステップ＃８０８および＃８０９でそれぞれ算出した重要度Ｗおよびペア重要度Ｓを調整する処理を行う（＃８１１）。この処理は、図１３に示す手順で行われる。

変化パターンが急上昇パターンである場合は（＃７２１でＹｅｓ）、プロファイル管理サーバ１は、各単語の重要度Ｗを、所定の値γａを加えることによって増加させる（＃７２２）。さらに、各ペアのペア重要度Ｓを、所定の値γｂを加えまたは所定の値γｃを掛けることによって増加させる（＃７２３）。

変化パターンが緩上昇パターンである場合は（＃７２４でＹｅｓ）、プロファイル管理サーバ１は、各ペアのペア重要度Ｓを、所定の値γｄを加えまたは所定の値γｅを掛けることによって増加させる（＃７２５）。

そして、プロファイル管理サーバ１は、適宜調整した各単語の重要度Ｗおよび各ペアのペア重要度Ｓを用いてプロファイルデータ６ＰＤを生成し記憶する（図１２の＃８１２）。ただし、既にこのユーザのプロファイルデータ６ＰＤがある場合は、登録済の単語の重要度Ｗおよび登録済のペアのペア重要度Ｓを更新する。

または、検索要求データ６ＱＤを受信した場合は（＃８１３でＹｅｓ）、ユーザが指定した検索キーを、このユーザのプロファイルデータ６ＰＤに基づいて補正し（＃８１４）、補正した検索キーで情報を検索する（＃８１５）。そして、検索結果を示すデータつまり検索結果データ６ＡＤを端末装置２へ送信する（＃８１６）。

プロファイル管理サーバ１は、以上の処理を、端末装置２からデータを受信するごとに、適宜、実行する。

本実施形態によると、文書に含まれる単語ごとの、ユーザにとっての重要性の度合いを、従来よりも精度よく求めることができる。

以下、本実施形態の幾つかの変形例を、説明する。本実施形態と重複する点については、説明を省略する。

〔第一の変形例〕
図１４は、端末装置２の機能的構成の変形例を示す図である。

上述の実施形態によると、プロファイル管理サーバ１は、ステップ＃８１１において、各単語の重要度Ｗを一律に決定し、各ペアのペア重要度Ｓを一律に決定した。しかし、ユーザの興味の度合いが部分ごとに異なることがある。そこで、重要度Ｗおよびペア重要度Ｓをより精度よく調整するために、プロファイル管理サーバ１および端末装置２を次のように構成してもよい。

図１４に示すように、端末装置２に、注目部分検知部２０９を設ける。注目部分検知部２０９は、ユーザがカレント文書の閲覧を開始してから終了するまでの間、所定の時間（例えば、１〜１０秒）ごとに、カレント文書の中でユーザが注目している部分（以下、「注目部分」と記載する。）検知する。なお、興味度検出部２０３が興味度ＲＩを検知する時刻に検知するのが望ましい。

検知は、例えば、次の方法によって行うことができる。注目部分検知部２０９は、デジタルカメラ２０ｋまたは視線追従型ヘッドマウントディスプレイが検知する、ユーザの瞳（視線）の方向に基づいて、注目部分を検知する。公知の技術によると、注目部分は、単語の単位で検知することができる。

＜参考＞
http://www.toshiba.co.jp/tech/review/2005/11/60_11pdf/rd01.pdf
http://www.murata.co.jp/zaidan/annual/pdf/k03/2011/a04106.pdf
または、注目部分検知部２０９は、キーロガーによって、ユーザが下線を引きまたは手書きのコメントを加えている箇所を、注目部分として検知する。エアペンが指す場所を検知することによって、注目部分を検知してもよい。

または、カレント文書が複数のページによって構成されている場合は、注目部分検知部２０９は、現在表示されているページを注目箇所として検出してもよい。

興味度データ提供部２０７は、興味度データ６Ｋの代わりに、興味度データ６Ｌを生成し、プロファイル管理サーバ１へ送信する。

興味度データ６Ｌには、興味度データ６Ｋに示される内容に加え、注目部分検知部２０９によって検知された、時刻ごとの注目部分が示されている。

プロファイル管理サーバ１の必要部分抽出部１０３（図３参照）は、図７で説明した通り、ステップ＃７０４において、プロファイルの生成のために必要でない部分をカレント文書から削除する。上述の実施形態では、不要な部分（削除する部分）の例として、電子メールのヘッダおよびレターヘッドを挙げたが、第一の変形例では、さらに、興味度データ６Ｌに示される注目箇所以外の部分をも、削除する。これにより、重要度Ｗおよびペア重要度Ｓをより高い精度で算出することができる。

また、変化パターン判定部１０６は、カレント文書の全体についての変化パターンを判定したが、興味度データ６Ｌに基づいて、注目箇所ごとの変化パターンを判定してもよい。そして、重要度調整部１０７は、注目箇所ごとに、それの変化パターンに応じて重要度Ｗおよびペア重要度Ｓを調整してもよい。

第一の変形例によると、ユーザの目に留まった単語をより正確に特定し、その単語に対して高い重み付けを行うことができる。例えば、新しいお菓子の企画をしている人であれば、情報を探しているときに、「スナック菓子のトレンド」の中の「スナック菓子」および「トレンド」の単語に目が留まりやすい。第一の変形例によると、これらの単語に対して高い重み付けを行うことができる。

また、ユーザがカレント文書の中のある程度の塊（センテンス、段落、項、節など）の内容に興味が沸いた場合であっても、これらの塊を注目部分として抽出するので、注目部分の中の複数の単語同士の関連性つまりペア重要度Ｓをより正確に算出することができる。例えば、「南部地方では、気候を生かした特産品で村おこしの協力者を募集している。特産品は、海に近い地域性を生かした塩や寒暖差の大きさを生かした紅茶である。」という注目部分に、一瞬で興味を掻き立てる単語がなくても、ペアとして重要な要素を抽出し、ペア重要度Ｓをより正確に算出することができる。

〔第二の変形例〕
図１５は、重要度調整処理の流れの変形例を説明するフローチャートである。

上述の実施形態および第一の変形例では、プロファイル管理サーバ１の重要度調整部１０７は、必要部分抽出部１０３によって抽出された部分の各単語の重要度Ｗを一律に調整し、各ペアのペア重要度Ｓを一律に調整した。

しかし、調整する単語およびペアを図１５に示す方法によって調整してもよい。変化パターン判定部１０６は、時刻ごとの変化パターンを判定する。

重要度調整部１０７は、変化パターンが急上昇パターンである時刻における注目部分を選出し（図１５の＃７３１でＹｅｓ、＃７３２）、この注目部分に属する各単語の重要度Ｗを、所定の値γａを加えることによって増加させる（＃７３３）。さらに、この注目部分に属する各ペアのペア重要度Ｓを、所定の値γｂを加えまたは所定の値γｃを掛けることによって増加させる（＃７３４）。

さらに、重要度調整部１０７は、変化パターンが急上昇パターンではなく緩上昇パターンである時刻における注目部分を選出し（＃７３５でＹｅｓ、＃７３６）、この注目部分に属する各ペアのペア重要度Ｓを、所定の値γｄを加えまたは所定の値γｅを掛けることによって増加させる（＃７３７）。

〔第三の変形例〕
図１６は、必要部分抽出処理の流れの変形例を説明するフローチャートである。

上述の実施形態および各変形例では、プロファイル管理サーバ１は、全体興味度ＲＥが閾値α以上である場合にのみ、重要度Ｗおよびペア重要度Ｓを算出し、プロファイルデータ６ＰＤを生成しまたは更新した（図７および図１２参照）。しかし、全体興味度ＲＥが閾値α未満であっても、変化パターンとして急上昇パターンまたは緩上昇パターンが表れていれば、これらの処理を行ってもよい。

すなわち、必要部分抽出部１０３は、図１６に示す手順で処理を行う。興味度データ６Ｋに示される全体興味度ＲＥと閾値αとを比較し（図１６の＃７４１）、全体興味度ＲＥが閾値α以上である場合は（＃７４２でＹｅｓ）、カレント文書から必要な部分を抽出する処理を行う（＃７４４〜＃７４６）。全体興味度ＲＥが閾値α未満である場合であっても（＃７４２でＮｏ）、変化パターンが急上昇パターンまたは緩上昇パターンであると変化パターン判定部１０６によって判定された場合は（＃７４３でＹｅｓ）、カレント文書から必要な部分を抽出する処理を行う（＃７４４〜＃７４６）。変化パターンが上昇無パターンであると判定された場合は（＃７４３でＮｏ）、それ以降の処理を中止し、次の興味度データ６Ｋが受信されるのを待つ。なお、ステップ＃７４４〜＃７４６の処理の内容は、図７のステップ＃７０３〜＃７０５の処理と同様である。

〔第四の変形例〕
図１７は、変化率と所定の値との関係を定義するテーブルの例を示す図である。

上述の実施形態および各変形例では、変化パターンが急上昇パターンである場合に、変化率を問わず一律に重要度Ｗを増加させ、一律にペア重要度Ｓを増加させた。しかし、変化率に応じて増加させる量を変えてもよい。例えば、図１７（Ａ）のような、変化率が多いほど所定の値γａが大きくなる関係を表わすテーブルを予め用意しておく。そして、このテーブルに基づいて変化率に応じた所定の値γａを求め、重要度Ｗを算出すればよい。テーブルの代わりに関数を用いてもよい。ペア重要度Ｓについても、同様である（図１７（Ｂ）および（Ｃ）参照）。

変化パターンが緩上昇パターンである場合も同様に、図１７（Ｄ）または（Ｅ）に示すテーブルを用いて、重要度Ｗの増加量を変化率に応じて変えてもよい。

〔その他の変形例〕
特定の書式が設定され目立つ単語に対しては、他の単語よりも高い重要度を与えてもよい。例えば、太字の単語、フォントサイズが所定のサイズ以上の単語、文書のタイトルとして用いられている単語、および章のタイトルまたは小見出しとして用いられている単語に対して、他の単語よりも高い重要度を与えてもよい。または、要約の欄に用いられている単語に対して、他の単語よりも高い重要度を与えてもよい。ペアの一部または全部の単語に特定の書式が設定されている場合についても同様に、他のペアよりも高い重要度（ペア重要度）を与えてもよい。

または、変化パターンを、興味度ＲＩの変化率だけでなく、ユーザのアクションまたは集中の度合い（集中度）をも参照して、判定してもよい。例えば、ある時刻Ｔ１における変化パターンを、時刻Ｔ１における興味度ＲＩの変化率が閾値βａ以上であることだけでなく、時刻Ｔ１においてユーザが所定のアクションを行ったことまたは集中度が所定の値以上であることを、急上昇パターンであると判定する条件としてもよい。緩上昇パターンの判定についても、同様である。

これにより、誰かに話し掛けられることなど、他の原因で興味度が急上昇した場合を除外することができ、変化パターンの判定の精度を高めることができる。なお、アクションおよび集中度は、公知の技術によって検知することができる。

プロファイル管理サーバ１および端末装置２それぞれの役割を、適宜、変更することができる。

例えば、変化パターンの判定を、プロファイル管理サーバ１の代わりに端末装置２が行ってもよい。または、上述の実施形態および各変形例では、検索クエリの補正だけでなく検索もプロファイル管理サーバ１が行ったが、補正の結果をプロファイル管理サーバ１から端末装置２へ送信し、検索は端末装置２が行ってもよい。

または、ペア重要度Ｓおよび重要度Ｗの算出およびプロファイルデータ６ＰＤの生成などの処理をすべて、端末装置２が行ってもよい。

または、カレント文書を画像形成装置４に印刷させた場合に、より高い重要度Ｗおよびペア重要度Ｓを与えてもよい。

上述の実施形態および各変形例では、所定の値を加算しまたは掛けるアルゴリズムを用いて重要度を調整したが、他のアルゴリズムを用いてもよい。

その他、文書管理システム１ＳＹ、プロファイル管理サーバ１、および端末装置２の全体または各部の構成、処理内容、処理順序、データの構成などは、本発明の趣旨に沿って適宜変更することができる。

１プロファイル管理サーバ（単語重要度算出装置）
１０２興味度データ取得部（興味度入力手段）
１０４単語重要度算出部（重要度算出手段）
１０５ペア重要度算出部（ペア重要度算出手段）
１０６変化パターン判定部（変化パターン検知手段）
１０７重要度調整部（重要度算出手段、ペア重要度算出手段）
１０９検索処理部（検索処理手段）
１２３プロファイルデータ記憶部（プロファイルデータ記憶手段）
６ＰＤプロファイルデータ
Ｓペア重要度
Ｗ重要度

Claims

ユーザの、文書の閲覧中の各時刻における前記文書に対する興味の度合いである興味度を入力する、興味度入力手段と、
入力された前記興味度の変化のパターンを検知する、変化パターン検知手段と、
検知された前記パターンに基づいて、前記文書に含まれる単語ごとの、前記ユーザにとっての重要性の度合いである重要度を算出する、重要度算出手段と、
を有することを特徴とする単語重要度算出装置。
前記変化パターン検知手段は、前記パターンとして、第一の長さの時間における前記興味度の変化率が第一の率以上である第一のパターンおよび前記第一の長さよりも長い第二の長さの時間における前記興味度の変化率が前記第二の率よりも小さい第二の率以上である第二のパターンのうちの少なくともいずれかを検知し、
前記重要度算出手段は、前記第一のパターンが検知された場合は、前記重要度として、前記第二のパターンのみ検知された場合よりも、高い度数を算出する、
請求項１に記載の単語重要度算出装置。
前記重要度算出手段は、前記単語それぞれの重要度を、当該単語が前記文書に表れる頻度に応じて算出する、
請求項１または請求項２に記載の単語重要度算出装置。
前記重要度算出手段は、前記各時刻における前記興味度の中間値が所定の値以上である場合に、前記単語それぞれの前記重要度を算出し、そうでない場合は、算出しない、
請求項１ないし請求項３のいずれかに記載の単語重要度算出装置。
前記重要度算出手段は、前記単語のうちの前記文書の中の前記ユーザが注目した部分に含まれる単語の前記重要度として、他の単語の前記重要度よりも高い度数を算出する、
請求項１ないし請求項４のいずれかに記載の単語重要度算出装置。
前記重要度算出手段は、前記単語のうちの所定の書式で表わされる単語の前記重要度として、他の単語の前記重要度よりも高い度数を算出する、
請求項１ないし請求項５のいずれかに記載の単語重要度算出装置。
前記重要度算出手段は、前記単語のうちの前記文書の中の所定の欄に表われる単語の前記重要度として、他の単語の前記重要度よりも高い度数を算出する、
請求項１ないし請求項５のいずれかに記載の単語重要度算出装置。
検知された前記パターンに基づいて、前記文書に含まれる複数の単語同士からなるペアごとの、前記ユーザにとっての重要性の度合いであるペア重要度を算出する、ペア重要度算出手段、を有する、
請求項１ないし請求項７のいずれかに記載の単語重要度算出装置。
前記ペア重要度算出手段は、前記第一のパターンが検知された場合は、前記ペア重要度として、前記第二のパターンのみ検知された場合よりも、高い度数を算出する、
請求項８に記載の単語重要度算出装置。
前記ペア重要度算出手段は、前記ペアのうちの前記文書の中の前記ユーザが注目した部分に含まれるペアの前記ペア重要度として、他のペアの前記ペア重要度よりも高い度数を算出する、
請求項８または請求項９に記載の単語重要度算出装置。
前記単語ごとの前記重要度および前記ペアごとの前記ペア重要度を示すプロファイルデータを記憶するプロファイルデータ記憶手段と、
前記ユーザが指定した検索クエリーを前記プロファイルデータに基づいて補正し、当該補正した検索クエリーに基づいて情報を検索する処理を行う検索処理手段と、を有する、
請求項８ないし請求項１０のいずれかに記載の単語重要度算出装置。
コンピュータが、
ユーザの、文書の閲覧中の各時刻における前記文書に対する興味の度合いである興味度の入力を受け付ける処理と、
入力された前記興味度の変化のパターンを検知する処理と、
検知された前記パターンに基づいて、前記文書に含まれる単語ごとの、前記ユーザにとっての重要性の度合いである重要度を算出する処理と、
を実行することを特徴とする単語重要度算出方法。
コンピュータに、
ユーザの、文書の閲覧中の各時刻における前記文書に対する興味の度合いである興味度の入力を受け付ける処理と、
入力された前記興味度の変化のパターンを検知する処理と、
検知された前記パターンに基づいて、前記文書に含まれる単語ごとの、前記ユーザにとっての重要性の度合いである重要度を算出する処理と、
を実行させることを特徴とするコンピュータプログラム。