JPH0916627A

JPH0916627A - 情報フィルタ装置及び情報フィルタ方法

Info

Publication number: JPH0916627A
Application number: JP8102655A
Authority: JP
Inventors: Nobuhiro Shimogoori; 信宏下郡
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 1995-04-24
Filing date: 1996-04-24
Publication date: 1997-01-17
Anticipated expiration: 2016-04-24
Also published as: JP3472032B2

Abstract

(57)【要約】【課題】推定精度が良好であり、計算量が少く高速に推
論／学習を行なうことができる情報フィルタ装置を提供
すること。【解決手段】文書を入力する文書入力手段１と、この文
書入力手段より入力された前記文書からキーワードを抽
出するキーワード抽出手段３と、予め定められたキーワ
ードの組合せと評価値の関係を記憶する記憶手段４と、
この記憶手段に記憶された前記関係と前記文書から抽出
された前記キーワードのうちの所定のキーワードに基い
て、入力された前記文書の重要度を推論する推論手段５
と、この推論手段により重要と判定された文書を利用者
に表示する表示手段６と、この表示された文書の重要性
に関する評価値を得るための評価データ入力手段７と、
前記文書から抽出されたキーワードと得られた評価値を
用いて、前記キーワードの組合せと評価値の関係を学習
する学習手段８とを具備したことを特徴とする。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、入手した文書に読
む価値があるか否かを利用者に代わって判定し、読む価
値があると判定された文書のみを利用者に提示する情報
フィルタ装置及び情報フィルタ方法に関する。

【０００２】

【従来の技術】近年、情報機器や情報記憶媒体等の大容
量化・低価格化に伴い、膨大な量の電子化情報が種々の
媒体で流通されるようになった。このように情報量が増
大してくると、利用者が全ての情報に目を通すことは不
可能であり、読む価値のある情報を選択する必要がでて
くる。しかし、大量の情報のうちから、必要な情報だけ
を選択すること自体が一般ユーザの限られた能力や時間
では困難になっている。

【０００３】そこで、利用者に代わって新着の文書の内
容を前もって評価し、読む価値があると思われるものだ
けを利用者に提示するような情報フィルタが種々提案さ
れている。このような従来の情報フィルタは、文書の内
容に関するキーワードを用いて文書の選択或いは評価を
行うものであって、（１）検索式のようなルールを予め
登録しておくもの、（２）ニューラルネットを用いるも
の、などが知られている。

【０００４】しかしながら、従来のルール記述型の情報
フィルタでは、利用者側においてキーワードを用いて検
索式のようなルールを明示的に記述したものを用意する
必要がある。ここで、利用者の興味等が変化した場合に
はその都度、利用者自身がルールを再定義しなければ対
応できないので、不便である。また、利用者の要求を十
分に満たすようにルールを記述するためには、ある程度
の経験や試行錯誤が必要とされ、簡易に適切なルールを
記述できるといったようなものではない。

【０００５】また、従来のニューラルネットを用いた情
報フィルタでは、ニューラルネットが利用者の好みを学
習してそれに基づき、情報を選択するので利用者側にお
いてルール記述の手間や経験が不要というメリットがあ
るが、その反面、ニューラルネット側では利用者の好み
を学習するために膨大な計算量が必要となり、計算量を
抑えるようにすると、充分な学習効果が得られない。

【０００６】以上のように、大量の情報の中から、利用
者の必要とする情報を選択して、その利用者に提示する
ようにした従来の情報フィルタは、ルール記述型の情報
フィルタの場合には、利用者がルールを明示的に記述す
るひつようがあり、利用者の興味が変化した場合には、
再び利用者がルールを定義し直す必要があるので、使用
に際して不便であった。

【０００７】また、一方、ニューラルネットを用いた従
来の情報フィルタは、利用者の好みを学習するのに膨大
な計算量を必要とし、計算量を抑えようとすると充分な
学習効果が得られず、必要な情報を適確に選択できな
い。

【０００８】

【発明が解決しようとする課題】以上のように、大量の
情報の中から、利用者の必要とする情報を選択してその
利用者に提示するようにした従来の情報フィルタにおい
ては、ルール記述型の情報フィルタの場合、利用者がル
ールを明示的に記述せねばらず、利用者の興味が変化し
た場合には再び利用者がルールを定義し直さねばならず
不便であった。

【０００９】また、一方、ニューラルネットを用いた従
来の情報フィルタにおいては、利用者の好みを学習する
のに膨大な計算量を必要としており、計算量を抑えよう
とすると充分な学習効果が得られず、必要な情報を適確
に選択できないという問題があった。

【００１０】従って、いずれの方式の情報フィルタにお
いても使い勝手の良いものではなく、大幅な改善が必要
であり、実用性に乏しいものであった。そのため、もっ
と実用的な情報フィルタの開発が嘱望されている。

【００１１】そこで、この発明の目的とするところは、
大量の情報の中から、ユーザの必要とする情報を選択す
るにあたり、無用に手間をかけることなく利用者の好み
の変化を反映できて、しかも、推定精度が良好であり、
かつ計算量が少く高速に推論／学習を行なうことができ
るようにした実用性の高い情報フィルタ装置および情報
フィルタ方法を提供することにある。

【００１２】

【課題を解決するための手段】本発明は、大量の情報の
中から、ユーザの必要とする情報を選択するにあたり、
実用性の高い情報フィルタ装置を提供するものであっ
て、特に、次のような情報フィルタを提供することを目
的としている。

【００１３】（１）無用に手間をかけることなく利用
者の好みの変化を反映できること。（２）推定精度が良好であること。（３）計算量が少なく高速に推論／学習を行うことが
できること。そして、上記目的を達成するため、本発明はつぎのよう
にする。すなわち、文書を入力する文書入力手段と、こ
の文書入力手段より入力された前記文書からキーワード
を抽出するキーワード抽出手段と、予め定められたキー
ワードの組合せと文書の重要性に関する評価値の関係を
記憶する記憶手段と、この記憶手段に記憶された前記関
係と前記入力された文書から抽出された前記キーワード
のうちの所定のキーワードに基いて、前記入力された文
書の重要度を推論する推論手段と、この推論手段により
重要度が高いと判定された場合に、前記入力された文書
を利用者に表示する表示手段とを具備したことを特徴と
する。

【００１４】また、本発明は、入力された文書から抽出
されたキーワードに基いて該文書の重要度を推論し、該
文書が重要と判定された場合に提示を行なう情報フィル
タ装置において、前記推論に用いるための予め定められ
たキーワードの組合せと文書の重要度に関する評価値の
関係の情報を保持する記憶手段と、学習対象となる文書
からキーワードを抽出するキーワード抽出手段と、前記
学習対象となる文書の評価値を入力するための評価デー
タ入力手段と、前記文書から抽出されたキーワードのう
ちの所定のキーワードと得られた前記評価値を用いて、
前記記憶手段の保持する前記キーワードの組合せと評価
値の関係の情報を学習する学習手段とを具備したことを
特徴とする。

【００１５】また、本発明は、文書を入力する文書入力
手段と、この文書入力手段より入力された前記文書から
キーワードを抽出するキーワード抽出手段と、予め定め
られたキーワードの組合せと評価値の関係の情報を保持
する記憶手段と、この記憶手段に記憶された前記関係と
前記文書から抽出された前記キーワードのうちの所定の
キーワードに基いて、前記入力された文書の重要度を推
論する推論手段と、この推論手段により重要と判定され
た文書を利用者に提示する表示手段と、この表示された
文書の重要性に関する前記利用者の評価値を入力するた
めの評価データ入力手段と、前記文書から抽出されたキ
ーワードと得られた前記評価値を用いて、前記記憶手段
に保持させる前記キーワードの組合せと評価値の関係の
情報を学習させる学習手段とを具備したことを特徴とす
る。

【００１６】また、好ましくは、前記学習手段は、前記
キーワード抽出手段により前記所定のキーワード以外の
新規のキーワードが抽出された場合に、過去の前記関係
の学習結果に該新規キーワードを追加するキーワード追
加手段をさらに具備したことを特徴とする。

【００１７】また、好ましくは、前記学習手段は、前記
キーワードの組合せと評価値の関係を学習する際、前記
文書から抽出されたキーワードが影響を及ぼす範囲につ
いてのみ学習するものであり、前記推論手段は、文書か
ら抽出されたキーワードに所定のキーワードが存在しな
いとした場合の該文書の重要度を予め保持しておき、入
力された前記文書の重要度を推論する際、前記文書から
抽出されたキーワードに所定のキーワードが存在する場
合に該キーワードが該保持しておいた重要度を変動させ
る値を求め、この値に基いて該保持しておいた重要度を
修正することにより、入力された前記の重要度を求める
ものであることを特徴とする。

【００１８】また、好ましくは、前記推論手段は、入力
された前記文書の重要度をスペクトル理論に基づいて推
論するものであることを特徴とする。

【００１９】また、好ましくは、前記学習手段は、前記
キーワードの組合せと評価値の関係をスペクトル理論に
基づいて学習するものであることを特徴とする。また、
好ましくは、前記文書から抽出されたキーワードのうち
の前記所定のキーワードの、抽出された全キーワードに
占める割合が、予め定められた値に満たない場合は、前
記推論手段による推論を行なわずに利用者に表示するよ
うにしたことを特徴とする。

【００２０】本発明では、入力された文書からキーワー
ドを抽出し、記憶手段に記憶している予め定められたキ
ーワードの組合せと文書の重要性に関する評価値の関係
の情報と前記入力文書から抽出されたキーワードのうち
の所定のキーワード（例えばテーブルに登録してあるキ
ーワード）に基いて、その入力された文書の重要度を推
論する。そして、推論手段により重要と判定された文書
を利用者に提示する。

【００２１】この推論は、好ましくは、スペクトル理論
（高速スペクトル理論）に基づいて行なわれる。また、
本発明では、入力文書から抽出されたキーワードに基い
て該文書の重要度を推論し、該文書が重要と判定された
場合に表示を行なうような情報フィルタにおいて、記憶
手段に保持させる推論に用いるための予め定められたキ
ーワードの組合せと文書の重要性に関する評価値の関係
の情報を学習する際、学習対象となる文書から抽出され
たキーワードのうちの所定のキーワード（例えばテーブ
ルに登録してあるキーワード）と、得られた評価値を用
いて、キーワードの組合せと評価値の関係を学習する。
この学習は、好ましくは、スペクトル理論に基づいて行
なわれる。

【００２２】本発明によれば、評価対象の文書から抽出
されるキーワードの組合せと、このキーワードの組み合
わせで決まる文書の重要度に関する評価値の関係だけに
基いて推論／学習を行なうので、良好な推定精度を維持
しつつ、しかも、計算量を少くし、高速に判定／学習を
行なうことが可能な情報フィルタ装置を得ることができ
るようになる。従って、本発明によれば、利用者は明ら
かに興味のない文書を読む必要がなくなる。

【００２３】尚、本発明はコンピュータで読取り、実行
できるアプリケーションソフトウエアとして可搬可能な
記憶媒体に格納するなどして頒布可能であることから、
次のような形態も発明の範疇に含まれる。

【００２４】［１］コンピュータなどのような情報表
示装置と共に用いられ、入力した文書から情報をフィル
タすることにより所定の文書を表示する処理プログラム
を媒体内に記憶したコンピュータ読み取り実行可能な記
憶媒体であって、入力された文書からキーワードを抽出
するプログラムコード手段と、予め定められたキーワー
ドの組合せと文書に与えられる評価値との関係を記憶す
るプログラムコード手段と、記憶された前記関係と前記
入力された文書から抽出された前記キーワードのうちの
所定のキーワードとに基づいて、前記入力された文書の
重要度を推論するプログラムコード手段と、からなる処
理プログラムを媒体内に記憶した読み取り可能な記憶媒
体。

【００２５】［２］前記推論により得られた重要度
が、所定の条件を満たしているか否かを判定するプログ
ラムコード手段と、前記判定により所定の条件を満たし
ていると判定された場合に、前記入力された文書に関す
る所定の情報を利用者に表示するプログラムコード手段
と、を更に具備してなる処理プログラムを媒体内に記憶
した前記［１］記載の読み取り可能な記憶媒体。

【００２６】［３］表示された前記所定の情報に基づ
いて、前記利用者に対する評価値を入力するプログラム
コード手段と、前記文書から抽出されたキーワードと、
前記入力された評価値とに基づいて、前記キーワードの
組合せと前記評価値との関係の情報を学習するプログラ
ムコード手段と、を更に具備してなる処理プログラムを
媒体内に記憶した前記［２］記載の読み取り可能な記憶
媒体。

【００２７】［４］前記学習させるプログラムコード
手段は、前記所定のキーワード以外の新規のキーワード
が抽出された場合に、前記新規のキーワードを追加する
プログラムコード手段を更に有してなる処理プログラム
を媒体内に記憶した前記［３］記載の読み取り可能な記
憶媒体。

【００２８】［５］前記学習させるプログラムコード
手段は、前記キーワードの組合せと評価値の関係を学習
する際、前記文書から抽出されたキーワードが影響を及
ぼす範囲について学習するプログラムコード手段を含
み、前記推論するプログラムコード手段は、文書から抽
出されたキーワードに所定のキーワードが存在しないと
した場合の当該文書の重要度を予め保持しておき、入力
された前記文書の重要度を推論する際に、前記文書から
抽出されたキーワードに所定のキーワードが存在する場
合に当該キーワードが保持しておいた重要度を変動させ
る値を求め、この値に基づいて該保持しておいた重要度
を修正することにより、入力された前記の重要度を求め
るプログラムコード手段を含んでなる処理プログラムを
媒体内に記憶した前記［３］記載の読み取り可能な記憶
媒体。

【００２９】

【発明の実施の形態】以下、図面を参照しながら本発明
の具体例を説明する。

【００３０】（第１の具体例）図１は、本発明の第１の
具体例に係る情報フィルタ装置の構成を示す図である。
本発明の第１の具体例における情報フィルタ装置は、文
書入力部１、文書記憶部２、キーワード抽出部３、デー
タ記憶部４、推論部５、表示部６、評価データ入力部７
及び学習部８を備えている。

【００３１】文書入力部１は、外部から電子化された文
書のデータ（以下、単に文書と呼ぶ）を入力するための
ものであり、文書の伝達形態に応じて、ネットワーク接
続装置、無線受信装置、磁気デイスク／テープ読取り装
置、ＣＤ‐ＲＯＭ読取り装置等の所望の装置を用いるこ
とができる。

【００３２】文書記憶部２は、外部から入力した文書を
一時的に蓄えるためのものであり、磁気ディスク装置、
磁気テープ装置、光ディスク装置、半導体メモリ等、所
望の装置を用いることができる。

【００３３】キーワード抽出部３は、文書記憶部２に一
時的に蓄えられた新たな文書から、所定のキーワードを
抽出する。文書からのキーワード抽出にあたってどのよ
うなキーワードを抽出の対象とするかは、次のようにし
て決める。

【００３４】キーワードは予め文書に付加して送る形態
と、付加しない形態とがあるので、キーワードの抽出に
は、例えば次のような方法を適用すればよい。

【００３５】予め文書にキーワードが付加されていない
場合には、(1) 公知のキーワード抽出手段（例えば、石
川巌他：「文書解析処理に基づく主題索引作成支援シス
テム」、情報処理学会論文誌Ｖｏｌ．１３２，１９９１
にて開示されているキーワード抽出手段等）を用いて文
書中からキーワードを抽出する。

【００３６】また、英文の場合には、単語の語幹を抽出
する。

【００３７】予め文書にキーワードが付加されている場
合には、次のような手段が用いられる。

【００３８】［１］上記(1) のキーワード抽出手段を
用いる、［２］文書に付加されているキーワードを取り出す。
そして、この取り出したものをキーワードとする。

【００３９】［３］上記［１］、［２］の両者を併用
する。

【００４０】このようにすることにより、所要とするキ
ーワードを定めてそのキーワードに該当するキーワード
を文書中から検索抽出する。

【００４１】データ記憶部４は、データを記憶保持する
ものであって、詳細は後述するスペクトル理論に基づい
た推論に用いる係数（後述するαｓ）、入力ベクトル及
び事例ベクトルの作成に用いる図２に示すようなキーワ
ードテーブル、及び／又は、学習部８の学習結果などを
記憶する。

【００４２】図２に示すようなキーワードテーブルは、
例えば、キーワードとして“ワープロ”、“辞書”、
“帰納”、“学習”、“情報”、“フィルタ”、“光
学”…といった言葉（キーワード）をキーワード番号と
共に登録する。具体的には、例えば、“ワープロ”とい
う言葉は“１”というキーワード番号と共に登録されて
おり、“辞書”という言葉は“２”というキーワード番
号と共に登録されており、“帰納”という言葉は“３”
というキーワード番号と共に登録されている。

【００４３】推論部５は、入力文書中からキーワード抽
出部３で抽出されたキーワード群をキーワード抽出部３
から受取り、データ記憶部４に記憶されているキーワー
ドテーブルを用いて、キーワード抽出部３から受け取っ
たキーワードのキーワード番号を求め、入力ベクトルを
生成した後に、データ記憶部４に記憶されている現時点
での係数αｓを用いてスペクトル理論に基づく推論を行
う。この推論における出力は、文書を利用者に提示すべ
きであるか否かを示す情報である。例えば、文書を利用
者に提示すべきであると判定された場合は“１”を、そ
うでない場合は“−１”を出力する。

【００４４】表示部６は制御機能部６ａと出力部６ｂと
を有する。制御機能部６ａは推論部５による上記の推論
の結果、利用者に提示すべきであると判定された文書の
内容を利用者に提示するためのものであって、推論部５
から指示された文書を文書記憶部２から読み出して出力
制御する。出力部６ｂは、この制御機能部６ａによる出
力制御に基づき、その文書を表示もしくは印字出力する
ものであって、デイスプレイ装置やプリンタ装置、或い
は音声出力装置などがあげられる。

【００４５】評価データ入力部７は、提示された文書に
対する評価データを入力する。評価データとは、例え
ば、文書が読む価値のあるか否かを示す情報である。実
際に入力する評価データとしては、文書が読む価値のあ
るものであった場合は評価値“１”を、そうでなかった
場合は評価値“−１”を入力しても良いし、他の形態
（例えば“Ｏ（マル），×（バツ）”又は“ｔｒｕｅ，
ｆａｌｓｅ”等）の情報をキー入力或いは選択入力し、
評価データ入力部７内部で評価値“１”や“−１”に変
換するようにしても良い。

【００４６】学習部８は、評価データ入力部７への入力
から得られた評価値（“＋１”又は“−１”）に基づい
て係数αｓの学習を行う。

【００４７】本具体例の情報フィルタ装置の概略動作を
説明する。本具体例の情報フィルタ装置の動作は、大き
く分けると実際の情報フィルタリング処理とその結果の
選択提示動作を含めた推論のプロセスと、良好な推論結
果を得るための学習のプロセスの２つからなる。

【００４８】推論のプロセスにおいては、文書入力部１
から新たに入力された文書は文書記憶部２に一時的に蓄
えられる。そして、この文書からキーワード抽出部３に
よりキーワードが抽出される。推論部５は、当該文書に
関して抽出されたキーワード群を受取り、図２に示した
ようなキーワードテーブルを用いて、出現したキーワー
ドのキーワード番号を求め、入力ベクトルを生成し、現
時点での係数αｓを用いてスペクトル理論による推論を
行う。

【００４９】そして、推論部５はスペクトル理論による
推論の結果、利用者に提示すべきであると判定した場合
には、表示部６に文書を表示することを指示する。この
指示を推論部５から受けると、表示部６は文書記憶部２
に記憶されている当該提示すべきと判定した文書の内容
を読み出して出力部６ｂに出力し、利用者に提示する。
利用者は出力部６ｂから出力された文書を読むことにな
る。

【００５０】学習プロセスは次のように行われる。

【００５１】利用者は、推論のプロセスによって表示部
６において提示された文書に対する評価を評価データ入
力部７より入力する。この入力された評価のデータは学
習部８に与えられ、学習部８はこの与えられた評価値を
もとにスペクトル理論に基づいて係数αｓの学習を行
う。

【００５２】この学習プロセスは、予め与えられた教示
データに基づく初期学習および推論のプロセスに伴う学
習の際に行われる。すなわち、良好な予測結果を得るた
めに、教示データを与え、後述する係数αｓを計算す
る。また、推論のプロセスにおいて教示された文書に対
して、利用者が評価を与えることにより、さらに係数α
ｓが計算され、学習が進むこととなる。

【００５３】推論部５、学習部８にて行うスペクトル理
論に基づく推論・学習について説明する。ここで、スペ
クトル理論は、例えば、Nathan Linial 等による"Const
antDepth Circuits, Fourier Transform, and Learnabi
lty", Jouranl of the Association for Computing Mac
hinery, Vol. 40, No. 3, July 1993, pp. 607-620)等
に詳しく述べられている。

【００５４】スペクトル理論では、入力（問題）と出力
（正解）の組みを与えて、評価関数のパラメータの学習
を行い、今までに入力されたことのない新たな問題が与
えられた場合に、その時点でのパラメータを用いて正解
を推論する。もちろん、入力されたことのある問題が与
えられた場合も正解を得ることができる。

【００５５】このようなスペクトル理論を情報フィルタ
装置に適用する場合、キーワードの集合又はその要素の
組合わせを入力（問題）とし、これに対応する評価値を
出力（正解）とし、新着文書から抽出したキーワードの
組合わせを入力として与えて、これに対応する評価値を
推論する。

【００５６】すなわち、本発明の推論及び学習は、予め
内容と評価のわかっている複数の事例を与えてどのよう
な入力の場合にどのような出力（評価値）となるかを予
め学習させ、学習終了後に、ある入力の答えが、どのよ
うな評価値をとるかを予測するものである。このような
推論及び学習に対し、本発明ではスペクトル理論を用い
ている。

【００５７】もう少し具体的にスペクトル理論について
説明する。例えば、学習事例として以下のような入力ベ
クトル（入力）及び出力（評価値）からなる事例を与え
て学習を行う。

【００５８】入力（０，１，１，１，１）出力“＋１” 入力（１，０，１，１，１）出力“−１” 入力（１，１，０，１，１）出力“＋１” 入力（１，１，１，０，１）出力“−１” 入力（１，１，１，１，０）出力“＋１” すなわち、スペクトル理論の手法とは、所定の入力ベク
トルを入力した場合にその入力に対応して、どのような
出力（評価値）が得られるかを学習させ、その学習が終
了した後に、例えば、入力ベクトルが“入力（１，１，
１，１，１）”である場合の答えが、“＋１”である
か、或いは“−１”であるかを予測するような推論を行
う手法である。

【００５９】このようなスペクトル理論の手法を情報フ
ィルタに応用するために、本発明システムにおける推論
部５では、推論を行おうとする対象である文書からキー
ワード抽出部３によって抽出されたキーワード（抽出キ
ーワード）について統一的な順番を付けて並べる。この
統一的な順番とは、例えば、キーワードテーブルのキー
ワードの並び順を意味するが、この並び順をユーザが適
宜編集して、変更できるようにしても良い。そして、抽
出したキーワードを順に、興味を引く対象として登録さ
れた語句（キーワード）に対応するキーワードであるか
図２に示すようなキーワードテーブルを参照して調べ、
登録されたものに該当していれば“１”に、該当してい
なければ“０”に置き換えることによって入力ベクトル
を作成する。具体的には、抽出キーワード群を順に１つ
づつ、登録キーワードと比較して登録キーワードに一致
するものがあれば“１”と置き、一致するものがなけれ
ば“０”と置くことで、入力ベクトルを生成する。

【００６０】また、学習にあたっては、本具体例におい
ては、利用者が興味を持つ内容の文書の場合は出力（評
価値）を“１”、興味のない内容の文書の場合は出力
（評価値）を“０”とし、これを用いて入力・出力の組
（入力ベクトルと評価値の組）による事例を構成し、幾
つかの事例を学習文書として与えることによって、推論
に用いるパラメータの学習を行う。

【００６１】例えば、利用者の興味のある分野のキーワ
ードとして、図２のようなキーワードが予めシステムに
登録されており、学習のための事例文書に「“情報”、
“フィルタ”、“学習”、“利用者”、“アルゴリズ
ム”」の５つのキーワードが、「“…”，“…”，
“…”，“情報”，“フィルタ”，“学習”，“…”，
“利用者”，“…”，“…”，“…”，“アルゴリズ
ム”，“…”，“…”，“…”」（但し、“…”はキー
ワードテーブルにキーワードとして登録されていない語
句であるが、キーワード抽出部３が抽出キーワードとし
て抽出したものを示す）のように他の語句に混って出現
していたとすると、この場合、この文書に対して推論部
５にて生成される入力ベクトルは、（０，０，０，１，１，１，０，１，０，０，０，１，
０，０，０）となる。

【００６２】そして、学習を行う場合に、利用者が、こ
の提示された文書を読んでみて、読むに値するか否かを
判断して、利用者が評価データ入力部７よりその旨の評
価を入力する。評価データ入力部７から、その評価対応
に評価値“＋１”（読むに値する）、評価値“−１”
（読むに値しない）が、学習部８に与えられることによ
って、学習部８はこの与えられた評価値“＋１”、“−
１”に基づいて係数αｓを計算し、この係数αｓに基づ
いて学習が行われる。

【００６３】このようにして利用者が、表示された文書
を読んだ結果、読むに値するか否かの評価をデータ入力
部７で入力することで学習部８は当該データ入力部７か
ら評価対応に出力される評価値（“＋１”又は“−
１”）に基づいて係数αｓの学習を行う。

【００６４】次に、スペクトル理論に基づく学習方法と
推論方法を具体的に示す。

【００６５】まず、学習や推論で使用する要素について
定義とその説明を行う。ここで使用する要素には、Ｘ，
Ｘｉ，Ｓ，ｓ，χｓ（Ｘｉ），αｓ，ｆ（Χｉ）といっ
たものがある。

【００６６】これらのうち、入力ベクトル全体集合
“Ｘ”は入力事例の全体を表す。例えば、以下のような
入力ベクトルがその並び順に入ってきたとする。

【００６７】（０，１，１，１，１）（１，０，１，１，１）（１，１，０，１，１）（１，１，１，０，１）（１，１，１，１，０）この例の場合、入力事例の全体を示す入力ベクトル全体
集合Ｘは、Ｘ＝（（０，１，１，１，１）、（１，０，
１，１，１）、（１，１，０，１，１）、（１，ｌ，
１，０，１）、（１，１，１，１，０））と書ける。

【００６８】入力ベクトル要素“Ｘｉ”はｉ番目の入力
事例の入力ベクトルを表す。例えば、上記の場合、１番
目の入力事例は、“（０，１，１，１，１）”であり、
２番目の入力事例は“（１，０，１，１，１）”であ
り、３番目の入力事例は“（１，１，０，１，１）”と
いった具合である。

【００６９】属性集合“Ｓ”は、属性ｓの組み合わせの
全体を表す。

【００７０】キーワード属性集合ｓとは、本具体例にお
いては、キーワードの番号の組合せからなるものをい
う。例えば、属性ｓが１〜３まで存在する場合（キーワ
ードの番号が１〜３までの３種がある場合）、実質的に
同じ組み合わせとなるものを除くと、キーワード属性集
合ｓの組み合わせの全体Ｓは、Ｓ＝（（１），（２），
（３），（１，２），（１，３），（２，３），（１，
２，３））となる。ただし、キーワード属性集合ｓの組
合わせを所定の次数で打ち切る場合は、Ｓは当該所定の
次数内での属性の組み合わせの全体とする。なお、ここ
で言う次数は、Ｓの中の１つの値を表すキーワード属性
集合ｓに含まれる属性の数を指す。

【００７１】すなわち、ｓ＝（１，３）の場合、次数は
“２”であり、ｓ＝（２）の場合、次数は“１”であ
り、ｓ＝（１，２，３）の場合、次数は“３”である。
従って、例えば、次数“２”で打ち切る場合のＳは、上
述の例の場合、Ｓ＝（（１），（２），（３），（１，
２），（１，３），（２，３））となる。

【００７２】要素“ｓ”は属性の組み合わせの属性集合
Ｓの中の１つの値を表す。例えば、（１，２，３）や
（３）或いは（１，２）の如く、“（）”で括られた属
性を指している。

【００７３】要素“χｓ（Ｘｉ）”はｉ番目の事例の入
力ベクトルＸｉにおいて、キーワード属性集合ｓに対応
する要素の値が“１”であるものの数が奇数個ならば
“−１”を、偶数個（偶数個には０個の場合も含む）な
らば“１”を係数として返すような関数を表す。

【００７４】例えば、ｉ番目の入力事例であるＸｉの入
力ベクトルがＸｉ＝（１，０，０）で、ｓ＝（１，３）
ならば、入力ベクトルＸｉ中の１番目の値は“１”、３
番目の値は“０”であるので、“１”であるものの数は
１個であってこれは奇数個であり、この場合、“−１”
を返すことになるから、関数χｓ（Ｘｉ）として表すと χｓ（Ｘｉ）＝χ1,3 （１，０，０）＝−１となる。また、Ｘｉ＝（１，０，０）、ｓ＝（２，３）
ならば、Ｘｉ中の２番目の値は“０”、３番目の値は
“０”であるので、“１”であるものの数は０個であ
り、これは偶数個であるから、この場合、“１”を返す
ことになるので、関数χｓ（Ｘｉ）は、 χｓ（Ｘｉ）＝χ2,3 （１，０，０）＝１となる。

【００７５】この“−１”及び“１”が次に説明する係
数αとなる。

【００７６】つまり、α1 の内容が“−１”であったと
すると、ｉ番目の入力事例であるＸｉ＝（１，０，
０）、ｓ＝（１）は、入力ベクトルＸｉにおけるキーワ
ード並び順での１番目のキーワードに、登録キーワード
が出現した数が奇数個あったことを示し、“１”であっ
たならばそれが０個であったことを示し、α2 の内容が
“−１”であったとすると、ｉ番目の入力事例であるＸ
ｉ＝（１，０，０）、ｓ＝（２）は、入力ベクトルＸｉ
におけるキーワード並び順での２番目のキーワードに、
登録キーワードが出現した数が奇数個あったことを示
し、“１”であったならばそれが０個であったことを示
し、α1,2 の内容が“−１”であったとすると、ｉ番目
の入力事例であるＸｉ＝（１，０，０）、ｓ＝（１，
２）は、入力ベクトルＸｉにおけるキーワード並び順で
の１番目と２番目のキーワードに、登録キーワードが出
現した数が奇数個あったことを示し、“１”であったな
らばそれが０個であった場合を含めて偶数個あったこと
を示し、α1,2,3 の内容が“−１”であったとすると、
ｉ番目の入力事例であるＸｉ＝（１，０，０）、ｓ＝
（１，２，３）は、入力ベクトルＸｉにおけるキーワー
ド並び順での１番目と２番目と３番目のキーワードに、
登録キーワードが出現した数が奇数個あったことを示
し、“１”であったならばそれが０個であった場合を含
めて偶数個あったことを示しているといった具合であ
る。

【００７７】これを学習対象の事例における入力ベクト
ル毎に、属性の組み合わせ別の登録キーワード出現数を
奇数、偶数の表示で並べたものがαｓである。

【００７８】要素“ｆ（Χｉ）”は、入力事例Ｘｉに対
する評価の推論出力（予測値）を表す。

【００７９】

【数１】

【００８０】ｓｉｇｎ（ｘ）：ｘ≧０ならばｓｉｇｎ
（ｘ）＝１、ｘ＜０ならばｓｉｇｎ（ｘ）＝−１となる
ような関数を表す。

【００８１】スペクトル理論に基づく学習は、次の数式
（１）によって行われる。

【００８２】

【数２】

【００８３】全てのｓに関してαを求める。ｍは事例の
総数である。スペクトル理論に基づく推論は、次の数式
（２）によって行われる。

【００８４】

【数３】

【００８５】与えられた問題事例ｘに対して式（２）を
用いると、ｆ（ｘ）の予測値が得られる。なお、推論
に、式（２）を使う限りは、右辺の値の正負が問題であ
るので、式（１）において分子をｍで割らなくても同じ
結果が得られることから、学習を次の式（３）で行うよ
うにしても構わない。本具体例では、式（３）を使用し
て説明している。

【００８６】

【数４】

【００８７】ところで、属性ｓの全ての組合わせを用い
て上記の推論・学習を行うようにする方が、より高い予
測精度が得られるようになるが、属性の数（キーワード
の数）の増加にともない、べき乗のオーダで計算量が増
えてしまう。前述の"NathanLinial" 等による文献によ
れば、一定の次数で学習を終了しても、おおまかな学習
は終了しており、予測精度にそれほどの差がないものと
考えられる。

【００８８】そこで、上記の学習と推論（予測）で用い
るＳの次数を同じ値で制限することにより、全体の次数
を制限し、計算量を削減することができる。

【００８９】以上がスペクトル理論を用いた推論・学習
の説明である。

【００９０】次に、図３を参照しながら推論部５の働き
を説明する。図３は、推論部５における処理の流れを示
すフローチャートである。

【００９１】推論部５は起動されると、キーワード抽出
部３から文書に現れたキーワードの一覧を読み込む（ス
テップＳ１０１）。すなわち、キーワード抽出部３は文
書が入力されると当該文書に現れたキーワードを抽出し
て一覧を形成し、保持しているので推論部５はこれを読
み込む。

【００９２】キーワードの一覧が読み込まれたならば、
次にこの読み込まれた各キーワードそれぞれについての
そのキーワード番号を、データ記憶部４に保存されてい
る図２の如きキーワードテーブルを参照しながら求め、
入力ベクトルを生成する（ステップＳ１０２）。

【００９３】その際、キーワードテーブルを参照しても
見付からないキーワード、つまり、キーワードテーブル
に登録されていないキーワードは、無視される。

【００９４】次に、キーワード同士の組み合わせ（前述
のＳ）の存在の有無を調べ（ステップＳ１０３）、その
結果、キーワード同士の組み合わせ（前述のＳ）が、ま
だ存在している場合には、次の組み合わせを生成し（ス
テップＳ１０４）、生成された組み合わせに関して予測
値の計算を行い（ステップＳ１０５）、ステップ１０３
に戻る。

【００９５】ステップＳ１０３での判定の結果、キーワ
ード同士の組み合わせがこれ以上存在しない場合には、
予測値の計算は終了する。ここで、式（２）のｓｉｇｎ
関数に代入する値、すなわち次の式（４）のｈ（ｘ）が
得られる。

【００９６】

【数５】

【００９７】入力された文書に対する評価の推論出力
（予測値）は、ｓｉｇｎ（ｘ）に代入すると、ｈ（ｘ）
が“０”未満であった場合（ステップＳ１０７）には、
予測値は“−１”となり、この場合はシステムは利用者
に当該評価対象となった入力された文書の提示を、実施
しないで終了する。しかし、ｈ（ｘ）が“０”以上であ
った場合（ステップＳ１０６）には、予測値は“−１”
となり、このときは推論部５は表示部６に文書を提示す
ることを指示し（ステップＳ１０７）、処理を終了す
る。そして、この提示の指示を受けた表示部６は、当該
評価対象となった文書を文書記憶部２より読み出して表
示出力或いはプリント出力する。

【００９８】図４を参照しながら学習部８の働きを説明
する。図４は、学習部８による処理の流れを示すフロー
チャートである。学習部８は、例えば、ユーザによる評
価データ入力部７から入力操作などによって起動され
る。

【００９９】学習部８は起動されると、キーワード抽出
部３から文書に現れたキーワードの一覧を読み込む（ス
テップＳ２０１）。読み込まれたキーワードのキーワー
ド番号をデータ記憶部４に保存されている図２のような
キーワードテーブルを参照しながら求め、事例ベクトル
を生成する（ステップＳ２０２）。この時、キーワード
テーブルに登録されていないキーワードは無視する。

【０１００】次に学習部８は、使用者が評価データ入力
部７の操作によって与えた評価を読み込む（ステップＳ
２０３）。この評価は、推論部５が表示指示した文書を
読んで使用者が自己にとって有用か、或いは興味がある
か否かの率直な判断評価である。

【０１０１】この評価が読み込まれると、次にキーワー
ド同士の組み合わせ（前述のＳ）の有無を調べる（ステ
ップＳ２０４）。その結果、キーワード同士の組み合わ
せ（前述のＳ）が存在している場合には、キーワード同
士の組み合わせを１つ生成し（ステップＳ２０５）、生
成された組み合わせに関して係数（前述のα）の計算を
行い（ステップＳ２０６）、ステップＳ２０４に戻る。
なお、ステップＳ２０６において、ｆ（Ｘ）はステップ
Ｓ２０３において読み込んだ、評価値のことである。

【０１０２】次にステップＳ２０４において再びキーワ
ード同士の組み合わせ（前述のＳ）の有無を調べる。そ
の結果、キーワード同士の組み合わせ（前述のＳ）がま
だ存在している場合には、次の組み合わせを生成し（ス
テップＳ２０５）、生成された組み合わせに関して係数
（前述のα）の計算を行い（ステップＳ２０６）、ステ
ップＳ２０４に戻る。

【０１０３】このような処理をキーワード同士の組み合
わせが存在する限り繰り返すが、ステップＳ２０４での
判断の結果、キーワード同士の組み合わせがもう存在し
ない場合には、係数の計算は終了し、求めた係数αをデ
ータ記憶部４に保存し（ステップＳ２０７）、終了す
る。

【０１０４】上記の動作を、キーワードテーブルに登録
するキーワード数を“６”、扱う係数αの次数を“２”
までとして、フィルタリングを行う例を示して、本具体
例をより具体的に説明する。

【０１０５】まず、学習による係数αの初期設定につい
て説明する。登録されているキーワードは図５に示すよ
うなものであるとする。図５の例は、キーワード番号１
番として“keyword*1 ”が、キーワード番号２番として
“keyword*3 ”が、キーワード番号３番として“keywor
d*3 ”が、キーワード番号４番として“keyword*4 ”
が、そして、キーワード番号５番として“keyword*5 ”
が登録されていることを示している。

【０１０６】ここで、（keyword*1 、keyword*3 ）が必
要なキーワードの組、（keyword*3、keyword*4 ）が不
要なキーワードの組であったとすると、次に、これらの
キーワードの組を用いて、仮想的に文書群を生成する。
仮想的な文書群の生成は、１文書あたり、上記６つのキ
ーワード中の３つのキーワードを含む構成として、それ
らの組み合わせ別のものをそれぞれ別の種類の文書とし
て考えた場合、例えば、各文書は（keyword*1 、keywor
d*3 ）又は（keyword*3 、keyword*4 ）のいずれかを主
体としてこれに更に別の１つのキーワードを加えた３つ
のキーワードを持つバリエーションとして生成する。

【０１０７】この結果、 (keyword*1、keyword*3 、keyword*3) (keyword*1、keyword*3 、keyword*4) (keyword*1、keyword*3 、keyword*5) (keyword*3、keyword*3 、keyword*4) (keyword*3、keyword*4 、keyword*5) (keyword*3、keyword*4 、keyword*6) の６種類の仮想文書が得られることになる。

【０１０８】これらの全ての仮想文書は上述のようなそ
れぞれ異なる組み合わせのキーワード３つを含む文書と
いうことになるが、これらのうち、必要なキーワードの
組が出現する仮想文書が必要な文書、不必要なキーワー
ドの組が出現する仮想文書が不必要な文書であるとし
て、それぞれに得点付けを行う。

【０１０９】更に、ノイズとして、“keyword*5 ”、
“keyword*6 ”を持つ仮想文書が存在する。ここでは、
以下の文書を学習させる。

【０１１０】「必要な文書」 (keyword*1、keyword*3 、keyword*3) 評価値…＋１ (keyword*1、keyword*3 、keyword*4) 評価値…＋１ (keyword*1、keyword*3 、keyword*5) 評価値…＋１「不必要な文書」 (keyword*3、keyword*3 、keyword*4) 評価値…−１ (keyword*3、keyword*4 、keyword*5) 評価値…−１ (keyword*3、keyword*4 、keyword*6) 評価値…−１「ノイズ」 (keyword*1、keyword*5 、keyword*6) 評価値…＋１ (keyword*3、keyword*5 、keyword*6) 評価値…−１以上のような文書群を学習させた結果、各αの値は図６
（ａ）のようになったとする。ただし、図６（ａ）にお
いて、αｉはkeyword*i に関するαの値を、そして、α
ｉ，ｊはkeyword*i とkeyword*j の組に関するαの値を
意味する。

【０１１１】次に、推論するプロセスを説明する。

【０１１２】（keyword*1 ，keyword*3 ，keyword*6 ）
をキーワードとして有し、“keyword*1 ”，“keyword*
3 ”，“…”，“…”，“…”，“keyword*6 ”なる配
列をとる文書（この文書はキーワード番号を取り出して
入力ベクトルにすると、（１、１、０、０、０、１）と
なる。）を次数２までに関し、処理したとする。する
と、図３におけるステップＳ１０３〜Ｓ１０５の処理ル
ープにおいて、各回周毎に順次以下の組合わせが生成さ
れる。つまり、１回目・・・keyword*1 のみ、２回目・・・keyword*3 のみ、３回目・・・keyword*3 のみ、４回目・・・keyword*4 のみ、５回目・・・keyword*5 のみ、６回目・・・keyword*6 のみ、７回目・・・keyword*1 とkeyword*3 、８回目・・・keyword*1 とkeyword*3 、９回目・・・keyword*1 とkeyword*4 、１０回目・・・keyword*1 とkeyword*5 、１１回目・・・keyword*1 とkeyword*6 、１２回目・・・keyword*3 とkeyword*3 、１３回目・・・keyword*3 とkeyword*4 、１４回目・・・keyword*3 とkeyword*5 、１５回目・・・keyword*3 とkeyword*6 、１６回目・・・keyword*3 とkeyword*4 、１７回目・・・keyword*3 とkeyword*5 、１８回目・・・keyword*3 とkeyword*6 、１９回目・・・keyword*4 とkeyword*5 、２０回目・・・keyword*4 とkeyword*6 、２１回目・・・keyword*5 とkeyword*6 の各組み合わせである。

【０１１３】この組合わせを用いて、始めにステップＳ
１０５を通過するときは、ｓ＝１であるため、図６
（ａ）からα１＝−８であり、また、関数χｓ（Ｘｉ）
として表すと、 χ1 （１，１，０，０，０，１）＝−１であるため、予測値＝予測値（＝０）＋（−８×（−１））＝８となる。

【０１１４】また、７回目にステップＳ１０５を通過す
るときは、ｓ＝１，２であるため、図６（ａ）からα
１，２＝０であり、また、 χ1,2 （１、１、０、０，０、１）＝１であるため、予測値＝予測値（＝０）＋（０×１）＝０となる。

【０１１５】最後にステップＳ１０５を通過するとき
は、ｓ＝５，６であるため、図６（ａ）からα５，６＝
２であり、また、 χ5,6 （１、１、０、０、０、１）＝−１であるため、予測値＝予測値（＝０）＋（２×（−１））＝−２となる。

【０１１６】ここで、これら予測値を合計すると最終的
には、予測値は“１２”となる。この例では、組合わせ
が存在しないので、図３のステップＳ１０３からステッ
プＳ１０６に移り、ここで、最終的な上記予測値“１
２”をしきい値と比較してその大小に応じ、提示の判断
をする。しきい値は“０”とすると、上記予測値“１
２”はしきい値よりも大きいので、利用者に提示すると
判定する。そして、この判定に従い、出力部６ｂでは当
該評価対象となった入力文書を表示することになる。な
お、この場合、しきい値との差がどのくらいであったか
否かの情報を利用者に提示するようにしても良い。

【０１１７】次に、学習するプロセスを説明する。図４
のステップＳ２０１において読み込まれたキーワードは
上記と同様に、（keyword*1 、keyword*3 、keyword*6
）である。上述の“keyword*1 ”，“keyword*3 ”，
“…”，“…”，“…”，“keyword*6 ”なる配列をと
る文書について、ステップＳ２０２においてキーワード
番号を取り出すと、（１、１、０、０、０、１）なる入
力ベクトルが得られる。

【０１１８】この文書は利用者にとって必要な文書であ
ったとすると利用者が与える評価は“Ｏ（マル）”或い
は“ｇｏｏｄ”或いは“１”などであるから、ステップ
Ｓ２０３において読み込まれる評価値は“１”となる。
ステップＳ２０５において生成される組合わせは、予測
において生成されたものと同様である。最初にステップ
Ｓ２０６を通過するときの組合わせにおける属性ｓはｓ
＝１であり、 χ1 （１，１，０，０，０，１）＝−１であるため、予測値は α１＝−８＋（１×（−１））＝−９となる。また、７回目にステップ２０６を通過するとき
の組合わせにおけるｓはｓ＝１，２であり、 χ1,2 （１，１，０，０，０，１）＝１であるため、 α１，２＝０＋（１×１）＝１となる。

【０１１９】そして、最後にステップ２０６を通過する
ときの組合わせにおけるｓはｓ＝“５，６”であり、 χ5,6 （１，１，０，０，０，１）＝−１であるため、 α５，６＝２＋（１×（−１））＝１となる。

【０１２０】ｓ＝“５，６”までの組合わせに対して処
理が終わると次のステップＳ２０４での組合わせ存在判
断においては、もう組合わせが存在しないくなる。その
ために、処理はステップＳ２０７に移り、各αを保存
し、終了する。

【０１２１】このような学習の結果、各αの値は図６
（ｂ）のようになる。

【０１２２】各要素の機能は以上の説明の通りである。
従って、本システムは、文書入力部１から、例えば、新
しい文書が入力されたとすると、キーワード抽出部３に
てこの文書からキーワードが抽出され、推論部５はこの
抽出されたキーワードをデータ記憶部４に記憶されてい
る利用者本人の興味ある分野のワード群であるキーワー
ドテーブルのキーワードと照らし合わせて、スペクトル
理論に基づき、読むに値する文書であるか否かを評価
し、読むに値すると評価した文書に対しては提示の指示
を表示部６に与えることにより、表示部６はその文書を
出力して利用者に提示するといった処理を行うことがで
きる。そのため、本システムにより、多数の文書から、
利用者の興味のそそる文書を自動的に選定することがで
きる。

【０１２３】以上のように、本具体例は、入力された文
書からキーワードを抽出し、この抽出キーワードを登録
キーワード（キーワードテーブルに登録してあるキーワ
ードで、利用者の興味のある分野のキーワード）と照合
して該当の有無を反映した入力ベクトルに変換し、この
入力ベクトルからスペクトル理論による推論を行い、読
むに値するか否かを判定し、読むに値すると判定した場
合にその文書を提示するようにし、また、提示された文
書を利用者が評価した結果を学習させて推論に反映させ
るようにしたので、推定精度が良好であり、また、推論
はスペクトル理論に基づき行うので、ニューラルネット
ワークを使用する場合に比べて計算量が少なく、高速に
判定／学習を行うことが可能となるなどの特徴を有する
情報フィルタを得ることができる。

【０１２４】上述の具体例は、登録キーワードの有無を
中心として評価するものであったが、この場合、未登録
のキーワードは無視するようになっている。そこで、こ
れに対処する例を、第２の具体例として説明する。

【０１２５】（第２の具体例）本具体例は、判定対象と
なる文書において、第１の具体例のキーワードテーブル
に登録していない新しいキーワードが出現した場合にも
対応できるようにしている。

【０１２６】本具体例の情報フィルタは図７に示すよう
に構成されており、基本的には第１の具体例（図１）と
同様であり、また、推論部５の処理の流れも第１の具体
例（図３）と同様であるので、ここでの重複した説明は
省略し、第１の具体例と相違する点を主として説明す
る。

【０１２７】この具体例では、第１の具体例での学習部
８の機能に加えて、更に新規のキーワードを学習できる
機能を付加した学習部８ａを先の学習部８の代わりに用
いるようにした点が異なる。

【０１２８】以下、図７及び図８を参照しながら、新規
のキーワードを学習可能とした学習部８ａの働きを説明
する。

【０１２９】図８は、学習部８ａによる処理の流れを示
すフローチャートである。

【０１３０】学習部８ａが起動されると、キーワード抽
出部３から文書に現れたキーワードの一覧を読み込む
（ステップＳ３０１）。次に学習部８ａは、読み込まれ
たキーワード群中に、キーワードテーブル未登録の新規
キーワードが存在するか否かをチェックする（ステップ
Ｓ３０２）。すなわち、データ記憶部４において保存さ
れている図２のようなキーワードテーブルを参照し、当
該キーワードテーブルにない新規キーワードが存在する
か否かをチェックする。その結果、新規キーワードが存
在する場合には、前記キーワードテーブルの最後に当該
新規キーワードを追加登録する（ステップＳ３０３）。
そして、新しくキーワードが加わったことにより、属性
ｓの組み合わせの全体であるＳの要素が増加しているの
で、必要なαｓを追加する（ステップＳ３０４）。

【０１３１】以上の処理をキーワード抽出部３の抽出し
たキーワード群中の各新規のキーワードについて繰返し
行う。そして、これ以上新規のキーワードが存在しない
場合（ステップＳ３０２）には、読み込まれたキーワー
ドのキーワード番号をキーワードテーブルから求め、事
例ベクトルを生成する（ステップＳ３０５）。

【０１３２】次に利用者の操作による評価データ入力部
７からの評価値を待ち、読み込む（ステップＳ３０
６）。提示した文書への評価値を読み込むと、次に、現
在までの全ての評価値の合計をα０とし、これをαの一
要素として保存する（ステップＳ３０７）。

【０１３３】次に、キーワード同士の組み合わせ（前述
のＳ）が存在しているか否かを調べ（ステップＳ３０
８）、その結果、まだ存在している場合には、次の組み
合わせを生成し（ステップＳ３０９）、生成された組み
合わせに関して係数（前述のα）の計算を行い（ステッ
プＳ３１０）、ステップＳ３０８に戻る。なお、ステッ
プＳ３１０においてｆ（ｘ）はステップＳ３０６におい
て読み込んだ、評価値のことである。

【０１３４】ステップＳ３０８での判定の結果、キーワ
ード同士の組み合わせがもう存在しない場合、係数αを
データ記憶部４に保存し（ステップＳ３１１）、処理を
終了する。

【０１３５】ステップＳ３０４においてαｓを追加する
方法を、具体的に説明する。例えば、図２のような１６
個のキーワードが既に登録されたキーワードテーブルが
あり、ここに新たに“データベース”というキーワード
が登録される場合を考える。この場合、キーワードテー
ブルには新しく“データベース”というキーワードが１
６番目のキーワードとして追加登録されることになる。

【０１３６】この時点では、ｓ＝（１６）を要素として
持つαｓはデータとして存在しない。ところが、ここで
“データベース”なる語句は新規に登録されるキーワー
ドであるため、現在までにフィルタリングした文章の中
には存在していなかったことが分かる。

【０１３７】すなわち、仮にキーワードテーブルに登録
されていたとしても、出現した回数は“０”である。従
って、学習式は α（１６）＝α（１６）＋ｆ（ｘ）χ(16)（ｘ）であるため、学習開始から現在までのχ(16)は常に
“１”（出現数偶数回；偶数には０も含まれる）を返し
ていた筈であり、α（１６）はΣｆ（ｘ）である。

【０１３８】従って、α（１６）＝α０により与えられ
る。つまり、現在までの全ての評価値の合計をα０と
し、これをαの一要素として保存しておくと共に、新規
登録の“keyword*16 ”については、α（１６）として
α０を用いれば良いことになる。

【０１３９】また、α（ａ，１６）は、キーワード番号
１６のキーワード（つまり、“データベース”という語
句）が出現していないので、α（ａ）と同じである。こ
こで、ａは１〜１５までのキーワード番号である。

【０１４０】同様に、次数Ｎのαは次数（Ｎ−１）のα
から求めることが可能である。

【０１４１】以上により、キーワードテーブルに登録し
ていない新しいキーワードが出現した場合にも、現在ま
での全ての評価値の合計をα０とし、これをαの一要素
として保存しておくと共に、新規登録のキーワードにつ
いては、そのキーワードのαとしてα０を用い、他の次
数のαとしては次数１での他のキーワードのものから流
用することで、新規登録に対応できるようになる情報フ
ィルタが得られる。

【０１４２】第２の具体例の変形例について説明する。

【０１４３】第２の具体例においては、その推論部５部
分は、第１の具体例（図３）と同様の処理内容で実現で
きる。しかし、図３の処理の流れを若干修正して、図９
のようにしても良い。すなわち、文書から抽出されたキ
ーワードのうち、キーワードテーブルに登録されている
キーワード（登録キーワード）に対応するキーワードの
種類数をＲ、抽出された全キーワードの種類数をＡ、値
“０”〜“１”の間における所望の値に設定した閾値を
ＣＯとした場合、ステップＳ１０８で、Ｒ／Ａ＜ＣＯ
のときは、ステップＳ１０３〜ステップＳ１０５の推
論をせずに、文書を表示するように指示を出す。

【０１４４】このようにすると、評価対象の文書から抽
出されたキーワードに含まれる登録キーワード対応のキ
ーワード種類数と文書から抽出されたキーワードの種類
数の比に応じて無条件に文書を提示するといった処理が
でき、抽出されたキーワードの種類数に占める登録キー
ワード数が設定した値に満たない時には、その文書を提
示することで、新分野の文書や、新技術の文書の見落と
しといった弊害発生の阻止を図ることが可能になる。

【０１４５】もちろん、抽出したキーワードのうちキー
ワードテーブルに存在しなかったものについて、第２の
具体例（図８）で説明したように、キーワードテーブル
に登録し、必要なαを追加し、αを学習して以後の推論
に反映させるようにすることもできる。

【０１４６】（第３の具体例）第３の具体例について説
明する。本具体例は、前述したスペクトル理論に基づい
た推論と学習をそれぞれ高速化するよう工夫した。以下
に説明するスペクトル理論をこれ以降「高速スペクトル
理論」と称する。

【０１４７】本具体例に係る情報フィルタの構成は図１
０に示すとおりであり、推論部５を推論部５Ａに学習部
８を学習部８Ａに置き換えてあるが、これらを含めその
他の要素の機能は基本的には第１の具体例（図１）と同
様であるので、同一部分についてのここでの説明は省略
し、第１の具体例と相違する点を主として説明する。

【０１４８】さて、情報フィルタに入力される問題べク
トル（つまり、評価しようとする文書から生成した評価
対象の入力ベクトル）の特性として、ほとんどの属性値
が“０”であることが挙げられる。すなわち、１つの文
書の中に出現するキーワードは通常、２０〜３０個であ
り、文書を構成している語句の多くは登録キーワード以
外のことが実験等によりわかっている。

【０１４９】これに対して、全体の属性の数、すなわ
ち、情報フィルタに登録されているキーワードの数は数
千〜１万個にも及ぶ。ここに着目すると、予測値の計算
式である式（２）において、殆どのχｓ（ｘ）は“１”
を値とすることが分かる。

【０１５０】そこで、予め全ての属性値が“０”であっ
た場合の予測値ｆ（０）を求めておき、ここから、
“０”でなかった属性値が影響を及ぼす部分だけを修正
する方が計算量が少なくて済む。

【０１５１】例えば、１０００個のキーワードが登録さ
れているシステムで、１０個のキーワードを含む文書を
次数２までフィルタリングする場合、第１の具体例の方
式では、１０００＋１０００×１０００回もαｓχｓ
（ｘ）を求めなければならないところを、本具体例のよ
うにすると、１０＋１０×９９０回の計算で済むことに
なり、計算量が大幅に減ることが分かる。ゆえに、その
計算量が減った分、高速処理となる。

【０１５２】これを実現するためには推論部５をこの具
体例では次のようにした推論部５Ａに置き換えてある。

【０１５３】以下、図１１を参照しながら推論部５Ａの
働きを説明する。

【０１５４】図１１は、推論部５Ａによる処理の流れを
示すフローチャートである。推論部５Ａは起動される
と、キーワード抽出部３から文書に現れたキーワードの
一覧を読み込む（ステップＳ４０１）。読み込まれたキ
ーワードのキーワード番号をデータ記憶部４に保存され
ている図２のようなキーワードテーブルを参照すること
により求める（ステップＳ４０２）。その際、キーワー
ド番号を求めようとしている対象のキーワードが、キー
ワードテーブルに登録されていない場合には無視する。

【０１５５】次に、予測値に取り敢えずｆ（０）を代入
する（ステップＳ４０３）。そして、キーワード同士の
組み合わせが他に存在するか否かを調べ（ステップＳ４
０４）その結果、キーワード同士の組み合わせ（前述の
ｓ）がまだ存在している場合には、文書内に出現したキ
ーワードから奇数個、残りを出現しなかったキーワード
から選び、組合せを生成する（ステップＳ４０５）。こ
れにより生成された組み合わせは、ｆ（０）とｆ（ｘ）
が異なる部分であるため、次にこれを予測値＝予測値−２α０−２αｓなる演算を施すことにより、修正する（ステップＳ４０
６）。

【０１５６】なお、ここでのα０とは、現在までの評価
値の総和であり、αｓは第１の具体例と異なり、総和と
の差分を記憶していることになる。

【０１５７】ステップＳ４０６におけるこの修正処理を
終えると、ステップＳ４０４に戻る。そして、ステップ
Ｓ４０４での判定の結果、キーワード同士の組み合わせ
がまだ存在すれば上述の処理を繰り返すが、もう存在し
ない場合には、予測値の計算は終了し、予測の結果によ
り文書を利用者に提示するか否かを判断する（ステップ
Ｓ４０７）。この判定は、予測の結果が“０未満”であ
るか否かにより決める。

【０１５８】すなわち、予測の結果が“０未満”であっ
た場合、推論部５Ａは提示の指示を出さず、従って、シ
ステムは利用者に文書を提示しないで終了することにな
る。しかし、予測の結果が“０以上”であった場合には
（ステップＳ４０７）、推論部５Ａは提示の指示を表示
部６に出し（ステップＳ４０８）、処理を終了する。

【０１５９】この指示を受けて表示部６は文書記憶部２
から当該評価の対象とした文書を読み出して出力部６ｂ
に出力し、当該文書を提示することになる。

【０１６０】図１２を参照しながら学習部８Ａの働きを
説明する。図１２は、学習部８Ａによる処理の流れを示
すフローチャートである。学習部８Ａが起動されると、
キーワード抽出部３から文書に現れたキーワードの一覧
を読み込む（ステップＳ５０１）。読み込まれたキーワ
ードのキーワード番号をデータ記憶部４に保存されてい
る図２のようなキーワードテーブルを参照しながら求め
る（ステップＳ５０２）。この時に、キーワードがキー
ワードテーブルに登録されていない場合には無視する。

【０１６１】次に、α０に評価値を加え（ステップＳ５
０５）、そして、キーワード同士の組み合わせの有無を
調べる（ステップＳ５０６）。このステップＳ５０６で
調べた結果、キーワード同士の組み合わせ（前述のＳ）
がまだ存在している場合、文書内に出現したキーワード
から奇数個、そして、残りを文書内に出現しなかった登
録キーワードから選び、組合せを生成する（ステップＳ
５０７）。これにより、生成された組合わせは、χｓ
（ｘ）が“−１”である部分であるため、αｓを修正す
る（ステップＳ５０８）。

【０１６２】更に、ｆ（０）もこれに合わせて修正する
（ｆ（０）＝ｆ（０）−２ｆ（Ｘ））（ステップＳ５０
９）。そして、ステップＳ５０６に戻ってキーワード同
士の組み合わせの有無を調べる。その結果、更に、組合
せが存在すればステップＳ５０７以降の処理を繰り返す
が、ステップＳ５０６での結果、存在しない場合には係
数の計算は終了し、αをデータ記憶部４に保存し（ステ
ップＳ５１０）、ｆ（０）もデータ記憶部４に保存し
（ステップＳ５１１）、終了する。

【０１６３】以上、本具体例は、文書から抽出したキー
ワードについて、登録キーワードと照合し、登録キーワ
ード該当のキーワードであれば、そのキーワード単体及
びキーワード同士の次数別組み合わせを調べて、それぞ
れの予測値を求め、予測値の値からその文書の提示、非
提示を決めるようにした。

【０１６４】これにより、処理内容が単純化されること
から、本具体例により、スペクトル理論に基づいた推論
と学習をそれぞれ高速化することが可能になる。

【０１６５】（第４の具体例）第４の具体例について説
明する。上述した第１〜第３の具体例は、いずれも１つ
の文書について、推論・表示を行うような逐次処理のシ
ステム構成例であった。第４の具体例では、複数の文書
について、一括して、推論・表示を行うようにした例を
説明する。

【０１６６】本具体例に係る情報フィルタの構成は図１
３に示す如きであり、複数の文書について、一括して、
推論できるようにした推論部５Ｂを用いるようにしたも
のであって、この推論部５Ｂをはじめ、各機能要素は基
本的には前述の具体例（図１）と同様であるから、ここ
での説明は省略し、異なる部分について説明する。

【０１６７】本具体例では、推論部５Ｂは推論処理に関
して、図３や図１１で説明したものに若干の修正を加え
た内容とした。ここでは、推論部５Ｂの機能として図３
で説明したものに、若干の修正を加えて実現するように
した例を図１４に示す。

【０１６８】この具体例では、複数の文書それぞれにつ
いて推論処理のみを先に実施し、その後に、評価の高い
文書から順に表示する。つまり、本具体例は複数の文書
をそれぞれ評価した後に、必要性の高いものを選んで提
示させるようにする例である。

【０１６９】従って、評価対象となる文書は複数文書
分、入力されており、それぞれの文書単位でキーワード
抽出部３はそれぞれその文書に現れたキーワードを抽出
する。

【０１７０】推論部Ｂ５が起動されると、キーワード抽
出部３から第１の文書に現れたキーワードの一覧を読み
込む（ステップＳ１０１）。キーワードの一覧が読み込
まれたならば、次にこの読み込まれた各キーワードそれ
ぞれについてのそのキーワード番号を、データ記憶部４
に保存されている図２のようなキーワードテーブルを参
照しながら求め、入力ベクトルを生成する（ステップＳ
１０２）。この時に、参照しても見付からないキーワー
ド、つまり、キーワードテーブルに登録されていないキ
ーワードであったならばそれは無視する。

【０１７１】次にキーワード同士の組み合わせ（前述の
Ｓ）の存在の有無を調べ（ステップＳ１０３）、その結
果、キーワード同士の組み合わせ（前述のＳ）が、まだ
存在している場合には、次の組み合わせを生成し（ステ
ップＳ１０４）、生成された組み合わせに関して予測値
の計算を行い（ステップＳ１０５）、ステップ１０３に
戻る。

【０１７２】ステップＳ１０３での判定の結果、キーワ
ード同士の組み合わせがもう存在しない場合には、予測
値の計算は終了する。ここで、式（２）のｓｉｇｎ関数
に代入する値、式（４）のｈ（ｘ）が得られる。

【０１７３】そして、ステップＳ１１１移り、このステ
ップＳ１１１以下の処理ループにより、各文書につい
て、推論を一括して行う。ここでは、式（２）により表
示すべきと判断されたものについて、式（４）のｈ
（ｘ）を当該文書の必要性の度合いを示す指標として保
存しておく。

【０１７４】このような処理を、第２の文書、第３の文
書…それぞれに行い、式（２）により表示すべきと判断
されたものについては、式（４）のｈ（ｘ）を当該文書
の必要性の度合いを示す指標として保存しておく。

【０１７５】このような処理が終了後、ステップＳ１１
２に移り、表示すべきと判断された文書を、必要性の度
合いを示す指標ｈ（ｘ）の大きい順にソートする。そし
て、ステップＳ１１３に移り、ソートされた順に対象の
文書を表示するように、表示部６に指示し、当該ソート
順に文書を表示させる。

【０１７６】この結果、複数の文書をそれぞれについて
まず評価して、文書の必要性の度合いを示す指標で保存
し、複数の文書をそれぞれについての当該評価を全て終
えた後に指標の高いものを順に表示指示して表示させる
ことができる。

【０１７７】従って、複数の文書が高頻度で入力される
ような場合に、事前に纏めて評価の後、必要性の高いも
のを選んで提示させることができるので、例えば、毎
日、要不要にかかわりなく、多数のメールが飛び込むネ
ットワークの各端末ユーザのように、取捨選択を必要と
する場合などに、緊急度の高いものや、重要度の高いも
の、或いは興味の高いと評価されるものを、指標の高い
ものから順に読むことができるようになり、便利とな
る。

【０１７８】（第１〜第４の具体例の変形例１）第１〜
第４の具体例では、推論結果を得るためのｓｉｇｎ関数
は、ｓｉｇｎ（ｘ）：ｘ≧０ならばｓｉｇｎ（ｘ）＝
１、ｘ＜０ならばｓｉｇｎ（ｘ）＝−１となるような関
数であった。ここで、次のような関数を考える。

【０１７９】ｓｉｇｎ′（ｘ）：ｘ≧ｃならばｓｉｇｎ（ｘ）＝１、ｘ＜ｃならばｓｉｇｎ（ｘ）＝−１この関数において、推論のしきい値ｃ＝０とした場合
が、上記のｓｉｇｎ（ｘ）である。ここで、上記推論の
しきい値ｃは、任意に設定しても構わない。ｃの値を正
側に大きくする程、表示条件が厳しくなり、ｃの値を負
側に大きくする程、表示条件が緩くなる。

【０１８０】（第１〜第４の具体例の変形例２）重要と
判定された文書を表示する場合の他の例として、ここで
は推論部５が、文書を利用者に提示すべきであるとの判
断をしたときに、表示部６は文書記憶部２の文書のう
ち、まず、当該文書の目次や要約の部分を読み出してこ
れを出力部６ｂに表示するように制御し、更にこれを見
たユーザが本文を読みたいと判断してその指示を図示し
ない入力操作部から与えたときに、その表示要求に応じ
て、表示部６は文書記憶部２の文書から当該文書の本文
を読み出して出力部６ｂに表示するように制御する機能
を持たせるようにする。

【０１８１】このような構成のシステムでは、推論部５
が文書を利用者に提示すべきであるとの判断をしたと
き、表示部６は文書記憶部２の文書のうち、まず、当該
文書の目次や要約の部分を読み出してこれを出力（表
示）するように制御する。

【０１８２】そして、この出力内容を見たユーザが本文
を読みたいと判断してその指示を、図示しない入力操作
部から与えたとすると、その表示要求に応じて、表示部
６は文書記憶部２の文書から当該文書の本文を読み出し
て出力（表示）する。

【０１８３】このように重要と判定された文書を表示す
る場合、まず、当該文書の目次や要約を表示し、更にユ
ーザが本文を読みたいと判断したときに、ユーザからの
表示要求に応じて、文書の本文を表示するようにする
と、情報フィルタがユーザのために選択した文書の中か
ら、ユーザはより興味のある文書のみを選択して読むこ
とができるようになる。

【０１８４】また、推論にあたり、第１段階として、図
０１の文書入力部１から入力された文書を特定する情報
（文書名や文書コードなど）とキーワード群の組を利用
し、該キーワード群に対して推論を行い、第２段階とし
て、必要と判定されたものについてのみ、文書の本文を
入力してキーワードを抽出し、推論をするようにしても
良い。

【０１８５】なお、以上の具体例において、キーワード
自体については言及しなかったが、通常の文書を良く表
す単語以外にも、その文書に予め分類がなされている場
合（例えば、特許関係書類におけるＩＰＣ分類（国際特
許分類）など）には、この分野や、著者名、著者所属な
どもキーワードの一部として利用することも可能であ
る。また、本発明は上述した各具体例に限定されるもの
ではなく、その要旨を逸脱しない範囲で、種々変形して
実施することができる。

【０１８６】以上により、複数の文書について、一括し
て、推論・表示を行うようにした情報フィルタ装置が得
られる。

【０１８７】（第５の具体例）上記の具体例ではキーワ
ードは増加して行く一方であったが、時間の経過ととも
に、利用者の興味が変化してゆくことも多く、その場
合、必要でないキーワードが発生する。そして、必要で
ないキーワードを残したままにしておくと、処理にその
分、無駄が生じるばかりでなく、使用者の必要とする文
書の評価に誤りが発生するようになってしまう。そこ
で、必要でないキーワードの除去が重要となるので、当
該必要でないキーワードの除去方法について第５の具体
例として説明する。

【０１８８】ここでは、不要キーワード検出を行うと共
に、不要キーワードが検出された場合に、過去の前記関
係の学習結果から該不要キーワードを削除するキーワー
ド削除機能を有する不要キーワード検出部９を設け、こ
の不要キーワード検出部９が不要キーワードを検出した
場合に、データ記憶部４における過去の前記関係の学習
結果から該データ記憶部４における該不要キーワードを
削除する構成とする。

【０１８９】すなわち、この第５の具体例では、図１５
に示すように、図０１、図０７、図１０、図１３いずれ
かの構成に、不要キーワード検出機能とキーワードテー
ブルの内容の更新処理機能を有する不要キーワード検出
処理部９を更に設け、不要キーワード検出してそれに基
づき、データ記憶部４におけるキーワードテーブルの内
容の更新を行うようにする。

【０１９０】この更新を行えるようにするために、キー
ワードテーブルは図０２のキーワードテーブルに登録日
時と使用回数を記入する覧を追加した図１６に示すよう
なものとし、また、学習部８，８ａ，８Ａはキーワード
テーブルへの登録時に登録時刻を記入し、キーワードの
使用毎にその該当のキーワードの使用回数を累積した数
を更新記録してゆく機能を持たせた構成とした点が先の
各具体例と少し異なるが、その他の点は先の各具体例の
動作を踏襲するので、同一部分の動作説明は省略し、以
下の説明は異なる部分についてのみ行う。

【０１９１】この具体例での特徴は、不要キーワード検
出処理部９の機能にあるが、この不要キーワード検出処
理部９の持つ機能のうち、不要キーワード検出機能は、
利用者からの指示で、或いは一定時間間隔で、又はフィ
ルタリング速度が一定以下に遅くなった時に起動され
る。

【０１９２】不要キーワード検出処理部９は起動される
と、図１６のキーワードテーブルを参照し、一定期間以
上登録されて、しかも、あまり使われていないキーワー
ドを探す。その探索のために、図１６は図０２のキーワ
ードテーブルに登録時刻と使用回数を記入する覧を追加
した構成としている。

【０１９３】この例では、１番（キーワード番号が１）
の“ワープロ”という語については“１９９４年１１月
１０日”に登録され、使用回数は“５３”回であること
を示しており、２番（キーワード番号が２）の“辞書”
という語については“１９９４年１１月１１日”に登録
され、使用回数は“２１”回であることを示しており、
３番（キーワード番号が３）の“帰納”という語につい
ては“１９９４年１２月１０日”に登録され、使用回数
は“９”回であることを示しており、４番（キーワード
番号が４）の“学習”という語については“１９９４年
１２月１０日”に登録され、使用回数は“６”回である
ことを示しており、といった具合である。

【０１９４】上記のように構成された本具体例装置の概
略動作を図１７を参照して説明する。図１７は、第４の
具体例の動作を示すフローチャートである。

【０１９５】削除の対象となっているキーワードがまだ
存在するかを確認し、存在する場合には、次のキーワー
ドを得る（ステップ６０１）。得たキーワードが登録さ
れてから一定以上の日数が経過していない場合（ステッ
プ６０２）、ステップ６０１に戻り次のキーワードを探
す。登録されてから一定以上の日数が経過している場合
（ステップ６０２）、そのキーワードの使用回数が定数
Ｂ以上である場合には、削除せずにステップ６０１に戻
る（ステップ６０３）。そのキーワードの使用回数が定
数Ｂ以下である場合には（ステップ６０３）、更に、そ
のキーワードの使用回数が定数Ｂよりも小さな定数Ｃ以
下である場合には、（ステップ６０４）、キーワードを
削除する（ステップ６０６）。そのキーワードの使用回
数が定数Ｃ以上である場合には（ステップ６０４）、キ
ーワードを削除する（ステップ６０６）。そのキーワー
ドの使用回数が定数Ｃ以上である場合には（ステップ６
０４）、そのキーワードの学習係数の一次の値αの絶対
値が定数Ｄ以下の場合（ステップ６０５）、キーワード
を削除する（ステップ６０６）。そのキーワードの学習
係数の一次の値αの絶対値が定数Ｄ以下でない場合（ス
テップ６０５）、キーワードは削除せずに次のキーワー
ドを探す（ステップ６０１）。

【０１９６】以下、具体例を用いて、キーワードの削除
処理を説明する。

【０１９７】データ学習部８はキーワードを登録する時
には、その登録日時を記録し、また使用する度に、キー
ワードテーブルにあるキーワードの使用回数を増やす
（インクリメントする）。そして、不要キーワード検出
部９はキーワードテーブルの登録時刻と使用回数を参照
し、初期登録から一定期間経過して、しかも、使用頻度
が一定回数以下のものを削除対象とし、該当のものを削
除する。

【０１９８】例えば、３ケ月以上前に登録されていて、
今までの使用回数は１０回以下であったキーワードを削
除対象とするといった処理を行う。従って、今日の日付
が１９９５年６月１日であったとすると、この場合、図
１６のキーワードテーブルでは、番号１〜７迄のキーワ
ード（“ワープロ”から“光学”迄のキーワード）が期
間的に削除対象候補となる。

【０１９９】次に、使用された回数を見ると、キーワー
ド番号３のキーワード（“帰納”）、キーワード番号４
のキーワード（“学習”）、キーワード番号７のキーワ
ード（“光学”）がそれぞれ削除対象となっている。こ
こで、使用回数が５以下のキーワードは削除するとすれ
ば、図１６の例の場合には、キーワード番号７のキーワ
ード（“光学”）は削除する。なお、使用回数が６回以
上１０回以下のキーワードは係数αの一次の値を参考に
して、削除するか否かを決める。

【０２００】係数αの例を示すと図１８のようになって
おり、この係数αの一次の値は、各キーワードが直接、
どの程度有用性に貢献しているかの指標である。従っ
て、αの一次の値が、“０”に近い場合には、あまり貢
献していないことを意味しており、削除して良いことに
なる。αの閾値を“１０”とした場合、αｓ≦１０を削
除対象とする。

【０２０１】キーワード番号３のキーワードに対応する
α（３）と、キーワード番号４のキーワードに対応する
α（４）が、α（３）＝２、α（４）＝１００であった
場合には、キーワード番号３のキーワード（“帰納”）
は削除対象に決定するが、キーワード番号４のキーワー
ドは削除対象にしない。

【０２０２】削除するキーワードが決定したならば、α
の値から、削除するキーワードに関係する項目を取り除
く。即ち、キーワード番号３とキーワード番号７の各キ
ーワードを削除する場合には、“α３”、“α１，
３”、“α２，３”、“α３，４”、“α３，５”…
…“α７”、“α１，７”、“α２，７”、“α３，
７”、“α４，７”…を削除する。これらは、いずれも
キーワード番号３のキーワードかキーワード番号７のキ
ーワードのいずれかが関与している要素であるためであ
る。

【０２０３】次に、キーワードテーブルからキーワード
番号３のキーワードと、キーワード番号７のキーワード
を削除する。次にキーワードテーブルからキーワード番
号３、とキーワード番号７を削除し、テーブルが虫食い
状態になっているので、整えて番号を１から順に付け直
す。

【０２０４】次に、キーワードテーブルに現在登録され
ている全てのキーワードの使用回数を一定の割合で減ら
す。例えば、ここでは、１／２にする。

【０２０５】以上のように、この具体例では、キーワー
ドテーブルにおける初期登録の時点と、使用頻度をキー
ワード毎に管理をするようにし、また、不要キーワード
検出処理部を設けて、初期登録から一定期間を経過し、
かつ、使用頻度の低いキーワードを対象に削除できるよ
うにしたので、不要なキーワードを学習結果を反映した
かたちで削除できるようになり、常に使用者の最新の興
味対象をターゲットにしたキーワード管理ができて、興
味のある文書を適確に選択できるようになる。なお、こ
こで用いた、閾値や係数などの具体的な数値は必要とさ
れるシステムの特性に応じて変更するものであり、数値
自体にはとくに意味はない。

【０２０６】（第６の具体例）１つの情報フィルタ装置
で取り扱う利用者の興味の範囲が、広範であった場合、
必要なキーワード数が爆発的に増加する危険性がある。
そして、キーワード数が増加すると、その計算量は指数
的に増加してしまうために、キーワードを分割して、複
数の情報フィルタでテーマ別にフィルタリングを行った
方が有利である。このような場合に、キーワードを分割
して利用する方法について説明する。

【０２０７】この具体例では、第５の具体例の構成に加
え、更にキーワードを分割するキーワード分割処理部１
０を設けた図１９の如きの構成とした。キーワード分割
処理部１０は所定のキーワードの数が一定の大きさ以上
になった場合に、過去の前記関係の学習結果を分割する
機能を有する。

【０２０８】キーワード分割処理部１０は、利用者から
の指示により、又はフィルタリング速度が一定以下にな
った時に起動される。キーワード分割処理部１０は起動
されると、２次のαの値を参考にキーワードの分類を開
始する。

【０２０９】２次のαの値（例えば、α（１，２））は
その値の示す２つのキーワード（α（１，２）の場合、
キーワード番号１のキーワードとキーワード番号２のキ
ーワード）が文書全体の有効性にどれだけ寄与している
かを示しており、二つのキーワードが同一の文書内に出
現しない限り、その値は“０”である。

【０２１０】従って、α（１，２）の値が“０”に近け
れば、キーワード番号１のキーワードとキーワード番号
２のキーワードは同時に出現しなかったか、もしくは、
あまり文書の有効性の判定には寄与しないことを意味す
る。ある一定の閾値、例えば、５を閾値とした場合、α
（ｉ，ｊ）≧５ならば、二つのキーワードｉとｊ（キ
ーワード番号ｉとｊのキーワード）にはリンク（つなが
り）があると考える。

【０２１１】そこで、リンクのある二つのキーワード間
にラインを張ったかたちで図示すると、たとえば、図１
８のキーワードは図２０のように表現される。

【０２１２】このような場合、キーワード番号１のキー
ワード、キーワード番号２のキーワード、キーワード番
号５のキーワードを１つのグループとし、キーワード番
号３のキーワード、キーワード番号４のキーワード、キ
ーワード番号６のキーワードを別のグループに分けるよ
うにするといった手法により、キーワードを分割する。

【０２１３】上記の動作を図２１に示すフローチャート
を参照して具体的に説明する。

【０２１４】キーワード分割処理部１０が起動される
と、まだ分割が必要であるかを判定する（ステップ７０
１）。判定は分割されたキーワード群の大きさの比が一
定以下になっているかにより行う。起動されてすぐには
分割は行われていないので、大きさはＭi0であり、分割
がまだ必要である。キーワードの中からランダムに起点
を選ぶ（ステップ７０２）。選んだ起点からリンクをた
どって到達できるキーワードが存在するかを確認する。
２つのキーワード（ａ、ｂ）間のリンクとは、２次元の
α（ａｂ）の絶対値を用いる。絶対値が予め定められた
値よりも大きい場合にはリンクがあると判定する（ステ
ップ７０３）。まだたどれるキーワードがある場合に
は、このキーワードに印を付ける（ステップ７０４）。
もうたどれるリンクがなくなってしまったら（ステップ
７０３）、印のついたキーワードを古いキーワードリス
トから取り出す。ステップ７０１に戻り、更に分割の必
要があるかを調べる。

【０２１５】更に具体的に、分割処理の手順を示す。ま
ず、キーワード番号１のキーワードから始め、リンクの
あるキーワードを順に探す。例えば、キーワード番号１
のキーワードとキーワード番号２のキーワードはリンク
があるので、キーワード番号２のキーワードは同じグル
ープに入る。キーワード番号３，４，５，６の各キーワ
ードはキーワード番号１のキーワードとは直接のリンク
が無い。

【０２１６】次に、新たにキーワード番号１のキーワー
ドと同じグループに入ったキーワード番号２のキーワー
ドとリンクのあるキーワードを探すと、キーワード番号
５のキーワードが見つかる。そこで、キーワード番号５
のキーワードを同じグループに入れる。

【０２１７】次にキーワード番号５のキーワードとリン
クのあるキーワードを探すが、新しく同じグループに加
えるキーワードは存在しないために、ここで一旦終了す
る。ここで、今回の例のように運良く、キーワードの数
が同程度の二つの集合が出来た場合は良いが、取り出さ
れたグループに含まれるキーワードの数が一定の割合以
下の場合には、このグループに含まれていないキーワー
ドをランダムに選び、そこを始点に新たなグループを探
し、既に取り出されているグループに加える。

【０２１８】このようにして、一定の割合に到達するま
で繰り返す。二つのグループにキーワードを分割したな
らば、データ記憶部６に含まれるキーワードテーブルと
αの値を複写し、第６の具体例で説明した削除手法によ
り、互いのグループに含まれないキーワードを削除す
る。このようにして学習結果を二つに分割することが可
能となる。そして、このキーワード分割により、キーワ
ード数の増加の抑制と、計算量の低減を図ることができ
るようになる。

【０２１９】（第７の具体例）本具体例では、推論部５
とデータ学習部８を改良し、少ない記憶容量で、高次の
αを求めることができるようにした方法について説明す
る。

【０２２０】ｎ次のαの値はｎ個のキーワードが同時に
出現する場合にのみ有効である。ところが、情報フィル
タが扱う数千種のキーワードのうち、同時にｎ個のキー
ワードが出現する可能性は極めて低い。特にｎの値が高
くなればなるほど、その組合せは膨張するが、実際に有
効なαは少ない。

【０２２１】そこで、有効なαのみを記憶しておき、そ
れ以外のものは、より低次のαから求めるようにする。

【０２２２】例えば、α（ａ1 ，ａ2 ，ａ3 ，．．．，
ａn-1 ，ａn ）を求める場合、ここに出現するキーワー
ド“ａ1 ”、“ａ2 ”、“ａ3 ”，… ，“ａn-1 ”，
“ａn ”の全てが同時に出現したことが無かった場合に
は、α（ａ1 ，ａ2 ，ａ3 ，…，ａn-1 ，ａn ）は、こ
れよりも、ｎ−１次までのαにより表現されることが知
られている。

【０２２３】例えば、三次のαを求める場合、α（ａ1
，ａ2 ，ａ3 ）で、キーワード“ａ1 ”、“ａ2 ”、
“ａ3 ”が同時に出現したことが無かった場合を想定す
ると、α（ａ1 ，ａ2 ，ａ3 ）は、第１の具体例でのχ
の計算により、ａ1 ，ａ2 ，ａ3 のうち、奇数個のキー
ワードが同時に出現した回数を数えていることと同値で
ある。

【０２２４】従って、ａ1 ，ａ2 ，ａ3 のそれぞれの値
を１／０の値のべクトルで表せば（全てのキーワードが
出現した場合は（１，１，１）となる。）、“α（ａ1
，ａ2 ，ａ3 ）”は、“（１，０，０）”又は
“（０，１，０）”又は“（０，０，１）”又は
“（１，１，１）”が起こった回数を数えていることに
なる。

【０２２５】一方、“α（ａ1 ，ａ2 ）”は、“（１，
０，０）”，“（０，１，０）”，“（１，０，
１）”，“（０，１，１）”が起こった回数を、“α
（ａ1 ，ａ3）”は、“（１，０，０）”，“（１，
１，０）”，“（０，０，１）”，“（０，１，１）”
が起こった回数を、“α（ａ2 ，ａ3 ）”は、“（１，
１，０）”，“（０，１，０）”，“（１，０，
１）”，“（０，０，１）”が起こった回数を、“α
（ａ1 ）”は、“（１，０，０）”，“（１，０，
１）”，“（１，１，０）”，“（１，１，１）”が起
こった回数を、α（ａ2 ）は、“（０，１，０）”，
“（０，１，１）”，“（１，１，０）”，“（１，
１，１）”が起こった回数を、そして、“α（ａ3 ）”
は、“（０，０，１）”，“（１，０，１）”，
“（１，１，０）”，“（１，１，１）”が起こった回
数をそれぞれ数えている。

【０２２６】ゆえに、 α（ａ1 ）＋α（ａ2 ）＋α（ａ3 ）−α（ａ1 ，ａ2
）−α（ａ2 ，ａ3 ）−α（ａ1 −ａ3 ）＝ｇ（０，
０，１）＋ｇ（０，１，０）＋ｇ（１，０，０）＋ｇ
（１，１，１）−４ｇ（１，１，１）＝α（ａ1 ，ａ2
，ａ3 ）−４ｇ（１，１，１）＝α（ａ1 ，ａ2 ，ａ3
）ただし、ｇ（ａ，ｂ，ｃ）（ａ，ｂ，ｃは１又は０）は
関数であり、ここでの関数ｇ（ａ，ｂ，ｃ）は、（ａ，
ｂ，ｃ）が起こった回数を表す。

【０２２７】つまり、ｇ（１，１，１）＝０の場合に
は、α（ａ１，ａ２，ａ３）は１次と２次のαで表現出
来ることが分る。この仕組みを利用して、３つのキーワ
ードが同時に出現した場合のみ、キーワードの組合せと
αの値を保持し、それ以外の場合は、上記の方法により
αを求める。

【０２２８】このようにすると、膨大な数のαの値を記
憶する必要がなく、少ない記憶容量で精度の高い予測を
行うことが可能となる。

【０２２９】なお、本発明は情報フィルタ処理を行なう
システムや情報フィルタ処理のための方法としての適用
ばかりでなく、プログラムパッケージ化し、パソコンや
ワークステーション等、コンピュータシステムに対して
アプリケーションパッケージとして提供して、情報フィ
ルタ処理を行なわせることもでき、コンピュータプログ
ラムパッケージとしての頒布の形態を採用した実施形態
も実現可能である。

【０２３０】

【発明の効果】以上、詳述したように本発明によれば、
文書から抽出されるキーワードの組合せと文書の重要性
に関する評価値の関係だけに基いて推論／学習を行なう
ので、良好な推定精度を維持しつつ、計算量を少くし、
高速に判定／学習を行なうことが可能な情報フィルタを
得ることができる。

【０２３１】従って、本発明によれば、利用者は明らか
に興味のない文書を読む必要がなくなる。

【図面の簡単な説明】

【図１】本発明を説明するための図であって、本発明の
第１〜第３の具体例に係る情報フィルタの構成を示すブ
ロック図。

【図２】本発明を説明するための図であって、本発明に
用いるキーワードテーブルの一例を示す図。

【図３】本発明を説明するための図であって、本発明の
第１および第２の具体例における推論の流れを示すフロ
ーチャート。

【図４】本発明を説明するための図であって、本発明の
第１の具体例における学習の流れを示すフローチャー
ト。

【図５】本発明を説明するための図であって、本発明に
用いるキーワードテーブルの他の例を示す図。

【図６】本発明を説明するための図であって、本発明に
用いる各係数αの学習前後の値を示す図。

【図７】本発明を説明するための図であって、本発明の
第２の具体例における情報フィルタの構成例を示すブロ
ック図。

【図８】本発明を説明するための図であって、本発明の
第２の具体例における学習の流れを示すフローチャー
ト。

【図９】本発明を説明するための図であって、本発明の
第２の具体例の変形例における推論の流れを示すフロー
チャート。

【図１０】本発明を説明するための図であって、本発明
の第３の具体例における情報フィルタの構成を示すブロ
ック図。

【図１１】本発明を説明するための図であって、本発明
の第３の具体例における推論の流れを示すフローチャー
ト。

【図１２】本発明を説明するための図であって、本発明
の第３の具体例における学習の流れを示すフローチャー
ト。

【図１３】本発明を説明するための図であって、本発明
の第４の実施形態における情報フィルタの構成を示すブ
ロック図。

【図１４】本発明を説明するための図であって、本発明
の第４の具体例における推論の流れを示すフローチャー
ト。

【図１５】本発明を説明するための図であって、本発明
の第５の具体例に係る情報フィルタの構成を示すブロッ
ク図。

【図１６】本発明を説明するための図であって、本発明
の第５の具体例において用いるキーワードテーブルの一
例を示す図。

【図１７】本発明を説明するための図であって、本発明
の第５の具体例における削除処理の流れを示すフローチ
ャート。

【図１８】本発明を説明するための図であって、本発明
の第５の具体例において用いる各係数αの例を示す図。

【図１９】本発明を説明するための図であって、本発明
の第６の具体例を説明するための図。

【図２０】本発明を説明するための図であって、本発明
の第６の具体例を説明するためのブロック図。

【図２１】本発明を説明するための図であって、本発明
の第６の具体例に係る分割処理の流れを示すフローチャ
ート。

【符号の説明】

１…文書入力部２…文書記憶部３…キーワード抽出部４…データ記憶部５，５Ａ，５Ｂ…推論部６…表示部６ａ…制御機能部６ｂ…出力部７…評価データ入力部８，８ａ，８Ａ…学習部９…不要キーワード検出処理部。

Claims

【特許請求の範囲】

【請求項１】入力された文書からキーワードを抽出す
るキーワード抽出手段と、予め定められたキーワードの組合せと文書の重要性に関
する評価値の関係を記憶する記憶手段と、この記憶手段に記憶された前記関係と前記入力された文
書から抽出された前記キーワードのうちの所定のキーワ
ードとに基いて、前記入力された文書の重要度を推論す
る推論手段と、この推論手段により重要度が高いと判定された場合に、
前記入力された文書を利用者に表示する表示手段と、を
具備したことを特徴とする情報フィルタ装置。
【請求項２】入力された文書から抽出されたキーワー
ドに基いて該文書の重要度を推論し、該文書が重要と判
定された場合に提示を行なう情報フィルタ装置におい
て、前記推論に用いるための予め定められたキーワードの組
合せと文書の重要度に関する評価値の関係の情報を保持
する記憶手段と、学習対象となる文書からキーワードを抽出するキーワー
ド抽出手段と、前記学習対象となる文書の評価値を入力するための評価
データ入力手段と、前記文書から抽出されたキーワードのうちの所定のキー
ワードと得られた前記評価値を用いて、前記記憶手段の
保持する前記キーワードの組合せと評価値の関係の情報
を学習する学習手段と、を具備したことを特徴とする情
報フィルタ装置。
【請求項３】文書を入力する文書入力手段と、この文書入力手段より入力された前記文書からキーワー
ドを抽出するキーワード抽出手段と、予め定められたキーワードの組合せと評価値の関係の情
報を保持する記憶手段と、この記憶手段に記憶された前記関係と前記文書から抽出
された前記キーワードのうちの所定のキーワードに基い
て、前記入力された文書の重要度を推論する推論手段
と、この推論手段により重要と判定された文書を利用者に提
示する表示手段と、この表示された文書の重要性に関する前記利用者の評価
値を入力するための評価データ入力手段と、前記文書から抽出されたキーワードと得られた前記評価
値を用いて、前記記憶手段に保持させる前記キーワード
の組合せと評価値の関係の情報を学習させる学習手段
と、を具備したことを特徴とする情報フィルタ装置。
【請求項４】前記学習手段は、前記キーワード抽出手
段により前記所定のキーワード以外の新規のキーワード
が抽出された場合に、過去の前記関係の学習結果に該新
規キーワードを追加するキーワード追加手段をさらに具
備したことを特徴とする請求項２または３に記載の情報
フィルタ装置。
【請求項５】前記学習手段は、前記キーワードの組合
せと評価値の関係を学習する際、前記文書から抽出され
たキーワードが影響を及ぼす範囲についてのみ学習する
ものであり、前記推論手段は、文書から抽出されたキー
ワードに所定のキーワードが存在しないとした場合の該
文書の重要度を予め保持しておき、入力された前記文書
の重要度を推論する際、前記文書から抽出されたキーワ
ードに所定のキーワードが存在する場合に該キーワード
が該保持しておいた重要度を変動させる値を求め、この
値に基いて該保持しておいた重要度を修正することによ
り、入力された前記の重要度を求めるものであることを
特徴とする請求項３に記載の情報フィルタ装置。
【請求項６】前記推論手段は、入力された前記文書の
重要度をスペクトル理論に基づいて推論するものである
ことを特徴とする請求項１または２または５いずれか記
載の情報フィルタ装置。
【請求項７】前記学習手段は、前記キーワードの組合
せと評価値の関係をスペクトル理論に基づいて学習する
ものであることを特徴とする請求項２乃至５いずれか記
載の情報フィルタ装置。
【請求項８】前記文書から抽出された全キーワード中
における前記所定のキーワードの、前記抽出された全キ
ーワード中に占める割合が、予め定められた値に満たな
いときは、前記推論手段による推論を行なわずに利用者
に提示する構成としたことを特徴とする請求項１または
２または４いずれか記載の情報フィルタ装置。
【請求項９】前記学習情報中の不要キーワードを検出
すると共に不要キーワードを削除する機能を持ち、不要
キーワードが検出された場合に、過去の前記関係の学習
結果から該不要キーワードを削除する不要キーワード検
出手段をさらに具備したことを特徴とする請求項２また
は３に記載の情報フィルタ装置。
【請求項１０】前記所定のキーワードの数が一定の大
きさ以上になった場合に、過去の前記関係の学習結果を
分割するキーワード分割手段をさらに具備したことを特
徴とする請求項２または３に記載の情報フィルタ装置。
【請求項１１】入力された文書からキーワードを抽出
するステップと、予め定められたキーワードの組合せと文書に与えられる
評価値との関係を記憶するステップと、記憶された前記関係と前記入力された文書から抽出され
た前記キーワードのうちの所定のキーワードとに基づい
て、前記入力された文書の重要度を推論するステップ
と、を具備することを特徴とする情報フィルタ方法。
【請求項１２】前記推論するステップにより得られた
重要度が、所定の条件を満たしているか否かを判定する
ステップと、前記判定ステップにより所定の条件を満たしていると判
定された場合に、前記入力された文書に関する所定の情
報を利用者に表示するステップと、を更に具備すること
を特徴とする請求項１１記載の情報フィルタ方法。
【請求項１３】前記表示ステップにより表示された前
記所定の情報に基づいて、前記利用者に対する評価値を
入力するステップと、前記文書から抽出されたキーワードと、前記入力された
評価値とに基づいて、前記キーワードの組合せと前記評
価値との関係の情報を学習するステップと、を更に具備
することを特徴とする請求項１２記載の情報フィルタ方
法。
【請求項１４】前記学習させるステップは、前記所定
のキーワード以外の新規のキーワードが抽出された場合
に、前記新規のキーワードを追加するステップを更に有
することを特徴とする請求項１３記載の情報フィルタ方
法。
【請求項１５】前記学習するステップは、前記キーワ
ードの組合せと評価値の関係を学習する際、前記文書か
ら抽出されたキーワードが影響を及ぼす範囲について学
習するステップを含み、前記推論するステップは、文書
から抽出されたキーワードに所定のキーワードが存在し
ないとした場合の当該文書の重要度を予め保持してお
き、入力された前記文書の重要度を推論する際に、前記
文書から抽出されたキーワードに所定のキーワードが存
在する場合に当該キーワードが保持しておいた重要度を
変動させる値を求め、この値に基づいて該保持しておい
た重要度を修正することにより、入力された前記の重要
度を求めるステップを含むことを特徴とする請求項１３
記載の情報フィルタ方法。