JPH1131156A - 文書検索装置及び方法 - Google Patents

文書検索装置及び方法

Info

Publication number
JPH1131156A
JPH1131156A JP9188516A JP18851697A JPH1131156A JP H1131156 A JPH1131156 A JP H1131156A JP 9188516 A JP9188516 A JP 9188516A JP 18851697 A JP18851697 A JP 18851697A JP H1131156 A JPH1131156 A JP H1131156A
Authority
JP
Japan
Prior art keywords
search
search key
strength
connection
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9188516A
Other languages
English (en)
Inventor
Noriko Koyama
紀子 小山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP9188516A priority Critical patent/JPH1131156A/ja
Publication of JPH1131156A publication Critical patent/JPH1131156A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】複雑な関連語など関係のある語も検索キーとす
ることができ、よりユーザの求めるものに近い検索結果
が得られるようにする。 【解決手段】入力部11から検索キーが入力されると、
検索キー展開部17はその入力検索キーを検索キーリス
トに入れ、更にニューラル・ネットワーク型の単語デー
タベース16を参照して、当該検索キーとの結びつきが
例えばユーザ指定の強さの範囲内の単語を検索キーとし
て求め、検索キーリストに追加する。検索部18は検索
キーリスト中の各検索キーをもとに文書ファイル15を
検索する。結果重み付け部19はこの検索結果をデータ
ベース16中の結びつきの強さの情報に基づいて重み付
けすると共に当該検索結果をデータベース16のネット
ワーク構成に従ってグルーピングする。検索制御部14
は、以上の処理を終えた検索結果を重み付けによって順
序付けし、制御部13による表示出力に供する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ユーザ指定の検索
キーと関係のある語も検索キーとして取得して文書検索
を行う文書検索装置及び方法に関する。
【0002】
【従来の技術】近年、OCR(光学的文字読取装置)な
どの発達により、今までは印刷されていた文書を、電子
化したファイルとして大量に持つことができるようにな
ってきた。当然、文書ファイルは大容量となり、その中
から求める情報を得るための検索システムが必要となっ
てくる。
【0003】検索システムには、予め文書ファイルにキ
ーワードを付けておく方法や、文書ファイルの内容を見
て検索する全文検索など、様々な方法を採用したものが
ある。いずれの場合でも、ユーザが入力する検索キーと
実際の文書ファイルに現れる語とのギャップを埋めるた
め、検索キーとなる語そのものだけでなく、類語やシソ
ーラスを用いて検索キーを展開するなどの方法で、より
ユーザの求めるものに近い検索結果を得る工夫がなされ
ている。
【0004】
【発明が解決しようとする課題】しかしながら、上記し
た従来技術においては、単に単語をグルーピングした類
語や階層構造のシソーラスをグルーピングの一種のよう
に用いているのみであり、検索結果においては優先度に
多少の付加情報を与えるだけで、それ以上の情報を反映
することはしていなかった。このため、よりユーザの求
めるものに近い検索結果を得るという点では、改良の余
地があった。
【0005】そこで、本発明は上記の問題を解決するた
めになされたものであり、単なる類語やシソーラスでは
なく、語と語をネットワーク型に結び、結びつきの強さ
等を規定できるニューラル・ネットワーク型の単語デー
タベースを用いることで、ユーザの指定した検索キーか
ら複雑な関連語など関係のある語も検索キーとして取得
でき、この検索キーを用いて文書検索を行うことで、よ
り適した検索結果を求めると共に、ユーザによりわかり
やすく検索結果を提示することができる文書検索装置及
び方法を提供することにある。
【0006】
【課題を解決するための手段】本発明は、ユーザ指定の
検索キーを入力するための入力手段と、単語相互間をネ
ットワーク状に結び、各結びつき毎に少なくとも結びつ
きの向きと強さを持つニューラル・ネットワーク型の単
語データベースと、この単語データベースを参照して上
記人力された検索キー(入力検索キー)との結びつきの
強さをもとに検索キーを展開する検索キー展開手段と、
この検索キー展開手段により展開された検索キーにより
文書を検索する検索手段とを備えたことを特徴とする。
【0007】また本発明は、上記検索手段による検索結
果を上記単語データベース中の結びつきの強さの情報に
基づいて重み付けすると共に当該検索結果を単語データ
ベースのネットワーク構成に従ってグルーピングする結
果重み付け手段と、この結果重み付け手段により重み付
けされ且つグルーピングされた検索結果を、その重み付
けに従って順序付けて表示する検索結果提示手段とを更
に備えたことをも特徴とする。
【0008】このような構成においては、入力検索キー
の単語を起点としてニューラル・ネットワーク型の単語
データベースのネットワークをたどることで、当該単語
との結びつきが強い単語を検索キーとして取得するとい
う検索キーの展開が行われることから、複雑な関連語な
ど関係のある語も検索キーとすることができる。したが
って、この展開された検索キーの各々により文書を検索
することで、よりユーザの求めるものに近い検索結果を
得ることが可能となる。なお、ここでは、展開された検
索キーには入力検索キーそれ自体も(入力検索キーとの
結びつきが最も強い検索キーとして)含まれているもの
とするが、含まれていないものとしてもよい。この場
合、入力検索キーと展開された検索キーにより文書を検
索することになる。
【0009】また、上記の構成においては、検索手段の
検索結果が上記展開された検索キーと入力検索キーとの
結びつきの強さに基づいて重み付けされると共に、単語
データベースの単語ネットワーク構成に従ってグルーピ
ングされ、その重み付けに従って順序付けて表示され
る。これにより、ユーザによりわかりやすく検索結果を
提示することができる。ここで、単語データベースのネ
ットワーク構成における単語相互間の各結びつき毎に、
結びつきの向きと強さに加えて結びつきの種類(例え
ば、上位概念/下位概念、同義語、反対語、関連語な
ど)を持たせ、ユーザに検索結果を提示する際に、その
種類を併せて提示することで、ユーザによりわかりやす
く検索結果を提示できる。
【0010】また、検索キーとの結びつきが強い単語で
あるとの判定条件として、結びつきの強さの範囲(の例
えば下限)を指定し、検索キーとの結びつきの強さがそ
の範囲(その下限を下回らない範囲)内の単語を検索キ
ーとして取得する構成とするとよい。この範囲(の下
限)は、システム側で予め設定しておいても、ユーザの
指定により設定或いは設定変更可能なようにしてもよ
い。もし、ユーザにより指定できるようにするならば、
複雑になりがちなニユーラル・ネットワーク型の単語デ
ータベースからの検索キーの展開に、ユーザが指定した
強さを反映することができるため、ユーザの意図する範
囲での検索を行うことが可能となる。
【0011】更に、設定する結びつきの強さの範囲を広
げる(例えば下限を拡張する、即ち結びつきの強さが弱
くなる方向に変更する)などの、ユーザからの変更指定
が受け付け可能な構成とするとよい。
【0012】このような構成においては、展開された検
索キー、即ち入力検索キーと関連のある検索キーが少な
いか或いはユーザの意図したものではなくても、結びつ
きの強さの範囲を広げることで、ユーザの意図した検索
キーを取得してユーザの求めるものに近い検索結果を新
たに得ることが可能となる。この結びつきの強さの範囲
の変更指定時には、前回の範囲に対して変更(拡張)さ
れた範囲についてのみ、例えば範囲の下限を指定する方
式であれば、前回の下限を上限として、その上限と今回
の下限との間の強さの範囲(拡張された範囲)内で、再
度検索キーを展開するならば、一度検索した検索キーを
再度取得することはなく、したがって一度検索した検索
キーで再度検索するという無駄を抑止して、新たな検索
結果だけを得ることができる。
【0013】また、検索時間(の上限)をユーザから指
定可能な構成とし、ユーザ指定の時間内に検索が終了す
るように検索キー展開手段による検索キー展開及び検索
手段による検索を制御する検索制御手段を設けるように
するとよい。この際、検索制御手段は、検索キー展開の
条件である人力検索キーとの結びつきの強さの範囲(の
例えば下限)を、予め定められた範囲(の下限)或いは
ユーザ指定の範囲(の下限)内で時間経過と共に逐次拡
張する制御を行うとよい。ここで、結びつきの強さの範
囲(の下限)の拡張の繰り返しを、ユーザ指定の検索時
間が経過するまで行うようにしても、ユーザ指定の検索
時間に見合った検索キーの個数(の上限)を決定し、そ
の個数の検索キーが取得できるまで行うようにしてもよ
い。
【0014】このような構成においては、ユーザが指定
した時間内に検索が終わるように制御することによっ
て、よりユーザの求める範囲の検索結果が得られるよう
になる。
【0015】この他、検索結果の特徴をユーザから指定
可能な構成とし、そのユーザ指定の検索結果の特徴から
検索キー展開の条件としての結びつきの強さの範囲を設
定するようにしてもよい。
【0016】このような構成においては、ユーザは感覚
的に自分の求める特徴を指定するだけで、それに応じた
検索キーの展開を行って、適切な検索結果を得ることが
できる。
【0017】
【発明の実施の形態】以下、本発明の実施の形態につき
図面を参照して説明する。 [第1の実施形態]図1は本発明の第1の実施形態に係
る文書検索装置の概略構成を示すブロック図である。
【0018】図1において、11は文字列を入力するた
めの入力部、12は入力部11により入力された文字列
などを表示する表示部である。13は装置全体の制御を
司る制御部、14は文書ファイル15を対象とする検索
処理のための全体的な制御を司る検索制御部である。
【0019】15は検索の対象となる文書ファイル、1
6は検索キーの展開及び重み付けの情報を持つ単語デー
タベースである。ここでは単語データベース16は、単
語相互間をネットワーク状に結び、各結びつき毎に結び
つきの向きと種類と強さを持つニューラル・ネットワー
ク型のデータベースである。
【0020】17は入力された検索キーを単語データベ
ース16を用いて展開する検索キー展開部、18は検索
部17により展開された検索キーにより文書ファイル1
5を検索する検索部、19は結果重み付け部である。結
果重み付け部19は、検索部18により検索された結果
を検索キー展開方法により重み付けをする結果重み付け
部である。
【0021】次に、図1の構成の文書検索装置の動作の
概要を説明する。まず、利用者の操作に従い、入力部1
1から検索キーとしての単語が入力される。この検索キ
ーは、制御部13を介して検索制御部14に送られる。
検索制御部14は、入力された検索キーを検索キー展開
部17に渡す。検索キー展開部17は、単語データベー
ス16を参照して、入力された検索キーからそれに類し
た複数の検索キーに展開する。
【0022】単語データベース16は、前記したように
単語相互間をネットワーク型に結び、結びつきの種類や
強さを規定した、ニューラル・ネットワーク型のデータ
ベースである。この単語データベース16のデータ構造
例を図2に示す。図中の矢印は、対応する語同士の結び
つきの方向を表し、それぞれ結びつきの種類と、結びつ
きの強さを示す数値とを持つ。ここでは、数値が少ない
方が結びつきが強いことを示す。なお、図では省略して
あるが、下位概念は反対方向に同じ結びつきの強さで上
位概念の結びつきを持つ。
【0023】さて、検索キー展開部17が単語データベ
ース16を参照することで展開された複数の検索キーは
検索部18に送られる。検索部18は渡された検索キー
をもとに、検索の対象となる文書の集まりである文書フ
ァイル15を検索する。検索部18により検索された結
果は、どの検索キーにマッチしたかという情報と共に結
果重み付け部19に送られる。
【0024】結果重み付け部19では、単語データベー
ス16を参照して検索キーの展開の情報を得、展開のと
きの単語間の関係により検索結果に重み付けをすると共
に、ネットワーク型の単語データベース16の情報に従
って検索キー毎に検索結果をグルーピングする。検索制
御部14は、以上の処理を終えた検索結果を重み付けに
よって順序付けた上で制御部13に戻し、検索処理の結
果とする。制御部13はその結果を表示部12を通して
ユーザに提示する。
【0025】次に、検索キー展開部17の処理の詳細
を、図3のフローチャートを参照して説明する。まず検
索キー展開部17は、入力された検索キー(検索語)自
体を検索キーリストに入れる(ステップ101)。次に
検索キー展開部17は、入力検索語で単語データベース
16を検索する(ステップ102)。もし、入力検索語
(に一致する単語)が単語データベース16にないなら
ば、検索キー展開部17はそのまま検索キーリストへの
追加を終了する。
【0026】これに対し、入力検索語が単語データベー
ス16にあるならば、検索キー展開部17は単語データ
ベース16のネットワークを順次たどる(ステップ10
4)。図2の例から明らかなように、1つの単語には複
数の結びつきがある場合もあるので、検索キー展開部1
7はそれらを全てたどる(ステップ105)。但し、遠
くまでたどって行くと、ほとんど関係のない単語までた
どられてしまうので、ある程度結びつきが強くなければ
そこでたどるのを止める(ステップ106)。
【0027】ここで、「ある程度」という「程度」は、
例えば結びつきの強さの下限で決定される。単語データ
ベース16では、結びつきが強い場合には小さな数値を
持っており、したがって上記「程度」は結びつきの強さ
を示す値の最大値で決定される。そこで、単語データベ
ース16のネットワークをたどって行くうち、入力検索
語からの結びつきの強さの値の合計が、例えば10を越
えないものまで、といった制限を設けておく。その条件
を満たし、結びつきが強い場合には、検索キーリストに
その単語を検索キーとして結び付きの強さ(の値の合
計)と共に追加する(ステップ107)。これを必要な
ネットワークを全てたどるまで繰り返す。なお、上記ス
テップ101において入力検索語(検索キー)を検索キ
ーリストに入れる際には、当該入力検索語の自身との結
び付きの強さの値として(最小値)0が設定されるもの
とする。
【0028】以上の検索キー展開部17の処理の具体例
を、検索語(検索キー)として「ベルゼブブ」という単
語が入力された場合について説明する。まず、入力され
た「べルゼブブ」は検索キーリストに登録される。更に
単語データベース16には、図2のように「ベルゼブ
ブ」という単語があるので、ネットワークをたどり、検
索キーの展開を行なう。
【0029】図2の単語データベース16の例では、
「ベルゼブブ」の上位概念には「悪魔」がある。この
「悪魔」は「ベルゼブブ」との結びつきの強さの値が1
のため、これも検索キーリストに追加される。更に「悪
魔」からは「天使」及び「堕天使」に結びつきがあり、
いずれも「ベルゼブブ」からの結びつきの強さの値の合
計が1+5=6,1+2=3のように10を越えないた
め、検索キーリストに追加される。
【0030】一方、「天使」からは上位概念として「キ
リスト教」もあるが、これは結びつきの強さの値の合計
が1+5+6=12のように10を越えるため、検索キ
ーリストには追加されない。
【0031】検索キー展開部17では、これを繰り返す
ことによって、「ベルゼブブ」という検索キーの入力に
対する図4に示すような検索キーリストが得られる。但
しこの段階では、図4中の重み付けの値は得られていな
いものとする。
【0032】結果重み付け部19は、この検索キーリス
トを用いて検索部18での検索結果を重み付けする。こ
の例では、結びつきの強さの値の合計が10を越えない
ものを検索キーリストに入れてあるので、重み付けは1
0と結びつきの強さの値との差ということにする。検索
キーリスト中の各検索キーの重み付けがどうなるかは、
図4に示してある。この重み付けを用いて、ユーザに対
して検索結果を示す順位を制御する。
【0033】次に、検索結果を表示部12を介してユー
ザに提示する例について5図を参照して説明する。まず
図5(a)は、入力された検索語である「ベルゼブブ」
についての検索結果表示画面例を示す。ここでは、入力
語「ベルゼブブ」、及び当該「ベルゼブブ」と(直接)
結びつきのある語「悪魔」について、その語を検索語と
する検索結果の件数、並びに重み付けが併せて表示され
る。また、上記結びつきのある語については、結びつき
の種類も表示される。図5(a)の例では、「ベルゼブ
ブ」に該当する文書は1つもないが、その上位概念であ
る「悪魔」には5件の文書があったことがわかる。
【0034】図5(a)の検索結果表示画面上でユーザ
が「悪魔」をマウス等で選択すると、制御部13の制御
により図5(b)のような検索結果表示画面に切り替え
られ、ユーザが選択した「悪魔」とそれぞれ結びつきの
ある語が、その検索結果の件数、重み付け、結びつきの
種類と併せて示される。図5(c)は、図5(b)の画
面上で「堕天使」を選択した場合に、図5(d)は図5
(c)の画面上で「天使」を選択した場合に、それぞれ
切り替え表示される検索結果表示画面の例を示す。この
図5(d)の画面上で、更に同じ「天使」を選択する
と、その「天使」という単語が存在する文書の(タイト
ルの)一覧である図6に示すような検索結果文書リスト
が表示される。この文書リストには、各文書(のタイト
ル)毎に、「天使」以外にその文書に存在する検索キー
リストにある語(即ち「天使」以外の検索キー)が併せ
て示される。
【0035】なお、ユーザに検索キーを提示していく場
合、単語データベース16がネットワーク型をしている
関係で、別の経路を通って同じ語に行き着く場合もあ
る。検索結果の重み付けとしては、より結びつきの強い
ものを優先するのが普通であるが、ユーザに提示する際
には、別の経路を経由して一度提示した語は表示の方法
を変えるなどすると分かりやすい。そこで図5の例で
は、そのような語の後に「*」という記号を付けること
で示している。 [第2の実施形態]図7は本発明の第2の実施形態に係
る文書検索装置の概略構成を示すブロック図である。
【0036】図7に示す文書検索装置は、図1中の入力
部11、表示部12、制御部13、検索制御部14、文
書ファイル15、単語データベース16、検索キー展開
部17、検索部18、結果重み付け部19に相当する、
入力部21、表示部22、制御部23、検索制御部2
4、文書ファイル25、単語データベース26、検索キ
ー展開部27、検索部28、結果重み付け部29を有し
ている。この図7の文書検索装置の特徴は、上記の各構
成要素に加えて、検索キー展開のための結びつきの強さ
の値の最大値(即ち結びつきの強さの下限)をユーザに
設定させるユーザインタフェースである強さ設定部3
0、及び当該強さ設定部30にてユーザに設定させた結
びつきの強さの値を記憶する強さ記憶部31を有してい
ることである。
【0037】さて、図7の構成の文書検索装置において
強さ設定部30は、ユーザとの対話を行うことで、検索
キー展開部27が検索キーを展開する際の結びつきの強
さの値の最大値を、ユーザにより予め入力設定させる。
強さ設定部30は、ユーザが入力設定した結びつきの強
さの値を強さ記憶部31に記憶する。
【0038】検索制御部24は、図1中の検索制御部1
4とは異なって、強さ記憶部31に記憶された(ユーザ
指定の)結びつきの強さの値の最大値を検索キー展開部
27に渡す機能を有している。これにより検索キー展開
部27は、単語データベース26のネットワークを順次
たどる際の条件として、検索制御部24から渡された結
びつきの強さの値の最大値を基準に、入力検索語(検索
キー)からの結びつきの強さの値の合計が当該最大値を
越えない範囲の結び付きの単語までたどるという条件を
設定し、ユーザが設定した範囲の結びつきの単語のみを
検索キーとして抽出して検索キーリストに追加すること
ができる。
【0039】また本実施形態では、ユーザは検索された
結果を見た後、更に結びつきの強さの値の最大値を設定
し直すことで、範囲を広げて再度検索させる、などの指
示を行うこともできる。検索制御部24は、結びつきの
強さの値の最大値が変更された場合、強さ記憶部31上
で変更された結びつきの強さの値を参照し、変更前の結
びつきの強さの値の最大値を最小値(即ち結びつきの強
さの上限)とし、変更後の結びつきの強さの値の最大値
を最大値(即ち結びつきの強さの下限)とする範囲の情
報を、新たに追加されるべき結び付きの強さの値の範囲
であるとして検索キー展開部27に渡す。すると検索キ
ー展開部27は、入力検索語からの結びつきの強さの値
の合計が検索制御部24から渡された範囲内の結び付き
の単語だけを、単語データベース26のネットワークを
たどって抽出する。これにより、同じ検索キーで再度検
索するなどの無駄な検索キー展開が発生するのを抑止で
きる。
【0040】次に、検索キー展開部27の処理の詳細
を、図8のフローチャートを参照して説明する。まず、
図8(a)に示すように、初めての検索か、ユーザが更
なる検索を指定したのかで処理が異なる(ステップ20
1)。初めての検索の場合には、検索キー展開部27は
入力された検索キー(検索語)自体を検索キーリストに
入れる(ステップ202)。次に検索キー展開部27
は、入力された検索キーで単語データベース26を検索
し(ステップ203)、当該検索キー(に一致する単
語)が単語データベース26にあった場合には(ステッ
プ204)、その検索キーについて、以下に述べるMO
DULE1の処理を行う(ステップ205)。このMO
DULE1は単語データベース26内のある単語を開始
点として行われる検索キーの展開処理であり、その処理
の流れは図8(b)に示されている。
【0041】まず、MODULE1の処理では、開始点
となる単語(ここでは、ステップ203で検索された単
語)から出ている結びつきを順次たどる(ステップ21
1)。結びつきを全部たどってしまった時点でMODU
LE1を終わり、上位の制御に戻る(ステップ21
2)。
【0042】これに対し、たどる結びつきがまだある場
合は、今回の検索が初めての検索であるならば、結びつ
きの強さの値の新たな最大値は指定されておらず、した
がって最小値は指定されていないはずであるから、次の
判定をスキップする(ステップ213)。一方、初めて
の検索でなければ、前回の結びつきの強さの値の指定値
との差分で範囲が指定されているはずなので、その範囲
の最小値(即ち前回指定された結びつきの強さの値の最
大値)より小さい場合は、該当する単語自体を検索キー
とせずに、更に結びつきをたどる処理に移る(ステップ
214)。逆に、最小値より大きい場合には、更にその
範囲の最大値(即ち、新たに指定された結びつきの強さ
の値の最大値)より小さいか否かを判断して(ステップ
215)、小さければ該当する単語を検索キーリストに
追加し(ステップ216)、その単語を開始点として同
じくMODULE1を行う(ステップ217)。
【0043】このようにして、前回の結びつきの強さの
指定値との差分で指定される範囲内の結び付きの単語だ
けが単語データベース26のネットワークをたどって抽
出され、検索キーリストに追加される。検索部18は、
この検索キーリスト中の各検索キーをもとに文書ファイ
ル15を検索する。 [第3の実施形態]図9は本発明の第3の実施形態に係
る文書検索装置の概略構成を示すブロック図である。
【0044】図9に示す文書検索装置は、図1中の入力
部11、表示部12、制御部13、検索制御部14、文
書ファイル15、単語データベース16、検索キー展開
部17、検索部18、結果重み付け部19に相当する、
入力部41、表示部42、制御部43、検索制御部4
4、文書ファイル45、単語データベース46、検索キ
ー展開部47、検索部48、結果重み付け部49を有し
ている。この図9の文書検索装置の特徴は、上記の各構
成要素に加えて、検索時間の上限値をユーザに設定させ
るユーザインタフェースである時間設定部50、及び当
該時間設定部50にてユーザに設定させた検索時間の上
限値を記憶する時間記憶部51を有していることであ
る。
【0045】さて、図9の構成の文書検索装置において
時間設定部50は、ユーザとの対話を行うことで、検索
時間の上限値をユーザにより予め入力設定させる。時間
設定部50は、ユーザが入力設定した検索時間の上限値
を時間記憶部51に記憶する。
【0046】検索制御部44は、時間記憶部51に記憶
されたユーザ指定の検索時間の上限値を参照しながら、
検索キー展開部47と検索部48への要求を制御するこ
とによって、ユーザが設定した時間の範囲内で検索を行
う。
【0047】次に、検索制御部44による制御手順の詳
細を、図10のフローチャートを参照して説明する。検
索制御部44は、時間記憶部51に記憶されている検索
時間の上限値と今までに検索に要した時間から、検索に
残された時間を調べる(ステップ301)。もし、残り
時間がないならば、検索制御部44はそこで処理を終了
する(ステップ302)。これに対し、残り時間がある
ならば、検索制御部44は結びつきの強さの値の最大値
を適当な値、例えば一定値だけ拡張して、検索キ一展開
部48に検索キーを展開させ(ステップ303)、更に
時間を指定して検索部48に文書ファイル45を検索さ
せる(ステップ304)。
【0048】ここで、検索部48での検索途中で指定さ
れた時間が過ぎてしまったならば、検索制御部44は検
索を打ち切って処理を終了する(ステップ305)。一
方、指定時間内に検索できたならば、検索制御部44は
その検索結果に対して結果重み付け部49により重み付
けさせた上で(ステップ306)、検索結果として積み
(ステップ307)、ステップ301に戻る。なお、ス
テップ303で一定値だけ拡張する代わりに、残り時間
に応じて決まる値だけ拡張するようにしても構わない。
【0049】次に、検索制御部44の制御処理の変形例
について、更に具体的に述べるならば、図10のフロー
チャートに示した制御処理と同等の効果が得られる検索
制御部44の制御処理について、図11のフローチャー
トを参照して説明する。この手順は、検索キーの数によ
って検索時間の見当がつく場合に有効な方法である。
【0050】まず検索制御部44は、時間記憶部51に
記憶されたユーザ指定の検索時間の上限値から検索キー
の個数の上限を計算する(ステップ311)。次に検索
制御部44は、検索キー展開部47により検索キーを展
開させてみて(ステップ312)、ステップ311での
計算で求められた上限の個数に達していなければ(ステ
ップ313)、結びつきの強さの値の最大値を適当な
値、例えば一定値だけ拡張して更に検索キーを展開させ
る(ステップ314)。なお、一定値だけ拡張する代わ
りに、計算で求めた上限の個数とその時点において実際
に展開されている個数との差に応じて決まる値だけ拡張
するようにしても構わない。
【0051】検索制御部44は、計算で求めた上限の個
数まで検索キーを展開させ後(ステップ313)、その
検索キーを使って検索部48により文書ファイル45を
検索させ(ステップ315)、その検索結果に対して結
果重み付け部49により重み付けさせて(ステップ31
6)戻る。
【0052】図10のフローチャートに示す制御手順、
または図11のフローチャートに示す制御手順のいずれ
を適用するかは、検索方式の特徴によって決めればよ
い。 [第4の実施形態]図12は本発明の第4の実施形態に
係る文書検索装置の概略構成を示すブロック図である。
【0053】図12に示す文書検索装置は、図1中の入
力部11、表示部12、制御部13、検索制御部14、
文書ファイル15、単語データベース16、検索キー展
開部17、検索部18、結果重み付け部19に相当す
る、入力部61、表示部62、制御部63、検索制御部
64、文書ファイル65、単語データベース66、検索
キー展開部67、検索部68、結果重み付け部69を有
している。この図12の文書検索装置の特徴は、上記の
各構成要素に加えて、検索結果の特徴をユーザに設定さ
せるユーザインタフェースである特徴設定部70、及び
当該特徴設定部70にてユーザに設定させた検索結果の
特徴を記憶する特徴記憶部71を有していることであ
る。
【0054】さて、図12の構成の文書検索装置におい
て特徴設定部70は、ユーザとの対話を行うことで、検
索結果の特徴をユーザにより予め入力設定させる。ここ
ではユーザは、「検索結果は少なくてもいいから速く」
「時間はかかってもいいから詳しく」などの検索結果の
特徴を指定する。この検索結果の特徴の指定には、ユー
ザに対して特徴設定部70により検索結果の特徴の一覧
を提示し、その中からユーザの望む特徴を選択させる方
法を適用する。この他、ユーザによりキーボード等から
検索結果の特徴を表す文字列を入力させ、その入力文字
列を文章解析することで、ユーザの意図した検索結果の
特徴を設定することも可能である。
【0055】特徴設定部70は、ユーザが入力設定した
検索結果の特徴を特徴記憶部71に記憶する。検索制御
部64は、特徴記憶部71に記憶されている検索結果の
特徴から、検索キーを展開する結びつきの強さ(の最大
値)を割り出し、この結びつきの強さで検索キー展開部
67に検索キーを展開させることで、ユーザが求めた特
徴を持つ検索結果を得る。
【0056】図13に、ユーザが指定する特徴の例と、
その特徴が設定された場合に決定される結びつきの強さ
の条件の例を示す。次に、検索制御部64及び検索キー
展開部67の処理の詳細を、図14のフローチャートを
参照して説明する。
【0057】まず検索制御部64は、図14(a)に示
すように、特徴記憶部71に記憶されているユーザが指
定した特徴を参照し(ステップ401)、その特徴に見
合った結びつきの強さを設定する(ステップ402)。
この結びつきの強さは図13に例示したような条件で設
定される。
【0058】次に検索制御部64は、設定した結びつき
の強さを条件として、検索キー展開部67に検索キーを
展開させる(ステップ403)。続いて検索制御部64
は、検索キー展開部67が展開した検索キーを使って検
索部68により文書ファイル65を検索させ(ステップ
404)、その検索結果に対して結果重み付け部69に
より重み付けさせて(ステップ405)戻る。
【0059】さて、上記ステップ403で検索制御部6
4から呼ばれた検索キー展開部67の処理は、図14
(b)のフローチャートに従って次のように行われる。
まず検索キー展開部67は、入力された検索キーの単語
自体を検索キーリストに入れる(ステップ411)。次
に検索キー展開部67は、入力された検索キーで単語デ
ータベース66を検索し(ステップ412)、当該検索
キー(に一致する単語)が単語データベース66にない
ならば、その段階で検索キーリストへの追加を終了する
(ステップ413)。
【0060】これに対し、入力された検索キーが単語デ
ータベース66にあるならば、検索キー展開部67は単
語データベース66のネットワークを順次たどる(ステ
ップ414)。ここで、1つの単語には複数の結びつき
がある場合もあるので、検索キー展開部67はそれらを
全てたどる(ステップ415)。たどったときの結びつ
きの強さの値の合計が、検索制御部64により指定され
た(ユーザ指定の特徴に見合った)強さの値以下ならば
(ステップ416)、検索キー展開部67は検索キーリ
ストにその単語を検索キーとして追加する(ステップ4
17)。このように本実施形態においては、ユーザが感
覚的に指定した特徴を結びつきの強さに置き換えて検索
を行うことができる。
【0061】以上の第1乃至第4の実施形態でそれぞれ
適用した文書検索装置における処理手順、特に検索制御
部14,24,44,64、及び検索キー展開部17,
27,47,67のそれぞれの処理手順は、プログラム
読み取り可能なパーソナルコンピュータ等のコンピュー
タに、当該処理手順を実行させるためのプログラムを記
録したCD−ROM、DVD−ROM、フロッピーディ
スク、メモリカード等の記録媒体に記録されているプロ
グラムを当該コンピュータで読み取り実行させることに
より実現される。なお、プログラムを記録した記録媒体
の内容が、通信回線等を介してコンピュータにダウンロ
ードされるものであっても構わない。
【0062】なお、以上の第1乃至第4の実施形態で
は、検索キーを単語で入力した場合に、検索キーの展開
及び検索、検索結果の提示を行う文書検索装置について
説明したが、本発明は、単なる単語の入力ではなく、合
成語や文章など、単語で構成されるものの入力であって
も、その入力を解析して単語単位に分割し、各単語を検
索キーとして検索に利用する文書検索装置にも応用する
ことが可能である。この場合は、分割した各単語を単語
データベースを用いて展開することになる。
【0063】
【発明の効果】以上詳述したように本発明によれば、単
語相互間をネットワーク状に結び、各結びつき毎に少な
くとも結びつきの向きと強さを持つニューラル・ネット
ワーク型の単語データベースを利用することによって、
複雑な関連語など関係のある語を検索キーとすることが
できる。
【0064】また本発明によれば、展開された検索キー
による検索結果を単語データベース中の結びつきの強さ
の情報に基づいて重み付けすると共に当該検索結果を単
語データベースのネットワーク構成に従ってグルーピン
グし、その重み付けに従って順序付けて表示することに
より、ユーザによりわかりやすく検索結果を提示するこ
とができる。
【0065】また本発明によれば、複雑になりがちなニ
ユーラル・ネットワーク型の単語データベースからの検
索キーの展開に、ユーザが指定した結びつきの強さを反
映することによって、ユーザの意図する範囲での検索を
行うことができ、しかも「もっと範囲を広げる」などの
指定で検索結果も追加でき、その際には一度検索した検
索キーでは検索しないよう、無駄な検索を避けることも
できる。
【0066】また本発明によれば、ユーザが指定した時
間内に検索が終わるように制御することによって、より
ユーザの求める範囲の検索結果が得られるようになる。
また本発明によれば、ユーザは感覚的に自分の求める特
徴を指定するだけで、それに見合った結びつきの強さの
範囲内で検索キーの展開を行わせることができるため、
適切な検索結果を得ることができる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態に係る文書検索装置の
概略構成を示すブロック図。
【図2】図1中の単語データベース16のデータ構造例
を示す模式図。
【図3】図1中の検索キー展開部17の処理手順を示す
フローチャート。
【図4】「ベルゼブブ」という検索キーが入力された場
合に検索キー展開により得られる検索キーリストの一例
を示す図。
【図5】「ベルゼブブ」という検索キーが入力された場
合の検索結果表示画面例を示す図。
【図6】検索結果文書リストの表示例を示す図。
【図7】本発明の第2の実施形態に係る文書検索装置の
概略構成を示すブロック図。
【図8】図7中の検索キー展開部27の処理手順を示す
フローチャート。
【図9】本発明の第3の実施形態に係る文書検索装置の
概略構成を示すブロック図。
【図10】図9中の検索制御部44による制御手順を示
すフローチャート。
【図11】図9中の検索制御部44による他の制御手順
を示すフローチャート。
【図12】本発明の第4の実施形態に係る文書検索装置
の概略構成を示すブロック図。
【図13】上記第4の実施形態において、ユーザが指定
する特徴の例と、その特徴が設定された場合に決定され
る結びつきの強さの条件の例を示す図。
【図14】図12中の検索制御部64及び検索キー展開
部67の処理手順を示すフローチャート。
【符号の説明】
11,21,41,61…入力部 12,22,42,62…表示部 14,24,44,64…検索制御部 15,25,45,65…文書ファイル 16,26,46,66…単語データベース 17,27,47,67…検索キー展開部 18,28,48,68…検索部 19,29,49,69…結果重み付け部 30…強さ設定部 31…強さ記憶部 50…時間設定部 51…時間記憶部 70…特徴設定部 71…特徴記憶部

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 ユーザ指定の検索キーを入力するための
    入力手段と、 単語相互間をネットワーク状に結び、各結びつき毎に少
    なくとも結びつきの向きと強さを持つニューラル・ネッ
    トワーク型の単語データベースと、 前記単語データベースを参照して前記入力手段により人
    力された検索キーとの結びつきの強さをもとに検索キー
    を展開する検索キー展開手段と、 前記検索キー展開手段により展開された検索キーにより
    文書を検索する検索手段とを具備することを特徴とする
    文書検索装置。
  2. 【請求項2】 前記検索キー展開手段に対し、前記人力
    された検索キーとの結びつきの強さをもとに検索キーを
    展開する際の条件として、前記人力された検索キーとの
    結びつきの強さの範囲を指定する検索制御手段を更に具
    備し、 前記検索キー展開手段は、前記検索制御手段により指定
    された前記結びつきの強さの範囲内で検索キーを展開す
    ることを特徴とする請求項1記載の文書検索装置。
  3. 【請求項3】 ユーザ指定の検索キーを入力するための
    入力手段と、 単語相互間をネットワーク状に結び、各結びつき毎に少
    なくとも結びつきの向きと強さを持つニューラル・ネッ
    トワーク型の単語データベースと、 前記単語データベースを参照して前記入力手段により人
    力された検索キーとの結びつきの強さをもとに索キーを
    展開する検索キー展開手段と、 前記検索キー展開手段による検索キー展開の条件として
    の、ユーザ指定の結びつきの強さの下限を設定記憶する
    ための強さ設定記憶手段と、 前記検索キー展開手段による検索キー展開を制御する検
    索制御手段であって、前記強さ設定記憶手段に記憶され
    ている結びつきの強さの下限を下回らない範囲内で、前
    記検索キー展開手段による検索キー展開を行わせる検索
    制御手段と、 前記検索キー展開手段により展開された検索キーにより
    文書を検索する検索手段とを具備することを特徴とする
    文書検索装置。
  4. 【請求項4】 前記検索制御手段は、前記強さ設定記憶
    手段に記憶されている結びつきの強さの下限が拡張変更
    された場合に、その拡張変更された範囲内で前記検索キ
    ー展開手段による検索キー展開を行わせることを特徴と
    する請求項3記載の文書検索装置。
  5. 【請求項5】 ユーザ指定の検索キーを入力するための
    入力手段と、 単語相互間をネットワーク状に結び、各結びつき毎に少
    なくとも結びつきの向きと強さを持つニューラル・ネッ
    トワーク型の単語データベースと、 前記単語データベースを参照して前記入力手段により人
    力された検索キーとの結びつきの強さをもとに検索キー
    を展開する検索キー展開手段と、 前記検索キー展開手段により展開された検索キーにより
    文書を検索する検索手段と、 ユーザ指定の検索時間の上限を設定記憶するための時間
    設定記憶手段と、 前記時間設定記憶手段に記憶されている時間内に検索が
    終了するように前記検索キー展開手段による検索キー展
    開及び前記検索手段による検索を制御する検索制御手段
    とを具備することを特徴とする文書検索装置。
  6. 【請求項6】 ユーザ指定の検索キーを入力するための
    入力手段と、 単語相互間をネットワーク状に結び、各結びつき毎に少
    なくとも結びつきの向きと強さを持つニューラル・ネッ
    トワーク型の単語データベースと、 前記単語データベースを参照して前記入力手段により人
    力された検索キーとの結びつきの強さをもとに検索キー
    を展開する検索キー展開手段と、 ユーザ指定の検索結果の特徴を設定記憶するための特徴
    設定記憶手段と、 前記特徴設定記憶手段に記憶されている特徴から前記検
    索キー展開手段による検索キー展開の条件としての結び
    つきの強さの範囲を決定し、その範囲内で前記検索キー
    展開手段による検索キー展開を行わせる検索制御手段
    と、 前記検索キー展開手段により展開された検索キーにより
    文書を検索する検索手段とを具備することを特徴とする
    文書検索装置。
  7. 【請求項7】 ユーザ指定の検索キーを入力するステッ
    プと、 単語相互間をネットワーク状に結び、各結びつき毎に少
    なくとも結びつきの向きと強さを持つニューラル・ネッ
    トワーク型の単語データベースを参照して、前記入力し
    た検索キーとの結びつきの強さをもとに検索キーを展開
    するステップと、 前記展開した検索キーにより文書を検索して検索結果を
    取得するステップとを具備することを特徴とする文書検
    索方法。
  8. 【請求項8】 コンピュータに、 ユーザ指定の検索キーを入力するステップと、 単語相互間をネットワーク状に結び、各結びつき毎に少
    なくとも結びつきの向きと強さを持つニューラル・ネッ
    トワーク型の単語データベースを参照して、前記入力し
    た検索キーとの結びつきの強さをもとに検索キーを展開
    するステップと、 前記展開した検索キーにより文書を検索して検索結果を
    取得するステップとを実行させるプログラムを記録した
    コンピュータ読取り可能な記録媒体。
JP9188516A 1997-07-14 1997-07-14 文書検索装置及び方法 Pending JPH1131156A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9188516A JPH1131156A (ja) 1997-07-14 1997-07-14 文書検索装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9188516A JPH1131156A (ja) 1997-07-14 1997-07-14 文書検索装置及び方法

Publications (1)

Publication Number Publication Date
JPH1131156A true JPH1131156A (ja) 1999-02-02

Family

ID=16225092

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9188516A Pending JPH1131156A (ja) 1997-07-14 1997-07-14 文書検索装置及び方法

Country Status (1)

Country Link
JP (1) JPH1131156A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000231569A (ja) * 1999-02-09 2000-08-22 Just Syst Corp インターネット情報検索装置、インターネット情報検索方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2000242654A (ja) * 1999-02-18 2000-09-08 Just Syst Corp 情報処理装置、情報処理方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2001282827A (ja) * 2000-03-30 2001-10-12 Just Syst Corp 文書検索装置、クエリ出力装置、文書検索方法、クエリ出力方法、並びに、記録媒体
JP2004021763A (ja) * 2002-06-19 2004-01-22 Hitachi Ltd テキストマイニングプログラム、方法、及び装置
JP2008276769A (ja) * 2007-04-26 2008-11-13 Nhn Corp キーワード提供範囲に基づいてキーワードを提供する方法およびそのシステム
JP2009140348A (ja) * 2007-12-07 2009-06-25 Toyota Motor Corp 行動決定装置、行動学習装置、及びロボット装置
WO2009104387A1 (ja) * 2008-02-20 2009-08-27 パナソニック株式会社 対話型番組検索装置
WO2014073233A1 (ja) * 2012-11-12 2014-05-15 富士ゼロックス株式会社 情報検索プログラム及び情報検索装置

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000231569A (ja) * 1999-02-09 2000-08-22 Just Syst Corp インターネット情報検索装置、インターネット情報検索方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2000242654A (ja) * 1999-02-18 2000-09-08 Just Syst Corp 情報処理装置、情報処理方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2001282827A (ja) * 2000-03-30 2001-10-12 Just Syst Corp 文書検索装置、クエリ出力装置、文書検索方法、クエリ出力方法、並びに、記録媒体
JP2004021763A (ja) * 2002-06-19 2004-01-22 Hitachi Ltd テキストマイニングプログラム、方法、及び装置
JP2008276769A (ja) * 2007-04-26 2008-11-13 Nhn Corp キーワード提供範囲に基づいてキーワードを提供する方法およびそのシステム
JP2009140348A (ja) * 2007-12-07 2009-06-25 Toyota Motor Corp 行動決定装置、行動学習装置、及びロボット装置
WO2009104387A1 (ja) * 2008-02-20 2009-08-27 パナソニック株式会社 対話型番組検索装置
CN101952825A (zh) * 2008-02-20 2011-01-19 松下电器产业株式会社 对话式节目检索装置
JPWO2009104387A1 (ja) * 2008-02-20 2011-06-16 パナソニック株式会社 対話型番組検索装置
US8161043B2 (en) 2008-02-20 2012-04-17 Panasonic Corporation Interactive program search apparatus
WO2014073233A1 (ja) * 2012-11-12 2014-05-15 富士ゼロックス株式会社 情報検索プログラム及び情報検索装置
JP2014096083A (ja) * 2012-11-12 2014-05-22 Fuji Xerox Co Ltd 情報検索プログラム及び情報検索装置

Similar Documents

Publication Publication Date Title
CN100472522C (zh) 用于搜索、导航和排名个人网中的文档的方法、***和计算机程序产品
US6598046B1 (en) System and method for retrieving documents responsive to a given user's role and scenario
KR101291291B1 (ko) 서치 엔진에서의 서치 결과의 다양한 개인화
JP2004326216A (ja) 文書検索装置、方法、プログラム、及び記録媒体
JP3315781B2 (ja) 利用者情報管理装置、情報フィルタ、情報分類装置、情報再生装置、情報検索装置及び仮名漢字変換装置
JPH08255163A (ja) 文書検索装置
JPH1131156A (ja) 文書検索装置及び方法
JP4754849B2 (ja) 文書検索装置、文書検索方法、および文書検索プログラム
US20050138028A1 (en) Processing, browsing and searching an electronic document
JP3767763B2 (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH10289240A (ja) 画像処理装置及びその制御方法
US20110119250A1 (en) Forward Progress Search Platform
JPH0934911A (ja) 情報検索装置
JPH1115841A (ja) 情報検索装置及び情報検索プログラムを記録した媒体
JP3059710B1 (ja) 情報検索システム、データベース管理装置、データベース管理方法、およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4636734B2 (ja) 情報検索システム、情報検索方法、情報検索プログラム、情報検索プログラムを記録した記録媒体、出力情報選択装置、出力情報選択方法、出力情報選択プログラム及び出力情報選択プログラムを記録した記録媒体
JPH06251081A (ja) ハイパーメディア処理装置
JPH09231233A (ja) ネットワーク検索装置
JP4138048B2 (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP3111081B2 (ja) データ検索装置
JPH07175811A (ja) 電子文書管理装置
JP3225735B2 (ja) 情報検索装置
JPH09305626A (ja) 検索文書作成装置、検索文書記憶メディア、文書検索装置及び文書検索方法
JPH11184888A (ja) 文書検索方法及び装置
JP2001060202A (ja) 文書閲覧システム及びそのシステムでの処理をコンピュータに行わせるためのプログラムを格納した記憶媒体