JPH0877203A - Document retrieval device - Google Patents

Document retrieval device

Info

Publication number
JPH0877203A
JPH0877203A JP6238580A JP23858094A JPH0877203A JP H0877203 A JPH0877203 A JP H0877203A JP 6238580 A JP6238580 A JP 6238580A JP 23858094 A JP23858094 A JP 23858094A JP H0877203 A JPH0877203 A JP H0877203A
Authority
JP
Japan
Prior art keywords
word
search
related word
document
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6238580A
Other languages
Japanese (ja)
Inventor
Kazuo Aihara
一雄 相原
Makoto Ando
誠 安藤
Akio Yamashita
明男 山下
Tatsuomi Kita
辰臣 喜多
Hiroko Matsuo
裕子 松尾
Shinji Kawamoto
真司 川本
Hiroshi Yamaguchi
浩 山口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP6238580A priority Critical patent/JPH0877203A/en
Publication of JPH0877203A publication Critical patent/JPH0877203A/en
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PURPOSE: To prevent a retrieval omission and a retrieval noise by speedily searching for a proper related word without any waste. CONSTITUTION: A related word dictionary is stored in a relative word dictionary storage part 109, and indexes which are generated for a document to be retrieved are stored in an index storage part 109. A relative word expansion part 103 finds candidates for a word related to a retrieval word inputted from a retrieval word input part 101. A relative word evaluation part 105 evaluates the candidate words obtained by the related word expansion part 103 on the basis of the indexes stored in the index storage part 109. The candidate words obtained by the related word expansion part 103 are found in the index storage part as a result of the evaluation, they are selected as related words, but when not the candidate words are not employed as the related words.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、文書データベースから
指定した検索語を含む文書を検索する文書検索装置に関
する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a document retrieval device for retrieving a document containing a designated retrieval word from a document database.

【0002】[0002]

【従来の技術】文書データベースの普及と計算機処理能
力の向上により、大量の文書データベースから指定した
検索語を含む文書を検索する文書検索装置が用いられる
ようになってきている。このような検索装置において、
従来は各文書にキーワードを与えておき、検索する際に
そのキーワードを用いる形態が一般的であった。最近で
は、さらに検索の際の柔軟性を向上させるために、あら
かじめキーワードをあたえず、自由なキーワードを指定
できるようにしたフルテキストサーチの方式が用いられ
るようになってきている。この方式においてユーザがキ
ーワードの指定のしかたを制御する方法が考えられてい
た。例えば特開平5−28199号公報記載の技術で
は、操作者の指定した検索語から関連語辞書を用いて操
作者の指定した展開条件に従って類義語・上位語・下位
語などの関連語に展開する。展開した関連語の数があら
かじめ設定された制限値よりも多いときには、もっと意
味の狭い語を検索語として指定するように操作者に指示
したり、あるいは展開条件を変更する。操作者は指示に
応じて、先に与えた検索語よりも意味が狭くしかも必要
な文書を探し出すのに適切な検索語を検討して、再度検
索語の指定を行う。あるいは展開条件の変更の場合に
は、例えば初期の展開条件として「類義語、距離1の上
位語、距離1の下位語」が設定されていたとして、これ
を「類義語のみ」という条件に狭める変更をする。そし
て、このような検索語の再度の指定や展開条件の変更に
よる関連語の展開のやりなおしを行うことにより関連語
を絞り込み、余分な検索結果が生じるのを防いでいた。
また、上記従来技術において、関連語として不要なもの
を排除するために、関連語辞書による展開結果の関連語
を操作者に提示し、提示された関連語から必要なものの
みを操作者に選択させることにより、余分な検索結果が
生じないようにすることも示されている。
2. Description of the Related Art Due to the spread of document databases and the improvement of computer processing capability, a document retrieval apparatus for retrieving a document containing a designated retrieval word from a large number of document databases has come to be used. In such a search device,
Conventionally, it has been a general practice to give a keyword to each document and use the keyword when searching. Recently, in order to further improve the flexibility in searching, a full-text search method has been used in which a keyword is not given in advance and a free keyword can be designated. In this method, a method has been considered in which a user controls how to specify a keyword. For example, in the technique described in Japanese Patent Laid-Open No. 5-28199, a search word specified by an operator is expanded into related words such as synonyms, high-order words, and low-order words according to expansion conditions specified by the operator using a related word dictionary. When the number of expanded related words is larger than a preset limit value, the operator is instructed to specify a word having a narrower meaning as a search word, or the expansion condition is changed. In response to the instruction, the operator considers a search word that is narrower in meaning than the previously given search word and is suitable for finding a necessary document, and specifies the search word again. Alternatively, in the case of changing the expansion condition, for example, assuming that "synonyms, high-rank words of distance 1 and low-rank words of distance 1" are set as the initial expansion conditions, the change is narrowed to "only synonyms". To do. Then, the related words are narrowed down by re-designating the search words and expanding the related words by changing the expansion conditions, thereby preventing the occurrence of extra search results.
Further, in the above-mentioned conventional technique, in order to eliminate unnecessary words as related words, the related words of the expansion result by the related word dictionary are presented to the operator, and only the necessary related words are selected for the operator from the presented related words. It is also shown that by doing so, extra search results are not generated.

【0003】[0003]

【発明が解決しようとする課題】しかし、上記従来の技
術のように、関連語の数や範囲を制限して、検索語の再
指定や展開条件の変更による関連語の展開のやりなおし
をすると、必要な関連語までが制限によって削除され検
索漏れが生じるという欠点があり、また、再度検索語を
指定するというのも煩わしさを生じるという欠点があっ
た。また、上記従来技術による関連語の絞り込みは、展
開された関連語が適切なものか否かの評価に基づいて行
われている訳ではないので、検索に必要のない語まで関
連語として展開してしまうことがあり、検索処理そのも
のに無駄が生じるいわゆる検索ノイズが多くなったりも
していた。なお、この欠点は、関連語辞書による展開結
果の関連語を操作者に提示し、提示された関連語から必
要なもののみを操作者に選択させるようにした場合に
は、解消することが可能であるが、提示された関連語に
不要な関連語が多くなるため、操作者の選択操作の負担
は大きい。本発明は、これらの従来技術の欠点を除去す
ることを目的とする。即ち、本発明は、適切な関連語を
無駄なく素早く探し出すことができ、検索漏れや検索ノ
イズの発生を防止することのできる文書検索装置を提供
することを目的とする。また、本発明は、適切な関連語
を操作者が選択する場合の選択操作の負担を小さくする
ことのできる文書検索装置を提供することを目的とす
る。
However, if the number and range of related words are limited and the related words are expanded again by respecifying the search words or changing the expansion conditions, as in the above-mentioned conventional technique, There is a drawback that even necessary related words are deleted due to the restriction and a search omission occurs, and it is troublesome to specify the search word again. Further, the related words are not narrowed down by the above-mentioned conventional technique based on the evaluation of whether or not the expanded related words are appropriate, so that even words not necessary for the search are expanded as related words. In some cases, so-called search noise, which is wasteful in the search process itself, is increased. It should be noted that this drawback can be solved by presenting the related word of the expansion result by the related word dictionary to the operator and allowing the operator to select only the necessary related word from the presented related words. However, since the number of unnecessary related words increases in the presented related words, the operator's selection operation is heavy. The present invention aims to eliminate these drawbacks of the prior art. That is, an object of the present invention is to provide a document search device capable of quickly searching for an appropriate related word without waste, and preventing omission of search or occurrence of search noise. It is another object of the present invention to provide a document search device that can reduce the burden of the selection operation when the operator selects an appropriate related word.

【0004】[0004]

【課題を解決するための手段】第1の発明は、検索すべ
き語を入力する検索語入力手段(101、501)と、
関連語情報を記憶する第1の記憶手段(104、50
4)と、検索対象文書の検索に関する情報を記憶する第
2の記憶手段と(109、509、513)、前記検索
語入力手段により入力された検索語に関して、第1の記
憶手段に記憶された関連語情報に基づいて関連語の候補
を求める関連語展開手段(103、503)と、前記関
連語展開手段によって得られた関連語の候補について第
2の記憶手段に記憶された前記検索に関する情報により
関連性を評価し、その評価に基づいて検索に用いる関連
語の選別を行う評価選別手段(105、505)と、を
備えたことを特徴とする文書検索装置である。
A first aspect of the invention is to provide a search word input means (101, 501) for inputting a word to be searched,
First storage means (104, 50) for storing related word information
4), second storage means (109, 509, 513) for storing information related to the search of the document to be searched, and the search word input by the search word input means is stored in the first storage means. Related word expanding means (103, 503) for obtaining related word candidates based on related word information, and information related to the search stored in the second storage means for the related word candidates obtained by the related word expanding means. The document search device is characterized by further comprising: an evaluation selection unit (105, 505) that evaluates the relevance according to, and selects related words to be used for a search based on the evaluation.

【0005】第2の発明は、第1の発明において、前記
評価選別手段による評価選別された関連語を操作者に提
示する手段(107、507)と、提示された関連語か
ら所望の関連語を選択する選択入力を操作者から受け付
ける選択入力手段(108、508)と、選択入力手段
による選択入力に基づいて、関連語を決定する関連語選
択手段(106、506)と、前記決定された検索に用
いる関連語に基づいて検索対象文書を検索する検索手段
(110、510)とを備えたものである。
In a second aspect based on the first aspect, a means (107, 507) for presenting to the operator the related words evaluated and selected by the evaluation and selection means, and a desired related word from the presented related words. Selection input means (108, 508) for receiving a selection input for selecting from the operator, and related word selection means (106, 506) for determining a related word based on the selection input by the selection input means; A search means (110, 510) for searching a document to be searched based on a related word used for the search is provided.

【0006】また、第3の発明は、第1の発明の文書検
索装置において、次のような構成に特徴を有するもので
ある。第1の記憶手段は、検索対象を記憶する文書記憶
手段(112、512)と、検索対象文書から抽出され
た語について語の表記とその語を含む文書を特定するた
めの情報を対応させて記憶したインデックス記憶手段
(109、509)とを含む。前記評価選別手段は、前
記関連語展開手段により展開された関連語が前記インデ
ックス記憶手段に記憶された語であるか評価し、前記イ
ンデックス記憶手段に記憶された語であると評価された
前記関連語の候補のみを残す選別を行う。前記提示する
手段は、前記評価手段により評価選別された前記関連語
の候補を提示する。前記検索手段は、前記検索に用いる
関連語と表記の一致する語を前記インデックス記憶手段
を検索して特定し、その特定された語の表記に対応する
文書を特定するための情報に基づき検索対象文書を特定
する。
The third invention is characterized by the following configuration in the document retrieval apparatus of the first invention. The first storage unit associates the document storage unit (112, 512) that stores the search target with the notation of the word extracted from the search target document and the information for specifying the document including the word. And stored index storage means (109, 509). The evaluation selection unit evaluates whether or not the related word expanded by the related word expansion unit is a word stored in the index storage unit, and the relation evaluated to be a word stored in the index storage unit. Select only the word candidates. The presenting means presents the related word candidates evaluated and selected by the evaluation means. The search means searches the index storage means to identify a word whose expression matches the related word used in the search, and a search target based on information for identifying a document corresponding to the expression of the identified word. Identify the document.

【0007】また、第4の発明は、第2の発明の文書検
索装置において、次のような構成を有することを特徴と
するものである。前記インデックス記憶手段に記憶され
た語が検索された回数を求める手段をさらに備えてい
る。前記第1の記憶手段は、語の表記に対応させてその
語が検索された回数を関連語評価値情報として記憶する
評価値情報記憶手段(513)を含む。前記提示する手
段は前記評価選別手段により評価選別された前記関連語
の候補を前記関連語評価値情報とともに提示する。
A fourth invention is characterized in that the document retrieval apparatus of the second invention has the following configuration. The index storage unit further includes a unit for obtaining the number of times the word stored in the index storage unit is searched. The first storage unit includes an evaluation value information storage unit (513) that stores the number of times the word is searched in association with the word notation as the related word evaluation value information. The presenting means presents the related word candidates selected and evaluated by the evaluation selecting means together with the related word evaluation value information.

【0008】[0008]

【作用】第1の記憶手段には、関連語情報を記憶させて
おき、第2の記憶手段には、検索対象文書の検索に関す
る情報を記憶させておく。この検索に関する情報は、検
索対象文書に関わりがあり、それを用いたり、参照する
ことにより、検索に役立てることのできる情報であり、
例えば、検索対象文書に対して作成された検索用のイン
デックスや、過去の検索において検索語またはその関連
語として使用された傾向を表す検索履歴情報などを用い
ることができる。関連語展開手段は、第1の記憶手段に
記憶された情報を参照して、検索語入力手段により入力
された検索語に関する関連語の候補を求める。
The related word information is stored in the first storage means, and the information relating to the search of the document to be searched is stored in the second storage means. The information related to this search is related to the document to be searched and can be used for the search by using or referring to it.
For example, a search index created for a search target document, search history information indicating a tendency of being used as a search word or a related word in a past search, and the like can be used. The related word expansion means refers to the information stored in the first storage means and obtains related word candidates related to the search word input by the search word input means.

【0009】評価選別手段は、関連語展開手段によって
得られた前記候補の語を、第2の記憶手段に記憶された
検索に関する情報に基づいて評価し、その評価に基づい
て前記候補の語から評価の高いものの選別を自動的に行
う。その評価は、具体的には例えば、関連語展開手段に
よって得られた候補の語がインデックスの情報中に存在
するか否かを調べることによって行ったり、検索履歴情
報、即ち検索語やその関連語が検索のために以前に用い
られたか否かあるいはその回数などを調べることによっ
て行う。このように、評価選別手段は、検索対象の文書
の検索に関する情報に基づいて関連性を評価して、その
評価に基づき前記候補の語から評価の高いものを自動的
に選別するようにしたので、検索対象の文書に関連して
いるような適切である可能性の高い関連語は残され、そ
うではない関連語が排除される。因みに、前記従来技術
では展開された関連語の数が多すぎるか否かだけを評価
し、多すぎるときにはそのことを操作者に伝えるのみで
あって、本発明のように関連語としての有用性の評価に
よる自動選別はできない。
The evaluation selection means evaluates the candidate words obtained by the related word expansion means based on the information regarding the search stored in the second storage means, and based on the evaluation, selects from the candidate words. Automatically sort high-rated items. Specifically, the evaluation is performed, for example, by checking whether or not the candidate word obtained by the related word expanding means exists in the information of the index, or the search history information, that is, the search word or its related word. This is done by checking whether or not was previously used for the search, or the number of times. In this way, the evaluation selection means is configured to evaluate the relevance based on the information related to the search of the document to be searched and automatically select the highly evaluated words from the candidate words based on the evaluation. , Relevant words that are highly likely to be relevant to the document to be searched are retained, and related words that are not appropriate are excluded. Incidentally, in the above-mentioned conventional technique, it is only evaluated whether or not the number of expanded related words is too large, and when the number is too large, only the fact is notified to the operator, and it is useful as a related word like the present invention. It is not possible to perform automatic selection based on evaluation.

【0010】また、第2の発明においては、前記評価選
別手段による評価選別結果が前記提示手段により操作者
に提示され、操作者はその提示された評価結果から選択
入力手段により所望の関連語を選択指示する。関連語選
択手段は、その指示に応じて検索に用いる関連語を決定
する。前記評価選別手段による自動的な関連性の評価と
ともに、操作者による評価選択がさらに加わるので、一
層適切な関連語が得られる。また、操作者に提示される
関連語は、前述のように適切なものが選別されているも
のであるので、操作者に無駄な選択肢を提示せずに済
み、提示する語の数を減らすことができ、選択を容易に
することができる。
Further, in the second invention, the evaluation selection result by the evaluation selection means is presented to the operator by the presentation means, and the operator selects a desired related word from the presented evaluation result by the selection input means. Select and instruct. The related word selection means determines a related word to be used for the search according to the instruction. Along with the automatic evaluation of the relevance by the evaluation selection means, the evaluation selection by the operator is further added, so that more appropriate related words can be obtained. In addition, the related words presented to the operator are those selected appropriately as described above, so it is not necessary to present the operator with useless options, and the number of presented words should be reduced. It is possible to facilitate the selection.

【0011】第3の発明は、関連語の評価をインデック
スを用いて行うようにしたものである。即ち、インデッ
クス記憶手段には、文書記憶手段に記憶された検索対象
文書から抽出された語について語の表記とその語を含む
文書を特定するための情報を対応させたインデックスを
記憶させておく。評価選別手段は、関連語展開手段によ
り展開された関連語がインデックス記憶手段に記憶され
た語であるか評価し、その評価により検索に用いる関連
語の候補を選別する。インデックスは検索対象の文書群
のそれぞれの文書から抽出した語(キーワード)を保持
したものであり、検索手段は、いわゆるインデックス検
索の場合、インデックスを参照してキーワードに対応す
る文書を特定する。従って、インデックスに含まれない
語は、それで検索しても対応する文書は特定できず、検
索にあたっての関連語としては役に立たないので、この
ようなインデックスに含まれない語を排除し、インデッ
クスに含まれる語だけを残すことにより、有用な関連語
を残す選別を自動的に行うことができる。提示する手段
は、上記のように評価選別手段により評価選別された前
記関連語の候補のみを操作者に提示する。提示する関連
語の候補には、評価選別手段の評価選別により、検索し
ても結果の得られない語は排除されているので、操作者
に無駄な選択肢を提示せずに済み、候補として表示する
語の数を減らすことができ、操作者は検索に用いる語の
選択を容易に行うことができる。検索手段は、前記検索
に用いる関連語と表記の一致する語を前記インデックス
記憶手段を検索して特定し、その特定された語の表記に
対応する文書を特定するための情報に基づき検索対象文
書を特定する。
A third aspect of the invention is to evaluate the related word by using an index. That is, the index storage means stores an index that associates the word notation with the word extracted from the search target document stored in the document storage means and the information for specifying the document including the word. The evaluation selection means evaluates whether the related word expanded by the related word expansion means is a word stored in the index storage means, and selects a related word candidate to be used for the search based on the evaluation. The index holds words (keywords) extracted from each document in the document group to be searched, and in the case of so-called index search, the search means refers to the index to identify the document corresponding to the keyword. Therefore, words that are not included in the index cannot be identified even if they are searched, and they are not useful as related words for searching.Thus, words that are not included in the index are excluded and included in the index. By leaving only the words that are used, it is possible to automatically perform selection so as to leave useful related words. The presenting means presents only the related word candidates evaluated and selected by the evaluation selecting means as described above to the operator. For the related word candidates to be presented, the words for which no results are obtained by the search are excluded by the evaluation selection of the evaluation selection means, so it is not necessary to present the operator with useless choices and displayed as candidates. The number of words to be used can be reduced, and the operator can easily select the word to be used for the search. The search means searches the index storage means to identify a word whose expression matches the related word used in the search, and a search target document based on information for identifying a document corresponding to the expression of the identified word. Specify.

【0012】第4の発明は、第3の発明において、提示
する手段により操作者に関連語の候補を提示する際に、
操作者に選択の参考となる関連語評価値情報として、提
示する各候補について検索に用いられた履歴をも併せて
提示するようにした。その履歴はインデックスに記憶さ
れた語が検索された回数を求めて、評価値情報記憶手段
に保持する。評価選別手段は、インデックスの参照によ
る関連語として適したものを評価選別するほかに、評価
値情報記憶手段を参照して、関連語の候補が検索に用い
られた回数をも評価する。提示する手段は、評価選別手
段から関連語の候補と、それらの各候補が検索に用いら
れた回数とを受け取り、両者を関係づけて操作者に提示
する。提示された評価値情報は対応する関連語の候補が
検索語として用いられる傾向を反映しており、操作者が
候補の中から関連語を選択するための参考情報として有
用であるので、操作者は検索に用いる語の選択を一層容
易に行うことができる。
In a fourth aspect based on the third aspect, when presenting the related word candidates to the operator by the presenting means,
The history used in the search for each candidate to be presented is also presented to the operator as related word evaluation value information that serves as a reference for selection. The history is stored in the evaluation value information storage means by calculating the number of times the word stored in the index is searched. The evaluation selection means evaluates and selects a suitable one as a related word by referring to the index, and also refers to the evaluation value information storage means to evaluate the number of times the related word candidate is used for the search. The presenting means receives the related word candidates and the number of times each of these candidates has been used for the search from the evaluation selecting means, and presents them to the operator in association with each other. The provided evaluation value information reflects the tendency that the corresponding related word candidates are used as search words, and is useful as reference information for the operator to select a related word from the candidates. Can more easily select the word used for the search.

【0013】[0013]

【実施例】以下、図面を参照して本発明の実施例を詳細
に説明する。
Embodiments of the present invention will be described below in detail with reference to the drawings.

【0014】(実施例1)図1は、本発明の実施例1に
係る文書検索装置の構成を示すブロック図である。この
文書検索装置は、検索する語を入力する検索語入力部1
01、検索語入力部101から入力された検索語を保持
する検索語一時記憶部102、検索語一時記憶部102
に保持された検索語から類義語・上位語・下位語などの
関連語の候補を求める関連語展開部103、関連語展開
部103で関連語の展開に用いる関連語辞書を記憶する
関連語辞書記憶部104、関連語展開部103により得
られた関連語の候補に対してインデックス記憶部109
をもとに評価を行う関連語評価選別部105、関連語の
選択を行う関連語選択部106、関連語の選択の際に表
示を行うための関連語表示部107、関連語の選択の際
にユーザが入力を行うための選択入力部108、文書記
憶部112に記憶されている文書のインデックスを蓄え
ているインデックス記憶部109、検索語一時記憶部1
02に保持された検索語をインデックス記憶部109を
つかって文書記憶部112から検索する検索処理部11
0、検索処理部110で検索した結果を保持するための
検索結果一時記憶部111、複数の文書を蓄えている文
書記憶部112からなっている。
(Embodiment 1) FIG. 1 is a block diagram showing the configuration of a document retrieval apparatus according to Embodiment 1 of the present invention. This document search device includes a search word input unit 1 for inputting a search word.
01, search word temporary storage unit 102 for holding the search word input from the search word input unit 101, search word temporary storage unit 102
Related word expansion unit 103 for finding candidates for related words such as synonyms, broader terms, and lower terms from the search word held in the related word dictionary storage unit that stores the related word dictionary used for the related word expansion in the related word expansion unit 103 The index storage unit 109 for the related word candidates obtained by the unit 104 and the related word expansion unit 103.
Related word evaluation selection section 105 for performing evaluation based on the related word, related word selection section 106 for selecting related words, related word display section 107 for displaying when selecting related words, and related word selection A selection input unit 108 for the user to input, an index storage unit 109 that stores the index of the document stored in the document storage unit 112, and a search term temporary storage unit 1
Search processing section 11 that searches the document storage section 112 for the search term held in 02 using the index storage section 109.
0, a search result temporary storage unit 111 for holding the search result by the search processing unit 110, and a document storage unit 112 that stores a plurality of documents.

【0015】図2は、図1に示した文書検索装置におけ
る動作の処理手順を示すフローチャートである。本図を
参照しながら実施例1の動作を説明する。まず、ステッ
プS21では検索語入力部101で検索語の入力を行
う。入力された検索語は検索語一時記憶部102に保持
する。次にステップS22に移り、関連語展開部103
において関連語への展開を行う。ここで展開された関連
語は検索に用いる関連語の候補である。次にステップS
3に移り、ここでは関連語展開部103において展開さ
れた関連語の候補について関連語評価選別部105がイ
ンデックス記憶部109に記憶されているインデックス
を用いて関連語を評価する。その評価は、例えば、イン
デックス記憶部109を検索し、関連語展開部103で
展開された各語がインデックス記憶部109内に存在す
るか否かを判定することによって行うことができる。即
ち、インデックス記憶部109内に存在しない関連語は
検索対象とする文書記憶部112のデータベースとは関
連のないものとして関連語から省く。そして、そのよう
にインデックスを用いた評価により得られた結果を検索
語一時記憶部102に保持する。次にステップS24に
おいて、ステップS23で求められた関連語の一覧の結
果を関連語表示部107に表示する。続いてステップS
25でユーザが関連語の選択を行う。選択の入力は選択
入力部108で行うが、これは例えば表示されている関
連語をポインティングデバイスなどで指示することによ
って行うようにすればよい。選択の終了は、終了を指示
する入力によって示す。ステップS26ではユーザから
のこうした入力があったかどうかを調べる。ステップS
25、S26は入力があるまで繰り返す。入力があった
場合は、ステップS27において、選択された関連語お
よび元の検索語を検索語一時記憶部102に保持する。
次にステップS28に進み、検索処理部110におい
て、検索語一時記憶部102に保持された検索語をイン
デックス記憶部109をもとにして文書記憶部112か
ら検索する検索処理を行い検索した結果を検索結果一時
部111に保持する。
FIG. 2 is a flow chart showing a processing procedure of an operation in the document retrieval apparatus shown in FIG. The operation of the first embodiment will be described with reference to this figure. First, in step S21, the search word input unit 101 inputs a search word. The input search word is held in the search word temporary storage unit 102. Next, moving to step S22, the related word expansion unit 103
Expand to related words in. The related word expanded here is a candidate of the related word used for a search. Then step S
3, the related word evaluation selection unit 105 evaluates the related word using the index stored in the index storage unit 109 for the related word candidate expanded by the related word expansion unit 103. The evaluation can be performed, for example, by searching the index storage unit 109 and determining whether or not each word expanded by the related word expansion unit 103 exists in the index storage unit 109. That is, related words that do not exist in the index storage unit 109 are excluded from the related words because they are not related to the database of the document storage unit 112 that is the search target. Then, the result obtained by the evaluation using the index is held in the search term temporary storage unit 102. Next, in step S24, the result of the list of related words obtained in step S23 is displayed on the related word display unit 107. Then step S
At 25, the user selects a related word. The selection input is performed by the selection input unit 108, but this may be performed by pointing the displayed related word with a pointing device or the like. The end of the selection is indicated by an input instructing the end. In step S26, it is checked whether there is such an input from the user. Step S
25 and S26 are repeated until there is an input. When there is an input, in step S27, the selected related word and the original search word are held in the search word temporary storage unit 102.
Next, in step S28, the search processing unit 110 performs a search process of searching the search word held in the search word temporary storage unit 102 from the document storage unit 112 based on the index storage unit 109, and displays the search result. It is held in the search result temporary unit 111.

【0016】次に、検索語入力部101において図3
(a)に示す検索語が入力された場合を例にとり、本実
施例のさらなる説明を行う。検索語「検索」を関連語辞
書記憶部104に記憶されている関連語辞書を用いて展
開した結果、図3(b)に示すように関連語として「調
査」「捜査」「探査」「模索」「探索」が得られたとす
る。これが検索語一時記憶部102に保持される。次に
関連語評価選別部105は検索語一時記憶部102に保
持された値をもとにインデックス記憶部109をアクセ
スして実際に文書記憶部112に登録された文書から切
り出された単語であるかどうかをチェックする。
Next, referring to FIG.
The present embodiment will be further described by taking the case where the search word shown in (a) is input as an example. As a result of expanding the search word “search” using the related word dictionary stored in the related word dictionary storage unit 104, as shown in FIG. 3B, “search”, “investigation”, “exploration”, and “searching” are performed as related words. It is assumed that "search" is obtained. This is held in the search term temporary storage unit 102. Next, the related word evaluation selection unit 105 accesses the index storage unit 109 based on the value held in the search word temporary storage unit 102 and is a word cut out from the document actually registered in the document storage unit 112. Check whether or not.

【0017】図4(a)にインデックス記憶部109に
記憶されているインデックスの一例を示す。ここでは実
際に関連語として展開された「模索」はどのファイルに
も切り出されていないため候補としては残らない。ここ
で実際に切り出された単語のみが検索語一時記憶部10
2に再度保持されて、関連語選択部106に送られて、
関連語表示部107に表示される。
FIG. 4A shows an example of indexes stored in the index storage unit 109. Here, the “search” that has actually been expanded as a related word is not extracted as a candidate because it is not extracted in any file. Only the words actually cut out here are the search word temporary storage unit 10
2 is held again and sent to the related word selection unit 106,
It is displayed on the related word display unit 107.

【0018】図4(b)は関連語表示部107に表示さ
れた関連語の例である。実際には文書記憶部112に登
録された文書からインデックスとして切り出されなかっ
た「模索」は検索対象リストの候補から外れ、無駄な選
択をすることはなくなる。ここでユーザはこの中から関
連語を選択する。選択の方法は、例えばポインティング
デバイスで選択したい語を示すことによって行えばよ
い。
FIG. 4B shows an example of related words displayed on the related word display unit 107. Actually, the “search” that is not cut out as an index from the document registered in the document storage unit 112 is removed from the candidates of the search target list, and unnecessary selection is eliminated. Here, the user selects a related word from these. The selection method may be performed, for example, by indicating the word to be selected with a pointing device.

【0019】図4(c)は選択した結果の一例を示して
いる。ここで網掛けになっているのが選択された語であ
る。実際の関連語表示部107では反転表示などによっ
て示される。これらの語が検索語一時記憶部102に保
持され、実際の検索に用いられる。検索の際にはインデ
ックスとして切り出されなかった「模索」は検索対象リ
ストの候補から外れ、さらにユーザが選択しなかった
「探索」「捜査」も検索の候補から外れ、不要な検索結
果が得られずにすむ。
FIG. 4C shows an example of the selected result. The selected words are shaded here. In the actual related word display unit 107, it is shown in reverse video or the like. These words are held in the search word temporary storage unit 102 and used for the actual search. “Search” that was not cut out as an index during the search is excluded from the candidates in the search target list, and “Search” and “Investigation” not selected by the user are also excluded from the search candidates and unnecessary search results are obtained. I don't have to.

【0020】実施例1において、インデックス記憶部1
09に記憶されているインデックスは、検索対象のデー
タベースである文書記憶部112中の文書から抽出した
ものであり、検索処理部はインデックスを参照して語に
対応する文書を特定する。従って、インデックスに含ま
れる語は検索対象文書を特定することができ、それ以外
のインデックスに含まれない語は文書を特定できないの
で、インデックスを用いた評価により候補の語から取捨
選択を自動的に行うようにしたことにより、適切な関連
語が得られ、さらにユーザ選択により候補を絞り込むの
で、検索を効率的に行うことができる。
In the first embodiment, the index storage unit 1
The index stored in 09 is extracted from the document in the document storage unit 112 that is the search target database, and the search processing unit refers to the index to identify the document corresponding to the word. Therefore, the words included in the index can specify the document to be searched, and the other words that are not included in the index cannot specify the document.As a result, evaluation using the index automatically selects and sorts the candidate words. By doing so, an appropriate related word is obtained, and the candidates are narrowed down by user selection, so that the search can be performed efficiently.

【0021】なお、以上に説明した実施例1は次のよう
に一部変更して実施することもできる。 (1) 上記実施例1では、関連語を選択するのにポイ
ンティングデバイスで指示したが、これは関連語につい
ている番号を指定することによって行ってもよい。 (2) 上記実施例1では、検索語として一つの語を用
いた場合について説明したが、複数の語であっても個々
に関連語選択の処理をすれば、本実施例と同様な方法で
対応できる。 (3) 上記実施例1では、検索に用いる関連語を指示
したが、逆に不要な関連語を指示するようにしてもよ
い。この場合は指示されなかった語を選択して検索に用
いることになる。 (4) 上記実施例1では、関連語評価選別部505に
より絞られた関連語の候補をさらにユーザに提示し、選
択させるように構成しているが、このユーザ選択を省略
して、関連語評価選別部505で得られた候補により直
接検索を行うようにしても、従来技術に比べ検索効率を
大きく向上させることができる。
The first embodiment described above can be implemented by partially modifying it as follows. (1) In the first embodiment, the pointing device is used to select the related word, but this may be done by designating the number of the related word. (2) In the first embodiment described above, the case where one word is used as the search word has been described, but even if there are a plurality of words, if the related word selection process is individually performed, the same method as in the present embodiment is used. Can handle. (3) In the first embodiment described above, the related word used for the search is instructed, but conversely, unnecessary related words may be instructed. In this case, the uninstructed word is selected and used for the search. (4) In the first embodiment, the related word candidates narrowed down by the related word evaluation and selection unit 505 are further presented to the user for selection, but this user selection is omitted and the related word is omitted. Even if a direct search is performed using the candidates obtained by the evaluation selection unit 505, the search efficiency can be greatly improved compared to the conventional technique.

【0022】(実施例2)実施例2は、展開された関連
語を検索履歴に基づいて評価するようにした実施例であ
る。図5は、実施例2による文書検索装置の構成を示す
ブロック図である。この文書検索装置は、検索語入力部
501、検索語一時記憶部502、関連語展開部50
3、関連語辞書記憶部504、関連語評価選別部50
5、関連語選択部506、関連語表示部507、選択入
力部508、インデックス記憶部509、検索処理部5
10、検索結果一時記憶部511、および文書記憶部5
12からなる構成とその機能において、実施例1とほぽ
同等のものであるが、本実施例2は実施例1にはない検
索履歴記憶部513を増設した構成のものである。この
検索履歴記憶部513は、ユーザが関連語を選択した履
歴を保持するものである。
(Embodiment 2) Embodiment 2 is an embodiment in which the expanded related words are evaluated based on the search history. FIG. 5 is a block diagram showing the configuration of the document search device according to the second embodiment. This document search device includes a search word input unit 501, a search word temporary storage unit 502, and a related word expansion unit 50.
3, related word dictionary storage unit 504, related word evaluation selection unit 50
5, related word selection unit 506, related word display unit 507, selection input unit 508, index storage unit 509, search processing unit 5
10, search result temporary storage unit 511, and document storage unit 5
The configuration of 12 and its function are almost the same as those of the first embodiment, but the second embodiment has a configuration in which a search history storage unit 513, which is not in the first embodiment, is added. The search history storage unit 513 holds a history of user's selection of related words.

【0023】図6は、図5に示した実施例2の装置にお
ける動作の処理手順を示すフローチャートである。ま
ず、ステップS61では検索語入力部501で検索語の
入力を行う。入力された検索語は検索語一時記憶部50
2に保持する。次にステップS62に移り、関連語展開
部503において関連語の展開を行う。次にステップS
63に移り、ここでは関連語展開部503において展開
された関連語に基づいて関連語評価選別部505がイン
デックス記憶部509に保持されているインデックスを
用いて関連語を評価する。そして、得られた結果を検索
語一時記憶部502に保持する。
FIG. 6 is a flow chart showing the processing procedure of the operation in the apparatus of the second embodiment shown in FIG. First, in step S61, the search word input unit 501 inputs a search word. The input search word is the search word temporary storage unit 50.
Hold at 2. Next, in step S62, the related word expansion unit 503 expands the related words. Then step S
Moving to 63, here, the related word evaluation selection unit 505 evaluates the related word using the index held in the index storage unit 509 based on the related word expanded by the related word expansion unit 503. Then, the obtained result is held in the search term temporary storage unit 502.

【0024】次にステップS64において、ステップS
63で求められた関連語の一覧の結果を関連語表示部5
07に表示する。続いてステップS65でユーザが関連
語の選択を行う。選択の入力は選択入力部508で行う
が、これは例えば表示されている関連語をポインティン
グデバイスなどで指示することによって行えばよい。選
択の終了は、終了を指示する入力によって示す。ステッ
プS66ではユーザからのこうした入力があったかどう
かを調べる。ステップS65およびS66は入力がある
まで繰り返す。入力があった場合は、ステップS67に
おいて、選択された関連語および元の検索語を検索語一
時記憶部502に保持する。
Next, in step S64, step S
The result of the list of related words obtained in 63 is displayed in the related word display unit 5.
It is displayed on 07. Then, in step S65, the user selects a related word. The selection input is performed by the selection input unit 508, which may be performed by pointing the displayed related word with a pointing device or the like. The end of the selection is indicated by an input instructing the end. In step S66, it is checked whether or not there is such an input from the user. Steps S65 and S66 are repeated until there is an input. If there is an input, in step S67, the selected related word and the original search word are held in the search word temporary storage unit 502.

【0025】次にステップS68に進み、検索処理部5
10において、検索語一時記憶部502に保持された検
索語および関連語をインデックス記憶部509をもとに
して文書記憶部512から検索する検索処理を行い、検
索した結果を検索結果一時記憶部511に保持する。な
お、検索結果一時記憶部511には上記検索に用いた検
索語とその関連語をも保持させる。
Next, in step S68, the retrieval processing unit 5
10, a search process for searching the document storage unit 512 for the search word and the related word held in the search word temporary storage unit 502 based on the index storage unit 509 is performed, and the search result is temporarily stored in the search result temporary storage unit 511. Hold on. The search result temporary storage unit 511 also holds the search word used in the above search and its related words.

【0026】次にステップS69に進み、検索結果一時
記憶部511に保持された検索結果に基づいて、検索履
歴記憶部513に格納されている検索履歴を更新する。
図7(a)は、検索履歴記憶部513に記憶された検索
履歴の例を示す図である。同図は関連語とその参照回数
を表している。図7(a)において「検索」「調査」が
関連語として選択されたと仮定すると、検索履歴記憶部
513は図7(b)に示すようにそれらの語の参照回数
をインクリメントする更新がなされる。これらは次回の
関連語展開時に展開評価選別部505に参照され、図8
(a)のようにその展開履歴をもとに表示される。この
実施例を図4(a)のインデックスを参照して取捨選択
した場合の関連語表示部の表示の一例を図8(b)に示
す。これはインデックスに切り出されたものを過去に参
照された回数の多い順番で検索候補の表示をしている。
Next, in step S69, the search history stored in the search history storage unit 513 is updated based on the search results held in the search result temporary storage unit 511.
FIG. 7A is a diagram showing an example of the search history stored in the search history storage unit 513. This figure shows related words and the number of times they are referenced. Assuming that “search” and “survey” are selected as related words in FIG. 7A, the search history storage unit 513 is updated to increment the reference count of those words as shown in FIG. 7B. . These are referred to by the expansion evaluation selection unit 505 at the next expansion of the related words,
It is displayed based on the development history as in (a). FIG. 8B shows an example of the display of the related word display section when this embodiment is selected by referring to the index of FIG. 4A. This displays the search candidates in the order of the number of times that the index is cut out is referred to in the past.

【0027】本実施例2において、履歴情報は、実際の
過去の検索においてどの程度に用いられたものであるか
を表すものであるので、それを参照して関連語候補を評
価し選択することは、検索の傾向を反映して関連語の決
定がなされることになる。従って、本実施例2によれ
ば、履歴情報に基づいて関連性を評価して、適切な関連
語を素早く決定できる。
In the second embodiment, since the history information indicates how much the history information has been used in the actual past search, the related word candidates should be evaluated and selected with reference to the history information. Will determine the related terms by reflecting the search tendency. Therefore, according to the second embodiment, the relevance can be evaluated based on the history information, and an appropriate related word can be quickly determined.

【0028】なお、以上に説明した実施例1は次のよう
に一部変更して実施することもできる。 (1) 上記実施例2では、検索語として一つの語を用
いたが、複数の語であっても個々に関連語展開の処理を
すれば、本発明実施例と同様な方法で対応できる。 (2) 上記実施例2では、ファイル内での関連語の出
現回数の順で候補を提示したが、使用頻度の順で提示し
ても同様の効果を得ることができる。 (3) 上記実施例2では、検索履歴を検索履歴記憶部
513が保持したが、関連語辞書に保持させても同様の
効果を得ることができる。 (4) 上記実施例2では、検索結果に含まれる関連語
に基づいて検索履歴記憶部の更新を行ったが、検索対象
として選択入力部により入力された関連語あるいは検索
語一時記憶部に記憶されている選択された関連語に基づ
いて検索履歴保持部の更新を行っても同様の効果を得る
ことができる。
The first embodiment described above can be implemented by partially modifying it as follows. (1) In the second embodiment, one word is used as a search word, but a plurality of words can be dealt with in the same manner as the embodiment of the present invention by individually processing the related word expansion. (2) Although the candidates are presented in the order of the number of appearances of the related words in the file in the second embodiment, the same effect can be obtained by presenting the candidates in the order of frequency of use. (3) In the second embodiment, the search history is stored in the search history storage unit 513, but the same effect can be obtained by storing the search history in the related word dictionary. (4) In the second embodiment, the search history storage unit is updated based on the related words included in the search result. However, the related words input by the selection input unit as the search target or the search word temporary storage unit stores the related words. The same effect can be obtained even if the search history holding unit is updated based on the selected related word.

【0029】[0029]

【発明の効果】第1ないし第4の発明によれば、検索対
象の文書の検索に関する情報に基づいて関連性を評価し
て、候補の語から取捨選択をし、関連語を決定するよう
にしたので、検索対象の文書に関連している適切な関連
語が自動的に得られ、これにより効率的な検索を行うこ
とができる。
According to the first to fourth aspects of the invention, the relevance is evaluated based on the information related to the search of the document to be searched, and the related words are selected and the related words are determined. As a result, an appropriate related word related to the document to be searched is automatically obtained, which enables efficient search.

【0030】また、第2ないし第4の発明によれば、前
記評価選別手段による評価選別結果が前記提示手段によ
り操作者に提示され、その提示された評価選別結果から
操作者が選択入力手段により所望の関連語を選択入力し
て、関連語選択手段により関連語が決定されるようにし
たので、自動的な評価選別のみでなく、操作者による評
価選別が加わるので、一層適切な関連語が得られる。ま
た、提示される関連語の候補は検索に関する情報により
評価選別されたものであるので、操作者に無駄な選択肢
を提示せずに済み、選択の負担を小さくすることができ
る。
According to the second to fourth inventions, the evaluation selection result by the evaluation selection means is presented to the operator by the presenting means, and the operator selects from the presented evaluation selection result by the selection input means. Since a desired related word is selected and input and the related word is determined by the related word selecting means, not only the automatic evaluation selection but also the evaluation selection by the operator is added. can get. In addition, since the related word candidates to be presented are evaluated and selected based on the information regarding the search, it is not necessary to present the operator with useless options, and the burden of selection can be reduced.

【0031】第3ないし第4の発明は、関連語の評価選
別にインデックス情報を利用する。インデックス検索の
場合、インデックスに含まれない語で検索しても対応す
る文書は特定できないので、このようなインデックスに
含まれない語を排除することにより、有用な関連語が残
り、効率的な検索を行うことができる。また、このよう
に選別された有用な関連語の候補が提示手段により提示
されるので、操作者に無駄な選択肢を提示せずに済み、
候補として表示する語の数を減らすことができ、選択が
容易になる。
The third to fourth inventions utilize the index information for the evaluation selection of the related words. In the case of index search, even if you search with words that are not included in the index, the corresponding document cannot be identified. Therefore, by eliminating words that are not included in the index, useful related words remain and efficient search is performed. It can be performed. In addition, since useful related word candidates selected in this way are presented by the presenting means, it is not necessary to present the operator with useless options,
The number of words displayed as candidates can be reduced and selection becomes easier.

【0032】第4の発明によれば、提示手段による関連
語の候補の提示を行う際に、提示される語の関連語評価
値情報を併せて表示するので、操作者はその関連語評価
値情報を参照して選択を行うことができ、より確かな選
択を容易に行うことができる。
According to the fourth aspect, when the candidate of the related word is presented by the presenting means, the related word evaluation value information of the presented word is also displayed, so that the operator has the related word evaluation value. The selection can be made by referring to the information, and a more reliable selection can be easily made.

【図面の簡単な説明】[Brief description of drawings]

【図1】 本発明の実施例1の構成を示すブロック図で
ある。
FIG. 1 is a block diagram showing a configuration of a first embodiment of the present invention.

【図2】 本発明の実施例1の動作を示すフローチャー
トである。
FIG. 2 is a flowchart showing the operation of the first embodiment of the present invention.

【図3】 (a)は実施例1を説明するための検索語の
入力の例を示す図、(b)は検索語の関連語の一覧を示
す図である。
FIG. 3A is a diagram showing an example of inputting a search word for explaining the first embodiment, and FIG. 3B is a diagram showing a list of related words of the search word.

【図4】 図4(a)は本発明の実施例1を説明するた
めのインデックスの状態を示す図、(b)および(c)
は実施例1を説明するための表示装置に表示された一例
を示す図である。
FIG. 4 (a) is a diagram showing a state of an index for explaining the first embodiment of the present invention, (b) and (c).
FIG. 3 is a diagram showing an example displayed on a display device for explaining the first embodiment.

【図5】 本発明の実施例2の構成を示すブロック図で
ある。
FIG. 5 is a block diagram showing a configuration of a second exemplary embodiment of the present invention.

【図6】 図2は本発明の実施例2にかかるフローチャ
ートである。
FIG. 2 is a flowchart according to the second embodiment of the present invention.

【図7】 (a)および(b)は本発明の実施例2を説
明するための検索履歴記憶部の一例を示す図である。
7A and 7B are diagrams showing an example of a search history storage unit for explaining the second embodiment of the present invention.

【図8】 (a) は本発明の実施例2を説明するため
の検索語の関連語の一覧を示す、(b)本発明の実施例
2を実施例1に適用した一例を示した検索語の関連語の
一覧を示す図である。
FIG. 8A is a list of related terms of a search word for explaining the second embodiment of the present invention, and FIG. 8B is a search showing an example in which the second embodiment of the present invention is applied to the first embodiment. It is a figure which shows the list of the related word of a word.

【符号の説明】[Explanation of symbols]

101,501…検索語入力部、102,502…検索
語一時記憶部、103,503…関連語展開部、10
4,504…関連語辞書記憶部、105,505…関連
語評価選別部、106,506…関連語選択部、10
7,507…関連語表示部、108,508…選択入力
部、109,509…インデックス記憶部、110,5
10…検索処理部、111,511…検索結果一時記憶
部、112,512…文書記憶部、513…検索履歴記
憶部。
101, 501 ... Search word input unit, 102, 502 ... Search word temporary storage unit, 103, 503 ... Related word expansion unit, 10
4, 504 ... Related word dictionary storage unit, 105, 505 ... Related word evaluation selection unit, 106, 506 ... Related word selection unit, 10
7, 507 ... Related word display section, 108, 508 ... Selection input section, 109, 509 ... Index storage section, 110, 5
10 ... Search processing unit, 111, 511 ... Temporary search result storage unit, 112, 512 ... Document storage unit, 513 ... Search history storage unit.

───────────────────────────────────────────────────── フロントページの続き (72)発明者 山下 明男 神奈川県川崎市高津区坂戸3丁目2番1号 KSP R&Dビジネスパークビル 富 士ゼロックス株式会社内 (72)発明者 喜多 辰臣 神奈川県川崎市高津区坂戸3丁目2番1号 KSP R&Dビジネスパークビル 富 士ゼロックス株式会社内 (72)発明者 松尾 裕子 神奈川県川崎市高津区坂戸3丁目2番1号 KSP R&Dビジネスパークビル 富 士ゼロックス株式会社内 (72)発明者 川本 真司 神奈川県川崎市高津区坂戸3丁目2番1号 KSP R&Dビジネスパークビル 富 士ゼロックス株式会社内 (72)発明者 山口 浩 神奈川県川崎市高津区坂戸3丁目2番1号 KSP R&Dビジネスパークビル 富 士ゼロックス株式会社内 ─────────────────────────────────────────────────── ─── Continuation of the front page (72) Inventor Akio Yamashita 3-2-1 Sakado, Takatsu-ku, Kawasaki City, Kanagawa Prefecture KSP R & D Business Park Building Fuji Xerox Co., Ltd. (72) Inventor Tatsuomi Kita Takatsu, Kawasaki City, Kanagawa Prefecture 3-2-1, Sakado, Kuku R & D Business Park Building, Fuji Xerox Co., Ltd. (72) Yuko Matsuo 3-2-1, Sakado, Takatsu-ku, Kawasaki City, Kanagawa KSP R & D Business Park Building, Fuji Xerox Co., Ltd. (72) ) Inventor Shinji Kawamoto 3-2-1 Sakado, Takatsu-ku, Kanagawa Prefecture KSP R & D Business Park Building Fuji Xerox Co., Ltd. (72) Inventor Hiroshi Yamaguchi 3-2-1 Sakado, Takatsu-ku, Kawasaki City, Kanagawa Prefecture KSP R & D Business park Le Fuji Xerox Co., Ltd. in

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】 検索すべき語を入力する検索語入力手段
と、 関連語情報を記憶する第1の記憶手段と、 検索対象文書の検索に関する情報を記憶する第2の記憶
手段と、 前記検索語入力手段により入力された検索語に関して、
第1の記憶手段に記憶された関連語情報に基づいて関連
語の候補を求める関連語展開手段と、 前記関連語展開手段によって得られた関連語の候補につ
いて第2の記憶手段に記憶された前記検索に関する情報
により関連性を評価し、その評価に基づいて検索に用い
る関連語の選別を行う評価選別手段と、を備えたことを
特徴とする文書検索装置。
1. A search word input means for inputting a word to be searched, a first storage means for storing related word information, a second storage means for storing information on a search for a document to be searched, and the search. Regarding the search word entered by the word input means,
Related word expansion means for obtaining related word candidates based on related word information stored in the first storage means, and related word candidates obtained by the related word expansion means are stored in the second storage means. A document search device, comprising: an evaluation selection unit that evaluates relevance based on the information about the search and selects related words to be used for the search based on the evaluation.
【請求項2】 前記評価選別手段による評価選別された
関連語を操作者に提示する手段と、 提示された関連語から所望の関連語を選択する選択入力
を操作者から受け付ける選択入力手段と、 選択入力手段による選択入力に基づいて、関連語を決定
する関連語選択手段と、 前記決定された検索に用いる関連語に基づいて検索対象
文書を検索する検索手段とを備えたことを特徴とする請
求項1記載の文書検索装置。
2. A means for presenting to the operator the related words evaluated and selected by the evaluation and selection means, and a selection input means for receiving from the operator a selection input for selecting a desired related word from the presented related words. A related word selecting means for determining a related word based on a selection input by the selection input means; and a searching means for searching a search target document based on the determined related word used for the search. The document search device according to claim 1.
【請求項3】 前記第1の記憶手段は、検索対象を記憶
する文書記憶手段と、検索対象文書から抽出された語に
ついて語の表記とその語を含む文書を特定するための情
報を対応させて記憶したインデックス記憶手段とを含
み、 前記評価選別手段は、前記関連語展開手段により展開さ
れた関連語が前記インデックス記憶手段に記憶された語
であるか評価し、前記インデックス記憶手段に記憶され
た語であると評価された前記関連語の候補のみを残す選
別を行い、 前記提示する手段は、前記評価手段により評価選別され
た前記関連語の候補を提示し、 前記検索手段は、前記検索に用いる関連語と表記の一致
する語を前記インデックス記憶手段を検索して特定し、
その特定された語の表記に対応する文書を特定するため
の情報に基づき検索対象文書を特定することを特徴とす
る請求項2記載の文書検索装置。
3. The first storage means associates a document storage means for storing a search target with a word notation of a word extracted from the search target document and information for specifying a document including the word. The evaluation selection means evaluates whether or not the related word expanded by the related word expansion means is a word stored in the index storage means, and stored in the index storage means. The selection is performed by leaving only the related word candidates that have been evaluated to be different words, and the presenting means presents the related word candidates that have been evaluated and selected by the evaluating means, and the searching means Searching the index storage means for a word having a matching notation with the related word used for
The document search device according to claim 2, wherein the search target document is specified based on information for specifying a document corresponding to the specified word notation.
【請求項4】 前記インデックス記憶手段に記憶された
語が検索された回数を求める手段をさらに備え、 前記第1の記憶手段は、語の表記に対応させてその語が
検索された回数を関連語評価値情報として記憶する評価
値情報記憶手段を含み、 前記提示する手段は前記評価選別手段により評価選別さ
れた前記関連語の候補を前記関連語評価値情報とともに
提示することを特徴とする請求項3記載の文書検索装
置。
4. The apparatus further comprises means for determining the number of times the word stored in the index storage means is searched, and the first storage means relates the number of times the word is searched in association with the notation of the word. An evaluation value information storage unit for storing as word evaluation value information is included, and the presenting unit presents the candidate of the related word evaluated and sorted by the evaluation selecting unit together with the related word evaluation value information. Item 3. The document search device according to item 3.
JP6238580A 1994-09-07 1994-09-07 Document retrieval device Pending JPH0877203A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6238580A JPH0877203A (en) 1994-09-07 1994-09-07 Document retrieval device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6238580A JPH0877203A (en) 1994-09-07 1994-09-07 Document retrieval device

Publications (1)

Publication Number Publication Date
JPH0877203A true JPH0877203A (en) 1996-03-22

Family

ID=17032326

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6238580A Pending JPH0877203A (en) 1994-09-07 1994-09-07 Document retrieval device

Country Status (1)

Country Link
JP (1) JPH0877203A (en)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000112968A (en) * 1998-10-02 2000-04-21 Fujitsu Ltd Information retrieval supporting device and information retrieval supporting program storage medium
WO2001039118A1 (en) * 1999-11-24 2001-05-31 Recruit Co.,Ltd. Latent needs inference device, latent need inference method, and recorded medium on which program is recorded
JP2002024261A (en) * 2000-07-07 2002-01-25 Denso Corp Information retrieval system
JP2002518748A (en) * 1998-06-15 2002-06-25 アマゾン ドット コム インコーポレイテッド Search query improvement system and method
JP2002519751A (en) * 1998-06-25 2002-07-02 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ User profile driven information retrieval based on context
US6734876B2 (en) 1997-11-28 2004-05-11 Minolta Co. ,Ltd. Image display apparatus
US8280720B2 (en) 2005-01-07 2012-10-02 Panasonic Corporation Association dictionary creation apparatus

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6734876B2 (en) 1997-11-28 2004-05-11 Minolta Co. ,Ltd. Image display apparatus
JP2002518748A (en) * 1998-06-15 2002-06-25 アマゾン ドット コム インコーポレイテッド Search query improvement system and method
JP2002519751A (en) * 1998-06-25 2002-07-02 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ User profile driven information retrieval based on context
JP2000112968A (en) * 1998-10-02 2000-04-21 Fujitsu Ltd Information retrieval supporting device and information retrieval supporting program storage medium
WO2001039118A1 (en) * 1999-11-24 2001-05-31 Recruit Co.,Ltd. Latent needs inference device, latent need inference method, and recorded medium on which program is recorded
JP2002024261A (en) * 2000-07-07 2002-01-25 Denso Corp Information retrieval system
US8280720B2 (en) 2005-01-07 2012-10-02 Panasonic Corporation Association dictionary creation apparatus

Similar Documents

Publication Publication Date Title
US5926808A (en) Displaying portions of text from multiple documents over multiple databases related to a search query in a computer network
KR100295354B1 (en) Document information retrieval system
US6944609B2 (en) Search results using editor feedback
US5787421A (en) System and method for information retrieval by using keywords associated with a given set of data elements and the frequency of each keyword as determined by the number of data elements attached to each keyword
KR19990013736A (en) Keyword Extraction System and Document Retrieval System Using It
US6112204A (en) Method and apparatus using run length encoding to evaluate a database
JPH07160731A (en) Method and device for picture retrieval
JPH09218881A (en) Additional retrieval word candidate presenting method, document retrieving method and devices therefor
JPWO2003034279A1 (en) Information retrieval method, information retrieval program, and computer-readable recording medium on which information retrieval program is recorded
JPH0528199A (en) Document retrieval device
JPH08255163A (en) Document retrieval device
JPH0877203A (en) Document retrieval device
JPH0773197A (en) Supporting system for preparing different notation word dictionary
JPH09259139A (en) Document data intelligent retrieval system
US6963865B2 (en) Method system and program product for data searching
JPH1131156A (en) Device and method for retrieving document
CA1276728C (en) Information retrieval system and method
JP3415214B2 (en) Document search device
JPH0584938B2 (en)
JPH08320879A (en) Adaptive feedback device
JPH10134067A (en) Information supply support method/device
JP4213931B2 (en) Specific information search method and information search device
JPH08235204A (en) Method and device for retrieving document
JPH09319752A (en) Retrieval supporting device
JPH08329094A (en) Document retrieval device

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050308

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050509

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050906

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051107

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20051122