JPH10143530A - Document retrieval system/method - Google Patents

Document retrieval system/method

Info

Publication number
JPH10143530A
JPH10143530A JP8304372A JP30437296A JPH10143530A JP H10143530 A JPH10143530 A JP H10143530A JP 8304372 A JP8304372 A JP 8304372A JP 30437296 A JP30437296 A JP 30437296A JP H10143530 A JPH10143530 A JP H10143530A
Authority
JP
Japan
Prior art keywords
search
document
retrieval
primary
documents
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8304372A
Other languages
Japanese (ja)
Inventor
Masaki Hori
正樹 堀
Tokumasa Yakura
得正 矢倉
Taiji Sogo
太治 十河
美佳 ▲吉▼岡
Miyoshi Yoshioka
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Omron Tateisi Electronics Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp, Omron Tateisi Electronics Co filed Critical Omron Corp
Priority to JP8304372A priority Critical patent/JPH10143530A/en
Publication of JPH10143530A publication Critical patent/JPH10143530A/en
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To facilitate retrieval work and to highly precisely retrieve a document. SOLUTION: A key sentence and a keyword for retrieving the document are inputted through an inquiry input mean 50. A retrieval execution means 52 retrieves the document from a retrieval object document group based on plural different retrieval systems by using the inputted key sentence and the keyword, and outputs a primary retrieval result. A connection extraction means 54 connects the primary retrieval results outputted from the retrieval execution means 52 by using a logic operation expression so as to extract a secondary retrieval result. A judgement control means 56 judges whether the number of the documents shown in the extracted secondary retrieval result is within the prescribed range or not. When it is within the prescribed range, an output instruction is given to a retrieval information output means 58. When it is out of the prescribed range, a retrieval condition in the retrieval execution means 52 or the connection extraction means 54 is changed and document retrieval/primary retrieval results are connected again. The retrieval information output means 58 outputs information on the secondary retrieval result in accordance with the output instruction from the judgment control means 56.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は、文書検索システム及び
文書検索方法に関し、特に検索の容易化及び高精度化に
関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a document retrieval system and a document retrieval method, and more particularly to facilitation of retrieval and higher accuracy.

【0002】[0002]

【従来の技術】従来、多くの文書から特定の文書全体を
検索(全文検索)するには、通常、ブーリアン(Boolea
n)検索方式又はブーリアン検索方式でない検索方式(非
ブーリアン検索方式)を用いていた。
2. Description of the Related Art Conventionally, to search a specific document from many documents (full-text search), a Boolean (Boolea) is usually used.
n) A search method other than the search method or the Boolean search method (non-Boolean search method) was used.

【0003】ブーリアン検索方式は、二値的検索方式と
も呼ばれ、被検索文書群内に文書検索の為に入力された
検索用の語(キーワード等)を含む文書があるか否かに
よって文書検索を行なう方式である。すなわち、被検索
文書群内の一の文が該キーワード等を含んでいれば、該
文が検索文書として検索結果に表わされ、いずれの文も
該キーワード等を含んでいなければ、検索結果に検索文
書なしと表わされる。このように、検索が二値的である
ため、適切なキーワードを用いて検索を行なえば、精度
の高い検索を行なうことができる。
[0003] The Boolean search method is also called a binary search method, and is based on whether or not there is a document including a search word (keyword or the like) input for document search in a group of documents to be searched. It is a method of performing. That is, if one sentence in the group of documents to be searched includes the keyword or the like, the sentence is represented in the search result as a search document, and if none of the sentences includes the keyword or the like, the search result Indicates that there is no search document. As described above, since the search is binary, if the search is performed using an appropriate keyword, a highly accurate search can be performed.

【0004】非ブーリアン検索方式には、様々な種類が
あるが、代表的なものにベストマッチング検索方式とコ
ンセプト検索方式がある。
[0004] There are various types of non-Boolean search methods, and typical ones are a best matching search method and a concept search method.

【0005】ベストマッチング検索方式は、以下に説明
する方式で全文検索を行なう方式である。まず、ある語
又は文と、他の語又は文との関連を予め記憶しておき、
キーワード又は検索用の文(キーセンテンス)を入力す
る。次に、被検索文書群内の各文書に、入力されたキー
ワード又はキーセンテンスと関連を有する語又は文が出
現する頻度を関連度として算出する。こうして算出され
た各文書ごとの関連度が、一定値を超えると、該文書は
検索文であると判断され、そうでない場合には検索文で
ないと判断される。判断結果は、文書検索結果として出
力される。この検索方式によれば、語又は文同士の関連
性が予め記憶されているので、キーワード又はキーセン
テンスの選択は容易に行なえる。したがって、キーワー
ド又はキーセンテンスの選択等に熟練を要求されること
がなく、検索作業を容易に行なうことができる。
[0005] The best matching search method is a method for performing a full-text search by the method described below. First, the relation between a certain word or sentence and another word or sentence is stored in advance,
Input a keyword or a sentence for search (key sentence). Next, the frequency of occurrence of a word or a sentence related to the input keyword or key sentence in each document in the searched document group is calculated as the degree of association. If the degree of relevance of each document calculated in this way exceeds a certain value, the document is determined to be a search sentence; otherwise, it is determined not to be a search sentence. The judgment result is output as a document search result. According to this search method, the relevance between words or sentences is stored in advance, so that a keyword or a key sentence can be easily selected. Therefore, no skill is required for selecting a keyword or a key sentence, and a search operation can be easily performed.

【0006】コンセプト検索方式は、概念検索とも呼ば
れるものである。以下にその検索手順を簡単に示す。ま
ず、ある語又は文の主題に対し、他の語又は文がどれく
らいの関連度(共通した概念、意味)を有するのかを予
め記憶しておく。次に、キーワード又はキーセンテンス
を入力する。さらに、被検索文群内の各文書中の語又は
文書の主題と、入力されたキーワード、キーセンテンス
間の意味内容の近さを関連度として算出する。こうして
算出された各文書ごとの関連度が、一定値を超えると、
該文書は検索文であると判断され、そうでない場合には
検索文でないと判断される。この場合でも、判断結果は
文書検索結果として出力される。すなわち、コンセプト
検索方式は、上記二つの検索方式と異なり、語又は文同
士を検索するのではなく、意味内容の近い語又は文を有
する文書の検索を行なう方式である。したがって、例え
入力キーワード、入力キーセンテンスを有する文書が、
被検索文群内に存在しなくても文書検索を行なうことが
可能である。これにより、検索作業を容易に行なうこと
ができる。
The concept search method is also called a concept search. The search procedure is briefly described below. First, the degree of relevance (common concept, meaning) of another word or sentence to the subject of a certain word or sentence is stored in advance. Next, a keyword or key sentence is input. Further, the similarity between the words in each document or the subject of each document in the group of sentences to be searched and the meanings of the input keywords and key sentences is calculated as the degree of association. If the calculated relevance of each document exceeds a certain value,
The document is determined to be a search statement, otherwise it is determined not to be a search statement. Even in this case, the determination result is output as a document search result. That is, unlike the above two search methods, the concept search method does not search for words or sentences, but searches for documents having words or sentences with similar meanings. Therefore, even if a document has an input keyword and an input key sentence,
It is possible to perform a document search even if the document does not exist in the search target sentence group. Thus, the search operation can be easily performed.

【0007】また、最近、複数の異なった検索方式の検
索結果の組み合せによる検索が提案されている。例え
ば、ブーリアン検索方式によって得られた文書検索結果
と、非ブーリアン検索方式で得られた文書検索結果を、
論理演算式(アンド、オア条件等)を用いて結合させる
文書検索方式である。
[0007] Recently, a search using a combination of search results of a plurality of different search methods has been proposed. For example, a document search result obtained by the Boolean search method and a document search result obtained by the non-boolean search method are
This is a document search method for combining documents using logical operation expressions (AND, OR conditions, etc.).

【0008】[0008]

【発明が解決しようとする課題】しかしながら、従来の
文書検索方式には、次の様な問題点があった。ブーリア
ン検索方式による検索では、適切なキーワード等を選択
しないと、正確な検索が行なえず、却って無駄な作業が
行なわれてしまう場合がある。したがって、適切なキー
ワード等を選択するために、文書検索を行なう場合、熟
練を要するという問題がある。また、適切なキーワード
等の選択の為、試行錯誤を行なう場合があり、検索作業
が困難になる問題もある。
However, the conventional document retrieval system has the following problems. In the search by the Boolean search method, unless an appropriate keyword or the like is selected, an accurate search cannot be performed, and a wasteful work may be performed. Therefore, there is a problem that skill is required when performing a document search in order to select an appropriate keyword or the like. In addition, trial and error may be performed to select an appropriate keyword or the like, and there is also a problem that a search operation becomes difficult.

【0009】ベストマッチング検索方式及びコンセプト
検索方式による検索では、キーセンテンス等の選択に熟
練を要求されることがなく、検索作業を容易に行なうこ
とができる反面、精度の高い検索を行なうことができな
いとい問題があった。
In the search by the best matching search method and the concept search method, no skill is required for selecting key sentences and the like, and the search operation can be easily performed, but a search with high accuracy cannot be performed. There was a problem.

【0010】そこで、本発明は、検索作業が容易で、し
かも精度の高い文書検索を行なうことが可能な文書検索
システム及び文書検索方法の提供を目的とする。
SUMMARY OF THE INVENTION It is an object of the present invention to provide a document search system and a document search method capable of performing a search operation easily and performing a highly accurate document search.

【0011】[0011]

【課題を解決するための手段】[Means for Solving the Problems]

【0012】[0012]

【課題を解決するに案出した技術思想】容易かつ精度の
高い文書検索を行なうことが可能な文書検索システム及
び文書検索方法を提供するために、文書検索のための問
い合わせ語又は問い合わせ文を入力し、入力された問い
合わせ語又は問い合わせ文を用い、複数の異なった検索
方式に基づいて検索対象となる文書群から文書検索を行
ない、一次検索結果を出力し、出力された一次検索結果
を論理演算式を用いて結合させ、二次検索結果を抽出
し、抽出された二次検索結果の文書数が所定の範囲にあ
るか否かを判断し、所定範囲内にある場合には、出力命
令を出し、該文書数が所定範囲外である場合には、検索
条件を変更して前記検索実行手段に再検索を行なわせ、
出力命令を受けて二次検索結果に関する情報を出力す
る。
[Technical idea devised to solve the problem] In order to provide a document search system and a document search method capable of performing easy and accurate document search, a query word or a query sentence for document search is input. Then, using the input query word or query sentence, perform a document search from a group of documents to be searched based on a plurality of different search methods, output a primary search result, and perform a logical operation on the output primary search result The secondary search result is extracted using the formula, the secondary search result is extracted, it is determined whether or not the number of documents in the extracted secondary search result is within a predetermined range. If the number of documents is out of the predetermined range, the search condition is changed and the search execution means is searched again,
Upon receiving the output command, the information about the secondary search result is output.

【0013】すなわち、請求項に記載した発明の構成を
示す第1図に記載しているように、請求項1の文書検索
システムは、文書検索のための問い合わせ語又は問い合
わせ文を入力する問い合わせ入力手段50、入力された
問い合わせ語又は問い合わせ文を用い、複数の異なった
検索方式に基づいて検索対象となる文書群から文書検索
を行ない、一次検索結果を出力する検索実行手段52、
出力された一次検索結果を論理演算式を用いて結合さ
せ、二次検索結果を抽出する結合抽出手段54、抽出さ
れた二次検索結果の文書数が所定の範囲にあるか否かを
判断し、所定範囲内にある場合には、出力命令を出し、
該文書数が所定範囲外である場合には、検索条件を変更
して前記検索実行手段に再検索を行なわせる判断制御手
段56、出力命令を受けて二次検索結果に関する情報を
出力する検索情報出力手段58、を備えたことを特徴と
する。
That is, as shown in FIG. 1 showing the configuration of the invention described in the claims, the document search system according to the first aspect has a query input for inputting a query word or a query sentence for document search. Means 50 for performing a document search from a group of documents to be searched based on a plurality of different search methods using the input query word or query sentence, and outputting a primary search result;
The combining and extracting means 54 for combining the output primary search results using a logical operation expression and extracting the secondary search results determines whether or not the number of documents of the extracted secondary search results is within a predetermined range. , If within the predetermined range, issue an output instruction,
When the number of documents is out of the predetermined range, the judgment control means 56 changes the search condition and causes the search execution means to perform the search again, and the search information for receiving the output instruction and outputting the information on the secondary search result Output means 58.

【0014】請求項2の文書検索システムは、請求項1
に係る文書検索システムにおいて、前記判断制御手段5
6において変更される前記検索条件は、前記結合抽出手
段54において用いられる一次検索結果の結合方法に関
する論理演算式であること、を特徴とする。
According to a second aspect of the present invention, there is provided a document search system.
In the document search system according to the above, the judgment control means 5
6, wherein the search condition changed is a logical operation expression relating to a method of combining the primary search results used in the combination extraction means 54.

【0015】請求項3の文書検索システムは、請求項1
に係る文書検索システムにおいて、前記判断制御手段5
6において変更される前記検索条件は、前記問い合わせ
入力手段50において入力された前記問い合せ語又は前
記問い合せ文のうち、検索に使用される語又は文の数で
あること、を特徴とする。
According to a third aspect of the present invention, there is provided a document search system.
In the document search system according to the above, the judgment control means 5
The search condition changed in step 6 is the number of words or sentences used in the search, out of the query word or the query sentence input by the query input means 50.

【0016】請求項4の文書検索方法は、文書検索のた
めの問い合わせ語又は問い合わせ文を入力し、入力され
た問い合わせ語又は問い合わせ文を用い、複数の異なっ
た検索方式に基づいて検索対象となる文書群から文書検
索を行ない、一次検索結果を出力し、出力された一次検
索結果を論理演算式を用いて結合させ、二次検索結果を
抽出し、抽出された二次検索結果の文書数が所定の範囲
にあるか否かを判断し、所定範囲内にある場合には、出
力命令を出し、該文書数が所定範囲外である場合には、
検索条件を変更して再検索を行なわせ、出力命令を受け
て二次検索結果に関する情報を出力すること、を備えた
ことを特徴とする。
According to a fourth aspect of the present invention, there is provided a document search method in which a query word or a query sentence for document search is input, and the input query word or query sentence is used as a search target based on a plurality of different search methods. A document search is performed from a group of documents, a primary search result is output, the output primary search result is combined using a logical operation expression, a secondary search result is extracted, and the number of documents of the extracted secondary search result is reduced. It is determined whether the number is within a predetermined range. If the number is outside the predetermined range, an output command is issued.
Changing the search condition to perform a re-search, and receiving an output instruction to output information relating to the secondary search result.

【0017】請求項5の文書検索方法は、請求項4に係
る文書検索方法において、変更される前記検索条件は、
一次検索結果の結合方法に関する論理演算式であるこ
と、を特徴とする。
According to a fifth aspect of the present invention, in the document search method according to the fourth aspect, the search condition to be changed is:
A logical operation expression relating to a method of combining the primary search results.

【0018】請求項6の文書検索方法は、請求項4に係
る文書検索方法において、変更される前記検索条件は、
入力された前記問い合せ語又は前記問い合せ文のうち、
検索に使用される語又は文の数であること、を特徴とす
る。
According to a sixth aspect of the present invention, in the document search method according to the fourth aspect, the search condition to be changed is:
Of the input query word or query sentence,
The number of words or sentences used in the search.

【0019】請求項7の記憶媒体は、コンピュータによ
り実行可能なプログラムを記憶したコンピュータ可読の
記憶媒体であって、前記プログラムは請求項1ないし請
求項6のいずれかの文書検索システム又は文書検索方法
を実現するものであること、を特徴とする。
A storage medium according to a seventh aspect is a computer-readable storage medium storing a computer-executable program, wherein the program is a document search system or a document search method according to any one of the first to sixth aspects. Is realized.

【0020】[0020]

【用語の定義】課題を解決するために案出した技術思想
を表現する請求項での用語の概念を、次の通り定義する
とともに、その用語と実施形態との関係を説明する。
[Definition of terms] The concept of the terms in the claims for expressing the technical idea devised to solve the problem is defined as follows, and the relationship between the terms and the embodiments is described.

【0021】「文書」:文字、記号などのキャラクタを
用いて表現された情報を含むテキストである。したがっ
て、文書がキャラクタを用いて表現された情報以外に画
像、図形、音声を含むハイパーテキストであっても良い
し、ある特定の記憶装置に格納されてデータベースシス
テムによって検索されるものであっても良いし、インタ
ーネット上のサーチエンジンによって検索されるハイパ
ーテキストであっても良い。もちろん、ワードプロセッ
サなどによって生成される各種の文書ファイルは、ここ
でいう文書に該当する。
"Document": a text including information expressed using characters such as characters and symbols. Therefore, the document may be a hypertext including an image, a graphic, and a sound in addition to the information expressed using the character, or may be stored in a specific storage device and searched by the database system. Good, or hypertext searched by a search engine on the Internet. Of course, various document files generated by a word processor or the like correspond to the document referred to herein.

【0022】「問い合わせ語又は問い合わせ文」:文書
検索のために用いられる単語、熟語、句等及び文章をい
い、実施形態では、図4Aに示す入力キーワード及び入
力キーセンテンスがこれに該当する。
"Inquiry word or inquiry sentence": A word, an idiom, a phrase, etc. and a sentence used for document retrieval. In the embodiment, the input keyword and the input key sentence shown in FIG. 4A correspond to this.

【0023】「検索対象となる文書群」:本文書検索シ
ステムによって検索される対象となる文章の集合をい
い、実施形態では、図5に示すハードディスク74に記
憶された複数の文書がこれに該当する。
"Document group to be searched": A set of documents to be searched by the document search system. In the embodiment, a plurality of documents stored in the hard disk 74 shown in FIG. I do.

【0024】「一次検索結果」:検索実行手段による文
書検索によって得られた結果をいい、実施形態では、図
6Aおよび図8に示す文書検索結果がこれに該当する。
"Primary search result": A result obtained by a document search by the search execution means. In the embodiment, the document search results shown in FIGS. 6A and 8 correspond to this.

【0025】「二次検索結果」:一次検索結果同士を論
理演算式等を用いて結合させることにより抽出した結果
をいい、実施形態では、図6B、6Cおよび図9A〜9
Cに示す検索結果がこれに該当する。
"Secondary search result": A result extracted by combining primary search results with each other using a logical operation expression or the like. In the embodiment, FIGS. 6B and 6C and FIGS.
The search result shown in C corresponds to this.

【0026】「コンピュータにより実行可能なプログラ
ム」:当該プログラムがコンピュータにより直接実行可
能な場合だけでなく、一旦変換した後(圧縮の解凍な
ど)に実行可能となる場合や、他のモジュールと組み合
せて実行可能となる場合等も含む概念である。
"Program Executable by Computer": Not only when the program can be directly executed by a computer, but also after it has been once converted (eg, decompression), or in combination with another module. This is a concept that includes the case where it becomes executable.

【0027】[0027]

【発明の効果】請求項1の文書検索システムおよび請求
項4の文書検索方法は、抽出された二次検索結果の文書
数が所定の範囲にあるか否かを判断し、所定範囲内にあ
る場合には、出力命令を出し、該文書数が所定範囲外で
ある場合には、検索条件を変更して再検索を行なわせる
ことを特徴とする。
According to the document search system of the first aspect and the document search method of the fourth aspect, it is determined whether or not the number of documents of the extracted secondary search result is within a predetermined range, and is determined to be within the predetermined range. In this case, an output command is issued, and when the number of documents is out of the predetermined range, the search condition is changed and the search is performed again.

【0028】したがって、二次検索結果の文書数が過大
又は過小な場合、自動的に変更された検索条件により再
度検索を行なう。すなわち、二次検索結果の文書数を適
切にすることができる。これにより、検索作業が容易
で、しかも精度の高い文書検索を行なうことができる文
書検索システム及び文書検索方法の提供が可能となる。
Therefore, when the number of documents in the secondary search result is too large or too small, the search is performed again according to the automatically changed search condition. That is, the number of documents in the secondary search result can be made appropriate. As a result, it is possible to provide a document search system and a document search method that can easily perform a search operation and perform a high-accuracy document search.

【0029】請求項2の文書検索システム及び請求項5
の文書検索方法は、前記判断制御手段において変更され
る前記検索条件が、前記結合抽出手段において用いられ
る一次検索結果の結合方法に関する論理演算式であるこ
とを特徴とする。
A document retrieval system according to claim 2 and claim 5
In the document search method, the search condition changed by the determination control means is a logical operation expression relating to a method of combining primary search results used in the combination extraction means.

【0030】したがって、二次検索結果の文書数が過大
又は過小な場合、一次検索結果の結合方法に関する論理
演算式を自動的に変更させて、二次検索結果の文書数を
適切な範囲とすることができる。これにより、検索作業
が容易で、しかも精度の高い文書検索を行なうことが可
能な文書検索システム及び文書検索方法の提供が可能と
なる。
Therefore, when the number of documents in the secondary search result is too large or too small, the logical operation expression relating to the method of combining the primary search results is automatically changed to keep the number of documents in the secondary search result in an appropriate range. be able to. As a result, it is possible to provide a document search system and a document search method that can easily perform a search operation and perform a highly accurate document search.

【0031】請求項3の文書検索システム及び請求項6
の文書検索方法は、変更される前記検索条件が、入力さ
れた前記問い合せ語又は前記問い合せ文のうち、検索に
使用される語又は文の数であることを特徴とする。
A document retrieval system according to claim 3 and claim 6.
In the document search method, the search condition to be changed is the number of words or sentences used for search among the input query words or query sentences.

【0032】したがって、二次検索結果の文書数が過大
又は過小な場合、検索に使用される前記問い合せ語又は
前記問い合せ文の数を自動的に適正化することができ
る。これにより、検索作業が容易で、しかも精度の高い
文書検索を行なうことができる文書検索システム及び文
書検索方法の提供が可能となる。
Therefore, when the number of documents in the secondary search result is too large or too small, the number of the query words or query sentences used in the search can be automatically optimized. As a result, it is possible to provide a document search system and a document search method that can easily perform a search operation and perform a high-accuracy document search.

【0033】請求項7の記憶媒体は、前記プログラムは
請求項1ないし請求項6のいずれかの文書検索システム
又は文書検索方法をコンピュータを用いて実現するプロ
グラムを記憶したことを特徴とする。
A storage medium according to a seventh aspect is characterized in that the program stores a program for realizing the document search system or the document search method according to any one of the first to sixth aspects using a computer.

【0034】したがって、プログラムをコンピュータに
読み取らせることにより、文書検索システム等を実現す
ることができる。すなわち、検索作業が容易で、しかも
精度の高い文書検索を行なうことができる文書検索シス
テム及び文書検索方法の提供が可能となる。
Therefore, a document retrieval system or the like can be realized by causing a computer to read the program. That is, it is possible to provide a document search system and a document search method that can easily perform a search operation and perform a highly accurate document search.

【0035】[0035]

【実施形態】本発明に係る文書検索システムの一実施形
態について説明する。図1に、本実施形態の文書検索シ
ステム100の構成を示す。文書検索システム100
は、問い合わせ入力手段50、検索実行手段52、結合
抽出手段54、判断制御手段56および検索情報出力手
段58を備えている。
DESCRIPTION OF THE PREFERRED EMBODIMENTS One embodiment of a document search system according to the present invention will be described. FIG. 1 shows a configuration of a document search system 100 according to the present embodiment. Document search system 100
Has an inquiry input unit 50, a search execution unit 52, a combination extraction unit 54, a judgment control unit 56, and a search information output unit 58.

【0036】ここで、上記各手段は、図1の左側から番
号順に直列接続されているが、判断制御手段56は、さ
らに結合抽出手段54および検索実行手段52に接続さ
れている。
Here, the respective units are connected in series in numerical order from the left side in FIG. 1, but the judgment control unit 56 is further connected to the combination extraction unit 54 and the search execution unit 52.

【0037】この文書検索システム100の機能におけ
る各手段の機能を簡単に説明する。問い合わせ入力手段
50は、文書検索のための問い合わせ語又は問い合わせ
文(以下キーセンテンス、キーワードという)を入力す
るための手段である。また、検索実行手段52は、入力
されたキーセンテンス又はキーワードを用いて、複数の
異なった検索方式に基づいて検索対象文書群から文書検
索を行なうとともに、一次的な検索結果を出力する手段
である。結合抽出手段54は、検索実行手段52から出
力された一次的な検索結果を、論理演算式を用いて結合
させることにより、二次的な検索結果を抽出する手段で
ある。さらに、判断制御手段56は、抽出された二次的
な検索結果に示された文書の数が所定の範囲にあるか否
かを判断し、所定範囲内にある場合には、検索情報出力
手段58に出力命令を出し、該文書数が所定範囲外であ
る場合には、検索実行手段52又は結合抽出手段54に
おける検索条件を変更して再び検索を行なわせる手段で
ある。なお、検索情報出力手段58は、判断制御手段5
6からの出力命令に応じて二次的な検索結果に関する情
報を出力する手段である。
The function of each means in the function of the document search system 100 will be briefly described. The query input unit 50 is a unit for inputting a query word or a query sentence (hereinafter referred to as a key sentence, a keyword) for document search. The search executing means 52 is a means for performing a document search from a search target document group based on a plurality of different search methods using the input key sentence or keyword, and outputting a primary search result. . The combination extraction unit 54 is a unit that extracts the secondary search results by combining the primary search results output from the search execution unit 52 using a logical operation expression. Further, the judgment control means 56 judges whether or not the number of documents indicated in the extracted secondary search result is within a predetermined range, and when the number is within the predetermined range, the search information output means When the number of documents is out of the predetermined range, a search condition in the search execution unit 52 or the combination extraction unit 54 is changed to search again. The search information output means 58 is provided for the judgment control means 5.
6 is a means for outputting information relating to a secondary search result in response to an output command from the control unit 6.

【0038】なお、本システムの操作者は、出力された
二次検索結果に記載されている文書名及び関連度に基づ
き、所望の文書を検索する。
The operator of the system searches for a desired document based on the document name and the relevance described in the output secondary search result.

【0039】図2に、図1に示す文書検索システム10
0をCPUを用いて実現した文書検索システム200の
構成を示す。ここで、文書検索システム200は、キー
ボード80、CRT82、ROM84、RAM86、F
DD78、プリンタ76、ハードディスク74及びCP
U72を備えており、各部はバスライン70によって接
続されている。
FIG. 2 shows the document search system 10 shown in FIG.
0 shows the configuration of a document search system 200 realized using a CPU. Here, the document search system 200 includes a keyboard 80, a CRT 82, a ROM 84, a RAM 86,
DD 78, printer 76, hard disk 74 and CP
U72 is provided, and each unit is connected by a bus line 70.

【0040】なお、図2に示した文書検索システム20
0は、図1に示す文書検索システム100と以下のよう
に対応する。すなわち、キーボード80は、問い合わせ
入力手段50と対応し、CRT82及びプリンタ76
は、検索情報出力手段58に対応する。また、CPU7
2が、検索実行手段52、結合抽出手段54及び判断制
御手段56のそれぞれに対応する。
The document search system 20 shown in FIG.
0 corresponds to the document search system 100 shown in FIG. 1 as follows. That is, the keyboard 80 corresponds to the inquiry input means 50, and the CRT 82 and the printer 76
Corresponds to the search information output means 58. Also, the CPU 7
Reference numeral 2 corresponds to each of the search execution unit 52, the combination extraction unit 54, and the judgment control unit 56.

【0041】次に、このような文書検索システム200
の動作について説明する。図3および図7に、図2に示
すROM84内に記憶されている動作プログラムの内容
を表わすフローチャートを示す。CPU72は、この動
作プログラムに従い、各部を制御する。この動作プログ
ラムは、FDD78を介して、フロッピーディスク60
から取り込んだものである。もちろん、動作プログラム
は、CDーROM等のその他の記憶装置から取り込んだ
ものであってもよく、通信回線を通じて取り込み、それ
をダウンロードしたものであってもよい。
Next, such a document search system 200
Will be described. FIGS. 3 and 7 are flowcharts showing the contents of the operation program stored in the ROM 84 shown in FIG. The CPU 72 controls each unit according to the operation program. This operation program is transmitted to the floppy disk 60 via the FDD 78.
It is taken from. Of course, the operation program may be fetched from another storage device such as a CD-ROM, or may be fetched through a communication line and downloaded.

【0042】図3に示したフローチャートに基づき、検
索条件の変更として結合抽出手段における論理演算式を
変更する場合の動作を説明する。なお、ここでの文書検
索方式は、上述のブーリアン検索方式およびコンセプト
検索方式(非ブーリアン検索方式)の両方が用いられて
いる。
Referring to the flow chart shown in FIG. 3, the operation in the case where the logical operation expression in the combination extraction means is changed as the change of the search condition will be described. Here, as the document search method, both the Boolean search method and the concept search method (non-Boolean search method) described above are used.

【0043】まず、キーボード80を用いて複数のキー
ワード又はキーセンテンスを入力する(図3、ステップ
S2)。通常、ブーリアン検索方式を実行するために
は、キーワードを入力し、コンセプト検索方式(非ブー
リアン検索方式)を行なうためにはキーセンテンスを入
力する。こうして入力されたキーワード等は、RAM8
6内に記憶される(図4A)。
First, a plurality of keywords or key sentences are input using the keyboard 80 (FIG. 3, step S2). Usually, a keyword is input to execute the Boolean search method, and a key sentence is input to perform the concept search method (non-Boolean search method). The keywords and the like thus input are stored in the RAM 8
6 (FIG. 4A).

【0044】つぎに、CPU72は、RAM86に記憶
されたキーワード等の一部を用い、ハードディスク74
に記憶された検索対象となる文書群から所望の文書を検
索するための文書検索を実行する(図3、ステップS
4)。図4Bに検索に用いられたキーワード等の一部を
示し、図5にハードディスク74に記憶された検索対象
となる文書群を示す。なお、こうして実行された文書検
索の結果(一次検索結果)の一例を図6Aに示す。この
一次検索結果は、一旦RAM86内に記憶される。な
お、本実施形態においては、ブーリアン検索方式および
非ブーリアン検索方式の両方が用いられているので、一
次検索結果は、文書名のみを示したもの及び文書名と関
連度の両方を示している。
Next, the CPU 72 uses a part of the keywords and the like stored in the RAM 86 to
A document search is performed to search for a desired document from a group of documents to be searched stored in the database (FIG. 3, step S).
4). FIG. 4B shows a part of the keywords and the like used in the search, and FIG. 5 shows a document group to be searched stored in the hard disk 74. FIG. 6A shows an example of the result (primary search result) of the document search executed in this manner. This primary search result is temporarily stored in the RAM 86. In this embodiment, since both the Boolean search method and the non-boolean search method are used, the primary search result indicates only the document name and indicates both the document name and the relevance.

【0045】つぎに、CPU72は、RAM86内に記
憶された一次検索結果を取り出し、文書検索結果同士を
論理演算式を用いて結合させた後、結合後の検索結果
(二次検索結果)を抽出する(図3、ステップS6)。
なお、ここでは、論理演算式としてANDを用いてい
る。したがって、コンセプト検索方式及びブーリアン検
索方式による一次検索結果の両方に有る文書(文書名)
を二次検索結果として抽出する。すなわち、図6Aに示
す両検索方式における一次検索結果の双方に有る文書、
すなわち文書名2、10、25及びnが二次検索結果と
して抽出される。こうして抽出された二次検索結果を図
6Bに示す。この二次検索結果も、一旦RAM86内に
記憶される。
Next, the CPU 72 takes out the primary search results stored in the RAM 86, combines the document search results with each other using a logical operation expression, and then extracts the combined search results (secondary search results). (Step S6 in FIG. 3).
Here, AND is used as the logical operation expression. Therefore, the document (document name) in both the primary search result by the concept search method and the Boolean search method
Is extracted as a secondary search result. That is, the documents in both of the primary search results in the two search methods shown in FIG. 6A,
That is, document names 2, 10, 25, and n are extracted as secondary search results. FIG. 6B shows the secondary search result extracted in this way. This secondary search result is also temporarily stored in the RAM 86.

【0046】CPU72は、抽出された二次検索結果内
の文書数が所定の範囲内であるか否かを判断する(図
3、ステップS8)。なお、ここでの文書数の所定範囲
は、7〜10であると仮定する。仮に、ステップS8に
おいて二次検索結果内の文書数が該所定の範囲内である
と判断されると、二次検索結果(図6B)がそのままC
RT82上に表示されるとともに、プリンタ76から出
力される(図3、ステップS10、図2参照)。
The CPU 72 determines whether the number of documents in the extracted secondary search result is within a predetermined range (FIG. 3, step S8). Here, it is assumed that the predetermined range of the number of documents is 7 to 10. If it is determined in step S8 that the number of documents in the secondary search result is within the predetermined range, the secondary search result (FIG.
It is displayed on the RT 82 and output from the printer 76 (see FIG. 3, step S10, FIG. 2).

【0047】しかし、二次検索結果内には、文書名2、
10、25及びnの合計4つの文書のみが含まれている
(図6B)。したがって、二次検索結果内の文書数は、
所定の範囲(7〜10)よりも少ないと判断される(ス
テップS8)。
However, in the secondary search result, the document name 2,
Only four documents 10, 25 and n are included (FIG. 6B). Therefore, the number of documents in the secondary search results is
It is determined that it is less than the predetermined range (7 to 10) (step S8).

【0048】ステップS8において、二次検索結果内の
文書数が所定範囲外であると判断されると、CPU72
は自動的に一次検索結果同士の結合を行なうための論理
演算式(検索条件)をANDからORに変更する(図
3、ステップS12)。そして、変更後の論理演算式
(OR)を用いて、再び一次検索結果同士を結合させる
(図3、ステップS6)。
If it is determined in step S8 that the number of documents in the secondary search result is out of the predetermined range, the CPU 72
Automatically changes the logical operation expression (search condition) for combining the primary search results from AND to OR (FIG. 3, step S12). Then, the primary search results are combined again using the changed logical operation expression (OR) (FIG. 3, step S6).

【0049】このような論理演算式の変更により、二次
検索結果内には、図6Aに示す両検索方式における一次
検索結果のいずれか一方に存在する文書、文書名2、1
0、25、28、35、41、43、53およびnの合
計9つの文書が含まれるようになる(図6C)。これに
より、CPU72は、抽出された二次検索結果内の文書
数が所定の範囲(7〜10)内であると判断し(ステッ
プS8)、図6Cに示す検索結果が、そのままCRT8
2上に表示されるとともに、プリンタ76から出力され
る(ステップS10)。
Due to such a change in the logical operation expression, in the secondary search result, the document, the document name 2, 1 and the document name existing in one of the primary search results in both the search methods shown in FIG.
A total of nine documents 0, 25, 28, 35, 41, 43, 53 and n are included (FIG. 6C). As a result, the CPU 72 determines that the number of documents in the extracted secondary search result is within the predetermined range (7 to 10) (step S8), and the search result shown in FIG.
2 and output from the printer 76 (step S10).

【0050】なお、上記の場合とは逆に、当初の論理演
算式(検索条件)がORであるために二次検索結果内の
文書数が所定範囲よりも多い場合、CPU72は二次検
索結果内の文書数に応じて自動的に論理演算式をORか
らANDに変更する。このように、CPU72は、二次
検索結果内の文書数が所定範囲外の場合、自動的に一次
検索結果同士の結合を行なうための論理演算式(検索条
件)を変更する。これにより、検索作業が容易で、しか
も精度の高い文書検索を行なうことができる。
Contrary to the above case, when the number of documents in the secondary search result is larger than a predetermined range because the initial logical operation expression (search condition) is OR, the CPU 72 sets the secondary search result. Automatically changes the logical operation expression from OR to AND according to the number of documents in the file. As described above, when the number of documents in the secondary search result is out of the predetermined range, the CPU 72 automatically changes the logical operation expression (search condition) for combining the primary search results. As a result, a search operation is easy and a highly accurate document search can be performed.

【0051】つぎに、図7に示すフローチャートに基づ
き、検索条件の変更として文書検索に使用されるキーワ
ード又はキーセンテンスの数を変更する場合を説明す
る。なお、この場合でも、検索方法、文書検索に用いら
れるキーワード等の数(図4B)及び所定範囲の数(7
〜10)も上述の実施形態と同じとし、さらに図3に示
すステップS2〜ステップS8に対応するステップ(図
7、ステップS22〜28)も上述の場合と同様に行な
われたものとする。
Next, a case in which the number of keywords or key sentences used for document search is changed as a change in search conditions will be described with reference to the flowchart shown in FIG. In this case as well, the search method, the number of keywords used for document search (FIG. 4B) and the number of predetermined ranges (7
10 to 10) are the same as those in the above-described embodiment, and steps (steps S22 to 28 in FIG. 7) corresponding to steps S2 to S8 shown in FIG. 3 are also performed in the same manner as in the above-described case.

【0052】ここで、例えば、ステップS28におい
て、二次検索結果内の文書数が所定範囲よりも少ないと
判断されたと仮定する。すなわち、図6Bに示すよう
に、二次検索結果内には、文書名2、10、25及びn
の合計4つの文書のみが含まれていたとする。このよう
な場合、CPU27は、RAM86に記憶されているキ
ーワード等のうち文書検索に用いられるキーワード又は
キーセンテンスの数を変更する(図7、ステップS3
2)。すなわち、キーワード及びキーセンテンスの数
を、図4Bに示す数から図4Cに示すような数に自動的
に増加させ、増加したキーワード及びキーセンテンスを
用いて再び文書検索を実行する(ステップS24)。
Here, for example, it is assumed that it is determined in step S28 that the number of documents in the secondary search result is smaller than a predetermined range. That is, as shown in FIG. 6B, the document names 2, 10, 25 and n are included in the secondary search result.
It is assumed that only four documents are included. In such a case, the CPU 27 changes the number of keywords or key sentences used for document search among the keywords and the like stored in the RAM 86 (FIG. 7, step S3).
2). That is, the number of keywords and key sentences is automatically increased from the number shown in FIG. 4B to the number shown in FIG. 4C, and a document search is executed again using the increased keywords and key sentences (step S24).

【0053】こうして検索された一次検索結果は、一旦
RAM86内に記憶され、CPU72は、RAM86内
に記憶された一次検索結果を取り出し、文書検索結果同
士を論理演算式を用いて再び結合させた後、二次検索結
果を抽出する(ステップS26)。
The primary search results searched in this way are temporarily stored in the RAM 86, and the CPU 72 takes out the primary search results stored in the RAM 86, and combines the document search results again using a logical operation expression. Then, the secondary search result is extracted (step S26).

【0054】例えば、このようなキーワード又はキーセ
ンテンスの数の変更により、二次検索結果内に合計9つ
の文書が含まれるようになったと仮定する(図6C)。
すると、CPU72は、抽出された二次検索結果内の文
書数が所定の範囲(7〜10)内であると判断し(ステ
ップS28)、図6Cに示す検索結果が、そのままCR
T82上に表示されるとともに、プリンタ76から出力
される(ステップS30)。
For example, suppose that such a change in the number of keywords or key sentences causes the secondary search result to include a total of nine documents (FIG. 6C).
Then, the CPU 72 determines that the number of documents in the extracted secondary search result is within the predetermined range (7 to 10) (step S28), and the search result shown in FIG.
It is displayed on T82 and output from the printer 76 (step S30).

【0055】なお、上記の場合とは逆に、当初の文書検
索に使用されたキーワード又はキーセンテンスの数が多
いために、二次検索結果内の文書数が所定範囲よりも多
い場合、CPU72は自動的に使用キーワード及びキー
センテンス数を減少させる。このように、CPU72
は、二次検索結果内の文書数が所定範囲外の場合、自動
的に文書検索に使用するキーワード及びキーセンテンス
の数を変更する。これにより、検索作業が容易で、しか
も精度の高い文書検索を行なうことができる。
Contrary to the above case, if the number of documents in the secondary search result is larger than a predetermined range because the number of keywords or key sentences used in the original document search is large, the CPU 72 Automatically reduce the number of used keywords and key sentences. Thus, the CPU 72
Automatically changes the number of keywords and key sentences used for document search when the number of documents in the secondary search result is out of a predetermined range. As a result, a search operation is easy and a highly accurate document search can be performed.

【0056】なお、上記二つの実施形態においては、二
次検索結果内の文書数が所定範囲外である場合に、検索
条件として論理演算式または文書検索に使用されるキー
ワード等の数のいずれか一方を変更する場合について説
明した。
In the above two embodiments, when the number of documents in the secondary search result is out of the predetermined range, any one of the logical operation formula or the number of keywords used in the document search is used as the search condition. The case where one is changed has been described.

【0057】しかし、二次検索結果内の文書数に応じて
一次検索結果同士の結合に用いられる論理演算式および
文書検索に使用されるキーワード等の数の双方を変更す
るようにしてもよい。これにより、検索作業が容易で、
より精度の高い文書検索を行なうことができる。
However, both the logical operation formula used for combining the primary search results and the number of keywords used for the document search may be changed according to the number of documents in the secondary search results. This makes searching easier,
A more accurate document search can be performed.

【0058】また、上記二つの実施形態においては、ブ
ーリアン検索方式およびコンセプト検索方式(非ブーリ
アン検索方式)の異なった検索方式により文書検索が実
行されていた。しかし、非ブーリアン検索方式(例え
ば、ベストマッチング検索方式およびコンセプト検索方
式)同士を用いて文書検索を実行するようにしてもよ
い。 図8に、ベストマッチング検索方式およびコンセ
プト検索方式を用いて文書検索を実行した場合の一次検
索結果の一例を示す。図8に示すように、非ブーリアン
検索方式同士を用いて文書検索を実行した場合、一次検
索結果は、文書名と関連度の両方によって表示される。
なお、この一次検索結果は、一旦RAM86内に記憶さ
れる。
Further, in the above two embodiments, the document search is executed by different search methods of the Boolean search method and the concept search method (non-Boolean search method). However, the document search may be performed using non-Boolean search methods (for example, the best matching search method and the concept search method). FIG. 8 shows an example of a primary search result when a document search is executed using the best matching search method and the concept search method. As shown in FIG. 8, when a document search is performed using the non-boolean search methods, the primary search result is displayed by both the document name and the relevance.
The primary search result is temporarily stored in the RAM 86.

【0059】つぎに、CPU72は、RAM86内に記
憶された一次検索結果を取り出し、文書検索結果同士を
論理演算式を用いて結合させる。なお、本実施形態にお
いては、論理演算式としてAND、ORだけでなく、関
連度平均も用いて一次検索結果同士を結合させ、二次検
索結果を抽出する。なお、ここでは、論理演算式として
ANDを用いていると仮定する。
Next, the CPU 72 takes out the primary search results stored in the RAM 86 and combines the document search results with each other using a logical operation expression. In the present embodiment, primary search results are combined with each other using not only AND and OR as logical operation expressions but also average relevance to extract secondary search results. Here, it is assumed that AND is used as the logical operation expression.

【0060】ここで、論理演算式であるANDは、min
(ベストマッチング検索方式による文書Xの関連度、コ
ンセプト検索方式による文書Xの関連度)で表わされ
る。すなわち、ANDにおいては、両検索方式によって
求めた各文書についての関連度のうち、値の高い方をそ
の文書の関連度とする。
Here, AND, which is a logical operation expression, is expressed by min
(Relevance of document X by the best matching search method, relevance of document X by the concept search method). That is, in the AND, the higher value of the relevance of each document obtained by both search methods is set as the relevance of the document.

【0061】図8に示す両検索方式の一次検索結果を、
ANDを用いて結合させる。ANDを用いて一次検索結
果同士を結合させると、文書番号2では81%が、文書
番号10では86%、文書番号nでは80%、文書番号
25では78%、文書番号28では77%、文書番号3
5では68%、文書番号41では39%及び文書番号5
3では64%が、それぞれの文書の関連度となる。
The primary search results of both search methods shown in FIG.
Combine using AND. When the primary search results are combined with each other using AND, 81% of document number 2 is 86% of document number 10, 80% of document number n, 78% of document number 25, 77% of document number 28, and 77% of document number 28. Number three
5 is 68%, document number 41 is 39% and document number 5
In the case of No. 3, 64% is the relevance of each document.

【0062】CPU72は、こうして求めた各文書の関
連度が、所定のしきい値以上であるか否かを判断し、し
きい値以上の関連度を有する文書だけを二次検索結果と
して抽出する。例えば、しきい値を70%と設定したと
仮定する。上記しきい値によって抽出した二次検索結果
内には、文書番号2、文書番号10、文書番号n、文書
番号25及び文書番号28の合計5つの文書が含まれる
(図9A)。
The CPU 72 determines whether or not the relevance of each document obtained in this way is equal to or greater than a predetermined threshold, and extracts only documents having a relevance equal to or greater than the threshold as a secondary search result. . For example, assume that the threshold is set to 70%. The secondary search result extracted by the above threshold value includes a total of five documents of document number 2, document number 10, document number n, document number 25, and document number 28 (FIG. 9A).

【0063】しかし、二次検索結果内の文書数は、所定
の範囲(7〜10)よりも少ないと判断され、CPU7
2は一次検索結果同士の結合を行なうための論理演算式
を、自動的にANDから他の論理演算式に変更する。そ
して、変更後の論理演算式を用いて、再び一次検索結果
同士を結合させる。
However, it is determined that the number of documents in the secondary search result is smaller than a predetermined range (7 to 10).
2 automatically changes the logical operation expression for combining the primary search results from AND to another logical operation expression. Then, the primary search results are combined again using the changed logical operation expression.

【0064】ここで、CPU72は、他の論理演算式と
して、関連度平均を選択する。ここで、論理演算式であ
る関連度平均は、ave(ベストマッチング検索方式によ
る文書Xの関連度、コンセプト検索方式による文書Xの
関連度)で表わされる。すなわち、関連度平均において
は、両検索方式によって求めた各文書についての関連度
の平均値をその文書の関連度とするのである。
Here, the CPU 72 selects the average degree of association as another logical operation expression. Here, the average degree of relevance, which is a logical operation expression, is represented by ave (relevance degree of document X by the best matching search method, relevance degree of document X by the concept search method). That is, in the relevance average, the average value of the relevance of each document obtained by both search methods is used as the relevance of the document.

【0065】図8に示す両検索方式の一次検索結果を、
関連度平均を用いて結合させる。関連度平均を用いて一
次検索結果を結合させると、文書番号2では80%が、
文書番号10では89%、文書番号nでは81.5%、
文書番号25では86.5%、文書番号28では78
%、文書番号35では72%、文書番号41では55%
及び文書番号53では67%が、それぞれの文書の関連
度となる。
The primary search results of both search methods shown in FIG.
Combine using average relevance. When the primary search results are combined using the average relevance, 80% of document numbers 2
89% for document number 10, 81.5% for document number n,
86.5% for document number 25, 78 for document number 28
%, 72% for document number 35, 55% for document number 41
In the document number 53, 67% is the relevance of each document.

【0066】上述の場合と同様に、CPU72は、各文
書の関連度が、所定のしきい値(70%)以上であるか
否かを判断し、しきい値以上の関連度を有する文書だけ
を二次検索結果として抽出する。この場合、しきい値に
よって抽出した二次検索結果内には、文書番号2、文書
番号10、文書番号n、文書番号25、文書番号28及
び文書番号35の合計6つの文書が含まれている(図9
B)。
As in the case described above, the CPU 72 determines whether or not the relevance of each document is equal to or greater than a predetermined threshold (70%). Is extracted as a secondary search result. In this case, the secondary search result extracted by the threshold value includes a total of six documents of document number 2, document number 10, document number n, document number 25, document number 28, and document number 35. (FIG. 9
B).

【0067】しかし、この二次検索結果内の文書数は、
所定の範囲(7〜10)よりも少ないと判断され、CP
U72は、論理演算式を自動的に関連度平均から他の論
理演算式に変更する。そして、変更後の論理演算式を用
いて、再び一次検索結果同士を結合させる。
However, the number of documents in this secondary search result is
It is determined that it is less than the predetermined range (7 to 10), and the CP
U72 automatically changes the logical operation expression from the average degree of association to another logical operation expression. Then, the primary search results are combined again using the changed logical operation expression.

【0068】なお、CPU72は、他の論理演算式とし
て、ORを選択し、上記と同様に図8に示す両検索方式
の一次検索結果を、ORを用いて結合させる。ORを用
いて一次検索結果を結合させると、文書番号2では89
%が、文書番号10では92%、文書番号nでは83
%、文書番号25では95%、文書番号28では79
%、文書番号35では76%、文書番号41では71%
及び文書番号53では70%が、それぞれの文書の関連
度となる。
Note that the CPU 72 selects OR as another logical operation expression, and combines the primary search results of the two search methods shown in FIG. When the primary search results are combined using OR, 89
% Is 92% for document number 10 and 83% for document number n.
%, 95% for document number 25, and 79 for document number 28
%, 76% for document number 35, 71% for document number 41
And in the document number 53, 70% is the relevance of each document.

【0069】ここでも、各文書の関連度が、上記しきい
値(70%)以上であるか否かを判断し、しきい値以上
の関連度を有する文書だけを二次検索結果として抽出す
る。
Also in this case, it is determined whether or not the relevance of each document is equal to or greater than the threshold value (70%), and only documents having a relevance equal to or greater than the threshold value are extracted as secondary search results. .

【0070】上記しきい値によって抽出した二次検索結
果内には、文書番号2、文書番号10、文書番号n、文
書番号25、文書番号28、文書番号35、文書番号4
1及び文書番号53の合計8つの文書が含まれている
(図9C)。CPU72は、こうして抽出された二次検
索結果内の文書数が所定の範囲(7〜10)内であると
判断すると、図9Cに示す検索結果が、そのままCRT
82上に表示されるとともに、プリンタ76から出力さ
れる。
The secondary search results extracted by the threshold value include document number 2, document number 10, document number n, document number 25, document number 28, document number 35, and document number 4
1 and the document number 53, that is, a total of eight documents (FIG. 9C). When the CPU 72 determines that the number of documents in the secondary search result thus extracted is within a predetermined range (7 to 10), the search result shown in FIG.
It is displayed on the display 82 and output from the printer 76.

【0071】なお、上記の場合とは逆に、当初の論理演
算式がOR又は関連度平均であるために二次検索結果内
の文書数が所定範囲よりも多い場合、CPU72は自動
的に論理演算式をOR又は関連度平均から関連度平均又
はANDに変更する。このように、CPU72は、二次
検索結果内の文書数が所定範囲外の場合、自動的に一次
検索結果同士の結合を行なうための論理演算式を変更す
る。
Note that, contrary to the above case, if the number of documents in the secondary search result is larger than a predetermined range because the original logical operation expression is OR or average relevance, the CPU 72 automatically sets the logical value. The arithmetic expression is changed from OR or average of relevance to average of relevance or AND. As described above, when the number of documents in the secondary search result is out of the predetermined range, the CPU 72 automatically changes the logical operation expression for combining the primary search results.

【0072】上述のように、AND、OR及び関連度平
均の三つの論理演算式を二次検索結果内の文書数に対応
して自動的に切り換えることによって、検索作業が容易
で、しかもより精度の高い文書検索を行なうことができ
る。
As described above, by automatically switching the three logical operation expressions of AND, OR and average of relevance according to the number of documents in the secondary search result, the search operation is easy and more accurate. High-quality document search.

【0073】なお、上記の各実施形態においては、検索
対象となる文書群を予めハードディスクに記憶し、被検
索文書群から所望の文書を検索するようにした。しか
し、検索作業が複雑にならず、検索精度が低下しないの
であれば文書検索システム外のデータベース等にアクセ
スして被検索文書群を検索するようにしてもよい。
In each of the above embodiments, a group of documents to be searched is stored in the hard disk in advance, and a desired document is searched from the group of documents to be searched. However, if the search operation is not complicated and the search accuracy does not decrease, a database or the like outside the document search system may be accessed to search the search target document group.

【0074】また、上記の各実施形態においては、抽出
された二次検索結果内の文書数が所定の範囲内であると
判断された場合、検索結果がCRT82で表示されると
ともにプリンタ76からも出力されていた。しかし、文
書検索システムの操作者が容易かつ明確に認識できるの
であれば、CRT82又はプリンタ76のいずれか片方
で表示又は出力してもよく、また他の表示手段、例えば
LCD上に表示させてもよい。
In each of the above embodiments, when it is determined that the number of documents in the extracted secondary search result is within a predetermined range, the search result is displayed on the CRT 82 and also transmitted from the printer 76. Had been output. However, if the operator of the document search system can easily and clearly recognize the information, it may be displayed or output on either the CRT 82 or the printer 76, or may be displayed on other display means, for example, on an LCD. Good.

【0075】さらに、上記の各実施形態における文書検
索方法は、ブーリアン検索方式およびコンセプト検索方
式の組合せ、又はベストマッチング検索方式及びコンセ
プト検索方式の組合せのいずれも2つの異なった方式を
用いていた。しかし、検索作業が複雑にならず、検索精
度が低下しないのであれば、2つの異なった方式でなく
3つ又はそれ以上の異なった文書検索方式を組み合わせ
て用いるようにしてもよい。また、非ブーリアン検索方
式としては、ベストマッチング検索方式及びコンセプト
検索方式以外の検索方式(例えば、ファジー検索方式)
を用いるようにしてもよい。
Further, in the document search method in each of the above embodiments, two different methods are used for each of the combination of the boolean search method and the concept search method, or the combination of the best matching search method and the concept search method. However, as long as the search operation is not complicated and the search accuracy does not decrease, three or more different document search methods may be used in combination instead of the two different methods. As the non-boolean search method, a search method other than the best matching search method and the concept search method (for example, a fuzzy search method)
May be used.

【0076】なお、上記の各実施形態においては、二次
検索結果内の文書の所定の範囲の数を7〜10としてい
た。しかし、被検索文書群内の文書数、キーワード、キ
ーセンテンスの数又は内容に応じて任意に設定すること
ができる。
In each of the above embodiments, the number of the predetermined range of the document in the secondary search result is set to 7 to 10. However, it can be set arbitrarily according to the number of documents, the number of keywords, the number of key sentences, or the contents in the group of documents to be searched.

【0077】また、上記の実施形態においては、キーワ
ード及びキーセンテンスの両方の数を同時に増加又は減
少させ(図4B、図4C参照)、変更後のキーワード等
を用いて再び文書検索を行なう場合について説明した。
しかし、キーワード及びキーセンテンスの数のそれぞれ
を別々に変更するようにしてもよい。
In the above-described embodiment, the case where both the number of keywords and the number of key sentences are simultaneously increased or decreased (see FIGS. 4B and 4C) and a document search is performed again using the changed keywords or the like. explained.
However, each of the number of keywords and the number of key sentences may be changed separately.

【0078】さらに、上記の実施形態においては、非ブ
ーリアン検索方式同士(ベストマッチング検索方式およ
びコンセプト検索方式)を用いて文書検索を実行した場
合だけに、上述の3つの論理演算式(AND、関連度平
均およびOR)を自動的に変更して一次検索結果を結合
させていた(図8、図9A〜9C参照)。しかし、ブー
リアン検索方式と非ブーリアン検索方式を組合せた場合
であっても、上記3つの論理演算式を用いることができ
る。ただし、この場合、ブーリアン検索方式による一次
検索結果に示す文書番号(図6A参照)の関連度を10
0%として、上述した一次検索結果の結合および二次検
索結果の抽出を行なう必要がある。
Further, in the above embodiment, only when the document search is executed using the non-Boolean search methods (the best matching search method and the concept search method), the above three logical operation expressions (AND, related (Degree average and OR) are automatically changed to combine the primary search results (see FIGS. 8 and 9A to 9C). However, even when the Boolean search method and the non-Boolean search method are combined, the above three logical operation expressions can be used. However, in this case, the relevance of the document number (see FIG. 6A) shown in the primary search result by the Boolean search method is set to 10
Assuming 0%, it is necessary to combine the primary search results and extract the secondary search results.

【0079】なお、上記の各実施形態においては、ブー
リアン検索方式を実行するために、キーワードを入力
し、非ブーリアン検索方式を行なうためにキーセンテン
スを入力していた。しかし、ブーリアン検索方式を実行
する場合であってもキーセンテンスのみを入力し、CP
U72によって特定の語(例えば、キーセンテンス中の
固有名詞等)のみを自動的にキーワードとして選択さ
せ、文書検索に用いるようにしてもよい。
In each of the above embodiments, a keyword is input to execute the Boolean search method, and a key sentence is input to execute the non-Boolean search method. However, even when executing the Boolean search method, only the key sentence is input and the CP
Only specific words (for example, proper nouns in key sentences) may be automatically selected as keywords by U72, and may be used for document search.

【0080】また、上述の各実施形態においては、CP
U72を用いて、図2に示す文書検索システム200の
各機能を実現した場合を例に説明したが、当該機能の一
部又は全部をハードウェアロジックにより実現するよう
構成してもよい。
In each of the above embodiments, the CP
Although the case where each function of the document search system 200 shown in FIG. 2 is realized using U72 has been described as an example, a part or all of the functions may be realized by hardware logic.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明に係る文書検索システムの一実施形態を
示すブロック図である。
FIG. 1 is a block diagram showing an embodiment of a document search system according to the present invention.

【図2】図1に示した文書検索システムを、CPUを用
いて実現した場合の構成を示すブロック図である。
FIG. 2 is a block diagram showing a configuration in a case where the document search system shown in FIG. 1 is realized using a CPU.

【図3】本発明に係る文書検索システムの動作を表わす
フローチャートである。
FIG. 3 is a flowchart showing the operation of the document search system according to the present invention.

【図4】RAM内に記憶された入力キーワード、入力キ
ーセンテンス及び検索に使用するキーワード、キーセン
テンスを示す図である。
FIG. 4 is a diagram showing input keywords, input key sentences, keywords used for search, and key sentences stored in a RAM.

【図5】ハードディスクに記憶された検索対象となる文
書群を示す図である。
FIG. 5 is a diagram showing a group of documents to be searched stored in a hard disk.

【図6】RAM内に記憶された一次検索結果及び一次検
索結果の結合によって抽出された二次検索結果を示す図
である。
FIG. 6 is a diagram showing primary search results stored in a RAM and secondary search results extracted by combining the primary search results.

【図7】本発明に係る文書検索システムの動作を表わす
フローチャートである。
FIG. 7 is a flowchart showing the operation of the document search system according to the present invention.

【図8】ベストマッチング検索方式およびコンセプト検
索方式を用いて文書検索を実行した場合の一次検索結果
を示す図である。
FIG. 8 is a diagram illustrating a primary search result when a document search is performed using a best matching search method and a concept search method.

【図9】図8に示した一次検索結果を結合させる論理演
算式をAND、関連度平均又はORに変更した場合の二
次検索結果の変化を示す図である。
9 is a diagram illustrating a change in a secondary search result when a logical operation expression for combining the primary search results illustrated in FIG. 8 is changed to AND, average relevance, or OR.

【符号の説明】[Explanation of symbols]

100・・・・・文書検索システム 100 ... Document retrieval system

───────────────────────────────────────────────────── フロントページの続き (72)発明者 ▲吉▼岡 美佳 京都府京都市右京区花園土堂町10番地 オ ムロン株式会社内 ──────────────────────────────────────────────────続 き Continuing on the front page (72) Inventor ▲ Yoshi ▼ Mika Oka 10 Odron-cho, Hanazono Todocho, Ukyo-ku, Kyoto, Kyoto Prefecture

Claims (7)

【特許請求の範囲】[Claims] 【請求項1】文書検索のための問い合わせ語又は問い合
わせ文を入力する問い合わせ入力手段、 入力された問い合わせ語又は問い合わせ文を用い、複数
の異なった検索方式に基づいて検索対象となる文書群か
ら文書検索を行ない、一次検索結果を出力する検索実行
手段、 出力された一次検索結果を論理演算式を用いて結合さ
せ、二次検索結果を抽出する結合抽出手段、 抽出された二次検索結果の文書数が所定の範囲にあるか
否かを判断し、所定範囲内にある場合には、出力命令を
出し、該文書数が所定範囲外である場合には、検索条件
を変更して前記検索実行手段に再検索を行なわせる判断
制御手段、 出力命令を受けて二次検索結果に関する情報を出力する
検索情報出力手段、 を備えたことを特徴とする文書検索システム。
1. A query input means for inputting a query word or a query sentence for a document search, a document from a document group to be searched based on a plurality of different search methods using the input query word or a query sentence. Search execution means for performing a search and outputting a primary search result; combining and extracting means for combining the output primary search results using a logical operation expression to extract a secondary search result; documents of the extracted secondary search results It is determined whether or not the number is within a predetermined range. If the number is within the predetermined range, an output instruction is issued. A document search system, comprising: a determination control unit for causing the unit to perform a search again; and a search information output unit for receiving information on an output command and outputting information on a secondary search result.
【請求項2】請求項1に係る文書検索システムにおい
て、 前記判断制御手段において変更される前記検索条件は、
前記結合抽出手段において用いられる一次検索結果の結
合方法に関する論理演算式であること、 を特徴とする文書検索システム。
2. The document search system according to claim 1, wherein the search condition changed by the determination control means is:
A logical operation expression relating to a method of combining the primary search results used in the combining and extracting means.
【請求項3】請求項1に係る文書検索システムにおい
て、 前記判断制御手段において変更される前記検索条件は、
前記問い合わせ入力手段において入力された前記問い合
せ語又は前記問い合せ文のうち、検索に使用される語又
は文の数であること、 を特徴とする文書検索システム。
3. The document search system according to claim 1, wherein the search condition changed by the determination control means is:
The number of words or sentences used in the search, out of the query word or the query sentence input by the query input means, a document search system.
【請求項4】文書検索のための問い合わせ語又は問い合
わせ文を入力し、 入力された問い合わせ語又は問い合わせ文を用い、複数
の異なった検索方式に基づいて検索対象となる文書群か
ら文書検索を行ない、一次検索結果を出力し、 出力された一次検索結果を論理演算式を用いて結合さ
せ、二次検索結果を抽出し、 抽出された二次検索結果の文書数が所定の範囲にあるか
否かを判断し、所定範囲内にある場合には、出力命令を
出し、該文書数が所定範囲外である場合には、検索条件
を変更して再検索を行なわせ、 出力命令を受けて二次検索結果に関する情報を出力する
こと、 を備えたことを特徴とする文書検索方法。
4. A query word or query sentence for document search is input, and a document search is performed from a group of documents to be searched based on a plurality of different search methods using the input query word or query sentence. Output the primary search results, combine the output primary search results using a logical operation expression, extract the secondary search results, and determine whether the number of documents of the extracted secondary search results is within a predetermined range. If the number of documents is out of the predetermined range, a search condition is changed and a search is performed again. Outputting information related to a next search result.
【請求項5】請求項4に係る文書検索方法において、 変更される前記検索条件は、一次検索結果の結合方法に
関する論理演算式であること、 を特徴とする文書検索方法。
5. The document search method according to claim 4, wherein the search condition to be changed is a logical operation expression relating to a method of combining primary search results.
【請求項6】請求項4に係る文書検索方法において、 変更される前記検索条件は、入力された前記問い合せ語
又は前記問い合せ文のうち、検索に使用される語又は文
の数であること、 を特徴とする文書検索方法。
6. The document search method according to claim 4, wherein the search condition to be changed is the number of words or sentences used in the search, among the input query words or query sentences. A document search method characterized by the following.
【請求項7】コンピュータにより実行可能なプログラム
を記憶したコンピュータ可読の記憶媒体であって、前記
プログラムは請求項1ないし請求項6のいずれかの文書
検索システム又は文書検索方法を実現するものであるこ
と、 を特徴とする記憶媒体。
7. A computer-readable storage medium storing a computer-executable program, wherein the program realizes the document search system or the document search method according to any one of claims 1 to 6. A storage medium characterized by the following.
JP8304372A 1996-11-15 1996-11-15 Document retrieval system/method Pending JPH10143530A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8304372A JPH10143530A (en) 1996-11-15 1996-11-15 Document retrieval system/method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8304372A JPH10143530A (en) 1996-11-15 1996-11-15 Document retrieval system/method

Publications (1)

Publication Number Publication Date
JPH10143530A true JPH10143530A (en) 1998-05-29

Family

ID=17932234

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8304372A Pending JPH10143530A (en) 1996-11-15 1996-11-15 Document retrieval system/method

Country Status (1)

Country Link
JP (1) JPH10143530A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000076294A (en) * 1998-09-02 2000-03-14 Ntt Data Corp Data retrieval method, device therefor and record medium
US6654742B1 (en) 1999-02-12 2003-11-25 International Business Machines Corporation Method and system for document collection final search result by arithmetical operations between search results sorted by multiple ranking metrics
KR20160044278A (en) * 2014-10-15 2016-04-25 주식회사 케이티 Method for making theme of contents, apparatus and system
JP2017173910A (en) * 2016-03-18 2017-09-28 Jcc株式会社 Search server, search system, search information distribution system, search program, and search information distribution program

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000076294A (en) * 1998-09-02 2000-03-14 Ntt Data Corp Data retrieval method, device therefor and record medium
US6654742B1 (en) 1999-02-12 2003-11-25 International Business Machines Corporation Method and system for document collection final search result by arithmetical operations between search results sorted by multiple ranking metrics
KR20160044278A (en) * 2014-10-15 2016-04-25 주식회사 케이티 Method for making theme of contents, apparatus and system
JP2017173910A (en) * 2016-03-18 2017-09-28 Jcc株式会社 Search server, search system, search information distribution system, search program, and search information distribution program

Similar Documents

Publication Publication Date Title
JP5740029B2 (en) System and method for improving interactive search queries
US7440947B2 (en) System and method for identifying query-relevant keywords in documents with latent semantic analysis
JP3132738B2 (en) Text search method
US6055528A (en) Method for cross-linguistic document retrieval
US7111237B2 (en) Blinking annotation callouts highlighting cross language search results
US5907840A (en) Overlapping subdocuments in a vector space search process
JPH10232883A (en) Document retrieval system coping with many languages
WO2005041068A1 (en) System and method for question-reply type document search
JPH06309362A (en) Information retrieving method
US6505198B2 (en) Sort system for text retrieval
JP2000200281A (en) Device and method for information retrieval and recording medium where information retrieval program is recorded
JP4065346B2 (en) Method for expanding keyword using co-occurrence between words, and computer-readable recording medium recording program for causing computer to execute each step of the method
JP4935243B2 (en) Search program, information search device, and information search method
JPH1145267A (en) Document retrieval device and computer readable recording medium recorded with program for functioning computer as the device
JPH09198395A (en) Document retrieval device
JPH10289240A (en) Image processor and its control method
JPH10143530A (en) Document retrieval system/method
JP2850952B2 (en) Document search method and apparatus
JPH0773197A (en) Supporting system for preparing different notation word dictionary
JPH07134720A (en) Method and device for presenting relative information in sentence preparing system
JP2002132789A (en) Document retrieving method
JP3135422B2 (en) Document retrieval apparatus and method
JP3558854B2 (en) Data retrieval device and computer-readable recording medium
JP3177593B2 (en) Term narrowing search method and computer readable recording medium recording a program for causing a computer to execute each step of the method
JPH07210565A (en) Method and device for retrieving information