JP2005173847A - Information retrieval device, information retrieval method, program, and recording medium recorded with the program - Google Patents

Information retrieval device, information retrieval method, program, and recording medium recorded with the program Download PDF

Info

Publication number
JP2005173847A
JP2005173847A JP2003411145A JP2003411145A JP2005173847A JP 2005173847 A JP2005173847 A JP 2005173847A JP 2003411145 A JP2003411145 A JP 2003411145A JP 2003411145 A JP2003411145 A JP 2003411145A JP 2005173847 A JP2005173847 A JP 2005173847A
Authority
JP
Japan
Prior art keywords
search
keyword
unit
evaluation
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003411145A
Other languages
Japanese (ja)
Inventor
Hisashi Hashimoto
尚志 橋本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2003411145A priority Critical patent/JP2005173847A/en
Publication of JP2005173847A publication Critical patent/JP2005173847A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To enable a retriever to obtain target information without repeating trial and an error for a retrieved sentence by evaluating three points which are the precision of a retrieved sentence, the quality of a document to be retrieved, and a retrieval result, and by repeating evaluations, retrievals, and conditional expression changes until the information of high determinacy is obtained. <P>SOLUTION: THe information retrieval device is equipped with a retrieval keyword generation part 12, a retrieval keyword evaluation part 13 which evaluates the availability of a retrieval keyword, a retrieved document evaluation part 14 which evaluates the availability of the document to be retrieved, a retrieval conditional expression generation part 15 which generates a retrieval conditional expression based upon the retrieval keyword and the evaluation of the document to be retrieved, a retrieval part 16 which performs retrieval based upon the generated retrieval conditional expression, and a retrieval result evaluation part which evaluates the availability of a retrieval result. The device is equipped with a function of repeating the retrieval while releasing the validity of the retrieval keyword and the retrieval conditional expression until a retrieval result having a specified hit rate when evaluated is obtained. <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

本発明は、検索者が検索文の試行錯誤を繰り返すことなく、目的の情報を入手することが可能な情報検索装置、情報検索方法及びプログラムに関する。   The present invention relates to an information search apparatus, an information search method, and a program that enable a searcher to obtain target information without repeating trial and error of a search sentence.


以下に、情報検索装置の従来例を説明する。

Hereinafter, a conventional example of an information search apparatus will be described.

(1) :従来例1
以下、「キーワードならびに自然文による情報検索」の例を従来例1として説明する。
(1): Conventional example 1
Hereinafter, an example of “information search using keywords and natural sentences” will be described as Conventional Example 1.

一般に利用されるキーワードならびに自然文による情報検索では、目的の情報に含まれると思われるキーワードならびに記述表現を推測、その推測から検索文を指定、検索を実施する。そして、その結果から目的の情報が見つからない場合、その結果を踏まえて、検索文を変更(キーワードの記述表現を変更もしくはキーワードそのものの変更や追加、削除)、再度、検索を実施する。   In information retrieval using commonly used keywords and natural sentences, a keyword and descriptive expression that are considered to be included in the target information are inferred, and a retrieval sentence is designated based on the inference and retrieval is performed. If the target information is not found from the result, the search sentence is changed (change the keyword description expression or the keyword itself is changed, added, or deleted) based on the result, and the search is performed again.

(2) :従来例2
以下、「シソーラス技術を用いた情報検索」を従来例2として説明する。一般に利用されているシソーラス技術を用いた情報検索では、目的の情報に含まれると思われるキーワードならびにそのキーワードの記述表現を推測、その推測から検索文を指定、検索を実施する。ただしその際、検索文で指定されたキーワードは、シソーラス技術により類義語や同義語、類似記述表現が追加された上で、検索が実施される。
(2): Conventional example 2
Hereinafter, “information retrieval using thesaurus technology” will be described as Conventional Example 2. In information retrieval using a commonly used thesaurus technology, a keyword that is considered to be included in target information and a description expression of the keyword are estimated, and a search sentence is designated from the estimation and a search is performed. However, at that time, the keyword specified in the search sentence is searched after synonyms, synonyms, and similar description expressions are added by a thesaurus technique.

(3) :従来例3
以下、「検索条件式緩和による段階情報検索」を従来例3として説明する。検索条件式緩和による段階情報検索では、検索キーワードや検索対象文書を評価せずに、検索結果のみの評価によって、検索条件を緩やかにしていくのが一般的である。
(3): Conventional example 3
Hereinafter, “stage information retrieval by relaxing the search condition formula” will be described as Conventional Example 3. In the stage information search by relaxing the search condition formula, the search condition is generally relaxed by evaluating only the search result without evaluating the search keyword or the search target document.

(4) :従来例4
以下、特許文献1を従来例4として説明する。従来例4は、詳細に指定したために、かえって該当する情報が得られなかった場合でも、利用者が検索条件を再指定することなく、必要とする情報を含む期待数の検索結果をデータベースから抽出することを可能とする情報検索装置に関するものである。
(4): Conventional example 4
Hereinafter, Patent Document 1 will be described as Conventional Example 4. Conventional example 4 is specified in detail, and even if the corresponding information is not obtained, the search result of the expected number including the necessary information is extracted from the database without the user respecifying the search condition. The present invention relates to an information retrieval apparatus that can perform the above.

このため、前記情報検索装置は、条件入力部で入力された検索条件を用いて、検索処理部は検索条件に該当する情報をデータベースから検索する。該当する情報が存在しなければ、検索条件を変更して再検索処理を行い、予め定めた期待数の検索結果を得るまで繰り返す。   For this reason, the information search device uses the search condition input by the condition input unit, and the search processing unit searches the database for information corresponding to the search condition. If the corresponding information does not exist, the search condition is changed and the re-search process is performed, and the process is repeated until a predetermined expected number of search results are obtained.

(5) :従来例5
以下、特許文献2を従来例5として説明する。従来例5は、検索結果をチェックしながら、検索条件を順次加えていったり、上位概念を用いて再試行するなどして段階的に検索を行う情報検索方式に関するものである。
(5): Conventional example 5
Hereinafter, Patent Document 2 will be described as Conventional Example 5. Conventional example 5 relates to an information search method in which search conditions are sequentially added while checking search results, or search is performed in stages by retrying using a superordinate concept.

そして、前記情報検索方式では、段階的にキーワードを選択して検索結果を絞り込んでいき、また0件であれば上位概念を利用して条件を緩めるなどして検索を進めていくので、検索失敗の確率が少なくなり、また条件が緩すぎたために検索結果に余分なデータが多く含まれてしまうということがなくなる。また、検索履歴が保存されるので、どのような条件で検索に失敗したのかを容易に知ることができるというものである。   In the information search method, the search results are narrowed down by selecting keywords step by step, and if the search results are zero, the search is advanced by relaxing the conditions by using the superordinate concept. And the search result does not contain a lot of extra data because the condition is too loose. In addition, since the search history is stored, it is possible to easily know under what conditions the search has failed.

(6) :従来例6
以下、特許文献3を従来例6として説明する。従来例6は、論理構造の異なる複数の文書に対する検索においても、高い再現率で検索可能にする構造化文書検索装置に関するものである。この構造化文書検索装置では、検索式が入力されると、検索式生成手段が検索式に示された検索条件を段階的に緩やかな条件に書き換え条件緩和検索式を生成する。
(6): Conventional example 6
Hereinafter, Patent Document 3 will be described as Conventional Example 6. Conventional Example 6 relates to a structured document search apparatus that enables a search with a high reproducibility even in a search for a plurality of documents having different logical structures. In this structured document search apparatus, when a search expression is input, the search expression generation means generates a rewrite condition relaxation search expression by gradually changing the search condition indicated in the search expression into a gradually gradual condition.

そして、確度計算手段は各条件緩和検索式を生成するのに行った書き換えの内容に応じて、条件緩和検索式による検索結果の確からしさを示す確度を計算する。検索実行手段は入力された検索式と検索式生成手段により生成された条件緩和検索式のそれぞれにより、文書保持手段の構造化文書を対象として検索を実行する。検索結果併合手段は検索実行手段による検索結果を、確度の高い順に並べて併合する。これにより、、正しく論理構造が作成されていない文書も検索することができ、再現率が向上するというものである。
特開2002−304414(P2002−304414A) 特開平2−189680号公報 特開平10−198697号公報
Then, the accuracy calculation means calculates the accuracy indicating the probability of the search result based on the conditional relaxation search formula in accordance with the contents of the rewriting performed to generate each conditional relaxation search formula. The search execution means executes a search for the structured document of the document holding means based on the input search expression and the condition relaxation search expression generated by the search expression generation means. The search result merging means arranges and merges the search results obtained by the search execution means in descending order of accuracy. As a result, it is possible to search for documents in which the logical structure is not correctly created, and the reproduction rate is improved.
JP 2002-304414 (P2002-304414A) JP-A-2-189680 JP-A-10-198697


(1) :前記従来例1では、目的の情報が見つかるまで、検索文の変更(キーワードの推測)、検索実施、検索結果の確認といった試行錯誤の繰り返しとなるのだが、検索文で指定されたキーワードの記述表現と目的の情報の記述表現が一致しない場合、目的の情報が検索されない。また、キーワードならびに自然文による情報検索では、検索者は目的の情報で使用されている記述表現を探し当てるための試行錯誤に手間がかかってしまう。

(1): In the above conventional example 1, until the target information is found, it is repeated trial and error such as change of search text (keyword guess), search execution, and check of search result. If the description expression of the keyword does not match the description expression of the target information, the target information is not retrieved. Further, in the information search using keywords and natural sentences, the searcher takes time and effort to find the descriptive expression used in the target information.

(2) :前記従来例2では、キーワードと目的の情報との記述表現の差異による検索漏れは少なくなるが、同時に、検索者が意図しない情報までも検索されることになり、目的の情報が埋もれて見つかり難くなってしまう。すなわち、シソーラス技術を用いた情報検索では、検索者は意図しない情報がヒットするために目的の情報が埋もれてしまって見つけられない。   (2): In the conventional example 2, the omission of search due to the difference in the description expression between the keyword and the target information is reduced, but at the same time, information not intended by the searcher is also searched, and the target information is It will be buried and difficult to find. That is, in the information search using the thesaurus technology, the searcher hits unintended information and the target information is buried and cannot be found.

(3) :前記従来例3では、検索ヒット件数の確保が優先となり、検索者が意図しない情報までも検索されることになり、目的の情報が埋もれて見つかり難くなってしまう。すなわち、段階検索を用いた情報検索では、検索者は意図しない情報がヒットするために目的の情報が埋もれてしまって見つけられない。   (3) In Prior Art 3, priority is given to securing the number of search hits, and even information that is not intended by the searcher is searched, making it difficult to find the target information. That is, in the information search using the step search, the searcher hits unintended information, and the target information is buried and cannot be found.

(4) :前記前記従来例4、5、6は、本発明の参考技術程度のものであり、本発明のように「検索者が検索文の試行錯誤を繰り返すことなく、目的の情報を入手する」技術とは全く異なっている。   (4): The above-mentioned conventional examples 4, 5, and 6 are about the level of the reference technology of the present invention. As in the present invention, “the searcher obtains the target information without repeating trial and error of the search sentence. It's completely different from “to do”.

本発明は、検索文の精度、検索対象となる文書の品質、検索結果という3点を評価し、確度の高い情報が入手できるまで、評価、検索、条件式変更を繰り返すことにより、検索者が検索文の試行錯誤を繰り返すことなく目的の情報を入手できるようにすることを目的とする。   The present invention evaluates three points: the accuracy of a search sentence, the quality of a document to be searched, and a search result, and repeats the evaluation, search, and conditional expression change until the highly accurate information is obtained. The purpose is to make it possible to obtain the target information without repeating trial and error in the search sentence.


本発明は前記の目的を達成するため、次のように構成した。

In order to achieve the above object, the present invention is configured as follows.

(1) :入力されたキーワード及び文章を基に検索キーワードを生成する検索キーワード生成部と、前記検索キーワード生成部で生成された検索キーワードの有用度(精度)を評価する検索キーワード評価部と、検索対象文書の有用度(品質)を評価する検索対象文書評価部と、前記検索キーワード及び検索対象文書の評価に基づいて検索条件式を生成する検索条件式生成部と、前記検索条件式生成部で生成された検索条件式に基づき検索を実行する検索部と、前記検索部による検索結果の有用度(妥当性)を評価する検索結果評価部とを有し、前記検索条件式生成部、検索部及び検索結果評価部とにより、前記検索結果の評価で特定のヒット率が得られるまで、検索キーワードの妥当性並びに検索条件式を緩めながら検索を繰り返すことで、確度の高い検索結果を得る機能を備えている。   (1): a search keyword generation unit that generates a search keyword based on the input keyword and sentence, a search keyword evaluation unit that evaluates the usefulness (accuracy) of the search keyword generated by the search keyword generation unit, A search target document evaluation unit that evaluates the usefulness (quality) of the search target document, a search condition formula generation unit that generates a search condition formula based on the search keyword and the evaluation of the search target document, and the search condition formula generation unit A search unit that executes a search based on the search condition expression generated in step 1; and a search result evaluation unit that evaluates the usefulness (relevance) of the search result by the search unit. And the search result evaluation unit repeat the search while relaxing the validity of the search keyword and the search condition expression until a specific hit rate is obtained in the evaluation of the search result. It has a function to obtain high-quality search results.

(2) :前記(1) の情報検索装置において、前記検索結果評価部の評価で特定のヒット率が得られたら、検索結果評価部で得られた結果一覧を評価する結果一覧評価部と、前記結果一覧評価部により評価された結果一覧を、表示装置の画面に表示する結果表示部とを備えていることを特徴とする。   (2): In the information search device of (1), when a specific hit rate is obtained by the evaluation of the search result evaluation unit, a result list evaluation unit that evaluates the result list obtained by the search result evaluation unit; And a result display unit for displaying the result list evaluated by the result list evaluation unit on a screen of a display device.

(3) :入力されたキーワード及び文章を基に検索キーワードを生成する検索キーワード生成手順と、前記検索キーワード生成手順で生成された検索キーワードの有用度(精度)を評価する検索キーワード評価手順と、検索対象文書の有用度(品質)を評価する検索対象文書評価手順と、前記検索キーワード及び検索対象文書の評価に基づいて検索条件式を生成する検索条件式生成手順と、前記検索条件式生成手順で生成された検索条件式に基づき検索を実行する検索手順と、前記検索手順による検索結果の有用度(妥当性)を評価する検索結果評価手順とを有し、前記検索条件式生成手順、検索手順及び検索結果評価手順とにより、前記検索結果の評価で特定のヒット率が得られるまで、検索キーワードの妥当性並びに検索条件式を緩めながら検索を繰り返すことで、確度の高い検索結果を得ることを特徴とする。   (3): a search keyword generation procedure for generating a search keyword based on the input keyword and sentence, a search keyword evaluation procedure for evaluating the usefulness (accuracy) of the search keyword generated in the search keyword generation procedure, A search target document evaluation procedure for evaluating the usefulness (quality) of the search target document, a search condition formula generation procedure for generating a search condition formula based on the search keyword and the evaluation of the search target document, and the search condition formula generation procedure A search procedure for executing a search based on the search condition expression generated in step (b), and a search result evaluation procedure for evaluating the usefulness (validity) of the search result obtained by the search procedure. While relaxing the validity of the search keyword and the search condition expression until a specific hit rate is obtained in the evaluation of the search result by the procedure and the search result evaluation procedure A search result with high accuracy is obtained by repeating the search.

(作用)
図1は本発明の原理説明図である。以下、図1を参照しながら、前記構成の作用を説明する。
(Function)
FIG. 1 is a diagram illustrating the principle of the present invention. The operation of the above configuration will be described below with reference to FIG.

検索キーワード生成部12は、入力取得部11により取得したキーワード及び文章に基づき検索キーワードを生成し、検索キーワード評価部13は、検索キーワード生成部12で生成された検索キーワードの有用度(精度)を評価する。次に、検索対象文書評価部14は、検索対象文書の有用度(品質)を評価する。   The search keyword generation unit 12 generates a search keyword based on the keyword and text acquired by the input acquisition unit 11, and the search keyword evaluation unit 13 determines the usefulness (accuracy) of the search keyword generated by the search keyword generation unit 12. evaluate. Next, the search target document evaluation unit 14 evaluates the usefulness (quality) of the search target document.

そして、検索条件式生成部15は、検索キーワード及び検索対象文書の評価結果に基づいて検索条件式を生成し、検索部16は前記検索条件式生成部15で生成された検索条件式に基づき検索を実行する。また、検索結果評価部17は、検索部16による検索結果の有用度(妥当性)を評価する。   The search condition expression generation unit 15 generates a search condition expression based on the search keyword and the evaluation result of the search target document, and the search unit 16 searches based on the search condition expression generated by the search condition expression generation unit 15. Execute. In addition, the search result evaluation unit 17 evaluates the usefulness (relevance) of the search result obtained by the search unit 16.

この場合、前記検索条件式生成部15、検索部16及び検索結果評価部17とにより、検索結果の評価で特定のヒット率が得られるまで、検索キーワードの妥当性並びに検索条件式を緩めながら検索を繰り返すことで、確度の高い検索結果を得る。   In this case, the search condition expression generation unit 15, the search unit 16, and the search result evaluation unit 17 perform a search while relaxing the validity of the search keyword and the search condition expression until a specific hit rate is obtained in the evaluation of the search result. By repeating the above, a highly accurate search result is obtained.

このようにして、検索文の有用度(精度)、検索対象となる文書の有用度(検索対象となる文書の品質)、検索結果の有用度(妥当性)の3点を評価し、確度の高い情報が入手できるまで、評価、検索、条件式変更を繰り返すことにより、検索者が検索文の試行錯誤を繰り返すことなく目的の情報を入手することが可能になる。   In this way, the three points of the usefulness (accuracy) of the search sentence, the usefulness of the document to be searched (the quality of the document to be searched), and the usefulness (validity) of the search result are evaluated. By repeating the evaluation, search, and conditional expression change until high information can be obtained, the searcher can obtain the target information without repeating trial and error of the search sentence.

すなわち、検索文の精度、検索対象となる文書の品質、検索結果という3点を評価し、確度の高い情報が入手できるまで、評価、検索、条件式変更を繰り返すことにより、検索者が検索文の試行錯誤を繰り返すことなく目的の情報を入手できる。   In other words, the searcher evaluates the following three points: the accuracy of the search sentence, the quality of the document to be searched, and the search result, and repeats the evaluation, search, and conditional expression change until the highly accurate information is available. The target information can be obtained without repeating trial and error.


請求項1乃至5によれば次のような効果がある。

According to the first to fifth aspects, the following effects can be obtained.

(1) :検索者が、目的の情報を検索するために検索文の試行錯誤を繰り返すことなく、検索文の有用度(精度)、すなわち、一般的に使用されているキーワードの適切な指定、探したい情報に関する十分な記述量と、検索対象となる情報の有用度(検索対象となる文書の品質)、すなわち、一般的に使用されている適切な表記、情報に関する十分な記述量と、検索結果に応じて自律的に適切な検索条件式変更、検索が繰り返された結果を得ることができるので、実用的に十分有用である。   (1): Searcher's usefulness (accuracy), that is, appropriate specification of commonly used keywords, without repeated trial and error of search sentences to search for target information, A sufficient amount of description about the information to be searched and the usefulness of the information to be searched (the quality of the document to be searched), that is, a proper notation generally used, a sufficient amount of description about the information, and a search Since it is possible to obtain a result of repeated appropriate search condition expression changes and searches autonomously according to the result, it is sufficiently useful practically.

(2) :検索者の試行錯誤による手間を省き、検索者にとってより適切と思われる検索結果を得ると共に、検索キーワード(文)ならびに検索対象文書の評価による検索条件式の生成により、必要以上の検索条件の緩和を抑制し、検索者にとってより適切と思われる検索結果をヒット件数をできるだけ増やさずに得ることが可能である。   (2): Saves the searcher's trial and error, obtains search results that are more appropriate for the searcher, and generates search condition expressions by evaluating the search keywords (sentences) and search target documents. It is possible to suppress the relaxation of search conditions and obtain search results that are more appropriate for the searcher without increasing the number of hits as much as possible.

(3) :検索文の精度、検索対象となる文書の品質、検索結果という3点を評価し、確度の高い情報が入手できるまで、評価、検索、条件式変更を繰り返すことにより、検索者が検索文の試行錯誤を繰り返すことなく目的の情報を入手できる。   (3): The searcher evaluates the following three points: the accuracy of the search sentence, the quality of the document to be searched, and the search results, and repeats the evaluation, search, and conditional expression change until the highly accurate information is available. The target information can be obtained without repeating trial and error in the search sentence.

§1:システム構成例の説明
図2は情報検索装置の構成図である。以下、図2に基づいて情報検索装置の構成例を説明する。この情報検索装置は、情報検索装置本体1と、該情報検索装置1に接続されたデータ入力部2、表示装置3、外部記憶装置4等で構成されている。そして、前記情報検索装置本体1には、入力取得部11、検索キーワード生成部12、検索キーワード評価部13、検索対象文書評価部14、検索条件式生成部15、検索部16、検索結果評価部17、結果一覧評価部18、結果表示部19、ワークメモリ20等が設けてある。
§1: Description of system configuration example FIG. 2 is a configuration diagram of an information search apparatus. Hereinafter, a configuration example of the information search apparatus will be described with reference to FIG. This information retrieval apparatus includes an information retrieval apparatus main body 1, a data input unit 2 connected to the information retrieval apparatus 1, a display device 3, an external storage device 4, and the like. The information search apparatus main body 1 includes an input acquisition unit 11, a search keyword generation unit 12, a search keyword evaluation unit 13, a search target document evaluation unit 14, a search condition expression generation unit 15, a search unit 16, and a search result evaluation unit. 17, a result list evaluation unit 18, a result display unit 19, a work memory 20, and the like are provided.

情報検索装置本体1は、パーソナルコンピュータ、ワークステーション、その他の各種コンピュータの本体で構成されている。データ入力部2は、入力キーワードや検索文等のデータを入力する手段(例えば、キーボード)で構成されている。表示装置3は各種情報を表示するための表示画面を有する装置(ディスプレイ装置)である。外部記憶装置4は、磁気ディスク装置(ハードディスク装置)や光ディスク装置等で構成されている。   The information retrieval apparatus body 1 is composed of a personal computer, a workstation, and other various computer bodies. The data input unit 2 is configured by means (for example, a keyboard) for inputting data such as input keywords and search sentences. The display device 3 is a device (display device) having a display screen for displaying various information. The external storage device 4 includes a magnetic disk device (hard disk device), an optical disk device, and the like.

また、入力取得部11は、データ入力部2から入力したデータ(検索者の入力したキーワード/検索文等)を取得するものである。検索キーワード生成部12は、入力データに基づき検索キーワードを生成するものである。例えば、キーワードの場合、入力されたキーワードそのまま(区切り記号がある場合には切り出し)、検索文(文章)の場合には、辞書によるキーワード切り出しを行う。   The input acquisition unit 11 acquires data input from the data input unit 2 (keyword / search text input by the searcher). The search keyword generation unit 12 generates a search keyword based on input data. For example, in the case of a keyword, the input keyword is used as it is (cut out if there is a delimiter), and in the case of a search sentence (sentence), the keyword is cut out using a dictionary.

検索キーワード評価部13は、検索キーワード生成部12によって生成された検索キーワードのキーワードスコア(表記品質、品詞など)を算出、また、正式表現や言い換え表現などの追加キーワードをそれぞれのキーワードスコアと共に付与するものである。例えば次のようにする。   The search keyword evaluation unit 13 calculates a keyword score (notation quality, part of speech, etc.) of the search keyword generated by the search keyword generation unit 12, and assigns additional keywords such as formal expressions and paraphrasing expressions together with the respective keyword scores. Is. For example:

例1):
表記品質によるスコア 指定されたキーワード>正式表現>言い換え>関連
品詞によるスコア 名詞>動詞>助詞
検索対象文書評価部14は、検索キーワード生成部12によって生成された検索キーワード並びに検索キーワード評価部13により付与された追加キーワードの検索対象文書中での組み合わせスコア(キーワードスコア、頻度、出現順、近接度など)を算出、組み合わせが複数ある場合には、それぞれの組み合わせのスコアを算出することで、検索対象文書の評価を行うものである。
Example 1):
Score by notation quality Specified keyword> Formal expression>Paraphrase> Related Score by part of speech Noun>Verb> Participation The search target document evaluator 14 assigns the search keyword generated by the search keyword generator 12 and the search keyword evaluator 13 The combination score (keyword score, frequency, order of appearance, proximity, etc.) of the added additional keyword in the search target document is calculated. If there are multiple combinations, the search score is calculated by calculating the score of each combination. It evaluates documents.

検索条件式生成部15は、検索対象文書評価部14で最も組み合わせスコアの高い組み合わせに基づいて検索条件式を作成(生成)するものである。検索部16は前記生成された検索条件式に基づいて検索を実行するものである。検索結果評価部17は、検索部16で検索した結果の合計スコア(件数、文書個々のスコアなどの総計)を算出、特定の値を満たすまで、検索条件式生成部15、検索部16、検索結果評価部17の各処理を繰り返す。なお、前記繰り返す意図は、試行錯誤の代行その1(表記のゆれによる検索漏れを防ぐため)である。   The search condition expression generation unit 15 creates (generates) a search condition expression based on the combination having the highest combination score in the search target document evaluation unit 14. The search unit 16 executes a search based on the generated search condition formula. The search result evaluation unit 17 calculates a total score (total number of cases, scores of individual documents, etc.) of the results searched by the search unit 16, and until the specific value is satisfied, the search condition expression generation unit 15, the search unit 16, and the search Each process of the result evaluation unit 17 is repeated. The intention to repeat is a trial-and-error proxy No. 1 (to prevent a search omission due to fluctuations in notation).

結果一覧評価部18は、検索部16で得られた検索結果に対し、順位付け/除外のために文書個々の一覧スコア(入力されたキーワード/検索文との一致度、表記のゆれによる重複など一覧中でのポイント)を算出し、その結果に基づいて検索結果一覧から不要な文書を除外後、順位付けを行うものである。なお、前記除外、順位付けを行う意図は、試行錯誤その2(重複の除外、有効と思われる文書を上位に表示することにより、多数ヒットによる参照漏れを防止するため)である。   The result list evaluation unit 18 uses the search results obtained by the search unit 16 to rank / exclude the individual list scores of documents (the degree of coincidence with input keywords / search sentences, duplication due to fluctuations in notation, etc.) Points in the list) are calculated, and based on the result, unnecessary documents are excluded from the search result list, and then ranking is performed. The intention to perform the exclusion and ranking is trial and error (2) (in order to prevent reference omission due to multiple hits by eliminating duplicates and displaying documents that are considered to be valid).

結果表示部19は、結果一覧評価部18で適正と評価された検索結果一覧を表示装置3の画面に表示するものである。ワークメモリ20は前記各部がワーク用として使用するものである。   The result display unit 19 displays the search result list evaluated as appropriate by the result list evaluation unit 18 on the screen of the display device 3. The work memory 20 is used by each of the above parts for work.

§2:情報検索装置の詳細な構成と機能の説明
図3は情報検索装置の詳細な構成と機能の説明図である。以下、図3に基づいて、図2に示した情報検索装置の各部の詳細な構成と機能を説明する。
§2: Detailed Configuration and Function Description of Information Search Device FIG. 3 is an explanatory diagram of the detailed configuration and function of the information search device. Hereinafter, based on FIG. 3, the detailed structure and function of each part of the information search device shown in FIG. 2 will be described.

入力取得部11は入力文字列取得プログラム31により入力取得処理を行う。検索キーワード生成部12は語句切出プログラム32により切り出し辞書33から語句を切り出すことで検索キーワードの生成処理を行う。検索キーワード評価部13はキーワード評価プログラム34によりキーワードスコアデータベース35を検索しながら検索キーワード評価処理を行う。   The input acquisition unit 11 performs input acquisition processing by the input character string acquisition program 31. The search keyword generation unit 12 performs search keyword generation processing by cutting out words from the cutout dictionary 33 by the word cutout program 32. The search keyword evaluation unit 13 performs a search keyword evaluation process while searching the keyword score database 35 by the keyword evaluation program 34.

検索対象文書評価部14は文書評価プログラム36により文書データベース37の文書を検索しながら検索対象文書評価処理を行う。検索条件式生成部15は条件式作成プログラム38により検索条件式生成処理を行う。検索部16は検索実行プログラム39により検索インデックス40を検索する。   The search target document evaluation unit 14 performs a search target document evaluation process while searching for documents in the document database 37 using the document evaluation program 36. The search condition expression generation unit 15 performs search condition expression generation processing by the conditional expression creation program 38. The search unit 16 searches the search index 40 by the search execution program 39.

検索結果評価部17は結果評価プログラム41により検索結果評価処理を行う。結果一覧評価部18は一覧評価プログラム42により一覧評価処理を行い、一覧作成プログラム43が一覧(一覧データ)を作成する。結果表示部19は一覧表示プログラム44により結果表示処理を行うことにより、表示装置3(図2参照)の画面に一覧表示を行う。   The search result evaluation unit 17 performs search result evaluation processing by the result evaluation program 41. The result list evaluation unit 18 performs list evaluation processing by the list evaluation program 42, and the list creation program 43 creates a list (list data). The result display unit 19 displays a list on the screen of the display device 3 (see FIG. 2) by performing a result display process by the list display program 44.

前記処理を行うに際し、前記入力文字列取得プログラム31、語句切出プログラム32、切り出し辞書33、キーワード評価プログラム34、キーワードスコアデータベース35、文書評価プログラム36、文書データベース37、条件式作成プログラム38、検索実行プログラム39、検索インデックス40、結果評価プログラム41、一覧評価プログラム42、一覧作成プログラム43、一覧表示プログラム44は、全て外部記憶装置4(図2参照)の記憶媒体に記憶させておき、必要に応じて前記各部が取り出して処理を行うものである。   In performing the processing, the input character string acquisition program 31, the phrase extraction program 32, the extraction dictionary 33, the keyword evaluation program 34, the keyword score database 35, the document evaluation program 36, the document database 37, the conditional expression creation program 38, the search The execution program 39, the search index 40, the result evaluation program 41, the list evaluation program 42, the list creation program 43, and the list display program 44 are all stored in the storage medium of the external storage device 4 (see FIG. 2) and necessary. In response, each of the above units takes out and performs processing.

前記構成の情報検索装置では、入力取得部11の入力文字列取得プログラム31により入力取得処理を行い、検索キーワード生成部12の語句切出プログラム32により切り出し辞書33から語句を切り出すことで検索キーワードの生成処理を行い、検索キーワード評価部13のキーワード評価プログラム34によりキーワードスコアデータベース35を検索しながら検索キーワード評価処理を行う。   In the information search apparatus having the above configuration, the input character string acquisition program 31 of the input acquisition unit 11 performs input acquisition processing, and the phrase extraction program 32 of the search keyword generation unit 12 extracts a phrase from the extraction dictionary 33 to extract the search keyword. The search keyword evaluation process is performed while searching the keyword score database 35 using the keyword evaluation program 34 of the search keyword evaluation unit 13.

次に、検索対象文書評価部14の文書評価プログラム36により文書データベース37の文書を検索しながら検索対象文書評価処理を行い、検索条件式生成部15の条件式作成プログラム38により検索条件式生成処理を行い、検索部16の検索実行プログラム39により検索インデックス40の検索を行い、検索結果評価部17の結果評価プログラム41により検索結果評価処理を行い、評価OKとなったら、結果一覧評価部18の一覧評価プログラム42により一覧評価処理を行い、一覧作成プログラム43の一覧(一覧データ)を作成し、結果表示部19の一覧表示プログラム44により結果表示処理を行うことで、表示装置3(図2参照)の画面に一覧表示を行う。   Next, search target document evaluation processing is performed while searching for documents in the document database 37 by the document evaluation program 36 of the search target document evaluation unit 14, and search condition formula generation processing is performed by the conditional expression creation program 38 of the search condition formula generation unit 15. The search execution program 39 of the search unit 16 searches the search index 40, the search result evaluation unit 41 of the search result evaluation unit 17 performs the search result evaluation process, and if the evaluation is OK, the result list evaluation unit 18 List evaluation processing is performed by the list evaluation program 42, a list (list data) of the list creation program 43 is created, and result display processing is performed by the list display program 44 of the result display unit 19, whereby the display device 3 (see FIG. 2). ) List.

しかし、結果評価プログラム41により検索結果評価処理を行い、評価NGとなった場合には、適当な結果が得られるまで、検索条件式生成部15の条件式作成プログラム38により検索条件式生成処理を行い、検索部16の検索実行プログラム39により検索インデックス40の検索を行い、検索結果評価部17の結果評価プログラム41により検索結果評価処理を行う処理を繰り返して行う。   However, when the search result evaluation process is performed by the result evaluation program 41 and the evaluation is NG, the search condition expression generation process is performed by the conditional expression generation program 38 of the search condition expression generation unit 15 until an appropriate result is obtained. The search index 40 is searched by the search execution program 39 of the search unit 16 and the search result evaluation process 41 is repeatedly executed by the result evaluation program 41 of the search result evaluation unit 17.

§3:情報検索装置全体の処理の説明
図4は情報検索装置全体の処理フローチャートである。以下、図4に基づいて情報検索装置全体の処理を説明する。なお、S1〜S10は各処理ステップを示す。
§3: Explanation of processing of entire information search device FIG. 4 is a flowchart of processing of the entire information search device. Hereinafter, processing of the entire information search apparatus will be described with reference to FIG. In addition, S1-S10 shows each process step.

先ず、外部からキーワードや検索文のデータを入力すると、入力取得部11は前記入力データを取得し(S1)、検索キーワード生成部12は前記入力データに基づいて検索キーワードを生成する(S2)。次に、検索キーワード評価部34は前記生成したキーワードの評価を行い(S3)、検索対象文書評価部14は検索対象文書の評価を行う(S4)。   First, when a keyword or search sentence data is input from the outside, the input acquisition unit 11 acquires the input data (S1), and the search keyword generation unit 12 generates a search keyword based on the input data (S2). Next, the search keyword evaluation unit 34 evaluates the generated keyword (S3), and the search target document evaluation unit 14 evaluates the search target document (S4).

次に、検索条件式生成部15は検索条件式を生成し(S5)、検索部16は前記生成した検索条件式を用いて検索を行う(S6)。次に、検索結果評価部17は検索結果を評価する(S7)。この評価において検索結果評価部17は、前記検索結果の評価は妥当か否かを判断し(S8)、検索結果の評価が妥当でないと判断した場合は前記S5の処理へ移行し、検索結果の評価が妥当であると判断した場合は、結果一覧評価部18が結果一覧の評価を行う(S9)。そして、結果表示部19は表示装置の画面に結果表示を行う(S10)。   Next, the search condition expression generation unit 15 generates a search condition expression (S5), and the search unit 16 performs a search using the generated search condition expression (S6). Next, the search result evaluation unit 17 evaluates the search result (S7). In this evaluation, the search result evaluation unit 17 determines whether or not the evaluation of the search result is appropriate (S8), and when it is determined that the evaluation of the search result is not appropriate, the process proceeds to the process of S5, When it is determined that the evaluation is appropriate, the result list evaluation unit 18 evaluates the result list (S9). Then, the result display unit 19 displays the result on the screen of the display device (S10).

§4:各部の詳細な処理の説明
以下、前記情報検索装置の各部について詳細に説明する。
§4: Explanation of detailed processing of each part Hereinafter, each part of the information search device will be described in detail.

(1) :検索キーワード評価部の処理
図5のA図は検索キーワード評価部の処理説明図である。検索キーワード評価部13はキーワード評価プログラム34によりキーワードスコアデータベース35を検索しながら検索キーワード評価処理を行う。この場合、キーワードスコアデータベース35には図5のA図に示したようなキーワードスコア表が格納されており、このキーワードスコア表には、キーワード、表記品質、品詞、スコアの各項目が格納されている。
(1): Processing of Search Keyword Evaluation Unit FIG. 5A is a process explanatory diagram of the search keyword evaluation unit. The search keyword evaluation unit 13 performs a search keyword evaluation process while searching the keyword score database 35 by the keyword evaluation program 34. In this case, a keyword score table as shown in FIG. 5A is stored in the keyword score database 35, and the keyword, notation quality, part of speech, and score items are stored in the keyword score table. Yes.

そこで、検索キーワード評価部13は、検索キーワードのキーワードスコア(表記品質、品詞など)を算出(キーワードスコアの情報を参照)、また正式表現や言い換え表現などの追加キーワードをそれぞれのキーワードスコアと共に検索キーワードに付与する。   Accordingly, the search keyword evaluation unit 13 calculates a keyword score (notation quality, part of speech, etc.) of the search keyword (refer to the keyword score information), and adds additional keywords such as formal expressions and paraphrasing expressions together with the respective keyword scores. To grant.

(2) :検索対象文書評価部の処理
図5のB図は検索対象文書評価部の処理説明図である。検索対象文書評価部14は、文書評価プログラム36により文書データベース37の文書を検索しながら検索対象文書評価処理を行う。この場合、文書データベース37には図5のB図に示したような文書スコア表が格納されており、この文書スコア表には、キーワード、表記品質、品詞、スコアの各項目がある。
(2): Processing of Search Target Document Evaluation Unit FIG. 5B is a process explanatory diagram of the search target document evaluation unit. The search target document evaluation unit 14 performs a search target document evaluation process while searching for documents in the document database 37 using the document evaluation program 36. In this case, a document score table as shown in FIG. 5B is stored in the document database 37, and this document score table includes items of keyword, notation quality, part of speech, and score.

そこで、検索対象文書評価部14は、検索キーワード並びに検索キーワード評価部13により付与された追加キーワードの検索対象文書中での組み合わせスコア(キーワードスコア、頻度、出現順、近接度など)を算出、組み合わせが複数ある場合には、それぞれの組み合わせの組み合わせスコアを算出する。   Therefore, the search target document evaluation unit 14 calculates and combines a combination score (keyword score, frequency, appearance order, proximity, etc.) of the search keyword and the additional keyword assigned by the search keyword evaluation unit 13 in the search target document. When there are a plurality of combinations, a combination score of each combination is calculated.

(3) :検索結果評価部の処理
図6のA図は検索結果評価部の処理説明図である。検索結果評価部17は、結果評価プログラム41により検索結果評価処理を行う。この場合、検索結果評価部17は、検索結果の合計スコア(件数、文書個々のスコアなどの総計)を算出、特定の値を満たすまで条件式作成から条件式の変更を繰り返す。
(3): Processing of Search Result Evaluation Unit FIG. 6A is an explanatory diagram of processing of the search result evaluation unit. The search result evaluation unit 17 performs a search result evaluation process using the result evaluation program 41. In this case, the search result evaluation unit 17 calculates the total score of the search results (total number of cases, scores of individual documents, etc.), and repeats changing the conditional expression from creating the conditional expression until a specific value is satisfied.

すなわち、検索結果評価部17は、検索結果のスコア(件数、文書個々のスコアなどの総計)を算出し、判定を行う。この判定で、前記スコアが特定の値に満たなければ、評価NGとなり、検索条件式生成部15へ移行し、検索対象文書評価部14で付与したスコアの高いものに条件式を変更し、検索部16が再び検索を実行することを繰り返す。   That is, the search result evaluation unit 17 calculates a score by calculating a score of the search result (total number of cases, scores of individual documents, etc.). In this determination, if the score does not satisfy a specific value, the evaluation is NG, the process proceeds to the search condition expression generation unit 15, the condition expression is changed to the one with the high score given by the search target document evaluation unit 14, and the search is performed. The unit 16 repeats executing the search again.

そして、再び、検索結果評価部17は、検索結果のスコア(件数、文書個々のスコアなどの総計)を算出し、判定を行う。この判定で、前記スコアが特定の値を満たしていれば、評価OKとなり、結果一覧評価部18の処理へ移行する。   Then, the search result evaluation unit 17 again calculates the score of the search result (the total number of cases, the score of each document, etc.) and makes a determination. In this determination, if the score satisfies a specific value, the evaluation is OK, and the process proceeds to the process of the result list evaluation unit 18.

(4) :結果一覧評価部の処理
図6のB図は結果一覧評価部の処理説明図である。前記のように、検索結果評価部17の結果評価プログラム41により検索結果評価処理を行い、評価OKとなったら、結果一覧評価部18の一覧評価プログラム42により一覧評価処理を行い、一覧作成プログラム43が一覧(一覧データ)を作成する。
(4): Process of Result List Evaluation Unit FIG. 6B is a process explanatory diagram of the result list evaluation unit. As described above, the search result evaluation process 41 is performed by the result evaluation program 41 of the search result evaluation unit 17, and when the evaluation is OK, the list evaluation process is performed by the list evaluation program 42 of the result list evaluation unit 18, and the list creation program 43 Creates a list (list data).

この場合、検索結果一覧に含まれる文書に対し、個々の一覧スコア(入力されたキーワード/検索文との一致度、表記のゆれによる重複など一覧中でのポイント)を算出し、その結果に基づいて検索結果一覧から不要な文書を除外後、ソート(順位付け)を行う。   In this case, for each document included in the search result list, an individual list score (a matching point with the input keyword / search sentence, a point in the list such as duplication due to fluctuation of notation) is calculated, and based on the result. After removing unnecessary documents from the search result list, sorting (ranking) is performed.

§5:データ構造例の説明
(1) :切り出し辞書のデータ構造例
図7のA図は切り出し辞書のデータ構造例を示す図である。切り出し辞書33は、検索キーワード生成部12の語句切出プログラム32が検索キーワードの生成時に参照する辞書(図3参照)である。
§5: Explanation of data structure example
(1): Data structure example of cutout dictionary FIG. 7A is a diagram showing a data structure example of the cutout dictionary. The cutout dictionary 33 is a dictionary (see FIG. 3) that is referred to by the word cutout program 32 of the search keyword generation unit 12 when the search keyword is generated.

この辞書には、「語句」と「ゆらぎ」があり、「語句」は文章中から切り出すべき語句、「ゆらぎ」は検索者の入力差異を吸収するためのゆらぎ表現である。例えば、語句が「aaaa」であれば、ゆらぎ1は「aaab」、ゆらぎ2は「abaa」・・・である。また、語句が「bbbb」であれば、ゆらぎ1は「bbba」、ゆらぎ2は「abba」・・・である。また、語句が「cccc」であれば、ゆらぎ1は「ccca」、ゆらぎ2は「aaaa」・・・である。   This dictionary includes “phrase” and “fluctuation”, where “phrase” is a phrase to be extracted from the sentence, and “fluctuation” is a fluctuation expression for absorbing a searcher's input difference. For example, if the phrase is “aaaa”, the fluctuation 1 is “aaab”, the fluctuation 2 is “abaa”. If the word is “bbbb”, the fluctuation 1 is “bbba”, the fluctuation 2 is “abba”. If the word is “cccc”, fluctuation 1 is “ccca”, fluctuation 2 is “aaa”, and so on.

(2) :キーワードスコアデータベースのデータ構造例
図7のB図はキーワードスコアデータベースのデータ構造例を示す図である。キーワードスコアデータベース35(図3参照)は、検索キーワード評価部13が検索キーワードの評価を行う時に検索するデータベースである。
(2): Data structure example of keyword score database FIG. 7B is a diagram showing a data structure example of the keyword score database. The keyword score database 35 (see FIG. 3) is a database that is searched when the search keyword evaluation unit 13 evaluates the search keyword.

前記キーワードスコアデータベース35のキーワードスコアは、図5のA図に示したキーワードスコア表のことであり、検索キーワード評価部13は、検索キーワードのキーワードスコア(表記品質、品詞など)を算出(キーワードスコアの情報を参照)、また正式表現や言い換え表現などの追加キーワードをそれぞれのキーワードスコアと共に検索キーワードに付与する。   The keyword score in the keyword score database 35 is the keyword score table shown in FIG. 5A, and the search keyword evaluation unit 13 calculates the keyword score (notation quality, part of speech, etc.) of the search keyword (keyword score). In addition, additional keywords such as formal expressions and paraphrasing expressions are assigned to the search keywords together with the respective keyword scores.

この場合、キーワードスコアデータベースによれば、キーワードは該当するキーワード、表記品質はキーワードの品質、品詞は品詞、スコアは品質、品詞などから算出されるスコアである。例えば、キーワード=「aaaa」であれば、表記品質=A、品詞=名詞、スコア=10である。また、キーワード=「bbbb」であれば、表記品質=B、品詞=動詞、スコア=8である。また、キーワード=「cccc」であれば、表記品質=A、品詞=名詞、スコア=7である。   In this case, according to the keyword score database, the keyword is a corresponding keyword, the notation quality is the quality of the keyword, the part of speech is the part of speech, the score is a score calculated from the quality, the part of speech, and the like. For example, if the keyword = “aaaa”, the notation quality = A, the part of speech = noun, and the score = 10. If the keyword = “bbbb”, the notation quality = B, the part of speech = verb, and the score = 8. If the keyword = “cccc”, the notation quality = A, the part of speech = noun, and the score = 7.

(3) :文書データベースのデータ構造例
図8は文書データベースのデータ構造例を示す図である。文書データベース37は、検索対象文書評価部14の文書評価プログラム36が検索対象文書評価処理を行う時に検索するものである(図3参照)。
(3): Data structure example of document database FIG. 8 is a diagram showing a data structure example of a document database. The document database 37 is searched when the document evaluation program 36 of the search target document evaluation unit 14 performs search target document evaluation processing (see FIG. 3).

検索対象文書評価部14は、検索キーワード並びに検索キーワード評価部13により付与された追加キーワードの検索対象文書中での組み合わせスコア(キーワードスコア、頻度、出現順、近接度など)を算出、組み合わせが複数ある場合には、それぞれの組み合わせの組み合わせスコアを算出する。この場合、文書データベース37によれば、タイトルは文書タイトル、本文は文書本文、検索キーワードはタイトル、本文に含まれないがヒットして欲しい語句である。   The search target document evaluation unit 14 calculates a combination score (keyword score, frequency, appearance order, proximity, etc.) in the search target document of the search keyword and the additional keyword given by the search keyword evaluation unit 13, and a plurality of combinations In some cases, a combination score for each combination is calculated. In this case, according to the document database 37, the title is the document title, the text is the text of the document, the search keyword is not included in the title and text, but is a phrase that is desired to be hit.

例えば、タイトル=aaaであれば、本文=aaaaaaaaaaaaaaa、検索キーワード1=abc、検索キーワード2=bcdである。タイトル=bbbであれば、本文=bbbbbbbbbbbbbbb、検索キーワード1=abc、検索キーワード2=efgである。タイトル=cccであれば、本文=ccccccccccccccc、検索キーワード1=bcdである。   For example, if title = aaa, text = aaaaaaaaaaaaaaaaaa, search keyword 1 = abc, search keyword 2 = bcd. If title = bbb, text = bbbbbbbbbbbbbbbbbb, search keyword 1 = abc, search keyword 2 = efg. If title = ccc, body = ccccccccccccccc, search keyword 1 = bcd.

§6:具体的な装置例と記録媒体の説明
図9は具体的な装置例である。前記情報検索装置は、ワークステーション、パーソナルコンピュータ等の任意のコンピュータにより実現することができる。この装置は、コンピュータ本体51と、該コンピュータ本体51に接続された表示装置3、入力装置(キーボード/マウス等)52、リムーバブルディスクドライブ(「RDD」という)53、ハードディスク装置(「HDD」という)54等で構成されている。
§6: Description of specific device example and recording medium FIG. 9 shows a specific device example. The information retrieval apparatus can be realized by an arbitrary computer such as a workstation or a personal computer. This apparatus includes a computer main body 51, a display device 3 connected to the computer main body 51, an input device (keyboard / mouse, etc.) 52, a removable disk drive (referred to as “RDD”) 53, and a hard disk device (referred to as “HDD”). 54 etc.

そして、コンピュータ本体51には、内部の各種制御や処理を行うCPU55と、プログラムや各種データを格納しておくためのROM56(不揮発性メモリ)と、メモリ57と、インタフェース制御部(「I/F制御部」という)58と、通信制御部59等が設けてある。なお、前記RDD53には、フレキシブルディスクドライブや光ディスクドライブ等が含まれる。   In the computer main body 51, a CPU 55 for performing various internal controls and processes, a ROM 56 (nonvolatile memory) for storing programs and various data, a memory 57, and an interface control unit ("I / F" 58 ”, a communication control unit 59, and the like. The RDD 53 includes a flexible disk drive, an optical disk drive, and the like.

前記構成の装置において、例えば、HDD54の磁気ディスク(記録媒体)に、前記情報検索装置の処理を実現するためのプログラムを格納しておき、このプログラムをCPU55が読み出して実行することにより、前記情報検索装置が行う処理を実行する。   In the apparatus configured as described above, for example, a program for realizing the processing of the information retrieval apparatus is stored in a magnetic disk (recording medium) of the HDD 54, and the CPU 55 reads out and executes the program, whereby the information The processing performed by the search device is executed.

しかし、本発明は、このような例に限らず、例えば、HDD54の磁気ディスクに、次のようにしてプログラムを格納し、このプログラムをCPU55が実行することで前記処理を行うことも可能である。   However, the present invention is not limited to such an example. For example, the program can be stored in the magnetic disk of the HDD 54 as follows, and the CPU 55 can execute the process by executing the program. .

a:他の装置で作成されたリムーバブルディスクに格納されているプログラム(他の装置で作成したプログラムデータ)を、RDD53により読み取り、HDD54の記録媒体に格納する。   a: A program (program data created by another device) stored in a removable disk created by another device is read by the RDD 53 and stored in a recording medium of the HDD 54.

b:通信回線を介して他の装置から伝送されたプログラム等のデータを、通信制御部59を介して受信し、そのデータをHDD54の記録媒体(磁気ディスク)に格納する。   b: Data such as a program transmitted from another device via the communication line is received via the communication control unit 59, and the data is stored in a recording medium (magnetic disk) of the HDD 54.

§7:その他の説明
前記の例では、本発明の情報検索装置を1台のコンピュータ(例えば、パーソナルコンピュータ、ワークステーション等)で構成したが、本発明はこのような例に限らず、次のようにしても実施可能である。
§7: Other description In the above example, the information retrieval apparatus of the present invention is configured by one computer (for example, a personal computer, a workstation, etc.), but the present invention is not limited to such an example, and the following In this way, it can be implemented.

(1) :前記の例(図1、2、3参照)において、検索キーワード評価部13、検索対象文書評価部14、検索条件式生成部15、検索結果評価部17等を、それぞれ独立したコンピュータ(例えば、パーソナルコンピュータ、ワークステーション等)で構成し、その他の部分を別のコンピュータ(例えば、パーソナルコンピュータ、ワークステーション等)で構成して、各コンピュータを通信回線で接続したシステムで構成することも可能である。   (1): In the above example (see FIGS. 1, 2, and 3), the search keyword evaluation unit 13, the search target document evaluation unit 14, the search condition expression generation unit 15, the search result evaluation unit 17, and the like are respectively independent computers. (For example, a personal computer, a workstation, etc.), and other parts may be configured by another computer (for example, a personal computer, a workstation, etc.), and each computer may be configured by a communication line. Is possible.

(2) :図3に示した切り出し辞書33、キーワードスコアデータベース、文書データベース37、検索インデックス40等を別のコンピュータで構成して、各コンピュータを通信回線で接続したシステムで構成することも可能である。   (2): The cutout dictionary 33, the keyword score database, the document database 37, the search index 40, etc. shown in FIG. 3 can be configured by separate computers, and each computer can be configured by a communication line. is there.


本発明の原理説明図である。It is a principle explanatory view of the present invention. 本発明の実施の形態における情報検索装置の構成図である。It is a block diagram of the information search device in the embodiment of the present invention. 本発明の実施の形態における情報検索装置の詳細な構成と機能の説明図である。It is explanatory drawing of a detailed structure and function of the information search device in embodiment of this invention. 本発明の実施の形態における情報検索装置全体の処理フローチャートである。It is a process flowchart of the whole information search device in embodiment of this invention. 本発明の実施の形態における各部の処理説明図(その1)であり、A図は検索キーワード評価部の処理説明図、B図は検索対象文書評価部の処理説明図である。FIG. 4 is a process explanatory diagram (part 1) of each part in the embodiment of the present invention, FIG. A is a process explanatory diagram of a search keyword evaluation unit, and FIG. B is a process explanatory diagram of a search target document evaluation unit. 本発明の実施の形態における各部の処理説明図(その2)であり、A図は検索結果評価部の処理説明図、B図は結果一覧評価部の処理説明図である。FIG. 6 is a process explanatory diagram (part 2) of each part in the embodiment of the present invention, FIG. A is a process explanatory diagram of a search result evaluation unit, and FIG. B is a process explanatory diagram of a result list evaluation unit. 本発明の実施の形態におけるデータ構造例であり、A図は切り出し辞書のデータ構造例、B図はキーワードスコアデータベースのデータ構造例である。It is an example of a data structure in an embodiment of the present invention, A figure is an example of the data structure of a cutout dictionary, and B figure is an example of a data structure of a keyword score database. 本発明の実施の形態における文書データベースのデータ構造例である。It is an example of the data structure of the document database in embodiment of this invention. 本発明の実施の形態における具体的な装置例である。It is a specific example of an apparatus in an embodiment of the invention.

符号の説明Explanation of symbols


1 情報検索装置本体
2 データ入力部
3 表示装置
4 外部記憶装置
11 入力取得部
12 検索キーワード生成部
13 検索キーワード評価部
14 検索対象文書評価部
15 検索条件式生成部
16 検索部
17 検索結果評価部
18 結果一覧評価部18
19 結果表示部
20 ワークメモリ
51 コンピュータ本体
52 入力装置(キーボード/マウス等)
54 ハードディスク装置(HDD)
55 CPU
56 ROM
57 メモリ
58 I/F制御部
59 通信制御部

DESCRIPTION OF SYMBOLS 1 Information retrieval apparatus main body 2 Data input part 3 Display apparatus 4 External storage device 11 Input acquisition part 12 Search keyword production | generation part 13 Search keyword evaluation part 14 Search object document evaluation part 15 Search conditional expression production | generation part 16 Search part 17 Search result evaluation part 18 Results list evaluation unit 18
19 Result display section 20 Work memory 51 Computer body 52 Input device (keyboard / mouse, etc.)
54 Hard Disk Drive (HDD)
55 CPU
56 ROM
57 Memory 58 I / F Control Unit 59 Communication Control Unit

Claims (5)

入力されたキーワード及び文章を基に検索キーワードを生成する検索キーワード生成部と、
前記検索キーワード生成部で生成された検索キーワードの有用度を評価する検索キーワード評価部と、
検索対象文書の有用度を評価する検索対象文書評価部と、
前記検索キーワード及び検索対象文書の評価に基づいて検索条件式を生成する検索条件式生成部と、
前記検索条件式生成部で生成された検索条件式に基づき検索を実行する検索部と、
前記検索部による検索結果の有用度を評価する検索結果評価部とを有し、
前記検索条件式生成部、検索部及び検索結果評価部とにより、前記検索結果の評価で特定のヒット率が得られるまで、検索キーワードの妥当性並びに検索条件式を緩めながら検索を繰り返すことで、確度の高い検索結果を得る機能を備えていることを特徴とする情報検索装置。
A search keyword generation unit that generates a search keyword based on the input keyword and sentence;
A search keyword evaluation unit that evaluates the usefulness of the search keyword generated by the search keyword generation unit;
A search target document evaluation unit for evaluating the usefulness of the search target document;
A search condition expression generating unit for generating a search condition expression based on the search keyword and the evaluation of the search target document;
A search unit that performs a search based on the search condition formula generated by the search condition formula generation unit;
A search result evaluation unit that evaluates the usefulness of the search result by the search unit;
By repeating the search while relaxing the validity of the search keyword and the search condition formula until the search condition formula generation unit, the search unit, and the search result evaluation unit obtain a specific hit rate in the evaluation of the search result, An information search apparatus having a function of obtaining a search result with high accuracy.
前記検索結果評価部の評価で特定のヒット率が得られたら、検索結果評価部で得られた結果一覧を評価する結果一覧評価部と、
前記結果一覧評価部により評価された結果一覧を、表示装置の画面に表示する結果表示部と、
を備えていることを特徴とする請求項1記載の情報検索装置。
When a specific hit rate is obtained in the evaluation of the search result evaluation unit, a result list evaluation unit for evaluating the result list obtained in the search result evaluation unit;
A result display unit that displays the result list evaluated by the result list evaluation unit on a screen of a display device;
The information search apparatus according to claim 1, further comprising:
入力されたキーワード及び文章を基に検索キーワードを生成する検索キーワード生成手順と、
前記検索キーワード生成手順で生成された検索キーワードの有用度を評価する検索キーワード評価手順と、
検索対象文書の有用度を評価する検索対象文書評価手順と、
前記検索キーワード及び検索対象文書の評価に基づいて検索条件式を生成する検索条件式生成手順と、
前記検索条件式生成手順で生成された検索条件式に基づき検索を実行する検索手順と、 前記検索手順による検索結果の有用度を評価する検索結果評価手順とを有し、
前記検索条件式生成手順、検索手順及び検索結果評価手順とにより、前記検索結果の評価で特定のヒット率が得られるまで、検索キーワードの妥当性並びに検索条件式を緩めながら検索を繰り返すことで、確度の高い検索結果を得ることを特徴とする情報検索方法。
A search keyword generation procedure for generating a search keyword based on the input keyword and sentence;
A search keyword evaluation procedure for evaluating the usefulness of the search keyword generated in the search keyword generation procedure;
A search target document evaluation procedure for evaluating the usefulness of the search target document;
A search condition expression generation procedure for generating a search condition expression based on the search keyword and the evaluation of the search target document;
A search procedure for performing a search based on the search condition formula generated in the search condition formula generation procedure, and a search result evaluation procedure for evaluating the usefulness of the search result by the search procedure,
By repeating the search while loosening the validity of the search keyword and the search condition formula until a specific hit rate is obtained in the search result evaluation by the search condition formula generation procedure, search procedure and search result evaluation procedure, An information search method characterized by obtaining a search result with high accuracy.
コンピュータに、
入力されたキーワード及び文章を基に検索キーワードを生成する検索キーワード生成部と、
前記検索キーワード生成部で生成された検索キーワードの有用度を評価する検索キーワード評価部と、
検索対象文書の有用度を評価する検索対象文書評価部と、
前記検索キーワード及び検索対象文書の評価に基づいて検索条件式を生成する検索条件式生成部と、
前記検索条件式生成部で生成された検索条件式に基づき検索を実行する検索部と、
前記検索部による検索結果の有用度を評価する検索結果評価部とを有し、
前記検索条件式生成部、検索部及び検索結果評価部とにより、前記検索結果の評価で特定のヒット率が得られるまで、検索キーワードの妥当性並びに検索条件式を緩めながら検索を繰り返すことで、確度の高い検索結果を得る機能を実現させるためのプログラム。
On the computer,
A search keyword generation unit that generates a search keyword based on the input keyword and sentence;
A search keyword evaluation unit that evaluates the usefulness of the search keyword generated by the search keyword generation unit;
A search target document evaluation unit for evaluating the usefulness of the search target document;
A search condition expression generating unit for generating a search condition expression based on the search keyword and the evaluation of the search target document;
A search unit that performs a search based on the search condition formula generated by the search condition formula generation unit;
A search result evaluation unit that evaluates the usefulness of the search result by the search unit;
By repeating the search while relaxing the validity of the search keyword and the search condition formula until the search condition formula generation unit, the search unit, and the search result evaluation unit obtain a specific hit rate in the evaluation of the search result, A program for realizing a function to obtain search results with high accuracy.
コンピュータに、
入力されたキーワード及び文章を基に検索キーワードを生成する検索キーワード生成部と、
前記検索キーワード生成部で生成された検索キーワードの有用度を評価する検索キーワード評価部と、
検索対象文書の有用度を評価する検索対象文書評価部と、
前記検索キーワード及び検索対象文書の評価に基づいて検索条件式を生成する検索条件式生成部と、
前記検索条件式生成部で生成された検索条件式に基づき検索を実行する検索部と、
前記検索部による検索結果の有用度を評価する検索結果評価部とを有し、
前記検索条件式生成部、検索部及び検索結果評価部とにより、前記検索結果の評価で特定のヒット率が得られるまで、検索キーワードの妥当性並びに検索条件式を緩めながら検索を繰り返すことで、確度の高い検索結果を得る機能を実現させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
On the computer,
A search keyword generation unit that generates a search keyword based on the input keyword and sentence;
A search keyword evaluation unit that evaluates the usefulness of the search keyword generated by the search keyword generation unit;
A search target document evaluation unit for evaluating the usefulness of the search target document;
A search condition expression generating unit for generating a search condition expression based on the search keyword and the evaluation of the search target document;
A search unit that performs a search based on the search condition formula generated by the search condition formula generation unit;
A search result evaluation unit that evaluates the usefulness of the search result by the search unit;
By repeating the search while relaxing the validity of the search keyword and the search condition formula until the search condition formula generation unit, the search unit, and the search result evaluation unit obtain a specific hit rate in the evaluation of the search result, A computer-readable recording medium storing a program for realizing a function for obtaining a search result with high accuracy.
JP2003411145A 2003-12-10 2003-12-10 Information retrieval device, information retrieval method, program, and recording medium recorded with the program Pending JP2005173847A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003411145A JP2005173847A (en) 2003-12-10 2003-12-10 Information retrieval device, information retrieval method, program, and recording medium recorded with the program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003411145A JP2005173847A (en) 2003-12-10 2003-12-10 Information retrieval device, information retrieval method, program, and recording medium recorded with the program

Publications (1)

Publication Number Publication Date
JP2005173847A true JP2005173847A (en) 2005-06-30

Family

ID=34731968

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003411145A Pending JP2005173847A (en) 2003-12-10 2003-12-10 Information retrieval device, information retrieval method, program, and recording medium recorded with the program

Country Status (1)

Country Link
JP (1) JP2005173847A (en)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008032393A1 (en) * 2006-09-15 2008-03-20 Fujitsu Limited Information processing method and device for work process analysis
JP2011076264A (en) * 2009-09-29 2011-04-14 Ntt Communications Kk Retrieval control device, retrieval control method, and program
WO2011118712A1 (en) * 2010-03-26 2011-09-29 楽天株式会社 Search system, search method, search program and storage medium
US8713070B2 (en) 2008-02-07 2014-04-29 Fujitsu Limited Business flow processing method and apparatus
JP5639314B1 (en) * 2014-01-28 2014-12-10 楽天株式会社 SEARCH DEVICE, SEARCH METHOD, RECORDING MEDIUM, AND PROGRAM
CN105740223A (en) * 2014-12-08 2016-07-06 联想(北京)有限公司 Information processing equipment and information processing method
JP2019074982A (en) * 2017-10-18 2019-05-16 三菱重工業株式会社 Information search device, search processing method, and program

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008032393A1 (en) * 2006-09-15 2008-03-20 Fujitsu Limited Information processing method and device for work process analysis
JP4832523B2 (en) * 2006-09-15 2011-12-07 富士通株式会社 Information processing method and apparatus for business process analysis
KR101125911B1 (en) * 2006-09-15 2012-03-26 후지쯔 가부시끼가이샤 Information processing method and device for work process analysis
US8224762B2 (en) 2006-09-15 2012-07-17 Fujitsu Limited Information processing method and apparatus for business process analysis
US8713070B2 (en) 2008-02-07 2014-04-29 Fujitsu Limited Business flow processing method and apparatus
JP2011076264A (en) * 2009-09-29 2011-04-14 Ntt Communications Kk Retrieval control device, retrieval control method, and program
US9542435B2 (en) 2010-03-26 2017-01-10 Rakuten, Inc. Search system, search method, search program and storage medium for providing a stabilized number of output search results
JP5174279B2 (en) * 2010-03-26 2013-04-03 楽天株式会社 SEARCH SYSTEM, SEARCH METHOD, SEARCH PROGRAM, AND RECORDING MEDIUM
WO2011118712A1 (en) * 2010-03-26 2011-09-29 楽天株式会社 Search system, search method, search program and storage medium
JP5639314B1 (en) * 2014-01-28 2014-12-10 楽天株式会社 SEARCH DEVICE, SEARCH METHOD, RECORDING MEDIUM, AND PROGRAM
WO2015114731A1 (en) * 2014-01-28 2015-08-06 楽天株式会社 Search device, search method, recording medium, and program
TWI503769B (en) * 2014-01-28 2015-10-11 Rakuten Inc A retrieval device, a retrieval method, a recording medium, and a program
CN105740223A (en) * 2014-12-08 2016-07-06 联想(北京)有限公司 Information processing equipment and information processing method
CN105740223B (en) * 2014-12-08 2019-04-26 联想(北京)有限公司 Information processing equipment and information processing method
JP2019074982A (en) * 2017-10-18 2019-05-16 三菱重工業株式会社 Information search device, search processing method, and program
JP7016237B2 (en) 2017-10-18 2022-02-04 三菱重工業株式会社 Information retrieval device, search processing method, and program

Similar Documents

Publication Publication Date Title
JP5169816B2 (en) Question answering device, question answering method, and question answering program
JP6828335B2 (en) Search program, search device and search method
US11573989B2 (en) Corpus specific generative query completion assistant
JP2011118689A (en) Retrieval method and system
JP2010287020A (en) Synonym translation system and synonym translation method
US7698271B2 (en) Conceptual network generating system, conceptual network generating method, and program product therefor
CN100437561C (en) Method and apparatus for processing, browsing and searching of electronic document and system thereof
JP2005038395A (en) Database retrieval device
JP2005173847A (en) Information retrieval device, information retrieval method, program, and recording medium recorded with the program
JP2006178599A (en) Document retrieval device and method
JP2008117351A (en) Search system
JP2008152641A (en) Similar example sentence retrieving device
JP2009277099A (en) Similar document retrieval device, method and program, and computer readable recording medium
JP5189413B2 (en) Voice data retrieval system
JP4745417B2 (en) Information retrieval apparatus and program
KR102519955B1 (en) Apparatus and method for extracting of topic keyword
Qin et al. Mining term association rules for heuristic query construction
KR101835994B1 (en) Method and apparatus of providing searching service for electronic books
JP2020071678A (en) Information processing device, control method, and program
JP4301496B2 (en) Database search apparatus, database search method and program
Rahimtoroghi et al. A structural rule-based stemmer for Persian
JP2007193500A (en) Document or diagram production support apparatus
JP2010003266A (en) Query generation device, method, program and computer-readable recording medium
JP4574186B2 (en) Important language identification method, important language identification program, important language identification device, document search device, and keyword extraction device
JP7305077B2 (en) Information processing device, abstract output method, and abstract output program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061006

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090618

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090707

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090813

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20090813

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20090813

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090929