JPH08263521A - Document registration and retrieval system - Google Patents

Document registration and retrieval system

Info

Publication number
JPH08263521A
JPH08263521A JP7091661A JP9166195A JPH08263521A JP H08263521 A JPH08263521 A JP H08263521A JP 7091661 A JP7091661 A JP 7091661A JP 9166195 A JP9166195 A JP 9166195A JP H08263521 A JPH08263521 A JP H08263521A
Authority
JP
Japan
Prior art keywords
keyword
document
thesaurus
dictionary
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7091661A
Other languages
Japanese (ja)
Inventor
Tatsuomi Kita
辰臣 喜多
Makoto Ando
誠 安藤
Akio Yamashita
明男 山下
Kazuo Aihara
一雄 相原
Hiroshi Yamaguchi
浩 山口
Hiroko Matsuo
裕子 松尾
Shinji Kawamoto
真司 川本
Naomi Hiraoka
直美 平岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP7091661A priority Critical patent/JPH08263521A/en
Publication of JPH08263521A publication Critical patent/JPH08263521A/en
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PURPOSE: To perform document retrieval that a user intends with a thesaurus- expanded retrieval key word even in the case where a key word dictionary and a thesaurus dictionary are not consistent. CONSTITUTION: A key word extracting means 3 extracts a key word from a document inputted through a document input means 2 by referring to the contents of a key word dictionary means 1 and a thesaurus dictionary means 7, and the extracted key word and information on a document such as a document name are stored in a storage means 5 to register the document. A thesaurus expanding means 8 performs the thesaurus expansion of the retrieval key word inputted from a key word input means 6 by referring to the contents of the thesaurus dictionary means 7 and a retrieval means 9 performs retrieval from the storage means 5 by using the thesaurus-expanded key word to extract information on the corresponding document. Therefore, the thesaurus-expanded retrieval key word and the key word which is registered after thesaurus expansion are based on the contents of the same thesaurus dictionary means 7 and a matching between both the key words is maintained.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、登録した文書を検索す
る文書登録検索システムに関し、特に、キーワードを類
語や関連語へシソーラス展開させる文書登録検索システ
ムに関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a document registration / retrieval system for retrieving registered documents, and more particularly to a document registration / retrieval system for expanding a keyword into a thesaurus or a related term.

【0002】[0002]

【従来の技術】文書登録検索システムはコンピュータに
よる電算処理により、文書を電子的なデータとして記憶
手段に登録格納し、この登録された文書を必要に応じて
検索することを可能にしている。このような文書登録検
索システムにおける文書の登録処理は、予め設定された
抽出すべきキーワードを格納したキーワード辞書手段を
参照して、登録対象の文書のテキスト部等からキーワー
ドを抽出し、抽出したキーワードと当該文書とを対応付
けて記憶手段に格納することにより行われる。なお、記
憶装置への文書の登録は文書の内容(テキストデータ)
ではなく、文書を特定する文書名や識別子等によってイ
ンデックスとして登録することも行われる。
2. Description of the Related Art A document registration / retrieval system allows a document to be registered and stored as electronic data in a storage means by computer processing, and the registered document can be searched as needed. In the document registration processing in such a document registration / retrieval system, the keyword extracted from the text part of the document to be registered is extracted by referring to the keyword dictionary means that stores the preset keyword to be extracted. This is performed by associating the document with the document and storing them in the storage means. The registration of the document in the storage device is the content of the document (text data).
Instead, it is also registered as an index by a document name or an identifier that identifies the document.

【0003】そして、文書登録検索システムにおける文
書の検索処理は、入力された検索キーワードを用いて前
記記憶装置を検索し、当該検索キーワードに対応する文
書の情報(内容、或いは、文書名等)を抽出することに
より行われる。ここで、文書登録検索システムでは、文
書登録時に抽出するキーワードや文書検索時に用いる検
索キーワードは辞書に予め設定した範囲の語から選択さ
れるが、文書を種々な利用者の感覚にあったキーワード
をもって登録し且つ検索し得るようにすることが要求さ
れている。
In the document search processing in the document registration / retrieval system, the storage device is searched using the input search keyword, and the information (content or document name etc.) of the document corresponding to the search keyword is retrieved. It is done by extracting. Here, in the document registration search system, the keyword extracted at the time of document registration and the search keyword used at the time of document search are selected from the range of words preset in the dictionary. It is required to be able to register and search.

【0004】このため、従来より、利用者が任意に入力
したキーワードによっても漏れのない文書検索を実現す
るために、検索キーワード抽出用のシソーラス辞書を備
えた文書登録検索システムがあり、このようなシステム
では入力された検索キーワードをシソーラス辞書を用い
て展開することにより、シソーラス辞書に格納されてい
る類語や関連語をも検索キーワードとして上記のような
文書検索を行う。
Therefore, conventionally, there has been a document registration / retrieval system provided with a thesaurus dictionary for extracting a retrieval keyword in order to realize a document retrieval without any omission by a keyword arbitrarily input by a user. In the system, the input search keyword is expanded using a thesaurus dictionary, and the above-mentioned document search is performed using the synonyms and related words stored in the thesaurus dictionary as the search keyword.

【0005】また、従来より、利用者の必要に応じて、
文書登録の際にキーワード抽出のために用いるキーワー
ド辞書の内容を変更し得る文書登録検索システムがあり
(特開昭63−228326号公報)、このシステムで
は利用者固有のキーワード候補(抽出すべきキーワー
ド)を格納した利用者キーワード辞書をシステムに設け
られている基本キーワード辞書とともに設け、利用者キ
ーワード辞書も用いてキーワード抽出を行う。
Conventionally, according to the needs of the user,
There is a document registration search system capable of changing the contents of a keyword dictionary used for keyword extraction at the time of document registration (Japanese Patent Laid-Open No. 63-228326). In this system, a user-specific keyword candidate (keyword to be extracted ) Is stored together with the basic keyword dictionary provided in the system, and the keyword is extracted using the user keyword dictionary.

【0006】[0006]

【発明が解決しようとする課題】上記した従来の2つの
文書登録検索システムから、例えば利用者が別個に購入
したシソーラス辞書を用いる等して検索キーワード展開
用のシソーラス辞書を利用者が必要とする内容のものと
すれば、更に利用者の意図に合致した検索キーワードに
よって文書検索を行うことができる。
A user needs a thesaurus dictionary for expanding a search keyword from the above-described two conventional document registration / retrieval systems, for example, by using a thesaurus dictionary purchased separately by the user. If the contents are included, a document search can be further performed by using a search keyword that matches the intention of the user.

【0007】しかしながら、上記のような検索キーワー
ドの展開を行った場合、検索キーワード展開用のシソー
ラス辞書と文書登録の際に用いるキーワード辞書とに格
納されている語の間で整合性が崩れてしまった場合に
は、検索キーワードを類語や関連語へ展開しても、これ
らの語が登録された文書に対応して登録されているキー
ワードに存在していない場合が生じる。このため、折角
シソーラス展開を行って類語や関連語をも検索キーワー
ドとしても、これらの語は実際には検索処理に使用され
ず、シソーラス展開により利用者の意図に合致した文書
検索を実現しようとする所期の目的が達成されていなか
った。
However, when the search keywords are expanded as described above, the consistency between the thesaurus stored for expanding the search keywords and the words stored in the keyword dictionary used for document registration is lost. In such a case, even if the search keyword is expanded to a synonym or a related word, the word may not exist in the keyword registered corresponding to the registered document. Therefore, even if the thesaurus expansion is performed and synonyms and related words are also used as search keywords, these words are not actually used in the search processing, and it is attempted to realize the document search that matches the user's intention by the thesaurus expansion. The intended purpose to do was not achieved.

【0008】本発明は上記従来の事情に鑑みなされたも
ので、シソーラス展開により利用者の意図に合致した文
書検索を実現する文書登録検索システムを提供すること
を目的とする。特に、請求項1に記載した発明は、検索
キーワードをシソーラス展開して得られた類語や関連語
を有効に文書検索に利用する文書登録検索システムを提
供することを目的とする。
The present invention has been made in view of the above conventional circumstances, and an object of the present invention is to provide a document registration / retrieval system that realizes a document retrieval that matches a user's intention by thesaurus expansion. In particular, the invention set forth in claim 1 aims to provide a document registration and retrieval system that effectively uses synonyms and related terms obtained by expanding a search keyword in a thesaurus in document retrieval.

【0009】また、請求項2又は請求項4に記載した発
明は、シソーラス辞書の内容を利用者の必要に応じて任
意に変更し得る文書登録検索システムを提供することを
目的とする。また、請求項3又は請求項4に記載した発
明は、キーワード辞書の内容を利用者の必要に応じて任
意に変更し得る文書登録検索システムを提供することを
目的とする。
It is another object of the present invention to provide a document registration / retrieval system capable of arbitrarily changing the contents of the thesaurus dictionary according to the needs of the user. It is another object of the present invention to provide a document registration / retrieval system capable of arbitrarily changing the contents of the keyword dictionary according to the needs of the user.

【0010】[0010]

【課題を解決するための手段】上記の目的を達成するた
めに、請求項1に記載した文書登録検索システムは、抽
出すべきキーワードを格納したキーワード辞書手段と、
登録すべき文書を入力する文書入力手段と、入力された
文書からキーワード辞書手段の内容を参照してキーワー
ドを抽出するキーワード抽出手段と、抽出されたキーワ
ードに対応付けて入力された文書に関する情報を格納す
る記憶手段と、文書を検索するための検索キーワードを
入力するキーワード入力手段と、所定の語の類語や関連
語を格納したシソーラス辞書手段と、入力された検索キ
ーワードをシソーラス辞書手段の内容を参照して類語や
関連語へ展開するシソーラス展開手段と、展開された検
索キーワードを用いて前記記憶手段から該当する文書の
情報を検索する検索手段と、を備えた文書登録検索シス
テムにおいて、前記キーワード抽出手段はシソーラス辞
書手段の内容をも参照してキーワードを抽出することを
特徴とする。
In order to achieve the above object, the document registration / retrieval system according to claim 1 is a keyword dictionary means for storing keywords to be extracted,
Document input means for inputting a document to be registered, keyword extracting means for extracting a keyword from the input document by referring to the contents of the keyword dictionary means, and information on a document input in association with the extracted keyword A storage means for storing, a keyword input means for inputting a search keyword for searching a document, a thesaurus dictionary means for storing synonyms and related words of a predetermined word, and an input search keyword for the contents of the thesaurus dictionary means. In the document registration / retrieval system including thesaurus expansion means for referring to the synonyms and related words and searching means for searching the information of the corresponding document from the storage means using the expanded search keyword, The extraction means is characterized in that the keyword is extracted by also referring to the contents of the thesaurus dictionary means.

【0011】また、請求項2に記載した文書登録検索シ
ステムは、請求項1に記載の文書登録検索システムにお
いて、前記シソーラス辞書手段の格納内容を編集するシ
ソーラス編集手段を更に備えたことを特徴とする。ま
た、請求項3に記載した文書登録検索システムは、請求
項1又は請求項2に記載の文書登録検索システムにおい
て、前記キーワード辞書手段の格納内容を編集するキー
ワード編集手段を更に備えたことを特徴とする。
A document registration / retrieval system according to a second aspect of the present invention is the document registration / retrieval system according to the first aspect, further comprising a thesaurus editing means for editing the contents stored in the thesaurus dictionary means. To do. The document registration / retrieval system according to claim 3 is the document registration / retrieval system according to claim 1 or 2, further comprising keyword editing means for editing the contents stored in the keyword dictionary means. And

【0012】また、請求項4に記載した文書登録検索シ
ステムは、請求項2又は請求項3に記載の文書登録検索
システムにおいて、前記編集手段による編集は前記辞書
手段に新たな辞書手段を付加することにより行うことを
特徴とする。なお、上記したキーワードの類語や関連語
は、同義語、上位概念語、下位概念語、反語等といった
種々な語を含む概念である。
Further, the document registration / retrieval system according to claim 4 is the document registration / retrieval system according to claim 2 or 3, wherein the editing by the editing means adds a new dictionary means to the dictionary means. It is characterized by carrying out by doing. The synonyms and related words of the above-mentioned keywords are concepts including various words such as synonyms, superordinate terms, subordinate terms, and antonyms.

【0013】[0013]

【作用】請求項1の文書登録検索システムによると、文
書入力手段から入力された文書からキーワード抽出手段
がキーワード辞書手段及びシソーラス辞書手段の内容を
参照してキーワードを抽出し、抽出したキーワードと文
書名等の文書の情報とを記憶手段に格納して文書の登録
を行う。したがって、登録されたキーワードはシソーラ
ス辞書手段の内容によってシソーラス展開された語も含
んでいる。そして、キーワード入力手段から入力された
検索キーワードをシソーラス展開手段が上記のシソーラ
ス辞書手段の内容を参照してシソーラス展開し、シソー
ラス展開された検索キーワードを用いて検索手段が上記
の記憶手段を検索し、該当する文書の情報を抽出する。
したがって、シソーラス展開された検索キーワードと上
記のシソーラス展開されて登録されたキーワードとは同
一のシソーラス辞書手段の内容に基づいており、両キー
ワード間の整合性が保持されている。
According to the document registration / retrieval system of claim 1, the keyword extracting unit extracts the keyword from the document input from the document input unit by referring to the contents of the keyword dictionary unit and the thesaurus dictionary unit, and the extracted keyword and document. The information of the document such as the name is stored in the storage means to register the document. Therefore, the registered keywords also include the thesaurus expanded words based on the contents of the thesaurus dictionary means. Then, the thesaurus expansion means expands the thesaurus with reference to the contents of the thesaurus dictionary means by the search keyword input from the keyword input means, and the search means searches the storage means by using the thesaurus expanded search keyword. , Extract the information of the corresponding document.
Therefore, the thesaurus-expanded search keyword and the above-mentioned thesaurus-expanded and registered keyword are based on the same content of the thesaurus dictionary means, and the consistency between both keywords is maintained.

【0014】また、請求項2の文書登録検索システムに
よるとシソーラス展開に用いるシソーラス辞書の内容は
シソーラス編集手段によって編集でき、また、請求項3
の文書登録検索システムによると登録文書からのキーワ
ード抽出に用いるキーワード辞書手段の内容はキーワー
ド編集手段によって編集でき、これら辞書手段の内容を
利用者の必要に応じて任意に変更、追加、削除すること
ができる。また、請求項4の文書登録検索システムによ
ると、利用者が別個に購入したキーラード辞書やシソー
ラス辞書をシステムに付加することにより、上記の辞書
手段の内容の編集を簡便に行う。
According to the document registration / retrieval system of claim 2, the contents of the thesaurus dictionary used for thesaurus expansion can be edited by the thesaurus editing means.
According to the document registration search system of, the contents of the keyword dictionary means used for extracting the keywords from the registered document can be edited by the keyword editing means, and the contents of these dictionary means can be arbitrarily changed, added or deleted according to the needs of the user. You can Further, according to the document registration / retrieval system of the fourth aspect, the contents of the above-mentioned dictionary means are easily edited by adding the Keylard dictionary and thesaurus dictionary which the user separately purchased to the system.

【0015】[0015]

【実施例】以下、本発明の一実施例に係る文書登録検索
システムを図面を参照して説明する。図1には本発明の
第1実施例に係る文書登録検索システムを示してある。
本実施例の文書登録検索システムは、主に文書登録に関
与する構成として、抽出すべきキーワード(候補)を格
納したキーワード辞書手段1と、登録すべき文書を入力
する文書入力手段2と、入力された文書からキーワード
を抽出するキーワード抽出手段3と、抽出されたキーワ
ードと入力された文書の文書名(文書に関する情報)を
対応付けて登録処理を行う登録手段4と、対応付けられ
たキーワードと文書名とを格納する文書・キーワード記
憶手段5とを備えている。
DESCRIPTION OF THE PREFERRED EMBODIMENTS A document registration / retrieval system according to an embodiment of the present invention will be described below with reference to the drawings. FIG. 1 shows a document registration / retrieval system according to a first embodiment of the present invention.
The document registration / retrieval system of the present embodiment is mainly related to document registration, and has a keyword dictionary means 1 storing keywords (candidates) to be extracted, a document input means 2 for inputting a document to be registered, and an input. The keyword extraction means 3 for extracting a keyword from the extracted document, the registration means 4 for performing the registration processing by associating the extracted keyword with the document name (information about the document) of the input document, and the associated keyword A document / keyword storage unit 5 for storing a document name is provided.

【0016】また、本実施例の文書登録検索システム
は、主に記憶手段5からの文書検索に関与する構成とし
て、文書を検索するための検索キーワードを入力するキ
ーワード入力手段6と、検索キーワードの類語や関連語
を格納したシソーラス辞書手段7と、検索キーワードを
シソーラス辞書手段7の内容を参照して類語や関連語へ
展開するシソーラス展開手段8と、展開された検索キー
ワードを用いて記憶手段5から該当する文書名を検索す
る検索手段9とを備えている。更に、本実施例の文書登
録検索システムにおけるキーワード抽出手段3は、入力
された文書からキーワードを抽出する際にキーワード辞
書手段1及びシソーラス辞書手段7の格納内容を参照
し、これら辞書手段1、7に格納されている語の範囲で
キーワードを抽出する。
Further, the document registration / retrieval system of this embodiment is mainly concerned with the document retrieval from the storage means 5, and the keyword input means 6 for inputting the retrieval keyword for retrieving the document and the retrieval keyword Thesaurus dictionary means 7 that stores synonyms and related words, thesaurus expansion means 8 that expands search keywords into synonyms and related words by referring to the contents of thesaurus dictionary means 7, and storage means 5 that uses the expanded search keywords. And a search means 9 for searching for a corresponding document name. Further, the keyword extracting means 3 in the document registration / retrieval system of the present embodiment refers to the stored contents of the keyword dictionary means 1 and thesaurus dictionary means 7 when extracting the keywords from the input document, and these dictionary means 1, 7 Extract keywords in the range of words stored in.

【0017】キーワード辞書手段1はハードディスク装
置等の読出自在な記憶装置から構成されており、予めシ
ステムに設定した多数の語をキーワードの候補として格
納している。シソーラス辞書手段7はハードディスク装
置等の読出自在な記憶装置から構成されており、システ
ムに予め設定した所定の語の類語や関連語を格納してい
る。
The keyword dictionary means 1 is composed of a readable storage device such as a hard disk device, and stores a large number of words preset in the system as keyword candidates. The thesaurus dictionary means 7 is composed of a readable storage device such as a hard disk device, and stores synonyms and related words of predetermined words preset in the system.

【0018】文書入力手段2は、例えば光学的文字読取
装置(OCR)から構成されており、紙媒体に記載され
た登録対象の文書を読み取って文字コードデータに変換
する。また、文書入力手段2は予め電子化されて記憶装
置に格納された文書データを取り込むものでもよく、こ
の場合にはコードデータへの変換処理を必要としない。
なお、文書入力手段2で文書をコード化せずにイメージ
データの形式で入力することも可能である。
The document input means 2 is composed of, for example, an optical character reading device (OCR), and reads a document to be registered written on a paper medium and converts it into character code data. Further, the document input means 2 may be one that takes in document data that has been digitized in advance and stored in the storage device, and in this case, conversion processing into code data is not required.
It is also possible to input the document in the form of image data without encoding it with the document input means 2.

【0019】キーワード抽出手段3は、キーワード辞書
手段1とシソーラス辞書手段7とに格納されている語が
入力された文書データに含まれているかを検索し、該当
する語をキーワードとして抽出する。このキーワード抽
出は、例えば、文書データを形態素解析して名詞や形容
詞等といったキーワードとなり得る語を探し出し、これ
らの語が辞書手段1又は辞書手段7に含まれているかに
よって行ったり、単純に辞書手段1又は辞書手段7に含
まれている語を文書データに突き合わせてパターンによ
って行ったり、漢字や片仮名といった文字種によって文
書データからキーワードとなり得る語を探し出し、これ
らの語が辞書手段1又は辞書手段7に含まれているかに
よって行うことができる。なお、形態素解析を行う場合
には、キーワード抽出手段3はキーワード辞書と共に文
法規則を格納した文法辞書を備えている。
The keyword extracting means 3 searches whether the words stored in the keyword dictionary means 1 and the thesaurus dictionary means 7 are included in the input document data, and extracts the corresponding words as keywords. This keyword extraction is performed, for example, by morphologically analyzing the document data to search for words that can be keywords such as nouns and adjectives, and depending on whether these words are included in the dictionary unit 1 or the dictionary unit 7, or simply in the dictionary unit. 1 or a word included in the dictionary means 7 is matched with the document data according to a pattern, or a word that can be a keyword is searched from the document data according to a character type such as kanji or katakana, and these words are stored in the dictionary means 1 or the dictionary means 7. It can be done depending on what is included. When performing morphological analysis, the keyword extracting means 3 includes a keyword dictionary and a grammar dictionary storing grammatical rules.

【0020】登録手段4は入力された文書データから当
該文書を特定する情報として文書名を抽出し、この文書
名と抽出されたキーワードとを対応付けてインデックス
化する。文書・キーワード記憶手段5は、例えばハード
ディスク装置等といった読出書込自在な記憶装置から構
成されており、登録手段4でインデックス化されたキー
ワードと文書名とを格納する。
The registration means 4 extracts a document name from the input document data as information for identifying the document, and indexes the document name and the extracted keyword in association with each other. The document / keyword storage means 5 is composed of a readable / writable storage device such as a hard disk device, and stores the keywords and the document names indexed by the registration means 4.

【0021】キーワード入力手段6は、例えばキーボー
ドから構成されており、利用者によって任意な検索キー
ワードが入力される。なお、検索キーワードの入力に際
して、複数の検索キーワードを論理式化する場合には、
その論理条件(例えば、論理積、論理和等)も入力され
る。また、検索キーワードを含む文節や文の形式で入力
し、キーワード入力手段6がこれを形態素解析して検索
キーワードを抽出するようにしてもよく、この場合に
は、上記のようにキーワード辞書や文法辞書を備えてお
けばよい。なお、キーワード入力手段6は光学的文字読
取装置(OCR)等から構成することもでき、この場合
には読み取ったデータをキーワード入力手段6が文字コ
ードデータに変換するようにしてもよい。
The keyword input means 6 is composed of, for example, a keyboard, and a user inputs an arbitrary search keyword. In addition, when inputting a search keyword, when formulating multiple search keywords,
The logical condition (for example, logical product, logical sum, etc.) is also input. Alternatively, a keyword or a sentence may be input in the form of a phrase or sentence containing a search keyword, and the keyword input means 6 may perform morphological analysis on the keyword to extract a search keyword. In this case, the keyword dictionary or grammar as described above is used. You should have a dictionary. The keyword input means 6 may be composed of an optical character reading device (OCR) or the like, and in this case, the read data may be converted into character code data by the keyword input means 6.

【0022】シソーラス展開手段8は入力された検索キ
ーワードを用いてシソーラス辞書手段7の格納内容を検
索し、検索キーワードに該当する語の類語や関連語を抽
出する。例えば、図8の(a)に示すような内容がシソ
ーラス辞書手段7に格納されている場合において、検索
キーワードが登録語の「大学」であるときには、「慶
応」、「東京」、「京都」がシソーラス展開の結果とし
て抽出される。検索手段9は、抽出された類語や関連語
を検索キーワードに加えて、これら検索キーワードによ
り記憶手段5の格納内容を検索して検索キーワードに合
致する文書名を検索する。
The thesaurus expansion means 8 searches the contents stored in the thesaurus dictionary means 7 using the input search keyword, and extracts synonyms and related words of the word corresponding to the search keyword. For example, in the case where the content shown in FIG. 8A is stored in the thesaurus dictionary means 7, when the search keyword is the registered word “university”, “Keio”, “Tokyo”, “Kyoto” Is extracted as a result of thesaurus expansion. The search means 9 adds the extracted synonyms and related words to the search keywords, searches the contents stored in the storage means 5 using these search keywords, and searches for the document name that matches the search keywords.

【0023】なお、検索キーワードに論理式の指定があ
る場合には、検索手段9は指定された論理条件によって
検索キーワードを論理式化し、当該論理式で記憶手段5
の内容を検索して検索式に合致する文書名を検索する。
例えば、複数の検索キーワードに対する論理条件が論理
積であるときにはこれら全ての検索キーワードに該当す
る文書名が全て検索され、論理条件が論理和であるとき
にはこれら検索キーワードの内のいずれか1つにでも該
当する含む文書名が全て検索される。
When the search keyword has a logical expression specified, the searching means 9 formulates the search keyword according to the specified logical condition, and the storage means 5 uses the logical expression.
The content of is searched for a document name that matches the search expression.
For example, when the logical condition for a plurality of search keywords is a logical product, all the document names corresponding to all these search keywords are searched, and when the logical condition is a logical sum, any one of these search keywords is used. All relevant document names are searched.

【0024】第1実施例に係る上記構成の文書登録検索
システムによると、文書入力手段2から入力された文書
からキーワード抽出手段3がキーワード辞書手段1及び
シソーラス辞書手段7の内容を参照してキーワードを抽
出し、抽出したキーワードと文書名とを記憶手段5に格
納して文書の登録を行う。そして、キーワード入力手段
6から入力された検索キーワードをシソーラス展開手段
8がシソーラス辞書手段7の内容を参照してシソーラス
展開し、類語や関連語を含む検索キーワードを用いて検
索手段9が記憶手段5を検索し、検索キーワードに該当
する文書名を抽出する。
According to the document registration / retrieval system having the above-described configuration according to the first embodiment, the keyword extracting unit 3 refers to the contents of the keyword dictionary unit 1 and the thesaurus dictionary unit 7 from the document input from the document input unit 2 to search the keywords. And the extracted keyword and document name are stored in the storage means 5 to register the document. Then, the thesaurus expansion means 8 expands the search keyword input from the keyword input means 6 by referring to the contents of the thesaurus dictionary means 7, and the search means 9 stores the storage means 5 using the search keyword including the synonyms and related words. Is searched, and the document name corresponding to the search keyword is extracted.

【0025】ここで、文書登録に際してのキーワード抽
出はキーワード辞書手段1のみならず、検索キーワード
のシソーラス展開に用いるシソーラス辞書手段7も参照
して行われるため、キーワード辞書手段1とシソーラス
辞書手段7との間で格納内容(登録語)に整合性がなく
とも、検索キーワードからシソーラス展開される語は必
ずキーワードとして記憶手段5に登録されている。した
がって、シソーラス展開して得られた類語や関連語を検
索キーワードとして確実且つ有効に用いた文書検索がな
され、シソーラス展開を利用した利用者の意図に合致し
た文書検索が実現される。
Since the keyword extraction at the time of document registration is performed not only by the keyword dictionary means 1 but also by the thesaurus dictionary means 7 used for thesaurus expansion of the search keyword, the keyword dictionary means 1 and the thesaurus dictionary means 7 are used. Even if the stored contents (registered words) are inconsistent, the words that are expanded by the thesaurus from the search keyword are always registered as keywords in the storage unit 5. Therefore, a document search that uses the synonyms and related words obtained by thesaurus expansion reliably and effectively as a search keyword is performed, and the document search that matches the user's intention using thesaurus expansion is realized.

【0026】図2には本発明の第2実施例に係る文書登
録検索システムを示してある。なお、上記した第1実施
例と同一部分には同一符号を付して重複する説明は省略
する。本実施例の文書登録検索システムは、シソーラス
辞書の内容を編集するためにユーザシソーラス辞書手段
10を新たに付加したものである。このユーザシソーラ
ス辞書手段10は、例えば利用者が別途購入する等した
利用者が必要とするシソーラスを格納しており、既にシ
ステムに備えられているシソーラス辞書手段7の格納内
容を増加させる。すなわち、ユーザシソーラス辞書手段
10はシソーラス辞書手段7が格納していなかった登録
語や類語及び関連語を格納しており、シソーラス辞書手
段7とユーザシソーラス辞書手段10との格納内容が相
俟ってシステムに設定されたシソーラスが増加する。
FIG. 2 shows a document registration / retrieval system according to the second embodiment of the present invention. The same parts as those in the first embodiment described above are designated by the same reference numerals, and duplicate description will be omitted. The document registration / retrieval system according to the present embodiment additionally includes a user thesaurus dictionary means 10 for editing the contents of the thesaurus dictionary. The user thesaurus dictionary means 10 stores a thesaurus required by the user, for example, the user purchases it separately, and increases the contents stored in the thesaurus dictionary means 7 already provided in the system. That is, the user thesaurus dictionary means 10 stores registered words, synonyms and related words which the thesaurus dictionary means 7 did not store, and the stored contents of the thesaurus dictionary means 7 and the user thesaurus dictionary means 10 are combined. The thesaurus set in the system increases.

【0027】そして、本実施例では、ユーザシソーラス
辞書手段10の増設に伴って、キーワード抽出に際して
キーワード抽出手段3がシソーラス辞書手段7の格納内
容と共にユーザシソーラス辞書手段10の格納内容も参
照し、ユーザシソーラス辞書手段10の格納内容からも
類語や関連語をキーワードを抽出する。また、検索キー
ワードのシソーラス展開に際してシソーラス展開手段8
がシソーラス辞書手段7の格納内容と共にユーザシソー
ラス辞書手段10の格納内容も参照し、ユーザシソーラ
ス辞書手段10の格納内容からも検索キーワードの類語
や関連語を抽出する。
In the present embodiment, as the user thesaurus dictionary means 10 is added, the keyword extracting means 3 refers to the stored content of the thesaurus dictionary means 7 as well as the stored content of the user thesaurus dictionary means 10 when extracting the keyword, The synonyms and related words are also extracted as keywords from the contents stored in the thesaurus dictionary means 10. Further, thesaurus expansion means 8 is used when expanding the thesaurus of search keywords.
Refers to the storage content of the user thesaurus dictionary means 10 as well as the storage content of the thesaurus dictionary means 7, and extracts synonyms and related words of the search keyword from the storage content of the user thesaurus dictionary means 10.

【0028】第2実施例の文書登録検索システムにおい
ては、第1実施例と同様に文書登録や文書検索がなされ
るが、登録に際してのキーワード抽出や検索に際しての
検索キーワードの展開において、ユーザシソーラス辞書
手段10の格納内容によって増加された語も抽出し、こ
れら語をキーワード或いは検索キーワードとして文書の
登録や検索を行うため、利用者の必要性に対応した文書
の登録検索処理が実現される。そして、このように利用
者の必要性に柔軟に対応させても、キーワード抽出はキ
ーワード辞書手段1のみならず、シソーラス辞書手段7
及びユーザシソーラス辞書手段10も参照して行われる
ため、キーワード辞書手段1とシソーラス辞書手段7及
びユーザシソーラス辞書手段10との間で格納内容に整
合性がなくとも、検索キーワードからシソーラス展開さ
れる語は必ずキーワードとして記憶手段5に登録され、
シソーラス展開して得られた類語や関連語を検索キーワ
ードとして確実且つ有効に用いた文書検索がなされる。
In the document registration / retrieval system of the second embodiment, document registration and document retrieval are carried out in the same manner as in the first embodiment, but the user thesaurus dictionary is used for extracting keywords during registration and expanding retrieval keywords during retrieval. The words increased by the contents stored in the means 10 are also extracted, and the words are used as keywords or search keywords to register or search the document, so that the document registration / retrieval process corresponding to the need of the user is realized. Even if the user's needs are flexibly dealt with in this way, the keyword extraction is performed not only by the keyword dictionary means 1 but also by the thesaurus dictionary means 7.
Also, since the user thesaurus dictionary means 10 is also referred to, even if the stored contents of the keyword dictionary means 1, thesaurus dictionary means 7, and the user thesaurus dictionary means 10 are inconsistent, the words that are expanded thesaurus from the search keyword are used. Is always registered as a keyword in the storage means 5,
Document search is performed using the synonyms and related words obtained by thesaurus expansion as search keywords reliably and effectively.

【0029】なお、第2実施例の変形例として、検索キ
ーワードのシソーラス展開はシソーラス展開手段8がシ
ソーラス辞書手段7及びユーザシソーラス辞書手段10
を参照して行い、キーワード抽出はキーワード抽出手段
3がシソーラス辞書手段7を参照せずにユーザシソーラ
ス辞書手段10とキーワード辞書手段1を参照して行う
ようにしてもよい。
As a modification of the second embodiment, the thesaurus expansion means 8 for the thesaurus expansion of the search keyword is the thesaurus dictionary means 7 and the user thesaurus dictionary means 10.
The keyword extraction unit 3 may perform the keyword extraction by referring to the user thesaurus dictionary unit 10 and the keyword dictionary unit 1 without referring to the thesaurus dictionary unit 7.

【0030】図3には本発明の第3実施例に係る文書登
録検索システムを示してある。なお、上記した第1実施
例と同一部分には同一符号を付して重複する説明は省略
する。本実施例の文書登録検索システムは、キーワード
辞書の内容を編集するためにユーザキーワード辞書手段
11を新たに付加したものである。このユーザキーワー
ド辞書手段11は、例えば利用者が別途購入する等した
利用者が必要とするキーワードを格納しており、既にシ
ステムに備えられているキーワード辞書手段1の格納内
容を増加させる。すなわち、ユーザキーワード辞書手段
11はキーワード辞書手段1が格納していなかった候補
語を格納しており、キーワード辞書手段1とユーザキー
ワード辞書手段11との格納内容が相俟ってシステムに
設定されたキーワードとして抽出すべき語が増加する。
FIG. 3 shows a document registration / retrieval system according to the third embodiment of the present invention. The same parts as those in the first embodiment described above are designated by the same reference numerals, and duplicate description will be omitted. The document registration / retrieval system of this embodiment additionally includes a user keyword dictionary means 11 for editing the contents of the keyword dictionary. The user keyword dictionary means 11 stores keywords required by the user, for example, the user purchases separately, and increases the stored contents of the keyword dictionary means 1 already provided in the system. That is, the user keyword dictionary means 11 stores the candidate words that the keyword dictionary means 1 did not store, and the storage contents of the keyword dictionary means 1 and the user keyword dictionary means 11 are set in the system together. More words should be extracted as keywords.

【0031】そして、本実施例では、ユーザキーワード
辞書手段11の増設に伴って、キーワード抽出に際して
キーワード抽出手段3がキーワード辞書手段1の格納内
容と共にユーザキーワード辞書手段11の格納内容も参
照し、ユーザキーワード辞書手段11の格納内容からも
キーワードを抽出する。
In this embodiment, the keyword extracting means 3 refers to the stored content of the keyword dictionary means 1 as well as the stored content of the user keyword dictionary means 11 when extracting the keywords as the user keyword dictionary means 11 is added. Keywords are also extracted from the stored contents of the keyword dictionary means 11.

【0032】第3実施例の文書登録検索システムにおい
ては、第1実施例と同様に文書登録や文書検索がなされ
るが、登録に際してのキーワード抽出においてユーザキ
ーワード辞書手段11の格納内容によって増加された語
も抽出し、これら語をキーワードとして文書の登録を行
うため、利用者の必要性に対応した文書の登録処理が実
現される。そして、このようにキーワード辞書の内容を
増加させて利用者の必要性に柔軟に対応させて、キーワ
ード辞書とシソーラス辞書との間で格納内容の整合性が
崩れても、キーワードとして抽出されて登録される語が
検索キーワードとされる語を上回るだけで、第1実施例
と同様にシソーラス展開して得られた類語や関連語を検
索キーワードとして確実且つ有効に用いた文書検索がな
される。
In the document registration / retrieval system of the third embodiment, document registration and document retrieval are carried out in the same manner as in the first embodiment, but the number is increased by the contents stored in the user keyword dictionary means 11 in the keyword extraction during registration. Since words are also extracted and the document is registered using these words as keywords, the document registration processing corresponding to the user's need is realized. In this way, by increasing the contents of the keyword dictionary and flexibly responding to the needs of the user, even if the consistency of the stored contents between the keyword dictionary and thesaurus dictionary is lost, it is extracted and registered as a keyword. Only when the number of defined words exceeds the number of search keywords, a document search is performed using the synonyms and related words obtained by thesaurus expansion as the search keywords reliably and effectively, as in the first embodiment.

【0033】なお、第2実施例と第3実施例とを複合さ
せた変形例として、検索キーワードのシソーラス展開は
シソーラス展開手段8がシソーラス辞書手段7及びユー
ザシソーラス辞書手段10を参照して行い、キーワード
抽出はキーワード抽出手段3がシソーラス辞書手段7を
参照せずにキーワード辞書手段1、ユーザキーワード辞
書手段11及びユーザシソーラス辞書手段10を参照し
て行うようにしてもよい。また、第2実施例と第3実施
例とを複合させた他の変形例として、検索キーワードの
シソーラス展開はシソーラス展開手段8がシソーラス辞
書手段7及びユーザシソーラス辞書手段10を参照して
行い、キーワード抽出はキーワード抽出手段3がキーワ
ード辞書手段1、ユーザキーワード辞書手段11、シソ
ーラス辞書手段7及びユーザシソーラス辞書手段10を
参照して行うようにしてもよい。
As a modified example in which the second and third embodiments are combined, thesaurus expansion of the search keyword is performed by the thesaurus expansion means 8 by referring to the thesaurus dictionary means 7 and the user thesaurus dictionary means 10. The keyword extraction unit 3 may perform keyword extraction by referring to the keyword dictionary unit 1, the user keyword dictionary unit 11, and the user thesaurus dictionary unit 10 without referring to the thesaurus dictionary unit 7. As another modification in which the second embodiment and the third embodiment are combined, the thesaurus expansion of the search keyword is performed by the thesaurus expansion means 8 by referring to the thesaurus dictionary means 7 and the user thesaurus dictionary means 10. The keyword extraction means 3 may perform the extraction by referring to the keyword dictionary means 1, the user keyword dictionary means 11, the thesaurus dictionary means 7, and the user thesaurus dictionary means 10.

【0034】図4には本発明の第4実施例に係る文書登
録検索システムを示してある。なお、上記した第1実施
例と同一部分には同一符号を付して重複する説明は省略
する。本実施例の文書登録検索システムは、キーワード
辞書及びシソーラス辞書の内容を編集するためにユーザ
辞書手段12を新たに付加したものである。このユーザ
辞書手段12は、例えば利用者が別途購入する等した利
用者が必要とするキーワード及びシソーラスを格納して
おり、既にシステムに備えられているキーワード辞書手
段1及びシソーラス辞書手段7の格納内容を増加させ
る。すなわち、ユーザ辞書手段12はキーワード辞書手
段1が格納していなかった候補語及びシソーラス辞書手
段7が格納していなかった類語や関連語を格納してお
り、キーワード辞書手段1及びシソーラス辞書手段7と
ユーザ辞書手段12との格納内容が相俟ってシステムに
設定されたキーワードや検索キーワードとして抽出すべ
き語が増加する。
FIG. 4 shows a document registration / retrieval system according to the fourth embodiment of the present invention. The same parts as those in the first embodiment described above are designated by the same reference numerals, and duplicate description will be omitted. The document registration / retrieval system according to the present embodiment additionally includes a user dictionary means 12 for editing the contents of the keyword dictionary and thesaurus dictionary. This user dictionary means 12 stores, for example, keywords and thesauri needed by the user, such as those purchased separately by the user, and the stored contents of the keyword dictionary means 1 and thesaurus dictionary means 7 already provided in the system. To increase. That is, the user dictionary means 12 stores candidate words which the keyword dictionary means 1 did not store and synonyms and related words which the thesaurus dictionary means 7 did not store, and the keyword dictionary means 1 and the thesaurus dictionary means 7 The contents stored in the user dictionary means 12 are combined with each other to increase the number of words to be extracted as keywords or search keywords set in the system.

【0035】そして、本実施例では、ユーザ辞書手段1
2の増設に伴って、キーワード抽出に際してキーワード
抽出手段3がキーワード辞書手段1及びシソーラス辞書
手段7の格納内容と共にユーザ辞書手段12の格納内容
も参照し、ユーザ辞書手段12の格納内容からもキーワ
ードを抽出する。また、検索キーワードのシソーラス展
開に際してシソーラス展開手段8がシソーラス辞書手段
7の格納内容と共にユーザ辞書手段12の格納内容も参
照し、ユーザ辞書手段12の格納内容からも検索キーワ
ードの類語や関連語を抽出する。
In the present embodiment, the user dictionary means 1
With the addition of 2, the keyword extracting unit 3 refers to the stored contents of the user dictionary unit 12 as well as the stored contents of the keyword dictionary unit 1 and thesaurus dictionary unit 7 when extracting the keywords, and the keyword is also extracted from the stored contents of the user dictionary unit 12. Extract. When the search keyword is expanded, the thesaurus expansion means 8 also refers to the contents stored in the thesaurus dictionary means 7 as well as the contents stored in the user dictionary means 12, and extracts synonyms and related words of the search keyword from the contents stored in the user dictionary means 12. To do.

【0036】第4実施例の文書登録検索システムにおい
ては、第1実施例と同様に文書登録や文書検索がなされ
るが、登録に際してのキーワード抽出においてユーザ辞
書手段12の格納内容によって増加された語も抽出し、
これら語をキーワードとして文書の登録を行うため、利
用者の必要性に対応した文書の登録処理が実現される。
また、検索に際しての検索キーワードの展開においてユ
ーザ辞書手段12の格納内容によって増加された語も類
語や間連語として抽出し、これら語を検索キーワードと
して文書の検索を行うため、利用者の必要性に対応した
文書の検索処理が実現される。そして、このようにキー
ワード辞書やシソーラス辞書の内容を増加させて利用者
の必要性に柔軟に対応させても、キーワードとして抽出
されて登録される語と検索キーワードとされる語は辞書
手段で設定された同一の範囲の語であり、第1実施例と
同様にシソーラス展開して得られた類語や関連語を検索
キーワードとして確実且つ有効に用いた文書検索がなさ
れる。
In the document registration / retrieval system of the fourth embodiment, document registration and document retrieval are performed in the same manner as in the first embodiment, but words increased by the contents stored in the user dictionary means 12 in keyword extraction at the time of registration. Also extracted,
Since the document is registered using these words as keywords, the document registration process corresponding to the need of the user is realized.
Further, the words increased by the contents stored in the user dictionary means 12 in the expansion of the search keyword at the time of search are also extracted as the synonyms and collocations, and the document is searched using these words as the search keyword. A corresponding document search process is realized. Even if the contents of the keyword dictionary or thesaurus dictionary are increased in this way to flexibly meet the needs of the user, the words extracted and registered as keywords and the words used as search keywords are set by the dictionary means. The document search is performed by using the synonyms and related words obtained by thesaurus expansion as the search keyword surely and effectively, which are the same range of words as those obtained in the first embodiment.

【0037】なお、第4実施例の変形例として、検索キ
ーワードのシソーラス展開はシソーラス展開手段8がシ
ソーラス辞書手段7及びユーザ辞書手段12を参照して
行い、キーワード抽出はキーワード抽出手段3がシソー
ラス辞書手段7を参照せずにキーワード辞書手段1及び
ユーザ辞書手段12を参照して行うようにしてもよい。
As a modification of the fourth embodiment, thesaurus expansion means 8 refers to the thesaurus dictionary means 7 and the user dictionary means 12 to perform thesaurus expansion of the search keyword, and the keyword extraction means 3 extracts the keyword from the thesaurus dictionary. Instead of referring to the means 7, the keyword dictionary means 1 and the user dictionary means 12 may be referred to.

【0038】上記した第4実施例の文書登録検索システ
ムを例にとって、図5〜図9を参照して文書登録及び文
書検索の処理を更に具体的に説明する。なお、以下の説
明では、キーワード辞書手段1には図7の(a)に示す
ような語がキーワードの候補として格納され、ユーザ辞
書手段12には図7の(b)に示すような語がシソーラ
ス或いはキーワードの候補として格納され、シソーラス
辞書手段7には図8の(a)に示すような語が登録語の
シソーラスとして格納されている。また、図9の(a)
に示すような内容の5つの文書(文書名:文書1〜文書
5)を登録の対象とする。
Taking the document registration / retrieval system of the fourth embodiment as an example, the process of document registration and document retrieval will be described more specifically with reference to FIGS. In the following description, the keyword dictionary means 1 stores words as shown in FIG. 7A as keyword candidates, and the user dictionary means 12 stores words as shown in FIG. 7B. The thesaurus is stored as a thesaurus or a keyword candidate, and the thesaurus dictionary means 7 stores words as shown in FIG. 8A as a thesaurus of registered words. In addition, FIG.
Five documents (document names: document 1 to document 5) having the contents shown in are registered.

【0039】まず、文書の登録処理を図5に示すフロー
チャートを参照して説明する。登録処理が利用者からに
指示等によって開始されると、キーワード抽出手段3が
作業領域として有しているメモリ領域にユーザ辞書手段
12、キーワード辞書手段1及びシソーラス辞書手段7
からそれぞれの格納内容を読み込み、読み込んだ語をキ
ーワードデータとして保持する(ステップS1〜S
3)。すなわち、キーワードデータとしては図7の
(c)に示すように、図7の(a)に示すキーワード辞
書の内容から「大学」、「東京」、「慶応」、「京
都」、「富士ゼロックス」が読み込まれると共に図7の
(b)に示すユーザ辞書の内容から「早稲田」が読み込
まれ、更に、これらの語の内の「大学」をユーザ辞書の
シソーラスで展開して「東大」も読み込まれる。なお、
図8の(a)に示すシソーラス辞書によってもシソーラ
スが行われるが、この例ではキーワードデータの内容に
特に影響しない。
First, the document registration process will be described with reference to the flowchart shown in FIG. When the registration process is started by an instruction or the like from the user, the user dictionary unit 12, the keyword dictionary unit 1, and the thesaurus dictionary unit 7 are stored in the memory area of the keyword extraction unit 3 as a work area.
Each stored content is read from and the read word is held as keyword data (steps S1 to S).
3). That is, as shown in (c) of FIG. 7, as keyword data, “university”, “Tokyo”, “Keio”, “Kyoto”, “Fuji Xerox” are selected from the contents of the keyword dictionary shown in (a) of FIG. “Waseda” is read from the contents of the user dictionary shown in FIG. 7B, and “University” among these words is expanded by the thesaurus of the user dictionary and “Todai” is also read. . In addition,
Although the thesaurus is also performed by the thesaurus dictionary shown in FIG. 8A, this example does not particularly affect the content of the keyword data.

【0040】次いで、文書入力手段2が上記した5つの
文書を読み込み(ステップS4)、これら文書のデータ
をキーワード抽出手段3が作業領域に格納する。そし
て、これら5つの文書について1つずつ以下のようなキ
ーワード抽出及び登録処理を行い(ステップS5、S
6)、全ての文書についての処理が終了したところで登
録処理を終了する(ステップS7)。すなわち、図9の
(a)に示した各文書の内容についてキーワード抽出手
段3がキーワードデータに読み込んだ語が含まれている
かを検索して、含まれている場合にはそれらの語を各文
書に対応して抽出する(ステップS5)。この結果、図
9の(b)に示すように、各文書名毎にキーワードが抽
出され、例えば、文書1からは「慶応」と「大学」がキ
ーワードとして抽出される。
Next, the document input means 2 reads the above-mentioned five documents (step S4), and the keyword extraction means 3 stores the data of these documents in the work area. Then, the following keyword extraction and registration processing is performed for each of these five documents (steps S5, S
6) When the processing for all the documents is completed, the registration processing is ended (step S7). That is, the keyword extracting unit 3 searches the contents of each document shown in FIG. 9A for whether the keyword data includes the read word. (Step S5). As a result, as shown in FIG. 9B, keywords are extracted for each document name, and for example, “Keio” and “University” are extracted as keywords from document 1.

【0041】そして、これら抽出されたキーワードと各
文書名とを登録手段4がキーワードを見出し語としたイ
ンデックスとし、このインデックスを記憶手段5に格納
する(ステップS6)。すなわち、図9の(b)に示し
た文書名とキーワードは、図9の(c)に示すようなイ
ンデックスとされ、例えば、「大学」というキーワード
を共に含む文書1、文書2及び文書5は、キーワード
「大学」を見出し語としてまとめられて登録される。し
たがって、記憶手段5には類語や関連語をも含んだキー
ワードに対応付けて文書の情報が格納される。
Then, the extracted keyword and each document name are used as an index by the registration means 4 with the keyword as a headword, and this index is stored in the storage means 5 (step S6). That is, the document names and keywords shown in (b) of FIG. 9 are indexes as shown in (c) of FIG. 9, and, for example, document 1, document 2, and document 5 that include the keyword “university” are , The keyword “university” is collected and registered as a headword. Therefore, the storage unit 5 stores document information in association with keywords including synonyms and related terms.

【0042】次に、文書の検索処理を図6に示すフロー
チャートを参照して説明する。利用者からに指示等によ
って検索処理が開始されると、シソーラス展開手段8が
作業領域として有しているメモリ領域にユーザ辞書手段
12及びシソーラス辞書手段7からそれぞれの格納内容
を読み込み、読み込んだ語をシソーラスデータとして保
持する(ステップS11、S12)。すなわち、シソー
ラスデータとしては図8の(b)に示すように、図7の
(b)に示すユーザ辞書のシソーラスから登録語「大
学」に対してシソーラス「東大」が読み込まれると共に
図8の(a)に示すシソーラス辞書の内容から登録語
「大学」に対するシソーラス「慶応」、「東京」、「京
都」が読み込まれる。
Next, the document search processing will be described with reference to the flowchart shown in FIG. When the search process is started by a user's instruction or the like, the stored contents are read from the user dictionary means 12 and thesaurus dictionary means 7 into the memory area which the thesaurus expansion means 8 has as a work area, and the read word is read. Is stored as thesaurus data (steps S11 and S12). That is, as the thesaurus data, as shown in FIG. 8B, the thesaurus “Todai” is read for the registered word “university” from the thesaurus of the user dictionary shown in FIG. The thesauruses "Keio", "Tokyo", and "Kyoto" for the registered word "university" are read from the contents of the thesaurus dictionary shown in a).

【0043】次いで、キーワード入力手段6から利用者
によって検索キーワードが入力されると(ステップS1
3)、シソーラス展開手段8が当該検索キーワードをシ
ソーラスデータを用いて展開し(ステップS14)、展
開されて類語や関連語をも含む検索キーワードを用いて
検索手段9が記憶手段5を検索し(ステップS15)、
検索キーワードに該当する文書名を抽出してディスプレ
イ装置等の出力手から出力する。例えば、「大学」とい
う検索キーワードが入力されたとすると、シソーラスデ
ータから「大学」及び「慶応」、「東京」、「京都」、
「東大」が検索キーワードとされ、図9の(c)に示す
インデックスから該当する文書名として、文書1、文書
2、文書3、文書5が検索される。したがって、シソー
ラス展開した検索キーワードにより、記憶手段5から漏
れのない有効な文書検索がなされる。
Next, when the user inputs a search keyword from the keyword input means 6 (step S1)
3) Then, the thesaurus expansion unit 8 expands the search keyword using thesaurus data (step S14), and the search unit 9 searches the storage unit 5 using the search keyword that is expanded and also includes synonyms and related words ( Step S15),
The document name corresponding to the search keyword is extracted and output from the output device such as a display device. For example, if the search keyword “university” is entered, “the university” and “Keio”, “Tokyo”, “Kyoto”,
With “Tokyo University” as the search keyword, documents 1, 2, 3, and 5 are searched for as the corresponding document names from the index shown in FIG. 9C. Therefore, an effective document search without omission from the storage means 5 is performed using the search keyword expanded in the thesaurus.

【0044】なお、上記実施例では検索された文書の情
報を文書名として示したが、本発明では、文書に付した
識別子や、文書の内容或いはその要約をもって検索され
た文書を出力するよにしてもよい。このように文書の内
容或いはその要約を検索結果とする場合には、インデッ
クスに関連付けた文書記憶手段に文書の内容或いはその
要約を格納しておき、文書名等から対応する文書内容等
を読み出すようにすればよい。また、インデックスの形
式を用いずに、文書の内容或いは要約をキーワードと対
応付けて記憶手段に格納しておき、当該記憶手段を検索
するようにしてもよい。
In the above embodiment, the information of the retrieved document is shown as the document name, but in the present invention, the retrieved document is output based on the identifier attached to the document, the content of the document, or the summary thereof. May be. When the content of the document or the summary thereof is used as the search result, the content or the summary of the document is stored in the document storage unit associated with the index, and the corresponding document content or the like is read from the document name or the like. You can do this. Alternatively, instead of using the index format, the content or the abstract of the document may be stored in the storage unit in association with the keyword, and the storage unit may be searched.

【0045】また、上記実施例ではキーワード辞書やシ
ソーラス辞書の編集を新たな辞書をシステムに付加する
ことにより行ったが、本発明では、例えば利用者が操作
する入力装置を用いて、キーワード辞書手段1やシソー
ラス辞書手段7の格納内容を書き換え、当該格納内容を
増加ばかりではなく変更や削除するようにしてもよい。
Further, in the above embodiment, the keyword dictionary and thesaurus dictionary were edited by adding a new dictionary to the system, but in the present invention, the keyword dictionary means is used, for example, by using the input device operated by the user. 1 or the stored contents of the thesaurus dictionary means 7 may be rewritten so that the stored contents are not only increased but also changed or deleted.

【0046】[0046]

【発明の効果】以上説明したように、請求項1に記載し
た文書登録検索システムによれば、文書登録に際して行
うキーワード抽出は検索に際して使用するシソーラス辞
書手段の内容をも参照して行うようにしたため、キーワ
ード辞書とシソーラス辞書との内容に整合性がとれてい
ない場合にあっても、シソーラス展開された検索キーワ
ードによって利用者の意図に合致した有効な文書検索を
行うことができる。また、請求項2又は請求項4に記載
した文書登録検索システムによれば、上記の効果を維持
しつつ、シソーラス辞書の内容を編集することができる
ため、利用者の必要に応じた効果的な文書検索を行うこ
とができる。
As described above, according to the document registration / retrieval system according to the first aspect, the keyword extraction performed at the time of document registration is performed by also referring to the contents of the thesaurus dictionary means used at the time of retrieval. Even if the contents of the keyword dictionary and the thesaurus dictionary are not consistent, an effective document search that matches the user's intention can be performed by the thesaurus expanded search keyword. Further, according to the document registration / retrieval system according to claim 2 or 4, since the contents of the thesaurus dictionary can be edited while maintaining the above effect, it is effective according to the needs of the user. You can search documents.

【0047】また、請求項3又は請求項4に記載した文
書登録検索システムによれば、上記の効果を維持しつ
つ、キーワード辞書の内容を編集することができるた
め、利用者の必要に応じた効果的な文書の登録及び検索
を行うことができる。特に、請求項4に記載した文書登
録検索システムによれば、辞書の内容の編集作業が容易
であるとともに、システムも新たな辞書を付加するため
のアダプタを設置する程度の変更を施せばよく、極めて
簡便にして辞書の編集を実現することができる
Further, according to the document registration / retrieval system according to the third or fourth aspect, the contents of the keyword dictionary can be edited while maintaining the above effect, so that it is possible to meet the needs of the user. Effective document registration and retrieval can be performed. In particular, according to the document registration / retrieval system described in claim 4, it is easy to edit the contents of the dictionary, and the system may be modified by installing an adapter for adding a new dictionary. It is very easy to edit a dictionary

【図面の簡単な説明】[Brief description of drawings]

【図1】 本発明の第1実施例に係る文書登録検索シス
テムの構成を示すブロック図である。
FIG. 1 is a block diagram showing a configuration of a document registration / retrieval system according to a first embodiment of the present invention.

【図2】 本発明の第2実施例に係る文書登録検索シス
テムの構成を示すブロック図である。
FIG. 2 is a block diagram showing a configuration of a document registration / retrieval system according to a second embodiment of the present invention.

【図3】 本発明の第3実施例に係る文書登録検索シス
テムの構成を示すブロック図である。
FIG. 3 is a block diagram showing a configuration of a document registration / retrieval system according to a third embodiment of the present invention.

【図4】 本発明の第4実施例に係る文書登録検索シス
テムの構成を示すブロック図である。
FIG. 4 is a block diagram showing a configuration of a document registration / retrieval system according to a fourth embodiment of the present invention.

【図5】 文書登録処理の一例を示すフローチャートで
ある。
FIG. 5 is a flowchart showing an example of document registration processing.

【図6】 文書検索処理の一例を示すフローチャートで
ある。
FIG. 6 is a flowchart illustrating an example of document search processing.

【図7】 キーワード抽出に用いるデータ内容を示す図
であり、(a)はキーワード辞書の内容、(b)はユー
ザ辞書の内容、(c)はキーワードデータの内容であ
る。
7A and 7B are diagrams showing data contents used for keyword extraction, where FIG. 7A shows the contents of a keyword dictionary, FIG. 7B shows the contents of a user dictionary, and FIG. 7C shows the contents of keyword data.

【図8】 シソーラス展開に用いるデータ内容を示す図
であり、(a)はシソーラス辞書の内容、(b)はシソ
ーラスデータの内容である。
8A and 8B are diagrams showing data contents used for thesaurus expansion. FIG. 8A shows the contents of a thesaurus dictionary, and FIG. 8B shows the contents of thesaurus data.

【図9】 文書に関するデータを示す図であり、(a)
は登録対象の文書の内容、(b)は文書名とキーワード
のの関係、(c)は記憶手段に格納されたインデックス
の内容である。
FIG. 9 is a diagram showing data related to a document, (a)
Is the content of the document to be registered, (b) is the relationship between the document name and the keyword, and (c) is the content of the index stored in the storage means.

【符号の説明】[Explanation of symbols]

1・・・キーワード辞書手段、 2・・・文書入力手
段、3・・・キーワード抽出手段、 5・・・記憶手
段、6・・・キーワード入力手段、 7・・・シソーラ
ス辞書手段、8・・・シソーラス展開手段、 9・・・
検索手段
1 ... Keyword dictionary means, 2 ... Document input means, 3 ... Keyword extraction means, 5 ... Storage means, 6 ... Keyword input means, 7 ... Thesaurus dictionary means, 8 ...・ Thesaurus deployment means, 9 ・ ・ ・
Search method

───────────────────────────────────────────────────── フロントページの続き (72)発明者 山下 明男 神奈川県川崎市高津区坂戸3丁目2番1号 KSP R&D ビジネスパークビル 富士ゼロックス株式会社内 (72)発明者 相原 一雄 神奈川県川崎市高津区坂戸3丁目2番1号 KSP R&D ビジネスパークビル 富士ゼロックス株式会社内 (72)発明者 山口 浩 神奈川県川崎市高津区坂戸3丁目2番1号 KSP R&D ビジネスパークビル 富士ゼロックス株式会社内 (72)発明者 松尾 裕子 神奈川県川崎市高津区坂戸3丁目2番1号 KSP R&D ビジネスパークビル 富士ゼロックス株式会社内 (72)発明者 川本 真司 神奈川県川崎市高津区坂戸3丁目2番1号 KSP R&D ビジネスパークビル 富士ゼロックス株式会社内 (72)発明者 平岡 直美 神奈川県川崎市高津区坂戸3丁目2番1号 KSP R&D ビジネスパークビル 富士ゼロックス株式会社内 ─────────────────────────────────────────────────── ─── Continued Front Page (72) Akio Yamashita Akio Yamashita 3-2-1 Sakado, Takatsu-ku, Kawasaki City, Kanagawa KSP R & D Business Park Building Fuji Xerox Co., Ltd. (72) Kazuo Aihara Sakado, Takatsu-ku, Kawasaki City, Kanagawa Prefecture 3-2-1 KSP R & D Business Park Building in Fuji Xerox Co., Ltd. (72) Inventor Hiroshi Yamaguchi 3-2-1 Sakado, Takatsu-ku, Kawasaki City, Kanagawa Prefecture KSP R & D Business Park Building in Fuji Xerox Co., Ltd. (72) Inventor Matsuo Yuko 3-2-1, Sakado, Takatsu-ku, Kawasaki-shi, Kanagawa KSP R & D Business Park Building Fuji Xerox Co., Ltd. (72) Inventor Shinji Kawamoto 3-2-1, Sakado, Takatsu-ku, Kawasaki-shi, Kanagawa KSP R & D Business Park Building Fuji Xerox Co., Ltd. (72) Inventor Naomi Hiraoka 3-2-1 Sakado, Takatsu-ku, Kawasaki City, Kanagawa Prefecture KSP R & D Business Park Building Fuji Xerox Co., Ltd.

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】 抽出すべきキーワードを格納したキーワ
ード辞書手段と、登録すべき文書を入力する文書入力手
段と、入力された文書からキーワード辞書手段の内容を
参照してキーワードを抽出するキーワード抽出手段と、
抽出されたキーワードに対応付けて入力された文書に関
する情報を格納する記憶手段と、文書を検索するための
検索キーワードを入力するキーワード入力手段と、所定
の語の類語や関連語を格納したシソーラス辞書手段と、
入力された検索キーワードをシソーラス辞書手段の内容
を参照して類語や関連語へ展開するシソーラス展開手段
と、展開された検索キーワードを用いて前記記憶手段か
ら該当する文書の情報を検索する検索手段と、を備えた
文書登録検索システムにおいて、 前記キーワード抽出手段はシソーラス辞書手段の内容を
も参照してキーワードを抽出することを特徴とする文書
登録検索システム。
1. A keyword dictionary means for storing keywords to be extracted, a document input means for inputting a document to be registered, and a keyword extracting means for extracting a keyword from the input document by referring to the contents of the keyword dictionary means. When,
A storage unit that stores information about a document that is input in association with the extracted keyword, a keyword input unit that inputs a search keyword for searching the document, and a thesaurus dictionary that stores synonyms and related terms of a predetermined word. Means and
A thesaurus expansion means for expanding the input search keyword into synonyms and related words by referring to the contents of the thesaurus dictionary means; and a search means for searching the information of the corresponding document from the storage means using the expanded search keyword. In the document registration / retrieval system, the keyword extracting unit extracts a keyword by also referring to the contents of the thesaurus dictionary unit.
【請求項2】 請求項1に記載の文書登録検索システム
において、 前記シソーラス辞書手段の格納内容を編集するシソーラ
ス編集手段を更に備えたことを特徴とする文書登録検索
システム。
2. The document registration / retrieval system according to claim 1, further comprising a thesaurus editing means for editing the contents stored in the thesaurus dictionary means.
【請求項3】 請求項1又は請求項2に記載の文書登録
検索システムにおいて、 前記キーワード辞書手段の格納内容を編集するキーワー
ド編集手段を更に備えたことを特徴とする文書登録検索
システム。
3. The document registration / retrieval system according to claim 1 or 2, further comprising keyword editing means for editing the contents stored in the keyword dictionary means.
【請求項4】 請求項2又は請求項3に記載の文書登録
検索システムにおいて、 前記編集手段による編集は前記辞書手段に新たな辞書手
段を付加することにより行うことを特徴とする文書登録
検索システム。
4. The document registration / retrieval system according to claim 2 or 3, wherein the editing by the editing means is performed by adding a new dictionary means to the dictionary means. .
JP7091661A 1995-03-24 1995-03-24 Document registration and retrieval system Pending JPH08263521A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7091661A JPH08263521A (en) 1995-03-24 1995-03-24 Document registration and retrieval system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7091661A JPH08263521A (en) 1995-03-24 1995-03-24 Document registration and retrieval system

Publications (1)

Publication Number Publication Date
JPH08263521A true JPH08263521A (en) 1996-10-11

Family

ID=14032683

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7091661A Pending JPH08263521A (en) 1995-03-24 1995-03-24 Document registration and retrieval system

Country Status (1)

Country Link
JP (1) JPH08263521A (en)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10134065A (en) * 1996-10-29 1998-05-22 Nec Corp Index information generation device, index information generation method and storage medium storing index information generation program
JPH10240771A (en) * 1997-02-21 1998-09-11 Nec Corp Image retrieval method based upon meaning and recognition and device therefor
JPH10307836A (en) * 1997-05-09 1998-11-17 Nec Eng Ltd Data processing system
JP2002269132A (en) * 2001-03-07 2002-09-20 Riso Kagaku Corp Retrieval auxiliary server and retrieval system
JP2003308324A (en) * 2002-04-12 2003-10-31 Yomiuri Shimbun Search word processor, and device for retrieving document
WO2007032483A1 (en) * 2005-09-16 2007-03-22 Jam Corporation Information search assisting apparatus, computer program, program storing medium, and information searching method
JP2021072102A (en) * 2018-03-23 2021-05-06 株式会社半導体エネルギー研究所 Document search method and document search device

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10134065A (en) * 1996-10-29 1998-05-22 Nec Corp Index information generation device, index information generation method and storage medium storing index information generation program
JPH10240771A (en) * 1997-02-21 1998-09-11 Nec Corp Image retrieval method based upon meaning and recognition and device therefor
JPH10307836A (en) * 1997-05-09 1998-11-17 Nec Eng Ltd Data processing system
JP2002269132A (en) * 2001-03-07 2002-09-20 Riso Kagaku Corp Retrieval auxiliary server and retrieval system
JP2003308324A (en) * 2002-04-12 2003-10-31 Yomiuri Shimbun Search word processor, and device for retrieving document
WO2007032483A1 (en) * 2005-09-16 2007-03-22 Jam Corporation Information search assisting apparatus, computer program, program storing medium, and information searching method
JP2021072102A (en) * 2018-03-23 2021-05-06 株式会社半導体エネルギー研究所 Document search method and document search device
US11789953B2 (en) 2018-03-23 2023-10-17 Semiconductor Energy Laboratory Co., Ltd. Document search system, document search method, program, and non-transitory computer readable storage medium
US12019636B2 (en) 2018-03-23 2024-06-25 Semiconductor Energy Laboratory Co., Ltd. Document search system, document search method, program, and non-transitory computer readable storage medium

Similar Documents

Publication Publication Date Title
JP4544674B2 (en) A system that provides information related to the selected string
JP2783558B2 (en) Summary generation method and summary generation device
US5794177A (en) Method and apparatus for morphological analysis and generation of natural language text
US5303150A (en) Wild-card word replacement system using a word dictionary
US5680628A (en) Method and apparatus for automated search and retrieval process
JP2742115B2 (en) Similar document search device
US20060031207A1 (en) Content search in complex language, such as Japanese
JP3022539B1 (en) Document search device
JPH08263521A (en) Document registration and retrieval system
JPH08147311A (en) Method for retrieving structured document and device therefor
JPH08171569A (en) Document retrieval device
US5682543A (en) Dictionary editing apparatus
JP2894301B2 (en) Document search method and apparatus using context information
KR20020054254A (en) Analysis Method for Korean Morphology using AVL+Trie Structure
JPH05298371A (en) Retrieving system
JPS61248160A (en) Document information registering system
EP1605371A1 (en) Content search in complex language, such as japanese
JPH07296005A (en) Japanese text registration/retrieval device
WO2005098672A1 (en) Electronic dictionary
JP3187671B2 (en) Electronic dictionary display
JPH07325837A (en) Communication sentence retrieval device by abstract word and communication sentence retreival method by the abstract word
JPH04211868A (en) Method for creating keyword for retrieval of cd-rom data
JPH07141381A (en) Electronic dictionary display device
JPH04330565A (en) Natural language processing system using universal file
JPH0821031B2 (en) Language analyzer