JPH0973454A - Device and method for document preparation - Google Patents

Device and method for document preparation

Info

Publication number
JPH0973454A
JPH0973454A JP7225379A JP22537995A JPH0973454A JP H0973454 A JPH0973454 A JP H0973454A JP 7225379 A JP7225379 A JP 7225379A JP 22537995 A JP22537995 A JP 22537995A JP H0973454 A JPH0973454 A JP H0973454A
Authority
JP
Japan
Prior art keywords
search
correspondence table
paraphrase
document
expression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7225379A
Other languages
Japanese (ja)
Inventor
Yasuo Tanosaki
康雄 田野崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP7225379A priority Critical patent/JPH0973454A/en
Publication of JPH0973454A publication Critical patent/JPH0973454A/en
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a document preparation device which can actualize high- level ambiguity retrieval and accurately retrieve desired data from a large document data base by performing the retrieval by using an automatically generated vocabulary correspondence table. SOLUTION: This device is equipped with a morpheme analysis part 1a, a syntax analysis part 1b, a paraphrastic expression extraction part 1c, and a paraphrastic expression analysis part 1d, the correspondence table of paraphrastic expressions and expression words and phrases to be expressed in different words can automatically be generated only by giving general text data as input data, and not only paraphrastic words included in the paraphrastic expressions, but also modifiers attached thereto are stored in correspondence relation, so ambiguity retrieval accompanied with various logical operations is possible by utilizing the dictionary which is generated here.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、テキストデータベ
ースから自動的に抽出・生成された連想キーデータを用
いて曖昧詮索を行う文書作成装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a document creating apparatus for performing ambiguous snooping using associative key data automatically extracted / generated from a text database.

【0002】[0002]

【従来の技術】従来、文書作成装置に於ける文書検索で
の曖昧検索を行うためには、類語辞書・シソーラス等を
用いるのが一般的であった。しかし、これらの辞書を整
備するのには時間を要し、特に進歩の速い先端科学の分
野の検索には追従できない状況であった。
2. Description of the Related Art Conventionally, in order to perform an ambiguous search in a document search in a document creation device, it has been general to use a thesaurus or thesaurus. However, it took time to maintain these dictionaries, and it was impossible to follow the search in the field of advanced science, which is progressing rapidly.

【0003】[0003]

【発明が解決しようとする課題】上述したように、従
来、曖昧検索を行う際に一般的な既存の類語辞書或いは
シソーラスといったものを利用するのでは効率が悪い。
そのため、自動的にこういった辞書を生成する手段及び
これを参照して文書検索を行う手段が渇望されていた。
更に、文章中には新出語の説明を行う「言い換え表現」
というものが頻繁に現れるが、こういった表現を利用し
て、曖昧検索を行うために必要なデータを自動的に作成
する手段及びこれを利用する手段も渇望されていた。
As described above, it is inefficient to use a general existing synonym dictionary or thesaurus in the conventional fuzzy search.
Therefore, there has been a strong demand for a means for automatically generating such a dictionary and a means for searching a document by referring to the means.
In addition, "paraphrases" that explain new words in sentences
However, there has been a long-felt demand for means for automatically creating the data necessary for performing fuzzy search using such expressions and means for using this.

【0004】そこで、本発明は上記事情を考慮して成さ
れたもので、自動生成された語彙対応表を用いて検索を
行うことにより、高度の曖昧検索を実現することがで
き、大量な文書データベースの中から所望のものを的確
に検索することが可能な文書作成装置を提供することを
目的とする。
Therefore, the present invention has been made in consideration of the above circumstances. By performing a search using an automatically generated vocabulary correspondence table, a high-level fuzzy search can be realized, and a large amount of documents can be obtained. It is an object of the present invention to provide a document creation device capable of accurately searching for a desired one from a database.

【0005】[0005]

【課題を解決するための手段】本発明は、上記目的を達
成するため、文書作成装置であって、見出し語に対応づ
けてその言い換え語をその修飾語とともに格納する語彙
対応表格納手段と、検索のためのキーワードを入力する
キーワード入力手段とを具備し、前記語彙対応表格納手
段の格納情報を参照し、前記キーワード入力手段のキー
ワードに対応する言い換え語との修飾語から生成した検
索式を新たな検索キーとして検索を行うようにしたこと
を特徴とする文書作成装置にある。
In order to achieve the above-mentioned object, the present invention is a document creation apparatus, which is a vocabulary correspondence table storage means for storing a paraphrase in association with a headword together with its modifier. A keyword input means for inputting a keyword for a search, referring to the storage information of the vocabulary correspondence table storage means, and a search expression generated from a modifier with a paraphrase corresponding to the keyword of the keyword input means. The document creating apparatus is characterized in that a search is performed as a new search key.

【0006】又、本発明は上記目的を達成するため、上
記文書作成装置にあって、見出し語に対する言い換え語
が同義語であり、それが、複合語で表わされる場合に
は、当該複合語を構成する各単語を語彙対応表に格納す
るようにし、見出し語に対する類語検索を行う際、各構
成単語の全てが一定の範囲内に包含する文書を検索する
ようにしたことにある。
In order to achieve the above object, the present invention provides the above-mentioned document creating apparatus, wherein when the paraphrase for the entry word is a synonym and it is represented by a compound word, the compound word is Each of the constituent words is stored in the vocabulary correspondence table, and when the synonym search is performed for the entry word, a document in which all of the constituent words are included within a certain range is searched.

【0007】更に、本発明は上記目的を達成するため、
上記文書作成装置にあって、見出し語に対する言い換え
語が上位概念語である場合には、その文例データ中に現
れた修飾語とともに格納し、見出し語に対する類語検索
を行う際に、上位概念語とその修飾語の全てを包含する
文書を検索するようにしたことにある。
Further, in order to achieve the above object, the present invention provides
In the document creation device, when the paraphrase word for the headword is a superordinate concept word, it is stored together with the modifier appearing in the sentence example data, and when the synonym search for the headword is performed, The search is for documents that include all of the modifiers.

【0008】更に、本発明は上記目的を達成するため
に、上記文書作成装置にあって、文例テキスト中の言い
換え表現を抽出して作成した語彙対応表辞書を設けたこ
とにある。
Further, in order to achieve the above object, the present invention is to provide the above-mentioned document creating apparatus with a vocabulary correspondence table dictionary created by extracting paraphrase expressions in the sentence example text.

【0009】更に、本発明は上記目的を達成するため、
上記文書作成装置にあって、語彙対応表中で、同一見出
し語について、複数の言い換え語で存在する場合には、
その内最も修飾語が少いものを検索キー対象として用い
ることにある。
Further, in order to achieve the above object, the present invention provides
In the document creation device, when the same headword exists in a plurality of paraphrases in the vocabulary correspondence table,
Among them, the one with the fewest modifiers is used as the search key target.

【0010】更に、本発明は上記目的を達成するため、
上記文書作成装置にあって、語彙対応表中のデータを参
照して検索式を作成するようにしたことにある。上記構
成によれば、入力データとしては一般的なテキストデー
タを与えるのみで、言い換え表現と被言い換え表現語句
との対応表を自動的に作成することができる。言い換え
表現は被言い換え表現の内容を説明する表現であり、こ
れが語句の場合には、一般に、被言い換え表現に対する
同義語或いはシソーラスの上位語からなるものである。
そのため本システムで作成された対応表を文書検索シス
テムで参照することにより曖昧検索が実現できる。又、
言い換え表現に含まれる言い換え語のみではなく、これ
に付属した修飾語も被言い換え語に対応づけて格納する
ため、ここで作成された辞書を利用して各種の論理演算
を行なう曖昧検索も可能になる。
Further, in order to achieve the above object, the present invention provides
In the above document creating apparatus, the search formula is created by referring to the data in the vocabulary correspondence table. According to the above configuration, a correspondence table between paraphrase expressions and paraphrased expression words can be automatically created by only providing general text data as input data. The paraphrasing expression is an expression for explaining the content of the paraphrased expression, and when this is a phrase, it generally consists of a synonym for the paraphrased expression or a broader term of the thesaurus.
Therefore, fuzzy search can be realized by referring to the correspondence table created by this system by the document search system. or,
Not only paraphrases included in paraphrases, but also modifiers attached to them are stored in correspondence with paraphrases, so fuzzy searches that perform various logical operations using the dictionary created here are also possible. Become.

【0011】[0011]

【発明の実施の形態】本発明の概略は、次の通りであ
る。即ち、テキストに対して形態素解析を行う手段と、
その結果を用いて言い換え表現および被言い換え表現語
句を抽出する手段と、言い換え表現中の修飾語を抽出す
る手段と、言い換え表現中の被修飾語を抽出する手段
と、被言い換え後と対応付けて言い換え表現中の修飾語
及び被修飾語を格納する手段と抽出した言い換え表現語
句についてこれが修飾語を含む場合には、その被修飾語
を、これに対応する被書き換え表現語句の上位概念語句
としてシソーラスに登録管理する手段と、抽出した言い
換え表現語句についてこれが修飾語を含まない場合に
は、この語句をこれに対応する被書き換え表現語句の同
義語として同義語辞書に登録管理する手段とを具備する
ことを特徴とする語彙対応表作成装置によって作成した
語彙対応表を用いて、検索式を作成する手段と、同義語
に関しては見出し語に対する類語検索を行なう際にその
各構成単語の全てが一定の範囲内に含まれる文書を検索
する検索方式と、見出し語に対する類語検索を行う際に
上位概念語とその修飾語の全てを含む文書を検索する検
索法指揮とを具備したことを特徴とする。
BEST MODE FOR CARRYING OUT THE INVENTION The outline of the present invention is as follows. That is, means for performing morphological analysis on text,
A means for extracting paraphrased expressions and paraphrased expression words and phrases using the result, a means for extracting a modifier in the paraphrased expression, a means for extracting a modified word in the paraphrased expression, in association with the paraphrased When the modifier and the modified word in the paraphrased expression and the extracted paraphrased expression phrase include the modifier, the modified word is a thesaurus as a superordinate concept phrase of the corresponding rewritten expression phrase. And a means for registering and managing the extracted paraphrase expression phrase in the synonym dictionary as a synonym of the corresponding rewritten expression phrase when this does not include a modifier. Using the vocabulary correspondence table created by the vocabulary correspondence table creation device characterized by A search method that searches for documents in which all of the constituent words are within a certain range when performing a synonym search, and a document that includes all broader terms and their modifiers when performing a synonym search for a headword It is characterized by having a search method command for searching.

【0012】これにより、入力データとしては一般的な
テキストデータを与えるのみで、言い換え表現と被言い
換え表現語句との対応表を自動的に作成することができ
る。言い換え表現は被言い換え表現の内容を説明する表
現であり、これが語句の場合には、一般に、被言い換え
表現に対する同義語あるいはシソーラスの上位語からな
るものである。そのため本システムで作成された対応表
を文書検索システムで参照することにより曖昧検索が実
現できる。又、言い換え表現に含まれる言い換え語のみ
ではなく、これに付属した修飾語も被言い換え語に対応
づけて格納するため、ここで作成された辞書を利用して
各種の論理演算を行う曖昧検索も可能になる。
With this, it is possible to automatically create a correspondence table between paraphrased expressions and paraphrased expressions by simply providing general text data as input data. The paraphrase is an expression that describes the content of the paraphrased expression, and when this is a phrase, it generally consists of a synonym for the paraphrased expression or a broader term of the thesaurus. Therefore, fuzzy search can be realized by referring to the correspondence table created by this system by the document search system. Further, not only the paraphrase word included in the paraphrase expression but also the modifier attached to the paraphrase word are stored in association with the paraphrase word, so that the fuzzy search that performs various logical operations using the dictionary created here is also possible. It will be possible.

【0013】以下、図面を参照して本発明の一実施の形
態を説明する。本装置はCPU及びメモリ・外部記憶装
置等から成るコンピュータ或いはワードプロセッサ中に
組み込まれている。又、本実施装置は、テキストデータ
ベース中から語彙対応表を作成する機能と、語彙対応表
を用いて検索を実行する機能を持つ。
An embodiment of the present invention will be described below with reference to the drawings. This device is incorporated in a computer or word processor including a CPU, a memory, an external storage device, and the like. Further, the present embodiment has a function of creating a vocabulary correspondence table from the text database and a function of executing a search using the vocabulary correspondence table.

【0014】先ず、本装置で用いる構成要素を図1に示
す。即ち、本装置は形態素解析部1aと、構文解析部1
b、言い換え表現抽出部1c、言い換え表現解析部1
d、同義語データ格納部1e、上位概念データ格納部1
f、テキスト格納バッファ1g、形態素解析結果格納バ
ッファ1h、語彙対応表格納バッファ1h、キーワード
入力部1p、キーワードサーチ部1q、見出し語チェッ
ク部1r、検索式生成部1s、検索実行部1t、キーワ
ード格納バッファ1u、検索式格納バッファ1v、及び
検索結果表示部1wとから成る。
First, the components used in this apparatus are shown in FIG. That is, the present apparatus includes a morphological analysis unit 1a and a syntax analysis unit 1
b, paraphrase expression extraction unit 1c, paraphrase expression analysis unit 1
d, synonym data storage unit 1e, superordinate concept data storage unit 1
f, text storage buffer 1g, morphological analysis result storage buffer 1h, vocabulary correspondence table storage buffer 1h, keyword input unit 1p, keyword search unit 1q, entry word check unit 1r, search expression generation unit 1s, search execution unit 1t, keyword storage It includes a buffer 1u, a search expression storage buffer 1v, and a search result display unit 1w.

【0015】次に、本装置の処理の流れについて具体的
に説明する。先ず、語彙対応表の作成処理過程について
図4を用いて簡単に説明する。ここでは、先ずテキスト
データをテキストバッファに格納する(ステップ5
a)。次に、形態素解析部1aが駆動しテキストデータ
の内容を処理し、結果を形態素解析結果格納バッファ1
hに格納する(ステップ5b)。形態素解析の結果を原
文書と対応づけて図2の形態素解析結果1及び2に示
す。
Next, the processing flow of this apparatus will be specifically described. First, a process of creating a vocabulary correspondence table will be briefly described with reference to FIG. Here, first, the text data is stored in the text buffer (step 5).
a). Next, the morphological analysis unit 1a is driven to process the contents of the text data, and the result is stored in the morphological analysis result storage buffer 1
It is stored in h (step 5b). The results of morphological analysis are shown in morphological analysis results 1 and 2 in FIG. 2 in association with the original document.

【0016】次に、言い換え表現抽出部1cが駆動す
る。ここでは、形態素解析結果格納バッファ1hに格納
されている結果を参照して、テキスト中に名詞に続く丸
括弧或いは名詞に続くコロン及びセミコロンがあるかど
うか調べ(ステップ5c)、あった場合には、丸括弧に
囲まれた部分或いはコロン及びセミコロンに続く部分を
「言い換え表現」とみなし後の処理を行う。この場合、
言い換え表現の直前の名詞を「被言い換え語」と呼ぶ。
Next, the paraphrasing expression extracting section 1c is driven. Here, referring to the result stored in the morphological analysis result storage buffer 1h, it is checked whether or not there are parentheses following the noun or colons and semicolons following the noun in the text (step 5c). , The part enclosed by the parentheses or the part following the colon and semicolon is regarded as a "paraphrase expression" and the subsequent processing is performed. in this case,
The noun immediately before the paraphrase is called the "paraphrased word."

【0017】次に、言い換え表現解析部1dが駆動する
(ステップ5d)。ここでは、形態素解析結果格納バッ
ファ1hを参照して、言い換え表現中に名詞以外の要素
が含まれているかを調べる。含まれていれば、言い換え
表現は、被言い換え表現に対する上位概念語とその修飾
語であるとみなし、上位語属性をセットする(ステップ
5f)、言い換え表現中に名詞のみしか含まれない場合
には、言い換え表現は複合語であり、被言い換え語に対
する同義語であるとみなし、同義語属性をセットする
(ステップ5g)。この後、形態素解析結果格納バッフ
ァ1hを参照して、被言い換え語と、その修飾語の組を
すでに解析した属性データとともに語彙対応表格納バッ
ファ1g中に格納する(ステップ5g)。語彙対応表格
納バッファ1g内に格納されている語彙対応表データの
構造を図3に示す。
Next, the paraphrasing expression analyzing section 1d is driven (step 5d). Here, referring to the morphological analysis result storage buffer 1h, it is checked whether or not the paraphrase expression includes an element other than a noun. If it is included, the paraphrase is regarded as a broader term and its modifier to the paraphrase, and the broader word attribute is set (step 5f). If the paraphrase contains only nouns, , The paraphrase expression is a compound word and is regarded as a synonym for the paraphrase word, and a synonym attribute is set (step 5g). After that, the morpheme analysis result storage buffer 1h is referred to and the set of the paraphrase word and its modifier is stored in the vocabulary correspondence table storage buffer 1g together with the already analyzed attribute data (step 5g). The structure of the vocabulary correspondence table data stored in the vocabulary correspondence table storage buffer 1g is shown in FIG.

【0018】語彙対応表格納バッファ1gの内容は、作
成処理終了後に外部記憶装置に格納されるが、検索実行
時には、再び語彙対応表格納バッファ1gにロードされ
るものである。
The contents of the vocabulary correspondence table storage buffer 1g are stored in the external storage device after the creation process is completed, but are loaded again in the vocabulary correspondence table storage buffer 1g when the search is executed.

【0019】次に、検索実行時の語彙対応表を用いて処
理について図6を用いて説明する。キーワード入力1p
が起動し、ユーザが入力した検索用キーワードをキーワ
ード格納バッファ1uに格納する(ステップ6a)。続
いて、見出し語チェック部1qが起動する(ステップ6
b)。ここでは、語彙対応表格納バッファ1g中に格納
されている語彙対応表の見出し語にキーワード格納バッ
ファ1uに格納されているキーワードと等しいものがあ
るか調べる。該当するものがなかった場合には検索処理
を終了する。該当するものがあった場合には、検索指揮
生成部1sが起動し、語彙対応表中で該当する見出し語
に対応する属性・言い換え語・修飾語を参照して検索式
を生成する(ステップ6c)。
Next, the processing using the vocabulary correspondence table at the time of executing the search will be described with reference to FIG. Keyword input 1p
Starts and stores the search keyword input by the user in the keyword storage buffer 1u (step 6a). Then, the entry word check unit 1q is activated (step 6).
b). Here, it is checked whether or not the entry word of the vocabulary correspondence table stored in the vocabulary correspondence table storage buffer 1g has the same keyword as the keyword stored in the keyword storage buffer 1u. If there is no corresponding item, the search process ends. If there is a match, the search command generation unit 1s is activated, and the search formula is generated by referring to the attribute / paraphrase / modifier corresponding to the corresponding headword in the vocabulary correspondence table (step 6c). ).

【0020】検索式生成部1sでは、先ず該当する見出
し語に対応する語彙対応表の行データの属性の欄を内容
を参照する。これが「同義語」属性ならば、この行の言
い換え語と各修飾語のデータを例えば記号「#」でつな
いだものを検索式格納バッファ1vに格納する。図3の
例では、見出し語「DVD」から生成される検索式は、
「デジタル#ビデオ#ディスク」となる。
In the search expression generation unit 1s, first, the contents are referred to the column of the attribute of the row data of the vocabulary correspondence table corresponding to the relevant headword. If this is a "synonym" attribute, the paraphrase word of this line and the data of each modifier are connected by the symbol "#", for example, and stored in the search expression storage buffer 1v. In the example of FIG. 3, the search expression generated from the headword “DVD” is
"Digital # Video # Disc".

【0021】又、見出し語に対応する語彙対応表の行デ
ータの属性の欄の内容が「同義語」属性ならば、この行
の言い換え語と各修飾語のデータを例えば記号「*」で
つないだものを検索式格納バッファ1vに格納する。図
3の例では、見出し語「アロマロカリス」から生成され
る検索式は、「古生代*水中*生物」となる。
If the content of the row data attribute column of the vocabulary correspondence table corresponding to the headword is the "synonym" attribute, the paraphrase word of this row and the data of each modifier are connected by, for example, the symbol "*". This is stored in the retrieval expression storage buffer 1v. In the example of FIG. 3, the search formula generated from the headword “Aromalocaris” is “Paleozoic * underwater * organism”.

【0022】図5に於いて、ステップ6cで、検索式デ
ータを検索式格納バッファ1vに格納したあと、制御は
ステップ6dに移る。ステップ6dでは検索実行部1t
が起動する。
In FIG. 5, after the retrieval formula data is stored in the retrieval formula storage buffer 1v in step 6c, the control proceeds to step 6d. In step 6d, the search execution unit 1t
Will start.

【0023】検索実行1tでは、検索式格納バッファ1
vに格納されている検索式に照合する文書の検索を、全
文検索の手法によって行う。ここで検索式を参照する際
には、一般に検索式が、「キーワード1 * キーワー
ド2」と記述されている場合には、キーワード1とキー
ワード2の何れをも含む文書ならどの文書とでも照合す
る要に検索処理を行ない、検索式が、「キーワード1
# キーワード2」と記述されている場合には、キーワ
ード1とキーワード2の何れをも含み、且つキーワード
1とキーワード2とが一定も字数内に存在する文書のみ
と照合するように検索処理を行う。実施例装置では、こ
の文字数が16に設定してある。
In the search execution 1t, the search expression storage buffer 1
A document that matches the search expression stored in v is searched by the full-text search method. When the search expression is referred to here, in general, when the search expression is described as “keyword 1 * keyword 2”, any document that includes both keyword 1 and keyword 2 is matched. In short, the search process is performed, and the search expression is "keyword 1
# Keyword 2 ”, the search process is performed so as to match only the documents that include both the keyword 1 and the keyword 2 and the keyword 1 and the keyword 2 are within a certain number of characters. . In the apparatus of the embodiment, the number of characters is set to 16.

【0024】ステップ6dで検索実行部1tが起動した
後、処理はステップ6eに移り、検索結果表示部1wが
検索結果の表示を行ない、検索処理を終了する。尚、見
出し語チェック部1rでの処理に於いて、該当する見出
し語が複数個ある場合には、その内、それに対応する修
飾語の最も少ないものを含む行のデータを採用すること
にする。
After the search execution unit 1t is activated in step 6d, the process proceeds to step 6e, the search result display unit 1w displays the search result, and the search process ends. In the processing in the headword checking unit 1r, if there are a plurality of corresponding headwords, the data of the row including the least corresponding modifier is adopted.

【0025】以上が本発明の一実施形態例である。尚、
本発明は上記の例に限定されるものではない。例えば、
上記の検索法指揮を一般的な検索方式と組み合わせて用
いても良い。一般的な検索方式によって得られた検索件
数が一定数以下の時本検索法指揮を実行するようなこと
も考えられる。その他、本発明はその趣旨を逸脱しない
範囲で各種の変形が可能である。
The above is one embodiment of the present invention. still,
The present invention is not limited to the above example. For example,
The above search method command may be used in combination with a general search method. It is also possible to execute this search method command when the number of searches obtained by a general search method is less than a certain number. Besides, the present invention can be variously modified without departing from the spirit thereof.

【0026】[0026]

【発明の効果】以上詳記したように、本発明によれば、
自動生成された語彙対応表を用いて検索を行うことによ
り、高度の曖昧検索を実現することができる。これによ
り、大量な文書データベースの中からユーザの目的とす
るものを的確に検索することが可能となり、その実用上
多大なる効果が得られるものである。
As described above in detail, according to the present invention,
A high-level fuzzy search can be realized by performing a search using the automatically generated vocabulary correspondence table. As a result, it becomes possible to accurately search for a target of the user from a large amount of document databases, and a great effect can be obtained in practical use.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施の形態に係る構成を示すブロッ
ク図。
FIG. 1 is a block diagram showing a configuration according to an embodiment of the present invention.

【図2】同実施の形態に於ける形態素解析結果を示した
図。
FIG. 2 is a diagram showing a result of morphological analysis in the same embodiment.

【図3】同実施の形態に於ける語彙対応表の例を示した
図。
FIG. 3 is a diagram showing an example of a vocabulary correspondence table in the same embodiment.

【図4】同実施の形態に於ける語彙対応表の作成処理の
流れを示したフローチャート。
FIG. 4 is a flowchart showing a flow of a process of creating a vocabulary correspondence table in the same embodiment.

【図5】同実施の形態に於ける検索実行部の処理の流れ
を示したフローチャート。
FIG. 5 is a flowchart showing a processing flow of a search execution unit according to the same embodiment.

【符号の説明】[Explanation of symbols]

1a…形態素解析部、1b…構文解析部、1c…言い換
え表現抽出部、1d…言い換え表現解析部、1e…同義
語データ格納部、1f…上位概念データ格納部、1g…
テキスト格納バッファ、1h…形態素解析結果格納バッ
ファ、1g…語彙対応表格納バッファ、1p…キーワー
ド入力部、1q…キーワードサーチ部、1r…見出し語
チェック部、1s…検索式生成部、1t…検索実行部、
1w…検索結果表示部、1u…キーワード格納バッフ
ァ、1v…検索式格納バッファ。
1a ... Morphological analysis unit, 1b ... Syntactic analysis unit, 1c ... Paraphrase expression extraction unit, 1d ... Paraphrase expression analysis unit, 1e ... Synonym data storage unit, 1f ... Superordinate concept data storage unit, 1g ...
Text storage buffer, 1h ... Morphological analysis result storage buffer, 1g ... Vocabulary correspondence table storage buffer, 1p ... Keyword input section, 1q ... Keyword search section, 1r ... Headword check section, 1s ... Search expression generation section, 1t ... Search execution Department,
1w ... Search result display unit, 1u ... Keyword storage buffer, 1v ... Search expression storage buffer.

Claims (6)

【特許請求の範囲】[Claims] 【請求項1】 文書作成装置であって、 見出し語に対応づけてその言い換え語をその修飾語とと
もに格納する語彙対応表格納手段と、 検索のためのキーワードを入力するキーワード入力手段
とを具備し、 前記語彙対応表格納手段の格納情報を参照し、前記キー
ワード入力手段のキーワードに対応する言い換え語との
修飾語から生成した検索式を新たな検索キーとして検索
を行うようにしたことを特徴とする文書作成装置。
1. A document creation apparatus, comprising: a vocabulary correspondence table storage means for storing a paraphrase word together with its modifier in association with a headword, and keyword input means for inputting a keyword for a search. The reference information stored in the vocabulary correspondence table storage means is referred to, and the search expression generated from the modifier with the paraphrase corresponding to the keyword of the keyword input means is used as a new search key for the search. Document creation device.
【請求項2】 見出し語に対する言い換え語が同義語で
あり、それが、複合語で表わされる場合には、当該複合
語を構成する各単語を語彙対応表に格納するようにし、 見出し語に対する類語検索を行う際、各構成単語の全て
が一定の範囲内に包含する文書を検索するようにしたこ
とを特徴とする請求項1記載の文書作成装置。
2. A paraphrase for a headword is a synonym, and when it is represented by a compound word, each word forming the compound word is stored in a vocabulary correspondence table, and a synonym for the headword. 2. The document creating apparatus according to claim 1, wherein when the search is performed, a document in which all the constituent words are included in a certain range is searched.
【請求項3】 見出し語に対する言い換え語が上位概念
語である場合には、その文例データ中に現れた修飾語と
ともに格納し、 見出し語に対する類語検索を行う際に、上位概念語とそ
の修飾語の全てを包含する文書を検索するようにしたこ
とを特徴とする請求項1記載の文書作成装置。
3. When the paraphrase for the headword is a superordinate concept, the paraphrase is stored together with the modifier appearing in the sentence example data, and when the synonym search for the headword is performed, the superordinate word and its modifier are stored. 2. The document creating apparatus according to claim 1, wherein a document including all of the above is searched.
【請求項4】 文例テキスト中の言い換え表現を抽出し
て作成した語彙対応表辞書を設けたことを特徴とする請
求項1記載の文書作成装置。
4. The document creating apparatus according to claim 1, further comprising a vocabulary correspondence table dictionary created by extracting paraphrase expressions in the sentence example text.
【請求項5】 語彙対応表中で、同一見出し語につい
て、複数の言い換え語で存在する場合には、その内最も
修飾語が少いものを検索キー対象として用いることを特
徴とする請求項1記載の文書作成装置。
5. The vocabulary correspondence table, when the same headword exists in a plurality of paraphrases, the one having the smallest number of modifiers is used as a search key target. Document creation device described.
【請求項6】 語彙対応表中のデータを参照して検索式
を作成するようにしたことを特徴とする請求項1記載の
文書作成装置。
6. The document creating apparatus according to claim 1, wherein the search expression is created by referring to the data in the vocabulary correspondence table.
JP7225379A 1995-09-01 1995-09-01 Device and method for document preparation Pending JPH0973454A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7225379A JPH0973454A (en) 1995-09-01 1995-09-01 Device and method for document preparation

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7225379A JPH0973454A (en) 1995-09-01 1995-09-01 Device and method for document preparation

Publications (1)

Publication Number Publication Date
JPH0973454A true JPH0973454A (en) 1997-03-18

Family

ID=16828437

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7225379A Pending JPH0973454A (en) 1995-09-01 1995-09-01 Device and method for document preparation

Country Status (1)

Country Link
JP (1) JPH0973454A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006190044A (en) * 2005-01-05 2006-07-20 Ricoh Co Ltd Relevant character string formation device, program and storage medium
WO2021107006A1 (en) * 2019-11-27 2021-06-03 株式会社東芝 Information processing device, information processing method, and program

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006190044A (en) * 2005-01-05 2006-07-20 Ricoh Co Ltd Relevant character string formation device, program and storage medium
WO2021107006A1 (en) * 2019-11-27 2021-06-03 株式会社東芝 Information processing device, information processing method, and program
CN114746862A (en) * 2019-11-27 2022-07-12 株式会社东芝 Information processing apparatus, information processing method, and program

Similar Documents

Publication Publication Date Title
Levow et al. Dictionary-based techniques for cross-language information retrieval
JP4544674B2 (en) A system that provides information related to the selected string
US7523102B2 (en) Content search in complex language, such as Japanese
KR101004515B1 (en) Method and system for retrieving confirming sentences
US5278980A (en) Iterative technique for phrase query formation and an information retrieval system employing same
JP2783558B2 (en) Summary generation method and summary generation device
US5890103A (en) Method and apparatus for improved tokenization of natural language text
US7293015B2 (en) Method and system for detecting user intentions in retrieval of hint sentences
US20070011132A1 (en) Named entity translation
JPH10232883A (en) Document retrieval system coping with many languages
JPH0724056B2 (en) Computer-based morphological text analysis method
JPH02308370A (en) Machine translation system
JPH05314166A (en) Electronic dictionary and dictionary retrieval device
JP2008084070A (en) Structured document retrieval device and program
Srinivas et al. An approach to robust partial parsing and evaluation metrics
JPH0973454A (en) Device and method for document preparation
EP1605371A1 (en) Content search in complex language, such as japanese
JP2004318381A (en) Similarity computing method, similarity computing program, and computer-readable storage medium storing it
JP2003006191A (en) Device and method for supporting preparation of foreign language document and program recording medium
JPH0793345A (en) Document retrieval device
JP2840258B2 (en) Method of creating bilingual dictionary and co-occurrence dictionary for machine translation system
JPH0561902A (en) Mechanical translation system
JP4262529B2 (en) Full-text search device, method, program, and recording medium
JPH1115846A (en) Information retrieval device and recording medium
Takeda et al. CRITAC—An experimental system for Japanese text proofreading