JPS60159970A

JPS60159970A - 情報蓄積検索方式

Info

Publication number: JPS60159970A
Application number: JP59013459A
Authority: JP
Inventors: Hiroyuki Kaji; 梶　博行; Yoshihiko Nitta; 義彦新田
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 1984-01-30
Filing date: 1984-01-30
Publication date: 1985-08-21
Also published as: US4775956A

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔発明の利用分野〕本発明は、自動翻訳システム、質問応答システム、文献
データベースシステム等の自然言語処理システムに関す
るものであり、特に、この種のシステムにおける自然言
語の語を見出しとする情報の蓄積と検索に関するもので
ある。　゛〔発明の背景〕前記のようなシステムにおいては、多数の語に対応して
それぞれの関連情報（文法、訳語、意味、文献等）を蓄
積し、任意の語が与えられたときにその関連情報を検索
することができるファイルが不可欠の構成要素であるが
、このようなファイルの所要容量と検索効率は、システ
ムのコストと性能を大きく左右するものであるから、そ
れらの改善は極めて重要である。

従来の情報蓄積検索方式によれば、それぞれの語に対応
して、語をキーとしてその語の関連情報を含むレコード
を形成し、かようなレコードを集めてファイルを構成す
る。そして、語が与えられたとき、これとレコードキー
との一致判定処理を行なうことによシ所望の関連情報を
出力する。このような方式では、派生語について次のよ
うな欠点があった。

一般に、語には多くの派生語がアリ、へれら派生語の関
連情報には共通するものが多い。例えば、複数の派生語
が品詞を異にするだけで意味記述はほとんど同一である
というような事例は、枚挙に暇がない。このような情況
に対処するのに、かような共通の情報をも各派生語にそ
れぞれ対応する複数のレコードに重複して記入するので
は、所要記憶容量が増大するだけでなく、蓄積情報の保
守（修正、補充等）も面倒である。そこで、派生語群中
の適当な１語を選び、その語に対応するレコードにのみ
共通関連情報を収録して、このレコードを他の派生語か
ら参照できるようにすることが考えられる。しかし、こ
れでは、ファイル構造が複雑になるばかりでなく、前記
選ばれた語以外の語から検索する場合には検索時間が長
くなる。

まだ、ファイルの利用目的によっては、ある語に対して
その派生語を検索する要求も生じる（例えば、自動翻訳
システムにおけるターゲット言語の生成用辞書、文献デ
ータベースシステムにおけるキーワードファイル等）。

このような要求を満たすには、従来の情報蓄積方式では
それら派生語もまた一種の関連情報として記憶すること
が必要になる。このために所要記憶容量は更に増大し、
それら派生語の関連情報までも含めて検索する場合には
、検索時間が一段と長引くことになる。

〔発明の目的〕

本発明は、前記の問題を解決することを目的とする。す
なわち、本発明の目的の一つは、諸派主語に共通する関
連情報の重複収録を省いて所要記憶容量を低減すること
であり、もう一つの目的は、多様な態様の検索を効率よ
く行なえるようにすることである。

〔発明の概要〕

語というものは、一般に、語の主たる意味を担う語根と
、派生語を作シ出す接辞とから成り、シかも、一つの語
根に接続しうる接辞の組は、比較的少数の類型に分類す
ることができるものである。

本発明の基礎をなす方策は、このような接辞の組の類型
すなわち派生語生成パターンを特定するコード（以下派
生語パターンコードという）を定め、これによって語根
を分類する点にある。

ファイルを構成する各レコードは、語根をキーとすると
ともに、その語根から生じる一群の派生語の全関連情報
と、その語根に適合する派生語パターンコードとを含む
。これとは別に、派生語パターンコードごとに対応する
一組の接辞を収録した派生語パターン辞書を用意し、検
索に当たり、この辞書を参照して語根と接辞から派生語
を合成する。また、レコード内の関連情報は、派生語間
に共通する部分と各派生語に個有の部分に分けて収録し
、出力に当たって完全情報を合成する。

〔発明の実施例〕

（１）実施例Ｉ最初に説明する実施例は、電子辞書であって、英単語を
入力してその単語の品詞と日本語訳とを検索・表示する
機能（「翻訳」機器のと、英単語と品詞とを入力してそ
の単語の派生語でかつ入力した品詞のものを検索・表示
する機能（「派生語」機能）とを有するものである。そ
の機器構成の概略は、第１図に示すように、検索処理や
他の機器の制御を行なう中央処理装置１、訳語辞書２１
及び派生語パターン辞書２２を格納した記憶装置２、文
字情報入力用キー及び前記「翻訳」機能、「派生語」機
能等の機能を指定するファンクションキーを備えた入力
装置３、及び文字情報を表示するだめの表示装置４から
成る。訳語辞書２１中の各レコードは、語根２１１、派
生語パターンコード２１２、訳語共通部分２１３及び訳
語個別部分２１４の各フィールドから成り、訳語個別部
分のフィールドは当該語根から派生する単語の数だけ繰
り返される。派生語パターン辞書２２中の各レコードは
、派生語パターンコード２２１及び接辞・品詞データ２
２２の各フィールドから成り、接辞・品詞データのフィ
ールドは当該派生語生成パターンに含まれる接辞の数だ
け繰り返される。ただし、同じ接辞でも品詞が異なれば
品詞ごとに別個の接辞とみなす。

訳語辞書２１及び派生語パターン辞書２２中のレコード
の内容の具体例をそれぞれ第２図及び第３図に示す。本
実施例において、「語根」は、語の形態索輪に厳密に従
うものでなく、一群の派生語の綴シに共通な部分文字列
として定義されている。例えば、派生語群（ｅｆｆｉｃ
ｉｅｎｃｙ、　ｅｆｆｉｃｉｅｎｔ。

ｅｆｆｉｃｉｅｎｔｌｙ　）については「ｅｆｆｉＣｉ
ｅｎ　ｊが語根であシ、（１ｎｓｉｓｔ、　Ｉｎ５１ｓ
ｔｅｎｃｅ、　Ｉｎ５ｉｓｔｅｎｔ。

１ｎｓｉｓｔｅｎｔｌｙ　）については「１ｎｓｉｓｔ
　Ｊが語根で、１、（ｃｏｍｐｉｌｅ　、　Ｃｏｍｐｉ
ｌａｔｉｏｎ　、　ｃｏｍｐｉｌｅｒ）については「０
０ｍ９口」へ語根である。まだ、「接辞」は、単語の綴
りから語根を除いた部分文字列である。例えば、語根［
ｅｆｆｉｃｉｅｎ　ｊについを作る接辞である。これと
同じ接辞の組に接続する語根としては［ｐｒｏｆｉｃｉ
ｅｎ　Ｊ　、「５ｕｆｆｉｃｉｅｎｊ等がある。すなわ
ち、この接辞の組はこれらの語根に共通し、それらを特
徴づけ、類別する派生語パターンである。このような接
辞の組を特定するのが「派生語パターンコード」であっ
て、前記の接辞の組にはコード「１２」が割当てられて
いる。

同様に、派生語群（１ｎｓｉｓｔ、　１ｎｓｉｓｔｅｎ
ｃｅ　。

１ｎｓｉｓｔｅｎｃｙ　、１ｎｓｉｓｔｅｎｔ　、１ｎ
ｓｔｓｔｅｎｔｔｙ　）や（ｐｅｒｓｉｓｔ　、　ｐｅ
ｒｓｉｓｔｅｎｃｅ　、　ｐｅｒｓｉｓｔｅｎｃｙ。

ｐｅｒｓｉｓｔｅｎｔ　、　ｐｅｒｓｉｓｔｅｎｔｌｙ
）を生成する接辞の組には派生語パターンコード「２７
」が割当てられ、（Ｃｏｍｐｉｌｅ　、ｃｏｍｐｉｌａ
ｔｊｏｎ　、Ｃｏｍｐｉｌｅｒ　）を生成する接辞の組
には派生語パターンコード「７０」が割当てられている
。

派生語パターン辞書２２の各レコード（第３図）におけ
る派生語パターンコードのフィールドには、前記派生語
パターンコードが見出しとして収容されており、そして
、接辞・品詞データのフィールドには、当該派生語パタ
ーンコードに対応する接辞の組に属する各接辞が、それ
によって生成される語の品詞と共に収容されている。ま
た、訳語辞書２１の各レコード（第２図）における語根
のフィールドには各派生語群の語根が見出しとして収容
されており、派生語パターンコードのフィールドには当
該語根に接続される接辞の組に対応する派生語パターン
コードが収容されている。例えば、語根［ｅｆｆｉｃｉ
ｅｎ　Ｊを含むレコードにおける派生語パターンコード
のフィールドの内容はｒｌ　２Ｊになっている。訳語辞
書２１には、更に、訳語情報が、派生語の訳語に共通な
部分（訳語共通部分）と各派生語の訳語に個有の部分（
訳語個別部分）に分けて収容されている。例えば、［ｅ
ｆｆｉｃｉｅｎｃｙ玉「ｅｆｆｉｃｉｅｒｒｔＩ及び「
ｅｆｆｉｃｉｅｎｔｌ幻の訳語「効率」、「効率的な」
及び「効率的に」は、第２図に示すように、共通部分「
効率」と、個別部分「−」、「的な」及び「的に」に分
けて収められている。ここで「−」は個別部分にあたる
文字列が存在しないことを表わす。なお、訳語辞書のレ
コードは語根のアルファベット順に、また派生語パター
ン辞書のレコードは派生語パターンコードの数値の大き
さ順に、それぞれ順序良く配列されている。

次に、前述した「翻訳」機能と「派生語」機能の実現の
ために中央処理装置１が行なう処理を、第４図のフロー
チャートに従って説明する。なお、同図及び以下の説明
中に用いられている記号の意　−味は次のとおりである
。ＭＤは本装置の処理モート責「翻訳」機能と「派生語
」機能の別）を示すインジケータで、入力装置３のファ
ンクションキーの操作によシセットされる。ＷＤは入力
された単語を保持するレジスタであり、ＰＳは入力され
た品詞コードを保持するレジスタである。ＰＬは検索結
果を示すフラグ、■は訳語辞書２１から読込むべきレコ
ードの相対レコード番号を示すカウンタ、Ｊは派生語パ
ターン辞書２２のレコード内の接辞・品詞データの番号
を示すカウンタである。

１ｍは訳語辞−書２１中のレコードの総数（測定値）、
Ｊｍは派生語パターン辞書２２のレコード中の接辞・品
詞データの総数（レコードによって異なり、各レコード
の適当なフィールドに記入しておく）を格納するレジス
タを、それぞれ表わす。

第４図のフローチャートに示す処理は、利用者が入力装
置３のキーボードから英単語（「ａ訳」モードの場合）
又は英単語と品詞（「派生語」モードの場合）を入力し
、所望の処理モードを指定するファンクションキーを操
作することにより開始される。まず、読込んだ入力デー
タをＷＤとＰＳにセットするとともに、ファンクション
キーに応じてＭＤに指定された処理モード（「翻訳」／
「派生語」）をセットしく１０１）　、ＷＤとＰＳにセ
ットされたデータを表示する（１０２）。次に、■の値
を１にした（１０３　）後、訳語辞書２１の第ニレコー
ドを読込み　（１０５）、そのレコードの語根がＷＤの
内容の前方部分に一致するか否かを判定する（１０７）
。この処理は、一致するレコードが発見されるまで、■
の値に１を加え（ｉｏｓ）ながら繰り返す。ただし、■
〉１ｍとなる（１０４）か、あるいは第ニレコードの語
根がＷＤの内容より大きくなる（１０６）と、入力単語
は非収録語である旨のメツセージを表示装置に出力（１
０９）　して、処理を終了する。

ＷＤの内容の前方部分に語根が一致するレコードが得ら
れると、そのレコード中の派生語パターンコードに対応
するレコードを派生語パターン辞書２２から読込む（１
１０）。次いで、そのレコード中の接辞・品詞データの
総数をＪｍにセットしく１ｔｔ）　％　Ｊの値を１にし
く１１２）、更にＦＬをｏ　ｆ　ｆ　”にする（１１３
）。それからステップ１１０で読込んだレコードの第Ｊ
接辞と語根とから派生語を合成（１１５）して、それが
ＷＤの内容と一致するか否かを判定しく１１６）　、こ
の処理を、Ｊに１を加え（１１７）ながら、ＪくＪｍで
ある間（１１４）繰シ返す。もしもＪくＪｍである間に
ＷＤの内容と一致する派生語が合成されなかった場合（
１１８）には、訳語辞書中の次のレコードの読込み処理
に戻る（１０８，１０５）　。合成した派生語がＷＤの
内容と一致した場合、その後の処理は、ＭＤにセットさ
れている処理モードによって異なる（１１９）。

ＭＤにセットされている処理モードが「翻訳」である場
合は、ＦＬを°’　ｏ　ｎ　”にした（１２０）後、品
詞と訳語の表示を行なう。すなわち、派生語パターン辞
書レコード中の第Ｊ接辞に対応する品詞データを表示装
置に出力しく１２１）　、次いで、訳語辞書レコードの
訳語共通部分と第Ｊ訳語個別部分とから訳語を合成しく
１２２）　、これを表示装置に出力する（１２３）。

他方、ＭＤにセットされている処理モードが「派生語」
の場合には、ステップ１１９で分岐し、次の処理によ、
０、ＰＳが指定する品詞の派生語を合成して表示する。

まず、Ｊの値を１にしく１２４）、ＦＬをｏ　ｆ　ｆ　
”にする（１２５）。次いで、派生語パターン辞書レコ
ード中の第５品詞がＰＳの内容と一致するか否かの判定
処理（１２７）を、Ｊに１を加え（１２８）ながら、Ｊ
　＜Ｊ　ｍである間（１２６）繰り返す。第５品詞がＰ
Ｓの内容と一致すれば、ＦＬを°ｌ　０ｎ１１にした（
１２９）後、派生語パターン辞書レコード中の第Ｊ接辞
と語根とから派生語を合成しく１３０）　、これを表示
装置に出力する（１３１）。もしもＪ＜：Ｊｍである間
にＰＳの内容と一致する品詞が発見されなかった場合（
１３２）には、非収録品詞である旨のメツセージを表示
装置に出力する（１３３）。

第５図は、以上の処理の結果として表示装置４に表示さ
れた画面の例を示す。第５図（ａ）は、英単語［ｅｆｆ
ｉｃｉｅｎｔＪを入力してファンクションキー「翻訳」
を押した場合である。この場合の中央処理装置１による
処理を簡単に説明すると、まずステップ１０２で入力単
語を表示してから、ステップ１０５で「ｅｆｆｉｃｉｅ
ｎｔ　ｊ　ト前方部分カ一致する語根１ｅｆｆｉｃｉｅ
ｎ　Ｊに対応する訳語辞書レコードが検索され、その結
果、その派生語パターンコードは「１２」であることが
わかり、ステップ１１０で対応する派生語パターン辞書
レコードを読込む。このレコードは語根［ｅｆｆｉｃｉ
ｅｎ　ｊに接辞ｒｃｙｊ、「ｔ」及びｒｔｌｙｊが接続
されうることを示しているので、ステップ１１５で派生
語（Ｊ　ｅｆ　ｆ　１ｃｉｅｎｃｙ　ｊ、［ｅｆｆｉｃ
ｉｅｎｔ　Ｊ　、［ｅｆｆｉｃｉｅｎｔｌｙ　ｊ　を順
次合成する。これらの派生語はステップ１１６で入力単
語［ｅｆｆｉｃｉｅｎｔＪと順次比較され、第２番目の
派生語が入力単語と一致することがわかる。そこで、第
２番目の接辞と対になった品詞「ＡＤＪ」をステップ１
２１で表示する。続いて、ステップ１２２で、語根「ｅ
ｆｆｉｃｉｅｎ　Ｊに対応する訳語辞書レコードの訳語
共通部分のデータ「効率」と第２番目の訳語個別部分の
データ「的な」とから訳語「効率的な」を合成し、これ
をステップ１２３で表示する。

第５図（ｂ）は、英単語「１ｎｓｉｓｔ　Ｊ　と品詞ｒ
ＮＪとを入力し、ファンクションキー「派生語」を押し
た場合である。まず入力した英単語と品詞とを表示し、
次いで語根「１ｎｓｉｓｔ　Ｊに対応する訳語辞書レコ
ードを検索して、派生語パターンコード「２７」に対応
する派生語パターン辞書レコードを読込み、入力単語［
１ｎｓｉｓｔＪ　と一致する派生語を合成して（この一
致判定は入力されたものが単語であることの確認である
）、分岐ステップ１１９に入るまでは、第５図（ａ）の
場合と同様である。次に、ステップ１２７で、入力品詞
「Ｎ」と派生語パターン辞書レコード中の品詞データを
比較し、その結果、第２番目の接辞「ｅｎＣｅ」と第３
番目の接辞「ｅｎｃｙ　Ｊ　とが名詞（Ｎ’）を作る接
辞であることが判明する。そこで、ステップ１３０で、
語根Ｉ”　１ｎｓｉｓｔ　Ｊとこれらの接辞とからそれ
ぞれ単語［１ｎｓｉｓｔｅｎｃｅｊ及び［１ｎｓｉｓｔ
ｅｎｃｙ　ｊを合成し、これらをステップ１３１で表示
する。

本実施例では接辞として接尾辞のみをと９あげたが、接
頭辞についても、また接尾辞と接頭辞の組合わせについ
ても、同様に本発明を適用できることは多言を要しない
。また、本実施例では辞書のサーチ方法として最も素朴
なシーケンシャルサーチ法を採用しているが、他のもつ
と効率の良いサーチ法を採用しうろことは、当業者には
明らかであろう。

本実施例においては、同一の接辞の組を持つ多数の語根
の間で接辞及び品詞データを共有することによる所要記
憶容量の低減効果が犬である。派生語生成パターンの種
類（接辞の組の数）は単語あるいは語根の総数に比して
ずつと少数であり、派生語パターンコードには２バイト
程度を割当てれば十分である。また、訳語情報の記述に
共通部分を設けたことによっても、記憶容量が節約され
ている。更に、従来技術によるときのような所要記憶容
量の増大もなしに、派生語検索機能が実現されている。

（２）実施例■ 次の実施例は、キーワード抽出機能と文献検索機能とを
持つ文献データベースシステムであり、第６図に示すよ
うに、キーワード抽出及び文献検索処理並びに他の機器
の制御を行なう中央処理装置Ｂ１、キーワードファイル
Ｂ２１及ヒ派生語パターン辞書Ｂ２２を格納する記憶装
置Ｂ２、文字情報を入力するだめの入力装置Ｂ３、文字
情報を出力するだめの出力装置Ｂ４及び文献ファイル、
Ｂ５”１格納す４大容量記憶４置８゛から構成２れる。

キーワードファイルＢ２１中の各レコードは、キーワー
ド語根Ｂ２１１、派生語パターンコードＢ２１２、正規
キーワード語番号Ｂ２１３及び文献番号Ｂ２１４の各フ
ィールドから成り、文献番号フィールドは当該キーワー
ドを持つ文献の数だけ繰り返される。派生語パターン辞
書Ｂ２２は実施例Ｉにおける派生語パターン辞書２２と
同様であるが、品詞データは必ずしも必要でない。

文献ファイルＢ、５１中の各レコードは、文献番号Ｂ５
１１、テキストＢ５１２及びキーワードＢ５１３の各フ
ィールドから成り、キーワードフィールドは当該テキス
トから抽出されたキーワードの数だけ繰り返される。

キーワードファイルＢ２１及び文献ファイルＢ５１の内
容の具体例を第７図と第８図に示す。

第７図は同図（ｂ）に示された文献番号Ｄ２３０の文献
に対するキーワード抽出を行なう前のものであシ、第８
図はそのキーワード抽出を完了した後のものである。

キーワード抽出機能を実現するために中央処理装置Ｂ１
が行なう処理の概略的フローチャートを第９図に示す。

第１ステツプ（ＢＩＯＩ＞では、文献ファイルＢ５１か
ら文献テキストを読込み、６語を切出す。例えば、第７
図（ｂ）の文献番号Ｄ２３０のテキストからは、「ｅｎ
ａｂｌｅＳ」、［ｅｆｆｉｃｉｅｎｔＪ、［ｃｏｍｐｉ
ｌａｔｉｏｎ　Ｊ　、［ｔ　ｏ　Ｊ、［ｃｏｍｐｉ１６
Ｊ等がキーワードの候補として切出される。第２ステツ
プ（Ｂ１０２）では、第１ステツプで得られた６語につ
いてキーワードファイルの検索を行なう。

この処理は実施例Ｉにおける訳語辞書２１の検索（第４
図のステップ１１９に入るまで）と実質上同じである。

キーワードファイルには［ｅｎａｂｌｅｊ、「ｔｏ」、
「ａ」等のキーワードとなりえない語は収録されていな
い。したがって、第２ステツプで検索に成功する［ｅＩ
ｆ−ｆ　１．ｃ：ｉ；ｅ　ｒｒｔｊ、「（Ｏｍｐｌ−１
ａｔｉｏｎｊ、［ｃｏｍｐｉｌｅｊ、「ｐｒＯｇｒａｍ
ｊ等がキーワードの候補として残される。第３ステツプ
（Ｂ１０３）では、キーワード候補として残った６語を
正規キーワードに変換する。すなわち、キーワードファ
イルレコードには派生語ノシターンコードと正規キーワ
ード語番号が収められているので、派生語パターンコー
ドに対応する派生語パターン辞書レコードを読込んで、
正規キーワード語番号に対応する派生語を合成する。例
えば、キーワード候補［ｅｆｆｉｃｉｅｎｔｊに対して
は、語根「ｅｆｆｉｃｉｅｎ　Ｊに対応するキーワード
ファイルレコードに派生語パターンコード「１２」と正
規キーワード語番号「１」が入っているので、派生語パ
ターンコード「１２」に対応する派生語パターン辞書レ
コード（第３図参照）中の第１番目の接辞ｒｃｙｊと語
根「ｅｆｆｉｃｉｅｎ　ｊとから正規キーワードである
［ｅｆｆｉｃｉｅｎｃｙ　Ｊ　’を合成する。第４ステ
ツプ（Ｂ１０４）では、第３ステツプで得られたいくつ
かの正規キーワードから重複するものを除いた後、これ
ら正規キーワードを文献ファイルレコードのキーワード
フィールドＢ５１３に書込む（第８図（ｂ）参照）。例
えば、文献番号Ｄ２３０ノテキスト中の語　［ｃｏｍｐ
ｉ　Ｉａｔ　ｉｏｎ　ｊ及び「ｃｏｍｐｉ　ｌｅｊから
はいずれも正規キーワードとして「ｃｏｍｐｉｌｅｒＪ
が得られるが、この正規キーワードは文献ファイルレコ
ードには１個だけ書込まれる。第５ステツプ（Ｂ１０５
）では、今処理した文献の文献番号を、抽出された各正
規キーワードの語根に対応するキーワードファイルレコ
ード中の文献番号フィールドＢ２１４にそれぞれ書込む
（第８図（ａ）参照）。

上記のキーワード抽出処理は、派生語パターン辞書を用
いてキーワードの正規化処理を行なう点に特徴があり、
この正規化処理によって、派生語の形で多数のキーワー
ドを実質上重複して抽出するの愚を避けることができる
。しかも、このように正規化したキーワードのみを抽出
・収録するにもかかわらず、検索に当って何の不自由も
生じないことは、次に説明する文献検索処理の内容から
明らかである。また、索引語作成の観点からも、正規化
されたキーワードのみが付与されることの利点は大きい
。

次に、文献検索機能を実現するために中央処理装置Ｂ１
が行なう処理の概略フローチャートを第１０図に示す。

第１ステツプ（Ｂ１５１）では、質問式を入力装置Ｂ３
から読込み、検索キーとなる語を切出す。第２ステツプ
（Ｂ１５２）では、各検索キーについてキーワードファ
イルの検索ヲ行すう。この処理は実施例Ｉにおける訳語
辞書２１の検索（第４図のステップ１１９に入るまで）
と実質上同じである。第２ステツプで検索した各キーワ
ードファイルレコードは、各検索キーに対応する文献集
合を示している。第３ステツプ（Ｂ１５３）では、質問
式に従った集合演算によシ、出力すべき文献の文献番号
を絞って決定する。第４、ステップ（Ｂ１５４）では、
出力すべき文献のテキストとキーワードとを文献ファイ
ルＢ５１から読出し、これを出力装置Ｂ４に出力する。

例えば、第８図に示されたファイルに対して質問式「ｃ
ｏｍｐｉｌｅｒ　＆　ｅｆｆｉｃｉｅｎｃｙＪで間合わ
せると、文献番号ＤｉＯ３及びＤ２３０の文献が検索さ
れるが、ここで、文献番号Ｄ２３０の文献はそのテキス
トに「ｃｏｍｐｉｌｅｒＪという単語も「ｅｆｆｉｃｉ
ｅｎｃｙｊという単語も含まれていないにもかかわらず
検索されたことに注目すべきである。

また、上記質問式中のキー「ｅｆｆｉｃｉｅｎｃｙ　ｊ
の代９に、正規化キーワードでない「ｅｆｆｉｃｉｅｎ
ｔｊを用いても、全く同じ結果が得られる。これらは派
生語パターン辞書を用いたことの効果である。これと−
見類似する検索能力が、キーワードの前方最長一致をと
るという従来方法によってももたらされる。しかしなが
ら、前方最長一致による検索は字面のみについての機械
的な処理であるために、単に綴りに前方一致があるだけ
で意味上は無関係なキーワードを持つ文献が拾われる恐
れがある。

これに対して、本発明によれば、派生語パターン辞書を
用いて派生語群をチェックするので、前記のような検索
ノイズの発生を完全に防止することができる。

〔発明の効果〕

以上の説明から明らかなように、本発明は、その独特な
派生語及びその関連情報の取扱いにより、検索効率の低
下なしにファイルの所要記憶容量を大幅に圧縮し、特に
派生語を含めた検索については検索効率の顕著な向上を
もたらすものである。

本発明は、携帯型の電訳器から大型コンピュータを用い
た自動翻訳システムや文献データベースシステムに至る
まで、広範な分野に適用することができる。携帯型の装
置では辞書全体をＲＯＭ化することも困難ではない。他
方、膨大な情報を扱う大型システムでは、派生語パター
ン辞書を主記憶装置に収容し、他のファイルは二次（外
部）記憶装置に収容する形式が、コストパフォーマンス
の観点から有利である。

【図面の簡単な説明】

第１図は本発明の一実施例である電子辞書の構成を示す
ブロックダイヤグラム、第２図は第１図中の訳語辞書の
内容の例を示す図、第３図は同じく派生語パターン辞書
の内容の例を示す図、第４図は第１図の電子辞書の検索
処理のフローチャート、第５図は同じく検索結果の表示
の例を示す図、第６図は本発明の他の実施例である文献
データベースシステムの構成を示すブロックダイヤグラ
ム、第７図は第６図中のキーワードファイル及び文献フ
ァイルのキーワード抽出処理前における内容の例を示す
図、第８図は同じくキーワード抽出処理後における内容
の例を示す図、第９図は第６図のシステムのキーワード
抽出処理のフローチャート、第１０図は同じく文献検索
処理のフローチャートである。１・・・中央処理装置、２・・・記憶装置、２１・・・
訳語辞書、２２・・・派生語パターン辞書、３・・・入
力装置、４・・・表示装置、Ｂ１・・・中央処理装置、
Ｂ２・・・記憶装置、Ｂ２１・・・キーワードファイル
、Ｂ２２・・・派生語パターン辞書、Ｂ３・・・入力装
置、Ｂ４・・・出力装置、Ｂ５・・・大容量記憶装置、
Ｂ５１・・・文献ファイル。代理人　弁理士　野萩　守（ほか１名）茅　ｌ　目１・［２２７２２２２２第２１０扁Ｊ正■閃第３０Ｈ回目４面口第４図第Ｓ図（α）　く芙承語ン　く品書りン　く８劇１巳に話〉（
ｂ）　く黄単息もン　く品詞ン　〈ミ＠１感自ン第　に
　口明＋１ｌｉｉ書の浄書（内容に変更なし）第　７　日手続補正書（方式）％式％１、事件の表示　昭和５９年特許願第１３４５９号２、
発明の名称　情報蓄積検索方式３、補正をする者事件との関係　特許出願人代表者　三　１）　勝　茂４、代理人居　所　東京都港区虎ノ門二丁目７番９号６、補正の対
称　図面（第７図及び第８図）７、補正の内容　第７図
及び第８図を別紙のとおシに補正する〇

Claims

【特許請求の範囲】１、入力された語の語根に接続されて一群の派生語を生
成する接辞の組を示す派生語パターンコード及びそれら
派生語の関連情報を含むレコードを情報蓄積装置から読
出す段階と、前記読出された派生語パターンコードに対
応す桑接辞の組を記憶装置から読出す段階と、語根と前
記読出された接辞の組とから派生語を合成する段階と、
前記読出、　された関連情報の内から所要のものを出力
する段階とを含む、情報の蓄積検索方式。２、特許請求の範囲１において、その関連情報を共通部
分と個別部分とから構成するとともに、関連情報の内か
ら所要のものを出力する段階において関連情報を前記共
通部分と個別部分とから合成する、情報の蓄積検索方式
。