JPH0231274A - 単語辞書検索装置 - Google Patents

単語辞書検索装置

Info

Publication number
JPH0231274A
JPH0231274A JP63182072A JP18207288A JPH0231274A JP H0231274 A JPH0231274 A JP H0231274A JP 63182072 A JP63182072 A JP 63182072A JP 18207288 A JP18207288 A JP 18207288A JP H0231274 A JPH0231274 A JP H0231274A
Authority
JP
Japan
Prior art keywords
character string
dictionary
word dictionary
search
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63182072A
Other languages
English (en)
Inventor
Shunichi Fukushima
俊一 福島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP63182072A priority Critical patent/JPH0231274A/ja
Publication of JPH0231274A publication Critical patent/JPH0231274A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、ワードプロセッサ等の文章処理装置に用いら
れ、単瞼辞書から文章の部分文字列に一致する全ての単
語を検索する単語辞書検索装置に関する。
(従来の技術) 近年、ワードプロセッサをはじめとする文章処理装置の
普及は著しい。このような文章処理装置において、最も
高頻度に行われる処理のひとつは。
文字列検索処理である。例えば、文章の所望の位置を捜
すためにある文字列を検索したり1文章中のある文字列
を全て別の文字列に置き換えたりする場合などに、文字
列検索処理が行われる(これを第1種の文字列検索処理
とする)。さらには。
文章の検査(文章中の誤りや不適切な部分の検出)、キ
ーワードの自動抽出、文章の音声への変換、他国飴への
自動翻訳といつたより高度な文章処理を行うための第1
ステツプとして、単讃辞書と文章とを照合し、単語辞書
から文章の部分文字列に一致する全ての単語を検索する
場合にも、又字列検索処理が行われる(これを第2種の
文字列検索処理とする)。単語辞書と文章の照合は、単
語辞書に登録されている複数の単語の表記の文字列と、
文章の文字列との照合であり、やはり文字列検索処理で
ある。第1種の文字列検索と第2橿の文字列検索処理と
は、文章から被検索文字列を捜し出す点では変わりがな
いが、第1種の文字タリ検鍬の被検索文字列は、通常1
個、多くとも数個程度であり、第2種の文字列検索処理
の被検索文字列は。
通常、数刃側から数十刃側(=単語辞書に収められてい
る単語数)という膨大な数である点が、大きな相違点で
ある。
そこで、従来1文字列検索処理専用に、登録モードと検
索モードとを有し、登録モードにおいては、入力される
複数の文字列を内部に記憶し、検索モードにおいては、
入力される文字列(ワイルドカード文字を含むことを許
す)から、登録モードで記憶された複数の文字列と一致
する全ての部分文字列を検出する文字列検索手段が実現
されている。このような文字列検索手段は1次の文献(
1)に示されているようにLSI化されている。なお。
ワイルドカード文字とは、任意の文字と一致するように
予め定められた特殊文字である。
1文字列検索LSIJ (山田・平田・水弁・高橋 電子情報通信学会技術研究報告CAS87−25.19
87年5月29日)   ・・・・・・・・・文献(1
)上記のような文字列検索手段は、第1種の文字列検索
処理には容易に適用できる。すなわち、まず、登録モー
ドで被検索又字列を文字列検索手段に登録し、久に、検
索モードで文章を文字列検索手段に入力子れば、文章か
ら所望の文字列を検索することができる。
(発明がPI#火しようとする峰題) しかし、上記の文字列検索手段を、第2種の文字列検索
処理に適用するにd問題がある。前記したように被検索
又字列の数が1通常、a万個から数十刃側という膨大な
数であるためである。したがって、第1種の文字列検索
処理と同様の形態で第2種の文字列検索処理を実現しよ
うとすると(登録モードで単語辞書の各単語を登録して
、検索モードで文章を入力する方法をとると)、文字列
検索手段が非常に多くの文字列を登録可能であるか、あ
るいは、文字列検索手段が多畝用意されることが必要に
なる。例えば、前記の文献(1)でLSI として実現
されている文字列検索手段は。
登録可能な文字列の数が64伽であり、6万4千語の単
語辞書を登録するのに、1千語必要である。
そこで、文字列検索手段に、単語辞書ではなく、文章を
登録する方法が考えられる。すなわち、まず、登録モー
ドで文章を文字列検索手段に登録し。
検索モードで単語辞書を入力するという方法である。文
章の基本的な単位である文の長さは、一般に、数十文字
であるから、この方法の方が、単語辞書を登録する方式
に比べて1文字列検索手段の個数が少なくて済む。しか
し1文章に対して、先頭文字位置と文字列長を変えて形
成した可能な全てのパターンを、文字列検索手段に登録
する必要がある。例え#′f:、、 r日本語を学習す
るJという8文字の文に対しては1次のようなバリエー
ション(36通り)1−登録する必要がある。8文字程
度の文で36通りであるから、数十文字の文に対しては
数百通りから数千通りともなり、やはり1文字列検索手
段が多数必要になってくる。
日本語を学習する 日本語を学古す 日本語を学習 日本語を学 日本語を 日本語 日本 日 単語を学習する 単語を学習す 単語を学習 単語を学 語を学習する 語を学習す また。ここで述べたような文字列検索手段を用いずに第
2mの文字列検索処理を実現する方法もあるが、第2種
の文字列検索処理についても文字列検索手段を用いた方
が、第1fmの文字列検索処理と第2種の文字列検索処
理とで、1つの文字列検索手段を共用できる点で1文章
処理装置とじては望ましい(文章処理装置として、効率
の良い構成がとれる)。
本発明の目的は1以上に述べたような文字列検索手段を
用いた単語辞書検索装置であって、かつ。
従来よりも少ない個数の文字列検索手段で構成できる単
語辞書検索装置を提供することである。
(課題を解決するための手段) 本発明は、単語辞書から文章の部分文字列に一致する全
ての単語を検索する単語辞書検索装置であって、前記単
語辞書を複数の部分単語辞書に分割し、該部分単語辞書
は各単語の表記に対して固定長の領域を持ち該固定長の
領域に表記を収めて余った部分にワイルドカード文字を
詰めた形態をとり、前記文章の全文字位置から前記固定
長の領域と同一長の単位文字列を抽出する単位文字列抽
出手段と、登録モードと検索モードとを有し該登録モー
ドにおいては入力される複数の文字列を内部に記憶し該
検索モードにおいては入力されるワイルドカード文字を
含む文字列から前記登録モードで記憶された複数の文字
列と一致する全ての部分文字列を検出する文字列検索手
段と、前記文字列検索手段に対して登録モードを設定し
前記単位文字列抽出手段によって抽出された複数の単位
文字列を前記文字列検索手段に入力する単位文字列登録
手段と、前記単位文字列抽出手段によって抽出された単
位文字列をもとに前記複数の部分単語辞書のなかから検
索対象とする部分単語辞書を選択する辞書選択手段と、
前記文字列検索手段に対して検索モードを設定し前記辞
書検索手段によりて選択された部分単語辞書を前記文字
列検索手段に入力する単語辞書入力手段とを備えること
を特徴とする。
(作用) 本発明の詳細な説明する。
本発明における単位文字列抽出手段は、長さがn文字の
文章から、n通りの単位文字列を抽出する。このときの
単位文字列の長さUは、単語辞書中の表記を収める領域
の長さと同一とする(単語辞書中の最大長の表記よりも
長い文章の部分文字列と照合を行っても無駄である)。
発明が解決しようとする問題点の項で示したような文章
を文字列検索手段に登録する従来の方法では、長さがn
の文章から抽出した先頭位置の異なるn通りの単位文字
列を、さらに、長さの異なる部分文字列に展開するわけ
であるから、部分文字列の総数(文字列検索手段に登録
する文字列の数)は、次のようになる。
n≦Uのとき   n(n+1) n ) uのとき  (n−u)u+Hu(n+1 )
=壺u(2n−n+1) 例えば、u = 8とすると上記の式の値は、n=8の
とき36.n=16のとき100、n=32のとき22
8である。本発明で文字列検索手段に登録する単位文字
列の数は、n=8のとき8.n=16のとき16.n−
32のとき32であるから、従来の方法に比べて、はる
かに少なくて済む(したがって、文字列検索手段の数も
少なくて済む)。
そして、本発明では、単位文字列を長さの異なる部分文
字列に展開する代わりに、単語辞書中の単語の表記にワ
イルドカード文字を付加し、文字列検索手段のワイルド
カード文字全照合する機能を利用することによりて、単
位文字列から長さの異なる復畝の単語を検出するように
している。第2図tよ従来の単一ffl辞書の内容の例
であり、第3図は本発明における単語辞書の内容の例で
ある。例えば、「日本語を学習する」という文章の先頭
から「日本語」「日本」「日」という単語群を抽出する
場合、従来の方法ならば、次のような8通りの部分又¥
列と、縞2図のような皐臼静讐10とt−照合すること
になる。
日本語を学資する 日本語を学習す 日本語を学習 日本語を学 日本語を 日本語。
日本 日 しかし、本発明では、単語辞書中にワイルドカード文字
が埋め込まれているので、「日本語を学習する」という
1通りの単位文字列と、第3図のような単語辞書1とを
照合すればよいことになる。
また、検索モードで単語辞書を文字列検索手段に入力す
る際に1単語辞書の容量が大きいことが問題となる。そ
こで、本発明では、辞書選択手段を設け、常に、単語辞
書のすべてを入力するのではなく、辞書選択手段によっ
て選択した部分のみを入力するようにする。これによっ
て、単語辞書のすべてを入力する場合に比べて、検索に
要する時間が大幅に短縮できる。
その際、検索の対象とする単語辞書の部分は、文字列検
索手段に登録する単位文字列をもとに選択する6例えば
、単語辞書を、単語の先頭文字ごとに分けて部分単語辞
書としておくならば、文字列検索手段に登録する各単位
文字列の先頭文字に対応する部分単語辞書のみを、検索
対象として選択すればよい。文字列検索手段に「日本文
学を学習す」「本文学を学習する」「文学を学習する」
「学を学習する」「を学習する」「学習する」「習する
」「する」「る」が登録されているならば1文字列検索
手段に単語辞書をすべて入力するのではなく1次のよう
な部分単語辞書のみを入力する。
「日」を先頭文字とする単語を収めた部分単語辞書「本
」を先頭文字とする単語を収めた部分単語辞書「文」を
先頭文字とする単語を収めた部分単語辞書「学」を先頭
文字とする単語を収めた部分単語辞書「を」を先頭文字
とする単語を収めた部分単語辞書「習」を先頭文字とす
る単語を収めた部分単語辞書「す」を先頭文字とする単
語を収めた部分単語辞書「る」を先頭文字とする単語を
収めた部分単語辞書(実施例) 図面を参照して、本発明を一層詳しく説明する。
第1図は本発明の単語辞書検索装置の一実施例の構成金
示すブロック図である。
第1図において、単語辞書1は、単語を登録した辞書で
ある。磁気ディスク装置、磁気テープ装置、ICメモリ
、光デイスク装置などで実現することができる。そして
、単語辞書lは、複数の部分単語辞書から構成される。
単語辞書1を部分単語辞書に分ける方法としては1例え
ば、単語の先頭文字ごとに分ける方法がある。第6図は
、単語辞書lを、単語の先頭文字ごとN個の部分単語辞
書1−1.1−2.・・・・・・・・・、1−Nに分け
た構成を示す図である(第6図において、L、M、Nは
整数で、1<L<M<Nとする)。さらに1本発明にお
ける部分単語辞書は、各単語の表記に対して、固定長(
以下、この長さをUで表す)の領域を持ち、この固定長
の領域に表記を収めて余った部分に、ワイルドカード文
字を詰めた形態をとる。第3図は、単語辞書1の内容を
、部分単語辞書1−Mについて示した図である。部分単
語辞書1−Mは。
「日」を先頭文字とする単語を収めた部分単語辞書であ
る。第3図では、ワイルドカード文字を「$」で表して
いる。また、u=8とした(以下、動作例を示す場合に
は、u = 8の場合で説明する)。
文章入力手段2は1文章を入力する手段である。
その場で作成されながら文章が入力される形態をとって
も良いし、予め他の装置で作成された文章をまとめて読
む込む形態をとっても良い。文章入力手段2は、キーボ
ード、文字認識装置、音戸認i#!装置、かな漢字変換
装置、磁気ディスク読み取り装置、磁気テープ読み取り
装置などで実現することができる。文章入力手段2より
入力された文章は、単位文字列抽出手段3へ送られる。
単位文字列抽出手段3は、文章入力手段2より入力され
た文章の全文字位置から、固定長Uの単位文字列を抽出
する手段である。例えば、「第1図は本発明の単飴静書
検索装置の一実施例の構成を示すブロック図である。」
 という文章からは。
次のような単位文字列(u=8の場合)を抽出する。単
位文字列抽出手段3は、抽出した単位文字列を、単位文
字列登録手段5と辞書選択手段9とへ送る。
第1図は本発明の 1図は本発明の単 図は本発明の単語 は本発明の単飴辞 本発明の単一辞書 すブロック図であ ブロック図である ロック図である。
ツク図である。
り図である。
図である。
である。
ある。
る。
文字列検索手段4は、登録モードと検索モードとを有し
、登録モードにおいては、入力される複数の文字列を内
部に記憶し、検索子−ドにおいては、入力される文字列
(ワイルドカード文字を含むことを許す)から、登録モ
ードで記憶された複数の文字列と一致する全ての部分文
字列を検出する手段である。文字列検索手段4は、公知
の手段であり、例えは、前記の文献(4)のようにして
実現できる。文献(1)のようにして文字列検索手段4
を笑現しだ場合、登録モードと検索モードの切り替えは
、外部からの信号を受は取ることによって行われる。登
録モードにおいては、まず、登録アドレス(文字列検索
手段4の内部に記憶する位置)が外部から設定され、続
いて、登録する文字列とが外部から入力されたならば2
文字列検案手段4は、文字列を1つ内部に記憶する。こ
れが繰り返されると、複数の文字列が文字列検索手段4
の内部に記憶されることになる。検索モードにおいては
、登録モードで記憶された文字列と一致する文字列が入
力されるごとに1文字列検索手段4は。
一致した文字列の登録アドレスを出力する。また、その
際、入力される文字列における一致位置(−致アドレス
)は、登録アドレスが出力されたときに1文字列検索手
段4に文字列がどこまで入力されたかtカウントしてお
くことによって得られ。
登録アドレスが出力されるのと同時に、文字列検索手段
4から出力される。
単位文字列登録手段5は、文字列検索手段4に対して登
録モードを設定し、単位文字列抽出手段3から送られて
きた複数の単位文字列を、文字列検索手段4へ入力する
手段である。第4図は2文#(1)のようにして又子列
検索手段4t−実現した場合の、単位文字列;!It録
手段5の処理中till示すフローチャートである。単
位文字列登録手段5は。
まず1文字列検案手段4へ登録モードを設定する信号を
送る(その信号により文字列検索手段4は登録モードに
なる)。そして、単位文字列登録手段5は、単位文字列
抽出手段3から単位文字列を1つずつ受は取り、受は取
った単位文字列を文字列検索手段4へ登録することを縁
り返す。単位文字列の文字列検索手段4への登録は、登
録アドレスを設定した後、登趣する単位文字列を文字列
検索手段4へ大力するという処理である。単位文字列抽
出手段3から送られてくる単位文字列がなくなったなら
ば、単位文字列登録手段5に文字列検素子膜4へ登録モ
ードを解除する信号を送り、処理を終了する(ただし、
登録モードを解除する信号は、単語辞書入力手段6の発
する検索モード設定信号で代用して省略する形もとれる
)。
辞書選択手段9は、単位文字列抽出手段3によって抽出
された単位文字列をもとに、複数の部分単語辞書のなか
から、検索対象とする部分単語辞書を選択する手段であ
る。部分単語辞書の選択方法は、単語辞JIIlを部分
単語辞書に分割する方法によるが、第6図のように、単
語の先頭文字ごとに部分単語辞書に分割する方法をとっ
た場合には、単位文字列抽出手段3によって抽出された
各単位文字列の先頭文字に対応する部分単語辞書を選択
すればよい。すなわち、第7図のような先頭文字と部分
単語辞書の辞書番号を対応付けた辞書選択表90を用意
し、単位文字列の先頭文字をキーとして、辞書選択表を
引いて検索対象とする部分単語辞書の辞書番号を得れば
よい。辞書選択手段9は、検索対象とする部分単語辞書
の辞書番号を、単語辞書入力手段6へ送る。
単語辞書入力手段6は、文字列検索手段4に対して検索
モードを設定し、単語辞a1のうち、辞書選択手段9に
よって選択された部分単語辞書を。
文字列検索手段4へ入力する手段である。処理手順は、
単位文字列登録手段5とほぼ同様で、まず。
文字列検索手段4に検索モードを設定する信号を送り、
次に、単語辞書lを文字列検索手段4へ入力しく辞書選
択手段9から指示された辞書番号の部分単語辞書を順次
入力する)、その入力が完了したら、文字列検索手段4
へ検索モードを解除する信号を送る。なお、単語辞書入
力手段6は、単位文字列登録手段5による単位文字列の
文字列検索手段4への登録処理が完了してから、起動さ
れる必要がある。
検索結果記憶手段7は1文字列検索手段4による検索結
果を記憶する手段である。磁気ディスク装置、磁気テー
プ装置、ICメモリなどで実現することができる。検索
結果とは、文章中のどの部分に、どのような単語が出現
したか(単語辞書中の単語と文章がどこで一致したか)
という情報である。文章中のどの部分かという情報は1
文字列検索手段4において一致が発生したときに、文字
列検索手段4から出力される(一致した単位文字列の)
登録アドレスと対応する。どのような単語かという情報
は1文字列検索手段4において一致が発生したときに1
文字列検索手段4から出力される、単語辞書1の一致ア
ドレスと対応する。そこで、検索結果記憶手段7は、一
致が発生したときの、単位文字列の登録アドレスと単語
辞書lの一致アドレスの組を記憶する。この2つのアド
レスは、一致が発生したときに文字列検索手段4から出
力される情報であるから、それをそのまま記憶すればよ
い。
制御手段8は1文章入力手段2.単位文字列抽出手段3
1文字列検索手段41単位文字列登録手段5.辞書選択
手段9.単語辞書入力手段6の動作を制御し、第5図の
ような処理を行わせる手段テする。コノピユータのCP
Uなどが用いられる。
制御手段8は、まず、文章入力手段2を起動して文章を
入力する(STEPl)。次に、制御手段8は、単位文
字列抽出手段3を起動して1文章から単位文字列を抽出
する(STEf’2)。続いて、制御手段8は、単位文
字列登録手段5を起動し、単位文字列を文字列検索手段
4に登録する(STEP3)。
この際1文字列検索手段4は登録モードに設定され、単
位文字列登録手段5より入力される単位文字列を、内部
に記憶する。また、制御手段8は。
辞書選択手段9を起動して、検索対象とする部分単語辞
書を選択する(STEP4)。続いて、制御手段8は、
単語辞書入力手段6を起動し、単語辞書lを文字列検索
手段4へ入力する(STEP5)。
この際1文字列検索手段4は検索モードに設定され、内
部に記憶された部位文字列に対して単語辞81を検索し
た結果を、検索結果記憶手段7へ出力する。ただし、5
TEP3と5TEP4の順序は入れ候えてもよいし、同
時に行ってもよい。
以上の実施例では、単飴辞C1を部分単語辞書に分割す
る方法として、1e、飴の先頭文字ごとに分割する方法
を示したが、本発明では1分割方法をこれに限定するも
のではない。単語の先頭文字に対して、1文字当り1個
の部分単語辞書とせず、複数の先頭文字をまとめてl 
([&iの部分単語辞書としてもよい。また、より荒い
分割方法としては。
漢字であるか、仮名であるかによって分割するだけでも
よい。そして、前記の通り、辞書選択手段9における検
索対象の部分単相辞書の選択方法は。
単詩辞itの部分単語辞書への分割方法に応じた方法を
とる。
また、1個の文字列検索手段4では文字列が登録し詐れ
ない場合には、登録できる数ずつ登録・検案を繰り返す
方法か、または、複数個の文字列検索手段4t−用いる
方法をとれはよい。複数個の文字列検案手段4を用いる
場合には、登録モードでは、制御手段8が文字列検索手
段4に登録された文字列の数を監視し、1つの文字列検
索手段4の登録可能数に達したならば、単位文字列登録
手段5へ登録する文字列検案手段4を切り替える指令忙
送るようにする。検索モードでは、単語辞書入力手段6
は、複数の文字列検索手板4へ並列に単飴辞41を入力
し、文字列検索手段4から出力される検索結果は、全て
検索結果記憶手段7へ書き込むようにする。
従来技術の項で示した第1種の文字列検索処理の実施形
態では、検索モードにおいて1文章を文字列検索手段に
入力する。この際、文章の任意の文字位置から照合が行
われる形がとられる。しかし、本発明のように、検索モ
ードにおいて、単語辞4!:t−文字列検索手段に入力
する場合には、単語辞書の文字列の任意の位置から照合
を行う必要はない。各単語の表記の先頭位置から照合を
開始すればよい。そのような照合開始位置の制限を行う
ためには、次のような2つの方法がある。通常、単語辞
書内の表記は単語ごとにデリミタで区切られている。そ
こで、第一の方法は、文字列検索手段の照合がデリミタ
の直後から行われるように制御することである(これは
、一般に、アンカーマツチと呼ばれる照合方法である)
。文献(1)に示されている文字列検索手段では、その
ようなアンカーマツチを実現できるようになっている。
第二の方法は、アンカーマツチを用いずに、登録する単
位文字列の先頭にデリミタを登録しておくものである。
これによって1文字列検索手段がアンカーマツチ機能を
持たなくとも、単語辞書内のデリミタ位置から照合が行
える。
また、第1株の文字列検索処理を、これまでに述べてい
る文字列検索手段で行っているような文章作成装置に、
本発明の単語辞書検索装置を組み込むならば1文字列検
索手段を、第1種の文字列検索処理と第2糧の文字列検
索処理とで共用することができる。
(発明の効果) 以上に説明したように1本発明によれば、文字列検索手
段を用いた単語辞書検索装置であって、かつ、従来より
も少ない個数の文字列検索手段で構成できる単語辞書検
索装置が得られる。
そして、文字列検索手段を用いた単語辞書検索装置であ
るので、第1種の文字列検索処理を、文字列検索手段で
行う文章作成装置と組み合わせることによって、文字列
検索手段を、第1橿の文字列検索処理と第2椙の文字列
検索処理とで共用する。効軍の良い構成の文章作成装置
が実現できる。
そして、単語辞書検索装置を組み込むことによって、X
章作成&&は、文章について単なる文字列の情報たけで
なく、j!iLMの情報を利用することができるように
なり、文章の検査や文章の音声変換をはじめとする。よ
り高度な文VL逃埋を行えるようになる。
また1文章から抽出された単位文字列に応じて。
部分単語辞書を選択するようにしたので、検索モードに
おいて1文字列検索手段に入力する単語辞−1の範囲を
限足することができる。そのため、単語辞書をすべて入
力するのに比べて高速な検索が行える。
なお、本発明の単語辞書検索装置では、各部分単語辞書
に登録されている単語は、必ずしも表記の文字コード順
に並べられている必要はない。従来、単語辞書について
は、そのなかに登録されている単線の並びを管理するこ
とが煩わしく、単語の追加・削除作業に大きな負荷を加
えていた。本発明で用いている単語辞書は1部分単語辞
書に分けることは必要であるが、部分単語辞書内では単
語の並びを管理する煩わしさをなくすことができる。
【図面の簡単な説明】
第1図は本発明の一実施例の構成を示すブロック図、第
2図は従来の単語辞書の内容の例を示す図、第3図は本
発明の単語辞書1の内容の例を示す図、第4図は単位文
字列登録手段5の処理手順を示すフローチャート、第5
図は実施例の処理手順を示すフローチャート、第6図は
単語辞書の部分単語辞書への分割方法の例を示す図、第
7図は辞書選択表90の内容の例を示す図である。 1・・・・・・単語辞書、2・・・・・・文章入力手段
、3・・・・・・単位文字列抽出手段、4・・・・・・
文字列検索手段、5・・・・・・単位文字列登録手段、
6・・・・・・単語辞書入力手段、7・・・・・・検索
結果記憶手段、8・・・・・・制御手段、9・・・・・
・辞書選択手段、90・・・・・・辞書選択表。 代理人 弁理士  本 庄 伸 介 第 図 第 図 901  &ffjllfj 第 図

Claims (1)

    【特許請求の範囲】
  1. 単語辞書から文章の部分文字列に一致する全ての単語を
    検索する単語辞書検索装置において、前記単語辞書を複
    数の部分単語辞書に分割し、該部分単語辞書は各単語の
    表記に対して固定長の領域を持ち該固定長の領域に表記
    を収めて余った部分にワイルドカード文字を詰めた形態
    をとり、前記文章の全文字位置から前記固定長の領域と
    同一長の単位文字列を抽出する単位文字列抽出手段と、
    登録モードと検索モードとを有し該登録モードにおいて
    は入力される複数の文字列を内部に記憶し該検索モード
    においては入力されるワイルドカード文字を含む文字列
    から前記登録モードで記憶された複数の文字列と一致す
    る全ての部分文字列を検出する文字列検索手段と、前記
    文字列検索手段に対して登録モードを設定し前記単位文
    字列抽出手段によって抽出された複数の単位文字列を前
    記文字列検索手段に入力する単位文字列登録手段と、前
    記単位文字列抽出手段によって抽出された単位文字列を
    もとに前記複数の部分単語辞書のなかから検索対象とす
    る部分単語辞書を選択する辞書選択手段と、前記文字列
    検索手段に対して検索モードを設定し前記辞書検索手段
    によって選択された部分単語辞書を前記文字列検索手段
    に入力する単語辞書入力手段とを備えることを特徴とす
    る単語辞書検索装置。
JP63182072A 1988-07-21 1988-07-21 単語辞書検索装置 Pending JPH0231274A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63182072A JPH0231274A (ja) 1988-07-21 1988-07-21 単語辞書検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63182072A JPH0231274A (ja) 1988-07-21 1988-07-21 単語辞書検索装置

Publications (1)

Publication Number Publication Date
JPH0231274A true JPH0231274A (ja) 1990-02-01

Family

ID=16111861

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63182072A Pending JPH0231274A (ja) 1988-07-21 1988-07-21 単語辞書検索装置

Country Status (1)

Country Link
JP (1) JPH0231274A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04245085A (ja) * 1991-01-30 1992-09-01 Kenwood Corp ディスクプレーヤ装置
DE112007001118T5 (de) 2006-06-19 2009-02-26 Toyota Jidosha Kabushiki Kaisha, Toyota-shi Brennstoffzelle

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04245085A (ja) * 1991-01-30 1992-09-01 Kenwood Corp ディスクプレーヤ装置
DE112007001118T5 (de) 2006-06-19 2009-02-26 Toyota Jidosha Kabushiki Kaisha, Toyota-shi Brennstoffzelle

Similar Documents

Publication Publication Date Title
US5794177A (en) Method and apparatus for morphological analysis and generation of natural language text
JPH079655B2 (ja) スペルの誤りの検出訂正方法及び装置
US5560037A (en) Compact hyphenation point data
US7328404B2 (en) Method for predicting the readings of japanese ideographs
KR20040101678A (ko) 복합 형태소 분석 장치 및 방법
KR870005314A (ko) 속기 번역 시스템
JPH0231274A (ja) 単語辞書検索装置
JP2792147B2 (ja) 文字処理方法およびその装置
JP3470927B2 (ja) 自然語解析方法及び装置
KR102317910B1 (ko) 중국어 형태소 분석 장치 및 방법
JP3873305B2 (ja) 仮名漢字変換装置および仮名漢字変換方法
JPS6057421A (ja) 文書作成装置
JPS63278174A (ja) 翻訳装置
JPS60225273A (ja) 単語検索方式
JPH0231273A (ja) 単語辞書検索装置
JPH01205267A (ja) 単語辞書検索装置
JPH01266670A (ja) 日本語対象文固有用語抽出処理装置
JPH01114976A (ja) 文書処理装置の辞書構造
JP2900628B2 (ja) 辞書検索装置
JPH01205226A (ja) 単語辞書検索装置
JP2006106896A (ja) データベース登録システム、データベース検索システム、語彙索引登録方法及び異表記同一視検索方法
KR0151902B1 (ko) 회귀적방법을 이용한 형태소 분석장치 및 그 방법
JPH01205266A (ja) 単語辞書検索装置
JPH10198676A (ja) 日本語形態素解析装置及び日本語形態素解析方法
JP2005322162A (ja) テキスト解析装置、その方法、プログラムおよびその記録媒体