JPH0231273A - 単語辞書検索装置 - Google Patents

単語辞書検索装置

Info

Publication number
JPH0231273A
JPH0231273A JP63182071A JP18207188A JPH0231273A JP H0231273 A JPH0231273 A JP H0231273A JP 63182071 A JP63182071 A JP 63182071A JP 18207188 A JP18207188 A JP 18207188A JP H0231273 A JPH0231273 A JP H0231273A
Authority
JP
Japan
Prior art keywords
character string
word
word dictionary
search
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63182071A
Other languages
English (en)
Inventor
Shunichi Fukushima
俊一 福島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP63182071A priority Critical patent/JPH0231273A/ja
Publication of JPH0231273A publication Critical patent/JPH0231273A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、ワードプロセッサ等の文章処理装置に用いら
れ、単語辞書から文章の部分文字列に一致する全ての単
語を検索する単語辞書検索装置に関する。
(従来の技術) 近年、ワードプロセッサをはじめとする文章処理装置の
普及は著しい。このような文章処理装置において、最も
高頻度に行われる処理のひとつは、文字列検索処理であ
る0例えば1文章の所望の位置を捜すためにある文字列
を検索したり1文章中のある文字列を全て別の文字列に
置き換えたりする場合などに、文字列検索処理が行われ
る(これを第1種の文字列検索処理とする)。さらには
、文章の検査(文章中の誤すや不適切な部分の検出)。
キーワードの自動抽出、文章の音声への変換、他国語へ
の自動翻訳といつたより高度な文章処理を行うための第
1ステツプとして、単語辞書と文章とを照合し、単語辞
書から文章の部分文字列に一致する全ての単語を検索す
る場合にも1文字列検索処理が行われる(これを第2種
の文字列検索処理とする)。単語辞書と文章の照合は、
単語辞書に登録されている複数の単語の表記の文字列と
、文章の文字列との照合であり、やはり文字列検索処理
である。第1種の文字列検索と第2種の文字列検索処理
とは1文章から被検索文字列を捜し出す点では変わりが
ないが、第1′!1/iの文字列検索の被検索文字列は
、通常1個、多くとも数個程度であり、第21S1の文
字列検索処理の被検索文字列は。
通常、数万側から数十刃側(=単語辞書に収められてい
る単語数)という膨大な数である点が、大きな相違点で
ある。
そこで、従来、文字列検索処理専用に、登録上−ドと検
索モードとを有し%登録モードにおいては、入力される
複数の文字列を内部に記憶し、検索モードにおいては、
入力される文字列(ワイルドカード文字を含むことを許
す)から、登録モードで記憶された複数の文字列と一致
する全ての部分文字列を検出する文字列検索手段が実現
されている。このような文字列検索手段は、次の文献(
1)に示されているようにLSI化されている。なお、
ワイルドカード文字とは、任意の文字と一致するように
予め定められた特殊文字である。
r文字列検索LSIJ (山田・平田・水弁・高橋、 電子情報通信学会技術研究報告CAS87−25198
7年5月29日)  ・・・・・・・・・文献(1)上
記のような文字列検索手段は、@1種の文字列検索処理
には容易に適用できる。すなわち、まず、登録モードで
被検索文字列を文字列検索手段に登録し、久に、検索モ
ードで文章を文字列検索手段に入力すれは1文章から所
望の文字列を検索することができる。
(発明が解決しようとする練題) しかし、上記の文字列検素手段を、第2糧の文字列検索
処理に適用するには問題がある。前に記したように被検
索文字列の数が、通常、数刃側から数十刃側という膨大
な数であるからである。したがって、第1鴇の文字列検
索処理と同様の形態で第2種の文字列検索処理を実現し
ようとすると(登録モードで単語辞書の6単mを登録し
て、検索モードで文章を入力する方法をとると)、文字
列検索手段が非常に多くの文字列を登録可能であるか、
あるいは1文字列検索手段が多数用意されることが必要
になる。例えば、前記の文献(11でLSIとして実現
されている文字列検索手段は。
登録可能な文字列の数が64個であり、6万4千語の単
語辞書を登録するのに、1千個必要である。
そこで、文字列検索手段に、単語辞書ではなく、文章を
登録する方法が考えられる。すなわち、まず、登録モー
ドで文章を文字列検索手段に登録し。
検索モードで単語辞書を入力するという方法である。文
章の基本的な単位である文の長さは、一般に、数十文字
であるから、?:、の方法の方が、単語辞書を登録する
方式に比べて、文字列検索手段の個1.が少なくて済む
。しかし、文章に対して、先頭文字位置と文字列長を変
えて形成した可能な全てのパターンを、文字列検索手段
に登録する必要がある。例えば、「日本語を学習する」
という8文字の文に対しては、次のようなバリエーショ
ン(36通り)を登録する必要がある。8文字程度の文
で36通りであるから、数十文字の文に対しては数百通
りから数千通りともなり、やはり、文字列検索手段が多
数必要になってくる。
日本語を学習する 日本語を学習す 日本語を学習 日本語を学 日本語を 日本語 日本 日 単語を学習する 単語を学習す 単語を学習 本IF#を学 語を学習する 語を学習す また。ここで述べたような文字列検索手段を用いずに第
2種の文字列検索処理を実現する方法もあるが、第2種
の文字列検索処理についても文字列検索手段を用いた方
が、第1種の文字列検索処理と第2種の文字列検索処理
とで、1つの文字列検索手段を共用できる点で、文章処
理装置としては望ましい(文章処理装置として、効率の
良い構成がとれる)。
本発明の目的は1以上に述べたような文字列検索手段を
用いた単語辞書検索装置であって、かつ。
従来よりも少ない個数の文字列検索手段で構成できる単
語辞書検索装置を提供することである。
(課題を解決するための手段) 本発明は、単語辞書から文章の部分文字列に一致する全
ての単語を検索する単語辞書検索装置であって、前記単
語辞書を複数の部分単語辞書に分割し、該部分単語′W
書は単語の表記をデ+J ミタをはさんでベタ詰めした
形態をとり、前記文章の全文字位置から前記単語辞書に
おける最大表記長と同一長の単位文字列を抽出する単位
文字列抽出手段と、登録モードと検索モードとを有し該
登録モードにおいては入力される複数の文字列を内部に
記憶し該検索モードにおいては入力されるワイルドカー
ド文字を含む文字列から前記登録モードで記憶された複
数の文字列と一致する全ての部分文字列を検出する文字
列検索手段と、前記文字列検索手段に対して登録モード
を設定し前記単位文字列抽出手段によって抽出された複
数の単位文字列を前記文字列検索手段に入力する単位文
字列登録手段と、前記単位文字列抽出手段によって抽出
された単位文字列をもとに前記複数の部分単語辞書のな
かから検索対象とする部分単語辞書を選択する辞書選択
手段と、与えられた文字列の末尾に前記単位文字列と同
一の長さKなるまでワイルドカード文字を付加するワイ
ルドカード付加手段と。
前記文字列検索手段に対して検索モードを設定し前記ワ
イルドカード付加手段により前記辞書選択手段によって
選択された部分単語辞書の各単語の表記をワイルドカー
ド文字を付加して前記文字列検索手段に入力する単語辞
書入力手段とを備えることを特徴とする。
(作用) 本発明の詳細な説明する。
本発明における単位文字列抽出手段は、長さがn文字の
文章から、n通りの単位文字列を抽出する。このときの
単位文字列の長さUは、単語辞書における最大表記長と
同一とする(単語辞書中の最大炎の表記よりも長い文章
の部分文字列と照合を行っても無駄である)。発明が解
決しようとする問題点の項で示したような文章を文字列
検索手段に登録する従来の方法では、長さがnの文章か
ら抽出した先頭位置の異なるn通りの単位文字列を、さ
らに、長さの異なる部分文字列に辰開するわけであるか
ら1部分文字列の総数(文字列検索手段に登録する文字
列の数)は1次のようになる。
n≦Uのとき   n(n+1) n)uのとき  (n−u)u+↓u(u+1)= ”
 u (2n−u+1 ) 例えば、u=8とすると上記の式の値は、n=8のとき
36.n=16のとき100、 n=32のとき228
である。本発明で文字列検索手段に登録する単位文字列
の数は、n=8のとき8.n=16のとき16.n=3
2のとき32であるから、従来の方法に比べて、はるか
に少なくて済む(したがって、文字列検索手段の数も少
なくて済む)。
そして1本発明では、単位文字列を長さの異なる部分X
字列に肘開する代わりに、ワイルドカード付加手段によ
り単語辞書中の単語にワイルドカード文字を付加し、文
字列検索手段のワイルドカード文字を照合する機能を利
用することによって。
羊位文子列から長さの異なる複数の単語を検出するよう
にしている。第2図は単語辞書1の内容の例である。第
2図において、各単語はデリミタr/J*+−,zさん
でベタ詰めされている。例えば、「日本語全学習する」
という文章の先頭から「日本語」「日本」「日」と(1
5単語群を抽出する場合、従来の方法ならば、次のよう
な8通りの部分文字列と、槙2図のような単語辞41と
を照合することになる。
日本語を学習する 日本語を学習す 日本rf!4管学愉 日本語を学 日本語を 日本語 日本 日 しかし2本発明では、単語辞書の各表記に、長さUまで
ワイルドカード文字を付加してから照合を行う。第3図
は、第2図の単語辞書1の各表記にワイルドカード文字
を付加した形を示した図である(n=8の場合、ワイル
ドカード文字は「$」で表している)。したがって、本
発明では、「日本語を学習する」という1通りの単位文
字列と、第3図のような文字列とを照合すればよいこと
になる。
また、検索モードで単語辞書を文字列検索手段に入力す
る際に、単語辞書の容量が大きいことが問題となる。そ
こで2本発明では、辞書選択手段を設け、常に、単語辞
書のすべてを入力するのではなく、辞書選択手段によっ
て選択した部分のみを入力するようにする。これによっ
て、単語辞書のすべてを入力する場合に比べて、検索に
要する時間が大幅に短縮できる。
その際、検索の対象とする単語辞書の部分は、文字列検
索手段に登録する単位文字列をもとに選択する。例えば
、単語辞書を、単語の先頭文字ごとに分けて部分単語辞
書としておくならば、文字列検索手段に登録する各単位
文字列の先頭文字に対応する部分単語辞書のみを、検索
対象として選択すればよい。文字列検索手段に「日本文
学を学習す」「本文学を学習する」「文学を学習する」
「学を学習する」「を学習する」「学習する」「習する
」「する」「る」が登録されているならば、文字列検索
手段に単語辞書をすべて入力するのではなく1次のよう
な部分単語辞書のみを入力する。
「日」を先頭文字とする単語を収めた部分単語辞書「本
」を先頭文字とする単語を収めた部分単語辞書「文」を
先頭文字とする単語を収めた部分単語辞書「学」を先頭
文字とする単語を収めた部分単語辞書「を」を先頭文字
とする単語を収めた部分単語辞書「習」を先頭文字とす
る単語を収めた部分単語辞書「す」を先頭文字とする単
語を収めた部分単語辞書「る」を先頭文字とする単語を
収めた部分単語辞書(実施例) 図面を参照して、本発明を一層詳しく説明する。
第1図は本発明の単語辞書検索装置の一層・雄側の構成
を示すブロック図である。
第1図において、単語辞書1は、単語を登録した辞書で
ある。磁気ディスク装置、磁気テープ装置、ICメモ1
ハ光デイスク装置などで実現することができる。そして
、単語辞書1は、複数の部分単語辞書から構成される。
単語辞書lを部分単語辞書に分ける方法としては、例え
ば、単語の先頭文字ごとに分ける方法がある。第6図は
、単語辞書1を、単語の先頭文字ごとN個の部分単語辞
書1−1.1−2.・・・・・・・・・ 1−Nに分け
た構成を示す図でるる(第6図において、L、M、Nは
整数で、1<L<M<Nとする)。さらに、本発明にお
ける単語辞書1は、各単語の表記をデリミタをはさんで
ベタ詰めした形態をとる。第2図は、単語辞書1の内容
の例を1部分率語辞書1−Mについて示した図である。
第2図では、デリミタを「/」で表している。
文章入力手段2は、文章を入力する手段である。
その場で作成されながら文章が入力される形態をとって
も良いし、予め他の装置で作成された文章をまとめて読
み込む形態tとっても良い。文章入力手段2は、キーボ
ード、文字認識装置、音声認識装置、かな漢字変換装置
、磁気ディスク読み取り装置、磁気テープ読み取り装置
などで実現することができる。文章入力手段2より入力
された文章は、単位文字列抽出手段3へ送られる。
単位文字列抽出手段3は1文章入力手段2より入力され
た文章の全文字位置から、単語辞書1における最大表記
長Uと同一長の単位文字列を抽出する手段である0例え
は、u = 8の場合(以下。
動作例では、同様にu = 8として説明を行う)、「
第1図は本発明の単語辞書検索装置の一実施例の構成を
示すブロック図である。」という文章からは、次のよう
な単位文字列を抽出する。単位文字列抽出手段3は、抽
出した単位文字列を、単位文字列登録手段5と辞書選択
手段9とへ送る。
第1図は本発明の 1図は本発明の単 図は本発明の単語 は本発明の単語辞 本発明の単給辞書 すブロック図であ ブロック図である ロック図である。
ツク図である。
り図である。
図である。
である。
ある。
る。
文字列検索手段4は、登録モードと検索モードとを有し
、登録モードにおいては、入力される複数の文字列を内
部に記憶し、検索モードにおいては、入力される文字列
(ワイルドカード文字を含むことを許す)から、登録モ
ードで記憶された複数の文字列と一致する全ての部分文
字列を検出する手段である。文字列検索手段4は、公知
の手段であり、例えば、前記の文献(1)のようにして
実現できる。文献(1)のよりにして文字列検索手段4
を実現した場合、登録モードと検索モードの切り替えは
、外部からの信号を受は取ることによって行われる。登
録モードにおいては、まず、登録アドレス(文字列検索
手段4の内部に記憶する位置)が外部から設定され、続
いて、登録する文字列とが外部から入力されたならば1
文字列検索手段4は、文字列を1つ内部に記憶する。こ
れが繰り返されると、複数の文字列が文字列検索手段4
の内部に記憶されることになる。検索モードにおいては
、登録モードで記憶された文字列と一致する文字列が入
力されるごとに1文字列検索手段4は。
一致した文字列の登録アドレスを出力する。また。
その際、入力される文字列における一致位置(−致アド
レス)は、登録アドレスが出力されたときに1文字列検
索手段4に文字列がどこまで入力されたかをカウントし
ておくことによって得られ。
登録アドレスが出力されるのと同時に1文字列検索手段
4から出力される。
単位文字列登録手段5は1文字列検索手段4に対して登
録モードを設定し、単位文字列抽出手段3から送られて
きた複数の単位文字列を、文字列検索手段4へ入力する
手段である。第4図は、文献(1)のようにして文字列
検索手段4を実現した場合の、単位文字列登録手段5の
処理手順を示すフローチャートである。単位文字列登録
手段5は、まず、文字列検索手段4へ登録モードを設定
する信号を送る(その信号により文字列検索手段4は登
録モードになる)。そして、単位文字列登録手段5は、
単位文字列抽出手段3から単位文字列を1つずつ受は取
り、受は取った単位文字列を文字列検索手段4へ登録す
ることを繰り返す。単位文字列の文字列検索手段4への
登録は、登録アドレスを設定した後、登録する単位文字
列を文字列検索手段4へ入力するという処理である。単
位文字列抽出手段3から送られてくる単位文字列がなく
なったならば、単位文字列登録手段5は文字列検索手段
4へ登録モードを解除する信号を送り、処j!lを終了
する(ただし、登録モードを解除する信号は、単語辞書
入力手段6の発する検索モード設定信号で代用して省略
する形もとれる)。
辞書選択手段9は、単位文字列抽出手段3によって抽出
された単位文字列をもとに、複数の部分単語辞書のなか
から、検索対象とする部分単語辞書を選択する手段であ
る。部分単語辞書の選択方法は、単語辞書lを部分単語
辞書に分割する方法によるが、第6図のように、単語の
先頭文字ごとに部分単語辞書に分割する方法をとりた場
合には。
単位文字列抽出手段3によって抽出された各単位文字列
の先頭文字に対応する部分単語辞書を選択すればよい。
すなわち、第7図のような先頭文字と部分単語辞書の辞
書番号を対応付けた辞書選択表90を用意し、単位文字
列の先頭文字をキーとして、辞書選択表を引いて検索対
象とする部分単語辞書の辞書番号を得ればよい。辞書選
択手段9は、検索対象とする部分単語辞書の辞書番号を
、単語辞書入力手段6へ送る。
ワイルドカード付加手段lOは、与えられた文字列の末
尾に、単位文字列と同一の長さ(単語辞書lにおける最
大表記長と同一の長さ)Uになるまで、ワイルドカード
文字を付加する手段である。
単語辞書入力手段6から単語の表記(可変長)を受は取
り、単語辞書入力手段6ヘワイルド力−ド文字を付加し
た結果を返す形態で動作する0例えば、単語辞書入力手
段6から「日本」という表記を受は取ったならば、単語
辞書入力手段6へ「日本$$$$$$Jを返し、「日本
語」という表記を受は取ったならは[日本語$$$$$
Jを返す。
ワイルドカード文字を長さUまで付加した文字列を形成
する方法は、例えば、予めワイルドカード文字をU個収
めたバッファを用意しておき、単語辞書入力手段6から
受は取゛りた表記を、その文字列長弁だけ、先頭からバ
ッファにセットしくオーバーライドして書き込み)、そ
の結果のバッツァ内のX字列を取り出せば良い。
単語辞書入力手段6は、文字列検索手段4に対して検索
モードを設定し、ワイルドカード付加手段10により、
辞書選択手段9によって選択された部分単語辞書の各単
語の表記に、ワイルドカード文字を付加して、文字列検
索手段4へ入力する手段である。処理手順は、単位文字
列登録手段5とほぼ同様で、まず1文字列検索手段4に
検索モードを設定する信号を送り、次に、単語辞!F1
を文字列検索手段4へ入力しく辞書選択手段9から指示
された辞書番号の部分単語辞書を順次入力する)、その
入力が完了したら、文字列検索手段4へ検索モードを解
除する信号を送る。ただし、部分単語辞書を文字列検索
手段4へ入力する際には。
部分単語辞書の各単語をワイルドカード付加手段10へ
渡し、それに対してワイルドカード付加手段lOより返
される文字列を、文字列検索手段4へ入力するようにす
る。したがって、単語辞書入力手段6は1例えば、第2
図のような部分単語辞書1−Mに対しては、それを読み
込んで、ワイルドカード付加手段1oにより第3図のよ
うなワイルドカード文字付きの文字列に変えて、文字列
検索手段4へ入力する。なお、単語辞書入力手段6は、
単位文字列登録手段5による単位文字列の文字列検索手
段4への登録処理が完了してから、起動される必要があ
る。
検索結果記憶手段7は5文字列検索手段4による検索結
果を記憶する手段である。磁気ディスク装置、磁気テー
プ装置、ICメモリなどで実現することができる。検索
結果とは1文章中のどの部分に、どのような単語が出現
したか(単語辞書中の単語と文章がどこで一致したか)
という情報である。文章中のどの部分かという情報は、
文字列検索手段4において一致が発生したときに2文字
列検索手段4から出力される(一致した単位文字列の)
登録アドレスと対応する。どのような単語かという情報
は1文字列検索手段4において一致が発生したときに1
文字列検索手段4から出力される、^t@辞書1の一致
アドレスと対応する。そこで、検索結果記憶手段7は、
一致が発生したときの、単位文字列の登録アドレスと単
語辞4!lの一致アドレスの船を記憶する。この2つの
アドレスは、一致が発生したときに文字列検索手段4か
ら出力される情報であるから、それをそのまま記憶すれ
ばよい。
制御手段8は、文章入力手段2.単位文字列抽出手段3
1文字列検索手段4.単位文字列登録手段5、辞書選択
手段9.単語辞書入力手段6の動作を制御し、第5図の
ような処理を行わせる手段でアル、コンピュータのCP
 Uなどが用いられる。
制御手段8は、まず、文章入力手段2を起動して文章を
入力する(STEPI )、次に、制御手段8は、単位
文字列抽出手段3を起動して1文章から単位文字列を抽
出する(STEP2)。続いて。
制御手段8は、単位文字列登録手段5を起動し。
単位文字列を文字列検索手段4に登録する(STEP3
)。 この際1文字列検索手段4は登録モードに設定さ
れ、単位文字列登録手段5より入力される単位文字列を
、内部に記憶する。また、制御手段8は、辞41!を選
択手段9を起動して、検索対象とする部分単語辞書を選
択する(STEP4)。続いて、制御手段8は、単語辞
書入力手段6を起動し、単語辞41にワイルドカード文
字を付加して文字列検索手段4へ入力する(STEP5
)。この際、文字列検索手段4は検索モードに設定され
内部に記憶された単位文字列に対して、ワイルドカード
文字を含んだ単語辞書1の文字列を検索した結果を、検
索結果記憶手段7へ出力する。本実施例では、ワイルド
カード付加手段10は、単語辞書入力手段6から直接制
御されるようになっている(制御手段8がワイルドカー
ド付加手段10を制御するような形態も可能である)。
以上の実施例では、単語辞書1を部分単語辞書に分割す
る方法として、単語の先頭文字ごとに分割する方法を示
したが1本発明では1分割方法をこれに限定するもので
はない。単語の先頭文字に対して、1文字当り1個の部
分単語゛辞書とせず、複数の先頭文字をまとめて1個の
部分単語辞書としてもよい。また、より荒い分割方法と
しては、漢字であるか、仮名であるかによって分割する
だけでもよい。そして、前記の通り、辞書選択手段9に
おける検索対象の部分単語辞書の選択方法は、単語辞書
1の部分単語辞書への分割方法に応じた方法をとる。
また、1個の文字列検索手段4では文字列が登録しきれ
ない場合には、登録できる数ずつ登録・検索を繰り返す
方法か、または、複数個の文字列検索手段4を用いる方
法をとればよい。複数個の文字列検索手段4を用いる場
合には、登録モードでは、制御手段8が文字列検索手段
4に登録された文字列の数を監視し、1つの文字列検索
手段4の登録可能数に達したならば、単位文字列登録手
段5へ登録する文字列検索手段4を切り替える指令を送
るようにする。検索モードでは、単語辞書入力手段6は
、複数の文字列検索手段4へ並列に単語辞書1を入力し
1文字列検索手段4から出力される検索結果は、全て検
索結果記憶手段7へ書き込むようにする。
従来技術の項で示した第1種の文字列検索処理の実施形
態では、検索モードにおいて、文章を文字列検索手段に
入力する。この際2文章の任意の文字位置から照合が行
われる形がとられる。しかし、本発明のように、検索モ
ードにおいて、単語辞書を文字列検索手段に入力する場
合には、単語辞書の文字列の任意の位置から照合を行う
必要はない。各単語の表記の先頭位置から照合を開始す
ればよい。そのような照合開始位置の制限を行うために
は1次のような2つの方法がある。単語辞書内の表記は
単語ごとにデ’Jミタで区切られているので、第一の方
法は、文字列検索手段の照合がデリミタの直後から行わ
れるように制御することである(これは、一般に1アン
カーマツチと呼ばれる照合方法である)。文献(1)に
示されている文字列検索手段では、そのようなアンカー
マツチを実現できるようKなっている。第二の方法は、
アンカーマツチ金柑いずに、登録する単位文字列の先頭
にデIJ iりを登録しておくものである。これによっ
て、文字列検索手段がアンカーマツチ機能を持たなくと
も、単語辞書内のデリミタ位置から照合が行える。
また、第181の文字列検索処理を、これまでに述べて
いる文字列検索手段で行っているような文章作成装置に
、本発明の単語辞書検索装置を組み込むならば、文字列
検索手段を、filE1檀の文字列検索処理と第2種の
文字列検索処理とで共用することができる。
(発明の効果) 以上に説明したように5本発明によれば、文字列検索手
段を用いた単語辞書検索装置であって。
かつ、従来よりも少ない個数の文字列検索手段で構成で
きる単語辞書検索装置が得られる。
そして1文字列検索手段を用いた単語辞書検索装置であ
るので、第1種の文字列検索処理を1文字列検索手段で
行う文章作成装置と組み合わせることによって2文字列
検索手段を、第1種の文字列検索処理と第2Wiの文字
列検索処理とで共用する、効率の良い構成の文章作成装
置が実現できる。
そして、単語辞書検索装置を組み込むことによって、文
章作成装置は、文章について単なる文字列の情報だけで
なく、単語の情報を利用することができるようになり、
文章の検査や文章の音声変換をはじめとする、より高度
な文章処理を行えるようになる。
また2文章から抽出された単位文字列に応じて、部分単
語辞書を選択するようにしたので、検索モードにおいて
、文字列検索手段に入力する単語辞書の範囲を限定する
ことができる。そのため、単語辞書をすべて入力するの
に比べて高速な検索が行える。
なお、本発明の単語辞書検案装置では、各部分単語辞書
に登録されている単語は、必ずしも表記の文字コード順
に並べられている必要はない。従来、単語辞書について
は、そのなかに登録されている単語の並ひを管理するこ
とが煩わしく、単語の追加・削除作業に大きな負荷を加
えていた。本発明で用いている単語辞書は、部分単語辞
書に分けることは必要であるが1部分単語辞書内では単
語の並びを管理する煩わしさをなくすことができる。
さらに、単語辞書は1表記をペタ詰めした形態がとれる
ので、表記領域を固定長セした場合に比べて、容量が小
さく抑えられる。
内容の例を示す図である。
l・・・・・・単語辞書、2・・・・・・文章入力手段
、3・・・・・・単位文字列抽出手段、4・・・・・・
文字列検索手段、5・・・・・・単位文字列登録手段、
6・・・・・・単飴辞書入カ手段、7・・・・・・検索
結果記憶手段、8・・・・・・制御手段。
9・・・・・・辞書選択手段blO・・川・ワイルドカ
ード付加手段、9o・川・・辞書選択表。
代理人 弁理士  本 庄 伸 介
【図面の簡単な説明】
第1図は本発明の一実施例の構成を示すブロック図、第
2図は単語辞ja1の内容の例を示す図。 第3図は単語辞書1内の各単語の表記にワイルドカード
文字を付加した結果を示す図、第4図は単位文字列登録
手段5の処理手順を示す70−チャート、第5図は実施
例の処理手順を示すフローチャート、第6図は単語辞書
の部分単語辞書への分割方法の例を示す図、第7図は辞
書選択表90の第1図 第4図 a$$$$$$$ E3gzssssss e叫 $$$$$$ a没 $$$$$$ a本 $$$$$$ a$−誘 $$$$$ a参人$$$$$ 日曜$$$$$$ a曜日$$$$$ 第3図 第5図 (a) 第5図 (b) 第 図

Claims (1)

    【特許請求の範囲】
  1. 単語辞書から文章の部分文字列に一致する全ての単語を
    検索する単語辞書検索装置において、前記単語辞書を複
    数の部分単語辞書に分割し、該部分単語辞書は単語の表
    記をデリミタをはさんでベタ詰めした形態をとり、前記
    文章の全文字位置から前記単語辞書における最大表記長
    と同一長の単位文字列を抽出する単位文字列抽出手段と
    、登録モードと検索モードとを有し該登録モードにおい
    ては入力される複数の文字列を内部に記憶し該検索モー
    ドにおいては入力されるワイルドカード文字を含む文字
    列から前記登録モードで記憶された複数の文字列と一致
    する全ての部分文字列を検出する文字列検索手段と、前
    記文字列検索手段に対して登録モードを設定し前記単位
    文字列抽出手段によって抽出された複数の単位文字列を
    前記文字列検索手段に入力する単位文字列登録手段と、
    前記単位文字列抽出手段によって抽出された単位文字列
    をもとに前記複数の部分単語辞書のなかから検索対象と
    する部分単語辞書を選択する辞書選択手段と、与えられ
    た文字列の末尾に前記単位文字列と同一の長さになるま
    でワイルドカード文字を付加するワイルドカード付加手
    段と、前記文字列検索手段に対して検索モードを設定し
    前記ワイルドカード付加手段により前記辞書選択手段に
    よって選択された部分単語辞書の各単語の表記をワイル
    ドカード文字を付加して前記文字列検索手段に入力する
    単語辞書入力手段とを備えることを特徴とする単語辞書
    検索装置。
JP63182071A 1988-07-21 1988-07-21 単語辞書検索装置 Pending JPH0231273A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63182071A JPH0231273A (ja) 1988-07-21 1988-07-21 単語辞書検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63182071A JPH0231273A (ja) 1988-07-21 1988-07-21 単語辞書検索装置

Publications (1)

Publication Number Publication Date
JPH0231273A true JPH0231273A (ja) 1990-02-01

Family

ID=16111842

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63182071A Pending JPH0231273A (ja) 1988-07-21 1988-07-21 単語辞書検索装置

Country Status (1)

Country Link
JP (1) JPH0231273A (ja)

Similar Documents

Publication Publication Date Title
JPH0869476A (ja) 検索システム
JPH0231273A (ja) 単語辞書検索装置
JP2792147B2 (ja) 文字処理方法およびその装置
JPH0231274A (ja) 単語辞書検索装置
JPS60225273A (ja) 単語検索方式
JPH0267684A (ja) 校正支援方法
JPH01205226A (ja) 単語辞書検索装置
JPS63138479A (ja) 文字認識装置
JPH0452500B2 (ja)
JPH03118661A (ja) 単語検索装置
JPH02148174A (ja) Ocrによる住所データベース検索装置
JP2580566B2 (ja) 音声合成装置
JPH01114976A (ja) 文書処理装置の辞書構造
JPH01205267A (ja) 単語辞書検索装置
JPH01205266A (ja) 単語辞書検索装置
JPS5978400A (ja) 候補列作成方式
JPS62256075A (ja) 辞書検索方式
JPH0630100B2 (ja) 仮名漢字変換方式
JPH0268663A (ja) 文字列検索装置
JPH07319892A (ja) 文字列照合装置
JPS60193068A (ja) 文章解析方式
JPH0337764A (ja) 巣語辞書検索装置
JPS6198475A (ja) 日本語文章入力装置
JPH05324610A (ja) 住所表記漢字入力装置
JPH0337754A (ja) 単語辞書検索装置