JPS59160275A - 単語認識装置 - Google Patents

単語認識装置

Info

Publication number
JPS59160275A
JPS59160275A JP58033569A JP3356983A JPS59160275A JP S59160275 A JPS59160275 A JP S59160275A JP 58033569 A JP58033569 A JP 58033569A JP 3356983 A JP3356983 A JP 3356983A JP S59160275 A JPS59160275 A JP S59160275A
Authority
JP
Japan
Prior art keywords
candidate
word
character
characters
register
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58033569A
Other languages
English (en)
Inventor
Yoshiaki Kurosawa
由明 黒沢
Yoshiyuki Hara
義幸 原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP58033569A priority Critical patent/JPS59160275A/ja
Publication of JPS59160275A publication Critical patent/JPS59160275A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 れた単語を簡易に且つ効果的にN悲識することのできる
単語認識装置に関する。
〔発明の技術的背景とその問題点3 手書入力、或いは音声入力された単語を認識する場合、
基本的にはその単語を構成する文字や音韻(ここでは音
韻についても文字として定義する)を個々に認識して行
われるがモの個々の文字に対する認識結果を単純に組合
せただけでは、十分な認識率を得ることができないこと
が多い。例えば成る文字の認識ができないとき、その単
語を認識することが出来なくなる場合がある。一方、上
記単語がn文字からなり、その単語を構成すると考えら
れる文字種がP個存在すると、単語を構成する文字列の
数はpn通りにもなる。然し、単語としての有意な文字
の組合せが限られていることから、この牡質を利用する
ことによって単語認識率の向上を図り得る。
そこで従来より、有意の単語を予め辞書として登録して
おき、入力単語の個々の文字の認識結果の単語としての
有意な組合せを上記単語辞書を参照して選択して単語を
認識することが行われている。
然し乍ら、入力単語の各文字毎に認識して求められた候
補文字数が多い場合には、その糾合せが膨大となる為、
単語辞舊との照合に多大な時間を要すると云う不具合が
あった。そこで、単語の各文字位置において求められる
候補文字の数を固定的に定め、これらの中での紹合せか
ら単語認識を行うことが考えられているが、各文字位置
において求められる候補文字の数が必ずしも一定で力い
ので、認識処理が複雑化すると云う問題があった。また
上記固定的な候補文字の数を少なく設定すると、各文字
について求められる認識結果を十分に利用でき々い場合
が生じ、この結果、単語としての認識率が低下すると云
う不具合も生じた。
〔発明の目的〕
本発明はこのような事情を考慮してなされたもので、そ
の目的とするところは、入力単語の各文字についてそれ
ぞれ認識した認識結果を十分に利用して、簡易にしかも
効率良く上記入力単語を高精変に認識することのできる
実用性の高い単語認識装置を提供することにある。
〔発明の概要〕
本発明は入力単語の各文字を認識して求められた候補文
字をレジスタに格納し、上記入力単語の文字数と各文字
位置毎に求められた候補文字数との情報に従って前記レ
ジスタからの候補文字の読出しと、単語辞書に予め登録
された単語の続出しとを制御して上記単語の対応した文
字位置における文字と前記候補文字とを比較し、一致し
た候補文字のその文字位置における候補順位に対応した
得点の総和を求めて、前記入力単語の候補単語な前記単
語辞書に登録された単語の中から選択するようにしたも
のである。
〔発明の効果〕
かくして本発明によれば、入力単語の各文字についてそ
れぞれ認識された結果を十分に利用した上で候補単語を
適訳するので、その認識精度を十分に高めることができ
る。しかも、単語の文字と候補文字との比較処理を、入
力単語の文字数および各文字位置における候補文字数に
従って制御して行うので、簡易に、しかも効率良く認識
処理を行い得る。特に、候補単語の糾合せを、単語辞書
に登録された単語の各文字に対する候補単語の、その文
字位置における候補順位に対応した得点の総和としてそ
の有意性を判定するので、認識処理が簡単な上、信頼性
が高い。故に、簡易に効果的に入力単語を認識すること
が可能となり、実用的利点が絶大である。
〔発明の実施例〕
以下、図面を参照して本発明の実施例につき説明する。
第1図は実施例装置の概略構成図であり、手書入力また
は音声入力された単語は認識部1に導びかれ、上記入力
単語を構成する文字列の各文字毎に膠識される。今、入
力単語がn文字からなる場合、認識部1はn個の文字に
ついてそれぞれrI(1=’l 、〜n)個の候補文字
RI、j(j=1、〜r+)を求めている。上記候補文
字R’sJは、入力単語を構成する1番目の文字に対す
る3番目の候補文字であることを示している。しかして
、このようにして認識部1で求められた候補文字” i
 * Jは、その文字位置に対応して候補レジスタ2に
順次格納される。この候補レジスタ2に格納された候補
文字Ri、jは、アドレスカウンタ3の制御を受けて、
順次1つずつ続出されてコンパレータ4の一方の入力端
に与えられる。このコンパレータ4は、他方の入力端に
アドレスカウンタ5の制御を受けて単語辞書6から読出
される単語の文字を入力し、この単語文字と上記候補単
語RI、Jとを比較照合するものである。そして、この
コン/母レータ4による照合結果は、特に上記単語文字
に対して候補文字R1,jが一致したときの情報は、ア
キュムレータ7に与えられるようになっている。
尚、前記アドレスカウンタ3,5は、後述するように1
アドレス制御部8によってその作動、つまり候補レジス
タ2および単語辞書6の読出しを制御するものである。
そして、このアドレス制御部8は、その制御の情報を終
了検出部9より受けるようになっている。
ところで、得点出力部10は前記候補レジスタ2から読
出される候補文字RH,jのその文字位置1における候
補順位四に対応する得点を出力するものである。この得
点は、例えば入力単語の文字について認識処理して求め
た複数の候補単語”+jを、類似度の高いものから順に
並べたときの順位情報、あるいはこの順位情報に対して
適当な重付けを施した重みの情報、または上記類似度の
値そのものからなるものである。この上う匁得点が、前
記候補レジスタ2から続出される候補文字R1,jに対
応して得点出力部10より出力され、前記アキュムレー
タ7に与えられる。アキュムレータ7は、前記コンパレ
ータ4が前述した文字照合によって一致結果を得たとき
、その一致した候補文字R’+Jの評価値として上記得
点を取込むものである。そして、単語辞書6から読出さ
れた単語の各文字について、その文字位置毎に一致した
候補文字R1,jK対応して得られた上記得点の総和を
求め、これを前記入力単語に対する単語辞書から選択さ
れた単語の認識結果として出力している。
そして、この単語の認識結果は、前記単語辞書6から選
択されて比較処理に供された単語のカテゴリ情報と共、
に出力部11に与えられている。
前記アキュムレータ7は、単語辞書6に登録された単語
中の、入力単語と文字数を同じくする全ての単語につい
て上述した認識処理を行い、各単語についての得点の総
和を順次求める。出力部11では、このようにして求め
られた得点の総和を相互に比較し、例えばその総和値が
高いものを入力単語に最も似ている卑語をして、つまり
候補単語として選択している。
尚、得点を類似度に対応させた場合には総和値の高いも
のを選択すればよいが、逆に候補順位そのものを得点と
した場合には、総和値が最も小さくなるものを選択する
ようにすればよい。
つまり、得点の設定の仕方に応じて、総和値に従う候補
単語の選択条件を変えることが必要なことは云うまでも
ない。また、単語の文字位置によっては、コンパレータ
4にて一致検出結果が得られ々い場合も考えられるが、
このときにハ得点を「0」または得点の総和処理におい
て無視されるような値を与えるようにしておけばよい。
このようKして、本装置においては、入力単語の各文字
について認識された候補文字と、単語辞書6に登録され
た単語の文字とを各文字位置毎に比較し、一致検出され
た候補文字の得点の総和から前記入力単語に対する候補
単語を求めている。
ところで、前記候補レジスタ2に記憶される9    
                  Anり候補文字
RI、jと、アドレス制御部8による上記候補文字R1
,jの続出し制御は次のようにして行われる。第2図は
その例を模式的に示すものである。1文字からなる入力
単語の各文字についてそれぞれ求められた候補文字Rl
、Jは、その文字位F[Kアドレス指定されて候補レジ
スタ2に格納される。このとき、候補文字R+、jは各
文字位置において類似度の晶いものから順に第1位、第
2位・・・とじて候補順位が定められ、レジスタ20割
当てられたアドレス領域に順に格納される。例えば第1
番目の文字について一求められた11個の候補文字RI
、−11R192〜p、、 rlは、候補レジスタ2の
アドレスrOJ、rlJ〜rr、−IJに順に格納され
る。そして、その次のアドレス「1 」Kは、上記第1
番目の文字について求められた候補文字が他に存在しな
いことを示す特定のコード、例えば(oooo)が格納
される。同様にして第2番目の文字について求められた
12個の候補文字R、、j  も、レジスタ2の他のア
ドレス領域に順に格納され、0 の最後の格納アドレスの次には上記特定コードが格納さ
れる。このようにして、各文字位置についてそれぞれ求
められた候補文字Ri 、、iが、その最後に特定コー
ドが付加されてレジスタ2に格納される。また最後の文
字については、つまりn文字目については、その候補文
字の終りに別の特定コード、例えば(0001)を付加
する。尚、これらの特定コードは、候補文字R1,」を
示すコードとして用いられないものであることは云うま
でもない。そして、各文字位置毎に設けられた( 00
00)からなる特定コードは、その文字位置についての
f:補文字の終了を示すものとして用いられ、また最後
に設けられた(0001)からなる特定コードは、全て
の候補文字に対する終了を意味するものとして用いられ
る。
前記終了検出部9、つまり第2図における終了コード検
出部91は、上述した特定コードを検出してアドレス制
御部8を制御している。しかしてアドレス制御部8は、
先ずアドレスカラ’is”9”ii’ sを歩進して、
第1文字位置の第1候補である候補文字R1□を候補レ
ジスタ2から読出すと共に、アドレスカウンタ5を付勢
して、単語辞書6から入力単語と同じ文字数の単語を選
択し、その第1文字位置の文字を読出す。このようにし
て続出された各文字についてコンパレータ4による一致
照合が行われることになる。
そして、その照合で一致結果を得たとき、その情報が前
記アキュムレータ7に与えられる。また一致結果が得ら
れない場合には、アドレスカウンタ3が歩進され、次の
候補文字がレジスタ2から読出される。このようにして
、順に候補文字が続出されて、単語辞書6から続出され
た果が全ての候補文字について得られない場合には、候
補文字の次に読出される特定コードによってその終了が
判定される。
しかして、1つの文字位置についての処理が終了したと
き、アドレスカウンタ3.5がそれぞれ歩進されて、次
の文字位置における文字照合が行われ、これがn文字に
ついてそれぞれ行われる。しかるのち、各文字位置の候
補文字についての照合が終了し、文字終了を示す特定コ
ード(0001)が検出されると、前記アドレス制御部
8はアドレスカウンタ3を初期状態に復帰させる。また
アドレスカウンタ5に対しては1次の単語を選択するべ
く、アドレス値を変更する。そして、この新たな単語に
ついても同様な処理を行わしめる。以下、上述した処理
が、単語辞1!:6に登録された単語中の、入力単語と
文字数を同じくする単語の全てについて行われる。
かくして以上の処理により、コン/4’レータ4は、単
語辞書6から読出された単語の各文字について一致する
候補単語をそれぞれ検出することになり、アキュムレー
タ7はコンパレータ4からの情報に従って上記各候補単
語の得点の総和を求めることになる。そして、この得点
の総和が単語辞W6から読出された単語の入力単語に対
するに3識評価値として求められることになる。従って
、このようにして各単語についてそれぞれ求められた評
価値を相互に比較し、最も高い評価値を得た単語を選択
すれば、これを入力単語の候補単語として認識すること
が可能となる。
尚、ここでは、候補レジスタ2の1つのアドレスを利用
して、各文字位置における候補文字の終了を示す特定コ
ードを格納したが、例えば第3図に示すように、各候補
文字毎に、後に続く候補文字が存在するか否かの補助デ
ータ13゜14を付加して候補レジスタ2に格納するよ
うにしてもよい。このようにすれば、候補文字の読出し
と共に、その後に続く候補文字存在の有無を判定するこ
とが可能となる上、レジスタ2の候補文字格納の為のア
ドレスを犠性にすることがなくガる。
また認識部Iにおいて入力単語の各文字について認識処
理した段階で、上記入力単語の文字数および各文字位置
における候補文字数が判るので、例えば第4図に示すよ
うにレジスタ15゜16に上記文字数および候補文字数
をそれぞれセットし、アドレスカウンタ3の値と上記文
字数および候補文字数とをコンパレータ17,1Bにて
それぞれ比較して、候補レジスタ2からの候補文字の読
出しと、単語辞誓6からの単語の読出しとを制御するよ
うにしてもよい。
このように本発明によれば、入力単語の各文字について
求められた候補文字について、その数に応じて単語辞書
との照合が行われるので処理効率が非常によい。しかも
、各文字位置の候補位置の得点から、単語を選択するの
で高い精塵で候補単語を選択することができ、その有用
性が高い。従って前述した単語認識に対する要求を効果
的に達成することができ、実用上絶大なる効果が水せら
れる。
尚、本発明は上記実施例に限定されるものではない。例
えば入力単語が音声として与えられる場合には、その音
声の音韻を文字として扱うことによって、同様な処理に
よる認識が可能である。この場合、音韻の特徴パラメー
タを以つて認識処理が行われることは云うまでもない。
その他、候補文字の読出し制御の形態も種々変形できる
。要するに本発明はその要旨を逸脱しない範囲で変形し
て実施することが可能である。
【図面の簡単な説明】
第1図は本発明の実施例装置の概略構成図、第2図およ
び第3図はそれぞれ候補文字の読出し制御について賎明
する為の図、第4図は本発明の別の実施例を示す概略構
成図である。 1・・・隠識部、2・・・候補レジスタ、3,5・・・
アドレスカウンタ、4・・・コンパレータ、6・・・単
語辞誓、7・・・アキュムレータ、8・・・アドレス制
御部、9・・・終了検出部、10・・・得点出力部、1
1・・・出力部。

Claims (1)

    【特許請求の範囲】
  1. 入力単語の各文字について認識して上記各文字に対する
    候補文字をそれぞれ求める手段と、この手段で求められ
    た候補文字を前記入力単語の文字位置に対応させて記憶
    するレジスタと、認識対象となる複数の単語を登録した
    単語辞書と、前記レジスタに記憶された各文字位置にお
    ける候補文字数および前記入力単語の文字数に従ッて前
    記レジスタからの候補文字の読出しと前記単語辞書から
    の単語の読出しとを制御する手段と、前記レジスタから
    続出される候補文字の前記文字位置における候補順位に
    対応した得点を出力する手段と、前記レジスタから続出
    された候補文字と前記単語辞書から読出された単語の対
    応した文字位置における文字とを比較する比較器と、こ
    の比較器が一致検出した各文字位置における候補文字の
    前記得点の総和を求める手段と、前記単語辞書から読出
    された単語についてそれぞれ求められた上記得点の総和
    に従って前記入力単語に対する候補単語を前記単語辞書
    に登録された単語の中から求める手段とを具備したこと
    を特徴とする単語認識装置。
JP58033569A 1983-03-01 1983-03-01 単語認識装置 Pending JPS59160275A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58033569A JPS59160275A (ja) 1983-03-01 1983-03-01 単語認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58033569A JPS59160275A (ja) 1983-03-01 1983-03-01 単語認識装置

Publications (1)

Publication Number Publication Date
JPS59160275A true JPS59160275A (ja) 1984-09-10

Family

ID=12390174

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58033569A Pending JPS59160275A (ja) 1983-03-01 1983-03-01 単語認識装置

Country Status (1)

Country Link
JP (1) JPS59160275A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63116283A (ja) * 1986-11-04 1988-05-20 Mitsubishi Electric Corp 日本文読取り装置
CN105989655A (zh) * 2015-03-18 2016-10-05 光荣株式会社 识别号检索***以及识别号检索方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63116283A (ja) * 1986-11-04 1988-05-20 Mitsubishi Electric Corp 日本文読取り装置
CN105989655A (zh) * 2015-03-18 2016-10-05 光荣株式会社 识别号检索***以及识别号检索方法
JP2016177383A (ja) * 2015-03-18 2016-10-06 グローリー株式会社 識別番号検索システム及び識別番号検索方法

Similar Documents

Publication Publication Date Title
US4400828A (en) Word recognizer
US4355302A (en) Spelled word recognizer
JPWO2004062110A1 (ja) データ圧縮方法、プログラム及び装置
JPH08255176A (ja) データベースのテーブルを比較する方法及びシステム
US5640488A (en) System and method for constructing clustered dictionary for speech and text recognition
JPS59160275A (ja) 単語認識装置
KR930000593B1 (ko) 입력문자열과 키워드와의 근사적 합치(Match)를 이용한 정보 검색 시스템 및 그 합치 방법
JP3115459B2 (ja) 文字認識辞書の構成方法及び検索方法
JP3071745B2 (ja) 文字認識結果の後処理方法
JPS59117673A (ja) 文字認識装置における後処理方式
JPH0713598A (ja) 特定タスク音声データベース生成装置
JP2923295B2 (ja) パターン同定処理方式
JP2839515B2 (ja) 文字読取システム
JP2637762B2 (ja) パターン詳細同定方式
JPS6131878B2 (ja)
JPH06274701A (ja) 単語照合装置
JPS63103393A (ja) 単語認識装置
JP3245415B2 (ja) 文字認識方法
JPS63268082A (ja) パタ−ン認識装置
JPS6252912B2 (ja)
JPH0640352B2 (ja) 文字認識装置
JP2006039383A (ja) 音声認識装置
JPH05274482A (ja) 数字列混在文書の文字認識の後処理方法
JPH0424887A (ja) 文子認識装置
JPH05314319A (ja) パターン認識後処理方式