JP2725454B2 - 文字コード知識処理方式 - Google Patents
文字コード知識処理方式Info
- Publication number
- JP2725454B2 JP2725454B2 JP2318863A JP31886390A JP2725454B2 JP 2725454 B2 JP2725454 B2 JP 2725454B2 JP 2318863 A JP2318863 A JP 2318863A JP 31886390 A JP31886390 A JP 31886390A JP 2725454 B2 JP2725454 B2 JP 2725454B2
- Authority
- JP
- Japan
- Prior art keywords
- knowledge processing
- dictionary
- character code
- result
- knowledge
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Character Discrimination (AREA)
- Document Processing Apparatus (AREA)
Description
【発明の詳細な説明】 〔産業上の利用分野〕 本発明は文字認識結果等を確認・補正する文字コード
知識処理方式に関するものである。
知識処理方式に関するものである。
各種業務の合理化等のため、対象物に記載された文字
を光学的に認識することがしばしば行われている。
を光学的に認識することがしばしば行われている。
しかし、生の文字認識結果そのものには誤りが多く含
まれ、そのままでは使用できないことから、知識処理に
よりノイズの除去や誤りの訂正を行い、認識結果の信頼
性を向上させるようにしている。
まれ、そのままでは使用できないことから、知識処理に
よりノイズの除去や誤りの訂正を行い、認識結果の信頼
性を向上させるようにしている。
また、光学的に認識された文字に限らず、キーボード
等から入力された文字に対しても同様な処理が施されて
いる。
等から入力された文字に対しても同様な処理が施されて
いる。
ところで、従来、この種の文字コード知識処理方式で
は、予め ・文字情報 ・単語情報 ・文字間の遷移情報 ・単語間の遷移情報 等を辞書として記憶領域に保持しておき、入力した文
字コード列と比較・照合し、正しいことを確認し、ある
いは、より正しいと推定される文字コード列に補正する
ようにしていた。
は、予め ・文字情報 ・単語情報 ・文字間の遷移情報 ・単語間の遷移情報 等を辞書として記憶領域に保持しておき、入力した文
字コード列と比較・照合し、正しいことを確認し、ある
いは、より正しいと推定される文字コード列に補正する
ようにしていた。
上述したように、従来の文字コード知識処理方式にあ
っては、必要な情報を全て記憶領域上に保持しなければ
ならなかったため、記憶容量が不足したり、処理時間が
長くなる等の欠点があった。
っては、必要な情報を全て記憶領域上に保持しなければ
ならなかったため、記憶容量が不足したり、処理時間が
長くなる等の欠点があった。
例えば、住所認識専用の文字コード知識処理を考える
と、地域名だけ必要な単語数は約40万語となり、このた
めに必要な記憶容量や処理時間は膨大なものとなる。そ
して、この他に、一般に住所に付記されるアパート・マ
ンション名等を予め辞書として保持し、照合を行うとい
うことになると、記憶容量や処理時間からいって実現困
難となる。
と、地域名だけ必要な単語数は約40万語となり、このた
めに必要な記憶容量や処理時間は膨大なものとなる。そ
して、この他に、一般に住所に付記されるアパート・マ
ンション名等を予め辞書として保持し、照合を行うとい
うことになると、記憶容量や処理時間からいって実現困
難となる。
本発明は上記の点に鑑み提案されたものであり、その
目的とするところは、コンパクトな辞書で高速に処理を
実行することのできる文字コード知識処理方式を提供す
ることにある。
目的とするところは、コンパクトな辞書で高速に処理を
実行することのできる文字コード知識処理方式を提供す
ることにある。
本発明は上記の目的を達成するため、入力文字コード
列を知識処理用の常駐辞書に基づいて知識処理する第1
知識処理部と、 その結果に基づいて知識処理用の逐次辞書を作成する
辞書作成部と、 常駐辞書および逐次辞書に基づいて第1知識処理部の
結果を更に知識処理する第2知識処理部とを備えるよう
にしている。
列を知識処理用の常駐辞書に基づいて知識処理する第1
知識処理部と、 その結果に基づいて知識処理用の逐次辞書を作成する
辞書作成部と、 常駐辞書および逐次辞書に基づいて第1知識処理部の
結果を更に知識処理する第2知識処理部とを備えるよう
にしている。
本発明の文字コード知識処理方式にあっては、入力文
字コード列を第1知識処理部が常駐辞書に基づいて知識
処理し、その結果に基づいて辞書作成部が逐次辞書を作
成し、常駐辞書および新たに作成された逐次辞書に基づ
いて第2知識処理部が第1知識処理部の結果を更に知識
処理する。
字コード列を第1知識処理部が常駐辞書に基づいて知識
処理し、その結果に基づいて辞書作成部が逐次辞書を作
成し、常駐辞書および新たに作成された逐次辞書に基づ
いて第2知識処理部が第1知識処理部の結果を更に知識
処理する。
以下、本発明の実施例につき図面を参照して説明す
る。
る。
第1図は本発明の文字コード知識処理方式の一実施例
を示す構成図である。
を示す構成図である。
第1図において、本実施例は、入力文字コード格納部
1と第1知識処理部2と辞書作成部3と第2知識処理部
4と知識処理結果格納部5と常駐辞書6と逐次辞書7と
から構成され、実際には中央処理装置(CPU),メモリ
装置,ハードディスク等の記憶媒体,各種プログラム等
の回路装置から構成される。なお、各部の機能等は、重
複を避けるため、以下の動作を通して説明することとす
る。
1と第1知識処理部2と辞書作成部3と第2知識処理部
4と知識処理結果格納部5と常駐辞書6と逐次辞書7と
から構成され、実際には中央処理装置(CPU),メモリ
装置,ハードディスク等の記憶媒体,各種プログラム等
の回路装置から構成される。なお、各部の機能等は、重
複を避けるため、以下の動作を通して説明することとす
る。
文字を光学的に認識した結果である文字コード列やキ
ーボード等から入力された文字コード列は、予め入力文
字コード格納部1に格納されているものとする。
ーボード等から入力された文字コード列は、予め入力文
字コード格納部1に格納されているものとする。
第2図は住所を認識した結果の入力文字コード列の例
を示したものであり、確率の高い順に上から10個の候補
が並んでおり、横一列がひとまとまりの文字列である。
を示したものであり、確率の高い順に上から10個の候補
が並んでおり、横一列がひとまとまりの文字列である。
第1図において、第1知識処理部2は入力文字コード
格納部1から入力文字コード列を取り出し、常駐辞書6
の情報を用い、単語の照合等を含む知識処理を施す。な
お、知識処理の技法については周知であるため、その説
明は省略する。また、常駐辞書6は、例えば住所知識処
理に関して、地域名が単語情報として登録されている。
格納部1から入力文字コード列を取り出し、常駐辞書6
の情報を用い、単語の照合等を含む知識処理を施す。な
お、知識処理の技法については周知であるため、その説
明は省略する。また、常駐辞書6は、例えば住所知識処
理に関して、地域名が単語情報として登録されている。
第3図は第1知識処理部2の処理結果の例を示したも
のであり、上段が参考のために示した正しい住所、中段
が第1知識処理部2の処理結果であり、下線部が知識処
理によって確定した部分、下線の引かれていない部分が
入力文字コード列の第1候補をそのまま結果として出力
した部分、下段が入力文字コード列(第2図と同じ)で
ある。すなわち、常駐辞書6の地域名の単語情報によ
り、「小金井市」,「貫井北町」等を正しいものと認識
し、確定する。
のであり、上段が参考のために示した正しい住所、中段
が第1知識処理部2の処理結果であり、下線部が知識処
理によって確定した部分、下線の引かれていない部分が
入力文字コード列の第1候補をそのまま結果として出力
した部分、下段が入力文字コード列(第2図と同じ)で
ある。すなわち、常駐辞書6の地域名の単語情報によ
り、「小金井市」,「貫井北町」等を正しいものと認識
し、確定する。
次いで、第1図において、辞書作成部3は第1知識処
理部2の結果に応じ、同時に出現する可能性の高い単語
に関する情報等を含む逐次辞書7を入力文字コード列毎
に作成する。例えば、第3図の例では、前半の処理結果
に含まれる地域名「小金井市」,「貫井北町」を抽出す
ると共に、更に、「小金井市」の属する「東京都」を類
推し、これらを単語情報として逐次辞書7に登録する。
これは、アパート・マンション等の名称には地域名等が
多く用いられているという事実に基づく。なお、逐次辞
書7には、これらの単語がアパート・マンション等の名
称、略称等に連なるという遷移情報も含める。
理部2の結果に応じ、同時に出現する可能性の高い単語
に関する情報等を含む逐次辞書7を入力文字コード列毎
に作成する。例えば、第3図の例では、前半の処理結果
に含まれる地域名「小金井市」,「貫井北町」を抽出す
ると共に、更に、「小金井市」の属する「東京都」を類
推し、これらを単語情報として逐次辞書7に登録する。
これは、アパート・マンション等の名称には地域名等が
多く用いられているという事実に基づく。なお、逐次辞
書7には、これらの単語がアパート・マンション等の名
称、略称等に連なるという遷移情報も含める。
次いで、第2知識処理部4は常駐辞書6と新たに作成
された逐次辞書7とを用いて、第1知識処理部2の結果
に対して更に知識処理を施し、結果を知識処理結果格納
部5に格納する。
された逐次辞書7とを用いて、第1知識処理部2の結果
に対して更に知識処理を施し、結果を知識処理結果格納
部5に格納する。
第4図は第2知識処理部4の処理結果の例を示したも
のであり、上段が参考のために示した正しい住所、中段
が第2知識処理部4の処理結果であり、下線部が知識処
理によって確定した部分、下段が入力文字コード列(第
2図と同じ)である。すなわち、常駐辞書6に格納され
た「アパート」,「マンション」,「パレ」等の一般的
な単語情報と逐次辞書7に格納された地域名等の情報に
より「パレ」,「小金井」,「105号」を正しいものと
認識し、確定する。なお、「武蔵」については、それ以
前の結果から類推して逐次辞書7に情報を作成できなか
ったため、処理せずにそのまま出力している。
のであり、上段が参考のために示した正しい住所、中段
が第2知識処理部4の処理結果であり、下線部が知識処
理によって確定した部分、下段が入力文字コード列(第
2図と同じ)である。すなわち、常駐辞書6に格納され
た「アパート」,「マンション」,「パレ」等の一般的
な単語情報と逐次辞書7に格納された地域名等の情報に
より「パレ」,「小金井」,「105号」を正しいものと
認識し、確定する。なお、「武蔵」については、それ以
前の結果から類推して逐次辞書7に情報を作成できなか
ったため、処理せずにそのまま出力している。
そして、知識処理結果格納部5に格納された結果は、
認識の目的に沿って適宜に利用される。
認識の目的に沿って適宜に利用される。
以上説明したように、本発明の文字コード知識処理方
式にあっては、常駐辞書として基本的な情報を割り当て
て記憶領域上に保持し、逐次辞書としては常駐辞書によ
る知識処理結果から類推して必要な情報を作成して記憶
領域上に追加保持すればよいことから、全体の記憶容量
が少なくて済むと共に、検索対象が少なくなることから
照合に要する処理時間が短くなって処理が高速に行える
という効果がある。
式にあっては、常駐辞書として基本的な情報を割り当て
て記憶領域上に保持し、逐次辞書としては常駐辞書によ
る知識処理結果から類推して必要な情報を作成して記憶
領域上に追加保持すればよいことから、全体の記憶容量
が少なくて済むと共に、検索対象が少なくなることから
照合に要する処理時間が短くなって処理が高速に行える
という効果がある。
【図面の簡単な説明】 第1図は本発明の文字コード知識処理方式の一実施例を
示す構成図、 第2図は入力文字コード列の例を示す図、 第3図は第1知識処理部の結果の例を示す図および、 第4図は第2知識処理部の結果の例を示す図である。 図において、 1……入力文字コード格納部 2……第1知識処理部 3……辞書作成部 4……第2知識処理部 5……知識処理結果格納部 6……常駐辞書 7……逐次辞書
示す構成図、 第2図は入力文字コード列の例を示す図、 第3図は第1知識処理部の結果の例を示す図および、 第4図は第2知識処理部の結果の例を示す図である。 図において、 1……入力文字コード格納部 2……第1知識処理部 3……辞書作成部 4……第2知識処理部 5……知識処理結果格納部 6……常駐辞書 7……逐次辞書
Claims (3)
- 【請求項1】入力文字コード列を知識処理用の常駐辞書
に基づいて知識処理する第1知識処理部と、 その結果に基づいて知識処理用の逐次辞書を作成する辞
書作成部と、 常駐辞書および逐次辞書に基づいて第1知識処理部の結
果を更に知識処理する第2知識処理部とを備えたことを
特徴とする文字コード知識処理方式。 - 【請求項2】辞書作成部は、第1知識処理部の結果に応
じ、同時に出現する可能性の高い単語に関する情報等を
含む逐次辞書を作成することを特徴とした請求項1記載
の文字コード知識処理方式。 - 【請求項3】文字認識結果の住所知識処理に適用したこ
とを特徴とする請求項1または2記載の文字コード知識
処理方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2318863A JP2725454B2 (ja) | 1990-11-22 | 1990-11-22 | 文字コード知識処理方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2318863A JP2725454B2 (ja) | 1990-11-22 | 1990-11-22 | 文字コード知識処理方式 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH04188383A JPH04188383A (ja) | 1992-07-06 |
JP2725454B2 true JP2725454B2 (ja) | 1998-03-11 |
Family
ID=18103802
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2318863A Expired - Lifetime JP2725454B2 (ja) | 1990-11-22 | 1990-11-22 | 文字コード知識処理方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2725454B2 (ja) |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2856409B2 (ja) * | 1989-02-27 | 1999-02-10 | 株式会社東芝 | 文字認識装置および方法 |
-
1990
- 1990-11-22 JP JP2318863A patent/JP2725454B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH04188383A (ja) | 1992-07-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113380223B (zh) | 多音字消歧方法、装置、***及存储介质 | |
JP2725454B2 (ja) | 文字コード知識処理方式 | |
JP2000250931A (ja) | 位置情報の自動抽出装置および自動抽出方法と記録媒体 | |
CN112579713A (zh) | 地址识别方法、装置、计算设备及计算机存储介质 | |
JP3258079B2 (ja) | 複合語辞書登録装置 | |
JP2839515B2 (ja) | 文字読取システム | |
JP3108121B2 (ja) | 音声認識装置の辞書制御方式 | |
CN109582296B (zh) | 一种基于栈增强lstm的程序表示方法 | |
JP2942375B2 (ja) | 文字読取装置 | |
JP2619499B2 (ja) | べた書き住所の文字認識後処理方式 | |
JP2827066B2 (ja) | 数字列混在文書の文字認識の後処理方法 | |
JP2795003B2 (ja) | 文字認識処理装置 | |
JPH07271920A (ja) | 文字認識装置 | |
JP2874199B2 (ja) | 単語辞書照合装置 | |
JPS63103393A (ja) | 単語認識装置 | |
JP2835065B2 (ja) | 文字列検索方法 | |
JPS63138478A (ja) | 文字認識方式 | |
JPS63138480A (ja) | 文字認識方式 | |
JP2002288194A (ja) | 戸籍情報処理装置及び方法、プログラム | |
JPH05205108A (ja) | 文字認識結果の後処理方法 | |
JPH05135212A (ja) | 住所単語照合方法 | |
JPS6344700A (ja) | 単語検出方式 | |
JPH03189891A (ja) | 辞書参照による知識処理を行う文字列読み取り装置 | |
JPH1153352A (ja) | 単語登録方法及び装置及び単語登録プログラムを格納した記憶媒体 | |
JP2000172695A (ja) | データ格納方法、データベース、データベース検索方法、データベース検索装置、及び記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071205 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081205 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091205 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091205 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101205 Year of fee payment: 13 |
|
EXPY | Cancellation because of completion of term |