JPS6316795B2 - - Google Patents
Info
- Publication number
- JPS6316795B2 JPS6316795B2 JP55000590A JP59080A JPS6316795B2 JP S6316795 B2 JPS6316795 B2 JP S6316795B2 JP 55000590 A JP55000590 A JP 55000590A JP 59080 A JP59080 A JP 59080A JP S6316795 B2 JPS6316795 B2 JP S6316795B2
- Authority
- JP
- Japan
- Prior art keywords
- kanji
- discrimination
- character
- katakana
- characters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 238000012850 discrimination method Methods 0.000 claims description 16
- 238000000034 method Methods 0.000 claims description 16
- 238000012015 optical character recognition Methods 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 8
- 235000016496 Panda oleosa Nutrition 0.000 description 6
- 240000000220 Panda oleosa Species 0.000 description 6
- 238000000605 extraction Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/242—Division of the character sequences into groups prior to recognition; Selection of dictionaries
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
Description
【発明の詳細な説明】
本発明は、ふりがな(例えば、カタカナ)判別
を用いる漢字判別方式に関し、特に光学文字読取
り装置の漢字判別方式に関する。
を用いる漢字判別方式に関し、特に光学文字読取
り装置の漢字判別方式に関する。
従来、光学文字読取り装置の文字認識方法には
各種あり、そのどの方法をとつてみても未知パタ
ーンからある文字を判別して結果を出す方式であ
つた。
各種あり、そのどの方法をとつてみても未知パタ
ーンからある文字を判別して結果を出す方式であ
つた。
すなわち、まず帳票上に書かれている文字は光
電変換によつてメモリ部にとり込まれ、第1図に
示すように、とり込まれたパターン1(通常、未
知パターンと呼ばれている)を、何らかの認識方
法2により判別を行い、文字を判定3する方法で
あつた。
電変換によつてメモリ部にとり込まれ、第1図に
示すように、とり込まれたパターン1(通常、未
知パターンと呼ばれている)を、何らかの認識方
法2により判別を行い、文字を判定3する方法で
あつた。
手書き文字の認識の場合、第2図に示すよう
に、光電変換後、入力パターンは生成された手書
き文字から字体等の手書き変動成分を除き文字を
安定に認識するために正規化4が行われ、次に特
徴抽出回路により文字パターンの形状からその特
徴を抽出して(5)、その結果を識別回路に入れて認
識する(6)。識別6とは、特徴抽出5で得られた特
徴の組を基に未知入力文字を判定する操作をい
う。
に、光電変換後、入力パターンは生成された手書
き文字から字体等の手書き変動成分を除き文字を
安定に認識するために正規化4が行われ、次に特
徴抽出回路により文字パターンの形状からその特
徴を抽出して(5)、その結果を識別回路に入れて認
識する(6)。識別6とは、特徴抽出5で得られた特
徴の組を基に未知入力文字を判定する操作をい
う。
また、文字の特徴抽出には、印刷文字をはじめ
常用手書き文字を対象に広く用いられている方法
として、パターン整合法がある。これは、標準パ
ターンと未知入力パターンとの整合の度合いを調
べることにより、文字を認識する方法である。そ
の他に、ストローク分析法、文字輪郭分析法、特
徴記号系列法、幾何学的特徴抽出法、A−b−S
(Analysis−by−Synthesis)法がある。
常用手書き文字を対象に広く用いられている方法
として、パターン整合法がある。これは、標準パ
ターンと未知入力パターンとの整合の度合いを調
べることにより、文字を認識する方法である。そ
の他に、ストローク分析法、文字輪郭分析法、特
徴記号系列法、幾何学的特徴抽出法、A−b−S
(Analysis−by−Synthesis)法がある。
以上述べた文字認識の方法は、数字、英字、カ
ナ、記号程度の少ない文字種では、誤つて読み取
られる場合は少ない。
ナ、記号程度の少ない文字種では、誤つて読み取
られる場合は少ない。
しかし、漢字の判定ともなると約2000種の文字
を判別する必要がでてくる。したがつて、従来の
判別のやり方では正しく漢字の認識を行うことは
不可能であるという問題点がある。
を判別する必要がでてくる。したがつて、従来の
判別のやり方では正しく漢字の認識を行うことは
不可能であるという問題点がある。
本発明の目的は、このような従来の問題点を除
去するため、光学文字読取り装置において、誤読
を少なくして漢字を正しく認識するためカタカナ
判別を用いる漢字判別方式を提供することにあ
る。
去するため、光学文字読取り装置において、誤読
を少なくして漢字を正しく認識するためカタカナ
判別を用いる漢字判別方式を提供することにあ
る。
本発明のカタカナ判別を用いる漢字判別方式
は、従来の判別方法にカナの判別を追加して組合
せ、漢字に対応してカナ文字を記入し、カナ文字
から漢字をある程度しぼり、漢字の判別結果と合
わせて判定することを特徴としている。
は、従来の判別方法にカナの判別を追加して組合
せ、漢字に対応してカナ文字を記入し、カナ文字
から漢字をある程度しぼり、漢字の判別結果と合
わせて判定することを特徴としている。
紙面に印刷されている文字パターンを認識する
には、その光学像を観測して認識装置で処理する
ための電気信号に変える必要があり、また観測さ
れる文字行の行位置や文字位置を決める必要があ
る。
には、その光学像を観測して認識装置で処理する
ための電気信号に変える必要があり、また観測さ
れる文字行の行位置や文字位置を決める必要があ
る。
行位置や文字位置は、帳票の基準端からのおお
よその位置が指定されているが、印刷の位置ず
れ、用紙の裁断によつて変動するために、文字の
観測系で帳票ごとに位置決めをし、走査しなけれ
ばならない。
よその位置が指定されているが、印刷の位置ず
れ、用紙の裁断によつて変動するために、文字の
観測系で帳票ごとに位置決めをし、走査しなけれ
ばならない。
以下、図面により、本発明の実施例を説明す
る。
る。
第3図は、本発明のカタカナ判別を用いる漢字
判別方式を説明するための帳票の一例である。帳
票には住所と氏名が書かれている。
判別方式を説明するための帳票の一例である。帳
票には住所と氏名が書かれている。
第3図においては、帳票7上に文字枠8があ
り、この文字枠8の中に漢字9とそれに対応した
カタカナ10が記入されている。帳票7の右端の
マーク11は読み取るべき文字の行位置を示して
いる。
り、この文字枠8の中に漢字9とそれに対応した
カタカナ10が記入されている。帳票7の右端の
マーク11は読み取るべき文字の行位置を示して
いる。
第4図は、本発明のカタカナ判別を用いる漢字
判別方式の構成図である。
判別方式の構成図である。
第4図に示すように、漢字一文字に対応したカ
タカナ部分の未知パターン12を帳票上より光電
変換により取り出し、第1図、第2図に示される
従来と同じ方法でカタカナ判別13を行う。判別
されたカタカナによつて推定される漢字14をメ
モリ部より取り出す。漢字A,B,………Xは推
定される漢字である。
タカナ部分の未知パターン12を帳票上より光電
変換により取り出し、第1図、第2図に示される
従来と同じ方法でカタカナ判別13を行う。判別
されたカタカナによつて推定される漢字14をメ
モリ部より取り出す。漢字A,B,………Xは推
定される漢字である。
一方、漢字一文字の未知パターン15を帳票上
より取り出す。この未知パターン15を第1図、
第2図に示すような従来と同じ考え方の判別方法
によつて漢字の判別16を行い判定結果を出す。
しかし漢字の場合約2000種もあり類似の判定漢字
17がいくつも出る。漢字A′,………,X′はい
くつかの類似する漢字である。
より取り出す。この未知パターン15を第1図、
第2図に示すような従来と同じ考え方の判別方法
によつて漢字の判別16を行い判定結果を出す。
しかし漢字の場合約2000種もあり類似の判定漢字
17がいくつも出る。漢字A′,………,X′はい
くつかの類似する漢字である。
この漢字の判定17と前記のカタカナによる判
定14とをいつしよにして類似度法等による判別
18を行い、最終判定19を行う。
定14とをいつしよにして類似度法等による判別
18を行い、最終判定19を行う。
第4図のカタカナ判別を有した漢字判別方式
を、具体的に説明すると第5図、第6図、第7図
に示されるようになる。
を、具体的に説明すると第5図、第6図、第7図
に示されるようになる。
第4図におけるカタカナ判別13、漢字判別1
6は第1図、第2図において説明した従来の方法
による。
6は第1図、第2図において説明した従来の方法
による。
第5図は、第4図のカタカナ判別13の結果か
ら漢字14を推定する方法である。
ら漢字14を推定する方法である。
すなわち、カナ20に対応して漢字21をメモ
リ内にたくわえておき、推定される漢字14をメ
モリより取り出す。
リ内にたくわえておき、推定される漢字14をメ
モリより取り出す。
第6図は、第4図における判別18の具体的な
方法である。
方法である。
まず、カタカナから推定される漢字14のうち
の一文字aをレジスタ22に持つてくる。次に漢
字判別16から類似される漢字17のうちの一文
字bを別のレジスタ23に持つてくる。この2つ
の文字a,bについて、定点サンプリング法等に
よりその類似度計算24を行う。これを上記の2
つの漢字の組み合わせすべてに行う。
の一文字aをレジスタ22に持つてくる。次に漢
字判別16から類似される漢字17のうちの一文
字bを別のレジスタ23に持つてくる。この2つ
の文字a,bについて、定点サンプリング法等に
よりその類似度計算24を行う。これを上記の2
つの漢字の組み合わせすべてに行う。
この結果を第7図に示すようなマトリツクス上
にうめていき、その類似度の数値から最終的に漢
字を判定25する。
にうめていき、その類似度の数値から最終的に漢
字を判定25する。
以上説明したように、本発明によればOCR等
の文字読取りシステムにおいて、漢字の判別のほ
かにふりがな、例えばカタカナ読取りを併用した
ので、誤読の少ない漢字判別が可能となる。
の文字読取りシステムにおいて、漢字の判別のほ
かにふりがな、例えばカタカナ読取りを併用した
ので、誤読の少ない漢字判別が可能となる。
すなわち、本発明のふりがな判別、例えばカタ
カナ判別を用いる漢字判別方式は、カナの誤読が
少ないので、それから推定される漢字も誤読が少
ない。加えて、漢字本来の判別の結果と重ね合わ
せるため、従来の考え方ではできなかつた正確な
読取りが可能となつた。
カナ判別を用いる漢字判別方式は、カナの誤読が
少ないので、それから推定される漢字も誤読が少
ない。加えて、漢字本来の判別の結果と重ね合わ
せるため、従来の考え方ではできなかつた正確な
読取りが可能となつた。
第1図は従来の判別方式のブロツク図、第2図
は従来の文字認識の説明図、第3図は本発明の漢
字判別方式に使われる帳票の一例を示す図第4図
は本発明の実施例を示すカタカナ判別を有した漢
字判別方式のシステム構成図、第5図は第4図の
カタカナ判別に対応した漢字の具体例を示す図、
第6図は第4図の最終判別方法の実際例を示す
図、第7図は類似度計算法による漢字判定法の一
例を示す図である。 1……未知パターン、2……認識、3……判
定、4……正規化、5……特徴抽出、6……識
別、7……帳票、8……文字枠、9……漢字、1
0……カタカナ、11……読取りマーク、12…
…カタカナ部分の未知パターン、13……カタカ
ナ判別、14,17……漢字、15……漢字部分
の未知パターン、16……漢字判別、、18……
判別、19,………25……判定、20……カタ
カナ、21……漢字、22……カタカナからの漢
字、23……漢字判別からの漢字、24……類似
度計算。
は従来の文字認識の説明図、第3図は本発明の漢
字判別方式に使われる帳票の一例を示す図第4図
は本発明の実施例を示すカタカナ判別を有した漢
字判別方式のシステム構成図、第5図は第4図の
カタカナ判別に対応した漢字の具体例を示す図、
第6図は第4図の最終判別方法の実際例を示す
図、第7図は類似度計算法による漢字判定法の一
例を示す図である。 1……未知パターン、2……認識、3……判
定、4……正規化、5……特徴抽出、6……識
別、7……帳票、8……文字枠、9……漢字、1
0……カタカナ、11……読取りマーク、12…
…カタカナ部分の未知パターン、13……カタカ
ナ判別、14,17……漢字、15……漢字部分
の未知パターン、16……漢字判別、、18……
判別、19,………25……判定、20……カタ
カナ、21……漢字、22……カタカナからの漢
字、23……漢字判別からの漢字、24……類似
度計算。
Claims (1)
- 1 一つの漢字を記入可能な枠と、該枠に対応し
て複数の文字から成るふりがなを記入可能な一つ
の枠が設けられた帳票に記入された漢字を認識す
る光学文字読取装置の漢字判別方式において、該
帳票に記入された一つの枠に記入された漢字と該
漢字対応の一つの枠に記入されたふりがなを認識
する認識手段と、該漢字及び該漢字対応のふりが
なの認識結果を比較して当該漢字の判別候補文字
を決定する手段とを備えることを特徴とするふり
がな判別を用いる漢字判別方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59080A JPS5699573A (en) | 1980-01-09 | 1980-01-09 | Kanji (chinese character) distinction system using katakana (square form of japanese syllabary) |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59080A JPS5699573A (en) | 1980-01-09 | 1980-01-09 | Kanji (chinese character) distinction system using katakana (square form of japanese syllabary) |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS5699573A JPS5699573A (en) | 1981-08-10 |
JPS6316795B2 true JPS6316795B2 (ja) | 1988-04-11 |
Family
ID=11477937
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP59080A Granted JPS5699573A (en) | 1980-01-09 | 1980-01-09 | Kanji (chinese character) distinction system using katakana (square form of japanese syllabary) |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS5699573A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0255761A (ja) * | 1988-08-22 | 1990-02-26 | Shikoku Chem Corp | ポリアミド樹脂組成物 |
JPH0662490A (ja) * | 1992-08-05 | 1994-03-04 | Mitsubishi Electric Corp | 多チャンネル音声再生装置 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58222379A (ja) * | 1982-06-18 | 1983-12-24 | Fujitsu Ltd | 文字認識修正処理方式 |
JPS592191A (ja) * | 1982-06-29 | 1984-01-07 | Fujitsu Ltd | 手書き日本語文の認識処理方式 |
JPS6334680A (ja) * | 1986-07-29 | 1988-02-15 | Toshiba Corp | 文字読取装置 |
JPH0546806A (ja) * | 1991-08-20 | 1993-02-26 | Oki Electric Ind Co Ltd | 文字認識方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5347733A (en) * | 1976-10-14 | 1978-04-28 | Fujitsu Ltd | Recognizing device for hand-written kana and chinese characters |
-
1980
- 1980-01-09 JP JP59080A patent/JPS5699573A/ja active Granted
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5347733A (en) * | 1976-10-14 | 1978-04-28 | Fujitsu Ltd | Recognizing device for hand-written kana and chinese characters |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0255761A (ja) * | 1988-08-22 | 1990-02-26 | Shikoku Chem Corp | ポリアミド樹脂組成物 |
JPH0662490A (ja) * | 1992-08-05 | 1994-03-04 | Mitsubishi Electric Corp | 多チャンネル音声再生装置 |
Also Published As
Publication number | Publication date |
---|---|
JPS5699573A (en) | 1981-08-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2553608B2 (ja) | 光学文字読取装置 | |
US6886136B1 (en) | Automatic template and field definition in form processing | |
US5040226A (en) | Courtesy amount read and transaction balancing system | |
EP0862132A2 (en) | Robust identification code recognition system | |
JP2713622B2 (ja) | 表形式文書読取装置 | |
JPS6316795B2 (ja) | ||
EP3477547B1 (en) | Optical character recognition systems and methods | |
JPH07182448A (ja) | 文字認識方法 | |
JPH05108806A (ja) | 画像特徴抽出方法及びその装置 | |
JP2877380B2 (ja) | 光学的文字読取装置 | |
JP2925270B2 (ja) | 文字読取装置 | |
JPS6074094A (ja) | 文字認識装置 | |
JPH0426153B2 (ja) | ||
JP3151866B2 (ja) | 英文字認識方法 | |
JP2924356B2 (ja) | 光学文字読取装置 | |
JP2832035B2 (ja) | 文字認識装置 | |
JP2600703B2 (ja) | 部分細線照合装置 | |
JPS62295192A (ja) | 光学文字画像読取装置 | |
JPH0319589B2 (ja) | ||
JPH0877293A (ja) | 文字認識装置および文字認識用辞書作成方法 | |
EP0114996A2 (en) | Character recognition utilizing transition measurements | |
JP2727755B2 (ja) | 文字列認識方法及びその装置 | |
JPH0628521A (ja) | 光学的文字読取装置 | |
JPH10124610A (ja) | 光学式文字読取装置 | |
JPS5933579A (ja) | 文字認識方式 |