JPS6316795B2 - - Google Patents

Info

Publication number
JPS6316795B2
JPS6316795B2 JP55000590A JP59080A JPS6316795B2 JP S6316795 B2 JPS6316795 B2 JP S6316795B2 JP 55000590 A JP55000590 A JP 55000590A JP 59080 A JP59080 A JP 59080A JP S6316795 B2 JPS6316795 B2 JP S6316795B2
Authority
JP
Japan
Prior art keywords
kanji
discrimination
character
katakana
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP55000590A
Other languages
English (en)
Other versions
JPS5699573A (en
Inventor
Yasutomi Ejiri
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP59080A priority Critical patent/JPS5699573A/ja
Publication of JPS5699573A publication Critical patent/JPS5699573A/ja
Publication of JPS6316795B2 publication Critical patent/JPS6316795B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 本発明は、ふりがな(例えば、カタカナ)判別
を用いる漢字判別方式に関し、特に光学文字読取
り装置の漢字判別方式に関する。
従来、光学文字読取り装置の文字認識方法には
各種あり、そのどの方法をとつてみても未知パタ
ーンからある文字を判別して結果を出す方式であ
つた。
すなわち、まず帳票上に書かれている文字は光
電変換によつてメモリ部にとり込まれ、第1図に
示すように、とり込まれたパターン1(通常、未
知パターンと呼ばれている)を、何らかの認識方
法2により判別を行い、文字を判定3する方法で
あつた。
手書き文字の認識の場合、第2図に示すよう
に、光電変換後、入力パターンは生成された手書
き文字から字体等の手書き変動成分を除き文字を
安定に認識するために正規化4が行われ、次に特
徴抽出回路により文字パターンの形状からその特
徴を抽出して(5)、その結果を識別回路に入れて認
識する(6)。識別6とは、特徴抽出5で得られた特
徴の組を基に未知入力文字を判定する操作をい
う。
また、文字の特徴抽出には、印刷文字をはじめ
常用手書き文字を対象に広く用いられている方法
として、パターン整合法がある。これは、標準パ
ターンと未知入力パターンとの整合の度合いを調
べることにより、文字を認識する方法である。そ
の他に、ストローク分析法、文字輪郭分析法、特
徴記号系列法、幾何学的特徴抽出法、A−b−S
(Analysis−by−Synthesis)法がある。
以上述べた文字認識の方法は、数字、英字、カ
ナ、記号程度の少ない文字種では、誤つて読み取
られる場合は少ない。
しかし、漢字の判定ともなると約2000種の文字
を判別する必要がでてくる。したがつて、従来の
判別のやり方では正しく漢字の認識を行うことは
不可能であるという問題点がある。
本発明の目的は、このような従来の問題点を除
去するため、光学文字読取り装置において、誤読
を少なくして漢字を正しく認識するためカタカナ
判別を用いる漢字判別方式を提供することにあ
る。
本発明のカタカナ判別を用いる漢字判別方式
は、従来の判別方法にカナの判別を追加して組合
せ、漢字に対応してカナ文字を記入し、カナ文字
から漢字をある程度しぼり、漢字の判別結果と合
わせて判定することを特徴としている。
紙面に印刷されている文字パターンを認識する
には、その光学像を観測して認識装置で処理する
ための電気信号に変える必要があり、また観測さ
れる文字行の行位置や文字位置を決める必要があ
る。
行位置や文字位置は、帳票の基準端からのおお
よその位置が指定されているが、印刷の位置ず
れ、用紙の裁断によつて変動するために、文字の
観測系で帳票ごとに位置決めをし、走査しなけれ
ばならない。
以下、図面により、本発明の実施例を説明す
る。
第3図は、本発明のカタカナ判別を用いる漢字
判別方式を説明するための帳票の一例である。帳
票には住所と氏名が書かれている。
第3図においては、帳票7上に文字枠8があ
り、この文字枠8の中に漢字9とそれに対応した
カタカナ10が記入されている。帳票7の右端の
マーク11は読み取るべき文字の行位置を示して
いる。
第4図は、本発明のカタカナ判別を用いる漢字
判別方式の構成図である。
第4図に示すように、漢字一文字に対応したカ
タカナ部分の未知パターン12を帳票上より光電
変換により取り出し、第1図、第2図に示される
従来と同じ方法でカタカナ判別13を行う。判別
されたカタカナによつて推定される漢字14をメ
モリ部より取り出す。漢字A,B,………Xは推
定される漢字である。
一方、漢字一文字の未知パターン15を帳票上
より取り出す。この未知パターン15を第1図、
第2図に示すような従来と同じ考え方の判別方法
によつて漢字の判別16を行い判定結果を出す。
しかし漢字の場合約2000種もあり類似の判定漢字
17がいくつも出る。漢字A′,………,X′はい
くつかの類似する漢字である。
この漢字の判定17と前記のカタカナによる判
定14とをいつしよにして類似度法等による判別
18を行い、最終判定19を行う。
第4図のカタカナ判別を有した漢字判別方式
を、具体的に説明すると第5図、第6図、第7図
に示されるようになる。
第4図におけるカタカナ判別13、漢字判別1
6は第1図、第2図において説明した従来の方法
による。
第5図は、第4図のカタカナ判別13の結果か
ら漢字14を推定する方法である。
すなわち、カナ20に対応して漢字21をメモ
リ内にたくわえておき、推定される漢字14をメ
モリより取り出す。
第6図は、第4図における判別18の具体的な
方法である。
まず、カタカナから推定される漢字14のうち
の一文字aをレジスタ22に持つてくる。次に漢
字判別16から類似される漢字17のうちの一文
字bを別のレジスタ23に持つてくる。この2つ
の文字a,bについて、定点サンプリング法等に
よりその類似度計算24を行う。これを上記の2
つの漢字の組み合わせすべてに行う。
この結果を第7図に示すようなマトリツクス上
にうめていき、その類似度の数値から最終的に漢
字を判定25する。
以上説明したように、本発明によればOCR等
の文字読取りシステムにおいて、漢字の判別のほ
かにふりがな、例えばカタカナ読取りを併用した
ので、誤読の少ない漢字判別が可能となる。
すなわち、本発明のふりがな判別、例えばカタ
カナ判別を用いる漢字判別方式は、カナの誤読が
少ないので、それから推定される漢字も誤読が少
ない。加えて、漢字本来の判別の結果と重ね合わ
せるため、従来の考え方ではできなかつた正確な
読取りが可能となつた。
【図面の簡単な説明】
第1図は従来の判別方式のブロツク図、第2図
は従来の文字認識の説明図、第3図は本発明の漢
字判別方式に使われる帳票の一例を示す図第4図
は本発明の実施例を示すカタカナ判別を有した漢
字判別方式のシステム構成図、第5図は第4図の
カタカナ判別に対応した漢字の具体例を示す図、
第6図は第4図の最終判別方法の実際例を示す
図、第7図は類似度計算法による漢字判定法の一
例を示す図である。 1……未知パターン、2……認識、3……判
定、4……正規化、5……特徴抽出、6……識
別、7……帳票、8……文字枠、9……漢字、1
0……カタカナ、11……読取りマーク、12…
…カタカナ部分の未知パターン、13……カタカ
ナ判別、14,17……漢字、15……漢字部分
の未知パターン、16……漢字判別、、18……
判別、19,………25……判定、20……カタ
カナ、21……漢字、22……カタカナからの漢
字、23……漢字判別からの漢字、24……類似
度計算。

Claims (1)

    【特許請求の範囲】
  1. 1 一つの漢字を記入可能な枠と、該枠に対応し
    て複数の文字から成るふりがなを記入可能な一つ
    の枠が設けられた帳票に記入された漢字を認識す
    る光学文字読取装置の漢字判別方式において、該
    帳票に記入された一つの枠に記入された漢字と該
    漢字対応の一つの枠に記入されたふりがなを認識
    する認識手段と、該漢字及び該漢字対応のふりが
    なの認識結果を比較して当該漢字の判別候補文字
    を決定する手段とを備えることを特徴とするふり
    がな判別を用いる漢字判別方式。
JP59080A 1980-01-09 1980-01-09 Kanji (chinese character) distinction system using katakana (square form of japanese syllabary) Granted JPS5699573A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59080A JPS5699573A (en) 1980-01-09 1980-01-09 Kanji (chinese character) distinction system using katakana (square form of japanese syllabary)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59080A JPS5699573A (en) 1980-01-09 1980-01-09 Kanji (chinese character) distinction system using katakana (square form of japanese syllabary)

Publications (2)

Publication Number Publication Date
JPS5699573A JPS5699573A (en) 1981-08-10
JPS6316795B2 true JPS6316795B2 (ja) 1988-04-11

Family

ID=11477937

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59080A Granted JPS5699573A (en) 1980-01-09 1980-01-09 Kanji (chinese character) distinction system using katakana (square form of japanese syllabary)

Country Status (1)

Country Link
JP (1) JPS5699573A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0255761A (ja) * 1988-08-22 1990-02-26 Shikoku Chem Corp ポリアミド樹脂組成物
JPH0662490A (ja) * 1992-08-05 1994-03-04 Mitsubishi Electric Corp 多チャンネル音声再生装置

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58222379A (ja) * 1982-06-18 1983-12-24 Fujitsu Ltd 文字認識修正処理方式
JPS592191A (ja) * 1982-06-29 1984-01-07 Fujitsu Ltd 手書き日本語文の認識処理方式
JPS6334680A (ja) * 1986-07-29 1988-02-15 Toshiba Corp 文字読取装置
JPH0546806A (ja) * 1991-08-20 1993-02-26 Oki Electric Ind Co Ltd 文字認識方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5347733A (en) * 1976-10-14 1978-04-28 Fujitsu Ltd Recognizing device for hand-written kana and chinese characters

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5347733A (en) * 1976-10-14 1978-04-28 Fujitsu Ltd Recognizing device for hand-written kana and chinese characters

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0255761A (ja) * 1988-08-22 1990-02-26 Shikoku Chem Corp ポリアミド樹脂組成物
JPH0662490A (ja) * 1992-08-05 1994-03-04 Mitsubishi Electric Corp 多チャンネル音声再生装置

Also Published As

Publication number Publication date
JPS5699573A (en) 1981-08-10

Similar Documents

Publication Publication Date Title
JP2553608B2 (ja) 光学文字読取装置
US6886136B1 (en) Automatic template and field definition in form processing
US5040226A (en) Courtesy amount read and transaction balancing system
EP0862132A2 (en) Robust identification code recognition system
JP2713622B2 (ja) 表形式文書読取装置
JPS6316795B2 (ja)
EP3477547B1 (en) Optical character recognition systems and methods
JPH07182448A (ja) 文字認識方法
JPH05108806A (ja) 画像特徴抽出方法及びその装置
JP2877380B2 (ja) 光学的文字読取装置
JP2925270B2 (ja) 文字読取装置
JPS6074094A (ja) 文字認識装置
JPH0426153B2 (ja)
JP3151866B2 (ja) 英文字認識方法
JP2924356B2 (ja) 光学文字読取装置
JP2832035B2 (ja) 文字認識装置
JP2600703B2 (ja) 部分細線照合装置
JPS62295192A (ja) 光学文字画像読取装置
JPH0319589B2 (ja)
JPH0877293A (ja) 文字認識装置および文字認識用辞書作成方法
EP0114996A2 (en) Character recognition utilizing transition measurements
JP2727755B2 (ja) 文字列認識方法及びその装置
JPH0628521A (ja) 光学的文字読取装置
JPH10124610A (ja) 光学式文字読取装置
JPS5933579A (ja) 文字認識方式