JP2611968B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JP2611968B2
JP2611968B2 JP60293970A JP29397085A JP2611968B2 JP 2611968 B2 JP2611968 B2 JP 2611968B2 JP 60293970 A JP60293970 A JP 60293970A JP 29397085 A JP29397085 A JP 29397085A JP 2611968 B2 JP2611968 B2 JP 2611968B2
Authority
JP
Japan
Prior art keywords
character
unit
recognition
character pattern
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP60293970A
Other languages
English (en)
Other versions
JPS62152092A (ja
Inventor
智子 馬場
豊志 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP60293970A priority Critical patent/JP2611968B2/ja
Publication of JPS62152092A publication Critical patent/JPS62152092A/ja
Application granted granted Critical
Publication of JP2611968B2 publication Critical patent/JP2611968B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 [発明の技術分野] 本発明は不鮮明な文字の認識を禁止して誤読を防止す
るようにした文字認識装置に関する。
[発明の技術的背景とその問題点] 光電変換部,量子化部,前処理部および認識部を具備
してなる文字認識装置においては、光電変換部により被
認識文字を電子信号のアナログ信号に変換し、このアナ
ログ信号を量子化部にて多値のデジタル信号に量子化
し、これにより得られたデジタル信号の文字パターンを
マッチングし易いように前処理部で形を整え、認識部で
辞書パターンと重ね合せてその類似度値を求めて文字を
認識するようになされている。
従って上記従来の文字認識装置においては、量子化部
から出力される文字パターンの全てが、文字の印字濃度
と関係なく前処理部を経て認識部に入力さて認識され
る。よって例えば印字濃度が薄く、文字線が欠けている
ような文字パターンも認識の対象として認識部に入力さ
れることになる。このように文字線の一部が欠けている
不鮮明な文字パターンは、例えば数字0の文字の一部が
欠けてCのようになると、数字6や英文字のCに誤読さ
れるように、文字認識装置で誤読される原因になった
り、また文字が不鮮明のためにその認識に無駄な時間を
要する等の悪影響を及ぼしていた。
[発明の目的] 本発明は上記従来の問題点を解消し、文字認識に悪影
響を与える不鮮明な文字パターンを認識操作前に認識操
作から除去するために、量子化されたデジタル信号の文
字パターンの印字濃度を判別し、印字の薄い文字パター
ンの読取を禁止して誤読を防止し得る文字認識装置を提
供することを目的とする。
[発明の概要] 本願発明による文字認識装置は、被認識文字をアナロ
グ信号に変換する光電交換部と、この光電変換部から出
力される前記アナログ信号を多値のデジタル信号に変換
しデジタル化された文字パターンとして出力する量子化
部と、この量子化部から出力される前記デジタル化され
た文字パターンを前処理して、正規化文字パターンを出
力すると共に、この正規化された文字パターンの芯線部
分を検出し芯線位置情報を出力する前処理部と、文字パ
ターンが登録された辞書と、前記前処理部から出力され
る前記正規化文字パターンと前記辞書に登録された文字
パターンとを比較して文字認識する認識部と、前記量子
化部から出力される前記デジタル化された文字パターン
と前記前処理部から出力される前記芯線位置情報とを入
力し、前記デジタル化された文字パターンの芯線部分の
濃度が所定値以下でかつ零より大きいときに前記認識部
に認識禁止信号を出力して文字認識動作を禁止する濃度
判定部とを具備したことを特徴とし、不鮮明な文字の誤
読を防止するようにしたものである。
[発明の実施例] 第1図は本発明の一実施例の構成を示すブロック図で
あり、11は例えば帳票上の被認識文字を電子信号のアナ
ログ信号に変換する光電変換部、12は光電変換されたア
ナログ信号を多値のデジタル信号に変換する量子化部、
13はデジタル化されたイメージパターンの大きさや位置
を正規化したり、不要情報を除去したりして認識し易い
ように形を整えるともに文字パターンの芯線部分、即ち
文字パターンの幅方向の中心部分を抽出し、芯線位置情
報、即ち文字パターンの幅方向の中心位置情報を出力す
る前処理部、15は前処理部13で正規化された文字パター
ンと辞書21の文字パターンとを比較して文字認識する認
識部である、以上の各部で構成される文字認識装置は従
来の文字認識装置と同じである。本発明の一実施例にお
いては、上記従来の文字認識装置に濃度判別部14を付加
してなるものである。この濃度判別部14は量子化部12お
よび前処理部13の各出力をそれぞれ入力し、前記量子化
部12から出力される多値のデジタル信号で表現された文
字パターンのうち前処理部13から出力される芯線位置情
報で指示された部分の濃度が一定の閾値以上であるか否
かを判別し、閾値以上または以下により、認識部15で認
識すべき文字かまたは認識禁止にすべき文字かを判別す
る機能を備え、印字濃度が所定値以下でかつ零より大き
いときに、その文字パターンの読取を禁止する信号を認
識部15に入力するようになされている。
第1図に示す本発明の一実施例の作用について説明す
る。
第1図において濃度判別部14を除く各部の構成および
その作用は、従来の文字認識装置と同一であるから、そ
の説明を省略し、以下に濃度判別部14の作用について説
明する。
第2図は文字線に濃淡のある数字0を示し、その数字
0の中の201で示す部分は十分な濃度を有する文字線で
あるが、202で示す部分はその濃度が極めて薄くなって
いる。このようなパターンは、例えば手書き文字の場合
にはその書き方のクセで起り、また活字文字の場合でも
プリンタの特性などによりよく起り得るパターンであ
る。この第2図に示すパターンを文字認識装置により量
子化すると、第3図に示すように、文字線の中の濃度の
薄い部分が欠けてしまい、英文字のCと似たパターンに
なり、このまま認識すると英文字Cと誤読を起こす結果
となる。
第2図に示す部分202は、文字線がないのでなく、非
常に薄くなっているのであるから、この部分をA/D変換
器でデジタル化すると、レベルの低い信号になるが、0
にはならない。一方もともと文字として部分202に文字
線がないパターン、例えば英文字Cのようなパターンで
は、これをデジタル化すると、0か0に近い値に変換さ
れる。本発明はこの違いを利用して、文字線が薄くて誤
読を起こし易い文字パターンの場合には、その認識を禁
止することにより、誤読を防止するようにしたものであ
る。
第4図は第1図における濃度判別部14の作用を説明す
るための図であり、101は記憶装置でこの例では4レベ
ルにA/D変換された信号1010〜1013を記憶するものであ
る。この記憶装置101が記憶する量子化レベルについて
説明する。
第5図はA/D変換の様子を示す図であり、例えばCの
右端のように、もともと文字として文字線がない場合に
は、第5図の(a)に示すように0000と量子化される。
文字線に十分な濃度がある場合には、第5図の(c)に
示すようなアナログ信号になり、1111と量子化される。
また第2図の部分202にように濃度が不十分な文字線の
場合には、第5図(b)に示すようなアナログ信号にな
り、0011と量子化される。記憶装置101はこれらの0000
や0011などの信号を記憶するものである。
第4図における102の論理素子で、この例では最高位
のビットM3と次のビットM2に信号がないときに、その出
力1031に信号が得られるように構成されている。これを
103で判別指令に基いて制御すると、必要な文字位置で
十分な濃度がないとき、出力1033に出力信号が得られ、
もともと欠落した文字でないのに、印字濃度が薄いため
に、量子化パターンが欠けてしまっているという情報が
得られる。この信号を第1図における認識部15に対して
濃度判別部14から出力されるリジェクト信号として用
い、上記不鮮明な文字の認識を禁止してその誤読の発生
を防止する。
[発明の効果] 従来の文字認識装置によれば、印字が薄い文字や、文
字線の一部が欠けている文字は、量子化の結果としては
文字の性質の一部が欠落して誤読を起こしたり、認識に
無駄な時間を費したりする欠点があったが、本発明によ
れば、従来の文字認識装置に文字線の濃度を判別する濃
度判別部を付加することにより、印字が薄かったり、文
字線の一部が欠けた文字の認識を禁止することができ、
これにより上記従来の欠点を解消することができる等の
優れた効果が奏せられる。
【図面の簡単な説明】
第1図は本発明の一実施例の構成を示すブロック図、第
2図および第3図はそれぞれ濃淡を有する数字0とその
量子化された文字パターンを示す図、第4図および第5
図はそれぞれ第1図における濃度判別部の作用を説明す
るための図である。 11……光電変換部、12……量子化部、13……前処理部、
14……濃度判別部、15……認識部、21……辞書。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 佐藤 豊志 青梅市末広町2丁目9番地 株式会社東 芝青梅工場内 (56)参考文献 特開 昭53−43435(JP,A)

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】被認識文字をアナログ信号に変換する光電
    交換部と、 この光電変換部から出力される前記アナログ信号を多値
    のデジタル信号に変換しデジタル化された文字パターン
    として出力する量子化部と、 この量子化部から出力される前記デジタル化された文字
    パターンを前処理して、正規化文字パターンを出力する
    と共に、この正規化された文字パターンの芯線部分を検
    出し芯線位置情報を出力する前処理部と、 文字パターンが登録された辞書と、 前記前処理部から出力される前記正規化文字パターンと
    前記辞書に登録された文字パターンとを比較して文字認
    識する認識部と、 前記量子化部から出力される前記デジタル化された文字
    パターンと前記前処理部から出力される前記芯線位置情
    報とを入力し、前記デジタル化された文字パターンの芯
    線部分の濃度が所定値以下でかつ零より大きいときに前
    記認識部に認識禁止信号を出力して文字認識動作を禁止
    する濃度判定部とを具備したことを特徴とする文字認識
    装置。
JP60293970A 1985-12-26 1985-12-26 文字認識装置 Expired - Lifetime JP2611968B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60293970A JP2611968B2 (ja) 1985-12-26 1985-12-26 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60293970A JP2611968B2 (ja) 1985-12-26 1985-12-26 文字認識装置

Publications (2)

Publication Number Publication Date
JPS62152092A JPS62152092A (ja) 1987-07-07
JP2611968B2 true JP2611968B2 (ja) 1997-05-21

Family

ID=17801549

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60293970A Expired - Lifetime JP2611968B2 (ja) 1985-12-26 1985-12-26 文字認識装置

Country Status (1)

Country Link
JP (1) JP2611968B2 (ja)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5343435A (en) * 1976-10-01 1978-04-19 Toshiba Corp Pattern recognition system

Also Published As

Publication number Publication date
JPS62152092A (ja) 1987-07-07

Similar Documents

Publication Publication Date Title
US5278400A (en) Multiple threshold encoding of machine readable code
US4747149A (en) Optical character recognition apparatus
US4520505A (en) Character reading device
EP0127441A2 (en) Character recognition apparatus
JPS63158678A (ja) 単語間スペ−ス検出方法
US7911653B2 (en) Device using low visibility encoded image to manage copy history
JP2611968B2 (ja) 文字認識装置
Pal et al. Computer recognition of printed Bangla script
JPH0430070B2 (ja)
JP2644041B2 (ja) 文字認識装置
JP2812256B2 (ja) 文字認識装置および方法
JP2001176008A (ja) 磁気パターンの認識装置、認識方法、および、情報記録媒体
JPS60116078A (ja) 文字認識装置
JPS6349269B2 (ja)
JPS6037952B2 (ja) 最適二値化方式
JPS6160184A (ja) 光学的文字読取装置
JPS639270B2 (ja)
JP3187182B2 (ja) 光学的手書き文字列認識方法および装置
JP2902905B2 (ja) 文字認識装置
JP2572048B2 (ja) 単語処理方式
JP2875330B2 (ja) 文字認識方法
JP2902904B2 (ja) 文字認識装置
JPS5831028B2 (ja) 文字認識装置
JPS6158088A (ja) ドツト印字文字の認識方法
JPH0135386B2 (ja)