JP3074691B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JP3074691B2
JP3074691B2 JP02015823A JP1582390A JP3074691B2 JP 3074691 B2 JP3074691 B2 JP 3074691B2 JP 02015823 A JP02015823 A JP 02015823A JP 1582390 A JP1582390 A JP 1582390A JP 3074691 B2 JP3074691 B2 JP 3074691B2
Authority
JP
Japan
Prior art keywords
character
template
matching
image
pixels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP02015823A
Other languages
English (en)
Other versions
JPH03219384A (ja
Inventor
芳徳 山口
悟 有田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp filed Critical Omron Corp
Priority to JP02015823A priority Critical patent/JP3074691B2/ja
Publication of JPH03219384A publication Critical patent/JPH03219384A/ja
Application granted granted Critical
Publication of JP3074691B2 publication Critical patent/JP3074691B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 <産業上の利用分野> この発明は、複数のテンプレートを用いてテンプレー
トマッチングを行うことにより、認識対象文字を認識す
る文字認識装置に関する。
<従来の技術> 従来この種文字認識装置では、テンプレートの文字領
域にのみ着目し、この文字領域と認識対象文字の画像と
の一致度合を判定して認識対象文字の認識を行ってい
る。前記の一致度合は、テンプレートの文字領域を構成
する黒画素と認識対象文字の画像との一致画素数と、テ
ンプレートの文字領域を構成する総黒画素数との比率を
もって定義される。
<発明が解決しようとする問題点> ところが認識対象文字が、第4図(3)に示すように
英文字の「h」である場合に、この認識対象文字の画像
4と英文字「h」のテンプレート1(第4図(1)に示
す)との間でテンプレートマッチングを行って得た一致
度合と、この認識対象文字の画像4と英文字「n」のテ
ンプレート1(第4図(2)に示す)との間でテンプレ
ートマッチングを行って得た一致度合とは一致するた
め、この認識対象文字の画像4が英文字の「h」である
のか、「n」であるのかが同定できず、認識不能となっ
たり、後誤識を行ったりする。
なお同図中、2はテンプレート1の文字領域を構成す
る黒画素の部分であり,3は背景を構成する白画素の部分
である。また5は認識対象文字の構成画素である黒画素
の部分であり、6は背景を構成する白画素の部分であ
る。
認識対象文字が、第5図(3)に示すように英文字の
「e」であっても同様であり、英文字「e」のテンプレ
ート1(第5図(1)に示す)を用いてテンプレートマ
ッチングを行って得た一致度合と、英文字「c」のテン
プレート1(第5図(2))を用いてテンプレートマッ
チングを行って得た一致度合とは一致するため、この認
識対象文字の画像4を同定することも困難である。
このような問題を解消するために、テンプレート1の
背景を構成する白画素3と認識対象文字の画像4との一
致画素数と、テンプレート1の背景を構成する白画素3
の総白画素数との比率をもって背景についての一致度合
を定義し、この一致度合の比較も併せて行うことにより
認識対象文字を同定している。
ところがこの方法では、第6図(1)に示すように認
識対象文字の画像4中にノイズ7や下線部分8が存在し
ていたり、第6図(2)に示すように認識対象文字の画
像4に隣接文字の画像の一部が含まれていたりすると、
背景についての一致度合を用いても認識対象文字の同定
が困難となる。
この発明は、認識対象文字が形態が相互に類似するい
ずれの文字であっても、また認識対象文字の画像中にノ
イズや隣接文字の画像などが含まれていても、認識対象
文字を確実に同定し得る文字認識装置を提供することを
目的とする。またこの発明が他に目的とするところは、
各テンプレートの中から認識対象文字の候補を短時間で
絞り込んで同定処理を行うことにより、認識対象文字の
同定処理を高速化する点にある。
<問題点を解決するための手段> この発明の文字認識装置は、複数のテンプレートを記
憶しておく記憶手段と、記憶手段より各テンプレートを
順次読み出して、それぞれそのテンプレートの文字領域
を構成する総画素数に対する前記テンプレートの文字領
域を構成する画素と認識対象文字の構成画素との一致画
素数の比率を、テンプレートの文字領域と認識対象文字
の画像との一致度合として算出するマッチング手段と、
マッチング手段で算出された前記一致度合をしきい値と
比較してそのしきい値を越える一致度合が得られたテン
プレートの文字を認識対象文字の候補として検出する検
出手段と、検出手段により複数の候補文字が検出された
とき前記テンプレートの文字領域を構成する画素と認識
対象文字の構成画素との一致画素数が最大となるテンプ
レートの候補文字を認識対象文字として同定する同定手
段とを具備して成る。
<作用> 認識対象文字の画像と各テンプレートの文字領域との
一致度合により認識対象文字の候補を検出した後、複数
の候補文字が検出されたときは一致画素数を参照してい
ずれか候補文字を認識対象文字として同定するので、認
識対象文字が形態が相互に類似するいずれの文字であっ
てもその区別が可能である。またテンプレートの文字領
域のみに着目して、テンプレートの文字領域と認識対象
文字の画像との一致度合を算出するので、たとえ認識対
象文字の画像中にノイズや隣接文字の画像などが含まれ
ていても、文字の同定になんらの悪影響も受けない。さ
らにテンプレートの文字領域において認識対象文字の構
成画素と一致する画素数がどの位の比率を占めるかによ
り、認識対象文字の候補となるテンプレートを検出する
ので、各テンプレートを候補として残すかどうかを一度
の処理により判断して、認識対象文字の同定処理を高速
化できる。
<実施例> 第1図は、この発明の一実施例にかかる文字認識装置
11の全体構成を示している。
図示例の装置11は、認識対象文字の入力画像に対しテ
ンプレートを全面走査する方式のものであって、画像入
力装置12,画像メモリ13,マッチング処理部14,同定部23,
マイクロプロセッサユニット(以下、MPUと略す)15な
どを構成として含み、MPU15にはキーボードなどの操作
部16と、外部インターフェイス回路18を介してホストコ
ンピュータ17とが接続されている。
画像入力装置12は、ティーチングモードで登録すべき
テンプレートの基準画像を取り込んで画像メモリ13に格
納し、また認識モードで認識対象文字の画像を入力して
その画像データをマッチング処理部14へ与える。
画像メモリ13に記憶された基準画像は、MPU15により
読み出され、操作部16により領域指定を受けた各文字の
画像がテンプレートとしてパターンメモリ22に登録され
る。
マッチング処理部14は、パターンマッチング部20と、
一致度合算出部21と、一致点検出部24とを含むもので、
パターンマッチング部20には画像入力装置12から認識対
象文字の1フレーム分の画像データが入力され、またMP
U15によりテンプレートがロードされ、この入力画像に
対しテンプレートを順次全面走査することによりテンプ
レートマッチングが行われる。
一致度合算出部21は、テンプレートの文字領域を構成
する画素(黒画素)と入力画像との一致画素数と、テン
プレートの文字領域を構成する総黒画素数との比率を一
致度合として算出する部分である。一致点検出部24は一
致度合算出部21で算出された前記一致度合をMPU15より
与えられた所定のしきい値と比較し、そのしきい値を越
える一致度合のテンプレートの文字を認識対象文字の候
補として検出し、またその一致位置を認識対象文字の存
在位置としてMPU15へ出力する。また一致点検出部24で
は、各一致位置につきそのテンプレートの文字領域を構
成する黒画素と入力画像との一致画素数を所定の記憶領
域に記憶保持しておく。
同定部23は、一致点検出部24により検出された文字位
置につき複数の候補文字が検出されたとき、いずれか候
補文字を認識対象文字として同定する部分である。この
同定部23では、MPU15より候補データを、また一致点検
出部24より各候補抽出時に得た前記一致画素数を、それ
ぞれ入力し、一致画素数が最大値をとる候補文字を認識
対象文字として同定する。
第2図は、認識モードにおける上記文字認識装置11の
動作手順を示している。
まずテンプレートマッチングに先立ち、MPU15は同図
のステップ1(図中「ST1」で示す)〜ステップ3にお
いて、最初のテンプレートをパターンメモリ22から読み
出してテンプレート内を走査し、テンプレート内の文字
領域を構成する総黒画素数を計数する。ステップ1では
テンプレート内の最初の画素が文字領域の構成画素(黒
画素)が否かが判断され、“YES"の判定で総黒画素数の
計数値がインクリメントされる(ステップ2)。同様の
判定および計数動作がテンプレート内の全ての画素につ
き実行されると、ステップ3が“YES"となり、つぎの処
理へ移行する。
この段階で画像入力装置12は認識対象文字の画像デー
タをマッチング処理部14のパターンマッチング部20へ与
えると共に、MPU15は最初のテンプレートをマッチング
処理部14へロードして、入力画像に対しこのテンプレー
トによるテンプレートマッチングが実行される。
このテンプレートマッチングにおいて、ステップ4で
はテンプレートの文字領域を構成する最初の黒画素と入
力画像とが一致するか否かが判断され、“YES"の判定で
一致画素数の計数値がインクリメントされる(ステップ
5)。同様の判定および計数動作がテンプレート内の文
字領域を構成する全ての画素につき一致度合検出部21に
より実行されると、ステップ6の判定が“YES"となり、
つぎのステップ7でステップ5で得た計数値とステップ
2で得た計数値との比率が一致度合として算出される。
つぎに一致点検出部24は、ステップ8において、この
一致度合の算出値が所定のしきい値を越えるか否かを判
定しており、その判定が“YES"であれば、現在のテンプ
レートの走査位置にそのテンプレートの文字が存在する
可能性があると判断され、MPU15には現位置の座標が取
り込まれると共に、前記文字が候補文字として記憶され
る。
ステップ10は、このテンプレートによる入力画像の全
面走査が完了したか否かを判定しており、その判定が
“NO"であれば、つぎの走査位置へ進んで上記と同様の
手順を実行される。
かくしてステップ10の判定が“YES"になれば、つぎの
テンプレートによるテンプレートマッチングが同様の手
順により実行される。
そして全てのテンプレートによるマッチング処理が完
了すると、ステップ11が“YES"となり、ステップ12へ進
み、各文字位置の候補群に対し統合処理を行って各文字
位置の同定を行う。各文字位置の候補群につき統合処理
が完了すると、ステップ13が“YES"となり、つぎのステ
ップ14において、最初の文字位置に複数の候補文字が検
出されたか否かが判定される。
もしステップ14の判定が“YES"であれば、同定部23
は、ステップ15において、各候補文字についてのステッ
プ5で求めた一致画素数のうち最大値をとる候補文字を
認識対象文字として同定する。なお着目した文字位置に
複数の候補文字が検出されていなければ、ステップ14の
判定は“NO"であり、その単独の候補文字が認識対象文
字として同定される。
かくてすべての文字位置につき、同様の同定処理が実
施されると、ステップ16が“YES"となって文字認識手順
が完了する。
例えば認識対象文字が第4図(3)に示す英文字の
「h」である場合、その画像4と第4図(1)(2)に
示す英文字「h」および「n」の各テンプレート1との
間でそれぞれテンプレートマッチングを行うと、ステッ
プ7で求められる一致度合は両者とも共通する。ところ
がステップ5で求められる一致画素数は、「h」のテン
プレートの方が大きな値となるから、認識対象文字は
「h」に同定されることになる。
認識対象文字が第5図(3)に示す英文字「e」であ
る場合も同様であり、ステップ5で求められる一致画素
数は「c」のテンプレートより「e」のテンプレートの
方が大きな値となるから、認識対象文字は「e」に同定
される。
またテンプレートの文字領域にのみ着目して一致度合
の算出を行うので、入力画像に第6図に示すようなノイ
ズ7や下線部分8が存在したり、また隣接文字が存在す
る場合であっても、支障なく高精度の文字認識を行うこ
とができる。
第3図は、この発明の他の実施例にかかる文字認識装
置11aの構成を示している。この実施例では、入力画像
を画像メモリ13に格納した後、この入力画像の各文字領
域を領域指定部25で指定して文字切出し部19により1文
字分を切り出している。そしてこの切り出された認識対
象文字の画像に対しテンプレートマッチングを行って、
前述の実施例の処理を実行するものである。
<発明の効果> この発明は上記の如く、認識対象文字の画像と各テン
プレートの文字領域との一致度合により認識対象文字の
候補を検出した後、複数の候補文字が検出されたときは
一致画素数を参照していずれか候補文字を認識対象文字
として同定するようにしたから、認識対象文字が形態が
相互に類似するいずれの文字であってもその区別が可能
であり、またたとえ認識対象文字の画像中にノイズや隣
接文字の画像などが含まれていても、文字の同定になん
らの悪影響も受けることはなく、確実かつ高精度の文字
認識が可能である。さらに同定処理に先立ち、テンプレ
ートの文字領域において認識対象文字の構成画素と一致
する画素数が占める比率を用いて、認識対象文字の候補
を絞り込むので、各テンプレートを候補として残すかど
うかを一度の処理により判断して、認識対象文字を高精
度かつ高速で同定することができる。
【図面の簡単な説明】
第1図はこの発明の一実施例にかかる文字認識装置のブ
ロック図、第2図は文字認識の手順を示すフローチャー
ト、第3図はこの発明の他の実施例の構成を示すブロッ
ク図、第4図および第5図はテンプレートと認識対象文
字とを対比して示す説明図、第6図は従来技術の問題点
を説明するための説明図である。 11,11a……文字認識装置 14……マッチング処理部、15……MPU 20……パターンマッチング部 21……一致度合算出部 22……パターンメモリ、23……同定部 24……一致点検出部
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06K 9/62

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】複数のテンプレートを記憶しておく記憶手
    段と、 前記記憶手段より各テンプレートを順次読み出して、そ
    れぞれそのテンプレートの文字領域を構成する総画素数
    に対する前記テンプレートの文字領域を構成する画素と
    認識対象文字の構成画素との一致画素数の比率を、テン
    プレートの文字領域と認識対象文字の画像との一致度合
    として算出するマッチング手段と、 前記マッチング手段で算出された一致度合をしきい値と
    比較して、そのしきい値を越える一致度合が得られたテ
    ンプレートの文字を認識対象文字の候補として検出する
    検出手段と、 前記検出手段により複数の候補文字が検出されたとき前
    記テンプレートの文字領域を構成する画素と認識対象文
    字の構成画素との一致画素数が最大となるテンプレート
    の候補文字を、認識対象文字として同定する同定手段と
    を具備して成る文字認識装置。
JP02015823A 1990-01-25 1990-01-25 文字認識装置 Expired - Fee Related JP3074691B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP02015823A JP3074691B2 (ja) 1990-01-25 1990-01-25 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP02015823A JP3074691B2 (ja) 1990-01-25 1990-01-25 文字認識装置

Publications (2)

Publication Number Publication Date
JPH03219384A JPH03219384A (ja) 1991-09-26
JP3074691B2 true JP3074691B2 (ja) 2000-08-07

Family

ID=11899575

Family Applications (1)

Application Number Title Priority Date Filing Date
JP02015823A Expired - Fee Related JP3074691B2 (ja) 1990-01-25 1990-01-25 文字認識装置

Country Status (1)

Country Link
JP (1) JP3074691B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4867771B2 (ja) * 2007-04-19 2012-02-01 パナソニック電工株式会社 テンプレートマッチング装置
EP1916538A3 (en) 2006-10-27 2011-02-16 Panasonic Electric Works Co., Ltd. Target moving object tracking device

Also Published As

Publication number Publication date
JPH03219384A (ja) 1991-09-26

Similar Documents

Publication Publication Date Title
US5410611A (en) Method for identifying word bounding boxes in text
EP0163377B1 (en) Pattern recognition system
US7970213B1 (en) Method and system for improving the recognition of text in an image
US20050238257A1 (en) Form search apparatus and method
US8938117B2 (en) Pattern recognition apparatus and method therefor configured to recognize object and another lower-order object
CN115546219B (zh) 检测板式生成方法、板卡缺陷检测方法、装置及产品
JP3074691B2 (ja) 文字認識装置
JPH11272800A (ja) 文字認識装置
JP2002245404A (ja) 領域切り出しプログラムおよび装置
JP2867531B2 (ja) 文字サイズ認識装置
JPH08263655A (ja) パターン認識方法
JP3115139B2 (ja) 文字切り出し方法
JPH0935058A (ja) 画像認識方法
JP2832035B2 (ja) 文字認識装置
JP2964684B2 (ja) 文字読取りにおける文字データ収集方法
JPH0855185A (ja) 文字認識装置
JP3046532B2 (ja) 物体の認識方法
JPH11134434A (ja) 網がけ領域の抽出方法及び装置
JP2972443B2 (ja) 文字認識装置
JP2851865B2 (ja) 文字認識装置
JP2977244B2 (ja) 文字認識方法及び文字認識装置
JP2658153B2 (ja) 文字識別方式
JPS63131287A (ja) 文字認識方式
JPH11135998A (ja) 認識方法
JPH0432970A (ja) 画像認識・修正方法及びその装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080609

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090609

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees