JPH02306386A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH02306386A
JPH02306386A JP1127519A JP12751989A JPH02306386A JP H02306386 A JPH02306386 A JP H02306386A JP 1127519 A JP1127519 A JP 1127519A JP 12751989 A JP12751989 A JP 12751989A JP H02306386 A JPH02306386 A JP H02306386A
Authority
JP
Japan
Prior art keywords
character
character string
recognition
recognized result
sum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1127519A
Other languages
English (en)
Inventor
Kazuhiro Mori
和宏 森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP1127519A priority Critical patent/JPH02306386A/ja
Priority to US07/523,375 priority patent/US5050224A/en
Publication of JPH02306386A publication Critical patent/JPH02306386A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • G06V10/7515Shifting the patterns to accommodate for positional errors

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、辞書パターンとの位置合わせが困難な文字画
像においても良好な認識結果を得ることが可能な文字認
識装置に関する。
(従来の技術) 従来、文字認識に有効な手法としてパターンマツチング
法がある。この手法は、2値化された文字画像に対して
、あらかじめ用意された辞書パターンとのマツチングを
取ることにより認識結果を得るものである。したがって
、辞書との照合において、各文字ごととの位置合わせが
正(2く行なわれなければならない。
しかしながら、たとえば文字間隔が狭い文字列画像で、
2値化処理において各文字が接触したり、雑画の接触や
、文字画像の欠けなどにより、ラベリング処理やプロフ
ィールなどを用いても、各文字ごとに正1. <辞書パ
ターンどの位置合わせを行なうことは困難となる。
(発明が解決しようとする課題) 従来の文字認識方法では、上記I7たように文字間隔が
狭い文字列画像での2値画像の接触や、雄面の接触、2
値画像の欠けなどにより、各文字ごとに正しく辞書パタ
ーンとの位置合わせを行なうことが困難となり、良好な
認識結果が得られないという問題を生じる。
そこで、本発明は、文字間隔が狭い文字列画像での2値
画像の接触や、雄面の接触、21!画像の欠けなどによ
り、各文字ごとに正しく辞書パターンとの位置合わせを
行なうことが困難な場合においても良好な認識結果が得
られる文字認識装置を提供することを目的とする。
[発明の構成] (課題を解決するための手段) 本発明の文字認識装置は、入力される文字画像を2値化
する2値化手段と、この2値化手段で2値化された文字
画像から文字列を険出し、その文字列に外接する矩形領
域を設定する文字列検出手段と、この文字列検出手段で
設定された矩形領域内において辞書パターンを走査させ
ながらマツチングを取り、個々の点にお1ノる類似度を
算出して認識結果を求める認識手段と、この認識手段で
求められた個々の認識結果が同じ認識結果で繋がる領域
の類似度の和を求め、その和の大きい順に分類I7て対
応する認詭結果を出力する手段とを具備している。
(作用) 検出された文字列に外接する矩形領域内において、辞書
パターンを走査させながらマツチングを取り、個々の点
における類似度を算出して認識結果を求める。さらに、
求められた認識結果が同じ認識結果で繋がる領域の類似
度の和を求め、その和の大きい順に分類して対応する認
識結果を出力する。
(実施例) 以下、本発明の一実施例について図面を参照して説明す
る。なお、この実施例では、たとえば数字の文字列を読
取る文字認識装置について説明する。
第1図において、まず2値化部1では、入力された多値
の文字画像を例えば背景が0゛、文字部が“1“の2値
画像に2値化する。2値化の方式には様々な方式がある
が、本発明においては2値化の方式については本質的で
はないので、単純な固定閾値による2値化方式として説
明する。すなわち、入力画像に対しである閾値以上の画
像を“1”に、閾値以下の画像を“0゛にすることによ
り、設定閾値が適切である場合、たとえば第2図に示す
ような文字列の2値画像が得られる。この2値画像は一
旦、2値画像蓄積部2に蓄えられる。
この場合、第2図の例に示すごとく文字の間隔が適度に
存在するような文字列の2値画像であれば、たとえば周
知のラベリング処理などにより、個々の文字に対して辞
書パターンとの位置合わせを行なう座標を確定する、い
わゆる文字検出切出しの処理を行なうことは容易である
しかし、たとえば第3図(a)に示すように文字の間隔
が狭いために文字同士が接触【−たり、第3図(b)に
示すように文字に雄面が接触1、たり、第3図(c)に
示すように文字に欠けが生じたりした場合、°個々の文
字ごとに対して位置合わせの座標を確定することは困難
である。
このような文字同士の接触や、雄面との接触、欠けなど
により位置合わせが困難であっても、以下に述べるよう
な処理により良好な認識を行なうことができる。
文字列検出部3では、2値画像蓄積部2に蓄えられた2
値画像から、たとえば第4図に示すようにX軸、Y軸方
向それぞれに対するプロフィールを用いることにより文
字列を険出し切出す。切出情報としては、たとえば検出
した文字列に外接する矩形領域を設定し、その矩形領域
の座標情報(Xs、Ys)、(Xe、Ye)を文字認識
部4に出力する。
文字認識部4では、2値画像蓄積部2に蓄えられた2値
画像、および文字列検出部3からの文字列に外接する矩
形領域の座標情報により文字認識処理を行なう。すなわ
ち、第5図に示すように、たとえば求まった文字列に外
接する矩形領域内の2値画像をラスクスキャンのように
1画素ずつずらしながら、辞書パターンの中心と位置合
わせを行ないパターンマツチングによる認識処理を行な
う。
これにより、文字列に外接する矩形領域の横幅および縦
幅がそれそ′れLx、Lyのとき、(LXXLy)個の
認識結果と類似度が求まる。ここで、類似度とは、入カ
バターンと辞書パターンとの一致度を定量的に示す度合
いのことであり、類似度が高いほど認識結果の確かさも
高い。
すなわち、文字列に外接する矩形領域内の文字に対応し
ない領域に対してパターンマツチングを行なっている場
合は認識結果は不確定であり、かつその類似度は低い値
となるが、文字に対応した領域に対してパターンマツチ
ングが行なわれた場合には正]、い認識結果と高い類似
度を取り得る。
この点に着目し、たとえば第6図に示すように4近傍で
認識結果が連結する領域の類似度の和を求め、その和の
大きいものから順に分類し、座標情報検証部5へ出力す
る。
第6図において、(a)図は認識結果を示し、(b)図
は(a)図の認識結果に対応する類似度を示している。
なお、第6図(b)においては、便宜上、類似度を「O
〜10」の数置で表している。
ここで、第6図(b)の例において、領域Aの類似度の
和はr64 (3位出力)」、領域Bの類似度の和はr
82(2位出力)」、領域Cの類似度の和はr56 (
4位出力)」、領域りの類似度の和はr83 (1位出
力)」である。
座標情報検証部5では、座標による認識結果の検証を行
なう。すなわち、文字とずれた所や文字と文字との間な
どで例外的に認識結果が不確定で、かつ高い類似度を取
り得るような場合が仮にあったとしても、文字と文字と
の間隔や縦方向の揃い方などの座標情報により、その認
識結果が真に文字によるものかそうでないかを検証する
ことができる。このようにして、座標情報も加味して得
られた認識結果を最終的に出力することにより、各文字
ごとの切出しが行なえなくとも、良好な認識結果を得る
ことができる。
なお、前記実施例においては、2値化部に単純2値化方
式を用いているが、その他の浮動閾値による2値化や微
分2値化など、様々な2値化方式%式% また、文字列検出部における文字列の検出切出しは、プ
ロフィールを用いた検出切出しのみならず、ラベリング
処理による文字列の検出切出しなども考えられる。
さらに、文字列に外接する矩形領域内における辞書パタ
ーンとの位置合わせは、前記実施例のごとくラスクスキ
ャン方向に1画素づつ動かす以外に、所定のピッチでサ
ンプリングを行なってもよい。
[発明の効果] 以上詳述したように本発明によれば、検出された文字列
に外接する矩形領域内において、辞書パターンを走査さ
せながらマツチングを取り、個々の点において求められ
た認識結果が同じ認識結果で繋がる領域の類似度の和を
求め、その和の大きい順に分類して対応する認識結果を
出力することにより、文字間隔が狭い文字列画像での2
値画像の接触や、雄面の接触、2値画像の欠けなどによ
り、各文字ごとに正しく辞書パターンとの位置合わせを
行なうことが困難な場合においても良好な認識結果が得
られる文字認識装置を提供できる。
【図面の簡単な説明】
図は本発明の一実施例を説明するためのもので、第1図
は全体的な構成を示すブロック図、第2図は2値画像の
一例を示す図、第3図は文字同士の接触、雄面との接触
、画像の欠けなどの一例を示す図、第4図はプロフィー
ルによる文字列の検出切出し処理を説明する図、第5図
はパターンマツチング処理を説明する図、第6図は類似
度の和による認識結果の分類を説明する図である。 1・・・2値化部、2・・・2値画像蓄積部、3・・・
文字列検出部、4・・・文字認識部、5・・・座標情報
検証部。 出願人代理人  弁理士 鈴江武彦 第3図 第4図 15ffl (a)!!’m結果 (b)類似度 IIG図

Claims (1)

  1. 【特許請求の範囲】 入力される文字画像を2値化する2値化手段と、 この2値化手段で2値化された文字画像から文字列を検
    出し、その文字列に外接する矩形領域を設定する文字列
    検出手段と、 この文字列検出手段で設定された矩形領域内において辞
    書パターンを走査させながらマッチングを取り、個々の
    点における類似度を算出して認識結果を求める認識手段
    と、 この認識手段で求められた個々の認識結果が同じ認識結
    果で繋がる領域の類似度の和を求め、その和の大きい順
    に分類して対応する認識結果を出力する手段と を具備したことを特徴とする文字認識装置。
JP1127519A 1989-05-20 1989-05-20 文字認識装置 Pending JPH02306386A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP1127519A JPH02306386A (ja) 1989-05-20 1989-05-20 文字認識装置
US07/523,375 US5050224A (en) 1989-05-20 1990-05-15 Character recognition apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1127519A JPH02306386A (ja) 1989-05-20 1989-05-20 文字認識装置

Publications (1)

Publication Number Publication Date
JPH02306386A true JPH02306386A (ja) 1990-12-19

Family

ID=14962023

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1127519A Pending JPH02306386A (ja) 1989-05-20 1989-05-20 文字認識装置

Country Status (2)

Country Link
US (1) US5050224A (ja)
JP (1) JPH02306386A (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0331981A (ja) * 1989-06-29 1991-02-12 Canon Inc 文字認識装置
EP0489374A1 (de) * 1990-12-06 1992-06-10 Reinhard Hörburger Lattenrost zur Auflage von Matratzen o. dgl.
US5253304A (en) * 1991-11-27 1993-10-12 At&T Bell Laboratories Method and apparatus for image segmentation
JP3260810B2 (ja) * 1992-03-31 2002-02-25 キヤノン株式会社 画像処理装置及びその方法
CA2106708C (en) * 1992-09-25 2000-01-25 Nobuatsu Sasanuma Image processing apparatus and method thereof
US6212299B1 (en) * 1992-12-11 2001-04-03 Matsushita Electric Industrial Co., Ltd. Method and apparatus for recognizing a character
US5410611A (en) * 1993-12-17 1995-04-25 Xerox Corporation Method for identifying word bounding boxes in text
JP3566334B2 (ja) * 1994-03-25 2004-09-15 キヤノン株式会社 画像処理装置およびその方法
US5644656A (en) * 1994-06-07 1997-07-01 Massachusetts Institute Of Technology Method and apparatus for automated text recognition
US5661763A (en) * 1995-07-28 1997-08-26 Adtran, Inc. Apparatus and method for detecting programmable length bit pattern in serial digital data stream
US6023530A (en) * 1995-11-13 2000-02-08 Applied Intelligent Systems, Inc. Vector correlation system for automatically locating patterns in an image
US8682077B1 (en) 2000-11-28 2014-03-25 Hand Held Products, Inc. Method for omnidirectional processing of 2D images including recognizable characters
US7203363B2 (en) * 2003-06-27 2007-04-10 Chunghwa Telecom Co., Ltd. String extraction method for image based on multiple stroke width patterns matching

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58129684A (ja) * 1982-01-29 1983-08-02 Toshiba Corp パタ−ン認識装置
BG39560A1 (en) * 1983-08-25 1986-07-15 Natov Polyvinylchloride composition
US4635290A (en) * 1983-12-20 1987-01-06 Nec Corporation Sectioning apparatus and method for optical character reader systems
US4864629A (en) * 1985-12-31 1989-09-05 Schlumberger Technologies, Inc. Image correlation system
US4907283A (en) * 1987-03-13 1990-03-06 Canon Kabushiki Kaisha Image processing apparatus

Also Published As

Publication number Publication date
US5050224A (en) 1991-09-17

Similar Documents

Publication Publication Date Title
US5410611A (en) Method for identifying word bounding boxes in text
JP2002133426A (ja) 多値画像から罫線を抽出する罫線抽出装置
JPH02306386A (ja) 文字認識装置
US5841905A (en) Business form image identification using projected profiles of graphical lines and text string lines
EP0609474A1 (en) Method and apparatus for transforming an image for classification or pattern recognition
JPH09251544A (ja) ワークエッジ検出画像処理装置
JP3494388B2 (ja) 指紋照合方法および指紋照合装置
JP2613959B2 (ja) 指紋紋様分類装置
JPH07220081A (ja) 画像認識装置の図形の切出し方法
US20130051681A1 (en) System and method for script and orientation detection of images
JPH06139338A (ja) 指紋紋様分類装置
JP2871161B2 (ja) 疑似特徴点識別方法
JPS63308689A (ja) 文字の傾き角度検出修正方式
JP2963807B2 (ja) 郵便番号枠検出装置
JPH05242224A (ja) 指紋照合装置
JP2002015283A (ja) 分離文字列統合方法および装置
JP3230371B2 (ja) 文字認識装置及び文字認識方法
JP2715930B2 (ja) 線分検出方法
JP2004013188A (ja) 帳票読取り装置および帳票読取り方法ならびプログラム
JP2683290B2 (ja) 罫線判定方法および文字認識装置
JPS58165178A (ja) 文字読取り装置
JPH07109612B2 (ja) 画像処理方法
Zhang et al. Using Orientation Voting to Extract Text Lines with Various Mixed Directions from a Document Image
JP2871233B2 (ja) 二値化像修正方法
JP2925270B2 (ja) 文字読取装置