JPH06150062A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH06150062A
JPH06150062A JP4295481A JP29548192A JPH06150062A JP H06150062 A JPH06150062 A JP H06150062A JP 4295481 A JP4295481 A JP 4295481A JP 29548192 A JP29548192 A JP 29548192A JP H06150062 A JPH06150062 A JP H06150062A
Authority
JP
Japan
Prior art keywords
character
contact
feature
characters
graphic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4295481A
Other languages
English (en)
Inventor
Michiaki Nobuoka
道明 信岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP4295481A priority Critical patent/JPH06150062A/ja
Publication of JPH06150062A publication Critical patent/JPH06150062A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】精度高く接触文字の分離を行うとともに処理時
間を短縮する。 【構成】認識対象画像として入力した2値画像により文
字領域抽出部4で抽出された文字領域内の黒画素の分布
より図形特徴抽出部5で抽出された図形特徴と、予め認
識対象画像を構成する文字の図形特徴を記憶している認
識辞書6からの図形特徴との照合により認識文字を決定
する文字認識において、認識結果および文字領域の縦横
比により接触文字判定部8で接触文字を判定し、接触文
字判定部で接触文字と判定された文字領域に対して射影
特徴抽出部9で射影特徴を抽出し、また、接触文字判定
部で接触文字と判定された文字領域に対して側面距離特
徴抽出部21で側面距離特徴を抽出し、これら射影特徴お
よび側面距離特徴に基づいて接触文字分割処理部22で切
断点を検出して接触文字の分離を行い、この分離結果に
基づいて図形特徴抽出部5で図形特徴を抽出させる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文書画像中の文字の認
識を行う文字認識装置に関する。
【0002】
【従来の技術】近年、画像入力装置を電子計算機などの
文字認識装置として利用する要求が高まっており、安定
な認識結果を短時間に得ることができる文字入力装置が
電子計算機などのシステムの性能向上に不可欠となって
いる。
【0003】以下、従来の文字認識装置の文字切り出し
方法について説明する。図6は従来の文字認識装置の機
能ブロック図である。図6において、画像入力部1は画
像格納部2に接続され、認識対象文書を2値画像として
入力して画像格納部2で画像を蓄える。この画像格納部
2が接続される外接矩形検出部3は、文字画像中の文字
の外接する矩形を黒画素の連結を基に求める。この外接
矩形検出部3が接続される文字領域抽出部4は、外接矩
形検出部3にて求められた矩形を基に文字領域を抽出す
る。この文字領域抽出部4および画像格納部2が接続さ
れる図形特徴抽出部5は、文字領域抽出部4にて求めら
れた文字領域内の画像(文字パターン)を画像格納部2
から取り出し、この画像中の黒画素の分布を図形特徴と
して抽出する。この図形特徴抽出部5が接続されるとと
もに、全ての認識対象文字の図形特徴を予め記憶してい
る認識辞書6が接続される文字認識部7は、図形特徴抽
出部5にて求められた図形特徴と、認識辞書6の図形特
徴とを比較して認識結果を求める。この文字認識部7が
接続される接触文字判定部8は、文字認識部7にて求め
られた認識結果および文字領域の大きさの縦横比により
接触文字であるかどうかの判定を行う。この接触文字判
定部8が接続される射影特徴抽出部9は、接触文字判定
部8にて接触文字と判定された文字領域内の射影特徴を
抽出する。この射影特徴抽出部9が接続される接触文字
分割処理部10は図形特徴抽出部5に接続され、射影特徴
抽出部9にて求められた射影特徴を基に切断点を検出し
て接触文字の分離を行って図形特徴抽出部5に出力す
る。また、接触文字判定部8が接続される認識結果出力
部11は、求められた認識結果を出力していた。
【0004】
【発明が解決しようとする課題】しかしながら、上記従
来の文字切り出し方法では、入力画像中、接触文字と判
断された領域の図7のaに示す画像において、接触文字
と判定された文字領域内に対し、図7のbに示すよう
に、射影特徴としてx軸方向へのヒストグラムを求め、
極小点の値がしきい値以下の点を切断点として、図7の
cに示すように接触文字の分離を行っていた。このよう
に、接触文字を分離する際、多数の切断点が求められて
しまい、従来の方法による文字切り出し認識精度の低下
および多数の切断点による処理時間の増大を招いてい
た。
【0005】本発明は上記従来の問題を解決するもの
で、精度高く切断点を検出して精度高く接触文字の分離
を行うとともに処理時間を短縮することができる文字認
識装置を提供することを目的とする。
【0006】
【課題を解決するための手段】上記課題を解決するため
に本発明の文字認識装置は、認識対象画像として入力し
た2値画像により、黒画素の8連結図形の外接矩形を検
出し、この外接矩形の大きさおよび位置関係により文字
領域を抽出し、この文字領域内の黒画素の分布より図形
特徴を抽出し、この図形特徴と、予め認識対象画像を構
成する文字の図形特徴を記憶している認識辞書からの図
形特徴との照合により認識文字を決定する文字認識装置
であって、認識結果および文字領域の縦横比により接触
文字を判定する接触文字判定部と、前記接触文字判定部
で接触文字と判定された文字領域に対して射影特徴を抽
出する射影特徴抽出部と、前記接触文字判定部で接触文
字と判定された文字領域に対して側面距離特徴を抽出す
る側面距離特徴抽出部と、前記射影特徴および側面距離
特徴に基づいて切断点を検出して接触文字の分離を行
い、この分離結果に基づいて図形特徴を抽出させる接触
文字分割処理部とを備えたものである。
【0007】
【作用】上記構成により、文字認識装置における接触文
字の分離に際して、接触文字と判定された文字領域内の
射影特徴を抽出し、また、接触文字と判定された領域内
の側面距離特徴を抽出し、これら射影特徴および側面距
離特徴に基づいて切断点を検出して接触文字の分離を行
うので、精度高く切断点が検出されて接触文字の分離が
行われ、処理時間も短縮される。
【0008】
【実施例】以下、本発明の一実施例について図面を参照
しながら説明する。なお、従来例と同一の作用効果を奏
するものには同一の符号を付してその説明を省略する。
【0009】図1は本発明の一実施例における文字認識
装置の機能ブロック図である。図1において、文字認識
部7で求められた認識結果および文字領域の大きさの縦
横比より、接触文字であるかどうかの判定を行う接触文
字判定部8が接続される側面距離特徴抽出部21は、接触
文字判定部8にて接触文字と判定された文字領域内の側
面距離特徴を求める。この側面距離特徴抽出部21と射影
特徴抽出部9が接続される接触文字分割処理部22は図形
特徴抽出部5に接続され、射影特徴抽出部9にて求めら
れた射影特徴と、側面距離特徴抽出部21にて求められた
側面距離特徴とを基に切断点を検出して接触文字の分離
を行い、その分離結果を図形特徴抽出部5に出力し、こ
の分離結果に基づいて図形特徴を抽出させる。
【0010】図2は図1の文字認識装置における装置ブ
ロック図である。図2において、スキャナ23は認識対象
文書を2値画像として読み込む。また、中央処理装置
(以下CPUという)24は全体の制御を行う。さらに、
リードオンリメモリ(以下ROMという)25は、CPU
24が全体の制御を行うための制御プログラム26と、全て
の認識対象文字の図形特徴を記憶している認識辞書27と
を記憶している。さらに、ランダムアクセスメモリ(以
下RAMという)28は、スキャナ23にて読み込まれた文
書画像29、文書画像中の外接矩形領域30、文字領域31お
よび認識結果32などを記憶している。さらに、キーボー
ド33はCPU24に対して外部より開始・終了などの指令
を与えるためのものであり、また、出力装置34は認識結
果を出力する。これらスキャナ23、CPU24、ROM2
5、RAM28、キーボード33および出力装置34は内部バ
ス35を介して接続されている。
【0011】以上のように構成された文字認識装置につ
いて、図3の全体フロチャートを用いて、以下、その動
作を説明する。まず、ステップS1で認識対象文書の2
値画像を画像入力部1にて入力して画像格納部2に蓄え
る。そして、ステップS2で、その画像中にて、近傍で
連結している8連結図形の黒画素の集まりを1つの文字
パターンとして、その文字パターンに外接する矩形を外
接矩形検出部3にて求め、内部データとして蓄える。
【0012】さらに、ステップS3で、検出された外接
矩形領域は文字領域抽出部4に送られて外接矩形の大き
さおよび位置関係により文字領域が抽出される。この文
字領域抽出部4では、他の多くの外接矩形に比べ微少で
かつ、その矩形の垂直方向のすぐ近くに矩形が存在する
場合、i,jなどの分離文字とみなし一つの矩形に統合
して文字領域とし、その他の場合には外接矩形を文字領
域として抽出し内部データに蓄える。
【0013】さらに、ステップS4で、抽出された文字
領域は、図形特徴抽出部5に送られ、この領域内の画像
を画像格納部2から取り出し、画像中の黒画素の分布を
図形特徴として抽出する。そして、ステップS5で、抽
出された図形特徴は文字認識部7に送られ、予め全ての
認識対象文字の図形特徴を記憶している認識辞書6から
の図形特徴との比較により、類似した特徴を有する文字
の文字コードおよび類似度を内部データとして蓄える。
【0014】さらに、ステップS6で、求められた認識
結果および外接矩形領域は接触文字判定部8に送られ、
接触文字の判定が行われる。この接触文字判定部8で
は、送られてきた認識結果の類似度の値が低い(すなわ
ち、類似性が低い)、または文字領域の横/縦の比が大
きい文字を接触文字と判定する。接触文字であれば、接
触文字と判定された領域が、射影特徴抽出部9および側
面距離特徴抽出部21に送られ、ステップS7の接触文字
分離処理が行われる。また、接触文字でなければ、内部
データとして認識結果を蓄え、ステップS10で全文字終
了するまでステップS4に戻る。
【0015】ここで、ステップS7の接触文字分離処理
について、図4の接触文字分離チャート、具体例の図5
および図7を用いて説明する。図7のaは入力画像中、
接触文字と判断された領域の画像であり、左上隅を原点
((x,y)=(0,0))とする。まず、射影特徴抽
出部9では、接触文字判定部8にて接触文字と判定され
た領域内の黒画素のx軸方向への射影、すなわち、ステ
ップS71で、縦方向のヒストグラムをとり、接触文字分
割処理部22へ送る。図7のaの画像では、x(0)=
7、x(1)=10、x(54)=3(ただし、x(a)=
bはx座標aにおけるヒストグラムの値がbであること
を示す)となる。この接触文字分割処理部22では、ステ
ップS72で、送られてきた射影特徴の分布の極小点を切
断候補点とする。すなわち、図7のbは、図7のaにお
ける射影特徴の分布を示したものであり、これより、x
=9,19,30,37,46が切断候補点として求められる。
【0016】さらに、側面距離特徴部21では、ステップ
S73で、接触文字判定部8にて接触文字と判断された領
域内の各x座標において、上側および下側の辺から、垂
直に線を伸ばしたときに最初に黒画素が存在するy座
標、すなわち各x座標において、最も低い位置および最
も高い位置に存在する黒画素の座標を抽出して側面距離
特徴とし、接触文字分割処理部22に送る。図7のaにお
ける画像ではx(0)=7、x’(0)=13、x(1)
=6、x’(1)=15、…、x(54)=17、x’(54)
=19(ただし、x(a)=bはx座標aにおける上側の
辺から垂直に線を伸したときに最初に黒画素が存在する
y座標がb、x’(a)=cはx座標aにおける下側の
辺から、垂直に線を伸ばしたときに最初に黒画素が存在
するy座標cであることを示す)となる。接触文字分割
部22では送られてきた側面距離特徴により、ステップS
74で、x座標aにおける黒画素の存在する幅(側面距離
特徴の差分)w(a)を次の式で求め、さらに、この分
布の極小点を、ステップS75で切断候補点とする。
【0017】w(a)=x’(a)−x(a)+1 図7のaの画像ではw(0)=7、w(1)=1、…、
w(54)=3となり、図5のaは、図7のaの画像の側
面距離特徴の差分の分布を示したものであり、これによ
り、x=19,37が切断候補点として求められる。
【0018】さらに、ステップS76で、射影特徴より求
められた切断候補点および、側面距離特徴より求められ
た切断候補点の一致する点を切断点として、ステップS
77で接触文字を分離し、分離された各々の文字領域を内
部データとして蓄える。図5のaの画像における切断点
はx=19およびx=37となり、図5のbに示すように分
離される。
【0019】このように、図3のステップS7における
接触文字分離処理が行われて分離された各々の文字領域
に対して、ステップS4と同様のステップS8の図形特
徴抽出処理、さらに、ステップS5と同様のステップS
9の文字認識処理を行い、内部データとして認識結果を
蓄える。そして、ステップS10で全文字終了したかどう
かを判定し、以上のステップS4〜ステップS9を認識
対象文書内に存在する全ての文字に対して行う。その
後、ステップS11で、認識結果は認識結果出力部11に送
られ、認識対象文書の認識結果を出力する。
【0020】したがって、以上のステップS1〜ステッ
プS11の処理、すなわち、認識対象画像として入力した
2値画像により文字領域抽出部4で抽出された文字領域
内の黒画素の分布より図形特徴抽出部5で抽出された図
形特徴と、予め認識対象画像を構成する文字の図形特徴
を記憶している認識辞書6からの図形特徴との照合によ
り認識文字を決定する文字認識において、認識結果およ
び文字領域の縦横比により接触文字判定部8で接触文字
を判定し、接触文字判定部で接触文字と判定された文字
領域に対して射影特徴抽出部9で射影特徴を抽出し、ま
た、接触文字判定部で接触文字と判定された文字領域に
対して側面距離特徴抽出部21で側面距離特徴を抽出し、
これら射影特徴および側面距離特徴に基づいて接触文字
分割処理部22で切断点を検出して接触文字の分離を行
い、この分離結果に基づいて図形特徴抽出部5で図形特
徴を抽出させるため、精度高く切断点の検出を行って精
度高く接触文字の分離を行うとともに処理時間を短縮で
き、与えられた文書画像の文字認識処理を精度良く迅速
に行うことができる。
【0021】
【発明の効果】以上のように本発明によれば、射影特徴
および側面距離特徴を用いて切断点を検出することによ
り、精度高く接触文字の分離を行うことができるととも
に処理時間も短縮することができる。
【図面の簡単な説明】
【図1】本発明の一実施例における文字認識装置の機能
ブロック図
【図2】図1の文字認識装置における装置ブロック図
【図3】図1の文字認識装置の動作を説明するための全
体フロチャート
【図4】図3における接触文字分離処理の詳細を示すフ
ロチャート
【図5】図3の接触文字分離処理において接触文字が分
離される過程を示す図
【図6】従来の文字認識装置の機能ブロック図
【図7】図6の接触文字分離処理において接触文字が分
離される過程を示す図
【符号の説明】
1 画像入力部 3 外接矩形検出部 4 文字領域抽出部 5 図形特徴抽出部 6 認識辞書 7 文字認識部 8 接触文字判定部 9 射影特徴抽出部 21 側面距離特徴抽出部 22 接触文字分割処理部 23 スキャナ 24 CPU 25 ROM 26 制御プログラム 27 認識辞書 28 RAM 29 文書画像 30 外接矩形領域 31 文字領域 32 認識結果

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】認識対象画像として入力した2値画像によ
    り、黒画素の8連結図形の外接矩形を検出し、この外接
    矩形の大きさおよび位置関係により文字領域を抽出し、
    この文字領域内の黒画素の分布より図形特徴を抽出し、
    この図形特徴と、予め認識対象画像を構成する文字の図
    形特徴を記憶している認識辞書からの図形特徴との照合
    により認識文字を決定する文字認識装置であって、認識
    結果および文字領域の縦横比により接触文字を判定する
    接触文字判定部と、前記接触文字判定部で接触文字と判
    定された文字領域に対して射影特徴を抽出する射影特徴
    抽出部と、前記接触文字判定部で接触文字と判定された
    文字領域に対して側面距離特徴を抽出する側面距離特徴
    抽出部と、前記射影特徴および側面距離特徴に基づいて
    切断点を検出して接触文字の分離を行い、この分離結果
    に基づいて図形特徴を抽出させる接触文字分割処理部と
    を備えた文字認識装置。
JP4295481A 1992-11-05 1992-11-05 文字認識装置 Pending JPH06150062A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4295481A JPH06150062A (ja) 1992-11-05 1992-11-05 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4295481A JPH06150062A (ja) 1992-11-05 1992-11-05 文字認識装置

Publications (1)

Publication Number Publication Date
JPH06150062A true JPH06150062A (ja) 1994-05-31

Family

ID=17821168

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4295481A Pending JPH06150062A (ja) 1992-11-05 1992-11-05 文字認識装置

Country Status (1)

Country Link
JP (1) JPH06150062A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010198308A (ja) * 2009-02-25 2010-09-09 Fujitsu Ltd 文字認識プログラム、文字認識方法および文字認識装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010198308A (ja) * 2009-02-25 2010-09-09 Fujitsu Ltd 文字認識プログラム、文字認識方法および文字認識装置

Similar Documents

Publication Publication Date Title
US6643401B1 (en) Apparatus and method for recognizing character
CN113139445A (zh) 表格识别方法、设备及计算机可读存储介质
JPH0721310A (ja) 文書認識装置
JP2000112599A (ja) 文書画像処理装置及び文書画像処理方法
JPH06150062A (ja) 文字認識装置
JP4281236B2 (ja) 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
US7103220B2 (en) Image processing apparatus, method and program, and storage medium
JP2002170079A (ja) 文書書式識別装置および識別方法
JP3133797B2 (ja) 文字認識方法及びその装置
JP2982221B2 (ja) 文字読み取り装置
JP3095470B2 (ja) 文字認識装置
JP3304512B2 (ja) 表認識装置
JP3052438B2 (ja) 表認識装置
JPH07160810A (ja) 文字認識装置
JPH07168911A (ja) 文書認識装置
JPH11242716A (ja) 画像処理方法および記録媒体
JP3000480B2 (ja) 文字領域区切り検出方法
JP3880091B2 (ja) 情報処理装置及び方法
JPH0855185A (ja) 文字認識装置
JP3517077B2 (ja) パターン抽出装置及びパターン領域の切り出し方法
JP3190794B2 (ja) 文字切り出し装置
JPH09269970A (ja) 文字認識方法とその装置
JPH10214308A (ja) 文字判別方法
JP2003030584A (ja) 文書認識装置、文書画像の領域識別方法、プログラム及び記憶媒体
JPH0628520A (ja) 文字認識装置