JP3379327B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JP3379327B2
JP3379327B2 JP06098496A JP6098496A JP3379327B2 JP 3379327 B2 JP3379327 B2 JP 3379327B2 JP 06098496 A JP06098496 A JP 06098496A JP 6098496 A JP6098496 A JP 6098496A JP 3379327 B2 JP3379327 B2 JP 3379327B2
Authority
JP
Japan
Prior art keywords
character
recognition
reference pattern
recognized
recognition target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP06098496A
Other languages
English (en)
Other versions
JPH09251514A (ja
Inventor
大助 藤野
知也 岡崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP06098496A priority Critical patent/JP3379327B2/ja
Publication of JPH09251514A publication Critical patent/JPH09251514A/ja
Application granted granted Critical
Publication of JP3379327B2 publication Critical patent/JP3379327B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は文字認識方法及びそ
の装置に関するものであり、特にカメラ等で撮像した隣
り合う文字間に重なりや接合を生じた低品質の文字画像
を読みとる文字認識装置に関するものである。
【0002】
【従来の技術】撮像した画像中の文字を読みとる文字認
識装置は、一般に画像から個々の文字パターンを切り出
す文字切り出し部と、切り出された文字パターンを認識
する文字認識部とから構成される。図44はこのような
文字認識装置の一般的な構成を示すものである。
【0003】図において、101は画像入力部であり、
認識対象文字を含む画像を走査し、2値信号で画像メモ
リ102に格納する。103は文字列切り出し部であ
り、オペレータが設定した文字列方向を用いて画像メモ
リ102から認識対象文字を含む文字列を切り出す。1
04は文字切り出し部であり、文字列切り出し部103
で切り出した文字列画像から認識対象文字を1文字ずつ
矩形領域として切り出す。105は認識対象の文字に対
応した基準パターンを格納した認識辞書を記憶する辞書
メモリである。106は文字認識部であり、文字切り出
し部104で切り出された各文字の矩形領域を辞書メモ
リ105に格納された基準パターンと照合することによ
り最も似た文字を認識結果とする。107は認識結果出
力部であり、文字認識部106の認識結果をディスプレ
イや他の装置に出力する。
【0004】次に動作について、図45の入力画像11
0を例に説明する。画像入力部101から入力した画像
110は、文字を形成する値「1」の画素(以下「黒画
素」と称す)、文字を除く背景の値「0」の画素(以下
「白画素」と称す)として2値化され画像メモリ102
に蓄えられる。図46において、文字切り出し部103
ではこの入力画像のあらかじめ指定された領域111に
ついて指定された文字列方向(この場合X方向)に走査
し、各走査ラインごとに黒画素を計数しY方向のヒスト
グラム120を求め、このヒストグラムの連続するY方
向の黒部分121、122の両端のY座標から文字列に
外接する矩形領域123、124を抽出する。
【0005】次に図47において、文字切り出し部10
4では、以上のように文字列切り出し部103で文字列
として抽出された矩形領域の各々に対して、まず矩形領
域123について、文字列方向とは垂直方向(この場合
Y方向)に走査し、各走査ラインごとに黒画素を計数し
X方向のヒストグラム130を求め、このヒストグラム
の連続するX方向の黒部分131、132、133、1
34の両端のX座標から各文字に外接する矩形領域13
5、136、137、138を抽出する。続いて矩形領
域124についても同様な処理を行い、対象文字に外接
する矩形領域を抽出する。
【0006】以上のように抽出された対象文字に外接す
る矩形領域の各々に対して、文字認識部106は図48
に示すように辞書メモリ105に格納された認識対象と
なる全ての文字の基準パターンと照合することにより最
も類似度の高い文字を認識結果とする。
【0007】
【発明が解決しようとする課題】従来の文字認識装置は
以上のように構成されていたため、文字認識部が各文字
を認識するためには、文字認識部において認識対象とな
る文字が確実に1つの矩形領域として切り出されてい
る、すなわち、撮像された文字が各々明確に分離されて
いる必要があった。
【0008】しかし、文字の配列によっては図4に示す
ように文字列方向とは垂直に文字が重なったり、あるい
は隣り合う文字が接合する場合があり、この場合は図4
の矩形領域42、43に示す如くヒストグラムからの各
文字の切り出しは困難であった。また、文字がきわめて
接近している場合は、画像入力部の解像度やノイズの影
響等によって隣り合う文字がくっついてしまうときがあ
り、この場合においてもヒストグラムからの個々の文字
の切り出しは困難であった。
【0009】そこで、重なりを持つ複数の文字を外接す
る矩形領域に対して、隣り合う文字間の背景領域の連結
性を調べて文字を分離する技術が提案されており、例え
ば特公平7ー046371に開示された技術がある。し
かし、このような従来技術によって文字列方向と直角に
重なった重なり文字の分離は可能であるが、接合文字に
対しては隣り合う文字を分離する背景領域が無いため個
々の文字領域を特定することは不可能であるという問題
があった。
【0010】この発明はこのような問題を解決するため
に為されたもので、隣り合う文字間に”重なり”や”接
合”があっても統一的な方法で文字の認識が可能である
文字認識装置を得ることを目的とする。
【0011】
【課題を解決するための手段】本発明に係わる文字認識
装置においては、認識対象文字を含む画像を入力する画
像入力部と、この画像入力部で入力した画像を文字列方
向に走査して生成した画素濃度ヒストグラムにより文字
列を切り出す文字列切り出し部と、この文字列切り出し
部で切り出した文字列画像を前記文字列と直角方向に走
査して生成した画素濃度ヒストグラムを用いて認識対象
文字を含む矩形領域を切り出す文字切り出し部と、この
文字切り出し部で切り出した前記矩形領域を認識対象文
字の基準パターンと比較することにより認識対象文字を
認識する第1の文字認識部と、この第1の文字認識部で
認識されなかった前記矩形領域と認識対象文字の基準パ
ターンとをこの基準パターンの位置をずらしながら比較
することにより、認識対象文字の基準パターンと類似度
の高い文字を認識対象文字の候補として基準パターンの
位置と共に抽出し、この抽出された複数の認識対象文字
の候補をその位置の出現順に並べ替えることにより認識
対象文字を認識する第2の文字認識部と、を備え、前記
第2の文字認識部は、文字列方向に隣り合う文字間に重
なりや接合を生じる可能性の有る部分をマスキングした
認識対象文字の基準パターンを用いて認識対象文字を認
識するものである。
【0012】又、本発明に係わる文字認識装置は、認識
対象文字を含む画像を入力する画像入力部と、この画像
入力部で入力した画像を文字列方向に走査して生成した
画素濃度ヒストグラムにより文字列を切り出す文字列切
り出し部と、この文字列切り出し部で切り出した文字列
画像を前記文字列と直角方向に走査して生成した画素濃
度ヒストグラムを用いて認識対象文字を含む矩形領域を
切り出す文字切り出し部と、この文字切り出し部で切り
出した前記矩形領域を認識対象文字の基準パターンと比
較することにより認識対象文字を認識する第1の文字認
識部と、前記認識対象文字の基準パターンを文字列と直
角方向で矩形領域の上下に連なる線要素の存在の有無で
分類し、前記第1の文字認識部で認識されなかった前記
矩形領域と前記線要素の存在しない認識対象文字の基準
パターンとをこの基準パターンの位置をずらしながら比
較することにより、認識対象文字の基準パターンと類似
度の高い文字を認識対象文字の候補として基準パターン
の位置と共に抽出するとともに、前記第1の文字認識部
で認識されなかった矩形領域の文字列と前記前記線要素
の存在する認識対象文字の基準パターンとを重ね合わせ
ることにより、認識対象文字の基準パターンと類似度の
高い文字を認識対象文字の候補として基準パターンの位
置と共に抽出し、この抽出された複数の認識対象文字の
候補をその位置の出現順に並べ替えることにより認識対
象文字を認識する第2の文字認識部と、を備えたもので
ある。
【0013】又、本発明に係わる文字認識装置は、認識
対象文字を含む画像を入力する画像入力部と、この画像
入力部で入力した画像を文字列方向に走査して生成した
画素濃度ヒストグラムにより文字列を切り出す文字列切
り出し部と、この文字列切り出し部で切り出した文字列
画像を前記文字列と直角方向に走査して生成した画素濃
度ヒストグラムを用いて認識対象文字を含む矩形領域を
切り出す文字切り出し部と、この文字切り出し部で切り
出した前記矩形領域を認識対象文字の基準パターンと比
較することにより認識対象文字を認識する第1の文字認
識部と、この第1の文字認識部で認識されなかった前記
矩形領域の一方の端に認識対象文字の基準パターンを重
ね合わせて認識対象文字を認識し、更にこの認識された
認識対象文字を前記矩形領域から除いた残りの矩形領域
の前記矩形領域の一方の端と同じ側の端に認識対象文字
の基準パターンを重ね合わせることにより認識対象文字
を順次認識する第2の文字認識部と、を備え、前記第2
の文字認識部は、認識すべき矩形領域の一方の端に文字
列と直角方向に走査して生成した画素濃度ヒストグラム
の高い位置が存在するときは、認識対象文字の基準パタ
ーンの内で文字列と直角方向で前記矩形領域の上下に連
なる線要素の存在する認識対象文字の基準パターンを重
ね合わせて認識対象文字を認識し、認識すべき矩形領域
の一方の端に文字列と直角方向に走査して生成した画素
濃度ヒストグラムの高い位置が存在しないときは、認識
対象文字の基準パターンの内で文字列と直角方向で前記
矩形領域の上下に連なる線要素の存在しない認識対象文
字の基準パターンを重ね合わせて認識対象文字を認識す
るものである。
【0014】
【発明の実施の形態】実施の形態1. 本発明による第1の実施の形態を図1〜図11により説
明する。図1は本発明による第1の実施の形態である文
字認識装置の要部構成を示す。図において、1は画像入
力部であり、認識対象文字を含む画像を走査し、2値信
号で画像メモリに2格納する。3は文字列切り出し部で
あり、オペレータが設定した文字列方向を用いて画像メ
モリ2から認識対象文字を含む文字列を切り出す。4は
文字切り出し部であり、文字列切り出し部3で切り出し
た文字列画像から認識対象文字を1文字ずつ矩形領域と
して切り出す。5は認識対象の文字に対応した基準パタ
ーンを格納した認識辞書を記憶する辞書メモリである。
6は第1の文字認識部、7は第2の文字認識部であり、
文字切り出し部4で切り出された各文字の矩形領域を辞
書メモリ5に格納された基準パターンと照合することに
より最も似た文字を認識結果とする。8は認識結果出力
部であり、第1の文字認識部6及び第2の文字認識部7
の認識結果をディスプレイや他の装置に出力するもので
ある。
【0015】次に動作について、図2の入力画像10を
例に説明する。画像入力部1から入力した画像10は、
文字を形成する値「1」の画素(以下「黒画素」と称
す)、文字を除く背景の値「0」の画素(以下「白画
素」と称す)として2値化され画像メモリ2に蓄えられ
る。図3において、文字切り出し部3ではこの入力画像
のあらかじめ指定された領域11について指定された文
字列方向(この場合X方向)に走査し、各走査ラインご
とに黒画素を計数しY方向のヒストグラム20を求め、
このヒストグラムの連続するY方向の黒部分21の両端
のY座標から文字列に外装する矩形領域23を抽出す
る。
【0016】次に図4において、文字切り出し部4で
は、以上のように文字切り出し部3で文字列として抽出
された矩形領域23について、文字列方向とは垂直方向
(この場合Y方向)に走査し、各走査ラインごとに黒画
素を計数しX方向のヒストグラム30を求め、このヒス
トグラムの連続するX方向の黒部分31、32、33、
34、35の両端のX座標から矩形領域41、42、4
3、44、45を抽出する。
【0017】以上のように抽出された矩形領域の各々に
対して、第1の文字認識部6は辞書メモリ5の内容を参
照しながら図5に示す処理フローによって文字の認識を
行う。図6は辞書メモリの内容であり、認識対象のn個
の文字カテゴリについて基準パターンおよびその横サイ
ズ、縦サイズが記録されている。以下、図5の処理フロ
ーについて説明する。
【0018】認識対象文字パターンを図7(a)の矩形
領域41とする。まず、ステップS101において幅W
1、高さH1である文字パターンを幅W、高さHの基準
サイズに正規化する。これを図7(b)に示す矩形領域
41’とする。
【0019】次にステップS102で辞書メモリ5に格
納されたi番目(最初はi=1)の認識対象のカテゴリ
を取り出しその基準パターンの縦横比と、切り出した文
字パターンの縦横比の比 R=(H1/W1)/(hi/wi) (1) をチェックする。R=1ならば切り出した文字パターン
と基準パターンとの縦横比が等しい。Rが1よりも定め
られた値以上離れている場合は切り出した文字パターン
と基準パターンの形がかけ離れたものとしてステップS
105に進み、類似度=0として記録する。それ以外の
場合はステップS103以下の類似度の計算を行う。
【0020】ステップS103では幅wi、高さhiで
ある文字パターンを幅W、高さHの基準サイズに正規化
する。
【0021】ステップS104では縦H、横Wにそれぞ
れ正規化された切り出した文字パターンと基準パターン
とを重ね合わせ両者の類似度を求め記録する。ここで正
規化された切り出した文字パターンをP、正規化された
基準パターンをQとすると、 P=[Pij]、Q=[Qij] (i=1〜W,j=1〜H) としたとき、類似度は次に示すSで表されるものであ
る。
【0022】
【数1】
【0023】ステップS106で認識対象の全てのカテ
ゴリについて類似度を求めたかを調べ(i=n?)、
「No」であればステップS102に戻り次の基準パタ
ーンについて類似度を求める。
【0024】全てのカテゴリについて類似度を求めた記
録は図8のようになる。ステップS107ではこの記録
から類似度が基準値以上で最も高い値を持つカテゴリが
あるかを調べ、該当するカテゴリがあればそのカテゴリ
を切り出した文字パターンの認識結果とする(ステップ
S108)。図8の場合、カテゴリ「E」がその認識結
果となる。ステップS107で該当する類似度がない場
合はステップS109で認識不可(認識結果を「リジェ
クト」)とする。
【0025】以上の処理を繰り返して、切り出した文字
パターン全てについて認識結果を求め、矩形領域41、
44、45の文字パターンはそれぞれ「E」、「O」、
「R」と認識される。しかし、重なりや接合を生じて切
り出された矩形領域42、43の文字パターンについて
は、ステップS102でパターンサイズの縦横比が規定
外となるか、又はパターンサイズを正規化して類似度を
求めても低い値となるので、認識不可となる。ここで、
矩形領域と文字パターンとは同じ意味で用いる。
【0026】このように認識不可となった切り出し文字
パターンの各々対して、第2の文字認識部7は図9に示
すフローによって認識処理を行う。以下、図9の処理フ
ローについて説明する。
【0027】認識対象文字パターンを図4の矩形領域4
2とする。まず、ステップS201において幅W42、
高さH42である文字パターンを、高さHの基準サイズ
に正規化し、幅は高さ正規化と同じ変倍率H/H42で
変倍する。
【0028】次に、ステップS202で辞書メモリ5に
格納されたi番目(最初はi=1)の認識対象のカテゴ
リを取り出しその高さhi、幅wiである基準パターン
を高さHの基準サイズに正規化し、幅は高さ正規化と同
じ変倍率H/hiで変倍する。
【0029】次に、ステップS203では高さHに正規
化した基準パターンを、高さHに正規化した切り出しパ
ターンの左端に重ねて類似度を求め、順次基準パターン
を右に動かしながら各位置における類似度を求めながら
切り出しパターンの右端まで移動する。このときの切り
出しパターンのサイズをH×Wc、基準パターンのサイ
ズをH×Wdとすれば、各位置x(切り出しパターンの
左端をx=0とする)における類似度S(x)は次式で表
される。
【0030】
【数2】
【0031】ここで、Pij(i=1〜Wc,j=1〜
H)は正規化された切り出しパターン、Qij(i=1〜
Wd,j=1〜H)は正規化された基準パターンであ
る。
【0032】以上のように求められた各位置における類
似度S(x)に対して、ステップS205ではS(x)の値
が基準値以上であるかどうかを調べ、基準値以上であれ
ば、その位置xとカテゴリとを記録する。そうでなけれ
ば何もせずにステップS206に進む。
【0033】ステップS206で認識対象の全てのカテ
ゴリについて処理を行ったかを調べ(i=n?)、もし
「No」であればステップS102に戻り次の基準パタ
ーンについて類似度を求める。
【0034】全てのカテゴリについて処理を終えた記録
は図10のようになる。即ち、カテゴリ「E」は位置x
2において高い類似度を示し、カテゴリ「L」は位置x
1において高い類似度を示すが、他のカテゴリは全領域
にわたって基準値未満の低い類似度となる。ステップS
207では、この記録から位置xの小さい順にカテゴリ
の編集を行い、切り出しパターンの矩形領域42の認識
結果を「LE」とする。
【0035】以上の処理によって、第1の文字認識部6
で認識されなかった残りの切り出し領域についても、同
様に第2の文字認識部7で認識処理が行われる。切り出
した矩形領域43に対してはステップS207までに図
11のような記録が得られ、これを編集して認識結果
「VAT」が得られる。
【0036】そして、認識結果出力部8では以上のよう
に認識された文字認識結果をディスプレイその他の処理
装置に出力する。
【0037】このように、複数の文字を含む切り出し領
域の高さをHに規格化し、この上に高さHに規格化した
規準パターンを重ね、左端から右へ順に規準パターンを
動かしながら各位置における類似度を求めるので、個々
の文字を切り出すことができなくても、直接文字の認識
が可能となる。又、文字列の全領域ではなく、個々の文
字認識が不可能であった切り出し領域のみに規準パター
ンを重ねて移動しながら類似度を求めるので、処理の高
速化が図れる。
【0038】実施の形態2. 次に、本発明による第2の実施の形態を図12〜図18
により説明する。この実施の形態による文字認識装置の
構成を図12に示す。本発明は認識対象文字としてある
文字パターンの一致度が他の文字パターンの一部に対し
て高い値を示すような文字を含んでいる場合に対応し、
図12は第1の実施の形態を示す図1と同一構成をとる
が、第2の文字認識部7aの処理内容が異なる。他の構
成部の処理内容は実施の形態1と同様であるため、第2
の文字認識部7aの処理内容のみ以下に説明する。図1
3は第2の文字認識部7aの処理フローを示す。
【0039】認識対象文字パターンを図4の矩形領域4
1の例で説明する。ここで辞書メモリ5には文字パター
ンの一致度が他の文字パターンの一部に対して高い値を
示すような文字として「I」が含まれている(図1
4)。
【0040】図13のステップS301〜S304は、
それぞれ図9のステップS201〜S204の処理と同
様である。ステップS304で求められた各位置におけ
る類似度S(x)に対して、ステップS305ではS(x)
の値が基準値以上であるかどうか調べ、それが基準値以
上であれば、その文字カテゴリと位置x、および基準パ
ターンの右端の位置を記録する。
【0041】ステップS306のループ処理で全ての文
字カテゴリについて処理をおこなう。ここで文字カテゴ
リ「I」の基準パターンについては、切り出し領域の文
字パターンの「L」の左端および「E」の左端に重ねた
とき、類似度S(x)が大きな値となるため(図15)、
最終的な記録は図16のように4つの文字が抽出され
る。
【0042】ステップS307では上記の記録から、同
時には存在し得ない文字を識別する。すなわち、4つの
抽出された文字の存在範囲を図示すれば図17のように
なるため,No.2の「I」はNo.4の「L」に内包
されることになり、両者は排他的と判定する。同様にN
o.3の「I」はNo.2の「E」に内包されるため、
両者は排他的であると判定する。
【0043】ステップS308では、上記の判定結果お
よび各文字の位置関係から可能性のある文字列の組み合
わせとその存在範囲を計算する。この場合の発生する組
み合わせは以下に示す(a)〜(d)となる。 (a)No.4の「L」×No.3の「I」 (b)No.4の「L」×No.1の「E」 (c)No.2の「I」×No.3の「I」 (d)No.2の「I」×No.1の「E」 そして、その存在範囲は図18(a)〜(d)の太線で
示した領域である。
【0044】ステップS309では、上記のように求め
られた文字の存在範囲を切り出し領域の存在範囲と比較
し最も一致度の高い文字の組み合わせを選択して認識結
果とする。例えば、図18において、切り出し領域を示
す太線部の長さと、(a)〜(d)の存在範囲を示す太
線部(x1とx2の和)の長さとを比較し、これらの太
線部の長さが近いほど一致度が高いものとなる。この実
施の形態の場合は、図18から(b)の組み合わせの
「EL」が認識結果となる。
【0045】このように、複数の文字を含む一つの切り
出し領域から、位置関係が排他的である複数の文字が抽
出されたときは、可能な文字の組み合わせを生成し、そ
れらの文字の存在する範囲と切り出し領域の範囲とを比
較し、切り出し領域の範囲に最も近い存在範囲を有する
文字の組み合わせを認識すべき文字の組み合わせとする
ので、誤認識の少ない文字認識が可能となる。
【0046】実施の形態3. 次に、本発明による第3の実施の形態を図19〜図21
により説明する。この実施の形態による文字認識装置の
構成を図19に示す。図19は実施の形態1の図1と同
一構成をとるが、文字切り出し部4aの処理内容、辞書
メモリ5aの内容、および第2の文字認識部7bの処理
内容が異なる。他の構成部の処理内容は実施の形態1と
同様であるため、上記の相違点のみを以下に説明する。
【0047】文字切り出し部4aでは、文字切り出し部
3で文字列として抽出された矩形領域23(図3を参
照)について、文字列方向とは垂直方向(この場合Y方
向)に走査し、各走査ラインごとに黒画素を計数しX方
向のヒストグラム30を求め、このヒストグラムの連続
するX方向の黒部分31、32、33、34、35の両
端のX座標から、矩形領域41、42、43、44、4
5を抽出すると共に、このヒストグラムの値H(x)が
文字列高さとなる位置をそれぞれ記録する(図4のx1
〜x5を参照)。矩形領域41〜45の該当する位置は
それぞれ次のようになる。即ち、矩形領域41ではx
1、矩形領域42ではx2及びx3、矩形領域43では
x4、矩形領域44ではなし、矩形領域45ではx5と
なる。
【0048】又、辞書メモリ5aの内容は図20に示す
如くであり、大きく2つに分類されている。一つの分類
は文字パターン左端に上下に連なる縦線要素が有る
「B,D,E,F,・・・」であり、他の分類はそのよ
うな縦線要素が無い「A,C,G,J,・・・」であ
る。
【0049】第2の文字認識部7bでは、第1の文字認
識部6で認識不可だった矩形領域42、43の認識を行
う。ここで第2の文字認識部7bの処理フローを図21
に示す。
【0050】ステップS401、S402は、図9のス
テップS201、S202と同様である。ステップS4
031では、比較しようとする基準パターンが縦線を持
つ分類Aに属するか縦線を持たない分類Bに属するかを
チェックし、分類Aに属するならばステップS4032
にすすみ、分類Bに属するならばステップS4033に
進む。
【0051】ステップS4033では、高さHに正規化
した基準パターンの左端を、高さHに正規化した切り出
しパターンの縦線位置に合わせて、各位置における類似
度を求める。切り出した矩形領域42の場合、図4に示
す縦線位置x2に当たる領域、縦線位置x3に当たる領
域に基準パターンを合わせて各位置における類似度を求
める。すなわち式(3)におけるS(x2),S(x3)を
求める。
【0052】ステップS4032では、高さHに正規化
した基準パターンを高さHに正規化した切り出しパター
ンの左端に重ねて類似度を求め、順次基準パターンを右
に動かしながら各位置における類似度を求め切り出しパ
ターンの右端まで移動する。すなわち式(3)における
S(x)をxを必要範囲で変化させながら計算する。
【0053】ステップS404以降の処理は、図9にお
けるステップS204以降の相当する処理と同様であ
る。
【0054】上記のステップS4033における処理で
は、縦線のある分類Aに属する基準パターンに対して切
り出し領域の縦線のある位置でのみ類似度を求めている
が、その他の位置では類似度が高い値を示さないことは
明確であり、本方式で類似度の高い文字を正確に抽出す
ることができる。したがって、計算コストの高い類似度
の計算の回数を大幅に減らして処理時間の短縮が図れ
る。
【0055】実施の形態4. 次に、本発明による第4の実施の形態を図22〜図25
により説明する。この実施の形態は撮像した認識対象文
字の字体が登録した認識対象文字の基準パターンに対し
て縦横異倍率の字体(いわゆる「長体」・「平体」)の
場合に対応する。この実施の形態の文字認識装置の構成
を図22に示す。図22は実施の形態1の図1と同一構
成をとるが、第1の文字認識部6aと第2の文字認識部
7cの処理内容が異なる。他の構成部の処理内容は実施
の形態1と同様であるため、第1の文字認識部6aと第
2の文字認識部7cの処理内容のみを以下に説明する。
【0056】図23に第1の文字認識部6aの処理フロ
ーを示す。ステップS501では、切り出したパターン
全てに対して実施の形態1の第1の文字認識部6と同様
の処理により矩形領域41、44、45の文字パターン
がそれぞれ「E」、「O」、「R」と認識され、矩形領
域42、43の文字パターンは認識不可となる。ここで
切り出された文字パターンと辞書に登録された基準パタ
ーンの縦横比が異なっていても、両者を基準サイズ縦
H,横Wに正規化して類似度を求めるので縦横比が異な
ることの影響は受けずに認識が実行される。
【0057】次に、ステップS502では、認識された
各文字に対して、切り出した矩形領域の縦横比と基準パ
ターンの縦横比の比を求め、それらの平均を求める。こ
れは切り出した矩形領域の縦サイズをHi、横サイズを
Wi、そして基準パターンの縦サイズをhi、横サイズ
をwiとすれば、両者の縦横比は、 ki=(hi・Wi)/(Hi・wi) で与えられ、この縦横比kiは、 hi/(ki・wi)=Hi/Wi の関係式から分かるように、認識された基準パターンに
対して横サイズをki倍すれば対応する切り出しパター
ンと縦横比の等しいパターンが得られるという倍率であ
る。この比kiの平均値kを求める。そして、m個の文
字が認識されたとき、この縦横比kiの平均値は次式で
求めることができる。
【0058】
【数3】
【0059】次に、第1の文字認識部6aで認識不可と
なった切り出した矩形領域の文字パターンの各々に対し
て、第2の文字認識部7cは図24に示すフローによっ
て認識処理を行う。以下、図24の処理フローについて
説明する。
【0060】認識対象文字パターンを図25(a)の矩
形領域42aとする。まず、ステップS601におい
て、幅Wa,高さHaである文字パターンを、高さHの
基準サイズに正規化し、幅は高さを正規化した時と同じ
変倍率H/Haで変倍する(図25(b))。
【0061】次に、ステップS602で、辞書メモリ5
に格納されたi番目の認識対象カテゴリをとりだし、そ
の高さhi、幅wiである基準パターンを、まず高さを
Hの基準サイズに正規化し、幅は、高さを正規化した変
倍率H/hiに(4)式のkを乗じた倍率で変倍する。
これによって基準パターンは高さがHで撮像した文字パ
ターンの縦横比と等しいパターンに変換される。i番目
の認識対象カテゴリが「L」のとき変換パターンは図2
5(c)から(d)に変換される。
【0062】次に、ステップS603では、上記のよう
に変換した基準パターンを、高さHに正規化した切り出
しパターンの左端に重ねて類似度を求め、順次変換パタ
ーンを右に動かしながら各位置における類似度を求め、
切り出しパターンの右端まで移動する。このときの類似
度S(x)の算出方法は上述の式(3)に準じる。
【0063】又、ステップS604以降の処理は、図9
のステップS204以降の対応する処理と同様であるた
め説明を省略する。
【0064】以上のように本実施の形態においては、基
準パターンに対して縦横比の異なる文字(長体・平体)
を入力した場合にも、第1の文字認識部6aで両者の縦
横比の比を求め、第2の文字認識部7cではこの比を用
いて基準パターンを入力した文字と同じ縦横比に変換し
て類似度を求めているので、基準パターンと縦横比の異
なる文字が重なり・接合を生じた場合にも良好な文字認
識結果が得られる。
【0065】実施の形態5. 次に、本発明による第5の実施の形態を図26〜図31
により説明する。実施の形態1では、例えば、図26に
示す切り出した矩形領域43を第2の文字認識部7で認
識する際、対象文字「A」の基準パターンを切り出した
矩形領域43に重ねたとき、図に示すように隣接する文
字の一部が重ね合わせた領域に入り込んで、その結果計
算した類似度が若干低くなる可能性がある。本実施の形
態では、このような類似度の低下を防止することを目的
としている。本実施の形態の文字認識装置の構成を図2
7に示す。図27は実施の形態1の図1と同一構成をと
るが、辞書メモリ5bの内容と第2の文字認識部7dの
処理内容が異なる。他の構成部の処理内容は実施の形態
1と同様であるので、上記の相違点のみを以下に説明す
る。
【0066】辞書メモリ5bの内容を図28に示す。図
28の内容は図6に示した内容にマスクパターンを付加
したものとなっている。このマスクパターンは、図29
に示すように基準パターンの領域のうち隣接する文字と
重なりや接合を生ずる可能性のある部分を値「0」と
し、他の領域(図29の網掛け部)を値「1」としたも
のである。
【0067】次に、第2の文字認識部7dの処理内容に
ついて説明する。図30は第2の文字認識部7dの処理
フローである。全体の処理内容は図9の処理と同様であ
りステップS702の類似度の計算方法のみ異なる。し
たがって処理の流れについては説明を省略し、ステップ
S702の類似度の計算方法について説明する。
【0068】ここでは類似度S(x)は以下の式によって
計算される。
【0069】
【数4】
【0070】ここで、R=[Rij]は基準サイズに正
規化されたマスクパターンであり、式(5)は切り出し
パターンと基準パターンの類似度を求めるとき、マスク
パターンの値が1となる領域(Rij=1)にのみ着目し
て類似度を計算することを意味する。従って、例えば図
31において「A」の基準パターンを切り出した矩形領
域43に重ねるとき、本来「A」を抽出する位置におい
て網掛けで示したマスクパターンが値1の領域のみを比
較の対象とするため、隣接する文字パターンの重なり部
分の影響を受けずに類似度を求めることができる。
【0071】以上のように本実施の形態においては、重
なりや接合を生じる可能性のある部分をマスクして類似
度を計算するようにしたため、とくに重なりや接合の幅
が大きい場合でも安定して個々の文字を抽出し認識する
ことが可能となる。
【0072】実施の形態6. 次に、本発明による第6の実施の形態を図32〜図36
により説明する。第6の実施の形態の文字認識装置の構
成を図32に示す。図32は第1の実施の形態の図1と
同一構成をとるが、第2の文字認識部7eの処理内容が
異なる。他の構成部の処理内容は実施の形態1と同様で
あるため、第2の文字認識部7eの処理内容のみを以下
に説明する。
【0073】図33に第2の文字認識部7eの処理フロ
ーを示す。認識対象文字パターンを図4の43の例で説
明する。ステップS801では、処理対象の矩形領域を
縦サイズが基準高さHとなるように変倍し、横サイズは
縦サイズと同じ倍率で変倍する。このように縦サイズH
で正規化された矩形領域をAとする(図34(a)参
照)。次にステップS802で文字検出番号jをj=
1、文字検出位置xcをxc=0に初期化する。ここで文
字検出番号jはこれから検出する文字が矩形領域Aの左
から何番目に当たるかを示し、文字検出位置xcは文字
検出対象の領域が矩形領域Aの左端を原点として座標値
xcから始まることを表すものである。
【0074】ステップS803より、図14に示す辞書
メモリ5の内容と矩形領域Aの内容を比較し文字の抽出
を行う。まず、ステップS803で、文字カテゴリ番号
iをi=1で初期化し、ステップS804で文字カテゴ
リ番号iの基準パターン(i=1のとき、図14では文
字カテゴリ「A」の基準パターン)を縦サイズが基準高
さHとなるように変倍し、横サイズは縦サイズと同じ倍
率で変倍する。このように縦サイズHで正規化された文
字カテゴリ番号iの基準パターンをPiとする。
【0075】次に、ステップS805では、文字検出番
号jの値を調べ、j=1(最初の文字検出)であれば、
ステップS806で、矩形領域Aと基準パターンPiの
類似度Si=S(x)を求める。類似度S(x)の内容は式
(3)で与えられる。ここではx=xc(=0)とし
て、図34(b)に示すように矩形領域Aの左端に基準
パターンPiの左端を合わせて両者の類似度S(x)を求
める。そして、ステップS808で、文字カテゴリ番号
i,文字検出座標xi、求めた類似度Si、及び正規化さ
れたカテゴリ番号iの基準パターンPiの横サイズwni
を記録する。
【0076】次に、ステップS809で、辞書メモリ5
に登録されている全て(n個)の文字カテゴリについて
処理を行ったかどうか(j=n?)をチェックし、「n
o」であれば、ステップS810で、文字カテゴリ番号
iを増分し、次の文字カテゴリを対象としてステップS
804へ戻る。以上の手順で矩形領域Aの左端(x=x
c=0)に全ての文字カテゴリの正規化パターンを重ね
合わせて、それぞれの類似度を求め、ステップS808
で必要項目を記録する。全ての文字カテゴリについて処
理を行った後の類似度記録内容は図35の如くであり、
各文字カテゴリ(1≦i≦n)について、文字カテゴリ
番号i、文字検出座標xi(j=1においてはxi=xc
=0)、類似度Si、及び正規化基準パターンPiの横サ
イズwniが記録されている。
【0077】全ての文字カテゴリについて処理を行った
ら(i=n)、ステップS809でループを抜けて、ス
テップS811で、類似度記録内容をチェックし、設定
した基準値以上の類似度Siがあれば、ステップS81
2で、類似度Siの最大値を与える文字カテゴリをj文
字目の認識結果とする。本実施の形態では文字カテゴリ
番号i=22のカテゴリ「V」が類似度最大となり、j
=1文字目の認識結果として選ばれる。このときの、文
字検出位置をxj、正規化基準パターンの横サイズをwj
とする(図34(c)参照)。
【0078】次に、ステップS813で、文字検出座標
xcを、xj+wj→xcとして、更新する(図34
(d))。ステップS814では、このときの矩形領域
Aの残エリアである図34(d)の距離Rをチェック
し、距離Rが基準値以上であれば、まだ検出すべき文字
があるとして、ステップS815で、文字検出番号jを
増分し、ステップS803に戻り、同様の手順で次の文
字を検出していく。j=2では、図34(e)に示すx
cを基準位置として、矩形領域Aと各文字カテゴリの正規
化基準パターンの類似度を求めることになる。
【0079】類似度を求める手順中、2文字目以降(文
字検出数j≧2)では、ステップS805においてステ
ップS807に分岐する。ステップS807において
は、矩形領域Aと基準パターンPiの類似度を Si=max{S(x)} (xc−ε1≦x≦xc+ε2) によって求める。これは(5)式のS(x)をxc−ε1
≦x≦xc+ε2の微小な範囲で変化させて求め、その最
大値を類似度Siとする。また、その最大値を与えるx
をxiとする。ここでxの値を変化させるのは、j−1
文字目に検出した文字の右端を基準とするj文字目の文
字検出座標xcに対して、図36(a)に示すように重
なりのある文字や、図36(b)に示すように接合のあ
る文字を検出するためで、ε1、ε2にはあらかじめ適当
な値をセットしておく。
【0080】以上の処理により、矩形領域Aに対して左
からj=1,2,・・・番目の文字が順次抽出され、ス
テップS813で、矩形領域Aの残エリアが無いと判断
された時点でステップS816に移行し、認識結果を編
集して処理を終了する。本実施の形態においては、認識
結果として「VAT」の文字列が編集される。なお、ス
テップ811で基準値以上の類似度Siが無い場合はそ
の認識検出番号において認識不可として、ステップ81
6で例えば「V?」(「?」は認識不可を表す。)など
の認識結果が編集される。
【0081】このように、複数の文字を含む切り出し領
域に対して、切り出し領域の左端に規準パターンを重ね
て類似度を求めることにより第1の文字を抽出し、この
第1の文字を切り出した残りの領域の左端に規準パター
ンを重ねて同様にして第2の文字を抽出し、これを繰り
返して順次文字を抽出するので、個々の文字を切り出す
ことができなくても、直接文字の認識が可能となる。
【0082】実施の形態7. 次に、本発明による第7の実施の形態を図37〜図40
により説明する。第7の実施の形態の文字認識装置の構
成を図37に示す。本実施の形態は認識対象文字として
ある文字パターンの一致度が他の文字パターンの一部に
対して高い値を示すような文字を含んでいる場合に対応
し、図37は第6の実施の形態の図32と同一構成をと
るが、第2の文字認識部7fの処理内容が異なる。他の
構成部の処理内容は第6の実施の形態と同様であるた
め、文字認識部7fの処理内容のみを以下に説明する。
【0083】図38に第2の文字認識部7fの処理フロ
ーを示す。本処理フローは図33のフローで示した第6
の実施の形態の処理と同様な流れであり、認識対象の矩
形領域の左から順に文字を抽出していく。相違点はステ
ップS911の基準値以上の類似度Siが有るかどうか
をチェックする処理である。ここで該当する類似度の個
数が「2個以上」、「1個」、「無し」によって処理が
分岐し、「2個以上」の場合において、いずれの文字カ
テゴリを認識結果として採用するかを決めるステップS
917の処理が付加したものとなる。「1個」、「無
し」の場合はそれぞれ図33のステップS811におけ
る「yes」「no」の分岐と同一である。ステップS
917では、類似度が基準値以上の複数の文字カテゴリ
に対して、各々の文字カテゴリを認識結果として仮定し
たときに、その仮定した文字パターンの右側に適正な文
字認識結果が得られるかによって認識結果を選択する。
以下にステップS917の処理内容について説明する。
【0084】認識対象文字パターンを図4の矩形領域4
2の例で説明する。ステップS901で、矩形領域42
を縦サイズHで正規化したパターンをAとする。ここ
で、辞書メモリ5には文字パターンの類似度が他の文字
パターンの一部に対して高い値を示すような文字として
「I」が含まれている(図14参照)。文字カテゴリ
「I」の基準パターンは矩形領域Aの左にあるパターン
「L」の左端の縦線と一致度が高いため、ステップS9
11の時点でステップS908において記録された内容
は図39の如くである。カテゴリ「I」「L」の類似度
S9、S12の2つが基準値以上となっているためステッ
プS917に分岐する。ステップS917ではSiが基
準値以上である上記2つのカテゴリから以下の手順で選
択処理を行う。
【0085】まず、i=9の文字カテゴリ「I」を認識
結果と仮定して、その右側に適正な文字認識結果が得ら
れるかをチェックする。すなわち、図40(a)におい
て文字検出位置xcに対してxc’=xc+wn9としてx
c’を新しい文字検出位置としてここに各文字カテゴリ
の正規化基準パターンPiを重ねて類似度Si(i=9)
を求める。ここでSiは Si=max{S(x)} (xc’−ε1≦x≦xc’+ε2) によって与えられる。図40(a)からわかるようにx
c’を文字検出基準位置とした網掛けで示した領域に
は、全てのカテゴリの基準パターンに対してパターンの
適合がみられないため類似度Siに高い値は得られな
い。
【0086】次に、i=12の文字カテゴリ「L」を認
識結果と仮定してその右側に適正な文字認識結果が得ら
れるかをチェックする。すなわち、図40(b)におい
て文字検出位置xcに対してxc’=xc+wn12とし
て、xc’を新しい文字検出位置とし、ここに各文字カ
テゴリの正規化基準パターンPiを重ねて同様に類似度
Si(i=12)を求める。この場合図40(b)からわ
かるように、xc’を文字検出基準位置とした網掛けで
示した領域に文字カテゴリ「E」を重ねたときに類似度
Siは高い値を示す。
【0087】以上のように、「I」「L」各々の文字カ
テゴリを認識結果として仮定したときに、その仮定した
文字パターンの右側に適正な文字認識結果が得られるの
はカテゴリ「L」であるので、ステップS910では文
字カテゴリ「L」をj文字目の認識結果とする。なお、
仮定した文字パターンの右側に残エリアが無い場合も適
正な文字認識結果が得られたものと等価とする。このあ
とステップS912に処理を移した後は、図33で説明
したステップS812以降の処理と同様である。
【0088】以上のように、本実施の形態では、認識対
象文字としてある文字パターンの一致度が他の文字パタ
ーンの一部に対して高い値を示すような文字を含んでい
る場合に対しても、抽出した各文字の右側に適切な文字
抽出が可能かどうかをチェックすることにより、複数の
文字を内在する矩形領域から適切に1つの文字を選択す
るので、誤認識を少なくして文字列の認識をすることが
可能である。
【0089】実施の形態8. 次に、本発明による第8の実施の形態を図41〜図43
により説明する。第8の実施の形態の文字認識装置の構
成を図41に示す。図41は実施の形態6の図32と同
一構成をとるが、辞書メモリ5aの内容、および第2の
文字認識部7gの処理内容が異なる。他の構成部の処理
内容は第6の実施の形態と同様であるため、上記の相違
点のみを以下に説明する。
【0090】辞書メモリ5aの内容は図20に示す如く
であり、大きく2つに分類されている。一つの分類は文
字パターン左端に上下に連なる縦線要素が有る「B,
D,E,F,・・・」(分類Aとする)であり、他の分
類はそのような縦線要素が無い「A,C,G,J,・・
・」(分類Bとする)である。
【0091】図42に第2の文字認識部7gの処理フロ
ーを示す。ステップS1001では処理対象の矩形領域
を縦サイズHで正規化する。このように正規化された矩
形領域をAとし、図43(a)の例で以下説明する。ス
テップS1002では文字検出番号jをj=1、文字検
出位置xcをxc=0に初期化する。
【0092】ステップS1002aでは矩形領域Aの文
字検出位置xcの近傍について縦方向ヒストグラムが基
準値以上となる部分があるか調べ、基準値以上となる部
分があればステップS1002bでflag=ONに、
基準値以上となる部分がなければステップS1002c
でflag=OFFにセットする。本実施の形態の場
合,矩形領域Aの縦方向ヒストグラムは図43(b)の
如くとなり、図からx=xc=0近傍でヒストグラムが
基準値以上となっているためflag=ONにセットさ
れる。
【0093】ステップS1003で文字カテゴリ番号を
i=1に初期化し、ステップS1009のチェックによ
りステップS1010で文字カテゴリ番号を増分しなが
ら、各文字カテゴリの正規化基準パターンと矩形領域A
の類似度をx=xcを基準位置として求めていく。ステ
ップS1004〜S1008までの類似度を求める処理
は第6の実施の形態で説明した図33のステップS80
4〜S808の処理と同様であるが、本実施の形態で
は、各文字カテゴリを扱う前にステップS1003aで
基準パターンの分類チェックを行う部分が異なる。
【0094】ステップS1003aでは、flag=O
Nならば文字カテゴリ番号iの基準パターンが左端に縦
線要素がある分類A、又はflag=OFFならば文字
カテゴリ番号iの基準パターンが左端に縦線要素がない
分類Bという条件に適合するかどうかをチェックし、条
件が適合すればステップS1003以降の類似度を求め
る処理を行い、条件が適合しなければ類似度は求めずに
ステップS1009にジャンプする。
【0095】いま、xc=0ではflag=ONである
ため基準パターンの左端に縦線要素がある分類Aのみ条
件が適合する。したがって分類Aの「B」、「D」、
「E」、・・・について類似度が求められ、ステップS
1011、S1012において最も高い類似度を示す文
字カテゴリ「L」が認識結果として検出される。
【0096】ステップS1013以降は第6の実施の形
態の図33のステップS813以降の処理説明と同様
に、文字検出座標xcを更新し、残エリアをチェック
し、文字検出番号jを増分してステップS1002aに
戻って次の文字を検出する。本実施の形態ではj=2に
おいて文字検出座標xcは図43(b)に示すx2の位置
にあるのでこの近傍でヒストグラムは基準値未満であ
り、ステップS1002a,S1002cでflag=
OFFとなる。従ってステップS1003aでは基準パ
ターンの左端に縦線要素がない分類Bのみ条件が適合
し、分類Bの「A」、「C」、「G」・・・についてス
テップS1004以降で類似度が求められ、ステップS
1011、S1012において最も高い類似度を示す文
字カテゴリ「A」が認識結果として検出される。
【0097】以上の説明から明らかなように、本実施の
形態においては、認識対象の領域について左端近傍に高
いヒストグラムがあるか否かでこの領域に適合する文字
が左端に縦線を持つか否かを判断し、あらかじめ縦線を
持つ、持たないによって分類された文字カテゴリから、
条件に適合する分類の文字カテゴリについてのみ類似度
を計算するようにしたため、計算コストの高い類似度の
計算の回数を大幅に減らして処理時間の短縮が図れる。
【0098】
【発明の効果】この発明は、以上説明したように構成さ
れているので、以下に記載されるような効果を奏する。
【0099】本発明に係わる文字認識装置においては、
認識対象文字を含む画像を入力する画像入力部と、この
画像入力部で入力した画像を文字列方向に走査して生成
した画素濃度ヒストグラムにより文字列を切り出す文字
列切り出し部と、この文字列切り出し部で切り出した文
字列画像を前記文字列と直角方向に走査して生成した画
素濃度ヒストグラムを用いて認識対象文字を含む矩形領
域を切り出す文字切り出し部と、この文字切り出し部で
切り出した前記矩形領域を認識対象文字の基準パターン
と比較することにより認識対象文字を認識する第1の文
字認識部と、この第1の文字認識部で認識されなかった
前記矩形領域と認識対象文字の基準パターンとをこの基
準パターンの位置をずらしながら比較することにより、
認識対象文字の基準パターンと類似度の高い文字を認識
対象文字の候補として基準パターンの位置と共に抽出
し、この抽出された複数の認識対象文字の候補をその位
置の出現順に並べ替えることにより認識対象文字を認識
する第2の文字認識部と、を備え、前記第2の文字認識
部は、文字列方向に隣り合う文字間に重なりや接合を生
じる可能性の有る部分をマスキングした認識対象文字の
基準パターンを用いて認識対象文字を認識するものであ
るので、複数の認識対象文字を含む矩形領域から、複数
の認識対象文字の候補をその位置と共に認識し、これら
の認識対象文字を位置の出現順に並べ替えて文字列を認
識することになり、隣り合う認識対象文字間に重なりや
接合を生じてヒストグラムからは個々の認識対象文字を
切り出せない場合においても、直接認識対象文字の認識
が可能となり、しかもその認識を安定したものとするこ
とができる効果がある。
【0100】又、認識対象文字を含む画像を入力する画
像入力部と、この画像入力部で入力した画像を文字列方
向に走査して生成した画素濃度ヒストグラムにより文字
列を切り出す文字列切り出し部と、この文字列切り出し
部で切り出した文字列画像を前記文字列と直角方向に走
査して生成した画素濃度ヒストグラムを用いて認識対象
文字を含む矩形領域を切り出す文字切り出し部と、この
文字切り出し部で切り出した前記矩形領域を認識対象文
字の基準パターンと比較することにより認識対象文字を
認識する第1の文字認識部と、前記認識対象文字の基準
パターンを文字列と直角方向で矩形領域の上下に連なる
線要素の存在の有無で分類し、前記第1の文字認識部で
認識されなかった前記矩形領域と前記線要素の存在しな
い認識対象文字の基準パターンとをこの基準パターンの
位置をずらしながら比較することにより、認識対象文字
の基準パターンと類似度の高い文字を認識対象文字の候
補として基準パターンの位置と共に抽出するとともに、
前記第1の文字認識部で認識されなかった矩形領域の文
字列と前記前記線要素の存在する認識対象文字の基準パ
ターンとを重ね合わせることにより、認識対象文字の基
準パターンと類似度の高い文字を認識対象文字の候補と
して基準パターンの位置と共に抽出し、この抽出された
複数の認識対象文字の候補をその位置の出現順に並べ替
えることにより認識対象文字を認識する第2の文字認識
部と、を備えたので、複数の認識対象文字を含む矩形領
域から、複数の認識対象文字の候補をその位置と共に認
識し、これらの認識対象文字を位置の出現順に並べ替え
て文字列を認識することになり、隣り合う認識対象文字
間に重なりや接合を生じてヒストグラムからは個々の認
識対象文字を切り出せない場合においても、直接認識対
象文字の認識が可能となり、しかもその認識回数を減ら
して、高速に認識対象文字の認識を可能とする効果があ
る。
【0101】又、認識対象文字を含む画像を入力する画
像入力部と、この画像入力部で入力した画像を文字列方
向に走査して生成した画素濃度ヒストグラムにより文字
列を切り出す文字列切り出し部と、この文字列切り出し
部で切り出した文字列画像を前記文字列と直角方向に走
査して生成した画素濃度ヒストグラムを用いて認識対象
文字を含む矩形領域を切り出す文字切り出し部と、この
文字切り出し部で切り出した前記矩形領域を認識対象文
字の基準パターンと比較することにより認識対象文字を
認識する第1の文字認識部と、この第1の文字認識部で
認識されなかった前記矩形領域の一方の端に認識対象文
字の基準パターンを重ね合わせて認識対象文字を認識
し、更にこの認識された認識対象文字を前記矩形領域か
ら除いた残りの矩形領域の前記矩形領域の一方の端と同
じ側の端に認識対象文字の基準パターンを重ね合わせる
ことにより認識対象文字を順次認識する第2の文字認識
部と、を備え、前記第2の文字認識部は、認識すべき矩
形領域の一方の端に文字列と直角方向に走査して生成し
た画素濃度ヒストグラムの高い位置が存在するときは、
認識対象文字の基準パターンの内で文字列と直角方向で
前記矩形領域の上下に連なる線要素の存在する認識対象
文字の基準パターンを重ね合わせて認識対象文字を認識
し、認識すべき矩形領域の一方の端に文字列と直角方向
に走査して生成した画素濃度ヒストグラムの高い位置が
存在しないときは、認識対象文字の基準パターンの内で
文字列と直角方向で前記矩形領域の上下に連なる線要素
の存在しない認識対象文字の基準パターンを重ね合わせ
て認識対象文字を認識するので、矩形領域から認識した
認識対象文字を順次取り除きながら文字列を認識するこ
とになり、隣り合う認識対象文字間に重なりや接合を生
じてヒストグラムからは個々の認識対象文字を切り出せ
ない場合においても、直接認識対象文字の認識が可能と
なり、しかもその認識回数を減らして、高速に認識対象
文字の認識を可能とする効果がある。
【図面の簡単な説明】
【図1】この発明の第1の実施の形態による文字認識装
置の構成を示すブロック図である。
【図2】この発明の第1の実施の形態による処理例を示
すための入力画像を示す説明図である。
【図3】この発明の第1の実施の形態による入力画像か
ら文字列領域を切り出す課程を示す説明図である。
【図4】この発明の第1の実施の形態による文字列領域
から文字領域を切り出す課程を示す説明図である。
【図5】この発明の第1の実施の形態による第1の文字
認識部6の処理内容を示すフロー図である。
【図6】この発明の第1の実施の形態による辞書メモリ
5の内容を示す説明図である。
【図7】この発明の第1の実施の形態による第1の文字
認識部6における文字サイズの正規化を示す説明図であ
る。
【図8】この発明の第1の実施の形態による一つの切り
出しパターンの類似度の記録を示す説明図である。
【図9】この発明の第1の実施の形態による第2の文字
認識部7の処理内容を示すフロー図である。
【図10】この発明の第1の実施の形態による接合を生
じた文字切り出し領域から各文字カテゴリの類似度を求
めた記録を示す説明図である。
【図11】この発明の第1の実施の形態による重なりを
生じた文字切り出し領域から各文字カテゴリの類似度を
求めた記録を示す説明図である。
【図12】この発明の第2の実施の形態による文字認識
装置の構成を示すブロック図である。
【図13】この発明の第2の実施の形態による第2の文
字認識部7aの処理内容を示すフロー図である。
【図14】この発明の第2の実施の形態による辞書メモ
リ5の内容を示す説明図である。
【図15】この発明の第2の実施の形態による切り出し
パターン「LE」の各位置における基準パターン「I」
の類似度を示す説明図である。
【図16】この発明の第2の実施の形態による切り出し
パターン「LE」から抽出される文字とその位置を示す
説明図である。
【図17】この発明の第2の実施の形態による抽出され
た各文字の存在範囲を示す説明図である。
【図18】この発明の第2の実施の形態による抽出され
た文字組み合わせの存在範囲を示す説明図である。
【図19】この発明の第3の実施の形態による文字認識
装置の構成を示すブロック図である。
【図20】この発明の第3の実施の形態による辞書メモ
リ5aの内容を示す説明図である。
【図21】この発明の第3の実施の形態による第2の文
字認識部7bの処理内容を示すフロー図である。
【図22】この発明の第4の実施の形態による文字認識
装置の構成を示すブロック図である。
【図23】この発明の第4の実施の形態による第1の文
字認識部6aの処理内容を示すフロー図である。
【図24】この発明の第4の実施の形態による第2の文
字認識部7cの処理内容を示すフロー図である。
【図25】この発明の第4の実施の形態による切り出し
パターンと基準パターンとを同サイズのパターンとする
パターンサイズの変換についての説明図である。
【図26】この発明の第5の実施の形態による類似度の
低下する切り出し矩形領域(パターン)を示す説明図で
ある。
【図27】この発明の第5の実施の形態による文字認識
装置の構成を示すブロック図である。
【図28】この発明の第5の実施の形態による辞書メモ
リ5bの内容を示す説明図である。
【図29】この発明の第5の実施の形態によるマスクパ
ターンの内容を示す説明図である。
【図30】この発明の第5の実施の形態による第2の文
字認識部7dの処理内容を示すフロー図である。
【図31】この発明の第5の実施の形態によるマスクパ
ターンの効果を示す説明図である。
【図32】この発明の第6の実施の形態による文字認識
装置の構成を示すブロック図である。
【図33】この発明の第6の実施の形態による第2の文
字認識部7eの処理内容を示すフロー図である。
【図34】この発明の第6の実施の形態による第2の文
字認識部7eの処理手順の説明図である。
【図35】この発明の第6の実施の形態による第2の文
字認識部7eの記録内容を示す説明図である。
【図36】この発明の第6の実施の形態による第2の文
字認識部7eの類似度を求める範囲についての説明図で
ある。
【図37】この発明の第7の実施の形態による文字認識
装置の構成を示すブロック図である。
【図38】この発明の第7の実施の形態による第2の文
字認識部7fの処理内容を示すフロー図である。
【図39】この発明の第7の実施の形態による第2の文
字認識部7fの記録内容を示す説明図である。
【図40】この発明の第7の実施の形態による第2の文
字認識部7fにおいて複数の認識候補文字から1つを選
択する方法の説明図である。
【図41】この発明の第8の実施の形態による文字認識
装置の構成を示すブロック図である。
【図42】この発明の第8の実施の形態による第2の文
字認識部7gの処理内容を示すフロー図である。
【図43】この発明の第8の実施の形態による第2の文
字認識部7gの文字検出位置のヒストグラムによる文字
カテゴリの分類についての説明図である。
【図44】従来の文字認識装置の構成を示すブロック図
である。
【図45】従来の文字認識装置の処理を示すための入力
画像の説明図である。
【図46】従来の入力画像から文字列領域を切り出す課
程を示す説明図である。
【図47】従来の文字列領域から文字領域を切り出す課
程を示す説明図である。
【図48】従来の個々に切り出された文字の類似度を求
める説明図である。
【符号の説明】
1 画像入力部、2 画像メモリ、3 文字列切り出し
部、4、4a 文字切り出し部、5、5a、5b 辞書
メモリ、6、6a 第1の文字認識部、7、7a、7
b、7c、7d,7e、7f、7g 第2の文字認識
部、10 画像、20、30 画素濃度ヒストグラム、
23 文字列、41〜45 矩形領域。
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06K 9/00 - 9/82

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 認識対象文字を含む画像を入力する画像
    入力部と、この画像入力部で入力した画像を文字列方向
    に走査して生成した画素濃度ヒストグラムにより文字列
    を切り出す文字列切り出し部と、この文字列切り出し部
    で切り出した文字列画像を前記文字列と直角方向に走査
    して生成した画素濃度ヒストグラムを用いて認識対象文
    字を含む矩形領域を切り出す文字切り出し部と、この文
    字切り出し部で切り出した前記矩形領域を認識対象文字
    の基準パターンと比較することにより認識対象文字を認
    識する第1の文字認識部と、この第1の文字認識部で認
    識されなかった前記矩形領域と認識対象文字の基準パタ
    ーンとをこの基準パターンの位置をずらしながら比較す
    ることにより、認識対象文字の基準パターンと類似度の
    高い文字を認識対象文字の候補として基準パターンの位
    置と共に抽出し、この抽出された複数の認識対象文字の
    候補をその位置の出現順に並べ替えることにより認識対
    象文字を認識する第2の文字認識部と、を備え、前記第
    2の文字認識部は、文字列方向に隣り合う文字間に重な
    りや接合を生じる可能性の有る部分をマスキングした認
    識対象文字の基準パターンを用いて認識対象文字を認識
    することを特徴とする文字認識装置。
  2. 【請求項2】 認識対象文字を含む画像を入力する画像
    入力部と、この画像入力部で入力した画像を文字列方向
    に走査して生成した画素濃度ヒストグラムにより文字列
    を切り出す文字列切り出し部と、この文字列切り出し部
    で切り出した文字列画像を前記文字列と直角方向に走査
    して生成した画素濃度ヒストグラムを用いて認識対象文
    字を含む矩形領域を切り出す文字切り出し部と、この文
    字切り出し部で切り出した前記矩形領域を認識対象文字
    の基準パターンと比較することにより認識対象文字を認
    識する第1の文字認識部と、前記認識対象文字の基準パ
    ターンを文字列と直角方向で矩形領域の上下に連なる線
    要素の存在の有無で分類し、前記第1の文字認識部で認
    識されなかった前記矩形領域と前記線要素の存在しない
    認識対象文字の基準パターンとをこの基準パターンの位
    置をずらしながら比較することにより、認識対象文字の
    基準パターンと類似度の高い文字を認識対 象文字の候補
    として基準パターンの位置と共に抽出するとともに、前
    記第1の文字認識部で認識されなかった矩形領域の文字
    列と前記前記線要素の存在する認識対象文字の基準パタ
    ーンとを重ね合わせることにより、認識対象文字の基準
    パターンと類似度の高い文字を認識対象文字の候補とし
    て基準パターンの位置と共に抽出し、この抽出された複
    数の認識対象文字の候補をその位置の出現順に並べ替え
    ることにより認識対象文字を認識する第2の文字認識部
    と、を備えたことを特徴とする文字認識装置。
  3. 【請求項3】 認識対象文字を含む画像を入力する画像
    入力部と、この画像入力部で入力した画像を文字列方向
    に走査して生成した画素濃度ヒストグラムにより文字列
    を切り出す文字列切り出し部と、この文字列切り出し部
    で切り出した文字列画像を前記文字列と直角方向に走査
    して生成した画素濃度ヒストグラムを用いて認識対象文
    字を含む矩形領域を切り出す文字切り出し部と、この文
    字切り出し部で切り出した前記矩形領域を認識対象文字
    の基準パターンと比較することにより認識対象文字を認
    識する第1の文字認識部と、この第1の文字認識部で認
    識されなかった前記矩形領域の一方の端に認識対象文字
    の基準パターンを重ね合わせて認識対象文字を認識し、
    更にこの認識された認識対象文字を前記矩形領域から除
    いた残りの矩形領域の前記矩形領域の一方の端と同じ側
    の端に認識対象文字の基準パターンを重ね合わせること
    により認識対象文字を順次認識する第2の文字認識部
    と、を備え、前記第2の文字認識部は、認識すべき矩形
    領域の一方の端に文字列と直角方向に走査して生成した
    画素濃度ヒストグラムの高い位置が存在するときは、認
    識対象文字の基準パターンの内で文字列と直角方向で前
    記矩形領域の上下に連なる線要素の存在する認識対象文
    字の基準パターンを重ね合わせて認識対象文字を認識
    し、認識すべき矩形領域の一方の端に文字列と直角方向
    に走査して生成した画素濃度ヒストグラムの高い位置が
    存在しないときは、認識対象文字の基準パターンの内で
    文字列と直角方向で前記矩形領域の上下に連なる線要素
    の存在しない認識対象文字の基準パターンを重ね合わせ
    て認識対象文字を認識することを特徴とする文字認識装
    置。
JP06098496A 1996-03-18 1996-03-18 文字認識装置 Expired - Fee Related JP3379327B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP06098496A JP3379327B2 (ja) 1996-03-18 1996-03-18 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP06098496A JP3379327B2 (ja) 1996-03-18 1996-03-18 文字認識装置

Publications (2)

Publication Number Publication Date
JPH09251514A JPH09251514A (ja) 1997-09-22
JP3379327B2 true JP3379327B2 (ja) 2003-02-24

Family

ID=13158217

Family Applications (1)

Application Number Title Priority Date Filing Date
JP06098496A Expired - Fee Related JP3379327B2 (ja) 1996-03-18 1996-03-18 文字認識装置

Country Status (1)

Country Link
JP (1) JP3379327B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004246722A (ja) * 2003-02-14 2004-09-02 Fasl Japan 株式会社 画像パターンの解析方法
CN110472002B (zh) * 2019-08-14 2022-11-29 腾讯科技(深圳)有限公司 一种文本相似度获取方法和装置

Also Published As

Publication number Publication date
JPH09251514A (ja) 1997-09-22

Similar Documents

Publication Publication Date Title
EP1497787B1 (en) System and method for identifying and extracting character strings from captured image data
US5907631A (en) Document image processing method and system having function of determining body text region reading order
US6006240A (en) Cell identification in table analysis
KR100311633B1 (ko) 문서화상으로부터의타이틀추출장치및방법
JPH09179901A (ja) ビットマップイメージ処理方法及び自動インデックス付けシステム
CN113435240B (zh) 一种端到端的表格检测和结构识别方法及***
JPH08305796A (ja) パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置
JP2000285190A (ja) 帳票識別方法および帳票識別装置および記憶媒体
Xiao et al. Knowledge-based English cursive script segmentation
JP3379327B2 (ja) 文字認識装置
de Oliveira et al. A new segmentation approach for handwritten digits
JPH0981740A (ja) 線図形入力装置
JP3130869B2 (ja) 指紋画像処理装置、指紋画像処理方法、および記録媒体
Hu et al. A hierarchical approach to efficient curvilinear object searching
Ablameyko et al. A complete system for interpretation of color maps
JP3957471B2 (ja) 分離文字列統合装置
US5894525A (en) Method and system for simultaneously recognizing contextually related input fields for a mutually consistent interpretation
JP3586911B2 (ja) 枠線認識装置
JP2917427B2 (ja) 図面読取装置
JP4159071B2 (ja) 画像処理方法,画像処理装置および該処理方法を実現させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
Graf et al. Analysis of complex and noisy check images
JP3345246B2 (ja) 文字認識装置及び文字認識方法
JPH0773273A (ja) パターン切出しおよび認識方法とそのシステム
Santosh et al. Arrowhead detection in biomedical images
JP3030814B2 (ja) ノイズ成分除去方法及びノイズ成分除去プログラムを記録した記録媒体

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees