JPH096909A - 文字読取装置 - Google Patents

文字読取装置

Info

Publication number
JPH096909A
JPH096909A JP7147370A JP14737095A JPH096909A JP H096909 A JPH096909 A JP H096909A JP 7147370 A JP7147370 A JP 7147370A JP 14737095 A JP14737095 A JP 14737095A JP H096909 A JPH096909 A JP H096909A
Authority
JP
Japan
Prior art keywords
image
character
end point
binary
multivalued
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7147370A
Other languages
English (en)
Other versions
JP2785747B2 (ja
Inventor
Osamu Suzuki
理 鈴木
Shinji Sase
慎治 佐瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP7147370A priority Critical patent/JP2785747B2/ja
Publication of JPH096909A publication Critical patent/JPH096909A/ja
Application granted granted Critical
Publication of JP2785747B2 publication Critical patent/JP2785747B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【目的】 より正確な整形処理を実行し、整形できる対
象を大幅に向上し、読取精度を高める。 【構成】 2値画像記憶部113の保持する2値全面画
像より文字画像を1文字ずつ切り出す(文字切り出し部
114)。切り出された2値文字画像から端点を検出す
る(端点検出部115)。検出した端点位置近傍の多値
画像を参照し、端点近傍の濃淡変化率を検出する(濃淡
変化率検出部116)。端点検出部115および濃淡変
化率検出部116での検出結果(端点位置および濃淡変
化率)に基づき端点間の接続可否を判定する(接続可否
判定部117)。接続可と判定された場合、その接続可
とされた2値文字画像上の端点間を接続する(文字画像
整形部118)。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、光学的に文字を読み
取る装置に関し、特に帳票など、紙面に記載された文字
を読み取る文字読取装置に関するものである。
【0002】
【従来の技術】この種の文字読取装置においては、画像
入力部分より得られた多値(濃淡)画像を2値文字画像
に変換し、場合によってはこの2値文字画像に対して大
きさを一定にする等の前処理を行い、それを認識するの
が一般的な手法である。この際、十分な読取精度が得ら
れない原因の1つに、入力文字上の部分的なかすれ、欠
けがある。これは、ボールペンの記入や印字文字の片打
ち(ななめ打ち)、インクリボンのかすれ等により、よ
く見られる。2値文字画像上のかすれを補正するための
対策には、従来技術として、多値画像を利用して、濃い
2値画像を作成して認識する手法(手法:リスキャン
法)や、2値文字画像を膨張および収縮させ、欠けやか
すれ部分をなくす整形を行い、認識する手法(手法)
がある。また、別の手法として、特開平2−24786
号公報において、線間で且つかすれ,欠け部分がきわめ
て短い場合のみ、推定による穴埋めを行う整形処理を行
い、認識する手法(手法)が提案されている。
【0003】
【発明が解決しようとする課題】これらの従来の手法の
内、手法は、元々の記入/印字文字が欠けている場合
には効果がない。また、手法では、2値文字画像上の
かすれ等の部分に関係ない部分が歪んでしまい、全体と
しては文字幅に大きなばらつきがでてしまい、読取処理
に悪影響を及ぼす場合がある。例として、図28(c)
に示すような2値文字画像(「6」)を上述のように整
形すると、図28(d)に示すような2値文字画像
(「8」に似た2値文字画像)になってしまう。また、
手法では、端点間の接続方向および接続距離の条件が
あるため、整形できる範囲に制限があり、かつ正確な接
続可否の判定ができない場合もある。この例として図2
8(a),(b)に示すような2値文字画像(「3」,
「2」)がある。図28(a)は、接続可否の判定が難
しい場合であり、図28(b)は距離が離れすぎている
ため、接続自体が無理な例である。
【0004】本発明はこのような課題を解決するために
なされたもので、その目的とするところは、より正確な
整形処理を実行することができ、また整形できる対象を
大幅に向上することができ、これによって読取精度を高
めることのできる文字読取装置を提供することにある。
【0005】
【課題を解決するための手段】このような目的を達成す
るために、第1発明(請求項1に係る発明)は、光学走
査により取り込んだイメージを多値全面画像として保持
し、この多値全面画像を2値全面画像に変換して保持
し、この2値全面画像から文字画像を1文字ずつ切り出
し、この切り出された文字の2値文字画像から端点を検
出し、この検出された端点の位置に対応する多値全面画
像上の位置を参照しその端点位置における濃淡変化の傾
きを検出し、この検出される各端点の濃淡変化の傾きお
よび端点間距離,位置関係に基づき各端点間の接続可否
を判定し、接続可と判定された場合、その接続可とされ
た2値文字画像上の端点間を接続するようにしたもので
ある。
【0006】第2発明(請求項2に係る発明)は、光学
走査により取り込んだイメージを多値全面画像として保
持し、この多値全面画像を2値全面画像に変換して保持
し、この2値全面画像から文字画像を1文字ずつ切り出
し、この切り出された文字の2値文字画像から端点を検
出し、この検出された端点の位置に対応する多値全面画
像上の位置を参照しその端点位置における濃淡変化の傾
きを検出し、この検出される各端点の濃淡変化の傾きお
よび端点間距離,位置関係,接線方向に基づき各端点間
の接続可否を判定し、接続可と判定された場合、その接
続可とされた2値文字画像上の端点間を接続するように
したものである第3発明(請求項3に係る発明)は、第
1発明又は第2発明において、端点間の多値全面画像の
情報を線分間の軌跡情報として利用しながら端点間を接
続するようにしたものである。
【0007】
【作用】したがってこの発明によれば、第1発明では、
2値文字画像から検出された各端点の濃淡変化の傾きお
よび端点間距離,位置関係に基づいて各端点間の接続可
否が判定され、接続可と判定された場合、その接続可と
された2値文字画像上の端点間が接続される。第2発明
では、2値文字画像から検出された各端点の濃淡変化の
傾きおよび端点間距離,位置関係,接線方向に基づいて
各端点間の接続可否が判定され、接続可と判定された場
合、その接続可とされた2値文字画像上の端点間が接続
される。第3発明では、第1発明又は第2発明におい
て、接続可と判定された場合、端点間の多値全面画像の
情報を線分間の軌跡情報として利用しながら、その接続
可とされた2値文字画像上の端点間が接続される。
【0008】
【実施例】以下、本発明を実施例に基づき詳細に説明す
る。 〔実施例1:第1発明〕図1はこの発明の一実施例を示
す文字読取装置のブロック図である。この文字読取装置
は、光学的に帳票上のイメージを走査し多値で入力する
画像入力部111と、この画像入力部111からのイメ
ージを多値全面画像として保持する多値画像記憶部11
2と、この多値画像記憶部112の保持する多値全面画
像を2値全面画像に変換し保持する2値画像記憶部11
3と、この2値画像記憶部113の保持する2値全面画
像より文字画像を1文字ずつ切り出しその帳票画像上の
位置を記憶する文字切り出し部114と、この文字切り
出し部114により切り出された2値文字画像から端点
を検出する端点検出部115とを備えている。
【0009】また、この文字読取装置は、多値画像記憶
部112の保持する多値全面画像より端点検出部115
の検出した端点位置近傍の多値画像を参照し、端点近傍
の濃淡の変化率(濃淡変化の傾き)を検出する濃淡変化
率検出部116と、端点検出部115および濃淡変化率
検出部116での検出結果(端点位置および濃淡変化
率)に基づき端点間の接続可否を判定する接続可否判定
部117と、接続可否判定部117により接続可と判定
された場合、その接続可とされた2値文字画像上の端点
間を接続する文字画像整形部118と、この文字画像整
形部118での整形後の2値文字画像(文字画像整形部
118を経ない2値文字画像も含む)を認識し判定する
認識部119とを備えている。
【0010】この文字読取装置は、光学的に画像を入力
する画像入力装置と、プログラムおよび画像を保持する
メモリと、全体の処理(および制御)を行う中央演算処
理装置との組合せにより、容易に実現できる。画像入力
部111は、帳票上を光学的に走査し、反射により得ら
れるアナログ信号を多値画像記憶部112へ与える。多
値画像記憶部112は画像入力部111からのアナログ
信号をディジタル変換した多値全面画像を保持する。
【0011】ここで、多値画像とは、各画素をその濃度
に応じた値で表現するものであり、例えば、最白値を
「0」、最黒値を「15」として割り当てる。多値画像
の濃度の範囲は8値以上であればよく、ハードウェア資
源と画像入力時の濃度に関する分解能との関係で設定す
ればよい。すなわち、多値画像の濃度の範囲は、16値
に限られるものではない。本実施例では、多値における
濃淡値の最白値を「0」、最黒値を「15」として、そ
の説明を進める。
【0012】多値画像記憶部112の保持する多値全面
画像の各画素は、背景部分、文字部分、背景なのか文字
なのかはっきりしない部分等、「0」から「15」まで
の16階調からなる範囲内で、様々な値をとっている。
2値画像記憶部113は、多値画像記憶部112の保持
する多値全面画像の各画素が所定の閾値より大きい場
合、すなわち文字部分と想定される濃度は全て「1」
に、そして小さい場合、すなわち背景部分と想定される
濃度は全て「0」に変換する。これにより、2値画像記
憶部113において、「0」と「1」とからなる2値全
面画像が得られる。ここで、閾値の設定については、予
め定められた値を使用してもよいし、濃度分布を帳票
毎、または、帳票の部分毎に測定し、その分布に基づい
て逐次設定してもよい。なお、この2値全面画像および
多値全面画像は、相互に参照が可能なように2値画像記
憶部113および多値画像記憶部112に記憶してお
く。
【0013】次に、文字切り出し部114では、2値画
像記憶部113の保持する2値全面画像から、文字を1
文字ずつ切り出し、この切り出された2値文字画像の2
値全面画像上の位置を記憶する。このことにより、2値
文字画像に対応する多値全面画像上の各文字画像も参照
可能である。2値文字画像の例を図2に示す。ここで、
文字切り出しに関しては、読取位置情報を、帳票上の書
かれた文字のうち、読み取りたい各文字について予め定
められた位置の範囲から参照して切り出してもよいし、
図3に示すようにレイアウト解析→文字行抽出→文字抽
出の手順で切り出してもよい。
【0014】文字切り出し部114にて切り出された2
値文字画像は端点検出部115へ送られる。端点検出部
115は、文字切り出し部114からの2値文字画像に
対して、端点検出を行う。なお、端点の検出方法は、過
去に様々の手法が提案されており、一般的な例として、
文字間隔の曲率等から求めることができる。本実施例で
は、以下のようにして、端点検出を行っている。
【0015】〔端点検出〕まず、2値文字画像を細線化
して、細線化画像を得る。この細線化法についても、現
在までに様々なアルゴリズムが提案されている。一例と
して、「2値画像の図形画素の境界点の値を「1」から
背景の「0」に逐次変換することによって8連結で線幅
「1」の線図形を得る」という手法を持つヒルディッチ
(Hilditch)の細線化アルゴリズムが適用できる。な
お、この手法は、既に公知の手法として知られているの
で、処理手順の詳しい内容については省略する。図2の
2値文字画像に対して細線化を行った画像を図4に示
す。
【0016】得られた細線化画像(図4)上の端点は、
図5(a)〜(h)に示された端点検出マスク(「3」
×「3」)を当てはめることにより、容易に検出するこ
とができる。ここで、細線化画像(図4)上の黒画素連
結成分401と2値文字画像(図2)上の黒画素連結成
分205を重ね合わせると、図6のようになる。なお、
図6上のi,mは黒画素連結成分401における細線化
上の端点である。この細線化上の端点iは、図5(c)
に示した端点検出マスクにより検出される。この場合、
このマスクの方向に延長して黒画素から白画素に変わる
直前の黒画素が、2値文字画像上の端点j(端点20
4)となる。
【0017】なお、端点検出マスクにより、細線化上の
端点の接線方向および線幅の情報も取得が可能である。
すなわち、一致した端点検出マスクにおける方向(図5
(c)では右向き)がそのまま端点(端点j)における
接線方向の情報ともなる。さらに、端点iから端点jに
引いた線に垂直な方向の線k−l上の黒画素数が、端点
jにおける文字幅となる。なお、この文字幅は、後述す
る文字画像整形部118にて端点接続を行うために必要
な情報となる。また、接線方向に関しては、後述する実
施例2での接続可否判定で必要となる。
【0018】同様に、細線化上の端点mは、図5(e)
に示した端点検出マスクにより検出される。この場合、
このマスクの方向に延長して黒画素から白画素に変わる
直前の黒画素が、2値文字画像上の端点n(端点20
6)となる。さらに、この端点nにおける接線方向は図
5(e)に示した端点検出マスクにおける方向(下向
き)、文字幅はo−p線上の黒画素数となる。
【0019】以下、同様にして、黒画素連結成分202
(図2)も端点を検出する。これにより、黒画素連結成
分205からは2値文字画像上の端点204,206、
黒画素連結成分202からは2値文字画像上の端点20
1,203が検出される。ここで、これらの検出された
端点が、実際上の文字の端点なのか、或いはかすれ等の
影響による端点なのかを判定するために、端点近傍の濃
淡変化率を検出する。
【0020】〔濃淡変化率(濃淡変化の傾き)の検出〕
濃淡変化率検出部116は、文字切り出し部114で得
た文字情報と端点検出部115で得た文字内の各端点位
置の情報から、多値画像記憶部112に保持されている
多値全面画像上の位置を参照する。ここで、図2上の黒
画素連結成分205上の端点204と黒画素連結成分2
05上の端点206の2つを例にとって説明する。端点
204を中心とした「5」×「5」の範囲内の多値画像
を図7に示す。端点206を中心とした「5」×「5」
の範囲内の多値画像を図8に示す。ここで、図7,図8
における各数値は各画素の濃度を表しており、最白値
「0」,最黒値「15」となる。さらに、この場合の2
値画像の黒点は10以上の値のものとしている。
【0021】これらの画像の濃淡変化の傾き(大きさ)
を検出する方法の1つに、画像に微分演算を施すという
考えがあり、特に濃淡変化の大きい所を抽出する時に
は、1次空間微分が有効であり、Roberts、Sobel等の微
分マスクを用いることができる。また、ここでは、端点
を中心とした「5」×「5」の範囲を検出対象範囲とし
たが、この検出対象範囲は「5」×「5」の範囲に限る
ことはなく、文字の線の太さと入力画像の分解能によ
り、線の太さ程度のサイズが最適となる。但し、「3」
×「3」の範囲以下だと小さすぎて情報が足りないし、
「7」×「7」の範囲以上では演算量が大きくなりすぎ
るので、「5」×「5」の範囲が望ましいサイズとな
る。従って、文字線が「5」程度の太さになるように予
め画像の大きさを正規化してから、「5」×「5」の範
囲で演算するようにする。この際、正規化をする場合
は、多値画像もあわせて行う。
【0022】ここでは、図9に示すように、検出対象範
囲の左上が原点になるように直交座標系x軸およびy軸
を設定し、検出対象範囲の画素(x,y)の濃淡値をf
(x,y)と定義する。以下、端点204の座標を
(a,b)、端点204を中心とした「5」×「5」の
範囲内の多値画像(図7)の濃淡値をf(a+i,b+
j)と表現し(但し、i,j=−2,−1,0,1,
2)、端点204における濃淡変化の大きさをg(a,
b)として、端点204における濃淡変化の大きさを求
める手法を述べる。
【0023】「5」×「5」の多値画像にかける1次空
間微分フィルタをx方向,y方向の「5」×「5」マス
クで表現すると、図10,図11になる。この微分フィ
ルタは、注目(中心)画素の近傍の濃淡値の微分を用い
た演算により、画像中の線や縁を図10はx方向
(横)、図11はy方向(縦)に強調するフィルタであ
る。この時、端点204を中心とした「5」×「5」の
範囲内の濃淡値f(a+i,b+j)にx方向,y方向
の1次微分マスクX(i,j),Y(i,j)をかけた
ときの端点204における濃淡変化の大きさg(a,
b)は、下記式により計算する。但し、i,j=−2,
−1,0,1,2、左上をX(−2,2)、右下をX
(2,2)、左上をY(−2,−2)、右下をY(2,
2)として表す。
【0024】
【数1】
【0025】この場合、g(a,b)は「625」とな
る。また、端点206を中心とした「5」×「5」の範
囲内の多値画像(図8)についても同様の手法により求
めると、端点206にける濃淡変化の大きさは「110
09」となる。以下、同様にして、端点203,201
についても濃淡変化の大きさを求める。このようにし
て、各々の端点の濃淡変化の大きさが求められれば、次
に接続可否判定部117で各端点間の接続可否を行う。
【0026】〔端点間の接続可否の判定〕まず、各々の
端点について、実際上の文字の端点か、かすれ等の影響
による端点かを上記(1)式より求めた濃淡変化の大き
さにより判定する。つまり、この端点の濃淡変化の大き
さが、所定の閾値より大きい場合、すなわち画像上の白
領域と黒領域との境目がはっきりしている場合には、こ
の端点は実際上の文字の端点と判定し、小さい場合、す
なわち画像上の白領域と黒領域との境目がはっきりして
いない場合には、かすれ等の影響による端点と判定す
る。この閾値の設定については、データベースの評価実
験により予め定めておく。ここでは、実験により閾値を
「2500」と設定する。
【0027】この際、端点206における濃淡変化の大
きさは「11009」となっており、閾値より大きいの
で、実際の文字の端点とみなせ、また、端点204にお
ける濃淡変化の大きさは閾値より小さいので、かすれ等
の影響による端点とみなせる。以下、残りの端点20
1,203についても同様の方法で判定する。なお、端
点201は、端点206と同様に、正常な文字の端点と
なるので、これらの端点のストローク(文字線)整形に
よる接続は行わない。また、端点203は端点204と
同様に、かすれ等の影響による端点となるので、これ以
降は、これらの端点が、ストローク整形により接続可能
かどうかを判定する。
【0028】以下、かすれ等による端点の接続可否判定
について、図12に示したフローチャートを参照しなが
ら説明する。まず、2値文字画像(図2)上の各端点2
01,203,204,206の内、かすれによる端点
である端点203,204についての接続可否判定を開
始する(ステップ910)。次に、端点間の直結接続可
否について判定する(ステップ911)。ここでは、端
点203,204間の直結接続可能な最大距離を、予め
端点検出部115で得られた端点203,204におけ
る文字幅と同じ長さと定義する。そして、端点203,
204間の距離が、この直結接続可能な最大距離よりも
短いか否かを判定する。また、端点203,204を中
心とした予め定められた「11」×「11」の範囲内
に、端点203,204以外のかすれ端点がないか否か
を判定する。
【0029】端点203,204の距離が直結接続可能
な最大距離よりも短く、かつ端点203,204を中心
とした「11」×「11」の範囲内に端点203,20
4以外のかすれ端点がなければ、直結接続による整形を
行う(ステップ912)。本実施例では、図14に示す
ように、端点203,204の距離が「4」となってお
り、直結接続可能な最大距離(文字幅)「5」より短
く、端点203,204を中心とした「11」×「1
1」の範囲内に端点203,204以外のかすれ端点が
ないことから、端点203,204とは直結接続による
整形が行われる。
【0030】ここで、端点における文字幅を直結接続可
能な最大距離とした理由は、2端点間のかすれ部分の距
離が文字幅と同じ長さを越えると、このかすれ部分が曲
線や交錯点,屈折点である可能性が高くなると実験によ
り実証されているためである。また、「11」×「1
1」の範囲内という値についても、この範囲内にかすれ
端点が複数(3個以上)あると、どれとどれを接続して
よいかの判別が困難になるためである。
【0031】ステップ912での端点203,204の
直結接続による整形は文字画像整形部118にて行われ
る。この際、端点検出部115で得た端点203,20
4の文字幅にあわせた太さの直線ストロークを作成し、
接続し、整形する。図15に整形終了後の2値文字画像
を示す。認識部119は、全ての画像整形処理が終了し
た2値文字画像に対して特徴抽出を行い、その後、予め
登録されている文字カテゴリ毎の特徴(以下、辞書と呼
ぶ)との比較演算を行うことにより、最も類似している
と判定した文字カテゴリを認識結果として出力し、1文
字分の認識処理を行う。
【0032】なお、認識部119で抽出する特徴につい
ては、方向特徴(文字線部あるいは輪郭の方向)、文字
エッジ部の特徴(文字エッジ部の輪郭形状)、画像のぼ
かし、圧縮による特徴(文字形の変形等を吸収するため
の圧縮)等があり、これらの特徴は処理速度および読取
対象と読取精度によりいずれを使用してもよい。また、
同じ認識部119で使用する比較演算については、様々
な距離計算(ユークリッド距離、シティブロック距離、
チェス盤距離等)や内積等の類似度計算等があり、前記
抽出された特徴との適合性により、いずれを使用しても
よい。上述した特徴、比較演算については、周知の技術
であるので、詳細な説明は省略する。
【0033】なお、本実施例は、図28(a),(c)
に示されるような2値文字画像(「3」,「6」)に対
しても適用できる。図28(a)に示された2値文字画
像のA部は端点間の距離が短く、直結接続可能のように
みえるが、実際はかすれによる端点ではないと判定され
るので、接続は行われない。また、図28(c)に示さ
れた2値文字画像のB部は接続可能な端点が他になく、
またかすれによる端点でもないので接続は行われない。
図28(c)に示された2値文字画像のC部の2端点は
かすれによる端点であり、直結接続可能な条件を満たす
ので、接続が行われる。
【0034】〔実施例2:第2発明〕この実施例2は、
接続可否判定部117および文字画像整形部118の機
能が異なるのみで、その他については実施例1と全く同
じである。以下、接続可否判定部117および文字画像
整形部118の機能についてのみ、図13に示すフロー
チャートを参照しながら説明する。
【0035】図16に示す2値文字画像を例に取って説
明する。この場合、濃淡変化率検出部116により、か
すれによる端点は、端点1602と端点1603の2端
点のみであると判定される。接続可否判定部117は、
この端点間の接続可否についての判定を開始する(ステ
ップ914)。次に、端点1602,1603の直結接
続可否について判定する(ステップ915)。この直結
接続可否の判定は、実施例1における直結接続可否の判
定と同様にして行われ、本実施例では、位置関係からみ
て、端点1602,1603の距離(図16に示す波線
部分)が、予め端点検出部115にて求められた文字幅
すなわち直結接続可能な最大距離より長いため、直結接
続は不可となる。
【0036】これにより、ステップ917へ進み、端点
検出部115で得た端点1602,1603における接
線方向を参照する。この場合、端点1603からは左下
の方向に仮想ストロークが引け、端点1602からは左
方向に仮想ストロークが引ける(図16に示す点線)。
このとき、端点1602,1603から線幅「1」の仮
想ストロークを接線方向に文字の整形可能な範囲内まで
引くものと仮定し、次に互いの端点1602,1603
から引いた仮想ストローク上の各画素の位置情報を参照
する。
【0037】ここで言う整形可能な範囲内というのは、
2値全面画像から文字切り出し部114にて1文字ずつ
切り出された時にできた文字の外接枠S1(図17)内
の面積を基準に2倍の面積(縦横等倍)とした仮想枠S
2(図16)のことを言う。。この場合、互いの端点1
602,1603から引いた仮想ストローク上の画素の
中に、同一の位置があり、この画素が交錯点1605と
なる。そして、この交錯点1605は仮想枠S2内に位
置しているので、仮想ストロークに近似した直線近似接
続として整形する(ステップ919)。
【0038】なお、仮想枠S2を外接枠S1の2倍の面
積としたのは、データベースの評価実験により予め定め
たものである。また、ステップ919での端点160
2,1603の仮想ストロークに近似した直線近似接続
は、文字画像整形部118にて行われる。 〔2値文字画像の整形〕次に、図18を参照しながら、
図16に示した2値文字画像を整形する手順、すなわち
端点1602,交錯点1605,端点1603からなる
仮想ストロークを中心線とした文字幅のあるストローク
を作成する手順について説明する。
【0039】まず、予め端点検出部115にて求めら
れた各々の端点1602,1603における文字幅と接
線方向を参照し、図中(図18)細線で示すように、仮
想枠S2の範囲内で各端点1602,1603から仮想
ストロークを中心線として幅のあるストロークを仮作成
する。仮作成したストロークを識別するために、ここで
各仮ストロークに端点別に識別子を付けておく。すなわ
ち、端点1603から作成した仮ストローク上の画素に
は、端点1603を含む仮ストローク上の画素と識別で
きるように各画素に識別子「3」を付ける。また、端点
1602から作成した仮ストローク上の画素にも同様の
理由から、各画素に識別子「2」を付ける。
【0040】次に、図中細線で示すように、各々の端
点1602,1603から作成した仮ストロークが交差
する部分を検出する。特にここでは、図中斜線で示すよ
うに各仮ストロークの境界線の交差した画素(交差点)
1801,1802,1803を求める。 〔交差点1801,1802の検出〕端点1603から
引いた仮ストロークの境界線上の画素(識別子「3」が
付加されている画素)に注目し、端点1602から引い
た仮ストローク上の画素との重なり部分(識別子「2」
が付加されている画素)から重ならない部分(識別子
「2」が付加されていない画素)へと変化した直前の画
素を交差点1801,1802とする。
【0041】〔交差点1802,1803の検出〕端点
1602から引いた仮ストロークの境界線上の画素(識
別子「2」が付加されている画素)に注目し、端点16
03から引いた仮ストローク上の画素との重なり部分
(識別子「3」が付加されている画素)から重ならない
部分(識別子「3」が付加されていない画素)へと変化
した直前の画素を交差点1802,1803とする。
【0042】以上より、端点1603から接線方向が
左下方向に文字幅のあるストロークを作成する。このと
き、交差点1801,1802をつなぐ直線のところま
で描くものとする。 端点1603と同様に端点1602から接線方向が左
方向に文字幅のあるストロークを作成する。このとき、
交差点1802,1803をつなぐ直線のところまで描
くものとする。以上の手順により、図16に示した2値
文字画像が整形され、図19に示すような2値文字画像
となる。これにより、2値文字画像の整形を終了する
(ステップ920)。
【0043】〔実施例3:第3発明〕この実施例3は、
文字画像整形部118の機能が異なるのみで、その他に
ついては実施例2と全く同じである。以下、文字画像整
形部118の機能についてのみ、図20〜図26を参照
しながら説明する。
【0044】図20に示す2値文字画像(「3」)のよ
うに、曲線部分が大きくかすれているようなケースにお
いては、端点2001,2002から濃淡変化の傾きと
距離と位置に加えて、接線方向の相対的関係を元に、各
端点2001,2002から接線(仮想ストローク)を
引いたとしても、図21に点線で示すように仮想ストロ
ークがお互いに交錯しないため、どこで接続すればよい
か判別できない。このようなケースでの文字画像整形処
理の手順について説明する。
【0045】まず、仮想枠S2(図20)内におい
て、ストロークが欠けていると想定される部分の領域
(かすれ領域)を定める。 このかすれ領域を定めるために、端点検出部115に
て予め定められた各端点2001,2002における接
線方向(図21に点線で示す方向)を参照する。 まず、仮想枠S2において、各端点2001,200
2上の接線方向を中心線とした角度が90度となる領域
(図22に示すS3,S4)を定義し、次に各端点20
01,2002同士を結ぶ直結線が領域S3,S4内に
含まれていないので、領域S3,S4にこの直結線を新
たな境界線として付加した領域(図22に示す領域S
5)をかすれ領域と定める。このとき、もし、直結線が
領域S3,S4内にある場合には、この領域S3,S4
を合わせた領域をそのままかすれ領域S5として定義す
る。
【0046】このようにして求めたかすれ領域S5中
の多値画像を多値画像記憶部112に保持されている多
値全面画像から参照する。以上により、かすれ領域S5
の多値画像は図23として表現される。 この中から濃淡値が「6」以上の画素を検出する。こ
こで言う「6」以上という閾値は、予め実験により定め
た値である。この値は、2値画像作成時の2値化閾値に
基づいて設定してもよい。また、かすれ領域S5の濃度
分布を測定し、その分布に基づいて設定してもよい。 以上により検出された画像の内、端点2001,20
02に隣接していない画素に注目すると、図24に示す
ようになる。さらに、これらの画素の内、端点2001
から最も近い画素を検索すると、画素2401を検出で
きる。同様に端点2002からは画素2402が検出で
きる。
【0047】そして、図25に示すように、端点20
01と画素2401とをつなぐ直線L1、画素2401
と画素2402とをつなぐ直線L2、画素2402と端
点2002とをつなぐ直線L3をベースとした文字幅の
あるストローク(図25の太線)を作成する。但し、こ
こで描く文字幅の太さは、端点検出部115にて予め求
められた各端点2001,2002における文字幅と同
じ太さとする。もし、各端点2001,2002におけ
る文字幅の太さが異なる場合は、平均の太さとする。
【0048】以上の手順により、図20に示した2値文
字画像が整形され、図26に示すような2値文字画像と
なる。ここで、図20に示した2値文字画像をリスキャ
ンにより整形したとしても、元々の画像にストロークが
かけているため、図26に示されるような2値文字画像
にはならない。したがって、本実施例における画像整形
法の方がリスキャンに比べ、より正確に整形できること
になる。
【0049】また、この実施例3では、図16に示した
2値文字画像のようなケースにも適用できる。これは、
各端点1602,1603の接線が互いに交錯した場合
ではあるが、この場合も多値画像を参照し、端点160
2,1603間の多値全面画像の情報を線分間の軌跡情
報として得ることにより、この軌跡情報を利用しなが
ら、記入文字形により忠実な文字整形を行うことができ
る。
【0050】
【発明の効果】以上説明したことから明らかなように本
発明によれば、従来の膨張収縮処理に比べ、かすれてい
る部分のみの整形処理を行うことができるため、文字形
の歪みが少なくなり、より正確な整形処理を実行するこ
とができる。また、整形できる対象も大幅に向上できる
ため、読取精度が高まるという効果を奏する。また、リ
スキャン処理と比較してみても、ストロークの欠けにも
対応できる分、より正確に整形でき、読取精度を高める
ことができる。
【0051】特に、第1発明では、非常に単純(微小)
なかすれ、欠けに対して正確な整形を行うことが可能で
ある。例えば、図28(a)に示した2値文字画像の場
合、従来の波形整形方法だと図27(b)のような2値
文字画像となる。これに対して、本発明では、端点と判
定できるので整形が行われず、図27(b)のような2
値文字画像とはならない。また、図28(c)に示した
2値文字画像の場合、従来の膨張収縮処理等の整形を行
うと図28(d)に示すような2値文字画像となるが、
本発明では図27(a)に示すように正確に整形するこ
とが可能となる。
【0052】また、第2発明では、かすれ部分における
仮想ストロークが図27(c),(d)に点線で示すよ
うに直結せず、交錯する場合においても対応可能とな
る。また、第3発明では、図27(e)に示すように、
かすれ部分が大きい場合や仮想ストロークが交錯しない
場合においても対応可能となり、整形できる範囲を広く
することが可能となる。
【図面の簡単な説明】
【図1】 本発明に係る文字読取装置のブロック図であ
る。
【図2】 切り出された文字の2値文字画像を例示する
図である。
【図3】 文字切り出し状況を例示する図である。
【図4】 図2に示した2値文字画像を細線化した画像
を示す図である。
【図5】 端点検出マスクを例示する図である。
【図6】 図2に示した2値文字画像上の黒画素連結成
分205における詳細画像を示す図である。
【図7】 端点204を中心とした「5」×「5」の範
囲内の多値画像を示す図である。
【図8】 端点206を中心とした「5」×「5」の範
囲内の多値画像を示す図である。
【図9】 検出対象範囲の座標系x,yと画素の濃淡値
f(x,y)の関係を示す図である。
【図10】 X方向の1次微分フィルタマスクXを例示
する図である。
【図11】 Y方向の1次微分フィルタマスクYを例示
する図である。
【図12】 実施例1における接続可否判定部および文
字画像整形部の機能を説明するためのフローチャートで
ある。
【図13】 実施例2における接続可否判定部および文
字画像整形部の機能を説明するためのフローチャートで
ある。
【図14】 図2に示した2値文字画像の欠け部分の拡
大図である。
【図15】 図2に示した2値文字画像を整形した後の
2値文字画像を示す図である。
【図16】 切り出された文字の2値文字画像を例示す
る図である。
【図17】 図16に示した2値文字画像に対する外接
枠を示す図である。
【図18】 図16に示した2値文字画像のかすれ部分
の拡大図である。
【図19】 図16に示した2値文字画像を整形した後
の2値文字画像を示す図である。
【図20】 切り出された文字の2値文字画像を例示す
る図である。
【図21】 図20に示した2値文字画像の各端点の接
線方向を示す図である。
【図22】 図20に示した2値文字画像におけるかす
れ領域を示す図である。
【図23】 図20に示したかすれ領域における多値画
像を示す図である。
【図24】 図23に示した多値画像のうち濃淡値が
「6」以上の画素を抽出した状況を示す図である。
【図25】 端点2001,画素2401,画素240
2,端点2002をつないでの整形状況を示す図であ
る。
【図26】 図20に示した2値文字画像を整形した後
の2値文字画像を示す図である。
【図27】 本発明の効果を説明するための2値文字画
像および整形した後の2値文字画像を例示する図であ
る。
【図28】 従来技術の問題点を説明するための2値文
字画像および整形した後の2値文字画像を例示する図で
ある。
【符号の説明】
111…画像入力部、112…多値画像記憶部、113
…2値画像記憶部、114…文字切り出し部、115…
端点検出部、116…濃淡変化率検出部、117…接続
可否判定部、118…文字画像整形部、119…認識
部。

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 用紙上のイメージを光学走査により取り
    込み、文字画像として1文字ずつ切り出し、その読取結
    果を出力する文字読取装置において、 前記光学走査により取り込んだイメージを多値全面画像
    として保持する多値画像保持手段と、 この多値画像保持手段の保持する多値全面画像を2値全
    面画像に変換して保持する2値画像保持手段と、 この2値画像保持手段の保持する2値全面画像から文字
    画像を1文字ずつ切り出す文字切り出し手段と、 この文字切り出し手段によって切り出された文字の2値
    文字画像から端点を検出する端点検出手段と、 この端点検出手段によって検出された端点の位置に対応
    する前記多値全面画像上の位置を参照しその端点位置に
    おける濃淡変化の傾きを検出する濃淡変化検出手段と、 この濃淡変化検出手段の検出する各端点の濃淡変化の傾
    きおよび端点間距離,位置関係に基づき各端点間の接続
    可否を判定する接続可否判定手段と、 この接続可否判定手段により接続可と判定された場合、
    その接続可とされた前記2値文字画像上の端点間を接続
    する画像整形処理手段とを備えたことを特徴とする文字
    読取装置。
  2. 【請求項2】 用紙上のイメージを光学走査により取り
    込み、文字画像として1文字ずつ切り出し、その読取結
    果を出力する文字読取装置において、 前記光学走査により取り込んだイメージを多値全面画像
    として保持する多値画像保持手段と、 この多値画像保持手段の保持する多値全面画像を2値全
    面画像に変換して保持する2値画像保持手段と、 この2値画像保持手段の保持する2値全面画像から文字
    画像を1文字ずつ切り出す文字切り出し手段と、 この文字切り出し手段によって切り出された文字の2値
    文字画像から端点を検出する端点検出手段と、 この端点検出手段によって検出された端点の位置に対応
    する前記多値全面画像上の位置を参照しその端点位置に
    おける濃淡変化の傾きを検出する濃淡変化検出手段と、 この濃淡変化検出手段の検出する各端点の濃淡変化の傾
    きおよび端点間距離,位置関係,接線方向に基づき各端
    点間の接続可否を判定する接続可否判定手段と、 この接続可否判定手段により接続可と判定された場合、
    その接続可とされた前記2値文字画像上の端点間を接続
    する画像整形処理手段とを備えたことを特徴とする文字
    読取装置。
  3. 【請求項3】 請求項1又は請求項2記載の文字読取装
    置において、端点間の多値全面画像の情報を線分間の軌
    跡情報として利用しながら端点間を接続するようにした
    ことを特徴とする文字読取装置。
JP7147370A 1995-06-14 1995-06-14 文字読取装置 Expired - Fee Related JP2785747B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7147370A JP2785747B2 (ja) 1995-06-14 1995-06-14 文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7147370A JP2785747B2 (ja) 1995-06-14 1995-06-14 文字読取装置

Publications (2)

Publication Number Publication Date
JPH096909A true JPH096909A (ja) 1997-01-10
JP2785747B2 JP2785747B2 (ja) 1998-08-13

Family

ID=15428700

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7147370A Expired - Fee Related JP2785747B2 (ja) 1995-06-14 1995-06-14 文字読取装置

Country Status (1)

Country Link
JP (1) JP2785747B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6537732B2 (en) 2000-02-02 2003-03-25 Tdk Corporation Resist pattern and method of forming same, method of forming thin-film pattern, and method of manufacturing micro device
JP2006350680A (ja) * 2005-06-16 2006-12-28 Fuji Xerox Co Ltd 画像処理装置、および画像処理方法、並びにコンピュータ・プログラム
JP2007058283A (ja) * 2005-08-22 2007-03-08 Fuji Xerox Co Ltd 教材処理装置、教材処理方法および教材処理プログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6537732B2 (en) 2000-02-02 2003-03-25 Tdk Corporation Resist pattern and method of forming same, method of forming thin-film pattern, and method of manufacturing micro device
JP2006350680A (ja) * 2005-06-16 2006-12-28 Fuji Xerox Co Ltd 画像処理装置、および画像処理方法、並びにコンピュータ・プログラム
JP2007058283A (ja) * 2005-08-22 2007-03-08 Fuji Xerox Co Ltd 教材処理装置、教材処理方法および教材処理プログラム
JP4701918B2 (ja) * 2005-08-22 2011-06-15 富士ゼロックス株式会社 教材処理装置、教材処理方法および教材処理プログラム

Also Published As

Publication number Publication date
JP2785747B2 (ja) 1998-08-13

Similar Documents

Publication Publication Date Title
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
US8019132B2 (en) System for recognizing fingerprint image, method and program for the same
CN112183038A (zh) 一种表格识别套打方法、计算机设备及计算机可读存储介质
JP3830998B2 (ja) 罫線除去方法及びこれを用いた文字認識装置
JP3006466B2 (ja) 文字入力装置
JP2785747B2 (ja) 文字読取装置
JP3494388B2 (ja) 指紋照合方法および指紋照合装置
JP2871590B2 (ja) 画像抽出方式
EP0476873B1 (en) Method of and apparatus for separating image regions
JP2985893B2 (ja) パターン認識装置
JP2002133424A (ja) 文書の傾き角度及び境界の検出方法
JP2812256B2 (ja) 文字認識装置および方法
JP2674475B2 (ja) 文字読取装置
JP6797763B2 (ja) 文字認識装置
JP3710164B2 (ja) 画像処理装置及び方法
JP2963508B2 (ja) 文字切出し装置
JP2677007B2 (ja) 線判別システム
JPH1021332A (ja) 非線形正規化方法
JPH06139338A (ja) 指紋紋様分類装置
JP2983448B2 (ja) 図面認識方法
JP3365941B2 (ja) 文字パターン認識方法及びその装置
JPH0877293A (ja) 文字認識装置および文字認識用辞書作成方法
JP3127413B2 (ja) 文字認識装置
JP3277977B2 (ja) 文字認識方法
JPH11232463A (ja) 画像認識装置および方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090529

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100529

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110529

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110529

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120529

Year of fee payment: 14

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120529

Year of fee payment: 14

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130529

Year of fee payment: 15

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140529

Year of fee payment: 16

LAPS Cancellation because of no payment of annual fees