JP3104355B2 - 特徴抽出装置 - Google Patents

特徴抽出装置

Info

Publication number
JP3104355B2
JP3104355B2 JP03351225A JP35122591A JP3104355B2 JP 3104355 B2 JP3104355 B2 JP 3104355B2 JP 03351225 A JP03351225 A JP 03351225A JP 35122591 A JP35122591 A JP 35122591A JP 3104355 B2 JP3104355 B2 JP 3104355B2
Authority
JP
Japan
Prior art keywords
pixel
value
continuity
attribute
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP03351225A
Other languages
English (en)
Other versions
JPH05166008A (ja
Inventor
潔 田代
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP03351225A priority Critical patent/JP3104355B2/ja
Publication of JPH05166008A publication Critical patent/JPH05166008A/ja
Application granted granted Critical
Publication of JP3104355B2 publication Critical patent/JP3104355B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Description

【発明の詳細な説明】
【産業上の利用分野】本発明は文字等の画像を認識する
装置に関する。
【0001】
【従来の技術】文字や記号等を認識するための処理を行
なうには、各々の文字や記号の形状の差異を良く表し、
かつ変形や雑音に影響されにくいような特徴を、対象と
する画像から抽出する必要がある。
【0002】文字や記号は、これを細かい領域に分解す
れば、縦、横、斜め方向のいずれかの線になるので、各
領域に表れた線の方向がその文字や記号の特徴として、
その認識のために有効である。また線の太さに影響され
ないようにするためには、輪郭部のみから特徴を抽出す
ることも有効である。例えば、「外郭方向寄与度特徴に
よる手書き漢字の識別」(電子通信学会論文(D)昭5
8ー論488[Dー143] 萩田、内藤、増田)のよ
うに、輪郭画素から複数の方向に画像を走査して黒画素
が連続する数を調べ、各連結数の割合を特徴とするもの
や、特開昭63ー293691号公報あるいは特開昭6
3ー219089号公報のように文字の輪郭において周
辺画素の状態を調べ、方向を判定して特徴とするもの等
が知られている。
【0003】
【発明が解決しようとする課題】しかし上記論文の方法
においては、特徴の数値は小数で表され、また各方向に
ついての数値を特徴として保持しなければならないため
に、データ量が多くなったり、装置が複雑になったり、
特徴の抽出や比較に時間がかかったりする。
【0004】また、上記の公開特許公報の方法において
は、周辺の画素の状態しか反映しないため、実際の文字
や記号を構成する線の方向を表さなかったり、雑音など
による輪郭部の細かな凸凹の悪影響を受けたりする。特
に輪郭部では2値化の際の値に近い濃度を持っている画
素が多いため、わずかな雑音により白画素と判定された
り、黒画素と判定されたりするため、凸凹等の変動が多
く発生する。また、輪郭を追跡する処理は並列化するこ
とが難しく特徴の抽出に時間がかかる。
【0005】本発明は、上記のような問題点を解決し、
文字や記号を構成する線の位置や方向を有効に表す特徴
を高速で求めるための簡単かつ並列処理が可能な方法に
より、文字や記号を識字率高く、かつ短時間で認識する
手段を提供することをこの発明の目的とする。
【0006】
【問題点を解決するための手段】第1の発明は、入力画
像の各画素を対象に、複数の方向に対する連続性を調
べ、その連続性を表す方向連続値を各方向に対して付与
する方向連続値付与手段と、この方向連続値付与手段に
より得られた各画素の方向連続値に基づいて注目画素が
どの方向属性を持つか判定する方向属性判定手段と、前
記方向属性判定手段により判定された方向属性を持つ画
素を各方向属性毎に計数する方向属性計数手段とを有す
ることを特徴とする。
【0007】第2の発明は、入力画像の各画素を対象
に、複数の方向に対する連続性を調べ、その連続性を表
す方向連続値を各方向に対して付与する方向連続値付与
手段と、この方向連続値付与手段により得られた各画素
の方向連続値を、入力画像に相当する空間において拡散
させる処理を行い、方向連続値を変更する方向連続値拡
散手段と、この方向連続値拡散手段により変更された各
画素の方向連続値に基づいて注目画素がどの方向属性を
持つか判定する方向属性判定手段と、前記方向属性判定
手段により判定された方向属性を持つ画素を各方向属性
毎に計数する方向属性計数手段とを有することを特徴と
する。
【0008】第3の発明は、入力画像の各画素を対象
に、複数の方向に対する連続性を調べ、その連続性を表
す方向連続値を各方向に対して付与する方向連続値付与
手段と、この方向連続値付与手段により得られた各画素
の方向連続値に基づいて注目画素がどの方向属性を持つ
か判定する方向属性判定手段と、入力画像に相当する空
間を複数の領域に分割する領域分割手段と、この領域分
割手段により分割された領域内で、前記方向属性判定手
段により判定された方向属性を持つ画素を各方向属性毎
にそれぞれ計数する方向属性計数手段とを有することを
特徴とする。
【0009】第4の発明は、力画像の各画素を対象に、
複数の方向に対する連続性を調べ、その連続性を表す方
向連続値を各方向に対して付与する方向連続値付与手段
と、この方向連続値付与手段により得られた各画素の方
向連続値を、入力画像に相当する空間において拡散させ
る処理を行い、方向連続値を変更する方向連続値拡散手
段と、この方向連続値拡散手段により変更された各画素
の方向連続値に基づいて注目画素がどの方向属性を持つ
か判定する方向属性判定手段と、入力画像に相当する空
間を複数の領域に分割する領域分割手段と、この領域分
割手段により分割された領域内で、前記方向属性判定手
段により判定された方向属性を持つ画素を各方向属性毎
にそれぞれ計数する方向属性計数手段とを有することを
特徴とする。
【0010】
【作用】第1の発明によれば、入力画像の各画素は、ま
ず方向連続値付与手段において複数の方向に対する連続
性が調べられ、その連続性を表す方向連続値が各方向に
対して付与される。次ぎに、方向属性判定手段におい
て、方向連続値付与手段により得られた各画素の方向連
続値に基づいて注目画素がどの方向属性を持つか判定さ
れる。そして最後に、方向属性計数手段において、方向
属性判定手段により判定された方向属性を持つ画素が各
方向属性毎に計数される。したがって、入力画像の各画
素の方向連続値を求めるようにしたので、入力画像を構
成する線の大局的な位置と方向を含む特徴を得ることが
できる。
【0011】また、第2の発明は、第1の発明に対し、
方向連続値付与手段により得られた各画素の方向連続値
を、入力画像に相当する空間において拡散させる処理を
行い、方向連続値を変更する方向連続値拡散手段を設け
たものであり、入力画像の輪郭部の凹凸の影響を方向連
続値拡散手段により拡散させることができる。
【0012】さらに、第3,4の発明は、第1,2の発
明に対し、入力画像に相当する空間を複数の領域に分割
する領域分割手段を設け、この領域分割手段により分割
された領域内で各方向属性を持つ画素を計数するように
したもので、より正確に特徴を抽出することができる。
【0013】
【実施例】以下、図面により本発明の実施例を説明す
る。
【0014】第1図において101は文書等を光学的に
読み取り、光電変換してその文字や記号等を画像データ
とする画像入力装置である。102は入力された画像に
対して2値化、ノイズ成分除去等の処理を行い、その画
像中から1文字に相当する単位領域を順次検出し、その
領域内の画像データを出力する前処理装置である。10
3は本発明の主要部を成す特徴抽出装置である。104
は前記の前処理装置102および特徴抽出装置103を
用いて、予め標準の文字画像から抽出した特徴を、文字
コードと対応して格納する辞書パターン格納装置であ
る。105は特徴抽出装置103から出力された文字画
像の特徴パターンを、辞書パターン格納装置104内の
複数の標準文字画像の特徴と比較し、その結果に応じた
文字コードを出力する特徴比較装置である。
【0015】第2図に本発明の主要部をなす特徴抽出装
置103の内部構成を示す。201は画像の各画素を対
象に、複数の方向についてこれに連続する他の画素との
連続性を調べ、その連続性の表す方向連続値を各方向に
対して付与する方向連続値付与部である。202は各画
素に付与された各方向に対する方向連続値を拡散させる
処理を行ない、各画素の方向連続値を修正する方向連続
拡散部である。203は方向連続拡散部202で処理さ
れた方向連続値をもとに各画素がこの方向属性を持つか
を判定する方向属性判定部である。204は一文字の占
める単位領域を規定の形状で多数の素領域に分割する領
域分割部である。205は各素領域において判定された
各方向属性を持つ画素数を計数する方向属性計数部であ
る。206は一文字が占める単位領域において各素領域
の画像の方向属性計数値を集合して、画像特長パターン
を抽出する方向属性集合部である。
【0016】今、この特徴抽出装置103の動作につい
て詳細に述べる。特徴抽出装置に入力される画像は2値
化されているとする。本実施例において各方向に連続す
る画素の列として抽出すべき複数の方向を第3図に示す
ような垂直、水平、右上がり、45度、左あがり45度
の4つの方向とする。以下の説明ではこれらの4つの方
向をそれぞれV、H、R、Lと呼ぶ。本発明の実際の応
用において、抽出方向はこの4つに制約されるものでは
ない。
【0017】まず、方向連続値付与部201における処
理について説明する。方向連続値付与部201におい
て、各画素に付与される方向連続値の定義は、1箇の注
目画素から各方向の両方の向きに画像を走査したときに
黒画素が連続する箇数とする。例えば第4図に示す例で
は、注目画素403からH方向の右向き、左向きにそれ
ぞれ画像を走査すると、6箇の黒画素が連続しているの
で、注目画素403におけるH方向の方向連続値は
「6」である。また注目画素が白画素の場合は各方向の
方向連続値は「0」とする。
【0018】注目画素403の他の方向連続値は同様に
してVが「3」、Rが「3」、そしてLが「5」であ
る。
【0019】本実施例で使用する上記の方向連続値は、
単純かつ並列化可能な方法で得ることができる。この方
法を用いてH方向の方向連続値を抽出する例を第5図及
び第11図を用いて説明する。第5図、第11図におい
て、Px,yは入力画像の画素x,yの座標値、Hx,yは水
平方向連続値、wは画素幅、hは画素高さを示す。まず
ステップ10、11において、y=0、x=1を代入し
て初期化する。次ぎにステップ12において、P0,y
黒画素であるか否かを判定する。黒画素でなければステ
ップ13へ進み、H0,yを0とし、一方黒画素であれば
ステップ14へ進み、H0,yを1とする。第5図(a)
に示す画素列の例ではP0,0は白であるから、ステップ
13へ進み、H1,0は0となる。次ぎにステップ15へ
進み、Px,yが黒画素であるか否かを判定する。黒画素
でなければステップ16へ進み、Hx,yを0とし、、一
方黒画素であれば左隣りの水平方向連続値Hx-1,yに1
を加算する。第5図(a)に示す画素列のの例ではP
1,0は白であるから、ステップ16に進み、H1,0は0と
なる。次ぎにステップ18へ進み、xをインクリメント
し、ステップ19ではxがw未満であるか否か(即ち、
右端まで走査したか否か)を判断し、x<wであればス
テップ15に戻り、x<wでなくなるまでステップ15
〜19の処理を繰り返す。これによりH方向に並ぶ一列
の画素列が走査され、第5図(b)に示すように一次的
な水平方向連続値Hx,0が決定される。ステップ19に
おいて、x<wでないと判定された場合は次のステップ
20へ進み、x=w−2を代入する。2を引くのは、右
端の画素501はすでに最終的な水平方向連続値が求ま
っているためである。次ぎにステップ21へ進み、注目
画素が0ではなく(即ち、黒)、かつ注目画素の右隣り
の画素が0でない(即ち、黒)か否かを判定する。注目
画素が黒で、かつ右隣りの画素が黒の場合は、ステップ
22へ進み、注目画素に付与された値を右隣りの画素に
付与された値に等しくする。例えば注目画素503の場
合は、右隣りの画素592の値「2」と等しくする。注
目画素が白または右隣りの画素が白である場合は何も行
わず、ステップ23へ進み、x=x−1とし、次ぎのス
テップ24においてx≧0か否か(即ち、左端まで走査
したか否か)を判定する。x≧0であればステップ15
に戻り、x≧0でなくなるまでステップ21〜24の処
理を繰り返す。以上の1往復の走査処理により、第5図
(c)に示すように、H方向に並ぶ一列の画素列に含ま
れる全画素のH方向の方向連続値が一度に求まる。ステ
ップ24においてx≧0ではないと判定された場合は次
ぎのステップ25へ進み、y=y+1として次の行へ移
り、さらにステップ26においてy<hであるか否か
(即ち、最終行まで走査したか否か)を判定する。y<
hであればステップ11へ戻り、y<hでなければ処理
を終了する。以上の処理は他のH方向に並ぶ画素列とは
互いに独立に行なえるので並列化が可能である。
【0020】他のV、R、L方向の方向連続値も、それ
ぞれV、R、L方向に並ぶ一列の画素列に対して同様の
処理を行うことにより求めることができる。
【0021】方向連続値拡散部における処理の目的は、
方向属性判定部において各画素に付与される方向属性
が、輪郭部の細かな凸凹の悪影響を受けないように、方
向連続値を修正することである。したがって、実際の処
理では方向連続値拡散部における処理が先であるが、説
明では方向属性判定部における処理を先にする。
【0022】方向属性判定部では、方向連続値付与部に
より各画素に付与され、方向連続値拡散部により更新さ
れた、各方向に対する方向連続値から、その画素がどの
方向属性を持つかを判定し、方向属性をその画素に付与
する。本実施例では各画素についてV、H、R、Lの4
方向に対する方向連続値がそれぞれ付与されている。
【0023】第12図において、方向属性判定部の処理
例が示され、まずステップ27、28おいてx=0,y
=0とし、次ぎにステップ29〜31へ進み、方向連続
値拡散部で更新された方向連続値V’x,y、H’x,y
R’x,y、L’x,yを比較し、ステップ32〜35におい
て最大の方向連続値を与える方向を、その画素に付与す
る方向属性Cx,yとする。例えば、前記した注目画素4
03において最大の方向連続値を持つ方向は「H」であ
るから、この画素に付与する方向属性は「H」である。
最大の方向連続値を与える方向が複数ある場合は、それ
らの方向をすべて付与する。但し、R、L方向連続値は
斜め45度に並ぶ画素を計数しているため、幾何的な長
さとして、H、V方向連続値に対して2の平方根を乗じ
て評価する必要がある。従って、上記方向連続値の比較
の際には、R、L方向の方向連続値に2の平方根を乗じ
た上で比較を行う。次ぎにステップ36へ進み、y=y
+1として次の行へ移り、さらにステップ26において
y<hであるか否か(即ち、最終行まで走査したか否
か)を判定する。y<hであればステップ29へ戻り、
ステップ29〜37の処理を繰り返す。y<hでなけれ
ば次のステップ38へ進み、x=x+1として次の列へ
移り、さらにステップ26においてx<wであるか否か
(即ち、左端まで走査したか否か)を判定する。x<w
であればステップ28へ戻り、x<wでなければ処理を
終了する。
【0024】尚、方向属性を付与する画素は、文字の輪
郭部の画素とすることが好ましい。輪郭部の画素の定義
は、その画素が黒であり、かつ上下左右4隣接の画素の
少なくとも1つが白であるような画素とする。
【0025】次に方向連続拡散部における処理について
説明する。方向連続付与部で得られた方向連続値をその
まま用いて、方向属性判定部で方向属性を付与すること
も可能であるが、輪郭部の細かな凸凹などにより方向属
性が変動してしまうという問題点がある。この問題点を
第6図を用いて説明する。第6図(a)に示すような画
像を例にすると、このように水平に長い線の輪郭には、
方向属性「H]を付与することが、特徴を表す意味で自
然である。この画像に対して方向連続値付与部で得られ
たH方向の方向連続値を第6図(b)に示す。H方向に
対する方向連続値は、線の内部では大きな値が得られて
いるが、輪郭部、特に突き出した部分では小さな値しか
得られない。故にこの方向連続値を用いて方向属性を判
定すると、第6図(c)で黒丸で示した輪郭画素は方向
属性が「H」にならず他の方向属性となってしまう。
【0026】この問題を補うために、線の内部で得られ
ている大きな方向連続値を画像上で拡散させ、輪郭部の
画素にも大きな方向連続値を付与する処理が有効であ
る。第13図において、方向連続拡散部の処理例が示さ
れ、まずステップ40においてx=0とし、次のステッ
プ41へ進み、方向連続値付与部で求めた第1行の画素
の方向連続値Hx,0と第2行の方向連続値Hx,1とを比較
し、いずれか最大である値を方向連続値H’x,0として
付与し直す。次ぎにステップ42へ進み、y=1とし、
さらにステップ43へ進み、注目画素の方向連続値H
x,y、その上の行の方向連続値Hx,y-1及びその下の行の
方向連続値Hx,y+1とを比較し、その中で最大である値
を方向連続値H’x,yとして付与し直す。次ぎにステッ
プ44へ進み、y=y+1とし、さらにステップ45へ
進み、y<h−1であるか否か(即ち、最終行より1つ
手前の行まで走査したか否か)を判定し、y<h−1で
あればステップ43へ戻り、ステップ43〜45の処理
を繰り返す。一方、y<h−1でなければ次のステップ
46へ進み、最終行の方向連続値Hx,h-1とその1つ手
前の行の方向連続値Hx,h-2とを比較し、いずれか最大
である値を方向連続値H’x,h-1として付与し直す。次
ぎにステップ47へ進み、x=x+1とし、さらに次の
ステップ48へ進み、x<wであるか否か(即ち、左端
まで走査したか否か)を判定し、x<wであればステッ
プ41へ戻り、x<wでなければ処理を終了する。第6
図(b)に示した方向連続値を、この処理によって更新
すると第6図(d)に示すような方向連続値が得られ
る。例えば第6図(c)に示めす突起部の輪郭画素60
5においては、更新前では方向連続値「2」が付与され
ていたが、更新後では同じ座標位置の画素605’に
「13」が付与されて十分に大きな方向連続値が得られ
ている。この方向連続値を用いて方向属性を判定する
と、この図形の輪郭部の画素は全て方向属性が「H」と
なり輪郭部の凸凹に左右されずに大局的な線の方向を正
確に抽出することができる。
【0027】他のV,R,L方向に対する方向連続値に
も同様の更新処理を行う。本実施例においてV,H,
R,L各方向に対する方向連続値の更新処理で参照する
画素の範囲を第7図に示す。
【0028】領域分割部は、入力画像に相当する空間を
素領域に分割するためのもので、この実施例において
は、第8図のごとく1文字の占める領域800を縦横各
3分割、合計9箇の素領域に分割している。
【0029】次に方向属性計数部における処理について
説明する。方向属性計数部では、各素領域内で各方向属
性を持つ画素を計数する。本実施例では第8図(a)の
ように文字画像を9つの領域に分割し、各領域内でV,
H,R,Lの4つの方向属性を持つ画素を計数するの
で、第9図(a)に示すように、9×4=36種類の値
として得られる。
【0030】第14図において、方向属性計数部の処理
例が示され、ここで、Mnは素領域の番号、Fnは第15
図に示すデータ領域、Nは素領域の数(第8図の例では
N=9)をそれぞれ表す。まずステップ49においてn
=0とし、次のステップ50〜53において、素領域M
n内で各方向属性V,H,R,Lを持つ画素を計数し、
データ領域Fn,Fn+N,Fn+2N,Fn+3Nにそれぞれ代入
する。次ぎにステップ54へ進み、n=n+1とし、さ
らに次のステップ55に進み、n<Nであるか否か判定
し、n<Nであればステップ50に戻り、ステップ50
〜55の処理を繰り返し、n<Nでなければ処理を終了
する。これにより第15図に示すように各方向属性V,
H,R,L毎に並べられたデータを得ることができる。
【0031】第8図の例において、画像の輪郭に存在す
るすべての画素に対して方向属性を付与すれば、第8図
(c)の例に示すものとなる。第8図(b)は素領域8
02を拡大して示したものであるが、素領域の画像81
0の周辺画素811に注目して、前記したプロセスによ
ってこの画素の方向属性を判定すれば、これは「L」で
ある。画像のすべての周辺画素に対して各方向属性を判
定して、素領域802において各方向についての方向属
性を持つ画素を計数すれば、「H」が0、「V」が1
4、「R」が3、「L」が5箇の存在が確認できる。
【0032】方向属性集合部は各素領域801、80
2、803、…809において各方向属性の画素を計数
した結果を1文字分の単位領域800に集合して第9図
(b)に示すパターンを作り出す。これが読み取った文
字や記号等を処理して抽出した画像特徴パターンであ
る。
【0033】さて辞書パターン格納装置104は、予め
標準の文字から以上述べたのと同じ手段で画像特徴を抽
出して、これら標準文字の画像特徴パターンを格納した
メモリである。
【0034】特徴比較装置105に方向属性集合部20
6から出力された読み取り画像の画像特徴パターンが入
力され、一方、辞書パターン格納装置104から順次に
呼び出された標準文字の画像特徴パターンと比較され
る。両パターンが最も近似したものをもって認識した文
字または記号とする。
【0035】両パターンの近似度を判定する手段の例と
して、両画像特徴パターンの間のユークリッド距離を計
算するという方法がある。両パターンを第10図に示す
ものとして、この間のユークリッド距離は次式である。
【0036】
【数1】
【0037】この認識結果は、この装置が組み込まれる
システムにおいて規定された文字コード(例えばASC
II)に変換されて、この文字等の認識装置から出力さ
れる。
【0038】本実施例では、本発明に含まれる画像特徴
抽出装置を文字等の認識に利用する場合について説明を
行ったが、本発明の原理によって得られる手段は図形の
認識、文字と図面の分離などにも広く応用が可能であ
る。
【0039】本実施例では方向連続値の定義を、注目画
素から各方向の両方の向きに画像を走査したときに黒画
素が連続する箇数としたが、他の定義を用いてもよい。
例えば、走査の途中で少数の白画素が出現し、再び黒画
素が連続している場合は計数を続けることにより、雑音
に左右されにくくすることも可能である。また注目画素
から各方向の両方の向きに一定の範囲内を走査したとき
に出現する黒画素の箇数としてもよい。また、実施例で
は白画素には方向連続値「0」を付与したが、注目画素
から各方向の両方の向きに画像を走査したときに白画素
が連続する箇数を方向連続値とすることにより白画素に
も「0」以外の方向連続値を付与することも可能であ
る。また本実施例では2値画像を対象としたが、多値画
像を対象とし、注目画素から各方面の両方の向きに一定
の範囲内を走査したときの濃度の総和などを方向連続値
としてもよい。
【0040】本実施例では方向連続値拡散部202にお
ける処理で、注目画像の付近の画素の方向連続値の最大
値を用いたが、付近の画素の平均値などを代わりに用い
てもよい。
【0041】本実施例では方向連続性判定部203の処
理において最大の方向属性を与える方向が複数ある場合
は、それらの方向すべてを方向属性として付与したが、
いずれか一つの方向のみを方向属性として付与してもよ
い。
【0042】本実施例では輪郭部の画素の定義をその画
素が黒であり、かつ上下左右4隣接の画素の少なくとも
一つが白であるような画素としたが、その画素が黒であ
り、上下左右8隣接の画素の少なくとも1つが白である
ような画素としてもよい。また本実施例では輪郭部の画
素にのみ方向属性を付与したが、全黒画素に方向属性を
付与してもよい。輪郭部のみに方向性を付与する方法に
よれば、文字の線の太さが変わっても方向属性を持つ画
素の数の変化が小さく、画像特徴の抽出が安定してでき
る。
【0043】また画像の芯線を抽出して芯線上の画素に
方向属性を付与してもよい。また、白画素にも方向属性
値を付与した上で白画素に方向属性を付与してもよい。
【0044】本実施例では単位領域を9つの素領域に分
解したが、分解の数は前述したよううに9つに限らな
い。また、各素領域が重なり合ってもかまわない。ま
た、方向属性を持つ画素の各方向別集計は素領域内の総
ての方向について行うことを省略し、素領域の位置に応
じて一部の方向属性についてのみ行ってもよい。
【0045】本実施例では特徴比較装置105におい
て、パターン間の近似度の尺度としてユークリッド距離
を用いたが、他の尺度でもよい。例えば、マハラノビス
距離、単純類似度、複合類似度などが応用可能である。
【0046】
【発明の効果】以上、詳細に行った説明のように本発明
の文字等の認識装置は画像の各画素に対して方向連続値
を付与、この方向連続値に対してこれを拡散する処理を
行うので、文字の輪郭における細かい凸凹や対象領域に
おける汚れ等の雑音からの悪影響が取り除かれる。取り
扱うデータは整数であり、また本構成によるプロセスは
並列処理が可能であるから全体の処理が高速化される。
また、本構成は従来の技術に比べて簡単である。したが
って文字等の特徴抽出に時間がかからず、また識字率が
向上し、装置を経済的に提供できる。
【0047】
【図面の簡単な説明】
【図1】本発明の文字等の全体構成図、
【図2】本発明に具備される特徴抽出装置の構成を示す
構成図、
【図3】実施例で用いる4方向の説明図、
【図4】方向連続値の説明図、
【図5】方向連続値の抽出方法の説明図、
【図6】方向連続値拡散部の処理の説明図、
【図7】同上の実施例において各方向に対する方向連続
値の更新処理で参照する画素範囲を示す説明図、
【図8】領域分割部により分割する素領域の一例を示す
説明図、
【図9】画像特徴パターンを示す説明図、
【図10】第10図はユークリッド距離計算式の記号を
示す説明図、
【図11】水平方向の方向連続値を抽出する処理の例を
示すフローチャート、
【図12】方向属性を付与する処理の例を示すフローチ
ャート、
【図13】水平方向の方向連続値を拡散させる処理の例
を示すフローチャート、
【図14】方向属性を計数し特徴量を求める処理の例を
示すフローチャート、
【図15】計数した方向属性を格納するデータ領域を示
す説明図。
【符号の説明】 101:画像入力装置、102:前処理装置、103:
特徴抽出装置、104:辞書パターン格納装置、10
5:特徴比較装置、201:方向連続値付与部、20
2:方向連続値拡散部、204:領域分割部、205:
方向属性計数部、206:方向属性集合部、301:画
素、401、501、601:白画素、402、50
2、602:黒画素、403、701、702、70
3、704、811:注目画素、603:方向連続値付
与部で得られるH方向の方向連続値、604:方向属性
が「H」になる輪郭部の画素、605:方向属性が
「H」以外になる輪郭画素の画素、606:方向連続値
拡散部で得られるH方向の方向連続値、800:1文字
分の単位領域、801、802、…809:素領域。
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平3−175591(JP,A) 特開 平3−182986(JP,A) 特開 昭59−184977(JP,A) 特開 昭63−157290(JP,A) 特開 平2−15388(JP,A) 特開 平2−228788(JP,A) 特開 平2−187884(JP,A) 特開 昭56−87169(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06K 9/46 G06K 9/48 G06K 9/62 G06T 7/60 JICSTファイル(JOIS)

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】入力画像の各画素を対象に、複数の方向に
    対する連続性を調べ、その連続性を表す方向連続値を各
    方向に対して付与する方向連続値付与手段と、 この方向連続値付与手段により得られた各画素の方向連
    続値を、入力画像に相当する空間において、輪郭内部の
    画素の方向連続値を輪郭画素の方向連続値に拡散させる
    処理を行うことによって、方向連続値を変更する方向連
    続値拡散手段と、この方向連続値拡散手段により変更さ
    れた各画素の方向連続値に基づいて注目画素がどの方向
    属性を持つか判定する方向属性判定手段と、 前記方向属性判定手段により判定された方向属性を持つ
    画素を各方向属性毎に計数する方向属性計数手段とを有
    することを特徴とする特徴抽出装置。
  2. 【請求項2】入力画像の各画素を対象に、複数の方向に
    対する連続性を調べ、その連続性を表す方向連続値を各
    方向に対して付与する方向連続値付与手段と、 この方向連続値付与手段により得られた各画素の方向連
    続値を、入力画像に相当する空間において、輪郭内部の
    画素の方向連続値を輪郭画素の方向連続値に拡散させる
    処理を行うことによって、方向連続値を変更する方向連
    続値拡散手段と、 この方向連続値拡散手段により変更された各画素の方向
    連続値に基づいて注目画素がどの方向属性を持つか判定
    する方向属性判定手段と、 入力画像に相当する空間を複数の領域に分割する領域分
    割手段と、 この領域分割手段により分割された領域内で、前記方向
    属性判定手段により判定された方向属性を持つ画素を各
    方向属性毎にそれぞれ計数する方向属性計数手段とを有
    することを特徴とする特徴抽出装置。
  3. 【請求項3】入力画像の各画素を対象に、複数の方向に
    対する連続性を調べ、その連続性を表す方向連続値を各
    方向に対して付与するステップ1と、 前記ステップ1により得られた各画素の方向連続値を、
    入力画像に相当する空間において、輪郭内部の画素の方
    向連続値を輪郭画素の方向連続値に拡散させる処理を行
    うことによって、方向連続値を変更するステップ2と、 前記ステップ2により変更された各画素の方向連続値に
    基づいて注目画素がどの方向属性を持つか判定するステ
    ップ3と、 前記ステップ3により判定された方向属性を持つ画素を
    各方向属性毎に計数するステップ4とを有することを特
    徴とする特徴抽出方法。
  4. 【請求項4】入力画像の各画素を対象に、複数の方向に
    対する連続性を調べ、その連続性を表す方向連続値を各
    方向に対して付与するステップ1と、 前記ステップ1により得られた各画素の方向連続値を、
    入力画像に相当する空間において、輪郭内部の画素の方
    向連続値を輪郭画素の方向連続値に拡散させる処理を行
    うことによって、方向連続値を変更するステップ2と、 前記ステップ2により変更された各画素の方向連続値に
    基づいて注目画素がどの方向属性を持つか判定するステ
    ップ3と、 入力画像に相当する空間を複数の領域に分割するステッ
    プ4と、 前記ステップ4により分割された領域内で、前記ステッ
    プ3により判定された方向属性を持つ画素を各方向属性
    毎にそれぞれ計数するステップ5とを有することを特徴
    とする特徴抽出方法。
JP03351225A 1991-12-13 1991-12-13 特徴抽出装置 Expired - Fee Related JP3104355B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03351225A JP3104355B2 (ja) 1991-12-13 1991-12-13 特徴抽出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03351225A JP3104355B2 (ja) 1991-12-13 1991-12-13 特徴抽出装置

Publications (2)

Publication Number Publication Date
JPH05166008A JPH05166008A (ja) 1993-07-02
JP3104355B2 true JP3104355B2 (ja) 2000-10-30

Family

ID=18415896

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03351225A Expired - Fee Related JP3104355B2 (ja) 1991-12-13 1991-12-13 特徴抽出装置

Country Status (1)

Country Link
JP (1) JP3104355B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2973944B2 (ja) * 1996-06-26 1999-11-08 富士ゼロックス株式会社 文書処理装置および文書処理方法

Also Published As

Publication number Publication date
JPH05166008A (ja) 1993-07-02

Similar Documents

Publication Publication Date Title
US4903312A (en) Character recognition with variable subdivisions of a character region
US5321770A (en) Method for determining boundaries of words in text
EP0483391B1 (en) Automatic signature verification
US5373566A (en) Neural network-based diacritical marker recognition system and method
US4757551A (en) Character recognition method and system capable of recognizing slant characters
US5841905A (en) Business form image identification using projected profiles of graphical lines and text string lines
US4556985A (en) Pattern recognition apparatus
US5054102A (en) Self-centering character stroke thickening for optical character recognition
US4628533A (en) Pattern recognition apparatus
JP3104355B2 (ja) 特徴抽出装置
JP4390523B2 (ja) 最小領域による合成画像の分割
JP4194309B2 (ja) 文書方向推定方法および文書方向推定プログラム
JP3113769B2 (ja) 文字認識装置
JP2865529B2 (ja) 指紋照合装置
JP2832928B2 (ja) 文字認識方法
JP2613211B2 (ja) 画像入力装置
JPH03126188A (ja) 文字認識装置
JP3127413B2 (ja) 文字認識装置
JP3578247B2 (ja) 文字認識方法および装置
JP2575402B2 (ja) 文字認識方法
JP3365941B2 (ja) 文字パターン認識方法及びその装置
JPH02166583A (ja) 文字認識装置
JP3009237B2 (ja) 特徴抽出方法
JPH0159627B2 (ja)
JPH0495180A (ja) 線分・曲線認識方式

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070901

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080901

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090901

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100901

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110901

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees