JP2792656B2 - 手書き数字認識における細線化データの途切れ修復方式 - Google Patents

手書き数字認識における細線化データの途切れ修復方式

Info

Publication number
JP2792656B2
JP2792656B2 JP63227545A JP22754588A JP2792656B2 JP 2792656 B2 JP2792656 B2 JP 2792656B2 JP 63227545 A JP63227545 A JP 63227545A JP 22754588 A JP22754588 A JP 22754588A JP 2792656 B2 JP2792656 B2 JP 2792656B2
Authority
JP
Japan
Prior art keywords
end points
data
thinned data
interruption
sector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP63227545A
Other languages
English (en)
Other versions
JPH0276088A (ja
Inventor
博史 亀山
章司 三木
和彦 大西
勝司 魚崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Glory Ltd
Original Assignee
Glory Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Glory Ltd filed Critical Glory Ltd
Priority to JP63227545A priority Critical patent/JP2792656B2/ja
Publication of JPH0276088A publication Critical patent/JPH0276088A/ja
Application granted granted Critical
Publication of JP2792656B2 publication Critical patent/JP2792656B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】 発明の目的: (産業上の利用分野) この発明は、手書き数字認識における細線化データの
途切れを正しく修復するための方式に関する。
(従来の技術) 手書き数字を読取ったデータを細線化処理した後に端
点,分岐点に基づいてブランチを決定し、このブランチ
のデータ構成を分析して、例えばブランチの形状によっ
てブランチを直線,円(ループ),円弧(アーク)の3
種類に分類して、その組合せパターンによって数字を認
識する方法を本出願人は特願昭62−274797号で出願して
いる。すなわち、文字パターンを前処理してループ,直
線及びアークの要素による特徴抽出を行ない、規格化を
行なってから予め登録されている分類コードと比較し、
その比較結果に基づいて必要時にバランスチェック,ス
トロークチェックを行ない、それでも文字が特定できな
いときには更に前記アークの回転方向,前記要素の長さ
比等の詳細分類を行なって前記文字パターンを認識する
ようにしている。
一方、大きな枠の中にOCRによる読取を意識せずに大
きさも自由に手書きされた複数桁の数字は、隣同志つな
がることが多く、また逆にインクのかすれや帳票紙の紙
質及び筆記具の種類,背影とのコントラスト等の影響に
より、細線化データに途切れが発生しやすい。細線化デ
ータの途切れをそのままにしておけば、ブランチの構成
が複雑になってしまい。数字を正確に認識することがで
きない。
これに対処する1つの方法として、認識対象ブロック
の重心位置等からブロックを結合する例を、本出願人は
特願昭63−60691号で出願している。すなわち、手書き
文字の認識を行なうに際して、認識対象の線構造追跡デ
ータを用いて連続線で表わされている対象毎にブロック
として切出し、この切出したブロックをその大きさによ
り、それのみで1つの認識対象候補ブロックとみなす有
効ブロックと、ノイズとみなすノイズブロックと、前記
有効ブロックより小さく前記ノイズブロックより大き
く、それのみで認識対象候補ブロックとしない所定大き
さの可能ブロックの3種類のブロックに分け、前記有効
ブロック及び前記可能ブロックに対して重心位置を求
め、各有効ブロック間の重心の距離が所定値以内ならそ
れら有効ブロックをまとめて1つの認識対象候補ブロッ
クとすると共に、前記可能ブロック及び前記有効ブロッ
クの重心の距離が所定値以内なら当該可能ブロック及び
有効ブロックをまとめて1つの認識対象候補ブロックと
するようにしている。
(発明が解決しようとする課題) しかしながら、細線化データに途切れが数多く発生し
た場合などには、上述特願昭63−60691号の修復方法で
は対処しきれず、認識不能となる場合が数多く見受けら
れた。
また、特開昭62−256188号公報で示されるような修復
処理方法もあるが、向かい合った線分同志にしか適用で
きず、完全な修復方法ではない。
この発明は上記問題点に鑑みなされたものであり、こ
の発明の目的は、かすれ等により細線化データに途切れ
が発生しても、筆記具の軌跡の範囲を扇形で近似するこ
とにより筆跡を合理的に推定し、細線化データの途切れ
を修復してその後の数字認識を確実にならしめるように
した途切れ修復方式を提供することにある。
発明の構成: (課題を解決するための手段) この発明は、手書き数字を読取ったデータを細線化し
た後、端点,分岐点に基づいてブランチを決定し、前記
ブランチのデータ構成を分析して手書き数字を認識する
方法における細線化データの途切れを修復する方式に関
するもので、この発明の上記目的は、細線化データの全
ての端点の近傍からそれぞれ所定方向に所定サイズの扇
形領域を構成し、前記扇形領域が重複する領域の各画素
において、前記各画素の少なくとも1つと前記各扇形領
域の円の中心点内近傍とを結ぶ2つの線分のなす角度が
所定範囲にあるとき、当該2つの扇形領域内の2つの端
点を結ぶようにして前記細線化データの途切れを修復す
ることによって達成される。
(作用) この発明では手書き数字の筆跡を合理的に推定するた
めに、細線化データの全ての端点の近傍からそれぞれ所
定方向にかつ所定サイズの扇形領域を形成し、扇形領域
内の端点と重複領域の画素との相互関係から2つの端点
を結んで細線化データの途切れを修復するようにしてい
る。筆跡に基づいた修復を行なっているため、数字認識
を確実に正しく行なうことが可能となる。
(実施例) この発明の動作を第1図及び第2図を参照して、第3
図のフローチャートに従って説明する。
数字の読取データを細線化処理した後(ステップS
1)、この細線化データの追跡によって端点のノード番
号を決定して、全ての端点に対してノード番号を割り振
っておく(ステップS2)。そして、全ての端点Eiに対し
て所定ビットd(例えば6ビット)だけ戻った円0iを扇
形の中心とし、0iEiを軸として半径fl(例えば14ビッ
ト)、中心角fθ(例えば50゜)の扇形領域を構成する
(ステップS3)。これは、例えば二次元メモリ上にその
扇形の領域の画素について、その端点のノード番号を書
込んでおくことによって行なう(ステップS4)。第1図
及び第2図では、それぞれ端点Em,Em′に対して0m,0m
を中心とし、0mEm,0m′Em′を軸として扇形領域Sm,Sm
を形成している。そして、各xy座標に対するメモリにカ
ウント数とノード番号(配列)の2種類を記憶してお
く。この記憶動作を全ての端点Eiに対して同様に行な
い。もし重複した領域(第1図のWA、第2図のWB)があ
れば、そのxy座標に対応するメモリの内容はカウント数
が2以上となり、またノード番号が複数記憶されること
になる。
次に、メモリの内容を端部からスキャンしてカウント
数が2以上記憶されている画素を捜して行く(ステップ
S5)。そして、その重複画素が見つかるとその画素をCn
とし、その画素Cnに対して記憶されているノード番号m,
m′に基づいてノード番号mに対応する端点Emと扇形領
域Smの中心0mの2点の中点Mmの座標を算出し(ステップ
S6)、この中点Mmと画素Cnとの線分Lmの傾きを各座標を
もとにして算出する(ステップS7)。一方、ノード番号
m′に対応する端点Em′と扇形領域Sm′の中心0m′の2
点の中点Mm′の座標を算出し(ステップS6)、この中点
Mm′と画素Cnとの線分Lm′の傾きも同様にして算出する
(ステップS8)。次に、この2つの線分Lm,Lm′の傾き
からその線分のなす角度θを算出する(ステップS9)。
第1図及び第2図の例では画素Cnに対して中点Mm,Mm
を求め、線分Lm,Lm′を求め、線分Lm,Lm′の傾きを算出
して角度θを求めている。
次に、上述の如くして求められた角度θがθ≦θ≦
180゜を満たす(θは定角で、例えば116゜)ならば、
端点Emと端点Em′とはインクのかすれ等による途切れと
見なして直線で結ぶ(ステップS10,S11)。
尚、角度θが上記条件を満たしていなければ、次の画
素Cn+1について同様に判断する(ステップS12)。そし
て、その重複領域の画素の1つでも上記条件を満たせ
ば、それら端点同志を直線で結んで他の端点を順次判断
する。第1図及び第2図の例ではいずれもθ≦θ≦18
0゜の条件を満たしているので、端点Emと端点Em′とを
結んでデータを修復することになる。なお、その重複領
域内の画素全てについて判断して1つもθ≦θ≦180
゜を満足する画素がなかったときには、その端点同志は
結ばず(ステップS13)、他の端点を順次判断する。ま
た、上記条件における定角θは任意であるが、端点Ei
から中心0iの距離を小さくするのに対応させて、小さく
すれば良い。また、重複領域の画素Cnと中点Mm,Mm′と
を結んだが、画素Cnと結ぶ点は端点Emと中心0mの間、端
点Em′と中心0m′の間ならどこでもよい(端点と中心点
も含む)。この場合、θを適宜変えればよい。
発明の効果: 以上のようにこの発明の途切れの修復方式によれば、
筆記具の軌跡を扇形で近似して所定の条件で線分を結ん
だり、結ばないようにしているので、極めて正確に途切
れを修復できる。この結果、数字認識を正確に行なうこ
とが可能となる。
【図面の簡単な説明】
第1図及び第2図はこの発明の原理を説明するための
図、第3図はこの発明の動作例を示すフローチャートで
ある。 Ei……端点、0m,0m′……中心、Sm,Sm′……扇形領域。
フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G06K 9/20

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】手書き数字を読取ったデータを細線化した
    後、端点,分岐点に基づいてブランチを決定し、前記ブ
    ランチのデータ構成を分析して手書き数字を認識する方
    法において、細線化データの全ての端点の近傍からそれ
    ぞれ所定方向に所定サイズの扇形領域を構成し、前記扇
    形領域が重複する領域の各画素において、前記各画素の
    少なくとも1つと前記各扇形領域の円の中心点内近傍と
    を結ぶ2つの線分のなす角度が所定範囲にあるとき、当
    該2つの扇形領域内の2つの端点を結ぶようにして前記
    細線化データの途切れを修復するようにしたことを特徴
    とする手書き数字認識における細線化データの途切れ修
    復方式。
JP63227545A 1988-09-13 1988-09-13 手書き数字認識における細線化データの途切れ修復方式 Expired - Fee Related JP2792656B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63227545A JP2792656B2 (ja) 1988-09-13 1988-09-13 手書き数字認識における細線化データの途切れ修復方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63227545A JP2792656B2 (ja) 1988-09-13 1988-09-13 手書き数字認識における細線化データの途切れ修復方式

Publications (2)

Publication Number Publication Date
JPH0276088A JPH0276088A (ja) 1990-03-15
JP2792656B2 true JP2792656B2 (ja) 1998-09-03

Family

ID=16862578

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63227545A Expired - Fee Related JP2792656B2 (ja) 1988-09-13 1988-09-13 手書き数字認識における細線化データの途切れ修復方式

Country Status (1)

Country Link
JP (1) JP2792656B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0581476A (ja) * 1991-09-18 1993-04-02 Nec Corp 文字認識装置

Also Published As

Publication number Publication date
JPH0276088A (ja) 1990-03-15

Similar Documents

Publication Publication Date Title
US5410611A (en) Method for identifying word bounding boxes in text
US6134340A (en) Fingerprint feature correlator
US4408342A (en) Method for recognizing a machine encoded character
EP1519302B1 (en) System and method for detecting a hand-drawn object in electronic ink input
JPH05242292A (ja) 分離方法
EP0385009A1 (en) Apparatus and method for use in image processing
US4891750A (en) Optical character recognition by forming and detecting matrices of geo features
US6941030B2 (en) Character-recognition pre-processing apparatus and method, and program recording medium
EP0446632A2 (en) Method and system for recognizing characters
JP2792656B2 (ja) 手書き数字認識における細線化データの途切れ修復方式
JPH08287259A (ja) 指紋照合方法
JP3236367B2 (ja) ストロークに基づくシンボルからのストロークの逐次的抽出方法及びその装置
JP2965165B2 (ja) パターン認識方法及び認識用辞書作成方法
JP2635582B2 (ja) パターン認識方式
JP3329528B2 (ja) ドキュメント読取り装置
JPH05242224A (ja) 指紋照合装置
JP3250317B2 (ja) 文字認識装置
JP2873647B2 (ja) 指紋の特徴点抽出方法及び特徴点抽出装置
JP2871160B2 (ja) 疑似特徴点識別方法
JPH11232463A (ja) 画像認識装置および方法
JP2792655B2 (ja) 手書き数字認識における下線処理方法
JPH1021398A (ja) 方向特徴ベクトル抽出方法
JPH096909A (ja) 文字読取装置
JPH07118016B2 (ja) 図形認識装置
JPH06103366A (ja) 指紋照合装置及び指紋照合方法

Legal Events

Date Code Title Description
S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees