JPS5894067A - 文字認識方法 - Google Patents

文字認識方法

Info

Publication number
JPS5894067A
JPS5894067A JP56190501A JP19050181A JPS5894067A JP S5894067 A JPS5894067 A JP S5894067A JP 56190501 A JP56190501 A JP 56190501A JP 19050181 A JP19050181 A JP 19050181A JP S5894067 A JPS5894067 A JP S5894067A
Authority
JP
Japan
Prior art keywords
character
pattern
register
character frame
subpatterns
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP56190501A
Other languages
English (en)
Other versions
JPS6363952B2 (ja
Inventor
Yoshiyuki Yamashita
山下 義征
Koichi Higuchi
浩一 樋口
Yoichi Yamada
陽一 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP56190501A priority Critical patent/JPS5894067A/ja
Publication of JPS5894067A publication Critical patent/JPS5894067A/ja
Publication of JPS6363952B2 publication Critical patent/JPS6363952B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は高速でかつ認識精度の良い文字認識方法に関す
るものである。
一般に文字図形の認識は文字図形パターンからストロー
クを抽出し、それら抽壮されたストロークの位置、長さ
、ストローク間の相互関係等の幾伺学的な特徴を抽出す
る事により行なわれている。
そしてストロークの抽出には、次のような2つの方法が
広く用いられている。
■ 文字図形の輪郭を追跡することにより検出された輪
郭点系列について曲率を計算し、その曲率の大きな値の
点を分割点として輪郭系列を分割し、分割された系列を
組合わせることによりストロークの抽出を行なう。
■ 文字図形パターンに細線化処理を行なって骨格化し
、その骨格パターンの連結性及び骨格ノeターンを追跡
し、急激な角度の変化点等を検出してストロークを抽出
する。
しかし、■の方法は文字図形・やターンが大きい場合や
複雑な場合には、その処理量が増大し処理速度の低下を
招くこと、また■の方法は文字図形パターンを細線化す
る必要があシ、さらにその細線化によるパターンの歪、
ヒゲの発生等の問題がありその後の処理を複雑化させる
こと、等の欠点を有している。
そこでこれらの欠点を除去する方法として、文字図形パ
ターンの線幅Wを検出し、前記パターンを所望の方向に
走査し、パターンの当該走査方向における記入点の長さ
tと、前記線幅Wとの間で、t≧nW(nは定数)を満
足する記入点を取り出すことによシ走査方向のストロー
ク成分を表わすサプノJ?ターンを抽出し、さらに文字
枠内を(MxN)の領域(M、Nは整数)に分割して各
領域の文字線量を計算して認識する方法が提案されてい
る。
ところで前記各方向のストローク成分を表わすサブパタ
ーンはその抽出方向により該サブパターンの複雑さくス
トロークの長さ、文字線量等)が異なることが知られて
いる。例えば、漢字では水平方向のストローク成分が垂
直方向のストローク成分より多く複雑である。すなわち
、従来のように各方向のサブ・ぐターンについて全て等
しい分割数MxNで分割して特徴マ) IJクスを作成
する場合に於て複雑なサブパターンについて十分な分解
能を得るために分割数を多くすると簡単なサブパターン
においてはストロークの位置の自由度が大きいので、そ
の変動を吸収するために複数の辞書マスクを用意する必
要が生じ、辞書の増大及び識別時間の増大を招く欠点が
あった。
本発明は、このような従来技術の欠点を解決するために
各方向のサブパターンを文字枠内で分割する際、それぞ
れのサブパターンについて異なる分割数で分割して、特
徴マ) IJクスを作成し識別を行うようにしたもので
、その目的とするところは高速で精度の良い文字認識方
法を提供するものである。以下本発明文字認識方法に於
ける一実施例を図面により詳細に説明する。
第1図は、本発明文字認識方法の一実施例を示す構成図
である。図において光信号人力1は、光電変換部2にお
いて2値の量子化されたディジタル電気信号に変換され
、パターンレジスタ3に格納される。それと同時に、線
幅計算部4において入カバターンの線幅(W)が計算さ
れる。垂直サブパターン抽出部5は、パターンレジスタ
について垂直スキャンを全面性なって、黒ビットの連続
の長さと計算部4において計算された線幅(W)との関
係より垂直サブ/IPターン(vsp)を抽出する。同
様に、水平サブパターン抽出部6は水平スキャンにより
水平サブパターン(H4F)を、右斜めサブパターン抽
出部7は右斜め45°スキヤンによシ右斜めサブパター
2 (H8F)を、左斜めサブパターン抽出部8は左斜
め45°スキヤンにより左斜めサブパターン(LSP)
を抽出する。第2図はサブパターンの・抽出例で(a)
は原ノやターン、伽)は垂直サブパターン(USP )
、(c)は水平サブパターン(H4F)、(d)は右斜
めサブパター7(H8F) 、(e)は左斜め一サブパ
ターン(LSP)を示す。
文字枠検出部9は・母ターンレジスタ3内の文字パター
ンに外接する文字枠を検出し、その結果を文字枠分割決
定部10へ送る。文字枠分割決定部10は検出された文
字枠内を水平サブツクターンレジスタについてMHxN
Hの領域、垂直サブパターンレジスタについてMvXN
vの領域、右斜めサブパターンレジスタについてMRx
NRの領域、左斜めサブパターンレジスタについてはM
LXNLの領域に分割するだめのX軸、Y軸上の分割点
座標を決定する。
但し%  Mtt + NH+ Mv + Nv+ M
R,NR* ML、 NLは整数であり本実施例ではM
H”NH= 7 、 My =Ny = 5 + MR
=NB=ML=NL=6としている。また、X軸は文字
枠の水平方向を、Y軸は垂直方向をそれぞれ示す。
特徴マトリクス抽出部1ノは、文字枠分割決定部10に
よシ決定された分割点座標によりvsp 。
H4F 、 H8F 、 LSPの各サブパターンレジ
スタ上の文字枠内領域を分割し、各領域の黒ビット数8
14を計数し、線幅Wを使用して式(1)によシ文字線
長を示す特徴Lijを計算し、H4Fに対応するM、、
xNH次元のH8P特徴マトリクス、 vspに対応す
るMvxN■次元のvsp特徴マトリクス51. H8
Fに対応するMRxNR次元のR8P特徴マトリクス、
 LSPに対応するMLxNL次元のLSP特徴マ) 
IJクスを作成する。
Li j = Bi j /W(1) その後、VSP特徴マ) IJクスは文字枠のY軸方向
の長さΔYで、H8P特徴マトリクヌはX軸方向の長さ
ΔXで、R8P及びLSP特徴マトリクスは(Δχ+Δ
Y)/2でそれぞれ正規化を行ない、最終的に(MHx
NH十MvXNv+MRxNR十町×NL)次元の正規
化特徴マトリクスを作成する。
識別部12は、標準文字マスク(fm)とこの特徴マト
リクス(fi)との間に式(2)で定義される距離(D
)を適用し、Dが最小の値となるような標準文字マスク
のカテゴリ名を文字名出力13に出力する。
D=〆ΣW (fm−f 、)2    (2)但し、
Wは特徴マトリクスの各要素ごとに与える重みである。
本実施例ではすべての要素についてW=1とした。
このようにするとH8P特徴マトリクスの分割数はvS
P特徴マ) IJクスの分割数に比べて多くしている(
Mv=Nv=5に対してM、=N)I=7)ので、漢字
における水平方向ストローク成分が垂直方向ストローク
成分よシ複雑であるという性質に適合し■SP特徴マト
リクスについてはストロークの位置変動を吸収すること
ができ、辞書を増大させることなく、高速で精度の高い
文字認識を行うことができる。
以上詳細に説明したように本発明は各サブパターンにつ
いて文字枠内を分割する際、サブパターンごとに異なる
分割数を使用するので、各サブパターンに対して適した
分割数を選択でき、高速で精度の高い文字の認識が実現
できる効果がある。
【図面の簡単な説明】
第1図は本発明文字認識方法に係る一実施例を示す構成
図、第2図はサブパターンの抽出例を示す図である。 1・・・光信号入力、2・・・光電変換部、3・・・・
ぐターンレジスタ、4・・・・線幅計算部、5〜8・・
・サブパターン抽出部、9・・・文字枠検出部、10・
・・文字枠分割決定部、1ノ・・・特徴マトリクス抽出
部、12・・・識別部、13・・・文字名出力。

Claims (1)

    【特許請求の範囲】
  1. 文字図形を光電変換し、量子化して得られたディジタル
    信号を原・ぐターンとしてパターンレジスタに格納し、
    前記原・母ターンから各方向のストローク成分をあられ
    すサブノリーンを抽出してサブパターンレジスタに格納
    し、前記原Aターンの文字枠内領域を前記サブパターン
    レジスタについてMxN個の領域(M、Nは整数)に分
    割し、各領域内の文字線長をあられす特徴量を文字の大
    きさで正規化して特徴マトリクスを作成し、該特徴マト
    リクスを標準文字マトリクスと照合して前記文字図形を
    認識する文字認識方法において、原・そターンの文字枠
    内領域をサブノリ−ンレジスタについて分割する際、各
    サブパターンレジスタごとに異なる分割数を用いて分割
    することを特徴とする文字認識方法。
JP56190501A 1981-11-30 1981-11-30 文字認識方法 Granted JPS5894067A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56190501A JPS5894067A (ja) 1981-11-30 1981-11-30 文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56190501A JPS5894067A (ja) 1981-11-30 1981-11-30 文字認識方法

Publications (2)

Publication Number Publication Date
JPS5894067A true JPS5894067A (ja) 1983-06-04
JPS6363952B2 JPS6363952B2 (ja) 1988-12-09

Family

ID=16259135

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56190501A Granted JPS5894067A (ja) 1981-11-30 1981-11-30 文字認識方法

Country Status (1)

Country Link
JP (1) JPS5894067A (ja)

Also Published As

Publication number Publication date
JPS6363952B2 (ja) 1988-12-09

Similar Documents

Publication Publication Date Title
JPS5894067A (ja) 文字認識方法
JPS5837780A (ja) 文字認識方式
JPS6318787B2 (ja)
JPS62154079A (ja) 文字認識方式
JPH0545991B2 (ja)
JPS6262393B2 (ja)
JPS6262392B2 (ja)
JPS62125485A (ja) 文字認識方式
JPH0545992B2 (ja)
JPH0632080B2 (ja) 文字認識方式
JPS6019287A (ja) 文字認識方法
JP2576491B2 (ja) 特徴抽出方式
JPS6038755B2 (ja) 特徴抽出方式
JPS634231B2 (ja)
JP2749946B2 (ja) 文字認識方法
JPH0580711B2 (ja)
JPH0632081B2 (ja) 文字認識方式
JPS6024513B2 (ja) 文字認識方式
JPH01152586A (ja) 文字図形認識方法
JPH0475553B2 (ja)
JPS5894065A (ja) 文字認識装置
JPS603072A (ja) 特徴抽出方法
JPH01187684A (ja) 文字認識装置
JPH0545990B2 (ja)
JPS5894064A (ja) 手書文字認識装置