JPH04590A - 文字認識方法 - Google Patents

文字認識方法

Info

Publication number
JPH04590A
JPH04590A JP2100831A JP10083190A JPH04590A JP H04590 A JPH04590 A JP H04590A JP 2100831 A JP2100831 A JP 2100831A JP 10083190 A JP10083190 A JP 10083190A JP H04590 A JPH04590 A JP H04590A
Authority
JP
Japan
Prior art keywords
character
pattern
horizontal
vertical
extracted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2100831A
Other languages
English (en)
Inventor
Koichi Higuchi
浩一 樋口
Yoshiyuki Yamashita
山下 義征
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2100831A priority Critical patent/JPH04590A/ja
Publication of JPH04590A publication Critical patent/JPH04590A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、媒体上の文字を光電変換して得られる文字パ
タンより、入力文字を認識する文字認識方法、特に高速
で、認識精度の良い文字認識方法に関するものである。
(従来の技術) 従来、この種の文字認識方法とし、では、特開昭58−
123171号公報に記載されるものがあった。
従来、媒体上の文字を認識する場合、手書文字において
は筆者の違いによる文字線素の移動や、印刷文字におい
てはフォント(字体)の違い等による文字線素の移動に
より、抽出される特徴が変動するので、該特徴の変動に
対応した辞書を用意しなければならなかった。そのなめ
、辞書容量が増大し、さらにその辞書の照合に要オろ時
間も増大して、処理速度の低下、装置の大型化を招いて
いた。
そこで、前記文献の技術では、帳票等の媒体上の文字を
光電変換して得た文字パタンを、水平方向及び垂直方向
に走査し、各走査ライン毎に黒ビット数を計数し、該文
字パタンに対して設定されたX軸上及びY軸上の黒ビッ
ト数の分布(周辺分布)を求めている。さらに、該周辺
分布の重心座標を求め、その重心座標に基づいて分割座
標そして分割境界を設定して分割領域を決め、該文字パ
タンの外接方形枠内を分割している。そのため、分割境
界、従って分割領域を水平方向及び垂直方向の文字線素
の移動に追従させることが可能となる。これにより、前
記文字パタンについて、水平、垂直、右斜め、及び左斜
めの各方向の線素を表すサブパタンを抽出し、前記分割
領域毎の各サブパタンの文字線素量を特徴要素とする特
徴マトリクスを抽出し、その抽出された特徴マトリクス
と、予め用意した辞書とを照合することで、個人差に基
づくストローク位置変動等の特徴の変動を吸収し、辞書
容量の減少による処理速度の高速化等を図るようにして
いる。したがって、文字、!!素の水平方向及び垂直方
向の移動に対しては、大きな効果があった。
(発明が解決しようとする課題) しかしながら、上記の文字認識方法では、次のような課
題があった。
第2図(a)、(b)、(c)、(d)は、従来の文字
パタン分割方法を説明するための図であり、同図(a、
 )は傾きのない文字パタン[○Jの例、同図(b)は
斜体字rQJの例、同図(c)は同図(a)の周辺分布
図、同図(d)は同図(b)の周辺分布図である。
従来の文字認識方法では、入力さhを文字パタンを水平
方向及び垂直方向に走査して周辺分布SXYを求め、そ
の周辺分布SXYによって設定した分割点座標り及び分
割境界Sに基づきその外接枠内を複数の領域に分割して
いる。ところが、第2図(b)に示すように、垂直線素
に傾きを持つような斜体字について垂直方向の分割境界
Sを定めた場合、第2図(a)に示すような傾きのない
文字の場合と比較すると、それぞれの分割点座標D(1
)〜D(5)とD(11)〜D(15)とが異なる上に
、傾きのない文字については分割境界Sが垂直線素と平
行に設定されるが、垂直線素に傾きを持つ斜体字につい
ては分割境界Sが文字線素を斜めに分断するように設定
される。そのため、同じ文字でありながら、周辺分布5
XY(1)とSXY (2>とが大きく異なり、従って
抽出される特徴が大きく異なったものとなって、文字認
識精度が低下してしまう。このように従来の文字認識方
法においては、垂直線素に傾きを持つような斜体字につ
いてそれを的確に分割する方法がないなめ、そのような
特徴の変動を吸収するために、様々な変形に対応する辞
書を用意せざるを得なかった。そのため、辞書容量が増
大し、照合に時間がかかつて、ハード規模(装置規模)
や処理時間が増大するという問題があり、未だ技術的に
十分満足のゆくものが得られなかった。
このような問題は、手書文字における右上り文字のよう
に水平線素に傾きがある文字の場合についても同様に生
じる。
本発明は、前記従来技術が持っていた課Eとして、処理
時間の増大と装置の大型化という点について解決した文
字認識方法を提供するものである。
(課題を解決するための手段) 本発明は、前記Muを解決するために、g体上の文字を
光電変換して得られる文字パタンを複数の領域に分割し
、該分割された分割領域毎に特徴を抽出しfS後、該抽
出された特徴と予め用意した辞書との照合により、前記
文字を認識する文字認識方法において、次のような手段
を講じたt、のである。
即ち、前記文字パタンより水平ストローク成分と垂直ス
トローク成分の両方またはいずれか一方を抽出し、前記
ストローク成分毎に、それぞれのストロークの傾斜を該
ストロークの長さを重みとして加重平均したものを該ス
トローク成分の平均傾斜として抽出し、前記平均傾斜に
従って前記文字パタンを走査して周辺分布を抽出し、前
記周辺分布を用いて分割点(分割点座標)を検出し、前
記分割点及び前記平均傾斜に基づき前記文字パタンを複
数の領域に分割するようにしたものである。
(作用) 本発明によれば、以上のように文字認識方法を構成した
ので、文字パタンか入力されると、その文字パタンの水
平ストローク成分と垂直ストローク成分の両方またはい
ずれか一方を抽出し、その水平ストローク成分よりその
各ストロークの平均傾斜を、その垂直ストローク成分よ
りその各ストロークの平均傾斜を、それぞれ抽出する。
ここで、各ストローク成分の平均傾斜は、該ストローク
成分に含まれるそれぞれのストロークの傾斜をそのスト
ロークの長さを重みとして加重平均して求めている。通
常長いストロークは文字の傾斜をよく反映し、短いスト
ロークは該文字のwX斜に対してばらつきが大きいが、
平均傾斜を加重平均により求めることで、平均傾斜の算
出には、長いストロークの傾斜が良く反映され、短いス
トロークの傾斜の影響が抑えられる。このようにして求
めた平均傾斜に従い文字パタンを走査して周辺分布を抽
出し、該周辺分布を用いて分割点座標を決定し、該分割
点座標と前に求めた平均傾斜に基づいて文字パタンを複
数の領域に分割している。その後、その分割された分割
領域毎に特徴を抽出し、その特徴と辞書との照合により
、入力文字の認識を行つ。
このように、文字パタンの傾斜に追従させて分割領域を
決定しているので、垂直線素や水平線素に傾きを持つ文
字パタンについても、抽出される特徴が安定となるので
、文字傾斜の変形に対応した辞書を用意する必要がない
。それにより、処理速度の高速化と装置の小型化、及び
認識精度の向上が図れる。従って、前記課題を解決でき
るのである。
(実施例) 第1図は、本発明の実施例を示すもので、文字認識方法
を説明するための文字認識装置の構成ブロック図である
この文字認識装置は、帳票等の媒体上の文字画像の光信
号INを量子化された電気信号(ディジタル信号)に変
換する光電変換部1を有し、その出力1則には、行バッ
ファ2が接続されている。行バッファ2は、例えば@2
048X高さ128ビツトの大きさを有し、1行分の文
字画像のディジタル信号を格納する構成になっており、
その出力側には、文字切出部3を介してパタンレジスタ
4が接続されている。
文字切出部3は、行バッファ2の出力から1文字分のデ
ィジタル信号(これを、「文字パタンJという)をパタ
ンレジスタ4に格納する機能を有している。
パタンレジスタ4は、例えば64X64ビツトの記憶容
量を有し、その出力側には文字枠検出部5、線幅測定部
6、及びサブパタン抽出部7が接続され、サブパタン抽
出部7を介して文字傾斜抽出部8が接続されていると共
に、周辺分布抽出部9が接続されている。
文字枠検出部5は、パタンレジスタ4内の文字パタンを
走査して外接枠、つまり文字枠を検出し、その検出結果
を周辺分布抽出部9等に与える機能を有している。線幅
測定部6は、パタンレジスタ4の出力に対する線幅を測
定し、その測定結果をサブパタン抽出部7に与える機能
を有している。
サブパタン抽出部7は、パタンレジスタ4を複数の方向
に走査して垂直、水平、右斜め、左斜めサブパタンを抽
出するもので、垂直サブパタン抽出部7a、水平サブパ
タン抽出部7b、右斜めサブパタン抽出部7c、及び左
斜めサブパタン抽出部7dより構成されている。各抽出
部7a〜7dは、それぞれパタン格納用のメモリを有し
ている。
文字傾斜抽出部8は、サブパタン抽出部7の垂直サブパ
タン抽出部7a及び水平サブパタン抽出部7bで抽出さ
hを垂直サブパタン及び水平サブパタンについて傾斜を
抽出し、その抽出結果を周辺分布抽出部9に与える機能
を有している。
周辺分布抽出部9は、文字傾斜抽出部8により得られた
傾斜を用いてパタンレジスタ4に格納された文字パタン
を走査してその周辺分布を抽出する機能を有している。
周辺分布抽出部9の出力側には、分割点検出部10及び
特徴マトリクス抽出部11か接続され、さらにその出力
側には識別部12が接続されている。
分割点検出部]0は、外接枠内を複数の領域に分割する
ための分割点座標を検出する機能を有している。特徴マ
トリクス抽出部11は、サブパタン抽出部7から出力さ
れる垂直1.水平、右斜め、及び左斜めサブパタンの各
パタンから、特徴量を抽出して特徴マトリクスF (k
)を作成し、それを識別部12へ与える機能を有してい
る。識別部12は、標準文字の特徴マトリクス(標準文
字マスク)G(k)とこの特徴マトリクスG(k>を有
する標準文字の文字名とを格納する辞書メモリを有して
いる。そして、特徴マトリクス抽出部11で抽出された
特徴マトリクスF (k>と辞書メモリの特徴マトリク
スG(k)とを照合することにより、該特徴マトリクス
F (k)を得た外接枠内領域の文字図形の認識を行い
、文字名0IJTを出力する機能を有している。
次I:5以上のように構成される文字認識装置を用いた
文字認識方法について、各精成ブロックの処理(I>〜
(IX)について説明する。
(I)  文字パタン生成処理 帳票上に記入された文字画像の光信号INが光電変換部
1に入力されると、光電変換部1では、光信号INを2
値のディジタル信号、つまり文字線部を°1゛ (これ
を「焦ビットJという)、背景部を“0’  (こhを
「白ビ゛・ントJというンに変換する。光電変換部]−
で変換さhf、−1行分の文字画像のディジタル信号は
、行バッファ2に格納される。
文字切出部3では、行バッファ2に格納さhf、H文字
画像のディジタル信号から、1文字分のディジタル信号
c文字パタン)を切出し、パタンレジスタ4に格納する
。本実施例では、帳票フォーマットが予め指定されてお
り、文字切出部3にIJメモリを有し、行バツフア2内
の文字位置を示すアドレスが格納されている。そのなめ
、文字切出し動作は、該アドレスで指定された行バッフ
ァ2の内容を読み出すことにより実行される。
(II)  文字枠検出処理 文字枠検出部5では、パタンレジスタ4のパタンを走査
してそのパタンの左端座標X」、右端座標Xr、上端座
標yt及び下端座標ybを検出する。外接枠、つまり文
字枠は(X、I)、Yt)、(XCYb>、(Xr、Y
t)、(Xr、Yb)の4点を結ぶ矩形枠となる。
才な、文字枠検出後は、特徴量の正現化を行うために、
必要な文字枠の大きさを算出する。即ち、パタンI・ジ
スタ4のX軸に対し、平行な方向(水平方向)の文字枠
の大きさをWPhとしてWPh=Xr−X、l!+lを
、垂直な方向(垂直方向)の文字枠の大きさをWPvと
してWPv=Yt−Yb+1を、そhぞhx出する。さ
らに、右斜め及び左斜め45″方向の文字枠の大きさを
WPr及びWPlとして WPh+WPv WPr=WPり= を算出する2これらの算出結果は、周辺分布抽出部9及
び特徴マトリクス抽出部11に与えら九る。
(III)  線幅測定処理 線幅測定部6は、パタンレジスタ4がらのディジタル信
号を入力し、例えば2×2の窓の全ての点が黒ビットと
なる状態の個数Qと、全黒ビットの個数Aとを計数し、
従来周知の次式(1>に従って線幅WLを算出する。
WL=A/(A−Qン         ・・・・・・
 (1)(TV)  サブパタン抽出処理 サブパタン抽出部7では、垂直サブパタン抽出部7a、
水平サブパタン抽出部7b、右斜めサブパタン抽出部7
cF1.び左斜めサブパタン抽出部7dにより、そノ1
それパタンレジスタ4上に設定し。
たX軸方向に対して垂直な方向(垂直方向)及び平行な
方向(水平方向)と、X軸から反時計方向45°の方向
(右斜め45°方向)及び時計方向45°の方向(左斜
め45°方向)とを、主走査方向としてパタンレジスタ
4を走査し、各主走査方向に対応する垂直、水平、右斜
め、及び左斜めサブパタンを抽出する。
即ち、垂直サブパタン抽出部7aでは、垂直方向を主走
査方向とじて原パタンを全面走査し、垂直方向の走査線
上で連続する黒ビット(黒ラン)を検出する。そして、
検出した黒ランの中から次式(2)を満足する長さjの
黒ランを抽出する。
j≧N・WL        ・・・(2)但し、Il
l:主走査方向における黒 ランの長さ N;各サブパタンに対する 任意定数(例えば、2) 次に、垂直サブパタン抽出部7aは、(2)式を満足す
る黒ランを、サブパタンを精成する黒ランとみなして図
示しない垂直サブパタンメモリに格納する。(2)式を
満足しない黒ランは白ビットとみなす。
同様に、水平、右斜め及び左斜めサブパタン抽出部7b
、7c、7d/1i、水平、右斜め及び左斜め方向を主
走査方向とじで原パタンを走査し、それぞれの主走査方
向の走査線上の黒ランの中から、(2)式を満足する黒
ランを抽出し、抽出しな黒ランを、サブパタンを精成す
る黒ランとみなして図示しない水平、右斜め及び左斜め
サブパタンメモリに格納する。
このようにして抽出されるサブパタンの一般的な例が第
3図(a)〜(e)に示されている。第3図(a)〜(
e)は文字パタン及びそのサブパタンの例を示す図であ
り、第3図(a)は外接する文字枠内の2値パタンから
なる原パタンであり、このような原パタンから得られた
垂直サブパタン(vsp)が第3図(b)に、水平サブ
パタン(H8P)が第3図(c)に、右斜めサブパタン
(R8P>が第3図(d)に、左斜めサブパタン(LS
P)が第3図(e)に、それぞれ示されている、 (V)  文字傾斜抽出処理 文字傾斜抽出部8は、サブパタン抽出部7より得られる
垂直サブパタン及び水平サブパタンのそれぞれについて
、該サブパタンの文字線素成分(これを[ストロークj
という〉を抽出する。次に、抽出した各ストロークの両
端の座標値より、各ストロークの傾きを計算し、それら
を平均して、垂直サブパタンからは垂直ストローク成分
の平均傾斜θV、水平サブパタンからは水平ストローク
成分の平均傾斜θhを、それぞれ抽出する。
次に、この平均傾斜θ■、θhの具体的な抽出方法につ
いて説明する。
先ず、垂直サブパタンについて、水平走査を全面に行い
、白ビットから黒ビット、及び黒ビットから白ビットへ
の変化点を検出する。そして、1ライン前の走査線と現
在の走査線における変化点座標との関係より、垂直方向
のストローク(垂直ストローク)の両端座標を抽出する
抽出した垂直ストロークの両端pi:標を(VXS、 
 VMS、)と(VXE、  VYE、)とした1’ 
       1            1’   
     ]とき、次式(3)を用いて垂直ストローク
成分の平均傾斜θVを計算する。但し、j−1,・・・
・・Pv、Pvは垂直サブパタンより抽出したストロー
ク数、またVYS、<VYE 、である。
−〕1 θV= ここで、VLG・は次式(4)より求められる、VLG
HAX  < l VXEi−VXSi  l 、  
l VYEi−VYS+  l )+ ・・・・・(4) この(4)式は、2点間の距離、即ち両端座標(VXS
 i 、 VYS i )及び(VXEi、VYEi)
を持つ垂直ストロークの長さを表わす該両端座標間の距
離を、その2点間の水平及び垂直座標差のうちで小さい
方の1/2と他の一方との和とする近似式である。
また、水平サブパタンより水平ストローク成分の平均傾
斜θhを、次のようにして抽出する。
水平サブパタンについて垂直走査を行い、水平方向のス
トローク(水平ストローク)の両端座標を抽出する。そ
の両端座標を、(HXSj、HYS、>と(HXE 、
、HYE 、)としたとき、水J          
 J        J千ストローク成分の平均傾斜θ
hを次式(5)で計算する。但し、j−1,・・・・・
・、ph、phは水平サブパタンより抽出したストロー
ク数、まなHXS 、<HXE 、である。
J        J θh= ・・・・・・(5) ここで、HLG、は次式(6)より求められる。
HLG。
HAX  < l HXEj−t(χSj  l 、 
 l HYEj−HYSj  l )+ ・・・・・・(6) なお、ストローク数がOのときは、その平均傾斜を0と
する。即ち、Pv=OのときはθV=○、ph=oのと
きはθh=oとする。
(VI)  周辺分布抽出処理 周辺分布抽出部9は、パタンレジスタ4に格納された文
字パタンを走査して、その周辺分布を抽出する。以下、
その周辺分布の抽出方法について、第4図(a)、(b
)を用いて説明する。
第4図(a)、(b)は、傾きを持つ文字パタンの分割
領域の決定方法を示す図であり、同図(a)は文字パタ
ンの例であって数字の「○Jの場合の図であり、同図(
b)は同図(a)の文字パタンから抽出された周辺分布
を示す図である。
第4図(a)で矢印Pは、開始アドレス(xa。
YT)から垂直走査を開始する場合の走査経路を示す。
なお、第4図(a>では、文字パタン上にX軸及びyI
!I!lを設定し、また、第4図(b)では、横方向に
X軸をとり、縦方向にX軸方向に対応した周辺分布SX
 (x)をとっている。
周辺分布抽出部9では、文字傾斜抽出部8で得られた平
均傾斜θV及び平均傾斜θhに基づき、パタンレジスタ
4に格納された文字パタンの走査経路を決定し、その走
査経路により垂直走査及び水平走査を行い、各走査によ
りX軸方向の周辺分布5X(x>及びy軸方向の周辺分
布sy (y)をそれぞれ抽出する。
次に、この周辺分布sx (x>、SY (y>の具体
的な抽出方法について説明する。
先ず、垂直走査を行う場合、文字パタンの上辺に走査開
始点として、例えば開始アドレス(xa。
YT)を設定し、その開始アドレス(xa、YT>から
y軸の正の方向へ走査を行うものとすると、その走査経
路PS座標(J、3’j、)は、次式(7)によって決
定される。
X 1 ” X a 、y1=YT x 、=xa+θvX (y −−YT)yi=yi−
1+1 ・・・(7) ここで、θVは実数であり、第4図(a)の場合例えば
θv=5/20に設定されている。また、θvX (y
 、−YT)の計算結果については小数点以下を切捨て
、座標値は全て整数である。
次に、(7)式で決定された走査経路Pに沿って垂直走
査を行い、その走査経路P中の黒ビット数を計数し、走
査開始点のX座標がxaにおける周辺分布の値SX (
xa>を得る。xaは、XL≦xa≦XRの範囲で変化
させる。即ち、走査開始点を(XL、YT)、(XL+
1.YT)、・・・(XR,YT)にそれぞれ設定し、
各走査開始点毎に前記(7)式に従う走査経路上の黒ビ
ット数を計数し、周辺分布を抽出する。これにより、周
辺分布SX (x>、x=XL、・・・、XRが抽出さ
れる。
また、平均傾斜θhを用いてy軸方向の周辺分布5Y(
y)を、次のようにして抽出する。
先ず、y軸上に走査開始点として、例えば開始アドレス
(XL、ya>を設定した場合の水平方向の走査経路は
、次式(8)によって決定さ九る。
x1=XL yl:ya xj=xj−1+1 y 、=ya+θllx (x 、−XL)J    
            J・・・(8) ここで、θhは実数であり、θhX(x−−XL)の計
算結果の小数点以下を切捨て、座標値は全て整数である
(8)式でyaの値をYT≦ya≦YBの範囲で変化さ
せる。allち(XL、YT)、 ・ 、(XL。
ya)、・・・、(XL、YB)を走査開始点に設定す
る。そして、それぞれの走査開始点毎に前記(8)式に
従う走査経路上の黒ビット数を計数すれば、周辺分布S
Y (y)、y=YT、・・・、YBが得られる。
(VII)  分割点決定処理 分割点検出部10は、周辺分布抽出部9で抽出された周
辺分布SX (x>、SY (y)の重心座標を求め、
次いで、文字枠のX軸方向またはy軸方向の全範囲また
はすでに求めた重心座標で分割された範囲における1次
モーメントの和をその範囲の黒ビット和で除算すること
により、X軸方向の分割点座標DX (m>及びy軸方
向の分割点座標DY(n)を決定するものである。但し
、mnは座標値の大きさの順に付した重心座標番号であ
り、m=1〜(Nχ−1)、n=1〜(NYl)である
。なお、本実施例では、NX=NY−4とした。
次に、この分割点座標DX (m)、DY (n)の具
体的な決定方法について第4図(a)、(b)を参照し
つつ説明する。
分割点座標DX (m)を求めるために、先ず文字枠の
X軸方向の範囲XL〜XRを対象として。
文字パタンの周辺分布SX (x>の1次モーメント和
をその範囲の黒ビット和で除算することにより、中央の
重心座標番号の重心座標DX(2>を次式(9)によっ
て求める。
・・(9) 但し、(8)式の右辺の値は実数となるので、小数点以
下を切り上げてDX(2>を整数にする。
次に、(9)式によって求めた重心S標D(2)によっ
て分割されてできるそれぞれのM囲、XL〜DX (2
>、DX (2)〜XRを対象として2つの重心座標D
X (1)、DX (3)をそれぞれ次式(10)、(
11)によって求める。
X二X[ χ=XL ・・・(10) 以上のようにして重心座標DX(1)、DX(2)、D
X (3)を求め、当該座標をX軸上の対象分割点座標
として決定する。
また、分割点座標DY(n)についても同様tこ、先ず
y軸上の周辺分布SY(、y)より、文字枠の範囲YT
〜YBを対象として、重心座標DY(2)を検出し、次
にその重心座標DY(2>によって分割されてできるそ
れぞれの範囲YT〜DY(2>、DY <2)〜YBの
そノ1ぞhを対象として周辺分1sY(、y>の重心座
標DY (1)、DY (3)を検出する。
以上のようにして重心座標DY(1)、DY(2)、D
Y (3)を求め、当該座標をy軸上の対象分割点!標
として決定する。
(VIIL)  特徴マトリクス抽出処理文字枠検出部
5が文字パタンの外接枠を規定する座標XN 、Xr、
Yt、Ybを検出し、さらに分割点検出部10が文字パ
タンについて対象分割点座標を検出すると、特徴マトリ
クス抽出部11では、垂直、水平、右斜め、及び左斜め
サブパタンの各パタンから特徴量を抽出し、特徴マトリ
クスを作成する。
即ち、特徴マトリクス抽出部11は、1つの外接枠内領
域を、対象分割点座標と座標Xf1.XrYt、Ybと
によってNχXNY個の部分領域に分割し、各部分領域
内のサブパタンの文字線量を表す特徴量を抽出する。そ
して、1つの外接枠領域内の各サブパタンから抽出しな
NχXNYX4個の特徴量から成る特徴マトリクスを、
当該外接枠内領域の特徴マトリクスとして抽出する。
先ず、水平サブパタン(H8P)からの特徴量抽出につ
き説明する。
特徴マトリクス抽出部11は、対象分割点座標と座標X
JII 、Xr、Yt、Ybとに基づき、外接枠内領域
をNXxNY個の部分領域に分割しく対象分割点座標及
び座標X、1)、Xr、Yt−、Ybは分割点座標であ
る)、各部分領域毎に部分@域内の水平サブパタンH8
Pの黒ビ・ソト数BH(i。
j)を計数する。
分割点座標から分割領域の決定は、次のように行う。先
ず、X軸上の分割点座標DX(n)を文字パタンの外接
枠の上辺に設定する。この座標の起点として、次式(1
2)で求められる座標系列の左側を、第4図(a>に示
すような分割境界Sとする。
x (+、 = D X (n ) 3’0 =y’r x 、=DX (n)+θvX(yi y□>yH=y
i−1+1 ・・・(12) 水平方向の分割境界Sも同様に、DY(n)とθhを用
いて設定する。
以上のように分割された分割領域毎に、水平サブパタン
H3Pの黒ビット数BH(i、j>を計数する。このB
H(i、j>は、一つの外接枠内領域に関する第i行第
j列の部分領域の黒ビット数である。さらに、次式(1
3)に従って第j行第j列の部分領域に関する特@1F
H(i、j)を計算する。
j列の部分領域のVSP、H3P、LSPの黒ビット数
BV(i、j)、BR(i、j)、BL(i、 j)を
計数し、次式(14)〜(16)に従って第i行第j列
の部分領域に関するvsp。
H3P、LSPの特徴量FV(i、j>、FR(j、j
>、FL(i、j>を算出する。
・・・・・・(13) 但し、i=1.2.・・・・・・、NXj=1.2.・
・・・・・、NY WL、線幅 wph、文字幅(=Xr−XU +1 )さらに、H8
Pの場合と同様にして、第i行第WL−WPU−=・−
(16’) 但し、 WPv;文字高さ(=Yb−Yt+1)WPr=WPJ
2 = (WPv+WPh)72以上のようにして、外
接枠内領域の各部分領域毎にVSP、H3P、H8P、
LSPの特徴1を抽出し、これらNχXNYX4個の特
徴量から成る特徴マトリクスF (k>(k=1.2.
・・・・・・NXXNYX4)を得る。特徴マトリクス
抽出部11は、特徴マトリクスF (k)を各外接枠領
域毎に抽出し、その抽出結果を識別部12へ送る。
(IX)  識別処理 識別部12は、抽出された特徴マトリクスF(k>と内
部に設けられた辞書メモリ内の特徴マトリクスG (k
)とを照合することにより、該特徴マトリクスF(k)
を得た外接枠内領域の文字図形の認識を行う。この認識
では、次式(17)に従って特徴マトリクスF (k)
とG (k)間の距離りを求め、距離りが最小となる特
徴マトリクスG (k)の標準文字の文字名(例えば、
JIS規格に定められた文字コード)OUTを認識結果
として出力する。
以上のように、本実施例では、次のような利点を有して
いる。
本実施例では、文字パタンから抽出された垂直サブパタ
ン及び水平サブパタンを用いて、垂直サブパタンより垂
直ストローク成分の平均傾斜θ■を、水平サブパタンよ
り水平ストローク成分の平均傾斜θhを、それぞれ抽出
し、その平均傾斜θV、θhに従って文字パタンを走査
してその文字パタンの周辺分布を抽出している。さらに
、その周辺分布を利用して、分割点座標を決定し、その
分割点座標と平均傾斜θV、θhに基づき、文字パタン
の外接枠内の分割領域を決定し、その分割領域毎の特徴
マトリクスを抽出している。そのため、手書文字におけ
る水平線素が右上がりに傾いな文字や、印刷文字におけ
る垂直線素が右に傾いた斜体字等のように傾斜を有する
文字パタンについて、抽出される特徴が安定となる。し
たがって、文字傾斜の変形に対応した辞書を識別部12
内に用意する必要がなく、辞書容量の減少により、照合
時間の短縮と、それによる処理速度の高速化が図れると
共に、ハード規模が小さくなり認識精度の良い文字認識
が可能となる。
なお、本発明は、上記実施例に限定されず、種々の変形
が可能である。その変形例としては、例えば次のような
ものがある。
(i)本実施例では、水平、垂直の両方向について、ス
トロークの傾斜を抽出する場合について説明した。しか
し、手書文字については、一般に右上がり文字が多いの
で、水平ストロークの傾斜抽出のみで十分である。また
、印刷文字の斜体字を対象とする場合は、垂直ストロー
クの傾斜抽出を行えばよい。このように、読取り対象に
より、適宜、傾斜抽出方向を選択し、構成の簡略化を図
ることが可能である。
(ii)第1図の構成ブロック図は、個別回路て構成す
る以外に、コンピュータを用いたプログラム制御等で実
行する構成にしてもよい。
(発明の効果) 以上詳細に説明したように本発明によれば、媒体上の文
字を光電変換して得られる文字パタンより水平ストロー
ク成分と垂直ストローク成分の両方またはいずれか一方
を抽出し、前記ストローク成分毎に、それぞれのストロ
ークの傾斜を該ストロークの長さを重みとして加重平均
したものを該ストローク成分の平均傾斜として抽出し、
前記平均傾斜に従って前記文字パタンを走査して周辺分
布を抽出し、前記周辺分布を用いて分割点を検出し、前
記分割点及び前記平均傾斜に基づき前記文字パタンを複
数の領域に分割して、その分割された分割領域毎に特徴
を抽出するようにしている。
そのため、手書文字のように水平線素が右上りに傾いた
文字や、印刷文字のように垂直線素が右に傾いた斜体字
等を対象とする場合でも、安定な特徴を抽出することが
できる。従って、文字傾斜の変形に対応した辞書を用意
する必要がなく、処理速度が速く、小さなハード規模で
、認識精度の良い文字認識が可能となる。
【図面の簡単な説明】
第1図は本発明の実施例を示す文字認識方法を説明する
ための文字認識装置の構成ブロック図、第2図(a)〜
(d)は従来の文字パタン分割方法を説明するための図
、第3図(a)〜(e)は文字パタン及びそのサブパタ
ンの例を示す図、第4図(a)、(b)は、傾きを持つ
文字パタンの分割領域の決定方法を示す図である。 1・・・光電変換部、2・・・行バッファ、3・・・文
字切出部、4・・・パタンレジスタ、5・・・文字枠検
出部、6・・・線幅測定部、7・・・サブパタン抽出部
、8・・・文字傾斜抽出部、9・・・周辺分布抽出部、
10・・・分割点検出部、11・・・特徴マトリクス抽
出部、12・・・識別部。

Claims (1)

  1. 【特許請求の範囲】 媒体上の文字を光電変換して得られる文字パタンを複数
    の領域に分割し、該分割された分割領域毎に特徴を抽出
    した後、該抽出された特徴と予め用意した辞書との照合
    により、前記文字を認識する文字認識方法において、 前記文字パタンより水平ストローク成分と垂直ストロー
    ク成分の両方またはいずれか一方を抽出し、 前記ストローク成分毎に、それぞれのストロークの傾斜
    を該ストロークの長さを重みとして加重平均したものを
    該ストローク成分の平均傾斜として抽出し、 前記平均傾斜に従って前記文字パタンを走査して周辺分
    布を抽出し、 前記周辺分布を用いて分割点を検出し、 前記分割点及び前記平均傾斜に基づき前記文字パタンを
    複数の領域に分割することを特徴とする文字認識方法。
JP2100831A 1990-04-17 1990-04-17 文字認識方法 Pending JPH04590A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2100831A JPH04590A (ja) 1990-04-17 1990-04-17 文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2100831A JPH04590A (ja) 1990-04-17 1990-04-17 文字認識方法

Publications (1)

Publication Number Publication Date
JPH04590A true JPH04590A (ja) 1992-01-06

Family

ID=14284265

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2100831A Pending JPH04590A (ja) 1990-04-17 1990-04-17 文字認識方法

Country Status (1)

Country Link
JP (1) JPH04590A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6271075B1 (en) 1999-03-30 2001-08-07 Nec Corporation Method of manufacturing semiconductor device which can reduce manufacturing cost without dropping performance of logic mixed DRAM

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5599680A (en) * 1979-01-24 1980-07-29 Toshiba Corp Character reading control system
JPS57196383A (en) * 1981-05-28 1982-12-02 Toshiba Corp Character recognition system
JPS603078A (ja) * 1983-06-21 1985-01-09 Oki Electric Ind Co Ltd 文字認識方法
JPS60201485A (ja) * 1984-03-27 1985-10-11 Oki Electric Ind Co Ltd 手書文字認識装置
JPS63238686A (ja) * 1987-03-26 1988-10-04 Oki Electric Ind Co Ltd 特徴抽出方式

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5599680A (en) * 1979-01-24 1980-07-29 Toshiba Corp Character reading control system
JPS57196383A (en) * 1981-05-28 1982-12-02 Toshiba Corp Character recognition system
JPS603078A (ja) * 1983-06-21 1985-01-09 Oki Electric Ind Co Ltd 文字認識方法
JPS60201485A (ja) * 1984-03-27 1985-10-11 Oki Electric Ind Co Ltd 手書文字認識装置
JPS63238686A (ja) * 1987-03-26 1988-10-04 Oki Electric Ind Co Ltd 特徴抽出方式

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6271075B1 (en) 1999-03-30 2001-08-07 Nec Corporation Method of manufacturing semiconductor device which can reduce manufacturing cost without dropping performance of logic mixed DRAM

Similar Documents

Publication Publication Date Title
JPH0420226B2 (ja)
JPH05501776A (ja) 光学式文字認識のための自動中心配置式文字字画太線化
CN113537216B (zh) 一种点阵字体文本行倾斜校正方法及装置
JPH04590A (ja) 文字認識方法
US20180211127A1 (en) Character recognition device, character recognition method, and character recognition program
JP2749946B2 (ja) 文字認識方法
JP2749947B2 (ja) 文字認識方法
JPH03126188A (ja) 文字認識装置
JP3196291B2 (ja) 文字認識方法および装置
JP3083609B2 (ja) 情報処理装置及びそれを用いた文字認識装置
JP2616994B2 (ja) 特徴抽出装置
JPH04589A (ja) 特徴抽出方法
JP3084833B2 (ja) 特徴抽出装置
JPH0656625B2 (ja) 特徴抽出方式
JP2616995B2 (ja) 文字認識装置
CN115512385A (zh) 一种位图格式钢筋图纸数据提取方法和***
JPH04591A (ja) 特徴抽出方法
CN117710985A (zh) 光学字符识别方法、装置及智能终端
JP3127413B2 (ja) 文字認識装置
JP2974167B2 (ja) 文字の大分類認識方法
KR940011699B1 (ko) 2진 영상의 윤곽선 추출방법
JP2881080B2 (ja) 特徴抽出方法
KR930012139B1 (ko) 문자인식을 위한 자획추출방법
JPH02287894A (ja) 文字認識装置
JPH0580711B2 (ja)