JP3113769B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JP3113769B2
JP3113769B2 JP05280651A JP28065193A JP3113769B2 JP 3113769 B2 JP3113769 B2 JP 3113769B2 JP 05280651 A JP05280651 A JP 05280651A JP 28065193 A JP28065193 A JP 28065193A JP 3113769 B2 JP3113769 B2 JP 3113769B2
Authority
JP
Japan
Prior art keywords
feature
edge
character
outline
character pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP05280651A
Other languages
English (en)
Other versions
JPH07160824A (ja
Inventor
孝志 勝毛
Original Assignee
株式会社日本デジタル研究所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社日本デジタル研究所 filed Critical 株式会社日本デジタル研究所
Priority to JP05280651A priority Critical patent/JP3113769B2/ja
Publication of JPH07160824A publication Critical patent/JPH07160824A/ja
Application granted granted Critical
Publication of JP3113769B2 publication Critical patent/JP3113769B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は文字認識装置に関し、特
に、光電変換によって得られた文字パターンを2値化
し、2値化した文字パターンから文字の特徴量を抽出
し、その特徴量を用いて文字を認識する文字認識装置に
関する。
【0002】
【従来の技術】従来、手書き文字を認識する文字認識装
置として、外郭方向寄与度を用いたものが知られてい
る。外郭方向寄与度とは文字パターンを複数方向から走
査したとき、白(背景)から黒(文字)へ変化する点
(外郭点)を求めることにより文字の大局的な特徴を表
わす外郭特徴と、黒(文字)部分の複数方向の連結長に
より文字の局所的な方向を示す方向寄与度特徴によって
構成されており、外郭特徴で表わされる外郭点における
方向寄与度特徴を選択した特徴を文字パターンの特徴と
する。
【0003】外郭寄与度については、電子通信学会論文
誌(1)(J66−D、NO.10、1983)の第1
185〜1192頁に荻田紀博、内藤誠一郎、増田功氏
の名で「外郭方向寄与度特徴による手書き漢字の識別」
と題して掲載の論文に詳しく説明されている。また、上
記論文の外郭方向寄与度特徴による文字認識に関連する
発明として、特開昭57−8880号(文字パターン
の分類処理装置)、特開昭57−164376号(文
字パターン分類処理装置)、特開昭57−18927
7号(文字認識装置)、特開昭58−200378号
(文字パターンの分類装置)、特開昭58−2238
84号(文字パターンの分類処理装置)、特開昭64
−51593号(文字認識方法)がある。
【0004】上述の発明のうちは方向寄与度と局所的
なメッシュ特徴の組み合わせに関するものであり、は
方向寄与度と大局的特徴との組み合わせに関するもので
あり、はとと大局的線密度特徴との組み合わせに
関するものであり、は局所的なメッシュ領域において
の方法を適用したものであり、はの方法の特殊な
タイプであり、は外郭寄与度と方向密度ベクトルとの
組み合わせに関するものである。
【0005】一方、従来の文字認識装置では光電変換
後、位置及び大きさの正規化を行った文字パターンにつ
いて、上記外郭寄与度による特徴ベクトルを作成し予め
用意された辞書テーブルとのマッチングをとり、文字パ
ターンの分類を行っていた。しかしながら、方向寄与度
の問題点として次のようなものがある。 (1)方向寄与度は文字の黒画素の追跡によって求めら
れる特徴であり、黒画素の凹凸や抜けによるノイズによ
り特徴量が変動する。 (2)黒画素の凹凸ノイズは文字の輪郭で発生し、外郭
特徴と方向寄与度との組み合わせでは特徴量の変動を受
けやすい。例えば、図2に示す認識文字例について方向
寄与度を求めるものとし、図2で‘・’を背景部
(白)、‘1’を文字部(黒)とし、文字線の方向コー
ドを図7(b)に示すように定義し、ある画素における
方向寄与度をD=(D1,D2,D3,D4)とする
(但し、D1〜D4はそれぞれ図7(b)の方向1,
2,3,及び方向4における方向寄与度である)。
【0006】このとき、図2の画素Aにおける方向寄与
度DAは、 DA=(0.98,0.10,0.05,0.14) と表わされ、方向1の成分が非常に強いことがわかる。
同様に、画素Bにおける方向寄与度DBは、 DB=(0.14,0.57,0.57,0.57) となる。しかし、画素Bは周囲画素からみてノイズとみ
なされる。このことから、方向寄与度はノイズによって
大きく変動することが明らかである。
【0007】
【発明が解決しようとする課題】上述した従来技術の、
方向寄与度がノイズによって大きく変動する、という問
題点を解決する手段として、従来はノイズ除去処理を行
っていた。ノイズ除去処理の代表例として、3×3のマ
トリックスによるパターンマッチング手法があり、これ
によれば1ドット幅の凹凸ノイズが除去できる。しかし
ながら、上述の方式によれば認識率がノイズ除去処理の
性能に左右されるという問題点、及びノイズ除去処理の
性能を上げるための処理量が増大すると言う問題点があ
った。
【0008】本発明は、 従来文字認識装置で用いられている外郭方向寄与度
が文字パターンの輪郭部に発生する凹凸ノイズに影響さ
れやすく、認識性能低下の原因になる、 ノイズ除去処理を行った場合、処理量が多くなり認
識時間が遅くなる。という問題点を解決するためになさ
れたものであり、文字の局所的な方向をノイズの影響な
く求めるエッジ特徴と文字の大局的特徴を求める外郭特
徴とを組み合わせることにより、ノイズ除去が不要で且
つ文字輪郭部分のノイズに影響されることなく高い認識
性能を有する文字認識装置の提供を目的とする。
【0009】
【課題を解決するための手段】上記の目的を達成するた
めに発明の文字認識装置は、2値化された文字パター
ンに対し位置及び大きさの正規化処理を行う正規化処理
部と、正規化処理後の文字パターンを入力し、該文字パ
ターンの外郭特徴を抽出する外郭特徴抽出部と、正規化
処理後の文字パターンを入力し、該文字パターンのエッ
ジ方向及びエッジ強度を抽出するエッジ特徴抽出部と、
外郭特徴抽出部で得た外郭特徴の外郭点におけるエッジ
方向とエッジ強度をエッジ特徴抽出部から入力してエッ
ジ方向別に該エッジ強度を累積し、正規化処理後の1文
字パターンの全ての外郭点についてエッジ方向別のエッ
ジ強度を累積した後、この累積されたエッジ強度をエッ
ジ方向別に正規化した特徴量を得る特徴合成部と、を
え、特徴合成部で得た特徴量に基づいて文字パターンの
分類を行うことを特徴とする。
【0010】
【0011】
【0012】
【0013】
【作用】上記構成により発明の文字認識装置は、外郭
特徴抽出部で正規化処理後の文字パターンを入力し該文
字パターンの外郭特徴を抽出し、エッジ特徴抽出部で正
規化処理後の文字パターンを入力し該文字パターンのエ
ッジ特徴(エッジ方向及びエッジ強度)を抽出し、特徴
合成部により外郭特徴抽出部で得た外郭特徴の外郭点に
おけるエッジ特徴(エッジ方向及びエッジ強度)をエッ
ジ特徴抽出部から入力し特徴量を求める。そして、特徴
合成部で得た特徴量に基づいて文字パターンの分類を行
う。
【0014】第2の発明は上記第1の発明の文字認識装
置において、エッジ特徴抽出部が算出手段により外郭点
の座標(i,j)におけるエッジ特徴としてエッジ方向
θ(i,j)及びエッジ強度V(i,j)を求め、量子
化手段により該エッジ方向θ(i,j)及びエッジ強度
V(i,j)をそれぞれ所定の区分に量子化する。
【0015】第3の発明は上記第1または第2の発明の
文字認識装置において、特徴合成部が、外郭特徴格納手
段により外郭特徴格納手段から各外郭点毎の外郭特徴を
順次読み出し、特徴量格納位置決定手段により読み出さ
れた外郭特徴から特徴量格納位置を決定し、エッジ特徴
読出手段により読み出された外郭特徴の外郭点のエッジ
特徴をエッジ特徴格納手段から読み出す。そして、特徴
量算出手段によりエッジ特徴のエッジ強度をエッジ方向
別にそれぞれの特徴量格納位置に累積して特徴量を得
る。
【0016】第4の発明は上記第3の発明の文字認識装
置において、特徴量正規化手段により1つの文字パター
ンの全ての外郭特徴についての特徴量を得た後、各特徴
量格納位置内で特徴量をエッジ方向別に正規化する。
【0017】
【実施例】図1は本発明に基づく文字認識装置の一実施
例の構成を示すブロック図であり、11は光電変換部、
12は正規化処理部、13は外郭特徴抽出部、14はエ
ッジ特徴抽出部、15は特徴合成部、16は識別部、1
7は特徴辞書テーブルである。光電変換部11は入力さ
れた文字パターンを電気信号に変換し正規化処理部12
に出力する。正規化処理部12は、光電変換部11によ
って電気信号に変換された文字パターンの位置及び大き
さの正規化を行い、外郭特徴抽出部13及びエッジ特徴
抽出部14に出力する。外郭特徴抽出部13は、従来の
外郭方向寄与度を用いる文字認識方式で用いられる外郭
特徴抽出処理と同様の動作を行う。すなわち、正規化処
理部12から出力される文字パターンを複数方向から走
査し、ある走査方向に対して文字線を最初に横切る点を
第1次特徴とし、同様に2回目、3回目、…、n回目に
横切る点をそれぞれ第2次特徴、第3次特徴、…、第n
次特徴として外郭特徴抽出部13のメモリ(図4(a)
参照)に格納する。
【0018】図2は認識対象文字例であり、‘・’は背
景部(白)を‘1’は文字部(黒)を表わし、図3は図
2に示す認識文字例の外郭特徴抽出部13による処理結
果の一例であり、走査方向Sのうち図4(b)に示す走
査方向7による外郭特徴抽出処理のである。また、図
4(a)は外郭特徴のテーブル構成例であり、この例で
は外郭特徴は走査方向S、外郭点の座標(i,j)、次
数M、及び区間Wで構成されている。区間Wはある走査
方向における走査範囲を示しており、図3に示す処理例
では1から4まである。エッジ特徴抽出部14は正規化
処理部12から出力される文字パターンのエッジの方向
及び強度をエッジ特徴として求める。
【0019】xを水平方向、yを垂直方向とし、X方向
のある座標をi、y方向のある座標をjとするとx方向
の微分値fx(i,j)及びy方向の微分値fy(i,
j)は次式のように表される。 fx(i,j)={f(i+1,j+1)+f(i+1,j) +(i+1,j−1)−f(i−1,j+1) −f(i−1,j)−f(i−1,j−1)} (1) fy(i,j)={f(i−1,j−1)+f(i,j−1) +(i+1,j−1)−f(i−1,j+1) −f(i,j+1)f(i+1,j+1)} (2)
【0020】上式(1),(2)からエッジの方向θ
(i,j)及びエッジの強度V(i,j)は次式のよう
に表わされる。
【数2】 θ(i,j)=tan-1(fy/fx) (3) V(i,j)={fx(i,j)2+fy(i,j)21/2 (4) f(i,j)は座標(i,j)における画像の明るさで
あり、1が黒(文字部)であり、0が白(背景部)であ
る。
【0021】図5,6は図2に示す認識文字列のエッジ
特徴抽出部14による処理結果の例を示し、図5はエッ
ジの方向を、図6はエッジの強度をそれぞれ示してい
る。エッジの方向θ(i,j)は図7(a)に示すよう
に背景部から文字部に向かう方向を示しており、図7
(b)に示すような4つの方向コードに量子化してい
る。また、方向が不定の場合は方向コードを5としてい
る。ここで、従来技術の方向寄与度における「方向」が
文字線の方向を示しているのに対し、エッジ特徴での
「方向」は文字の輪郭線に対して垂直な方向を示す。従
って、方向寄与度と比較した場合、90°回転したよう
な方向になる。
【0022】エッジの強度V(i,j)は8段階に量子
化しており、方向コード不定の場合はエッジの強度を0
にしている。例えば、図2における画素Aのエッジ特徴
はエッジ方向θA=4、エッジ強度VA=4であり、画
素Bのエッジ特徴はエッジ方向θB=3、エッジ強度V
B=6である。画素A及び画素Bにおける特徴量を方向
寄与度と比較すると、方向寄与度はノイズによって方向
が全く変わってしまうがエッジ特徴の場合は変化の方向
が隣り合った方向になっており、大きく変動しない。
【0023】図7(c)はエッジ特徴のテーブル構成例
であり、特徴点の座標(i,j)、4つの方向コードに
量子化されたエッジの方向θ、8段階に量子化されたエ
ッジの強度Vで構成されている。特徴合成部15は、ま
ず外郭特徴抽出部13から各外郭点毎の外郭特徴を入力
し、ついで各外郭特徴の外郭点におけるエッジ特徴をエ
ッジ特徴抽出部14から入力し最終的な特徴量を求め
る。
【0024】図8は特徴合成部15の具体的動作を示す
フローチャートであり、ステップS1で外郭特徴抽出部
13の特徴テーブル(例、図4(a))を参照しステッ
プS2に移る。ステップS2では図7(c)に示すよう
なエッジ特徴テーブルのエッジ特徴に基づいて決定され
る特徴量格納位置(例えば、テーブル形式で構成する特
徴量格納エリアの位置(図示せず))を求めステップS
3に移る。特徴量の格納位置は、例えば、走査方向S、
次数M、区間Wによって決定することができる。
【0025】次に、ステップS3ではその外郭特徴の外
郭点のエッジ特徴をエッジ特徴抽出部14から入力して
ステップS4に移る。例えば、図4(a)の例で走査方
向S=7における外郭点(24,2)のエッジ特徴とし
て図7(c)の座標(24,2)の方向θ=3,強度V
=2が格納される。ステップS4ではステップS2で求
めた格納位置にエッジ強度をエッジ方向コード別に累積
して正規化前の特徴量とする。ここで、不定方向コード
5は、走査方向Sと平行なエッジ方向に累積する。不定
方向コード5のエッジ強度(V5)は任意に設定可能で
ありV=0の場合は図6に示すように不定方向コードを
無視したことになる。
【0026】図9は不定方向コード5の取り扱いを説明
するための認識文字例“文”であり、図2に示した認識
文字例“文”と比べて文字線幅が細くなっている。
【0027】図10は図9に示した認識文字例“文”の
エッジ特徴抽出部14によるエッジ方向の抽出結果の一
例であり、領域Cにおいて不定方向コード5が多数存在
している。走査方向S=7の場合、V5=0ではV5の
累積は行われず、領域Cの文字情報は失われる。一方、
V>0の場合はエッジ方向コード3の特徴量格納位置に
V5が累積される。従って、図9に示す認識文字例
“文”のように文字線幅が細い場合にも文字情報が反映
される。
【0028】ステップS5では上記ステップS4の動作
を外郭特徴の外郭点がなくなるまで繰返し、その後、ス
テップS6で各特徴量格納位置内で方向別に特徴量の正
規化を行う。正規化後の特徴量Diはあるエッジ方向i
におけるエッジ強度の累積値(正規化前の特徴量)をE
Diとすると、下記(5)式で表わされる。
【数3】 Di=(EDi/max(EDj)) (5) 式(5)は特徴量(ベクトル)を表わし、例えば、エッ
ジ方向コード数が4個の場合j=1〜4となる。また、
式(5)の分母は4つのエッジ方向のうち最大の値を持
つエッジ方向を選択することを意味する(即ち、式
(5)では各格納位置内において最大のエッジ方向が1
になるように正規化することを意味する)。
【0029】例えば、ある格納位置においてエッジ方向
コード1のエッジ強度の累積値(正規化前の特徴量)1
0、エッジ方向コード2のエッジ強度の累積値が15、
エッジ方向コード3のエッジ強度の累積値が20、エッ
ジ方向コード4のエッジ強度の累積値が12の場合、特
徴量(ベクトル)(D1,D2,D3,D4)は(0.
5,0.75,1.0,0.6)となる。識別部16は
上述した特徴合成部15に格納されている特徴と予め用
意された各文字の特徴辞書テーブル17とのマッチング
をとり文字パターンの分類を行う。
【0030】本発明は前述した方向寄与を用いる場合
と比較すると、方向寄与度はノイズによって方向が全く
変わってしまうのに対し、エッジ特徴では変化の方向が
隣り合った方向になっており、ノイズによって大きく変
動しないのでノイズ処理を必要としない。従って、認識
率がノイズ除去処理の性能に左右されることなく、ま
た、ノイズ除去処理回路を要しない。
【0031】
【発明の効果】以上説明したように本発明の文字認識装
置によれば、文字の局所的な方向をノイズの影響なく求
めるエッジ特徴と文字の大局的特徴を求める外郭特徴を
合成し、その構成した特徴と各文字の特徴辞書とのマッ
チングをとり文字パターンの分類を行っているので、文
字パターンの輪郭部に発生する凹凸ノイズに影響されな
い文字認識が実現できる。
【図面の簡単な説明】
【図1】本発明に基づく文字認識装置の一実施例の構成
を示すブロック図である。
【図2】文字認識例を示す図である。
【図3】図2に示す認識文字例の外郭特徴抽出部による
処理結果の一例を示す図である。
【図4】走査方向、及び外郭特徴のテーブル構成例であ
る。
【図5】図2に示す認識文字列のエッジ特徴抽出部によ
る処理結果の一例(エッジの方向)を示す図である。
【図6】図2に示す認識文字列のエッジ特徴抽出部によ
る処理結果の一例(エッジの強度)を示す図である。
【図7】エッジ特徴と方向コードの説明図、及びエッジ
特徴のテーブル構成例である。
【図8】特徴合成部の動作を示すフローチャートであ
る。
【図9】認識文字の例である。
【図10】認識文字の例である。
【符号の説明】
11 光電変換部 12 正規化処理部 13 外郭特徴抽出部 14 エッジ特徴抽出部 15 特徴合成部 16 識別部 17 特徴辞書テーブル

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 2値化された文字パターンに対し位置及
    び大きさの正規化処理を行う正規化処理部と、 前記正規化処理後の文字パターンを入力し、該文字パタ
    ーンの外郭特徴を抽出する外郭特徴抽出部と、 前記正規化処理後の文字パターンを入力し、該文字パタ
    ーンのエッジ方向及びエッジ強度を抽出するエッジ特徴
    抽出部と、 前記外郭特徴抽出部で得た外郭特徴の外郭点における
    ッジ方向とエッジ強度を前記エッジ特徴抽出部から入力
    てエッジ方向別に該エッジ強度を累積し、前記正規化
    処理後の1文字パターンの全ての外郭点についてエッジ
    方向別のエッジ強度を累積した後、この累積されたエッ
    ジ強度を正規化した特徴量を得る特徴合成部と、を
    え、 前記特徴合成部で得た特徴量に基づいて文字パターンの
    分類を行うことを特徴とする文字認識装置。
JP05280651A 1993-10-15 1993-10-15 文字認識装置 Expired - Lifetime JP3113769B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP05280651A JP3113769B2 (ja) 1993-10-15 1993-10-15 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP05280651A JP3113769B2 (ja) 1993-10-15 1993-10-15 文字認識装置

Publications (2)

Publication Number Publication Date
JPH07160824A JPH07160824A (ja) 1995-06-23
JP3113769B2 true JP3113769B2 (ja) 2000-12-04

Family

ID=17628031

Family Applications (1)

Application Number Title Priority Date Filing Date
JP05280651A Expired - Lifetime JP3113769B2 (ja) 1993-10-15 1993-10-15 文字認識装置

Country Status (1)

Country Link
JP (1) JP3113769B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6349011B1 (en) 1997-08-30 2002-02-19 Lg Electronics, Inc. Automatic tracking system and tracking method

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE514377C2 (sv) * 1998-08-26 2001-02-19 Gunnar Sparr Teckenigenkänning
CN107977659B (zh) * 2016-10-25 2021-03-16 北京搜狗科技发展有限公司 一种文字识别方法、装置及电子设备
CN109697442B (zh) * 2017-10-20 2023-04-07 阿里巴巴集团控股有限公司 一种字符识别模型的训练方法和装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6349011B1 (en) 1997-08-30 2002-02-19 Lg Electronics, Inc. Automatic tracking system and tracking method

Also Published As

Publication number Publication date
JPH07160824A (ja) 1995-06-23

Similar Documents

Publication Publication Date Title
Kumar et al. A detailed review of feature extraction in image processing systems
US5287275A (en) Image recognition apparatus and method for recognizing a pattern within an image
US7233697B2 (en) Character recognition device and a method therefor
US8144943B2 (en) Apparatus and method for detecting specific subject in image
US5539840A (en) Multifont optical character recognition using a box connectivity approach
US20040086153A1 (en) Methods and systems for recognizing road signs in a digital image
JP4300098B2 (ja) オブジェクト識別方法とその装置、プログラム及び記録媒体
JPH06215293A (ja) 車番認識装置
JP3113769B2 (ja) 文字認識装置
Qiu et al. An optimized license plate recognition system for complex situations
JP4264332B2 (ja) 文字認識装置、ナンバープレート認識システム
KR101991461B1 (ko) 특징점의 벡터화를 이용한 문자인식 시스템 및 방법
Gatos et al. A segmentation-free recognition technique to assist old Greek handwritten manuscript OCR
JP3687999B2 (ja) 文字認識装置
KR940007935B1 (ko) 문자 인식을 위한 후보 분류 방법
JP2902097B2 (ja) 情報処理装置及び文字認識装置
JP3104355B2 (ja) 特徴抽出装置
JP3446794B2 (ja) 文字認識における多角形近似法および文字認識装置
JP2974167B2 (ja) 文字の大分類認識方法
JP2728117B2 (ja) 文字認識装置
JP4231375B2 (ja) パターン認識装置、パターン認識方法、パターン認識プログラムおよびパターン認識プログラムを記録した記録媒体。
JP3463255B2 (ja) 多値画像パターンの認識処理方法
JPS63269267A (ja) 文字認識方法
JP2917396B2 (ja) 文字認識方式
KR930012139B1 (ko) 문자인식을 위한 자획추출방법

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080922

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110922

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140922

Year of fee payment: 14

EXPY Cancellation because of completion of term