JPS60142481A

JPS60142481A - 文字認識装置

Info

Publication number: JPS60142481A
Application number: JP58250095A
Authority: JP
Inventors: Naoyuki Sekiya; 関谷　直之; Masahito Nakajima; 雅人中島; Tetsuo Hizuka; 哲男肥塚; Hiroyuki Tsukahara; 博之塚原; Noriyuki Hiraoka; 平岡　規之
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1983-12-28
Filing date: 1983-12-28
Publication date: 1985-07-27

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】（１）発明の技術分野本発明はテレビカメラやデジタイザ等から入力されたデ
ジタル化文字画像を認識する文字認識装置に関する。

（２）技術の背景近年デジタル信号処理技術の発達により１紙面や工業製
品などに描かれている文字をコンピュータによって認識
することが可能となった。それに伴い特に工業製品など
の製造番号や種別等の工業用文字、郵便番号、又は手書
き文字などの自動認識装置が実用化されてきている。

（３）従来技術と問題点デジタル信号処理による従来の文字認識装置としては、
認識すべき文字の種類を辞！点して予めパターン化し一
ζ記憶させておき、認識すべき文字と辞書とのパターン
マツチングをとることによって認識を行なうものが一般
的である。

そのような文字認識装置の一構成例を第１図に示す。

まず辞書を作成するためにスイッチＳを端子１゛１側に
接続し辞書作成モー川・にする。その後認識すべき文字
のリファレンスをテレビカメラ１より人力サセる。カメ
ラコン１−ロールユニット２（ＣＣＵ）によって制御さ
れるテレビカメラ１より入力された画像は電気信号に変
換された後、Ａ／Ｄ変換器３によって２値化（０又は１
）されデジタル信号に変換される。

以」二の処理によって１文字分の画像は例えば６４ビッ
ト×６４ヒツトの細かい格子状の画素（−ピッｌ−，以
下ビットという。）に分割され、各ヒツト毎に文字が存
在する部分には１が割当てられ、そうでない部分には０
が割当てられ６　この１両面分（６４ピッｌ−Ｘ　６４
ヒツト）の情報はフレームメモリ４に記憶される。この
場合各ビットは一般に文字に比べて非常に小さいため、
入力したリファレンスの文字による線は２値化された画
面上では数ビットの幅を持った２値化データの集合とし
て表わされる。（文字による線以外の部分はノイズが載
、ている部分を除いて０である。）以上のようにして辞
書を作るために入力されフレームメモリに格納された１
文字分の画像に対して、まず細線化回路５において人カ
リ、ファレンス文字の細線化が行われる。即ち前記した
ように入力リファレンス文字による線の線幅は数ビット
分あるのでこれを１ビツト又は２ピツと程度の細い幅の
線に変換する。これによっ”ζ人力リファレンス文字の
骨格構造がパターン化される。このようにして細線化さ
れた入力リファレンス文字は、細マスクパターンとして
細マスクパターンメモリ６に記１．＃される。一方フレ
ームメモリ４に格納された上記画像に刻して、太線化回
路７において入力リファレンス文字の太線化が行われる
。即ち例えば線幅が３ビツトの線を５ビット幅の太い線
に変換する。これによって入力リファレンス文字の骨格
構造のみでは表わしきれない特徴がパターン化される。

そしてこのように太線化された入力リファレンス文字は
、大マスクパターンとして太マスクパターンメモリ８に
記憶される。このようにして１文字毎にリファレンス文
字を入力・処理することによって、各リファレンス文字
毎に細マスクパターン及び大マスクパターンとしてパタ
ーン化された辞■が作成される。

以上のようにして辞書が作成された後、実際に文字を入
力して文字認識を行なう。そのためにスイッチＳを端子
１゛２側に接続し認識モードにする。

そして認識すべき文字をテレビカメラ１より入力させ、
辞■作成の場合と同様にＡ／Ｄ変換器３６ｊよって２値
のデジタル信号に変換し、アレーン、メモリ４に格納す
る。このようにして入力された文字画像はまずパターン
マツチング回路９において細マスクパターンメモリ６に
記憶されζいる各リファレンス文字の細マスクパターン
とのマツチングがとられる。そしてパターンマツチング
回路９の出力として、各リファレンス文字毎に細マスク
パターンと入力画像の文字部とを重ね合わせ、細マスク
パターンが入力画像の文字部からはみ出ず部分のビット
数が不一致度Ａとして不一致度判定回路１１に出力され
る。また同様にして入力された文字画像１はパターンマ
ツチング回路１０において大マスクパターンメモリ８に
記憶されている各リファレンス文字の大マスクパターン
とのマツチングがとられる。そしてパターンマ・スチン
グ回路１０の出力として、各リファレンス文字毎に太マ
スクパターンと入力画像の文字部とを重ね合わせ。

上記とは逆に文字部が太マスクパターンからはみ出ず部
分のビット数が不一致度Ｂとして不一致度判定回路１１
に出力される。そして不一致度判定回路１１においては
各リファレンス文字毎に入力画像に対する不一致度Ａ及
びＢの和を計算し、その和（単位はビット数）が最も小
さいリファレンス文字が入力された文字であるとして、
その文字情報を結果出力装置１２に出力する。

以上のような文字認識装置においては認識すべき文字の
種類′が変わっても辞書を新たに作れるため、柔軟性に
富んだ文字認識を行なうことができる。また細マスクパ
ターンと大マスクパターンの２種類の辞書によって認識
を行なうため、異なった線幅の文字への対応が可能とな
り、高い認識率を得ることができる。ところで第１図に
おいて太線化回路７の具体的な処理動作は入力文字画像
の線部分（１の部分〉を線の幅方向に一定し）１−数だ
（）太らせることによって実現される。これに対して細
線化回路５の具体的な処理動作は太線化の場合のように
は単純ではないのでそれについて第２図に例を示しなが
ら説明を行なう。

第２図（ａ）は入力リファレンス文字による線の一部が
３ピノ［・幅に量子化されたヒソ１−の集合とし０表わ
されている例である。この場合ヒソ１−（Φのみが０に
量子化されており、この部分だけ線幅が細くなっている
。このような３ピツＩ・幅の線を１ビツト幅の線に細線
化するためには、線部分（１に量子化されたヒソＩ〜の
部分）の各ヒツト毎に上下左右方向及び斜め方向の自身
の周囲８ビツトを見て３周囲８ヒツトがずべて１の場合
にはそのヒツトに１を割り当て、１つ呑もＯがあればそ
のビットは０にするという操作を行なうことによって細
線化を行う。

第２図（ａｌの場合２例えばビット■について見ると左
右２ヒ、ットと下３ヒツトは１であるが、上３ピッ１へ
が０であるため、ピッ１−■は０とする。即ち、ビット
■は捨てられる。ところがヒツト■について見ると、上
下左右斜めの周囲８、ビットが全て１であるためピッＩ
・■には１が割り当てられそのビットは残される。他の
全ての線部分のビットについても同様の操作を行なうこ
とｐこまって第２図ｔａ＋の３ヒツト幅の線は同図中の
斜線で示したように１ビツト幅の線に細線化される。と
ころがこの細線化の方法によるとビット■、■、■につ
いては残しておくべき（１を割当てるべき）であるのに
、ビ・ノド■がＯであるために各ヒツトの周囲８ヒツト
を見ることによって３つのビットは捨てられてしまい、
同図に示すように１ヒツト幅に細線化した時に　その部
分が切れてしまうという問題点があった。このような問
題ば３ヒ／を幅を１ビツト幅に細線化する場合に限らず
、入力リファレンス文字の線幅が途中で細くなっている
ような場合にも生じる。さらに第２図（ｂｌに示すよう
に２ビツト幅の線を」二記の細線化の方法によゲで細線
化しようとすると、各ヒツトとも周囲８ヒツトか全て１
になるビットは１つもないので全てのヒツトにＯが割当
てられて消去されてしまうという問題点があった。そし
てこれらの不都合な細線化は結果的に文字の誤認識を生
しやすくしてしまうという問題点があった。

また第１図に示した。Ｊ、うな従来の文字認識装置によ
ると、入力されたリファレンス文字を含む画像にノイズ
成分か載っている場合１文字以外の部分がＫ１１１線化
又は太線化されてしまいそれらを細マスクパターン又は
大マスクパターンとした場合に。

認識時におけるパターンマツチング、４！Ｉに細マスク
パターンとのマツチングにおいて、そのノイズｇＢ分が
前記不一致度Ａの出力値を増してしまい。

細マスクパターンとのパターンマツチングに対する依存
度の大きな線幅の♀■１い文字の認識が低下してしまう
という問題点があった。

（４）発明の目的本発明は上記問題点を除くために、従来の画像入力装置
、Δ／Ｄ変換器、アレーン、メモリ、及びパターンマツ
チング回路などにより構成される文字認識装置に、孤立
ヒント除去回路及び重みイ」り細線化回路などを付加す
るごとにより、線幅の細い文字に刻しても高い認識率で
文字認識を行なうことのできる文字認識装置を提供する
ことを目的とする。

（５）発明の構成本発明は検出すべきビーノドの周囲のビットの２値デー
タを検出する手段と、該周囲のビットに所定の重み付け
を施す手段と２周囲ヒツトの２値データに基づいて重み
の和を検出する手段と、該重みの和が第１の設定値を越
えているときに検出すべきビットをマスクパターン用ヒ
ツトとして出力する細線化手段とを備えたことを特徴と
する文字認識装置及び検出すべきピッ１〜の周囲のヒツ
トの２値データを検出する手段と、該周囲のビットに所
定のｍみイζＪりを施ず１段と４周囲ヒツトの２値デー
タに基づいて重みの和を検出する手・陵と、該重めの和
が第１の設定値を越えているときに検出ずべきビットを
マスタパターン用ヒントとして出力する細線化手段と前
記周囲ピッ］−の２埴デークの和が所定の第２設定値以
下であるとき検出ピノ１−を独立ビットとして消去する
手段を有することを特徴とする文字認識装置を提供する
ものである。

（６）発明の実施例以下本発明の実施例について詳細に説明を行なう。

第３図は本発明による文字認識装置の全体的な構成図で
ある。

本発明と第１図に示した従来例とで異なる点は。

フレームメモリと細線化回路及び太線化回路の間に孤立
しノｌ−除去回路１３が接続されており、又従来の細線
化回路５　（第１図）の代わりに重み（りＪり細線化回
路１４とそれを制御する重み設定回路１５及びスライス
レベル設定回路１６が接続されている点である。その他
の構成及び動作は第１図の従来例の場合と同様なので、
その説明は省略する。

まず孤立ビット除去回路１３は入力したリファレンス文
字を含む画像におい°乙　１ヒソ１−だげ孤立して１に
量子化されているヒソ１を９文字部分ではなく、ノイズ
やごみによるものとして除去してしまう回路である。具
体的な動作は、入力画像において１に量子化されている
ヒツト、を順に見てゆき、そのビットの周囲８ビツトが
全て０ならばそのビットはノイズ又はごみなどによる孤
立ビットであるとして除去する。この回路によってノイ
ズ又はごみによる文字以外の部分が誤って細線化又は太
線化されてしまうということを避けることができる。

次に太線化回路７については従来例と同じであるので霧
略し１重め付は細線化回路１４１重め設定回路１５．及
びスライスレベル設定回路１６の動作について説明する
。第４図はこの３つの回路の部分の詳しい構成図である
。即ち市みイ］け９、■線化回路１４ば重み付は回路１
７及び細線化判定回路１８から構成され、それぞれ重み
設定回路１５及びスライスレベル設定回路１６によって
制御される。

重み付は細線化回路１４は入力されたリファレンス文字
の線部分の各ビットに重め付＆Ｊを行ないＩｔｎｌ線化
するための回路である。その具体的な重め設定例を第５
図に示す。

まず第５図（ａｌは斜線で示した線部分のビット（１に
量子化されているビット）においてその周囲８ビツトを
見て、ヒソＩ・ｐが１に量子化されているならば得点２
を足し、０に量子化されているならば点は加えない。

以下ヒツトｑ、ｒ、ｓ、ｔ、ｕ、Ｖ、ｗについてそれぞ
れ重み伺けの点数を斜線部のヒツトからの距離に応して
、３，２．３，２．３，２．３点とし２周囲８ビ、トに
対して合計の点数を計算し。

その結果を斜線部のヒソ１への重みと３−る。

第５図（ｂｌは注目するヒント（斜線部のビット）の右
側と下側の市みを犬きくシ、方向性を持たせた設定例で
ある。即ち右側と下側の重みの点数か高くなっているた
め、右側と下側のヒントが１に量子化さり、ていると斜
線部のビットの重みが大きくなる。

第６図ｔａ＋は第５図（ｂｌの重み設定例を用いて、１
箇所（ピストｏ）だけ欠落している３ピノ１−幅の線部
分のそれぞれのピッＩ・に重み付りを行なった例である
。例えばビット■についてみると第５図（ｂｌのピッｌ
−ｕ、ｖ、ｗに相当するビットのみが１に量子化されて
いるため、ヒｙ　）ｕ’、ｖ、　ｗに対する重み５．４
．５点が足されて工４点となる。

またビット■についてめると、第５図（ｂｌのヒソｉ　
ｐ　＝　ｗに相当する周囲８ヒツトが全て１に量子化さ
れているため、ビットｐ〜Ｗに対する重みが全て加算さ
れて最高点２８点となる。

また欠落しているピッ］・＠の近くの内側のヒツト■、
［相］、■などについては例えばピッ］−■について見
ると、第５図ｔｂ＋のヒソｌ−ｐに相当するビットのみ
が０に量子化されているにずぎないため。

重め伺りを行なうと２５点と比較的高い点数となる。ビ
ット［相］及び０についても同様である。

以−Ｌのような重み付けを行なった後、第６図（ａｌの
例では２１点以上の重み伺りがされているヒツトのみを
細線化ビットとして残す（１に量子化し他のビットは０
に量子化する）ことによって、同図中の太線の枠で囲ま
れた部分が細線化の結果となり、細マスクパターンとし
て出力される。このような方法によればヒソｌ−■が欠
落し°ζいてもヒツト■、亀＠の部分が細線化により消
去される５ことはなくなる。

以」二のような処理において第５図（ａ）又は（ｂｌに
示ずような重み伺り方法の設定は重み設定回路１５にお
いて行なうことができ、それに従って重め伺は回路１７
において第６図＋ａ＋に示したような重め伺けが行われ
る。そしてスラ・イス１ノヘル設定回路１Ｇにおい“ζ
ｒ＋＋＋線化ビットとし７て残ずべき市め伺りの点数闇
値を設定しく第６図ｉａ）の例の場合２１点）、細線化
判定回路１８において」−記闇値に従ってＨｍ　ｉｇｔ
化（第６図（・ｌ）の大枠部分を抽出する処理）を行う
。

第に図（ｌ））は第５図（ｂｌの車み設定例を用いて２
ビツト幅の線部分のそれぞれのピッＩ・に市みイ＝Ｊり
を行なった例である。この場合第５図（Ｉ））の市め設
定例が方向性のある重み設定例であるため、上側のビッ
ト０と下側のヒツト■なとで重め伺りの点数が異なり、
１スライスレベル設定回路１６において例えば闇値を１
７点に設定するごとによって、同図の太線の枠で囲まれ
た部分がａａ線化の結果となり、細マスクパターンとし
て出力される。このようにスライスレベル設定回路１６
においてイ■線化の重み付は闇値を変えることによって
２ビット幅の線部分の細線化も可能となり、ま、た、第
６図（ａｌなどにおいては３重み付の闇値を下げるごと
によって３ビツト幅から２ビツト幅−・の細線化も簡１
１１に可能となる。さらに重み設定回路１５において第
５図以外の重み設定（例えば見る範囲を周囲８ビツトよ
り広くする）を行なうことにより、３ビツト幅より広い
幅の線に対しても細線化を行なうことが可能となる。

以−］二のように本発明による重み（＝ＪシＪ細線化を
行なうことにより、従来方式では困ゲ１ｆであった８用
い線幅部分の細線化をはじめとするさまざまな種類の線
の細線化を行なうことが可能となる。そしてこのように
して細線化された細マスクパターンをｈａマスタパター
ンメモリ６　（第３図）に記憶させ。

従来例と同様にパターンマツチングを行なうことにより
従来例の場合よりも高認識率の文字認識を行なうことが
できる。

（７）発明のすＪ果本発明によれば孤立しント除去回路にＪ、って文字以外
のノイズ又はごみなどによる不要なヒソｌ−を消去する
ことができ２特に線幅の６１１１い文字の認識率を高め
ることができる。

これに加えて重め（＝ＪしＪ細線化を行なうごとによっ
て、　＋ｎｏ線化の自由度を従来方式に比べて大きくす
ることができ、より高い認識を行なうことができる６■
マスクパターンを作成することか可能となる。

【図面の簡単な説明】

第１図は従来の文字認識装置の構成図１第２図は従来の
細線化処理の説明図、第３図は本発明による文字認識装
置の構成図、第４図は本発明による重み付り細線化回路
とその周辺回路の構成図。第５図（ａｌ　、　′（ｂｌは重み伺げ設定のパターン
図、第６図ｔａ＋、　（ｂ）は実際の重みイ′Ｊリパタ
ーン図である。１・・・テレヒカメラ　２・・・カメラコンＩ−ロール
ユニソＩ−（ＣＣＵ）　３・・・Ａ　／　Ｉ）変換器　
４・・・フレームメモリ　５・・・細線化回路６・・・細マスクパターンメモリ７・・・太線化回路　８・・・太マスクパターンメモリ
　９．１９・・・パターンマツチング回路　１１・・・不一致度刊定回路　１
２・・・結果出力装置　１３・・・孤立ヒフ１−除去回路　１４・・・重み伺り細線化回路　１５・・・重み設定回路１６・・・スライスレベル設定回路１７・・・重み付は回路　１８・・・細線化判定回路Ｓ・　・・スイソチ第１図ら第２図（０）

Claims

【特許請求の範囲】

（１）検出ずべきビットの周囲のビットの２値データを
検出する手段と、該周囲のビットに所定の重みイ］けを
施す手段と２周囲ビットの２値データに基づいてｍみの
和を検出する手段と、該重みの和が第１の設定値を越え
ているときに検出ずべきビットをマスタパターン用ビッ
トとして出力する細線化手段とを備えたことを特徴とす
る文字認識装置。
（２）前記マスクパターン用のピノ［・は細線化用ヒツ
トであることを特徴とする特許請求の範囲第１項記載の
文字認識装置。
（３）検出すべきヒツトの周囲のヒントの２値テータを
検出する手段と、該周囲のヒツトに所定の重み伺のを施
す手段と９周囲ビットの２値データに基づいて重みの和
を検出する手段と、該重みの和が第１の設定値を越えて
いるときに検出ずへきビットをマスクパターン用ビット
とし′ζ出力する細線化手段と前記周囲ビットの２値デ
ータの和が所定の第２設定値以下であるとき検出ビット
を孤立ヒントとして消去する手段を有することを特徴と
する文字認識装置。