JPS60142481A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPS60142481A
JPS60142481A JP58250095A JP25009583A JPS60142481A JP S60142481 A JPS60142481 A JP S60142481A JP 58250095 A JP58250095 A JP 58250095A JP 25009583 A JP25009583 A JP 25009583A JP S60142481 A JPS60142481 A JP S60142481A
Authority
JP
Japan
Prior art keywords
circuit
bit
thinning
bits
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58250095A
Other languages
English (en)
Inventor
Naoyuki Sekiya
関谷 直之
Masahito Nakajima
雅人 中島
Tetsuo Hizuka
哲男 肥塚
Hiroyuki Tsukahara
博之 塚原
Noriyuki Hiraoka
平岡 規之
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP58250095A priority Critical patent/JPS60142481A/ja
Publication of JPS60142481A publication Critical patent/JPS60142481A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (1)発明の技術分野 本発明はテレビカメラやデジタイザ等から入力されたデ
ジタル化文字画像を認識する文字認識装置に関する。
(2)技術の背景 近年デジタル信号処理技術の発達により1紙面や工業製
品などに描かれている文字をコンピュータによって認識
することが可能となった。それに伴い特に工業製品など
の製造番号や種別等の工業用文字、郵便番号、又は手書
き文字などの自動認識装置が実用化されてきている。
(3)従来技術と問題点 デジタル信号処理による従来の文字認識装置としては、
認識すべき文字の種類を辞!点して予めパターン化し一
ζ記憶させておき、認識すべき文字と辞書とのパターン
マツチングをとることによって認識を行なうものが一般
的である。
そのような文字認識装置の一構成例を第1図に示す。
まず辞書を作成するためにスイッチSを端子1゛1側に
接続し辞書作成モー川・にする。その後認識すべき文字
のリファレンスをテレビカメラ1より人力サセる。カメ
ラコン1−ロールユニット2(CCU)によって制御さ
れるテレビカメラ1より入力された画像は電気信号に変
換された後、A/D変換器3によって2値化(0又は1
)されデジタル信号に変換される。
以」二の処理によって1文字分の画像は例えば64ビッ
ト×64ヒツトの細かい格子状の画素(−ピッl−,以
下ビットという。)に分割され、各ヒツト毎に文字が存
在する部分には1が割当てられ、そうでない部分には0
が割当てられ6 この1両面分(64ピッl−X 64
ヒツト)の情報はフレームメモリ4に記憶される。この
場合各ビットは一般に文字に比べて非常に小さいため、
入力したリファレンスの文字による線は2値化された画
面上では数ビットの幅を持った2値化データの集合とし
て表わされる。(文字による線以外の部分はノイズが載
、ている部分を除いて0である。)以上のようにして辞
書を作るために入力されフレームメモリに格納された1
文字分の画像に対して、まず細線化回路5において人カ
リ、ファレンス文字の細線化が行われる。即ち前記した
ように入力リファレンス文字による線の線幅は数ビット
分あるのでこれを1ビツト又は2ピツと程度の細い幅の
線に変換する。これによっ”ζ人力リファレンス文字の
骨格構造がパターン化される。このようにして細線化さ
れた入力リファレンス文字は、細マスクパターンとして
細マスクパターンメモリ6に記1.#される。一方フレ
ームメモリ4に格納された上記画像に刻して、太線化回
路7において入力リファレンス文字の太線化が行われる
。即ち例えば線幅が3ビツトの線を5ビット幅の太い線
に変換する。これによって入力リファレンス文字の骨格
構造のみでは表わしきれない特徴がパターン化される。
そしてこのように太線化された入力リファレンス文字は
、大マスクパターンとして太マスクパターンメモリ8に
記憶される。このようにして1文字毎にリファレンス文
字を入力・処理することによって、各リファレンス文字
毎に細マスクパターン及び大マスクパターンとしてパタ
ーン化された辞■が作成される。
以上のようにして辞書が作成された後、実際に文字を入
力して文字認識を行なう。そのためにスイッチSを端子
1゛2側に接続し認識モードにする。
そして認識すべき文字をテレビカメラ1より入力させ、
辞■作成の場合と同様にA/D変換器36jよって2値
のデジタル信号に変換し、アレーン、メモリ4に格納す
る。このようにして入力された文字画像はまずパターン
マツチング回路9において細マスクパターンメモリ6に
記憶されζいる各リファレンス文字の細マスクパターン
とのマツチングがとられる。そしてパターンマツチング
回路9の出力として、各リファレンス文字毎に細マスク
パターンと入力画像の文字部とを重ね合わせ、細マスク
パターンが入力画像の文字部からはみ出ず部分のビット
数が不一致度Aとして不一致度判定回路11に出力され
る。また同様にして入力された文字画像1はパターンマ
ツチング回路10において大マスクパターンメモリ8に
記憶されている各リファレンス文字の大マスクパターン
とのマツチングがとられる。そしてパターンマ・スチン
グ回路10の出力として、各リファレンス文字毎に太マ
スクパターンと入力画像の文字部とを重ね合わせ。
上記とは逆に文字部が太マスクパターンからはみ出ず部
分のビット数が不一致度Bとして不一致度判定回路11
に出力される。そして不一致度判定回路11においては
各リファレンス文字毎に入力画像に対する不一致度A及
びBの和を計算し、その和(単位はビット数)が最も小
さいリファレンス文字が入力された文字であるとして、
その文字情報を結果出力装置12に出力する。
以上のような文字認識装置においては認識すべき文字の
種類′が変わっても辞書を新たに作れるため、柔軟性に
富んだ文字認識を行なうことができる。また細マスクパ
ターンと大マスクパターンの2種類の辞書によって認識
を行なうため、異なった線幅の文字への対応が可能とな
り、高い認識率を得ることができる。ところで第1図に
おいて太線化回路7の具体的な処理動作は入力文字画像
の線部分(1の部分〉を線の幅方向に一定し)1−数だ
()太らせることによって実現される。これに対して細
線化回路5の具体的な処理動作は太線化の場合のように
は単純ではないのでそれについて第2図に例を示しなが
ら説明を行なう。
第2図(a)は入力リファレンス文字による線の一部が
3ピノ[・幅に量子化されたヒソ1−の集合とし0表わ
されている例である。この場合ヒソ1−(Φのみが0に
量子化されており、この部分だけ線幅が細くなっている
。このような3ピツI・幅の線を1ビツト幅の線に細線
化するためには、線部分(1に量子化されたヒソI〜の
部分)の各ヒツト毎に上下左右方向及び斜め方向の自身
の周囲8ビツトを見て3周囲8ヒツトがずべて1の場合
にはそのヒツトに1を割り当て、1つ呑もOがあればそ
のビットは0にするという操作を行なうことによって細
線化を行う。
第2図(alの場合2例えばビット■について見ると左
右2ヒ、ットと下3ヒツトは1であるが、上3ピッ1へ
が0であるため、ピッ1−■は0とする。即ち、ビット
■は捨てられる。ところがヒツト■について見ると、上
下左右斜めの周囲8、ビットが全て1であるためピッI
・■には1が割り当てられそのビットは残される。他の
全ての線部分のビットについても同様の操作を行なうこ
とpこまって第2図ta+の3ヒツト幅の線は同図中の
斜線で示したように1ビツト幅の線に細線化される。と
ころがこの細線化の方法によるとビット■、■、■につ
いては残しておくべき(1を割当てるべき)であるのに
、ビ・ノド■がOであるために各ヒツトの周囲8ヒツト
を見ることによって3つのビットは捨てられてしまい、
同図に示すように1ヒツト幅に細線化した時に その部
分が切れてしまうという問題点があった。このような問
題ば3ヒ/を幅を1ビツト幅に細線化する場合に限らず
、入力リファレンス文字の線幅が途中で細くなっている
ような場合にも生じる。さらに第2図(blに示すよう
に2ビツト幅の線を」二記の細線化の方法によゲで細線
化しようとすると、各ヒツトとも周囲8ヒツトか全て1
になるビットは1つもないので全てのヒツトにOが割当
てられて消去されてしまうという問題点があった。そし
てこれらの不都合な細線化は結果的に文字の誤認識を生
しやすくしてしまうという問題点があった。
また第1図に示した。J、うな従来の文字認識装置によ
ると、入力されたリファレンス文字を含む画像にノイズ
成分か載っている場合1文字以外の部分がK111線化
又は太線化されてしまいそれらを細マスクパターン又は
大マスクパターンとした場合に。
認識時におけるパターンマツチング、4!Iに細マスク
パターンとのマツチングにおいて、そのノイズgB分が
前記不一致度Aの出力値を増してしまい。
細マスクパターンとのパターンマツチングに対する依存
度の大きな線幅の♀■1い文字の認識が低下してしまう
という問題点があった。
(4)発明の目的 本発明は上記問題点を除くために、従来の画像入力装置
、Δ/D変換器、アレーン、メモリ、及びパターンマツ
チング回路などにより構成される文字認識装置に、孤立
ヒント除去回路及び重みイ」り細線化回路などを付加す
るごとにより、線幅の細い文字に刻しても高い認識率で
文字認識を行なうことのできる文字認識装置を提供する
ことを目的とする。
(5)発明の構成 本発明は検出すべきビーノドの周囲のビットの2値デー
タを検出する手段と、該周囲のビットに所定の重み付け
を施す手段と2周囲ヒツトの2値データに基づいて重み
の和を検出する手段と、該重みの和が第1の設定値を越
えているときに検出すべきビットをマスクパターン用ヒ
ツトとして出力する細線化手段とを備えたことを特徴と
する文字認識装置及び検出すべきピッ1〜の周囲のヒツ
トの2値データを検出する手段と、該周囲のビットに所
定のmみイζJりを施ず1段と4周囲ヒツトの2値デー
タに基づいて重みの和を検出する手・陵と、該重めの和
が第1の設定値を越えているときに検出ずべきビットを
マスタパターン用ヒントとして出力する細線化手段と前
記周囲ピッ]−の2埴デークの和が所定の第2設定値以
下であるとき検出ピノ1−を独立ビットとして消去する
手段を有することを特徴とする文字認識装置を提供する
ものである。
(6)発明の実施例 以下本発明の実施例について詳細に説明を行なう。
第3図は本発明による文字認識装置の全体的な構成図で
ある。
本発明と第1図に示した従来例とで異なる点は。
フレームメモリと細線化回路及び太線化回路の間に孤立
しノl−除去回路13が接続されており、又従来の細線
化回路5 (第1図)の代わりに重み(りJり細線化回
路14とそれを制御する重み設定回路15及びスライス
レベル設定回路16が接続されている点である。その他
の構成及び動作は第1図の従来例の場合と同様なので、
その説明は省略する。
まず孤立ビット除去回路13は入力したリファレンス文
字を含む画像におい°乙 1ヒソ1−だげ孤立して1に
量子化されているヒソ1を9文字部分ではなく、ノイズ
やごみによるものとして除去してしまう回路である。具
体的な動作は、入力画像において1に量子化されている
ヒツト、を順に見てゆき、そのビットの周囲8ビツトが
全て0ならばそのビットはノイズ又はごみなどによる孤
立ビットであるとして除去する。この回路によってノイ
ズ又はごみによる文字以外の部分が誤って細線化又は太
線化されてしまうということを避けることができる。
次に太線化回路7については従来例と同じであるので霧
略し1重め付は細線化回路141重め設定回路15.及
びスライスレベル設定回路16の動作について説明する
。第4図はこの3つの回路の部分の詳しい構成図である
。即ち市みイ]け9、■線化回路14ば重み付は回路1
7及び細線化判定回路18から構成され、それぞれ重み
設定回路15及びスライスレベル設定回路16によって
制御される。
重み付は細線化回路14は入力されたリファレンス文字
の線部分の各ビットに重め付&Jを行ないItnl線化
するための回路である。その具体的な重め設定例を第5
図に示す。
まず第5図(alは斜線で示した線部分のビット(1に
量子化されているビット)においてその周囲8ビツトを
見て、ヒソI・pが1に量子化されているならば得点2
を足し、0に量子化されているならば点は加えない。
以下ヒツトq、r、s、t、u、V、wについてそれぞ
れ重み伺けの点数を斜線部のヒツトからの距離に応して
、3,2.3,2.3,2.3点とし2周囲8ビ、トに
対して合計の点数を計算し。
その結果を斜線部のヒソ1への重みと3−る。
第5図(blは注目するヒント(斜線部のビット)の右
側と下側の市みを犬きくシ、方向性を持たせた設定例で
ある。即ち右側と下側の重みの点数か高くなっているた
め、右側と下側のヒントが1に量子化さり、ていると斜
線部のビットの重みが大きくなる。
第6図ta+は第5図(blの重み設定例を用いて、1
箇所(ピストo)だけ欠落している3ピノ1−幅の線部
分のそれぞれのピッI・に重み付りを行なった例である
。例えばビット■についてみると第5図(blのピッl
−u、v、wに相当するビットのみが1に量子化されて
いるため、ヒy )u’、v、 wに対する重み5.4
.5点が足されて工4点となる。
またビット■についてめると、第5図(blのヒソi 
p = wに相当する周囲8ヒツトが全て1に量子化さ
れているため、ビットp〜Wに対する重みが全て加算さ
れて最高点28点となる。
また欠落しているピッ]・@の近くの内側のヒツト■、
[相]、■などについては例えばピッ]−■について見
ると、第5図tb+のヒソl−pに相当するビットのみ
が0に量子化されているにずぎないため。
重め伺りを行なうと25点と比較的高い点数となる。ビ
ット[相]及び0についても同様である。
以−Lのような重み付けを行なった後、第6図(alの
例では21点以上の重み伺りがされているヒツトのみを
細線化ビットとして残す(1に量子化し他のビットは0
に量子化する)ことによって、同図中の太線の枠で囲ま
れた部分が細線化の結果となり、細マスクパターンとし
て出力される。このような方法によればヒソl−■が欠
落し°ζいてもヒツト■、亀@の部分が細線化により消
去される5ことはなくなる。
以」二のような処理において第5図(a)又は(blに
示ずような重み伺り方法の設定は重み設定回路15にお
いて行なうことができ、それに従って重め伺は回路17
において第6図+a+に示したような重め伺けが行われ
る。そしてスラ・イス1ノヘル設定回路1Gにおい“ζ
r+++線化ビットとし7て残ずべき市め伺りの点数闇
値を設定しく第6図ia)の例の場合21点)、細線化
判定回路18において」−記闇値に従ってHm igt
化(第6図(・l)の大枠部分を抽出する処理)を行う
第に図(l))は第5図(blの車み設定例を用いて2
ビツト幅の線部分のそれぞれのピッI・に市みイ=Jり
を行なった例である。この場合第5図(I))の市め設
定例が方向性のある重み設定例であるため、上側のビッ
ト0と下側のヒツト■なとで重め伺りの点数が異なり、
1スライスレベル設定回路16において例えば闇値を1
7点に設定するごとによって、同図の太線の枠で囲まれ
た部分がaa線化の結果となり、細マスクパターンとし
て出力される。このようにスライスレベル設定回路16
においてイ■線化の重み付は闇値を変えることによって
2ビット幅の線部分の細線化も可能となり、ま、た、第
6図(alなどにおいては3重み付の闇値を下げるごと
によって3ビツト幅から2ビツト幅−・の細線化も簡1
11に可能となる。さらに重み設定回路15において第
5図以外の重み設定(例えば見る範囲を周囲8ビツトよ
り広くする)を行なうことにより、3ビツト幅より広い
幅の線に対しても細線化を行なうことが可能となる。
以−]二のように本発明による重み(=JシJ細線化を
行なうことにより、従来方式では困ゲ1fであった8用
い線幅部分の細線化をはじめとするさまざまな種類の線
の細線化を行なうことが可能となる。そしてこのように
して細線化された細マスクパターンをhaマスタパター
ンメモリ6 (第3図)に記憶させ。
従来例と同様にパターンマツチングを行なうことにより
従来例の場合よりも高認識率の文字認識を行なうことが
できる。
(7)発明のすJ果 本発明によれば孤立しント除去回路にJ、って文字以外
のノイズ又はごみなどによる不要なヒソl−を消去する
ことができ2特に線幅の6111い文字の認識率を高め
ることができる。
これに加えて重め(=JしJ細線化を行なうごとによっ
て、 +no線化の自由度を従来方式に比べて大きくす
ることができ、より高い認識を行なうことができる6■
マスクパターンを作成することか可能となる。
【図面の簡単な説明】
第1図は従来の文字認識装置の構成図1第2図は従来の
細線化処理の説明図、第3図は本発明による文字認識装
置の構成図、第4図は本発明による重み付り細線化回路
とその周辺回路の構成図。 第5図(al 、 ′(blは重み伺げ設定のパターン
図、第6図ta+、 (b)は実際の重みイ′Jリパタ
ーン図である。 1・・・テレヒカメラ 2・・・カメラコンI−ロール
ユニソI−(CCU) 3・・・A / I)変換器 
4・・・フレームメモリ 5・・・細線化回路 6・・・細マスクパターンメモリ 7・・・太線化回路 8・・・太マスクパターンメモリ
 9.19・・・パタ ーンマツチング回路 11・・・不一致度刊定回路 1
2・・・結果出力 装置 13・・・孤立ヒフ1−除去回 路 14・・・重み伺り細線化回 路 15・・・重み設定回路 16・・・スライスレベル設定回路 17・・・重み付は回路 18・・ ・細線化判定回路 S・ ・・スイソチ 第1図 ら 第2図 (0)

Claims (3)

    【特許請求の範囲】
  1. (1)検出ずべきビットの周囲のビットの2値データを
    検出する手段と、該周囲のビットに所定の重みイ]けを
    施す手段と2周囲ビットの2値データに基づいてmみの
    和を検出する手段と、該重みの和が第1の設定値を越え
    ているときに検出ずべきビットをマスタパターン用ビッ
    トとして出力する細線化手段とを備えたことを特徴とす
    る文字認識装置。
  2. (2)前記マスクパターン用のピノ[・は細線化用ヒツ
    トであることを特徴とする特許請求の範囲第1項記載の
    文字認識装置。
  3. (3)検出すべきヒツトの周囲のヒントの2値テータを
    検出する手段と、該周囲のヒツトに所定の重み伺のを施
    す手段と9周囲ビットの2値データに基づいて重みの和
    を検出する手段と、該重みの和が第1の設定値を越えて
    いるときに検出ずへきビットをマスクパターン用ビット
    とし′ζ出力する細線化手段と前記周囲ビットの2値デ
    ータの和が所定の第2設定値以下であるとき検出ビット
    を孤立ヒントとして消去する手段を有することを特徴と
    する文字認識装置。
JP58250095A 1983-12-28 1983-12-28 文字認識装置 Pending JPS60142481A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58250095A JPS60142481A (ja) 1983-12-28 1983-12-28 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58250095A JPS60142481A (ja) 1983-12-28 1983-12-28 文字認識装置

Publications (1)

Publication Number Publication Date
JPS60142481A true JPS60142481A (ja) 1985-07-27

Family

ID=17202734

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58250095A Pending JPS60142481A (ja) 1983-12-28 1983-12-28 文字認識装置

Country Status (1)

Country Link
JP (1) JPS60142481A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02257381A (ja) * 1988-12-20 1990-10-18 American Teleph & Telegr Co <Att> 画像分類方法、画像内文字の分類方法並びに識別装置、及び画像細線化方法
US7374426B2 (en) 2005-03-16 2008-05-20 Nec Corporation Card-edge board connector that electrically connects two boards

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02257381A (ja) * 1988-12-20 1990-10-18 American Teleph & Telegr Co <Att> 画像分類方法、画像内文字の分類方法並びに識別装置、及び画像細線化方法
US7374426B2 (en) 2005-03-16 2008-05-20 Nec Corporation Card-edge board connector that electrically connects two boards

Similar Documents

Publication Publication Date Title
JP3017384B2 (ja) 特徴領域抽出装置
CN110619334B (zh) 基于深度学习的人像分割方法、架构及相关装置
US6728399B1 (en) Method and apparatus for defining color borders in a raster image by identifying and breaking contrast ties
US20110229033A1 (en) Image Processing Method, and Program
CN115063861A (zh) 模型训练方法、图像背景相似判断方法及装置
JPH0134496B2 (ja)
JPH04315272A (ja) 図形認識装置
US6324300B1 (en) Defining color borders in a raster image
JPS60142481A (ja) 文字認識装置
WO2022267387A1 (zh) 图像识别方法、装置、电子设备和存储介质
CN109800758A (zh) 一种极大值区域检测的自然场景文字检测方法
US20050047665A1 (en) Method for segmenting moving object of compressed moving image
EP1394726A2 (en) Image processing for pattern recognition using edge detection and projections along predetermined directions
JP3058951B2 (ja) 画像パターン認識装置
JP3060922B2 (ja) 特徴生成装置
JP2789622B2 (ja) 文字/図形領域判定装置
JPH04324577A (ja) 折れ線グラフ認識装置
CN115018939A (zh) 用于生成山水画的图像处理方法、***、设备及存储介质
Arora et al. Danger Warning System for Blinds using Computer Vision (Sixth Sense) and OCR
JP2024002327A (ja) 情報処理装置、情報処理システム、情報処理方法、及びプログラム
JPH03126188A (ja) 文字認識装置
JPH07271907A (ja) アナログ画像の二値化装置
JPS60258688A (ja) パタ−ン認識方法及びこれを用いた装置
JPS642315B2 (ja)
JPH06187456A (ja) ニューラルネットワーク画像認識方法および装置