JPH0749926A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH0749926A
JPH0749926A JP5212352A JP21235293A JPH0749926A JP H0749926 A JPH0749926 A JP H0749926A JP 5212352 A JP5212352 A JP 5212352A JP 21235293 A JP21235293 A JP 21235293A JP H0749926 A JPH0749926 A JP H0749926A
Authority
JP
Japan
Prior art keywords
character
noise
character image
image
storage means
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5212352A
Other languages
English (en)
Inventor
Kiyoshi Tashiro
潔 田代
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP5212352A priority Critical patent/JPH0749926A/ja
Publication of JPH0749926A publication Critical patent/JPH0749926A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 文字認識速度を向上し、また、誤ったノイズ
除去処理による誤認識を減少させて認識精度を向上した
文字認識装置を提供する。 【構成】 文字切り出し手段1により切り出された文字
画像は、文字画像記憶手段2に保存される。文字識別手
段3は、文字画像記憶手段2内の画像に対して識別処理
を行ない、識別結果と確信度を出力する。文字認識結果
出力手段4は、文字識別手段3から得られる確信度か
ら、識別結果を認識結果として出力するか否かを判定す
るとともに、認識結果として出力できない場合には、ノ
イズ除去手段5によりノイズ除去処理を行ない、文字画
像記憶手段2に保存し、ノイズ除去処理の行われた画像
に対して文字識別手段3により識別処理を行なわせる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、入力画像から、文字画
像を切り出し、文字を認識する文字認識装置に関するも
のである。
【0002】
【従来の技術】文字認識装置では、入力画像中にノイズ
が混入すると、そのノイズの影響により誤認識するな
ど、認識率が低下するという問題がある。従来、このよ
うなノイズの影響による誤認識を減らすため、例えば、
平成2年度科学研究費補助金研究成果報告書「イメージ
型と論理型情報処理を統合した高速・高精度の知的文字
システムの研究開発」8ページ等に示されているよう
に、多くの文字認識装置では、切り出された文字画像に
対して、認識処理を行なう前に一律にノイズ除去を行な
う方法が用いられてきた。あるいは、例えば、「文字認
識概論」オーム社,15〜44ページに示されているよ
うに、ノイズが含まれていても影響を受けにくいような
特徴抽出、識別計数を用いる方法がある。
【0003】しかし、切り出された画像に対して一律に
ノイズ除去処理を行なう方法では、ノイズ除去処理に費
やされる計算量により、全体としての文字認識速度が低
下するという欠点があった。特に、画像中にノイズが含
まれる割合が少ない場合には、ノイズ除去処理の大半は
無駄に行なわれることになる。また、文字画像中の文字
に含まれるべき部分がノイズ除去処理により誤って変更
されてしまい、誤認識が発生する場合があるという欠点
もある。
【0004】一方、ノイズが含まれていても影響を受け
にくいような特徴抽出、識別関数は、処理が複雑であ
り、必要とする計算処理が多く、文字認識速度が低下す
るという欠点がある。この場合も、ノイズが含まれてい
ない画像は、より簡素な特徴抽出、識別関数を用いても
十分な認識精度で認識することができるので、画像中に
ノイズが含まれる割合が少ない場合には無駄な処理が多
いことになる。
【0005】
【発明が解決しようとする課題】本発明は、上述した事
情に鑑みてなされたもので、必要であるときにのみノイ
ズ除去処理を行なうことにより、全体としての文字認識
速度を向上し、また、誤ったノイズ除去処理による誤認
識を減少させて認識精度を向上した文字認識装置を提供
することを目的とするものである。
【0006】
【課題を解決するための手段】本発明は、請求項1に記
載の発明においては、入力画像より文字を切り出し認識
する文字認識装置において、入力画像から文字画像を切
り出す文字切り出し手段と、該文字切り出し手段により
得られた文字画像を保存する文字画像記憶手段と、該文
字画像記憶手段中の文字画像から文字を識別し識別結果
と確信度を出力する文字識別手段と、前記文字画像記憶
手段中の文字画像からノイズを除去して前記文字画像記
憶手段に保存するノイズ除去手段と、前記確信度があら
かじめ決められた値より大きい場合には前記識別結果を
認識結果として出力しそれ以外の場合には前記ノイズ除
去手段により文字画像記憶手段中の文字画像からノイズ
を除去した画像を前記文字画像記憶手段に保存させ前記
文字画像記憶手段中のノイズを除去した画像を前記文字
識別手段により識別してその識別結果を認識結果として
出力する認識結果出力手段を有することを特徴とするも
のである。
【0007】請求項2に記載の発明においては、入力画
像より文字を切り出し認識する文字認識装置において、
入力画像から文字画像を切り出す文字切り出し手段と、
該文字切り出し手段により得られた文字画像を保存する
文字画像記憶手段と、該文字画像記憶手段中の文字画像
から文字を識別し識別結果と確信度を出力する文字識別
手段と、前記文字画像記憶手段中の文字画像からノイズ
を除去して前記文字画像記憶手段に保存するノイズ除去
手段と、前記確信度があらかじめ決められた第1の値よ
り大きい場合には前記識別結果を認識結果として出力し
それ以外の場合には前記ノイズ除去手段により文字画像
記憶手段中の文字画像からノイズを除去した画像を前記
文字画像記憶手段に保存させ前記文字画像記憶手段中の
ノイズを除去した画像を前記文字識別手段により識別し
確信度があらかじめ決められた第2の値より大きい場合
にはその識別結果を認識結果として出力しそれ以外の場
合にはリジェクトを表すコードを認識結果として出力す
る認識結果出力手段を有することを特徴とするものであ
る。
【0008】請求項3に記載の発明においては、入力画
像より文字を切り出し認識する文字認識装置において、
入力画像から文字画像を切り出す文字切り出し手段と、
該文字切り出し手段により得られた文字画像を保存する
文字画像記憶手段と、該文字画像記憶手段中の文字画像
から文字を識別し識別結果と確信度を出力する文字識別
手段と、前記文字画像記憶手段中の文字画像からノイズ
を除去して前記文字画像記憶手段に保存するノイズ除去
手段と、前記確信度があらかじめ決められた第1の値よ
り大きい場合には前記識別結果を認識結果として出力し
それ以外の場合には前記ノイズ除去手段により文字画像
記憶手段中の画像からノイズを除去した画像を前記文字
画像記憶手段に保存させ前記文字画像記憶手段中の画像
を再度前記文字識別手段により識別し確信度が予め決め
られた第2の値より大きい場合にはその識別結果を認識
結果として出力しそれ以外の場合には再度前記ノイズ除
去手段によるノイズ除去処理及び前記文字識別手段によ
る識別処理を行なわせる認識結果出力手段を有すること
を特徴とするものである。
【0009】請求項4に記載の発明においては、入力画
像より文字を切り出し認識する文字認識装置において、
入力画像から文字画像を切り出す文字切り出し手段と、
該文字切り出し手段により得られた文字画像を保存する
文字画像記憶手段と、該文字画像記憶手段中の文字画像
から文字を識別し識別結果と確信度を出力する文字識別
手段と、前記文字画像記憶手段中の文字画像からノイズ
を除去して前記文字画像記憶手段に保存するノイズ除去
手段と、前記確信度があらかじめ決められた第1の値よ
り大きい場合には前記識別結果を認識結果として出力し
それ以外の場合には前記ノイズ除去手段により文字画像
記憶手段中の画像からノイズを除去した画像を前記文字
画像記憶手段に保存させ前記文字画像記憶手段中のノイ
ズを除去した画像を前記文字識別手段により識別し確信
度が予め決められた第2の値より大きいかあるいは前記
ノイズ除去手段において除去すべきノイズがない場合に
はその識別結果を認識結果として出力しそれ以外の場合
には再度前記ノイズ除去手段によるノイズ除去処理及び
前記文字識別手段による識別処理を行なわせる認識結果
出力手段を有することを特徴とするものである。
【0010】請求項5に記載の発明においては、入力画
像より文字を切り出し認識する文字認識装置において、
入力画像から文字画像を切り出す文字切り出し手段と、
該文字切り出し手段により得られた文字画像を保存する
文字画像記憶手段と、該文字画像記憶手段中の文字画像
から文字を識別し識別結果と確信度を出力する文字識別
手段と、前記文字画像記憶手段中の文字画像からノイズ
を除去して前記文字画像記憶手段に保存するノイズ除去
手段と、前記確信度があらかじめ決められた第1の値よ
り大きい場合には前記識別結果を認識結果として出力し
それ以外の場合には前記ノイズ除去手段により文字画像
記憶手段中の画像からノイズを除去した画像を前記文字
画像記憶手段に保存させ前記文字画像記憶手段中のノイ
ズを除去した画像を前記文字識別手段により識別し確信
度が予め決められた第2の値以下でありかつ前記ノイズ
除去手段において除去すべきノイズが存在する場合には
再度前記ノイズ除去手段によるノイズ除去処理及び前記
文字識別手段による識別処理を行なわせそれ以外の場合
には確信度が予め決められた第3の値より大きいときそ
の識別結果を認識結果として出力しそれ以外の場合には
リジェクトを表わすコードを認識結果として出力する認
識結果出力手段を有することを特徴とするものである。
【0011】請求項6に記載の発明においては、入力画
像より文字を切り出し認識する文字認識装置において、
入力画像から文字画像を切り出す文字切り出し手段と、
該文字切り出し手段により得られた文字画像を保存する
文字画像記憶手段と、該文字画像記憶手段中の文字画像
から文字を識別し識別結果と確信度を出力する文字識別
手段と、前記文字画像記憶手段中の文字画像からノイズ
を除去して前記文字画像記憶手段に保存するノイズ除去
手段と、前記確信度があらかじめ決められた値より大き
い場合には前記識別結果を認識結果として出力しそれ以
外の場合には前記ノイズ除去手段により文字画像記憶手
段中の画像からノイズを除去した画像を前記文字画像記
憶手段に保存させ前記文字画像記憶手段中のノイズを除
去した画像を前記文字識別手段により識別する処理を前
記ノイズ除去手段において除去すべきノイズがなくなる
まで繰り返し行ない得られた複数の識別結果のうち最も
確信度の大きい識別結果を認識結果として出力する認識
結果出力手段を有することを特徴とするものである。
【0012】請求項7に記載の発明においては、入力画
像より文字を切り出し認識する文字認識装置において、
入力画像から文字画像を切り出す文字切り出し手段と、
該文字切り出し手段により得られた文字画像を保存する
文字画像記憶手段と、該文字画像記憶手段中の文字画像
から文字を識別し識別結果と確信度を出力する文字識別
手段と、前記文字画像記憶手段中の文字画像からノイズ
を除去して前記文字画像記憶手段に保存するノイズ除去
手段と、前記確信度があらかじめ決められた第1の値よ
り大きい場合には前記識別結果を認識結果として出力し
それ以外の場合には前記ノイズ除去手段により文字画像
記憶手段中の画像からノイズを除去した画像を前記文字
画像記憶手段に保存させ前記文字画像記憶手段中のノイ
ズを除去した画像を前記文字識別手段により識別する処
理を前記ノイズ除去手段において除去すべきノイズがな
くなるまで繰り返し行ない得られた複数の確信度の最大
値があらかじめ決められた第2の値より大きい場合には
確信どの値が最も大きい識別結果を認識結果として出力
しそれ以外の場合にはリジェクトを表わすコードを認識
結果として出力する認識結果出力手段を有することを特
徴とするものである。
【0013】請求項8に記載の発明においては、請求項
1乃至7のいずれか1項に記載の文字認識装置におい
て、前記ノイズ除去手段は、前記文字画像記憶手段に保
存されている文字画像からノイズ候補を検出するノイズ
候補検出手段と、該ノイズ候補検出手段で検出された各
ノイズ候補に対してその候補がノイズであると推定され
る評価値を計算する評価値計算手段と、前記ノイズ候補
検出手段により2つ以上のノイズ候補が検出された場合
は前記評価値計算手段による各ノイズ候補の評価値の最
も大きいノイズ候補に対してのみ文字画像からノイズの
除去処理を行ない前記ノイズ候補検出手段によりただ1
つのノイズ候補が検出された場合には検出されたノイズ
候補に対して文字画像からノイズの除去処理を行ない前
記ノイズ候補検出手段によりノイズ候補が検出されない
場合はノイズの除去処理を行なわないノイズ候補削除手
段を備えていることを特徴とするものである。
【0014】
【作用】本発明によれば、入力画像から文字画像を切り
出し、初回はノイズ除去処理を行なわずに、文字を識別
する。文字の識別の際には、文字識別手段は識別結果と
ともに、確信度を出力する。この確信度があらかじめ決
められた値より大きい場合には、そのまま識別結果を認
識結果として出力する。これにより、ノイズがないある
いは少ない場合には、ノイズ除去処理を行なわずに文字
の認識が行なわれ、文字認識速度を向上することができ
る。
【0015】また、初回の文字の識別による確信度が、
あらかじめ決められた値以下の場合には、ノイズ除去処
理を行ない、改めて文字の識別を行なうことにより、初
回の処理においてノイズの影響による誤認識を防ぐこと
ができる。
【0016】請求項2では、さらに、2回目の文字の識
別による確信度があらかじめ決められた値以下の場合に
は、ノイズ除去を行なっても文字が識別できなかったも
のとして、リジェクトを表わすコードを認識結果として
出力することにより、誤まった認識結果の出力を減少さ
せることができる。
【0017】請求項3では、2回目の文字の識別による
確信度があらかじめ決められた値以下の場合には、確信
度があらかじめ決められた値を越えるまで、繰り返しノ
イズ除去及び文字の識別を行なって、認識結果をより確
実なものとすることができる。
【0018】請求項4では、さらに、除去すべきノイズ
の有無を判定し、除去するべきノイズがなくなった場合
には、その時点の識別結果を認識結果として出力するこ
とにより、無限にノイズ除去及び文字の識別を繰り返す
ことを防止している。
【0019】請求項5では、さらに、出力すべき識別結
果が決定した段階で、その確信度があらかじめ決められ
た値以下の場合には、文字が認識できなかったものとし
て、リジェクトを表わすコードを認識結果として出力す
ることにより、誤った認識結果の出力を減少させること
ができる。
【0020】請求項6では、初回の文字の識別による確
信度があらかじめ決められた値以下の場合に、ノイズの
除去処理および文字の識別処理を、除去すべきノイズが
なくなるまで繰り返して行ない、その間に得られた複数
の確信度が最大の識別結果を認識結果として出力するこ
とにより、ノイズ除去処理を繰り返すうちに誤ったノイ
ズ除去処理が行なわれて誤認識が発生するのを減少さ
せ、認識精度を向上させることができる。
【0021】請求項7では、さらに、最大の確信度があ
らかじめ決められた値以下の場合には、文字が認識でき
なかったものとして、リジェクトを表わすコードを認識
結果として出力することにより、誤った認識結果の出力
を減少させることができる。
【0022】上述のノイズ除去手段においては、例え
ば、文字画像からノイズ候補を検出し、検出されたノイ
ズ候補を、その評価値の大きいものから1つずつ除去し
ていくように構成することができ、段階的にノイズを除
去することができる。これにより、上述の各請求項に記
載の文字認識装置で繰り返してノイズを除去する過程に
おいて、適正な文字画像を得ることができる。
【0023】
【実施例】図1は、本発明の文字認識装置の一実施例を
示すブロック図である。図中、1は文字切り出し手段、
2は文字画像記憶手段、3は文字識別手段、4は文字認
識結果出力手段、5はノイズ除去手段である。文字切り
出し手段1は、複数の文字が含まれる入力画像中から、
文字が1つ含まれる領域を切り出して文字画像を得る。
文字画像記憶手段2は、文字切り出し手段1あるいはノ
イズ除去手段5により得られた画像を保存する。文字識
別手段3は、文字画像記憶手段2から得られる画像に対
して識別処理を行ない、候補文字のコードあるいはリジ
ェクトを表すコードで構成される識別結果と確信度を出
力する。識別処理の方法としては、公知の方法を用いる
ことができ、例えば、パターンマッチング法でもよい
し、特徴抽出法を用いた認識法を採用してもよい。文字
認識結果出力手段4は、文字識別手段3から得られる確
信度から、識別結果を認識結果として出力するか否かを
判定するとともに、認識結果として出力できない場合に
は、ノイズ除去手段5を動作させノイズ除去処理を行な
わせるとともに、ノイズ除去処理の行なわれた画像に対
して文字識別手段3により識別処理を行なわせる。この
動作は、ある場合には、繰り返し行なう。ノイズ除去手
段5は、文字画像記憶手段2から得られる画像に対し
て、ノイズを検出して除去し、ノイズが除去された画像
を出力する。処理によっては、除去すべきノイズがない
場合に、その旨を文字認識結果出力手段4に出力するこ
とができる。
【0024】文字識別手段3によって出力される確信度
は、文字識別手段3に入力された画像と、文字の標準サ
ンプルとの整合した度合いを表す。すなわち、整合度が
大きいほど、確信度の値は高くなる。最も確信度の値が
高い文字を識別結果として出力する。このとき用いる標
準サンプルとしては、ノイズが含まれていない文字画像
を用いることができる。そのため、文字識別手段3に入
力された画像にノイズが含まれていない場合には、入力
画像と、正解である文字の標準サンプルとの整合度は大
きく、文字識別手段3により出力される確信度の値は大
きくなる。逆に、ノイズが含まれている場合には、入力
画像と、各文字の標準サンプルとの整合度はいずれも小
さく、確信度の値は小さくなる。したがって、あらかじ
め閾値を決めておき、その閾値より大きいか否かで画像
中にノイズが含まれていたか否かを推定することができ
る。
【0025】図2は、文字識別手段3の一例を示すブロ
ック構成図である。図中、11は画像正規化手段、12
は特徴抽出手段、13は標準特徴記憶手段、14は類似
度計算手段である。画像正規化手段11は、入力された
画像中の全黒画素を包含するような外接矩形を検出し、
外接矩形があらかじめ決められた大きさになるように、
縦横それぞれの方向へ拡大または縮小し、得られる正規
化画像を出力する。特徴抽出手段12は、画像正規化手
段11により得られた正規化画像から、粗いメッシュ特
徴を抽出し、出力する。粗いメッシュ特徴とは、画像を
メッシュ状の矩形領域に分割し、分割された各矩形領域
ごとに、矩形領域に含まれる画像の特徴を抽出したもの
である。各矩形領域から抽出する特徴としては、公知の
特徴を用いることができ、例えば、画素値の和を求め、
これを特徴とすることができる。このとき、粗いメッシ
ュ特徴は、画素値の和のマトリクスとして得られる。標
準特徴記憶手段13は、認識対象とする各文字につい
て、あらかじめ用意された標準特徴を記憶し、要求に応
じて各文字に対応する標準特徴を出力する。標準特徴
は、あらかじめ各文字につき少なくとも1つ用意した標
準サンプル画像を、それぞれ画像正規化手段11による
処理と同等の処理により正規化した正規化画像から、特
徴抽出手段12による処理と同等の処理により抽出され
た特徴を平均して求めておくことができる。類似度計算
手段14は、特徴抽出手段12で得られる特徴と、標準
特徴記憶手段13から得られる各文字の標準特徴との間
の類似度をそれぞれ計算し、最も大きな値の類似度が得
られた標準特徴に対応する文字コードと、確信度として
最も大きい類似度の値を出力する。
【0026】図3は、ノイズ除去手段5の一例を示すブ
ロック構成図である。図中、21は孤立黒画素検出手
段、22は孤立黒画素削除手段である。孤立黒画素検出
手段21は、画像中から隣接する画素が全て白画素であ
るような黒画素を検出し、その画像中での位置を出力す
る。条件を満たす黒画素が検出されなかった場合には、
未検出を示すコードを出力する。孤立黒画素削除手段2
2は、孤立黒画素検出手段21で得られた、孤立黒画素
の画像中での位置を用いて、該当する画素を白画素に置
き換える。孤立黒画素検出手段21で未検出を示すコー
ドが得られた場合には何も行なわない。
【0027】このノイズ除去手段の一例において、孤立
黒画素検出手段21で検出される黒画素の大きさを、ノ
イズ除去手段の動作回数に応じて変化させることができ
る。例えば、初回の動作では、1画素のみが孤立して黒
である画素を検出し、2回目の動作では、連続した2画
素が孤立している画素を検出するように動作させること
ができる。もちろん、所定の大きさの黒画素群から、し
だいに小さくしていくこともできる。
【0028】図4は、ノイズ除去手段5の別の例を示す
ブロック構成図である。図中、31はノイズ候補検出手
段、32は評価値計算手段、33はノイズ候補除去手段
である。この例では、ノイズ除去手段5は、文字画像記
憶手段2から得られる画像中の、ノイズであると推定さ
れる評価値が最も大きいノイズ候補に対してのみノイズ
除去処理を行なうものである。このノイズ除去手段5が
繰り返し動作する場合に、ノイズであると推定される評
価値が大きいノイズ候補から順に除去処理が行なわれ
る。
【0029】ノイズ候補検出手段31は、画像中からあ
らかじめ決められた条件を満たすノイズ候補を検出す
る。評価値計算手段32は、ノイズ候補検出手段31で
検出された各ノイズ候補に対して、そのノイズ候補がノ
イズであると推定される評価値を計算する。ノイズ候補
除去手段33は、ノイズ候補検出手段31で検出された
ノイズ候補の1つに対して、画像中からそのノイズ候補
を除去する処理を行なう。
【0030】この例において、ノイズ候補検出手段31
におけるノイズ候補の検出方法としては、例えば、画像
中において、黒画素が連続した黒画素塊のうち、面積が
あらかじめ決められた値より小さいものを全てノイズ候
補として検出するという方法を用いることができる。ま
た、評価値計算手段32における評価値の計算は、例え
ば、ノイズ候補の面積の逆数と、ノイズ候補から最も近
い黒画素塊までの距離を、それぞれに定数を乗じた上で
加算して求めることができる。ノイズ候補削除手段33
において除去するノイズ候補は、例えば、評価値計算手
段32において計算された評価値が、最も大きいまたは
最も小さいノイズ候補を選択することができる。選択さ
れたノイズ候補に対応する黒画素塊を構成する黒画素が
全て白画素に置き換えられる。上述のノイズ候補の検出
方法、評価値の計算方法、ノイズ候補の除去方法は、そ
れぞれ、これらの方法に限らず、他の手法を用いること
も可能である。ノイズがなく、ノイズ候補検出手段31
においてノイズ候補が検出されないときは、ノイズ除去
の処理は行なわれず、入力される画像をそのまま出力す
る。
【0031】図5は、図4に示したノイズ除去手段の例
におけるノイズ除去動作の説明図である。図中、41は
ノイズ除去前の画像、42,43はノイズ、44はノイ
ズ除去後の画像である。図5(A)に示すように、ノイ
ズ除去前の画像41には、ノイズ42及びノイズ43が
存在する。ノイズ43は、文字の線の一部が切れてしま
ったために発生したノイズである。ノイズ候補検出手段
31により、ノイズ42及びノイズ43がノイズ候補と
して検出される。検出された2つのノイズ候補は、評価
値計算手段32において、評価値が計算される。計算さ
れた評価値の例を図5(B)に示す。例えば、評価値の
大きいノイズ候補から選択するものとすれば、ノイズ4
2に対応するノイズ候補が選択され、ノイズ候補削除手
段33により、ノイズ42が除去される。ノイズ42が
除去された画像の例を図5(C)に示す。このように、
文字の要素となるべく関係の薄いノイズから順に除去す
ることができる。
【0032】また、図5(C)に示す文字画像のよう
に、ノイズ43を含んでいる方が、例えば上述の図2で
示した文字識別手段3における粗いメッシュ特徴の抽出
及び識別においては、評価値が大きく、良好な結果を得
ることができる。すなわち、従来のように、認識処理の
前にノイズを消去してしまうと、ノイズ43のような文
字の一部をも消去してしまい、誤認識のもととなってい
るが、本発明の文字認識装置では、ノイズ除去処理を行
なう前に文字識別処理を行なっているので、図5(C)
のような、文字の一部がノイズとして消去されるような
場合でも、正確に認識することができる。
【0033】図3乃至図4において、文字識別手段3及
びノイズ除去手段5の例を示したが、本発明はこれらの
例に示す構成に限るものではなく、公知の種々の手法を
用いることができる。
【0034】以下、本発明の文字認識装置の一実施例に
おけるいくつかの動作例を、図1、および、図6乃至図
12を用いて説明する。図6は、本発明の文字認識装置
の一実施例における第1の動作例を説明するフローチャ
ートである。まず、S51において、文字切り出し手段
1により入力画像から1文字ごとの文字画像を切り出
し、得られた文字画像を文字画像記憶手段2に保存す
る。S52において、文字画像記憶手段2に保存されて
いる文字画像に対し、文字識別手段3により識別処理を
行なう。識別結果及び確信度が文字認識結果出力手段4
に出力される。S53において、識別結果の確信度と、
あらかじめ決められた値T1とを比較し、確信度が値T
1より大きい場合には、画像中にノイズがなかったと推
定して、S56において、識別結果を認識結果として出
力し、切り出された文字に対する認識処理を終了する。
S53において、識別結果の確信度があらかじめ決めら
れた値T1より大きくない場合には、画像中にノイズが
あったと推定して、ノイズ除去手段5によるノイズ除去
処理を含む一連の処理を行なう。この第1の動作例で
は、S54において、文字画像記憶手段2に保存されて
いる画像に対してノイズ除去手段5によりノイズ除去処
理を行ない、得られる画像を文字画像記憶手段2に保存
する。その画像に対し、S55において、文字識別手段
3により識別処理を行ない、その結果得られる識別結果
を、S56において、認識結果として出力し、切り出さ
れた文字に対する認識処理を終了する。
【0035】図7は、本発明の文字認識装置の一実施例
における第2の動作例を説明するフローチャートであ
る。S51,S52及びS53において確信度があらか
じめ決められた値T1より大きい場合の処理は、上述の
第1の動作例と同様であるので説明を省略する。S53
において、識別結果の確信度があらかじめ決められた値
T1より大きくない場合には、第1の動作例と同様、ノ
イズがあったと推定して、S54において、文字画像記
憶手段2に保存されている画像に対してノイズ除去手段
5によりノイズ除去処理を行ない、得られる画像を文字
画像記憶手段2に保存する。その画像に対し、S55に
おいて、文字識別手段3により識別処理を行なう。その
結果得られる確信度と、あらかじめ決められた値T3と
をS57において比較し、確信度が値T3より大きい場
合には、S56において、S55における識別処理によ
り得られた識別結果を認識結果として出力し、切り出さ
れた文字に対する認識処理を終了する。また、S57に
おいて、確信度が値T3より大きくない場合には、ノイ
ズ除去処理を行なっても認識できなかったものとして、
S58において、リジェクトを表わすコードを認識結果
として出力し、切り出された文字に対する認識処理を終
了する。
【0036】図8は、本発明の文字認識装置の一実施例
における第3の動作例を説明するフローチャートであ
る。S51,S52及びS53において確信度があらか
じめ決められた値T1より大きい場合の処理は、上述の
第1の動作例と同様であるので説明を省略する。S53
において、識別結果の確信度があらかじめ決められた値
T1より大きくない場合には、第1の動作例と同様、ノ
イズがあったと推定して、S54において、文字画像記
憶手段2に保存されている画像に対してノイズ除去手段
5によりノイズ除去処理を行ない、得られる画像を文字
画像記憶手段2に保存する。その画像に対し、S55に
おいて、文字識別手段3により識別処理を行なう。その
結果得られる確信度と、あらかじめ決められた値T2と
をS59において比較し、確信度が値T2より大きくな
い場合には、S54に戻り、ノイズ除去処理及びS55
における文字識別処理を繰り返して行なう。そして、確
信度があらかじめ決められた値T2より大きくなったと
S59において判定された場合に、繰り返しの処理が終
了する。その時に得られた識別結果を認識結果として、
S56において出力し、切り出された文字に対する認識
処理を終了する。
【0037】図9は、本発明の文字認識装置の一実施例
における第4の動作例を説明するフローチャートであ
る。この動作例は、上述の第3の動作例とほぼ同様であ
るが、S59において、S55における識別処理の結果
得られた確信度が、あらかじめ決められた値T2より大
きくない場合に、さらに、S60において、除去するノ
イズがあるか否かを判定している。そのため、S54に
おけるノイズ除去処理と、S55における文字識別処理
の繰り返しの処理は、確信度があらかじめ決められた値
T2より大きくなるか、または、文字画像記憶手段2に
保存されている画像に、除去すべきノイズがなくなった
場合に終了する。このS60における判定によって、識
別不能によりノイズ除去処理と文字識別処理が無限に繰
り返されるのを防ぐことができる。繰り返しの処理が終
了した時に得られた識別結果を認識結果として、S56
において出力し、切り出された文字に対する認識処理を
終了する。
【0038】図10は、本発明の文字認識装置の一実施
例における第5の動作例を説明するフローチャートであ
る。この動作例は、上述の第4の動作例とほぼ同様であ
るが、ノイズ除去処理と文字識別処理の繰り返しの処理
が終了した時点で、確信度とあらかじめ決められた値T
3との比較を行なっている。すなわち、S59におい
て、S55における識別処理の結果得られた確信度が、
あらかじめ決められた値T2より大きい場合、あるい
は、S60において、除去すべきノイズが存在しないと
判断された場合、S61において、そのときの確信度と
あらかじめ決められた値T3とを比較する。比較の結
果、確信度が値T3よりも大きい場合には、S56にお
いて、識別結果を認識結果として出力し、確信度が値T
3よりも大きくない場合には、認識不能として、S62
において、リジェクトを表わすコードを認識結果として
出力し、切り出された文字に対する認識処理を終了す
る。
【0039】この第5の動作例において、あらかじめ決
められた値T2が値T3より大きい場合には、確信度が
値T2より大きいときには値T3よりも大きいことは自
明であるから、S59において確信度が値T2より大き
い場合に、S61の判定を行なわずに、S56における
認識結果の出力処理を行なうように動作させることも可
能である。
【0040】図11は、本発明の文字認識装置の一実施
例における第6の動作例を説明するフローチャートであ
る。S51,S52及びS53において確信度があらか
じめ決められた値T1より大きい場合の処理は、上述の
第1の動作例と同様であるので説明を省略する。S53
において、識別結果の確信度があらかじめ決められた値
T1より大きくない場合には、S54において、文字画
像記憶手段2に保存されている画像に対してノイズ除去
手段5によりノイズ除去処理を行ない、得られる画像を
文字画像記憶手段2に保存し、S55において、その画
像に対し文字識別手段3により識別処理を行なうという
処理を、除去すべきノイズがなくなるまで繰り返し行な
う。このとき、S52において行なわれた文字識別処理
と、S55において行なわれる文字識別処理ごとに、文
字識別手段3から出力される識別結果および確信度が保
管される。S60において、除去すべきノイズがなくな
ったことが判定されると、繰り返しの処理を終了し、S
63において、繰り返しの処理によって得られた複数の
識別結果のうち、確信度の値が最も大きい識別結果を認
識結果として出力し、切り出された文字に対する認識処
理を終了する。
【0041】図12は、本発明の文字認識装置の一実施
例における第7の動作例を説明するフローチャートであ
る。この動作例は、上述の第6の動作例とほぼ同様であ
るが、S54におけるノイズ除去処理およびS55にお
ける文字識別処理の繰り返し処理を終了した後、S64
において、S52及びS55の文字識別処理で得られた
複数の確信度のうち、値が最大のものと、あらかじめ決
められた値T3とを比較し、最大の確信度が値T3より
大きい場合には、S63において、その確信度に対応す
る識別結果を認識結果として出力する。また、最大の確
信度が値T3より大きくない場合には、S65におい
て、認識不能としてリジェクトを表わすコードを認識結
果として出力し、切り出された文字に対する認識処理を
終了する。
【0042】上述の各動作例において、あらかじめ決め
られた値T1,T2,T3は、それぞれ、認識結果の正
当率等を勘案して決めればよく、すべて違う値でもよい
し、2つあるいは3つが同じ値に設定されてもよい。
【0043】本発明の文字認識装置の一実施例における
具体的な動作について説明する。ここでは、簡単のた
め、上述した動作例のうち、第1の動作例について、具
体的な例を用いながら説明するが、他の動作例について
も、同様に考えることができる。また、文字識別手段3
としては、図2に示す構成を用いた場合を例に説明す
る。
【0044】図13は、文字画像の例の説明図である。
文字切り出し手段により、入力画像から1文字ごとに切
り出され、図13に示すような文字画像として、文字画
像記憶手段に保存される。図13(A)は、ノイズのな
い文字画像を示しており、図13(B)は、ノイズの存
在する文字画像を示している。以下の説明では、この2
つの文字画像についての処理を説明する。
【0045】図14は、正規化画像の例の説明図であ
る。文字識別手段3において、画像正規化手段11で、
文字画像に対して正規化処理が行なわれる。正規化処理
は、上述のように、文字画像中の全黒画素を包含するよ
うな外接矩形を検出し、外接矩形があらかじめ決められ
た大きさになるように、縦横それぞれの方向へ拡大また
は縮小し、得られる正規化画像を出力する。この例で
は、ほぼ正方形となるように、正規化処理を行なってい
る。図13(A)に示したノイズのない文字画像を正規
化した正規化画像を図14(A)に、図13(B)に示
したノイズを含む文字画像を正規化した正規化画像を図
14(B)に示す。文字画像にノイズが存在すると、ノ
イズによって外接矩形の大きさが規定されてしまう場合
があり、その場合には、図14(B)に示すように、正
しく正規化できないことになる。
【0046】図15は、特徴抽出手段により得られた粗
いメッシュ特徴の例の説明図である。特徴抽出手段12
において、正規化画像から粗いメッシュ特徴を抽出す
る。図15では、正規化画像を4×4の領域に分割し、
各領域内に含まれる画素数をそれぞれの領域の特徴と
し、各領域から得られる16個の特徴値により、粗いメ
ッシュ特徴を構成している。図15(A)は、図14
(A)に示すノイズのない正規化画像から抽出した粗い
メッシュ特徴を示している。また、図15は(B)は、
図14(B)に示すノイズを含んだ正規化画像から抽出
した粗いメッシュ特徴を示している。このように、2つ
の粗いメッシュ特徴は、相違する部分が多く存在する異
になる。
【0047】図16は、標準特徴記憶手段に記憶される
標準特徴の例の説明図である。標準特徴記憶手段13に
記憶される標準特徴も、図13乃至図15に示した過程
と同様にして作成される。ここでは、数字について、そ
の標準特徴の作成過程を示しているが、他の文字、記号
についても同様である。図16(A)は、標準特徴を得
るために用意されたノイズのない標準的な文字画像であ
る。それぞれの文字画像を正規化した正規化画像の例を
図16(B)に示している。さらに、それぞれの正規化
画像から抽出された粗いメッシュ特徴の例を図16
(C)に示している。この図16(C)に示した粗いメ
ッシュ特徴を標準特徴として、標準特徴記憶手段13に
記憶される。
【0048】図17は、類似度の計算による文字の識別
結果と確信度の出力の説明図である。図15に示された
それぞれの粗いメッシュ特徴と、図16に示されたそれ
ぞれの標準特徴との類似度を、類似度計算手段14によ
り計算する。計算された類似度の中で、最も大きい値を
有するものを確信度とし、それに対応する文字コードを
求め、これを識別結果とする。図17(A)は、図13
(A)に示すノイズが含まれていない場合の類似度計算
の結果である。最大の類似度は、「2」の0.99であ
る。識別結果として「2」を示すコードが出力されると
ともに、確信度として0.99が出力される。また、図
17(B)は、図13(B)に示すノイズの含まれてい
る場合の類似度計算の結果である。最大の類似度は、
「5」の0.76である。識別結果として「5」を示す
コードが出力されるとともに、確信度として0.76が
出力される。
【0049】このように、図13(A)に示すような画
像中にノイズが含まれていない場合は、図17(A)に
示すように、正解である文字「2」と、値の大きな確信
度0.99が得られる。しかし、図13(B)に示すよ
うに画像中にノイズが含まれていた場合は、図17
(B)に示すように、誤りである文字「5」と、値の小
さい確信度0.76が得られてしまう。したがって、例
えば、あらかじめ閾値として0.95を設定し、確信度
が閾値である0.95より大きい場合には、ノイズが含
まれていなかったと推定し、それ以外の場合にはノイズ
が含まれていたと推定すればよい。確信度が0.95よ
り大きい場合には、識別結果を文字認識装置の認識結果
として出力する。それ以外の場合は、文字画像記憶手段
中の画像に対してノイズ除去手段5によってノイズを除
去し、再び文字識別手段により識別を行なう。
【0050】図18は、ノイズ除去処理を行なった後の
文字画像の認識過程の説明図である。図13(B)に示
されたノイズを含む文字画像に対して、ノイズ除去手段
5によってノイズ除去処理を行なう。その結果、図18
(A)に示すように、ノイズを含まない文字画像が、文
字画像記憶手段2に保存される。以下、上述した処理と
同様の過程により、識別処理がなされる。まず、図18
(A)に示したノイズを含まない文字画像に対して、画
像正規化手段11により正規化処理を行ない、図18
(B)に示す正規化画像を得る。その正規化画像から特
徴抽出手段12により、図18(C)に示す粗いメッシ
ュ特徴が抽出される。抽出された粗いメッシュ特徴と、
図16(C)に示した標準特徴との類似度を類似度計算
手段14により計算する。計算結果を図18(D)に示
す。ここで、最大の類似度は0.99であり、この値を
確信度とし、対応する文字コード「2」を識別結果とし
て出力する。この確信度は、あらかじめ決められた閾値
0.95より大きいので、「2」を文字認識装置の認識
結果として出力する。このように、ノイズ除去手段5に
よってノイズが除去されたことにより、正解である認識
結果「2」を得ることができた。
【0051】
【発明の効果】以上の説明から明らかなように、本発明
によれば、画像中にノイズが含まれていなかった場合に
はノイズ除去処理を行なわずに認識結果を認識結果とし
て出力することができ、従来技術では無駄に行なわれて
いたノイズ処理を省略できるので、文字認識速度を向上
することができる。
【0052】また、画像中において文字に含まれるべき
部分が、ノイズとして誤って判定される状態であって
も、まずノイズ除去処理を行なわずに識別処理を行なう
ことにより、従来発生していた誤ったノイズ除去処理に
よる誤認識をほとんどなくすことができ、文字認識精度
を向上させることができる。
【0053】さらに、ノイズであると推定される評価値
の大きいノイズ候補から順に除去するノイズ除去手段を
有することにより、無駄なノイズ除去処理をさらに減少
させるとともに、誤ったノイズ除去処理をさらに減少さ
せることができ、文字認識速度、文字認識精度がより一
層向上するという効果がある。
【図面の簡単な説明】
【図1】 本発明の文字認識装置の一実施例を示すブロ
ック図である。
【図2】 文字識別手段3の一例を示すブロック構成図
である。
【図3】 ノイズ除去手段5の一例を示すブロック構成
図である。
【図4】 ノイズ除去手段5の別の例を示すブロック構
成図である。
【図5】 図4に示したノイズ除去手段の例におけるノ
イズ除去動作の説明図である。
【図6】 本発明の文字認識装置の一実施例における第
1の動作例を説明するフローチャートである。
【図7】 本発明の文字認識装置の一実施例における第
2の動作例を説明するフローチャートである。
【図8】 本発明の文字認識装置の一実施例における第
3の動作例を説明するフローチャートである。
【図9】 本発明の文字認識装置の一実施例における第
4の動作例を説明するフローチャートである。
【図10】 本発明の文字認識装置の一実施例における
第5の動作例を説明するフローチャートである。
【図11】 本発明の文字認識装置の一実施例における
第6の動作例を説明するフローチャートである。
【図12】 本発明の文字認識装置の一実施例における
第7の動作例を説明するフローチャートである。
【図13】 文字画像の例の説明図である。
【図14】 正規化画像の例の説明図である。
【図15】 特徴抽出手段により得られた粗いメッシュ
特徴の例の説明図である。
【図16】 標準特徴記憶手段に記憶される標準特徴の
例の説明図である。
【図17】 類似度の計算による文字の識別結果と確信
度の出力の説明図である。
【図18】 ノイズ除去処理を行なった後の文字画像の
認識過程の説明図である。
【符号の説明】
1 文字切り出し手段、2 文字画像記憶手段、3 文
字識別手段、4 文字認識結果出力手段、5 ノイズ除
去手段、11 画像正規化手段、12 特徴抽出手段、
13 標準特徴記憶手段、14 類似度計算手段、21
孤立黒画素検出手段、22 孤立黒画素削除手段、3
1 ノイズ候補検出手段、32 評価値計算手段、33
ノイズ候補除去手段。

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 入力画像より文字を切り出し認識する文
    字認識装置において、入力画像から文字画像を切り出す
    文字切り出し手段と、該文字切り出し手段により得られ
    た文字画像を保存する文字画像記憶手段と、該文字画像
    記憶手段中の文字画像から文字を識別し識別結果と確信
    度を出力する文字識別手段と、前記文字画像記憶手段中
    の文字画像からノイズを除去して前記文字画像記憶手段
    に保存するノイズ除去手段と、前記確信度があらかじめ
    決められた値より大きい場合には前記識別結果を認識結
    果として出力しそれ以外の場合には前記ノイズ除去手段
    により文字画像記憶手段中の文字画像からノイズを除去
    した画像を前記文字画像記憶手段に保存させ前記文字画
    像記憶手段中のノイズを除去した画像を前記文字識別手
    段により識別してその識別結果を認識結果として出力す
    る認識結果出力手段を有することを特徴とする文字認識
    装置。
  2. 【請求項2】 入力画像より文字を切り出し認識する文
    字認識装置において、入力画像から文字画像を切り出す
    文字切り出し手段と、該文字切り出し手段により得られ
    た文字画像を保存する文字画像記憶手段と、該文字画像
    記憶手段中の文字画像から文字を識別し識別結果と確信
    度を出力する文字識別手段と、前記文字画像記憶手段中
    の文字画像からノイズを除去して前記文字画像記憶手段
    に保存するノイズ除去手段と、前記確信度があらかじめ
    決められた第1の値より大きい場合には前記識別結果を
    認識結果として出力しそれ以外の場合には前記ノイズ除
    去手段により文字画像記憶手段中の文字画像からノイズ
    を除去した画像を前記文字画像記憶手段に保存させ前記
    文字画像記憶手段中のノイズを除去した画像を前記文字
    識別手段により識別し確信度があらかじめ決められた第
    2の値より大きい場合にはその識別結果を認識結果とし
    て出力しそれ以外の場合にはリジェクトを表すコードを
    認識結果として出力する認識結果出力手段を有すること
    を特徴とする文字認識装置。
  3. 【請求項3】 入力画像より文字を切り出し認識する文
    字認識装置において、入力画像から文字画像を切り出す
    文字切り出し手段と、該文字切り出し手段により得られ
    た文字画像を保存する文字画像記憶手段と、該文字画像
    記憶手段中の文字画像から文字を識別し識別結果と確信
    度を出力する文字識別手段と、前記文字画像記憶手段中
    の文字画像からノイズを除去して前記文字画像記憶手段
    に保存するノイズ除去手段と、前記確信度があらかじめ
    決められた第1の値より大きい場合には前記識別結果を
    認識結果として出力しそれ以外の場合には前記ノイズ除
    去手段により文字画像記憶手段中の画像からノイズを除
    去した画像を前記文字画像記憶手段に保存させ前記文字
    画像記憶手段中の画像を再度前記文字識別手段により識
    別し確信度が予め決められた第2の値より大きい場合に
    はその識別結果を認識結果として出力しそれ以外の場合
    には再度前記ノイズ除去手段によるノイズ除去処理及び
    前記文字識別手段による識別処理を行なわせる認識結果
    出力手段を有することを特徴とする文字認識装置。
  4. 【請求項4】 入力画像より文字を切り出し認識する文
    字認識装置において、入力画像から文字画像を切り出す
    文字切り出し手段と、該文字切り出し手段により得られ
    た文字画像を保存する文字画像記憶手段と、該文字画像
    記憶手段中の文字画像から文字を識別し識別結果と確信
    度を出力する文字識別手段と、前記文字画像記憶手段中
    の文字画像からノイズを除去して前記文字画像記憶手段
    に保存するノイズ除去手段と、前記確信度があらかじめ
    決められた第1の値より大きい場合には前記識別結果を
    認識結果として出力しそれ以外の場合には前記ノイズ除
    去手段により文字画像記憶手段中の画像からノイズを除
    去した画像を前記文字画像記憶手段に保存させ前記文字
    画像記憶手段中のノイズを除去した画像を前記文字識別
    手段により識別し確信度が予め決められた第2の値より
    大きいかあるいは前記ノイズ除去手段において除去すべ
    きノイズがない場合にはその識別結果を認識結果として
    出力しそれ以外の場合には再度前記ノイズ除去手段によ
    るノイズ除去処理及び前記文字識別手段による識別処理
    を行なわせる認識結果出力手段を有することを特徴とす
    る文字認識装置。
  5. 【請求項5】 入力画像より文字を切り出し認識する文
    字認識装置において、入力画像から文字画像を切り出す
    文字切り出し手段と、該文字切り出し手段により得られ
    た文字画像を保存する文字画像記憶手段と、該文字画像
    記憶手段中の文字画像から文字を識別し識別結果と確信
    度を出力する文字識別手段と、前記文字画像記憶手段中
    の文字画像からノイズを除去して前記文字画像記憶手段
    に保存するノイズ除去手段と、前記確信度があらかじめ
    決められた第1の値より大きい場合には前記識別結果を
    認識結果として出力しそれ以外の場合には前記ノイズ除
    去手段により文字画像記憶手段中の画像からノイズを除
    去した画像を前記文字画像記憶手段に保存させ前記文字
    画像記憶手段中のノイズを除去した画像を前記文字識別
    手段により識別し確信度が予め決められた第2の値以下
    でありかつ前記ノイズ除去手段において除去すべきノイ
    ズが存在する場合には再度前記ノイズ除去手段によるノ
    イズ除去処理及び前記文字識別手段による識別処理を行
    なわせそれ以外の場合には確信度が予め決められた第3
    の値より大きいときその識別結果を認識結果として出力
    しそれ以外の場合にはリジェクトを表わすコードを認識
    結果として出力する認識結果出力手段を有することを特
    徴とする文字認識装置。
  6. 【請求項6】 入力画像より文字を切り出し認識する文
    字認識装置において、入力画像から文字画像を切り出す
    文字切り出し手段と、該文字切り出し手段により得られ
    た文字画像を保存する文字画像記憶手段と、該文字画像
    記憶手段中の文字画像から文字を識別し識別結果と確信
    度を出力する文字識別手段と、前記文字画像記憶手段中
    の文字画像からノイズを除去して前記文字画像記憶手段
    に保存するノイズ除去手段と、前記確信度があらかじめ
    決められた値より大きい場合には前記識別結果を認識結
    果として出力しそれ以外の場合には前記ノイズ除去手段
    により文字画像記憶手段中の画像からノイズを除去した
    画像を前記文字画像記憶手段に保存させ前記文字画像記
    憶手段中のノイズを除去した画像を前記文字識別手段に
    より識別する処理を前記ノイズ除去手段において除去す
    べきノイズがなくなるまで繰り返し行ない得られた複数
    の識別結果のうち最も確信度の大きい識別結果を認識結
    果として出力する認識結果出力手段を有することを特徴
    とする文字認識装置。
  7. 【請求項7】 入力画像より文字を切り出し認識する文
    字認識装置において、入力画像から文字画像を切り出す
    文字切り出し手段と、該文字切り出し手段により得られ
    た文字画像を保存する文字画像記憶手段と、該文字画像
    記憶手段中の文字画像から文字を識別し識別結果と確信
    度を出力する文字識別手段と、前記文字画像記憶手段中
    の文字画像からノイズを除去して前記文字画像記憶手段
    に保存するノイズ除去手段と、前記確信度があらかじめ
    決められた第1の値より大きい場合には前記識別結果を
    認識結果として出力しそれ以外の場合には前記ノイズ除
    去手段により文字画像記憶手段中の画像からノイズを除
    去した画像を前記文字画像記憶手段に保存させ前記文字
    画像記憶手段中のノイズを除去した画像を前記文字識別
    手段により識別する処理を前記ノイズ除去手段において
    除去すべきノイズがなくなるまで繰り返し行ない得られ
    た複数の確信度の最大値があらかじめ決められた第2の
    値より大きい場合には確信どの値が最も大きい識別結果
    を認識結果として出力しそれ以外の場合にはリジェクト
    を表わすコードを認識結果として出力する認識結果出力
    手段を有することを特徴とする文字認識装置。
  8. 【請求項8】 前記ノイズ除去手段は、前記文字画像記
    憶手段に保存されている文字画像からノイズ候補を検出
    するノイズ候補検出手段と、該ノイズ候補検出手段で検
    出された各ノイズ候補に対してその候補がノイズである
    と推定される評価値を計算する評価値計算手段と、前記
    ノイズ候補検出手段により2つ以上のノイズ候補が検出
    された場合は前記評価値計算手段による各ノイズ候補の
    評価値の最も大きいノイズ候補に対してのみ文字画像か
    らノイズの除去処理を行ない前記ノイズ候補検出手段に
    よりただ1つのノイズ候補が検出された場合には検出さ
    れたノイズ候補に対して文字画像からノイズの除去処理
    を行ない前記ノイズ候補検出手段によりノイズ候補が検
    出されない場合はノイズの除去処理を行なわないノイズ
    候補削除手段を備えていることを特徴とする請求項1乃
    至7のいずれか1項に記載の文字認識装置。
JP5212352A 1993-08-04 1993-08-04 文字認識装置 Pending JPH0749926A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5212352A JPH0749926A (ja) 1993-08-04 1993-08-04 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5212352A JPH0749926A (ja) 1993-08-04 1993-08-04 文字認識装置

Publications (1)

Publication Number Publication Date
JPH0749926A true JPH0749926A (ja) 1995-02-21

Family

ID=16621126

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5212352A Pending JPH0749926A (ja) 1993-08-04 1993-08-04 文字認識装置

Country Status (1)

Country Link
JP (1) JPH0749926A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003008899A (ja) * 2001-06-19 2003-01-10 Fuji Xerox Co Ltd 画像処理装置
US6605392B2 (en) 1998-06-19 2003-08-12 Canon Kabushiki Kaisha X-ray mask structure, and X-ray exposure method and apparatus using the same
JP2010020394A (ja) * 2008-07-08 2010-01-28 Canon Inc 画像処理装置および方法
US9792495B2 (en) 2015-04-03 2017-10-17 Fuji Xerox Co., Ltd. Character recognition apparatus, character recognition processing system, and non-transitory computer readable medium
US11361529B2 (en) * 2019-01-24 2022-06-14 Fujifilm Business Innovation Corp. Information processing apparatus and non-transitory computer readable medium

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6605392B2 (en) 1998-06-19 2003-08-12 Canon Kabushiki Kaisha X-ray mask structure, and X-ray exposure method and apparatus using the same
JP2003008899A (ja) * 2001-06-19 2003-01-10 Fuji Xerox Co Ltd 画像処理装置
JP2010020394A (ja) * 2008-07-08 2010-01-28 Canon Inc 画像処理装置および方法
US8452095B2 (en) 2008-07-08 2013-05-28 Canon Kabushiki Kaisha Image processing for post-processing rate of character rectangle extraction and character recognition accuracy
US9792495B2 (en) 2015-04-03 2017-10-17 Fuji Xerox Co., Ltd. Character recognition apparatus, character recognition processing system, and non-transitory computer readable medium
US11361529B2 (en) * 2019-01-24 2022-06-14 Fujifilm Business Innovation Corp. Information processing apparatus and non-transitory computer readable medium

Similar Documents

Publication Publication Date Title
US5410611A (en) Method for identifying word bounding boxes in text
US8014603B2 (en) System and method for characterizing handwritten or typed words in a document
US5539841A (en) Method for comparing image sections to determine similarity therebetween
US5369714A (en) Method and apparatus for determining the frequency of phrases in a document without document image decoding
US5768417A (en) Method and system for velocity-based handwriting recognition
US6249605B1 (en) Key character extraction and lexicon reduction for cursive text recognition
US6128410A (en) Pattern matching apparatus and method that considers distance and direction
US5862259A (en) Pattern recognition employing arbitrary segmentation and compound probabilistic evaluation
US6327385B1 (en) Character segmentation device and character segmentation system
JP4300098B2 (ja) オブジェクト識別方法とその装置、プログラム及び記録媒体
US5621818A (en) Document recognition apparatus
US20050058350A1 (en) System and method for object identification
JP2000113103A (ja) 文書画像の方向判定方法、装置および記録媒体
JPH0749926A (ja) 文字認識装置
JPH08190690A (ja) ナンバープレート決定方法
JP3209197B2 (ja) 文字認識装置及び文字認識プログラムを記録した記録媒体
JP2993252B2 (ja) 同形異文字判別方法および装置
JP3220226B2 (ja) 文字列方向判別方法
KR910007032B1 (ko) 한글 문서 인식장치의 문자열과 개별문자 절출방법
JP4215385B2 (ja) パターン認識装置、パターン認識方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP3665435B2 (ja) 文字認識装置および文字認識方法
JPH1011541A (ja) 文字認識装置
JPS6111886A (ja) 文字認識方式
JP2792063B2 (ja) 文字認識辞書作成方式
JPH03219384A (ja) 文字認識装置