JPH0245892A - 文字認識方法及びその装置 - Google Patents

文字認識方法及びその装置

Info

Publication number
JPH0245892A
JPH0245892A JP63197537A JP19753788A JPH0245892A JP H0245892 A JPH0245892 A JP H0245892A JP 63197537 A JP63197537 A JP 63197537A JP 19753788 A JP19753788 A JP 19753788A JP H0245892 A JPH0245892 A JP H0245892A
Authority
JP
Japan
Prior art keywords
threshold
preprocessing
threshold value
image data
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63197537A
Other languages
English (en)
Inventor
Yoko Anzai
安斎 洋子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP63197537A priority Critical patent/JPH0245892A/ja
Publication of JPH0245892A publication Critical patent/JPH0245892A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 この発明は9文字認識の前処理過程において。
様々な利点を持つ複数のしきい値決定方法を実行し、得
られたしきい値を用いて処理することによリ、あらゆる
条件下の文字の認識1ζ対応することができる文字認識
方法及び装置1ど関するものである。
〔従来の技術〕
一般に9文字認識過程における前処理過程では。
画像データに含まれる雑音や歪み成分の除去、上記前処
理過程に続く特徴抽出・認識過程の処理を容易に行うた
めの文字の位置や大きさの変換などの処理が行われる。
前処理過程における雑音除去の最も一般的な方法として
、しきい値処理による画像データの2値化が知られてい
る。つまり9画像IP(i、j)  をしきい値tに関
して、各画素の濃度を JP (i、 j)= 1: IP (i、 j)≧t
O: IP (i、 j) < t と処理するものである。
このしきい値を決定する方法にはさまざまな種類があり
、1つ1つが違った利点を持つ。
このような方法で設定されたしきい値で2値化された画
像が、lf処理過程を経て特徴抽出、・識別過程に送ら
れるので、不適当なしきい値で2値化された場合、不適
当に認識される可能性がある。
このように2文字認識において2値化を行う場合、あら
ゆる条件下の1画像に対する最適なしきい値をどのよう
にして設定するかということが重要な問題となる。
しきい値決定方法に関する従来の一例1こ、各画素の濃
度の平均からしきい値を得る平均−次式法という方法が
ある。この方法は2画像の濃度ヒストグラムを求めるこ
となくしきい値を決定できるので、非常に簡単なアルゴ
リズムで済み、ステップ数も少ないという利点がある。
平均−次式法を用いた文字認識方法の従来例について、
第3因。
第4図を用いて説明する。
第3図は従来の実施例の機能ブロック図を示したもので
あり、第4図は従来の実施例の前処理部の一例を示した
ものである。
図において、111は走査部、(2)は前処理部、(3
)は特徴抽出部、(4)は識別部、(8)はしきい値決
定処理。
(9)は2値化処理、 +IGは正規化処理である。入
力文字を照明し、上記入力文字の濃淡情報を得る走査部
1!)を経た画像データは、様々な雑音、歪みなどを含
むため、このままでは識別は困難である。このデータは
つぎに前処理部(2)に送られる。前処理部(2)では
、しきい値決定処理(8)において平均−次式法を用い
てしきい値を設定し、そのしきい値によってデータを2
値化しく2値化処理19+)、さらに認識を行いやす(
するために2色々な大きさの文字を一定の大きさに拡大
、縮小して寸法を合せる正規化処理+IGが行われる。
次に、特徴抽出部(3)に送られ9文字を認識する上で
必要となる文字の特徴を決定し9次にその文字と1文字
認識装置内の基準となる1セツトの辞書とマツチングさ
せ。
認識を行う識別部(4)に送られる。
従来の文字認識方法は、上記のようにしきい値決定方法
を平均−次式法という1つの方法薯ど限定してしきい値
を決定し、そのしきい値を用いて2値化、識別を行って
いた。
〔発明が解決しようとする課題〕
従来の文字認識方法は、上記のようにしきい値決定方法
を平均−次式法という1つの方法に限定していた。入力
文字の条件(印字文字のインキのにじみ、かすれ等)が
一定の場合は、従来方法でも問題はないが、このような
ケースはまれであって、現実には、入力文字1つ1つに
よって条件は異なるものである。
この場合、その1つ1つの条件に対して、限定された平
均−次式法というしきい値決定方法が最適なものとは限
らない。例えば、活字や線、記号等の、比率が安定して
いる場合にはP−タイル法が最適であると考えられてい
る。また、自動車ナンバー自動読取システムでは、天気
による明暗。
スピードによるナンバーのぼやけ等あらゆる条件が考え
られ、このよう゛な場合は9判別分析法−大津の方法の
ように柔軟性のあるしきい値決定方法が最適であると思
われる。
つまり、限定されたしきい値決定方法により設定された
しきい値では認識できなかった文字が。
別のしきい値決定方法により設定されたしきい値では認
識できる可能性がある。
この発明は、このような課題を解決するためになされた
もので1文字認識におけるしきい値の設定を重視し、様
々な利点を持つ複数のしきい値決定方法の実行を可能と
する文字認識方法及びその装置を提供することを目的と
するものである。
〔課題を解決するための手段〕
本発明は1文字認識におけるlif処理部(2)で、し
きい値決定処程を複数、並列に実行することにより、上
記しきい値決定処理に続く面処理過程の処理を並列に実
行し、特徴抽出過程、識別過程を経て識別された複数の
結果から入力文字を判定するようにしたものである。
〔作 用〕
この発明においては1文字認識においてしきい値処理を
行う場合に、しきい値決定方法を1つに限定しないこと
により2文字の認識率を高める。
〔実施例〕
しきい値決定方法には、平均−次式法、P−タイル法、
モード法2判別分析法−大津の方法等があり、それぞれ
が違った特徴を持つ。
平均−次式法とは9曲に説明した通りであり。
P−タイル法とは、a度ヒストグラムの面積の比率によ
ってしきい値を決定する方法、モード法とは、濃度ヒス
トグラムの中の山(モード)の間に谷を見つけて、その
谷の濃度値をしきい値とする方法9判別分析法−大津の
方法とは、濃度ヒストグラムのクラス分離度を最大にす
るという判別分析の基準を用いた方法で、ヒストグラム
が双峰的な場合はモード法として働き、モードがない場
合でもしきい値が自動的に決まるという優れた方法であ
る。
以下、これらのしきい値決定方法の中から3つのしきい
値決定方法を実行する場合を例に9図面を参照して本発
明を説明する。
第1図は本発明の実施例のブロック図、第2図は本発明
の実施例のフローチャートである。
与えられた入力文字は走査部(l目とおいて画像データ
に変換される(ステップQυ)。走査部(1)を経た画
像データは次に前処理部(2)へ送られるが、3つのし
きい値決定処理を実行するため、データは第1の前処理
部(5)、第2の前処理部(6)、第3の前処理部(7
)へ送られる。
前処理部では、ステップ四〜@が実行される。
第1の前処理部(5)では2例えば平均−次式法によっ
てしきい値を決定しくステップ(23) 、そのしきい
値で画像データを2値化する(ステップ0)。
さらに、認識を行いやすくするために色々な大きさの文
字を一定の大きさに拡大、縮小して寸法を合せることに
より正規化する(ステップQ4)。
第2の前処理部(61では、第1の前処理部のしきい値
決定方法とは別の方法2例えばP−タイル法によってし
きい値を決定しくステップcl!3) 、そのしきい値
で画像データを2値化する(ステップc13)。
さらに、第1の前処理部と同じよう1ζ正規化する(ス
テップ@)。
第3の前処理部(7)では、第1の訂処理部、第2の前
処理部のしきい値決定方法とは別の方法9例えば判別分
析法−大津の方法によってしきい値を決定しくステップ
(23) 、そのしきい値で画像データを2値化する(
ステップc13)。さらに第1の前処理部、第2の前処
理部と同じように正規化する(ステップc!4)第1の
前処理部(51,第2の前処理部(6)、第3の前処理
部(7)を経たデータはすべて特徴抽出部(3)へ送ら
れる。
特徴抽出部(3)では、正規化が施された3つの2値デ
ータに対し、従来の方法(例えば、メッシ特微量の計算
)でそれぞれ特微量を計算する(ステップ(ハ))。
次に、データは識別部(4)に送られ、計算機の内部の
辞口の特微量と比較することにより入力文字が何という
文字であるかを識別し、それぞれのしきい値決定方法に
対する候補文字を3つ決定する。
(ステップc!1)。
〔発明の効果〕
以上のようにこの発明によれば、しきい値を1つに限定
しないで複数のしきい値を設定することにより、あらゆ
る条件下の文字への対応が可能なので9文字の認識率が
向上する。
【図面の簡単な説明】
第1図は、この発明の実施例のブロック図、第2図はこ
の発明の実施例のフローチャート、第3図は従来の実施
例のブロック図、第4図は従来の実施例の面処理過程の
一例を示した図である。 図において、(1:は走査部、(2)は面処理部、(3
)は特徴抽出部、(41は識別部である。 なお9図中同一あるいは相当部分には同一符号を付して
示しである。

Claims (2)

    【特許請求の範囲】
  1. (1)与えられた入力文字を照明することにより、上記
    入力文字の濃淡情報を得る走査過程と、上記走査過程で
    得られた画像データに含まれる雑音や歪み成分を除去す
    る前処理過程と、上記前処理過程を経た画像データから
    文字を読み取る上で必要となる文字の特徴を抽出する特
    徴抽出過程と、上記特徴抽出過程で得られた特徴をもと
    に入力文字が何という文字であるかを判定する識別過程
    からなる文字認識過程において、上記前処理過程の1つ
    の方法であるしきい値処理を行う場合に、1つ1つが異
    なるしきい値決定方法からなる複数のしきい値決定処理
    を用意し、上記走査過程を経た画像データに対し、上記
    複数のしきい値決定処理と、上記複数のしきい値決定処
    理に続く前処理過程の処理を並列に施すことを特徴とす
    る文字認識方法。
  2. (2)与えられた入力文字を照明することにより、上記
    入力文字の濃淡情報を得る走査部と、上記走査部で得ら
    れた画像データに含まれる雑音や歪み成分を除去する前
    処理部と、上記前処理部を経た画像データから文字を読
    み取る上で必要となる文字の特徴を抽出する特徴抽出部
    と、上記特徴抽出部で得られた特徴をもとに入力文字が
    何という文字であるかを判定する識別部からなる文字認
    識装置において、第1のしきい値決定方法によりしきい
    値を決定し、データの2値化、正規化を行う第1の前処
    理部と、第2のしきい値決定方法によりしきい値を決定
    し、データの2値化、正規化を行う第2の前処理部と、
    第3のしきい値決定方法によりしきい値を決定し、デー
    タの2値化、正規化を行う第3の前処理部からなる前処
    理部を具備することを特徴とする文字認識装置。
JP63197537A 1988-08-08 1988-08-08 文字認識方法及びその装置 Pending JPH0245892A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63197537A JPH0245892A (ja) 1988-08-08 1988-08-08 文字認識方法及びその装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63197537A JPH0245892A (ja) 1988-08-08 1988-08-08 文字認識方法及びその装置

Publications (1)

Publication Number Publication Date
JPH0245892A true JPH0245892A (ja) 1990-02-15

Family

ID=16376124

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63197537A Pending JPH0245892A (ja) 1988-08-08 1988-08-08 文字認識方法及びその装置

Country Status (1)

Country Link
JP (1) JPH0245892A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11312220A (ja) * 1998-03-13 1999-11-09 Canon Inc 正規化されたグレ―スケ―ル画像の分類駆動型閾値処理
JP2012118737A (ja) * 2010-11-30 2012-06-21 Fujitsu Ltd 検査支援プログラム、検査支援方法及び検査支援装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11312220A (ja) * 1998-03-13 1999-11-09 Canon Inc 正規化されたグレ―スケ―ル画像の分類駆動型閾値処理
JP4497574B2 (ja) * 1998-03-13 2010-07-07 キヤノン株式会社 正規化されたグレースケール画像の分類駆動型閾値処理
JP2012118737A (ja) * 2010-11-30 2012-06-21 Fujitsu Ltd 検査支援プログラム、検査支援方法及び検査支援装置

Similar Documents

Publication Publication Date Title
CN107609549B (zh) 一种自然场景下证件图像的文本检测方法
KR100523898B1 (ko) 이미지 프로세싱 방법 및 장치 및 기록 매체
US9965695B1 (en) Document image binarization method based on content type separation
CN110309806B (zh) 一种基于视频图像处理的手势识别***及其方法
WO2011128777A2 (en) Segmentation of textual lines in an image that include western characters and hieroglyphic characters
CN101122953A (zh) 一种图片文字分割的方法
JP2002298085A (ja) 文字認識装置、文字認識方法、及び記録媒体
JPH05225378A (ja) 文書画像の領域分割システム
CN111209865A (zh) 文件内容提取方法、装置、电子设备及存储介质
EP0516576A2 (en) Method of discriminating between text and graphics
Saddami et al. Improvement of binarization performance using local otsu thresholding.
CN112818983A (zh) 一种利用图片相识度判断字符倒置的方法
CN109871779B (zh) 掌纹识别的方法及电子设备
JPH0245892A (ja) 文字認識方法及びその装置
CN115619813A (zh) Sem图像前景提取方法、装置、计算机设备及存储介质
KR100295360B1 (ko) 쉐이딩알고리즘을이용한영상처리방법
JP2005250786A (ja) 画像認識方法
JP4409713B2 (ja) 文書画像認識装置及び記録媒体
JP2002245404A (ja) 領域切り出しプログラムおよび装置
JPH05342412A (ja) グラディエントベクトルの抽出方式及び文字認識用特徴抽出方式
CN117351523A (zh) 指纹比对方法、装置以及处理器设备
JP2001291058A (ja) 文字認識装置及び記録媒体
JPS60122474A (ja) 正規化方法
KR0175400B1 (ko) 영상 세선화 기법을 이용한 문자의 자간 분리방법
JP3634248B2 (ja) 文字領域抽出方法、文字領域抽出装置及び記録媒体