JPH02297688A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH02297688A
JPH02297688A JP1117575A JP11757589A JPH02297688A JP H02297688 A JPH02297688 A JP H02297688A JP 1117575 A JP1117575 A JP 1117575A JP 11757589 A JP11757589 A JP 11757589A JP H02297688 A JPH02297688 A JP H02297688A
Authority
JP
Japan
Prior art keywords
character
dictionary
characters
pattern
handwritten
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1117575A
Other languages
English (en)
Inventor
Koichi Higuchi
浩一 樋口
Yoshiyuki Yamashita
山下 義征
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP1117575A priority Critical patent/JPH02297688A/ja
Publication of JPH02297688A publication Critical patent/JPH02297688A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は手書、印刷文字か混在して含まれる媒体上の文
字の認識を行なう高速で認識制度の良い文字認識装置に
関するものである。
(従来の技術) 従来の文字認識装置には特公昭60−38756号公報
に開示されるものがあり、以下の構成要素(a)〜(【
)を具備して構成される。
(a)文字図形な光電変換することにより黒ビット及び
白ビットで表されるディジタル信号の原パターンを作成
する。
(b)次に、該原パターンの線幅を算出する。
(c)次に、前記原パターンを複数の方向に走査を行な
って各走査列毎の黒ビットの連続個数を検出し、当該黒
ビツト連続個数と前記線幅とに基づいて前記複数の走査
方向毎に対応した複数のサブパターンを抽出する。
(d)次に、前記原パターンの文字枠内領域をサブパタ
ーンについて(NXXNY)個の領域(NX、 NYは
定数)に分割し、該分割された領域内についてセルを単
位として黒点を計数した結果と前記線幅とを基に特徴量
を文字の大きさて正規化して特徴マトリクスを作成する
(e)次に、該特徴量を文字の大きさで正規化して特徴
マトリクスを作成する。
(f)そして、該特徴マトリクスを予め用意した文字図
形パターンの標準文字マトリクスからなる辞書と照合し
て文字図形を認識する。
ところで第5図に示すはかき、封書等の郵便番号におい
ては、第5図(a)に示すように予め住所とともに印刷
されている場合と、第5図(b)に示すように手書で記
入される場合がある。個人が記入する場合は、後者が一
般的であるが、前者は、ダイレクトメールの返信はがき
、返信封筒や、雑誌、書籍等に折り込まれた申し込みは
がき等にみられ、その数は膨大である。従って、郵便番
号を認識対象とする文字認識装置では、手書及び印刷文
字の双方に対応する大容量の辞書を用意し、照合を行な
っていた。
また、注文伝票、申し込み書、依頼書等の伝票類におい
て手書・印刷文字が混在する場合も同様であり、手書文
字、印刷文字の双方に対応した大容量の辞書を用意し、
照合を行なっていた。
(発明が解決しようとする課題) しかしながら、上記従来の方法では手書文字、印刷文字
の双方に対応した大容量の辞書との照合を行なわなけれ
ばならず、従って照合に時間がかかり、そのため処理速
度が低下し、また認識精度の低下も招いていた。
本発明はこれらの問題点を解決するためのもので、処理
速度の低下と認識精度の低下という問題点を除去するた
め、入力文字パターンが手書文字か印刷文字かを判定し
、当該判定結果に従って文字認識の際照合に使用する辞
書を選択するようにしたものであり、高速で認識精度の
良い文字認識装置を提供することを目的とする。
(課題を解決するための手段) 本発明は前記問題点を解決するために、文字の記入位置
及び大きさを示す記入枠を有する媒体上の文字、図形等
の読取対象な光電変換して得られる文字パターンに対し
て特徴抽出を行ない、当該特徴を辞書と比較照合して前
記文字パターンの認識を行なう文字認識装置において、
手書文字、印刷文字等の文字の種類に応じて複数の辞書
からなる辞書部と、媒体−Fの読取対象を充電変換して
得られた前記文字パターンの線素が記入枠に相当する領
域をはみ出しているか否かを検出するはみ出し検出部と
、検出結果により辞書部の所望の辞書を選択する辞書選
択部とを具備することに特徴かある。
(作用) 以上のような構成を有する本発明によれば、文字の記入
位置及び大きさを示す記入枠を有する媒体上の文字、図
形等の読取対象は光電変換されて文字パターンが得られ
る。この文字パターンに対して特徴抽出が行なわれる。
また、はみ出し検出部は文字パターンの線素が記入枠に
相当する領域をはみ出しているか否かを検出する。この
検出は読取対象が手書文字か印刷文字かを判定すること
になる。そして、この検出結果に基づいて辞書選択部が
手書文字、印刷文字等の文字の種類に応じて複数の辞書
からなる辞書部の中から所望の辞書を選択する。特徴が
選択された辞書と比較照合されて文字パターンの認識が
行なわれる。
したがって、本発明は前記問題点を解決でき、高速で認
識精度の良い文字認識装置を提供できる。
(実施例) 以下、本発明の一実施例を図面に基づいて説明する。
第1図は本発明の一実施例の構成を示すブロック図であ
る。同図において、1は光信号入力、2は光電変換部、
3は画像メモリ、4は文字切出部、5はパターンレジス
タ、6ははみ出し検出部、7は辞書部、8は認識部、9
は文字名出力である。
次に、本実施例の動作につい′ζ説明する。
先ず、文字、図形等(以下、文字と称する)が記載され
た帳票等の媒体からの光信号は光信号人力1より入力さ
れ、光電変換部2において光電変換され、得られたディ
ジタル信号を画像データとして画像メモリ3に一時格納
する。ここで本実施例の画像データが2値化され文字線
部の画素は“1°であって黒画素と呼ひ、背鼠部の画素
は“0′であって白画素と呼ぶことにする。また、本実
施例の画像メモリ3は前記媒体上の文字列1行分の画像
データを格納するだけの容量をもつ。
また、各画素の信号は前記媒体上の2次元座標通りに再
現できる形式で格納される。そして、文字切出部4は前
記画像データについて文字領域の検出及び文字パターン
の切出しを行ない、得られた文字パターンをパターンレ
ジスタ5へ出力する。
ここで、第2図は画像メモリに格納されている画像デー
タの一部を示す図である。また第3図は文字切出部4よ
り得られた文字パターンの例を示す図である。第2図は
手書文字の例であり、このように文字線の最終部分がは
み出す場合が多い。本実施例では記入枠はドロップアウ
トカラーであり光電変換部2では感知されない。文字切
出部4では予め文字切出部にもつ書式情報メモリに記入
枠に対応するアドレスが記入されており画像メモリ3の
当該アドレスを読み出すことにより、文字の切出しを行
なう。第3図は数字゛2′の文字パターンの切出し例で
ある。この例では文字線の最終部分かはみ出しており、
はみ出した部分はパターンレジスタ5には格納されない
。はみ出し検出部6は前記パターンレジスタ5を読み出
し、入力された文字パターンにはみ出しかあるか否かを
検出し、その結果を辞書部7に対して出力する。第3図
において、点線で示された方形枠は、帳票上の記入枠に
対応するものである。はみ出し検出部6はこの方形枠に
沿って走査し、文字パターンの黒ビットか存在するか否
かを調べ存在する場合は文字線のはみ出しがあると判定
し、全て白ビットであればはみ出し無しと判定し、その
結果を辞書部7に出力する。
辞書部7には複数の辞書が用意されており、はみ出し検
出部6の結果により、辞書を選択して、認識部8に対し
て出力する。
本実施例では2種類の辞書が用意されておりはみ、出し
が検出された場合は、辞書Aを出力し、検出されない場
合は辞書A及び辞書Bを認識部8に対して出力する。辞
書Aは手書文字を対象にした辞書であり、辞書Bは印刷
文字を対象とした辞書である。従って、はみ出しがある
場合は手書文字のみの認識を行ない、無い場合は双方の
文字に関する認識を行なう。
認識部8はパターンレジスタを読み出し、当該文字パタ
ーンの特徴抽出を行い、得られた特徴と前記辞書部7よ
り出力された辞書との照合を行ない、その結果得られる
文字名を文字名出力9に出力する。
本実施例における認識部8の動作を以下説明する。
まず、文字パターンの線幅を算出する。
次に、前記文字パターンを複数の方向に走査を行なって
各走査列ごとの黒ビットの連続個数を検出し、当該黒ビ
ツト連続個数と前記線幅とにJSづいて前記複数の走査
方向ごとに対応した複数のサブパターンを抽出する。本
実施例では水平、垂直、右斜め、左斜めの4方向に走査
し4種のサブパターンを得る。
次に、前記文字パターンの文字枠内領域をサブパターン
について(NXM)個の領域(N、Mは定数)に分割し
、この分割された領域内についてセルを単位として黒点
を係数した結果と前記幅とを基に特徴量を計算する。な
お、本実施例ではN=4.M=4とする。
次に、この特徴量を文字の大きさで正規化して特徴71
へりクスを作成する。なお、NXMX4次元、本実施例
では64次元となる。
そして、この特徴マトリクスと辞書部8から出力される
辞書との照合を行ない、その結果得られる文字名を文字
名出力11に出力する。
本実施例における辞書は前記特徴マトリクスと同形式の
辞書マトリクスで構成される。この辞書マトリクスgi
(1=1.2.・・・、64)と前記特徴マトリクスf
i(L=1.2.・・・、64)との間に下記の式を適
用して距離りを計算し、最もDの小さな辞書マトリクス
に対応する文字名を文字名出力に出力する。
以上詳細に説明したように、本実施例によれば、予め帳
票上に存在する記入枠より、文字かはみ出しているか否
かを検出する手段とその検出結果により、辞書を選択す
る手段を設けたので、記入枠からはみ出した手書文字に
ついては、手書文字を対象とした辞書のみの識別を行な
うようにした。
第4図に印刷数字及び手書数字の例を示す図である。手
書数字は個人差による変形が多く、変形ば対応した辞書
を用意するのて、大きな辞書が必要となる。また、印刷
文字についても、第4図に示すように、多数の字形が存
在し、これに対応した辞書を用意するので手書文字と同
様に大容量の辞書が必要である。従って、手書文字を検
出し、手書文字の辞書に限定すれば照合に要する時間が
大幅に短縮されるのである。また、印刷数字の131.
161 、tB′などは字形が似ている。
手書文字と印刷文字を合わせた辞書を用いて手書文字を
認識する場合、例えば8゛か“6′に誤るというように
、HA 読が起こり易くなる。従って、−jlQ的に対
象字形が限られている場合はそれに対応して辞書の限定
を行なうことにより、認識率が向上する。
また、本実施例では記入枠はドロップアウトカラーであ
り、記入枠位置が予め与えらえれている場合について説
明したが、記入枠かドロップアウトカラーでない場合は
、記入枠と文字パターンか含まれる画像データ得られる
ので当該画像データについて、記入枠を検出分離し、検
出された記入枠と前記文字パターンが接触するか否かを
判定することにより同様の効果が得られることは明らか
である。
(発明の効果) 以上説明したように、本発明によれば、入力文字パター
ンが手書文字か印刷文字かを判定し、当該P1定結果に
従って文字認識の際照合に使用する辞書を選択するよう
にしたものであり、高速で認識精度の良い文字認識装置
を提供できる。
【図面の簡単な説明】
第1図は本発明の一実施例の構成を示すブロック図、第
2図は画像メモリに格納されている画像データの一部を
示す図、第3図は文字切出部より得られた文字パターン
の例を示す図、第4図は印刷数字及び手書数字の例を示
す図、第5図ははがきの一例を示す図である。 1・・・光信号入力、 2・・・光電変換部、 3・・・画像メモリ、 4・・・文字切出部、 5・・・パターンレジスタ、 6・・・はみ出し検出部、 7・・・辞書部、 8・・・認識部、 9・・・文字名出力。 第3図 (Q’J卵刷収シ惰′J (b)  すi、4X!¥のイi+J θ/2J4.5b7δり ■をj叛′J−反ひ゛手書4叉享の−ダ″1第4図

Claims (1)

  1. 【特許請求の範囲】 文字の記入位置及び大きさを示す記入枠を有する媒体上
    の文字、図形等の読取対象を光電変換して得られる文字
    パターンに対して特徴抽出を行ない、当該特徴を辞書と
    比較照合して前記文字パターンの認識を行なう文字認識
    装置において、手書文字、印刷文字等の文字の種類に応
    じて複数の前記辞書からなる辞書部と、 前記媒体上の読取対象を光電変換して得られた前記文字
    パターンの線素が前記記入枠に相当する領域をはみ出し
    ているか否かを検出するはみ出し検出部と、 該検出結果により前記辞書部の所望の辞書を選択する辞
    書選択部とを具備することを特徴とする文字認識装置。
JP1117575A 1989-05-12 1989-05-12 文字認識装置 Pending JPH02297688A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1117575A JPH02297688A (ja) 1989-05-12 1989-05-12 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1117575A JPH02297688A (ja) 1989-05-12 1989-05-12 文字認識装置

Publications (1)

Publication Number Publication Date
JPH02297688A true JPH02297688A (ja) 1990-12-10

Family

ID=14715217

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1117575A Pending JPH02297688A (ja) 1989-05-12 1989-05-12 文字認識装置

Country Status (1)

Country Link
JP (1) JPH02297688A (ja)

Similar Documents

Publication Publication Date Title
US6151423A (en) Character recognition with document orientation determination
US5664027A (en) Methods and apparatus for inferring orientation of lines of text
EP0738987B1 (en) Processing machine readable forms
JPH0420226B2 (ja)
JPS63158678A (ja) 単語間スペ−ス検出方法
US4962432A (en) Selective retrieval of data from microfilm images of different forms by reading a memory index form cord (bar code) recorded on each image frame
JPS6077279A (ja) 文字イメ−ジ切出し方法
EP0144006B1 (en) An improved method of character recognitionand apparatus therefor
EP0042968B1 (en) Multi-registration in optical character recognition
US5854860A (en) Image filing apparatus having a character recognition function
JPH0430070B2 (ja)
JP3268552B2 (ja) 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置
JPH02297688A (ja) 文字認識装置
JP3476595B2 (ja) 画像領域分割方法、および画像2値化方法
JP2616995B2 (ja) 文字認識装置
JP2575408B2 (ja) 郵便物の宛先住所読取装置
JP3710164B2 (ja) 画像処理装置及び方法
JP2582611B2 (ja) マルチフオント辞書の作成法
JPH0797390B2 (ja) 文字認識装置
JP2993533B2 (ja) 情報処理装置及び文字認識装置
JP2875330B2 (ja) 文字認識方法
JP2708604B2 (ja) 文字認識方法
EP0201909A2 (en) Procedure for automatic reading of images and device for carrying out this same procedure
JPH04223584A (ja) 光学式文字読取装置
JPH0420506B2 (ja)