JPH0212391A - 文字認識方式 - Google Patents

文字認識方式

Info

Publication number
JPH0212391A
JPH0212391A JP63161325A JP16132588A JPH0212391A JP H0212391 A JPH0212391 A JP H0212391A JP 63161325 A JP63161325 A JP 63161325A JP 16132588 A JP16132588 A JP 16132588A JP H0212391 A JPH0212391 A JP H0212391A
Authority
JP
Japan
Prior art keywords
reading
candidate
reading mode
character
dissimilarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63161325A
Other languages
English (en)
Inventor
Atsushi Tsukumo
津雲 淳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP63161325A priority Critical patent/JPH0212391A/ja
Publication of JPH0212391A publication Critical patent/JPH0212391A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、光学文字認識装置などに適用される文字認識
方式に関し、特に漢字等の多字種の文字を認識対象とす
る文字認識方式に関する。
〈従来技術とその課題) 近年、日本語情報処理が急速に広まっているが、最も大
きな問題として漢字等の多字種の文字を扱う日本語の入
力方法があげられており、その一つの解決手段として、
光学文字認識装置(OpticalCharacter
 Reader;以下OCRと呼ぶ)が期待されている
。OCRでは、操作者が文字の書かれた、或いは文字の
印刷された用紙をセットし、その文字を機械的に読取っ
た後に操作者が読取り結果の確認を行ない、読取りが棄
却された場合と読取りが誤りている場合には操作者が修
正を行なうことによって文字の入力が完結する。この中
で操作者に最も負担のかかる作業は読取り結果の確認、
修正である。中でも誤った読取り結果を見つける作業は
、操作者に大きな負担となるから、読取り率を高くして
誤読結果を増すよりは読取り率を低くして誤読結果を減
らし、比較的負担の軽い読取り棄却の修正を増すように
設計されるOCRも存在する。このようにOCRの出力
が正読となるか、誤読となるか、読取り棄却となるかに
よって操作者の確認、修正の作業負担が異なり、日本語
の入力効率に大きく影響を与える。従って、正続、誤読
、読取り棄却の定め方は、非常に重要である。
しかしOCRの読取り性能は、入力する文字の品質に依
存しており、比較的乱雑に書かれた文字は丁寧に書かれ
た文字よりも正しく読取ることが難しく、印字品質の低
い印刷文字は通常の印刷文字よりも正しく読取ることが
難しい、そのために読取り対象が数字、英字等のように
少ない字種の場合には、高精度読取りモードと通常読取
りモードとを設け、高精度読取りモードでは、特徴抽出
処理及び分類・識別処理を詳細に行ない、更に低品質文
字認識用の参照パタンを追加する等の対策によって、読
取り速度の低下と引き換えに高精度の読取り性能を達成
し、読取り結果の確認、修正の作業の軽減を図っている
。しかし読取り対象が漢字等の多字種の場合には、読取
り速度の制約、装置規模の制約を考慮すると、英数字の
読取りのように、高精度読取りモードを実現するのは器
しかった。
従来の文字認識方式には上述のように解決すべき課題が
あった。
(課題を解決するための手段) 前述の課題を解決するために本発明が提供する手段は、 手書きまたは印刷された文字を読取る文字認識方式であ
って、外部から指定された読取りモード信号を入力し、
通常読取りモードであるか低品質読取りモードであるか
を判定して、読取りモード選択信号を出力する読取りモ
ード選択部と、二次元格子状の量子化パタンとして文字
パタン信号を入力し、読取り対象の入力された文字パタ
ンの各字種に対する相違度を計算し、相違度によって順
序づけを行ない、各字種の文字コードと相違度との対を
相違度信号として出力する文字分類部と、 前記読取りモード選択部から読取りモード選択信号を読
込み2前記文字分類部からは相違度信号を読込み、該読
取りモード遭択信号が前記通常読取りモード又は低品質
読取りモードのうちのいずれのモードを示すかに応じて
読取り結果または候補字種のうちの少なくとも一方を決
定する読取り判定部とを備えてなり、 該読取判定部は、 通常読取りモードの場合には、順序づけられた相違度が
、通常読取りモード読取り条件を満たしたときに第1位
の相違度に対応する字種を読取り結果と定め、さらに第
2位以下の相違度の中で通常読取りモード候補条件を満
たした相違度に対応する字種を候補文字種と定め、順序
づけられた相違度が通常読取りモード読取り条件を満た
さないときには各相違度の中で通常読取りモード候補条
件を溝たした相違度に対応する字種を候補文字種と定め
、 低品質読取りモードの場合には、順序づけられた相違度
が低品質読取りモード読取り条件を満たしたときに第1
位の相違度に対応する字種を読取り結果と定め、さらに
第2位以下の相違度の中で低品′M読取りモード候補条
件を満たしな相違度に対応する字種を候補文字種と定め
、順序づけられた相違度が低品質読取りモード読取り条
件を満たさないときには各相違度の中で低品質読取りモ
ード候補条件を満たした相違度に対応する字種を候補字
種と定め、読取り結果が存在する場合には、読取り結果
フラッグと読取り結果の字種を示す文字コード及び候補
フラッグ候補字種を示す1個または複数個の文字コード
を表わす信号を出力し、読取り結果か存在しない場合に
は、候補フラッグと候補字種を示す1個または複数個の
文字コードを表わす信号を出力し、 低品質読取りモード読取り条件は通常読取りモード読取
り条件よりも読取り結果が少なくなるように定め、低品
質読取りモード候補条件は通常読取りモード候補条件よ
りも、候補字種が多くなるように定めてあることを特徴
とする。
(作用) 以下に図面を参照して本発明の原理について説明する。
第2図は読取り結果を決定する例を示しており、y軸は
第1位の候補字種に対する入力文字パタンの相違度、y
軸は第2位の候補字種に対する入力文字パタンの相違度
を示している。このとき〔第1位の相違度〕≦〔第2位
の相違度〕(顕似度ならば〔第1位の相違度〕≧〔第2
位の相違度〕)であるので、各人力パタンのx−y平面
上の分布はy≧Xの領域に限られる9図中“0″を第1
位候補が正解の場合、 X″を第1位候補が正解でない
場合とする。第2図<a)が通常の品質の文字に対する
第1位と第2位の候補の相違度の分布とすると、C1で
示す曲線より上の第1位と第2位の候補の相違度がfr
(x、y)>0の領域に含まれれば読取り、fl (x
、y)≦の領域に含まれれば読取り棄却とすればよい、
これに比べて、低品質の文字に対する第1位と第2位の
候補の相違度の分布は第2図(b)のように第1位の候
補が正解のときの相違度が大きい値を取るようになるか
、或いは第2図(C)に第1位の候補が正解でないとき
の相違度が小さい値を取るようになって、“○”印と“
X”印の判別が龍しくなる。
そこで第2図(b)の場合には第1位と第2位の候補の
相違度が、曲線C2の上の領域f2 (xy)ン0に含
まれるときに読取り、f2 (x、y)≦0の領域に含
まれるときは読取り棄却とし、第2図(c)の場合には
曲線C3の上の領域f3(x、y)>Oに含まれるとき
に読取り、f。
(x、y)≦Oの領域に含まれるときは読取り棄却とし
なけえればならない。
第3図は文字分類処理の結果の順序づけられた相違度を
示しており、S軸は順位、D軸は相違度を示している。
候補字種に正解となるべき字種が含まれる確率を低品質
の文字の読取りと通常の品質の文字の読取りとで同程度
にするためには、候補条件を相違度の閾値処理で定める
場合、もし通常の文字に対する候補条件がD≦T +で
あるならば、低品質の文字に対する候補条件をD≦T。
(ただしT’、>Tiとしなければならず、候補条件を
順位で定める場合、もし通常の品質の文字に対する候補
条件がS≦81であるならば、低品質の文字に対する候
補条件をS≦32  (ただしSz>St)としなけれ
ばならない。
以上のように低品質の文字の読取りは、正しく読取るこ
とが困難になり、更に候補字種に正解が含まれるなめに
は、候補字種を多めにすることが必要である。従って読
取り結果を修正する作業に関して、通常の読取りに比べ
て低品質の文字の読取りの方が負担が大きくなることは
避けられない。
しかし読取り結果に誤読が多いよりは読取り棄却が多い
方が、修正する作業の負担は軽いことから、低品質文字
の読取りに対しては、読取り率が低く、候補文字が多く
ても候補字種に正解が高い確率で含まれることが望まし
い。
OCRの操作者は、経験的に文字の品質が通常のもので
あるか、低いかを判断することができる。
従ってOCRに入力すべき用紙上の文字の品質を入力前
に操作者が、通常読取りモードが、低品質読取りモード
かを判定することは、OCRの操作上の大きな負担とは
ならない、従って通常読取りモードであるか、低品質読
取りモードであるかを外部信号として与えられる環境に
おいて、各モードに応じた読取り条件及び候補条件を定
めることによって、読取り結果の確認、修正作業の負担
を軽くする文字認識方式が提供できる。
(実施例) 第1図は本発明の一実施例を示すブロック図である。
読取りモード選択部1は、外部信号11を受け、この外
部信号11により、読込み指定された読取りモードが通
常読取りモードであるが、低品質読取りモードであるか
を判定し、読取りモード選択信号12を出力する。外部
信号11は前述の読取りモード信号に相当する。
文字分類部2は、量子化された文字パタンを信号13と
して読込み、各読取り対象字種に対する相違度を計算し
、相違度の値で順序づけられた、文字コードと相違度の
対を相違度信号として出力するもので、文字認識技術に
おいては一般的なものであり、容易に実現できる。
読取り判定部3は、読取りモード選択部1かち読取り信
号12を読込み、文字分類部2から相違度信号を読込み
、通常読取りモードの場合には、通常読取りモード読取
り条件と通常読取りモード候補条件を用いて、読取り結
果及び候補字種を決定し、低品質読取りモードの場合に
は、低品質読取りモード読取り条件と低品質読取りモー
ド候補条件を用いて、読取り結果及び候祷字種を決定し
、読取り結果及び候補字種を信号15として出力するも
ので、文字認識で用いられるディジタル回路技術によっ
て容易に実現できる。
(発明の効果) 以上のように本発明によれば、入力される文字の品質に
応じた読取り条件及び候補選択条件を適用することによ
り、特徴抽出処理或いは分類・識別処理を複雑化させる
ことなく、読取り結果の確認、修正作業の負担を考慮し
た文字読取り結果及び候補字種を出力することができ、
日本語情報処理のための入力効率の向上に大きく役立つ
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロック図、第2図は
順位づけされた第1位と第2位の相違度から読取り結果
を決定する条件が入力文字の品質によって異なることを
示す概念図、第3図は順位づけされた相違度または順位
から候補字種を定める条件が入力文字の品質によって異
なることを示す概念図である。 図中、1は読取りモード選択部、2は文字分類部、3は
読取り判定部を示している。

Claims (1)

  1. 【特許請求の範囲】 手書きまたは印刷された文字を読取る文字認識方式にお
    いて、外部から指定された読取りモード信号を入力し、
    通常読取りモードであるか低品質読取りモードであるか
    を判定して、読取りモード選択信号を出力する読取りモ
    ード選択部と、二次元格子状の量子化パタンとして文字
    パタン信号を入力し、読取り対象の入力された文字パタ
    ンの各字種に対する相違度を計算し、相違度によって順
    序づけを行ない、各字種の文字コードと相違度との対を
    相違度信号として出力する文字分類部と、 前記読取りモード選択部から読取りモード選択信号を読
    込み、前記文字分類部からは相違度信号を読込み、該読
    取りモード選択信号が前記通常読取りモード又は低品質
    読取りモードのうちのいずれのモードを示すかに応じて
    読取り結果または候補字種のうちの少なくとも一方を決
    定する読取り判定部とを備えてなり、 該読取判定部は、 通常読取りモードの場合には、順序づけられた相違度が
    、通常読取りモード読取り条件を満たしたときに第1位
    の相違度に対応する字種を読取り結果と定め、さらに第
    2位以下の相違度の中で通常読取りモード候補条件を満
    たした相違度に対応する字種を候補文字種と定め、順序
    づけられた相違度が通常読取りモード読取り条件を満た
    さないときには各相違度の中で通常読取りモード候補条
    件を満たした相違度に対応する字種を候補文字種と定め
    、 低品質読取りモードの場合には、順序づけられた相違度
    が低品質読取りモード読取り条件を満たしたときに第1
    位の相違度に対応する字種を読取り結果と定め、さらに
    第2位以下の相違度の中で低品質読取りモード候補条件
    を満たした相違度に対応する字種を候補文字種と定め、
    順序づけられた相違度が低品質読取りモード読取り条件
    を満たさないときには各相違度の中で低品質読取りモー
    ド候補条件を満たした相違度に対応する字種を候補字種
    と定め、読取り結果が存在する場合には、読取り結果フ
    ラッグと読取り結果の字種を示す文字コード及び候補フ
    ラッグと候補字種を示す1個または複数個の文字コード
    を表わす信号を出力し、読取り結果が存在しない場合に
    は、候補フラッグと候補字種を示す1個または複数個の
    文字コードを表わす信号を出力し、 低品質読取りモード読取り条件は通常読取りモード読取
    り条件よりも読取り結果が少なくなるように定め、低品
    質読取りモード候補条件は通常読取りモード候補条件よ
    りも、候補字種が多くなるように定めてあることを特徴
    とする文字認識方式。
JP63161325A 1988-06-29 1988-06-29 文字認識方式 Pending JPH0212391A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63161325A JPH0212391A (ja) 1988-06-29 1988-06-29 文字認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63161325A JPH0212391A (ja) 1988-06-29 1988-06-29 文字認識方式

Publications (1)

Publication Number Publication Date
JPH0212391A true JPH0212391A (ja) 1990-01-17

Family

ID=15732946

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63161325A Pending JPH0212391A (ja) 1988-06-29 1988-06-29 文字認識方式

Country Status (1)

Country Link
JP (1) JPH0212391A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5356317A (en) * 1992-07-28 1994-10-18 Yazaki Corporation Multi-terminal connector

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5356317A (en) * 1992-07-28 1994-10-18 Yazaki Corporation Multi-terminal connector

Similar Documents

Publication Publication Date Title
US4926492A (en) Optical character reading apparatus and method
US5844991A (en) Script identification from images using cluster-based templates
EP1052593B1 (en) Form search apparatus and method
US6687401B2 (en) Pattern recognizing apparatus and method
US5048113A (en) Character recognition post-processing method
US6549662B1 (en) Method of recognizing characters
JPH0212391A (ja) 文字認識方式
JP4194020B2 (ja) 文字認識方法、該方法の実行に用いるプログラム及び文字認識装置
JPH11184976A (ja) 辞書学習方式および文字認識装置
JP2002207960A (ja) 認識文字修正方法及び認識文字修正プログラム
JP3151866B2 (ja) 英文字認識方法
JP2930996B2 (ja) 画像認識方法および画像認識装置
JP2677271B2 (ja) 文字認識装置
KR930012141B1 (ko) 온라인 필기체 문자인식방법
JP2784004B2 (ja) 文字認識装置
JP2931485B2 (ja) 文字切出し装置及び方法
JP2993533B2 (ja) 情報処理装置及び文字認識装置
JPH01311390A (ja) 文字置換制御方式
JP3476872B2 (ja) 文字認識装置
JP3595081B2 (ja) 文字認識方法
JP2752499B2 (ja) 文字読取り装置
JPH06259595A (ja) 文字認識処理装置及び認識処理方法
JP3377719B2 (ja) 文字認識装置及びコンピュータ読み取り可能な記録媒体
JPH0520490A (ja) 光学的文字読取修正システム
JPH07117995B2 (ja) 文字認識装置