JP2878772B2 - 光学的文字読取装置 - Google Patents

光学的文字読取装置

Info

Publication number
JP2878772B2
JP2878772B2 JP2083226A JP8322690A JP2878772B2 JP 2878772 B2 JP2878772 B2 JP 2878772B2 JP 2083226 A JP2083226 A JP 2083226A JP 8322690 A JP8322690 A JP 8322690A JP 2878772 B2 JP2878772 B2 JP 2878772B2
Authority
JP
Japan
Prior art keywords
character
similarity
candidate
knowledge
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2083226A
Other languages
English (en)
Other versions
JPH03282793A (ja
Inventor
正則 寺崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2083226A priority Critical patent/JP2878772B2/ja
Publication of JPH03282793A publication Critical patent/JPH03282793A/ja
Application granted granted Critical
Publication of JP2878772B2 publication Critical patent/JP2878772B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、光学的文字読取装置に関する。
(従来の技術) 従来から、光学的文字読取装置では、文字認識によっ
て得た文字候補のマトリックスから、知識辞書内の単語
情報を用いて知識処理を行うことにより最終的な認識結
果を得ている。
この知識処理において、文字認識により第1候補とし
て得た文字が、知識処理の結果他の文字と置き代えられ
た場合、表示画面上においてその文字は、例えば高輝度
あるいはカラーにより他の文字と区別して表示され、こ
れにより変換箇所の確認をオペレータに促すようになさ
れている。
しかしながら、知識処理において文字候補のマトリッ
クスに対応する単語候補が知識辞書から得られなかった
場合、つまり知識候補無しの場合は、表示画面において
第1候補の文字列が素読み文字として単一色で表示され
るだけであるため、どの文字が誤読の可能性が高いのか
を一目で判断することが困難であった。したがって、効
率良く誤読箇所の修正を行うことができなかった。
(発明が解決しようとする課題) 本発明はこのような課題を解決するためのもので、知
識処理において、文字候補のマトリックスに対応する単
語候補が知識辞書から得られなかった場合に、各行の第
1文字候補を識別できるようそれぞれ妥当性に応じて表
示することにより、誤読の可能性が高い文字候補を一目
で判断することのできる光学的文字読取装置の提供を目
的としている。
[発明の構成] (課題を解決するための手段) 本発明の光学的文字読取装置は上記目的を達成するた
めに、帳票に記された文字のパターンをイメージデータ
として読込むイメージ読込手段と、各カテゴリの標準パ
ターンが予め格納された認識辞書と、イメージ読込手段
より読込まれた文字パターンと認識辞書内の各標準パタ
ーンとを照合して類似度を求め、これらの類似度に基づ
いて複数の文字候補を判定する文字認識手段と、この文
字認識手段により得られた各文字候補の類似度を保持す
る類似度保持手段と、認識辞書内の各カテゴリについて
の類似度分布が予め格納された類似度分布格納手段と、
知識情報として単語が予め格納された知識辞書と、文字
認識手段により得た文字候補のマトリックスから知識辞
書を用いて知識処理を行う知識処理手段と、知識処理に
おいて文字候補のマトリックスに対応する単語候補が知
識辞書から得られなかった場合、行毎に、最も類似度の
高い第1文字候補の妥当性を、類似度保持手段に保持さ
れた類似度と類似度分布格納手段に格納された該当する
カテゴリの類似度分布とから判定する文字候補妥当性判
定手段と、その判定結果に基づき、各行の第1文字候補
を識別できるようにそれぞれ妥当性に応じて表示するよ
う制御を行う表示制御手段とを具備したものである。
(作用) 本発明の光学的文字読取装置では、文字認識手段によ
り得られた各文字候補の類似度を類似度保持手段に保持
しておき、知識処理において、文字候補のマトリックス
に対応する単語候補が知識辞書から得られなかった場合
に、文字候補妥当性判定手段は、行毎に、最も類似度の
高い第1文字候補の妥当性を、類似度保持手段に保持さ
れた類似度と類似度分布格納手段に格納された該当する
カテゴリの類似度分布に基づき判定する。そして表示制
御手段は、その判定結果に基づき、各行の第1文字候補
を識別できるようにそれぞれ妥当性に応じて表示するよ
う制御を行う。
したがって、この発明によれば、知識処理において、
文字候補のマトリックスに対応する単語候補が知識辞書
から得られなかった場合に、各行の第1文字候補を識別
できるようそれぞれ妥当性に応じて表示することによ
り、誤読の可能性が高い文字候補を一目で判断すること
ができる。
(実施例) 以下、本発明の実施例を図面に基づいて説明する。
第1図は本発明に係る一実施例の光学的文字読取装置
の構成を説明するためのブロック図である。
同図において、1は帳票に記された文字のパターンを
イメージデータとして読込むイメージ読込部、2は各カ
テゴリ(文字)の標準パターンが格納された認識辞書、
3はイメージ読込部1より読込まれた文字パターンと認
識辞書2に格納された各標準パターンとを複合類似度法
等によりマッチングして、類似度の高い上位所定数の文
字候補を判定する文字認識部である。また、4は文字認
識で得た各文字候補についての類似度が一時的に保持さ
れる類似度保持部、5は予め多数の文字パターンを入力
して文字認識を行うことにより収集された各カテゴリの
類似度分布の上限値および下限値が格納された類似度分
布格納部である。さらに6は認識情報として単語が格納
された知識辞書、7は文字認識部3により得られた文字
候補のマトリックスから知識辞書6を検索して、最終的
な文字認識結果を得る知識処理部、8は知識処理におい
て、文字候補のマトリックスに対応する単語候補が知識
辞書6から得られなかった場合(知識候補無しの場
合)、マトリックスの行毎に、最も類似度の高い第1文
字候補の妥当性を、類似度保持部4に保持された類似度
と類似度分布格納部5に格納された該当するカテゴリの
類似度分布に基づき判定する文字候補妥当性判定部、9
は各種の表示を行う表示部、10は文字候補妥当性判定部
8の判定結果に基づき、各行の第1文字候補をそれぞれ
の妥当性に応じて予め定義されたカラーで表示するよう
制御を行う表示制御部である。
次にこの実施例装置において代表される動作を第2図
および第3図を用いて説明する。尚、ここでは、入力文
字パターンとして「オウメ」を読込んだ場合を例にとり
説明する。
まずイメージ読込部1により帳票に記された文字のパ
ターンをイメージデータとして読込み、この文字パター
ンを文字認識部3に送る。
すると、文字認識部3は、入力文字パターンと認識辞
書2内の各標準パターンとを複合類似度法等によりマッ
チングしてそれぞれの類似度を算出し、類似度の高い上
位所定数の文字候補群を文字認識結果として知識処理部
7に渡すとともに、その類似度を類似度保持部4に保存
する。
この後、知識処理部7は、受取った文字候補群をマト
リックス状に組合せ、このマトリックスで知識辞書6の
検索を行うことにより最終的な文字認識結果を判定す
る。
ところで、上述の知識処理において、文字候補のマト
リックスに対応する単語候補が知識辞書6から得られな
かった場合(知識候補無しの場合)、文字候補妥当性判
定部8および表示制御部10は次のような処理を行う。
第3図に示すように、まず文字候補妥当性判定部8
は、類似度保持部4に保存された各行の第1文字候補の
類似度に着目し、その類似度が、類似度分布格納部5に
格納された該当するカテゴリの類似度分布における上限
値および下限値の間に存在するか否かを判断する(ステ
ップA)。
この結果、例えば「ア」の文字の場合のように、第1
文字候補の類似度が類似度分布における上限値および下
限値間に存在しないことが判断された場合、文字候補妥
当性判定部8は、誤読の可能性が大であることを判断
し、当該文字候補にその判定結果を示す情報を付加して
これを表示制御部10に送る(ステップB)。
この後、表示制御部10は、付加情報に基づき例えば赤
のカラーを設定し(ステップC)、このカラーで、表示
部9の画面上に当該文字候補を表示する(ステップ
D)。
また、例えば「ウ」や「メ」の文字の場合のように、
ステップAにおいて、第1文字候補の類似度が、該当す
るカテゴリの類似度分布における上限値および下限値間
に存在することが判断された場合、文字候補妥当性判定
部8は、第1文字候補と第2文字候補との間に所定の値
(ここでは0.01)以上の類似度差があるか否かを判断す
る(ステップE)。
ここで、「ウ」と「ワ」の文字の場合のように、第1
文字候補と第2文字候補との類似度の差が所定の値以下
と判断された場合、文字候補妥当性判定部8は、正誤不
明と判断し、第1文字候補にその判定結果を示す情報を
付加してこれを表示制御部10に送る(ステップF)。
これにより表示制御部10は、付加情報に基づき例えば
黄のカラーを設定し(ステップC)、このカラーで、表
示部9の画面上に当該文字候補を表示する(ステップ
D)。
また、「メ」と「ナ」の文字の場合のように、第1文
字候補と第2文字候補との類似度の差が所定の値以上と
判断された場合、文字候補妥当性判定部8は、正読の可
能性が大と判断し、第1文字候補にその判定結果を示す
情報を付加してこれを表示制御部10に送る(ステップ
G)。
これにより表示制御部10は、付加情報に基づき例えば
青のカラーを設定し(ステップC)、このカラーで、表
示部9の画面上に当該文字候補を表示する(ステップ
D)。
かくしてこの実施例の光学的文字読取装置によれば、
知識処理において、知識辞書6から対応する単語候補が
得られない場合において、各行の第1文字候補をその妥
当性に応じたカラーで表示することにより、誤読の可能
性が高い文字候補を画面上で一目で識別することが可能
となり、この結果、誤読箇所の修正を効率良く行うこと
ができる。
[発明の効果] 以上説明したように本発明の光学的文字読取装置によ
れば、知識処理において、文字候補のマトリックスに対
応する単語候補が知識辞書から得られなかった場合に、
各行の第1文字候補を識別できるようにそれぞれ妥当性
に応じて表示することにより、誤読の可能性が高い文字
候補を一目で判断することができ、誤読箇所の修正を効
率良く行うことができる。
【図面の簡単な説明】
第1図は本発明に係る一実施例の光学的文字読取装置の
構成を説明するためのブロック図、第2図は第1図の光
学的文字読取装置における全体の処理を説明するための
図、第3図は第2図における素読み文字の妥当性チェッ
クからカラー表示までの流れを示すフローチャートであ
る。 1……イメージ読込部、2……認識辞書、3……文字認
識部、4……類似度保持部、5……類似度分布格納部、
6……知識辞書、7……知識処理部、8……文字候補妥
当性判定部、9……表示部、10……表示制御部。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】帳票に記された文字のパターンをイメージ
    データとして読込むイメージ読込手段と、 各カテゴリの標準パターンが予め格納された認識辞書
    と、 前記イメージ読込手段より読込まれた文字パターンと前
    記認識辞書内の各標準パターンとを照合して類似度を求
    め、これらの類似度に基づいて複数の文字候補を判定す
    る文字認識手段と、 この文字認識手段により得られた各文字候補の類似度を
    保持する類似度保持手段と、 前記認識辞書内の各カテゴリについての類似度分布が予
    め格納された類似度分布格納手段と、 知識情報として単語が格納された知識辞書と、 前記文字認識手段により得た文字候補のマトリックスか
    ら前記知識辞書を用いて知識処理を行う知識処理手段
    と、 知識処理において前記文字候補のマトリックスに対応す
    る単語候補が前記知識辞書から得られなかった場合、行
    毎に、最も類似度の高い第1文字候補の妥当性を、前記
    類似度保持手段に保持された類似度と前記類似度分布格
    納手段に格納された該当するカテゴリの類似度分布とか
    ら判定する文字候補妥当性判定手段と、 その判定結果に基づき、前記各行の第1文字候補を識別
    できるようにそれぞれ妥当性に応じて表示するよう制御
    を行う表示制御手段とを具備することを特徴とする光学
    的文字読取装置。
JP2083226A 1990-03-30 1990-03-30 光学的文字読取装置 Expired - Lifetime JP2878772B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2083226A JP2878772B2 (ja) 1990-03-30 1990-03-30 光学的文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2083226A JP2878772B2 (ja) 1990-03-30 1990-03-30 光学的文字読取装置

Publications (2)

Publication Number Publication Date
JPH03282793A JPH03282793A (ja) 1991-12-12
JP2878772B2 true JP2878772B2 (ja) 1999-04-05

Family

ID=13796407

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2083226A Expired - Lifetime JP2878772B2 (ja) 1990-03-30 1990-03-30 光学的文字読取装置

Country Status (1)

Country Link
JP (1) JP2878772B2 (ja)

Also Published As

Publication number Publication date
JPH03282793A (ja) 1991-12-12

Similar Documents

Publication Publication Date Title
US6564206B1 (en) Information search apparatus and method, and storage medium
WO2019194028A1 (ja) 画像処理装置、画像処理方法、およびプログラムを記憶する記憶媒体
WO2019194051A1 (ja) 画像処理装置、画像処理方法、およびプログラムを記憶する記憶媒体
WO2019194026A1 (ja) 画像処理装置、画像処理方法、およびプログラムを記憶する記憶媒体
JPWO2016063483A1 (ja) 自動販売機認識装置、商品棚認識装置、自動販売機認識方法、プログラムおよび画像処理装置
US6549662B1 (en) Method of recognizing characters
JP2000305946A (ja) 情報検索装置、情報検索方法、及び記憶媒体
WO2019194052A1 (ja) 画像処理装置、画像処理方法、およびプログラムを記憶する記憶媒体
WO2019193923A1 (ja) 画像処理装置、画像処理方法および記録媒体
JP2878772B2 (ja) 光学的文字読取装置
JP7111143B2 (ja) 画像処理装置、画像処理方法およびプログラム
JP2003346080A (ja) 文字認識方法
JPH1049623A (ja) 文字読取装置
JP2001101340A (ja) 文字読取装置および文字認識方法
JPH10198761A (ja) 文字認識方法および文字認識装置
JPS61133487A (ja) 文字認識装置
JP2984287B2 (ja) 光学式文字読取装置
JPH0520490A (ja) 光学的文字読取修正システム
JPH07230530A (ja) 文字認識装置及び読み推定方法
JPH0528323A (ja) 文字認識装置
JPS61195473A (ja) 文字読取装置
JPH0554178A (ja) 文字認識装置及び修正用帳票
JPH0344784A (ja) 文字認識装置
JP2000353207A (ja) 画像読取システム
JPH08263595A (ja) 文字認識装置及び文字認識方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080122

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090122

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100122

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100122

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110122

Year of fee payment: 12

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110122

Year of fee payment: 12