JPH07182441A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH07182441A
JPH07182441A JP6097227A JP9722794A JPH07182441A JP H07182441 A JPH07182441 A JP H07182441A JP 6097227 A JP6097227 A JP 6097227A JP 9722794 A JP9722794 A JP 9722794A JP H07182441 A JPH07182441 A JP H07182441A
Authority
JP
Japan
Prior art keywords
recognition
character
unit
word
recognition result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6097227A
Other languages
English (en)
Inventor
Junzo Ikuta
淳三 生田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Publication of JPH07182441A publication Critical patent/JPH07182441A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 誤認識された単語または文字が原稿中のどの
位置にあるかを即座に知ることができる作業性に優れた
文字認識装置を提供することを目的とする。 【構成】 原稿を読み取る画像入力部1と、イメージデ
ータを記憶する原稿イメージ記憶部2と、イメージデー
タの文字認識を行いコードデータを出力する文字認識実
行部3と、コードデータを記憶する認識結果記憶部4
と、認識結果等を表示する表示部5と、全ての単語の綴
りを記憶している単語辞書6と、単語辞書6を参照して
認識結果記憶部4中の誤認識された単語を検出する誤認
識検出部7と、誤認識された単語に対応するイメージデ
ータを表示部5に表示するとともにこの誤認識された単
語の原稿中での位置等を前記表示部5に明示する誤認識
位置明示部8と、正しい認識結果を入力する入力部9
と、認識結果記憶部4中の誤認された単語を訂正する誤
認識訂正部10と、を備えた構成からなる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はイメージスキャナ等によ
って得られたイメージデータを、コンピュータ等で容易
に処理可能なアスキーコード等の文字コードに変換する
文字認識装置に関するものである。
【0002】
【従来の技術】近年、データベースを使った情報検索や
機械翻訳等、文書処理を行う技術の発達につれて、コン
ピュータ等での処理を容易にするために、文章等を電子
化するニーズが増大している。その際の入力装置とし
て、キーボード等に代わって、印刷物等のイメージを読
み取り、自動的にアスキーコード等の文字コードに変換
することのできる文字認識装置が種々開発されている。
【0003】しかしながら、現在の技術レベルでは、文
書等の全てを1文字の誤りもなく認識するのは極めて困
難であり、文字認識終了後に利用者が原稿と認識結果と
を比較して、誤認識部分を訂正することが行われてい
る。
【0004】以下に従来の文字認識装置について説明す
る。従来の文字認識装置は、文字認識処理で得られた認
識結果中の各々の単語を、全ての単語の正しい綴りを記
憶している単語辞書と比較して、認識結果中の単語辞書
に記憶されていない単語があった場合に、この単語が誤
認識されたものと判断して、その単語に対応する部分の
イメージをそのまま表示部に表示し、利用者に正しい単
語を入力させて、認識結果の訂正を行っている。
【0005】以下に従来の他の文字認識装置について説
明する。従来の他の文字認識装置は、文字認識処理で得
られた認識結果中の文字の内、認識確度が誤認識しきい
値より低い文字を、誤認識したものと判断して、その文
字に対応する部分のイメージをそのまま表示部に表示
し、利用者に正しい文字を入力させて、認識結果の訂正
を行っている。
【0006】
【発明が解決しようとする課題】しかしながら上記従来
の構成では、利用者が認識結果の訂正を行う際におい
て、イメージデータの品質が極めて悪く、利用者が、誤
認識部分だけでなく、誤認識部分の前後の原稿の文脈等
から正しい認識結果を把握しなければならない場合等
に、誤認識したと判断された単語または文字に対応する
部分のイメージのみしか表示されないため、誤認識され
た単語または文字が、原稿中のどの位置にあるかを、利
用者が自ら探し出さなければならず、原稿を参照しなが
ら認識結果の訂正を行うのが極めて煩雑で作業性に欠け
るという問題点を有していた。また、文字認識装置が、
文字認識処理によって同様な誤認識を原稿中の複数の部
分で起こした場合であっても、利用者は、これらを各々
訂正しなければならず、煩雑で手数が掛かり作業性に欠
けるという問題点を有していた。
【0007】また、当該単語のイメージ部分がかすれて
いたり、当該単語が大文字か小文字かわからない場合が
あり、当該単語に対応するイメージだけでは利用者はそ
の文字列がわからず、さらに原稿中での位置も把握しに
くいという問題点も有していた。
【0008】本発明は上記従来の問題点を解決するもの
で、誤認識された単語または文字が原稿中のどの位置に
あるかを即座に知ることができ、原稿を参照しながら認
識結果を極めて容易に訂正することができるとともに、
同様な誤認識を一括して訂正することができる作業性に
著しく優れた文字認識装置を提供することを目的とす
る。
【0009】
【課題を解決するための手段】この目的を達成するため
に本発明の請求項1記載の文字認識装置は、文書等から
なる原稿を読み取る画像入力部と、前記画像入力部で得
られたイメージデータを記憶する原稿イメージ記憶部
と、前記原稿イメージ記憶部に記憶されているイメージ
データに対して文字認識を行いその文字に対応するコー
ドデータを出力する文字認識実行部と、前記文字認識実
行部で得られたコードデータを記憶する認識結果記憶部
と、認識結果等を表示する表示部と、全ての単語の正確
な綴りを記憶している単語辞書と、前記単語辞書を参照
して前記認識結果記憶部のコードデータ中の誤認識され
た単語を検出する誤認識検出部と、前記誤認識検出部で
検出されている誤認識された単語に対応する前記原稿イ
メージ記憶部に記憶されたイメージデータを前記表示部
に表示するとともにこの誤認識された単語の前記画像入
力部で読み取られた原稿中での位置等を前記表示部に明
示する誤認識位置明示部と、正しい認識結果を入力する
入力部と、前記認識結果記憶部中の前記誤認識検出部で
得られている誤認識された単語を前記入力部での入力に
応じて訂正する誤認識訂正部と、を備えた構成を有して
おり、請求項2記載の文字認識装置は、文書等からなる
原稿を読み取る画像入力部と、前記画像入力部で得られ
たイメージデータを記憶する原稿イメージ記憶部と、前
記原稿イメージ記憶部に記憶されているイメージデータ
に対して文字認識を行いその文字に対応するコードデー
タを出力する文字認識実行部と、前記文字認識実行部で
得られたコードデータを記憶する認識結果記憶部と、認
識結果等を表示する表示部と、前記認識結果記憶部のコ
ードデータ中の認識確度が誤認識しきい値より低い文字
を誤認識された文字として検出する誤認識検出部と、前
記誤認識検出部で検出されている誤認識された文字に対
応する前記原稿イメージ記憶部に記憶されたイメージデ
ータを前記表示部に表示するとともにこの誤認識された
文字の前記画像入力部で読み取られた原稿中での位置等
を前記表示部に明示する誤認識位置明示部と、正しい認
識結果を入力する入力部と、前記認識結果記憶部中の前
記誤認識検出部で得られている誤認識された文字を前記
入力部での入力に応じて訂正する誤認識訂正部と、を備
えた構成を有しており、請求項3に記載の文字認識装置
は、請求項1または2のいずれか1項において、前記誤
認識位置明示部が前記誤認識訂正部で訂正の対象となっ
ている誤認識された単語または文字と認識結果が同一の
部分を前記認識結果記憶部から検索しこれらの単語群ま
たは文字群の前記画像入力部で読み取られた原稿中での
位置等を前記表示部に明示する同一誤認識明示手段を備
えた構成を有しており、請求項4に記載の文字認識装置
は、請求項3において、前記誤認識訂正部が訂正の対象
となっている誤認識された単語または文字と認識結果が
同一の部分を前記認識結果記憶部から検索しこれらの単
語群または文字群を前記入力部での入力に応じて一括し
て訂正する同一誤認識一括訂正手段を備えた構成を有し
ている。
【0010】また、請求項5に記載の文字認識装置は、
請求項1,2,3,4のいずれか1項において、前記誤
認識検出部で検出されている誤認識された単語に対応す
る前記原稿イメージ記憶部に記憶されたイメージデータ
を誤認識された単語の周囲も含めて前記表示部に表示す
るとともにこの誤認識された前記画像入力部で読み取ら
れた原稿中での位置等を前記表示部に明示する前記誤認
識位置明示部を備えた構成を有している。
【0011】ここで、誤認識位置明示部における誤認識
された単語または文字の原稿中での位置の明示方法とし
ては、原稿1ページに対応する枠等を表示部に表示し、
この枠内の誤認識された部分に対応する位置にその大き
さに応じた矩形等を表示する方法や、原稿イメージ記憶
部中の原稿1ページ分のイメージ全体を縮小する等して
表示部に表示し、誤認識された単語または文字に対応す
るイメージを、表示色変更、下線付加、反転表示等する
方法や、誤認識された単語または文字が原稿中の何行目
の何語目あるいは何文字目にあるかを表示部に表示する
方法等が挙げられる。
【0012】
【作用】この構成によって、誤認識検出部が、認識結果
記憶部に記憶されている認識結果中に、単語辞書に記憶
されていない単語があるか、あるいは認識確度が誤認識
しきい値より低い文字がある場合に、この単語または文
字を誤認識したものと判断し、誤認識位置明示部が、誤
認識検出部で検出されている誤認識した単語または文字
の画像入力部で読み取られた原稿中での位置を表示部に
明示するために、誤認識された単語または文字が原稿中
のどの位置にあるかを即座に知ることができ、利用者が
原稿を参照しながら、認識結果を極めて容易に訂正する
ことができる。また、誤認識明示部が、現在誤認識訂正
部で訂正の対象となっている、誤認識された単語または
文字と認識結果が同一の部分を認識結果記憶部から検索
し、これらの単語群または文字群の原稿中での位置を表
示部に明示する同一誤認識明示手段を有することで、現
在修正中の部分と同一の誤認識をしている部分を明示し
て、利用者が得られた認識結果中の誤認識部分を、早期
かつ全体的に把握することができる。更に、誤認識訂正
部が、現在訂正の対象となっている誤認識された単語ま
たは文字と認識結果が同一の部分を、認識結果記憶部か
ら検索して、該当する単語群または文字群を、入力部か
らの利用者による入力に応じ、一括して訂正する同一誤
認識一括訂正手段を備えたことで、認識結果内の、現在
訂正中の単語または文字と同様な誤認識をしている部分
を、利用者が一括して極めて容易に訂正することができ
る。
【0013】また、請求項5における文字認識装置で
は、回りのイメージを表示することにより当該文字列の
原稿での位置発見がスムーズになり、また、イメージが
かすれていたり、大文字か小文字か判断が不可能なもの
でも、容易に修正が可能となる。
【0014】
【実施例】
(実施例1)以下本発明の第1の実施例における文字認
識装置について、図面を参照しながら説明する。図1は
本発明の第1の実施例における文字認識装置の機能ブロ
ック図である。1はスキャナ等(図示せず)からなり文
書等の原稿(図示せず)を読み取り電気信号に変換しイ
メージデータとして出力する画像入力部、2は画像入力
部1で得られた原稿(図示せず)のイメージデータを記
憶する原稿イメージ記憶部、3は原稿イメージ記憶部2
に記憶されているイメージデータを文字認識しアスキー
コード等の文字コードデータに変換して出力する文字認
識実行部、4は文字認識実行部3で得られた文字コード
を認識結果として記憶する認識結果記憶部、5はCR
T,LCD等からなり認識結果,誤認識の訂正等の情報
を表示する表示部、6は全ての単語の正しい綴りを文字
コードとして記憶している単語辞書、7は単語辞書6を
参照して認識結果記憶部4に記憶されている認識結果を
構成する単語の内単語辞書6に記憶されていないものを
検索しこの単語を誤認識したものと判断して検出する誤
認識検出部、8は誤認識検出部7で検出した誤認識され
ている単語及び原稿イメージ記憶部2中のこの単語に対
応する部分のイメージを表示部5に順次表示するととも
にこの単語が原稿(図示せず)中のどの位置にあるか等
を表示部5に明示する誤認識位置明示部、9はキーボー
ド等からなり正しい認識結果等の利用者からの指示が入
力される入力部、10は誤認識検出部7で検出した認識
結果記憶部4中の誤認識された単語を入力部9での指示
に応じて順次訂正する誤認識訂正部である。
【0015】以上のように構成された本発明の第1の実
施例における文字認識装置について、以下その動作を説
明する。図2は本発明の第1の実施例における文字認識
装置のフローチャートであり、図3は本発明の第1の実
施例における文字認識装置が文字認識を行う原稿の一例
を示す図であり、図4は図3に示した原稿に対する認識
結果を示す図であり、図5は本発明の第1の実施例にお
ける文字認識装置の単語辞書の一例を示す図であり、図
6(a)及び図6(b)は誤認識訂正処理の表示画面の
一例を示す図であり、図7は本発明の第1の実施例にお
ける文字認識装置の誤認識訂正動作中の認識結果記憶部
の内容を示す図である。
【0016】初めに、画像入力部1によって、原稿を読
み込み、イメージデータとして原稿イメージ記憶部2に
記憶する(S1)。ここでは、図3に示すような原稿を
読み込むものとする。次に、文字認識実行部3によっ
て、原稿イメージ記憶部2に記憶されているイメージデ
ータに対する文字認識を行い、得られた文字コードデー
タを認識結果として認識結果記憶部4に記憶する(S
2)。ここでは、図3に示すような原稿に対して、図4
に示すような認識結果が得られたものとする。ここで、
認識結果として、原稿のイメージデータ中の各々の単語
に対応し文字コードによって表される認識文字と、各々
の単語のイメージデータ上でのX,Y座標と、各々の単
語のイメージデータ上での幅,高さが得られる。次に、
誤認識検出部7が、S2で得られた、認識結果記憶部4
に記憶されている認識結果から、個々の単語を一つずつ
順に選出する(S3)。ここでは、まず、単語「Thi
s」が選出される。次に、誤認識検出部7は、処理すべ
き単語がなくなったか調べる(S4)。Yesである場
合は、全ての処理を終了し、Noである場合は、S5へ
jumpする。ここでは、単語「This」を処理中で
あるために、S5へjumpする。次に、誤認識検出部
7は、S3で選出された単語が単語辞書6中に記憶され
ているか検索する(S5)。ここでは、図5に示すよう
な単語辞書6を用いて、単語「This」を検索する。
ところが、単語「This」は単語辞書6中に記憶され
ていない。しかし、単語「This」が文頭にあるた
め、大文字「T」を小文字「t」に変換して、単語「t
his」を単語辞書6中で再度検索を行う。これは単語
辞書6中に記憶されているために、検索に成功する。次
に、誤認識検出部7は、S5での検索が成功したか調べ
る(S6)。Yesである場合は、次の単語を処理する
ためにS3へjumpし、Noである場合は、S7へj
umpする。ここでは、S5での検索が成功しているた
めに、S3へjumpする。次に、誤認識検出部7は、
認識結果記憶部4に記憶された図4に示されているよう
な認識結果中の単語「is」,「a」,「word」に
対して同様な処理を行い、S3へjumpする。次に、
誤認識検出部7は、認識結果記憶部4から次の単語「p
roccssor」を選出する(S3)。次に、単語
「proccssor」を処理中であるためにS4へj
umpする(S4)。次に、誤認識検出部7は、S3で
選出された単語「proccssor」が単語辞書6中
に記憶されているか検索する(S5)。ここでは、図5
より明らかなように、単語辞書6中には記憶されていな
い。よって、検索は失敗する。次に、S5で検索が成功
したか調べる(S5)。ここでは、検索に失敗している
ので、S7へjumpする。次に、誤認識位置明示部8
は、図6(a)に示すように、表示部5へ、誤認識検出
部7がS5で検索に失敗した単語「proccsso
r」を認識文字列として表示し、原稿イメージ記憶部2
中に記憶されたこの単語に対応するイメージを表示し、
更に、原稿イメージ記憶部2に記憶されているイメージ
データから原稿全体の大きさを検出し、これに対応する
大きさの枠を原稿全体画面として表示するとともに、認
識結果記憶部4中に記憶されている単語「proccs
sor」のイメージデータ上でのX,Y座標及び幅,高
さに基づき、この原稿全体画面上での単語「procc
ssor」の位置及び大きさを示す矩形を、単語位置明
示矩形として表示して、図3に示すような原稿上での、
単語「proccssor」の位置を明示する(S
7)。これにより、利用者は原稿上のどの位置の単語で
誤認識が発生したかを極めて容易に把握することができ
る。次に、S5で検索に失敗した単語についての文字列
の入力を受付ける(S8)。ここでは、利用者は入力部
9から原稿を参照して、S5で失敗した単語の正しい綴
りを修正文字列として入力することになる。例えば、図
6(b)に示すように、図3に示すような原稿に基づい
て、文字列「processor」が入力される。ここ
で、S7において、原稿全体表示画面と単語位置明示矩
形が表示されているために、原稿から即座に正しい文字
列を得ることができる。次に、誤認識訂正部10は、S
8で利用者が入力部9から入力した文字列に応じて、認
識結果記憶部4中のS5で検索に失敗した単語を訂正
し、次の単語を処理するために、S3へjumpする
(S9)。ここでは、この処理によって、認識結果記憶
部4の内容が図7に示すように訂正される。次に、以上
の処理を繰り返し、認識結果記憶部4中の全ての単語に
対する処理が終了すると、処理すべき単語がなくなった
と判断して(S4)、全ての処理を終了する。
【0017】以上のように本発明の第1の実施例によれ
ば、誤認識検出部7が、単語辞書6を参照して、認識結
果記憶部4から、誤認識された単語を検出し、誤認識位
置明示部8が、この誤認識された単語の原稿上での位置
等を表示部5へ明示するために、利用者が原稿を参照し
て認識結果を極めて容易に訂正することができる。
【0018】尚、本発明の第1の実施例においては、誤
認識検出部7が単語辞書6を参照して認識結果記憶部4
中の誤認識した単語を検出するようにしているが、単語
辞書6を除き、文字認識実行部3での認識確度が、誤認
識しきい値より低い文字を誤認識された文字として検出
し、この文字に対して同様な処理を行うようにしてもよ
い。また、原稿として英語の文書を用いているが、これ
は日本語等他の言語の文書や、C言語等のプログラムリ
スト等であってもよい。
【0019】(実施例2)以下本発明の第2の実施例に
おける文字認識装置について、図面を参照しながら説明
する。図8は本発明の第2の実施例における文字認識装
置の機能ブロック図である。1は画像入力部、2は原稿
イメージ記憶部、3は文字認識実行部、4は認識結果記
憶部、5は表示部、6は単語辞書、7は誤認識検出部、
9は入力部であり、これらは従来例と同様なものなので
同一の符号を付し説明を省略する。11は誤認識検出部
7で検出した誤認識された単語と同一の単語を認識結果
記憶部4に記憶されている認識結果から検索しこれらの
単語が原稿中のどの位置にあるか等を表示部5に明示す
る同一誤認識明示手段を有する誤認識位置明示部、12
は現在訂正の対象となっている誤認識検出部7で検出し
た誤認識された単語と同一の単語を認識結果記憶部4に
記憶されている認識結果から検索しこれらの単語を利用
者の入力部9からの入力に応じて一括して訂正する同一
誤認識一括訂正手段を有する誤認識訂正部である。
【0020】以上のように構成された本発明の第2の実
施例における文字認識装置について、以下その動作を説
明する。図9は本発明の第2の実施例における文字認識
装置のフローチャートであり、図10は本発明の第2の
実施例における文字認識装置の同一誤認識明示処理の表
示画面の一例を示す図であり、図11は本発明の第2の
実施例における文字認識装置の誤認識一括訂正動作中の
認識結果記憶部の内容を示す図である。
【0021】初めに、実施例1と同様にし、原稿の読み
込み及び文字認識を行う(S1〜S2)。ここでは、実
施例1と同様にし、図3に示すような原稿に対して、図
4に示すような認識結果が得られたものとする。次に、
実施例1と同様にして、認識結果を単語辞書6と照合す
る(S3〜S6)。ここでは、認識結果記憶部4中の図
4に示すような認識結果の内、単語「This」から単
語「word」までに対する、図5に示すような単語辞
書6による検索に成功したものとする。次に、認識結果
記憶部4から、その次の単語「proccssor」を
選出し、単語辞書6による検索を行う(S3〜S5)。
ここでは、単語辞書6中に単語「proccssor」
が記憶されていないために、検索は失敗する。次に、S
5での検索が成功したか調べる(S6)、ここでは、検
索に失敗しているために、S10へjumpする。次
に、S5で検索に失敗した単語と同一の単語を、認識結
果記憶部4中から検索する(S10)。ここでは、S2
で得られた認識結果の中から、図4に示すように、S5
で検索に失敗した単語「proccssor」と同一の
単語が検索される。次に、誤認識位置明示部11は、図
10に示すように、表示部5へ、誤認識検出部7がS5
で検索に失敗した単語「proccssor」を認識文
字列として表示し、原稿イメージ記憶部2中に記憶され
たこの単語に対応するイメージを表示し、更に、原稿イ
メージ記憶部2に記憶されているイメージデータから原
稿全体の大きさを検出し、これに対応する大きさの枠を
原稿全体画面として表示するとともに、認識結果記憶部
4中に記憶されているS5で検索に失敗した単語「pr
occssor」及びS10で検索されたこれと同一の
単語群の、イメージデータ上でのX,Y座標及び幅,高
さに基づき、この原稿全体画面上での、これらの単語群
の位置及び大きさを示す矩形を、単語位置明示矩形とし
て表示して、図2に示すような原稿上における、これら
の単語群の位置を明示する(S11)。次に、利用者
は、実施例1と同様にして、入力部9から、原稿を参照
して、S5で検索に失敗した単語の正しい綴りを修正文
字列として入力する(S8)。ここでは、図3に示すよ
うな原稿に基づいて、文字列「processor」が
入力される。次に、誤認識訂正部12は、S8で利用者
が入力部9から入力した文字列に応じて、認識結果記憶
部4中のS5で検索に失敗した単語と、S10で検索さ
れたこれと同一の単語群を一括して訂正し、次の単語を
処理するために、S3へjumpする(S12)。ここ
では、この処理によって、認識結果記憶部4の内容が、
図11に示すように一括して訂正される。次に、以上の
処理を繰り返し、認識結果記憶部4中の全ての単語に対
する処理が終了すると、処理すべき単語がなくなったと
判断して(S4)、全ての処理を終了する。
【0022】以上のように本発明の第2の実施例によれ
ば、誤認識位置明示部11が現在誤認識訂正部12で訂
正の対象となっている誤認識検出部7で検出された単語
と同一の単語を、認識結果記憶部4中から検索し、現在
訂正の対象となっている単語及びこれと同一の認識結果
記憶部4中の単語群の、原稿中での位置等を表示部5へ
明示する同一誤認識明示手段を有するために、現在修正
中の部分と同一の誤認識をしている部分を表示して、利
用者が、文字認識実行部3で得られた認識結果中の誤認
識部分を、早期かつ全体的に把握することができる。ま
た、誤認識訂正部12が、現在訂正の対象となっている
誤認識された単語と同一の単語を、認識結果記憶部4中
から検索し、これらを入力部9からの利用者の入力に応
じて一括して訂正する同一誤認識一括訂正手段を有する
ために、認識結果内の、現在訂正中の単語と同様な誤認
識をしている部分を、利用者が一括して訂正することが
できる。
【0023】尚、本発明の第2の実施例においては、誤
認識訂正部12が同一誤認識一括訂正手段を有している
が、これはなくともよい。また、認識結果に対する処理
を単語毎に行っているが、これは前述のように、文字毎
に行ってもよい。更に、原稿として英語の文書を用いて
いるが、これは前述のように他の言語等であってもよ
い。
【0024】(実施例3)実施例1、2においては、誤
認識位置明示部8は、表示部5へ、原稿イメージ記憶部
2中に記憶されたこの単語または文字に対応するイメー
ジを表示するようにしているが、図12に示すように、
この単語または文字に対応するイメージの周囲も含めて
表示するようにしてもよい。
【0025】
【発明の効果】以上のように本発明は、誤認識検出部
が、認識結果記憶部に記憶されている認識結果中に、単
語辞書に記憶されていない単語があるか、あるいは認識
確度が誤認識しきい値より低い文字がある場合に、この
単語または文字を誤認識したものと判断し、誤認識位置
明示部が、誤認識検出部で検出されている誤認識した単
語または文字の、画像入力部で読み取られた原稿中での
位置を表示部に明示するために、誤認識された単語また
は文字が原稿中のどの位置にあるかを即座に知ることが
でき、利用者が、原稿を参照しながら、認識結果を極め
て容易に訂正することができ、誤認識明示部が、現在誤
認識訂正部で訂正の対象となっている、誤認識された単
語または文字と認識結果が同一の部分を認識結果記憶部
から検索し、これらの単語群または文字群の原稿中での
位置を表示部に明示する同一誤認識明示手段を有するこ
とで、現在修正中の部分と同一の誤認識をしている部分
を明示して、利用者が、得られた認識結果中の誤認識部
分を、早期かつ全体的に把握することができ、誤認識訂
正部が、現在訂正の対象となっている誤認識された単語
または文字と認識結果が同一の部分を、認識結果記憶部
から検索して、該当する単語群または文字群を、入力部
からの利用者による入力に応じ、一括して訂正する同一
誤認識一括訂正手段を備えたことで、認識結果内の、現
在訂正中の単語または文字と同様な誤認識をしている部
分を、利用者が一括して極めて容易に訂正することがで
きる作業性に著しく優れた文字認識装置を実現できるも
のである。
【0026】また、誤認識された単語または文字のイメ
ージを表示するだけでは誤認識された単語または文字を
把握するのが難しい場合においても、画像入力部で読み
取られた原稿中での位置を明示するとともに誤認識され
た単語または文字に対応するイメージの周囲も含めて表
示することにより、誤認識された単語または文字が原稿
中のどの部分にあるかをより容易に知ることができる。
【図面の簡単な説明】
【図1】本発明の第1の実施例における文字認識装置の
機能ブロック図
【図2】本発明の第1の実施例における文字認識装置の
フローチャート
【図3】本発明の第1の実施例における文字認識装置が
文字認識を行う原稿の一例を示す図
【図4】図3に示した原稿に対する認識結果を示す図
【図5】本発明の第1の実施例における文字認識装置の
単語辞書の一例を示す図
【図6】(a)本発明の第1の実施例における文字認識
装置の誤認識訂正処理の表示画面の一例を示す図(b)
本発明の第1の実施例における文字認識装置の誤認識訂
正処理の表示画面の一例を示す図
【図7】本発明の第1の実施例における文字認識装置の
誤認識訂正動作中の認識結果記憶部の内容を示す図
【図8】本発明の第2の実施例における文字認識装置の
機能ブロック図
【図9】本発明の第2の実施例における文字認識装置の
フローチャート
【図10】本発明の第2の実施例における文字認識装置
の同一誤認識明示処理の表示画面の一例を示す図
【図11】本発明の第2の実施例における文字認識装置
の誤認識一括訂正動作中の認識結果記憶部の内容を示す
【図12】本発明の第2の実施例における文字認識装置
の誤認識訂正処理の表示画面の一例を示す図
【符号の説明】
1 画像入力部 2 原稿イメージ記憶部 3 文字認識実行部 4 認識結果記憶部 5 表示部 6 単語辞書 7 誤認識検出部 8 誤認識位置明示部 9 入力部 10 誤認識訂正部 11 誤認識位置明示部 12 誤認識訂正部

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】文書等からなる原稿を読み取る画像入力部
    と、前記画像入力部で得られたイメージデータを記憶す
    る原稿イメージ記憶部と、前記原稿イメージ記憶部に記
    憶されているイメージデータに対して文字認識を行いそ
    の文字に対応するコードデータを出力する文字認識実行
    部と、前記文字認識実行部で得られたコードデータを記
    憶する認識結果記憶部と、認識結果等を表示する表示部
    と、単語の正確な綴りを記憶している単語辞書と、前記
    単語辞書を参照して前記認識結果記憶部のコードデータ
    中の誤認識された単語を検出する誤認識検出部と、前記
    誤認識検出部で検出されている誤認識された単語に対応
    する前記原稿イメージ記憶部に記憶されたイメージデー
    タを前記表示部に表示するとともにこの誤認識された単
    語の前記画像入力部で読み取られた原稿中での位置等を
    前記表示部に明示する誤認識位置明示部と、正しい認識
    結果を入力する入力部と、前記認識結果記憶部中の前記
    誤認識検出部で得られている誤認識された単語を前記入
    力部での入力に応じて訂正する誤認識訂正部と、を備え
    たことを特徴とする文字認識装置。
  2. 【請求項2】文書等からなる原稿を読み取る画像入力部
    と、前記画像入力部で得られたイメージデータを記憶す
    る原稿イメージ記憶部と、前記原稿イメージ記憶部に記
    憶されているイメージデータに対して文字認識を行いそ
    の文字に対応するコードデータを出力する文字認識実行
    部と、前記文字認識実行部で得られたコードデータを記
    憶する認識結果記憶部と、認識結果等を表示する表示部
    と、前記認識結果記憶部のコードデータ中の認識確度が
    誤認識しきい値より低い文字を誤認識された文字として
    検出する誤認識検出部と、前記誤認識検出部で検出され
    ている誤認識された文字に対応する前記原稿イメージ記
    憶部に記憶されたイメージデータを前記表示部に表示す
    るとともにこの誤認識された文字の前記画像入力部で読
    み取られた原稿中での位置等を前記表示部に明示する誤
    認識位置明示部と、正しい認識結果を入力する入力部
    と、前記認識結果記憶部中の前記誤認識検出部で得られ
    ている誤認識された文字を前記入力部での入力に応じて
    訂正する誤認識訂正部と、を備えたことを特徴とする文
    字認識装置。
  3. 【請求項3】前記誤認識位置明示部が前記誤認識訂正部
    で訂正の対象となっている誤認識された単語または文字
    と認識結果が同一の部分を前記認識結果記憶部から検索
    しこれらの単語群または文字群の前記画像入力部で読み
    取られた原稿中での位置等を前記表示部に明示する同一
    誤認識明示手段を有することを特徴とする請求項1また
    は2のいずれか1項記載の文字認識装置。
  4. 【請求項4】前記誤認識訂正部が訂正の対象となってい
    る誤認識された単語または文字と認識結果が同一の部分
    を前記認識結果記憶部から検索しこれらの単語群または
    文字群を前記入力部での入力に応じて一括して訂正する
    同一誤認識一括訂正手段を有することを特徴とする請求
    項3に記載の文字認識装置。
  5. 【請求項5】前記誤認識検出部で検出されている誤認識
    された単語に対応する前記原稿イメージ記憶部に記憶さ
    れたイメージデータを誤認識された単語の周囲も含めて
    前記表示部に表示するとともにこの誤認識された前記画
    像入力部で読み取られた原稿中での位置等を前記表示部
    に明示する前記誤認識位置明示部を有することを特徴と
    する請求項1,2,3,4のいずれか1項記載の文字認
    識装置。
JP6097227A 1993-11-09 1994-05-11 文字認識装置 Pending JPH07182441A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP27974293 1993-11-09
JP5-279742 1993-11-09

Publications (1)

Publication Number Publication Date
JPH07182441A true JPH07182441A (ja) 1995-07-21

Family

ID=17615269

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6097227A Pending JPH07182441A (ja) 1993-11-09 1994-05-11 文字認識装置

Country Status (1)

Country Link
JP (1) JPH07182441A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002049890A (ja) * 2000-08-01 2002-02-15 Minolta Co Ltd 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JP2004502258A (ja) * 2000-07-05 2004-01-22 パーマン システム リミテッド 1対1比較による漢字の校正システム
JP2009193356A (ja) * 2008-02-14 2009-08-27 Canon Inc 画像処理装置、画像処理方法、プログラム、及び記憶媒体
JP2021100279A (ja) * 2020-08-27 2021-07-01 キヤノン株式会社 画像処理装置及びその制御方法、プログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004502258A (ja) * 2000-07-05 2004-01-22 パーマン システム リミテッド 1対1比較による漢字の校正システム
JP2002049890A (ja) * 2000-08-01 2002-02-15 Minolta Co Ltd 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JP2009193356A (ja) * 2008-02-14 2009-08-27 Canon Inc 画像処理装置、画像処理方法、プログラム、及び記憶媒体
JP2021100279A (ja) * 2020-08-27 2021-07-01 キヤノン株式会社 画像処理装置及びその制御方法、プログラム
JP2022141978A (ja) * 2020-08-27 2022-09-29 キヤノン株式会社 画像処理装置及びその制御方法、プログラム

Similar Documents

Publication Publication Date Title
CA2153684C (en) Combined dictionary based and likely character string method of handwriting recognition
JP3427692B2 (ja) 文字認識方法および文字認識装置
JPH0793328A (ja) 綴り不適切訂正装置
RU2665274C2 (ru) Всплывающая панель верификации
CN114494679A (zh) 一种双层pdf生成及校对方法和装置
JPH07182441A (ja) 文字認識装置
WO2022004097A1 (ja) 情報処理装置、情報処理方法、及びコンピュータプログラム
US20210042555A1 (en) Information Processing Apparatus and Table Recognition Method
JP3274014B2 (ja) 文字認識装置および文字認識方法
JP3221968B2 (ja) 文字認識装置
JPH06348911A (ja) 英文字認識装置
JP3455643B2 (ja) 文字認識装置における学習辞書の更新方法及び文字認識装置
JP3935374B2 (ja) 辞書構築支援方法、装置及びプログラム
JP2002207960A (ja) 認識文字修正方法及び認識文字修正プログラム
JP2902138B2 (ja) 誤読文字修正方法
JP2731394B2 (ja) 文字入力装置
JP3390567B2 (ja) 誤字訂正装置
JP2006330780A (ja) 文字認識装置および文字認識プログラム
JPH05120471A (ja) 文字認識装置
JPH05120472A (ja) 文字認識装置
JPH07334624A (ja) 文字認識装置
JPH09138835A (ja) 文字認識装置
JPH05298495A (ja) 文字認識装置と誤認識文字修正方法並びに欧文文書処理装置
JPH11143993A (ja) 認識文字修正装置およびその方法
JPH01134584A (ja) 文字認識装置

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20050620