JP2002133367A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JP2002133367A
JP2002133367A JP2000320463A JP2000320463A JP2002133367A JP 2002133367 A JP2002133367 A JP 2002133367A JP 2000320463 A JP2000320463 A JP 2000320463A JP 2000320463 A JP2000320463 A JP 2000320463A JP 2002133367 A JP2002133367 A JP 2002133367A
Authority
JP
Japan
Prior art keywords
character
image
display
recognition
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2000320463A
Other languages
English (en)
Inventor
Hajime Sato
元 佐藤
Hitoshi Nishikawachi
仁 西河内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2000320463A priority Critical patent/JP2002133367A/ja
Publication of JP2002133367A publication Critical patent/JP2002133367A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

(57)【要約】 【課題】 不読文字に対応した入力イメージを瞬時に特
定し、認識結果の確認・修正を確実かつ容易に行うこと
ができるOCRを提供する。 【解決手段】 スキャナ11で読み取られ、画像メモリ
12に格納された画像イメージから、フィールド検出部
13によって文字の入力イメージが切り出されてフィー
ルドメモリ15に格納される。更に入力イメージは、文
字切出部16によって1文字毎の文字イメージが切り出
され、文字認識部17で逐次認識され、その認識結果が
認識結果メモリ18に格納される。入力イメージと認識
結果は、表示画面生成部19Aによって読み出され、不
読文字に対応する文字イメージには、正読文字とは異な
る表示色や文字枠が付される。入力イメージとその認識
結果は、確認・修正用の表示画面として、表示部21に
対比表示される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字認識装置(以
下、「OCR」という)、特にその認識結果の表示形式
に関するものである。
【0002】
【従来の技術】図2は、従来のOCRの一例を示す構成
図である。このOCRは、認識対象の帳票を光学的に読
み取るスキャナ11を有している。スキャナ11には画
像メモリ12が接続され、読み取られた帳票の画像イメ
ージが一時的に格納されるようになっている。
【0003】画像メモリ12には、フィールド検出部1
3が接続されている。フィールド検出部13は、帳票形
式登録部14に登録された帳票のフォーマット情報に従
って、読み取り対象のフィールド位置を検出し、そのフ
ィールドイメージを出力するものである。フィールド検
出部13の出力側には、フィールドメモリ15と文字切
出部16が接続されている。フィールドメモリ15は、
認識結果の修正等のために、フィールドイメージを格納
するものである。
【0004】文字切出部16は、フィールドイメージ中
の文字イメージを1文字単位に切り出すものであり、こ
の出力側に文字認識部17が接続されている。文字認識
部17は、切り出された文字イメージの特徴を抽出して
文字を認識し、該当する文字の文字コードを出力するも
のである。文字認識部17の出力側には、認識結果を記
憶する認識結果メモリ18が接続されている。
【0005】フィールドメモリ15と認識結果メモリ1
8の出力側には、認識結果の確認・修正用の画面を生成
する表示画面生成部19が接続されている。表示画面生
成部19の出力側には、画面情報を記憶する表示メモリ
20が接続され、この表示メモリ20に記憶され画面情
報が表示部21に表示されるようになっている。
【0006】このOCRは、表示部21に表示された認
識結果を、必要に応じて修正するための入力部22を備
えている。入力部22は、認識結果修正部23に接続さ
れており、この入力部22から入力された修正データに
よって認識結果メモリ18に格納された認識結果を修正
することができるようになっている。そして、修正処理
の完了した認識結果は、認識結果メモリ18から出力信
号OUTとして出力されるようになっている。
【0007】図3(a),(b)は、図2のOCRにお
ける認識結果の表示例を示す図である。以下、図2の動
作を説明する。
【0008】読み取り対象の帳票の画像イメージは、ス
キャナ11によって読み取られて画像メモリ12に一旦
格納される。フィールド検出部13によって、画像メモ
リ12中の画像イメージから文字部分のフィールドイメ
ージが切り出され、フィールドメモリ15に格納される
と共に、文字切出部16に与えられる。フィールドイメ
ージ中の文字イメージは、文字切出部16によって1文
字毎に切り出され、文字認識部17によって逐次認識さ
れて文字コードに変換される。変換された文字コード
は、認識結果メモリ18に格納される。
【0009】1フィールド内のすべての文字認識が完了
すると、フィールドメモリ15に格納されたフィールド
イメージと、認識結果メモリ18に格納された認識結果
の文字コードが表示画面生成部19によって読み出さ
れ、認識結果の確認・修正用の画面情報が生成されて、
表示メモリ20に格納される。表示メモリ20の内容は
表示部21によって、図3(a)に示すように画面表示
される。
【0010】図3(a)に示すように、修正前の表示画
面には、入力されたとおりのフィールドイメージが入力
イメージとして表示され、認識結果の文字コードが所定
のフォントによって黒色で表示される。また、認識され
ずにリジェクトされた不読文字は、認識結果が赤色の
「?」で表示され、修正入力のためのカーソルが設定さ
れる。
【0011】オペレータは、不読文字に対応する入力イ
メージを確認し、提示された複数の候補文字の中から適
切な文字をマウスで選択したり、キーボードから正しい
文字を入力する。これにより、表示部21の画面は、図
3(b)に示すような修正後の表示画面に変わり、不読
文字の「?」が修正入力された青色の文字に置き換えら
れる。
【0012】このように、入力イメージと認識結果を対
比して表示すると共に、不読文字を赤色の「?」で表示
するようにしているので、不読箇所を見落とすことなく
修正することができる。
【0013】
【発明が解決しようとする課題】しかしながら、従来の
OCRでは、次のような課題があった。即ち、認識結果
として表示された不読文字と、入力イメージ中の文字の
対応付けがないので、フィールド中の文字数が多くなる
と、不読文字に対応したイメージを瞬時に特定すること
ができなかった。
【0014】本発明は、前記従来技術が持っていた課題
を解決し、認識結果の確認・修正が確実かつ容易に行え
るOCRを提供するものである。
【0015】
【課題を解決するための手段】前記課題を解決するため
に、本発明の内の第1の発明は、OCRにおいて、読み
取り対象の文書を光学的に読み取って画像イメージを生
成する読取手段と、前記文書の形式情報が予め登録され
た登録手段と、前記形式情報に基づいて前記画像イメー
ジから複数の文字が記載された文字フィールドを検出す
る検出手段と、前記検出手段で検出された文字フィール
ド中の複数の文字を認識し、各文字に対して正しく認識
できたときには該当する文字コードを、正しく認識でき
ないときには不読の旨の記号コードを出力する認識手段
と、前記文字フィールドのイメージと前記認識手段の認
識結果を同一画面上に対比して表示する表示手段と、入
力部から与えられた修正データに基づいて前記表示手段
に表示されたイメージの表示形式を変更すると共に、前
記認識手段の認識結果を修正する修正手段とを備えてい
る。
【0016】第1の発明によれば、以上のようにOCR
を構成したので、次のような作用が行われる。
【0017】読み取り対象の文書は、読取手段によって
光学的に読み取られて、画像イメージが生成される。画
像イメージは検出手段に与えられ、登録手段に予め登録
されたその文書の形式情報に基づいて、複数の文字が記
載された文字フィールドが検出される。文字フィールド
中に含まれる複数の文字は、認識手段によって認識さ
れ、正しく認識できた文字には該当する文字コードが、
正しく認識できない文字には不読の旨の記号コードが出
力される。
【0018】文字フィールドのイメージと認識手段の認
識結果は、表示手段によって同一画面上に対比して表示
される。また、入力部から修正手段に修正データが与え
られると、この修正手段によって、修正データに基づい
てイメージの表示形式が変更されると共に、認識結果が
修正される。
【0019】第2の発明は、第1の発明における表示手
段を、認識手段において正しく認識できなかった文字に
対応する文字フィールド中の文字イメージを、正しく認
識できた文字とは異なる表示色で表示するように構成し
ている。
【0020】第3の発明は、第1または第2の発明にお
ける表示手段を、認識手段において正しく認識できなか
った文字に対応する文字フィールド中の文字イメージ
に、文字枠を付加して表示するように構成している。
【0021】第4の発明は、第1または第2の発明にお
ける表示手段を、文字フィールド中のすべての文字イメ
ージに文字枠を付加すると共に、認識結果の各文字及び
記号に文字枠を付加して表示するように構成している。
【0022】第5の発明は、第4の発明における表示手
段を、認識手段において正しく認識できなかった文字に
対応する文字フィールド中の文字に付加する文字枠を、
正しく認識できた文字に付加する文字枠とは異なる表示
色で表示するように構成している。
【0023】第6の発明は、第1〜第5の発明における
修正手段を、修正データによって修正された文字のイメ
ージの表示色及び認識結果の文字の表示色を変更するよ
うに構成している。
【0024】第7の発明は、第1〜第6の発明における
表示手段を、文字フィールドのイメージと認識手段の認
識結果に加えて、該認識手段において正しく認識できな
かった文字イメージを拡大して同一画面上に表示するよ
うに構成している。
【0025】第8の発明は、第1〜第6の発明における
表示手段を、文字フィールドのイメージと認識手段の認
識結果に加えて、該認識手段において正しく認識できな
かった文字イメージとその周辺部のイメージを拡大して
同一画面上に表示するように構成している。
【0026】第9の発明は、第1〜第6の発明における
表示手段を、文字フィールドのイメージと認識手段の認
識結果に加えて、該認識手段において正しく認識できな
かった文字イメージ及び文字枠とその周辺部のイメージ
を拡大して同一画面上に表示するように構成している。
【0027】第10の発明は、第1〜第9の発明におい
て、入力部から与えられた指示に基づいて表示手段に表
示されたイメージの表示範囲を一定の領域内で変更する
変更手段を設けている。
【0028】
【発明の実施の形態】(第1の実施形態)図1は、本発
明の第1の実施形態を示すOCRの構成図であり、図2
中の要素と共通の要素には共通の符号が付されている。
【0029】このOCRは、図2のOCRと同様に、認
識対象の文字が記載された帳票を光学的に読み取る読取
手段(例えば、スキャナ)11を有している。スキャナ
11には画像メモリ12が接続され、読み取られた帳票
の画像イメージが一時的に格納されるようになってい
る。
【0030】画像メモリ12には、検出手段(例えば、
フィールド検出部)13が接続されている。フィールド
検出部13は、登録手段(例えば、帳票形式登録部)1
4に登録された帳票のフォーマット情報に従って、読み
取り対象の文字が存在するフィールド位置を検出し、そ
のフィールドイメージを出力するものである。フィール
ド検出部13の出力側には、フィールドメモリ15と文
字切出部16が接続されている。
【0031】フィールドメモリ15は、認識結果の修正
処理のために、フィールドイメージを格納するものであ
る。文字切出部16は、文字認識のためにフィールドイ
メージ中の文字イメージを1文字単位に切り出すもので
あり、この出力側に認識手段(例えば、文字認識部)1
7が接続されている。
【0032】文字認識部17は、切り出された文字イメ
ージの特徴を抽出して文字を認識し、該当する文字の文
字コードに変換するものである。また、文字認識部17
は、正しく認識できない文字イメージを、不読の旨の記
号「?」の記号コードに変換して出力するようになって
いる。文字認識部17の出力側には、認識結果を記憶す
るための認識結果メモリ18が接続されている。
【0033】フィールドメモリ15と認識結果メモリ1
8の出力側には、認識結果の確認・修正用の画面を生成
する表示手段(例えば、表示画面生成部)19Aが接続
されている。表示画面生成部19Aは、フィールドイメ
ージと認識結果を対比して、第1の表示色(例えば、黒
色)で表示する表示画面を生成するものである。更に、
表示画面生成部19Aは、認識結果の中に、認識されず
にリジェクトされた不読文字が含まれる場合には、その
不読文字の認識結果を第2の表示色(例えば、赤色)の
「?」で表示すると共に、フィールドイメージ中の不読
箇所を第3の表示色(例えば、桃色)に変えて表示する
機能を有している。
【0034】表示画面生成部19Aの出力側には、画面
情報を格納する表示メモリ20が接続され、この表示メ
モリ20に格納され画面情報が表示部21によって読み
出されて表示されるようになっている。
【0035】このOCRは、表示部21に表示された認
識結果を、必要に応じて修正するためのキーボードやマ
ウス等の入力部22を備えており、この入力部22が、
修正手段(例えば、修正処理部)30に接続されてい
る。
【0036】修正処理部30は、修正制御部31と、認
識結果生成部32と表示画面修正部33で構成されてお
り、この修正制御部31に入力部22が接続されてい
る。修正制御部31は、入力部22から入力された修正
データと帳票形式登録部14に登録された帳票のフォー
マット情報に基づいて、認識結果生成部32と表示画面
修正部33を制御するものである。
【0037】認識結果生成部32は、修正制御部31の
制御に従って、認識結果メモリ18に格納された認識結
果を修正するものである。表示画面修正部33は、同様
に修正制御部31の制御に従って、表示メモリ20に格
納された画面情報の内容を修正するものである。そし
て、入力部22から入力された修正データに従って修正
された認識結果は、認識結果メモリ18から出力信号O
UTとして出力されるようになっている。
【0038】図4(a),(b)は、図1のOCRにお
ける認識結果の表示例を示す図である。以下、この図4
(a),(b)を参照しつつ、図1の動作を説明する。
【0039】読み取り対象の帳票の画像イメージは、ス
キャナ11によって読み取られて画像メモリ12に一旦
格納される。画像メモリ12に格納された画像イメージ
は、フィールド検出部13によって文字部分のフィール
ドイメージが切り出され、フィールドメモリ15に格納
されると共に、文字切出部16に与えられる。フィール
ドイメージ中の文字イメージは、文字切出部16によっ
て1文字毎に切り出され、文字認識部17によって逐次
認識される。正しく認識された文字イメージは文字コー
ドに変換される。また、正しく認識されなかった文字イ
メージは、不読文字としてリジェクトされ、「?」の記
号コードと共に、この不読文字に対応する複数の候補文
字の文字コードが出力される。これらの認識結果は、認
識結果メモリ18に格納される。
【0040】1フィールド内のすべての文字認識が完了
すると、フィールドメモリ15に格納されたフィールド
イメージと、認識結果メモリ18に格納された認識結果
が表示画面生成部19Aによって読み出され、確認・修
正用の画面情報が生成されて表示メモリ20に格納され
る。表示メモリ20の内容は表示部21によって、図4
(a)のように画面表示される。
【0041】図4(a)に示すように、修正前の表示画
面には、入力されたとおりのフィールドイメージが入力
イメージとして表示される。入力イメージの内で、正し
く認識された文字に対応するフィールドイメージは黒色
で表示され、不読文字に対応するフィールドイメージは
桃色で表示される。
【0042】一方、認識結果には、正しく認識された文
字コードが所定のフォントによって黒色で表示され、不
読文字は赤色の「?」で表示されると共に、この不読文
字の位置に修正入力のためのカーソルが設定される。
【0043】オペレータは、不読文字に対応する入力イ
メージを確認し、提示された複数の候補文字の中から適
切な文字をマウスで選択したり、キーボードから正しい
文字を入力する。これにより、表示画面修正部33によ
って、表示メモリ20中の認識結果の「?」が修正入力
された文字に修正されると共に、その表示色が第4の表
示色(例えば、青色)に変更される。この結果、表示部
21の画面は図4(b)に示す修正後の表示画面に変わ
る。
【0044】以上のように、この第1の実施形態のOC
Rは、入力イメージにおいて、正しく認識された文字と
不読文字を容易に識別可能な表示画面を生成する表示画
面生成部19Aを有すると共に、入力部22からの修正
入力に従って表示メモリ20の内容を修正する修正処理
部30を有している。これにより、不読文字に対応する
イメージを瞬時に特定することが可能になり、認識結果
の確認・修正を確実かつ容易に行うことができる。
【0045】(第2の実施形態)図5(a),(b)
は、本発明の第2の実施形態の表示例を示す図である。
なお、この第2の実施形態で用いられるOCRは、図1
とほぼ同様である。但し、表示画像修正部33は、入力
部22の修正データに基づいて認識結果中の不読文字を
修正する機能に加え、修正された文字の入力イメージの
表示色を認識結果と同じ第4の色(即ち、青色)に変更
する機能を有している。このOCRでは、図1とほぼ同
様の動作が行われる。
【0046】即ち、読み取り対象の帳票の認識結果は、
図5(a)に示すように、入力イメージの内で、正しく
認識された文字に対応するフィールドイメージは黒色で
表示され、不読文字に対応するフィールドイメージは桃
色で表示される。一方、認識結果には、正しく認識され
た文字コードが所定のフォントで黒色で表示され、不読
文字は赤色の「?」で表示されると共に、この不読文字
の位置に修正入力のためのカーソルが設定される。
【0047】次に、オペレータによって不読文字に対応
する修正入力が行われる。これにより、認識結果修正部
32によって、認識結果の不読文字の「?」が修正入力
された青色の文字に置き換えられると共に、表示画面修
正部33によって、修正された文字に対応する入力イメ
ージが青色に変更される。修正された画面は、図5
(b)のように表示される。
【0048】以上のように、この第2の実施形態のOC
Rは、正しく認識された文字と不読文字の入力イメージ
を識別できる表示画面を生成する表示画面生成部19A
を有すると共に、入力部22からの修正入力に従って表
示メモリ20の内容を修正する修正処理部30を有して
いる。これにより、不読文字に対応するイメージを瞬時
に特定することが可能になり、認識結果の確認・修正を
確実かつ容易に行うことができる。更に、修正済みの入
力イメージの表示色を変更するようにしているので、未
修正と修正済みの文字を容易に区別することが可能にな
り、修正漏れを防止することができる。
【0049】(第3の実施形態)図6は、本発明の第3
の実施形態を示すOCRの構成図であり、図1中の要素
と共通の要素には共通の符号が付されている。
【0050】このOCRは、図1のOCRに文字枠生成
部41を設けると共に、表示画面生成部19Aに代えて
機能の異なる表示画面生成部19Bを設けたたものであ
る。文字枠生成部41は、帳票形式登録部14に登録さ
れた帳票のフォーマット情報に従って、認識対象の文字
に対応する文字枠の情報を生成して表示画面生成部19
Bに出力するものである。また、表示画面生成部19B
は、フィールドイメージと認識結果を対比する表示画面
を生成するものである。表示画面生成部19Bは、認識
結果の中の不読文字を第2の表示色(即ち、赤色)の
「?」で表示すると共に、入力イメージ中の不読文字に
第3の表示色(即ち、桃色)の文字枠を追加して表示す
る機能を有している。その他の構成は図1と同様であ
る。
【0051】図7(a),(b)は、図6のOCRにお
ける認識結果の表示例を示す図である。
【0052】文字枠生成部41によって帳票形式登録部
14が参照され、この帳票形式登録部14に登録された
フィールド毎の文字数、文字幅、文字高、及び文字間隔
のフォーマット情報に基づいて、入力イメージに付加さ
れる文字枠の位置が算出され、表示画面生成部19Bに
与えられる。そして、表示画面生成部19Bにおいて、
読み取り対象の帳票の入力イメージは、文字イメージが
第1の表示色(即ち、黒色)で表示され、更に不読文字
に桃色の文字枠が追加される。また、認識結果は、正し
く認識された文字コードが所定のフォントで黒色で表示
され、不読文字が赤色の「?」で表示されると共に、こ
の不読文字の位置に修正入力のためのカーソルが設定さ
れた画面情報が生成される。生成された画面情報は、表
示メモリ20に格納され、図7(a)に示すように表示
部21に表示される。
【0053】次に、オペレータによって不読文字に対応
する修正入力が行われると、修正処理部30によって、
図7(b)に示すように、認識結果の不読文字の「?」
が修正入力された青色の文字に置き換えられると共に、
修正された文字に対応する入力イメージが、青色に変更
される。
【0054】以上のように、この第3の実施形態のOC
Rは、文字枠のデータを生成する文字枠生成部41と、
不読文字の入力イメージに文字枠を付加した画面情報を
生成する表示画面生成部19Bを有している。これによ
り、不読文字に対応するイメージを瞬時に特定すること
が可能になり、認識結果の確認・修正を確実かつ容易に
行うことができる。
【0055】(第4の実施形態)図8(a),(b)
は、本発明の第4の実施形態の表示例を示す図である。
なお、この第4の実施形態で用いられるOCRは、図6
とほぼ同様である。但し、表示画面生成部19Bは、文
字枠生成部41から与えられる文字枠データに従って、
入力イメージと認識結果の両方に、文字枠を付加した画
面情報を生成する機能を有している。このOCRでは、
図6とほぼ同様の動作が行われる。
【0056】即ち、読み取り対象の帳票の入力イメージ
は、図8(a)に示すように、文字枠生成部41で算出
された文字枠位置の情報に従って、文字イメージを区分
する桃色の文字枠の中に黒色で表示される。
【0057】また、認識結果の文字も、文字枠中に表示
される。正しく認識された文字は、所定のフォントで黒
色に表示され、不読文字は赤色の「?」で表示されると
共に、この不読文字の位置に修正入力のためのカーソル
が設定される。
【0058】次に、オペレータによって不読文字に対応
する修正入力が行われると、図8(b)に示すように、
認識結果の不読文字の「?」が修正入力された青色の文
字に置き換えられる。
【0059】以上のように、この第4の実施形態のOC
Rは、文字枠のデータを生成する文字枠生成部41と、
入力イメージ及び認識結果の全体に文字枠を付加した表
示画面を生成する表示画面生成部19Bを有している。
これにより、「(空白)」の位置を容易に特定すること
が可能になり、認識結果の確認・修正を確実かつ容易に
行うことができる。
【0060】(第5の実施形態)図9(a),(b)
は、本発明の第5の実施形態の表示例を示す図である。
なお、この第5の実施形態で用いられるOCRは、図6
とほぼ同様である。但し、表示画面生成部19Bは、文
字枠生成部41から与えられる文字枠データに従って、
入力イメージと認識結果の両方に、文字枠を付加した表
示画面データを生成する機能を有している。特に、入力
イメージには、不読文字に対応する文字枠を第3の表示
色(即ち、桃色)で表示し、正常に読み取られた文字に
対応する文字枠を第1の表示色(即ち、黒色)で表示す
るようになっている。このOCRでは、図6とほぼ同様
の動作が行われる。
【0061】即ち、読み取り対象の帳票の入力イメージ
は、図9(a)に示すように、正しく認識された文字イ
メージは黒色の文字枠の中に黒色で表示され、不読の文
字イメージは桃色の文字枠の中に黒色で表示される。
【0062】また、認識結果の文字も黒色の文字枠中に
表示される。正しく認識された文字は、所定のフォント
で黒色に表示され、不読文字は赤色の「?」で表示され
ると共に、この不読文字の位置に修正入力のためのカー
ソルが設定される。
【0063】次に、オペレータによって不読文字に対応
する修正入力が行われ、図9(b)に示すように、認識
結果の不読文字の「?」が修正入力された青色の文字に
置き換えられる。
【0064】以上のように、この第5の実施形態のOC
Rは、文字枠のデータを生成する文字枠生成部41と、
入力イメージ及び認識結果の全体に文字枠を付加した画
面情報を生成する表示画面生成部19Bを有している。
これにより、「(空白)」の位置を容易に特定すること
が可能になり、認識結果の確認・修正を確実かつ容易に
行うことができる。更に、表示画面生成部19Bでは、
不読文字のイメージに正しく認識された文字とは異なる
色の文字枠を付加するようになっているので、不読箇所
を直ちに識別することができる。
【0065】(第6の実施形態)図10は、本発明の第
6の実施形態を示すOCRの構成図であり、図1中の要
素と共通の要素には共通の符号が付されている。
【0066】このOCRは、図1のOCRに拡大画像生
成部42を設けたものである。拡大画像生成部42は、
不読文字に対応する入力イメージの拡大画像イメージを
生成して、表示メモリ20に追加書き込みを行うもので
ある。その他の構成は図1と同様である。
【0067】図11は、図10のOCRにおける認識結
果の表示例を示す図である。即ち、読み取り対象の帳票
の認識結果は、図11に示すように、入力イメージとそ
の認識結果が、フィールド単位に対比して表示されると
共に、不読文字に対応する文字イメージが拡大イメージ
として追加表示される。
【0068】以上のように、この第6の実施形態のOC
Rは、不読文字の入力イメージを拡大して表示するため
の拡大画像生成部42を有している。これにより、不読
文字に対応するイメージを瞬時に特定することが可能に
なり、認識結果の確認・修正を確実かつ容易に行うこと
ができる。
【0069】(第7の実施形態)図12は、本発明の第
7の実施形態の表示例を示す図である。なお、この第7
の実施形態で用いられるOCRは、図10とほぼ同様で
ある。但し、拡大画像生成部42は、不読文字に対応す
るイメージだけでなく、その周辺のイメージも含めて、
拡大イメージとして追加表示する機能を有している。こ
のOCRでは、図10とほぼ同様の動作が行われる。
【0070】即ち、読み取り対象の帳票の認識結果は、
図12に示すように、入力イメージとその認識結果が、
フィールド単位に対比して表示されると共に、不読文字
に対応する文字イメージとその周辺のイメージが、拡大
イメージとして追加表示される。
【0071】以上のように、この第7の実施形態のOC
Rは、不読文字の入力イメージとその周辺のイメージを
拡大して表示するための拡大画像生成部42を有してい
る。これにより、不読文字に対応するイメージを瞬時に
特定すると共に、正しい文字を容易に判断することが可
能になり、認識結果の確認・修正を確実かつ容易に行う
ことができる。
【0072】(第8の実施形態)図13は、本発明の第
8の実施形態の表示例を示す図である。なお、この第8
の実施形態で用いられるOCRは、図10とほぼ同様で
ある。但し、拡大画像生成部42は、不読文字に対応す
るイメージだけでなく、そのイメージに文字枠を付加す
ると共に、その周辺のイメージも含めて、拡大イメージ
として追加表示する機能を有している。このOCRで
は、図10とほぼ同様の動作が行われる。
【0073】即ち、読み取り対象の帳票の認識結果は、
図13に示すように、入力イメージとその認識結果が、
フィールド単位に対比して表示される。更に、文字枠が
付加された不読文字に対応する文字イメージと共に、そ
の周辺のイメージが拡大イメージとして追加表示され
る。
【0074】以上のように、この第8の実施形態のOC
Rは、文字枠を付加した不読文字の入力イメージと、そ
の周辺のイメージを拡大して表示するための拡大画像生
成部42を有している。これにより、不読文字に対応す
るイメージを瞬時に特定すると共に、正しい文字を容易
に判断することが可能になり、認識結果の確認・修正を
確実かつ容易に行うことができる。
【0075】(第9の実施形態)図14は、本発明の第
9の実施形態を示すOCRの構成図であり、図1中の要
素と共通の要素には共通の符号が付されている。
【0076】このOCRは、図1のOCRに変更手段
(例えば、フィールド範囲変更部)43を設けると共
に、表示画面生成部19Aに代えて、機能の異なる表示
画面生成部19Cを設けたたものである。
【0077】フィールド範囲変更部43は、入力部22
からの指定に基づいて、表示用の入力イメージを一定の
範囲で上下左右にスクロールする機能を有している。ま
た、表示画面生成部19Cは、フィールドイメージと認
識結果を対比して表示する画面情報を生成すると共に、
表示画面中に入力イメージのスクロール制御用のスクロ
ール・バー等を追加表示する機能を有している。その他
の構成は図1と同様である。
【0078】図15(a)〜(c)は、図14のOCR
の動作を説明するための図であり、同図(a)は、画像
メモリ12中に格納された画像イメージを模式的に示す
図、及び同図(b),(c)は、それぞれ表示部21に
表示された修正前及び修正後の表示画面である。以下、
これらの図15(a)〜(c)を参照しつつ、図14の
動作を説明する。
【0079】読み取り対象の帳票の画像イメージは、ス
キャナ11によって読み取られ、画像メモリ12に、図
15(a)のように格納される。画像メモリ12に格納
された画像イメージは、フィールド検出部13によって
基準表示範囲のフィールドイメージが切り出され、フィ
ールド範囲変更部43を介してフィールドメモリ15に
格納されると共に、文字切出部16に与えられる。フィ
ールドイメージ中の文字イメージは、文字切出部16に
よって1文字毎に切り出され、文字認識部17によって
逐次認識される。正しく認識された文字イメージは文字
コードに変換される。また、正しく認識されなかった文
字イメージは、不読文字としてリジェクトされ、「?」
の記号コードとこの不読文字に対応する複数の候補文字
の文字コードが出力される。これらの認識結果は、認識
結果メモリ18に格納される。
【0080】1フィールド内のすべての文字認識が完了
すると、フィールドメモリ15に格納されたフィールド
イメージと、認識結果メモリ18に格納された認識結果
が表示画面生成部19Cによって読み出され、確認・修
正用の画面情報が生成される。更に、入力イメージの表
示エリアの右側と下側に、スクロール制御用のスクロー
ル・バーが追加される。表示画面生成部19Cで生成さ
れた画面情報は表示メモリ20に格納され、図15
(b)に示すように、表示部21に表示される。
【0081】オペレータは、表示部21の表示画面によ
って入力イメージの表示範囲を確認する。図15(b)
に示すように、イメージが左下にずれている場合には、
右側のスクロール・バーをマウスでドラッグして、表示
イメージを上方に移動させる。更に、下側のスクロール
・バーをマウスでドラッグして、表示イメージを右側に
移動させ、入力イメージ中の文字が把握できる位置に移
動させる。更に、不読文字に対応する入力イメージを確
認し、提示された複数の候補文字の中から適切な文字を
マウスで選択したり、キーボードから正しい文字を入力
する。これにより、表示部21には、図15(c)に示
すような修正後の画面が表示される。
【0082】以上のように、この第9の実施形態のOC
Rは、入力部22からの操作に従って、入力イメージの
表示範囲を変更するフィールド範囲変更部43を有して
いる。これにより、例えば、文字の記入位置がずれた
り、斜めに傾斜して読み取られたような場合に、元の帳
票を確認する必要なく、読み取った画像イメージから入
力された文字を確認することが可能になり、認識結果の
確認・修正を迅速に行うことができる。
【0083】なお、本発明は、上記実施形態に限定され
ず、種々の変形が可能である。この変形例としては、例
えば、次の(a)〜(d)のようなものがある。
【0084】(a) 帳票の読み取りについて説明した
が、一般文書等の文字認識にも同様に適用できる。
【0085】(b) フィールド検出部13、文字切出
部16、修正処理部30等は、説明の都合上、個別の処
理部として説明したが、実際にはこれらの機能を備えた
プログラムに従って動作するコンピュータで構成するこ
とができる。
【0086】(c) 説明中に例示した入力イメージや
認識結果の表示色は一例であり、不読文字のイメージや
認識結果を容易に識別することができれば、どのような
色分けでも良い。
【0087】(d) 色分け表示、文字枠の追加表示、
拡大イメージの表示、及び入力イメージのスクロール表
示等を個別に説明したが、複数の表示方法を任意に組み
合わせて構成することができる。
【0088】
【発明の効果】以上詳細に説明したように、第1の発明
によれば、文字フィールドのイメージと認識手段の認識
結果を同一画面上に対比して表示する表示手段と、入力
部から与えられた修正データに基づいてこの表示手段に
表示されたイメージの表示形式を変更すると共に、認識
手段の認識結果を修正する修正手段とを有している。こ
れにより、修正対象の文字イメージを容易に特定するこ
とが可能になり、認識結果の確認・修正を確実かつ容易
に行うことができる。
【0089】第2の発明によれば、第1の発明中の表示
手段を、認識手段で正しく認識できなかった文字に対応
する文字フィールド中の文字イメージを、正しく認識で
きた文字とは異なる表示色で表示するように構成してい
る。これにより、修正対象の文字イメージを即座に特定
することができる。
【0090】第3の発明によれば、第1または第2の発
明中の表示手段を、認識手段で正しく認識できなかった
文字に対応する文字フィールド中の文字イメージに、文
字枠を付加して表示するように構成している。これによ
り、修正対象の文字イメージを即座に特定することがで
きる。
【0091】第4の発明によれば、第1または第2の発
明中の表示手段を、文字フィールド中のすべての文字イ
メージに文字枠を付加すると共に、認識結果の各文字及
び記号に文字枠を付加して表示するように構成してい
る。これにより、「空白」の位置を確実に特定すること
ができる。
【0092】第5の発明によれば、第4の発明中の表示
手段を、認識手段で正しく認識できなかった文字に対応
する文字フィールド中の文字に付加する文字枠を、正し
く認識できた文字に付加する文字枠とは異なる表示色で
表示するように構成している。これにより、「空白」の
位置を含めて、修正対象の文字イメージを即座に特定す
ることができる。
【0093】第6の発明によれば、第1〜第5の発明中
の修正手段を、修正データによって修正された文字のイ
メージの表示色及び認識結果の文字の表示色を変更する
ように構成している。これにより、修正済みと未修正の
文字を区別することができ、修正漏れ等を防止すること
ができる。
【0094】第7の発明によれば、第1〜第6の発明中
の表示手段を、文字フィールドのイメージと認識手段の
認識結果に加えて、この認識手段で正しく認識できなか
った文字イメージを拡大して同一画面上に表示するよう
に構成している。これにより、不読文字を正確に推測し
て修正することができる。
【0095】第8の発明によれば、第1〜第6の発明中
の表示手段を、文字フィールドのイメージと認識手段の
認識結果に加えて、この認識手段で正しく認識できなか
った文字イメージとその周辺部のイメージを拡大して同
一画面上に表示するように構成している。これにより、
不読文字の周囲のイメージが明瞭になり、更に正確に修
正することができる。
【0096】第9の発明によれば、第1〜第6の発明中
の表示手段を、文字フィールドのイメージと認識手段の
認識結果に加えて、この認識手段で正しく認識できなか
った文字イメージ及び文字枠とその周辺部のイメージを
拡大して同一画面上に表示するように構成している。こ
れにより、不読文字とその周囲のイメージの関係が明瞭
になり、更に正確に修正することができる。
【0097】第10の発明によれば、第1〜第9の発明
のOCRに、入力部から与えられた指示に基づいて表示
手段に表示されたイメージの表示範囲を一定の領域内で
変更する変更手段を設けている。これにより、文字フィ
ールドのイメージがずれたり傾いたりした場合に、イメ
ージの表示範囲を修正して正確なイメージに基づいて認
識結果の確認・修正を行うことができる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態を示すOCRの構成図
である。
【図2】従来のOCRの一例を示す構成図である。
【図3】図2のOCRにおける認識結果の表示例を示す
図である。
【図4】図1のOCRにおける認識結果の表示例を示す
図である。
【図5】本発明の第2の実施形態の表示例を示す図であ
る。
【図6】本発明の第3の実施形態を示すOCRの構成図
である。
【図7】図6のOCRにおける認識結果の表示例を示す
図である。
【図8】本発明の第4の実施形態の表示例を示す図であ
る。
【図9】本発明の第5の実施形態の表示例を示す図であ
る。
【図10】本発明の第6の実施形態を示すOCRの構成
図である。
【図11】図10のOCRにおける認識結果の表示例を
示す図である。
【図12】本発明の第7の実施形態の表示例を示す図で
ある。
【図13】本発明の第8の実施形態の表示例を示す図で
ある。
【図14】本発明の第9の実施形態を示すOCRの構成
図である。
【図15】図14のOCRの動作を説明するための図で
ある。
【符号の説明】
11 スキャナ 12 画像メモリ 13 フィールド検出部 14 帳票形式登録部 15 フィールドメモリ 16 文字切出部 17 文字認識部 18 認識結果メモリ 19A,19B,19C 表示画面生成部 20 表示メモリ 21 表示部 22 入力部 30 修正処理部 31 修正制御部 32 認識結果修正部 33 表示画面修正部 41 文字枠生成部 42 拡大画像生成部 43 フィールド範囲変更部
フロントページの続き Fターム(参考) 5B064 AA01 AB09 BA01 EA05 EA10 FA05 FA10 FA11 5E501 AA30 BA07 CA03 CB02 CB09 CB13 EB19 FA13 FA42 FB44

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 読み取り対象の文書を光学的に読み取っ
    て画像イメージを生成する読取手段と、 前記文書の形式情報が予め登録された登録手段と、 前記形式情報に基づいて前記画像イメージから複数の文
    字が記載された文字フィールドを検出する検出手段と、 前記検出手段で検出された文字フィールド中の複数の文
    字を認識し、各文字に対して正しく認識できたときには
    該当する文字コードを、正しく認識できないときには不
    読の旨の記号コードを出力する認識手段と、 前記文字フィールドのイメージと前記認識手段の認識結
    果を同一画面上に対比して表示する表示手段と、 入力部から与えられた修正データに基づいて前記表示手
    段に表示されたイメージの表示形式を変更すると共に、
    前記認識手段の認識結果を修正する修正手段とを、 備えたことを特徴とする文字認識装置。
  2. 【請求項2】 前記表示手段は、前記認識手段において
    正しく認識できなかった文字に対応する前記文字フィー
    ルド中の文字イメージを、正しく認識できた文字とは異
    なる表示色で表示するように構成したことを特徴とする
    請求項1記載の文字認識装置。
  3. 【請求項3】 前記表示手段は、前記認識手段において
    正しく認識できなかった文字に対応する前記文字フィー
    ルド中の文字イメージに、文字枠を付加して表示するよ
    うに構成したことを特徴とする請求項1または2記載の
    文字認識装置。
  4. 【請求項4】 前記表示手段は、前記文字フィールド中
    のすべての文字イメージに文字枠を付加すると共に、前
    記認識結果の各文字及び記号に文字枠を付加して表示す
    るように構成したことを特徴とする請求項1または2記
    載の文字認識装置。
  5. 【請求項5】 前記表示手段は、前記認識手段において
    正しく認識できなかった文字に対応する前記文字フィー
    ルド中の文字に付加する文字枠を、正しく認識できた文
    字に付加する文字枠とは異なる表示色で表示するように
    構成したことを特徴とする請求項4記載の文字認識装
    置。
  6. 【請求項6】 前記修正手段は、前記修正データによっ
    て修正された文字のイメージの表示色及び認識結果の文
    字の表示色を変更するように構成したことを特徴とする
    請求項1乃至5のいずれか1つに記載した文字認識装
    置。
  7. 【請求項7】 前記表示手段は、前記文字フィールドの
    イメージと前記認識手段の認識結果に加えて、該認識手
    段において正しく認識できなかった文字イメージを拡大
    して同一画面上に表示するように構成したことを特徴と
    する請求項1乃至6のいずれか1つに記載した文字認識
    装置。
  8. 【請求項8】 前記表示手段は、前記文字フィールドの
    イメージと前記認識手段の認識結果に加えて、該認識手
    段において正しく認識できなかった文字イメージとその
    周辺部のイメージを拡大して同一画面上に表示するよう
    に構成したことを特徴とする請求項1乃至6のいずれか
    1つに記載した文字認識装置。
  9. 【請求項9】 前記表示手段は、前記文字フィールドの
    イメージと前記認識手段の認識結果に加えて、該認識手
    段において正しく認識できなかった文字イメージ及び文
    字枠とその周辺部のイメージを拡大して同一画面上に表
    示するように構成したことを特徴とする請求項1乃至6
    のいずれか1つに記載した文字認識装置。
  10. 【請求項10】 前記入力部から与えられた指示に基づ
    いて前記表示手段に表示されたイメージの表示範囲を一
    定の領域内で変更する変更手段を設けたことを特徴とす
    る請求項1乃至9のいずれか1つに記載した文字認識装
    置。
JP2000320463A 2000-10-20 2000-10-20 文字認識装置 Withdrawn JP2002133367A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000320463A JP2002133367A (ja) 2000-10-20 2000-10-20 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000320463A JP2002133367A (ja) 2000-10-20 2000-10-20 文字認識装置

Publications (1)

Publication Number Publication Date
JP2002133367A true JP2002133367A (ja) 2002-05-10

Family

ID=18798744

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000320463A Withdrawn JP2002133367A (ja) 2000-10-20 2000-10-20 文字認識装置

Country Status (1)

Country Link
JP (1) JP2002133367A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005302011A (ja) * 2004-03-24 2005-10-27 Microsoft Corp スキャン・ドキュメントから電子フォームに取り込むための方法および装置
JPWO2006123633A1 (ja) * 2005-05-17 2008-12-25 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Maschines Corporation システム、方法及びコンピュータ・プログラム
JP2013130997A (ja) * 2011-12-21 2013-07-04 Kyocera Document Solutions Inc 画像形成装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005302011A (ja) * 2004-03-24 2005-10-27 Microsoft Corp スキャン・ドキュメントから電子フォームに取り込むための方法および装置
JP4676225B2 (ja) * 2004-03-24 2011-04-27 マイクロソフト コーポレーション スキャン・ドキュメントから電子フォームに取り込むための方法および装置
JPWO2006123633A1 (ja) * 2005-05-17 2008-12-25 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Maschines Corporation システム、方法及びコンピュータ・プログラム
JP4608541B2 (ja) * 2005-05-17 2011-01-12 インターナショナル・ビジネス・マシーンズ・コーポレーション システム、方法及びコンピュータ・プログラム
JP2013130997A (ja) * 2011-12-21 2013-07-04 Kyocera Document Solutions Inc 画像形成装置

Similar Documents

Publication Publication Date Title
JP3996579B2 (ja) 機械可読フォームのアクティブ領域を識別するためのフォーム処理システム
JP6569532B2 (ja) 管理システム、リスト作成装置、リスト作成方法、管理方法及び管理用プログラム
JP2835178B2 (ja) 文書読取装置
JP6921522B2 (ja) 画像処理装置及びその制御方法並びにプログラム
KR100351584B1 (ko) 한자의 일자대조에 의한 교정 시스템
JP7241506B2 (ja) 光学式文字認識結果の修正支援装置および修正支援用プログラム
JP2002133367A (ja) 文字認識装置
JP6325218B2 (ja) 文字認識結果検証装置及び文字読取システム
JP2016162211A (ja) 情報処理装置、制御方法及びプログラム
JP2002230480A (ja) 文字認識装置および文字認識結果修正方法
JP3540192B2 (ja) 光学文字読取用紙認識結果の確認修正方法およびその装置
JPH0388086A (ja) 文書読取装置
JP6743401B2 (ja) 帳票設計・読取設定支援装置、帳票設計・読取設定支援方法、及び、光学文字認識システム
JPH08137987A (ja) 光学式文字読取装置
JP2687902B2 (ja) 文書画像認識装置
JPH01292586A (ja) 文字認識支援装置
JPH05303661A (ja) イメージデータ部分取得表示装置
CN117556856A (zh) 基于编辑的二维码生成方法、电子设备及存储介质
JP2004341754A (ja) 文字認識結果修正装置及びその方法並びに文字認識結果修正プログラム
JP3221969B2 (ja) 文字認識装置
JP2001195541A (ja) 文字認識制御方法および装置
JP2006119942A (ja) 文字列領域切り出し装置
JP2008250817A (ja) 帳票自動識別装置
JP2001307020A (ja) 文字認識装置
JPH0927007A (ja) 文字認識装置及び方法

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20080108