JPH11338969A - 光学式文字読取装置 - Google Patents

光学式文字読取装置

Info

Publication number
JPH11338969A
JPH11338969A JP10147224A JP14722498A JPH11338969A JP H11338969 A JPH11338969 A JP H11338969A JP 10147224 A JP10147224 A JP 10147224A JP 14722498 A JP14722498 A JP 14722498A JP H11338969 A JPH11338969 A JP H11338969A
Authority
JP
Japan
Prior art keywords
entry
character
recognition result
memory
frame line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP10147224A
Other languages
English (en)
Inventor
Katsumi Fukuchi
克己 福地
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP10147224A priority Critical patent/JPH11338969A/ja
Publication of JPH11338969A publication Critical patent/JPH11338969A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 記入欄の枠線と文字が接触する場合でも正し
い認識結果を取得でき、その認識結果を外部に出力でき
る光学式文字読取装置を提供する。 【解決手段】 文字が記された記入欄の枠線と文字が接
触するのか否かを判定する判定手段を有し、帳票に同一
の内容が記される記入欄が帳票の中に複数存在する場合
に、前記判定手段によって枠線と文字が接触しない記入
欄を検出し、当該記入欄に記された文字の認識結果を外
部に出力できるようにする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、同一の内容が記さ
れる記入欄が複数存在する帳票の読取を可能とする光学
式文字読取装置(Optical Character Reader:以下、O
CRという)に関する。
【0002】
【従来の技術】例えば、OCRによって図2に示すよう
な帳票を読み取らせる場合がある。図2は帳票の構成を
示す図であり、ミシン目入りの切り取り線が設けられた
帳票を示している。このような帳票は、例えば銀行等の
金融機関で振込業務等に活用され、切り取り線で切り離
された一部(図中の左側の票)が振込先の取扱票として
取り扱われ、一部(図中の中央の票)が金融機関の受領
証として取り扱われ、一部(図中の右側の票)が振込人
の領収書として取り扱われる。なお、金額のような重要
な内容は、同一の内容が帳票に設けられた複数箇所(図
2の例では振込先の取扱票と金融機関の受領証に1箇所
づつ、合計2箇所)の記入欄に記される。
【0003】OCRは、このような帳票を読み取る場合
に、同一の内容が記される複数箇所(図2の例では2箇
所)の記入欄の内容を読み取って認識処理を行い、認識
結果を比較して、比較が一致した場合にのみ認識結果を
外部に出力し、一致しない場合は認識結果が不明である
として処理する。
【0004】
【発明が解決しようとする課題】しかしながら、OCR
は、記入欄の枠線と文字が接触する場合に、記入欄に記
入された文字をそれとは異なる文字として認識すること
がある。同一の内容が記された2箇所の記入欄の一方が
このように認識された場合、2箇所の記入欄の認識結果
の比較が一致しなくなる。この場合、OCRは、認識結
果が不明であるとして処理する。このような現象が、ど
のようにして起こるのかを図3〜6を用いて以下に説明
する。
【0005】図3と図4は、記入欄の枠線と記入欄に記
された文字の関係を示す図である。図3は、図2の左側
の票(振込先の取扱票)の記入欄(以下、第1の記入欄
という)を拡大して示すものであり、枠線と文字が接触
していない例を示している。図4は、図2の中央の票
(金融機関の受領証)の記入欄(以下、第2の記入欄と
いう)を拡大して示すものであり、枠線と文字が接触し
ている例を示している。図中、1は枠線、2は文字
「2」、3は枠線、4は枠線3と接触している文字
「2」である。図5と図6は、図4の枠線の除去前と除
去後の文字のイメージを示す図である。図中、5は枠線
3を除去した後の文字「2」のイメージである。
【0006】OCRは、第1と第2の2箇所の記入欄に
記載された文字2と文字4を認識処理するに当たり、図
3から枠線1を除去した文字のイメージ(文字「2」の
イメージ)と図4から枠線3を除去した文字のイメージ
(図6に示す文字5のイメージ)を抽出し、これらを図
示しない認識手段によって認識処理する。このとき、前
者は文字「2」と認識されるが、後者は文字「2」の最
下部の線が枠線とともに除去されるため文字「7」と認
識処理される。この場合、OCRは、2箇所の記入欄の
認識結果の比較が一致しなくなるので、認識結果が不明
であるとして処理する。
【0007】本発明は、このように記入欄の枠線と文字
が接触する場合でも正しい認識結果を取得でき、その認
識結果を外部に出力できる光学式文字読取装置を提供す
る。
【0008】
【課題を解決するための手段】上記課題を解決するため
に、本発明は、帳票に記された文字を読み取り、認識結
果を外部に出力する光学式文字読取装置において、文字
が記された記入欄の枠線と文字が接触するのか否かを判
定する判定手段を有し、同一の内容が記される記入欄が
帳票の中に複数存在する場合に、前記判定手段によって
枠線と文字が接触しない記入欄を検出し、当該記入欄に
記された文字の認識結果を外部に出力できることを特徴
とする。
【0009】
【発明の実施の形態】以下、本発明の実施の形態を説明
する。
【0010】<実施例の構成>図1は本発明の光学式文
字読取装置(以下、OCRという)の機能ブロックを示
す図である。
【0011】図中、10は帳票であり、11は光電変換
部、12はAD変換回路、13は2値化回路、14はイ
メージメモリ、15は枠線除去部、16はパターンメモ
リ、17は文字認識部、18は第1の記入欄の認識結果
を格納するメモリ、19は第2の記入欄の認識結果を格
納するメモリ、20は第1の記入欄の枠線と文字の接触
状態を示すフラグを格納するメモリ、21は第2の記入
欄の枠線と文字の接触状態を示すフラグを格納するメモ
リである。なお、帳票10は、同一の内容が記された記
入欄が複数設けられた帳票である。本実施例では、図2
に示すように、同一の内容が記された記入欄が2箇所設
けられた帳票を例にして説明する。
【0012】<実施例の動作>本実施例のOCRは、あ
らかじめ、帳票の種類と帳票のフォーマットが対応付け
られて図示しない記憶手段に記憶されている。この帳票
のフォーマットには、同一の内容が記された記入欄がど
の位置に存在するのかを特定する情報が含まれる。この
情報は、例えば、帳票10の同一の内容が記された2箇
所の記入欄の位置は帳票10に設けられた左上の角の基
点(図2における太線と太線が交わる部分)から「下に
○○ミリ〜○○ミリ、右に○○ミリ〜○○ミリ」および
「下に××ミリ〜××ミリ、右に××ミリ〜××ミリ」
に存在する、旨を示すように設定されている。
【0013】以下に、本実施例のOCRが、どのように
して帳票10を読み取るのかを説明する。
【0014】まず、オペレータが帳票10をOCRの図
示しない搬送機構にセットする。続いて、オペレータが
OCRの図示しない入力手段によって読み取るべき帳票
の種類が帳票10である旨を入力して読み取り開始を入
力する。
【0015】これにより、OCRは、前述の記憶手段か
ら帳票の種類に対応する帳票のフォーマットを読み出
す。
【0016】続いて、OCRは、図示しない光源によっ
て帳票10に光を照射しながら、搬送機構によって帳票
10を光電変換部11の光軸に対して垂直の方向に搬送
する。帳票10に照射された光は帳票10の表面で反射
する。光電変換部11は、帳票10の表面で反射した光
を検知し、電気信号に変換してAD変換回路12に出力
する。AD変換回路12は電気信号をAD変換して2値
化回路13に出力する。2値化回路13はその信号を2
値化してイメージメモリ14に出力し、イメージメモリ
14はその信号を格納する。イメージメモリ14に格納
される信号は帳票10の全体の画像を示すデータであ
る。
【0017】次に、枠線除去部15は、記憶手段から読
み出した帳票10のフォーマットから、帳票10の同一
の内容が記された2箇所の記入欄の位置、すなわち、帳
票10の左上の角に設けられた基点から「下に○○ミリ
〜○○ミリ、右に○○ミリ〜○○ミリ」および「下に×
×ミリ〜××ミリ、右に××ミリ〜××ミリ」とする位
置を特定する。
【0018】その後、枠線除去部15は、イメージメモ
リ14に格納された帳票10の全体の画像の中から、帳
票10の同一の内容が記された2箇所の記入欄の画像を
読み出す。2箇所の記入欄の画像は例えば図3や図4の
ようになっている。図3は、図2の左側の票(振込先の
取扱票)の記入欄(以下、第1の記入欄という)のイメ
ージを示す図である。また、図4は、図2の中央の票
(金融機関の受領証)の記入欄(以下、第2の記入欄と
いう)のイメージを示す図である。図3や図4に示すよ
うに2箇所の記入欄の画像には枠線が含まれている。そ
こで、枠線除去部15は2箇所の記入欄の画像から枠線
部分を除去したイメージデータを作成してパターンメモ
リ16に出力する。
【0019】例えば、第1の記入欄を処理する場合、枠
線除去部15は、枠線を含む文字のイメージデータをイ
メージメモリ14から読み出し、枠線部分を除去したイ
メージデータ(すなわち、正常な文字「2」のイメージ
データ)を作成してパターンメモリ16に出力する。ま
た、第2の記入欄を処理する場合、枠線除去部15は、
枠線を含む文字のイメージデータ(すなわち、図5に示
すイメージデータ)をイメージメモリ14から読み出
す。そして、枠線部分を除去したイメージデータ(すな
わち、図6に示すイメージデータ)を作成してパターン
メモリ16に出力する。パターンメモリ16はこれらイ
メージデータを格納する。
【0020】なお、このとき、枠線除去部15は、第1
の記入欄と第2の記入欄の枠線が文字と接触しているの
か否かを判定する。この判定は、例えば図7や図8に示
すように、水平方向に記入欄周辺の画素のヒストグラム
をとることにより行われる。図7は第1の記入欄の枠線
と文字の関係を示す図であり、図8は第2の記入欄の枠
線と文字の関係を示す図である。図7に示すように、第
1の記入欄は、枠線1と文字2が非接触な状態になって
いるので、枠線1の部分と文字2の部分のヒストグラム
が所定間隔以上、分離した状態になる。また、図8に示
すように、第2の記入欄は、枠線3と文字4が接触した
状態になっているので、枠線3の部分と文字4の部分の
ヒストグラムが接合した状態になる。枠線除去部15
は、これら記入欄周辺の画像のヒストグラムが分離した
状態になるのか否かを識別することによって、枠線が文
字と接触しているのか否かを判定する。
【0021】その後、枠線除去部15は、枠線と文字の
接触状態を示すフラグをメモリ20または21に出力す
る。この出力先は第1の記入欄を認識処理したときはメ
モリ20であり、第2の記入欄を認識処理したときはメ
モリ21である。例えば、第1の記入欄を処理する場
合、枠線除去部15は、枠線と文字の接触状態を示すフ
ラグとして「非接触」を示すコードをメモリ20に出力
する。また、第2の記入欄を処理する場合、枠線除去部
15は、枠線と文字の接触状態を示すフラグとして「接
触」を示すコードをメモリ21に出力する。メモリ20
または21はこれらフラグを格納する。
【0022】次に、文字認識部17は、パターンメモリ
16に格納された文字のイメージデータを認識処理す
る。文字認識部17は、第1の記入欄に記された文字を
認識処理した場合はその認識結果をメモリ18に出力
し、第2の記入欄に記された文字を認識処理した場合は
その認識結果をメモリ19に出力する。メモリ18また
は19はこれら認識結果を格納する。本実施例の場合、
メモリ18は文字2の認識結果「2」を格納し、メモリ
19は文字4の認識結果「7」を格納する。
【0023】次に、結果判定部22は、以下に示す
(1)〜(4)に場合分けして、判定処理を行う。
【0024】(1)メモリ20、21に格納されたフラ
グが両方とも「非接触」の場合は、メモリ18の認識結
果とメモリ19の認識結果を比較し、両方の認識結果が
一致していれば、その認識結果を外部に出力する。一致
していなければ、認識結果が不明であることを外部に出
力する。
【0025】(2)メモリ20に格納されたフラグが
「非接触」で、メモリ21に格納されたフラグが「接
触」の場合は、メモリ18の認識結果が「2」であれ
ば、認識結果「2」を外部に出力する。メモリ18の認
識結果が「2」でなければ、枠線の下部と文字の下部が
重なっている可能性があるので、正しい認識結果を取得
するために以下のように処理する。すなわち、メモリ1
8の認識結果とメモリ19の認識結果を比較し、両方の
認識結果が一致していれば、その認識結果を外部に出力
する。一致していなければ、認識結果が不明であること
を外部に出力する。
【0026】(3)メモリ20に格納されたフラグが
「接触」で、メモリ21に格納されたフラグが「非接
触」の場合は、メモリ19の認識結果が「2」であれ
ば、認識結果「2」を外部に出力する。メモリ19の認
識結果が「2」でなければ、枠線の下部と文字の下部が
重なっている可能性があるので、正しい認識結果を取得
するために以下のように処理する。すなわち、メモリ1
8の認識結果とメモリ19の認識結果を比較し、両方の
認識結果が一致していれば、その認識結果を外部に出力
する。一致していなければ、認識結果が不明であること
を外部に出力する。
【0027】(4)メモリ20、21に格納されたフラ
グが両方とも「接触」の場合は、メモリ18の認識結果
とメモリ19の認識結果のどちらかが「2」であれば、
認識結果「2」を外部に出力する。メモリ18の認識結
果とメモリ19の認識結果の両方とも「7」であれば、
認識結果が不明であることを外部に出力する。
【0028】なお、本実施例は、メモリ20に格納され
たフラグが「非接触」であり、メモリ21に格納された
フラグが「接触」、メモリ18の認識結果が「2」、メ
モリ19の認識結果が「7」である。したがって、前記
の(2)に該当する。そのため、結果判定部22は認識
結果として「2」を外部に出力する。
【0029】以上、本発明を詳述したが、本発明は、本
実施例に限定されることなく、本発明の要旨を逸脱しな
い範囲で種々の応用及び変形が考えられる。例えば、本
実施例では、文字「2」と文字「7」の場合を例にして
説明したが、文字「L」と文字「1」のように、他の文
字の場合にも応用することができる。また、本実施例で
は、枠線の下部と文字の下部が接触する場合を例にして
説明したが、枠線と文字が下部以外の部分で接触する場
合にも応用することができる。さらに、本実施例では、
同一の内容が記された記入欄が2箇所存在する場合を例
にして説明したが、3箇所以上存在する場合にも応用す
ることができる。また、本実施例では、オペレータが図
示しない入力手段によって読み取るべき帳票の種別を入
力することによって同一の内容が記された記入欄の位置
を特定するようにしているが、帳票に帳票の種別を示す
情報等を付し、OCRがこの情報等を読み取ることによ
って同一の内容が記された記入欄の位置を特定するよう
に変形することができる。
【0030】
【発明の効果】以上、説明したように、本発明は、記入
欄の枠線と文字が接触する場合でも正しい認識結果を取
得でき、その認識結果を外部に出力できる。
【図面の簡単な説明】
【図1】本発明の光学式文字読取装置の機能ブロックを
示す図である。
【図2】帳票の構成を示す図である。
【図3】記入欄の枠線と記入欄に記された文字の関係を
示す図である。
【図4】記入欄の枠線と記入欄に記された文字の関係を
示す図である。
【図5】枠線の除去前の文字のイメージを示す図であ
る。
【図6】枠線の除去後の文字のイメージを示す図であ
る。
【図7】枠線と文字の関係を示す図である。
【図8】枠線と文字の関係を示す図である。
【符号の説明】
11 光電変換部 12 AD変換回路 13 2値化回路 14 イメージメモリ 15 枠線除去部 16 パターンメモリ 17 文字認識部 18 第1の記入欄の認識結果を格納するメモリ 19 第2の記入欄の認識結果を格納するメモリ 20 第1の記入欄の枠線と文字の接触状態を格納する
メモリ 21 第2の記入欄の枠線と文字の接触状態を格納する
メモリ

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 帳票に記された文字を読み取り、認識結
    果を外部に出力する光学式文字読取装置において、 文字が記された記入欄の枠線と文字が接触するのか否か
    を判定する判定手段を有し、 同一の内容が記される記入欄が帳票の中に複数存在する
    場合に、前記判定手段によって枠線と文字が接触しない
    記入欄を検出し、当該記入欄に記された文字の認識結果
    を外部に出力できることを特徴とする光学式文字読取装
    置。
JP10147224A 1998-05-28 1998-05-28 光学式文字読取装置 Withdrawn JPH11338969A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10147224A JPH11338969A (ja) 1998-05-28 1998-05-28 光学式文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10147224A JPH11338969A (ja) 1998-05-28 1998-05-28 光学式文字読取装置

Publications (1)

Publication Number Publication Date
JPH11338969A true JPH11338969A (ja) 1999-12-10

Family

ID=15425388

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10147224A Withdrawn JPH11338969A (ja) 1998-05-28 1998-05-28 光学式文字読取装置

Country Status (1)

Country Link
JP (1) JPH11338969A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10796143B2 (en) 2017-03-16 2020-10-06 Fuji Xerox Co., Ltd. Information processing apparatus, information processing system, and non-transitory computer readable medium

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10796143B2 (en) 2017-03-16 2020-10-06 Fuji Xerox Co., Ltd. Information processing apparatus, information processing system, and non-transitory computer readable medium

Similar Documents

Publication Publication Date Title
JP2553608B2 (ja) 光学文字読取装置
JPH11338969A (ja) 光学式文字読取装置
JP2000029983A (ja) 文書読取装置
JPS5949671A (ja) 光学的文字読取装置
JPH11184965A (ja) 帳票識別登録装置
JP4580520B2 (ja) 文字認識方法および文字認識装置
JPS5836391B2 (ja) 光学的文字読取装置
JPS6074094A (ja) 文字認識装置
JP2768814B2 (ja) 光学的文字読取装置
JP2925275B2 (ja) 光学的文字読取装置
JP3191265B2 (ja) 画像入力装置およびその画像入力制御方法
KR100447140B1 (ko) 지문 특징 데이터 저장 장치 및 방법
JPS63137383A (ja) 文字読取装置
JPH0744682A (ja) 画像読取装置
JPH05274473A (ja) 光学的文字読取装置
JPS62267890A (ja) 図形認識装置
JPS63120387A (ja) 光学文字読取装置
JPH02195430A (ja) 文字切出回路
JPH0652351A (ja) 光学的文字読取装置
JPH0272497A (ja) 光学的文字読取装置
JPH10254981A (ja) 画像処理装置
JPH0478981A (ja) 光学的文字読取装置
JPH01199285A (ja) 光学的文字読取装置
JPH01166167A (ja) 投票券払戻装置
JPS63251874A (ja) 接触文字の切り出し方法

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20050802