JPH03122786A - 光学的文字読取装置 - Google Patents

光学的文字読取装置

Info

Publication number
JPH03122786A
JPH03122786A JP1258772A JP25877289A JPH03122786A JP H03122786 A JPH03122786 A JP H03122786A JP 1258772 A JP1258772 A JP 1258772A JP 25877289 A JP25877289 A JP 25877289A JP H03122786 A JPH03122786 A JP H03122786A
Authority
JP
Japan
Prior art keywords
character
pattern
frame
entry frame
contact
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1258772A
Other languages
English (en)
Other versions
JP2877380B2 (ja
Inventor
Toyoshi Sato
佐藤 豊志
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP1258772A priority Critical patent/JP2877380B2/ja
Publication of JPH03122786A publication Critical patent/JPH03122786A/ja
Application granted granted Critical
Publication of JP2877380B2 publication Critical patent/JP2877380B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、帳票に設けられた非ドロップアウトカラーに
よる文字記入枠内に記入された文字の読取りを行なう光
学的文字読取装置に関する。
(従来の技術) 一般に、帳票に記入された文字を読取る光学的文字読取
装置においては、帳票に設けられた文字記入位置を示す
枠内を文字読取りの対象としている。帳票に設けられた
文字記入位置を示す枠(文字記入枠)が黒い枠(非ドロ
ツプアウトカラ)によって印刷等がされている場合、文
字記入枠内に記入する文字が枠に接触したり、はみ出さ
ないことが文字記入条件となっている。
近年では、第2図に示す払込通知票のような、一般の人
によって文字が記録される帳票を、光学的文字読取装置
によって読取りを行なう場合が増えてきている。しかし
ながら、一般の人によって文字の記入が行われるため、
文字が文字記入枠へ接触したり、はみ出して記入される
場合が非常に多くなっている。このような文字が正確に
記入されない場合であっても、そのまま文字認識処理が
実行されてしまう。このため、正確に文字記入枠内に記
入されない文字については、文字認識率が大きく低下し
てしまうことがあった。特に、払込通知票等における口
座番号や、金額等の数字文字データについて誤読すると
大きな問題が生じてしまう。
(発明が解決しようとする課題) このように、帳票に設けられた文字記入枠内に記入され
た文字が、枠に接触したり、はみ出しているような場合
には、文字認識率が低下してしまうという問題があった
本発明は前記のような点に鑑みてなされたもので、文字
記入枠に記入された文字か、枠に接触・はみ出している
ような場合であっても、好適な文字読取り結果を得るこ
とが可能な光学的文字読取装置を提供することを目的と
する。
[発明の構成コ (課題を解決するための手段) 本発明は、帳票の文字記入枠内に記入された文字の前記
文字記入枠に対する接触・はみ出し状態を検出する接触
・はみ出し状態検出手段と、この接触・はみ出し状態検
出手段によって接触・はみ出しが検出された文字につい
て、接触・はみ出した部分を除いた前記文字記入枠内に
存在する部分文字パターンを検出する文字パターン検出
手段と、読取りの対象とする複数の文字毎に、文字記入
枠への接触・はみ出しによって形成される部分文字パタ
ーンの文字認識処理に用いられる標準文字パターンを格
納するための辞書格納手段と、接触・はみ出し状態検出
手段によって検出された文字の前記文字記入枠に対する
接触・はみ出し状態に応じて、辞書格納手段に格納され
た標帛パターンを読出し、文字パターン検出手段によっ
て検出された前記部分文字パターンについて文字認識処
理を行なう文字認識処理手段とを具備して構成するもの
である。
さらに、接触・はみ出し状態は、文字記入枠の上下左右
の各方向に対する文字の接触・はみ出し数によって示し
、標準パターンは文字記入枠の上下左右の各方向におけ
る接触・はみ出し数毎にそれぞれ対応して辞書格納手段
に格納されるようにするものである。
(作用) このような構成によれば、文字記入枠に接触・はみ出し
で記入された文字については、辞書格納部に格納された
一般の標準文字パターンと異なった接触・はみ出して記
入された文字用の特定の標準文字パターンを用いて文字
認識処理が実行される。また、接触・はみ出して記入さ
れた文字用の標準文字パターンは、読取り対象とする文
字のそれぞれについて辞書格納部に格納されるため、文
字記入枠への接触・はみ出しによって形成される部分文
字パターンが、他の文字に類似するような場合であって
も、少なくとも誤読することを防ぐ(リジェクトさせる
)ことができる。
(実施例) 以下、図面を参照して本発明の一実施例を説明する。第
1図は同実施例に係わる光学的文字読取装置における文
字認識処理を行なう機能部分の構成を示すブロック図で
ある。同図において、+1は帳票から光学的に読み取っ
た文字行−荷分の2値化パターンを格納するためのライ
ンバッファである。ラインバッファHには、文字切出し
回路12、及び文字認識回路13が接続されている。文
字認識回路12は、ラインバッファIIに格納された文
字行−持分の2値化パターンから、1文字分の文字パタ
ーンを検出するものである。文字認識回路13は、文字
切出し回路I2によって検出された文字パターンについ
て、辞書メモリ14に格納された標章パターンをもとに
、1文字毎に文字認識処理を行なうものである。辞書メ
モリ14には、文字記入枠への接触・はみ出しがないよ
うに記入された文字の文字パターンを認識するための標
準パターンをはじめ、接触・はみ出しによる部分文字パ
ターン(文字記入枠内に存在するパターン)を認識する
ための(票準パターンが文字記入枠への接触・はみ出し
状態毎に格納されている。
次に、同実施例の動作を説明する。
ここでは、第2図に示すような帳票を文字読取り処理の
対象とするものとする。まず、第2図に示す帳票につい
て、スキャナ装置等において光学的に走査を行ない、帳
票イメージの検出を行なう。
帳票イメージが検出されると、予め設定された読取制御
情報に基づいて、文字読取り処理の対象とする領域(行
)のイメージが検出される。なお、読取り制御情報に基
づいて実行される処理については説明を省略する。第2
図に示す帳票の場合、データ行(口座番号、金額が記入
される行)の行イメージが検出され、図中Aのデータラ
インを介して、ラインバッファ11に転送される。ライ
ンはバッファ11に1行分のイメージデータか転送され
ると、図示せぬ回路(例えば装置全体の制御を司る制御
回路)から図中Bの制御ラインを介して、文字切出し回
路12に対して文字切出し開始信号が与えられる。文字
切出し回路12は、文字切出し開始信号を入力すると、
図中Cのデータラインを介してラインバッファ11を走
査して、1文字分の文字パターンの検出を行なう。文字
切出し回路12は、次のようにして文字パターンの検出
を行なう。まず、ラインバッファ11に格納された1行
分のイメージパターンから、第3図に示すように、水平
(X方向)・垂直(Y方向)のそれぞれの方向別ヒスト
グラムを求め、この方向別ヒストグラムをもとに文字記
入枠の抽出を行なう。文字記入枠の判別は、X方向、Y
方向のそれぞれのヒストグラムにおいて、ヒストグラム
値があるスライスレベル以上であり、尚且つそのヒスト
グラムの座標が、予め想定された枠サイズを示すピッチ
(例えば読取制御情報によって与えられる)の誤差範囲
内であるか否かによって行なう。文字記入枠の抽出が終
了すると、文字切出し回路12は、上下左右のそれぞれ
の文字記入枠線と文字パターン(文字線)とか交差(接
触)している数(接触・はみ出しクリップ数)を第4図
に示すようにして求める。ここでは、左側文字枠線に対
しての接触・はみ出しクリップ数を(L)、同様にして
右側(R)、上側(T)、下側(B)とする。第4図は
、数字「0」が左側文字枠線に対してはみ出している例
を示すものである。接触・はみ出しクリップ数の検出方
法は、例えば各文字記入枠線の内側(文字側)の1ビツ
トを走査して、白ビット(例えば“0″)から黒ビット
(例えば・1”)に変化する変化点数を求める。第4図
においては、CI。
C2において白から黒に変化していることか検出され、
変化点数−2が左側文字記入枠線の接触・はみ出しクリ
ップ数(L)となる。こうして、第4図に示す数字「0
」の接触・はみ出しクリップ数は、(L)−2、(R)
−0、(T)−0、(B)−0となる。次に、文字切出
し回路12は、文字記入枠のパターンを除去し、文字記
入枠内に位置する文字パターン(部分文字パターン)を
抽出する。こうして得られた文字パターン(部分文字パ
ターン)は、データラインCを介して文字認識回路13
に転送される。ただし、文字記入枠にり1する接触・は
み出しのない文字パターンについては、通常の文字パタ
ーンが転送されることになる。
また、文字切出し回路12は、文字記入枠における接触
・はみ出しクリップ数を、部分文字パターン(文字パタ
ーン)の付加情報として文字認識回路13に転送すると
共に、信号ラインDを介して文字認識処理の開始を指示
する認識開始信号を出力する。文字認識回路13は、文
字切出し回路12かろの認識開始信号を入力すると、デ
ータラインCを介して入力した文字パターン(部分文字
パターン)について、辞書メモリ14に予め格納された
読取りの対象とする各文字についての標準パターンとの
照合を行なうことによって文字認識処理を行なう。
文字認識処理に用いられる辞書メモリ14には、第5図
に示すように、辞書エントリポイントが設定され、標章
パターンが格納されている。第5図は、数字の文字パタ
ーンを認識するために用いられる辞書のエントリポイン
トを示すものである。すなわち、辞書メモリ14には、
読取りの対象とする文字のそれぞれについて、各文字記
入枠線への接触・はみ出しクリップ数の組(接触・はみ
出し状態)毎に辞書エントリポイントが設定され、接触
・はみ出し状態に応じた標準パターンが格納される。
例えば、数字「0」の文字パターンを認識するための認
識辞書は、上下左右の文字記入枠への接触・はみ出しか
ないパターン用の辞書(L−0,R−O,T−0,B−
0) 、左側文字記入枠線のみにクリップ数−2ではみ
出したパターン(第4図に示すようなパターン)用辞書
(L−2,R−0゜T−0,B−0) 、下側文字記入
枠線のみにクリップ数−2ではみ出したパターン用辞書
(L−0゜R−0,T−0,B−2) 、及び前記条件
を満足しないその他のパターン用辞書(L−*、R−*
T−*、B−*)で構成されている。同様に、他の文字
についても、各文字によって可能性のある接触・はみ出
し状態毎に辞書が構成される。
文字認識回路13は、認識対象とする文字パターン(部
分文字パターン)の付加情報として入力した接触・はみ
出しクリップ数に応じた辞書エントリポイントによって
示される辞書(標準パターン)を辞書メモリ14から呼
出し、文字パターンと照合を行なうことによって文字を
認識する。こうして文字認識結果(文字コード)が得ら
れると、文字認識回路13は、この認識結果をデータラ
インEへ出力する。さらに、文字認識回路13は、1文
字分の文字認識が終了すると、信号ラインFを介して、
1文字認識回路信号を文字切出し回路12に出力する。
これによって、文字切出し回路12は、ラインバッファ
11に格納されたイメージから、次の文字認識処理の対
象とする文字パターンの切出しを開始する。
以下同様な処理を繰り返して、各文字記入枠内に存在す
る文字パターン(部分文字パターン)を切出して、文字
認識処理を行なう。
ここで、文字認識処理の一例について説明する。
第2図中の(a)の文字記入枠における文字パターンは
、下側枠線をクリップ数=2ではみ出しているため(第
3図参照)、文字切出しの際の枠パターン除去によって
第6図(a)のような部分文字パターンとなる。このよ
うな部分文字パターンについても、辞書メモリ14に文
字パターンの下部が欠けた文字パターン用の辞書が格納
されていれば数字「6」であると認識することかできる
。また、第2図中(b)の文字記入枠内における文字パ
ターンは、左側枠線をクリップ数−3ではみ出している
ため、文字切出しの際の枠パターン除去によって第6図
(b)のような部分文字パターンとなる。この部分文字
パターンは、数字「3」と類似しているが、左側文字枠
へのクリップ数−3の辞書(数字「8」用の辞書として
用意される)を用いて文字認識処理されるので、少なく
ともリジェクトして数字「3」に誤読されることを防ぐ
ことができる(ただし、数字「3」用の辞書に左側文字
枠へのクリップ数−3の辞書が用意されていない場合)
。同様に、第2図中(c)の文字記入枠における文字パ
ターンは、枠パターン除去によって第6図(c)のよう
な部分文字パターンとなるが、この部分文字パターン用
の辞書を用意することによって、数字「7」に誤読され
ることを防ぐことができる。なお、第2図中(d)の文
字記入枠における部分文字パターンは、図中に示すよう
なりリップによって他と間違い易い相手文字か無い。こ
のため、特にクリップして得られる部分文字パターン用
の辞書を用意する必要がなく、−船釣な数字「5」用の
辞書を用いて文字認識回路を行なうようにすれば良い。
また、数字「3」も同様に、左側文字枠ヘクリップした
場合であっても、他と間違い易い相手文字が無いため、
 QX的な数字「3」用の辞書を用いて文字認識処理を
行なうようにすれば良い。これより、左側枠線をクリッ
プ数−3ではみだした数字「8」の部分文字パターンに
ついて文字認識を行なう場合に、数字「3」用の辞書が
選択されない。
このようにして、文字記入枠への接触・はみ出し方向、
及びクリップ数羽に、部分文字パターンについての文字
認識処理に用いられる認識辞書(標準パターン)を用意
することにより、帳票に記入された文字が文字記入枠(
黒枠等の非ドロップアウトカラー)に接触・はみ出して
いる場合であっても、部分文字パターン用の認識辞書を
用いて対処するので、少なくとも誤読することを防ぐこ
とができる。
また、従来、非ドロップアウトカラーによる文字記入枠
に接触・はみ出した文字パターンを切り出すことが困難
であるために、文字記入枠はドロップアウトカラーによ
って印刷等されていた。しかしながら、本発明では、文
字記入枠に対する接触・はみ出しによる部分文字パター
ンについて認識処理を実行することができる。従って、
文字記入枠を必ずしもドロップアウトカラーにする必要
がないため、これに応じた特定の光源を用いる必要がな
く、一つの光源を用いて帳票のイメージを検出し、文字
認識を行なうことができる。
[発明の効果] 以上のように本発明によれば、帳票に設けられた文字記
入枠に接触・はみ出して記入された文字の文字パターン
(部分文字パターン)について文字認識処理を行なうた
めの辞書を接触・はみ出し状態毎に用意しているので、
文字が枠に接触・はみ出している場合であっても、この
辞書を用いて文字認識処理を行なうことにより、好適な
文字読取り結果を得ることができるものである。
【図面の簡単な説明】
第1図は本発明の一実施例に係わる光学的文字読取装置
における文字認識処理を行なう機能部分の構成を示すブ
ロック図、第2図は文字読取処理の対象とする帳票の一
例を示す図、第3図は文字記入枠抽出の処理を説明する
ための図、第4図は文字記入枠に対する文字パターンの
接触・はみ出しクリップ数を求める処理を説明するため
の図、第5図は各文字の接触・はみ出しクリップ数と辞
書エントリポイントとの対応を示す図、第6図は部分文
字パターンの一例を示す図である。 11・・・ラインバッファ、12・・・文字切出し回路
、I3・・−文字認識回路、14・・・辞書メモリ第1

Claims (2)

    【特許請求の範囲】
  1. (1)帳票に設けられた文字記入枠内に記入された文字
    の読取りを行なう光学的文字読取装置において、 前記帳票の文字記入枠内に記入された文字の前記文字記
    入枠に対する接触・はみ出し状態を検出する接触・はみ
    出し状態検出手段と、 前記接触・はみ出し状態検出手段によって接触・はみ出
    しが検出された文字について、接触・はみ出した部分を
    除いた前記文字記入枠内に存在する部分文字パターンを
    検出する文字パターン検出手段と、 読取りの対象とする複数の文字のそれぞれについて、文
    字記入枠への接触・はみ出しによって形成される部分文
    字パターンの文字認識処理に用いられる標準文字パター
    ンを、前記接触・はみ出し状態毎に格納するための辞書
    格納手段と、 前記接触・はみ出し状態検出手段によって検出された文
    字の前記文字記入枠に対する接触・はみ出し状態に応じ
    て、前記辞書格納手段に格納された標準パターンを読出
    し、前記文字パターン検出手段によって検出された前記
    部分文字パターンについて文字認識処理を行なう文字認
    識処理手段と、を具備したことを特徴とする光学的文字
    読取装置。
  2. (2)前記接触・はみ出し状態は、前記文字記入枠の上
    下左右の各方向に対する文字の接触・はみ出し数によっ
    て示し、前記標準パターンは、前記文字記入枠の上下左
    右の各方向における接触・はみ出し数毎にそれぞれ対応
    して前記辞書格納手段に格納されることを特徴とする第
    1請求項記載の光学的文字読取装置。
JP1258772A 1989-10-05 1989-10-05 光学的文字読取装置 Expired - Lifetime JP2877380B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1258772A JP2877380B2 (ja) 1989-10-05 1989-10-05 光学的文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1258772A JP2877380B2 (ja) 1989-10-05 1989-10-05 光学的文字読取装置

Publications (2)

Publication Number Publication Date
JPH03122786A true JPH03122786A (ja) 1991-05-24
JP2877380B2 JP2877380B2 (ja) 1999-03-31

Family

ID=17324870

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1258772A Expired - Lifetime JP2877380B2 (ja) 1989-10-05 1989-10-05 光学的文字読取装置

Country Status (1)

Country Link
JP (1) JP2877380B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003099708A (ja) * 2001-09-21 2003-04-04 Toshiba Corp 文字認識装置、区分機、文字認識方法及び区分方法
JP2012185713A (ja) * 2011-03-07 2012-09-27 Mitsubishi Electric Corp 帳票文字認識装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003099708A (ja) * 2001-09-21 2003-04-04 Toshiba Corp 文字認識装置、区分機、文字認識方法及び区分方法
JP2012185713A (ja) * 2011-03-07 2012-09-27 Mitsubishi Electric Corp 帳票文字認識装置

Also Published As

Publication number Publication date
JP2877380B2 (ja) 1999-03-31

Similar Documents

Publication Publication Date Title
US4481665A (en) Character segmentation method
JPS63158678A (ja) 単語間スペ−ス検出方法
KR100383858B1 (ko) 문자인식장치의 문자추출방법 및 장치
IL98293A (en) A method for distinguishing between text and graphics
JP5041775B2 (ja) 文字切出方法及び文字認識装置
JPH03122786A (ja) 光学的文字読取装置
JP3268552B2 (ja) 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置
JP3794285B2 (ja) 光学式文字読取装置
JP2630261B2 (ja) 文字認識装置
JPH0991385A (ja) 文字認識辞書追加方法及びこれを用いた端末ocr装置
JP2868392B2 (ja) 手書き記号認識装置
JP2001291058A (ja) 文字認識装置及び記録媒体
JP2925270B2 (ja) 文字読取装置
JPS6160184A (ja) 光学的文字読取装置
JP2778436B2 (ja) 文字切り出し装置
JP2002074269A (ja) 文字認識方法
JPH03282895A (ja) 光学的文字読取装置
JPH0632074B2 (ja) 正規化方法
JPH10233930A (ja) 画像処理装置
JPS62295192A (ja) 光学文字画像読取装置
JPH08101886A (ja) 文字認識装置
JPH0535921A (ja) 文字照合装置及びそのための方法
JPH1040338A (ja) 光学式文字読取装置
JPH06301814A (ja) 文字読取装置
JPH01237778A (ja) 文字認識方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080122

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090122

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100122

Year of fee payment: 11

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100122

Year of fee payment: 11