JP2010191724A - 画像処理装置および制御プログラム - Google Patents

画像処理装置および制御プログラム Download PDF

Info

Publication number
JP2010191724A
JP2010191724A JP2009035945A JP2009035945A JP2010191724A JP 2010191724 A JP2010191724 A JP 2010191724A JP 2009035945 A JP2009035945 A JP 2009035945A JP 2009035945 A JP2009035945 A JP 2009035945A JP 2010191724 A JP2010191724 A JP 2010191724A
Authority
JP
Japan
Prior art keywords
character
image
stroke
print
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009035945A
Other languages
English (en)
Inventor
Takaaki Akiyama
孝明 秋山
Tetsuji Sakaguchi
鉄次 坂口
Masayuki Okamoto
正行 岡本
Keiichiro Shirai
啓一郎 白井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Shinshu University NUC
Original Assignee
Seiko Epson Corp
Shinshu University NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp, Shinshu University NUC filed Critical Seiko Epson Corp
Priority to JP2009035945A priority Critical patent/JP2010191724A/ja
Publication of JP2010191724A publication Critical patent/JP2010191724A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

【課題】文字色が様々であったり、印刷文字に手書き文字あるいは手書き図形が重なっている場合でも、良好に文字認識処理を行う。
【解決手段】画像処理装置は、入力画像から印刷文字の文字列が含まれる画像領域を特定し、一つの印刷文字の周囲に余白を形成可能な大きさの文字枠を用いて、特定した画像領域から前記一つの印刷文字が含まれると推定される領域を切り出し、文字枠に接触するストロークを検出し、当該ストロークと一連とみなせるストローク群を抽出し、このストローク群のうち印刷文字と重なっていると推定される部分を残して、文字枠に含まれる画像からストローク群を除去する。
【選択図】図2

Description

本発明は、画像処理装置および制御プログラムに係り、特に印刷文字と手書き文字が混在した書類において印刷文字を光学的に読み取る際に用いられる画像処理装置および制御プログラムに関する。
従来、小切手のコンピューターによる自動処理においては、小切手用紙の所定領域(クリアバンドに印刷されたMICR(Magnetic Ink Character Recognition)文字を読取るだけでなく、支払金額の読取り、顧客情報の読取り等が提案されてきた(例えば、特許文献1参照)。
特開2002−296319号公報
ところで、MICR文字は磁気(インク)の分布で認識されるように設計されたものであるが,近年OCR(Optical Character Recognition)の性能向上により光学的に読取られることが一般的になってきた。更に米国では最近の法律改正により小切手の電子データのみで決済ができるようになりつつあり、光学的な手法によるMICR文字の高精度な認識が重要になってきている。
これまでMICR文字読取りのための製品はいくつか実現されているが,濃淡画像(グレースケール画像)としてスキャンし、処理しているため,複雑な色や模様を持つ背景が印刷されていたり、署名(signature;サイン)の一部がMICR文字に重なったりした場合等に文字認識精度が十分ではないという問題点があった。
同様に、光学的な手法による印刷文字の認識を行う場合には、印刷文字に手書き文字あるいは手書き図形などが重なっている場合についても文字認識精度が確保できないという問題点が生じることが想定される。
そこで、本発明の目的は、文字色が様々であったり、印刷文字に手書き文字あるいは手書き図形が重なっている場合でも、良好に文字認識処理を行えるように画像前処理を行う画像処理装置および制御プログラムを提供することにある。
上記課題を解決するため、本発明の第1態様は、入力画像から印刷文字の認識に先だって画像前処理を行う画像処理装置において、前記入力画像から前記印刷文字の文字列が含まれる画像領域を特定する領域特定部と、一つの印刷文字の周囲に余白を形成可能な大きさの文字枠を用いて、前記特定した画像領域から前記一つの印刷文字が含まれると推定される領域を切り出す文字切り出し部と、前記文字枠に接触するストロークを検出し、当該ストロークと一連とみなせるストローク群を抽出する連続ストローク抽出部と、前記ストローク群のうち前記印刷文字と重なっていると推定される部分を残して、前記文字枠に含まれる画像から前記ストローク群を除去するストローク除去部と、を備えたことを特徴としている。
上記構成によれば、領域特定部は、入力画像から印刷文字の文字列が含まれる画像領域を特定し、文字切り出し部は、文字枠を用いて、特定した画像領域から一つの印刷文字が含まれると推定される領域を切り出す。
これらの結果、連続ストローク抽出部は、文字枠に接触するストロークを検出し、当該ストロークと一連とみなせるストローク群を抽出し、ストローク除去部は、ストローク群のうち印刷文字と重なっていると推定される部分を残して、文字枠に含まれる画像からストローク群を除去する。
したがって、印刷文字以外に起因するストローク、例えば、手書きのサインによるサインストロークのみを除去することが可能となり、より確実に印刷文字の認識が行える。
本発明の第2態様は、第1態様において、前記ストローク除去部は、前記文字枠に含まれる画像から前記ストローク群を削除する削除部と、前記ストローク群のうち前記印刷文字と重なっていると推定される部分を補間する補間部と、を備えたことを特徴としている。
上記構成によれば、ストローク除去部の削除部は、前記文字枠に含まれる画像から前記ストローク群を削除する。
これにより、補間部は、ストローク群のうち印刷文字と重なっていると推定される部分を補間する。
したがって、より確実に印刷文字以外に起因するストロークのみを除去することが可能となり、画像認識の認識精度の向上に寄与することとなる。
本発明の第3態様は、第1態様または第2態様において、前記連続ストローク抽出部は、前記文字枠に接触するストロークを追跡し、複数のストロークに分岐する場合は、最も曲率が小さいストロークを前記ストローク群を構成する一連のストロークとすることを特徴とする。
上記構成によれば、印刷文字を構成するストロークがストローク群として除去されてしまうことを抑制できる。
本発明の第4態様は、第1態様ないし第3態様のいずれかにおいて、前記連続ストローク抽出部は、前記文字枠内の画像を線分(端点含む)と連結点(分岐点、交差点)とに分割するラベリング部と、前記分割された線分と前記連結点との配置関係に基づいて前記ストローク群を構成するストロークを推定するストローク群推定部と、を備えたことを特徴としている。
上記構成によれば、連続ストローク抽出部のラベリング部は、文字枠内の画像を線分と連結点とに分割する。
これにより、ストローク群推定部は、分割された線分と連結点との配置関係に基づいてストローク群を構成するストロークを推定する。
本発明の第5態様は、第1態様ないし第4態様のいずれかにおいて、前記文字切り出し部は、前記入力画像中の前記印刷文字の存在確率を表す相関画像を生成する相関画像生成部と、前記相関画像から前記印刷文字の所定の文字間ピッチに基づいて、前記印刷文字の中心位置を推定する文字中心推定部と、前記中心位置に基づいて、前記文字枠の配置位置を決定する文字枠位置決定部と、を備えたことを特徴とする。
上記構成によれば、文字切り出し部の相関画像生成部は、入力画像中の印刷文字の存在確率を表す相関画像を生成する。
これにより文字中心推定部は、相関画像から前記印刷文字の所定の文字間ピッチに基づいて、印刷文字の中心位置を推定する。
これにより、文字枠位置決定部は、推定された中心位置に基づいて、文字枠の配置位置を決定する。
したがって、印刷文字の文字間ピッチにそぐわない位置が印刷文字の中心位置として推定されることはないので、より文字枠の配置を的確なものとして、文字切り出しの信頼性を向上させることができる。
本発明の第6態様は、第1態様ないし第5態様のいずれかにおいて、前記印刷文字のみが含まれていると推定できる印刷文字画像領域を抽出する印刷文字領域抽出部と、前記印刷文字画像領域における文字色の色平均値に基づいて、前記印刷文字の印刷領域とそれ以外の領域とを識別するための閾値を設定する閾値設定部と、前記入力画像から文字色のみの画像を抽出する文字画像抽出部と、を備え、前記領域特定部は、前記抽出された文字色のみの画像から、文字列の配置を推定して、前記印刷文字の文字列が含まれる画像領域を特定する、ことを特徴とする。
上記構成によれば、印刷文字領域抽出部は、印刷文字のみが含まれていると推定できる印刷文字画像領域を抽出し、閾値設定部は、印刷文字画像領域における色平均値に基づいて、印刷文字の印刷領域とそれ以外の領域とを識別するための閾値を設定する。
これにより、領域特定部は、設定された閾値に基づいて、入力画像から印刷文字の文字列が含まれる画像領域を特定するので、より確実に画像領域を特定することができる。
本発明の第7態様は、入力画像から印刷文字の認識に先だって画像前処理を行う画像処理装置をコンピューターにより制御するための制御プログラムにおいて、前記コンピューターに、前記入力画像から前記印刷文字の文字列が含まれる画像領域を特定させる領域特定機能と、一つの印刷文字の周囲に余白を形成可能な大きさの文字枠を用いて、前記特定した画像領域から前記一つの印刷文字が含まれると推定される領域を切り出させる文字切り出し機能と、前記文字枠に接触するストロークを検出させ、当該ストロークと一連とみなせるストローク群を抽出させる連続ストローク抽出機能と、前記ストローク群のうち前記印刷文字と重なっていると推定される部分を残して、前記文字枠に含まれる画像から前記ストローク群を除去するストローク除去機能と、を実現させることを特徴とする。
上記構成によれば、印刷文字以外に起因するストローク、例えば、手書きのサインによるサインストロークのみを除去することが可能となり、より確実に印刷文字の認識が行える。
本発明によれば、印刷文字以外に起因するストローク、例えば、手書きのサインによるサインストロークのみを除去することが可能となり、印刷文字の光学的な文字認識処理における認識率の向上に寄与することができる。
印刷文字認識装置の概要ブロック図である。 実施形態の光学文字認識(OCR)の概要処理フローチャートである。 ステップS12の二値化および行切り出し処理の詳細処理フローチャートである。 スキャナー部により読み込んだ小切手のカラー画像の切出処理の説明図である。 文字色推定時の動作説明図である。 矩形領域の削除の説明図である。 二値化画像の説明図である。 MICR文字印刷領域の特定処理の説明図である。 除去しきれなかった背景や手書きのサインの影響による影響を低減するためのガウス型重み付け処理の説明図である。 MICR文字印刷領域の決定の説明図である。 MICR文字印刷領域に対応する切り出し画像の説明図である。 MICR文字印刷領域に対応する切り出し画像の二値化画像の説明図である。 MICR文字のテンプレート画像である。 得られた平均テンプレート画像の説明図である。 文字切り出しの処理フローチャートである。 相関分布グラフの説明図である。 ダミーピークの説明図である。 シグモイド関数の説明図である。 ダミーピークを抑えた後の相関分布の説明図である。 切り出した画像の一例を説明する図である。 サインのストローク部分を取り除く処理の処理フローチャートである。 細線化の説明図である。 連結点の調査の説明図である。 線分のグループ化の説明図である。 サインストロークの推定処理の処理フローチャートである。 サインストロークの線分に対応する画素の削除および文字の復元を説明する図である。 サインストローク削除処理の詳細説明図である。 サインストローク除去後のMICR文字の説明図である。 実施形態の変形例の説明図である。
次に本発明の好適な実施の形態について図面を参照して説明する。
図1は、印刷文字認識装置の概要ブロック図である。
本実施形態においては、印刷物として、背景模様、小切手番号などが印刷されている小切手の印刷文字(磁気インク文字)を認識するための印刷文字認識装置を例として説明する。
印刷文字認識装置10は、当該印刷文字認識装置10を中枢的に制御するコントロール部11と、挿入された小切手を光学的に読み取るためのスキャナー部12と、オペレータが各種操作を行うための操作部13と、読取結果や操作手順等の各種情報を表示するための表示部14と、ホストコンピューターなどの外部のホスト装置16と通信ネットワークを介して接続するための通信インターフェース部15と、を備えている。
この場合において、コントロール部11は、領域特定部、文字切り出し部、連続ストローク抽出部、ストローク除去部、削除部、補間部、ラベリング部、ストローク群推定部、相関画像生成部、文字中心推定部、文字枠位置決定部、印刷文字領域抽出部、閾値設定部として機能している。
なお、本実施形態では理解の便宜のため具体的な画素数等を記載するが、これらの数値はあくまで一例に過ぎず、後述する解像度等の条件に応じて変更可能である。
まず、実施形態の概要動作について説明する。
図2は、実施形態の光学文字認識(OCR)の概要処理フローチャートである。
印刷文字認識装置1のコントロール部11は、スキャナー部12に挿入された小切手を光学的にカラー画像として読み取る(ステップS11)。この場合に、小切手をカラー画像で読み込むのは、小切手はその種類によって、背景の模様が様々であり、模様の色も様々であるからであり、グレースケール画像あるいは二値画像で読み込んだ場合には、MICR文字と模様などとを識別することが困難だからである。
続いてコントロール部11は、ステップS11で読み込んだカラー画像に基づいて、二値化を行い、MICR文字が印刷されているMICR文字印刷領域(行)を推定し、切り出しを行う(ステップS12)。
ここで、MICR文字の色を利用した背景除去では,印刷された文字色は必ずしも一様ではないことを考慮して,まず正確な文字色推定のために小切手のMICR文字印刷面におけるMICR文字印刷領域を推定する必要がある。
そこで、本実施形態では、MICR文字の色を光の三原色r、g、b(0≦r、g、b≦255)で表した場合に黒(r=0;g=0;b=0)と仮定し,各画素を構成するr、g、bの最小値が所定の閾値より小さい値であれば文字領域に属する画素、閾値以上であれば背景領域に属する画素であるとする。
得られた二値画像は、複数の画素が連結した画素連結領域に分割してラベリングを行い,文字部分と判断すべきではない画素連結領域を削除する。具体的には、MICR文字が一つだけ含まれる領域、複数のMICR文字がサインによる手書き文字でつながれた画像が含まれる領域、背景パターン領域などがそれぞれ画素連結領域としてラベリングされ、MICR文字が一つだけ含まれる領域がMICR文字印刷領域を構成するものと判断されることとなる。
ここで残る画素連結領域をMICR文字印刷領域(行)と考え、当該MICR文字印刷領域(行)中のMICR文字の色を推定する。この結果として得られたMICR文字の色を用いて再度二値化を行うことでサインと背景パターンを除去する。
上記の処理で除去できない背景とサインの中には複数のMICR文字にまたがって重なる場合があり,このような場合には文字分割処理が必要となる。文字分割ではMICR文字テンプレートを重ね合わせて生成したフィルターを利用し、切り出したMICR文字印刷領域上で畳み込み処理を行うことで相関を求める。
この結果、得られた相関画像のピークから文字の中心位置を推定し、一文字ごとに文字の切出しを行う。具体的には、コントロール部13は、切り出した行に含まれるMICR文字を所定の大きさを有する矩形状の文字枠に1文字ずつ含まれるように切り出す(ステップS13)。
この場合において、後段のサイン除去の処理に備え、文字切出しに用いる矩形状の文字枠では切出対象のMICR文字の左右上下にある程度のマージンを持たせている。
最後に分割された文字枠内に残る手書のサインに対応する画素をストローク追跡により削除する(ステップS14〜S15)。
具体的には、全てのMICR文字の切り出しが完了すると、各MICR文字毎に文字枠に接触する線が含まれているか否かを判別する(ステップS14)。これは、サインなどの手書き文字は、MICR文字印刷領域の外に記入されたものが文字枠を超えて書き込まれているからであり、このような場合には、文字枠に接触する線が存在するからである。
従って、ステップS14の判別において、文字枠に接触する線が含まれている場合には、手書き文字のストロークまたは背景の一部が含まれているということであるので、コントロール部11は、手書き文字のストロークまたは背景の一部を除去する処理を全ての切り出した文字について行うこととなる(ステップS15)。
この際に、まず文字枠内の画素連結領域に対してラベリングを行い、各画素領域に対して面積やアスペクト比から明らかにMICR文字と判断されないものを削除する。次に文字枠内のMICR文字あるいは手書きのサインに対応する画素群に対して細線化を行い,領域の周囲に接しているストロークから追跡を行い,曲率を考慮してサインに対応するストロークの追跡を行う。このストローク追跡の結果得られたストローク全体を手書きされたサインの一部として除去し、除去する際に削除された文字部分は穴埋めを行い、元のMICR文字を復元する。
続いて、コントロール部11は、手書きされたサインを除去したMICR文字について文字認識処理を行い(ステップS16)、認識結果を表示部14あるいは通信インターフェース部15を介して外部のホスト装置16に出力することとなる(ステップS17)。
これらの結果、サインなどの手書き文字の影響を低減してより確実にMICR文字の認識が行え、OCRの認識率をよりいっそう向上させることが可能となる。
次により具体的な動作について説明する。
図3は、ステップS12の二値化および行切り出し処理の詳細処理フローチャートである。
以下の説明においては、MICR文字としてE13Bのフォントを用いる場合について説明する。このE13Bのフォントは、0〜9の10個の数字フォントと、transit、on−us、amount、dashと呼ばれる4個の制御文字フォントの14種のフォントで構成されている。
まず、コントロール部11は、スキャナー部12により小切手のカラー画像を取得すると(ステップS21)、認識領域を大まかに切り出す処理を行う(ステップS22)。
図4は、スキャナー部により読み込んだ小切手のカラー画像の切出処理の説明図である。
小切手CHKの下部には、図4(a)に示すように、小切手振出人のサイン欄に隣接して、小切手番号がMICR文字で印刷されたクリアバンドCBと呼ばれる領域が設けられている。
そこで、本実施形態のコントロール部11は、スキャナー部12により読み込んだ小切手のカラー画像から、図4(b)に示すように、クリアバンドCBを認識領域CB0として切り出しを行うこととなる。
ところで、小切手CHKにおいて、クリアバンドCBは、小切手の下部から決められた大きさの領域であり、MICR文字はこの領域内の一定の領域に印刷されることになっている。
しかしながら、小切手によっては所定の場所に印字されてない場合があり,MICR文字印刷領域を正確に推定する必要がある。
まず、スキャナー部12による取り込みの際に発生した、ディザによる色むらを抑えるために文字のエッジを保存しつつ平滑化を行う(ステップS23)。
ここで、文字列は水平の線分、垂直の線分を多く含むと仮定し,水平・垂直方向に対して各列・行ごとに一次元ガウシアンフィルターN(σ=1.0)(σは標準偏差)を施し、得られた二枚の平滑化画像の各画素においてr、g、b値ごとに小さい方の値を当該画素のr、g、b値として採用し、平滑化処理を完了する。
次に,文字色からの色距離が大きく離れる背景とサインを除去することとなるが、印刷条件により文字色が異なるため、初期段階において、文字色は不明である。
そこで、本実施形態においては、はじめに文字色を完全な黒色と仮定して二値化(第1回目の二値化)を行って文字領域を抽出し、抽出した文字領域内におけるr、g、b値に基づいておおよその文字色を推定した後,再度、背景とサイン除去のための二値化(第2回目の二値化)を行っている。
この結果、印刷条件の違いによる文字色の違いを吸収して、より確実に背景を除去することができる。
まず,文字色を黒色=(r=0,g=0,b=0)と仮定し,画素値I(i,j)に対応する(r,g,b)の三色のうち一色でも閾値τよりも小さいものがあれば、文字候補領域であるとし、その値を“1”とする。同様に画素値I(i,j)に対応する(r,g,b)の三色の全てが閾値τよりも大きければ、文字候補領域ではないとし、その値を“0”とする第1回目の二値化を行う(ステップS24)。
第1回目の二値化画像B(i,j)を式で表せば次式の通りとなる。
ここで、具体的に説明する。
図5は、文字色推定時の動作説明図である。
図5に示すように、抽出した文字領域内において、画素毎にr、g、bの値を検出すると、様々な値が存在する。
例えば、MICR文字上では、図5中左側に示すように、(r=0,g=0,b=0)であり、背景部分では、図5中右側に示すように、(r=167,g=195,b=221)である。したがって、閾値τ=38(=0.15×255)として、rgb色空間上における距離が閾値τよりも小さい場合に文字領域であると判断する場合には、MICR文字上の画素は文字候補領域に属していると判断され、背景部分の画素は、非文字領域に属していると判断される。
また、この段階では背景等に対応する微小連結領域を多く含むため、矩形領域面積が80画素未満または1000画素以上の領域と、矩形領域のアスペクト比が所定のアスペクト比よりも横長の矩形領域を削除し、文字領域と推定される矩形領域のみを残した画像を作成する(ステップS25)。
図6は、矩形領域の削除の説明図である。
図6(a)に示すように、MICR文字が一つだけ含まれている矩形領域RB1、RB3、RB5は、矩形領域面積が80画素以上、1000画素未満であり、かつ、矩形領域のアスペクト比が所定のアスペクト比よりも縦長の領域となっている。
これに対して、矩形領域RB2は、矩形領域面積が80画素未満または1000画素以上であり、かつ、領域形領域のアスペクト比が所定のアスペクト比よりも横長の領域となっている。
また、矩形領域RB4は、矩形領域面積が1000画素以上となっている。
これらの結果、矩形領域RB2および矩形領域RB4は、削除され、図6(b)に示すように、領域CB1には、矩形領域RB1、RB3、RB5のみが残されることとなる。
この段階で矩形領域RB2、RB4のように文字部分も大幅に削除される可能性があるが,文字色の推定に必要な文字らしい部分だけ残ればよいので問題はない。
ここで抽出された矩形領域RB1、RB3、RB5(文字候補領域)に含まれる画素の平均文字色c”を次式のように設定する(ステップS26)。
c”=(r”,g”,b”)
次に、平均文字色c”として推定された文字色を用いて最終的な二値化を行い,背景とサインを除去する。
二値化の条件としては、式(1)に加え,更に範囲を狭める式を加えたものを用いる。
この場合において、例えば、式(1)においては閾値τ=51(0.2×255)とし、式(2)においては閾値τ=102(=0.4×255)として、二値化を行う(ステップS27)。
図7は、二値化画像の説明図である。
図7(a)は、式(1)のみを用いて二値化を行った場合の画像であり、図7(b)は、式(1)および式(2)を用いて二値化を行った場合の画像であり、図7(b)に示すように、背景としての小切手の枠飾り部分が除去されて二値化が行われているのがわかる。
続いてコントロール部11は、再び、文字領域と推定される矩形領域のみを残した画像を作成し(ステップS28)、MICR文字印刷領域(行)を推定し(ステップS29)、MICR文字印刷領域(行)を切り出すこととなる(ステップS30)。
図8は、MICR文字印刷領域の特定処理の説明図である。
次にコントロール部11は、図8(a)に示す上述の処理によって得られたMICR文字印刷領域CB2Aに対応する二値画像B(i,j)の水平方向(図8では、垂直方向)へのMICR文字の色を有する画素の頻度に対応する投影ヒストグラム(横軸は、画素位置)をとると、図8(b)に示すようなものとなる。
図8(b)に示すように、MICR文字が含まれる場合には、投影ヒストグラムにおいて、MICR文字印刷領域CB2Aの中央部付近の値が増加するため,閾値処理によってMICR文字印刷領域を決定できることとなる。
図9は、除去しきれなかった背景や手書きのサインの影響による影響を低減するためのガウス型重み付け処理の説明図である。
しかしながら、実際の処理においては、除去しきれなかった背景や手書きのサインの影響により、投影ヒストグラムにおけるMICR文字印刷領域CB2Aの両端部分における値が増加する傾向がある。このため,前述の最終的な二値化の後にも微小領域の削除を行い,更に図9(a)に示すガウス型の重みN(σ=30)を加えることで投影ヒストグラム両端の値を抑えることを行った。
図9(b)は、除去しきれなかった背景や手書きのサインの影響による影響を低減するためのガウス型重み付け処理適用後の投影ヒストグラムである。
図10は、MICR文字印刷領域の決定の説明図である。
MICR文字印刷領域P(i,j)は、図10(a)に示すように、この投影ヒストグラムの最大値Vmaxを与える位置から上下に40画素(ピクセル)の範囲において,閾値TH=Vmax/3を超える区間を上下限として推定される。すなわち、図10(b)に示すように、閾値TH=Vmax/3以下のヒストグラムの正規化を行い、投影ヒストグラムの最大値Vmaxを与える位置から上下に40画素(ピクセル)の範囲において,閾値TH=Vmax/3を超える両端の画素位置AR1、AR2の間の画素範囲をMICR文字印刷領域P(i、j)としている。ただし、文字の垂直方向位置のばらつき程度によっては、この範囲からはみ出す文字も存在するため、上下方向にマージンをとる。本実施の形態では、上方向のマージンは35画素とし、下方向のマージンは40画素としている。
図11は、MICR文字印刷領域に対応する切り出し画像の説明図である。
この結果、切り出されたMICR文字印刷領域P(i,j)に対応する画像は、図11に示すようなものとなる。
図12は、MICR文字印刷領域に対応する切り出し画像の二値化画像の説明図である。
図7(a)の二値化画像CB2と比較して、MICR文字印刷領域に対応する切り出し画像の二値化画像CB3Aは、図12に示すように、MICR文字以外の背景、手書きサインなどができる限り除去された状態となっている。
次にこの二値化画像CB3AからMICR文字を切り出すためのフィルターについて説明する。
図13は、MICR文字のテンプレート画像である。
上述したようにE−13Bのフォントには、図13(a)〜(j)に示すように、0〜9の10個の数字フォントと、図13(k)〜(n)に示すように、4個の制御文字フォントとがある。
図13に示すフォントの画像は、印字品質が比較的良好と思われる画像から切出したものである。
これらのそれぞれをテンプレートとして、二値化画像とのマッチングを行い,相関値の最大値や平均値によって,相関画像を得る方法が考えられるが、本実施形態では、処理の高速化を図るために、これらのテンプレート画像をあらかじめ足し込み正規化しておくことで,一回のフィルタリングで相関画像を取得するように構成している。
この場合において、テンプレート画像によっては,得られる相関値が他の画像よりも小さくなる場合があるため、得られる相関値がほぼ等しくなるように、得られる相関値が他の画像よりも小さくなるテンプレート画像、すなわち、数字「0」の重みw=2、数字「4」の重みw=2、数字「7」の重みw=3としている。他の数字フォントおよび制御文字フォントについては、それぞれ重みw=1としている。
そして、これらの各テンプレート画像を構成する画素の値(黒=1、白=0)について、同一画素位置における重みを乗じた画素の値を積算して一つのテンプレート画像を生成し、得られたテンプレート画像の値の正規化を行って平均テンプレート画像を生成する。
この平均テンプレート画像を表す式をT”で表すと、次式(3)のようになる。

ここで、Ωは、テンプレート画像領域である。
図14は、得られた平均テンプレート画像の説明図である。
図14に示すように平均テンプレート画像FTは、色が濃い側(黒側)ほど、MICR文字を構成する画素が存在する確率が高い領域を表し、色が薄い側(白側)ほど、MICR文字を構成する画素が存在する確率が低い領域を表しており、1回のマッチングで、14文字全てのフィルタリングを行って相関画像を算出することができるため、14文字をそれぞれ別個のテンプレート画像を用いて判別を行う場合と比較して、高速に処理が可能となっている。
平均テンプレート画像FTの特性をT”で表した場合、フィルタリングにより得られる相関画像Cは次のように求まる。

ここで*は、畳込みを表している。
図15は、文字切り出しの処理フローチャートである。
コントロール部11は、MICR文字印刷領域(行)を切り出した二値化画像を取得すると(ステップS41)、平均テンプレート画像FTによる図示しない相関画像Cを取得する(ステップS42)。
図16は、相関分布グラフの説明図である。
この場合に、得られる相関画像Cは2次元で処理すると時間がかかるので,各列ごとに最大値をとり、図16(a)に示すように、1次元の相関分布Co(x)グラフを生成する(ステップS43)。
この1次元の相関分布Co(x)を実際のMICR文字上に重ね合わせてみると、図16(b)に示すような状態となり、MICR文字との相関があることが把握できる。
次に、この相関分布を用いたMICR文字の切り分け処理について説明する。
通常の文字抽出であればラベリングでラベルごとに文字を抽出できる。しかし,前述した処理で削除できない背景や手書きのサインの影響により、複数のMICR文字が結合した文字列として切り出される可能性がある。
また、印刷文字であるMICR文字の文字ピッチは比較的一定であるが,数ピクセルの誤差を含む場合がある。したがって、固定ピッチで文字の切り分けを行う場合、数ピクセルのずれがある文字の切り分けを繰り返すと、誤差が累積し、徐々に切出し位置がずれていく可能性も生じる。
そこで、本実施形態では、MICR文字の仕様で定められている文字ピッチを利用し、文字の大まかな存在位置を知るために、MICR文字テンプレート画像とMICR文字印刷領域P(i,j)のマッチングを行い、次にピーク位置の尤度推定を行う(ステップS44)。
図16(b)に示したように,相関分布Co(x)のピークはおおむね文字位置に対応するが,文字位置ではない位置にもピークは表れる。また、個々のピークを与えている分布の大きさも一様でないため,閾値処理でピーク位置を割り出すことは困難である。
そこで、本実施形態では、MICR文字が一定ピッチdで印刷されていることを考慮し,ピーク同士が間隔dで現れる場合には、当該ピークを強調することにより、文字位置をより正確に求めることとした。
以下、具体的に説明する。
MICR文字が配置されている行方向のある位置xで文字が存在するかどうかを調べる際に,その位置での相関値に加え、ピーク検出位置に対してピッチdだけ離れた位置xd近傍における相関分布を考慮し、検出したピークを強調する。ここでは位置xdの前後に最大距離Lだけ離れた範囲内、すなわち、位置xdの近傍[−L、+L]の範囲の相関分布を重みつきで累積するピーク尤度関数を以下のように定義する。
ここで重みつき関数N(μ=xd、σ) は位置xdに中心を持つ標準偏差σの正規分布を表している。そして,上式の尤度関数を元の相関値にかけあわせることで,ピーク位置の強調された次式で表された相関分布を得ることとなる。
なお,式(5)のピーク尤度関数であるが,位置xに対して、左右両方向に対して別々に計算を行い大きいほうの尤度を用いているが,文字列端では、文字が隣接している片側のみで尤度を求めている。
図17は、ダミーピークの説明図である。
上述した処理により、ピッチdだけ離れたピーク同士のピークは強調されることとなるが、図17(a)に丸印で示すように、強調されたピークの中間位置に別のピークが観測される傾向があった。これは、図17(b)に示すように抽出対象となるMICR文字には、縦方向の線分が多く含まれるため(例えば、図17(b)では、数字の「0」)、文字と文字の中間にも縦方向の線分が並ぶパターンが生じ、図17(c)に示すように、相関値が高くなり、ダミーピークとして検出されているためである。
一方、ダミーピークは、17(a)に示すように、MICR文字に起因する隣接する正規のピークに比べて小さく,正規のピークから半ピッチ(=d/2)の位置に現れる傾向がある。
このため,ここではあるピーク検出位置xと、ピーク検出位置xから半ピッチ(=d/2)離れた位置xd/2の近傍の相関値を比べ,相関値の大きい方を強調し,小さいほうを抑制することにより、ダミーピークの影響を抑制することを考える。
図18は、シグモイド関数の説明図である。
そこで、式(5)においてxd の代わりにxd/2を用い,尤度関数として、式(7)および図18に示すようなシグモイド関数を定義した。
式(7)においてピーク検出位置xにおける相関分布値Co”(x)が、ピーク検出位置x+d/2における相関分布値Co”(xd/2)よりも大きければ、Δc>0となり,シグモイド関数の値が0.5以上となるため、ピーク検出位置xにおける相関分布値Co”(x)が強調され、逆の場合はΔc<0となり,シグモイド関数の値が0.5以下となり、ピーク検出位置xにおける相関分布値Co”(x)が抑制される。
図19は、ダミーピークを抑えた後の相関分布の説明図である。
図19に丸印で示すように、文字間ピッチd毎にピークがきれいに現れ、ダミーピークが抑制された相関分布が得られる。
次にMICR文字領域の中心位置に相当するピーク位置の特定について説明する。
コントロール部11は、最終的なピーク位置を特定するために動的閾値を用いて文字領域中心のピークのみを検出する。本実施形態では、動的閾値THdyとして、図19の相関値をガウスフィルターN(μ=0,σ=1)で平滑化した値を用いる。閾値処理により検出された領域ごとに相関の最大値を与える点を求める。そして,ある点piとその半ピッチ(=d/2)右隣の点pjの値を比較したときに,右隣の点pjが小さければpjをダミーピークと判断して削除し、逆に点pjが大きければ点piを削除する。特定したピーク位置から、解像度や小切手の用紙種類に応じた画素範囲、たとえば、解像度が300dpiの場合、左右に20画素の範囲を文字領域として切出しを行う。
このように、コントロール部11は、ダミーピークを抑制し(ステップS45)、続いて、ピーク位置を特定する処理を行う(ステップS46)。さらに、コントロール部11は、特定したピーク位置に基づいて文字を切り出し(ステップS47)、文字切り出し画像を生成する(ステップS48)。
図20は、切り出した画像の一例を説明する図である。
図20において、上3段は、手書きのサインが含まれずに切り出された画像であり、最下段が手書きのサインが含まれた状態で切り出された画像である。
次に、切出した文字に残るサインのストローク部分を取り除く処理について説明する。
図21は、サインのストローク部分を取り除く処理の処理フローチャートである。
この時点において、文字切り出し画像は、MICR文字と背景やサインストロークの一部を残すのみであるが、更に細線化を施して中心線のみを残すことで,ストローク追跡を行いやすくする。
この場合において、この文字切り出し画像には、MICR文字に重ならない背景やサインの一部が微小領域として含まれることがあるため、コントロール部11は、文字切り出し画像を取得すると(ステップS51)、まず文字切り出し画像からラベリングを行い、MICR文字と判断されないものを削除する(ステップ52)。
その後,コントロール部11は、細線化を行うが,細線化を行う前により形状の滑らかな中心線を得るため、文字切り出し画像をメディアンフィルターを用いて平滑化する(ステップS53)。これにより、ピーク的なノイズ成分を除去することが可能となる。
続いてコントロール部11は、手書きのサインのストロークの追跡を行う準備として細線化を行う(ステップS54)。
図22は、細線化の説明図である。
図22において、図22(a1)〜(a7)は、細線化前の切り出し画像であり、図22(b1)〜(b7)は細線化後の切り出し画像である。
図22(b1)〜(b7)に示すように、細線化後には、各ストロークが1ドット幅となるようにされている。
そして、コントロール部11は、得られた線画像の構造に基づいて連結数(1:端点、2:連結点、3:分岐点、4:交差点)を調査する(ステップS55)。
図23は、連結数の調査の説明図である。
図23(b)は、図23(a)に示す細線化後の切り出し画像の一部を拡大し、各画素の連結状態を調査した結果を表す図である。
図23(b)において、数字「0」とラベリングされた画素は、文字を構成する画素としては検出されていない領域であり、数字「2」とラベリングされた画素は、文字を構成する画素であって、当該画素に上下左右斜め方向のいずれかに隣接する画素の個数が2個である線分要素であることを表し、数字「3」とラベリングされた画素は、文字を構成する画素であって、当該が画素に上下左右斜め方向のいずれかに隣接する画素の個数が3個以上である分岐点(あるいは交差点)であることを表している。また、図23(b)において数字「1」とラベリングされた画素は、文字を構成する画素であって、当該画素に上下左右斜め方向のいずれかに隣接する画素の個数が1個である端点であることを表している。
この場合において、図23(b)に示すように、端点または分岐点(数字「1」あるいは数字「3」で表された画素)に挟まれた画素は線分を構成する画素であり、数字「2」で表されている。
図24は、線分のグループ化の説明図である。
したがって、端点または分岐点であるとラベリングされた画素に挟まれた数字「2」とラベリングされた画素については、一つのグループ、すなわち、一つの線分に属する画素であるとしてグループ化し、グループ毎に共通のラベルを付与する(ステップS55)。具体的には、図24に示すように、端点または分岐点(連結数として数字「1」あるいは数字「3」で表された画素)で挟まれた画素群については、同一の数字で線分としてのラベリングを行う。図24中では、例えば、数字「112」とラベリングされた画素が一つのグループである線分を構成し、数字「113」とラベリングされた画素が他のグループである他の線分を構成している。
これにより、各グループは、切り出し画像に含まれる文字を構成する線分(あるいはサインのストローク)となっている。
続いてコントロール部11は、サインストロークの推定処理に移行することとなる(ステップS56)。
図25は、サインストロークの推定処理の処理フローチャートである。
サインストロークが上書きされた文字画像において,ストロークはMICR文字の印刷領域外から続いているため、文字領域枠に接している可能性が非常に高い。
そこで、コントロール部11は、文字領域枠に接している端点をストローク推定の追跡開始位置として、追跡を開始する(ステップS71)。
続いて、コントロール部11は、線分上を移動して追跡を行う(ステップS72)。すなわち、第1回目は、文字領域枠に接している端点から当該端点に続く線分上を移動して追跡を行うこととなる。具体的には、図24において、右端の数字「1」がラベリングされた端点から数字「112」がラベリングされた線分上を移動していくこととなる。
次にコントロール部11は、ラベリングされた数字を参照して現在の追跡点が分岐点または交差点、すなわち、数字「3」または数字「4」がラベリングされている画素に至ったか否かを判別する(ステップS73)。
ステップS73の判別において、未だに分岐点または交差点としてラベリングされている画素に至っていない場合には(ステップS73;No)、処理をステップS72に移行して、当該線分上の追跡を続行する。
ステップS73の判別において、分岐点または交差点としてラベリングされている画素に至った場合には、コントロール部11は、他の線分を検索し(ステップS74)、現在たどってきた線分と見つかったすべて線分の組み合わせで、曲率を計算し、最も曲率の小さい線分を現在たどってきた線分と同一ストロークであると判断してグループ化する(ステップS75)。これは、手書きのサインストロークについては、急激な曲率変化が起こることは考えにくいので、一体のサインストロークとして取り扱うためである。なお、この場合において、曲率を求めるのに十分な長さがない線分が存在しているため、このような場合には、曲率を計算するのに十分な長さとなるまで線分の探索を行い,もっとも曲率の少ない経路を同一ストロークとみなすように処理を行っている。
続いて、コントロール部11は、現在の追跡点が端点かあるいは既に通った線分であるか否かを判別する(ステップS76)。
ステップS76の判別において、現在の追跡点が端点および既に通った線分のいずれでもない場合には(ステップS76;No)、コントロール部11は、処理を再びステップS72に移行して、当該線分上の追跡を続行する。
ステップS76の判別において、現在の追跡点が端点かあるいは既に通った線分である場合には(ステップS76;Yes)、コントロール部11は、処理をステップS62に移行する。
図26は、サインストロークの線分に対応する画素の削除および文字の復元を説明する図である。
続いてコントロール部11は、推定されたサインストロークの線分に対応する画素を削除する(ステップS57)。
具体的には、図26(a)に示すように、推定されたサインストロークSS1、SS2が存在する場合に、図26(b)に示すように、サインストロークSS1、SS2を画素数的に膨張させた膨張ストロークSD1、SD2を生成し、文字領域画像の同一座標から削除する。
図27は、サインストローク削除処理の詳細説明図である。
図27(a)に示す文字切り出し画像があった場合に、上述した処理により算出したサインストロークSS10を、例えば、1×1のサイズを有する画素を3×3のサイズを有する画素で置き換えることにより、図27(c)に示すような膨張ストロークSD11を生成する。
そして、図27(a)に示した元の文字切り出し画像と座標を合わせて、膨張ストロークSD111を差し引く処理を行うと、得られる結果は図27(d)に示すようにサインストロークが完全に除去された状態となる。
図27(c)に示すように、サインストロークを除去するだけの処理では文字の一部に欠損が生じるため画素の補間を行い高品質な文字画像を取得する(ステップS58)。
より詳細には、図26(c)に示すように、推定されたサインストロークSS1、SS2には、文字画像との間で数字「3」にラベリングされた分岐点(あるいは交差点)が存在したはずであるので、当該分岐点(あるいは当該交差点)の画素を、膨張ストロークSD1、SD2の生成時と同様に膨張させ、補間画素群AD1、AD2、AD3を生成して、MICR文字の復元を行う。
図28は、サインストローク除去後のMICR文字の説明図である。
図28(a1)〜(a5)は、サインストローク除去前の文字切り出し画像であり、これらに対してサインストローク除去後の文字切り出し画像が図28(b1)〜(b5)である。
以上の説明は、原理的なものであったが、発明者らは、実用性を検証するため,様々な小切手画像に対して背景除去、MICR文字の切出し及びサインストローク削除の実験を行った。
これによれば、小切手の背景に複雑な色と模様が使われ,サインが上書きされている場合にも,概ね良好にこれらを削除することができた。
以上の説明のように、本実施形態によれば、高品位のMICR文字を抽出することが可能となる。したがって、MICR文字部分に手書きのサインストロークが接触している状態においても、光学的手段により良好に文字認識が行える。
図29は、実施形態の変形例の説明図である。
以上の図3の説明においては、信頼性の向上のため、閾値の決定後(ステップS26)、二値化を行い(ステップS27)、文字領域と推定される矩形領域のみを残した画像を作成し(ステップS28)、MICR文字印刷領域(行)を推定し(ステップS29)、MICR文字印刷領域(行)を切り出していたが(ステップS30)、図3のステップ群F1に代えて、図29に示すステップ群F2を採用し、文字以外の領域を削除した画像を作成し(ステップS81)、閾値を決定し、MICR文字印刷領域(行)を推定してから(ステップS83)、二値化をおこなって(ステップS84)、MICR文字印刷領域(行)を切り出すように構成すれば、信頼性は多少低下するものの、処理速度の向上が図れる。
以上の説明においては、印刷文字として磁気読み取りおよび光学読み取りの双方が行えるMICR文字の場合について説明したが、光学読み取りのみが可能な印刷文字についても同様に適用が可能である。
10…印刷文字認識装置、11…コントロール部、12…スキャナー部、13…操作部、14…表示部、15…通信インターフェース部、16…ホスト装置。

Claims (7)

  1. 入力画像から印刷文字の認識に先だって画像前処理を行う画像処理装置において、
    前記入力画像から前記印刷文字の文字列が含まれる画像領域を特定する領域特定部と、
    一つの印刷文字の周囲に余白を形成可能な大きさの文字枠を用いて、前記特定した画像領域から前記一つの印刷文字が含まれると推定される領域を切り出す文字切り出し部と、
    前記文字枠に接触するストロークを検出し、当該ストロークと一連とみなせるストローク群を抽出する連続ストローク抽出部と、
    前記ストローク群のうち前記印刷文字と重なっていると推定される部分を残して、前記文字枠に含まれる画像から前記ストローク群を除去するストローク除去部と、
    を備えたことを特徴とする画像処理装置。
  2. 請求項1記載の画像処理装置において、
    前記ストローク除去部は、前記文字枠に含まれる画像から前記ストローク群を削除する削除部と、
    前記ストローク群のうち前記印刷文字と重なっていると推定される部分を補間する補間部と、
    を備えたことを特徴とする画像処理装置。
  3. 請求項1または請求項2記載の画像処理装置において、
    前記連続ストローク抽出部は、前記文字枠に接触するストロークを追跡し、複数のストロークに分岐する場合は、最も曲率が小さいストロークを前記ストローク群を構成する一連のストロークとすることを特徴とする画像処理装置。
  4. 請求項1ないし請求項3のいずれかに記載の画像処理装置において、
    前記連続ストローク抽出部は、前記文字枠内の画像を線分と連結点とに分割するラベリング部と、
    前記分割された線分と前記連結点との配置関係に基づいて前記ストローク群を構成するストロークを推定するストローク群推定部と、
    を備えたことを特徴とする画像処理装置。
  5. 請求項1ないし請求項4のいずれかに記載の画像処理装置において、
    前記文字切り出し部は、前記入力画像中の前記印刷文字の存在確率を表す相関画像を生成する相関画像生成部と、
    前記相関画像から前記印刷文字の所定の文字間ピッチに基づいて、前記印刷文字の中心位置を推定する文字中心推定部と、
    前記中心位置に基づいて、前記文字枠の配置位置を決定する文字枠位置決定部と、
    を備えたことを特徴とする画像処理装置。
  6. 請求項1ないし請求項5のいずれかに記載の画像処理装置において、
    前記印刷文字のみが含まれていると推定できる印刷文字画像領域を抽出する印刷文字領域抽出部と、
    前記印刷文字画像領域における文字色の色平均値に基づいて、前記印刷文字の印刷領域とそれ以外の領域とを識別するための閾値を設定する閾値設定部と、前記入力画像から文字色のみの画像を抽出する文字画像抽出部と、を備え、
    前記領域特定部は、前記抽出された文字色のみの画像から、文字列の配置を推定して、前記印刷文字の文字列が含まれる画像領域を特定する、
    ことを特徴とする画像処理装置。
  7. 入力画像から印刷文字の認識に先だって画像前処理を行う画像処理装置をコンピューターにより制御するための制御プログラムにおいて、
    前記コンピューターに、
    前記入力画像から前記印刷文字の文字列が含まれる画像領域を特定させる領域特定機能と、
    一つの印刷文字の周囲に余白を形成可能な大きさの文字枠を用いて、前記特定した画像領域から前記一つの印刷文字が含まれると推定される領域を切り出させる文字切り出し機能と、
    前記文字枠に接触するストロークを検出させ、当該ストロークと一連とみなせるストローク群を抽出させる連続ストローク抽出機能と、
    前記ストローク群のうち前記印刷文字と重なっていると推定される部分を残して、前記文字枠に含まれる画像から前記ストローク群を除去するストローク除去機能と、
    を実現させることを特徴とする制御プログラム。
JP2009035945A 2009-02-18 2009-02-18 画像処理装置および制御プログラム Pending JP2010191724A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009035945A JP2010191724A (ja) 2009-02-18 2009-02-18 画像処理装置および制御プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009035945A JP2010191724A (ja) 2009-02-18 2009-02-18 画像処理装置および制御プログラム

Publications (1)

Publication Number Publication Date
JP2010191724A true JP2010191724A (ja) 2010-09-02

Family

ID=42817696

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009035945A Pending JP2010191724A (ja) 2009-02-18 2009-02-18 画像処理装置および制御プログラム

Country Status (1)

Country Link
JP (1) JP2010191724A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102529421A (zh) * 2010-11-24 2012-07-04 株式会社理光 在热介质上绘制图像的设备、方法和计算机程序产品
JP2019128602A (ja) * 2018-01-19 2019-08-01 富士通フロンテック株式会社 光学的文字認識装置、プログラム
JP2022522425A (ja) * 2019-02-25 2022-04-19 ネイバー コーポレーション 文字認識装置及び文字認識装置による文字認識方法
JP7137170B1 (ja) 2021-03-22 2022-09-14 楽天グループ株式会社 情報処理装置、情報処理方法およびプログラム
JP2022146745A (ja) * 2021-03-22 2022-10-05 楽天グループ株式会社 情報処理装置、情報処理方法およびプログラム
WO2024043602A1 (ko) * 2022-08-26 2024-02-29 삼성전자 주식회사 이미지로부터 텍스트를 획득하는 방법 및 서버

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102529421A (zh) * 2010-11-24 2012-07-04 株式会社理光 在热介质上绘制图像的设备、方法和计算机程序产品
JP2019128602A (ja) * 2018-01-19 2019-08-01 富士通フロンテック株式会社 光学的文字認識装置、プログラム
JP2022522425A (ja) * 2019-02-25 2022-04-19 ネイバー コーポレーション 文字認識装置及び文字認識装置による文字認識方法
JP7297910B2 (ja) 2019-02-25 2023-06-26 ネイバー コーポレーション 文字認識装置及び文字認識装置による文字認識方法
JP7137170B1 (ja) 2021-03-22 2022-09-14 楽天グループ株式会社 情報処理装置、情報処理方法およびプログラム
JP2022146746A (ja) * 2021-03-22 2022-10-05 楽天グループ株式会社 情報処理装置、情報処理方法およびプログラム
JP2022146745A (ja) * 2021-03-22 2022-10-05 楽天グループ株式会社 情報処理装置、情報処理方法およびプログラム
JP7344916B2 (ja) 2021-03-22 2023-09-14 楽天グループ株式会社 情報処理装置、情報処理方法およびプログラム
WO2024043602A1 (ko) * 2022-08-26 2024-02-29 삼성전자 주식회사 이미지로부터 텍스트를 획득하는 방법 및 서버

Similar Documents

Publication Publication Date Title
Gatos et al. Automatic table detection in document images
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
US20070253040A1 (en) Color scanning to enhance bitonal image
US11836969B2 (en) Preprocessing images for OCR using character pixel height estimation and cycle generative adversarial networks for better character recognition
CN112183038A (zh) 一种表格识别套打方法、计算机设备及计算机可读存储介质
Alberti et al. Labeling, cutting, grouping: an efficient text line segmentation method for medieval manuscripts
JP2010191724A (ja) 画像処理装置および制御プログラム
Kumar et al. Power-law transformation for enhanced recognition of born-digital word images
JP3830998B2 (ja) 罫線除去方法及びこれを用いた文字認識装置
Shirai et al. Removal of background patterns and signatures for magnetic ink character recognition of checks
Agrawal et al. Stroke-like pattern noise removal in binary document images
Bukhari et al. Layout analysis of Arabic script documents
EP2223265A1 (en) A method for resolving contradicting output data from an optical character recognition (ocr) system, wherein the output data comprises more than one recognition alternative for an image of a character
Mangla et al. An end detection algorithm for segmentation of broken and touching characters in handwritten Gurumukhi word
Sanchez et al. Text line segmentation in images of handwritten historical documents
JP4543675B2 (ja) 文字・図形の認識方法
Bhaskar et al. Implementing optical character recognition on the android operating system for business cards
Thilagavathy et al. Recognition of distorted character using edge detection algorithm
CN110298350B (zh) 一种高效的印刷体维吾尔文单词分割算法
JP4492258B2 (ja) 文字・図形の認識方法および検査方法
JP2871590B2 (ja) 画像抽出方式
CN111241862A (zh) 基于边缘特性的条形码定位方法
JP3794285B2 (ja) 光学式文字読取装置
Khan et al. Morphology based Character Recognition of Overlapped and Touched Objects
JP2019021085A (ja) 画像処理プログラム、画像処理方法及び画像処理装置