JP3995185B2 - 枠認識装置及び記録媒体 - Google Patents

枠認識装置及び記録媒体 Download PDF

Info

Publication number
JP3995185B2
JP3995185B2 JP2000228083A JP2000228083A JP3995185B2 JP 3995185 B2 JP3995185 B2 JP 3995185B2 JP 2000228083 A JP2000228083 A JP 2000228083A JP 2000228083 A JP2000228083 A JP 2000228083A JP 3995185 B2 JP3995185 B2 JP 3995185B2
Authority
JP
Japan
Prior art keywords
frame
rectangle
pixel rectangle
black pixel
black
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000228083A
Other languages
English (en)
Other versions
JP2002042143A (ja
Inventor
敏文 山合
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2000228083A priority Critical patent/JP3995185B2/ja
Priority to US09/904,473 priority patent/US7003159B2/en
Publication of JP2002042143A publication Critical patent/JP2002042143A/ja
Application granted granted Critical
Publication of JP3995185B2 publication Critical patent/JP3995185B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、帳票類のような文書画像中の罫線で囲まれた枠を認識するための技術に関する。
【0002】
【従来の技術】
罫線で囲まれた枠を含む帳票など文書を扱う文字認識装置(OCR)においては、文字認識の前処理段階で文書画像データより枠を認識する必要がある。同様に、マーク認識装置(PMR)においても、文書画像データよりマーク記入枠の位置を予め定義する必要がある。
【0003】
このような枠認識に関しては様々な従来技術が知られているが、その多くの基本原理は、水平、垂直方向の黒ランの閾値処理により水平、垂直方向の罫線を抽出し、四方を罫線で囲まれた領域を枠として認識するというものである(特開平11−66225号、特開平9−138837号など)。
【0004】
【発明が解決しようとする課題】
文字認識装置で処理される帳票類に使用されている枠の大半は、複数の枠が二次元的に連続して配置された図13に示すような表形式の枠、複数の枠が一次元的に連続して配置された図14に示すような梯子形式の枠、あるいは、1つ1つが分離した図15に示すような枠のいずれかに分類することができる。ここでは便宜上、図13及び図14に示すような枠を複雑枠と呼び、図15に示すような枠を単純枠と呼ぶこととする。
【0005】
複雑枠については、個々の枠のサイズが小さい場合でも、枠を構成する罫線の長さは文字サイズより十分に大きいため、前記従来技術により認識可能である。他方、チェックボックスや1文字記入枠のように、文字サイズと同等か、それより小さいサイズの単純枠については、前記従来技術によって認識することは難しい。前記従来技術では、罫線を抽出するための黒ラン長の閾値を文字サイズと同等以下にすると、文字の部分でも多くの罫線候補が抽出されてしまい、本来の罫線を精度よく抽出することが困難であるためである。
【0006】
また、帳票類に用いられる枠は、枠線の細いものが多いため、スキャナで読み取ると、枠線にかすれが生じやすい。殊に、ドロップアウトを目的にした薄い色で枠が印刷された帳票などは、それを白黒スキャナで読み取ると、枠線のかすれが特に生じやすい。そのかすれを生じない程度の濃度で読み取ろうとすると、記入された文字などが潰れやすくなるため、読み取り濃度をあまり高くすることも困難である。
【0007】
よって、本発明の目的は、前記従来技術では認識が困難な、1文字記入枠やチェックボックスのような、文字サイズ程度もしくはそれより小さな単純枠なども高精度に認識できる枠認識装置を提供すること、及び、枠線のかすれが多い場合にも高精度の枠認識が可能な枠認識装置を提供することにある。
【0008】
【課題を解決するための手段】
本発明の枠認識装置の特徴は、入力画像データより黒画素の連結成分の外接矩形(黒画素矩形)を抽出し、該抽出された黒画素矩形について、該黒画素矩形の領域情報を用いて黒画素矩形を枠候補又は非枠候補に弁別し、該枠候補と弁別された黒画像矩形の内部より白画素の連結成分の外接矩形(白画素矩形)を抽出し、該抽出された白画素矩形と黒画素矩形との位置関係とから、黒画素矩形を枠又は非枠に弁別することである。
【0009】
以上に述べた本発明の特徴及びその他の特徴について、以下に述べる実施の形態に関連して具体的に説明する。
【0010】
【発明の実施の形態】
以下、添付図面を参照し、本発明の実施の形態について説明する。
図1は本発明の1つの実施の形態を説明するためのブロック図である。ここに示す枠認識装置は、画像入力部100、画像圧縮部101、画像記憶部102、黒画素矩形抽出部103、一次判定部104、白画素矩形抽出部105、二次判定部106、作業用記憶部107、出力部108、以上各部の動作及び装置全体の動作を制御するための制御部109から構成される。画像圧縮部101は、必要に応じて設けられるもので、省くことも可能である。
【0011】
一次判定部104、白画素矩形抽出部105及び二次判定部106は、1文字記入枠やチェツクボックスなどの、文字サイズと同程度もしくはそれより小さなサイズの枠の認識処理を行う枠認識モジュール110を構成する。ただし、これ以外の条件の枠を例えば前記従来技術などにより認識するための処理部分を追加し、この処理部分により認識された枠と、枠認識モジュール110で認識された枠を処理結果として出力するように変更してもよい。すなわち、本発明は前記従来技術などと組み合わせて実施することも容易である。そのような組み合わせを採用する場合、以下に詳述するような矩形抽出などは従来技術による枠認識処理と共通するため、そのため手段を共通化し得る。
【0012】
なお、本実施の形態の枠認識装置は、単独の装置として実現し得るが、これに限定されるものではなく、例えば、文字認識装置(OCR)において前処理部として組み込まれ、あるいは、マーク認識装置(OMR)において予めマーク記入枠を定義しておくための帳票定義部として組み込まれる場合もある。
【0013】
図2は、本実施の形態の枠認識装置の全体的な動作を示すフローチャートである。以下、図1のブロック図及び図2のフローチャートを参照し、本実施の形態の枠認識装置の構成と動作について説明する。
【0014】
画像入力部100によって文書画像データ(通常、2値データ)が入力され、画像記憶部102に格納される(ステップ200)。より具体的には、文書画像データは、文書読み取り用のイメージスキャナや、文書画像データが予め格納されているパソコンなどの記憶装置より直接的に、又はネットワーク経由にて入力され、あるいは、磁気ディスクなどの各種記録媒体より入力される。なお、必要に応じて、入力された文書画像データに対し画像圧縮部101でOR圧縮(縮小)処理が施される。このようなOR圧縮処理を施すと、画像記憶部101の記憶容量の削減や黒画素矩形抽出などの処理時間の短縮、枠線のかすれの影響の軽減に効果的である。
【0015】
次に、黒画素矩形抽出部103において、画像記憶部101内の文書画像データ(入力された文書画像データ又はそのOR圧縮後の画像データ)より、黒画素の連結成分の外接矩形(黒画素矩形)が抽出される(ステップ201)。この黒画素矩形抽出は、文書画像の全体又は予め指定された処理領域に対して行われる。抽出された各黒画素矩形の領域情報として、例えば、左上コーナーと右下コーナーの座標が作業用記憶部107に記憶される。
【0016】
黒画素矩形抽出の処理が終わると、枠認識モジュール110による枠認識処理が開始する。
【0017】
まず、作業用記憶部107より1つの黒画素矩形の領域情報が取り出され(ステップ202)、その領域情報を用いて一次判定部104で枠候補と非枠候補の弁別のための条件判定が行われる(ステップ203)。この弁別には、黒画素矩形の高さ、幅、面積、黒画素数、黒ランの数などの情報を利用できるが、ここでは、1文字記入枠やチェックボックスのような文字サイズ程度かそれより小さな枠である可能性の高い黒画素矩形を弁別することを目的としているため、複雑な条件判定を行う必要はない。したがって、この条件判定では、例えば次のような比較的単純な条件(1-1)乃至条件(1-4)に関する判定が行われる。
・条件(1-1):大きさ(高さ及び幅)がある閾値を越える。
・条件(1-2):大きさ(高さ及び幅)がある閾値より小さい。
・条件(1-3):縦横比(高さ/幅比又は幅/高さ比)がある閾値を越える。
・条件(1-4):黒画素密度(内部の黒画素数を面積で割った値)がある閾値を越える。
【0018】
条件(1-1)は1文字記入枠の大きさを越える黒画素矩形、例えば文書画像上で2cmを越える高さ又は幅の黒画素矩形を枠候補から排除するための条件である。条件(1-2)は、ノイズのような小さな黒画素矩形、例えば文書画像上で3mm以下の黒画素矩形を枠候補から排除するための条件である。条件(1-3)は、縦横比が枠としては明らかに大きすぎる罫線のような黒画素矩形を排除するための条件である。条件(1-4)は、内部が黒でほぼ埋め尽くされているような黒画素矩形を排除するための条件であり、1文字記入枠やチェツクボックスは塗りつぶされていない限り、この条件は成立しない。なお、黒画素密度の計算のための黒画素数は、一次判定部105において画像記憶部102内の文書画像データを参照して計数してもよいし、黒画素矩形抽出部103において黒画素矩形を抽出する際に計数して領域情報と関連付けて作業用記憶部107に書き込むようにしてもよい。後者の構成のほうが処理効率の面で一般に有利であろう。
【0019】
一次判定部104による条件判定で、上記4条件のいずれか1つでも成立した場合には(判定結果=NG)、その黒画素矩形は枠候補とされず、ステップ202に戻り、別の黒画素矩形の領域情報が作業用記憶部107より読み出され、その黒画素矩形について一次判定部104で条件判定が行われる。
【0020】
一次判定部104の条件判定で、前記4条件のいずれも成立しない場合には(判定結果=OK)、その黒画素矩形は枠候補とされる(ステップ204)。
【0021】
1つの黒画素矩形が枠候補とされると、白画素矩形抽出部105において、その黒画素矩形(親矩形と呼ぶ)の領域情報に基づき、画像記憶部102内の文書画像データの、親矩形の領域内部を参照し、白画素の連結成分の外接矩形(白画素矩形)を抽出し、その領域情報として例えば左上コーナーと右下コーナーの座標を作業用記憶部107に格納する(ステップ205)。
【0022】
次に、作業用記憶部107より1つの白画素矩形の領域情報が取り出され(ステップ206)、二次判定部106で、この白画素矩形に関し、その領域情報を用いて、親領域(枠候補とされた黒画素矩形)を枠又は非枠に弁別するための条件判定(二次判定)が行われる(ステップ207)。この条件判定で条件が成立した場合(判定結果=OK)には、その親矩形は枠であると認識される(ステップ208)。枠と認識された親矩形については、例えば、その領域情報に枠であることを示すフラグ情報が付加され、あるいは、作業用記憶部107内に用意された枠情報記憶域に、その領域情報が格納される。条件が不成立の場合には(判定結果=NG)、判定すべき白画素矩形が残っているならば(ステップ209,No)、ステップ206に戻り、別の1つの白画素矩形の領域情報が取り出され、その白画素矩形に関する条件判定が二次判定部106で行われる。親矩形より抽出された白画素矩形の全てについて条件判定を行っても親矩形が枠と認識されないか(ステップ209,Yes)、親矩形が枠と認識されると、ステップ202に戻り、次の黒画素矩形について同様の枠認識処理が繰り返される。抽出された全ての黒画素矩形が処理済みとなると(ステップ210,Yes)、作業用記憶部107より枠として認識された黒画素矩形の領域情報が出力部108により外部(例えば文字認識装置の認識部など)へ出力され(ステップ211)、1つの文書画像データに対する動作を完了する。
【0023】
さて、ステップ207の条件判定(二次判定)は、基本的には、親矩形とその内部より抽出された白画素矩形との位置関係に関する判定である。以下、その具体例を説明する。
【0024】
図3は、二次判定の第1の例を示すフローチャートである。まず、親矩形と白画素矩形の重心が計算され(ステップ300)、算出された重心のX,Y方向のずれ(絶対値)が算出される(ステップ301)。X,Y方向の重心のずれが閾値th1(例えば4)と比較され、X,Y両方向の重心のずれが閾値th1以下ならば、条件が成立したとされ(ステップ303)、そうでなければ条件は不成立とされる(ステップ304)。
【0025】
例えば、親矩形の左上コーナーの座標(Xso,Yso)と右下コーナーの座標(Xeo,Yeo)が
Xso=365,Yso=840
Xeo=400,Yeo=905
であり、抽出された白画素矩形の左上コーナーの座標(Xsw,Ysw)、右下コーナーの座標(Xew,Yew)が
Xsw=372,Ysw=850,
Xew=392,Yew=898
であるとする。この場合、親矩形の重心の座標は(383、873)、この白画素矩形の重心の座標は(382、874)であるから、重心のずれはX,Y方向とも1であり、これは閾値ht1(ここでは4)以下であるので条件は成立し、したがって親矩形は枠と認識される。
【0026】
図4は、二次判定の第2の例を示すフローチャートである。まず、親矩形と白画素矩形の座標Xs(XsoとXsw)のずれ,Ys(YsoとYsw)のずれ、Xe(XeoとXew)のずれ、Ye(YeoとYew)のずれが計算され(ステップ400)、その最大のずれと最小のずれの差が求められる(ステップ401)。この差が閾値th2(例えば5)と比較され(ステップ402)、差が閾値th2以下ならば条件成立とされ(ステップ403)、そうでなければ条件不成立とされる(ステップ404)。
【0027】
二次判定の第1例の説明中で挙げた親矩形と白画素矩形の場合、
Xsのずれ=7、Ysのずれ=10、Xeのすれ=8、Yeのずれ=7
であり、その最大値10と最小値7の差はで、これは閾値th2(ここでは5)以下であるので、条件は成立し、したがって親矩形は枠として認識される。
【0028】
図5は、二次判定の第3の例を示すフローチャートである。まず、親矩形と白画素矩形の座標Xs(XsoとXsw)のずれ,Ys(YsoとYsw)のずれ、Xe(XeoとXew)のずれ、Ye(YeoとYew)のずれが計算され(ステップ500)、求められた各々のずれと、予め定められた枠を囲む罫線の太さ(例えば9)との差が計算される(ステップ501)。算出された各々の差と閾値th3(例えば4)が比較され(ステップ502)、いずれの差も閾値th3以下ならば条件成立とされ(ステップ503)、いずれか1つの差でも閾値th3を越えるならば条件不成立とされる(ステップ504)。
【0029】
二次判定の第1例の説明中で挙げた親矩形と白画素矩形の場合、Xsのずれ=7、Ysのずれ=10、Xeのずれ=8、Yeのずれ=7と罫線太さ(ここでは9)との差は最大で2となるため、条件は成立し、したがって親矩形は枠として認識されることになる。
【0030】
図6は、二次判定の第4の例を示すフローチャートである。まず、親矩形の内部において水平又は垂直方向の黒ラン抽出が行われ、抽出された黒ランの長さのヒストグラムが作成される(ステップ600)。親矩形は、内部が塗り潰されていない枠であるから(内部が塗り潰された枠は一次判定で枠候補から排除されている)、このヒストグラムの最頻値を、枠を構成する罫線の太さとみなすことができる。この仮定に立って、ヒストグラムの最頻値の黒ラン長が罫線の太さと推定される(ステップ601)。次に、親矩形と白画素矩形の座標Xs(XsoとXsw)のずれ,Ys(YsoとYsw)のずれ、Xe(XeoとXew)のずれ、Ye(YeoとYew)のずれが計算され(ステップ602)、求められた各々のずれと、ステップ601で推定された罫線の太さとの差が計算される(ステップ603)。算出された各々の差と閾値th3(例えば4)が比較され(ステップ604)、いずれの差も閾値th3以下ならば条件成立とされ(ステップ605)、いずれか1つの差でも閾値th3を越えると条件不成立とされる(ステップ606)。以上の第1例乃至第4例の二次判定によれば、1文字記入枠やチェツクボックスのような、従来技術では認識が困難な文字サイズ程度以下の枠を精度よく弁別できるが、本第4例の二次判定によれば、枠線(罫線)の太さの違いに適応し、様々な太さの枠線からなる枠を精度よく認識できる。
【0031】
さて、親矩形が枠である場合でも、枠線(罫線)のある辺が、かすれにより切れた場合、その辺については、親矩形と白画素矩形とが重なってしまう。例えば、前述の二次判定の第1例で挙げた親矩形の左辺の罫線がかすれで切れたとすると、抽出される白画素矩形の座標はXsw=365,Ysw=850,Xew=392,Yew=898となり、Ysw=Ysoであるため、判定結果は不成立となってしまう。
【0032】
このような、かすれによる枠線の切れに対処するための二次判定の第5の例を図7のフローチャートにより説明する。まず、図5又は図6に示した判定処理が行われ(ステップ700)、その判定結果が調べられる(ステップ701)。それが「成立」ならば、最小的な判定結果は「成立」とされる(ステップ705)。しかし、ステップ700の判定結果が「不成立」ならば、親矩形と白画素矩形の座標Xs,Ys,Xe,Yeの中で一致するものがあるか調べられ(ステップ702)、一致する座標がなければ最終的な判定結果は「不成立」とされる(ステップ704)。
【0033】
一致する座標があるならば、その座標位置の枠線を構成する罫線の有無の判定が行われる(ステップ703)。例えば、Xsの座標が一致しているならば、かすれにより左辺の枠線がかすれで切れている場合が考えられるので、左辺の位置について罫線有無判定が行われる。この判定の方法としては、例えば、対象とする辺の位置にある黒画素をカウントし、カウント値が閾値を越えたときに「罫線有り」、閾値を下回るときに「罫線無し」、とするような単純な方法で構わない。罫線があると判定した場合には、二次判定の最終結果は「成立」とされ(ステップ705)、罫線がない場合には二次判定の最終結果は「不成立」とされる(ステップ704)。
【0034】
本例によれば、例えば、もともと1辺又は2辺に罫線がない「コ」や「し」といった文字の黒画素矩形を枠と誤認識することなく、かすれにより枠線が切れた枠の認識率を向上させることができる。
【0035】
図8は、二次判定の第6の例を示すフローチャートである。本例も、前記第5例と同様に枠線のかすれによる切れを救済することができる。
【0036】
まず、親矩形の罫線の太さが推定される(ステップ800)。その推定方法は、図6のステップ600,601に関連して説明したように、親矩形の内部について水平又は垂直方向の黒ランの長さを調べてヒストグラムを作成し、その最頻値の黒ランの長さを罫線の太さとする方法でよい。
【0037】
親矩形と白画素矩形の座標Xsのずれが計算され、同ずれが基準値Thに設定される(ステップ801)。そして、この基準値Thが、推定した罫線の太さの2倍以上であるか判定され(ステップ802)、そうであるならば判定結果は「不成立」とされる(ステップ807)。
【0038】
基準値Thが罫線太さの2倍より小さいときには、親矩形と白画素矩形のXe,Ys,Yeのずれが計算され、いずれの座標のずれも(Th+5)以上であるか否かの判定が行われ(ステップ803)、そうであるならば「不成立」とされる(ステップ807)。いずれかの座標のずれが(Th+5)未満であるならば、親矩形と白画素矩形の座標の一致があるか判定される(ステップ804)。座標の一致がなければ判定結果は「成立」とされる(ステップ806)。座標の一致がある場合には、その一致した座標位置について罫線の有無が判定される(ステップ805)。この罫線の有無判定は、図7のステップ703と同様の方法で行えばよい。そして、罫線があると判定されたときには、かすれにより枠線が切れている場合と考えられるため、最終的な判定結果は「成立」とされる(ステップ806)。しかし、罫線がないと判定されたときには、最終的な判定結果は「不成立」とされる(ステップ807)。
【0039】
以上説明した本実施の形態の枠認識装置、あるいは、その処理内容を一般的なコンピュータの資源を利用して、ソフトウェアにより実現することも可能であり、そのような枠認識装置も本発明に包含される。コンピュータ上で、枠認識装置もしくはその処理内容を実現するためのプログラムは、それが記録された磁気ディスク、光ディスク、光磁気ディスク、半導体記憶素子などの各種記録媒体よりコンピュータに読み込まれ、あるいは、ネットワークを介してコンピュータに取り込まれて実行されることになる。そのようなプログラムが記録された各種記録媒体も本発明に包含される。また、本実施の形態の枠認識装置による枠認識処理の方法も本発明に包含される。
【0040】
図9は、本発明の他の実施の形態を示すブロック図である。図9において、図1と同一部分又は対応部分には同一の符号が付されている。
【0041】
本実施の形態の枠認識装置は、前記実施の形態の枠認識装置と同様な画像入力部100、画像圧縮部101、画像記憶部102、黒画素矩形抽出部103、一次判定部104、白画素矩形抽出部105、二次判定部106、作業用記憶部107、出力部108、制御部109のほかに、仮想連続枠領域生成部120と黒画素矩形統合部121を含む構成である。本実施の形態の枠認識装置は、概念的には、黒画素矩形統合部121により統合された黒画素矩形に関する枠認識処理部123を含む。しかし、枠認識モジュール110が枠認識処理部123として兼用されるため、実際的には枠認識ジュール110と別個に枠認識処理部123が設けられるわけではない。このように枠認識モジュール110を枠認識処理部123として利用する構成によれば、枠認識装置のコスト削減が可能であり、また、枠認識装置をコンピュータを利用してソフトウェアで実現する場合には、そのためのプログラムがコンパクトになり、必要メモリ容量も削減されるという利点がある。
【0042】
ただし、枠認識モジュール110とは別に枠認識処理部123を設ける構成も可能であり、このような構成によれば、枠認識処理部123で枠認識モジュール110とは異なる処理アルゴリズムを利用することができるため、処理の自由度は増大する。
【0043】
また、本実施の形態の枠認識装置においても、前記従来技術などにより枠を認識するための処理部分を追加し、この処理部分により認識された枠も処理結果として出力させることが可能である。すなわち、本実施の形態も前記従来技術などとの組み合わせが可能である。
【0044】
図10、本実施の形態の枠認識装置の全体的な動作を示すフローチャートである。以下、図9のブロック図及び図10のフローチャートを参照し、本実施の形態の枠認識装置の構成と動作について説明する。
【0045】
画像入力部100によって文書画像データ(2値データ)が入力され、画像記憶部102に格納される(ステップ900)。必要に応じて、入力された文書画像データに対し画像圧縮部101でOR圧縮(縮小)処理が施される。
【0046】
次に、黒画素矩形抽出部103において、画像記憶部101内の文書画像データ(入力された文書画像データ又はそのOR圧縮データ)より、黒画素の連結成分の外接矩形(黒画素矩形)が抽出される(ステップ901)。この黒画素矩形抽出は、文書画像の全体又は予め指定された処理領域について行われる。抽出された各黒画素矩形の領域情報として、例えば、左上コーナーと右下コーナーの座標が作業用記憶部107に記憶される。
【0047】
黒画素矩形抽出の処理が終わると、枠認識モジュール110による枠認識処理が実行される(ステップ902)。このステップの処理内容は、図2のフローチャートにおけるステップ202〜210の処理ループと同様であるので、その説明は繰り返さない。
【0048】
本実施の形態の枠認識装置は、ステップ903以降で、ステップ902の枠認識処理により認識された枠に関する情報を利用することにより、罫線のかすれなどが原因で認識に失敗した枠の認識を再度試みることに特徴がある。一般に、枠の配置には連続性があるため、すでに枠として認識されている黒画素矩形の位置などから、枠である可能性の高い黒画素矩形を容易に推定可能である。
【0049】
そこで、枠の連続性に着目し、仮想連続枠領域生成部120において、既に枠として認識された黒画素矩形の連続した領域(仮想連続枠領域)を生成する(ステップ903)。枠は1つだけ単独に存在することもあり得るが、口座番号、電話番号、氏名、住所などを記入するための枠のように、複数個の枠が一列に並んで配置されていることが多い。また、連続した枠の大きさは均等であることが多い。特に、マークシート帳票などでは、行単位に整合をとるため、枠が正確にマトリクス配置されていることが多い。そして、多くの帳票は横書きであるため、枠は行方向すなわち水平方向(X方向)に配列されている場合が圧倒的に多い。そこで、例えば、枠として認識された黒画素矩形の中で、垂直方向(Y方向)に重なりのあるものを水平方向に統合し、統合領域を文書画像の横幅一杯に(あるいは、指定された処理対象領域の横幅一杯に)拡張することにより仮想連続枠領域を生成する。
【0050】
図11において、951,952,953は仮想連続枠領域の例である。これら仮想連続枠領域951〜953の内部に示された図形Sは枠として認識された黒画素矩形(又は枠画像)であり、図形Fは枠線がかすれにより切れたために認識に失敗した枠画像である。仮想連続枠領域を文書画像(又は指定された処理対象領域)の横幅一杯に拡張した理由は、仮想連続枠領域953に見られるように、認識に成功した枠より外側に、認識に失敗した枠が存在し得るからである。
【0051】
なお、縦書き帳票のように、枠が垂直方向に配列されている場合には、垂直方向に枠を統合することによって仮想連続枠領域を生成するとよい。また、仮想連続枠領域生成部120において、認識された枠の連続方向を自動判定し、判定した方向の仮想連続枠領域を生成するようにしてもよい。さらに、枠として認識された黒画素矩形を大きさによって分類し、同一カテゴリの黒画素矩形のみを仮想連続枠領域の生成に利用するようにしてもよい。
【0052】
このような仮想連続枠領域の生成処理が終了すると、1つの仮想連続枠領域が選択される(ステップ904)。黒画素矩形統合部121において、この仮想連続枠矩形領域に含まれている、枠候補とされたが枠としては認識されなかった黒画素矩形で、1つの枠を構成している可能性の高い黒画素矩形を統合する処理を行う(ステップ905)。具体的には、図11に図形Fとして示されている枠画像の黒画素矩形のような、水平方向(X方向)に重なっている黒画素矩形を1つの黒画素矩形に統合する。また、図12に示すような水平方向に重なりのない黒画素矩形であっても、水平方向の距離が近く、かつ、高さの差が小さい黒画素矩形も統合する。次に、このようにして統合された各黒画素矩形を対象として、枠認識モジュール110で枠認識処理を行う(ステップ906)。このような処理によって、前記第1の実施の形態の枠認識装置では認識できない、かすれにより枠線の2辺が分断されたような枠も認識可能となる。
【0053】
1つの仮想連続枠領域の処理が終了すると、ステップ904に戻り、別の仮想連続枠領域が選択され、同様の処理が繰り返される。全ての仮想連続枠領域に対する処理が終わると(ステップ907,No)、認識された枠の領域情報が出力部108により出力され(ステップ908)、一連の動作を終了する。
【0054】
なお、枠認識モジュール110とは別に枠認識処理部123が設けられる場合には、ステップ906は枠認識処理部123によって実行されることになる。この場合、例えば特開平11−66225号公報に述べられているように、統合された黒画素矩形について、罫線の分断を判定し、分断された罫線を接続したうえで、罫線で四方を囲まれている場合には枠として認識するような処理方法も利用できる。
【0055】
また、本実施の形態の枠認識装置あるいはその処理内容をコンピュータ上でソフトウェアにより実現することも可能であり、そのような枠認識装置も本発明に包含される。また、そのためのプログラムが記録された各種記録媒体も本発明に包含される。本実施の形態の枠認識装置による枠認識処理の方法も本発明に包含される。
【0056】
なお、図11及び図12に関連して単純枠を例に挙げて説明したが、複雑枠であっても1文字が記入されるような小さな枠を同様に精度よく認識できる。
【0057】
【発明の効果】
以上、詳細に説明したように、本発明によれば、単純枠なども含め、高精度に枠を認識可能となる。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態を示すブロック図である。
【図2】第1の実施の形態による枠認識装置の全体的動作を説明するためのフローチャートである。
【図3】二次判定の第1の例を説明するためのフローチャートである。
【図4】二次判定の第2の例を説明するためのフローチャートである。
【図5】二次判定の第3の例を説明するためのフローチャートである。
【図6】二次判定の第4の例を説明するためのフローチャートである。
【図7】二次判定の第5の例を説明するためのフローチャートである。
【図8】二次判定の第6の例を説明するためのフローチャートである。
【図9】本発明の第2の実施の形態を説明するためのブロック図である。
【図10】第2の実施の形態による枠認識装置の全体的動作を説明するためのフローチャートである。
【図11】仮想連続枠領域の説明図である。
【図12】水平方向に重なりのない黒画素矩形の統合の説明のための図である。
【図13】表形式の枠の例を示す図である。
【図14】梯子形式の枠の例を示す図である。
【図15】独立形式の枠の例を示す図である。
【符号の説明】
100 画像入力部
101 画像圧縮部
102 画像記憶部
103 黒画素矩形抽出部
104 一次判定部
105 白画素矩形抽出部
106 二次判定部
107 作業記憶部
108 出力部
109 制御部
110 枠認識モジュール
120 仮想連続枠領域生成部
121 黒画素矩形統合部
123 枠認識処理部

Claims (8)

  1. 入力画像データより黒画素の連結成分の外接矩形(以下、黒画素矩形と呼ぶ)を抽出する黒画素矩形抽出手段と、
    前記黒画素矩形抽出手段によって抽出された黒画素矩形について、該黒画素矩形の領域情報を用いて該黒画素矩形を枠候補又は非枠候補に弁別する一次判定手段と、
    前記一次判定手段によって枠候補と弁別された前記黒画像矩形の内部より白画素の連結成分の外接矩形(以下、白画素矩形と呼ぶ)を抽出する白画素矩形抽出手段と、
    前記白画素矩形抽出手段によって抽出された前記白画素矩形と、前記黒画素矩形との位置関係とから、該黒画素矩形を枠又は非枠に弁別する二次判定手段と、
    を有することを特徴とする枠認識装置。
  2. 前記一次判定手段は、前記黒画素矩形の大きさ、縦横比、及び該黒画素矩形内部における黒画素の密度を用いて該黒画素矩形を枠候補又は非枠候補に弁別することを特徴とする請求項1記載の枠認識装置。
  3. 前記二次判定手段は、前記白画素矩形と、前記黒画素矩形との重心のずれとから、該黒画素矩形を枠又は非枠に弁別することを特徴とする請求項1又は2記載の枠認識装置。
  4. 前記二次判定手段は、前記黒画素矩形のコーナー座標と前記白画素矩形のコーナー座標とのずれ量における最大値と最小値の差から、該黒画素矩形を枠又は非枠に弁別することを特徴とする請求項1又は2記載の枠認識装置。
  5. 前記二次判定手段において、前記黒画素矩形を非枠に弁別した場合に、前記黒画素矩形と前記白画素矩形のコーナー座標と、前記白画素矩形のコーナー座標のうち少なくとも一つの座標が一致する場合、該一致する座標を含む前記黒画素矩形を構成する辺であって、該一致する座標を含む前記白画素矩形を構成する辺に含まれる該黒画素矩形を構成する辺に基づいて、該黒画素矩形を再度枠又は非枠に弁別することを特徴とする請求項1乃至4のいずれか1項に記載の枠認識装置。
  6. 前記二次判定手段において、該一致する座標を含む前記黒画素矩形を構成する辺であって、該一致する座標を含む前記白画素矩形を構成する辺に含まれる該黒画素矩形を構成する辺の有無から該黒画素矩形を再度枠又は非枠に弁別することを特徴とする請求項5記載の枠認識装置。
  7. 該辺の位置にある黒画素数が所定の閾値を超えたときに、該黒画素矩形が枠であると弁別することを特徴とする請求項5または6記載の枠認識装置。
  8. コンピュータが読み取り可能な記録媒体であって、請求項1乃至7のいずれか1項記載の枠認識装置の機能をコンピュータで実現するためのプログラムが記録されたことを特徴とする記録媒体。
JP2000228083A 2000-07-28 2000-07-28 枠認識装置及び記録媒体 Expired - Fee Related JP3995185B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2000228083A JP3995185B2 (ja) 2000-07-28 2000-07-28 枠認識装置及び記録媒体
US09/904,473 US7003159B2 (en) 2000-07-28 2001-07-13 Document frame recognition system and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000228083A JP3995185B2 (ja) 2000-07-28 2000-07-28 枠認識装置及び記録媒体

Publications (2)

Publication Number Publication Date
JP2002042143A JP2002042143A (ja) 2002-02-08
JP3995185B2 true JP3995185B2 (ja) 2007-10-24

Family

ID=18721443

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000228083A Expired - Fee Related JP3995185B2 (ja) 2000-07-28 2000-07-28 枠認識装置及び記録媒体

Country Status (2)

Country Link
US (1) US7003159B2 (ja)
JP (1) JP3995185B2 (ja)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7321687B2 (en) * 2002-03-07 2008-01-22 Canon Kabushiki Kaisha Apparatus and method for image processing to label an object in a binary image
JP4079087B2 (ja) * 2003-03-12 2008-04-23 セイコーエプソン株式会社 レイアウトシステム
US7336396B2 (en) * 2003-03-20 2008-02-26 Kabushiki Kaisha Toshiba Image processing apparatus and image processing method
US7428700B2 (en) * 2003-07-28 2008-09-23 Microsoft Corporation Vision-based document segmentation
JP2006074512A (ja) * 2004-09-02 2006-03-16 Casio Comput Co Ltd 撮影装置、撮影装置の画像処理方法及びプログラム
US20070168382A1 (en) * 2006-01-03 2007-07-19 Michael Tillberg Document analysis system for integration of paper records into a searchable electronic database
JP4869841B2 (ja) * 2006-03-14 2012-02-08 株式会社リコー 画像処理装置、画像方向判別方法、および画像方向判別プログラム
JP4860574B2 (ja) * 2006-09-13 2012-01-25 株式会社キーエンス 文字切り出し装置、方法およびプログラム
JP4774390B2 (ja) * 2006-09-13 2011-09-14 株式会社キーエンス 文字切り出し装置、方法およびプログラム
US20090208055A1 (en) * 2008-02-20 2009-08-20 Lockheed Martin Corporation Efficient detection of broken line segments in a scanned image
JP4491488B2 (ja) * 2008-03-03 2010-06-30 シャープ株式会社 画像処理装置、画像読取装置、画像データ出力処理装置、および画像処理方法
JP4909311B2 (ja) * 2008-03-31 2012-04-04 富士通フロンテック株式会社 文字認識装置
CN101551859B (zh) * 2008-03-31 2012-01-04 夏普株式会社 图像辨别装置及图像检索装置
JP5171421B2 (ja) * 2008-06-18 2013-03-27 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム
JP5208043B2 (ja) * 2009-04-16 2013-06-12 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
JP2012190434A (ja) * 2011-02-24 2012-10-04 Ricoh Co Ltd 帳票定義装置、帳票定義方法、プログラム及び記録媒体
US20160209989A1 (en) * 2013-09-30 2016-07-21 Jin-Feng Luan Record and replay of operations on graphical objects
CN110543624B (zh) * 2018-05-28 2023-06-23 珠海金山办公软件有限公司 一种pdf文档中复选框的识别方法、装置及电子设备
US11113559B2 (en) 2018-07-20 2021-09-07 Ricoh Company, Ltd. Information processing apparatus for improving text data recognition, information processing method, and non-transitory recording medium
US11151373B2 (en) 2018-07-20 2021-10-19 Ricoh Company, Ltd. Information processing apparatus and information processing method
US11416674B2 (en) 2018-07-20 2022-08-16 Ricoh Company, Ltd. Information processing apparatus, method of processing information and storage medium

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2713622B2 (ja) * 1989-11-20 1998-02-16 富士通株式会社 表形式文書読取装置
JP2579397B2 (ja) * 1991-12-18 1997-02-05 インターナショナル・ビジネス・マシーンズ・コーポレイション 文書画像のレイアウトモデルを作成する方法及び装置
JP3253356B2 (ja) * 1992-07-06 2002-02-04 株式会社リコー 文書画像の領域識別方法
JP3302147B2 (ja) * 1993-05-12 2002-07-15 株式会社リコー 文書画像処理方法
JPH0721310A (ja) * 1993-06-30 1995-01-24 Matsushita Electric Ind Co Ltd 文書認識装置
US5706096A (en) * 1994-04-25 1998-01-06 Ricoh Company, Ltd. Optimum line density determining method and system
US5898795A (en) * 1995-12-08 1999-04-27 Ricoh Company, Ltd. Character recognition method using a method for deleting ruled lines
JP3830998B2 (ja) * 1995-12-28 2006-10-11 株式会社東芝 罫線除去方法及びこれを用いた文字認識装置
JP3615333B2 (ja) * 1996-12-05 2005-02-02 株式会社リコー 罫線消去装置
US6226402B1 (en) * 1996-12-20 2001-05-01 Fujitsu Limited Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
US6327387B1 (en) * 1996-12-27 2001-12-04 Fujitsu Limited Apparatus and method for extracting management information from image
JP3606500B2 (ja) * 1997-01-31 2005-01-05 株式会社リコー 矩形分類方法
JP3846752B2 (ja) 1997-03-06 2006-11-15 株式会社リコー 罫線消去方法
JPH1166225A (ja) 1997-08-25 1999-03-09 Ricoh Co Ltd 表情報抽出装置及び方法並びに記録媒体
US6636631B2 (en) * 1998-06-04 2003-10-21 Matsushita Electric Industrial Co., Ltd. Optical character reading method and system for a document with ruled lines and its application
JP2001060247A (ja) * 1999-06-14 2001-03-06 Fuji Xerox Co Ltd 画像処理装置および画像処理方法
JP4040231B2 (ja) 2000-02-18 2008-01-30 株式会社リコー 文字抽出方法及び装置並びに記憶媒体
JP2001236464A (ja) 2000-02-25 2001-08-31 Ricoh Co Ltd 文字抽出方法、文字抽出装置及び記憶媒体
JP4159720B2 (ja) * 2000-03-15 2008-10-01 株式会社リコー 表認識方法と表認識装置と文字認識装置及び表認識プログラムを記録した記憶媒体

Also Published As

Publication number Publication date
US20020025072A1 (en) 2002-02-28
JP2002042143A (ja) 2002-02-08
US7003159B2 (en) 2006-02-21

Similar Documents

Publication Publication Date Title
JP3995185B2 (ja) 枠認識装置及び記録媒体
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
US7254270B2 (en) System and method for bounding and classifying regions within a graphical image
JP3278471B2 (ja) 領域分割方法
US20070081179A1 (en) Image processing device, image processing method, and computer program product
JP2008148298A (ja) 画像における異なった内容の領域を識別する方法、画像における異なった内容の領域を識別する装置、および画像における異なった内容の領域を識別するコンピュータ・プログラムを具現するコンピュータ読み取り可能な媒体
JP4159720B2 (ja) 表認識方法と表認識装置と文字認識装置及び表認識プログラムを記録した記憶媒体
JP2006067585A (ja) デジタル画像におけるキャプションを位置特定及び抽出する方法及び装置
JP2002298085A (ja) 文字認識装置、文字認識方法、及び記録媒体
JP2000194850A (ja) ユ―ザ囲み領域の抽出装置及び抽出方法
US8306335B2 (en) Method of analyzing digital document images
JP4164489B2 (ja) 文書画像強調方法、装置及びそのための記憶媒体
US6289120B1 (en) Method and system for processing images of forms which have irregular construction and/or determining whether characters are interior to a form
US20090316219A1 (en) Image processing apparatus, image processing method and computer-readable storage medium
JP3215163B2 (ja) 罫線識別方法及び領域識別方法
JP2002342710A (ja) 文字切出し装置及びそれに用いる文字切出し方法並びにそのプログラム
JP2000090194A (ja) 画像処理方法および画像処理装置
JPH11191135A (ja) 文書画像の日本語英語判定方法、文書認識方法および記録媒体
JP4079411B2 (ja) 画像処理方法、画像処理装置、画像処理プログラムおよび画像処理プログラムが格納されたコンピュータ読み取り可能な記憶媒体
WO2023042270A1 (ja) 文字認識プログラム、文字認識システム、及び文字認識方法
JP3391987B2 (ja) 帳票認識装置
JP3406942B2 (ja) 画像処理装置及び方法
JP4040231B2 (ja) 文字抽出方法及び装置並びに記憶媒体
JPH05159062A (ja) 文書認識装置
JP3220226B2 (ja) 文字列方向判別方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070110

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070312

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070425

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070622

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070725

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070727

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100810

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100810

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100810

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110810

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110810

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120810

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120810

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130810

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees