JP3402755B2 - 領域分割方法 - Google Patents

領域分割方法

Info

Publication number
JP3402755B2
JP3402755B2 JP13165194A JP13165194A JP3402755B2 JP 3402755 B2 JP3402755 B2 JP 3402755B2 JP 13165194 A JP13165194 A JP 13165194A JP 13165194 A JP13165194 A JP 13165194A JP 3402755 B2 JP3402755 B2 JP 3402755B2
Authority
JP
Japan
Prior art keywords
rectangle
character
rectangles
processing
integrated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP13165194A
Other languages
English (en)
Other versions
JPH07334614A (ja
Inventor
敏文 山合
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP13165194A priority Critical patent/JP3402755B2/ja
Publication of JPH07334614A publication Critical patent/JPH07334614A/ja
Application granted granted Critical
Publication of JP3402755B2 publication Critical patent/JP3402755B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Image Analysis (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字認識装置(OC
R)の前処理部、ファクシミリやテレックス等の通信機
器、光ファイル等の画像データベース入力等に利用され
る画像処理技術に係り、特に、文書等の画像データよ
り、文字領域や図表領域等の属性の異なる情報領域を抽
出するための領域分割技術に関する。
【0002】
【従来の技術】文字領域や図表領域等の属性の異なる情
報領域が混在した文書等の文字認識を行なう場合、ある
いは、そのような文書等の画像を光ディスク等の記憶メ
ディア上にファイリングしたりファクシミリで送信した
りする場合等に、しばしば、画像を属性の異なる情報領
域毎に分割し、各領域毎に処理方法を切り替えたり、あ
るいは特定の領域だけを特定の処理の対象にする等の制
御が必要になる。
【0003】従来、このような領域分割に関して、周辺
分布を用いて文字領域とその他の領域とに切り分ける方
法(特開昭62−71379号)や、周辺分布を利用し
て黒画素群の外接矩形を抽出し、それらをパラメータ処
理により統合していくことによって文字領域を構成し、
他の領域と分割する方法(特開平3−126181号)
が知られている。
【0004】しかし、前者の方法は、画像のスキューへ
の対応が難しく、さらには、対象とする文書毎にパラメ
ータの設定が必要になるという難点がある。後者の方法
も外接矩形の抽出に周辺分布を利用する関係から、画像
のスキューの程度によってはスキュー補正処理が必要に
なるという問題点がある。また前者の方法は、文字領域
において矩形の重なりがある場合や、囲み記事の領域が
含まれるような構造の複雑な文書への対応が困難である
という難点がある。
【0005】また、矩形統合により文字領域を抽出する
領域分割の方法として、本出願人の特願平5−1591
90号の明細書に記載された方法がある。この方法で
は、文書等の画像を予め所定倍率で圧縮し、その圧縮画
像より黒画素連結成分に外接する矩形を抽出し、画像圧
縮による文字の矩形の融合度合に応じて、あるいは、行
方向に近接した文字の矩形間の距離の分布に応じて、文
字の矩形を行方向へ統合するためのパラメータ(矩形間
距離の閾値)を自動的に変化させるなどによって、スキ
ュー補正を不要とし、かつ、複雑な文書構造、様々な文
字サイズの文書に対応することが可能である。しかしな
がら、この方法によっても、様々な文書類に適用した場
合、例えば、英文書等でコラム間の距離よりも単語間距
離のほうが大きい場合などに、同一行が複数の行に分解
されてしまって正確な文字領域の抽出ができないような
ケースを生じることが判明している。
【0006】
【発明が解決しようとする課題】上に述べた特願平5−
159190号の領域分割方法は、2個の文字の矩形を
同一行として統合するか否かの判定を固定又は可変のパ
ラメータ(例えば矩形間距離)によって行なう方式であ
る。このパラメータ処理方式は高速処理が可能である反
面、上に述べたように、正確な結果を得られる対象文書
の許容度が小さい。
【0007】本発明は、文字矩形を統合して文字領域を
生成するというボトムアップ的手法による領域分割方法
において、パラメータ処理方式だけでは正確な領域分割
結果が得られないような文書画像等に対しても対応でき
るようにし、処理可能な文書等の許容度を拡大しようと
するものである。
【0008】
【課題を解決するための手段】本発明の骨子は、文書等
の画像を所定倍率で圧縮した画像より黒画素連結成分に
外接した矩形を抽出し、抽出した矩形の中で文字の矩形
と判断される矩形を行方向へ統合する領域分割方法にお
いて、文字矩形の統合を行なう際に、注目した2個の文
字矩形が同一行として統合できるか否かを判断するため
の条件として、当該2個の文字矩形と、これら2個の文
字矩形が含まれない行の他の文字矩形又は他の文字矩
形の統合された行との位置関係に関する条件を含むこと
である。
【0009】注目した2個の文字矩形と、これら2個の
文字矩形が含まれない行の他の文字矩形または行との位
置関係の条件の具体的な例としては、後記実施例に関連
して詳細に説明するような、該2個の文字矩形のそれぞ
れと、その上側又は下側の接近した他の文字矩形又は行
との、先頭位置又は末尾位置の行方向の距離に関する条
件、あるいは、該2個の文字矩形の間の空間の上又は下
に設定した仮想領域と、他の文字矩形又は行との重なり
の関係の条件などがある。
【0010】
【作用】パラメータ方式では、統合判定のためのパラメ
ータを大きめに設定すると、同一行であるべき行が分割
されてしまったり、逆にパラメータを小さめにすると、
別々のコラムの行が統合されてしまうといった不都合が
起きやすい。
【0011】これに対し、上述のように本発明の方法
は、2つの文字矩形を同一行として統合すべきか否かの
判断の際に、周辺の文字矩形又は行との位置関係を参照
するため、そのような不都合を回避することができる。
【0012】より具体的に述べれば、複数のコラム(文
字領域)がある場合、各コラム内の行の先頭又は末尾が
揃っていることが多い。また、複数行からなるコラム内
では、各行を構成する文字矩形と文字矩形との間の空間
の上又は下に、上または下の行を構成する文字矩形が存
在する確率が高い。本発明によれば、そのような性質を
利用し、パラメータ処理では正しい判定が困難な文字矩
形の統合判定を的確に行なうことができる。
【0013】なお、上に述べた注目した文字矩形と、他
の文字矩形又は行との位置関係に関する条件による統合
判定と、固定又は可変パラメータによる統合判定とを組
合わせる態様も当然に本発明の範囲に含まれるものであ
り、それによりパラメータ方式の高速性を活かしつつ、
パラメータ方式のみでは正確な領域分割結果が得られな
いような文書等に対しても高精度の領域分割が可能とな
る。
【0014】
【実施例】以下、本発明のいくつかの実施例について、
図面を用い説明する。
【0015】図1は、各実施例のための装置例を示すブ
ロック図である。図1において、スキャナ1により読み
取られた文書画像の2値データは、画像入力部2によっ
て画像メモリ3に格納される。画像メモリ3内の文書画
像データは、領域識別部6内の画像圧縮部7に読み出さ
れ、ここで所定の圧縮率のOR圧縮を施されてから画像
メモリ3に戻される。画像メモリ3内の文書画像データ
は、画像表示部4によってディスプレー5に表示させる
ことができる。なお、画像入力部2より文書画像データ
を画像圧縮部7へ直接入力し、ここで圧縮した画像デー
タを画像メモリ3に格納することも可能である。
【0016】領域識別部6は、前記の画像圧縮部7と、
外接矩形検出部8、矩形分類部9、文字領域統合部10
から構成されている。各部の役割は次のとおりである。
【0017】外接矩形検出部8は、画像メモリ3内の圧
縮された文書画像データより、黒画素の繋りを調べ、黒
画素連結成分に外接する矩形を抽出する部分である。こ
こで抽出された矩形には、文字(1文字又は2文字以上
の文字列)の矩形のほか、罫線、ノイズ、表、図その
他、様々な属性の矩形が含まれる。
【0018】矩形分類部9は、このような様々な属性の
矩形を、矩形の内部データ、矩形の形状等から判別分類
する部分である。この分類のための具体的な方法は様々
なものが知られているが、例えば先に引用した特願平5
−159190号の明細書に述べられているような方法
を利用してよい。
【0019】文字領域統合部10は、矩形分類部9によ
って文字に分類された矩形に対して統合処理を行ない、
文字領域に統合する部分である。本発明は、この文字領
域統合部10に関わるものである。
【0020】領域識別部6による領域識別の結果は文字
認識部11による文字認識処理に利用される。つまり、
ここに示す例にあっては領域識別部6は光学的文字認識
の前処理部として利用される。ただし、これは一例に過
ぎないことは当然である。
【0021】図2は、文字領域統合部10の内部構成の
例を示すブロック図である。図2の(a)は後記実施例
1及び実施例2に係る構成を示しており、(b)は後記
実施例3に係る構成を示している。
【0022】図2において、パラメータ設定部10Aは
文字領域を統合していく上で閾値となるパラメータを設
定する部分である。このパラメータは、予め対象文書の
種類に応じた固定値を設定するようにしてもよいし、あ
るいは、先に引用した特願平5−159190号の明細
書に述べられているように、文字矩形の融合度合や行方
向に近接した文字矩形の距離の分布に基づいて自動的に
設定させるようにしてもよい。
【0023】文字間統合処理部10Bは、文字矩形を行
方向に統合する処理を行なう部分である。図2(b)に
示した文字間再統合処理部10Cは、文字間統合処理部
10Bと実質的に同一の統合処理を行なう部分であり、
これは後記実施例3でのみ必要となる。文字間統合処理
部10Bと文字間再統合処理部10Cとが、本発明の要
旨に直接関連する部分である。
【0024】行間統合処理部10Dは、行方向への文字
矩形の統合により得られた行を、行と垂直な方向へ統合
することによって、文字領域を抽出する部分である。こ
の統合処理の具体的な方法は様々なものが知られている
が、その好ましい例が先に引用した特願平5−1591
90号の明細書に述べられている。
【0025】以上は各実施例に共通の説明である。文字
間統合処理部10B又は文字間再統合処理部10Cにお
ける統合処理について、実施例毎に詳細に説明する。な
お、便宜上、文書画像上の行の方向を水平方向として説
明する。
【0026】<実施例1>本実施例における文字間統合
処理部10Bの処理フローを図3に示す。まず、全ての
矩形より順に1個ずつ、処理矩形(矩形番号i)として
選び、それが文字の矩形であるか調べる処理を文字矩形
が見つかるまで繰り返す(ステップ301〜ステップ3
10)。この処理ループで調べる矩形がなくなった時点
で文字間統合処理は終了する。
【0027】1つの文字矩形が処理矩形として選び出さ
れると、この処理矩形に関するステップ315以下の処
理に入る。まず、処理矩形(矩形番号i)の次の矩形よ
り順に1個ずつ、処理矩形との統合の相手方となる矩形
(参照矩形と呼ぶ、矩形番号j)を選び、それが文字の
矩形であるか調べる処理を文字矩形が見つかるまで繰り
返す(ステップ315〜325)。矩形がなくなった時
点で、この処理ループを抜けてステップ301〜310
のループへ戻り、次の処理矩形に関する処理を開始す
る。
【0028】文字矩形である参照矩形が見つかると、処
理矩形と参照矩形との垂直方向(行の上下方向)の距離
が所定値を超えているか調べ(ステップ330)、この
垂直距離が所定値を超えているときには、この参照矩形
と処理矩形とは同一行の矩形である可能性がないのでス
テップ315に戻って次の参照矩形を探す。
【0029】垂直距離が所定値以下である場合、処理矩
形と参照矩形とは同一行の矩形である可能性があるの
で、両矩形間の水平方向の距離が閾値(パラメータ設定
部10Aで設定されたパラメータ)以下であるか調べる
(ステップ335)。ここまでがパラメータ方式による
統合判定処理である。そして、水平距離が閾値以下であ
れば、処理矩形と参照矩形とを統合し(ステップ36
0)、ステップ315に戻って次の参照矩形についての
処理に入る。
【0030】ステップ335で水平距離が閾値を超えて
いると判断した場合、処理矩形と参照矩形とを統合する
か否かを、別の文字の矩形(参照矩形[2]と呼ぶ)を
参照することによって判定する処理ループ(ステップ3
40〜355)に入る。まず、全ての矩形より1個ずつ
参照矩形[2]としての矩形(矩形番号k)を選び、そ
れが文字の矩形であるか調べる処理を、調べる矩形がな
くなるまで繰り返す(ステップ340〜350)。調べ
る矩形がなくなった時点で、この処理を抜けてステップ
315に戻る。
【0031】文字矩形である参照矩形[2]が見つかる
と、参照矩形[2]に関連した統合条件を調べる(ステ
ップ355)。「統合する(同一行である)」と判断し
た場合以外はステップ340へ戻る。統合する(同一行
である)と判断した場合には、ステップ360に進み処
理矩形と参照矩形とを統合した後に、ステップ315へ
戻る。
【0032】実際の処理の流れとしては、ステップ34
0〜355のループで、参照矩形[2]として選ばれた
文字矩形毎に条件を順次調べて、その結果をフラグ情報
として蓄積していき、このフラグ情報に基づいて「同一
行である」(統合する)か否かを判断する。例えば、あ
る処理矩形と参照矩形に関して、「同一行らしい」とい
う条件に2つ以上該当するか、「同一行である」という
条件に1つでも該当すれば「同一行である」と確定する
(統合する)。一方、「同一行でないらしい」という条
件に1つでも該当すれば、「同一行でない」と確定する
(統合対象から外す)。
【0033】なお、より一般的に言えば、複数の条件に
ついての判定結果を多値で分類し、統計的確率を用いて
最終判断を出す方法や、経験的結果をテーブルにしてお
いて、それを参照して判断する方法などが可能である。
【0034】次に、ステップ355における条件判定の
具体例を説明する。ここに示す例は、次の統合条件1−
1から統合条件1−3までの判定を行ない、その結果よ
り上に述べたルールによって最終的に判断する。
【0035】<統合条件1−1>複数のコラム(文字領
域)がある場合、各コラム内の行の先頭又は末尾が揃っ
ていることが多い。この性質を統合判定に利用する。
【0036】すなわち、矩形の処理順が文書画像の左上
角から右下角へ向かってラスタースキャンをするかの様
な順番であるとすると、処理矩形に対して参照矩形は右
側に位置する。もし、処理矩形と参照矩形とが別々のコ
ラムの行の文字矩形であれば(同一行として統合すべき
でない矩形であれば)、参照矩形の上又は下に先頭位置
の近い参照矩形[2]が見つかる可能性が高く、また、
左側の処理矩形の上又は下に末尾位置の近い参照矩形
[2]が見つかる可能性が高い。このような参照矩形
[2]が少なくとも1つ見つかった場合には、処理矩形
参照矩形とは「同一行でないらしい」と判定する。
【0037】図4は、この統合条件判定の説明図であ
る。(a)に示すように、参照矩形101の上側に先頭
位置の接近した(先頭位置の水平距離が所定値以下の)
文字矩形103が存在する場合、処理矩形102と参照
矩形101とは別コラムの行(別の行)である可能性が
高いので「同一行でないらしい」と判定される。同様の
文字矩形が参照矩形101の下側に存在する場合も「同
一行でないらしい」と判定される。
【0038】一方、図4(b)に示すように、処理矩形
102の上側に末尾位置の接近した(末尾位置の水平距
離が所定値以下の)文字矩形104が存在するときに
は、処理矩形102と参照矩形101とは別コラムの行
である可能性が高いので「同一行でないらしい」と判定
される。処理矩形102の下側に同様の文字矩形が存在
する場合も「同一行でないらしい」と判定される。
【0039】なお、処理矩形とその上又は下の文字矩形
との末尾位置の距離そのもの、参照矩形の上又は下の文
字矩形との先頭位置の距離そのもの、を特徴量として判
定を行なうことも可能である。
【0040】<統合条件1−2>複数行からなるコラム
内では、各行を構成する文字矩形と文字矩形との間の空
間の上又は下に、上または下の行を構成する文字矩形が
存在する確率が高いことに着目して、統合判定を行な
う。図5及び図6は、この統合条件判定の説明図であ
る。
【0041】この例では、図5に示すように、処理矩形
102と参照矩形101との間の空間の上及び下に、あ
る高さと幅を持つ矩形の仮想領域110,111を設定
する。仮想領域110,111の高さ(垂直方向の大き
さ)は例えばコラムの行ピッチ程度もしくは文字矩形か
ら推定される標準文字サイズ程度に選ぶことができる。
仮想領域110,111の幅(水平方向の大きさ)は、
矩形間距離より大きめにして、処理矩形102及び参照
矩形101に多少重なる(水平方向で)程度のマージン
を持たせる。このように多少のマージンを持たせる目的
は、スキューやスペース分のインデントによって、仮想
領域110,111が処理矩形102及び参照矩形10
1と重ならなくなることを防止するためである。仮想領
域110,111の水平方向の中心は、矩形間の空間の
中心に合わせる。上側の仮想領域110の底辺は、処理
矩形102の上辺と参照矩形101の上辺のうちの上側
のものに一致させる。下側の仮想領域111の上辺は、
処理矩形102の下辺と参照矩形101の下辺のうちの
下側のものに一致させる。
【0042】このような上下の仮想領域110,111
と重なりのある他の文字矩形を探し、また、重なりのあ
る文字矩形の重なりの度合い、その文字矩形が上下両方
にあるか等を特徴量として、処理矩形102と参照矩形
101とが同一行であるか否かを判定する。次に、図5
及び図6により、条件について説明する。
【0043】(条件1−2a)図5に示すように上側の
仮想領域110を含む(仮想領域の全幅にわたって重な
りのある)文字矩形121が存在するか、あるいは下側
の仮想領域111を含む文字矩形が存在する場合には、
処理矩形102と参照矩形101とを「同一行らしい」
と判定する。
【0044】(条件1−2b)図6(a)に示すよう
に、上側の仮想領域110を含む(仮想領域の全幅にわ
たって重なりのある)文字矩形122と、下側の仮想領
域111を含む文字矩形123とが両方存在する場合、
処理矩形102と参照矩形101とは「同一行である」
と判定する。
【0045】上下の仮想領域110,111のうち、一
方の仮想領域を含む文字矩形(図6(b)では文字矩形
124)が存在し、他方の仮想領域と部分的に重なりの
ある文字矩形(図6(b)では文字矩形125)が存在
する場合、前者の文字矩形とそれに近いほうの処理矩形
又は参照矩形(図6(b)では参照矩形101)との距
離Sp1と、後者の文字矩形とそれに近いほうの処理矩
形又は参照矩形(図6(b)では参照矩形101)との
距離Sp2が、Sp1≦Sp2ならば、処理矩形102
と参照矩形101は「同一行である」と判定する。Sp
1>Sp2のときは、図6(e)に示すようなタイトル
130の下の別々のコラム131,132中の先頭行の
文字矩形が処理矩形と参照矩形となっている場合が考え
られるので、判定を据え置く。
【0046】(条件1−2c)上側又は下側の仮想領域
110,111と部分的に重なりのある文字矩形(図6
の(c),(d)では文字矩形126,127)が存在
する場合に、Xs<VxsかつXe>Vxmであるとき
(図6(c)のケース) またはXs<VxmかつXe>Vxeであるとき(図6
(d)のケース) に、処理矩形102と参照矩形101を「同一行らし
い」と判定する。
【0047】ただし、図6の(c)及び(d)より明ら
かなように、Vxsは処理矩形102と参照矩形101
との間の空間の先端(処理矩形102の末尾)のX座
標、Vxeは同空間の末尾(参照矩形101の先端)の
X座標、Vsmは同空間の中線のX座標、XsとXeは
仮想領域110,111に部分的に重なりのある文字矩
形126,127の先頭と末尾のX座標である。
【0048】<統合条件1−3>図7に示すように、処
理矩形102と参照矩形101との間の空間の上下に、
上記統合条件1−2の場合と同様の仮想領域110,1
11を設定し、それぞれの仮想領域110,111に重
なりのある文字矩形が存在するか、さらに、処理矩形1
02及び参照矩形101の上下の行ピッチ程度の距離内
に別の文字矩形が存在するかを調べる。
【0049】そして、図7(a)に示すように、上下の
仮想領域110,111と重なりのある文字矩形がいず
れも存在せず、かつ、処理矩形102の上下並びに参照
矩形101の上下いずれにも、行ピッチ程度の距離内に
他の文字矩形が存在しない場合には、処理矩形102と
参照矩形101は独立したタイトル等である可能性が高
いので「同一行らしい」と判定する。
【0050】一方、図7(b)に示すように、仮想領域
110,111との重なりのある文字矩形が存在せず、
かつ、処理矩形102又は参照矩形101の上又は下
の、行ピッチ程度の距離内に、他の文字矩形(図7
(b)では文字矩形135,136)が存在する場合に
は、処理矩形102と参照矩形101とは別々のコラム
の行である可能性が高いので「同一行ではないらしい」
と判定する。
【0051】<実施例2>本実施例における文字間統合
処理部10Bの処理フローを図8に示す。図8におい
て、ステップ401〜410は図3のステップ301〜
310と同一内容の処理ステップであり、処理矩形とし
ての文字矩形を選ぶための処理部分である。ステップ4
15〜435は図3のステップ315〜335と同一内
容の処理ステップで、参照矩形としての文字矩形を選
び、文字矩形と参照矩形との間の距離により統合判定を
行なう部分である。以上の処理部分に関しては、前記実
施例1と処理内容が全く同一である。また、ステップ4
60は、ステップ360と同一の矩形統合の処理ステッ
プである。
【0052】ステップ440〜455は図3のステップ
340〜355に対応する処理ループであるが、処理矩
形及び参照矩形の統合判定のために、文字矩形ではな
く、その段階までに文字矩形統合により生成された行を
参照する点が前記実施例1と異なる。
【0053】すなわち、ステップ435で処理矩形と参
照矩形との間の水平距離が閾値を超えていると判断した
場合、統合により生成されている行より、最初のものか
ら順に1個ずつ参照行としての行(行番号k)を選び、
参照行に関連した統合条件の判定(ステップ455)を
行なう処理を繰り返し、各判定の結果をフラグ情報とし
て保存し、このフラグ情報より「同一行である」(統合
すべきである)か否かを判断する。この判断方法は、例
えば前記実施例1の場合と同様、ある処理矩形と参照矩
形に関して、「同一行らしい」という条件に2つ以上該
当するか、「同一行である」という条件に1つでも該当
すれば「同一行である」(統合する)と判断し、一方、
「同一行でないらしい」という条件に1つでも該当すれ
ば「同一行でない」(統合しない)と判断する。
【0054】ステップ455の統合条件は、前記実施例
1におけるステップ355のものと類似しているが、文
字矩形ではなく、文字矩形を統合した行(参照行)を参
照することがステップ355とは異なる。また、参照行
となり得る行は、その時点までに生成されている行に限
られるが、逐次処理であるので、参照行は常に処理矩形
又は参照矩形より上側に位置することになる。以下、ス
テップ455における統合条件の具体例を説明する。
【0055】<統合条件2−1>前記実施例1の統合条
件1−1に類似しているので、図4を援用して説明す
る。図4の(a)に示すように、参照矩形101の上側
に先頭位置の接近した(先頭位置の水平距離が所定値以
下の)行(103)が存在する場合には、処理矩形10
2と参照矩形101とは「同一行でないらしい」(別コ
ラムの行らしい)と判定する。下側には行が生成されて
いないので、下側については調べない。
【0056】また、図4の(b)に示すように、処理矩
形102の上側に、末尾位置の接近した(末尾位置の水
平距離が所定値以下の)行(104)が存在する場合に
は、処理矩形102と参照矩形101とは「同一行では
ないらしい」と判定する。下側には行が生成されていな
いので、調べる必要はない。
【0057】なお、処理矩形とその上の行との末尾位置
の距離そのもの、参照矩形の上の行との先頭位置の距離
そのもの、を特徴量として統合判定を行なうことも可能
である。
【0058】<統合条件2−2>前記実施例1の統合条
件1−2に類似しているので、図5及び図6を援用して
説明する。
【0059】図5に示すように、処理矩形102と参照
矩形101との間の空間の上に、前述のような高さと幅
を持つ矩形の仮想領域110を設定する。下側には行が
生成されていないので、仮想領域を設定する必要はな
い。
【0060】図6を参照する。上側の仮想領域110と
部分的に重なりのある行(図6の(c),(d)では行
(126,127)が存在する場合に、Xs<Vxsか
つXe>Vxmであるとき(図6(c)のケース) またはXs<VxmかつXe>Vxeであるとき(図6
(d)のケース) に、処理矩形102と参照矩形101を「同一行らし
い」と判定する。
【0061】ただし、図6の(c)及び(d)より明ら
かなように、Vxsは処理矩形102と参照矩形101
との間の空間の先端(処理矩形102の末尾)のX座
標、Vxeは同空間の末尾(参照矩形101の先端)の
X座標、Vsmは同空間の中線のX座標、XsとXeは
仮想領域110に部分的に重なりのある行(126,1
27)の先頭と末尾のX座標である。
【0062】<実施例3>本実施例においては、文字領
域統合部10は図2(b)に示す構成を有し、文字間矩
形統合処理部10Bと文字間再統合処理部10Cによっ
て2段階の文字矩形統合処理を行なう。
【0063】文字間統合処理部10Bにおける文字矩形
統合処理の内容は前記実施例2において説明したものと
全く同じであり、その処理フローは図8に示す通りであ
るので、前記実施例2での説明を援用して説明を繰り返
さない。
【0064】図9は文字間再統合処理部10Cの処理フ
ローを示す。文字間統合処理部10Bによる処理が完了
した後、あるいは、ある範囲以上につい当該処理が進ん
だ後に、文字間再統合処理部10Cによる処理が開始す
る。
【0065】図9において、ステップ501〜510は
図3のステップ301〜310(第4図のステップ40
1〜410)と同一内容の処理ステップであり、処理矩
形としての文字矩形を選ぶための処理部分である。
【0066】ステップ515〜535は図3のステップ
315〜335(図8のステップ415〜435)と同
一内容の処理ステップで、参照矩形としての文字矩形を
選び、文字矩形と参照矩形との間の水平距離により統合
判定を行なう部分である。ただし、文字間統合処理部1
0Bによる文字間統合処理によって、すでに「同一行で
ある」と判断されて統合されている矩形が存在するの
で、ステップ435で水平距離がパラメータ以内の場合
には、ステップ565で「同一行である」と判断されて
いる処理矩形と参照矩形であるかをチェックし、そのよ
うなものであるならば改めて統合処理のステップ560
に進む必要はないので、ステップ565よりステップ5
15に戻って次の参照矩形に関する処理に入る。なお、
ステップ560は、図3のステップ360(図8のステ
ップ460)と同一の矩形統合の処理ステップである。
【0067】ステップ540〜555は図8のステップ
440〜455とほぼ同様の処理ループであるが、文字
間統合処理部10Bによる統合処理が既に実行されてい
るため、ステップ455における統合条件の内容が異な
る。その主要な相異点は、処理矩形と参照矩形の上側の
行だけでなく下側の行も参照対象に加えることである。
その結果、前記実施例2に比べ、より高精度の統合処理
を期待できる。
【0068】なお、図8のステップ455と同様、ステ
ップ555においては、各参照行に関連した統合条件の
判定結果をフラグ情報として保存し、このフラグ情報よ
り「同一行である」(統合すべきである)か否かを判断
する。この判断方法は、例えば、ステップ455と同
様、ある処理矩形と参照矩形に関して、「同一行らし
い」という条件に2つ以上該当するか、「同一行であ
る」という条件に1つでも該当すれば「同一行である」
(統合する)と判断し、一方、「同一行でないらしい」
という条件に1つでも該当すれば「同一行でない」(統
合しない)と判断する。以下、ステップ555の統合条
件の具体例を説明する。
【0069】<統合条件3−1>前記実施例1の統合条
件1−1に類似しているので、図4を援用して説明す
る。図4の(a)に示すように、参照矩形101の上側
に先頭位置の接近した(先頭位置の水平距離が所定値以
下の)行(103)が存在する場合には、処理矩形10
2と参照矩形101とは「同一行でないらしい」(別コ
ラムの行らしい)と判定する。下側の行についても同様
の判定を行なう(これが図8のステップ455の統合条
件2−1と異なる点である)。
【0070】また、図4の(b)に示すように、処理矩
形102の上側に、末尾位置の接近した(末尾位置の水
平距離が所定値以下の)行(104)が存在する場合に
は、処理矩形102と参照矩形101とは「同一行では
ないらしい」と判定する。下側の行についても同様の判
定を行なう(これが図8のステップ455の統合条件2
−1と異なる点である)。
【0071】なお、処理矩形102とその上又は下の行
との末尾位置の距離そのもの、参照矩形101の上又は
下の行との先頭位置の距離そのもの、を特徴量として統
合判定を行なうことも可能である。
【0072】<統合条件3−2>前記実施例1の統合条
件1−2に類似しているので、図5及び図6を援用して
説明する。
【0073】前記実施例1におけると同様、図5に示す
ように、処理矩形102と参照矩形101との間の空間
の上及び下に、前述のような高さと幅を持つ矩形の仮想
領域110,111を設定する(下側にも仮想領域11
1を設定する点が図8のステップ455の統合条件2−
2と相違する)。
【0074】このような上下の仮想領域110,111
と重なりのある行を探し、また、重なりのある行の重な
りの度合い、その行が上下両方にあるか等を特徴量とし
て、処理矩形102と参照矩形101とが同一行である
か否かを判定する。
【0075】(条件3−2a)図5に示すように上側の
仮想領域110を含む(仮想領域の全幅にわたって重な
りのある)行(121)が存在するか、あるいは下側の
仮想領域111を含む行が存在する場合には、処理矩形
102と参照矩形101とを「同一行らしい」と判定す
る。
【0076】(条件3−2b)図6(a)に示すよう
に、上側の仮想領域110を含む(仮想領域の全幅にわ
たって重なりのある)行(122)と、下側の仮想領域
111を含む行(123)とが両方存在する場合、処理
矩形102と参照矩形101とは「同一行である」と判
定する。
【0077】上下の仮想領域110,111のうち、一
方の仮想領域を含む行(図6(b)では124)が存在
し、他方の仮想領域と部分的に重なりのある行(図6
(b)では125)が存在する場合、前者の行(12
4)とそれに近いほうの処理矩形又は参照矩形(図6
(b)では参照矩形101)との距離Sp1と、後者の
行(125)とそれに近いほうの処理矩形又は参照矩形
(図6(b)では参照矩形101)との距離Sp2が、
Sp1≦Sp2ならば、処理矩形102と参照矩形10
1は「同一行である」と判定する。Sp1>Sp2のと
きは、図6(e)に示すようなタイトル130の下の別
々のコラム131,132中の先頭行の文字矩形が処理
矩形と参照矩形となっている場合が考えられるので判定
を据え置く。
【0078】(条件3−2c)上側又は下側の仮想領域
110,111と部分的に重なりのある行(図6の
(c),(d)では126,127)が存在する場合
に、Xs<VxsかつXe>Vxmであるとき(図6
(c)のケース) またはXs<VxmかつXe>Vxeであるとき(図6
(d)のケース) に、処理矩形102と参照矩形101を「同一行らし
い」と判定する。
【0079】ただし、図6の(c)及び(d)より明ら
かなように、Vxsは処理矩形102と参照矩形101
との間の空間の先端(処理矩形102の末尾)のX座
標、Vxeは同空間の末尾(参照矩形101の先端)の
X座標、Vsmは同空間の中線のX座標、XsとXeは
仮想領域110,111に部分的に重なりのある行(1
26,127)の先頭と末尾のX座標である。
【0080】<統合条件3−3>図7に示すように、処
理矩形と参照矩形との間の空間の上下に、上記統合条件
3−2の場合と同様の仮想領域110,111を設定
し、それぞれの仮想領域110,111に重なりのある
行が存在するか、さらに、処理矩形102及び参照矩形
101の上下の行ピッチ程度の距離内に行が存在するを
調べる。
【0081】そして、図7(a)に示すように、上下の
仮想領域110,111とも、それとの重なりのある行
が存在せず、かつ、処理矩形102の上下並びに参照矩
形101の上下いずれにも、行ピッチ程度の距離内に行
が存在しない場合には、処理矩形102と参照矩形10
1は独立したタイトル等である可能性が高いので「同一
行らしい」と判定する。
【0082】一方、図7(b)に示すように、仮想領域
110,111との重なりのある行が存在せず、かつ、
処理矩形102又は参照矩形101の上又は下の、行ピ
ッチ程度の距離内に、行(135,136)が存在する
場合には、処理矩形102と参照矩形101とは別々の
コラムの行である可能性が高いので「同一行ではないら
しい」と判定する。
【0083】
【発明の効果】以上の説明から明らかなように、請求項
1乃至5に記載の発明によれば、パラメータ処理のみに
よる場合に、往々にして生じる不都合、例えば、同一行
であるべき行が複数の行に分割され、あるいは、別々の
行が一つの行に統合されるといった不都合を回避し、正
しい文字領域の抽出が可能となる。特に、請求項3の発
明のように、パラメータ処理と他の文字矩形又は矩形を
参照した条件判定を組み合わせる方法によれば、パラメ
ータ処理の高速性を活かしつつ、正しく処理できる文書
の許容度を拡大できる。
【図面の簡単な説明】
【図1】本発明を実施するための装置構成の一例を示す
ブロック図である。
【図2】(a)文字領域統合部の構成例を示すブロック
図である。 (b)文字領域統合部の他の構成例を示すブロック図で
ある。
【図3】文字間統合処理部の処理フローの一例を示すフ
ローチャートである。
【図4】統合条件の一例を説明するための図である。
【図5】統合条件の一例を説明するための図である。
【図6】統合条件の一例を説明するための図である。
【図7】統合条件の一例を説明するための図である。
【図8】文字間統合処理部の処理フローの他の一例を示
すフローチャートである。
【図9】文字間再統合処理部の処理フローの一例を示す
フローチャートである。
【符号の説明】
1 スキャナ 2 画像入力部 3 画像メモリ 4 画像表示部 5 ディスプレー 6 領域識別部 7 画像圧縮部 8 外接矩形検出部 9 矩形分類部 10 文字領域統合部 10A パラメータ設定部 10B 文字間統合処理部 10C 文字間再統合処理部 10D 行間統合処理部 11 文字認識部 101 参照矩形 102 処理矩形 103,104 文字矩形(行) 110,111 仮想領域 121〜127 文字矩形(行) 130 タイトル 131,132 コラム 135,136 文字矩形(行)
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平3−198177(JP,A) 特開 平7−73271(JP,A) 特開 平6−187490(JP,A) PRU91−7画像の融合を利用した紙 面の領域分割,電子情報通信学会技術研 究報告,日本,1991年 5月23日,第91 巻第50号,pp.45−50 (58)調査した分野(Int.Cl.7,DB名) G06K 9/00 - 9/82 G06T 7/40

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】 文書等の画像を所定倍率で圧縮した画像
    より黒画素連結成分に外接した矩形を抽出し、抽出した
    矩形の中で文字の矩形と判断される矩形を行方向へ統合
    する領域分割方法において、文字矩形の統合を行なう際
    に、注目した2個の文字矩形が同一行として統合できる
    か否かを判断するための条件として、当該2個の文字矩
    形と、これら2個の文字矩形が含まれない行の他の文字
    矩形又は他の文字矩形の統合された行との位置関係に
    関する条件を含むことを特徴とする領域分割方法。
  2. 【請求項2】 文書等の画像を所定倍率で圧縮した画像
    より黒画素連結成分に外接した矩形を抽出し、抽出した
    矩形の中で文字の矩形と判断される矩形を行方向へ統合
    する領域分割方法において、文字矩形の統合を行なう際
    に、相互間の行方向の距離及び行方向と垂直の方向の距
    離がそれぞれある値以下の2個の文字矩形を選び、該2
    個の文字矩形について同一行として統合できるか否かの
    判断を行ない、該判断のための条件として、該2個の文
    字矩形と、これら2個の文字矩形が含まれない行の他の
    文字矩形又は他の文字矩形の統合された行との位置関
    係に関する条件を含むことを特徴とする領域分割方法。
  3. 【請求項3】 文書等の画像の所定倍率で圧縮した画像
    より黒画素連結成分に外接した矩形を抽出し、抽出した
    矩形の中で文字の矩形と判断される矩形を行方向へ統合
    する領域分割方法において、文字矩形を統合する処理を
    2回行ない、1回目の文字矩形統合処理においては、注
    目した2個の文字矩形が同一行として統合できるか否か
    を判断するための条件として、当該2個の文字矩形の上
    側にある既に統合により生成された行との位置関係に関
    する条件を含み、2回目の文字矩形統合処理において
    は、注目した2個の文字矩形が同一行として統合できる
    か否かを判断するための条件として、当該2個の文字矩
    形の上側及び下側にある既に統合により生成された行と
    の位置関係に関する条件を含むことを特徴とする領域分
    割方法。
  4. 【請求項4】 注目した2個の文字矩形が同一行として
    統合できるか否かの判断のための条件として、該2個の
    文字矩形のそれぞれと、その上側又は下側の接近した他
    の文字矩形又は行との、先頭位置又は末尾位置の行方向
    の距離に関する条件を含むことを特徴とする請求項1、
    2又は3記載の領域分割方法。
  5. 【請求項5】 注目した2個の文字矩形が同一行として
    統合できるか否かの判断のための条件として、該2個の
    文字矩形の間の空間の上又は下に設定した仮想領域と、
    他の文字矩形又は行との重なりの関係に関する条件を含
    むことを特徴とする請求項1、2又は3記載の領域分割
    方法。
JP13165194A 1994-06-14 1994-06-14 領域分割方法 Expired - Fee Related JP3402755B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP13165194A JP3402755B2 (ja) 1994-06-14 1994-06-14 領域分割方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP13165194A JP3402755B2 (ja) 1994-06-14 1994-06-14 領域分割方法

Publications (2)

Publication Number Publication Date
JPH07334614A JPH07334614A (ja) 1995-12-22
JP3402755B2 true JP3402755B2 (ja) 2003-05-06

Family

ID=15063047

Family Applications (1)

Application Number Title Priority Date Filing Date
JP13165194A Expired - Fee Related JP3402755B2 (ja) 1994-06-14 1994-06-14 領域分割方法

Country Status (1)

Country Link
JP (1) JP3402755B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3653156B2 (ja) * 1997-01-29 2005-05-25 株式会社リコー 文書画像領域抽出方法
CN111144282B (zh) * 2019-12-25 2023-12-05 北京同邦卓益科技有限公司 表格识别方法和装置、计算机可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
PRU91−7画像の融合を利用した紙面の領域分割,電子情報通信学会技術研究報告,日本,1991年 5月23日,第91巻第50号,pp.45−50

Also Published As

Publication number Publication date
JPH07334614A (ja) 1995-12-22

Similar Documents

Publication Publication Date Title
US6006240A (en) Cell identification in table analysis
US5539841A (en) Method for comparing image sections to determine similarity therebetween
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
US5410611A (en) Method for identifying word bounding boxes in text
JP3343864B2 (ja) 語体の分離方法
US6327384B1 (en) Character recognition apparatus and method for recognizing characters
JP3278471B2 (ja) 領域分割方法
US5129012A (en) Detecting line segments and predetermined patterns in an optically scanned document
JPH11219407A (ja) 文書画像認識装置および文書画像認識プログラムの記憶媒体
JP4395188B2 (ja) 文書画像認識装置および文書画像認識プログラムの記憶媒体
US6434270B1 (en) Pattern extraction apparatus
US20090316219A1 (en) Image processing apparatus, image processing method and computer-readable storage medium
JP3402755B2 (ja) 領域分割方法
JP3285686B2 (ja) 領域分割方法
JP3344774B2 (ja) 矩形分類方法
JP4810853B2 (ja) 文字画像切出装置、文字画像切出方法およびプログラム
US20030123730A1 (en) Document recognition system and method using vertical line adjacency graphs
JP2796561B2 (ja) 表形式文書認識方式
JP2007295210A (ja) 画像処理装置、画像処理方法、画像処理プログラム、およびこれを記録した記録媒体
JP2917427B2 (ja) 図面読取装置
JP4040231B2 (ja) 文字抽出方法及び装置並びに記憶媒体
JP2918666B2 (ja) 文字画像切出し方法
JP3077929B2 (ja) 文字切出し方式
JP3517077B2 (ja) パターン抽出装置及びパターン領域の切り出し方法
JPH11242716A (ja) 画像処理方法および記録媒体

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080229

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090228

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100228

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110228

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120229

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130228

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130228

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140228

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees