JP3402755B2 - 領域分割方法 - Google Patents
領域分割方法Info
- Publication number
- JP3402755B2 JP3402755B2 JP13165194A JP13165194A JP3402755B2 JP 3402755 B2 JP3402755 B2 JP 3402755B2 JP 13165194 A JP13165194 A JP 13165194A JP 13165194 A JP13165194 A JP 13165194A JP 3402755 B2 JP3402755 B2 JP 3402755B2
- Authority
- JP
- Japan
- Prior art keywords
- rectangle
- character
- rectangles
- processing
- integrated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Character Input (AREA)
- Image Analysis (AREA)
Description
R)の前処理部、ファクシミリやテレックス等の通信機
器、光ファイル等の画像データベース入力等に利用され
る画像処理技術に係り、特に、文書等の画像データよ
り、文字領域や図表領域等の属性の異なる情報領域を抽
出するための領域分割技術に関する。
報領域が混在した文書等の文字認識を行なう場合、ある
いは、そのような文書等の画像を光ディスク等の記憶メ
ディア上にファイリングしたりファクシミリで送信した
りする場合等に、しばしば、画像を属性の異なる情報領
域毎に分割し、各領域毎に処理方法を切り替えたり、あ
るいは特定の領域だけを特定の処理の対象にする等の制
御が必要になる。
分布を用いて文字領域とその他の領域とに切り分ける方
法(特開昭62−71379号)や、周辺分布を利用し
て黒画素群の外接矩形を抽出し、それらをパラメータ処
理により統合していくことによって文字領域を構成し、
他の領域と分割する方法(特開平3−126181号)
が知られている。
の対応が難しく、さらには、対象とする文書毎にパラメ
ータの設定が必要になるという難点がある。後者の方法
も外接矩形の抽出に周辺分布を利用する関係から、画像
のスキューの程度によってはスキュー補正処理が必要に
なるという問題点がある。また前者の方法は、文字領域
において矩形の重なりがある場合や、囲み記事の領域が
含まれるような構造の複雑な文書への対応が困難である
という難点がある。
領域分割の方法として、本出願人の特願平5−1591
90号の明細書に記載された方法がある。この方法で
は、文書等の画像を予め所定倍率で圧縮し、その圧縮画
像より黒画素連結成分に外接する矩形を抽出し、画像圧
縮による文字の矩形の融合度合に応じて、あるいは、行
方向に近接した文字の矩形間の距離の分布に応じて、文
字の矩形を行方向へ統合するためのパラメータ(矩形間
距離の閾値)を自動的に変化させるなどによって、スキ
ュー補正を不要とし、かつ、複雑な文書構造、様々な文
字サイズの文書に対応することが可能である。しかしな
がら、この方法によっても、様々な文書類に適用した場
合、例えば、英文書等でコラム間の距離よりも単語間距
離のほうが大きい場合などに、同一行が複数の行に分解
されてしまって正確な文字領域の抽出ができないような
ケースを生じることが判明している。
159190号の領域分割方法は、2個の文字の矩形を
同一行として統合するか否かの判定を固定又は可変のパ
ラメータ(例えば矩形間距離)によって行なう方式であ
る。このパラメータ処理方式は高速処理が可能である反
面、上に述べたように、正確な結果を得られる対象文書
の許容度が小さい。
生成するというボトムアップ的手法による領域分割方法
において、パラメータ処理方式だけでは正確な領域分割
結果が得られないような文書画像等に対しても対応でき
るようにし、処理可能な文書等の許容度を拡大しようと
するものである。
の画像を所定倍率で圧縮した画像より黒画素連結成分に
外接した矩形を抽出し、抽出した矩形の中で文字の矩形
と判断される矩形を行方向へ統合する領域分割方法にお
いて、文字矩形の統合を行なう際に、注目した2個の文
字矩形が同一行として統合できるか否かを判断するため
の条件として、当該2個の文字矩形と、これら2個の文
字矩形が含まれない行の他の文字矩形又は該他の文字矩
形の統合された行との位置関係に関する条件を含むこと
である。
文字矩形が含まれない行の他の文字矩形または行との位
置関係の条件の具体的な例としては、後記実施例に関連
して詳細に説明するような、該2個の文字矩形のそれぞ
れと、その上側又は下側の接近した他の文字矩形又は行
との、先頭位置又は末尾位置の行方向の距離に関する条
件、あるいは、該2個の文字矩形の間の空間の上又は下
に設定した仮想領域と、他の文字矩形又は行との重なり
の関係の条件などがある。
ータを大きめに設定すると、同一行であるべき行が分割
されてしまったり、逆にパラメータを小さめにすると、
別々のコラムの行が統合されてしまうといった不都合が
起きやすい。
は、2つの文字矩形を同一行として統合すべきか否かの
判断の際に、周辺の文字矩形又は行との位置関係を参照
するため、そのような不都合を回避することができる。
字領域)がある場合、各コラム内の行の先頭又は末尾が
揃っていることが多い。また、複数行からなるコラム内
では、各行を構成する文字矩形と文字矩形との間の空間
の上又は下に、上または下の行を構成する文字矩形が存
在する確率が高い。本発明によれば、そのような性質を
利用し、パラメータ処理では正しい判定が困難な文字矩
形の統合判定を的確に行なうことができる。
の文字矩形又は行との位置関係に関する条件による統合
判定と、固定又は可変パラメータによる統合判定とを組
合わせる態様も当然に本発明の範囲に含まれるものであ
り、それによりパラメータ方式の高速性を活かしつつ、
パラメータ方式のみでは正確な領域分割結果が得られな
いような文書等に対しても高精度の領域分割が可能とな
る。
図面を用い説明する。
ロック図である。図1において、スキャナ1により読み
取られた文書画像の2値データは、画像入力部2によっ
て画像メモリ3に格納される。画像メモリ3内の文書画
像データは、領域識別部6内の画像圧縮部7に読み出さ
れ、ここで所定の圧縮率のOR圧縮を施されてから画像
メモリ3に戻される。画像メモリ3内の文書画像データ
は、画像表示部4によってディスプレー5に表示させる
ことができる。なお、画像入力部2より文書画像データ
を画像圧縮部7へ直接入力し、ここで圧縮した画像デー
タを画像メモリ3に格納することも可能である。
外接矩形検出部8、矩形分類部9、文字領域統合部10
から構成されている。各部の役割は次のとおりである。
縮された文書画像データより、黒画素の繋りを調べ、黒
画素連結成分に外接する矩形を抽出する部分である。こ
こで抽出された矩形には、文字(1文字又は2文字以上
の文字列)の矩形のほか、罫線、ノイズ、表、図その
他、様々な属性の矩形が含まれる。
矩形を、矩形の内部データ、矩形の形状等から判別分類
する部分である。この分類のための具体的な方法は様々
なものが知られているが、例えば先に引用した特願平5
−159190号の明細書に述べられているような方法
を利用してよい。
って文字に分類された矩形に対して統合処理を行ない、
文字領域に統合する部分である。本発明は、この文字領
域統合部10に関わるものである。
認識部11による文字認識処理に利用される。つまり、
ここに示す例にあっては領域識別部6は光学的文字認識
の前処理部として利用される。ただし、これは一例に過
ぎないことは当然である。
例を示すブロック図である。図2の(a)は後記実施例
1及び実施例2に係る構成を示しており、(b)は後記
実施例3に係る構成を示している。
文字領域を統合していく上で閾値となるパラメータを設
定する部分である。このパラメータは、予め対象文書の
種類に応じた固定値を設定するようにしてもよいし、あ
るいは、先に引用した特願平5−159190号の明細
書に述べられているように、文字矩形の融合度合や行方
向に近接した文字矩形の距離の分布に基づいて自動的に
設定させるようにしてもよい。
方向に統合する処理を行なう部分である。図2(b)に
示した文字間再統合処理部10Cは、文字間統合処理部
10Bと実質的に同一の統合処理を行なう部分であり、
これは後記実施例3でのみ必要となる。文字間統合処理
部10Bと文字間再統合処理部10Cとが、本発明の要
旨に直接関連する部分である。
矩形の統合により得られた行を、行と垂直な方向へ統合
することによって、文字領域を抽出する部分である。こ
の統合処理の具体的な方法は様々なものが知られている
が、その好ましい例が先に引用した特願平5−1591
90号の明細書に述べられている。
間統合処理部10B又は文字間再統合処理部10Cにお
ける統合処理について、実施例毎に詳細に説明する。な
お、便宜上、文書画像上の行の方向を水平方向として説
明する。
処理部10Bの処理フローを図3に示す。まず、全ての
矩形より順に1個ずつ、処理矩形(矩形番号i)として
選び、それが文字の矩形であるか調べる処理を文字矩形
が見つかるまで繰り返す(ステップ301〜ステップ3
10)。この処理ループで調べる矩形がなくなった時点
で文字間統合処理は終了する。
れると、この処理矩形に関するステップ315以下の処
理に入る。まず、処理矩形(矩形番号i)の次の矩形よ
り順に1個ずつ、処理矩形との統合の相手方となる矩形
(参照矩形と呼ぶ、矩形番号j)を選び、それが文字の
矩形であるか調べる処理を文字矩形が見つかるまで繰り
返す(ステップ315〜325)。矩形がなくなった時
点で、この処理ループを抜けてステップ301〜310
のループへ戻り、次の処理矩形に関する処理を開始す
る。
理矩形と参照矩形との垂直方向(行の上下方向)の距離
が所定値を超えているか調べ(ステップ330)、この
垂直距離が所定値を超えているときには、この参照矩形
と処理矩形とは同一行の矩形である可能性がないのでス
テップ315に戻って次の参照矩形を探す。
形と参照矩形とは同一行の矩形である可能性があるの
で、両矩形間の水平方向の距離が閾値(パラメータ設定
部10Aで設定されたパラメータ)以下であるか調べる
(ステップ335)。ここまでがパラメータ方式による
統合判定処理である。そして、水平距離が閾値以下であ
れば、処理矩形と参照矩形とを統合し(ステップ36
0)、ステップ315に戻って次の参照矩形についての
処理に入る。
いると判断した場合、処理矩形と参照矩形とを統合する
か否かを、別の文字の矩形(参照矩形[2]と呼ぶ)を
参照することによって判定する処理ループ(ステップ3
40〜355)に入る。まず、全ての矩形より1個ずつ
参照矩形[2]としての矩形(矩形番号k)を選び、そ
れが文字の矩形であるか調べる処理を、調べる矩形がな
くなるまで繰り返す(ステップ340〜350)。調べ
る矩形がなくなった時点で、この処理を抜けてステップ
315に戻る。
と、参照矩形[2]に関連した統合条件を調べる(ステ
ップ355)。「統合する(同一行である)」と判断し
た場合以外はステップ340へ戻る。統合する(同一行
である)と判断した場合には、ステップ360に進み処
理矩形と参照矩形とを統合した後に、ステップ315へ
戻る。
0〜355のループで、参照矩形[2]として選ばれた
文字矩形毎に条件を順次調べて、その結果をフラグ情報
として蓄積していき、このフラグ情報に基づいて「同一
行である」(統合する)か否かを判断する。例えば、あ
る処理矩形と参照矩形に関して、「同一行らしい」とい
う条件に2つ以上該当するか、「同一行である」という
条件に1つでも該当すれば「同一行である」と確定する
(統合する)。一方、「同一行でないらしい」という条
件に1つでも該当すれば、「同一行でない」と確定する
(統合対象から外す)。
ついての判定結果を多値で分類し、統計的確率を用いて
最終判断を出す方法や、経験的結果をテーブルにしてお
いて、それを参照して判断する方法などが可能である。
具体例を説明する。ここに示す例は、次の統合条件1−
1から統合条件1−3までの判定を行ない、その結果よ
り上に述べたルールによって最終的に判断する。
域)がある場合、各コラム内の行の先頭又は末尾が揃っ
ていることが多い。この性質を統合判定に利用する。
角から右下角へ向かってラスタースキャンをするかの様
な順番であるとすると、処理矩形に対して参照矩形は右
側に位置する。もし、処理矩形と参照矩形とが別々のコ
ラムの行の文字矩形であれば(同一行として統合すべき
でない矩形であれば)、参照矩形の上又は下に先頭位置
の近い参照矩形[2]が見つかる可能性が高く、また、
左側の処理矩形の上又は下に末尾位置の近い参照矩形
[2]が見つかる可能性が高い。このような参照矩形
[2]が少なくとも1つ見つかった場合には、処理矩形
と参照矩形とは「同一行でないらしい」と判定する。
る。(a)に示すように、参照矩形101の上側に先頭
位置の接近した(先頭位置の水平距離が所定値以下の)
文字矩形103が存在する場合、処理矩形102と参照
矩形101とは別コラムの行(別の行)である可能性が
高いので「同一行でないらしい」と判定される。同様の
文字矩形が参照矩形101の下側に存在する場合も「同
一行でないらしい」と判定される。
102の上側に末尾位置の接近した(末尾位置の水平距
離が所定値以下の)文字矩形104が存在するときに
は、処理矩形102と参照矩形101とは別コラムの行
である可能性が高いので「同一行でないらしい」と判定
される。処理矩形102の下側に同様の文字矩形が存在
する場合も「同一行でないらしい」と判定される。
との末尾位置の距離そのもの、参照矩形の上又は下の文
字矩形との先頭位置の距離そのもの、を特徴量として判
定を行なうことも可能である。
内では、各行を構成する文字矩形と文字矩形との間の空
間の上又は下に、上または下の行を構成する文字矩形が
存在する確率が高いことに着目して、統合判定を行な
う。図5及び図6は、この統合条件判定の説明図であ
る。
102と参照矩形101との間の空間の上及び下に、あ
る高さと幅を持つ矩形の仮想領域110,111を設定
する。仮想領域110,111の高さ(垂直方向の大き
さ)は例えばコラムの行ピッチ程度もしくは文字矩形か
ら推定される標準文字サイズ程度に選ぶことができる。
仮想領域110,111の幅(水平方向の大きさ)は、
矩形間距離より大きめにして、処理矩形102及び参照
矩形101に多少重なる(水平方向で)程度のマージン
を持たせる。このように多少のマージンを持たせる目的
は、スキューやスペース分のインデントによって、仮想
領域110,111が処理矩形102及び参照矩形10
1と重ならなくなることを防止するためである。仮想領
域110,111の水平方向の中心は、矩形間の空間の
中心に合わせる。上側の仮想領域110の底辺は、処理
矩形102の上辺と参照矩形101の上辺のうちの上側
のものに一致させる。下側の仮想領域111の上辺は、
処理矩形102の下辺と参照矩形101の下辺のうちの
下側のものに一致させる。
と重なりのある他の文字矩形を探し、また、重なりのあ
る文字矩形の重なりの度合い、その文字矩形が上下両方
にあるか等を特徴量として、処理矩形102と参照矩形
101とが同一行であるか否かを判定する。次に、図5
及び図6により、条件について説明する。
仮想領域110を含む(仮想領域の全幅にわたって重な
りのある)文字矩形121が存在するか、あるいは下側
の仮想領域111を含む文字矩形が存在する場合には、
処理矩形102と参照矩形101とを「同一行らしい」
と判定する。
に、上側の仮想領域110を含む(仮想領域の全幅にわ
たって重なりのある)文字矩形122と、下側の仮想領
域111を含む文字矩形123とが両方存在する場合、
処理矩形102と参照矩形101とは「同一行である」
と判定する。
方の仮想領域を含む文字矩形(図6(b)では文字矩形
124)が存在し、他方の仮想領域と部分的に重なりの
ある文字矩形(図6(b)では文字矩形125)が存在
する場合、前者の文字矩形とそれに近いほうの処理矩形
又は参照矩形(図6(b)では参照矩形101)との距
離Sp1と、後者の文字矩形とそれに近いほうの処理矩
形又は参照矩形(図6(b)では参照矩形101)との
距離Sp2が、Sp1≦Sp2ならば、処理矩形102
と参照矩形101は「同一行である」と判定する。Sp
1>Sp2のときは、図6(e)に示すようなタイトル
130の下の別々のコラム131,132中の先頭行の
文字矩形が処理矩形と参照矩形となっている場合が考え
られるので、判定を据え置く。
110,111と部分的に重なりのある文字矩形(図6
の(c),(d)では文字矩形126,127)が存在
する場合に、Xs<VxsかつXe>Vxmであるとき
(図6(c)のケース) またはXs<VxmかつXe>Vxeであるとき(図6
(d)のケース) に、処理矩形102と参照矩形101を「同一行らし
い」と判定する。
かなように、Vxsは処理矩形102と参照矩形101
との間の空間の先端(処理矩形102の末尾)のX座
標、Vxeは同空間の末尾(参照矩形101の先端)の
X座標、Vsmは同空間の中線のX座標、XsとXeは
仮想領域110,111に部分的に重なりのある文字矩
形126,127の先頭と末尾のX座標である。
理矩形102と参照矩形101との間の空間の上下に、
上記統合条件1−2の場合と同様の仮想領域110,1
11を設定し、それぞれの仮想領域110,111に重
なりのある文字矩形が存在するか、さらに、処理矩形1
02及び参照矩形101の上下の行ピッチ程度の距離内
に別の文字矩形が存在するかを調べる。
仮想領域110,111と重なりのある文字矩形がいず
れも存在せず、かつ、処理矩形102の上下並びに参照
矩形101の上下いずれにも、行ピッチ程度の距離内に
他の文字矩形が存在しない場合には、処理矩形102と
参照矩形101は独立したタイトル等である可能性が高
いので「同一行らしい」と判定する。
110,111との重なりのある文字矩形が存在せず、
かつ、処理矩形102又は参照矩形101の上又は下
の、行ピッチ程度の距離内に、他の文字矩形(図7
(b)では文字矩形135,136)が存在する場合に
は、処理矩形102と参照矩形101とは別々のコラム
の行である可能性が高いので「同一行ではないらしい」
と判定する。
処理部10Bの処理フローを図8に示す。図8におい
て、ステップ401〜410は図3のステップ301〜
310と同一内容の処理ステップであり、処理矩形とし
ての文字矩形を選ぶための処理部分である。ステップ4
15〜435は図3のステップ315〜335と同一内
容の処理ステップで、参照矩形としての文字矩形を選
び、文字矩形と参照矩形との間の距離により統合判定を
行なう部分である。以上の処理部分に関しては、前記実
施例1と処理内容が全く同一である。また、ステップ4
60は、ステップ360と同一の矩形統合の処理ステッ
プである。
340〜355に対応する処理ループであるが、処理矩
形及び参照矩形の統合判定のために、文字矩形ではな
く、その段階までに文字矩形統合により生成された行を
参照する点が前記実施例1と異なる。
照矩形との間の水平距離が閾値を超えていると判断した
場合、統合により生成されている行より、最初のものか
ら順に1個ずつ参照行としての行(行番号k)を選び、
参照行に関連した統合条件の判定(ステップ455)を
行なう処理を繰り返し、各判定の結果をフラグ情報とし
て保存し、このフラグ情報より「同一行である」(統合
すべきである)か否かを判断する。この判断方法は、例
えば前記実施例1の場合と同様、ある処理矩形と参照矩
形に関して、「同一行らしい」という条件に2つ以上該
当するか、「同一行である」という条件に1つでも該当
すれば「同一行である」(統合する)と判断し、一方、
「同一行でないらしい」という条件に1つでも該当すれ
ば「同一行でない」(統合しない)と判断する。
1におけるステップ355のものと類似しているが、文
字矩形ではなく、文字矩形を統合した行(参照行)を参
照することがステップ355とは異なる。また、参照行
となり得る行は、その時点までに生成されている行に限
られるが、逐次処理であるので、参照行は常に処理矩形
又は参照矩形より上側に位置することになる。以下、ス
テップ455における統合条件の具体例を説明する。
件1−1に類似しているので、図4を援用して説明す
る。図4の(a)に示すように、参照矩形101の上側
に先頭位置の接近した(先頭位置の水平距離が所定値以
下の)行(103)が存在する場合には、処理矩形10
2と参照矩形101とは「同一行でないらしい」(別コ
ラムの行らしい)と判定する。下側には行が生成されて
いないので、下側については調べない。
形102の上側に、末尾位置の接近した(末尾位置の水
平距離が所定値以下の)行(104)が存在する場合に
は、処理矩形102と参照矩形101とは「同一行では
ないらしい」と判定する。下側には行が生成されていな
いので、調べる必要はない。
の距離そのもの、参照矩形の上の行との先頭位置の距離
そのもの、を特徴量として統合判定を行なうことも可能
である。
件1−2に類似しているので、図5及び図6を援用して
説明する。
矩形101との間の空間の上に、前述のような高さと幅
を持つ矩形の仮想領域110を設定する。下側には行が
生成されていないので、仮想領域を設定する必要はな
い。
部分的に重なりのある行(図6の(c),(d)では行
(126,127)が存在する場合に、Xs<Vxsか
つXe>Vxmであるとき(図6(c)のケース) またはXs<VxmかつXe>Vxeであるとき(図6
(d)のケース) に、処理矩形102と参照矩形101を「同一行らし
い」と判定する。
かなように、Vxsは処理矩形102と参照矩形101
との間の空間の先端(処理矩形102の末尾)のX座
標、Vxeは同空間の末尾(参照矩形101の先端)の
X座標、Vsmは同空間の中線のX座標、XsとXeは
仮想領域110に部分的に重なりのある行(126,1
27)の先頭と末尾のX座標である。
域統合部10は図2(b)に示す構成を有し、文字間矩
形統合処理部10Bと文字間再統合処理部10Cによっ
て2段階の文字矩形統合処理を行なう。
統合処理の内容は前記実施例2において説明したものと
全く同じであり、その処理フローは図8に示す通りであ
るので、前記実施例2での説明を援用して説明を繰り返
さない。
ローを示す。文字間統合処理部10Bによる処理が完了
した後、あるいは、ある範囲以上につい当該処理が進ん
だ後に、文字間再統合処理部10Cによる処理が開始す
る。
図3のステップ301〜310(第4図のステップ40
1〜410)と同一内容の処理ステップであり、処理矩
形としての文字矩形を選ぶための処理部分である。
315〜335(図8のステップ415〜435)と同
一内容の処理ステップで、参照矩形としての文字矩形を
選び、文字矩形と参照矩形との間の水平距離により統合
判定を行なう部分である。ただし、文字間統合処理部1
0Bによる文字間統合処理によって、すでに「同一行で
ある」と判断されて統合されている矩形が存在するの
で、ステップ435で水平距離がパラメータ以内の場合
には、ステップ565で「同一行である」と判断されて
いる処理矩形と参照矩形であるかをチェックし、そのよ
うなものであるならば改めて統合処理のステップ560
に進む必要はないので、ステップ565よりステップ5
15に戻って次の参照矩形に関する処理に入る。なお、
ステップ560は、図3のステップ360(図8のステ
ップ460)と同一の矩形統合の処理ステップである。
440〜455とほぼ同様の処理ループであるが、文字
間統合処理部10Bによる統合処理が既に実行されてい
るため、ステップ455における統合条件の内容が異な
る。その主要な相異点は、処理矩形と参照矩形の上側の
行だけでなく下側の行も参照対象に加えることである。
その結果、前記実施例2に比べ、より高精度の統合処理
を期待できる。
ップ555においては、各参照行に関連した統合条件の
判定結果をフラグ情報として保存し、このフラグ情報よ
り「同一行である」(統合すべきである)か否かを判断
する。この判断方法は、例えば、ステップ455と同
様、ある処理矩形と参照矩形に関して、「同一行らし
い」という条件に2つ以上該当するか、「同一行であ
る」という条件に1つでも該当すれば「同一行である」
(統合する)と判断し、一方、「同一行でないらしい」
という条件に1つでも該当すれば「同一行でない」(統
合しない)と判断する。以下、ステップ555の統合条
件の具体例を説明する。
件1−1に類似しているので、図4を援用して説明す
る。図4の(a)に示すように、参照矩形101の上側
に先頭位置の接近した(先頭位置の水平距離が所定値以
下の)行(103)が存在する場合には、処理矩形10
2と参照矩形101とは「同一行でないらしい」(別コ
ラムの行らしい)と判定する。下側の行についても同様
の判定を行なう(これが図8のステップ455の統合条
件2−1と異なる点である)。
形102の上側に、末尾位置の接近した(末尾位置の水
平距離が所定値以下の)行(104)が存在する場合に
は、処理矩形102と参照矩形101とは「同一行では
ないらしい」と判定する。下側の行についても同様の判
定を行なう(これが図8のステップ455の統合条件2
−1と異なる点である)。
との末尾位置の距離そのもの、参照矩形101の上又は
下の行との先頭位置の距離そのもの、を特徴量として統
合判定を行なうことも可能である。
件1−2に類似しているので、図5及び図6を援用して
説明する。
ように、処理矩形102と参照矩形101との間の空間
の上及び下に、前述のような高さと幅を持つ矩形の仮想
領域110,111を設定する(下側にも仮想領域11
1を設定する点が図8のステップ455の統合条件2−
2と相違する)。
と重なりのある行を探し、また、重なりのある行の重な
りの度合い、その行が上下両方にあるか等を特徴量とし
て、処理矩形102と参照矩形101とが同一行である
か否かを判定する。
仮想領域110を含む(仮想領域の全幅にわたって重な
りのある)行(121)が存在するか、あるいは下側の
仮想領域111を含む行が存在する場合には、処理矩形
102と参照矩形101とを「同一行らしい」と判定す
る。
に、上側の仮想領域110を含む(仮想領域の全幅にわ
たって重なりのある)行(122)と、下側の仮想領域
111を含む行(123)とが両方存在する場合、処理
矩形102と参照矩形101とは「同一行である」と判
定する。
方の仮想領域を含む行(図6(b)では124)が存在
し、他方の仮想領域と部分的に重なりのある行(図6
(b)では125)が存在する場合、前者の行(12
4)とそれに近いほうの処理矩形又は参照矩形(図6
(b)では参照矩形101)との距離Sp1と、後者の
行(125)とそれに近いほうの処理矩形又は参照矩形
(図6(b)では参照矩形101)との距離Sp2が、
Sp1≦Sp2ならば、処理矩形102と参照矩形10
1は「同一行である」と判定する。Sp1>Sp2のと
きは、図6(e)に示すようなタイトル130の下の別
々のコラム131,132中の先頭行の文字矩形が処理
矩形と参照矩形となっている場合が考えられるので判定
を据え置く。
110,111と部分的に重なりのある行(図6の
(c),(d)では126,127)が存在する場合
に、Xs<VxsかつXe>Vxmであるとき(図6
(c)のケース) またはXs<VxmかつXe>Vxeであるとき(図6
(d)のケース) に、処理矩形102と参照矩形101を「同一行らし
い」と判定する。
かなように、Vxsは処理矩形102と参照矩形101
との間の空間の先端(処理矩形102の末尾)のX座
標、Vxeは同空間の末尾(参照矩形101の先端)の
X座標、Vsmは同空間の中線のX座標、XsとXeは
仮想領域110,111に部分的に重なりのある行(1
26,127)の先頭と末尾のX座標である。
理矩形と参照矩形との間の空間の上下に、上記統合条件
3−2の場合と同様の仮想領域110,111を設定
し、それぞれの仮想領域110,111に重なりのある
行が存在するか、さらに、処理矩形102及び参照矩形
101の上下の行ピッチ程度の距離内に行が存在するを
調べる。
仮想領域110,111とも、それとの重なりのある行
が存在せず、かつ、処理矩形102の上下並びに参照矩
形101の上下いずれにも、行ピッチ程度の距離内に行
が存在しない場合には、処理矩形102と参照矩形10
1は独立したタイトル等である可能性が高いので「同一
行らしい」と判定する。
110,111との重なりのある行が存在せず、かつ、
処理矩形102又は参照矩形101の上又は下の、行ピ
ッチ程度の距離内に、行(135,136)が存在する
場合には、処理矩形102と参照矩形101とは別々の
コラムの行である可能性が高いので「同一行ではないら
しい」と判定する。
1乃至5に記載の発明によれば、パラメータ処理のみに
よる場合に、往々にして生じる不都合、例えば、同一行
であるべき行が複数の行に分割され、あるいは、別々の
行が一つの行に統合されるといった不都合を回避し、正
しい文字領域の抽出が可能となる。特に、請求項3の発
明のように、パラメータ処理と他の文字矩形又は矩形を
参照した条件判定を組み合わせる方法によれば、パラメ
ータ処理の高速性を活かしつつ、正しく処理できる文書
の許容度を拡大できる。
ブロック図である。
図である。 (b)文字領域統合部の他の構成例を示すブロック図で
ある。
ローチャートである。
すフローチャートである。
フローチャートである。
Claims (5)
- 【請求項1】 文書等の画像を所定倍率で圧縮した画像
より黒画素連結成分に外接した矩形を抽出し、抽出した
矩形の中で文字の矩形と判断される矩形を行方向へ統合
する領域分割方法において、文字矩形の統合を行なう際
に、注目した2個の文字矩形が同一行として統合できる
か否かを判断するための条件として、当該2個の文字矩
形と、これら2個の文字矩形が含まれない行の他の文字
矩形又は該他の文字矩形の統合された行との位置関係に
関する条件を含むことを特徴とする領域分割方法。 - 【請求項2】 文書等の画像を所定倍率で圧縮した画像
より黒画素連結成分に外接した矩形を抽出し、抽出した
矩形の中で文字の矩形と判断される矩形を行方向へ統合
する領域分割方法において、文字矩形の統合を行なう際
に、相互間の行方向の距離及び行方向と垂直の方向の距
離がそれぞれある値以下の2個の文字矩形を選び、該2
個の文字矩形について同一行として統合できるか否かの
判断を行ない、該判断のための条件として、該2個の文
字矩形と、これら2個の文字矩形が含まれない行の他の
文字矩形又は該他の文字矩形の統合された行との位置関
係に関する条件を含むことを特徴とする領域分割方法。 - 【請求項3】 文書等の画像の所定倍率で圧縮した画像
より黒画素連結成分に外接した矩形を抽出し、抽出した
矩形の中で文字の矩形と判断される矩形を行方向へ統合
する領域分割方法において、文字矩形を統合する処理を
2回行ない、1回目の文字矩形統合処理においては、注
目した2個の文字矩形が同一行として統合できるか否か
を判断するための条件として、当該2個の文字矩形の上
側にある既に統合により生成された行との位置関係に関
する条件を含み、2回目の文字矩形統合処理において
は、注目した2個の文字矩形が同一行として統合できる
か否かを判断するための条件として、当該2個の文字矩
形の上側及び下側にある既に統合により生成された行と
の位置関係に関する条件を含むことを特徴とする領域分
割方法。 - 【請求項4】 注目した2個の文字矩形が同一行として
統合できるか否かの判断のための条件として、該2個の
文字矩形のそれぞれと、その上側又は下側の接近した他
の文字矩形又は行との、先頭位置又は末尾位置の行方向
の距離に関する条件を含むことを特徴とする請求項1、
2又は3記載の領域分割方法。 - 【請求項5】 注目した2個の文字矩形が同一行として
統合できるか否かの判断のための条件として、該2個の
文字矩形の間の空間の上又は下に設定した仮想領域と、
他の文字矩形又は行との重なりの関係に関する条件を含
むことを特徴とする請求項1、2又は3記載の領域分割
方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP13165194A JP3402755B2 (ja) | 1994-06-14 | 1994-06-14 | 領域分割方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP13165194A JP3402755B2 (ja) | 1994-06-14 | 1994-06-14 | 領域分割方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH07334614A JPH07334614A (ja) | 1995-12-22 |
JP3402755B2 true JP3402755B2 (ja) | 2003-05-06 |
Family
ID=15063047
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP13165194A Expired - Fee Related JP3402755B2 (ja) | 1994-06-14 | 1994-06-14 | 領域分割方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3402755B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3653156B2 (ja) * | 1997-01-29 | 2005-05-25 | 株式会社リコー | 文書画像領域抽出方法 |
CN111144282B (zh) * | 2019-12-25 | 2023-12-05 | 北京同邦卓益科技有限公司 | 表格识别方法和装置、计算机可读存储介质 |
-
1994
- 1994-06-14 JP JP13165194A patent/JP3402755B2/ja not_active Expired - Fee Related
Non-Patent Citations (1)
Title |
---|
PRU91−7画像の融合を利用した紙面の領域分割,電子情報通信学会技術研究報告,日本,1991年 5月23日,第91巻第50号,pp.45−50 |
Also Published As
Publication number | Publication date |
---|---|
JPH07334614A (ja) | 1995-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6006240A (en) | Cell identification in table analysis | |
US5539841A (en) | Method for comparing image sections to determine similarity therebetween | |
JP3904840B2 (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
US5410611A (en) | Method for identifying word bounding boxes in text | |
JP3343864B2 (ja) | 語体の分離方法 | |
US6327384B1 (en) | Character recognition apparatus and method for recognizing characters | |
JP3278471B2 (ja) | 領域分割方法 | |
US5129012A (en) | Detecting line segments and predetermined patterns in an optically scanned document | |
JPH11219407A (ja) | 文書画像認識装置および文書画像認識プログラムの記憶媒体 | |
JP4395188B2 (ja) | 文書画像認識装置および文書画像認識プログラムの記憶媒体 | |
US6434270B1 (en) | Pattern extraction apparatus | |
US20090316219A1 (en) | Image processing apparatus, image processing method and computer-readable storage medium | |
JP3402755B2 (ja) | 領域分割方法 | |
JP3285686B2 (ja) | 領域分割方法 | |
JP3344774B2 (ja) | 矩形分類方法 | |
JP4810853B2 (ja) | 文字画像切出装置、文字画像切出方法およびプログラム | |
US20030123730A1 (en) | Document recognition system and method using vertical line adjacency graphs | |
JP2796561B2 (ja) | 表形式文書認識方式 | |
JP2007295210A (ja) | 画像処理装置、画像処理方法、画像処理プログラム、およびこれを記録した記録媒体 | |
JP2917427B2 (ja) | 図面読取装置 | |
JP4040231B2 (ja) | 文字抽出方法及び装置並びに記憶媒体 | |
JP2918666B2 (ja) | 文字画像切出し方法 | |
JP3077929B2 (ja) | 文字切出し方式 | |
JP3517077B2 (ja) | パターン抽出装置及びパターン領域の切り出し方法 | |
JPH11242716A (ja) | 画像処理方法および記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080229 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090228 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100228 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110228 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120229 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130228 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130228 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140228 Year of fee payment: 11 |
|
LAPS | Cancellation because of no payment of annual fees |