JP3007549B2 - 文字記入領域抽出方法 - Google Patents
文字記入領域抽出方法Info
- Publication number
- JP3007549B2 JP3007549B2 JP7045682A JP4568295A JP3007549B2 JP 3007549 B2 JP3007549 B2 JP 3007549B2 JP 7045682 A JP7045682 A JP 7045682A JP 4568295 A JP4568295 A JP 4568295A JP 3007549 B2 JP3007549 B2 JP 3007549B2
- Authority
- JP
- Japan
- Prior art keywords
- area
- closed
- character entry
- region
- extracting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Character Input (AREA)
Description
めて文書とする)内に存在する枠で囲まれた文字記入領
域を抽出する方法に関する。
成する直線分を探索することにより文字記入領域を決定
している。
2重線、破線といった文字記入領域(図11)を抽出す
る場合には実線、2重線、破線といった様々な線分の種
類毎に処理が必要になり、多種多様の線種全てに対処す
ることは現実的に困難である。さらに、従来の方法では
枠線が破線や曲線である場合(図12)には対応できな
い。また、枠外に近接する線分が存在するような場合
(図13)には枠を形成する直線分の同定が困難にな
り、文字記入領域の抽出に失敗する原因となるため、枠
外に線分が近接する場合には適用できないという限界が
ある。このため対象とする文書の書式には様々な制約が
ある。
でき、かつ近接線分の存在などの枠外の様々な状況の変
化に対しても安定した文字記入領域抽出が可能な文字記
入領域抽出方法を提供することにある。
出方法は、入力された図面や文書の画像を粗から密に階
層的に複数の領域に分割する領域分割段階と、前記画像
が一定の粗さの領域まで分割されると、該領域において
黒画素で囲まれた閉領域を抽出する閉領域抽出段階と、
事前に得られている枠座標情報を用いて、前記の抽出さ
れた閉領域のうち同一枠内にほぼ包含される全ての閉領
域を同じグループに属するものとしてグルーピングする
閉領域グルーピング段階と、当該階層において同一のグ
ループにグルーピングされた閉領域中に前回の階層にお
いて異なるグループに属する閉領域が存在すれば前記の
グルーピングされた領域を不正領域として無効化する不
正領域検知・無効化段階と、領域の分割の回数が上限値
に達したか、および領域の分割をさらに行える有効領域
が存在するかどうかを判定し、領域の分割の回数が上限
値に達せず、かつ有効領域が存在すれば、前記領域分割
段階に戻る分割終了条件判定段階と、領域の分割の回数
が上限値に達したか、有効領域が存在しなくなれば、同
じグループにグルーピングされた閉領域の最小外接矩形
領域を文字記入領域として抽出する外接矩形生成・文字
記入領域抽出段階を有する。
て画像の分割を行うことができる。
文書または図面の画像を粗から密に階層的に分割し、一
定の粗さの領域が得られると、閉領域となる背景領域を
抽出し、抽出された閉領域を事前に得られている枠座標
情報をもとにグルーピングし、同じ枠内にグルーピング
された全ての有効な閉領域の最小外接矩形領域を文字記
入領域として抽出するので、枠が実線の場合は勿論、枠
が2重線、破線、波線といった様々な文字記入領域の抽
出が可能である。さらに、本発明は、各階層において同
一のグループにグルーピングされた閉領域中に前回の階
層と異なるグループに属する閉領域が存在すれば、これ
ら閉領域が画像の掠れや点線、破線のために枠外の領域
と接合したものとして、その枠外の領域と接合した閉領
域を無効化するので、近接線分の存在や線分の破れなど
にも影響されないで、文字記入領域を抽出することがで
きる。
て説明する。
出方法を示す流れ図である。
正段階1と領域分割段階2と閉領域抽出段階3と閉領域
のグルーピング段階4と不正領域検知段階5と不正領域
の無効化段階6と分割終了条件判定段階7と同グループ
領域の外接矩形を生成する段階8と文字記入領域の切り
出し段階9から構成される。
ータの傾きの補正を行なう。傾きの補正方法としては、
枠線を基準とするものや、画像の射影(ヒストグラム)
を用いた方法などがある。傾きの補正方法は本発明の本
質部分でないので省略する。 (2)領域分割段階2 次に、入力された画像を粗から密に分割する。この分割
に4進木構造化法(quadtree 法)を用いるものとす
る。4進木構造化法は画像を4つの単位領域(ノード)
に分割し、そのノード内に黒画素がある場合にはさらに
そのノードを4つのノードに分割していく。ノード内に
黒画素が1つもない場合にはそのノードはそれ以上分割
しない。この手法を用いれば、黒画素のある範囲だけを
階層的に分割することができ、任意の粗さの画像を高速
に得ることができる。なお、4進木構造化法を用いなく
ても画像を粗から密に階層的に分割することは可能であ
るが、4進木構造化法では不必要なところは処理しない
のでデータ量の軽減、処理時間の短縮が図れる。 (3)閉領域抽出段階3 画像が一定の粗さの領域まで分割された時点で、黒画素
で囲まれる閉領域の抽出を行う。閉領域の抽出は4進木
データ上で行うことも可能であるが、処理が複雑になる
ため4進木データをビットマップデータに変換してから
抽出処理を行うものとする。ここで本方法では後述する
枠座標情報をもとに枠付近のみを処理するようにしてい
る。閉領域の抽出は白黒の境界となる画素を追跡するこ
とにより実現できる。 (4)閉領域のグルーピング段階4 次に、枠座標情報を用いて、抽出された閉領域のうち同
一枠内にほぼ包含される全ての閉領域を同じグループに
属するものとして登録する。枠座標情報は、枠の大きさ
や相対位置といった情報である。枠座標情報は事前に空
の書式などから獲得しておく。 (5)不正領域の検知段階5 不正領域というのは、破線や入力画像の掠れによって枠
外の領域と接合してしまった領域のことを指す。不正領
域があると枠内領域を正しく決定することができないの
で、これを検知し無効化する必要がある。具体的には、
第(n+1)階層の領域Akが、第n階層において異な
るグループに属する領域ai,bjを含む場合、枠外の
領域との接合があったと判断する。 (6)不正領域の無効化段階6 不正領域の検知段階5において不正領域とされた領域A
kを無効な領域として登録し、この部分の分割は第n階
層で終了するものとする。これにより、破線や掠れのあ
る部分の分割を適正な階層で自動的に停止することがで
きる。 (7)分割終了条件判定段階7 領域の分割回数が上限値(この値は、画像の性質、処理
時間などを考慮して設定しておく)に達するか、有効領
域がなくなるまで、以上の領域分割段階2から不正領域
の無効化段階6を繰り返す。領域の分割回数が上限値に
達するか、有効領域になくなると、次の段階に移る。 (8)同グループ領域の最小外接矩形の生成段階8 各階層において抽出された全ての閉領域について、同グ
ループに属する領域全体に対する最小外接矩形を生成す
る。この外接矩形を文字記入領域とする。 (9)文字記入領域の切り出し段階9 以上のようにして獲得された文字記入領域に対して原画
像上で対応する領域を切り出す。
具体例を説明する。
された画像データである。この画像データは傾き補正段
階1で傾きの補正が行われた後、領域分割段階2で4進
木構造化法により粗から密に分割される。図3は分割例
である。次に、閉領域抽出段階3で閉領域抽出が行われ
るが、図3の4進木データを図4に示すようなビットマ
ップデータに変換した後、図5に示すような閉領域が抽
出される。次に、閉領域のグルーピング段階4で閉領域
のグルーピングが行われる。図6は第n階層のグルーピ
ング、図7は第(n+1)階層のグルーピングの結果を
示しいる。ここで、図7中の中央の白抜きの領域Akは
図6中の異なるグループに属する領域ai,bjを含む
ので、不正領域検知段階5で領域Akを不正領域として
無効化し、図8が有効領域となる。次に、同グループ領
域の最小外接矩形の生成段階8で図8の有効領域に対し
て図9に示すような文字記入領域が決定され、文字記入
領域の切り出し段階9で切り出される。図10は図2の
原画像に対して切り出された文字記入領域を示してい
る。
位置や大きさが決まっている帳票のような定型書式の文
書を対象として説明したが、本発明は定型書式以外の場
合でも、何らかの方法で閉領域のグルーピングが可能な
場合には適用が可能である。
文書内に存在する枠で囲まれた文字記入領域を抽出する
場合に、様々な種類の線分に単一の処理で対応できると
ともに、近接線分の存在などの枠外に状況の変化にも影
響されない文字記入領域の抽出ができるため、対象とな
る文書の書式の制約を大幅に軽減することができ、適用
範囲を大幅に拡大することが可能になる。
理の流れ図である。
図である。
様子を示す図である。
換した様子を示す図である。
域を示す図である。
を示す図である。
示す図である。
示す図である。
領域を示す図である。
を示す図である。
す図である。
の例を示す図である。
Claims (2)
- 【請求項1】 図形や文書の囲み枠で定義された文字記
入領域を抽出する文字記入領域抽出方法であって、 入力された図面や文書の画像を粗から密に階層的に複数
の矩形領域に分割する領域分割段階と、 前記画像が一定の粗さ以上の矩形領域に分割されると、
該領域において黒画素で囲まれた閉領域を抽出する閉領
域抽出段階と、 事前に得られている枠座標情報を用いて、前記の抽出さ
れた閉領域のうち同一枠内にほぼ包含される全ての閉領
域を同じグループに属するものとしてグルーピングする
閉領域グルーピング段階と、 当該階層において同一のグループにグルーピングされた
閉領域中に前回の階層において異なるグループに属する
閉領域が存在すれば前記のグルーピングされた領域を不
正領域として無効化する不正領域検出・無効化段階と、矩形 領域の分割の回数が上限値に達したか、および矩形
領域の分割をさらに行える有効領域が存在するかどうか
を判定し、矩形領域の分割の回数が上限値に達せず、か
つ有効領域が存在すれば、前記領域分割手順に戻る分割
終了条件判断手段と、 領域の分割回数が上限値に達したか、有効領域が存在し
なくなれば、同じグループにグルーピングされた閉領域
の最小外接矩形領域を文字記入領域として抽出する外接
矩形生成・文字記入領域抽出段階を有する文字記入領域
抽出方法。 - 【請求項2】 4進木構造化法を用いて画像の分割を行
なう請求項1記載の閉領域抽出方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP7045682A JP3007549B2 (ja) | 1995-03-06 | 1995-03-06 | 文字記入領域抽出方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP7045682A JP3007549B2 (ja) | 1995-03-06 | 1995-03-06 | 文字記入領域抽出方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH08241372A JPH08241372A (ja) | 1996-09-17 |
JP3007549B2 true JP3007549B2 (ja) | 2000-02-07 |
Family
ID=12726172
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP7045682A Expired - Lifetime JP3007549B2 (ja) | 1995-03-06 | 1995-03-06 | 文字記入領域抽出方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3007549B2 (ja) |
-
1995
- 1995-03-06 JP JP7045682A patent/JP3007549B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH08241372A (ja) | 1996-09-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5452374A (en) | Skew detection and correction of a document image representation | |
US5465304A (en) | Segmentation of text, picture and lines of a document image | |
JP3086702B2 (ja) | テキスト又は線図形を識別する方法及びデジタル処理システム | |
US5075895A (en) | Method and apparatus for recognizing table area formed in binary image of document | |
JP2001358925A (ja) | 画像処理のための装置、方法及び記録媒体 | |
JP2006067585A (ja) | デジタル画像におけるキャプションを位置特定及び抽出する方法及び装置 | |
JPH05233873A (ja) | 領域分割方法 | |
US20150055866A1 (en) | Optical character recognition by iterative re-segmentation of text images using high-level cues | |
JP2003259112A (ja) | 透かし情報抽出装置及びその制御方法 | |
JP3007549B2 (ja) | 文字記入領域抽出方法 | |
JPH08317193A (ja) | ディジタル化画像の縦横ラインを検知し修正する方法および装置 | |
JP4804433B2 (ja) | 画像処理装置、画像処理方法、及び、画像処理プログラム | |
US11100355B1 (en) | Document image content protection in the context of noise reduction | |
JP3007550B2 (ja) | 閉領域抽出方法 | |
JP2000090194A (ja) | 画像処理方法および画像処理装置 | |
JP3187895B2 (ja) | 文字領域抽出方法 | |
JP2986185B2 (ja) | 線図形の線幅分類方式 | |
JP2006072839A (ja) | 画像処理方法、画像処理装置、画像処理プログラム及び記録媒体 | |
JP2945601B2 (ja) | 対話型図面入力方法 | |
JPH07230525A (ja) | 罫線認識方法及び表処理方法 | |
JP7402931B2 (ja) | 方法、コンピュータ可読プログラムおよびシステム | |
JP7342518B2 (ja) | 画像処理装置及び画像処理プログラム | |
KR100309679B1 (ko) | 문자열추출방법 | |
JP3072126B2 (ja) | 書体を識別する方法及び装置 | |
JP3157860B2 (ja) | 原稿の図形領域抽出方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071126 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081126 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091126 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101126 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101126 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111126 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111126 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121126 Year of fee payment: 13 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121126 Year of fee payment: 13 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131126 Year of fee payment: 14 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
EXPY | Cancellation because of completion of term |