JP3007549B2 - 文字記入領域抽出方法 - Google Patents

文字記入領域抽出方法

Info

Publication number
JP3007549B2
JP3007549B2 JP7045682A JP4568295A JP3007549B2 JP 3007549 B2 JP3007549 B2 JP 3007549B2 JP 7045682 A JP7045682 A JP 7045682A JP 4568295 A JP4568295 A JP 4568295A JP 3007549 B2 JP3007549 B2 JP 3007549B2
Authority
JP
Japan
Prior art keywords
area
closed
character entry
region
extracting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP7045682A
Other languages
English (en)
Other versions
JPH08241372A (ja
Inventor
啓之 新井
昭夫 塩
和己 小高
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP7045682A priority Critical patent/JP3007549B2/ja
Publication of JPH08241372A publication Critical patent/JPH08241372A/ja
Application granted granted Critical
Publication of JP3007549B2 publication Critical patent/JP3007549B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、図面や文書(以下まと
めて文書とする)内に存在する枠で囲まれた文字記入領
域を抽出する方法に関する。
【0002】
【従来の技術】従来の文字記入領域抽出法では、枠を形
成する直線分を探索することにより文字記入領域を決定
している。
【0003】
【発明が解決しようとする課題】このため、枠が実線、
2重線、破線といった文字記入領域(図11)を抽出す
る場合には実線、2重線、破線といった様々な線分の種
類毎に処理が必要になり、多種多様の線種全てに対処す
ることは現実的に困難である。さらに、従来の方法では
枠線が破線や曲線である場合(図12)には対応できな
い。また、枠外に近接する線分が存在するような場合
(図13)には枠を形成する直線分の同定が困難にな
り、文字記入領域の抽出に失敗する原因となるため、枠
外に線分が近接する場合には適用できないという限界が
ある。このため対象とする文書の書式には様々な制約が
ある。
【0004】本発明の目的は、様々な種類の線分に対応
でき、かつ近接線分の存在などの枠外の様々な状況の変
化に対しても安定した文字記入領域抽出が可能な文字記
入領域抽出方法を提供することにある。
【0005】
【課題を解決するための手段】本発明の文字記入領域抽
出方法は、入力された図面や文書の画像を粗から密に階
層的に複数の領域に分割する領域分割段階と、前記画像
が一定の粗さの領域まで分割されると、該領域において
黒画素で囲まれた閉領域を抽出する閉領域抽出段階と、
事前に得られている枠座標情報を用いて、前記の抽出さ
れた閉領域のうち同一枠内にほぼ包含される全ての閉領
域を同じグループに属するものとしてグルーピングする
閉領域グルーピング段階と、当該階層において同一のグ
ループにグルーピングされた閉領域中に前回の階層にお
いて異なるグループに属する閉領域が存在すれば前記の
グルーピングされた領域を不正領域として無効化する不
正領域検知・無効化段階と、領域の分割の回数が上限値
に達したか、および領域の分割をさらに行える有効領域
が存在するかどうかを判定し、領域の分割の回数が上限
値に達せず、かつ有効領域が存在すれば、前記領域分割
段階に戻る分割終了条件判定段階と、領域の分割の回数
が上限値に達したか、有効領域が存在しなくなれば、同
じグループにグルーピングされた閉領域の最小外接矩形
領域を文字記入領域として抽出する外接矩形生成・文字
記入領域抽出段階を有する。
【0006】なお、画像の分割は4進木構造化法を用い
て画像の分割を行うことができる。
【0007】
【作用】本発明は、スキャナーなどから入力された帳票
文書または図面の画像を粗から密に階層的に分割し、一
定の粗さの領域が得られると、閉領域となる背景領域を
抽出し、抽出された閉領域を事前に得られている枠座標
情報をもとにグルーピングし、同じ枠内にグルーピング
された全ての有効な閉領域の最小外接矩形領域を文字記
入領域として抽出するので、枠が実線の場合は勿論、枠
が2重線、破線、波線といった様々な文字記入領域の抽
出が可能である。さらに、本発明は、各階層において同
一のグループにグルーピングされた閉領域中に前回の階
層と異なるグループに属する閉領域が存在すれば、これ
ら閉領域が画像の掠れや点線、破線のために枠外の領域
と接合したものとして、その枠外の領域と接合した閉領
域を無効化するので、近接線分の存在や線分の破れなど
にも影響されないで、文字記入領域を抽出することがで
きる。
【0008】
【実施例】次に、本発明の実施例について図面を参照し
て説明する。
【0009】図1は本発明の一実施例の文字記入領域抽
出方法を示す流れ図である。
【0010】本実施例の文字記入領域抽出方法は傾き補
正段階1と領域分割段階2と閉領域抽出段階3と閉領域
のグルーピング段階4と不正領域検知段階5と不正領域
の無効化段階6と分割終了条件判定段階7と同グループ
領域の外接矩形を生成する段階8と文字記入領域の切り
出し段階9から構成される。
【0011】次に、各段階1〜9の処理を説明する。 (1)傾き補正段階1 まず、スキャナーなどにより計算機に入力された画像デ
ータの傾きの補正を行なう。傾きの補正方法としては、
枠線を基準とするものや、画像の射影(ヒストグラム)
を用いた方法などがある。傾きの補正方法は本発明の本
質部分でないので省略する。 (2)領域分割段階2 次に、入力された画像を粗から密に分割する。この分割
に4進木構造化法(quadtree 法)を用いるものとす
る。4進木構造化法は画像を4つの単位領域(ノード)
に分割し、そのノード内に黒画素がある場合にはさらに
そのノードを4つのノードに分割していく。ノード内に
黒画素が1つもない場合にはそのノードはそれ以上分割
しない。この手法を用いれば、黒画素のある範囲だけを
階層的に分割することができ、任意の粗さの画像を高速
に得ることができる。なお、4進木構造化法を用いなく
ても画像を粗から密に階層的に分割することは可能であ
るが、4進木構造化法では不必要なところは処理しない
のでデータ量の軽減、処理時間の短縮が図れる。 (3)閉領域抽出段階3 画像が一定の粗さの領域まで分割された時点で、黒画素
で囲まれる閉領域の抽出を行う。閉領域の抽出は4進木
データ上で行うことも可能であるが、処理が複雑になる
ため4進木データをビットマップデータに変換してから
抽出処理を行うものとする。ここで本方法では後述する
枠座標情報をもとに枠付近のみを処理するようにしてい
る。閉領域の抽出は白黒の境界となる画素を追跡するこ
とにより実現できる。 (4)閉領域のグルーピング段階4 次に、枠座標情報を用いて、抽出された閉領域のうち同
一枠内にほぼ包含される全ての閉領域を同じグループに
属するものとして登録する。枠座標情報は、枠の大きさ
や相対位置といった情報である。枠座標情報は事前に空
の書式などから獲得しておく。 (5)不正領域の検知段階5 不正領域というのは、破線や入力画像の掠れによって枠
外の領域と接合してしまった領域のことを指す。不正領
域があると枠内領域を正しく決定することができないの
で、これを検知し無効化する必要がある。具体的には、
第(n+1)階層の領域Akが、第n階層において異な
るグループに属する領域ai,bjを含む場合、枠外の
領域との接合があったと判断する。 (6)不正領域の無効化段階6 不正領域の検知段階5において不正領域とされた領域A
kを無効な領域として登録し、この部分の分割は第n階
層で終了するものとする。これにより、破線や掠れのあ
る部分の分割を適正な階層で自動的に停止することがで
きる。 (7)分割終了条件判定段階7 領域の分割回数が上限値(この値は、画像の性質、処理
時間などを考慮して設定しておく)に達するか、有効領
域がなくなるまで、以上の領域分割段階2から不正領域
の無効化段階6を繰り返す。領域の分割回数が上限値に
達するか、有効領域になくなると、次の段階に移る。 (8)同グループ領域の最小外接矩形の生成段階8 各階層において抽出された全ての閉領域について、同グ
ループに属する領域全体に対する最小外接矩形を生成す
る。この外接矩形を文字記入領域とする。 (9)文字記入領域の切り出し段階9 以上のようにして獲得された文字記入領域に対して原画
像上で対応する領域を切り出す。
【0012】次に、本方法を用いた文字記入領域抽出の
具体例を説明する。
【0013】図2はスキャナーなどにより計算機に入力
された画像データである。この画像データは傾き補正段
階1で傾きの補正が行われた後、領域分割段階2で4進
木構造化法により粗から密に分割される。図3は分割例
である。次に、閉領域抽出段階3で閉領域抽出が行われ
るが、図3の4進木データを図4に示すようなビットマ
ップデータに変換した後、図5に示すような閉領域が抽
出される。次に、閉領域のグルーピング段階4で閉領域
のグルーピングが行われる。図6は第n階層のグルーピ
ング、図7は第(n+1)階層のグルーピングの結果を
示しいる。ここで、図7中の中央の白抜きの領域Akは
図6中の異なるグループに属する領域ai,bjを含む
ので、不正領域検知段階5で領域Akを不正領域として
無効化し、図8が有効領域となる。次に、同グループ領
域の最小外接矩形の生成段階8で図8の有効領域に対し
て図9に示すような文字記入領域が決定され、文字記入
領域の切り出し段階9で切り出される。図10は図2の
原画像に対して切り出された文字記入領域を示してい
る。
【0014】以上、説明の簡単化のため、枠の大まかな
位置や大きさが決まっている帳票のような定型書式の文
書を対象として説明したが、本発明は定型書式以外の場
合でも、何らかの方法で閉領域のグルーピングが可能な
場合には適用が可能である。
【0015】
【発明の効果】以上説明したように、本発明によれば、
文書内に存在する枠で囲まれた文字記入領域を抽出する
場合に、様々な種類の線分に単一の処理で対応できると
ともに、近接線分の存在などの枠外に状況の変化にも影
響されない文字記入領域の抽出ができるため、対象とな
る文書の書式の制約を大幅に軽減することができ、適用
範囲を大幅に拡大することが可能になる。
【図面の簡単な説明】
【図1】本発明の一実施例の文字記入領域抽出方法の処
理の流れ図である。
【図2】文字記入領域抽出の対象画像データの例を示す
図である。
【図3】図2の画像データを4進木構造化法に分割した
様子を示す図である。
【図4】図3の4進木データをビットマップデータに変
換した様子を示す図である。
【図5】図4のビットマップデータから抽出された閉領
域を示す図である。
【図6】閉領域のグルーピング例を示す図である。
【図7】図6の次の層における閉領域のグルーピング例
を示す図である。
【図8】図7中の不正領域Akを無効化した有効領域を
示す図である。
【図9】図8の有効領域から決定された切り出し領域を
示す図である。
【図10】図2の原画像に対して切り出された文字記入
領域を示す図である。
【図11】枠が実線、2重線、破線の文字記入領域の例
を示す図である。
【図12】枠が破線や曲線である文字記入領域の例を示
す図である。
【図13】枠外に近接する線分が存在する文字記入領域
の例を示す図である。
【符号の説明】
1 傾き補正段階 2 領域分割段階 3 閉領域抽出段階 4 閉領域のグルーピング段階 5 不正領域検知段階 6 不正領域の無効化段階 7 分割終了条件判定段階 8 同グループ領域の外接矩形を生成する段階 9 文字記入領域の切り出し段階
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06K 9/20 G06T 7/00

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 図形や文書の囲み枠で定義された文字記
    入領域を抽出する文字記入領域抽出方法であって、 入力された図面や文書の画像を粗から密に階層的に複数
    矩形領域に分割する領域分割段階と、 前記画像が一定の粗さ以上の矩形領域に分割されると、
    該領域において黒画素で囲まれた閉領域を抽出する閉領
    域抽出段階と、 事前に得られている枠座標情報を用いて、前記の抽出さ
    れた閉領域のうち同一枠内にほぼ包含される全ての閉領
    域を同じグループに属するものとしてグルーピングする
    閉領域グルーピング段階と、 当該階層において同一のグループにグルーピングされた
    閉領域中に前回の階層において異なるグループに属する
    閉領域が存在すれば前記のグルーピングされた領域を不
    正領域として無効化する不正領域検出・無効化段階と、矩形 領域の分割の回数が上限値に達したか、および矩形
    領域の分割をさらに行える有効領域が存在するかどうか
    を判定し、矩形領域の分割の回数が上限値に達せず、か
    つ有効領域が存在すれば、前記領域分割手順に戻る分割
    終了条件判断手段と、 領域の分割回数が上限値に達したか、有効領域が存在し
    なくなれば、同じグループにグルーピングされた閉領域
    の最小外接矩形領域を文字記入領域として抽出する外接
    矩形生成・文字記入領域抽出段階を有する文字記入領域
    抽出方法。
  2. 【請求項2】 4進木構造化法を用いて画像の分割を行
    なう請求項1記載の閉領域抽出方法。
JP7045682A 1995-03-06 1995-03-06 文字記入領域抽出方法 Expired - Lifetime JP3007549B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7045682A JP3007549B2 (ja) 1995-03-06 1995-03-06 文字記入領域抽出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7045682A JP3007549B2 (ja) 1995-03-06 1995-03-06 文字記入領域抽出方法

Publications (2)

Publication Number Publication Date
JPH08241372A JPH08241372A (ja) 1996-09-17
JP3007549B2 true JP3007549B2 (ja) 2000-02-07

Family

ID=12726172

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7045682A Expired - Lifetime JP3007549B2 (ja) 1995-03-06 1995-03-06 文字記入領域抽出方法

Country Status (1)

Country Link
JP (1) JP3007549B2 (ja)

Also Published As

Publication number Publication date
JPH08241372A (ja) 1996-09-17

Similar Documents

Publication Publication Date Title
US5452374A (en) Skew detection and correction of a document image representation
US5465304A (en) Segmentation of text, picture and lines of a document image
JP3086702B2 (ja) テキスト又は線図形を識別する方法及びデジタル処理システム
US5075895A (en) Method and apparatus for recognizing table area formed in binary image of document
JP2001358925A (ja) 画像処理のための装置、方法及び記録媒体
JP2006067585A (ja) デジタル画像におけるキャプションを位置特定及び抽出する方法及び装置
JPH05233873A (ja) 領域分割方法
US20150055866A1 (en) Optical character recognition by iterative re-segmentation of text images using high-level cues
JP2003259112A (ja) 透かし情報抽出装置及びその制御方法
JP3007549B2 (ja) 文字記入領域抽出方法
JPH08317193A (ja) ディジタル化画像の縦横ラインを検知し修正する方法および装置
JP4804433B2 (ja) 画像処理装置、画像処理方法、及び、画像処理プログラム
US11100355B1 (en) Document image content protection in the context of noise reduction
JP3007550B2 (ja) 閉領域抽出方法
JP2000090194A (ja) 画像処理方法および画像処理装置
JP3187895B2 (ja) 文字領域抽出方法
JP2986185B2 (ja) 線図形の線幅分類方式
JP2006072839A (ja) 画像処理方法、画像処理装置、画像処理プログラム及び記録媒体
JP2945601B2 (ja) 対話型図面入力方法
JPH07230525A (ja) 罫線認識方法及び表処理方法
JP7402931B2 (ja) 方法、コンピュータ可読プログラムおよびシステム
JP7342518B2 (ja) 画像処理装置及び画像処理プログラム
KR100309679B1 (ko) 문자열추출방법
JP3072126B2 (ja) 書体を識別する方法及び装置
JP3157860B2 (ja) 原稿の図形領域抽出方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071126

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081126

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091126

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101126

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101126

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111126

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111126

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121126

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121126

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131126

Year of fee payment: 14

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term