JPH0728935A - 文書画像処理装置 - Google Patents

文書画像処理装置

Info

Publication number
JPH0728935A
JPH0728935A JP5192746A JP19274693A JPH0728935A JP H0728935 A JPH0728935 A JP H0728935A JP 5192746 A JP5192746 A JP 5192746A JP 19274693 A JP19274693 A JP 19274693A JP H0728935 A JPH0728935 A JP H0728935A
Authority
JP
Japan
Prior art keywords
area
layout information
extraction
document image
layout
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5192746A
Other languages
English (en)
Inventor
Naohiro Amamoto
直弘 天本
Sadamasa Hirogaki
節正 広垣
Yoshitaka Hamaguchi
佳孝 濱口
Makoto Torigoe
真 鳥越
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP5192746A priority Critical patent/JPH0728935A/ja
Publication of JPH0728935A publication Critical patent/JPH0728935A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

(57)【要約】 【目的】 予め用意されたレイアウト情報により正確な
領域抽出を行なう。 【構成】 読取部1により得られた文書画像から、領域
抽出部2により当該文書画像上の各領域を抽出する。次
に、レイアウト識別部4によりこの領域抽出結果とレイ
アウト情報格納部3に予め格納されている複数又は単数
のレイアウト情報とを比較する。そして、一致したレイ
アウト情報に従って、領域抽出部2の領域抽出結果を修
正し、文字領域を抽出する。この文字領域については、
文字認識部6で文字認識を行ない、その結果を認識結果
格納部7に格納する。また、文字以外の領域については
画像データとして画像データ格納部5に格納する。一
方、一致するレイアウト情報がないときは、領域抽出結
果をレイアウト情報格納部3に格納する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字認識装置(OC
R)やファクシミリ等に使用される文書画像処理装置に
関するものである。
【0002】
【従来の技術】文字のほかに絵や写真等を含む文書中の
文字を認識する場合、文書画像中から文字の部分だけを
取り出さなければならない。このような文書画像の処理
を行なう装置が文書画像処理装置である。図2及び図3
は、従来の文書画像処理の一例の説明図である。図2
(a)及び図3(a)に示す読取対象となる帳票11、
21から、図2(b)及び図3(b)に示す直線イメー
ジを検出する。そして、これらの直線群からフレーム構
造を抽出し、予め格納されているフレーム構造情報との
マッチングにより読取フィールドを決定し、このフィー
ルド内の文字を認識する(特開平2−217977号公
報参照)。
【0003】
【発明が解決しようとする課題】しかしながら、上述し
た従来の技術には、次のような問題があった。即ち、上
述した従来の技術では、図2(b)及び図3(b)に示
すような直線イメージが存在する帳票のみが処理対象で
あり、一般文書のように必ずしも直線イメージが存在し
ないような文書は処理ができなかった。例えば、図4に
示すように、文字領域に書かれた文書が複数の欄に亘っ
ているような場合は、処理することができないという問
題があった。本発明は、以上の点に着目してなされたも
ので、上述のような直線イメージがない場合にも、文字
認識対象とする領域を決定でき、領域抽出及び文字認識
を正確に行なえるようにした文書画像処理装置を提供す
ることを目的とするものである。
【0004】
【課題を解決するための手段】本発明の文書画像処理装
置は、文書画像の各領域を抽出する領域抽出部と、文書
画像上に配置された各領域の属性を示すレイアウト情報
を複数又は単数格納するレイアウト情報格納部と、当該
レイアウト情報格納部に格納されたレイアウト情報のう
ち、前記領域抽出部による領域抽出結果に最も一致する
ものを取り出し、一致するレイアウト情報が存在しない
場合は前記領域抽出結果を新たなレイアウト情報として
前記レイアウト情報格納部に格納し、一致するレイアウ
ト情報が存在する場合は当該レイアウト情報に従って前
記領域抽出結果を修正するレイアウト識別部とから成る
ことを特徴とするものである。
【0005】
【作用】本発明の文書画像処理装置においては、読取部
により得られた文書画像から、領域抽出部により当該文
書画像上の各領域を抽出する。次に、レイアウト識別部
によりこの領域抽出結果とレイアウト情報格納部に予め
格納されている複数又は単数のレイアウト情報とを比較
する。そして、一致したレイアウト情報に従って、領域
抽出部の領域抽出結果を修正し、文字領域を抽出する。
この文字領域については、文字認識部で文字認識を行な
い、その結果を認識結果格納部に格納する。また、文字
以外の領域については画像データとして画像データ格納
部に格納する。
【0006】
【実施例】以下、本発明の実施例を図面を参照して詳細
に説明する。図1は、本発明の文書画像処理装置の一実
施例のブロック図である。図示の装置は、読取部1、文
書画像処理装置10、画像データ格納部5、文字認識部
6、認識結果格納部7から成る。読取部1は、CCDラ
インセンサ等から成り、処理対象となる文書を主走査方
向には電気的に走査し、副走査方向には機械的に走査し
て読み取る。この読取部1には、例えば、周知のシート
フィーダ(図示省略)が設けられている。文書画像処理
装置10は、領域抽出部2、レイアウト情報格納部3、
レイアウト識別部4から成る。
【0007】領域抽出部2は、読取部1で読み取った画
像について領域の抽出処理を行なう。この処理は、例え
ば、以下のようにして行なう。図4に示すように、2値
化された画像データから文字、図形等の領域を自動的に
抽出する。このため、この画像データから、図5
(a)、(b)に示すように、予め定められた閾値以上
の長さと幅を持つ空白領域を追跡して領域を検出し、図
5(c)に示すように、これらの領域を矩形の組み合わ
せとして格納する。レイアウト情報格納部3は、フロッ
ピディスク等から成り、複数のレイアウト情報を予め格
納している。尚、レイアウト情報は、単数でもよく、ま
た、初期状態において空になっていてもよい。
【0008】図6は、文書画像の各領域を示し、図7
は、図6の文書画像に対応するレイアウト情報の一例を
示す。例えば、図7に示す表の第1行では、図6の領域
61を、xs=100,ys=300,xe=160
0,ye=1000の各直線で区画される領域として特
定する。そして、その領域の属性がflagにより文字(横
書き)であることが示される。属性は、例えば6ビット
のデータから成り、“1”のビットは文字(横書き)示
し、“2”のビットは文字(縦書き)を示し、“4”の
ビットは図形を示す。また、“8”のビットは写真を示
し、“16”のビットは罫線を示し、“32”のビット
は表を示す。
【0009】従って、図7に示す表の第2行は、図6の
領域62が、xs=1650,ys=300,xe=3
300,ye=1500の各直線で区画される領域であ
り、その属性はflagにより図形であることが示される。
また、図7に示す表の第3行は、図6の領域63が、x
s=100,ys=1200,xe=1600,ye=
3000の各直線で区画される領域であり、その属性は
flagにより写真であることが示される。図7に示す表の
第4行は、図6の領域が、xs=1650,ys=17
00,xe=3300,ye=4600の各直線で区画
される領域であり、その属性はflagにより文字(横書
き)であることが示される。図7に示す表の第5行は、
図6の領域が、xs=100,ys=3100,xe=
1600,ye=4600の各直線で区画される領域で
あり、その属性はflagにより文字(横書き)であること
が示される。
【0010】尚、図7に示すレイアウト情報に文字領域
の読取順序等の項目を含めるようにしてもよい。例え
ば、図6の領域61、65、64の順に文章が書かれて
いる場合は、この順序を示しておくことにより、この順
序に従って、自動的に文字認識を行なうことができる。
【0011】レイアウト識別部4は、レイアウト情報格
納部3に予め格納されている複数のレイアウト情報と、
領域抽出部2で得られた領域抽出結果とを比較する。そ
して、一致するレイアウト情報を識別した結果、領域抽
出結果を修正する必要があればレイアウト情報に従って
修正し、文字以外の領域は画像データとして画像データ
格納部5に格納する。一方、文字領域は文字認識部6で
文字認識した後、テキストデータとして認識結果格納部
7に格納する。また、レイアウト識別部4でのレイアウ
ト情報と領域抽出結果との比較により各レイアウト情報
について類似度を求める。そして、類似度が最大である
レイアウト情報を一致レイアウトとする。このレイアウ
ト情報に従って領域抽出結果を修正する。
【0012】まず、レイアウト情報に格納されているあ
る領域を既知領域とし、この既知領域の中心点の座標を
次式により求める。 {(xs+xe)/2,(ys+ye)/2} 一方、領域抽出の結果得られた領域(抽出領域)のう
ち、既知領域と同じ属性を持つすべての抽出領域につい
て、上記式により中心点を求める。その後、既知領域の
中心点と、これらのすべての抽出領域の中心点との距離
を求める。そして、この距離が最小となる抽出領域を既
知領域に対応する領域とする。尚、図8(a)に示す抽
出領域71、75のように、図8(b)に示すいずれの
既知領域にも対応しない抽出領域もある。以上の処理を
すべての既知領域について行なう。
【0013】これらの処理において、以下の2つの場合
は、領域抽出結果とレイアウト情報との類似度を“0”
(不一致)とし、以降の処理は行なわない。 (1)既知領域と同じ属性を持つ抽出領域が存在しない
場合、即ち、既知領域に対応する抽出領域が存在しない
場合は、不一致とする。 (2)ある抽出領域が複数の既知領域に対応している場
合は、後述する類似度の計算の都合上、不一致とする。
【0014】上述した(1)、(2)の2つの場合以外
の場合は、次のようにして領域抽出結果とレイアウト情
報との類似度を求める。まず、既知領域とそれに対応す
る抽出領域との重複部分の面積を求める。この面積は、
双方の領域の座標から容易に求められる。そして、次式
により類似度を求める。 類似度=(重複部分の面積の和)/(全既知領域の面積
の和)×100 以上の処理をレイアウト情報格納部3に格納されている
すべてのレイアウト情報について行なう。そして、最も
類似度の大きいレイアウトを一致レイアウトとする。た
だし、その一致レイアウトの類似度がある一定値(TH
L)以下の場合は、一致レイアウトなしとして領域抽出
結果を新しいレイアウト情報としてレイアウト情報格納
部3に格納する。この場合は、領域抽出結果をそのまま
使用するので、以下の修正処理は行なわない。
【0015】最後に、上記処理で一致レイアウトと判定
されたレイアウト情報に従って領域抽出結果を修正す
る。図8は、修正処理の一例の説明図である。一致レイ
アウト情報の左上及び右下の文字領域は、領域抽出結果
ではそれぞれ2つの領域に分かれている。従って、それ
らの2つの領域を統合する必要がある。この場合、既知
領域に対応する抽出領域とそれ以外の領域を類似度が1
00%に最も近づく組み合わせで統合を行なう。ここ
で、既知領域に対応しない領域とは、既知領域との重複
部分を持たない領域である。このような領域を既知領域
に対応する抽出領域と統合する必要がある。ただし、既
知領域と抽出領域の対応が1対1ではなくなるような組
み合わせでの統合は行なわない。修正の結果得られた領
域のうち、文字以外の領域は画像データとして画像デー
タ格納部5に格納される。
【0016】一方、レイアウト識別部4で得られた修正
された領域抽出結果のうち、文字の領域に関しては、文
字認識部6で文字を1文字単位に切り出し、文字認識を
行なった後、その認識の結果得られる文字コードを認識
結果格納部7に格納する。図9に、上述したレイアウト
識別部の処理手順の概要を示す。
【0017】まず、ステップS1では、レイアウト情報
の既知領域に対応する文書画像の抽出領域を求める。こ
の対応関係を求めた後、ステップS2で、レイアウト情
報と文書画像の類似度を求める。この類似度はすべての
レイアウト情報について求める。ステップS3では、ス
テップS2で求めた最大の類似度が一定値以下か否かを
判別し、一定値以下のときは、一致するレイアウト情報
がないものとして、ステップS5で領域抽出結果を新た
なレイアウト情報とする。一方、ステップS2で求めた
最大の類似度が一定値以下でないときは、そのレイアウ
ト情報を領域抽出結果に一致するレイアウト情報とし、
ステップS4でそのレイアウト情報に従って領域抽出結
果を修正する。
【0018】次に、上述した装置の動作を説明する。ま
ず、読取部1で文書画像が読み取られる。領域抽出部2
では、この文書画像から公知の方法により図8(a)に
示すように各領域が抽出される。レイアウト情報格納部
3には、図8(b)に示すようなレイアウト情報が格納
されている。レイアウト識別部4は、図9のフローチャ
ートに従って処理を行なう。図8(a)と図8(b)と
を比較すると、抽出領域71の中心点に最も近い中心点
を持つのは既知領域81である。従って、抽出領域72
に対応するのは、既知領域81である。同様に、抽出領
域73に対応するのは、既知領域82であり、抽出領域
74に対応するのは、既知領域83である。また、抽出
領域75に対応するのは、既知領域84であり、抽出領
域76に対応するのは、既知領域84である。更に、抽
出領域77に対応するのは、既知領域85である。
【0019】次に、図8(a)の領域抽出結果と、図8
(b)のレイアウト情報の類似度を求める。このため、
まず、抽出領域71、72と、既知領域81の各重複部
分の面積を求める。同様に、抽出領域73、74と、既
知領域82、83の各重複部分の面積を求める。また、
抽出領域75、76と、既知領域84の各重複部分の面
積を求める。更に、抽出領域77と、既知領域85の重
複部分の面積を求める。そして、これらの重複部分の面
積の和を求める。一方、既知領域81、82、83、8
4、85の各面積を求め、それらの和を求める。この既
知領域の面積の和は、予め求めておいて、レイアウト情
報中に含めておくようにしてもよい。
【0020】そして、既知領域と抽出領域の重複部分の
面積の和を、既知領域の面積の和で割ることによって類
似度を求める。この類似度が100%であれば、領域抽
出結果のレイアウトは、既知のレイアウトと完全に一致
することになる。しかし、完全に一致しなくても類似度
がある程度の大きさであれば、領域抽出の誤差の範囲に
含まれ、レイアウト情報のレイアウトと一致すると見な
すことができる。図8のような場合は、レイアウトが一
致すると見なす。
【0021】従って、図8(b)に従い、図8(a)の
領域抽出結果を修正する。即ち、図8(a)の複数の抽
出領域のうち、図8(b)の1つの既知領域と対応する
ものを統合する。例えば、抽出領域71は、抽出領域7
2と統合して図8(c)に示す1つの抽出領域91とす
る。一方、抽出領域75は、抽出領域73と抽出領域7
6のいずれかと統合することになるが、抽出領域75の
属性が文字であり、抽出領域73の属性が図形で、抽出
領域76の属性が文字であるので、抽出領域76と統合
する。尚、図8(a)に示す場合と異なり、抽出領域7
3の属性も文字であるときも、抽出領域76と統合した
場合の類似度が抽出領域73と統合した場合の類似度よ
り大きくなるので、抽出領域76と統合する。そして、
図8(c)に示す1つの抽出領域94とする。
【0022】この結果、図8(b)のレイアウト情報の
属性を参照し、既知領域81に対応する抽出領域91、
既知領域84に対応する抽出領域94、既知領域85に
対応する抽出領域95をそれぞれ文字領域として取り出
し、これらの領域から各文字を切り出して文字認識を行
なうことができる。従って、領域抽出の結果得られた各
抽出領域のすべてについて属性を調べる必要がなく、迅
速な文書画像処理を行なうことができる。また、図8
(c)に示す抽出領域92、93を誤って文字領域とし
て文字認識してしまうことを防止することができる。
【0023】尚、本発明は、上述した実施例に限定され
るものではなく、請求の範囲に記載された事項の範囲内
で種々の変形が可能であることはいうまでもない。例え
ば、領域抽出結果とレイアウト情報の比較において、抽
出領域の中心点と既知領域の中心点の距離を比較するよ
うにしたが、これに限らず、抽出領域の特定の頂点と既
知領域の特定の頂点の距離を比較するようにしてもよ
い。
【0024】
【発明の効果】以上説明したように、本発明の文書画像
処理装置によれば、予め用意されたレイアウト情報の中
から領域抽出結果に最も一致するものを自動的に選び出
し、これに従って領域抽出結果を修正して画像処理を行
なうようにしたので、レイアウトが未知の文書として画
像処理を行なう場合と比較して迅速かつ確実な画像処理
を行なうことができる。この結果、いかなる文書画像に
ついても文字認識の精度を向上させることができる。ま
た、レイアウト情報と領域抽出結果を比較する際、既知
領域と抽出領域の中心点間の距離により対応関係を求め
て対応する領域の重複部分の面積からレイアウト情報と
領域抽出結果の類似度を計算するようにすることによ
り、正確な類似度を計算でき、適切な画像処理を行なう
ことができる。
【図面の簡単な説明】
【図1】本発明の文書画像処理装置の一実施例のブロッ
ク図である。
【図2】従来の文書画像処理の一例(その1)の説明図
である。
【図3】従来の文書画像処理の一例(その2)の説明図
である。
【図4】領域抽出処理の一例(その1)の説明図であ
る。
【図5】領域抽出処理の一例(その2)の説明図であ
る。
【図6】文書画像の各領域の説明図である。
【図7】レイアウト情報の一例の説明図である。
【図8】修正処理の一例の説明図である。
【図9】レイアウト識別部の処理手順の概要を示すフロ
ーチャートである。
【符号の説明】
1 読取部 2 領域抽出部 3 レイアウト情報格納部 4 レイアウト識別部 5 画像データ格納部 6 文字認識部 7 認識結果格納部 10 文書画像処理装置
───────────────────────────────────────────────────── フロントページの続き (72)発明者 鳥越 真 東京都港区虎ノ門1丁目7番12号 沖電気 工業株式会社内

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 文書画像の各領域を抽出する領域抽出部
    と、 文書画像上に配置された各領域の属性を示すレイアウト
    情報を複数又は単数格納するレイアウト情報格納部と、 当該レイアウト情報格納部に格納されたレイアウト情報
    のうち、前記領域抽出部による領域抽出結果に最も一致
    するものを取り出し、一致するレイアウト情報が存在し
    ない場合は前記領域抽出結果を新たなレイアウト情報と
    して前記レイアウト情報格納部に格納し、一致するレイ
    アウト情報が存在する場合は当該レイアウト情報に従っ
    て前記領域抽出結果を修正するレイアウト識別部とから
    成ることを特徴とする文書画像処理装置。
  2. 【請求項2】 前記レイアウト識別部は、前記レイアウ
    ト情報と前記領域抽出結果とを比較する際、双方に含ま
    れる各領域の中心点の座標を求め、前記レイアウト情報
    の領域と前記領域抽出結果の領域とでそれらの中心点の
    距離が最も小さいものを対応する領域とし、これらの対
    応する領域の重複部分の面積により類似度を求め、当該
    類似度が最大のレイアウト情報を前記領域抽出結果に一
    致するレイアウト情報とすることを特徴とする文書画像
    処理装置。
JP5192746A 1993-07-07 1993-07-07 文書画像処理装置 Pending JPH0728935A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5192746A JPH0728935A (ja) 1993-07-07 1993-07-07 文書画像処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5192746A JPH0728935A (ja) 1993-07-07 1993-07-07 文書画像処理装置

Publications (1)

Publication Number Publication Date
JPH0728935A true JPH0728935A (ja) 1995-01-31

Family

ID=16296369

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5192746A Pending JPH0728935A (ja) 1993-07-07 1993-07-07 文書画像処理装置

Country Status (1)

Country Link
JP (1) JPH0728935A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003141447A (ja) * 2001-11-06 2003-05-16 Canon Inc 帳票検索システム
US7969598B2 (en) 2005-11-24 2011-06-28 Canon Kabushiki Kaisha Information processing apparatus, system and control method thereof, program, and storage medium for document management
JP2013114678A (ja) * 2011-11-30 2013-06-10 Sharp Corp 画像判定装置およびプログラム
JP2019134364A (ja) * 2018-02-01 2019-08-08 キヤノン株式会社 スキャン画像データに関連する情報を設定するための装置、方法、及びプログラム
JP2021022764A (ja) * 2019-07-24 2021-02-18 京セラドキュメントソリューションズ株式会社 画像処理装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003141447A (ja) * 2001-11-06 2003-05-16 Canon Inc 帳票検索システム
US7969598B2 (en) 2005-11-24 2011-06-28 Canon Kabushiki Kaisha Information processing apparatus, system and control method thereof, program, and storage medium for document management
JP2013114678A (ja) * 2011-11-30 2013-06-10 Sharp Corp 画像判定装置およびプログラム
JP2019134364A (ja) * 2018-02-01 2019-08-08 キヤノン株式会社 スキャン画像データに関連する情報を設定するための装置、方法、及びプログラム
JP2021022764A (ja) * 2019-07-24 2021-02-18 京セラドキュメントソリューションズ株式会社 画像処理装置

Similar Documents

Publication Publication Date Title
US5410611A (en) Method for identifying word bounding boxes in text
JP3343864B2 (ja) 語体の分離方法
US5907631A (en) Document image processing method and system having function of determining body text region reading order
US6944344B2 (en) Document search and retrieval apparatus, recording medium and program
JP3278471B2 (ja) 領域分割方法
JPH07200745A (ja) 少なくとも二つのイメージセクションの比較方法
JPH1139428A (ja) 文書映像の方向修正方法
JP2002203207A (ja) 文字認識方法,プログラム及び記録媒体
JPH0728935A (ja) 文書画像処理装置
JP4810853B2 (ja) 文字画像切出装置、文字画像切出方法およびプログラム
JPH07230525A (ja) 罫線認識方法及び表処理方法
JPH0991385A (ja) 文字認識辞書追加方法及びこれを用いた端末ocr装置
US11710331B2 (en) Systems and methods for separating ligature characters in digitized document images
JP2963474B2 (ja) 類似文字識別方法
JPH0728934A (ja) 文書画像処理装置
JPH09288714A (ja) 表認識方法および装置
JP3276554B2 (ja) フォーマット認識装置及び文字読取り装置
JPH01292586A (ja) 文字認識支援装置
JPH01171080A (ja) 誤り自動訂正文字認識装置
JPH04241074A (ja) 自動文書清書装置
JPH09269970A (ja) 文字認識方法とその装置
JP3071479B2 (ja) 行間スペース検出方法
JP2977244B2 (ja) 文字認識方法及び文字認識装置
JP2004013188A (ja) 帳票読取り装置および帳票読取り方法ならびプログラム
JPH05114048A (ja) 文字認識方法及びその装置