JPH08221506A - 帳票文書認識装置および帳票文書認識方法 - Google Patents

帳票文書認識装置および帳票文書認識方法

Info

Publication number
JPH08221506A
JPH08221506A JP7028333A JP2833395A JPH08221506A JP H08221506 A JPH08221506 A JP H08221506A JP 7028333 A JP7028333 A JP 7028333A JP 2833395 A JP2833395 A JP 2833395A JP H08221506 A JPH08221506 A JP H08221506A
Authority
JP
Japan
Prior art keywords
rectangular frame
line segment
extracted
form document
line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7028333A
Other languages
English (en)
Inventor
Hiroaki Kubota
浩明 久保田
Osamu Hori
修 堀
Mieko Asano
三恵子 浅野
Shigeyoshi Shimotsuji
成佳 下辻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP7028333A priority Critical patent/JPH08221506A/ja
Publication of JPH08221506A publication Critical patent/JPH08221506A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 複雑な表を含む帳票文書や品質の悪い帳票文
書画像においても、長方形枠の抽出を簡易かつ正確に行
うことのできる帳票文書認識装置を提供する。 【構成】 本発明は、複数の長方形枠からなる表を含む
帳票文書を認識する帳票文書認識装置において、入力さ
れた帳票文書の画像データ中から所定のしきい値以上の
長さを有する線分を抽出する線分抽出手段と、抽出され
た前記線分のうち互いに直交するもの同士の交点を抽出
する交点抽出手段と、抽出された前記交点の集合の中か
ら長方形の4頂点となる4つの交点を選択し、該4つの
交点からなる長方形の辺に相当する部分に所定のしきい
値以上の抽出された線分が存在する場合、該4つの交点
からなる長方形を長方形枠として決定する長方形枠抽出
手段とを具備することを特徴とする。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、表形式の部分を含む帳
票あるいは文書をデータ化する帳票文書認識装置および
方法に関する。
【0002】
【従来の技術】帳票文書には、一般に、表を形成する罫
線と文字が含まれ、場合によってはその他に下線や区切
り線のようなガイドラインあるいは図・写真などの多く
の種類の線分が含まれる。
【0003】上記のような帳票文書を認識するための帳
票文書認識装置では、まず帳票文書中から正確に罫線を
抽出することが重要になる。従来の帳票文書認識装置の
多くは、罫線を抽出する方法として、まず帳票文書の入
力画像から線分を抽出し、抽出した線分のうち所定の条
件を満たすものを罫線として決定するような方法を取っ
ている。例えば、抽出された線分の長さを計測し、これ
が設定したしきい値よりも長いものを罫線とする方法が
ある。
【0004】しかしながら、そのような方法では、罫線
のつもりで記述された線分が上記の所定の条件を満たし
ていなかったために罫線として抽出することに失敗した
り、あるいは、文字を構成する線分が上記の所定の条件
を満たしてしまい、これを罫線と誤判別することがあっ
た。例えば、帳票文書画像のかすれや線の途切れなどに
よって抽出した線分がしきい値よりも短くなり、罫線の
抽出に失敗することがあった。また、複雑な帳票文書画
像においては、文字と罫線が接近していたり、文字パタ
ーン中にしきい値を越える長さの線分を含んでいたりす
ることがあり、文字を罫線と誤判別してしまうことがあ
った。
【0005】帳票文書を認識するために表部分の構造認
識や文字コード認識を行うとき、表の基本構成要素であ
る長方形枠(矩形領域)を抽出することは重要である。
従来、この長方形枠の抽出方法として、画像中から検出
した交差パターンに基づいて抽出する方法があった。例
えば、特開平2−50774号公報に示される方法で
は、画像中からくさび型やT字型などのパターンを抽出
し、パターンの分析と組合せにより表領域を抽出してい
る。この方法では、ある程度のカスレや線の途切れに対
しては対応できるが、複雑な文書画像においては、文字
列部分のパターンを交差パターンと間違えてしまう場合
があり、確実に文字列パターンを除去できないという欠
点があった。
【0006】線分と線分の交点という概念を使って長方
形領域を抽出しようという方法もある。例えば、成瀬博
之他「枠罫線情報を用いた帳票文書の構造認識」(電子
情報通信学会論文誌D−II,Vol.J75−D−I
I,No.8)に示されるように、抽出されている罫線
を延長して矩形領域を積極的に作成し、長方形枠として
抽出する方法である。しかし、この方法は、正しい罫線
が抽出されていることを前提として矩形領域を作成する
ものであり、上記のものと同様、文字と表が接触してい
たり、文字部分にノイズがかかっている場合には、文字
と罫線を分類することはできず、正しい罫線が抽出でき
ないので、正しい長方形を抽出することができなかっ
た。
【0007】長方形枠を抽出する際、4つの頂点の接続
状態あるいは頂点付近の形状を求めるものでは、頂点付
近の局所パターンを詳細に認識していたので、処理時間
がかかるといった欠点があった。
【0008】
【発明が解決しようとする課題】以上述べたように、従
来の帳票文書認識装置および方法では、帳票文書の入力
画像から抽出した線分のうち所定の条件を満たすものを
罫線として決定するような方法を取っていたので、帳票
文書に複雑な表が含まれるなどして入力画像中に種々の
線分が込み入って存在していたり、帳票文書の入力画像
の品質が悪かったりする場合、罫線の抽出に失敗した
り、罫線でないものを罫線として抽出してしまうなど正
確な罫線の抽出ができず、正確な長方形枠の抽出ができ
なかった。
【0009】また、画像中から検出した線分の交差パタ
ーンに基づいて長方形枠を抽出する方法では、複雑な表
を含むような帳票文書に対しては、文字列部分のパター
ンを交差パターンと間違えてしまい、正確な長方形枠の
抽出ができなかった。
【0010】また、抽出した罫線を延長して矩形領域を
積極的に作成し、長方形枠として抽出する方法では、文
字と表が接触していたり、文字部分にノイズがかかって
いる場合には、正確な長方形枠の抽出ができなかった。
【0011】さらに、長方形枠を抽出する際、4頂点の
接続状態あるいは頂点付近の形状を検査して長方形枠を
抽出するものでは、頂点付近の局所パターンを詳細に認
識するための処理に時間がかかるといった欠点があっ
た。
【0012】本発明は、上記事情を考慮してなされたも
ので、複雑な表を含む帳票文書や品質の悪い帳票文書画
像においても、長方形枠の抽出を簡易かつ正確に行うこ
とのできる帳票文書認識装置および方法を提供すること
を目的とする。
【0013】また、本発明は、帳票文書画像から長方形
枠の各頂点の接続状態および各頂点の形状を簡易に求め
ることのできる帳票文書認識装置および方法を提供する
ことを目的とする。
【0014】
【課題を解決するための手段】本発明は、複数の長方形
枠からなる表を含む帳票文書を認識する帳票文書認識装
置において、入力された帳票文書の画像データ中から所
定のしきい値以上の長さを有する線分を抽出する線分抽
出手段と、抽出された前記線分のうち互いに直交するも
の同士の交点を抽出する交点抽出手段と、抽出された前
記交点の集合の中から長方形の4頂点となる4つの交点
を選択し、該4つの交点からなる長方形の辺に相当する
部分に所定のしきい値以上の抽出された線分が存在する
場合、該4つの交点からなる長方形を長方形枠として決
定する長方形枠抽出手段とを具備することを特徴とす
る。
【0015】また、本発明は、複数の枠からなる表を含
む帳票を認識する帳票文書認識装置において、入力され
た帳票文書の画像データ中から長方形枠を抽出する長方
形枠抽出手段と、抽出された前記長方形枠の各頂点と前
記画像データ中の前記表を構成する枠の各頂点近傍の線
分との間のずれを夫々計測する頂点ずれ計測手段と、計
測された各頂点と線分の間の夫々のずれを表す情報によ
って、前記表を構成する枠の各頂点の接続状態または各
頂点の形状を決定する頂点属性計測手段とを具備するこ
とを特徴とする。
【0016】本発明は、複数の長方形枠からなる表を含
む帳票文書を認識する帳票文書認識方法において、入力
された帳票文書の画像データ中から所定のしきい値以上
の長さを有する線分を抽出し、抽出された前記線分のう
ち互いに直交するもの同士の交点を抽出し、抽出された
前記交点の集合の中から長方形の4頂点となる4つの交
点を選択し、該4つの交点からなる長方形の辺に相当す
る部分に所定のしきい値以上の抽出された線分が存在す
る場合、該4つの交点からなる長方形を長方形枠として
決定することを特徴とする。
【0017】本発明は、複数の枠からなる表を含む帳票
を認識する帳票文書認識方法において、入力された帳票
文書の画像データ中から長方形枠を抽出し、抽出された
前記長方形枠の各頂点と前記画像データ中の前記表を構
成する枠の各頂点近傍の線分との間のずれを夫々計測
し、計測された各頂点と線分の間の夫々のずれを表す情
報によって、前記表を構成する枠の各頂点の接続状態ま
たは各頂点の形状を決定することを特徴とする。
【0018】
【作用】本発明では、帳票文書画像より抽出された線分
より、(長方形枠を形成することができるような)ある
一定以上の長さをもつ線分をピックアップし、互いにほ
ぼ垂直に(あるいは所定の角度で)交差する線分同士の
交点を検出し、さらに求められた交点より4点をピック
アップし、この4点が長方形枠の頂点となりうるかを頂
点間の線分の有無にてチェックすることにより、長方形
枠を求められる。
【0019】したがって、本発明によれば、線分と線分
の交点情報を使用しているため、抽出された線分が途切
れている場合でも、あるいは線が完全に交わっていない
場合でも、確実に長方形枠の頂点を検出することが可能
である。さらに、求めた交点より長方形枠が生成できる
かをチェックすることにより、線の分類を長方形枠抽出
の前に行ってしまうのではなく、長方形枠抽出の過程で
罫線であるか文字であるかを判断しながら分類すること
ができ、線種判別の間違いも少なく、罫線と文字パター
ン中の線分と判別を正確に行うことができる。同時に、
複雑な文書画像に対しても正確な長方形枠の抽出を行う
ことが可能となる。
【0020】また、本発明では、帳票文書画像より抽出
された線分より長方形枠を形成し、長方形枠の各頂点に
対応する線分との距離を計測し、計測された各頂点と線
分との距離によって頂点の接続状態および交点の形状を
決定する。
【0021】したがって、本発明によれば、頂点と線分
の距離を利用するだけで、各頂点の接続状態および頂点
付近の形状を求めることにより、複雑な処理を行うこと
はなく、簡易に、頂点の丸みなどの形状を決定すること
ができる。
【0022】
【実施例】以下、図面を参照しながら実施例を説明す
る。図1は、本発明の第1の実施例に係る帳票文書認識
装置の構成を示すブロック図である。本実施例の帳票文
書認識装置は、画像入力部1、線分抽出部2、線分分類
部3、文字列枠抽出部5、文字列認識部6、帳票文書作
成部7、出力部8より構成される。線分分類部3は、内
部に長方形枠抽出部4を持つ。
【0023】画像入力部1は、処理対象となる帳票文書
を画像データとして入力するためのものであり、例えば
イメージ・スキャナーなどからなる。線分抽出部2は、
入力した画像データに対して、2値化処理、細線化処
理、線分接続処理などの前処理を施し、入力画像データ
を線分データとして抽出する。線分データには、長さ、
終始点座標などが含まれる。
【0024】線分分類部3は、抽出された線分を、長方
形枠データ、罫線データ(長方形枠を構成する線分も含
む)、文字パターンデータに分類して出力する。上記の
長方形枠データは、線分分類過程の中で線分分類部3内
の長方形枠抽出部4にて抽出される。
【0025】文字列枠抽出部5は、長方形枠データを参
照して、文字パターンデータを文字列に分割し、各文字
列の座標位置や縦横のサイズを計測する。また、文字列
に外接する文字列枠を抽出する。
【0026】文字認識部6は、抽出された文字列を文字
パターン認識処理にて文字コードに変換し、文字列単位
に文字コードデータを出力する。帳票文書作成部7は、
罫線データ、長方形枠データおよび文字コードデータか
ら帳票文書データを作成する。
【0027】出力部8は、帳票文書データを出力するた
めのものであり、例えば表示装置やプリンタなどからな
る。作成した帳票文書データは、図示しない磁気記憶装
置などに格納することができる。
【0028】以下、図2に示すフローチャートを参照し
ながら、本実施例の処理の流れを説明する。なお、図3
に、入力する帳票の一例を、図4に、図3の入力帳票を
読み取ったデータの一例を示す。
【0029】[ステップS1]まず、画像入力部1から
処理対象となる帳票文書を光学的に読取る。入力した画
像データは、一旦、図示しない画像メモリなどに格納す
る。
【0030】[ステップS2]線分抽出部2は、入力し
た画像データに対して、2値化処理、細線化処理、線分
接続処理などの前処理を施し、入力画像データをすべて
線分データとして抽出する。
【0031】図5に、線分抽出部2における線分抽出処
理の一例のフローチャートを示す。まず、入力画像デー
タに対し予め設定したしきい値にて2値化処理を施す
(ステップS21)。2値化画像に対し細線化処理を行
う(ステップS22)。得られた細線に対して、チェイ
ンコードを計測し、折れ線近似を行う(ステップS2
3)。そして、折れ線近似された線分単位に、長さ、終
始点座標、角度等の特徴量計測を行う(ステップS2
4)。最後に、上記の特徴量を参照して、複数の線分が
接近しており、かつ、角度の差が小さいもの同士を接続
し、これを抽出した線分として出力する(ステップS2
5)。
【0032】[ステップS3]抽出された線分は、線分
分類部3で、罫線または文字パターン中の線分に分類さ
れる。また、線分分類過程の中で、線分分類部3内の長
方形枠抽出部4よって長方形枠が抽出される。
【0033】図6は、線分分類部3における線分分類処
理の一例のフローチャートである。まず、線分抽出部2
において抽出された線分データの中から、長さが予め設
定したしきい値t1よりも小さい線分を罫線になり得な
い微小線分として除去する(ステップS32)。
【0034】除去されなかったt1以上の長さの線分の
うち、長さが予め設定したしきい値t2(t2>t1)
よりも大きい線分の角度を平均し、画像全体の傾きを計
測する(ステップS33)。傾き計算は線分の角度のヒ
ストグラムをとり最大値をとっても良い。もちろん、す
べての線分から傾きを求めても構わない。
【0035】求めた線分の角度を参照し、画像の傾きに
対してほぼ水平または垂直である線分を抽出する(ステ
ップS34)。長方形枠抽出部4にて、後述するような
手順で、抽出された水平線分および垂直線分によって作
られる長方形枠の抽出を行う(ステップS35)。
【0036】抽出された長方形枠ごとに、4つの頂点の
接続状態および形状、斜線の有無、長方形枠の4辺とそ
の内部にある斜線の線種および線幅等の属性を計測する
(ステップS36)。
【0037】ここで得られた長方形枠の座標位置および
その他の属性を長方形枠データとする(ステップS3
7)。上記ステップS35の長方形枠抽出処理の結果、
長方形枠を形成する4辺に使われた線分を罫線データと
する(ステップS40)。一方、上記ステップS35の
長方形枠抽出処理の結果、長方形枠を形成する4辺に使
われなかった線分については、その線分の長さと予め定
めたしきい値t3とを比較し(ステップS39)、しき
い値t3よりも長いものは罫線データとし(ステップS
40)、それ以外のものを文字パターンの線分とみなし
文字パターンとする(ステップS42)。
【0038】また、ステップS34の水平・垂直線分抽
出処理の結果、水平・垂直でない線分に対して、長方形
枠の属性(斜線、頂点の形状)として使われた線分は罫
線データとする(ステップS39,S40)。一方、長
方形枠の属性(斜線、頂点の形状)として使われなかっ
た線分は文字パターンとする(ステップS39,S4
2)。
【0039】さらに、ステップS32にて微小線分とし
て除去された線分は文字パターンとする(ステップS4
2)。以上により、線分の分類と長方形枠の抽出が行わ
れ、線分分類部3からは、分類結果である、文字パター
ンデータ、罫線データ、長方形枠データが、それぞれ出
力される。なお、図・写真中の線分や下線・区切り線等
のガイドラインなどその他の線分は、罫線に分類される
こととなる。
【0040】ところで、上記ステップS35の長方形枠
抽出では、複数の長方形枠からなる大きな長方形枠が重
複して抽出されることがある。例えば図4において、長
方形枠R[3−1−4−7]は、複数の小さい長方形枠
(R[2−1−4−5]とR[3−2−5−7])を含
んでいるため、大きい長方形枠を出力すべき長方形枠デ
ータから消去する処理を行う。ここで、長方形枠R[a
−b−c−d]は左下点Pa、左上点Pb、右上点P
c、右下点Pdを4頂点とする長方形枠と定義する。そ
こで、図6のフローチャートにおいて、ステップS35
の長方形枠抽出あるいはステップS36の長方形枠の属
性計測の後で、重複する長方形枠の消去処理を行なうと
良い。この処理は、4つの頂点の座標値を参照して、も
し、大きい長方形枠が小さい長方形枠を含んでいる場合
は、この大きい長方形枠を消去する。以上により、重複
する長方形枠の消去を行うことができる。
【0041】図7は、線分分類部3内の長方形枠抽出部
4において行われる上記ステップS35の処理手順の一
例を示したフローチャートである。まず、垂直な線分と
水平な線分の交点の座標を計算する(ステップS5
1)。ここで求められる交点は、線分上になくても構わ
ない。
【0042】図8に示すようなケースを考慮に入れ、線
分の外側で交わる場合においても抽出すべき交点P6
1,P62として抽出する。ただし、線分の端と交点の
距離Dmがあるしきい値Dよりも大きい場合(Dm>
D)は抽出すべき交点としない。距離Dmは、水平方向
の距離Dxと垂直方向の距離Dyの最大値Dm=MAX
(Dx,Dy)である。線分中に交点が存在する場合、
Di=−1としておく。
【0043】次に、その抽出された交点に対して冗長で
あるものを除去する(ステップS52)。図9に示すよ
うに複数の交点が一箇所に接近している場合は、1点に
まとめる処理をする。ここでは、交点と線分の端との距
離Dmが小さい方の交点を用いる。距離Dmが等しいと
きは、座標を平均化する。図9のケースでは、交点P7
1と交点P72が非常に近いため、交点と2本の線分と
の距離が小さい線分L71と線分L72の交点P71を
採用し、交点P72を削除する。
【0044】以上で長方形枠の頂点となる可能性のある
交点を抽出することができる。次に、長方形枠の探索を
行う前に、抽出された交点をソートしておく(ステップ
S53)。これにより長方形枠の探索速度を上げること
ができる。ソートは画面の左から右に点が並ぶように行
う。したがって、交点のx座標値でソートを行う。
【0045】ソート後、左側の点から順に長方形枠の左
の縦線を生成するために2点をピックアップする(ステ
ップS54)。この処理は画面の左から右に進み、ピッ
クアップする点が右側になくなるまで続けられ(ステッ
プS55)、ピックアップする2点がなくなったとき長
方形枠の探索が終了する。
【0046】ピックアップされた2点について、垂直性
のチェックを行う(ステップS56)。線分が存在しな
い場合、次ぎの2点をピックアップする。次に、2点間
に線分が存在するかをチェックする(ステップS5
7)。線分が存在しない場合、次の2点をピックアップ
する。
【0047】上記2つのチェックをクリアした場合、長
方形枠の左の縦線が得られたものとして、この縦線から
右側に伸びる横線の探索を行う。そのため、この縦線の
右側に位置する3点目のピックアップを行う(ステップ
S58)。3点目としてピックアップする点がなくなっ
たら、この縦線は長方形枠を構成するものではないの
で、新たな縦線候補を探すために次の2点をピックアッ
プをし直す(ステップS59)。
【0048】最初にピックアップした2点のうち上にく
る(x座標が小さい)点と3点目の点を結ぶ線の水平性
のチェックを行う(ステップS60)。水平でない場
合、次の3点目のピックアップを行う。
【0049】次に、2点間に線分が存在するかをチェッ
クする(ステップS61)。線分が存在しない場合、次
の3点目をピックアップする。上記2つのチェックをク
リアした場合、長方形枠の上側の横線が得られたものと
して、長方形枠の4番目の頂点の評価を行う。
【0050】まず、左側の縦線と上側の横線により、4
点目の大方の位置を想定し、4点目のピックアップを行
う(ステップS62)。3点目としてピックアップする
点がなくなったら、この横線は長方形枠を構成するもの
ではないので、新たな横線候補を探すために次の3点目
をピックアップをし直す(ステップS63)。
【0051】4点目の点によってできた2辺(縦線と横
線)の平行性をチェックする(ステップS64)。平行
でない場合、次の4点目のピックアップを行う。次に、
2点間に線分が存在するかをチェックする(ステップS
65)。線分が存在しない場合、次の4点目をピックア
ップする。
【0052】上記2つのチェックをクリアした場合、長
方形枠のすべての辺を確定することができる。こうして
完成した長方形枠に関して、4つの頂点の座標値を長方
形枠データとして格納する(ステップS66)。
【0053】図10は、図7における線分チェック処理
(ステップS57,S61,S66)を説明するための
図である。図10において、点P81および点P82は
長方形枠の一辺の両端の点、すなわち、頂点の候補点で
ある。この2点間に線分が存在するかチェックする場
合、まず80のような領域を発生させる。この領域80
はP81とP82の距離分だけの長さを持ち、n画素分
の幅を持つ。この領域80の中に、線分抽出部2によっ
て抽出された線分が領域80の長さ方向に何パーセント
存在するかを確かめる。例えば、領域80には線分L8
1、線分L82、線分L83が存在する。線分L83は
領域外にはみ出しているが、長さのカウントには領域に
含まれる部分のみ加えて、存在するパーセントrを計測
する。このパーセントsがあるしきい値Sよりも大きい
ときは、線分が存在すると認識する。
【0054】ここで、図3の帳票を入力の具体例とし
て、上記処理を説明する。図3の帳票が画像入力部1か
ら入力されると、線分抽出部2により線分L1〜L22
が得られる。
【0055】線分分類部3では、長方形枠抽出部4を用
いて水平・垂直線分である線分L1〜L14に対して、
垂直に交わる2本の線分の交点P1〜P15を求める。
前述のように、交点を求める際、線分上に位置せず、線
分の外側で交わるものについても求めるべき交点として
抽出する。例えば、線分L2と線分L9の交点P6、線
分L4と線分L14の交点P14である。
【0056】その後、抽出された交点P1〜P7中から
長方形枠を生成できる4つの頂点を見つける。例えば、
P1、P2、P4、P5の4点から長方形枠R[2−1
−4−5]を生成する。このようにして、大小28個の
長方形枠が探索することができる。
【0057】ただし、このままでは、大きい長方形枠
(例えば、長方形枠R[3−1−4−7])は、複数の
小さい長方形枠(この場合、R[2−1−4−5]とR
[3−2−5−7])を含んでいるため、大きい長方形
枠を出力すべき長方形枠データから消去する。
【0058】このようにして、R[2−1−4−5]を
はじめとする8個の長方形枠を出力することができる。
ここで、線分分類部3では、残された長方形枠に対して
属性を計測する。計測する属性項目は、各頂点の接続状
態および形状(角丸み)、枠内の斜線、罫線の線幅、線
種である。この処理より、長方形枠R[2−1−4−
5]内には斜線が存在することが認識できる。
【0059】長方形枠として見つかった線分(L1〜L
14)、長方形枠に付随する斜線(L15)は罫線とし
て分類し、線分(L16〜L22)については文字パタ
ーン中の線分として分類する。このようにして、抽出さ
れた線分を正確に分類することが可能であり、同時に長
方形枠を抽出することができる。
【0060】次に、図11に、ステップS36の長方形
枠属性計測処理の一例を示す。最初に、斜線抽出処理
(ステップS111)を行い、長方形枠内の斜線の有無
をチェックする。次に、長方形枠の4辺とその内部にあ
る斜線の線種計測(ステップS112)および線幅計測
(ステップS113)を行う。
【0061】また、必要に応じて次の処理を行なう。頂
点計測処理(ステップS114)を行い、4つの頂点と
対応する縦の辺および横の辺との距離の計測を行う。そ
の頂点距離に基づいて、頂点形状決定処理(ステップS
115)と頂点接続状態成形処理(ステップS116)
のいずれか一方または両方を行う。頂点形状決定処理と
頂点接続状態成形処理の処理順序は任意である。
【0062】図12は、ステップS115の長方形枠の
頂点形状決定処理の一例を説明するための図である。図
12において、長方形枠R[102−101−103−
104]が抽出されたとする。このとき、頂点P101
の形状を計測するために、頂点P101と線分L103
の距離Dx=aおよび頂点P101と線分L101の距
離Dy=bを計測する。この結果、α<Dx<β、か
つ、α<Dy<βなる条件が得られれば、この頂点P1
01に角丸みがあることを決定し、この頂点P101に
90度の円弧C101を発生させる。この場合、線分L
105〜L107の特徴について詳細に処理することな
く、円弧C101を発生させることができる。ただし、
円弧C101発生の基となる線分L105〜L107
は、図6のステップS39の線分対応処理において、罫
線の一部として分類する。
【0063】図13および図14は、図11のステップ
S116の長方形枠の頂点接続状態成形処理を説明する
ための図である。前述した長方形枠抽出部4により抽出
された長方形の頂点において、図13や図14のように
1つの線分の外に交点が存在する場合がある。ここで、
交点と、該交点を内部に含まない方の線分との距離Dx
が所定のしきい値γより小さい場合、線の途切れと見な
して、線分を交点まで延長して線分を接続するように処
理を行なっても良い。例えば、図13では、線分L11
1と線分L112について抽出された交点P111と各
線分L111,L112の距離計測の結果、Dx=c、
Dy=−1を得ることになる。この場合、c<γであ
り、線の途切れを接続することができる。また、図14
において、線分L121と線分L122の交点であるP
121と各線分の距離計測の結果、Dx=d、Dy=−
1を得る。この場合、d>γであり、線の途切れとは見
なされず、接続を行わないようにすることができる。
【0064】以上のようにして、長方形枠の属性計測を
行うことができる。 [ステップS4]文字列枠抽出部5は、ステップS5に
て抽出された長方形枠データを参照して、抽出線分から
分類された文字パターンデータを一纏まりの文字列に分
割し、各文字列の座標位置や縦横のサイズを計測する。
また、各文字列に外接する文字列枠を抽出する。
【0065】[ステップS5]文字認識部6は、抽出さ
れた文字列を文字パターン認識処理にて文字コードに変
換し、文字列単位に文字コードデータを出力する。
【0066】[ステップS6]帳票文書作成部7は、罫
線データ、長方形枠データ、文字列枠情報を含む文字コ
ードデータから帳票文書データを作成する。
【0067】[ステップS7]出力部8は、帳票文書デ
ータを出力する。以上説明したように、本実施例によれ
ば、線と線の交点情報を使用することにより、抽出され
た線分が途切れている場合でも、あるいは、線が完全に
交わっていない場合でも、確実に長方形枠の頂点を検出
することができる。また、線の分類を、長方形枠抽出の
前に行ってしまうのではなく、長方形枠抽出の過程で罫
線であるか文字であるかを判断しながら分類することが
可能であり、線種判別の性能を上げることが可能であ
り、簡易かつ正確に、複雑な文書画像から長方形枠の抽
出を行うことができる。
【0068】また、頂点と線分の距離を利用するだけ
で、各頂点の接続状態および頂点付近の形状を求めるこ
とにより、複雑な処理を行うことはなく、簡易に、頂点
の丸みなどの形状を決定することができる。
【0069】(第2の実施例)図15は、本発明の第2
の実施例に係る帳票文書認識装置の構成を示すブロック
図である。
【0070】本実施例の帳票文書認識装置は、第1の実
施例の長方形枠データ抽出機能を持つように簡略化した
ものであり、画像入力部101、線分抽出部102、長
方形枠抽出部104、長方形枠属性計測部105、長方
形枠データ出力部106を備えている。
【0071】画像入力部101は、処理対象となる帳票
文書を画像データとして入力するためのものであり、例
えばイメージ・スキャナーなどからなる。第1の実施例
の画像入力部1に相当するものである。
【0072】線分抽出部102は、入力した画像データ
に対して、2値化処理、細線化処理、線分接続処理など
の前処理を施し、入力画像データを線分データとして抽
出する。線分データには、長さ、終始点座標などが含ま
れる。第1の実施例の画像入力部2に相当するものであ
る。
【0073】長方形枠抽出部104は、抽出された線分
から長方形枠データを抽出する。第1の実施例の図6の
ステップS32〜S35の処理を行なうものに相当す
る。長方形枠属性計測部105は、抽出した長方形枠に
対して、長方形枠の特徴となる斜線の有無、辺の線幅お
よび線種、頂点の形状および接続状態等の属性データを
計測する。第1の実施例の図6のステップS36の処理
を行なうものに相当する。
【0074】長方形枠データ出力部106は、得られた
長方形枠データに基づいて、所定の画像フォーマットデ
ータあるいはベクトルデータを生成する。そして、生成
したデータを、例えば表示装置やプリンタなどから出力
する。あるいは、磁気記憶装置などに格納する。
【0075】以上のような構成において、本実施例の処
理の流れは以下のようになる。まず、画像入力部101
から、例えば図3のような処理対象となる帳票文書を光
学的に読取り、画像データとして図示しない画像メモリ
などに格納する。入力した画像データは、一旦、図示し
ない画像メモリなどに格納する。
【0076】次に、線分抽出部102は、例えば第1の
実施例にて図5を参照して説明したような手順で、入力
した画像データに前処理を施し、入力画像データを線分
データとして抽出する。
【0077】次に、長方形枠抽出部104は、第1の実
施例にて図6のステップS32〜S34を参照して説明
したような手順で、長方形枠を構成する可能性のある所
定の長さ以上の水平・垂直線分を抽出し、例えば図6の
ステップS35、図7を参照して説明したような手順
で、抽出した水平・垂直線分から、長方形枠を抽出す
る。
【0078】長方形枠属性計測部105は、例えば図6
のステップS36、図11を参照して説明したような手
順で、上記の抽出された長方形枠に対して、長方形枠の
特徴となる斜線の有無、辺の線幅および線種、頂点の形
状および接続状態等の属性データを計測する。また、必
要に応じてステップS115の頂点形状決定処理とステ
ップS116の頂点接続状態成形処理のいずれか一方ま
たは両方を行う。
【0079】なお、長方形枠抽出部104の処理後また
は長方形枠属性計測部105の処理後に、前述したよう
に、重複する長方形枠の消去処理を行なうと好ましい。
最後に、長方形枠データ出力部106は、長方形枠のコ
ードデータに基づいて、長方形枠を画像のフォーマット
あるいはベクトルデータとしてデータ出力する。 この
ように、本実施例によれば、線と線の交点情報を使用す
ることにより、抽出された線分が途切れている場合で
も、あるいは、線が完全に交わっていない場合でも、確
実に長方形枠の頂点を検出することができる。また、線
の分類を、長方形枠抽出の前に行ってしまうのではな
く、長方形枠抽出の過程で罫線であるか文字であるかを
判断しながら分類することが可能であり、線種判別の性
能を上げることが可能であり、簡易かつ正確に、複雑な
文書画像から長方形枠の抽出を行うことができる。
【0080】また、頂点と線分の距離を利用するだけ
で、各頂点の接続状態および頂点付近の形状を求めるこ
とにより、複雑な処理を行うことはなく、簡易に、頂点
の丸みなどの形状を決定することができる。また、本発
明は上述した各実施例に限定されるものではなく、その
要旨を逸脱しない範囲で、種々変形して実施することが
できる。
【0081】
【発明の効果】本発明によれば、帳票文書画像中の線分
と線分の交点から長方形を求め、この長方形が帳票文書
の長方形枠か否かを頂点間の線分の存在により判定する
ので、抽出された線分が途切れている場合でも、あるい
は、線が完全に交わっていない場合でも、確実に長方形
枠の頂点を検出することができる。また、線の分類を、
長方形枠抽出の前に行ってしまうのではなく、長方形枠
抽出の過程で罫線であるか文字であるかを判断しながら
分類することができ、線種判別の性能を上げることが可
能であり、複雑な文書画像に対して簡易かつ正確に長方
形枠の抽出を行うことができる。
【0082】また、本発明によれば、帳票文書画像中か
ら抽出した長方形の頂点と該頂点近傍の線分との間の距
離を利用して、各頂点の接続状態および頂点付近の形状
を求めるので、複雑な処理を行うことはなく、簡易に、
頂点の丸みなどの形状を決定することができる。
【図面の簡単な説明】
【図1】本発明の第1の実施例に係る帳票文書認識装置
の構成を示すブロック図
【図2】同実施例の処理の流れの概略を示すフローチャ
ート
【図3】入力の一例を示す図
【図4】読み取った入力から生成されたデータの一例を
示す図
【図5】線分抽出処理の流れを示すフローチャート
【図6】線分分類処理の流れを示すフローチャート
【図7】長方形枠抽出処理の流れを示すフローチャート
【図8】長方形枠抽出処理における交点計測を説明する
ための図
【図9】長方形枠抽出処理における冗長交点除去を説明
するための図
【図10】長方形枠抽出処理における線分チェックを説
明するための図
【図11】長方形枠属性計測処理の流れを示すフローチ
ャート
【図12】長方形枠の頂点形状決定処理を説明するため
の図
【図13】長方形枠の頂点接続状態成形処理を説明する
ための図
【図14】長方形枠の頂点接続状態成形処理を説明する
ための図
【図15】本発明の第2の実施例に係る帳票文書認識装
置の構成を示すブロック図
【符号の説明】
1…画像入力部、2…線分抽出部、3…線分分類部、4
…長方形枠抽出部、5…文字列枠抽出部、6…文字列認
識部、7…帳票文書作成部、8…出力部、101…画像
入力部、103…線分抽出部、104…長方形枠抽出
部、105…長方形枠属性計測部、106…長方形枠デ
ータ出力部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 下辻 成佳 神奈川県川崎市幸区小向東芝町1番地 株 式会社東芝研究開発センター内

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】複数の長方形枠からなる表を含む帳票文書
    を認識する帳票文書認識装置において、 入力された帳票文書の画像データ中から所定のしきい値
    以上の長さを有する線分を抽出する線分抽出手段と、 抽出された前記線分のうち互いに直交するもの同士の交
    点を抽出する交点抽出手段と、 抽出された前記交点の集合の中から長方形の4頂点とな
    る4つの交点を選択し、該4つの交点からなる長方形の
    辺に相当する部分に所定のしきい値以上の抽出された線
    分が存在する場合、該4つの交点からなる長方形を長方
    形枠として決定する長方形枠抽出手段とを具備すること
    を特徴とする帳票文書認識装置。
  2. 【請求項2】複数の枠からなる表を含む帳票を認識する
    帳票文書認識装置において、 入力された帳票文書の画像データ中から長方形枠を抽出
    する長方形枠抽出手段と、 抽出された前記長方形枠の各頂点と前記画像データ中の
    前記表を構成する枠の各頂点近傍の線分との間のずれを
    夫々計測する頂点ずれ計測手段と、 計測された各頂点と線分の間の夫々のずれを表す情報に
    よって、前記表を構成する枠の各頂点の接続状態および
    各頂点の形状を決定する頂点属性計測手段とを具備する
    ことを特徴とする帳票文書認識装置。
  3. 【請求項3】複数の長方形枠からなる表を含む帳票文書
    を認識する帳票文書認識方法において、 入力された帳票文書の画像データ中から所定のしきい値
    以上の長さを有する線分を抽出し、 抽出された前記線分のうち互いに直交するもの同士の交
    点を抽出し、 抽出された前記交点の集合の中から長方形の4頂点とな
    る4つの交点を選択し、 該4つの交点からなる長方形の辺に相当する部分に所定
    のしきい値以上の抽出された線分が存在する場合、該4
    つの交点からなる長方形を長方形枠として決定すること
    を特徴とする帳票文書認識方法。
  4. 【請求項4】複数の枠からなる表を含む帳票を認識する
    帳票文書認識方法において、 入力された帳票文書の画像データ中から長方形枠を抽出
    し、 抽出された前記長方形枠の各頂点と前記画像データ中の
    前記表を構成する枠の各頂点近傍の線分との間のずれを
    夫々計測し、 計測された各頂点と線分の間の夫々のずれを表す情報に
    よって、前記表を構成する枠の各頂点の接続状態または
    各頂点の形状を決定することを特徴とする帳票文書認識
    方法。
JP7028333A 1995-02-16 1995-02-16 帳票文書認識装置および帳票文書認識方法 Pending JPH08221506A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7028333A JPH08221506A (ja) 1995-02-16 1995-02-16 帳票文書認識装置および帳票文書認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7028333A JPH08221506A (ja) 1995-02-16 1995-02-16 帳票文書認識装置および帳票文書認識方法

Publications (1)

Publication Number Publication Date
JPH08221506A true JPH08221506A (ja) 1996-08-30

Family

ID=12245693

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7028333A Pending JPH08221506A (ja) 1995-02-16 1995-02-16 帳票文書認識装置および帳票文書認識方法

Country Status (1)

Country Link
JP (1) JPH08221506A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007052670A (ja) * 2005-08-18 2007-03-01 Nippon Telegr & Teleph Corp <Ntt> 辺検出方法及び隅評価方法及び装置及びプログラム
KR20150028631A (ko) * 2013-09-06 2015-03-16 삼성전자주식회사 영상에 포함된 표의 구조를 생성하는 방법 및 이를 위한 장치
CN111353458A (zh) * 2020-03-10 2020-06-30 腾讯科技(深圳)有限公司 文本框标注方法、装置和存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007052670A (ja) * 2005-08-18 2007-03-01 Nippon Telegr & Teleph Corp <Ntt> 辺検出方法及び隅評価方法及び装置及びプログラム
JP4525519B2 (ja) * 2005-08-18 2010-08-18 日本電信電話株式会社 四辺形評価方法及び装置及びプログラム
KR20150028631A (ko) * 2013-09-06 2015-03-16 삼성전자주식회사 영상에 포함된 표의 구조를 생성하는 방법 및 이를 위한 장치
CN111353458A (zh) * 2020-03-10 2020-06-30 腾讯科技(深圳)有限公司 文本框标注方法、装置和存储介质
CN111353458B (zh) * 2020-03-10 2023-08-18 腾讯科技(深圳)有限公司 文本框标注方法、装置和存储介质

Similar Documents

Publication Publication Date Title
US5907631A (en) Document image processing method and system having function of determining body text region reading order
US5452374A (en) Skew detection and correction of a document image representation
US5199084A (en) Apparatus and method for locating characters on a label
JP2002133426A (ja) 多値画像から罫線を抽出する罫線抽出装置
JP3471578B2 (ja) 行方向判定装置、画像傾き検出装置及び画像傾き補正装置
WO1992006449A1 (en) Character recognition methods and apparatus for locating and extracting predetermined data from a document
JP2000112599A (ja) 文書画像処理装置及び文書画像処理方法
JPH02306386A (ja) 文字認識装置
JPH08221506A (ja) 帳票文書認識装置および帳票文書認識方法
JP3268552B2 (ja) 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置
JPH10162139A (ja) 画像処理装置、および画像処理プログラムを記録した媒体
JP3077929B2 (ja) 文字切出し方式
JPH0799532B2 (ja) 文字切出し装置
JP3186712B2 (ja) 文書読取装置
JP3220226B2 (ja) 文字列方向判別方法
JP6438369B2 (ja) 帳票画像判定プログラム、帳票画像判定方法および帳票画像判定システム
JPS5949671A (ja) 光学的文字読取装置
JPH07160799A (ja) 文字認識方式
JPH07141465A (ja) 文書画像の傾き検出方法
JPH10507014A (ja) 2進イメージにおけるランドスケープ・スキャンの自動決定
JP2000000524A (ja) 絵はがき判定方法及び絵はがき判定装置
JP2988801B2 (ja) 宛名認識装置
JP3190794B2 (ja) 文字切り出し装置
JPH1040333A (ja) 帳票認識装置
JPH03219384A (ja) 文字認識装置