JP2851089B2 - 表処理方法 - Google Patents

表処理方法

Info

Publication number
JP2851089B2
JP2851089B2 JP1314519A JP31451989A JP2851089B2 JP 2851089 B2 JP2851089 B2 JP 2851089B2 JP 1314519 A JP1314519 A JP 1314519A JP 31451989 A JP31451989 A JP 31451989A JP 2851089 B2 JP2851089 B2 JP 2851089B2
Authority
JP
Japan
Prior art keywords
frame
rectangle
image
scanning direction
ruled line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP1314519A
Other languages
English (en)
Other versions
JPH03172984A (ja
Inventor
吾朗 別所
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP1314519A priority Critical patent/JP2851089B2/ja
Publication of JPH03172984A publication Critical patent/JPH03172984A/ja
Application granted granted Critical
Publication of JP2851089B2 publication Critical patent/JP2851089B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、文字認識装置等において、文書や帳票等の
画像中の表の処理方法に関する。
〔従来の技術〕
文字認識装置において文書画像を処理する場合、画像
を文字領域、写真や図等のイメージ領域、表領域等に分
割し、それぞれ別の処理を行うことが多い。
表領域に関しては、罫線の位置座標を用いて、表中の
各枠を認識し、各枠内の画像より文字を切り出して認識
する方法がとられている。
このような表の処理において、従来は、枠を構成する
主走査方向及び副走査方向の罫線の矩形を抽出し、この
矩形の内側(枠内より見て)の座標を用いて枠を定義し
ている。
〔発明が解決しようとする課題〕
しかし、文書画像が傾いて入力された場合に枠内の文
字を正しく切り出すことができなくなるという問題があ
った。
例えば第4図に示すような画像の場合について説明す
ると、実線は罫線(線分)であるが、これは破線のよう
な矩形として抽出される。第5図は主走査方向(X方
向)の罫線の矩形の説明図であり、51が入力された実際
の罫線、52はその矩形である。そして、罫線に囲まれた
枠を認識するが、その際に従来は罫線の矩形の内側の座
標を用いる。例えば枠の上辺を構成する主走査方向の矩
形の場合、第5図に示す座標Yeにより枠の上辺のY座標
を定義する。したがって、第4図に示す傾いた画像の場
合、ハッチングを施した領域が枠の領域として抽出され
ることになり、枠が実際よりも狭くなってしまう。その
結果、枠内の罫線に接近した文字が枠からはみ出し、正
常に切り出すことができなくなる場合がある。
本発明の目的は、文書画像が傾いて入力された場合に
おいても、表中の文字を正しく切り出し認識することが
可能な表処理方法を提供することである。
〔課題を解決するための手段〕
本発明の表処理方法は、表領域において主走査方向及
び層走査方向の罫線を包含する矩形を抽出し、罫線によ
って囲まれる枠を罫線の矩形の外側(枠内より見て)の
座標を用いて認識し、枠内の黒連結の外接矩形を求め、
枠に接している外接矩形を除去し、残った外接矩形を用
いて枠内の文字を切り出すことを特徴とするものであ
る。
〔作 用〕
罫線の矩形の外側の座標を用いて枠を認識するため、
文書が傾いている場合においても、認識される枠の幅が
実際より極端に狭くなることがなくなるので、文字欠け
を防止できる。
例えば第4図に示した画像と同じ傾いた表の画像の場
合、本発明によれば、認識されら枠は第3図に示すよう
に広くなる。
他方、罫線の矩形の外側の座標を用いるため、認識さ
れた枠の内部に、枠を構成する罫線の一部が含まれる。
しかし、枠内の黒連結の外接矩形の中で枠に接触したも
のを排除することにより、そのような罫線の線分部分を
除去できる。
したがって、傾いた文書画像の場合においても、表中
の文字を正しく切り出して認識することが可能となる。
〔実施例〕
第1図は本発明の一実施例を示すブロック図、第2図
は処理のフローチャートである。
スキャナ等の2値画像入力部11によって文書を読取
り、その2値の画像を2値イメージメモリ12に格納する
(処理ステップ31)。この文書画像に対して、表領域認
識部13は表領域を認識し、そのイメージを表領域イメー
ジメモリ14に格納する(処理ステップ32)。この表領域
認識は、ランレングス分布等を利用して自動的に認識す
る方法と、マウス等を用いて外部より領域を指定するこ
とによって認識する方法とがある。
主走査方向線分抽出部15において、表領域イメージに
対して、主走査方向に連結した黒画素を追跡して主走査
方向の罫線を囲む矩形を抽出し、その始点座標(Xs,Y
s)及び終点座標(Xe,Ye)を主走査方向線分座標メモリ
16に格納する(第5図参照、処理ステップ33)。
副走査方向線分抽出部17において、表領域イメージに
対し、同様に副走査方向の罫線の矩形を抽出し、その始
終点座標を副走査方向線分座標メモリ18に格納する(処
理ステップ34)。
次に枠認識部19において、主走査方向罫線と副走査方
向罫線の組合せにより枠の認識を行い、この枠の例えば
対角頂点の座標を枠座標メモリ20に格納する(ステップ
35)。この際、前述の如く、枠を構成する罫線の矩形の
外側の座標(上辺の罫線では上側、下辺の罫線では下
側、左辺の罫線では外側、右辺の罫線では下側の座標)
を用いて、枠の対角頂点の座標を求める。このようにし
て、第3図にハッチング領域として示したような枠の領
域が認識される。
次に枠領域抽出部21において、枠座標に従って表領域
イメージより枠内のイメージを切り出し、それを枠内イ
メージメモリ22に格納する(処理ステップ36)。
黒連結外接矩形抽出部23において、枠内イメージより
黒連結の外接矩形を抽出し、その座標を外接矩形メモリ
24に格納する(処理ステップ37)。
行切出し部25において、抽出された黒連結の外接矩形
の座標と枠の座標との比較により、外接矩形と枠との接
触を調べ、枠に接した黒連結外接矩形を枠を構成する罫
線の一部であるとみなし除去する(処理ステップ38)。
そして、残った枠内の黒連結外接矩形について、文字サ
イズの推定、統合を行って枠内の文字行(文字素を構成
する外接矩形の統合矩形)を生成し、また、その必要な
修正または削除を行い、最終的な文字行のイメージを枠
内イメージメモリ22より切り出して行イメージメモリ26
に格納する(処理ステップ39,40,41,42)。
次に文字切出し・認識部27において、文字行イメージ
より文字を切出して認識する(処理ステップ44)。
〔発明の効果〕
以上の説明から明らかな如く、本発明によれば、文書
画像が傾いて入力された場合においても、認識される枠
が不適当なほど実際より狭くなることがないため、文字
画像の欠落を防止することができ、また認識した枠内の
黒連結により矩形のうちの枠に接したものを除去するこ
とによる、枠を構成する罫線を文字切出しに先立って除
去するため、文字の切出し及び認識を正確に行うことが
できる。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロック図、第2図は
処理のフローチャート、第3図は枠認識の説明図、第4
図は従来方法による枠認識の問題点の説明図、第5図は
罫線の矩形の説明図である。 11……2値画像入力部、13……表領域認識部, 15……主走査方向線分抽出部、 17……副走査方向線分抽出部、 19……枠認識部、21……枠領域抽出部、 23……黒連結外接矩形抽出部、 25……行切出し部、 27……文字切出し・認識部。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】表領域において、主走査方向及び副走査方
    向の罫線の矩形を抽出し、罫線によって囲まれる枠を罫
    線の矩形の外側の座標を用いて認識し、枠内の黒連結の
    外接矩形を求め、枠に接している外接矩形を除去し、残
    った外接矩形を用いて枠内の文字を切り出すことを特徴
    とする表処理方法。
JP1314519A 1989-11-30 1989-11-30 表処理方法 Expired - Fee Related JP2851089B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1314519A JP2851089B2 (ja) 1989-11-30 1989-11-30 表処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1314519A JP2851089B2 (ja) 1989-11-30 1989-11-30 表処理方法

Publications (2)

Publication Number Publication Date
JPH03172984A JPH03172984A (ja) 1991-07-26
JP2851089B2 true JP2851089B2 (ja) 1999-01-27

Family

ID=18054260

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1314519A Expired - Fee Related JP2851089B2 (ja) 1989-11-30 1989-11-30 表処理方法

Country Status (1)

Country Link
JP (1) JP2851089B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5848186A (en) * 1995-08-11 1998-12-08 Canon Kabushiki Kaisha Feature extraction system for identifying text within a table image
US5898795A (en) * 1995-12-08 1999-04-27 Ricoh Company, Ltd. Character recognition method using a method for deleting ruled lines
JP4329764B2 (ja) 2006-01-17 2009-09-09 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置および罫線抽出プログラム
JP4424309B2 (ja) 2006-01-23 2010-03-03 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置、文字判定プログラム、および文字判定方法

Also Published As

Publication number Publication date
JPH03172984A (ja) 1991-07-26

Similar Documents

Publication Publication Date Title
JP2812982B2 (ja) 表認識方法
JP2001358925A (ja) 画像処理のための装置、方法及び記録媒体
JP2851089B2 (ja) 表処理方法
JP2851087B2 (ja) 表処理方法
JP4165046B2 (ja) 画像処理装置、画像処理方法、画像処理プログラムおよび画像処理プログラムを記録したコンピュータ読取可能な記録媒体
JP4281236B2 (ja) 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
JP2957729B2 (ja) 行方向判定装置
JP2800192B2 (ja) 高速文字図形分離装置
JP4040231B2 (ja) 文字抽出方法及び装置並びに記憶媒体
JP3140079B2 (ja) 罫線認識方法及び表処理方法
JP3046652B2 (ja) 文字原稿の傾き補正方法
JP3391987B2 (ja) 帳票認識装置
JP3162414B2 (ja) 罫線認識方法及び表処理方法
JPH09161007A (ja) 表領域文字認識方法
JP2931041B2 (ja) 表内文字認識方法
JP2948840B2 (ja) 矩形抽出方法
JP3157534B2 (ja) 表認識方法
JP2991761B2 (ja) 行切出し方法
JP3566738B2 (ja) 網掛け領域処理方法および網掛け領域処理装置
JPH01270107A (ja) 数値制御加工装置のプログラム作成装置
JP3031565B2 (ja) 表領域判定方法
JPH05128305A (ja) 領域分割方法
JPH02253386A (ja) 文字認識装置
JPH0343879A (ja) 文字認識装置およびその文字領域分離方法
JPH05108880A (ja) 英文字認識装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071113

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081113

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081113

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091113

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees