JPH1027208A - 帳票照合方法及び装置 - Google Patents

帳票照合方法及び装置

Info

Publication number
JPH1027208A
JPH1027208A JP8180959A JP18095996A JPH1027208A JP H1027208 A JPH1027208 A JP H1027208A JP 8180959 A JP8180959 A JP 8180959A JP 18095996 A JP18095996 A JP 18095996A JP H1027208 A JPH1027208 A JP H1027208A
Authority
JP
Japan
Prior art keywords
field
collation
format information
collated
field area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8180959A
Other languages
English (en)
Inventor
Yuji Yonekura
雄司 米倉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
N T T DATA TSUSHIN KK
NTT Data Corp
Original Assignee
N T T DATA TSUSHIN KK
NTT Data Communications Systems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by N T T DATA TSUSHIN KK, NTT Data Communications Systems Corp filed Critical N T T DATA TSUSHIN KK
Priority to JP8180959A priority Critical patent/JPH1027208A/ja
Publication of JPH1027208A publication Critical patent/JPH1027208A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【課題】 汎用の帳票を効率的に認識する帳票照合装置
を提供する。 【解決手段】 入力画像から被照合帳票の罫線を抽出
し、罫線外周に沿った基準線を基準線特定部12で特定
する。フィールド抽出部13は、抽出された罫線と基準
線から文字記入のためのフィールド位置を表すフォーマ
ット情報を生成する。フォーマット情報修正部16は、
被照合帳票のフォーマット情報に合致するように予め登
録された照合用帳票のフォーマット情報を修正する。帳
票選択部17は、修正されたフォーマット情報が被照合
帳票のフォーマット情報と一定範囲で対応する照合用帳
票を選択し、これを照合結果として出力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字等を入力する
ためのフィールドが形成された帳票入力画像に含まれる
被照合帳票と予め登録されている複数の照合用帳票のフ
ォーマット情報を照合して、被照合帳票のフォーマット
により合致する照合用帳票を選択する手法に関する。
【0002】
【従来の技術】帳票に記載された文字の自動認識を行う
場合、画像として取り込んだ帳票の種類を予め登録され
た複数の照合用帳票との照合により特定するとともに、
その帳票画像における文字等を記入するためのフィール
ド、例えば文字記入フィールドを抽出し、抽出した文字
記入フィールド内の文字を切り出して文字認識処理を施
すのが通常である。この場合、帳票画像からの文字記入
フィールドの抽出は、その帳票のフォーマット情報と照
合用帳票のフォーマット情報との照合によって行われる
が、帳票画像の入力時に生じる位置ずれや帳票サイズの
異同がフォーマット情報の照合の際に問題となる。そこ
で、従来は、文字記入フィールドの位置を決めるための
基準マークを印刷した専用の帳票を使用し、文字記入フ
ィールドの位置を基準マークからの相対位置で定義する
ことによって上記問題を解決していた。また、予め帳票
の所定部位に定型の帳票を識別するための帳票IDを印
刷し、この帳票IDを光学センサ等で認識することで帳
票の種類を特定していた。
【0003】
【発明が解決しようとする課題】上述のように、従来
は、帳票画像の入力時に生じる位置ずれや帳票サイズの
異同の問題を解消する上で、基準マークや帳票IDの存
在が不可欠であった。そのため、文字認識を伴う帳票の
照合に際しては、基準マークや帳票IDが印刷された専
用の帳票を用いなければならず、オフィスで使用される
汎用の帳票を使用することができなかった。また、同一
帳票を含む画像であっても、入力の際の解像度が異なる
場合は認識結果が異なるという問題があった。例えば低
解像度で入力した際に、罫線の一部が認識されない場合
や、逆に、ゴミ等の存在によって、実際には存在しない
罫線が誤って認識されてしまう場合があった。
【0004】そこで本発明の課題は、基準マークや帳票
IDが存在しない汎用の帳票であっても、また、帳票画
像の入力時の解像度が異なる場合であっても、同一の帳
票に対しては常に同一の照合結果を得るようにする、改
良された照合手法を提供することにある。本発明の他の
課題は、入力画像に含まれる帳票に対し、予め登録され
た照合用帳票の中から最適なものを的確に選択し得る帳
票照合装置を提供することにある。
【0005】
【課題を解決するための手段】上記課題を解決する本発
明の帳票照合方法は、入力画像に含まれる被照合帳票か
ら文字等を記入するためのフィールドが形成されている
フィールド領域を特定するステップと、予め保持されて
いる複数の照合用帳票のそれぞれのフィールド領域と前
記特定された被照合帳票のフィールド領域のサイズを合
致させるステップと、フィールド領域のサイズが合致し
た各照合用帳票と被照合帳票の個々のフィールド間の対
応関係の有無、フィールド領域のサイズが合致した被照
合帳票のフィールドと各照合用帳票のフィールド領域内
で互いに隣接する複数フィールドからなる統合フィール
ドとの対応関係の有無、あるいはフィールド領域のサイ
ズが合致した各照合用帳票のフィールドと被照合帳票の
フィールド領域内で互いに隣接する複数のフィールドか
らなる統合フィールドとの対応関係の有無、を判定し、
一定範囲で対応する照合用帳票を選択するステップと、
をコンピュータ装置上で実行することを特徴とする。
【0006】この場合、照合用帳票及び被照合帳票にお
けるフィールド同士、またはフィールドと統合フィール
ドとの対応の有無は、例えば、前記フィールド領域の基
準位置からの相対値で表される個々のフィールドないし
統合フィールドの形成位置が互いに一致するか否かによ
り判定する。
【0007】また、上記他の課題を解決する本発明の帳
票照合装置は、文字等を記入するためのフィールドが形
成されているフィールド領域の基準位置とこの基準位置
からの相対値で表される個々のフィールドの形成位置と
で表されるフォーマット情報を照合用帳票毎に格納した
フォーマット情報格納手段;入力画像に含まれる被照合
帳票からフィールド領域を特定するとともに個々のフィ
ールドの形成位置をフィールド領域の基準位置からの相
対位置として表すフォーマット情報を生成するフォーマ
ット情報生成手段;各照合用帳票の各々のフィールド領
域と前記被照合帳票のフィールド領域とを比較して両領
域のサイズを合致させるための変形量を算出するフォー
マット情報比較手段;各照合用帳票についての個々のフ
ォーマット情報を前記算出された変形量により修正して
修正フォーマット情報を生成するフォーマット情報修正
手段;及び、この修正フォーマット情報が前記被照合帳
票について生成されたフォーマット情報と一定範囲で合
致する照合用帳票を選択する照合手段;を備えることを
特徴とする。
【0008】照合手段は、照合用帳票の修正フォーマッ
ト情報と被照合帳票について生成されたフォーマット情
報とを個々のフィールド毎に照合し、一致しないフィー
ルドが存在する場合は、さらに、被照合帳票の一のフィ
ールドと各照合用帳票のフィールド領域内で互いに隣接
する複数フィールド毎、または、各照合用帳票の一のフ
ィールドと被照合帳票のフィールド領域内で互いに隣接
する複数のフィールド毎に照合するように構成する。
【0009】本発明は、また、上記帳票照合装置をコン
ピュータ装置上で実現する際に用いられる命令記憶媒体
をも提供する。この命令記憶媒体は、コンピュータ装置
によって読み取られ、該コンピュータ装置によって実行
される命令群を実体化して、帳票照合に対する処理ステ
ップをコンピュータ装置上で実現する命令記憶媒体であ
って、前記処理ステップが以下のステップを含んでいる
ものである。 (1)入力画像に含まれる被照合帳票から文字等を記入
するためのフィールドが形成されているフィールド領域
を特定するステップ、(2)予め保持されている複数の
照合用帳票のそれぞれのフィールド領域と前記特定され
た被照合帳票のフィールド領域のサイズを合致させるス
テップ、(3)フィールド領域のサイズが合致した各照
合用帳票と被照合帳票の個々のフィールド間の対応関係
の有無、被照合帳票のフィールドと各照合用帳票のフィ
ールド領域内で互いに隣接する複数フィールドからなる
統合フィールドとの対応関係の有無、または各照合用帳
票のフィールドと被照合帳票のフィールド領域内で互い
に隣接する複数のフィールドからなる統合フィールドと
の対応関係の有無のいずれかを判定し、一定範囲で対応
する照合用帳票を選択するステップ。
【0010】
【発明の実施の形態】以下、フィールド領域が罫線によ
って囲まれた被照合帳票を入力するとともに複数の照合
用帳票から被照合帳票の特徴に合致するものを選択する
帳票照合装置を例に挙げて、本発明の実施の形態を詳細
に説明する。
【0011】図1は、この実施形態による帳票照合装置
のブロック構成図である。この帳票照合装置1は、帳票
入力部10、罫線抽出部11、基準線特定部12、フィ
ールド抽出部13、フォーマット情報格納部14、フォ
ーマット情報比較部15、フォーマット情報修正部1
6、帳票選択部17、及び、照合結果出力部18から構
成される。
【0012】各処理部は、通常、図示しない命令記憶手
段に記憶された命令群(プログラムと必要なデータ)に
従って、コンピュータ装置のマイクロプロセッサユニッ
トが所要の処理を実行することにより形成される。但
し、上述の命令群は、必ずしもコンピュータ装置と一体
不可分である必要はなく、該コンピュータ装置から分離
した存在であっても良い。この場合は、コンピュータ装
置が読取可能且つコンピュータ装置によって実行可能な
形態で、フレキシブルディスクやCD−ROM(コンパ
クトディスク型ROM)上に物理的に実体化させる必要
がある。また、始点と終点とが明確な態様で把握できる
場合は、上記命令群を通信媒体上で実体化させたもので
あっても良い。
【0013】まず、帳票照合装置1の各処理部の機能を
概説する。帳票入力部10は、例えば汎用のスキャナか
ら取り込んだ画像を罫線抽出部11に渡す。この画像は
被照合帳票が形成されたものである。罫線抽出部11
は、取り込んだ画像から水平方向及び垂直方向の罫線を
抽出するものであり、基準線特定部12は、罫線抽出部
11により抽出された罫線から基準線を特定するもので
ある。基準線については後述する。フィールド抽出部1
3は、抽出された罫線に囲まれたフィールド、例えば文
字記入フィールドを抽出し、その位置やサイズを基準線
からの相対座標の形で帳票選択部17に渡す。フォーマ
ット情報格納部14は、予め登録した照合用帳票につい
てのフォーマット情報を格納したものである。フォーマ
ット情報は帳票の特徴を表す情報であり、本実施形態で
は、帳票の基準座標と帳票内の個々のフィールドの相対
座標をフォーマット情報とする。ここに基準座標とは、
基準線の特定位置の座標、フィールドの相対座標とはフ
ィールドの位置を特定する座標をそれぞれ意味するが、
詳しくは後述する。フォーマット情報比較部15は、被
照合帳票のフォーマット情報とフォーマット情報格納部
14内の各照合用帳票のフォーマット情報とを比較して
両者の位置ずれや拡大・縮小率(変形量)を導出し、こ
れをフォーマット情報修正部16に渡す。フォーマット
情報修正部16は、上記変形量に基づいてフォーマット
情報格納部14内の各照合用帳票のフォーマット情報を
修正し、これを帳票選択部17に渡す。帳票選択部17
は、フォーマット情報が修正された複数の照合用帳票か
ら被照合帳票の特徴と同一または類似のものを選択して
照合結果出力部18に渡す。照合結果出力部18は、選
択された照合用帳票に関する情報を後段処理、例えば文
字切出し手段等へ送るものである。
【0014】次に、この帳票照合装置1の動作例を説明
する。いま、帳票入力部10から被照合帳票の画像が取
り込まれたとする。被照合帳票は既使用のものであり、
フィールドには文字が記入されているものである。取り
込まれた画像は罫線抽出部11に入力され、ここで罫線
が抽出される。説明を簡単にするために、ここでは特
に、罫線全体が実線または破線から成る水平罫線と垂直
罫線とで形成されているものとする。
【0015】まず、図2を参照して、実線による水平罫
線の抽出処理を説明する。図2(a)は、画素が認識で
きない程度の小さなスケールで見た場合の水平罫線21
の一例を示した図である。図中、符号22は水平罫線2
1の端点部であり、その部分を画素が認識できる程度の
大きなスケールで見た場合の拡大図が図2(b)であ
る。罫線抽出部11は、画像上を水平方向に走査しなが
ら、図2(b)の中で、符号221ないし224のいず
れかで表された部分のように、黒画素が水平方向に罫線
閾値A以上にわたって連続分布した部分を見い出す。次
に、これらの部分が垂直方向に互いに隣接している部分
を見い出す。これらの部分が見い出された場合、これを
水平罫線と認識する。このようにして認識された水平罫
線は、例えば図2(b)に示されるように、水平方向に
連続する4つの黒画素の束221〜224から形成され
たものである。
【0016】次に、破線による水平罫線の抽出処理を説
明する。図3(a)は、この場合の水平罫線の一例を示
した図であり、図3(b)はこの水平罫線の部分拡大図
である。罫線抽出部11は、実線の場合と同様に、画像
上を水平方向に走査しながら、黒画素が互いに隣接して
いる領域を見い出し、その外接矩形を求める。次に、求
めた外接矩形の垂直サイズが線幅閾値B以下で、かつ、
水平方向のサイズが破線閾値D以下の矩形を水平破線の
一部とみなす。さらに、水平破線の一部とみなされた外
接矩形の中で、互いの垂直中心座標の差が中心差分閾値
C以下で、水平方向の間隔が破線間隔閾値E以下のもの
を統合していく。このようにして統合された全領域の水
平方向の長さが罫線閾値A以上のものを水平破線と認識
し、これを抽出する。
【0017】また、図4(a)に示すように、互いの垂
直中心座標の差が中心差分閾値C以下となる破線1と破
線2の間に黒画素領域(垂直実線)がクロスしている場
合、1本の水平破線41が黒画素部分によって分断され
たものか、あるいは破線1と破線2が独立の破線かを判
定する。この場合は、図4(b)に示される破線間の間
隙領域42に着目し、破線1と黒画素部分、及び黒画素
部分と破線2との間に存在する白画素の共に長さが破線
間隔閾値Eを越えない場合は、2本の破線は1本の破線
41が分断されたものとみなして統合処理を行う。
【0018】最後に破線の両端部の特定処理を行う。一
例として、右端部を特定するための処理を図5(a)と
図5(b)により説明する。図5(a)は、破線51の
端部領域52に黒画素領域が存在する様子を示すもので
あり、図5(b)はその端部領域52の拡大図である。
この右端部特定処理では、白画素の長さが破線間隔閾値
Eを越えない間に黒画素領域が存在するか否かを判定
し、存在する場合は、この黒画素領域を破線51の終端
として更新する。この更新処理を白画素の長さが破線間
隔閾値Eを越えるまで繰り返し、越えた時点で、破線5
1の右端部を特定する。
【0019】なお、罫線抽出部11の水平罫線の抽出処
理における水平軸と垂直軸を入れ替えて処理すること
で、同様の手順で垂直罫線をも抽出することができる。
罫線抽出部11によって被照合帳票についての罫線が抽
出されると、その結果が基準線特定部12に送られる。
【0020】基準線特定部12は、罫線抽出部11から
送られた罫線抽出結果に基づいて、水平罫線の中で垂直
座標位置が最小及び最大となる一対の罫線、そして、垂
直罫線の中で水平座標位置が最小及び最大となる一対の
罫線を、それぞれフィールド領域を囲む水平基準線,垂
直基準線としてそれぞれ特定する。このようにして特定
された各基準線は、結局、フィールド領域の最外周に沿
ったものとなる。上記罫線抽出結果と基準線の特定結果
は、フォーマット情報比較部14とフォーマット抽出部
13に送られ、それぞれ独立に処理される。そこで、ま
ず、フォーマット情報比較部14の処理内容を図6を参
照して説明する。
【0021】フォーマット情報比較部14では、フォー
マット情報格納部14に格納された複数の照合用帳票と
被照合帳票とを比較し、両帳票間の位置ずれ量、両帳票
のサイズを合致させるための変形量を水平方向と垂直方
向について求める。図6(a)は、フォーマット情報格
納部14に格納されている照合用帳票の罫線及び基準線
(太線)の例を示しており、図6(b)は、被照合帳票
について、罫線抽出処理部11と基準線特定部12の処
理により得られた罫線及び基準線(太線)の例を示して
いる。図6(a)、(b)に示されるように、ここでは
画面の左上を基準座標(0,0)としている。そして図
6(a)において、X’,Y’はそれぞれ、垂直罫線に
ついて水平座標の小さい方の罫線の水平座標、水平罫線
について垂直座標の小さい方の罫線の垂直座標である。
同様に、図6(b)において、X,Yはそれぞれ、垂直
罫線について水平座標が小さい方の罫線の水平座標、水
平罫線について垂直座標の小さい方の罫線の垂直座標で
ある。このとき、水平方向の位置ずれと垂直方向の位置
ずれは、次式で与えられる。
【0022】
【数1】水平方向の位置ずれ=X−X’ 垂直方向の位置ずれ=Y−Y’
【0023】さらに図6(a)において、W’,H’
は、それぞれ、2本の垂直基準線の間隔、2本の水平基
準線の間隔である。同様に、図6(b)において、W,
Hは、それぞれ、2本の垂直基準線の間隔、2本の水平
基準線の間隔である。このとき、帳票の基準線を合致さ
せるための水平方向及び垂直方向の変形量、例えば各々
の拡大・縮小率は、次式で与えられる。
【0024】
【数2】水平方向の拡大・縮小率=W/W’ 垂直方向の拡大・縮小率=H/H’
【0025】このようにしてフォーマット情報比較部1
4で照合用帳票毎に位置ずれ量、変形量が求められ、そ
の結果がフォーマット情報修正部16に送られる。フォ
ーマット情報修正部16では、フォーマット情報比較部
14で求められた位置ずれ量、変形量に基づいてフォー
マット情報におけるフィールド座標(フィールドの位置
を示す座標)を修正する。一つのフィールド(図6
(a),(b)の斜線で示した部分)の対応関係を示し
た図6(c)を参照して、上記修正処理を説明する。
【0026】図6(c)において、座標x’、y’を、
フォーマット情報格納部14の照合用帳票から任意に取
り出したフィールドの水平方向のフィールド座標、垂直
方向のフィールド座標とする。各方向のフィールド座標
は、どちらも基準座標(0,0)から測った相対座標で
ある。フォーマット情報修正部16は、座標x’とy’
を被照合帳票の基準座標(0,0)から測ったフィール
ド座標とみなすことができるように修正を施す。修正さ
れた座標を座標x”とy”とすると、これらは次式によ
り与えられる。
【0027】
【数3】x”=(W/W’)×x’+X−X’ y”=(H/H’)×y’+Y−Y’
【0028】図6(c)においてこの処理を見れば、左
上座標(x1’、y1’)と右上座標(x2’、y
2’)で指定されるフィールドは、左上座標(x1”、
y1”)と右上座標(x2”、y2”)で指定されるフ
ィールドに修正されたことになる。このようにして照合
用帳票の全てについてフィールド座標が修正され、その
結果が帳票選択部18に送られる。
【0029】次に、フィールド抽出部13での処理内容
を図7及び図8を参照して説明する。フィールド抽出部
13では、罫線抽出結果と基準線の特定結果を受けて、
被照合帳票から罫線によって四方を囲まれた個々のフィ
ールドを抽出する。その際、各フィールドのフィールド
座標を生成する。このフィールド座標は基準座標からの
相対座標である。図7は、このフィールド抽出の処理手
順であり、図8はフィールド抽出処理の際の具体例を示
すものである。
【0030】フィールド抽出に際しては、まず、図7に
示されるように、ループ(1)として垂直方向に移動し
て水平罫線の着目を変える(ステップS701)。但
し、処理の最初では、着目する水平罫線は垂直座標の最
も小さな水平罫線である。次に、着目した水平罫線を右
に移動して交点の着目を変え(ステップS701)、処
理1を行う。処理1では、水平罫線と垂直罫線が交わる
任意の交点に着目して、その交点にflagAとfla
gBを識別可能な2つの印として付与する(ステップS
703)。図8(a)には、その具体例として、丸印で
表された着目交点にflagAとflagBが付与され
ている様子が示されている。
【0031】次に、分岐1に於いて、水平罫線上を走査
しながらflagBの右側に交点が存在するか否かを調
べる(ステップS704)。flagBの右側に交点が
存在すれば(ステップS704:Yes)、図8(b)
のように処理2として交点の着目を右側の交点に移動
し、flagBを着目交点に付け変えて、新たにfla
gCをその着目交点に付与し、分岐2に進む。もし、f
lagBの右側に交点が存在しなければ(ステップS7
04:No)、ループ(2)を再び実行する。
【0032】分岐2では、flagCの下に交点が存在
するか否かを調べる(ステップS706)。flagC
の下に交点が存在する場合(ステップS704:Ye
s)は、図8(d)に例示されるように、処理3として
交点の着目を下側の交点に移動し、flagCを着目交
点に付け変え、そして着目交点に新たにflagDを付
与し、分岐3に進む。flagCの下に交点が存在しな
い場合(ステップS704:No)は、分岐1を再び実
行する。つまり、図8(c)に例示されるように、下に
交点がない交点を飛び越して、下に交点の存在する交点
に着目を移して行く。
【0033】分岐3では水平罫線上を左方向に走査し
て、flagDの左側に交点が存在するか否かを調べる
(ステップS708)。flagDの左側に交点が存在
する場合(ステップS708:Yes)は、図8(d)
に例示されるように、交点の着目をflagDの左側に
交点に移動し、flagDを着目交点に付け変えて分岐
4に進む。flagDの左側に交点が存在しない場合
(ステップS708:No)は、分岐2を再び実行す
る。つまり、図8(e)に例示されるように、左側に交
点がない交点を下に飛び越して、左側に交点の存在する
交点に着目を移して行く。
【0034】分岐4ではflagDの直上にflagA
が存在するか否かを調べる(ステップS710)。そし
て、flagDの直上にflagAが存在する場合(ス
テップS708:Yes)は、処理5に進む。一方、f
lagDの直上にflagAが存在しない場合(ステッ
プS708:Yes)は、分岐3を再び実行する。つま
り、図8(g)に例示されるように、着目交点の直上に
flagAが存在しない交点を左に飛び越して直上にf
lagAが存在する交点に着目を移す。
【0035】処理5では、図8(h)で例示されるよう
に、flagA、flagB、flagC、flagD
が付与された4点を頂点とする矩形領域(太線)をフィ
ールドとして抽出し、抽出したフィールドを指定するフ
ィールド座標を生成する(ステップS711)。その
後、再びループ(2)に進み、以上で説明したステップ
S703からステップS711の処理を繰り返す。以上
の手順を経て抽出されたフィールド座標の結果は、照合
選択部17に送られる。
【0036】帳票選択部17では、フォーマット情報修
正部16とフィールド抽出部13から送られた結果に基
づいて、被照合帳票と照合用帳票とのフィールドマッチ
ング処理を行う。このフィールドマッチング処理の手順
は図9に示す通りであり、まず、フォーマット情報修正
部16とフィールド抽出部13の処理結果に基づいてフ
ィールドマッチング(1)を行う。ここでは、修正後の
フォーマット情報のフィールド(F”)と被照合帳票の
フィールド(F)との照合を行う(ステップS91)。
各フィールドF”及びFの(左、右、上、下)の座標値
をそれぞれ(x”(l),x”(r),y”(t),
y”(b))、(x(l),x(r),y(t),y
(b))としたとき、照合条件は、下記のように表され
る。
【0037】
【数4】(A1)x”(l)−照合閾値G≦x(l)≦
x”(l)+照合閾値G (A2)x”(r)−照合閾値G≦x(r)≦x”
(r)+照合閾値G (A3)y”(t)−照合閾値G≦y(t)≦y”
(t)+照合閾値G (A4)y”(b)−照合閾値G≦y(b)≦y”
(b)+照合閾値G
【0038】なお、照合閾値Gは、被照合帳票の画像取
り込みの解像度等を考慮して設定される。上記照合条件
を複数の照合用帳票の全てについて行い、不一致フィー
ルドの数を計数する。そして、不一致フィールド数がゼ
ロか否かを照合用帳票毎に判定し(ステップS92)、
ゼロとなる照合用帳票が存在するときは(ステップS9
2:Yes)、照合一致、即ちその照合用帳票が被照合
帳票と同一フォーマットの帳票であるとみなす(ステッ
プS93)。一方、不一致フィールド数がゼロでないと
きは(ステップS92:No)は、フィールドマッチン
グ(2)に処理を移す。
【0039】フィールドマッチング(2)では、フィー
ルド抽出部13において被照合帳票の罫線に途切れ等が
あるために、複数のフィールドを誤って一つのフィール
ドとしてしまった場合を想定し、照合用帳票について隣
接した複数のフィールドを統合し、この統合フィールド
と被照合帳票のフィールドとの照合を実行する(ステッ
プS94)。このステップでは、フィールドマッチング
(1)において不一致となった全てのフィールドFにつ
いて、次の照合条件式を満足するフィールドF”を求め
る。
【0040】
【数5】(B1)x”(l)≧x(l)−照合閾値G (B2)x”(r)≦x(r)+照合閾値G (B3)y”(t)≧y(t)−照合閾値G (B4)y”(b)≦y(b)+照合閾値G
【0041】条件式(B1)〜(B4)を満足するフィ
ールドF”がn個見い出されとき、これらのn個のフィ
ールド全てを統合する。また、統合したフィールドとフ
ィールドFが照合条件(A1)〜(A4)の全てを満た
すとき、n個のフィールドF”がフィールドFと一致し
たものとみなし、ステップS92で求めた不一致フィー
ルド数から数値“n”を差し引く。これにより不一致フ
ィールド数がゼロになった場合は(ステップS95:Y
es)、フォーマットが一致する可能性のある帳票候補
とみなす(ステップS96)。この処理を全てのフィー
ルドについて実施してもゼロとならない場合は(ステッ
プS95:No)、フィールドマッチング(3)に処理
を移す。
【0042】フィールドマッチング(3)では、フィー
ルド抽出部13において被照合帳票に記入文字や雑音が
あるために、1つのフィールドを誤って複数のフィール
ドに分割して認識した場合を想定して、被照合帳票につ
いて隣接した複数の抽出されたフィールドを統合して、
フィールドマッチングを行う(S97)。このステップ
では、フィールドマッチング(2)において不一致フィ
ールドとされた全てのフォーマットフィールドF”のそ
れぞれについて、以下の条件式を満足するフィールドF
を全て見い出す。
【0043】
【数6】(C1)x(l)≧x”(l)−照合閾値G (C2)x(r)≦x”(r)+照合閾値G (C3)y(t)≧y”(t)−照合閾値G (C4)y(b)≦y”(b)+照合閾値G
【0044】条件式(C1)〜(C4)を全て満足する
フィールドFがn個見い出されたとき、このn個のフィ
ールドを全て統合する。そして、統合したフィールド
F”が照合条件(A1)〜(A4)の全てを満たすと
き、フィールドF”がn個のフィールドFと一致したも
のとみなして、ステップS95における不一致フィール
ド数から“1”を差し引く。不一致フィールド数がゼロ
になった場合は(ステップS95:Yes)、フォーマ
ットが一致する可能性がある帳票候補とみなす(ステッ
プS96)。一方、ゼロでない場合は(S98:N
o)、照合不一致と判定し(ステップS99)、フィー
ルドマッチング処理を終える。なお、ステップS96に
おいて、帳票候補が複数になる場合は、不一致フィール
ド数の最も少ないものを選択し、これを帳票照合の結果
とする。
【0045】このように、本実施形態では、照合用帳票
のフィールド領域のサイズを被照合帳票のフィールド領
域のサイズに合致するように修正し、修正後のフィール
ド領域に含まれるフィールドと被照合帳票内のフィール
ドとを照合するようにしたので、従来のように帳票を識
別するためのマークや基準マークが付与された専用の帳
票を用いる必要がなく、汎用の帳票を利用することがで
きる。また、被照合帳票を画像の形で取り込む際に、罫
線の途切れや、ノイズ成分の混入等によってフィールド
を誤認識した場合であっても正しく照合を行うことがで
きる。
【0046】既存のフォーマット情報が存在しない場
合、つまり帳票についてのフォーマット情報を新規に登
録する場合は、図10に示す処理を行う。フォーマット
情報を登録する場合は、まず、フィールド内に文字等が
記入されていない帳票の画像を帳票入力部10より取り
込む(ステップS101)。罫線抽出部11は、この画
像を走査して水平罫線及び垂直罫線を抽出する(ステッ
プS102)。また、抽出された各罫線の中から垂直基
準線、水平基準線、及び基準座標を特定し、これをフィ
ールド抽出部13とフォーマット情報格納部16へ送る
(ステップS103)。フィールド抽出部13は、当該
帳票のフィールド座標を基準座標の相対値として表し、
これをフォーマット情報格納部16へ送る(ステップS
104)。フォーマット情報格納部16では、以上のス
テップで求めた基準座標とフィールド座標とをフォーマ
ット情報として登録し、次の帳票照合の際に使用可能に
する。
【0047】以上、本発明の実施形態を詳細に説明した
が、本発明は上記実施形態に限定されるものではない。
例えば、本実施形態では、照合用帳票と被照合帳票の垂
直基準線と水平基準線とを特定し、前者の各基準線に囲
まれる領域のサイズを後者の各基準線に囲まれる領域の
サイズに合致するように位置ずれ量や拡大・縮小率を変
えているが、要はフィールド領域のサイズを両帳票にお
いて一致させればよいので、フィールド領域の変形手法
は任意であって良い。また、図9におけるフィールドマ
ッチング(2)処理(S94)とフィールドマッチング
(3)処理(S97)とは必ずしもこの順に実行しなく
ともよく、また、両処理を独立させるようにしても良
い。
【0048】
【発明の効果】以上の説明から明らかなように、本発明
によれば、汎用の帳票を被照合帳票として用いた場合で
あっても、帳票サイズの相違、位置ずれ、画像取み時の
解像度の変化、雑音等の混入等に対して頑健な照合を行
うことができ、適用用途が拡がる効果がある。また、本
発明のような帳票照合過程を認識系の前段に設けること
により、認識系の構成を簡略にすることができる。
【図面の簡単な説明】
【図1】本発明の一実施形態に係る帳票照合装置のブロ
ック構成図。
【図2】(a)は本実施形態による被照合帳票イメージ
上の実線による水平罫線の一例を示す図、(b)は前記
水平罫線の端部の拡大図。
【図3】(a)は本実施形態による被照合帳票イメージ
上の破線による水平罫線の一例を示す図、(b)は前記
水平罫線の一部の拡大図。
【図4】(a)は本実施形態による被照合帳票イメージ
上の2本の破線による水平罫線の一例を示す図、(b)
は前記水平罫線の間隙部分の拡大図。
【図5】(a)は本実施形態による端部を有する破線に
よる水平罫線の一例を示す図、(b)は前記端部の周辺
拡大図。
【図6】(a)は本実施形態による照合用帳票のフォー
マットの一例を示した図、(b)は本実施形態による被
照合帳票イメージの罫線の一例を示した図、(c)は本
実施形態によるフォーマット情報修正部の処理を説明す
るための図。
【図7】本実施形態によるフィールド抽出部の処理手順
の説明図。
【図8】本実施形態によるフィールド抽出部の各処理に
おける具体例を示した図。
【図9】本実施形態による帳票照合処理の手順説明図。
【図10】本実施形態によるフォーマット情報格納部へ
の登録処理の手順説明図。
【符号の説明】
1 帳票照合装置 10 帳票入力部 11 罫線抽出部 12 基準線特定部 13 フィールド抽出部 14 フォーマット情報格納部 15 フォーマット情報比較部 16 フォーマット情報修正部 17 帳票照合選択部 18 照合結果出力部

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 入力画像に含まれる被照合帳票から文字
    等を記入するためのフィールドが形成されているフィー
    ルド領域を特定するステップと、 予め保持されている複数の照合用帳票のそれぞれのフィ
    ールド領域と前記特定された被照合帳票のフィールド領
    域のサイズを合致させるステップと、 フィールド領域のサイズが合致した各照合用帳票と被照
    合帳票の個々のフィールド間の対応関係の有無を判定
    し、一定範囲で対応する照合用帳票を選択するステップ
    と、 をコンピュータ装置上で実行することを特徴とする帳票
    照合方法。
  2. 【請求項2】 入力画像に含まれる被照合帳票から文字
    等を記入するためのフィールドが形成されているフィー
    ルド領域を特定するステップと、 予め保持されている複数の照合用帳票のそれぞれのフィ
    ールド領域と前記特定された被照合帳票のフィールド領
    域のサイズを合致させるステップと、 フィールド領域のサイズが合致した被照合帳票のフィー
    ルドと各照合用帳票のフィールド領域内で互いに隣接す
    る複数フィールドからなる統合フィールドとの対応関係
    の有無を判定し、一定範囲で対応する照合用帳票を選択
    するステップと、 をコンピュータ装置上で実行することを特徴とする帳票
    照合方法。
  3. 【請求項3】 入力画像に含まれる被照合帳票から文字
    等を記入するためのフィールドが形成されているフィー
    ルド領域を特定するステップと、 予め保持されている複数の照合用帳票のそれぞれのフィ
    ールド領域と前記特定された被照合帳票のフィールド領
    域のサイズを合致させるステップと、 フィールド領域のサイズが合致した各照合用帳票のフィ
    ールドと被照合帳票のフィールド領域内で互いに隣接す
    る複数のフィールドからなる統合フィールドとの対応関
    係の有無を判定し、一定範囲で対応する照合用帳票を選
    択するステップと、 をコンピュータ装置上で実行することを特徴とする帳票
    照合方法。
  4. 【請求項4】 前記照合用帳票及び被照合帳票における
    フィールド同士、またはフィールドと統合フィールドと
    の対応の有無を、前記フィールド領域の基準位置からの
    相対値で表される個々のフィールドないし統合フィール
    ドの形成位置が互いに一致するか否かにより判定するこ
    とを特徴とする請求項1ないし3のいずれかの項記載の
    帳票照合方法。
  5. 【請求項5】 文字等を記入するためのフィールドが形
    成されているフィールド領域の基準位置とこの基準位置
    からの相対値で表される個々のフィールドの形成位置と
    を含むフォーマット情報を照合用帳票毎に格納したフォ
    ーマット情報格納手段と、 入力画像に含まれる被照合帳票から前記フィールド領域
    を特定するとともに特定したフィールド領域の基準位置
    とこの基準位置からの相対値で表される個々のフィール
    ドの形成位置とを含むフォーマット情報を生成するフォ
    ーマット情報生成手段と、 各照合用帳票のフォーマット情報と前記被照合帳票につ
    いて生成されたフォーマット情報とを比較して照合用帳
    票と被照合帳票のフィールド領域のサイズを合致させる
    ための変形量を算出するフィールド情報比較手段と、 各照合用帳票についての個々フォーマット情報を前記算
    出された変形量により修正して修正フォーマット情報を
    生成するフォーマット情報修正手段と、 この修正フォーマット情報が前記被照合帳票について生
    成されたフォーマット情報と一定範囲で合致する照合用
    帳票を選択する照合手段と、 を備えることを特徴とする帳票照合装置。
  6. 【請求項6】 前記照合手段は、照合用帳票の修正フォ
    ーマット情報と被照合帳票について生成されたフォーマ
    ット情報とを個々のフィールド毎に照合し、一致しない
    フィールドが存在する場合は、さらに、被照合帳票の一
    のフィールドと各照合用帳票のフィールド領域内で互い
    に隣接する複数フィールド毎、または、各照合用帳票の
    一のフィールドと被照合帳票のフィールド領域内で互い
    に隣接する複数のフィールド毎に照合することを特徴と
    する請求項5記載の帳票照合装置。
  7. 【請求項7】 コンピュータ装置によって読み取られ、
    該コンピュータ装置によって実行される命令群を実体化
    して、帳票照合に対する処理ステップを前記コンピュー
    タ装置上で実現する命令記憶媒体であって、 前記処理ステップは、 入力画像に含まれる被照合帳票から文字等を記入するた
    めのフィールドが形成されているフィールド領域を特定
    するステップと、 予め保持されている複数の照合用帳票のそれぞれのフィ
    ールド領域と前記特定された被照合帳票のフィールド領
    域のサイズを合致させるステップと、 フィールド領域のサイズが合致した各照合用帳票と被照
    合帳票の個々のフィールド間の対応関係の有無、被照合
    帳票のフィールドと各照合用帳票のフィールド領域内で
    互いに隣接する複数フィールドからなる統合フィールド
    との対応関係の有無、または各照合用帳票のフィールド
    と被照合帳票のフィールド領域内で互いに隣接する複数
    のフィールドからなる統合フィールドとの対応関係の有
    無のいずれかを判定し、一定範囲で対応する照合用帳票
    を選択するステップと、 を含むことを特徴とする命令記憶媒体。
JP8180959A 1996-07-10 1996-07-10 帳票照合方法及び装置 Pending JPH1027208A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8180959A JPH1027208A (ja) 1996-07-10 1996-07-10 帳票照合方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8180959A JPH1027208A (ja) 1996-07-10 1996-07-10 帳票照合方法及び装置

Publications (1)

Publication Number Publication Date
JPH1027208A true JPH1027208A (ja) 1998-01-27

Family

ID=16092280

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8180959A Pending JPH1027208A (ja) 1996-07-10 1996-07-10 帳票照合方法及び装置

Country Status (1)

Country Link
JP (1) JPH1027208A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007157171A (ja) * 2007-01-29 2007-06-21 Fujitsu Ltd 帳票照合装置
JP2013114678A (ja) * 2011-11-30 2013-06-10 Sharp Corp 画像判定装置およびプログラム
JP2016081380A (ja) * 2014-10-20 2016-05-16 富士通フロンテック株式会社 帳票処理プログラム及び帳票処理装置
JP2016126636A (ja) * 2015-01-07 2016-07-11 コニカミノルタ株式会社 帳票識別装置及びプログラム
WO2020157937A1 (ja) * 2019-01-31 2020-08-06 株式会社Pfu 画像処理装置、制御方法及び制御プログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007157171A (ja) * 2007-01-29 2007-06-21 Fujitsu Ltd 帳票照合装置
JP2013114678A (ja) * 2011-11-30 2013-06-10 Sharp Corp 画像判定装置およびプログラム
JP2016081380A (ja) * 2014-10-20 2016-05-16 富士通フロンテック株式会社 帳票処理プログラム及び帳票処理装置
JP2016126636A (ja) * 2015-01-07 2016-07-11 コニカミノルタ株式会社 帳票識別装置及びプログラム
WO2020157937A1 (ja) * 2019-01-31 2020-08-06 株式会社Pfu 画像処理装置、制御方法及び制御プログラム

Similar Documents

Publication Publication Date Title
JP7013182B2 (ja) 情報処理装置、情報処理方法およびプログラム
US7889926B2 (en) Image dictionary creating apparatus, coding apparatus, image dictionary creating method
US8009909B2 (en) Image processing apparatus and its method
US7876471B2 (en) Image processing apparatus, control method and program thereof which searches for corresponding original electronic data based on a paper document
US20020006220A1 (en) Method and apparatus for recognizing document image by use of color information
US20060008113A1 (en) Image processing system and image processing method
JPH113430A (ja) 入力画像を基準画像に対応付ける方法、そのための装置、及びその方法を実現するプログラムを記憶した記憶媒体
JP2018055255A (ja) 情報処理装置、情報処理方法及びプログラム
US6947596B2 (en) Character recognition method, program and recording medium
JPH1027208A (ja) 帳票照合方法及び装置
JP5691547B2 (ja) 画像の変更箇所抽出装置、画像の変更箇所表示装置及びプログラム
JPH08190690A (ja) ナンバープレート決定方法
JP4651876B2 (ja) パターン識別装置、パターン識別方法及びパターン識別用プログラム
JP4281236B2 (ja) 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
JP2868134B2 (ja) 画像処理方法及び装置
US6678427B1 (en) Document identification registration system
JP2017138743A (ja) 画像処理装置、画像処理方法及びプログラム
KR101991461B1 (ko) 특징점의 벡터화를 이용한 문자인식 시스템 및 방법
JP5109548B2 (ja) 画像処理装置及びプログラム
KR20200131368A (ko) 행정구역별 오브젝트 인식방법 및 그 시스템
JP2000076378A (ja) 文字認識方法
JPH10208040A (ja) 画像処理方法及び記録媒体
JP3585143B2 (ja) 文字列抽出方法および装置
JP3805161B2 (ja) 文字読取装置、文字読取方法、文字読取プログラムを記録したコンピュータ読み取り可能な情報記憶媒体
JPH10154191A (ja) 帳票識別方法及び装置並びに帳票識別プログラムを記録した媒体