JP2918064B2 - テンプレート除去のため画像を位置合せするための方法および装置 - Google Patents

テンプレート除去のため画像を位置合せするための方法および装置

Info

Publication number
JP2918064B2
JP2918064B2 JP7514168A JP51416895A JP2918064B2 JP 2918064 B2 JP2918064 B2 JP 2918064B2 JP 7514168 A JP7514168 A JP 7514168A JP 51416895 A JP51416895 A JP 51416895A JP 2918064 B2 JP2918064 B2 JP 2918064B2
Authority
JP
Japan
Prior art keywords
image
band
column
corresponding input
row
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP7514168A
Other languages
English (en)
Other versions
JPH08504076A (ja
Inventor
ズロトニック,アヴァイド
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH08504076A publication Critical patent/JPH08504076A/ja
Application granted granted Critical
Publication of JP2918064B2 publication Critical patent/JP2918064B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction
    • H04N1/411Bandwidth or redundancy reduction for the transmission or storage or reproduction of two-tone pictures, e.g. black and white pictures
    • H04N1/4115Bandwidth or redundancy reduction for the transmission or storage or reproduction of two-tone pictures, e.g. black and white pictures involving the recognition of specific patterns, e.g. by symbol matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Description

【発明の詳細な説明】 [技術分野] 本発明は、画像の位置合せ、具体的には、テンプレー
トに書き込まれた情報を、空のテンプレートの画像を除
去することによって分離できるようにするために、空の
テンプレートの画像と書き込まれたテンプレートの画像
とを位置合せするための方法および装置に関する。本発
明は特に、不変フォームに書き込まれた情報を、画像の
うちで情報内容に寄与しない部分とは別に処理しなけれ
ばならない分野に関する。
[背景技術] 紙文書の扱いは、現在のオフィス環境において日課と
なっている。フォームなどの文書の処理をより効率的に
しようとする時には、コンピュータやデータ伝送ネット
ワークなどの近代的なデータ処理手段を利用できるよう
にするため、文書をディジタル化しなければならない。
一旦そのようなシステムで文書を使用できるようになっ
たならば、文書を記憶装置にロードし、後に検索するこ
とができる。記憶装置と文書の検索は、これに関する1
態様に過ぎず、もう一方の、おそらくより重要な態様
は、文書に含まれる情報の取り扱いである。
文書に含まれる情報の取り扱いには、通常は、読取り
装置による情報の獲得、獲得した情報の機械可読コード
への変換、後におそらくは繰り返されるであろう処理の
ためのコード化された情報な記憶、情報の実際の処理お
よび、処理の結果の最終的な出力が含まれる。
光学スキャナなどの読取り装置による情報の獲得は、
十分に高い解像度で行われる必要がある。さもないと、
情報内容が不完全になったり、部分的に失われるはずで
ある。読取り装置は通常、大量の走査データをもたら
し、この大量のデータが、高速で信頼性のある処理のた
めに強力なコンピュータと、記憶のために大きな記憶容
量を必要とする。典型的な例として、A4サイズ(279×2
10mm)の1ページを100画素/cm(画素とは、画像要素を
表し、白または黒のドッドである)で走査すると、約70
0Kバイトの記憶空間が必要になる。ごくあたりまえの分
量の文書でも、法外な量の記憶域が必要になる可能性が
ある。
書き込まれたフォームの画像の大半は、情報内容に寄
与しないので、空のフォームである標準部分または一定
部分(CP)と、書き込まれたデータである可変部分(V
P)を分離するめに、異なる方法が開発されてきた。こ
の一定部分(CP)と可変部分(VP)の分離を、テンプレ
ート除去と称するが、これには、下記の長所がある。
・記憶域の節約:フォーム画像の多くは、一定部分(C
P)の単一のコピーに重畳された可変部分(VP)から再
構成できる。通常、可変部分(VP)のサイズは、全画像
のサイズのごく一部に過ぎず、記憶域の90%を節約する
ことが可能である。
・通信の改良:上と同じ理由から、一定部分(CP)と可
変部分(VP)を分離すると、通信量がかなり節約され、
したがって、フォーム処理システムに共通するボルトネ
ックのつが除去される。
・光学文字認識(OCR)の精度向上:情況によっては、
フォームの一定部分(CP)が、自動文字認識と干渉する
可能性がある。可変部分(VP)だけにアクセスできれ
ば、この問題のかなりを除去できる。
一定部分(CP)すなわちフォーム自体の除去のための
方法は、たとえば、D・E・Nielsen et al・,著、"Ev
aluation of Scanner Spectral Response for Insuranc
e Industry Documents",16/A44 NCI Program,Working P
aper No.2、1973年5月によって報告され、実施されて
きた。この方法は、「ドロップアウト・インク」技法と
も称するが、フォームを印刷する時に、通常のスキャナ
に透明な特殊なカーラー・インクを使用するという発想
に基づくものである。このタイプの完成されたフォーム
を走査する場合、基本的なパターン(すなわちCP)は、
スキャナには見えなくなり、可変部分(VP)だけがコン
ピュータに入力されるはずである。この手法の明らかな
短所は、特殊なインク感度を有するスキャナを使用する
ので、既存のアーカイブにこの手法を適用できないこと
である。また、特殊インクを使用するのは、確かに面倒
であり、コストも高い。「ドロップアウト・インク」技
法のもう1つの短所は、フォーム背景は除去したいが、
フォームの印刷方法や印刷に使用される色の種類に影響
が及ぶことを望まないカスタマが存在することである。
書き込まれた情報からフォーム背景を分離するための
もう1つの手法が、欧州特許出願EP−A−0 411 231
(米国特許第5182656号明細書)、表題「Method for Co
mpressing and Decompressing Forms by Means of very
1arge Symbol Matching(超大記号マッチングによるフ
ォームの圧縮伸長のための方法)」に開示されている。
この手法によれば、空のフォーム(CP)のサンプルを事
前に走査し、得られたデータをディジタル化し、コンピ
ュータ・メモリに記憶してフォーム・ライブラリを作成
する。次に、元の、圧縮しようとする書き込まれたフォ
ーム(F)を走査し、得られたデータをディジタル化
し、空のフォーム(CP)の表現を検索してこれから減算
する。この差が、可変部分(VP)すなわち書き込まれた
情報のディジタル表現になる。
そのようなフォーム除去を実行するためには、入力フ
ォーム画像(F)と空のテンプレート(CP)の画像を正
確に位置合せすることが必要である。入力フォーム画像
が、全体的にはテンプレートと位置合せている、すなわ
ち、オフセット、スキュー、スケールの差がない時であ
っても、通常は、局所的なゆがみがあり、テンプレート
(すなわち一定部分CP)をドロップ・アウトする前にそ
のゆがみを直さなければならない。このような局所的な
ゆがみは、スキャナ動作に一貫性がないが、写真コピー
のゆがみの結果であることが多い。
最終的な位置決めを計算する、すなわち、画像の可変
部分(VP)に関して一定部分(CP)を位置合せする方法
が、上で述べた欧州特許出願EP−A−0 411 231(米
国特許第5182656号明細書)と、欧州特許出願EP−A−
0 411 232(米国特許第5204756号明細書)、表題「M
ethod for High−Quality Compression of Binary Text
Images(2進テキスト画像の高品質圧縮のための方
法)」に記載されている。局所歪みが少なく、区分的線
形であると仮定して、入力(F)とテンプレート画像
(CP)の両方を小さなブロックに分解し、ヒストグラム
相関を使用して、対応するブロックの相対オフセットを
見つける別個の一貫性保存処理を使用して、異なるブロ
ックに関して計算されたオフセットの間に衝突が発生し
ないようにする。あるブロックのヒストグラムに十分な
情報がない場合には、隣接ブロックのオフセットを使用
して、そのブロックの変換を計算する。
実際には、上の技法は非常に良好に機能するが、下記
のいくつかの特殊な事例には、信頼性の向上が必要であ
る。
・1つのフォームのコピーを複数回繰り返すことでゆが
みが累算され、既存技法の制限要因に直面することにな
る。
・スキャナによっては、テンプレートの入力の両方とし
て同一のフォームを使用しても、ドロップアウト後にき
れいな画像がもたらされない。
・非常に密に書き込まれた区域のフォーム再構成でのア
ーチファクトが報告されており、このアーチファクト
は、わずかな位置決め誤差に対して非常に敏感である。
・テンプレート走査の品質が低い時に、深刻な位置決め
誤差がいくつか報告されいる。
テンプレート除去のための既知の技法は、非線形ゆが
みを有する画像の取り扱いに適していないことがわかっ
ている。
[発明の開示] 本発明の目的は、既知のテンプレート除去技法の信頼
性を高めるために、非線形ゆがみを有する画像の取り扱
いを改善することである。
本発明のもう1つの目的は、空の基準テンプレート画
像(CP)に対する入力画像(F)の微細位置合せを達成
するために、局所ゆがみを克服することである。
本発明のもう1つの目的は、微細位置合せ処理の堅牢
さを高めた、テンプレート除去のための方法および装置
を提供することである。
上記の目的は、最適対応サブシーケンス(OCS)・ア
ルゴリズムを使用して微細位置合せ処理の堅牢さを向上
させるという点で達成された。本発明による方法には、
基準テンプレート画像内の線と書き込まれたテンプレー
ト画像内の線の1方向への射影の対応する対を見つける
ことによって、前記線基準テンプレート画像内の前記線
と書き込まれたテンプレート画像内の前記線とを相関さ
せるステップと、前記投影の方向に垂直な方向での対と
それぞれの線の2つの射影の変位を決定し、前記射影の
対の間で一致を達成するために書き込まれたテンプレー
ト画像の各線の画素を移動しなければならない行または
列の数を評価するステップと、最後のステップで決定さ
れたとおりに、前記射影の方向に垂直に、書き込まれた
テンプレート画像の線の画素をシフトすることによっ
て、新入力画像(26)を生成するステップとが含まれ
る。
本発明のもう1つの好ましい実施例では、同一のステ
ップを、上の処理の射影の方向に関して90゜回転した方
向で繰り返す。
もう1つの実施例では、上記の処理を実行する前に、
書き込まれたテンプレート画像と基準テンプレート画像
とをバンドに分割する。この方法には、曲がった線に簡
単に対処できるという長所がある。
[図面の簡単な説明] 第1図は、フォーム・ライブラリへの基準テンプレー
ト画像の記憶と検索を示し、本発明による水平微細位置
合せを示す流れ図である。
第2図は、基準テンプレートの画像と入力テンプレー
トの画像の示す図である。
第3図は、本発明によって垂直バンドに分割された、
第2図の基準テンプレート画像と入力テンプレート画像
を示す図である。
第4図は、第2図の基準テンプレートと、本発明によ
って得られた新入力画像を示す図である。
第5図は、本発明による垂直微細位置合せを示す図で
ある。
第6図は、本発明による装置の概略ブロック図であ
る。
[発明の好ましい実施例] 書き込まれたテンプレートの一定部分(CP)を除去す
ることをテンプレート除去技法と称するが、その前に、
基準テンプレート画像(CP)と称する空のテンプレート
の画像を、書き込まれたテンプレートの画像に対して正
確に位置合せしなければならない。特に局所ゆがみ、と
りわけ非線形のゆがみが、この微細位置合せの精度に悪
影響を及ぼす。書き込まれたテンプレート(F)に関す
る一定部分(CP)の位置合せが良ければ良いほど、テン
プレート除去処理の結果も良くなる。微細位置合せ処理
全体の堅牢さを改善するために、最適対応サブシーケン
ス(OCS)・アルゴリズムと称するアルゴリズムが採用
された。この最適対応サブシーケンス・アルゴリズム
は、無限アルファベット・ペナルティ最小化問題(infi
nite alphabet penalty minimisation problem)である
ステレオ・マッチング(stereo matching)に関して既
に説明されている。このOCSアルゴリズムによる部分文
字列マッチングの問題は、論文"Optimal Correspondenc
e of String Subsequences"Y.P.,Wang他,IEEET ransact
ion on Pattern Analysis and Machine Intelligenc,Vo
l.2,No.11,19900年11月、pp.1080−1087に記載されてい
る。
以下の節では、テンプレート除去のための微細位置合
せに関する修正OCSアルゴリズムすなわち、フォーム認
識用最適サブシーケンス対応の使用を詳細に説明する。
下での問題の定式化は、関数f(i,j,a,b)が、シーケ
ンス要素aおよびbの他に引数として指標iおよびjを
とる点で、通常とは多少異なることに留意されたい。こ
の表記によって、望ましくない一致を制御する際に多少
の柔軟性が得られる。
画素の2つのシーケンスすなわち、A={a0,a1,…,a
N}およびB={b0,b1,…,bM}があり、すべての数値引
数に関してf(i,j,a,b)≧0になる関数f(i,j,a,b)
があるものとする。この関数f(i,j,a,b)を使用し
て、要素aと要素bの間の一致の質を評価する。OCS
は、和 が最大になるインデックス対P[2]の集合である。前
記P[2]の集合には、 P={(j0,k0),(j1,k1),…,(jL,kL)} [2] という形でインッデックス対が含まれ、 0≦j0<j1<…<jL≦N 0≦k0<k1<…<kL≦M であり、Lは、要素AおよびBのシーケンスの一致した
要素の数である。上のステップの最後に、最大の和
[1]とインデックス対のシーケンスPが、出力として
得られる。本明細書で使用されるOCSアルゴリズムは、
下で詳細に説明する。
ステップ1)ないし4)に従って、行列Sを計算す
る。ただしs(N,M)は、A={a0,a1,…,aN}およびB
={b0,b1,…,bM}に関するOCS問題のスコアである。
1) S(0,0)=f(a0,b0) 2) for i = 1 to N−1 s(i,0)=MAX{s(i−1,0),f (i,0,ai,b0)} 3) for j = 1 to M−1 s(0,j)=MAX{s(0,j−1),f (0,j,a0,bj)} 4) for i = 1 to N−1 for j = 1 to M−1 s(i,j)=MAX{s(i,j−1),s (i−1,j),s(i−1,j−1)+f(i,j,ai,bj)} ステップ5)ないし9)では、集合Pのインデックス
対のシーケンスが、次式によって計算される。
5) i=N−1, j=M−1 6) while i≧0 and j≧0 7) if i>0 and s(i−1,j)=s(i,j)
i=i−1 else 8) if j>0 and s(i,j−1)=s(i,j)
j=j−1 else 9) if s(i,j)>0 Pの先頭に(i,j)を挿入
i=i−1 j=j−1 s(N−1,M−1)が修正OCSアルゴリズムの戻り値で
あり、Pは、要求されたインデックスを有する。
本発明の数学的背景が、上で詳細に示された。以下の
節では、本発明による方法を実例に関して説明する。本
発明のステップと、準備ステップ1ないし4を、第1図
および第5図の流れ図に示す。
第1図に、基準テンプレート(CP)を走査し(ステッ
プ1)、本発明の微細位置合せ処理のための基準入力と
して使用するか、フォーラム・ライブラリに記憶できる
ことが概略的に示されている。このようなライブラリへ
の記憶とそこからの検索を、ステップ2、3および4に
示す。
第2図を参照すると、所与の空の基準テンプレート画
像20(CP)があり、基準テンプレート画像20は、12行の
画素と24列の画素からなる。説明を簡単にするために、
この図と後続の図では、基礎となる格子を図示し、黒画
素のそれぞれを、「×」として図示する。水平とは画像
の行に平行な方向を意味し、垂直とは画像の列に平行な
方向を意味することに留意されたい。
基準テンプレート画像20(CP)の左側には、1行あた
りの黒画像の個数が示されている。この数のシーケンス
を、A={0,19,0,0,19,0,1,2,0,19,0,0}と表すことが
できる。基準テンプレート画像20は、通常は記憶装置
(フォーラム・ライブラリまたは作業バッファ)に記憶
され、そこから、簡単に検索できる(ステップ4)。基
準テンプレート画像20を走査し記憶するステップ1ない
し4は、必ずしも第1図に示された他のステップを実行
する直前に実行しなくてよい。適切な基準テンプレート
を有するデータベースすなわち、異なる空のフォーム
(CP)を含むデータベースの作成と維持は、本明細書で
は示さない。
本発明の第1ステップとして、処理されるテンプレー
ト(通常は書き込まれたテンプレート)を、適当なスキ
ャナによって走査し、このテンプレートの画像21(F)
を得る。画像21を、以下では入力画像と称する。このス
テップは、第1図ではステップ10として示されており、
ディジタル化された入力画像21自体は、第2図に示され
ている。このテンプレートの内容すなわち、通常は書き
込まれた情報は、本発明による微細位置合せの説明には
関係がなく、基準テンプレート(CP)として既に使用さ
れたものと同様の空のテンプレートを走査した。2つの
画像すなわち基準テンプレート画像20と入力画像21を比
較すると、スキャナによって導入された不正確さのため
に2つの画像がわずかに異なることがわかる。入力画像
21は、11行24列の画素だけを有し、黒画素の一部が失わ
れたり、位置が狂っている。入力画像の1行あたりの黒
画素の個数は、画素のシーケンスB={0,18,1,0,10,8,
0,3,0,0,18}によって表される。入力画像21の1行あた
りの画素の数と比較した基準テンプレート画像20の1行
あたりの画素数を、表1に示す。
入力画像21の一定部分(CP)を除去する前に、局所ゆ
がみを取り除き、入力画像21を基準テンプレート画像20
に関して正確に位置合せしなければならない。
本発明によれば、基準テンプレート画像20と入力画像
21の両方を、ここで垂直のバンド、すなわち、複数列の
画素を含むバンドに分割する。このステップは、第1図
のステップ11によって表される。第3図に示されている
ように、基準テンプレート画像20は、2つの垂直基準バ
ンド22(CPA)および23(CPB)に分割される。入力画像
21は、2つの垂直入力バンド24(FA)および25(FB)に
分割される。これら4つの垂直バンドの各行の黒画素の
個数を、第3図に示す。
次に、入力画像21の垂直入力バンド24および25のそれ
ぞれと、基準テンプレート画像20の垂直基準バンド22お
よび23とのマッチングを、修正OSCアルゴリズムを使用
して実行する。このステップは、ステップ12に示されて
いる。垂直入力バンド24および25内の線の水平射影を垂
直基準バンド22および23内の線に相関させるために、OC
Sを使用する。これによって、垂直バンド内の前記録の
垂直オフセットを決定する。
黒画素のシーケンス(この例ではAA、ABおよびBA
BB)は垂直バンド内の線の水平投影であり、f(i,j,a,
b)は、これらの黒画素シーケンスの要素間の一致の質
を評価する関数である。表2に、垂直基準バンド22の垂
直入力バンド24のマッチングを示す。文字「−」は、存
在しない項目を示す。これによって、表3の対応する項
目を削除することが暗示される。
マッチングされた要素の数は、L=10である。垂直バ
ンドCPBおよびFBの画素シーケンスABおよびBBのマッチ
ングを、表3に示す。マッチングされた要素の数は、や
はりL=10である。
上のOCSアルゴリズムに従って、前記垂直入力バンドF
AおよびFB内の線の新しい垂直位置が定義される。次
に、線のそれぞれを新しい位置に移動した新入力画像26
()を構成する。この垂直シフトによる再構成は、第
1図ではステップ13として示されている。第4図の新入
力画像26()は、それ以降の全てのステップ、すなわ
ち、テンプレート除去(第1図のステップ14)に直接
に、または、第5図の水平微細位置合せステップに、入
力画像として使用される。
本発明による微細位置合せは、この時点で終了して、
前記新入力画像26()を通常のテンプレート除去処理
14の入力画像として使用するか、第5図のステップ50な
いし52を実行して、基準テンプレート画像20(CP)と新
入力画像26()の位置合せをさらに改善することがで
きる。
たとえば画素の行に平行か画素の列に平行など、1方
向だけの微細位置合せは、たとえば書き込まれたフォー
ムを読み取るのにファクシミリを使用する場合、主に垂
直軸に沿ったゆがみが発生するので、このような場合に
は満足な結果をもたらす可能性がある。この種のゆがみ
は、モータが機械的に不完全であるために発生する場合
がある。
水平微細位置合せ(ステップ50ないし52)を、以下で
説明する。マッチング処理の基本原理は、上の例によっ
て既に説明済みであるから、ステップ50ないし52は完全
に詳細には説明しない。
新入力画像26()と基準テンプレート画像20(CP)
を、所与の「高さ」h(h=画素の行の数)を有する水
平バンドに分割する。好ましい例では、テンプレートの
全長が24画素しかないので、たとえばh=12画素/バン
ドを水平バンドの「高さ」として選択できる。前記新入
力画像26()と基準テンプレート画像20(CP)を水平
バンドに分割するステップは、第5図の流れ図のステッ
プ50に示されている。
次に、OSCアルゴリズムを使用して、水平入力バンド
内の線と水平基準バンド内の線とを相関させ、前記バン
ド内の垂直線のオフセットを決定する。AaおよびAbは、
水平基準バンド内の線の垂直投影であり、BaおよびB
bは、水平に入力バンド内の線の垂直投影である。この
ステップは、第5図のステップ51に示されている。マッ
チング・ステップ12に関して説明したように、マッチン
グ関数f(i,j,a,b)によって、シーケンスAaとBaの間
の一致ならびにAbとBbの間の一致の質を評価する。
最後に、第5図のステップ52に示されるように、水平
入力バンド内の垂直線をその最適位置に移動することに
よって、新入力画像()を構成する。
上のアルゴリズムは、下記の最適化方法によって高速
化できる。
1.第1のマッチング処理すなわち、垂直バンドによる水
平線の位置合せか、第2のマッチング処理すなわち、水
平バンドによる垂直線の位置合せのいずれか一方だけを
実行する。
2.i<j+max_diffまたはj<i+max_diffになる場合
にSを評価しない。ただし、max_diffは、応用例に依存
する。
3.行i−1の最大値に関してs(i,j)が十分大きい場
合には、行iの残りを評価しない。ただし、「十分大き
い」は、応用例に依存する。
4.列j−1の最大値に関してs(i,j)が十分大きい場
合には、列jの残りを評価しない。ただし、「十分大き
い」は、応用例に依存する。
たとえばA4のページからなる文書を処理する時、各ペ
ージを「幅」w=250画素の垂直バンドに分割し、「高
さ」h=250画素の水平バンドに分割すると、よい結果
が得られた。本発明のOCSアルゴリズムに使用されるマ
ッチング関数f(x,y)は、修正可能であることに留意
されたい。f(x,y)=|w−(x−y)|やf(x,y)=
1+MIN(x,y)が、使用可能なマッチング関数の例であ
る。
テンプレート除去のためのシステムの例を、第6図に
概略的に示す。このシステムには、スキャナ61、フォー
ム・ライブラリ62、作業バッファ63、および、プロセッ
サ64の一部であるかこれによって制御される微細位置合
せユニット65が含まれる。これらの回路および要素の全
てが、たとえばATバスとすることのできるバス66によっ
て相互接続される。本発明によれば、前記フォーム・ラ
イブラリ62に記憶されているものであってもよい基準テ
ンプレート画像が、プロセッサ64の要求に基づいて前記
微細位置合せユニット65に供給される。書き込まれたテ
ンプレートを、スキャナ61によって走査し、その画像を
作業バッファ63に転送する。この作業バッファ63から、
要求があった時に画像を検索できる。微細位置合せユニ
ット65は、プロセッサ、フォーム・ライブラリ62および
作業バッファ63との相互作用によって、本発明による諸
ステップを実行する。最後に、微細位置合せユニット65
は、新入力画像()を作業バッファ63に記憶し、そこ
から新入力画像()を検索して、テンプレート除去を
行うことができる。
上の例のように黒画素と黒画素のシーケンスに対する
微細位置合せ処理に基づくのではなく、白画素と白画素
のそれぞれのシーケンスを使用することも可能である。
さらに、特定の情況の下では、画像の分割が不用にな
る、すなわち、本発明に従って行または列の1つのバン
ドだけが処理されることに留意されたい。本明細書で
は、画素の行が、紙の短い辺に平行であるか、その辺に
垂直である。行に対して垂直の画素の列に関しても、同
じ事があてはまる。
本発明の技法は、従来のテンプレート除去技法よりは
るかに堅牢である。この技法は、古い技法の失敗例を多
数用いてテストされ、圧縮の達成、視覚的品質および速
度に関して優れていることが証明されている。

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】画素の行および列を含む基準テンプレート
    画像および書き込まれたテンプレート画像を位置合せす
    る方法であって、 a)前記基準テンプレート画像を複数の画素列を有する
    基準バンドに分割するステップと、 b)前記書き込まれたテンプレート画像を複数の画素列
    を有する対応する入力バンドに分割するステップと、 前記基準バンドとそれに対応する入力バンドのそれぞれ
    について、 c)前記基準バンド画像内の行および前記対応する入力
    バンド画像内の行の1方向への射影の対応する対を見つ
    けることによって、前記基準バンド画像内の前記行と前
    記対応する入力バンド画像内の前記行とを相関させるス
    テップと、 d)前記射影の方向に垂直な方向での前記対のそれぞれ
    の行の2つの射影の変位を決定し、前記射影の対の間で
    一致を達成するために前記対応する入力バンド画像の各
    行の画素をシフトしなければならない行の数を評価する
    ステップと、 e)決定された変位を使用して、前記射影の方向に垂直
    に前記対応する入力バンド画像の行の画素をシフトする
    ことによって、新入力画像を生成するステップと、 を別々に実行することを含む方法。
  2. 【請求項2】a)前記基準テンプレート画像を複数の画
    素列を有する基準列バンドに分割するステップと、 b)前記新入力画像を複数の画素列を有する対応する入
    力列バンドに分割するステップと、 前記基準バンドとそれに対応する入力列バンドのそれぞ
    れについて、 c)請求項1のステップc)で選択された射影の方向に
    垂直な方向の射影を用いて、前記基準列バンド画像内お
    よび前記対応する入力列バンド画像内の列の射影の対応
    する対を見つけることによって、前記対応する入力列バ
    ンド画像内の前記列とを前記基準列バンド画像内の前記
    列とを相関させるステップと、 d)請求項1のステップc)で選択された前記射影の方
    向に平行な方向での前記対のそれぞれの列の2つの射影
    の変位を決定し、前記射影の対の間で一致を達成するた
    めに前記対応する入力列バンド画像の各列の画素をシフ
    トしなければならない列の数を評価するステップと、 e)決定された変位を使用して、請求項1のステップ
    c)で選択された前記射影の方向に平行に、前記対応す
    る入力列バンド画像の列の画素をシフトすることによっ
    て、新入力画像を生成するステップと、 を別々に実行することを含む、請求項1に記載の方法。
  3. 【請求項3】プロセッサと、基準テンプレート画像およ
    び入力された書き込まれたテンプレート画像を記憶する
    ための記憶装置とを含む、前記基準テンプレート画像と
    前記入力テンプレート画像とを位置合せするための装置
    であって、 前記基準テンプレート画像を複数の画素列を有する基準
    バンドに分割し、前記書き込まれたテンプレート画像を
    複数の画素列を有する対応する入力バンドに分割する手
    段と、 前記基準バンド画像内の行および前記対応する入力バン
    ド画像内の行の1方向への射影の対応する対を見つける
    ことによって、前記基準バンド画像内の前記行と前記対
    応する入力バンド画像内の前記行とを相関させる手段
    と、 前記射影の方向に垂直な方向での前記対のそれぞれの行
    の2つの射影の変位を決定し、前記射影の対の間で一致
    を達成するために前記対応する入力バンド画像の各行の
    画素をシフトしなければならない行の数を評価する手段
    と、 変位を決定する手段によって決定された通りに、前記射
    影の方向に垂直に、前記対応する入力バンド画像の行の
    画素をシフトすることによって、新入力画像を生成する
    手段と、 を含む装置。
  4. 【請求項4】前記基準バンド画像を複数の画素列を有す
    る基準列バンドに分割し、前記新入力画像を複数の画素
    列を有する対応する入力列バンドに分割する手段と、 請求項3の相関手段によって選択された射影の方向に垂
    直な方向の射影を用いて、前記基準列バンド画像内およ
    び前記対応する入力列バンド画像内の列の射影の対応す
    る対を見つけることによって、前記基準列バンド画像内
    の前記列と前記対応する入力列バンド画像内の前記列と
    を相関させる手段と、 請求項3の相関手段によって選択された前記射影の方向
    に平行な方向での前記対のそれぞれの列の2つの射影の
    変位を決定し、前記射影の対の間で一致を達成するため
    に前記対応する入力列バンド画像の各列の画素をシフト
    しなければならない列の数を評価する手段と、 決定された変位を使用して、請求項3の相関手段によっ
    て選択された前記射影の方向に平行に、前記対応する入
    力列バンド画像の列の画素をシフトすることによって、
    新入力画像を生成する手段と、 を更に含む、請求項3に記載の装置。
JP7514168A 1993-11-16 1993-11-16 テンプレート除去のため画像を位置合せするための方法および装置 Expired - Lifetime JP2918064B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/EP1993/003211 WO1995014348A1 (en) 1993-11-16 1993-11-16 Method and apparatus for alignment of images for template elimination

Publications (2)

Publication Number Publication Date
JPH08504076A JPH08504076A (ja) 1996-04-30
JP2918064B2 true JP2918064B2 (ja) 1999-07-12

Family

ID=8165792

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7514168A Expired - Lifetime JP2918064B2 (ja) 1993-11-16 1993-11-16 テンプレート除去のため画像を位置合せするための方法および装置

Country Status (4)

Country Link
US (1) US5793887A (ja)
EP (1) EP0679313A1 (ja)
JP (1) JP2918064B2 (ja)
WO (1) WO1995014348A1 (ja)

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4002655B2 (ja) * 1998-01-06 2007-11-07 株式会社日立製作所 パターン検査方法およびその装置
US6295083B1 (en) * 1998-02-27 2001-09-25 Tektronix, Inc. High precision image alignment detection
US6507662B1 (en) 1998-09-11 2003-01-14 Quid Technologies Llc Method and system for biometric recognition based on electric and/or magnetic properties
US6385342B1 (en) * 1998-11-13 2002-05-07 Xerox Corporation Blocking signature detection for identification of JPEG images
US6507671B1 (en) 1998-12-11 2003-01-14 International Business Machines Corporation Method and system for dropping template from a filled in image
US6499041B1 (en) 1998-12-29 2002-12-24 International Business Machines Corporation Methods, systems and computer program products for copying between templates having associated field designations
US6728426B1 (en) 1999-08-23 2004-04-27 International Business Machines Corporation Compression of form images in gray-level
US6351566B1 (en) 2000-03-02 2002-02-26 International Business Machines Method for image binarization
US6658166B1 (en) * 2000-03-08 2003-12-02 International Business Machines Corporation Correction of distortions in form processing
US6741738B2 (en) 2000-03-13 2004-05-25 Tms, Inc. Method of optical mark recognition
US6778703B1 (en) 2000-04-19 2004-08-17 International Business Machines Corporation Form recognition using reference areas
JP3927353B2 (ja) * 2000-06-15 2007-06-06 株式会社日立製作所 比較検査における画像の位置合せ方法、比較検査方法及び比較検査装置
US7917844B1 (en) 2000-07-14 2011-03-29 International Business Machines Corporation Directory service for form processing
US6760490B1 (en) 2000-09-28 2004-07-06 International Business Machines Corporation Efficient checking of key-in data entry
US6640009B2 (en) 2001-02-06 2003-10-28 International Business Machines Corporation Identification, separation and compression of multiple forms with mutants
JP4112968B2 (ja) * 2002-12-26 2008-07-02 富士通株式会社 ビデオテキスト処理装置
RU2003108434A (ru) * 2003-03-28 2004-09-27 "Аби Софтвер Лтд." (CY) Способ предварительной обработки изображения машиночитаемой формы нефиксированного формата
US20110188759A1 (en) * 2003-06-26 2011-08-04 Irina Filimonova Method and System of Pre-Analysis and Automated Classification of Documents
RU2003108433A (ru) 2003-03-28 2004-09-27 Аби Софтвер Лтд. (Cy) Способ предварительной обработки изображения машиночитаемой формы
US9224040B2 (en) 2003-03-28 2015-12-29 Abbyy Development Llc Method for object recognition and describing structure of graphical objects
US9015573B2 (en) 2003-03-28 2015-04-21 Abbyy Development Llc Object recognition and describing structure of graphical objects
US7305612B2 (en) * 2003-03-31 2007-12-04 Siemens Corporate Research, Inc. Systems and methods for automatic form segmentation for raster-based passive electronic documents
RU2635259C1 (ru) * 2016-06-22 2017-11-09 Общество с ограниченной ответственностью "Аби Девелопмент" Способ и устройство для определения типа цифрового документа
WO2007049270A2 (en) * 2005-10-25 2007-05-03 Charactell Ltd Form data extraction without customization
US8233714B2 (en) 2006-08-01 2012-07-31 Abbyy Software Ltd. Method and system for creating flexible structure descriptions
US9740692B2 (en) 2006-08-01 2017-08-22 Abbyy Development Llc Creating flexible structure descriptions of documents with repetitive non-regular structures
US8108764B2 (en) * 2007-10-03 2012-01-31 Esker, Inc. Document recognition using static and variable strings to create a document signature
US11830605B2 (en) * 2013-04-24 2023-11-28 Koninklijke Philips N.V. Image visualization of medical imaging studies between separate and distinct computing system using a template
US9542137B2 (en) 2014-01-14 2017-01-10 Xerox Corporation Image shift template
US10395133B1 (en) * 2015-05-08 2019-08-27 Open Text Corporation Image box filtering for optical character recognition

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4926489A (en) * 1983-03-11 1990-05-15 Kla Instruments Corporation Reticle inspection system
JP2531605B2 (ja) * 1984-02-24 1996-09-04 株式会社東芝 画像の位置合せ装置
GB2203317B (en) * 1987-04-02 1991-04-03 Ibm Display system
JPH02287684A (ja) * 1989-04-28 1990-11-27 Ibm Japan Ltd イメージ処理装置および方法
IL91221A (en) * 1989-08-04 1995-03-30 Ibm Israel Binary text compression method
IL91220A (en) * 1989-08-04 1995-03-30 Ibm Israel Compression of information
US5542007A (en) * 1993-10-27 1996-07-30 International Business Machines Corporation Form dropout compression method which handles form white-out and writing in shaded and white-out areas of the form

Also Published As

Publication number Publication date
WO1995014348A1 (en) 1995-05-26
JPH08504076A (ja) 1996-04-30
EP0679313A1 (en) 1995-11-02
US5793887A (en) 1998-08-11

Similar Documents

Publication Publication Date Title
JP2918064B2 (ja) テンプレート除去のため画像を位置合せするための方法および装置
US5182656A (en) Method for compressing and decompressing forms by means of very large symbol matching
EP0658042B1 (en) Dropped-form document image compression
JP3925971B2 (ja) 統合同値類の作成方法
US6546136B1 (en) Matching CCITT compressed document images
US6334001B2 (en) Iterative smoothing technique for pre-processing mixed raster content planes to improve the quality of a decompressed image and increase document compression ratios
US8339619B2 (en) System and image processing method and apparatus for re-using and re-editing images
KR0159831B1 (ko) 디지탈 화상의 결함위치 자동식별방법
US6668101B2 (en) Image processing apparatus and method, and computer-readable memory
JPH04225485A (ja) バーコードを認識する方法
JPH07220091A (ja) 画像処理装置及び方法
US6407828B1 (en) Document transmission module connectable to data source for transmitting data in standard or high speed modes
JP3335009B2 (ja) 画像処理方法及び画像処理装置
US5388167A (en) Document image processing system and document image processing method
US5778095A (en) Classification of scanned symbols into equivalence classes
US6507671B1 (en) Method and system for dropping template from a filled in image
JP2007129557A (ja) 画像処理システム
JPH06149898A (ja) 画像記憶検索装置
JP5517028B2 (ja) 画像処理装置
JP3090070B2 (ja) 帳票識別方法及び装置
JP2643092B2 (ja) 文書書式上の事前定義されたフィールドの外側に位置する標準外データを処理する方法およびシステム
EP0896295A2 (en) Character recognition method and system
JP2778436B2 (ja) 文字切り出し装置
JPS6252337B2 (ja)
Capitant et al. The application of optical character recognition techniques to bandwidth compression of facsimile data