JP2015169978A - 画像処理装置及び画像処理プログラム - Google Patents
画像処理装置及び画像処理プログラム Download PDFInfo
- Publication number
- JP2015169978A JP2015169978A JP2014042304A JP2014042304A JP2015169978A JP 2015169978 A JP2015169978 A JP 2015169978A JP 2014042304 A JP2014042304 A JP 2014042304A JP 2014042304 A JP2014042304 A JP 2014042304A JP 2015169978 A JP2015169978 A JP 2015169978A
- Authority
- JP
- Japan
- Prior art keywords
- image
- line segment
- module
- affine transformation
- transformation amount
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 claims abstract description 86
- 238000004364 calculation method Methods 0.000 claims abstract description 68
- 238000001514 detection method Methods 0.000 claims abstract description 57
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 claims description 135
- 230000009466 transformation Effects 0.000 claims description 135
- 238000000034 method Methods 0.000 claims description 35
- 230000002159 abnormal effect Effects 0.000 claims description 9
- 238000006243 chemical reaction Methods 0.000 claims description 7
- 238000011156 evaluation Methods 0.000 claims description 7
- 238000012937 correction Methods 0.000 claims description 6
- 238000004904 shortening Methods 0.000 abstract 1
- 230000008569 process Effects 0.000 description 23
- 238000010586 diagram Methods 0.000 description 15
- 238000004891 communication Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 6
- 238000004590 computer program Methods 0.000 description 5
- 238000000605 extraction Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 208000028752 abnormal posture Diseases 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/02—Affine transformations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
- G06V10/243—Aligning, centring, orientation detection or correction of the image by compensating for image skew or non-uniform image deformations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Image Analysis (AREA)
- Character Input (AREA)
- Editing Of Facsimile Originals (AREA)
Abstract
【解決手段】画像処理装置の検出手段は、第1の画像から線分を検出し、選択手段は、前記線分のうち、長さ順で上位から予め定められた数の線分と、前記第1の画像の雛型となる第2の画像における線分との組を選択し、算出手段は、前記線分の組を用いて、前記第2の画像に対する前記第1の画像の歪みを算出する。
【選択図】図7
Description
請求項1の発明は、第1の画像から線分を検出する検出手段と、前記線分のうち、長さ順で上位から予め定められた数の線分と、前記第1の画像の雛型となる第2の画像における線分との組を選択する選択手段と、前記線分の組を用いて、前記第2の画像に対する前記第1の画像の歪みを算出する算出手段を具備することを特徴とする画像処理装置である。
文字等が記入された文書とその文書の雛型(以下、テンプレートともいう。文字が記入される前の状態の文書)とのマッチング処理に関する技術がある。例えば、文書として、主に帳票がある。特に、スキャンされた記入済みの帳票と、予め定められたレイアウト情報との位置ずれや回転、歪みの補正量を算出する技術に属する。
以下では、スキャン(撮影を含む概念である。以下、同様)された帳票の画像を受付画像と呼ぶ。
また、帳票の文字(レ点などのマークを含む概念である。以下、同様)認識の対象である領域の情報をレイアウト情報と呼ぶ。また、レイアウト情報を指示する枠線等が描かれた画像をテンプレート画像とする。テンプレート画像は、例えば、未記入の帳票の画像である。なお、レイアウト情報とテンプレート画像との歪み量はゼロ又は既知とする。また、受付画像に対応するテンプレート画像は既知とする。
受付画像は、テンプレート画像をプリントする場面や記入済みの情報をスキャンする場面において、レイアウト情報に対して位置ずれや回転、歪みが生じる。以下ではこれらを総称して歪み量と呼ぶ。本実施の形態における歪み量は、画像のアフィン変換量で表されるものとする。
画像のアフィン変換は数式1で表される。数式1において(x’,y’)Tは変換前の座標、(x,y)Tは変換後の座標を表す。画像のアフィン変換は平行移動・回転・拡大縮小を含み、6つのパラメータ(a,b,c,d,e,f)から成る。
この過程において、特にプリント、スキャンの機械的な処理(紙送り等の処理)のために、図3の例に示すように受付画像とレイアウト情報の間に位置ずれや回転等の歪みが生じる。正しい情報を収集するためには歪み量を算出し、補正を行う必要がある。この様子を図4、図5の例に示す。図4に示す例は、図2の例に示したテンプレート画像200に対応付けられたレイアウト情報400である。分かりやすさのため1領域(対象領域410)のみの指定を図示しているが、複数領域あってもよい。原点を左上角の(x0,y0)として、対象領域410である四角形領域(xnw,ynw),(xne,yne),(xsw,ysw),(xse,yse)で囲まれた位置の情報を取得しようとしているが、歪みのために、図5の例に示す記入済みの受付画像とレイアウト情報の重ね合わせ画像500のように、受付画像300において前記の位置は(x’nw,y’nw),(x’ne,y’ne),(x’sw,y’sw),(x’se,y’se)となり、レイアウト情報と一致していない。そこで、歪みのアフィン変換量を推定し、数式1によってレイアウト情報又は受付画像を補正し、所望の位置の情報を取得しようとする。既存の技術では、枠線やその端点・交点など、テンプレート画像と受付画像で共通の特徴的な図形に基づいて上記の歪み量を算出する。例えば、対応する線分の組から平行移動量を算出する。また、対応する特徴点の組からアフィン変換量を算出する。特徴点は線分の交点や端点、矩形の角などである。
この問題に対して、レイアウト情報と受付画像の論理構造を利用する、特許文献3に示されるような既存の技術がある。しかし実環境においては、受付画像から検出される線分や特徴点には誤抽出や見逃しがあるため、これらの論理構造は必ずしも一致しない。線分の検出に誤検出がある例を図6に示す。この例では、受付画像600内に線分610のように、大きなレ点があるため、誤検出のレイアウトにおける線分として検出してしまう。
図1は、本実施の形態(以下に示す第1の実施の形態〜第6の実施の形態)を実現するための構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム(コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム)、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じて定まることの意を含めて用いる。「予め定められた値」が複数ある場合は、それぞれ異なった値であってもよいし、2以上の値(もちろんのことながら、全ての値も含む)が同じであってもよい。また、「Aである場合、Bをする」という意味を有する記載は、「Aであるか否かを判断し、Aであると判断した場合はBをする」の意味で用いる。ただし、Aであるか否かの判断が不要である場合を除く。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」(社会システム)にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。なお、ここでの記憶装置としては、ハードディスク、RAM(Random Access Memory)、外部記憶媒体、通信回線を介した記憶装置、CPU(Central Processing Unit)内のレジスタ等を含んでいてもよい。
画像読取装置110は、画像処理装置100と接続されている。画像読取装置110は、テンプレートに文字等が記入された画像を読み取る機能を有している。例えば、スキャナ、カメラ等で画像を読み込むこと、ファックス等で通信回線を介して外部機器から画像を受信すること、ハードディスク(コンピュータに内蔵されているものの他に、ネットワークを介して接続されているもの等を含む)等に記憶されている画像を読み出すこと等が含まれる。画像は、2値画像、多値画像(カラー画像を含む)であってもよい。受け付ける画像は、1枚であってもよいし、複数枚であってもよい。また、画像の内容として、ビジネスに用いられる帳票等の文書等であって、テンプレートがあるものである。例えば、表、枠線、下線、トンボ等が含まれている文書であって、それら表等に関する情報がテンプレート情報になる。以下、表が含まれている文書を例示して説明する。
テンプレート情報120は、画像処理装置100と接続されている。テンプレート情報120は、テンプレートに関する情報(例えば、テンプレート線分727、テンプレート特徴点777、テンプレート画像905等)を画像処理装置100に渡す。
−−−−− −−−−− −−−−−
step1.テンプレート画像の枠線を検出する。
step2.受付画像の枠線を検出する。
step3.受付画像の枠線を長い順にN個選択する。
step4.上記のように選択したN個の線分それぞれについて、テンプレート画像の枠線をM個選択し、テンプレート画像の線分と受付画像の線分の組を作成する。
step5.上記のように作成されたNM個のテンプレート画像とテンプレート画像の線分の組からさらに2つの組を選択し、アフィン変換量を算出する。
step6.上記のように作成されたN(N−1)M(M−1)個のアフィン変換量のうち、最適なものを選択する。
step7.上記のように選択されたアフィン変換量でテンプレート画像と受付画像の特徴点を対応付ける。
step8.上記のように対応付けられた対応点群からアフィン変換量を求め、これを歪み量とする。
−−−−− −−−−− −−−−−
なお、step4においてMとは、テンプレート画像から検出された線分の数である。また、step7において特徴点とは、線分の端点や交点である。また、step6において最適とは、テンプレート画像又は受付画像の特徴点を候補アフィン変換量で変換したとき、特徴点の配置の一致度が高いことを表す。
本実施の形態は、歪み量の範囲を仮定しない。その代わりに、テンプレート画像と受付画像の線分の組を限定することにより、処理時間の短縮を達成している。
一般に“線らしさ”とは長く細く湾曲が少ないほど高いと考えることができる。ゆえに、線らしさに基づいて線分を検出する技術は、一般に長細い線分ほど正確に検出する。受付画像から検出される線分は、誤抽出と見逃しの可能性があるが、長い線分であるほど正確に検出されていると期待できる。よって、歪み量を限定することなく高速化を達成するために、本実施の形態は、線分の長さに基づいて絞り込みを行う。
また、より遠い特徴点どうしからアフィン変換量を算出する方がよい。なぜならば、検出の微小な誤差の影響を線分の長さによって低減することができるためである。より長い線分の端点はより離れており、より正確なアフィン変換量が算出されると期待できる。
また、step5におけるアフィン変換量は、2つの線分の組から算出する。アフィン変換量を求めるには、最低3つの点の組が必要である。2つの線分の組には、最小で3つ、最大で5つの点の組があり、ここから任意の3組を選択すればよい。
また、step6における最適の評価は、以下に示すような例がある。まず、候補アフィン変換量でテンプレート画像の特徴点座標を変換する。続いて、受付画像の特徴点と変換後のテンプレート画像の特徴点について、互いに最近傍である特徴点の組を作成する。続いて、予め定められた値以上の距離を持つ組を棄却する。最後に組の総数を評価値とする。又は、組の距離の和の逆数を評価値とする。
なお、step3、step4において受付画像とテンプレート画像を入れ替えても同様の効用が得られる。また、step3において、短すぎる、傾きすぎる、距離が遠すぎるといった異常値を棄却してもよい。また、step4において、テンプレート画像の線分についてもまた長い順に絞り込みを行ってもよい。step5において、アフィン変換量が異常値となるような組み合わせは棄却して、step6以降の処理を軽減させてもよい。ここで、異常値とは、反転などの実環境では物理的に想定しえない拡縮や平行移動を示すアフィン変換量を指す。
また、前述の選択するN、Mは、文書毎(帳票毎)に設定可能としてもよい。また、Nは、Mに予め定められた1以上の計数を乗算した値としてもよい。Nは、Mと同数であることが理想的ではあるが、受付画像の線分数はテンプレート画像の線分数よりも多くなることが一般的であるからである。
処理の概要は、前述した画像処理装置100の処理と同様である。ただし、テンプレート画像から線分と特徴点を検出するのではなく、予めテンプレートの線分と特徴量の情報を抽出したものを使用している。
線分選択モジュール720は、線分検出モジュール710、線分ペア選択モジュール730と接続されており、線分ペア選択モジュール730に受付画像線分725を渡す。線分選択モジュール720は、受付画像線分715のうち、長さ順で上位から予め定められた数の線分を選択し、その選択した線分を受付画像線分725として、線分ペア選択モジュール730に渡す。ここで、「長さ順」とは、長さの長い線分を上位とすることであり、いわゆる降順にソートすることに該当する。つまり、全ての検出された線分(受付画像線分720)からN個の線分(受付画像線分725)を選択する。
特徴点検出モジュール740は、アフィン変換量算出Aモジュール750、特徴点ペア探索モジュール760と接続されており、受付画像705を受け付け、アフィン変換量算出Aモジュール750、特徴点ペア探索モジュール760に受付画像特徴点745を渡す。特徴点検出モジュール740は、既存の技術を用いて受付画像705内の特徴点を抽出し、その特徴点を受付画像特徴点745として出力する。ここで、特徴量とは、線分の端点又は線分どうしがなす交点である。
アフィン変換量算出Bモジュール770は、特徴点ペア探索モジュール760と接続されており、アフィン変換量775を出力する。アフィン変換量算出Bモジュール770は、特徴点の組(特徴点ペア765)からアフィン変換量775を算出する。受付画像705の受付画像特徴点745とテンプレート画像のテンプレート特徴点777について、アフィン変換量算出Aモジュール750による算出処理後に、予め定められた距離内に収まっている最近傍の関係にある組から、最小2乗法によりアフィン変換量を算出する。
受付画像の線分は、長さ順にソートされ、高々上位N個までしか参照されない。なお、n1,n2は、受付画像の線分のインデックスである。また、m1,m2はテンプレートの線分のインデックスである。また、アフィン変換量Aは、前述の数式1における6つのパラメータ(a,b,c,d,e,f)である。
歪み量であるアフィン変換量が分かることで、例えば、大量のスキャン投入の際に異常な姿勢の設置があれば、これを自動で検知・警告するようにしてもよい。
ステップS804では、アフィン変換量Aに(0,0,0,0,0,0)を代入する。
ステップS806では、変数Sに0を代入する。
ステップS808では、変数n1に0を代入する。
ステップS810では、n1<Nであるか否かを判断し、n1<Nである場合はステップS812へ進み、それ以外の場合は処理を終了する(ステップS899)。
ステップS812では、変数n2にn1+1を代入する。
ステップS814では、n2<Nであるか否かを判断し、n2<Nである場合はステップS816へ進み、それ以外の場合はステップS844へ進む。
ステップS818では、m1<Mであるか否かを判断し、m1<Mである場合はステップS820へ進み、それ以外の場合はステップS842へ進む。
ステップS820では、変数m2に0を代入する。
ステップS822では、m2<Mであるか否かを判断し、m2<Mである場合はステップS824へ進み、それ以外の場合はステップS840へ進む。
ステップS824では、m2≠m1であるか否かを判断し、m2≠m1である場合はステップS826へ進み、それ以外の場合はステップS838へ進む。
ステップS826では、アフィン変換量算出を行う。(n1,m1)、(n2,m2)の線分ペアからアフィン変換量Aを算出する。
ステップS830では、一致度算出を行う。対応する特徴点から一致度Sを算出する。
ステップS832では、Sselected<Sであるか否かを判断し、Sselected<Sである場合はステップS834へ進み、それ以外の場合はステップS838へ進む。
ステップS834では、AselectedにAを代入する。
ステップS836では、SselectedにSを代入する。
ステップS838では、m2にm2+1を代入する。
ステップS840では、m1にm1+1を代入する。
ステップS842では、n2にn2+1を代入する。
ステップS844では、n1にn1+1を代入する。
テンプレート画像905も受付画像705と同様のスキャンやコピーのプロセスにより作成することで、受付画像705とテンプレート画像905で同様の劣化が生じる。これにより、線分の誤検出・見逃しを含んだより一致度の高い線分と特徴点の対応をとることとなる。
アフィン変換量算出Aモジュール750は、線分ペア選択モジュール730、特徴点検出モジュール740、特徴点ペア探索モジュール760、特徴点検出モジュール920と接続されており、特徴点ペア探索モジュール760にアフィン変換量755を渡す。
特徴点ペア探索モジュール760は、特徴点検出モジュール740、アフィン変換量算出Aモジュール750、アフィン変換量算出Bモジュール770、特徴点検出モジュール920と接続されており、アフィン変換量算出Bモジュール770に特徴点ペア765を渡す。
線分検出モジュール910は、線分ペア選択モジュール730と接続されており、テンプレート画像905を受け付け、線分ペア選択モジュール730にテンプレート線分727を渡す。線分検出モジュール910は、テンプレート画像905からテンプレート線分727を検出する。ここで、テンプレート画像905は、レイアウト情報を指示する枠が描かれており、その枠内は未記入の画像である。つまり、受付画像705の記入前の画像である。線分検出モジュール710と同等の処理を行う。
特徴点検出モジュール920は、アフィン変換量算出Aモジュール750、特徴点ペア探索モジュール760と接続されており、テンプレート画像905を受け付け、アフィン変換量算出Aモジュール750、特徴点ペア探索モジュール760にテンプレート特徴点777を渡す。特徴点検出モジュール740と同等の処理を行う。
線分ペア選択モジュール730は、線分選択モジュール720、アフィン変換量算出Aモジュール750、線分選択モジュール1020と接続されており、アフィン変換量算出Aモジュール750に線分ペア735を渡す。
線分検出モジュール910は、線分選択モジュール1020と接続されており、テンプレート画像905を受け付け、線分選択モジュール1020にテンプレート線分1015を渡す。
線分選択モジュール1020は、線分検出モジュール910、線分ペア選択モジュール730と接続されており、線分ペア選択モジュール730にテンプレート線分727を渡す。線分選択モジュール1020は、テンプレート画像905のテンプレート線分1015として、長さ順で上位から予め定められた数の線分を利用する。つまり、テンプレート線分1015から長さの長いものを選択して、その選択した線分をテンプレート線分727として出力する。テンプレート線分1015に対しても長さに基づいた取捨選択を行うものであり、線分選択モジュール720と同等の処理を行う。
線分ペア選択モジュール730は、線分選択モジュール720、線分選択モジュール1020、アフィン変換量算出Cモジュール1150と接続されており、アフィン変換量算出Cモジュール1150に線分ペア735を渡す。
アフィン変換量算出Cモジュール1150は、線分ペア選択モジュール730、特徴点検出モジュール740、特徴点ペア探索モジュール760、特徴点検出モジュール920と接続されており、変換範囲1135を受け付け、特徴点ペア探索モジュール760にアフィン変換量755を渡す。アフィン変換量算出Cモジュール1150は、線分ペア735から算出されるアフィン変換量が異常値である場合、一致度の評価における特徴点のペアの探索を行わない。つまり、アフィン変換量算出Cモジュール1150は、特徴点による一致度を評価する前に、変換範囲1135に収まらないアフィン変換量を異常値と判定し棄却する。図8に示したフローチャート例における、特徴点対応付け処理(ステップS828)の直前で棄却を行えばよい。
特徴点ペア探索モジュール760は、特徴点検出モジュール740、アフィン変換量算出Cモジュール1150、アフィン変換量算出Bモジュール770、特徴点検出モジュール920と接続されており、アフィン変換量算出Bモジュール770に特徴点ペア765を渡す。
アフィン変換量算出Bモジュール770は、特徴点ペア探索モジュール760、アフィン変換モジュール1280と接続されており、アフィン変換モジュール1280にアフィン変換量775を渡す。
アフィン変換モジュール1280は、アフィン変換量算出Bモジュール770、領域切り出しモジュール1290と接続されており、レイアウト情報1277を受け付け、領域切り出しモジュール1290にレイアウト情報1285を渡す。アフィン変換モジュール1280は、アフィン変換量算出Bモジュール770が算出したアフィン変換量775によって、レイアウト情報1277の位置情報を補正する。補正は数式1の通りである。実環境で発生した歪みを補正したレイアウト情報1285が得られる。
領域切り出しモジュール1290は、アフィン変換モジュール1280と接続されており、レイアウト情報1285を受け取って、領域画像1295を出力する。つまり、補正されたレイアウト情報1285に基づいて、領域を切り出すことで、所望の位置の領域画像1295(記入情報)が得られる。受付画像705ではなく、レイアウト情報1285を補正することで、画像編集による誤差がなく、また、補正すべき点数が少なくなる。
領域切り出しモジュール1290は、アフィン変換モジュール1280、文字認識モジュール1390と接続されており、文字認識モジュール1390に領域画像1295を渡す。
文字認識モジュール1390は、領域切り出しモジュール1290と接続されており、文字認識結果1395を出力する。文字認識モジュール1390は、補正されたレイアウト情報1285に基づいて文字認識を行う。つまり、文字認識モジュール1390は、領域画像1295に対して文字認識を行い、文字認識結果1395を出力する。文字認識は、既存の技術を利用すればよい。
なお、図12、図13に示した例は、第1の実施の形態にモジュール(アフィン変換モジュール1280、領域切り出しモジュール1290、文字認識モジュール1390)を付加しているが、第2の実施の形態等に対して、同様にモジュールを付加してもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray(登録商標) Disc)、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM(登録商標))、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)、SD(Secure Digital)メモリーカード等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
110…画像読取装置
120…テンプレート情報
130…出力装置
705…受付画像
710…線分検出モジュール
715…受付画像線分
720…線分選択モジュール
725…受付画像線分
727…テンプレート線分
730…線分ペア選択モジュール
735…線分ペア
740…特徴点検出モジュール
745…受付画像特徴点
750…アフィン変換量算出Aモジュール
755…アフィン変換量
760…特徴点ペア探索モジュール
765…特徴点ペア
770…アフィン変換量算出Bモジュール
775…アフィン変換量
777…テンプレート特徴点
905…テンプレート画像
910…線分検出モジュール
920…特徴点検出モジュール
1015…テンプレート線分
1020…線分選択モジュール
1135…変換範囲
1150…アフィン変換量算出Cモジュール
1277…レイアウト情報
1280…アフィン変換モジュール
1285…レイアウト情報
1290…領域切り出しモジュール
1295…領域画像
1390…文字認識モジュール
1395…文字認識結果
Claims (10)
- 第1の画像から線分を検出する検出手段と、
前記線分のうち、長さ順で上位から予め定められた数の線分と、前記第1の画像の雛型となる第2の画像における線分との組を選択する選択手段と、
前記線分の組を用いて、前記第2の画像に対する前記第1の画像の歪みを算出する算出手段
を具備することを特徴とする画像処理装置。 - 前記算出手段は、前記線分の組の2つからアフィン変換量を算出し、該アフィン変換量を用いた前記第1の画像と前記第2の画像の一致度に基づいて、前記歪みを示すアフィン変換量を選択する
ことを特徴とする請求項1に記載の画像処理装置。 - 前記一致度とは、前記第1の画像から検出される特徴点と前記第2の画像における特徴点について、前記アフィン変換量による変換後に、最近傍の関係にある組が、予め定められた距離内に収まっている個数であり、
前記特徴点とは、前記線分の端点又は前記線分どうしがなす交点である
ことを特徴とする請求項2に記載の画像処理装置。 - 前記第1の画像の特徴点と前記第2の画像の特徴点について、前記算出手段による算出処理後に、予め定められた距離内に収まっている最近傍の関係にある組から、最小2乗法によりアフィン変換量を算出する第2の算出手段
をさらに具備することを特徴とする請求項1から3のいずれか一項に記載の画像処理装置。 - 前記第2の画像から線分を検出する第2の検出手段
をさらに具備しており、
前記第2の画像は、レイアウト情報を指示する枠が描かれており、該枠内は未記入の画像である
ことを特徴とする請求項1から4のいずれか一項に記載の画像処理装置。 - 前記選択手段は、前記第2の画像の線分として、長さ順で上位から予め定められた数の線分を利用する
ことを特徴とする請求項1から5のいずれか一項に記載の画像処理装置。 - 前記算出手段は、前記線分の組から算出されるアフィン変換量が異常値である場合、前記一致度の評価における特徴点の組の探索を行わない
ことを特徴とする請求項2から6のいずれか一項に記載の画像処理装置。 - 前記アフィン変換量によって、レイアウト情報の補正を行う補正手段
をさらに具備することを特徴とする請求項1から7のいずれか一項に記載の画像処理装置。 - 前記補正されたレイアウト情報に基づいて文字認識を行う文字認識手段
をさらに具備することを特徴とする請求項8に記載の画像処理装置。 - コンピュータを、
第1の画像から線分を検出する検出手段と、
前記線分のうち、長さ順で上位から予め定められた数の線分と、前記第1の画像の雛型となる第2の画像における線分との組を選択する選択手段と、
前記線分の組を用いて、前記第2の画像に対する前記第1の画像の歪みを算出する算出手段
として機能させるための画像処理プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014042304A JP6187323B2 (ja) | 2014-03-05 | 2014-03-05 | 画像処理装置及び画像処理プログラム |
US14/482,577 US9626738B2 (en) | 2014-03-05 | 2014-09-10 | Image processing apparatus, image processing method, and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014042304A JP6187323B2 (ja) | 2014-03-05 | 2014-03-05 | 画像処理装置及び画像処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015169978A true JP2015169978A (ja) | 2015-09-28 |
JP6187323B2 JP6187323B2 (ja) | 2017-08-30 |
Family
ID=54017867
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014042304A Expired - Fee Related JP6187323B2 (ja) | 2014-03-05 | 2014-03-05 | 画像処理装置及び画像処理プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US9626738B2 (ja) |
JP (1) | JP6187323B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10262202B2 (en) | 2016-04-25 | 2019-04-16 | Fujitsu Limited | Form recognition method, form recognition device, and non-transitory computer-readable medium |
JP2020095624A (ja) * | 2018-12-14 | 2020-06-18 | 株式会社デンソーテン | 画像処理装置、および画像処理方法 |
CN113139445A (zh) * | 2021-04-08 | 2021-07-20 | 招商银行股份有限公司 | 表格识别方法、设备及计算机可读存储介质 |
JP2022504454A (ja) * | 2019-09-30 | 2022-01-13 | 北京市商▲湯▼科技▲開▼▲發▼有限公司 | フォーム認識方法、フォーム抽出方法および関連する装置 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020008629A1 (ja) * | 2018-07-06 | 2020-01-09 | 楽天株式会社 | 画像処理システム、画像処理方法、及びプログラム |
EP3786844A4 (en) * | 2018-07-06 | 2021-05-05 | Rakuten, Inc. | IMAGE PROCESSING SYSTEM, IMAGE PROCESSING METHOD AND PROGRAM |
EP3905108A1 (en) * | 2020-04-29 | 2021-11-03 | Onfido Ltd | Scalable, flexible and robust template-based data extraction pipeline |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06290264A (ja) * | 1993-03-31 | 1994-10-18 | Nec Software Ltd | 画像データの自動歪み補正システム |
JPH09330412A (ja) * | 1996-06-12 | 1997-12-22 | Dainippon Printing Co Ltd | 画像検査方法および装置 |
JPH1091783A (ja) * | 1996-09-11 | 1998-04-10 | Ricoh Co Ltd | 画像位置合わせ方法、ファクス文字認識装置及びコンピュータ記憶媒体 |
JP2001229341A (ja) * | 2000-02-14 | 2001-08-24 | Mitsubishi Electric Corp | 文字認識装置及び文字認識方法 |
US20120045131A1 (en) * | 2010-08-17 | 2012-02-23 | Fujitsu Limited | Method of and apparatus for processing images |
JP2013106160A (ja) * | 2011-11-11 | 2013-05-30 | Pfu Ltd | 画像処理装置、矩形検出方法及びコンピュータプログラム |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4949392A (en) * | 1988-05-20 | 1990-08-14 | Eastman Kodak Company | Document recognition and automatic indexing for optical character recognition |
JPH10207981A (ja) | 1997-01-20 | 1998-08-07 | Ricoh Co Ltd | 帳票認識方法 |
JPH11353412A (ja) | 1998-06-08 | 1999-12-24 | Oki Electric Ind Co Ltd | 文字記入座標の補正方法、フォーマット選択方法及び光学式文字読取装置 |
US6996295B2 (en) * | 2002-01-10 | 2006-02-07 | Siemens Corporate Research, Inc. | Automatic document reading system for technical drawings |
US7330604B2 (en) * | 2006-03-02 | 2008-02-12 | Compulink Management Center, Inc. | Model-based dewarping method and apparatus |
US8724924B2 (en) * | 2008-01-18 | 2014-05-13 | Mitek Systems, Inc. | Systems and methods for processing mobile images to identify and extract content from forms |
US8358852B2 (en) * | 2008-03-31 | 2013-01-22 | Lexmark International, Inc. | Automatic forms identification systems and methods |
-
2014
- 2014-03-05 JP JP2014042304A patent/JP6187323B2/ja not_active Expired - Fee Related
- 2014-09-10 US US14/482,577 patent/US9626738B2/en active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06290264A (ja) * | 1993-03-31 | 1994-10-18 | Nec Software Ltd | 画像データの自動歪み補正システム |
JPH09330412A (ja) * | 1996-06-12 | 1997-12-22 | Dainippon Printing Co Ltd | 画像検査方法および装置 |
JPH1091783A (ja) * | 1996-09-11 | 1998-04-10 | Ricoh Co Ltd | 画像位置合わせ方法、ファクス文字認識装置及びコンピュータ記憶媒体 |
JP2001229341A (ja) * | 2000-02-14 | 2001-08-24 | Mitsubishi Electric Corp | 文字認識装置及び文字認識方法 |
US20120045131A1 (en) * | 2010-08-17 | 2012-02-23 | Fujitsu Limited | Method of and apparatus for processing images |
JP2012043433A (ja) * | 2010-08-17 | 2012-03-01 | Fujitsu Ltd | 画像処理方法及び装置 |
JP2013106160A (ja) * | 2011-11-11 | 2013-05-30 | Pfu Ltd | 画像処理装置、矩形検出方法及びコンピュータプログラム |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10262202B2 (en) | 2016-04-25 | 2019-04-16 | Fujitsu Limited | Form recognition method, form recognition device, and non-transitory computer-readable medium |
JP2020095624A (ja) * | 2018-12-14 | 2020-06-18 | 株式会社デンソーテン | 画像処理装置、および画像処理方法 |
JP2022504454A (ja) * | 2019-09-30 | 2022-01-13 | 北京市商▲湯▼科技▲開▼▲發▼有限公司 | フォーム認識方法、フォーム抽出方法および関連する装置 |
CN113139445A (zh) * | 2021-04-08 | 2021-07-20 | 招商银行股份有限公司 | 表格识别方法、设备及计算机可读存储介质 |
CN113139445B (zh) * | 2021-04-08 | 2024-05-31 | 招商银行股份有限公司 | 表格识别方法、设备及计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP6187323B2 (ja) | 2017-08-30 |
US9626738B2 (en) | 2017-04-18 |
US20150254869A1 (en) | 2015-09-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6187323B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP6119952B2 (ja) | 画像処理装置及び画像処理プログラム | |
KR101235226B1 (ko) | 화상 처리 장치, 화상 처리 방법 및 기록 매체 | |
US10643097B2 (en) | Image processing apparatuses and non-transitory computer readable medium | |
JP6221220B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2018045359A (ja) | 画像処理装置及び画像処理プログラム | |
JP5601027B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5481965B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP6323009B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP4840388B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP6241311B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP6003375B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP6098065B2 (ja) | 画像検査装置、画像検査方法、及びプログラム | |
JP2016212473A (ja) | 情報処理装置および情報処理プログラム | |
JP2010211699A (ja) | 画像処理装置及び画像処理プログラム | |
JP5821648B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP4882929B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2011065311A (ja) | 画像処理装置及び画像処理プログラム | |
JP2016133888A (ja) | 情報処理装置及び情報処理プログラム | |
JP2016053797A (ja) | 画像処理装置及び画像処理プログラム | |
JP5935324B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP2017022431A (ja) | 情報処理装置及び情報処理プログラム | |
CN117765541A (zh) | 一种通行证图像对齐方法及装置 | |
JP6252091B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP6244805B2 (ja) | 画像処理装置及び画像処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160722 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170526 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170704 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170717 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6187323 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |