JP4153850B2 - 画像処理装置、画像処理プログラム - Google Patents

画像処理装置、画像処理プログラム Download PDF

Info

Publication number
JP4153850B2
JP4153850B2 JP2003306990A JP2003306990A JP4153850B2 JP 4153850 B2 JP4153850 B2 JP 4153850B2 JP 2003306990 A JP2003306990 A JP 2003306990A JP 2003306990 A JP2003306990 A JP 2003306990A JP 4153850 B2 JP4153850 B2 JP 4153850B2
Authority
JP
Japan
Prior art keywords
region
boundary
candidate
area
candidates
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003306990A
Other languages
English (en)
Other versions
JP2005078306A (ja
Inventor
智久 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2003306990A priority Critical patent/JP4153850B2/ja
Publication of JP2005078306A publication Critical patent/JP2005078306A/ja
Application granted granted Critical
Publication of JP4153850B2 publication Critical patent/JP4153850B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)
  • Character Input (AREA)
  • Image Processing (AREA)

Description

本発明は、帳票等の画像から記入枠を抽出する画像処理装置、画像処理プログラムに関する。
従来、帳票等の画像から記入枠を抽出する方法として、様々な方法が提案されているが、これらの方法では、想定している帳票と入力された帳票との間の寸法の食い違いにより記入枠の抽出が失敗するという問題があり、寸法が一定でない帳票群からの記入枠の抽出が困難となっていた。
例えば、特許文献1に記載された方法では、帳票のフォーマットごとに罫線枠の格子点の座標列が登録されており、それらの座標により記入枠の位置を特定している。この方法では、枠の寸法の変動や紙の伸縮等による画像の歪みや伸縮等の変動が有る場合には、正確な位置合せが困難となり、記入枠の抽出が困難となる。
また、特許文献2に記載された方法では、入力画像と基準画像の部分画像同士の位置合せを行い、部分画像同士の位置合せの結果を用いて画像全体の位置合せを行い、基準画像について定められた枠位置に、記入枠が位置するように入力画像を補正しているが、この方法では、罫線位置の変動やフォーム上のプレプリント文字のフォントや配置等の変動が有る場合、それらの変動に起因する画像の変動により位置合せが困難となる。
また、特許文献3に記載された方法では、入力帳票と基準帳票について、水平線長及び垂直線長を線方向へ投影し、横座標及び縦座標を一定間隔に分割した間隔ごとの累積線長を求めて分布を作成し、入力帳票と基準帳票とで水平線の分布同士と垂直線の分布同士のマッチングを行うことにより位置合せを行っている。この方法では、枠の寸法の変動や紙の伸縮等による画像の歪みや伸縮を、線の分布のマッチングによりある程度吸収することができるが、枠の寸法の変動に起因する累積線長の変動が大きい場合には位置合せが困難となる。
特開平10−143605号公報 特開昭60−120485号公報 特開平7−249099号公報
このように従来の方法では、帳票に設けられる領域を区分する枠の寸法の変動が大きいと位置合せが困難となり、想定している帳票と処理対象とする帳票との間の領域の寸法の食い違いにより、領域を区分する位置(記入枠)の抽出が失敗してしまうという問題があった。
本発明は、前記のような問題に鑑みなされたもので、帳票に設けられる領域の寸法が一定でない帳票群から領域を区分する位置を確実に抽出することが可能な画像処理装置、画像処理プログラムを提供することを目的とする。
本発明は、処理対象とする帳票の画像中から、帳票の様式について定められた領域の境界位置の候補とする境界候補を抽出する境界候補抽出手段と、前記境界候補抽出手段によって抽出された前記境界候補の対を両端とする領域候補の各々について、前記領域候補の境界の両端にそれぞれ接している異なる方向の境界の本数の組からなる特徴量を算出する領域特徴抽出手段と、前記領域特徴抽出手段によって算出された前記特徴量のパターンと、帳票の様式上の特徴量の参照パターンとの距離が小さくなるように、前記境界候補と様式上での境界とのマッチングをとることにより領域候補を選択するマッチング手段と、前記マッチング手段により選択された領域候補から領域を区分する位置を抽出する領域区分位置抽出手段とを具備したことを特徴とする。
本発明によれば、処理対象の様式の座標情報を用いないでマッチングを実行することにより、帳票に設けられる領域の寸法が一定でない帳票群から領域を区分する位置(例えば記入枠)を確実に抽出することが可能となる。
以下、図面を参照して本発明の実施の形態について説明する。図1は、本実施形態における画像処理装置を実現するシステムの構成を示すブロック図である。
本実施形態における画像処理装置は、コンピュータに本実施形態を実現するプログラムを組み込むことによって構成でき、以下ではそのような構成を仮定して説明する。ただし、本実施形態は各手段を専用ハードウェアや、その集合体、または分散処理用のコンピュータネットワークとしても構成することもでき、以下に説明する手段を具備する構成ならば、ここで挙げた構成に関わらずどのようなもので実装しても良い。また、本実施形態における画像処理装置は、帳票等に記録された罫線(記入枠)の位置を検出する罫線(記入枠)認識装置、罫線(記入枠)により区切られた領域内に記入された文字を認識する文字認識装置として用いることができる。
図1に示すように、本実施形態における画像処理装置は、CPU10、メモリ12、ディスプレイ14、キーボード15、ポインティングデバイス16、スキャナ17、記憶装置18、及びプリンタ19を備えている。
CPU10は、画像処理装置全体の制御を司るもので、メモリ12に記録される各種プログラムに従い、データの入出力制御、スキャナ17から入力された帳票等の画像に対する画像処理(文字認識処理)制御などの各種の処理を制御する。
メモリ12は、プログラムやデータなどを記録するもので、各種プログラムに従って処理が実行される場合に、このプログラムの実行に伴って処理対象とするデータが一時的に記憶される。メモリ12に記憶されるプログラムとしては、例えば帳票等の画像に対する画像処理を実行するための画像処理プログラム12aが記憶される。また、画像処理プログラム12aの実行に伴って記憶されるデータとしては、スキャナ17によって入力された帳票等の画像のデータ(入力画像データ12b)、入力画像データ12bに対して帳票に設けられる領域の区分、例えば記入枠を認識する際に用いられる、処理対象とする帳票の様式上の領域から抽出された特徴量を表す参照パターンデータ12c、参照パターンデータ12cを用いて入力画像データ12bから抽出された記入枠の位置を示す記入枠抽出結果データ12d、記入枠抽出結果データ12dが示す領域内に記入された文字に対する文字認識処理の結果(文字コード)である文字認識結果データ12eなどが記憶される。
ディスプレイ14は、LCD(Liquid Crystal Display)などにより構成され、画像処理結果(文字認識結果)や装置の状態を示す情報を表示する。
キーボード15は、装置に対して各種の指示を入力するために用いられる。
ポインティングデバイス16は、マウスやタブレットなどにより構成され、装置に対して各種の指示を入力するために用いられる。
スキャナ17は、画像処理の対象とする帳票等の画像を読み取り、入力画像データを生成する。
記憶装置18は、各種の記録媒体に対してプログラムやデータなどの読み書きを実行する。記憶装置18は、記録媒体として、ハードディスク等の磁気ディスクや、光ディスク、半導体メモリなどを用いることができる。記録媒体は、固定型、可搬型の何れであっても良い。
プリンタ19は、帳票等の画像に対する画像処理(文字認識結果)を紙媒体に印刷するもので、例えば帳票に設けられた記入枠内に記入されていた文字に対する文字認識処理の結果(文字コード)を画像(文字)として印刷する。
(第1実施形態)
以下、図面を参照して本発明の第1実施形態について説明する。
図2は、図1に示すシステムによって実現される第1実施形態における画像処理装置の機能構成を示すブロック図である。
第1実施形態における画像処理装置は、入力画像20(入力画像データ12b)に対するノイズ除去や二値化、拡大縮小、回転等の前処理により前処理済み画像を生成する前処理手段21と、処理対象の帳票の様式について定められた分割位置の前処理済み画像上での位置の候補を境界候補として抽出する境界候補抽出手段22と、境界候補の対を両端とする領域候補の各々についての特徴量を算出する領域特徴抽出手段23と、様式上の領域の系列から抽出した特徴量のパターンと様式上の領域に対応する前処理済み画像上での領域候補の系列から抽出した特徴量の参照パターン25との距離が小さくなるように、様式上での境界と前処理済み画像上での境界候補のマッチングをとることにより領域候補を選択するマッチング手段24と、マッチング手段24により選択された領域候補から領域を区分する位置、すなわち記入枠を抽出する記入枠抽出手段26(領域区分位置抽出手段)とから構成されている。
第1実施形態では、例えば図3、図4に示すような様式の帳票を処理対象とするものとして説明する。図3は、マッチング手段24におけるマッチングの際に使用される参照パターン25のもとになった帳票の様式を示すもので、複数の垂直方向の罫線と、垂直罫線の間に設けられた複数の水平方向の罫線によって、複数の領域が区分されている。各領域は、文字が記入される位置を表している。図4は、処理対象とする帳票の様式を示すもので、図3と同様にして複数の垂直方向の罫線と水平方向の罫線によって領域を区分している。図4では、各領域に対して文字が記入されている状態を示している。
図3と図4を比較すると、文字が記入される領域の数と、その各領域についての相対的な位置関係は同じであるが、領域を区分する罫線の位置(座標)が異なり、また図4に示す処理対象とする帳票には、図3にはない領域(「製品情報」の文字列が記入された領域)を区分する罫線が存在している。
第1実施形態の画像処理装置では、罫線(枠)の位置に依存しない方法で位置合わせをするマッチングにより、処理対象とする帳票群における罫線の位置の変動が位置合わせに影響を与えないようにして、領域を区分する枠(領域)の位置を確実に抽出できるようにする。
次に、第1実施形態における動作について、図5に示すフローチャートを参照しながら説明する。
まず、スキャナ17により処理対象とする帳票(図4)について読み取りが実行され、入力画像データ12b(入力画像20)がメモリ12に記憶される(ステップA1)。
前処理手段21は、入力された画像(入力画像20)に対して二値化やノイズ除去、拡大縮小、回転等の前処理を実行して前処理済み画像を生成する(ステップA2)。
次に、境界候補抽出手段22は、前処理済み画像上において、処理対象の帳票の様式について定められた領域の分割位置の候補として境界候補を抽出する(ステップA3)。例えば、領域同士の境界に罫線(枠線)が引かれている場合、境界候補は、罫線抽出により抽出された罫線の位置を示す座標として抽出可能である。例えば、図3に示す帳票の様式では、垂直罫線B1−B6により領域a−eが区切られているが、図4に示す帳票の様式では、垂直罫線抽出によって得られる垂直罫線C1−C8の横座標が境界位置候補となる。なお、領域を区分する位置(境界)を表すB1−B6,C1−C8を境界番号と称する。
領域特徴抽出手段23は、境界候補の対に挟まれた領域の特徴量を、可能な対の全てまたは一部について算出する(ステップA4)。例えば、可能な対の全てについて特徴量を抽出する場合、図4に示す帳票を処理対象とする場合、以下の境界番号の対を両端とする境界候補の各々について特徴量を算出する。
(C1,C2)(C1,C3)(C1,C4)(C1,C5)(C1,C6)(C1,C7)(C1,C8)
(C2,C3)(C2,C4)(C2,C5)(C2,C6)(C2,C7)(C2,C8)
(C3,C4)(C3,C5)(C3,C6)(C3,C7)(C3,C8)
(C4,C5)(C4,C6)(C4,C7)(C4,C8)
(C5,C6)(C5,C7)(C5,C8)
(C6,C7)(C6,C8)
(C7,C8)
領域特徴抽出手段23が求める特徴量としては、例えば図4に示す帳票の様式の場合では、垂直罫線(C2)の右側に接している水平罫線の本数r(この場合では6本)と、垂直罫線(C3)の左側から接している水平罫線の本数l(この場合では6本)の組からなる2次元ベクトル(r,l)を用いることができる。
この特徴量を図4に示す帳票について列挙した対のいくつかに対応する領域候補について求めた結果は以下のようになる。
(C2,C3):(6,6)、(C3,C4):(6,6)、(C4,C5):(2,2)、(C5,C7):(7,8)、(C7,C8):(8,8)、(C1,C2):(2,2)、(C1,C3):(2,6)、(C5,C6):(7,2)、(C6,C7):(3,8)、(C6,C8):(3,8)。
ただし、「:」の前側は領域候補の両端に位置する境界候補の対を、後ろ側は領域候補について求めた特徴量を表している。
次に、マッチング手段24は、様式上の領域の系列から抽出した特徴量のパターンと様式上の領域に対応する前処理済み画像上での領域候補の系列から抽出した特徴量のパターンの距離が小さくなるように、様式上での境界の系列と前処理済み画像上での境界候補の系列のマッチングをとることにより領域候補を選択する(ステップA5)。
マッチング手段24によるマッチングは、帳票の様式上の領域から求めた特徴量のパターン、すなわち参照パターンと、領域候補から求めた特徴量のパターンの距離が小さくなるように行う。ただし、図3に示す帳票の様式に対する図4の様式に示す左端の領域(垂直罫線C1−C2の間の領域)のように、様式で定められていない領域が前後に付随している可能性が有る場合を想定して、マッチングにおいて、最初及び最後のいくつかの境界候補を無視してマッチングを行う端点フリーマッチングを行う。また、様式で定められていない領域が付随しない場合は、端点固定でのマッチングを行っても良い。
特徴量のパターン同士の距離は、例えば、様式上の領域から求めた特徴量のベクトルと、対応付けられた領域候補から求めた特徴ベクトルのユークリッド距離の自乗和として求めることができる。
図3の様式と図4の帳票の例において、例えば、(r,l)を特徴量とした場合、図3の様式について参照パターンを定めると以下のようになる。
(B1,B2):(6,6)、(B2,B3):(6,6)、(B3,B4):(2,2)、(B4,B5):(7,8)、(B5,B6):(8,8)。
様式上の境界B1,B2,B3,B4,B5,B6がそれぞれ境界候補C2,C3,C4,C5,C7,C8に対応付けられた場合の距離は、
((6−6)+(6−6))+((6−6)+(6−6)
+((2−2)+(2−2))+((7−7)+(8−8)+(8−8)+(8−8)
=0
となる。
また、様式上の境界B1,B2,B3,B4,B5,B6がそれぞれ境界候補C1,C3,C4,C5,C6,C8に対応付けられた場合の距離は、
((2−6)+(6−6))+((6−6)+(6−6)
+((2−2)+(2−2))+((7−7)+(2−8)+(3−8)+(8−8)
=77
となる。
以上では、様式上の領域が入力画像上で省略されていないことを仮定してパターン同士の距離の計算方法について述べたが、様式上の領域が入力画像上で省略されている場合は、領域毎に定めたペナルティー値で、自乗和で表された距離の式の当該領域に対応する項を置き換えることにより、領域の省略に対応することができる。
例えば、B3,B4を両端とする領域が省略されており、この領域に対応するペナルティー値が1000であり、B1,B2,B3がC2,C3,C4と、B4,B5,B6がC4,C7,C8と対応付けられている場合の距離は、
((6−6)+(6−6))+((6−6)+(6−6))+1000
+((2−7)+(8−8)+(8−8)+(8−8)
=1025
となる。
参照パターン25と入力画像20から求めた特徴量のパターンの距離が小さくなるように、様式上の境界と境界候補を対応付ける方法としては、例えば動的計画法を用いることができる。
図6は、図3の様式と図4の帳票のマッチングにおいて、動的計画法を用いた場合の様子を示した図である。図6において、横軸が境界候補の系列C1−C8の番号、縦軸が様式上の境界B1−B6の番号に対応している。
図6において、マッチングの経路は点線及び座標軸の交点として表現されるノード同士を結ぶ辺の系列として表現される。ノード同士を結ぶ辺の、両端の真横に位置する境界の対は様式上の領域と対応しており、両端の真下に位置する境界候補の対は領域候補に対応しているので、ノード同士を結ぶ辺を介して様式上の領域と領域候補が対応づけられている。例えば、境界B4−B5の対に対しては、境界候補C5−C7の対が対応づけられている。
図6の例では、隣り合う境界の対に対応する境界候補の対が、異なる二つの境界候補からなっているが、処理対象とする帳票にある領域が省略されているなどして、入力画像上から抜けている場合には、例えば図7に示すように、様式上の境界の対(B3−B4)に同一の二つの境界候補(C4−C4)が対応付けられる。従って、様式上の領域に対して、空の領域候補が対応付けられることになる。
境界候補を垂直罫線として抽出した場合、境界候補C6のように、様式で定められた境界と対応しない境界候補が検出される場合がある。このため、経路上の隣り合うノードを結ぶ辺の各々の境界番号差と境界候補番号差は1対多となる。
また、図4のように、様式で定められていない領域が、様式で定められている領域の系列の外側に付随している可能性がある場合は、境界番号差と境界候補番号差が0対1となる辺も含んだ経路も求められる。
次に、記入枠抽出手段26は、マッチング手段24により選択された領域候補から記入枠を抽出し、その記入枠の位置を示す情報(領域を区分する位置を示す情報)を記入枠抽出結果27として出力する(ステップA6)。分割した領域からの記入枠の抽出方法としては、対象とする様式や、マッチング手段24で求めた領域の種類により、様々な方法が考えられるが、例えば、図3の様式の領域b及び領域eにおいては、当該領域を横罫線で分割する事によって各記入枠を抽出することができる。
また、記入枠抽出手段26(領域区分位置抽出手段)を、図8のブロック図に示す機能によって構成することにより、マッチング手段24により求められた領域候補内に含まれる部分領域の位置を示す記入枠をさらに抽出することができる。
すなわち、記入枠抽出手段26は、マッチング手段24で求められた領域候補を示す領域情報30をもとに、領域候補内をさらに分割して得られる部分領域の境界の候補(領域内境界候補)を、境界候補抽出手段22と同様の方法で抽出する領域内境界候補抽出手段31と、領域内境界候補抽出手段31によって抽出された領域内境界候補の対で定まる部分領域候補の特徴量を領域特徴抽出手段23と同様の方法で抽出する部分領域特徴抽出手段32と、マッチング手段24と同様の方法により部分領域特徴抽出手段32で抽出した特徴量のパターンと様式上の部分領域から求めた特徴量のパターンすなわち領域内参照パターン34をマッチングして部分領域候補を選択する領域内マッチング手段33と、領域内マッチング手段33で選択した部分領域候補から記入枠(部分領域を区分する位置)を抽出する領域内記入枠抽出手段35(部分領域区分位置抽出手段)から構成される。
この場合、記入枠抽出手段26は、領域内マッチング手段33で求めた部分領域を罫線で分割することによって記入枠を求めてもよい。また、領域内記入枠抽出手段35は、記入枠抽出手段26を領域内境界候補抽出手段31、部分領域特徴抽出手段32、領域内マッチング手段33、領域内記入枠抽出手段35に分割したのと同様に、さらに分割した機能により構成することもできる。こうして、記入枠を抽出する手段を再帰的に任意の回数で再分割する構成とすることで、より複雑な様式に対応することができる。
なお、マッチング手段24によるマッチングで、様式上の領域に対して空の領域候補が対応付けられた場合、その領域は入力画像20上に存在していないことになるが、この場合には当該領域からの記入枠の抽出は行わず、当該領域上の記入枠については、当該記入枠の位置を表す情報の替わりに、当該記入枠が空であることを示す情報を記入枠抽出結果27として出力するものとする。
なお、図5に示すステップA7については、後述する第3実施形態及び第4実施形態において説明する。
このようにして、第1実施形態の画像処理装置では、マッチング手段24において領域を区分する記入枠の位置に依存しない方法で参照パターン25とのマッチングを実行するので、処理対象とする帳票群における罫線の位置の変動があっても、記入枠(領域)の位置を確実に抽出できるようになる。
(第2実施形態)
以下、図面を参照して本発明の第2実施形態について説明する。
図9は第2実施形態における画像処理装置の機能構成を示すブロック図である。
第2実施形態における画像処理装置は、入力画像に対するノイズ除去や二値化、拡大縮小、回転等の前処理により前処理済み画像を生成する前処理手段21と、処理対象の帳票の様式について定められた水平方向の分割位置の前処理済み画像上での位置として水平方向の境界候補を抽出する水平方向境界候補抽出手段22aと、処理対象の帳票の様式について定められた垂直方向の分割位置の前処理済み画像上での位置として垂直方向の境界候補を抽出する垂直方向境界候補抽出手段22bと、水平方向の境界候補の対を両端とする水平方向の領域候補の各々についての特徴量を算出する水平方向領域特徴抽出手段23aと、垂直方向の境界候補の対を両端とする垂直方向の領域候補の各々についての特徴量を算出する垂直方向領域特徴抽出手段23bと、処理対象の帳票の様式について予め定められた水平方向の参照パターン(水平方向参照パターン25a)と水平方向の領域候補から抽出した特徴量のパターンの距離が小さくなるように水平方向の参照パターンと水平方向の領域候補をマッチングして水平方向の領域候補を選択する水平方向マッチング手段24aと、処理対象の帳票の様式について予め定められた垂直方向の参照パターン(垂直方向参照パターン25b)と垂直方向の領域候補から抽出した特徴量のパターンの距離が小さくなるように垂直方向の参照パターンと垂直方向の領域候補をマッチングして垂直方向の領域候補を選択する垂直方向マッチング手段24bと、水平方向マッチング手段24aで選択した水平方向の領域候補に対応する境界候補及び垂直方向マッチング手段24bで選択した垂直方向の領域候補に対応する境界候補の座標を用いて、様式上で定められた矩形領域の座標を求める領域抽出手段28と、領域抽出手段28で求めた矩形領域から領域を区分する位置、すなわち記入枠を抽出する記入枠抽出手段26(領域区分位置抽出手段)とから構成されている。
なお、第1実施形態と同様の機能を有する部分については同じ符号を付している。
第2実施形態では、例えば図10、図11に示すような様式の帳票を処理対象とするものとして説明する。図10は、水平方向マッチング手段24a及び垂直方向マッチング手段24bにおけるマッチングの際に使用される水平方向参照パターン25a、垂直方向参照パターン25bのもとになった帳票の様式を示すもので、a,b,c,d,eは記入枠の各々を表している。図10に示す帳票の様式は、横方向に領域を分割しても、縦方向に領域を分割しても、記入枠が領域の境界によって分割されている。
また、図11は、図10の様式を水平方向及び垂直方向の罫線として、水平方向の境界HB1,HB2,HB3,HB4、垂直方向の境界VB1,VB2,VB3,VB4を定め、それらの境界により水平方向の領域h1,h2,h3と、垂直方向の領域v1,v2,v3とを定めた例を示す図である。なお、領域を区分する位置(境界)を表すHB1,HB2,HB3,HB4,VB1,VB2,VB3,VB4を境界番号と称する。
次に、第2実施形態における動作について説明する。
第2実施形態の画像処理装置は、基本的には第1実施形態(図5に示すフローチャート)と同様の流れで処理を実行するものとし、同一の処理部分については説明を省略する。第2実施形態では、ステップA3〜A5に相当する処理において、水平方向、垂直方向のそれぞれの方向で処理を実行し、各方向で特徴量のパターンについてマッチングを行うことで領域候補を選択し、水平方向と垂直方向のそれぞれで選択された領域候補の境界の位置をもとに領域を表す矩形領域を求める。
まず、前処理手段21により入力画像20に対して前処理済み画像が生成されると、水平方向境界候補抽出手段22a及び垂直方向境界候補抽出手段22bは、それぞれ前処理済み画像上において、処理対象の帳票の様式について定められた領域の分割位置の候補として境界候補を抽出する。水平方向の境界候補と垂直方向の境界候補の抽出は、第1実施形態における境界候補抽出手段22と同様の処理を水平方向境界候補抽出手段22aと垂直方向境界候補抽出手段22bが、帳票の画像に対してそれぞれ水平方向、垂直方向に行うことで実現される。
次に、水平方向領域特徴抽出手段23a及び垂直方向領域特徴抽出手段23bは、第1実施形態における領域特徴抽出手段23と領域候補の特徴の抽出と同様の方法により、それぞれ水平方向の領域候補及び垂直方向の領域候補の特徴抽出を行う。
次に、水平方向マッチング手段24aと垂直方向マッチング手段24bは、第1実施形態におけるマッチング手段24におけるマッチングと同様の方法により、水平方向領域特徴抽出手段23a及び垂直方向領域特徴抽出手段23bにより抽出された領域候補の特徴量のパターンについて、それぞれ水平方向参照パターン25a、垂直方向参照パターン25bとのマッチングをして領域候補を選択する。なお、水平方向参照パターン25a及び垂直方向参照パターン25bは、第1実施形態における参照パターンと同様に定義される。
次に、領域抽出手段28は、水平方向マッチング手段24aと垂直方向マッチング手段24bのそれぞれにより選択された領域候補の境界の位置をもとに矩形領域を求める。例えば、帳票の様式上で、上下左右の端に接している境界の番号の組み合わせからなる矩形情報を、上下左右の境界番号に対応する水平方向の境界候補及び垂直方向の境界候補の座標に置き換えることによって、前処理済み画像上での矩形の座標を求め、それを抽出した領域の矩形の座標とする。
例えば、図11に示す記入枠aに対する矩形情報についての矩形情報は(HB1,HB2,VB1,VB2)により表され、(HB1,HB3,VB1,VB2)の各境界番号を座標に置き換えることで、領域の矩形(各頂点の座標)を求めることができる。
記入枠抽出手段26は、領域抽出手段28で抽出された領域の矩形(領域矩形)から領域を区分する位置を示す記入枠の抽出を行う。なお、この抽出処理は、第1実施形態における記入枠の抽出と同様の方法で行われる。
このようにして、第1実施形態の方法では記入枠の抽出を行うことができない図10のような様式、すなわち横方向に領域を分割しても、縦方向に領域を分割しても、記入枠が領域の境界によって分割されてしまう様式であっても、第2実施形態における画像処理装置では、水平方向、垂直方向のそれぞれについての特徴を抽出し、それぞれの方向でマッチング処理を実行することにより記入枠(領域)の抽出が可能となる。
(第3実施形態)
以下、図面を参照して本発明の第3実施形態について説明する。
第3実施形態では、画像処理装置を文字認識装置として使用する場合について説明する。
図12は第3実施形態における文字認識装置の機能構成を表すブロック図である。
第3実施形態における文字認識装置は、入力画像に対するノイズ除去や二値化、拡大縮小、回転等の前処理により前処理済み画像を生成する前処理手段21と、処理対象の帳票の様式について定められた分割位置の前処理済み画像上での位置の候補を境界候補として抽出する境界候補抽出手段22と、境界候補の対を両端とする領域候補の各々についての特徴量を算出する領域特徴抽出手段23と、様式上の領域の系列から抽出した特徴量のパターンと様式上の領域に対応する前処理済み画像上での領域候補の系列から抽出した特徴量のパターンの距離が小さくなるように、様式上での境界と前処理済み画像上での境界候補のマッチングをとることにより領域候補を選択するマッチング手段24と、マッチング手段24により選択された領域候補から記入枠を抽出する記入枠抽出手段26と、記入枠内に記入された文字を認識し、文字コードの列に変換する記入枠認識手段29とから構成されている。
すなわち、第3実施形態の文字認識装置は、第1実施形態における画像処理装置に記入枠認識手段29が追加された構成を有する。前処理手段21、境界候補抽出手段22、領域特徴抽出手段23、マッチング手段24、記入枠抽出手段26は、第1実施形態と同じ処理を実行するものとして詳細な説明を省略する。
第3実施形態の文字認識装置は、基本的には第1実施形態(図5に示すフローチャート)と同様の流れで処理を実行するものとし、同一の処理部分(ステップA1〜A6)については説明を省略する。第3実施形態は、ステップA7に相当する処理が追加されている。
記入枠認識手段29は、記入枠抽出手段26によって抽出された記入枠内に記入された文字を認識して文字コードの列に変換する(図5、ステップA7)。
記入枠内に記入された文字の認識は、例えば、記入枠内の画像に対してラベリングを行い黒画素の連結領域として個別の文字毎の文字画像を抽出し、文字画像に対して複合類似度法に基づくクラス分類を行う事によって文字種を特定し、文字種に対応する文字コードを、文字画像に外接する矩形の中心の横座標に関して昇順で並べた系列を認識結果として出力することによって可能である。ただし、記入枠内の文字の認識方法にとしては、前記の方法に限らずどのような方法を用いても良い。
このようにして、第3実施形態の文字認識装置では、第1実施形態と同様の処理によって抽出された記入枠の位置をもとに、記入枠内の文字について文字認識することができるので、記入枠毎に確実に分類された認識結果を出力することができる。
(第4実施形態)
以下、図面を参照して本発明の第4実施形態について説明する。
第4実施形態では、第3実施形態と同様に、画像処理装置を文字認識装置として使用する場合について説明する。
図13は、第4実施形態における文字認識装置の機能構成を表すブロック図である。
第4実施形態における文字認識装置は、入力画像に対するノイズ除去や二値化、拡大縮小、回転等の前処理により前処理済み画像を生成する前処理手段21と、処理対象の帳票の様式について定められた水平方向の分割位置の前処理済み画像上での位置として水平方向の境界候補を抽出する水平方向境界候補抽出手段22aと、処理対象の帳票の様式について定められた垂直方向の分割位置の前処理済み画像上での位置として垂直方向の境界候補を抽出する垂直方向境界候補抽出手段22bと、水平方向の境界候補の対を両端とする水平方向の領域候補の各々についての特徴量を算出する水平方向領域特徴抽出手段23aと、垂直方向の境界候補の対を両端とする垂直方向の領域候補の各々についての特徴量を算出する垂直方向領域特徴抽出手段23bと、処理対象の帳票の様式について予め定められた水平方向の参照パターンと水平方向の領域候補から抽出した特徴量のパターンの距離が小さくなるように水平方向の参照パターンと水平方向の領域候補をマッチングして水平方向の領域候補を選択する水平方向マッチング手段24aと、処理対象の帳票の様式について予め定められた垂直方向の参照パターンと垂直方向の領域候補から抽出した特徴量のパターンの距離が小さくなるように垂直方向の参照パターンと垂直方向の領域候補をマッチングして垂直方向の領域候補を選択する垂直方向マッチング手段24bと、水平方向マッチング手段24aで選択した水平方向の境界候補及び垂直方向マッチング手段24bで選択した垂直方向の境界候補の座標を用いて、様式上で定められた矩形領域の座標を求める領域抽出手段28と、領域抽出手段28で求めた矩形領域から記入枠を抽出する記入枠抽出手段26と、記入枠内に記入された文字を認識し、文字コードの列に変換する記入枠認識手段29とから構成されている。
すなわち、第4実施形態の文字認識装置は、第2実施形態における画像処理装置に記入枠認識手段29が追加された構成を有する。その他の機能については、第2実施形態と同じ処理を実行するものとして詳細な説明を省略する。
第4実施形態の文字認識装置は、基本的には第1実施形態(図5に示すフローチャート)と同様の流れで処理を実行するものとし、同一の処理部分(ステップA1〜A6)については説明を省略する。第4実施形態は、第3実施形態と同様に、ステップA7に相当する処理が追加されている。
記入枠認識手段29は、記入枠抽出手段26によって抽出された記入枠内に記入された文字を認識して文字コードの列に変換する(図5、ステップA7)。文字認識処理の方法についても、第3実施形態と同様にして実行することができる。
このようにして、第4実施形態の文字認識装置では、図11に示すような様式の帳票の記入枠内に記入された文字についても、第3実施形態と同様の処理によって抽出された記入枠の位置をもとに、記入枠内の文字について文字認識することができるので、記入枠毎に確実に分類された認識結果を出力することができる。
なお、前述した説明では、帳票の様式において設けられる領域は、垂直及び水平方向の罫線(記入枠)によって区切られているものとしたが、その他の形態によって区分されていても良い。例えば、領域が所定の間隔をもった空白領域により区分されていたり、帳票の外周辺近傍に設けられた所定の形状を持ったマーカにより区分位置が示されていても良い。すなわち、領域の区分を表すものであれば何れの形態が用いられていても良い。
また、本発明は、前述した実施形態に限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で種々に変形することが可能である。また、前述した実施形態で実行される機能は可能な限り適宜組み合わせて実施しても良い。前述した実施形態には種々の段階の発明が含まれており、開示される複数の構成要件における適宜の組み合わせにより種々の発明が抽出され得る。例えば、実施形態に示される全構成要件から幾つかの構成要件が削除されても、効果が得られるので有れば、この構成要件が削除された構成が発明として抽出され得る。
また、前述した各実施形態において記載した処理は、コンピュータに実行させることのできる画像処理(文字認識)プログラムとして、例えば磁気ディスク(フレキシブルディスク、ハードディスク等)、光ディスク(CD−ROM、DVD等)、半導体メモリなどの記録媒体に書き込んで各種装置に提供することができる。また、通信媒体により伝送して各種装置に提供することも可能である。画像処理装置(文字認識装置)を実現するコンピュータは、記録媒体に記録された画像処理プログラムを読み込み、または通信媒体を介して画像処理(文字認識)プログラムを受信し、このプログラムによって動作が制御されることにより、上述した処理を実行する。
本発明の実施形態における画像処理装置を実現するシステムの構成を示すブロック図。 図1に示すシステムによって実現される第1実施形態における画像処理装置の機能構成を示すブロック図。 第1実施形態において処理の対象とする帳票の様式の一例を示す図。 第1実施形態において処理の対象とする帳票の様式の一例を示す図。 第1実施形態における動作について説明するためのフローチャート。 図3の様式と図4の帳票のマッチングにおいて動的計画法を用いた場合の様子を示した図。 動的計画法を用いた場合の他の様子を示した図。 第1実施形態における記入枠抽出手段26の詳細な機能構成を示すブロック図。 第2実施形態における画像処理装置の機能構成を示すブロック図。 第2実施形態において本発明で処理の対象とする帳票の様式の一例を示す図。 図10の様式の水平罫線及び垂直罫線による領域への分解の一例を示す図。 第3実施形態における文字認識装置の機能構成を表すブロック図。 第4実施形態における文字認識装置の機能構成を表すブロック図。
符号の説明
10…CPU、12…メモリ、12a…画像処理プログラム、12b…入力画像データ、12c…参照パターンデータ、12d…記入枠抽出結果データ、12e…文字認識結果データ、14…ディスプレイ、15…キーボード、16…ポインティングデバイス、17…スキャナ、18…記憶装置、19…プリンタ、20…入力画像、21…前処理手段、22…境界候補抽出手段、22a…水平方向境界候補抽出手段、22b…垂直方向境界候補抽出手段、23…領域特徴抽出手段、23a…水平方向領域特徴抽出手段、23b…垂直方向領域特徴抽出手段、24…マッチング手段、24a…水平方向マッチング手段、24b…垂直方向マッチング手段、25…参照パターン、25a…水平方向参照パターン、25b…垂直方向参照パターン、26…記入枠抽出手段、27…記入枠抽出結果、28…領域抽出手段、29…記入枠認識手段、30…領域情報、31…領域内境界候補抽出手段、32…部分領域特徴抽出手段、33…領域内マッチング手段、34…領域内参照パターン、35…領域内記入枠抽出手段。

Claims (7)

  1. 処理対象とする帳票の画像中から、帳票の様式について定められた領域の境界位置の候補とする境界候補を抽出する境界候補抽出手段と、
    前記境界候補抽出手段によって抽出された前記境界候補の対を両端とする領域候補の各々について、前記領域候補の境界の両端にそれぞれ接している異なる方向の境界の本数の組からなる特徴量を算出する領域特徴抽出手段と、
    前記領域特徴抽出手段によって算出された前記特徴量のパターンと、帳票の様式上の特徴量の参照パターンとの距離が小さくなるように、前記境界候補と様式上での境界とのマッチングをとることにより領域候補を選択するマッチング手段と、
    前記マッチング手段により選択された領域候補から領域を区分する位置を抽出する領域区分位置抽出手段と
    を具備したことを特徴とする画像処理装置。
  2. 処理対象とする帳票の画像中から、帳票の様式について定められた水平方向の境界候補を抽出する水平方向境界候補抽出手段と、
    処理対象とする帳票の画像中から、帳票の様式について定められた垂直方向の境界候補を抽出する垂直方向境界候補抽出手段と、
    前記水平方向境界候補抽出手段により抽出された水平方向の境界候補の対を両端とする水平方向の第1の領域候補の各々について、前記第1の領域候補の境界の両端にそれぞれ接している異なる方向の境界の本数の組からなる第1の特徴量を算出する水平方向領域特徴抽出手段と、
    前記垂直方向境界候補抽出手段により抽出された垂直方向の境界候補の対を両端とする垂直方向の第2の領域候補の各々について、前記第2の領域候補の境界の両端にそれぞれ接している異なる方向の境界の本数の組からなる第2の特徴量を算出する垂直方向領域特徴抽出手段と、
    前記水平方向領域特徴抽出手段により算出された前記第1の特徴量のパターンと、帳票の様式について予め定められた水平方向の参照パターンとの距離が小さくなるように、水平方向の領域候補と水平方向の参照パターンとをマッチングして水平方向の領域候補を選択する水平方向マッチング手段と、
    前記垂直方向領域特徴抽出手段により算出された前記第2の特徴量のパターンと、帳票の様式について予め定められた垂直方向の参照パターンとの距離が小さくなるように、垂直方向の領域候補と垂直方向の参照パターンとをマッチングして垂直方向の領域候補を選択する垂直方向マッチング手段と、
    前記水平方向マッチング手段により選択された水平方向の領域候補に対応する境界候補、及び前記垂直方向マッチング手段により選択された垂直方向の領域候補に対応する境界候補を用いて矩形領域を求める領域抽出手段と、
    前記領域抽出手段で求めた矩形領域から領域を区分する位置を抽出する領域区分位置抽出手段と
    を具備したことを特徴とする画像処理装置。
  3. 前記領域区分位置抽出手段は、領域を区分する位置として領域の境界を表す記入枠を抽出する記入枠抽出手段を有することを特徴とする請求項1または請求項2記載の画像処理装置。
  4. 前記記入枠抽出手段により抽出された前記記入枠内に記入された文字を認識し、文字コードの列に変換する記入枠認識手段を具備したことを特徴とする請求項3記載の画像処理装置。
  5. 前記領域区分位置抽出手段は、
    前記マッチング手段により選択された領域候補内から部分領域の境界位置の候補とする領域内境界候補を抽出する領域内境界候補抽出手段と、
    前記領域内境界候補抽出手段によって抽出された前記領域内境界候補の対を両端とする領域候補の各々について特徴量を算出する部分領域特徴抽出手段と、
    前記部分領域特徴抽出手段によって算出された特徴量のパターンと、帳票の様式上の部分領域の特徴量の参照パターンとの距離が小さくなるように、前記領域内境界候補と様式上での境界とのマッチングをとることにより部分領域候補を選択する領域内マッチング手段と、
    前記領域内マッチング手段により選択された部分領域候補から部分領域を区分する位置を抽出する部分領域区分位置抽出手段とを具備したことを特徴とする請求項1記載の画像処理装置。
  6. コンピュータを、
    処理対象とする帳票の画像中から、帳票の様式について定められた領域の境界位置の候補とする境界候補を抽出する境界候補抽出手段と、
    前記境界候補抽出手段によって抽出された前記境界候補の対を両端とする領域候補の各々について、前記領域候補の境界の両端にそれぞれ接している異なる方向の境界の本数の組からなる特徴量を算出する領域特徴抽出手段と、
    前記領域特徴抽出手段によって算出された前記特徴量のパターンと、帳票の様式上の特徴量の参照パターンとの距離が小さくなるように、前記境界候補と様式上での境界とのマッチングをとることにより領域候補を選択するマッチング手段と、
    前記マッチング手段により選択された領域候補から領域を区分する位置を抽出する領域区分位置抽出手段として機能させるための画像処理プログラム。
  7. コンピュータを、
    処理対象とする帳票の画像中から、帳票の様式について定められた水平方向の境界候補を抽出する水平方向境界候補抽出手段と、
    処理対象とする帳票の画像中から、帳票の様式について定められた垂直方向の境界候補を抽出する垂直方向境界候補抽出手段と、
    前記水平方向境界候補抽出手段により抽出された水平方向の境界候補の対を両端とする水平方向の第1の領域候補の各々について、前記第1の領域候補の境界の両端にそれぞれ接している異なる方向の境界の本数の組からなる特徴量を算出する水平方向領域特徴抽出手段と、
    前記垂直方向境界候補抽出手段により抽出された垂直方向の境界候補の対を両端とする垂直方向の第2の領域候補の各々について、前記第2の領域候補の境界の両端にそれぞれ接している異なる方向の境界の本数の組からなる第2の特徴量を算出する垂直方向領域特徴抽出手段と、
    前記水平方向領域特徴抽出手段により算出された前記第1の特徴量のパターンと、帳票の様式について予め定められた水平方向の参照パターンとの距離が小さくなるように、水平方向の領域候補と水平方向の参照パターンとをマッチングして水平方向の領域候補を選択する水平方向マッチング手段と、
    前記垂直方向領域特徴抽出手段により算出された前記第2の特徴量のパターンと、帳票の様式について予め定められた垂直方向の参照パターンとの距離が小さくなるように、垂直方向の領域候補と垂直方向の参照パターンとをマッチングして垂直方向の領域候補を選択する垂直方向マッチング手段と、
    前記水平方向マッチング手段により選択された水平方向の領域候補に対応する境界候補、及び前記垂直方向マッチング手段により選択された垂直方向の領域候補に対応する境界候補を用いて矩形領域を求める領域抽出手段と、
    前記領域抽出手段で求めた矩形領域から領域を区分する位置を抽出する領域区分位置抽出手段として機能させるための画像処理プログラム。
JP2003306990A 2003-08-29 2003-08-29 画像処理装置、画像処理プログラム Expired - Fee Related JP4153850B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003306990A JP4153850B2 (ja) 2003-08-29 2003-08-29 画像処理装置、画像処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003306990A JP4153850B2 (ja) 2003-08-29 2003-08-29 画像処理装置、画像処理プログラム

Publications (2)

Publication Number Publication Date
JP2005078306A JP2005078306A (ja) 2005-03-24
JP4153850B2 true JP4153850B2 (ja) 2008-09-24

Family

ID=34409918

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003306990A Expired - Fee Related JP4153850B2 (ja) 2003-08-29 2003-08-29 画像処理装置、画像処理プログラム

Country Status (1)

Country Link
JP (1) JP4153850B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5062884B2 (ja) * 2007-08-24 2012-10-31 株式会社リコー 画像検索装置、画像検索方法及びプログラム
JP7283756B2 (ja) 2020-05-12 2023-05-30 株式会社ミラボ 情報処理装置、及びプログラム

Also Published As

Publication number Publication date
JP2005078306A (ja) 2005-03-24

Similar Documents

Publication Publication Date Title
CN102354363B (zh) 高反光柱面金属上的二维条码图像识别方法
JP5854802B2 (ja) 画像処理装置、画像処理方法、及びコンピュータプログラム
JP5387193B2 (ja) 画像処理システム、画像処理装置およびプログラム
KR101235226B1 (ko) 화상 처리 장치, 화상 처리 방법 및 기록 매체
JP5321109B2 (ja) 情報処理装置及び情報処理プログラム
US7680329B2 (en) Character recognition apparatus and character recognition method
JP2016181057A (ja) 画像処理装置、画像処理方法及び画像処理プログラム
JP2017161969A (ja) 文字認識装置、方法およびプログラム
US20020051574A1 (en) Character recognition method, program and recording medium
JP2009065640A (ja) 画像作成装置、画像作成方法、画像作成プログラム、および画像作成プログラムを記録したコンピュータ読取り可能な記録媒体
JP4153850B2 (ja) 画像処理装置、画像処理プログラム
JP4543675B2 (ja) 文字・図形の認識方法
JP5619111B2 (ja) 画像判定装置およびプログラム
JP2008113145A (ja) 画像処理装置及び画像処理プログラム
JP2000353233A (ja) 地図データ印刷システムと方法およびその処理プログラムを記録した記録媒体
JP2008269131A (ja) 画像処理装置及び画像処理プログラム
JP7034823B2 (ja) 画像処理プログラム、画像処理方法、及び画像処理装置
JP2008135857A (ja) 画像処理装置及び画像処理プログラム
JP4792117B2 (ja) 文書画像処理装置、文書画像処理方法および文書画像処理プログラム
JP6950436B2 (ja) 画像キャプチャ用コンピュータプログラム、画像キャプチャ装置及び画像キャプチャ方法
JPH09288728A (ja) 画像処理装置及びその方法
WO2023042270A1 (ja) 文字認識プログラム、文字認識システム、及び文字認識方法
JP4356995B2 (ja) マーク判定装置、マーク判定の制御方法、プログラム及び記憶媒体
JP5062076B2 (ja) 情報処理装置及び情報処理プログラム
JP6190346B2 (ja) 角印検出プログラム、角印検出方法、および角印検出装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060713

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060718

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060901

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20061212

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080609

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080704

R151 Written notification of patent or utility model registration

Ref document number: 4153850

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110711

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120711

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130711

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees