JP5844698B2 - 文字認識装置 - Google Patents

文字認識装置 Download PDF

Info

Publication number
JP5844698B2
JP5844698B2 JP2012168370A JP2012168370A JP5844698B2 JP 5844698 B2 JP5844698 B2 JP 5844698B2 JP 2012168370 A JP2012168370 A JP 2012168370A JP 2012168370 A JP2012168370 A JP 2012168370A JP 5844698 B2 JP5844698 B2 JP 5844698B2
Authority
JP
Japan
Prior art keywords
image
ruled line
item
character recognition
definition information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012168370A
Other languages
English (en)
Other versions
JP2014026592A (ja
Inventor
浩一 金元
浩一 金元
正典 中林
正典 中林
中村 一夫
一夫 中村
将平 長谷川
将平 長谷川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Frontech Ltd
Original Assignee
Fujitsu Frontech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Frontech Ltd filed Critical Fujitsu Frontech Ltd
Priority to JP2012168370A priority Critical patent/JP5844698B2/ja
Publication of JP2014026592A publication Critical patent/JP2014026592A/ja
Application granted granted Critical
Publication of JP5844698B2 publication Critical patent/JP5844698B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Character Input (AREA)

Description

本発明は、文字認識装置に関し、特に項目の読出し方式に関する。
スキャナによる帳票の読取りは、帳票用紙の外形、例えば端部や端面を基準にして、イメージ(画像)上で各項目の読出し位置が算出されて、各項目の文字認識が行われる。しかし、帳票の外形を基準にする方式では、外形精度が十分に高いことが要求される。そのため、以下に説明するように例えばカメラタイプのスキャナでは、帳票の角部に浮きが発生したりすると、基準位置がずれて、正しく文字認識ができなく場合がある。
図17は、浮きの発生により項目座標の検出にエラーを生じる例を、説明する図である。図17(A)は、浮きのない状態、つまり正常な状態で撮影された帳票80のイメージ(画像)の一部を示すものである。帳票80のイメージは、端部の検出が容易なように、帳票80の周囲が黒背景90になるように処理される。このイメージから帳票80の左上端の端部80aが基準位置として検出される。そして、項目Aを読みだす場合には、項目Aに対応する項目82まで端部80aから予め登録されている距離dに従って、読み出し位置を決めてデータの読み出しが行われる。
図17(C)は、端部が浮いた状態でスキャナの台座54に置かれた帳票80を側面から示すものである。基準となる端部80aがこのように浮いた状態であると、端部80aだけがスキャナのカメラに接近することで、端部80aが他の部分に比べて拡大されて撮影される。図17(B)は、端部80aが浮いた状態で撮影された帳票80のイメージ画像である。端部80a近傍が拡大された結果、基準となる端部80aが、イメージ上で本来の位置より外側に移動してしまうために、イメージ上では端部80aと項目位置82の間隔が、dよりさらにΔdだけ伸びてしまう。項目Aに対して誤った位置で読み出しが行われるために、正しい文字認識ができなくなる。
このような帳票の浮きへの対策の1つとして、撮影される帳票画像の歪の有無を検出して、警告等を行う歪み検出方法が提案されている(特許文献1)。
2007−272572号公報
帳票の項目読出しの基準に帳票の外形を利用する方式では、用紙の裁断精度あるいは用紙に対する印刷の位置精度あるいは帳票の浮き等の影響を大きく受けてしまう。このような影響を受けないようにするために、帳票の外形を基準位置に使用しない読出し方式が求められる。
本願発明は、上記課題に鑑み、帳票の外形に影響を受けることなく、項目の読出しを行うことができる文字認識装置を提供することを目的とする。
上記目的を達成するために、撮影された帳票のイメージに基づき文字認識を行う文字認識装置において、前記帳票の種類を特定する帳票ID及び当該帳票IDの位置を前記イメージから抽出する帳票ID抽出部と、前記抽出した帳票IDに基づき当該帳票に対応する定義情報を、帳票の定義情報が記憶された記憶部から獲得する定義情報獲得部と、前記獲得された定義情報に含まれる罫線情報に基づき、前記イメージから当該帳票の基準罫線を探索する罫線探索部と、前記獲得された定義情報に含まれ前記帳票の外形を基準とする項目座標を帳票IDの位置を基準とする座標に変換するとともに、前記イメージ上での前記基準罫線の位置を用いて前記項目座標を前記イメージに対応して補正する項目座標補正部と、前記項目座標補正部により補正された前記項目座標に基づき、文字認識を行う文字認識部を備え、前記帳票ID抽出部は、前記イメージの帳票IDの位置を、前記帳票IDの文字の中で当該帳票の中央寄りの文字を基準に抽出する。
本発明によれば、帳票の外形に影響を受けることなく、項目の読出しを行うことができる文字認識装置を提供することができる。
本発明を適用した文字認識装置100とそのシステムを説明するための図である。 具体的な帳票80の1例を示す図である。 文字認識装置100の具体的な構成を示す、機能ブロック図である。 帳票ID84と項目82の関係を示す図である。 帳票ID84と基準罫線86の関係を示す図である。 斜行情報算出を説明するための図である。 水平方向と垂直方向のそれぞれの拡縮率の算出を説明する図である。 項目座標補正において、拡縮補正を説明するための図である。 項目座標補正において、斜行補正を説明するための図である。 文字認識処理のメインのフローチャートである。 帳票ID抽出処理のサブルーチンである。 定義情報獲得処理のサブルーチンである。 罫線探索処理のサブルーチンである。 項目座標補正処理のサブルーチンである。 基準罫線86を使用しないで補正する例を説明する図である。 項目の読出し基準に対する帳票80の裁断の影響を説明するイメージの図である。 浮きの発生により項目座標の検出にエラーを生じる例を、説明する図である。
以下、図面に従って本発明の実施形態を説明する。図1は、本発明を適用した文字認識装置100を搭載した端末装置1とその概略システムを説明するための図である。このシステムは、例えば、金融機関の窓口に設置され、顧客が記入した所定の入金や出金の各伝票を読取るためのシステムである。端末装置1には、スキャナ50、操作部60、モニタ70が接続される。
端末装置1は、CPU10、DRAM12、HDD14、IF部18、画像処理部20を有する。端末装置1としては、一般的なパーソナルコンピュータを使用することができる。CPU10は、端末装置1、スキャナ50、操作部60、モニタ70を統括的に制御する制御部である。CPU10は、所定のプログラムを読込んで、操作部60からの指示に基づき、演算や外部制御等および文字認識の各処理を実行する。また、CPU10は、文字認識装置100を有する。スキャナ50による帳票80の読取処理時に、CPU10は、HDD14から文字認識用のプログラムを読込み、文字認識装置100として機能するので、CPU10は文字認識装置100という機能部を有していると便宜的に表現する。
DRAM12は、一時記憶メモリで、スキャナ50で読取ったイメージデータを記憶したり、イメージデータに画像処理を施すためのワーキンングエリアとして用いられる。
HDD14は、保存用メモリで、HDD14には、文字認識用のプログラムを含む各種制御用のプログラムや必要なデータが記憶される。HDD14には、データとして、帳票を読み出すために必要な帳票の定義情報16が記憶される。
定義情報16とは、帳票上の各項目の位置(座標)情報や各項目の文字認識をする上で必要な情報を言い、定義体とも呼ばれる。従って、定義情報16は帳票80の種類ごとに異なっている。定義情報16には、帳票IDに関する定義情報や基準罫線に関する情報が含まれる。帳票IDとは、帳票の種類を示す情報で、帳票80の種類に関わらず、帳票80の一定位置に印刷される。帳票IDの定義情報とは、帳票IDの帳票上の座標(位置)、桁数、など帳票IDを認識するための情報である。基準罫線とは、帳票80撮影時の傾きや拡縮の影響を補正するために用いる基準となる罫線を言い、詳細は、後述する。
図2は、具体的な帳票80の1例である。図2に示す帳票80は、横長タイプの帳票で、銀行で使用される預入れ処理用の帳票である。左上に印刷された「2000」が、帳票ID84である。枠で囲まれ欄が、顧客によって数字や文字が記入される各項目の領域である。顧客によって枠で囲まれ各項目に数字や文字が記入された帳票80がスキャナ50でイメージとして取込まれ、このイメージから、顧客により記入された数字や文字が文字認識される。なお、通常、各枠はドロップアウトカラーである赤または青の色で印刷され、帳票ID84は黒で印刷される。
IF部18は、外部に接続される周辺装置(ここでは、スキャナ50や操作部60)とCPU10とのデータの送受信を行うインターフェース部である。画像処理部20は、CPU10からの指示に基づき、例えば、スキャナ50による帳票80の読取り操作時に表示させる各種操作用の画面を作成し、作成した画面を接続されるモニタ70に表示させるものである。
スキャナ50は、帳票80を撮影するカメラ部52と、撮影される帳票80が載置される台座54を有する。カメラ部52は、スキャナ50の上部に配置され、台座54に載置された帳票80を上から非接触で撮影するよう取付けられる。カメラ部52は、撮影レンズ、撮像素子及び撮像部等を有し、帳票80のデジタル化されたカラーのイメージデータをIF部18に出力する。なお、スキャナ50は、上述のような2次元センサが搭載されたカメラタイプでなく、帳票80を移動させながら読み出すラインセンサのタイプであってもよい。また、スキャナ50は、上述のような帳票80を一枚づつ置いて読取るタイプではなく、帳票を自動送りする自動フィーダーを備えたタイプであってもよい。
操作部60は、例えばマウスやキーボードで、操作者から帳票読取り処理に対する指示が入力され、IF部18を介してCPU10にその指示内容を通知するものである。モニタ70は、例えばLCDパネルで、モニタ70には、帳票80の読取り処理時に、画像処理部20で作成された各種操作用の画面が表示される。また、モニタ70には、スキャナ50で読取られた帳票80の画像あるいは読取った文字が表示されるようにしてもよい。
図3は、文字認識装置100の具体的な構成を示す、機能ブロック図である。図3(A)は、文字認識装置100の全体構成を示す図である。文字認識装置100は、帳票ID抽出部110、定義情報獲得部120、罫線探索部130、項目座標補正部140及び文字認識部150を有する。文字認識装置100の各部は、定義情報16を参照しながら処理を行う。また、図4は帳票ID84と項目82の関係を示す図で、図5は帳票ID84と基準罫線86の関係を示す図である。図4及び図5を参照しながら説明する。
帳票ID抽出部110は、撮影された帳票80のイメージから、帳票ID84を探索し、探索した帳票ID84に対して文字認識を行うものである。上述したように、帳票80の左上端の端部80aを基準とした帳票ID84の位置は、帳票の種類に関わらず一定となっている。図4(A)に示すように、定義情報16に基づく帳票80の端部80aを基準として所定量離れた位置で、帳票ID84(9999)を抽出する。帳票ID84の探索に限り、帳票80の端部80aを利用する。
探索された帳票ID84を基準として以下で各項目を読み出すとともに、帳票IDの具体的な基準位置となるID基準85を帳票ID84から検出する。ID基準85は、帳票ID84の中で、最も中央寄りの数字の外接矩形のセンタとする(図4(B))。帳票ID84「9999」の一番右の四角で囲まれた「9」の中心座標を、ID基準85とする。(図4(A))。帳票ID84の最も中央寄りの数字を基準に用いるのは、中央寄りの数字ほど帳票80の端部の影響を受けづらいからである。図4(C)は、ID基準85を基準として、所定量離れた位置から項目82を読出す様子を示すものである。項目82の基準とする位置は、例えば項目の左上端である。
定義情報獲得部120は、帳票IDの文字認識結果から求められた帳票IDに対応する定義情報を、HDD14に予め帳票ID毎に用意され記憶された定義情報の中から読み出すものである。例えば、帳票80の種類が図2で示した預入れ用帳票であった場合には、預入れ用帳票の定義情報16をHDD14から読み出す。
罫線探索部130は、読み出した定義情報16から、基準罫線に関する情報である罫線情報を抽出し、イメージから基準罫線を探索して、基準罫線に基づき帳票80撮影時の傾きや拡縮率を算出する。図5を参照する。図5(A)は、定義情報16上での、帳票ID84と基準罫線86の位置関係を示すもので、図5(B)は、イメージ上での帳票ID84と基準罫線86を示すものである。
罫線情報は、基準罫線の属性情報で、基準罫線の位置、方向や長さに関する情報である。補正の基準となる基準罫線は、帳票80の中で、補正に利用するに適した罫線が、帳票80の種類ごとに予め選択されて、定義情報16に登録されている。基準罫線としては、一定以上の長さで、線幅が一定以上太く、かつ図5(A)に示すように、帳票ID84から一定以上離れている直線であることが望ましい。また、基準罫線は、複数本、例えば水平方向と垂直方向の2本であってもよい。
図3(B)は、罫線探索部130の具体的な構成を示す図である。罫線探索部130は、罫線検出部132、斜行情報算出部134、拡縮情報算出部136を有する。罫線検出部132は、帳票ID84(具体的はID基準85)を基準にした基準罫線86の位置を算出する。基準罫線86の位置が、定義情報16で、帳票80の端部80aを基準にしている場合には、帳票ID84を基準にした位置に変換する(図5(A))。そして、帳票ID84を基準として算出した基準罫線86の位置に基づきで、図5(B)に示すように、イメージ上で、基準罫線86を検出する。
斜行情報算出部134は、検出した基準罫線86に基づき、イメージ上での帳票80の斜行情報である斜度θを算出する。ここでは、イメージ上の水平垂直軸を基準として、台座54に載置された帳票80の斜度θを算出する。図6は、斜行情報算出を説明するための図で、1点鎖線で示すイメージ上の水平軸92を基準に、基準罫線86の斜度θを算出する。なお、図6では、水平な基準罫線86を例にしたが、基準罫線86が垂直な場合でも、垂直軸に対する傾きを算出することで、斜度θを算出することができる。
拡縮情報算出部136は、定義情報での帳票ID84から基準罫線86までの距離(図5(A))と、イメージ上の帳票ID84から基準罫線86までの距離(図5(B))を対比することにより、イメージの拡縮情報である拡縮率を求める。
また、図7は、水平方向と垂直方向のそれぞれの拡縮率の算出を説明する図である。拡縮情報算出部136は、基準罫線を水平方向と垂直方向の両方に設定し、水平方向の基準罫線86と垂直方向の基準罫線86aまでのそれぞれの距離を対比することで、水平方向と垂直方向の拡縮率をそれぞれ求めるようにしてもよい。本実施形態のような画像取込み部がカメラの場合には、水平方向と垂直方向の両方でそれぞれ拡縮を生じる可能性があるので、両方向の拡縮情報をそれぞれ算出するのが望ましい。また、画像取込み部がラインセンサのような場合には、ライン方向への拡縮は十分に少ないので、ラインに直交する方向のみ拡縮情報を算出すればよい。
項目座標補正部140は、定義情報上で「文字認識項目」の位置を示す座標(以下、項目座標と呼ぶ)を、帳票ID84の位置を基準にした座標(以下、ID座標と呼ぶ)に変換する。図3(C)は、項目座標補正部140の具体的な構成を示す図である。項目座標補正部140は、イメージ座標変換部142、拡縮補正部144、斜行補正部146を有する。図8は、項目座標補正を説明するための図で、図8(A)は、定義情報16上での帳票ID84と項目82の関係を示し、図8(B)はイメージ上での帳票ID84と項目82の関係を示す。イメージ座標変換部142は、定義情報では、帳票80の端部80aが基準となっている項目82の座標を、帳票ID84を基準にしたイメージ座標に変換する。
拡縮補正部144は、拡縮情報算出部136で算出した拡縮率を利用して、項目82の座標の拡縮補正を行う。これにより、図8(B)で示すように、定義情報による項目82の位置を項目82aとし、拡縮補正部144により、例えば水平方向にΔx、垂直方向にΔyそれぞれ移動されて、項目82aから項目82bの位置に補正される。
図9は、項目座標補正の斜行補正について説明するための図である。図9(A)は、イメージ上で帳票80が傾いている場合の例である。上述したように、イメージ上の水平軸92を基準に、基準罫線86の斜度θを算出する。
図9(B)は、定義情報16上での帳票ID84と項目82の関係を示すものである。なお、斜行補正においては、ID基準85が、帳票80の上辺から距離と左辺からの距離が等距離fになる位置に設定されるのが、望ましい。
図9(C)は、イメージ上での補正する様子を示す。斜行補正部146は、斜行情報算出部134で算出した斜度θを利用して、項目82の座標の斜行補正を行う。斜行補正部146により、帳票ID84のID基準85を中心に、項目82がθ度回転されて補正が行われる。
文字認識部150は、項目座標補正部140で補正された各項目のイメージ上の座標で、イメージの一部を切り出して、各項目に対応する文字認識を行うものである。文字認識に必要な手書き/活字・字種(数字、カナ、漢字等)などについては、定義情報16を参照する。
図10〜図14は、これまで説明した帳票の文字認識処理の手順をフローチャートで示すものである。かかる文字認識処理は、CPU10、特に文字認識装置100によって実行される。図10は、文字認識処理のメインのフローチャートである。撮影された帳票80イメージから、帳票ID抽出処理(ステップS10)、定義情報獲得処理(ステップS12)、罫線探索処理(ステップS14)、項目座標補正処理(ステップS16)、文字認識処理(ステップS18)を順番に行う。帳票ID抽出処理、定義情報獲得処理、罫線探索処理、項目座標補正処理の各処理ついて、図11〜図14の各サブルーチンで説明する。ただし、帳票ID抽出処理、定義情報獲得処理、罫線探索処理、項目座標補正処理の各処理は、前述した帳票ID抽出部110、定義情報獲得部120、罫線探索部130及び項目座標補正部140によって実行される機能と同等な内容であるので、重複する部分は省略する。
図11は、帳票ID抽出処理のサブルーチンである。撮影された帳票80のイメージから、帳票ID84の文字認識を行う(ステップS20)。帳票80の端部80aから所定量離れた位置で、帳票ID84を抽出する。帳票ID84の位置は、帳票の種類に関わらず、帳票80の端部80aから一定の位置に印刷され、端部80aからの位置は定義情報16に記載されている。そして、抽出した帳票ID84のイメージに文字認識を行い、帳票ID84の番号を検出し、帳票ID84を特定する。さらに、イメージ上での帳票IDの位置を検出する(ステップS22)。前述のように、帳票ID84の位置として、帳票ID84の最も中央寄りの数字の中心座標をID基準85とする。数字の中心座標は、数字の外接矩形の中心として求められる。
図12は、定義情報獲得処理のサブルーチンである。帳票IDに対応する各定義情報の読出しを行う(ステップS30)。帳票ID毎に予め用意されてHDD14に記憶された定義情報の中から、ステップS20で特定された帳票ID84に対応する定義情報を読み出す。
図13は、罫線探索処理のサブルーチンである。ステップS30で獲得した定義情報16に基づき、イメージから基準罫線を検出する(ステップS40)。基準罫線86の傾きからイメージ上の斜度θを算出する(ステップS42)。イメージ上の水平軸あるいは垂直軸に対する基準罫線86の傾きを計算して、斜度θを算出する。次に、イメージ上の帳票ID84と基準罫線86の距離を算出する(ステップS44)。さらに、定義情報16における帳票ID84と基準罫線86の距離を比較する(ステップS46)。イメージ上の距離と定義情報16における距離を対比して、拡縮率を算出する(ステップS48)。拡縮率の算出に当たっては、図7で示したように、水平と垂直の2本の基準罫線86を利用して、水平および垂直のそれぞれの拡縮率を算出してもよい。なお、ステップS40は罫線検出部132の機能に対応し、ステップS42は斜行情報算出部134の機能に対応し、ステップS44とステップS46とステップS46は、拡縮情報算出部136の機能に対応する。
図14は、項目座標補正処理のサブルーチンである。項目座標を、帳票80の端部80aを基準にした定義情報での座標から、帳票ID84の位置を基準にしたID座標に変換する(ステップS50)。次に、項目のID座標を拡縮補正する(ステップS52)。ステップS48で算出した拡縮率を用いて項目のID座標を拡縮補正する。
さらに、項目のID座標を斜行補正する(ステップS54)。ステップS42で算出した斜度θを用いて項目のID座標を補正する。
そして、変換され補正されたイメージ上での帳票80の各項目82のID座標に基づき、各項目に対応するイメージ部分が抽出され、抽出された画像から文字が認識される(ステップS18)。
図15は、基準罫線86を使用しないで補正する例を説明する図である。これまでの説明では、帳票80のイメージの斜行や拡縮率について、基準罫線86を用いて算出補正する例を示したが、基準罫線86ではなく、印刷された文字を利用しても算出することもできる。
図15(A)は、撮影された帳票80のイメージの1例である。定義情報16には、帳票80の種類に応じて、帳票80に予め印刷された文字の中で、基準となる文字である基準文字88a(ABCD)と基準文字88b(XYZ)が、基準罫線86と共にあるいは基準罫線86に代り設定されている。基準文字88aと基準文字88bの座標情報も定義情報16に含まれる。
基準文字88aは、拡縮率の算出用である。基準文字88aと基準文字88bは、組み合わせて斜度の算出に用いられる。基準文字88aとしては、帳票ID84からある程度離れた位置にある文字が選ばれる。また、基準文字88bは、基準文字88aから水平方向にある程度離れた位置にある文字が選ばれる。
帳票ID84のID基準85と同様に、基準文字88aの位置として基準文字88aのセンタ座標を、イメージ上で算出する。基準文字88aが複数文字の場合には、その中で予め選択された文字がセンタ座標に用いられる。基準文字88bについても同様である。
そして、帳票ID84と基準文字88aの定義情報16の距離と、帳票ID84と基準文字88aのイメージ上の距離を比較して、拡縮率を算出する。図15(A)では、基準文字88aが帳票ID84の下方向に離れた位置にあるので、帳票80の垂直方向の拡縮率を算出することができる。そして、図15(B)に示すように、基準文字88aと基準文字88bを結ぶ線と1点鎖線で示すイメージ上の水平軸92との傾きを算出することで、斜度θを算出することができる。
図16は、項目の読出し基準に対する帳票80の裁断の影響を説明するイメージの図である。項目の読出し基準を、端部80aから帳票ID84に変換することで、裁断の影響を受けなくなることを説明するものである。裁断位置が内側にずれた帳票80bを、破線で示す。図16(A)は、これまでのように帳票80の端部80aを基準として、項目82を決定する場合である。裁断位置が帳票80bのようにずれると、その分だけ項目位置82に対する読出し位置がずれてしまうことは、明らかである。
図16(B)は、本実施形態で説明したように帳票ID84を基準として、項目82を決定する場合である。帳票ID84の抽出でのみ裁断精度の影響を受けるが、具体的な各項目82に対する読出しでは、帳票80の裁断精度の影響を受けないので、項目82の読出し位置がずれてしまうおそれはない。帳票ID84の抽出に関しては、帳票ID84の抽出範囲を広く設定しておくことで対応できる。このように、各項目と同時に印刷される帳票IDを基準に利用することにより、裁断位置のズレ、あるいは用紙に対する印刷位置のズレの影響も受けないようにすることができる。
以上のように、項目82の位置(座標)を帳票ID84の位置を基準にして算出して決定するので、帳票80の外形精度や浮きに影響されずに、正しく項目82の位置を決定することができる。これにより、文字認識の精度が向上する。
以上説明した実施形態により、少なくとも以下の効果が奏せられる。
1)本実施形態では、帳票IDを原点とすることにより、撮影時に帳票の浮きがあってもその影響を受けにくくなり、浮きのないように注意を払わなくても済むので、現場での使い勝手が向上する。
2)帳票端を原点(基準)とする方式では、帳票端から項目までの位置が重要となり、印刷及び裁断において、高い精度が要求されるが、本実施形態では、帳票の裁断精度を緩和することができ、帳票の作成コストの低減につながる。
3)帳票の種類によらず一定の位置に印刷される帳票IDを基準として用いることで、基準位置の検出が容易にできる。
4)帳票の斜行や拡縮補正のための罫線や文字を、帳票の種類に応じて予め選択して定義情報16に登録して、イメージの斜行や拡縮を補正するので、帳票の外形によらずに、イメージの斜行や拡縮を補正することができる。帳票の浮き、あるいは外形が曲がったり歪んでいても、影響を受けづらい。
5)補正のための基準罫線や文字が予め定義情報に登録されているので、補正に適した罫線や文字を、スキャンごと毎回検出する必要がなくなり、補正処理が短時間でできる。
6)本実施形態の方式では、従来の帳票をそのまま使用できるので、投資費用が少なくて済む。
7)帳票用紙に対する相対的な印刷精度も緩和されるので、パソコン用の一般的なプリンタにより作成された帳票でも、使用可能になる。
8)帳票端検出の重要性も低くなくなるので、黒背景の必要もなくなり、黒背景を作成するための台や画像処理が不要になる。
なお、本発明は上述した実施形態そのままに限定されるものではく、実施段階でのその要旨を逸脱しない範囲で構成要素を変形して具体化することができる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成することができる。例えば、実施形態に示される全構成要素を適宜組み合わせても良い。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。このような、発明の趣旨を逸脱しない範囲内において種々の変形や応用が可能であることはもちろんである。
1 端末装置
10 CPU
12 DRAM
14 HDD
16 定義情報
18 IF部
20 画像処理部
50 スキャナ
52 カメラ部
54 台座
60 操作部
70 モニタ
80 帳票
80a 端部
82 項目
84 帳票ID
85 ID基準
86 基準罫線
88 基準文字
90 黒背景
100 文字認識装置
110 帳票ID抽出部
120 定義情報獲得部
130 罫線探索部
132 罫線検出部
134 斜行情報算出部
136 拡縮情報算出部
140 項目座標補正部
142 イメージ座標変換部
144 拡縮補正部
146 斜行補正部
150 文字認識部

Claims (6)

  1. 撮影された帳票のイメージに基づき文字認識を行う文字認識装置において、
    前記帳票の種類を特定する帳票ID及び当該帳票IDの位置を前記イメージから抽出する帳票ID抽出部と、
    前記抽出した帳票IDに基づき当該帳票に対応する定義情報を、帳票の定義情報が記憶された記憶部から獲得する定義情報獲得部と、
    前記獲得された定義情報に含まれる罫線情報に基づき、前記イメージから当該帳票の基準罫線を探索する罫線探索部と、
    前記獲得された定義情報に含まれ前記帳票の外形を基準とする項目座標を帳票IDの位置を基準とする座標に変換するとともに、前記イメージ上での前記基準罫線の位置を用いて前記項目座標を前記イメージに対応して補正する項目座標補正部と、
    前記項目座標補正部により補正された前記項目座標に基づき、文字認識を行う文字認識部を備え、
    前記帳票ID抽出部は、前記イメージの帳票IDの位置を、前記帳票IDの文字の中で当該帳票の中央寄りの文字を基準に抽出する
    ことを特徴とする文字認識装置。
  2. 前記項目座標補正部は、
    前記定義情報における帳票IDと前記基準罫線との距離と、前記イメージにおける帳票IDと前記基準罫線との距離を比較して、前記イメージの拡縮情報を算出する拡縮情報算出部と、
    前記算出された拡縮情報に基づき、前記項目座標に対して拡縮補正を行う拡縮補正部を有する
    ことを特徴とする請求項1に記載の文字認識装置。
  3. 前記項目座標補正部は、
    前記イメージ上での前記基準罫線の傾き情報を算出する斜行情報算出部と
    前記算出された斜行情報に基づき、前記項目座標に対して斜行補正を行う斜行補正部を有する
    ことを特徴とする請求項1に記載の文字認識装置。
  4. 前記罫線探索部は、前記イメージの帳票IDの位置から、前記イメージ上で前記基準罫線を探索する
    ことを特徴とする請求項1に記載の文字認識装置。
  5. 撮影された帳票のイメージに基づき文字認識を行う文字認識方法において、
    前記帳票の種類を特定する帳票ID及び当該帳票IDの位置を前記イメージから抽出する工程と、
    前記抽出した帳票IDに基づき当該帳票に対応する定義情報を、帳票の定義情報が記憶された記憶部から獲得する工程と、
    前記獲得された定義情報に含まれる罫線情報に基づき、前記イメージから当該帳票の基準罫線を探索する工程と、
    前記獲得された定義情報に含まれ前記帳票の外形を基準とする項目座標を帳票IDの位置を基準とする座標に変換する工程と、
    前記イメージ上での前記基準罫線の位置を用いて、前記項目座標を前記イメージに対応して補正する工程と、
    前記補正された項目座標に基づき、文字認識を行う工程を含み、
    前記イメージから抽出する工程は、前記イメージの帳票IDの位置を、前記帳票IDの文字の中で当該帳票の中央寄りの文字を基準に抽出する
    ことを特徴とする文字認識方法
  6. 撮影された帳票のイメージに基づき文字認識を行う文字認識方法をコンピュータに実行させるプログラムにおいて、
    前記帳票の種類を特定する帳票ID及び当該帳票IDの位置を前記イメージから抽出するステップと、
    前記抽出した帳票IDに基づき当該帳票に対応する定義情報を、帳票の定義情報が記憶された記憶部から獲得するステップと、
    前記獲得された定義情報に含まれる罫線情報に基づき、前記イメージから当該帳票の基準罫線を探索するステップと、
    前記獲得された定義情報に含まれ前記帳票の外形を基準とする項目座標を帳票IDの位置を基準とする座標に変換するステップと、
    前記イメージ上での前記基準罫線の位置を用いて、前記項目座標を前記イメージに対応して補正するステップと、
    前記補正された項目座標に基づき、文字認識を行うステップを含み、
    前記イメージから抽出するステップは、前記イメージの帳票IDの位置を、前記帳票IDの文字の中で当該帳票の中央寄りの文字を基準に抽出する
    ことを特徴とするプログラム。
JP2012168370A 2012-07-30 2012-07-30 文字認識装置 Active JP5844698B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012168370A JP5844698B2 (ja) 2012-07-30 2012-07-30 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012168370A JP5844698B2 (ja) 2012-07-30 2012-07-30 文字認識装置

Publications (2)

Publication Number Publication Date
JP2014026592A JP2014026592A (ja) 2014-02-06
JP5844698B2 true JP5844698B2 (ja) 2016-01-20

Family

ID=50200143

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012168370A Active JP5844698B2 (ja) 2012-07-30 2012-07-30 文字認識装置

Country Status (1)

Country Link
JP (1) JP5844698B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6582499B2 (ja) * 2015-03-31 2019-10-02 大日本印刷株式会社 薬剤認証システム、薬剤認証方法、およびプログラム
JP6564136B2 (ja) 2016-05-31 2019-08-21 株式会社Pfu 画像処理装置、画像処理方法、および、プログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0221385A (ja) * 1988-07-11 1990-01-24 Hitachi Ltd プリンタ装置
JPH0488488A (ja) * 1990-07-25 1992-03-23 Nec Corp 光学文字読取装置
JP3031579B2 (ja) * 1991-12-05 2000-04-10 株式会社日立製作所 帳票の文字認識領域指定方法
JPH11143986A (ja) * 1997-10-17 1999-05-28 Internatl Business Mach Corp <Ibm> ビットマップイメージの処理方法及び処理装置、ビットマップイメージの処理を行うイメージ処理プログラムを格納した記憶媒体
JP4594638B2 (ja) * 2004-03-30 2010-12-08 富士通株式会社 媒体処理装置,媒体処理方法,媒体画像処理装置,媒体画像処理プログラムおよび帳票

Also Published As

Publication number Publication date
JP2014026592A (ja) 2014-02-06

Similar Documents

Publication Publication Date Title
US7999657B2 (en) Image registration method for image comparison and document authentication
US8155425B1 (en) Automated check detection and image cropping
JP5616308B2 (ja) 文字の形状特徴を使用した文字比較による文書改変検知方法
JP5387193B2 (ja) 画像処理システム、画像処理装置およびプログラム
US20200372248A1 (en) Certificate recognition method and apparatus, electronic device, and computer-readable storage medium
JP2012243307A (ja) 入力画像における歪を検出する方法、入力画像における歪を検出する装置およびコンピューター読み取り可能な媒体
CN112183038A (zh) 一种表格识别套打方法、计算机设备及计算机可读存储介质
US10970845B2 (en) Image processing apparatus, image processing method, and storage medium
JP4395188B2 (ja) 文書画像認識装置および文書画像認識プログラムの記憶媒体
JP6665595B2 (ja) 文字認識装置、方法およびプログラム
US10643097B2 (en) Image processing apparatuses and non-transitory computer readable medium
US7079265B2 (en) Distortion correction device for correcting imaged object to produce plane image without distortion
JP5844698B2 (ja) 文字認識装置
JP4013060B2 (ja) 画像補正方法および画像補正装置
JP5940615B2 (ja) 携帯端末装置用のスキューロジック文字認識方法、プログラム及び携帯端末装置
CN113658039A (zh) 一种药瓶标签图像的拼接顺序确定方法
US9110926B1 (en) Skew detection for vertical text
JP3006466B2 (ja) 文字入力装置
JP2017199288A (ja) 画像処理装置、画像処理方法及びプログラム
JP2006229685A (ja) 帳票歪み判定装置
JP4696239B2 (ja) 文字列の傾斜補正方法及び装置
JP3223878B2 (ja) 文字列照合装置、方法及び記録媒体
WO2022024835A1 (ja) 画像処理システム、画像処理方法、画像処理プログラム、画像処理サーバ、及び学習モデル
JP6878739B1 (ja) シリアルナンバー等文字列抽出サーバ、方法及びプログラム
JP4635845B2 (ja) Ocr装置、フォームアウト方法及びフォームアウトプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140903

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150421

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150428

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150625

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151117

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151119

R150 Certificate of patent or registration of utility model

Ref document number: 5844698

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150