JP4194301B2 - 文字認識システムおよび文字認識プログラム - Google Patents
文字認識システムおよび文字認識プログラム Download PDFInfo
- Publication number
- JP4194301B2 JP4194301B2 JP2002159690A JP2002159690A JP4194301B2 JP 4194301 B2 JP4194301 B2 JP 4194301B2 JP 2002159690 A JP2002159690 A JP 2002159690A JP 2002159690 A JP2002159690 A JP 2002159690A JP 4194301 B2 JP4194301 B2 JP 4194301B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- edge
- character recognition
- upper side
- detected
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Character Input (AREA)
Description
【発明の属する技術分野】
本発明は、帳票の文字認識を行う文字認識システムおよび文字認識プログラムに関するものである。
【0002】
【従来の技術】
従来、帳票をスキャナにて読み取ってイメージをディスプレイ上に表示すると、帳票部分の文字が読み取られた部分と、帳票のない部分も白画像として表示されてしまうので、オペレータが文字認識する範囲を枠で囲み、当該枠内をスキャナーで読み取って文字認識ソフトに渡して当該帳票の文字認識を行うようにしていた。
【0003】
また、帳票原点を決定するため、3点マークと呼ばれるマークを帳票の左上、右上、左下に印刷する必要があった。
【0004】
【発明が解決しようとする課題】
このため、帳票の文字の印刷されていない部分と、帳票のない背景部分とが共に白画像となってしまうため、上述したようにオペレータが帳票に相当する範囲を枠で囲んで当該枠の内部をスキャナで読み取って文字認識するという面倒な作業が必要となってしまうなどの問題があった。
【0005】
また、帳票原点を決定するため、3点マークと呼ばれるマークを帳票の左上、右上、左下に印刷する必要があり、帳票の制約が生じるという問題もあった。
【0006】
本発明は、これらの問題を解決するため、帳票をイメージスキャナで読み取ったときにエッジ強調およびコントラスト変更して当該帳票の各端の部分を検出あるいは推定して帳票の外側を黒背景にした帳票画像を自動生成し、当該黒背景の帳票画像が黒から白に変化する点を基準点として文字認識を行い、帳票から外側を黒背景とした帳票画像を自動生成して文字認識を簡易かつ精度良好に実現することを目的としている。
【0007】
【課題を解決するための手段】
図1を参照して課題を解決するための手段を説明する。
【0008】
図1において、処理装置1は、プログラムに従い各種処理を実行するものであって、ここでは、エッジ強調処理手段13、コントラスト変更手段14、帳票端検出手段15、黒背景付加手段16、文字認識手段17などから構成されるものである。
【0009】
エッジ強調処理手段13は、画像のエッジを強調するものである。
コントラスト変更手段14は、画像のコントラストを変更するものである。
【0010】
黒背景付加手段16は、画像中の帳票の外側の部分に黒背景を付加するものである。
【0011】
文字認識手段17は、画像中の黒画素から白画素に変化して点を基点(原点)に、文字認識を行うものである。
【0012】
イメージスキャナ3は、帳票2を読み取って画像を生成するものである。
次に、動作を説明する。
【0013】
イメージスキャナ3によって帳票3を読み取って画像を生成し、エッジ強調処理手段13が当該画像中のエッジを強調し、帳票検出手段15が画像中から帳票の端(例えば上、下、左、右の各端)を検出し、黒背景付加手段16が画像中の帳票の画像の外側に黒背景を付加し、文字認識手段17が黒背景の付加された画像中で黒画素から白画素に変化した点を基点(原点)に、文字認識を行うようにしている。
【0014】
この際、エッジ強調して帳票の用紙端が検出できないときに、コントラスト変更手段14が画像のコントラストおよび必要に応じて明るさを増減して帳票(用紙)の端を検出することを繰り返して用紙端を検出するようにしている。
【0015】
また、帳票端検出手段15が画像上で帳票(用紙)端の上、下、左、右のうちのいずれか1つあるいは2つが検出できなかったときに他の検出できた位置から当該検出できなかった位置を、帳票のサイズから推定するようにしている。
【0016】
従って、帳票をイメージスキャナで読み取ったときにエッジ強調およびコントラスト変更して当該帳票の各端の部分を検出あるいは推定して帳票の外側を黒背景にした帳票画像を自動生成し、当該黒背景の帳票画像が黒から白に変化する点を基準点として文字認識を行うことにより、帳票から外側を黒背景とした帳票画像を自動生成して文字認識を簡易かつ精度良好に実現することが可能となる。
【0017】
【発明の実施の形態】
次に、図1から図5を用いて本発明の実施の形態および動作を順次詳細に説明する。
【0018】
図1は、本発明のシステム構成図を示す。
図1において、処理装置1は、プログラムに従い各種処理を実行するものであって、11ないし18などから構成されるものである。
【0019】
イメージスキャナ制御手段11は、イメージスキャナ3を制御して帳票2から画像を読み取るものである。
【0020】
画像格納手段12は、イメージスキャナ制御手段11によってイメージスキャナ3から読み取られた帳票の画像を一時的に格納するものである。
【0021】
エッジ強調処理手段13は、帳票から読み取った画像中の帳票画像のエッジを強調して当該帳票の用紙端(エッジ)を検出し易くするものである。
【0022】
コントラスト変更手段14は、帳票から読み取った画像中の帳票の用紙端(エッジ)のコントラストを変更および必要に応じて明るさを変更して当該用紙端(エッジ)を検出し易くするものである。
【0023】
帳票端検出手段15は、エッジ強調処理手段13およびコントラスト変更手段14によってエッジ強調、コントラスト変更した後の画像から帳票の用紙端の位置(上、下、右、左の端の位置)を検出するものである。
【0024】
黒背景付加手段16は、帳票端検出手段15によって検出された画像中の帳票の用紙の外側の部分に、黒背景を付加した画像を生成するものである。
【0025】
文字認識手段17は、黒背景を付加した画像中で、黒画素から白画素に変化する位置を基点として、周知の手法に従い、文字認識を行うものである(図5参照)。
【0026】
認識結果表示手段18は、文字認識手段17で文字認識された認識結果を、ディスプレイ4上に表示するものである。
【0027】
帳票2は、文字認識の対象の帳票である。
イメージスキャナ3は、帳票2の画像を読み取るものである。
【0028】
ディスプレイ4は、認識結果を表示するものである。
次に、図2のフローチャートの順番に従い、図1の構成の動作を詳細に説明する。
【0029】
図2は、本発明の動作説明フローチャートを示す。
図2において、S1は、読み取り画像を保存する。これは、帳票2をイメージスキャナ3で読み取って生成した画像を作業域に保存する。
【0030】
S2は、エッジ強調する。この際、S3でコントラスト変更を行い、画像中の帳票の用紙端が検出し易くする(図3を用いて後述する)。
【0031】
S4は、帳票端を検出する。これは、S2でエッジ強調、S3でコントラスト変更し、帳票の用紙の端(エッジ部分)の位置(用紙の上、下、左、右の位置)をそれぞれ検出する。尚、用紙の端の上下左右のうち1つあるいは2つが検出できないときは他の検出できた位置から推定する。
【0032】
S5は、黒背景を付加する。これは、S4で検出した帳票の用紙の外側に、黒背景を付加した画像を生成する。
【0033】
S6は、文字認識する。これは、S5で黒背景の付加された画像中で、黒画素から白画素に変化する点を基点にし、周知の文字認識を行う(図5参照)。そして、文字認識した結果を、文字認識データとして出力する。
【0034】
以上によって、帳票2からイメージスキャナ3で読み取った画像のエッジ強調、コントラスト変更して帳票の端(エッジ)を検出し、当該検出した帳票の端の外側に黒背景を付加した画像を生成し、当該生成した画像中で黒画素から白画素に変わる点を基点にして、帳票上の文字認識することが可能となる。
【0035】
図4は、本発明の詳細フローチャートを示す。
図4において、S11は、コントラスト初期設定する。これは、帳票からイメージスキャナ3で読み取るときのコントラストをデフォルトの初期設定値に設定する。
【0036】
S12は、画像読み取りする。これは、S11で初期設定値のコントラスト、あるいはS21でコントラスト値変更された後のコントラストで、イメージスキャナ3で帳票2の画像を読み取る。
【0037】
S13は、エッジ強調処理を行う。これはS12で読み取った画像について、帳票のエッジ(用紙端)を強調する処理を行う。
【0038】
S14は、上辺、左辺、右辺、下辺を検出する。
S15は、上辺、左辺が検出できたか判別する。YESの場合には、S16で検出した帳票端の上辺、左辺の交点を検出し、S17に進む。一方、S15のNOの場合には、上辺、左辺が検出できなかったのでS21でコントラスト値を変更してS12以降を繰り返す。
【0039】
S17は、交点が画像内にあるか判別する。これは、S15のYESで検出した帳票の上辺と左辺との交点が、画像内にある、即ち、帳票の上辺と左辺の交点がイメージスキャナ3で読み取った画像内に含まれるか判別する。YESの場合には、S18で黒背景付加(画像中の帳票の外側に黒背景を付加)した画像を生成し、S19で文字認識(画像中で黒画素から白画素に変化した点を基点として、周知の文字認識)を行い、S20に進む。一方、S17のNOの場合には、交点が画像内にない、即ち、画像内に帳票の画像が全部含まれていないと判明し、帳票の端(エッジ)の検出位置が誤検出と判明したので、S21でコントラスト値変更し、S12以降を繰り返す。
【0040】
S20は、文字認識エラーか判別する。これは、S19の文字認識の結果、エラーか判別する。YESの場合には、画像中の帳票のエッジ(端)の誤検出と判明したので、S21でコントラスト値変更してS12以降を繰り返す。一方、S20のNOの場合には、文字認識エラーが発生しなく、正常に文字認識されたと判明したので、終了する。
【0041】
以上によって、イメージスキャナ3で帳票2の画像を読み取るコントラストを変更して当該帳票2から読み取った画像についてエッジ強調して画像中から帳票のエッジ(端)を検出し、上辺と左辺の交点が画像内にあるときに正常な帳票の辺の検出ができたと判定し、当該検出した帳票の外側に黒背景を付加した画像を生成し、当該画像上で黒画素から白画素に変化する点を基点にして文字認識することにより、正確かつ精度良好に文字認識することが可能となる。
【0042】
図4および図5は、本発明の説明図を示す。
図4の(a)は、画像を読み込む。これは、既述した図1のイメージスキャナ3を制御して帳票2から読み取った画像を取り込む。ここでは、中央の矩形の部分が帳票2から読み取った画像であり、その外側が帳票の外側の部分に配置されていたイメージスキャナ3の読み取り台から読み取った白背景の画像である。
【0043】
図4の(b)は、エッジ強調し、帳票端を強調した様子を示す。ここでは、帳票端は、帳票2から読み取った画像の端の部分を強調したものである。
【0044】
図4の(c)は、帳票端を検出して、黒背景を付加した様子を示す。ここでは、図4の(b)で検出した帳票端の外側を黒背景を付加した画像を示す。
【0045】
図5の(d)は、画像端からスキャンして黒から白に切り替わる位置を検出し、切り替わった位置を帳票端とした様子を示す。ここでは、上辺および左辺からそれぞれスキャンして黒から白に切り替わった位置を、帳票端とそれぞれ決定する。
【0046】
図5の(e)は、帳票上で上辺と左辺が交差する位置(帳票原点)を抽出する様子を示す。帳票原点(帳票基点)は、画像上で帳票の上辺と左辺が交差する位置である。画像原点(画像基点)は、画像上で左上の位置である。
【0047】
図5の(f)は、OCR定義体に従い、画像原点からのX方向、Y方向の位置をそれぞれ算出して文字位置を決定し、文字認識する様子を示す。これは、図5の(g)に定義したOCR定義体中の
・例えば項目名Aは、帳票原点からX座標”30”、Y座標”20”の位置に、X方向サイズ”5”、Y方向サイズ”1”の領域に当該項目名Aの文字列が記載されていると判明するので、
これを画像原点からの値に変換し、図5の(f)の画像原点からの当該変換後の値の領域から項目名Aの文字認識を、周知の手法で行う。
【0048】
図5の(g)は、OCR定義体の例を示す。ここでは、帳票2上に記載されている文字列は、項目名に対応づけて帳票原点からのX座標、Y座標、X座標からのX方向サイズ、Y座標からのY方向サイズがそれぞれ定義されている。
【0049】
(付記1)
帳票の文字認識を行う文字認識システムにおいて、
帳票からイメージスキャナを用いて画像を読み取る手段と、
前記読み取った画像について、エッジ強調して帳票の用紙端を検出する手段と、
前記検出した帳票の用紙端の外側を黒画像とした帳票画像を生成する手段と、前記帳票画像の外側の黒画像から白画像に変化した位置をもとに文字認識する手段と
を備えたことを特徴とする文字認識システム。
【0050】
(付記2)
前記エッジ強調して帳票の用紙端が検出できないときに、画像のコントラストおよび必要に応じて明るさを増減して用紙端を検出することを繰り返して当該用紙端を検出する手段を備えたことを特徴とする付記1記載の文字認識システム。
【0051】
(付記3)
前記用紙端の上、下、左、右のうちのいずれか1つあるいは2つが検出できなかったときに他の検出できた位置から当該検出できなかった位置を、帳票のサイズから推定する手段を備えたことを特徴とする付記1あるいは付記2記載の文字認識システム。
【0052】
(付記4)
帳票の文字認識を行う文字認識プログラムにおいて、
帳票からイメージスキャナを用いて画像を読み取る手段と、
前記イメージスキャナで前記帳票を読み取った画像について、エッジ強調して帳票の用紙端を検出する手段と、
前記検出した帳票の用紙端の外側を黒画像とした帳票画像を生成する手段と、前記帳票画像の外側の黒画像から白画像に変化した位置をもとに文字認識する手段と
してコンピュータに機能させるための文字認識プログラム。
【0053】
【発明の効果】
以上説明したように、本発明によれば、帳票2をイメージスキャナ3で読み取ったときにエッジ強調および必要に応じてコントラスト変更して当該帳票2の各端の部分を検出あるいは推定して帳票2の外側を黒背景にした帳票画像を自動生成し、当該黒背景の帳票画像が黒から白に変化する点を基準点(帳票原点)として文字認識を行う構成を採用しているため、帳票2から外側を黒背景とした帳票画像を自動生成して文字認識を簡易かつ精度良好に実現することが可能となる。
【図面の簡単な説明】
【図1】本発明のシステム構成図である。
【図2】本発明の動作説明フローチャートである。
【図3】本発明の詳細フローチャートである。
【図4】本発明の説明図(その1)である。
【図5】本発明の説明図(その2)である。
【符号の説明】
1:処理装置
11:イメージスキャナ制御手段
12:画像格納手段
13:エッジ強調処理手段
14:コントラスト変更手段
15:帳票端検出手段
16:黒背景付加手段
17:文字認識手段
18:認識結果表示手段
2:帳票
3:イメージスキャナ
4:ディスプレイ
Claims (4)
- 帳票の文字認識を行う文字認識システムにおいて、
帳票からイメージスキャナを用いて当該帳票の全体を含む画像を読み取る手段と、
前記読み取った前記帳票の全体を含む画像について、エッジ強調して帳票の上辺、左辺、下辺、および右辺の用紙端を検出する手段と、
前記検出した用紙端の上辺、左辺、下辺、および右辺について隣接するものの交点が前記読み取った画像内に含まれるときに正しいと判定、一方、含まれないときに誤検出と判定する手段と、
前記正しいと判定された帳票の用紙端の上辺、左辺、下辺、および上辺の外側を黒画素とした帳票画像を生成する手段と、
前記帳票画像の外側の黒画素から白画素に変化する用紙端の上辺、左辺、下辺、および上辺について隣接するものの交点を基点として文字認識する手段とを備えたことを特徴とする文字認識システム。 - 前記誤検出と判定された場合に、画像のコントラスト値および明るさのいずれか一方あるいは両者を増減して用紙端を検出することを繰り返して当該用紙端を検出する手段を備えたことを特徴とする請求項1記載の文字認識システム。
- 前記帳票の用紙端の上辺、左辺、下辺、および右辺のいずれかが検出されなかった場合には、当該帳票のサイズをもとに他のものから検出できなかった用紙端を推定する手段を備えたことを特徴とする請求項1あるいは請求項2記載の文字認識システム。
- 帳票の文字認識を行う文字認識プログラムにおいて、
帳票からイメージスキャナを用いて当該帳票の全体を含む画像を読み取る手段と、
前記読み取った前記帳票の全体を含む画像について、エッジ強調して帳票の上辺、左辺、下辺、および右辺の用紙端を検出する手段と、
前記検出した用紙端の上辺、左辺、下辺、および右辺について隣接するものの交点が前記読み取った画像内に含まれるときに正しいと判定、一方、含まれないときに誤検出と判定する手段と、
前記正しいと判定された帳票の用紙端の上辺、左辺、下辺、および上辺の外側を黒画素とした帳票画像を生成する手段と、
前記帳票画像の外側の黒画素から白画素に変化する用紙端の上辺、左辺、下辺、および上辺について隣接するものの交点を基点として文字認識する手段としてコンピュータに機能させるための文字認識プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002159690A JP4194301B2 (ja) | 2002-05-31 | 2002-05-31 | 文字認識システムおよび文字認識プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002159690A JP4194301B2 (ja) | 2002-05-31 | 2002-05-31 | 文字認識システムおよび文字認識プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004005177A JP2004005177A (ja) | 2004-01-08 |
JP4194301B2 true JP4194301B2 (ja) | 2008-12-10 |
Family
ID=30429364
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002159690A Expired - Fee Related JP4194301B2 (ja) | 2002-05-31 | 2002-05-31 | 文字認識システムおよび文字認識プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4194301B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4598426B2 (ja) * | 2004-03-30 | 2010-12-15 | 富士通株式会社 | 境界抽出方法、プログラムおよびこれを用いた装置 |
JP6981140B2 (ja) * | 2017-09-26 | 2021-12-15 | 株式会社リコー | 画像処理装置、画像処理方法、およびプログラム |
-
2002
- 2002-05-31 JP JP2002159690A patent/JP4194301B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2004005177A (ja) | 2004-01-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8422773B2 (en) | Image zone detecting using color gradation levels, method, apparatus and computer readable medium | |
JPH03144863A (ja) | 画像の傾き検出方法および補正方法ならびに画像情報処理装置 | |
JP4574503B2 (ja) | 画像処理装置、画像処理方法およびプログラム | |
JP2005073015A (ja) | 画像処理装置及び画像処理方法及びコンピュータプログラム | |
US20070172123A1 (en) | Image processing apparatus, image processing method and computer readable medium | |
JPH0535938A (ja) | 画像処理装置 | |
JPH08287184A (ja) | 画像切り出し装置及び文字認識装置 | |
JP4194301B2 (ja) | 文字認識システムおよび文字認識プログラム | |
JP3582988B2 (ja) | 非接触型画像読取装置 | |
JP6883199B2 (ja) | 画像処理装置、画像読み取り装置、および、プログラム | |
JP2012073769A (ja) | 楽譜認識装置及びコンピュータプログラム | |
JPH03263282A (ja) | 文字読取装置の文字切出し方法 | |
JPH10208040A (ja) | 画像処理方法及び記録媒体 | |
JP2008083988A (ja) | 入力フォーム作成装置及びプログラム | |
JPH07160814A (ja) | 光学式文字認識方法 | |
JPH04156694A (ja) | 文字認識方式 | |
JP2636866B2 (ja) | 情報処理方法 | |
JP3221969B2 (ja) | 文字認識装置 | |
JP3564987B2 (ja) | 光学式文字読取装置 | |
JPH0758927A (ja) | 絵柄データ作成装置 | |
JP2001126025A (ja) | Ocr用フォーマットパラメータ作成方法 | |
JP2004318896A (ja) | 非接触型画像読取装置 | |
JP2001109826A (ja) | 帳票処理装置及び帳票処理方法及びコンピュータ読み取り可能な記憶媒体 | |
JPH05128305A (ja) | 領域分割方法 | |
JPH02193278A (ja) | 画像処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050324 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080624 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080821 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080916 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080922 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4194301 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111003 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111003 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121003 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121003 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131003 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |