JP4594952B2 - 文字認識装置及び文字認識方法 - Google Patents
文字認識装置及び文字認識方法 Download PDFInfo
- Publication number
- JP4594952B2 JP4594952B2 JP2007072673A JP2007072673A JP4594952B2 JP 4594952 B2 JP4594952 B2 JP 4594952B2 JP 2007072673 A JP2007072673 A JP 2007072673A JP 2007072673 A JP2007072673 A JP 2007072673A JP 4594952 B2 JP4594952 B2 JP 4594952B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- character
- feature vector
- license
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Description
図1は本発明に係る一つの実施の形態の身分証認識システムの構成を示す図、図2は申込書の一例を示す図である。
図1に示すように、この身分証認識システムは、帳票としての申込書1の表面を例えばCCDなどで走査(スキャン)して画像情報(イメージデータ)を取得(生成)するイメージスキャナー2(以下スキャナー2と称す)と、このスキャナー2に接続され、申込書1から読み取った画像情報(イメージデータ)に対して免許証23の画像の抽出処理及び文字認識処理を行うコンピュータ10とから構成されている。
この免許証フォーマット13cには、例えば免許証に予め複数印字されている特徴的な基準文字である「年」、「月」、「日」のうちのいずれか1種類、この例では「日」という文字種と、複数の基準文字「日」の位置関係のデータ(免許証23のある点(左上角など)を基準(X座標0,Y座標0)とした「日」という文字のX座標・Y座標と各文字間の距離データなど)が記憶されている。
表示部14は、スキャナー2が取り込んだ申込書1の画像や、抽出した免許証部分の画像から文字認識処理するための画面、文字認識結果のテキストデータなどを表示する。
そこで、本システムでは、免許証23の貼り付け位置を検出するための基準となる5個の「日」という文字(p1…p5)の中心点の位置情報をメモリ13に登録しておき、図3に示すような、認識対象の申込書の画像1aから検出された「日」という文字(d1…dn)の中心点の位置がそれぞれどれに対応するかを総当りで調べ、最も確からしい組み合わせを求める。
この身分証認識システムの場合、スキャナー2の読み取り台に申込書1がセットされ、走査開始の操作が行われると、スキャナー2は、申込書1の表面を走査してイメージデータを生成しコンピュータ10へ送る。
免許証画認識処理を行う場合、CPU16は、まず、スキャナー2により読み取られた申込書1の画像を一定方向(縦方向)に走査する(図5のS111)。
また、CPU16は、横方向に連続する黒ピクセルの範囲32の端部の黒ピクセルから、上下に黒ピクセルを追跡し、縦方向に連続する黒ピクセルの範囲33を検出する(S115)。
CPU16は、この文字認識処理の結果であるテキストデータとメモリ13に一時記憶しておいた免許証23の部分画像とを対応させて、ハードディスク装置15に構築されたデータベースに登録する。
図7に示すように、「日」という文字は、厳密には、中央から上の部分と下の部分では形が異なっている。この微妙な違いを検出することで、処理をさらに高速化できる。
このように、はみ出し部35の方向を検出して、予め文字の向き(上:正規方向または下:逆方向)を判定しておくことで、複数の「日」という文字を組み合わせ最適化処理で上下を判定する必要がなくなるので、免許証23の認識をより高速に行うことができる。
また、CPU16は、背景に斜線が描かれている文字画像「1」、「1」、「3」、「5」については、第2辞書13bを参照して文字認識処理を行う。
<免許証番号斜線部専用の辞書>
次に正規化した画像を縦横に格子状に分割し、分割した各マスごとに濃度特徴などを算出して得た特徴量を辞書として登録する。
<斜線が入った文字画像の処理>
以下、具体的な処理について説明する。
ここで、斜線は回転した画像上でX軸とほぼ平行な黒画素成分の集まり、つまり水平線となっているため、CPU16は、黒画素の水平方向の射影をとるなどの方法で斜線の位置を検出する。
ここで、斜線が引かれていたマスの特徴は、標準辞書である第1辞書13aの特徴と大きく異なるため、斜線部分の特徴は文字認識の結果に悪影響を与えてしまう。
図14に斜線部分を取り除いた特徴ベクトルの例を示す。この図14に示す例では、斜線が入っていたマスは、2、4、7行目の各行P(一行ずつ)であるため、81次元の特徴ベクトルから、3×9マス分の特徴ベクトル、つまり27次元分が取り除かれるため、比較対象が54次元の特徴ベクトルとなる。
図15に回転せずに斜線部分の特徴量を除去した例を示す。この図15の例では、斜線で塗りつぶしたマスで示される42マスが、数字の背景の斜線による影響を受けており、文字認識に使用できる特徴量は39次元となってしまい、比較のための情報量が明らかに減るため、認識精度が低下することになる。
Claims (4)
- 斜線を背景にした文字列が印字された印字面より画像を取得する画像情報取得手段と、
前記画像情報取得手段により取得された画像の中から、前記斜線を背景にした文字列の
画像を抽出し、各文字単位に切り出す文字画像切出手段と、
前記文字画像切出手段により切り出された文字画像を、前記斜線がほぼ水平になる角度に回転する文字画像回転手段と、
前記文字画像回転手段により回転された文字画像より水平方向に線を構成する黒画素成分を除去する射線処理手段と、
前記射線処理手段により水平方向に線を構成する黒画素成分が除去された文字画像の特徴ベクトルを抽出する特徴ベクトル抽出手段と、
予め前記斜線の角度と一致する角度で回転させた状態の基準文字画像の特徴ベクトルとテキストデータとを対応付けた辞書を記憶した辞書記憶部と、
前記特徴ベクトル抽出手段により抽出された前記文字画像の特徴ベクトルと前記辞書記憶部に記憶された特徴ベクトルとを比較して一致また近似する特徴ベクトルを持つテキストデータを出力する文字認識手段とを具備したことを特徴とする文字認識装置。 - 請求項1記載の文字認識装置において、
前記画像情報取得手段が、
帳票より画像を取得する帳票画像情報取得手段と、
前記帳票画像情報取得手段により取得された帳票の画像の中から「年」、「月」、「日」の少なくとも1つの種類の複数の文字を検出する特徴文字検出手段と、
前記特徴文字検出手段により検出された複数の文字の位置関係と予め設定された身分証の文字の基準位置とに基づいて身分証の画像の伸縮率および・または方向を求め、前記帳票の画像の中から身分証の画像を抽出する画像抽出手段と
を具備したことを特徴とする請求項1記載の文字認識装置。 - 斜線を背景にした文字列が印字された印字面より画像を画像情報取得手段が取得するステップと、
前記画像情報取得手段により取得された画像の中から、文字画像切出手段が、前記斜線を背景にした文字列の画像を抽出し、各文字単位に切り出すステップと、
前記文字画像切出手段により切り出された文字画像を、文字画像回転手段が、前記斜線がほぼ水平になる角度に回転するステップと、
前記文字画像回転手段により回転された文字画像より水平方向に線を構成する黒画素成分を射線処理手段が除去するステップと、
前記射線処理手段により水平方向に線を構成する黒画素成分が除去された文字画像の特徴ベクトルを特徴ベクトル抽出手段が抽出するステップと、
予め前記斜線の角度と一致する角度で回転させた状態の基準文字画像の特徴ベクトルとテキストデータとを対応付けた辞書を辞書記憶部に記憶しておき、前記特徴ベクトル抽出手段により抽出された前記文字画像の特徴ベクトルと、前記辞書記憶部に記憶された特徴ベクトルとを文字認識手段が比較して一致また近似する特徴ベクトルを持つテキストデータを出力するステップと
を有することを特徴とする文字認識方法。 - 請求項3記載の文字認識方法において、
帳票より画像を帳票画像情報取得手段が取得するステップと、
前記帳票画像情報取得手段により取得された帳票の画像の中から「年」、「月」、「日」の少なくとも1つの種類の複数の文字を特徴文字検出手段が検出するステップと、
前記特徴文字検出手段により検出された複数の文字の位置関係と予め設定された身分証の文字の基準位置とに基づいて画像抽出手段が身分証の画像の伸縮率および・または方向を求め、前記帳票の画像の中から身分証の画像を抽出するステップと
を有することを特徴とする請求項3記載の文字認識方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007072673A JP4594952B2 (ja) | 2007-03-20 | 2007-03-20 | 文字認識装置及び文字認識方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007072673A JP4594952B2 (ja) | 2007-03-20 | 2007-03-20 | 文字認識装置及び文字認識方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008234291A JP2008234291A (ja) | 2008-10-02 |
JP4594952B2 true JP4594952B2 (ja) | 2010-12-08 |
Family
ID=39906989
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007072673A Active JP4594952B2 (ja) | 2007-03-20 | 2007-03-20 | 文字認識装置及び文字認識方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4594952B2 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6080259B2 (ja) | 2013-02-06 | 2017-02-15 | 日本電産サンキョー株式会社 | 文字切り出し装置及び文字切り出し方法 |
CN103235946A (zh) * | 2013-04-08 | 2013-08-07 | 上海合合信息科技发展有限公司 | 人工识别名片信息的防泄密处理方法 |
CN104050450A (zh) * | 2014-06-16 | 2014-09-17 | 西安通瑞新材料开发有限公司 | 一种基于视频的车牌识别方法 |
CN106156767A (zh) * | 2016-03-02 | 2016-11-23 | 平安科技(深圳)有限公司 | 行驶证有效期自动提取方法、服务器及终端 |
JP6190923B1 (ja) * | 2016-06-23 | 2017-08-30 | 株式会社ダイナム | 会員情報登録支援システム |
JP6563084B1 (ja) * | 2018-06-22 | 2019-08-21 | 株式会社東芝 | カード番号認識装置およびカード番号認識方法 |
JP2021047688A (ja) * | 2019-09-19 | 2021-03-25 | 株式会社日立情報通信エンジニアリング | 帳票認識方法およびプログラム |
JP7372633B2 (ja) * | 2020-03-31 | 2023-11-01 | ローレルバンクマシン株式会社 | 紙葉類識別装置および紙葉類識別方法 |
CN113343970B (zh) * | 2021-06-24 | 2024-03-08 | 中国平安人寿保险股份有限公司 | 文本图像检测方法、装置、设备及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0279184A (ja) * | 1988-09-16 | 1990-03-19 | Hitachi Ltd | 画像情報装置の正常画像判定方法 |
JPH03113582A (ja) * | 1989-09-27 | 1991-05-14 | Oki Electric Ind Co Ltd | 文字背景処理装置 |
-
2007
- 2007-03-20 JP JP2007072673A patent/JP4594952B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0279184A (ja) * | 1988-09-16 | 1990-03-19 | Hitachi Ltd | 画像情報装置の正常画像判定方法 |
JPH03113582A (ja) * | 1989-09-27 | 1991-05-14 | Oki Electric Ind Co Ltd | 文字背景処理装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2008234291A (ja) | 2008-10-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4594952B2 (ja) | 文字認識装置及び文字認識方法 | |
JP5620244B2 (ja) | 画像比較および文書認証のための画像位置合わせの方法及びプログラム | |
US6707466B1 (en) | Method and system for form recognition and digitized image processing | |
US20200065601A1 (en) | Method and system for transforming handwritten text to digital ink | |
US20100158326A1 (en) | Signature system, signature device, signature verification device, signature verification method, computer readable medium and computer data signal | |
JP4557765B2 (ja) | 画像処理装置およびその方法 | |
US6614929B1 (en) | Apparatus and method of detecting character writing area in document, and document format generating apparatus | |
US6600482B1 (en) | Method and system for form recognition and digitized image processing | |
US10503993B2 (en) | Image processing apparatus | |
JP2018055255A (ja) | 情報処理装置、情報処理方法及びプログラム | |
US11881043B2 (en) | Image processing system, image processing method, and program | |
US9818028B2 (en) | Information processing apparatus for obtaining a degree of similarity between elements | |
CN114283273A (zh) | 对照***、对照方法和信息存储介质 | |
JP4309881B2 (ja) | 身分証認識装置及び身分証認識方法 | |
JP4474231B2 (ja) | 文書リンク情報取得システム | |
JP2018067096A (ja) | 文字認識装置及び文字認識方法 | |
WO2001052519A1 (en) | A method and system for form recognition and digitized image processing | |
US11722615B2 (en) | Image processing including adjusting image orientation | |
EP4379677A1 (en) | Image processing system, image processing method, and program | |
EP4379678A1 (en) | Image processing system, image processing method, and program | |
JP4188344B2 (ja) | 指紋照合装置、方法およびプログラム | |
JP5298830B2 (ja) | 画像処理プログラム、画像処理装置及び画像処理システム | |
JP5277750B2 (ja) | 画像処理プログラム、画像処理装置及び画像処理システム | |
JP2000339407A (ja) | 画像処理装置及び画像処理方法及びコンピュータ読み取り可能な記憶媒体 | |
JP6743401B2 (ja) | 帳票設計・読取設定支援装置、帳票設計・読取設定支援方法、及び、光学文字認識システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100323 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100521 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20100521 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20100521 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100824 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100917 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130924 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4594952 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |