JP6582464B2 - 情報入力装置、およびプログラム - Google Patents

情報入力装置、およびプログラム Download PDF

Info

Publication number
JP6582464B2
JP6582464B2 JP2015053081A JP2015053081A JP6582464B2 JP 6582464 B2 JP6582464 B2 JP 6582464B2 JP 2015053081 A JP2015053081 A JP 2015053081A JP 2015053081 A JP2015053081 A JP 2015053081A JP 6582464 B2 JP6582464 B2 JP 6582464B2
Authority
JP
Japan
Prior art keywords
image data
name
partial image
last
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015053081A
Other languages
English (en)
Other versions
JP2016173710A (ja
Inventor
里葉子 芦田
里葉子 芦田
晃慶 山下
晃慶 山下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dai Nippon Printing Co Ltd
Original Assignee
Dai Nippon Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dai Nippon Printing Co Ltd filed Critical Dai Nippon Printing Co Ltd
Priority to JP2015053081A priority Critical patent/JP6582464B2/ja
Publication of JP2016173710A publication Critical patent/JP2016173710A/ja
Application granted granted Critical
Publication of JP6582464B2 publication Critical patent/JP6582464B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)
  • User Interface Of Digital Computer (AREA)

Description

本発明は、ユーザによる入力作業を支援する光学文字認識を用いた情報入力装置に関する。
従前より、企業が街頭で行うキャンペーンへの参加や一般商取引におけるポイントカード会員などの入会手続きにおいて、ユーザが参加や入会の申し込みを行う場合、ユーザが所持する個人認証用の媒体に記載されている個人情報を撮影し、光学文字認識(OCR:Optical Character Recognition)を行うことによって、ユーザに対する申込票への記入の負荷を低減させる方法が行われている。
この場合、キャンペーンや特典が付与される対象商品が、酒類やたばこなど、その利用に法的な年齢制限が課せられているような場合、前記個人認証用の媒体は、例えば、ユーザの免許証など、生年月日の記載のある公的身分証明書であることが望ましい。そのような媒体であれば、入会申し込みと同時に年齢認証を行えるため、ユーザにとっても企業側にとっても年齢認証に係る負荷が軽減される。
これらの、免許証などの公的身分証明書においては、情報入力装置で読み取る対象の、姓名、住所、生年月日などが記載されている位置や文字サイズがほぼ定まっているため、特にOCRを用いた自動文字認識処理に適していると考えられる。
特許文献1では、保険業界等の契約内容の変更手続等における契約者の家族などの手続者の認証を行うため、手続者の免許証などの身分証明書の画像データから、前記手続者の姓をテキストデータで取得して、公的な身分証データとして抽出し、契約者の姓と一致することにより認証を行う認証装置が呈示されている。
また、特許文献2では、光学的文字読取り装置(OCR)を用いて、姓名を認識する場合に使用される文字認識処理装置が紹介されている。これによると姓名の認識を行なう場合には、姓名から成る文字列を読取り、文字の数に応じて姓名特有の仕切りを設定して、前半部と後半部とに2分割し、前半部を姓辞書と比較照合し、後半部を名辞書と比較照合して、認識ができない場合は仕切りを変更して再度各辞書と比較照合することにより、姓と名を認識する方法が呈示されている。
また、特許文献3では、手書きで記された手書き漢字(印刷文字でもよい)の姓名認識を行う光学文字読取り装置(OCR)における文字認識方法において、異なる姓と名の区切方法がある場合、いずれかの区切方法を選択するための候補データを表示する方法が紹介されている。
特許第5166330号公報 特許第2892376号公報 特許第2933178号公報
ところで、OCRを用いて自動文字認識を行う場合、例え記載位置や文字サイズ(文字の高さ)が揃っていたとしても、例えば姓名欄に記載された姓名においては、姓と名の間に明瞭な区切り(空白)などがないといった理由で正確な姓と名の区切りを自動で認識できなかったり、住所などにおいては記載欄の大きさの制限によって、記載された文字数が多い場合、文字の横幅が縦のサイズの半角や2/3角となっていて、光学文字認識が困難となってしまったりする場合がある。
特許文献1に開示されている方法では、姓名の区切りを決定する以前に、抽出すべき手続者の姓が予め判っている(契約者の姓と一致することが期待されている)ため、姓と名を正確に区分することは容易にできる、しかし、通常の文字認識においては、姓は予め判ってはいない。特許文献2では、特許文献3で指摘されているように、複数の異なる姓と名の区切方法がある場合において、いずれか一の区切方法が選択されてしまうため、必ずしも正確に姓と名が区切られる保証がないといった問題がある。また、特許文献3では、複数の異なる姓と名の区切方法がある場合について、区切方法を選択するための候補データを表示して、ユーザが候補データの中から所望する姓名の区切を選択するため、姓と名は正確に区切られる。しかし、候補となる姓と名の区切方法が複数表示されるため、ユーザが不快に感じる姓名の区切方法が表示されたり、表示された区切方法のリストの中から別途キーボードやマウス等の入力装置を用いて選択したりする必要があるため、物理的に固定されたスペースなどが必要となり、ユーザにとっても企業側にとっても煩わしさを感じる場合がある。
本発明の目的は、ユーザが所持する個人認証用の媒体に記載されている個人情報を撮影し、その画像データから光学文字認識(OCR)によって、正確に記載データを抽出するとともに、姓と名の間に明瞭な区切り(空白)などがない場合でも、場所を選ばずに容易な操作で正確に姓と名を区分することができる情報入力装置を提供することである。
前記課題を解決するための、本願の第1の発明は、公的身分証明書を撮影して画像データとして記憶する撮影手段と、前記記憶した画像データを前記公的身分証明書の種類ごとに定められたレイアウト情報を用いて複数の部分画像データに分割する画像分割手段と、前記部分画像データを所定のサイズに拡大縮小する画像補正手段と、前記所定のサイズに拡大縮小された各々の部分画像データを光学文字認識を用いてテキストデータ化してレイアウト情報から得られる属性と併せて保持する文字認識手段と、姓名に係る部分画像データをテキストデータ化した文字列を姓と名に区分する姓名区分手段と、姓名の姓と名の区切りを示す入力を検知してテキストデータを姓のテキストデータと名のテキストデータの区切りを決定する区分決定手段と、それぞれのテキストデータを記憶するデータ保存手段と、を備え、前記画像補正手段は、姓名に係る部分画像データに含まれる姓名の文字数と住所に係る部分画像データにおける1文字分の文字幅を比較することによりそれぞれの文字幅を判定してそれぞれの部分画像データを同一の文字幅になるように拡大縮小することを特徴とする情報入力装置である。こうして、ユーザが所持する公的身分証明書を撮影することによってユーザの個人情報を取得することができ、文字の拡縮による補正を予め行うことによって、光学文字認識(OCR)による文字認識の精度アップを図ることができる。
第2の発明は、公的身分証明書を撮影して画像データとして記憶する撮影手段と、前記記憶した画像データを前記公的身分証明書の種類ごとに定められたレイアウト情報を用いて複数の部分画像データに分割する画像分割手段と、前記部分画像データを所定のサイズに拡大縮小する画像補正手段と、前記所定のサイズに拡大縮小された各々の部分画像データを光学文字認識を用いてテキストデータ化してレイアウト情報から得られる属性と併せて保持する文字認識手段と、姓名に係る部分画像データをテキストデータ化した文字列を姓と名に区分する姓名区分手段と、姓名の姓と名の区切りを示す入力を検知してテキストデータを姓のテキストデータと名のテキストデータの区切りを決定する区分決定手段と、それぞれのテキストデータを記憶するデータ保存手段と、を備え、前記姓名区分手段は、姓名に係る部分画像データをテキストデータ化した文字列を一つ以上の姓と名に区分してそれぞれの区切り方の確からしさの指標を取得し、前記区分決定手段は、前記指標をもとに前記文字列を修飾して表示部に表示することを特徴とする情報入力装置である。こうして、ユーザが所持する公的身分証明書を撮影することによってユーザの個人情報を取得することができ、ユーザは正しい姓と名の区切りをより的確に指定することができる。
第3の発明は、前記画像補正手段は、姓名に係る部分画像データに含まれる姓名の文字数と住所に係る部分画像データにおける1文字分の文字幅を比較することによりそれぞれの文字幅を判定してそれぞれの部分画像データを同一の文字幅になるように拡大縮小することを特徴とする第2の発明における情報入力装置である。このように文字の拡縮による補正を予め行うことによって、光学文字認識(OCR)による文字認識の精度アップを図ることができる。
第4の発明は、コンピュータを、第1の発明から第3の発明のいずれか1つに記載の情報入力装置として機能させるためのコンピュータプログラムである。
本発明によれば、ユーザが所持する個人認証用の媒体に記載されている個人情報を撮影するだけで、正確に媒体に記載されたデータを抽出するとともに、場所を選ばずに容易な操作で正確に姓と名を区分することができる。
本実施形態の構成を示す図である。 情報入力装置100についてより詳しく説明する機能ブロック図である。 情報入力装置100のハードウェア構成を示す図である。 レイアウト情報131を説明する図である。 姓名辞書161と姓名履歴162を説明する図である。 本実施形態の処理の流れを説明するフローチャートである 個人認証用の媒体200の外観の例を示す図である。 画像補正手段140における文字サイズの補正に関するフローチャートである。 姓名区分手段160における姓名の区切りの指標を求めるフローチャートである。 区分決定手段170が表示部105に表示する姓名のテキストの例を示す図である。
以下に、本発明の一つの実施形態に係るシステムの構成について図面を参照してさらに詳細に説明する。
図1は、本実施形態の構成を示す図である。100は情報入力装置であり、典型的にはタブレット型コンピュータ等の可搬型の端末であり、カメラ121を備える。また、情報入力装置100は、前記カメラ121でユーザの所持する公的身分証明書などの個人認証用の媒体200を撮影する。また、情報入力装置100は、ネットワーク500を介して外部装置との情報の送受信を行う。ここでは特に、ユーザの個人情報を管理する企業の会員サーバ300と情報の授受を行う。
図2は、本実施形態の情報入力装置100についてその機能の側面からより詳しく説明する機能ブロック図である。情報入力装置100は、内蔵するカメラが撮影した画像データを記憶する撮影手段120と、画像データを所定のレイアウト情報を用いて複数の部分画像データに分割する画像分割手段130と、部分画像データを所定のサイズに拡大縮小する画像補正手段140と、所定のサイズに拡大縮小された各々の部分画像データを光学文字認識を用いてテキストデータ化する文字認識手段150と、テキストデータ化した姓名を区分してその場合に得られる指標を姓名の文字列とともに表示部に表示する姓名区分手段160と、表示された姓名の姓と名の区切りを示す入力を検知してテキストデータを姓のテキストデータと名のテキストデータに区分する区分決定手段170と、それぞれのテキストデータを記憶するデータ保存手段180とそれぞれの手段を制御する制御手段110が備えられている。処理の流れについては、さらに詳細な説明を後述する。
図3は、情報入力装置100のハードウェア構成を示す図である。情報入力装置100は先に述べたように典型的にはタブレット型のコンピュータ(以降、タブレットPCと称する)であり、ハードウェアとしては一つのコンピュータシステムである。情報入力装置100は、制御部101、記憶部102、周辺機器インターフェース(I/F)部103、入力部104、表示部105、通信部106を備え、それらがバス109を介して接続される。また、本構成の特徴として、周辺機器I/F部103に接続されるカメラ121が内蔵されている。尚、図3のハードウェア構成は一例であり、別途、目的に応じて様々な構成を採ることが可能である。
制御部101は、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)等で構成される。CPUは、記憶部102、ROM、記録媒体等に格納されるプログラムをRAM上のワークメモリ領域に呼び出して実行し、バス109を介して接続された各装置を駆動制御し、コンピュータが行う処理を実現する。ROMは、不揮発性メモリであり、情報入力装置100のブートプログラム、データ等を恒久的に保持している。RAMは、揮発性メモリであり、記憶部102、ROM、記録媒体等からロードしたプログラム、データ等を一時的に保持するとともに、制御部101が各種処理を行う為に使用するワークエリアを備える。
記憶部102は、制御部101が実行するプログラム、プログラム実行に必要なデータ、OS(オペレーティングシステム)等が格納される。プログラムに関しては、OS(オペレーティングシステム)に相当する制御プログラムや、制御手段110として機能するプログラムコード、撮影手段120として機能するプログラムコード、画像分割手段130として機能するプログラムコード、画像補正手段140として機能するプログラムコード、文字認識手段150として機能するプログラムコード、姓名区分手段160として機能するプログラムコード、区分決定手段170として機能するプログラムコード、データ保存手段180として機能するプログラムコードが格納されている。これらのプログラムコードは、制御部101により必要に応じて読み出されてRAMに移され、CPUに読み出されて実行されることにより各種の手段として機能する。
周辺機器I/F部103は、コンピュータに周辺機器を接続させるためのポートであり、周辺機器I/F部103を介してコンピュータは周辺機器とのデータの送受信を行う。周辺機器I/F部103は、USBやIEEE1394やRS−232C等で構成されており、本実施形態では、タブレットPCに内蔵されたカメラ121と接続されており、撮影されたデータを受信する。入力部104は、例えば、タッチパネル等の入力装置である。入力部104を介して、ユーザは情報入力装置100に対して、操作指示、動作指示、データ入力等を行うことができる。表示部105は、液晶パネル等のディスプレイ装置であり、入力部104のタッチパネルと重畳して設置されていてもよい。
通信部106は、通信制御装置、通信ポート等を有し、情報入力装置100とネットワーク500間の通信を媒介する無線の通信インターフェースであり、ネットワーク500を介して、他のコンピュータとの通信制御を行う。
図2に戻って、制御手段110は制御部101とOS(オペレーティングシステム)等を実行するコンピュータプログラムであり、撮影手段120はカメラとカメラによる撮影を制御するコンピュータプログラムである。また、画像分割手段130からデータ保存手段180についても、撮影した画像の認識に係るコンピュータプログラムであり、制御手段110が各コンピュータプログラムを解釈実行することにより機能する。
以下に、本実施形態の情報入力装置100が持つデータベースについて説明する。また、本実施形態では、これらの各種データベースについて、説明の上で必要最低限の項目しか例示していないが、実際の運用においては、これらに派生する様々な項目が付加され保存されていてもよい。
図4は、情報入力装置100が持つデータベースの一つであるレイアウト情報131を説明する図である。情報入力装置100の画像分割手段130は、撮影手段120によって記憶された画像データをレイアウト情報131を用いて複数の部分画像データに分割する。
レイアウト情報131は、個人認証用媒体名(T12)単位で使用され、この単位で1レコードを構成する。画像分割手段130がどの個人認証用媒体を使用するかについては、後述するように、情報入力装置100のオペレータが予め設定しておいてもよいし、自動的に設定するようにしてもよい。T11の数字は個人認証用媒体名(T12)に対する識別子(ID)である。
例えば、個人認証用媒体が自動車運転免許証と設定された場合、このレコードはいくつかの属性(項目とも称す、T13)を含み、例えば、姓名(T13の一つ)のデータは入力画像の基準点(通常左上隅の点)からの始点座標(T14、T15、この例ではX=29,Y=15)と終点座標(T16、T17、この例ではX=40,Y=105)に囲まれた範囲に存在する。また、姓名の文字の書体(フォント、T18)は「丸ゴシック」、文字の縦サイズ(T19)は12ポイントであることが示されている。尚、座標系やフォントの呼称、文字サイズの単位などは、プログラム内で任意に設定できるようにしてもよい。
図5は、情報入力装置100が持つデータベースの一つである姓名辞書161と姓名履歴162を説明する図である。情報入力装置100の姓名区分手段160は、文字認識手段150によってテキストデータ化された姓名を姓名辞書161と姓名履歴162を用いて姓と名を区分するとともに、区分の確からしさを表す指標を姓名辞書161と姓名履歴162から抽出する。
図5(a)は姓名辞書161の構成を示す例である。この例では、存在すべきであろう姓のリスト(T21)と、その姓が出現する確率に基づいて付与された指標(T22)が併記されて羅列されている。この指標は、統計に基づいた「区切り方の確からしさの指標」とも解釈できる。
同様に、図5(b)は姓名履歴162の構成を示す例である。この例では、姓名辞書161と同じ姓のリスト(T23)と、その姓がこの処理において実際に出現した数値である指標(T24)が併記されて羅列されている。この指標は、現実の使用に基づいた「区切り方の確からしさの指標」とも解釈できる。尚、後述するように姓名辞書161は、任意に入れ替えられてもよいし、姓名履歴162は、他の装置の履歴を取り込んで加算しても適宜更新されるようにしてもよい。
次に、本実施形態の処理の流れについて、図6を用いて、さらに詳細に説明する。先ず、情報入力装置100の撮影手段120によって、入力対象となるユーザの所持する個人認証用の媒体200を、情報入力装置100に内蔵されたカメラ121で撮影する。撮影手段120は、撮影した画像データを記憶する。
続いて、情報入力装置100の画像分割手段130は、どのレイアウト情報131のレコードを使用するか(どの種類の個人認証用媒体のレイアウト情報を使用するか)についての情報を取得する、これについては情報入力装置100のオペレータが入力部104を介して手入力により制御手段110にレイアウト情報を指示してもよいし、保持しているレイアウト情報131のそれぞれのレコードから、文字が入力されていることが期待される領域を抽出し、前記撮影した画像データから該領域に係る画像データを取得して、その濃淡の解析や空間周波数分析を行い、それらの画像データの中から文字の存在の確度が一番高いレイアウト情報131のレコードを自動的に選択し、設定するようにしてもよい。画像分割手段130は、画像データを所定のレイアウト情報を用いて複数の部分画像データに分割する。
画像補正手段140は、画像分割手段130が分割した部分画像データのうち、姓名に係る部分画像データと住所に係る部分画像データを取得して、空間周波数分析などを用いて、先ず姓名の文字数を求めて、その文字数から、例えば7文字以下ならば文字幅は全角、14文字以下ならば2/3角、15文字以上なら半角というように判定する。続いて、住所に係る部分画像データを取得して、1文字分の幅を求め、姓名の文字幅と比較して文字幅を判定し、1文字の幅が全角になるよう(所定の大きさになるよう)、それぞれの部分画像データを幅方向に拡大する(詳細な処理の流れについては後述する)。
図7は、公的身分証明書などの個人認証用の媒体200の外観の例を示す図である。この例では、画像補正手段140は、姓名に係る部分画像データから検知される文字数が4文字なので、姓名に係る部分画像データの文字の幅201を全角と判定する。また、住所に係る部分画像データから検知される文字幅202については、姓名に係る部分画像データから検知される文字の幅201と比較して、ここでは2/3角と判定する。そこで、姓名に係る部分画像データについてはそのまま補正を行わず、住所に係る部分画像データについては、1文字の幅が全角になるように幅方向に拡大される。
図8は、画像補正手段140における文字サイズの補正に関する詳細な処理の流れを示すフローチャートである。画像補正手段140は、先ず、姓名に係る部分画像データの取得する(S201)。続いて、空間周波数分析などを用いて姓名の文字数を取得する(S202)。次に、先に説明したように、取得した文字数から、文字幅が全角か、2/3角か、半角かの判定を行う(S203、S204〜S206)。続いて、住所に係る部分画像データの取得し(S207)、空間周波数分析などを用いて住所の文字幅を取得する(S208)。ここで、先に判定した姓名の文字幅と比較し、住所の文字幅は全角か、2/3角か、半角かを判定する(S209、S210〜S212)。ここで求められた文字幅に基づいて、姓名に係る部分画像データの大きさを文字幅が全角になるように補正し(S213)、住所に係る部分画像データの大きさを文字幅が全角になるように補正して(S214)、姓名と住所に係る部分画像データにおける文字幅が同一になるようにして処理を終える。
図6に戻り、情報入力装置100の文字認識手段150は、補正された各々の部分画像データを光学文字認識(OCR)を用いてテキストデータ化する。ここで、光学文字認識(OCR)処理については幅広く知られており、市販もされているため、本実施形態の装置では、既存技術のOCRを搭載して使用する。このとき、汎用的なOCRを利用したいため、上述の画像補正手段140で説明した処理を行い、文字幅を全角に統一するような正規化を行って、入力データの汎用化を図る。
続いて、姓名区分手段160は、文字認識手段150によってテキストデータ化された姓名について、姓名辞書161と姓名履歴162を用いて姓と名に区分する。
図9は、姓名区分手段160における姓名の区切りの指標を求めるフローチャートである。先ず、テキストデータ化された姓名の文字列を取得する(S301)。次に、取得した姓名の文字列から姓名の区切りとなる可能性がある位置の数を求める(S302)、例えば、「波多野理子」という姓名のユーザがいた場合、区切りとなる可能性がある位置は次の「/」で示される4か所である。
波/多/野/理/子。
ここで、この数「4」回だけループして(S303)、姓のパターンを4つ作成する(S304)。作成される姓のパターンは「波」、「波多」、「波多野」、「波多野理」の4種である。ここで、作成した姓のパターンの数だけループして(S305)、その姓のパターンが姓名辞書161に存在するかどうか姓名辞書に問い合わせる(S306、S307)。ここで姓が存在した場合、姓名辞書161の当該姓欄(T21)に対応する指標(T22)を取得し、区切り方の確からしさの指標値として保持する(S308)。続いて、この姓が姓名履歴162に存在するかどうか姓名辞書に問い合わせる(S309、S310)。ここで姓が存在した場合、姓名履歴162の当該姓欄(T23)に対応する指標(T24)を取得し、先の区切り方の確からしさの指標値に加算する(S311)。尚、姓名辞書161と姓名履歴162が保有する姓のレコードが同期している場合(常に同じ場合)、姓名辞書に問い合わせる(S309、S310)処理は不要で、姓名辞書の指標を保持した(S308)直後に姓名履歴の指標を加算する(S311)ようにしてもよい。こうして、それぞれの姓のパターンに対する区切り方の確からしさの指標を記憶して(S312)処理を終える。
図6に戻り、情報入力装置100の区分決定手段170は、こうして作成した姓のパターンに対する区切り方の確からしさの指標をもとに、テキストデータ化された姓名の文字列を修飾して情報入力装置100の表示部105に表示し、ユーザによる姓名の姓と名の区切りを示す入力を情報入力装置100の入力部104から検知して、テキストデータを姓のテキストデータと名のテキストデータに区分する。尚、この例ではタッチパネルディスプレイを搭載したタブレットPCを想定しているため、入力部104と表示部105は一つの重畳されたデバイスとなっている。
図10は、本実施形態における区分決定手段170が情報入力装置100の表示部105に表示する、姓名のテキストの例である。図10(a)は、姓名のテキストを、区切り方の確からしさの指標に関係なくそのまま表示した例である。ユーザは、例えば、このテキストの文字と文字の間を、指で上から下に切るジェスチャによって姓と名に区切ることにより姓と名の区切りを決定する。指で上から下に切るジェスチャは、情報入力装置100の入力部104であるタッチパネルで検知すればよい。図10(b)は、姓名のテキストを、区切り方の確からしさの指標に基づいて、姓と名の間隔を調整(修飾)して表示した例である。この例では区切り方の確からしさが高い文字間が広く表示されており(波多 野理子より波多野 理子の方が確からしい)、ジェスチャによる操作がやりやすくなっている。さらに、図10(c)や図10(d)のように、区切り方の確からしさの指標に基づいて、姓と名の間に記号やマークのような修飾を施し、ジェスチャによる操作をやりやすくするようにしてもよい。
図6に戻り、区分決定手段170は、こうして区分が決定された姓と名のテキストに加え、住所や生年月日、有効期間などといった、レイアウト情報によって部分画像データに分割されて文字認識された様々なテキストデータを情報入力装置100の表示部105に表示するようにしてもよい。
次に、情報入力装置100のデータ保存手段180は、上述の区分された姓と名のテキスト、住所、生年月日、有効期間などといった、レイアウト情報によって部分画像データに分割されて文字認識された様々なテキストデータを記憶し、個人情報DB(データベース)181として記憶する。
また、情報入力装置100は、前記個人情報DB181に記録されている情報を、通信部106を経由して、ネットワーク500を介して、外部の企業の会員サーバ300などに情報を送信することもできる。
本実施形態によれば、ユーザが所持する個人認証用の媒体に記載されている個人情報を撮影し、その画像データを光学文字認識(OCR)によって、正確に記載データを抽出するとともに、姓と名の間に明瞭な区切り(空白)などがない場合でも、容易な操作で正確に姓と名を区分することができる情報入力装置が提供される。この装置はポータブルで設置場所を選ばず、狭いイベント会場であっても使用することができ、また、個人認証用の媒体から文字認識した生年月日から現在の年齢を算定することにより、年齢認証をその場で完了することができる。
本発明は、上述の実施形態に限定されることなく、特許請求の範囲内で種々変更、応用が可能である。例えば、情報入力装置100は、本実施形態で示したようなタブレットPCでなく、通常のPC等の装置であってもよい。この場合、区分決定手段170における、指で上から下に切るジェスチャなどの指示の入力をマウスで行うようにしても同様に本発明の実施をすることが可能である。
100 情報入力装置
110 制御手段
120 撮影手段
130 画像分割手段
131 レイアウト情報
140 画像補正手段
150 文字認識手段
160 姓名区分手段
161 姓名辞書
162 姓名履歴
170 区分決定手段
180 データ保存手段
181 個人情報DB
200 個人認証用の媒体
300 企業の会員サーバ
500 ネットワーク

Claims (4)

  1. 公的身分証明書を撮影して画像データとして記憶する撮影手段と、
    前記記憶した画像データを前記公的身分証明書の種類ごとに定められたレイアウト情報を用いて複数の部分画像データに分割する画像分割手段と、
    前記部分画像データを所定のサイズに拡大縮小する画像補正手段と、
    前記所定のサイズに拡大縮小された各々の部分画像データを光学文字認識を用いてテキストデータ化してレイアウト情報から得られる属性と併せて保持する文字認識手段と、
    姓名に係る部分画像データをテキストデータ化した文字列を姓と名に区分する姓名区分手段と、
    姓名の姓と名の区切りを示す入力を検知してテキストデータを姓のテキストデータと名のテキストデータの区切りを決定する区分決定手段と、
    それぞれのテキストデータを記憶するデータ保存手段と、を備え、
    前記画像補正手段は、姓名に係る部分画像データに含まれる姓名の文字数と住所に係る部分画像データにおける1文字分の文字幅を比較することによりそれぞれの文字幅を判定してそれぞれの部分画像データを同一の文字幅になるように拡大縮小することを特徴とする情報入力装置。
  2. 公的身分証明書を撮影して画像データとして記憶する撮影手段と、
    前記記憶した画像データを前記公的身分証明書の種類ごとに定められたレイアウト情報を用いて複数の部分画像データに分割する画像分割手段と、
    前記部分画像データを所定のサイズに拡大縮小する画像補正手段と、
    前記所定のサイズに拡大縮小された各々の部分画像データを光学文字認識を用いてテキストデータ化してレイアウト情報から得られる属性と併せて保持する文字認識手段と、
    姓名に係る部分画像データをテキストデータ化した文字列を姓と名に区分する姓名区分手段と、
    姓名の姓と名の区切りを示す入力を検知してテキストデータを姓のテキストデータと名のテキストデータの区切りを決定する区分決定手段と、
    それぞれのテキストデータを記憶するデータ保存手段と、を備え、
    前記姓名区分手段は、姓名に係る部分画像データをテキストデータ化した文字列を一つ以上の姓と名に区分してそれぞれの区切り方の確からしさの指標を取得し、
    前記区分決定手段は、それらの指標をもとに前記文字列を修飾して表示部に表示することを特徴とする情報入力装置。
  3. 前記画像補正手段は、姓名に係る部分画像データに含まれる姓名の文字数と住所に係る部分画像データにおける1文字分の文字幅を比較することによりそれぞれの文字幅を判定してそれぞれの部分画像データを同一の文字幅になるように拡大縮小することを特徴とする請求項2に記載の情報入力装置。
  4. コンピュータを、請求項1から請求項3のいずれか1つに記載の情報入力装置として機能させるためのコンピュータプログラム。
JP2015053081A 2015-03-17 2015-03-17 情報入力装置、およびプログラム Active JP6582464B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015053081A JP6582464B2 (ja) 2015-03-17 2015-03-17 情報入力装置、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015053081A JP6582464B2 (ja) 2015-03-17 2015-03-17 情報入力装置、およびプログラム

Publications (2)

Publication Number Publication Date
JP2016173710A JP2016173710A (ja) 2016-09-29
JP6582464B2 true JP6582464B2 (ja) 2019-10-02

Family

ID=57009678

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015053081A Active JP6582464B2 (ja) 2015-03-17 2015-03-17 情報入力装置、およびプログラム

Country Status (1)

Country Link
JP (1) JP6582464B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111428723A (zh) * 2020-04-02 2020-07-17 苏州杰锐思智能科技股份有限公司 字符识别方法及装置、电子设备、存储介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7206644B2 (ja) * 2018-06-08 2023-01-18 大日本印刷株式会社 文字認識装置、文字認識方法、及びプログラム

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0433053A (ja) * 1990-05-24 1992-02-04 Seiko Epson Corp 氏名整形装置
JP2933178B2 (ja) * 1991-02-28 1999-08-09 沖電気工業株式会社 光学文字読取り装置における文字認識方法
JPH04341845A (ja) * 1991-05-17 1992-11-27 Waapu:Kk 印字間隔制御装置
JPH07314839A (ja) * 1994-05-25 1995-12-05 Toshiba Corp 印刷装置
JP3375766B2 (ja) * 1994-12-27 2003-02-10 松下電器産業株式会社 文字認識装置
JP4076900B2 (ja) * 2003-04-18 2008-04-16 日本電信電話株式会社 名義解析方法、装置、およびプログラム
JP5204448B2 (ja) * 2007-09-20 2013-06-05 株式会社Pfu 証明書読取認識装置
JP5166330B2 (ja) * 2009-03-16 2013-03-21 株式会社東芝 認証装置、認証方法および認証プログラム
JP5059150B2 (ja) * 2010-02-26 2012-10-24 株式会社東芝 コピー帳票のための伸縮補正読取機能

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111428723A (zh) * 2020-04-02 2020-07-17 苏州杰锐思智能科技股份有限公司 字符识别方法及装置、电子设备、存储介质

Also Published As

Publication number Publication date
JP2016173710A (ja) 2016-09-29

Similar Documents

Publication Publication Date Title
US10853638B2 (en) System and method for extracting structured information from image documents
KR102240279B1 (ko) 컨텐트 처리 방법 및 그 전자 장치
JP5248696B1 (ja) 電子機器、手書き文書作成方法、及び手書き文書作成プログラム
JP6244892B2 (ja) 文書内の文字の局所的な拡大縮小、回転および表示位置に対して不変である光学的文字認識のためのワード検出
JP2007317022A (ja) 手書文字処理装置及び手書文字処理方法
US11475688B2 (en) Information processing apparatus and information processing method for extracting information from document image
US20190379795A1 (en) Image processing device, image processing method, image processing program, and recording medium storing program
US11816923B2 (en) Face image candidate determination apparatus for authentication, face image candidate determination method for authentication, program, and recording medium
CN103577094A (zh) 电子设备和方法
KR101927064B1 (ko) 전자책 또는 전자노트에 대한 요약 데이터 생성 장치 및 방법
JP2017527894A (ja) 手書きを使用するユーザ識別登録の管理
US20160062637A1 (en) Method, apparatus and non-transitory storage medium for processing punctuation mark
JP2016066115A (ja) デジタルコンテンツの閲覧支援装置、閲覧支援方法及びプログラム
CN109388935B (zh) 单证验证方法及装置、电子设备及可读存储介质
JP6582464B2 (ja) 情報入力装置、およびプログラム
JP2015099566A (ja) 特徴算出装置、方法及びプログラム
US20140222825A1 (en) Electronic device and method for searching handwritten document
KR20150024107A (ko) 입력된 객체의 정렬 방법 및 그 전자 장치
JP2018055256A (ja) 情報処理装置、情報処理方法及びプログラム
US20160092729A1 (en) Information processing device, information processing method, and computer program product
JP5330576B1 (ja) 情報処理装置および筆跡検索方法
US8644612B2 (en) Information processing apparatus and locus data recognition method
WO2016031016A1 (ja) 電子機器、方法及びプログラム
JP6772629B2 (ja) 情報処理装置、文字入力プログラムおよび文字入力方法
JP2014044555A (ja) 画像処理装置、画像処理システム及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180122

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190205

A603 Late request for extension of time limit during examination

Free format text: JAPANESE INTERMEDIATE CODE: A603

Effective date: 20190507

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190603

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190806

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190819

R150 Certificate of patent or registration of utility model

Ref document number: 6582464

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150