JP6481204B2 - 情報処理装置と、その処理方法及びプログラム - Google Patents

情報処理装置と、その処理方法及びプログラム Download PDF

Info

Publication number
JP6481204B2
JP6481204B2 JP2015223365A JP2015223365A JP6481204B2 JP 6481204 B2 JP6481204 B2 JP 6481204B2 JP 2015223365 A JP2015223365 A JP 2015223365A JP 2015223365 A JP2015223365 A JP 2015223365A JP 6481204 B2 JP6481204 B2 JP 6481204B2
Authority
JP
Japan
Prior art keywords
character string
area
value
character
key
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015223365A
Other languages
English (en)
Other versions
JP2017091379A (ja
JP2017091379A5 (ja
Inventor
新一 三浦
新一 三浦
孝文 白波瀬
孝文 白波瀬
真一 鷲田
真一 鷲田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Marketing Japan Inc
Original Assignee
Canon Marketing Japan Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Marketing Japan Inc filed Critical Canon Marketing Japan Inc
Priority to JP2015223365A priority Critical patent/JP6481204B2/ja
Publication of JP2017091379A publication Critical patent/JP2017091379A/ja
Publication of JP2017091379A5 publication Critical patent/JP2017091379A5/ja
Application granted granted Critical
Publication of JP6481204B2 publication Critical patent/JP6481204B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)

Description

本発明は、文書画像の所望の箇所の値を容易に取得可能とする画像処理技術に関する。
従来、様々な画像処理技術が開示されている。その中で、ブロックセレクション技術というものが存在する。
ブロックセレクション技術とは、1ページ内の画像データの認識を行い、文字領域、図領域、写真領域、表領域等のブロックに分類を行うものである。このブロックセレクション技術により得られた文字領域を文字認識することが行われている。ブロックセレクション技術については、特許文献1に開示されている。
また、ブロックセレクションを用いないで文字認識する場合には、事前に文字認識領域をテンプレートとして定義することが必要となる。文字認識領域を定義する技術については、特許文献2に開示されている。
特開2006−195887号公報 特開2005−267394号公報
ブロックセレクション技術を用いると、様々なフォームから文字情報を取得できるため、利便性が高い一方、所定の範囲(例えば、文字列が複数行にわたる範囲)でブロック分けするため、ブロック内の文字列をすべて抽出することになり、必要な文字列の取得することは技術的に困難であった。
また、文字認識領域を定義して文字列を取得する技術においては、設定が煩雑であった。さらに、フォームごとに設定を作る必要があり、容易に文字列を取得することができなかった。
そこで、本発明の目的は、文書画像から所望の箇所の値を容易に取得できる仕組みを提供することである。
本発明の目的を達成するための、複数の異なる属性の領域を含む画像データから値を取得して出力する情報処理装置であって、前記画像データの中で、複数の文字列で書かれた文字領域を特定する文字領域特定手段と、前記文字領域の複数の文字列のそれぞれの文字列の領域を抽出し、前記抽出した領域でキー文字列を複数箇所で特定するキー文字列特定手段と、前記複数箇所で特定したキー文字列毎に予め対応づけられた位置条件に合致する前記抽出した領域にある値を、前記出力するべく取得する取得手段と、前記出力するべく取得するための設定情報として記憶し、前記キー文字列毎に予め対応づけられた位置条件を、前記キー文字列と前記値との相対的な方向及び前記キー文字列から前記相対的な方向を見た場合の前記値の取得位置を特定可能な数で設定する設定手段とを備えることを特徴とする情報処理装置。
本発明によれば、文書画像から所望の箇所の値を容易に取得できる。
画像処理システムの構成例を示す図である PC201の概略構成を示すブロック図である 画像処理システムにて実行される画像処理の概略を示すフローチャートである 設定条件(設定ファイル)作成処理のフローチャートである 設定条件による値取得処理のフローチャートである ブロック情報の一例を示すデータ図である 文字認識領域情報の一例を示すデータ図である 設定ファイルの一例を示すデータ図である 読み込む文書画像の一例を示すイメージ図である ブロック情報を文書画像上で表示した場合のイメージ図である 文字認識領域情報を選択領域として文書画像上で表示した場合のイメージ図である 設定情報を生成するための設定画面の一例を示す図である 値取得領域の選択を受け付けた場合に設定画面の一例を示す図である 値取得処理により取得された値を表示した画面の一例を示す図である
以下、本発明の実施形態を、図面を参照して詳細に説明する。
図1は、本発明の実施形態に係る画像処理方法が適用された画像処理システムの構成例を示す図である。
図1において、画像処理システムは、例えば、情報処理装置としてのパーソナルコンピュータ(PC)201と、画像読取装置としてのスキャナ202と、印刷装置としてのプリンタ203とを備え、これらがネットワーク204を介して互いに接続されている。
スキャナ202は、紙文書を光学的に読み取って電子化し、その画像データをPC201に送ることができる。PC201は、受信した画像データに対して所定の画像処理を実行する。その際、オペレータがキーボードやマウス等を操作して処理結果の確認および修正を行うことができる。プリンタ203は、所定の画像処理が行われた画像データをPC201から受信して印刷を行う。
ネットワーク204は、インターネット、LANやWAN、電話回線、専用デジタル回線、ATMやフレームリレー回線、通信衛星回線、ケーブルテレビ回線、データ放送用無線回線等のいずれか、またはこれらの組み合わせにより実現される、いわゆる通信ネットワークであり、データの送受信が可能であればよい。
なお、本発明の実施形態に係る画像処理方法を図示の画像処理システムに適用した形態について説明するが、これに限定されず、スキャナやプリンタが一体的に構成された複合機に適用した形態であってもよい。また、PC201は、スキャナ202から入力された画像データに限らず、デジタルカメラ等で撮影された文書画像データに対して本発明の画像処理方法を実行してもよく、画像データの入力先や入力方法を限定するものではない。
図2は、図1のPC201の概略構成を示すブロック図である。
PC201において、CPU101は、ROM102に格納されている制御プログラムに従って装置全体の制御を行う。ROM102は、CPU101が実行する後述する処理等の制御プログラムを含む各種プログラムや各種パラメータデータを格納する。RAM103は、記憶装置104からロードされたプログラムを一時的に記憶したり、エリア画像や各種データを記憶する。また、RAM103は、データの作業領域や一時待避領域として機能する。
記憶装置104は、例えば、ハードディスクやCD−ROM等で構成され、画像データを管理するデータベースを含む各種データを記憶する。ディスプレイ105は、例えば、LCDやCRTで構成される。入力装置106は、例えば、マウスやキーボード、ペンタブレット等で構成される。
ネットワークインターフェース(I/F)109は、ネットワーク204上に接続されている外部装置(スキャナ202やプリンタ203に限らず、不図示のサーバや外部記憶装置等)と通信し、プログラムやデータを読み込んだり、書き込んだりする。
図3は、図1の画像処理システムにて実行される画像処理の概略を示すフローチャートである。本処理は、PC201内の画像処理プログラムに基づいてCPU101により実行される処理である。なお、図3の詳細な処理を示すフローチャートは、図4と図5を用いて説明する。
まず、ステップS301では、PC201は、スキャナ202を制御して紙文書の画像を読み取らせて、その画像データを取得する。次に、PC201は、画像に対してブロックセレクション処理を行って、画像から表、文字、絵や図、枠、線の各領域を抽出する。
ブロックセレクション処理とは、図9のように読み取った一頁のイメージデータをオブジェクト毎の塊として認識し、該ブロック各々を文字/ 図画/ 写真/線/表等の属性に判定し、異なる属性を持つ領域に分割する処理である。
具体的には、先ず、入力画像を白黒に二値化し、輪郭線追跡をおこなって黒画素輪郭で囲まれる画素の塊を抽出する。面積の大きい黒画素の塊については、内部にある白画素に対しても輪郭線追跡をおこない白画素の塊を抽出、さらに一定面積以上の白画素の塊の内部からは再帰的に黒画素の塊を抽出する。
このようにして得られた黒画素の塊を、大きさおよび形状で分類し、異なる属性を持つ領域へ分類していく。たとえば、縦横比が1に近く、大きさが一定の範囲のものを文字相当の画素塊とし、さらに近接する文字が整列良くグループ化可能な部分を文字領域、扁平な画素塊を線領域、一定大きさ以上でかつ四角系の白画素塊を整列よく内包する黒画素塊の占める範囲を表領域、不定形の画素塊が散在している領域を写真領域、それ以外の任意形状の画素塊を図画領域、などとする。
ブロックセレクション処理で得られた各ブロックに対するブロック情報を図6に示す。図6に示すブロック情報に対応する画像の例が図10である。なお、各ブロック情報は画面上で表示されないが、説明のために図10で各ブロックを示すものとする。
このブロックセレクション処理で得られたブロックのうち、テキスト属性(種別)を持つブロックを取得し、このブロックについて文字認識処理を行う。文字認識技術については既知の技術であるため説明を省略する。
文字認識をした結果得られた文字列から、複数行にわたる領域かを判定し、複数行にわたる場合には、各行に分割して、領域として登録する。1行はそのままの領域として登録する。文字認識した場合に得られた領域(座標)も取得できるため、その座標を登録する。領域として登録されたデータの例が図7である。図6のブロック4が5つの領域として分割され、登録されている(701)。
なお、文字認識の結果によっては、行が分かれる「個人番号」「123456789012」場合は、702のように、わかれて登録される。
この登録された領域を用いて、設定画面上(図13)で、ユーザにより選択し、値取得領域を特定するための条件(設定条件)を作成する。作成された設定条件を、設定ファイル(図8)に保存して、記憶装置104に記憶する。
ステップS302では、PC201は、実際に値を取得したい画像を読み込み、ステップS301で作成した設定条件に従って、値を取得する領域を特定する。この特定は、ステップS301で説明した処理と同様に、ブロックセレクションにより得られたブロックに対して文字認識処理を行い、行分割して、領域を登録する。この領域から、設定条件のキー領域の検索文字列(例えば、通知カード)を基に、キー領域を検索して、このキー領域から、条件(例えば、下、1)を用いて、キー領域の下の1つ目の領域を値取得領域として特定する。
ステップS303では、PC201は、値取得領域として特定された領域に登録されている文字列(数字)を取得して、ディスプレイ105に表示する。ディスプレイへの表示例は、図14である。また、ユーザからの出力指示によりCSVファイル等に取得した値のデータ群をエクスポートして出力する。
次に図4〜図5を用いて、本実施形態における詳細処理について説明する。なお、図4〜図5は、図1の画像処理システムにて実行される画像処理の詳細を示すフローチャートである。本処理は、PC201内の画像処理プログラムに基づいてCPU101により実行される処理である。図4は、設定条件(設定ファイル)作成処理のフローチャートであり、図5は、設定条件による値取得処理のフローチャートである。
まず、図4のフローチャートを用いて説明する。
ステップS401では、PC201は、ユーザの操作により、画像処理プログラムを実行させ、不図示のメニューから設定条件作成機能が選択されたか。値取得機能が選択されたかを判定する。設定条件作成機能が選択された場合にはステップS402へ処理を移す。値取得機能が選択された場合には、図5へ処理を移す。
ステップS402では、PC201はスキャナから取り込まれた画像、或いは所定のフォルダに格納されている画像を読み込む。読み込まれた画像の例が、図8である。
ステップS403では、PC201は、読み込まれた画像を用いて、ブロックセレクション処理を実行する。なお、ブロックセレクション処理については、ステップS301の通りである。このブロックセレクションは、ブロックセレクションライブラリを用いて実行する。ブロックセレクションで得られるブロック情報は図6である。
ここで、図6を説明する。ブロックID、種別(テキスト、図、表・・・)領域情報(座標X、座標Y、幅、高さ)を有している。これらのブロック情報は、ブロックセレクションライブラリが生成するものである。
ステップS404では、PC201は、ブロックセレクションライブラリからテキスト種別、表種別を有するブロック情報を取得する。
ステップS405では、PC201は、取得したブロックに対して、文字認識処理を行う。文字認識処理は既知の技術であり説明を省略するが、例えば、パターンマッチングを用いて、記入文字と文字のテンプレートを照合して、文字候補を抽出する技術がある。
文字認識処理により、文字列(数字含む)と、その文字列の領域情報(座標)が取得できる。領域情報は、文字列を囲む枠を示す領域である。文字認識した結果は、ブロックごとにメモリで管理されるものとする。
ステップS405では、すべてのブロックに対して、まず文字認識を実行し、ステップS408の処理へ移行するようにしているが、1ブロックごとに、文字認識を行い、S408の判定を行ってもよい。すなわち、すべてのブロックに対して文字認識を実行したあとに、ステップS408の判定を実行する手順に限定されるものではない。
ステップS406では、PC201は、すべてのブロックに対して、処理を実行したか否かを判定する。すべてのブロックに対して処理が行われていない場合、次に処理するブロックの文字列を取得するべくステップS407へ処理を移す。すべてのブロックに対して処理を実行した場合には、ステップS411へ処理を移す。
ステップS407では、PC201は、処理対象のブロックの文字認識結果(文字列)をメモリから取得する。
ステップS408では、PC201は、取得した文字列が複数行の文字列かを判定する。図10を参照し、ブロック4を例にとると、5行にわたる文字列が取得できるため、ステップS410へ処理を移す。また、ブロック1を例にとると、1行の文字列が取得できるため、ステップS409へ処理を移す。
ステップS409では、PC201は、文字認識結果を、図7の文字認識領域情報に登録する。図7では、領域IDと、文字認識結果から得られる文字列と、文字列がある位置を示す領域情報(座標)を登録する。
ステップS410では、PC201は、行ごとに分割して、文字認識領域情報に登録する。図7の701に示す通り、ブロック4の文字列が、5つの領域に分けて登録される。なお、領域情報(座標)は、それぞれの行の文字列のある位置の座標が登録される。
なお、この図7に登録された領域が、後述する設定画面で選択可能な選択領域となる。
ステップS411では、PC201は、図7の文字認識領域情報の座標を用いて、選択領域を表示する。選択領域を表示した例が、図11であり、選択領域は、破線で示されている。すなわち、設定情報を生成すべく、文字認識処理により得られた文字認識領域を表示する表示処理の一例を示すステップである。
ステップS412では、PC201は、選択領域を表示する際に、設定画面を合わせて表示する。設定画面の例が、図12である。なお、設定画面の表示は、S402の画面を読み込む際に事前に表示されている構成であってもよく、手順を限定するものではない。
ステップS413では、PC201は、ユーザの操作により、キー領域とする領域の選択を受ける。図12の例を基に詳述すると、1200にフォーカスがある状態で、1201の領域を選択すると、1200に選択された領域名がインプットされる。領域名は、図7の文字列から取得して表示する。何文字目までを領域名とするか、スペースなどの区切りまでを領域名とするかは予め設定されているものとする。
すなわち、キーとなる領域を、表示された文字認識領域から選択する第1の選択処理の一例を示すステップである。
1201と1202は、実線で示されている通り、キー領域として選択されたことを示している。また、未選択の領域と識別できるように表示する。これにより、キー領域としてどの領域を選択しているのかを把握しやすくなる。
条件(and、or)については、ユーザが任意に選択するものとする。位置については、後述するが、値取得領域として領域が選択された場合に、表示される。
ステップS414では、PC201は、上述したように選択した領域の領域名を設定画面に表示する。複数のキー領域を選択する場合には、次の領域を繰り返し選択する。
ステップS415では、PC201は、値取得領域とする領域の選択を受け付ける。図13の例を基に詳述すると、1300にフォーカスがある状態で、1301の領域を選択すると、1300に選択された領域名がインプットされる。領域名は、図7の文字列から取得して表示する。何文字目までを領域名とするか、スペースなどの区切りまでを領域名とするかは予め設定されているものとする。
すなわち、値取得領域となる領域を、表示された文字認識領域から選択する第2の選択処理の一例を示すステップである。
1301は、斜め線で網掛け表示されている通り、値取得領域として選択されたことを示している。また、未選択の領域、キー領域と識別できるように表示する。これにより、キー領域として、また値取得領域としてどの領域を選択しているのかを把握しやすくなり、設定作業が容易になる。
すなわち、第1の選択処理で選択されたキーとなる領域と、第2の選択処理で選択された値取得領域となる領域とを識別可能に表示する識別表示処理の一例を示すステップものである。
ステップS416では、PC201は、上述したように選択した領域(値取得領域)の領域名を設定画面に表示する。
ステップS417では、PC201は、キー領域と値取得領域の関係(位置)取得する。具体的には、キー領域として選択した領域の領域情報(座標)と、値取得領域として選択した領域の領域情報(座標)から位置関係を算出する。例えば、値取得領域がキー領域の下に位置すると判定された場合には、キー領域から下方向で、何個目の領域かを決定する。図13の例では、1301は、通知カードの領域の下にある領域と判定され、1個目の領域と決定される。この位置の決定を、選択されたキー領域ごとに行い、関係の位置情報を取得する。
すなわち、第1の選択処理により選択されたキーとなる領域の領域情報と第2の選択処理により選択された値取得領域の領域情報に従って、キーとなる領域に対応する値取得領域の位置を特定する特定処理の一例を示すステップである。
ステップS418では、PC201は、ステップS417で取得した位置情報を1302に条件として設定して、表示する。
ステップS419では、PC201は、その他の条件設定の入力を受け付ける。例えば、取得値属性、桁数などである。
なお、ステップS413〜ステップS419の処理に対応する操作は、ユーザが任意の順番で入力操作ができるため、フローチャートに記載の手順に限定されるものではない。
ステップS420では、PC201は、ユーザの操作により登録ボタンが押下されると、設定画面で入力された条件(設定情報)を設定ファイルに保存する。すなわち、特定処理により特定された位置を位置条件として設定し、第1の選択処理で選択されたキーとなる領域の文字列をキー文字列として設定する処理の一例を示すステップである。なお、図13の設定画面での各項目へインプットも設定処理の一例である。
設定ファイルの保存例は、図8である。801は、701のように領域が登録された場合の例であり、802は、702のように個人番号と、数字の領域が別の行として認識され、領域が登録された場合の例である。そして、キー領域として、通知カード、個人番号が選択された場合の例である。
なお、図8の設定ファイルの設定情報は、キーとなる領域を特定するためのキー文字列(例えば、キー領域の検索文字列:通知カード)と、キーとなる領域に基づき文字列を取得する領域を特定するための位置条件(条件:下、1)を含む設定情報と言い換えることが可能である。
続いて、図5を用いて、設定条件による値取得処理のフローチャートについて説明する。
ステップS501では、PC201は、設定ファイルから設定情報を読み込む。利用する設定ファイルは、ユーザが任意に選択して読み込んでもよい。
ステップS502では、PC201は、PC201はスキャナから取り込まれた画像、或いは所定のフォルダに格納されている画像を読み込む。
ステップS503では、PC201は、PC201は、読み込まれた画像を用いて、ブロックセレクション処理を実行する。このブロックセレクションは、ブロックセレクションライブラリを用いて実行する。なお、ブロックセレクション処理については、ステップS301の通りである。また、ブロック情報は図6と同様である。さらに、ブロックセレクションライブラリで文字認識処理を実行してもよい。
ステップS504では、PC201は、ブロックセレクションライブラリからテキスト種別、表種別を有するブロック情報を取得する。
ステップS505では、PC201は、取得したブロックに対して、文字認識処理を行う。文字認識処理は既知の技術であり説明を省略するが、例えば、パターンマッチングを用いて、記入文字と文字のテンプレートを照合して、文字候補を抽出する技術がある。
文字認識処理により、文字列(数字含む)と、その文字列の領域情報(座標)が取得できる。領域情報は、文字列を囲む枠を示す領域である。文字認識した結果は、ブロックごとにメモリで管理されるものとする。
ステップS505では、すべてのブロックに対して、まず文字認識を実行し、ステップS508の処理へ移行するようにしているが、1ブロックごとに、文字認識を行い、S508の判定を行ってもよい。すなわち、すべてのブロックに対して文字認識を実行したあとに、ステップS508の判定を実行する手順に限定されるものではない。
ステップS506では、PC201は、すべてのブロックに対して、処理を実行したか否かを判定する。すべてのブロックに対して処理が行われていない場合、次に処理するブロックの文字列を取得するべくステップS507へ処理を移す。すべてのブロックに対して処理を実行した場合には、ステップS509へ処理を移す。
ステップS507では、PC201は、処理対象のブロックの文字認識結果(文字列)をメモリから取得する。すなわち、所定の領域の画像に対する文字認識結果(ブロックの文字認識の結果)により得られる文字列を取得する取得処理の一例を示すステップである。所定の領域とは、例えば、ブロックセレクションにより得られた領域である。
ステップS508では、PC201は、取得した文字列が複数行の文字列かを判定する。ステップS408の処理と同様のため、図10を参照し説明する。ブロック4を例にとると、5行にわたる文字列が取得できるため、ステップS510へ処理を移す。また、ブロック1を例にとると、1行の文字列が取得できるため、ステップS509へ処理を移す。すなわち、ステップS508は、取得処理により取得された文字列が複数行の文字列か否かを判定する複数行判定処理の一例を示すステップである。
ステップS509では、PC201は、文字認識結果をメモリに記憶する。なお、ステップS409の処理と同様のため、図7を用いて説明する。文字認識結果は図7の文字認識領域情報に登録される。図7では、領域IDと、文字認識結果から得られる文字列と、文字列がある位置を示す領域情報(座標)を登録する。
ステップS510では、PC201は、行ごとに領域を分割して、文字認識領域情報を生成し、登録する。図7の701に示す通り、ブロック4の文字列が、5つの領域に分けて登録される。なお、領域情報(座標)は、それぞれの行の文字列のある位置の座標が登録される。
なお、図7の文字認識領域情報は、文字認識処理により得られた文字認識領域と言い換えることが可能である。また、ステップS510は、複数行判定処理により複数行と判定された場合に、行ごとの文字認識領域を生成する生成処理の一例を示すステップである。
ステップS511では、PC201は、読み込まれた設定情報のキー領域の検索文字列(図8参照)を取得して、文字認識領域情報を検索する。キー領域の検索文字列に従って、文字認識領域情報の文字列で一致する領域を特定する。これにより、一致した領域がキー検索領域となる。すなわち、キー文字列に従って、文字認識処理により得られた文字認識領域から、キーとなる領域を特定するキー領域特定処理の一例を示すステップである。また、詳細には、生成処理により生成された文字認識領域から、キーとなる領域を特定する処理の一例を示すステップである。
ステップS512では、PC201は、キー領域と、設定情報の条件(例えば、「下、1」)を取得して、キー領域から1つ下の領域を特定する。キー領域の座標を基に、文字認識領域情報(例えば、図7)を参照して下方向の座標を有する領域を検索し、特定する。この特定した領域が値取得領域となる。なお、下方向の座標を有する領域のうち、一番近い座標を持つ領域から順に1つ目の領域、2つ目の領域とする。
キー領域が複数ある場合には、キー領域の条件「and、or」に従って、値取得領域を特定する。
すなわち、特定されたキーとなる領域と設定情報の位置条件に従って、文字認識領域から値取得領域を特定する値取得領域特定処理の一例を示すステップである。
ステップS512で値取得領域が特定できた場合には、画像上に値取得箇所を示すように、値取得領域の座標に従って、枠等の識別表示を行う。なお、識別表示した例が、図14の1401である。図14は、図9の帳票とは異なる個人を例にした帳票の画像(文書画像)で、値取得表示と、識別表示をしている。
ステップS511とステップS512により、キー領域を特定したうえで、キー領域から位置条件(例えば、下、1)にある領域を特定して値を取得するため、誤った位置の値を取得することがなくなる。文字認識定義のあるテンプレートを用いた場合には、ユーザによる貼り付け誤差によって、適切な値が取得できないが、本処理を用いることにより貼り付け誤差があっても取得したい箇所の値を取得することが可能となる。
ステップS513では、PC201は、ステップS512で特定した値取得領域の文字列を取得する。文字列の取得は、文字認識領域情報(例えば、図7)の文字列から取得する。この時、出力条件(例えば「数字、12ケタ」)に従って、必要な文字列を取得する。
ステップS514では、PC201は、取得した文字列(値)を認識結果画面1402に表示する。すなわち、特定された値取得領域の文字列を出力する表示出力処理の一例を示すステップである。
なお、ステップS513で出力条件に合致する値が取得できない場合にはエラーを通知する。認識結果に誤りがあった場合には、ユーザにより、修正入力エリアに修正値を入力させることが可能である。修正入力エリアに入力された場合には、入力値が登録される値となる。
ステップS515では、PC201は、認識結果をCSVファイルに出力する。なお、複数の画像が読み込まれた場合には、すべての画像に対して、値取得を実行し、図14の登録ボタンで値を登録して、最後の画像に対する値を登録すると、CSVファイルにて値を出力する。出力するファイルの形式は一例であり、限定されるものではない。
また、ファイルの出力先を任意に指定する、出力する際には、不図示の出力ボタンを押下することで、所定の出力先に認識結果(値)を出力することが可能であることは言うまでもない。
出力する値としては、「987654321098」だけでもよいし、987654321098の領域名(個人番号)と合わせて出力してもよい。
以上、本実施形態によれば、文書画像から所望の箇所の値を容易に取得できる。
特に、煩雑な設定が必要な文字認識領域を設定したテンプレートを用いることなく、容易に値取得する条件を設定することができる。また、ブロックセレクションにより複数行にわたる文字列が取得できる場合においても、所定の位置にある値を容易かつ精度よく取得させることが可能となる。
例えば、テンプレートと用いる文字認識技術を用いた場合に、申請書に貼り付け書類があると、貼付け位置がずれてしまうと認識領域がずれてしまい、誤った値が取得されるという技術的な課題がある。本実施形態では、貼付け位置が上下左右にずれたとしても、ブロックセレクションを用いて、キー領域を特定したうえで、キー領域から位置条件にある領域を特定して値を取得するため、誤った位置の値を取得することがなくなるという効果を得ることできる。
なお、上述した各種データの構成及びその内容はこれに限定されるものではなく、用途や目的に応じて、様々な構成や内容で構成されることは言うまでもない。例えば、本実施形態では、値取得領域を特定する条件として、「1つ」下の領域という形で領域単位で条件を持たせるようにしたが、キー領域からの相対的な位置を持たせるようにしてもよい。すなわち、値取得領域を特定するためのキー領域からの位置条件を持たせる構成であればよい。
以上、一実施形態について示したが、本発明は、例えば、システム、装置、方法、プログラムもしくは記録媒体等としての実施態様をとることが可能であり、具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。例えば、クラウド環境で実現する構成であってもよい。その場合、クラウド環境上のサーバで、設定ファイル作成ツールが実行される。
また、本発明におけるプログラムは、図3〜図5に示すフローチャートの処理方法をコンピュータが実行可能なプログラムである。なお、記憶媒体に図3〜図5の処理方法をコンピュータが実行可能なプログラムが記憶される構成であってもよい。なお、本発明におけるプログラムは図3〜図5の各装置の処理方法ごとのプログラムであってもよい。
以上のように、前述した実施形態の機能を実現するプログラムを記録した記録媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記録媒体に格納されたプログラムを読出し実行することによっても、本発明の目的が達成されることは言うまでもない。
この場合、記録媒体から読み出されたプログラム自体が本発明の新規な機能を実現することになり、そのプログラムを記憶した記録媒体は本発明を構成することになる。
プログラムを供給するための記録媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、DVD−ROM、磁気テープ、不揮発性のメモリカード、ROM、EEPROM、シリコンディスク、ソリッドステートドライブ等を用いることができる。
また、コンピュータが読み出したプログラムを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPU等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
また、本発明は、複数の機器から構成されるシステムに適用しても、1つの機器からなる装置に適用してもよい。また、本発明は、システムあるいは装置にプログラムを供給することによって達成される場合にも適応できることは言うまでもない。この場合、本発明を達成するためのプログラムを格納した記録媒体を該システムあるいは装置に読み出すことによって、そのシステムあるいは装置が、本発明の効果を享受することが可能となる。
さらに、本発明を達成するためのプログラムをネットワーク上のサーバ、データベース等から通信プログラムによりダウンロードして読み出すことによって、そのシステムあるいは装置が、本発明の効果を享受することが可能となる。
なお、上述した各実施形態およびその変形例を組み合わせた構成も全て本発明に含まれるものである。
101 CPU
102 RAM
104 記憶装置
201 PC
202 スキャナ
203 プリンタ

Claims (11)

  1. 複数の異なる属性の領域を含む画像データから値を取得して出力する情報処理装置であって、
    前記画像データの中で、複数の文字列で書かれた文字領域を特定する文字領域特定手段と、
    前記文字領域の複数の文字列のそれぞれの文字列の領域を抽出し、前記抽出した領域でキー文字列を複数箇所で特定するキー文字列特定手段と、
    前記複数箇所で特定したキー文字列毎に予め対応づけられた位置条件に合致する前記抽出した領域にある値を、前記出力するべく取得する取得手段と、
    前記出力するべく取得するための設定情報として記憶し、前記キー文字列毎に予め対応づけられた位置条件を、前記キー文字列と前記値との相対的な方向及び前記キー文字列から前記相対的な方向を見た場合の前記値の取得位置を特定可能な数で設定する設定手段と
    を備えることを特徴とする情報処理装置。
  2. 前記特定された文字領域にある文字列が複数行の文字列か否かを判定する複数行判定手段と、
    前記複数行判定手段により複数行と判定された場合に、行ごとの文字領域を生成する生成手段と
    を更に備え、
    前記キー文字列特定手段は、前記生成手段により生成された行ごとの文字領域の複数の文字列のそれぞれの文字列の領域を抽出し、前記抽出した領域でキー文字列を複数箇所で特定することを特徴とする請求項に記載の情報処理装置。
  3. 前記文字領域は、ブロックセレクションにより得られた領域であることを特徴とする請求項1または2に記載の情報処理装置。
  4. 前記設定手段は、前記抽出した領域で前記キー文字列のある領域と前記値のある領域との指定を受け付けることにより、前記キー文字列に対応づけられる位置条件を、前記キー文字列と前記値との相対的な方向及び前記キー文字列から前記相対的な方向を見た場合の前記値の取得位置を特定する数で設定することを特徴とする請求項1〜3のいずれか1項に記載の情報処理装置。
  5. 前記設定情報を生成すべく、前記特定された文字領域を表示する表示手段と、
    前記キー文字列のある領域を、前記表示手段で表示された文字領域から指定を受け付ける第1の受付手段と、
    前記値のある領域を、前記表示手段で表示された文字領域から指定を受け付ける第2の受付手段と
    更に備えることを特徴とする請求項に記載の情報処理装置。
  6. 前記第1の受付手段で指定されたキー文字列のある領域と、前記第2の受付手段で指定された値のある領域とを識別可能に表示する識別表示手段を更に備えることを特徴とする請求項に記載の情報処理装置。
  7. 複数の異なる属性の領域を含む画像データから値を取得して出力する情報処理装置であって、
    前記画像データの中で、複数の文字列で書かれた文字領域を特定する文字領域特定手段と、
    前記文字領域の複数の文字列のそれぞれの文字列の領域を抽出し、前記抽出した領域でキー文字列を特定するキー文字列特定手段と、
    記特定したキー文字列に予め対応づけられた位置条件に合致する領域にある文字列全体を取得する取得手段と、
    前記取得した文字列全体に前記特定したキー文字列が含まれる場合に、前記出力するべく取得する値に対して予め設定された出力条件に従って前記取得した文字列全体から当該キー文字列を除いた値を、前記出力するべく取得する値取得手段と
    を備えることを特徴とする情報処理装置。
  8. 複数の異なる属性の領域を含む画像データから値を取得して出力する情報処理装置の処理方法であって、
    文字領域特定手段が、前記画像データの中で、複数の文字列で書かれた文字領域を特定する文字領域特定ステップと、
    キー文字列特定手段が、前記文字領域の複数の文字列のそれぞれの文字列の領域を抽出し、前記抽出した領域でキー文字列を複数箇所で特定するキー文字列特定ステップと、
    取得手段が、前記複数箇所で特定したキー文字列毎に予め対応づけられた位置条件に合致する前記抽出した領域にある値を、前記出力するべく取得する取得ステップと
    設定手段が、前記出力するべく取得するための設定情報として記憶し、前記キー文字列予め対応づけられた位置条件を、前記キー文字列と前記値との相対的な方向及び前記キー文字列から前記相対的な方向を見た場合の前記値の取得位置を特定する数で設定する設定ステップと
    を備えることを特徴とする処理方法。
  9. 複数の異なる属性の領域を含む画像データから値を取得して出力する情報処理装置において実行可能なプログラムであって、
    前記情報処理装置を、
    前記画像データの中で、複数の文字列で書かれた文字領域を特定する文字領域特定手段と、
    前記文字領域の複数の文字列のそれぞれの文字列の領域を抽出し、前記抽出した領域でキー文字列を複数箇所で特定するキー文字列特定手段と、
    前記複数箇所で特定したキー文字列毎に予め対応づけられた位置条件に合致する前記抽出した領域にある値を、前記出力するべく取得する取得手段と、
    前記出力するべく取得するための設定情報として記憶し、前記キー文字列毎に予め対応づけられた位置条件を、前記キー文字列と前記値との相対的な方向及び前記キー文字列から前記相対的な方向を見た場合の前記値の取得位置を特定可能な数で設定する設定手段
    として機能させるためのプログラム。
  10. 複数の異なる属性の領域を含む画像データから値を取得して出力する情報処理装置の処理方法であって、
    文字領域特定手段が、前記画像データの中で、複数の文字列で書かれた文字領域を特定する文字領域特定ステップと、
    キー文字列特定手段が、前記文字領域の複数の文字列のそれぞれの文字列の領域を抽出し、前記抽出した領域でキー文字列を特定するキー文字列特定ステップと、
    取得手段が、前記特定したキー文字列に予め対応づけられた位置条件に合致する領域にある文字列全体を取得する取得ステップと、
    値取得手段が、前記領域から前記取得した文字列全体に前記特定したキー文字列が含まれる場合に、それぞれの前記出力するべく取得する値に対して予め設定された出力条件に従って、前記取得した文字列全体から当該キー文字列を除いた値を、前記出力するべく取得する値取得ステップと
    を備えることを特徴とする処理方法。
  11. 複数の異なる属性の領域を含む画像データから値を取得して出力する情報処理装置において実行可能なプログラムであって、
    前記情報処理装置を、
    前記画像データの中で、複数の文字列で書かれた文字領域を特定する文字領域特定手段と、
    前記文字領域の複数の文字列のそれぞれの文字列の領域を抽出し、前記抽出した領域でキー文字列を特定するキー文字列特定手段と、
    前記特定したキー文字列に予め対応づけられた位置条件に合致する領域にある文字列全体を取得する取得手段と、
    前記取得した文字列全体に前記特定したキー文字列が含まれる場合に、前記出力するべく取得する値に対して予め設定された出力条件に従って前記取得した文字列全体から当該キー文字列を除いた値を、前記出力するべく取得する値取得手段
    として機能させるためのプログラム。
JP2015223365A 2015-11-13 2015-11-13 情報処理装置と、その処理方法及びプログラム Active JP6481204B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015223365A JP6481204B2 (ja) 2015-11-13 2015-11-13 情報処理装置と、その処理方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015223365A JP6481204B2 (ja) 2015-11-13 2015-11-13 情報処理装置と、その処理方法及びプログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2019019392A Division JP6795770B2 (ja) 2019-02-06 2019-02-06 情報処理装置と、その処理方法及びプログラム

Publications (3)

Publication Number Publication Date
JP2017091379A JP2017091379A (ja) 2017-05-25
JP2017091379A5 JP2017091379A5 (ja) 2017-12-07
JP6481204B2 true JP6481204B2 (ja) 2019-03-13

Family

ID=58768381

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015223365A Active JP6481204B2 (ja) 2015-11-13 2015-11-13 情報処理装置と、その処理方法及びプログラム

Country Status (1)

Country Link
JP (1) JP6481204B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6364051B2 (ja) * 2016-09-15 2018-07-25 株式会社アイエスピー ガイダンス付き文書情報取得方法、プログラム、及び携帯端末装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3814320B2 (ja) * 1995-12-14 2006-08-30 キヤノン株式会社 画像処理方法及び装置
JP3394694B2 (ja) * 1997-08-29 2003-04-07 沖電気工業株式会社 フォーマット情報登録方法及びocrシステム
JP2003223610A (ja) * 2002-01-28 2003-08-08 Toshiba Corp 文字認識装置及び文字認識方法
JP6404579B2 (ja) * 2014-03-05 2018-10-10 グローリー株式会社 売上管理システム及び売上管理方法

Also Published As

Publication number Publication date
JP2017091379A (ja) 2017-05-25

Similar Documents

Publication Publication Date Title
JP2019041150A5 (ja)
JP2007279828A (ja) 帳票処理装置、帳票様式作成装置、帳票、帳票処理用のプログラム、帳票様式作成用のプログラム
JP2011165187A (ja) ドキュメントを表示する方法およびシステム
JP6826293B2 (ja) 情報処理システムと、その処理方法及びプログラム
JP2007049388A (ja) 画像処理装置及びその制御方法、プログラム
US9614984B2 (en) Electronic document generation system and recording medium
US11153446B2 (en) Information processing apparatus for presenting an object for a batch operation without selection in advance and non-transitory computer readable medium
JP6931168B2 (ja) 情報処理装置、制御方法、プログラム
US20160119500A1 (en) Image processing apparatus, terminal device, and non-transitory data recording medium recording control program
JP6481204B2 (ja) 情報処理装置と、その処理方法及びプログラム
JP2008131381A (ja) 帳票生成装置および帳票生成方法およびプログラムおよび記録媒体
US20180035007A1 (en) Image forming apparatus, storage medium, and method for digitizing document
JP2010068347A (ja) 画像形成装置、画像形成方法および画像形成プログラム
JP2018055256A (ja) 情報処理装置、情報処理方法及びプログラム
JP6558339B2 (ja) 画像処理装置及び画像処理プログラム
JP6795770B2 (ja) 情報処理装置と、その処理方法及びプログラム
JP7302175B2 (ja) 情報処理装置、及び情報処理プログラム
JP6700705B2 (ja) 振り分けシステム、情報処理方法、及びプログラム
JP6194781B2 (ja) 画像処理装置及びプログラム
JP2009251915A (ja) 文書処理装置及び文書処理方法
JP6947971B2 (ja) 情報処理装置、制御方法、プログラム
JP7383882B2 (ja) 情報処理装置、及び情報処理プログラム
JP2013069008A (ja) 電子書籍作成装置、電子書籍表示装置、電子書籍作成方法、電子書籍表示方法およびプログラム
JP6536542B2 (ja) 情報処理装置、制御方法、プログラム
JP5528410B2 (ja) ビューワ装置、サーバ装置、表示制御方法、電子コミック編集方法及びプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171026

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20171026

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20180703

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180926

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181002

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20181031

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181203

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190108

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20190109

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190121

R151 Written notification of patent or utility model registration

Ref document number: 6481204

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250