JP6682827B2 - 情報処理装置及び情報処理プログラム - Google Patents

情報処理装置及び情報処理プログラム Download PDF

Info

Publication number
JP6682827B2
JP6682827B2 JP2015232949A JP2015232949A JP6682827B2 JP 6682827 B2 JP6682827 B2 JP 6682827B2 JP 2015232949 A JP2015232949 A JP 2015232949A JP 2015232949 A JP2015232949 A JP 2015232949A JP 6682827 B2 JP6682827 B2 JP 6682827B2
Authority
JP
Japan
Prior art keywords
writing frame
attribute
document type
module
writing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015232949A
Other languages
English (en)
Other versions
JP2017102526A (ja
Inventor
野口 武史
武史 野口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2015232949A priority Critical patent/JP6682827B2/ja
Publication of JP2017102526A publication Critical patent/JP2017102526A/ja
Application granted granted Critical
Publication of JP6682827B2 publication Critical patent/JP6682827B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)

Description

本発明は、情報処理装置及び情報処理プログラムに関する。
特許文献1には、帳票定義データ作成時のユーザー負担を軽減することを課題とし、帳票処理装置は、ユーザーが指定した領域に対して、レイアウト情報の抽出及び指定した領域と関連がある項目名を抽出し、これらの情報を定義データに変換することにより、帳票定義データの自動作成を実施し、こうすることにより、定義位置のみを指定するだけで、定義データが自動作成されるため、ユーザーの帳票定義データの設定負担を軽減することができることが開示されている。
特開2004−258706号公報
帳票内の筆記枠の属性を設定するのに、例えば、特許文献1に記載された技術では、指定された読み取り領域内部や読み取り領域周辺の文字情報をイメージデータから認識し、認識結果を利用して定義データである属性を自動作成することが行われている。
しかし、文字情報の認識結果から属性を自動作成した場合、誤った認識結果となった場合は毎回誤った属性が自動作成されることになる。一方、既に筆記枠の属性が付与された文書型は蓄積されており、それらは正しい属性が付与されている。
本発明は、既に筆記枠の属性が付与された文書型の属性を、選択された筆記枠の属性又は属性の候補として設定するようにした情報処理装置及び情報処理プログラムを提供することを目的としている。
かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項1の発明は、文書型上で筆記枠を選択する選択手段と、前記文書型の特徴と選択された前記筆記枠の特徴を抽出する第1の抽出手段と、既に筆記枠の属性が付与された文書型から、前記文書型の特徴と前記筆記枠の特徴に類似する文書型を抽出する第2の抽出手段と、前記第2の抽出手段によって抽出された文書型内の筆記枠に付与された属性を、前記選択手段によって選択された筆記枠の属性又は属性の候補として設定する設定手段と、前記設定手段によって設定された筆記枠の属性又は属性の候補を用いて文字認識用の辞書及び認識の後処理としての文法処理で用いる辞書を設定する辞書設定手段を有する情報処理装置である。
請求項2の発明は、前記文書型が画像である場合、前記第1の抽出手段は、該文書型の画像処理結果の特徴又は選択された前記筆記枠の内側又は周囲にある文字の認識結果を、該文書型の特徴として抽出する、請求項1に記載の情報処理装置である。
請求項3の発明は、前記設定手段は、前記第2の抽出手段によって抽出された文書型内の筆記枠に付与された属性を、対象としている文書型内の複数の筆記枠の属性又は属性の候補として設定する、請求項1又は2に記載の情報処理装置である。
請求項4の発明は、前記設定手段は、前記第2の抽出手段によって文書型が抽出できなかった場合、操作者の操作にしたがって、前記筆記枠の属性を設定する、請求項1から3のいずれか一項に記載の情報処理装置である。
請求項5の発明は、コンピュータを、文書型上で筆記枠を選択する選択手段と、前記文書型の特徴と選択された前記筆記枠の特徴を抽出する第1の抽出手段と、既に筆記枠の属性が付与された文書型から、前記文書型の特徴と前記筆記枠の特徴に類似する文書型を抽出する第2の抽出手段と、前記第2の抽出手段によって抽出された文書型内の筆記枠に付与された属性を、前記選択手段によって選択された筆記枠の属性又は属性の候補として設定する設定手段と、前記設定手段によって設定された筆記枠の属性又は属性の候補を用いて文字認識用の辞書及び認識の後処理としての文法処理で用いる辞書を設定する辞書設定手段として機能させるための情報処理プログラムである。
請求項1の情報処理装置によれば、既に筆記枠の属性が付与された文書型の属性を、選択された筆記枠の属性又は属性の候補として設定することができる。
請求項2の情報処理装置によれば、文書型が画像である場合、その文書型の画像処理結果の特徴又は選択された筆記枠の内側又は周囲にある文字の認識結果を、その文書型の特徴として抽出することができる。
請求項3の情報処理装置によれば、選択された筆記枠だけでなく、対象としている文書型内の複数の筆記枠の属性又は属性の候補として設定することができる。
請求項4の情報処理装置によれば、文書型が抽出できなかった場合、操作者の操作にしたがって、筆記枠の属性を設定することができる。
請求項5の情報処理プログラムによれば、既に筆記枠の属性が付与された文書型の属性を、選択された筆記枠の属性又は属性の候補として設定することができる。
第1の実施の形態の構成例についての概念的なモジュール構成図である。 本実施の形態を利用したシステム構成例を示す説明図である。 第1の実施の形態による処理例を示すフローチャートである。 第1の実施の形態による処理対象の例を示す説明図である。 第1の実施の形態による処理例を示す説明図である。 第1の実施の形態による処理例を示す説明図である。 フォームテーブルのデータ構造例を示す説明図である。 筆記枠テーブルのデータ構造例を示す説明図である。 第2の実施の形態の構成例についての概念的なモジュール構成図である。 第2の実施の形態による処理例を示すフローチャートである。 本実施の形態を実現するコンピュータのハードウェア構成例を示すブロック図である。
以下、図面に基づき本発明を実現するにあたっての好適な各種の実施の形態の例を説明する。
<第1の実施の形態>
図1は、第1の実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム(コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム)、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するという意味である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態にしたがって、又はそれまでの状況・状態にしたがって定まることの意を含めて用いる。「予め定められた値」が複数ある場合は、それぞれ異なった値であってもよいし、2以上の値(もちろんのことながら、全ての値も含む)が同じであってもよい。また、「Aである場合、Bをする」という意味を有する記載は、「Aであるか否かを判断し、Aであると判断した場合はBをする」の意味で用いる。ただし、Aであるか否かの判断が不要である場合を除く。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」(社会システム)にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。なお、ここでの記憶装置としては、ハードディスク、RAM(Random Access Memory)、外部記憶媒体、通信回線を介した記憶装置、CPU(Central Processing Unit)内のレジスタ等を含んでいてもよい。
第1の実施の形態である情報処理装置100は、文書型上で筆記枠の属性(以下、プロパティともいう)を設定するものであって、図1の例に示すように、フォーム取得モジュール110、筆記枠選択モジュール115、フォーム特徴抽出モジュール120、筆記枠特徴抽出モジュール125、帳票情報記憶モジュール130、類似帳票抽出モジュール135、筆記枠プロパティ取得モジュール140、筆記枠プロパティ設定モジュール145、出力モジュール150を有している。ここで文書型とは、ユーザーが手書きで記入することが可能な領域である筆記枠を有しており、未だその記入が行われていない文書である。例えば、書類、帳票、伝票等の型(書式、フォーム、フォーマット、テンプレート等ともいわれる、以下、フォームともいう)が該当する。また、筆記枠は、一般的には、長方形(正方形を含む)の枠で構成されている領域であるが、手書きの文字等を記入可能であることを示す下線等で構成されている領域であってもよい。また、記入される文字等として、文字、記号(チェックマーク等)、サイン、印(スタンプ)等がある。また、ここで対象とする文書型は、フォームをスキャナ等で読み込んだ画像データであってもよいし、文書作成用アプリケーション(プログラム)によって作成された文書データであってもよい。
フォーム取得モジュール110は、フォーム特徴抽出モジュール120、筆記枠プロパティ設定モジュール145と接続されている。フォーム取得モジュール110は、文書型を取得する。文書型を取得するとは、例えば、スキャナ、カメラ等で文書型の画像データを読み込むこと、ファックス等で通信回線を介して外部機器から文書型の画像データを受信すること、ハードディスク(コンピュータに内蔵されているものの他に、ネットワークを介して接続されているもの等を含む)等に記憶されている文書型(画像データ、文書データ)を読み出すこと等が含まれる。画像データは、2値画像、多値画像(カラー画像を含む)であってもよい。受け付ける画像は、1枚であってもよいし、複数枚であってもよい。
筆記枠選択モジュール115は、筆記枠特徴抽出モジュール125と接続されている。筆記枠選択モジュール115は、文書型上で筆記枠を選択する。例えば、ユーザーのマウス等の操作によって、筆記枠を形成するようにしてもよいし、文書型上にある筆記枠を選択するようにしてもよい。文書型が画像データである場合は、筆記枠を形成する操作を受け付けるようにしてもよい。また、文書型が文書データである場合は、筆記枠を選択する操作を受け付けるようにしてもよい。さらに、文書型が画像データである場合であっても、その画像データ内の筆記枠を認識し、その筆記枠を選択する操作を受け付けるようにしてもよい。筆記枠の認識として、例えば、予め定められた長さ以上の線分で構成された長方形を抽出する等の従来の技術を用いればよい。
フォーム特徴抽出モジュール120は、フォーム取得モジュール110、類似帳票抽出モジュール135と接続されている。フォーム特徴抽出モジュール120は、フォーム取得モジュール110によって取得された文書型の特徴を抽出する。例えば、文書型が画像データである場合、フォーム特徴抽出モジュール120は、その文書型の画像処理結果の特徴又は筆記枠選択モジュール115によって選択された筆記枠の内側又は周囲にある文字の認識結果を、その文書型の特徴として抽出するようにしてもよい。画像処理として、例えば、線分抽出、画素塊抽出等がある。また、画素塊とは、4連結又は8連結で連続する画素領域を少なくとも含み、これらの画素領域の集合をも含む。これらの画素領域の集合とは、4連結等で連続した画素領域が複数あり、その複数の画素領域は近傍にあるものをいう。ここで、近傍にあるものとは、例えば、互いの画素領域が距離的に近いもの、文章としての1行から1文字ずつ切り出すように縦又は横方向に射影し、空白地点で切り出した画像領域、又は一定間隔で切り出した画像領域等がある。なお、1つの画素塊として、1文字の画像となる場合が多い。ただし、実際に人間が文字として認識できる画素領域である必要はない。文字の一部分、文字を形成しない画素領域等もあり、何らかの画素の塊であればよい。画像処理結果の特徴として、例えば、その画像(文書型)の線分の本数、その線分の分布、枠(筆記枠以外の枠を含めてもよい)の個数、その枠の分布、画素塊の個数、その画素塊の分布等がある。
また、筆記枠選択モジュール115によって選択された筆記枠の内側又は周囲に対して、文字認識を行うようにしてもよい。その認識結果として、誤った文字が含まれている可能性があるが、修正は不要としてもよい。文書型の特徴としての認識結果であるので、予め定められた文字認識処理(文字認識処理装置、文字認識処理アルゴリズム等)が行われているのであれば、誤認識結果が含まれていてもよい。
例えば、文書型が文書データである場合、タイトル等の文字データ、枠の個数、その枠の分布等がある。
筆記枠特徴抽出モジュール125は、筆記枠選択モジュール115、類似帳票抽出モジュール135と接続されている。筆記枠特徴抽出モジュール125は、筆記枠選択モジュール115によって選択された筆記枠の特徴を抽出する。ここで筆記枠の特徴として、例えば、筆記枠の位置(例えば、左上端の座標等)、大きさ(幅、高さ、面積等)、形状(幅と高さの比率等)、枠線の種類(実線、点線、一点鎖線等)、周囲の筆記枠との関係(上下左右の各辺に接している筆記枠の個数等)等がある。
帳票情報記憶モジュール130は、類似帳票抽出モジュール135と接続されている。帳票情報記憶モジュール130は、既に筆記枠の属性が付与された文書型が記憶されている。その文書型の筆記枠には、属性が設定されている。ここでの属性としては、その筆記枠に記入されている文字の認識処理において、認識率を高めるための情報が含まれていればよい。具体的には、その筆記枠内に記入される文字の種類(例えば、数字、英字、カタカナ、ひらがな、漢字、一般文字(それらの混在等)等)、認識用辞書の種類(例えば、数字用辞書、英語用辞書、氏名辞書、電話番号辞書、会社名辞書、住所辞書等)等がある。例えば、文字の種類が特定されていると、その種類に合わせた特徴抽出、認識用アルゴリズム等を設定することができる。また、認識用辞書の種類が特定されていると、一般的な認識用辞書を用いるよりも認識率を向上させることができる。また、認識の後処理としての文法処理で用いる辞書を属性として含めてもよい。
類似帳票抽出モジュール135は、フォーム特徴抽出モジュール120、筆記枠特徴抽出モジュール125、帳票情報記憶モジュール130、筆記枠プロパティ取得モジュール140と接続されている。類似帳票抽出モジュール135は、帳票情報記憶モジュール130に記憶された既に筆記枠の属性が付与された文書型から、フォーム特徴抽出モジュール120と筆記枠特徴抽出モジュール125によって抽出された特徴に類似する特徴を有している文書型を抽出する。抽出する文書型は複数であってもよい。また、ここで類似するとは、特徴空間における両者(対象となっている文書型と帳票情報記憶モジュール130内の文書型)間の距離が予め定められた閾値未満又は以下であること、又は、その距離で昇順に並べた場合に、予め定められた順位内であること(予め定められた順位が1位である場合、最も類似することを示している)等がある。もちろんのことながら、類似には、一致していることを含む。
また、文書型だけでなく、対象としている筆記枠と類似する筆記枠を抽出するようにしてもよい。
筆記枠プロパティ取得モジュール140は、類似帳票抽出モジュール135、筆記枠プロパティ設定モジュール145と接続されている。筆記枠プロパティ取得モジュール140は、類似帳票抽出モジュール135によって抽出された文書型内の筆記枠に付与された属性を抽出する。ここで筆記枠は、対象としている筆記枠に対応する筆記枠である。
筆記枠プロパティ設定モジュール145は、フォーム取得モジュール110、筆記枠プロパティ取得モジュール140、出力モジュール150と接続されている。筆記枠プロパティ設定モジュール145は、類似帳票抽出モジュール135によって抽出された文書型内の筆記枠に付与された属性を、筆記枠選択モジュール115によって選択された筆記枠の属性又は属性の候補として設定する。具体的には、筆記枠プロパティ取得モジュール140によって取得された属性を、筆記枠選択モジュール115によって選択された筆記枠の属性又は属性の候補として設定する。
また、筆記枠プロパティ設定モジュール145は、類似帳票抽出モジュール135によって抽出された文書型内の筆記枠に付与された属性を、対象としている文書型内の複数の筆記枠の属性又は属性の候補として設定するようにしてもよい。つまり、筆記枠選択モジュール115によって選択された筆記枠の属性又は属性の候補だけでなく、他の筆記枠の属性又は属性の候補も、類似帳票抽出モジュール135が抽出した文書型の筆記枠の属性を用いて設定するものである。
出力モジュール150は、筆記枠プロパティ設定モジュール145と接続されている。出力モジュール150は、筆記枠プロパティ設定モジュール145によって設定された筆記枠の属性又は属性の候補を出力する。ここで出力するとは、例えば、文書型データベース等の記憶装置へ書き込むこと、メモリーカード等の記憶媒体に記憶すること、他の情報処理装置(例えば、認識装置等)へ渡すこと等が含まれる。また、プリンタ等の印刷装置で印刷すること、液晶ディスプレイ等の表示装置に表示すること等を含めてもよい。特に、属性の候補として設定した場合は、ユーザーに選択させて属性を確定するために、表示装置に属性の候補を選択可能に表示するようにしてもよい。
図2は、本実施の形態を利用したシステム構成例を示す説明図である。
図2(a)に示すシステム構成例では、画像読取装置210、フォーム生成処理装置220、情報処理装置100、文字認識装置230によって構成されている。
画像読取装置210は、情報処理装置100と接続されている。画像読取装置210は、フォームをスキャナ等によって読み取り、情報処理装置100に渡す。
フォーム生成処理装置220は、情報処理装置100と接続されている。フォーム生成処理装置220は、操作者の操作にしたがって文書作成用アプリケーションを用いてフォームを作成し、情報処理装置100に渡す。
情報処理装置100は、画像読取装置210、フォーム生成処理装置220、文字認識装置230と接続されている。画像読取装置210又はフォーム生成処理装置220から受け取ったフォームを対象として、そのフォーム内の筆記枠の属性を設定する。
文字認識装置230は、情報処理装置100と接続されている。文字認識装置230は、そのフォームを用いた文書(つまり、筆記枠内に手書き文字が記入された文書)の画像を読み込み、その筆記枠内の文字を認識する。
図2(b)に示すシステム構成例では、情報処理装置100、画像読取装置210a、画像読取装置210b、フォーム生成処理装置220a、フォーム生成処理装置220b、文字認識装置230、画像読取・文字認識装置250は、通信回線290を介してそれぞれ接続されている。通信回線290は、無線、有線、これらの組み合わせであってもよく、例えば、通信インフラとしてのインターネット、イントラネット等であってもよい。また、情報処理装置100、文字認識装置230による機能は、クラウドサービスとして実現してもよい。複数の画像読取装置210(図2(b)の例では、画像読取装置210a、画像読取装置210b)、複数のフォーム生成処理装置220(図2(b)の例では、フォーム生成処理装置220a、フォーム生成処理装置220b)が、情報処理装置100、文字認識装置230を用いるようにしたものである。なお、画像読取・文字認識装置250は、画像読取装置210のスキャナとしての機能、文字認識装置230の機能を有しているものであり、フォームの読み取り、記入済みの文書の読み取り、文字認識処理を行うものである。
図3は、第1の実施の形態による処理例を示すフローチャートである。
ステップS302では、フォーム取得モジュール110が、フォームを取得する。
ステップS304では、筆記枠選択モジュール115が、筆記枠を選択する。例えば、操作者が属性を定義したい筆記枠を選択し、筆記枠選択モジュール115が、その選択操作を受け付ける。
ステップS306では、フォーム特徴抽出モジュール120が、フォームの特徴を抽出する。
ステップS308では、筆記枠特徴抽出モジュール125が、筆記枠の特徴(例えば、位置/幅/高さ等)を抽出する。
ステップS310では、類似帳票抽出モジュール135が、フォームの特徴、筆記枠の特徴に基づいて、帳票情報記憶モジュール130から類似する帳票を選択する。
ステップS312では、筆記枠プロパティ取得モジュール140が、類似帳票の筆記枠プロパティを取得する。
ステップS314では、筆記枠プロパティ設定モジュール145が、取得した筆記枠プロパティに基づき、定義したい筆記枠のプロパティを設定する。なお、定義したい筆記枠だけでなく、他の筆記枠についても類似帳票の筆記枠プロパティを用いて設定してもよい。
図4は、第1の実施の形態による処理対象の例を示す説明図である。フォーム400は、「クレーム・苦情処理ノート」のフォーム例を示しており、例えば、製品の問い合わせ等の電話応答で用いられるものである。担当者は、フォーム400が印刷された文書の筆記枠内に手書きで記入する。そして、手書きされたフォーム400を、文字認識し、その後の製品のバージョンアップ、開発等に役立てるものである。
フォーム400は、フォーム生成処理装置220によって作成され、その文書データがフォーム取得モジュール110によって取得されてもよい。また、印刷されたフォーム400が画像読取装置210によって読み取られ、その画像データがフォーム取得モジュール110によって取得されてもよい。
図5は、第1の実施の形態による処理例を示す説明図である。
フォーム400内には、手書きの文字等が記入される領域として、受付者枠505、受付日時(年月日)枠510、受付日時(時)枠515、受付日時(分)枠520、受付方法枠525、お客様名枠530、性別枠535、会社名枠540、郵便番号枠545、電話番号枠550、住所枠555、件名枠560、クレーム・苦情の概要及び発生要因枠565、処理の方法(費用・その他)枠570、再発防止策枠575、処理年月日枠580、処理者枠585を有している。
これらは、操作者の操作によって選択(指定を含む)される。フォーム400が文書データである場合は、受付者枠505等を選択すればよい。
図6は、第1の実施の形態による処理例を示す説明図である。図6に示す例は、ユーザーの操作によって枠を選択している例を示している。
お客様名枠530を選択するために、筆記枠の左上端となる角指定点610を指定した後、対角にある右下端を枠指定カーソル620で指定しているところを示している。
この操作によって、お客様名枠530が選択されることとなる。選択の結果、角指定点610の座標(x,y)と、角指定点610から右下端を指定した枠指定カーソル620の位置までのx座標での距離(幅)とy座標での距離(高さ)が抽出されることとなる。
この後、本実施の形態を用いない従来の筆記枠指定処理では、その選択した筆記枠(お客様名枠530)の属性を、ユーザーが設定する処理が必要となる。
しかし、情報処理装置100を用いることによって、フォーム400と類似するフォームを抽出し、そのフォーム内のお客様名枠530に対応する筆記枠の属性を抽出し、お客様名枠530の属性として設定することができる。
図7は、フォームテーブル700のデータ構造例を示す説明図である。
フォームテーブル700は、フォームid欄710、フォーム格納場所欄720、フォーム特徴量欄730、筆記枠id欄740を有している。フォームid欄710は、本実施の形態において、フォームを一意に識別するための情報(フォームid:identification)を記憶している。フォーム格納場所欄720は、フォームの格納場所を記憶している。例えば、そのフォームの文書名であってもよいし、そのフォームの場所を指し示す記述であるURI(Uniform Resource Identifier、なお、URL:Uniform Resource Locatorを含む)等であってもよい。フォーム特徴量欄730は、フォームの特徴量を記憶している。フォームの特徴量として、例えば、前述したように、線分の本数、その線分の分布、枠の個数、その枠の分布、画素塊の個数、その画素塊の分布、筆記枠の内側又は周囲に対しての文字認識結果等が該当する。筆記枠id欄740は、そのフォームに含まれている筆記枠であって、本実施の形態において(又はそのフォームにおいて)、筆記枠を一意に識別するための情報(筆記枠id)を記憶している。この筆記枠idは、図8の例に示す筆記枠テーブル800へのポインタとなる。
図8は、筆記枠テーブル800のデータ構造例を示す説明図である。筆記枠テーブル800は、筆記枠id欄810、位置欄820、幅欄830、高さ欄840、認識結果表示設定欄850、変換辞書欄860、枠名称欄870を有している。筆記枠id欄810は、筆記枠idを記憶している。位置欄820は、その筆記枠idが示す筆記枠の位置(x座標、y座標)を記憶している。幅欄830は、その筆記枠の幅を記憶している。高さ欄840は、その筆記枠の高さを記憶している。認識結果表示設定欄850は、その筆記枠において、認識結果を表示する場合の文字属性等の設定を記憶している。変換辞書欄860は、その筆記枠に対して、文字認識を行う場合に用いる変換辞書(認識用辞書)を記憶している。図8に示す例では、「一般文字列」、「英数字」の辞書を示しているが、前述したように、氏名辞書、電話番号辞書等を用いてもよい。枠名称欄870は、その筆記枠の枠名称を記憶している。
フォームテーブル700、筆記枠テーブル800は、既に筆記枠の属性が設定されたフォームに関する情報として記憶されている。そして、情報処理装置100の処理によって、対象となったフォーム(フォーム取得モジュール110が取得したフォーム)に関する情報、そのフォーム内の属性(例えば、認識結果表示設定欄850、変換辞書欄860、枠名称欄870等)が、フォームテーブル700、筆記枠テーブル800に追加されることとなる。ユーザーは、筆記枠毎に新たに属性を設定することなく、既に設定された属性を利用することができるようになる。
また、例えば、帳票等を対象とした文字認識を行う場合、筆記枠毎に文字認識用の属性(例えば、文字認識用辞書の種類)が設定されており、その属性にしたがって文字認識が行われている。この属性が誤ったものである場合、認識率が低下することとなる。したがって、このような場合、筆記枠毎に新たに属性を設定する技術と比べて筆記枠の属性の設定を行いやすくするだけでなく、情報処理装置100は、認識率を向上させることとなる。
<第2の実施の形態>
図9は、第2の実施の形態の構成例についての概念的なモジュール構成図を示している。情報処理装置900は、フォーム取得モジュール110、筆記枠選択モジュール115、フォーム特徴抽出モジュール120、筆記枠特徴抽出モジュール125、帳票情報記憶モジュール130、類似帳票抽出モジュール135、筆記枠プロパティ取得モジュール140、筆記枠プロパティ設定モジュール145、ユーザー選択依頼処理モジュール945、出力モジュール150を有している。情報処理装置900は、第1の実施の形態の情報処理装置100にユーザー選択依頼処理モジュール945を付加したものである。
なお、第1の実施の形態と同種の部位には同一符号を付し重複した説明を省略する。
フォーム取得モジュール110は、フォーム特徴抽出モジュール120、筆記枠プロパティ設定モジュール145と接続されている。
筆記枠選択モジュール115は、筆記枠特徴抽出モジュール125と接続されている。
フォーム特徴抽出モジュール120は、フォーム取得モジュール110、類似帳票抽出モジュール135と接続されている。
筆記枠特徴抽出モジュール125は、筆記枠選択モジュール115、類似帳票抽出モジュール135と接続されている。
帳票情報記憶モジュール130は、類似帳票抽出モジュール135、ユーザー選択依頼処理モジュール945と接続されている。
類似帳票抽出モジュール135は、フォーム特徴抽出モジュール120、筆記枠特徴抽出モジュール125、帳票情報記憶モジュール130、筆記枠プロパティ取得モジュール140、ユーザー選択依頼処理モジュール945と接続されている。類似帳票抽出モジュール135は、例えば、特徴空間における両者間の距離が予め定められた閾値未満又は以下となるものがなかった場合は、帳票情報記憶モジュール130から文書型を抽出できなかったとする。
筆記枠プロパティ取得モジュール140は、類似帳票抽出モジュール135、筆記枠プロパティ設定モジュール145と接続されている。類似帳票抽出モジュール135によって文書型が抽出できなかった場合、筆記枠プロパティ取得モジュール140は処理を行わずに、ユーザー選択依頼処理モジュール945による処理を行う。
筆記枠プロパティ設定モジュール145は、フォーム取得モジュール110、筆記枠プロパティ取得モジュール140、ユーザー選択依頼処理モジュール945、出力モジュール150と接続されている。
ユーザー選択依頼処理モジュール945は、帳票情報記憶モジュール130、類似帳票抽出モジュール135、筆記枠プロパティ設定モジュール145と接続されている。ユーザー選択依頼処理モジュール945は、類似帳票抽出モジュール135によって文書型が抽出できなかった場合、操作者に対して、筆記枠選択モジュール115によって選択された筆記枠(他の筆記枠を含めてもよい)の属性を設定するように依頼する。そして、筆記枠プロパティ設定モジュール145は、操作者の操作にしたがって、筆記枠の属性を設定する。
出力モジュール150は、筆記枠プロパティ設定モジュール145と接続されている。
図10は、第2の実施の形態による処理例を示すフローチャートである。
ステップS1002では、フォーム取得モジュール110が、フォームを取得する。
ステップS1004では、筆記枠選択モジュール115が、筆記枠を選択する。例えば、操作者が属性を定義したい筆記枠を選択し、筆記枠選択モジュール115が、その選択操作を受け付ける。
ステップS1006では、フォーム特徴抽出モジュール120が、フォームの特徴を抽出する。
ステップS1008では、筆記枠特徴抽出モジュール125が、筆記枠の特徴(例えば、位置/幅/高さ等)を抽出する。
ステップS1010では、類似帳票抽出モジュール135が、フォームの特徴、筆記枠の特徴に基づいて、帳票情報記憶モジュール130から類似する帳票を選択する。
ステップS1012では、類似帳票抽出モジュール135が、ステップS1010で類似帳票を選択できたか否かを判断し、選択できた場合はステップS1018へ進み、それ以外の場合はステップS1014へ進む。
ステップS1014では、ユーザー選択依頼処理モジュール945が、ユーザーに類似帳票の選択を依頼する。例えば、特徴空間における両者間の距離が予め定められた閾値未満又は以下ではないが、その距離で昇順に並べた場合に、予め定められた順位内である帳票情報記憶モジュール130内のフォームを選択可能に提示するようにしてもよい。ユーザーは、その提示されたフォームから、類似するフォーム(複写したい筆記枠プロパティを有しているフォーム)を選択するようにしてもよい。
ステップS1016では、ユーザー選択依頼処理モジュール945が、ユーザーの操作によって類似帳票が選択されたか否かを判断し、選択された場合はステップS1018へ進み、それ以外の場合はステップS1022へ進む。
ステップS1018では、筆記枠プロパティ取得モジュール140が、類似帳票の筆記枠プロパティを取得する。
ステップS1020では、筆記枠プロパティ設定モジュール145が、取得した筆記枠プロパティに基づき、定義したい筆記枠のプロパティを設定する。なお、定義したい筆記枠だけでなく、他の筆記枠についても類似帳票の筆記枠プロパティを用いて設定してもよい。
ステップS1022では、筆記枠プロパティ設定モジュール145が、筆記枠プロパティを手動で(ユーザーの操作にしたがって)設定する。
図11を参照して、本実施の形態の情報処理装置のハードウェア構成例について説明する。図11に示す構成は、例えばパーソナルコンピュータ(PC)等によって構成されるものであり、スキャナ等のデータ読み取り部1117と、プリンタ等のデータ出力部1118を備えたハードウェア構成例を示している。
CPU(Central Processing Unit)1101は、前述の実施の形態において説明した各種のモジュール、すなわち、フォーム取得モジュール110、筆記枠選択モジュール115、フォーム特徴抽出モジュール120、筆記枠特徴抽出モジュール125、類似帳票抽出モジュール135、筆記枠プロパティ取得モジュール140、筆記枠プロパティ設定モジュール145、出力モジュール150、ユーザー選択依頼処理モジュール945等の各モジュールの実行シーケンスを記述したコンピュータ・プログラムにしたがった処理を実行する制御部である。
ROM(Read Only Memory)1102は、CPU1101が使用するプログラムや演算パラメータ等を格納する。RAM(Random Access Memory)1103は、CPU1101の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバス等から構成されるホストバス1104により相互に接続されている。
ホストバス1104は、ブリッジ1105を介して、PCI(Peripheral Component Interconnect/Interface)バス等の外部バス1106に接続されている。
キーボード1108、マウス等のポインティングデバイス1109は、操作者により操作されるデバイスである。ディスプレイ1110は、液晶表示装置又はCRT(Cathode Ray Tube)等があり、各種情報をテキストやイメージ情報として表示する。また、ポインティングデバイス1109とディスプレイ1110の両方の機能を備えているタッチスクリーン等であってもよい。
HDD(Hard Disk Drive)1111は、ハードディスク(フラッシュメモリ等であってもよい)を内蔵し、ハードディスクを駆動し、CPU1101によって実行するプログラムや情報を記録又は再生させる。ハードディスクは、帳票情報記憶モジュール130等としての機能を実現させる。さらに、その他の各種データ、各種コンピュータ・プログラム等が格納される。
ドライブ1112は、装着されている磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体1113に記録されているデータ又はプログラムを読み出して、そのデータ又はプログラムを、インタフェース1107、外部バス1106、ブリッジ1105、及びホストバス1104を介して接続されているRAM1103に供給する。なお、リムーバブル記録媒体1113も、データ記録領域として利用可能である。
接続ポート1114は、外部接続機器1115を接続するポートであり、USB、IEEE1394等の接続部を持つ。接続ポート1114は、インタフェース1107、及び外部バス1106、ブリッジ1105、ホストバス1104等を介してCPU1101等に接続されている。通信部1116は、通信回線に接続され、外部とのデータ通信処理を実行する。データ読み取り部1117は、例えばスキャナであり、ドキュメントの読み取り処理を実行する。データ出力部1118は、例えばプリンタであり、ドキュメントデータの出力処理を実行する。
なお、図11に示す情報処理装置のハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、図11に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えば特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続している形態でもよく、さらに図11に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、特に、パーソナルコンピュータの他、携帯情報通信機器(携帯電話、スマートフォン、モバイル機器、ウェアラブルコンピュータ等を含む)、情報家電、ロボット、複写機、ファックス、スキャナ、プリンタ、複合機(スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)などに組み込まれていてもよい。
前述の実施の形態においては、主に、属性の設定の例を示したが、属性の候補の設定としてもよい。候補の場合は、複数の属性の候補としてもよい。そして、ユーザーによって選択された属性を設定してもよい。
なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通等のために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray(登録商標) Disc)、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM(登録商標))、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)、SD(Secure Digital)メモリーカード等が含まれる。
そして、前記のプログラムの全体又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、又は無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分又は全部であってもよく、又は別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して記録されていてもよい。また、圧縮や暗号化等、復元可能であればどのような態様で記録されていてもよい。
100…情報処理装置
110…フォーム取得モジュール
115…筆記枠選択モジュール
120…フォーム特徴抽出モジュール
125…筆記枠特徴抽出モジュール
130…帳票情報記憶モジュール
135…類似帳票抽出モジュール
140…筆記枠プロパティ取得モジュール
145…筆記枠プロパティ設定モジュール
150…出力モジュール
210…画像読取装置
220…フォーム生成処理装置
230…文字認識装置
250…画像読取・文字認識装置
290…通信回線
900…情報処理装置
945…ユーザー選択依頼処理モジュール

Claims (5)

  1. 文書型上で筆記枠を選択する選択手段と、
    前記文書型の特徴と選択された前記筆記枠の特徴を抽出する第1の抽出手段と、
    既に筆記枠の属性が付与された文書型から、前記文書型の特徴と前記筆記枠の特徴に類似する文書型を抽出する第2の抽出手段と、
    前記第2の抽出手段によって抽出された文書型内の筆記枠に付与された属性を、前記選択手段によって選択された筆記枠の属性又は属性の候補として設定する設定手段と、
    前記設定手段によって設定された筆記枠の属性又は属性の候補を用いて文字認識用の辞書及び認識の後処理としての文法処理で用いる辞書を設定する辞書設定手段
    を有する情報処理装置。
  2. 前記文書型が画像である場合、前記第1の抽出手段は、該文書型の画像処理結果の特徴又は選択された前記筆記枠の内側又は周囲にある文字の認識結果を、該文書型の特徴として抽出する、
    請求項1に記載の情報処理装置。
  3. 前記設定手段は、前記第2の抽出手段によって抽出された文書型内の筆記枠に付与された属性を、対象としている文書型内の複数の筆記枠の属性又は属性の候補として設定する、
    請求項1又は2に記載の情報処理装置。
  4. 前記設定手段は、前記第2の抽出手段によって文書型が抽出できなかった場合、操作者の操作にしたがって、前記筆記枠の属性を設定する、
    請求項1から3のいずれか一項に記載の情報処理装置。
  5. コンピュータを、
    文書型上で筆記枠を選択する選択手段と、
    前記文書型の特徴と選択された前記筆記枠の特徴を抽出する第1の抽出手段と、
    既に筆記枠の属性が付与された文書型から、前記文書型の特徴と前記筆記枠の特徴に類似する文書型を抽出する第2の抽出手段と、
    前記第2の抽出手段によって抽出された文書型内の筆記枠に付与された属性を、前記選択手段によって選択された筆記枠の属性又は属性の候補として設定する設定手段と、
    前記設定手段によって設定された筆記枠の属性又は属性の候補を用いて文字認識用の辞書及び認識の後処理としての文法処理で用いる辞書を設定する辞書設定手段
    として機能させるための情報処理プログラム。
JP2015232949A 2015-11-30 2015-11-30 情報処理装置及び情報処理プログラム Active JP6682827B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015232949A JP6682827B2 (ja) 2015-11-30 2015-11-30 情報処理装置及び情報処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015232949A JP6682827B2 (ja) 2015-11-30 2015-11-30 情報処理装置及び情報処理プログラム

Publications (2)

Publication Number Publication Date
JP2017102526A JP2017102526A (ja) 2017-06-08
JP6682827B2 true JP6682827B2 (ja) 2020-04-15

Family

ID=59017344

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015232949A Active JP6682827B2 (ja) 2015-11-30 2015-11-30 情報処理装置及び情報処理プログラム

Country Status (1)

Country Link
JP (1) JP6682827B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021131659A (ja) * 2020-02-19 2021-09-09 キヤノンマーケティングジャパン株式会社 情報処理装置、制御方法、及びプログラム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0644216A (ja) * 1992-07-24 1994-02-18 Ricoh Co Ltd 入力装置
JP3923474B2 (ja) * 2004-01-23 2007-05-30 沖電気工業株式会社 文字読み取り装置
JP2005242786A (ja) * 2004-02-27 2005-09-08 Oki Electric Ind Co Ltd 帳票識別装置および帳票識別方法
US20080008391A1 (en) * 2006-07-10 2008-01-10 Amir Geva Method and System for Document Form Recognition
JP2008027133A (ja) * 2006-07-20 2008-02-07 Canon Inc 帳票処理装置及び帳票処理方法ならびに帳票処理方法を実行するプログラムと記憶媒体
JP5089524B2 (ja) * 2008-08-05 2012-12-05 株式会社リコー 文書処理装置、文書処理システム、文書処理方法、及び、文書処理プログラム
JP2015153138A (ja) * 2014-02-14 2015-08-24 株式会社リコー 情報処理システム、情報処理方法及びプログラム

Also Published As

Publication number Publication date
JP2017102526A (ja) 2017-06-08

Similar Documents

Publication Publication Date Title
US8391607B2 (en) Image processor and computer readable medium
US10049097B1 (en) Systems and methods for creating multi-layered optical character recognition (OCR) documents
US11321558B2 (en) Information processing apparatus and non-transitory computer readable medium
US10643097B2 (en) Image processing apparatuses and non-transitory computer readable medium
US11670067B2 (en) Information processing apparatus and non-transitory computer readable medium
JP2009223477A (ja) 情報処理装置及び情報処理プログラム
JP6682827B2 (ja) 情報処理装置及び情報処理プログラム
JP4780184B2 (ja) 画像処理装置及び画像処理プログラム
JP7027757B2 (ja) 情報処理装置及び情報処理プログラム
JP2008052439A (ja) 画像処理システムおよび画像処理プログラム
JP5481965B2 (ja) 情報処理装置及び情報処理プログラム
JP6676121B2 (ja) データ入力装置及びデータ入力プログラム
JP5476884B2 (ja) 画像処理装置及び画像処理プログラム
JP5510221B2 (ja) 情報処理装置及び情報処理プログラム
JP2020030722A (ja) 帳票画像処理システム、帳票画像処理方法、および帳票画像処理プログラム
EP3113031B1 (en) Image processing device, image processing method, and program
JP5924035B2 (ja) 情報処理装置及び情報処理プログラム
JP7504674B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP2018136709A (ja) データ入力装置、データ入力プログラム及びデータ入力システム
JP6743470B2 (ja) 画像蓄積装置及び画像蓄積プログラム
JP6003677B2 (ja) 画像処理装置及び画像処理プログラム
JP6435636B2 (ja) 情報処理装置及び情報処理プログラム
JP2021144302A (ja) 情報処理装置及び情報処理プログラム
JP2020194491A (ja) 情報処理装置、制御方法、及びプログラム
JP2020126326A (ja) 帳票に含まれる文字列を認識するための装置、方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181022

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190926

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191008

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191203

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191217

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200210

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200225

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200309

R150 Certificate of patent or registration of utility model

Ref document number: 6682827

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350