JP2008276766A - フォーム自動埋込方法及び装置 - Google Patents

フォーム自動埋込方法及び装置 Download PDF

Info

Publication number
JP2008276766A
JP2008276766A JP2008109935A JP2008109935A JP2008276766A JP 2008276766 A JP2008276766 A JP 2008276766A JP 2008109935 A JP2008109935 A JP 2008109935A JP 2008109935 A JP2008109935 A JP 2008109935A JP 2008276766 A JP2008276766 A JP 2008276766A
Authority
JP
Japan
Prior art keywords
field
column
text
tagging
fields
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008109935A
Other languages
English (en)
Other versions
JP4829920B2 (ja
JP2008276766A5 (ja
Inventor
Sebastien Dabet
デビット セバスチャン
Marco Bressan
ブレサン マルコ
Herve Poirier
ポイリー エルベ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xerox Corp
Original Assignee
Xerox Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xerox Corp filed Critical Xerox Corp
Publication of JP2008276766A publication Critical patent/JP2008276766A/ja
Publication of JP2008276766A5 publication Critical patent/JP2008276766A5/ja
Application granted granted Critical
Publication of JP4829920B2 publication Critical patent/JP4829920B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/174Form filling; Merging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)
  • Document Processing Apparatus (AREA)

Abstract

【課題】フォームの完成のために要する時間の最小化と共に処理における誤りにも対応した電子フォームを埋めるための方法を提供する。
【解決手段】ハードコピー書類の取込画像内のテキスト内容を識別する光学式文字認識エンジン64と、埋められることになるフォームの欄を埋めるためにテキスト内容の中の候補テキストセグメントにタグ付けするタグ付けモジュール68と、フォームの複数の欄のそれぞれについて、前記欄を欄除外パラメータに基づいて手作業入力欄または自動的に埋められる欄として指定し、自動的に埋められる欄として指定された欄を自動的に埋め、手作業で埋められる欄を空欄のまま残す欄除外モジュールと72と、を有し、前記欄除外パラメータは、タグ付けの誤り率、光学式文字認識の誤り率、および欄の関連度パラメータのうちの少なくとも1つの関数として行う。
【選択図】図3

Description

例示的な実施態様は、情報技術に関する。特にそれは、物理的な書類から抽出したテキスト情報を用いてフォームを埋めるための方法および装置に関し、特にそれに関して述べられることになる。
多くのビジネス関連フォームは、現在、電子形式である。場合によっては、それらのフォームに書き込むための情報が印刷書類で呈示される。たとえば、本に関係する情報を入力するための電子フォームは、著者、題名、ISBN番号、発行者、および日付等の欄を含むことがある。フォームはまた、名刺、ID、書状、およびそのほかの物理的な書類からの情報が電子形式で利用可能となるように、それらの情報を入力するためにも存在する。
光学式文字認識(OCR)技術は、スキャンされた画像からテキスト情報を抽出するソフトウエアを採用する。その種のテクニックが、本、名刺、およびそれらの類からテキスト情報を抽出するために応用されている。テキストが抽出された後は、各テキスト行をデータ型についてタグ付けすることが可能である。抽出された情報は、電子フォーム内の対応する欄をあらかじめ書き込むために使用できる。そのほかの情報は手作業で入力できる。たとえば名刺またはIDの取り込み時に、テキスト行を『個人名』、『役職』『所属』等々としてタグ付けすることによって個人データが抽出されるようにできる。タグ付けされた個人データを使用して新しい連絡フォーム等のフォームを埋めることが可能であり、その後それを連絡データベース内に組み込むことが可能である。会社の郵便室もまた、この種のテクニックを使用し、到来した郵便物から抽出された情報を用いてフォームを完成することによってデータベースを提供することができる。
フォームを埋めるために使用されるOCR技術は、ディジタル書類内の個別の文字の認識、および抽出された情報とフォームの特定の欄の正しい結合(タグ付け)の両方において必ずいくつかの誤りをもたらす。しかしながら情報の手作業の入力は時間を要し、また概して誤りも招く。
フォームの完成のために要する時間の最小化と共に処理における誤りにも対応した電子フォームを埋めるための方法を提供する。
例示的な実施態様の1つの態様によれば、電子フォームの欄を、書類の画像を取り込むこと、取り込まれた画像に対して光学式文字認識を適用してテキスト内容を識別すること、およびテキスト内容内の候補テキストセグメントをフォームの欄についてタグ付けすることによって獲得された候補テキストセグメントを用いて自動的に埋めるために選択するための方法である。この方法は、フォームの複数の欄のそれぞれについて、テキストの長さパラメータ、光学式文字認識の誤り率、タグ付けの誤り率、および欄の関連度パラメータから選択された少なくとも1つのパラメータに基づいて欄除外関数を計算することを含む。自動的に埋めるために欄を選択するか否かの決定が、計算された欄除外関数に基づいてなされる。
この方法においては、欄除外関数の計算が、欄のための手作業入力時間および手作業訂正時間の評価を含むことができ、計算される関数は、評価された手作業入力時間および手作業訂正時間に基づく。
欄除外関数は、欄の関連度パラメータに基づくこともできる。
この方法は、さらに、フォームの複数の欄のそれぞれについて、関連度パラメータを欄に割り当てることを含み、欄除外関数は、割り当てられた欄の関連度パラメータに基づく。
光学式文字認識誤り率は、光学式文字認識デバイスによって提供される情報から評価できる。
この方法は、さらに、フォームの複数の欄のそれぞれについて、画像の取り込みに使用されるデバイスの画質属性の説明となる画像取込パラメータを割り当てることを含み、欄除外関数は、その画像取込パラメータに基づく。
この方法は、さらに、フォームの複数の欄のそれぞれについて、テキスト属性に基づいてテキスト属性パラメータを割り当てることを含み、欄除外関数は、そのテキスト属性パラメータに基づく。
この方法は、さらに、フォームの複数の欄のそれぞれについて、選択されたユーザインターフェースについての手作業の挿入および訂正の時間に基づいてインターフェース属性パラメータを割り当てることを含み、欄除外関数は、そのテキスト属性パラメータに基づく。
欄のテキストの長さパラメータは、その欄のための、書類の代表的な標本から得られたテキストセグメントの平均の長さに基づくことができる。
フォームの欄のうちの少なくとも第1のものに、そのフォームの第2の欄の関連度パラメータと異なる関連度パラメータを割り当てることができる。
この方法は、さらに、物理的書類の画像を取り込むこと、取り込まれた画像に対して光学式文字認識を適用してテキスト内容を識別すること、テキスト内容内の候補テキストセグメントをフォームの欄についてタグ付けすること、および欄が自動的に埋められる欄として指定される場合にはタグ付けされた候補テキストセグメントを用いてフォームの欄を自動的に埋め、それ以外の場合にはその欄を空欄のまま残すことを含む。自動的に埋められるとして、または埋められないとして欄を指定することは、テキストの長さパラメータ、タグ付け誤り率、光学式文字認識誤り率、および欄の関連度パラメータのうちの少なくとも1つに依存する。
電子フォームを埋めるための装置は、請求項1の方法を実行するプロセッサ、および埋められることになるフォームを表示するグラフィカルユーザインターフェースを含むことができ、ユーザインターフェースは、プロセッサによって自動的に欄を埋めることが決定された自動的に埋められる欄を表示する。
コンピュータプログラムプロダクトは、コンピュータ上で実行されたときにそのコンピュータにこの方法を実行させるインストラクションをエンコードできる。
別の態様においては、フォームを埋めるための装置が、ハードコピー書類の取込画像内のテキスト内容を識別する光学式文字認識エンジンを含む。タグ付けモジュールが、埋められることになるフォームの欄を埋めるためにテキスト内容内の候補テキストセグメントにタグ付けする。欄除外モジュールが、フォームの複数の欄のそれぞれについて、欄を欄除外パラメータに基づいて手作業入力欄または自動的に埋められる欄として指定し、かつ自動的に埋められる欄として指定された欄を自動的に埋め、手作業で埋められる欄を空欄のまま残す。欄除外パラメータは、タグ付けの誤り率、光学式文字認識の誤り率、および欄の関連度パラメータのうちの少なくとも1つの関数である。
この装置は、さらに、フォームの欄についてタグ付け誤りを決定するタグ付け誤り率モジュール、およびフォームの欄について光学式文字認識誤り率を決定する光学式文字認識誤り率モジュールを含むことができる。
この装置は、さらに、欄除外モジュールによって自動的に埋められる欄として指定された自動的に埋められる欄を伴うフォームを表示するために構成されたグラフィカルユーザインターフェースを含むことができる。
この装置は、さらに、取込画像を生成する画像取り込みデバイスを含むことができる。
別の態様においては、欄が、その欄のための手作業の訂正および手作業の入力の時間の決定およびその欄の関連度に基づいて、手作業または自動的に埋められるとして指定されるフォームを表示するべくグラフィカルユーザインターフェースが構成される。このグラフィカルユーザインターフェースは、自動的に埋められるとして指定された欄を書類の取込画像から引き出された候補テキストセグメントを用いて埋め、かつ手作業で埋められるとして指定された欄を空欄のまま残すために構成される。
別の態様においては、フォームを埋めるための方法が、物理的書類の画像を取り込むこと、取り込まれた画像に光学式文字認識を適用してテキスト内容を識別すること、テキスト内容内の候補テキストセグメントをフォームの欄についてタグ付けすること、およびフォームの欄を、その欄が自動的に埋められる欄として指定される場合にはタグ付けされた候補テキストセグメントを用いて自動的に埋め、それ以外の場合にはその欄を空欄のまま残すことを含む。自動的に埋められるとして、または埋められないとして欄を指定することは、テキストの長さパラメータ、タグ付け誤り率、光学式文字認識誤り率、および欄の関連度パラメータのうちの少なくとも1つに依存する。
この方法は、さらに、フォームの複数の欄のそれぞれについて、テキストの長さパラメータ、タグ付け誤り率、光学式文字認識誤り率、および欄の関連度パラメータのうちの少なくとも1つに基づく欄除外関数の計算、および欄除外関数に基づくフォームの欄を自動的に埋めるか否かの決定を含むことができる。
この方法は、さらに、フォームの複数の欄のそれぞれについて、欄に対する関連度パラメータの割り当てを含むことができ、欄除外関数は、割り当てられた欄の関連度パラメータに基づく。
この方法は、さらに、タグ付け誤り率の設定を含むことができ、欄除外関数は、タグ付け誤り率の関数になる。
この方法は、さらに、光学式文字認識誤り率の設定を含むことができ、欄除外関数は、光学式文字認識誤り率の関数になる。
この方法は、さらに、(a)取り込まれた画像の画質属性に基づいて画像取り込み属性パラメータを計算すること、および欄除外関数が画像取り込み属性パラメータの関数となること、(b)取り込まれた画像のテキスト属性に基づいてテキスト属性パラメータを計算すること、および欄除外関数がテキスト属性パラメータの関数となること、および(c)選択されたユーザインターフェースについての手作業の挿入および訂正の時間に基づいてインターフェース属性パラメータを計算すること、および欄除外関数がインターフェース属性パラメータの関数となることのうちの少なくとも1つを含むことができる。
この方法は、さらに、自動的に埋められないと決定された手作業で埋めるための欄をユーザに対して明らかにすることを含むことができる。
物理的書類は、名刺を含むことができる。
フォームの埋込みのための自動化された方法および装置は、フォームの欄の自動化されたタグ付けを可能にし、それによってユーザがチェックすること、およびおそらくは(誤り率および欄の重要性等のファクタに基づいて)訂正することを欲すると見られる欄だけが手作業の入力または訂正のためにユーザに呈示される。このようにこの方法は、最適後訂正時間の提供をねらいとしている。
自動化されたフォームの埋込みは、ここで述べられているとおり、フォームの欄の少なくともいくつかを、ディジタル書類から引き出された情報を用いて埋めることを伴う。印刷された書類内に含まれている情報からの自動化されたフォームの埋込みは、通常、ディジタル化、OCR、および実体認識を必要とし、その後に、テキストセグメントが適用できると決定されたフォームの適切な欄に応じたOCR出力のテキストセグメントのタグ付けが続く。OCRおよびタグ付けの両方が、フォームの内容に誤りを導く可能性があることから、通常は手作業の訂正段階が採用される。時間要件および最終的な正確さに関して最適訂正アプローチは、OCRの精度およびタグ付けの精度、ユーザインターフェース、およびフォームの特性に依存する。例示的な方法は、1つまたは複数のファクタに基づいて所定の欄が自動的に埋められるか否かについての決定がなされることを可能にする。その種のファクタは、精度(または誤差)関連ファクタ、欄の属性(欄が正確に完成されることの相対的な重要度等)、および効率(ユーザの利便性、および手作業の入力対手作業の訂正に要する相対的な時間等)ファクタのうちの1つまたは複数を含むことがある。例示的なシステムおよび方法は、フォームの複数の欄のそれぞれについて決定が計算されることを可能にする。その決定に基づき、タグ付きの情報を用いて欄が自動的に埋められるか、ユーザが手作業で完成するべく空欄のまま残されるようにできる。
訂正段階に関係する決定の1つは、したがって、タグ付きの情報を用いてフォームの欄を埋めて、ユーザに結果の訂正を許すか否かということになる。この決定は、この例示的な方法の、アプリケーション固有の後訂正段階と見ることができる。
種々の態様において、この例示的な方法は、ユーザの後訂正のために最適なやり方で自動化されたタグ付きの結果を変更する。この例示的な方法は、フォーム内の所定の欄が、書類から自動的に抽出された情報およびフォームの特徴を用いて埋められるべきであるか否かを決定する。欄への埋込みについての決定は、ユーザの観点から誤りの確率、記載事項をタイプする時間、および欄の属性を考慮しつつ、手作業で入力するより処理を便利にする。特に、欄関連度の重みが、この決定のための基本的な属性として導入される。
一例として、この例示的な方法は、印刷された名刺からの個人的な連絡情報を用いたフォーム内の埋込みの点から述べられる。しかしながら、この方法は、任意のフォーム埋込み処理、特に時間および精度の恩典がもっとも明白になる大量のフォームの完成を必要とする処理における応用を見出している。
この例示的な方法は、物理的なテキスト書類からフォーム内を埋める処理を単純化し、かつそれに必要となる時間を短縮する。種々の態様において、この方法は、ユーザが低い関連度の欄内の誤りの訂正に時間を消費することを防止する一方、高い関連度の欄について、抽出された情報の訂正が手作業の入力より便利であり、かつ信頼できるものであるか否かを自動的に評価する。
図1は、名刺10の形式の例示的な物理的書類である名刺から抽出できる例示的なディジタル情報12、および、ここではオペレータに表示できる連絡情報ファイルとして示されている例示的な電子フォーム14を図示している。電子フォームは、抽出された情報の少なくともいくつかを用いて埋められるが、そのほかの欄は、手作業の入力のために空欄のまま残される。
図1において、名刺10は、5×8.5cmの名刺またはその類似物等の物理的なカードであるが、この方法は、到来郵便物、医療記録、運転免許証等の識別カード、本および技術文献の情報、たとえば著者、題名、ISBN番号、発行者、日付等々といったほかの印刷書類からの情報を用いる自動化されたフォーム埋込みにも等しく適用可能である。名刺の個人情報は、一般に、テキスト行16に整理された個人の名前、役職、所属(会社名、大学名、組織、またはそれらの類等)、仕事先の居所情報、仕事先の電話番号、仕事先のファクシミリ番号、電子メールアドレス等々を含み、グラフィックの所属ロゴ(組織のロゴ、大学のロゴ、会社のロゴ等々)を含むこともある。与えられた名刺がそれらの項目のうちのいくつかしか含まないこともあれば追加の、またはほかの情報を含むこともある。
図1に示されているとおり、例示的なフォーム14は、名刺から抽出された情報を用いて埋められることになる多数の欄18、20等を含む。例示的な欄は、『人名』、『役職』、『会社名』、『仕事先の電話番号』、『自宅の電話』、『仕事先のファクシミリ番号』、およびそれらの類を含むことができる。フォーム14の欄は、それぞれ、この方法が進行する間に、情報を用いて自動的に埋められる自動埋込み欄(APF)18、またはユーザにより手作業で埋められる手動埋込み欄(MPF)20として指定される。MPF20が、APF18から区別される何らかの方法で強調されてもよい。APF18は、概して、全内容を削除して欄の全内容をタイプ入力することによって、またはAPFの内容を適宜訂正することによってユーザが内容を変更できる欄である。MPF20は、埋められないが、ユーザによって埋められることになり、異なる色を用いて強調されるようにできる。自動/手動としてのフォームの欄の指定は、多数の特徴に基づく。それらの特徴のいくつかは、欄を埋めるときの誤りについての尤度を考慮した誤り関連の特徴である。そのほかの欄の指定に使用可能な特徴には、目標欄の属性特徴(標本セットについて計算できる平均の内容の長さ、型等、および欄関連度であり、特にこれは有用である)、インターフェース属性(挿入および訂正時間)および目標欄の属性等の効率の属性特徴を含めることができる。この方法は、それらの特徴のいくつかまたは全部に対するパラメータの割り当て、および決定の基礎を、それらのパラメータに基づいて計算される関数に置くことを含む。
図2は、フォーム14等の電子フォームの埋込みにおいて、書類10がスキャンされて取り込み済み書類26が生成され、OCR処理されてテキスト28が生成され、タグ付けされてラベル付きテキスト30が生成されるときに生じるおそれのある誤りの原因を示す概略図である。自動化されたフォーム埋込みにおける誤りは、OCR文字認識誤り32、タグ付け誤り34(情報と特定の欄の誤った結合)をはじめ、正しくない情報の入力または自動的に入力された情報の訂正から生じる手作業の誤りを含む多数の原因から生じ得る。欄除外システム36は、それらの、およびそのほかの特徴38を考慮に入れて、所定の欄を自動的に埋めること、またはそれを除外すること、すなわちそれを手作業の入力のために空欄のまま残すことがより効率的であるか否かを決定する。
OCRおよびタグ付けに関連付けされる誤り率は、たとえば、手作業の訂正のために一般に必要となる平均時間に影響を及ぼす。たとえば、デスクトップ・ラップトップ・コンピュータ上においてユーザが特定の電子名刺連絡フォームのために必要なすべての情報を手作業で入力するために平均して2.5分を要することがある。スキャナが2%のグローバルOCR誤り率を有すること、および所定の名刺10について15%のタグ付け誤り率が存在すると仮定すると、自動的な出力からユーザが必要と考えるすべての後訂正を行うために平均して1分を要することになる。この例において、手作業の訂正が続いて行われる自動フォーム埋込みは、全体のフォームを手作業で完成するより、概略で2.5倍高速である。
次の表1は、この例示的な方法においてフォームの欄に欄指定を割り当てるために利用することができるいくつかの候補特徴を要約している。
Figure 2008276766
特徴が1より多くの属性を表す場合には、それらの属性のそれぞれに、名前および値等のパラメータを与えることができる。値のそれぞれは、独立に、または組み合わせて、欄が自動的に埋められるべきか否かの決定において使用できる。それに代えて、特徴の属性を、所定の欄を埋めるか否かの決定に使用されるベクトルまたはそのほかの表現に結合してもよい。認識されることになろうが、これらの属性の多くは、値の範囲を仮定でき、統計的に決定された平均の値(たとえば平均値)またはそのほかの方法で評価された値によって割り当てられたパラメータで表現できる。
画像/取り込み属性の特徴Iqは、画像の取り込みに使用されるデバイスの画質属性、たとえば取り込みデバイスの解像度、雑音、レンズ品質、およびそれらの類を組み込むことができる。概して言えば、この特徴に割り当てられる1つまたは複数のパラメータは、所定の画像取り込みデバイスについて一定にとどまり、したがってすべての欄に等しく影響を及ぼすと考えられる。
テキスト属性の特徴Aは、取込画像(または、一般的な取込画像)のテキスト属性、たとえばフォントサイズ、フォントタイプ、レイアウト、およびそれらの類を組み込むことができる。これらの属性は、全体的なOCR誤り率およびタグ付け誤り率に影響を及ぼすことがある。したがって、たとえばフォントが小さいか、またはOCRによって容易に認識されないものの場合に、評価された訂正時間が手作業の入力時間より高ければ、割り当てられるパラメータが、自動的な欄の埋込みに抗する重み付けをすることができる。
インターフェース属性の特徴Kは、特定のユーザインターフェースについて予測される英数/数字挿入および訂正時間を組み込むことができる。たとえば携帯電話は、コンピュータのキーボードより操作により多くの時間を消費し、したがってこれら2つのタイプのインターフェースについてKが異なってよい。この特徴は、ユーザが欄を空欄のまま残すことを好むか、またはあらかじめ埋め込まれた欄の訂正を好むかといったユーザの好みを組み込むこともできる。ユーザが訂正するより欄に書埋め込む方を好む場合には、この特徴に割り当てられるパラメータが、自動的な欄の埋込みに抗して決定を重くすることができる。
欄属性の特徴Fは、内容の長さ、内容のタイプ、およびそれらの類といった欄の内容ベースの属性を組み込むことができる。1つの実施態様においては、欄属性の特徴Fが、欄の内容の平均の長さの関数になる(たとえば、各文字に長さ1を与える)。たとえば、F=Flength=フォームの特定の欄の平均の内容の長さとする。テキストの長さパラメータFlengthは、取り込み中のタイプの書類、たとえば名刺等の代表的な標本からの正しくタグ付けされた記載事項の長さを平均することによってフォームの各欄について評価できる。
欄関連度の特徴Wは、フォーム内の任意の与えられた欄の重要度を示す値を有し、連続またはバイナリの測度とすることが可能である。バイナリの測度(すなわち、0または1)は、オプションおよび必須の欄をともに含むフォームに適すると見られる。たとえば、必須の欄には1の関連度が、オプションの欄にはゼロの関連度が与えられるようにできる。概して言えば、所定の電子フォームについて、管理者が各欄に欄関連度Wを割り当てる。欄が必須欄、すなわちオプションの欄とは対照的に埋められることが必須となっている欄として指定されている場合には、より高い値を欄関連度パラメータWに割り当てることができる。各欄の関連度を計算する別の方法は、ユーザの好みから、たとえば手作業でフォームを埋めるときにユーザがいずれの欄に入力するかを観察することによって学習することである。
OCR誤り率Eoは、OCR処理から生じる誤りのはびこる率を表す。この誤り率は、平均して誤って識別されると予測される文字の比率として表すことができる。これは、フォームの各欄について、たとえばフォントサイズ、フォントの明瞭度、文字のタイプ等に基づき統計的に決定できる。OCR誤り率Eoは、OCRの信頼性、たとえば特定の書類に関するOCRデバイスによる出力を用いてさらに絞り込むことができる。OCR誤り率は、0と1の間で変化する値とすることができ、その場合には0が欄の文字の正しい認識において誤りの尤度がないことに対応し、1が文字の正しい認識において成功する尤度がないことに対応する。
OCR誤り率Eoは、フォームの各欄に割り当てることができ、その結果、いくつかの欄がほかの欄より高い、または低い誤り率を有する。OCR誤り率Eoは、フォームの完成に使用されることになるタイプの書類のセットをスキャンし、手作業で誤りを評価、識別し、かつ所定の欄についての平均値を計算することによって決定される平均値とすることができる。別の実施態様においては、OCR誤り率を、特定の取り込みデバイスについての平均誤り率とすること、すなわちフォームの各欄について同一の値とすることができる。
タグ付け誤り率Etは、OCR処理されたテキストのシーケンスの誤ったタグ付けから生じる誤りのはびこる率を表す。タグ付け誤り率は、OCR品質および内容のタイプ(英数字、数字等)を含む1つまたは複数のパラメータの関数とすることができる。タグ付け誤り率の評価は、タグ付けの信頼性、たとえばOCRデバイスによる出力を使用することによってさらに絞り込むことができる。タグ付け誤り率は、0と1の間で変化する値とすることができ、その場合には0が正しい欄に対するテキストセグメントの整合において誤りの尤度がないことに対応し、1が正しい欄に対するテキストセグメントの整合において成功の尤度がないことに対応する。
OCR誤り率Eoの場合と同様に、タグ付け誤り率Etは、システムによってタグ付けされた書類の手作業による再検討、欄が正しいテキスト行を含んでいるか否かの評価、および正確さの計算によって決定できる。この場合に各欄が、その欄にあるテキストが実際は別の欄に属する平均の確率を表す独自の誤り率を有する。郵便番号または住所等の非常に特定された内容を有するいくつかの欄は、低いタグ付け誤り率を有することになるが、ほかのいくつかの、概して内容がほかのものと非常に近い欄(特に、ファクシミリ番号と電話番号)は、より大きいタグ付け誤り率を有することがある。別の実施態様においては、タグ付け誤り率を平均タグ付け誤り率とすること、すなわちフォームの各欄について同一の値が割り当てられるとすることができる。
概して言えば、MPF/APFとして欄を指定することは、これらのいくつかまたは全部の関数となる。パラメータのいくつかが、ほかより大きい重みを与えられてもよい。
フォームの欄のいくつかが、この例示的な欄除外のシステムとは別の手段によって指定されてもよいことが認識されるものとする。たとえば、いくつかの欄が、ユーザの好みだけを通じて指定されてもよい。
図3は、より詳細が以下に説明されている例示的な方法に従った電子フォームを埋めるための例示的な装置40の機能ブロック図である。この装置は、プロセッサ42を含む。
画像取り込みデバイス44は、名刺10等の物理的な書類の画像を取り込むが、装置40に組み込まれてもよく、または別体のデバイスとしてもよい。取り込みデバイス44は、ディジタルカメラ、スキャナ、電話のカメラ、またはそのほかの、物理的な書類のディジタル画像を提供するデバイスとすることができる。取り込まれた画像の画質は、レンズ品質、照明状態、センサの分解能、およびそれらの類といったいくつかのファクタに依存することがある。取り込まれた画像は、プロセッサ42によって処理される。
ユーザインターフェース46は、ここにはグラフィカルユーザインターフェース(GUI)として図解されているが、プロセッサ42と有線または無線通信する。図示されているユーザインターフェース46は、フォームを埋める間にそれを表示するためのLCDスクリーンまたはコンピュータモニタ等のディスプレイ48を含み、名刺10の取込画像等の取込画像26を横並びで提供することもできる。ユーザインターフェース46はまた、ユーザとユーザインターフェース46のインタラクションを可能にするユーザ入力デバイス50、たとえばキーボード、キーパッド、タッチスクリーン、カーソルコントロールデバイス、またはそれらの組み合わせ等も含む。
プロセッサ42は、この例示的な方法を実施するための関連するメモリ80内にストアされたインストラクションを実行するいくつかの処理モジュール60,62,64,66,68,70,72を含むことができる。プロセッサ42およびオプションとしてメモリ80、画像取り込みデバイス44および/またはユーザインターフェース46は、デスクトップまたはラップトップコンピュータ、パームトップコンピュータ、または携帯情報端末(PDA)等の汎用コンピューティングデバイス内において具体化してもよい。または、プロセッサ42が、ディジタルカメラ、写真撮影能力を伴う携帯電話、ページャ、スキャニングデバイス、プリンタ、またはそれらの類といったコンピューティング能力を伴うデバイス内に組み込まれてもよい。さらに別の実施態様においては、GUIが、完成されることになるフォームをウェブブラウザ内に表示し、ローカルエリアネットワーク(LAN)またはワイドエリアネットワーク(WAN)、たとえばインターネット等のコンピュータネットワークを介してプロセッサ42と通信する。
特に汎用コンピューティングデバイスの場合においては、処理モジュール60,62,64,66,68,70,72をアドオンソフトウエアまたはハードウエアとすることができる。コンピュータの種々のコンポーネント42,44,46,80は、すべてバス(図示せず)によって接続されるようにできる。
メモリ80は、ランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、磁気ディスクまたはテープ、光ディスク、フラッシュメモリ、またはホログラフメモリ等の任意タイプのコンピュータ可読メディアを表すことができる。取込画像、OCR処理済みデータ、タグ付き情報、埋められることになる欄を含めた埋められることになるフォームの構造、およびそれらの類もまたメモリ80内にストアすることができる。
オプションとして画像処理モジュール60は、獲得された名刺画像26に対して選択された画像前処理(たとえば、リサイズ、ゆがみ補正)を実行してOCRを向上させる。またはモジュール60は、画像取り込みデバイス44内に組み込まれることもある。
画質評価モジュール62は、獲得された(オプションとして前処理された)画像の品質および/またはフォームを埋めることになる書類の代表的な画像の品質を評価できる。画質評価モジュール62は、入力として画像取り込みデバイス44および/または画像処理モジュール60からのレンズ品質、照明状態、センサの分解能、およびそれらの類といった画質情報を得ることができる。それに代えて、この情報の一部または全部を関連するメモリ80内にストアすることができる。画質評価モジュール62は、画質情報に基づいて1つまたは複数の画質パラメータを出力する。この情報は、メモリ内において取り込みデバイスについての情報と関連付けすることができ、それによって新しい書類が既知の取り込みデバイスを用いて取り込まれたときに適切なパラメータが検索されるようにできる。
光学式文字認識(OCR)モジュール64は、取り込まれ、またオプションで前処理された画像を処理して情報を抽出する。概して言えば、OCRモジュール64は、画像内に含まれているテキスト文字を抽出し、またレイアウトおよびフォント情報を提供することもできる。OCRモジュールは、文字、それらの位置、およびフォントサイズを包含するテキストファイル28を出力する。これらの特徴を結合してテキスト行およびセパレータの書類表現を形成できる。たとえば、OCRモジュールによって出力される書類表現は、一連のテキストセグメント82(図1)に分解される。各セグメント82は、名刺画像内のテキスト行に対応できる。たとえば図1の名刺10の場合であれば、セグメント82が、『John H. Smith』、『Process Engineer』、『ABC Corporation』、『12345 Main Street』、および『New York, NY 11111』(OCRモジュールが行の情報および文字を正しく識別したことを前提とする)というテキストセグメントを含むことができる。OCR出力は、XMLまたはそのほかのマークアップ言語フォーマットでエンコードされてもよい。
OCRモジュール64は、期待される文字形状との整合を基礎として文字を識別する1つまたは複数のパターン認識アルゴリズムに基づいて動作する。OCR処理の出力においては、印刷された文字と期待されるパターンの間の理想に至らない整合、非最適画質、名前または住所等の短いかまたは常用テキスト内容、実質的な装飾またはそのほかの芸術的特徴を有する整合困難なフォント等々の多様なファクタに起因して誤りまたは不確実性の発生が期待できる。
不確実性を解決するために、OCRモジュール64は、オプションとして追加の情報または後変換処理、たとえばスペルチェッカ、文法チェッカ、およびそれらの類を利用する。
信頼性評価モジュール66は、画質およびテキスト属性(フォントサイズ、レイアウト、およびそれらの類)の評価を基礎として、出力されたテキスト情報28が正しいことの信頼性を評価する。この信頼性は、割り当てたOCR誤り率Eoとして、たとえば、平均して誤って識別されることが期待される文字のパーセンテージの関数として表現できる。モジュール66は、OCRエンジン64の一部とするか、または別体のモジュールとすることができる。別体のモジュールの場合には、信頼性評価モジュール66が、Eoを決定するためにOCRモジュール64から情報を受け取ることができる。この場合においては、OCRモジュールが、各欄のために信頼性レベルを割り当てることができる。別の実施態様においては、割り当てられる誤り率Eoが、少なくとも部分的に特定の書類についての情報を基礎とすること、たとえばタグ付けされたセグメント82についてのパターン整合の近さ、およびOCRがそのセグメント(または候補内の単語)のために1より多くの候補を識別したか否かを基礎とすることができる。
タグ付けモジュール68は、入力としてOCRエンジン64の出力28を取り、フォームの欄のためのテキストセグメントの候補を識別する。特にタグ付けモジュール68は、OCR出力をタグ付けして、その内容にラベルを付ける。タグ付けモジュール68は、テキスト行またはそのほかのセグメント16に、正規表現の整合を使用するトークンのシーケンスとしてラベル付けできる。このトークンおよびセパレータのストリームの最大尤度構文解析が、書類の行の機能的ラベル付けをもたらす。たとえば、候補テキストセグメント82が、それぞれ、特定のテキストセグメントとの対応がもっともありがちであると決定されたフォーム14の欄を表すタグ84(図1)を用いてタグ付けされる。
タグ付けモジュール68は、テキスト画像セグメント16にタグを割り当てる上で情報の種々の断片を使用することができる。たとえば、第1行および/または最大フォントサイズを伴う行は、しばしばそのカードによって伝えられる人の名前となり、住所情報は、しばしば1つまたは複数の数字を伴って開始する。
タグ付けの方法は、第8回インターナショナル カンファレンス オン ドキュメント アナリシス アンド レコグニション(International Conference on Document Analysis and Recognition)会報、511〜515ページのハンドリー(Handley)ほかによる『ドキュメント アンダスタンディング システム ユージング ストカスティック コンテキストフリー グラマーズ(Document Understanding System Using Stochastic Context‐Free Grammars)』(2005年)、および米国特許第7,058,567号の中で述べられている。タグ付け段階の中で適用可能な例示的なテクノロジは、確率論的コンテキスト‐フリー文法、ゼロックス インクリメンタル パーザー(Xerox Incremental Parser(XIP)、およびそれらの類である。
タグ付け誤りモジュール70は、トークン(または複数のトークン)82が割り当てられる各欄についてのタグ付け誤り率Etを割り当てる。
欄除外モジュール72は、フォーム14の欄18,20が、図2に概説されている例示的な欄除外システム36の原理を使用して自動的に埋められるべきであるか否かを決定する。この決定は、上記の表1を参照して説明した特徴のうちの少なくともいくつかに基づくことができる。特にモジュール72は、モジュール70および66から得られるタグ付け誤りおよびOCR誤りの情報を利用できる。
図4は、図3の装置を用いて実行できる、例示的なコンピュータ実装によるフォームを埋めるための方法を示している。この方法は、S100において開始する。
この方法の初期段階Aは、欄除外モジュールによって使用されることになるパラメータの設定(たとえば、決定または割り当て)を含むことができる。S102においては画像取り込み属性パラメータIqが決定されるか、または別の方法で割り当てできる。このステップは、取り込みデバイス42から画質、取り込みデバイスの分解能等の画像属性を獲得し、それらの属性をメモリ内にストアし、それらから画像取り込み属性パラメータIqを決定することを含むことができる。それに代えて、メモリからIqの値を、特定の取り込みデバイスについて検索してもよい。
S104においては、OCR誤り率Eoを各欄について設定できる。これは、たとえば書類内に異なるフォントが使用されている場合に各欄について決定されてもよく、またはフォーム全体について決定された単一の値としてもよい。このステップは、OCR属性の値を獲得すること、それらをメモリ内にストアすること、およびそれらからOCR誤り率Eoを決定することを含むことができる。
S106においては、タグ付け誤り率Eoを各欄について設定できる。このステップは、OCR品質、内容のタイプ(英数、数字等)、およびタグ付けの信頼性といったタグ付け誤り属性の値を獲得すること、それらの値をメモリ内にストアすること、およびそれらからタグ付け誤り率を決定することを含むことができる。
S108においては、欄関連度パラメータWを各欄について設定できる。
S110においては、そのほかのパラメータ、たとえばテキスト属性パラメータA、インターフェース属性パラメータK、欄属性パラメータF等を設定できる。
S112においては、決定済みのパラメータに基づいてフォームの欄のための指定が決定される。詳細には、欄除外関数を各欄について計算すること、およびその関数に基づいて各欄をAPFまたはMPFとして指定することができる。特にS112は、各欄について、平均の手作業による訂正時間および手作業による入力時間を評価すること、およびそれらからの欄除外関数の計算を含むことができる。S112の終わりにフォームの各欄が、MPFまたはAPF指定を伴ってタグ付けされるようにできる。
この方法の第2段階Bは、欄指定が設定された後に実行できるが、フォームを埋めることを含む。S114においては、物理的な書類10が、たとえば画像取り込みデバイス44によって取り込まれる。
S116においては、取り込まれた画像が、たとえば前処理モジュール60によってオプションで前処理される。
S118においては、その画像がOCR処理されてテキストのセグメント82、および各セグメント内の文字列が識別される。
S120においては、テキスト82の候補セグメントがタグ付け、たとえばフォーム14の対応する欄に対する参照を用いてラベル付けされる。
S122においては、欄指定に従い、OCR抽出された情報を用いてフォーム14を埋めることができる。APFとして指定された欄は、自動的に埋められて第1の色で強調されるようにできる。ユーザに、欄と名刺または表示されたそれの画像を比較し、誤りがある場合には欄の内容を編集することを促すプロンプトを表示できる。MPFは空欄のまま残され、第2の色で強調されるようにできる。ユーザに、情報の入力を促してもよい。『必須でない』が指定されている欄は、ユーザに、その欄を空欄のまま残してもよいことを示す異なる色で強調するか、または強調しなくてもよい。
S124においては、埋められ、かつオプションで訂正されたフォームをストアし、連絡データベース内に組み込むことができる。この方法は、ステップS126において終了する。
認識されるとおり、別の実施態様においては、スキャンされた特定の書類の属性がパラメータのいくつかまたは全部の決定において考慮され得るように、ステップS102〜S110を全体として、または部分的に書類の画像の取り込み(S114)の後に実行できる。
図4に図示した方法は、コンピュータ上において実行できるコンピュータプログラムプロダクトに実装できる。コンピュータプログラムプロダクトは、コントロールプログラムが記録されたディスク、ハードディスク等の有体のコンピュータ可読記録メディアとしてもよく、またはデータ信号としてコントロールプログラムが埋め込まれる伝送可能な搬送波としてもよい。
欄除外モジュール72は、入力としてパラメータまたは属性を取り、欄のそれぞれについて欄指定を自動的に決定する。1つの実施態様においては、欄指定がユーザのインタラクション時間を最小化するべく意図される。以下の考察において、Mは手作業による入力時間であり、欄の内容の完全な手作業入力に要すると期待される合計時間を表す。Cは手作業による訂正時間であり、APFの内容の手作業訂正に要すると期待される合計時間を表す。この例示的な実施態様においては、すべてのユーザが訂正および手作業入力を類似の態様で行うことが仮定されている。たとえば、特定のユーザのタイピング能力の評価は欄除外モデル内に組み込まれていない。しかしながらその種の評価がマシンの学習アプローチを通じて組み込み可能となることは企図されている。
欄についての手作業の訂正および入力の時間CおよびMは、上で識別されたパラメータの関数として表すことが可能である。1つの例示的なモデルにおいては、所定の欄のための手作業入力時間Mが欄およびインターフェースのパラメータのみに依存し、M(F,K)で表される。手作業訂正時間Cは、OCRおよびタグ付けの誤り率、および手作業入力時間に依存し、C(Eo,Et,M,F,K)で表される。手作業訂正時間Cが手作業入力時間に依存する理由はタグ付けである。モデルが、誤ってタグ付けされた欄を埋める決定を行った場合に、完全な削除が必要となることから、訂正時間Cが、ほとんど手作業入力時間Mに等しくなる。これが生じ得る回数は、タグ付け誤り率Etの分布によって与えられる。ストア済みの値Eo、Et、M、F、およびKに基づくCおよびMを計算するための関数は、メモリ内にストアできる。すべてのフォームのために同一の取り込みデバイスが使用される場合には、EoおよびEtが、特定のフォームの所定の欄について一定であると仮定できる。
1つの単純なアプローチは、期待される訂正時間Cが期待される手作業入力時間Mより少ない場合に欄を埋めることである。またはその逆に、期待される手作業入力時間Mが期待される手作業訂正時間Cより少ない場合(C‐M>0)には、その欄を空のまま残す。より複雑な仮説検定手順も使用可能であり、以下に概説する。
上に述べた単純化されたモデルは、決定の中で欄関連度Wを考慮していない。1つの実施態様においては、決定が、無関係な(または重要でない)欄の訂正に過剰な時間をユーザが費やすことの回避を求める。このモデルは、欄が埋められた場合に、それが必須欄でない場合でさえ、ユーザは、それが正しいことを確かめることになるが、欄が空欄のまま残されていれば、ユーザは、その欄が低い重要度を伴うとき、それを埋めることはしない。しかしながら、手作業訂正時間Cと手作業入力時間Mの間の差が大きい場合には(すなわち、C<<M)自動的に欄を埋める決定がなされる(ここでの仮定は、欄が重要でない場合であっても、それがおそらくは誤りを含んでなく、したがって訂正処理をより長くすることがないというものである)。これは、f(C,M,W)>0であれば欄を空欄のまま残す決定を採用することによって達成され、それにおいてfは、訂正時間、訂正と手作業入力時間の差、および関連度の関数である。たとえば、
C>(W×TD)+αM
であれば欄を空欄のまま残し、それにおいてTDは、ユーザが重要な欄(関連度1)のために快く払う平均の時間を表す時間のユニットであり、
αはユーザの好みの関数である重み付けファクタである。
この例において、記載事項を訂正する最大容認時間は、2つのパラメータによってコントロールされる。αの値は、バイアスを与えて、そのユーザが概して手作業で欄に入力すること(α>1)またはそれらを訂正すること(α<1)を好むか否かを指定するために使用可能であり、所定のユーザについてメモリ80内にストアできる。W×TDは、ユーザが関連度Wを伴う欄を、印刷と電子バージョンの間を交互に見比べなければならないことが回避できるために記載事項がたとえいくつかの誤りを有していても手作業で入力する代わりに訂正する最大容認オーバーヘッドを与える。
以下は、決定をどのように行うことが可能であるかの例を提供する。次の時間を定義できる。
M=入力ユニットに手作業で書き込む平均時間
R=ユニットを読む平均時間
C=ユニットを訂正する平均時間
length=欄属性特徴Fにストアされる長さ値
これらの時間のための適切な値を、使用されることになるユーザインターフェースのタイプを伴った典型的なユーザ経験に基づいて割り当てることができる。ユニットは、文字、数字、またはほかの文字との間の空白等の1文字に対応する。長さ値は、概して特定の欄のユニットの総数に対応する(適正にタグ付けされているとき)。
手作業入力時間M(F,K)は、平均μMを伴う正規分布であると考えることが可能である。つまり、
μM(F,K)=Flength×TM
この仮定においては、特定のインターフェースについてTMが一定になることから、手作業入力時間が欄の長さにのみ依存する。より複雑な仮定は、インターフェースの性質およびテキスト内容の属性を考慮に入れることができる。たとえば、通常のキーボード上に用意されていない記号には、より高いユニット時間TMを割り当てることができる。
手作業訂正時間C(Eo,Et,M,F,K)は、平均μc(Eo,Et,M,F,K)を伴う正規分布であると仮定することが可能である。
μcは、合計の読む時間+合計の編集時間の和であると仮定できる。合計の読む時間Rは、人がAPFを読むために要すると評価された時間であり、したがってテキストの長さに比例すると仮定される。つまり、
R=Flength×TR
合計の編集時間Xは、埋められた欄を人が編集するために要すると評価された時間であり、したがって誤りに依存する。タグ付けが正しくない場合には(Et=1)、編集時間が手作業入力時間(μM)とほぼ等しくなり、それが正しい場合には(Et=0)、OCR誤り(長さにOCR誤り率Eoを乗じる)に、ユニットTcを訂正する平均時間を乗じた値に比例することになる。つまり、
X=(1‐Et)×Eo×Flength×Tc+Et×μM
したがって、
μc(Eo,Et,M,F,K)=Flength×(TR+(1‐Et)×Eo×Flength×Tc+Et×μM
欄の埋込みについての決定評価基準は次のとおりとなる。
μc<W×TD+αμM
これは単純化されたモデルについて次を意味する。
W>Flength(TR+(1‐Et)×Eo×Tc+(Et‐α)TM)/TD
例としてα=1(すなわち、ユーザが手作業入力および訂正のいずれも好まない)とし、かつ以下を仮定する。
M=1秒
‐ TD=5秒
‐ TR=0.2秒
‐ TC=5秒
フォームの3つの欄、すなわち人名、会社名、およびファクシミリ番号のそれぞれに、たとえば管理者によって、欄関連度ファクタWとして0.9、0.8、および0.2が割り当てられていると仮定する。またタグ付けモジュールが、12、10、および10文字の平均の長さを有するとして識別されたそれらの欄について、テキストセグメントを識別したとする。表2は、それらの欄のそれぞれについての決定を例示している。
Figure 2008276766
ファクシミリ番号および会社名の場合には、予測される誤り率が同じである。しかしながら関連度の重みが最終的な決定を変更し、会社名が高い関連度の重みを有し、かつこの欄が埋込みを必要とすることから、誤りを伴うテキストであっても欄に書き込む時間を短縮できると決定される。
より複雑なモデルは、数字対そのほかの文字といった目標の欄の内容のタイプの影響を考慮に入れることができる。このモデルの変更は、手作業入力時間Mに対して次のとおりの結果をもたらす。
M(F,K)=FLENGTH×(FDIGIT×KINSERT_DIGIT+(1‐FDIGIT)×KINSERT_OTHER
(M(F,K)=FLENGTH×Tmの代わり)
本実施の形態において、名刺の形式の例示的な物理的書類からのテキストセグメントの抽出、およびフォームの選択された欄への埋込みを示した概略図である。 フォームの自動埋込みにおける誤りの原因を説明するために用いる図である。 物理的書類から引き出されたテキストセグメントを用いて電子フォームを埋めるための例示的な装置の機能ブロック図である。 本実施の形態においてフォームの選択された欄を埋めるための方法を示した図フローチャートである。
符号の説明
10 名刺、書類、12 ディジタル情報、14 電子フォーム、フォーム、16 テキスト行、セグメント、テキスト画像セグメント、18 自動埋込み欄(APF)、APF、20 手動埋込み欄(MPF)、MPF、26 取り込み済み書類、取り込み済み画像、名刺画像、28 テキスト、テキストファイル、テキスト情報、30 ラベル付きテキスト、32 OCR文字認識誤り、34 タグ付け誤り、36 欄除外システム、38 そのほかの特徴、40 装置、42 プロセッサ、44 画像取り込みデバイス、46 ユーザインターフェース、48 ディスプレイ、50 ユーザ入力デバイス、60 画像処理モジュール、62 画質評価モジュール、64 光学式文字認識(OCR)モジュール、OCRモジュール、OCRエンジン、66 信頼性評価モジュール、68 タグ付けモジュール、70 タグ付け誤りモジュール、72 欄除外モジュール、80 メモリ、82 テキストセグメント、セグメント、トークン、テキスト、84 タグ、60,62,64,66,68,70,72 処理モジュール。

Claims (5)

  1. 電子フォームの欄を、書類の画像を取り込むこと、前記取り込まれた画像に対して光学式文字認識を適用してテキスト内容を識別すること、および前記テキスト内容の中の候補テキストセグメントを前記フォームの欄にタグ付けすることによって獲得された候補テキストセグメントで自動的に埋めるために選択するための方法であって、
    電子フォームの複数の欄のそれぞれについて、テキストの長さパラメータ、光学式文字認識の誤り率、タグ付けの誤り率、および欄の関連度パラメータから選択された少なくとも1つのパラメータに基づいて欄除外関数を計算し、
    前記計算された欄除外関数に基づいて自動的に埋めるために前記欄を選択するか否かを決定する、
    ことを包含するフォーム自動埋込方法。
  2. 物理的書類の画像を取り込み、
    前記取り込まれた画像に対して光学式文字認識を適用してテキスト内容を識別し、
    前記テキスト内容内の候補テキストセグメントを前記フォームの欄についてタグ付けし、
    前記欄が自動的に埋められる欄として指定される場合には前記タグ付けされた候補テキストセグメントを用いて前記フォームの欄を自動的に埋め、それ以外の場合には前記欄を空欄のまま残し、前記欄の指定は、テキストの長さパラメータ、タグ付けの誤り率、光学式文字認識の誤り率、および欄の関連度パラメータのうちの少なくとも1つに依存すること、
    を包含するフォーム自動埋込方法。
  3. 請求項1記載の方法を実行し、
    物理的書類の画像を取り込み、
    前記取り込まれた画像に対して光学式文字認識を適用してテキスト内容を識別し、
    前記テキスト内容内の候補テキストセグメントを前記フォームの欄についてタグ付けし、
    前記欄が自動的に埋められる欄として指定される場合には前記タグ付けされた候補テキストセグメントを用いて前記フォームの欄を自動的に埋め、それ以外の場合には前記欄を空欄のまま残す、
    ことを包含するフォーム自動埋込方法。
  4. ハードコピー書類の取込画像内のテキスト内容を識別する光学式文字認識エンジンと、
    埋められることになるフォームの欄を埋めるために前記テキスト内容の中の候補テキストセグメントにタグ付けするタグ付けモジュールと、
    前記フォームの複数の欄のそれぞれについて、前記欄を欄除外パラメータに基づいて手作業入力欄または自動的に埋められる欄として指定し、自動的に埋められる欄として指定された欄を自動的に埋め、手作業で埋められる欄を空欄のまま残す欄除外モジュールと、
    を有し、
    前記欄除外パラメータは、タグ付けの誤り率、光学式文字認識の誤り率、および欄の関連度パラメータのうちの少なくとも1つの関数として行うフォーム自動埋込装置。
  5. 欄が、前記欄のための手作業の訂正および手作業の入力の時間の決定および前記欄の関連度に基づいて、手作業または自動的に埋められるとして指定されるフォームを表示するグラフィカルユーザインターフェースであって、
    自動的に埋められるとして指定された欄を書類の取込画像から引き出された候補テキストセグメントを用いて埋め、かつ手作業で埋められるとして指定された欄を空欄のまま残す手段を有するグラフィカルユーザインターフェース装置。
JP2008109935A 2007-04-26 2008-04-21 フォーム自動埋込方法及び装置、グラフィカルユーザインターフェース装置 Expired - Fee Related JP4829920B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/789,823 2007-04-26
US11/789,823 US7849398B2 (en) 2007-04-26 2007-04-26 Decision criteria for automated form population

Publications (3)

Publication Number Publication Date
JP2008276766A true JP2008276766A (ja) 2008-11-13
JP2008276766A5 JP2008276766A5 (ja) 2011-06-02
JP4829920B2 JP4829920B2 (ja) 2011-12-07

Family

ID=39711061

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008109935A Expired - Fee Related JP4829920B2 (ja) 2007-04-26 2008-04-21 フォーム自動埋込方法及び装置、グラフィカルユーザインターフェース装置

Country Status (3)

Country Link
US (1) US7849398B2 (ja)
EP (1) EP1986106A3 (ja)
JP (1) JP4829920B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022237795A1 (zh) * 2021-05-11 2022-11-17 维沃移动通信有限公司 信息显示方法和电子设备
JP7401044B1 (ja) 2023-04-19 2023-12-19 株式会社immedio 企業に対するユーザの問合せを処理する方法

Families Citing this family (67)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7272604B1 (en) 1999-09-03 2007-09-18 Atle Hedloy Method, system and computer readable medium for addressing handling from an operating system
US7581169B2 (en) 2005-01-14 2009-08-25 Nicholas James Thomson Method and apparatus for form automatic layout
US8782087B2 (en) 2005-03-18 2014-07-15 Beyondcore, Inc. Analyzing large data sets to find deviation patterns
US10127130B2 (en) 2005-03-18 2018-11-13 Salesforce.Com Identifying contributors that explain differences between a data set and a subset of the data set
TWI265715B (en) * 2005-07-21 2006-11-01 Inventec Appliances Corp Method for collecting business card data in mobile communication apparatus
US7711191B2 (en) * 2006-12-21 2010-05-04 Michael John Kosek Electronic transaction processing server with automated transaction evaluation
TWI402767B (zh) * 2008-11-28 2013-07-21 Hon Hai Prec Ind Co Ltd 具有圖片編輯功能的電子裝置及方法
US8655803B2 (en) 2008-12-17 2014-02-18 Xerox Corporation Method of feature extraction from noisy documents
JP5366562B2 (ja) * 2009-01-13 2013-12-11 キヤノン株式会社 情報処理装置および情報処理装置の制御方法およびプログラム
US9159090B2 (en) * 2009-03-24 2015-10-13 Hewlett-Packard Development Company, L.P. Building a standardized web form
US20100289757A1 (en) * 2009-05-14 2010-11-18 Budelli Joey G Scanner with gesture-based text selection capability
US20120072861A1 (en) * 2009-06-12 2012-03-22 Apaar Tuli Method and apparatus for user interaction
US8589433B2 (en) * 2009-10-21 2013-11-19 International Business Machines Corporation Dynamic tagging
US20110255794A1 (en) * 2010-01-15 2011-10-20 Copanion, Inc. Systems and methods for automatically extracting data by narrowing data search scope using contour matching
WO2011149608A1 (en) * 2010-05-25 2011-12-01 Beyondcore, Inc. Identifying and using critical fields in quality management
WO2012174680A1 (en) * 2011-06-24 2012-12-27 Hewlett-Packard Development Company, L.P. Identity based automated form filling
US9418304B2 (en) 2011-06-29 2016-08-16 Qualcomm Incorporated System and method for recognizing text information in object
US10769554B2 (en) * 2011-08-01 2020-09-08 Intuit Inc. Interactive technique for using a user-provided image of a document to collect information
JP5771108B2 (ja) * 2011-09-30 2015-08-26 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 光学式文字認識で生成したテキストデータの校正を支援するためのシステム、方法、プログラム
US10796232B2 (en) 2011-12-04 2020-10-06 Salesforce.Com, Inc. Explaining differences between predicted outcomes and actual outcomes of a process
US10802687B2 (en) 2011-12-04 2020-10-13 Salesforce.Com, Inc. Displaying differences between different data sets of a process
US10559380B2 (en) 2011-12-30 2020-02-11 Elwha Llc Evidence-based healthcare information management protocols
US10340034B2 (en) 2011-12-30 2019-07-02 Elwha Llc Evidence-based healthcare information management protocols
US10679309B2 (en) 2011-12-30 2020-06-09 Elwha Llc Evidence-based healthcare information management protocols
US10528913B2 (en) 2011-12-30 2020-01-07 Elwha Llc Evidence-based healthcare information management protocols
US10475142B2 (en) 2011-12-30 2019-11-12 Elwha Llc Evidence-based healthcare information management protocols
US20130173294A1 (en) 2011-12-30 2013-07-04 Elwha LLC, a limited liability company of the State of Delaware Evidence-based healthcare information management protocols
US10552581B2 (en) 2011-12-30 2020-02-04 Elwha Llc Evidence-based healthcare information management protocols
US11455350B2 (en) * 2012-02-08 2022-09-27 Thomson Reuters Enterprise Centre Gmbh System, method, and interfaces for work product management
US9037962B1 (en) * 2012-04-30 2015-05-19 Intuit Inc. Method and system for tracking and reporting data importation accuracy
US20140081883A1 (en) * 2012-06-05 2014-03-20 United Services Automobile Association Systems and methods for recruiting candidates for employment
US9665353B2 (en) * 2012-11-08 2017-05-30 Facebook, Inc. Progressive rendering of data sets
US8885951B1 (en) 2012-12-14 2014-11-11 Tony Cristofano System and method for data identification and extraction of forms
US9710806B2 (en) 2013-02-27 2017-07-18 Fiserv, Inc. Systems and methods for electronic payment instrument repository
US9189468B2 (en) * 2013-03-07 2015-11-17 Ricoh Company, Ltd. Form filling based on classification and identification of multimedia data
US20140279303A1 (en) * 2013-03-15 2014-09-18 Fiserv, Inc. Image capture and processing for financial transactions
KR102162836B1 (ko) * 2013-08-30 2020-10-07 삼성전자주식회사 필드 속성을 이용한 컨텐트를 제공하는 전자 장치 및 방법
US10061835B2 (en) 2013-10-28 2018-08-28 Motorola Solutions, Inc. Establishing user-confidence levels of data inputs
US10114800B1 (en) * 2013-12-05 2018-10-30 Intuit Inc. Layout reconstruction using spatial and grammatical constraints
US20150227787A1 (en) * 2014-02-12 2015-08-13 Bank Of America Corporation Photograph billpay tagging
US9959265B1 (en) * 2014-05-08 2018-05-01 Google Llc Populating values in a spreadsheet using semantic cues
US10204165B2 (en) * 2014-10-28 2019-02-12 Bolt Solutions Inc. Network-based gathering of background information
US20180247702A1 (en) * 2015-03-10 2018-08-30 Michigan Health Information Network Shared Services Secure, accurate, and efficient patient intake systems and methods
US9910566B2 (en) * 2015-04-22 2018-03-06 Xerox Corporation Copy and paste operation using OCR with integrated correction application
JP6623547B2 (ja) * 2015-05-12 2019-12-25 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
RU2613846C2 (ru) * 2015-09-07 2017-03-21 Общество с ограниченной ответственностью "Аби Девелопмент" Метод и система извлечения данных из изображений слабоструктурированных документов
US10776571B2 (en) * 2016-05-04 2020-09-15 Google Llc Dispatch of user input to multiple input fields in a user interface
CN106682665B (zh) * 2016-12-27 2020-07-14 陕西科技大学 一种基于计算机视觉的七段式数显仪表数字识别方法
US20190065614A1 (en) * 2017-08-28 2019-02-28 Go Daddy Operating Company, LLC Customer requested website from digital image metadata
US10630639B2 (en) 2017-08-28 2020-04-21 Go Daddy Operating Company, LLC Suggesting a domain name from digital image metadata
US11182547B2 (en) 2017-11-17 2021-11-23 Adobe Inc. Automated form generation system
KR102458338B1 (ko) * 2017-11-30 2022-10-25 삼성전자주식회사 컴퓨팅 장치의 정보 입력 방법 및 그 컴퓨팅 장치
US10635748B2 (en) * 2017-12-14 2020-04-28 International Business Machines Corporation Cognitive auto-fill content recommendation
US10977437B2 (en) * 2018-10-26 2021-04-13 Cimpress Schweiz Gmbh Technologies for automatically generating product designs based on linked information
US11144715B2 (en) * 2018-11-29 2021-10-12 ProntoForms Inc. Efficient data entry system for electronic forms
US11295072B2 (en) 2019-06-03 2022-04-05 Adp, Llc Autoform filling using text from optical character recognition and metadata for document types
US10922481B2 (en) * 2019-06-14 2021-02-16 International Business Machines Corporation Visual user attention redirection while form filling to enhance auto-fill accuracy
US11366968B2 (en) * 2019-07-29 2022-06-21 Intuit Inc. Region proposal networks for automated bounding box detection and text segmentation
US10839147B1 (en) * 2019-09-24 2020-11-17 Intersections Inc. Method, a system and a machine-readable data carrier for classifying input fields and groups of input fields of a webpage
US11848084B1 (en) 2020-07-23 2023-12-19 Express Scripts Strategic Development, Inc. Automated on-demand generation of custom physical labels for medication containers
US11416675B1 (en) * 2021-05-19 2022-08-16 Amdocs Development Limited System, method, and computer program for electronic form customization
IT202100012701A1 (it) * 2021-05-20 2022-11-20 Più Sviluppo S R L Metodo di acquisizione rapida dei documenti e successiva gestione degli stessi
US11475214B1 (en) * 2021-06-08 2022-10-18 Oracle International Corporation Systems and methods for auto-completing fields on digital forms
CN113379385B (zh) * 2021-06-11 2023-03-24 上海妙一生物科技有限公司 一种临床研究项目计划数据处理方法和装置
US20220414328A1 (en) * 2021-06-23 2022-12-29 Servicenow Canada Inc. Method and system for predicting field value using information extracted from a document
US11830264B2 (en) * 2022-01-31 2023-11-28 Intuit Inc. End to end trainable document extraction
SE2251012A1 (en) * 2022-08-31 2024-03-01 Seamless Distrib Systems Ab System and method for form-filling by character recognition of identity documents

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0434671A (ja) * 1990-05-31 1992-02-05 Toshiba Corp パターン認識方法及びパターン認識装置
JPH10187502A (ja) * 1996-12-26 1998-07-21 Toshiba Corp 画像情報処理装置、画像情報処理方法及び画像情報処理用記憶媒体

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5455872A (en) * 1993-04-26 1995-10-03 International Business Machines Corporation System and method for enhanced character recogngition accuracy by adaptive probability weighting
US5805747A (en) * 1994-10-04 1998-09-08 Science Applications International Corporation Apparatus and method for OCR character and confidence determination using multiple OCR devices
US5963966A (en) * 1995-11-08 1999-10-05 Cybernet Systems Corporation Automated capture of technical documents for electronic review and distribution
US6192380B1 (en) * 1998-03-31 2001-02-20 Intel Corporation Automatic web based form fill-in
US7120302B1 (en) * 2000-07-31 2006-10-10 Raf Technology, Inc. Method for improving the accuracy of character recognition processes
US20020131636A1 (en) * 2001-03-19 2002-09-19 Darwin Hou Palm office assistants
US20040205530A1 (en) * 2001-06-28 2004-10-14 Borg Michael J. System and method to automatically complete electronic forms
US20040205526A1 (en) * 2001-09-28 2004-10-14 Vadim Borodovski Prompted form filling mechanism
US7058567B2 (en) * 2001-10-10 2006-06-06 Xerox Corporation Natural language parser
US20030163782A1 (en) * 2002-02-27 2003-08-28 Owen Benjamin K. Form data entry system
US7171061B2 (en) * 2002-07-12 2007-01-30 Xerox Corporation Systems and methods for triage of passages of text output from an OCR system
US7426496B2 (en) * 2004-03-03 2008-09-16 Microsoft Corporation Assisted form filling
US7305129B2 (en) 2003-01-29 2007-12-04 Microsoft Corporation Methods and apparatus for populating electronic forms from scanned documents
US7660779B2 (en) * 2004-05-12 2010-02-09 Microsoft Corporation Intelligent autofill
US7826665B2 (en) 2005-12-12 2010-11-02 Xerox Corporation Personal information retrieval using knowledge bases for optical character recognition correction

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0434671A (ja) * 1990-05-31 1992-02-05 Toshiba Corp パターン認識方法及びパターン認識装置
JPH10187502A (ja) * 1996-12-26 1998-07-21 Toshiba Corp 画像情報処理装置、画像情報処理方法及び画像情報処理用記憶媒体

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022237795A1 (zh) * 2021-05-11 2022-11-17 维沃移动通信有限公司 信息显示方法和电子设备
JP7401044B1 (ja) 2023-04-19 2023-12-19 株式会社immedio 企業に対するユーザの問合せを処理する方法

Also Published As

Publication number Publication date
JP4829920B2 (ja) 2011-12-07
EP1986106A2 (en) 2008-10-29
US7849398B2 (en) 2010-12-07
EP1986106A3 (en) 2009-04-08
US20080267505A1 (en) 2008-10-30

Similar Documents

Publication Publication Date Title
JP4829920B2 (ja) フォーム自動埋込方法及び装置、グラフィカルユーザインターフェース装置
KR101122854B1 (ko) 스캔된 문서들로부터 전자 서식들을 채우기 위한 방법 및장치
US8233714B2 (en) Method and system for creating flexible structure descriptions
US8732570B2 (en) Non-symbolic data system for the automated completion of forms
US9785627B2 (en) Automated form fill-in via form retrieval
US7836399B2 (en) Detection of lists in vector graphics documents
US20190294912A1 (en) Image processing device, image processing method, and image processing program
US20070098263A1 (en) Data entry apparatus and program therefor
US20170220858A1 (en) Optical recognition of tables
JPH08305731A (ja) 文書格納等の方法及び文書サーバ
RU2571396C2 (ru) Способ и система для верификации в процессе чтения
US8953228B1 (en) Automatic assignment of note attributes using partial image recognition results
US11741735B2 (en) Automatically attaching optical character recognition data to images
US8593697B2 (en) Document processing
JP2008282094A (ja) 文字認識処理装置
US20100023517A1 (en) Method and system for extracting data-points from a data file
JP4518212B2 (ja) 画像処理装置及びプログラム
US8908998B2 (en) Method for automated quality control
JP5134383B2 (ja) Ocr装置、証跡管理装置及び証跡管理システム
JP4517822B2 (ja) 画像処理装置及びプログラム
US8380690B2 (en) Automating form transcription
US8390836B2 (en) Automatic review of variable imaging jobs
JP5445740B2 (ja) 画像処理装置、画像処理システムおよび処理プログラム
JP2006252575A (ja) 財務諸表自動入力装置及び財務諸表自動入力方法
CN117391045B (zh) 可复制蒙文的可携带文件格式文件输出方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110419

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110419

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20110419

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20110524

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110531

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110817

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110906

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110916

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140922

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees