JP2005275820A - 帳票認識装置、方法、プログラムおよび記憶媒体 - Google Patents

帳票認識装置、方法、プログラムおよび記憶媒体 Download PDF

Info

Publication number
JP2005275820A
JP2005275820A JP2004088207A JP2004088207A JP2005275820A JP 2005275820 A JP2005275820 A JP 2005275820A JP 2004088207 A JP2004088207 A JP 2004088207A JP 2004088207 A JP2004088207 A JP 2004088207A JP 2005275820 A JP2005275820 A JP 2005275820A
Authority
JP
Japan
Prior art keywords
page
registered
recognition
search
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2004088207A
Other languages
English (en)
Inventor
Hiroaki Ikeda
裕章 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2004088207A priority Critical patent/JP2005275820A/ja
Priority to US11/086,031 priority patent/US7623714B2/en
Publication of JP2005275820A publication Critical patent/JP2005275820A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 仕切り帳票挿入等の煩雑は操作を要することなく複数ページで構成された帳票を精度よく認識する。
【解決手段】 検索帳票と登録帳票の各対応ページとの類似度を計算する。1ページ目の検索画像を登録帳票と比較する際には、登録帳票が絞り込まれていないため、全ての登録帳票が比較対象となる。算出された類似度が閾値より小さいとき登録帳票を認識対象から除外することによって認識対象をむ。
【選択図】 図3

Description

本発明は、帳票の自動認識を行う帳票認識装置、方法、プログラムおよび記憶媒体に関し、特に複数ページの帳票を扱うことが可能な帳票認識装置、方法、プログラムおよび記憶媒体に関する。
帳票を、あらかじめ登録されたフォーマットごとに自動分類する帳票認識は、大量の帳票の入力処理を行う上で大変有効な方法である。このような帳票認識装置では、スキャナ等から読み取った帳票画像データから特徴量を抽出し、帳票書式データを生成する。そして、検索帳票と登録帳票の書式データの類似度を求め、類似度の最も高い登録帳票を、認識結果とする。
帳票認識に関して、特許文献1では、帳票のテーブルに着目し、各テーブルの面積の全テーブルの面積の合計に対する割合を評価して、視覚的な感覚に近い類似度を採用している。しかし、特許文献1では、入力画像単位、すなわち1ページ単位で類似度の計算が行われるため、複数ページ綴りの帳票の認識には不適である。
複数ページ綴りの帳票の認識に関して、特許文献2では、複数ページを一括りとして処理するため、各括りの先頭に仕切り帳票を入れる。すなわち、読み取りのたびに仕切り帳票か否かを判定し、仕切り帳票であれば、次の帳票から、以後に表れる最初の仕切り帳票の前までをひとつの処理単位とする。
特開2000−285187号公報 特開平10−269311号公報
しかしながら特許文献2の帳票認識では、複数ページの帳票を扱う際に、仕切り帳票を作成するという煩雑な操作が付加される。
本発明はこのような従来の問題点を解消すべく創案されたもので、仕切り帳票挿入等の煩雑は操作を要することなく複数ページで構成された帳票を精度よく認識することを目的とする。
本発明によれば、仕切り帳票挿入等の煩雑は操作を要することなく複数ページで構成された帳票を精度よく認識し得る。
本発明は、複数ページで構成される検索帳票の画像が、予め登録されている複数の登録帳票のいずれに対応するか認識する帳票認識装置であって、前記検索帳票および前記登録帳票の各ページの特徴量を抽出する特徴抽出手段と、前記検索帳票の各ページの特徴量と前記登録帳票の各ページの特徴量との類似度を計算する類似度計算手段と、前記類似度が所定の値より小さいときに、該登録帳票を認識対象の候補から除外する対象帳票選択手段と、前記対象帳票選択手段で除外された前記登録帳票以外の登録帳票について、前記類似度に基いて認識結果の帳票を決定する帳票決定手段とを備える。これによって、仕切り帳票挿入等の煩雑は操作を要することなく複数ページで構成された帳票を精度よく認識し得る。
本発明は、複数ページで構成される検索帳票の画像が、予め登録されている複数の登録帳票のいずれに対応するか認識する帳票認識装方法であって、
前記検索帳票および前記登録帳票の各ページの特徴量を抽出する特徴抽出ステップと、前記検索帳票の各ページの特徴量と前記登録帳票の各ページの特徴量との類似度を計算する類似度計算ステップと、前記類似度が所定の値より小さいときに、該登録帳票を認識対象の候補から除外する対象帳票選択ステップと、前記対象帳票選択ステップで除外された前記登録帳票以外の登録帳票について、前記類似度に基いて認識結果の帳票を決定する帳票決定ステップとを備える。これによって、仕切り帳票挿入等の煩雑は操作を要することなく複数ページで構成された帳票を精度よく認識し得る。
次に本発明に係る帳票認識装置の好適な実施例を図面に基いて説明する。
図1は本発明に係る帳票認識装置の実施例1を示すブロック図である。
図1において、帳票認識装置は、磁気ディスク等の外部記憶装置104およびイメージスキャナ108を備え、帳票の画像データを外部記憶装置104から読み込み、あるいは帳票をイメージスキャナ108で読み取る。
帳票認識装置は全体制御のためのCPU101を備え、CPU101の制御プログラムはROM102に格納されている。イメージスキャナ108から入力された帳票画像はRAM103に保持され、ROM102内の制御プログラムにより、帳票認識のための処理を実行する。
帳票認識のための特徴量等は制御プログラムとともにROM102に格納され、あるいは外部記憶装置104からRAM103に読み込まれる。
なお必要に応じ、帳票認識に先立ってノイズ除去等の前処理を実行する。
図1において、105はディスプレイ、106はキーボード、107はマウス等のポインティングデバイスである。また、109はネットワークインターフェースであり、図示しない遠隔地に存在する装置と通信し、プログラム、認識辞書、データ等を送受信し得る。
本発明は汎用的なコンピュータでも実施可能であり、その場合、媒体等で提供される制御プログラムを外部記憶装置104に記憶し、オペレータの指示等によりCPU101で実行するように構成してもよい。
また、帳票認識装置は、イメージスキャナ108やディスプレイ105などがインターフェイスを介して接続された構成であってもよい。
次に、図1の帳票認識装置の処理内容を説明する。
図2は、帳票認識装置に帳票登録の処理を示すフローチャートであり、図3は、帳票認識の処理を示すフローチャートである。
図2において、帳票登録の処理は以下の各ステップによって実行される。
ステップS201:まず、イメージスキャナ108等から登録すべき帳票の画像データを1ページずつ入力する。
ステップS202:ステップS201で入力された1ページの画データにおいて特徴量を抽出する。特徴量は、例えば帳票内にある表枠の大きさ、位置、数、あるいは、表枠内のセル数等である。
ステップS203:登録すべき帳票における全ページの特徴量抽出処理が終了したか否かを判断し、全ページが終了していなかったときはステップS201に戻る。これによって全ページの特徴量抽出処理が終わるまでステップS201〜S203の処理を繰り返す。
ステップS204:ステップS202で抽出された各ページ毎の特徴量を保存すると共に、全ページを一つの帳票として関連付けつつ保存する。これによって1セットの帳票の登録処理が終了する。登録帳票の画像データや特徴量はRAM103や外部記憶装置104に保存される。
図2の処理によって登録された帳票のデータは、例えば、図4のデータ構成となる。すなわち、3ページの帳票ID1が、1ページ目の画像データA、2ページ目の画像データB、3ページ目の画像データCで構成され、4ページの帳票ID2が1ページ目の画像データD、2ページの画像データE、3ページ目の画像データF、4ページ目の画像データGで構成され、2ページの帳票ID3が、1ページ目の画像データH、2ページ目の画像データIで構成されていることがテーブル状に保存される。
図3において、帳票認識の処理は以下の各ステップによって実行される。
ステップS301:本実施例では、認識対象の帳票(検索帳票という。)の各ページの画像(検索画像という。)のデータについて特徴量を抽出(ステップS305)し、各ページの特徴量をバッファに格納する。まず、ステップS301では、このバッファに認識処理未完の特徴量が存在するか否かを判断する。認識処理未完の特徴量が存在するときはステップS306に進み、存在しなければ、ステップS302に進む。
ステップS302:検索帳票の検索画像の入力はステップS303から開始されるが、ステップS302では、検索帳票の全ページ入力の終了判断を行う。全ページの入力が終了したときはステップS316に進み、未入力のページが残っているときはステップS303に進む。
ステップS303:検索帳票の検索画像の入力を開始し、ステップS304に進む。
ステップS304:入力された1ページの検索画像について所定の特徴量を抽出する。特徴量は、登録帳票に関するステップS202と同様、帳票内にある表枠の大きさ、位置、数、あるいは、表枠内のセルの数等である。
ステップS305:ステップS304に続き、ステップS304で抽出した特徴量をステップS301で説明したバッファに記憶する。
ステップS306:ステップS301で、既にバッファ内に特徴量が格納されているときは、バッファの先頭にある特徴量を取り出し、ステップS307にジャンプする。
ステップS307:ステップS306で取り出した特徴量と、登録帳票の各対応ページとの類似度を計算する。1ページ目の検索画像を登録帳票と比較する際には、登録帳票が絞り込まれていないため、全ての登録帳票が比較対象となる。従って、図4の登録帳票のテーブルが比較対象である場合、帳票ID1〜ID3の1ページ目の画像データA、D、Hとの類似度を計算する。
ステップS308:ステップS307に続き、ステップS307で算出された類似度を所定の閾値と比較する。類似度が閾値より小さいときはステップS309に進み、類似度が閾値以上のときはステップS310に進む。
ステップS309:対応ページの類似度が閾値より小さい登録帳票を認識対象から除外することによって認識対象を絞り込み、ステップS310に進む。例えば、画像データDとの類似度が閾値より小のとき、帳票ID2は対象外となり、認識対象は帳票ID1、ID3に絞り込まれる。
ステップS310:ステップS309に続いて、検索帳票の最終ページまで、入力、特徴量算出の処理が完了したか否かを判断する。処理が完了していれば、ステップS311に進み、未処理のページが残っているときはステップS314に進む。
ステップS311:認識対象として帳票が1個に絞り込まれたか否か判断する。唯一の帳票に絞り込まれたときはステップS312に進み、複数の帳票が認識対象として残っているときはステップS313に進む。
ステップS312:唯一に絞り込まれた帳票を帳票認識結果とし、ステップS314に進む。
ステップS313:複数の帳票が残っている場合、例えば、各帳票について、各ページの類似度を全ページについて平均し、平均値が最大となる帳票を帳票認識結果とする。あるいは、各ページの類似度の最低値を比較し、類似度最低値が最も大きい帳票をものを帳票認識結果とする等、種々のアルゴリズムにより、認識結果としての帳票を選択し得る。
ステップS314:ステップS312またはステップS313により認識結果が確定したときは、以後の認識処理のために、特徴量が格納されているバッファから認識結果の帳票のページ数分だけ特徴量を削除する。
例えば、帳票ID1、ID3の2ページ目の画像データB、Iの両者が、類似度においてステップS308の閾値以上であったとき、さらに3ページ目の画像データCの類似度が閾値以上であれば、帳票ID1、ID3の両者が認識対象に残る。ここで帳票ID3が認識結果となった場合、H、Iの2ページ分の特徴量がバッファより削除される。
一方、帳票ID1に関して、類似度算出の可能性があったため、3ページ目の画像データCが先読みされ、既に特徴量が抽出されてバッファに格納されている。従って画像データCの特徴量は直ちに取り出し可能であり、画像データCを1ページ目として再度認識処理が開始される。
一方、帳票ID1が認識結果となった場合、特徴量が抽出されたすべてのページが認識結果に使用されたことになり、バッファ内の全てのページが消去される。以後の認識処理においては、ステップS303で新たに画像入力が実行される。
ステップS314:検索帳票の最後のページまで類似度計算が完了していない場合、認識対象とすべき登録帳票が残っているか否か判断する。認識対象とすべき登録帳票が残っているときはステップS301に戻って、ステップS301以下の処理を繰り返し、登録帳票が残っていないときはステップS315に進む。
ステップS315:既に認識対象がなくなった場合、検索帳票の最初のページの認識結果を「Unknown」とする。一方、バッファに格納された特徴量の先頭の情報を削除し、これまで2ページ目に位置していた帳票ページを先頭ページとして、同一検索帳票について再度に帳票認識を実行する。
ステップS310で検索画像の処理する完了したときに、バッファ内が空であれば、すべての検索画像の認識が成功したことになるが、バッファ内に特徴量が残っていれば、帳票認識は不成功となり、それらの認識結果はすべて「Unknown」とされる。
以上説明したように、実施例1では、ページ数が一様でない複数ページの帳票について認識処理が可能である。
また特徴量が計算された検索画像は、類似度が充分高い登録帳票が存在せず、あるいはページ数がことなる等の原因で認識不成功になったときでも「Unknown」として処理を完結するので、検索画像を再度処理する必要がある場合でも、再計算を要求されない。
図6は、帳票認識装置で実行可能な各種データ処理プログラムを格納する記憶媒体のメモリマップである。メモリマップには、ディレクトリ情報と、図2のフローチャートの処理を実行するプログラムコード群よりなる第1のデータ処理プログラムと、図3のフローチャートの処理を実行するプログラムコード群よりなる第1のデータ処理プログラムが格納される。
ディレクトリ情報においては、特に図示しないが、各種プログラムに従属するデータ、例えば認識辞書等も管理され、また、各種プログラムをコンピュータにインストールするためのプログラム等が記憶される場合もある。
実施例1は、仕切り帳票挿入等の煩雑は操作を要することなく複数ページで構成された帳票を精度よく認識し得る。
さらに、ページ単位での処理対象帳票を絞込むことで、類似度計算の回数を減少でき、認識処理時間を短縮し得る。また検索帳票と異なる登録帳票を認識対象から除外することによって認識対象を絞り込むので、認識精度を向上させる効果がある。
次に本発明に係る帳票認識装置の実施例2を図面に基いて説明する。
実施例2は図1と同様の構成、図3と同様の処理によって、特定ページが繰り返し出現する帳票の認識において有利である。
図5において、登録帳票ID2は2ページ目に登録された画像データEと、3ページ目に登録された画像データFが繰り返し出現する。すなわち1ページ目の画像データDに続いて、画像データEのページ、画像データFのページが、E、F、E、F、…、E、Fのように繰り返し出現し、最後に4ページ目に登録された画像データGが出現する。図5のテーブルでは、2ページ目の画像データEに右向き矢印が付され、3ページ目に登録された画像データFに左向き矢印が付されており、右向き矢印によって繰り返しの開始ページ、左向き矢印によって繰り返しの終了ページを示している。
繰り返しの範囲が3ページ以上のときは、同様に右向き矢印によって繰り返しの開始ページ、左向き矢印によって繰り返しの終了ページを示す。また、1セットの帳票で複数の繰り返し範囲を定義することも可能である。
さらに、開始位置と終了位置が同一ページ、すなわち1ページの画像Eが、E、E、…、Eのように繰り返される場合、同一ページに右向き矢印および左向き矢印を付し、あるいはその他の指標を付す等の方法で、繰り返しを定義する。
実施例2では、図3のステップS307の類似度計算において、ページの繰り返しを考慮した処理を行う。例えば、帳票ID2の3ページ目の画像データとの類似度を計算し、ステップS308で類似度が所定値以上と判断されたときには、次の比較対象として、4ページ目の画像データGおよび繰り返しの結果出現する2ページ目の画像データEの両者を評価する。そして、他の帳票が認識対象に残っていればその帳票も評価する必要がある。
3ページ目の類似度評価に続いて、ステップS307で画像データEの類似度を算出し、ステップS308で類似度が所定値以上と判断され、認識対象として残ったとき、画像データEの繰り返しが発生したことになる。このとき、次に類似度を算出すべき画像データはFとなり、画像データFの類似度が所定値以上であれば、再び画像データGおよび画像データEの両者が比較対象となる。
またステップS314では、繰り返しを含んだ全ページ数を認識結果としてバッファから削除する。
以上説明したように、実施例2は、複数のページで構成され、その一部が繰り返されているような、ページ数可変の帳票であっても、繰り返しを自動的に判断し、帳票認識できる効果がある。
本発明に係る帳票認識装置の実施例1を示すブロック図である。(実施例1) 図1の帳票認識装置における登録処理を説明するフローチャートである。(実施例1) 図1の帳票認識装置における認識処理を説明するフローチャートである。(実施例1) 図1の帳票認識装置における登録帳票のデータ構成を示すテーブルである。(実施例1) 本発明に係る帳票認識装置の実施例2における登録帳票のデータ構成を示すテーブルである。(実施例2) 図1の帳票認識装置における各種データ処理プログラムを格納する記憶媒体のメモリマップを示す図である。(実施例2)
符号の説明
101・・・CPU
102・・・ROM
103・・・RAM
104・・・外部記憶装置
105・・・ディスプレイ
106・・・キーボード
107・・・ポインティングデバイス
108・・・スキャナ部
109・・・ネットワークインターフェース

Claims (7)

  1. 複数ページで構成される検索帳票の画像が、予め登録されている複数の登録帳票のいずれに対応するか認識する帳票認識装置であって、
    前記検索帳票および前記登録帳票の各ページの特徴量を抽出する特徴抽出手段と、
    前記検索帳票の各ページの特徴量と前記登録帳票の各ページの特徴量との類似度を計算する類似度計算手段と、
    前記類似度が所定の値より小さいときに、該登録帳票を認識対象の候補から除外する対象帳票選択手段と、
    前記対象帳票選択手段で除外された前記登録帳票以外の登録帳票について、前記類似度に基いて認識結果の帳票を決定する帳票決定手段と、
    を備えた帳票認識装置。
  2. 前記検索帳票の特徴量を格納する特徴量登録手段と、
    前記特徴抽出手段により得られた特徴量を前記特徴量登録手段に記憶する特徴量記憶手段と、
    をさらに有し、
    前記類似度計算手段は、特徴量登録手段から前記検索帳票の各ページの特徴量を読み取る、
    ことを特徴とする請求項1記載の帳票認識装置。
  3. 前記登録帳票の前記ページの繰り返しを記憶するページ繰り返し帳票登録手段をさらに有し、
    前記類似度計算手段は、前記検索帳票のページが繰り返しとなる可能性がある場合、前記対象帳票選択手段で除外されなかった認識対象のページに、繰り返しの可能性のあるページを加えて、類似度を計算する、
    ことを特徴とする請求項1記載の帳票認識装置。
  4. 前記対象帳票選択手段が前記検索帳票全ページの類似度計算を完了する前に、認識対象の登録帳票がなくなった場合、前記検索帳票の最初のページを認識不能とし、次のページを先頭ページとみなして前記検索帳票を再度を認識処理することを特徴とする請求項1記載の帳票認識装置。
  5. 複数ページで構成される検索帳票の画像が、予め登録されている複数の登録帳票のいずれに対応するか認識する帳票認識装方法であって、
    前記検索帳票および前記登録帳票の各ページの特徴量を抽出する特徴抽出ステップと、
    前記検索帳票の各ページの特徴量と前記登録帳票の各ページの特徴量との類似度を計算する類似度計算ステップと、
    前記類似度が所定の値より小さいときに、該登録帳票を認識対象の候補から除外する対象帳票選択ステップと、
    前記対象帳票選択ステップで除外された前記登録帳票以外の登録帳票について、前記類似度に基いて認識結果の帳票を決定する帳票決定ステップと、
    を備えた帳票認識方法。
  6. 請求項5記載の帳票認識方法をコンピュータによって実現させるためのコンピュータ実行可能プログラム。
  7. 請求項5に記載の帳票認識方法をコンピュータによって実現させるためのコンピュータ読取可能なプログラムを格納する記憶媒体。
JP2004088207A 2004-03-25 2004-03-25 帳票認識装置、方法、プログラムおよび記憶媒体 Withdrawn JP2005275820A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2004088207A JP2005275820A (ja) 2004-03-25 2004-03-25 帳票認識装置、方法、プログラムおよび記憶媒体
US11/086,031 US7623714B2 (en) 2004-03-25 2005-03-22 Form recognition system, method, program, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004088207A JP2005275820A (ja) 2004-03-25 2004-03-25 帳票認識装置、方法、プログラムおよび記憶媒体

Publications (1)

Publication Number Publication Date
JP2005275820A true JP2005275820A (ja) 2005-10-06

Family

ID=34989860

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004088207A Withdrawn JP2005275820A (ja) 2004-03-25 2004-03-25 帳票認識装置、方法、プログラムおよび記憶媒体

Country Status (2)

Country Link
US (1) US7623714B2 (ja)
JP (1) JP2005275820A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110633660A (zh) * 2019-08-30 2019-12-31 盈盛智创科技(广州)有限公司 一种文档识别的方法、设备和存储介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7154982B2 (ja) * 2018-12-06 2022-10-18 キヤノン株式会社 情報処理装置、制御方法、及びプログラム

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5448375A (en) * 1992-03-20 1995-09-05 Xerox Corporation Method and system for labeling a document for storage, manipulation, and retrieval
US5502575A (en) * 1992-08-06 1996-03-26 Matsushita Electric Industrial Co., Ltd. Imaging apparatus having a counterfeiting prevention function
US6549638B2 (en) * 1998-11-03 2003-04-15 Digimarc Corporation Methods for evidencing illicit use of a computer system or device
JPH10269311A (ja) 1997-03-25 1998-10-09 Oki Electric Ind Co Ltd 帳票処理単位指定方法
US6741743B2 (en) * 1998-07-31 2004-05-25 Prc. Inc. Imaged document optical correlation and conversion system
JP4416202B2 (ja) 1999-03-31 2010-02-17 キヤノン株式会社 帳票認識装置、情報システム、及び記憶媒体
US6370271B2 (en) * 1999-04-30 2002-04-09 Seiko Epson Corporation Image processing apparatus and methods for pattern recognition
JP3962891B2 (ja) * 2000-08-09 2007-08-22 富士ゼロックス株式会社 文書画像処理装置、文書画像処理方法、及び記憶媒体
US6912308B2 (en) * 2000-12-01 2005-06-28 Targus Communications Corp. Apparatus and method for automatic form recognition and pagination

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110633660A (zh) * 2019-08-30 2019-12-31 盈盛智创科技(广州)有限公司 一种文档识别的方法、设备和存储介质

Also Published As

Publication number Publication date
US7623714B2 (en) 2009-11-24
US20050213819A1 (en) 2005-09-29

Similar Documents

Publication Publication Date Title
JP3689455B2 (ja) 情報処理方法及び装置
JP4926004B2 (ja) 文書処理装置、文書処理方法及び文書処理プログラム
JP3919617B2 (ja) 文字認識装置および文字認識方法、プログラムおよび記憶媒体
JP6900164B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP2006031546A (ja) 文字方向識別装置、文書処理装置及びプログラム並びに記憶媒体
CN115828874A (zh) 基于图像识别技术的行业表格数字化处理方法
US8526744B2 (en) Document processing apparatus and computer readable medium
JP5623574B2 (ja) 帳票識別装置および帳票識別方法
JP4154308B2 (ja) 帳票認識装置、帳票認識方法、プログラムおよび記憶媒体
JP2005275820A (ja) 帳票認識装置、方法、プログラムおよび記憶媒体
CN116958977A (zh) 签名位置确定方法、装置、设备及存储介质
JP6131765B2 (ja) 情報処理装置及び情報処理プログラム
CN115858797A (zh) 一种基于ocr技术生成中文近义词的方法及***
JP2005063419A (ja) 言語識別装置、プログラム及び記録媒体
JP7358838B2 (ja) 情報処理装置、及び情報処理プログラム
JP4328511B2 (ja) パターン認識装置、パターン認識方法、プログラムおよび記憶媒体
JP2013182459A (ja) 情報処理装置、情報処理方法及びプログラム
JP2010009337A (ja) アノテーション装置、アノテーション方法およびプログラム
CN115546810B (zh) 图像元素类别的识别方法及装置
JP7501255B2 (ja) 文書検索システム、文書検索方法およびプログラム
JP2010061449A (ja) 原画像探索装置及び原画像探索プログラム
JP2006343797A (ja) 文字認識装置、文字認識方法およびコンピュータプログラム
JPH05346974A (ja) 文字認識装置
JP2001338263A (ja) 画像処理装置及び画像処理方法並びに記憶媒体
CN118036597A (zh) 基于自适应空间度量的结构化信息抽取方法、***及介质

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060606

A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20070605