JP4388030B2 - 文書自動分類システムと方法及びその記録媒体 - Google Patents

文書自動分類システムと方法及びその記録媒体 Download PDF

Info

Publication number
JP4388030B2
JP4388030B2 JP2006128111A JP2006128111A JP4388030B2 JP 4388030 B2 JP4388030 B2 JP 4388030B2 JP 2006128111 A JP2006128111 A JP 2006128111A JP 2006128111 A JP2006128111 A JP 2006128111A JP 4388030 B2 JP4388030 B2 JP 4388030B2
Authority
JP
Japan
Prior art keywords
document
straight lines
basic
straight
digitized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006128111A
Other languages
English (en)
Other versions
JP2006313550A (ja
Inventor
齊平 葉
志宗 江
智堯 張
Original Assignee
力新国際科技股▲ふん▼有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 力新国際科技股▲ふん▼有限公司 filed Critical 力新国際科技股▲ふん▼有限公司
Publication of JP2006313550A publication Critical patent/JP2006313550A/ja
Application granted granted Critical
Publication of JP4388030B2 publication Critical patent/JP4388030B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)
  • Processing Or Creating Images (AREA)
  • Character Input (AREA)

Description

本発明は文書自動分類システムと方法、及びその記録媒体に関し、特に、文書に複数の直線を有する文書自動分類システムと方法及びその記録媒体に関する。
近年、情報技術の進歩により、様々な情報をデジタル化して保存することが可能となった。文書のデジタル化がその一例である。文書をデジタル化することで、文書の保存空間を有効的に縮小できるだけでなく、検索や管理も簡単になる。しかし、会社経営で生じる文書の数は膨大で、種類も煩雑であり、例えば、財務、人事、研究開発、品質保証など、様々な文書を管理する必要があり、新たな形式の管理負担となっている。
文書を分類することは文書管理の重要な手順であり、これにより、検索の範囲を縮小し、管理の効率を高めることができる。これまで、光学式文字認識(optical character recognition, OCR)によって文書の自動分類を行う方法があったが、光学式文字認識は比較的多くの処理と演算、及びより良いハードウェア設備を必要とし、且つ、大量の資源を消耗するため、文書に書かれた内容まで細分する必要がない限り、光学式文字認識の方法による文書の自動分類は避けている。
もう一種類の文書自動分類の方法は、人間が視覚分類を行う行動パターンをシミュレートし、文書中から重要な特徴を取得し、二つの文書が同じであるかどうかを判断する。例えば、文書における表の外観に基づき、特徴を篩いにかけて取得を行う。特徴とは一般的に表の線、又は線によって囲まれた欄を指す。しかし、紙文書はデジタル化入力の過程において、傾斜したり、変位したり、異なった解像度による等比例拡大縮小などの問題が、文書自動分類の判断を妨げる。ベクトル、傾斜角度、傾きなどの関連データを利用して上述の干渉要因を排除することもできるが、大量の演算を行うことによるハードウェアの消耗はやはり避けられない。
よって、文書自動分類の干渉要因をいかにして排除し、より簡単なハードウェアでデジタル化文書を有効に分類するかが目下解決すべき課題である。
上述の課題に対し、本発明の目的は、文書をデジタル化する時に生じる傾斜、変位、等比例拡大縮小などの干渉要因を排除し、且つ、より簡単なハードウェアでデジタル化文書を有効に分類することのできる、文書自動分類システムと方法及びその記録媒体を提供することである。
上述の目的を遂げるため、本発明の文書自動分類システムはデータベースと、位置決め情報の取得装置と、位置決め装置と、文書比較装置と、を有する。データベースは、少なくとも一つの基本文書を保存する。位置決め情報の取得装置は、デジタル化文書にある複数の直線の位置決め情報を取得する。位置決め装置は前記複数の直線の位置決め情報を基に、基本文書にある直線と比較を行い、基本文書の対応直線を抽出する。文書比較装置は、複数の直線と基本文書の対応直線を比較し、位置決め処理によって複数の直線と基本文書の対応直線を重ね合せ、さらに、デジタル化文書にある全ての直線とこれら直線に最も近い位置にある基本文書の直線との距離を基に、前記デジタル化文書と前記基本文書が同じ種類であるかどうかを判別する。
本発明は更に文書自動分類方法を提供する。その方法は、デジタル化文書にある複数の直線の位置決め情報を取得するステップと、複数の直線の位置決め情報を基に基本文書の直線と比較を行い、基本文書の対応直線を抽出するステップと、複数の直線とデータベースに保存されている基本文書の対応直線を比較し、位置決め処理によって、前記複数の直線と前記基本文書の対応直線を重ね合せ、デジタル化文書にある全ての直線と、それらに最も近い位置にある前記基本文書の直線との距離を基に、前記デジタル化文書と前記基本文書が同じ種類であるかどうかを判別するステップと、を有する。
本発明の文書自動分類システムと方法によれば、簡単な演算処理だけで文書をデジタル化する過程で生じる、例えば、傾斜、変位、等比例拡大縮小などの干渉要因を排除でき、且つ、より簡単なハードウェアでデジタル化文書を有効に自動分類することができる。
本発明の文書自動分類システム及び方法を、図面を参考にして以下に述べる。
図1は、本発明の実施例の文書自動分類システム1を示す図である。自動分類システム1はデジタル化文書32を分類し、データベース11と、位置決め情報の取得装置12と、位置決め装置13と、文書比較装置14とを有する。
データベース11には少なくとも一つの基本文書31を保存する。以下、表を有する文書を例に説明する。図2は基本文書31を示す図であり、基本文書31の位置決め情報は、表の直線の端点座標、任意の二直線間の距離とそのうちの一直線の長さとの比、及び、任意の二直線の間の投影重なり比例、などである。例えば、線分AA’の端点座標や、線分BB’と線分CC’の距離D1と線分BB’の長さL1との比D1/L1や、距離D1と線分CC’の長さL2の比D1/L2や、線分AA’と線分CC’の距離D2と線分AA’の長さL1との比D2/L1や、線分BB’上における線分CC’の投影重なり比例L2/L1などである。
位置決め情報の取得装置12はデジタル化文書32にある複数の直線の位置決め情報の取得に用いられる。図3に示すように、例えば、位置決め情報の取得装置12はデジタル化文書32の線分bb’、 線分cc’、 線分dd’の端点座標を取得し、演算後、線分bb’と線分cc’の距離D4と線分bb’の長さL4との比D4/L4や、線分cc’と線分dd’の距離D5と線分cc’の長さL5との比D5/L5や、線分bb’上における線分cc’の投影重なり比例L5/L4などが得られる。
位置決め装置13は、デジタル化文書32から取得した複数の直線の位置決め情報と基本文書31の対応する直線の位置決め情報を比較する。例えば、動的計画法(dynamic programming)によって、デジタル化文書32の線分bb’、 線分cc’、 線分dd’を見つけ、基本文書31の線分BB’、 線分CC’、 線分DD’と対応させる。
文書比較装置14は、デジタル化文書32にある複数の直線の位置決め情報と基本文書31を比較して、位置決め処理を行い、デジタル化文書32にある複数の直線と基本文書31の対応する直線とを重ね合わせる。位置決め情報処理は、回転、変位、等比例拡大縮小、又は、上記の二種類以上の演算処理を行う。
回転処理は、デジタル化文書32にある複数の直線と水平線の夾角からデジタル化文書32の傾斜の程度を求めて、補正を行ってデジタル化文書32にある複数の直線と基本文書31の対応する直線を重ね合わせる。平行移動処理は、デジタル化文書32の複数の直線と基本文書31の対応する直線の端点座標から、デジタル化文書32の水平変位量と垂直変位量を求め、補正を行った後デジタル化文書32の複数の直線と基本文書31の対応する直線を重ね合わせる。等比例拡大縮小処理はデジタル化文書32の複数の直線のうち、任意の二直線の距離と二直線のいずれか一直線の長さの比を保持したまま、或いは、任意の二直線の投影重なり比を変えずに、拡大縮小を行い、デジタル化文書32の複数の直線と基本文書31の対応する直線を重ね合わせる。例えば、線分bb’と線分cc’の距離D4と線分bb’の長さL4の比D4/L4を変えずに、デジタル化文書32を拡大縮小することによって、線分bb’の長さL4を基本文書31の線分BB’の長さL1と同じにすると、デジタル化文書32を基本文書31と同じ大きさに拡大縮小できる。
文書比較装置14は、さらに、デジタル化文書32にある全ての直線と、これら直線に最も近い位置にある基本文書31の直線との距離によって、デジタル化文書32と基本文書31が同じ種類であるかどうか判断する。その判断方法は、デジタル化文書32とデータベースにある基本文書31を比較し、デジタル化文書32の全ての直線とこれら直線に最も近い位置にある基本文書31の直線との距離の和が最も小さい時、デジタル化文書32と基本文書31が同じ種類であると判断する。
図2から図5において、表を有する文書を例に本発明の実施例の文書自動分類システムを説明する。図2は、基本文書31の一部の位置決め情報を示し、図3は、デジタル化文書32の一部の位置決め情報を示している。デジタル化の過程ではデジタル化文書32は不安定であるため、表に傾斜、変位、及び等比例拡大縮小などが生じている。
まず、位置決め情報の取得装置12はデジタル化文書32から複数の直線の特徴を取得する。例えば、線分bb’、 線分cc’の端点座表を取得して、線分bb’の長さL4、線分cc’の長さL5、及び線分bb’と線分cc’との間の距離D4を算出する。デジタル化文書32は等比例拡大縮小されているが、線分bb’と線分cc’の相対関係は等比例拡大縮小の影響を受けない。例えば、線分bb’と線分cc’の間の距離D4と線分bb’の長さL4の比D4/L4、又は、線分bb’と線分cc’の長さの比L4/L5などである。よって、位置決め装置13は動的計画法によって、上記の位置決め情報で基本文書31から線分bb’と線分cc’に対応する直線、即ち、線分BB’と線分CC’を求めることができる。
次に、線分bb’と水平線の夾角θからデジタル化文書32の傾斜の程度を求めることができ、回転補正を行う。線分BB’の点Bの端点座標と線分bb’の点bの端点座標からデジタル化文書32の水平変位量Xと垂直変位量Yを得ることができ、補正後、線分bb’は線分BB’と重なり合う。上述のように、線分bb’と線分cc’の間の距離D4と線分bb’の長さL4の比D4/L4はデジタル化文書32の等比例拡大縮小のために変化することはない。よって、比D4/L4を保ったままデジタル化文書32を拡大縮小し、線分bb’の長さL4を線分BB’の長さL1と等しくすれば、線分bb’と線分cc’をそれぞれ線分BB’と線分CC’は重なり合う。
デジタル化文書32の位置決め処理の後、基本文書31と比較を行うことができる。図5が示すデジタル化文書32と基本文書31はまだわずかに変位が見られるが、これは説明の利便のためで、実際には無いものと考えてよい。図5に示すように、文書比較装置14はデジタル化文書32にある全ての直線と、これら直線に最も近い位置にある基本文書31の直線との距離を計算し、デジタル化文書32の全ての直線と、これら直線に最も近い基本文書31との直線の距離の和が最も小さい時、デジタル化文書32と基本文書31が同じ種類であると認定し、分類結果を出力する。逆に、図6に示すように、もしデジタル化文書32’の表に線分hh’が含まれる場合、線分hh’に最も近い基本文書31の直線が線分CC’或いは線分DD’であるので、デジタル化文書32’と基本文書31を比較して得られる距離の和は大幅に増加し、デジタル化文書32’は基本文書31と同じ種類ではないと判断する。
なお、上述の説明が二本の水平の直線を取得した場合の説明であり、自動分類の精確性を高めるため、同時にデジタル化文書32の複数の直線、例えば、線分aa’、線分bb’、線分cc’、線分dd’、線分ee’及び線分ff’を取得しても良く、この場合基本文書の線分AA’ 、線分BB’ 、線分CC’ 、線分DD’ 、線分EE’ 及び線分FF’に対して位置決め処理が行われるが、演算の負荷が増加する可能性もある。又、垂直の直線gg’を取得して参考文献31のGG’と比較してもよい。この他、表の欄の大きさをデジタル化文書32の等比例拡大縮小の基準にしてもよく、例えば線分bb’の長さL4と線分gb’の長さL6の比 L4/L6を、線分BB’の長さL1と線分GB’の長さL3の比L1/L3は等しい。
図7は、本発明の文書自動分類方法である。その手順は、デジタル化文書32にある複数の直線の位置情報を取得するステップ(S21)と、取得した複数の直線の位置決め情報とデータベース11に保存されている基本文書31の直線の位置決め情報との比較を行い、基本文書31の対応する直線を抽出するステップ(S22)と、デジタル化文書32にある複数の直線と基本文書31の対応する直線を比較し、位置決め処理によって、取得した複数の直線と基本文書31の対応する直線を重ね合せ、更に、デジタル化文書32にある全ての直線とこれら直線に最も近い位置にある基本文書31の直線との間の距離を基に、デジタル化文書32と基本文書31が同じ種類であるかどうかを判別するステップと(S23)を有する。位置決め情報の取得、位置決め処理、及び文書比較などの方法は上記に述べたとおりである。
本発明の文書自動分類システムと方法によれば、光学式文字認識を必要とせず、且つ、簡単な演算処理だけで文書をデジタル化する過程に生じる、例えば傾斜、変位、等比例拡大縮小などの干渉要因を排除できる。よって、本発明の文書自動分類システムと方法は、より簡単なハードウェアでデジタル化文書を有効に自動分類することができる。
以上、図面を参照して本発明の実施形態を詳述してきたが、具体的な構成は、この実施形態に限られるものではない。例えば、複数の直線の特徴を取得する前に細線化の画像処理を行うことによって、より精確な直線の端点座標を得ることができる。又、本発明実施例では表を有する文書を例に説明しているが、文字のみの文書でも本発明のシステムと方法を利用することができる。例えば、文書の文書名称、単一種類の文書に特有の文字記載などを単一の直線と見なし、即ち、文書内の連続した文字列を単一直線として、直線の特徴を取得する際の基準としてもよい。更に例えば、文書にある物体を文書の位置決めの基礎として、物体縁部の直線の位置決め情報を取得して後続の処理を行い、文書の分類を行ってもよい。又、上述した文書自動分類方法をコンピュータに実行させるためのプログラムとして記録したコンピュータ読み取り可能な記録媒体(例えば、メモリカード、FD、CD、DVD、MO、ROMなど)を提供することも可能である。勿論、上述のプログラムをインターネットのような通信ネットワークを介して配布することも可能である。よって、本発明の要旨を逸脱しない範囲の設計変更等があっても、本発明に含まれる。
本発明の実施例の文書自動分類システムを示すブロック図である。 本発明の基本文書を示す略図である。 本発明のデジタル化文書を示す略図である。 本発明の基本文書に対して、デジタル化文書が傾斜、変位、等比例拡大縮小を生じていることを示す図である。 位置決め処理後のデジタル化文書と基本文書の比較を示す略図である。 もう一つの位置決め処理後のデジタル化文書と基本文書の比較を示す略図である。 本発明の実施例の文書自動分類方法の手順を示すフローチャートである。
符号の説明
1 文書自動分類システム
11 データベース
12 位置決め情報の取得装置
13 位置決め装置
14 文書比較装置
31 基本文書
32、32’ デジタル化文書
S21〜S23 文書自動分類方法の手順

Claims (15)

  1. デジタル文書を分類する文書自動分類システムであり、前記デジタル文書が少なくとも一の表を含み前記システムが
    少なくとも一の表を含む、少なくとも一の基本文書を保存するデータベースと、
    デジタル化文書にある複数の直線の位置決め情報を取得する位置決め情報の取得装置、前記位置決め情報が前記複数の直線の端点座標を含み、前記複数の直線の縁部直線の任意の二直線間の距離とそのうちの一直線の長さとの比、および任意の二直線の投影重なり比を含み
    動的計画法により、前記複数の直線の位置決め情報と前記基本文書の直線との比較を行い、前記基本文書にある対応直線を抽出する位置決め装置と、
    前記複数の直線と前記基本文書の対応する直線を比較し、位置決め処理によって前記複数の直線と前記基本文書の対応直線を重ね合わせ、さらに、前記デジタル化文書にある全ての直線とこれら直線に最も近い位置にある前記基本文書との距離を基に、前記デジタル文書と前記基本文書が同じ種類であるかどうかを判別する文書比較装置と、
    を有することを特徴とする文書自動分類システム。
  2. 前記位置決め処理が回転、平行移動、等比例拡大縮小、又はこれらを組合わせた処理であることを特徴とする請求項記載の文書自動分類システム。
  3. 前記回転処理は、前記複数の直線と、水平線の夾角を補正することによって、前記複数の直線と前記基本文書にある対応直線を重ね合わせ、前記平行移動処理は、前記複数の直線と前記基本文書にある対応直線の端点座標から、前記デジタル化文書の水平変位量および垂直変位量を求め補正を行って、前記複数の直線と前記基本文書にある対応直線を重ね合わせ、前記等比例拡大縮小処理は、前記複数の直線の縁部直線の任意の二直線の間の距離とそのうちの一直線の長さとの比を保持したまま、又は任意の二直線の投影重なり比を変えずに、拡大縮小を行い、前記複数の直線と前記基本文書の対応直線を重ねあわせることを特徴とする請求項記載の文書自動分類システム。
  4. 前記文書比較装置が前記デジタル化文書と前記データベースにある前記基本文書とを比較し、前記デジタル化文書にある全ての直線と最も近い位置にある前記基本文書の直線との間の距離の和が最も小さい時、前記デジタル化文書と前記基本文書が同じ種類であると認定することを特徴とする請求項1記載の文書自動分類システム。
  5. 前記位置決め情報取得装置が先に細線化の画像処理を行い、その後前記デジタル化文書にある前記表の複数の直線の位置決め情報を取得することを特徴とする請求項1記載の文書自動分類システム。
  6. 少なくとも一の表を含むデジタル化文書を分類する、コンピュータにより実行する文書自動分類方法であり、
    少なくとも一の表を含む、少なくとも一の基本文書をデータベースに保存するステップと
    前記デジタル化文書にある複数の直線の位置決め情報を取得するステップ、このうち前記位置決め情報が前記複数の直線の端点座標を含み、前記複数の直線の縁部直線の任意の二直線間の距離とそのうちの一直線の長さとの比、および任意の二直線の投影重なり比を含み、
    動的計画法により、前記複数の直線の位置決め情報を基に前記基本文書の直線との比較を行い、前記基本文書の対応直線を抽出するステップと、
    前記複数の直線と前記基本文書の対応する直線を比較し、位置決め処理によって、前記複数の直線と前記基本文書の対応直線を重ね合わせ、更に、前記デジタル化文書にある全ての直線と最も近い位置にある前記基本文書の直線との距離を基に、前記デジタル化文書と前記基本文書が同じ種類であるかどうかを判別するステップと、
    を有することを特徴とする文書自動分類方法。
  7. 前記位置決め処理が、回転、平行移動、等比例拡大縮小、又はこれらを組合わせた処理であることを特徴とする請求項記載の文書自動分類方法。
  8. 前記回転処理は、前記複数の直線と、水平線の夾角を補正することによって、前記複数の直線と前記基本文書にある対応直線を重ね合わせ、
    前記平行移動処理は、前記複数の直線と前記基本文書にある対応直線の端点座標から、前記デジタル化文書の水平変位量および垂直変位量を求め補正を行って、前記複数の直線と前記基本文書にある対応直線を重ね合わせ、
    前記等比例拡大縮小処理は、前記複数の直線の縁部直線の任意の二直線の間の距離とそのうちの一直線の長さとの比を保持したまま、又は任意の二直線の投影重なり比を変えずに、拡大縮小を行い、前記複数の直線と前記基本文書の対応直線を重ねあわせることを特徴とする請求項記載の文書自動分類方法。
  9. 前記文書比較ステップが、前記デジタル化文書と前記データベースの前記基本文書とを比較し、前記デジタル化文書の全ての直線と最も近い位置にある前記基本文書の直線との間の距離の和が最も小さい時、前記デジタル化文書と前記基本文書が同じ種類であると認定することを特徴とする請求項の文書自動分類方法。
  10. 前記位置決め情報の取得ステップが、先に細線化の画像処理を行い、その後前記デジタル化文書にある前記表の複数の直線の位置決め情報を取得することを特徴とする請求項6記載の文書自動分類方法。
  11. 文書自動分類方法を保存したコンピュータで読取り可能な記録媒体であって、前記方法をコンピュータで読取ったのち、少なくとも一の表を含むデジタル文書を分類する方法が、
    少なくとも一の表を含む、少なくとも一の基本文書をデータベースに保存するステップと
    前記デジタル化文書にある複数の直線の位置決め情報を取得するステップであり、このうち前記位置決め情報が前記複数の直線の端点座標を含み、前記複数の直線の縁部直線の任意の二直線間の距離とそのうちの一直線の長さとの比、および任意の二直線の投影重なり比を含み
    動的計画法により、前記複数の直線の位置決め情報を基に前記基本文書の直線との比較を行い、前記基本文書の対応直線を抽出するステップと、
    前記複数の直線と前記基本文書の対応する直線を比較し、位置決め処理によって、前記複数の直線と前記基本文書の対応直線を重ね合わせ、更に、前記デジタル化文書にある全ての直線と最も近い位置にある前記基本文書の直線との距離を基に、前記デジタル化文書と前記基本文書が同じ種類であるかどうかを判別するステップと、
    を有することを特徴とするコンピュータで読取り可能な記録媒体。
  12. 前記位置決め処理が、回転、平行移動、等比例拡大縮小、又はこれらを組合わせた処理であることを特徴とする請求項11記載のコンピュータで読取り可能な記録媒体。
  13. 前記回転処理は、前記複数の直線と、水平線の夾角を補正することによって、前記複数の直線と前記基本文書にある対応直線を重ね合わせ、
    前記平行移動処理は、前記複数の直線と前記基本文書にある対応直線の端点座標から、前記デジタル化文書の水平変位量および垂直変位量を求め補正を行って、前記複数の直線と前記基本文書にある対応直線を重ね合わせ、
    前記等比例拡大縮小処理は、前記複数の直線の縁部直線の任意の二直線の間の距離とそのうちの一直線の長さとの比を保持したまま、又は任意の二直線の投影重なり比を変えずに、拡大縮小を行い、前記複数の直線と前記基本文書の対応直線を重ねあわせることを特徴とする請求項12記載のコンピュータで読取り可能な記録媒体。
  14. 前記文書比較ステップが、前記デジタル化文書と前記データベースの前記基本文書とを比較し、前記デジタル化文書の全ての直線と最も近い位置にある前記基本文書の直線との間の距離の和が最も小さい時、前記デジタル化文書と前記基本文書が同じ種類であると認定することを特徴とする請求項11記載のコンピュータで読取り可能な記録媒体。
  15. 前記位置決め情報の取得ステップが、先に細線化の画像処理を行い、その後前記デジタル化文書にある前記表の複数の直線の位置決め情報を取得することを特徴とする請求項11記載のコンピュータで読取り可能な記録媒体。
JP2006128111A 2005-05-04 2006-05-02 文書自動分類システムと方法及びその記録媒体 Expired - Fee Related JP4388030B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW094114411A TWI319153B (en) 2005-05-04 2005-05-04 System, method and medium of automatic document classification

Publications (2)

Publication Number Publication Date
JP2006313550A JP2006313550A (ja) 2006-11-16
JP4388030B2 true JP4388030B2 (ja) 2009-12-24

Family

ID=37394098

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006128111A Expired - Fee Related JP4388030B2 (ja) 2005-05-04 2006-05-02 文書自動分類システムと方法及びその記録媒体

Country Status (3)

Country Link
US (1) US7602971B2 (ja)
JP (1) JP4388030B2 (ja)
TW (1) TWI319153B (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI332635B (en) * 2007-01-05 2010-11-01 Compal Electronics Inc Method for determing oriention of chinese words
CN102023966B (zh) * 2009-09-16 2014-03-26 鸿富锦精密工业(深圳)有限公司 用于合约比较的计算机***及合约比较方法
TWI423154B (zh) * 2009-12-30 2014-01-11 Univ Nat Chi Nan Book Inventory Management System and Its Method
US8996350B1 (en) 2011-11-02 2015-03-31 Dub Software Group, Inc. System and method for automatic document management
US8831361B2 (en) * 2012-03-09 2014-09-09 Ancora Software Inc. Method and system for commercial document image classification
EP2875446A4 (en) * 2012-07-23 2016-09-28 Hewlett Packard Development Co CLASSIFICATION OF DOCUMENT
US9218701B2 (en) 2013-05-28 2015-12-22 Bank Of America Corporation Image overlay for duplicate image detection
US9298981B1 (en) * 2014-10-08 2016-03-29 Xerox Corporation Categorizer assisted capture of customer documents using a mobile device
US11436853B1 (en) * 2019-03-25 2022-09-06 Idemia Identity & Security USA LLC Document authentication
US11335110B2 (en) * 2020-08-05 2022-05-17 Verizon Patent And Licensing Inc. Systems and methods for processing a table of information in a document

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5867597A (en) * 1995-09-05 1999-02-02 Ricoh Corporation High-speed retrieval by example
JP3108015B2 (ja) * 1996-05-22 2000-11-13 松下電器産業株式会社 ハイパーテキスト検索装置
US6178417B1 (en) * 1998-06-29 2001-01-23 Xerox Corporation Method and means of matching documents based on text genre
US9460414B2 (en) * 2001-08-28 2016-10-04 Eugene M. Lee Computer assisted and/or implemented process and system for annotating and/or linking documents and data, optionally in an intellectual property management system
US6925475B2 (en) * 2001-10-12 2005-08-02 Commissariat A L'energie Atomique Process and apparatus for management of multimedia databases
JP4423164B2 (ja) * 2004-10-28 2010-03-03 株式会社日立製作所 知識共有システム及び情報公開制御方法

Also Published As

Publication number Publication date
TW200639691A (en) 2006-11-16
TWI319153B (en) 2010-01-01
JP2006313550A (ja) 2006-11-16
US7602971B2 (en) 2009-10-13
US20060251326A1 (en) 2006-11-09

Similar Documents

Publication Publication Date Title
JP4388030B2 (ja) 文書自動分類システムと方法及びその記録媒体
JP4594372B2 (ja) ドキュメント画像からのパラメータ化された形状の認識方法
JP4623676B2 (ja) 動的なコネクタ解析のための方法、装置及び記憶媒体
KR101235226B1 (ko) 화상 처리 장치, 화상 처리 방법 및 기록 매체
JP2012203458A (ja) 画像処理装置及びプログラム
JP4535584B2 (ja) ディジタル画像処理方法
JP2008158774A (ja) 画像処理方法、画像処理装置、プログラム、及び記憶媒体
JP2016062524A (ja) データ処理システム、データ処理方法およびデータ処理プログラム
JP4395188B2 (ja) 文書画像認識装置および文書画像認識プログラムの記憶媒体
JP2010186389A (ja) 情報処理装置及び情報処理プログラム
Luo et al. Multi-operator image retargeting with automatic integration of direct and indirect seam carving
KR101377910B1 (ko) 화상 처리 방법 및 화상 처리 장치
JP2008134791A (ja) 画像処理装置及び画像処理プログラム
US10679049B2 (en) Identifying hand drawn tables
JP2014170452A (ja) 画像処理装置及びプログラム
JP6137464B2 (ja) 画像処理装置および画像処理プログラム
JP3638845B2 (ja) 画像処理装置及び方法
JP2007011529A (ja) Ocr処理における文字認識位置の決定方法
JP6194781B2 (ja) 画像処理装置及びプログラム
JP2021196932A (ja) 家屋異動検出システム、家屋異動検出方法及び家屋異動検出プログラム
CN112419208A (zh) 一种基于施工图审查矢量图纸编译方法及***
JP2020113002A (ja) 表示比較プログラム、装置、及び方法
JP2009053827A (ja) 帳票画像処理装置及び帳票画像処理プログラム
JP4687558B2 (ja) 画像照合装置、画像照合方法及びプログラム
CN107092909A (zh) 基于三角形相似定理的角度检测算法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090422

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090722

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090909

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091001

R150 Certificate of patent or registration of utility model

Ref document number: 4388030

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121009

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121009

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131009

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees