JP4145530B2 - ドキュメントにおける自動的テーブル位置決め - Google Patents
ドキュメントにおける自動的テーブル位置決め Download PDFInfo
- Publication number
- JP4145530B2 JP4145530B2 JP2002045833A JP2002045833A JP4145530B2 JP 4145530 B2 JP4145530 B2 JP 4145530B2 JP 2002045833 A JP2002045833 A JP 2002045833A JP 2002045833 A JP2002045833 A JP 2002045833A JP 4145530 B2 JP4145530 B2 JP 4145530B2
- Authority
- JP
- Japan
- Prior art keywords
- crop
- document
- lines
- group
- crops
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
- Character Input (AREA)
Description
【発明の属する技術分野】
本発明は、ドキュメント内に存在するテーブル状の構造の自動的位置決めに関するものである。このようなテーブル状の構造は、例えば、フォーム上に存在するテーブルの全体又は一部である場合がある(尚、ここでは「テーブル」とはセルの二次元的集合である)。然しながら、本発明は技術的な図面におけるタイトルブロック即ち表題欄(又は「説明」)の自動的位置決めに関して特に興味のあるものである。本明細書においては、「テーブル」という用語は、前述した例の全て及び一般的にテーブル状構造を指し示すために使用する。
【0002】
【従来の技術】
本発明技術は、これのみという訳ではないが、通常、ドキュメントのスキャンしたイメージ等のドキュメントの表現、ドキュメント上に存在するイメージのベクトル表現等に対して適用される。
【0003】
ドキュメント内に存在するテーブルの位置を自動的に検知することが可能であることが有益的であるような多くの分野が存在している。1つの例はフォーム処理であり、セル内のデータを読むことによってデータベースエントリを自動的に発生させることが可能であるようにフォーム上のテーブル内のセルを自動的に位置決めすることが可能であることが望ましい。この分野においては種々の提案が既になされている。然しながら、現在使用可能なフォーム認識コンピュータプログラムの大多数は、フォーム自身からなり且つ殆ど他のものを包含することのないイメージ内の不自然な姿勢にあるフォームの認識に依存している。
【0004】
自動的テーブル位置決めは技術的図面(例えば機械工学的図面又は建築図面)を処理する分野において特に興味がある。後者の分野においては、図面のタイトルブロックを自動的に位置決めすることが可能である場合には、以下の処理を実施することが可能である。即ち、
※タイトルブロックが見えたままであるような図面の自動的折り曲げ、
※正しい配向状態での図面のポジショニング(何故ならば、タイトルブロックは、通常、例えば右下等のイメージに関して特定した角部に位置されているからである)、
※例えばパソコンを使用しての図面のスキャンしたイメージの処理において、タイトルブロックは手作業での索引付けを助けるためにタイトルブロックを拡大表示させることが可能であり、
※図面の自動的索引付けにおいて第一ステップがとられ、タイトルブロックが位置決めされると、その中に包含されている情報を抽出することの問題に過ぎなくなる。
【0005】
技術的図面においてタイトルブロック(説明)の内容を支配し且つポジショニングを行う国家レベル及び国際レベルにおいての種々のスタンダードが定義されている。これらのスタンダードとしては、ISO5457及びISO7200及びフランス国家スタンダードNFE04−503等がある。
【0006】
より詳細には、スタンダードISO7200によれば、説明は、頁内に位置されている種々の矩形状のセル、即ち「フィールド」からなるテーブル状のフォームである。該セルは情報を包含しており且つ以下の3つのフィールドは強制的である。
【0007】
※図面に対しての識別番号即ちコードを与える識別ゾーン、
※タイトルゾーン、
※図面の所有者の名前を包含するゾーン。
【0008】
スタンダードISO5457によれば、タイトルブロックの識別部分は「通常の観察方向から見た場合にタイトルブロックの右下角部に位置し、且つ170mmの最大長を有すべきである」。フランス国家スタンダードNFE04−503によれば、タイトルブロックの寸法は幅が190mmで高さが277mmを超えるものであってはならない。
【0009】
ISO5457は、更に、「水平方向に位置された用紙即ちタイプX(図1a参照)又は垂直方向に位置された用紙即ちタイプY(図1b参照)の両方に対して、図面の識別(登録番号、タイトル、出展等)を包含するタイトルブロックの部分が図面空間の右下角部に位置されるようにタイトルブロックの位置が図面空間内に存在すべきである。タイトルブロックの観察方向は、一般的に、その図面のものに対応すべきである。然しながら、印刷前の図面の用紙を節約するために、タイプXの用紙を垂直位置(図1c参照)で使用し且つタイプYの用紙を水平位置(図1d参照)において使用することが可能である。これらの場合においては、タイトルブロックの識別部分は図面空間の右上角部にあるべきであり、且つタイトルブロックが右側から見た場合に読むことが可能であるような配向状態とすべきである。」であることを特定している。
【0010】
これらのスタンダード(基準)は技術的な図面においてタイトルブロックのポジショニングを行う場合にある程度の余裕を与えるものであることが理解される。更に、これらのスタンダードは常に変化しており且つ技術的な図面はこれらのスタンダードにおいて定義されている規則に常に準拠するものではない。特に古い図面が関与する場合には変化している可能性が存在している。従って、フォーム認識ソフトウエアによって使用されるテーブル又はセルの位置決め用の技術はタイトルブロック位置決めに対しては適切なものではない。
【0011】
通常、技術的な図面は、境界、穿孔用の充填用余白、図面空間を制限するためのフレーム、ポジショニング及び配向状態を示すための中心位置決め及び配向マークを有している。然しながら、それらは常に存在するものではないのでこれらの特徴を信頼することは不可能である。更に、タイトルブロックの位置決めは、通常、技術的図面のスキャンしたイメージに基づいて行われ、且つ上述した特徴はスキャニング期間中の図面の不良なポジショニングに起因してスキャンしたイメージから存在していない場合がある。従って、タイトルブロックの位置決めはその他のファクタに基づくべきである。
【0012】
D. Lopresti及びG. Nhgy著「自動化テーブル処理:(独断的)調査(Automated Table Processing: An (Opinionated) Survey)」、GREC’99のプロシーディングズ、109−134頁の文献は、テーブル内のセルの位置が関与する場合には、一般的に、セルの境界を画定するラインを見分けることによってドキュメントのイメージからテーブルの構造を抽出することが必要であることを示している。このような方法は技術的な図面におけるタイトルブロックの位置に対して直接的に適用可能なものではない。
【0013】
「パターン認識(Pattern recognition)」、Vol.3、No.9、1353−1368(1998)におけるJ−L Chen及びH. J. Lee著「ストリップ投影を使用したフォーム構造抽出用の効率的なアルゴリズム(An efficient algorithm for form structure extraction using strip projection)」は、イメージからのテーブルの構造を抽出する方法を提案している.然しながら、この技術は、例えば技術的図面上の説明等の特定の構造の位置に対して適応されているものではない。
【0014】
T. Syeda−Mahmood著「工学図面におけるイメージ構造から検索用キーワードの抽出(Extracting Indexing Keywords from Image Structures in Engineering Drawings)」、ICDAR’99のプロシーディングズ、471−474(1999)は、特に、技術的図面におけるタイトルブロックの位置決め及びその後のタイトルブロックからの情報の抽出の問題を取扱っている。特定の二次元構造を見つけ出すために「ロケーションハッシング(location hashing)」方法が使用されている。この技術は複雑であり、且つ位置決めすべき各構造に対するモデルを確立するための学習フェーズを必要とするという欠点を有している。従って、この方法は、技術的図面における本来的な変化する可能性に鑑みて適切なものではない。
【0015】
2000年3月22日付で出願した本発明者の先のフランス特許出願第0003639号においては、タイトルブロック位置決めの問題はテーブル状フォーム処理用の新たな方法に基づいて解決している。然しながら、この場合にも、この方法は位置決めされるべき各異なるタイプのタイトルブロックに対するモデルを必要とする欠点を有している。
【0016】
タイトルブロック位置決め方法は、G−F.Arias、A.Chhabra及びV.Misra著「グラフィックス認識の実際的適用:電話会社図面からの情報の抽出の手助け(APracticalApplicationofGraphicsRecognition:HelpingwiththeExtractionofInformationformTelephonicCompanyDrawings)」、GREC’97のプロシーディングズ、273−279頁(1997)において提案されている。この方法は、R.Kasturi及びK.Tombre「グラフィックス認識−方法及び適用(GraphicsRecognition−MethodsandApplications)」、コンピュータサイエンスにおけるレクチャノート、Vol.1072、35−48頁、スプリンゲル−フェアラーク、ベルリン、ドイツ、1996におけるA.CHHABRA、V.Misra及びJ−F.Arias著「雑音のあるランレンス符号化画像における水平ラインの検知:高速方法(Detectionofhorizontallienesinnoisyrunlengthencodedimages:TheFASTmethod)」に記載されているFAST方法に基づいており、それは図面のクロップから直線を抽出することを可能とする。これらの直線が抽出された後に、空でないセルが検知される。ある幅対高さ比の条件を満足する最も大きな面積を有するセルを検知することによってタイトルブロックが位置決めされる。この全体的な技術は、セルが特定の寸法を有しているドキュメントに対して特定的なものであり、従って技術的な図面におけるタイトルブロックにおけるようにセル寸法が変化する蓋然性がある場合には有用なものではない。
【0017】
【発明が解決しようとする課題】
本発明はテーブル位置決めの従来方法において固有の問題及び欠点を解消せんとするものである。より詳細には、本発明の好適実施例は、ドキュメント上に存在する特定のテーブルを信頼性を持って且つ迅速に位置決めすることが可能であるローバスト即ち確固としたテーブル位置決め方法及び装置を提供する。本発明技術では、ドキュメントのサブ領域の解析が関与し、これらのサブ領域はドキュメントの「クロップ」と呼ばれる。
【0018】
【課題を解決するための手段】
本発明は、ドキュメント内のテーブルを自動的に位置決めする方法を提供しており、本方法は、
ドキュメントの複数個のクロップを画定し、
該ドキュメントの各クロップに対して、その長さが所定のスレッシュホールド値以上であるラインの位置を決定し、
前記ラインの密度を表わすパラメータを評価し、
前記評価したパラメータに基づいて前記複数個のクロップのうちのどの1つが前記テーブルの位置を有しているかを決定する、
上記各ステップを有している。
【0019】
検知したイメージラインは、そのイメージが表示される媒体の背景カラーのピクセルではなくそのイメージを構成するラインに対応する。検知されたラインの長さは任意の便宜的な対応で決定することが可能である。例えば、処理したドキュメントがスキャンされ且つ解析されるものがスキャンされたイメージである場合には、異なるスキャンライン上に存在するイメージピクセルの数をカウントすることが便利な場合がある。別の例として、ドキュメントのイメージがHPGL(ヒューレットパッカードグラフィックスランゲージ)表現の下で解析される場合には、そのデータはベクトル形式であり且つそのベクトル情報はそのイメージを構成しているラインの長さに関するデータを有している。明らかに、検知されたラインの長さは、例えば、そのラインを構成しているイメージピクセルの数によって、従来の測定単位(センチメートル、ミリメートル)によって、等の任意の便利な態様で表わすことが可能である。
【0020】
検知したラインの密度を表わす評価されたパラメータは各クロップに対して定義されたグループ内の検知されたラインの数とすることが可能であり、これらのラインの隣接する対の間の分離が基準値未満である場合には、ラインは共通のグループに割当てられる。決定処理は、又、異なるクロップにおける検知されたラインの太さを考慮する場合がある。
【0021】
本発明の自動的テーブル位置決め方法が技術的な図面におけるタイトルブロックの位置決めに適用される場合には、複数個のクロップがドキュメントの夫々の角部又は端部に対応するものであることが有益的である。
【0022】
本処理が減少させた解像度でドキュメントのイメージに対して適用される場合には、本発明に基づくテーブル位置決め方法の速度が改善することが判明している。更に、このことは、又、本方法をよりローバスト即ち確固としたものとさせる。
【0023】
本発明に基づく方法はドキュメント全体からの信号測定に基づいている。更に、それは比較的少ない数のパラメータの評価が関与しており、そのパラメータの各々は物理的な意味を有している。従って、それはローバスト即ち確固としたものであり且つ信頼性のあるものである。更に、それは自動的ドキュメント処理装置に統合するのに充分に高速である。
【0024】
A4フォーマットにおける技術的な図面における自動的タイトルブロック位置決めに対して適用される本発明に基づく方法の好適な実施例は98%の認識率を与えており、その場合に説明位置の不正確な表示は存在せず、且つA0−A3フォーマットにおける図面に対しては82%の認識率であり、説明位置の不正確な表示は2%であるに過ぎない。
【0025】
本発明は、更に、上述した方法を適用することによってドキュメントにおけるテーブルを自動的に位置決めする装置を提供している。
【0026】
【発明の実施の形態】
本発明の以下の好適実施例の説明は技術的な図面におけるタイトルブロックの位置決めに関連している。然しながら、理解すべきことであるが、本発明の技術は、一般的に、ドキュメントにおけるテーブルの位置決めに対して適用可能なものである。
【0027】
本発明の第一の好適な実施例に基づく方法の主要な解析的ステップの特性について図2乃至8を参照して説明する。
【0028】
本発明者等は、技術的な図面におけるタイトルブロックが、通常、以下の特性を所有するものであることを見出した。
【0029】
※それはテーブルのようなものであり(セルの集合)、集合全体は10cmより大きな幅と4cm及び28cmの間からなる高さとを有しており、
※構成セルの高さは、通常、約0.5cm及び3cmの間から構成されており、且つ
※それは図面の角部のうちの1つ、通常タイトルブロックの内容を読取るための通常の方向に見た場合の右下角部に位置している。
【0030】
これらの観察に基づいて、本発明者等は、図面の角部又は端部に対応する夫々のサブ領域の解析に基づくタイトルブロック位置決め技術を採用することとなった。上述したように、このような各サブ領域は図面のイメージの「クロップ」と呼ぶことが可能である。例えば、図2に示した技術的な図面の場合には、図面の角部に対応する解析用のクロップは図3に例示したように識別することが可能である。より詳細に説明すると、図2に示した技術的な図面はA0ドキュメントであり、且つ図3に示した各クロップに対するクロップ幅は18cmであり、クロップ高さは13cmである。
【0031】
本発明の第一の好適実施例においては、図面の角部に対応するクロップは各水平ライン上に存在する黒色のピクセルの数を評価することによって解析される。この解析は、通常、例えばTIFF(Tagged Image File Format)において図面のスキャンしたイメージに基づいてパソコンによって実施される。黒色ピクセルの評価した数がこの数の黒色ピクセルを並べて配置させることによって形成されるラインの長さによって表わされる場合に便利である。対応する水平ラインの垂直位置に関して評価したライン長さのプロットは「投影プロファイル」と呼ばれる。図4は図2に示した図面に基づいて図3において識別された4個のクロップに対して計算した投影プロファイルを示している。タイトルブロックを包含する角部は図2の図の右下角部である。図4dに示したこの角部の投影プロファイルは実質的に規則的な態様で離隔している多数のピークを包含していることが理解される。このことは規則的な態様で離隔されている多数の比較的長いラインに対応している。
【0032】
本発明の第一の好適な実施例によれば、異なるクロップに対して決定される投影プロファイルにおけるピークに基づいて、該図面のどのクロップがその図面のタイトルブロックに対応するか又はそれを包含するものであるかの選択が行われる。このことは各クロップのイメージにおける長いラインの検知となる。この実施例に基づく選択処理のステップは図8a及び8bのフローチャートに要約しており、その場合に、図8aは、長いラインを識別し且つ各クロップにおける長いラインの密度を表わすパラメータを評価することに関与するステップを示しており、且つ図8bは評価されたパラメータに基づいてどのクロップがタイトルブロックを包含しているかを選択する好適なアルゴリズムを示している。
【0033】
最初に、あるクロップを考慮から除外することが助けとなる場合がある。例えば、A0乃至A3フォーマットにおける技術的な図面におけるタイトルブロックの位置決めの場合において、タイトルブロックは殆どいつも図面の左上角部か右下角部に位置している。従って、他の角部を考慮から除外することによって決定アルゴリズムを高速化させることが可能である。このことは、例えば、解析すべきクロップの総数を表わすパラメータNの値をクロップの総数未満に設定し、且つ可能性のある候補者(即ち、左上及び右下)であるクロップのみを解析するためにクロップのインデックスnの値を割当てるか、又は始めに蓋然性のない角部に対するクロップを単に定義しないことによって行うことが可能である。
【0034】
解析すべきクロップのうちの最初のもの(n=1)に対して、投影プロファイルを検査し且つ所定のスレッシュホールド値(ここでは、「Threshold」として指定される)に関してピークを識別する(図8aのステップS1−S3を参照)。種々のクロップを画定するために使用されるクロップ幅が18cmである技術的な図面におけるタイトルブロックの位置決めにおいては、適切なThreshold値は10cmである。そのようにして識別されたピークはイメージ内に存在する「長い」ラインに対応する。
【0035】
次に、各ピークに対して、プロファイルがスレッシュホールド値を交差する2つの位置が決定され、且つこれらはそのプロファイルにおける「高い領域」の始め(pi1)及び終わり(pi2)に対応する(図5参照)。これらの始めの位置及び終わりの位置のリストを作成する。次いで、投影プロファイルSを、この始めの位置と終わりの位置とのリスト、即ちS=[(pi1,pi2)]iによって表わすことが可能である。パラメータHiRegThickも評価され(図8aのステップS4)且つ図面のこのクロップ内に存在する長いラインのグローバル即ち全体的な太さを表している。特定のクロップに対するHiRegThickは、そのクロップに対する投影プロファイルにおけるスレッシュホールドを超える区域の幅の和に等しい。換言すると、HiRegThick=(pi2−pi1)である。
【0036】
時々、スレッシュホールドを超える区域の始めの点及び終わり点のリストによる投影プロファイルの表示は、投影プロファイル内に短いディップ即ち窪みが存在するある場合をマスクする場合があり、このような場合を図6における丸印領域によって示してある。丸印を付けたピークの対を別々の高い領域として考えるのは適切ではなく、それらは、実際には、共通の領域の一部である。換言すると、一対の高い領域は、実際には、2つの隣り合った薄いラインではなく、単一の厚いラインに対応している。従って、本発明の好適実施例においては、このようなピークは単一の高い領域に合体される(図8aのステップS5)。
【0037】
どの対のピークを合体すべきかを決定する手段として、「MergeThreshold」という基準値を使用することが可能である。高い領域の開始位置及び終了位置のリストを処理して、Ti=p(i+1)1−pi2,i 1(図7参照)のようにして隣接する高い領域の間の分離Tを決定する。与えられた対の隣接するピークの間の分離がMergeThresholdよりも小さい場合には、問題のピークが合体される。例えば、(p21,p22)及び(p31,p32)によって表わされる一対のピークが合体される場合には、リスト中のエントリ(p21,p22)及び(p31,p32)が(p21,p32)の値を有する単一のエントリによって置換される。技術的な図面に関する限り、適切なMergeThesholdの値は、例えば、0.2cmである。
【0038】
本発明の第一の好適な実施例に基づく投影プロファイルの上述した解析は、図面の種々のクロップ内の比較的長いイメージラインを検知する処理を構成している。長いラインが検知されると、本発明によれば、ラインのグループを定義すること(図8aのステップS6)、及びこれらのグループのうちの1つ又はそれ以上のパラメータを参照することによってどのクロップが位置決めされるべきテーブルを有しているかを決定することが有益的なものであることが判明した。
【0039】
どの検知されたライン(投影プロファイルにおける高い領域)が与えられたグループに対して割当てられるべきかを決定する場合に、隣接するピークの間の分離Tが再度考慮される。この時は、それらの間の分離が「PeakGroup」という基準値よりも小さい場合には、同一のグループに属するものと考えられる。与えられた組のピークに対して、各対の隣接するピークの間の分離がPeakGroupより小さい場合には、隣接するピークは対のようなものであると考えられ、従ってピークの組全体が同一のグループに属する。例えば、T1,T2,T3の各々がPeakGroupより小さい場合には、図7に示したピークの全てが単一のグループに属することとなる。実際には、T1及びT2<PeakGroupであるがT3>PeakGroupであり、従って図7の左側の3個のピークのみが共通のグループに属する。技術的な図面のタイトルブロックにおけるセルの典型的な高さ(0.5−3cm)に関しての発明者等の知見に基づいて、PeakGroupを3cmに設定することが望ましい。このグループ化処理の結果は各クロップ内に存在している高い領域のグループのリストである。
【0040】
上述したように、各高い領域は比較的長いラインに対応している。従って、各グループは互いに3cmの分離内の対のようなものである1組の長いラインに対応している。そのクロップが技術的な図面のタイトルブロックに対応する場合には、長いラインの1つの識別されたグループのみが存在すべきである。然しながら、あるタイプのイメージを包含するクロップに対しては長いラインの複数個のグループが識別される場合がある。
【0041】
次に、各夫々のクロップを代表するものとして1つのグループを選択することが便利である。好適には、その代表的なグループは最大多数の高い領域(長いライン)を包含しているものであり、グループ当たりのライン数は、ここでは、NbRegとして指定し且つ図8aのステップS7において評価される。然しながら、NbRegの2番目に高い値(即ち、2番目に最大多数の高い領域)を包含するグループを選択することが望ましい場合がある。特に、第一選択グループ(及び、必要な場合には、第二選択グループ)はそのグループとイメージ境界との間の距離に関して妥当性が評価される。選択されたグループがイメージ境界に対する最も近いグループである場合には、その距離がDistBorder1と呼ばれる基準値と比較される(図8aのステップS9−S10)。選択されたグループがイメージ境界に対して2番目に近いグループである場合には、このグループと境界に最も近いグループとの間の距離が基準値DistBorder2と比較される(図8aのステップS11)。その比較された距離が夫々の基準値よりも大きい場合には、その選択されたグループは図面のタイトルブロックに対応することは不可能である。発明者等の知見に基づいて、DistBorder1を3cmに設定し且つDistBorder2を2.5cmに設定することが望ましい。
【0042】
本発明の好適実施例においては、各クロップを表わすべく選択されたグループの妥当性評価を行うための更なるテストを実施する。より詳細に説明すると、夫々のグループ内の高い領域の間の平均距離は所定の範囲の値内のものとすべきである(図8aのステップS14においてチェック)。この平均距離はタイトルブロック内の1個のセルの平均高さと比較することが可能である。従って、この点に関しての発明者等の知見に基づいて、代表的なグループが技術的な図面のタイトルブロックに対応する場合には、この平均距離は0.5−3cm(上限及び下限を含む)の範囲内とすべきである。
【0043】
最大多数の高い領域を包含している2つのグループが無効なものである場合には、理論的には、このクロップを表わす次の最大多数の高い領域を有するグループが有効なものである(上述したDistBorder2及び平均距離テストに関して)場合には、そのグループを選択することが可能である。然しながら、その代わりに、タイトルブロックの位置として問題のクロップを考慮から除外すべく決定される場合にはより良い結果が達成されることが判明した(図8b上の点Cへの分岐である図8aのステップS12参照)。最大多数(又は2番目に最大多数)の高い領域を有するグループが有効なものである場合には、そのグループが問題のクロップを表わすグループとして選択される(ステップS15)。
【0044】
好適には、どのクロップがその図面のタイトルブロックを有するか否かの決定は、各クロップに対して選択された代表的なグループの特性に基づいて行われる。図8bはこの決定を行うための好適なアルゴリズムを表わしたフローチャートを示している。
【0045】
最初に、他の全てのクロップよりも大きなNbRegを有する単一のクロップが存在するか否かをステップS18乃至S20において決定する。その結果が「肯定」である場合には、ステップS21においてこの単一のクロップがテーブル位置として選択され、且つその決定処理は終了する。然しながら、NbRegが全てのクロップに対してゼロである場合には(ステップS18において決定)、テーブル位置に関する決定はパラメータHiRegThickに基づいて行われる。HiRegThickの最大値を有するクロップがステップS22において決定される。このクロップはテーブル位置として選択され(ステップS25において)且つ、HiRegThickのこの値が2つのテストをパスした場合には、この決定処理は終了する。最初のテスト(ステップS23)は、HiRegThickが「MinDetect」と呼ばれる基準値よりも大きいことを検証する。MinDetectはタイトルブロック内のセルを区画する長いラインの集合によって示される蓋然性のある最小の太さの大きさを表わしている。発明者等の知見に基づいて、MinDetectを0.3cmに設定することが望ましい。2番目のテスト(ステップS24)は、選択したクロップに対するHiRegThickの値とHiRegThickの次に最も高い値との間の差が「Tolerance」と呼ばれる値を超えることを検証する。発明者等の知見に基づいて、Toleranceをテスト中のHiRegThickの値の50%に設定することが望ましい。
【0046】
HiRegThickの最も高い値が上述した2つのテストのいずれかに不合格である場合には、本方法は、タイトルブロックの位置に関して決定を行うことが出来なかったことの表示を返す(ステップS26)。タイトルブロックの位置を「手作業」によって決定することはユーザの随意である。これは「拒否」と呼ばれる。
【0047】
ステップS20において、NbRegの最も高い値が2個又はそれ以上のクロップによって共有されていることが決定される場合には、再度、タイトルブロックの位置に関して決定を行うことが不可能であることの信号を発生することが望ましい(ステップS26)。
【0048】
上述した説明は、本発明の好適実施例において実施される解析の主要なステップの概略である。古い図面及びタイトルブロックが部分的に消去されている図面の場合であっても技術的な図面においてタイトルブロックを位置決め即ち探し出す上述した方法は成功裡に適用されている。本方法の信頼性を測定するテストについて以下に詳細に説明する。然しながら、テスト結果を提示する前に、タイトルブロック位置決め処理の信頼性及び/又は速度を更に改善するために上述した方法ステップに関連することが可能な幾つかの前処理段階について検討することが適切である。これらの前処理段階としては、好適には、以下のものを包含している。
【0049】
※フォーマット(用紙寸法に関して)及び分解能(dpiに関して)の検証、
※解析すべきイメージの分解能の減少、
※解析すべきイメージのデスキューイング(矯正)、
※イメージを取囲むフレーム又は境界の検知(このような境界又はフレームは、通常、技術的な図面において存在している)。
【0050】
多数の理由により解析すべきドキュメントのフォーマット及び分解能を検証することが有益的である。最初に、幾つかの場合においては、その図面に関する情報が非常に悪いものであって、有意義な解析を行うことが不可能な場合がある。第二に、A0乃至A3フォーマットにおける図面と比較してA4フォーマットにおける図面に対する異なるクロップを定義することが好適である(後述)。図面の分解能(dpi即ち1インチ当たりのドット数において)、即ち図の高さ及び幅がチェックされ且つ標準値と比較される。測定された表面値が基準値の25%内である場合には、その図面は解析を行うために受付けられる。そうでない場合には、本方法は図面の拒否へリターンする。
【0051】
実験によれば、本発明に基づく検知方法の速度及び信頼性は、分解能を減少させた図面のイメージに関して解析を行う場合に両方とも改善させることが判明した。信頼性における改善は、ラインを強調させ且つちぎれたラインを回復させる傾向がある減少処理自身から発生するものと考えられる。発明者等の知見に基づいて、50dpiの分解能で図面のイメージを発生させ、次いでこの分解能を減少させたイメージから投影プロファイル等を計算することが望ましい。
【0052】
本発明の第一の好適な実施例が図面のスキャンしたイメージの解析が関与するので、スキャニング処理期間中に不整合エラー(スキュー)が発生する場合がある。これは上に説明した方法の性能を減少させる。従って、本発明の解析ステップを適用する前に、スキューを検知し且つそれを補正することが有益的である。市場においてはスキューを検知し且つ補正する種々のアルゴリズムが入手可能である(例えば、Y. K. Chen及びJ. F. Wang著「遷移カウントの変化の最大化に基づいたスキュー回復(Skew reconstruction based on maximization of variance of transition−counts)」、パターン認識33(2000)、195−208頁参照)。
【0053】
前処理段階期間中、通常主要な図面の周りに描かれるフレームを検知することが望ましい。上述したように、このフレームのポジショニングに関する情報は、好適には、クロップに対する代表的なグループの選択の妥当性評価(DistBorder1及びDistBorder2の値により)を行うために使用される。フレームを検知するための好適な方法は、ドキュメントのエッジ即ち端部に対する水平及び垂直な投影プロファイルを発生し、且つ4つのドキュメント端部近くにおける最も長いラインを見つけ出すためにこれらの投影プロファイルを解析するものである。これらのラインが交差する場合には、それらは図のフレーム即ち画枠を表わすものと考えられる。図のフレームを見つけ出すための別の方法は、ドキュメント上に存在する最大のボックスを検知することである。
【0054】
図面の周りに位置されているフレームを検知することが不可能であることが判明した場合には、フレームに関してではなくドキュメントの端部に関して与えられたクロップに対して選択された代表的なグループの選択の妥当性評価を行うことが可能である。然しながら、一般的には、フレームを位置決め即ち探し出すことが不可能である場合には、タイトルブロックに対しての位置を特定することが不可能であることを表わす「拒否」を発行することが望ましいものと考えられる。
【0055】
本発明の好適実施例に基づく方法の上の説明においては、種々のクロップを定義するために使用される角部のクロップはクロップ幅18cm及びクロップ高さ13cmを有していた。A0乃至A3フォーマットのドキュメントにおけるタイトルブロックを位置決めする場合にはこれらの寸法を有する角部クロップを使用することが有益的であることが判明している。然しながら、A4ドキュメントにおけるタイトルブロックを位置決め即ち探し出す場合には、21cmのクロップ幅(用紙の幅に等しい)及び13cmのクロップ高さを与えるドキュメントの上部及び底部端部に対応する端部クロップを使用することが望ましい。図9は主要な用紙フォーマットの全てに関しての好適なクロップ寸法を示している。
【0056】
上述した本発明の第一の好適な実施例においては、ドキュメントのスキャンしたイメージのライン上に存在するイメージピクセルの数を評価することによってドキュメントの種々のクロップにおいてラインを検知している(投影プロファイルを発生)。解析すべきドキュメントがベクトルフォーマットにおけるデータ(例えばHPGL)によって表わされる本発明の第二の好適な実施例においては、対応する投影プロファイルはベクトルデータから直接的に発生され、それはイメージ内のラインの長さ及び位置及び夫々のラインの太さを表わす。本発明の3番目の好適実施例においては、解析すべきドキュメント上のラインは上述したChhaebr,Misra及びAriasの「FAST」方法によって見つけ出される。ラインデータは、どのようにして派生されようとも、上述したThreshold値を超える長さを有するラインの位置を決定し、且つPeakGroup基準値に関して1個又はそれ以上のグループに対して種々のラインを割り当てるために処理される。パラメータHiRegThickの値は与えられたクロップ内のラインの太さを加算することによって決定される。上述した前処理段階が必要とされないということを除いて、残りの処理は本発明の第一の好適実施例についてのものと実質的に同じである。
【0057】
本発明に基づく方法の有効性を評価するために、788個の技術的な図面のスキャンしたイメージのデータベースに関してテストを実施した。これらのスキャンした図面はTIFFフォーマットであり且つA0乃至A3フォーマットに対しては500TIFF画像に対応しており且つA4フォーマットに対しては288TIFF画像に対応していた。図面の出展に依存して、分解能は異なっており(200乃至400dpi)且つスキャンの品質においても差異が存在していた。説明が部分的に消去された図面があり、スキャン問題に起因して主要なフレームが不完全なものも且つ黒色の境界を有しているものも存在していた。説明のタイプも異なっていた。
【0058】
上記テストでは以下のものを測定した。
【0059】
※正しく位置決めされたタイトルブロックの百分率(「認識率」と呼ぶ)、
※該方法が説明の位置を決定するものでなかった図面の百分率(「拒否率」と呼ぶ)、
※該方法がタイトルブロックに対する不正確な位置を発生した図面の百分率(「混乱率」と呼ぶ)。
【0060】
該テストは、タイトルブロック位置決めにおける本発明に基づく方法の有効性を証明し、且つ矯正及び分解能前処理段階が該方法の信頼性に関してどのような効果を有しているかを評価せんとするものであった。本発明の第一の好適実施例の方法を使用してテスト結果を得且つ表1に要約してある。
【0061】
【表1】
【0062】
本発明に基づく方法は技術的な図面におけるタイトルブロックの位置の信頼性のある表示を与えるものであることを上記テスト結果は示している。特に、混乱率は非常に低く、不正確な説明位置決めは50において1又は2,3の場合であることが示されている。更に、これらのテストが示すところによれば、解析するスキャンしたイメージに対して矯正及び分解能の減少を適用することによって認識率における改善を得ることが可能である。分解能を50dpiへ減少させることはA0ドキュメントに対する処理時間を約5秒から1秒未満へ減少させることが該テストによって判明した。
【0063】
矯正を行うが分解能を減少させない場合に得られたテスト結果を詳細に検討した結果、A4フォーマットにおける図面の場合には、タイトルブロック位置決めの表示を該方法が与えることに失敗した場合の多くがスキャンしたイメージにおける黒色の境界が存在することに起因するものであることが判明した。黒色の境界は、又、A0−A3フォーマットにおける図面に対して混乱の場合の幾つかを発生させた。A0−A3フォーマットにおける図面の場合には、不可思議なタイトルブロックを有する古い図面の場合において拒否が主に発生していた。これらの図面の場合には、その他の混乱の原因としては、図面の左上又は右下角部内において、タイトルブロック内に存在するよりもより多くのガイドラインを有するテーブルが存在していたこと、図面におけるスキャンの不完全性(曲がった又はちぎれたラインとなる)、且つ図面が部分的に消去された説明を有していること(このような場合の大多数においては、これは混乱というよりも拒否となるものであるが)等であった。
【0064】
デスキューイング即ち矯正及び分解能の減少の両方が適用される場合には、全てのフォーマットにおける図面に対して認識率の改善が見られる。混乱は、殆ど、説明と反対側の角部内に表われるテーブルに起因するものである。
【0065】
分解能の減少が50dpiではなく100dpiである更なるテストを行った。このことは認識率において僅かな改善を発生したが、その効果は顕著なものではなかった。
【0066】
パラメータHiRegThickの許容可能な値に関する条件と共に又はそれなしで、どのクロップがタイトルブロックを包含するものであるかの決定をこのパラメータのみに基づいて行うことが可能であるか否かを決定するための更なるテストを行った。これらのテストによれば、認識率が減少したか及び/又は混乱率が許容不可能に増加したかのいずれかであった。
【0067】
上述したテストの全ては、C++でのイメージライブラリィに加えてスクリプト言語で書かれたコンピュータプログラムによる本発明に基づく方法の実現を包含するものであった。プログラムを完全にC++で書き直すことによって処理速度を更に改善することが可能であるものと思われる。更なる前処理段階として黒色の境界を除去するアルゴリズムを付加することによって付加的な改善が得られる。
【0068】
本発明を特定の好適実施例について説明したが、本発明から逸脱することなしに種々の変形及び修正を行うことが可能であることを理解すべきである。
【0069】
例えば、本発明の好適実施例においては、スキャンしたドキュメントの角部又は端部に対応するクロップを解析している。タイトルブロックは、通常、1つの角部に位置されているので、処理を高速化するという根拠によれば技術的な図面におけるタイトルブロックの位置決めの場合にはドキュメントの角部又は端部のみを解析して決定を行うことが有益的である。然しながら、ドキュメントの他の部分に対応するクロップを解析することが望ましい場合もあり、ドキュメント全体をカバーするようなクロップの組に広がる場合もある。
【0070】
更に、第一の好適な実施例におけるように解析されたクロップのラインに沿って存在する黒色ピクセルの数を評価することが必ずしも適切でない場合がある。イメージがネガティブなものとされる場合には、白色のピクセルをカウントすることがより適切な場合がある。カラーのドキュメントの場合には、黒色以外の何等かのカラーのピクセルの数を評価することが望ましい場合がある。一般的に、図が描かれている媒体の背景のカラーのピクセルではなくイメージを構成しているピクセルであるイメージピクセルをカウントすることが望ましい。
【0071】
更に、本発明の好適実施例の上述した説明では特定の方法ステップとパラメータ値との組合わせを示している。理解すべきことであるが、本発明はこのような特定の組合わせに制限されるべきものではない。より詳細には、これらの特徴は分離可能なものであり且つ異なる部分結合で結合させることが可能である。
【0072】
以上、本発明の具体的実施の態様について詳細に説明したが、本発明は、これら具体例にのみ制限されるべきものではなく、本発明の技術的範囲を逸脱することなしに種々の変形が可能であることは勿論である。
【図面の簡単な説明】
【図1】 国際基準ISO5457において特定されている技術的図面におけるタイトルブロックのポジショニングを示すものであって、(a)は通常の水平配向状態におけるタイプXドキュメントを示しており、(b)は通常の垂直配向状態におけるタイプYドキュメントを示しており、(c)は垂直の配向状態とされたタイプXドキュメントを示しており、(d)は水平の配向状態とされたタイプYドキュメントを示している。
【図2】 技術的な図面の1例を示した概略図。
【図3】 図2に示した技術的な図面の夫々の角部に対応するクロップを示した概略図。
【図4】 図2に示した技術的な図面の夫々の角部における投影プロファイル(ライン当たりの黒色ピクセルの数に対応)を示しており、(a)は図2の図面の左上角部に対応する投影プロファイルを示しており、(b)は図2の図面の右上角部に対応する投影プロファイルを示しており、(c)は図2の図面の左下角部に対応する投影プロファイルを示しており、(d)は図2の図面の右下角部に対応する投影プロファイルを示している。
【図5】 本発明の第一の好適な実施例に基づく投影プロファイルにおけるピークに対してどのようにしてスレッシュホールド処理が適用されるかを示した概略図。
【図6】 本発明の第二の好適な実施例に基づく投影プロファイルにおけるピークに対してどのようにして合体処理が適用されるかを示した概略図。
【図7】 本発明の第一の好適な実施例に基づいて投影プロファイルにおけるピークがどのようにしてグループ化されるかを示した概略図。
【図8A】 解析したクロップにおけるラインの密度を表わすパラメータを発生する1つのアルゴリズムを例示したフローチャート。
【図8B】 複数個の解析したクロップのいずれが技術的図面のタイトルブロックを包含しているかを決定する1つの好適なアルゴリズムを示したフローチャート。
【図9】 本発明の好適実施例に基づいて異なる寸法の図面内のクロップをどのようにして解析を行うために識別するかを示した概略図。
【符号の説明】
T:隣接するピーク間の分離(間隔)
Claims (13)
- スキャンされ格納手段内に格納されているドキュメントにおいて自動的にテーブルを位置決めするコンピュータによって実施される方法において、
クロップ画定手段が、前記ドキュメントのフォーマットに対応して予め決められた寸法の領域である複数個のクロップを画定し且つ前記格納手段内に格納し、
位置決定手段が、前記ドキュメントの各クロップに対して、その長さが所定のスレッシュホールド値以上であるラインの位置を決定し且つその決定したラインの位置を前記格納手段内に格納し、
評価手段が、前記ラインの密度を表わす少なくとも1個のパラメータを評価し、
決定手段が、前記評価手段からの前記少なくとも1個の評価したパラメータに基づいて前記格納手段内に格納されている前記複数個のクロップのうちのどの1つが前記テーブルの位置を有しているかを決定する、
上記各ステップを有していることを特徴とする方法。 - 請求項1において、技術図面におけるタイトルブロックの位置に対して適用されることを特徴とする方法。
- 請求項2において、前記複数個のクロップが前記ドキュメントの夫々の角部に対応していることを特徴とする方法。
- 請求項1乃至3のうちのいずれか1項において、前記評価ステップが、前記ラインのグループを画定することを包含しており、2本又はそれ以上のラインの隣接するものの間の分離が基準値未満である場合には前記2個又はそれ以上の隣接するラインを共通のグループに割当て、前記決定ステップが、異なるクロップに対して画定されるラインのグループの少なくとも1個のパラメータを評価するステップを有している、ことを特徴とする方法。
- 請求項4において、前記決定処理が、各クロップに対して、各グループにおける前記ラインの数を評価し、且つ最大数のラインを有しており且つ妥当性テストにパスしたグループをそのクロップを代表するものとして指定し、その代表的なグループが最大数のラインを有しているクロップをそのテーブルの位置を有するクロップとして選択する、上記各ステップを有していることを特徴とする方法。
- 請求項5において、前記妥当性テストが、前記ドキュメント上の境界から前記グループの距離を評価するステップを有していることを特徴とする方法。
- 請求項5又は6において、前記妥当性テストが、前記グループ内の隣接するラインの間の分離を評価するステップを有していることを特徴とする方法。
- 請求項5乃至7のうちのいずれか1項において、各クロップに対する前記ラインの太さの和を評価するステップを有しており、最大数のラインを有する代表的なグループを有するクロップが存在しない場合には、前記決定ステップが、他のクロップに対する対応する評価した太さよりも著しく大きな評価した太さの和を有するクロップが存在しているか否かを決定し、且つ存在している場合には、そのクロップをテーブルの位置として指定し、且つ存在しない場合には、テーブルの位置を選択することに失敗したことを表わす信号を発生することを特徴とする方法。
- 請求項1乃至8のうちのいずれか1項において、解析すべきドキュメントのフォーマットを検証する予備的なステップを有していることを特徴とする方法。
- 請求項1乃至9のうちのいずれか1項において、ドキュメント上に存在するフレームの位置を決定し且つ境界を画定するステップを有していることを特徴とする方法。
- 請求項1乃至10のうちのいずれか1項において、減少した分解能においてドキュメントのイメージに対して適用することを特徴とする方法。
- 請求項1乃至11のうちのいずれか1項において、ドキュメントのスキャンしたイメージに対して適用し、且つ本方法を適用する前にスキャンしたイメージを矯正するステップを有していることを特徴とする方法。
- 請求項1乃至12のうちのいずれか1項に基づく方法を適用することによってドキュメント内のテーブルを自動的に位置決めすることを特徴とする装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP01400470.9 | 2001-02-22 | ||
EP01400470 | 2001-02-22 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002279434A JP2002279434A (ja) | 2002-09-27 |
JP4145530B2 true JP4145530B2 (ja) | 2008-09-03 |
Family
ID=8182631
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002045833A Expired - Fee Related JP4145530B2 (ja) | 2001-02-22 | 2002-02-22 | ドキュメントにおける自動的テーブル位置決め |
Country Status (3)
Country | Link |
---|---|
US (1) | US7251349B2 (ja) |
JP (1) | JP4145530B2 (ja) |
DE (1) | DE60204066T2 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7218684B2 (en) * | 2001-11-02 | 2007-05-15 | Interdigital Technology Corporation | Method and system for code reuse and capacity enhancement using null steering |
US9329827B2 (en) * | 2004-12-29 | 2016-05-03 | Funmobility, Inc. | Cropping of images for display on variably sized display devices |
JP4572248B2 (ja) | 2008-06-23 | 2010-11-04 | シャープ株式会社 | 画像処理装置、画像形成装置、画像処理方法、制御プログラム、記録媒体 |
JP4625861B2 (ja) * | 2008-11-17 | 2011-02-02 | シャープ株式会社 | 画像処理装置、画像読取装置、画像形成装置、画像処理方法、制御プログラム、および記録媒体 |
JP4927122B2 (ja) * | 2009-06-15 | 2012-05-09 | シャープ株式会社 | 画像処理方法、画像処理装置、画像形成装置、プログラムおよび記録媒体 |
WO2011012455A1 (en) | 2009-07-30 | 2011-02-03 | Oce-Technologies B.V. | Automatic table location in documents |
US10296665B2 (en) * | 2013-03-15 | 2019-05-21 | On Center Software, Inc. | Image management in construction project software programs |
JP6953957B2 (ja) | 2017-09-27 | 2021-10-27 | 富士フイルムビジネスイノベーション株式会社 | 画像処理装置及びプログラム |
US10846525B2 (en) | 2019-02-15 | 2020-11-24 | Wipro Limited | Method and system for identifying cell region of table comprising cell borders from image document |
US11688193B2 (en) | 2020-11-13 | 2023-06-27 | International Business Machines Corporation | Interactive structure annotation with artificial intelligence |
EP4145403A1 (en) * | 2021-09-03 | 2023-03-08 | Tata Consultancy Services Limited | Systems and methods for extracting, digitizing, and using engineering drawing data |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63158669A (ja) * | 1986-12-23 | 1988-07-01 | Matsushita Electric Ind Co Ltd | 図面認識装置 |
JPH01321575A (ja) * | 1988-06-23 | 1989-12-27 | Matsushita Electric Ind Co Ltd | 境界検出装置 |
JPH02204881A (ja) * | 1989-02-02 | 1990-08-14 | Canon Inc | 図形文字分離方法 |
US5129012A (en) * | 1989-03-25 | 1992-07-07 | Sony Corporation | Detecting line segments and predetermined patterns in an optically scanned document |
JPH03110685A (ja) * | 1989-09-25 | 1991-05-10 | Toshiba Corp | 画像相関器 |
US5181255A (en) * | 1990-12-13 | 1993-01-19 | Xerox Corporation | Segmentation of handwriting and machine printed text |
JPH03290774A (ja) * | 1990-04-06 | 1991-12-20 | Fuji Facom Corp | 文書画像の文章領域抽出装置 |
US5680479A (en) | 1992-04-24 | 1997-10-21 | Canon Kabushiki Kaisha | Method and apparatus for character recognition |
JPH06203165A (ja) | 1993-01-07 | 1994-07-22 | Canon Inc | 画像情報処理方法及び装置 |
JP3344774B2 (ja) * | 1993-06-25 | 2002-11-18 | 株式会社リコー | 矩形分類方法 |
JPH0721309A (ja) * | 1993-06-30 | 1995-01-24 | Matsushita Electric Ind Co Ltd | 文書認識装置 |
JPH0721310A (ja) * | 1993-06-30 | 1995-01-24 | Matsushita Electric Ind Co Ltd | 文書認識装置 |
DE69518467T2 (de) * | 1994-06-03 | 2001-01-04 | Riso Kagaku Corp., Tokio/Tokyo | Bildverarbeitungsgerät |
JPH08305778A (ja) * | 1995-04-21 | 1996-11-22 | Xerox Corp | ユーザの作成したマークの存在を調査するための方法 |
US6137905A (en) | 1995-08-31 | 2000-10-24 | Canon Kabushiki Kaisha | System for discriminating document orientation |
JP3586949B2 (ja) * | 1995-11-16 | 2004-11-10 | 松下電器産業株式会社 | 帳票認識装置 |
US5784487A (en) * | 1996-05-23 | 1998-07-21 | Xerox Corporation | System for document layout analysis |
US6055036A (en) * | 1997-02-14 | 2000-04-25 | Ricoh Company, Ltd. | Book image reading apparatus and book image forming apparatus |
US6621941B1 (en) * | 1998-12-18 | 2003-09-16 | Xerox Corporation | System of indexing a two dimensional pattern in a document drawing |
US6757870B1 (en) * | 2000-03-22 | 2004-06-29 | Hewlett-Packard Development Company, L.P. | Automatic table detection method and system |
US6816630B1 (en) * | 2000-05-22 | 2004-11-09 | Electro-Sensors, Inc. | System and method for creating and processing data forms |
-
2002
- 2002-02-21 DE DE60204066T patent/DE60204066T2/de not_active Expired - Lifetime
- 2002-02-22 JP JP2002045833A patent/JP4145530B2/ja not_active Expired - Fee Related
- 2002-02-22 US US10/079,513 patent/US7251349B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP2002279434A (ja) | 2002-09-27 |
US20020154818A1 (en) | 2002-10-24 |
US7251349B2 (en) | 2007-07-31 |
DE60204066D1 (de) | 2005-06-16 |
DE60204066T2 (de) | 2006-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110766014B (zh) | 票据信息定位方法、***及计算机可读存储介质 | |
CN111814722B (zh) | 一种图像中的表格识别方法、装置、电子设备及存储介质 | |
US6249604B1 (en) | Method for determining boundaries of words in text | |
JP3576570B2 (ja) | 比較方法 | |
US6778703B1 (en) | Form recognition using reference areas | |
CA2077970C (en) | Optical word recognition by examination of word shape | |
JP5015195B2 (ja) | デジタル画像内の数字を検知する方法 | |
JP3278471B2 (ja) | 領域分割方法 | |
JP3842006B2 (ja) | 帳票類判別装置、帳票類判別方法、およびこれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
US5640466A (en) | Method of deriving wordshapes for subsequent comparison | |
JP4771804B2 (ja) | レイアウト解析プログラム、レイアウト解析装置、レイアウト解析方法 | |
JP4145530B2 (ja) | ドキュメントにおける自動的テーブル位置決め | |
JP4796169B2 (ja) | デジタル画像の向きの判定方法 | |
CN114299528A (zh) | 一种针对扫描文档的信息提取和结构化方法 | |
CN102737240B (zh) | 分析数字文档图像的方法 | |
CN111626145A (zh) | 一种简捷有效的残缺表格识别及跨页拼接方法 | |
JP3428494B2 (ja) | 文字認識装置及びその文字認識方法並びにその制御プログラムを記録した記録媒体 | |
JP2003091730A (ja) | 画像照合装置、画像照合方法および画像照合プログラム | |
JP2009223612A (ja) | 画像認識装置及びプログラム | |
EP1237115B1 (en) | Automatic table location in documents | |
CN111612045A (zh) | 一种获取目标检测数据集的通用方法 | |
JP2004094427A (ja) | 帳票画像処理装置及び該装置を実現するためのプログラム | |
JP4242962B2 (ja) | 文字切出装置 | |
JP2723075B2 (ja) | 表認識装置及び表枠線の途切れ補間方法 | |
JP2988412B2 (ja) | 光学式文字読取装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050222 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070403 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20070702 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20070705 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20070802 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20070807 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20070903 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20070906 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071003 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071030 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20080130 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20080204 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20080227 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20080303 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20080319 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20080325 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080417 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080520 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080618 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4145530 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110627 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120627 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130627 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |