JPH05500874A - ディジタル化書類における選択本文の自動抽出のための多角形準拠式方法 - Google Patents

ディジタル化書類における選択本文の自動抽出のための多角形準拠式方法

Info

Publication number
JPH05500874A
JPH05500874A JP3510219A JP51021991A JPH05500874A JP H05500874 A JPH05500874 A JP H05500874A JP 3510219 A JP3510219 A JP 3510219A JP 51021991 A JP51021991 A JP 51021991A JP H05500874 A JPH05500874 A JP H05500874A
Authority
JP
Japan
Prior art keywords
contour
polygon
document
contours
polygons
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3510219A
Other languages
English (en)
Inventor
リー,ヨンチュン
Original Assignee
イーストマン・コダック・カンパニー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by イーストマン・コダック・カンパニー filed Critical イーストマン・コダック・カンパニー
Publication of JPH05500874A publication Critical patent/JPH05500874A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1429Identifying or ignoring parts by sensing at different wavelengths
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/182Extraction of features or characteristics of the image by coding the contour of the pattern
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。

Description

【発明の詳細な説明】 菫寸(□1頓□ ■ム及の多方!]奥式方抹 創肪野 この発明は一般に画像処理技法に、更に詳細には、紙準拠式書類において任意の 大きさ及び形状の手書きの閉した曲線で囲まれた関心のある本文領域の抽出をそ の書類のディジタル化画像における本文の自動抽出により可能にする本文領域抽 出技法に関係している。
発酉凶宵景 計算機準拠弐システムが紙準拠式書類の自動化解析及び翻訳を今では与えること ができるということの実現化にますます強調が置かれている。祇準拠式文書化( ドキヱメンテーシヲン)から計算機化された記憶及び検索システムへの動きは電 子式書類環境から得られるはずの多くの利点によって促進されてきている。明確 な利点は記憶、伝送及び検索の効率であるが、これはほとんどすべての種類の紙 1!拠式情報が計算機化形式においてより効率的に処理され得るからである。計 算機化形式により与えられる書類更新及び改訂能力は祇準拠式媒体に比べての最 も重要な利得であろう。画像改訂及び更新をシステムが可能にするためには、デ ィジタル形式でデータを再生成する代わりにデータ捕獲過程を自動化することが 必要である。従って、編集を容易にし且つ記憶量及び処理時間を減少させるため に(ピントマツプの代わりに)書類における図形要素の記述を生成することが必 要である。
自動語処理装置は成文書類を経済的な且つ時間節約的な方法で作成し、変更し、 記憶するために事務所においてますます使用されている。そのような装置は、誤 り訂正、新しい本文の節の挿入、異なった出所を有する二つ以上の本文の組合せ 、並びに本文の節に対応するデータの任意の再現及び電子的記憶を行う能力を持 っている。そのような自動語処理装置の、通常のタイプライタに比較しての利点 は、そのような装置により生成され得る成文書類の作成における融通性及び時間 節約、並びにこれらから生しるより高い効率である。自動語処理装置の使用と関 連した特に時間を消費する段階は記憶及び/又は更なる処理のための、紙上に既 に存在する情報の自動語処理装置への転送である。
大量の本文のキーボードによる手動転送は極めて時間ががかり、従って本文に含 まれた情報を語処理装!へ自動的に転送するために種種の方法及び装置が開発さ れている。一つのそのような装置は図面などを読み取ってデータを計算機に入力 するためのディジタイザなどであり、これにおいては座標のための読取り表示器 が線の端点及び難儀又は曲がり点のような特徴点まで手動で移動されて、読み取 られた座標が計算機において記憶されるようになっている。この場合には、線の 識別も又別の装置によって手動で計算機へ入力される。この方法による線の識別 は人間のパターン認識能力によって行われ、字体はディジタル化動作が完全に自 動化されるのを明確に阻止する。
本文の節に含まれた存在情報の語処理装置への自動転送における問題は、そのよ うな本文の節が生しるマスクが又図形及び/又は画像区域を含むことができるこ とである。マスクにおけるこれらの種種の形式の情報区域を自動的に識別し、分 離し且つ記憶して、これらの種種のマスク区域を表現するデータの最適符号化を 達成し且つ又語処理装置(ワードプロセッサ)内でこれらの区域を表現するデー タの別別の操作を可能にするようにすることが技術上の問題点である。
過去においては、ディジタル化書類において本文又は文の諸領域を除去又は切除 するためには、切除されるべきである選択本文の周りの窓位置(長方形区域)を 操作員が指定できるようにするために「マウス」と共に対話式ソフトウェアパッ ケージの援助を必要とした。しかしながら、操作員が低置類上に境界を手書きす ることにより本文領域を選択し、そして書類が走査された後にディジタル領域に おける4ji識付き領域を計算機に自動的に抽出させることがより自然であり且 つ容易である。この形式の本文抽出は手書き成分を識別してディジタル書類にお けるそれの空間座標を見つけるためのアルゴリズムを必要とする。識別された手 書き曲線の境界座標は次に、手書き境界の外側の外部本文から一体的本文資料を 分離するために使用される。
従来技術の実施は、書類が種種の大きさ及び樺式の文字を持っているときには手 書き曲線を識別することが不可能であった。面積(又は大きさ)しきい値は手書 き成分の大きさが文字の若干数のものより小さいときにはその小形手書き成分を 抽出しそこなう6手書き曲線は任意の形状であり得る拘束のない記号であるので 、手書き記号に関する事前の情報なしで手書き記号の認識のためにパターン認識 技法(統計的又は構造的解析)を使用することは不可能である。
この発明は書類における任意の大きさ又は形状の手書き閉曲線を識別するために しきい値のない技法を用いて上に言及した諸問題を克服する。識別された曲線の 境界座標は次に曲線の内側の本文を見つけるために使用される。外部本文資料を 消すことによって、出力画像は選択されている所望の本文だけを含むことになる 。
発皿Ω開示 この発明は画像処理に向けられており、本文を抽出する方法を開示しているが、 この方法においては低置類上の関心のある本文領域が任意の大きさ又は形状の手 書き閉曲線で囲まれて、囲まれた本文領域が書類のディジタル化された後に(ビ ットマツプ画像の形式における電子式書類)自動的に抽出され得るようになって いる。この方法は手書き成分を識別するために輪郭の幾何学的空間関係の技法を 用い且つこれらの輪郭をこれに囲まれた所望の本文資料の抽出のために用いる。
凹面二固単広説皿 図1は標識付き書類の例を示しており、図2は画素近傍及び画素捜索順序を示し ており、図3aは単一のベクトルによって置き換えられる多数の短いほとんど一 致するベクトルを生じることになる多角形の線形近イ以を線図で図解しており、 図3bは置換ベクトルからの偏差が決定される方法を図解しており、図4はパラ メータ「R」が決定され且つ計算される方法を線図で図解しており、図5はブロ ック区分化の例を示しており、図6は幾何学的に連続された輪郭を図解するため の図式例を示しており、図7aは内部角から角度の和を計算する方法の図解例で あり、図7bは外部角から角度の和を計算する方法を図解しており、図8は書類 から標識付き本文領域を抽出するために使用される手順の流れ図であり、 図9は図7に図解された輪郭連結段階の流れ図であり、スス10は図1からの手 書き曲線抽出の結果を図解している。
発ユ炎実施ta方法 この発明は図1に示されたように書類10においてダークペン12により囲まれ た本文領域を自動的に抽出するための能力を与える。標識付き書[10は低置類 を電子式書類(ピントマツプ画像)に変換するために走査され又はディジタル化 される。
輪郭ベクトル化は所望の本文領域の抽出を実施するために必要とされる数段階に おける最初のものである。輪郭ベクトル化は電子式書類を多角形の集まりへ変換 する。この変換は輪郭画素追跡に続く輪郭画素の区分的線形近似を必要とする。
輪郭画素追跡動作は水平方向に画素を走査することによって始まる。0から1へ の遷移が検出されると、追跡動作は回転順序に輪郭を追跡して最後には開始点に 戻って輪郭を完成する。捜索が行われる回転順序は図2に図解されている。画素 ρ1は書類ページを左から右へ走査することによって検出された遷移である中心 画素がρ1、最初の遷移、である図20に示された3×3格子を用いて、次の遷 移が見つけられるまで図20の指定捜索順序1〜8で捜索が行われる。この例で はρ2が3×3格子のセル番号3において見つけられた。この画素はモジュール 8算術を用いて以前の方向に4の値を加算して、その結果に1を加算するという 規則を用いて見つけられた。図2bにおけるρ2は今度は同じ捜索順序での3× 3格子における中心画素であり、従ってセル3において遷移が見つけられる。
捜索における次の画素は方向8における画素から始まる。この過程は閉した輪郭 が完成されるまで繰り返される0輪郭追跡の完了後、次の遷移を見つけるために 走査が再開されて、それから次の輪郭を追跡する。この過程は最後の輪郭が完成 されるまで繰り返される。輪郭追跡過程は、結果として生じる輪郭の集まりがデ ータ記憶のためにより少ない記憶量を必要とし且つ黒区域の輪郭だけが記憶され るので、後程の手書き曲線抽出のために二つの主な利点、輪郭分離及びデータ圧 縮、を与える。輪郭追跡規則に従って、外側輪郭は時計回りに行き、且つ内側輪 郭は逆時計回りの方向にある。輪郭方向は輪郭画素の順序に固定されている。そ れは外側及び内側輪郭の識別のための有効な特徴である。
区公的線形近似法 区分的線形近(以過程は共線的画素を合体させることによって一連の輪郭画素を 一連のベクトルへ変換する。閉した境界を形成する一連のベクトルは図3に示さ れたような多角形になる0区分的線形近似過程は反復中に鋭い角の検出を可能に する内積制約を課することによって幾分変更される0輪郭画素を順次走査して、 同じ直線上にある連続した画素をベクトルへと合体させる。これは図3に示され たように一連の短いベクトルで構成された多角形を形成する。多角形の頂点は( Vi 、Vt 、Vs ・・・Vi ・・・Vn)によって示されている。任意 の二つの連続したベクトル(例えば、Vi及びWill)の正規化内積の計算は 且つ =l≦Ii≦1 任意の三つの連続した点vi−1、vi 、Willを考えることにより、■、 −2、■4..は三角形vi−1% vi 、Willの辺を形成する。線分V l−1、WillはΔ−v+−1 s vi 、Willの底辺である。Δvi −1+ vi 、violの高さは、Vi−1、vi及びVl % vi−1の 系列をvi−1、Willに近似させるための偏差として役立つ、この偏差が所 定のしきい値(ε)より小さく且つIiが所定の負の値より大きければ、上に記 述された近僚子が適用される。そうでない場合には、部分V、は保持され且つ次 の二つの連続した線分が線形返信にさらされる。
図3bにおいてはベクトルVl−I Vi及びVi V1*1が示されており、 置換ベクトルvi−1vi。1からの偏差であるdに対する値が所与の値より下 であるならば、!喚が行われる。しかしながら、dが所定の値より上にある場合 には、原初ベクトルは保存される。dの値は、 d−x i Cxr−+ )’t−+ ) )’+ (xt−+ Xl−1)  + (y+−+ xr、+ xl−+ )’1.+ )によって与えられる。従 って、鋭い角の保存は、反復中に二つの連続したベクトルのそれぞれの正規化内 積値をめて、この値が負のしきい値より小さいときには線分合体演算子を飛び越 すことによって実施される。鋭い角における辺線分の内積は負の値でなければな らないので、負のしきい値が選択される。それゆえ、正規化値が小さいほど、そ れが示す角は鋭い、この特定の応用に対しては、しきい値はラジアン単位で−1 と0との間にある負の値に設定される。この制約を区分的線形近似法に組み込む ことによって、この方法は鋭く曲がる鋭角の角を保存すると共に変化の多い短い 線分を平滑化することが判明した。注目されるべきことであるが、この能力は線 形近位法が線状対象物に適用されるときには特に重大である。注目されるべきこ とであるが、区分的線形近似法アルゴリズムの動作中に、平滑化しきい値は1で 始まって所定値まで増分され、且つ線形近位法において得られるひずんだ結果を 最小化するために反復が進行する。
完成されると、輪郭ベクトル化過程はビノトマンプ画像を単純な多角形の集まり へ変換する。この多角形表現は手書き曲線及びこれらの曲線により囲まれた情報 の抽出が、より少ない記憶量を必要とする、より小形の多角形領域において行わ れることを可能にする。
び外 の 書類の輪郭ベクトル化の結果として生成された未相関多角形の群は更なる処理の ために類別化されなければならない。従って、多角形は二つの群、すなわち内側 多角形及び外側多角形、に分離され、そしてこれらは次に、対称物復元の速度を 上げ且つ手書き曲線の識別を容易にするために使用されることができる。
輪郭方向識別パラメータ(R)は次のように定義される。すなわち、ここで、X 、及びy、は多角形頂点の座標であり、又nは頂点の数である。
それゆえ、正のRを持った多角形は外側輪郭(時計回りの方向)を意味する。
内側輪郭多角形(逆時計回り)は負のRによって表示される。そこで多角形のリ ストを走査し且つRの値を検査することによって、多角形の集まりは二つの群− 内側及び外側−へ分類される。
ズ旦ヱ又区光化 この過程は外側多角形集合及び内側多角形集合を図4に図解されたようにそれぞ れ幾何学的により相関のある下位群へと区分化される。それは対象物復元のため の連結過程を外側輪郭及び内側輪郭の各下位群に対してより効率的にする。
群分けはまず多角形成分を分類してこれを幾何学的最高−最低順序のリストにお くことにより行われる。クインクソート(QuicksorL)のような欅準ソ ータアルゴリズムは権利が存在していないが、これにおいては多角形境界決定箱 形の角座標のy値が分類用基本値としてとられる。次に、分類された成分は区分 化点を検出するために走査される。区分化点は上方座標(UYiJから下方座標 (LY、)を減算したものが正の値を生しることになるときに見つけられる(図 4)、ここで、i及びi+1は分類リストにおける二つの連続した成分を示して おり、又UY、及びLY、はそれぞれ垂直方向における多角形の境界決定箱形の 上方及び下方座標である。正の値は分類リストにおける連続した多角形間の水平 射影における物理層内ギャップ(非電なり合い)を意味する。それゆえ、内空間 が検出されたときには、新しいブロック区分が見つけられる。プロ・ンク区分化 の図式例が図4に示されている。同じ区分化ブロックに割り当てられた多角形は 水平方向において密接な幾何学的連結を有する傾向がある。
輸昇迷績 この過程は外側及び内側多角形の座標の幾何学的関係を検査して、それが幾何学 的に連結されているかどうかを見る。例えば、文字が閉曲線の境界の内側にある ときにはその文字は手書き曲線に幾何学的に連結している。幾何学的連結多角形 は群分けされて構成要素(エンティティ)として取り扱われる。図5は連結多角 形の例を示している。内側輪郭#1はそれぞれ外側輪郭#1、#2、#3、#4 と幾何学的に連結されている。
連結過程に対する流れ図は次の表記法により図7に示されている。
0ij−i番目の外側多角形ブロックにおける3番目の要素、Ii鋼−1番目の 内側多角形ブロックにおけるm番目の要素、Mi=i番目の外側多角形ブロック における要素の数、N1=i番目の内側多角形ブロックにおける要素の数、S  =区分化ブロックの数、 この過程は各外側輪郭(Oij)を走査して、幾何学的に外側輪郭を取り囲む又 は外側輪郭の内側に入る内側輪郭(I is)を連結する。この幾何学的連結は 図6に示されたように角度の和(A)の計算によって表示される。例えば、内側 多角形の頂点に関する外側輪郭の中心点の角度和(A)が0であるならば、外側 輪郭は内側輪郭の内部に存在しなければならなず、幾何学的連結が確立されてい る。従って、連結過程はことごとくの内側及び外側成分間で進行し、対象物構成 要素のリストを生成する。各構成要素における主要素は外側多角形であり、内側 輪郭の二つの集合を上槽する。第1集合は主要素を取り囲んでいる「外部内側多 角形」と呼ばれ、又第2集合は主要素の境界の内側に配置されている「内部内側 多角形」と呼ばれる。図5は外側及び内側輪郭の連続結果を示している。例えば 、外側輪郭(主要素)#3は内側輪郭#1(外部内側多角形)及び内側輪郭#2 (内部内側多角形)を指摘する。
本文硬堰迫聞 手書き曲線識別は、対象物構成要素のリストを走査して、「外部内側多角形」が 存在しているかどうか検査することによって達成されるが、これは外側輪郭を取 り囲む任意の内側輪郭部を検出する。それが見つけられたならば、「外部内側多 角形」は手書き閉曲線の内側輪郭でなければならない。これは又外側多角形の位 置が選択本文領域の一部分でなければならないことを意味する0図9は、同し外 部内側多角形を指摘している走査リストにおける外側多角形の境界座標を集める ことによる図1に示された書類画像からの手書き閉曲線の抽出内側輪郭を示して おり、境界決定区域の和は手書き曲線の境界により制限された所望の本文領域を 形成するように集められている。この過程が何らのしきい値決定過程を含んでい ないことに注目することは重要であり、この過程は本文の全ページを有する書類 から任意の大きさ及び形状の手書き閉曲線を抽出するために適用可能である。
段階40は低置類をディジタル画像へ変換する走査器を用いて標識付き低置類を ディジタル化する。ディジタル画像は二次元配列のセルによって表現されている 。
各セルにおける値は「1」又は「0」である。黒い点(ドツト)は「1」によつ て表示され且つr Q 、、Iは白い点に対するものである。このディジタル化 は段階42において言及したビ、トマノブ(二進値)画像を生成する。段階44 において、輪郭ベクトル化は任意の県パターンの輪郭を抽出し、抽出された輪郭 は多角形−一連のへクトルーにおいて表現される。輪部ベクトル化は二つの過程 −輪郭画素追跡及び輪郭画素の線形近似−で構成されるでいる。これらの過程は 両方弁上で詳細に記述されている。
ベクトル化過程の結果として、多角形の集まりが段階46において生成された。
段階4日は多角形の集まりを多角形の順次のベクトルの回転方向に基づいて二つ の群へと分離する。この方向は上に説明されたRの値によって表示される。段階 50及び52において、近接した多角形はそれぞれ内側輪郭又は外側輪郭として 群分けされ、これによって連結動作が後程より効率的に実施されるようになるこ とを可能にする。段階54及び56においては多角形の二つの集合が分離されて これらはそれぞれ内側輪郭及び外側輪郭と関連するようになる。段階58及び6 ゜において多角形はその空間座標に基づいて分類されて、すべての内側多角形及 びすべての外側多角形が幾何学的最高−最低順序におかれる。段階62及び64 はブロックの区分化点を検出する。前に説明されたような区分化点は二つの連続 した多角形間の水平射影における物理層内空間が検出されたときに形成される。
段階66及び68においては多角形の二つの集合が形成されて各ブロックが水平 方向に近接した多角形の集まりを含んでいる。図8に示されたように輪郭連結は 段階70において行われる。段階72においては、任意の他の内側輪郭により取 り囲まれた外側輪郭によって定義された外部内側輪郭が識別される。段階74に おいて、外部内側輪郭は手書き閉曲線の内側輪郭として定義される。同し外部内 側多角形を指摘している走査リストにおける外側多角形の境界決定座標を集める ことによって、集められている境界決定区域の和は手書き曲線の境界により制限 された所望の試験領域を形成する。
図8は外側輪郭及び内側輪郭を輪郭連結することに関係した手順に対する流れ図 を図解している。段階80において指数1、j及びmはプログラム開始させるた めに1に設定される。段階82において、プログラムは、1番目の外側多角形ブ ロックにおシする3番目の多角形要素の読取りを要求する。多角形素子は01」  と名づけられている。Iim多角形要素の読取りは段階84においてJim内 側多角形ブロックにおいて行われる。多角形要素はIimと名づけられている。
段階86は多角形(Oij)の境界箱形の中心座標Coutを計算する。同様に 段階88は多角形(Iij)の境界決定箱形の中心座標(Cin)を計算する。
段階9oは図6に示されたパラメータAを用いてOij とIi−との間の幾何 学的空間関係を検査する。Cou tが角測度のための内部固定点として取られ たならば、内側多角形(Iim)が多角形を取り囲むために使用される。又は、 点Cinが取られたならば外側多角形(Oij)が使用される6次に、パラメー タAの値が2πの段階92におG゛ては、外側多角形(Oij)及び内側多角形 (l 111)は同し対象物として考察される。実施中に二つの多角形を連結す るためにポインタが設定される。段階94は1番目の内側多角形ブロックから次 の内側多角形を読み取るために指数mを増大する。段階96において、(i(A )が0であるならば、内側多角形指数mを1だけ増分することによって次の内側 輪郭を読み取る。段階98においては、mが1番目の内側多角形プロ、りにおけ る多角形の数(Ni)より小さければ次の多角形を処理することが決定される。
段階100において、指数mがNiより大きければ、内側多角形指数m(=1) をリセットし、そして外側多角形指数を1だけ増分することによって次の外側多 角形を読み取る。段階102は、i番目の外側多角形プロ、りにおいて最後の多 角形が読み取られるまで処理段階82ないし100を継続する。段階104にお いては、次の多角形の処理がブロック指数の増分により継続され、そして外側多 角形指数Jをリセットする。段階106はデータが空になるまで上の過程が継続 されることを要求する。
1占 び 上の この発明は全ページの本文を有する書類において標識付き本文6i域の自動化抽 出を与える計算機準拠式システムにおいて有効である。この発明は輪郭の幾何学 的空間関係を用いて手書き成分を識別しそしてこれの座標を所望の本文資料の抽 出のために利用する。この発明の利点は何らのしきい値又はパターン認識方法を 用いることなく任意の大きさ及び形状の手書き曲線を識別し且つ見つける際のそ れの強固さにある。
FIG、 / FIG、3b ?)側(邦婢1 1F看吹Aす!Kl涜^ FIG、8 C===:=:==D FIG、 10 ディジタル化書類における選択本文の自動抽出のための多角形準拠式方法 斐−1灯−」 閉曲線を構成する任意の大きさの任意の手書き形状で包囲された領域における本 文を抽出するためにしきい値のないアルゴリズムが使用される。この技法の使用 は操作員が祇準拠式書類における本文資料の強度領域を選択し且つ書類のディジ タル化画像における包囲本文の抽出を自動化することを可能にする。
国際調査報告

Claims (8)

    【特許請求の範囲】
  1. 1.紙書類をラスタ走査する段階、 書類が走査されるにつれて書類のビットマップ表現を生成して、遷移が検出され るたびに輪郭ベクトル化を使用してビットマップ表現を一連のベクトルにより形 成された閉多角形の集まりへ変換するようにする段階、多角形の集まりを内側及 び外側群の輪郭へ分類する段階、内側及び外側輪郭のすべてをそれらのそれぞれ の群における位置に従って分類する段階、 重なり合う輪郭が互いに幾何学的に関係づけられるように各群の分類輪郭におけ る区分化点を決定する段階、 水平方向における幾何学的関係を有するすべての多角形について多角形ブロック を確立する段階、 輪郭連結を用いて多角形の外側及び内側の両輪郭の座標の幾何学的関係を検査し 、それらが幾何学的に重なり合っているかどうかを決定する段階、連結多角形の リストを走査して多角形の外部内側輪郭を見つける段階、並びに前記のビットマ ップ表現書類から手書き閉曲線の多角形の内側輪郭を抽出する段階、 によって特徴づけられた、紙書類における標識付き本文領域を抽出する方法。
  2. 2.前記の輪郭ベクトル化が輪郭画素追跡及び区分的線形近似の両段階によって 特徴づけられている、請求項1に記載の方法。
  3. 3.内側及び外側群の輪郭のための分離基準が方程式▲数式、化学式、表等があ ります▼ により与えられたクロス乗積の和によって作られ、ここで正のRが外側輪郭を表 示し且つ負のRが内側輪郭を表示している、請求項1に記載の方法。
  4. 4.上方座標(UYi−1)から下方座標(LYi)を減算した結果が正の値で あるときに区分化点が決定される、請求項1に記載の方法。
  5. 5.幾何学的連結を示す外側輪郭の中心点の角度和が、多角形の内側の成分に対 してはA=Σθi=2π多角形の外側の成分に対してはA=Σθi=0である、 請求項1に記載の方法。
  6. 6.更なる段階が外部内側輪郭の外側に配置された画素に対して画素値を0に設 定する、請求項1に記載の方法。
  7. 7.a)紙書類の画像をディジタル化して書類のビットマップ表現を形成する段 階、 b)ビットマップ画像から輪郭ベクトルの集合を抽出する段階、及びc)書類に おける包囲本文領域を抽出する段階、によって特徴づけられた、紙書頬における 包囲本文領域を抽出する方法。
  8. 8.紙書類上の選択データ領域をマーカを使用して閉曲線で包囲する段階、前記 の紙書類をディジタル化する段階、輪郭の幾何学的空間関係の技法を用いて手書 き成分を識別する段階、識別された手書き成分をこれに包囲された選択データの 抽出のために使用する段階、 によって特徴づけられた、紙書類上の選択データ領域を抽出する方法。
JP3510219A 1990-05-21 1991-05-20 ディジタル化書類における選択本文の自動抽出のための多角形準拠式方法 Pending JPH05500874A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US526,425 1990-05-21
US07/526,425 US5048099A (en) 1990-05-21 1990-05-21 Polygon-based method for automatic extraction of selected text in a digitized document

Publications (1)

Publication Number Publication Date
JPH05500874A true JPH05500874A (ja) 1993-02-18

Family

ID=24097286

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3510219A Pending JPH05500874A (ja) 1990-05-21 1991-05-20 ディジタル化書類における選択本文の自動抽出のための多角形準拠式方法

Country Status (4)

Country Link
US (1) US5048099A (ja)
EP (1) EP0483343A1 (ja)
JP (1) JPH05500874A (ja)
WO (1) WO1991018368A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006061698A (ja) * 2004-08-27 2006-03-09 General Electric Co <Ge> 関心領域を指示するためのユーザ対話式の方法
JP2014178941A (ja) * 2013-03-15 2014-09-25 Nec Corp 画像照合システム

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5426727A (en) * 1989-01-20 1995-06-20 Asahi Kogaku Kogyo K.K. High-quality character generating system and method for use therein
JP2840306B2 (ja) * 1989-08-02 1998-12-24 キヤノン株式会社 画像処理装置の領域処理方法
KR940007346B1 (ko) * 1991-03-28 1994-08-13 삼성전자 주식회사 화상 처리 시스템의 엣지 검출 장치
US5703962A (en) * 1991-08-29 1997-12-30 Canon Kabushiki Kaisha Image processing method and apparatus
US6058209A (en) * 1991-09-27 2000-05-02 E. I. Du Pont De Nemours And Company Method for resolving redundant identifications of an object
US5201011A (en) * 1991-11-19 1993-04-06 Xerox Corporation Method and apparatus for image hand markup detection using morphological techniques
CA2078423C (en) * 1991-11-19 1997-01-14 Per-Kristian Halvorsen Method and apparatus for supplementing significant portions of a document selected without document image decoding with retrieved information
IL100256A (en) * 1991-12-06 1997-01-10 Scitex Corp Ltd Apparatus and method for preparing picture masks
US5579407A (en) * 1992-04-21 1996-11-26 Murez; James D. Optical character classification
EP0898240B1 (en) * 1993-01-11 2003-03-05 Canon Kabushiki Kaisha Image processing method and apparatus
US6002798A (en) * 1993-01-19 1999-12-14 Canon Kabushiki Kaisha Method and apparatus for creating, indexing and viewing abstracted documents
JP2908204B2 (ja) * 1993-11-12 1999-06-21 日本電気ソフトウェア株式会社 十指指紋カード入力装置
US5517586A (en) * 1994-08-16 1996-05-14 Wang Laboratories, Inc. Method and apparatus for automatically specifying a portion of text from a bitmap image of the text
JP2918465B2 (ja) * 1994-11-14 1999-07-12 大日本スクリーン製造株式会社 画像処理方法
JP3392628B2 (ja) * 1996-03-29 2003-03-31 富士通株式会社 輪郭抽出方法及びシステム
JPH10191020A (ja) * 1996-12-20 1998-07-21 Canon Inc 被写体画像切出し方法及び装置
US5838820A (en) * 1997-04-30 1998-11-17 Bergman; Anthony J. Pattern recognition apparatus and method
US6351559B1 (en) 1998-12-22 2002-02-26 Matsushita Electric Corporation Of America User-enclosed region extraction from scanned document images
US6208352B1 (en) * 1999-08-30 2001-03-27 General Dynamics Government Systems Corp. Method for the computerized solution of the intersection of polygons
US6640010B2 (en) 1999-11-12 2003-10-28 Xerox Corporation Word-to-word selection on images
US6867875B1 (en) 1999-12-06 2005-03-15 Matsushita Electric Industrial Co., Ltd. Method and apparatus for simplifying fax transmissions using user-circled region detection
US6597808B1 (en) 1999-12-06 2003-07-22 Matsushita Electric Industrial Co., Ltd. User drawn circled region extraction from scanned documents
US6940617B2 (en) * 2001-02-09 2005-09-06 Matsushita Electric Industrial Co., Ltd. Printing control interface system and method with handwriting discrimination capability
US6999204B2 (en) * 2001-04-05 2006-02-14 Global 360, Inc. Document processing using color marking
US7246321B2 (en) * 2001-07-13 2007-07-17 Anoto Ab Editing data
US20030095113A1 (en) * 2001-11-21 2003-05-22 Yue Ma Index and retrieval system and method for scanned notes from whiteboard
DE10215548B4 (de) * 2002-04-09 2006-05-11 Eltromat Polygraph Gmbh Verfahren und Vorrichtung zur Erfassung von Abtastpositionen in Druckbildern
DE10337831A1 (de) * 2003-08-18 2005-03-24 Sick Ag Verfahren zur optischen Erkennung von alphanumerischen Zeichen
US7603349B1 (en) 2004-07-29 2009-10-13 Yahoo! Inc. User interfaces for search systems using in-line contextual queries
US7856441B1 (en) 2005-01-10 2010-12-21 Yahoo! Inc. Search systems and methods using enhanced contextual queries
EP1946233A4 (en) * 2005-10-25 2013-02-27 Charactell Ltd FORMULAR DATA EXTRACTION WITHOUT ADAPTATION
US20070115500A1 (en) * 2005-11-21 2007-05-24 Xerox Corporation Method for operating communication device
KR20080055119A (ko) * 2006-12-14 2008-06-19 삼성전자주식회사 화상형성장치 및 그 제어방법
US8244036B2 (en) * 2007-01-24 2012-08-14 Bluebeam Software, Inc. Method for emphasizing differences in graphical appearance between an original document and a modified document with annotations
US9779168B2 (en) 2010-10-04 2017-10-03 Excalibur Ip, Llc Contextual quick-picks
US9530121B2 (en) * 2011-12-19 2016-12-27 Hunter Engineering Company Vehicle service procedures
JP6107270B2 (ja) * 2013-03-19 2017-04-05 ブラザー工業株式会社 画像処理装置およびコンピュータプログラム
GB2521338A (en) * 2013-09-26 2015-06-24 Ibm Text selection
JP6540280B2 (ja) 2015-06-30 2019-07-10 ブラザー工業株式会社 画像処理装置およびコンピュータプログラム
US10083353B2 (en) 2016-10-28 2018-09-25 Intuit Inc. Identifying document forms using digital fingerprints
CN110555433B (zh) * 2018-05-30 2024-04-26 北京三星通信技术研究有限公司 图像处理方法、装置、电子设备及计算机可读存储介质

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4680805A (en) * 1983-11-17 1987-07-14 Texas Instruments Incorporated Method and apparatus for recognition of discontinuous text
GB8330869D0 (en) * 1983-11-18 1983-12-29 Centurfax Ltd Page make-up system
US4777651A (en) * 1984-06-25 1988-10-11 Tektronix, Inc. Method of pixel to vector conversion in an automatic picture coding system
JPH07107694B2 (ja) * 1984-08-31 1995-11-15 株式会社日立製作所 文書処理装置
US4853971A (en) * 1985-03-18 1989-08-01 Dainippon Screen Mfg. Co., Ltd. Method and apparatus for processing image data
EP0206214B1 (de) * 1985-06-18 1989-11-15 Siemens Aktiengesellschaft Verfahren zur einheitlichen symbolischen Beschreibung von Dokumentenmustern in Form von Datenstrukturen in einem Automaten
US4817166A (en) * 1986-05-05 1989-03-28 Perceptics Corporation Apparatus for reading a license plate
JPH0738681B2 (ja) * 1987-03-20 1995-04-26 富士ゼロックス株式会社 領域認識装置
US4901365A (en) * 1988-12-19 1990-02-13 Ncr Corporation Method of searching binary images to find search regions in which straight lines may be found

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006061698A (ja) * 2004-08-27 2006-03-09 General Electric Co <Ge> 関心領域を指示するためのユーザ対話式の方法
JP2014178941A (ja) * 2013-03-15 2014-09-25 Nec Corp 画像照合システム

Also Published As

Publication number Publication date
US5048099A (en) 1991-09-10
WO1991018368A1 (en) 1991-11-28
EP0483343A1 (en) 1992-05-06

Similar Documents

Publication Publication Date Title
JPH05500874A (ja) ディジタル化書類における選択本文の自動抽出のための多角形準拠式方法
CN110738207B (zh) 一种融合文字图像中文字区域边缘信息的文字检测方法
EP3535689A1 (en) Method and system for transforming handwritten text to digital ink
JP5854802B2 (ja) 画像処理装置、画像処理方法、及びコンピュータプログラム
Biswas et al. Construction of isothetic covers of a digital object: A combinatorial approach
JPH05500285A (ja) 書式画像における曲がりを検出する方法
CN112712273B (zh) 一种基于骨架相似度的手写体汉字美观度评判方法
Kim et al. Accurate segmentation of land regions in historical cadastral maps
Den Hartog et al. Knowledge-based interpretation of utility maps
CN112364709A (zh) 基于编码识别的机柜智能资产盘点方法
CN115082935A (zh) 用于对文档图像进行矫正的方法、设备及存储介质
Tang et al. Automatic structural scene digitalization
US7570811B2 (en) Segmenting an image via a graph
US7336825B2 (en) Segmenting a composite image via minimum areas
JP7165970B2 (ja) 学習データ生成装置および学習データ生成方法
JP4648084B2 (ja) 記号認識方法及び装置
EP1439485B1 (en) Segmenting a composite image via basic rectangles
Jeong et al. The Development of a Framework for the Automated Translation of Sketch-Based Data into BIM Models
Zhang et al. A Data Augmentation Method for Data-Driven Component Segmentation of Engineering Drawings
Lu et al. Panoptic-DLA: Document Layout Analysis of Historical Newspapers Based on Proposal-Free Panoptic Segmentation Model
JANSSEN Interpretation of maps: From bottom-up to model-based
Klingmann Part-Structured Spotting of Cuneiform Characters
Johnson Image processing for compound documents
Chen et al. Development of a method for extracting graph elements from mathematical graphs
CN117275026A (zh) 基于卷积神经网络的对投资金额类表格识别方法