JP4412762B2 - 点線抽出方法、その装置及びその記録媒体 - Google Patents

点線抽出方法、その装置及びその記録媒体 Download PDF

Info

Publication number
JP4412762B2
JP4412762B2 JP15300899A JP15300899A JP4412762B2 JP 4412762 B2 JP4412762 B2 JP 4412762B2 JP 15300899 A JP15300899 A JP 15300899A JP 15300899 A JP15300899 A JP 15300899A JP 4412762 B2 JP4412762 B2 JP 4412762B2
Authority
JP
Japan
Prior art keywords
dotted line
isolated
threshold
equal
isolated points
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP15300899A
Other languages
English (en)
Other versions
JP2000339454A (ja
Inventor
亘一 千葉
真一 江口
浩一 金元
勝利 小原
眞紀 矢吹
裕 勝又
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Fujitsu Frontech Ltd
Original Assignee
Fujitsu Ltd
Fujitsu Frontech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd, Fujitsu Frontech Ltd filed Critical Fujitsu Ltd
Priority to JP15300899A priority Critical patent/JP4412762B2/ja
Priority to US09/421,283 priority patent/US6556701B1/en
Publication of JP2000339454A publication Critical patent/JP2000339454A/ja
Application granted granted Critical
Publication of JP4412762B2 publication Critical patent/JP4412762B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Image Analysis (AREA)
  • Character Input (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、帳票の2値画像から点線を抽出する点線抽出方法、その装置及びその記録媒体に関し、点線を構成する孤立点の位置関係から点線を抽出する点線抽出方法、その装置及びその記録媒体に関する。
【0002】
近年、文字認識装置が、帳票上の文字を読み取るために、利用されている。帳票上の文字を読み取るためには、罫線で区画された文字領域を検出する必要がある。この方法として、事前に文字領域を登録する方法や、罫線の位置関係から表のフォーマットを自動解析する方法がある。
【0003】
いずれにしても、このような文字領域を検出する必要がある。この文字領域を区画する線分には、実線の他に、点線がある。このため、点線を正確に抽出する方法が望まれる。
【0004】
【従来の技術】
図9は、点線を使用した帳票の例を説明する説明図、図10は、従来技術の説明図である。
【0005】
図9は、金融機関における振込依頼書を示す。この例では、銀行名、支店名、種別、口座番号、受取人氏名、金額、手数料の各記入欄がある。そして、銀行名と支店名は、点線で区切られている。同様に、金額欄も点線で区切られている。
【0006】
このような点線で区切られた欄を認識するためには、点線を抽出する必要がある。
【0007】
図10に示すように、従来の点線抽出方法は、画像から、孤立点A、B、C、D等を抽出する。孤立点は、所定のサイズを有し、各々孤立している。そして、連続して並び、隣り合う孤立点と孤立点の間隔が、一定値dのものを、点線を構成する孤立点として、収集していた。図10では、孤立点Eが検出されない場合には、孤立点A、B、C、Dが、点線1を構成し、孤立点F、Gが、点線2を構成する。
【0008】
このように、従来の点線抽出方法は、連続して並ぶ孤立点の間隔が一定値である孤立点を探すことにより、点線を抽出していた。
【0009】
【発明が解決しようとする課題】
図11乃至図14は、従来技術の問題点説明図であり、図11は、イメージ読み取り結果に、かすれが生じている場合の説明図、図12は、点線に文字が接触している場合の説明図、図13は、点線に実線が交差している場合の説明図、図14は、点線に他の点線が交差している場合の説明図である。
【0010】
従来の点線抽出方法では、点線を構成する幾つかの孤立点がなくなった場合には、点線を正確に抽出できないという問題があった。
【0011】
例えば、図11に示すように、イメージ読み取り結果に、線のかすれが生じる場合には、点線もかすれる。従って、図10に示すように、孤立点A〜Gからなる点線において、かすれにより孤立点Eがなくなってしまう。このため、従来の点線抽出方法では、孤立点A〜Dの第1の点線1と、孤立点F、Gからなる第2の点線2に分割されてしまう。これにより、正確な点線の抽出が困難となる。
【0012】
又、図12に示すように、点線に文字が接触している場合には、接触部分に位置する点のサイズが大きくなる。このため、点線を構成する孤立点が、孤立点として抽出されない。このため、孤立点がなくなる。これにより、前述と同様に、点線が分断され、正確な点線の抽出が困難となる。
【0013】
更に、図13に示すように、点線に実線が交差している場合や、図14に示すように、点線に他の点線が交差している場合には、交差部分に位置する点のサイズが大きくなる。このため、点線を構成する孤立点が、孤立点として抽出されない。これにより、前述と同様に、点線が分断され、正確な点線の抽出が困難となる。
【0014】
従って、本発明の目的は、点線を構成する孤立点の幾つかが抽出されなくても、正確に点線を抽出するための点線抽出方法、その装置及びその記録媒体を提供することにある。
【0015】
本発明の他の目的は、画像のかすれにより、点線を構成する孤立点の幾つかが抽出されなくても、正確に点線を抽出するための点線抽出方法、その装置及びその記録媒体を提供することにある。
【0016】
本発明の更に他の目的は、文字との交差により、点線を構成する孤立点の幾つかが抽出されなくても、正確に点線を抽出するための点線抽出方法、その装置及びその記録媒体を提供することにある。
【0017】
本発明の更に他の目的は、他の実線又は点線との交差により、点線を構成する孤立点の幾つかが抽出されなくても、正確に点線を抽出するための点線抽出方法、その装置及びその記録媒体を提供することにある。
【0018】
【課題を解決するための手段】
本発明の点線抽出方法は、帳票上の画像から孤立点を抽出する第1のステップと、前記隣り合う2つの孤立点の間の位置関係から、点線の候補を構成する孤立点を抽出する第2のステップと、抽出された点線候補の孤立点群の位置関係から、前記点線の候補の妥当性を判定する第3のステップとを有し、前記第1のステップは、前記個々の孤立点のサイズが、所定のサイズの範囲内にあるかを判定し、前記所定のサイズの範囲内にある孤立点の座標をメモリに格納するステップを有し、前記第2のステップは、前記所定のサイズの範囲内にある孤立点から、前記隣り合う孤立点間の距離を算出し、前記隣り合う孤立点間の距離が、第1の閾値以下の孤立点を抽出するステップと、前記閾値以下の孤立点間のずれ算出し、前記孤立点間のずれが、第2の閾値以下の孤立点を抽出するステップと、前記第2の閾値以下の孤立点の各々サイズの差を算出し、前記差が第3の閾値以下の孤立点を抽出するステップと、前記第3の閾値以下の孤立点の数を計数し、前記数が所定値以上に孤立点を抽出し、前記点線の候補を構成する孤立点を抽出するステップを有し、前記第3のステップは、前記隣り合う孤立点間の各距離の差を算出して、算出した前記差が、第5の閾値以下であることを判定するステップと、前記第5の閾値以下であると判定した場合に、前記孤立点群が構成する線分の傾きを算出し、前記算出した傾きが、第7の閾値以下であるかを判定し、前記算出した傾きが、第7の閾値以下であると判定した場合に、前記点線の候補が点線であると判定するステップを有する
【0019】
本発明は、孤立点の間の位置関係をおおまかに見て、点線の候補を構成する孤立点を抽出する。例えば、孤立点と孤立点との間隔が、一定値ばかりか、間隔が一定値の倍数になっている場合も、点線の候補を構成する孤立点として抽出する。次に、抽出された点線に対し、孤立点群の間隔の規則性から点線の正当性を調べる。
【0020】
このようにして、2つの孤立点間の位置関係から点線の候補を抽出した後、抽出した孤立点群の位置関係から点線の正当性を調べるので、孤立点が部分的になくなっても、正確に点線を抽出することができる。即ち、画像のかすれや、文字接触や、実線又は点線との交差により、本来点線を構成する孤立点がなくなっても、正確に点線を抽出することができる。
【0021】
又、本発明の他の形態は、前記第3のステップは、前記孤立点同志の間隔の規則性を判定して、前記点線の候補の妥当性を判定するステップを含む。
【0022】
更に、本発明の他の形態は、前記第3のステップは、前記孤立点群が構成する線分の傾きを算出して、前記点線の候補の妥当性を判定するステップを更に含む。
【0023】
更に、本発明の他の形態は、前記第3のステップは、前記隣り合う孤立点間の各距離の差を算出して、その差により、前記点線の候補の妥当性を判定するステップを含む。
【0024】
本発明の更に他の形態は、前記第2のステップは、前記隣り合う孤立点間の距離を算出するステップと、前記距離と予め定めた閾値とを比較するステップとを有する。
【0025】
更に、本発明の更に他の形態は、前記第2のステップは、前記隣り合う孤立点間のずれを算出するステップと、前記ずれと予め定めた閾値とを比較するステップとを有する。
【0026】
更に、本発明の別の形態は、前記第2のステップは、前記隣り合う孤立点の各々サイズの差を算出するステップと、前記サイズの差と予め定めた閾値とを比較するステップとを有する。
【0027】
更に、本発明の別の形態は、前記第2のステップは、前記点線の候補を構成する孤立点の数を計数するステップと、前記孤立点の数と予め定めた閾値とを比較するステップとを有する。
【0028】
本発明の点線抽出装置は、帳票上の画像を読み取る読み取り手段と、前記画像から孤立点を抽出した後、前記隣り合う2つの孤立点の間の位置関係から、点線の候補を構成する孤立点を抽出し、そして、抽出された点線候補の孤立点群の位置関係から、前記点線の候補の妥当性を判定するプロセッサとを有する。
【0029】
本発明の他の形態は、前記プロセッサは、前記孤立点同志の間隔の規則性を判定して、前記点線の候補の妥当性を判定する。
【0030】
本発明の別の形態は、前記プロセッサは、前記孤立点群が構成する線分の傾きを算出して、前記点線の候補の妥当性を判定する。
【0031】
本発明の更に別の形態は、前記プロセッサは、前記隣り合う孤立点間の各距離の差を算出して、その差により、前記点線の候補の妥当性を判定する。
【0032】
本発明の更に別の形態は、前記プロセッサは、前記隣り合う孤立点間の距離を算出した後、前記距離と予め定めた閾値とを比較する。
【0033】
本発明の更に別の形態は、前記プロセッサは、前記隣り合う孤立点間のずれを算出した後、前記ずれと予め定めた閾値とを比較する。
【0034】
本発明の更に別の形態は、前記プロセッサは、前記隣り合う孤立点の各々サイズの差を算出した後、前記サイズの差と予め定めた閾値とを比較する。
【0035】
本発明の更に別の形態は、前記プロセッサは前記点線の候補を構成する孤立点の数を計数した後、前記孤立点の数と予め定めた閾値とを比較する。
【0036】
本発明の記録媒体は、帳票上の画像から孤立点を抽出する第1のプログラムと、前記隣り合う2つの孤立点の間の位置関係から、点線の候補を構成する孤立点を抽出する第2のプログラムと、抽出された点線候補の孤立点群の位置関係から、前記点線の候補の妥当性を判定する第3のプログラムとを有する。
【0037】
【発明の実施の形態】
図1は、本発明の一実施の形態のブロック図、図2は図1における孤立点収集処理フロー図、図3は、図1における点線候補抽出処理フロー図(その1)、図4は、図1における点線候補抽出処理フロー図(その2)、図5は、図1における点線の正当性チェック処理フロー図(その1)、図6は、図1における点線の正当性チェック処理フロー図(その2)、図7は、図3及び図4の点線抽出処理の説明図、図8は、図5及び図6の点線正当性チェックの説明図である。
【0038】
図1に示すように、イメージスキャナ1は、帳票を読み取り、2値画像に変換する。プロセッサ(CPU)2は、スキャナー1の2値画像から点線を抽出する。メモリ3は、CPU2の処理のために、必要な情報を保持する。
【0039】
CPU2は、イメージスキャナ1から読み取った帳票の2値画像から孤立点を抽出し、孤立点座標情報を作成する孤立点収集部20と、孤立点座標情報から孤立点同志の間隔等の幾つかの条件から点線候補を判定し、点線候補の孤立点情報を作成する点線候補抽出部21と、点線候補情報から、点線候補が点線として妥当なものかをチェックする点線正当性チェック部22とを有する。尚、これら各部は、CPU2が実行する処理をブロックにして示したものである。
【0040】
メモリ3は、抽出した孤立点座標情報を格納する孤立点座標格納域30と、抽出した点線候補情報を格納する点線候補格納域31と、チェックされた点線情報を格納する点線情報格納域32とを有する。
【0041】
図2により、孤立点収集部20の処理について、説明する。
【0042】
(S1)CPU2は、2値画像の全ての点に外接する矩形を作成する。図7に示すように、点Aに外接する矩形を作成する。点に外接する矩形を作成する理由は、点の形によらず、点間の間隔等を簡単に判断できるからである。
【0043】
(S2)CPU2は、全ての点の外接矩形に対してサイズチェックを行ったかを判定する。全ての点のチェックを終了すると、終了する。
【0044】
(S3)次に、CPU2は、作成した矩形のサイズをチェックする。点線を構成する孤立点のサイズは予め定まっている。ここでは、矩形のサイズが、点線を構成するような比較的小さな孤立点のサイズの範囲内にあるかを判定する。矩形のサイズが、孤立点のサイズの範囲内にない場合には、点線を構成しない点と判断して、ステップS2に戻る。。
【0045】
(S4)矩形のサイズが、孤立点のサイズの範囲内にある場合には、CPU2は、その孤立点の外接情報(外接座標)を、メモリ3のファイルに出力する。メモリ3では、孤立点座標情報格納域30にこれを格納する。そして、ステップS2に戻る。
【0046】
このような孤立点抽出処理を、2値画像の全ての点に対して行う。このようにして、点線を構成する孤立点を抽出する。
【0047】
次に、図3及び図4により、点線候補抽出部21の処理について、説明する。
【0048】
(S10)CPU2は、全ての孤立点を処理したかを判定する。全ての孤立点が一度でも以下のステップで説明する孤立点A又は孤立点Bとして処理された場合には、図4のステップS18に進む。
【0049】
(S11)CPU2は、孤立点の矩形情報から任意の孤立点Aを基準点として決定する。
【0050】
(S12)CPU2は、全ての孤立点を処理したかを判定する。全ての孤立点が一度でも以下のステップで孤立点Bとして処理された場合には、ステップS10に戻る。
【0051】
(S13)CPU2は、基準点Aに最も近い孤立点Bを探す。即ち、CPU2は、基準点Aと、一度でも孤立点Bとして処理された孤立点を除いた全ての孤立点との距離を計算して、基準点Aに最も近い孤立点Bを探す。
【0052】
(S14)CPU2は、基準点Aと孤立点Bとの間の距離と閾値とを比較して、基準点Aと孤立点Bとの距離d(図7参照)が、閾値より大きいかを判定する。この閾値は、点線の条件である点間の規定値の整数倍に設定されている。そして、距離dが、閾値より大きい場合には、ステップS12に戻る。この距離dの計算は、図7に示すように、孤立点の矩形の端部と孤立点の矩形の端部との間の距離を計算することにより行う。このため、矩形座標から容易に距離を計算できる。
【0053】
(S15)CPU2は、孤立点Aと孤立点Bとの中心座標間のずれWを計算する。そして、CPU2は、ずれWが、閾値より大きいかを判定する。ずれWが閾値より大きい場合には、点線を構成しないので、ステップS12に戻る。
【0054】
(S16)CPU2は、孤立点Aの矩形サイズと、孤立点Bの矩形サイズとの差(違い)を計算する。そして、CPU2は、差が閾値より大きいかを判定する。差が閾値より大きい場合には、点線を構成しないので、ステップS12に戻る。
【0055】
(S17)CPU2は、これらの条件を満たした孤立点Bを点線を構成する点と判断する。そして、CPU2は、点の個数を「1」インクリメントする。次に、孤立点Bを基準点Aと置き換え、ステップS12に戻る。
【0056】
(S18)CPU2は、カウントした個数と、閾値とを比較する。この閾値は、点線の条件となる最低限度の点の個数である。カウントした個数が閾値以上でない場合には、点線でないと判断して、終了する。
【0057】
(S19)CPU2は、カウントした個数が、閾値以上であれば、点線と判断する。そして、点線候補情報を作成する。点線候補情報は、点線を構成する各孤立点の矩形座標と、点線の開始座標、終了座標と、各孤立点のリンク関係の情報から構成される。そして、終了する。
【0058】
このようにして、点線の候補の条件として、基本的に、2つの隣り合う孤立点の位置関係を判定する。即ち、点線候補の条件としては、2つの孤立点間の距離、ずれ量、サイズの違いを判定している。距離が離れているものは、点線ではない。ずれが大きいものは、点線の関係にない。サイズが異なるものは、点線の関係にない。この点線の候補の条件は、最低限2つの孤立点の距離を判定することが望ましい。
【0059】
又、点線の候補として、上記条件を満たした孤立点の個数を判定している。孤立点の個数が少なければ、点線として成り立たない。点線としては、ある程度の個数の孤立点が必要である。
【0060】
このようにして、点線の候補を構成する孤立点を抽出する。
【0061】
次に、図5及び図6により、点線の正当性チェック部22の処理について、説明する。
【0062】
(S20)CPU2は、点線候補情報格納域31から先頭の点Aと二番目の点Bを取り出す。そして、CPU2は、点AB間の距離αを計算する。点AB間の距離は、図8に示すように、点Aの中心座標位置と点Bの中心座標位置との距離である。これにより、一点鎖線等でも、正確に点間の距離を計算できる。更に、CPU2は、点Bを点Aに置き換える。
【0063】
(S21)CPU2は、点線候補情報格納域31の全ての点を処理したかを判定する。全ての点を処理した場合には、図6のステップS27に進む。
【0064】
(S22)全ての点を処理していない場合には、CPU2は、置き換えた点Aの次の位置に存在する点Bを探す。そして、CPU2は、点AB間の距離βを計算する。点AB間の距離βも、図8に示すように、点Aの中心座標位置と点Bの中心座標位置との距離である。これにより、点AB間の距離αと、置き換えられた点ABの距離βとが得られた。
【0065】
(S23)CPU2は、距離αと距離βとの差を算出する。そして、距離αと距離βとの差が、閾値より大きいかを判定する。差が閾値より大きい場合には、図6のステップS29に進む。
【0066】
(S24)CPU2は、距離αと距離βとを比較して、大きい方を求める。大きい方の距離(α又はβ)を小さい方の距離(β又はα)で割って、商と余りを求める。そして、この商が所定の倍数以内で且つ余りが閾値以内かを判定する。
【0067】
(S25)商が倍数以内でない場合又は商が倍数以内でも、余りが閾値以内でない場合には、NG(no good)数をインクリメントする。そして、CPU2は、NG数が閾値を越えたかを判定する。NG数が閾値を越えていない場合には、ステップS26に進む。NG数が閾値を越えている場合には、図6のステップS29に進む。
【0068】
(S26)CPU2は、距離βを距離αとする。そして、点Bを点Aに置き換える。そして、ステップS21に戻る。
【0069】
(S27)点線の条件として、傾きをチェックする。CPU2は、先頭の点と最終の点の座標から傾きを計算する。そして、CPU2は、その傾きが閾値以内かを判定する。傾きが閾値以内でない場合には、ステップS29に進む。
【0070】
(S28)傾きが閾値以内なら、点線であったと判定する。そして、点線を構成する孤立点座標と、点線の開始座標、終了座標を、メモリ3の点線情報格納域32に格納する。更に、後の解析処理のため、点線の画像を格納域32にコピーする。そして、終了する。
【0071】
(S29)ステップS23の距離の条件、ステップS24の距離の規則性の条件、ステップS27の傾きの条件を満たさない場合には、CPU2は、これら孤立点が、点線を構成しないと判定する。そして、終了する。
【0072】
このようにして、2点間の位置関係により、点線候補を抽出した後、全体の点群の位置関係から、点線の正当性をチェックする。点線の正当性のチェックのため、隣り合う点間の距離を比較する。そして、距離の差が大きい場合には、点線でないと判定する。又、2つの距離の商が、倍数以内にあるかを判定する。2つの距離の商が倍数以内でなければ、その関係になかった数を計数して、閾値と比較する。関係になかった回数が閾値以上である場合には、点線でないと判定する。
【0073】
更に、これら条件を満たした場合には、更に、点線の傾きをチェックする。これらにより、点線の正当性をチェックする。このため、イメージ読み取り時のかすれや、文字との接触、実線との交差、他の点線との交差により、点線を構成する孤立点の幾つかが欠落しても、点線の抽出が可能となる。
【0074】
上述の実施の態様の他に、本発明は、次のような変形が可能である。
【0075】
(1) 前述の実施の態様では、点線の候補を抽出するため、4つの条件を判定しているが、これら条件を全て判定することが、望ましいが、これら全ての条件を判定する必要はなく、必要に応じて、幾つかの条件を省くことができる。
【0076】
(2) 点線の正当性をチェックするため、3つの条件を判定しているが、これら条件を全て判定することが、望ましいが、これら全ての条件を判定する必要はなく、必要に応じて、幾つかの条件を省くことができる。
【0077】
以上、本発明を実施の形態により説明したが、本発明の主旨の範囲内で種々の変形が可能であり、これらを本発明の範囲から排除するものではない。
【0078】
【発明の効果】
以上説明したように、本発明によれば、次の効果を奏する。
【0079】
(1)孤立点の間の位置関係を、距離、ずれ、サイズ差、数により大まかに見て、点線の候補を構成する孤立点を抽出し、抽出された点線に対し、孤立点群の規則性である孤立点間の距離、傾きから点線の正当性を調べるので、孤立点が部分的になくなっても、正確に点線を抽出できる。
【0080】
(2) 即ち、画像のかすれや、文字接触や、実線又は点線との交差により、本来点線を構成する孤立点がなくなっても、正確に点線を抽出することができる。
【図面の簡単な説明】
【図1】本発明の一実施の形態のブロック図である。
【図2】図1の孤立点収集処理フロー図である。
【図3】図1の点線候補抽出処理フロー図(その1)である。
【図4】図1の点線候補抽出処理フロー図(その2)である。
【図5】図1の点線の正当性チェック処理フロー図(その1)である。
【図6】図1の点線の正当性チェック処理フロー図(その2)である。
【図7】図3及び図4の点線抽出処理の説明図である。
【図8】図5及び図6の点線正当性チェックの説明図である。
【図9】点線が使用された帳票例の説明図である。
【図10】従来技術の説明図である。
【図11】従来技術の問題点説明図(その1)である。
【図12】従来技術の問題点説明図(その2)である。
【図13】従来技術の問題点説明図(その3)である。
【図14】従来技術の問題点説明図(その4)である。
【符号の説明】
1 イメージスキャナ
2 プロセッサ(CPU)
3 メモリ
20 孤立点収集部
21 点線候補抽出部
22 点線正当性チェック部
30 孤立点座標情報格納部
31 点線候補情報格納部
32 点線情報格納部

Claims (6)

  1. 帳票上の点線を抽出する点線抽出方法において、
    帳票上の画像から孤立点を抽出する第1のステップと、
    前記隣り合う2つの孤立点の間の位置関係から、点線の候補を構成する孤立点を抽出する第2のステップと、
    抽出された点線候補の孤立点群の位置関係から、前記点線の候補の妥当性を判定する第3のステップとを有し、
    前記第1のステップは、
    前記個々の孤立点のサイズが、所定のサイズの範囲内にあるかを判定し、前記所定のサイズの範囲内にある孤立点の座標をメモリに格納するステップを有し、
    前記第2のステップは、
    前記所定のサイズの範囲内にある孤立点から、前記隣り合う孤立点間の距離を算出し、前記隣り合う孤立点間の距離が、第1の閾値以下の孤立点を抽出するステップと、
    前記閾値以下の孤立点間のずれ算出し、前記孤立点間のずれが、第2の閾値以下の孤立点を抽出するステップと、
    前記第2の閾値以下の孤立点の各々サイズの差を算出し、前記差が第3の閾値以下の孤立点を抽出するステップと、
    前記第3の閾値以下の孤立点の数を計数し、前記数が所定値以上に孤立点を抽出し、前記点線の候補を構成する孤立点を抽出するステップを有し、
    前記第3のステップは、
    前記隣り合う孤立点間の各距離の差を算出して、算出した前記差が、第5の閾値以下であることを判定するステップと、
    前記第5の閾値以下であると判定した場合に、前記孤立点群が構成する線分の傾きを算出し、前記算出した傾きが、第7の閾値以下であるかを判定し、前記算出した傾きが、第7の閾値以下であると判定した場合に、前記点線の候補が点線であると判定するステップを有する
    ことを特徴とする点線抽出方法。
  2. 請求項の点線抽出方法において、
    前記第1の閾値以下でない孤立点、前記第2の閾値以下でない孤立点、前記第3の閾値以下でない孤立点の数を計数し、前記計数した数が、第4の閾値以上である場合には、前記抽出した孤立点が点線を構成しないと判定するステップを更に有する
    ことを特徴とする点線抽出方法。
  3. 請求項の点線抽出方法において、
    前記第5の閾値以下でない孤立点間の距離の数を計数し、前記計数した数が、第6の閾値以上である場合には、前記抽出した孤立点が点線を構成しないと判定するステップを更に有する
    ことを特徴とする点線抽出方法。
  4. 帳票上の点線を抽出する点線抽出装置において、
    帳票上の画像を読み取る読み取り手段と、
    前記画像から孤立点を抽出した後、前記隣り合う2つの孤立点の間の位置関係から、点線の候補を構成する孤立点を抽出し、そして、抽出された点線候補の孤立点群の位置関係から、前記点線の候補の妥当性を判定するプロセッサとを有し、
    前記プロセッサは、前記個々の孤立点のサイズが、所定のサイズの範囲内にあるかを判定し、前記所定のサイズの範囲内にある孤立点の座標をメモリに格納し、前記所定のサイズの範囲内にある孤立点から、前記隣り合う孤立点間の距離を算出し、前記隣り合う孤立点間の距離が、第1の閾値以下の孤立点を抽出し、前記閾値以下の孤立点間のずれ算出し、前記孤立点間のずれが、第2の閾値以下の孤立点を抽出し、前記第2の閾値以下の孤立点の各々サイズの差を算出し、前記差が第3の閾値以下の孤立点を抽出し、前記第3の閾値以下の孤立点の数を計数し、前記数が所定値以上の孤立点を抽出して、前記点線の候補を構成する孤立点を抽出し、
    前記隣り合う孤立点間の各距離の差を算出して、算出した前記差が、第5の閾値以下であることを判定し、前記第5の閾値以下であると判定した場合に、前記孤立点群が構成する線分の傾きを算出し、前記算出した傾きが、第7の閾値以下であるかを判定し、前記算出した傾きが、第7の閾値以下であると判定した場合に、前記点線の候補が点線であると判定する
    ことを特徴とする点線抽出装置。
  5. 請求項の点線抽出装置において、
    前記プロセッサは、前記第1の閾値以下でない孤立点、前記第2の閾値以下でない孤立点、前記第3の閾値以下でない孤立点の数を計数し、前記計数した数が、第4の閾値以上である場合には、前記抽出した孤立点が点線を構成しないと判定する
    ことを特徴とする点線抽出装置。
  6. 請求項の点線抽出装置において、
    前記プロセッサは、前記第5の閾値以下でない孤立点間の距離の数を計数し、前記計数した数が、第6の閾値以上である場合には、前記抽出した孤立点が点線を構成しないと判定する
    ことを特徴とする点線抽出装置。
JP15300899A 1999-05-31 1999-05-31 点線抽出方法、その装置及びその記録媒体 Expired - Lifetime JP4412762B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP15300899A JP4412762B2 (ja) 1999-05-31 1999-05-31 点線抽出方法、その装置及びその記録媒体
US09/421,283 US6556701B1 (en) 1999-05-31 1999-10-20 Method of and apparatus for extracting dotted line, and storage medium thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP15300899A JP4412762B2 (ja) 1999-05-31 1999-05-31 点線抽出方法、その装置及びその記録媒体

Publications (2)

Publication Number Publication Date
JP2000339454A JP2000339454A (ja) 2000-12-08
JP4412762B2 true JP4412762B2 (ja) 2010-02-10

Family

ID=15552949

Family Applications (1)

Application Number Title Priority Date Filing Date
JP15300899A Expired - Lifetime JP4412762B2 (ja) 1999-05-31 1999-05-31 点線抽出方法、その装置及びその記録媒体

Country Status (2)

Country Link
US (1) US6556701B1 (ja)
JP (1) JP4412762B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7664325B2 (en) * 2005-12-21 2010-02-16 Microsoft Corporation Framework for detecting a structured handwritten object
US7583841B2 (en) * 2005-12-21 2009-09-01 Microsoft Corporation Table detection in ink notes
JP4791295B2 (ja) * 2006-08-31 2011-10-12 富士通株式会社 罫線抽出プログラム、罫線抽出装置、罫線抽出方法
WO2010113217A1 (ja) * 2009-03-31 2010-10-07 富士通フロンテック株式会社 文字認識装置及び文字認識方法
JP5822664B2 (ja) 2011-11-11 2015-11-24 株式会社Pfu 画像処理装置、直線検出方法及びコンピュータプログラム
JP5871571B2 (ja) 2011-11-11 2016-03-01 株式会社Pfu 画像処理装置、矩形検出方法及びコンピュータプログラム
JP5854774B2 (ja) * 2011-11-11 2016-02-09 株式会社Pfu 画像処理装置、直線検出方法及びコンピュータプログラム
US8903173B2 (en) * 2011-12-21 2014-12-02 Ncr Corporation Automatic image processing for document de-skewing and cropping

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2037173C (en) * 1990-03-30 1996-01-09 Hirofumi Kameyama Character recognizing system
US5638462A (en) * 1993-12-24 1997-06-10 Nec Corporation Method and apparatus for recognizing graphic forms on the basis of elevation angle data associated with sequence of points constituting the graphic form
DE69531882D1 (de) * 1994-07-13 2003-11-13 Canon Kk Gerät und Verfahren zur Bildverarbeitung
US6104833A (en) * 1996-01-09 2000-08-15 Fujitsu Limited Pattern recognizing apparatus and method
JPH10111931A (ja) 1996-10-07 1998-04-28 Meidensha Corp 線種認識方法
JP2991145B2 (ja) 1997-01-30 1999-12-20 日本電気株式会社 線分検出装置
JP3113217B2 (ja) 1997-04-18 2000-11-27 日本電信電話株式会社 破線認識方法

Also Published As

Publication number Publication date
JP2000339454A (ja) 2000-12-08
US6556701B1 (en) 2003-04-29

Similar Documents

Publication Publication Date Title
JPH11219407A (ja) 文書画像認識装置および文書画像認識プログラムの記憶媒体
US20140169681A1 (en) Method, apparatus and system for generating a feature vector
CN112508037B (zh) 图像模板匹配方法、装置及存储装置
JPH05242292A (ja) 分離方法
US4918740A (en) Processing means for use in an optical character recognition system
JP4891013B2 (ja) タイトル抽出装置、画像読取装置、タイトル抽出方法、及びタイトル抽出プログラム
JP4412762B2 (ja) 点線抽出方法、その装置及びその記録媒体
US20230065041A1 (en) Geometric pattern matching method and device for performing the method
JP5414631B2 (ja) 文字列探索方法、文字列探索装置、記録媒体
US6351560B1 (en) Apparatus, method, and program for locating an objective on a form and a recording medium for recording the program for locating the objective on the form
JP3574562B2 (ja) 画像内の一連パターンの認識および変形検出方法及びそのプログラムを記録した記録媒体
JP3798179B2 (ja) パターン抽出装置及び文字切り出し装置
KR100229810B1 (ko) 영상 데이터베이스 검색방법
JPH06215184A (ja) 抽出領域のラベリング装置
JP3466899B2 (ja) 文字認識装置及び方法並びにプログラム記憶媒体
JP2576080B2 (ja) 文字切出し方法
JP2630261B2 (ja) 文字認識装置
JP2683116B2 (ja) 罫線の除去方法
JP2768289B2 (ja) 文字切り出し装置
JP3867237B2 (ja) 文字認識方法および装置および文字認識プログラムを記録した記録媒体
JPH0676103A (ja) 文書画像の文章領域抽出装置
JP2813601B2 (ja) 表形式文書認識装置
JP3296872B2 (ja) 硬貨識別方法
JP3190794B2 (ja) 文字切り出し装置
JP2658137B2 (ja) 文字認識方式

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060324

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090602

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090803

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090825

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091026

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091117

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091117

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121127

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4412762

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121127

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131127

Year of fee payment: 4

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term