JPH09503329A - 文書中の前景情報を背景情報から分離する方法 - Google Patents

文書中の前景情報を背景情報から分離する方法

Info

Publication number
JPH09503329A
JPH09503329A JP8519443A JP51944396A JPH09503329A JP H09503329 A JPH09503329 A JP H09503329A JP 8519443 A JP8519443 A JP 8519443A JP 51944396 A JP51944396 A JP 51944396A JP H09503329 A JPH09503329 A JP H09503329A
Authority
JP
Japan
Prior art keywords
information
background
threshold
document
foreground
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8519443A
Other languages
English (en)
Other versions
JP3078844B2 (ja
Inventor
ヘーネル、ワルター
Original Assignee
インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン filed Critical インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン
Publication of JPH09503329A publication Critical patent/JPH09503329A/ja
Application granted granted Critical
Publication of JP3078844B2 publication Critical patent/JP3078844B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/28Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Analysis (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】 背景情報の上に前景情報が加法的または減法によって重ねられている文書中で前景情報を背景情報から分離する方法を提供する。本発明によれば、第1ステップで文書を複数のセグメントに分割し、第2ステップで各セグメント中の信号強度の極値の頻度分布を決定する。こうして求めた頻度分布は、本質的に背景情報を含む1つの主モード(背景モード)を有する。最初の2つのステップで前景と背景の十分な分離が行えない場合は、第3ステップで文書全体の信号強度の頻度分布の決定を行い、求めた2つの頻度分布を共同評価する第4ステップでより鋭敏な分離を行う。文書中の背景情報の信号強度の閾値を決定するため、第5ステップで、背景モードの前景情報に向かう側面からまたは別の主モードの背景モードと反対側にある側面の1つから、好ましくは2つの主モードの1つの側面上の点の線形近似によってこの閾値を誘導する。

Description

【発明の詳細な説明】 文書中の前景情報を背景情報から分離する方法技術分野 本発明は、前景情報が背景情報の上に加法的にまたは減法的に重なっている文 書中で前景情報を背景情報から分離する方法に関する。この方法は、文書中の背 景情報の信号強度の閾値を決定し、文書中の背景情報を除去し、あるいはまた電 子的グレイ・スケールを白黒に変換するのに特に適している。背景技術 電子文書処理を使用する際、データの量の故に、また後続の処理を簡単にする ために、電子的グレイ・スケールを白黒に変換することがしばしば必要となる。 その際に、テキストと数字だけを白黒情報として残し、背景パターンと予め印刷 されたドロップアウト色は残さないようにして、読みやすくし、あるいは後続の 電子処理が実施できるようにすべきである。そのためには、情報を含む前景と、 一般に情報は含まないがたとえば安全や設計上の理由から構造化されている背景 とを区別できることが必要である。前景と背景が区別できる場合、前景情報を分 離するために背景を除去する、すなわち背景を抑制または消去することが可能に なる。 前景情報に後でさらに何らかの処理を加えるには、背景の 構成要素が誤った解釈を招く可能性のある望ましくない人工物として前景に流れ 込まないようにすることが特に必要である。 たとえばユーロチェックや身分証明書など安全保護上の理由で文書が高度に構 造化された背景を有する場合には、後続の電子処理の諸要件を満たす白黒画像を 、現況技術で知られる背景除去のための方法によって生成できないことがしばし ばある。高度に構造化された背景とは、高コントラストを特徴とし、一般に好ま しくは直線状または類似の模様であり、記入項目と同程度の構造寸法を有する、 背景である。 高度に構造化された背景を含む文書の一例として、第1図に、グレイ・スケー ルで表したユーロチェックの通貨フィールドと金額フィールドを示す。第2図に は、第1図の水平線に沿ったグレイ・スケール分布を示す。この場合、この線は 、通貨フィールド及び金額フィールドの手書き項目と機械印刷項目の間の領域に 、これらの項目を切断しないように置かれていた。高い値(「白」の方向)は明 るいグレイ値を表し、低い値(「黒」の方向)は暗いグレイ値を表す。通常の2 56グレイ値を使用する場合、グレイ値0=黒、グレイ値255=白である。 第2図を見るとわかるように、(フレームではなく)背景のグレイ値は特定の 限界(閾値)まで均一に延び、たとえばフレーム化の結果としてあるいはイメー ジの歪みによるなど僅かな例外を除き、一般にこの限界より低くなることはない 。 これは、色飽和が有効に制御できる、製造における印刷技術の結果である。この ことは一般には望ましい。そうでないと、人が項目を読み取るのが難しくなり、 読取り不可能となることさえある。第2図にはっきり見えるように閾値の下で「 黒」の方向への偏位は、外枠及び通貨フィールドと金額フィールドの間の分割線 によって生じたものである。 (手書き及び機械印刷)項目のグレイ値は、最もよく使われているプリンタの 減法的カラー挙動によって生じ、各ケースでこの閾値より下になるが、ごく僅か だけのことがしばしばである。したがって、背景とのコントラストは背景内部の コントラストよりもかなり目立たない。減法的カラー挙動とは一般に、色素を追 加するとスペクトルから色成分が除去される、すなわちグレイ値が全体としてよ り暗くなるとの意味である。 既知の白黒変換法では、背景閾値、明暗コントラスト、あるいは線幅や隣接グ レイ値の標準偏差などの判定基準を使用する。コントラスト法は一般に高度に構 造化された背景を含む文書の上記の適用分野で使用するには適していない。背景 中でのコントラストの変化の方が背景と項目の間での変化よりも目立つことがあ るからである。同様に線幅の評価も適さないことがしばしばである。背景構造は 、第1図のユーロチェックの例を見るとわかるようにしばしば直線状構造をもつ からである。 印刷技術の特徴から、閾値法の使用が最適の結果を与える ことになる。閾値法とは、グレイ値を当該の閾値で限定されるクラスに分割する 方法をいう。ただし、閾値の正確で最適な決定に難点がある。閾値は、可能な最 良の白黒イメージをもたらす様々なアルゴリズムに従って、グレイ値のヒストグ ラムから計算されることがしばしばである。文献では、これらの閾値法は「閾値 処理(thresholding)法とも呼ばれる。 既知の方法のレビューが、P.K.サホー(Sahoo)、S.サルタニ(Soltani )、A.K.C.ウォン(Wong)の論文「A Survey of Thresholding Technique s」、Computer Vision,Graphics and Image Processing,41,233-260(1988) に出ている。そこでは、ヒストグラムの形状を変化させて閾値を決定するヒスト グラム変換法と、閾値を計算するためのアルゴリズムが区別されている。サホー 等で代表される最も重要な方法について、高度に構造化された背景を含む文書で のその使用に関して以下に簡単に論じる。 ヒストグラム変換法 サホー等のいう、エッジ演算子を用いてヒストグラムを改善する方法は、高度 に構造化された背景には使用できない。この方法は背景のエッジと項目のエッジ を区別できないからである。隣接するグレイ値の標準偏差はヒストグラムの変更 にさらに適していない。この場合も項目だけでなく特に背景が標準偏差の増大を もたらすからである。 閾値を計算するためのアルゴリズム 既知の「モード・アンド・コンキャビティ」法も同様に、高度に構造化された 背景を含む文書ではうまく使用できない。高度に構造化された背景はしばしばグ レイ値のヒストグラム中でいくつかのモードとコンキャビティを発生し、したが って背景と前景への明白な割振りが不可能だからである。 「オーツ法」も使用できない。このアルゴリズムは、クラス間分散を最大にす ることによってピクチャ・ポイントをクラスに分割し、それがいくつかのタラス を与えるか及びそのうちのどれに求める情報が含まれるかは前もってわからない からである。 既知のエントロピー法では、白黒イメージのデータ内容が最大になるように閾 値を計算しようと試みる。しかし、背景と項目のデータ内容が区別されないので 、高度に構造化された背景を含む文書の場合、この方法も考慮に入れることがで きない。 サホー等の文献の補足で方法について論じられており、下記の文献にも既知の 他の方法が出ている。 J.M.ホワイト(White)、G.D.ローラー(Rohrer)「Image Threshold ing for Optical Character Recognition and other Applications Requiring C haracter Image Extraction」、IBM J.Res.Development Vol.27 No.4(83年7 月)に、白黒変換用の2つの方法が記載されている。 1)動的閾値を用いる方法。ただし、これは第6図に示す結 果をもたらす。 2)線幅を評価する方法。ただし、高度に構造化された背景を含む文書には適さ ない。 「Greyscale Assist for Machine Recognition of Courtesy Amount on Chequ es」、IBMテクニカル・ディスクロージャ・ブルテン、Vol.34 No.5(91年10月) 、pp.374-377には、閾値選択のため解像度の異なる2つのイメージを使用する方 法を記載している。 N.オーツ、「A Threshold Selection Method from Grey Level Histograms 」、IEEE Transactions on Systems,Man and Cybernetics,Vol.SMC-9(1979年 1月)、pp.66-67にはオーツ法が提示されている。 T.クリタ、N.オーツ、N.アブデルマレク(Abdelmalek)「Maximum Like lihood Thresholding based on Population Mixture Models」、Pattern Recogn ition,Vol.25 No.10,1231-1240(1992年)では、オーツ法とその応用法につい て論じている。 M.A.シド=アハメド(Sid-Ahmed)、「A Hardware Structure for the au tomatic selection of Multi-Level Thresholds in Digital Images」、Pattern Recognition,Vol.25 No.12,1517-1528(1992年)では、オーツ法をさらに発 展させた方法について論じている。 C.K.リー(Lee)、C.H.リ(Li)、「Adaptive Thresholding via Gau ssian Pyramid」、China 1991,Interna tional Conference on Circuits and Systems June 1991,Shenzhen,Chinaでは 、エントロピー法をさらに発展させた方法について論じている。 上記の既知のどの方法も、高度に構造化された背景の問題を満足に解決し、あ るいは後続の電子処理の要件を満たす満足できるイメージを生成することができ ない。発明の開示 本発明の目的は、ハーフトーン・ピクチャにおける背景グレイ・スケールが最 大に(最も暗く)なる閾値を計算することのできる、前景情報を背景情報から分 離する方法を提供することにある。 本発明の目的は、請求の範囲の独立項である第1項に記載の方法によって達成 される。 本発明によれば、第1段階で文書をいくつかのセグメントに分割し、第2段階 で各セグメント中の信号強度の極値の頻度分布(frequency distribution)を決 定する。こうして決定した頻度分布は、本質的に背景情報を含む主モード(背景 モード)を示す。最初の2段階で前景と背景の十分な分離が行えない場合は、第 3段階で文書全体の信号強度の頻度分布を実施することができ、第4段階で、得 られた2つの頻度分布を評価することにより鋭敏な分離を行うことができる。 文書中の背景情報の信号強度の閾値を決定するため、第5段階で、前景情報に 向かって傾斜した背景情報の側面から、 あるいは背景に隣接する別の主モードの側面から、好ましくは2つの主モードの 側面上の点の線形近似によってこの閾値を導出する。 文書中の背景情報を除去するため、追加の第6段階で、文書中の情報を閾値よ り上の信号強度と下の信号強度に分割し、第7段階で背景領域を表す信号強度を 削除することができる。 本発明による方法をイメージ文書の白黒変換に使用する場合は、印刷によって 生成した文書の諸特性と、後続の電子処理の要件を満たす生成された白黒イメー ジを利用する。 本発明による方法は、所望の任意の背景を含む文書/イメージの背景除去に使 用できるが、レコーダまたはプリンタによって背景から減法的に生成された前景 情報を保持しなければならない。すなわち、背景に前景情報を重ねることによっ て得られるグレイ値が、背景文書の元のグレイ値より暗くなければならない。 本発明による方法の既知の方法に勝る具体的利点は、高度に構造化された背景 を含む、すなわち背景中のコントラストの大きな文書の背景が、特に、顕著な直 線状または手書き様の文字を有する場合に、除去されることにある。その場合、 背景構造の構造寸法が前景情報の手書きの寸法と同程度である場合に良好な結果 が得られる。 本発明による方法は、グレイ・イメージの閾値の「オンライン」決定、すなわ ち文書が存在する通りの状態での閾値の決定に特に適している。一般に、文書の グレイ値は、たとえ ば照明の強度の結果、あるいは文書のフェージングの結果として変化する。同様 に色飽和及び紙の状態も文書ごとに変化する。またスキャナの違いから、たとえ ばスキャナの感度一般から、あるいは文書のグレイ値の測定に直接影響を与える スペクトルで条件付けられた感度を通じて、ある効果が生じる。 本発明を使って得られる背景閾値を使用すると、たとえば決定された閾値より も明るいすべてのグレイ値を除去することにより、後で背景を除去することがで き、その後の文書処理、たとえば文字認識を行うことができる。 いくつかの適当な閾値を使用することにより、情報の大きな損失なしにグレイ ・スケールの数を減らすことができる。その場合、情報の損失の度合は閾値の選 択の影響を受ける。 ただし、本発明の教示は光学式イメージ処理での使用に限定されるものではな く、背景に前景信号が加法的または減法的に重なっているすべてのフィールド中 で前景情報を所望の背景から分離するのにも同様に使用できる。図面の簡単な説明 第1図は、グレイ・スケール表示によるユーロチェックの通貨フィールドと金 額フィールドを示す図である。 第2図は、第1図の水平線に沿ったグレイ値の分布図である。 第3図は、第1図に示すイメージのグレイ値の頻度分布の 標準ヒストグラムHStd(i)である。 第4A図は、第1図に示すイメージのグレイ値の頻度分布のセグメント・ヒス トグラムHseg(i)である。 第4B図は、第4A図で選択されたセグメント・サイズと第1図の部分イメー ジのセグメント・ラスタ化を示す図である。 第5A図は、第4A図の標準化セグメント・ヒストグラムHseg(i)と第 3図の標準化標準ヒストグラムHstd(i)とから形成した示差ヒストグラム Hdif(i)である。 第5B図は、一般に多モード・ヒストグラムの場合と同様の、ただし主モード を2つしか含まない示差ヒストグラムHdif(i)である。 第6図は、背景グレイ値の閾値SWINの一次近似による決定を示す図である。 第7図は、閾値を決定するより正確な方法を示す図である。 第8図は、イメージ解像度が限られているためにしばしば得られる、円滑化前 のヒストグラムである。 第9図及び第10図は、既知の現況技術の方法によって得られる、第1図のイ メージの背景除去の結果を示す図である。 第11図は、本発明の方法による第1図のイメージの背景除去の結果を示す図 である。発明を実施するための最良の形態 次に第1図に示したユーロチェックの例を用いて、後でイメージから背景を除 去すべきグレイ値イメージ中の背景グレイ値か最大に(最も暗く)なる閾値(以 下では閾値と称する)を決定するための本発明による方法を説明する。 第3図に、ユーロチェックの通貨フィールドと金額フィールドの第1図に示し たイメージのグレイ値の頻度分布の標準ヒストグラムHstd(i)を示す。縦 軸に示した頻度Hstd(i)は、グレイ値がiの測定イメージ点の数である。 ここでグレイ値iは横軸上に示してあり、グレイ値i=0の「黒」からグレイ値 が最大imaxの「白」へと延びる。 第3図の領域10は本質的に背景サンプル情報を含み、ピーク20は主として 第1図のフィールド・マージンによって生成される。領域10とピーク20の間 の領域30には前景項目の書込み情報が含まれる。ただし、この情報が正確に局 在化されている場合、それはこの標準ヒストグラムHstd(i)からは決定で きない。また個々の領域は重なり合っており、この場合に情報の分離は不可能で ある。 先にユーロチェックなどの印刷文書について概略を述べたように、背景は特定 のグレイ値、すなわち閾値より低くならない。これは製造に使用する印刷技術の ためであり、色飽和(すなわち色のシェード)が一般に非常に正確に制御でき、 かつ読みやすくなるように制御しなければならない。背景のグレイ値が一般に閾 値より低くならず、したがって特定のグ レイ値より暗くならない結果、前景が背景情報から分離でき、背景の最小グレイ 値が大幅に上がるように、標準ヒストグラムを別のヒストグラムで変更または置 き換えるべきである。 第1段階で、処理しようとするイメージ文書を別々のセグメントに分割する。 それらのセグメントは面積がほぼ等しいが、この処理は後のデータ処理を簡単に するためのものにすぎず、この方法にとって本質的ではない。分割の際に、予想 閾値がいくつかのセグメント中に少なくとも1回含まれるように注意する。さら に、「項目を含まない」セグメント、すなわち背景情報のみを含み、項目からの 前景情報を欠くセグメントが存在すべきである。本質的に均一に構造化された背 景パターンでは、セグメント・サイズは背景のサンプル・サイズから簡単な推定 によって決定できるので有利である。 大きすぎるセグメント・サイズを選択した場合、後述のように閾値の推定に使 用できる情報が少なすぎることがある。「項目を含まない」セグメントが得られ ない場合は、セグメント面積が大きくなりすぎるので特にそうである。ただし、 セグメント面積が小さすぎる場合、状況によってはセグメント化前の初期イメー ジに比べて得られる意味のあるデータが少なくなりすぎる。 各セグメントごとに、最も暗いグレイ値(最小値)を決定し、新しいセグメン ト・ヒストグラムHseg(i)に入力する。これは最小値ヒストグラムとも呼 ばれる。標準ヒストグラムHstd(i)に対応して、グレイ値iのセグメント ・ヒストグラム中の決定されたセグメントの頻度Hseg(i)を横軸の各グレ イ値ごとに縦軸に入力する。同様に、グレイ値iはグレイ値i=0の「黒」から グレイ値が最大imaxの「白」へと延びる。第4A図に、第1図に示したユー ロチェックの通貨フィールドと金額フィールドのイメージに対する選択されたセ グメントのグレイ値の頻度分布のこうしたセグメント化ヒストグラムHseg( i)を示す。これに対して選択されたセグメントのセグメント・サイズを、第1 図の部分イメージのセグメント・ラスタ化と共に第4B図に示す。第4B図に示 したセグメント・サイズは一例にすぎないが、後の処理にとって有利であること が証明されている。 最小値が決定された領域(セグメント)は、予想閾値がその中で見つかるよう 十分に大きく選ぶべきである。ユーロチェック(第1図)の場合のように最小値 が規則的に現れる場合は、非常に小さな面積でもこの条件が満たされることにな る。ただし、セグメントの面積の大きな変動やセグメントの重なりがある場合で も、セグメント・ヒストグラムHseg(i)はほとんど変わらないことが確定 されている。一般にセグメントとしては、表面の限られた切片を使用でき、これ は部分的に重なり合っていてもよい。その例として、異なるサイズの方形領域だ けでなく線形領域も挙げることができる。ほんの少数のグレイ・スケール(たと えば16)を含むハーフトーン・イメージや非常にフェージングの強いイメージ の場合、処理前に低域フィルタの使用を推奨する。 得られたセグメント・ヒストグラムHseg(i)(第4A図)及び対応する 標準ヒストグラムHStd(i)(第3図)をさらに処理する前に正規化する。 この目的には既知のどの正規化法を使用してもよい。しかし、両方のヒストグラ ムを、セグメント中の測定点(イメージ画素)の数に対して正規化すると有利で ある。その後、グレイ値iのすべての測定値の和(頻度H(i))にセグメント 当りの測定点の数を乗じた積として正規化頻度Hnorm(i)が得られる。 Hnorm(i)=(セグメント当りの測定点)*H(i) 標準ヒストグラムHstd(i)では、セグメント化されていないため、1セ グメント中の測定点(イメージ画素)の数は1に等しい。どちらのヒストグラム の場合も、この正規化の結果、すべての頻度の和は同じ値になる。この正規化の 利点は、主としてヒストグラム構築の際に対応する値の処理に(セグメント当り の測定点の和は大抵は知られている)乗算しか必要でなく、除算は不要である点 にある。頻度H(i)及びセグメント当りの測定点の数は各ケースで整数である ので、整数のみで計算を行うことができる。 後続ステップで第4A図に従って得られる正規化セグメント・ヒストグラムH seg(i)からセグメント化前のイメージ文書の対応する正規化標準ヒストグ ラムHstd(i)(第3図)を差し引き、示差ヒストグラムHdif(i)に 入力する。第5A図に、第1図のユーロチェックの通貨フィールドと金額フィー ルドを表すセグメント化前のイメージ文 書の、第4A図の正規化セグメント・ヒストグラムHseg(i)と第3図の正 規化標準ヒストグラムHstd(i)から形成した、このような示差ヒストグラ ムHdif(i)を示す。示差ヒストグラムを簡略化するため、負になる値は、 情報の損失なしにゼロに設定することができる。 得られる示差ヒストグラムHdif(i)は、その前のセグメント・ヒストグ ラムHseg(i)と同様に、主最大値である主モード100を示す。これは「 白」に近く、主として背景情報を含み、したがって背景モード100と名付ける 。簡単な場合で、項目の黒化が最大黒化にほぼ対応する場合、示差ヒストグラム Hdif(i)もセグメント・ヒストグラムHseg(i)も純粋に2モードと なり、もう一つだけ主モード110を含み、これは前景情報を含み、したがって 前景モード110と呼ばれる。 第5B図に、一般に多モード・ヒストグラムとして得られるが、正規化セグメ ント・ヒストグラムHseg(i)とセグメント化前のイメージ文書の関連する 正規化標準ヒストグラムHstd(i)とからの2つの主モードしか含まない示 差ヒストグラムHdif(i)を示す。この場合、背景モード100は、「黒」 に近い方にあって前景情報を含む複数の前景モード110、120とコントラス トをなす。したがって、前景モード110、120は、主最大値を含む主前景モ ード110と、1個または複数の副最大値を含む別の前景モード120に分割さ れる。示差ヒストグラムHdif(i) に対するこれらのバージョンは、セグメント・ヒストグラムHseg(i)にも ほぼ同様に適用される。 次に、上記の方法で得られた示差ヒストグラムを現況技術で既知の方法によっ て処理し、閾値を求めることができる。閾値を決定するための本発明による方法 については後述する。関係するモードは前景モードと背景モードであり、前景情 報と背景情報が加法的に重なっているため、背景モード100は、より高い、す なわち印刷技術のグレイ限界より上のグレイ値をもつので、モードを適切に制限 することによって閾値を求めることができる。 閾値決定の第1段階では、得られた示差ヒストグラムHdif(i)から出発 して、「黒」側に向かった背景モード100の「暗色」側面上の最大勾配を決定 する。次に、暗色側面の最大勾配点Pmaxから出発して、暗色側面上の決定され た最大直線勾配をもつ直線と横軸の交点から背景グレイ値の閾値(SWIN)を一 次近似として得る。第6図に、背景グレイ値の閾値SWINの一次近似による決定 を示す。 背景モード100の暗色側面の最大勾配の決定のみから閾値SWINを求めるの は実現可能でないことを理解されたい。2つの主モードの対向する両側面の少な くとも一方の適当な点のあらゆる線形近似が、前景情報と背景情報の分離が行わ れるため、適用例に応じて十分に正確な閾値の一次近似値に供給される。しかし どの点が近似に適しているかは、応用例によって異なる。 閾値SWINの一次近似による決定は、前述のように、背景閾値として十分に正 確な値をもたらし、2つの主モードの面積がほぼ同サイズの場合は特にそうであ る。しかし、主モードの面積が異り、背景モード100の面積が前景モード11 0と120の面積よりずっと大きくなっている場合、背景モード100の最も近 くにある前景モード110または120に背景モード100が部分的に重なり、 その結果、閾値SWINが暗くなりすぎる。すなわち、閾値が「暗色」側に寄りす ぎている結果、一部の情報が失われる可能性がある。閾値SWINのなお十分に正 確な値の限界値として、背景モード100の面積が前景モード110及び120 の面積の2倍よりやや小さい領域の場合があげられる。 閾値を求めるためのより正確な精密な方法を第7図に示す。要するに、第6図 で一次近似で求めた閾値から出発して、背景モード100の暗色側面に、示差ヒ ストグラムHdif(i)の下の全面積に対する背景モード100の面積に対応 した重みを付ける。示差ヒストグラムHdif(i)で示差ヒストグラムHdi f(i)の下の全面積に対する背景モード100の面積で重みを付けた、最大勾 配Pmaxにおける頻度と、一次近似による閾値SWINの点における頻度との差か ら改善された閾値SWmodを算出する。微調整のため、この主モード100と1 10の面積に対応する重み付けに補正係数aとβを加えることもできる。そうす ると、閾値SWmodは次式に従って計算される。 次に上式から導出した頻度値Hdif(SWmod)から、読取りまたは適当な 補間によって閾値SWmodを決定する。背景モード100の面積が比較的大きい 場合、閾値SWmodは「白」の方向にずれる。背景モードの面積が比較的小さい 場合は、「黒」方向への変位は一般には必要でないが、場合によって必要なこと もある。 重み付けの微調整用のパラメータaとβは、最も簡単な場合は1に等しく選択 する。微調整が必要な場合、パラメータaとβの値はたとえば実際の結果と名目 的結果の比較から逆方向に作業することによって推定し、あるいは学習プロセス で決定することができる。そのような学習プロセスでは、入力値としてたとえば 次の値が必要となる。 出発値はHdif(SWmod)である。 こうして求めたHdif(SWmod)の値を次に名目値Hd if(SWnom)と比較し、この比較から重み付けの微調整のためのパラメータ aとβを求める。名目値Hdif(SWnom)は自動読取り手順から生成するこ とが好ましく、その際に、閾値のある範囲について読取りエラー率を決定し、こ れによって最小エラー率で閾値に関する結論に達する。 次に、決定されたデータから、おそらくやはり対話式に学習することにより、 閾値を決定する方法をさらに精巧なものにすることができる。すなわち、閾値を 検索する方法を実施するための装置は、たとえば背景除去後の手書き認識からの 結果を名目的結果と比較し、それによって、閾値決定のためのパラメータを品質 ステートメントによって最適化することが可能になる。重みに影響を与える補正 係数aとβの他に、一次近似による閾値の補間を行う点もここでは変数として使 用することができる。またこの微調整をすべて中立のネットワークで実施して利 益を受けることもできる。 上記の閾値を決定するためのプロセスはまた、前景モード(110)の「明色 」側面(したがって「白」の方向)でも同様に実施できることに留意されたい。 さらに、閾値を決定するための前記手段はすべて、セグメント・ヒストグラム Hseg(i)によっても実施できることを理解されたい。第4a図と第5a図 を比較するとわかるように、この場合、セグメント・ヒストグラムはそれから導 いた示差ヒストグラムと僅かしか異なっていない。ただし、ある応用例の範囲で は、セグメント・ヒストグラムと示差ヒ ストグラムの共同評価が特に説得力のある結果をもたらし、したがって閾値決定 の評価が容易になることが判明している。セグメント・ヒストグラムと示差ヒス トグラムの共同評価とは、両方のヒストグラムからの情報を利用し、それから別 の情報を引き出す任意の形の評価を意味するものとする。上記の例では、両ヒス トグラムの差をとることによって共同評価を行ったが、たとえば標準ヒストグラ ムに(たとえば要素ごとの乗算または除算により)セグメント・ヒストグラムで 重み付けする、平行勾配評価及び重み付けした勾配を形成する、両方のヒストグ ラムで分離点、すなわちヒストグラムがゼロになる点を評価して、前景と背景の 分離が生じるとき、ケースを改善するなど、他の共同評価手段も考えられる。 計算した閾値を使って、次にイメージ文書に対して様々な処理を行うことがで きる。背景除去は、決定された閾値よりも大きなグレイ値をもつイメージ上のす べての点を「白」のグレイ値に設定する、いわゆる「閾値処理」によって実施す ると有利である。さらにデジタル処理を行うため、閾値より小さなグレイ値をも つすべてのイメージ点を「黒」に設定することができる。 さらに、この処理により、すべての(主)モードの各側面ごとに上記の閾値決 定方法を使用して、グレイ値の減少を実施することができる。こうして求めた閾 値は、背景/前景閾値を表すだけでなく、前景情報中の異なる対象の区別が可能 な閾値の範囲をも表す。 多くの応用例では、イメージ点と測定点の数が限られているため、ヒストグラ ムをさらに処理する前にそれらの点を平滑化することを推奨する。第8図に、イ メージ解像度が限られているためにしばしば得られる平滑でないヒストグラムを 示す。平滑化には既知のどんな方法を使用してもよい。本発明の一実施形態では 、ガウス関数で重み付けした隣接点平滑化法を使用する。この方法では、(開始 点を含めて)それぞれガウス関数で重み付けした隣接するいくつかの点の和をと り、その和に対して重みを正規化する。このようにすると、ヒストグラム全体を 平滑化し、比較的小さな副モードを除去することが可能である。ただし、この場 合、ガウス関数以外の関数、たとえば方形関数も重み付けに使用できる。 本発明による閾値検索法により、現代のイメージ処理の諸要件を満たす総合的 な例外的結果を比較的簡単にかつ高速度で得ることができる。 いくつかの走査ユーロチェック・イメージでこのアルゴリズムを検査した。様 々なスキャナ(16及び256グレイ・スケール)を使って様々な解像度(20 0〜300dpi)で電子イメージを生成した。次にこれらのイメージから所望 の領域を選択し、上記の方法を使って白黒イメージに変換した。スキャナ及び解 像度の如何にかかわらず、それらの結果は後続の電子処理(電子式文字認識)に とって満足すべきものであった。 第9図と第10図に、既知のプロセスによって、すなわち 第9図では「線形平均による動的閾値処理」によって、また第10図では「面積 平均による動的閾値処理」によって生成した、第1図のイメージの背景除去の結 果を示す。比較のため、第11図に、本発明の方法による第1図のイメージの背 景除去の結果を示す。 上記の本発明の方法では、関連データも、ダイアグラムをグラフに作成する必 要なく、電子データ処理の意味で直接に処理できることは明らかである。したが って、ここに提案する方法は、自動コンピュータ・プログラムで使用するにも適 している。 本発明によるプロセスは、高度に構造化された背景を含むイメージのグレイ領 域を白と黒のイメージに変換するのに特によく適している。ただし、文書全体( たとえばユーロチェック全体)の完全な処理は必ずしも推奨できない。そこには 、たとえば高度に構造化されていない様々なタイプの背景の領域が含まれるから である。この場合、同じタイプの背景を含む領域内の文書の部分処理を推奨する 。
───────────────────────────────────────────────────── 【要約の続き】

Claims (1)

  1. 【特許請求の範囲】 1.背景情報の上に前景情報が加法的にまたは減法的に重ねられている文書中の 前景情報を背景情報から分離する方法において、 文書を複数のセグメント(80)に分割する第1のステップ(第4b図)と、 各セグメント中の信号強度の少なくとも1つの極値の少なくとも1つの頻度分 布を、実質的に背景情報を含む1つの主モード(背景モード100)を含むよう に決定する第2のステップ(第4a図)とを特徴とする方法。 2.第1ステップで、背景情報の信号強度の少なくとも1つの極値が大部分のセ グメント(80)に少なくとも1回含まれるようにセグメント(80)を選択す ることを特徴とする、請求項1に記載の方法。 3.第1ステップで、複数のセグメント(80)が、専ら背景情報を含むいくつ かのセグメントを含むように、セグメント(80)を選択することを特徴とする 、請求項1または2に記載の方法。 4.第1ステップで、セグメント(80)がそれぞれ類似の構造となるようにセ グメント(80)を選択することを特徴とする、請求項1ないし3のいずれか一 項に記載の方法。 5.文書全体から信号強度の頻度分布(第3図)を決定する第3のステップと、 第2及び第3ステップで導かれた頻度分布の共同評価(第5図)を行う第4の ステップとを特徴とする、請求項1ないし4のいずれか一項に記載の方法。 6.第4ステップで、第2及び第3ステップで決定した頻度分布の重ね合せ、好 ましくは加法的または減法的重ね合せによって共同評価を行うことを特徴とする 、請求項5に記載の方法。 7.決定された頻度分布の少なくとも1つまたは第4ステップに含まれる重ね合 せあるいはその両方を平滑化するステップを特徴とする、請求項1ないし6のい ずれか一項に記載の方法。 8.平滑化ステップで、開始点を含めて、それぞれ平滑化関数で重み付けしたい くつかの隣接点の和を形成し、こうして形成した和を重みの和で正規化すること を特徴とする、請求項7に記載の方法。 9.平滑化関数としてガウス関数または方形関数を使用することを特徴とする、 請求項8に記載の方法。 10.文書がイメージであり、背景情報がサンプルである(第1図)ことを特徴 とする、請求項1ないし9のいずれか一項に記載の方法。 11.前景情報が手書き文字であることを特徴とする、請求項1ないし10のい ずれか一項に記載の方法。 12.背景モード(100)の前景情報に向いた側面から、または 別の主モード(110)の背景モード(100)とは反対側の側面から 文書中の背景情報の信号強度の閾値を誘導する第5のステップを特徴とする、 請求項1ないし11のいずれか一項に記載の方法。 13.閾値を誘導する第5ステップが、2つの主モード(100、110)の少 なくとも1つの側面上の1点の線形近似(第6図)を行うステップを含むことを 特徴とする、請求項12に記載の方法。 14.線形近似ステップを、各ケースで側面勾配が最大の点(Pmax)で行うこ とを特徴とする、請求項13に記載の方法。 15.閾値を誘導する第5ステップが、線形近似によって得た閾値を、主モード で囲まれる領域の閾値で重み付けする(第7図)ステップを含むことを特徴とす る、請求項12ないし14のいずれか一項に記載の方法。 16.閾値を誘導する第5ステップが、決定された頻度分布の少なくとも1つ及 び品質ステートメントによって決まる初期デフォルトから誘導された、学習のた めの初期値を使用する学習ステップを含むことを特徴とする、請求項12ないし 15のいずれか一項に記載の方法。 17.文書中の背景情報を除去するため、閾値を用いて文書の情報を分割する第 6のステップを特徴とする、請求項12ないし16のいずれか一項に記載の方法 。 18.第6ステップで、情報を、閾値より高い信号強度をも つ情報と閾値より低い信号強度をもつ情報とに分離することを特徴とする、請求 項17に記載の方法。 19.本質的に背景情報を含む、第6ステップで分離した情報領域を除去する第 7のステップを特徴とする、請求項17または18に記載の方法。 20.第7ステップにおける電子式グレイ・スケール・イメージの白黒変換の際 に、閾値に対応するグレイ値より明るいグレイ値をもつすべての情報を「白」の グレイ値に設定することを特徴とする、請求項19に記載の方法。 21.閾値に対応するグレイ値より暗いグレイ値をもつ残りすべての情報を「黒 」のグレイ値に設定する(第11図)ことを特徴とする、請求項20に記載の方 法。 22.高度に構造化された背景をもつイメージ文書(第1図及び第11図)の背 景削除への請求項1ないし21のいずれか一項に記載の方法の使用。
JP08519443A 1994-12-20 1995-06-06 文書中の前景情報を背景情報から分離する方法 Expired - Fee Related JP3078844B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE4445386.8 1994-12-20
DE4445386A DE4445386C1 (de) 1994-12-20 1994-12-20 Verfahren und Vorrichtung zur Trennung einer Vordergrundinformation von einer Hintergrundinformation in einer Vorlage
PCT/EP1995/002156 WO1996019778A1 (de) 1994-12-20 1995-06-06 Verfahren zur trennung einer vordergrundinformation von einer hintergrundinformation in einer vorlage

Publications (2)

Publication Number Publication Date
JPH09503329A true JPH09503329A (ja) 1997-03-31
JP3078844B2 JP3078844B2 (ja) 2000-08-21

Family

ID=6536333

Family Applications (1)

Application Number Title Priority Date Filing Date
JP08519443A Expired - Fee Related JP3078844B2 (ja) 1994-12-20 1995-06-06 文書中の前景情報を背景情報から分離する方法

Country Status (4)

Country Link
US (1) US6064762A (ja)
JP (1) JP3078844B2 (ja)
DE (1) DE4445386C1 (ja)
WO (1) WO1996019778A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4732626B2 (ja) * 2001-07-17 2011-07-27 グローリー株式会社 帳票処理方法および装置並びにプログラム

Families Citing this family (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19536170A1 (de) * 1995-09-29 1997-04-03 Ibm Ermittlung von Schwellwerten bei der Digitalisierung von Bildern durch eine Verteilungsanalyse der Informationen
DE10017081A1 (de) * 2000-04-06 2001-10-11 Cgk Comp Ges Konstanz Mbh Verfahren und Vorrichtung zur automatischen Zeichenerkennung
ES2304938T3 (es) * 2000-09-11 2008-11-01 Leica Geosystems Ag Metodo para identificar puntos de medida en un sistema de medida optico.
US20020146171A1 (en) * 2000-10-01 2002-10-10 Applied Science Fiction, Inc. Method, apparatus and system for black segment detection
US6993183B2 (en) * 2001-03-13 2006-01-31 Canon Kabushiki Kaisha Image processing apparatus, image processing system, image processing method, and computer-readable storage medium
GB2375676A (en) 2001-05-17 2002-11-20 Hewlett Packard Co Reducing the effects of specular reflections appearing in an image
JP4003428B2 (ja) * 2001-10-10 2007-11-07 セイコーエプソン株式会社 小切手等処理装置及び小切手等処理方法
US7392472B2 (en) * 2002-04-25 2008-06-24 Microsoft Corporation Layout analysis
US7024039B2 (en) * 2002-04-25 2006-04-04 Microsoft Corporation Block retouching
US7263227B2 (en) * 2002-04-25 2007-08-28 Microsoft Corporation Activity detector
US7120297B2 (en) * 2002-04-25 2006-10-10 Microsoft Corporation Segmented layered image system
US7110596B2 (en) 2002-04-25 2006-09-19 Microsoft Corporation System and method facilitating document image compression utilizing a mask
US7164797B2 (en) * 2002-04-25 2007-01-16 Microsoft Corporation Clustering
US7043079B2 (en) 2002-04-25 2006-05-09 Microsoft Corporation “Don't care” pixel interpolation
EP1450304A1 (en) * 2003-02-21 2004-08-25 City University of Hong Kong Image processing apparatus and method
DE10311700A1 (de) 2003-03-17 2004-10-07 Océ Document Technologies GmbH Verfahren und Einrichtung zum Verarbeiten der Farbinformation einer mit Störzeichen und Nutzzeichen versehenen Vorlage
US20050097046A1 (en) 2003-10-30 2005-05-05 Singfield Joy S. Wireless electronic check deposit scanning and cashing machine with web-based online account cash management computer application system
CN100357957C (zh) * 2004-08-10 2007-12-26 富士通株式会社 用于识别图像中的字符的字符识别装置和字符识别方法
US20060098243A1 (en) * 2004-11-08 2006-05-11 Lexmark International, Inc. Determining a gray background value and/or skew of a scanned document
US20060239555A1 (en) * 2005-04-25 2006-10-26 Destiny Technology Corporation System and method for differentiating pictures and texts
DE102005028669A1 (de) * 2005-06-16 2006-12-28 Walter Hanke Mechanische Werkstätten GmbH & Co. KG Verfahren und Vorrichtung zur Erkennung einer in einen Münzprüfer eingegebenen Münze unter Verwendung ihres Prägebildes
JP4215038B2 (ja) * 2005-09-16 2009-01-28 セイコーエプソン株式会社 画像処理装置、画像処理方法、およびプログラム
US8176414B1 (en) 2005-09-30 2012-05-08 Google Inc. Document division method and system
US7873200B1 (en) 2006-10-31 2011-01-18 United Services Automobile Association (Usaa) Systems and methods for remote deposit of checks
US8708227B1 (en) 2006-10-31 2014-04-29 United Services Automobile Association (Usaa) Systems and methods for remote deposit of checks
US8134762B2 (en) * 2007-01-29 2012-03-13 Sharp Laboratories Of America, Inc. Methods and systems for characterizing regions of substantially-uniform color in a digital image
US10380559B1 (en) 2007-03-15 2019-08-13 United Services Automobile Association (Usaa) Systems and methods for check representment prevention
US20080310721A1 (en) * 2007-06-14 2008-12-18 John Jinhwan Yang Method And Apparatus For Recognizing Characters In A Document Image
US9058512B1 (en) 2007-09-28 2015-06-16 United Services Automobile Association (Usaa) Systems and methods for digital signature detection
US9892454B1 (en) 2007-10-23 2018-02-13 United Services Automobile Association (Usaa) Systems and methods for obtaining an image of a check to be deposited
US9159101B1 (en) 2007-10-23 2015-10-13 United Services Automobile Association (Usaa) Image processing
US10380562B1 (en) 2008-02-07 2019-08-13 United Services Automobile Association (Usaa) Systems and methods for mobile deposit of negotiable instruments
US10504185B1 (en) 2008-09-08 2019-12-10 United Services Automobile Association (Usaa) Systems and methods for live video financial deposit
US8452689B1 (en) 2009-02-18 2013-05-28 United Services Automobile Association (Usaa) Systems and methods of check detection
JP2010205067A (ja) * 2009-03-04 2010-09-16 Fujifilm Corp 領域抽出装置、領域抽出方法及び領域抽出プログラム
US10956728B1 (en) 2009-03-04 2021-03-23 United Services Automobile Association (Usaa) Systems and methods of check processing with background removal
US9779392B1 (en) 2009-08-19 2017-10-03 United Services Automobile Association (Usaa) Apparatuses, methods and systems for a publishing and subscribing platform of depositing negotiable instruments
US8699779B1 (en) 2009-08-28 2014-04-15 United Services Automobile Association (Usaa) Systems and methods for alignment of check during mobile deposit
US9129340B1 (en) 2010-06-08 2015-09-08 United Services Automobile Association (Usaa) Apparatuses, methods and systems for remote deposit capture with enhanced image detection
JP5921154B2 (ja) * 2011-11-09 2016-05-24 日東電工株式会社 光学フィルム、画像表示装置および画像表示装置の製造方法
US10380565B1 (en) 2012-01-05 2019-08-13 United Services Automobile Association (Usaa) System and method for storefront bank deposits
US10552810B1 (en) 2012-12-19 2020-02-04 United Services Automobile Association (Usaa) System and method for remote deposit of financial instruments
US11138578B1 (en) 2013-09-09 2021-10-05 United Services Automobile Association (Usaa) Systems and methods for remote deposit of currency
US9286514B1 (en) 2013-10-17 2016-03-15 United Services Automobile Association (Usaa) Character count determination for a digital image
JP5992567B1 (ja) * 2015-03-20 2016-09-14 株式会社Pfu 日付識別装置
US10402790B1 (en) 2015-05-28 2019-09-03 United Services Automobile Association (Usaa) Composing a focused document image from multiple image captures or portions of multiple image captures
US9710911B2 (en) * 2015-11-30 2017-07-18 Raytheon Company System and method for generating a background reference image from a series of images to facilitate moving object identification
US11030752B1 (en) 2018-04-27 2021-06-08 United Services Automobile Association (Usaa) System, computing device, and method for document detection
US11900755B1 (en) 2020-11-30 2024-02-13 United Services Automobile Association (Usaa) System, computing device, and method for document detection and deposit processing
CN112954138A (zh) * 2021-02-20 2021-06-11 东营市阔海水产科技有限公司 水产经济动物图像采集方法、终端设备及可移动料台

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4731863A (en) * 1986-04-07 1988-03-15 Eastman Kodak Company Digital image processing method employing histogram peak detection
US4856528A (en) * 1987-06-26 1989-08-15 John Hopkins University Tumor volume determination
US4952805A (en) * 1987-08-20 1990-08-28 Fuji Photo Film Co., Ltd. Method of judging the presence or absence of a limited irradiation field, method of selecting a correct irradiation field, and method of judging correctness or incorrectness of an irradiation field
FR2641882B1 (fr) * 1989-01-16 1991-04-19 Electricite De France Procede et dispositif de binarisation d'image a deux dimensions, par comparaison a un seuil
US5280367A (en) * 1991-05-28 1994-01-18 Hewlett-Packard Company Automatic separation of text from background in scanned images of complex documents
DE4138663A1 (de) * 1991-11-25 1993-05-27 Siemens Ag Verfahren zur segmentierung eines zusammenhaengenden gebietes mit diffuser berandung in einem monochromen rasterbild

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4732626B2 (ja) * 2001-07-17 2011-07-27 グローリー株式会社 帳票処理方法および装置並びにプログラム

Also Published As

Publication number Publication date
DE4445386C1 (de) 1996-05-02
US6064762A (en) 2000-05-16
JP3078844B2 (ja) 2000-08-21
WO1996019778A1 (de) 1996-06-27

Similar Documents

Publication Publication Date Title
JPH09503329A (ja) 文書中の前景情報を背景情報から分離する方法
KR100512831B1 (ko) 이미지 처리 방법, 장치 및 프로그램 저장 매체
US7292375B2 (en) Method and apparatus for color image processing, and a computer product
Sauvola et al. Adaptive document binarization
US5583659A (en) Multi-windowing technique for thresholding an image using local image properties
Sauvola et al. Adaptive document image binarization
US20070253040A1 (en) Color scanning to enhance bitonal image
US7746505B2 (en) Image quality improving apparatus and method using detected edges
US8014596B2 (en) Methods and systems for background color extrapolation
US8947736B2 (en) Method for binarizing scanned document images containing gray or light colored text printed with halftone pattern
US7411699B2 (en) Method and apparatus to enhance digital image quality
CN113688838B (zh) 红色笔迹提取方法、***、可读存储介质及计算机设备
US6389164B2 (en) Image segmentation apparatus and method
JP3554033B2 (ja) Ocr方法およびocrシステム
JP2004336282A (ja) 画像処理装置、画像処理プログラム及び該プログラムを記録した記録媒体
US7057767B2 (en) Automatic background removal method and system
Abdullah et al. Novel Adaptive Binarization Method for Degraded Document Images.
CN113421256B (zh) 一种点阵文本行字符投影分割方法及装置
JP3073837B2 (ja) 画像領域分離装置及び画像領域分離方法
JPH08272902A (ja) 異字体異品質文字の認識方法
CN112634229B (zh) 图像去除黑边的方法
JP3989647B2 (ja) 画像処理方法,装置および記録媒体
CN111476243A (zh) 影像文字识别方法及装置
KR100484170B1 (ko) 디지털 화질 개선방법 및 장치
Goyal et al. HYBRID BINARIZTION TECHNIQUE FOR HISTORICAL MANUSCRIPTS

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees