JP3078844B2 - 文書中の前景情報を背景情報から分離する方法 - Google Patents

文書中の前景情報を背景情報から分離する方法

Info

Publication number
JP3078844B2
JP3078844B2 JP08519443A JP51944396A JP3078844B2 JP 3078844 B2 JP3078844 B2 JP 3078844B2 JP 08519443 A JP08519443 A JP 08519443A JP 51944396 A JP51944396 A JP 51944396A JP 3078844 B2 JP3078844 B2 JP 3078844B2
Authority
JP
Japan
Prior art keywords
background
threshold
document
information
frequency distribution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP08519443A
Other languages
English (en)
Other versions
JPH09503329A (ja
Inventor
ヘーネル、ワルター
Original Assignee
インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン filed Critical インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン
Publication of JPH09503329A publication Critical patent/JPH09503329A/ja
Application granted granted Critical
Publication of JP3078844B2 publication Critical patent/JP3078844B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/28Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)

Description

【発明の詳細な説明】 技術分野 本発明は、前景情報が背景情報の上に加法的にまたは
減法的に重なっている文書中で前景情報を背景情報から
分離する方法に関する。この方法は、文書中の背景情報
の信号強度の閾値を決定し、文書中の背景情報を除去
し、あるいはまた電子的グレイ・スケールを白黒に変換
するのに特に適している。
背景技術 電子文書処理を使用する際、データの量の故に、また
後続の処理を簡単にするために、電子的グレイ・スケー
ルを白黒に変換することがしばしば必要となる。その際
に、テキストと数字だけを白黒情報として残し、背景パ
ターンと予め印刷されたドロップアウト色は残さないよ
うにして、読みやすくし、あるいは後続の電子処理が実
施できるようにすべきである。そのためには、情報を含
む前景と、一般に情報は含まないがたとえば安全や設計
上の理由から構造化されている背景とを区別できること
が必要である。前景と背景が区別できる場合、前景情報
を分離するために背景を除去する、すなわち背景を抑制
または消去することが可能になる。
前景情報に後でさらに何らかの処理を加えるには、背
景の構成要素が誤った解釈を招く可能性のある望ましく
ない人工物として前景に流れ込まないようにすることが
特に必要である。
たとえばユーロチェックや身分証明書など安全保護上
の理由で文書が高度に構造化された背景を有する場合に
は、後続の電子処理の諸要件を満たす白黒画像を、現況
技術で知られる背景除去のための方法によって生成でき
ないことがしばしばある。高度に構造化された背景と
は、高コントラストを特徴とし、一般に好ましくは直線
状または類似の模様であり、記入項目と同程度の構造寸
法を有する、背景である。
高度に構造化された背景を含む文書の一例として、第
1図に、グレイ・スケールで表したユーロチェックの通
貨フィールドと金額フィールドを示す。第2図には、第
1図の水平線に沿ったグレイ・スケール分布を示す。こ
の場合、この線は、通貨フィールド及び金額フィールド
の手書き項目と機械印刷項目の間の領域に、これらの項
目を切断しないように置かれていた。高い値(「白」の
方向)は明るいグレイ値を表し、低い値(「黒」の方
向)は暗いグレイ値を表す。通常の256グレイ値を使用
する場合、グレイ値0=黒、グレイ値255=白である。
第2図を見るとわかるように、(フレームではなく)
背景のグレイ値は特定の限界(閾値)まで均一に延び、
たとえばフレーム化の結果としてあるいはイメージの歪
みによるなど僅かな例外を除き、一般にこの限界より低
くなることはない。これは、色飽和が有効に制御でき
る、製造における印刷技術の結果である。このことは一
般には望ましい。そうでないと、人が項目を読み取るの
が難しくなり、読取り不可能となることさえある。第2
図にはっきり見えるように閾値の下で「黒」の方向への
偏位は、外枠及び通貨フィールドと金額フィールドの間
の分割線によって生じたものである。
(手書き及び機械印刷)項目のグレイ値は、最もよく
使われているプリンタの減法的カラー挙動によって生
じ、各ケースでこの閾値より下になるが、ごく僅かだけ
のことがしばしばである。したがって、背景とのコント
ラストは背景内部のコントラストよりもかなり目立たな
い。減法的カラー挙動とは一般に、色素を追加するとス
ペクトルから色成分が除去される、すなわちグレイ値が
全体としてより暗くなるとの意味である。
既知の白黒変換法では、背景閾値、明暗コントラス
ト、あるいは線幅や隣接グレイ値の標準偏差などの判定
基準を使用する。コントラスト法は一般に高度に構造化
された背景を含む文書の上記の適用分野で使用するには
適していない。背景中でのコントラストの変化の方が背
景と項目の間での変化よりも目立つことがあるからであ
る。同様に線幅の評価も適さないことがしばしばであ
る。背景構造は、第1図のユーロチェックの例を見ると
わかるようにしばしば直線状構造をもつからである。
印刷技術の特徴から、閾値法の使用が最適の結果を与
えることになる。閾値法とは、グレイ値を当該の閾値で
限定されるクラスに分割する方法をいう。ただし、閾値
の正確で最適な決定に難点がある。閾値は、可能な最良
の白黒イメージをもたらす様々なアルゴリズムに従っ
て、グレイ値のヒストグラムから計算されることがしば
しばである。文献では、これらの閾値法は「閾値処理
(thresholding)法とも呼ばれる。
既知の方法のレビューが、P.K.サホー(Sahoo)、S.
サルタニ(Soltani)、A.K.C.ウォン(Wong)の論文「A
Survey of Thresholding Techniques」、Computer Vis
ion,Graphics and Image Processing,41,233−260(198
8)に出ている。そこでは、ヒストグラムの形状を変化
させて閾値を決定するヒストグラム変換法と、閾値を計
算するためのアルゴリズムが区別されている。サホー等
で代表される最も重要な方法について、高度に構造化さ
れた背景を含む文書でのその使用に関して以下に簡単に
論じる。
ヒストグラム変換法 サホー等のいう、エッジ演算子を用いてヒストグラム
を改善する方法は、高度に構造化された背景には使用で
きない。この方法は背景のエッジと項目のエッジを区別
できないからである。隣接するグレイ値の標準偏差はヒ
ストグラムの変更にさらに適していない。この場合も項
目だけでなく特に背景が標準偏差の増大をもたらすから
である。
閾値を計算するためのアルゴリズム 既知の「モード・アンド・コンキャビティ」法も同様
に、高度に構造化された背景を含む文書ではうまく使用
できない。高度に構造化された背景はしばしばグレイ値
のヒストグラム中でいくつかのモードとコンキャビティ
を発生し、したがって背景と前景への明白な割振りが不
可能だからである。
「オーツ法」も使用できない。このアルゴリズムは、
クラス間分散を最大にすることによってピクチャ・ポイ
ントをクラスに分割し、それがいくつかのクラスを与え
るか及びそのうちのどれに求める情報が含まれるかは前
もってわからないからである。
既知のエントロピー法では、白黒イメージのデータ内
容が最大になるように閾値を計算しようと試みる。しか
し、背景と項目のデータ内容が区別されないので、高度
に構造化された背景を含む文書の場合、この方法も考慮
に入れることができない。
サホー等の文献の補足で方法について論じられてお
り、下記の文献にも既知の他の方法が出ている。
J.M.ホワイト(White)、G.D.ローラー(Rohrer)「I
mage Thresholding for Optical Character Recognitio
n and other Applications Requiring Character Image
Extraction」、IBM J.Res.Development Vol.27 No.4
(83年7月)に、白黒変換用の2つの方法が記載されて
いる。
1)動的閾値を用いる方法。ただし、これは第6図に示
す結果をもたらす。
2)線幅を評価する方法。ただし、高度に構造化された
背景を含む文書には適さない。
「Greyscale Assist for Machine Recognition of Co
urtesy Amount on Cheques」、IBMテクニカル・ディス
クロージャ・ブルテン、Vol.34 No.5(91年10月)、pp.
374−377には、閾値選択のため解像度の異なる2つのイ
メージを使用する方法を記載している。
N.オーツ、「A Threshold Selection Method from Gr
ey Level Histograms」、IEEE Transactions on System
s,Man and Cybernetics,Vol.SMC−9(1979年1月)、p
p.66−67にはオーツ法が提示されている。
T.クリタ、N.オーツ、N.アブデルマレク(Abdelmale
k)「Maximum Likelihood Thresholding based on Popu
lation Mixture Models」、Pattern Recognition,Vol.2
5 No.10,1231−1240(1992年)では、オーツ法とその応
用法について論じている。
M.A.シド=アハメド(Sid−Ahmed)、「A Hardware S
tructure for the automatic selection of Multi−Lev
el Thresholds in Digital Images」、Pattern Recogni
tion,Vol.25 No.12,1517−1528(1992年)では、オーツ
法をさらに発展させた方法について論じている。
C.K.リー(Lee)、C.H.リ(Li)、「Adaptive Thresh
olding via Gaussian Pyramid」、China 1991,Internat
ional Conference on Circuits and Systems June 199
1,Shenzhen,Chinaでは、エントロピー法をさらに発展さ
せた方法について論じている。
上記の既知のどの方法も、高度に構造化された背景の
問題を満足に解決し、あるいは後続の電子処理の要件を
満たす満足できるイメージを生成することができない。
発明の開示 本発明の目的は、ハーフトーン・ピクチャにおける背
景グレイ・スケールが最大に(最も暗く)なる閾値を計
算することのできる、前景情報を背景情報から分離する
方法を提供することにある。
本発明の目的は、請求の範囲の独立項である第1項に
記載の方法によって達成される。
本発明によれば、第1段階で文書をいくつかのセグメ
ントに分割し、第2段階で各セグメント中の信号強度の
極値の頻度分布(frequency distribution)を決定す
る。こうして決定した頻度分布は、本質的に背景情報を
含む主モード(背景モード)を示す。最初の2段階で前
景と背景の十分な分離が行えない場合は、第3段階で文
書全体の信号強度の頻度分布を実施することができ、第
4段階で、得られた2つの頻度分布を評価することによ
り鋭敏な分離を行うことができる。
文書中の背景情報の信号強度の閾値を決定するため、
第5段階で、前景情報に向かって傾斜した背景情報の側
面から、あるいは背景に隣接する別の主モードの側面か
ら、好ましくは2つの主モードの側面上の点の線形近似
によってこの閾値を導出する。
文書中の背景情報を除去するため、追加の第6段階
で、文書中の情報を閾値より上の信号強度と下の信号強
度に分割し、第7段階で背景領域を表す信号強度を削除
することができる。
本発明による方法をイメージ文書の白黒変換に使用す
る場合は、印刷によって生成した文書の諸特性と、後続
の電子処理の要件を満たす生成された白黒イメージを利
用する。
本発明による方法は、所望の任意の背景を含む文書/
イメージの背景除去に使用できるが、レコーダまたはプ
リンタによって背景から減法的に生成された前景情報を
保持しなければならない。すなわち、背景に前景情報を
重ねることによって得られるグレイ値が、背景文書の元
のグレイ値より暗くなければならない。
本発明による方法の既知の方法に勝る具体的利点は、
高度に構造化された背景を含む、すなわち背景中のコン
トラストの大きな文書の背景が、特に、顕著な直線状ま
たは手書き様の文字を有する場合に、除去されることに
ある。その場合、背景構造の構造寸法が前景情報の手書
きの寸法と同程度である場合に良好な結果が得られる。
本発明による方法は、グレイ・イメージの閾値の「オ
ンライン」決定、すなわち文書が存在する通りの状態で
の閾値の決定に特に適している。一般に、文書のグレイ
値は、たとえば照明の強度の結果、あるいは文書のフェ
ージングの結果として変化する。同様に色飽和及び紙の
状態も文書ごとに変化する。またスキャナの違いから、
たとえばスキャナの感度一般から、あるいは文書のグレ
イ値の測定に直接影響を与えるスペクトルで条件付けら
れた感度を通じて、ある効果が生じる。
本発明を使って得られる背景閾値を使用すると、たと
えば決定された閾値よりも明るいすべてのグレイ値を除
去することにより、後で背景を除去することができ、そ
の後の文書処理、たとえば文字認識を行うことができ
る。
いくつかの適当な閾値を使用することにより、情報の
大きな損失なしにグレイ・スケールの数を減らすことが
できる。その場合、情報の損失の度合は閾値の選択の影
響を受ける。
ただし、本発明の教示は光学式イメージ処理での使用
に限定されるものではなく、背景に前景信号が加法的ま
たは減法的に重なっているすべてのフィールド中で前景
情報を所望の背景から分離するのにも同様に使用でき
る。
図面の簡単な説明 第1図は、グレイ・スケール表示によるユーロチェッ
クの通貨フィールドと金額フィールドを示す図である。
第2図は、第1図の水平線に沿ったグレイ値の分布図
である。
第3図は、第1図に示すイメージのグレイ値の頻度分
布の標準ヒストグラムHstd(i)である。
第4A図は、第1図に示すイメージのグレイ値の頻度分
布のセグメント・ヒストグラムHseg(i)である。
第4B図は、第4A図で選択されたセグメント・サイズと
第1図の部分イメージのセグメント・ラスタ化を示す図
である。
第5A図は、第4A図の標準化セグメント・ヒストグラム
Hseg(i)と第3図の標準化標準ヒストグラムHstd
(i)とから形成した示差ヒストグラムHdif(i)であ
る。
第5B図は、一般に多モード・ヒストグラムの場合と同
様の、ただし主モードを2つしか含まない示差ヒストグ
ラムHdif(i)である。
第6図は、背景グレイ値の閾値SWINの一次近似による
決定を示す図である。
第7図は、閾値を決定するより正確な方法を示す図で
ある。
第8図は、イメージ解像度が限られているためにしば
しば得られる、円滑化前のヒストグラムである。
第9図及び第10図は、既知の現況技術の方法によって
得られる、第1図イメージの背景除去の結果を示す図で
ある。
第11図は、本発明の方法による第1図のイメージの背
景除去の結果を示す図である。
発明を実施するための最良の形態 次に第1図に示したユーロチェックの例を用いて、後
でイメージから背景を除去するための最大(最も暗い)
背景閾値をグレイ値イメージの中で決定するための本発
明による方法を説明する。
第3図に、ユーロチェックの通貨フィールドと金額フ
ィールドの第1図に示したイメージのグレイ値の頻度分
布の標準ヒストグラムHstd(i)を示す。縦軸に示した
頻度Hstd(i)は、グレイ値がiの測定イメージ点の数
である。ここでグレイ値iは横軸上に示してあり、グレ
イ値i=0の「黒」からグレイ値が最大imaxの「白」へ
と延びる。
第3図の領域10は本質的に背景サンプル情報を含み、
ピーク20は主として第1図のフィールド・マージンによ
って生成される。領域10とピーク20の間の領域30には前
景項目の書込み情報が含まれる。ただし、この情報が正
確に局在化されている場合、それはこの標準ヒストグラ
ムHstd(i)からは決定できない。また個々の領域は重
なり合っており、この場合に情報の分離は不可能であ
る。
先にユーロチェックなどの印刷文書について概略を述
べたように、背景は特定のグレイ値、すなわち閾値より
低くならない。これは製造に使用する印刷技術のためで
あり、色飽和(すなわち色のシェード)が一般に非常に
正確に制御でき、かつ読みやすくなるように制御しなけ
ればならない。背景のグレイ値が一般に閾値より低くな
らず、したがって特定のグレイ値より暗くならない結
果、前景が背景情報から分離でき、背景の最小グレイ値
が大幅に上がるように、標準ヒストグラムを別のヒスト
グラムで変更または置き換えるべきである。
第1段階で、処理しようとするイメージ文書を別々の
セグメントに分割する。それらのセグメントは面積がほ
ぼ等しいが、この処理は後のデータ処理を簡単にするた
めのものにすぎず、この方法にとって本質的ではない。
分割の際に、予想閾値がいくつかのセグメント中に少な
くとも1回含まれるように注意する。さらに、「項目を
含まない」セグメント、すなわち背景情報のみを含み、
項目からの前景情報を欠くセグメントが存在すべきであ
る。本質的に均一に構造化された背景パターンでは、セ
グメント・サイズは背景のサンプル・サイズから簡単な
推定によって決定できるので有利である。
大きすぎるセグメント・サイズを選択した場合、後述
のように閾値の推定に使用できる情報が少なすぎること
がある。「項目を含まない」セグメントが得られない場
合は、セグメント面積が大きくなりすぎるので特にそう
である。ただし、セグメント面積が小さすぎる場合、状
況によってはセグメント化前の初期イメージに比べて得
られる意味のあるデータが少なくなりすぎる。
各セグメントごとに、最も暗いグレイ値(最小値)を
決定し、新しいセグメント・ヒストグラムHseg(i)に
入力する。これは最小値ヒストグラムとも呼ばれる。標
準ヒストグラムHstd(i)に対応して、グレイ値iのセ
グメント・ヒストグラム中の決定されたセグメントの頻
度Hseg(i)を横軸の各グレイ値ごとに縦軸に入力す
る。同様に、グレイ値iはグレイ値i=0の「黒」から
グレイ値が最大imaxの「白」へと延びる。第4A図に、第
1図に示したユーロチェックの通貨フィールドと金額フ
ィールドのイメージに対する選択されたセグメントのグ
レイ値の頻度分布のこうしたセグメント化ヒストグラム
Hseg(i)を示す。これに対して選択されたセグメント
のセグメント・サイズを、第1図の部分イメージのセグ
メント・ラスタ化と共に第4B図に示す。第4B図に示した
セグメント・サイズは一例にすぎないが、後の処理にと
って有利であることが証明されている。
最小値が決定された領域(セグメント)は、予想閾値
がその中で見つかるよう十分に大きく選ぶべきである。
ユーロチェック(第1図)の場合のように最小値が規則
的に現れる場合は、非常に小さな面積でもこの条件が満
たされることになる。ただし、セグメントの面積の大き
な変動やセグメントの重なりがある場合でも、セグメン
ト・ヒストグラムHseg(i)はほとんど変わらないこと
が確定されている。一般にセグメントとしては、表面の
限られた切片を使用でき、これは部分的に重なり合って
いてもよい。その例として、異なるサイズの方形領域だ
けでなく線形領域も挙げることができる。ほんの少数の
グレイ・スケール(たとえば16)を含むハーフトーン・
イメージや非常にフェージングの強いイメージの場合、
処理前に低域フィルタの使用を推奨する。
得られたセグメント・ヒストグラムHseg(i)(第4A
図)及び対応する標準ヒストグラムHstd(i)(第3
図)をさらに処理する前に正規化する。の目的には既知
のどの正規化法を使用してもよい。しかし、両方のヒス
トグラムを、セグメント中の測定点(イメージ画素)の
数に対して正規化すると有利である。その後、グレイ値
iのすべての測定値の和(頻度H(i))にセグメント
当りの測定点の数を乗じた積として正規化頻度Hnorm
(i)が得られる。
Hnorm(i)=(セグメント当りの測定点)
(i) 標準ヒストグラムHstd(i)では、セグメント化され
ていないため、1セグメント中の測定点(イメージ画
素)の数は1に等しい。どちらのヒストグラムの場合
も、この正規化の結果、すべての頻度の和は同じ値にな
る。この正規化の利点は、主としてヒストグラム構築の
際に対応する値の処理に(セグメント当りの測定点の和
は大抵は知られている)乗算しか必要でなく、除算は不
要である点にある。頻度H(i)及びセグメント当りの
測定点の数は各ケースで整数であるので、整数のみで計
算を行うことができる。
後続ステップで第4A図に従って得られる正規化セグメ
ント・ヒストグラムHseg(i)からセグメント化前のイ
メージ文書の対応する正規化標準ヒストグラムHstd
(i)(第3図)を差し引き、示差ヒストグラムHdif
(i)に入力する。第5A図に、第1のユーロチェックの
通貨フィールドと金額フィールドを表すセグメント化前
のイメージ文書の、第4A図の正規化セグメント・ヒスト
グラムHseg(i)と第3図の正規化標準ヒストグラムHs
td(i)から形成した、このような示差ヒストグラムHd
if(i)を示す。示差ヒストグラムを簡略化するため、
負になる値は、情報の損失なしにゼロに設定することが
できる。
得られる示差ヒストグラムHdif(i)は、その前とセ
グメント・ヒストグラムHseg(i)と同様に、主最大値
である主モード100を示す。これは「白」に近く、主と
して背景情報を含み、したがって背景モード100と名付
ける。簡単な場合で、項目の黒化が最大黒化にほぼ対応
する場合、示差ヒストグラムHdif(i)もセグメント・
ヒストグラムHseg(i)も純粋に2モードとなり、もう
一つだけ主モード110を含み、これは前景情報を含み、
したがって前景モード110と呼ばれる。
第5B図に、一般に多モード・ヒストグラムとして得ら
れるが、正規化セグメント・ヒストグラムHseg(i)と
セグメント化前のイメージ文書の関連する正規化標準ヒ
ストグラムHstd(i)とからの2つの主モードしか含ま
ない示差ヒストグラムHdif(i)を示す。この場合、背
景モード100は、「黒」に近い方にあって前景情報を含
む複数の前景モード110、120とコントラストをなす。し
たがって、前景モード110、120は、主最大値を含む主前
景モード110と、1個または複数の副最大値を含む別の
前景モード120に分割される。示差ヒストグラムHdif
(i)に対するこれらのバージョンは、セグメント・ヒ
ストグラムHseg(i)にもほぼ同様に適用される。
次に、上記の方法で得られた示差ヒストグラムを現況
技術で既知の方法によって処理し、閾値を求めることが
できる。閾値を決定するための本発明による方法につい
ては後述する。関係するモードは前景モードと背景モー
ドであり、前景情報と背景情報が加法的に重なっている
ため、背景モード100は、より高い、すなわち印刷技術
のグレイ限界より上のグレイ値をもつので、モードを適
切に制限することによって閾値を求めることができる。
閾値決定の第1段階では、得られた示差ヒストグラム
Hdif(i)から出発して、「黒」側に向かった背景モー
ド100の「暗色」側面上の最大勾配を決定する。次に、
暗色側面の最大勾配点Pmaxから出発して、暗色側面上の
決定された最大直線勾配をもつ直線と横軸の交点から背
景グレイ値の閾値(SWIN)を一次近似として得る。第6
図に、背景グレイ値の閾値SWINの一次近似による決定を
示す。
背景モード100の暗色側面の最大勾配の決定のみから
閾値SWINを求めるのは実現可能でないことを理解された
い。2つの主モードの対向する両側面の少なくとも一方
の適当な点のあらゆる線形近似が、前景情報と背景情報
の分離が行われるため、適用例に応じて十分に正確な閾
値の一次近似値に供給される。しかしどの点が近似に適
しているかは、応用例によって異なる。
閾値SWINの一次近似による決定は、前述のように、背
景閾値として十分に正確な値をもたらし、2つの主モー
ドの面積がほぼ同サイズの場合は特にそうである。しか
し、主モードの面積が異り、背景モード100の面積が前
景モード110と120の面積よりずっと大きくなっている場
合、背景モード100の最も近くにある前景モード110また
は120に背景モード100が部分的に重なり、その結果、閾
値SWINが暗くなりすぎる。すなわち、閾値が「暗色」側
に寄りすぎている結果、一部の情報が失われる可能性が
ある。閾値SWINのなお十分に正確な値の限界値として、
背景モード100の面積が前景モード110及び120の面積の
2倍よりやや小さい領域の場合があげられる。
閾値を求めるためのより正確な精密な方法を第7図に
示す。要するに、第6図で一次近似で求めた閾値から出
発して、背景モード100の暗色側面に、示差ヒストグラ
ムHdif(i)の下の全面積に対する背景モード100の面
積に対応した重みを付ける。示差ヒストグラムHdif
(i)で示差ヒストグラムHdif(i)の下の全面積に対
する背景モード100の面積で重みを付けた、最大勾配P
maxにおける頻度と、一次近似による閾値SWINの点にお
ける頻度との差から改善された閾値SWmodを算出する。
微調整のため、この主モード100と110の面積に対応する
重み付けに補正係数aとβを加えることもできる。そう
すると、閾値SWmodは次式に従って計算される。
次に上式から導出した頻度値Hdif(SWmod)から、読
取りまたは適当な補間によって閾値SWmodを決定する。
背景モード100の面積が比較的大きい場合、閾値SWmod
「白」の方向にずれる。背景モードの面積が比較的小さ
い場合は、「黒」方向への変位は一般には必要でない
が、場合によって必要なこともある。
重み付けの微調整用のパラメータaとβは、最も簡単
な場合は1に等しく選択する。微調整が必要な場合、パ
ラメータaとβの値はたとえば実際の結果と名目的結果
の比較から逆方向に作業することによって推定し、ある
いは学習プロセスで決定することができる。そのような
学習プロセスでは、入力値としてたとえば次の値が必要
となる。
SWIN Pmax Hdif(Pmax) Hdif(SWIN) 出発値はHdif(SWmod)である。
こうして求めたHdif(SWmod)の値を次に名目値Hdif
(SWnom)と比較し、この比較から重み付けの微調整の
ためのパラメータaとβを求める。名目値Hdif(S
Wnom)は自動読取り手順から生成することが好ましく、
その際に、閾値のある範囲について読取りエラー率を決
定し、これによって最小エラー率で閾値に関する結論に
達する。
次に、決定されたデータから、おそらくやはり対話式
に学習することにより、閾値を決定する方法をさらに精
巧なものにすることができる。すなわち、閾値を検索す
る方法を実施するための装置は、たとえば背景除去後の
手書き認識からの結果を名目的結果と比較し、それによ
って、閾値決定のためのパラメータを品質ステートメン
トによって最適化することが可能になる。重みに影響を
与える補正係数aとβの他に、一次近似による閾値の補
間を行う点もここでは変数として使用することができ
る。またこの微調整をすべて中立のネットワークで実施
して利益を受けることもできる。
上記の閾値を決定するためのプロセスはまた、前景モ
ード(110)の「明色」側面(したがって「白」の方
向)でも同様に実施できることに留意されたい。
さらに、閾値を決定するための前記手段はすべて、セ
グメント・ヒストグラムHseg(i)によっても実施でき
ることを理解されたい。第4a図と第5a図を比較するとわ
かるように、この場合、セグメント・ヒストグラムはそ
れから導いた示差ヒストグラムと僅かしか異なっていな
い。ただし、ある応用例の範囲では、セグメント・ヒス
トグラムと示差ヒストグラムの共同評価が特に説得力の
ある結果をもたらし、したがって閾値決定の評価が容易
になることが判明している。セグメント・ヒストグラム
と示差ヒストグラムの共同評価とは、両方のヒストグラ
ムからの情報を利用し、それから別の情報を引き出す任
意の形の評価を意味するものとする。上記の例では、両
ヒストグラムの差をとることによって共同評価を行った
が、たとえば標準ヒストグラムに(たとえば要素ごとの
乗算または除算により)セグメント・ヒストグラムで重
み付けする、平行勾配評価及び重み付けした勾配を形成
する、両方のヒストグラムで分離点、すなわちヒストグ
ラムがゼロになる点を評価して、前景と背景の分離が生
じるとき、ケースを改善するなど、他の共同評価手段も
考えられる。
計算した閾値を使って、次にイメージ文書に対して様
々な処理を行うことができる。背景除去は、決定された
閾値よりも大きなグレイ値をもつイメージ上のすべての
点を「白」のグレイ値に設定する、いわゆる「閾値処
理」によって実施すると有利である。さらにデジタル処
理を行うため、閾値より小さなグレイ値をもつすべての
イメージ点を「黒」に設定することができる。
さらに、この処理により、すべての(主)モードの各
側面ごとに上記の閾値決定方法を使用して、グレイ値の
減少を実施することができる。こうして求めた閾値は、
背景/前景閾値を表すだけでなく、前景情報中の異なる
対象の区別が可能な閾値の範囲をも表す。
多くの応用例では、イメージ点と測定点の数が限られ
ているため、ヒストグラムをさらに処理する前にそれら
の点を平滑化することを推奨する。第8図に、イメージ
解像度が限られているためにしばしば得られる平滑でな
いヒストグラムを示す。平滑化には既知のどんな方法を
使用してもよい。本発明の一実施形態では、ガウス関数
で重み付けした隣接点平滑化法を使用する。この方法で
は、(開始点を含めて)それぞれガウス関数で重み付け
した隣接するいくつかの点の和をとり、その和に対して
重みを正規化する。このようにすると、ヒストグラム全
体を平滑化し、比較的小さな副モードを除去することが
可能である。ただし、この場合、ガウス関数以下の関
数、たとえば方形関数も重み付けに使用できる。
本発明による閾値検索法により、現代のイメージ処理
の諸要件を満たす総合的な例外的結果を比較的簡単にか
つ高速度で得ることができる。
いくつかの走査ユーロチェック・イメージでこのアル
ゴリズムを検査した。様々なスキャナ(16及び256グレ
イ・スケール)を使って様々な解像度(200〜300dpi)
で電子イメージを生成した。次にこれらのイメージから
所望の領域を選択し、上記の方法を使って白黒イメージ
に変換した。スキャナ及び解像度の如何にかかわらず、
それらの結果は後続の電子処理(電子式文字認識)にと
って満足すべきものであった。
第9図と第10図に、既知のプロセスによって、すなわ
ち第9図では「線形平均による動的閾値処理」によっ
て、また第10図では「面積平均による動的閾値処理」に
よって生成した、第1図のイメージの背景除去の結果を
示す。比較のため、第11図に、本発明の方法による第1
図のイメージの背景除去の結果を示す。
上記の本発明の方法では、関連データも、ダイアグラ
ムをグラフに作成する必要なく、電子データ処理の意味
で直接に処理できることは明らかである。したがって、
ここに提案する方法は、自動コンピュータ・プログラム
で使用するにも適している。
本発明によるプロセスは、高度に構造化された背景を
含むイメージのグレイ領域を白と黒のイメージに変換す
るのに特によく適している。ただし、文書全体(たとえ
ばユーロチェック全体)の完全な処理は必ずしも推奨で
きない。そこには、たとえば高度に構造化されていない
様々なタイプの背景の領域が含まれるからである。この
場合、同じタイプの背景を含む領域内の文書の部分処理
を推奨する。
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭59−54375(JP,A) 特開 昭61−208387(JP,A) 特開 平5−197802(JP,A) 特開 平8−235355(JP,A) 米国特許5280367(US,A) 米国特許4856528(US,A) (58)調査した分野(Int.Cl.7,DB名) G06T 7/00 JICSTファイル(JOIS)

Claims (9)

    (57)【特許請求の範囲】
  1. 【請求項1】背景画素情報の上に前景画素情報が加法的
    にまたは減法的に重ねられている文書中の前景画素情報
    を背景画素情報から分離する方法において、 前記文書を複数のセグメントに分割するステップと、 各セグメントにおける画素の内最も低い信号強度の最小
    強度画素を1つ決定し、前記複数のセグメントにわたっ
    てかかる最小強度画素の頻度分布を画素信号強度別に決
    定するステップと、 前記頻度分布から前記背景画素情報の信号強度の最小値
    の分布の所在を決定するステップと、 前記所在を決定された信号強度の最小値の分布から分離
    のための閾値を決定するステップと、 前記閾値以上の大きさの信号強度の画素を前記文書にお
    いて最大強度値の画素に置き換えるステップと、 を含むことを特徴とする方法。
  2. 【請求項2】背景画素情報の上に前景画素情報が加法的
    にまたは減法的に重ねられている文書中の前景画素情報
    を背景画素情報から分離する方法において、 前記文書のすべての画素の信号強度の頻度分布を画素信
    号強度別に決定するステップと、 前記文書を複数のセグメントに分割するステップと、 各セグメントにおける画素の内最も低い信号強度の最小
    強度画素を1つ決定し、前記複数のセグメントにわたっ
    てかかる最小強度画素の頻度分布を画素信号強度別に決
    定するステップと、 前記最小強度値の頻度分布の画素数を前記文書のすべて
    の画素数と同数になるように正規化するステップと、 前記文書のすべての画素の信号強度の頻度分布および前
    記各セグメント中の信号強度の最小値の頻度分布から両
    者の合成である頻度分布を決定するステップと、 前記合成である頻度分布から前記背景画素情報の信号強
    度の最小値の分布の所在を決定するステップと、 前記所在を決定された信号強度の最小値の分布から分離
    のための閾値を決定するステップと、 前記閾値以上の大きさの信号強度の画素を前記文書にお
    いて最大強度値の画素に置き換えるステップと、 を含むことを特徴とする方法。
  3. 【請求項3】前記文書を複数のセグメントに分割するス
    テップで、複数のセグメントが、専ら背景情報を含むい
    くつかのセグメントを含むように、セグメントを選択す
    ることを特徴とする、請求項1または2に記載の方法。
  4. 【請求項4】前記合成は前記文書のすべての画素の信号
    強度の頻度分布および前記各セグメント中の信号強度の
    最小値の頻度分布の加法的または減法的重ね合せである
    ことを特徴とする、請求項2に記載の方法。
  5. 【請求項5】決定された頻度分布および合成された頻度
    分布の少なくとも1つを平滑化関数で平滑化するステッ
    プを含むことを特徴とする、請求項1ないし4のいずれ
    か一項に記載の方法。
  6. 【請求項6】前景情報が手書き文字であることを特徴と
    する、請求項1ないし5のいずれか一項に記載の方法。
  7. 【請求項7】前記閾値を決定するステップは、各セグメ
    ント中の画素の信号強度の最小値の頻度分布または前記
    合成された頻度分布において、背景モード(100)の前
    景情報に向いた側面から、または主モード(110)の背
    景モード(100)に向いた側の側面から文書中の背景情
    報の信号強度の閾値を誘導するステップを含むことを特
    徴とする、請求項1ないし6のいずれか一項に記載の方
    法。
  8. 【請求項8】閾値を誘導するステップが、2つの主モー
    ド(100、110)の少なくとも1つの側面上の1点の線形
    近似を行うステップを含むことを特徴とする、請求項7
    に記載の方法。
  9. 【請求項9】閾値を誘導するステップが、線形近似によ
    って得た閾値を、2つの主モードで囲まれる領域の閾値
    で重み付けするステップを含むことを特徴とする、請求
    項8に記載の方法。
JP08519443A 1994-12-20 1995-06-06 文書中の前景情報を背景情報から分離する方法 Expired - Fee Related JP3078844B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE4445386.8 1994-12-20
DE4445386A DE4445386C1 (de) 1994-12-20 1994-12-20 Verfahren und Vorrichtung zur Trennung einer Vordergrundinformation von einer Hintergrundinformation in einer Vorlage
PCT/EP1995/002156 WO1996019778A1 (de) 1994-12-20 1995-06-06 Verfahren zur trennung einer vordergrundinformation von einer hintergrundinformation in einer vorlage

Publications (2)

Publication Number Publication Date
JPH09503329A JPH09503329A (ja) 1997-03-31
JP3078844B2 true JP3078844B2 (ja) 2000-08-21

Family

ID=6536333

Family Applications (1)

Application Number Title Priority Date Filing Date
JP08519443A Expired - Fee Related JP3078844B2 (ja) 1994-12-20 1995-06-06 文書中の前景情報を背景情報から分離する方法

Country Status (4)

Country Link
US (1) US6064762A (ja)
JP (1) JP3078844B2 (ja)
DE (1) DE4445386C1 (ja)
WO (1) WO1996019778A1 (ja)

Families Citing this family (51)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19536170A1 (de) * 1995-09-29 1997-04-03 Ibm Ermittlung von Schwellwerten bei der Digitalisierung von Bildern durch eine Verteilungsanalyse der Informationen
DE10017081A1 (de) * 2000-04-06 2001-10-11 Cgk Comp Ges Konstanz Mbh Verfahren und Vorrichtung zur automatischen Zeichenerkennung
EP1186860B1 (en) * 2000-09-11 2008-04-09 Leica Geosystems AG Method for identifying measuring points in an optical measuring system
US20020146171A1 (en) * 2000-10-01 2002-10-10 Applied Science Fiction, Inc. Method, apparatus and system for black segment detection
US6993183B2 (en) * 2001-03-13 2006-01-31 Canon Kabushiki Kaisha Image processing apparatus, image processing system, image processing method, and computer-readable storage medium
GB2375676A (en) 2001-05-17 2002-11-20 Hewlett Packard Co Reducing the effects of specular reflections appearing in an image
JP4732626B2 (ja) * 2001-07-17 2011-07-27 グローリー株式会社 帳票処理方法および装置並びにプログラム
JP4003428B2 (ja) * 2001-10-10 2007-11-07 セイコーエプソン株式会社 小切手等処理装置及び小切手等処理方法
US7024039B2 (en) * 2002-04-25 2006-04-04 Microsoft Corporation Block retouching
US7392472B2 (en) * 2002-04-25 2008-06-24 Microsoft Corporation Layout analysis
US7110596B2 (en) * 2002-04-25 2006-09-19 Microsoft Corporation System and method facilitating document image compression utilizing a mask
US7120297B2 (en) * 2002-04-25 2006-10-10 Microsoft Corporation Segmented layered image system
US7263227B2 (en) * 2002-04-25 2007-08-28 Microsoft Corporation Activity detector
US7164797B2 (en) * 2002-04-25 2007-01-16 Microsoft Corporation Clustering
US7043079B2 (en) 2002-04-25 2006-05-09 Microsoft Corporation “Don't care” pixel interpolation
EP1450304A1 (en) * 2003-02-21 2004-08-25 City University of Hong Kong Image processing apparatus and method
DE10311700A1 (de) 2003-03-17 2004-10-07 Océ Document Technologies GmbH Verfahren und Einrichtung zum Verarbeiten der Farbinformation einer mit Störzeichen und Nutzzeichen versehenen Vorlage
US20050097046A1 (en) 2003-10-30 2005-05-05 Singfield Joy S. Wireless electronic check deposit scanning and cashing machine with web-based online account cash management computer application system
CN100357957C (zh) * 2004-08-10 2007-12-26 富士通株式会社 用于识别图像中的字符的字符识别装置和字符识别方法
US20060098243A1 (en) * 2004-11-08 2006-05-11 Lexmark International, Inc. Determining a gray background value and/or skew of a scanned document
US20060239555A1 (en) * 2005-04-25 2006-10-26 Destiny Technology Corporation System and method for differentiating pictures and texts
DE102005028669A1 (de) 2005-06-16 2006-12-28 Walter Hanke Mechanische Werkstätten GmbH & Co. KG Verfahren und Vorrichtung zur Erkennung einer in einen Münzprüfer eingegebenen Münze unter Verwendung ihres Prägebildes
JP4215038B2 (ja) 2005-09-16 2009-01-28 セイコーエプソン株式会社 画像処理装置、画像処理方法、およびプログラム
US8176414B1 (en) 2005-09-30 2012-05-08 Google Inc. Document division method and system
US8708227B1 (en) 2006-10-31 2014-04-29 United Services Automobile Association (Usaa) Systems and methods for remote deposit of checks
US7873200B1 (en) 2006-10-31 2011-01-18 United Services Automobile Association (Usaa) Systems and methods for remote deposit of checks
US8134762B2 (en) * 2007-01-29 2012-03-13 Sharp Laboratories Of America, Inc. Methods and systems for characterizing regions of substantially-uniform color in a digital image
US10380559B1 (en) 2007-03-15 2019-08-13 United Services Automobile Association (Usaa) Systems and methods for check representment prevention
US20080310721A1 (en) * 2007-06-14 2008-12-18 John Jinhwan Yang Method And Apparatus For Recognizing Characters In A Document Image
US9058512B1 (en) 2007-09-28 2015-06-16 United Services Automobile Association (Usaa) Systems and methods for digital signature detection
US9159101B1 (en) 2007-10-23 2015-10-13 United Services Automobile Association (Usaa) Image processing
US9892454B1 (en) 2007-10-23 2018-02-13 United Services Automobile Association (Usaa) Systems and methods for obtaining an image of a check to be deposited
US10380562B1 (en) 2008-02-07 2019-08-13 United Services Automobile Association (Usaa) Systems and methods for mobile deposit of negotiable instruments
US10504185B1 (en) 2008-09-08 2019-12-10 United Services Automobile Association (Usaa) Systems and methods for live video financial deposit
US8452689B1 (en) 2009-02-18 2013-05-28 United Services Automobile Association (Usaa) Systems and methods of check detection
US10956728B1 (en) 2009-03-04 2021-03-23 United Services Automobile Association (Usaa) Systems and methods of check processing with background removal
JP2010205067A (ja) * 2009-03-04 2010-09-16 Fujifilm Corp 領域抽出装置、領域抽出方法及び領域抽出プログラム
US9779392B1 (en) 2009-08-19 2017-10-03 United Services Automobile Association (Usaa) Apparatuses, methods and systems for a publishing and subscribing platform of depositing negotiable instruments
US8699779B1 (en) 2009-08-28 2014-04-15 United Services Automobile Association (Usaa) Systems and methods for alignment of check during mobile deposit
US9129340B1 (en) 2010-06-08 2015-09-08 United Services Automobile Association (Usaa) Apparatuses, methods and systems for remote deposit capture with enhanced image detection
JP5921154B2 (ja) * 2011-11-09 2016-05-24 日東電工株式会社 光学フィルム、画像表示装置および画像表示装置の製造方法
US10380565B1 (en) 2012-01-05 2019-08-13 United Services Automobile Association (Usaa) System and method for storefront bank deposits
US10552810B1 (en) 2012-12-19 2020-02-04 United Services Automobile Association (Usaa) System and method for remote deposit of financial instruments
US11138578B1 (en) 2013-09-09 2021-10-05 United Services Automobile Association (Usaa) Systems and methods for remote deposit of currency
US9286514B1 (en) 2013-10-17 2016-03-15 United Services Automobile Association (Usaa) Character count determination for a digital image
JP5992567B1 (ja) * 2015-03-20 2016-09-14 株式会社Pfu 日付識別装置
US10402790B1 (en) 2015-05-28 2019-09-03 United Services Automobile Association (Usaa) Composing a focused document image from multiple image captures or portions of multiple image captures
US9710911B2 (en) * 2015-11-30 2017-07-18 Raytheon Company System and method for generating a background reference image from a series of images to facilitate moving object identification
US11030752B1 (en) 2018-04-27 2021-06-08 United Services Automobile Association (Usaa) System, computing device, and method for document detection
US11900755B1 (en) 2020-11-30 2024-02-13 United Services Automobile Association (Usaa) System, computing device, and method for document detection and deposit processing
CN112954138A (zh) * 2021-02-20 2021-06-11 东营市阔海水产科技有限公司 水产经济动物图像采集方法、终端设备及可移动料台

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4731863A (en) * 1986-04-07 1988-03-15 Eastman Kodak Company Digital image processing method employing histogram peak detection
US4856528A (en) * 1987-06-26 1989-08-15 John Hopkins University Tumor volume determination
US4952805A (en) * 1987-08-20 1990-08-28 Fuji Photo Film Co., Ltd. Method of judging the presence or absence of a limited irradiation field, method of selecting a correct irradiation field, and method of judging correctness or incorrectness of an irradiation field
FR2641882B1 (fr) * 1989-01-16 1991-04-19 Electricite De France Procede et dispositif de binarisation d'image a deux dimensions, par comparaison a un seuil
US5280367A (en) * 1991-05-28 1994-01-18 Hewlett-Packard Company Automatic separation of text from background in scanned images of complex documents
DE4138663A1 (de) * 1991-11-25 1993-05-27 Siemens Ag Verfahren zur segmentierung eines zusammenhaengenden gebietes mit diffuser berandung in einem monochromen rasterbild

Also Published As

Publication number Publication date
JPH09503329A (ja) 1997-03-31
US6064762A (en) 2000-05-16
WO1996019778A1 (de) 1996-06-27
DE4445386C1 (de) 1996-05-02

Similar Documents

Publication Publication Date Title
JP3078844B2 (ja) 文書中の前景情報を背景情報から分離する方法
US7292375B2 (en) Method and apparatus for color image processing, and a computer product
US7054485B2 (en) Image processing method, apparatus and system
JP4423298B2 (ja) デジタル画像におけるテキスト状エッジの強調
US7346211B2 (en) Image type classification using color discreteness features
US7411699B2 (en) Method and apparatus to enhance digital image quality
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
US7428331B2 (en) Page background estimation using color, texture and edge features
US20070253040A1 (en) Color scanning to enhance bitonal image
US20050249430A1 (en) Image quality improving apparatus and method
US6721458B1 (en) Artifact reduction using adaptive nonlinear filters
US20030128396A1 (en) Image type classification using edge features
JP2002185800A (ja) 適合画像強調フィルター及び強調画像データの生成方法
CN113688838B (zh) 红色笔迹提取方法、***、可读存储介质及计算机设备
JP2004336282A (ja) 画像処理装置、画像処理プログラム及び該プログラムを記録した記録媒体
US6985629B2 (en) Image processing method, relative density detecting method and image processing apparatus
JP4795737B2 (ja) 顔検出方法および装置並びにプログラム
Boiangiu et al. Methods of bitonal image conversion for modern and classic documents
JP3989647B2 (ja) 画像処理方法,装置および記録媒体
JP4324532B2 (ja) 画像処理装置および記憶媒体
JP2007011935A (ja) 顔判別方法および装置並びにプログラム
CN115908114A (zh) 黑白漫画风格的二值化图片转化方法、装置、设备和介质
JP2000040153A (ja) 画像処理方法、画像処理プログラムを記録した媒体及び画像処理装置
JP4005243B2 (ja) 画像処理装置
Nakamura et al. Extraction of photographic area from document images

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees