JP4237441B2 - ドキュメントエッジ検出方法 - Google Patents

ドキュメントエッジ検出方法 Download PDF

Info

Publication number
JP4237441B2
JP4237441B2 JP2002020809A JP2002020809A JP4237441B2 JP 4237441 B2 JP4237441 B2 JP 4237441B2 JP 2002020809 A JP2002020809 A JP 2002020809A JP 2002020809 A JP2002020809 A JP 2002020809A JP 4237441 B2 JP4237441 B2 JP 4237441B2
Authority
JP
Japan
Prior art keywords
edge
document
column
image data
detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002020809A
Other languages
English (en)
Other versions
JP2002251606A (ja
Inventor
エル.ファレル バーバラ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xerox Corp
Original Assignee
Xerox Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xerox Corp filed Critical Xerox Corp
Publication of JP2002251606A publication Critical patent/JP2002251606A/ja
Application granted granted Critical
Publication of JP4237441B2 publication Critical patent/JP4237441B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00681Detecting the presence, position or size of a sheet or correcting its position before scanning
    • H04N1/00684Object of the detection
    • H04N1/00702Position
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00681Detecting the presence, position or size of a sheet or correcting its position before scanning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00681Detecting the presence, position or size of a sheet or correcting its position before scanning
    • H04N1/00684Object of the detection
    • H04N1/00708Size or dimensions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00681Detecting the presence, position or size of a sheet or correcting its position before scanning
    • H04N1/00684Object of the detection
    • H04N1/00718Skew
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00681Detecting the presence, position or size of a sheet or correcting its position before scanning
    • H04N1/00729Detection means
    • H04N1/00734Optical detectors
    • H04N1/00737Optical detectors using the scanning elements as detectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00681Detecting the presence, position or size of a sheet or correcting its position before scanning
    • H04N1/00742Detection methods
    • H04N1/00745Detecting the leading or trailing ends of a moving sheet

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Facsimile Scanning Arrangements (AREA)
  • Image Input (AREA)
  • Image Analysis (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、ドキュメント走査装置に係り、詳細には、走査システムによって走査される、ドキュメントのエッジを自動的に検出するシステム及び方法に関する。
【0002】
【従来の技術】
例えば、ドキュメントを電子入力走査することで形成したビデオ画像データからドキュメントのコピーを複製する場合、ドキュメントの外側エッジの決定に依存する機能を提供することが望ましい場合がある。そのような機能(feature)として、例えば走査システムにおけるドキュメントの自動位置決め、電子画像の電子位置合わせ及びスキュー除去(deskewing)が挙げられる。
【0003】
ドキュメントの位置を決定する1つの方法では、ユーザは、ドキュメントを実際に走査する前に、ドキュメントのサイズを手作業で決定し、ユーザインタフェースによって幅をドキュメント走査システムに入力する。この方法では、ドキュメント画像がクリップ(clip)されないように、ドキュメントをドキュメント走査システムの中央に配置する必要がある。ユーザは正確な幅を常に入力できるとも限らないし、ドキュメントをドキュメント走査の中央に正確に配置できるとも限らないため、技術文書走査システムによく見られるように大量のドキュメントを処理する場合、特に、この手作業の方法では生産性が低く無駄なコピーが生じる。
【0004】
したがって、ドキュメントが走査のために最初にステージされているときにドキュメントのエッジと位置を決定するために、エッジ検出動作を設けるのが望ましい。理解できるように、エッジ検出動作を提供するためには、走査システムでドキュメントの外側エッジをなんとか検出する必要がある。従来、自動エッジ検出方法は、デジタルスキャナ及び/又は画像処理システムの能力に依存して入力ドキュメントの背景と周囲のバッキング(backing)との反射率の差などの差異を感知する。しかしながら、ドキュメントシートは濃いセピア、トレーシングペーパー、厚く明るいボンドペーパー、ほぼ透明のフィルムといった基体の色域(gamut)をとることができ、バッキングの反射率に非常に近い反射率をとることができるような技術環境では、特に、既存のエッジ検出方法は完全にはうまくいかない。
【0005】
このような従来の自動幅検出方法ではステージされるドキュメントの先端の一部分が捕捉され、先端の捕捉部分はバッキングに関連する画像データとドキュメント自体に関連する画像データの両方を含む。この自動化された方法では、ドキュメントの幅及び位置は、各CCDセンサ素子がバッキング又はドキュメントのどちらで覆われているかを判定することで計算される。この判定を行うために従来の自動検出方法は、画像データのピクセルコラムの平均値を利用してドキュメントとバッキングとを区別する分類方法を用いる。
【0006】
しかしながら、ドキュメントの輝度は暗から明まで変化し、大部分のボンドペーパーやフィルムドキュメントはバッキングとほぼ同じ輝度を有するため、従来の自動幅検出方法ではドキュメントの実際の位置と幅を検出することができない場合があった。さらに、この従来の方法は1次関数に対応する平均値データにしか依存していない。平均値データは、CCDセンサ内の電気ノイズ又は実際の走査システム内のほこりや汚れに非常に敏感である。換言すると、過度の電気ノイズ、ほこり又は汚れによって、従来のエッジ検出方法は簡単に無効になってしまう。
【0007】
1次関数に基づいた検出関数の使用に関連する欠点をなくすために、米国特許第6,046,828号は、走査画像データをフィルタリングし2次統計量を利用してバッキングとドキュメントとの変移部分を識別する、ドキュメントの幅及び位置の自動検出方法及びシステムを教示する。米国特許第6,046,828号が教示したシステム及び方法によって平均値データにのみ依存していた従来の方法よりもエッジ検出は向上したが、幾つかの要因によって有効性が限定されてしまった。
【0008】
例えば、理想的な環境ではバッキングは常に一定の反射率を有する。しかしながら、バッキングはドキュメントに接触するため、汚れこすられて縦縞が現れる。さらに、特定のCCD素子の問題又は較正によっても縦縞が現れる。さらに、上記のように、技術用図面のようなドキュメントは濃いセピアからトレーシングペーパー、厚く明るいボンドペーパー、ほぼ透明のフィルムまでといった基体の色域をとることができ、エッジがぼろぼろで破れているようなひどい状態にあることもある。このような要因全てが、反射率の急上昇に基づいてドキュメントエッジを検出しようとする努力をくじいていた。
【0009】
【発明が解決しようとする課題】
したがって、変化する状況や遭遇する広範囲のドキュメント基体を処理するのに充分にロバストな、有効な自動エッジ検出システムを有するのが望ましい。
【0010】
【課題を解決するための手段】
本発明の1態様は、走査システムでドキュメントのエッジを自動的に検出する方法である。この方法は、(a)ドキュメントの一部を走査して画像データのセットを得るステップと、(b)1次関数である第1の関数を用いて画像データから第1の値のセットを計算するステップと、(c)2次関数である第2の関数を用いて画像データから第2の値のセットを計算するステップと、(d)複数の第1の値の差の関数である第1の傾き値を決定するステップと、(e)複数の第2の値の差の関数である第2の傾き値を決定するステップと、(f)第1の傾き値と第2の傾き値からドキュメントの検出エッジを決定するステップと、を含む。
【0011】
本発明の他の態様によると、ドキュメントのエッジを検出する方法が提供されている。この方法は、(a)ドキュメントの一部を走査して画像データのセットを得るステップと、(b)2次関数である第1の関数を用いて画像データから第1の値のセットを計算するステップと、(c)複数の第1の値の差の関数である第1の傾き値を決定するステップと、(d)複数の第1の値の合計を含むブロック合計値を生成するステップと、(f)第1の傾き値とブロック合計値から検出したドキュメントの検出エッジを決定するステップと、を含む。
【0012】
【発明の実施の形態】
図1を参照すると、本発明の教示にしたがって動作可能なドキュメントハンドラ及び画像形成システムの一部分の概略図が示されている。照射源12が光Aを発生させ、この光はプラテンガラス14を通過し、反射光Bとしてドキュメント16から反射し、センサ18によって受け取られる。センサ18は、ハンドラによって支持される最も幅の広いドキュメントの幅全体を走査できる程度に十分な長さを有するラスタ入力スキャナ(RIS)を備えるのが好ましい。センサ18は、CCDセンサ要素などの小さな光センサからなる線形アレイの形態であるのが好ましい。センサ18は反射光Bを受け取り、この反射光をビデオデータに変換する。このビデオデータは、走査線全体の各ピクセルの特定のグレーレベル値(例えば、8ビットシステムの場合は0〜255の値をとり、グレーレベル0はブラックを表しグレーレベル255はホワイトを表す)を識別する。ビデオデータは画像処理システム(IPS)20に供給され、該画像処理システムは以下に説明する方法でドキュメントエッジを識別するために画像データに対して動作する。
【0013】
ドキュメント16は、プラテンガラスに対して又は該プラテンガラスに近接してドキュメント16を支持するように位置するバッキングローラ22によってセンサ(プラテンガラス14)の上を通過させられ、適当な画像バッキングを提供する。ローラ22は、ローラの表面がドキュメントと正確に同じ速度で移動するような速度で駆動されるのが好ましい。これにより、バッキングローラはドキュメントのプラテン上の前進を加速したり妨害したりしない。ローラが透明なドキュメントの画像に干渉しないように、バッキングローラ22の外面は同じ色、好ましくは白である。理解されるように、適当なバッキングを提供するためには、ローラ22はセンサ18全体を覆うべきである。したがって、ドキュメントを走査する際、センサ18内の各CCDセンサ素子はバッキングかドキュメントのいずれかによって覆われる。このシステムは、ドキュメントをローラ22にガイドする搬送ローラ24とドキュメントをローラ22から運搬する搬送ローラ26をさらに含む。ドキュメントをプラテンへ、またプラテンからガイドする以外に、搬送ローラ24、26はプラテンガラスに対してドキュメントを強固に保持する助けとなる。
【0014】
ローラ22は、軸36を中心に回転するように取り付けられた略円筒形ハウジング30内に取り付けられる。バッキングローラの円面の外周の一部分を取り囲むハウジング30の外面の一部分32が、ドキュメント幅検出バッキングを形成する。ハウジングの幅検出バッキング32は、真の円形状から僅かに凹んでいるのが好ましい。例えば、幅検出バッキング32は、普通なら円形のハウジング30の外面の平坦な部分でもよい。ハウジングの幅検出バッキングは黒であることが好ましい。ハウジング30はモータ34によって駆動され、該モータは、幅検出バッキング32が図2に示すように照射源12とセンサ18の視野にありこれらに対向する位置まで軸36を中心にしてハウジングを回転させるように作動する。
【0015】
上記のように、検出バッキング32はわずかに凹んでいるため、センサ18の焦点よりも上にある。したがって、検出バッキング32はセンサ18の焦点から外れているように見えるので、幅検出バッキングの表面の変化はあまり見えず表面は色やきめがより均一に見える。このような見かけの均一性によって、検出バッキング32の変化をドキュメントエッジ状特徴として誤って識別する可能性が低くなる。
【0016】
エッジ検出動作の1実施形態では、バッキングローラ22がプラテンの上に位置するようにハウジングが配置される。ドキュメント搬送ローラ24、26はプラテンの上でドキュメント16の一部をガイドし、そこでドキュメントは走査されて画像濃度を表す画像データのピクセルからなるビデオ画像データを生成する。定位置にあるバッキングローラ22によるこの部分走査は、明(例えば、ホワイト)バッキングに対してドキュメントを捕捉した画像データの数本の走査線からなる画像データの第1のセットを得るために実行される。このドキュメントの第1の部分を走査した後、モータ34はハウンジング30を回転させ、幅検出バッキング部分32がセンサ18の視野に入る。ドキュメント16の他の部分が定位置にあるエッジ検出バッキングによって走査されて、暗(例えばブラック)バッキングに対してドキュメントを捕捉した画像データの数本の走査線からなる画像データの第2のセットを得る。IPS20は、エッジを検出するために、画像データの2つのセットに対して動作する。
【0017】
図3を参照すると、ドキュメントのエッジを決定する方法の1実施形態を例示したフローチャートが示されている。簡単にいうと、図3の方法は、4つのエッジ検出動作でドキュメントのエッジを識別する。エッジ検出動作はそれぞれ、走査画像データから生成した1つ以上の1次、2次及び/又は4次統計量を用いてエッジ候補を探索する。エッジ検出動作がエッジ候補を検出すると、この動作は検出したエッジの位置を与える。エッジ検出動作の終了後、この方法は、検出したエッジ候補のいずれかがドキュメントエッジに対応するかを判定し、対応した場合はそこにドキュメントエッジを位置させる。
【0018】
図3に例示するプロセスは、ドキュメントの一部を走査して画像濃度を表すピクセルからなるプレスキャン画像データを得ることから始まる。具体的には、ステップ100では、バッキングローラ22(図1)などの実質的に光を反射し明るい色(例えばホワイト)のバッキングに対して、ドキュメントの第1の部分を走査して、以下autoIQ(AIQ)画像データと称する画像データの第1のセットを得る。明バッキングに対して第1の部分を走査した後、ステップ100では検出バッキング32(図2)などの暗(例えばブラック)バッキングに対してドキュメントの第2の部分を走査して、以下autoWidth(AW)画像データと称する画像データの第2のセットを得る。ステップ100はさらに、画像データを収集してローパスフィルタ処理するローパスフィルタ動作を含むのが好ましい。例えば、ドキュメントを400spiで走査し、各走査線で4ピクセル幅のウィンドウで平均化し、100spiの画像を生成することができる。ローパスフィルタ動作は、あらゆるシステムノイズを低減し、処理しなければならない画像データの量を少なくするように動作する。
【0019】
図4を参照すると、ステップ100で捕捉されるプレスキャン画像データのグラフによる表示がなされている。プレスキャン画像データ50は、画像データの2つのセット、即ちautoIQ画像データ52とautoWidth画像データ54とを有するものとして示されている。autoIQ画像データ52は、各々がN個のピクセルを含むM本のピクセルデータの走査線からなるものとして示され、ピクセルのM×Nのマトリックスxm,n(m=1〜M、n=1〜N)を有すると考えることができる。同様に、AW画像データ54は、各々がN個のピクセルを含むM´本のピクセルデータの走査線からなるものとして示され、ピクセルのM´×Nのマトリックスxm´,n(m´=1〜M´、n=1〜N)からなると考えることができる。
【0020】
捕捉したAIQ画像データとAW画像データそれぞれの走査線の本数は、所望の性能特徴に応じて変化することを理解されたい。エッジ候補を正確に識別することができる充分なデータを確実に得るために、最小の本数の走査線を走査すべきである。所望の本数を走査することができるが、エッジ検出動作に特別に長い時間を割かないように、捕捉する走査線の本数を限定しようとしてもよい。
【0021】
図3に戻ると、プレスキャン画像データの一部が利用できるようになると、ステップ102を開始して4つのエッジ検出動作のうち1つ以上で使用するための1次、2次及び4次統計量をプレスキャン画像データから生成する。より具体的にいうと、ステップ102は、autoWidth画像データの各ピクセルコラムに対して1次、2次及び4次統計量を生成し、autoIQ画像データの各ピクセルコラムに対して1次統計量を生成する。
【0022】
ステップ102で計算した1次統計量を用いて、ステップ104は、プレスキャン画像データ内のピクセルコラムが狭帯域アーチファクトに対応するのか、幅検出バッキングに対応するのか、それとも自動検出予測データ(predictor)であるのかを示すコラムフラグを生成する。簡単にいうと、狭帯域アーチファクトとは、バッキングロールの汚れ及び/又は縞によって生じる画像データの「エラー」であり、これによってホワイトバッキングロールに対応するピクセルのグレーレベルが濃く(低く)なる。さらに、狭帯域アーチファクトは、全てのピクセルに対してホワイト出力を生成してしまう欠陥のあるセンサによっても生じ、そのためにブラック検出バッキングに対応する画像データの帯域がホワイトとなってしまう。狭帯域アーチファクトは、近傍ブロックの平均値を計算し、ブロックの平均値と現在のコラムの平均値を比較することによって識別する。コラムが狭帯域アーチファクトに対応すると識別された場合、狭帯域フラグがそのコラムに対して設定される。
【0023】
自動エッジ予測データは、ドキュメントのエッジ又はその付近にあるピクセルコラムを識別する。自動エッジ予測データは、現在のコラムより僅かな距離前方にあるコラムブロックの平均値と現在のコラムより僅かな距離後方にあるコラムブロックの平均値との大きな差を探索する。自動エッジ予測データのために、現在のコラムの平均値と僅かに後方のブロックの平均値との差を計算する。また、現在のコラムの平均値とこれより前方のブロックの平均値との差を計算する。自動エッジ予測データは、これらの間の大きな差を探索する。大きな差が存在した場合、自動エッジ予測データは真に設定される(コラムがエッジ境界付近にある)。このパラメータは、ホワイトバッキングローラにおけるアーチファクトによる誤った初期エッジ検出を防止する助けとなる。
【0024】
導出される他の有用なコラムタイプのパラメータは、コラムが幅検出バッキングに対応するかどうかを示す。このパラメータもまた、現在のピクセルコラムの近傍のコラムブロックの平均値を調査して現在のコラムが検出バッキングに対応するかどうかを示す。現在のコラムが検出バッキングに対応するためには、現在のコラムの平均値と近傍ブロックコラムの平均値との差が小さくなければならない。離れた近傍ブロックの平均値との差も小さくなければならない。現在のコラムの平均値も検出バッキングの予測平均値に対応しなければならない。ホワイトバッキングローラの対応する離れた近傍ブロックとブラック検出バッキングローラの対応する離れた近傍ブロックとの差も大きくなければならない。このパラメータもまた、ホワイトバッキングローラにおけるアーチファクトによる誤った初期エッジ検出を防止する助けとなる。
【0025】
画像統計量を生成した後、プロセスはこの統計量を用いてエッジ候補を探索する。上記のように、プロセスはエッジ候補を探索するために4つのエッジ検出動作(ステップ110、112、114及び116)を含む。各エッジ検出動作は他から独立しており、連続して実行されるものとして示されているが、エッジ検出動作を並行して実行できることを理解されたい。ステップ110では、プロセスはステップ102で生成した1次統計量の値を用いてエッジ候補を探索する。より具体的にいうと、ステップ110は、現在のコラムのAW画像データの平均値とAIQ画像データの平均値の差を近傍のピクセルコラムのAW画像データの平均値とAIQ画像データの平均値の差とを比較することによって、エッジ候補を検出する。エッジ候補を検出すると、ステップ110は選択したコラムフラグの状態を調べて検出結果を確認する。検出結果を確認すると、検出したエッジの位置が与えられる。
【0026】
ステップ112は、ステップ102で生成した1次及び2次統計量を使用してエッジ候補を検出し、これを検出した場合は検出したエッジの位置に対応するコラムを出力する。特に、ステップ112は、1次及び2次統計量の変化の1次導関数(即ち傾き)を用いてエッジ候補を検出する。エッジ候補を検出すると、コラムフラグの状態を調べて検出結果を確認する。
【0027】
ステップ114は、ステップ102で生成した4次統計量の値を用いてエッジ候補を探索する。エッジ候補を検出した場合、ステップ114は選択したコラムフラグに対してエッジ検出結果を確認し、確認できた場合は検出したエッジの位置を出力する。ステップ116は、ステップ102で生成した2次統計量の値を用いてエッジ候補を探索し、選択したコラムフラグの状態を調べることでエッジ候補の識別を確認する。検出結果を確認すると、検出したエッジの位置が出力される。
【0028】
ステップ120では、プロセスはエッジ候補が検出されたかどうかを判定する。検出されなかった場合、プロセスはステップ122に続き、そこでは走査システムはエッジが検出されなかったことを示し、ドキュメント幅の手作業による入力を要求する。エッジ候補が識別された場合、プロセスはステップ126に続く。ステップ126では、1つ以上の候補が識別された場合、プロセスはどのエッジ候補の検出結果が実際のドキュメントエッジに対応するかを判定する。ドキュメントエッジの識別後、ステップ126は検出したドキュメントエッジが有効かどうかを照合する。
【0029】
次に、図3に示すドキュメントのエッジを決定する方法で選択されたステップをより詳細に説明する。図3および以下に説明する関連する図面に示される方法は、左右のエッジを識別するために使用することができる。例えば、図4を参照すると、左エッジを探索する場合、プロセスは最も左のピクセルコラムであるコラム1から始まりコラムNに向かって移動する。即ち、左から右へと移動する。右エッジを検出するためには、プロセスは単に最も右のコラムから始まりプレスキャン画像データにわたって右から左へと移動する。コラムには右から左へ1〜Nの番号がリナンバーされる。エッジを確実に検出するために、プロセスは、コラム1から許容可能な最大ドキュメント幅+許容可能な最小ドキュメント幅の半分までの間で左エッジを探索する。左エッジを決定した後、プロセスは、最も右のコラムからスタートして識別した左エッジ+最小のドキュメント幅まででドキュメントの右エッジを探索する。
【0030】
図5を参照すると、図3のステップ102で実行した、プレスキャン画像データから1次、2次及び4次統計量を生成するプロセスがより詳細に示されている。ステップ131では、AW画像データ(暗バッキング)内のピクセルデータのN個のコラムそれぞれの平均値を計算し、これを保存する。例えば、AW画像データがM´=50の走査線を含むならば、例えばピクセル位置56のピクセルコラムは50個のピクセルからなる画像データを含み、画像データの各ピクセルが同じユニットセンサ要素から生成されたことになる。より具体的にいうと、図4を参照すると、例えばコラム56のようなAW画像データ54内の各ピクセルコラムn(n=1〜N)に対して、ステップ131はそのピクセルコラムのピクセル値Xm´,n(m´=1〜M´)の平均値MeanAw(n)を計算する。即ち、コラム平均値MeanAw(n)を以下の式で求めることができる。
【0031】
【数1】
Figure 0004237441
平均値を計算した後、ステップ132は、AW画像データ内のピクセルデータのN個のコラムそれぞれの標準偏差を計算する。本明細書中で用いるStdAW(n)は、AW画像データのコラムnのピクセル値Xm´,n(m´=1〜M´)の標準偏差を識別する。
【0032】
ステップ133は、ステップ131と132で計算した平均値と標準偏差値を使用してAW画像データ内のピクセルデータのN個のコラムそれぞれのとがりを決定する。とがりとは、分布の「とがり」の程度を示す尺度である。とがりは、サンプルの母集団が正規分布に対して分布のテールに分布する程度を表す。分布の値が正の値で大きい(ハイピーク)場合、データは平均値付近に集中していることを意味する(幅ほそ分布)。参考までに、正規分布ではとがりは0である。本明細書中で用いるKAW(n)は、AW画像データのコラムnのとがりを識別する。
【0033】
ステップ135では、autoIQ画像データからも1次統計量が計算される。ステップ135では、AIQ画像データ(ホワイトバッキングローラ)内のピクセルデータのN個のコラムそれぞれの平均値を計算し、これを保存するのが好ましい。即ち、AIQ画像データ52内のピクセルコラムn(n=1〜N)のそれぞれに対して、ステップ135ではそのピクセルコラムにおけるピクセルXm,n(m=1〜M)のコラム平均値MeanAIQ(n)を計算する。
【0034】
autoIQ画像データとautoWidth画像データそれぞれの各ピクセルコラムのコラム平均値を計算した後、ステップ136ではautoWidth画像データの各コラムの平均値(MeanAW(n))と対応するautoIQ画像データのコラムの平均値(MeanAIQ(n))の差の絶対値を計算する。ステップ136で計算した平均値の差の絶対値は以下の式で与えられる。
【0035】
【数2】
Figure 0004237441
【0036】
透明ドキュメントと濃いドキュメントの区別を助けるために、ステップ137では、閾値グレーレベル以下のautoWidth画像データのコラム平均値(MeanAW(n))の連続カウントを蓄積する。閾値より小さいグレーレベル値を有するコラム平均値の合計が十分に大きい場合、ドキュメントは透明ドキュメントであり透明ドキュメント検出フラグ「transp−detected」が真に設定されることが予測できる。透明ドキュメントのエッジは一般的には確実に検出されないため、透明ドキュメントが検出されると、プロセスは「失敗」し、ドキュメント幅の手作業による入力を要求する。透明ドキュメントを検出するさらなるチェックとして、オートバッカ(backer)フラグもまた透明ドキュメントをバッカとして示し透明ドキュメントエッジ検出を防ぐ。
【0037】
透明ドキュメントを検出するための閾値グレーレベル値は、用いる幅検出バッキングの平均グレーレベル及び濃いドキュメントの場合に予測されるグレーレベルに基づいて選択される。同様に、透明ドキュメント検出フラグを真に設定するために必要な閾値未満の平均値を有するコラムの数を、走査システムで使用する一般的な透明ドキュメントと濃いドキュメントを調査することで、経験的に決定することができる。1実施形態では、ブラック幅検出バッキングを用いてドキュメントを処理する走査システムは、透明ドキュメント検出フラグを真に設定するためには、90%以上のコラムが検出バッキングの平均グレーレベル未満の平均値を有することが必要になる。
【0038】
図6は、図3のステップ110で実行されるエッジ検出動作をより詳細に示す。上記のように、図6に示す方法を左右のエッジを識別するために使用することができる。上記のように、左エッジを探索するときは、プロセスは最も左のピクセルコラム1から開始しコラムNまで移動する。即ち、左から右へと移動する。右エッジを検出するためには、プロセスは最も右のコラムを識別し、プレスキャン画像データ全体を右から左へと移動する。コラムは右から左へ向かって1からNまでリナンバーされる。
【0039】
ステップ141で、プロセスは現在のコラムnを1に初期化し、最大コラムを探索させる。エッジを確実に検出するために、プロセスは、コラム1から最大ドキュメント幅+許容可能な最小のドキュメント幅の半分までの間でドキュメントの左エッジを探索すればよい。左エッジを決定すると、プロセスは、最も右のエッジ(コラムN)から始めて左エッジ+許容可能な最小ドキュメント幅までの間でドキュメントの右エッジの探索を開始する。
【0040】
ステップ142では、プロセスは現在のコラムの平均差MeanDiff(n)と2コラム先即ち2つ分ドキュメントに向かう位置にあるコラムの平均差を比較する。より具体的にいうと、ステップ142は、現在のコラムの平均差と2つ先のコラムの平均差の差の絶対値を以下のように決定する。
【0041】
【数3】
Figure 0004237441
【0042】
プレスキャン画像データがバッキングに対応する場合、コラムの平均差(AIQ画像データ(ホワイトバッキングロール)とAW画像データ(ブラック幅検出バッキング)との差である)は大きいが、コラム間の平均差は比較的等しい。同様に、プレスキャン画像データのコラムがドキュメントに対応する場合、AIQ画像データとAW画像データの両方がドキュメントに対応するため、平均差は比較的小さい。しかしながら、ドキュメントエッジの境界では、現在のコラム(n)の平均差が2つのプレスキャン画像バッキング(ホワイトバッキングロールとブラック幅検出バッキング)の差であるため、この差は大きい。一方、AIQ画像データとAW画像データがドキュメントに対応するため、2つ先のコラム(n+2)の平均差は小さい。したがって、ドキュメントのAltMeanDiffに先鋭なピークを予測することができる。
【0043】
ステップ143では、プロセスはAltMeanDiffが閾値(MnDiff−Thresh1)よりも大きいかどうかを判定する。閾値は、走査システムで見られる実際のドキュメントを表すドキュメントをトレーニングすることで経験的に導出することができる。1実施形態では、12〜17の範囲の閾値を用いていたが、他の範囲の閾値を用いてもよい。AltMeanDiffが閾値より大きくない場合、プロセスはステップ144で最大の探索コラムに到達したかどうかを判定する。到達していない場合は、プロセスは現在のコラムカウントを増やし(ステップ145)、新しいAltMeanDiffを計算する。最大探索コラムに到達した場合、プロセスはエッジを検出できなかったことを示す。他方でAltMeanDiffが閾値以上であった場合、エッジ候補が検出されプロセスはステップ147に続く。
【0044】
近傍コラムの平均差の比較によって、広範囲のドキュメントの種類にわたって優れたエッジ予測を行うことができる。しかしながら、検出の結果が狭帯域アーチファクトとならないようにするために、プロセスは、ステップ147に現在のコラムが狭帯域アーチファクトに対応するかどうかを識別するように設計されたチェックを含む。ステップ147は、現在のコラムと次のコラムのいずれかが狭帯域アーチファクトに対応する(即ち、狭帯域フラグが設定されている)と識別されたかを判定するのが好ましい。上記のように識別された場合、プロセスは狭帯域であるとして検出を拒否し、ステップ144に戻ってエッジの探索を続ける。そうでない場合は、プロセスはステップ148へと続き、そこでは自動エッジ照合を実行する。
【0045】
ステップ148は、現在のコラムが自動エッジ予測データコラム(図3のステップ104)であるかどうかを判定する。自動エッジ予測データコラムであるならば、プロセスはステップ149でエッジがコラムn+2に存在すると決定する。現在のコラムが自動エッジ予測データコラムでない場合、プロセスは検出を拒否してステップ144に戻り、エッジの探索を続ける。
【0046】
図7は、図3のステップ112で実行するエッジ検出動作をより詳細に示す。上記のように、図7に示す方法を使用してプレスキャン画像データにわたって左から右へ又は右から左へと移動することによって、左右のエッジを識別することができる。ステップ151では、プロセスは現在のコラムをn=1に初期化し、最大コラムを探索させる。エッジを確実に検出するために、プロセスはコラム1から最大ドキュメント幅+許容可能な最小のドキュメント幅の半分までの間でドキュメントの左エッジを探索すればよい。左エッジを決定すると、プロセスは、最も右のエッジ(コラムN)から始めて左エッジ+許容可能な最小ドキュメント幅までの間でドキュメントの右エッジの探索を開始する。
【0047】
ステップ152では、プロセスはautoWidth画像データの統計量を用いて生成された4つのエッジ予測値を生成する。生成された最初の2つの予測値は、平均値(Mean1st)の変化の1次導関数(傾き)及び隣接するコラムの標準偏差(Std1st)の変化の1次導関数である。Mean1st及びStd1stの値は、図3のステップ102で生成した平均値と標準偏差値を用いて計算する。プロセスは、現在のコラムの2つ先のコラムの平均値と現在のコラムの1つ先のコラムの平均値の差の絶対値から、現在のコラムの1つ先のコラムの平均値と現在のコラムの平均値の差を引いたものとして、Mean1st(n)を決定する。即ち、以下の式で表すことができる。
【0048】
【数4】
Figure 0004237441
【0049】
同様に、コラム(n+2)の標準偏差値とコラム(n+1)の標準偏差値の差からコラム(n+1)の標準偏差値と現在のコラム(n)の標準偏差値の差を引いたものとして、Std1st(n)を計算することができる。即ち、以下の式で表すことができる。
【0050】
【数5】
Figure 0004237441
【0051】
標準偏差の大きな変化はドキュメントエッジでよく見られる。標準偏差の変化の1次導関数によって、コラム(n+2)とコラム(n+1)の標準偏差に大きな正の値の変化がありコラム(n)とコラム(n+1)の間には変化がほとんどない場合には、大きな正のピークを得ることができる。
【0052】
2つの傾きの値を生成した後、ステップ152はStd1st(n)とMean1st(n)の積の絶対値として、第3のエッジ予測値を計算する。このStd1st(n)とMean1st(n)の積をProd1stと称する。
【0053】
【数6】
Figure 0004237441
【0054】
この動作で使用する第4のエッジ予測値は、y個先、即ちy個分ドキュメントに向かうコラムから始まるx個のコラムブロックの標準偏差の合計である。1実施形態では、xとyをそれぞれ10〜20及び20〜30と決定した。しかしながら、当業者なら、システムの要件に基づいてxとyの値を容易に求めることができるであろう。具体的にには、第4のエッジ予測値は以下の式で求められる。
【0055】
【数7】
Figure 0004237441
【0056】
ステップ153では、プロセスは以下の3つの条件のうち1つを満たすかどうかを判定する。
【0057】
【数8】
Figure 0004237441
式中、所与の走査システムに見られる実際のドキュメントを表すドキュメントから、閾値を経験的に決定することができる。1実施形態では、PTrsh1及びPThrsh2は両方とも30〜40の範囲で、PTrsh3は10〜20の範囲で、SSThrsh1及びSSThrsh2は両方とも30〜40の範囲で、StdThrsh1及びStdThrsh2は約3であった。第2の条件は、第1の条件よりも僅かに厳しく、例えばPThrsh2がPThrsh1よりも僅かに大きくStdThrsh1が非常に高い。第3の条件は3つの予測値を見るため、要件は僅かに緩和されている。PThrsh3がPThrsh1とPThrsh2よりも小さく、StdThrsh2がSthrs1よりも小さく、SSThrsh2がSSThrsh1よりも僅かに高い。
【0058】
上記の式(8)で与えた条件のどれも満たさない場合、エッジ候補は検出されず、プロセスはステップ154へと続きそこで最大探索コラムに到達したかどうかを判定する。最大探索コラムに到達していない場合、プロセスは現在のコラムを増やして(ステップ155)ステップ152に戻り、新しいコラムに対して4つの新しいエッジ予測値を計算する。最大探索コラムに到達した場合、プロセスはエッジを識別しなかったことを示す(ステップ156)。他方で、上記の式(8)で与えた3つの条件のうちどれか1つを満たす場合、エッジ候補が検出されプロセスはステップ157へと続く。
【0059】
ステップ157では、プロセスは現在のコラム又は次のコラムのいずれかが狭帯域アーチファクトに対応する(即ち狭帯域フラグが設定されている)と識別されたかを判定する。狭帯域アーチファクトに対応すると識別された場合、プロセスは狭帯域であるために検出を拒否し、ステップ154に戻ってエッジの探索を続ける。狭帯域アーチファクトに対応すると識別されない場合、プロセスはステップ158へと続き、そこで現在のピクセルコラムが幅検出バッキングに対応するかを判定する。
【0060】
ステップ158で現在のピクセルコラムは検出バッキングに対応しないと判定した場合、プロセスはステップ159でピクセルコラムn+1にエッジが存在すると判定する。現在のコラムが検出バッキングに対応するならば、プロセスは検出を拒否し、ステップ154に戻ってエッジの探索を続ける。
【0061】
図8を参照すると、図3のステップ114のエッジ検出動作を実行するプロセスが示されている。上記のように、図8のプロセスを使用して左右のエッジを識別することができる。左エッジを探索するときは、プロセスは最も左のピクセルコラムから始めてプレスキャン画像データにわたって左から右へと移動する。右エッジを検出するには、プロセスはコラム1として識別された最も右のコラムから始めてデータを右から左へと移動する。
【0062】
図8のプロセスは、ステップ161の探索変数、即ち現在のコラムと探索する最大コラムの初期化から始まる。上記のように、プロセスはコラム1から最大ドキュメント幅+許容可能な最小ドキュメント幅の半分までの間でドキュメントの左エッジを探索すればよい。左エッジを決定した後、プロセスは最も右のエッジ(コラムN)から始めて左エッジ+許容可能な最小ドキュメント幅までの間でドキュメントの右エッジの探索を始める。
【0063】
ステップ162で、プロセスは検出動作で使用する2つのエッジ予測値を生成する。生成される第1の予測値は、とがり値(K1st)の変化の1次導関数である。具体的にK1stは、現在のコラムの2つ先のコラムのとがり値と1つ先のコラムのとがり値の差から、1つ先のコラムのとがり値と現在のコラムのとがり値の差をひいたものとして、決定される。即ち、以下の式で表すことができる。
【0064】
【数9】
Figure 0004237441
【0065】
ステップ162で生成される第2のエッジ予測値は、AltMeanDiff(n)である。式(3)で与えられるAltMeanDiff(n)は、現在のコラムの平均差と2つ先のコラムの平均差の差の絶対値であることを思い出されたい。ステップ163では、プロセスは以下の条件が満たされるかどうかエッジ検出結果を識別する。
【0066】
【数10】
Figure 0004237441
式中、閾値MnDiff−Thresh2及びKThresh2は、走査システムで見られる実際のドキュメントを表すドキュメントから経験的に決定した。1実施形態では、MnDiff−Thresh2は、図3のステップ110の平均差エッジ検出で使用するMnDiff−Thresh1から10〜15の範囲に僅かに緩和し、Thresh1は25〜30の範囲であった。しかし、閾値は大きく変化し得ることを当業者ならば理解するであろう。
【0067】
上記の式(10)で与えられた条件を満たさない場合エッジ候補は検出されず、プロセスはステップ164へと続き、そこで最大探索コラムに到達したかどうかを判定する。最大探索コラムに到達していない場合、プロセスは現在のコラムを増やして(ステップ165)ステップ162に戻り、新しいコラムに対して2つの新しいエッジ予測値を計算する。最大探索コラムに到達した場合、プロセスはエッジを識別しなかったことを示す(ステップ166)。他方で、式(10)で与えられた条件を満たすならば、エッジ候補が検出されてプロセスはステップ167へと続く。
【0068】
ステップ167では、プロセスは現在のコラム又は近傍コラムのいずれかが狭帯域アーチファクトに対応するかどうかを判定する。現在のコラム又は次のコラムが狭帯域アーチファクトに対応する(即ち狭帯域フラグが設定されている)と識別されたとステップ167が判定した場合、プロセスは狭帯域であるとして検出を拒否し、ステップ164に戻ってエッジの探索を続ける。ステップ167が上記のように判定しなかった場合、プロセスはステップ168へと続きそこで現在のピクセルコラムが幅検出バッキングに対応するかどうかを判定する。
【0069】
ステップ168で現在のピクセルコラムが幅検出バッキングに対応しないと判定された場合、プロセスはステップ169でエッジ候補がコラムn+3に存在すると判定する。他方で、現在のピクセルコラムが幅検出バッキングに対応する場合、プロセスは検出を拒否しステップ164に戻ってエッジの探索を続ける。
【0070】
図9を参照すると、図3のステップ116のエッジ検出動作を実行するプロセスが示されている。上記のように、プロセスを使用してプレスキャン画像データにわたって左から右へ又は右から左へと移動することによって左右のエッジを識別することができる。プロセスは、ステップ171の変数の初期化から始まる。現在のコラムが初期化されて最大探索コラムが設定される。
【0071】
ステップ172では、プロセスはエッジ検索動作に必要な2つのエッジ予測値を生成する。生成される第1の予測値はStd1st、即ち標準偏差値の変化の1次導関数である。上記のようにまた式(5)で与えられたように、Std1st(n)は、コラム(n+2)の標準偏差値とコラム(n+1)の標準偏差値の差からコラム(n+1)の標準偏差と現在のコラム(n)の標準偏差の差を引いたものとして、計算される。図9のプロセスで使用する第2のエッジ予測値はSumStd(n)である。式(7)で与えられたように、SumStd(n)はy個先のコラムから始まるx個のコラムブロックの標準偏差の合計であることを思い出されたい。
【0072】
ステップ173では、プロセスは以下の条件を満たすかどうかエッジ検出結果を識別する。
【0073】
【数11】
Figure 0004237441
式中、閾値StdThrsh3及びSSThrsh3は、走査システムで見られる実際のドキュメントを表すドキュメントから経験的に決定した。1実施形態では、SSThrsh3は30でありStdThrsh3は3であった。
【0074】
上記の式(11)で与えられた条件を満たさない場合エッジ候補は検出されず、プロセスはステップ174へと続き、そこで最大探索コラムに到達したかどうかが判定される。最大探索コラムに到達していない場合、プロセスは現在のコラムを増やして(ステップ175)ステップ172に戻り、新しいコラムに対して2つの新しいエッジ予測値を計算する。最大探索コラムに到達した場合、プロセスはエッジを識別できなかったことを示す(ステップ176)。他方で、式(11)で与えられた条件を満たす場合、エッジ候補が検出されプロセスはステップ177へと続く。
【0075】
有効なエッジであるためには、現在のコラムが自動エッジ予測装置コラムでなければならない(即ち、オートエッジフラグが設定されていなければならない)。したがって、ステップ177では現在のコラムが自動エッジ予測データであるかどうかを判定する。自動エッジ予測データであった場合、ステップ178でエッジがコラムn+1に存在と判定する。現在のコラムが自動エッジ予測データコラムでない場合、プロセスは検出を拒否してステップ174に戻り、エッジの探索を続ける。
【0076】
狭帯域アーチファクト、検出バッキング及びオートエッジフラグの判定の説明に移る前に、これらのコラムフラグを生成するのに使用するプレスキャン画像データについて説明する。図10は、コラムフラグを決定するのに使用するプレスキャン画像データ部分を概略的に表示している。コラムフラグの生成には、AIQ画像データの現在のコラムを取り囲む一対の近傍コラムブロック(ブロック62及び64)とこれに対応するAW画像データの一対のコラムブロック(ブロック72及び74)を使用する。さらにプロセスは、AIQ画像データの現在のコラムを取り囲む一対のやや離れた近傍コラムブロック(ブロック66及び68)とこれに対応するAW画像データの一対のやや離れたコラムブロック(ブロック76及び78)に依存する。
【0077】
対応する対の近傍ブロック62と72はそれぞれ、本明細書中ではNearFutureAIQ及びNearFutureAWとして識別され、それぞれx個先、即ちx個分ドキュメントに向かうコラムから始まるx"個分のコラムブロックからなる。対応する対の近傍ブロック64と74はそれぞれ、本明細書中ではNearPastAIQ及びNearPastAWとして識別される。これらのNearPastブロックはそれぞれx´個後方から始まりx"個分のコラムを含むコラムブロックからなる。
【0078】
離れた近傍ブロックの対も同じ関係を維持する。即ち、対応する対の離れた近傍ブロック66及び76(本明細書中ではそれぞれFarFutureAIQ、FarFutureAWと称する)はそれぞれ、y個先のコラムから始まるy"個分のコラムブロックからなる。本明細書中ではそれぞれFarPastAIQ、FarPastAWと称する対応する対の離れた近傍ブロック68及び78はそれぞれ、y個分後方のコラムから始まりそこから先にy"個分のコラムを含むコラムブロックからなる。
【0079】
近傍ブロック及び離れた近傍ブロックそれぞれのサイズ及び位置は、走査システムで予測されるドキュメントの範囲を表す、ドキュメントに対応する画像データを分析することによって経験的に決定することができる。
【0080】
図11は、図3のステップ104で実行されるように、ピクセルコラムが狭帯域アーチファクトに対応するかどうかを判定するプロセスの1実施形態を示す。図11のプロセスはステップ181から始まり、そこでは近傍ブロックNearFutureAIQ、NearPastAIQ、NearFutureAW、NearPastAWの平均値が計算される。近傍ブロックのブロック平均が求められると、プロセスはブロック平均と現在のコラムの平均の差を求める(ステップ183)。即ち、以下の値を計算する。
【0081】
【数12】
Figure 0004237441
式中、Mean(NPAIQ)、Mean(NFAIQ)は、近傍ブロックNearPastAIQ、NearFutureAIQのコラム平均値の平均であり、Mean(NPAW)、Mean(NFAW)は、近傍ブロックNearPastAW、NearFutureAWのコラム平均値の平均である。
【0082】
ステップ185では、プロセスは現在のコラムの画像データ(AIQ画像データとAW画像データの両方)に狭帯域が存在するかどうかを判定する。狭帯域がautoIQ画像データに存在することを確定する基準は以下の条件を含む。(a)現在のコラムの平均と近傍ブロックの平均の差が大きいこと。例えばabs(Diff1AIQ),abs(Diff2AIQ)≧6及び(b)Diff1AIQ、Diff2AIQが同じ符号であること。即ち、現在のコラムの平均が両方の近傍ブロックの平均よりもかなり低いかかなり高いこと。及び(c)近傍ブロックの平均の差abs(Diff1AW−Diff2AW)が小さい(例えば<3)ことである。上記の各条件を満たす場合、狭帯域がAIQ画像データで識別される。
【0083】
同様に、上記の基準をautoWidth画像データにも適用する。即ち、以下の各条件を満たす場合、つまり、(a)abs(Diff1AW),abs(Diff2AW)≧6及び(b)Diff1AW、Diff2AWが同じ符号であること。即ち、現在のコラムの平均が両方の近傍ブロックの平均よりもかなり低いかかなり高いこと。及び(c)(Diff1AW−Diff2AW)が小さいこと(例えば<3)を満たす場合、狭帯域がAW画像データに存在する。
【0084】
狭帯域がAIQ画像データ又はAW画像データに存在するかどうかを判定した後、プロセスはステップ187へと続き、そこではコラムが狭帯域アーチファクトに対応するかどうかの最終的な判定がAIQ画像データ及びAW画像データの現在の状態、また狭帯域の識別のヒストリーに基づいて行われる。第1に、狭帯域が現在のコラム又は先行する2つのコラムのいずれかのAIQ画像データに存在するならば、現在のAIQコラムは「狭帯域アーチファクト」として示される。第2に、狭帯域が現在のコラム又は先行する2つのコラムのいずれかのAW画像データで検出されているならば、現在のAWコラムは「狭帯域アーチファクト」として示される。狭帯域アーチファクトフラグがAIQコラムとAWコラムの両方ではなくそのいずれかで設定されるならば、現在のコラムは狭帯域アーチファクトに対応すると識別される(即ち、狭帯域フラグが設定される)。
【0085】
上記に説明した図6、7及び8のエッジ検出動作に含まれる、現在のコラム又は次の2つのコラムが狭帯域アーチファクトに対応するかどうかの判定以外に、狭帯域フラグはエッジ検出動作全ての最終チェックとして使用することができる。全てのエッジ検出動作に対して、エッジを検出した後、また次の2つのコラムのいずれかで狭帯域が検出された場合、そのエッジは捨てられエッジ検出が再開する。
【0086】
図12は、ピクセルコラムが自動エッジ予測データコラムであるかどうかを判定するプロセスの1実施形態を示す。図12のプロセスはステップ191から始まり、そこではautoWidth画像データの近傍ブロックNearFutureAW及びNearPastAWそれぞれのブロック平均値と、autoWidth画像データの離れた近傍ブロックFarFutureAW及びFarPastAWそれぞれのブロック平均値の計算を行う。近傍ブロックのブロック平均を計算する場合、プロセスはブロック内のコラムの平均(アベレージ)を単に計算する。しかしながら、離れた近傍ブロックの平均を計算する場合は、プロセスはそのブロックの高いコラム平均と低いコラム平均を落とし、残りのコラム平均を使用してブロック平均を決定する。
【0087】
ステップ193では、離れた近傍ブロックの平均の差、近傍ブロックの平均と現在のコラムの平均の差を計算する。即ち、以下の通りである。
【0088】
【数13】
Figure 0004237441
式中、Mean(NPAW)、Mean(NFAW)は、近傍ブロックNearPastAW、NearFutureAWのコラム平均値の平均であり、Mean(FPAW)、Mean(FFAW)は、離れた近傍ブロックFarPastAW、FarFutureAWのコラム平均値の平均である。
【0089】
ステップ195では、プロセスはステップ193で計算した差に基づいてコラムの状態が自動エッジ予測装置であるか否かを識別する。具体的には、NearBlockDiffAW及びFarBlockDiffAWの両方がグレーレベルの閾値よりも大きいかどうかを識別する。即ちコラムがバッカ・マテリアルと実際のドキュメントとの間のエッジ境界又は該エッジ境界付近にあるならば、先行する近傍ブロックの平均はドキュメントを示し後方のブロックの平均はブラックバッカを示すはずなので、この差が大きくなる。1実施形態では、優れた自動エッジ予測データの性能を提供するために30グレーレベルよりも大きい閾値の差が決定された。
【0090】
図13は、ピクセルコラムが幅検出バッキングに対応するかどうかを判定するプロセスの1実施形態を示す。図13のプロセスはステップ201から始まり、そこでは近傍ブロックNearPastAW及びNearFutureAWのコラム平均値のブロック平均値Mean(NPAW)及びMean(NFAW)を計算する。ステップ201はまた、離れた近傍ブロックFarPastAW及びFarFutureAWのコラム平均値のブロック平均値Mean(FPAW)及びMean(FFAW)を計算する。さらに、ステップ201は、離れた近傍ブロックFarPastAIQ及びFarFutureAIQのコラム平均値のブロック平均値Mean(FPAIQ)及びMean(FFAIQ)を計算する。
【0091】
上記のように、近傍ブロックのブロック平均を計算する際には、プロセスはブロック内のコラムの平均(アベレージ)を単に計算すればよい。しかしながら、離れた近傍ブロックの平均を計算する際には、プロセスはブロック内の高いコラム平均と低いコラム平均を落とし、残りのコラム平均を使用してブロック平均を決定する。
【0092】
プロセスはステップ203へと続き、そこではバッキング検出パラメータがステップ201で計算したブロック平均値から計算される。一般に、離れた近傍ブロックの両方が幅検出バッキングに対応するならば、離れた近傍ブロックの平均の差は小さい。同様に、現在のコラムと近傍ブロックの差も小さい。さらに、画像データが幅検出バッキングに対応するならば、離れた近傍ブロックの平均は低いことが予測できる。さらに、画像データがバッキングに対応するならば、autoWidth画像データとautoIQ画像データのグレーレベルの差(ホワイトバッキング対ブラックバッキング)は大きいままのはずである。上記の条件が与えられて、ステップ203は以下のバッキング検出パラメータ、即ちFarBlockDiffAW(式(17)で与えられる)、Diff1AW及びDiff2AW(式(14)及び(15))及び先行するブロックのAIQ画像データとAW画像データのブロック平均の差を以下に示すように計算する。
【0093】
【数14】
Figure 0004237441
【0094】
ステップ205では、プロセスはブロック平均及びバッキング検出パラメータを用いて現在のコラムが幅検出バッキングに対応するかどうかを判定する。具体的には、式(19)で与えられる以下の条件が満たされるならば、現在のコラムは検出バッキングに対応することになる。
【0095】
【数15】
Figure 0004237441
【0096】
式(19)の最後の条件によって、非常に濃いドキュメントが検出バッキングに対応すると誤って識別されるのを防止することができる。非常に濃いドキュメントの場合、AutoWidthプレスキャンとAutoIQプレスキャンのドキュメント領域のグレーレベルの差が非常に小さい。ドキュメント領域のグレーレベルの差(ホワイトバッキング透き通し対ブラックバッキング透き通し)は透明ドキュメントの場合は大きい。このことと、AutoWidth画像データのブラックバッカと(ブラックバッカを透き通す)ドキュメントのグレーレベルの僅かな差が、透明ドキュメントが幅検出バッキングに対応すると識別する。したがって、エッジとして検出することを未然に防ぐことができる。
【0097】
1実施形態では、3〜5のBlockThrsh、20のBackerThrsh及び60のDarkDocThrshを用いた。しかしながら、当業者なら、システムの要件に基づいて他の値を使用できることを理解するであろう。
【0098】
図7及び8の検出動作で幅検出バッキングフラグを使用する以外に、検出バッキングコラムフラグは、任意の検出動作で識別された誤ったエッジを検出するのに有用である。より具体的には、任意の検出動作がエッジを識別した後、ホワイト縞の幅に対応するコラム数より広いスキッピングが、走査システムにおいて幾つかの透明ドキュメントのうち1つのエッジに現れたならば、その画像データは検出バッキングに対応すると判定され、そのエッジは捨てられる。この追加的なフェールセーフチェックは、(エッジの検出の信頼性があまりない)透明ドキュメントの検出に有用である。
【0099】
4つの異なる検出動作(即ち、ステップ110、112、114及び116)を用いることで、4つの異なるエッジ検出結果を識別できる。対立を緩和するために、図3のステップ126は検出前動作を実行する。ステップ126で実行できるエッジ検出前動作の一例を以下に説明する。検出前動作の説明にあたって、ステップ110の検出動作を検出テスト1と称し、ステップ112の動作を検出テスト2と称し、ステップ114の動作を検出テスト3と称し、ステップ116の動作を検出テスト4と称する。
(A) 検出テストのうち1つだけがエッジを識別した場合、その検出動作によって識別されたエッジ検出結果をドキュメントエッジと判定する(透明ドキュメントが識別されなかった場合)。
(B) 検出テスト1でエッジを検出しなかった場合、以下の先行規則を適用する。
(1) 他の3つの検出テストのうち2つだけがドキュメントエッジを識別したならば、最も先に検出したエッジがドキュメントエッジとして作用する。しかしながら、テスト2が最も早くエッジ検出を行って透明ドキュメントが検出されたならば、エッジは宣言されない。
(2) 他の検出動作3つ全てがエッジを識別し、検出テスト2が識別したエッジが、テスト3で識別したエッジ又はテスト4で識別したエッジのいずれかに合致するならば、テスト2で検出したエッジがドキュメントエッジと判定される。そうではなく、他の2つのテストに合致しない場合は、3つのテストで最も早く検出したエッジがドキュメントエッジと判定される。
(C) 検出テスト1がエッジを識別し他の検出テストの1つだけがエッジを識別した場合、テスト1が常に優先する。
(D) 最後の場合は、検出テスト1(規則7)がエッジを識別し他の2つ以上のテストもエッジを識別した場合である。この場合は以下の規則を適用する。
(1) 全ての規則がトリガされる場合、
a) テスト2及び3の検出結果が合致しこれらがテスト1の検出よりも早く行われた場合、テスト2の検出結果はテスト1の検出結果を無視することができる。又は、テスト2の検出が最も早く、他のどの規則にも合致せず、先行するコラム(n+3、n+4、n+5)の標準偏差値が小さく例えば50未満である場合、テスト2のエッジ検出結果がテスト1の検出結果よりも優先する(透明ドキュメントが検出されなかった場合)。
b) テスト3の検出が最も早い検出で、他のテストが互いに合致せず、コラム(n+3、n+4、n+5)の標準偏差値が小さい場合、テスト3の検出結果はテスト1の検出結果を無視することができる。
c) 他の組み合わせの場合、テスト1の検出結果が優先する。
(2) テスト2がエッジを識別しなかった場合、テスト3及びテスト4のエッジ検出結果はテストのエッジ検出結果を無視することができない。
(3) 検出テスト1、2及び4だけがエッジを識別するためのテストである場合、
a) 3つ全ての検出テスト結果が合致するか又はテスト1が最も早い検出である場合、テスト1のエッジ検出結果がドキュメントエッジとして有効である。
b) テスト2及び4のエッジ検出結果が合致しこれらがテスト1よりも早く検出された場合、テスト2で検出したエッジはテスト1のエッジを無視する。又はテスト2のエッジ検出が最も早く、他のどの規則にも合致せず、コラム(n+3、n+4、n+5)の標準偏差値が小さく、透明ドキュメントが識別されていない場合、テスト2のエッジ検出結果がテスト1よりも優先する。
c) テスト4の検出が最も早くテスト1と2の検出結果(規則7及び9)が合致せず、コラム(n+3、n+4、n+5)の標準偏差値が小さい場合、テスト4の検出結果がテスト1を無視してドキュメントエッジを識別する。
(4) 検出テスト1、2及び3がエッジを識別し、テスト3の検出が最も早く、テスト1と2の検出結果が合致しない場合、テスト3の検出結果(規則8)がテスト1の結果を無視する。
【0100】
検出前動作を使用してエッジの検出結果を調整した後、ステップ126のプロセスは最終的なエッジ照合動作を実行して識別したドキュメントエッジの確実性を判定する。ドキュメントエッジが検出テスト1及び2から検出されなかった場合、ドキュメントエッジの確実性は低い。ドキュメントエッジを実際の物理的ドキュメントエッジに確実に対応させるために、プロセスは近傍コラム(好ましくは、コラムn+3、n+4、n+5)を調査することでドキュメントエッジの高標準偏差値(例えば、>25.0)を探す。これらの近傍コラムの高標準偏差は、エッジにテキスト/ラインアートがあることを示す。もしあれば、ドキュメントエッジの検出は遅かった可能性がある。即ち検出したエッジはドキュメント内にあることになる。このような場合、検出したドキュメントエッジは無視される。
【図面の簡単な説明】
【図1】本発明の教示にしたがって動作可能なドキュメントハンドラ及び画像形成システムの一部の概略図である。
【図2】検出バッキングで走査するように位置している図1のドキュメントハンドラ及び画像形成システムの概略図である。
【図3】本発明の教示にしたがって走査したドキュメントのエッジを検出する方法の実施の形態を例示するフローチャートである。
【図4】本発明の概念によるエッジ検出方法の実施の形態で得られたプレスキャン画像データを表す図である。
【図5】プレスキャン画像データから統計量をコンパイリングするプロセスの実施の形態を例示するフローチャートである。
【図6】本発明の教示による平均値の差に基づくエッジ検出動作の実施の形態を例示するフローチャートである。
【図7】本発明の概念による1次及び2次統計量に基づいたエッジ識別方法の実施の形態を例示するフローチャートである。
【図8】本発明の概念による4次統計量を用いるエッジ識別動作を示すフローチャートである。
【図9】本発明の概念による第4のエッジ識別を実行するプロセスを示すフローチャートである。
【図10】本発明の概念によるコラムタイプのパラメータを判定するのに使用するプレスキャン画像データの概略を示す図である。
【図11】ピクセルコラムが狭帯域アーチファクトに対応するかどうかを判定するプロセスの実施の形態を示すフローチャートである。
【図12】ピクセルが自動エッジ予測データコラムであるかどうかを判定するプロセスの実施の形態を例示するフローチャートである。
【図13】ピクセルコラムが検出バッキングに対応するかどうかを判定するプロセスの実施の形態を示すフローチャートである。
【符号の説明】
16 ドキュメント
22 バッキングローラ
32 幅検出バッキング
50 プレスキャン画像データ
52 autoIQ画像データ
54 autoWidth画像データ

Claims (2)

  1. (a) ドキュメントの一部を走査して画像データのセットを得るステップと、
    (b) 1次関数である第1の関数を用いて前記画像データから第1の値のセットを計算するステップと、
    (c) 2次関数である第2の関数を用いて前記画像データから第2の値のセットを計算するステップと、
    (d) 複数の第1の値の差の関数である第1の傾き値を決定するステップと、
    (e) 複数の第2の値の差の関数である第2の傾き値を決定するステップと、
    (f) 前記第1の傾き値と前記第2の傾き値から前記ドキュメントの検出エッジを決定するステップと、
    (g)前記画像データから、それぞれが4次統計量である第3の値のセットを計算するステップと、
    (h) 前記第3の値のセットから前記ドキュメントの第2の検出エッジを決定するステップと、
    (i) 前記検出エッジと前記第2の検出エッジを調整してドキュメントエッジを得るステップと、
    (j) それぞれが複数の第1の値の平均値を含む複数のブロック値を計算するステップと、
    (k) 複数の近傍ブロック値を用いて前記ドキュメントエッジを照合することによりドキュメントエッジの確実性を求め、ドキュメントエッジの該確実性が所定の値より低い場合には該ドキュメントエッジを無視するステップと、
    と、を含む、走査システムにおいてドキュメントのエッジを自動的に検出する方法。
  2. (a) ドキュメントの一部を走査して画像データのセットを得るステップと、
    (b) 2次関数である第1の関数を用いて前記画像データから第1の値のセットを計算するステップと、
    (c) 複数の第1の値の差の関数である第1の傾き値を決定するステップと、
    (d) 複数の第1の値の合計を含むブロック合計値を生成するステップと、
    (e) 前記第1の傾き値と前記ブロック合計値から検出したドキュメントの検出エッジを決定するステップと、
    (f) 4次関数である第2の関数を用いて画像データから第2の値のセットを計算するステップと、
    (g) 前記第2の値のセットから前記ドキュメントの第2の検出エッジを決定するステップと、
    (h) 前記検出エッジと第2の検出エッジとを調整してドキュメントエッジを得るステップと、
    (i) 複数の近傍ブロック値を用いて前記ドキュメントエッジを照合することによりドキュメントエッジの確実性を求め、ドキュメントエッジの該確実性が所定の値より低い場合には該ドキュメントエッジを無視するステップと、
    を含む、走査システムにおいてドキュメントのエッジを自動的に検出する方法。
JP2002020809A 2001-02-01 2002-01-30 ドキュメントエッジ検出方法 Expired - Fee Related JP4237441B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/775,367 US6930804B2 (en) 2001-02-01 2001-02-01 System and method for automatically detecting edges of scanned documents
US775367 2001-02-01

Publications (2)

Publication Number Publication Date
JP2002251606A JP2002251606A (ja) 2002-09-06
JP4237441B2 true JP4237441B2 (ja) 2009-03-11

Family

ID=25104174

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002020809A Expired - Fee Related JP4237441B2 (ja) 2001-02-01 2002-01-30 ドキュメントエッジ検出方法

Country Status (4)

Country Link
US (1) US6930804B2 (ja)
EP (1) EP1229715B1 (ja)
JP (1) JP4237441B2 (ja)
DE (1) DE60228149D1 (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004110445A (ja) * 2002-09-19 2004-04-08 Hitachi Ltd 文書管理方法、プログラムおよびシステム
JP4611160B2 (ja) * 2005-09-21 2011-01-12 株式会社Pfu 画像読取装置
US8027839B2 (en) * 2006-12-19 2011-09-27 Nuance Communications, Inc. Using an automated speech application environment to automatically provide text exchange services
KR101411548B1 (ko) * 2007-11-05 2014-07-07 삼성전자주식회사 이미지 센서, 컬러 필터 어레이, 및 촬상 장치
WO2010056238A1 (en) * 2008-11-13 2010-05-20 Hewlett-Packard Development Company, L.P. Systems and methods for edge detection during an imaging operation
JP4844657B2 (ja) * 2009-07-31 2011-12-28 カシオ計算機株式会社 画像処理装置及び方法
TWI420357B (zh) * 2009-08-28 2013-12-21 Pixart Imaging Inc 觸控系統及其指示物座標偵測方法
CN102033657B (zh) * 2009-09-24 2014-04-16 原相科技股份有限公司 触控***及其指示物高度侦测方法和指示物坐标侦测方法
JP5736731B2 (ja) * 2010-10-29 2015-06-17 富士ゼロックス株式会社 検知装置及び画像形成装置
EP2710792B1 (de) * 2011-05-16 2015-10-14 Roth + Weber GmbH Verfahren zur detektion der breite und position von dokumenten anhand von bildinformationen in einem grossformatigen scanner-system
US8731323B2 (en) * 2011-11-23 2014-05-20 Stmicroelectronics Asia Pacific Pte Ltd. General banding and codec banding artifact removal
WO2018109811A1 (ja) * 2016-12-12 2018-06-21 株式会社Pfu 原稿読取装置
TWI748751B (zh) * 2020-11-17 2021-12-01 虹光精密工業股份有限公司 壓板組件可拆式文件掃描裝置
CN112613420B (zh) * 2020-12-26 2022-09-16 数源科技股份有限公司 用于人脸识别的降维签名方法
CN112614069B (zh) * 2020-12-26 2022-08-30 数源科技股份有限公司 人脸图片降维模糊预处理方法

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4648120A (en) * 1982-07-02 1987-03-03 Conoco Inc. Edge and line detection in multidimensional noisy, imagery data
JPS62200976A (ja) * 1986-02-28 1987-09-04 Dainippon Screen Mfg Co Ltd 高分解能2値化画像出力装置
US5017963A (en) * 1990-05-07 1991-05-21 Xerox Corporation Image input device providing background detection arrangement
US5198853A (en) * 1990-11-16 1993-03-30 Konica Corporation Document size detection apparatus
US5133022A (en) * 1991-02-06 1992-07-21 Recognition Equipment Incorporated Normalizing correlator for video processing
US5214294A (en) 1991-04-19 1993-05-25 Fuji Photo Film Co., Ltd. Scan reading method including density measuring and edge detection
JP3276985B2 (ja) * 1991-06-27 2002-04-22 ゼロックス・コーポレーション イメージピクセル処理方法
US5384621A (en) * 1994-01-04 1995-01-24 Xerox Corporation Document detection apparatus
US6021222A (en) * 1994-08-16 2000-02-01 Ricoh Co., Ltd. System and method for the detection of a circle image for pattern recognition
US5528387A (en) * 1994-11-23 1996-06-18 Xerox Corporation Electronic image registration for a scanner
US5729024A (en) * 1995-05-08 1998-03-17 Ricoh Company, Ltd. Original edge detecting system and optical sensor
JP3427582B2 (ja) * 1995-08-21 2003-07-22 富士ゼロックス株式会社 原稿端検出装置、原稿サイズ検出装置および原稿端検出方法
US5790211A (en) * 1995-09-08 1998-08-04 Xerox Corporation Platen cover for a digital document scanner with electrically switchable reflectance modes
US5748344A (en) * 1995-09-25 1998-05-05 Xerox Corporation System and method for determining a location and orientation in a black and white digital scanner
US6046828A (en) * 1997-03-06 2000-04-04 Xerox Corporation Method and system for automatically detecting an edge and width of a document utilizing a scanning system
US6198845B1 (en) * 1997-07-01 2001-03-06 Xerox Corporation Method for determining document background for adjusting the dynamic range of an image of the document
US5995661A (en) * 1997-10-08 1999-11-30 Hewlett-Packard Company Image boundary detection for a scanned image
US6005683A (en) * 1997-12-05 1999-12-21 Hewlett-Packard Company Document edge detection by linear image sensor
US6195475B1 (en) * 1998-09-15 2001-02-27 Hewlett-Packard Company Navigation system for handheld scanner
US6166394A (en) * 1998-12-07 2000-12-26 Xerox Corporation Dual background document scanner to eliminate hole printouts
US6839466B2 (en) * 1999-10-04 2005-01-04 Xerox Corporation Detecting overlapping images in an automatic image segmentation device with the presence of severe bleeding

Also Published As

Publication number Publication date
DE60228149D1 (de) 2008-09-25
US20020126330A1 (en) 2002-09-12
JP2002251606A (ja) 2002-09-06
US6930804B2 (en) 2005-08-16
EP1229715B1 (en) 2008-08-13
EP1229715A2 (en) 2002-08-07
EP1229715A3 (en) 2004-12-22

Similar Documents

Publication Publication Date Title
US6741741B2 (en) System and method for automatically detecting edges of scanned documents
JP4237441B2 (ja) ドキュメントエッジ検出方法
US10397412B2 (en) Image processing apparatus, image processing method for estimating cause of abnormality having occurrenced in image processing apparatus
JP4844247B2 (ja) 画像処理装置および画像処理プログラム
US10129415B2 (en) Image reading apparatus, image forming apparatus, image reading method, and storage medium
US5959290A (en) Image input device and method for providing scanning artifact detection
US10194051B2 (en) Device for detecting amount of skew in document and image processing apparatus
JP5532176B1 (ja) 画像読取装置および画像形成装置
US8837018B2 (en) Image scanning apparatus scanning document image and image forming apparatus including image scanning apparatus
JPH10271286A (ja) ドキュメントエッジ自動検出方法及びドキュメントエッジ自動検出システム
US11140295B2 (en) Image reading apparatus and method configured to correct tilt image data
US6122393A (en) Image input device and method for providing scanning artifact detection
JP2019161418A (ja) 画像読取装置、画像処理システム、制御方法及び制御プログラム
US6198835B1 (en) Image input device and method for providing scanning artifact detection
US8837007B2 (en) Image processing method for extracting an area of a document from a read image
JP5777805B2 (ja) 大判のスキャナシステムにおいて画像情報に基づきドキュメントの幅及び位置を検出する方法
EP0929180A1 (en) Image input device and method for providing scanning artifact detection
US20040114147A1 (en) Electronic image registration based on chrominance channel
US6246781B1 (en) Image input device and method for providing scanning artifact detection
CN113489856A (zh) 图像读取装置
JP7110895B2 (ja) 画像読取装置、画像形成装置
JP6519808B2 (ja) 画像処理装置
JP4160894B2 (ja) 画像読取処理装置
JP2015019339A (ja) 読取装置、補正方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050131

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080610

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080617

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080827

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081118

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081218

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111226

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees