JP4994017B2 - 文書画像を示す走査データを処理するための方法 - Google Patents

文書画像を示す走査データを処理するための方法 Download PDF

Info

Publication number
JP4994017B2
JP4994017B2 JP2006339320A JP2006339320A JP4994017B2 JP 4994017 B2 JP4994017 B2 JP 4994017B2 JP 2006339320 A JP2006339320 A JP 2006339320A JP 2006339320 A JP2006339320 A JP 2006339320A JP 4994017 B2 JP4994017 B2 JP 4994017B2
Authority
JP
Japan
Prior art keywords
text
image
parameter set
background
objects
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006339320A
Other languages
English (en)
Other versions
JP2007174654A (ja
Inventor
ファン ジガン
エー. シュウェイド スチュアート
イー. バントン マーティン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xerox Corp
Original Assignee
Xerox Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xerox Corp filed Critical Xerox Corp
Publication of JP2007174654A publication Critical patent/JP2007174654A/ja
Application granted granted Critical
Publication of JP4994017B2 publication Critical patent/JP4994017B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/162Quantising the image signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Analysis (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Image Processing (AREA)

Description

本発明は、画像セグメント化(セグメンテーション)に関し、詳細には、文書画像を示す走査されたデータを処理する方法であって、高い再生画質を得るためにより好適に画像の背景及びテキスト部分を検出する方法に関する。
本発明の例示的な実施の形態は、多数の抽出された一定の色領域(「MECCA」)を備えた混合ラスターコンテント(「MRC」)画像を生成するための画像セグメント化方法を対象とする。MRCモデリングは、高い圧縮比を達成し、一方で良質に構成された画質を維持可能な強力な画像表示方法である。MECCAモデリングは、比較的分解能を必要としないこと、内在するテキスト強調できること、ならびにノイズ低減を特徴とする利点を有する。MECCAモデルは、1つの背景レイヤ(層)、N個のフォアグラウンドレイヤ、及びN個のマスクレイヤ(ここでNは非負整数である)を含んでいる。背景レイヤは連続階調ビットマップであってもよいが、フォアグラウンドレイヤは一定色に制限される。
1つの画像のMRC/MECCA表示を生成するためには、セグメント化が必要である。セグメント化アルゴリズムは一般に、4つのステップ、即ち、オブジェクト抽出、オブジェクト選択、カラー・クラスタリング、及び結果生成から構成される。第1のステップでは、テキスト及び他のオブジェクトが画像から抽出される。次に、抽出されたオブジェクトは、フォアグラウンドレイヤに表示されるべきかどうかを判断するために、色の一定性及びその他の特徴に対して検査される。第3のステップでは、選択されたオブジェクトが、色空間内でクラスタ化される。最終的に画像は、それぞれのフォアグラウンドレイヤが同一色のクラスタからのオブジェクトをコード化するようにセグメント化される。
ウインドウ処理は、文書画像セグメント化における別の概念である。ウインドウ処理は、ページを背景境界によって分離される異なる領域に仕切る。ウインドウ処理は、最初に、異なるテキスト・オブジェクト及びウインドウを分離するページ背景を識別する。ウインドウは、画像及び図形(「合成画像」と称される)のようなものとして分類される。グラフィック・ウインドウは、更に再帰的に処理される。グラフィック・ウインドウの局所背景が検出される。テキスト及び(1つのウインドウ内の)ウインドウは局所背景によって分離される。これら(1つのウインドウ内部の)ウインドウは分類される。すべてのオブジェクトが分離されるまで、このプロセスは繰り返される。
MRC/MECCAセグメント化の一部として適用可能なウインドウ処理が必要である。これは、オブジェクトとしてテキスト及びその他の詳細を抽出し、これらオブジェクトは、フォアグラウンドレイヤにおいてコード化されることになる候補である。
ページ背景検出は一般に、走査済み文書画像セグメント化のための最初のステップである。検出された背景は、さらに、テキスト文字、画像、及び図形を含むページにおいて異なるオブジェクトを分離するために適用されることができる。ページ背景検出は、また、背景強調のような用途に対しても有用である。既存のページ背景検出方法の多くは、全体的(全域的)なしきい値処理に基づく。具体的には、しきい値はまず、画素強度の全体的なヒストグラムから抽出される一部の統計値を使用して決定される。しきい値は、そのページ上のすべての画素に適用される。上記のアプローチは一般に妥当な結果を生成するが、テキスト領域、及び背景が黒っぽい対象と近接するその他の領域で失敗することがある。テキスト(及びより黒っぽい)領域における背景は、空いた白色領域のそれとは異なる統計的分布を有していることが多い。多くの理由で、例えばICE(統合的キャビティ効果)や、JPEG(ジェイペグ)リンギング(ringing)アーチファクト(一部の走査画像は軽くJPEGで圧縮されてファイルサイズ及び/又はバンド幅を低減させ、圧縮が軽いと導入されるリンギングは目に見えないこともあるが、ページ背景検出結果を変化させるのに十分に強いことがある)などの利用で黒っぽくなる傾向がある。背景検出中におけるエラーは、背景強調のような用途に対しては有効である可能性があるが、MRC/MECCAモデルをセグメント化するような他の用途に対しては不適当な結果を導くことがある。しきい値を全体的に低下させて(更なる領域が背景として検出される)問題を回避することができる。しかしながら、画像領域のような明るく背景でない部分を背景として誤って判別する危険がある。局所しきい値処理方法が、テキスト及び背景を分離するために存在する。こうした方法は、しきい値を確立するために局所統計値に依拠する(を用いる)。これらの方法は、テキスト及び他の小さな細部を効果的に抽出することができ、したがってOCRなどの用途に適している。しかしながら、これら方法は、画像用ウインドウなどの大きなオブジェクト見出すことができず、ページ背景検出に対しては一般に不適当である。たとえば、「非ページ背景」として分類すべきところ、一般的には、色背景上のテキストは、「テキスト」及び「背景」として分類する。さらに、局所しきい値処理法は、一般に多くの計算を必要とする。
データを背景又はテキストの一方にセグメント化することが重要であることは、異なる画像の種類に応じて、対応する圧縮アルゴリズムを使用することがはるかに効率的であるという理由からである。たとえば、JPEGが画像のための効率的な圧縮アルゴリズムである一方、他のアルゴリズムは特にテキストなどの二値画像向けに設計される。走査画像データの異なる部分に対して異なる圧縮アルゴリズムを使用することは、再生された高画質のデータに対する高圧縮比という利点を提供する。
したがって、背景をより正確に識別することができる走査画像データ、及びこの走査画像データ内のテキストデータをより好ましくセグメント化する必要がある。
より広範囲にウインドウ表示情報を利用するMRC/MECCAセグメント化方法を提供する。より詳しくは、画像は、背景及び異なる複数のウインドウに分割される。各ウインドウは、画像又は図形のいずれかとして分類される。このようなウインドウ表示分類は、セグメント化方法内での意思決定及びパラメータ選択を最適化する。
本実施の形態に従って、ページ背景検出方法はまた、2つのしきい値構成に基づいて開示される。2つのヒストグラムが作成され、テキスト・ヒストグラムはテキスト(及びより黒っぽい)領域から、白色領域ヒストグラムは非テキスト(及びより明るい)領域から作成される。近傍に黒っぽい画素が存在する画素はテキスト・ヒストグラムに寄与し、そうでない画素は、白色領域ヒストグラムに寄与する。2つのしきい値は、2つのヒストグラムから生成され、テキスト領域及び非テキスト領域に別々に適用される。このような検出方法は、明るい画像領域を犠牲にすることなく、テキスト及び背景をきれいに分離することができる。
したがって、再生画像品質を改良し圧縮比を高めるためのセグメント化データを含む文書画像を表わす走査データを処理するための方法が提供される。この方法は、走査データを背景レイヤ及びフォアグラウンドレイヤにセグメント化することを含む。走査データのフォアグラウンドレイヤは、複数のウインドウで表示され、各ウインドウは背景レイヤデータと隣接するように識別され得る選択領域を有する。オブジェクトは複数のウインドウからオブジェクトが抽出され、ここでオブジェクトはテキスト、図形及び画像オブジェクトから構成され、それぞれが背景レイヤデータに対するコントラストの特殊性によって識別可能である。テキストオブジェクトは、比較的低いレベルのコントラストによって識別され、図形オブジェクトは次のレベルのコントラストで、画像オブジェクトは、比較的高いレベルのコントラストによって識別される。さらに個々のレベルのコントラストは予め選択されたしきい値によって定義される。
背景レイヤのセグメント化は、画素強度を表わす複数のヒストグラムを作成し、該テキスト・ヒストグラムの1つが走査画像の黒っぽい領域におけるテキストを表わし、白色領域ヒストグラムは走査画像の非テキスト(より明るい)領域を表わす。異なるしきい値は、ページ背景レイヤを識別するためのヒストグラムに適用される。
本発明は、改良された高圧縮比及び良好な再構築画像品質を実現するために走査データをセグメント化することに関する。上述のように、異なるタイプの走査データは、異なるタイプの圧縮アルゴリズムに従ってより効率的に圧縮されることができる。画像が緩慢に変化する走査画像データ部分(ピクチャ)は、JPEGのような画像圧縮アルゴリズムによって良好に圧縮される。遷移領域は、バイナリ圧縮器によって良好に圧縮される。したがって、セグメント化プロセスは、基本的には画像を幾つかのレイヤにセグメント化し、緩慢に変化する情報を伝送するレイヤが画像圧縮器で圧縮され、急激な遷移を伝送するレイヤはバイナリ圧縮器によって圧縮される。
本発明は、主として、走査画像データの「ウインドウ処理」、及びページ背景レイヤ検出の識別に対する2つのしきい値処理技法に関する。このウインドウ処理は、ページ背景、一般に用紙の白い部分を使用することに関し、ページ上のオブジェクトを分離することである。オブジェクトによって、一部のテキストや文字、図形表示、又は画像表示が示される。ウインドウ内のオブジェクトデータを識別し、それを背景データからウインドウ内のフォアグラウンド・レイヤデータをより正確な方法で処理することによって、データ・セグメント化はより効率的に実行され、データはより効率的に圧縮されてより正確に再生される。主な目的は、テキスト材料を他のオブジェクトデータから区別しフォアグラウンドレイヤとして正確に分離することである。たとえば、画像データが一部のテキストを含む画像から構成される場合、画像内の非テキストの小さなオブジェクトとテキストは画素の強度により基づくため、テキストと非常に類似して見えるので、混同されないことが重要である。
特に図1を参照すると、画像1は、テキストデータ2、画像データ4、及び図形データ6から構成される。画像のこれらの部分のすべてが白色背景によって隣接されていることが理解できる。図2は、従来の背景検出方法とともに発生する可能性がある問題を示し、ここで、単一のしきい値は、画素データのヒストグラムの全体的しきい値処理に基づいて適用される。この場合、テキスト及び白色ページ背景間の領域の分離は、テキストの領域内の隣接する黒っぽい画素によってあまりきれいではない。その適用されたしきい値が高すぎると、このような部分のページ背景領域をはっきりと区別することはできない。あるいはまた、全体的しきい値処理が低下されてページ背景検出を向上させる場合、画像データのより白い領域8は背景レイヤとして混同される可能性がある。しかしながら、図4の再生された画像を図2及び図3と対照させることは、本件の方法が白色背景レイヤ、及びこれによるクリアで鮮明なテキスト部分をより高品質で再生を行なうことを立証する。
図5を参照すると、本発明は、ウインドウ処理情報をより広範囲に利用するMRC/MECCAセグメント化方法から構成される。図5を参照すると、ウインドウ処理10は、オブジェクト抽出20、オブジェクト選択30、カラー・クラスタリング40、及びコーディング50と組み合わされる。
ウインドウ処理10は、画像を複数のブロックに分けることを含んでいる。上述したように、各ウインドウは、背景によって分離される異なる領域にページを区分することを含む。したがって、画像は、ウインドウを画像及び図形のいずれかとして分類するために、背景ウインドウおよび異なるウインドウに区分される。以下に述べられるように、分類されたウインドウはオブジェクト抽出20、オブジェクト選択30、カラー・クラスタリング40、及び結果生成(コーディング)50のそれぞれにステップにおいて、意思決定及びパラメータ選択プロセスを最適化するために利用することができる。
図6を参照すると、オブジェクト抽出20のステップにおいて、抽出されるオブジェクトに対して、(オブジェクトとその環境との間に)強いコントラストが必要とされる。画像ウインドウには、背景及び図形のそれぞれのウインドウよりも、もっと厳しい条件(より強いコントラスト)が課せられる。これは、ノイズは画像ウインドウ内にある傾向が強いという事実による。より強いコントラスト要件は、これを演繹的知識として示す。したがって、潜在的オブジェクトから成る候補データは、抽出される(60)。オブジェクトが図形データ又は画像データを含むウインドウ内にない場合、テキスト・オブジェクトとして識別のために考慮され、第1のパラメータ・セットE1(64)がそのテキストオブジェクトを背景レイヤデータと区別するために適用される。そのパラメータ・セットE1(64)は、比較的低いレベルのコントラスト表示を含んでいる。そのオブジェクトが図形又は画像ウインドウ62のいずれかにある場合、該オブジェクトが図形ウインドウ66内にあると判断されることになり、第2のパラメータ・セットE2(68)が、背景レイヤデータとは対照的にウインドウ内で図形オブジェクトを識別するために適用される。パラメータ・セットE2(68)は、パラメータ・セットE1よりも高い次のレベル・コントラストによって識別される。オブジェクトが画像ウインドウにある場合、パラメータ・セットE3(70)は比較的高いレベルのコントラストを含むように適用される。パラメータ・セット値E1、E2、E3は、実験的データに基づいて予め定められている。適用されたパラメータ・セットの用途によって抽出され得る(72)オブジェクトは、これらは適切に分類されたオブジェクトリストに送信される(74)。すべてのコントラスト測定値は、特定の対象となるオブジェクトの環境に左右される。「環境」によって、隣接する画素を意味することを意図する。
オブジェクト選択ステップにおいて、オブジェクトは、色均一性に関して検査される。均一なオブジェクトのみがフォアグラウンドレイヤの候補としてさらに考慮される。また一方、異なる評価基準が、テキスト、図形、及び画像データに適用される。選択の基準となるためのしきい値は、画像ウインドウのオブジェクトに対して高く(より困難に)設定される。さらに詳しくは、選択パラメータS1は、ウインドウにないデータ、即ち、候補テキストデータに対して適用され(80)、パラメータ・セットS1が、比較的低いレベルの色均一性を表示する。第2のパラメータ・セットS2の適用は、ウインドウ内の図形オブジェクトに対して行なわれる(82)。第3のパラメータ・セットS3は、画像ウインドウ・データに適用される(84)。色均一性図形パラメータ・セットS3はパラメータ・セットS2より高く、このパラメータセットは低いパラメータ・セットS1よりも高い。さらに、パラメータ・セットは、実験的データに基づいて予め定められている。パラメータ・セットを適用して、候補オブジェクトに色均一性が不足していると決定されると、フォアグラウンドレイヤとしてのオブジェクト選択から削除される(86)。
図8のカラークラスタリング・ステップにおいて、オブジェクトは、各グループ内でオブジェクトが同じ色となるようにグループ化される。このクラスタリングは、最初に同じウインドウ内で実行され、そして同じタイプのウインドウ内で実行される。異なる種類のウインドウからのオブジェクトは、異なるクラスタに残存する。画像ウインドウにおける小さなクラスタ(オブジェクトを有するクラスタ)は、ノイズを表すことがよくあるので(背景として符号化され)廃棄される。より詳しくは、3つの区別可能なクラスタリング・パラメータ・セットはまた、候補オブジェクトに適用される。ウインドウの外側にある候補オブジェクト、即ち、テキスト・オブジェクトでは、第1のクラスタ・パラメータ読み取りセットC1の使用が加えられ(90)、同色のオブジェクトが比較的低いレベルにあることを判断する。図形オブジェクトでは、第2のパラメータ・セットC2が、ウインドウ内の図形オブジェクトを識別するために加えられる92。最後に、第3のパラメータ・セットC3は、候補画像オブジェクトに適用され、色均一性に対するしきい値が高いレベルに設定される。同一色を有するようにクラスタ化可能なオブジェクトは適切にクラスタ化される。
図9及び図10に関して、本実施の形態の別の特徴は、2つのしきい値処理を使用するページ背景検出方法に関して説明される。2つのヒストグラムは、一方がテキスト(及びより黒っぽい)領域から、さらに他方が非テキスト(及びより明るい)領域から作成される。その付近に(即ち、所定の周辺領域内に)黒っぽい画素があると、画素はテキスト・ヒストグラムに寄与する。そうでなければ、白色領域ヒストグラムに寄与する。2つのしきい値は、2つのヒストグラムから生成され、テキスト(より黒っぽい)領域と、非テキスト(より明るい)領域に別個に適用される。ヒストグラムは、それぞれ、背景領域、ブロック、テキスト領域、又はブロックから(100)の統計値を収集するために作成される。その統計値派分析され(102)、ヒストグラムからしきい値を導き出す(104)。
図10に関して、一実施の形態において、本発明の方法は、画像を分離ブロックにセグメント化することを含んでいる。すべての画素強度が所定値より大きい場合、ブロックは「背景」ブロックであると考えられる。そうでなければ、ブロックは、「テキストブロック」として分類される。候補ブロックが識別されると(106)、これらブロックは、黒色画素を含むか否かを判断するために検査される(108)。肯定判断の場合、第1のしきい値はテキスト・ヒストグラムを更新する(110)ために適用されて、テキストしきい値によって識別されるテキストデータを含む。否定判断の場合、ブロックは、第2のしきい値の適用に基づいて背景ヒストグラムを更新する(112)ために使用される。
図1は、セグメント識別、特にページ背景検出のために処理されるべきオリジナル画像の表示を示す図である。 図2は、従来方法の処理結果を示す図である。 図3は、代替的セグメント化方法の結果を示す図である。 図4は、本発明の方法によるページ背景再生のための高品質再生画像結果を示す図である。 図5は、ウインドウ情報に基づく本発明の画像セグメント化のための処理工程を示しているフローチャートである。 図6は、図5のオブジェクト抽出ステップの処理工程をより詳細に示すフローチャートである。 図7は、図5のオブジェクト選択ステップの処理工程をより詳細に示すフローチャートである。 図8は、図5のカラークラスタ化ステップの処理工程をより詳細に示すフローチャートである。 図9は、2つのしきい値処理を使用するページ背景検出方法のための処理工程を一般に示すフローチャートである。 図10は、図9の統計値収集ステップの処理工程をより詳細に示すフローチャートである。

Claims (1)

  1. テキスト、図形、又は画像等のオブジェクトを含むページを走査することによって得られた走査画像データを、圧縮する方法であって、
    前記走査画像データから、2つのしきい値処理を用いて背景を識別し、前記背景によって分離される前記ページの領域を複数のウインドウとして区分する、ウインドウ処理ステップと、
    各前記ウインドウ内からコントラストに基づいてオブジェクトを抽出するために、テキストオブジェクトを背景レイヤデータと区別するために第1のパラメータ・セットE1を適用し、図形オブジェクトと背景レイヤデータとを区別するために第2のパラメータ・セットE2を適用し、画像オブジェクトと背景レイヤデータとを区別するために第3のパラメータ・セットE3を適用し、抽出された各オブジェクトを、候補オブジェクトとして分類されたオブジェクトリストに送信する、オブジェクト抽出ステップと、
    前記候補オブジェクトの色均一性に関して検査する評価基準として、前記テキストオブジェクトに第1のパラメータ・セットS1を適用し、前記図形オブジェクトに第2のパラメータ・セットS2を適用し、前記画像オブジェクトに第3のパラメータ・セットS3を適用し、色均一性が不足していると決定された前記候補オブジェクトを、フォアグラウンドレイヤとしての前記オブジェクトリストから削除する、オブジェクト選択ステップと、
    同色の前記候補オブジェクトを識別するために、前記テキストオブジェクトに第1のパラメータ・セットC1を適用し、前記図形オブジェクトに第2のパラメータ・セットC2を適用し、前記画像オブジェクトに第3のパラメータ・セットC3を適用し、同一色を有する候補オブジェクトをクラスタ化する、カラー・クラスタリングステップと、
    前記クラスタ化された各候補オブジェクトを、それぞれ対応したコーディングによって圧縮するコーディングステップと、
    を含む、方法。
JP2006339320A 2005-12-21 2006-12-18 文書画像を示す走査データを処理するための方法 Expired - Fee Related JP4994017B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/313,980 US7379593B2 (en) 2005-12-21 2005-12-21 Method for image segmentation from proved detection of background and text image portions
US11/313980 2005-12-21

Publications (2)

Publication Number Publication Date
JP2007174654A JP2007174654A (ja) 2007-07-05
JP4994017B2 true JP4994017B2 (ja) 2012-08-08

Family

ID=38173559

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006339320A Expired - Fee Related JP4994017B2 (ja) 2005-12-21 2006-12-18 文書画像を示す走査データを処理するための方法

Country Status (2)

Country Link
US (1) US7379593B2 (ja)
JP (1) JP4994017B2 (ja)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8204306B2 (en) * 2004-06-14 2012-06-19 Xerox Corporation Method for image segmentation based on block clustering for improved processing of touching characters
JP4277218B2 (ja) * 2005-02-07 2009-06-10 ソニー株式会社 記録再生装置、その方法及びプログラム
US7664329B2 (en) * 2006-03-02 2010-02-16 Honeywell International Inc. Block-based Gaussian mixture model video motion detection
US7763876B2 (en) * 2007-04-06 2010-07-27 Xerox Corporation Gloss and differential gloss measuring system
US8218887B2 (en) * 2007-09-28 2012-07-10 Abbyy Software, Ltd. Enhanced method of multilayer compression of PDF (image) files using OCR systems
US7764893B2 (en) * 2008-01-31 2010-07-27 Xerox Corporation Use of customer documents for gloss measurements
US8077358B2 (en) * 2008-04-24 2011-12-13 Xerox Corporation Systems and methods for implementing use of customer documents in maintaining image quality (IQ)/image quality consistency (IQC) of printing devices
US8150106B2 (en) 2008-04-30 2012-04-03 Xerox Corporation Printer characterization, monitoring and diagnosis using dynamic test patterns generated by sensing and analyzing customer documents
US8208183B2 (en) * 2008-11-19 2012-06-26 Xerox Corporation Detecting image quality defects by measuring images printed on image bearing surfaces of printing devices
JP2010205067A (ja) * 2009-03-04 2010-09-16 Fujifilm Corp 領域抽出装置、領域抽出方法及び領域抽出プログラム
KR101058726B1 (ko) * 2009-11-11 2011-08-22 삼성전자주식회사 조명 성분을 제거하기 위한 이미지 보정 장치 및 방법
US8340363B2 (en) 2010-05-27 2012-12-25 Palo Alto Research Center Incorporated System and method for efficient interpretation of images in terms of objects and their parts
CN102456219B (zh) * 2010-10-14 2014-09-03 北大方正集团有限公司 光栅化方法和装置
US8306335B2 (en) * 2011-03-30 2012-11-06 Seiko Epson Corporation Method of analyzing digital document images
JP6205221B2 (ja) * 2013-09-20 2017-09-27 理想科学工業株式会社 印刷制御装置、及び、プログラム
US9740995B2 (en) * 2013-10-28 2017-08-22 Morningstar, Inc. Coordinate-based document processing and data entry system and method
CN105608459B (zh) 2014-10-29 2018-09-14 阿里巴巴集团控股有限公司 商品图片的分割方法及其装置
CN108961316B (zh) * 2017-05-23 2022-05-31 华为技术有限公司 图像处理方法、装置及服务器
US11995511B2 (en) 2018-02-08 2024-05-28 Digimarc Corporation Methods and arrangements for localizing machine-readable indicia
US10958807B1 (en) * 2018-02-08 2021-03-23 Digimarc Corporation Methods and arrangements for configuring retail scanning systems
US10880451B2 (en) 2018-06-08 2020-12-29 Digimarc Corporation Aggregating detectability metrics to determine signal robustness

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5767978A (en) 1997-01-21 1998-06-16 Xerox Corporation Image segmentation system
JP3731629B2 (ja) * 1998-03-11 2006-01-05 富士ゼロックス株式会社 画像処理装置、画像送信装置、画像処理方法、画像送信方法
DE19958553A1 (de) * 1999-12-04 2001-06-07 Luratech Ges Fuer Luft Und Rau Verfahren zur Kompression von gescannten Farb- und/oder Graustufendokumenten
EP1271403B1 (en) * 2001-06-26 2005-03-09 Nokia Corporation Method and device for character location in images from digital camera
US7031518B2 (en) * 2002-07-01 2006-04-18 Xerox Corporation Segmentation method and system for Multiple Raster Content (MRC) representation of documents
JP2005020227A (ja) * 2003-06-25 2005-01-20 Pfu Ltd 画像圧縮装置
TWI366156B (en) * 2003-07-01 2012-06-11 Xerox Corp Method and system for thinning or eroding a gray image of an input image defined by a plurality of pixels

Also Published As

Publication number Publication date
US20070140571A1 (en) 2007-06-21
US7379593B2 (en) 2008-05-27
JP2007174654A (ja) 2007-07-05

Similar Documents

Publication Publication Date Title
JP4994017B2 (ja) 文書画像を示す走査データを処理するための方法
US10455117B2 (en) Image processing apparatus, method, and storage medium
US6973213B2 (en) Background-based image segmentation
JP4667062B2 (ja) 画像解析装置、画像解析方法、及びブロブ識別装置
JP4745296B2 (ja) デジタル画像の領域分離方法および領域分離システム
JP4590470B2 (ja) 背景色を推定する方法およびシステム
JP5008572B2 (ja) 画像処理方法、画像処理装置およびコンピュータ可読媒体
JP4242532B2 (ja) デジタル画像データ区分方法
JP4745297B2 (ja) デジタル画像における均一な色の領域を特定する方法およびシステム
US20050163374A1 (en) Methods and systems for automatic detection of continuous-tone regions in document images
JP2000175051A (ja) デジタル画像デ―タの区分方法並びにデ―タブロックの区分方法及び分類方法
US9158987B2 (en) Image processing device that separates image into plural regions
JP6743092B2 (ja) 画像処理装置、画像処理の制御方法、及びプログラム
JP2007306560A (ja) 文書画像データのページ境界の処理方法
JP4441300B2 (ja) 画像処理装置、画像処理方法、画像処理プログラムおよびこのプログラムを記憶した記録媒体
JP2004199622A (ja) 画像処理装置、画像処理方法、記録媒体およびプログラム
JP4370950B2 (ja) 画像処理装置
US20060269132A1 (en) Apparatus and method for detecting white areas within windows and selectively merging the detected white areas into the enclosing window
JP4217969B2 (ja) 画像処理装置及びプログラム
JP2005260452A (ja) 画像処理装置
JP4409713B2 (ja) 文書画像認識装置及び記録媒体
JP4507656B2 (ja) 画像処理装置
JP4193687B2 (ja) 画像処理装置及びプログラム
JP4383187B2 (ja) 画像処理装置、画像処理用プログラム及び記憶媒体
JP2004336211A (ja) 画像データの圧縮処理方法及び圧縮システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091216

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110705

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111004

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120410

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120508

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150518

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees