JP2009044739A - デジタル画像の背景色を決定するための方法およびシステム - Google Patents

デジタル画像の背景色を決定するための方法およびシステム Download PDF

Info

Publication number
JP2009044739A
JP2009044739A JP2008206211A JP2008206211A JP2009044739A JP 2009044739 A JP2009044739 A JP 2009044739A JP 2008206211 A JP2008206211 A JP 2008206211A JP 2008206211 A JP2008206211 A JP 2008206211A JP 2009044739 A JP2009044739 A JP 2009044739A
Authority
JP
Japan
Prior art keywords
data
buffer
color
value
pixel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008206211A
Other languages
English (en)
Other versions
JP4516994B2 (ja
Inventor
Richard J Campbell
ジョン キャンベル リチャード
Mathew Spiegl John
マシュー スピーグル ジョン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Publication of JP2009044739A publication Critical patent/JP2009044739A/ja
Application granted granted Critical
Publication of JP4516994B2 publication Critical patent/JP4516994B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Analysis (AREA)

Abstract

【課題】背景色を精度よく推定することができるシステムを実現する。
【解決手段】エッジ濃度、画像の均一性(均一度)、局所的な色ではないという情報、前景色などの選択条件に基づいて、画像データからカラーバッファに選択的に蓄積された画素の色値を集約することにより、局所背景の色を推定する。
【選択図】図6

Description

本発明は、デジタル画像の背景色を決定するための方法およびシステムに関するものである。
多くのデジタル画像における視覚的品質を改善させるための処理は、デジタル画像の中の異なる画像領域を正確に特定できるかどうかに依存している。さらに、様々な画像領域の正確な検出は、多くの圧縮処理において重要である。
特許文献1の技術では、原画像をブロック分割し、文字領域に属する画素を色に応じて文字と背景とに分類する。例えば、暗い画素を文字とし、明るい画素を背景とする。そして、背景に属する画素数が最大となるブロックを選択して、ブロック内における背景色の平均値を背景色とし、階調補正を行う。
特開2004−320701(2004年11月11日公開)
しかしながら、上記従来の構成では、ブロック内の画素を輝度に応じて文字と背景とに分類しているので、着色した大きな文字(テキスト)の内部の画素が背景として誤って分類されるおそれがある。
本発明は、上記の問題点に鑑みてなされたものであり、その目的は、背景色を精度よく推定することができるシステムおよび方法を実現することにある。
本発明に係るシステムは、上記課題を解決するために、デジタル画像の背景色を決定するシステムであって、第1バッファと、デジタル画像から、上記第1バッファに蓄積するデータを選択するためのデータ選択部と、上記第1バッファに蓄積されたデータに基づいて背景の色値を推定する背景色値推定部とを備えることを特徴とする。
本発明に係る方法は、デジタル画像の背景色を決定する方法であって、デジタル画像の中から注目画素を決定する第1ステップと、上記注目画素の周辺の第1領域に含まれる第1複数画素の中から、所定の選択条件を満たす第2複数画素を選択する第2ステップと、上記第2複数画素に基づいて背景の色値を算出する第3ステップとを含むことを特徴とする。
これにより、背景色を精度よく推定することができる。
具体的には、上記データ選択部は、デジタル画像におけるエッジに近い位置のデータを上記第1バッファに蓄積しないことが好ましい。
例えば、上記データ選択部は、デジタル画像において検出されたエッジから所定の距離の範囲に含まれる画素のデータを第1バッファに蓄積しない。もしくは、データ選択部は、エッジ画素と非エッジ画素の数の差分の重み付けを行って求められるエッジ濃度の値が所定閾値以上の画素のデータを第1バッファに蓄積しない。
また、上記選択条件は、上記デジタル画像のエッジからの距離に基づいていることが好ましい。
例えば、上記選択条件は、デジタル画像において検出されたエッジから所定の距離の範囲外である条件であってもよい。もしくは、選択条件は、エッジ画素と非エッジ画素の数の差分の重み付けを行って求められるエッジ濃度の値が所定閾値未満であるという条件であってもよい。
これにより、エッジの周辺の画素のデータが第1バッファに蓄積されない。この周辺の領域の大きさを予め決定しておくことで、大きなサイズのテキストやボールドテキストの内部の画素についても第1バッファに蓄積されなくなる。そのため、このようなテキストの内部の色が背景色の推定の際に考慮されることがなくなる。その結果、背景色を精度よく推定することができる。
また、本発明のシステムにおいて、上記データ選択部は、デジタル画像における均一領域の位置に存在するデータを上記第1バッファに蓄積することが好ましい。
なお、デジタル画像における均一領域は、以下のようにして求めることができる。例えば、デジタル画像を複数のブロックに分割し、各ブロックに含まれる画素の色値の分散を求め、当該分散の値が所定閾値以下のブロックを均一領域であるとする。
また、本発明の方法において、上記選択条件は、均一度に基づいていることが好ましい。
ここで、均一度とは例えば分散の値で示され、選択条件は、例えば、均一度が所定閾値以下であるという条件である。
上記の構成によれば、均一な領域の画素のデータが第1バッファに蓄積される。均一な領域は背景である可能性が高い。その結果、背景色を精度よく推定することができる。
さらに、本発明のシステムは、上記第1バッファに蓄積された各データに対して重み係数を割り当てる重み係数割り当て部を備え、上記背景色値推定部は、上記第1バッファに蓄積されたデータと、当該データに割り当てられた上記重み係数とを基に、背景の色値を推定することが好ましい。
また、本発明の方法において、上記第2複数画素の各画素に対して重み係数を決定する第4ステップを含むことが好ましい。そして、上記第3ステップは、上記重み係数に基づいて行われることが好ましい。
ここで、重み係数は、例えば、以下のようにして決定される。つまり、ノーマルテキスト領域(テキストが背景よりも暗い領域)において、暗い画素(つまり、輝度が所定閾値よりも低い画素)の重み係数を相対的に小さい値とし、明るい画素(つまり、輝度が所定閾値よりも高い画素)の重み係数を相対的に大きい値とする。一方、反転テキスト領域(テキストが背景よりも明るい領域)では、暗い画素(つまり、輝度が所定閾値よりも低い画素)の重み係数を相対的に大きい値とし、明るい画素(つまり、輝度が所定閾値よりも高い画素)の重み係数を相対的に小さい値とする。
すなわち、重み係数は、背景画素の特徴よりも非背景画素の特徴に近い特徴を有する画素については相対的に小さい値が割り当てられ、非背景画素の特徴よりも背景画素の特徴に近い特徴を有する画素については相対的に大きい値が割り当てられる。
これにより、背景色を精度良く推定することができる。
また、本発明のシステムにおいて、上記第1バッファは、上記デジタル画像から得られた色値のヒストグラムの第1ピークに対応し、上記データ選択部は、上記第1ピークに近い色を有するデータを選択することが好ましい。
背景画素の数はデジタル画像において多いので、デジタル画像から得られた色値のヒストグラムのピークは背景の色を示している確率が高い。上記の構成によれば、データ選択部が第1ピークに近い色を有するデータを選択するので、第1バッファには背景に属する画素のデータが蓄積されることとなる。その結果、背景色を精度よく推定することができる。
また、本発明のシステムは、上記ヒストグラムの第2ピークに対応する第2バッファを備え、上記データ選択部は、上記第2ピークに近い色を有するデータを上記第2バッファに蓄積するデータとして選択し、上記背景色値推定部は、上記第2バッファに蓄積されたデータに基づいて上記第2ピークに対応する背景の色値も推定することが好ましい。
デジタル画像から得られた色値のヒストグラムにおいて異なるピークが複数存在するということは、異なる色の背景が複数存在していることを意味する。上記の構成によれば、異なるピークに対応するバッファが設けられることになる。そして、各バッファに対応する背景の色値を推定する。このように、異なる色の背景を別々に考慮することができるので、異なる色の複数の背景の各々の色値を精度よく推定することができる。
また、本発明のシステムにおいて、上記データ選択部は、前景オブジェクトの色に近い色値を有するデータを上記第1バッファに蓄積しないことが好ましい。
具体的には、データ選択部は、前景オブジェクトの色との色差が所定閾値以下の色を有する画素のデータを第1バッファに蓄積しない。
また、本発明の方法において、上記選択条件は、前景色との距離に基づいていることが好ましい。
具体的には、上記選択条件は、前景色との距離が所定閾値より大きい色を有するという条件である。
上記の構成によれば、前景色に近い色を有する画素に対応するデータが第1バッファに蓄積されない。その結果、前景色の影響を受けることなく、背景色を精度よく推定することができる。
また、本発明のシステムにおいて、上記背景色値推定部は、上記第1バッファに蓄積されたデータの平均値、トリム平均値、重み平均値、中央値、最大値、最小値の何れかを算出する集約算出部を備え、当該集約算出部によって算出された値を、上記背景の色値とすることが好ましい。これにより、簡単な演算で背景の色値を推定できる。
また、本発明のシステムは、デジタル画像の背景色を決定するシステムであって、デジタル画像に含まれる複数の画素位置の各々に対応する画素データを含む第1バッファと、上記第1バッファの各画素データに対応する重み係数を決定するデータ重み係数決定部と、上記第1バッファに含まれる各画素データと上記重み係数とに基づいて、背景の色値を推定する背景色値推定部とを備えることを特徴とする。
これにより、背景色を精度よく推定することができる。
具体的には、上記データ重み係数決定部は、上記第1バッファに含まれる各画素データに対応するデジタル画像上の位置と、デジタル画像におけるエッジ位置とに基づいて、上記重み係数を決定することが好ましい。
さらに具体的には、データ重み係数決定部は、第1バッファに含まれる各画素データに対応するデジタル画像上の位置とデジタル画像におけるエッジ位置との距離が長くなるほど大きな値をとるように上記重み係数を決定することが好ましい。
上記の構成によれば、テキストなどのエッジ位置に近い画素の影響を小さくした状態で背景の色値を推定することとなる。その結果、背景の色値を精度よく推定することができる。
また、本発明のシステムにおいて、上記データ重み係数決定部は、上記第1バッファに含まれる各画素データに対応するデジタル画像上の位置に近接する領域の均一度に基づいて、上記重み係数を決定することが好ましい。
具体的には、データ重み係数決定部は、第1バッファに含まれる各画素データに対応するデジタル画像上の位置に近接する所定範囲の領域に含まれる画素データの均一度(例えば、分散値などで示される)が高くなるにつれ(均一度が分散の場合、分散値が小さくなるにつれ)、大きな値をとるように上記重み係数を決定することが好ましい。
均一度が高い場合、背景である可能性が高い。そのため、上記の構成によれば、均一度の高い領域の画素データの重み係数が大きくなるため、精度よく背景の色値を推定することができる。
また、本発明のシステムにおいて、上記第1バッファは、上記デジタル画像から得られた色値のヒストグラムの第1ピークに対応することが好ましい。
背景画素の数はデジタル画像において多いので、デジタル画像から得られた色値のヒストグラムのピークは背景の色を示している確率が高い。上記の構成によれば、第1バッファには背景に属する画素のデータが蓄積されることとなる。その結果、背景色を精度よく推定することができる。
また、本発明のシステムにおいて、上記ヒストグラムの第2ピークに対応する第2バッファを備えることが好ましい。
デジタル画像から得られた色値のヒストグラムにおいて異なるピークが複数存在するということは、異なる色の背景が複数存在していることを意味する。上記の構成によれば、異なるピークに対応するバッファが設けられることになる。そして、各バッファに対応する背景の色値を推定する。このように、異なる色の背景を別々に考慮することができるので、異なる色の複数の背景の各々の色値を精度よく推定することができる。
また、本発明のシステムにおいて、上記データ重み係数決定部は、上記第1バッファに含まれる各画素データの色と前景オブジェクトの色との類似度に基づいて、上記重み係数を決定することが好ましい。
具体的には、データ重み係数決定部は、第1バッファに含まれる各画素データの色と前景オブジェクトの色との類似度が高くなるにつれ、大きな値をとるように上記重み係数を決定することが好ましい。
上記の構成によれば、前景オブジェクトに近い色を有する画素の影響を小さくすることができるので、精度よく背景の色値を推定することができる。
なお、上記類似度は、ユークリッド距離、市街地距離、重み付けされた距離の何れかの距離で示されることが好ましい。
また、上記背景色値推定部は、上記第1バッファの中の画素データと上記重み係数とに基づいた重み平均値を算出する重み平均算出部を備え、当該重み平均値を上記背景の色値とすることが好ましい。
本発明に係るシステムは、上記課題を解決するために、デジタル画像の背景色を決定するシステムであって、第1バッファと、デジタル画像から、上記第1バッファに蓄積するデータを選択するためのデータ選択部と、上記第1バッファに蓄積されたデータに基づいて背景の色値を推定する背景色値推定部とを備える。
また、本発明に係る方法は、デジタル画像の背景色を決定する方法であって、デジタル画像の中から注目画素を決定する第1ステップと、上記注目画素の周辺の第1領域に含まれる第1複数画素の中から、所定の選択条件を満たす第2複数画素を選択する第2ステップと、上記第2複数画素に基づいて背景の色値を算出する第3ステップとを含む。
これにより、背景色を精度よく推定することができる。
本発明の実施形態に係るシステムおよび方法では、エッジ濃度、画像の均一性(均一度)、局所的な色ではないという情報、前景色などの選択条件に基づいて、画像データからカラーバッファに選択的に蓄積された画素の色値を集約することにより、局所背景の色を推定するものである。
本発明の実施形態は、図面を参照することでより理解されるであろう。図面では、同じ部材については同じ符号をつけている。
ここで、図に示されるように、本発明の構成は、様々な異なる形態に変形および設計されることができることが容易にわかるであろう。このように、以下に述べる、本発明の方法およびシステムの実施形態についてのより詳細な説明は、本発明の範囲を限定するものではなく、本発明の最良の形態を示したものにすぎない。
本発明の実施形態の構成は、ハードウェア、ファームウェアおよび/またはソフトウェアによって実現されてもよい。ここで述べる一実施形態はこれらの形態の1つについてのみ説明するものであり、本発明の範囲内において、これらの形態の何れかで構成を実現してもよいことは、当業者であれば理解される。
図1は、ドキュメント画像10の一例を示している。ドキュメント画像10は、下地領域12と、第1局所背景領域14と、第2局所背景領域16と、第3局所背景領域18とを含むいくつかの領域を備えた文書画像である。グローバル背景領域とも見なされる下地領域は、文書が印刷される用紙の色、または、電子文書が作成されている背景の色、を有する広範囲の均質の領域のことである。局所背景領域は、均質な特徴または色を有する局所的な領域である。色は、ある色空間で表現される。典型的な色空間としては、RGB、sRGB、CMYK、HSV、YUV、YIQ、CIEL、YCbCr、グレースケールおよび輝度のみを含む色空間などが挙げられる。
図2は、図1で示されるドキュメント画像10に対応する背景画像20を示している。背景画像(例えば、図2で示される背景画像20)は、除去されたドキュメントコンテンツと、下地または局所背景で満たされた領域から、当該除去されたドキュメントコンテンツにより残された「ホール」とに関連する画像(例えば、図1のドキュメント画像10)の背景画像に対応する。背景画像20の下地領域22は、ドキュメント画像10の下地領域12に対応している。背景画像20の第1局所背景領域24は、ドキュメント画像10の第1局所背景領域14に対応している。背景画像20の第2局所背景領域26は、ドキュメント画像10の第2局所背景領域16に対応している。背景画像20の第3局所背景領域28は、ドキュメント画像10の第3局所背景領域18に対応している。背景画像をより正確に決定することは、画像圧縮または画像解析のために好ましい。
本発明の一実施形態では、スキャンされたドキュメント画像の中のある位置における局所背景の色を推定するために、制限文脈(limited-context)ラスター方法を行う。
局所背景の推定色は、色の平均値に基づいて算出されてもよいし、他の推定色算出手段が使用されてもよい。典型的な算出手段としては、中央値、重み平均値、トリム平均値などに基づいて算出するものがある。例えば、平均値、中央値、重み平均値、トリム平均値、重みトリム平均値を局所背景の推定色とする。
本発明の一実施形態では、領域内を支配する色の集約(summarization)処理を行う。
また、本発明の一実施形態では、バッファ(以下、カラーバッファという場合がある)に蓄積された画像データサンプルに基づいて注目画素での局所背景の色を推定する。注目画素の周りの近傍画素の画像データをサンプリングすることにより、当該バッファにデータが集められる。
(具体的な実施形態1)
具体的な実施形態1について図3を参照しながら説明する。本実施形態では、データ選択部32は、入力画像データ30からデータを選択する。色推定部34は、データ選択部32により選択された選択データ33および入力画像データ30に基づいて局所背景の推定色36を求める。
データ選択部32は、注目画素の周辺のサンプリング近傍領域の画像データをサンプリングする画像データサンプリング部を備えていてもよい。サンプリング近傍領域は、M×Nの矩形ウィンドウによって決定されてもよい。もしくは、サンプリング近傍領域は、半径rの円形領域であってもよい。このように、データ選択部32は、注目画素に近接する所定範囲の領域内の画素データをサンプリングする。このとき、データ選択部32は、後述する選択条件に従って、カラーバッファに蓄積する画素データを選択する。
なお、データ選択部32は、上記所定範囲の領域内の画素データの全てのカラーバッファに蓄積してもよい。この場合、色推定部は、各画素データの重み係数を用いる。重み係数は、非背景画素の特徴に近い画素において小さくなり、背景画素の特徴に近い画素において大きくなるように設定される。
具体的には、カラーバッファに含まれる各画素データに対応するデジタル画像上の位置とデジタル画像におけるエッジ位置との距離が長くなるほど大きな値をとるように上記重み係数が決定される。もしくは、カラーバッファに含まれる各画素データに対応するデジタル画像上の位置に近接する所定範囲の領域に含まれる画素データの均一度(例えば、分散値などで示される)が高くなるにつれ(均一度が分散の場合、分散値が小さくなるにつれ)、大きな値をとるように上記重み係数が決定される。もしくは、カラーバッファに含まれる各画素データの色と前景オブジェクトの色との類似度が高くなるにつれ、大きな値をとるように上記重み係数を決定される。重み係数を用いる場合の具体的な形態は後述する。
さらに、本実施形態は、原因バッファ(causal buffer)を備えていてもよい。この原因バッファでは、新たなデータ要素が、最小のサンプルに取って代わる。これにより、原因バッファは、サンプリング順に従って、最新のサンプルを保持することになる。
(具体的な実施形態2)
本発明の具体的な実施形態2について図4を参照しながら説明する。本実施形態では、サンプリング近傍領域の画素データは、選択条件に従って選択的にバッファに追加される。本実施形態では、データ選択部42は、選択条件41に従って、入力画像データ40からのデータ選択を実行する。そして、色推定部44は、選択データ43および入力画像データ40に基づいて、背景色の推定処理を実行し、推定した背景の推定色46を求める。
次に、選択条件の具体的な例について、図5を参照しながら説明する。本具体例では、選択条件は、エッジ検出アルゴリズムの出力に基づいている。原稿画像でのエッジ位置が、公知のエッジ検出方法によって検出される。典型的なエッジ検出方法としては、ソーベル(Sobel)エッジ検出器、Cannyエッジ検出器、Prewittエッジ検出器などの方法がある。このような公知の検出方法によって検出されたエッジ位置の情報を、データ選択部42が取得する(S50)。エッジ位置は、色やコンテンツ(例えば、テキストに対する均一背景)の急峻な遷移が生じている画素を特定するために使用される。このような急峻な遷移の画素は、カラーバッファへの蓄積対象から除外される。すなわち、データ選択部42は、エッジ位置からの距離に基づいて、カラーバッファに蓄積するデータを選択する(S52)。例えば、データ選択部42は、エッジ位置から所定距離以上離れた画素のデータのみを選択する。そして、背景色は、バッファデータに基づいて推定される(S54)。具体的には、バッファに蓄積された画素データの平均値、トリム平均値、重み平均値、重みトリム平均値、中央値などを、背景の色値とする。このように、選択条件の一例としては、公知のエッジ検出方法によって検出されたエッジ画素に対応する画素データについてはカラーバッファへの蓄積対象から外すことが挙げられる。
エッジ検出結果を使用することにより、遷移領域でのテキストの色が局所背景の推定色を汚すことを防止することができる。
しかしながら、画像データのバッファにおけるエッジ位置の除去だけでは、大きなフォントのテキストや太字テキスト(ボールドテキスト)の悪い影響を除くことができない。バッファへの蓄積対象からエッジ画素を除去することは、背景色の推定の際に使用されるバッファの平均化から、大きなフォントの文字の内部の画素を除去するものではない。例えば、大きな文字の内部では、カラーバッファは、テキスト色によって支配されており、カラーバッファを満たすために十分なサンプルが集められた場合、局所背景の推定色は、結果としてテキストの色の方向に収束してしまう。つまり、大きなフォントのテキストや太字テキストのエッジ位置の画素のみをカラーバッファから除去したとしても、これらのテキストの内部の画素がカラーバッファに残ると、これらの画素の色が局所背景の推定色に影響を与えてしまい、得られた局所背景の推定色はテキストの色に近い色となり、背景の色を正確に示さないくなる。
この問題を軽減するための選択条件の具体例について図6を参照しながら説明する。エッジ検出結果を受信した(S60)後、画像処理技術を用いて、テキスト文字のエッジ境界の中を満たす処理(充填処理)、または、エッジ境界を膨張させる処理(膨張処理)を行う(S62)。当該充填処理または膨張処理の画像処理技術としては、morphological closing処理、flood filling処理、dilation処理などがある。充填処理/膨張処理の結果は、バッファへの蓄積対象となる画素データを選択するために使用される(S64)。例えば、データ選択部42は、膨張処理が行われた結果エッジ位置から所定距離以上離れた画素のデータのみを選択する。その後、背景色が、バッファに蓄積された画素データに基づいて推定される(S66)。具体的には、バッファに蓄積された画素データの平均値、トリム平均値、重み平均値、重みトリム平均値、中央値などを、背景の色値とする。
例えば、デジタル画像において検出されたエッジから所定の距離の範囲外である画素のデータのみをカラーバッファへの蓄積対象とする選択条件であってもよい。
なお、充填処理および膨張処理が使用されなくてもよい。
さらに、選択条件の別の具体例について説明する。本具体例では、エッジ画素と非エッジ画素の数の差分の重み付けを行って求められるエッジ濃度が選択条件として使用される。エッジ濃度は、エッジ近傍で大きな値になり、エッジから離れると小さな値となる。エッジからの距離が設定距離を越える画素がカラーバッファに蓄積され、局所背景の色の推定に使用される。
エッジ濃度信号は入力エッジ信号から計算される。ここで、入力エッジ信号とは、上述した公知のエッジ検出方法によって検出されたエッジ画素/非エッジ画素を示す信号のことである。入力エッジ信号の各画素に対して、周辺領域が決定される。この周辺領域の中において、集約エッジ濃度信号が計算される。入力エッジ信号は、周辺領域のエッジ濃度と結合され、出力エッジ濃度信号を形成する。局所背景信号が計算される注目画素でのエッジ濃度信号を生成するために、一連の画像位置に対してこの処理が繰り返される。
本発明の一実施形態では、入力エッジ信号の各画素のエッジ濃度edgedenを、下記の方法に従って算出する。
まず、edgeden値を既知のレベルの値に初期化する。例えば、edgden=0に初期化する。
次に、各画素(i,j)について、edgeden(i,j)を周辺領域のedgeden値の最大値に設定する(edgeden=max(neighboring edgeden))。ここで周辺領域は、注目画素の周囲であり、かつ、予め定められた範囲の領域である。
その後、エッジマップを用いて、edgeden(i,j)を以下の式に従って更新する。具体的には、エッジ画素である場合、加算係数wを加算し、非エッジ画素である場合、減算係数wdecayを減算する。
Figure 2009044739
最後に、以下の式のように、マイナスの値になった場合は0とし、予め設定された設定最大値count_saturateを超える場合には当該設定最大値count_saturateとする処理を行う。
Figure 2009044739
パラメータwdecay及びcount_saturateを通して、エッジ濃度は、画素値がバッファに蓄積される前に、信頼性の高いエッジ領域から画素がどの程度離れているかを制御(control)するものであり、局所背景の色の推定に影響を与える。パラメータwは、エッジ検知でのノイズの感度に対して高い信頼性のエッジ領域でエッジ濃度測定が取り得る割合を制御する。減衰(decay)が長くなるにつれ、大きなフォントのテキストやボールドテキストの内部のグリフ画素は、局所背景の色の推定に追加されにくくなる。逆にいえば、減衰が長くなると、局所背景の色の推定処理において、新たな局所背景色に集中(集約)するために多くの画素が取られる。weを小さくすれば、周辺に十分に連続したエッジ画素がないと、edgedenが大きくならないが、逆にwを大きくすれば、短い連続したエッジ画素でも、すぐにedgedenが大きくなるので、このweを制御することで、割合が制御できるということになる。edgedenが大きくなりやすければ、それだけ減衰が長くなりやすくなる。
本発明の一実施形態では、行方向に対するedgeden値を設定するために、まず最初に左から右へのスキャン方向で、エッジデータが指標化(index)される。その後、edgeden値を補正するために、右から左へのスキャン方向でエッジデータが指標化(index)される。これにより、走査統計(running sum)の方向依存性を低減させ、エッジの両側からのカウントを減らすことができる。
もしくは、エッジまたはテキスト画素のバイナリーマップを受信し、当該バイナリーマップに従って、エッジまたはテキスト画素としてラベル付けされた画素を背景色の集約の際に無視してもよい。
なお、データ選択部は、エッジ画素と非エッジ画素の数の差分の重み付けを行って求められるエッジ濃度の値edgedenが所定閾値以上の画素のデータをカラーバッファに蓄積しないようにしてもよい。
(具体的な実施形態3)
さらに別の具体的な実施形態3について図7を参照しながら説明する。均一度算出部72は、どの画素を背景色の推定のために選択するかを決定するために使用される均一度を算出するものである。均一度73は、入力画像データ70に対して均一度算出部72によって算出される。均一度73は、データ選択部74によって使用される。データ選択部74は、背景色推定部76によって使用されるデータを選択するものである。背景色推定部は、背景の推定色77を生成するものである。
均一度の典型的な例は分散である。均一度は、エッジ濃度と関係していない。均一度は、複数の異なる領域が空間的に混在している箇所において最大値を取る。均一領域の画素は、局所背景の色を推定するためにより信頼性の高いサンプルであるとみなされる。残りの画素は「不明」画素としてラベル付けされ、推定処理において無視される。なお、残りの画素に対して、新しい条件を用いて処理されてもよい。
均一度は、きめのある(textured)背景が「不明」画素としてラベル付けされるように選択される。もしくは、均一度は、きめのある(textured)領域が背景領域とみなされるように選択されてもよい。
このように、データ選択部74は、注目画素の周囲の所定範囲の領域に属する画素データの分散の値が所定閾値以下である注目画素の画素データを選択すればよい。
(具体的な実施形態4)
さらに別の具体的な実施形態4について図8を参照しながら説明する。本実施形態では、「不明」画素としてラベル付けされ、十分に低いエッジ濃度edgeden(i,j)を有する画素がカラーバッファに蓄積され、局所背景の色の推定のために使用される。これにより、局所背景の推定色は、スムース(わずかな変化があってもよい)であり、きめのある(textured)局所背景領域に近くなる。本実施形態では、均一度算出部82およびエッジ濃度算出部84は、入力画像データ80から各々、均一度83およびエッジ濃度85を測定する。これら均一度83およびエッジ濃度85は、色推定部88が局所背景の推定色89を推定するためのデータを選択するデータ選択部86によって使用される。
具体的には、データ選択部86は、注目画素の周囲の所定範囲の領域に属する画素データの分散の値が所定閾値より大きい注目画素であり(つまり、「不明」画素を意味する)、エッジ濃度が所定閾値以下である注目画素の画素データを、カラーバッファへの蓄積対象として選択する。これにより、きめのある(textured)局所背景領域であっても、当該領域に属する画素のデータをカラーバッファに蓄積でき、このような領域の背景色を精度よく推定できる。
(具体的な実施形態5)
さらに別の実施形態5について説明する。前景画素は、背景画素よりも暗いものもあれば、背景画素よりも明るいものもある。背景画素よりも暗いグリフ画素の領域及びテキスト画素の領域を、それぞれ「ノーマルグリフ領域」および「ノーマルテキスト領域」という。一方、局所背景の色がグリフの色よりも暗い領域を「反転グリフ領域」といい、局所背景の色がテキストの色よりも暗い領域を「反転テキスト領域」とする。
図9を参照して本実施形態を説明する。本実施形態では、重み係数信号99が色推定部100によって使用される。局所背景の色を推定する色推定部100は、以下の式にしたがって、重み係数ランニング平均μを算出する。ここで、各画素の色値をc、バッファでの対応する重み係数をw、重み係数の合計を1、バッファサイズをKとする。
Figure 2009044739
図9で示されるように、均一度算出部92およびエッジ濃度算出部94は、入力画像データ90から、それぞれ、均一度93およびエッジ濃度95を算出する。これら均一度93およびエッジ濃度95はデータ選択部96によって使用され、色推定部100が局所背景の色を推定するために用いる選択データ97が決定される。選択データ97は、重み係数算出部98によって決定された重み係数99に従って重み付けされる。
ノーマルテキスト領域として特定された領域では、明るい画素値の領域に大きな重み係数を割り当て、暗い画素値の前景画素に小さい重み係数を割り当てる。
反転テキスト領域として特定された領域では、暗い画素値の領域に大きな重み係数を割り当て、明るい画素値の前景画素に小さい重み係数を割り当てる。
このように、重み係数は、以下のようにして決定される。つまり、ノーマルテキスト領域(テキストが背景よりも暗い領域)において、暗い画素(つまり、輝度が所定閾値よりも低い画素)の重み係数を相対的に小さい値とし、明るい画素(つまり、輝度が所定閾値よりも高い画素)の重み係数を相対的に大きい値とする。一方、反転テキスト領域(テキストが背景よりも明るい領域)では、暗い画素(つまり、輝度が所定閾値よりも低い画素)の重み係数を相対的に大きい値とし、明るい画素(つまり、輝度が所定閾値よりも高い画素)の重み係数を相対的に小さい値とする。
(具体的な実施形態6)
さらに別の実施形態6について図10を参照して説明する。データ選択部112は、入力画像データ110から、カラーバッファへ蓄積するデータを選択する。選択された選択データ113は、データ重み係数115と関連付けて色推定部116によって使用される。データ重み係数115は、背景の推定色を決定するために、重み係数算出部114によって、入力画像データ110から決定される。
なお、上記の実施形態では、入力画像データは、ストリームベース(stream-based)の処理がされ、処理された入力画像データがシステムに渡されると、制限文脈(limited context)が、メモリーの使用を最小限にし、計算回数を制限するために維持されてもよい。これは、オンライン処理(リアルタイム処理)を説明しており、データがストリームで次々と流れてくるので、限られたラインメモリ上の画像データを用いて限られた処理時間で処理することを意味する。また、空間的な画素の減少が、システムを通してパスされる注目画素に関連する局所背景色を推定するために必要とされてもよい。
(具体的な実施形態7)
さらに、入力画像での主たる背景色を特定するために、従来の解析方法が実行されてもよい。主たる背景色を特定するための典型的な方法としては、特開2007−336562に記載の方法が知られている。また、非局所信号が色集約のための画素を選択する際に使用されてもよい。全体の色のヒストグラムの大きいピーク(major peak)を局所背景色と見なしてもよい。カラーバッファは、大きいピークの各々に割り当てられても良い。背景色の推定処理の際、各注目画素は、大きいピークに対応するか否かを判断するために分析される。注目画素が大きいピークに対応している場合、当該ピークに対応するカラーバッファが更新され、当該カラーバッファが注目画素のための局所背景色を推定するために使用される。この実施形態7は図11に示される。
図11に示す実施形態7では、画像データ値120をカラーバッファ125・126・127に追加するか否かを判断するために、非局所色情報(non-local color information)121がデータ選択部122によって使用される。データ選択部122は、カラーバッファ選択信号123を決定する。局所背景の色を推定する色推定部124は、複数のカラーバッファ125・126・127およびバッファ集約算出部128を備えている。バッファ集約算出部128は、選択されたカラーバッファ125・126・127の色データ値をまとめる。バッファ集約算出部128は、平均値、トリム平均値、中央値、重み平均値、重みトリム平均値などを算出する。非局所色情報は、画像データのヒストグラムから得られたピークの色値を含む。
なお、ヒストグラムの大きなピークに近い色を有する画素だけがカラーバッファに追加されてもよい。局所色値に集中するために必要とされる空間的な画素の減少量は、バッファでの色が既に注目画素に似ているので、少なくなる。
また、画像データがバッファに蓄積され、異なるスキャン方向を用いて複数回処理されてもよい。ラスター画像データの複数ラインは、プロセッサまたはASICに2回流される。1回目は、ラスター方向であり、2回目は、ラスター方向と逆の方向である。画像データの複数回の処理の各々から決定された複数の局所背景の推定色が調和され、各注目画素での単一の推定色を生成する。各推定色は、次の処理で使用されてもよい。画素の推定色は、画素の色に最も近い推定色を選択することによって決定されてもよい。
(具体的な実施形態8)
さらに別の実施形態8について図12を参照しながら説明する。本実施形態では、前景オブジェクトの推定色を維持し、データ選択に使用する。注目画素の色値が局所前景の推定色と一致している場合、注目画素の色値は、小さい重み係数が割り当てられる、もしくは、背景色集約のためのバッファに蓄積されない。このような実施形態によれば、背景色集約のためのバッファに誤って追加される前景画素の数を減少させる。これにより、前景領域と背景領域との間の境界の周辺画素によって改悪されることなく、よりよい背景の推定色を導き出すことができる。
背景データ選択部142は、前景推定色を組み入れた選択条件に基づいて画像データを選択する。選択された選択データは、背景色バッファに入力される。背景色推定部144は、当該背景色バッファから局所背景色の推定を行う。背景色推定部144は、背景色バッファおよびバッファ集約算出部を備えていても良い。もしくは、背景色推定部144は、複数のカラーバッファを備えていても良い。各カラーバッファは、画像データのカラーヒストグラムのピークに対応している。この場合、背景データ選択部142は、カラーバッファ選択部を備えている。前景推定色の色値に近い画像データ140は、背景データ選択部142によって選択されず、カラーバッファに入力されない。もしくは、背景色推定部144は、前景推定色149の色値に近い画像データ140に対して、前景推定色149の色値に近くない画像データ140よりも小さい重み係数を割り当ててもよい。
本実施形態では、前景推定色149は、前景色推定部148によって、前景カラーバッファでの画像色値の集約に基づいて決定される。前景データ選択部146は、前景カラーバッファに蓄積するために前景特徴を示す画像データ値を選択する。例えば、前景データ選択部146は、エッジ検出結果を用い、前景特徴を示す画像データ値として、エッジの立ち上がりからエッジの立下りまでの画像データ値を選択したり、edgedenの値が大きい画像データ値を選択する。
上記の各実施形態では、色の類似度が、色値間の距離を用いて求められる。典型的な色間の距離は、Lノルム、Lノルム、luma-chroma-chroma色空間のchroma成分間の2次元市街地距離、3次元色空間の成分間の3次元市街地距離、ユークリッド距離、luma-chroma-chroma色空間のchroma成分間の重み2次元市街地距離、3次元色空間の成分間の重み3次元市街地距離など公知の距離を用いることができる。
上記の各実施形態では、背景色推定のためのバッファに蓄積する画素をどれにするかが、上述したような条件(複数の条件の組合せでもよい)に基づいて限定される。もしくは、各バッファに蓄積されたエントリーは重み係数と関連付けされていてもよい。
また、上記の各実施形態では、背景色推定部は、背景/前景の推定色から計算される値に基づいて、片寄った集約方法を行ってもよい。典型的な例では、反転テキスト領域で起こるような、前景色が背景色よりも明るい場合、背景色をより暗く片寄らせ、前景色をより明るく片寄らせる。一方、ノーマルテキスト領域で起こるような、前景色が背景色よりも暗い場合、背景色をより明るく片寄らせ、前景色をより暗く片寄らせる。
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
最後に、図3・4・7・8・9・10・11・12に示すシステムの各ブロックは、ハードウェアロジックによって構成してもよいし、次のようにCPUを用いてソフトウェアによって実現してもよい。
すなわち、図3・4・7・8・9・10・11・12に示すシステムは、各機能を実現する制御プログラムの命令を実行するCPU(central processing unit)、上記プログラムを格納したROM(read only memory)、上記プログラムを展開するRAM(random access memory)、上記プログラムおよび各種データを格納するメモリ等の記憶装置(記録媒体)などを備えている。そして、本発明の目的は、上述した機能を実現するソフトウェアである図3・4・7・8・9・10・11・12に示すシステムの制御プログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)をコンピュータで読み取り可能に記録した記録媒体を、上記図3・4・7・8・9・10・11・12に示すシステムに供給し、そのコンピュータ(またはCPUやMPU)が記録媒体に記録されているプログラムコードを読み出し実行することによっても、達成可能である。
上記記録媒体としては、例えば、磁気テープやカセットテープ等のテープ系、フロッピー(登録商標)ディスク/ハードディスク等の磁気ディスクやCD−ROM/MO/MD/DVD/CD−R等の光ディスクを含むディスク系、ICカード(メモリカードを含む)/光カード等のカード系、あるいはマスクROM/EPROM/EEPROM/フラッシュROM等の半導体メモリ系などを用いることができる。
また、図3・4・7・8・9・10・11・12に示すシステムを通信ネットワークと接続可能に構成し、上記プログラムコードを通信ネットワークを介して供給してもよい。この通信ネットワークとしては、特に限定されず、例えば、インターネット、イントラネット、エキストラネット、LAN、ISDN、VAN、CATV通信網、仮想専用網(virtual private network)、電話回線網、移動体通信網、衛星通信網等が利用可能である。また、通信ネットワークを構成する伝送媒体としては、特に限定されず、例えば、IEEE1394、USB、電力線搬送、ケーブルTV回線、電話線、ADSL回線等の有線でも、IrDAやリモコンのような赤外線、Bluetooth(登録商標)、802.11無線、HDR、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。
本発明は、複合機、プリンタなどの画像処理を行う画像処理装置の用途に適用できる。
図1は、下地領域および3つの局所背景領域を含むデジタル画像の一例を示す図である。 図1のデジタル画像に対応する背景画像を示す図である。 本発明の実施形態1に係るシステムの構成を示すブロック図である。 本発明の実施形態2に係るシステムの構成を示すブロック図である。 本発明の実施形態2に係るシステムにおける処理の一例の流れを示すフローチャートである。 本発明の実施形態2に係るシステムにおける処理の他の例の流れを示すフローチャートである。 本発明の実施形態3に係るシステムの構成を示すブロック図である。 本発明の実施形態4に係るシステムの構成を示すブロック図である。 本発明の実施形態5に係るシステムの構成を示すブロック図である。 本発明の実施形態6に係るシステムの構成を示すブロック図である。 本発明の実施形態7に係るシステムの構成を示すブロック図である。 本発明の実施形態8に係るシステムの構成を示すブロック図である。
符号の説明
32・42・74・86・96・112・122 データ選択部
34・44・76・88・100・116・124 色推定部(背景色値推定部)
72・82・92 均一度算出部
84・94 エッジ濃度算出部
98・114 重み係数算出部(重み係数割り当て部)
125・126・127 カラーバッファ(第1バッファ、第2バッファ)
128 バッファ集約算出部
142 背景データ選択部(データ選択部)
144 背景色推定部(背景色値推定部)

Claims (22)

  1. デジタル画像の背景色を決定するシステムであって、
    第1バッファと、
    デジタル画像から、上記第1バッファに蓄積するデータを選択するためのデータ選択部と、
    上記第1バッファに蓄積されたデータに基づいて背景の色値を推定する背景色値推定部とを備えることを特徴とするシステム。
  2. 上記データ選択部は、デジタル画像におけるエッジに近い位置のデータを上記第1バッファに蓄積しないことを特徴とする請求項1に記載のシステム。
  3. 上記データ選択部は、デジタル画像における均一領域の位置に存在するデータを上記第1バッファに蓄積することを特徴とする請求項1に記載のシステム。
  4. 上記第1バッファに蓄積された各データに対して重み係数を割り当てる重み係数割り当て部を備え、
    上記背景色値推定部は、上記第1バッファに蓄積されたデータと、当該データに割り当てられた上記重み係数とを基に、背景の色値を推定することを特徴とする請求項1から3の何れか1項に記載のシステム。
  5. 上記第1バッファは、上記デジタル画像から得られた色値のヒストグラムの第1ピークに対応し、
    上記データ選択部は、上記第1ピークに近い色を有するデータを選択することを特徴とする請求項1に記載のシステム。
  6. 上記ヒストグラムの第2ピークに対応する第2バッファを備え、
    上記データ選択部は、上記第2ピークに近い色を有するデータを上記第2バッファに蓄積するデータとして選択し、
    上記背景色値推定部は、上記第2バッファに蓄積されたデータに基づいて上記第2ピークに対応する背景の色値も推定することを特徴とする請求項5に記載のシステム。
  7. 上記データ選択部は、前景オブジェクトの色に近い色値を有するデータを上記第1バッファに蓄積しないことを特徴とする請求項1に記載のシステム。
  8. 上記背景色値推定部は、上記第1バッファに蓄積されたデータの平均値、トリム平均値、重み平均値、中央値、最大値、最小値の何れかを算出する集約算出部を備え、当該集約算出部によって算出された値を、上記背景の色値とすることを特徴とする請求項1から7の何れか1項に記載のシステム。
  9. デジタル画像の背景色を決定するシステムであって、
    デジタル画像に含まれる複数の画素位置の各々に対応する画素データを含む第1バッファと、
    上記第1バッファの各画素データに対応する重み係数を決定するデータ重み係数決定部と、
    上記第1バッファに含まれる各画素データと上記重み係数とに基づいて、背景の色値を推定する背景色値推定部とを備えることを特徴とするシステム。
  10. 上記データ重み係数決定部は、上記第1バッファに含まれる各画素データに対応するデジタル画像上の位置と、デジタル画像におけるエッジ位置とに基づいて、上記重み係数を決定することを特徴とする請求項9に記載のシステム。
  11. 上記データ重み係数決定部は、上記第1バッファに含まれる各画素データに対応するデジタル画像上の位置に近接する領域の均一度に基づいて、上記重み係数を決定することを特徴とする請求項9に記載のシステム。
  12. 上記第1バッファは、上記デジタル画像から得られた色値のヒストグラムの第1ピークに対応することを特徴とする請求項9から11の何れか1項に記載のシステム。
  13. 上記ヒストグラムの第2ピークに対応する第2バッファを備えることを特徴とする請求項12に記載のシステム。
  14. 上記データ重み係数決定部は、上記第1バッファに含まれる各画素データの色と前景オブジェクトの色との類似度に基づいて、上記重み係数を決定することを特徴とする請求項9に記載のシステム。
  15. 上記類似度は、ユークリッド距離、市街地距離、重み付けされた距離の何れかの距離で示されることを特徴とする請求項14に記載のシステム。
  16. 上記背景色値推定部は、上記第1バッファの中の画素データと上記重み係数とに基づいた重み平均値を算出する重み平均算出部を備え、当該重み平均値を上記背景の色値とすることを特徴とする請求項9に記載のシステム。
  17. デジタル画像の背景色を決定する方法であって、
    デジタル画像の中から注目画素を決定する第1ステップと、
    上記注目画素の周辺の第1領域に含まれる第1複数画素の中から、所定の選択条件を満たす第2複数画素を選択する第2ステップと、
    上記第2複数画素に基づいて背景の色値を算出する第3ステップとを含むことを特徴とする方法。
  18. 上記選択条件は、上記デジタル画像のエッジからの距離に基づいていることを特徴とする請求項17に記載の方法。
  19. 上記選択条件は、均一度に基づいていることを特徴とする請求項17に記載の方法。
  20. 上記選択条件は、前景色との距離に基づいていることを特徴とする請求項17に記載の方法。
  21. 上記第2複数画素の各画素に対して重み係数を決定する第4ステップを含むことを特徴とする請求項17に記載の方法。
  22. 上記第3ステップは、上記重み係数に基づいて行われることを特徴とする請求項21に記載の方法。
JP2008206211A 2007-08-08 2008-08-08 デジタル画像の背景色を決定するための方法およびシステム Expired - Fee Related JP4516994B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US11/835,684 US20090041344A1 (en) 2007-08-08 2007-08-08 Methods and Systems for Determining a Background Color in a Digital Image

Publications (2)

Publication Number Publication Date
JP2009044739A true JP2009044739A (ja) 2009-02-26
JP4516994B2 JP4516994B2 (ja) 2010-08-04

Family

ID=40346596

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008206211A Expired - Fee Related JP4516994B2 (ja) 2007-08-08 2008-08-08 デジタル画像の背景色を決定するための方法およびシステム

Country Status (2)

Country Link
US (1) US20090041344A1 (ja)
JP (1) JP4516994B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5974589B2 (ja) * 2012-03-30 2016-08-23 ブラザー工業株式会社 画像処理装置およびプログラム
US9774793B2 (en) * 2014-08-01 2017-09-26 Adobe Systems Incorporated Image segmentation for a live camera feed
JP7028099B2 (ja) * 2018-08-02 2022-03-02 日本電信電話株式会社 候補領域推定装置、候補領域推定方法、及びプログラム
CN116258653B (zh) * 2023-05-16 2023-07-14 深圳市夜行人科技有限公司 一种基于深度学习的微光图像增强方法和***

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000022971A (ja) * 1998-06-30 2000-01-21 Canon Inc 画像処理装置及び方法及び情報処理装置及びその制御方法及び記憶媒体
JP2005018176A (ja) * 2003-06-24 2005-01-20 Nippon Hoso Kyokai <Nhk> 文字領域抽出装置、文字領域抽出方法及び文字領域抽出プログラム
JP2006025448A (ja) * 2005-08-05 2006-01-26 Sony Corp キー信号生成装置及び方法、画像合成装置、並びに記録媒体

Family Cites Families (98)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4741046A (en) * 1984-07-27 1988-04-26 Konishiroku Photo Industry Co., Ltd. Method of discriminating pictures
US5001767A (en) * 1987-11-30 1991-03-19 Kabushiki Kaisha Toshiba Image processing device
JPH02100583A (ja) * 1988-10-07 1990-04-12 Toshiba Corp 画像処理方法およびその装置
US5353132A (en) * 1989-02-06 1994-10-04 Canon Kabushiki Kaisha Image processing device
JP3223512B2 (ja) * 1990-12-19 2001-10-29 ソニー株式会社 画像表示方法及び装置
US5157740A (en) * 1991-02-07 1992-10-20 Unisys Corporation Method for background suppression in an image data processing system
JP2852390B2 (ja) * 1991-02-16 1999-02-03 株式会社半導体エネルギー研究所 表示装置
JPH06121161A (ja) * 1991-05-14 1994-04-28 Fuji Xerox Co Ltd カラー画像処理装置の文字処理方式
US5280367A (en) * 1991-05-28 1994-01-18 Hewlett-Packard Company Automatic separation of text from background in scanned images of complex documents
JP3276985B2 (ja) * 1991-06-27 2002-04-22 ゼロックス・コーポレーション イメージピクセル処理方法
US5436981A (en) * 1992-06-24 1995-07-25 Canon Kabushiki Kaisha Image processing method, and apparatus therefor
US5379130A (en) * 1992-12-02 1995-01-03 Industrial Technology Research Institute Text/image separation method
US5365596A (en) * 1992-12-17 1994-11-15 Philip Morris Incorporated Methods and apparatus for automatic image inspection of continuously moving objects
US5339172A (en) * 1993-06-11 1994-08-16 Xerox Corporation Apparatus and method for segmenting an input image in one of a plurality of modes
US5362796A (en) * 1993-08-09 1994-11-08 Isp Investments Inc. Molded crosslinked vinyl lactam polymer gel and method of preparation
US5546474A (en) * 1993-12-21 1996-08-13 Hewlett-Packard Company Detection of photo regions in digital images
JPH07220091A (ja) * 1994-02-04 1995-08-18 Canon Inc 画像処理装置及び方法
US5481622A (en) * 1994-03-01 1996-01-02 Rensselaer Polytechnic Institute Eye tracking apparatus and method employing grayscale threshold values
DE69523970T2 (de) * 1994-04-15 2002-07-04 Canon Kk Dokumentspeicher- und Wiederauffindungssystem
EP0677817B1 (en) * 1994-04-15 2000-11-08 Canon Kabushiki Kaisha Page segmentation and character recognition system
JPH07322252A (ja) * 1994-05-23 1995-12-08 Canon Inc 画像符号化装置
US6215904B1 (en) * 1994-11-30 2001-04-10 Xerox Corporation Apparatus and method for selecting encoding schemes based upon image content
US5848185A (en) * 1994-12-28 1998-12-08 Canon Kabushiki Kaisha Image processing apparatus and method
US5649025A (en) * 1995-02-03 1997-07-15 Xerox Corporation Multithresholding for document image segmentation
JPH08305846A (ja) * 1995-03-07 1996-11-22 Matsushita Electric Ind Co Ltd ニューロフィルターと像域分割方法とフィルター装置
US5682249A (en) * 1995-05-11 1997-10-28 Xerox Corporation Method of encoding an image at full resolution for storing in a reduced image buffer
US5923775A (en) * 1996-04-04 1999-07-13 Eastman Kodak Company Apparatus and method for signal dependent noise estimation and reduction in digital images
US5946420A (en) * 1996-05-10 1999-08-31 Hewlett-Packard Company Printing with text enhancement: recognition by sensing paired edges, or by disqualification in pictorial regions
JP2973944B2 (ja) * 1996-06-26 1999-11-08 富士ゼロックス株式会社 文書処理装置および文書処理方法
US5956468A (en) * 1996-07-12 1999-09-21 Seiko Epson Corporation Document segmentation system
US5778092A (en) * 1996-12-20 1998-07-07 Xerox Corporation Method and apparatus for compressing color or gray scale documents
US5767978A (en) * 1997-01-21 1998-06-16 Xerox Corporation Image segmentation system
US5900953A (en) * 1997-06-17 1999-05-04 At&T Corp Method and apparatus for extracting a foreground image and a background image from a color document image
US6014464A (en) * 1997-10-21 2000-01-11 Kurzweil Educational Systems, Inc. Compression/ decompression algorithm for image documents having text graphical and color content
US6347153B1 (en) * 1998-01-21 2002-02-12 Xerox Corporation Method and system for classifying and processing of pixels of image data
US6175650B1 (en) * 1998-01-26 2001-01-16 Xerox Corporation Adaptive quantization compatible with the JPEG baseline sequential mode
JP4662584B2 (ja) * 1998-01-27 2011-03-30 イーストマン コダック カンパニー 画像センサのライン毎ノイズ除去装置及び方法
US6020979A (en) * 1998-03-23 2000-02-01 Xerox Corporation Method of encoding high resolution edge position information in continuous tone image information
US6175427B1 (en) * 1998-04-20 2001-01-16 Xerox Corporation System and method of tonal correction of independent regions on a compound document
US6577351B1 (en) * 1998-05-18 2003-06-10 Liberate Technologies Anti-aliasing television signals for display
US6233353B1 (en) * 1998-06-29 2001-05-15 Xerox Corporation System for segmenting line drawings from text within a binary digital image
US6493041B1 (en) * 1998-06-30 2002-12-10 Sun Microsystems, Inc. Method and apparatus for the detection of motion in video
JP3453085B2 (ja) * 1998-07-23 2003-10-06 ジーイー横河メディカルシステム株式会社 X線ct装置
US6389164B2 (en) * 1998-09-23 2002-05-14 Xerox Corporation Image segmentation apparatus and method
US6782129B1 (en) * 1998-09-23 2004-08-24 Xerox Corporation Image segmentation apparatus and method
US6360009B2 (en) * 1998-09-23 2002-03-19 Xerox Corporation Image segmentation apparatus and method
US6272240B1 (en) * 1998-09-23 2001-08-07 Xerox Corporation Image segmentation apparatus and method
US6178260B1 (en) * 1998-09-23 2001-01-23 Xerox Corporation Image segmentation apparatus and method
US6373981B1 (en) * 1998-12-21 2002-04-16 Xerox Corporation Method and apparatus for segmenting data to create mixed raster content planes
US6400844B1 (en) * 1998-12-02 2002-06-04 Xerox Corporation Method and apparatus for segmenting data to create mixed raster content planes
US6731789B1 (en) * 1999-01-29 2004-05-04 Canon Kabushiki Kaisha Image processing apparatus and method, and storage medium
IL131282A (en) * 1999-08-05 2009-02-11 Orbotech Ltd Apparatus and methods for inspection of objects
US6594401B1 (en) * 1999-10-20 2003-07-15 Xerox Corporation Detection and elimination of scanning artifacts
US6577762B1 (en) * 1999-10-26 2003-06-10 Xerox Corporation Background surface thresholding
US6728391B1 (en) * 1999-12-03 2004-04-27 United Parcel Service Of America, Inc. Multi-resolution label locator
DE19958553A1 (de) * 1999-12-04 2001-06-07 Luratech Ges Fuer Luft Und Rau Verfahren zur Kompression von gescannten Farb- und/oder Graustufendokumenten
US6718059B1 (en) * 1999-12-10 2004-04-06 Canon Kabushiki Kaisha Block selection-based image processing
GB2357649A (en) * 1999-12-22 2001-06-27 Nokia Mobile Phones Ltd Image enhancement using inverse histogram based pixel mapping
EP1119186A3 (en) * 2000-01-19 2002-07-31 Xerox Corporation Method for generating anti-aliased text and line graphics in compressed document images
US6901164B2 (en) * 2000-04-14 2005-05-31 Trusight Ltd. Method for automated high speed improvement of digital color images
JP3986732B2 (ja) * 2000-06-21 2007-10-03 パイオニア株式会社 映像信号の輝度レベル補正装置
US7133565B2 (en) * 2000-08-25 2006-11-07 Canon Kabushiki Kaisha Image processing apparatus and method
US6941014B2 (en) * 2000-12-15 2005-09-06 Xerox Corporation Method and apparatus for segmenting an image using a combination of image segmentation techniques
US6766053B2 (en) * 2000-12-15 2004-07-20 Xerox Corporation Method and apparatus for classifying images and/or image regions based on texture information
US6674899B2 (en) * 2000-12-18 2004-01-06 Xerox Corporation Automatic background detection of scanned documents
US6522791B2 (en) * 2001-01-23 2003-02-18 Xerox Corporation Dynamic user interface with scanned image improvement assist
CN1213592C (zh) * 2001-07-31 2005-08-03 佳能株式会社 采用自适应二值化的图象处理方法和设备
US6983068B2 (en) * 2001-09-28 2006-01-03 Xerox Corporation Picture/graphics classification system and method
US7194140B2 (en) * 2001-11-05 2007-03-20 Canon Kabushiki Kaisha Image processing apparatus and method which compresses image data of each region using a selected encoding method
JPWO2003043306A1 (ja) * 2001-11-13 2005-03-10 セイコーエプソン株式会社 色変換プログラムを記録した媒体、色変換テーブルデータを記録した媒体、色変換装置、色変換方法、色変換プログラム、色変換テーブル、色変換テーブル作成プログラムを記録した媒体、補間演算プログラムを記録した媒体、色変換テーブル作成プログラム、補間演算プログラム、色変換テーブル作成装置、補間演算装置、色変換テーブル作成方法、補間演算方法、部分色変換テーブル、印刷装置および印刷方法
US7424129B2 (en) * 2001-11-19 2008-09-09 Ricoh Company, Ltd Printing system with embedded audio/video content recognition and processing
EP1318665B1 (en) * 2001-12-06 2015-02-25 Canon Kabushiki Kaisha Image processing apparatus and method, program, and storage medium
US7027647B2 (en) * 2001-12-31 2006-04-11 Hewlett-Packard Development Company, L.P. Coder matched layer separation for compression of compound documents
US8103104B2 (en) * 2002-01-11 2012-01-24 Hewlett-Packard Development Company, L.P. Text extraction and its application to compound document image compression
US6941024B2 (en) * 2002-01-14 2005-09-06 Hewlett-Packard Development Company, L.P. Coder matched layer separation and interpolation for compression of compound documents
US7085422B2 (en) * 2002-02-20 2006-08-01 International Business Machines Corporation Layer based compression of digital images
US7050650B2 (en) * 2002-02-28 2006-05-23 Hewlett-Packard Development Company, L.P. User selected background noise removal for scanned document images
US6987882B2 (en) * 2002-07-01 2006-01-17 Xerox Corporation Separation system for Multiple Raster Content (MRC) representation of documents
US6993185B2 (en) * 2002-08-30 2006-01-31 Matsushita Electric Industrial Co., Ltd. Method of texture-based color document segmentation
US6918706B2 (en) * 2002-10-31 2005-07-19 Canon Kabushiki Kaisha Reducing a difference in picture quality between deteriorated and non-deteriorated images using a printing apparatus
US20040096102A1 (en) * 2002-11-18 2004-05-20 Xerox Corporation Methodology for scanned color document segmentation
US7079687B2 (en) * 2003-03-06 2006-07-18 Seiko Epson Corporation Method and apparatus for segmentation of compound documents
US7139433B2 (en) * 2003-03-13 2006-11-21 Sharp Laboratories Of America, Inc. Compound image compression method and apparatus
US20040190028A1 (en) * 2003-03-31 2004-09-30 Foster Thomas J. Post RIP image rendering in an electrographic printer in order to minimize electrophotographic process nonuniformities
US7330288B2 (en) * 2003-03-31 2008-02-12 Eastman Kodak Company Post RIP image rendering in a MICR electrographic printer to improve readability
US7483484B2 (en) * 2003-10-09 2009-01-27 Samsung Electronics Co., Ltd. Apparatus and method for detecting opaque logos within digital video signals
WO2005041579A2 (en) * 2003-10-24 2005-05-06 Reactrix Systems, Inc. Method and system for processing captured image information in an interactive video display system
US7912291B2 (en) * 2003-11-10 2011-03-22 Ricoh Co., Ltd Features for retrieval and similarity matching of documents from the JPEG 2000-compressed domain
US7317829B2 (en) * 2003-12-12 2008-01-08 Microsoft Corporation Background color estimation for scanned images
US7379594B2 (en) * 2004-01-28 2008-05-27 Sharp Laboratories Of America, Inc. Methods and systems for automatic detection of continuous-tone regions in document images
US7343046B2 (en) * 2004-02-12 2008-03-11 Xerox Corporation Systems and methods for organizing image data into regions
SE0400325D0 (sv) * 2004-02-13 2004-02-13 Mamea Imaging Ab Method and arrangement relating to x-ray imaging
US7324711B2 (en) * 2004-02-26 2008-01-29 Xerox Corporation Method for automated image indexing and retrieval
US20060098243A1 (en) * 2004-11-08 2006-05-11 Lexmark International, Inc. Determining a gray background value and/or skew of a scanned document
US7433513B2 (en) * 2005-01-07 2008-10-07 Hewlett-Packard Development Company, L.P. Scaling an array of luminace values
US7899258B2 (en) * 2005-08-12 2011-03-01 Seiko Epson Corporation Systems and methods to convert images into high-quality compressed documents
US7668394B2 (en) * 2005-12-21 2010-02-23 Lexmark International, Inc. Background intensity correction of a scan of a document
US7856142B2 (en) * 2007-01-26 2010-12-21 Sharp Laboratories Of America, Inc. Methods and systems for detecting character content in a digital image

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000022971A (ja) * 1998-06-30 2000-01-21 Canon Inc 画像処理装置及び方法及び情報処理装置及びその制御方法及び記憶媒体
JP2005018176A (ja) * 2003-06-24 2005-01-20 Nippon Hoso Kyokai <Nhk> 文字領域抽出装置、文字領域抽出方法及び文字領域抽出プログラム
JP2006025448A (ja) * 2005-08-05 2006-01-26 Sony Corp キー信号生成装置及び方法、画像合成装置、並びに記録媒体

Also Published As

Publication number Publication date
JP4516994B2 (ja) 2010-08-04
US20090041344A1 (en) 2009-02-12

Similar Documents

Publication Publication Date Title
JP4590470B2 (ja) 背景色を推定する方法およびシステム
US8290264B2 (en) Image processing method and apparatus
KR101670282B1 (ko) 전경-배경 제약 조건 전파를 기초로 하는 비디오 매팅
US6819796B2 (en) Method of and apparatus for segmenting a pixellated image
US7916173B2 (en) Method for detecting and selecting good quality image frames from video
KR102146560B1 (ko) 영상 보정 방법 및 장치
JP4423298B2 (ja) デジタル画像におけるテキスト状エッジの強調
JP4460839B2 (ja) デジタル画像鮮鋭化装置
WO2008134000A1 (en) Image segmentation and enhancement
KR20100037054A (ko) 이미지들에서 아티팩트들을 감소시키기 위한 장치 및 방법
JP2008187709A (ja) 画素の分類方法および画像処理装置
US20090202167A1 (en) Method and apparatus for image enhancement
JP4350778B2 (ja) 画像処理装置、画像処理プログラムおよび記録媒体
US7327504B2 (en) Method of detecting clipped image pixels
JP4516994B2 (ja) デジタル画像の背景色を決定するための方法およびシステム
JP2008310817A (ja) テキストマップの中からライン構造を検出する方法および画像処理装置
US20180018759A1 (en) Image artifact detection and correction in scenes obtained from multiple visual images
JP2004336282A (ja) 画像処理装置、画像処理プログラム及び該プログラムを記録した記録媒体
JP4649498B2 (ja) 画像データの色補正方法及びシステム
US20190259168A1 (en) Image processing apparatus, image processing method, and storage medium
JP3985928B2 (ja) 画像処理方法、画像処理装置、文字認識装置及び記憶媒体
JP2005275854A (ja) 画像処理装置、画像処理方法、画像処理プログラムおよびこのプログラムを記憶した記録媒体
JP4771087B2 (ja) 画像処理装置及び画像処理プログラム
JP4708866B2 (ja) ルックアップテーブル作成装置および方法,ならびにルックアップテーブル作成プログラム
JP2009010819A (ja) 画像判別装置および方法、並びに、プログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100114

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100119

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100323

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100420

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100517

R150 Certificate of patent or registration of utility model

Ref document number: 4516994

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130521

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140521

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees