JP2015138553A - 画像平滑化方法及び画像平滑化装置 - Google Patents

画像平滑化方法及び画像平滑化装置 Download PDF

Info

Publication number
JP2015138553A
JP2015138553A JP2015006463A JP2015006463A JP2015138553A JP 2015138553 A JP2015138553 A JP 2015138553A JP 2015006463 A JP2015006463 A JP 2015006463A JP 2015006463 A JP2015006463 A JP 2015006463A JP 2015138553 A JP2015138553 A JP 2015138553A
Authority
JP
Japan
Prior art keywords
segment
image
value
pixel
filling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015006463A
Other languages
English (en)
Other versions
JP6467933B2 (ja
Inventor
ジォン・ユヌ
Yun Zheng
源 何
Yuan He
源 何
俊 孫
Shun Son
俊 孫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JP2015138553A publication Critical patent/JP2015138553A/ja
Application granted granted Critical
Publication of JP6467933B2 publication Critical patent/JP6467933B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/10Image enhancement or restoration using non-spatial domain filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/77Retouching; Inpainting; Scratch removal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/194Segmentation; Edge detection involving foreground-background segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/34Smoothing or thinning of the pattern; Morphological operations; Skeletonisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20021Dividing image into blocks, subimages or windows
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20048Transform domain processing
    • G06T2207/20064Wavelet transform [DWT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/28Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
    • G06V30/287Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/409Edge or detail enhancement; Noise or error suppression
    • H04N1/4092Edge or detail enhancement

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Analysis (AREA)

Abstract

【課題】前景又は背景を示す画像に対してデータ充填を行って画像を平滑化する方法及び装置を提供する。
【解決手段】方法は、所定粒度で画像を複数セグメントに分割し;複数セグメントのうちの、空白ピクセル及び非空白ピクセルを含むセグメントの空白ピクセルの値を、非空白ピクセルの値に基づいて得られた値に変更し、充填後のセグメントを取得し;充填後のセグメントのピクセル行列に対して特異値分解を行い、ピクセル値が平滑化されたセグメントを取得し;及び、ピクセル値が平滑化されたセグメント中の各非空白ピクセルの値を、充填ステップ前の非空白ピクセルの初期値に戻し、再建後のセグメントを得ることを含む。
【選択図】図1

Description

本発明は、画像処理分野に関し、特に、前景又は背景を示す画像に対してデータ充填を行うことで画像を平滑化する方法及び装置に関する。
画像処理では、画像(例えば、文書画像)が3層画像、即ち、前景画像、背景画像及びマスク画像に分割されることがある。その後、この3層画像の特性に基づいて、この3層画像に対してそれぞれ処理を行うことで、より良い処理効果を実現することができる。
しかし、背景画像及び前景画像は往々にして平滑な画像でない。例えば、背景画像は、背景の画像ピクセル(画素)だけでなく、背景画像中の前景ピクセルの位置に空白ピクセルも含まれる可能性がある。また、前景画像は、前景の画像ピクセルだけでなく、前景画像中の背景ピクセルの位置に空白ピクセルを含まれる可能性がある。ある場合、例えば、データ圧縮効果を向上させるために、背景画像及び/又は背景層画像中の空白ピクセルの値を変更すること(充填することともいう)で、平滑な背景画像及び平滑な前景画像を得る必要がある。
従来では、通常、空白ピクセル領域近傍のピクセルの平均値を用いることで、ピクセル域中で直接的に画像充填を行う。しかし、このような方法で得られた充填画像は、十分に平滑なものでない。
また、既知の離散コサイン変換(DCT)及びウェーブレット変換(wavelet transform)による方法では、離散コサイン変換及びウェーブレット変換を行うことで、周波数領域で画像充填を行う。しかし、このような方法は、処理速度が遅すぎ、また、量化されたパラメータが充填品質に影響することがある。
よって、上述の問題を解決し得る技術が望ましい。
本発明の1つの目的は、前景又は背景を示す(表示する)画像に対してデータ充填を行うことで、画像を平滑化し得る方法及び装置を提供することにある。
本発明の一側面によれば、前景又は背景を示す画像に対してデータ充填を行うことで、画像を平滑化する方法が提供される。該方法は、
所定粒度で画像を複数セグメント(ブロックとも言う)に分割する分割ステップ;
複数セグメントのうちの、空白ピクセル及び非空白ピクセルを含むセグメントの空白ピクセルの値を、非空白ピクセルの値に基づいて得られた値に変更し、充填後のセグメントを得る充填ステップ;
充填後のセグメントのピクセル行列(matrix)に対して特異値分解を行い、ピクセル値が平滑化されたセグメントを得る平滑化ステップであって、そのうち、ピクセル値が平滑化されたセグメントのピクセル行列の値は、得られた特異値、左特異ベクトル及び右特異ベクトルの転置(transposed)の積として計算された、平滑化ステップ;及び
ピクセル値が平滑化されたセグメント中の各非空白ピクセルの値を、充填ステップ前の非空白ピクセルの初期値に戻し(回復し)、再建後のセグメントを得る再建ステップを含む。
本発明の一実施例による画像平滑化方法のフローチャートである。 所定粒度で分割することにより得られた複数セグメントの例を示す図である。 本発明の他の実施例による所定粒度の整数倍で画像平滑化を行う方法のフローチャートである。 所定粒度の整数倍で分割することにより得られた複数セグメントの例を示す図である。 本発明の一実施例による画像平滑化装置のブロック図である。 本発明の他の実施例による画像平滑化装置のブロック図である。 本発明の他の実施例による画像平滑化装置のブロック図である。 本発明の画像平滑化方法及び画像平滑化装置の実施に用い得る計算装置の例の構成図である。
以下、添付した図面を参照しながら、本発明を実施するための形態を詳細に説明する。
図1は、本発明の実施例による画像平滑化方法100のフローチャートである。
図1に示す方法では、前景又は背景を示す画像に対してデータ充填を行うことで画像を平滑化する。そのうち、前景を示す画像とは、前景層画像を指し、背景を示す画像とは、背景層画像を指す。
図1に示すように、ステップS102では、所定粒度を以て画像を複数セグメントに分割する。
例えば、所定粒度は、4×4ピクセルであってもよく、このような分割で得られた各セグメントの大小(サイズ)は、4×4ピクセルである。なお、容易に理解すべきは、4×4ピクセルは例示だけであり、ニーズに応じて、所定粒度は、他のもの、例えば、8×8ピクセルであっても良いとのことである。
図2は、所定粒度で分割することで得られた複数セグメントの例を示す図である。そのうち、各セグメントは、若干個のピクセルを含む。そのうち、分割により得られた複数セグメントは、空白セグメントだけでなく、非完全空白セグメント(即ち、空白ピクセル及び非空白ピクセルを含むセグメント)をも含む。空白セグメント中は、全てのピクセルが空白なものであり、非完全空白セグメント中は、非空白ピクセルが存在すると同時に、空白ピクセルも存在する。なお、図2に示されていないが、理解すべきは、次のようなセグメントが存在する可能性もあり、即ち、該セグメントには、非空白ピクセルのみが存在する。このようなセグメントに対しては、データ充填を行う必要がない。
背景層画像を例とすると、背景層画像は、背景の画像ピクセルのみを含み、背景層画像中の前景ピクセルの位置は空白ピクセルである。このような場合、背景ピクセルの位置と前景ピクセルの位置との境界の位置には、非完全空白セグメントが存在する可能性があり、背景ピクセルの位置には、非空白セグメントが存在する可能性があり、前景ピクセルの位置には、空白セグメントが存在する可能性がある。
同様に、前景層画像は、前景の画像ピクセルのみを含み、前景層画像中の背景ピクセルの位置は空白ピクセルである。このような場合、前景ピクセルの位置と背景ピクセルの位置との境界の位置には、非完全空白セグメントが存在する可能性があり、前景ピクセルの位置には、非空白セグメントが存在する可能性があり、背景ピクセルの位置には、空白セグメントが存在する可能性がある。
ステップS104では、ステップS102で分割より得られた複数セグメントのうちの、空白ピクセル及び非空白ピクセルを含むセグメント、即ち、非完全空白セグメントについて、該セグメントの空白ピクセルの値を、非空白ピクセルの値に基づいて得られた値に変更することで、充填後のセグメントを得る。非空白ピクセルの値に基づいて得られた値は、例えば、非空白ピクセルの平均値であっても良い。なお、理解すべきは、非空白ピクセルの値に基づいて得られた値は、平均値に限定されず、非空白ピクセルの値と非空白ピクセルの位置の関数であっても良いとのことである。
ステップS106では、ステップS104で得られた充填後のセグメントのピクセル行列に対して異値分解を行うことで、ピクセル値が平滑化されたセグメントを得る。そのうち、ピクセル値が平滑化されたセグメントのピクセル行列の値は、得られた特異値s、左特異ベクトルu及び右特異ベクトルvの転置の積と計算される。
具体的に言えば、充填後のセグメントに対応するピクセル値行列がBであるとする。左特異ベクトルuは、次のように計算され得る。
T=B*B’とし、
i=1:3
u=T*u/norm(u)
エンド
そのうち、B’は、Bの転置を表し。i=1:3は、循環(loop)回数が3であることを示すが、循環回数は、これに限定されず、ニーズに応じて、他の循環回数を設定してもよい。norm(u)は、左特異ベクトルuのノルムを表す。循環を行う時に、uの初期値は、ランダムである。
特異値sは、次のように計算され得る。
s=sqrt((T*u)(0)/u(0))
そのうち、sqrt()は、平方根の関数を表す。“0”は、対応する行列の第1個の要素を表す。なお、理解すべきは、第1個の要素の値だけではなく、他の任意の1つの要素の値を取っても良いとのことである。
右特異ベクトルvは、次のように計算され得る。
T=B’*Bとし、
i=1:3
v=T*v/norm(v)
エンド
そのうち、B’は、Bの転置を表す。i=1:3は、循環回数が3であることを表すが、循環回数は、これに限定されず、ニーズに応じて、他の循環回数を設定しても良い。norm(v)は、右特異ベクトルvのノルムを表す。循環を行う時に、vの初期値は、ランダムである。
ピクセル値が平滑化されたセグメントに対応する近似ピクセル値行列は、Ba=s×u×v’である。そのうち、Baのaは、近似(approximate)を表し、v’は、右特異ベクトルvの転置を表す。
ステップS108では、ステップS106で得られた、ピクセル値が平滑化されたセグメント中の各非空白ピクセルについて、非空白ピクセルの値を、充填ステップS104の前の非空白ピクセルの初期値に戻すことで、再建後のセグメントを得る。その理由は、ステップS106で得られた、ピクセル値が平滑化されたセグメントについて、空白ピクセル及び非空白ピクセルの値はすべて、得られた特異値、左特異ベクトル及び右特異ベクトルの転置の積と計算されたからである。よって、非空白ピクセルの初期値を回復し、空白ピクセルの特異値分解計算結果のみを保留する必要がある。具体的に言えば、近似ピクセル値行列Ba中の非空白ピクセルの値を、充填ステップS104の前の非空白ピクセルの初期値に戻すことで、再建後のセグメントを得る。
ステップS110では、所定収斂条件を満足するかどうかを判断する。
例えば、2回連続反復により得られた2つの再建後のセグメントのピクセルの標準偏差(Standard Deviation)が所定値より小さいかどうかを判断してもよい。標準偏差が所定値より小さい場合、収斂条件を満足していると見なし、そうでない場合、収斂条件を満足してないと見なす。
ステップS110で所定収斂条件を満足していると判断した場合、該処理を終了させる。ステップS110で所定収斂条件を満足していないと判断した場合、ステップS106に戻す。このような場合、ステップS106では、ステップS108で得られた再建後のセグメントのピクセル行列に対して特異値分解を行って、ピクセル値が平滑化されたセグメントを得る。
図3は、本発明の実施例による所定粒度の整数倍で画像平滑化を行う方法300のフローチャートである。
図3の処理は、図1の処理と同様である。しかし、両者の相違点は、所定粒度の整数倍で分割ステップを行い、そして、分割された複数セグメント中の空白セグメント及び図1の処理で得られた再建後のセグメントをそれぞれ空白ピクセル及び非空白ピクセルとして、充填ステップ、平滑化ステップ及び再建ステップを行うことにある。
図3に示すように、ステップS302では、所定粒度の整数倍で画像を複数セグメントに分割しても良い。このように得られたセグメントのサイズは、所定粒度を以て分割することで得られたセグメントのサイズの整数倍である。
ステップS304では、空白セグメント中のピクセルの値を、図1の処理で得られた再建後のセグメント中のピクセルの値に基づいて得られた値に変更することで、充填後のセグメントを得る。
ステップS306では、充填後のセグメントのピクセル行列に対して特異値分解を行うことで、ピクセル値が平滑化されたセグメントを得る。
ステップS308では、図1の処理で得られた再建後のセグメント中のピクセルの値を、ステップS306の前の初期値に戻すことで、今回の再建後のセグメントを得る。
ステップS310では、所定収斂条件を満足しているかどうかを判断する。例えば、2回連続反復により得られた2つの再建後のセグメントのピクセルの標準偏差が所定値より小さいかどうかを判断しても良い。標準偏差が所定値より小さい場合、収斂条件を満足していると見なし、そうでない場合、収斂条件を満足していないと見なす。
画像全体に対して平滑化を行うためには、所定粒度の整数倍数を逓増させることで、分割ステップ、充填ステップ、平滑化ステップ及び再建ステップを、画像中の全てのピクセルへの処理が終わるまでに行っても良い。言い換えると、画像分割時に採用する粒度を次第に増大して、次第に処理を行う。
好ましくは、画像を、原始画像色空間(例えば、RGB色空間)からYCbCr画像色空間に変換しても良く、その後、次元(dimension)Cb及び次元Crのうちの少なくとも1つの次元の画像に対してダウンサンプリングを行うことで、対応する次元上の縮小画像を得る。続いて、それぞれ、次元Yの画像、次元Cbの縮小画像及び次元Crの縮小画像に対して図1乃至4に記載の処理を行う。例えば、Cb及びCr次元の画像の解像度を原解像度の1/2まで下げても良い。なお、理解すべきは、Cb及びCr次元の画像を必ず同じ解像度まで縮小させる必要がなく、ニーズに応じて、異なる解像度まで縮小させても良いとのことである。例えば、Cb次元の画像を原解像度の1/2まで縮小させ、Cr次元の画像を原解像度の1/4まで縮小させても良い。Y次元の画像に比べ、Cb次元の画像及びCr次元の画像の重要度が低いので、Cb次元の画像及びCr次元の画像を縮小させても、処理の品質に影響を与えることがない一方、処理速度を大幅に増加させることができる。
図1乃至4に記載の処理を行った後で、Cr次元の縮小画像及びCb次元の縮小画像に対してアップサンプリングを行うことで、その原始サイズに戻すことができる。その後、原始サイズになった画像を、YCbCr画像色空間から原始画像色空間に変換することができる。
また、オプションで、最終に得られた画像に対してGaussian平滑化を行うことで、画像の平滑化を向上させても良い。
以上、本発明の実施例による画像平滑化方法を説明した。以下、本発明の実施例による画像平滑化装置を説明する。なお、理解すべきは、方法について説明した内容は、対応する画像平滑化装置にも適用し得るとのことである。よって、便宜のため、ここでは重複説明を省略する。
図5は、本発明の一実施例による画像平滑化装置500のブロック図である。画像平滑化装置500は、前景又は背景を示す画像に対してデータ充填を行うことで画像を平滑化する。
図5に示すように、画像平滑化装置500は、分割部502、充填部504、平滑化部506、再建部508及び制御部510を含む。
分割部502は、制御部510の制御の下で、所定粒度を以て画像を複数セグメントに分割する。充填部504は、制御部510の制御の下、分割部502の分割で得られた複数セグメントのうちの、空白ピクセル及び非空白ピクセルを含むセグメントについて、該セグメントの空白ピクセルの値を、非空白ピクセルの値に基づいて得られた値に変更することで、充填後のセグメントを得る。平滑化部506は、制御部510の制御の下で、充填部504の充填後のセグメントのピクセル行列に対して特異値分解を行うことで、ピクセル値が平滑化されたセグメントを取得し、そのうち、ピクセル値が平滑化されたセグメントのピクセル行列の値は、得られた特異値、左特異ベクトル及び右特異ベクトルの転置の積と計算されている。充填部506が得た、ピクセル値が平滑化されたセグメント中の各非空白ピクセルについて、再建部508は、制御部510の制御の下で、該非空白ピクセルの値を、充填部506の充填前の非空白ピクセルの初期値に戻すことで、再建後のセグメントを得る。制御部510は、分割部502、充填部504、平滑化部506及び再建部508の処理を制御するように構成される。
好ましくは、制御部510は、平滑化部506及び再建部508が反復に(繰り返して)処理を、所定収斂条件を満足するまでに行うように制御するように構成されてもよい。
例えば、制御部510は、2回連続反復により得られた2つの再建後のセグメントのピクセルの標準偏差が所定値より小さいかどうかを判断しても良い。標準偏差が所定値より小さい場合、収斂条件を満足していると見なし、そうでない場合、収斂条件を満足していないと見なす。
好ましくは、制御部510は、分割部502が整数倍数の所定粒度を所定粒度として処理を行うように制御し、また、充填部504、平滑化部506及び再建部508が所定粒度で分割された複数セグメントのうちの空白セグメント及び再建後のセグメントをそれぞれ空白ピクセル及び非空白ピクセルとして処理を行うように制御するように構成されても良い。
好ましくは、制御部510は、平滑化部506及び再建部508が反復に処理を、所定収斂条件を満足するまでに行うように制御するように構成されても良い。
好ましくは、制御部510は、分割部502、充填部504、平滑化部506及び再建部508が整数倍数を逓増させて処理を、画像中の全てのピクセルへの処理が終わるまでに行うように制御するように構成されても良い。
図6は、本発明の他の実施例による画像平滑化装置500’のブロック図である。
図6に示す画像平滑化装置500’と、図5に示す画像平滑化装置500との相違点は、画像平滑化装置500’は更に、第一変換部512、ダウンサンプリング部514、アップサンプリング部516及び第二変換部518を含むことにある。
第一変換部512は、画像を、原始画像色空間からYCbCr画像色空間に変換することができる。ダウンサンプリング部514は、次元Cb及び次元Crのうちの少なくとも1つの次元の画像に対してダウンサンプリングを行うことで、対応する次元上の縮小画像を取得し、縮小画像を分割部502に送信することができる。
制御部510は、分割部502、充填部504、平滑化部506及び再建部508の処理を制御することができる。分割部502は、制御部510の制御の下で、所定粒度によるダウンサンプリング部514の処理で得られた画像を複数セグメントに分割することができる。充填部504は、制御部510の制御の下で、分割部502の分割により到られた複数セグメントのうちの、空白ピクセル及び非空白ピクセルを含むセグメントについて、該セグメントの空白ピクセルの値を、非空白ピクセルの値に基づいて得られた値に変更することで、充填後のセグメントを得ることができる。平滑化部506は、制御部510の制御の下で、充填部504の充填後のセグメントのピクセル行列に対して特異値分解を行うことで、ピクセル値が平滑化されたセグメントを得ることができ、そのうち、ピクセル値が平滑化されたセグメントのピクセル行列の値は、得られた特異値、左特異ベクトル及び右特異ベクトルの転置の積と計算された。充填部506が得た、ピクセル値が平滑化されたセグメント中の各非空白ピクセルについて、再建部508は、制御部510の制御の下で、該非空白ピクセルの値を、充填部506の充填前の非空白ピクセルの初期値に戻すことで、再建後のセグメントを得ることができる。
アップサンプリング部516は、再建部508が再建した画像に対してアップサンプリングを行うことで、その原始サイズに回復することができる。第二変換部518は、原始サイズになった画像を、YCbCr画像色空間から原始画像色空間に変換することができる。
図7は、本発明の他の実施例による画像平滑化装置500”のブロック図である。
図7に示す画像平滑化装置500”と、図5に示す画像平滑化装置500との相違点は、画像平滑化装置500”は更にGaussian平滑化部520を含むことにある。
Gaussian平滑化部520は、再建部508が再建した画像に対してGaussian平滑化を行うことで、平滑化の効果を向上させた画像を得ることができる。
また、上述の方法及び装置は、ソフトウェア、ファームウェア、ハードウェア又はそれらの任意の組む合せの方式で実現されても良い。ソフトウェア又はファームウェアにより実現する場合、まず、記憶媒体又はネットワークから、専用ハードウェア構造を有するマシン(例えば、図8に示す汎用マシン800)に該ソフトウェア又はファームウェアのプログラムをインストールし、それから、該マシンは、各種プログラムがインストールされている時に、上述の方法及び装置の各種機能を実行することができる。
図8は、本発明の画像平滑化方法及び画像平滑化装置の実施に用い得る計算装置の例(汎用コンピュータ800)の構成図である。
図8に示すように、中央処理ユニット(CPU)801が、リードオンリーメモリ(ROM)802に記憶されているプログラム、又は、記憶部808からランダムアクセスメモリ(RAM)803にロードされているプログラムに基づいて各種の処理を行う。RAM803は、ニーズに応じて、CPU801が各種の処理などを実行するときに必要なデータを記憶しても良い。CPU801、ROM802及びRAM803は、バス804を経由して互いに接続される。また、入力/出力インターフェース805もバス804に接続される。
入力/出力インターフェース805には、入力部806(キーボードやマウスなどを含む)、出力部807(表示器、例えばCRT、LCD、スピーカーなどを含む)、記憶部808(ハードディスクなどを含む)、及び通信部809(ネットワーク接続カード、例えばLANカード、モデムなどを含む)が接続される。通信部809は、ネットワーク、例えばインターネットを経由して通信処理を行う。また、ドライブ810がニーズに応じて入力/出力インターフェース805に接続されても良い。また、ニーズに応じて、取り外し可能な媒体811、例えば磁気ディスク、光ディスク、光磁気ディスク、半導体メモリなどをドライブ810にセットすることにより、その中から読み出したコンピュータプログラムを記憶部808にインストールしても良い。
ソフトウェアにより上述の処理を実現する場合は、ネットワーク、例えばインターネット、又は記憶媒体、例えば取り外し可能な媒体811から、このソフトウェアを構成すプログラムをインストールしても良い。
なお、当業者が理解すべきは、このような記憶媒体は、中にプログラムが記憶されており、ユーザにプログラムを提供するよう装置と独立して配られる図8に示すような取り外し可能な媒体811に限定されない。取り外し可能な媒体811の例としては、磁気ディスク(フロッピー(登録商標)ディスクを含む)、光ディスク(CD−ROM及びDVDを含む)、光磁気ディスク(MD(登録商標)を含む)、及び半導体メモリを含む。或いは、記憶媒体はROM802、記憶部808に含まれるハードディスクなどであってもよく、それらにはプログラムが記憶されており、且つそれらを含む装置とともにユーザに配られても良い。
また、本発明は、マシン(例えば、コンピュータ)読取可能な命令コードからなるプログラムプロダクトにも関する。この命令コードは、マシンに読み取られて実行される時に、上述の実施例による方法を実行することができる。
さらに、上述のマシン読取可能な命令コードからなるプログラムプロダクトを記憶している記憶媒体も本開示に含まれている。このような記憶媒体は、磁気ディスク(フロッピーディスク)、光ディスク、光磁気ディスク、メモリカード、メモリスティックなどを含むが、これらに限定されない。
本発明の上述の実施例による方法は、明細書に記載の又は図面に図示の時間順序に従って実行することに限定されず、他の時間順序に従って、並列に又は独立して実行しても良い。よって、本明細書又は図面に記載の方法の実行順序は、本発明の技術的範囲を限定しない。
また、もちろん、本発明の上述の方法の各処理プロセスは、各種のマシン可読記憶媒体に保存のコンピュータ実行可能なプログラムの方式により実現されても良い。
また、本発明の目的は、上述の実行可能なプログラムコードを記憶している記憶媒体を直接又は間接にシステム又は装置に提供し、且つ、該システム又は装置中のコンピュータ又は中央処理ユニット(CPU)が上述のプログラムコードを読み出して実行させる方式で実現されても良い。
また、該システム又は装置はプログラムを実行する機能を有すれば、本発明の実施方式はプログラムに限定されず、また、該プログラムは他の任意の形式、例えば、オブジェクトプログラム、インタープリター実行用プログラム、又は、オペレーティングシステム操作システムに提供するスクリプトプログラムなどであっても良い。
上述のマシン可読記憶媒体は、各種の記憶装置及び記憶ユニット、半導体装置、ディスユニット例えば光、磁気及び光磁気ディス、及び他の任意の使用可能な情報記憶媒体などであっても良い。
また、クライントコンピュータが、インターネットに接続されている所定のウェブサイトを経由して、本発明の上述の実施例によるコンピュータプログラムコードをダウンロードし、コンピュータにインストールした後に、該プログラムを実行することにより、本発明を実現することもできる。
また、上述の各実施例を含む実施形態に関し、更に以下の付記を開示する。
(付記1)
前景又は背景を示す画像に対してデータ充填を行い、画像を平滑化する方法であって、
所定粒度で前記画像を複数セグメントに分割する分割ステップ;
前記複数セグメントのうちの、空白ピクセル及び非空白ピクセルを含むセグメントの空白ピクセルの値を、前記非空白ピクセルの値に基づいて得られた値に変更し、充填後のセグメントを得る充填ステップ;
前記充填後のセグメントのピクセル行列に対して特異値分解を行い、ピクセル値が平滑化されたセグメントを得る平滑化ステップであって、そのうち、前記ピクセル値が平滑化されたセグメントのピクセル行列の値は、得られた特異値、左特異ベクトル及び右特異ベクトルの転置の積と計算された、平滑化ステップ;及び
前記ピクセル値が平滑化されたセグメント中の各非空白ピクセルの値を、前記充填ステップ前の前記非空白ピクセルの初期値に戻し、再建後のセグメントを得る再建ステップを含む、方法。
(付記2)
付記1に記載の方法であって、更に、
反復に前記平滑化ステップ及び前記再建ステップを、所定収斂条件を満足するまでに行うことを含む、方法。
(付記3)
付記1に記載の方法であって、更に、
整数倍数の所定粒度を前記所定粒度として前記分割ステップを行い、前記所定粒度で分割された複数セグメントのうちの空白セグメント及び前記再建後のセグメントをそれぞれ前記空白ピクセル及び前記非空白ピクセルとして前記充填ステップ、前記平滑化ステップ及び前記再建ステップを行うことを含む、方法。
(付記4)
付記3に記載の方法であって、更に、
反復に前記平滑化ステップ及び前記再建ステップを、所定収斂条件を満足するまでに行うことを含む、方法。
(付記5)
付記3に記載の方法であって、更に、
前記整数倍数を逓増させて前記分割ステップ、前記充填ステップ、前記平滑化ステップ及び前記再建ステップを、前記画像中の全てのピクセルへの処理が終わるまでに行うことを含む、方法。
(付記6)
付記2又は4に記載の方法であって、
前記所定収斂条件は、2回連続反復により得られた2つの再建後のセグメントのピクセルの標準偏差が所定値より小さいかどうかである、方法。
(付記7)
付記1に記載の方法であって、
前記分割ステップの前に、更に、
前記画像を原始画像色空間からYCbCr画像色空間に変換する第一変換ステップ;及び
次元Cb及び次元Crのうちの少なくとも1つの次元の画像に対してダウンサンプリングを行い、対応する次元の縮小画像を得るダウンサンプリングステップを含む、方法。
(付記8)
付記7に記載の方法であって、
前記再建ステップの後に、更に、
前記縮小画像に対してアップサンプリングを行い、その原始サイズに戻すアップサンプリングにステップ;及び
原始サイズに戻された画像を、前記YCbCr画像色空間から前記原始画像色空間に変換する第二変換ステップを含む、方法。
(付記9)
付記1に記載の方法であって、
前記再建ステップの後に、更に、
前記再建ステップが再建した画像に対してGaussian平滑化を行うGaussian平滑化ステップを含む、方法。
(付記10)
前景又は背景を示す画像に対してデータ充填を行い、画像を平滑化する装置であって、
所定粒度で前記画像を複数セグメントに分割するための分割部;
前記複数セグメントのうちの、空白ピクセル及び非空白ピクセルを含むの空白ピクセルの値を、前記非空白ピクセルの値に基づいて得られた値に変更し、充填後のセグメントを得るための充填部;
前記充填後のセグメントのピクセル行列に対して特異値分解を行い、ピクセル値が平滑化されたセグメントを得るための平滑化部であって、そのうち、前記ピクセル値が平滑化されたセグメントのピクセル行列の値は、得られた特異値、左特異ベクトル及び右特異ベクトルの転置の積と計算された、平滑化部;
前記ピクセル値が平滑化されたセグメント中の各非空白ピクセルの値を、前記充填部の充填前の前記非空白ピクセルの初期値に戻し、再建後のセグメントを得るための再建部
;及び
前記分割部、前記充填部、前記平滑化部及び前記再建部の処理を制御するための制御部を含む、装置。
(付記11)
付記10に記載の装置であって、更に、
前記制御部は、前記平滑化部及び再建部が反復に処理を、所定収斂条件を満足するまでに行うように制御するように構成される、装置。
(付記12)
付記10に記載の装置であって、
前記制御部は、前記分割部が整数倍数の所定粒度を前記所定粒度として処理を行うように制御し、且つ、前記充填部、前記平滑化部及び前記再建部が前記所定粒度で分割された複数セグメントのうちの空白セグメント及び前記再建後のセグメントをそれぞれ前記空白ピクセル及び前記非空白ピクセルとして処理を行うように制御するように構成される、装置。
(付記13)
付記12に記載の装置であって、
前記制御部は、前記平滑化部及び前記再建部が反復に処理を、所定収斂条件を満足するまでに行うように制御するように構成される、装置。
(付記14)
付記12に記載の装置であって、
前記制御部は、前記分割部、前記充填部、前記平滑化部及び前記再建部が前記整数倍数を逓増させて処理を、前記画像中の全てのピクセルへの処理が終わるまでに行うように制御するように構成される、装置。
(付記15)
付記11又は13に記載の装置であって、
前記所定収斂条件は、2回連続反復により得られた2つの再建後のセグメントのピクセルの標準偏差が所定値より小さいかどうかである、装置。
(付記16)
付記10に記載の装置であって、更に、
前記画像を、原始画像色空間からYCbCr画像色空間に変換するための第一変換部;及び
次元Cb及び次元Crのうちの少なくとも1つの次元の画像に対してダウンサンプリングを行い、対応する次元の縮小画像を取得し、前記縮小画像を前記分割部に送信するためのダウンサンプリングに部を含む、装置。
(付記17)
付記16に記載の装置であって、更に
前記再建部が再建した画像に対してアップサンプリングを行い、その原始サイズに戻すためのアップサンプリング部;及び
原始サイズに戻された画像を、前記YCbCr画像色空間から前記原始画像色空間に変換するための第二変換部を含む、装置。
(付記18)
付記10に記載の装置であって、更に
前記再建部が再建した画像に対してGaussian平滑化を行うためのGaussian平滑化部を含む、装置。
(付記19)
コンピュータに、付記1〜9中の任意の1項に記載の方法を実行させるためのプログラム。
(付記20)
付記19に記載のプログラムを記憶したコンピュータ可読媒体。
以上、本発明の好ましい実施形態を説明したが、本発明はこの実施形態に限定されず、本発明の趣旨を離脱しない限り、本発明に対するあらゆる変更は本発明の技術的範囲に属する。

Claims (10)

  1. 前景又は背景を示す画像に対してデータ充填を行って画像を平滑化する方法であって、
    所定粒度により前記画像を複数セグメントに分割する分割ステップ;
    前記複数セグメントのうちの、空白ピクセル及び非空白ピクセルを含むセグメントの空白ピクセルの値を、前記非空白ピクセルの値に基づいて得られた値に変更し、充填後のセグメントを得る充填ステップ;
    前記充填後のセグメントのピクセル行列に対して特異値分解を行い、ピクセル値が平滑化されたセグメントを得る平滑化ステップであって、そのうち、前記ピクセル値が平滑化されたセグメントのピクセル行列の値は、得られた特異値、左特異ベクトル及び右特異ベクトルの転置の積と計算された、平滑化ステップ;及び
    前記ピクセル値が平滑化されたセグメント中の各非空白ピクセルの値を、前記充填ステップ前の前記非空白ピクセルの初期値に戻し、再建後のセグメントを得る再建ステップを含む、方法。
  2. 請求項1に記載の方法であって、更に、
    反復に前記平滑化ステップ及び前記再建ステップを、所定収斂条件を満足するまでに行うことを含む、方法。
  3. 請求項1に記載の方法であって、更に、
    整数倍数の所定粒度を前記所定粒度として前記分割ステップを行い、前記所定粒度で分割された複数セグメントのうちの空白セグメント及び前記再建後のセグメントをそれぞれ前記空白ピクセル及び前記非空白ピクセルとして前記充填ステップ、前記平滑化ステップ及び前記再建ステップを行うことを含む、方法。
  4. 請求項3に記載の方法であって、更に、
    反復に前記平滑化ステップ及び前記再建ステップを、所定収斂条件を満足するまでに行うことを含む、方法。
  5. 請求項3に記載の方法であって、更に、
    前記整数倍数を逓増させて前記分割ステップ、前記充填ステップ、前記平滑化ステップ及び前記再建ステップを、前記画像中の全てのピクセルへの処理が終わるまでに行うことを含む、方法。
  6. 請求項求2又は4に記載の方法であって、
    前記所定収斂条件は、2回連続反復により得られた2つの再建後のセグメントのピクセルの標準偏差が所定値より小さいかどうかである、方法。
  7. 請求項1に記載の方法であって、
    前記分割ステップの前に、更に、
    前記画像を、原始画像色空間からYCbCr画像色空間に変換する第一変換ステップ
    ;及び
    次元Cb及び次元Crのうちの少なくとも1つの次元の画像に対してダウンサンプリングを行い、対応する次元の縮小画像を得るダウンサンプリングステップを含む、方法。
  8. 請求項7に記載の方法であって、
    前記再建ステップの後に、更に、
    前記縮小画像に対してアップサンプリングを行い、その原始サイズに戻すアップサンプリングステップ;及び
    原始サイズに戻された画像を、前記YCbCr画像色空間から前記原始画像色空間に変換する第二変換ステップを含む、方法。
  9. 請求項1に記載の方法であって、
    前記再建ステップの後に、更に、
    前記再建ステップにより再建された画像に対してGaussian平滑化を行うGaussian平滑化ステップを含む、方法。
  10. 前景又は背景を示す画像に対してデータ充填を行って画像を平滑化する装置であって、
    所定粒度により前記画像を複数セグメントに分割するための分割部;
    前記複数セグメントのうちの、空白ピクセル及び非空白ピクセルを含むセグメントの空白ピクセルの値を、前記非空白ピクセルの値に基づいて得られた値に変更し、充填後のセグメントを得る充填部;
    前記充填後のセグメントのピクセル行列に対して特異値分解を行い、ピクセル値が平滑化されたセグメントを得るための平滑化部であって、そのうち、前記ピクセル値が平滑化されたセグメントのピクセル行列の値は、得られた特異値、左特異ベクトル及び右特異ベクトルの転置の積と計算された、平滑化部;
    前記ピクセル値が平滑化されたセグメント中の各非空白ピクセル値を、前記充填部の充填前の前記非空白ピクセルの初期値に戻し、再建後のセグメントを得るための再建部;及び
    前記分割部、前記充填部、前記平滑化部及び前記再建部の処理を制御するための制御部を含む、装置。
JP2015006463A 2014-01-20 2015-01-16 画像平滑化方法及び画像平滑化装置 Expired - Fee Related JP6467933B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201410025101.4 2014-01-20
CN201410025101.4A CN104794686B (zh) 2014-01-20 2014-01-20 图像平滑方法和图像平滑装置

Publications (2)

Publication Number Publication Date
JP2015138553A true JP2015138553A (ja) 2015-07-30
JP6467933B2 JP6467933B2 (ja) 2019-02-13

Family

ID=53545070

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015006463A Expired - Fee Related JP6467933B2 (ja) 2014-01-20 2015-01-16 画像平滑化方法及び画像平滑化装置

Country Status (3)

Country Link
US (1) US9418307B2 (ja)
JP (1) JP6467933B2 (ja)
CN (1) CN104794686B (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104794686B (zh) * 2014-01-20 2018-06-12 富士通株式会社 图像平滑方法和图像平滑装置
CN106611406B (zh) * 2015-10-27 2019-08-16 富士通株式会社 图像校正方法和图像校正设备
CN111476146B (zh) * 2020-04-03 2023-04-07 北京金沙江科技有限公司 一种基于移动端的学历证件照标准化处理方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02503241A (ja) * 1988-02-22 1990-10-04 イーストマン・コダック・カンパニー Svdブロック変換を使用したディジタル画像雑音抑制方法
US6016366A (en) * 1996-02-05 2000-01-18 Hewlett-Packard Company Method of filtering images using image compressibility to determine threshold parameter
JP2000163569A (ja) * 1998-11-30 2000-06-16 Mitsubishi Electric Corp 画質改善方法及び画質改善装置

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4945502A (en) * 1988-12-27 1990-07-31 Eastman Kodak Company Digital image sharpening method using SVD block transform
DE69214229T2 (de) * 1991-08-14 1997-04-30 Agfa Gevaert Nv Verfahren und Vorrichtung zur Kontrastverbesserung von Bildern
US7408986B2 (en) * 2003-06-13 2008-08-05 Microsoft Corporation Increasing motion smoothness using frame interpolation with motion analysis
US7889950B2 (en) * 2005-08-30 2011-02-15 The Regents Of The University Of California, Santa Cruz Kernel regression for image processing and reconstruction
US7881554B2 (en) * 2006-06-05 2011-02-01 Stmicroelectronics S.R.L. Method for correcting a digital image
JP4862897B2 (ja) * 2007-02-02 2012-01-25 株式会社ニコン 画像処理方法
CN101290678A (zh) * 2007-04-20 2008-10-22 美国西门子医疗解决公司 快速平滑向上取样得自医学成像的二元体积
US8948539B2 (en) * 2011-09-28 2015-02-03 The United States Of America As Represented By The Secretary Of The Army System and method for image improvement and enhancement
JP5220677B2 (ja) * 2009-04-08 2013-06-26 オリンパス株式会社 画像処理装置、画像処理方法および画像処理プログラム
US8917952B2 (en) * 2012-10-22 2014-12-23 Siemens Medical Solutions Usa, Inc. Parallel image convolution processing with SVD kernel data
US8977012B2 (en) * 2012-10-31 2015-03-10 Google Inc. Image denoising system and method
CN103049892B (zh) * 2013-01-27 2015-05-27 西安电子科技大学 基于相似块矩阵秩最小化的非局部图像去噪方法
CN104794686B (zh) * 2014-01-20 2018-06-12 富士通株式会社 图像平滑方法和图像平滑装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02503241A (ja) * 1988-02-22 1990-10-04 イーストマン・コダック・カンパニー Svdブロック変換を使用したディジタル画像雑音抑制方法
US6016366A (en) * 1996-02-05 2000-01-18 Hewlett-Packard Company Method of filtering images using image compressibility to determine threshold parameter
JP2000163569A (ja) * 1998-11-30 2000-06-16 Mitsubishi Electric Corp 画質改善方法及び画質改善装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
WEI LI ET AL.: "EFFICIENT IMAGE COMPLETION METHOD BASED ON ALTERNATING DIRECTION THEORY", 2013 IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING, JPN6018049655, 15 September 2013 (2013-09-15), US, pages 700 - 703, XP032566103, DOI: doi:10.1109/ICIP.2013.6738144 *
井上 光平、浦浜 喜一: ""スパースな特異値分解に基づく画像識別と画像検索の高速化"", 電子情報通信学会技術研究報告, vol. 102, no. 152, JPN6018049654, 21 June 2002 (2002-06-21), JP, pages 1 - 6 *

Also Published As

Publication number Publication date
US20150206021A1 (en) 2015-07-23
CN104794686A (zh) 2015-07-22
US9418307B2 (en) 2016-08-16
JP6467933B2 (ja) 2019-02-13
CN104794686B (zh) 2018-06-12

Similar Documents

Publication Publication Date Title
CN110555795B (zh) 高解析度风格迁移
JP6490871B2 (ja) 画像アップスケーリング
JP6961139B2 (ja) 知覚的な縮小方法を用いて画像を縮小するための画像処理システム
CN113014927B (zh) 图像压缩方法和图像压缩装置
US10803552B2 (en) Video resolution up-conversion method and device
JP6467933B2 (ja) 画像平滑化方法及び画像平滑化装置
EP4107628A1 (en) Method and apparatus for deep neural network based inter-frame prediction in video coding
Vishnukumar et al. Single image super-resolution based on compressive sensing and improved TV minimization sparse recovery
Feng et al. Single‐image super‐resolution with total generalised variation and Shearlet regularisations
WO2017070841A1 (zh) 图像处理方法和装置
US20220114770A1 (en) Image Processing Method And Apparatus And Computer Program Product For The Same
US9508025B2 (en) Image processing device, image processing method and medium
KR102119132B1 (ko) 에지 컴퓨팅용 초고해상도 영상을 복원하기 위한 초고해상도 영상 복원 장치 및 방법
US11080824B2 (en) Techniques for upscaling images generated with undetermined downscaling kernels
US8908986B1 (en) Systems and methods for selecting ink colors
CN114140340A (zh) 图像数据的伪影处理方法及装置、存储介质、终端
JP4957572B2 (ja) 画像処理装置、画像処理システム、画像処理方法および画像処理プログラム
WO2023031999A1 (ja) 映像情報処理装置、方法およびプログラム
US11880961B2 (en) Spectral hint-based inpainting of images
US20230342991A1 (en) Machine learning-based chroma keying process
JP2013042328A (ja) 画像処理装置及び画像処理プログラム
JP4085647B2 (ja) ブロックノイズ除去方法
WO2022268236A1 (en) Image compression and associated color approximation
CN115880144A (zh) 图像处理方法、装置、电子设备及计算机可读存储介质
CN115641267A (zh) 人脸图像的修复方法及装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20171215

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181207

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181218

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181231

R150 Certificate of patent or registration of utility model

Ref document number: 6467933

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees