JP2004215257A - Dct基盤の改善された動映像符号化方法及びその装置 - Google Patents
Dct基盤の改善された動映像符号化方法及びその装置 Download PDFInfo
- Publication number
- JP2004215257A JP2004215257A JP2003427762A JP2003427762A JP2004215257A JP 2004215257 A JP2004215257 A JP 2004215257A JP 2003427762 A JP2003427762 A JP 2003427762A JP 2003427762 A JP2003427762 A JP 2003427762A JP 2004215257 A JP2004215257 A JP 2004215257A
- Authority
- JP
- Japan
- Prior art keywords
- quantization
- dct
- input video
- video data
- modified
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/117—Filters, e.g. for pre-processing or post-processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
- H04N19/126—Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/80—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
【課題】 DCT基盤の改善された動映像符号化方法及びその装置を提供する。
【解決手段】 本発明による複数の変形量子化加重値行列を使用するDCT基盤の動映像符号化方法は、入力映像データのノイズ情報に基づいて、前記複数の変形量子化加重値行列のうち何れか一つを選択する段階と、前記入力映像データに対してDCT変換を行う段階と、前記DCT変換された入力映像データに対して前記選択された変形量子化加重値行列を使用して量子化を行う段階と、を含む。
【選択図】 図10
【解決手段】 本発明による複数の変形量子化加重値行列を使用するDCT基盤の動映像符号化方法は、入力映像データのノイズ情報に基づいて、前記複数の変形量子化加重値行列のうち何れか一つを選択する段階と、前記入力映像データに対してDCT変換を行う段階と、前記DCT変換された入力映像データに対して前記選択された変形量子化加重値行列を使用して量子化を行う段階と、を含む。
【選択図】 図10
Description
本発明は動映像符号化方法及びその装置に係り、特に、DCT(Discrete Cosine Transform)に基盤している動映像符号化器にノイズに歪曲されている映像が入力された場合、これを効果的に除去するための方法及び装置に関する。
最近、アナログ地上波放送を受信して、これをMPEG2、MPEG4のような圧縮方式を利用して符号化して保存するセットアップボックスが開発されている。しかし、地上波放送の場合、受信端での映像がチャンネルによってノイズに歪曲されている場合が多い。例えば、映像全体にホワイトガウスノイズが加えられているような現象が見られる場合がある。このような映像をそのまま圧縮する場合、ノイズの影響で圧縮効率が落ちる。
したがって、動映像でのノイズ除去のための研究が活発に行われている。従来使われているノイズ除去方式には、空間領域ノイズ除去方式と時間領域ノイズ除去方式とがある。以下では、図1ないし図4を参照して、従来のノイズ除去方式を説明する。
図1は、一般的な動映像符号化のための符号化器を示すブロック図である。
VODサービスや動映像通信のために、符号化器は圧縮技術によって符号化されたビットストリームを生成する機能を行う。
まず、DCT部110は、空間的相関性を除去するために8×8画素ブロック単位に入力される映像データに対してDCT演算を行い、量子化部(Quantization:Q)120は、DCT部110で得られたDCT係数に対して量子化を行って、幾つの代表値で表現することによって、高効率損失圧縮を行う。
VODサービスや動映像通信のために、符号化器は圧縮技術によって符号化されたビットストリームを生成する機能を行う。
まず、DCT部110は、空間的相関性を除去するために8×8画素ブロック単位に入力される映像データに対してDCT演算を行い、量子化部(Quantization:Q)120は、DCT部110で得られたDCT係数に対して量子化を行って、幾つの代表値で表現することによって、高効率損失圧縮を行う。
逆量子化部(Inverse Quantization:IQ)130は、量子化部120で量子化された映像データを逆量子化する。IDCT(Inverse Discrete Cosine Transform)部140は、逆量子化部130で逆量子化された映像データに対してIDCT変換を行う。フレームメモリ部150は、IDCT部140でIDCT変換された映像データをフレーム単位に保存する。
動き推定及び補償部(Motion Estimation and Compensation:ME/MC)160は、入力される現在フレームの映像データとフレームメモリ部150に保存された以前フレームの映像データとを利用してマクロブロック当り動きベクトルMVとブロック整合誤差に当るSAD(Sum of Absolute Difference)とを推定する。
可変長符号化部(Variable Length Coding:VLC)170は、動き推定部160で推定された動きベクトルMVによってDCT及び量子化処理されたデータで統計的な重複性を除去する。
図2は、従来のノイズ除去方式を採用した動映像符号化器を示している。図2に示された動映像符号化器は、図1に示された一般的な符号化器220に前処理器210が付加された構成を有する。前処理器210は、従来のノイズ除去方式を利用して入力映像からノイズを除去して、ノイズが除去された映像を動映像符号化器220に入力する。
前処理器210で使われるノイズ除去方式には、空間領域ノイズ除去方式と時間領域ノイズ除去方式とがあり、この2つのノイズ除去方式を結合した空間−時間領域ノイズ除去方式がある。
図3及び図4は、空間領域ノイズ除去方式を示す図面である。
図3のエッジ選択部310は、図4に示された8つの空間領域ノイズ除去フィルターマスク別に高域通過フィルタリングを行い、フィルタリングされた出力の絶対値が最小である方向を選択する。係数制御部320は、選択された方向によって低域通過フィルターの係数を調整することによって、選択された方向に低域通過フィルタリングを行う。この時、エッジ選択部310で使用するマスクの数が多いほど方向性検出の正確度は高くなるが、ノイズ減衰効果は低くなる。一方、マスクの数が小さいほどノイズ減衰効果は高くなるが、エッジブラリングが発生する。
図3のエッジ選択部310は、図4に示された8つの空間領域ノイズ除去フィルターマスク別に高域通過フィルタリングを行い、フィルタリングされた出力の絶対値が最小である方向を選択する。係数制御部320は、選択された方向によって低域通過フィルターの係数を調整することによって、選択された方向に低域通過フィルタリングを行う。この時、エッジ選択部310で使用するマスクの数が多いほど方向性検出の正確度は高くなるが、ノイズ減衰効果は低くなる。一方、マスクの数が小さいほどノイズ減衰効果は高くなるが、エッジブラリングが発生する。
図5は、時間領域ノイズ減衰方式を説明するための図面である。
図5の動き検出部510は、入力映像とフレームメモリ530とに保存された以前映像から現在映像の動き存在の有無及びノイズのサイズを予測する。動き検出部510によって現在映像での動きが小さく、ノイズが多いと判断される場合、時間的再帰フィルター520は、時間軸に対して強い低帯域通過フィルタリングを行う。もし、動き検出部510によって現在映像での動きが大きく、ノイズが少ないと判断される場合、時間的再帰フィルター520は、低帯域通過フィルタリングを行わず、入力映像をそのまま出力する。このような時間領域ノイズ減衰方式は、動きがほとんどない映像では良い効果を表す。
このような、ノイズ除去方式の一例は、特許文献1にも開示されている。
図5の動き検出部510は、入力映像とフレームメモリ530とに保存された以前映像から現在映像の動き存在の有無及びノイズのサイズを予測する。動き検出部510によって現在映像での動きが小さく、ノイズが多いと判断される場合、時間的再帰フィルター520は、時間軸に対して強い低帯域通過フィルタリングを行う。もし、動き検出部510によって現在映像での動きが大きく、ノイズが少ないと判断される場合、時間的再帰フィルター520は、低帯域通過フィルタリングを行わず、入力映像をそのまま出力する。このような時間領域ノイズ減衰方式は、動きがほとんどない映像では良い効果を表す。
このような、ノイズ除去方式の一例は、特許文献1にも開示されている。
しかし、このような従来空間領域のノイズ除去フィルターの場合、エッジを生かすためにフィルタリングを行った場合にも、ブラリング効果は相変らず現れるという問題点があった。また、従来時間領域のノイズ除去フィルターの場合にも動きがある場合には、フィルタリングがほとんど行われないため、ノイズ除去効果がないという問題点があった。
米国特許第5,969,777号公報
1999年6月に頒布されたIEEE Trans.Circ.Syst.for Video Technol.のW.Niehsen及びM.Brunigによる"Covariance analysis of motion−compensated frame differences"
本発明は前記のような従来ノイズ除去方式を改善して、動映像符号器内でフィルタリングを加えてノイズを除去する改善されたノイズ除去方法及び装置を提供することを目的とする。
本発明はまた、前記改善されたノイズ除去方法及び装置を使用する動映像符号化方法及び符号化装置を提供することを目的とする。
前記目的は、本発明による複数の変形量子化加重値行列を使用するDCT基盤の動映像符号化方法において、入力映像データのノイズ情報に基づいて、前記複数の変形量子化加重値行列のうち何れか一つを選択する段階と、前記入力映像データに対してDCT変換を行う段階と、前記DCT変換された入力映像データに対して前記選択された変形量子化加重値行列を使用して量子化を行う段階と、を含む方法によって達成される。
また、前記目的は、本発明によるDCT基盤の動映像符号化方法において、入力映像データのノイズ情報に基づいて、変形量子化加重値行列を生成する段階と、前記入力映像データに対してDCT変換を行う段階と、前記DCT変換された入力映像データに対して前記生成された変形量子化加重値行列を使用して量子化を行う段階と、を含む符号化方法によって達成される。
また、前記目的は、本発明による複数の変形量子化加重値行列を使用するDCT基盤の動映像符号化装置において、前記複数の変形量子化加重値行列を保存する変形量子化加重値行列保存部と、入力映像データのノイズ情報に基づいて、前記複数の変形量子化加重値行列のうち何れか一つを決定する変形量子化加重値行列決定部と、前記入力映像データに対してDCT変換を行うDCT変換部と、前記DCT変換された入力映像データに対して前記選択された変形量子化加重値行列を使用して量子化を行う量子化部と、を含む装置によって達成される。
また、前記目的は、DCT基盤の動映像符号化装置において、入力映像データのノイズ情報に基づいて、変形量子化加重値行列を生成する段階変形量子化加重値行列生成部と、前記入力映像データに対してDCT変換を行うDCT変換部と、前記DCT変換された入力映像データに対して前記量子化加重値行列生成部で生成された変形量子化加重値行列を使用して量子化を行う量子化部と、を含む装置によって達成される。
本発明によるDCT領域でのノイズ除去装置が適用された動映像符号化器を使用することによって、従来の動映像符号化器に少量のメモリと簡単なロジック及び処理過程を追加することによって従来の動映像符号化器及び復号化器と互換性を維持しつつ、ノイズ除去のための高性能のフィルタリングを具現できる。
以下では、図6ないし図9を参照して、本発明に使われる改善されたノイズ除去方式を説明する。
動映像符号化において、前処理フィルタリングは、映像に混ざっているノイズを除去することによって、符号化効率を向上させるという点で非常に重要である。ノイズ除去のための従来の前処理フィルタリングが、ほとんど空間画素領域で行われたことと違って、本発明によるノイズ除去方式は、符号器内のDCT領域で行われることを特徴とする。
動映像符号化において、前処理フィルタリングは、映像に混ざっているノイズを除去することによって、符号化効率を向上させるという点で非常に重要である。ノイズ除去のための従来の前処理フィルタリングが、ほとんど空間画素領域で行われたことと違って、本発明によるノイズ除去方式は、符号器内のDCT領域で行われることを特徴とする。
本発明を説明するための実施例では、このために近似化された一般化ウィーナーフィルタリングを使用した。ここで、近似化された一般化ウィーナーフィルタリングとは、DCTのような高速ユニタリ変換を使用することによって、近似的にウィーナーフィルタリングを具現させうるフィルタリング方法を意味する。また、選択的に近似化されたウィーナーフィルタリング以外に、DCT領域でのフィルタリングのために他のフィルタリング技法を使用しても良い。
図6は、平均値が0でない映像データのための近似化された一般化ウィーナーフィルタリングを示すブロック図である。
図6で入力vは、ノイズが含まれた映像ブロックを意味し、出力(式(1))はフィルタリングされた映像ブロックの行−整列された列ベクトルを意味する。入力映像vは、通常0でない平均を有する映像ブロックであるので、平均値予測部610では当該ブロックの平均値(式(2))を予測し、減算部620では入力映像vから予測された平均値(式(2))を減算する。
図6で入力vは、ノイズが含まれた映像ブロックを意味し、出力(式(1))はフィルタリングされた映像ブロックの行−整列された列ベクトルを意味する。入力映像vは、通常0でない平均を有する映像ブロックであるので、平均値予測部610では当該ブロックの平均値(式(2))を予測し、減算部620では入力映像vから予測された平均値(式(2))を減算する。
減算部620で計算された平均を引いたデータzは、フィルタリング部630によってフィルタリングされ、フィルタリング部630はフィルタリングされたデータ(式(3))を出力する。
加算部640は、フィルタリングされたデータ(式(5))に当該ブロックの平均値(式(2))を加算して所望のフィルタリングされたデータ(式(4))を出力する。
以下では、平均値が0である映像モデルに対する一般化ウィーナーフィルタリング方式を説明する。
平均値が0である映像モデルに対する一般化ウィーナーフィルタリングは、下記式(6)のように記述されうる。
平均値が0である映像モデルに対する一般化ウィーナーフィルタリングは、下記式(6)のように記述されうる。
また、Aはユニタリ変換を意味するが、本実施例ではDCT変換を使用するので、本実施例の場合にはAはDCT変換を意味する。また、C8が8×8 DCT行列を意味し、式(7)がクロネッカ乗算子を意味するとする時、式(8)に表現できる。
したがって、式(10)を8×8ブロックに適用させれば、下記式(11)を得られる。
ここで、式(12)は式(13)の通りである。
式(11)を見れば、平均が0である映像ブロックに対して、近似化された一般化ウィーナーフィルタリングは2次元DCT係数に式(14)を乗算することによってなることが分かる。一旦、式(15)が決定されれば、最終フィルタリングされた映像は式(15)に平均値(式(16))を加算することによって得られる。
以下では、平均値が0でない映像モデルに対する一般化ウィーナーフィルタリング方式を説明する。
平均ブロックがノイズが混ざった入力DCTブロックにS(k,l)を乗算することによって得られると仮定、すなわち、式(17)が成り立つと仮定する場合、図7はDCT領域での平均値の加算と減算とを含む構造であって図8のように再構成されうる。
平均ブロックがノイズが混ざった入力DCTブロックにS(k,l)を乗算することによって得られると仮定、すなわち、式(17)が成り立つと仮定する場合、図7はDCT領域での平均値の加算と減算とを含む構造であって図8のように再構成されうる。
前記仮定による式(17)と式(11)とを利用すれば、DCT領域でのフィルタリングされた映像ブロックは次の式(18)のように表現されうる。
ここで、F(k,l)は次の式(19)のように表現される。
すなわち、式(18)で全体フィルタリング過程がF(k,l)と一つの乗算とに単一化されることが分かる。式(19)で、F(k,l)は信号対ノイズ比(Signal to Noise Ratio:SNR)、共分散行列、及び平均行列によって決定されることが分かる。
一旦、平均行列S(k,l)を求めることが必要であるが、本実施例では式(17)を満足させる式S(k,l)を選択する。本実施例では、このうち最も簡単な方法である、DCTブロックで次の式(20)のようにDC値を得る。
以下では、図8及び図9を参照して、動映像符号化器での前処理過程を説明する。
前記では入力映像の平均が0でない映像ブロックに対しても近似化された一般化ウィーナーフィルタリングがDCT係数に対する乗算で行われうることを説明した。
前記では入力映像の平均が0でない映像ブロックに対しても近似化された一般化ウィーナーフィルタリングがDCT係数に対する乗算で行われうることを説明した。
図8では近似化された一般化ウィーナーフィルタリング方式が動映像符号化器に適用されたことを示す。図8は、イントラブロックのための符号化器の構造を示す。図8(a)及び図8(c)はイントラブロックの場合、DCT領域でフィルタリングを行った後、IDCT過程を行う必要なくすぐ量子化及びVLCを行えば良いということを示す。
すなわち、DCT係数にF(k,l)を乗算することによってフィルタリングが完了することを示す。一方、量子化過程もまた、DCT係数各々を量子化テーブルによって特定値で乗算する(割算する)作業である。したがって、F(k,l)をDCT係数各々に乗算する作業と量子化作業とは一つの作業に合わせられる。
図8に適用された概念は図9に示されたように、動き補償による予測ブロック情報p(m,n)は既にノイズが除去されたという仮定下で、インターブロックに対しても同一に適用されうる。
一般的に共分散ψ(k,l)は、入力映像ブロックがインターブロックであるかまたはイントラブロックであるかによって決まるので、式(19)のF(k,l)もブロックモードによって変更されて適用される。
以下では、平均値が減算されたイントラ及びインターブロックに対して分散予測値を求める方法を式(21)を参照して説明する。Sが平均が減算されたN×N(N=8)ブロックである場合、当該ブロックの分散行列は、式(21)によって求められる。
前記式(21)は、非特許文献1に記載されている。
一方、式(21)を適用して色々な実験映像に適用して分散予測値を求められる。イントラブロックの場合、元映像を8×8ブロックに分けて処理し、インターブロックの場合には全域探索方法を使用して、インターブロックに選択されたブロックだけを集めて式(21)を適用して分散予測値を計算する。
一方、式(21)を適用して色々な実験映像に適用して分散予測値を求められる。イントラブロックの場合、元映像を8×8ブロックに分けて処理し、インターブロックの場合には全域探索方法を使用して、インターブロックに選択されたブロックだけを集めて式(21)を適用して分散予測値を計算する。
計算された分散予測値から式(22)を求め、再びRをDCT変換して式(23)が得られる。
以下では、式(19)のσn 2/σ2を求める方法を説明する。
以下では、式(19)のσn 2/σ2を求める方法を説明する。
σn 2/σ2でノイズ分散値σn 2は、ノイズ予測器から得られる。また、ノイズと元映像画素とはランダム変数であると仮定する時、通常独立的なものと見なされるので、元映像の分散値σ2の予測分(式(24))は、下記式(25)を使用して予測される。
本実施例では同じマクロブロックに含まれた8×8ブロックは、同じ分散値を有すると仮定する。したがって、分散値計算のために別途の演算量を要求しない。
図10は、本発明の一実施例によるノイズ除去方式を採用した改善された動映像符号器を示す図面である。
以下では、図1及び図10を参照して本発明の一実施例を説明する。
以下では、図1及び図10を参照して本発明の一実施例を説明する。
本発明によるノイズ除去方式を採用した動映像符号器は、図1の一般的な動映像符号器に、ノイズ予測部1080、量子化加重値行列決定部1092及び量子化加重値行列保存部1094を含む。
DCT部1010、IDCT部1040、フレームメモリ部1050、動き予測及び補償部1060、VLC部1070は、図1の一般的な動映像符号化器と同じ機能を行うので、説明の簡単のために詳細な説明は省略する。
DCT部1010、IDCT部1040、フレームメモリ部1050、動き予測及び補償部1060、VLC部1070は、図1の一般的な動映像符号化器と同じ機能を行うので、説明の簡単のために詳細な説明は省略する。
量子化加重値行列決定部1092は、ノイズ予測部1080から伝送されたノイズ分散値σZ 2と動き予測及び補償部1060から伝送されたσZ 2とに基づいて、量子化加重値行列を決定し、これに対応する量子化加重値行列のインデックス情報を量子化加重値行列保存部1094に伝送する。
以下では、量子化加重値行列決定部1092でノイズ予測部1080から伝送されたノイズ分散値σZ 2と動き予測及び補償部1060から伝送されたσZ 2とに基づいて量子化加重値行列を決定する過程を詳細に説明する。
数式8及び前記図8及び図9と関連した説明によって、F(k,l)は式(19)によって決定される。F(k,l)が決定されれば、図8(c)に示されたように、8×8ブロックのDCT変換された係数V(k,l)は各々当該F(k,l)と乗算され、その結果である式(26)は量子化過程で量子化加重値行列によって分けられる。
本発明による動映像符号化装置ではDCT変換された係数V(k,l)にF(k,l)を乗算し、式(26)を量子化加重値行列に分ける過程を一つの過程に合わせて行う。すなわち、量子化加重値行列QTの(k,l)位置成分をQ(k,l)という場合、新しい量子化加重値行列QT’の(k,l)の位置成分はQ(k,l)/F(k,l)となる。
本実施例では、前記2つの過程を一つの過程に合わせる方法を利用して、σn 2とσn 2とによる幾つかのF行列をあらかじめ計算して、これに他の新しい量子化加重値行列QT’を計算して量子化加重値行列保存部1094に保存する。
本実施例では、σn 2とσn 2とによる5つの新しい量子化加重値行列QT’が量子化加重値行列保存部1094に保存される。σn 2とσn 2とが決定されれば、式(25)を使用してσn 2/σ2を求められる。
式(19)を参照すれば、F(k,l)はS(k,l)、ψ(k,l)、及びσn 2/σ2によって決定されるが、S(k,l)は式(20)によって決定され、ψ(k,l)は入力映像がインターブロックであるかまたはイントラブロックであるかによって決定されるブロックモードによって変更されて適用される。したがって、F(k,l)を決定するための唯一の変数はσn 2/σ2である。本実施例では、σn 2/σ2を5つの場合に分類し、五つの新しい量子化加重値行列QT’を生成して、これを量子化加重値行列保存部1094に保存する。
量子化加重値行列決定部1092は、ノイズ予測部1080から入力されたσn 2と動き予測及び補償部1060から入力されたσn 2とに基づいてσn 2/σ2を量子化し、その値に対応する新しい量子化行列インデックスを量子化加重値行列保存部1094に伝送する。量子化加重値行列保存部1094に保存された量子化加重値行列がσn 2/σ2に基づいて5つの場合に分類される場合、前記量子化は5段階に量子化され、インデックスも0、1、2、3、4のうち何れか一つの値となる。
一方、ノイズの多い映像、すなわちノイズ分散値が大きい映像で分散値が小さなブロックの場合、σn 2/σ2が非常に大きくなる。σn 2/σ2が非常に大きい値を有する場合、式(19)及び式(20)から分かるように、ほとんどのF(k,l)が0に近い数となってブロック化現象が激しくなる傾向がある。したがって、このような現象を防止するために下記の式(27)のようにTcutoff を使用する。
通常的に、Tcutoff は1〜2程度の値を使用する。
量子化加重値行列保存部1094は、量子化加重値行列決定部1092から入力された量子化加重値行列インデックス情報に基づいて、当該量子化加重値行列を選択して量子化部1020に伝送する。
量子化加重値行列保存部1094は、量子化加重値行列決定部1092から入力された量子化加重値行列インデックス情報に基づいて、当該量子化加重値行列を選択して量子化部1020に伝送する。
量子化部1020は、入力された当該量子化加重値行列を使用して量子化を行う。
逆量子化部1030は、元来のデフォルト量子化加重値行列に基づいて逆量子化を行う。
また、新しい量子化加重値行列は、ユーザが任意に決定できる。本実施例では、入力映像ブロックのY成分に対するDCT領域でのノイズ除去方式を示しているが、Y成分以外のU及びV成分に対しても同じ装置を適用できる。この時、U及びV成分のための別途の加重値マトリックスが必要である。
逆量子化部1030は、元来のデフォルト量子化加重値行列に基づいて逆量子化を行う。
また、新しい量子化加重値行列は、ユーザが任意に決定できる。本実施例では、入力映像ブロックのY成分に対するDCT領域でのノイズ除去方式を示しているが、Y成分以外のU及びV成分に対しても同じ装置を適用できる。この時、U及びV成分のための別途の加重値マトリックスが必要である。
図11は、本発明のさらに他の実施例によるノイズ除去方式を採用した改善された動映像符号器を示す図面である。
本実施例によるノイズ除去方式を採用した動映像符号器は、図1の一般的な動映像符号器に、ノイズ予測部1180及び変形量子化加重値行列生成部1190をさらに含む。DCT部1110、IDCT部1140、フレームメモリ部1150、動き予測及び補償部1160、VLC部1170は、図1の一般的な動映像符号化器と同じ機能を行うので、説明の簡単のために詳細な説明は省略する。
本実施例によるノイズ除去方式を採用した動映像符号器は、図1の一般的な動映像符号器に、ノイズ予測部1180及び変形量子化加重値行列生成部1190をさらに含む。DCT部1110、IDCT部1140、フレームメモリ部1150、動き予測及び補償部1160、VLC部1170は、図1の一般的な動映像符号化器と同じ機能を行うので、説明の簡単のために詳細な説明は省略する。
変形量子化加重値行列生成部1190は、ノイズ予測部1180から伝送されたノイズ分散値σn 2と動き予測及び補償部1160から伝送されたσn 2とに基づいて、変形量子化加重値行列を生成し、生成された変形量子化加重値行列を量子化部1120に伝送する。
量子化部1120は、量子化加重値行列生成部1190から入力された変形量子化加重値行列に基づいて量子化を行う。
以下では、変形量子化加重値行列生成部1190でノイズ予測部1180から伝送されたノイズ分散値σn 2と動き予測及び補償部1060から伝送されたσn 2とに基づいて、変形量子化加重値行列を生成する過程を詳細に説明する。
以下では、変形量子化加重値行列生成部1190でノイズ予測部1180から伝送されたノイズ分散値σn 2と動き予測及び補償部1060から伝送されたσn 2とに基づいて、変形量子化加重値行列を生成する過程を詳細に説明する。
式(20)及び前記図8及び図9と関連した説明によって、F(k,l)は式(19)によって決定される。F(k,l)が決定されれば、図8(c)に示されたように、8×8ブロックのDCT変換された係数V(k,l)は各々当該F(k,l)と乗算され、その結果である式(26)は量子化過程で量子化加重値行列によって分けられる。
本発明による変形量子化加重値行列生成部1190ではDCT変換された係数V(k,l)にF(k,l)を乗算し、式(26)を量子化加重値行列に分ける過程を一つの過程に合わせて行う。すなわち、量子化加重値行列QTの(k,l)位置成分をQ(k,l)という場合、新しい量子化加重値行列QT’の(k,l)の位置成分はQ(k,l)/F(k,l)となる。
本発明による変形量子化加重値行列生成部1190では、σn 2とσn 2とに基づいて、変形量子化加重値行列QT’を計算して量子化部1120に伝送する。
量子化部1120は、入力された当該量子化加重値行列を使用して量子化を行う。
逆量子化部1130は、元来のデフォルト量子化加重値行列に基づいて逆量子化を行う。
量子化部1120は、入力された当該量子化加重値行列を使用して量子化を行う。
逆量子化部1130は、元来のデフォルト量子化加重値行列に基づいて逆量子化を行う。
本発明は前述した実施例に限定されず、本発明の技術的思想の範囲内で当業者による変形が可能である。特に、本発明は、MPEG−1、MPEG−2、MPEG 4のような全ての動映像符号化装置及び方法に適用されうる。
本発明はまた、コンピュータで読取れる記録媒体にコンピュータが読取れるコードとして具現できる。コンピュータが読取れる記録媒体は、コンピュータシステムによって読取られるデータが保存される全ての種類の記録装置を含む。コンピュータが読取れる記録媒体の例としては、ROM、RAM、CD−ROM、磁気テープ、ハードディスク、フロッピー(登録商標)ディスク、フラッシュメモリ、光データ保存装置があり、またキャリヤウェーブ(例えば、インターネットを通じる伝送)状に具現されることも含む。またコンピュータが読取れる記録媒体は、ネットワークに連結されたコンピュータシステムに分散され、分散方式でコンピュータが読取れるコードとして保存され、かつ実行されうる。
本発明はDCTに基盤した動映像符号化器にノイズにより歪曲されている映像が入力された場合、これを効果的に除去するための符号化方法及び装置に係り、DCTに基盤した動映像符号化方法及びこれを採用した動映像符号化装置に利用されうる。
1010 DCT
1020 Q
1030 IQ
1040 IDCT
1050 フレームメモリ
1060 ME/MC
1070 VLC
1080 ノイズ予測部
1092 量子化加重値行列決定部
1094 量子化加重値行列保存部
1020 Q
1030 IQ
1040 IDCT
1050 フレームメモリ
1060 ME/MC
1070 VLC
1080 ノイズ予測部
1092 量子化加重値行列決定部
1094 量子化加重値行列保存部
Claims (21)
- 複数の変形量子化加重値行列を使用するDCT基盤の動映像符号化方法において、
(a)入力映像データのノイズ情報に基づいて、前記複数の変形量子化加重値行列のうち何れか一つを選択する段階と、
(b)前記入力映像データに対してDCT変換を行う段階と、
(c)前記DCT変換された入力映像データに対して(a)段階で選択された変形量子化加重値行列を使用して量子化を行う段階と、を含むことを特徴とする符号化方法。 - 前記複数の量子化加重値行列は、入力映像データのノイズ情報と関連して分類されていることを特徴とする請求項1に記載の符号化方法。
- 前記ノイズ情報は、ノイズ分散値と入力映像分散値間の比であることを特徴とする請求項1に記載の符号化方法。
- 前記動映像符号化方法は、(d)前記(c)段階で量子化されたデータを逆量子化する段階をさらに含み、前記逆量子化段階ではデフォルト量子化行列を使用して逆量子化を行うことを特徴とする請求項1に記載の符号化方法。
- DCT基盤の動映像符号化方法において、
(a)入力映像データのノイズ情報に基づいて、変形量子化加重値行列を生成する段階と、
(b)前記入力映像データに対してDCT変換を行う段階と、
(c)前記DCT変換された入力映像データに対して(a)段階で生成された変形量子化加重値行列を使用して量子化を行う段階と、を含むことを特徴とする符号化方法。 - 前記ノイズ情報は、ノイズ分散値と入力映像分散値間の比であることを特徴とする請求項5に記載の符号化方法。
- 前記動映像符号化方法は、(d)前記(c)段階で量子化されたデータを逆量子化する段階をさらに含み、前記逆量子化段階ではデフォルト量子化行列を使用して逆量子化を行うことを特徴とする請求項5に記載の符号化方法。
- 複数の変形量子化加重値行列を使用するDCT基盤の動映像符号化装置において、
前記複数の変形量子化加重値行列を保存する変形量子化加重値行列保存部と、
入力映像データのノイズ情報に基づいて、前記複数の変形量子化加重値行列のうち何れか一つを決定する変形量子化加重値行列決定部と、
前記入力映像データに対してDCT変換を行うDCT変換部と、
前記DCT変換された入力映像データに対して前記選択された変形量子化加重値行列を使用して量子化を行う量子化部と、を含むことを特徴とする動映像符号化装置。 - 前記複数の量子化加重値行列は、入力映像データのノイズ情報と関連して分類されていることを特徴とする請求項8に記載の符号化装置。
- 前記ノイズ情報は、ノイズ分散値と入力映像分散値間の比であることを特徴とする請求項8に記載の符号化装置。
- 前記符号化装置は、前記量子化部で量子化されたデータを逆量子化する逆量子化部をさらに含み、前記逆量子化段階ではデフォルト量子化行列を使用して逆量子化を行うことを特徴とする請求項8に記載の符号化装置。
- DCT基盤の動映像符号化装置において、
入力映像データのノイズ情報に基づいて、変形量子化加重値行列を生成する変形量子化加重値行列生成部と、
前記入力映像データに対してDCT変換を行うDCT変換部と、
前記DCT変換された入力映像データに対して前記量子化加重値行列生成部で生成された変形量子化加重値行列を使用して量子化を行う量子化部と、を含むことを特徴とする動映像符号化装置。 - 前記ノイズ情報は、ノイズ分散値と入力映像分散値間の比であることを特徴とする請求項12に記載の符号化装置。
- 前記符号化装置は、前記量子化部で量子化されたデータを逆量子化する逆量子化部をさらに含み、前記逆量子化段階ではデフォルト量子化行列を使用して逆量子化を行うことを特徴とする請求項12に記載の符号化装置。
- (a)入力映像データのノイズ情報に基づいて、複数の変形量子化加重値行列のうち何れか一つを選択する段階と、
(b)前記入力映像データに対してDCT変換を行う段階と、
(c)前記DCT変換された入力映像データに対して(a)段階で選択された変形量子化加重値行列を使用して量子化を行う段階と、を含むDCT基盤の動映像符号化方法をコンピュータに実行させるためのプログラムを記録したコンピュータで判読可能な記録媒体(行うためのコンピュータで行える命令語が記録されたコンピュータで判読可能な記録媒体)。 - 前記複数の量子化加重値行列は、入力映像データのノイズ情報と関連して分類されていることを特徴とする請求項15に記載のコンピュータで判読可能な記録媒体。
- 前記ノイズ情報は、ノイズ分散値と入力映像分散値間の比であることを特徴とする請求項15に記載のコンピュータで判読可能な記録媒体。
- 前記動映像符号化方法は、(d)前記(c)段階で量子化されたデータを逆量子化する段階をさらに含み、前記逆量子化段階ではデフォルト量子化行列を使用して逆量子化を行うことを特徴とする請求項15に記載のコンピュータで判読可能な記録媒体。
- (a)入力映像データのノイズ情報に基づいて、変形量子化加重値行列を生成する段階と、
(b)前記入力映像データに対してDCT変換を行う段階と、
(c)前記DCT変換された入力映像データに対して(a)段階で生成された変形量子化加重値行列を使用して量子化を行う段階と、を含むDCT基盤の動映像符号化方法をコンピュータに実行させるためのプログラムを記録したコンピュータで判読可能な記録媒体(行うためのコンピュータで行える命令語が記録されたコンピュータで判読可能な記録媒体)。 - 前記ノイズ情報は、ノイズ分散値と入力映像分散値間の比であることを特徴とする請求項19に記載のコンピュータで判読可能な記録媒体。
- 前記動映像符号化方法は、(d)前記(c)段階で量子化されたデータを逆量子化する段階をさらに含み、前記逆量子化段階ではデフォルト量子化行列を使用して逆量子化を行うことを特徴とする請求項19に記載のコンピュータで判読可能な記録媒体。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020020085447A KR20040058929A (ko) | 2002-12-27 | 2002-12-27 | Dtc 기반의 개선된 동영상 부호화 방법 및 그 장치 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004215257A true JP2004215257A (ja) | 2004-07-29 |
Family
ID=32464623
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003427762A Pending JP2004215257A (ja) | 2002-12-27 | 2003-12-24 | Dct基盤の改善された動映像符号化方法及びその装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20040228406A1 (ja) |
EP (1) | EP1434442A3 (ja) |
JP (1) | JP2004215257A (ja) |
KR (1) | KR20040058929A (ja) |
CN (1) | CN1232124C (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008206211A (ja) * | 2008-06-02 | 2008-09-04 | Toshiba Corp | 動画像符号化/復号化の方法及び装置 |
Families Citing this family (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100584552B1 (ko) | 2003-01-14 | 2006-05-30 | 삼성전자주식회사 | 동영상 부호화 및 복호화 방법과 그 장치 |
US7801383B2 (en) | 2004-05-15 | 2010-09-21 | Microsoft Corporation | Embedded scalar quantizers with arbitrary dead-zone ratios |
KR100579890B1 (ko) * | 2004-12-30 | 2006-05-15 | 삼성전자주식회사 | 움직임 적응적 영상처리 장치 및 그 방법 |
KR100689215B1 (ko) * | 2005-04-18 | 2007-03-09 | 동국대학교 산학협력단 | H.264 에서 다운 샘플링과 에지 방향성을 이용한 고속예측 모드 결정 방법 |
US8422546B2 (en) | 2005-05-25 | 2013-04-16 | Microsoft Corporation | Adaptive video encoding using a perceptual model |
US8130828B2 (en) | 2006-04-07 | 2012-03-06 | Microsoft Corporation | Adjusting quantization to preserve non-zero AC coefficients |
US8059721B2 (en) | 2006-04-07 | 2011-11-15 | Microsoft Corporation | Estimating sample-domain distortion in the transform domain with rounding compensation |
US8503536B2 (en) | 2006-04-07 | 2013-08-06 | Microsoft Corporation | Quantization adjustments for DC shift artifacts |
US7974340B2 (en) | 2006-04-07 | 2011-07-05 | Microsoft Corporation | Adaptive B-picture quantization control |
US7995649B2 (en) * | 2006-04-07 | 2011-08-09 | Microsoft Corporation | Quantization adjustment based on texture level |
US8711925B2 (en) | 2006-05-05 | 2014-04-29 | Microsoft Corporation | Flexible quantization |
US8542726B2 (en) | 2006-10-17 | 2013-09-24 | Microsoft Corporation | Directional and motion-compensated discrete cosine transformation |
KR100694166B1 (ko) * | 2006-11-28 | 2007-03-12 | 삼성전자주식회사 | 동영상 부호화 방법과 그 장치 |
US8238424B2 (en) | 2007-02-09 | 2012-08-07 | Microsoft Corporation | Complexity-based adaptive preprocessing for multiple-pass video compression |
US8498335B2 (en) | 2007-03-26 | 2013-07-30 | Microsoft Corporation | Adaptive deadzone size adjustment in quantization |
US8243797B2 (en) | 2007-03-30 | 2012-08-14 | Microsoft Corporation | Regions of interest for quality adjustments |
US8442337B2 (en) | 2007-04-18 | 2013-05-14 | Microsoft Corporation | Encoding adjustments for animation content |
US8331438B2 (en) | 2007-06-05 | 2012-12-11 | Microsoft Corporation | Adaptive selection of picture-level quantization parameters for predicted video pictures |
US8189933B2 (en) | 2008-03-31 | 2012-05-29 | Microsoft Corporation | Classifying and controlling encoding quality for textured, dark smooth and smooth video content |
US8897359B2 (en) | 2008-06-03 | 2014-11-25 | Microsoft Corporation | Adaptive quantization for enhancement layer video coding |
US8254457B2 (en) * | 2008-10-20 | 2012-08-28 | Realtek Semiconductor Corp. | Video signal processing method and apparatus thereof |
US9123103B2 (en) * | 2013-12-26 | 2015-09-01 | Mediatek Inc. | Method and apparatus for image denoising with three-dimensional block-matching |
CN104994379A (zh) * | 2015-08-05 | 2015-10-21 | 中磊电子(苏州)有限公司 | 视频处理方法及视频处理装置 |
CN105279742B (zh) * | 2015-11-19 | 2018-03-30 | 中国人民解放军国防科学技术大学 | 一种快速的基于分块噪声能量估计的图像去噪方法 |
CN105279743B (zh) * | 2015-11-19 | 2018-03-30 | 中国人民解放军国防科学技术大学 | 一种基于多级dct系数的图像噪声水平估计方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03250923A (ja) * | 1990-02-28 | 1991-11-08 | Victor Co Of Japan Ltd | 直交変換符号化復号化方法 |
JP2651097B2 (ja) * | 1991-11-08 | 1997-09-10 | エイ・ティ・アンド・ティ・コーポレーション | 量子化パラメータ生成方法および装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5440344A (en) * | 1992-04-28 | 1995-08-08 | Mitsubishi Denki Kabushiki Kaisha | Video encoder using adjacent pixel difference for quantizer control |
US5426463A (en) * | 1993-02-22 | 1995-06-20 | Rca Thomson Licensing Corporation | Apparatus for controlling quantizing in a video signal compressor |
JPH09163373A (ja) * | 1995-12-08 | 1997-06-20 | Toshiba Corp | 雑音低減装置 |
-
2002
- 2002-12-27 KR KR1020020085447A patent/KR20040058929A/ko not_active Application Discontinuation
-
2003
- 2003-08-19 US US10/642,646 patent/US20040228406A1/en not_active Abandoned
- 2003-12-17 EP EP20030029085 patent/EP1434442A3/en not_active Withdrawn
- 2003-12-24 JP JP2003427762A patent/JP2004215257A/ja active Pending
- 2003-12-26 CN CNB2003101247272A patent/CN1232124C/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03250923A (ja) * | 1990-02-28 | 1991-11-08 | Victor Co Of Japan Ltd | 直交変換符号化復号化方法 |
JP2651097B2 (ja) * | 1991-11-08 | 1997-09-10 | エイ・ティ・アンド・ティ・コーポレーション | 量子化パラメータ生成方法および装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008206211A (ja) * | 2008-06-02 | 2008-09-04 | Toshiba Corp | 動画像符号化/復号化の方法及び装置 |
Also Published As
Publication number | Publication date |
---|---|
KR20040058929A (ko) | 2004-07-05 |
EP1434442A3 (en) | 2005-10-12 |
EP1434442A2 (en) | 2004-06-30 |
US20040228406A1 (en) | 2004-11-18 |
CN1512785A (zh) | 2004-07-14 |
CN1232124C (zh) | 2005-12-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2004215257A (ja) | Dct基盤の改善された動映像符号化方法及びその装置 | |
JP4602360B2 (ja) | 動映像符号化及び復号化方法、並びにその装置 | |
KR100497398B1 (ko) | 영상 잡음 제거방법 및 장치 | |
KR100708118B1 (ko) | 복수개의 변형 곱셈 테이블을 이용한 동영상 부호화 및복호화 장치와 그 방법, 및 이를 구현하기 위한프로그램이 기록된 기록 매체 | |
KR100677616B1 (ko) | 동영상 부호화 및 복호화 방법과 그 장치 | |
KR100677615B1 (ko) | 동영상 부호화 및 복호화 방법과 그 장치 | |
KR100694166B1 (ko) | 동영상 부호화 방법과 그 장치 | |
KR100622305B1 (ko) | 동영상 복호화 방법과 그 장치 | |
KR100708206B1 (ko) | 동영상 복호화 방법과 그 장치 | |
KR100584622B1 (ko) | 동영상 부호화 및 복호화 방법과 그 장치 | |
KR100622304B1 (ko) | 동영상 복호화 방법과 그 장치 | |
KR100622306B1 (ko) | 동영상 복호화 방법과 그 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20061122 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091201 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100506 |