JP6069128B2 - 変換量子化方法、変換量子化装置及び変換量子化プログラム - Google Patents

変換量子化方法、変換量子化装置及び変換量子化プログラム Download PDF

Info

Publication number
JP6069128B2
JP6069128B2 JP2013165623A JP2013165623A JP6069128B2 JP 6069128 B2 JP6069128 B2 JP 6069128B2 JP 2013165623 A JP2013165623 A JP 2013165623A JP 2013165623 A JP2013165623 A JP 2013165623A JP 6069128 B2 JP6069128 B2 JP 6069128B2
Authority
JP
Japan
Prior art keywords
size
transform
sum
block
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013165623A
Other languages
English (en)
Other versions
JP2015035720A (ja
Inventor
佳 蘇
佳 蘇
新田 高庸
高庸 新田
大西 隆之
隆之 大西
充郎 池田
充郎 池田
清水 淳
淳 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2013165623A priority Critical patent/JP6069128B2/ja
Publication of JP2015035720A publication Critical patent/JP2015035720A/ja
Application granted granted Critical
Publication of JP6069128B2 publication Critical patent/JP6069128B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、高効率動画像圧縮符号化規格であるHEVCに準拠した符号化器(エンコーダ)に用いる変換量子化方法、変換量子化装置及び変換量子化プログラムに関する。
近年、高効率動画像圧縮符号化(HEVC)は、4K(横方向の解像度が、HDTVの2倍となる4000画素の高解像度動画像)のような高解像度動画像を処理するために、Joint Collaborative Team on Video Coding共同研究部会(JCT−VC)で審議されている(例えば、非特許文献1、2、3参照)。HEVCはH.264/AVCの後継として、演算量は複数倍必要であるが、同じ主観画質で少なくとも40%のビットレートを削減できている。HEVCの主な技術的革新は、四分木構造でブロックサイズが変化する符号化ユニット(CU)と、予測ユニット(PU)と、変換単位処理ユニット(TU)があることである。異なるサイズ(すなわち、四分木の深さ)でRD(レート歪み)コストを再帰的に測定することによって最も圧縮率の高い符号化モードを算出することができる。さらに、レート歪み最適量子化(RDOQ)や、非正方形四分木変換(NSQT)というような新たな符号化ツールが追加されているため、効率がさらに良くなる反面、対応するハードウェアの開発がさらに困難になっている。
TUの処理の高速化に関して提案されている既存の方法は、主に高速バタフライ構造と早期終了メカニズムの二つのクラスに分類することができる。例えば、非特許文献1、2、3、4に記載されているように、高速バタフライ構造は、変換または量子化演算そのものの強化に焦点を当てているが、最終的に使用されない候補を含めて四分木構造すべての残差ブロックを計算する必要がある。非特許文献4では非ゼロDCT係数の数に基づいて、初期の段階でTUの四分木をカットすることで、TU分割を早期に決定する方法を提案している。
しかし、処理の結果オールゼロブロック(AZB:変換量子化後の係数成分がすべてゼロとなり、結果として係数を符号化する必要がないブロック)となるTUについても変換量子化の演算を行うため、冗長な計算が発生する。非特許文献5では、大きなブロックがオールゼロブロックになった場合、そこに含まれる小さなブロックもオールゼロブロックとなりやすい性質を使用して、冗長な計算を減少させている。ただし、判定処理が繰り返し行われるため、ハードウェア実装が困難である。非特許文献6では周辺の残差の統計を取りながら、できるだけ大きな変換サイズを使用する提案を行っているが、判定結果が正確ではない問題がある。
K. Ugur, K. Andersson, A. Fuldseth, G. Bjontegaard, L.P. Endresen, J. Lainema, A. Hallapuro, J. Ridge, D. Rusanovskyy, and C. Zhang, ''High performance, low complexity video coding and the emerging hevc standard,'' Circuits and Systems for Video Technology, IEEE Transactions on, vol. 20, no. 12, pp. 1688--1697, 2010. W.J. Han, J. Min, I.K. Kim, E. Alshina, A. Alshin, T. Lee, J. Chen, V. Seregin, S. Lee, and Y.M. Hong, ''Improved video compression efficiency through flexible unit representation and corresponding extension of coding tools,'' Circuits and Systems for Video Technology, IEEE Transactions on, vol. 20, no. 12, pp. 1709--1720, 2010. F. Bossen, V. Drugeon, E. Francois, J. Jung, S. Kanumuri, M. Narroschke, H. Sasai, J. Sole, Y. Suzuki, and T.K. Tan, ''Video coding using a simplified block structure and advanced coding techniques,'' Circuits and Systems for Video Technology, IEEE Transactions on, vol.20, no. 12, pp. 1667--1675, 2010. A. Tanizawa, J. Yamaguchi, T. Shiodera, T. Chujoh, and T. Yamakage, ''Improvement of intra coding by bidirectional intra prediction and 1 dimensional directional unified transform,'' Joint Collaborative Team onVideo Coding, JCTVC-B042, Geneva, 2010. Felix C. A. Fernandes, ''Low complexity rotational transform,'' Joint Collaborative Team on Video Coding, JCTVC-C096, Guangzhou, 2010. Yoon Mi Hong, Kyo-Hyuk Lee Il-Koo Kim, Madhu Krishnan Wei Dai, and Pankaj Topiwala, ''Low complexity 16x16 and 32x32 transforms and partial frequency transform,'' Joint Collaborative Team on Video Coding, JCTVC-C209, Guangzhou, 2010.
前述したように、TUの処理は複雑かつ計算負荷が高いため、ハードウェア実装が容易でないという問題がある。
本発明は、このような事情に鑑みてなされたもので、計算負荷を高めることなく、変換単位処理ユニット(TU)の処理を行うことができる変換量子化方法、変換量子化装置及び変換量子化プログラムを提供することを目的とする。
本発明は、画像符号化におけるインター予測残差とその差分絶対値和から量子化変換係数を算出する変換量子化方法であって、変換量子化サイズ、QP値、ビット深度と変換係数閾値の関係を示す変換係数閾値表から画像符号化対象である2N×2Nサイズのブロック(N=2,nは3以上の整数)の変換量子化サイズ2N、入力されたQP値及びビット深度に対応する変換係数閾値を求める変換係数閾値特定ステップと、前記変換量子化サイズに対して定まる第1の調整係数を前記変換係数閾値に掛けた結果を第1の差分絶対値和上限値とする第1の差分絶対値和上限値算出ステップと、2N×2Nサイズのブロックに対する差分絶対値和と前記第1の差分絶対値和上限値とを比較する第1の判定ステップと、前記第1の判定ステップにより2N×2Nサイズのブロックに対する差分絶対値和の方が前記第1の差分絶対値和上限値より小さいと判定された場合には、量子化変換係数をゼロとする第1の量子化変換係数決定ステップとを有することを特徴とする。
本発明は、前記変換量子化サイズに対して定まる第2の調整係数を前記変換係数閾値に掛けた結果を第2の差分絶対値和上限値とする第2の差分絶対値和上限値算出ステップと、前記第1の判定ステップにより2N×2Nサイズのブロックに対する差分絶対値和の方が前記第1の差分絶対値和上限値より大きいか等しいと判定された場合には、前記2N×2Nのブロックサイズに対する差分絶対値和と前記第2の差分絶対値和上限値とを比較する第2の判定ステップと、前記第2の判定ステップにより2N×2Nサイズのブロックに対する差分絶対値和の方が前記第2の差分絶対値和上限値より小さいと判定された場合には、変換量子化サイズを2N×2Nとして変換量子化演算を実行する第2の量子化変換係数決定ステップと、をさらに有することを特徴とする。
本発明は、前記第2の判定ステップにより2N×2Nサイズのブロックに対する差分絶対値和の方が前記第2の差分絶対値和上限値より大きいか等しいと判定された場合には、前記2N×2Nサイズのブロックを4つに分割し、各N×Nサイズのブロックに対する差分絶対値和と前記2N×2Nサイズのブロックに対する差分絶対値和に1/4を乗じた値とを比較する第3の判定ステップと、前記第3の判定ステップによりいずれか一つのN×Nサイズのブロックに対する差分絶対値和の方が前記2N×2Nサイズのブロックに対する差分絶対値和に1/4を乗じた値より大きいか等しいと判定された場合には、前記2N×2Nサイズのブロックに対して再帰的に変換量子化演算を実行する第3の量子化変換係数決定ステップとをさらに有することを特徴とする。
本発明は、前記変換係数閾値表は、インター予測残差と変換係数がガウス分布に従うとしたうえで、画像符号化対象のブロックの量子化変換係数の絶対値がすべて1より小さいとした場合に導出される差分絶対値和についての不等式から特定される値を変換係数閾値として定めることを特徴とする。
本発明は、画像符号化におけるインター予測残差とその差分絶対値和から量子化変換係数を算出する変換量子化装置であって、変換量子化サイズ、QP値、ビット深度と変換係数閾値の関係を示す変換係数閾値表から画像符号化対象である2N×2Nサイズのブロック(N=2,nは3以上の整数)の変換量子化サイズ2N、入力されたQP値及びビット深度に対応する変換係数閾値を求める変換係数閾値特定手段と、前記変換量子化サイズに対して定まる第1の調整係数を前記変換係数閾値に掛けた結果を第1の差分絶対値和上限値とする第1の差分絶対値和上限値算出手段と、2N×2Nサイズのブロックに対する差分絶対値和と前記第1の差分絶対値和上限値とを比較する第1の判定手段と、前記第1の判定手段により2N×2Nサイズのブロックに対する差分絶対値和の方が前記第1の差分絶対値和上限値より小さいと判定された場合には、量子化変換係数をゼロとする第1の量子化変換係数決定手段とを備えることを特徴とする。
本発明は、コンピュータに、前記変換量子化方法を実行させるための変換量子化プログラムである。
本発明によれば、計算負荷を高めることなく、変換単位処理ユニット(TU)の処理を行うことができるという効果が得られる。
本発明の一実施形態の構成を示す変換量子化装置の構成を示すブロック図である。 図1に示すAZB判定部2が行う各ブロックに対する役割の割り当て処理動作を示すフローチャートである。 対象としたテストシーケンスの残差ブロックを示す図である。 エネルギー分布の例を示す図である。 対象としたテストシーケンスの残差ブロックを示す図である。 エネルギー分布の例を示す図である。 符号化効率を示す図である。
以下、図面を参照して、本発明の一実施形態による変換量子化装置を説明する。HEVCの符号化装置において、動き予測(符号化対象画像と、参照画像との間で動きベクトルの探索を行う処理。インター予測ともいう)を行った後、インター予測結果の残差が、TU処理の入力となる。例えば、TUデプス(四分木の深さ)が3の設定で64×64のCUが一つ入力された場合、再帰的なRD計算を行う従来の方式では、4回の32×32の整数変換量子化、16回の16×16の整数変換量子化と64回の8×8の整数変換量子化をすべて計算し、その後、RDコストを使って、レート歪み最適化されたTUサイズを決定することになる。異なるサイズのCUに対して、これらのプロセスを繰り返すことによって、変換量子化係数と共に最適化されたTU分割の形態、すなわちTUパーティションマップが計算される。その際に、再帰的な計算によって、多くの冗長演算が引き起こされる。さらに、一般的には多くの残差ブロックにおいて、TU処理後に係数がすべてゼロとなっている現象が発生する。したがって、本実施形態では図1に示すように、変換量子化(特に変換量子化の後にゼロになるような残差ブロックの変換量子化)を計算することなく、最適化されたTUのパーティションマップと、変換量子化係数がオールゼロとなるか否かを事前に予測する方法を実現する。
図1は同実施形態による変換量子化装置の構成を示すブロック図である。図1において、符号1は、インター予測を行うインター予測部である。符号2は、役割の割り当てを判定するAZB判定部である。符号3は、全サイズ全深さの整数変換量子化を行うトラバーサル整数変換量子化部である。符号4は、予測TUサイズの整数変換量子化を行う予測TUサイズの整数変換量子化部である。符号5は、エントロピー符号化を行って出力ビットストリームを出力するエントロピー符号化部である。
次に、図1に示す変換量子化装置の動作を説明する。まず、インター予測部1は、入力原画像からインター予測を処理した後、インター予測画像と原画像との差分画像である残差rijとそのSAD(差分絶対値和)を出力する。この残差rijとそのSADは、変換・量子化の計算が必要とされているかどうかを判定するために、AZB判定部2に送られる。ここでSADの値は、AZB判定部2でSADの値を再計算する必要をなくすために、インター予測部1から送られている。後述のAZB判定方法に従い、ブロックがLブロックとして判定されると、当該ブロックはオールゼロブロックと判定され、変換・量子化行列qijをすべて直接0に設定し、エントロピー符号化部5に出力する。QP(量子化パラメータ)の値はインター予測部1、AZB判定部2、トラバーサル整数変換量子化部3及びエントロピー符号化部5に入力される。
一方、AZB判定方法に従い、ブロックがTWブロックとして判定されると、残差rijがトラバーサル整数変換量子化部3へ送られる。そして、トラバーサル整数変換量子化部3によって変換・量子化行列qijがエントロピー符号化部5に出力される。また、AZB判定方法に従い、ブロックがMブロックとして判定されると、予測TUサイズと残差rijが予測TUサイズの整数変換量子化部4へ送られる。そして、予測TUサイズの整数変換量子化部4によって変換・量子化行列qijがエントロピー符号化部5に出力される。エントロピー符号化部5は、変換・量子化行列qijに基づき、符号化を行って出力ビットストリームを出力する。
次に、図2を参照して、図1に示すAZB判定部2の処理動作を説明する、図2は、図1に示すAZB判定部2が行う各ブロックに対する役割の割り当て処理動作を示すフローチャートである。ここでは、最も大きな変換量子化サイズを2N×2N(Nは自然数)として、N×Nと(N/2)×(N/2)の合計3サイズが選択可能という条件で説明する。変換量子化サイズ(N)、QP値(QP)、ビット深度(BitDepth)それぞれの閾値(THの値)テーブルは、表1、表2に示すように、事前に計算される(表1、表2はBitDepthが8の場合である)。表1、表2の計算方法は後述する。
まず、AZB判定部2は、インター予測処理部1から残差rij、そのSADを、外部からQP値を入力する(ステップS1)。インター予測処理部1において、SADは、コーディングユニット(CU)それぞれについて動き推定を行って計算される。続いて、AZB判定部2は、現在入力されている残差のサイズ(変換量子化サイズと同じ)におけるSAD2N×2Nの値と、対応する閾値TH2N×2N[QP]とを比較し(ステップS2)、SADが閾値よりも小さい場合には、現在の残差ブロック(2N×2N)は、Lブロック(2N×2N)と判定し、この判定結果を出力する(ステップS9)。Lブロック(Leader:リーダーブロック)とは、前述のようにオールゼロブロックと判定されるブロックを意味し、変換・量子化行列qijをすべて直接0に設定し、変換量子化演算処理をスキップできるブロックである。
一方、ステップS2の条件が満たされない場合、対応する閾値TH’2N×2N[QP]と比較し(ステップS3)、SADが閾値よりも小さい場合には、現在の残差ブロック(2N×2N)は、Mブロック(2N×2N)と判定し、この判定結果を出力する(ステップS10)。Mブロック(Member:メンバーブロック)とは、変換・量子化サイズが決定された状態で、変換・量子化演算を行うブロックを意味し、Mブロック(2N×2N)では、変換量子化サイズを2N×2Nに決定した状態で変換・量子化演算を行い、N×Nや(N/2)×(N/2)の変換・量子化ブロックの演算はスキップできる。
一方、ステップS3の条件が満たされない場合、2N×2Nを構成している4つのN×Nブロックそれぞれについて、SAD(N×N)の値と、SAD(2N×2N)の1/4の値とを比較する(ステップS4)。4つのN×Nブロックのいずれか一つでも、SAD(N×N)が1/4のSAD(2N×2N)よりも小さいという条件を満たさないブロックが存在した場合には、現在の残差ブロック(2N×2N)は、TWブロック(2N×2N)と判定し、この判定結果を出力する(ステップS16)。TWブロック(Temporary Worker:テンポラリワーカーブロック)とは、現在のサイズ、および現在よりも小さなサイズ(すなわち、2N×2N、N×N、(N/2)×(N/2)の3サイズ)について、変換量子化演算を再帰的に実施するブロックを意味し、これは従来の再帰的な決定手法と同一のものである。すなわち、TWブロックと判定されたブロックについては、変換量子化サイズを再帰的に決定する。
次に、4つのN×Nブロックすべてが、SAD(N×N)が1/4のSAD(2N×2N)よりも小さい場合、残差ブロックはさらに小さいサイズに分割されて同様の判定を行う。すなわち、4つのN×Nブロックそれぞれについて、SAD(N×N)の値と、対応する閾値THN×N[QP]とを比較し(ステップS5)、SAD(N×N)<THN×N[QP]の条件が満たされる場合、このブロックはN×NのLブロックと判定され、この判定結果を出力する(ステップS11)。すなわち、オールゼロブロックと判定されて変換・量子化演算をスキップする。ステップS5の条件を満たさない場合、SAD(N×N)<TH’N×N[QP]の条件が満たされるか否かを判定し(ステップS6)、満たされるならばこのブロックはN×NのMブロックと判定され、この判定結果を出力する(ステップS12)。すなわちサイズをN×Nに決定して変換・量子化演算が行われる。
次に、SAD(N×N)<TH’N×N[QP]の条件が満たされないのであれば、N×Nを構成している4つの(N/2)×(N/2)ブロックそれぞれについて、SAD((N/2)×(N/2))の値と、SAD(N×N)の1/4の値とを比較する(ステップS7)。4つの(N/2)×(N/2)ブロックのいずれか一つでも、SAD((N/2)×(N/2))が1/4のSAD(N×N)よりも小さいという条件を満たさないブロックが存在した場合には、現在の残差ブロックN×Nは、TWブロック(N×N)として判定し、この判定結果を出力する(ステップS15)。すなわち、このブロックは、現在のサイズ、および現在よりも小さなサイズ(すなわち、N×N、(N/2)×(N/2)の2サイズ)について、変換量子化演算を再帰的に実施する。
一方、4つの(N/2)×(N/2)ブロックのいずれも、SAD((N/2)×(N/2))が1/4のSAD(N×N)よりも小さいという条件を満たす場合は、4つの(N/2)×(N/2)ブロックそれぞれについて、SAD((N/2)×(N/2))の値と、対応する閾値THN/2×N/2[QP]とを比較し(ステップS8)、SAD((N/2)×(N/2))<THN/2×N/2[QP]の条件が満たされる場合、このブロックは(N/2)×(N/2)のLブロックと判定し、この判定結果を出力する(ステップS13)。また、条件が満たされない場合は(N/2)×(N/2)のMブロックと判定し、この判定結果を出力する(ステップS14)。
この例では、処理順序が大きなサイズから小さなサイズに向けて行うようになっているので、より大きなサイズのブロックが、より事前にチェックされることになる。これによって、より大きなサイズでLブロックと判定されてしまう影響がある。それはLブロックがより小さいTUサイズで発生したときが最適解であっても、それが無視されることを意味する。この欠陥を克服するために、上述のように条件を満たさないブロックは全部TWブロックと判定し、再帰的な変換・量子化演算を行っている。なお、判定処理を高速に行うために、各TUサイズに対応する閾値テーブルを事前に計算して使用する。閾値テーブルの事前計算手法、および役割の割り当ての詳細は後述する。
次に、変換量子化係数の事前予測に使用する閾値を事前に決定するために、まず、残差とTU・パーティション間の対応を明らかにするための残差周波数解析を行った結果について説明する。残差周波数解析は以下のステップによって行われる。解析のためのテストビデオ・シーケンスは、本実施形態とは別のHEVC符号化器、例えばHEVC標準化に用いられる参照エンコーダソフトウェアであるHM(HEVC試験モデル)によって事前にエンコードされる。HMは、符号化に用いられる複数のモードやパラメータについて、網羅的に符号化を試し、その中で符号化効率(ビットレート−歪み特性)がもっとも優れたモードやパラメータを選び出して符号化を行うため、エンコードした結果はビットレート−歪み特性が最適化された状態にあり、事前の分析に適している。
本実施形態ではHMでエンコードした結果を分析して、レート歪み最適化されたTUパーティション分割マップを得る。まず、残差信号を、インター予測が終了した直後に抽出する。続いて、異なるサイズの整数変換結果(整数変換を行い、量子化を行う前の係数値)を、最大のTUサイズから、最小のTUサイズにわたってそれぞれ計算させ、抽出する。こうして抽出された算出結果に基づいて、変換係数のエネルギー分布が描かれている。上記のような事前解析により、最適なTUサイズと、複数の異なるサイズでDCT変換を行った場合の周波数エネルギー分布との関係性を明らかにすることができる。そこで、最適なTUサイズの事前判定手法は、この関係性をモデル化することで得られることになる。
このようにして描かれたエネルギー分布の例を図3〜図6に示す。図3、図4は入力された64×64CU全体にわたる分布であり、図4、図5は、入力された64×64CUのうち左上にある16×16残差ブロックの部分を拡大した頻度分布である。図3、図5は残差ブロックユニットを示しており、図4、図6の(a)(b)(c)は3つの周波数ユニットを示している。図3、図5は、対象としたテストシーケンスの残差ブロックであり、線は実際に選択されたTU分割結果(TUパーティションマップ)を示している。分割結果が4×4の場合のみ、強調のため太い線を使用している。図4、図6の(a)(b)(c)の3つの周波数ユニットは、3つある各サイズに固定して、変換演算を行った後の周波数エネルギー分布を表示している。周波数分布とTUパーティションマップを並べて見ることにより、最適化されたTUサイズがどのように決定されているかを観察することが目的である。
ここで、TUの構造を決定するにあたり、リーダー(L)、メンバー(M)とテンポラリーワーカー(TW)という3種類の役割を定義する。周波数ユニットの図で、丸印は、平均して非常に小さな周波数エネルギーしか持っていないブロックを示しており、これをリーダーブロックと定義する。これは、対応するサイズの変換計算後、これらのブロックの周波数エネルギー成分は非常に小さくなることを意味している。これらのブロックの変換係数は、ビットストリーム上では非常に少ないビット数しか消費しない。したがって、リーダーブロックが発生するような変換サイズを選択することは、最適なTUパーティションを選択していると考えることができる。
したがって、これらリーダーブロックを残差ブロックから検出することができるならば、これらのLブロックを利用してTUパーティションの基本構造を決定することが有効と考えられる。ダイヤモンド印によって示されるメンバーブロックは、リーダーブロックと同じ分割領域から発生している。リーダーブロックのように、周波数エネルギーがTU構造を導くほど十分に小さくないのでこれらはリーダーブロックが主導で決定されるTUパーティション構造に付随するものとして扱われる。最後に、三角形印で示されるテンポラリワーカーは、残差ブロックから判定を行うのが困難なブロックであり、これらはレート・歪みコストをもとに再帰的にサイズを判定するしかないものである。
次に、閾値の決定について説明する。閾値を導出するにあたっては、インター予測残差である残差サンプルrijと量子化前変換係数dijがガウシアンモデルに基づいていることを前提とする。変換量子化係数qijの絶対値がすべて1未満となる場合(すなわち、オールゼロブロックとなる場合)変換量子化に入力される残差の係数はすべて、分散がQP(量子化ステップ)の1ステップの範囲に収まっていることが推定される。そこで、2つのガウスモデルの分散の関係を計算することによって、SAD値と閾値との関係性が構築される。閾値の導出方法を以下に説明する。
変換量子化係数の絶対値が1未満、すなわち、|quv|<1の場合、このブロックは、オールゼロブロックである。HMにおいて、変換量子化係数qijは、
ij =(dij×f[QP%6]+offset)>>(29+QP/6−logN− BitDepth)i,j=0...N−1
のように求められる。
ただし、
f[x]= {26214,23302,20560,18396,16384,14564},x=0,…,5
28+QP/6−log N−BitDepth<offset<229+QP/6−log N−BitDepth
であり、BitDepthは、ピクセルのビット深度と定義される。
量子化前変換係数duvがQPの1ステップ未満となるたるための条件は
と求められる。ただしshift=29+QP/6−logN−Bitdepthである。
量子化前変換係数dijの分布と、インター予測残差rijの分布がそれぞれガウス分布と仮定した場合、この分布の分散間で成立する関係(近似式)は、次のように導出される。
ここで、TはHMで定義されている正規化された変換行列である。
[A]は行列Aの(u,u)番目のコンポーネントである。Rij=ρ|j−i|ρ=0.6では、σ (u,v)は下記のように計算される。
上記のとおり、σ (u,v)の中で最大の値は、DC成分で発生しているので、以下のようになる。
残差サンプルrij(i,j=0...N−1)と量子化前変換係数dijは、ガウス分布としてモデル化しているので、dijの分布は(−nσ,nσ)の範囲内に収まると現される。nはゼロ以上の実数であり、n=3の場合、dijがこの範囲に収まる確率は約99%である。それゆえ、変換係数の分布σ(u,v)と、インター予測残差の分布σには、次の関係が成り立つ。
TH[QP]>n×σ
一方、
であり、
N=8の場合、
である。
8×8ブロックの場合におけるSADと変換係数閾値の関係(不等式)は、インター予測残差の分布の分散がSADを用いた式で近似できることから、下記のように導出される。
8×8以外のブロックの関係も、下記のように導出される。
この実施形態中では、画質を保つため、閾値TH[QP]に乗じる調整係数を求めるための係数nの値は2に、TH’[QP]に乗じる調整係数を求めるための係数nの値は1に設定されている。なお、図1中の閾値TH[QP]及びTH’[QP]は、それぞれ上記のTH[QP]、TH’[QP]に調整係数を乗じたものを改めてTH[QP]及びTH’[QP]としたものである。
次に、本実施形態による変換量子化装置によって生じる効果について説明する。本実施形態による変換量子化装置の効果を明らかにするために、符号化効率と演算時間の評価を行った。大小の動き、クローズアップや広い範囲の画像、パンやシーンチェンジなどを含んだクラスA(2560×1600)、およびクラスB(1920×1080)のHEVCテストシーケンスを使用した。表3はBDビットレート(参考文献「G. Bjontegard, ''Calculation of average PSNR differences between RD-curves,'' ITU-T VCEG-M33, 2001.」)を、変換量子化時間の短縮効果を表4に記載している。
ここで、総符号化時間の短縮(TR)は、HMの符号化時間TIMEHEVCと、提案方式の符号化時間TIMEproposalによって以下のように計算している。
TRは、前述した手法とHMとでの変換量子化時間短縮の割合を示す。IはRDOQオフと提案方式、IIはRDOQオンと前述した方式で、IIIはRDOQオフでTUサイズを固定したCU、IVはRDOQオンでTUサイズを固定している。前述した手法はRDOQオフとオンの双方において、それぞれ1.00%と0.80%のBDビットレート削減を達成するとともに、12.8%と26.3%の総エンコード時間短縮を達成している。
また、符号化効率を図7に示す。横軸は総符号化時間比、元のHM6.3合計符号化時間の占有率を表す。縦軸はBDのビットレートを示す。これらの結果から、TUサイズをCUサイズと等しくする手法と比べて、符号化時間が短縮され、符号化効率も向上していることが確認できる。符号化時間が短縮される主な原因は、リーダーブロックによるTQの演算が省略できるためである。
以上説明したように、全サイズ全深さで変換量子化の計算を行うことなく、最適化されたTUパーティションを事前に判定するようにしたため、残差ブロックの特徴分析を行うことによって、異なった役割が残差ブロックに割り当てられることになり、対応する変換と量子化のみ計算を行えばよくなる。
これにより、再帰的なRD計算を行うことなく最適化されたTUサイズを事前に高精度に判定するとともに、オールゼロとなるブロックもあわせて事前に判定することによって冗長な演算を抑制し、結果として演算量を削減することができる。特に、事前の準備として、周波数領域における残差の特性を分析することで、最適化されたTUサイズと残差との間の相関関係を明らかにし、そのうえで、TUのブロック分割(TUパーティション)の予測のために、残差周波数の分析を行ってブロックのモデリング(役割の割り当て)を行う。その後、役割の割り当てに基づいて変換パーティションの事前判定を行い、TUサイズおよびオールゼロブロックの事前判定を行うようにした。このため、計算負荷を高めることなく、TUに関する処理を行うことができる。
前述した実施形態における変換量子化装置をコンピュータで実現するようにしてもよい。その場合、この機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現してもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでもよい。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよく、PLD(Programmable Logic Device)やFPGA(Field Programmable Gate Array)等のハードウェアを用いて実現されるものであってもよい。
以上、図面を参照して本発明の実施の形態を説明してきたが、上記実施の形態は本発明の例示に過ぎず、本発明が上記実施の形態に限定されるものではないことは明らかである。したがって、本発明の技術思想及び範囲を逸脱しない範囲で構成要素の追加、省略、置換、その他の変更を行ってもよい。
計算負荷を高めることなく、変換単位処理ユニット(TU)の処理を行うことが不可欠な用途にも適用できる。
1・・・インター予測部、2・・・AZB判定部、3・・・トラバーサル整数変換量子化部、4・・・予測TUサイズの整数変換量子化部、5・・・エントロピー符号化部

Claims (6)

  1. 画像符号化におけるインター予測残差とその差分絶対値和から量子化変換係数を算出する変換量子化方法であって、
    変換量子化サイズ、QP値、ビット深度と変換係数閾値の関係を示す変換係数閾値表から画像符号化対象である2N×2Nサイズのブロック(N=2n,nは3以上の整数)の変換量子化サイズ2N、入力されたQP値及びビット深度に対応する変換係数閾値を求める変換係数閾値特定ステップと、
    前記変換量子化サイズに対して定まる第1の調整係数を前記変換係数閾値に掛けた結果を第1の差分絶対値和上限値とする第1の差分絶対値和上限値算出ステップと、
    2N×2Nサイズのブロックに対する差分絶対値和と前記第1の差分絶対値和上限値とを比較する第1の判定ステップと、
    前記第1の判定ステップにより2N×2Nサイズのブロックに対する差分絶対値和の方が前記第1の差分絶対値和上限値より小さいと判定された場合には、量子化変換係数をゼロとする第1の量子化変換係数決定ステップと
    前記変換量子化サイズに対して定まる第2の調整係数を前記変換係数閾値に掛けた結果を第2の差分絶対値和上限値とする第2の差分絶対値和上限値算出ステップと、
    前記第1の判定ステップにより2N×2Nサイズのブロックに対する差分絶対値和の方が前記第1の差分絶対値和上限値より大きいか等しいと判定された場合には、前記2N×2Nのブロックサイズに対する差分絶対値和と前記第2の差分絶対値和上限値とを比較する第2の判定ステップと、
    前記第2の判定ステップにより2N×2Nサイズのブロックに対する差分絶対値和の方が前記第2の差分絶対値和上限値より小さいと判定された場合には、変換量子化サイズを2N×2Nとして変換量子化演算を実行する第2の量子化変換係数決定ステップと、
    を有することを特徴とする変換量子化方法。
  2. 前記第2の判定ステップにより2N×2Nサイズのブロックに対する差分絶対値和の方が前記第2の差分絶対値和上限値より大きいか等しいと判定された場合には、前記2N×2Nサイズのブロックを4つに分割し、各N×Nサイズのブロックに対する差分絶対値和と前記2N×2Nサイズのブロックに対する差分絶対値和に1/4を乗じた値とを比較する第3の判定ステップと、
    前記第3の判定ステップによりいずれか一つのN×Nサイズのブロックに対する差分絶対値和の方が前記2N×2Nサイズのブロックに対する差分絶対値和に1/4を乗じた値より大きいか等しいと判定された場合には、前記2N×2Nサイズのブロックに対して再帰的に変換量子化演算を実行する第3の量子化変換係数決定ステップと
    をさらに有することを特徴とする請求項に記載の変換量子化方法。
  3. 画像符号化におけるインター予測残差とその差分絶対値和から量子化変換係数を算出する変換量子化方法であって、
    変換量子化サイズ、QP値、ビット深度と変換係数閾値の関係を示す変換係数閾値表から画像符号化対象である2N×2Nサイズのブロック(N=2n,nは3以上の整数)の変換量子化サイズ2N、入力されたQP値及びビット深度に対応する変換係数閾値を求める変換係数閾値特定ステップと、
    前記変換量子化サイズに対して定まる第1の調整係数を前記変換係数閾値に掛けた結果を第1の差分絶対値和上限値とする第1の差分絶対値和上限値算出ステップと、
    2N×2Nサイズのブロックに対する差分絶対値和と前記第1の差分絶対値和上限値とを比較する第1の判定ステップと、
    前記第1の判定ステップにより2N×2Nサイズのブロックに対する差分絶対値和の方が前記第1の差分絶対値和上限値より小さいと判定された場合には、量子化変換係数をゼロとする第1の量子化変換係数決定ステップと、
    前記変換係数閾値表は、
    インター予測残差と変換係数がガウス分布に従うとしたうえで、画像符号化対象のブロックの量子化変換係数の絶対値がすべて1より小さいとした場合に導出される差分絶対値和についての不等式から特定される値を変換係数閾値として定めることを特徴とする変換量子化方法。
  4. 画像符号化におけるインター予測残差とその差分絶対値和から量子化変換係数を算出する変換量子化装置であって、
    変換量子化サイズ、QP値、ビット深度と変換係数閾値の関係を示す変換係数閾値表から画像符号化対象である2N×2Nサイズのブロック(N=2n,nは3以上の整数)の変換量子化サイズ2N、入力されたQP値及びビット深度に対応する変換係数閾値を求める変換係数閾値特定手段と、
    前記変換量子化サイズに対して定まる第1の調整係数を前記変換係数閾値に掛けた結果を第1の差分絶対値和上限値とする第1の差分絶対値和上限値算出手段と、
    2N×2Nサイズのブロックに対する差分絶対値和と前記第1の差分絶対値和上限値とを比較する第1の判定手段と、
    前記第1の判定手段により2N×2Nサイズのブロックに対する差分絶対値和の方が前記第1の差分絶対値和上限値より小さいと判定された場合には、量子化変換係数をゼロとする第1の量子化変換係数決定手段と
    前記変換量子化サイズに対して定まる第2の調整係数を前記変換係数閾値に掛けた結果を第2の差分絶対値和上限値とする第2の差分絶対値和上限値算出ステップと、
    前記第1の判定ステップにより2N×2Nサイズのブロックに対する差分絶対値和の方が前記第1の差分絶対値和上限値より大きいか等しいと判定された場合には、前記2N×2Nのブロックサイズに対する差分絶対値和と前記第2の差分絶対値和上限値とを比較する第2の判定ステップと、
    前記第2の判定ステップにより2N×2Nサイズのブロックに対する差分絶対値和の方が前記第2の差分絶対値和上限値より小さいと判定された場合には、変換量子化サイズを2N×2Nとして変換量子化演算を実行する第2の量子化変換係数決定ステップと、
    を備えることを特徴とする変換量子化装置。
  5. 画像符号化におけるインター予測残差とその差分絶対値和から量子化変換係数を算出する変換量子化装置であって、
    変換量子化サイズ、QP値、ビット深度と変換係数閾値の関係を示す変換係数閾値表から画像符号化対象である2N×2Nサイズのブロック(N=2n,nは3以上の整数)の変換量子化サイズ2N、入力されたQP値及びビット深度に対応する変換係数閾値を求める変換係数閾値特定手段と、
    前記変換量子化サイズに対して定まる第1の調整係数を前記変換係数閾値に掛けた結果を第1の差分絶対値和上限値とする第1の差分絶対値和上限値算出手段と、
    2N×2Nサイズのブロックに対する差分絶対値和と前記第1の差分絶対値和上限値とを比較する第1の判定手段と、
    前記第1の判定手段により2N×2Nサイズのブロックに対する差分絶対値和の方が前記第1の差分絶対値和上限値より小さいと判定された場合には、量子化変換係数をゼロとする第1の量子化変換係数決定手段と、
    前記変換係数閾値表は、
    インター予測残差と変換係数がガウス分布に従うとしたうえで、画像符号化対象のブロックの量子化変換係数の絶対値がすべて1より小さいとした場合に導出される差分絶対値和についての不等式から特定される値を変換係数閾値として定めることを特徴とする変換量子化装置。
  6. コンピュータに、請求項1からのいずれか1項に記載の変換量子化方法を実行させるための変換量子化プログラム。
JP2013165623A 2013-08-08 2013-08-08 変換量子化方法、変換量子化装置及び変換量子化プログラム Active JP6069128B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013165623A JP6069128B2 (ja) 2013-08-08 2013-08-08 変換量子化方法、変換量子化装置及び変換量子化プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013165623A JP6069128B2 (ja) 2013-08-08 2013-08-08 変換量子化方法、変換量子化装置及び変換量子化プログラム

Publications (2)

Publication Number Publication Date
JP2015035720A JP2015035720A (ja) 2015-02-19
JP6069128B2 true JP6069128B2 (ja) 2017-02-01

Family

ID=52543946

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013165623A Active JP6069128B2 (ja) 2013-08-08 2013-08-08 変換量子化方法、変換量子化装置及び変換量子化プログラム

Country Status (1)

Country Link
JP (1) JP6069128B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11190810B2 (en) 2018-01-26 2021-11-30 Samsung Electronics Co., Ltd. Device and method for compressing image data using quantization parameter and entropy tables

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6053210B1 (ja) * 2015-06-10 2016-12-27 日本電信電話株式会社 映像符号化装置、映像符号化方法及び映像符号化プログラム
CN109196862B (zh) * 2016-05-28 2021-01-22 联发科技股份有限公司 视频数据处理方法、装置及相应可读存储介质
KR20200065367A (ko) 2018-11-30 2020-06-09 삼성전자주식회사 이미지 처리 장치 및 프레임 버퍼 컴프레서

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW484327B (en) * 2000-12-18 2002-04-21 Inst Information Industry Control method for video motion estimation with reduced computation and the device thereof
WO2013086724A1 (en) * 2011-12-15 2013-06-20 Mediatek Singapore Pte. Ltd. Method of clippling transformed coefficients before de-quantization

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11190810B2 (en) 2018-01-26 2021-11-30 Samsung Electronics Co., Ltd. Device and method for compressing image data using quantization parameter and entropy tables

Also Published As

Publication number Publication date
JP2015035720A (ja) 2015-02-19

Similar Documents

Publication Publication Date Title
JP6931690B2 (ja) コンテンツをエンコードする方法及び計算装置
CN110024392B (zh) 用于视频译码的低复杂度符号预测
KR101978194B1 (ko) 디지털 이미지를 처리하는 방법 및 시스템
KR20200026863A (ko) 인트라 예측 방법 및 그 장치
US20180115787A1 (en) Method for encoding and decoding video signal, and apparatus therefor
JP6284954B2 (ja) イントラ予測のためのモード決定の簡略化
KR102093802B1 (ko) 디지털 이미지의 블록의 마스크 기반 처리를 위한 시스템 및 방법
JP2006140758A (ja) 動画像符号化方法、動画像符号化装置および動画像符号化プログラム
JP2014523186A (ja) エントロピー符号化/復号化方法及びその装置
TW201345265A (zh) 藉由預測階層資料單元的量子化參數對視訊進行編碼/解碼的方法及其裝置
KR20180061027A (ko) 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
BR112020006572A2 (pt) codificação aritmética binária com modificação progressiva de parâmetros de adaptação
JP6069128B2 (ja) 変換量子化方法、変換量子化装置及び変換量子化プログラム
KR102138650B1 (ko) 디지털 이미지의 블록을 처리하는 시스템 및 방법
KR20150099165A (ko) Tsm 율-왜곡 최적화 방법, 그를 이용한 인코딩 방법 및 장치, 그리고 영상 처리 장치
JP2019110530A (ja) ビデオデータを符号化するための方法及び装置
JP2015027022A (ja) 動画像符号化装置、動画像符号化方法、およびプログラム
CN108028938A (zh) 视频编码方法及装置
JP6339977B2 (ja) 映像符号化装置及び映像符号化プログラム
JP2015043524A (ja) レート歪コスト推定装置及びプログラム
JP6176044B2 (ja) ブロック構造決定回路および情報圧縮回路
JP6259272B2 (ja) 映像符号化装置及び映像符号化プログラム
JP6075875B2 (ja) 変換量子化方法、変換量子化装置及び変換量子化プログラム
JP2018186419A (ja) トランスコーダ、トランスコード方法、及びトランスコードプログラム
JP6145084B2 (ja) サイズ判定方法、サイズ判定装置及びコンピュータプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150827

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160425

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160510

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160707

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161220

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161226

R150 Certificate of patent or registration of utility model

Ref document number: 6069128

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150