JP6548635B2 - データ符号化及び復号化 - Google Patents

データ符号化及び復号化 Download PDF

Info

Publication number
JP6548635B2
JP6548635B2 JP2016517463A JP2016517463A JP6548635B2 JP 6548635 B2 JP6548635 B2 JP 6548635B2 JP 2016517463 A JP2016517463 A JP 2016517463A JP 2016517463 A JP2016517463 A JP 2016517463A JP 6548635 B2 JP6548635 B2 JP 6548635B2
Authority
JP
Japan
Prior art keywords
array
video data
data values
scaling list
skip mode
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016517463A
Other languages
English (en)
Other versions
JP2016532341A (ja
JP2016532341A5 (ja
Inventor
ジェームス アレキサンダー ガメイ
ジェームス アレキサンダー ガメイ
カール ジェームス シャーマン
カール ジェームス シャーマン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Europe BV United Kingdom Branch
Sony Corp
Original Assignee
Sony United Kingdom Ltd
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony United Kingdom Ltd, Sony Corp filed Critical Sony United Kingdom Ltd
Publication of JP2016532341A publication Critical patent/JP2016532341A/ja
Publication of JP2016532341A5 publication Critical patent/JP2016532341A5/ja
Application granted granted Critical
Publication of JP6548635B2 publication Critical patent/JP6548635B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/129Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

[関連出願の相互参照]
本願は、2013年9月25日出願のGB1317041.0号の優先権を主張するものであり、参照によってその全体が本明細書に援用される。
本発明は、データ符号化及び復号化に関する。
本明細書の「背景技術」の記載は、本出願における背景を一般的に説明するためのものである。本発明者らの技術は、この背景技術の欄で説明される範囲において、本出願の出願時点で従来技術でないのであれば従来技術と見なしてはならない説明の側面と同様に、明示又は黙示を問わず、本出願に対する従来技術として認められるものではない。
ビデオデータを周波数領域表現に変換し、得られた周波数領域係数を量子化し、その後、当該量子化された係数にある種のエントロピー符号化を適用するビデオデータ圧縮システム及びビデオデータ解凍システムが存在する。
エンコーダ側での空間周波数領域への変換は、デコーダ側での逆変換に対応する。このような変換として、例えば、いわゆる離散コサイン変換(DCT)と、いわゆる離散サイン変換(DST)とが挙げられる。いくつかの例では、このような変換は、(符号化されるビデオデータから導出される)入力サンプル配列に対して変換係数行列を用いた行列乗算を行うことで周波数変換されたデータを生成するように実行される。周波数変換されたデータは、この周波数変換されたデータ配列に対して逆変換係数行列を用いた行列乗算を行うことで、再びサンプルデータに変換される。このようにして得られたサンプルデータから、出力ビデオデータを導出することができる。
いわゆるHEVC(High Efficiency Video Coding)規格等の、一部の規格及び規格案は、空間周波数変換が実際には用いられない符号化及び復号化モードを定義する。これらは、「変換スキップ」又は「変換及び量子化(trans-quant)スキップ」モードと称されることもある。
本発明の目的は、効率的なエントロピー符号化処理を行うことができるビデオデータ復号化装置及びビデオデータ符号化装置を提供することである。
本発明によれば、請求項1に記載のビデオデータ復号化装置、すなわち、符号化されたビデオデータ値の配列を復号化するように動作可能であるビデオデータ復号化装置であって、逆量子化パラメータを各データ値に適用して対応の逆量子化されたデータ値を生成することによって、上記符号化されたビデオデータ値の配列を逆量子化するように構成される逆量子化部と、上記逆量子化されたデータ値に逆周波数変換を適用するように構成される逆周波数変換部と、変換スキップモードが、上記符号化されたビデオデータ値の配列に適用可能であるか否かを検出するように構成される検出部とを具備し、上記検出部が、上記変換スキップモードが、上記符号化されたビデオデータ値の配列に適用可能ではないと検出した場合、上記検出部は、上記逆量子化部を制御し、上記符号化されたビデオデータ値の配列内の各データ値の位置に応じて、上記符号化されたビデオデータ値の配列のデータ値間で変化し得る逆量子化パラメータを適用させ、上記逆周波数変換部を制御し、上記逆量子化されたデータ値に逆周波数変換を適用させ、上記検出部が、上記変換スキップモードが、上記符号化されたビデオデータ値の配列に適用可能であることを検出した場合、上記検出部は、上記逆量子化部を制御し、上記符号化されたビデオデータ値の配列毎に、上記配列内の各データ値の位置から独立した逆量子化パラメータを適用させ、上記逆周波数変換部を制御し、上記逆量子化されたデータ値に逆周波数変換を適用させないようにするビデオデータ復号化装置が提供される。
本発明の各側面及び特徴は、添付の特許請求の範囲において定義される。
なお、上述の一般的な説明及び以降の詳細な説明は、本発明の一例であり、本発明を限定するものではないことが理解されるべきである。
ビデオデータ圧縮及びビデオデータ解凍を行うオーディオ/ビデオ(A/V)データ送受信システムを示す概略図である。 ビデオデータ解凍を行うビデオ表示システムを示す概略図である。 ビデオデータ圧縮及びビデオデータ解凍を行うオーディオ/ビデオ記憶システムを示す概略図である。 ビデオデータ圧縮を行うビデオカメラを示す概略図である。 ビデオカメラの一例をさらに詳細に示す概略図である。 ビデオカメラの別の例を示す概略図である。 データキャリアを示す概略図である。 データキャリアを示す概略図である。 ビデオデータ圧縮・解凍装置を示す概略図である。 予測画像の生成を示す概略図である。 最大符号化ユニット(LCU:Largest Coding Unit)を示す概略図である。 4つの符号化ユニット(CU:Coding Unit)の組を示す概略図である。 小さな符号化ユニットに細分された図8の符号化ユニットを示す概略図である。 小さな符号化ユニットに細分された図8の符号化ユニットを示す概略図である。 予測ユニット(PU:Prediction Unit)の配列を示す概略図である。 変換ユニット(TU:Transform Unit)の配列を示す概略図である。 スケーリングリストの使用法を示す概略図である。 エンコーダ及び/又はデコーダの一部を示す概略図である。 サンプルの配列を示す概略図である。 周波数分離された係数の配列を示す概略図である。 図16の配列内の傾向を示す概略図である。 逆スキャンを示す概略図である。 スケーリングリスト内の傾向を示す概略図である。 画像収差を示す概略図である。 符号化動作の一部を示す概略フローチャートである。 復号化動作の一部を示す概略フローチャートである。 エンコーダ及び/又はデコーダの一部を示す概略図である。 符号化及び/又は復号化動作の一部を示す概略フローチャートである。 エンコーダ及び/又はデコーダの一部を示す概略図である。 符号化及び/又は復号化動作の一部を示す概略フローチャートである。
添付図面と共に以降の詳細な説明を参照することによって、本発明の完全な理解及びその優位性の多くが容易に理解される。
次に各図面を参照すると、図1〜図4eには、以下に説明する各実施形態に係る圧縮装置及び/又は解凍装置を利用する装置又はシステムが概略的に示されている。
以下に説明する全てのデータ圧縮装置及び/又はデータ解凍装置は、ハードウェアで実現されてもよいし、例えば、特定用途向け集積回路(ASIC:Application Specific Integrated Circuit)又はフィールドプログラマブルゲートアレイ(FPGA:Field Programmable Gate Array)、あるいはこれらの組み合わせ等のようなプログラム可能なハードウェアとして、汎用コンピュータ等の汎用データ処理装置上で動作するソフトウェアで実現されてもよい。ソフトウェア及び/又はファームウェアで実現される実施形態の場合、このようなソフトウェア及び/又はファームフェア、並びに、このようなソフトウェア及び/又はファームウェアが記憶又は提供される非一時的な機械可読データ記録媒体が、本発明の実施形態であると考えられることが理解されよう。
図1は、ビデオデータ圧縮及びビデオデータ解凍を行うオーディオ/ビデオデータ送受信システムを示す概略図である。
入力オーディオ/ビデオ信号10は、少なくともオーディオ/ビデオ信号10のビデオ要素を圧縮するビデオデータ圧縮装置20に供給され、例えば、ケーブル、光ファイバ、無線リンク等の送信ルート30に沿って送信される。圧縮された信号は、解凍装置40によって処理され、これにより、出力オーディオ/ビデオ信号50が提供される。リターンパスでは、圧縮装置60がオーディオ/ビデオ信号を圧縮し、当該オーディオ/ビデオ信号は送信ルート30に沿って解凍装置70に送信される。
したがって、圧縮装置20及び解凍装置70は、送信リンクにおける1つのノードを構成することができる。また、解凍装置40及び圧縮装置60は、送信リンクにおける他の1つのノードを構成することができる。もちろん、送信リンクが単方向である場合は、一方のノードのみが圧縮装置を要求し、他方のノードのみが解凍装置を要求することになる。
図2は、ビデオデータ解凍を行うビデオ表示システムを示す概略図である。具体的には、圧縮されたオーディオ/ビデオ信号100は解凍装置110によって処理され、これにより、表示装置120上で表示することができる解凍信号が提供される。解凍装置110は、例えば、表示装置120と同じケーシング内に設けることにより、表示装置120と一体的に形成してもよい。あるいは、解凍装置110は、(例えば、)いわゆるセットトップボックス(STB:Set Top Box)として提供されてもよい。なお、「セットトップ」という表現は、当該ボックスを表示装置120に対して特定の方向又は位置に配置する必要があることを意味するわけではない。この用語は、単に、周辺機器として表示部に接続可能なデバイスを示すために当該技術分野において使用しているに過ぎない。
図3は、ビデオデータ圧縮及びビデオデータ解凍を行うオーディオ/ビデオ記憶システムを示す概略図である。入力オーディオ/ビデオ信号130は、圧縮信号を生成する圧縮装置140に供給され、例えば、磁気ディスク装置、光ディスク装置、磁気テープ装置、又は半導体メモリやその他の記憶装置等の固体記憶装置等の記憶装置150に記憶される。再生時においては、圧縮データが記憶装置150から読み出され、解凍装置160に渡されて解凍される。これにより、出力オーディオ/ビデオ信号170が提供される。
圧縮信号又は符号化信号、及び当該信号を記憶する記憶媒体又はデータキャリアは、本発明の実施形態であると考えられることが理解されよう。これについては、図4d及び図4eを参照して後述する。
図4aは、ビデオデータ圧縮を行うビデオカメラを示す概略図である。図4aにおいて、CCD(Charge Coupled Device)イメージセンサ及びそれに付随する制御・読出電子機器等の画像キャプチャ装置180は、圧縮装置190に渡されるビデオ信号を生成する。1つのマイクロフォン(あるいは複数のマイクロフォン)200は、圧縮装置190に渡されるオーディオ信号を生成する。圧縮装置190は、記憶及び/又は送信される(ステージ220として包括的に表されている)圧縮オーディオ/ビデオ信号210を生成する。
以下に説明する技術は、主に、ビデオデータ圧縮に関する。オーディオデータ圧縮を行うために、以降に説明するビデオデータ圧縮技術とともに多くの既存の技術を用いて圧縮オーディオ/ビデオ信号を生成してもよいことが理解されよう。したがって、オーディオデータ圧縮について別途説明は行わない。また、特に、放送品質ビデオデータにおいて、ビデオデータに関連するデータレートは、(圧縮及び非圧縮を問わず)一般的に、オーディオデータに関連するデータレートよりもはるかに高いことも理解されよう。したがって、非圧縮オーディオデータは、圧縮ビデオデータに追加することができ、これにより、圧縮オーディオ/ビデオ信号を形成できることが理解されよう。さらに、本発明の実施形態(図1〜図4e参照)はオーディオ/ビデオデータに関するものであるが、以下に説明する技術は、単にビデオデータを扱う(すなわち、圧縮、解凍、記憶、表示、及び/又は送信する)システムに使用してもよいことが理解されよう。すなわち、これらの実施形態は、必ずしもオーディオデータ処理と関連している必要はなく、ビデオデータ圧縮に適用することができる。
図4bは、ビデオカメラの一例をより詳細に示す概略図である。図4aと共通の参照符号が付された特徴部については説明を省略する。図4bは、図4aのカメラの一例(図4aのステージ220が記憶機能を有する場合)である。同図では、圧縮データがまずバッファ221によってバッファリングされ、記憶媒体222に記憶される。記憶媒体222は、例えば、磁気ディスク、光ディスク、フラッシュメモリ、いわゆるソリッドステートドライブ(SSD)等とすることができる。なお、図4bの構成は、単一の(物理的な)装置182として実装することができる。
図4cは、ビデオカメラの別の例を示す概略図である。同図では、図4bの記憶構成の代わりに、ネットワークインタフェース223を設けたことで、圧縮データを別の装置(図示せず)に送信可能となっている。また、ネットワークインタフェース223を通じて、ビデオカメラが制御データ等のデータを受信することも可能となっている。なお、図4bの構成は、単一の(物理的な)装置183として実装することができる。
図4d及び図4eは、データキャリアを示す概略図である。このデータキャリアは、例えば、記憶媒体222として用いて、本願に記載される圧縮技術によって圧縮された圧縮データを保持する。図4dは、フラッシュメモリ等の固体メモリとして実装されるリムーバブルな不揮発性記憶媒体225の一例を示す概略図である。図4eは、光ディスク等のディスク型媒体として実装されるリムーバブルな不揮発性記憶媒体226の一例を示す概略図である。
図5は、ビデオデータ圧縮・解凍装置を示す概略図である。
連続画像の入力ビデオ信号300は、加算部310及び画像予測部320に供給される。画像予測部320については、図6を参照して後で詳述する。加算部310は、「+」入力上で入力ビデオ信号300を受信し、「−」入力上で画像予測部320の出力を受信する事実上の減算(負の加算)動作を実行する。これにより、入力画像から予測画像が減算される。この結果、実画像と予測画像との差を表すいわゆる残差画像信号330が生成される。
残差画像信号を生成する理由の1つは次の通りである。説明を行うデータ符号化技術、すなわち、残差画像信号に適用される技術は、符号化される画像において「エネルギー」が少ない場合に、より効率的に作用する傾向がある。ここで、「効率的」という用語は、生成した符号化データの量が少ないことを指す。特定の画像品質レベルにおいては、生成するデータができるだけ少ないことが望ましい(且つ、「効率的」と考えられる)。残差画像における「エネルギー」は、残差画像に含まれる情報量に関連する。仮に、予測画像と実画像とが同一だとすると、これら2つの画像の差(すなわち、残差画像)は、ゼロの情報(ゼロエネルギー)を含み、非常に容易に少量の符号化データに符号化できる。一般的に、予測処理をある程度良好に実行できる場合、残差画像データは、入力画像よりも情報が小さく(エネルギーが少ない)、容易に少量の符号化データに符号化することができると予想される。
残差画像データ330は、残差画像データの離散コサイン変換(DCT:Discrete Cosine Transform)表現を生成する変換部340に供給される。このDCT技術自体は広く知られており、ここでの詳細な説明は行わない。しかしながら、以降で詳細に説明する装置で用いられる技術の側面が存在する。
なお、いくつかの実施形態では、DCTの代わりに、離散サイン変換(DST:Discrete Cosine Transform)を用いる。他の実施形態においては、変換を実行しなくてもよい。この変換は選択的に行うことができ、例えば、「変換スキップ」コマンド/モードの制御により、変換ステージが事実上バイパスされる。
変換部340の出力、すなわち、画像データにおける各変換ブロックに対する一連の変換係数は、量子化部350に供給される。量子化スケーリング要素による単純な乗算から、量子化パラメータの制御下における複雑なルックアップテーブルの応用に至るまで、様々な量子化技術がビデオデータ圧縮の分野において広く知られている。その目的として一般的なものには2つある。1つ目は、変換データが取り得る値を量子化処理により減少させることである。2つ目は、変換データの値がゼロである可能性を量子化処理により増加させることである。これらにより、少量の圧縮ビデオデータの生成において、エントロピー符号化処理をより効率的に行うことができる。
制御部345は、変換部340及び量子化部350(並びにこれらに対応して逆の処理を行う各部)の動作を、後でさらに詳しく説明する技術によって制御する。なお、制御部345は、図5の装置の動作の他の態様も制御してもよい。
スキャン部360により、データスキャン処理が適用される。スキャン処理の目的は、非ゼロの量子化変換係数をできるだけひとまとめにするため、また、もちろん、これにより、ゼロ値の係数をできるだけひとまとめにするために、量子化変換データを再整理することである。これらの機能により、いわゆるランレングス符号化、又は同様の技術を効率的に適用することができる。したがって、スキャン処理は、(a)スキャンの一部として全ての係数が一度は選択されるように、且つ、(b)スキャンにより所望の再整理を行うことができるように、「スキャン順」に従って、量子化変換データ、及び、特に、変換及び量子化された画像データのブロックに対応する係数のブロックから係数を選択することを含む。有効な結果をもたらすスキャン順の1つの例は、いわゆるジグザグスキャン順である。
スキャンされた係数は、その後、エントロピーエンコーダ(EE)370に渡される。この場合もやはり、各種のタイプのエントロピー符号化を実行してもよい。2つの例は、いわゆるCABAC(Context Adaptive Binary Arithmetic Coding)システムの変形、及び、いわゆるCAVLC(Context Adaptive Variable-Length Coding)システムの変形である。一般的に、CABACは効率がよいと考えられている。ある研究では、CABACにおける符号化出力データの量は、同等の画像品質に対して、CAVLCよりも10〜20%少ないことが示されている。しかしながら、CAVLCが示す(実行する上での)複雑性のレベルは、CABACの複雑性のレベルよりもはるかに低いと考えられている。
なお、スキャン処理及びエントロピー符号化処理は、別々の処理として示されているが、実際には、組み合わせるか、又は、一緒に扱うことができる。すなわち、エントロピーエンコーダへのデータの読み出し(又はエントロピーエンコーダによるデータ処理)は、スキャン順で行うことができる。これと同様の事は、各逆処理にも当てはまる。
エントロピーエンコーダ370の出力により、例えば、予測部320が予測画像を生成する方法を定義する(上述及び/又は後述の)追加データと共に、圧縮出力ビデオ信号380が提供される。
一方、予測部320自身の動作は解凍された圧縮出力データに依存するため、リターンパスも提供される。
この機能の理由は以下の通りである。解凍処理における適切なステージで、解凍された残差データが生成される。この解凍残差データは、出力画像を生成するために、予測画像に追加する必要がある(なぜなら、元の残差データは、入力画像と予測画像との差であったため)。圧縮側と解凍側との間でこの処理が同等となるように、予測部320によって生成される予測画像は、圧縮処理中及び解凍処理中において、同一であるべきである。もちろん、装置は、解凍時において元の入力画像にアクセスすることができない。装置がアクセスできるのは、解凍画像のみである。したがって、圧縮時において、予測部320は、解凍された圧縮画像に基づいて(少なくとも、インター画像符号化について)その予測を行う。
エントロピーエンコーダ370により実行されるエントロピー符号化処理は、「無損失(lossless)」であると考えられる。すなわち、エントロピーエンコーダ370に最初に供給されたデータと全く同じデータに置き換えることができる。したがって、リターンパスは、エントロピー符号化ステージよりも前に実装することができる。実際、スキャン部360によって実行されるスキャン処理も無損失であると考えられるが、本実施形態では、リターンパス390は、量子化部350の出力から、補足逆量子化部420の入力までとされている。
一般的には、エントロピーデコーダ410、逆スキャン部400、逆量子化部420、逆変換部430は、それぞれ、エントロピーエンコーダ370、スキャン部360、量子化部350、及び変換部340の逆機能を提供する。ここでは、圧縮処理について説明を続ける。入力圧縮ビデオ信号を解凍するための処理は、圧縮処理のリターンパスに対応する。同様に、復号化装置又は復号化方法は、ここで説明するエンコーダの復号化経路の特徴又は動作に対応する。
圧縮処理において、量子化された係数は、リターンパス390により量子化部350から、スキャン部360の逆動作を実行する逆量子化部420に渡される。逆量子化処理及び逆変換処理が各部420、430により実行され、圧縮−解凍残差画像信号440が生成される。
画像信号440は、加算部450で予測部320の出力に追加され、再構築出力画像460が生成される。これにより、画像予測部320への1つの入力が構成される。
受信した圧縮ビデオ信号470に適用される処理について説明する。圧縮ビデオ信号470は、まず、エントロピーデコーダ410に供給され、そこから逆スキャン部400、逆量子化部420、及び逆変換部430の順に供給される。その後、加算部450により画像予測部320の出力に追加される。単刀直入に言うと、加算部450の出力460は、出力解凍ビデオ信号480を形成する。実際には、信号の出力の前に、さらにフィルタリングを施してもよい。
図5は、符号化されたビデオデータ値の配列を復号化するように動作可能であるビデオデータ復号化装置の一例を示す。当該ビデオデータ復号化装置は、各データ値に逆量子化パラメータを適用して対応の逆量子化されたデータ値を生成することによって、符号化されたビデオデータ値の配列を逆量子化するように構成される逆量子化部と、逆量子化されたデータ値に逆周波数変換を適用するように構成される逆周波数変換部とを具備する。図5はまた、変換スキップモード及び任意選択的に非変換スキップモード(後で詳述する)で入力ビデオデータ値の配列を符号化するように動作可能であるビデオデータ符号化装置の一例でもある。当該ビデオデータ符号化装置は、入力ビデオデータ値に周波数変換を適用して周波数変換された入力データ値の配列を生成するように構成される周波数変換器と、周波数変換された各入力データ値に量子化パラメータを適用して対応の量子化されたデータ値を生成することによって、周波数変換された入力データ値を量子化するように構成される量子化部とを具備する。なお、「任意選択的に」という表現は、本装置を、変換スキップモード及び非変換スキップモードで動作可能としてもよく、又は非変換スキップモードで動作不可能である装置としてもよいことを意味する。この選択はブロック(TU等)毎又はその他に基づいて行われる。
図6は、予測画像の生成を示す概略図であり、特に、画像予測部320の動作を示している。
いわゆるイントラ画像予測、及びいわゆるインター画像予測又は動き補償(MC:Motion-Compensated)予測という2つの基本的な予測モードが存在する。
イントラ画像予測は、同一画像内から得られるデータにおける画像ブロックの内容の予測を基礎としている。これは、他のビデオ圧縮技術における、いわゆるIフレーム符号化に対応する。画像全体がイントラ符号化されるIフレーム符号化とは対照的に、本実施形態では、イントラ符号化及びインター符号化の選択を、ブロック毎に行うことができる。他の実施形態では、当該選択が依然として画像毎に行われる。
動き補償予測においては、他の隣接画像又は近接画像において、現在の画像において符号化される画像詳細のソースを定義しようとする動き情報が用いられる。したがって、理想的な例では、予測画像における画像データのブロックの内容は、隣接画像における同じ位置もしくはわずかに異なる位置にある対応ブロックを示す参照(動きベクトル)として、非常に容易に符号化することができる。
図6に戻る。図6には(イントラ画像予測及びインター画像予測に対応する)2つの画像予測構成が示されており、その予測結果が、加算部310及び450に供給するための予測画像のブロックを提供するように、モード信号510の制御下において乗算部500によって選択される。当該選択は、どちらを選択すれば最小の「エネルギー」(上述のように、符号化を要求する情報量と考えてもよい)となるかに基づいて行われ、また、当該選択は、符号化出力データストリーム内でエンコーダに通知される。これに関して、例えば、入力画像から、2つのバージョンの予測画像の領域を試行減算し、差分画像の各ピクセル値を2乗し、乗算値を合計し、当該2つのバージョンのうち、その画像領域に関連する差分画像の平均乗算値が低いのはどちらのバージョンかを特定することによって、画像エネルギーを検出することができる。
イントラ予測システムにおいて、実際の予測は、信号460の一部として受信された画像ブロックに基づいて行われる。すなわち、予測は、解凍装置において全く同じ予測を行うことができるように、符号化−復号化画像ブロックに基づいて行われる。しかしながら、データを入力ビデオ信号300から抽出して、イントラモード選択部520により、イントラ画像予測部530の動作を制御することもできる。
インター画像予測では、動き補償(MC)予測部540は、例えば、動き推定部550によって入力ビデオ信号300から抽出された動きベクトル等の動き情報を用いる。これら動きベクトルは、インター画像予測のブロックを生成する動き補償予測部540によって、処理された再構築画像460に適用される。
ここで、信号460に適用される処理について説明する。まず、信号460は、フィルタ部560によってフィルタリングされる。この処理では、変換部340により実行されるブロックに基づく処理及び後続の動作に対する影響を除去するか、少なくとも低減させるために「非ブロック化(deblocking)」フィルタが適用される。また、再構築信号460及び入力ビデオ信号300を処理することによって得られた係数を使用して、適応ループフィルタが適用される。この適応ループフィルタは、公知の技術を使用して、フィルタリング対象のデータに対して適応フィルタ係数を適用するフィルタの一種である。すなわち、フィルタ係数は、各種要素に基づいて変化し得る。どのフィルタ係数を用いるかを定義するデータは、符号化出力データストリームの一部に挿入される。
フィルタ部560からのフィルタリングされた出力は、実際には、出力ビデオ信号480を形成する。この信号は、1つ又は複数の画像記憶部570に記憶される。連続画像の記憶は、動き補償予測処理、特に、動きベクトルの生成において要求される。必要メモリを確保するため、画像記憶部570内の記憶画像は、圧縮形式で保持され、その後、動きベクトルの生成に用いるために解凍されてもよい。この特定の目的のために、公知のいかなる圧縮/解凍システムを用いてもよい。記憶画像は、より高い解像度の記憶画像を生成する補間フィルタ580に渡される。この例では、補間フィルタ580によって出力される補間画像の解像度が、画像記憶部570に記憶された画像の8倍(各寸法)となるように、中間サンプル(サブサンプル)が生成される。補間画像は、動き推定部550及び動き補間予測部540への入力として渡される。
いくつかの実施形態では、乗算部600を使用して、入力ビデオ信号のデータ値に因数4を乗算し(効率的には、単にデータ値を2ビット左にシフトさせる)、除算部又は右シフト部610を使用して、装置の出力で、対応する除算動作(2ビット右にシフト)を適用する任意のステージがさらに提供される。したがって、左へのシフト及び右へのシフトにより、単に装置の内部動作に対して、データが変更される。この方法により、あらゆるデータ丸め誤差の影響も低減されるので、装置内における高い計算精度を提供することができる。
ここで、圧縮処理のために画像を分割する方法について説明する。基本的なレベルでは、圧縮される画像はサンプルブロックの配列として考えることができる。検討されているこのようなブロックの中で最大のものは、便宜的に、64×64サンプルの正方形配列を表すいわゆる最大符号化ユニット(LCU:Largest Coding Unit)700とする(図7参照)。ここで、輝度サンプルについて説明する。4:4:4、4:2:2、4:2:0、又は4:4:4:4(GBR+キーデータ)等のクロミナンスモードによって、輝度ブロックに対応する、対応クロミナンスサンプルの数が異なる。
符号化ユニット、予測ユニット、及び変換ユニットという基本的な3つの種類のブロックについて説明する。一般的には、LCUの再帰的な分割により、例えば、ブロックサイズ及びブロック符号化パラメータ(予測又は残差符号化モード等)が、符号化される画像の特定の特徴に応じて設定されるといった方法で、入力画像が分割される。
LCUは、いわゆる符号化ユニット(CU)に分割されてもよい。符号化ユニットは、常に正方形であり、また、8×8サンプルから最大サイズのLCU700までのサイズを有している。符号化ユニットは、ある種のツリー構造として配置されてもよい。その結果、例えば、第1の分割が図8に示すように行われて、32×32サンプルの符号化ユニット710が与えられる。続いて行われる分割は、16×16サンプルの符号化ユニット720(図9)及び潜在的な8×8サンプルの符号化ユニット730(図10)が与えられるように、選択的な基準に基づいて行われてもよい。全体としては、この処理により、LCUと同じ大きさ、あるいは、8×8サンプルと同じ大きさを有するCUブロックの容量適応符号化ツリー構造を提供することができる。出力ビデオデータの符号化は、符号化ユニット構造に基づいて行われる。
図11は、予測ユニット(PU)の配列を示す概略図である。予測ユニットは、画像予測処理に関連する情報を伝達するための基本的なユニットであり、換言すると、図5の装置からの出力ビデオ信号を形成するためのエントロピー符号化された残差画像データに追加される追加データである。一般的に、予測ユニットの形状は、正方形に限られない。これらは、最小(8×8)サイズより大きい限り、特に、1つの正方形符号化ユニットの半分を形成する長方形等、他の形状を採ることができる。その目的は、隣接する予測ユニットの境界が画像内の実オブジェクトの境界に(できるだけ近くに)合わせられるようにすることであり、その結果、様々な予測パラメータを異なる実オブジェクトに適用することができる。各符号化ユニットは、1つ又は複数の予測ユニットを含んでいてもよい。
図12は、変換ユニット(TU)の配列を示す概略図である。変換ユニットは、変換・量子化処理における基本的なユニットである。変換ユニットは、常に正方形であり、4×4サンプルから32×32サンプルまでのサイズを採ることができる。各符号化ユニットは1つ又は複数の変換ユニットを含むことができる。図12における頭字語SDIP−Pは、いわゆる短距離イントラ予測分割を示している。この配列では、1次元の変換のみが行われる。したがって、4×NブロックがN回の変換により渡され、変換における入力データは、現在のSDIP−P内の既に復号化されている隣接ブロック及び既に符号化されている隣接線に基づく。
上述した構成では、量子化は、例えば、次の式に従って、当該ブロックQpに適用可能である量子化パラメータから導出された量子化除数QStepを用いた、変換ユニット(TU)の係数の大きさ(係数の符号は別個に保存される)の除算として、周波数分離された係数に適用される。
qStep=baseQStep[Qp%6]<<int(Qp/6)
ここで、パーセント記号%は、モジュロ関数を示す。したがって、A%Bは、AをBで除算した場合の余りに等しい。<<記号は、<<記号の後の値分の左ビットシフトを示す。したがって、例えば、<<3は、ビット三個分の左シフトを表す。変数baseQStepは、0〜5の指標関数であり、Qp%6で表される。したがって、baseQStepの(潜在的に)異なる値は、関連の指標Qp%6に従って適用される。関数intは、整数値を示す。
計算を簡単にするため、エンコーダに関するいくつかの実施形態では、baseQStepの逆数を事前に計算し、14ビット等のビット数分左にシフトすることで、inverseQStepの値が得られる。次いで、inverseQStepの値を係数の大きさによって乗算する。このようにする理由は、乗算動作は、いくつかの構成では、除算動作より実施が簡単だからである。
これによって、次のような組み合わせ演算が得られる。
出力=((入力×inverseQStep)+rounding)>>qBits
式中、qBits=14+int(Qp/6)+transformShift
式中、transformShiftは、変換処理による任意の付加的なシフトに対する補正を表す。
いくつかの実施形態では、いわゆるスケーリングリストは、TU内の異なる係数に適用可能である量子化度をさらに変化させるメカニズムとして用いられる。各係数位置は、スケーリングリスト内の対応のエントリに関連付けられる。スケーリングリスト値は、量子化除数を変更するのに用いられる。いくつかの実施形態では、10進法の16のスケーリングリスト値は、変化なしに相当する。つまり、除数は変化しない。いくつかの実施形態では、スケーリングリスト値は、上記式で用いられる値inverseQStepを修正するのに用いられ、以下のような結果が得られる。
inverseQStep=(inverseQStep<<4)/スケーリングリスト値
変数「rounding」(丸め)を上記で紹介した。qBitsだけ右にシフトする前に、最終的な結果を丸めるために或る値が追加される。丸めは、最も近い整数値への丸め又は次に高い整数値への丸め等、様々な方法によって適用することができる。
図13は、上述したスケーリングリストの使用法を示す概略図である。量子化部350は、変換された係数800を変換部340から受信する。(例えば、画像圧縮ブロックサイズ又は他のパラメータに対応するように選択された)適切なスケーリングリスト810が使用される。
上述したように、スケーリングリスト810の各エントリと、変換された係数とは、一対一の対応関係にある。アドレス生成部820は、変換された各係数及びこれに対応するスケーリングリストのエントリを調べるためのアドレスを供給する。これらは、(上述したもの等の)他の量子化パラメータと共に、包括的に除算器830と称される部に渡される。除算器830は、スケーリングリストの各エントリ及び他のパラメータを用いて量子化されたデータ840を生成する上述の計算を実行する。なお、除算器は実際には、量子化パラメータの逆数に基づいて乗算演算を実行してもよいが、全体的な効果は、上述の除算と同様である。
図14は、エンコーダ及び/又はデコーダの一部を示す概略図であり、特に、図5に示す上述の構成の一部に対応する。対応のスケーリングリストは、量子化部350及び逆量子化部420(エンコーダのリターンパスの一部であってもよく、スタンドアロン型デコーダの一部であってもよい)に供給される。復号化ステージでは、他の符号化パラメータの所定の関数として、又は使用する適切なスケーリングリストを定義する圧縮されたデータストリーム内のデータ又は当該データストリームに関係付けられるデータに応じて、適切なスケーリングリストが選択されてもよい。
図15は、サンプルの配列を示す概略図である。実際には、これらは、上述した残差画像330のサンプルを表し、適切な相対的な空間位置に描写される。つまり、1つの画像内のこれらのサンプルの位置に関して、サンプル900は、4×4近接サンプルの配列の左上隅に位置し、サンプル910は、係る配列の右下隅に位置する。
もちろん、図15の4×4配列は、単なる一例であることが理解されるであろう。ここで説明する技術及び属性は、8×8、16×16、32×32等の種々の異なるサイズの配列に適用することができる。実際には、4×4配列を、主に図を簡単に且つ理解し易くするように図15〜図19に示すが、いくつかの実施形態では、以下に説明する技術を適用する配列サイズは、8×8、16×16及び32×32のみである。つまり、これらの実施形態では、以下に説明する技術は実際には、4×4配列に適用されない。それにもかかわらず、説明を分かり易くするために4×4配列を示していることを理解されたい。なお、配列サイズは、符号化されたデータ値の配列(つまり、この文脈では、逆量子化部ステージに入力されるデータ値)又は周波数変換された入力データ値の配列(つまり、この文脈では、量子化部ステージに入力されるデータ値)のサイズを指すことができる。
図15のサンプルは、変換部340によって処理され、周波数分離された係数が生成される。図16は、係る周波数分離された係数の配列を示す概略図である。ここで、配列内の係数の位置は、当該係数に対応する空間周波数を表す。慣例では、いわゆるDC係数920は、左上配列位置を占める。図16の配列内の右側移動は、水平周波数成分の増加を表し、図16の配列の下方移動は、垂直周波数成分の増加を表す。なお、係数の配列をこのように(例えば、右下隅にDC係数を有しないように)表現するのは慣例に過ぎず、係数の順番は、当該処理の他の部分に技術的に関連する。この理由の1つを、図16に破線矢印930によって概略的に示す。これは、図16の配列内の右下位置から左上位置への移動が画像再構築に対する係数の重要度の全体的な増加に対応することを示す。つまり、図15のサンプルの配列又はブロックを再構築するために、図16の係数のうちの最重要係数は、DC係数920である。当該DC係数920の次に高い重要度を有する係数として、その下側の水平及び垂直周波数係数が続く。
一般論として、このような重要度の傾向は、DC係数の大きさは、サンプルのブロックから導出された係数のセット内で最大となる傾向があり得るという点で、係数の大きさに関する傾向とも対応する。図17は、図16の配列内の係る傾向を示す概略図である。図中、より小さい値は、当該配列の右下に向かう傾向があり、より大きい値は、配列の左上に向かう傾向がある。もちろん、係数の特有の個々の配列は、この一般的な傾向とは異なる可能性がある。
これらの傾向が技術的に関連する一形態は、図5のエントロピーエンコーダ370によって実行されるエントロピー符号化ステージに関連する。この種のエントロピー符号化に適用される一般的な原則として、ブロック内のより小さいデータ値を処理した後により大きいデータ値を処理することでより効率的に動作するというものがある。したがって、(量子化ステージを間に挟むか否かに関係なく)周波数分離された係数がエントロピー符号化される場合、いわゆる「逆スキャン」パターンが、エントロピー符号化のために適切な順序でデータを選択するのに用いられる。図18は、逆スキャンの一例を示す概略図である。この例は、図示の対角スキャンパターンに従って係数の配列の右下隅の係数940から始まり、DC係数920まで進む、いわゆる逆対角スキャン(reverse-diagonal scan)に関する。このパターンは、一般的には、より小さい値の係数は、より大きい値の係数の前に符号化されることを意味する。
重要度の傾向は、スケーリングリスト値にも関連する。これは実際には、異なる量子化を配列内の異なる係数位置に適用可能とするという、スケーリングリストの1つの目的である。一般的には、図19に概略的に示すように、スケーリングリスト値(量子化又は逆量子化されるビデオデータ内の配列位置毎の値又はエントリ)は、傾向として、DC係数に対応する配列位置で最小となり、水平及び垂直空間周波数が増えるにつれて増加する。なお、より小さいスケーリングリスト値は、より粗さの小さい(less-harsh)量子化に対応する。
上述した技術は、周波数変換されたデータに対しては良好に作用することができる。しかし、周波数変換が用いられない場合、例えば、いわゆる「変換スキップ」モード(名前の通り、周波数変換を採用しないモード)の場合、量子化される値の配列内のデータは、上述した重要度又は数値の傾向を有しない。また、この場合、逆変換処理によって再構築画像データ全体に亘って量子化の粗さのばらつきが平滑化されることもない。しかし、スケーリングリストは単に、周期的な可変量子化パターンを画像に適用するものである。変換スキップブロックでは、より粗さの小さい量子化が左上部分に適用され、より粗い量子化が右下部分に適用されることになるが、再構築画像に関して述べれば、この変換スキップブロック内の各画像位置は全て、等しく重要(significant)であり、再構築画像内の各画像位置に対応する。これに関して、概略的な例として、図20に、周波数変換されなかったデータとスケーリングリストを用いた場合に見られ得る収差を概略的に示す。各ブロックの画質はその左上隅に向かって高くなり、これによって、図のような「魚の鱗」現象が見られる。
この問題に対処するために、本発明の実施形態において種々の選択肢が提供される。
例えば、いくつかの実施形態では、変換スキップモードでは、スケーリングリストの使用は禁止又は防止され、量子化又は逆量子化値が配列内の各データ値の位置とは独立する。例えば、デコーダは、変換スキップモードが、符号化されたビデオデータ値の配列に適用可能か否かを検出するように構成される(例えば、制御部345によって実施される)検出部を有してもよい。検出部は、変換スキップモードが、符号化されたビデオデータ値の配列に適用可能ではないことを検出した場合、逆量子化部を制御し、配列内の各データ値の位置に応じて符号化されたデータ値の配列におけるデータ値間で変化し得る逆量子化パラメータを適用させ、逆周波数変換部を制御し、逆量子化されたデータ値に逆周波数変換を適用する。検出部は、変換スキップモードが、符号化されたビデオデータ値の配列に適用可能であると検出した場合、逆量子化部を制御し、符号化されたデータ値の配列毎に、配列内の各データ値の位置とは独立する逆量子化パラメータを適用させ、逆周波数変換部を制御し、逆量子化されたデータ値に逆周波数変換を適用させないようにする。エンコーダ側では、変換スキップモードが入力ビデオデータ値の配列に適用可能ではない場合、制御部345は、周波数変換器を制御して周波数変換を適用させ、量子化部を制御し、配列内の周波数変換された各入力データ値の位置に応じて周波数変換された入力データ値の配列内のデータ値間で変化し得る量子化パラメータを適用させる。変換スキップモードが、符号化されたビデオデータ値の配列に適用可能である場合、制御部345は、周波数変換器を制御して周波数変換を適用させないようにし、量子化部を制御し、入力データ値の配列毎に配列内の各入力データ値の位置から独立した量子化パラメータを適用することによって入力ビデオデータ値を量子化させる。
いくつかの実施形態では、異なる係数位置に対応する異なる値を表すスケーリングリストを用いる代わりに、全て同じ値を含むスケーリングリストが用いられる(つまり、スケーリングリスト内の各スケーリングリストエントリは同じ数値を有する)か、又は単一の値がスケーリングリストの代わりに提供され、この単一の値が、係数毎の適切な計算においてスケーリングリストエントリの代わりに用いられる。例えば、係る単一の(又は同様の)値は、変換スキップモードで用いることができる。これらの実施形態の潜在的な変更形態として、(スケーリングリストの均等物における個別の値又は同じ値の複数のインスタンスとして送信又は記憶される)単一の値は、例えば、配列サイズ又はビデオチャネルに応じた異なる単一の値とすることができる。
全て同じ、つまり、互いに同一の値を含むスケーリングリストの一例を以下に示す:
係る変換スキップモード用スケーリングリストは、符号化されたビデオデータの1つ又は複数の符号化パラメータに応じて(例えば、制御部345によって)2つ以上の異なる変換スキップモード用スケーリングリストのセットから選択されてもよい。代替的には、変換スキップモード用スケーリングリストは、符号化されたデータ値の配列を含むデータストリームで供給してもよい。代替的には、制御部は、変換スキップモードが選択されなかった場合、当該データ値の配列に適用可能とされるスケーリングリストの1つ又は複数の値、例えば、当該スケーリングリストにおいてそれぞれ事前に選択された位置の1つ又は複数の値から変換スケーリングリストの値を導出してもよい。
まず、以下の説明の背景として、図21は、符号化動作の一部を示す概略フローチャートであり、図22は、復号化動作の対応の部分(エンコーダの逆方向復号化経路にも当てはまる特徴)を示す概略フローチャートである。
図21を参照すると、ステップ1000において、変換スキップモードを有効化する(つまり、係るモードが現在の符号化動作の文脈で許可される)場合、ステップ1010では、「変換スキップ有効化」フラグが、ビデオデータストリームに関係付けられる。一例では、係るフラグは、フレーム毎に1つ提供してもよい。変換スキップ有効化フラグが設定された場合、エンコーダは、変換スキップが当該TUに適用されたか否かを示すTU毎フラグ(TU-by-TU flag)を供給する(と共にデコーダが当該TU毎フラグを探す)。変換スキップ有効化フラグが設定されなかった場合、エンコーダは、TU毎フラグを供給しない(と共にデコーダが当該TU毎フラグを探さない)。
なお、一部のエンコーダでは、変換スキップモードは、当該特定のエンコーダの設計パラメータ下で強制してもよい。他のエンコーダでは、(例えば、制御部345で実施される)検出部は、変換スキップモードが入力ビデオデータ値の現在の配列に適用可能であるか否かを検出するように構成されてもよい。
ステップ1020において、制御部345は、TU毎に、変換スキップを用いるか否かを判定する。いくつかの例では、これは、変換スキップモード及び変換を用いる他のモードをテストし、目的関数の評価に応じてモードを選択することによって実行することができる。目的関数の評価は、当該モードに関して生成されるデータ量及び当該モードに関して生成される各データエラーのうちの1つ又は複数に関連してもよい。変換スキップモードが選択された場合、制御は、ステップ1030に進む。当該ステップでは、TUが変換スキップモードを用いて符号化され、制御はステップ1040に進む。当該ステップでは、上述したTU毎フラグが設定され、変換スキップモードが用いられたことを示す。
他方で、ステップ1000において変換スキップモードが有効化されなかった場合、又は、ステップ1020において変換スキップモードが特定のTUに関して選択されなかった場合、ステップ1050で周波数変換を用いてTUの符号化を行う。
制御は、ステップ1040及びステップ1050の両方から最終ステップ1060に進む。当該ステップでは、出力データストリームが、符号化されたデータ、適宜、フラグ及び/又はスケーリングリスト値及び/又は単一の値を用いて形成される。
対応のデコーダ動作を図22に概略的に示す。ステップ1100は、変換スキップ有効化フラグの直近のインスタンスを調べることによって変換スキップモードが有効化されているか否かを検出する。変換スキップモードが有効化されている場合、ステップ1110では、TU毎フラグがTU毎に確認される。スキップモードが、特定のTUのために選択されている場合、TUは、ステップ1120において逆変換を用いずに復号化される。しかし、TUに関してスキップモードが選択されなかった場合、又は(ステップ1100において)スキップモードが有効化されなかった場合、制御がステップ1120に進む前にステップ1130において逆変換が適用される。
図23は、図14と同様にエンコーダ及び/又はデコーダの一部を示す概略図である。大部分が同一であるため、これらについてさらなる説明はしない。
例えば、制御部345からの制御信号は、マルチプレクサ1200及び模式スイッチ(schematic switch)1210に供給される。制御信号は、変換スキップモードが現在のTUに適用されるか否かを示す。
変換スキップモードが現在のTUに適用可能である場合、模式スイッチ1210は閉じ、データは変換部340を迂回する。換言すると、スイッチ1210は、変換部340が、データの現在のブロックに周波数変換を適用することを防止する。同様に、マルチプレクサ1200は、スケーリングリスト1220の代わりに、全てのデータ配列位置に適用可能である単一のデータ値が量子化部350に供給又は代入されてスケーリングリストの代わりに用いられるように制御される。これにより、スケーリングリストの使用が禁止される。
単一のデータ値は、符号化されたデータ値の配列を含むデータストリームで供給されてもよい。代替的には、制御部345は、スケーリングリストの1つ又は複数の値から単一のデータ値を導出してもよい。当該スケーリングリストは、変換スキップモードが選択されなかった場合に、当該符号化されたビデオデータ値の配列に適用可能とされる。純粋に例示として、単一の値は、左上(DC)配列値に適用可能であるスケーリングリスト値と等しくしてもよく、又は左上の4つのスケーリングリスト値の平均値等の平均としてもよい。代替的には、単一のデータ値は、符号化されたビデオデータの1つ又は複数の符号化パラメータに応じて2つ以上の異なる単一のデータ値のセットから選択されてもよい。例えば、単一の値は、TUサイズ等のブロックサイズに応じて選択してもよい。
また、変換スキップモードが現在のTUに適用可能ではない場合、模式スイッチ1210は開き、変換部340が有効化され、マルチプレクサ1200は、単一の値1230の代わりにスケーリングリスト1220を供給するように制御される。
同様に、復号化経路では、対応の模式スイッチ1240が、同様に制御部345からの制御信号の制御下で、逆変換部430の動作又はバイパスを制御する。別の模式マルチプレクサ1250は、現在のTUに適用可能であるスケーリングリスト1220又は単一の値1230を逆量子化部420に供給するように設けられる。上述したように、変換スキップモードでは、逆変換部430は用いられず、単一の値1230が、逆量子化部420に供給される。非変換スキップモードでは、スケーリングリスト1220が用いられ、逆変換部430が有効化される。
上記動作は、図24の概略フローチャートに要約される。ステップ1300では、変換スキップモードが適用可能である場合、ステップ1310では、当該TUに対して、スケーリングリストの代わりに単一の値を用いる。他方で、ステップ1300では、変換スキップモードが適用可能ではない場合、ステップ1320において、スケーリングリストを用いる。
同様の構成を図25に示す。対応の特徴は図23を参照して既に述べているため、重ねては説明しない。図25と図23との違いは、制御部345からの制御信号によって、この変更形態の量子化部350'及び逆量子化部420'を制御し、(非変換スキップモードで)スケーリングリスト1220を使用させるか、又は(変換スキップモードで)スケーリングリストを使用させないようにすることによって、スケーリングリストの使用を禁止することにある。ここで、スケーリングリストを用いないことは、量子化を実行するために上記計算を実施するだけで、スケーリングリストによって可変とされる計算は行われない(つまり、サンプル間で変化がない)ことを意味する。上記の文における「スケーリングリストを用いない」という表現は、もちろん、上述したように、スケーリングリストの代わりに単一の値を用いることを包含する。
この動作は、図26の概略フローチャートに要約される。ステップ1400において、変換スキップモードが適用可能である場合、ステップ1410において、当該TUのためにスケーリングリストを用いない。また、ステップ1400において、変換スキップモードが適用可能ではない場合、ステップ1420において、スケーリングリストを用いる。
上述の説明では、変換スキップモードはTU毎に選択されたが、CU等のより大きなブロック又はスライス若しくは画像に対して選択を行うことができることが理解されるであろう。
[データ信号]
上記符号化装置及び係る信号を保持する記憶装置又は送信媒体の変形例によって生成されるデータ信号は、本開示の実施形態を代表するものと見なされることが理解されるであろう。
本開示の実施形態が、少なくとも部分的にソフトウェア制御式データ処理装置によって実施されるものとして記載されている限り、係るソフトウェアを保持する、光ディスク、磁気ディスク、半導体メモリ等の非一過性の装置可読媒体も、本開示の一実施形態を代表するものと見なされることが理解されるであろう。
もちろん、本開示の多くの変更形態及び変形が上記教示を鑑みて可能である。したがって、添付の特許請求の範囲から逸脱しない限り、本技術は、本明細書で詳述したものとは異なる方法で実施してもよいことを理解されたい。
さらなる実施形態は、以下の番号付けされた項によって定義される。
1. 符号化されたビデオデータ値の配列を復号化するように動作可能であるビデオデータ復号化装置であって、
逆量子化パラメータを各データ値に適用して対応の逆量子化されたデータ値を生成することによって、上記符号化されたビデオデータ値の配列を逆量子化するように構成される逆量子化部と、
上記逆量子化されたデータ値に逆周波数変換を適用するように構成される逆周波数変換部と、
変換スキップモードが、上記符号化されたビデオデータ値の配列に適用可能であるか否かを検出するように構成される検出部と
を具備し、
上記検出部が、上記変換スキップモードが、上記符号化されたビデオデータ値の配列に適用可能ではないと検出した場合、上記検出部は、上記逆量子化部を制御し、上記符号化されたビデオデータ値の配列内の各データ値の位置に応じて、上記符号化されたビデオデータ値の配列のデータ値間で変化し得る逆量子化パラメータを適用させ、上記逆周波数変換部を制御し、上記逆量子化されたデータ値に逆周波数変換を適用させ、
上記検出部が、上記変換スキップモードが、上記符号化されたビデオデータ値の配列に適用可能であることを検出した場合、上記検出部は、上記逆量子化部を制御し、上記符号化されたビデオデータ値の配列毎に、上記配列内の各データ値の位置から独立した逆量子化パラメータを適用させ、上記逆周波数変換部を制御し、上記逆量子化されたデータ値に逆周波数変換を適用させないようにする
ビデオデータ復号化装置。
2. 上記1に記載のビデオデータ復号化装置であって、
上記逆量子化部は、スケーリングリスト内の各エントリに依存する逆量子化パラメータを使用するように構成され、
上記スケーリングリスト内には、上記符号化されたビデオデータの配列位置毎に1つのエントリが存在する
ビデオデータ復号化装置。
3. 上記1又は2に記載のビデオデータ復号化装置であって、
上記検出部が、上記変換スキップモードが、上記符号化されたビデオデータ値の配列に適用可能であることを検出した場合、上記検出部は、上記逆量子化部による上記スケーリングリストの使用を禁止するように動作可能である
ビデオデータ復号化装置。
4. 上記2に記載のビデオデータ復号化装置であって、
上記検出部が、上記変換スキップモードが、上記符号化されたビデオデータ値の配列に適用可能であることを検出した場合、上記逆量子化部は、スケーリングリスト値が全て同一である変換スキップモード用スケーリングリストを用いるように構成される
ビデオデータ復号化装置。
5. 上記4に記載のビデオデータ復号化装置であって、
上記変換スキップモード用スケーリングリストは、上記符号化されたビデオデータの1つ又は複数の符号化パラメータに応じて、2つ以上の異なる変換スキップモード用スケーリングリストのセットから選択される
ビデオデータ復号化装置。
6. 上記4に記載のビデオデータ復号化装置であって、
上記変換スキップモード用スケーリングリストは、上記符号化されたビデオデータ値の配列を含むデータストリームで供給される
ビデオデータ復号化装置。
7. 上記4に記載のビデオデータ復号化装置であって、
上記復号化装置は、上記変換スキップモードが選択されなかった場合、当該符号化されたビデオデータ値の配列に適用可能とされる上記スケーリングリストの1つ又は複数の値から上記変換スキップモード用スケーリングリスト値を導出するように動作可能である
ビデオデータ復号化装置。
8. 上記2に記載のビデオデータ復号化装置であって、
上記逆量子化部は、上記検出部が、上記変換スキップモードが、上記符号化されたビデオデータ値の配列に適用可能であることを検出した場合、上記スケーリングリスト値の代わりに単一のデータ値を代用するように構成される
ビデオデータ復号化装置。
9. 上記8に記載のビデオデータ復号化装置であって、
上記単一のデータ値は、上記符号化されたビデオデータ値の配列を含むデータストリームで供給される
ビデオデータ復号化装置。
10. 上記8に記載のビデオデータ復号化装置であって、
上記復号化装置は、上記変換スキップモードが選択されなかった場合、当該符号化されたビデオデータ値の配列に適用可能とされる上記スケーリングリストの1つ又は複数の値から上記単一のデータ値を導出するように動作可能である
ビデオデータ復号化装置。
11. 上記8に記載のビデオデータ復号化装置であって、
上記単一のデータ値は、上記符号化されたビデオデータの1つ又は複数の符号化パラメータに応じて2つ以上の異なる単一のデータ値のセットから選択される
ビデオデータ復号化装置。
12. 請求項1〜11に記載のビデオデータ復号化装置であって、
上記符号化されたビデオデータ値の配列は、
8×8配列、
16×16配列、及び
32×32配列
から成るリストから選択される
ビデオデータ復号化装置。
13. 変換スキップモード及び任意選択的に非変換スキップモードで入力ビデオデータ値の配列を符号化するように動作可能であるビデオデータ符号化装置であって、
上記入力ビデオデータ値に周波数変換を適用して周波数変換された入力ビデオデータ値の配列を生成するように構成される周波数変換器と、
周波数変換された各入力ビデオデータ値に量子化パラメータを適用して対応の量子化されたデータ値を生成することによって、上記周波数変換された入力ビデオデータ値を量子化するように構成される量子化部と、
上記変換スキップモードが上記入力ビデオデータ値の配列に適用可能ではない場合、上記周波数変換器を制御し、上記周波数変換を適用させ、上記量子化部を制御し、上記配列内の周波数変換された各入力ビデオデータ値の位置に応じて上記周波数変換された入力ビデオデータ値の配列内のデータ値間で変化し得る量子化パラメータを適用させ、
上記変換スキップモードが上記符号化されたビデオデータ値の配列に適用可能である場合、上記周波数変換器を制御し、上記周波数変換を適用させないようにし、上記量子化部を制御し、入力ビデオデータ値の配列毎に、上記配列内の各入力ビデオデータ値の位置から独立した量子化パラメータを適用することによって、上記入力ビデオデータ値を量子化させる制御部と
を具備する
ビデオデータ符号化装置。
14. 上記13に記載のビデオデータ符号化装置であって、
変換スキップモードが上記入力ビデオデータ値の配列に適用可能であるか否かを検出するように構成される検出部
をさらに具備する
ビデオデータ符号化装置。
15. 上記13に記載のビデオデータ符号化装置であって、
上記量子化部は、スケーリングリスト内の各エントリに依存する量子化パラメータを使用するように構成され、
上記スケーリングリスト内には、量子化される上記データの配列位置毎に1つのエントリが存在する
ビデオデータ符号化装置。
16. 上記15に記載のビデオデータ符号化装置であって、
上記検出部は、上記変換スキップモードが上記入力ビデオデータ値の配列に適用可能であることを検出した場合、上記検出部は、上記量子化部による上記スケーリングリストの使用を禁止するように動作可能である
ビデオデータ符号化装置。
17. 上記15に記載のビデオデータ符号化装置であって、
上記検出部が、上記変換スキップモードが上記入力ビデオデータ値の配列に適用可能であることを検出した場合、上記量子化部は、スケーリングリスト値が全て同一である変換スキップモード用スケーリングリストを用いるように構成される
ビデオデータ符号化装置。
18. 上記17に記載のビデオデータ符号化装置であって、
上記変換スキップモード用スケーリングリストは、上記入力ビデオデータの1つ又は複数の符号化パラメータに応じて、2つ以上の異なる変換スキップモード用スケーリングリストのセットから選択される
ビデオデータ符号化装置。
19. 上記17に記載のビデオデータ符号化装置であって、
上記変換スキップモード用スケーリングリストは、上記符号化されたビデオデータ値の配列を含むデータストリームで供給される
ビデオデータ符号化装置。
20. 上記17に記載のビデオデータ符号化装置であって、
上記符号化装置は、上記変換スキップモードが選択されなかった場合、当該入力ビデオデータ値の配列に適用可能とされる上記スケーリングリストの1つ又は複数の値から上記変換スキップモード用スケーリングリスト値を導出するように動作可能である
ビデオデータ符号化装置。
21. 上記15に記載のビデオデータ符号化装置であって、
上記検出部が、上記変換スキップモードが上記入力ビデオデータ値の配列に適用可能であることを検出した場合、上記量子化部は、上記スケーリングリスト値の代わりに単一のデータ値を代用するように構成される
ビデオデータ符号化装置。
22. 上記21に記載のビデオデータ符号化装置であって、
上記単一のデータ値は、上記符号化されたビデオデータ値の配列を含むデータストリームで供給される
ビデオデータ符号化装置。
23. 上記21に記載のビデオデータ符号化装置であって、
上記符号化装置は、上記変換スキップモードが選択されなかった場合、当該入力ビデオデータ値の配列に適用可能とされる上記スケーリングリストの1つ又は複数の値から上記単一のデータ値を導出するように動作可能である
ビデオデータ符号化装置。
24. 上記21に記載のビデオデータ符号化装置であって、
上記単一のデータ値は、上記入力ビデオデータの1つ又は複数の符号化パラメータに応じて2つ以上の異なる単一のデータ値のセットから選択される
ビデオデータ符号化装置。
25. 請求項13〜24に記載のビデオデータ符号化装置であって、
上記周波数変換された入力ビデオデータ値の配列は、
8×8配列、
16×16配列、及び
32×32配列
から成るリストから選択される
ビデオデータ符号化装置。
26. 請求項1〜12に記載のビデオデータ復号化装置又は請求項13〜25に記載のビデオデータ符号化装置を具備する装置であって、ビデオデータキャプチャ装置、記憶装置、送信装置、表示装置、及び記録装置のうち少なくとも1つの機能を有する装置。
27. 符号化されたビデオデータ値の配列を復号化するビデオデータ復号化方法であって、
変換スキップモードが、上記符号化されたビデオデータ値の配列に適用可能であるか否かを検出し、
上記変換スキップモードが、上記符号化されたビデオデータ値の配列に適用可能ではないと検出された場合、上記配列内の各データ値の位置に応じて、上記符号化されたビデオデータ値の配列のデータ値間で変化し得る逆量子化パラメータを適用することによって、上記符号化されたビデオデータ値の配列を逆量子化し、上記逆量子化されたデータ値に逆周波数変換を適用し、
上記変換スキップモードが、上記符号化されたビデオデータ値の配列に適用可能であると検出された場合、上記符号化されたビデオデータ値の配列毎に、上記配列内の各データ値の位置から独立した逆量子化パラメータを適用することによって、上記符号化されたビデオデータ値の配列を逆量子化し、上記逆量子化されたデータ値に逆周波数変換を適用しない
ビデオデータ復号化方法。
28. 入力ビデオデータ値の配列を符号化するビデオデータ符号化方法であって、
変換スキップモードが上記入力ビデオデータ値の配列に適用可能ではない場合、上記入力ビデオデータを周波数変換し、上記配列内の周波数変換された各入力ビデオデータ値の位置に応じて上記周波数変換された入力ビデオデータ値の配列内のデータ値間で変化し得る量子化パラメータを適用することによって、周波数変換された入力ビデオデータ値の結果として得られる配列を量子化し、
上記変換スキップモードが上記入力ビデオデータ値の配列に適用可能である場合、入力ビデオデータ値の配列毎に、上記配列内の各入力ビデオデータ値の位置から独立した量子化パラメータを適用することによって、上記入力ビデオデータ値を量子化する
ビデオデータ符号化方法。
29. コンピュータに、上記27に記載のビデオデータ復号化方法又は上記28に記載のビデオデータ符号化方法の各ステップを実行させるプログラム。
30. 上記29に記載のプログラムが記録されたコンピュータ可読記録媒体。

Claims (19)

  1. 符号化されたビデオデータ値の配列を復号化するビデオデータ復号化装置であって、
    スケーリングリストを各データ値に適用して対応の逆量子化されたデータ値を生成することによって、前記符号化されたビデオデータ値の配列を逆量子化するように構成される逆量子化部と、
    前記逆量子化されたデータ値に逆周波数変換を適用するように構成される逆周波数変換部と、
    変換スキップモードが、前記符号化されたビデオデータ値の配列に適用可能であるか否かを検出するように構成される検出部の回路と
    を具備し、
    前記検出部が、前記変換スキップモードが、前記符号化されたビデオデータ値の配列に適用可能ではないと検出した場合、前記検出部は、前記逆量子化部を制御し、前記符号化されたビデオデータ値の配列内の各データ値の位置に応じて、前記符号化されたビデオデータ値の配列のデータ値間で変化し得るスケーリングリストを適用させ、前記逆周波数変換部を制御し、前記逆量子化されたデータ値に逆周波数変換を適用させ、
    前記検出部が、前記変換スキップモードが、前記符号化されたビデオデータ値の配列に適用可能であることを検出し、かつ前記配列が4×4配列である場合、前記検出部は、前記逆量子化部を制御し、符号化されたビデオデータ値の4×4配列に、前記配列内の各データ値の位置に依存したスケーリングリストを適用させ、前記逆周波数変換部を制御し、前記逆量子化されたデータ値に逆周波数変換を適用させないようにさせ、
    前記検出部が、前記変換スキップモードが、前記符号化されたビデオデータ値の配列に適用可能であることを検出し、かつ前記配列が8×8配列、16×16配列、および32×32配列のいずれか1つである場合、前記検出部は、前記逆量子化部を制御し、前記符号化されたビデオデータ値の8×8配列、16×16配列、または32×32配列毎に、前記配列内の各データ値の位置から独立したスケーリングリストを適用させ、前記逆周波数変換部を制御し、前記逆量子化されたデータ値に逆周波数変換を適用させないようにさせ、
    前記逆量子化部は、前記スケーリングリストを使用するように構成され、
    前記スケーリングリスト内には、前記符号化されたビデオデータの配列位置毎に1つのエントリが存在し、
    前記符号化されたビデオデータ値の8×8配列、16×16配列、または32×32配列に対して、前記検出部が、前記変換スキップモードが、前記符号化されたビデオデータ値の配列に適用可能であることを検出した場合、前記逆量子化部は、スケーリングリストの各エントリが全て同一である変換スキップモード用スケーリングリストを用いるように構成される
    ビデオデータ復号化装置。
  2. 請求項1に記載のビデオデータ復号化装置であって、
    前記符号化されたビデオデータ値の8×8配列、16×16配列、または32×32配列に対して、前記検出部が、前記変換スキップモードが、前記符号化されたビデオデータ値の配列に適用可能であることを検出した場合、前記検出部は、前記逆量子化部による前記スケーリングリストの使用を禁止するように動作可能である
    ビデオデータ復号化装置。
  3. 請求項1に記載のビデオデータ復号化装置であって、
    前記逆量子化部は、前記検出部が、前記変換スキップモードが、前記符号化されたビデオデータ値の8×8配列、16×16配列、または32×32配列に適用可能であることを検出した場合、前記スケーリングリストの代わりに単一のデータ値を代用するように構成される
    ビデオデータ復号化装置。
  4. 請求項3に記載のビデオデータ復号化装置であって、
    前記単一のデータ値は、左上(DC)配列値に適用可能であるスケーリングリストのエントリと等しいか、又は左上の4つのスケーリングリストのエントリの平均値である
    ビデオデータ復号化装置。
  5. 請求項1に記載のビデオデータ復号化装置であって、
    前記スケーリングリストの各エントリは16の値を持つ
    ビデオデータ復号化装置。
  6. 変換スキップモード及び任意選択的に非変換スキップモードで入力ビデオデータ値の配列を符号化するビデオデータ符号化装置であって、
    前記入力ビデオデータ値に周波数変換を適用して周波数変換された入力ビデオデータ値の配列を生成するように構成される周波数変換器と、
    周波数変換された各入力ビデオデータ値にスケーリングリストを適用して対応の量子化されたデータ値を生成することによって、前記周波数変換された入力ビデオデータ値を量子化するように構成される量子化部と、
    前記変換スキップモードが前記入力ビデオデータ値の配列に適用可能ではない場合、前記周波数変換器を制御し、前記周波数変換を適用させ、前記量子化部を制御し、前記配列内の周波数変換された各入力ビデオデータ値の位置に応じて前記周波数変換された入力ビデオデータ値の配列内のデータ値間で変化し得るスケーリングリストを適用させ、
    前記変換スキップモードが前記入力されたビデオデータ値の配列に適用可能であり、かつ前記配列が4×4配列である場合、前記周波数変換器を制御し、前記周波数変換を適用させないようにし、前記量子化部を制御し、入力ビデオデータ値の4×4配列に、前記配列内の各入力ビデオデータ値の位置に依存するスケーリングリストを適用することによって、前記入力ビデオデータ値を量子化させ、
    前記変換スキップモードが前記入力されたビデオデータ値の配列に適用可能であり、かつ前記配列が8×8配列、16×16配列、および32×32配列のいずれか1つである場合、前記周波数変換器を制御し、前記周波数変換を適用させないようにし、前記量子化部を制御し、入力ビデオデータ値の8×8配列、16×16配列、または32×32配列毎に、前記配列内の各入力ビデオデータ値の位置から独立したスケーリングリストを適用することによって、前記入力ビデオデータ値を量子化させる制御部の回路と、
    変換スキップモードが前記入力ビデオデータ値の配列に適用可能であるか否かを検出するように構成される検出部と
    を具備し、
    前記入力されたビデオデータ値の8×8配列、16×16配列、または32×32配列に対して、前記量子化部は、スケーリングリストを使用するように構成され、
    前記スケーリングリスト内には、量子化される前記データの配列位置毎に1つのエントリが存在し、
    前記検出部が、前記変換スキップモードが、前記入力ビデオデータ値の配列に適用可能であることを検出した場合、前記量子化部は、スケーリングリストの各エントリが全て同一である変換スキップモード用スケーリングリストを用いるように構成される
    ビデオデータ符号化装置。
  7. 請求項6に記載のビデオデータ符号化装置であって、
    前記入力されたビデオデータ値の8×8配列、16×16配列、または32×32配列に対して、前記検出部は、前記変換スキップモードが、前記入力ビデオデータ値の配列に適用可能であることを検出した場合、前記検出部は、前記量子化部による前記スケーリングリストの使用を禁止するように動作可能である
    ビデオデータ符号化装置。
  8. 請求項6に記載のビデオデータ符号化装置であって、
    前記変換スキップモード用スケーリングリストは、前記入力ビデオデータの1つ又は複数の符号化パラメータに応じて、2つ以上の異なる変換スキップモード用スケーリングリストのセットから選択される
    ビデオデータ符号化装置。
  9. 請求項6に記載のビデオデータ符号化装置であって、
    前記符号化装置は、もし前記変換スキップモードが選択されなかったであろう合当該入力ビデオデータ値の配列に適用可能とされる前記スケーリングリストの1つ又は複数の値から前記変換スキップモード用スケーリングリストの各エントリを導出するように動作可能である
    ビデオデータ符号化装置。
  10. 請求項6に記載のビデオデータ符号化装置であって、
    前記検出部が、前記変換スキップモードが前記入力ビデオデータ値の配列に適用可能であることを検出した場合、前記量子化部は、前記スケーリングリストの代わりに単一のデータ値を代用するように構成される
    ビデオデータ符号化装置。
  11. 請求項10に記載のビデオデータ符号化装置であって、
    前記符号化装置は、もし前記変換スキップモードが選択されなかったであろう合当該入力ビデオデータ値の配列に適用可能とされる前記スケーリングリストの1つ又は複数の値から前記単一のデータ値を導出するように動作可能である
    ビデオデータ符号化装置。
  12. 請求項6に記載のビデオデータ符号化装置であって、
    前記スケーリングリストの各エントリは16の値を持つ
    ビデオデータ符号化装置。
  13. 請求項1に記載のビデオデータ復号化装置を具備する装置であって、ビデオデータキャプチャ装置、送信装置、表示装置、及び記憶装置のうち少なくとも1つの機能を有する装置。
  14. 符号化されたビデオデータ値の配列を復号化するビデオデータ復号化方法であって、
    変換スキップモードが、前記符号化されたビデオデータ値の配列に適用可能であるか否かを検出し、
    前記変換スキップモードが、前記符号化されたビデオデータ値の配列に適用可能ではないと検出された場合、前記配列内の各データ値の位置に応じて、前記符号化されたビデオデータ値の配列のデータ値間で変化し得るスケーリングリストを適用することによって、前記符号化されたビデオデータ値の配列を逆量子化し、前記逆量子化されたデータ値に逆周波数変換を適用し、
    前記変換スキップモードが、前記符号化されたビデオデータ値の配列に適用可能であると検出され、かつ前記配列が4×4配列である場合、前記符号化されたビデオデータ値の4×4配列に前記配列内の各データ値の位置に依存したスケーリングリストを適用することによって、前記符号化されたビデオデータ値の配列を逆量子化し、前記逆量子化されたデータ値に逆周波数変換を適用せず、
    前記変換スキップモードが、前記符号化されたビデオデータ値の配列に適用可能であると検出され、かつ前記配列が8×8配列、16×16配列、および32×32配列のいずれか1つである場合、前記符号化されたビデオデータ値の8×8配列、16×16配列、または32×32配列毎に、前記配列内の各データ値の位置から独立したスケーリングリストを適用することによって、前記符号化されたビデオデータ値の配列を逆量子化し、前記逆量子化されたデータ値に逆周波数変換を適用しない
    ビデオデータ復号化方法。
  15. 入力ビデオデータ値の配列を符号化するビデオデータ符号化方法であって、
    変換スキップモードが前記入力ビデオデータ値の配列に適用可能ではない場合、前記入力ビデオデータを周波数変換し、前記配列内の周波数変換された各入力ビデオデータ値の位置に応じて前記周波数変換された入力ビデオデータ値の配列内のデータ値間で変化し得るスケーリングリストを適用することによって、周波数変換された入力ビデオデータ値の結果として得られる配列を量子化し、
    前記変換スキップモードが前記入力ビデオデータ値の配列に適用可能であり、かつ前記配列が4×4配列である場合、入力ビデオデータ値の配列毎に、前記配列内の各入力ビデオデータ値の位置から独立したスケーリングリストを適用することによって、前記入力ビデオデータ値を量子化し、
    前記変換スキップモードが前記入力ビデオデータ値の配列に適用可能であり、かつ前記配列が8×8配列、16×16配列、および32×32配列のいずれか1つである場合、入力ビデオデータ値の配列毎に、前記配列内の各入力ビデオデータ値の位置から独立したスケーリングリストを適用することによって、前記入力ビデオデータ値を量子化する
    ビデオデータ符号化方法。
  16. コンピュータに、請求項14に記載のビデオデータ復号化方法の各ステップを実行させるプログラムが記録されたコンピュータ可読記録媒体。
  17. コンピュータに、請求項15に記載のビデオデータ符号化方法の各ステップを実行させるプログラムが記録されたコンピュータ可読記録媒体。
  18. 請求項1に記載のビデオデータ復号化装置であって、
    前記検出部が、前記変換スキップモードが、前記符号化されたビデオデータ値の配列に適用可能であることを検出し、かつ前記配列が8×8配列、16×16配列、および32×32配列のいずれか1つである場合、前記検出部は、前記逆量子化部を制御し、前記符号化されたビデオデータ値の8×8配列、16×16配列、または32×32配列毎に、前記配列内の各データ値の位置から独立したスケーリングリストのみを適用させる
    ビデオデータ復号化装置。
  19. 請求項6に記載のビデオデータ符号化装置であって、
    前記変換スキップモードが前記入力されたビデオデータ値の配列に適用可能であり、かつ前記配列が8×8配列、16×16配列、および32×32配列のいずれか1つである場合、前記制御部が前記量子化部を制御し、入力ビデオデータ値の8×8配列、16×16配列、または32×32配列毎に、前記配列内の各入力ビデオデータ値の位置から独立したスケーリングリストのみを適用する
    ビデオデータ符号化装置。
JP2016517463A 2013-09-25 2014-09-24 データ符号化及び復号化 Active JP6548635B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB1317041.0 2013-09-25
GB1317041.0A GB2518823A (en) 2013-09-25 2013-09-25 Data encoding and decoding
PCT/GB2014/052902 WO2015044660A1 (en) 2013-09-25 2014-09-24 Data encoding and decoding

Publications (3)

Publication Number Publication Date
JP2016532341A JP2016532341A (ja) 2016-10-13
JP2016532341A5 JP2016532341A5 (ja) 2017-10-05
JP6548635B2 true JP6548635B2 (ja) 2019-07-24

Family

ID=49553411

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016517463A Active JP6548635B2 (ja) 2013-09-25 2014-09-24 データ符号化及び復号化

Country Status (12)

Country Link
US (2) US10575017B2 (ja)
EP (1) EP3036904B1 (ja)
JP (1) JP6548635B2 (ja)
CN (2) CN105580367B (ja)
AU (1) AU2014326421B2 (ja)
BR (1) BR112016006042A2 (ja)
CA (1) CA2923556C (ja)
GB (1) GB2518823A (ja)
MX (1) MX366389B (ja)
RU (2) RU2760234C2 (ja)
TW (1) TWI650012B (ja)
WO (1) WO2015044660A1 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10091506B2 (en) * 2015-06-11 2018-10-02 Sony Corporation Data-charge phase data compression architecture
US10027968B2 (en) * 2015-06-12 2018-07-17 Sony Corporation Data-charge phase data compression tool
US10123044B2 (en) * 2015-07-16 2018-11-06 Mediatek Inc. Partial decoding circuit of video encoder/decoder for dealing with inverse second transform and partial encoding circuit of video encoder for dealing with second transform
US10224042B2 (en) * 2016-10-31 2019-03-05 Qualcomm Incorporated Encoding of multiple audio signals
CN110024410B (zh) * 2016-11-25 2023-07-28 株式会社Kt 用于对视频进行编码和解码的方法
KR20180089290A (ko) 2017-01-31 2018-08-08 세종대학교산학협력단 영상의 부호화/복호화 방법 및 장치
JP7522137B2 (ja) * 2019-06-14 2024-07-24 フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. 改良型の変換ベーススケーリングを用いるエンコーダ、デコーダ、方法、およびコンピュータプログラム
WO2021039650A1 (ja) * 2019-08-23 2021-03-04 ソニー株式会社 画像処理装置および方法
WO2021086023A1 (ko) * 2019-10-28 2021-05-06 엘지전자 주식회사 적응적 변환을 이용하여 레지듀얼 처리를 수행하는 영상 부호화/복호화 방법, 장치 및 비트스트림을 전송하는 방법
US11490122B2 (en) * 2020-09-24 2022-11-01 Tencent America LLC Method and apparatus for video coding

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3542911B2 (ja) * 1998-08-24 2004-07-14 日本電気株式会社 動画圧縮装置
EP1569458A1 (en) * 2004-02-12 2005-08-31 Matsushita Electric Industrial Co., Ltd. Encoding and decoding of video images based on a non-linear quantization
US7519229B2 (en) * 2004-03-30 2009-04-14 Apple, Inc. Video coding system providing separate coding chains for dynamically selected small-size or full-size playback
JP2008526072A (ja) * 2004-12-22 2008-07-17 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ スケーラブル符号化
CN102165771A (zh) * 2008-08-12 2011-08-24 诺基亚公司 使用空间可变变换的视频编码
JP5686499B2 (ja) * 2009-01-22 2015-03-18 株式会社Nttドコモ 画像予測符号化装置、方法及びプログラム、画像予測復号装置、方法及びプログラム、並びに、符号化・復号システム及び方法
JP5604825B2 (ja) * 2009-08-19 2014-10-15 ソニー株式会社 画像処理装置および方法
US9706214B2 (en) * 2010-12-24 2017-07-11 Microsoft Technology Licensing, Llc Image and video decoding implementations
US9854275B2 (en) 2011-06-25 2017-12-26 Qualcomm Incorporated Quantization in video coding
GB2492333B (en) 2011-06-27 2018-12-12 British Broadcasting Corp Video encoding and decoding using transforms
US9756360B2 (en) * 2011-07-19 2017-09-05 Qualcomm Incorporated Coefficient scanning in video coding
IN2014DN03098A (ja) * 2011-10-17 2015-05-15 Kt Corp
GB2496197A (en) * 2011-11-07 2013-05-08 Sony Corp Frequency Domain Video Data Reordering for Encoding
GB2496194A (en) * 2011-11-07 2013-05-08 Sony Corp Entropy encoding video data using reordering patterns
TWI535222B (zh) 2012-06-29 2016-05-21 Sony Corp Image processing apparatus and method
CN114786016A (zh) * 2012-07-02 2022-07-22 韩国电子通信研究院 图像编码/解码方法和非暂时性计算机可读记录介质
US9253483B2 (en) * 2012-09-25 2016-02-02 Google Technology Holdings LLC Signaling of scaling list

Also Published As

Publication number Publication date
RU2760234C2 (ru) 2021-11-23
JP2016532341A (ja) 2016-10-13
GB2518823A (en) 2015-04-08
US10958938B2 (en) 2021-03-23
TW201517600A (zh) 2015-05-01
AU2014326421A1 (en) 2016-03-17
MX2016003402A (es) 2016-06-30
US20200195971A1 (en) 2020-06-18
CN105580367A (zh) 2016-05-11
MX366389B (es) 2019-07-08
WO2015044660A1 (en) 2015-04-02
RU2665309C2 (ru) 2018-08-28
US20160227252A1 (en) 2016-08-04
AU2014326421B2 (en) 2019-04-04
CN109451311A (zh) 2019-03-08
BR112016006042A2 (pt) 2017-08-01
TWI650012B (zh) 2019-02-01
RU2018130348A (ru) 2019-03-15
EP3036904B1 (en) 2020-01-15
EP3036904A1 (en) 2016-06-29
GB201317041D0 (en) 2013-11-06
CN105580367B (zh) 2018-11-13
US10575017B2 (en) 2020-02-25
CN109451311B (zh) 2023-06-30
RU2016115854A (ru) 2017-10-30
RU2018130348A3 (ja) 2021-10-20
CA2923556C (en) 2021-11-23
CA2923556A1 (en) 2015-04-02

Similar Documents

Publication Publication Date Title
JP6548635B2 (ja) データ符号化及び復号化
JP6609753B2 (ja) データ符号化及び復号化
JP6128707B2 (ja) データ符号化及び復号化
US10341680B2 (en) Data encoding and decoding apparatus, method and storage medium
WO2013012930A9 (en) Coefficient scanning in video coding
KR20160101925A (ko) 데이터 인코딩 및 디코딩
JP6777780B2 (ja) ビデオデータ符号化方法、プログラム、コンピュータ可読記録媒体、ビデオデータ符号化装置、及び、ビデオデータ符号化装置を具備する装置
JP7047777B2 (ja) 画像データ符号化及び復号化
US10873759B2 (en) Data encoding and decoding
JP6708211B2 (ja) 動画像符号化装置、動画像符号化方法および動画像符号化プログラムを記憶する記録媒体
CN111684798A (zh) 数据编码和解码
US20220078430A1 (en) Image data encoding and decoding
JP2022548685A (ja) 画像データの符号化及び復号化
CN115380533A (zh) 视频数据编码和解码

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170822

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170822

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180612

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180619

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20180918

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20181115

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181218

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190528

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190625

R150 Certificate of patent or registration of utility model

Ref document number: 6548635

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

Free format text: JAPANESE INTERMEDIATE CODE: R313115

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350