JP7369191B2

JP7369191B2 - しきい値とライスパラメータとを使用した係数復号のための正規コード化ビン低減

Info

Publication number: JP7369191B2
Application number: JP2021529025A
Authority: JP
Inventors: カルチェビチ、マルタ; コバン、ムハンメド・ゼイド
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2018-12-06
Filing date: 2019-12-06
Publication date: 2023-10-25
Anticipated expiration: 2039-12-06
Also published as: AU2019392913A1; KR20210096114A; SG11202104333UA; JP2022510145A; CN113170138B; CL2021001439A1; SA521422035B1; IL282516A; CA3117940A1; US10904548B2; US20200186814A1; WO2020118212A1; EP3891982A1; BR112021009714A2; CN113170138A; MX2021006528A; CO2021007279A2

Description

[0001] 本出願は、
２０１９年１２月５日に出願された米国特許出願第１６／７０４，９９５号の優先権を主張し、この出願は、
２０１８年１２月６日に出願された米国仮特許出願第６２／７７６，３７９号と、
２０１９年１月２日に出願された米国仮特許出願第６２／７８７，６８１号と
の利益を主張し、各々の内容全体は、参照により本明細書に組み込まれる。

[0002] 本開示は、ビデオ符号化（video encoding）およびビデオ復号（video decoding）に関する。

[0003] デジタルビデオ能力は、デジタルテレビジョン、デジタルダイレクトブロードキャストシステム、ワイヤレスブロードキャストシステム、携帯情報端末（ＰＤＡ）、ラップトップまたはデスクトップコンピュータ、タブレットコンピュータ、電子ブックリーダー、デジタルカメラ、デジタル記録デバイス、デジタルメディアプレーヤ、ビデオゲームデバイス、ビデオゲームコンソール、セルラー電話または衛星無線電話、いわゆる「スマートフォン」、ビデオ遠隔会議デバイス、ビデオストリーミングデバイスなどを含む、広範囲のデバイスに組み込まれ得る。デジタルビデオデバイスは、ＭＰＥＧ－２、ＭＰＥＧ－４、ＩＴＵ－ＴＨ．２６３、ＩＴＵ－ＴＨ．２６４／ＭＰＥＧ－４，Ｐａｒｔ１０，アドバンストビデオコーディング（ＡＶＣ）、高効率ビデオコーディング（ＨＥＶＣ：High Efficiency Video Coding）規格、ＩＴＵ－ＴＨ．２６５／高効率ビデオコーディング（ＨＥＶＣ）によって定義された規格、およびそのような規格の拡張に記載されているビデオコーディング技法など、ビデオコーディング技法を実装する。ビデオデバイスは、そのようなビデオコーディング技法を実装することによって、デジタルビデオ情報をより効率的に送信、受信、符号化、復号、および／または記憶し得る。

[0004] ビデオコーディング技法は、ビデオシーケンスに固有の冗長性を低減または除去するための空間（ピクチャ内）予測および／または時間（ピクチャ間）予測を含む。ブロックベースのビデオコーディングでは、ビデオスライス（たとえば、ビデオピクチャまたはビデオピクチャの一部分）が、コーディングツリーユニット（ＣＴＵ：coding tree unit）、コーディングユニット（ＣＵ：coding unit）および／またはコーディングノードと呼ばれることもある、ビデオブロックに区分され得る。ピクチャのイントラコード化（Ｉ）スライス中のビデオブロックは、同じピクチャ中の隣接ブロック中の参照サンプルに対する空間予測を使用して符号化される。ピクチャのインターコード化（ＰまたはＢ）スライス中のビデオブロックは、同じピクチャ中の隣接ブロック中の参照サンプルに対する空間予測、または他の参照ピクチャ中の参照サンプルに対する時間予測を使用し得る。ピクチャはフレームと呼ばれることがあり、参照ピクチャは参照フレームと呼ばれることがある。

[0005] ビデオコーディング（たとえば、ビデオ符号化および／またはビデオ復号）は、一般に、同じピクチャ中のビデオデータ（video data）のすでにコーディングされたブロックからビデオデータのブロックを予測すること（たとえば、イントラ予測）または異なるピクチャ中のビデオデータのすでにコーディングされたブロックからビデオデータのブロックを予測すること（たとえば、インター予測）のいずれかを伴う。いくつかの事例では、ビデオエンコーダはまた、予測ブロック（prediction block）を元のブロックと比較することによって残差データ（residual data）を計算する。したがって、残差データは、ビデオデータの予測ブロックと元のブロックとの間の差分を表す。残差データをシグナリングするために必要とされるビット数を低減するために、ビデオエンコーダは、残差データを変換係数（transform coefficient）に変換し、変換係数を量子化し、変換および量子化された係数（coefficient）を符号化ビットストリーム（encoded bitstream）中でシグナリングする。変換および量子化プロセスによって達成される圧縮は、変換および量子化プロセスが復号ビデオデータにひずみを導入し得ることを意味する、ロッシー（lossy）であり得る。本開示では、変換係数コーディングに関係する技法について説明する。

[0006] ビデオデータを復号する（decode）方法は、第１の復号パス（first decoding pass）のために正規コード化ビン（regular coded bins）のしきい値数（threshold number）を決定することと、係数の第１のセットについて、正規コード化ビンのしきい値数に達するまで、係数グループ（coefficient group）のシンタックス要素（syntax element）のビン（bin）をコンテキスト復号（context decode）することと、ここにおいて、シンタックス要素のコンテキスト復号されたビンが、１つまたは複数の有意性フラグ（significance flag）と、１つまたは複数のパリティレベルフラグ（parity level flag）と、１つまたは複数の第１のフラグ（first flag）とを備え、ここにおいて、１つまたは複数の有意性フラグの各々は、対応する係数の絶対レベル（absolute level）が０に等しいかどうかを示し、１つまたは複数のパリティレベルフラグの各々は、対応する係数の絶対レベルが偶数（even）であるか奇数（odd）であるかを示し、１つまたは複数の第１のフラグの各々は、対応する係数の絶対レベルが２よりも大きいかどうかを示す、シンタックス要素のコンテキスト復号されたビンに基づいて変換ユニット（transform unit）の係数の第１のセットの値を決定することと、正規コード化ビンのしきい値数に達したことに応答して、係数の第２のセットについて、追加のシンタックス要素をバイパス復号（bypass decode）することと、ここにおいて、追加のシンタックス要素をバイパス復号することが、係数の第２のセットのうちの係数について、ライスパラメータ（Rice parameter）の値（value）を導出することを備える、追加のシンタックス要素に基づいて変換ユニットの係数の第２のセットの値を決定することと、ここにおいて、追加のシンタックス要素に基づいて変換ユニットの係数の第２のセットの値を決定することは、ライスパラメータに基づいてゼロパラメータ（zero parameter）の値を決定することと、ここにおいて、ゼロパラメータの値が、０の係数レベル（coefficient level）に対応するコード化値（coded value）を識別する、係数の第２のセットのうちの第１の係数（first coefficient）のための第１のコード化値（first coded value）を受信することと、ゼロパラメータの値と第１の係数のための第１のコード化値とに基づいて、第１の係数のレベル（level）を決定することとを備える、を含む。

[0007] ビデオデータを復号するためのデバイスは、ビデオデータを記憶するように構成されたメモリと、回路中に実装された１つまたは複数のプロセッサとを含み、１つまたは複数のプロセッサは、第１の復号パスのために正規コード化ビンのしきい値数を決定することと、係数の第１のセットについて、正規コード化ビンのしきい値数に達するまで、係数グループのシンタックス要素のビンをコンテキスト復号することと、ここにおいて、シンタックス要素のコンテキスト復号されたビンが、１つまたは複数の有意性フラグと、１つまたは複数のパリティレベルフラグと、１つまたは複数の第１のフラグとを備え、ここにおいて、１つまたは複数の有意性フラグの各々は、対応する係数の絶対レベルが０に等しいかどうかを示し、１つまたは複数のパリティレベルフラグの各々は、対応する係数の絶対レベルが偶数であるか奇数であるかを示し、１つまたは複数の第１のフラグの各々は、対応する係数の絶対レベルが２よりも大きいかどうかを示す、シンタックス要素のコンテキスト復号されたビンに基づいて変換ユニットの係数の第１のセットの値を決定することと、正規コード化ビンのしきい値数に達したことに応答して、係数の第２のセットについて、追加のシンタックス要素をバイパス復号することと、ここにおいて、追加のシンタックス要素をバイパス復号するために、１つまたは複数のプロセッサが、係数の第２のセットのうちの係数について、ライスパラメータの値を導出するように構成された、追加のシンタックス要素に基づいて変換ユニットの係数の第２のセットの値を決定することと、ここにおいて、追加のシンタックス要素に基づいて変換ユニットの係数の第２のセットの値を決定するために、１つまたは複数のプロセッサが、ライスパラメータに基づいてゼロパラメータの値を決定することと、ここにおいて、ゼロパラメータの値が、０の係数レベルに対応するコード化値を識別する、係数の第２のセットのうちの第１の係数のための第１のコード化値を受信すること、ゼロパラメータの値と第１の係数のための第１のコード化値とに基づいて、第１の係数のレベルを決定することとを行うように構成された、を行うように構成される。

[0008] １つまたは複数の例によれば、コンピュータ可読記憶媒体（computer-readable storage medium）が命令（instruction）を記憶し、命令は、１つまたは複数のプロセッサによって実行されたとき、１つまたは複数のプロセッサに、第１の復号パスのために正規コード化ビンのしきい値数を決定することと、係数の第１のセットについて、正規コード化ビンのしきい値数に達するまで、係数グループのシンタックス要素のビンをコンテキスト復号することと、ここにおいて、シンタックス要素のコンテキスト復号されたビンが、１つまたは複数の有意性フラグと、１つまたは複数のパリティレベルフラグと、１つまたは複数の第１のフラグとを備え、ここにおいて、１つまたは複数の有意性フラグの各々は、対応する係数の絶対レベルが０に等しいかどうかを示し、１つまたは複数のパリティレベルフラグの各々は、対応する係数の絶対レベルが偶数であるか奇数であるかを示し、１つまたは複数の第１のフラグの各々は、対応する係数の絶対レベルが２よりも大きいかどうかを示す、シンタックス要素のコンテキスト復号されたビンに基づいて変換ユニットの係数の第１のセットの値を決定することと、正規コード化ビンのしきい値数に達したことに応答して、係数の第２のセットについて、追加のシンタックス要素をバイパス復号することと、ここにおいて、追加のシンタックス要素をバイパス復号するために、命令が、１つまたは複数のプロセッサに、係数の第２のセットのうちの係数について、ライスパラメータの値を導出させる、追加のシンタックス要素に基づいて変換ユニットの係数の第２のセットの値を決定することと、ここにおいて、追加のシンタックス要素に基づいて変換ユニットの係数の第２のセットの値を決定するために、命令が、１つまたは複数のプロセッサに、ライスパラメータに基づいてゼロパラメータの値を決定することと、ここにおいて、ゼロパラメータの値が、０の係数レベルに対応するコード化値を識別する、係数の第２のセットのうちの第１の係数のための第１のコード化値を受信すること、ゼロパラメータの値と第１の係数のための第１のコード化値とに基づいて、第１の係数のレベルを決定することとを行わせる、を行わせる。

[0009] 一例によれば、ビデオデータを復号するための装置（apparatus）は、第１の復号パスのために正規コード化ビンのしきい値数を決定するための手段と、係数の第１のセットについて、正規コード化ビンのしきい値数に達するまで、係数グループのシンタックス要素のビンをコンテキスト復号するための手段と、ここにおいて、シンタックス要素のコンテキスト復号されたビンが、１つまたは複数の有意性フラグと、１つまたは複数のパリティレベルフラグと、１つまたは複数の第１のフラグとを備え、ここにおいて、１つまたは複数の有意性フラグの各々は、対応する係数の絶対レベルが０に等しいかどうかを示し、１つまたは複数のパリティレベルフラグの各々は、対応する係数の絶対レベルが偶数であるか奇数であるかを示し、１つまたは複数の第１のフラグの各々は、対応する係数の絶対レベルが２よりも大きいかどうかを示す、シンタックス要素のコンテキスト復号されたビンに基づいて変換ユニットの係数の第１のセットの値を決定するための手段と、正規コード化ビンのしきい値数に達したことに応答して、係数の第２のセットについて、追加のシンタックス要素をバイパス復号するための手段と、ここにおいて、追加のシンタックス要素をバイパス復号するための手段が、係数の第２のセットのうちの係数について、ライスパラメータの値を導出するための手段を備える、追加のシンタックス要素に基づいて変換ユニットの係数の第２のセットの値を決定するための手段と、ここにおいて、追加のシンタックス要素に基づいて変換ユニットの係数の第２のセットの値を決定するための手段は、ライスパラメータに基づいてゼロパラメータの値を決定するための手段と、ここにおいて、ゼロパラメータの値が、０の係数レベルに対応するコード化値を識別する、係数の第２のセットのうちの第１の係数のための第１のコード化値を受信するための手段と、ゼロパラメータの値と第１の係数のための第１のコード化値とに基づいて、第１の係数のレベルを決定するための手段とを備える、を含む。

[0010] １つまたは複数の例の詳細が添付の図面および以下の説明に記載される。他の特徴、目的、および利点は、説明、図面、および特許請求の範囲から明らかになろう。

[0011] 本開示の技法を実施し得る例示的なビデオ符号化および復号システムを示すブロック図。 [0012] 例示的なクワッドツリーバイナリツリー（ＱＴＢＴ：quadtree binary tree）構造を示す概念図。対応するコーディングツリーユニット（ＣＴＵ）を示す概念図。 [0013] コーディンググループ（ＣＧ：coding group）中の係数のための絶対レベル値を表すシンタックス要素の例示的な順序を示す図。 [0014] 確率モデル（probability model）を選択するために使用されるテンプレートの図。 [0015] Ｐａｒフラグの後の第１のパスにおけるインターリーブされたＧｔ２フラグの例を示す図。 [0016] Ｇｔ１フラグの後の第１のパスにおけるインターリーブされたＧｔ２フラグの例を示す図。 [0017] 第１のコーディングパスにおけるＳＩＧ－Ｇｔ１－Ｐａｒ－Ｇｔ２コーディングについて正規コード化ビン限界（regular coded bin limit）に達した最後の係数の部分コーディングの例を示す図。 [0018] 第１のコーディングパスにおけるＳＩＧ－Ｇｔ１－Ｇｔ２－Ｐａｒコーディングについて正規コード化ビン限界に達した最後の係数の部分コーディングの例を示す図。 [0019] 本開示の技法を実施し得る例示的なビデオエンコーダ（video encoder）を示すブロック図。 [0020] 本開示の技法を実施し得る例示的なビデオデコーダ（video decoder）を示すブロック図。 [0021] バイナリ算術コーディング（binary arithmetic coding）における範囲更新プロセス（range update process）を示す概念図。バイナリ算術コーディングにおける範囲更新プロセスを示す概念図。 [0022] バイナリ算術コーディングにおける出力プロセスを示す概念図。 [0023] ビデオエンコーダ中のコンテキスト適応型バイナリ算術コーディング（ＣＡＢＡＣ：context adaptive binary arithmetic coding）コーダを示すブロック図。 [0024] ビデオデコーダ中のＣＡＢＡＣコーダを示すブロック図。 [0025] ビデオエンコーダの例示的な動作を示すフローチャート。 [0026] ビデオデコーダの例示的な動作を示すフローチャート。 [0027] ビデオデコーダの例示的な動作を示すフローチャート。

[0028] ビデオコーディング（たとえば、ビデオ符号化および／またはビデオ復号）は、一般に、同じピクチャ中のビデオデータのすでにコーディングされたブロックからビデオデータのブロックを予測すること（たとえば、イントラ予測）または異なるピクチャ中のビデオデータのすでにコーディングされたブロックからビデオデータのブロックを予測すること（たとえば、インター予測）のいずれかを伴う。いくつかの事例では、ビデオエンコーダはまた、予測ブロックを元のブロックと比較することによって残差データを計算する。したがって、残差データは、ビデオデータの予測ブロックと元のブロックとの間の差分を表す。残差データをシグナリングするために必要とされるビット数を低減するために、ビデオエンコーダは、残差データを変換および量子化し、変換および量子化された残差データを符号化ビットストリーム中でシグナリングする。変換および量子化プロセスによって達成される圧縮は、変換および量子化プロセスが復号ビデオデータにひずみを導入し得ることを意味する、ロッシーであり得る。

[0029] ビデオデコーダは、予測ブロック単独でよりもぴったり元のビデオブロックに一致する再構築ビデオブロック（reconstructed video block）を生成するために、残差データを復号し、予測ブロックに加算する。残差データの変換および量子化によって導入されるロスにより、再構築ブロック（reconstructed block）は、ひずみまたはアーティファクトを有し得る。アーティファクトまたはひずみの１つの通例のタイプはブロッキネス（blockiness）と呼ばれ、ここで、ビデオデータをコーディングするために使用されるブロックの境界が視認できる。

[0030] 復号ビデオの品質をさらに改善するために、ビデオデコーダは、再構築ビデオブロックに対して１つまたは複数のフィルタ処理演算（filtering operation）を実施することができる。これらのフィルタ処理演算の例は、デブロッキングフィルタ処理、サンプル適応オフセット（ＳＡＯ：sample adaptive offset）フィルタ処理、および適応ループフィルタ処理（ＡＬＦ：adaptive loop filtering）を含む。これらのフィルタ処理演算のためのパラメータは、ビデオエンコーダによって決定され、符号化ビデオビットストリーム中で明示的にシグナリングされるか、またはパラメータが符号化ビデオビットストリーム中で明示的にシグナリングされる必要なしにビデオデコーダによって暗黙的に決定されるかのいずれかであり得る。

[0031] 上記で紹介されたように、ビデオエンコーダは、変換係数を生成するために、残差データを変換する。それらの変換係数はさらに量子化され得る。本開示では、変換係数、または係数という用語は、量子化された変換係数または量子化されていない変換係数のいずれかを指し得る。本開示は、変換係数、たとえば、量子化された変換係数の値をビデオエンコーダからビデオデコーダにシグナリングするための技法について説明する。より詳細には、本開示は、ビットのバイナリ表現を、一連の非バイナリ値の量子化された変換係数にコンバートするエントロピー復号プロセスに関係する技法について説明する。概してエントロピー復号の逆プロセスである、対応するエントロピー符号化プロセスについても本開示において説明される。

[0032] 一例では、本開示は、係数のブロックのための係数レベルの残りの絶対値をコーディングするためのコード、たとえば、ゴロムライスコード（Golomb-Rice code）または指数ゴロムコード（Exponential-Golomb code）を定義するために使用されるライスパラメータを決定するための技法について説明し、ここで、１よりも大きい係数レベル、および２よりも大きい係数レベルなどの有意係数（significant coefficient）の他のインジケーションをコーディングするためにコンテキスト適応型バイナリ算術コーディング（ＣＡＢＡＣ）が使用される。係数レベルは、ロッシーコーディングの場合、変換係数のレベルであるか、あるいは変換スキップモード（transform skip mode）におけるロスレスコーディング（lossless coding）またはロッシーコーディングの場合、変換がそれに適用されない係数（すなわち、残差ピクセル値）のレベルであり得る。以下でより詳細に説明されるように、係数レベルは、係数レベルの絶対値または係数レベルの残存レベル（remaining level）のいずれかであり得る。

[0033] ライスパラメータは、ゴロムコードのファミリー、たとえば、ゴロムライスコードまたは指数ゴロムコードからコードワードセットを選択するために使用される調節可能な値である。ライスパラメータによって定義されるコードは、変換ユニット（ＴＵ：transform unit）または係数グループ（ＣＧ）、すなわち、係数のブロック中の少なくとも１つの係数のための係数レベルの残りの絶対値をコーディングするために使用され得る。ＣＧの各々は、ビデオデータの４×４変換ブロック（transform block）、または変換ブロックの４×４サブブロックであり得る。ＣＧは、ロッシーコーディングの場合、変換係数を含むか、あるいは変換スキップモードにおけるロスレスコーディングまたはロッシーコーディングの場合、変換がそれに適用されない係数を含み得る。

[0034] 本開示は、ライスパラメータに基づいてゼロパラメータの値を決定するための技法についてさらに説明する。ゼロパラメータは、０の係数レベルに対応するビットストリーム値を表す。係数レベルが０である確率が比較的低い場合、より短いコードワードが非０値のために使用され得るように、より長いコードワードまたはビットストリーム値は０の係数レベルに割り当てられ得る。本開示の技法は、係数レベルのコーディングにおいてビットが節約され得るように、ゼロパラメータの選択を改善することによってビデオ圧縮を改善し得る。

[0035] 本開示の技法は、高効率ビデオコーディング（ＨＥＶＣ：High Efficiency Video Coding）など、既存のビデオコーデックのいずれかに適用され得るか、または現在開発中であるかもしくはまたは他の将来ビデオコーディング規格のための汎用ビデオコーディング（ＶＶＣ：Versatile Video Coding）など、新しいビデオコーディング規格のための有望なコーディングツールとして提案され得る。

[0036] 図１は、本開示の技法を実施し得る例示的なビデオ符号化および復号システム１００を示すブロック図である。本開示の技法は、概して、ビデオデータをコーディング（符号化および／または復号）することを対象とする。概して、ビデオデータは、ビデオを処理するための何らかのデータを含む。したがって、ビデオデータは、生の符号化されていないビデオ、符号化されたビデオ、復号された（たとえば、再構築された）ビデオ、およびシグナリングデータなどのビデオメタデータ（video metadata）を含み得る。

[0037] 図１に示されているように、システム１００は、この例では、宛先デバイス１１６によって復号および表示されるべき符号化ビデオデータを提供するソースデバイス１０２を含む。特に、ソースデバイス１０２は、コンピュータ可読媒体１１０を介して宛先デバイス１１６にビデオデータを提供する。ソースデバイス１０２と宛先デバイス１１６とは、デスクトップコンピュータ、ノートブック（すなわち、ラップトップ）コンピュータ、タブレットコンピュータ、セットトップボックス、スマートフォンなどの電話ハンドセット、テレビジョン、カメラ、ディスプレイデバイス、デジタルメディアプレーヤ、ビデオゲームコンソール、ビデオストリーミングデバイスなどを含む、広範囲のデバイスのいずれかを備え得る。いくつかの場合には、ソースデバイス１０２と宛先デバイス１１６とは、ワイヤレス通信のために装備され得、したがって、ワイヤレス通信デバイスと呼ばれることがある。

[0038] 図１の例では、ソースデバイス１０２は、ビデオソース１０４と、メモリ１０６と、ビデオエンコーダ２００と、出力インターフェース１０８とを含む。宛先デバイス１１６は、入力インターフェース１２２と、ビデオデコーダ３００と、メモリ１２０と、ディスプレイデバイス１１８とを含む。本開示によれば、ソースデバイス１０２のビデオエンコーダ２００と、宛先デバイス１１６のビデオデコーダ３００とは、本明細書において説明される係数コーディングのための技法を適用するように構成され得る。したがって、ソースデバイス１０２はビデオ符号化デバイスの例を表し、宛先デバイス１１６はビデオ復号デバイスの例を表す。他の例では、ソースデバイスと宛先デバイスとは、他の構成要素または配置を含み得る。たとえば、ソースデバイス１０２は、外部カメラなどの外部ビデオソースからビデオデータを受信し得る。同様に、宛先デバイス１１６は、一体型ディスプレイデバイスを含むのではなく、外部ディスプレイデバイスとインターフェースし得る。

[0039] 図１に示されているシステム１００は一例にすぎない。概して、どんなデジタルビデオ符号化および／または復号デバイスも、本明細書において説明される係数コーディングのための技法を実施し得る。ソースデバイス１０２と宛先デバイス１１６とは、ソースデバイス１０２が宛先デバイス１１６への送信のためにコード化ビデオデータを生成するようなコーディングデバイス（coding device）の例にすぎない。本開示は、「コーディング」デバイスを、データのコーディング（符号化および／または復号）を実施するデバイスとして参照する。したがって、ビデオエンコーダ２００とビデオデコーダ３００とは、コーディングデバイス、特に、それぞれビデオエンコーダとビデオデコーダとの例を表す。いくつかの例では、ソースデバイス１０２と宛先デバイス１１６とは、ソースデバイス１０２と宛先デバイス１１６との各々がビデオ符号化および復号構成要素を含むように、実質的に対称的に動作し得る。したがって、システム１００は、たとえば、ビデオストリーミング、ビデオ再生、ビデオブロードキャスティング、またはビデオテレフォニーのための、ソースデバイス１０２と宛先デバイス１１６との間の一方向または双方向ビデオ送信をサポートし得る。

[0040] 概して、ビデオソース１０４は、ビデオデータ（すなわち、生の符号化されていないビデオデータ）のソースを表し、ビデオデータの連続的な一連のピクチャ（「フレーム」とも呼ばれる）をビデオエンコーダ２００に提供し、ビデオエンコーダ２００は、ピクチャのためにデータを符号化する。ソースデバイス１０２のビデオソース１０４は、ビデオカメラ、以前にキャプチャされた生のビデオを含んでいるビデオアーカイブ、および／またはビデオコンテンツプロバイダからビデオを受信するためのビデオフィードインターフェースなど、ビデオキャプチャデバイスを含み得る。さらなる代替として、ビデオソース１０４は、ソースビデオとして、コンピュータグラフィックスベースのデータ、またはライブビデオとアーカイブビデオとコンピュータ生成ビデオとの組合せを生成し得る。各場合において、ビデオエンコーダ２００は、キャプチャされたビデオ、プリキャプチャされたビデオ、またはコンピュータ生成されたビデオデータを符号化する。ビデオエンコーダ２００は、ピクチャを、（「表示順序」と呼ばれることがある）受信順序から、コーディングのためのコーディング順序に並べ替え得る。ビデオエンコーダ２００は、符号化ビデオデータを含むビットストリームを生成し得る。ソースデバイス１０２は、次いで、たとえば、宛先デバイス１１６の入力インターフェース１２２による受信および／または取出しのために、出力インターフェース１０８を介して符号化ビデオデータをコンピュータ可読媒体１１０上に出力し得る。

[0041] ソースデバイス１０２のメモリ１０６と、宛先デバイス１１６のメモリ１２０とは、汎用メモリを表す。いくつかの例では、メモリ１０６、１２０は、生のビデオデータ、たとえば、ビデオソース１０４からの生のビデオ、およびビデオデコーダ３００からの生の復号ビデオデータを記憶し得る。追加または代替として、メモリ１０６、１２０は、たとえば、それぞれ、ビデオエンコーダ２００とビデオデコーダ３００とによって実行可能なソフトウェア命令を記憶し得る。メモリ１０６とメモリ１２０とは、この例ではビデオエンコーダ２００とビデオデコーダ３００とは別個に示されているが、ビデオエンコーダ２００とビデオデコーダ３００とは、機能的に同様または等価な目的で内部メモリをも含み得ることを理解されたい。さらに、メモリ１０６、１２０は、符号化ビデオデータ、たとえば、ビデオエンコーダ２００からの出力、およびビデオデコーダ３００への入力を記憶し得る。いくつかの例では、メモリ１０６、１２０の部分は、たとえば、生の復号および／または符号化ビデオデータを記憶するために、１つまたは複数のビデオバッファとして割り振られ得る。

[0042] コンピュータ可読媒体１１０は、ソースデバイス１０２から宛先デバイス１１６に符号化ビデオデータを移送することが可能な任意のタイプの媒体またはデバイスを表し得る。一例では、コンピュータ可読媒体１１０は、ソースデバイス１０２が、たとえば、無線周波数ネットワークまたはコンピュータベースのネットワークを介して、符号化ビデオデータを宛先デバイス１１６にリアルタイムで直接送信することを可能にするための通信媒体を表す。出力インターフェース１０８は、符号化ビデオデータを含む送信信号を変調し得、入力インターフェース１２２は、ワイヤレス通信プロトコルなどの通信規格に従って、受信された送信信号を復調し得る。通信媒体は、無線周波数（ＲＦ）スペクトルあるいは１つまたは複数の物理伝送線路など、任意のワイヤレスまたはワイヤード通信媒体を備え得る。通信媒体は、ローカルエリアネットワーク、ワイドエリアネットワーク、またはインターネットなどのグローバルネットワークなど、パケットベースのネットワークの一部を形成し得る。通信媒体は、ルータ、スイッチ、基地局、またはソースデバイス１０２から宛先デバイス１１６への通信を容易にするために有用であり得る任意の他の機器を含み得る。

[0043] いくつかの例では、ソースデバイス１０２は、出力インターフェース１０８から記憶デバイス１１２に符号化データを出力し得る。同様に、宛先デバイス１１６は、入力インターフェース１２２を介して記憶デバイス１１２から符号化データにアクセスし得る。記憶デバイス１１２は、ハードドライブ、Ｂｌｕ－ｒａｙ（登録商標）ディスク、ＤＶＤ、ＣＤ－ＲＯＭ、フラッシュメモリ、揮発性または不揮発性メモリ、あるいは符号化ビデオデータを記憶するための任意の他の好適なデジタル記憶媒体など、様々な分散されたまたはローカルにアクセスされるデータ記憶媒体のいずれかを含み得る。

[0044] いくつかの例では、ソースデバイス１０２は、ソースデバイス１０２によって生成された符号化ビデオを記憶し得るファイルサーバ１１４または別の中間記憶デバイスに符号化ビデオデータを出力し得る。宛先デバイス１１６は、ストリーミングまたはダウンロードを介して、ファイルサーバ１１４から、記憶されたビデオデータにアクセスし得る。ファイルサーバ１１４は、符号化ビデオデータを記憶し、その符号化ビデオデータを宛先デバイス１１６に送信することが可能な任意のタイプのサーバデバイスであり得る。ファイルサーバ１１４は、（たとえば、ウェブサイト用の）ウェブサーバ、ファイル転送プロトコル（ＦＴＰ）サーバ、コンテンツ配信ネットワークデバイス、またはネットワーク接続ストレージ（ＮＡＳ）デバイスを表し得る。宛先デバイス１１６は、インターネット接続を含む、任意の標準データ接続を通してファイルサーバ１１４から符号化ビデオデータにアクセスし得る。これは、ファイルサーバ１１４に記憶された符号化ビデオデータにアクセスするのに好適であるワイヤレスチャネル（たとえば、Ｗｉ－Ｆｉ（登録商標）接続）、ワイヤード接続（たとえば、デジタル加入者線（ＤＳＬ）、ケーブルモデムなど）、またはその両方の組合せを含み得る。ファイルサーバ１１４と入力インターフェース１２２とは、ストリーミング送信プロトコル、ダウンロード送信プロトコル、またはそれらの組合せに従って動作するように構成され得る。

[0045] 出力インターフェース１０８と入力インターフェース１２２とは、ワイヤレス送信機／受信機、モデム、ワイヤードネットワーキング構成要素（たとえば、イーサネット（登録商標）カード）、様々なＩＥＥＥ８０２．１１規格のいずれかに従って動作するワイヤレス通信構成要素、または他の物理的構成要素を表し得る。出力インターフェース１０８と入力インターフェース１２２とがワイヤレス構成要素を備える例では、出力インターフェース１０８と入力インターフェース１２２とは、４Ｇ、４Ｇ－ＬＴＥ（登録商標）（ロングタームエボリューション）、ＬＴＥアドバンスト、５Ｇなど、セルラー通信規格に従って、符号化ビデオデータなどのデータを転送するように構成され得る。出力インターフェース１０８がワイヤレス送信機を備えるいくつかの例では、出力インターフェース１０８と入力インターフェース１２２とは、ＩＥＥＥ８０２．１１仕様、ＩＥＥＥ８０２．１５仕様（たとえば、ＺｉｇＢｅｅ（登録商標））、Ｂｌｕｅｔｏｏｔｈ（登録商標）規格など、他のワイヤレス規格に従って、符号化ビデオデータなどのデータを転送するように構成され得る。いくつかの例では、ソースデバイス１０２および／または宛先デバイス１１６は、それぞれのシステムオンチップ（ＳｏＣ）デバイスを含み得る。たとえば、ソースデバイス１０２は、ビデオエンコーダ２００および／または出力インターフェース１０８に帰属する機能を実施するためのＳｏＣデバイスを含み得、宛先デバイス１１６は、ビデオデコーダ３００および／または入力インターフェース１２２に帰属する機能を実施するためのＳｏＣデバイスを含み得る。

[0046] 本開示の技法は、オーバージエアテレビジョン放送、ケーブルテレビジョン送信、衛星テレビジョン送信、動的適応ストリーミングオーバーＨＴＴＰ（ＤＡＳＨ）などのインターネットストリーミングビデオ送信、データ記憶媒体上に符号化されたデジタルビデオ、データ記憶媒体に記憶されたデジタルビデオの復号、または他の適用例など、様々なマルチメディア適用例のいずれかをサポートするビデオコーディングに適用され得る。

[0047] 宛先デバイス１１６の入力インターフェース１２２は、コンピュータ可読媒体１１０（たとえば、通信媒体、記憶デバイス１１２、ファイルサーバ１１４など）から符号化ビデオビットストリームを受信する。符号化ビデオビットストリームは、ビデオブロックまたは他のコード化ユニット（たとえば、スライス、ピクチャ、ピクチャのグループ、シーケンスなど）の特性および／または処理を記述する値を有するシンタックス要素など、ビデオデコーダ３００によっても使用される、ビデオエンコーダ２００によって定義されるシグナリング情報を含み得る。ディスプレイデバイス１１８は、復号ビデオデータの復号ピクチャ（decoded picture）をユーザに表示する。ディスプレイデバイス１１８は、陰極線管（ＣＲＴ）、液晶ディスプレイ（ＬＣＤ）、プラズマディスプレイ、有機発光ダイオード（ＯＬＥＤ）ディスプレイ、または別のタイプのディスプレイデバイスなど、様々なディスプレイデバイスのいずれかを表し得る。

[0048] 図１には示されていないが、いくつかの例では、ビデオエンコーダ２００とビデオデコーダ３００とは各々、オーディオエンコーダおよび／またはオーディオデコーダと統合され得、共通のデータストリーム中にオーディオとビデオの両方を含む多重化ストリームを処理するために、適切なＭＵＸ－ＤＥＭＵＸユニット、あるいは他のハードウェアおよび／またはソフトウェアを含み得る。適用可能な場合、ＭＵＸ－ＤＥＭＵＸユニットは、ＩＴＵＨ．２２３マルチプレクサプロトコル、またはユーザデータグラムプロトコル（ＵＤＰ）などの他のプロトコルに準拠し得る。

[0049] ビデオエンコーダ２００とビデオデコーダ３００とは各々、１つまたは複数のマイクロプロセッサ、デジタル信号プロセッサ（ＤＳＰ）、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、ディスクリート論理、ソフトウェア、ハードウェア、ファームウェアなど、様々な好適なエンコーダおよび／またはデコーダ回路のいずれか、あるいはそれらの任意の組合せとして実装され得る。本技法が部分的にソフトウェアで実装されるとき、デバイスは、好適な非一時的コンピュータ可読媒体にソフトウェアの命令を記憶し、本開示の技法を実施するために１つまたは複数のプロセッサを使用してその命令をハードウェアで実行し得る。ビデオエンコーダ２００とビデオデコーダ３００との各々は、１つまたは複数のエンコーダまたはデコーダに含まれ得、両者のいずれかがそれぞれのデバイス中に複合エンコーダ／デコーダ（ＣＯＤＥＣ）の一部として組み込まれ得る。ビデオエンコーダ２００および／またはビデオデコーダ３００を含むデバイスは、集積回路、マイクロプロセッサ、および／またはセルラー電話機などのワイヤレス通信デバイスを備え得る。

[0050] ビデオエンコーダ２００とビデオデコーダ３００とは、高効率ビデオコーディング（ＨＥＶＣ）とも呼ばれるＩＴＵ－ＴＨ．２６５などのビデオコーディング規格、あるいはマルチビューおよび／またはスケーラブルビデオコーディング拡張などのそれの拡張に従って動作し得る。代替的に、ビデオエンコーダ２００とビデオデコーダ３００とは、共同探査テストモデル（ＪＥＭ：Joint Exploration Test Model）、または汎用ビデオコーディング（ＶＶＣ）とも呼ばれるＩＴＵ－ＴＨ．２６６など、他のプロプライエタリ（proprietary）または業界規格に従って動作し得る。ＶＶＣ規格の最近のドラフトは、Ｂｒｏｓｓら、「ＶｅｒｓａｔｉｌｅＶｉｄｅｏＣｏｄｉｎｇ（Ｄｒａｆｔ６）」、ＩＴＵ－ＴＳＧ１６ＷＰ３とＩＳＯ／ＩＥＣＪＴＣ１／ＳＣ２９／ＷＧ１１とのジョイントビデオエキスパートチーム（ＪＶＥＴ）、第１５回会合：ヨーテボリ、ＳＥ、２０１９年７月３～１２日、ＪＶＥＴ－Ｏ２００１－ｖＥ（以下、「ＶＶＣドラフト６」）に記載されている。ただし、本開示の技法は、いかなる特定のコーディング規格にも限定されない。

[0051] 概して、ビデオエンコーダ２００とビデオデコーダ３００とは、ピクチャのブロックベースのコーディングを実施し得る。「ブロック」という用語は、処理されるべき（たとえば、符号化されるべき、復号されるべき、あるいは符号化および／または復号プロセスにおいて他の方法で使用されるべき）データを含む構造を一般に意味する。たとえば、ブロックは、ルミナンスおよび／またはクロミナンスデータのサンプルの２次元行列を含み得る。概して、ビデオエンコーダ２００とビデオデコーダ３００とは、ＹＵＶ（たとえば、Ｙ、Ｃｂ、Ｃｒ）フォーマットで表されるビデオデータをコーディングし得る。すなわち、ピクチャのサンプルのために赤色、緑色、および青色（ＲＧＢ）データをコーディングするのではなく、ビデオエンコーダ２００とビデオデコーダ３００とは、ルミナンス成分とクロミナンス成分とをコーディングし得、ここで、クロミナンス成分は、赤色相と青色相の両方のクロミナンス成分を含み得る。いくつかの例では、ビデオエンコーダ２００は、符号化より前に、受信されたＲＧＢフォーマット付きデータをＹＵＶ表現にコンバートし、ビデオデコーダ３００は、ＹＵＶ表現をＲＧＢフォーマットにコンバートする。代替的に、前処理および後処理ユニット（図示されず）が、これらのコンバージョンを実施し得る。

[0052] 本開示は、概して、ピクチャのコーディング（たとえば、符号化および復号）を、ピクチャのデータを符号化または復号するプロセスを含むように参照し得る。同様に、本開示は、ピクチャのブロックのコーディングを、ブロックのデータを符号化または復号するプロセス、たとえば、予測および／または残差コーディングを含むように参照し得る。符号化ビデオビットストリームは、概して、コーディング決定（たとえば、コーディングモード）とブロックへのピクチャの区分とを表すシンタックス要素の一連の値を含む。したがって、ピクチャまたはブロックをコーディングすることへの参照は、概して、ピクチャまたはブロックを形成しているシンタックス要素の値をコーディングすることとして理解されたい。

[0053] ＨＥＶＣは、コーディングユニット（ＣＵ）、予測ユニット（ＰＵ：prediction unit）および変換ユニット（ＴＵ）を含む、様々なブロックを定義する。ＨＥＶＣに従って、（ビデオエンコーダ２００などの）ビデオコーダ（video coder）は、クワッドツリー構造に従ってコーディングツリーユニット（ＣＴＵ）をＣＵに区分する。すなわち、ビデオコーダは、ＣＴＵとＣＵとを４つの等しい重複しない正方形に区分し、クワッドツリーの各ノードは、０個または４個のいずれかの子ノードを有する。子ノードなしのノードは「リーフノード」と呼ばれることがあり、そのようなリーフノードのＣＵは、１つまたは複数のＰＵならびに／あるいは１つまたは複数のＴＵを含み得る。ビデオコーダは、ＰＵとＴＵとをさらに区分し得る。たとえば、ＨＥＶＣでは、残差クワッドツリー（ＲＱＴ）は、ＴＵの区分を表す。ＨＥＶＣでは、ＰＵはインター予測データを表すが、ＴＵは残差データを表す。イントラ予測されるＣＵは、イントラモードインジケーションなどのイントラ予測情報を含む。

[0054] 別の例として、ビデオエンコーダ２００とビデオデコーダ３００とは、ＪＥＭまたはＶＶＣに従って動作するように構成され得る。ＪＥＭまたはＶＶＣに従って、（ビデオエンコーダ２００などの）ビデオコーダは、ピクチャを複数のコーディングツリーユニット（ＣＴＵ）に区分する。ビデオエンコーダ２００は、クワッドツリーバイナリツリー（ＱＴＢＴ）構造またはマルチタイプツリー（ＭＴＴ：Multi-Type Tree）構造など、ツリー構造に従ってＣＴＵを区分し得る。ＱＴＢＴ構造は、ＨＥＶＣのＣＵとＰＵとＴＵとの間の分離など、複数の区分タイプの概念を除去する。ＱＴＢＴ構造は、クワッドツリー区分に従って区分される第１のレベル、およびバイナリツリー区分に従って区分される第２のレベルという、２つのレベルを含む。ＱＴＢＴ構造のルートノードはＣＴＵに対応する。バイナリツリーのリーフノードはコーディングユニット（ＣＵ）に対応する。

[0055] ＭＴＴ区分構造では、ブロックは、クワッドツリー（ＱＴ）区分と、バイナリツリー（ＢＴ）区分と、１つまたは複数のタイプのトリプルツリー（ＴＴ）（ターナリツリー（ＴＴ）とも呼ばれる）区分とを使用して区分され得る。トリプルまたはターナリツリー区分は、ブロックが３つのサブブロックにスプリットされる区分である。いくつかの例では、トリプルまたはターナリツリー区分は、中心を通して元のブロックを分割することなしにブロックを３つのサブブロックに分割する。ＭＴＴにおける区分タイプ（たとえば、ＱＴ、ＢＴ、およびＴＴ）は、対称的または非対称的であり得る。

[0056] いくつかの例では、ビデオエンコーダ２００とビデオデコーダ３００とは、ルミナンス成分とクロミナンス成分との各々を表すために単一のＱＴＢＴまたはＭＴＴ構造を使用し得、他の例では、ビデオエンコーダ２００とビデオデコーダ３００とは、ルミナンス成分のための１つのＱＴＢＴ／ＭＴＴ構造、および両方のクロミナンス成分のための別のＱＴＢＴ／ＭＴＴ構造（またはそれぞれのクロミナンス成分のための２つのＱＴＢＴ／ＭＴＴ構造）など、２つ以上のＱＴＢＴまたはＭＴＴ構造を使用し得る。

[0057] ビデオエンコーダ２００とビデオデコーダ３００とは、ＨＥＶＣごとのクワッドツリー区分、ＱＴＢＴ区分、ＭＴＴ区分、または他の区分構造を使用するように構成され得る。説明の目的で、本開示の技法の説明はＱＴＢＴ区分に関して提示される。しかしながら、本開示の技法は、クワッドツリー区分、または同様に他のタイプの区分を使用するように構成されたビデオコーダにも適用され得ることを理解されたい。

[0058] ブロック（たとえば、ＣＴＵまたはＣＵ）は、ピクチャ中で様々な仕方でグループ化され得る。一例として、ブリックは、ピクチャ中の特定のタイル内のＣＴＵ行の矩形領域を参照し得る。タイルは、ピクチャ中の特定のタイル列と特定のタイル行との内のＣＴＵの矩形領域であり得る。タイル列は、ピクチャの高さに等しい高さと、（たとえば、ピクチャパラメータセット中などの）シンタックス要素によって指定された幅とを有するＣＴＵの矩形領域を参照する。タイル行は、（たとえば、ピクチャパラメータセット中などの）シンタックス要素によって指定された高さと、ピクチャの幅に等しい幅とを有するＣＴＵの矩形領域を参照する。

[0059] いくつかの例では、タイルは複数のブリックに区分され得、それらの各々は、タイル内に１つまたは複数のＣＴＵ行を含み得る。複数のブリックに区分されないタイルもブリックと呼ばれることがある。しかしながら、タイルの真のサブセットであるブリックは、タイルとは呼ばれないことがある。

[0060] ピクチャ中のブリックはまた、スライス中に配置され得る。スライスは、もっぱら単一のネットワークアブストラクションレイヤ（ＮＡＬ：network abstraction layer）ユニット中に含まれていることがあるピクチャの整数個のブリックであり得る。いくつかの例では、スライスは、いくつかの完全なタイル、または１つのタイルの完全なブリックの連続シーケンスのみのいずれかを含む。

[0061] 本開示では、たとえば、１６×１６サンプルまたは１６個ずつの１６個のサンプルなど、垂直寸法と水平寸法とに関して、（ＣＵまたは他のビデオブロックなどの）ブロックのサンプル寸法を参照するために「Ｎ×Ｎ」と「Ｎ個ずつのＮ個の」とを互換的に使用し得る。一般に、１６×１６ＣＵは、垂直方向に１６個のサンプルを有し（ｙ＝１６）、水平方向に１６個のサンプルを有する（ｘ＝１６）。同様に、Ｎ×ＮＣＵは、一般に、垂直方向にＮ個のサンプルを有し、水平方向にＮ個のサンプルを有し、ここで、Ｎは非負整数値を表す。ＣＵ中のサンプルは、行と列とに配置され得る。さらに、ＣＵは、必ずしも、水平方向において垂直方向と同じ数のサンプルを有する必要があるとは限らない。たとえば、ＣＵはＮ×Ｍサンプルを備え得、ここで、Ｍは必ずしもＮに等しいとは限らない。

[0062] ビデオエンコーダ２００は、予測および／または残差情報、ならびに他の情報を表すＣＵのためにビデオデータを符号化する。予測情報は、ＣＵについて予測ブロックを形成するためにＣＵがどのように予測されるべきかを示す。残差情報は、概して、符号化より前のＣＵのサンプルと予測ブロックとの間のサンプルごとの差分を表す。

[0063] ＣＵを予測するために、ビデオエンコーダ２００は、概して、インター予測またはイントラ予測を通してＣＵについて予測ブロックを形成し得る。インター予測は、概して、以前にコーディングされたピクチャのデータからＣＵを予測することを指し、一方、イントラ予測は、概して、同じピクチャの以前にコーディングされたデータからＣＵを予測することを指す。インター予測を実施するために、ビデオエンコーダ２００は、１つまたは複数の動きベクトルを使用して予測ブロックを生成し得る。ビデオエンコーダ２００は、概して、たとえば、ＣＵと参照ブロックとの間の差分に関して、ＣＵにぴったり一致する参照ブロックを識別するために動き探索を実施し得る。ビデオエンコーダ２００は、参照ブロックが現在ＣＵにぴったり一致するかどうかを決定するために、絶対差分和（ＳＡＤ）、２乗差分和（ＳＳＤ）、平均絶対差（ＭＡＤ）、平均２乗差（ＭＳＤ）、または他のそのような差分計算を使用して差分メトリックを計算し得る。いくつかの例では、ビデオエンコーダ２００は、単方向予測または双方向予測を使用して現在ＣＵを予測し得る。

[0064] ＪＥＭとＶＶＣとのいくつかの例はまた、インター予測モードと考えられ得る、アフィン動き補償モードを提供する。アフィン動き補償モードでは、ビデオエンコーダ２００は、ズームインまたはアウト、回転、パースペクティブの動き、あるいは他の変則の動きタイプなど、非並進の動きを表す２つ以上の動きベクトルを決定し得る。

[0065] イントラ予測を実施するために、ビデオエンコーダ２００は、予測ブロックを生成するようにイントラ予測モードを選択し得る。ＪＥＭとＶＶＣとのいくつかの例は、様々な方向性モード、ならびに平面モードおよびＤＣモードを含む、６７個のイントラ予測モードを提供する。概して、ビデオエンコーダ２００は、現在ブロック（たとえば、ＣＵのブロック）のサンプルをそれから予測すべき、現在ブロックに対する隣接サンプルを記述するイントラ予測モードを選択する。そのようなサンプルは、ビデオエンコーダ２００がラスタ走査順序で（左から右に、上から下に）ＣＴＵとＣＵとをコーディングすると仮定すると、概して、現在ブロックと同じピクチャ中の現在ブロックの上方、上方および左側、または左側にあり得る。

[0066] ビデオエンコーダ２００は、現在ブロックについて予測モードを表すデータを符号化する。たとえば、インター予測モードでは、ビデオエンコーダ２００は、様々な利用可能なインター予測モードのうちのどれが使用されるか、ならびに対応するモードの動き情報を表すデータを符号化し得る。たとえば、単方向または双方向インター予測では、ビデオエンコーダ２００は、高度動きベクトル予測（ＡＭＶＰ：advanced motion vector prediction）またはマージモードを使用して動きベクトルを符号化し得る。ビデオエンコーダ２００は、アフィン動き補償モードの動きベクトルを符号化するために同様のモードを使用し得る。

[0067] ブロックのイントラ予測またはインター予測などの予測に続いて、ビデオエンコーダ２００は、ブロックについて残差データを計算し得る。残差ブロック（residual block）などの残差データは、ブロックと、対応する予測モードを使用して形成された、ブロックについての予測ブロックとの間の、サンプルごとの差分を表す。ビデオエンコーダ２００は、サンプル領域ではなく変換領域中に変換データを生成するために、残差ブロックに１つまたは複数の変換を適用し得る。たとえば、ビデオエンコーダ２００は、離散コサイン変換（ＤＣＴ）、整数変換、ウェーブレット変換、または概念的に同様の変換を残差ビデオデータに適用し得る。さらに、ビデオエンコーダ２００は、モード依存非分離可能２次変換（ＭＤＮＳＳＴ：mode-dependent non-separable secondary transform）、信号依存変換、カルーネンレーベ変換（ＫＬＴ：Karhunen-Loeve transform）など、第１の変換に続いて２次変換を適用し得る。ビデオエンコーダ２００は、１つまたは複数の変換の適用に続いて変換係数を生成する。

[0068] 上述のように、変換係数を生成するための任意の変換に続いて、ビデオエンコーダ２００は、変換係数の量子化を実施し得る。量子化は、一般に、変換係数を表すために使用されるデータの量をできるだけ低減させるために変換係数が量子化され、さらなる圧縮を実現するプロセスを指す。量子化プロセスを実施することによって、ビデオエンコーダ２００は、変換係数の一部または全部に関連するビット深度を低減し得る。たとえば、ビデオエンコーダ２００は、量子化中にｎビット値をｍビット値に切り捨て得、ここで、ｎはｍよりも大きい。いくつかの例では、量子化を実施するために、ビデオエンコーダ２００は、量子化されるべき値のビット単位の右シフトを実施し得る。

[0069] 量子化に続いて、ビデオエンコーダ２００は、変換係数を走査して、量子化された変換係数を含む２次元行列から１次元ベクトルを生成し得る。走査は、より高いエネルギー（したがって、より低い頻度）の変換係数をベクトルの前方に配置し、より低いエネルギー（したがって、より高い頻度）の変換係数をベクトルの後方に配置するように設計され得る。いくつかの例では、ビデオエンコーダ２００は、あらかじめ定義された走査順序を利用して、量子化された変換係数を走査してシリアル化ベクトルを生成し、次いで、ベクトルの量子化された変換係数をエントロピー符号化し得る。他の例では、ビデオエンコーダ２００は適応型走査を実施し得る。量子化された変換係数を走査して１次元ベクトルを形成した後に、ビデオエンコーダ２００は、たとえば、コンテキスト適応型バイナリ算術コーディング（ＣＡＢＡＣ）に従って、１次元ベクトルをエントロピー符号化し得る。ビデオエンコーダ２００はまた、ビデオデータを復号する際のビデオデコーダ３００による使用のために、符号化ビデオデータに関連付けられたメタデータを記述するシンタックス要素の値をエントロピー符号化し得る。

[0070] ＣＡＢＡＣを実施するために、ビデオエンコーダ２００は、コンテキストモデル内のコンテキストを、送信されるべきシンボルに割り当て得る。コンテキストは、たとえば、シンボルの隣接値が０値であるか否かに関係し得る。確率決定は、シンボルに割り当てられたコンテキストに基づき得る。

[0071] ビデオエンコーダ２００は、さらに、ブロックベースのシンタックスデータ、ピクチャベースのシンタックスデータ、およびシーケンスベースのシンタックスデータなどのシンタックスデータを、たとえば、ピクチャヘッダ、ブロックヘッダ、スライスヘッダ、あるいはシーケンスパラメータセット（ＳＰＳ）、ピクチャパラメータセット（ＰＰＳ）、またはビデオパラメータセット（ＶＰＳ）などの他のシンタックスデータ中で、ビデオデコーダ３００に対して生成し得る。ビデオデコーダ３００は、対応するビデオデータをどのように復号すべきかを決定するために、そのようなシンタックスデータを同様に復号し得る。

[0072] このようにして、ビデオエンコーダ２００は、符号化ビデオデータ、たとえば、ブロック（たとえば、ＣＵ）へのピクチャの区分ならびにブロックの予測および／または残差情報を記述するシンタックス要素を含むビットストリームを生成し得る。最終的に、ビデオデコーダ３００は、ビットストリームを受信し、符号化ビデオデータを復号し得る。

[0073] 概して、ビデオデコーダ３００は、ビットストリームの符号化ビデオデータを復号するために、ビデオエンコーダ２００によって実施されたものの逆プロセスを実施する。たとえば、ビデオデコーダ３００は、ビデオエンコーダ２００のＣＡＢＡＣ符号化プロセスと逆ではあるが、それと実質的に同様の様式でＣＡＢＡＣを使用してビットストリームのシンタックス要素の値を復号し得る。シンタックス要素は、ＣＴＵのＣＵを定義するために、ＣＴＵへのピクチャの区分情報と、ＱＴＢＴ構造などの対応する区分構造に従う、各ＣＴＵの区分とを定義し得る。シンタックス要素は、ビデオデータのブロック（たとえば、ＣＵ）についての予測および残差情報をさらに定義し得る。

[0074] 残差情報は、たとえば、量子化された変換係数によって表され得る。ビデオデコーダ３００は、ブロックの残差ブロックを再生するために、ブロックの量子化された変換係数を逆量子化し、逆変換し得る。ビデオデコーダ３００は、ブロックの予測ブロックを形成するために、シグナリングされた予測モード（イントラまたはインター予測）と、関係する予測情報（たとえば、インター予測のための動き情報）とを使用する。ビデオデコーダ３００は、次いで、（サンプルごとに）予測ブロックと残差ブロックとを組み合わせて、元のブロックを再生し得る。ビデオデコーダ３００は、ブロックの境界に沿って視覚的アーティファクトを低減するためにデブロッキングプロセスを実施することなど、追加の処理を実施し得る。

[0075] 本開示は、概して、シンタックス要素など、ある情報を「シグナリング」することに言及することがある。「シグナリング」という用語は、概して、符号化ビデオデータを復号するために使用されるシンタックス要素および／または他のデータの値の通信を指し得る。すなわち、ビデオエンコーダ２００は、ビットストリーム中でシンタックス要素の値をシグナリングし得る。概して、シグナリングは、ビットストリーム中に値を生成することを指す。上述されたように、ソースデバイス１０２は、実質的にリアルタイムでビットストリームを宛先デバイス１１６に移送するか、または、宛先デバイス１１６による後の取出しのためにシンタックス要素を記憶デバイス１１２に記憶するときに起こり得るように、リアルタイムでなくビットストリームを宛先デバイス１１６に移送し得る。

[0076] 図２Ａと図２Ｂとは、例示的なクワッドツリーバイナリツリー（ＱＴＢＴ）構造１３０と、対応するコーディングツリーユニット（ＣＴＵ）１３２とを示す概念図である。実線はクワッドツリースプリッティングを表し、点線はバイナリツリースプリッティングを示す。バイナリツリーの各スプリット（すなわち、非リーフ）ノードでは、どのスプリッティングタイプ（すなわち、水平または垂直）が使用されるかを示すために１つのフラグがシグナリングされ、ここで、この例では、０は水平スプリッティングを示し、１は垂直スプリッティングを示す。クワッドツリースプリッティングでは、クワッドツリーノードが、ブロックを、等しいサイズをもつ４つのサブブロックに水平および垂直にスプリットするので、スプリッティングタイプを示す必要がない。したがって、ＱＴＢＴ構造１３０の領域ツリーレベル（すなわち、実線）についての（スプリッティング情報などの）シンタックス要素と、ＱＴＢＴ構造１３０の予測ツリーレベル（すなわち、破線）についての（スプリッティング情報などの）シンタックス要素とを、ビデオエンコーダ２００は符号化し得、ビデオデコーダ３００は復号し得る。ＱＴＢＴ構造１３０の端末リーフノードによって表されるＣＵについての、予測および変換データなどのビデオデータを、ビデオエンコーダ２００は符号化し得、ビデオデコーダ３００は復号し得る。

[0077] 概して、図２ＢのＣＴＵ１３２は、第１および第２のレベルにおいてＱＴＢＴ構造１３０のノードに対応するブロックのサイズを定義するパラメータに関連付けられ得る。これらのパラメータは、（サンプル中のＣＴＵ１３２のサイズを表す）ＣＴＵサイズと、（最小許容クワッドツリーリーフノードサイズを表すＭｉｎＱＴＳｉｚｅ）最小クワッドツリーサイズと、（最大許容バイナリツリールートノードサイズを表すＭａｘＢＴＳｉｚｅ）最大バイナリツリーサイズと、（最大許容バイナリツリー深度を表すＭａｘＢＴＤｅｐｔｈ）最大バイナリツリー深度と、（最小許容バイナリツリーリーフノードサイズを表すＭｉｎＢＴＳｉｚｅ）最小バイナリツリーサイズとを含み得る。

[0078] ＣＴＵに対応するＱＴＢＴ構造のルートノードは、ＱＴＢＴ構造の第１のレベルにおいて４つの子ノードを有し得、それらの各々は、クワッドツリー区分に従って区分され得る。すなわち、第１のレベルのノードは、リーフノードである（子ノードを有しない）か、あるいは４つの子ノードを有する。ＱＴＢＴ構造１３０の例は、ブランチのために実線を有する親ノードと子ノードとを含むようなノードを表す。第１のレベルのノードが最大許容バイナリツリールートノードサイズ（ＭａｘＢＴＳｉｚｅ）よりも大きくない場合、ノードは、それぞれのバイナリツリーによってさらに区分され得る。１つのノードのバイナリツリースプリッティングは、スプリットから生じるノードが最小許容バイナリツリーリーフノードサイズ（ＭｉｎＢＴＳｉｚｅ）または最大許容バイナリツリー深度（ＭａｘＢＴＤｅｐｔｈ）に達するまで反復され得る。ＱＴＢＴ構造１３０の例は、ブランチのために破線を有するようなノードを表す。バイナリツリーリーフノードはコーディングユニット（ＣＵ）と呼ばれ、ＣＵは、どんなさらなる区分もない、予測（たとえば、ピクチャ内またはピクチャ間予測）ならびに変換のために使用される。上記で論じられたように、ＣＵは「ビデオブロック」または「ブロック」と呼ばれることもある。

[0079] ＱＴＢＴ区分構造の一例では、ＣＴＵサイズは、１２８×１２８（ルーマサンプルおよび２つの対応する６４×６４クロマサンプル）として設定され、ＭｉｎＱＴＳｉｚｅは１６×１６として設定され、ＭａｘＢＴＳｉｚｅは６４×６４として設定され、（幅と高さの両方について）ＭｉｎＢＴＳｉｚｅは４として設定され、ＭａｘＢＴＤｅｐｔｈは４として設定される。クワッドツリー区分は、クワッドツリーリーフノードを生成するために、最初にＣＴＵに適用される。クワッドツリーリーフノードは、１６×１６（すなわち、ＭｉｎＱＴＳｉｚｅ）から１２８×１２８（すなわち、ＣＴＵサイズ）のサイズを有し得る。リーフクワッドツリーノードが１２８×１２８である場合、サイズがＭａｘＢＴＳｉｚｅ（すなわち、この例では６４×６４）を超えるので、それはバイナリツリーによってさらにスプリットされない。他の場合、リーフクワッドツリーノードは、バイナリツリーによってさらに区分される。したがって、クワッドツリーリーフノードはまた、バイナリツリーのためのルートノードであり、０としてのバイナリツリー深度を有する。バイナリツリー深度がＭａｘＢＴＤｅｐｔｈ（この例では４）に達したとき、さらなるスプリッティングは許可されない。バイナリツリーノードがＭｉｎＢＴＳｉｚｅ（この例では４）に等しい幅を有するとき、それは、さらなる水平スプリッティングが許可されないことを暗示する。同様に、ＭｉｎＢＴＳｉｚｅに等しい高さを有するバイナリツリーノードは、さらなる垂直スプリッティングがそのバイナリツリーノードのために許可されないことを暗示する。上述されたように、バイナリツリーのリーフノードは、ＣＵと呼ばれ、さらなる区分なしに予測および変換に従ってさらに処理される。

[0080] トレリスコード化量子化（ＴＣＱ：Trellis coded quantization）は、Ｈ．Ｓｃｈｗａｒｚ、Ｔ．Ｎｇｕｙｅｎ、Ｄ．Ｍａｒｐｅ、Ｔ．Ｗｉｅｇａｎｄ、Ｍ．Ｋａｒｃｚｅｗｉｃｚ、Ｍ．Ｃｏｂａｎ、Ｊ．Ｄｏｎｇ、「ＣＥ７：Ｔｒａｎｓｆｏｒｍｃｏｅｆｆｉｃｉｅｎｔｃｏｄｉｎｇｗｉｔｈｒｅｄｕｃｅｄｎｕｍｂｅｒｏｆｒｅｇｕｌａｒ－ｃｏｄｅｄｂｉｎｓ（ｔｅｓｔｓ７．１．３ａ，７．１．３ｂ）」、ＪＶＥＴ文書ＪＶＥＴ－Ｌ０２７４、マカオ、ＣＮ、２０１８年１０月（以下、ＪＶＥＴ－Ｌ０２７４）において提案された。ＪＶＥＴ－Ｌ０２７４の技法では、２つのスカラー量子化器が、量子化／逆量子化のために切替え可能に使用される。現在の変換／量子化係数に対して使用されるスカラー量子化器は、走査順序で現在の変換／量子化係数に先行する量子化係数のパリティ（最下位ビット）によって決定される。

[0081] ＪＶＥＴ－Ｌ０２７４では、ＴＣＱに結合された係数コーディング方式も提案され、それによって、量子化係数を復号するためのコンテキスト選択は、使用される量子化器に依存する。特に、係数が０または非０であることを示す係数の有意性フラグ（ＳＩＧ：significance flag）は、コンテキストモデルの３つのセットを有し、特定のＳＩＧのために選択されるセットは、関連する係数のために使用される量子化器に依存する。したがって、現在の係数のＳＩＧを復号し始めるとき、エントロピー復号器は、現在の係数と、したがってその係数のＳＩＧのためのコンテキストセットとについて量子化器を決定する、前の走査位置における係数のパリティを知らなくてはならない。

[0082] ＴＵは、コーディンググループ（ＣＧ）と呼ばれる非重複サブブロックに分割され、それのサイズは通常４×４である。本明細書において説明される復号プロセスは、４×４ＣＧに関して説明されることが時々あるが、任意の他のＣＧサイズに容易に拡張され得る。本開示の技法、したがって本明細書中に含まれる説明は、主に、ＣＧ中の係数の絶対レベルの符号化および復号プロセスに関係する。サインなど、ＣＧに関連する他の情報は、ＪＶＥＴ－Ｌ０２７４に記載された様式で符号化または復号され得るが、代替技法を使用して符号化および復号されてもよい。

[0083] ビデオエンコーダ２００とビデオデコーダ３００とは、ビットストリーム中のシンタックス要素を処理するように構成され得る。たとえば、係数の絶対レベル値（ａｂｓＬｅｖｅｌ）を表すために以下のシンタックス要素が使用され得る。

・ｓｉｇ＿ｃｏｅｆｆ＿ｆｌａｇ：ａｂｓＬｅｖｅｌが０である場合、このフラグは０に等しい。そうでない場合、フラグは１に等しい。

・ａｂｓ＿ｌｅｖｅｌ＿ｇｔ１＿ｆｌａｇ：ｓｉｇ＿ｃｏｅｆｆ＿ｆｌａｇが１に等しい場合、フラグはビットストリーム中に存在する。ａｂｓＬｅｖｅｌが１よりも大きい場合、それは１に等しい。そうでない場合、フラグは０に等しい。

・ｐａｒ＿ｌｅｖｅｌ＿ｆｌａｇ：ｒｅｍ＿ａｂｓ＿ｇｔ１＿ｆｌａｇが１に等しい場合、フラグはビットストリーム中に存在する。ａｂｓＬｅｖｅｌが奇数である場合、それは０に等しく、ａｂｓＬｅｖｅｌが偶数である場合、それは１に等しい。

・ａｂｓ＿ｌｅｖｅｌ＿ｇｔ３＿ｆｌａｇ：ａｂｓ＿ｌｅｖｅｌ＿ｇｔ１＿ｆｌａｇが１に等しい場合、フラグはビットストリーム中に存在する。ａｂｓＬｅｖｅｌが３よりも大きい場合、それは１に等しい。そうでない場合、フラグは０に等しい。

・ａｂｓ＿ｒｅｍａｉｎｄｅｒ：ａｂｓ＿ｌｅｖｅｌ＿ｇｔ３＿ｆｌａｇが１に等しい場合、このシンタックス要素はビットストリーム中に存在する。それは、ゴロムライスコードを用いてコーディングされる変換係数レベルの残りの絶対値である
・ａｂｓ＿ｌｅｖｅｌ：これは、ゴロムライスコードを用いてコーディングされる変換係数レベルの絶対値である。

[0084] 以下で、シンタックス要素ｓｉｇ＿ｃｏｅｆｆ＿ｆｌａｇ、ｐａｒ＿ｌｅｖｅｌ＿ｆｌａｇ、ａｂｓ＿ｌｅｖｅｌ＿ｇｔ１＿ｆｌａｇ、ａｂｓ＿ｌｅｖｅｌ＿ｇｔ３＿ｆｌａｇ、ａｂｓ＿ｒｅｍａｉｎｄｅｒ、およびａｂｓ＿ｌｅｖｅｌは、説明を簡潔にするために、それぞれ、ＳＩＧ、Ｐａｒ、Ｇｔ１、Ｇｔ２、ｒｅｍＬｅｖｅｌ、ａｂｓＬｅｖｅｌとして示される。

[0085] ビデオエンコーダ２００とビデオデコーダ３００とは、ビットストリームからパース（parse）されない上記のシンタックス要素のいずれかを、０などのデフォルト値に設定するように構成され得る。５つのシンタックス要素のうちの第１のものの値を仮定すれば、係数の絶対レベルの値は次のように計算され得る。

[0086] 代替的に、係数が完全にバイパスコード化モードでコーディングされる場合、ａｂｓｏｌｕｔｅＬｅｖｅｌは、ａｂｓ＿ｌｅｖｅｌとして直接コーディングされ得る。

[0087] 図３は、ＪＶＥＴ－Ｌ０２７４におけるようにＣＧ中のａｂｓｏｌｕｔｅＬｅｖｅｌを表すシンタックス要素のための例示的な順序を示す。他の順序が使用されてもよい。わかるように、ａｂｓＬｅｖｅｌが４よりも大きいとき、すべての５つのシンタックス要素がビットストリームからパースされる。

[0088] 図３の例では、ビデオデコーダ３００は、最高４つのパスにおいてＣＧ中の位置を走査する。第１のパス１３６において、ビデオデコーダ３００は、ＳＩＧと、Ｐａｒと、Ｇｔ１との値をパースする。非０ＳＩＧのみが、対応するＧｔ１およびＰａｒによって後続される。すなわち、ビデオデコーダ３００が、係数レベルが０に等しいことを意味する０の値をＳＩＧが有すると決定した場合、ビデオデコーダ３００は、その係数についてＧｔ１およびｐａｒのインスタンス（instance）を受信しない。第１のパス１３６の後に、ａｂｓＬｅｖｅｌ１として示される、部分的なａｂｓｏｌｕｔｅＬｅｖｅｌの値が、各位置について、式（２）に示されているように再構築され得る。

[0089] いくつかの実装形態では、ビデオデコーダ３００は、第１のパス１３６において、４×４サブブロックについて最高２８個の正規コード化ビンを、および２×２サブブロックについて最高６つの正規コード化ビンをパースするように構成され得る。正規コード化ビンの数の限界は、ＳＩＧ、Ｇｔ１、Ｐａｒビンのグループにおいて執行され得、これは、ＳＩＧ、Ｇｔ１、およびＰａｒビンの各グループがセットとしてコーディングされることと、セットの中間におけるバイパスコーディング（bypass coding）への切替えが許容されないこととを意味する。

[0090] 第１のパスに少なくとも１つの非０Ｇｔ１がある場合、ビデオデコーダ３００は、第２のパス１３８を走査するように構成され得る。第２のパス１３８において、ビデオデコーダ３００は、非０Ｇｔ１をもつ位置についてＧｔ２をパースする。第１のパス１３６と第２のパス１３８とにおけるビンは、すべて正規コーディング（regular code）され得、これは、ビンの確率分布が、選択されたコンテキストモデルによってモデル化されることを意味する。第２のパス１３８に少なくとも１つの非０Ｇｔ２がある場合、ビデオデコーダ３００は第３のパス１４０を走査する。第３のパス１４０中に、ビデオデコーダ３００は、非０Ｇｔ２をもつ位置のｒｅｍＬｅｖｅｌをパースする。ｒｅｍＬｅｖｅｌはバイナリでなく、ビデオデコーダ３００は、ｒｅｍのバイナリ化バージョンのビンをバイパスコーディングし得、これは、ビンが一様に分布すると仮定され、コンテキスト選択が必要でないことを意味する。

[0091] 第４のパス１４２において、ビデオデコーダ３００は、前の３つのパスにおいて正規コード化ビンを用いて部分的に表されない、すべての残りの係数を走査する。さらなるパス１４２の係数レベルが、バイパスコード化ビンを使用して絶対値としてコーディングされる。

[0092] ビデオエンコーダ２００とビデオデコーダ３００とは、コンテキストモデリングを実施し得る。ＪＶＥＴ－Ｌ０２７４において使用されるコンテキストモデリングについても、本開示によって提案される修正とともに、ここで手短に紹介される。以下でより詳細に論じられるコンテキストモデリングは、概して、復号すべきビンのための、コンテキストとも呼ばれる確率モデルの選択を指す。ＪＶＥＴ－Ｌ０２７４では、シンタックス要素ＳＩＧ、Ｐａｒ、Ｇｔ１、およびＧｔ２は、コンテキストモデリングを使用してコーディングされる。コンテキストの選択は、Ｎとして示される、局所近傍にあるａｂｓＬｅｖｅｌ１の値に依存する。図４は、使用される近傍のテンプレートを示す。テンプレート内の、しかし現在のＴＵ外の位置は、Ｎから除外され得る。

[0093] 図４は、確率モデルを選択するために使用されるテンプレートの図を示す。「Ｘ」でマークされた正方形は、現在の走査位置を指定し、「Ｙ」でマークされた正方形は、使用される局所近傍を表す。

[0094] 現在位置（図４においてＸをもつ正方形を参照されたい）について、ビデオデコーダ３００は、ｃｔｘＩｄｘＳＩＧ、ｃｔｘＩｄｘＰａｒ、ｃｔｘＩｄｘＧｔ１、およびｃｔｘＩｄｘＧｔ２として示される、それのＳＩＧ、Ｐａｒ、Ｇｔ１、およびＧｔ２のコンテキストインデックスを決定する。コンテキストインデックスを決定するために、ビデオデコーダ３００は、最初に、ｎｕｍＳＩＧ、ｓｕｍＡｂｓ１、およびｄという３つの変数を決定し得る。変数ｎｕｍＳＩＧは、以下の式（３）によって表される、Ｎ中の非０ＳＩＧの数を表す。

[0095] 変数ｓｕｍＡｂｓ１は、以下の式（４）によって表される、Ｎ中のａｂｓＬｅｖｅｌ１の合計を表す。

[0096] 変数ｄは、以下の式（５）によって表されるように、ＴＵ内の現在位置の対角測度（diagonal measure）を表す。

ここで、ｘおよびｙは、ＴＵ内の現在位置の座標を表す。

[0097] ｓｕｍＡｂｓ１とｄとが与えられれば、ビデオデコーダ３００は、次のようにＳＩＧを復号するためのコンテキストインデックスを決定する。

・ルーマについて、ｃｔｘＩｄｘＳＩＧは式（６）によって決定される。

・クロマについて、ｃｔｘＩｄｘＳＩＧは式（７）によって決定される。

[0098] 式（６）および（７）において、変数「ｓｔａｔｅ」は、ＪＶＥＴ－Ｌ０２７４において定義されている状態機械（state machine）の現在の状態（present state）を表す。

[0099] ｓｕｍＳＩＧと、ｓｕｍＡｂｓ１と、ｄとが与えられれば、ビデオデコーダ３００は、次のようにＰａｒを復号するためのコンテキストインデックスを決定する。

・現在の走査位置が最後の非０係数の位置に等しい場合、ｃｔｘＩｄｘＰａｒは０である。

・そうでない場合、
○ ルーマについて、ｃｔｘＩｄｘＰａｒは式（８）によって決定される。

○ クロマについて、ｃｔｘＩｄｘＰａｒは（９）によって決定される。

ｃｔｘＩｄｘＧｔ１とｃｔｘＩｄｘＧｔ２とは、ｃｔｘＩｄｘＰａｒの値に設定される。

[0100] ビデオエンコーダ２００とビデオデコーダ３００とは、ＲｅｍＬｅｖｅｌコーディングを実施するように構成され得る。ビデオデコーダ３００は、非バイナリシンタックス要素ｒｅｍＲｅｍａｉｎｄｅｒ（ｒｅｍＬｅｖｅｌ）とａｂｓＬｅｖｅｌとをコーディングするためのライスパラメータ（ｒｉｃｅＰａｒ）を次のように導出する。

・各サブブロックの開始において、ｒｉｃｅＰａｒは０に等しく設定される。

・シンタックス要素残余をコーディングした後に、ライスパラメータ（ｒｉｃｅＰａｒ）は次のように修正される。

ｒｉｃｅＰａｒが３よりも小さく、残余の最後のコード化値が（（３＜＜ｒｉｃｅＰａｒ）－１）よりも大きい場合、ｒｉｃｅＰａｒは１だけ増分される。

[0101] 完全にバイパスコーディングされた絶対量子化インデックスを表す、非バイナリシンタックス要素ａｂｓＬｅｖｅｌをコーディングするために、以下が適用される。

ローカルテンプレート中の絶対値の合計ｓｕｍＡｂｓが決定される。

変数ｒｉｃｅＰａｒおよびｐｏｓＺｅｒｏが、次式に従ってテーブルルックアップによって決定される。

ここで、変数ｓｔａｔｅは従属量子化の状態を表し（従属量子化が無効にされたとき、それは０に等しい）、テーブルｒｉｃｅＰａｒＴａｂｌｅ［]およびｐｏｓＺｅｒｏＴａｂｌｅ［]［]は次式によって与えられる。

・中間変数ｃｏｄｅＶａｌｕｅが次のように導出される。

○ ａｂｓＬｅｖｅｌが０に等しい場合、ｃｏｄｅＶａｌｕｅはｐｏｓＺｅｒｏに等しく設定される。

○ そうでなく、ａｂｓＬｅｖｅｌがｐｏｓＺｅｒｏ以下である場合、ｃｏｄｅＶａｌｕｅはａｂｓＬｅｖｅｌ－１に等しく設定される。

○ そうでない（ａｂｓＬｅｖｅｌがｐｏｓＺｅｒｏよりも大きい）場合、ｃｏｄｅＶａｌｕｅはａｂｓＬｅｖｅｌに等しく設定される。

・ｃｏｄｅＶａｌｕｅの値は、ライスパラメータｒｉｃｅＰａｒとともにゴロムライスコードを使用してコーディングされる。

[0102] ビデオエンコーダ２００とビデオデコーダ３００とは、ａｂｓｏｌｕｔｅＬｅｖｅｌ再構築を実施するように構成され得る。ａｂｓｏｌｕｔｅＬｅｖｅｌ再構築は、ビットストリーム中のシンタックス要素に関して上記で論じられた、ＪＶＥＴ－Ｌ０２７４におけるのと同じであり得る。

[0103] ビデオエンコーダ２００とビデオデコーダ３００とは、インターリーブ様式でＧｔ２フラグをコーダするように構成され得る。いくつかの例では、第１のパスにおいて、ＳＩＧ、Ｇｔ１、Ｐａｒフラグがコーディングされ、第２のパスにおいて、Ｇｔ２フラグがコーディングされる場合において説明された方式の代わりに、Ｇｔ２フラグは、以下の図に示されるように、Ｐａｒフラグの後にあるいはＧｔ１フラグの後に第１のパスに組み込まれ、コーディングパスが４から３に低減され得る。

[0104] 図５は、Ｐａｒフラグの後の第１のパスにおけるインターリーブされたＧｔ２フラグの例を示す。図５に関して、ビデオデコーダ３００は、図３に関して上記で説明されたのと同じ様式でａｂｓＬｅｖｅｌ１の値を決定し得るが、様々なシンタックス要素が受信される順序が変更される。たとえば、図５では、ビデオデコーダ３００は、第２のパス（たとえば、図３における第２のパス１３８）の一部としてではなく、第１のパス１６２の一部としてＧｔ２の値を決定する。したがって、図５では、図３の第１のパス１３６と第２のパス１３８とは、単一のパス（第１のパス１６２）に効果的に組み合わされ、図３の第３のパス１４０と第４のパス１４２とは、それぞれ、図５の第２のパス１６４と第３のパス１６６とになる。したがって、図５の例では、すべてのシンタックス要素を搬送するためにわずか３つのパスが必要とされる。

[0105] 図６は、Ｇｔ１フラグの後の第１のパスにおけるインターリーブされたＧｔ２フラグの例を示す。この場合、ａｂｓＬｅｖｅｌ１は、次のように計算され得、

コンテキストモデリングに関して上記で導入された式のコンテキスト導出において使用され得る。図６に関して、ビデオデコーダ３００は、図３に関して上記で説明されたのと同じ様式でａｂｓＬｅｖｅｌ１の値を決定し得るが、様々なシンタックス要素が受信される順序が変更される。たとえば、図６では、ビデオデコーダ３００は、第２のパス（たとえば、図３における第２のパス１３８）の一部としてではなく、第１のパス１７２の一部としてＧｔ２の値を決定する。したがって、図６では、図３の第１のパス１３６と第２のパス１３８とは、単一のパス（第１のパス１７２）に効果的に組み合わされ、図３の第３のパス１４０と第４のパス１４２とは、それぞれ、図６の第２のパス１７４と第３のパス１７６とになる。したがって、図６の例では、すべてのシンタックス要素を搬送するためにわずか３つのパスが必要とされる。図６では、第１のパス１７２のシンタックス要素は、図５における第１のパス１６２のシンタックス要素とは異なる順序で走査されるが、他のパスは概して同じである。

[0106] ビデオエンコーダ２００とビデオデコーダ３００とは、部分的な最後の正規ビンコード化係数表現を利用するように構成され得、ここで、いくつかの係数の値は、バイパスコーディングを使用して搬送される残余値とともに正規コード化ビンを使用して部分的に搬送され得る。ＪＶＥＴ－Ｌ０２７４に記載されたコーディング方式では、第１のコーディングパスのための正規コード化ビンバジェットに達する最後の正規ビンコード化係数（たとえば、図３のＣｏｅｆｆＫ）、ＳＩＧ、Ｇｔ１、Ｐａｒビンは、すべて正規コード化ビンとしてコーディングされる。正規ビンコーディングは、ＳＩＧ－Ｇｔ１－Ｐａｒグループの中間において終了しない。ＳＩＧ－Ｇｔ１－Ｐａｒ－Ｇｔ２グループまたはＳＩＧ－Ｇｔ１－Ｇｔ２－Ｐａｒグループ（たとえば、図５および図６）について同様に、ＣｏｅｆｆＫのＳＩＧ、Ｇｔ１、Ｐａｒ、Ｇｔ２フラグのためのコーディングは、正規モード（regular mode）においてコーディングされる。本開示は、図７および図８に示されているようにＳＩＧおよびＧｔ１フラグのコーディングの後の正規コード化ビンの起こり得る終了を可能にすることによって、この制約を破るための技法を提案する。

[0107] 図７は、第１のコーディングパス１８２におけるＳＩＧ－Ｇｔ１－Ｐａｒ－Ｇｔ２コーディングについて正規コード化ビン限界に達した最後の係数の部分コーディングの例を示す。図７の例では、ビデオデコーダ３００は、ｒｅｍＬｅｖｅｌ値とａｂｓＬｅｖｅｌ値の両方を含む第３のパス１８６を走査する。ｒｅｍＬｅｖｅｌの値は、係数の実際の値と、第１のパス１８２および第２のパス１８４から決定された部分値との間の残余値を表す。ａｂｓＬｅｖｅｌの値は、対照的に、係数値の絶対値を表す。

[0108] 図８は、第１のコーディングパス１９２におけるＳＩＧ－Ｇｔ１－Ｇｔ２－Ｐａｒコーディングについて正規コード化ビン限界に達した最後の係数の部分コーディングの例を示す。図８では、第１のパス１９２のシンタックス要素は、図７における第１のパス１８２のシンタックス要素とは異なる順序で走査される。第２のパス１９４および第３のパス１９６は、図７における第２のパス１８４および第３のパス１８６と概して同じである。

[0109] 図７と図８との例では、ＣｏｅｆｆＫの残存レベルは、バイパスコーディングされるａｂｓＬｅｖｅｌの値とともに第３のパス１８６／１９６においてバイパスコーディングされる、ｒｅｍＬｅｖｅｌＦｕｌｌとしてコーディングされる。係数の値は次のように表される。

または

[0110] 他の例では、ビンの正規コーディング（regular coding）は、ＰａｒおよびＧｔ２フラグのコーディングの後に終了することができるか、またはその逆も同様である。この場合、最後の係数の残存レベルは、残存レベルの半分としてコーディングされることになるはずであり、すなわち、

または

[0111] 正規コード化ビンの総数は、インターリーブされたＳＩＧ、Ｇｔ１、Ｇｔ２およびＰａｒフラグに課された総数として指定され得る。

[0112] ビデオエンコーダ２００とビデオデコーダ３００とは、残存レベルコーディングを実施するように構成され得る。第２のコーディングパスにおけるｒｅｍＬｅｖｅｌコーディングは、ＲｅｍＬｅｖｅｌコーディングに関して上記で説明されたものと同等であり得る。ビデオデコーダ３００は、ＣｏｅｆｆＫ－１の終了まで、ライスパラメータ更新および導出を実施し得、ここで、ＣｏｅｆｆＫ－１は、最後の正規コード化係数（ＣｏｅｆｆＫ）の前の、最後から２つ目の正規コード化係数を表す。ビデオデコーダ３００は、完全正規コーディングを使用してＣｏｅｆｆＫ－１を復号し得、正規コーディングを使用してまたは正規コーディングとバイパスコーディングとの組合せを使用して完全にＣｏｅｆｆＫをデコーデッドし得る。ＣｏｅｆｆＫのｒｅｍＬｅｖｅｌＦｕｌｌのコーディングのために、ビデオデコーダ３００は、次のようにライスパラメータを更新し得、

ここで、ｒｉｃｅＰａｒは、第２のパスにおけるｒｅｍＬｅｖｅｌのコーディングのために使用されるｒｉｃｅＰａｒであり、ｌａｓｔＣｏｄｅｄＧｔ２Ｆｌａｇは、第１のコーディングパスにおける最後のコード化Ｇｔ２フラグの値である。代替的に、２×ｒｉｃｅＰａｒであるｒｉｃｅＰａｒの値が使用され得るか、またはＣｏｅｆｆＫのための残存レベルの最適なコーディングに一致するｒｉｃｅＰａｒが使用され得る。

[0113] いくつかの例では、ＣｏｅｆｆＫのｒｅｍＬｅｖｅｌＦｕｌｌのコーディングのために、ビデオデコーダ３００は、次のようにライスパラメータを更新し得る。

[0114] バイパスコーディングを使用して完全にコーディングされる係数のためのａｂｓＬｅｖｅｌ値の残りについて、ビデオデコーダ３００は次のようにｒｉｃｅＰａｒＢｙｐａｓｓを更新し得る。バイパスコード化係数をコーディングする前に、ビデオデコーダ３００は次のようにｒｉｃｅＰａｒＢｙｐａｓｓを更新する。

ｉｆ（ｒｉｃｅＰａｒＢｙｐａｓｓ＜３＆＆ａｂｓｏｌｕｔｅＬｅｖｅｌＰｒｅｖＣｏｅｆｆ＞（（３＜＜ｒｉｃｅＰａｒＢｙｐａｓｓ）－１）｛ｒｉｃｅＰａｒＢｙｐａｓｓ＋＋；｝
[0115] ｒｅｍＬｅｖｅｌの代わりに、しきい値検査のために前のコード化係数（ＣｏｅｆｆＫ）の完全絶対値が使用されることを除いて、ｒｉｃｅＰａｒがｒｅｍＬｅｖｅｌコーディングのために更新される様式と同様に。

[0116] ビデオデコーダ３００は、ａｂｓＬｅｖｅｌレベル任意の種々の異なる技法を決定するためのｐｏｓＺｅｒｏパラメータを導出し得る。一例では、ビデオデコーダ３００は、次のようにルックアップテーブル（look up table）を使用してａｂｓＬｅｖｅｌレベルを決定するためのｐｏｓＺｅｒｏパラメータを導出し得る。

[0117] ビデオデコーダ３００は、次のようにコード化されるべき中間変数ｃｏｄｅＶａｌｕｅを導出し得る。

○ ａｂｓＬｅｖｅｌまたはｒｅｍＬｅｖｅｌＦｕｌｌが０に等しい場合、ｃｏｄｅＶａｌｕｅはｐｏｓＺｅｒｏに等しく設定される。

○ そうでなく、ａｂｓＬｅｖｅｌまたはｒｅｍＬｅｖｅｌＦｕｌｌがｐｏｓＺｅｒｏ以下である場合、ｃｏｄｅＶａｌｕｅは、それぞれ、ａｂｓＬｅｖｅｌ－１またはｒｅｍＬｅｖｅｌＦｕｌｌ－１に等しく設定される。

○ そうでない（ａｂｓＬｅｖｅｌまたはｒｅｍＬｅｖｅｌＦｕｌｌがｐｏｓＺｅｒｏよりも大きい）場合、ｃｏｄｅＶａｌｕｅは、それぞれ、ａｂｓＬｅｖｅｌまたはｒｅｍＬｅｖｅｌＦｕｌｌに等しく設定される。

[0118] ビデオデコーダ３００は、ライスパラメータｒｉｃｅＰａｒＢｙｐａｓｓとともにゴロムライスコードを使用してｃｏｄｅＶａｌｕｅの値をコーディングし得る。

[0119] 図９は、本開示の技法を実施し得る例示的なビデオエンコーダ２００を示すブロック図である。図９は、説明の目的で提供されており、本開示において広く例示され、説明される技法を限定するものと見なされるべきではない。説明の目的で、本開示では、ＨＥＶＣビデオコーディング規格および開発中のＨ．２６６ビデオコーディング規格などのビデオコーディング規格のコンテキストにおいて、ビデオエンコーダ２００について説明する。しかしながら、本開示の技法は、これらのビデオコーディング規格に限定されず、一般的にビデオ符号化および復号に適用可能である。

[0120] 図９の例では、ビデオエンコーダ２００は、ビデオデータメモリ２３０と、モード選択ユニット２０２と、残差生成ユニット２０４と、変換処理ユニット２０６と、量子化ユニット２０８と、逆量子化ユニット２１０と、逆変換処理ユニット２１２と、再構築ユニット２１４と、フィルタユニット２１６と、復号ピクチャバッファ（ＤＰＢ：decoded picture buffer）２１８と、エントロピー符号化ユニット２２０とを含む。

[0121] ビデオデータメモリ２３０は、ビデオエンコーダ２００の構成要素によって符号化されるべきビデオデータを記憶し得る。ビデオエンコーダ２００は、たとえば、ビデオソース１０４（図１）から、ビデオデータメモリ２３０に記憶されたビデオデータを受信し得る。ＤＰＢ２１８は、ビデオエンコーダ２００による後続のビデオデータの予測において使用する参照ビデオデータを記憶する参照ピクチャメモリとして働き得る。ビデオデータメモリ２３０とＤＰＢ２１８とは、同期ＤＲＡＭ（ＳＤＲＡＭ）を含むダイナミックランダムアクセスメモリ（ＤＲＡＭ）、磁気抵抗ＲＡＭ（ＭＲＡＭ）、抵抗性ＲＡＭ（ＲＲＡＭ（登録商標））、または他のタイプのメモリデバイスなど、様々なメモリデバイスのいずれかによって形成され得る。ビデオデータメモリ２３０とＤＰＢ２１８とは、同じメモリデバイスまたは別個のメモリデバイスによって提供され得る。様々な例では、ビデオデータメモリ２３０は、図示のように、ビデオエンコーダ２００の他の構成要素とともにオンチップであるか、またはそれらの構成要素に対してオフチップであり得る。

[0122] 本開示では、ビデオデータメモリ２３０への参照は、特にそのように説明されない限り、ビデオエンコーダ２００の内部のメモリに限定されるものとして解釈されるべきではなく、または特にそのように説明されない限り、ビデオエンコーダ２００の外部のメモリに限定されるものとして解釈されるべきではない。そうではなく、ビデオデータメモリ２３０への参照は、ビデオエンコーダ２００が符号化のために受信するビデオデータ（たとえば、符号化されるべきである現在ブロックのビデオデータ）を記憶する参照メモリとして理解されたい。図１のメモリ１０６はまた、ビデオエンコーダ２００の様々なユニットからの出力の一時的記憶を提供し得る。

[0123] 図９の様々なユニットは、ビデオエンコーダ２００によって実施される動作を理解するのを支援するために示されている。ユニットは、固定機能回路、プログラマブル回路、またはそれらの組合せとして実装され得る。固定機能回路は、特定の機能を提供する回路を指し、実施され得る動作にプリセットされる。プログラマブル回路は、様々なタスクを実施するように、および実施され得る動作においてフレキシブルな機能を提供するようにプログラムされる回路を指す。たとえば、プログラマブル回路は、ソフトウェアまたはファームウェアの命令によって定義される様式でプログラマブル回路を動作させるソフトウェアまたはファームウェアを実行し得る。固定機能回路は、（たとえば、パラメータを受信するかまたはパラメータを出力するための）ソフトウェア命令を実行し得るが、固定機能回路が実施する動作のタイプは、概して不変である。いくつかの例では、ユニットのうちの１つまたは複数は、別個の回路ブロック（固定機能またはプログラマブル）であり得、いくつかの例では、１つまたは複数のユニットは、集積回路であり得る。

[0124] ビデオエンコーダ２００は、算術論理ユニット（ＡＬＵ）、基本機能ユニット（ＥＦＵ）、デジタル回路、アナログ回路、および／またはプログラマブル回路から形成されるプログラマブルコアを含み得る。ビデオエンコーダ２００の動作が、プログラマブル回路によって実行されるソフトウェアを使用して実施される例では、メモリ１０６（図１）は、ビデオエンコーダ２００が受信し実行するソフトウェアのオブジェクトコードを記憶し得るか、またはビデオエンコーダ２００内の別のメモリ（図示されず）が、そのような命令を記憶し得る。

[0125] ビデオデータメモリ２３０は、受信されたビデオデータを記憶するように構成される。ビデオエンコーダ２００は、ビデオデータメモリ２３０からビデオデータのピクチャを取り出し、残差生成ユニット２０４とモード選択ユニット２０２とにビデオデータを提供し得る。ビデオデータメモリ２３０中のビデオデータは、符号化されるべきである生のビデオデータであり得る。

[0126] モード選択ユニット２０２は、動き推定ユニット２２２と、動き補償ユニット２２４と、イントラ予測ユニット２２６とを含む。モード選択ユニット２０２は、他の予測モードに従ってビデオ予測を実施するための追加の機能ユニットを含み得る。例として、モード選択ユニット２０２は、パレットユニット、（動き推定ユニット２２２および／または動き補償ユニット２２４の一部であり得る）イントラブロックコピーユニット、アフィンユニット、線形モデル（ＬＭ）ユニットなどを含み得る。

[0127] モード選択ユニット２０２は、概して、符号化パラメータの組合せと、そのような組合せについての得られたレートひずみ値とをテストするために、複数の符号化パスを協調させる。符号化パラメータは、ＣＵへのＣＴＵの区分、ＣＵの予測モード、ＣＵの残差データのための変換タイプ、ＣＵの残差データのための量子化パラメータなどを含み得る。モード選択ユニット２０２は、最終的に、他のテストされた組合せよりも良好であるレートひずみ値を有する符号化パラメータの組合せを選択し得る。

[0128] ビデオエンコーダ２００は、ビデオデータメモリ２３０から取り出されたピクチャを一連のＣＴＵに区分し、１つまたは複数のＣＴＵをスライス内にカプセル化し得る。モード選択ユニット２０２は、上記で説明されたＨＥＶＣのＱＴＢＴ構造またはクワッドツリー構造など、ツリー構造に従ってピクチャのＣＴＵを区分し得る。上記で説明されたように、ビデオエンコーダ２００は、ツリー構造に従ってＣＴＵを区分することから１つまたは複数のＣＵを形成し得る。そのようなＣＵは、一般に「ビデオブロック」または「ブロック」と呼ばれることもある。

[0129] 概して、モード選択ユニット２０２はまた、現在ブロック（たとえば、現在ＣＵ、またはＨＥＶＣでは、ＰＵとＴＵとの重複する部分）についての予測ブロックを生成するように、それの構成要素（たとえば、動き推定ユニット２２２、動き補償ユニット２２４、およびイントラ予測ユニット２２６）を制御する。現在ブロックのインター予測のために、動き推定ユニット２２２は、１つまたは複数の参照ピクチャ（たとえば、ＤＰＢ２１８に記憶されている１つまたは複数の以前のコード化ピクチャ）中で１つまたは複数のぴったり一致する参照ブロックを識別するために動き探索を実施し得る。特に、動き推定ユニット２２２は、たとえば、絶対差分和（ＳＡＤ）、２乗差分和（ＳＳＤ）、平均絶対差（ＭＡＤ）、平均２乗差（ＭＳＤ）などに従って、現在ブロックに対して潜在的参照ブロックがどのくらい類似しているかを表す値を計算し得る。動き推定ユニット２２２は、概して、現在ブロックと考慮されている参照ブロックとの間のサンプルごとの差分を使用してこれらの計算を実施し得る。動き推定ユニット２２２は、現在ブロックに最もぴったり一致する参照ブロックを示す、これらの計算から得られた最も低い値を有する参照ブロックを識別し得る。

[0130] 動き推定ユニット２２２は、現在ピクチャ中の現在ブロックの位置に対して参照ピクチャ中の参照ブロックの位置を定義する１つまたは複数の動きベクトル（ＭＶ：motion vector）を形成し得る。動き推定ユニット２２２は、次いで、動きベクトルを動き補償ユニット２２４に提供し得る。たとえば、単方向インター予測では、動き推定ユニット２２２は、単一の動きベクトルを提供し得るが、双方向インター予測では、動き推定ユニット２２２は、２つの動きベクトルを提供し得る。動き補償ユニット２２４は、次いで、動きベクトルを使用して予測ブロックを生成し得る。たとえば、動き補償ユニット２２４は、動きベクトルを使用して参照ブロックのデータを取り出し得る。別の例として、動きベクトルが分数サンプル精度を有する場合、動き補償ユニット２２４は、１つまたは複数の補間フィルタに従って予測ブロックの値を補間し得る。その上、双方向インター予測では、動き補償ユニット２２４は、それぞれの動きベクトルによって識別された２つの参照ブロックについてデータを取り出し、たとえば、サンプルごとの平均化または加重平均化を通して、取り出されたデータを組み合わせ得る。

[0131] 別の例として、イントラ予測、またはイントラ予測コーディングのために、イントラ予測ユニット２２６は、現在ブロックに隣接しているサンプルから予測ブロックを生成し得る。たとえば、方向性モードでは、イントラ予測ユニット２２６は、隣接サンプルの値を概して数学的に組み合わせ、現在ブロックにわたって規定の方向にこれらの計算された値をポピュレートして、予測ブロックを生成し得る。別の例として、ＤＣモードでは、イントラ予測ユニット２２６は、現在ブロックに対する隣接サンプルの平均を計算し、予測ブロックのサンプルごとにこの得られた平均を含むように予測ブロックを生成し得る。

[0132] モード選択ユニット２０２は、予測ブロックを残差生成ユニット２０４に提供する。残差生成ユニット２０４は、ビデオデータメモリ２３０から現在ブロックの生の非コード化バージョンを受信し、モード選択ユニット２０２から予測ブロックを受信する。残差生成ユニット２０４は、現在ブロックと予測ブロックとの間のサンプルごとの差分を計算する。得られたサンプルごとの差分は、現在ブロックについての残差ブロックを定義する。いくつかの例では、残差生成ユニット２０４はまた、残差差分パルスコード変調（ＲＤＰＣＭ：residual differential pulse code modulation）を使用して残差ブロックを生成するために、残差ブロック中のサンプル値の間の差分を決定し得る。いくつかの例では、残差生成ユニット２０４は、バイナリ減算を実施する１つまたは複数の減算器回路を使用して形成され得る。

[0133] モード選択ユニット２０２がＣＵをＰＵに区分する例では、各ＰＵは、ルーマ予測ユニットと、対応するクロマ予測ユニットとに関連付けられ得る。ビデオエンコーダ２００とビデオデコーダ３００とは、様々なサイズを有するＰＵをサポートし得る。上記のように、ＣＵのサイズは、ＣＵのルーマコーディングブロックのサイズを指すことがあり、ＰＵのサイズは、ＰＵのルーマ予測ユニットのサイズを指すことがある。特定のＣＵのサイズが２Ｎ×２Ｎであると仮定すると、ビデオエンコーダ２００は、イントラ予測のための２Ｎ×２ＮまたはＮ×ＮのＰＵサイズと、インター予測のための２Ｎ×２Ｎ、２Ｎ×Ｎ、Ｎ×２Ｎ、Ｎ×Ｎ、または同様のものの対称ＰＵサイズとをサポートし得る。ビデオエンコーダ２０とビデオデコーダ３０とはまた、インター予測のための２Ｎ×ｎＵ、２Ｎ×ｎＤ、ｎＬ×２Ｎ、およびｎＲ×２ＮのＰＵサイズの非対称区分をサポートし得る。

[0134] モード選択ユニットがＣＵをＰＵにさらに区分しない例では、各ＣＵは、ルーマコーディングブロックと、対応するクロマコーディングブロックとに関連付けられ得る。上記のように、ＣＵのサイズは、ＣＵのルーマコーディングブロックのサイズを指し得る。ビデオエンコーダ２００とビデオデコーダ３００とは、２Ｎ×２Ｎ、２Ｎ×Ｎ、またはＮ×２ＮのＣＵサイズをサポートし得る。

[0135] いくつかの例として、イントラブロックコピーモードコーディング、アフィンモードコーディング、および線形モデル（ＬＭ）モードコーディングなど、他のビデオコーディング技法では、モード選択ユニット２０２は、コーディング技法に関連付けられたそれぞれのユニットを介して、符号化されている現在ブロックについて予測ブロックを生成する。パレットモードコーディングなど、いくつかの例では、モード選択ユニット２０２は、予測ブロックを生成せず、代わりに、選択されたパレットに基づいてブロックを再構築すべき様式を示すシンタックス要素を生成し得る。そのようなモードでは、モード選択ユニット２０２は、符号化されるためにこれらのシンタックス要素をエントロピー符号化ユニット２２０に提供し得る。

[0136] 上記で説明されたように、残差生成ユニット２０４は、現在ブロックと、対応する予測ブロックとについて、ビデオデータを受信する。残差生成ユニット２０４は、次いで、現在ブロックについての残差ブロックを生成する。残差ブロックを生成するために、残差生成ユニット２０４は、予測ブロックと現在ブロックとの間のサンプルごとの差分を計算する。

[0137] 変換処理ユニット２０６は、変換係数のブロック（本明細書では「変換係数ブロック（transform coefficient block）」と呼ばれる）を生成するために、残差ブロックに１つまたは複数の変換を適用する。変換処理ユニット２０６は、変換係数ブロックを形成するために、残差ブロックに様々な変換を適用し得る。たとえば、変換処理ユニット２０６は、離散コサイン変換（ＤＣＴ）、方向変換、カルーネンレーベ変換（ＫＬＴ）、または概念的に同様の変換を残差ブロックに適用し得る。いくつかの例では、変換処理ユニット２０６は、複数の変換、たとえば、１次変換および２次変換、たとえば回転変換を残差ブロックに実施し得る。いくつかの例では、変換処理ユニット２０６は、残差ブロックに変換を適用しない。

[0138] 量子化ユニット２０８は、量子化された変換係数ブロックを生成するために、変換係数ブロック中の変換係数を量子化し得る。量子化ユニット２０８は、現在ブロックに関連付けられた量子化パラメータ（ＱＰ：quantization parameter）値に従って変換係数ブロックの変換係数を量子化し得る。ビデオエンコーダ２００は（たとえば、モード選択ユニット２０２を介して）、ＣＵに関連付けられたＱＰ値を調整することによって、現在ブロックに関連付けられた係数ブロックに適用される量子化の程度を調整し得る。量子化は、情報の損失を導入することがあり、したがって、量子化された変換係数は、変換処理ユニット２０６によって生成された元の変換係数よりも低い精度を有し得る。

[0139] 逆量子化ユニット２１０と逆変換処理ユニット２１２とは、変換係数ブロックから残差ブロックを再構築するために、それぞれ、量子化された変換係数ブロックに逆量子化と逆変換とを適用し得る。再構築ユニット２１４は、再構築された残差ブロックと、モード選択ユニット２０２によって生成された予測ブロックとに基づいて、（ある程度のひずみを潜在的にもっているものの）現在ブロックに対応する再構築ブロックを生成し得る。たとえば、再構築ユニット２１４は、再構築ブロックを生成するために、モード選択ユニット２０２によって生成された予測ブロックからの対応するサンプルに、再構築された残差ブロックのサンプルを加算し得る。

[0140] フィルタユニット２１６は、再構築ブロックに対して１つまたは複数のフィルタ演算を実施し得る。たとえば、フィルタユニット２１６は、ＣＵのエッジに沿ってブロッキネスアーティファクト（blockiness artifact）を低減するためのデブロッキング動作（deblocking operation）を実施し得る。いくつかの例では、フィルタユニット２１６の動作はスキップされてよい。

[0141] ビデオエンコーダ２００は、再構築ブロックをＤＰＢ２１８に記憶する。たとえば、フィルタユニット２１６の動作が実施される例において、再構築ユニット２１４は、再構築ブロックをＤＰＢ２１８に記憶し得る。フィルタユニット２１６の動作が実施される例では、フィルタユニット２１６は、フィルタ処理された再構築ブロックをＤＰＢ２１８に記憶し得る。動き推定ユニット２２２と動き補償ユニット２２４とは、後で符号化されるピクチャのブロックをインター予測するために、再構築（および潜在的にフィルタ処理）されたブロックから形成された参照ピクチャをＤＰＢ２１８から取り出し得る。さらに、イントラ予測ユニット２２６は、現在ピクチャ中の他のブロックをイントラ予測するために、現在ピクチャのＤＰＢ２１８中の再構築ブロックを使用し得る。

[0142] 概して、エントロピー符号化ユニット２２０は、係数コーディングについて上記で説明されたシンタックス要素を含む、ビデオエンコーダ２００の他の機能構成要素から受信されたシンタックス要素をエントロピー符号化し得る。たとえば、エントロピー符号化ユニット２２０は、量子化ユニット２０８からの量子化された変換係数ブロックをエントロピー符号化し得る。別の例として、エントロピー符号化ユニット２２０は、モード選択ユニット２０２からの予測シンタックス要素（たとえば、インター予測のための動き情報、またはイントラ予測のためのイントラモード情報）をエントロピー符号化し得る。エントロピー符号化ユニット２２０は、エントロピー符号化データを生成するために、ビデオデータの別の例であるシンタックス要素に対して１つまたは複数のエントロピー符号化演算を実施し得る。たとえば、エントロピー符号化ユニット２２０は、コンテキスト適応型可変長コーディング（ＣＡＶＬＣ：context-adaptive variable length coding）動作、ＣＡＢＡＣ動作、可変対可変（Ｖ２Ｖ）長コーディング動作、シンタックスベースコンテキスト適応型バイナリ算術コーディング（ＳＢＡＣ：syntax-based context-adaptive binary arithmetic coding）動作、確率間隔区分エントロピー（ＰＩＰＥ：Probability Interval Partitioning Entropy）コーディング動作、指数ゴロム符号化動作、または別のタイプのエントロピー符号化動作をデータに対して実施し得る。いくつかの例では、エントロピー符号化ユニット２２０は、シンタックス要素がエントロピー符号化されないバイパスモード（bypass mode）で動作し得る。

[0143] ビデオエンコーダ２００は、スライスまたはピクチャのブロックを再構築するために必要とされるエントロピー符号化されたシンタックス要素を含むビットストリームを出力し得る。特に、エントロピー符号化ユニット２２０がビットストリームを出力し得る。

[0144] 上記で説明された動作は、ブロックに関して説明されている。そのような説明は、ルーマコーディングブロックおよび／またはクロマコーディングブロックのための動作であるものとして理解されたい。上記で説明されたように、いくつかの例では、ルーマコーディングブロックとクロマコーディングブロックとは、ＣＵのルーマ成分とクロマ成分とである。いくつかの例では、ルーマコーディングブロックとクロマコーディングブロックとは、ＰＵのルーマ成分とクロマ成分とである。

[0145] いくつかの例では、ルーマコーディングブロックに関して実施される動作は、クロマコーディングブロックのために繰り返される必要はない。一例として、ルーマコーディングブロックのための動きベクトル（ＭＶ）と参照ピクチャとを識別するための動作は、クロマブロックのためのＭＶと参照ピクチャとを識別するために繰り返される必要はない。そうではなく、ルーマコーディングブロックのためのＭＶは、クロマブロックのためのＭＶを決定するためにスケーリングされてよく、参照ピクチャは同じであってよい。別の例として、イントラ予測プロセスは、ルーマコーディングブロックとクロマコーディングブロックについて同じであってよい。

[0146] ビデオエンコーダ２００は、本開示において説明されるように、ビデオデータを記憶するように構成されたメモリと、回路中に実装され、係数を符号化するように構成された１つまたは複数の処理ユニットとを含む、ビデオデータを符号化するように構成されたデバイスの例を表す。

[0147] 図１０は、本開示の技法を実施し得る例示的なビデオデコーダ３００を示すブロック図である。図１０は、説明の目的で提供されており、本開示において広く例示され、説明される技法に対する限定ではない。説明の目的で、本開示は、ビデオデコーダ３００についてＪＥＭとＨＥＶＣとの技法に従って説明されることを記載する。しかしながら、本開示の技法は、他のビデオコーディング規格に構成されたビデオコーディングデバイスによって実施され得る。

[0148] 図１０の例では、ビデオデコーダ３００は、コード化ピクチャバッファ（ＣＰＢ：coded picture buffer）メモリ３２０と、エントロピー復号ユニット（entropy decoding unit）３０２と、予測処理ユニット３０４と、逆量子化ユニット３０６と、逆変換処理ユニット３０８と、再構築ユニット３１０と、フィルタユニット３１２と、復号ピクチャバッファ（ＤＰＢ）３１４とを含む。予測処理ユニット３０４は、動き補償ユニット３１６と、イントラ予測ユニット３１８とを含む。予測処理ユニット３０４は、他の予測モードに従って予測を実施するための追加ユニットを含み得る。例として、予測処理ユニット３０４は、パレットユニット、（動き補償ユニット３１６の一部を形成し得る）イントラブロックコピーユニット、アフィンユニット、線形モデル（ＬＭ）ユニットなどを含み得る。他の例では、ビデオデコーダ３００は、より多数の、より少数の、または異なる機能構成要素を含み得る。

[0149] ＣＰＢメモリ３２０は、ビデオデコーダ３００の構成要素によって復号されるべき、符号化ビデオビットストリームなどのビデオデータを記憶し得る。ＣＰＢメモリ３２０に記憶されるビデオデータは、たとえば、コンピュータ可読媒体１１０（図１）から取得され得る。ＣＰＢメモリ３２０は、符号化ビデオビットストリームからの符号化ビデオデータ（たとえば、シンタックス要素）を記憶するＣＰＢを含み得る。また、ＣＰＢメモリ３２０は、ビデオデコーダ３００の様々なユニットからの出力を表す一時データなど、コード化ピクチャのシンタックス要素以外のビデオデータを記憶し得る。ＤＰＢ３１４は、概して、ビデオデコーダ３００が符号化ビデオビットストリームの後続のデータまたはピクチャを復号するときに出力しおよび／または参照ビデオデータとして使用し得る復号ピクチャを記憶する。ＣＰＢメモリ３２０とＤＰＢ３１４とは、同期ＤＲＡＭ（ＳＤＲＡＭ）を含むダイナミックランダムアクセスメモリ（ＤＲＡＭ）、磁気抵抗ＲＡＭ（ＭＲＡＭ）、抵抗性ＲＡＭ（ＲＲＡＭ）、または他のタイプのメモリデバイスなど、様々なメモリデバイスのいずれかによって形成され得る。ＣＰＢメモリ３２０とＤＰＢ３１４とは、同じメモリデバイスまたは別個のメモリデバイスによって提供され得る。様々な例では、ＣＰＢメモリ３２０は、ビデオデコーダ３００の他の構成要素とともにオンチップであるか、またはそれらの構成要素に対してオフチップであり得る。

[0150] 追加または代替として、いくつかの例では、ビデオデコーダ３００は、メモリ１２０（図１）からコード化ビデオデータを取り出し得る。すなわち、メモリ１２０は、ＣＰＢメモリ３２０を用いて上記で論じられたデータを記憶し得る。同様に、メモリ１２０は、ビデオデコーダ３００の機能の一部または全部が、ビデオデコーダ３００の処理回路によって実行されるべきソフトウェアにおいて実装されたとき、ビデオデコーダ３００によって実行されるべき命令を記憶し得る。

[0151] 図１０に示されている様々なユニットは、ビデオデコーダ３００によって実施される動作を理解するのを支援するために示されている。ユニットは、固定機能回路、プログラマブル回路、またはそれらの組合せとして実装され得る。図９と同様に、固定機能回路は、特定の機能を提供する回路を指し、実施され得る動作にプリセットされる。プログラマブル回路は、様々なタスクを実施するように、および実施され得る動作においてフレキシブルな機能を提供するようにプログラムされる回路を指す。たとえば、プログラマブル回路は、ソフトウェアまたはファームウェアの命令によって定義される様式でプログラマブル回路を動作させるソフトウェアまたはファームウェアを実行し得る。固定機能回路は、（たとえば、パラメータを受信するかまたはパラメータを出力するための）ソフトウェア命令を実行し得るが、固定機能回路が実施する動作のタイプは、概して不変である。いくつかの例では、ユニットのうちの１つまたは複数は、別個の回路ブロック（固定機能またはプログラマブル）であり得、いくつかの例では、１つまたは複数のユニットは、集積回路であり得る。

[0152] ビデオデコーダ３００は、ＡＬＵ、ＥＦＵ、デジタル回路、アナログ回路、および／またはプログラマブル回路から形成されるプログラマブルコアを含み得る。ビデオデコーダ３００の動作が、プログラマブル回路上で実行されるソフトウェアによって実施される例では、オンチップまたはオフチップメモリは、ビデオデコーダ３００が受信し実行するソフトウェアの命令（たとえば、オブジェクトコード）を記憶し得る。

[0153] エントロピー復号ユニット３０２は、ＣＰＢから符号化ビデオデータを受信し、ビデオデータをエントロピー復号して、係数コーディングについて上記で説明されたシンタックス要素を含むシンタックス要素を再生し得る。予測処理ユニット３０４と、逆量子化ユニット３０６と、逆変換処理ユニット３０８と、再構築ユニット３１０と、フィルタユニット３１２とは、ビットストリームから抽出されたシンタックス要素に基づいて復号ビデオデータを生成し得る。

[0154] 概して、ビデオデコーダ３００は、ブロックごとにピクチャを再構築する。ビデオデコーダ３００は、各ブロックに対して個々に再構築演算を実施し得る（ここで、現在再構築されているブロック、すなわち、現在復号されているブロックは、「現在ブロック」と呼ばれることがある）。

[0155] エントロピー復号ユニット３０２は、量子化された変換係数ブロックの量子化された変換係数を定義するシンタックス要素、ならびに量子化パラメータ（ＱＰ）および／または変換モードインジケーションなどの変換情報をエントロピー復号し得る。逆量子化ユニット３０６は、量子化の程度と、同様に、逆量子化ユニット３０６が適用すべき逆量子化の程度とを決定するために、量子化された変換係数ブロックに関連付けられたＱＰを使用し得る。逆量子化ユニット３０６は、量子化された変換係数を逆量子化するために、たとえば、ビット単位の左シフト演算を実施し得る。逆量子化ユニット３０６は、それにより、変換係数を含む変換係数ブロックを形成し得る。

[0156] 逆量子化ユニット３０６が変換係数ブロックを形成した後に、逆変換処理ユニット３０８は、現在ブロックに関連する残差ブロックを生成するために、変換係数ブロックに１つまたは複数の逆変換を適用し得る。たとえば、逆変換処理ユニット３０８は、逆ＤＣＴ、逆整数変換、逆カルーネンレーベ変換（ＫＬＴ）、逆回転変換、逆方向変換、または別の逆変換を係数ブロックに適用し得る。

[0157] さらに、予測処理ユニット３０４は、エントロピー復号ユニット３０２によってエントロピー復号された予測情報シンタックス要素に従って予測ブロックを生成する。たとえば、予測情報シンタックス要素が、現在ブロックがインター予測されることを示す場合、動き補償ユニット３１６は、予測ブロックを生成し得る。この場合、予測情報シンタックス要素は、参照ブロックをそれから取り出すべきＤＰＢ３１４中の参照ピクチャ、ならびに現在ピクチャ中の現在ブロックのロケーションに対して参照ピクチャ中の参照ブロックのロケーションを識別する動きベクトルを示し得る。動き補償ユニット３１６は、概して、動き補償ユニット２２４（図９）に関して説明されたのと実質的に同様である様式でインター予測プロセスを実施し得る。

[0158] 別の例として、予測情報シンタックス要素が、現在ブロックがイントラ予測されることを示す場合、イントラ予測ユニット３１８は、予測情報シンタックス要素によって示されるイントラ予測モードに従って予測ブロックを生成し得る。この場合も、イントラ予測ユニット３１８は、概して、イントラ予測ユニット２２６（図９）に関して説明されたのと実質的に同様である様式でイントラ予測プロセスを実施し得る。イントラ予測ユニット３１８は、ＤＰＢ３１４から、現在ブロックに対する隣接サンプルのデータを取り出し得る。

[0159] 再構築ユニット３１０は、予測ブロックと残差ブロックとを使用して現在ブロックを再構築し得る。たとえば、再構築ユニット３１０は、現在ブロックを再構築するために、予測ブロックの対応するサンプルに残差ブロックのサンプルを加算し得る。

[0160] フィルタユニット３１２は、再構築ブロックに対して１つまたは複数のフィルタ演算を実施し得る。たとえば、フィルタユニット３１２は、再構築ブロックのエッジに沿ってブロッキネスアーティファクトを低減するためのデブロッキング動作を実施し得る。フィルタユニット３１２の動作は、すべての例において必ずしも実施されるとは限らない。

[0161] ビデオデコーダ３００は、再構築ブロックをＤＰＢ３１４に記憶し得る。上記で論じられたように、ＤＰＢ３１４は、イントラ予測のための現在ピクチャのサンプルおよび後続の動き補償のための以前に復号されたピクチャなど、参照情報を予測処理ユニット３０４に提供し得る。その上、ビデオデコーダ３００は、ＤＰＢからの復号ピクチャを、後続のプレゼンテーションのために、図１のディスプレイデバイス１１８などのディスプレイデバイス上に出力し得る。

[0162] このようにして、ビデオデコーダ３００は、本開示において説明されるように、ビデオデータを記憶するように構成されたメモリと、回路中に実装され、係数を復号するように構成された１つまたは複数の処理ユニットとを含む、ビデオ復号デバイスの例を表す。

[0163] 図１１Ａと図１１Ｂとは、ビンｎにおけるＣＡＢＡＣプロセスの例を示す。図１１Ａの例４００では、ビンｎにおいて、ビン２における範囲（range）は、あるコンテキスト状態（σ）を所与として、劣勢シンボル（ＬＰＳ：least probable symbol）（ｐ_σ）の確率によって与えられる、ＲａｎｇｅＭＰＳとＲａｎｇｅＬＰＳとを含む。例４００は、ビンｎの値が優勢シンボル（ＭＰＳ：most probable symbol）に等しいときのビンｎ＋１における範囲の更新を示す。この例では、低は同じままであるが、ビンｎ＋１における範囲の値は、ビンｎにおけるＲａｎｇｅＭＰＳの値に低減される。図１１Ｂの例４０２は、ビンｎの値がＭＰＳに等しくない（すなわち、ＬＰＳに等しい）ときのビンｎ＋１における範囲の更新を示す。この例では、低（Low）は、ビンｎにおけるＲａｎｇｅＬＰＳのより低い範囲値に移動される。加えて、ビンｎ＋１における範囲の値は、ビンｎにおけるＲａｎｇｅＬＰＳの値に低減される。

[0164] ＨＥＶＣビデオコーディングプロセスの一例では、範囲（range）は９ビットで表され、低は１０ビットで表される。範囲値および低値を十分な精度で維持するための再正規化プロセスがある。範囲が２５６よりも小さいときはいつでも、再正規化が行われる。したがって、範囲は、再正規化の後、常に２５６以上である。範囲の値と低の値とに応じて、バイナリ算術コーダ（ＢＡＣ：binary arithmetic coder）は、ビットストリームに「０」または「１」を出力するか、または将来の出力のために保持するために（ＢＯ：未解決ビット（bits-outstanding）と呼ばれる）内部変数を更新する。図１２は、範囲に応じたＢＡＣ出力の例を示す。たとえば、範囲と低とが、あるしきい値（たとえば、５１２）を上回るとき、ビットストリームに「１」が出力される。範囲と低とが、あるしきい値（たとえば、５１２）を下回るとき、ビットストリームに「０」が出力される。範囲と下側とが、あるしきい値間にあるとき、ビットストリームに何も出力されない。代わりに、ＢＯ値が増分され得、次のビンが符号化される。

[0165] Ｈ．２６４／ＡＶＣのＣＡＢＡＣコンテキストモデルでは、およびＨＥＶＣのいくつかの例では、１２８個の状態がある。０から６３までであり得る（状態σによって示される）６４個の可能なＬＰＳ確率がある。各ＭＰＳは０または１であり得る。したがって、１２８個の状態は、６４個の状態確率×ＭＰＳのための２個の可能な値（０または１）である。したがって、状態は、７ビットを用いてインデックス付けされ得る。

[0166] ＬＰＳ範囲（ｒａｎｇｅＬＰＳ_σ）を導出する計算を低減するために、すべての場合についての結果が事前計算され、近似値としてルックアップテーブルに記憶され得る。したがって、ＬＰＳ範囲は、単純なテーブルルックアップを使用することによって、乗算なしに取得され得る。乗算は、多くのハードウェアアーキテクチャにおいて有意なレイテンシ（significant latency）を生じ得るので、この乗算を回避することは、いくつかのデバイスまたはアプリケーションにとって重要であり得る。

[0167] ４列事前計算ＬＰＳ範囲テーブル（4-column pre-calculated LPS range table）が乗算の代わりに使用され得る。範囲は４つのセグメントに分割される。セグメントインデックスは、質問（範囲＞＞６）＆３によって導出され得る。事実上、セグメントインデックスは、実際の範囲からビットをシフトし、ドロップすることによって導出される。以下の表１は、可能な範囲およびそれらの対応するインデックスを示す。

[0168] ＬＰＳ範囲テーブルは、次いで、６４個のエントリ（確率状態（probability state）ごとに１つ）×４（範囲インデックスごとに１つ）を有する。各エントリは、範囲ＬＰＳ、すなわち、範囲にＬＰＳ確率を乗算した値である。このテーブルの部分の例が以下の表２に示される。表２は、確率状態９～１２を示す。ＨＥＶＣのための１つの提案では、確率状態は０～６３にわたり得る。

[0169] 各セグメント（すなわち、範囲値）において、各確率状態_σのＬＰＳ範囲があらかじめ定義される。言い換えれば、確率状態_σのＬＰＳ範囲が４つの値（すなわち、範囲インデックスごとに１つの値）に量子化される。所与のポイントにおいて使用される特定のＬＰＳ範囲は、範囲がどのセグメントに属するかに依存する。テーブル中で使用される可能なＬＰＳ範囲の数は、テーブル列の数（すなわち、可能なＬＰＳ範囲値の数）とＬＰＳ範囲精度との間のトレードオフである。概して、より多数の列は、ＬＰＳ範囲値のより小さい量子化誤差を生じるが、また、テーブルを記憶するためにより多くのメモリの必要を増加させる。より少数の列は、量子化誤差を増加させるが、また、テーブルを記憶するために必要とされるメモリを低減する。

[0170] 上記で説明されたように、各ＬＰＳ確率状態は、対応する確率を有する。各状態の確率ｐは次のように導出され、

ここで、状態σは０から６３である。定数αは、各コンテキスト状態の間の確率変化の量を表す。一例では、α＝０．９４９３であるか、または、より正確には、α＝（０．０１８７５／０．５）^1/63である。状態σ＝０における確率は０．５に等しい（すなわち、ｐ₀＝１／２）。すなわち、コンテキスト状態０において、ＬＰＳとＭＰＳとは、同程度の確率がある。各連続状態における確率は、前の状態にαを乗算することによって導出される。したがって、コンテキスト状態α＝１においてＬＰＳが発生する確率は、ｐ₀＊０．９４９３である（０．５＊０．９４９３＝．４７４６５）。したがって、状態αのインデックスが増加するにつれて、ＬＰＳが発生する確率は下がる。

[0171] ＣＡＢＡＣは、確率状態が信号統計値（すなわち、前にコーディングされたビンの値）に従うように更新されるので、適応型である。更新プロセスは次の通りである。所与の確率状態について、更新は、状態インデックスと、ＬＰＳまたはＭＰＳのいずれかとして識別される符号化シンボルの値とに依存する。更新プロセスの結果として、潜在的に修正されたＬＰＳ確率推定値と、必要な場合、修正されたＭＰＳ値とからなる、新しい確率状態が導出される。

[0172] ＭＰＳに等しいビン値の場合、所与の状態インデックスは１だけ増分され得る。これは、ＬＰＳ確率がすでにそれの最小値にある（または等価的に、最大ＭＰＳ確率に達した）、状態インデックス６２においてＭＰＳが発生したときを除く、すべての状態に関してである。この場合、ＬＰＳが見られるか、または最後のビン値が符号化されるまで、状態インデックス６２は固定のままである（最後のビン値の特殊な場合には状態６３が使用される）。ＬＰＳが発生したとき、状態インデックスは、次の式に示されているように、状態インデックスをある量だけ減分することによって変更される。このルールは、概して、次の例外とともにＬＰＳの各発生に適用される。ＬＰＳが、同程度の確率がある場合に対応する、インデックスσ＝０をもつ状態において符号化されたと仮定すると、状態インデックスは固定のままであるが、ＭＰＳ値は、ＬＰＳの値とＭＰＳの値とが交換されるようにトグルされることになる。すべての他の場合には、たとえどのシンボルが符号化されたとしても、ＭＰＳ値は改変されない。ＬＰＳ確率の遷移ルールの導出は、所与ＬＰＳ確率ｐ_oldと、それの更新された相対物ｐ_newとの間の次の関係に基づく。

ＭＰＳが発生した場合、ｐ_new＝ｍａｘ（αｐ_old，ｐ₆₂）
ＬＰＳが発生した場合、ｐ_new＝（１－α）＋αｐ_old
[0173] ＣＡＢＡＣにおける確率推定プロセスの実際的な実装形態に関して、すべての遷移ルールは、６ビット符号なし整数値の６３個のエントリをそれぞれ有する多くて２つのテーブルによって実現され得ることに留意することが重要である。いくつかの例では、状態遷移は、所与の状態インデックスσについて、ＬＰＳが観測された場合に新しい更新された状態インデックスＴｒａｎｓＩｄｘＬＰＳ［σ]を決定する、単一のテーブルＴｒａｎｓＩｄｘＬＰＳを用いて決定され得る。ＭＰＳ駆動型遷移は、１の固定値による状態インデックスの単純な（飽和）増分によって取得され、更新された状態インデックスｍｉｎ（σ＋１，６２）を生じることができる。以下の表３は、部分的なＴｒａｎｓＩｄｘＬＰＳテーブルの例である。

[0174] 図１１Ａと、図１１Ｂと、図１２とに関して上記で説明された技法は、ＣＡＢＡＣの１つの例示的な実装形態を表すにすぎない。本開示の技法は、ＣＡＢＡＣのこの説明された実装形態のみに限定されないことを理解されたい。たとえば、より古いＢＡＣ手法（たとえば、Ｈ．２６４／ＡＶＣにおいて使用されるＢＡＣ手法）では、テーブルＲａｎｇｅＬＰＳおよびＴｒａｎｓＩｄｘＬＰＳは、低解像度ビデオ（すなわち、共通中間フォーマット（ＣＩＦ）およびクォーターＣＩＦ（ＱＣＩＦ）ビデオ）のために調節された。ＨＥＶＣ、およびＶＶＣなどの将来のコーデックでは、大量のビデオコンテンツが高精細度（ＨＤ）であり、いくつかの場合には、ＨＤよりも大きい。ＨＤ解像度またはＨＤよりも大きい解像度であるビデオコンテンツは、Ｈ．２６４／ＡＶＣを開発するために使用される１０年前のＱＣＩＦシーケンスとは異なる統計値を有する傾向がある。したがって、Ｈ．２６４／ＡＶＣからのテーブルＲａｎｇｅＬＰＳおよびＴｒａｎｓＩｄｘＬＰＳは、あまりに急速である様式で状態間の適応を引き起こし得る。すなわち、確率状態間の遷移は、特にＬＰＳが発生するときは、ＨＤビデオのより平滑でより高解像度のコンテンツには大きくなりすぎ得る。したがって、従来の技法に従って使用される確率モデルは、ＨＤおよび極ＨＤコンテンツにとってあまり正確でないことがある。さらに、ＨＤビデオコンテンツはピクセル値のより広い範囲を含むので、Ｈ．２６４／ＡＶＣテーブルは、ＨＤコンテンツ中に存在し得るより極端な値を考慮するのに十分なエントリを含まない。

[0175] したがって、ＨＥＶＣと、ＶＶＣなどの将来のコーディング規格とのために、ＲａｎｇｅＬＰＳおよびＴｒａｎｓＩｄｘＬＰＳテーブルは、この新しいコンテンツの特性を考慮するように修正され得る。特に、ＨＥＶＣと将来のコーディング規格とのためのＢＡＣプロセスは、より遅い適応プロセスを可能にするテーブルを使用し得、より極端な場合（すなわち、歪み確率）を考慮し得る。したがって、一例として、ＲａｎｇｅＬＰＳおよびＴｒａｎｓＩｄｘＬＰＳテーブルは、Ｈ．２６４／ＡＶＣまたはＨＥＶＣを用いるＢＡＣにおいて使用されるよりも多くの確率状態および範囲を含むことによってこれらの目的を達成するように修正され得る。

[0176] 図１３は、本開示の技法による、ＣＡＢＡＣを実施するように構成され得る例示的なエントロピー符号化ユニット２２０のブロック図である。シンタックス要素４１８がエントロピー符号化ユニット２２０に入力される。シンタックス要素がすでにバイナリ値シンタックス要素（すなわち、０と１との値のみを有するシンタックス要素）である場合、バイナリ化のステップはスキップされ得る。シンタックス要素が非バイナリ値シンタックス要素（non-binary valued syntax element）（たとえば、変換係数レベルなど、複数のビットによって表されるシンタックス要素）である場合、非バイナリ値シンタックス要素はバイナライザ４２０によってバイナリ化される。バイナライザ４２０は、バイナリ決定のシーケンスへの非バイナリ値シンタックス要素のマッピングを実施する。これらのバイナリ決定は、しばしば「ビン（bin）」と呼ばれる。たとえば、変換係数レベルでは、レベルの値は連続するビンに分けられ得、各ビンは、係数レベルの絶対値がある値よりも大きいか否かを示す。たとえば、（有意性フラグと呼ばれることがある）ビン０は、変換係数レベルの絶対値が０よりも大きいか否かを示す。ビン１は、変換係数レベルの絶対値が１よりも大きいか否かを示す、などである。各非バイナリ値シンタックス要素について、一意のマッピングが作成され得る。

[0177] バイナライザ４２０によって生成された各ビンは、エントロピー符号化ユニット２２０のバイナリ算術コーディング側に供給される。すなわち、非バイナリ値シンタックス要素の所定のセットについて、各ビンタイプ（たとえば、ビン０）が次のビンタイプ（たとえば、ビン１）の前にコーディングされる。コーディングは、正規モードまたはバイパスモードのいずれかで実施され得る。バイパスモードでは、バイパスコーディングエンジン４２６が、固定確率モデル（fixed probability model）を使用して、たとえば、ゴロム－ライスまたは指数ゴロムコーディングを使用して、算術コーディングを実施する。バイパスモードは、概して、より予測可能なシンタックス要素のために使用される。

[0178] 正規モードでのコーディングは、ＣＡＢＡＣを実施することを伴う。正規モードＣＡＢＡＣは、ビンの値の確率が、前にコーディングされたビンの値を与えられれば予測可能である場合に、ビン値をコーディングするためのものである。ビンがＬＰＳである確率がコンテキストモデラ（context modeler）４２２によって決定される。コンテキストモデラ４２２は、ビン値とコンテキストモデル（たとえば、確率状態σ）とを出力する。コンテキストモデルは、一連のビンのための初期コンテキストモデルであり得るか、または前にコーディングされたビンのコード化値に基づいて決定され得る。上記で説明されたように、コンテキストモデラは、前にコーディングされたビンがＭＰＳであったかＬＰＳであったか否かに基づいて状態を更新し得る。

[0179] コンテキストモデルと確率状態σとがコンテキストモデラ４２２によって決定された後に、正規コーディングエンジン（regular coding engine）４２４が、ビン値に対してＢＡＣを実施する。本開示の技法に従って、正規コーディングエンジン４２４は、６５個以上の確率状態σを含むＴｒａｎｓＩｄｘＬＰＳテーブル４３０を使用してＢＡＣを実施する。一例では、確率状態の数は１２８である。ＴｒａｎｓＩｄｘＬＰＳは、前のビン（ビンｎ）がＬＰＳであるとき、次のビン（ビンｎ＋１）のためにどの確率状態が使用されるかを決定するために使用される。正規コーディングエンジン４２４はまた、特定の確率状態σを所与としてＬＰＳの範囲値を決定するために、ＲａｎｇｅＬＰＳテーブル１２８を使用し得る。しかしながら、本開示の技法によれば、ＴｒａｎｓＩｄｘＬＰＳテーブル４３０のすべての可能な確率状態σを使用するのではなく、確率状態インデックスσは、ＲａｎｇｅＬＰＳテーブルにおいて使用するためのグループ化インデックスにマッピングされる。すなわち、ＲａｎｇｅＬＰＳテーブル４２８への各インデックスは、確率状態の総数のうちの２つ以上を表し得る。グループ化インデックスへの確率状態インデックスσのマッピングは、（たとえば、２による除算によって）線形であり得るか、あるいは非線形（たとえば、対数関数またはマッピングテーブル）であり得る。

[0180] 本開示の他の例では、連続する確率状態の間の差分は、パラメータαが０．９４９３よりも大きくなるように設定することによって、より小さくされ得る。一例では、α＝０．９６８９である。本開示の別の例では、ＬＰＳが発生する最も高い確率（ｐ₀）は、０．５よりも低くなるように設定され得る。一例では、ｐ₀は０．４９３に等しくなり得る。

[0181] 本開示の１つまたは複数の技法によれば、バイナリ算術コーディングプロセスにおいて確率状態を更新するために使用される変数（たとえば、ウィンドウサイズ、スケーリングファクタ（scaling factor）（α）、および確率更新速度（probability updating speed）のうちの１つまたは複数）の同じ値を使用するのとは対照的に、エントロピー符号化ユニット２２０は、異なるコンテキストモデルおよび／または異なるシンタックス要素のために変数の異なる値を使用し得る。たとえば、エントロピー符号化ユニット２２０は、複数のコンテキストモデルのうちのコンテキストモデルのために、バイナリ算術コーディングプロセスにおいて確率状態を更新するために使用される変数の値を決定し、決定された値に基づいて確率状態を更新し得る。

[0182] 図１４は、本開示の技法による、ＣＡＢＡＣを実施するように構成され得る例示的なエントロピー復号ユニット３０２のブロック図である。図１４のエントロピー復号ユニット３０２は、図１３で説明されたエントロピー符号化ユニット２２０の様式とは逆の様式でＣＡＢＡＣを実施する。ビットストリーム４４８からのコード化ビット（coded bit）がエントロピー復号ユニット３０２に入力される。コード化ビットは、コード化ビットがバイパスモードを使用してエントロピーコーディングされたか、正規モードを使用してエントロピーコーディングされたか否かに基づいて、コンテキストモデラ４５０またはバイパス復号エンジン４５２のいずれかに供給される。コード化ビットがバイパスモードでコーディングされた場合、バイパス復号エンジン４５２は、たとえば、バイナリ値シンタックス要素または非バイナリシンタックス要素のビンを取り出すために、ゴロムライスまたは指数ゴロム復号を使用し得る。

[0183] コード化ビットが正規モードでコーディングされた場合、コンテキストモデラ４５０はコード化ビットのための確率モデルを決定し得、正規復号エンジン（regular decoding engine）４５４は、非バイナリ値シンタックス要素のビン（または、バイナリ値の場合、シンタックス要素自体）を生成するために、コード化ビットを復号し得る。コンテキストモデルと確率状態σとがコンテキストモデラ４５０によって決定された後に、正規復号エンジン４５４はビン値に対してＢＡＣを実施する。本開示の技法に従って、正規復号エンジン４５４は、６５個以上の確率状態σを含むＴｒａｎｓＩｄｘＬＰＳテーブル４５８を使用してＢＡＣを実施する。一例では、確率状態の数は１２８であるが、本開示の技法に合致する、確率状態の他の数が定義され得る。ＴｒａｎｓＩｄｘＬＰＳテーブル４５８は、前のビン（ビンｎ）がＬＰＳであるとき、次のビン（ビンｎ＋１）のためにどの確率状態が使用されるかを決定するために使用される。正規復号エンジン４５４はまた、特定の確率状態σを所与としてＬＰＳの範囲値を決定するために、ＲａｎｇｅＬＰＳテーブル４５６を使用し得る。しかしながら、本開示の技法によれば、ＴｒａｎｓＩｄｘＬＰＳテーブル４５８のすべての可能な確率状態σを使用するのではなく、確率状態インデックスσは、ＲａｎｇｅＬＰＳテーブル４５６において使用するためのグループ化インデックスにマッピングされる。すなわち、ＲａｎｇｅＬＰＳテーブル４５６への各インデックスは、確率状態の総数のうちの２つ以上を表し得る。グループ化インデックスへの確率状態インデックスσのマッピングは、（たとえば、２による除算によって）線形であり得るか、あるいは非線形（たとえば、対数関数またはマッピングテーブル）であり得る。

[0184] 本開示の他の例では、連続する確率状態の間の差分は、パラメータαが０．９４９３よりも大きくなるように設定することによって、より小さくされ得る。一例では、α＝０．９６８９である。本開示の別の例では、ＬＰＳが発生する最も高い確率（ｐ₀）は、０．５よりも低くなるように設定され得る。一例では、ｐ₀は０．４９３に等しくなり得る。

[0185] ビンが正規復号エンジン４５４によって復号された後に、逆バイナライザ（reverse binarizer）４６０は、ビンを非バイナリ値シンタックス要素の値にコンバートし戻すために逆マッピングを実施し得る。

[0186] 図１５は、ビデオデータの現在ブロックを符号化するためのビデオエンコーダの例示的な動作を示すフローチャートである。現在ブロックは現在ＣＵを含み得る。ビデオエンコーダ２００（図１および図９）に関して説明されるが、他のデバイスが図１５の動作と同様の動作を実施するように構成され得ることを理解されたい。

[0187] この例では、ビデオエンコーダ２００は、最初に、現在ブロックを予測する（５５０）。たとえば、ビデオエンコーダ２００は、現在ブロックについての予測ブロックを形成し得る。ビデオエンコーダ２００は、次いで、現在ブロックについての残差ブロックを計算し得る（５５２）。残差ブロックを計算するために、ビデオエンコーダ２００は、元のコーディングされていないブロックと、現在ブロックについての予測ブロックとの間の差分を計算し得る。ビデオエンコーダ２００は、次いで、残差ブロックの係数を変換し量子化し得る（５５４）。次に、ビデオエンコーダ２００は、残差ブロックの量子化された変換係数を走査し得る（５５６）。走査中に、または走査に続いて、ビデオエンコーダ２００は、係数をエントロピー符号化し得る（５５８）。たとえば、ビデオエンコーダ２００は、ＣＡＶＬＣまたはＣＡＢＡＣを使用して係数を符号化し得る。ビデオエンコーダ２００は、次いで、ブロックのエントロピーコーディングされたデータを出力し得る（５６０）。

[0188] 図１６は、ビデオデータの現在ブロックを復号するためのビデオデコーダの例示的な動作を示すフローチャートである。現在ブロックは現在ＣＵを含み得る。ビデオデコーダ３００（図１および図３）に関して説明されるが、他のデバイスが図１６の動作と同様の動作を実施するように構成され得ることを理解されたい。

[0189] ビデオデコーダ３００は、エントロピーコーディングされた予測情報、および現在ブロックに対応する残差ブロックの係数についてのエントロピーコーディングされたデータなど、現在ブロックについてのエントロピーコーディングされたデータを受信し得る（５７０）。ビデオデコーダ３００は、エントロピーコーディングされたデータをエントロピー復号して、現在のブロックについての予測情報を決定し、残差ブロックの係数を再生し得る（５７２）。ビデオデコーダ３００は、現在ブロックについての予測ブロックを計算するために、たとえば、現在ブロックについての予測情報によって示されるイントラ予測またはインター予測モードを使用して、現在ブロックを予測し得る（５７４）。ビデオデコーダ３００は、次いで、量子化された変換係数のブロックを作成するために、再生された係数を逆走査し得る（５７６）。ビデオデコーダ３００は、次いで、係数を逆量子化し、逆変換して、残差ブロックを生成し得る（５７８）。ビデオデコーダ３００は、最終的に、予測ブロックと残差ブロックとを組み合わせることによって現在ブロックを復号し得る（５８０）。

[0190] 図１７は、係数値を復号するためのビデオデコーダの例示的な動作を示すフローチャートである。ビデオデコーダ３００（図１および図１０）に関して説明されるが、他のデバイスが図１７の動作と同様の動作を実施するように構成され得ることを理解されたい。

[0191] ビデオデコーダ３００が、第１の復号パスのために正規コード化ビンのしきい値数を決定する（６０２）。

[0192] 係数の第１のセットについて、ビデオデコーダ３００は、正規コード化ビンのしきい値数に達するまで、係数グループのシンタックス要素をコンテキスト復号する（６０４）。シンタックス要素のコンテキスト復号されるビンは、上記で説明されたように、たとえば、１つまたは複数の有意性フラグと、１つまたは複数のパリティレベルフラグと、１つまたは複数の第１のフラグとを含み得る。１つまたは複数の有意性フラグの各々は、係数の絶対レベルが０に等しいかどうかを示し得、１つまたは複数のパリティレベルフラグの各々は、係数が偶数である絶対レベルを有するか奇数である絶対レベルを有するかを示し得る。１つまたは複数の第１のフラグの各々は、係数が２よりも大きい絶対レベルを有するかどうかを示し得る。

[0193] 係数グループのシンタックス要素をコンテキスト復号するために、ビデオデコーダ３００は、係数グループのシンタックス要素を復号するためにコンテキスト適応型バイナリ算術復号（context-adaptive binary arithmetic decoding）を実施し得る。他の例では、正規コード化ビンのしきい値数に達するまで、係数グループのシンタックス要素をコンテキスト復号するために、ビデオデコーダ３００は、係数の第１のセットの係数のためのシンタックス要素をコーディングしている間、正規コード化ビンのしきい値数に達したと決定し、係数の第１のセットの係数のための１つまたは複数の残りのシンタックス要素をコンテキスト復号し得る。

[0194] ビデオデコーダ３００は、シンタックス要素のコンテキスト復号されたビンに基づいて変換ユニットの係数の第１のセットの値を決定する（６０６）。正規コード化ビンのしきい値数に達したことに応答して、係数の第２のセットについて、ビデオデコーダ３００は、追加のシンタックス要素をバイパス復号する（６０８）。追加のシンタックス要素をバイパス復号するために、ビデオデコーダ３００は、係数の第２のセットのうちの係数について、ライスパラメータの値を導出し得る。

[0195] ビデオデコーダ３００は、追加のシンタックス要素に基づいて変換ユニットの係数の第２のセットの値を決定する（６１０）。追加のシンタックス要素に基づいて変換ユニットの係数の第２のセットの値を決定するために、ビデオデコーダ３００は、ライスパラメータに基づいてゼロパラメータの値を決定する（６１２）。ライスパラメータに基づいてゼロパラメータの値を決定するために、ビデオデコーダ３００は、たとえば、ライスパラメータに基づいて、また状態機械の現在の状態に基づいてゼロパラメータの値を決定し得る。上記で説明されたように、ゼロパラメータの値は、０の係数レベルに対応するコード化値を識別する。ビデオデコーダ３００は、たとえば、ルックアップテーブルからまたは何らかの他の方法でライスパラメータの値を決定し得る。

[0196] 追加のシンタックス要素に基づいて変換ユニットの係数の第２のセットの値を決定するために、ビデオデコーダ３００はまた、係数の第２のセットのうちの第１の係数のための第１のコード化値を受信し（６１４）、ゼロパラメータの値と第１の係数のための第１のコード化値とに基づいて、第１の係数のレベルを決定する（６１６）。第１の係数のレベルは、たとえば、残存レベルまたは絶対レベルのいずれかであり得る。

[0197] ゼロパラメータの値が第１のコード化値に等しいことに応答して、ビデオデコーダ３００は、第１の係数のレベルが０に等しいと決定し得る。第１のコード化値がゼロパラメータの値よりも大きいことに応答して、ビデオデコーダ３００は、第１の係数のレベルが第１のコード化値に等しいと決定し得る。他の事例では、第１のコード化値がゼロパラメータの値よりも小さいことに応答して、ビデオデコーダ３００は、第１の係数のレベルが第１のコード化値＋１に等しいと決定し得る。

[0198] ビデオデコーダ３００はまた、係数の第１のセットの値と係数の第２のセットの値とに基づいて、復号された変換ブロックを決定し、再構築ブロックを決定するために、復号された変換ブロックを予測ブロックに追加し、ビデオデータの復号ブロック（decoded block）を決定するために、再構築ブロックに対して１つまたは複数のフィルタ処理演算を実施し、ビデオデータの復号ブロックを含むビデオデータの復号ピクチャを出力し得る。

[0199] 上記例に応じて、本明細書で説明された技法のいずれかのいくつかの行為またはイベントは、異なるシーケンスで実施され得、追加、マージ、または完全に除外され得る（たとえば、すべての説明された行為またはイベントが本技法の実践のために必要であるとは限らない）ことを認識されたい。その上、いくつかの例では、行為またはイベントは、連続的にではなく、たとえば、マルチスレッド処理、割込み処理、または複数のプロセッサを通して同時に実施され得る。

[0200] １つまたは複数の例では、説明された機能は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せにおいて実装され得る。ソフトウェアで実装される場合、機能は、１つまたは複数の命令またはコードとして、コンピュータ可読媒体上に記憶されるか、あるいはコンピュータ可読媒体を介して送信され、ハードウェアベースの処理ユニットによって実行され得る。コンピュータ可読媒体は、データ記憶媒体などの有形媒体に対応する、コンピュータ可読記憶媒体を含み得るか、または、たとえば、通信プロトコルに従って、ある場所から別の場所へのコンピュータプログラムの転送を促進する任意の媒体を含む通信媒体を含み得る。このようにして、コンピュータ可読媒体は、概して、（１）非一時的な有形コンピュータ可読記憶媒体、あるいは（２）信号または搬送波などの通信媒体に対応し得る。データ記憶媒体は、本開示において説明された技法の実装のための命令、コードおよび／またはデータ構造を取り出すために、１つまたは複数のコンピュータあるいは１つまたは複数のプロセッサによってアクセスされ得る、任意の利用可能な媒体であり得る。コンピュータプログラム製品はコンピュータ可読媒体を含み得る。

[0201] 限定ではなく例として、そのようなコンピュータ可読記憶媒体は、ＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ（登録商標）、ＣＤ－ＲＯＭまたは他の光ディスクストレージ、磁気ディスクストレージ、または他の磁気ストレージデバイス、フラッシュメモリ、あるいは命令またはデータ構造の形態の所望のプログラムコードを記憶するために使用され得、コンピュータによってアクセスされ得る任意の他の媒体のうちの１つまたは複数を含むことができる。また、いかなる接続もコンピュータ可読媒体と適切に呼ばれる。たとえば、命令が、同軸ケーブル、光ファイバーケーブル、ツイストペア、デジタル加入者回線（ＤＳＬ）、または赤外線、無線、およびマイクロ波などのワイヤレス技術を使用して、ウェブサイト、サーバ、または他のリモートソースから送信される場合、同軸ケーブル、光ファイバーケーブル、ツイストペア、ＤＳＬ、または赤外線、無線、およびマイクロ波などのワイヤレス技術は媒体の定義に含まれる。しかしながら、コンピュータ可読記憶媒体およびデータ記憶媒体は、接続、搬送波、信号、または他の一時的媒体を含むのではなく、代わりに、非一時的な有形の記憶媒体を対象とすることを理解されたい。本明細書で使用されるディスク（disk）およびディスク（disc）は、コンパクトディスク（disc）（ＣＤ）、レーザーディスク（登録商標）（disc）、光ディスク（disc）、デジタル多用途ディスク（disc）（ＤＶＤ）、フロッピー（登録商標）ディスク（disk）およびＢｌｕ－ｒａｙディスク（disc）を含み、ここで、ディスク（disk）は通常、データを磁気的に再生し、ディスク（disc）は、データをレーザーで光学的に再生する。上記の組合せもコンピュータ可読媒体の範囲内に含まれるべきである。

[0202] 命令は、１つまたは複数のＤＳＰ、汎用マイクロプロセッサ、ＡＳＩＣ、ＦＰＧＡ、あるいは他の等価な集積回路またはディスクリート論理回路など、１つまたは複数のプロセッサによって実行され得る。したがって、本明細書で使用される「プロセッサ」という用語は、前述の構造、または本明細書で説明された技法の実装に好適な任意の他の構造のいずれかを指すことがある。さらに、いくつかの態様では、本明細書で説明された機能は、符号化および復号のために構成された専用ハードウェアおよび／またはソフトウェアモジュール内に提供されるか、あるいは複合コーデックに組み込まれ得る。また、本技法は、１つまたは複数の回路または論理要素において完全に実装され得る。

[0203] 本開示の技法は、ワイヤレスハンドセット、集積回路（ＩＣ）またはＩＣのセット（たとえば、チップセット）を含む、多種多様なデバイスまたは装置において実装され得る。本開示では、開示される技法を実施するように構成されたデバイスの機能的態様を強調するために様々な構成要素、モジュール、またはユニットについて説明されたが、それらの構成要素、モジュール、またはユニットを、必ずしも異なるハードウェアユニットによって実現する必要があるとは限らない。むしろ、上記で説明されたように、様々なユニットが、好適なソフトウェアおよび／またはファームウェアとともに、上記で説明された１つまたは複数のプロセッサを含めて、コーデックハードウェアユニットにおいて組み合わされ得るか、または相互動作可能なハードウェアユニットの集合によって提供され得る。

[0204] 様々な例について説明された。これらおよび他の例は、以下の特許請求の範囲内に入る。
以下に、本願の出願当初の特許請求の範囲に記載された発明を付記する。
［Ｃ１］
ビデオデータを復号する方法であって、前記方法は、
第１の復号パスのために正規コード化ビンのしきい値数を決定することと、
係数の第１のセットについて、正規コード化ビンの前記しきい値数に達するまで、係数グループのシンタックス要素のビンをコンテキスト復号することと、ここにおいて、シンタックス要素の前記コンテキスト復号されたビンが、１つまたは複数の有意性フラグと、１つまたは複数のパリティレベルフラグと、１つまたは複数の第１のフラグとを備え、ここにおいて、前記１つまたは複数の有意性フラグの各々は、対応する係数の絶対レベルが０に等しいかどうかを示し、前記１つまたは複数のパリティレベルフラグの各々は、前記対応する係数の前記絶対レベルが偶数であるか奇数であるかを示し、前記１つまたは複数の第１のフラグの各々は、前記対応する係数の前記絶対レベルが２よりも大きいかどうかを示す、
シンタックス要素の前記コンテキスト復号されたビンに基づいて変換ユニットの係数の前記第１のセットの値を決定することと、
正規コード化ビンの前記しきい値数に達したことに応答して、係数の第２のセットについて、追加のシンタックス要素をバイパス復号することと、ここにおいて、前記追加のシンタックス要素をバイパス復号することが、係数の前記第２のセットのうちの係数について、ライスパラメータの値を導出することを備える、
前記追加のシンタックス要素に基づいて前記変換ユニットの係数の前記第２のセットの値を決定することと、ここにおいて、前記追加のシンタックス要素に基づいて前記変換ユニットの係数の前記第２のセットの前記値を決定することは、
ライスパラメータに基づいてゼロパラメータの値を決定することと、ここにおいて、前記ゼロパラメータの前記値が、０の係数レベルに対応するコード化値を識別する、
係数の前記第２のセットのうちの第１の係数のための第１のコード化値を受信することと、
前記ゼロパラメータの前記値と前記第１の係数のための前記第１のコード化値とに基づいて、前記第１の係数のレベルを決定することと
を備える、
を備える、方法。
［Ｃ２］
前記第１の係数の前記レベルが、残存レベルを備える、Ｃ１に記載の方法。
［Ｃ３］
前記第１の係数の前記レベルが、絶対レベルを備える、Ｃ１に記載の方法。
［Ｃ４］
前記ライスパラメータに基づいて前記ゼロパラメータの前記値を決定することが、前記ライスパラメータに基づいて、および状態機械の現在の状態に基づいて前記ゼロパラメータの前記値を決定することを備える、Ｃ１に記載の方法。
［Ｃ５］
前記ゼロパラメータの前記値が前記第１のコード化値に等しいことに応答して、前記第１の係数の前記レベルが０に等しいと決定すること
をさらに備える、Ｃ１に記載の方法。
［Ｃ６］
前記第１のコード化値が前記ゼロパラメータの前記値よりも大きいことに応答して、前記第１の係数の前記レベルが前記第１のコード化値に等しいと決定すること
をさらに備える、Ｃ１に記載の方法。
［Ｃ７］
前記第１のコード化値が前記ゼロパラメータの前記値よりも小さいことに応答して、前記第１の係数の前記レベルが前記第１のコード化値＋１に等しいと決定すること
をさらに備える、Ｃ１に記載の方法。
［Ｃ８］
ルックアップテーブルから前記ライスパラメータの前記値を決定すること
をさらに備える、Ｃ１に記載の方法。
［Ｃ９］
前記係数グループの前記シンタックス要素をコンテキスト復号することが、前記係数グループの前記シンタックス要素を復号するためにコンテキスト適応型バイナリ算術復号を実施することを備える、Ｃ１に記載の方法。
［Ｃ１０］
正規コード化ビンの前記しきい値数に達するまで、前記係数グループのシンタックス要素をコンテキスト復号することは、
係数の前記第１のセットの係数のためのシンタックス要素をコーディングしている間、正規コード化ビンの前記しきい値数に達したと決定することと、
係数の前記第１のセットの前記係数のための１つまたは複数の残りのシンタックス要素をコンテキスト復号することと
を備える、Ｃ１に記載の方法。
［Ｃ１１］
係数の前記第１のセットの前記値と係数の前記第２のセットの前記値とに基づいて、復号された変換ブロックを決定することと、
再構築ブロックを決定するために、前記復号された変換ブロックを予測ブロックに追加することと、
ビデオデータの復号ブロックを決定するために、前記再構築ブロックに対して１つまたは複数のフィルタ処理演算を実施することと、
ビデオデータの前記復号ブロックを含むビデオデータの復号ピクチャを出力することとをさらに備える、Ｃ１に記載の方法。
［Ｃ１２］
ビデオデータを復号するためのデバイスであって、前記デバイスが、
前記ビデオデータを記憶するように構成されたメモリと、
回路中に実装された１つまたは複数のプロセッサと
を備え、前記１つまたは複数のプロセッサは、
第１の復号パスのために正規コード化ビンのしきい値数を決定することと、
係数の第１のセットについて、正規コード化ビンの前記しきい値数に達するまで、係数グループのシンタックス要素のビンをコンテキスト復号することと、ここにおいて、シンタックス要素の前記コンテキスト復号されたビンが、１つまたは複数の有意性フラグと、１つまたは複数のパリティレベルフラグと、１つまたは複数の第１のフラグとを備え、ここにおいて、前記１つまたは複数の有意性フラグの各々は、対応する係数の絶対レベルが０に等しいかどうかを示し、前記１つまたは複数のパリティレベルフラグの各々は、前記対応する係数の前記絶対レベルが偶数であるか奇数であるかを示し、前記１つまたは複数の第１のフラグの各々は、前記対応する係数の前記絶対レベルが２よりも大きいかどうかを示す、
シンタックス要素の前記コンテキスト復号されたビンに基づいて変換ユニットの係数の前記第１のセットの値を決定することと、
正規コード化ビンの前記しきい値数に達したことに応答して、係数の第２のセットについて、追加のシンタックス要素をバイパス復号することと、ここにおいて、前記追加のシンタックス要素をバイパス復号するために、前記１つまたは複数のプロセッサが、係数の前記第２のセットのうちの係数について、ライスパラメータの値を導出するように構成された、
前記追加のシンタックス要素に基づいて前記変換ユニットの係数の前記第２のセットの値を決定することと、ここにおいて、前記追加のシンタックス要素に基づいて前記変換ユニットの係数の前記第２のセットの前記値を決定するために、前記１つまたは複数のプロセッサが、
ライスパラメータに基づいてゼロパラメータの値を決定することと、ここにおいて、前記ゼロパラメータの前記値が、０の係数レベルに対応するコード化値を識別する、
係数の前記第２のセットのうちの第１の係数のための第１のコード化値を受信すること、
前記ゼロパラメータの前記値と前記第１の係数のための前記第１のコード化値とに基づいて、前記第１の係数のレベルを決定することと
を行うように構成された、
を行うように構成された、デバイス。
［Ｃ１３］
前記第１の係数の前記レベルが、残存レベルを備える、Ｃ１２に記載のデバイス。
［Ｃ１４］
前記第１の係数の前記レベルが、絶対レベルを備える、Ｃ１２に記載のデバイス。
［Ｃ１５］
前記ライスパラメータに基づいて前記ゼロパラメータの前記値を決定するために、前記１つまたは複数のプロセッサが、前記ライスパラメータに基づいて、および状態機械の現在の状態に基づいて前記ゼロパラメータの前記値を決定するように構成された、Ｃ１２に記載のデバイス。
［Ｃ１６］
前記１つまたは複数のプロセッサは、
前記ゼロパラメータの前記値が前記第１のコード化値に等しいことに応答して、前記第１の係数の前記レベルが０に等しいと決定する
ようにさらに構成された、Ｃ１２に記載のデバイス。
［Ｃ１７］
前記１つまたは複数のプロセッサは、
前記第１のコード化値が前記ゼロパラメータの前記値よりも大きいことに応答して、前記第１の係数の前記レベルが前記第１のコード化値に等しいと決定する
ようにさらに構成された、Ｃ１２に記載のデバイス。
［Ｃ１８］
前記１つまたは複数のプロセッサは、
前記第１のコード化値が前記ゼロパラメータの前記値よりも小さいことに応答して、前記第１の係数の前記レベルが前記第１のコード化値＋１に等しいと決定する
ようにさらに構成された、Ｃ１２に記載のデバイス。
［Ｃ１９］
前記１つまたは複数のプロセッサが、
ルックアップテーブルから前記ライスパラメータの前記値を決定する
ようにさらに構成された、Ｃ１２に記載のデバイス。
［Ｃ２０］
前記係数グループの前記シンタックス要素をコンテキスト復号するために、前記１つまたは複数のプロセッサが、前記係数グループの前記シンタックス要素を復号するためにコンテキスト適応型バイナリ算術復号を実施するように構成された、Ｃ１２に記載のデバイス。
［Ｃ２１］
正規コード化ビンの前記しきい値数に達するまで、前記係数グループのシンタックス要素をコンテキスト復号するために、前記１つまたは複数のプロセッサは、
係数の前記第１のセットの係数のためのシンタックス要素をコーディングしている間、正規コード化ビンの前記しきい値数に達したと決定することと、
係数の前記第１のセットの前記係数のための１つまたは複数の残りのシンタックス要素をコンテキスト復号することと
を行うように構成された、Ｃ１２に記載のデバイス。
［Ｃ２２］
前記１つまたは複数のプロセッサが、
係数の前記第１のセットの前記値と係数の前記第２のセットの前記値とに基づいて、復号された変換ブロックを決定することと、
再構築ブロックを決定するために、前記復号された変換ブロックを予測ブロックに追加することと、
ビデオデータの復号ブロックを決定するために、前記再構築ブロックに対して１つまたは複数のフィルタ処理演算を実施することと、
ビデオデータの前記復号ブロックを含むビデオデータの復号ピクチャを出力することとを行うようにさらに構成された、Ｃ１２に記載のデバイス。
［Ｃ２３］
前記デバイスが、符号化ビデオデータを受信するように構成された受信機をさらに備えるワイヤレス通信デバイスを備える、Ｃ１２に記載のデバイス。
［Ｃ２４］
前記ワイヤレス通信デバイスが、電話ハンドセットを備え、ここにおいて、前記受信機が、ワイヤレス通信規格に従って、前記符号化ビデオデータを備える信号を復調するように構成された、Ｃ２３に記載のデバイス。
［Ｃ２５］
復号ビデオデータを表示するように構成されたディスプレイ
をさらに備える、Ｃ１２に記載のデバイス。
［Ｃ２６］
前記デバイスが、カメラ、コンピュータ、モバイルデバイス、ブロードキャスト受信機デバイス、またはセットトップボックスのうちの１つまたは複数を備える、Ｃ１２に記載のデバイス。
［Ｃ２７］
命令を記憶するコンピュータ可読記憶媒体であって、前記命令は、１つまたは複数のプロセッサによって実行されたとき、前記１つまたは複数のプロセッサに、
第１の復号パスのために正規コード化ビンのしきい値数を決定することと、
係数の第１のセットについて、正規コード化ビンの前記しきい値数に達するまで、係数グループのシンタックス要素のビンをコンテキスト復号することと、ここにおいて、シンタックス要素の前記コンテキスト復号されたビンが、１つまたは複数の有意性フラグと、１つまたは複数のパリティレベルフラグと、１つまたは複数の第１のフラグとを備え、ここにおいて、前記１つまたは複数の有意性フラグの各々は、対応する係数の絶対レベルが０に等しいかどうかを示し、前記１つまたは複数のパリティレベルフラグの各々は、前記対応する係数の前記絶対レベルが偶数であるか奇数であるかを示し、前記１つまたは複数の第１のフラグの各々は、前記対応する係数の前記絶対レベルが２よりも大きいかどうかを示す、
シンタックス要素の前記コンテキスト復号されたビンに基づいて変換ユニットの係数の前記第１のセットの値を決定することと、
正規コード化ビンの前記しきい値数に達したことに応答して、係数の第２のセットについて、追加のシンタックス要素をバイパス復号することと、ここにおいて、前記追加のシンタックス要素をバイパス復号するために、前記命令が、前記１つまたは複数のプロセッサに、係数の前記第２のセットのうちの係数について、ライスパラメータの値を導出させる、
前記追加のシンタックス要素に基づいて前記変換ユニットの係数の前記第２のセットの値を決定することと、ここにおいて、前記追加のシンタックス要素に基づいて前記変換ユニットの係数の前記第２のセットの前記値を決定するために、前記命令が、前記１つまたは複数のプロセッサに、
ライスパラメータに基づいてゼロパラメータの値を決定することと、ここにおいて、前記ゼロパラメータの前記値が、０の係数レベルに対応するコード化値を識別する、
係数の前記第２のセットのうちの第１の係数のための第１のコード化値を受信すること、
前記ゼロパラメータの前記値と前記第１の係数のための前記第１のコード化値とに基づいて、前記第１の係数のレベルを決定することと
を行わせる、
を行わせる、コンピュータ可読記憶媒体。
［Ｃ２８］
前記第１の係数の前記レベルが、残存レベルを備える、Ｃ２７に記載のコンピュータ可読記憶媒体。
［Ｃ２９］
前記第１の係数の前記レベルが、絶対レベルを備える、Ｃ２７に記載のコンピュータ可読記憶媒体。
［Ｃ３０］
前記ライスパラメータに基づいて前記ゼロパラメータの前記値を決定するために、前記命令が、前記１つまたは複数のプロセッサに、前記ライスパラメータに基づいて、および状態機械の現在の状態に基づいて前記ゼロパラメータの前記値を決定させる、Ｃ２７に記載のコンピュータ可読記憶媒体。
［Ｃ３１］
前記命令は、前記１つまたは複数のプロセッサに、
前記ゼロパラメータの前記値が前記第１のコード化値に等しいことに応答して、前記第１の係数の前記レベルが０に等しいと決定する
ことをさらに行わせる、Ｃ２７に記載のコンピュータ可読記憶媒体。
［Ｃ３２］
前記命令は、前記１つまたは複数のプロセッサに、
前記第１のコード化値が前記ゼロパラメータの前記値よりも大きいことに応答して、前記第１の係数の前記レベルが前記第１のコード化値に等しいと決定する
ことをさらに行わせる、Ｃ２７に記載のコンピュータ可読記憶媒体。
［Ｃ３３］
前記命令は、前記１つまたは複数のプロセッサに、
前記第１のコード化値が前記ゼロパラメータの前記値よりも小さいことに応答して、前記第１の係数の前記レベルが前記第１のコード化値＋１に等しいと決定する
ことをさらに行わせる、Ｃ２７に記載のコンピュータ可読記憶媒体。
［Ｃ３４］
前記命令が、前記１つまたは複数のプロセッサに、
ルックアップテーブルから前記ライスパラメータの前記値を決定する
ことをさらに行わせる、Ｃ２７に記載のコンピュータ可読記憶媒体。
［Ｃ３５］
前記係数グループの前記シンタックス要素をコンテキスト復号するために、前記命令が、前記１つまたは複数のプロセッサに、前記係数グループの前記シンタックス要素を復号するためにコンテキスト適応型バイナリ算術復号を実施させる、Ｃ２７に記載のコンピュータ可読記憶媒体。
［Ｃ３６］
正規コード化ビンの前記しきい値数に達するまで、前記係数グループのシンタックス要素をコンテキスト復号するために、前記命令が、前記１つまたは複数のプロセッサに、係数の前記第１のセットの係数のためのシンタックス要素をコーディングしている間、正規コード化ビンの前記しきい値数に達したと決定することと、
係数の前記第１のセットの前記係数のための１つまたは複数の残りのシンタックス要素をコンテキスト復号することと
を行わせる、Ｃ２７に記載のコンピュータ可読記憶媒体。
［Ｃ３７］
前記命令が、前記１つまたは複数のプロセッサに、
係数の前記第１のセットの前記値と係数の前記第２のセットの前記値とに基づいて、復号された変換ブロックを決定することと、
再構築ブロックを決定するために、前記復号された変換ブロックを予測ブロックに追加することと、
ビデオデータの復号ブロックを決定するために、前記再構築ブロックに対して１つまたは複数のフィルタ処理演算を実施することと、
ビデオデータの前記復号ブロックを含むビデオデータの復号ピクチャを出力することとをさらに行わせる、Ｃ２７に記載のコンピュータ可読記憶媒体。
［Ｃ３８］
ビデオデータを復号するための装置であって、前記装置は、
第１の復号パスのために正規コード化ビンのしきい値数を決定するための手段と、
係数の第１のセットについて、正規コード化ビンの前記しきい値数に達するまで、係数グループのシンタックス要素のビンをコンテキスト復号するための手段と、ここにおいて、シンタックス要素の前記コンテキスト復号されたビンが、１つまたは複数の有意性フラグと、１つまたは複数のパリティレベルフラグと、１つまたは複数の第１のフラグとを備え、ここにおいて、前記１つまたは複数の有意性フラグの各々は、対応する係数の絶対レベルが０に等しいかどうかを示し、前記１つまたは複数のパリティレベルフラグの各々は、前記対応する係数の前記絶対レベルが偶数であるか奇数であるかを示し、前記１つまたは複数の第１のフラグの各々は、前記対応する係数の前記絶対レベルが２よりも大きいかどうかを示す、
シンタックス要素の前記コンテキスト復号されたビンに基づいて変換ユニットの係数の前記第１のセットの値を決定するための手段と、
正規コード化ビンの前記しきい値数に達したことに応答して、係数の第２のセットについて、追加のシンタックス要素をバイパス復号するための手段と、ここにおいて、前記追加のシンタックス要素をバイパス復号するための前記手段が、係数の前記第２のセットのうちの係数について、ライスパラメータの値を導出するための手段を備える、
前記追加のシンタックス要素に基づいて前記変換ユニットの係数の前記第２のセットの値を決定するための手段と、ここにおいて、前記追加のシンタックス要素に基づいて前記変換ユニットの係数の前記第２のセットの前記値を決定するための前記手段は、
ライスパラメータに基づいてゼロパラメータの値を決定するための手段と、ここにおいて、前記ゼロパラメータの前記値が、０の係数レベルに対応するコード化値を識別する、
係数の前記第２のセットのうちの第１の係数のための第１のコード化値を受信するための手段と、
前記ゼロパラメータの前記値と前記第１の係数のための前記第１のコード化値とに基づいて、前記第１の係数のレベルを決定するための手段と
を備える、
を備える、装置。

Claims

ビデオデータを復号する方法であって、前記方法は、
第１の復号パスのために正規コード化ビンのしきい値数を決定することと、
変換ユニットの係数の第１のセットについて、正規コード化ビンの前記しきい値数に達するまで、係数グループのシンタックス要素のビンをコンテキスト復号することと、ここにおいて、シンタックス要素の前記コンテキスト復号されたビンが、１つまたは複数の有意性フラグと、１つまたは複数のパリティレベルフラグと、１つまたは複数の第１のフラグとを備え、ここにおいて、前記１つまたは複数の有意性フラグの各々は、係数の前記第１のセットのうちの対応する係数の絶対レベルが０に等しいかどうかを示し、前記１つまたは複数のパリティレベルフラグの各々は、前記対応する係数の前記絶対レベルが偶数であるか奇数であるかを示し、前記１つまたは複数の第１のフラグの各々は、前記対応する係数の前記絶対レベルが２よりも大きいかどうかを示す、
シンタックス要素の前記コンテキスト復号されたビンのそれぞれに基づいて前記変換ユニットの係数の前記第１のセットのうちの各係数の絶対レベルの値を決定することと、
正規コード化ビンの前記しきい値数に達したことに応答して、前記変換ユニットの係数の第２のセットについて、追加のシンタックス要素をバイパス復号することと、ここにおいて、前記追加のシンタックス要素は、前記係数グループの前記シンタックス要素とは異なり、ここにおいて、前記追加のシンタックス要素をバイパス復号することが、係数の前記第２のセットのうちの各係数について、ライスパラメータの値を導出することを備える、
前記追加のシンタックス要素に基づいて前記変換ユニットの係数の前記第２のセットのうちの各係数の絶対レベルの値を決定することと、ここにおいて、前記追加のシンタックス要素のそれぞれに基づいて前記変換ユニットの係数の前記第２のセットのうちの各係数の前記絶対レベルの前記値を決定することは、
係数の前記第２のセットのうちの第１の係数のための前記ライスパラメータの前記値に基づいてゼロパラメータの値を決定することと、ここにおいて、前記ゼロパラメータの前記値が、０の係数レベルに対応するコード化値を識別する、
前記追加のシンタックス要素の前記それぞれに基づいて、係数の前記第２のセットのうちの前記第１の係数のためのコード化中間値を導出することと、
前記ゼロパラメータの前記値と前記第１の係数のための前記コード化中間値とに基づいて、前記第１の係数の前記絶対レベルの前記値を決定することと
を備える、
を備える、方法。
前記ライスパラメータの前記値に基づいて前記ゼロパラメータの前記値を決定することが、前記ライスパラメータの前記値に基づいて、および状態機械の現在の状態に基づいて前記ゼロパラメータの前記値を決定することを備える、または、
前記方法が、ルックアップテーブルから前記ライスパラメータの前記値を決定することをさらに備える、
請求項１に記載の方法。
前記ゼロパラメータの前記値が前記コード化中間値に等しいことに応答して、前記第１の係数の前記レベルが０に等しいと決定することと、
前記コード化中間値が前記ゼロパラメータの前記値よりも大きいことに応答して、前記第１の係数の前記レベルが前記コード化中間値に等しいと決定することと、
前記コード化中間値が前記ゼロパラメータの前記値よりも小さいことに応答して、前記第１の係数の前記レベルが前記コード化中間値＋１に等しいと決定することと
をさらに備える、請求項１に記載の方法。
前記係数グループの前記シンタックス要素をコンテキスト復号することが、前記係数グループの前記シンタックス要素を復号するためにコンテキスト適応型バイナリ算術復号を実施することを備える、または、
正規コード化ビンの前記しきい値数に達するまで、前記係数グループのシンタックス要素をコンテキスト復号することが、
係数の前記第１のセットの係数のためのシンタックス要素をコーディングしている間、正規コード化ビンの前記しきい値数に達したと決定することと、
係数の前記第１のセットの前記係数のための１つまたは複数の残りのシンタックス要素をコンテキスト復号することと
を備える、請求項１に記載の方法。
係数の前記第１のセットのうちの各係数の絶対レベルの前記値と係数の前記第２のセットのうちの各係数の絶対レベルの前記値とに基づいて、復号された変換ブロックを決定することと、
再構築ブロックを決定するために、前記復号された変換ブロックを予測ブロックに追加することと、
ビデオデータの復号ブロックを決定するために、前記再構築ブロックに対して１つまたは複数のフィルタ処理演算を実施することと、
ビデオデータの前記復号ブロックを含むビデオデータの復号ピクチャを出力することと
をさらに備える、請求項１に記載の方法。
ビデオデータを復号するためのデバイスであって、前記デバイスが、
前記ビデオデータを記憶するように構成されたメモリと、
回路中に実装された１つまたは複数のプロセッサと
を備え、前記１つまたは複数のプロセッサは、
第１の復号パスのために正規コード化ビンのしきい値数を決定することと、
変換ユニットの係数の第１のセットについて、正規コード化ビンの前記しきい値数に達するまで、係数グループのシンタックス要素のビンをコンテキスト復号することと、ここにおいて、シンタックス要素の前記コンテキスト復号されたビンが、１つまたは複数の有意性フラグと、１つまたは複数のパリティレベルフラグと、１つまたは複数の第１のフラグとを備え、ここにおいて、前記１つまたは複数の有意性フラグの各々は、対応する係数の絶対レベルが０に等しいかどうかを示し、前記１つまたは複数のパリティレベルフラグの各々は、前記対応する係数の前記絶対レベルが偶数であるか奇数であるかを示し、前記１つまたは複数の第１のフラグの各々は、前記対応する係数の前記絶対レベルが２よりも大きいかどうかを示す、
シンタックス要素の前記コンテキスト復号されたビンのそれぞれに基づいて前記変換ユニットの係数の前記第１のセットのうちの各係数の絶対レベルの値を決定することと、
正規コード化ビンの前記しきい値数に達したことに応答して、前記変換ユニットの係数の第２のセットについて、追加のシンタックス要素をバイパス復号することと、ここにおいて、前記追加のシンタックス要素は、係数グループのシンタックス要素の前記コンテキスト復号されたビンとは異なり、ここにおいて、前記追加のシンタックス要素をバイパス復号するために、前記１つまたは複数のプロセッサが、係数の前記第２のセットのうちの係数について、ライスパラメータの値を導出するように構成された、
前記追加のシンタックス要素に基づいて前記変換ユニットの係数の前記第２のセットのうちの各係数の絶対レベルの値を決定することと、ここにおいて、前記追加のシンタックス要素のそれぞれに基づいて前記変換ユニットの係数の前記第２のセットのうちの各係数の前記絶対レベルの前記値を決定するために、前記１つまたは複数のプロセッサが、
係数の前記第２のセットのうちの第１の係数のための前記ライスパラメータの前記値に基づいてゼロパラメータの値を決定することと、ここにおいて、前記ゼロパラメータの前記値が、０の係数レベルに対応するコード化値を識別する、
前記追加のシンタックス要素の前記それぞれに基づいて、係数の前記第２のセットのうちの前記第１の係数のためのコード化中間値を導出することと、
前記ゼロパラメータの前記値と前記第１の係数のための前記コード化中間値とに基づいて、前記第１の係数の前記絶対レベルの前記値を決定することと
を行うように構成された、
を行うように構成された、デバイス。
前記ライスパラメータの前記値に基づいて前記ゼロパラメータの前記値を決定するために、前記１つまたは複数のプロセッサが、前記ライスパラメータの前記値に基づいて、および状態機械の現在の状態に基づいて前記ゼロパラメータの前記値を決定するように構成された、または、
前記１つまたは複数のプロセッサが、ルックアップテーブルから前記ライスパラメータの前記値を決定するようにさらに構成された、
請求項６に記載のデバイス。
前記１つまたは複数のプロセッサは、
前記ゼロパラメータの前記値が前記コード化中間値に等しいことに応答して、前記第１の係数の前記レベルが０に等しいと決定することと、
前記のコード化中間値が前記ゼロパラメータの前記値よりも大きいことに応答して、前記第１の係数の前記レベルが前記コード化中間値に等しいと決定することと、
前記コード化中間値が前記ゼロパラメータの前記値よりも小さいことに応答して、前記第１の係数の前記レベルが前記コード化中間値＋１に等しいと決定することと
を行うようにさらに構成された、請求項６に記載のデバイス。
前記係数グループの前記シンタックス要素をコンテキスト復号するために、前記１つまたは複数のプロセッサが、前記係数グループの前記シンタックス要素を復号するためにコンテキスト適応型バイナリ算術復号を実施するように構成された、または、
正規コード化ビンの前記しきい値数に達するまで、前記係数グループのシンタックス要素をコンテキスト復号するために、前記１つまたは複数のプロセッサは、
係数の前記第１のセットの係数のためのシンタックス要素をコーディングしている間、正規コード化ビンの前記しきい値数に達したと決定することと、
係数の前記第１のセットの前記係数のための１つまたは複数の残りのシンタックス要素をコンテキスト復号することと
を行うように構成された、請求項６に記載のデバイス。
前記１つまたは複数のプロセッサが、
係数の前記第１のセットのうちの各係数の絶対レベルの前記値と係数の前記第２のセットのうちの各係数の絶対レベルの前記値とに基づいて、復号された変換ブロックを決定することと、
再構築ブロックを決定するために、前記復号された変換ブロックを予測ブロックに追加することと、
ビデオデータの復号ブロックを決定するために、前記再構築ブロックに対して１つまたは複数のフィルタ処理演算を実施することと、
ビデオデータの前記復号ブロックを含むビデオデータの復号ピクチャを出力することとを行うようにさらに構成された、請求項６に記載のデバイス。
前記デバイスが、符号化ビデオデータを受信するように構成された受信機をさらに備えるワイヤレス通信デバイスを備え、好ましくは、
前記ワイヤレス通信デバイスが、電話ハンドセットを備え、
前記受信機が、ワイヤレス通信規格に従って、前記符号化ビデオデータを備える信号を復調するように構成された、請求項６に記載のデバイス。
復号ビデオデータを表示するように構成されたディスプレイ
をさらに備える、請求項６に記載のデバイス。
前記デバイスが、カメラ、コンピュータ、モバイルデバイス、ブロードキャスト受信機デバイス、またはセットトップボックスのうちの１つまたは複数を備える、請求項６に記載のデバイス。
命令を記憶するコンピュータ可読記憶媒体であって、前記命令は、１つまたは複数のプロセッサによって実行されたとき、前記１つまたは複数のプロセッサに、
第１の復号パスのために正規コード化ビンのしきい値数を決定することと、
変換ユニットの係数の第１のセットについて、正規コード化ビンの前記しきい値数に達するまで、係数グループのシンタックス要素のビンをコンテキスト復号することと、ここにおいて、シンタックス要素の前記コンテキスト復号されたビンが、１つまたは複数の有意性フラグと、１つまたは複数のパリティレベルフラグと、１つまたは複数の第１のフラグとを備え、ここにおいて、前記１つまたは複数の有意性フラグの各々は、対応する係数の絶対レベルが０に等しいかどうかを示し、前記１つまたは複数のパリティレベルフラグの各々は、前記対応する係数の前記絶対レベルが偶数であるか奇数であるかを示し、前記１つまたは複数の第１のフラグの各々は、前記対応する係数の前記絶対レベルが２よりも大きいかどうかを示す、
シンタックス要素の前記コンテキスト復号されたビンのそれぞれに基づいて前記変換ユニットの係数の前記第１のセットのうちの各係数の絶対レベルの値を決定することと、
正規コード化ビンの前記しきい値数に達したことに応答して、前記変換ユニットの係数の第２のセットについて、追加のシンタックス要素をバイパス復号することと、ここにおいて、前記追加のシンタックス要素は、係数グループのシンタックス要素の前記コンテキスト復号されたビンとは異なり、ここにおいて、前記追加のシンタックス要素をバイパス復号するために、前記命令が、前記１つまたは複数のプロセッサに、係数の前記第２のセットのうちの各係数について、ライスパラメータの値を導出させる、
前記追加のシンタックス要素に基づいて前記変換ユニットの係数の前記第２のセットのうちの各係数の絶対レベルの値を決定することと、ここにおいて、前記追加のシンタックス要素に基づいて前記変換ユニットの係数の前記第２のセットのうちの各係数の前記絶対レベルの前記値を決定するために、前記命令が、前記１つまたは複数のプロセッサに、
係数の前記第２のセットのうちの第１の係数のための前記ライスパラメータの前記値に基づいてゼロパラメータの値を決定することと、ここにおいて、前記ゼロパラメータの前記値が、０の係数レベルに対応するコード化値を識別する、
前記追加のシンタックス要素の前記それぞれに基づいて、係数の前記第２のセットのうちの前記第１の係数のためのコード化中間値を導出すること、
前記ゼロパラメータの前記値と前記第１の係数のための前記コード化中間値とに基づいて、前記第１の係数の前記絶対レベルの前記値を決定することと
を行わせる、
を行わせる、コンピュータ可読記憶媒体。
請求項２～５のいずれか一項に記載の方法を前記１つまたは複数のプロセッサに行わせる命令をさらに備える、請求項１４に記載のコンピュータ可読記憶媒体。