JP2023530630A

JP2023530630A - ビデオ符号化のための適応量子化器設計

Info

Publication number: JP2023530630A
Application number: JP2022576094A
Authority: JP
Inventors: クリシュナカントラパカ; ジェホンチョン; アレキサンドロスマイケルトウラピス; デイヴィッドウィリアムシンガー
Original assignee: Apple Inc
Current assignee: Apple Inc
Priority date: 2020-06-22
Filing date: 2021-06-04
Publication date: 2023-07-19
Also published as: US11979572B2; CN115868160A; WO2021262419A1; EP4169250A1; US20210400273A1

Abstract

量子化ステップサイズテーブルテンプレートを用いて適応的に量子化ステップサイズを導出するための技術を含む、改善されたビデオ符号化及び復号技術が記載される。説明される量子化技術は、特に、より高い量子化の程度において、より柔軟な量子化ステップサイズを用いて、量子化に対するよりきめ細かい制御を提供する。これは、改善された全体的な圧縮品質をもたらすることができる。インループフィルタリングパラメータなどの他の符号化パラメータは、より柔軟な量子化パラメータに基づいて導出することができる。

Description

(関連出願の相互参照)
本出願は、２０２０年６月２２日に出願された米国仮特許出願第６３／０４２，４５１号を主張する、２０２１年２月８日に出願された米国仮特許出願第６３／１４７，１６３号の米国特許法第１１９条（ｅ）の下での利益を更に主張する、２０２１年４月１９日に出願された米国特許出願第１７／２３４，５９６号に対する優先権を主張するものであり、それらの内容は、その全体が参照により本明細書に組み込まれる。

本明細書で提案される技術は、概して、画像及びビデオデータの圧縮及び復元に関し、具体的には、ビデオ符号化における量子化器設計に関する。本技術は、高効率ビデオ符号化（High－Efficiency video coding、ＨＥＶＣ）若しくは多用途ビデオ符号化（Versatile video coding、ＶＶＣ）規格などのＩＴＵ－Ｔ／ＭＰＥＧビデオコーデック、又はＡＶ１若しくはＡＶ２規格などのＡＯＭｅｄｉａビデオコーデックに限定されない。本明細書で提案される技術の説明では、現在のＡＶ１及びドラフトＶＶＣ仕様に基づいて実施例が使用されるが、提案される技術は全て、任意の他の量子化器設計に、及び異なる色成分（ルマ／クロマ／アルファ／深度）、ビット深度などに適用することができる。

提案される技術はまた、ＭＰＥＧアクティビティにおいて探索されているニューラルネットワークモデル圧縮、すなわち、マルチメディアコンテンツの記述及び分析のためのニューラルネットワークの圧縮の分野にも適用することができる。モデル符号化システムでは、ビデオコンテンツの代わりにニューラルネットワークパラメータ（例えば、モデルアーキテクチャ、重み、バイアス、及び他のハイパーパラメータ）が圧縮される。いくつかの既存の技術は、エントロピ符号化される必要があるパラメータ情報の量を低減するために、そのサブ方法の１つとして量子化器設計を適用し、本明細書で提案される技術は全て、そのような量子化器設計にも適用することができる。

序論
ＡＶ１仕様では、量子化インデックス（ｑ＿ｉｄｘ）は、０～２５５（又は合計２５６）のデータ範囲を有する。より少ない量子化インデックス、例えば、色成分に対するビット深度精度の各増分ごとに６つの追加の量子化インデックスの増分で８ビットコンテンツに対してＡＶＣ／ＨＥＶＣ及びＶＶＣそれぞれについて５２及び６４を有するＭＰＥＧ４－ＡＶＣ、ＨＥＶＣ、及びＶＶＣなどのＭＰＥＧビデオ符号化規格に対して、ＡＶ１は、より精細な数のステップサイズ（２５６）を有することが観察される。しかしながら、ＡＶ１における量子化ステップサイズ（ｑ＿ｓｔｅｐ）へのこれらのｑ＿ｉｄｘのマッピングは、図７に示されるように、ＡＶＣ／ＨＥＶＣ又はＶＶＣと比較してより低い勾配を有することが観察される。例えば、ＶＶＣでは、ｑ＿ｓｔｅｐは、指数関数的に大きくなる（～ｐｏｗ（ｑ＿ｉｄｘ／６，２）、すなわち、６つのインデックスごとにサイズが２倍になる）。結果として、ｑ＿ｓｔｅｐは、より高いｑ＿ｉｄｘ値において比較的非常に大きく、はるかに低いビットレートとなる。対照的に、ＡＶ１ステップサイズは、より低いｑ＿ｉｄｘにおいてほぼ線形に変化し、より高いｑ＿ｉｄｘにおいて指数関数的に増加し、より高いｑ＿ｉｄｘにおいて比較的より小さいｑ＿ｓｔｅｐをもたらす。ＡＶ１はまた、図７に示されるように、ＡＣ係数及びＤＣ係数についてｑ＿ｉｄｘからｑ＿ｓｔｅｐへの別個のマッピングを有することも注目に値する。

ＡＶ１仕様及び量子化方式の設計。
シンタックス要素「ｂａｓｅ＿ｑ＿ｉｄｘ」は、ベースフレームｑ＿ｉｄｘを指定するためにシーケンス／フレームヘッダにおいて符号化される。ｂａｓｅ＿ｑ＿ｉｄｘは、８ビットで固定長符号化される。ｂａｓｅ＿ｑ＿ｉｄｘは、全てのＡＣ係数に対するベースオフセットとして機能する。ルマＡＣ係数以外の係数については、以下で説明するように、追加のデルタオフセットをビットストリームでシグナリングすることができる。Ｆｉｎａｌ＿ｑ＿ｉｄｘは、次のように計算される。
式中、ｄｅｌｔａは、ルマＤＣ係数、クロマＵＤＣ、クロマＵＡＣ、クロマＶＤＣ、クロマＶＡＣそれぞれについて、ＤｅｌｔａＱＹＤｃ、ＤｅｌｔａＱＵＤｃ、ＤｅｌｔａＱＵＡｃ、ＤｅｌｔａＱＶＤｃ、ＤｅｌｔａＱＶＡｃなどのシンタックス要素から導出される。

また、シンタックス要素「ｄｉｆｆ＿ｕｖ＿ｄｅｌｔａ」は、クロマＵ成分及びクロマＶ成分に同じデルタが使用されるかどうかを指定する。このｑ＿ｉｄｘは、量子化ステップサイズのルックアップテーブルへのインデックスである。

これらの技術は、いくつかの問題を引き起こす。

より低いビットレートへの到達：上記で説明したように、ＶＶＣでは、ｑ＿ｓｔｅｐは、より高いｑ＿ｉｄｘにおいて非常に大きい値まで指数関数的に増大し、はるかに低いビットレートとなる。対照的に、ＡＶ１ステップサイズは、より低いｑ＿ｉｄｘにおいてほぼ線形に変化し、より高いｑ＿ｉｄｘにおいて指数関数的に増加し、より高いｑ＿ｉｄｘにおいて比較的より小さいｑ＿ｓｔｅｐをもたらす。これは、ＡＶ１が高いｑ＿ｉｄｘで動作しているときでさえ、一部のシーケンスに対して低いビットレートを達成しない理由の１つとして考えられている。また、ＤＣステップサイズは、ＡＣと比較してより低い勾配を有し、ＤＣ係数においてより高い精度を維持する。係数位置ごとにステップサイズを拡張することができるスケーリング行列の柔軟なシグナリングを提供するＶＶＣ、ＨＥＶＣなどのＭＰＥＧ規格とは異なり、ＡＶ１量子化行列は、固定されており、ＤＣ値を更に増加させる能力を有しない。これはまた、ＤＣがこれらのビットレートにおいて最も重要な成分であるため、極端に低いビットレートに達する能力に悪影響を与える。この観察は、フレームのコンテンツ及び構成（イントラ／インター、予測など）にも依存することが主張される。

量子化ステップサイズの柔軟かつコンテンツ適応変動。より粗い又はより大きい量子化ステップサイズは、いくつかのコンテンツ特性（平坦な領域、細かい詳細など）に対して精度の著しい損失をもたらし得るが、コンテンツ内のいくつかの他の特性（複雑なテクスチャ、水など）に対してより低いレートを達成するために、より粗い量子化が必要とされ得ることを観察することができる。

本開示の一態様に係るビデオ配信システムの簡略化したブロック図を示す。本開示の一態様に係る符号化システムの機能ブロック図である。本開示の一態様に係る復号システムの機能ブロック図である。本開示の一実施形態に係る量子化選択システムの機能ブロック図である。本開示の別の実施形態に係る量子化選択システムの機能ブロック図である。本開示の一実施形態に係る方法を示す。いくつかのビデオ符号化プロトコルによってサポートされる量子化器値を比較している。量子化ステップモードを有する本開示の一実施形態に係る方法を示す。

本開示の実施形態は、量子化ステップサイズテーブルテンプレートを用いて適応的に量子化ステップサイズを導出するための技術を提供する。これらの技術は、本明細書で説明するように、ビデオ符号化及び復号デバイスに使用することができる。説明される量子化技術は、特に、より高い量子化の程度において、より柔軟な量子化ステップサイズを用いて、量子化に対するよりきめ細かい制御を提供する。これは、特により低いビットレートにおいて改善された全体的な圧縮品質をもたらすことができる。いくつかの実施形態では、より柔軟な量子化ステップサイズに基づいて、インループフィルタリングパラメータなどの他の符号化パラメータを導出することができる。
図１

図１は、本開示の一態様に係るビデオ配信システム１００の簡略化したブロック図を示す。システム１００は、ネットワーク１３０を介して相互に接続された複数の端末１１０、１２０を含んでもよい。端末１１０、１２０は、ネットワーク１３０を介して相手先へ送信するためのビデオデータを符号化することができる。したがって、第１の端末１１０は、ローカルでビデオデータをキャプチャし、ビデオデータを符号化し、ネットワーク１３０を介して符号化したビデオデータを相手先の端末１２０に送信することができる。受信端末１２０は、符号化されたビデオデータを受信し、復号し、例えば端末１２０のディスプレイ上で、ローカルでレンダーリングすることができる。端末がビデオデータの双方向交換に関与している場合、端末１２０は、ローカルでビデオデータをキャプチャし、ビデオデータを符号化し、ネットワーク１３０を介して符号化したビデオデータを相手先の端末１１０に送信することができる。受信端末１１０は、端末１２０から送信された符号化されたビデオデータを受信し、復号し、例えばそれ自体のディスプレイ上で、ローカルでレンダーリングすることができる。説明したプロセスは、フレーム及びフィールドフレームの符号化の両方に対して動作することができるが、簡単にするために、本論考は、この技術を完全なフレームの文脈で説明する。

ビデオ符号化システム１００は、様々な用途で使用することができる。第１の用途では、端末１１０、１２０は、符号化されたビデオのリアルタイム双方向交換をサポートし、それらの間でビデオ会議セッションを確立することができる。別の用途では、端末１１０は、予め生成されたビデオ（例えば、テレビ又は映画番組）を符号化し、１つの、又は多くの場合、多数のダウンロードするクライアント（例えば、端末１２０）への配信のために符号化したビデオを記憶することができる。したがって、符号化されたビデオはライブ又は予め生成されたものとすることができ、端末１１０は１対１又は１対多数の配信モデルに従って符号化したビデオを配信するメディアサーバとして機能することができる。本論考の目的のために、ビデオ及びビデオ配信スキームの種類は、特に明記しない限り重要ではない。

図１では、端末１１０、１２０は、スマートフォン及びタブレットコンピュータとしてそれぞれ示されているが、本開示の原理は、それに限定されない。本開示の態様はまた、様々なタイプのコンピュータ（デスクトップ、ラップトップ、及びタブレットコンピュータ）、コンピュータサーバ、メディアプレーヤ、専用のビデオ会議機器及び／又は専用のビデオ符号化機器にも適用される。

ネットワーク１３０は、例えば、有線通信ネットワーク及び／又は無線通信ネットワークを含む、端末１１０と１２０との間で符号化されたビデオデータを伝達する任意の数のネットワークを表す。通信ネットワーク１３０は、回線交換又はパケット交換チャネルのデータを交換することができる。代表的なネットワークとしては、電気通信ネットワーク、ローカルエリアネットワーク、広域ネットワーク、及び／又はインターネットが挙げられる。本説明の目的上、ネットワークのアーキテクチャ及びトポロジは、特に明記しない限り本開示の動作にとって重要ではない。
図２

図２は、本開示の一態様に係る符号化システム２００の機能ブロック図である。システム２００は、画素ブロック符号器２１０と、画素ブロック復号器２２０と、フレームバッファ２３０と、インループフィルタシステム２４０と、基準ピクチャバッファ２５０と、予測器２６０と、コントローラ２７０と、シンタックスユニット２８０と、を含むことができる。符号化システム２００は、便宜上「画素ブロック」と呼ばれるビデオフレームの所定の単位に対して動作して、予測技術に従って画素ブロックを差分的に符号化することができる。したがって、符号化されることになるビデオのフレームは、画素ブロック符号器２１０が画素ブロックごとに処理する、画素ブロックに解析することができる。画素ブロック符号器２１０は、符号化された画素ブロックデータをシンタックスユニット２８０に提示することができ、シンタックスユニット２８０は、符号化された画素ブロックを、統制する符号化プロトコルに準拠する送信シンタックスにフォーマットする。

画素ブロック復号器２２０は、符号化された画素ブロックデータを復号し、そこから復号された画素ブロックデータを生成することができる。フレームバッファ２３０は、復号された画素ブロックデータから再構成されたフレームデータを生成することができる。インループフィルタ２４０は、再構成されたフレームに対して１つ以上のフィルタリング動作を実行することができる。例えば、インループフィルタ２４０は、デブロッキングフィルタリング、サンプル適応オフセット（sample adaptive offset、ＳＡＯ）フィルタリング、適応ループフィルタリング（adaptive loop filtering、ＡＬＦ）、最尤（maximum likelihood、ＭＬ）ベースのフィルタリング方式、デリンギング、バンド撤去、鮮明化、解像度スケーリングなどを実行することができる。基準ピクチャバッファ２６０は、フィルタリングされたフレームを記憶することができ、それを後で受信した画素ブロックの予測のソースとして使用することができる。

画素ブロック符号器２１０は、減算器２１２と、変換ユニット２１４と、量子化器２１６と、エントロピ符号器２１８とを含むことができる。画素ブロック符号器２１０は、減算器２１２で入力データの画素ブロックを受け入れることができる。減算器２１２は、予測器２６０から予測された画素ブロックを受信し、そこから入力画素ブロックと予測された画素ブロックの差を表す画素残差のアレイを生成することができる。変換ユニット２１４は、減算器２１２からのサンプルデータ出力に変換を適用し、画素ドメインから変換係数のドメインにデータを変換することができる。いくつかのシナリオでは（例えば、高ダイナミックレンジで動作するとき）、変換ユニット２１４及び／又は減算器２１２の前に、入力を再整形することができる、又は適応方式を適用してコンテンツ転送特性を調整することができる。このような適応は、再マッピング関数に基づく単純なスケーリング、又はより洗練された画素操作技術のいずれかであってもよい。量子化器２１６は、量子化パラメータｑｐに従って変換ユニット２１４によって出力された変換係数の量子化を実行することができる。量子化器２１６は、一様又は非一様量子化パラメータのいずれかを適用することができる。非一様量子化パラメータは、変換ユニット２１４から出力された係数のブロックの所定の位置にわたって変化することができる。エントロピ符号器２１８は、例えば、可変長符号語により、又はコンテキスト適応型バイナリ算術符号器を使用して、出力を符号化することにより、係数量子化器の出力の帯域幅を低減することができる。

変換ユニット２１４は、コントローラ２７０によって判定される様々な変換モードで動作することができる。例えば、変換ユニット２１４は、離散コサイン変換（discrete cosine transform、ＤＣＴ）、離散サイン変換（discrete sine transform、ＤＳＴ）、Ｗａｌｓｈ－Ｈａｄａｍａｒｄ変換、Ｈａａｒ変換、Ｄａｕｂｅｃｈｉｅｓウェーブレット変換などを適用することができる。一態様では、コントローラ２７０は、変換ユニット２１５によって適用される符号化モードを選択してもよく、それに従って変換ユニット２１５を構成してもよく、符号化されたビデオデータの符号化モードＭを明示的に又は暗示的に、のいずれかでシグナリングしてもよい。

量子化器２１６は、コントローラ２７０によって判定される量子化パラメータｑｐに従って作動することができる。量子化パラメータを生成するための技術は、以下で説明する。コントローラ２７０は、その量子化パラメータ選択を表すデータをシンタックスユニット２８０に提供することができる。

エントロピ符号器２１８は、その名前が暗示するように、量子化器２１６から出力されたデータのエントロピ符号化を実行することができる。例えば、エントロピ符号器２１８は、ランレングス符号化、ハフマン符号化、ゴロム符号化、コンテキスト適応型バイナリ算術符号化などを実行することができる。

画素ブロック復号器２２０は、画素ブロック符号器２１０の符号化動作を反転することができる。例えば、画素ブロック復号器２２０は、逆量子化器２２２と、逆変換ユニット２２４と、加算器２２６とを含むことができる。いくつかのシナリオ（例えば、高ダイナミックレンジで動作するとき）では、逆変換ユニット２２４及び／又は加算器２２６の後に、入力は、典型的には符号器において適用された関数及びコンテンツ特性に従って、逆再整形又は再マッピングすることができる。画素ブロック復号器２２０は、量子化器２１６の出力からその入力データを取ることができる。許容されてはいるが、画素ブロック復号器２２０は、エントロピ符号化が無損失のイベントであるため、エントロピ符号化されたデータのエントロピ復号を実行する必要はない。逆量子化器２２２は、画素ブロック符号器２１０の量子化器２１６の動作を反転することができる。逆量子化器２２２は、量子化パラメータデータｑｐによって指定される一様又は非一様逆量子化を実行することができる。同様に、逆変換ユニット２２４は、変換ユニット２１４の動作を反転することができる。逆量子化器２２２及び逆変換ユニット２２４は、画素ブロック符号器２１０のそれらの対応するものと同じ量子化パラメータｑｐ及び変換モードを使用することができる。量子化動作は、様々な点でデータを切り捨てることになる可能性があり、したがって、逆量子化器２２２によって回復されたデータは、画素ブロック符号器２１０内の量子化器２１６に提示されたデータと比較したとき、符号化誤差を有することになる可能性がある。

加算器２２６は、減算器２１２によって実行される動作を反転することができる。それは、残差信号を生成するのに減算器２１２が使用したのと同じ予測画素ブロックを予測器２６０から受信することができる。加算器２２６は、予測画素ブロックを逆変換ユニット２２４によって出力された再構成された残差値に加えることができ、再構成された画素ブロックデータを出力することができる。

説明したように、フレームバッファ２３０は、画素ブロック復号器２２０の出力から再構成されたフレームをアセンブルすることができる。インループフィルタ２４０は、回復した画素ブロックデータに対して様々なフィルタリング動作を実行することができる。例えば、インループフィルタ２４０は、デブロッキングフィルタ、サンプル適応オフセット（「ＳＡＯ」）フィルタ、及び／又は他のタイプのインループフィルタ（図示せず）を含むことができる。

基準ピクチャバッファ２５０は、後の他の画素ブロックの予測で使用するフィルタリングされたフレームデータを記憶することができる。異なる予測モードに対して異なる種類の予測データが、予測器２６０に利用可能になる。例えば、入力画素ブロックに対して、イントラ予測は、入力画素ブロックが配置された同じフレームの復号化されたデータから予測基準を取る。したがって、基準フレーム記憶２５０は、それぞれのフレームの復号された画素ブロックデータをそれが符号化されたように記憶することができる。同じ入力画素ブロックに対して、インター予測は、参照フレームとして指定された前に符号化され復号化されたフレーム（単数又は複数）から予測基準を取ることができる。したがって、基準フレーム記憶２５０は、これらの復号された基準フレームを記憶することができる。

予測器２６０は、残差を生成するのに使用する予測ブロックを画素ブロック符号器２１０に供給することができる。予測器２６０は、イントラモード符号化、並びに、単予測、双予測、及び／又は多仮説インターモード符号化に従って予測検索動作を実行することができる。イントラモード符号化の場合、予測器２６０は、入力画素ブロックに対する最も近い一致を提供する符号化される画素ブロックと同じフレームからの画素ブロックデータの中から検索することができる。インターモード符号化の場合、予測器２６０は、入力画素ブロックに対する一致を提供する基準ピクチャバッファ２５０に記憶された他の以前に符号化されたフレームの画素ブロックデータの中から検索することができる。様々なモードに従って生成された予測の中から、予測器２６０は、目標ビットレートを所与としてビデオが復号されるときに最も低い歪みを達成するモードを選択することができる。特定のチャネル挙動を満たすこと、又はランダムアクセス若しくはデータリフレッシュポリシーをサポートするといった、符号化システム２００が準拠する他のポリシーを満たすように符号化モードが選択される場合に、例外が発生することがある。

コントローラ２７０は、符号化システム２００の動作全体を制御することができる。コントローラ２７０は、入力画素ブロック、並びにまた符号化ビットレート目標及び他の動作パラメータなどの外部制約条件の分析に基づいて、画素ブロック符号器２１０及び予測器２６０に対する動作パラメータを選択することができる。本説明に関連するように、それが量子化パラメータｑｐ、一様若しくは非一様量子化器の使用、及び／又は変換モードＭを選択するとき、それらのパラメータをシンタックスユニット２８０に提供することができ、これは、それらのパラメータを表すデータをシステム２００によって出力される符号化されたビデオデータのデータストリームに含めることができる。コントローラ２７０はまた、システムが基準画像を生成することができ、かつ符号化されたデータの各部分について選択されたモードを識別するメタデータを含むことができる、異なる動作モードの間で選択することができる。

動作中、コントローラ２７０は、量子化器２１６及び変換ユニット２１５の動作パラメータを画像データの異なる粒度で、画素ブロックごと又はより大きな粒度（例えば、フレームごと、スライスごと、最大符号化ユニット（largest coding unit、ＬＣＵ）若しくは符号化ツリーユニット（Coding Tree Unit、ＣＴＵ）ごと、又は別の領域）のいずれかで修正することができる。一態様では、量子化パラメータは、符号化されたフレーム内の画素ごとに修正することができる。

加えて、説明したように、コントローラ２７０は、インループフィルタ２５０及び予測ユニット２６０の動作を制御することができる。そのような制御としては、予測ユニット２６０に対してはモード選択（ラムダ、テストされることになるモード、検索ウィンドウ、歪み戦略など）、及びインループフィルタ２５０に対しては、フィルタパラメータの選択、パラメータの並べ替え、重み付け予測などを挙げることができる。
図３

図３は、本開示の一態様に係る復号システム３００の機能ブロック図である。復号システム３００は、シンタックスユニット３１０と、画素ブロック復号器３２０と、フレームバッファ３３０と、インループフィルタ３４０と、基準ピクチャバッファ３５０と、予測器３６０と、コントローラ３７０と、を含むことができる。

シンタックスユニット３１０は、符号化されたビデオデータストリームを受信することができ、符号化されたデータをその成分部分に解析することができる。符号化パラメータを表すデータは、コントローラ３７０に供給することができ、符号化された残差を表すデータ（図２の画素ブロック符号器２１０によって出力されたデータ）は、その個別の画素ブロック復号器３２０に供給することができる。予測器３６０は、符号化されたビデオデータにおいて提供される符号化パラメータデータに従って、基準ピクチャバッファ３５０で利用可能な基準データから予測ブロックを生成することができる。それは、予測ブロックを画素ブロック復号器３２０に供給することができる。画素ブロック復号器３２０は、（図２の）画素ブロック符号器２１０によって適用される符号化動作を反転することができる。フレームバッファ３３０は、画素ブロック復号器３２０によって出力された復号された画素ブロックから再構成されたフレームを生成することができる。インループフィルタ３４０は、再構成された画素フレームデータをフィルタリングすることができる。フィルタリングされたフレームは、復号システム３００から出力することができる。基準フレームとして機能するように指定されたフィルタリングされたフレームはまた、基準ピクチャバッファ３５０に記憶することができる。

画素ブロック復号器３２０は、エントロピ復号器３２２と、逆量子化器３２４と、逆変換ユニット３２６と、加算器３２８と、を含むことができる。エントロピ復号器３２２は、エントロピ復号を実行し、（図２の）エントロピ符号器２１８によって実行されるプロセスを反転することができる。逆量子化器３２４は、（図２の）画素ブロック符号器２１０の量子化器３１６の動作を反転することができる。同様に、逆変換ユニット３２６は、（図２の）変換ユニット２１４の動作を反転することができる。それらは、符号化されたビデオデータストリームから識別された量子化パラメータｑｐ及び変換モードＭを使用することができる。量子化はデータを切り捨てる可能性があるため、逆量子化器３２４によって回復された画素ブロックは、（図２の）符号器の画素ブロック符号器２１０に提示された入力画素ブロックｓと比較したとき、符号化誤差を有することになる可能性がある。

加算器３２８は、（図２の）減算器２１０によって実行される動作を反転することができる。それは、符号化されたビデオデータストリーム内の予測基準によって判定されたように、予測器３６０から予測画素ブロックを受信することができる。加算器３２８は、予測画素ブロックを逆変換ユニット３２６によって出力された再構成された残差値に加えることができ、再構成された画素ブロックデータを出力することができる。

説明したように、フレームバッファ３３０は、画素ブロック復号器３２０の出力から再構成されたフレームをアセンブルすることができる。インループフィルタ３４０は、符号化されたビデオデータによって識別されたように回復した画素ブロックデータに対して様々なフィルタリング動作を実行することができる。例えば、インループフィルタ３４０は、デブロッキングフィルタ、サンプル適応オフセット（「ＳＡＯ」）フィルタ、及び／又は他のタイプのインループフィルタを含むことができる。このようにして、フレームバッファ３３０及びインループフィルタ３４０の動作は、（図２の）符号器２００の対応するフレームバッファ２３０及びインループフィルタ２４０の動作を模倣する。

基準ピクチャバッファ３５０は、後の他の画素ブロックの予測で使用するフィルタリングされたフレームデータを記憶することができる。基準ピクチャバッファ３５０は、イントラ予測に使用するために、復号されたフレームをそれが符号化されたように記憶することができる。基準ピクチャバッファ３５０はまた、復号された基準フレームを記憶することができる。

説明したように、予測器３６０は、符号化されたビデオデータ内で識別された符号化モードに従って、予測ブロックを画素ブロック復号器３２０に供給することができる。予測器３６０は、符号化されたビデオデータストリーム内に供給される予測基準インジケータによって判定されたように、予測された画素ブロックデータを供給することができる。

コントローラ３７０は、符号化システム３００の動作全体を制御することができる。コントローラ３７０は、符号化されたビデオデータストリーム内で受信したパラメータに基づいて、画素ブロック復号器３２０及び予測器３６０に対する動作パラメータを設定することができる。本説明に関連するように、これらの動作パラメータは、逆量子化器３２４に対する量子化パラメータＱｐ及び逆変換ユニット３１０に対する変換モードＭを含むことができる。説明したように、受信したパラメータは、画像データの様々な粒度で、例えば、画素ブロックごとに、フレームごとに、スライスごとに、ＬＣＵ／ＣＴＵごとに、又は入力画像に対して定義された他の種類の領域に基づいて、設定することができる。
図４

図４は、本開示の一実施形態に係る量子化選択システム４００の機能ブロック図である。一実施形態では、ビデオ符号器及び復号器は、複数の（例えば、Ｎ個の）量子化ステップサイズテーブルテンプレートに従ってビデオを量子化することができ、各テーブル４１０．０、４１０．１、．．．、４１０．ｎは、インデックス値（ｑ＿ｉｄｘ）と量子化パラメータ調整（ｑ＿Ｓｔｅｐ）との間のそれ自体の関係を与える。これらのテーブル４１０．０、４１０．１、．．．、４１０．ｎに記憶されたｑ＿Ｓｔｅｐ値は、経験的に導出する、又は所定の関数若しくは式に従って生成することができる。例えば、第１のテーブル４１０．０に記憶されたｑ＿Ｓｔｅｐ値は、ｑ＿Ｓｔｅｐ＝ｍ＊ｑ＿ｉｄｘ＋ｃ（グラフ４２０．０に示される）などの線形関係を有することができ、式中、ｍ及びｃは、実数定数である。第２のテーブル４１０．１に記憶されたｑ＿Ｓｔｅｐ値は、ｑ＿Ｓｔｅｐ＝２＾ｑ＿ｉｄｘ／ｋ（グラフ４２０．１に示される）などの指数関係を有することができる。符号化及び復号システムは、符号化アプリケーションに所望され得るような、ｑ＿ｉｄｘインデックス値とｑ＿Ｓｔｅｐ量子化ステップサイズ値との間の数学的関係４１０．０、４２０．１、．．．、４２０．ｎと同数のテーブル４１０．０、４１０．１、．．．、４１０．ｎを有することができる。符号化及び復号動作中に、符号器及び復号器は、即時符号化ニーズに適合するように、テーブル４１０．０、４２０．１、．．．、４２０．ｎ内の量子化ステップサイズ値から適応的に選択することができる。

第１の実施形態では、量子化インデックス値は、ｑ＿Ｓｔｅｐ値が読み取られることになるテーブル４１０．０、４１０．１、．．．、又は４１０．ｎを識別するテーブルインデックス（ｔｂｌ＿ｉｄｘ）と、ｑ＿Ｓｔｅｐ値が読み取られることになる選択されたテーブル４１０．０、４１０．１、．．．、又は４１０．ｎ内のエントリを識別するインデックス値（ｑ＿ｉｄｘ）とを使用して、符号器と復号器との間でシグナリングすることができる。ｑ＿Ｓｔｅｐ値は、最終量子化パラメータｑｐを生成するために、基本量子化パラメータ値ｂａｓｅ＿ｑｐとともに加算器４３０に入力することができる。最終量子化パラメータは、量子化器４４０に入力することができ、場合によっては量子化又は逆量子化のいずれかのために変換係数（図２、図３）に適用されてもよい。

別の実施形態では、符号器及び復号器は、量子化ステップサイズテーブルテンプレート４１０．０、４２０．１、．．．、４２０．ｎから動的ベースでそれら自体の量子化調整テーブルを導出することができる。符号器は、量子化ステップサイズテーブルテンプレート４１０．０、４２０．１、．．．、４２０．ｎから所望の量子化調整テーブルを導出することができ、遷移点を復号器にシグナリングすることができ、復号器は、対応する調整テーブルを生成することができる。

一実施形態では、符号器は、順序付けられた信号対：ＴＩｄｘ_i、ＴＰ_iでテーブル間の遷移点をシグナリングすることができる。信号対の各インスタンスｉは、先行する遷移点（ＴＰ_i-1）からＴＰ_iによって識別される量子化インデックスまでの量子化インデックスの範囲内で使用されることになるＴＩｄｘ_iによって表されるテーブルを識別することができる。具体的には、
ｉ＝０の場合、ｏｐｅｒａｔｉｎｇ＿ｑｕａｎｔ＿ｓｔｅｐ＿ｓｉｚｅ＿ｔａｂｌｅ［ｋ］＝ｔａｂｌｅ＿ＴＩｄｘＮ０［ｋ］であり、式中、ｋは、０からＴＰ０－１までの範囲である。
（ｉ＞０）である場合、ｏｐｅｒａｔｉｎｇ＿ｑｕａｎｔ＿ｓｔｅｐ＿ｓｉｚｅ＿ｔａｂｌｅ［ｋ］＝ｏｐｅｒａｔｉｎｇ＿ｑｕａｎｔ＿ｓｔｅｐ＿ｓｉｚｅ＿ｔａｂｌｅ［ｇｌｏｂａｌ＿ｔｒａｎｓｉｔｉｏｎ＿ｐｏｉｎｔ］＋ｔａｂｌｅ＿ＴＩｄｘＮｉ［ｋ－ｇｌｏｂａｌ＿ｔｒａｎｓｉｔｉｏｎ＿ｐｏｉｎｔ］であり、
式中、ｇｌｏｂａｌ＿ｔｒａｎｓｉｔｉｏｎ＿ｐｏｉｎｔ＝０からｉ－１までの各ＴＰｉにおける全ての要素数の合計であり、ｋは、ｇｌｏｂａｌ＿ｔｒａｎｓｉｔｉｏｎ＿ｐｏｉｎｔからＴＰｉまでの範囲である。

３つの信号対（ＴＩｄｘｉ，ＴＰｉ）、ｉ＝０、１、２が提供される例を考える。そのような例では、量子化調整テーブルは、以下のようにデフォルト量子化調整テーブル４１０．０、４１０．１、４１０．２（図示せず）に記憶されたｑ＿Ｓｔｅｐ値から導出することができる。
実際には、提示される符号化状況に依存して、各ソーステーブルから抽出されたセグメント値範囲の端点を結合して、連続量子化調整曲線を形成することが好都合である場合がある。

図４は、ＴＩｄｘｉ，ＴＰｉ信号対に応じて、量子化インデックス信号ｑ＿ｉｄｘに応じて量子化調整テーブル４１０．０、４１０．１、．．．、４１０．ｎの中から選択するためのテーブル選択信号ｔｂｌ＿ｉｄｘを生成する復号器４５０を示す。関係が復号器４５０によって確立されると、量子化パラメータｑｐの選択は、ビデオデータが量子化（符号化）又は逆量子化（復号）されるときに行うことができる。量子化インデックスｑ＿ｉｄｘは、復号器４５０に提示することができ、復号器４５０は、ｑ＿ｓｔｅｐ値を読み取ることができる量子化調整テーブル４１０．０、４１０．１、．．．、４１０．ｎを選択するテーブルインデックス信号を生成する。量子化インデックスｑ＿ｉｄｘはまた、テーブルからｑ＿ｓｔｅｐ値を読み取るために、選択されたテーブル（例えば、テーブル４１０．０）に提示することができる。

一実施形態では、システム４００は、量子化調整テーブル４１０．０、４１０．１、．．．、４１０．ｎの出力に設けられた加算器４６０．０、４６０．１、．．．、４６０．ｎを含むことができ、それらは、量子化調整テーブル４１０．０、４１０．１、．．．、４１０．ｎから読み取られたｑ＿ｓｔｅｐ値に加法的オフセットを与えることができる。オフセットは、例えば、遷移点において量子化調整テーブル４１０．０、４１０．１、．．．、４１０．ｎから読み取られたｑ＿ｓｔｅｐ値のセグメントの間に連続曲線を提供するために、所望され得るように、量子化調整テーブル４１０．０、４１０．１、．．．、４１０．ｎから読み取られたｑ＿ｓｔｅｐ値に適用することができる。そのようなオフセットは、復号器４５０に記憶して、復号器４５０がｑ＿ｓｔｅｐ値をそれぞれの量子化調整テーブル４１０．０、４１０．１、又は４１０．ｎから読み取らせるときに、選択された加算器４６０．０、４６０．１、又は４６０．ｎに出力することができる。

別の実施形態では、スケーリングファクタは、遷移点とともにシグナリングすることができ、量子化調整テーブル４１０．０、４１０．１、．．．、４１０．ｎから読み取られたｑ＿ｓｔｅｐ値にスケーリングファクタとして適用することができる。システム４００は、それぞれの量子化調整テーブル４１０．０、４１０．１、．．．、４１０．ｎから読み取られたｑ＿ｓｔｅｐ値にスケーリング重みｗを適用することができる乗算器４７０．０、４７０．１、．．．、４７０．ｎを含むことができる。そのような実施形態では、符号器は、個別の遷移点ＴＰｉによって識別されるテーブルに適用されることになるテーブル（ＴＩｄｘｉ）及び重み（ｗｉ）を表すために、ＴＩｄｘｉ、ＴＰｉ、ｗｉとして信号値を送信することができる。そのような重みは、復号器４５０によって記憶して、量子化インデックス値ｑ＿ｉｄｘによって判定されるようにｑ＿ｓｔｅｐ値に適用することができる。

もちろん、乗算器４７０．０、４７０．１、．．．、４７０．ｎ及び加算器４６０．０、４６０．１、．．．、４６０．ｎは、組み合わせて使用されてもよく、これにより、システム設計者がそれらの個々のアプリケーションのニーズに適合するように所望され得る量子化調整テーブル４１０．０、４１０．１、．．．、４１０．ｎにおいて定義されたｑ＿ｓｔｅｐ関係の任意の線形結合を定義することが可能になる。したがって、システム４００によって表される技術は、ビデオ符号化及び復号動作中に量子化調整を動的に定義するための広い柔軟性を提供する。

別の実施形態では、符号器は、ｑ＿ｉｄｘの範囲にわたって量子化調整テーブル４１０．０、４１０．１、．．．、４１０．ｎの選択を定義することによって、動的に生成された量子化調整をシグナリングすることができる。この実施形態では、選択は、遷移点によって識別されてもよく、特定の量子化ステップサイズテンプレートＴＩｄｘＮｋを用いて対象領域を本質的に定義する開始インデックス（ｒｅｇｉｏｎＳｔａｒｔＮｋ）をシグナリングすることができる。この開始インデックス（ｒｅｇｉｏｎＳｔａｒｔＮｋ）のデフォルト値は、０に推測することができ、この場合、それは、上述したように動作する。
Ｋ＝０である場合、
ｏｐｅｒａｔｉｎｇ＿ｑｕａｎｔ＿ｓｔｅｐ＿ｓｉｚｅ＿ｔａｂｌｅ［ｍ］＝ｗｅｉｇｈｔＮ０＊ｔａｂｌｅ＿ＴＩｄｘＮ０［ｒｅｇｉｏｎＳｔａｒｔＮ０＋ｍ］、式中、ｍは、０からＴＰ０の範囲である。
（Ｋ＞０）である場合、
ｏｐｅｒａｔｉｎｇ＿ｑｕａｎｔ＿ｓｔｅｐ＿ｓｉｚｅ＿ｔａｂｌｅ［ｍ］＝ｏｐｅｒａｔｉｎｇ＿ｑｕａｎｔ＿ｓｔｅｐ＿ｓｉｚｅ＿ｔａｂｌｅ［ｇｌｏｂａｌ＿ｔｒａｎｓｉｔｉｏｎ＿ｐｏｉｎｔ］＋ｗｅｉｇｈｔＮｋ＊ｔａｂｌｅ＿ＴＩｄｘＮｋ［ｒｅｇｉｏｎＳｔａｒｔＮｋ＋ｍ－ｇｌｏｂａｌ＿ｔｒａｎｓｉｔｉｏｎ＿ｐｏｉｎｔ］、式中、
ｇｌｏｂａｌ＿ｔｒａｎｓｉｔｉｏｎ＿ｐｏｉｎｔ＝０からｋ－１までの全てのＴＰｋの合計であり、ｍは、ｇｌｏｂａｌ＿ｔｒａｎｓｉｔｉｏｎ＿ｐｏｉｎｔからＴＰｋ－１までの範囲である。

更なる実施形態では、システム４００は、以下に示されるように、シグナリングされた量子化ステップサイズテンプレートに基づいて量子化ステップ領域を独立して導出することができる。（ＴＩｄｘｋ、ＴＰｋ、ｗｅｉｇｈｔＮｋ、ｒｅｇｉｏｎＳｔａｒｔＮｋ）の全てのシグナリングされたＫ個の対について、
Ｋ＝０である場合、
ｏｐｅｒａｔｉｎｇ＿ｑｕａｎｔ＿ｓｔｅｐ＿ｓｉｚｅ＿ｔａｂｌｅ［ｍ］＝ｗｅｉｇｈｔＮ０＊ｔａｂｌｅ＿ＴＩｄｘＮ０［ｒｅｇｉｏｎＳｔａｒｔＮ０＋ｍ］、式中、ｍは、０からＴＰ０の範囲である。
（Ｋ＞０）である場合、
ｏｐｅｒａｔｉｎｇ＿ｑｕａｎｔ＿ｓｔｅｐ＿ｓｉｚｅ＿ｔａｂｌｅ［ｍ］＝ｗｅｉｇｈｔＮｋ＊ｔａｂｌｅ＿ＴＩｄｘＮｋ［ｒｅｇｉｏｎＳｔａｒｔＮｋ＋ｍ－ｇｌｏｂａｌ＿ｔｒａｎｓｉｔｉｏｎ＿ｐｏｉｎｔ］、式中、
ｇｌｏｂａｌ＿ｔｒａｎｓｉｔｉｏｎ＿ｐｏｉｎｔ＝０からｋ－１までの全てのＴＰｋの合計であり、ｍは、ｇｌｏｂａｌ＿ｔｒａｎｓｉｔｉｏｎ＿ｐｏｉｎｔからＴＰｋ－１までの範囲である。

上に示したように、前述の実施形態は、デフォルト量子化調整テーブル４１０．０、４１０．１、．．．、４１０．ｎの内容に基づいて所望のｑ＿ｉｄｘ対ｑ＿Ｓｔｅｐ関係を適応させることができ、同時に、滑らかな単調関係を維持することができる。加えて、複数のテーブルの場合、複数の遷移点をシグナリングすることができる。特定の実施形態では、全ての遷移点が同じ距離にあり、１つの値（それらの距離）のみがシグナリングされることが可能である。

テーブルインデックス（ｔｂｌ＿ｉｄｘ）、遷移点（ＴＰｉ）、重み（ｗｉ）、開始インデックス（ｒｅｇｉｏｎＳｔａｒｔＮｋ）などの前述のシンタックス要素は、ルマＤＣ、ルマＡＣ、クロマＵＤＣ、クロマＵＡＣ、クロマＶＤＣ、及びクロマＶＡＣなどの全てのタイプについて別々にシグナリングすることができる。
図５

図５は、本開示の一実施形態に係る別のシステム５００を示す。システム５００は、複数のデフォルト量子化調整テーブル５１０．０、５１０．１、．．．、５１０．ｎと、乗算器５２０．０、５２０．１、．．．、５２０．ｎと、加算器デフォルト量子化調整テーブル５３０．１、．．．、５３０．ｎと、量子化調整テーブル用のメモリ５４０と、ビットストリームパーサ５５０と、を含むことができる。ビットストリームパーサ５５０は、遷移点識別データを含むデータストリームを受信することができ、それを構成データ要素（例えば、使用されている技術に依存して、テーブルインデックス、遷移点、重み、及び／又は領域開始データ）に解析することができる。ビットストリームパーサは、これらのデータ要素をシステム５００から出力することができる。

量子化調整テーブル５４０を構築（又は修正）するために、ビットストリームパーサ５５０は、遷移点データによって識別されるように、デフォルト量子化調整テーブル５１０．０、５１０．１、．．．、５１０．ｎのうちの選択されたものに信号を出力することができる。説明したように、テーブルインデックスは、記憶されたｑ＿Ｓｔｅｐデータが読み出されるデフォルト量子化調整テーブル５１０．０、５１０．１、．．．、５１０．ｎのうちの１つを識別することができる。遷移点及び／又は領域開始データは、記憶されたｑ＿Ｓｔｅｐデータが読み出される選択されたデフォルト量子化調整テーブル（例えば、テーブル５１０．１）内の位置を識別することができる。使用される場合、重み情報は、ｑ＿Ｓｔｅｐデータがデフォルト量子化調整テーブル５１０．１から読み取られ、量子化調整テーブル５４０に記憶されるときに乗算器５２０．１によって適用されることになるスケーリングファクタを識別することができる。加算器５３０．１は、選択されたデフォルト量子化調整テーブル５１０．１から記憶されたｑ＿ｓｔｅｐ値と、先行する遷移点識別から量子化調整テーブル５４０に記憶されたｑ＿ｓｔｅｐ値との間の連続性を維持するために所望され得るように、オフセットをｑ＿ｓｔｅｐ値に加算することができる。多くの（しかし全てではない）符号化アプリケーションにおいて、ｑ＿ｉｄｘの値が増加するにつれてｑ＿ｓｔｅｐ値が単調に増加することを確実にすることが望ましい。また、図６には示されていないが、加算器５３０．１、．．．、５３０．ｎは、ビットストリームでシグナリングされ、かつビットストリームパーサ５５０によって識別される、オフセット値を適用することができる。
図６

図６は、本開示の一実施形態に係る方法を示す。方法６００は、デフォルトｑ＿ｓｔｅｐ曲線と遷移点が適用されるｑ＿ｉｄｘ値の範囲とを識別するデータを含むことができる、遷移点を識別するデータの受信時に開始することができる（ボックス６１０）。任意選択的に、遷移点識別は、識別オフセット及び／又はスケーリング重みを含むことができる（ボックス６２０、６３０）。この遷移点識別データから、方法６００は、量子化曲線を導出することができる（ボックス６４０）。

その後、方法６００は、ビデオ符号器又は復号器のランタイム動作中に適用することができる。所与の符号化要素についてｑ＿ｉｄｘ値が受信されると（ボックス６５０）、方法６００は、ボックス６４０で導出された量子化調整曲線に従ってｑ＿ｓｔｅｐ調整値を導出することができる（ボックス６６０）。方法６００は、ｑ＿ｓｔｅｐ値を符号化要素のｂａｓｅ＿ｑｐ値に適用することによって、基本量子化パラメータを調整することができ（ボックス６７０）、得られた値は、（符号化のための）量子化動作又は（復号のための）逆量子化動作に適用することができる（ボックス６８０）。ボックス６５０～６８０の動作は、符号化／復号動作が実行される限り、又は新しい遷移点データが受信されるまで（ボックス６９０）、繰り返すことができる。新しい遷移点データが受信されると、方法は、ボックス６１０～６４０の動作に従って量子化調整曲線を修正することができる。

動作において、量子化調整曲線の修正は、以前に識別された遷移点の大規模な置換を必要としない。一実施形態では、修正された遷移点データは、それらが適用される量子化インデックスの識別とともに受信することができる。新しい量子化調整曲線は、新しい遷移点識別を他のｑ＿ｉｄｘ範囲に適用されるより古い遷移点識別と統合することによって導出することができる。

一態様では、量子化パラメータ以外の符号化パラメータも、ｑ＿ｓｔｅｐなどの量子化パラメータから導出することができる（任意選択のボックス６７５）。インループフィルタリングパラメータ、インター予測パラメータ及びイントラ予測パラメータなどの符号化パラメータは、「改善された量子化器に基づく符号化拡張」で以下により詳細に説明するように、ｑ＿ｓｔｅｐに基づいて、符号器又は復号器において決定することができる。ボックス６７５で決定された任意の非量子化符号化パラメータは、対応する符号器又は復号器プロセス（図６に図示せず）において使用することができる。例えば、インループデブロッキングフィルタのフィルタ強度は、ボックス６７５でｑ＿ｓｔｅｐに基づいて決定することができ、次いで、決定されたデブロッキングフィルタ強度は、符号器フィルタ２４０（図２）又は復号器フィルタ３４０（図３）内のデブロッキングフィルタに適用することができる。
量子化調整テーブルの生成をサポートするための例示的なシンタックス

以下では、前述の技術のＡＶ１符号化プロトコルへの統合を示すために、例示的なシンタックスが与えられる。以下の例は、説明するように、ＡＶ１を対象とするが、本開示の原理は、ＶＶＣ、ＨＥＶＣなどの様々な他の符号化システムに適用することができる。

フレーム量子化器導出：関数ｇｅｔ＿ｄｃ＿ｑｕａｎｔ（ｐｌａｎｅ）は、特定のプレーンのｄｃ係数の量子化器値を返し、以下のように導出することができる。
●ｐｌａｎｅが０に等しい場合、ｄｃ＿ｑ（ｇｅｔ＿ｑｉｎｄｅｘ（０，ｓｅｇｍｅｎｔ＿ｉｄ）＋ＤｅｌｔａＱＹＤｃ）を返す。
●さもなければ、ｐｌａｎｅが１に等しい場合、ｄｃ＿ｑ（ｇｅｔ＿ｑｉｎｄｅｘ（０，ｓｅｇｍｅｎｔ＿ｉｄ）＋ＤｅｌｔａＱＵＤｃ）を返す。
●そうでない場合（ｐｌａｎｅが２に等しい）、ｄｃ＿ｑ（ｇｅｔ＿ｑｉｎｄｅｘ（０，ｓｅｇｍｅｎｔ＿ｉｄ）＋ＤｅｌｔａＱＶＤｃ）を返す。

関数ｇｅｔ＿ａｃ＿ｑｕａｎｔ（ｐｌａｎｅ）は、特定のプレーンのａｃ係数の量子化器値を返すことができ、以下のように導出することができる。
●ｐｌａｎｅが０に等しい場合、ａｃ＿ｑ（ｇｅｔ＿ｑｉｎｄｅｘ（０，ｓｅｇｍｅｎｔ＿ｉｄ））を返す。
●さもなければ、ｐｌａｎｅが１に等しい場合、ａｃ＿ｑ（ｇｅｔ＿ｑｉｎｄｅｘ（０，ｓｅｇｍｅｎｔ＿ｉｄ）＋ＤｅｌｔａＱＵＡｃ）を返す。
●そうでない場合（ｐｌａｎｅが２に等しい）、ａｃ＿ｑ（ｇｅｔ＿ｑｉｎｄｅｘ（０，ｓｅｇｍｅｎｔ＿ｉｄ）＋ＤｅｌｔａＱＶＡｃ）を返す。
関数ｇｅｔ＿ｑｉｎｄｅｘ（ｉｇｎｏｒｅＤｅｌｔａＱ，ｓｅｇｍｅｎｔＩｄ）は、現在のブロックの量子化器インデックス、例えば、更なる説明で使用される「ｑ＿Ｉｄｘ」を返すことができる。

シンタックスは、以下に示されるような要素を含むことができる。簡略化のために、関連するシンタックス要素のみが示され、残りは省略される。

一般的なフレームヘッダＯＢＵシンタックス要素は、以下の要素を含むことができる。

非圧縮ヘッダシンタックスは、以下の要素を含むことができる。
ここで、
１に等しいｓｅｐａｒａｔｅ＿Ｙｄｃ＿ｑ＿ｐａｒａｍｓは、ルマＤＣ量子化テーブルパラメータが別々に符号化されることを示す。０に等しいｓｅｐａｒａｔｅ＿Ｙｄｃ＿ｑ＿ｐａｒａｍｓは、別個のルマＤＣ量子化テーブルパラメータがシグナリングされず、ルマＡＣ量子化テーブルパラメータから導出されないことを示す。存在しない場合、その値は０であると仮定される。
１に等しいｄｉｆｆｅｒｅｎｔ＿ｃｈｒｏｍａ＿ｑｕａｎｔ＿ｐａｒａｍは、クロマ（Ｕ及びＶ）量子化テーブルパラメータが別々に符号化されることを示す。０に等しいｄｉｆｆｅｒｅｎｔ＿ｃｈｒｏｍａ＿ｑｕａｎｔ＿ｐａｒａｍは、別個のクロマ（Ｕ及びＶ）量子化テーブルパラメータがシグナリングされず、ルマ量子化テーブルパラメータから導出されないことを示す。存在しない場合、その値は０であると仮定される。
１に等しいｓｅｐａｒａｔｅ＿ｕｖ＿ｑｕａｎｔ＿ｐａｒａｍは、クロマＵ成分及びクロマＶ成分の量子化テーブルパラメータが別々に符号化されることを示す。０に等しいｓｅｐａｒａｔｅ＿ｕｖ＿ｑｕａｎｔ＿ｐａｒａｍは、クロマＵ成分及びクロマＶ成分の量子化テーブルパラメータがシグナリングされず、共有されないことを示す。存在しない場合、その値は０であると仮定される。
１に等しいｓｅｐａｒａｔｅ＿Ｕｄｃ＿ｑ＿ｐａｒａｍｓは、クロマＵＤＣ成分の量子化テーブルパラメータが別々に符号化されることを示す。０に等しいｓｅｐａｒａｔｅ＿Ｕｄｃ＿ｑ＿ｐａｒａｍｓは、クロマＵＤＣ成分の量子化テーブルパラメータが別々に符号化されず、クロマＵＡＣ成分と共有されないことを示す。存在しない場合、その値は０であると仮定される。
１に等しいｓｅｐａｒａｔｅ＿Ｖｄｃ＿ｑ＿ｐａｒａｍｓは、クロマＶＤＣ成分の量子化テーブルパラメータが別々に符号化されることを示す。０に等しいｓｅｐａｒａｔｅ＿Ｖｄｃ＿ｑ＿ｐａｒａｍｓは、クロマＶＤＣ成分の量子化テーブルパラメータが別々に符号化されず、クロマＶＡＣ成分と共有されないことを示す。存在しない場合、その値は０であると仮定される。
１に等しいｓｅｐａｒａｔｅ＿ＵＶｄｃ＿ｑ＿ｐａｒａｍｓは、クロマＵ及びクロマＶＤＣ成分の量子化テーブルパラメータが別々に符号化されることを示す。０に等しいｓｅｐａｒａｔｅ＿ＵＶｄｃ＿ｑ＿ｐａｒａｍｓは、クロマＵ及びクロマＶＤＣ成分の量子化テーブルパラメータが別々に符号化されず、クロマＵＡＣ成分と共有されないことを示す。存在しない場合、その値は０であると仮定される。

ｑｕａｎｔＴａｂｌｅ＿ｐａｒａｍｓヘッダシンタックス要素は、以下の情報を含むことができる。
ここで、
ｔｙｐｅは、以下のマッピングに従ったビデオコンテンツを表す：０のタイプ値は、ルマＡＣであり、１は、ルマＤＣであり、２は、クロマＵＡＣであり、３は、クロマＶＡＣであり、４は、クロマＶＡＣであり、５は、クロマＶＤＣである。
ｎｕｍ＿ｐｉｖｏｔｐｏｉｎｔｓ［ｔｙｐｅ］は、特定のタイプの量子化ステップサイズテーブルを導出するために合計で使用されるピボットポイントの数を指定する。
ＴａｂｌｅＩｄｘ［ｔｙｐｅ］［ｉｄｘ］は、特定のタイプの量子化ステップサイズテーブル及びピボットポイントインデックスを導出するために使用される量子化ステップサイズテンプレートインデックスを指定する。
ｔｒａｎｓｉｔｉｏｎ＿ｐｏｉｎｔ［ｔｙｐｅ］［ｉｄｘ］は、特定のタイプの量子化ステップサイズテーブル及びピボットポイントインデックスを導出するための遷移点インデックスを指定する。
１に等しいｗｅｉｇｈｔｓ＿ａｐｐｌｉｅｄは、特定のタイプの量子化ステップサイズテーブル及びピボットポイントインデックスを導出するために重みが適用される場合を示す。０に等しいｗｅｉｇｈｔｓ＿ａｐｐｌｉｅｄは、重みが１に等しいと推測されることを示す。存在しない場合、ｗｅｉｇｈｔｓ＿ａｐｐｌｉｅｄの値は、０に等しい。
ｗｅｉｇｈｔＮｒＩｄｘは、特定のタイプの量子化ステップサイズテーブル及びピボットポイントインデックスを導出するために使用される重み分子値を指定する。
ｗｅｉｇｈｔＤｒＩｄｘは、特定のタイプの量子化ステップサイズテーブル及びピボットポイントインデックスを導出するために使用される重み分母値を指定する。
１に等しいｎｏｎ＿ｚｅｒｏ＿ｉｄｘ＿ｅｎａｂｌｅｄは、量子化ステップサイズテンプレート内のフレキシブル開始領域が有効化されていることを示す。０に等しいｎｏｎ＿ｚｅｒｏ＿ｉｄｘ＿ｅｎａｂｌｅｄは、量子化ステップサイズテンプレート内のフレキシブル開始領域が有効化されておらず、ｒｅｇｉｏｎＳｔａｒｔＩｄｘが０であると推測されることを示す。存在しない場合、ｎｏｎ＿ｚｅｒｏ＿ｉｄｘ＿ｅｎａｂｌｅｄは、０であると推測される。
ｒｅｇｉｏｎＳｔａｒｔＩｄｘは、特定のタイプの量子化ステップサイズテーブル及びピボットポイントインデックスを導出するために使用される特定の量子化ステップサイズテーブルテンプレート内の開始インデックスを指定する。

前述のシンタックスを使用して、量子化ステップサイズテーブルは、以下のように導出することができ、量子化ステップサイズテーブルが望まれる全てのタイプについてプロセスを繰り返す。

ローカル変数は、０に初期化することができる（例えば、Ｋ＝０、ｇｌｏｂａｌ＿ｔｒａｎｓｉｔｉｏｎ＿ｐｏｉｎｔ＝０）。

所与のｑ＿ｉｄｘについての最終量子化ステップサイズ値は、ｄｅｒｉｖｅｄ＿ｑｕａｎｔ＿ｓｔｅｐ＿ｓｉｚｅ＿ｔａｂｌｅ［ｔｙｐｅ］［ｑ＿ｉｄｘ］として導出することができる。

上記のシンタックスは、例えば、上記で説明した技術を使用してシーケンスヘッダでそれらをシグナリングすることによって、量子化ステップサイズテンプレートが利用可能にされており、ｑ＿ｉｄｘ値の総数が２５６であり、３つの色成分（Ｙ、Ｕ、Ｖ）がヘッダ内に存在する、システムに適用される。もちろん、本開示の原理は、異なる数のｑ＿ｉｄｘ値を使用するシステム、及び他の成分（アルファ、深度など）、並びに所望され得るような成分のサブセット（モノクロなど）に適用される。

以下の説明は、前述の量子化曲線導出の例示的な適用例を提示する。１つが完全に線形であり、もう１つのテーブルが指数関数的に変化する、２つの量子化調整テーブル４１０．０、４１０．１を有することが望ましい例を考える。

線形量子化ステップサイズテーブル４１０．０は、例えば、ｑ＿ｓｔｅｐ＝ｃｌｉｐ（ＤＥＳＩＲＥＤ＿ＭＩＮ，ＤＥＳＩＲＥＤ＿ＭＡＸ，ｍ＊ｑ＿ｉｄｘ＋ｃ）として導出することができ、式中、ｍ及びｃは、なんらかの実数定数であり、ＤＥＳＩＲＥＤ＿ＭＩＮ、ＤＥＳＩＲＥＤ＿ＭＡＸは、それぞれ量子化ステップサイズの望ましい最小値及び最大値である。

指数関数的に変化する量子化ステップサイズテーブル４１０．１は、例えば、ｑ＿ｓｔｅｐ＝ｃｌｉｐ（ＤＥＳＩＲＥＤ＿ＭＩＮ，ＤＥＳＩＲＥＤ＿ＭＡＸ，ＲＯＵＮＤ（２４＊（２＾（ｑ＿Ｉｄｘ／１６）＋ｋ）））として導出することができ、式中、ｋは、なんらかの実数定数であり、ＤＥＳＩＲＥＤ＿ＭＩＮ、ＤＥＳＩＲＥＤ＿ＭＡＸは、量子化ステップサイズの望ましい最小値及び最大値である。

そのような適用例では、システム４００は、線形テーブルから指数テーブルへの遷移を指定する「ｌｉｎｅａｒ＿ｔａｂｌｅ＿ｍａｘ＿ｉｄｘ」などの「遷移点」をシグナリングすることができる。
ｌｉｎｅａｒ＿ｔａｂｌｅ＿ｍａｘ＿ｉｄｘ又は「遷移点」は、ＡＣ又はＤＣ成分に対して異なるようにシグナリングすることができる。

ｌｉｎｅａｒ＿ｔａｂｌｅ＿ｍａｘ＿ｉｄｘ又は「遷移点」は、ルマ成分、クロマＵ成分、及びクロマＶ成分に対して異なるようにシグナリングすることができる。

ｌｉｎｅａｒ＿ｔａｂｌｅ＿ｍａｘ＿ｉｄｘ又は「遷移点」は、異なるビット深度に対して異なるようにシグナリングすることができる。

「遷移点」のシグナリングは、シーケンス、フレーム、スライス、タイル、又はブロックヘッダという異なるレベルの粒度でシグナリングすることができる。シグナリングの各レベルは、異なるトレードオフを有することができる。

適用例では、複数のＮ個の量子化調整曲線のデータは、（符号化コストを最小化するために）シーケンス又はフレーム粒度でシグナリングすることができ、それらの量子化調整曲線のうちの選択された１つに対応するインデックスは、所望の適応性を達成するために、フレーム内のブロックレベル、スライスレベル、セグメントレベル、タイルレベル、又は特定の領域レベルなどのより低い粒度でシグナリングすることができる。シグナリング粒度は、異なる複雑さ、圧縮効率、及び適応性のトレードオフを提供することができることに留意することができる。一般に、最も低い粒度でのシグナリングは、ハードウェア実装形態にとって計算集約的であり、より多くの符号化コストを招くこともある。しかしながら、それは、特に低ビットレートアプリケーションに対して、符号化決定を行うための最大の柔軟性又は適応性を提供することができる。同様に、量子化ステップサイズインデックス、遷移点、遷移点における重み、及び量子化ステップサイズインデックス内の対象領域に関するシグナリングは、ブロックレベル、スライスレベル、セグメントレベル、タイルレベル又は特定の領域レベル、フレームレベル又はシーケンスレベルなどの様々な粒度でシグナリングすることができる。そのようなデータに対して、より低い粒度でのシグナリングは、著しい柔軟性及びコンテンツベースの適応性を提供する。

上記の説明は、ユニタリｑ＿ｓｔｅｐ値及びｂａｓｅ＿ｑｐ値のコンテキストにおける量子化調整を提示した。前述の技術は、多次元量子化行列に適用することができ、量子化調整曲線は、（例えば、ＤＣ係数について、及び変換ユニット２１４（図２）によって生成された複数のＡＣ係数について）処理されている変換係数に従って、かつまたｑ＿ｉｄｘによって変化する量子化調整値を有する量子化調整行列として定義される。そのような量子化調整行列のデータは、シーケンス又はフレームヘッダで明示的にシグナリングすることができる。これらの「Ｎ」個の量子化調整行列からの量子化行列に対応するインデックスは、処理されている符号化要素に供給することができる。

別の実施形態では、量子化ステップサイズテーブル及びスケーリング行列をシグナリングするために、ピボット法を適用することができる。システム４００は、Ｎ個のインデックスを指定し（デルタを使用して、それらが単調に増加していることを確実にする）、次いで、補間法を使用して、欠落インデックスを補間することができる。補間は、単にバイリニアであってもよく、又はより複雑なモデル（例えば、バイキュービック）を使用してもよい。そのような技術は、例えば、１つのセグメントが補間を使用し、次のセグメントが関数を使用する、区分的方法と組み合わせることができる。そのような技術は、精細な方法で、かつ定義されたステップサイズを使用して、量子化の精度に対する制御を提供する。ＤＣ／ＡＣ量子化は、量子化行列と同様の方策を使用することができる。補間（例えば、ピボットベースの）方法を使用して量子化行列をシグナリングすることによって、量子化行列シグナリングに関連付けられた高いシグナリングコストを低減することができる。この手法では、システム４００は、特定の点の値をシグナリングすることができ、それは、所定の位置にプレフィックスすることができる、又はそれらの位置は、明示的にシグナリングされる（後者の場合、全ての変換タイプに対して均一に離間した点を採用することが好ましい場合がある）。異なる変換タイプに対して、異なる点をシグナリングすることができる、又は対応する「スケーリングされた」位置における点は、ピボットポイントとしてのみ示される。次に、指定された方法を使用して、例えば、水平方向及び／又は垂直方向に適用されるバイリニア補間を使用して、中間欠落点の量子化スケールが補間される。

一実施形態では、システム４００は、各段階（例えば、ＳＰＳ）において複数の量子化行列をシグナリングし、したがって、これをより柔軟にすることができる。ＰＰＳにおいて、設計は、ＳＰＳ内のどの量子化行列（又は複数の量子化行列）を使用することを好むかを、それらのインデックスを示すことによって示すオプションを有する。これにより、インデックスのみがシグナリングされる必要があるため、異なる量子化行列の複数回のコストのかかるシグナリングを回避する。更に、スライス／タイルレベルで、ＰＰＳ量子化行列リストへのインデックスを更に使用して、領域内で使用される量子化スケーリング行列の更なる制御及び柔軟性を可能にすることができる。これは、ブロックレベルで拡張することもできる。量子化行列間で予測する機構も使用することができ、すなわち、テーブル全体をシグナリングする代わりに、基準テーブルからのデルタを使用することができ、又は１つのＰＰＳ内の量子化行列を、ＳＰＳ内で示された量子化行列から、若しくは別の以前に送信されたＰＰＳから予測することができる。異なる構造、例えば、ＰＰＳよりも重要度が高く、ＰＰＳが予測することができる全ての可能な量子化行列を含む適応ＮＡＬユニットタイプなどの新しいＮＡＬユニットタイプを示すことも可能であり得る。その場合、復号器又は送信システムは、チャネル切替え、ランダムアクセスなどの目的で、ストリーム内の異なるユニットタイプ間の関係をより容易に決定することができる。ＰＰＳ又はＡＰＳはまた、量子化行列の基準バッファをポピュレートすることができ、それはまた、そのような要素の予測のために利用することができる。基本的に、他の以前にシグナリングされた要素又は構造からＰＰＳ内の量子化行列を予測するこの機能は、量子化行列の「インター」予測の形態と見なすことができる。量子化行列の空間／イントラ予測も可能であり、すなわち、ＰＰＳが複数の量子化行列を含むことが許容される場合、量子化行列は、ＰＰＳにおいてシグナリングされた以前の量子化行列と比較して、予測方式で符号化することができる。

更なる実施形態では、システム４００は、フレーム／タイルレベル（コストが小さいため、細かい数のインデックスが可能であり得る）及びブロックレベル（基本的に「量子化された量子化ステップサイズ増分」を示している）の両方において、シグナリングされる量子化インデックスの数を制御することができる。例えば、ピクチャレベルでは依然として２５６又はおそらく１２８の量子化ステップを有することができるが、ブロックレベルでは、１の代わりにＮ（例えば、Ｎ＝２又は４）の増分でデルタオフセットを示すことができる。これは、ＡＣ及びクロマにも適用することができる。より具体的には、ブロックレベルでのｑｐＩｄｘは、ｂｌｏｃｋ＿ｑｐＩｄｘ＝ｂａｓｅ＿ｑ＿ｉｄｘ＋ｑｐ＿ｄｅｌｔａ＊ｑｕａｎｔ＿ｑｐ＿ｄｅｌｔａとして導出することができる。

ＶＶＣ、ＨＥＶＣ、及びＡＶ１規格の既存の実装形態では、量子化行列は、通常、変換ブロックサイズ、予測タイプ、及びブロックの色成分に基づいて導出され、一般に、全てのＱＰについて固定されるが、異なる変換サイズ、予測モード、及び色成分について異なり得る。一実施形態では、システム４００は、ＱＰにも基づいて量子化行列を制御及び調整する柔軟性を提供することができる。すなわち、特定の予測及びブロックタイプに対して単一の量子化行列を使用する代わりに、システム４００は、ＱＰ又はＱＰ範囲に基づいて量子化行列を切り替えることもできる。異なる行列は、低いＱＰ対中程度のＱＰ、対高いＱＰに対してより意味があり得る。拡張として、行列自体が、使用されているＱＰ値に基づいて調整される項を有することができる。

上記の説明は、ｑ＿ｉｄｘとして表される量子化インデックスの単一の範囲に沿った量子化値の調整を提示した。実際には、異なるタイプのデータに対してシステム４００（図４）及び方法５００（図５）の異なるインスタンス化を提供することが望ましい場合がある。例えば、クロマデータとは異なるインスタンス化を、ルマデータに対して提供することができる。高ダイナミックレンジ（high dynamic range、ＨＤＲ）ビデオとは異なるインスタンス化を、標準ダイナミックレンジ（standard dynamic range、ＳＤＲ）ビデオに対して提供することができる。ビデオデータを表すために使用されるビット深度（例えば、８ビットカラー、１０ビットカラー、又は１２ビットカラー）に基づいて、異なるインスタンス化を提供することができる。異なるタイプの変換係数のために（例えば、ＡＣ係数とは異なるＤＣ係数のために）異なるインスタンス化を提供することができる。インスタンス化の数及びタイプは、システム設計者が前述の技術を個々のニーズに適用するときに、システム設計者によって選択することができる。

更なる態様では、符号器と復号器との間の送信の前に、量子化値自体を量子化することができる。多くの適用例では、画素ブロックの量子化パラメータは、ｄｅｌｔａ＿ｑｐ値として表され、ｄｅｌｔａ＿ｑｐ値は、符号化シンタックス内の他の場所で与えられる基本量子化パラメータに対する変化を表す（例えば、ｆｉｎａｌ＿ｑｐ＝ｂａｓｅ＿ｑｐ＋ｄｅｌｔａ＿ｑｐ）。更なる実施形態では、ｆｉｎａｌ＿ｑｐ＝ｂａｓｅ＿ｑｐ＋ｑ＿ｑｐ＊ｄｅｌｔａ＿ｑｐとなるように量子化器量子化パラメータｑ＿ｑｐに対して量子化される値としてｄｅｌｔａ＿ｑｐを提供することが有益であり得る。量子化器量子化パラメータｑ＿ｑｐは、より高いレベルのシンタックス要素でシグナリングすることができる。多くの符号化アプリケーションでは、ｄｅｌｔａ＿ｑｐ値のシグナリングは、符号化帯域幅の６～８％を消費することがあり、したがって、ｄｅｌｔａ＿ｑｐ値の量子化により、符号化ビットレートの大幅な低減を達成することができると推定される。

更なる態様では、画素再整形特性をキャプチャするために、（本明細書で説明する方法の任意の組合せを使用して）複数の量子化ステップサイズテーブルを生成することができる。隣接領域は、異なる画素再整形特性又は再整形「モード」に従うことができることが可能である。量子化ステップサイズテーブルの柔軟な使用を可能にするために、品質、圧縮効率、及び複雑さの間の最良のトレードオフを提供する（再整形特性／モードを考慮した）、その特定の領域に使用される量子化ステップサイズテーブルをシグナリングすることが更に提案される。領域は、ブロック、スライス、タイル、セグメント及び／若しくはフレーム、又はシーケンスレベルなどの、様々な粒度であってもよい。
量子化調整曲線の動的生成

いくつかの態様では、（図４のテーブル４１０．０～４１０．ｎなどの）量子化調整曲線のセットの生成は、量子化ステップモード選択（ｑＳｔｅｐ＿ｍｏｄｅ）によって制御することができる。選択された量子化ステップモードは、選択されたモードにおける量子化曲線のセットを構築するために必要な任意のパラメータとともに、圧縮されたビットストリームでシグナリングすることができる。

例えば、量子化曲線のセットは、以下の候補量子化ステップモードのうちの１つに従って生成することができる。
ａ．ｑＳｔｅｐ＿ｍｏｄｅ＝０は、デフォルト量子化調整曲線のセットが予め決定され、固定されていることを示すことができる。この場合、所定の量子化調整曲線を構築するために、圧縮されたビットストリームで更なる情報がシグナリングされる必要はなく、したがって、量子化ステップモードパラメータは、必要とされなくてもよい。
ｂ．ｑＳｔｅｐ＿ｍｏｄｅ＝１は、長さが所定の関係によって互いに関係付けられている識別された数の間隔で量子化調整曲線が生成されることを示すことができる。例えば、間隔は、利用可能な数の量子化インデックス（ｑ_idx）にわたって２のべき乗関係（例えば、８、８＊２⁰、８＊２¹、８＊２³）に従って増加する長さを有するように定義することができる。量子化調整値は、様々な手段に従って各間隔内で生成することができる。一例では、デフォルトテーブルに所定の量子化調整値を提供することができ、テーブル値は、各間隔の長さに従ってテーブル値をスケーリングして、先行する間隔の最高量子化調整値に従ってオフセットを適用することによって、各間隔にわたって拡張することができる。デフォルトテーブルは、指数関数的に増加するプロファイルによるなどの、所望のプロファイルに従ってインデックス値によって増加する量子化調整値を含むことができる。代替的に、デフォルトテーブルは、インデックス値によって線形に増加する量子化調整値を含むことができる。この例では、量子化ステップモードパラメータは、曲線の数（ＮｕｍＴｒａｎｓｉｓｔｉｏｎＩｎｔｅｒｖａｌ＿ｍｉｎｕｓ１）と、各曲線を指定するテーブル内の量子化ステップエントリの数（ｎｕｍＯｓｔｅｐｓｉｎＩｎｔｅｒｖａｌ）とを含むことができる。
ｃ．ｑＳｔｅｐ＿ｍｏｄｅ＝２は、第１の量子化調整曲線がシグナリングされ、他の量子化調整曲線は、シグナリングされた第１の曲線を複製することによって生成されることを示すことができる。この例では、量子化ステップモードパラメータは、シグナリングされた第１の曲線を定義するテーブル内の量子化ステップサイズエントリの数と、シグナリングされた第１の曲線を定義するテーブル内の各エントリの量子化ステップサイズ値とを含むことができる。
ｄ．ｑＳｔｅｐ＿ｍｏｄｅ＝３は、各量子化調整曲線が明示的にシグナリングされることを示すことができる。例えば、各曲線は、テーブルによって定義することができ、各テーブルは、シグナリングすることができる。この例では、量子化ステップモードパラメータは、テーブルの数を含むことができ、次いで、各テーブルについて、各テーブル内の量子化ステップサイズのリストとともに、そのテーブル内のエントリの数を含むことができる。

選択可能な量子化ステップモードを含む設計は、いくつかの利点を提供することができる。
ａ．遷移間隔タイプ：間隔ウィンドウは、曲線のセグメントと見なすることができる。固定及び可変のいずれかである間隔ウィンドウを有することが有益であり得る。可変量子化モード選択方式は、符号化システムに柔軟性を提供する。
ｂ．遷移間隔にわたる対称性：一実装形態では、Ｑステップは、各間隔の後に２倍になり得る（例えば、Ｎ番目の間隔のＱステップは、Ｎ－１番目の間隔からの対応するＱステップの２倍である）。可変量子化モード選択方式は、符号器と復号器との間でＱステップ情報を交換するために暗黙的なシグナリングを提供し、それを活用し、それによって、そのようなシステムにおける符号化効率を高めることができる。
ｃ．間隔長の指数関数的（特に２のべき乗）導出：一実装形態では、例えば、間隔長は、各間隔の後に２倍になり得る（例えば、Ｎ番目の間隔の長さは、Ｎ－１番目の間隔の２倍である）。可変量子化モード選択方式は、符号器と復号器との間で間隔情報を交換するために暗黙的なシグナリングを提供し、それを活用し、更に、そのようなシステムにおける符号化効率を高めることができる。

場合によっては、ｑＩｄｘのＱｓｔｅｐへの指数関数的（特に２のべき乗）マッピングを有することが望ましいことがある。２のべき乗は、除算演算を必要とせずに、シフト演算によってより効率的に実現することができる。ハードウェア処理回路に実装される場合、除算演算は、実行するのに高価な数学演算であることが多い。

上記の４つの量子化ステップモードのシーケンスヘッダのための例示的なシンタックス

一態様では、ｑＳｔｅｐ＿ｍｏｄｅは、ｑＳｔｅｐ導出の選択されたモードを指定することができる。ｑＳｔｅｐ＿ｍｏｄｅ＝０は、セクション１．１におけるテーブルが現在のシーケンスに使用されることを指定する。ｑＳｔｅｐ＿ｍｏｄｅ＝１及びｑｑＳｔｅｐ＿ｍｏｄｅ＝２は、セクション１．２及びセクション１．３におけるようにｑＳｔｅｐ値を導出する方法を指定する。ｑＳｔｅｐ＿ｍｏｄｅ＝３は、指定されていない。存在しない場合、ｑＳｔｅｐ＿ｍｏｄｅの値は、０であると推測される。

他の態様では、量子化曲線のシグナリングは、シーケンスヘッダで行われる必要はなく、代わりに、圧縮されたビットストリーム内の異なる周波数において、又は異なる粒度レベルにおいて行われてもよい。これは、ビットストリーム内のシンタックスの異なるレイヤにおいて量子化調整曲線を指定することによって行われてもよい。例えば、量子化曲線シグナリングは、シーケンスレイヤ、タイルレイヤなどで行われてもよい。同様に、ＭＰＥＧ規格（例えば、ＶＶＣ）では、それらは、シーケンス、ピクチャ、サブピクチャ、スライス、又はタイルヘッダであってもよい。

以下は、前述のシーケンスヘッダシンタックスを使用して量子化曲線を生成するための例示的な技術を、擬似コードの例を用いて説明する。
ｑＳｔｅｐ＿ｍｏｄｅ＝０

第１の例では、ｑＳｔｅｐ＿ｍｏｄｅ＝０であり、これは、ｑＳｔｅｐサイズの既定の粒度を適用する。この例では、間隔ウィンドウタイプは、固定に設定され、遷移間隔は、間隔ごとに２倍になり、ステップサイズは、２のべき乗曲線として導出される。この実装形態は、量子化テーブルがインターフェース仕様において定義されることを可能にし、インターフェース仕様は、量子化テーブルの値を明示的に指定する必要がない符号化アプリケーションのためのデフォルト値のセットを与える。ＮｕｍＴｒａｎｓｉｔｉｏｎＩｎｔｅｒｖａｌ＿ｍｉｎｕｓ１の値は、デバイス間で９に等しいと推測することができ、各遷移間隔のｎｕｍＱｓｔｅｐｓＩｎＩｎｔｅｒｖａｌは、８、８、１６、３２、３２、３２、３２、３２、３２、３２に等しいと推測することができる。この例では、ＮｕｍＴｒａｎｓｉｔｉｏｎＩｎｔｅｒｖａｌ＿ｍｉｎｕｓ１及びｎｕｍＱｓｔｅｐｓＩｎＩｎｔｅｒｖａｌの値は、ｑＳｔｅｐ＿ｍｏｄｅ値が０に設定されている場合に導出される。
ｑＳｔｅｐ＿ｍｏｄｅ＝１

別の例では、ｑＳｔｅｐ＿ｍｏｄｅ＝１であり、これは、符号器がフレキシブル量子化ステップでフレキシブル量子化テーブルを定義することを可能にする。この例では、間隔ウィンドウタイプは、可変であり、遷移間隔にわたる対称性＝間隔ごとに２倍であり、ステップサイズは、２のべき乗曲線として導出される。この実装形態は、動作ビットレート範囲におけるＱステップの精度を定義する柔軟性を提供する。例えば、より高いＱＰで動作するとき、動作ＱＰの周りのより細かいステップサイズを定義することができ、これは、量子化誤差及び符号化セッション中の符号化品質の急激な遷移を低減するのに役立つ。

この例では、符号器は、以下のようにシグナリングを提供することができる。
ＮｕｍＴｒａｎｓｉｔｉｏｎＩｎｔｅｒｖａｌ＿ｍｉｎｕｓ１－この値プラス１は、間隔内のｑｓｔｅｐの数がシグナリングされる、２５６のＱｓｔｅｐ範囲内の間隔の数を指定する。
ＮｕｍＱｓｔｅｐｓＩｎＩｎｔｅｒｖａｌ［ｉ］－「ｉ」番目の遷移間隔内のｑＳｔｅｐ点の数。
「ｉ」番目の遷移間隔についてＮｕｍＱｓｔｅｐｓＩｎＩｎｔｅｒｖａｌがシグナリングされないとき、ＮｕｍＱｓｔｅｐｓＩｎＩｎｔｅｒｖａｌは、３２に等しいと推測される。
遷移の値ＮｕｍＱｓｔｅｐｓＩｎＩｎｔｅｒｖａｌ［ＮｕｍＴｒａｎｓｉｔｉｏｎＩｎｔｅｒｖａｌ＿ｍｉｎｕｓ１］は、２５６－（ＮｕｍＱｓｔｅｐｓＩｎＩｎｔｅｒｖａｌ［０］からＮｕｍＱｓｔｅｐｓＩｎＩｎｔｅｒｖａｌ［ＮｕｍＴｒａｎｓｉｔｉｏｎＩｎｔｅｒｖａｌ＿ｍｉｎｕｓ１］までの合計）であると推測される。
多くの場合、実際には、ＮｕｍＱｓｔｅｐｓＩｎＩｎｔｅｒｖａｌ［０－ＮｕｍＴｒａｎｓｉｔｉｏｎＩｎｔｅｒｖａｌ＿ｍｉｎｕｓ１］の合計は、２５６未満である。

ｑＳｔｅｐ＿ｍｏｄｅ＝１の一態様では、ＮｕｍＱｓｔｅｐｓＩｎＩｎｔｅｒｖａｌは、２のべき乗として設定することができ、Ｑステップテーブルは、次のように導出することができる。

浮動小数点精度で動作することができる方法に好適であり得るｑＳｔｅｐ＿ｍｏｄｅ＝１の別の態様では、Ｑステップテーブルは、以下のように導出することができる。
代替的に、変数（例えば、ｑＩｄｘ－（ｂａｓｅ＿ｑＩｄｘ＿ｔｒａｎｓｉｔｉｏｎ－１））の精度は、除算後の精度を高めるために除算前に大きな値によって乗算又はシフトすることによって高めることができる。
ｑＳｔｅｐ＿ｍｏｄｅ＝１の一態様では、ｎｕｍＱｓｔｅｐｓＩｎＩｎｔｅｒｖａｌは、可変長コードを用いて前の間隔からデルタ符号化することができ、Ｉｎｉｔｉａｌ＿ｑＩｄｘ＿ｆａｃｔｏｒの値は、いくつかの実装形態ではビットストリームでシグナリングすることができる。
ｑＳｔｅｐ＿ｍｏｄｅ＝２

更なる例では、ｑＳｔｅｐ＿ｍｏｄｅ＝２であり、これは、符号器が１つの間隔のオフセットをシグナリングし、追加の間隔を生成するためにその間隔を複製することを可能にする。
ｑＳｔｅｐ＿ｍｏｄｅ＝３

更に別の例では、ｑＳｔｅｐ＿ｍｏｄｅ＝３であり、これは、符号化システムがＱｓｔｅｐＴａｂｌｅＴｅｍｐｌａｔｅを明示的にシグナリングし、ＱｓｔｅｐＴａｂｌｅＴｅｍｐｌａｔｅからＱｓｔｅｐＴａｂｌｅをｄｅｒｉｖｉｅすることを可能にする。この例では、テンプレートとして機能するテーブルのセットをシグナリングすることができる。そのシーケンスに使用されることになる最終テーブルは、ＱｓｔｅｐＴａｂｌｅＴｅｍｐｌａｔｅの組合せとして導出することができる。以下の例示的な説明では、テーブル１から最初の６４個のエントリがあり、テーブル２から次の１９６個のエントリがある。
Ｋ＝０である場合、
さもなければ（Ｋ＞０）である場合、
図８

図８は、量子化ステップモードを有する本開示の一実施形態に係る方法を示す。方法８００は、選択された量子化ステップモード及び選択された量子化ステップモードに関連付けられたパラメータを識別するデータの受信時に開始することができる。選択された量子化ステップモードに関連付けられたパラメータは、量子化調整曲線のセットの導出を可能にすることができ、上記で説明したように、遷移点の数についてのデータを含むことができる（ボックス８１０）。任意選択的に、遷移点識別は、識別オフセット及び／又はスケーリング重みを含むことができる（ボックス８２０、８３０）。選択された量子化ステップモード及び任意の関連付けられたパラメータから、方法８００は、量子化曲線を導出することができる（ボックス８４０）。

その後、方法８００は、ビデオ符号器又は復号器のランタイム動作中に適用することができる。所与の符号化要素についてｑ＿ｉｄｘ値が受信されると（ボックス８５０）、方法８００は、ボックス８４０で導出された量子化調整曲線に従ってｑ＿ｓｔｅｐ調整値を導出することができる（ボックス８６０）。方法８００は、ｑ＿ｓｔｅｐ値を符号化要素のｂａｓｅ＿ｑｐ値に適用することができ（ボックス８７０）、得られた値は、（符号化のための）量子化動作又は（復号のための）逆量子化動作に適用することができる（ボックス８８０）。ボックス８５０～８８０の動作は、符号化／復号動作が実行される限り、又は新しい量子化ステップモード若しくは関連付けられたパラメータが受信されるまで（ボックス８９０）、繰り返すことができる。新しい量子化ステップモード又は量子化ステップモードに関連付けられた新しいパラメータが受信されると、方法は、ボックス８１０～８４０の動作に従って量子化調整曲線を修正することができる。

動作において、量子化調整曲線の修正は、量子化調整曲線の予測に関して以下で説明するように、以前に識別された遷移点の大規模な置換を必要としない。一実施形態では、修正された遷移点データは、それらが適用される量子化インデックスの識別とともに受信することができる。新しい量子化調整曲線は、新しい遷移点識別を他のｑ＿ｉｄｘ範囲に適用されるより古い遷移点識別と統合することによって導出することができる。

一態様では、量子化パラメータ以外の符号化パラメータも、ｑ＿ｓｔｅｐなどの量子化パラメータから導出することができる（任意選択のボックス８７５）。インループフィルタリングパラメータ、インター予測パラメータ及びイントラ予測パラメータなどの符号化パラメータは、「改善された量子化器に基づく符号化拡張」で以下により詳細に説明するように、ｑ＿ｓｔｅｐに基づいて、符号器又は復号器において決定することができる。ボックス８７５で決定された任意の非量子化符号化パラメータは、対応する符号器又は復号器プロセス（図８に図示せず）において使用することができる。例えば、インループデブロッキングフィルタのフィルタ強度は、ボックス８７５でｑ＿ｓｔｅｐに基づいて決定することができ、次いで、決定されたデブロッキングフィルタ強度は、符号器フィルタ２４０（図２）又は復号器フィルタ３４０（図３）内のデブロッキングフィルタに適用することができる。
量子化調整曲線の代替セット及び予測

符号化されたビデオの異なる部分は、量子化調整曲線の代替セットを使用することができる。例えば、４つの量子化ステップモードのシーケンスヘッダにおいて上述したような量子化調整曲線の１つのセットは、ビデオシーケンス内の全ての画像データの量子化又は逆量子化中に使用するための新しい量子化調整曲線を生成するために組み合わされる。他の例では、量子化曲線の異なるセットを、ＤＣ係数及びＡＣ係数について、ルマデータ及びクロマデータについて、又はＩフレーム、Ｐフレーム、若しくはＢフレームについて、圧縮ビットストリームにおいて定義することができる。

一態様では、符号化システムは、Ｑ＿Ｓｔｅｐの第１の要素であるｉｎｉｔｉａｌ＿Ｑ＿Ｓｔｅｐインデックスを明示的にシグナリングすることができる。

量子化調整曲線の代替セットが圧縮ビットストリームに２回以上含まれるとき、調整曲線を指定するビットコストは、以前にシグナリングされた量子化調整曲線から調整曲線の１つのセットを予測することによって、低減することができる。

第１の態様では、量子化調整曲線のセットは、量子化調整曲線のセットを指定するパラメータ内の予測によって指定することができる。このタイプの予測では、パラメータは、以前のパラメータに対してデルタ符号化することができる。例えば、Ｎ個の要素のｑ－Ｓｔｅｐテーブルをシグナリングしている間に、ｑＳｔｅｐテーブルのＫ番目の要素は、（Ｋ－１）番目の要素（利用可能な場合）からのデルタ、すなわちｄｅｌｔａｑＳｔｅｐ［ｋ］として符号化することができる。ｑＳｔｅｐパラメータの導出中、ｑＳｔｅｐ［Ｋ］は、ｑＳｔｅｐ［ｋ－１］＋ｄｅｌｔａｑＳｔｅｐ［Ｋ］として導出される。（以前の値に基づいて）そのようなデルタ符号化方式を有効又は無効にするために、フラグをシグナリングすることができる。

第２の態様では、量子化調整曲線のセットは、時間パラメータにわたる中の予測によって指定することができる。このタイプの予測では、パラメータは、時間ピクチャの対応するヘッダ（ピクチャ、タイルヘッダなど）又は同じピクチャ内のヘッダ（例えばタイルヘッダ）のいずれかであるが、符号化順で先行する、すでにシングル化されたパラメータからコピーされる。（時間的な値又はすでに符号化された先行する値に基づいて）そのようなコピー方式を有効又は無効にするために、フラグをシグナリングすることができる。複数のタイルがシーケンス内で有効にされるときに、どこから情報をコピーすることができるかを指定するために、特定のルールを定義することができる。いくつかの例示的な定義を以下に示す。
ａ．グローバルパラメータセット（例えば、シーケンスヘッダ）からのコピーを指定するためのフラグ。このフラグが有効にされている場合、パラメータは、グローバルパラメータセットからコピーすることによって導出される。
ｂ．（ａ）においてフラグが無効にされている場合、特定のタイルヘッダから（例えば、現在と同じタイルＩＤを有する時間ピクチャのタイルヘッダから）コピーするために、別のフラグをシグナリングすることができる。
要約すると、現在のヘッダ（例えば、タイル）について、どこから情報をコピーすることができるかを指定するために、それをシグナリングすることができる。

第３の態様では、量子化調整曲線のセットは、色成分パラメータ間の予測によって指定することができる。このタイプの予測では、パラメータは、それらの対応する成分からコピーされる。例えば、パラメータは、成分のうちの１つ（ルマ）についてシグナリングされ、他の２つの成分Ｃｂ及びＣｒは、ルマと同じパラメータを使用する。別の例では、パラメータは、成分のうちの１つ（ＡＣ係数）についてシグナリングされ、ＤＣ成分は、ＡＣ係数と同じパラメータを使用する。（上記の例における対応する成分に基づいて）そのようなコピー方式を有効又は無効にするために、フラグをシグナリングすることができる。無効にされた場合、上記の成分の各々について、別個のパラメータをシグナリングすることができる。
改善された量子化器に基づく符号化拡張

量子化インデックスｑ＿ｉｄｘと量子化ステップサイズｑ＿ｓｔｅｐとの間の関係が明示的にシグナリングされ、画像／ビデオ符号化仕様に適応される、フレキシブル量子化器シグナリング方式が上記で提示されている（例えば、図６、図８）。この量子化器制御は、例えば、残差信号の量子化に使用することができる。特に、タイル、画像、又はシーケンスの１つのセットについて、ユーザは、ｑ＿ｉｄｘ値の特定の範囲、例えば、ｑ＿ｉｄｘ（ｍ）からｑ＿ｉｄｘ（ｎ）までがｑ＿ｓｔｅｐ０（ｍ）からｑ＿ｓｔｅｐ０（ｎ）までの特定のｑ＿ｓｔｅｐ値に対応することをシグナリングするように選択することができる。しかしながら、タイル、画像、又はシーケンスの異なるセットについて、ｑ＿ｓｔｅｐ値の異なる範囲、すなわちｑ＿ｓｔｅｐ１（ｍ）からｑ＿ｓｔｅｐ１（ｎ）までを選択することができる。そのような柔軟性は、より細かくかつより正確なレート制御及びレート割り当てモデルが達成されることを可能にすることができるため、異なる符号器において有利であると見ることができる。

それにもかかわらず、そのような量子化器の柔軟性をサポートすることができる符号化システムのいくつかの規範的及び非規範的態様は、そのような設計によって影響を受け得る。特に、通常、符号化中の量子化器の選択は、レート歪み最適化量子化、ＨＥＶＣ及びＶＶＣビデオ符号化規格のコンテキストにおいて適用可能なサンプル適応オフセット最適化など、符号器によってサポートされる場合、ラグランジュベースの動き推定、モード決定、並びに他のレート歪みベースの動作のために使用されるラグランジュパラメータなどの、符号化モード決定を制御するパラメータに影響を与え得る。そのようなラグランジュ最適化は、通常、以下の形式である。
Ｊ＝歪み＋ラムダ＊レート
式中、歪みは、符号化された信号が元の入力とどれだけ異なるかを示すことができる品質の任意のメトリックであってもよく、例えば、絶対値の和又は二乗差として計算することができ、レートは、現在最適化されている対応する情報を符号化するために必要なビット数の実際の値又は近似値のいずれかを示す。変数ラムダは、より低い歪み又はより低いレートのいずれかに向かう決定プロセスの選好をもたらす制御パラメータである。そのような最適化では、ラグランジュコストＪを使用して複数の代替符号化モード又はパラメータが評価され、そのようなコストが通常は最小になるものが符号化モードとして選択される。モデルは、復号の複雑さ／電力のコスト、パケット損失によるコスト推定値、後処理による品質などの、追加のコストパラメータをサポートするように拡張することができる。

パラメータ・ラムダの制御は、通常、ｑ＿ｉｄｘの値を検査し、ｑ＿ｉｄｘを所与としてラムダの定式化を指定することによって達成されるが、場合によっては、分解能、スライスタイプ、階層レベル、局所複雑度／分散などの他のパラメータも指定される。そのような関係は、異なるモデルが与えられた場合に、異なる量子化器及び符号化条件の下で符号化されたシーケンスの挙動、並びにラグランジュラムダ値に対するそれらの影響を検査することによって過去に決定されている。しかしながら、従来の符号化仕様は、固定されたｑ＿ｉｄｘセットを採用し、したがって、ｑ＿ｉｄｘとラグランジュパラメータとの間の適切な関係を決定することは容易である。それにもかかわらず、ｑ＿ｉｄｘからｑ＿ｓｔｅｐへの柔軟な設計（図６及び図８など）においてそうすることは、ここでｑ＿ｉｄｘからｑ＿ｓｔｅｐへのマッピングが固定されていないことを考えると、少し複雑である。ラムダパラメータの元の計算を依然として使用することができるが、これは準最適であり得る。例えば、ＡＶＣ及びＨＥＶＣのような規格において使用される一般的なモデルは、以下の形式である。
ラムダ＝アルファ＊２＾（（ｑ＿ｉｄｘ－１２）／３）

この計算のコア形式は、これらの規格におけるｑ＿ｉｄｘとＱｓｔｅｐの一意の関係に基づくが、アルファは、符号化中に考慮される予測構造及びアプリケーション目標に基づいて通常は調整される。イントラ符号化の場合、例えば、アルファに使用される一般的な値は、０．６８に等しい。この計算は、「公称」ｑ＿ｉｄｘが与えられた場合のラムダの「公称」計算と呼ばれることがある。

そのような固定式はまた、上記で説明したｑ＿ｉｄｘからｑ＿ｓｔｅｐへの適応設計とともに使用することができるが、それは準最適であり、符号化のための最良の性能をもたらさないことがある。代わりに、新しいｑ＿ｉｄｘ対ｑ＿ｓｔｅｐ関係に基づくようにラムダ計算を調整することができる。特に、ＡＶＣ及びＨＥＶＣに使用されるラムダモデルを以下の形式に再定式化することができる。
ラムダ＝アルファ＊ｆ（ｑ＿ｓｔｅｐ）
ＡＶＣ及びＨＥＶＣでは、ｑ＿ｓｔｅｐは、次の形式である。
式中、ｘが０～５の範囲でのｑ＿ｓｔｅｐ（ｘ）は、それぞれ、０．６２５、約０．７０２、約０．７８７、約０．８８４、約０．９９２、及び約１．１１４に等しい。それを使用して、ＡＶＣ及びＨＥＶＣについて、ｑ＿ｉｄｘとｑ＿ｓｔｅｐとの間の逆関係を導出することもできる。すなわち、ｑ＿ｓｔｅｐが与えられると、ｑ＿ｉｄｘの値を次のように近似することができる。
次に、その式を使用して、公称ｑ＿ｉｄｘの代わりにｑ＿ｉｄｘ（ｑ＿ｓｔｅｐ）関数を用いて上記の公称ラムダ定式化を更新することができ、したがって以下の通りである。

同様のモデルが他の符号化規格の符号器実装形態にわたって適用可能であると仮定すると、フレキシブルｑ＿ｉｄｘマッピング方法のためのラムダ値を決定するために上記の式を使用することができる。すなわち、まず、現在のパーティションのための動作ｑ＿ｓｔｅｐを決定し、次いで、ラムダを導出するために上記の定式化にこのｑ＿ｓｔｅｐを使用する。

符号器における異なる動作に対して、ラムダは、少し異なって計算することができる。例えば、動き推定の場合、ラムダは、通常、モード決定プロセスのためのラムダの平方根として計算される。上記の計算の拡張、すなわち、ｑ＿ｉｄｘを使用する対応する公称計算からｑ＿ｓｔｅｐを使用する定式化へのラムダ計算の再マッピングは、現在の技術の経験を積んだ人々にとって非常に簡単であるはずである。公称ｑ＿ｉｄｘからのラムダの導出を指定する符号器によって使用される他の式を変換して、代わりにｑ＿ｓｔｅｐ値を利用することも非常に簡単であるはずである。

ラムダの導出はまた、どの歪み関数が使用されるかに依存し得る。ｑ＿ｉｄｘを使用する対応する公称計算からｑ＿ｓｔｅｐを使用する定式化へのラムダの同様の再マッピングは、一次歪み（例えば、絶対差の和）、二次歪み（例えば、平均二乗誤差）、及びより高次かつ訓練された歪み（例えば、ＳＳＩＭ、ＶＭＡＦなど）に拡張することができる。より高次かつ訓練された歪みの場合、領域（８×８のブロック、セグメントなど）及びｑ＿ｉｄｘ（ｑ＿ｓｔｅｐ）についてのメトリックスコアの関数として、ＳｃａｌｅＦａｃｔｏｒ（アルファに加えて）を計算することができる。

いくつかの符号器は、任意のｑ＿ｓｔｅｐ値についてラムダの値を計算することが可能であり得るが、場合によっては、例えば、特定のハードウェア実装形態では、そのような計算は、限られたサイズの、例えば、サイズＮのルックアップテーブルを使用して実行することができる。そのような場合、Ｎ個の異なる、対数領域において均一に分布したｑ＿ｓｔｅｐ値についてｑ＿ｓｔｅｐとラムダとの間の正確なマッピングを提供するようにルックアップテーブルを設計し、次いで、補間技術を使用して、実際の選択されたｑ＿ｓｔｅｐについてより正確なラムダ値を導出することができる。

例えば、Ｎが６４であり、３２から２＾１４までのＱｓｔｅｐ範囲をカバーしたいと仮定すると、位置３２＋２５６＊ｎにおけるｑ＿ｓｔｅｐ値についてのラムダを定義することができ、ｎは、０からＮ－１までである。ｑ＿ｉｄｘが定義されたｑ＿ｓｔｅｐ値とは異なるｑ＿ｓｔｅｐ値にマッピングされる場合、ラムダは、最も近い隣接する定義されたｑ＿ｓｔｅｐ値を使用する補間プロセス、又は必要であれば外挿プロセスを使用して計算することができる。補間は、様々な補間法を使用して、例えば、バイリニア、バイキュービック、又は区分キュービックのエルミート多項式補間法を使用して行うことができ、量子化ステップサイズの特性が与えられれば、好ましくは対数領域で、又は線形領域で実行することができる。

この手法は、計算の複雑さも低く保ちながら、ｑ＿ｓｔｅｐをラムダルックアップテーブルに記憶するメモリ要件を低減するのに役立つことができる。

符号器と復号器の両方に影響を及ぼす、ループフィルタリング、動きベクトル、及び重み付け予測などの規範的動作はまた、柔軟なｑ＿ｓｔｅｐからｑ＿ｉｄｘへのマッピングの考慮によって影響を受け得る。特に、デブロッキング、適応ループフィルタリング（ＡＬＦ）、サンプル適応オフセット（ＳＡＯ）フィルタリングなどのループフィルタリング機構は、ブロック及びその近傍の対応するｑ＿ｉｄｘの値を考慮して、そのブロック内のサンプルに対して実行されるフィルタリング機構の強度を調整することができる。例えば、ＡＶＣ及びＨＥＶＣでは、画素がどのように、いつフィルタリングされるべきかに影響を与えるｑ＿ｉｄｘ依存閾値を指定するテーブルが定義される。これらのテーブルは、閾値Ｔとｑ＿ｉｄｘとの間の式、すなわちＴ＝ｇ（ｑ＿ｉｄｘ）として定義することもできる。そのような閾値は、特定のｑ＿ｓｔｅｐ値とのその関連付けも考慮して、ｑ＿ｉｄｘがもたらし得る予想される歪みに基づいて定義される。しかしながら、本明細書で説明する柔軟なｑ＿ｉｄｘ設計では、インデックスｑ＿ｉｄｘの代わりに実際のｑ＿ｓｔｅｐ値、すなわちＴ＝ｈ（ｑ＿ｓｔｅｐ）に基づいてそのようなテーブル又は式を再定義することがより適切であり得る。そのような式の変換、すなわちｑ＿ｉｄｘからｑ＿ｓｔｅｐへの変換は、ラグランジュパラメータ導出の定式化の変換が上記で実行された方法と非常に類似して行うことができる。

ＨＥＶＣにおけるように、テーブルルックアップを使用してそのような閾値処理機構を計算することが望ましい場合、固定テーブル内のエントリによって示される「量子化された」ｑ＿ｓｔｅｐ値のみを考慮する固定テーブルを使用することができる、又はラグランジュパラメータ導出にも利用された補間技術の使用による、のいずれかである。

インループデブロックフィルタリングのための一態様では、デブロッキングフィルタ強度は、量子化の程度に関係することができる。画素ブロック（又は画像の他の部分）におけるより高い程度の量子化は、視覚ブロッキングアーティファクトの増加をもたらすことがあり、したがって、より強いデブロッキングフィルタの使用により、圧縮品質を改善することができる。インループデブロッキングフィルタは、符号器及び復号器の両方に使用することができ、デブロッキングフィルタ強度は、符号器と復号器との間の圧縮ビットストリームで明示的にシグナリングされる代わりに、他の符号化パラメータから推測することができる。ＡＶＣ及びＨＥＶＣでは、デブロッキングフィルタ強度は、画素ブロックに使用される量子化器インデックス（ｑ＿ｉｄｘ）に基づいて（少なくとも部分的に）推測される。本明細書で説明するより柔軟な量子化器設計では、ｑ＿ｉｄｘは、使用される量子化の程度、ブロッキネスアーティファクトの重大度、又は最良のインループフィルタ強度についての信頼できる予測子ではないことがある。これらのより柔軟な量子化器設計を用いて、デブロッキングフィルタ強度は、ｑ＿ｓｔｅｐ又はｑｐ（量子化パラメータ）値のいずれかからより良好に予測することができる。

符号器と復号器の両方における他のプロセスも、符号化ステップを実行する又は適応させるために量子化情報を利用することができる。例えば、動きベクトル予測は、現在の動きベクトルを予測及び符号化するための可能な動きベクトル候補を判定するために、現在のブロックに空間的及び時間的に隣接するパーティションを考慮する。そのような導出は、候補の品質、したがってその動きベクトルに直接関係するため、量子化を利用することもできる。近傍が別の近傍よりも高品質である場合、高品質の近傍の動きベクトルは、低品質の近傍の動きベクトルよりも高い相関を有し得る可能性が高い。ｑ＿ｉｄｘの代わりに近傍に使用される実際のｑ＿ｓｔｅｐを考慮することにより、異なる近傍パーティション間の相対品質をよりよく考慮することを可能にすることができ、したがって、潜在的に、最終的な動きベクトル予測子をより正確に決定することができる。具体的には、動きベクトル予測リスト内の他のより低品質の動きベクトル候補と比較して、より高品質の動きベクトル候補をより低いインデックス位置に配置することができる。いくつかの動きベクトル候補は、同じである又は類似していることがあるため、動きベクトルリスト内のこれらの候補を配置するより正確な方法を有することは、有益であると立証することができる。同様の手法は、重み付けされた予測パラメータなどの他の情報の予測に使用することができる。

一態様では、予測検索は、候補予測基準の量子化の程度に基づくことができる。複数の可能な予測基準からの様々なタイプの予測について、予測精度の精度は、量子化の程度に関連することができる。高度に量子化された予測基準は、それほど高度に量子化されていなかった予測基準と比較して不十分な予測を提供することがある。したがって、（例えば、画素データのインター予測又はイントラ予測のために）符号器において単一の動き予測基準を選択するとき、符号器は、より低い程度に以前に量子化された予測基準を選択することに向かうバイアスを含むことができ、量子化の程度は、ｑ＿ｉｄｘではなくｑ＿ｓｔｅｐ又はｑｐに基づいてより正確に決定することができる。符号器又は復号器における複数の予測基準の重み付けされた組合せの場合、重み付けは、（ｑ＿ｉｄｘの代わりに）ｑ＿ｓｔｅｐ又はｑｐに基づくことができる。例えば、線形重み付け予測は、以下のようにすることができる。
式中、ｃ１／ｃ２は、候補であり、ｑ（ｘ）は、（ｑ＿ｓｔｅｐ又はｑｐによって測定したときの）候補ｘの量子化器強度であり、ｆは、何らかの重み付けに対応し、ｐｒｅｄｉｃｔｉｏｎ＿ｉｎｆｏは、どんな情報が予測されているか（例えば、イントラ予測又はインター予測のための、動きベクトル、重み、又は更にはサンプルであってもよい）である。例えば、重みの合計が１になることを確実にするために、相対重み付けを使用することもできる。

別の態様では、特定の画素領域の量子化ステップサイズ調整曲線は、前景領域に対するその背景領域の画素強度分布に基づいて構築することができる。ここでの領域は、ブロック、タイル、セグメント、又はフレーム全体であってもよい。例えば、量子化ステップサイズ値は、以下のステップでＮ×Ｎの画素のブロックについて導出することができる。第１のステップでは、各Ｎ×Ｎのブロックについて、背景領域が推定され、その平均画素強度が計算される。背景領域を推定する方法は、Ｎ×Ｎの画素のブロックの周りの周囲のＭ行／列の画素が背景を構成することができるなどの、簡単なものであってもよい。代替として、背景領域導出は、追跡、人体姿勢推定、背景混合モデル、ファジー及び深層学習ベースの方法などのより高度な方法を伴うことができる。第２のステップでは、現在の領域（例えば、Ｎ×Ｎの画素のブロック）内の背景画素と非背景画素との間の画素強度の絶対差に基づいて、コントラスト係数が計算される。係数は、例えば、最も近い前景画素に対する背景画素の画素距離に基づく重み付けされた絶対差として計算することもできる。第３のステップでは、ステップ１で導出された背景の平均画素強度の関数として、及びステップ２で導出されたコントラスト係数の関数として、量子化ステップサイズスケーリングファクタが計算される。このスケーリングファクタは、正規化して、隣接するステップサイズの範囲内に収まるようにクリッピングすることができる。このスケーリングファクタは、隣接ブロックに対するブロックの知覚マスクとして解釈することができ、この係数は、本開示で説明する量子化曲線のいずれかに対する比として適用することができる。代替的に、これらのスケーリングファクタを適用した後に生じる量子化器ステップは、正規化後に新しい量子化器曲線を形成することができ、シーケンス、フレーム、タイル、又はセグメントヘッダにおいてシグナリングすることができる。

前述の考察では、本開示の態様の動作を図２～図３に示すものなどのビデオ符号器と復号器との関連で説明した。一般に、これらの構成要素は、電子デバイスとして提供される。ビデオ復号器及び／又はコントローラは、特定用途向け集積回路、フィールドプログラマブルゲートアレイ及び／又はデジタル信号プロセッサなどの集積回路に具現化することができる。あるいは、それらは、カメラデバイス、パーソナルコンピュータ、ノートブックコンピュータ、タブレットコンピュータ、スマートフォン、又はコンピュータサーバ上で実行するコンピュータプログラムに具体化することができる。そのようなコンピュータプログラムは、典型的には、電子、磁気、及び／又は光学ベースの記憶デバイスなどの非一時的物理記憶媒体に記憶された命令を含み、それらがプロセッサによって読み取られて実行される。復号器は通常、スマートフォン、タブレットコンピュータ、ゲームシステム、ＤＶＤプレーヤ、ポータブルメディアプレーヤなどのような民生電子機器デバイス内にパッケージされ、またビデオゲーム、メディアプレーヤ、メディアエディタなどの民生用ソフトウェアアプリケーション内にパッケージすることもできる。もちろん、これらの構成要素は、必要に応じて、専用のハードウェア構成要素とプログラムされた汎用プロセッサとに機能を分散するハイブリッドシステムとして、提供することもできる。

ビデオ符号器及び復号器は、様々な方法でチャネルを介してビデオを交換することができる。それらは、図１に示すように、通信及び／又はコンピュータネットワークを介して互いに通信することができる。更に他の適用例では、ビデオ符号器は、ビデオデータを電気記憶媒体、磁気記憶媒体、及び／又は光学記憶媒体などの記憶デバイスに出力することができ、それは、後で復号器に提供することができる。そのような適用例では、復号器は、符号化されたビデオデータを記憶デバイスから取り出し、それを復号することができる。

Claims

量子化方法であって、
符号化されたビデオデータを表すデータストリームでシグナリングされる遷移点データであって、前記遷移点データが、新しい量子化調整曲線の導出に使用されることになるデフォルト調整曲線の要素を識別する、遷移点データから、前記新しい量子化調整曲線を導出することと、
処理されることになるビデオの要素について、処理されることになるビデオの前記要素に関連付けられたインデックス値に従って、前記新しい量子化調整曲線から量子化調整値を導出することと、
前記量子化調整値から量子化パラメータを導出することと、
量子化動作において、前記量子化パラメータをビデオの前記要素に適用することと、
を含む、方法。
前記遷移点データが、デフォルト調整曲線を識別するテーブルインデックスと、前記新しい量子化調整曲線の導出に使用される前記テーブルへのインデックスの範囲と、を含む、請求項１に記載の方法。
前記遷移点データが、前記新しい量子化調整曲線の導出のためにデフォルト調整曲線の前記要素に適用されるスケーリングを識別するスケーリング値を含む、請求項１に記載の方法。
前記量子化動作が、ビデオ符号器によって実行される変換係数の量子化である、請求項１に記載の方法。
前記量子化動作が、ビデオ復号器によって実行される変換係数の逆量子化である、請求項１に記載の方法。
前記曲線に沿った各インデックス位置における前記新しい量子化調整曲線が、変換係数の個別の行列に適用される量子化調整の量子化行列を表す、請求項１に記載の方法。
前記デフォルト調整曲線がそれぞれ、量子化ステップサイズのテーブルによって表され、
前記遷移点データが、前記テーブルのうちのどれが前記テーブルへのインデックスのどの範囲にわたって前記新しい量子化調整曲線に寄与するかを示す、前記テーブル間の遷移を定義し、
前記量子化調整値が、前記インデックス値の前記遷移点データによって選択された前記テーブルの前記量子化ステップサイズのエントリから導出される、
請求項１に記載の方法。
前記データストリームの異なる部分に対して遷移点データの異なるセットが存在し、前記データストリームの前記異なる部分の各々に対して新しい量子化調整曲線が導出される、請求項１に記載の方法。
前記異なる部分が、ＡＣ係数及びＤＣ係数である、請求項８に記載の方法。
前記異なる部分が、ルマ係数及びクロマ係数である、請求項８に記載の方法。
前記異なる部分が、Ｉフレーム、Ｐフレーム、及びＢフレームである、請求項８に記載の方法。
遷移点データの後のセットが、遷移点データの前のセットから予測される、請求項８に記載の方法。
前記遷移点データが、選択された量子化ステップモードと、前記選択された量子化ステップモードの選択されたパラメータと、を含む、請求項１に記載の方法。
前記量子化調整値に基づいてフィルタ強度を導出することと、
前記導出されたフィルタ強度でインループフィルタをビデオの前記要素に適用することと、
を更に含む、請求項１に記載の方法。
量子化方法であって、
量子化ステップモードと、符号化されたビデオデータを表すデータストリームでシグナリングされた前記選択された量子化ステップモードの任意の関連付けられたモードパラメータとから新しい量子化調整曲線を導出することと、
処理されることになるビデオの要素について、処理されることになるビデオの前記要素に関連付けられたインデックス値に従って、前記新しい量子化調整曲線から量子化調整値を導出することと、
前記量子化調整値から量子化パラメータを導出することと、
量子化動作において、前記量子化パラメータをビデオの前記要素に適用することと、
を含む、方法。
前記選択された量子化ステップモードが、既定のモードであり、モードパラメータが、前記選択された量子化ステップモードに関連付けられていない、請求項１５に記載の方法。
前記選択された量子化ステップモードが、直前の量子化調整曲線から２倍の勾配を有する線形量子化調整曲線を含む、請求項１５に記載の方法。
前記選択された量子化ステップモードが、１つの量子化調整曲線を指定する関連付けられたパラメータを含み、サブシーケンス量子化調整曲線が、前記１つの量子化調整曲線を複製することによって決定される、請求項１５に記載の方法。
前記選択された量子化ステップモードが、各量子化調整曲線に対する量子化ステップサイズのテーブルを定義する関連付けられたパラメータを含む、請求項１５に記載の方法。
前記量子化調整値に基づいてフィルタ強度を導出することと、
前記導出されたフィルタ強度でインループフィルタをビデオの前記要素に適用することと、
を更に含む、請求項１５に記載の方法。
符号化システムであって、
量子化パラメータをビデオの要素に適用する量子化器と、
前記量子化器を制御するコントローラと、
命令を記憶するメモリと、
を備え、前記命令が、前記コントローラによって実行されると、
符号化されたビデオデータを表すデータストリームでシグナリングされる遷移点データであって、前記遷移点データが、新しい量子化調整曲線の導出に使用されることになるデフォルト調整曲線の要素を識別する、遷移点データから、前記新しい量子化調整曲線を導出させ、
処理されることになるビデオの前記要素について、処理されることになるビデオの前記要素に関連付けられたインデックス値に従って、前記新しい量子化調整曲線から量子化調整値を導出させ、
前記量子化調整値から前記量子化パラメータを導出させる、
符号化システム。
命令を記憶する非一時的記憶媒体であって、前記命令が、プロセッサ上で実行されると、
量子化ステップモードと、符号化されたビデオデータを表すデータストリームでシグナリングされた前記選択された量子化ステップモードの任意の関連付けられたモードパラメータとから新しい量子化調整曲線を導出させ、
処理されることになるビデオの要素について、処理されることになるビデオの前記要素に関連付けられたインデックス値に従って、前記新しい量子化調整曲線から量子化調整値を導出させ、
前記量子化調整値から量子化パラメータを導出させ、
量子化動作において、前記量子化パラメータをビデオの前記要素に適用させる、
非一時的記憶媒体。