JP7315702B2

JP7315702B2 - エンコードされたビデオビットストリームをデコードする方法、デバイス、及びコンピュータプログラム

Info

Publication number: JP7315702B2
Application number: JP2021560266A
Authority: JP
Inventors: チョイ，ビョンドゥ; ウェンジャー，ステファン; リィウ，シャン
Original assignee: テンセント・アメリカ・エルエルシー
Priority date: 2020-05-20
Filing date: 2021-04-12
Publication date: 2023-07-26
Anticipated expiration: 2041-04-12
Also published as: US11477471B2; SG11202111859WA; US20210368189A1; KR20210144885A; EP3939264A4; JP2023134662A; EP3939264A1; AU2021257953A1; JP2022537241A; WO2021236257A1; US20220400276A1; AU2021257953B2; CN114270819A; AU2023203644A1

Description

［関連出願への相互参照］
本願は、米国特許商標庁で、２０２０年５月２０日付けで出願された米国特許仮出願第６３／０２７８３５号、２０２０年６月５日付けで出願された米国特許仮出願第６３／０３５６４７号、２０２０年６月８日付けで出願された米国特許仮出願第６３／０３６１７４号、２０２０年６月８日付けで出願された米国特許仮出願第６３／０３６３４２号、及び２０２１年３月２４日付けで出願された米国特許出願第１７／２１１２３６号に対して３５Ｕ．Ｓ．Ｃ第１１９条による優先権を主張する。これらの先願の開示は、その全文を参照により本願に援用される。

［技術分野］
開示されている対象は、ビデオコーディング及びデコーディングに、より具体的には、複数のレイヤによるコーディングされたビデオストリームでの参照ピクチャリサンプリング及び空間スケーラビリティのシグナリング結合に関係がある。

動き補償付きのインターピクチャ予測を使用したビデオコーディング及びデコーディングが知られている。圧縮されていないデジタルビデオはピクチャの連続から成ることができ、各ピクチャは、例えば、１９２０×１０８０のルミナンスサンプル及び関連するクロミナンスサンプルの空間寸法を有する。ピクチャの連続は、例えば、毎秒６０ピクチャ、つまり６０Ｈｚの固定又は可変のピクチャレート（俗にフレームレートとしても知られている。）を有することができる。圧縮されていないビデオは、有意なビットレート要件を有している。例えば、サンプル当たり８ビットでの１０８０ｐ６０４：２：０ビデオ（６０Ｈｚのフレームレートでの１９２０×１０８０のルミナンスサンプル解像度）は、１．５Ｇビット／ｓに近いバンド幅を必要とする。そのようなビデオの１時間は、６００ギガバイト（ＧＢ）超の記憶空間を必要とする。

ビデオコーディング及びデコーディングの１つの目的は、圧縮による入力ビデオ信号の冗長性の低減であることができる。圧縮は、いくつかの場合に２桁以上、上記のバンド幅又は記憶空間要件を減らすのを助けることができる。可逆及び不可逆圧縮の両方並びにそれらの組み合わせが用いられ得る。可逆圧縮は、原信号の厳密なコピーが圧縮された原信号から再構成可能である技術を指す。不可逆圧縮を使用する場合に、再構成された信号は、原信号と同じでない場合があるが、原信号と再構成された信号との間のひずみは、再構成された信号を、意図された用途にとって有用なものとするほど十分に小さい。ビデオの場合には、不可逆圧縮が広く用いられている。許容されるひずみの量は用途に依存し、例えば、特定の消費者ストリーミング用途のユーザは、テレビジョン配信用途のユーザよりも高いひずみを許容し得る。達成可能な圧縮比は、より高い許容可能な／受け入れ可能なひずみがより高い圧縮比をもたらし得ることを反映することができる。

ビデオエンコーダ及びデコーダは、例えば、動き補償、変換、量子化、及びエントロピコーディングを含む、いくつかの広いカテゴリからの技術を利用することができる。そのような技術のいくつかは以下で紹介される。

従前、ビデオエンコーダ及びデコーダは、ほとんどの場合に、コーディングされたビデオシーケンス（Coded Video Sequence，ＣＶＳ）、グループ・オブ・ピクチャ（Group of Picture，ＧＯＰ）、又は同様のマルチピクチャタイムフレームについて、定義され一定に保たれた所与のピクチャサイズで動作する傾向があった。例えば、ＭＰＥＧ－２では、システム設計は、シーンの活動などの因子に応じて、しかしＩピクチャでのみ、従って、通常はＧＯＰについて、水平解像度（及び、それによって、ピクチャサイズ）を変えることが知られている。ＣＶＳ内の異なる解像度の使用のための参照ピクチャのリサンプリングは、例えば、ＩＴＵ－ＴＲｅｃ．Ｈ．２６３ＡｎｎｅｘＰから、知られている。しかし、ここでは、ピクチャサイズは変化せず、参照ピクチャのみがリサンプリングされて、結果として、潜在的に、ピクチャキャンバスの部分のみが（ダウンサンプリングの場合に）使用されるか、あるいは、シーンの部分のみが（アップサンプリングの場合に）捕捉されることになる。更に、Ｈ．２６３ＡｎｎｅｘＱは、上向き又は下向きに（各次元で）２倍で個々のマクロブロックのリサンプリングを可能にする。この場合もやはり、ピクチャサイズは同じままである。マクロブロックのサイズは、Ｈ．２６３では固定であるから、シグナリングされる必要がない。

予測されたピクチャにおけるピクチャサイズの変化は、現代のビデオコーディングでは、より主流になっている。例えば、ＶＰ９は、参照ピクチャリサンプリング、及びピクチャ全体の解像度の変化を可能にする、同様に、ＶＶＣに向けて行われたある提案（例えば、その全文を本願に援用されるHendry, et. al，“On adaptive resolution change (ARC) for VVC”，Joint Video Team document JVET-M0135-v1，２０１９年１月９～１８日）は、異なる（より高い又はより低い）解像度への参照ピクチャ全体のリサンプリングを可能にする。そのような文献では、異なる候補解像度が、シーケンスパラメータセットでコーディングされて、ピクチャパラメータセットでピクチャごとのシンタックス要素によって参照されることが提案されている。

実施形態で、少なくとも１つのプロセッサを用いて、エンコードされたビデオビットストリームをデコードする方法であって、
コーディングされたビデオシーケンス（ＣＶＳ）に対して参照ピクチャリサンプリングが有効にされることを示す第１フラグを、前記エンコードされたビデオビットストリームから取得するステップと、
ピクチャ解像度が前記ＣＶＳにおいて変更されるかどうかを示す第２フラグの値を決定するステップと、
前記ピクチャ解像度が前記ＣＶＳにおいて変更されることを示す前記第２フラグの値に基づいて、空間スケーラビリティ及び適応解像度変更（Adaptive Resolution Change，ＡＲＣ）のために前記参照ピクチャリサンプリングを用いて前記ＣＶＳをデコードするステップと、
前記ピクチャ解像度が前記ＣＶＳにおいて変更されないことを示す前記第２フラグの値に基づいて、前記空間スケーラビリティのためには前記参照ピクチャリサンプリングを用いて、前記ＡＲＣのためには前記参照ピクチャリサンプリングを用いずに前記ＣＶＳをデコードするステップと
を有する方法が提供される。

実施形態で、エンコードされたビデオビットストリームをデコードするデバイスであって、
プログラムコードを記憶するよう構成される少なくとも１つのメモリと、
前記プログラムコードを読み出し、該プログラムコードによって指示されるように動作するよう構成される少なくとも１つのプロセッサと
を有し、
前記プログラムコードは、
前記少なくとも１つのプロセッサに、コーディングされたビデオシーケンス（ＣＶＳ）に対して参照ピクチャリサンプリングが有効にされることを示す第１フラグを、前記エンコードされたビデオビットストリームから取得させる第１取得コードと、
前記少なくとも１つのプロセッサに、ピクチャ解像度が前記ＣＶＳにおいて変更されるかどうかを示す第２フラグの値を決定させる決定コードと、
前記少なくとも１つのプロセッサに、前記ピクチャ解像度が前記ＣＶＳにおいて変更されることを示す前記第２フラグの値に基づいて、空間スケーラビリティ及び適応解像度変更（ＡＲＣ）のために前記参照ピクチャリサンプリングを用いて前記ＣＶＳをデコードさせる第１デコーディングコードと、
前記少なくとも１つのプロセッサに、前記ピクチャ解像度が前記ＣＶＳにおいて変更されないことを示す前記第２フラグの値に基づいて、前記空間スケーラビリティのためには前記参照ピクチャリサンプリングを用いて、前記ＡＲＣのためには前記参照ピクチャリサンプリングを用いずに前記ＣＶＳをデコードさせる第２デコーディングコードと
を含む、
デバイスが提供される。

実施形態で、命令を記憶している非一時的なコンピュータ可読媒体であって、
前記命令は、
エンコードされたビデオビットストリームをデコードするデバイスの１つ以上のプロセッサによって実行される場合に、該１つ以上のプロセッサに、
コーディングされたビデオシーケンス（ＣＶＳ）に対して参照ピクチャリサンプリングが有効にされることを示す第１フラグを、前記エンコードされたビデオビットストリームから取得するステップと、
ピクチャ解像度が前記ＣＶＳにおいて変更されるかどうかを示す第２フラグの値を決定するステップと、
前記ピクチャ解像度が前記ＣＶＳにおいて変更されることを示す前記第２フラグの値に基づいて、空間スケーラビリティ及び適応解像度変更（ＡＲＣ）のために前記参照ピクチャリサンプリングを用いて前記ＣＶＳをデコードするステップと、
前記ピクチャ解像度が前記ＣＶＳにおいて変更されないことを示す前記第２フラグの値に基づいて、前記空間スケーラビリティのためには前記参照ピクチャリサンプリングを用いて、前記ＡＲＣのためには前記参照ピクチャリサンプリングを用いずに前記ＣＶＳをデコードするステップと
を実行させる１つ以上の命令を有する、
非一時的なコンピュータ可読媒体が提供される。

開示されている対象の更なる特徴、性質、及び様々な利点は、以下の詳細な説明及び添付の図面からより明らかになる。

実施形態に従う通信システムの略ブロック図の概略図である。実施形態に従う通信システムの略ブロック図の概略図である。実施形態に従うデコーダの略ブロック図の概略図である。実施形態に従うエンコーダの略ブロック図の概略図である。実施形態に従う、ＡＲＣパラメータのシグナリングのためのオプションの概略図である。実施形態に従う、ＡＲＣパラメータのシグナリングのためのオプションの概略図である。実施形態に従う、ＡＲＣパラメータのシグナリングのためのオプションの概略図である。実施形態に従う、ＡＲＣパラメータのシグナリングのためのオプションの概略図である。実施形態に従う、ＡＲＣパラメータのシグナリングのためのオプションの概略図である。実施形態に従うシンタックステーブルの例の概略図である。実施形態に従うシンタックステーブルの例の概略図である。実施形態に従う、適応解像度変更によるスケーラビリティのための予測構造の例である。実施形態に従うシンタックステーブルの例である。実施形態に従う、アクセスユニットごとのＰＯＣサイクル及びアクセスユニットカウント値のパージング及びデコーディングの略ブロック図の概略図である。実施形態に従う、多層サブピクチャを含むビデオビットストリーム構造の概略図である。実施形態に従う、強化された解像度による選択されたサブピクチャの表示の概略図である。実施形態に従う、多層サブピクチャを含むビデオビットストリームのためのデコーディング及び表示プロセスのブロック図である。実施形態に従う、サブピクチャのエンハンスメントレイヤによる３６０度ビデオ表示の概略図である。実施形態に従う、サブピクチャ並びにその対応するレイヤ及びピクチャ予測構造のレイアウト情報の例である。実施形態に従う、局所領域の空間スケーラビリティモダリティを伴った、サブピクチャ並びにその対応するレイヤ及びピクチャ予測構造のレイアウト情報の例である。実施形態に従う、サブピクチャレイヤ情報のためのシンタックステーブルの例である。実施形態に従う、サブピクチャレイヤ情報のためのシンタックステーブルの例である。実施形態に従うサブピクチャレイアウト情報のためのＳＥＩメッセージのシンタックステーブルの例である。実施形態に従う、出力レイヤ及び各出力レイヤセットについてのプロファイル／ティア／レベル情報を示すシンタックステーブルの例である。実施形態に従う、各出力レイヤセットについて出力レイヤモードオンを示すシンタックステーブルの例である。実施形態に従う各出力レイヤセットについて各レイヤの目下のサブピクチャを示すシンタックステーブルの例である。ビデオパラメータセットローバイトシーケンスペイロード（Raw Byte Sequence Payload，ＲＢＳＰ）のシンタックステーブルの例である。出力レイヤセットモードで出力レイヤセットを示すシンタックステーブルの例である。シーケンスパラメータセット（ＳＰＳ）でコーディングされたビデオシーケンス内の参照ピクチャリサンプリング及び解像度変更を示すシンタックステーブルの例である。ＰＰＳでピクチャサイズを示すシンタックステーブルの例である。実施形態に従う、エンコードされたビデオビットストリームをデコードするプロセスの例のフローチャートである。実施形態に従う、エンコードされたビデオビットストリームをデコードするプロセスの例のフローチャートである。実施形態に従う、エンコードされたビデオビットストリームをデコードするプロセスの例のフローチャートである。実施形態に従うコンピュータシステムの概略図である。

図１は、本開示の実施形態に従う通信システム（１００）の略ブロック図を表す。システム（１００）は、ネットワーク（１５０）を介して相互接続されている少なくとも２つの端末（１１０、１２０）を含んでよい。データの一方向伝送については、第１端末（１１０）は、ネットワーク（１５０）を介した他の端末（１２０）への伝送のためにローカル位置でビデオデータをコーディングしてよい。第２端末（１２０）は、他の端末のエンコーディングされたビデオデータをネットワーク（１５０）から受信し、コーディングされたデータをデコードして、回復されたビデオデータを表示してよい。一方向データ伝送は、メディアサービングアプリケーションなどにおいて一般的であり得る。

図１は、例えば、ビデオ会議中に、現れ得るコーディングされたビデオの双方向伝送をサポートするよう設けられた端末（１３０、１４０）の第２対を表す。データの双方向伝送については、各端末（１３０、１４０）は、ネットワーク（１５０）を介した他の端末への伝送のために、ローカル位置で捕捉されたビデオデータをコーディングしてよい。各端末（１３０、１４０）はまた、他の端末によって送信されたコーディングされたビデオデータを受信してよく、コーディングされたデータをデコードしてよく、そして、回復されたビデオデータをローカルの表示デバイスで表示してよい。

図１では、端末（１１０～１４０）は、サーバ、パーソナルコンピュータ、及びスマートフォンとして表され得るが、本開示の原理は、そのように限定されなくてもよい。本開示の実施形態は、ラップトップコンピュータ、タブレットコンピュータ、メディアプレイヤー、及び／又は専用のビデオ会議装置で用途を見出す。ネットワーク（１５０）は、例えば、ワイヤライン及び／又はワイヤレス通信ネットワークを含む、コーディングされたビデオデータを端末（１１０～１４０）の間で伝達する任意数のネットワークを表す。通信ネットワーク（１５０）は、回路交換及び／又はパケット交換チャネルにおいてデータを交換してよい。代表的なネットワークには、電気通信網、ローカルエリアネットワーク、ワイドエリアネットワーク、及び／又はインターネットがある。本議論のために、ネットワーク（１５０）のアーキテクチャ及びトポロジは、以降で説明されない限りは本開示の動作に無関係であってよい。

図２は、開示されている対象の応用例として、ストリーミング環境におけるビデオエンコーダ及びデコーダの配置を表す。開示されている対象は、例えば、ビデオ会議と、デジタルＴＶと、ＣＤ、ＤＶＤ、メモリスティックなどを含むデジタル媒体上での圧縮されたビデオの記憶と、などを含む他のビデオ対応用途に同様に適用可能であることができる。

ストリーミングシステムは、ビデオソース（２０１）、例えば、圧縮されていないビデオサンプルを生成する、例えば、デジタルカメラを含むことができる捕捉サブシステム（２１３）を含んでよい。そのサンプルストリーム（２０２）は、エンコードされたビデオビットストリームと比較して高いデータボリューム強調するよう太線として表されており、カメラ（２０１）へ結合されたエンコーダ（２０３）によって処理され得る。エンコーダ（２０３）は、以下で更に詳細に記載されるように、開示されている対象の態様を可能にするか又は実装するためのハードウェア、ソフトウェア、又はそれらの組み合わせを含むことができる。エンコードされたビデオビットストリーム（２０４）は、サンプルストリームと比較して低いデータボリュームを強調するよう細線として表されており、将来の使用のためにストリーミングサーバ（２０５）に記憶され得る。１つ以上のストリーミングクライアント（２０６、２０８）は、エンコードされたビデオビットストリーム（２０４）のコピーを読み出すためにストリーミングサーバ（２０５）にアクセスすることができる。クライアント（２０６）は、ビデオデコーダを含むことができ、ビデオデコーダは、エンコードされたビデオビットストリーム（２０７）の入来するコピーをデコードし、ディスプレイ（２１２）又は他のレンダリングデバイス（図示せず。）でレンダリングされ得る送出ビデオサンプルストリーム（２１１）を生成する。いくつかのストリーミングシステムでは、ビデオビットストリーム（２０４、２０７、２０９）は、特定のビデオコーディング／圧縮規格に従ってエンコードされ得る。そのような規格の例には、ＩＴＵ－Ｔ推奨Ｈ．２６５がある。バーサタイル・ビデオ・コーディング（Versatile Video Coding）又はＶＶＣとして俗に知られているビデオコーディング規格が開発中である。開示されている対象は、ＶＶＣとの関連で使用されてもよい。

図３は、本開示の実施形態に従うビデオデコーダ（２１０）の機能ブロック図を表す。

受信器（３１０）は、デコーダ（２１０）によってデコードされるべき１つ以上のコーディングされたビデオシーケンスを、同じ又は他の実施形態で、一度に１つのコーディングされたビデオシーケンス、を受け取ってよい。各コーディングされたビデオシーケンスのデコーディングは、他のコーディングされたビデオシーケンスから独立している。コーディングされたビデオシーケンスは、チャネル（３１２）から受け取られてよく、チャネル（３１２）は、エンコードされたビデオデータを記憶するストレージデバイスへのハードウェア／ソフトウェアリンクであってよい。受信器（３１０）は、他のデータ、例えば、コーディングされたオーディオデータ及び／又は補助データストリームとともに、エンコードされたビデオデータを受け取ってもよく、それらは、それらの各々の使用エンティティ（図示せず。）へ転送されてよい。受信器（３１０）は、コーディングされたビデオシーケンスを他のデータから分離してよい。ネットワークジッタに対抗するために、バッファメモリ（３１５）が受信器（３１０）とエントロピデコーダ／パーサ（３２０）（以降「パーサ」）との間に結合されてもよい。受信器（３１０）が十分なバンド幅及び可制御性の記憶／転送デバイスから、又はアイソシンクロナス（isosynchronous）ネットワークからデータを受信しているときに、バッファ（３１５）は必要とされなくてもよく、あるいは、小さくてよい。インターネットなどのベストエフォートのパケットネットワークでの使用のために、バッファ（３１５）は必要とされる場合があり、比較的に大きくかつ適応サイズであることができる。

ビデオデコーダ（２１０）は、エントロピコーディングされたビデオシーケンスからシンボル（３２１）を再構成するためのパーサ（３２０）を含んでよい。それらのシンボルのカテゴリは、デコーダ（２１０）の動作を管理するために使用される情報と、潜在的に、図３で表されるように、デコーダの内部部分ではないがデコーダへ結合され得るディスプレイ（２１２）などのレンダリングデバイスを制御するための情報とを含む。レンダリングデバイスのための制御情報は、ＳＥＩ（Supplementary Enhancement Information）メッセージ又はＶＵＩ（Video Usability Information）パラメータセットフラグメント（図示せず。）の形をとってよい。パーサ（３２０）は、受け取られたコーディングされたビデオシーケンスをパース／エントロピデコードしてよい。コーディングされたビデオシーケンスのコーディングは、ビデオコーディング技術又は規格に従うことができ、可変長コーディング、ハフマンコーディング、文脈依存による又はよらない算術コーディング、などを含む、当業者によく知られている原理に従うことができる。パーサ（３２０）は、コーディングされたビデオシーケンスから、ビデオデコーダにおけるピクセルのサブグループのうちの少なくとも１つについてのサブグループパラメータの組を、そのグループに対応する少なくとも１つのパラメータに基づいて抽出してよい。サブグループは、グループ・オブ・ピクチャ（Groups of Pictures，ＧＯＰ）、ピクチャ、サブピクチャ、タイル、スライス、ブリック、マクロブロック、コーディングツリーユニット（Coding Tree Units，ＣＴＵ）、コーディングユニット（Coding Units，ＣＵ）、ブロック、変換ユニット（Transform Units，ＴＵ）、予測ユニット（Prediction Units，ＰＵ）、などを含むことができる。タイルは、ピクチャにおける特定のタイル列及び行内のＣＵ／ＣＴＵの長方形領域を示してよい。ブリックは、特定のタイル内のＣＵ／ＣＴＵ行の長方形領域を示してよい。スライスは、ＮＡＬユニットに含まれるピクチャの１つ以上のブリックを示してよい。サブピクチャは、ピクチャにおける１つ以上のスライスの長方形領域を示してよい。エントロピデコーダ／パーサはまた、変換係数などのコーディングされたビデオシーケンス情報から、量子化パラメータ値、動きベクトル、なども抽出してよい。

パーサ（３２０）は、シンボル（３２１）を生成するために、バッファ（３１５）から受け取られたビデオシーケンスに対してエントロピデコーディング／パージング動作を実行してよい。

シンボル（３２１）の再構成は、コーディングされたビデオピクチャ又はその部分（例えば、インター及びイントラピクチャ、インター及びイントラブロック）のタイプ及び他の因子に応じて多種多様なユニットを有することができる。どのユニットが含まれるか、及びそれらがどのように含まれるかは、コーディングされたビデオシーケンスからパーサ（３２０）によってパースされたサブグループ制御情報によって制御され得る。パーサ（３２０）と以下の複数のユニットとの間のそのようなサブグループ制御情報のフローは、明りょうさのために表されていない。

既に述べられた機能ブロックを超えて、デコーダ２１０は、概念的に、以下で説明される多数の機能ユニットに細分され得る。商業上の制約の下で動作する実際の実施では、それらのユニットの多くが互いに密に相互作用し、少なくとも部分的に互いに組み込まれ得る。しかし、開示されている対象を説明することを目的として、以下での機能ユニットへの概念的細分は適切である。

第１ユニットは、スケーラ及び／又は逆変換ユニット（３５１）である。スケーラ及び／又は逆変換ユニット（３５１）は、パーサ（３２０）からシンボル（３２１）として、量子化された変換係数とともに、使用するために変換するもの、ブロックサイズ、量子化係数、量子化スケーリングマトリクスなどを含む制御情報を受け取る。スケーラ及び／又は逆変換ユニット（３５１）は、アグリゲータ（３５５）へ入力することができるサンプル値を含むブロックを出力することができる。

いくつかの場合に、スケーラ及び／又は逆変換ユニット（３５１）の出力サンプルは、イントラコーディングされたブロック、すなわち、前に再構成されたピクチャからの予測情報を使用しておらず、現在のピクチャの前に再構成された部分からの予測情報を使用することができるブロック、に関係することができる。そのような予測情報は、イントラピクチャ予測ユニット（３５２）によって供給され得る。いくつかの場合に、イントラピクチャ予測ユニット（３５２）は、現在の（部分的に再構成された）ピクチャ（３５８）からフェッチされた周囲の既に再構成された情報を用いて、再構成中のブロックと同じサイズ及び形状のブロックを生成する。アグリゲータ（３５５）は、いくつかの場合に、サンプルごとに、イントラ予測ユニット（３５２）が生成した予測情報を、スケーラ及び／又は逆変換ユニット（３５１）によって供給される出力サンプル情報に加える。

他の場合では、スケーラ及び／又は逆変換ユニット（３５１）の出力サンプルは、インターコーディングされた、そして潜在的に動き補償されたブロックに関係することができる。そのような場合に、動き補償予測ユニット（３５３）は、予測のために使用されるサンプルをフェッチするよう参照ピクチャメモリ（３５７）にアクセスすることができる。フェッチされたサンプルを、ブロックに関係するシンボル（３２１）に従って、動き補償した後に、それらのサンプルは、出力サンプル情報を生成するために、アグリゲータ（３５５）によって、スケーラ及び／又は逆変換ユニットの出力（この場合に、残差サンプル又は残差信号と呼ばれる。）に加えられ得る。動き補償予測ユニットが予測サンプルをフェッチする参照ピクチャメモリ内のアドレスは、動きベクトルによって制御され得る。動きベクトルは、例えば、Ｘ、Ｙ及び参照ピクチャコンポーネントを有することができるシンボル（３２１）の形で動き補償予測ユニットが利用することができるものである。動き補償はまた、サブサンプルの正確な動きベクトルが使用されているときに参照ピクチャメモリからフェッチされるサンプル値の補間や、動きベクトル予測メカニズムなどを含むこともできる。

アグリゲータ（３５５）の出力サンプルは、ループフィルタユニット（３５６）において様々なループフィルタリング技術を受けることができる。ビデオ圧縮技術は、インループフィルタ技術を含むことができる。この技術は、コーディングされたビデオビットストリームに含まれており、パーサ（３２０）からのシンボル（３２１）としてループフィルタユニット（３５６）に利用可能にされたパラメータによって制御されるが、コーディングされたピクチャ又はコーディングされたビデオシーケンスの（デコーディング順序において）前の部分のデコーディング中に得られたメタ情報にも応答することができ、更には、前に構成されたループフィルタ処理されたサンプル値に応答することができる。

ループフィルタユニット（３５６）の出力は、レンダーデバイス（２１２）へ出力され、更には、将来のインターピクチャ予測における使用のために参照ピクチャメモリに記憶され得るサンプルストリームであることができる。

特定のコーディングされたピクチャは、完全に再構成されると、将来の予測のための参照ピクチャとして使用され得る。コーディングされたピクチャが完全に再構成され、コーディングされたピクチャが（例えば、パーサ（３２０）によって）参照ピクチャとして識別されると、現在の参照ピクチャ（３５８）が参照ピクチャメモリ（３５７）の部分になることができ、未使用の現在ピクチャメモリは、後続のコーディングされたピクチャの再構成を開始する前に再割り当てされ得る。

ビデオデコーダ（２１０）は、ＩＴＵ－ＴＲｅｃ．Ｈ．２６５などの規格で文書化されることがある所定のビデオ圧縮技術に従ってデコーディング動作を実行してよい。コーディングされたビデオシーケンスは、それが、ビデオ圧縮技術文書又は規格で、具体的にはその中のプロファイル文書で、定められているビデオ圧縮技術又は規格のシンタックスに従うという意味で、使用中のビデオ圧縮技術又は規格によって規定されたシンタックスに従い得る。また、コーディングされたビデオシーケンスの複雑さは、ビデオ圧縮技術又は規格のレベルによって定義された境界内にあることが、順守のために必要である。いくつかの場合に、レベルは、最大ピクチャサイズ、最大フレームレート、最大再構成サンプルレート（例えば、メガサンプル／秒で測定される。）、最大参照ピクチャサイズ、などを制限する。レベルによって設定された制限は、いくつかの場合に、仮想リファレンスデコーダ（Hypothetical Reference Decoder，ＨＲＤ）仕様及びコーディングされたビデオシーケンスにおいて通知されるＨＲＤバッファ管理のためのメタデータを通じて更に制限され得る。

実施形態において、受信器（３１０）は、エンコードされたビデオとともに、追加の（冗長な）データを受け取ってもよい。追加のデータは、コーディングされたビデオシーケンスの部分としても含まれてもよい。追加のデータは、ビデオデコーダ（２１０）によって、データを適切にデコードするために及び／又は原ビデオデータをより正確に再構成するために使用されてよい。追加のデータは、例えば、時間、空間、又はＳＮＲエンハンスメントレイヤ、冗長スライス、冗長ピクチャ、前方誤り訂正符号、などの形をとることができる。

図４は、本開示の実施形態に従うビデオエンコーダ（２０３）の機能ブロック図であってよい。

エンコーダ（２０３）は、エンコーダ（２０３）によってコーディングされるべきビデオ画像を捕捉し得るビデオソース（２０１）（エンコーダの部分ではない。）からビデオサンプルを受け取ってよい。

ビデオソース（２０１）は、任意の適切なビットデプス（例えば、８ビット、１０ビット、１２ビットなど）、任意の色空間（例えば、ＢＴ．６０１ＹＣｒＣＢ、ＲＧＢなど）、及び任意の適切なサンプリング構造（例えば、ＹＣｒＣｂ４：２：０、ＹＣｒＣｂ４：４：４）であることができるデジタルビデオサンプルストリームの形で、エンコーダ（２０３）によってコーディングされるべきソースビデオシーケンスを供給してよい。メディアサービングシステムでは、ビデオソース（２０１）は、前に準備されたビデオを記憶しているストレージデバイスであってもよい。ビデオ会議システムでは、ビデオソース（２０１）は、ローカル画像情報をビデオシーケンスとして捕捉するカメラであってもよい。ビデオデータは、順に見られる場合に動きを授ける複数の個別ピクチャとして供給されてもよい。ピクチャ自体は、ピクセルの空間アレイとして編成されてよく、各ピクセルは、使用中のサンプリング構造、色空間、などに依存する１つ以上のサンプルを有することができる。当業者であれば、ピクセルとサンプルとの間の関係を容易に理解することができる。本明細書は、以下、サンプルに焦点を当てる。

実施形態に従って、エンコーダ（２０３）は、実時間において又は用途によって必要とされる任意の他の時間制約の下で、ソースビデオシーケンスのピクチャを、コーディングされたビデオシーケンス（４４３）へとコーディング及び圧縮してよい。適切なコーディング速度を強いることは、コントローラ（４５０）の一機能である。コントローラはまた、以下で記載されるような他の機能ユニットを制御してもよく、それらのユニットへ機能的に結合されてもよい。結合は明りょうさのために表されていない。コントローラによってセットされるパラメータには、レート制御に関連したパラメータ（ピクチャスキップ、量子化器、レートひずみ最適化技術のラムダ値、など）、ピクチャサイズ、グループ・オブ・ピクチャ（ＧＯＰ）レイアウト、最大動きベクトル探索範囲、などが含まれ得る。当業者は、コントローラ（４５０）の他の機能を、それらが特定のシステム設計のために最適化されたビデオエンコーダ（２０３）に関係し得るということで、容易に識別することができる。

いくつかのビデオエンコーダは、当業者が「コーディングループ」として容易に実現するものにおいて動作する。過度に単純化された記載として、コーディングループは、エンコーダ（４３０）（以降「ソースコーダ」）のエンコーディング部分（コーディングされるべき入力ピクチャと、参照ピクチャとに基づいて、シンボルを生成することに関与する。）と、（シンボルとコーディングされたビデオビットストリームとの間の如何なる圧縮も、開示されている対象に置いて考えられているビデオ圧縮技術で可逆であるときに）（遠隔の）デコーダも生成することになるサンプルデータを生成するようシンボルを再構成する、エンコーダ（２０３）に埋め込まれた（ローカルの）デコーダ（４３３）とから成ることができる。その再構成されたサンプルストリームは、参照ピクチャメモリ（４３４）へ入力される。シンボルストリームのデコーディングは、デコーダの場所（ローカル又は遠隔）に依存しないビットパーフェクト（bit-exact）な結果をもたらすので、参照ピクチャメモリのコンテンツも、ローカルのエンコーダと遠隔のエンコーダとの間でビットパーフェクトである。すなわち、エンコーダの予測部分は、デコーダがデコーディング中に予測を使用するときに“見る”ことになるのとまさに同じサンプル値を参照ピクチャサンプルとして“見る”。参照ピクチャのシンクロニシティ（及び、例えば、チャネルエラーのために、シンクロニシティが維持され得ない場合に、結果として生じるドリフト）のこの基本原理は、当業者によく知られている。

“ローカル”のデコーダ（４３３）の動作は、図３とともに既に詳細に上述されている、“遠隔”のデコーダ（２１０）と同じであることができる。簡単に図４も参照すると、しかしながら、シンボルが利用可能であり、エントロピコーダ（４４５）及びパーサ（３２０）によるコーディングされたビデオシーケンスへのシンボルのエンコーディング／デコーディングが可逆であることができるので、チャネル（３１２）、受信器（３１０）、バッファ（３１５）、及びパーサ（３２０）を含むデコーダ（２１０）のエントロピデコーディング部分は、ローカルのデコーダ（４３３）において完全には実装されなくてもよい。

この時点で行われ得る観察は、デコーダに存在するパージング／エントロピデコーディングを除く如何なるデコーダ技術も必然的に、対応するエンコーダにおいて実質的に同じ機能形態で存在する必要があることである。この理由により、開示されている対象は、デコーダの動作に焦点を当てる。エンコーダ技術の説明は、それらが、包括的に記載されているデコーダ技術の逆であるということで、省略可能である。特定の範囲においてのみ、より詳細な説明が必要とされ、以下で与えられている。

その動作の部分として、ソースコーダ（４３０）は、動き補償された予測コーディングを実行してよい。これは、「参照ピクチャ」として指定されたビデオシーケンスからの１つ以上の前にコーディングされたフレームを参照して予測的に入力ピクチャをコーディングする。このようにして、コーディングエンジン（４３２）は、入力ピクチャに対する予測参照として選択され得る参照ピクチャのピクセルブロックと入力ピクチャのピクセルブロックとの間の差をコーディングする。

ローカルのビデオデコーダ（４３３）は、ソースコーダ（４３０）によって生成されたシンボルに基づいて、参照フレームとして指定され得るフレームのコーディングされたビデオデータをデコードしてよい。コーディングエンジン（４３２）の動作は、有利なことに、不可逆プロセスであってよい。コーディングされたビデオデータがビデオデコーダ（図４には図示せず。）でデコードされ得るとき、再構成されたビデオシーケンスは、通常は、いくらかのエラーを伴ったソースビデオシーケンスの複製であり得る。ローカルのビデオデコーダ（４３３）は、参照フレームに対してビデオデコーダによって実行され得るデコーディングプロセスを再現し、再構成された参照フレームを参照ピクチャキャッシュ（４３４）に格納されるようにしてよい。このように、エンコーダ（２０３）は、（伝送エラーなしで）遠端のビデオデコーダによって取得されることになる再構成された参照フレームと共通の内容を有している再構成された参照フレームのコピーをローカルで記憶し得る。

予測器（４３５）は、コーディングエンジン（４３２）の予測探索を実行してよい。すなわち、新しいピクチャがコーディングされるために、予測器（４３５）は、その新しいピクチャのための適切な予測基準となり得る参照ピクチャ動きベクトル、ブロック形状、などの特定のメタデータ又は（候補参照ピクセルブロックとしての）サンプルデータを参照ピクチャメモリ（４３４）から探してよい。予測器（４３５）は、適切な予測基準を見つけるためにサンプルブロック・バイ・ピクセルブロックベース（sample block-by-pixel block basis）で動作してよい。いくつかの場合に、予測器（４３５）によって取得された探索結果によって決定されるように、入力ピクチャは、参照ピクチャメモリ（４３４）に記憶されている複数の参照ピクチャから引き出された予測基準を有してよい。

コントローラ（４５０）は、例えば、ビデオデータをエンコードするために使用されるパラメータ及びサブグループパラメータの設定を含め、ビデオコーダ（４３０）のコーディング動作を管理してもよい。

上記の全ての機能ユニットの出力は、エントロピコーダ（４４５）においてエントロピコーディングを受けてよい。エントロピコーダは、例えば、ハフマンコーディング、可変長コーディング、算術コーディングなどとして当業者に知られている技術に従ってシンボルを可逆圧縮することによって、様々な機能ユニットによって生成されたシンボルを、コーディングされたビデオシーケンスへと変換する。

送信器（４４０）は、エントロピコーダ（４４５）によって生成されたコーディングされたビデオシーケンスを、通信チャネル（４６０）を介した伝送のために準備するようにバッファリングしてよい。通信チャネル（４６０）は、エンコードされたビデオデータを記憶するストレージデバイスへのハードウェア／ソフトウェアリンクであってよい。送信器（４４０）は、ビデオコーダ（４３０）からのコーディングされたビデオデータを、送信されるべき他のデータ、例えば、コーディングされたオーディオデータ及び／又は補助的なデータストリーム（ソースは図示せず）とマージしてもよい。

コントローラ（４５０）は、エンコーダ（２０３）の動作を管理してもよい。コーディング中、コントローラ（４５０）は、各々のピクチャに適用され得るコーディング技術に影響を及ぼす可能性がある特定のコーディングされたピクチャタイプを各コーディングされたピクチャに割り当ててよい。例えば、ピクチャはしばしば、次のフレームタイプのうちの１つとして割り当てられてよい。

イントラピクチャ（Intra Picture）（Ｉピクチャ）は、予測のソースとしてシーケンス内の如何なる他のピクチャも使用せずにコーディング及びデコードされ得るピクチャであってよい。いくつかのビデオコーデックは、例えば、独立したデコーダリフレッシュ（Independent Decoder Refresh，ＩＤＲ）ピクチャを含む種々のタイプのイントラピクチャを許容する。当業者であれば、Ｉピクチャのそのような変形並びにそれらの各々の応用及び特徴を知っている。

予測ピクチャ（Predictive Picture）（Ｐピクチャ）は、各ブロックのサンプル値を予測するために多くても１つの動きベクトル及び参照インデックスを用いてイントラ予測又はインター予測によりコーディング及びデコードされ得るピクチャであってよい。

双方向予測ピクチャ（Bi-directionally Predictive Picture）（Ｂピクチャ）は、各ブロックのサンプル値を予測するために多くても２つの動きベクトル及び参照インデックスを用いてイントラ予測又はインター予測によりコーディング及びデコードされ得るピクチャであってよい。同様に、多重予測ピクチャ（multiple-predictive picture(s)）は、単一のブロックの再構成のために２つよりも多い参照ピクチャ及び関連するメタデータを使用することができる。

ソースピクチャは、一般に、複数のサンプルブロック（例えば、夫々、４×４、８×８、４×８、又は１６×１６のサンプルのブロック）に空間的に細分され、ブロックごとにコーディングされてよい。ブロックは、ブロックの各々のピクチャに適用されているコーディング割り当てによって決定される他の（既にコーディングされた）ブロックを参照して予測的にコーディングされてよい。例えば、Ｉピクチャのブロックは、非予測的にコーディングされてよく、あるいは、それらは、同じピクチャの既にコーディングされたブロックを参照して予測的にコーディングされてもよい（空間予測又はイントラ予測）。Ｐピクチャのピクセルブロックは、非予測的に、あるいは、１つの前にコーディングされた参照ピクチャを参照して空間予測により又は時間予測により、コーディングされてよい。Ｂピクチャのブロックは、非予測的に、あるいは、１つ又は２つの前にコーディングされた参照ピクチャを参照して空間予測により又は時間予測により、コーディングされてよい。

ビデオコーダ（２０３）は、ＩＴＵ－ＴＲｅｃ．Ｈ．２６５のような所定のビデオコーディング技術又は規格に従ってコーディング動作を実行してよい。その動作中に、ビデオコーダ（２０３）は、入力ビデオシーケンスにおける時間及び空間冗長性を利用する予測コーディング動作を含む様々な圧縮動作を実行してよい。従って、コーディングされたビデオデータは、使用されているビデオコーディング技術又は規格によって定められているシンタックスに従い得る。

実施形態において、送信器（４４０）は、エンコードされたビデオとともに追加のデータを送信してもよい。ビデオコーダ（４３０）は、コーディングされたビデオシーケンスの部分としてそのようなデータを含めてよい。追加のデータは、時間／空間／ＳＮＲエンハンスメントレイヤ、冗長ピクチャ及びスライスなどの他の形式の冗長データ、ＳＥＩメッセージ、ＶＵＩパラメータセットフラグメント、などを有してよい。

近年、単一のビデオピクチャへの複数の意味的に独立したピクチャ部分の圧縮領域アグリゲーション又は抽出は、注目を集めている。特に、例えば、３６０度のコーディング又は特定の監視アプリケーションと関連して、複数の意味的に独立したソースピクチャ（例えば、立法投影３６０度シーンの６立方面、又は他カメラ監視セットアップの場合における個別的なカメラ入力）は、所与の時点での異なるシーンごとのアクティビティに対処するよう別個の適応解像度設定を必要とすることがある。すなわち、エンコーダは、所与の時点で、３６０度全体又は監視シーンを構成する異なる意味的に独立したピクチャのために異なるリサンプリング係数を使用することを選択してよい。単一のピクチャに結合される場合に、次いで、参照ピクチャリサンプリングが実行されることが必要であり、適応解像度コーディングシグナリングは、コーディングされたピクチャの部分のために利用可能である。

以下、本明細書の残りで参照されることになる２、３の項目が紹介される。

サブピクチャは、いくつかの場合に、意味的にグループ分けされており、変更された解像度で独立してコーディングされ得るサンプル、ブロック、マクロブロック、コーディングユニット、又は同様のエンティティの長方形配置を指す。１つ以上のサブピクチャは、ピクチャを形成してよい。１つ以上のコーディングされたサブピクチャは、コーディングされたピクチャを形成してよい。１つ以上のサブピクチャは、ピクチャにまとめられてもよく、１つ以上のサブピクチャは、ピクチャから抽出されてもよい。特定の環境で、１つ以上のコーディングされたサブピクチャは、同じレベルにトランスコーディングせずに圧縮領域で、コーディングされたピクチャにまとめられてもよく、同じ又は他の場合には、１つ以上のコーディングされたサブピクチャは、圧縮領域で、コーディングされたサブピクチャから抽出されてもよい。

適応解像度変更（Adaptive Resolution Change，ＡＲＣ）は、コーディングされたビデオシーケンス内のピクチャ又はサブピクチャの解像度の変化を、例えば、参照ピクチャリサンプリングによって、可能にするメカニズムを指し得る。ＡＲＣパラメータは、以降、適応解像度変更を実行するために必要な制御情報を指し、例えば、フィルタパラメータ、スケーリング係数、出力及び／又は参照ピクチャの解像度、様々な制御フラグ、などを含んでよい。

実施形態において、コーディング及びデコーディングは、単一の、意味的に独立したコーディングされたビデオピクチャに対して実行されてよい。独立したＡＲＣパラメータによる複数のサブピクチャのコーディング／デコーディングの意味合い及びその暗黙的な更なる複雑性について記載する前に、ＡＲＣパラメータのシグナリングについてのオプションが説明されるべきである。

図５Ａ～５Ｅを参照すると、ＡＲＣパラメータのシグナリングについてのいくつかの実施形態が示されている。実施形態の夫々により述べられているように、それらは、コーディング効率、複雑性、及びアーキテクチャ視点から特定の利点及び特定の欠点を有し得る。ビデオコーディング規格又は技術は、ＡＲＣパラメータのシグナリングのために、これらの実施形態、又は関連技術から知られているオプション、のうちの１つ以上を選択してよい。実施形態は、相互排他的でなくてよく、考えられる限りは、アプリケーションニーズ、関連する標準技術、又はエンコーダの選択に基づいて交換されてもよい。

ＡＲＣパラメータの分類には、
Ｘ及びＹ次元で別々であるか又は結合されているアップサンプル及び／又はダウンサンプル係数、
所与の数のピクチャについて一定速度のズームイン／アウトを示す時間次元を追加されたアップサンプル及び／又はダウンサンプル係数
が含まれてよい。

上記の２つのうちのどちらも、その係数を含む表を指し示し得る１つ以上の、おそらくは短いシンタックス要素のコーディングを伴ってよい。

解像度は、組み合わせて又は別々に、入力ピクチャ、出力ピクチャ、参照ピクチャ、コーディングされたピクチャのサンプル、ブロック、マクロブロック、ＣＵ、又は任意の他の適切な粒度の単位で、Ｘ又はＹ次元での解像度を指してよい。１つよりも多い解像度がある場合に（例えば、入力ピクチャについて１つと参照ピクチャについて１つ）、特定の場合に、ひと組の値が他の組の値から推測されてもよい。解像度は、例えば、フラグの使用によって、ゲーティング（gated）されてもよい。より詳細な例については、以下を参照されたい。

「ワーピング」（Warping）座標は、Ｈ．２６３ＡｎｎｅｘＰで使用されるものと同種であって、先と同じく、上述された適切な粒度にあってよい。Ｈ．２６３ＡｎｎｅｘＰは、そのようなワーピング座標をコーディングするための１つの効率的な方法を定義するが、他の、潜在的により効率的な方法も、考えられる限りは、考案されてよい。例えば、ＡｎｎｅｘＰのワーピング座標の可変長リバーシブルな「ハフマン」スタイルコーディングは、適切な長さのバイナリコーディングで置換されてもよく、このとき、バイナリコードワードの長さは、例えば、最大ピクチャサイズから導出されて、場合により、最大ピクチャサイズの境界の外での「ワーピング」を可能にするために、特定の係数を乗じられかつ特定の値でオフセットされてもよい。

アップサンプル及び／又はダウンサンプルフィルタパラメータ。実施形態において、アップサンプリング及び／又はダウンサンプリングのための単一のフィルタしか存在しなくてもよい。しかし、実施形態において、フィルタ設計における更なる柔軟性を可能にすることが望ましいことがあり、それは、フィルタパラメータのシグナリングを必要とし得る。そのようなパラメータは、とり得るフィルタ設計のリストにおいてインデックスにより選択されてよく、フィルタは、（例えば、適切なエントロピコーディング技術を用いてフィルタ係数のリストを通じて）完全に指定されてもよく、フィルタは、上記のメカニズムのいずれかなどに従ってシグナリングされるアップサンプル及び／又はダウンサンプル比により暗黙的に選択されてもよい。

以降、説明は、コードワードにより示される有限なアップサンプル及び／又はダウンサンプル係数の組（同じ係数がＸ及びＹの両方の次元で使用される。）のコーディングを前提とする。そのコードワードは、例えば、Ｈ．２６４及びＨ．２６５などのビデオコーディング規格で特定のシンタックス要素に共通なＥｘｔ－Ｇｏｌｏｍｂコードを使用することによって、可変長コーディングされてよい。アップサンプル及び／又はダウンサンプル係数への値の１つの適切なマッピングは、例えば、以下の表１に従うことができる。

多くの類似したマッピングが、ビデオ圧縮技術又は規格で利用可能なアップ及びダウンスケールメカニズムの適用のニーズ及び能力に従って考案され得た。表は、より多くの値に拡張されてもよい。値はまた、Ｅｘｔ－Ｇｏｌｏｍｂコード以外のエントロピコーディングメカニズムによって、例えば、バイナリコーディングを用いて、表されてもよい。それは、リサンプリング係数が、例えば、ＭＡＮＥによって、ビデオ処理エンジン（第１に、エンコーダ及びデコーダ）自体の外で重要である場合に、特定の利点を有し得る。解像度変更が不要である状況については、短い（例えば、上記の表では、単一ビットのみ）Ｅｘｔ－Ｇｏｌｏｍｂコードが選択可能であることが留意されるべきである。それは、最も一般的な場合のためにバイナリコードを使用することよりもコーディング効率が優れている可能性がある。

表中のエントリの数及びそれらのセマンティクスは、完全に又は部分的に設定可能であってよい。例えば、表の基本概要は、シーケンス又はデコーダパラメータセットなどの「ハイ」パラメータセットで運ばれてよい。実施形態において、１つ以上のそのような表は、ビデオコーディング技術又は規格で定義されてもよく、例えば、デコーダ又はシーケンスパラメータセットにより選択されてもよい。

以下では、上述されたようにコーディングされているアップサンプル及び／又はダウンサンプル係数（ＡＲＣ情報）がビデオコーディング技術又は標準シンタックスにどのように含まれ得るかが記載される。同様の考えは、アップサンプル及び／又はダウンサンプルフィルタを制御する１つ又は数個のコードワードに当てはまる。比較的大量のデータがフィルタ又は他のデータ構造のために必要とされ得る場合に関する説明については以下を参照されたい。

図５Ａに示されるように、Ｈ．２６３ＡｎｎｅｘＰは、４つのワーピング座標の形でＡＲＣ情報（５０２）をピクチャヘッダ（５０１）内に、具体的には、Ｈ．２６３ＰＬＵＳＰＴＹＰＥ（５０３）ヘッダ拡張に含める。これは、（ａ）利用可能なピクチャヘッダが有り、かつ、（ｂ）ＡＲＣ情報の頻繁な変化が期待される、場合に、理にかなった設計選択であることができる。しかし、Ｈ．２６３スタイルシグナリングを使用する場合のオーバーヘッドは極めて高くなる可能性があり、スケーリング係数は、ピクチャヘッダが過渡的な性質を有し得るので、ピクチャ境界に付随しないことがある。

図５Ｂに示されるように、ＪＶＣＥＴ－Ｍ１３５－ｖ１は、シーケンスパラメータセット（５０７）の中に位置している目標解像度を含む表（５０６）をインデックス化する、ピクチャパラメータセット（５０４）に位置しているＡＲＣ参照情報（５０５）（インデックス）を含む。シーケンスパラメータセット（５０７）における表（５０６）でのとり得る解像度の配置は、著者による口頭の声明によれば、能力交換（capability exchange）中に相互運用ネゴシエーションポイント（interoperability negotiation point）としてＳＰＳ（５０７）を使用することによって正当化され得る。解像度は、適切なピクチャパラメータセット（５０４）を参照することによってピクチャごとに表（５０６）の値によってセットされた限界内で変化することができる。

図５Ｅ～５Ｅを参照すると、次の実施形態は、ＡＲＣ情報をビデオビットストリームで運ぶために存在してよい。これらのオプションの夫々は、上記の実施形態に対して特定の利点を有する。実施形態は、同時に、同じビデオコーディング技術又は規格において存在してもよい。

実施形態、例えば、図５Ｃに示される実施形態において、リサンプリング（ズーム）係数などのＡＲＣ情報（５０９）は、スライスヘッダ、ＧＯＢヘッダ、タイルヘッダ、又はタイルグループヘッダに存在してよい。図５Ｃは、タイルグループヘッダ（５０８）が使用される実施形態を表す。これは、例えば、上述されたような、数ビットの単一の可変長ｕｅ（ｖ）又は固定長コードワードのように、ＡＲＣ情報が小さい場合に、適切であることができる。タイルグループヘッダで直接にＡＲＣ情報を有することは、ＡＲＣ情報が、例えば、ピクチャ全体ではなく、そのタイルグループによって表されるサブピクチャに適用可能であり得るという付加的な利点を有している。以下も参照されたい。更には、たとえビデオ圧縮技術又は規格が（例えば、タイルグループに基づいた適応的な解像度変化とは対照的に）ピクチャ全体にのみ適応可能な解像度変化を企図するとしても、ＡＲＣ情報をタイルグループヘッダに、それをＨ２６３スタイルのピクチャヘッダに置くことにより置くことは、誤り耐性の観点から特定の利点を有する。

実施形態、例えば、図５Ｄに示される実施形態において、ＡＲＣ情報（５１２）自体が、例えば、ピクチャパラメータセット、ヘッダパラメータセット、タイルパラメータセット、適応パラメータセット、などのような適切なパラメータセットに存在してもよい。図５Ｄは、適応パラメータセット（５１１）が使用される実施形態を表す。そのパラメータセットの範囲は、有利なことに、ピクチャよりも大きくならず、例えば、タイルグループであることができる。ＡＲＣ情報の使用は、関連するパラメータセットの活性化を通じて潜在してもよい。例えば、ビデオコーディング技術又は規格がピクチャベースのＡＲＣのみを企図する場合に、ピクチャパラメータセット又は同等物が適切であり得る。

実施形態、例えば、図５Ｅに示される実施形態において、ＡＲＣ参照情報（５１３）は、タイルグループヘッダ（５１４）又は類似したデータ構造に存在してもよい。その参照情報（５１３）は、単一のピクチャを越える範囲でパラメータセット（５１６）において利用可能なＡＲＣ情報（５１５）のサブセット、例えば、シーケンスパラメータセット又はデコーダパラメータセットを参照することができる。

図６Ａに示されるように、ピクチャの（場合により長方形の）部分に適用可能なヘッダの例となるシンタックス構造としてのタイルグループヘッダ（６０１）は、可変長のＥｘｐ－Ｇｏｌｏｍｂコーディングされたシンタックス要素ｄｅｃ＿ｐｉｃ＿ｓｉｚｅ＿ｉｄｘ（６０２）（太字で表示）を条件付きで含むことができる。タイルグループヘッダにおけるこのシンタックス要素の存在は、適応解像度（６０３）の使用時にゲーティングされ得る。ここで、フラグの値は太字で表されておらず、これは、フラグが、シンタックスダイアグラムで発生する時点でビットストリームに存在することを意味する。適応解像度がこのピクチャ又はその部分に対して使用中であるか否かは、ビットストリーム内又は外の如何なる高位シンタックス構造でもシグナリングされ得る。示されている例では、適応解像度は、以下で説明されるようにシーケンスパラメータセットでシグナリングされる。

図６Ｂを参照すると、シーケンスパラメータセット（６１０）の抜粋も示されている。示されている最初のシンタックス要素は、ａｄａｐｔｉｖｅ＿ｐｉｃ＿ｒｅｓｏｌｕｔｉｏｎ＿ｃｈａｎｇｅ＿ｆｌａｇ（６１１）である。真である場合に、そのフラグは、適応解像度の使用を示すことができ、翻って、特定の制御情報を必要とし得る。例において、そのような制御情報は、パラメータセット（６１２）及びタイルグループヘッダ（６００）においてｉｆ（）文に基づくフラグの値に基づいて条件付きで存在する。

適応解像度が使用中である場合に、この例では、サンプル（６１３）のユニットで出力解像度がコーディングされる。数６１３は、ｏｕｔｐｕｔ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ及びｏｕｔｐｕｔ＿ｐｉｃ＿ｈｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓの両方を参照する。これらは一緒に、出力ピクチャの解像度を定義することができる。ビデオコーディング技術又は規格の他の場所で、どちらかの値に対する特定の制限が定義され得る。例えば、レベル定義は、それら２つのシンタックス要素の値の積であることができる総出力サンプル数を制限してよい。また、特定のビデオコーディング技術又は規格、あるいは、例えば、システム規格などの外部技術又は規格は、番号付け範囲（例えば、一方又は両方の次元が２の累乗で割り切れるべきである）、又はアスペクト比（例えば、幅及び高さは４：３又は１６：９などの関係になければならない）を制限してもよい。そのような制限は、ハードウェア実装を容易にするために、又は他の理由のために、導入されてもよく、当該技術でよく知られている。

特定のアプリケーションで、エンコーダは、サイズを出力ピクチャサイズであると暗黙的に想定するのではなく、特定のピクチャサイズを使用するようにデコーダに指示することが賢明であることができる。この例では、シンタックス要素ｒｅｆｅｒｅｎｃｅ＿ｐｉｃ＿ｓｉｚｅ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ（６１４）は、参照ピクチャ次元（６１５）の条件付きの存在をゲーティングする（先と同じく、数は幅及び高さの両方を参照する）。

最後に、とり得るデコーディングピクチャ幅及び高さの表が示されている。そのような表は、例えば、表指示（ｎｕｍ＿ｄｅｃ＿ｐｉｃ＿ｓｉｚｅ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ＿ｍｉｎｕｓ１）（６１６）によって、表現され得る。「ｍｉｎｕｓ１」は、そのシンタックス要素の値の解釈（interpretation）を指すことができる。例えば、シンタックス要素のコーディングされた値が０である場合に、１つの表エントリが存在する。コーディングされた値が５である場合に、６つの表エントリが存在する。表の各“行”ごとに、デコードされたピクチャ幅及び高さが、次いで、シンタックス（６１７）に含まれる。

表されている表エントリ（６１７）は、タイルグループヘッダにおけるシンタックス要素ｄｅｃ＿ｐｉｃ＿ｓｉｚｅ＿ｉｄｘ（６０２）を用いてインデックスを付され得る。それによって、タイルグループごとに異なったデコーディングサイズ、実際にはズーム係数が可能となる。

特定のビデオコーディング技術又は規格、例えば、ＶＰ９は、空間スケーラビリティを可能にするために、時間スケーラビリティとともに特定の形態の参照ピクチャリサンプリング（開示されている対象とは全く別なふうにシグナリングされる）を実装することによって空間スケーラビリティをサポートする。特に、特定の参照ピクチャは、空間エンハンスメントレイヤのベースを形成するよう、ＡＲＣスタイル技術を用いて、より高い解像度へアップサンプリングされてもよい。それらのアップサンプリングされたピクチャは、詳細を追加するために、高い解像度で通常の予測メカニズムを使用して精緻化され得る。

ここで説明されている実施形態は、そのような環境で使用され得る。特定の場合に、同じ又は他の実施形態において、ＮＡＬユニットヘッダ、例えば、一時ＩＤ（Temporal ID）フィールドにおける値は、時間レイヤのみならず空間レイヤも示すために使用され得る。そうすることは、特定のシステム設計にとって特定の利点を有し得る。例えば、ＮＡＬユニットヘッダの一時ＩＤ値に基づいて時間レイヤ選択的転送のために生成及び最適化された既存の選択的転送ユニット（Selected Forwarding Units，ＳＦＵ）は、スケーラブル環境のために変更無しで使用可能である。それを可能にするために、コーディングされたピクチャと時間レイヤとの間のマッピングがＮＡＬユニットヘッダにおいて一時ＩＤフィールドによって示される必要がある。

いくつかのビデオコーディング技術で、アクセスユニット（Access Unit，ＡＵ）は、所与の時点で捕捉されて各々のピクチャ、スライス、タイル、及び／又はＮＡＬユニットビットストリーム内に構成されたコーディングされたピクチャ、スライス、タイル、ＮＡＬユニットなどを指すことができる。そのような時点は、合成時間（composition time）であることができる。

ＨＥＶＣ、及び特定の他のビデオコーディング技術では、ピクチャ・オーダー・カウント（Picture Order Count，ＰＯＣ）値が、デコーディングピクチャバッファ（Decoded Picture Buffer，ＤＰＢ）に格納された複数の参照ピクチャの中から選択された参照ピクチャを示すために使用され得る。アクセスユニット（ＡＵ）が１つ以上のピクチャ、スライス、又はタイルを含む場合に、同じＡＵに属する各ピクチャ、スライス、又はタイルは、同じＰＯＣ値を運んでよく、ＰＯＣ値から、それらが同じ合成時間のコンテンツから生成されたことが導出され得る。すなわち、２つのピクチャ／スライス／タイルが同じ所与のＰＯＣ値を運ぶシナリオにおいて、その２つのピクチャ／スライス／タイルは同じＡＵに属しかつ同じ合成時間を有していることが決定され得る。対照的に、異なるＰＯＣ値を有する２つのピクチャ／タイル／スライスは、それらのピクチャ／スライス／タイルが異なるＡＵに属しかつ異なる合成時間を有していることを示すことができる。

実施形態において、この堅固な関係は、アクセスユニットが異なるＰＯＣ値を有するピクチャ、スライス、又はタイルを含むことができる点で緩和され得る。ＡＵ内の異なるＰＯＣ値を許すことによって、ＰＯＣ値を使用して、同じ提示時間（presentation time）を有する潜在的に独立してデコード可能なピクチャ／スライス／タイルを識別することが可能になる。それは、翻って、以下で更に詳細に記載されるように、参照ピクチャ選択シグナリング、例えば、参照ピクチャセットシグナリング又は参照ピクチャリストシグナリング、の変化無しで、複数のスケーラブルレイヤのサポートを可能にすることができる。

しかし、ＰＯＣ値のみから、異なるＰＯＣ値を有する他のピクチャ／スライス／タイルに対して、ピクチャ／スライス／タイルが属するＡＵを識別することができることが、依然として望ましい。これは、以下で記載されるように、達成され得る。

実施形態において、アクセスユニットカウント（Access Unit Count，ＡＵＣ）は、ＮＡＬユニットヘッダ、スライスヘッダ、タイルグループヘッダ、ＳＥＩメッセージ、パラメータセット又はＡＵデリミタ（delimiter）などの高位シンタックス構造でシグナリングされてよい。ＡＵＣの値は、どのＮＡＬユニット、ピクチャ、スライス、又はタイルが所与のＡＵに属するかを識別するために使用されてよい。ＡＵＣの値は、個別の合成時間インスタンスに対応していてよい。ＡＵＣ値は、ＰＯＣ値の倍数に等しくなる。整数値でＰＯＣ値を割ることによって、ＡＵＣ値は計算され得る。特定の場合に、割り算は、デコーダ実装に一定の負担をかける可能性がある。そのような場合に、ＡＵＣ値の番号付け空間における小さな制限は、シフト演算による割り算の置換を可能にし得る。例えば、ＡＵＣ値は、ＰＯＣ値範囲の最上位ビット（ＭＳＢ）値に等しくなる。

実施形態において、ＡＵごとのＰＯＣサイクル（ｐｏｃ＿ｃｙｃｌｅ＿ａｕ）の値は、ＮＡＬユニットヘッダ、スライスヘッダ、タイルグループヘッダ、ＳＥＩメッセージ、パラメータセット又はＡＵデリミタなどの高位シンタックス構造でシグナリングされてよい。ｐｏｃ＿ｃｙｃｌｅ＿ａｕは、多数の異なる連続したＰＯＣ値が同じＡＵとどのように関連付けられ得るかを示してよい。例えば、ｐｏｃ＿ｃｙｃｌｅ＿ａｕの値が４に等しい場合に、０以上３以下に等しいＰＯＣ値を有するピクチャ、スライス、又はタイルは、０に等しいＡＵＣ値を有するＡＵと関連付けられてよく、４以上７以下に等しいＰＯＣ値を有するピクチャ、スライス、又はタイルは、１に等しいＡＵＣ値を有するＡＵと関連付けられてよい。従って、ＡＵＣの値は、ｐｏｃ＿ｃｙｃｌｅ＿ａｕでＰＯＣ値を割ることによって推測され得る。

実施形態において、ｐｏｃ＿ｃｙｃｌｅ＿ａｕの値は、コーディングされたビデオシーケンスにおける空間又はＳＮＲレイヤの数を識別する、例えば、ビデオパラメータセット（ＶＰＳ）に位置している情報から、導出されてもよい。そのような可能な関係の例は、以下で簡単に説明される。上述された導出はＶＰＳで数ビットを節約し得るので、コーディング効率を改善し得る一方で、いくつかの実施形態で、ｐｏｃ＿ｃｙｃｌｅ＿ａｕは、ピクチャなどのビットストリームの所与の小さな部分についてｐｏｃ＿ｃｙｃｌｅ＿ａｕを最小化することが可能であるために、階層的にビデオパラメータセットの下にある適切な高位シンタックス構造で明示的にコーディングされてもよい。この最適化は、ＰＯＣ値、及び／又はＰＯＣを間接的に参照するシンタックス要素の値が、低位シンタックス構造でコーディングされ得るので、上記の導出プロセスを通じてセーブ可能であるよりも多いビットをセーブし得る。

実施形態において、図８は、コーディングされたビデオシーケンスで全てのピクチャ／スライスのために使用されるｐｏｃ＿ｃｙｃｌｅ＿ａｕを示す、ＶＰＳ（又はＳＰＳ）におけるｖｐｓ＿ｐｏｃ＿ｃｙｃｌｅ＿ａｕのシンタックス要素と、スライスヘッダで現在のスライスのｐｏｃ＿ｃｙｃｌｅ＿ａｕを示すｓｌｉｃｅ＿ｐｏｃ＿ｃｙｃｌｅ＿ａｕのシンタックス要素とをシグナリングするためのシンタックステーブルの例を示す。ＰＯＣ値がＡＵごとに一様に増大する場合に、ＶＰＳにおけるｖｐｓ＿ｃｏｎｔａｎｔ＿ｐｏｃ＿ｃｙｃｌｅ＿ｐｅｒ＿ａｕは、１に等しくセットされてよく、ｖｐｓ＿ｐｏｃ＿ｃｙｃｌｅ＿ａｕは、ＶＰＳでシグナリングされてよい。この場合に、ｓｌｉｃｅ＿ｐｏｃ＿ｃｙｃｌｅ＿ａｕは、明示的にシグナリングされなくてもよく、各ＡＵのＡＵＣの値は、ｖｐｓ＿ｐｏｃ＿ｃｙｃｌｅ＿ａｕでＰＯＣの値を割ることによって計算され得る。ＰＯＣ値がＡＵごとに一様に増大しない場合に、ＶＰＳにおけるｖｐｓ＿ｃｏｎｔａｎｔ＿ｐｏｃ＿ｃｙｃｌｅ＿ｐｅｒ＿ａｕは、０に等しくセットされてよい。この場合に、ｖｐｓ＿ａｃｃｅｓｓ＿ｕｎｉｔ＿ｃｎｔはシグナリングされなくてもよく、一方、ｓｌｉｃｅ＿ａｃｃｅｓｓ＿ｕｎｉｔ＿ｃｎｔは各スライス又はピクチャごとにスライスヘッダでシグナリングされてよい。各スライス又はピクチャは、異なる値のｓｌｉｃｅ＿ａｃｃｅｓｓ＿ｕｎｉｔ＿ｃｎｔを有してよい。各ＡＵのＡＵＣの値は、ｓｌｉｃｅ＿ｐｏｃ＿ｃｙｃｌｅ＿ａｕでＰＯＣの値を割ることによって計算され得る。

図９は、上記のプロセスの例を説明するブロック図を示す。例えば、動作Ｓ９１０で、ＶＰＳ（又はＳＰＳ）はパースされ得、動作Ｓ９２０で、ＡＵごとのＰＯＣサイクルがコーディングされたビデオシーケンス内で一定であるかどうかが、決定され得る。ＡＵごとのＰＯＣサイクルが一定である場合に（動作Ｓ９２０でＹＥＳ）、次いで、動作Ｓ９３０で、特定のアクセスユニットについてのアクセスユニットカウントの値が、コーディングされたビデオシーケンスについてシグナリングされたｐｏｃ＿ｃｙｃｌｅ＿ａｕと、特定のアクセスユニットのＰＯＣ値とから計算され得る。ＡＵごとのＰＯＣサイクルが一定でない場合に（動作Ｓ９２０でＮＯ）、次いで、動作Ｓ９４０で、特定のアクセスユニットについてのアクセスユニットカウントの値が、特定のレベルでシグナリングされたｐｏｃ＿ｃｙｃｌｅ＿ａｕと、特定のアクセスユニットのＰＯＣ値とから計算され得る。動作Ｓ９５０で、新しいＶＰＳ（又はＳＰＳ）がパースされ得る。

実施形態において、たとえピクチャ、スライス、又はタイルのＰＯＣの値が異なり得るとしても、同じＡＵＣ値を有するＡＵに対応するピクチャ、スライス、又はタイルは、同じデコーディング又は出力時間インスタンスと関連付けられてよい。従って、同じＡＵ内のピクチャ、スライス、又はタイルの間で如何なる相互的なパージング／デコーディング依存性もなしで、同じＡＵと関連付けられたピクチャ、スライス、又はタイルの全て又はサブセットは、並行してデコードされてよく、同じ時間インスタンスで出力されてよい。

実施形態において、たとえピクチャ、スライス、又はタイルのＰＯＣの値が異なり得るとしても、同じＡＵＣ値を有するＡＵに対応するピクチャ、スライス、又はタイルは、同じ合成／表示時間インスタンスと関連付けられてよい。合成時間がコンテナフォーマットに含まれる場合に、たとえピクチャが異なるＡＵに対応するとしても、ピクチャが同じ合成時間を有しているならば、ピクチャは同じ時間インスタンスで表示され得る。

実施形態において、各ピクチャ、スライス、又はタイルは、同じＡＵにおいて同じ時間識別子（ｔｅｍｐｏｒａｌ＿ｉｄ）を有してよい。ある時間インスタンスに対応するピクチャ、スライス、又はタイルの全て又はサブセットは、同じ時間サブレイヤと関連付けられてよい。実施形態において、各ピクチャ、スライス、又はタイルは、同じＡＵにおいて同じ又は異なる空間レイヤｉｄ（要素ｌａｙｅｒ＿ｉｄ）を有してもよい。ある時間インスタンスに対応するピクチャ、スライス、又はタイルの全て又はサブセットは、同じ又は異なる空間レイヤと関連付けられてよい。

図７は、適応解像度変更とのｔｅｍｐｏｒａｌ＿ｉｄ、ｌａｙｅｒ＿ｉｄ、並びにＰＯＣ及びＡＵＣ値の組み合わせによるビデオシーケンス構造の例を示す。この例では、ＡＵＣ＝０を有する最初のＡＵ内のピクチャ、スライス、又はタイルは、ｔｅｍｐｏｒａｌ＿ｉｄ＝０及びｌａｙｅｒ＿ｉｄ＝０又は１を有してよく、一方、ＡＵＣ＝１を有する第２のＡＵ内のピクチャ、スライス、又はタイルは、ｔｅｍｐｏｒａｌ＿ｉｄ＝１及びｌａｙｅｒ＿ｉｄ＝０又は１を夫々有してよい。ＰＯＣの値は、ｔｅｍｐｏｒａｌ＿ｉｄ及びｌａｙｅｒ＿ｉｄの値にかかわらずピクチャごとに１ずつ増える。この例では、ｐｏｃ＿ｃｙｃｌｅ＿ａｕの値は２に等しくなる。実施形態において、ｐｏｃ＿ｃｙｃｌｅ＿ａｕの値は、（空間スケーラビリティ）レイヤの数に等しくセットされてよい。この例では、従って、ＰＯＣの値は２ずつ増え、一方、ＡＵＣの値は１ずつ増える。

上記の実施形態で、インターピクチャ又はインターレイヤ予測構造及び参照ピクチャ指示の全て又はサブセットは、ＨＥＶＣでの既存の参照ピクチャセット（ＲＰＳ）シグナリング又は参照ピクチャリスト（ＲＰＬ）シグナリングを使用することによってサポートされてよい。ＲＰＳ又はＲＰＬで、選択された参照ピクチャは、ＰＯＣの値、又は現在のピクチャと選択された参照ピクチャとの間のＰＯＣの差分値をシグナリングすることによって、示され得る。実施形態において、ＲＰＳ又はＲＰＬは、シグナリングの変化無しで、しかし、次の制限を有して、インターピクチャ又はインターレイヤ予測構造を示すために使用され得る。参照ピクチャのｔｅｍｐｏｒａｌ＿ｉｄの値が現在のピクチャのｔｅｍｐｏｒａｌ＿ｉｄの値よりも大きい場合に、現在のピクチャは、動き補償又は他の予測のために参照ピクチャを使用しなくもよい。参照ピクチャのｌａｙｅｒ＿ｉｄの値が現在のピクチャのｌａｙｅｒ＿ｉｄの値よりも大きい場合に、現在のピクチャは、動き補償又は他の予測のために参照ピクチャを使用しなくてもよい。

実施形態において、時間動きベクトル予測のためのＰＯＣ差分に基づいた動きベクトルスケーリングは、アクセスユニット内の複数のピクチャにわたって無効にされてもよい。従って、各ピクチャがアクセスユニット内で異なるＰＯＣ値を有することがあるが、動きベクトルは、アクセスユニット内の時間動きベクトル予測のためにスケーリング及び使用されなくてもよい。これは、同じＡＵで異なるＰＯＣを有する参照ピクチャが同じ時間インスタンスを有する参照ピクチャと見なされるからである。従って、実施形態において、動きベクトルスケーリング関数は、参照ピクチャが現在のピクチャに関連したＡＵに属する場合に１を返してよい。

実施形態において、時間動きベクトル予測のためのＰＯＣ差分に基づいた動きベクトルスケーリングは、参照ピクチャの空間分解能が現在のピクチャの空間分解能とは異なる場合に、複数のピクチャにわたって任意に無効化されてもよい。動きベクトルスケーリングが許可される場合に、動きベクトルは、現在のピクチャと参照ピクチャとの間のＰＯＣ差分及び空間分解能比の両方に基づいてスケーリングされる。

実施形態において、動きベクトルは、特に、ｐｏｃ＿ｃｙｃｌｅ＿ａｕが非一様値を有する場合に（ｖｐｓ＿ｃｏｎｔａｎｔ＿ｐｏｃ＿ｃｙｃｌｅ＿ｐｅｒ＿ａｕ＝＝０である場合に）、時間動きベクトル予測のためのＰＯＣ差分の代わりにＡＵＣ差分に基づいてスケーリングされてもよい。そうでない場合（ｖｐｓ＿ｃｏｎｔａｎｔ＿ｐｏｃ＿ｃｙｃｌｅ＿ｐｅｒ＿ａｕ＝＝１である場合）には、ＡＵＣ差分に基づいた動きベクトルスケーリングは、ＰＯＣ差分に基づいた動きベクトルスケーリングと同じであってよい。

実施形態において、動きベクトルがＡＵＣ差分に基づいてスケーリングされる場合に、現在のピクチャを含む同じＡＵ内の（同じＡＵＣ値を有する）参照動きベクトルは、ＡＵＣ差分に基づいてスケーリングされず、現在のピクチャと参照ピクチャとの間の空間分解能比に基づいたスケーリングを有して又はスケーリング無しで動きベクトル予測のために使用される。

実施形態において、ＡＵＣ値は、ＡＵの境界を識別するために使用され、かつ、ＡＵ粒度での入力及び出力タイミングを必要とする仮想リファレンスデコーダ（ＨＲＤ）動作のために使用される。実施形態において、ＡＵの最上位レイヤを有するデコードされたピクチャは、表示のために出力されてよい。ＡＵＣ値及びｌａｙｅｒ＿ｉｄ値は、出力ピクチャを識別するために使用され得る。

実施形態において、ピクチャは、１つ以上のサブピクチャを含んでもよい。各サブピクチャは、ピクチャの局所領域又は全体領域をカバーしてよい。サブピクチャによってサポートされる領域は、他のサブピクチャによってサポートされる領域と重なり合っても重なり合わなくてもよい。１つ以上のサブピクチャによってカバーされている領域は、ピクチャの全体領域をカバーしてもしなくてもよい。ピクチャがサブピクチャを含む場合に、そのサブピクチャによってサポートされる領域は、ピクチャによってサポートされる領域と同じであってもよい。

実施形態において、サブピクチャは、コーディングされたピクチャのために使用されているコーディング方法と類似したコーディング方法によってコーディングされてもよい。サブピクチャは、独立してコーディングされてもよく、あるいは、他のサブピクチャ又はコーディングされたピクチャに依存してコーディングされてもよい。サブピクチャは、他のサブピクチャ又はコーディングされたピクチャからの如何なるパージング依存性も有しても有さなくてもよい。

実施形態において、コーディングされたサブピクチャは、１つ以上のレイヤに含まれてもよい。レイヤ内のコーディングされたサブピクチャは、異なる空間分解能を有してもよい。元のサブピクチャは、空間的にリサンプリング（アップサンプリング又はダウンサンプリング）され、異なる空間分解能パラメータでコーディングされ、レイヤに対応するビットストリームに含まれてよい。

実施形態において、Ｗがサブピクチャの幅を示し、Ｈがサブピクチャの高さを示すとして、（Ｗ，Ｈ）を有するサブピクチャは、コーディングされて、レイヤ０に対応するコーディングされたビットストリームに含まれてよく、一方、元の空間分解能を有するサブピクチャからアップサンプリング（又はダウンサンプリングされた）、（Ｗ×Ｓ_ｗ，ｋ，Ｈ×Ｓ_ｈ，ｋ）を有するサブピクチャは、コーディングされ、レイヤｋに対応するコーディングされたビットストリームに含まれてよい。ここで、Ｓ_ｗ，ｋ、Ｓ_ｈ，ｋは、夫々、水平方向及び垂直方向でのリサンプリング比を示す。Ｓ_ｗ，ｋ、Ｓ_ｈ，ｋの値が１よりも大きい場合に、リサンプリングはアップサンプリングであってよい。一方、Ｓ_ｗ，ｋ、Ｓ_ｈ，ｋの値が１よりも小さい場合には、リサンプリングはダウンサンプリングであってよい。

実施形態において、レイヤ内のコーディングされたサブピクチャは、同じサブピクチャ又は異なるサブピクチャにおける他のレイヤ内のコーディングされたサブピクチャのそれとは異なった視覚品質を有してもよい。例えば、レイヤｎ内のサブピクチャｉは、量子化パラメータＱ_ｉ，ｎでコーディングされてよく、一方、レイヤｍ内のサブピクチャｊは、量子化パラメータＱ_ｊ，ｍでコーディングされてよい。

実施形態において、レイヤ内のコーディングされたサブピクチャは、同じ局所領域の他のレイヤ内のコーディングされたサブピクチャからの如何なるパージング又はデコーディング依存性もなしで、独立してデコード可能であってよい。同じ局所領域の他のサブピクチャレイヤを参照せずに独立にデコード可能であることができるサブピクチャレイヤは、独立サブピクチャレイヤであり得る。独立サブピクチャレイヤ内のコーディングされたサブピクチャは、同じサブピクチャレイヤ内の前にコーディングされたサブピクチャからのデコーディング又はパージング依存性を有しても有さなくてもよいが、コーディングされたサブピクチャは、他のサブピクチャレイヤ内のコーディングされたサブピクチャからの如何なる依存性も有さなくてよい。

実施形態において、レイヤ内のコーディングされたサブピクチャは、同じ局所領域の他のレイヤ内のコーディングされたサブピクチャからの何らかのパージング又はデコーディング依存性を有して、従属的にデコード可能であってもよい。同じ局所領域の他のサブピクチャレイヤを参照して従属的にデコード可能であることができるサブピクチャレイヤは、従属サブピクチャレイヤであり得る。従属サブピクチャレイヤ内のコーディングされたサブピクチャは、同じサブピクチャに属するコーディングされたサブピクチャ、同じサブピクチャレイヤ内の前にコーディングされたサブピクチャ、又は両方の参照サブピクチャを参照してよい。

実施形態において、コーディングされたサブピクチャは、１つ以上の独立サブピクチャレイヤと、１つ以上の従属サブピクチャレイヤとを含んでよい。しかし、少なくとも１つの独立サブピクチャレイヤが、コーディングされたサブピクチャのために存在してよい。独立サブピクチャレイヤの、ＮＡＬユニットヘッダ又は他の高位シンタックス構造に存在し得るレイヤ識別子（ｌａｙｅｒ＿ｉｄ）の値は、０に等しくなる。０に等しいｌａｙｅｒ＿ｉｄを有するサブピクチャレイヤは、基本サブピクチャレイヤであってよい。

実施形態において、ピクチャは、１つ以上の前景サブピクチャと、１つの背景サブピクチャとを含んでよい。背景サブピクチャによってサポートされる領域は、ピクチャの領域に等しくてよい。前景サブピクチャによってサポートされる領域は、背景サブピクチャによってサポートされる領域と重なり合ってもよい。背景サブピクチャは、基本サブピクチャレイヤであってよく、一方、前景サブピクチャは、非基本（拡張）サブピクチャレイヤであってよい。１つ以上の非基本サブピクチャレイヤは、デコーディングのために同じ基本レイヤを参照してよい。ａがｂよりも大きいとして、ａに等しいｌａｙｅｒ＿ｉｄを有する各非基本サブピクチャレイヤは、ｂに等しいｌａｙｅｒ＿ｉｄを有する非基本サブピクチャレイヤを参照してもよい。

実施形態において、ピクチャは、背景サブピクチャの有無によらず１つ以上の前景サブピクチャを含んでもよい。各サブピクチャは、それ自身の基本サブピクチャレイヤと、１つ以上の非基本（拡張）レイヤとを有してよい。各基本サブピクチャレイヤは、１つ以上の非基本サブピクチャレイヤによって参照されてよい。ａがｂよりも大きいとして、ａに等しいｌａｙｅｒ＿ｉｄを有する各非基本サブピクチャレイヤは、ｂに等しいｌａｙｅｒ＿ｉｄを有する非基本サブピクチャレイヤを参照してよい。

実施形態において、ピクチャは、背景サブピクチャの有無によらず１つ以上の前景サブピクチャを含んでもよい。（基本又は非基本）サブピクチャレイヤ内の各コーディングされたサブピクチャは、同じサブピクチャに属する１つ以上の非基本レイヤサブピクチャと、同じサブピクチャに属さない１つ以上の非基本レイヤサブピクチャとによって参照されてよい。

実施形態において、ピクチャは、背景サブピクチャの有無によらず１つ以上の前景サブピクチャを含んでもよい。レイヤａ内のサブピクチャは、同じレイヤ内の複数のサブピクチャに更にパーティション化されてよい。レイヤｂ内の１つ以上のコーディングされたサブピクチャは、レイヤａ内のパーティション化されたサブピクチャを参照してよい。

実施形態において、コーディングされたビデオシーケンス（ＣＶＳ）は、コーディングされたピクチャのグループであってよい。ＣＶＳは、１つ以上のコーディングされたサブピクチャシーケンス（ＣＳＰＳ）を含んでもよく、ＣＳＰＳは、ピクチャの同じ局所領域をカバーするコーディングされたサブピクチャのグループであってよい。ＣＳＰＳは、コーディングされたビデオシーケンスのそれと同じ又は異なった時間分解能を有してよい。

実施形態において、ＣＳＰＳは、コーディングされて、１つ以上のレイヤに含まれてよい。ＣＳＰＳは、１つ以上のＣＳＰＳレイヤを含んでもよい。ＣＳＰＳに対応する１つ以上のＣＳＰＳレイヤをデコードすることは、同じ局所領域に対応するサブピクチャのシーケンスを再構成してよい。

実施形態において、ＣＳＰＳに対応するＣＳＰＳレイヤの数は、他のＣＳＰＳに対応するＣＳＰＳレイヤの数と同じであっても又は異なってもよい。

実施形態において、ＣＳＰＳレイヤは、他のＣＳＰＳレイヤとは異なった時間分解能（例えば、フレームレート）を有してもよい。元の（圧縮されていない）サブピクチャシーケンスは、時間的にリサンプリング（例えば、アップサンプリング又はダウンサンプリング）され、異なる時間分解能パラメータでコーディングされ、レイヤに対応するビットストリームに含まれてよい。

実施形態において、フレームレートＦを有するサブピクチャシーケンスは、コーディングされて、レイヤ０に対応するコーディングされたビットストリームに含まれてよく、一方、元のサブピクチャシーケンスから時間的にアップサンプリング（又はダウンサンプリング）された、Ｆ×Ｓ_ｔ，ｋを有するサブピクチャシーケンスは、コーディングされて、レイヤｋに対応するコーディングされたビットストリームに含まれてよい。ここで、Ｓ_ｔ，ｋは、レイヤｋのための時間サンプリング比を示す。Ｓ_ｔ，ｋの値が１よりも大きい場合には、時間リサンプリングプロセスは、フレームレートアップコンバージョンであってよい。一方、Ｓ_ｔ，ｋが１よりも小さい場合には、時間リサンプリングプロセスは、フレームレートダウンコンバージョンであってよい。

実施形態において、ＣＳＰＳレイヤａを有するサブピクチャが、動き補償又は何らかのインターレイヤ予測のために、ＣＳＰＳレイヤｂを有するサブピクチャによって参照される場合に、ＣＳＰＳレイヤａの空間分解能がＣＳＰＳレイヤｂの空間分解能とは異なるならば、ＣＳＰＳレイヤａでのデコードされたピクセルは、リサンプリングされて、参照のために使用される。リサンプリングプロセスは、アップサンプリングフィルタリング又はダウンサンプリングフィルタリングを使用してもよい。

図１０は、０に等しいｌａｙｅｒ＿ｉｄを有する背景ビデオＣＳＰＳと、複数の前景ＣＳＰＳレイヤとを含むビデオストリームの例を示す。コーディングされたサブピクチャは１つ以上のＣＳＰＳレイヤを含んでもよく、一方、如何なる前景ＣＳＰＳレイヤにも属さない背景領域は、基本レイヤを含んでよい。基本レイヤは、背景領域及び前景領域を含んでもよく、一方、エンハンスメントＣＳＰＳレイヤは前景領域を含んでよい。エンハンスメントＣＳＰＳレイヤは、同じ領域で、基本レイヤよりも良い視覚品質を有し得る。エンハンスメントＣＳＰＳレイヤは、同じ領域に対応する基本レイヤの動きベクトル及び再構成されたピクセルを参照してよい。

実施形態において、ビデオファイルでは、基本レイヤに対応するビデオビットストリームは、トラックに含まれ、一方、各サブピクチャに対応するＣＳＰＳレイヤは、別個のトラックに含まれる。

実施形態において、基本レイヤに対応するビデオビットストリームは、トラックに含まれ、一方、同じｌａｙｅｒ＿ｉｄを有するＣＳＰＳレイヤは、別個のトラックに含まれる。この例では、レイヤｋに対応するトラックは、レイヤｋに対応するＣＳＰＳレイヤのみを含む。

実施形態において、各サブピクチャの各ＣＳＰＳレイヤは、別のトラックに格納される。各トラックは、１つ以上の他のトラックからの如何なるパージング又はデコーディング依存性も有しても有さなくてもよい。

実施形態において、各トラックは、サブピクチャの全て又はサブセットのＣＳＰＳレイヤのレイヤｉからレイヤｊに対応するビットストリームを含んでよい。ここで、０＜ｉ＝＜ｊ＝＜ｋであり、ｋはＣＳＰＳの最高レイヤである。

実施形態において、ピクチャは、デプスマップ、アルファマップ、３Ｄジオメトリデータ、占有マップ、などを含む１つ以上の関連するメディアデータを含む。そのような関連する時間付き（timed）メディアデータは、夫々が１つのサブピクチャに対応する１つ又は複数のデータサブストリームに分けられ得る。

図１１は、多層サブピクチャ方法に基づいたビデオ会議の例を示す。ビデオストリームには、背景ピクチャに対応する１つの基本レイヤビデオビットストリームと、前景サブピクチャに対応する１つ以上のエンハンスメントレイヤビデオビットストリームとが含まれる。各エンハンスメントレイヤビデオビットストリームは、ＣＳＰＳレイヤに対応してよい。ディスプレイでは、基本レイヤに対応するピクチャがデフォルトで表示される。基本レイヤは、一人以上のユーザのピクチャ・イン・ピクチャ（Picture In Picture，ＰＩＰ）を含む。特定のユーザがクライアントの制御によって選択される場合に、選択されたユーザに対応するエンハンスメントＣＳＰＳレイヤは、向上した品質又は空間分解能でデコード及び表示され得る。

図１２は、上記のプロセスの例を説明するブロック図を示す。例えば、動作Ｓ１２１０で、複数のレイヤを含むビデオビットストリームがデコードされ得る。動作Ｓ１２２０で、背景領域及び１つ以上の前景サブピクチャが識別され得る。動作Ｓ１２３０で、特定のサブピクチャ領域、例えば、前景サブピクチャのうちの１つ、が選択されるかどうかが決定され得る。特定のサブピクチャ領域が選択される場合に（動作Ｓ１２４０でＹＥＳ）、強化されたサブピクチャがデコード及び表示されてよい。特定のサブピクチャ領域が選択されない場合に（動作Ｓ１２４０でＮＯ）、背景領域がデコード及び表示されてよい。

実施形態において、ネットワークミドルボックス（例えば、ルータ）は、そのバンド幅に応じてユーザへ送信すべきレイヤのサブセットを選択してもよい。ピクチャ／サブピクチャ編成は、バンド幅適応のために使用されてよい。例えば、ユーザがバンド幅を有さない場合に、ルータは、それらの重要性により又は使用されている設定に基づいてレイヤを削除するか又はいくつかのサブピクチャを選択する。これは、バンド幅に適応するよう動的に行われ得る。

図１３は、３６０度ビデオの使用ケースに関係がある実施形態を示す。球状の３６０度ピクチャ、例えば、ピクチャ１３１０が平面ピクチャに投影される場合に、投影３６０度ピクチャは、基本レイヤとして複数のサブピクチャにパーティション化されてよい。例えば、複数のサブピクチャは、後方サブピクチャ、上サブピクチャ、右サブピクチャ、左サブピクチャ、前方サブピクチャ、及び↓サブピクチャを含んでよい。特定のサブピクチャ、例えば、前方サブピクチャのエンハンスメントレイヤがコーディングされて、クライアントへ伝送されてよい。デコーダは、全てのサブピクチャを含む基本レイヤと、選択されたサブピクチャのエンハンスメントレイヤとの両方をデコードすることが可能であってよい。現在のビューポートが選択されたサブピクチャと同じである場合に、表示されているピクチャは、エンハンスメントレイヤを伴ったデコードされたサブピクチャでより高い品質を有し得る。そうでない場合には、基本レイヤを含むデコードされたピクチャが、より低い品質で表示され得る。

実施形態において、表示のための如何なるレイアウト情報も、補足情報（例えば、ＳＥＩメッセージ又はメタデータ）として、ファイルに存在してもよい。１つ以上のデコードされたサブピクチャは、シグナリングされたレイアウト情報に応じて再配置又は表示されてよい。レイアウト情報は、ストリーミングサーバ又はブロードキャスタによってシグナリングされてよく、あるいは、ネットワークエンティティ又はクラウドサーバによって再生されてもよく、あるいは、ユーザのカスタマイズされた設定によって決定されてもよい。

実施形態において、入力されたピクチャが１つ以上の（長方形の）サブ領域に分けられる場合に、各サブ領域は、独立レイヤとしてコーディングされてもよい。局所領域に対応する各独立レイヤは、一意のｌａｙｅｒ＿ｉｄ値を有してよい。各独立レイヤについて、サブピクチャサイズ及び位置情報がシグナリングされてよい。例えば、ピクチャサイズ（幅、高さ）及び左上隅のオフセット情報（ｘ＿ｏｆｆｓｅｔ、ｙ＿ｏｆｆｓｅｔ）がシグナリングされてもよい。図１４は、分割されたサブピクチャのレイアウト、そのサブピクチャサイズ及び位置情報、並びにその対応するピクチャ予測構造の例を示す。サブピクチャサイズ及びサブピクチャ位置を含むレイアウト情報は、パラメータセット、スライス若しくはタイルグループのヘッダ、又はＳＥＩメッセージなどの高位シンタックス構造でシグナリングされてよい。

実施形態で、独立レイヤに対応する各サブピクチャは、ＡＵ内でその一意のＰＯＣ値を有してもよい。ＤＰＢに格納されているピクチャの中の参照ピクチャがＲＰＳ又はＲＰＬ構造でシンタックス要素を使用することによって指示される場合に、レイヤに対応する各サブピクチャのＰＯＣ値が使用されてもよい。

実施形態において、（インターレイヤ）予測構造を示すために、ｌａｙｅｒ＿ｉｄは使用されなくてもよく、ＰＯＣ（差分）値が使用され得る。

実施形態で、レイヤ（又は局所領域）に対応するＮに等しいＰＯＣ値を有しているサブピクチャは、動き補償された予測のために、同じレイヤ（又は同じ局所領域）に対応する、Ｋ＋Ｎに等しいＰＯＣ値を有するサブピクチャの参照ピクチャとして使用されてもされなくてもよい。ほとんどの場合に、数Ｋの値は、サブ領域の数と同じであってもよい（独立）レイヤの最大数に等しくなる。

実施形態において、図１５は、図１４の拡張された場合を表す。入力されたピクチャが複数（例えば、４つ）のサブ領域に分けられる場合に、各局所領域は、１つ以上のレイヤを有してコーディングされてよい。その場合に、独立レイヤの数はサブ領域の数に等しくてよく、１つ以上のレイヤは１つのサブ領域に対応してよい。よって、各サブ領域は、１つ以上の独立レイヤ及びゼロ個以上の従属レイヤを有してコーディングされてよい。

実施形態において、図１５で、入力されたピクチャは４つのサブ領域に分けられてよい。例として、右上サブ領域は、レイヤ１及びレイヤ４である２つのレイヤとしてコーディングされてよく、一方、右下サブ領域は、レイヤ３及びレイヤ５である２つのレイヤとしてコーディングされてよい。この場合に、レイヤ４は、動き補償された予測のためにレイヤ１を参照してよく、一方、レイヤ５は、動き補償のためにレイヤ３を参照してよい。

実施形態において、レイヤ境界にわたるインループフィルタリング（例えば、デブロッキングフィルタリング、適応インループフィルタリング、リシェーパ（reshaper）、バイラテラルフィルタリング、又は任意のディープラーニングに基づいたフィルタリング）は、（任意に）無効にされてもよい。

実施形態において、レイヤ境界にわたる動き補償された予測又はイントラブロックコピーは、（任意に）無効にされてもよい。

実施形態において、サブピクチャの境界での動き補償された予測又はインループフィルタリングのための境界パディングは、任意に処理されてもよい。境界パディングが処理されるか否かを示すフラグは、パラメータセット（ＶＰＳ、ＳＰＳ、ＰＰＳ、若しくはＡＰＳ）、スライス若しくはタイルグループヘッダ、又はＳＥＩメッセージなどの高位シンタックス構造でシグナリングされてもよい。

実施形態において、サブ領域（又はサブピクチャ）のレイアウト情報は、ＶＰＳ又はＳＰＳでシグナリングされてもよい。図１６Ａは、ＶＰＳでのシンタックス要素の例を示し、図１６Ｂは、ＳＰＳでのシンタックス要素の例を示す。この例では、ｖｐｓ＿ｓｕｂ＿ｐｉｃｔｕｒｅ＿ｄｉｖｉｄｉｎｇ＿ｆｌａｇがＶＰＳでシグナリングされる。フラグは、入力されたピクチャが複数のサブ領域に分けられるか否かを示してよい。ｖｐｓ＿ｓｕｂ＿ｐｉｃｔｕｒｅ＿ｄｉｖｉｄｉｎｇ＿ｆｌａｇの値が０に等しい場合に、現在のＶＰＳに対応するコーディングされたビデオシーケンス内の入力されたピクチャは、複数のサブ領域に分けられなくてもよい。この場合に、入力されたピクチャのサイズは、ＳＰＳでシグナリングされるコーディングされたピクチャのサイズ（ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ、ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ）に等しくなる。ｖｐｓ＿ｓｕｂ＿ｐｉｃｔｕｒｅ＿ｄｉｖｉｄｉｎｇ＿ｆｌａｇの値が１に等しい場合に、入力されたピクチャは、複数のサブ領域に分けられ得る。この場合に、シンタックス要素ｖｐｓ＿ｆｕｌｌ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ及びｖｐｓ＿ｆｕｌｌ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍａｐｌｅｓは、ＶＰＳでシグナリングされる。ｖｐｓ＿ｆｕｌｌ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ及びｖｐｓ＿ｆｕｌｌ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍａｐｌｅｓの値は、夫々、入力されたピクチャの幅及び高さに等しくなる。

実施形態において、ｖｐｓ＿ｆｕｌｌ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ及びｖｐｓ＿ｆｕｌｌ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍａｐｌｅｓの値は、デコーディングのために使用されなくてもよいが、合成及び表示のために使用され得る。

実施形態において、ｖｐｓ＿ｓｕｂ＿ｐｉｃｔｕｒｅ＿ｄｉｖｉｄｉｎｇ＿ｆｌａｇの値が１に等しい場合に、シンタックス要素ｐｉｃ＿ｏｆｆｓｅｔ＿ｘ及びｐｉｃ＿ｏｆｆｓｅｔ＿ｙは、特定のレイヤに対応するＳＰＳでシグナリングされてよい。この場合に、ＳＰＳでシグナリングされるコーディングされたピクチャのサイズ（ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ、ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ）は、特定のレイヤに対応するサブ領域の幅及び高さに等しくなる。また、サブ領域の左上隅の位置（ｐｉｃ＿ｏｆｆｓｅｔ＿ｘ、ｐｉｃ＿ｏｆｆｓｅｔ＿ｙ）が、ＳＰＳでシグナリングされてもよい。

実施形態において、サブ領域の左上隅の位置情報（ｐｉｃ＿ｏｆｆｓｅｔ＿ｘ、ｐｉｃ＿ｏｆｆｓｅｔ＿ｙ）は、デコーディングのために使用されなくてもよいが、合成及び表示のために使用され得る。

実施形態において、入力されたピクチャのサブ領域の全て又はサブセットのレイアウト情報（サイズ及び位置）、及びレイヤ間の依存関係情報が、パラメータセット又はＳＥＩメッセージでシグナリングされてもよい。図１７は、サブ領域のレイアウトの情報、レイヤ間の依存性、及びサブ領域と１つ以上のレイヤとの間の関係を示すシンタックス要素の例を表す。この例では、シンタックス要素ｎｕｍ＿ｓｕｂ＿ｒｅｇｉｏｎは、現在のコーディングされたビデオシーケンス内の（長方形）サブ領域の数を示す。シンタックス要素ｎｕｍ＿ｌａｙｅｒｓは、現在のコーディングされたビデオシーケンス内のレイヤの数を示す。ｎｕｍ＿ｌａｙｅｒｓの値は、ｎｕｍ＿ｓｕｂ＿ｒｅｇｉｏｎの値以上であってよい。いずれかのサブ領域が単一のレイヤとしてコーディングされる場合に、ｎｕｍ＿ｌａｙｅｒｓの値は、ｎｕｍ＿ｓｕｂ＿ｒｅｇｉｏｎの値と等しくなる。１つ以上のサブ領域が複数のレイヤとしてコーディングされる場合に、ｎｕｍ＿ｌａｙｅｒｓの値は、ｎｕｍ＿ｓｕｂ＿ｒｅｇｉｏｎの値よりも大きくなる。シンタックス要素ｄｉｒｅｃｔ＿ｄｅｐｅｎｄｅｎｃｙ＿ｆｌａｇ［ｉ］［ｊ］は、ｊ番目のレイヤからｉ番目のレイヤへの依存性を示す。ｎｕｍ＿ｌａｙｅｒｓ＿ｆｏｒ＿ｒｅｇｉｏｎ［ｉ］は、ｉ番目のサブ領域に関連したレイヤの数を示す。ｓｕｂ＿ｒｅｇｉｏｎ＿ｌａｙｅｒ＿ｉｄ［ｉ］［ｊ］は、ｉ番目のサブ領域に関連したｊ番目のレイヤのｌａｙｅｒ＿ｉｄを示す。ｓｕｂ＿ｒｅｇｉｏｎ＿ｏｆｆｓｅｔ＿ｘ［ｉ］及びｓｕｂ＿ｒｅｇｉｏｎ＿ｏｆｆｓｅｔ＿ｙ［ｉ］は、夫々、ｉ番目のサブ領域の左上隅の水平及び垂直位置を示す。ｓｕｂ＿ｒｅｇｉｏｎ＿ｗｉｄｔｈ［ｉ］及びｓｕｂ＿ｒｅｇｉｏｎ＿ｈｅｉｇｈｔ［ｉ］は、夫々、ｉ番目のサブ領域の幅及び高さを示す。

実施形態において、プロファイルティアレベル情報の有無によらず出力されるべき１つ以上のレイヤを示すための出力レイヤセットを定める１つ以上のシンタックス要素は、高位シンタックス構造、例えば、ＶＰＳ、ＤＰＳ、ＳＰＳ、ＰＰＳ、ＡＰＳ、又はＳＥＩメッセージでシグナリングされてよい。図１８を参照すると、ＶＰＳを参照するコーディングされたビデオシーケンスにおける出力レイヤセット（Output Layer Set，ＯＬＳ）の数を示すシンタックス要素ｎｕｍ＿ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｓｅｔｓは、ＶＰＳでシグナリングされてよい。各出力レイヤセットについて、ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｆｌａｇは、出力レイヤの数と同じ回数だけシグナリングされてよい。

実施形態において、１に等しいｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｆｌａｇは、ｉ番目のレイヤが出力されることを示してよい。０に等しいｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｆｌａｇは、ｉ番目のレイヤが出力されないことを示してよい。

実施形態において、各出力レイヤセットについてプロファイルティアレベル情報を定める１つ以上のシンタックス要素は、高位シンタックス構造、例えば、ＶＰＳ、ＤＰＳ、ＳＰＳ、ＰＰＳ、ＡＰＳ、又はＳＥＩメッセージでシグナリングされてよい。依然として図１８を参照すると、ＶＰＳを参照するコーディングされたビデオシーケンスにおけるＯＬＳごとのプロファイルティアレベル情報の数を示すシンタックス要素ｎｕｍ＿ｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌは、ＶＰＳでシグナリングされてよい。各出力レイヤセットについて、プロファイルティアレベル情報のためのシンタックス要素の組又はプロファイルティアレベル情報内のエントリの中で特定のプロファイルティアレベル情報を示すインデックスは、出力レイヤの数と同じ回数だけシグナリングされてよい。

実施形態において、ｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ＿ｉｄｘ［ｉ］［ｊ］は、ｉ番目のＯＬＳのｊ番目のレイヤに適用するｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ（）シンタックス構造の、ＶＰＳでのｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ（）シンタックス構造のリスト内へのインデックスを指定する。

実施形態において、図１９を参照すると、シンタックス要素ｎｕｍ＿ｐｒｏｆｉｌｅ＿ｔｉｌｅ＿ｌｅｖｅｌ及び／又はｎｕｍ＿ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｓｅｔｓは、最大レイヤの数が１よりも多い（ｖｐｓ＿ｍａｘ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１＞０）場合にシグナリングされてよい。

実施形態において、図１９を参照すると、ｉ番目の出力レイヤセットについての出力レイヤシグナリングのモードを示すシンタックス要素ｖｐｓ＿ｏｕｔｐｕｔ＿ｌａｙｅｒｓ＿ｍｏｄｅ［ｉ］が、ＶＰＳに存在してもよい。

実施形態において、０に等しいｖｐｓ＿ｏｕｔｐｕｔ＿ｌａｙｅｒｓ＿ｍｏｄｅ［ｉ］は、最高レイヤのみがｉ番目の出力レイヤセットにより出力されることを示してよい。１に等しいｖｐｓ＿ｏｕｔｐｕｔ＿ｌａｙｅｒｓ＿ｍｏｄｅ［ｉ］は、全てのレイヤがｉ番目の出力レイヤセットにより出力されることを示してよい。２に等しいｖｐｓ＿ｏｕｔｐｕｔ＿ｌａｙｅｒｓ＿ｍｏｄｅ［ｉ］は、ｉ番目の出力レイヤセットにより出力されるレイヤが、１に等しいｖｐｓ＿ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｆｌａｇ［ｉ］［ｊ］を有するレイヤであることを示してよい。より多くの値がリザーブされてもよい。

実施形態において、ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｆｌａｇ［ｉ］［ｊ］は、ｉ番目の出力レイヤセットについてのｖｐｓ＿ｏｕｔｐｕｔ＿ｌａｙｅｒｓ＿ｍｏｄｅ［ｉ］の値に応じて、シグナリングされてもされなくてもよい。

実施形態において、図１９を参照すると、フラグｖｐｓ＿ｐｔｌ＿ｆｌａｇ［ｉ］が、ｉ番目の出力レイヤセットについて存在してもよい。ｖｐｓ＿ｐｔｌ＿ｆｌａｇ［ｉ］の値に応じて、ｉ番目の出力レイヤセットのプロファイルティアレベル情報は、シグナリングされてもされなくてもよい。

実施形態において、図２０を参照すると、現在のＣＶＳでのサブピクチャの数ｍａｘ＿ｓｕｂｐｉｃｓ＿ｍｉｎｕｓ１は、高位シンタックス構造、例えば、ＶＰＳ、ＤＰＳ、ＳＰＳ、ＰＰＳ、ＡＰＳ、又はＳＥＩメッセージでシグナリングされてもよい。

実施形態において、図２０を参照すると、ｉ番目のサブピクチャのサブピクチャ識別子ｓｕｂ＿ｐｉｃ＿ｉｄ［ｉ］は、サブピクチャの数が１よりも多い（ｍａｘ＿ｓｕｂｐｉｃｓ＿ｍｉｎｕｓ１＞０）場合にシグナリングされてよい。

実施形態において、各出力レイヤセットの各レイヤに属するサブピクチャ識別子を示す１つ以上のシンタックス要素は、ＶＰＳでシグナリングされてもよい。図２０を参照すると、ｓｕｂ＿ｐｉｃ＿ｉｄ＿ｌａｙｅｒ［ｉ］［ｊ］［ｋ］は、ｉ番目の出力レイヤセットのｊ番目のレイヤに存在するｋ番目のサブピクチャを示す。この情報により、デコーダは、特定の出力レイヤセットの各レイヤについて、どのサブピクチャがデコードされ出力され得るかを認識し得る。

実施形態において、ピクチャヘッダ（ＰＨ）は、コーディングされたピクチャの全スライスに適用するシンタックス要素を含むシンタックス構造である。ピクチャユニット（ＰＵ）はＮＡＬユニットの組であり、ＮＡＬユニットは、特定の分類規則に従って互いに関連付けられ、デコーディング順序において連続しており、かつ、厳密に１つのコーディングされたピクチャを含む。ＰＵは、ピクチャヘッダ（ＰＨ）と、コーディングされたピクチャを含む１つ以上のＶＣＬＮＡＬユニットとを含んでよい。

実施形態において、ＳＰＳ（ＲＢＳＰ）は、それが参照される前にデコーディングプロセスに利用可能であるか、０に等しいＴｅｍｐｏｒａｌＩＤを有する少なくとも１つのＡＵに含まれるか、あるいは、外部手段を通じて供給されてよい。

実施形態において、ＳＰＳ（ＲＢＳＰ）は、それが参照される前にデコーディングプロセスに利用可能であるか、ＳＰＳを参照する１つ以上のＰＰＳを含むＣＶＳで０に等しいＴｅｍｐｏｒａｌＩＤを有する少なくとも１つのＡＵに含まれるか、あるいは、外部手段を通じて供給されてよい。

実施形態において、ＳＰＳ（ＲＢＳＰ）は、それが１つ以上のＰＰＳによって参照される前にデコーディングプロセスに利用可能であるか、ＳＰＳを参照する１つ以上のＰＰＳを含むＣＶＳでＳＰＳＮＡＬユニットを参照するＰＰＳＮＡＬユニットの最小ｎｕｈ＿ｌａｙｅｒ＿ｉｄ値に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有する少なくとも１つのＰＵに含まれるか、あるいは、外部手段を通じて供給されてよい。

実施形態において、ＳＰＳ（ＲＢＳＰ）は、それが１つ以上のＰＰＳによって参照される前にデコーディングプロセスに利用可能であるか、０に等しいＴｅｍｐｏｒａｌＩＤ及びＳＰＳＮＡＬユニットを参照するＰＰＳＮＡＬユニットの最小ｎｕｈ＿ｌａｙｅｒ＿ｉｄ値に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有する少なくとも１つのＰＵに含まれるか、あるいは、外部手段を通じて供給されてよい。

実施形態において、ＳＰＳ（ＲＢＳＰ）は、それが１つ以上のＰＰＳによって参照される前にデコーディングプロセスに利用可能であるか、０に等しいＴｅｍｐｏｒａｌＩＤ及びＣＶＳでＳＰＳＮＡＬユニットを参照するＰＰＳＮＡＬユニットの最小ｎｕｈ＿ｌａｙｅｒ＿ｉｄ値に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有する少なくとも１つのＰＵに含まれるか、あるいは、外部手段を通じて供給されてよい。

同じ又は他の実施形態で、ｐｐｓ＿ｓｅｑ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄは、参照されているＳＰＳについてのｓｐｓ＿ｓｅｑ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄの値を指定してよい。ｐｐｓ＿ｓｅｑ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄの値は、コーディングされたレイヤワイズのビデオシーケンス（ＣＬＶＳ）におけるコーディングされたピクチャによって参照される全てのＰＰＳで同じであってよい。

同じ又は他の実施形態で、ＣＶＳで特定の値のｓｐｓ＿ｓｅｑ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄを有する全てのＳＰＳＮＡＬユニットは、同じ内容を有してもよい。

同じ又は他の実施形態で、ｎｕｈ＿ｌａｙｅｒ＿ｉｄ値にかかわらず、ＳＰＳＮＡＬユニットは、ｓｐｓ＿ｓｅｑ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄの同じ値空間を共有してもよい。

同じ又は他の実施形態で、あるＳＰＳＮＡＬユニットのｎｕｈ＿ｌａｙｅｒ＿ｉｄ値は、そのＳＰＳＮＡＬユニットを参照するＰＰＳＮＡＬユニットの最小ｎｕｈ＿ｌａｙｅｒ＿ｉｄ値に等しくてもよい。

実施形態において、ｍに等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するＳＰＳが、ｎに等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有する１つ以上のＰＰＳによって参照される場合に、ｍに等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するレイヤは、ｎに等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するレイヤ又はｍに等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するレイヤの（直接又は間接）参照レイヤと同じであってもよい。

実施形態において、ＰＰＳ（ＲＢＳＰ）は、それが参照される前にデコーディングプロセスに利用可能であるか、ＰＰＳＮＡＬユニットのＴｅｍｐｏｒａｌＩＤに等しいＴｅｍｐｏｒａｌＩＤを有する少なくとも１つのＡＵに含まれるか、あるいは、外部手段を通じて供給されてよい。

実施形態において、ＰＰＳ（ＲＢＳＰ）は、それが参照される前にデコーディングプロセスに利用可能であるか、ＰＰＳを参照する１つ以上のＰＨ（又はコーディングされたスライスＮＡＬユニット）を含むＣＶＳでＰＰＳＮＡＬユニットのＴｅｍｐｏｒａｌＩＤに等しいＴｅｍｐｏｒａｌＩＤを有する少なくとも１つのＡＵに含まれるか、あるいは、外部手段を通じて供給されてよい。

実施形態において、ＰＰＳ（ＲＢＳＰ）は、それが１つ以上のＰＨ（又はコーディングされたスライスＮＡＬユニット）によって参照される前にデコーディングプロセスに利用可能であるか、ＰＰＳを参照する１つ以上のＰＨ（又はコーディングされたスライスＮＡＬユニット）を含むＣＶＳでＰＰＳＮＡＬユニットを参照するコーディングされたスライスＮＡＬユニットの最小ｎｕｈ＿ｌａｙｅｒ＿ｉｄ値に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有する少なくとも１つのＰＵに含まれるか、あるいは、外部手段を通じて供給されてよい。

実施形態において、ＰＰＳ（ＲＢＳＰ）は、それが１つ以上のＰＨ（又はコーディングされたスライスＮＡＬユニット）によって参照される前にデコーディングプロセスに利用可能であるか、ＰＰＳを参照する１つ以上のＰＨ（又はコーディングされたスライスＮＡＬユニット）を含むＣＶＳでＰＰＳＮＡＬユニットを参照するＰＰＳＮＡＬユニットの最小ｎｕｈ＿ｌａｙｅｒ＿ｉｄ値に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄ及びＰＰＳＮＡＬユニットのＴｅｍｐｏｒａｌＩＤに等しいＴｅｍｐｏｒａｌＩＤを有する少なくとも１つのＰＵに含まれるか、あるいは、外部手段を通じて供給されてよい。

同じ又は他の実施形態で、ＰＨにおけるｐｈ＿ｐｉｃ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄは、使用中の参照されているＰＰＳについてのｐｐｓ＿ｐｉｃ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄの値を指定してよい。ｐｐｓ＿ｓｅｑ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄの値は、ＣＬＶＳにおけるコーディングされたピクチャによって参照される全てのＰＰＳで同じであってよい。

同じ又は他の実施形態で、ＰＵ内の特定の値のｐｐｓ＿ｐｉｃ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄを有する全てのＰＰＳＮＡＬユニットは、同じ内容を有してもよい。

同じ又は他の実施形態で、ｎｕｈ＿ｌａｙｅｒ＿ｉｄ値にかかわらず、ＰＰＳＮＡＬユニットは、ｐｐｓ＿ｐｉｃ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄの同じ値空間を共有してもよい。

同じ又は他の実施形態で、あるＰＰＳＮＡＬユニットのｎｕｈ＿ｌａｙｅｒ＿ｉｄは、そのＰＰＳＮＡＬユニットを参照するＮＡＬユニットを参照するコーディングされたスライスＮＡＬユニットの最小ｎｕｈ＿ｌａｙｅｒ＿ｉｄ値に等しくてもよい。

実施形態において、ｍに等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するＰＰＳが、ｎに等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有する１つ以上のコーディングされたスライスＮＡＬユニットによって参照される場合に、ｍに等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するレイヤは、ｎに等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するレイヤ又はｍに等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するレイヤの（直接又は間接）参照レイヤと同じであってもよい。

ピクチャが、異なる解像度を有する１つ以上の例を含むビットストリーム内にエンコードされる場合に、レイヤの各コーディングされたビデオシーケンスは、参照ピクチャが現在のピクチャとは異なる解像度を有し得るときに参照ピクチャリサンプリングを使用してよい。空間スケーラビリティ又は適応ピクチャ解像度変更（ＡＲＣ）のための参照ピクチャリサンプリングを示すシンタックス要素を指定することが望ましい。

図２１を参照すると、出力レイヤは、出力される出力レイヤセットのレイヤを示してよい。出力レイヤセット（ＯＬＳ）は、指定されたレイヤの組を含むレイヤの組を示してよく、指定されたレイヤの組では、レイヤの組の中の１つ以上のレイヤが出力レイヤであるよう指定されている。出力レイヤセット（ＯＬＳ）レイヤインデックスは、ＯＬＳ内のレイヤのリストに対する、ＯＬＳ内のレイヤのインデックスである。

サブレイヤは、特定の値のＴｅｍｐｏｒａｌＩＤ変数を有するＶＣＬＮＡＬユニット及び関連する非ＶＣＬＮＡＬユニットを含む時間スケーラブルビットストリームの時間スケーラブルレイヤを示してよい。サブレイヤ表現は、特定のサブレイヤ及びより低いサブレイヤのＮＡＬユニットを含むビットストリームのサブセットを示してよい。

ＶＰＳＲＢＳＰは、それが参照される前にデコーディングプロセスに利用可能であるか、０に等しいＴｅｍｐｏｒａｌＩＤを有する少なくとも１つのＡＵに含まれるか、あるいは、外部手段を通じて供給されてよい。ＣＶＳにおける特定の値のｖｐｓ＿ｖｉｄｅｏ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄを有する全てのＶＰＳＮＡＬユニットは、同じ内容を有してもよい。

図２２に示されるように、実施形態において、ｖｐｓ＿ｖｉｄｅｏ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄは、他のシンタックス要素による参照のためにＶＰＳの識別を供給する。ｖｐｓ＿ｖｉｄｅｏ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄの値は、０よりも大きくてよい。

実施形態において、ｖｐｓ＿ｍａｘ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１ｐｌｕｓ１は、ＶＰＳを参照する各ＣＶＳでのレイヤの最大許容数を指定してよい。

ｖｐｓ＿ｍａｘ＿ｓｕｂｌａｙｅｒｓ＿ｍｉｎｕｓ１ｐｌｕｓ１は、ＶＰＳを参照する各ＣＶＳでのレイヤに存在する可能性がある時間サブレイヤの最大数を指定してよい。ｖｐｓ＿ｍａｘ＿ｓｕｂｌａｙｅｒｓ＿ｍｉｎｕｓ１ｐｌｕｓ１の値は、０以上６以下の範囲にあってよい。

実施形態において、１に等しいｖｐｓ＿ａｌｌ＿ｌａｙｅｒｓ＿ｓａｍｅ＿ｎｕｍ＿ｓｕｂｌａｙｅｒｓ＿ｆｌａｇは、時間サブレイヤの数が、ＶＰＳを参照する各ＣＶＳでの全レイヤについて同じであることを指定してよい。０に等しいｖｐｓ＿ａｌｌ＿ｌａｙｅｒｓ＿ｓａｍｅ＿ｎｕｍ＿ｓｕｂｌａｙｅｒｓ＿ｆｌａｇは、ＶＰＳを参照する各レイヤでのレイヤが、同数の時間サブレイヤを有しても有さなくてもよいことを指定してよい。存在しない場合には、ｖｐｓ＿ａｌｌ＿ｌａｙｅｒｓ＿ｓａｍｅ＿ｎｕｍ＿ｓｕｂｌａｙｅｒｓ＿ｆｌａｇの値は、１に等しいと推測されてよい。

実施形態において、１に等しいｖｐｓ＿ａｌｌ＿ｉｎｄｅｐｅｎｄｅｎｔ＿ｌａｙｅｒｓ＿ｆｌａｇは、ＣＶＳ内の全てのレイヤがインターレイヤ予測を使用せずに独立してコーディングされることを特定してよい。

実施形態において、０に等しいｖｐｓ＿ａｌｌ＿ｉｎｄｅｐｅｎｄｅｎｔ＿ｌａｙｅｒｓ＿ｆｌａｇは、ＣＶＳ内のレイヤの１つ以上がインターレイヤ予測を使用し得ることを特定してよい。存在しない場合には、ｖｐｓ＿ａｌｌ＿ｉｎｄｅｐｅｎｄｅｎｔ＿ｌａｙｅｒｓ＿ｆｌａｇは、１に等しいと推測されてよい。

実施形態において、ｖｐｓ＿ｌａｙｅｒ＿ｉｄ［ｉ］は、ｉ番目のレイヤのｎｕｈ＿ｌａｙｅｒ＿ｉｄ値を指定してよい。ｍ及びｎのいずれか２つの非負整数値について、ｍがｎよりも小さいとき、ｖｐｓ＿ｌａｙｅｒ＿ｉｄ［ｍ］の値は、ｖｐｓ＿ｌａｙｅｒ＿ｉｄ［ｎ］よりも小さくなる。

実施形態において、１に等しいｖｐｓ＿ｉｎｄｅｐｅｎｄｅｎｔ＿ｌａｙｅｒ＿ｆｌａｇ［ｉ］は、インデックスｉを有するレイヤがインターレイヤ予測を使用しないことを特定してよい。０に等しいｖｐｓ＿ｉｎｄｅｐｅｎｄｅｎｔ＿ｌａｙｅｒ＿ｆｌａｇ［ｉ］は、インデックスｉを有するレイヤがインターレイヤ予測を使用してよく、０以上ｉ－１以下の範囲のｊについてのシンタックス要素ｖｐｓ＿ｄｉｒｅｃｔ＿ｒｅｆ＿ｌａｙｅｒ＿ｆｌａｇ［ｉ］［ｊ］がＶＰＳに存在することを特定してよい。存在しない場合には、ｖｐｓ＿ｉｎｄｅｐｅｎｄｅｎｔ＿ｌａｙｅｒ＿ｆｌａｇ［ｉ］の値は、１に等しいと推測されてよい。

実施形態において、０に等しいｖｐｓ＿ｄｉｒｅｃｔ＿ｒｅｆ＿ｌａｙｅｒ＿ｆｌａｇ［ｉ］［ｊ］は、インデックスｊを有するレイヤが、インデックスｉを有するレイヤのための直接参照レイヤでないことを特定してよい。１に等しいｖｐｓ＿ｄｉｒｅｃｔ＿ｒｅｆ＿ｌａｙｅｒ＿ｆｌａｇ［ｉ］［ｊ］は、インデックスｊを有するレイヤが、インデックスｉを有するレイヤのための直接参照レイヤであることを特定してよい。ｖｐｓ＿ｄｉｒｅｃｔ＿ｒｅｆ＿ｌａｙｅｒ＿ｆｌａｇ［ｉ］［ｊ］が、０以上ｖｐｓ＿ｍａｘ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１以下の範囲でｉ及びｊについて存在しない場合には、それは０に等しいと推測されてよい。ｖｐｓ＿ｉｎｄｅｐｅｎｄｅｎｔ＿ｌａｙｅｒ＿ｆｌａｇ［ｉ］が０に等しい場合に、ｖｐｓ＿ｄｉｒｅｃｔ＿ｒｅｆ＿ｌａｙｅｒ＿ｆｌａｇ［ｉ］［ｊ］の値が１に等しいように、０以上ｉ－１以下の範囲で少なくとも１つのｊの値が存在してよい。

変数ＮｕｍＤｉｒｅｃｔＲｅｆＬａｙｅｒｓ［ｉ］、ＤｉｒｅｃｔＲｅｆＬａｙｅｒＩｄｘ［ｉ］［ｄ］、ＮｕｍＲｅｆＬａｙｅｒｓ［ｉ］、ＲｅｆＬａｙｅｒＩｄｘ［ｉ］［ｒ］、及びＬａｙｅｒＵｓｅｄＡｓＲｅｆＬａｙｅｒＦｌａｇ［ｊ］は、次のように導出されてよい：

ｖｐｓ＿ｌａｙｅｒ＿ｉｄ［ｉ］に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するレイヤのレイヤインデックスを指定する変数ＧｅｎｅｒａｌＬａｙｅｒＩｄｘ［ｉ］は、次のように、導出されてよい：

ｉ及びｊのいずれか２つの異なる値について、いずれも０以上ｖｐｓ＿ｍａｘ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１以下の範囲をとり、ｄｅｐｅｎｄｅｎｃｙＦｌａｇ［ｉ］［ｊ］が１に等しいとき、ｉ番目のレイヤに適用するｃｈｒｏｍａ＿ｆｏｍａｒｔ＿ｉｄｃ及びｂｉｔ＿ｄｅｐｔｈ＿ｍｉｎｕｓ８の値は夫々、ｊ番目のレイヤに適用するｃｈｒｏｍａ＿ｆｏｍａｒｔ＿ｉｄｃ及びｂｉｔ＿ｄｅｐｔｈ＿ｍｉｎｕｓ８の値に等しくなることが、ビットストリームコンフォーマンスの要件であってよい。

１に等しいｍａｘ＿ｔｉｄ＿ｒｅｆ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］は、シンタックス要素ｍａｘ＿ｔｉｄ＿ｉｌ＿ｒｅｆ＿ｐｉｃｓ＿ｐｌａｓ１［ｉ］が存在することを特定してよい。０に等しいｍａｘ＿ｔｉｄ＿ｒｅｆ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］は、シンタックス要素ｍａｘ＿ｔｉｄ＿ｉｌ＿ｒｅｆ＿ｐｉｃｓ＿ｐｌａｓ１［ｉ］が存在しないことを特定してよい。

０に等しいｍａｘ＿ｔｉｄ＿ｉｌ＿ｒｅｆ＿ｐｉｃｓ＿ｐｌｕｓ１［ｉ］は、インターレイヤ予測がｉ番目のレイヤの非ＩＲＡＰピクチャによって使用されないことを特定してよい。０よりも大きいｍａｘ＿ｔｉｄ＿ｉｌ＿ｒｅｆ＿ｐｉｃｓ＿ｐｌｕｓ１［ｉ］は、ｉ番目のレイヤのピクチャをデコードするために、ｍａｘ＿ｔｉｄ＿ｉｌ＿ｒｅｆ＿ｐｉｃｓ＿ｐｌｕｓ１［ｉ］－１よりも大きいＴｅｍｐｏｒａｌＩＤを有するピクチャがＩＬＲＰとして使用されないことを特定してよい。存在しない場合には、ｍａｘ＿ｔｉｄ＿ｉｌ＿ｒｅｆ＿ｐｉｃｓ＿ｐｌｕｓ１［ｉ］の値は、７に等しいと推測されてよい。

１に等しいｅａｃｈ＿ｌａｙｅｒ＿ｉｓ＿ａｎ＿ｏｌｓ＿ｆｌａｇは、各ＯＬＳがただ１つのレイヤを含み、ＶＰＳを参照するＣＶＳ内の各レイヤ自体がＯＬＳであって、含まれている１つのレイヤが唯一の出力レイヤであることを特定してよい。０に等しいｅａｃｈ＿ｌａｙｅｒ＿ｉｓ＿ａｎ＿ｏｌｓ＿ｆｌａｇは、ＯＬＳが１つよりも多いレイヤを含み得ることを特定してよい。ｖｐｓ＿ｍａｘ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１が０に等しい場合に、ｅａｃｈ＿ｌａｙｅｒ＿ｉｓ＿ａｎ＿ｏｌｓ＿ｆｌａｇの値は、１に等しいと推測されてよい。そうでない場合には、ｖｐｓ＿ａｌｌ＿ｉｎｄｅｐｅｎｄｅｎｔ＿ｌａｙｅｒｓ＿ｆｌａｇが０に等しいとき、ｅａｃｈ＿ｌａｙｅｒ＿ｉｓ＿ａｎ＿ｏｌｓ＿ｆｌａｇの値は、０に等しいと推測されてよい。

０に等しいｏｌｓ＿ｍｏｄｅ＿ｉｄｃは、ＶＰＳによって指定されているＯＬＳの総数がｖｐｓ＿ｍａｘ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１＋１に等しく、ｉ番目のＯＬＳが０以上ｉ以下のレイヤインデックスを有するレイヤを含み、ＯＬＳごとに、ＯＬＳ内の最高レイヤのみが出力されることを特定してよい。

１に等しいｏｌｓ＿ｍｏｄｅ＿ｉｄｃは、ＶＰＳによって指定されているＯＬＳの総数がｖｐｓ＿ｍａｘ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１＋１に等しく、ｉ番目のＯＬＳが０以上ｉ以下のレイヤインデックスを有するレイヤを含み、ＯＬＳごとに、ＯＬＳ内の全てのレイヤが出力されることを特定してよい。

２に等しいｏｌｓ＿ｍｏｄｅ＿ｉｄｃは、ＶＰＳによって指定されているＯＬＳの総数が明示的にシグナリングされ、ＯＬＳごとに、出力レイヤが明示的にシグナリングされ、他のレイヤが、ＯＬＳの出力レイヤの直接又は間接参照レイヤであるレイヤであることを特定してよい。

ｏｌｓ＿ｍｏｄｅ＿ｉｄｃの値は、０以上２以下の範囲をとってよい。ｏｌｓ＿ｍｏｄｅ＿ｉｄｃの値３は、ＩＴＵ－Ｔ｜ＩＳＯ／ＩＥＣによる将来の使用のためにリザーブされる。

ｖｐｓ＿ａｌｌ＿ｉｎｄｅｐｅｎｄｅｎｔ＿ｌａｙｅｒｓ＿ｆｌａｇが１に等しく、ｅａｃｈ＿ｌａｙｅｒ＿ｉｓ＿ａｎ＿ｏｌｓ＿ｆｌａｇが０に等しい場合に、ｏｌｓ＿ｍｏｄｅ＿ｉｄｃの値は、２に等しいと推測されてよい。

ｎｕｍ＿ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｓｅｔｓ＿ｍｉｎｕｓ１ｐｌｕｓ１は、ｏｌｓ＿ｍｏｄｅ＿ｉｄｃが２に等しいときにＶＰＳによって指定されるＯＬＳの総数を特定してよい。

ＶＰＳによって指定されているＯＬＳを指定する変数ＴｏｔａｌＮｕｍＯｌｓｓは、次のように導出されてよい：

１に等しいｏｌｓ＿ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｆｌａｇ［ｉ］［ｊ］は、ｖｐｓ＿ｌａｙｅｒ＿ｉｄ［ｊ］に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するレイヤが、ｏｌｓ＿ｍｏｄｅ＿ｉｄｃが２に等しいときにｉ番目のＯＬＳの出力レイヤであることを特定してよい。０に等しいｏｌｓ＿ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｆｌａｇ［ｉ］［ｊ］は、ｖｐｓ＿ｌａｙｅｒ＿ｉｄ［ｊ］に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するレイヤが、ｏｌｓ＿ｍｏｄｅ＿ｉｄｃが２に等しいときにｉ番目のＯＬＳの出力レイヤではないことを特定してよい。

ｉ番目のＯＬＳにおける出力レイヤの数を指定する変数ＮｕｍＯｕｔｐｕｔＬａｙｅｒｓＩｎＯｌｓ［ｉ］、ｉ番目のＯＬＳにおけるｊ番目のレイヤ内のサブレイヤの数を指定する変数ＮｕｍＳｕｂＬａｙｅｒｓＩｎＬａｙｅｒＩｎＯＬＳ［ｉ］［ｊ］、ｉ番目のＯＬＳにおけるｊ番目の出力レイヤのｎｕｈ＿ｌａｙｅｒ＿ｉｄ値を指定する変数ＯｕｔｐｕｔＬａｙｅｒＩｄＩｎＯｌｓ［ｉ］［ｊ］、及びｋ番目のレイヤが少なくとも１つのＯＬＳで出力レイヤとして使用されるかどうかを指定する変数ＬａｙｅｒＵｓｅｄＡｓＯｕｔｐｕｔＬａｙｅｒＦｌａｇ［ｋ］は、次のように導出されてよい：

０以上ｖｐｓ＿ｍａｘ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１以下の範囲のｉの各値について、ＬａｙｅｒＵｓｅｄＡｓＲｅｆＬａｙｅｒＦｌａｇ［ｉ］及びＬａｙｅｒＵｓｅｄＡｓＯｕｔｐｕｔＬａｙｅｒＦｌａｇ［ｉ］の値は、両方とも０に等しくなくてもよい。すなわち、少なくとも１つのＯＬＳの出力レイヤでも、いずれかの他のレイヤの直接参照レイヤでもないレイヤは存在し得ない。

ＯＬＳごとに、出力レイヤである少なくとも１つのレイヤが存在し得る。すなわち、０以上ＴｏｔａｌＮｕｍＯｌｓｓ－１以下の範囲のｉの如何なる値についても、ＮｕｍＯｕｔｐｕｔＬａｙｅｒｓＩｎＯｌｓ［ｉ］の値は０以上であってよい。

ｉ番目のＯＬＳにおけるレイヤの数を指定する変数ＮｕｍＬａｙｅｒｓＩｎＯｌｓ［ｉ］、及びｉ番目のＯＬＳにおけるｊ番のレイヤのｎｕｈ＿ｌａｙｅｒ＿ｉｄ値を指定する変数ＬａｙｅｒＩｄＩｎＯｌｓ［ｉ］［ｊ］は、次のように導出されてよい：

ＬａｙｅｒＩｄＩｎＯｌｓ［ｉ］［ｊ］に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するレイヤのＯＬＳレイヤインデックスを指定する変数ＯｌｓＬａｙｅｒＩｄｘ［ｉ］［ｊ］は、次のように導出される。

各ＯＬＳにおける最下レイヤは、独立レイヤであってよい。すなわち、０以上ＴｏｔａｌＮｕｍＯｌｓｓ－１以下の範囲内の各ｉについて、ｖｐｓ＿ｉｎｄｅｐｅｎｄｅｎｔ＿ｌａｙｅｒ＿ｆｌａｇ［ＧｅｎｅｒａｌＬａｙｅｒＩｄｘ［ＬａｙｅｒＩｄＩｎＯｌｓ［ｉ］［ｊ］］］の値は１に等しくなる。

各レイヤは、ＶＰＳによって指定されている少なくとも１つのＯＬＳに含まれてよい。すなわち、０以上ｖｐｓ＿ｍａｘ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１以下の範囲をとるｋについてのｖｐｓ＿ｌａｙｅｒ＿ｉｄ［ｋ］の１つに等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄの特定の値ｎｕｈＬａｙｅｒＩｄを有する各レイヤについて、ｉ及びｊの少なくとも一対の値が存在してよく、ここで、ｉは、０以上ＴｏｔａｌＮｕｍＯｌｓｓ－１以下の範囲をとり、ｊは、０以上ＮｕｍＬａｙｅｒｓＩｎＯｌｓ［ｉ］－１以下の範囲をとり、それにより、ＬａｙｅｒＩｄＩｎＯｌｓ［ｉ］［ｊ］の値はｎｕｈＬａｙｅｒＩｄに等しい。

実施形態において、デコーディングプロセスは、現在のピクチャＣｕｔｔＰｉｃについて、次のように作動してよい：
－ＰｉｃｔｕｒｅＯｕｔｐｕｔＦｌａｇは、次のようにセットされてよい：
－次の条件の１つが真である場合に、ＰｉｃｔｕｒｅＯｕｔｐｕｔＦｌａｇは、０に等しくセットされてよい：
－現在のピクチャがＲＡＳＬであり、関連するＩＲＡＰピクチャのＮｏＯｕｔｐｕｔＢｅｆｏｒｅＲｅｃｏｖｅｒｙＦｌａｇが１に等しい。
－ｇｄｒ＿ｅｎａｂｌｅｄ＿ｆｌａｇが１に等しく、現在のピクチャが、１に等しいＮｏＯｕｔｐｕｔＢｅｆｏｒｅＲｅｃｏｖｅｒｙＦｌａｇを有するＧＤＲピクチャである。
－ｇｄｒ＿ｅｎａｂｌｅｄ＿ｆｌａｇが１に等しく、現在のピクチャが、１に等しいＮｏＯｕｔｐｕｔＢｅｆｏｒｅＲｅｃｏｖｅｒｙＦｌａｇを有するＧＤＲピクチャに関連し、現在のピクチャのＰｉｃＯｒｄｅｒＣｎｔＶａｌが、関連するＧＤＲピクチャのＲｐＰｉｃＯｒｄｅｒＣｎｔＶａｌよりも小さい。
－ｓｐｓ＿ｖｉｄｅｏ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄが０よりも大きく、ｏｌｓ＿ｍｏｄｅ＿ｉｄｃが０に等しく、現在のＡＵが、次の条件の全てを満足するピクチャＰｉｃＡを含む：
－ＰｉｃＡが、１に等しいＰｉｃｔｕｒｅＯｕｔｐｕｔＦｌａｇを有する。
－ＰｉｃＡが、現在のピクチャのそれよりも大きいｎｕｈ＿ｌａｙｅｒ＿ｉｄｎｕｈＬｉｄを有する。
－ＰｉｃＡが、ＯＬＳの出力レイヤに属する（すなわち、ＯｕｔｐｕｔＬａｙｅｒＩｄＩｎＯｌｓ［ＴａｒｇｅｔＯｌｓＩｄｘ］［０］がｎｕｈＬｉｄに等しい）。
－ｓｐｓ＿ｖｉｄｅｏ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄが０よりも大きく、ｏｌｓ＿ｍｏｄｅ＿ｉｄｃが２に等しく、ｏｌｓ＿ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｆｌａｇ［ＴａｒｇｅｔＯｌｓＩｄｘ］［ＧｅｎｅｒａｌＬａｙｅｒＩｄｘ［ｎｕｈ＿ｌａｙｅｒ＿ｉｄ］］が０に等しい。
－真である条件がない場合には、ＰｉｃｔｕｒｅＯｕｔｐｕｔＦｌａｇは、ｐｉｃ＿ｏｕｔｐｕｔ＿ｆｌａｇに等しくセットされてよい。

現在のピクチャの全スライスがデコードされた後、現在のデコードされたピクチャは、「短期参照用に使用」とマークされ、ＲｅｆＰｉｃＬｉｓｔ［０］又はＲｅｆＰｉｃＬｉｓｔ［１］内の各ＩＬＲＰエントリは、「短期参照用に使用」とマークされる。

実施形態において、各レイヤが出力レイヤセットである場合に、ＰｉｃｔｕｒｅＯｕｔｐｕｔＦｌａｇは、ｏｌｓ＿ｍｏｄｅ＿ｉｄｃの値にかかわらず、ｐｉｃ＿ｏｕｔｐｕｔ＿ｆｌａｇに等しくセットされてよい。

実施形態において、ＰｉｃｔｕｒｅＯｕｔｐｕｔＦｌａｇは、ｓｐｓ＿ｖｉｄｅｏ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄが０よりも大きく、ｅａｃｈ＿ｌａｙｅｒ＿ｉｓ＿ａｎ＿ｏｌｓ＿ｆｌａｇが０に等しく、ｏｌｓ＿ｍｏｄｅ＿ｉｄｃが０に等しく、現在のＡＵが、次の条件：
ＰｉｃＡが、１に等しいＰｉｃｔｕｒｅＯｕｔｐｕｔＦｌａｇを有する、
ＰｉｃＡが、現在のピクチャのそれよりも大きいｎｕｈ＿ｌａｙｅｒ＿ｉｄｎｕｈＬｉｄを有する、
ＰｉｃＡが、ＯＬＳの出力レイヤに属する（すなわち、ＯｕｔｐｕｔＬａｙｅｒＩｄＩｎＯｌｓ［ＴａｒｇｅｔＯｌｓＩｄｘ］［０］がｎｕｈＬｉｄに等しい）
の全てを満足するピクチャＰｉｃＡを含む場合に、０に等しくセットされてよい。

実施形態において、ＰｉｃｔｕｒｅＯｕｔｐｕｔＦｌａｇは、ｓｐｓ＿ｖｉｄｅｏ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄが０よりも大きく、ｅａｃｈ＿ｌａｙｅｒ＿ｉｓ＿ａｎ＿ｏｌｓ＿ｆｌａｇが０に等しく、ｏｌｓ＿ｍｏｄｅ＿ｉｄｃが２に等しく、ｏｌｓ＿ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｆｌａｇ［ＴａｒｇｅｔＯｌｓＩｄｘ］［ＧｅｎｅｒａｌＬａｙｅｒＩｄｘ［ｎｕｈ＿ｌａｙｅｒ＿ｉｄ］］が０に等しい場合に、０に等しくセットされてよい。

参照ピクチャリサンプリングは、コーディングされた（階層化された）ビデオシーケンス内の適応解像度変更と、同じ出力レイヤセットに属するレイヤ間の依存関係を有するレイヤにわたる空間スケーラビリティとを有効にしてよい。

実施形態において、図２３に示されるように、ｓｐｓ＿ｒｅｆ＿ｐｉｃ＿ｒｅｓａｍｐｌｉｎｇ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、パラメータセット（例えば、シーケンスパラメータセット）でシグナリングされる、フラグｓｐｓ＿ｒｅｆ＿ｐｉｃ＿ｒｅｓａｍｐｌｉｎｇ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、参照ピクチャリサンプリングが、ＳＰＳを参照するコーディングされたビデオシーケンス内の適応解像度変更、又はレイヤにわたる空間スケーラビリティのために使用されるか否かを示してよい。１に等しいｓｐｓ＿ｒｅｆ＿ｐｉｃ＿ｒｅｓａｍｐｌｉｎｇ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、参照ピクチャリサンプリングが有効にされ、ＣＬＶＳ内のピクチャの１つ以上のスライスが参照ピクチャリストのアクティブエントリ内の異なる空間分解能を有する参照ピクチャを参照することを特定してよい。０に等しいｓｐｓ＿ｒｅｆ＿ｐｉｃ＿ｒｅｓａｍｐｌｉｎｇ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、参照ピクチャリサンプリングが無効にされ、ＣＬＶＳ内のピクチャのスライスが参照ピクチャリストのアクティブエントリ内の異なる空間分解能を有する参照ピクチャを参照しないことを特定してよい。

実施形態において、ｓｐｓ＿ｒｅｆ＿ｐｉｃ＿ｒｅｓａｍｐｌｉｎｇ＿ｅｎａｂｌｅｄ＿ｆｌａｇが１に等しい場合に、現在のピクチャについて、異なる空間分解能を有する参照ピクチャは、現在のピクチャを含むレイヤと同じレイヤ又は異なったレイヤのどちらかに属する。

他の実施形態では、１に等しいｓｐｓ＿ｒｅｆ＿ｐｉｃ＿ｒｅｓａｍｐｌｉｎｇ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、参照ピクチャリサンプリングが有効にされ、ＣＬＶＳ内のピクチャの１つ以上のスライスが参照ピクチャリストのアクティブエントリ内の異なる空間分解能又は異なるスケーリングウィンドウを有する参照ピクチャを参照することを特定してもよい。０に等しいｓｐｓ＿ｒｅｆ＿ｐｉｃ＿ｒｅｓａｍｐｌｉｎｇ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、参照ピクチャリサンプリングが無効にされ、ＣＬＶＳ内のピクチャのスライスが参照ピクチャリストのアクティブエントリ内の異なる空間分解能又は異なるスケーリングウィンドウを有する参照ピクチャを参照しないことを特定してもよい。

実施形態において、ｓｐｓ＿ｒｅｆ＿ｐｉｃ＿ｒｅｓａｍｐｌｉｎｇ＿ｅｎａｂｌｅｄ＿ｆｌａｇが１に等しい場合に、現在のピクチャについて、異なる空間分解能又は異なるスケーリングウィンドウを有する参照ピクチャは、現在のピクチャを含むレイヤと同じレイヤ又は異なったレイヤのどちらかに属する。

実施形態において、ｓｐｓ＿ｒｅｓ＿ｃｈａｎｇｅ＿ｉｎ＿ｃｌｖｓ＿ａｌｌｏｗｅｄ＿ｆｌａｇは、ピクチャ解像度がＣＬＶＳ又はＣＶＳ内で変化するか否かを示してよい。１に等しいｓｐｓ＿ｒｅｓ＿ｃｈａｎｇｅ＿ｉｎ＿ｃｌｖｓ＿ａｌｌｏｗｅｄ＿ｆｌａｇは、ピクチャ空間分解能が、ＳＰＳを参照するＣＬＶＳ内で変化し得ることを特定してよい。０に等しいｓｐｓ＿ｒｅｓ＿ｃｈａｎｇｅ＿ｉｎ＿ｃｌｖｓ＿ａｌｌｏｗｅｄ＿ｆｌａｇは、ピクチャ空間分解能が、ＳＰＳを参照する如何なるＣＬＶＳ内でも変化しないことを特定してよい。存在しない場合には、ｓｐｓ＿ｒｅｓ＿ｃｈａｎｇｅ＿ｉｎ＿ｃｌｖｓ＿ａｌｌｏｗｅｄ＿ｆｌａｇの値は、０に等しいと推測されてよい。

実施形態において、ｓｐｓ＿ｒｅｆ＿ｐｉｃ＿ｒｅｓａｍｐｌｉｎｇ＿ｅｎａｂｌｅｄ＿ｆｌａｇが１に等しく、ｓｐｓ＿ｒｅｓ＿ｃｈａｎｇｅ＿ｉｎ＿ｃｌｖｓ＿ａｌｌｏｗｅｄ＿ｆｌａｇが０に等しい場合に、参照ピクチャリサンプリングは、空間スケーラビリティのためにのみ使用され、ＣＬＶＳ内の適応解像度変更のためには使用され得ない。

実施形態において、ｓｐｓ＿ｒｅｆ＿ｐｉｃ＿ｒｅｓａｍｐｌｉｎｇ＿ｅｎａｂｌｅｄ＿ｆｌａｇが１に等しく、ｓｐｓ＿ｒｅｓ＿ｃｈａｎｇｅ＿ｉｎ＿ｃｌｖｓ＿ａｌｌｏｗｅｄ＿ｆｌａｇが１に等しい場合に、参照ピクチャリサンプリングは、空間スケーラビリティ及びＣＬＶＳ内の適応解像度変更の両方のために使用されてよい。

ｓｐｓ＿ｒｅｆ＿ｐｉｃ＿ｒｅｓａｍｐｌｉｎｇ＿ｅｎａｂｌｅｄ＿ｆｌａｇが１に等しく、ｓｐｓ＿ｒｅｓ＿ｃｈａｎｇｅ＿ｉｎ＿ｃｌｖｓ＿ａｌｌｏｗｅｄ＿ｆｌａｇが０に等しく、ｓｐｓ＿ｖｉｄｅｏ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄが０に等しい場合に、ｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎｄｏｗ＿ｅｘｐｌｉｃｉｔ＿ｓｉｇｎａｌｌｉｎｇ＿ｆｌａｇは１に等しくなる。それは、ピクチャ解像度がＣＬＶＳ又はＣＶＳ内で一定であって、参照ピクチャリサンプリングが使用される場合に、スケーリングウィンドウパラメータが、適合ウィンドウパラメータから値を推測するのではなく、明示的にシグナリングされる必要があることを意味する。

実施形態において、ｓｐｓ＿ｖｉｒｔｕａｌ＿ｂｏｕｎｄａｒｉｅｓ＿ｐｒｅｓｅｎｔ＿ｆｌａｇは、図２３に示されるように、ＳＰＳでシグナリングされる。フラグｓｐｓ＿ｖｉｒｔｕａｌ＿ｂｏｕｎｄａｒｉｅｓ＿ｐｒｅｓｅｎｔ＿ｆｌａｇは、仮想境界情報がＳＰＳでシグナリングされるか否かを示してよい。

実施形態において、ｓｐｓ＿ｖｉｒｔｕａｌ＿ｂｏｕｎｄａｒｉｅｓ＿ｐｒｅｓｅｎｔ＿ｆｌａｇは、ｓｐｓ＿ｒｅｓ＿ｃｈａｎｇｅ＿ｉｎ＿ｃｌｖｓ＿ａｌｌｏｗｅｄ＿ｆｌａｇが０に等しい場合にのみ、条件付きでシグナリングされる。これは、参照ピクチャリサンプリングが使用される場合に、仮想境界情報はＳＰＳでシグナリングされないことがあるからである。

実施形態において、１に等しいｓｐｓ＿ｖｉｒｔｕａｌ＿ｂｏｕｎｄａｒｉｅｓ＿ｐｒｅｓｅｎｔ＿ｆｌａｇは、仮想境界の情報がＳＰＳでシグナリングされることを特定して良い。０に等しいｓｐｓ＿ｖｉｒｔｕａｌ＿ｂｏｕｎｄａｒｉｅｓ＿ｐｒｅｓｅｎｔ＿ｆｌａｇは、仮想境界の情報がＳＰＳでシグナリングされないことを特定してよい。ＳＰＳでシグナリングされる１つ又は１つよりも多い仮想境界が存在する場合に、インループフィルタリング動作は、ＳＰＳを参照するピクチャにおいて仮想境界間で無効にされる。インループフィルタリング動作は、デブロッキングフィルタ、サンプル適応オフセットフィルタ、及び適応ループフィルタ動作を含む。存在しない場合には、ｓｐｓ＿ｖｉｒｔｕａｌ＿ｂｏｕｎｄａｒｉｅｓ＿ｐｒｅｓｅｎｔ＿ｆｌａｇの値は、０に等しいと推測されてよい。

実施形態において、ｓｐｓ＿ｓｕｂｐｉｃ＿ｉｎｆｏ＿ｐｒｅｓｅｎｔ＿ｆｌａｇは、図２３に示されるように、ＳＰＳでシグナリングされる。フラグｓｐｓ＿ｓｕｂｐｉｃ＿ｉｎｆｏ＿ｐｒｅｓｅｎｔ＿ｆｌａｇは、サブピクチャパーティショニング情報がＳＰＳでシグナリングされるか否かを示してよい。

実施形態において、ｓｐｓ＿ｓｕｂｐｉｃ＿ｉｎｆｏ＿ｐｒｅｓｅｎｔ＿ｆｌａｇは、ｓｐｓ＿ｒｅｓ＿ｃｈａｎｇｅ＿ｉｎ＿ｃｌｖｓ＿ａｌｌｏｗｅｄ＿ｆｌａｇが０に等しい場合にのみ、条件付きでシグナリングされる。これは、参照ピクチャリサンプリングが使用される場合に、サブピクチャパーティショニング情報がＳＰＳでシグナリングされないことがあるからである。

実施形態において、１に等しいｓｐｓ＿ｓｕｂｐｉｃ＿ｉｎｆｏ＿ｐｒｅｓｅｎｔ＿ｆｌａｇは、サブピクチャ情報がＣＬＶＳについて存在し、ＣＬＶＳの各ピクチャに１つ又は１つよりも多いサブピクチャが存在し得ることを特定してよい。０に等しいｓｐｓ＿ｓｕｂｐｉｃ＿ｉｎｆｏ＿ｐｒｅｓｅｎｔ＿ｆｌａｇは、サブピクチャ情報がＣＬＶＳについて存在せず、ＣＬＶＳの各ピクチャに１つしかサブピクチャが存在しないことを特定してよい。存在しない場合には、ｓｐｓ＿ｓｕｂｐｉｃ＿ｉｎｆｏ＿ｐｒｅｓｅｎｔ＿ｆｌａｇの値は、０に等しいと推測されてよい。

実施形態において、ｐｐｓ＿ｒｅｓ＿ｃｈａｎｇｅ＿ｉｎ＿ｃｌｖｓ＿ａｌｌｏｗｅｄ＿ｆｌａｇは、図２４に示されるように、ＰＰＳでシグナリングされてよい。ＰＰＳにおけるｐｐｓ＿ｒｅｓ＿ｃｈａｎｇｅ＿ｉｎ＿ｃｌｖｓ＿ａｌｌｏｗｅｄ＿ｆｌａｇの値は、ＰＰＳが参照するＳＰＳにおけるｓｐｓ＿ｒｅｓ＿ｃｈａｎｇｅ＿ｉｎ＿ｃｌｖｓ＿ａｌｌｏｗｅｄ＿ｆｌａｇの値に等しくてよい。

実施形態において、ピクチャ幅及び高さ情報は、ｐｐｓ＿ｒｅｓ＿ｃｈａｎｇｅ＿ｉｎ＿ｃｌｖｓ＿ａｌｌｏｗｅｄ＿ｆｌａｇが１に等しい場合にのみ、ＰＰＳでシグナリングされてよい。ｐｐｓ＿ｒｅｓ＿ｃｈａｎｇｅ＿ｉｎ＿ｃｌｖｓ＿ａｌｌｏｗｅｄ＿ｆｌａｇが０に等しい場合に、ピクチャの幅及び高さの値は、ＳＰＳでシグナリングされたピクチャの幅及び高さの最大値に等しいと推測される。

実施形態において、ｐｐｓ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓは、ルーマサンプルのユニットでＰＰＳを参照する各デコードされたピクチャの幅を指定してよい。ｐｐｓ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓは、０に等しいはずはなく、Ｍａｘ（８，ＭｉｎＣｂＳｉｚｅＹ）の整数倍であるべきであり、ｓｐｓ＿ｐｉｃ＿ｗｉｄｔｈ＿ｍａｘ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ以下であるべきである。存在しない場合には、ｐｐｓ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓの値は、ｓｐｓ＿ｐｉｃ＿ｗｉｄｔｈ＿ｍａｘ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓに等しいと推測されてよい。ｓｐｓ＿ｒｅｆ＿ｗｒａｐａｒｏｕｎｄ＿ｅｎａｂｌｅｄ＿ｆｌａｇが１に等しい場合に、（ＣｔｂＳｉｚｅＹ／ＭｉｎＣｂＳｉｚｅＹ＋１）の値は、（ｐｐｓ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ／ＭｉｎＣｂＳｉｚｅＹ－１）の値以下であるべきである、ｐｐｓ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓは、ルーマサンプルのユニットでＰＰＳを参照する各デコードされたピクチャの高さを特定してよい。ｐｐｓ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓは、０に等しいはずはなく、Ｍａｘ（８，ＭｉｎＣｂＳｉｚｅＹ）の整数倍であるべきであり、ｓｐｓ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｍａｘ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ以下であるべきである。存在しない場合には、ｐｐｓ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓの値は、ｓｐｓ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｍａｘ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓに等しいと推測されてよい。

図２５Ａ～２５Ｃは、エンコードされたビデオビットストリームをデコードするための例となるプロセス２５００Ａ、２５００Ｂ、及び２５００Ｃを表すフローチャートである。いくつかの実施で、図２５Ａ～２５Ｃの１つ以上のプロセスブロックは、デコーダ２１０によって実行されてよい。いくつかの実施で、図２５Ａ～２５Ｃの１つ以上のプロセスブロックは、エンコーダ２０３などの、他のデバイス又はデコーダ２１０とは別の若しくはデコーダ２１０を含むデバイスのグループによって実行されてよい。

図２５Ａに示されるように、プロセス２５００Ａは、参照ピクチャリサンプリングがコーディングされたビデオシーケンス（ＣＶＳ）に対して有効にされることを示す第１フラグを、エンコードされたビデオビットストリームから取得すること（ブロック２５１１）を含んでよい。実施形態において、第１フラグは、ｓｐｓ＿ｒｅｆ＿ｐｉｃ＿ｒｅｓａｍｐｌｉｎｇ＿ｅｎａｂｌｅｄ＿ｆｌａｇに対応してよい。

図２５Ａに更に示されるように、プロセス２５００Ａは、ピクチャ解像度がＣＶＳで変更されるかどうかを示す第２フラグの値を決定すること（ブロック２５１２）を含んでもよい。実施形態において、第２フラグは、ｓｐｓ＿ｒｅｓ＿ｃｈａｎｇｅ＿ｉｎ＿ｃｌｖｓ＿ａｌｌｏｗｅｄ＿ｆｌａｇに対応してよい。

図２５Ａに更に示されるように、プロセス２５００Ａは、第２フラグの値が、ピクチャ解像度がＣＶＳで変更されるかどうかを示しているかどうかを決定すること（ブロック２５１３）を含んでもよい。

図２５Ａに更に示されるように、プロセス２５００Ａは、ピクチャ解像度がＣＶＳで変更されることを示す第２フラグの値に基づいて（ブロック２５１３でＹＥＳ）、空間スケーラビリティ及び適応解像度変更（ＡＲＣ）のために参照ピクチャリサンプリングを使用してＣＶＳをデコードすること（ブロック２５１５）を含んでもよい。

図２５Ｂに示されるように、プロセス２５００Ｂは、第２フラグの値が、ピクチャ解像度がＣＶＳで変更されるかどうかを示しているかどうかを決定すること（ブロック２５２３）を含んでもよい。実施形態において、プロセス２５００Ｂのブロック２５２３は、プロセス２５００Ａのブロック２５１３に対応してよい。

図２５Ｂに更に示されるように、プロセス２５００Ｂは、ピクチャ解像度がＣＶＳで変更されないことを示す第２フラグの値に基づいて（ブロック２５２３でＮＯ）、仮想境界情報がシグナリングされるかどうかを示す第３フラグを取得すること（ブロック２５２５）を含んでもよい。実施形態において、第３フラグは、ｓｐｓ＿ｖｉｒｔｕａｌ＿ｂｏｕｎｄａｒｉｅｓ＿ｐｒｅｓｅｎｔ＿ｆｌａｇに対応してよい。

図２５Ｂに更に示されるように、プロセス２５００Ｂは、ピクチャ解像度がＣＶＳで変更されることを示す第２フラグの値に基づいて（ブロック２５２３でＹＥＳ）、第３フラグがシグナリングされなくてもよいこと（ブロック２５２４）を含んでもよい。

図２５Ｃに示されるように、プロセス２５００Ｃは、第２フラグの値が、ピクチャ解像度がＣＶＳで変更されるかどうかを示しているかどうかを決定すること（ブロック２５３３）を含んでもよい。実施形態において、プロセス２５００Ｃのブロック２５３３は、プロセス２５００Ａのブロック２５１３に対応してよい。

図２５Ｃに更に示されるように、プロセス２５００Ｃは、ピクチャ解像度がＣＶＳで変更されないことを示す第２フラグの値に基づいて（ブロック２５３３でＮＯ）、サブピクチャパーティショニング情報がシグナリングされるかどうかを示す第４フラグを取得すること（ブロック２５３５）を含んでもよい。実施形態において、第４フラグは、ｓｐｓ＿ｓｕｂｐｉｃ＿ｉｎｆｏ＿ｐｒｅｓｅｎｔ＿ｆｌａｇに対応してよい。

図２５Ｃに更に示されるように、プロセス２５００Ｃは、ピクチャ解像度がＣＶＳで変更されることを示す第２フラグの値に基づいて（ブロック２５３３でＹＥＳ）、第４フラグがシグナリングされなくてもよいこと（ブロック２５３４）を含んでもよい。

実施形態において、プロセス２５００Ａ、２５００Ｂ、及び２５００Ｃの１つ以上のブロックは、如何なる順序でも組み合わされてよい。更に、図２５Ａ～２５Ｃは、プロセス２５００Ａ、２５００Ｂ、及び２５００Ｃのブロックの例を示すが、いくつかの実施で、プロセス２５００Ａ、２５００Ｂ、及び２５００Ｃは、図２５Ａ～２５Ｃに表されているものに比較して、追加のブロック、より少ないブロック、異なったブロック、別なふうに配置されたブロックを含んでもよい。追加的に、又は代替的に、プロセス２５００Ａ、２５００Ｂ、及び２５００Ｃのブロックの２つ以上は、並行して実行されてもよい。

更に、提案されている方法は、プロセッシング回路（例えば、１つ以上のプロセッサ又は１つ以上の集積回路）によって実装されてもよい。一例で、１つ以上のプロセッサは、提案されている方法の１つ以上を実行するよう、非一時的なコンピュータ可読媒体に記憶されているプログラムを実行する。

上記の技術は、コンピュータ読み出し可能な命令を使用しかつ１つ以上のコンピュータ可読媒体に物理的に記憶されているコンピュータソフトウェアとして実装可能である。例えば、図２６は、開示されている対象の特定の実施形態を実装することに適したコンピュータシステム２６００を示す。

コンピュータソフトウェアは、中央演算処理装置（ＣＰＵ）、グラフィクス処理ユニット（ＧＰＵ）などによって直接に又は解釈、ミクロコード実行などを通じて実行され得る命令を含むコードを生成するようにアセンブリ、コンパイル、リンキングなどのメカニズムに従い得る如何なる適切な機械コード又はコンピュータ言語によってもコーディング可能である。

命令は、例えば、パーソナルコンピュータ、タブレットコンピュータ、サーバ、スマートフォン、ゲーム機、モノのインターネット（Internet of Things）のためのデバイス、などを含む様々なタイプのコンピュータ又はその構成要素で実行可能である。

コンピュータシステム２６００に関して図２６に示される構成要素は、本質的に例示であり、本開示の実施形態を実装するコンピュータソフトウェアの使用又は機能の範囲に関して如何なる制限も示唆することを意図しない。構成要素の構成は、コンピュータシステム２６００の例となる実施形態において説明される構成要素のうちのいずれか１つ又は組み合わせに関して何らかの依存性又は要件も有するものとして解釈されるべきではない。

コンピュータシステム２６００は、特定のヒューマンインターフェース入力デバイスを含んでよい。そのようなヒューマンインターフェース入力デバイスは、例えば、触覚入力（例えば、キーボード、スワイプ、データグローブ操作）、音声入力（例えば、声、拍手）、視覚入力（例えば、ジェスチャ）、嗅覚入力（図示せず。）を通じた一人以上のユーザによる入力に反応してよい。ヒューマンインターフェースデバイスはまた、音声（例えば、発話、音楽、周囲音）、画像（例えば、スキャンされた画像、静止画カメラから取得された写真画像）、映像（例えば、二次元映像、立体視映像を含む三次元映像）など、人による意識的な入力に必ずしも直接には関係しない特定のメディアを捕捉するためにも使用され得る。

入力ヒューマンインターフェースデバイスは、キーボード２６０１、マウス２６０２、トラックパッド２６０３、タッチスクリーン２６１０及び関連するグラフィクスアダプタ、データグローブ、ジョイスティック２６０５、マイク２６０６、スキャナ２６０７、カメラ２６０８のうちの１つ以上（夫々表されているもののうちの１つのみ）を含んでよい。

コンピュータシステム２６００は、特定のヒューマンインターフェース出力デバイスも含んでよい。そのようなヒューマンインターフェース出力デバイスは、例えば、触覚出力、音響、光、及び匂い／味を通じて一人以上のユーザの感覚を刺激し得る。そのようなヒューマンインターフェース出力デバイスは、触覚出力デバイス（例えば、タッチスクリーン２６１０、データグローブ、又はジョイスティック２６０５による触覚フィードバック、しかし、入力デバイスとして機能しない触覚フィードバックデバイスも存在し得る。）を含んでよい。例えば、そのようなデバイスは、音声出力デバイス（例えば、スピーカ２６０９、ヘッドホン（図示せず。））、視覚出力デバイス（例えば、夫々タッチスクリーン入力機能の有無によらず、夫々触覚フィードバック機能の有無によらず、ＣＲＴスクリーン、ＬＣＤスクリーン、プラズマスクリーン、ＯＬＥＤスクリーンを含み、それらのうちのいくつかは、立体視出力、仮想現実メガネ（図示せず。）、ホログラフィックディスプレイ及びスモークタンク（図示せず。）などの手段により二次元視覚出力又は三次元よりも多い次元の出力を出力可能なスクリーン２６１０）、及びプリンタ（図示せず。）であってもよい。

コンピュータシステム２６００は、人がアクセス可能なストレージデバイス及びそれらの関連する媒体、例えば、ＣＤ／ＤＶＤ又は同様の媒体２６２１を伴ったＣＤ／ＤＶＤＲＯＭ／ＲＷ２６２０、サムドライブ２６２２、リムーバブルハードディスク又はソリッドステートドライブ２６２３、レガシー磁気媒体、例えば、テープ及びフロッピー（登録商標）ディスク（図示せず。）、専用のＲＯＭ／ＡＳＩＣ／ＰＬＤベースデバイス、例えば、セキュリティドングル（図示せず。）、なども含むことができる。

当業者であれば、目下開示されている対象に関連して使用されている「コンピュータ可読媒体」という用語が、伝送媒体、搬送波、又は他の一時的な信号を含まないことも理解するはずである。

コンピュータシステム２６００はまた、１つ以上の通信ネットワークへのインターフェースも含むことができる。ネットワークは、例えば、ワイヤレス、ワイヤライン、光であることができる。ネットワークは更に、ローカル、ワイドエリア、メトロポリタン、車両及び工業、実時間、遅延耐性、などであることができる。ネットワークの例には、イーサネット（登録商標）などのローカルエリアネットワーク、ワイヤレスＬＡＮ、ＧＳＭ、３Ｇ、４Ｇ、５Ｇ、ＬＴＥなどを含むセルラーネットワーク、ケーブルＴＶ、衛星ＴＶ、及び地上放送ＴＶを含むＴＶワイヤライン又はワイヤレス広域デジタルネットワーク、ＣＡＮバスを含む車両及び工場ネットワーク、などがある。特定のネットワークは、一般に、特定の汎用デジタルポート又はペリフェラルバス２６４９（例えば、コンピュータシステム２６００のＵＳＢポートなど）に取り付けられた外付けネットワークインターフェースアダプタ２６５４を必要とする。他は、一般に、後述されるようなシステムバスへの取り付け（例えば、ＰＣコンピュータシステムへのイーサネットネットワーク、又はスマートフォンコンピュータシステムへのセルラーネットワークインターフェース）によってコンピュータシステム２６００のコアに組み込まれる。例として、ネットワーク２６５５は、ネットワークインターフェース２６５４を用いてペリフェラルバス２６４９へ接続されてよい。これらのネットワークのいずれかを使用して、コンピュータシステム２６００は他のエンティティと通信することができる。そのような通信は、単方向の受信専用（例えば、ブロードキャストＴＶ）又は単方向の送信専用（例えば、特定のＣＡＮバスデバイスへのＣＡＮバス）であることができ、あるいは、例えば、ローカル若しくは広域デジタルネットワークを使用して他のコンピュータシステムに対して双方向であることができる。特定のプロトコル又はプロトコルスタックが、上述されたようなネットワーク及びネットワークインターフェース２６５４の夫々で使用可能である。

上記のヒューマンインターフェースデバイス、人がアクセス可能なストレージデバイス、及びネットワークインターフェースは、コンピュータシステム２６００のコア２６４０へ取り付けられ得る。

コア２６４０は、１つ以上の中央演算処理装置（ＣＰＵ）２６４１、グラフィクス処理ユニット（ＧＰＵ）２６４２、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）２６４３の形をとる専用のプログラム可能処理ユニット、特定のタスクのためのハードウェアアクセラレータ２６４４、などを含むことができる。これらのデバイスは、リードオンリーメモリ（ＲＯＭ）２６４５、ランダムアクセスメモリ（ＲＡＭ）２６４６、内部のユーザアクセス不能ハードドライブなどの内蔵大容量記憶装置、ＳＳＤ、など２６４７とともに、システムバス２６４８を通じて接続されてよい。いくつかのコンピュータシステムでは、システムバス２６４８は、追加のＣＰＵ、ＧＰＵなどによる拡張を可能にするように、１つ以上の物理プラグの形でアクセス可能であることができる。コアのシステムバス２６４８へ直接に又はペリフェラルバス２６４９を通じて、周辺機器が取り付けられ得る。ペリフェラルバスのためのアーキテクチャには、ペリフェラル・コンポーネント・インターコネクト（ＰＣＩ）、ＵＳＢなどがある。

ＣＰＵ２６４１、ＧＰＵ２６４２、ＦＰＧＡ２６４３、及びアクセラレータ２６４４は、組み合わせて上記のコンピュータコードを構成することができる特定の命令を実行可能である。そのコンピュータコードは、ＲＯＭ２６４５又はＲＡＭ２６４６に記憶され得る。一時データもＲＡＭ２６４６に記憶可能であり、一方、永続性データは、例えば、内蔵大容量記憶装置２６４７に記憶可能である。メモリデバイスのいずれかへの高速な格納及び読み出しは、キャッシュメモリの使用により可能にされ得る。キャッシュメモリは、１つ以上のＣＰＵ２６４１、ＧＰＵ２６４２、大容量記憶装置２６４７、ＲＯＭ２６４５、ＲＡＭ２６４６などと密接に関連し得る。

コンピュータ可読媒体は、様々なコンピュータ実装動作を実行するためのコンピュータコードを有することができる。媒体及びコンピュータコードは、本開示の目的のために特別に設計及び構成されたものであることができ、あるいは、それらは、コンピュータソフトウェア技術で通常の知識を有する者によく知られており利用可能である種類のものであることができる。

例として、限定としてではなく、アーキテクチャ２６００、具体的にはコア２６４０を有するコンピュータシステムは、１つ以上の有形なコンピュータ可読媒体において具現されているソフトウェアを実行するプロセッサ（ＣＰＵ、ＧＰＵ、ＦＰＧＡ、アクセラレータ、などを含む。）の結果として機能を提供することができる。そのようなコンピュータ可読媒体は、コア内蔵大容量記憶装置２６４７又はＲＯＭ２６４５などの、非一時的な性質であるコア２６４０の特定の記憶装置に加えて、先に紹介されたユーザアクセス可能な大容量記憶装置に関連した媒体であることができる。本開示の様々な実施形態を実装するソフトウェアは、そのようなデバイスに記憶され、コア２６４０によって実行可能である。コンピュータ可読媒体には、特定のニーズに応じて、１つ以上のメモリデバイス又はチップが含まれ得る。ソフトウェアは、コア２６４０、及び、具体的には、その中のプロセッサ（ＣＰＵ、ＧＰＵ、ＦＰＧＡなどを含む。）に、ＲＡＭ２６４６に記憶されているデータ構造を定義し、ソフトウェアによって定義されたプロセスに従ってそのようなデータ構造を変更することを含め、本明細書で説明されている特定のプロセス又は特定のプロセスの特定の部分を実行させることができる。追加的に、又は代替案として、コンピュータシステムは、本明細書で説明されている特定のプロセス又は特定のプロセスの特定の部分を実行するようにソフトウェアの代わりに又はそれとともに動作することができる、回路内でハードウェアにより実現されるか又は別なふうに具現されるロジック（例えば、アクセラレータ２６４４）の結果として、機能を提供することができる。ソフトウェアへの言及は、必要に応じて、ロジックを包含することができ、その逆も同様である。コンピュータ可読媒体への言及は、必要に応じて、実行のためのソフトウェアを記憶している回路（例えば、集積回路（ＩＣ））、実行のためのロジックを具現する回路、又は両方を包含することができる。本開示は、ハードウェア及びソフトウェアの如何なる適切な組み合わせも包含する。

本開示は、いくつかの例となる実施形態について記載してきたが、本開示の範囲内にある代替、交換、及び様々な置換均等物が存在する。よって、明らかなように、当業者であれば、たとえ本明細書で明示的に図示又は説明されていないとしても、本開示の原理を具現し、よって、その精神及び範囲の中にある多数のシステム及び方法に想到可能である。

Claims

少なくとも１つのプロセッサを用いて、エンコードされたビデオビットストリームをデコードする方法であって、
コーディングされたビデオシーケンス（ＣＶＳ）に対して参照ピクチャリサンプリングが有効にされることを示す第１フラグを、前記エンコードされたビデオビットストリームから取得するステップと、
ピクチャ解像度が前記ＣＶＳにおいて変更されるかどうかを示す第２フラグの値を決定するステップと、
前記ピクチャ解像度が前記ＣＶＳにおいて変更されることを示す前記第２フラグの値に基づいて、空間スケーラビリティ及び適応解像度変更（ＡＲＣ）のために前記参照ピクチャリサンプリングを用いて前記ＣＶＳをデコードするステップと、
前記ピクチャ解像度が前記ＣＶＳにおいて変更されないことを示す前記第２フラグの値に基づいて、前記空間スケーラビリティのためには前記参照ピクチャリサンプリングを用いて、前記ＡＲＣのためには前記参照ピクチャリサンプリングを用いずに前記ＣＶＳをデコードするステップと
を有する方法。
前記ＣＶＳは、コーディングされたレイヤワイズビデオシーケンス（ＣＬＶＳ）である、
請求項１に記載の方法。
前記第２フラグが前記エンコードされたビデオビットストリームに存在しない場合に、
前記第２フラグの値は、前記ピクチャ解像度が前記ＣＶＳにおいて変更されないことを示す値に等しいと推測される、
請求項１又は２に記載の方法。
前記ピクチャ解像度が前記ＣＶＳにおいて変更されないことを示す前記第２フラグの値に基づいて、仮想境界情報がシグナリングされるかどうかを示す第３フラグを取得するステップを更に有する、
請求項１乃至３のうちいずれか一項に記載の方法。
前記ピクチャ解像度が前記ＣＶＳにおいて変更されないことを示す前記第２フラグの値に基づいて、サブピクチャパーティション化情報がシグナリングされるかどうかを示す第４フラグを取得するステップを更に有する、
請求項１乃至４のうちいずれか一項に記載の方法。
前記ピクチャ解像度が前記ＣＶＳにおいて変更されないことを示す前記第２フラグの値に基づいて、スケーリングウィンドウパラメータはシグナリングされる、
請求項１乃至５のうちいずれか一項に記載の方法。
前記第１フラグ及び前記第２フラグは、シーケンスパラメータセット（ＳＰＳ）でシグナリングされる、
請求項１乃至６のうちいずれか一項に記載の方法。
前記ピクチャ解像度が前記ＣＶＳにおいて変更されることを示す前記第２フラグの値に基づいて、前記ＳＰＳを参照するピクチャパラメータセット（ＰＰＳ）に含まれている第５フラグは、前記ピクチャ解像度が前記ＣＶＳにおいて変更されることを示し、
前記ピクチャ解像度が前記ＣＶＳにおいてに置いて変更されることを示す前記第５フラグに基づいて、前記ＰＰＳに対応するピクチャの幅及び高さのうちの少なくとも一方が明示的にシグナリングされる、
請求項７に記載の方法。
前記ピクチャ解像度が前記ＣＶＳにおいて変更されないことを示す前記第２フラグの値に基づいて、前記ＳＰＳを参照するピクチャパラメータセット（ＰＰＳ）に含まれている第５フラグは、前記ピクチャ解像度が前記ＣＶＳにおいて変更されないことを示し、
前記ピクチャ解像度が前記ＣＶＳにおいて変更されないことを示す前記第５フラグに基づいて、前記ＰＰＳに対応するピクチャの幅及び高さのうちの少なくとも一方は明示的にシグナリングされず、
前記幅及び前記高さのうちの前記少なくとも一方は、前記ＳＰＳでシグナリングされた最大幅及び最大高さのうちの少なくとも一方に等しいと推測される、
請求項７に記載の方法。
エンコードされたビデオビットストリームをデコードするデバイスであって、
プログラムコードを記憶するよう構成される少なくとも１つのメモリと、
前記プログラムコードを読み出し、該プログラムコードによって指示されるように動作するよう構成される少なくとも１つのプロセッサと
を有し、
前記プログラムコードは、前記少なくとも１つのプロセッサによって実行される場合に、前記少なくとも１つのプロセッサに、請求項１乃至９のうちいずれか一項に記載の方法を実行させる、
デバイス。
コンピュータで実行される場合に、前記コンピュータに、請求項１乃至９のうちいずれか一項に記載の方法を実行させるコンピュータプログラム。