JP2020515169A

JP2020515169A - メディアアプリケーションフォーマットでスケーラブル動画像をシグナリングするためのシステム及び方法

Info

Publication number: JP2020515169A
Application number: JP2019551722A
Authority: JP
Inventors: サーチンジー．デシュパンダ
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 2017-03-20
Filing date: 2018-01-31
Publication date: 2020-05-21
Also published as: US20200021853A1; WO2018173498A1; CN110506421B; CN110506421A; EP3603067A1; EP3603067A4

Abstract

データをカプセル化する方法が開示されている。本方法は、マルチレイヤ動画像表示データを含む符号化動画像データを受信することと、符号化動画像データに関連付けられた１つ以上のパラメータ値を設定することと、符号化動画像データをデータ構造内にカプセル化することと、を含む。

Description

本開示は、動画像符号化に関し、より具体的には、スケーラブル動画像データをシグナリングするための技術に関する。

デジタル動画像能力は、デジタルテレビ、ラップトップ又はデスクトップコンピュータ、タブレット型コンピュータ、デジタル記録デバイス、デジタルメディアプレーヤ、ビデオゲーミングデバイス、いわゆるスマートフォンを含むセルラー電話、医療用イメージングデバイスなどを含む、広範囲のデバイスに組み込むことができる。デジタル動画像は、動画像符号化規格に従って符号化することができる。動画像符号化規格は、動画像圧縮技術を組み込むことができる。動画像符号化規格の例としては、ＩＳＯ／ＩＥＣＭＰＥＧ−４Ｖｉｓｕａｌ及びＩＴＵ−ＴＨ．２６４（ＩＳＯ／ＩＥＣＭＰＥＧ−４ＡＶＣとしても公知である）並びにＨｉｇｈ−ＥｆｆｉｃｉｅｎｃｙＶｉｄｅｏＣｏｄｉｎｇ（ＨＥＶＣ）が挙げられる。ＨＥＶＣは、ＨｉｇｈＥｆｆｉｃｉｅｎｃｙＶｉｄｅｏＣｏｄｉｎｇ（ＨＥＶＣ），Ｒｅｃに記載されている。ＩＴＵ−ＴＨ．２６５（２０１５年４月）は、参照により本明細書に組み込まれ、本明細書ではＩＴＵ−ＴＨ．２６５と呼ばれる。動画像圧縮技術は、動画像データを記憶し送信するためのデータ要件を低減することを可能にする。動画像圧縮技術は、ビデオシーケンスにおける固有の冗長性を利用することにより、データ要件を低減することができる。動画像圧縮技術は、ビデオシーケンスを連続的により小さな部分（すなわち、ビデオシーケンス内のフレームの群、フレーム群内のフレーム、フレーム内のスライス、スライス内の符号化木ユニット（例えば、マクロブロック）、符号化木ユニット内の符号化ブロックなど）に再分割することができる。イントラ予測符号化技術（例えば、ピクチャ内（空間的））及びインター予測技術（すなわち、ピクチャ間（時間的））を使用して、符号化される動画像データのユニットと動画像データの参照ユニットとの間の差分値を生成することができる。差分値は、残差データと呼ばれることがある。残差データは、量子化された変換係数として符号化することができる。シンタックス要素は、残差データと参照符号化ユニットを関連付けることができる（例えば、イントラ予測モードインデックス、動きベクトル、及びブロックベクトル）。残差データ及びシンタックス要素は、エントロピ符号化することができる。エントロピ符号化された残差データ及びシンタックス要素は、準拠ビットストリームに含めることができる。データ構造内準拠ビットストリーム及び関連メタデータは、データ構造に従ってカプセル化することができる。例えば、動画像表示及びそれに関連付けられたメタデータを形成する１つ以上の準拠ビットストリームは、ファイルフォーマットに従ってカプセル化することができる。動画像データをカプセル化するための現在の技術は、理想的ではない場合がある。

一実施例では、データをカプセル化する方法は、マルチレイヤ動画像表示データを含む符号化動画像データを受信することと、符号化動画像データに関連付けられた１つ以上のパラメータ値を設定することと、符号化動画像データをデータ構造内にカプセル化することと、を含む。

本開示の１つ以上の技術に係る、動画像データを符号化及び復号するように構成することができるシステムの一例を示すブロック図である。本開示の１つ以上の技術に係る、符号化動画像データ及び対応するデータ構造を示す概念図である。本開示の１つ以上の技術に係る、符号化動画像データ及び対応するメタデータをカプセル化するデータ構造を示す概念図である。本開示の１つ以上の技術に係る、動画像データを符号化及び復号するように構成することができるシステムの実装形態に含まれ得る構成要素の一例を示す概念図である。本開示の１つ以上の技術に係る、動画像データを符号化するように構成することができる動画像符号化装置の一例を示すブロック図である。本開示の１つ以上の技術に係る、動画像データを復号するように構成することができる動画像復号装置の一例を示すブロック図である。発明を実施するための形態

概して、本開示は、動画像データを符号化する様々な技術を説明する。特に、本開示は、データ構造に従って動画像データをカプセル化する及びデカプセル化するための技術を説明する。本明細書で説明する例示的なデータ構造は、様々なデータ通信技術を利用する多様な範囲のデバイスへ、スケーラブル動画像表示が効率的に送信できるようになるために、特に有用であり得る。本開示の技術は、ＩＴＵ−ＴＨ．２６４及びＩＴＵ−ＴＨ．２６５に関して説明されているが、一般的には、動画像符号化に適用可能であり得ることに留意されたい。例えば、本明細書で説明する符号化技術は、ＩＴＵ−ＴＨ．２６５に含まれるもの以外のブロック構造、イントラ予測技術、インター予測技術、変換技術、フィルタリング技術、及び／又はエントロピ符号化技術を含む動画像符号化システム（将来の動画像符号化規格に基づく動画像符号化システムを含む）に組み込むことができる。従って、ＩＴＵ−ＴＨ．２６４及びＩＴＵ−ＴＨ．２６５への参照は、説明のためのものであり、本明細書で説明する技術の範囲を限定するように解釈すべきではない。例えば、本明細書で説明する技術により、例えば、現在開発中の動画像符号化技術を含め、他の動画像符号化技術に従って符号化動画像データを含む動画像表示のためのスケーラブル動画像表示が効率的に送信できるようになる。更に、本明細書での文書の参照による組み込みは、説明のためのものであり、本明細書で使用される用語に関して限定する又は曖昧さを生むように解釈されるべきではないことに留意されたい。例えば、組み込まれた参照が、別の組み込まれた参照とは、及び／又はその用語が本明細書で使用されるのとは異なる用語の定義を提供する場合では、その用語は、それぞれの対応する定義を幅広く含むように、及び／又は代わりに特定の定義の各々を含むように解釈されるべきである。

一実施例では、デバイスは、マルチレイヤ動画像表示データを含む符号化動画像データを受信し、符号化動画像データに関連付けられた１つ以上のパラメータ値を設定し、かつ、符号化動画像データをデータ構造内にカプセル化するように構成された１つ以上のプロセッサを備える。

一実施例では、非一時的コンピュータ可読記憶媒体は、媒体上に記憶された命令を含み、その命令は実行されると、デバイスの１つ以上プロセッサに、マルチレイヤ動画像表示データを含む符号化動画像データを受信させ、符号化動画像データに関連付けられた１つ以上のパラメータ値を設定させ、符号化動画像データをデータ構造内にカプセル化させる。

一実施例では、装置は、マルチレイヤ動画像表示データを含む符号化動画像データを受信し、符号化動画像データに関連付けられた１つ以上のパラメータ値を設定し、符号化動画像データをデータ構造内カプセル化する、手段を備える。

一実施例では、データをデカプセル化する方法は、本明細書で説明する技術のうちの１つ以上に従ってカプセル化されたデータ構造を受信することと、そのデータ構造をデカプセル化することと、を含む。

一実施例では、デバイスは、本明細書で説明する技術のうちの１つ以上に従ってカプセル化されたデータ構造を受信し、そのデータ構造をデカプセル化するように構成された１つ以上のプロセッサを備える。

一実施例では、非一時的コンピュータ可読記憶媒体は、媒体上に記憶された命令を含み、その命令が実行されると、デバイスの１つ以上プロセッサに、本明細書で説明する技術のうちの１つ以上に従ってカプセル化されたデータ構造を受信し、そのデータ構造をデカプセル化する。

一実施例では、装置は、本明細書で説明する技術のうちの１つ以上に従ってカプセル化されたデータ構造を受信し、そのデータ構造をデカプセル化するための手段を含む。

１つ以上の実施例の詳細は、添付の図面及び以下の明細書に記述されている。他の特徴、目的、及び利点は、明細書及び図面から、並びに特許請求の範囲から明白であろう。

ビデオコンテンツは、典型的には、一連のフレームからなるビデオシーケンスを含む。一連のフレームはまた、ピクチャ群（group of pictures）（ＧＯＰ）と呼ばれることがある。各動画像フレーム又はピクチャは、複数のスライス又はタイルを含むことができ、スライス又はタイルは、複数の動画像ブロックを含む。動画像ブロックは、予測的に符号化され得る画素値（サンプルとも呼ばれる）の最大アレイとして定義することができる。動画像ブロックは、走査パターン（例えば、ラスター走査）にしたがってしたがって順序付けすることができる。動画像符号化装置は、動画像ブロック及びその再分割に対して予測符号化を実行する。ＩＴＵ−ＴＨ．２６４は、１６×１６のルマ（luma）サンプルを含むマクロブロックを規定する。ＩＴＵ−ＴＨ．２６５は、類似の符号化ツリーユニット（Coding Tree Unit）（ＣＴＵ）構造を規定するが、ピクチャは、等しいサイズのＣＴＵに分割することができ、各ＣＴＵは、１６×１６、３２×３２、又は６４×６４のルマサンプルを有する符号化ツリーブロック（Coding Tree Block）（ＣＴＢ）を含むことができる。本明細書で使用されるとき、動画像ブロックという用語は、一般に、ピクチャの領域を指すことがあり、又はより具体的には、予測的に符号化できる画素値の最大アレイ、その再分割、及び／又は対応する構造を指すことがある。

ＩＴＵ−ＴＨ．２６５では、ＣＴＵのＣＴＢは、対応する四分木ブロック構造に従って符号化ブロック（ＣＢ）に区画化することができる。ＩＴＵ−ＴＨ．２６５によれば、１つのルマＣＢは、２つの対応するクロマＣＢ及び関連するシンタックス要素と共に、符号化ユニット（ＣＵ）と呼ばれる。ＣＵは、ＣＵに対する１つ以上の予測部（prediction unit）（ＰＵ）を定義する予測部（ＰＵ）構造に関連し、ＰＵは、対応する参照サンプルに関連する。すなわち、ＩＴＵ−ＴＨ．２６５では、イントラ予測又はインター予測を使用してピクチャ領域を符号化する決定がＣＵレベルで行われ、ＣＵに関し、イントラ予測又はインター予測に対応する１つ以上の予測を使用して、ＣＵのＣＢに対する参照サンプルを生成することができる。ＩＴＵ−ＴＨ．２６５では、ＰＵは、ルマ及びクロマ予測ブロック（prediction block）（ＰＢ）を含むことができ、正方形ＰＢはイントラ予測に対してサポートされ、矩形ＰＢはインター予測に対してサポートされる。イントラ予測データ（例えば、イントラ予測モードシンタックス要素）又はインター予測データ（例えば、動きデータシンタックス要素）は、ＰＵを対応する参照サンプルに関連させることができる。残差データは、動画像データの各成分（例えば、ルマ（Ｙ）及びクロマ（Ｃｂ及びＣｒ））に対応する差分値のそれぞれのアレイを含むことができる。残差データは、画素領域内とすることができる。離散コサイン変換（discrete cosine transform）（ＤＣＴ）、離散サイン変換（discretesine transform）（ＤＳＴ）、整数変換、ウェーブレット変換、又は概念的に類似の変換などの変換を、画素差分値に適用して、変換係数を生成することができる。ＩＴＵ−ＴＨ．２６５では、ＣＵは、更に変換ユニット（Transform Unit）（ＴＵ）に再分割できることに留意されたい。すなわち、画素差分値のアレイは、変換係数を生成するために再分割することができ（例えば、４つの８×８変換を、１６×１６のルマＣＢに対応する残差値の１６×１６のアレイに適用することができる）、そのような再分割は、変換ブロック（Transform Blocks）（ＴＢ）と呼ばれることがある。変換係数は、量子化パラメータ（quantization parameter）（ＱＰ）に従って量子化され得る。量子化された変換係数（これはレベル値と呼ばれることがある）は、エントロピ符号化技術（例えば、コンテンツ適応可変長符号化（content adaptive variable length coding）（ＣＡＶＬＣ）、コンテキスト適応２値算術符号化（context adaptive binary arithmetic coding）（ＣＡＢＡＣ）、確率区間分割エントロピ符号化（probability interval partitioning entropy coding）（ＰＩＰＥ）など）に従ってエントロピ符号化することができる。更に、予測モードを示すシンタックス要素などのシンタックス要素も、エントロピ符号化することができる。エントロピ符号化され量子化された変換係数及び対応するエントロピ符号化されたシンタックス要素は、動画像データを再生するために使用することができる準拠ビットストリームを形成することができる。二値化プロセスを、エントロピ符号化プロセスの一部としてシンタックス要素に対して実行することができる。二値化は、シンタックス値を一連の１つ以上のビットに変換するプロセスを指す。これらのビットは、「ビン」と呼ばれることがある。

ＩＴＵ−ＴＨ．２６５では、符号化ビデオシーケンスは、アクセスユニットのシーケンスとしてカプセル化（又は構造化）されてもよく、各アクセスユニットは、ネットワーク抽象レイヤ（ＮＡＬ）ユニットとして構造化された動画像データを含む。ＩＴＵ−ＴＨ．２６５では、アクセスユニット及びＮＡＬユニットは、以下のように定義される：
ネットワーク抽象レイヤ（ＮＡＬ）ユニット：後に続くデータの種別のインジケーション、及び必要に応じてエミュレーション防止バイトを点在させた生バイトシーケンスペイロード（ＲＢＳＰ）の形式で当該データを包含するバイトを包含するシンタックス構造。
アクセスユニット：特定の分類ルールに従って互いに関連付けられているＮＡＬユニットのセットは、復号順に連続しており、０に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するただ１つの符号化ピクチャを包含する。

図２は、ＮＡＬユニットを含むアクセスユニットに従って構造化された、符号化されたピクチャ群の一例を示す概念図である。図２に示す例では、ピクチャ群に含まれる動画像データの各スライスは、ＮＡＬユニットに関連付けられている。更に、ＩＴＵ−ＴＨ．２６５では、ビデオシーケンス、ＧＯＰ、ピクチャ、スライス、及びＣＴＵのそれぞれは、動画像符号化特性を記述するメタデータに関連付けられてもよい。ＩＴＵ−ＴＨ．２６５は、動画像データ特性及び／又は動画像符号化特性を記述するために使用され得るパラメータセットを定義する。ＩＴＵ−ＴＨ．２６５では、パラメータセットは特殊な種別のＮＡＬユニットとしてカプセル化されてもよく、又はメッセージとしてシグナリングされてもよい。符号化動画像データ（例えばスライス）を含むＮＡＬユニットは、ＶＣＬ（動画像符号化レイヤ）ＮＡＬユニットと呼ばれることがあり、メタデータ（例えばパラメータセット）を含むＮＡＬユニットは、非ＶＣＬＮＡＬユニットと呼ばれることがある。ＩＴＵ−ＴＨ．２６５は、以下の種別の定義されたパラメータセットを規定している：
動画像パラメータセット（ＶＰＳ）：０個以上の符号化ビデオシーケンス（ＣＶＳ）全体に適用されるシンタックス要素を包含するシンタックス構造であって、ＳＰＳに含まれるシンタックス要素のコンテンツによって判定され、ＳＰＳはＰＰＳに含まれるシンタックス要素によって参照され、ＰＰＳは各スライスセグメントヘッダに含まれるシンタックス要素によって参照されるシンタックス構造。
シーケンスパラメータセット（ＳＰＳ）：０個以上のＣＶＳ全体に適用されるシンタックス要素を包含するシンタックス構造であって、ＰＰＳに含まれるシンタックス要素のコンテンツによって判定され、ＰＰＳは各スライスセグメントヘッダに含まれるシンタックス要素によって参照されるシンタックス構造。
ピクチャパラメータセット（ＰＰＳ）：０個以上の符号化ピクチャ全体に適用されるシンタックス要素を包含するシンタックス構造であって、各スライスセグメントヘッダに含まれるシンタックス要素によって判定されるシンタックス構造。

更に、ＩＴＵ−ＴＨ．２６５は、フォーマット範囲拡張（ＲＥｘｔ）、スケーラビリティ（ＳＨＶＣ）、マルチビュー（ＭＶ−ＨＥＶＣ）及び３−Ｄ（３Ｄ−ＨＥＶＣ）を含むマルチレイヤ拡張をサポートする。場合によっては、ＩＴＵ−ＴＨ．２６５によってサポートされるマルチレイヤ拡張は、レイヤードＨＥＶＣ（Ｌ−ＨＥＶＣ）又はマルチレイヤＨＥＶＣ表示と呼ばれることもある。マルチレイヤ拡張は、動画像表示がベースレイヤ及び１つ以上の追加のエンハンスメントレイヤを含むことを可能にする。例えば、ベースレイヤは、基本レベルの品質（例えば、高解像度レンダリング）を有する動画像表示を可能にすることができ、エンハンスメントレイヤは、強化された品質レベル（例えば、超高解像度レンダリング）を有する動画像表示を可能にすることができる。ＩＴＵ−ＴＨ．２６５では、ベースレイヤを参照することによってエンハンスメントレイヤを符号化することができる。すなわち、例えば、エンハンスメントレイヤ内のピクチャは、ベースレイヤ内の１つ以上のピクチャ（その拡大／縮小したバージョンを含む）を参照することによって、（例えば、インター予測技術を使用して）符号化されてもよい。場合によっては、ベースレイヤ及びエンハンスメントレイヤは、異なる動画像符号化規格に従って符号化されてもよいことに留意されたい。例えば、ベースレイヤはＩＴＵ−ＴＨ．２６４に従って符号化されてもよく、エンハンスメントレイヤはＩＴＵ−ＴＨ．２６５に従って符号化されてもよい。ＩＴＵ−ＴＨ．２６５では、各ＮＡＬユニットは、ＮＡＬユニットが関連付けられている動画像データのレイヤを示す識別子（ｎｕｈ＿ｌａｙｅｒ＿ｉｄ）を含んでもよい。ＩＴＵ−ＴＨ．２６５は、以下のように、ｎｕｈ＿ｌａｙｅｒ＿ｉｄを定義する：
ｎｕｈ＿ｌａｙｅｒ＿ｉｄは、ＶＣＬ（動画像符号化レイヤ）ＮＡＬユニットが属するレイヤの識別子、又は非ＶＣＬＮＡＬユニットが適用されるレイヤの識別子を明示する。

更に、ＩＴＵ−ＴＨ．２６５の付属書類Ｆは、Ｌ−ＨＥＶＣをサポートするために使用され得るパラメータセット及び視覚的有用性情報（Visual Usability Information）（ＶＵＩ）を提供し、ＩＴＵ−ＴＨ．２６５の付属書類Ｈは、スケーラブルＨＥＶＣ動画像がどのように符号化され得るかの説明を提供する（例えば、仮想参照デコーダの挙動などが記載されている）。簡潔にするために、ＩＴＵ−ＴＨ．２６５の付属書類Ｆ及び付属書類Ｈの完全な説明は、本明細書では再現されていないが、ＩＴＵ−ＴＨ．２６５の付属書類Ｆ及び付属書類Ｈは、参照により本明細書に組み込まれている。

ＩＴＵ−ＴＨ．２６５は、プロファイル、ティア（tier）及びレベルセマンティクスについて、以下の定義されたシンタックス要素を含む：
ｇｅｎｅｒａｌ＿ｐｒｏｆｉｌｅ＿ｓｐａｃｅは、ｇｅｎｅｒａｌ＿ｐｒｏｆｉｌｅ＿ｉｄｃ、及び両端値を含む０〜３１の範囲にあるｊの全ての値に対するｇｅｎｅｒａｌ＿ｐｒｏｆｉｌｅ＿ｃｏｍｐａｔｉｂｉｌｉｔｙ＿ｆｌａｇ［ｊ］を解釈するためのコンテキストを規定する。ｇｅｎｅｒａｌ＿ｐｒｏｆｉｌｅ＿ｓｐａｃｅの値は、このバージョンの仕様に適合するビットストリームにおいて、０に等しいものとする。ｇｅｎｅｒａｌ＿ｐｒｏｆｉｌｅ＿ｓｐａｃｅの他の値は、ＩＴＵ−Ｔ｜ＩＳＯ／ＩＥＣによる将来の使用のために予約される。復号装置は、ｇｅｎｅｒａｌ＿ｐｒｏｆｉｌｅ＿ｓｐａｃｅが０に等しい場合、ＣＶＳを無視するものとする。
ｇｅｎｅｒａｌ＿ｔｉｅｒ＿ｆｌａｇは、［Ｉ−ＩＴＵＨ．２６５の］付属書類Ａに規定されているように、ｇｅｎｅｒａｌ＿ｌｅｖｅｌ＿ｉｄｃの解釈のためのティアコンテキストを規定する。
ｇｅｎｅｒａｌ＿ｐｒｏｆｉｌｅ＿ｉｄｃは、ｇｅｎｅｒａｌ＿ｐｒｏｆｉｌｅ＿ｓｐａｃｅが０に等しい場合、［Ｉ−ＩＴＵＨ．２６５の］付属書類Ａに規定されているようにＣＶＳがプロファイルに適合することを示す。ビットストリームは、［Ｉ−ＩＴＵＨ．２６５の］付属書類Ａで規定されたもの以外のｇｅｎｅｒａｌ＿ｐｒｏｆｉｌｅ＿ｉｄｃの値を含まないものとする。ｇｅｎｅｒａｌ＿ｐｒｏｆｉｌｅ＿ｉｄｃの他の値は、ＩＴＵ−Ｔ｜ＩＳＯ／ＩＥＣによる将来の使用のために予約される。
ｇｅｎｅｒａｌ＿ｐｒｏｇｒｅｓｓｉｖｅ＿ｓｏｕｒｃｅ＿ｆｌａｇ及びｇｅｎｅｒａｌ＿ｉｎｔｅｒｌａｃｅｄ＿ｓｏｕｒｃｅ＿ｆｌａｇは、以下のように解釈される：
−ｇｅｎｅｒａｌ＿ｐｒｏｇｒｅｓｓｉｖｅ＿ｓｏｕｒｃｅ＿ｆｌａｇが１に等しく、ｇｅｎｅｒａｌ＿ｉｎｔｅｒｌａｃｅｄ＿ｓｏｕｒｃｅ＿ｆｌａｇが０に等しい場合、ＣＶＳにおけるピクチャのソース走査タイプは、プログレッシブのみとして解釈されるべきである。
−さもなければ、ｇｅｎｅｒａｌ＿ｐｒｏｇｒｅｓｓｉｖｅ＿ｓｏｕｒｃｅ＿ｆｌａｇが０に等しく、ｇｅｎｅｒａｌ＿ｉｎｔｅｒｌａｃｅｄ＿ｓｏｕｒｃｅ＿ｆｌａｇが１に等しい場合、ＣＶＳにおけるピクチャのソース走査タイプは、インタレースのみとして解釈されるべきである。
−さもなければ、ｇｅｎｅｒａｌ＿ｐｒｏｇｒｅｓｓｉｖｅ＿ｓｏｕｒｃｅ＿ｆｌａｇが０に等しく、ｇｅｎｅｒａｌ＿ｉｎｔｅｒｌａｃｅｄ＿ｓｏｕｒｃｅ＿ｆｌａｇが０に等しい場合、ＣＶＳにおけるピクチャのソース走査タイプは、不明であるか又は規定されていないと解釈されるべきである。
−さもなければ（ｇｅｎｅｒａｌ＿ｐｒｏｇｒｅｓｓｉｖｅ＿ｓｏｕｒｃｅ＿ｆｌａｇが１に等しく、ｇｅｎｅｒａｌ＿ｉｎｔｅｒｌａｃｅｄ＿ｓｏｕｒｃｅ＿ｆｌａｇが１に等しい）、ＣＶＳにおける各ピクチャのソース走査タイプは、ピクチャタイミングＳＥＩ（ＳｕｐｐｌｅｍｅｎｔａｌＥｎｈａｎｃｅｍｅｎｔＩｎｆｏｒｍａｔｉｏｎ）メッセージ内のピクチャシンタックス要素ｓｏｕｒｃｅ＿ｓｃａｎ＿ｔｙｐｅを使用してピクチャレベルで示される。
１に等しいｇｅｎｅｒａｌ＿ｎｏｎ＿ｐａｃｋｅｄ＿ｃｏｎｓｔｒａｉｎｔ＿ｆｌａｇは、ＣＶＳ内にフレームパッキングアレンジメントＳＥＩメッセージも、セグメント化された矩形フレームパッキングアレンジメントＳＥＩメッセージも存在しないことを規定し、０に等しいｇｅｎｅｒａｌ＿ｎｏｎ＿ｐａｃｋｅｄ＿ｃｏｎｓｔｒａｉｎｔ＿ｆｌａｇは、１つ以上のフレームパッキングアレンジメントＳＥＩメッセージ又はセグメント化された矩形フレームパッキングアレンジメントＳＥＩメッセージが存在していても存在していなくてもよいことを示す。
１に等しいｇｅｎｅｒａｌ＿ｆｒａｍｅ＿ｏｎｌｙ＿ｃｏｎｓｔｒａｉｎｔ＿ｆｌａｇは、ｆｉｅｌｄ＿ｓｅｑ＿ｆｌａｇが０に等しいことを規定し、０に等しいｇｅｎｅｒａｌ＿ｆｒａｍｅ＿ｏｎｌｙ＿ｃｏｎｓｔｒａｉｎｔ＿ｆｌａｇは、ｆｉｅｌｄ＿ｓｅｑ＿ｆｌａｇが０に等しくても等しくなくてもよいことを示す。
ｇｅｎｅｒａｌ＿ｌｅｖｅｌ＿ｉｄｃは、［Ｉ−ＩＴＵＨ．２６５の］付属書類Ａで規定されるように、ＣＶＳが適合するレベルを示す。ビットストリームは、［Ｉ−ＩＴＵＨ．２６５の］付属書類Ａで規定されたもの以外のｇｅｎｅｒａｌ＿ｌｅｖｅｌ＿ｉｄｃの値を含まないものとする。ｇｅｎｅｒａｌ＿ｌｅｖｅｌ＿ｉｄｃの他の値は、ＩＴＵ−Ｔ｜ＩＳＯ／ＩＥＣによる将来の使用のために予約される。
１に等しいｓｕｂ＿ｌａｙｅｒ＿ｐｒｏｆｉｌｅ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］は、ＴｅｍｐｏｒａｌＩｄがｉに等しいサブレイヤ表現のｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ（）シンタックス構造に、プロファイル情報が存在することを規定し、０に等しいｓｕｂ＿ｌａｙｅｒ＿ｐｒｏｆｉｌｅ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］は、ＴｅｍｐｏｒａｌＩｄがｉに等しいサブレイヤ表現のｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ（）シンタックス構造に、プロファイル情報が存在しないことを規定する。ｐｒｏｆｉｌｅＰｒｅｓｅｎｔＦｌａｇが０に等しい場合、ｓｕｂ＿ｌａｙｅｒ＿ｐｒｏｆｉｌｅ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］は０に等しいものとする。
１に等しいｓｕｂ＿ｌａｙｅｒ＿ｌｅｖｅｌ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］は、ＴｅｍｐｏｒａｌＩｄがｉに等しいサブレイヤ表現のｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ（）シンタックス構造に、レベル情報が存在することを規定し、０に等しいｓｕｂ＿ｌａｙｅｒ＿ｌｅｖｅｌ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］は、ＴｅｍｐｏｒａｌＩｄがｉに等しいサブレイヤ表現のｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ（）シンタックス構造に、レベル情報が存在しないことを規定する。

ＩＴＵ−ＴＨ．２６５の付属書類ＦにおけるＶＰＳセマンティクスは、以下の定義されたシンタックス要素を含む：
０に等しいｖｐｓ＿ｅｘｔｅｎｓｉｏｎ＿ｆｌａｇは、ＶＰＳＲＢＳＰシンタックス構造において、ｖｐｓ＿ｅｘｔｅｎｓｉｏｎ（）シンタックス構造が存在しないことを規定し、１に等しいｖｐｓ＿ｅｘｔｅｎｓｉｏｎ＿ｆｌａｇは、ＶＰＳＲＢＳＰシンタックス構造において、ｖｐｓ＿ｅｘｔｅｎｓｉｏｎ（）シンタックス構造が存在することを規定する。ＭａｘＬａｙｅｒｓＭｉｎｕｓ１が０より大きい場合、ｖｐｓ＿ｅｘｔｅｎｓｉｏｎ＿ｆｌａｇは１に等しいものとする。
ｖｐｓ＿ｅｘｔｅｎｓｉｏｎ（）シンタックス構造がｖｐｓ＿ｎｕｍ＿ｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ＿ｍｉｎｕｓ１ｐｌｕｓ１を含む場合、ＶＰＳにおけるｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ（）シンタックス構造の数を規定する。ｖｐｓ＿ｎｕｍ＿ｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ＿ｍｉｎｕｓ１の値は、両端値を含む、０〜６３の範囲であるものとする。
ｖｐｓ＿ｍａｘ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１が０より大きい場合、ｖｐｓ＿ｎｕｍ＿ｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ＿ｍｉｎｕｓ１の値は、１以上であるものとする。
１に等しいｖｐｓ＿ｖｕｉ＿ｐｒｅｓｅｎｔ＿ｆｌａｇは、ｖｐｓ＿ｖｕｉ（）シンタックス構造がＶＰＳに存在することを規定し、０に等しいｖｐｓ＿ｖｕｉ＿ｐｒｅｓｅｎｔ＿ｆｌａｇは、ｖｐｓ＿ｖｕｉ（）シンタックス構造がＶＰＳに存在しないことを規定する。

更に、ＩＴＵ−ＴＨ．２６５の付属書類ＦにおけるＶＰＳＶＵＩフィールドシンタックスは、以下の定義されたシンタックス要素を含む：
１に等しいｐｉｃ＿ｒａｔｅ＿ｐｒｅｓｅｎｔ＿ｖｐｓ＿ｆｌａｇは、シンタックス要素ｐｉｃ＿ｒａｔｅ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］［ｊ］が存在することを規定し、０に等しいｐｉｃ＿ｒａｔｅ＿ｐｒｅｓｅｎｔ＿ｖｐｓ＿ｆｌａｇは、シンタックス要素ｐｉｃ＿ｒａｔｅ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］［ｊ］が存在しないことを規定する。
１に等しいｐｉｃ＿ｒａｔｅ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］［ｊ］は、ｉ番目のレイヤセットのｊ番目のサブセットのピクチャレート情報が存在することを規定し、０に等しいｐｉｃ＿ｒａｔｅ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］［ｊ］は、ｉ番目のレイヤセットのｊ番目のサブセットのピクチャレート情報が存在しないことを規定する。ｐｉｃ＿ｒａｔｅ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］［ｊ］が存在しない場合、ｐｉｃ＿ｒａｔｅ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］［ｊ］の値は０に等しいと推測される。
ｃｏｎｓｔａｎｔ＿ｐｉｃ＿ｒａｔｅ＿ｉｄｃ［ｉ］［ｊ］は、ｉ番目のレイヤセットのｊ番目のサブセットのピクチャレートが一定であるかどうかを示す。以下において、時間的セグメントｔＳｅｇは、ｉ番目のレイヤセットのｊ番目のサブセットの、復号順に、２つ以上の連続するアクセスユニットの任意のセットであり、ａｕＴｏｔａｌ（ｔＳｅｇ）は、時間的セグメントｔＳｅｇ内のアクセスユニットの数であり、ｔ１（ｔＳｅｇ）は、時間的セグメントｔＳｅｇの（復号順において）最初のアクセスユニットの除去時間（秒単位）であり、ｔ２（ｔＳｅｇ）は、時間的セグメントｔＳｅｇの（復号順において）最後のアクセスユニットの除去時間（秒単位）であり、ａｖｇＰｉｃＲａｔｅ（ｔＳｅｇ）は、時間的セグメントｔＳｅｇ内の平均ピクチャレートであり、以下のように規定される：
ａｖｇＰｉｃＲａｔｅ（ｔＳｅｇ）＝Ｒｏｕｎｄ（ａｕＴｏｔａｌ（ｔＳｅｇ）＊２５６÷（ｔ２（ｔＳｅｇ）−ｔ１（ｔＳｅｇ）））
ｉ番目のレイヤセットのｊ番目のサブセットが１つ若しくは２つのアクセスユニットのみを含む場合、又はａｖｇＰｉｃＲａｔｅ（ｔＳｅｇ）の値が全ての時間的セグメントにわたって一定である場合、ピクチャレートは一定である。さもなければ、ピクチャレートは一定ではない。
０に等しいｃｏｎｓｔａｎｔ＿ｐｉｃ＿ｒａｔｅ＿ｉｄｃ［ｉ］［ｊ］は、ｉ番目のレイヤセットのｊ番目のサブセットのピクチャレートが一定でないことを示す。
１に等しいｃｏｎｓｔａｎｔ＿ｐｉｃ＿ｒａｔｅ＿ｉｄｃ［ｉ］［ｊ］は、ｉ番目のレイヤセットのｊ番目のサブセットのピクチャレートが一定であることを示す。
２に等しいｃｏｎｓｔａｎｔ＿ｐｉｃ＿ｒａｔｅ＿ｉｄｃ［ｉ］［ｊ］は、ｉ番目のレイヤセットのｊ番目のサブセットのピクチャレートが一定であっても、一定でなくてもよいことを示す。ｃｏｎｓｔａｎｔ＿ｐｉｃ＿ｒａｔｅ＿ｉｄｃ［ｉ］［ｊ］の値は、両端値を含む０〜２の範囲であるものとする。

更に、ＩＴＵ−ＴＨ．２６５の付属書類ＦにおけるＶＰＳＶＵＩフィールドセマンティクスには、ｖｉｄｅｏ＿ｖｐｓ＿ｆｏｒｍａｔ、ｖｉｄｅｏ＿ｆｕｌｌ＿ｒａｎｇｅ＿ｖｐｓ＿ｆｌａｇ、ｃｏｌｏｕｒ＿ｐｒｉｍａｒｉｅｓ＿ｖｐｓ、ｔｒａｎｓｆｅｒ＿ｃｈａｒａｃｔｅｒｉｓｔｉｃｓ＿ｖｐｓ及びｍａｔｒｉｘ＿ｃｏｅｆｆｓ＿ｖｐｓと定義されたシンタックス要素を含むｖｉｄｅｏ＿ｓｉｇｎａｌ＿ｉｎｆｏ（）が含まれており、これらはそれぞれ、ＶＰＳを参照する各ＳＰＳに対し、ＳＰＳＶＵＩシンタックス要素ｖｉｄｅｏ＿ｆｏｒｍａｔ、ｖｉｄｅｏ＿ｆｕｌｌ＿ｒａｎｇｅ＿ｆｌａｇ、ｃｏｌｏｕｒ＿ｐｒｉｍａｒｉｅｓ、ｔｒａｎｓｆｅｒ＿ｃｈａｒａｃｔｅｒｉｓｔｉｃｓ、及びｍａｔｒｉｘ＿ｃｏｅｆｆｓの値の推測に使用され得る。

ＩＴＵ−ＴＨ．２６５の付属書類ＦにおけるＳＰＳセマンティクスは、以下の定義されたシンタックス要素を含む：
１に等しいｖｕｉ＿ｐａｒａｍｅｔｅｒｓ＿ｐｒｅｓｅｎｔ＿ｆｌａｇは、付属書類Ｅで規定されているｖｕｉ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造が存在することを規定し、０に等しいｖｕｉ＿ｐａｒａｍｅｔｅｒｓ＿ｐｒｅｓｅｎｔ＿ｆｌａｇは、付属書類Ｅで規定されているｖｕｉ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造が存在しないことを規定する。

ＩＴＵ−ＴＨ．２６５の付属書類ＥにおけるＶＵＩパラメータは、以下の定義されたシンタックス要素を含む：
１に等しいａｓｐｅｃｔ＿ｒａｔｉｏ＿ｉｎｆｏ＿ｐｒｅｓｅｎｔ＿ｆｌａｇは、ａｓｐｅｃｔ＿ｒａｔｉｏ＿ｉｄｃが存在することを規定し、０に等しいａｓｐｅｃｔ＿ｒａｔｉｏ＿ｉｎｆｏ＿ｐｒｅｓｅｎｔ＿ｆｌａｇは、ａｓｐｅｃｔ＿ｒａｔｉｏ＿ｉｄｃが存在しないことを規定する。
ａｓｐｅｃｔ＿ｒａｔｉｏ＿ｉｄｃは、ルマサンプルのサンプルアスペクト比の値を規定する。［ＩＴＵ−ＴＨ．２６５の］表Ｅ．１は、コードの意味を示す。ａｓｐｅｃｔ＿ｒａｔｉｏ＿ｉｄｃがＥＸＴＥＮＤＥＤ＿ＳＡＲを示す場合、サンプルアスペクト比は、ｓａｒ＿ｗｉｄｔｈ：ｓａｒ＿ｈｉｇｈによって表される。ａｓｐｅｃｔ＿ｒａｔｉｏ＿ｉｄｃシンタックス要素が存在しない場合、ａｓｐｅｃｔ＿ｒａｔｉｏ＿ｉｄｃ値は０に等しいと推測される。両端値を含む１７〜２５４の範囲にあるａｓｐｅｃｔ＿ｒａｔｉｏ＿ｉｄｃの値は、ＩＴＵ−Ｔ｜ＩＳＯ／ＩＥＣによる将来の使用のために予約され、このバージョンの仕様に適合するビットストリームには存在しないものとする。復号装置は、両端値を含む１７〜２５４の範囲にあるａｓｐｅｃｔ＿ｒａｔｉｏ＿ｉｄｃの値を、値０に相当すると解釈するものとする。
１に等しいｏｖｅｒｓｃａｎ＿ｉｎｆｏ＿ｐｒｅｓｅｎｔ＿ｆｌａｇは、ｏｖｅｒｓｃａｎ＿ａｐｐｒｏｐｒｉａｔｅ＿ｆｌａｇが存在することを規定する。ｏｖｅｒｓｃａｎ＿ｉｎｆｏ＿ｐｒｅｓｅｎｔ＿ｆｌａｇが０に等しいか又は存在しない場合、動画像信号のための好ましいディスプレイ方法は規定されない。
ｖｉｄｅｏ＿ｆｕｌｌ＿ｒａｎｇｅ＿ｆｌａｇは、Ｅ’Ｙ、Ｅ’ＰＢ、及びＥ’ＰＲ又はＥ’Ｒ、Ｅ’Ｇ及びＥ’Ｂの実数値成分信号から得られたルマ信号及びクロマ信号の黒レベル並びに範囲を示す。
ｖｉｄｅｏ＿ｆｕｌｌ＿ｒａｎｇｅ＿ｆｌａｇシンタックス要素が存在しない場合、ｖｉｄｅｏ＿ｆｕｌｌ＿ｒａｎｇｅ＿ｆｌａｇの値は０に等しいと推測される。
１に等しいｃｏｌｏｕｒ＿ｄｅｓｃｒｉｐｔｉｏｎ＿ｐｒｅｓｅｎｔ＿ｆｌａｇは、ｃｏｌｏｕｒ＿ｐｒｉｍａｒｉｅｓ、ｔｒａｎｓｆｅｒ＿ｃｈａｒａｃｔｅｒｉｓｔｉｃｓ及びｍａｔｒｉｘ＿ｃｏｅｆｆｓが存在することを規定し、０に等しいｃｏｌｏｕｒ＿ｄｅｓｃｒｉｐｔｉｏｎ＿ｐｒｅｓｅｎｔ＿ｆｌａｇは、ｃｏｌｏｕｒ＿ｐｒｉｍａｒｉｅｓ、ｔｒａｎｓｆｅｒ＿ｃｈａｒａｃｔｅｒｉｓｔｉｃｓ及びｍａｔｒｉｘ＿ｃｏｅｆｆｓが存在しないことを規定する。
ｃｏｌｏｕｒ＿ｐｒｉｍａｒｉｅｓは、ＩＳＯ１１６６４−１で規定されているＣＩＥ１９３１のｘとｙの定義に関して、［ＩＴＵ−ＴＨ．２６５の］表Ｅ．３で規定されているソースプライマリ（source primary）の色度座標（chromaticity coordinate）を示す。
ｔｒａｎｓｆｅｒ＿ｃｈａｒａｃｔｅｒｉｓｔｉｃｓは、公称実数値範囲０〜１の線形光強度入力Ｌｃの関数として、［ＩＴＵ−ＴＨ．２６５の］表Ｅ．４で規定されているソースピクチャの光−電子伝達特性（opto-electronictransfer characteristic）を示す。
ｍａｔｒｉｘ＿ｃｏｅｆｆｓは、［ＩＴＵ−ＴＨ．２６５の］表Ｅ．５で規定されているように、緑、青及び赤又はＹ、Ｚ及びＸ原色からルマ信号及びクロマ信号を導出する際に使用される行列係数（matrix coefficients）を表す。
１に等しいｃｈｒｏｍａ＿ｌｏｃ＿ｉｎｆｏ＿ｐｒｅｓｅｎｔ＿ｆｌａｇは、ｃｈｒｏｍａ＿ｓａｍｐｌｅ＿ｌｏｃ＿ｔｙｐｅ＿ｔｏｐ＿ｆｉｅｌｄ及びｃｈｒｏｍａ＿ｓａｍｐｌｅ＿ｌｏｃ＿ｔｙｐｅ＿ｂｏｔｔｏｍ＿ｆｉｅｌｄが存在することを規定し、０に等しいｃｈｒｏｍａ＿ｌｏｃ＿ｉｎｆｏ＿ｐｒｅｓｅｎｔ＿ｆｌａｇは、ｃｈｒｏｍａ＿ｓａｍｐｌｅ＿ｌｏｃ＿ｔｙｐｅ＿ｔｏｐ＿ｆｉｅｌｄ及びｃｈｒｏｍａ＿ｓａｍｐｌｅ＿ｌｏｃ＿ｔｙｐｅ＿ｂｏｔｔｏｍ＿ｆｉｅｌｄが存在しないことを規定する。ｃｈｒｏｍａ＿ｆｏｒｍａｔ＿ｉｄｃが１に等しくない場合、ｃｈｒｏｍａ＿ｌｏｃ＿ｉｎｆｏ＿ｐｒｅｓｅｎｔ＿ｆｌａｇは、０に等しくなければならない。
１に等しいｖｕｉ＿ｔｉｍｉｎｇ＿ｉｎｆｏ＿ｐｒｅｓｅｎｔ＿ｆｌａｇは、ｖｕｉ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造に、ｖｕｉ＿ｎｕｍ＿ｕｎｉｔｓ＿ｉｎ＿ｔｉｃｋ、ｖｕｉ＿ｔｉｍｅ＿ｓｃａｌｅ、ｖｕｉ＿ｐｏｃ＿ｐｒｏｐｏｒｔｉｏｎａｌ＿ｔｏ＿ｔｉｍｉｎｇ＿ｆｌａｇ及びｖｕｉ＿ｈｒｄ＿ｐａｒａｍｅｔｅｒｓ＿ｐｒｅｓｅｎｔ＿ｆｌａｇが存在することを規定し、０に等しいｖｕｉ＿ｔｉｍｉｎｇ＿ｉｎｆｏ＿ｐｒｅｓｅｎｔ＿ｆｌａｇは、ｖｕｉ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造に、ｖｕｉ＿ｎｕｍ＿ｕｎｉｔｓ＿ｉｎ＿ｔｉｃｋ、ｖｕｉ＿ｔｉｍｅ＿ｓｃａｌｅ、ｖｕｉ＿ｐｏｃ＿ｐｒｏｐｏｒｔｉｏｎａｌ＿ｔｏ＿ｔｉｍｉｎｇ＿ｆｌａｇ及びｖｕｉ＿ｈｒｄ＿ｐａｒａｍｅｔｅｒｓ＿ｐｒｅｓｅｎｔ＿ｆｌａｇが存在しないことを規定する。
ｖｕｉ＿ｎｕｍ＿ｕｎｉｔｓ＿ｉｎ＿ｔｉｃｋは、クロックティックカウンタの１増分（クロック単位と呼ばれる）に対応する周波数ｖｕｉ＿ｔｉｍｅ＿ｓｃａｌｅＨｚで動作するクロックの時間ユニットの数である。ｖｕｉ＿ｎｕｍ＿ｕｎｉｔｓ＿ｉｎ＿ｔｉｃｋは、０よりも大きいものとする。秒単位でのクロック単位は、ｖｕｉ＿ｔｉｍｅ＿ｓｃａｌｅで除算されたｖｕｉ＿ｎｕｍ＿ｕｎｉｔｓ＿ｉｎ＿ｔｉｃｋの商に等しい。例えば、動画像信号のピクチャレートが２５Ｈｚである場合、ｖｐｓ＿ｔｉｍｅ＿ｓｃａｌｅは２７００００００に等しくてよく、ｖｐｓ＿ｎｕｍ＿ｕｎｉｔｓ＿ｉｎ＿ｔｉｃｋは１０８００００に等しくてよく、したがってクロック単位は０．０４秒であってよい。
ｖｐｓ＿ｎｕｍ＿ｕｎｉｔｓ＿ｉｎ＿ｔｉｃｋがＳＰＳによって参照されるＶＰＳで存在する場合において、ｖｐｓ＿ｎｕｍ＿ｕｎｉｔｓ＿ｉｎ＿ｔｉｃｋが存在する場合は、ｖｐｓ＿ｎｕｍ＿ｕｎｉｔｓ＿ｉｎ＿ｔｉｃｋに等しいものとし、ｖｕｉ＿ｎｕｍ＿ｕｎｉｔｓ＿ｉｎ＿ｔｉｃｋが存在しない場合は、ｖｐｓ＿ｎｕｍ＿ｕｎｉｔｓ＿ｉｎ＿ｔｉｃｋに等しいものと推測される。
ｖｕｉ＿ｔｉｍｅ＿ｓｃａｌｅは、１秒間に通過する時間ユニットの数である。例えば、２７ＭＨｚクロックを使用して時間を測定する時間座標系は、２７００００００のｖｕｉ＿ｔｉｍｅ＿ｓｃａｌｅを有する。ｖｕｉ＿ｔｉｍｅ＿ｓｃａｌｅの値は、０よりも大きいものとする。ｖｐｓ＿ｔｉｍｅ＿ｓｃａｌｅがＳＰＳによって参照されるＶＰＳで存在する場合において、ｖｕｉ＿ｔｉｍｅ＿ｓｃａｌｅが存在する場合は、ｖｐｓ＿ｔｉｍｅ＿ｓｃａｌｅに等しいものとし、ｖｐｓ＿ｔｉｍｅ＿ｓｃａｌｅが存在しない場合は、ｖｐｓ＿ｔｉｍｅ＿ｓｃａｌｅに等しいものと推測される。
１に等しいｖｕｉ＿ｈｒｄ＿ｐａｒａｍｅｔｅｒｓ＿ｐｒｅｓｅｎｔ＿ｆｌａｇは、ｖｕｉ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造に、シンタックス構造ｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（）が存在することを規定し、０に等しいｖｕｉ＿ｈｒｄ＿ｐａｒａｍｅｔｅｒｓ＿ｐｒｅｓｅｎｔ＿ｆｌａｇは、ｖｕｉ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造に、シンタックス構造ｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（）が存在しないことを規定する。

ｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（）が１に等しいｆｉｘｅｄ＿ｐｉｃ＿ｒａｔｅ＿ｇｅｎｅｒａｌ＿ｆｌａｇ［ｉ］を含むことは、ＨｉｇｈｅｓｔＴｉｄがｉに等しい場合、出力順に連続したピクチャのＨＲＤ出力時間の間の時間的距離が、以下に規定されるように制約されることを示す。０に等しいｆｉｘｅｄ＿ｐｉｃ＿ｒａｔｅ＿ｇｅｎｅｒａｌ＿ｆｌａｇ［ｉ］は、この制約が適用されなくてもよいことを示す。
ｆｉｘｅｄ＿ｐｉｃ＿ｒａｔｅ＿ｇｅｎｅｒａｌ＿ｆｌａｇ［ｉ］が存在しない場合、０に等しいと推測される。
１に等しいｆｉｘｅｄ＿ｐｉｃ＿ｒａｔｅ＿ｗｉｔｈｉｎ＿ｃｖｓ＿ｆｌａｇ［ｉ］は、ＨｉｇｈｅｓｔＴｉｄがｉに等しい場合、出力順に連続するピクチャのＨＲＤ出力時間の間の時間的距離が、以下に規定するように制約されることを示し、０に等しいｆｉｘｅｄ＿ｐｉｃ＿ｒａｔｅ＿ｗｉｔｈｉｎ＿ｃｖｓ＿ｆｌａｇ［ｉ］は、この制約が適用されなくてもよいことを示す。ｆｉｘｅｄ＿ｐｉｃ＿ｒａｔｅ＿ｇｅｎｅｒａｌ＿ｆｌａｇ［ｉ］が１に等しい場合、ｆｉｘｅｄ＿ｐｉｃ＿ｒａｔｅ＿ｗｉｔｈｉｎ＿ｃｖｓ＿ｆｌａｇ［ｉ］の値は、１に等しいと推測される。

更に、ＩＴＵ−ＴＨ．２６５は、ピクチャクロッピングをサポートする。すなわち、ピクチャは、ピクチャサイズに応じて符号化されてもよく、クロッピングされたピクチャサイズに従って出力（例えば、ディスプレイ用）されてもよい。ＩＴＵ−ＴＨ．２６５の第７節における一般シーケンスパラメータセットＲＢＳＰセマンティクス及びＩＴＵ−ＴＨ．２６５の付属書類Ｆにおける一般シーケンスパラメータセットＲＢＳＰセマンティクスには、以下の定義されたシンタックス要素が含まれる：
１に等しいｃｏｎｆｏｒｍａｎｃｅ＿ｗｉｎｄｏｗ＿ｆｌａｇは、適合クロッピングウィンドウオフセットパラメータがＳＰＳで次に続くことを示し、０に等しいｃｏｎｆｏｒｍａｎｃｅ＿ｗｉｎｄｏｗ＿ｆｌａｇは、適合クロッピングウィンドウオフセットパラメータ（すなわち、ｃｏｎｆ＿ｗｉｎ＿ｌｅｆｔ＿ｏｆｆｓｅｔ、ｃｏｎｆ＿ｗｉｎ＿ｒｉｇｈｔ＿ｏｆｆｓｅｔ、ｃｏｎｆ＿ｗｉｎ＿ｔｏｐ＿ｏｆｆｓｅｔ及びｃｏｎｆ＿ｗｉｎ＿ｂｏｔｔｏｍ＿ｏｆｆｓｅｔ）が存在しないことを示す。
ｃｏｎｆ＿ｗｉｎ＿ｌｅｆｔ＿ｏｆｆｓｅｔ、ｃｏｎｆ＿ｗｉｎ＿ｒｉｇｈｔ＿ｏｆｆｓｅｔ、ｃｏｎｆ＿ｗｉｎ＿ｔｏｐ＿ｏｆｆｓｅｔ及びｃｏｎｆ＿ｗｉｎ＿ｂｏｔｔｏｍ＿ｏｆｆｓｅｔは、出力のためにピクチャ座標で規定された矩形領域として、復号プロセスから出力されるＣＶＳ内のピクチャサンプルを規定する。ｃｏｎｆｏｒｍａｎｃｅ＿ｗｉｎｄｏｗ＿ｆｌａｇが０に等しい場合、ｃｏｎｆ＿ｗｉｎ＿ｌｅｆｔ＿ｏｆｆｓｅｔ，ｃｏｎｆ＿ｗｉｎ＿ｒｉｇｈｔ＿ｏｆｆｓｅｔ、ｃｏｎｆ＿ｗｉｎ＿ｔｏｐ＿ｏｆｆｓｅｔ及びｃｏｎｆ＿ｗｉｎ＿ｂｏｔｔｏｍ＿ｏｆｆｓｅｔの値は０に等しいと推測される。

適合クロッピングウィンドウには、両端値を含む、ＳｕｂＷｉｄｔｈＣ^＊ｃｏｎｆ＿ｗｉｎ＿ｌｅｆｔ＿ｏｆｆｓｅｔからｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ−（ＳｕｂＷｉｄｔｈＣ^＊ｃｏｎｆ＿ｗｉｎ＿ｒｉｇｈｔ＿ｏｆｆｓｅｔ＋１）までの水平方向のピクチャ座標、及びＳｕｂＨｅｉｇｈｔＣ^＊ｃｏｎｆ＿ｗｉｎ＿ｔｏｐ＿ｏｆｆｓｅｔからｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ−（ＳｕｂＨｅｉｇｈｔＣ^＊ｃｏｎｆ＿ｗｉｎ＿ｂｏｔｔｏｍ＿ｏｆｆｓｅｔ＋１）までの垂直方向のピクチャ座標を伴う、ルマサンプルが含まれる。

ＳｕｂＷｉｄｔｈＣ^＊（ｃｏｎｆ＿ｗｉｎ＿ｌｅｆｔ＿ｏｆｆｓｅｔ＋ｃｏｎｆ＿ｗｉｎ＿ｒｉｇｈｔ＿ｏｆｆｓｅｔ）の値は、ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓよりも小さいものとし、ＳｕｂＨｅｉｇｈｔＣ＊（ｃｏｎｆ＿ｗｉｎ＿ｔｏｐ＿ｏｆｆｓｅｔ＋ｃｏｎｆ＿ｗｉｎ＿ｂｏｔｔｏｍ＿ｏｆｆｓｅｔ）の値は、ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓよりも小さいものとする。

ＣｈｒｏｍａＡｒｒａｙＴｙｐｅが０に等しくない場合、対応する２つのクロマアレイの規定サンプルは、ピクチャ座標（ｘ／ＳｕｂＷｉｄｔｈＣ，ｙ／ＳｕｂＨｅｉｇｈｔＣ）を有するサンプルであり、ここで、（ｘ，ｙ）は規定されたルマサンプルのピクチャ座標である。

注３−適合クロッピングウィンドウオフセットパラメータは、出力にのみ適用される。全ての内部復号プロセスは、クロッピングされていないピクチャサイズに適用される。

更に、表現フォーマットシンタックス及びＩＴＵ−ＴＨ．２６５の付属書類Ｆは、以下の定義されたシンタックス要素を含む：
１に等しいｃｏｎｆｏｒｍａｎｃｅ＿ｗｉｎｄｏｗ＿ｖｐｓ＿ｆｌａｇは、シンタックス要素ｃｏｎｆ＿ｗｉｎ＿ｖｐｓ＿ｌｅｆｔ＿ｏｆｆｓｅｔ、ｃｏｎｆ＿ｗｉｎ＿ｖｐｓ＿ｒｉｇｈｔ＿ｏｆｆｓｅｔ、ｃｏｎｆ＿ｗｉｎ＿ｖｐｓ＿ｔｏｐ＿ｏｆｆｓｅｔ及びｃｏｎｆ＿ｗｉｎ＿ｖｐｓ＿ｂｏｔｔｏｍ＿ｏｆｆｓｅｔがｒｅｐ＿ｆｏｒｍａｔ（）構造内で次に続くことを示し、０に等しいｃｏｎｆｏｒｍａｎｃｅ＿ｗｉｎｄｏｗ＿ｖｐｓ＿ｆｌａｇは、シンタックス要素ｃｏｎｆ＿ｗｉｎ＿ｖｐｓ＿ｌｅｆｔ＿ｏｆｆｓｅｔ、ｃｏｎｆ＿ｗｉｎ＿ｖｐｓ＿ｒｉｇｈｔ＿ｏｆｆｓｅｔ、ｃｏｎｆ＿ｗｉｎ＿ｖｐｓ＿ｔｏｐ＿ｏｆｆｓｅｔ及びｃｏｎｆ＿ｗｉｎ＿ｖｐｓ＿ｂｏｔｔｏｍ＿ｏｆｆｓｅｔが存在しないことを規定する。
ｃｏｎｆ＿ｗｉｎ＿ｖｐｓ＿ｌｅｆｔ＿ｏｆｆｓｅｔ、ｃｏｎｆ＿ｗｉｎ＿ｖｐｓ＿ｒｉｇｈｔ＿ｏｆｆｓｅｔ、ｃｏｎｆ＿ｗｉｎ＿ｖｐｓ＿ｔｏｐ＿ｏｆｆｓｅｔ及びｃｏｎｆ＿ｗｉｎ＿ｖｐｓ＿ｂｏｔｔｏｍ＿ｏｆｆｓｅｔは、それぞれ、ＶＰＳを参照する各ＳＰＳに対し、ＳＰＳシンタックス要素ｃｏｎｆ＿ｗｉｎ＿ｌｅｆｔ＿ｏｆｆｓｅｔ、ｃｏｎｆ＿ｗｉｎ＿ｒｉｇｈｔ＿ｏｆｆｓｅｔ、ｃｏｎｆ＿ｗｉｎ＿ｔｏｐ＿ｏｆｆｓｅｔ及びｃｏｎｆ＿ｗｉｎ＿ｂｏｔｔｏｍ＿ｏｆｆｓｅｔの値の推測に使用される。ｃｏｎｆ＿ｗｉｎ＿ｖｐｓ＿ｌｅｆｔ＿ｏｆｆｓｅｔ、ｃｏｎｆ＿ｗｉｎ＿ｖｐｓ＿ｔｏｐ＿ｏｆｆｓｅｔ及びｃｏｎｆ＿ｗｉｎ＿ｖｐｓ＿ｂｏｔｔｏｍ＿ｏｆｆｓｅｔの値が存在しない場合、ｃｏｎｆ＿ｗｉｎ＿ｖｐｓ＿ｌｅｆｔ＿ｏｆｆｓｅｔ、ｃｏｎｆ＿ｗｉｎ＿ｖｐｓ＿ｔｏｐ＿ｏｆｆｓｅｔ及びｃｏｎｆ＿ｗｉｎ＿ｖｐｓ＿ｂｏｔｔｏｍ＿ｏｆｆｓｅｔの値は０に等しいと推測される。

ＳｕｂＷｉｄｔｈＣ^＊（ｃｏｎｆ＿ｗｉｎ＿ｖｐｓ＿ｌｅｆｔ＿ｏｆｆｓｅｔ＋ｃｏｎｆ＿ｗｉｎ＿ｖｐｓ＿ｒｉｇｈｔ＿ｏｆｆｓｅｔ）の値は、ｐｉｃ＿ｗｉｄｔｈ＿ｖｐｓ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓよりも小さいものとし、ＳｕｂＨｅｉｇｈｔＣ＊（ｃｏｎｆ＿ｗｉｎ＿ｖｐｓ＿ｔｏｐ＿ｏｆｆｓｅｔ＋ｃｏｎｆ＿ｗｉｎ＿ｖｐｓ＿ｂｏｔｔｏｍ＿ｏｆｆｓｅｔ）の値は、ｐｉｃ＿ｈｅｉｇｈｔ＿ｖｐｓ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓよりも小さいものとする。
これらの表現フォーマットシンタックス要素ｃｏｎｆｏｒｍａｎｃｅ＿ｗｉｎｄｏｗ＿ｖｐｓ＿ｆｌａｇ、ｃｏｎｆ＿ｗｉｎ＿ｖｐｓ＿ｌｅｆｔ＿ｏｆｆｓｅｔ、ｃｏｎｆ＿ｗｉｎ＿ｖｐｓ＿ｒｉｇｈｔ＿ｏｆｆｓｅｔ、ｃｏｎｆ＿ｗｉｎ＿ｖｐｓ＿ｔｏｐ＿ｏｆｆｓｅｔ及びｃｏｎｆ＿ｗｉｎ＿ｖｐｓ＿ｂｏｔｔｏｍ＿ｏｆｆｓｅｔは、動画像パラメータセット拡張（ｖｐｓ＿ｅｘｔｅｎｓｉｏｎ（））に含まれてもよい。

従って、マルチレイヤＨＥＶＣ表示の１つ以上の特性及び／又はパラメータは、ＩＴＵ−ＴＨ．２６５が提供するセマンティクスに従ってシグナリングされてもよい。ＩＴＵ−ＴＨ．２６５は、特性及び／又はパラメータがシグナリングされ得る方法及び場合に関して柔軟性を提供することに留意されたい。

マルチレイヤードＨＥＶＣ表示は、データ構造に従ってカプセル化されてもよい。ＩＳＯ／ＩＥＣ１４４９６−１５，ＴｈｉｒｄＥｄｉｔｉｏｎ，「Ｉｎｆｏｒｍａｔｉｏｎｔｅｃｈｎｏｌｏｇｙ−−Ｃｏｄｉｎｇｏｆａｕｄｉｏ−ｖｉｓｕａｌｏｂｊｅｃｔｓ−−ＣａｒｒｉａｇｅｏｆＮＡＬｕｎｉｔｓｔｒｕｃｔｕｒｅｄｖｉｄｅｏｉｎｔｈｅＩＳＯＢａｓｅＭｅｄｉａＦｉｌｅＦｏｒｍａｔ」（以下、「ＩＳＯ−ＶＩＤＥＯ」）は、参照により組み込まれ、マルチレイヤＨＥＶＣ表示をカプセル化するためのデータ構造を説明している。ＩＳＯ−ＶＩＤＥＯは、ＮＡＬユニット（例えば、ＩＴＵ−ＴＨ．２６４及びＩＴＵ−ＴＨ．２６５）として構造化される動画像のストリームのためのストレージフォーマットを規定する。図３は、符号化動画像データ及び対応するメタデータをカプセル化するメディアファイルを示す概念図である。図３の例示的なメディアファイル３０２は、符号化動画像データとメタデータとの間の論理関係を示すことを意図していることに留意されたい。簡潔にするために、メディアファイルに含まれるデータ（例えば、ファイルヘッダ、テーブル、ボックスタイプなど）の完全な説明は提供されない。

ＩＳＯ／ＩＥＣ１４４９６−１５では、アグリゲータ、エクストラクタは、次のように定義される：
同じサンプルに属するＮＡＬユニットをグループ化するために、ＮＡＬユニットヘッダを使用するアグリゲータインストリーム構造（aggregator in-stream structure）。
他のトラックからデータを抽出するために、ＮＡＬユニットヘッダを使用するエクストラクタインストリーム構造（extractors in-stream structure）。
注：エクストラクタは、他のトラックからデータを抽出する方法に関する命令を含む。論理的に、エクストラクタはデータへのポインタとして見ることができる。エクストラクタが含まれているトラックを読み出す間に、エクストラクタはそれが指しているデータに置き換えられる。

サンプルは、単一のタイムスタンプと関連付けられた全てのデータであってもよい。

図３に示す例では、メディアファイル３０２は、メタデータコンテナ３０４を参照する動画像エレメンタリストリーム３０８Ａ〜３０８Ｎを含む。図３に示すように、ビデオストリーム３０８Ａ〜３０８Ｎは、アクセスユニット３１０Ａ〜３１０Ｎにグループ化されたＮＡＬユニット３１２Ａ〜〜３１２Ｎを含む。前述したように、ＮＡＬユニットは、ＶＣＬ−ＮＡＬユニット及び非ＶＣＬユニットを含んでもよい。図３に更に示すように、メタデータコンテナ３０４は、メタデータボックス３０６Ａ〜３０６Ｂを含む。場合によっては、メタデータボックスは、メタデータオブジェクトと呼ばれることもあるという点に留意されたい。一実施例では、メタデータボックス３０６Ａ〜３０６Ｂは、パラメータセット（例えば、上述のＩＴＵ−ＴＨ．２６５パラメータセットのうちの１つ以上）を含んでもよい。したがって、パラメータセットは、メタデータボックス３０６Ａ〜３０６Ｂ（「アウトオブバンド」（out-of-band）と呼ばれることがある）及び／又は動画像エレメンタリストリーム（「インバンド」（in-band）と呼ばれることがある）に含まれてもよい。いくつかの実施例では、ビデオストリームは、ビデオトラックと呼ばれることもあるという点に留意されたい。更に、ファイルフォーマットは、異なるタイプの構成を定義することができることに留意されたい。例えば、ファイルフォーマットは、１つ以上のボックスタイプを規定することができる。ファイルフォーマットの構成は、ファイルフォーマットのインスタンスに含まれ得るビデオストリームの特性に基づいて定義することができる。例えば、ボックスタイプは、ビデオストリームに適用される１つ以上の制約に基づいて定義される場合があり、例えば、ボックスタイプは、各ビデオストリームが、各アクセスユニット内に特定数の特定タイプのＮＡＬユニットを有することを必要とする場合がある。更に、ボックスタイプは、メタデータボックス内に含まれる動画像表示のうちの１つ以上の特性及び／又はパラメータを必要とする場合がある。表１は、ＩＳＯ−ＶＩＤＥＯで規定された動画像表示の構成の概要を提供する。

したがって、表１に示すように、ＩＳＯ−ＶＩＤＥＯは、マルチレイヤ拡張を含むベースのＨＥＶＣ表示（拡張子なし）及び／又はＨＥＶＣ表示をサポートすることができる規定された構成を含む。更に、ＩＳＯ−ＶＩＤＥＯは、Ｌ−ＨＥＶＣストリームを多数の方法でトラック内に配置することができるように提供し、その中には、次のようなものがある。１つのトラック内の全てのレイヤ、それ自体のトラックの各レイヤ、ハイブリッド方式で、全てのレイヤを含む１つのトラック及び１つ以上の単一レイヤトラック、トラック内の予想される動作点（例えば、ＨＥＶＣベース、ステレオペア、マルチビューシーン）。

更に、ＩＳＯ−ＶＩＤＥＯは、Ｌ−ＨＥＶＣビットストリームが複数のトラックによって表され、レイヤが複数のトラックに記憶されている動作点をプレーヤが使用する場合、プレーヤがＬ−ＨＥＶＣ復号装置に受け渡す前にＬ−ＨＥＶＣアクセスユニットを再構築しなければならないことを定めている。ＩＳＯ−ＶＩＤＥＯでは、Ｌ−ＨＥＶＣ動作点は、トラックによって明示的に表され得る。すなわち、トラック内の各サンプルは、アクセスユニットを含み、アクセスユニットのＮＡＬユニットの一部又は全ては、エクストラクタ及びアグリゲータに含まれ得るか又は参照され得る。ＩＳＯ−ＶＩＤＥＯでは、Ｌ−ＨＥＶＣビットストリームの記憶は、サンプルエントリ、動作点情報（「ｏｉｎｆ」）サンプルグループ及びレイヤ情報（「ｌｉｎｆ」）サンプルグループなどの構造によってサポートされる。サンプルエントリ内の構造は、そのサンプルエントリに関連付けられたサンプル、この場合は符号化動画像情報、の復号化又は使用のための情報を提供する。動作点情報サンプルグループは、動作点を構成するレイヤ及びサブレイヤのような動作点に関する情報、それらの間の依存関係（該当する場合）、動作点のプロファイル、レベル及びティアパラメータ、並びに他のこのような動作点関連情報を記録する。レイヤ情報サンプルグループには、トラックのサンプルに保持されている全てのレイヤ及びサブレイヤが一覧表示される。トラックを見つけるためにトラック参照を使用して組み合わされた、これらのサンプルグループ内の情報は、読み手がその機能に従って動作点を選択し、選択された動作点を復号するために必要な関連レイヤ及びサブレイヤを含むトラックを識別し、それらを効率的に抽出するのに十分である。

Ｋ．Ｈｕｇｈｅｓ，Ｄ．Ｓｉｎｇｅｒ，Ｋ．Ｋｏｌａｒｏｖ，Ｉ．Ｓｏｄａｇａｒ，「ＣｏｍｍｏｎＭｅｄｉａＡｐｐｌｉｃａｔｉｏｎＦｏｒｍａｔｆｏｒＳｅｇｍｅｎｔｅｄＭｅｄｉａ− ＣＭＡＦ」（２０１６年５月）に記載されているＣｏｍｍｏｎＭｅｄｉａＡｐｐｌｉｃａｔｉｏｎＦｏｒｍａｔ（ＣＭＡＦ）は、本明細書に参照として組み込まれており、多様な適応ストリーミング、ブロードキャスト、ダウンロード及びストレージ配信技術（storage delivery techniques）と互換性があり得る幅広いデバイスへの、単一の暗号化された適応可能なマルチメディア表示の大規模配信を行うために最適化されることを意図したメディアアプリケーションフォーマットを定義している。以下で更に詳細に説明する図４は、多様な適応ストリーミング、ブロードキャスト、ダウンロード及びストレージ配信技術と互換性のあり得る幅広いデバイスを含むシステムを含む。ＣＭＡＦは現在、マルチレイヤＨＥＶＣをサポートしていないことに留意されたい。本明細書で説明した技術は、ＣＭＡＦベースのファイルフォーマットがマルチレイヤＨＥＶＣをサポートし得るための効率的な方法を提供するために使用されてもよい。

図１は、本開示の１つ以上の技術に係る、動画像データを符号化する（すなわち、符号化及び／又は復号する）ように構成することができるシステムの一例を示すブロック図である。システム１００は、本開示の１つ以上の技術係る、動画像データをカプセル化することができるシステムの一例を表す。図１に示すように、システム１００は、ソースデバイス１０２と、通信媒体１１０と、宛先デバイス１２０と、を含む。図１に示す例では、ソースデバイス１０２は、動画像データを符号化し、符号化した動画像データを通信媒体１１０に送信するように構成された、任意のデバイスを含むことができる。宛先デバイス１２０は、通信媒体１１０を介して符号化した動画像データを受信し、符号化した動画像データを復号するように構成された、任意のデバイスを含むことができる。ソースデバイス１０２及び／又は宛先デバイス１２０は、有線通信及び／又は無線通信用に装備された演算デバイスを含むことができ、かつ、例えば、セットトップボックス、デジタルビデオレコーダ、テレビ、デスクトップ、ラップトップ又はタブレットコンピュータ、ゲーム機、医療用撮像デバイス、並びに、例えば、スマートフォン、セルラー電話、パーソナルゲーミングデバイスを含むモバイルデバイス、を含むことができる。

通信媒体１１０は、無線及び有線の通信媒体並びに／又は記憶デバイスの任意の組み合わせを含むことができる。通信媒体１１０としては、同軸ケーブル、光ファイバケーブル、ツイストペアケーブル、無線送信機及び受信機、ルータ、スイッチ、リピータ、基地局、又は様々なデバイスとサイトとの間の通信を容易にするために有用であり得る任意の他の機器を挙げることができる。通信媒体１１０は、１つ以上のネットワークを含むことができる。例えば、通信媒体１１０は、ワールドワイドウェブ、例えば、インターネットへのアクセスを可能にするように構成されたネットワークを含むことができる。ネットワークは、１つ以上の電気通信プロトコルの組み合わせに従って動作することができる。電気通信プロトコルは、独自の態様を含むことができ、及び／又は規格化された電気通信プロトコルを含むことができる。規格化された電気通信プロトコルの例としては、ＤｉｇｉｔａｌＶｉｄｅｏＢｒｏａｄｃａｓｔｉｎｇ（ＤＶＢ）規格、ＡｄｖａｎｃｅｄＴｅｌｅｖｉｓｉｏｎＳｙｓｔｅｍｓＣｏｍｍｉｔｔｅｅ（ＡＴＳＣ）規格、ＩｎｔｅｇｒａｔｅｄＳｅｒｖｉｃｅｓＤｉｇｉｔａｌＢｒｏａｄｃａｓｔｉｎｇ（ＩＳＤＢ）規格、ＤａｔａＯｖｅｒＣａｂｌｅＳｅｒｖｉｃｅＩｎｔｅｒｆａｃｅＳｐｅｃｉｆｉｃａｔｉｏｎ（ＤＯＣＳＩＳ）規格、ＧｌｏｂａｌＳｙｓｔｅｍＭｏｂｉｌｅＣｏｍｍｕｎｉｃａｔｉｏｎｓ（ＧＳＭ）規格、符号分割多重アクセス（ｃｏｄｅｄｉｖｉｓｉｏｎｍｕｌｔｉｐｌｅａｃｃｅｓｓ）（ＣＤＭＡ）規格、第三世代パートナーシッププロジェクト（3rd Generation Partnership Project）（３ＧＰＰ）規格、欧州電気通信標準化機構（European Telecommunications Standards Institute）（ＥＴＳＩ）規格、インターネットプロトコル（Internet Protocol）（ＩＰ）規格、ワイヤレスアプリケーションプロトコル（WirelessApplication Protocol）（ＷＡＰ）規格、及びＩｎｓｔｉｔｕｔｅｏｆＥｌｅｃｔｒｉｃａｌａｎｄＥｌｅｃｔｒｏｎｉｃｓＥｎｇｉｎｅｅｒｓ（ＩＥＥＥ）規格が挙げられる。

記憶デバイスは、データを記憶することができる任意の種類のデバイス又は記憶媒体を含むことができる。記憶媒体は、有形又は非一時的コンピュータ可読媒体を含むことができる。コンピュータ可読媒体としては、光学ディスク、フラッシュメモリ、磁気メモリ、又は任意の他の好適なデジタル記憶媒体を挙げることができる。いくつかの例では、メモリデバイス又はその一部分は不揮発性メモリとして説明されることがあり、他の例では、メモリデバイスの一部分は揮発性メモリとして説明されることがある。揮発性メモリの例としては、ランダムアクセスメモリ（random access memory）（ＲＡＭ）、ダイナミックランダムアクセスメモリ（dynamic random access memory）（ＤＲＡＭ）、及びスタティックランダムアクセスメモリ（static random access memory）（ＳＲＡＭ）を挙げることができる。不揮発性メモリの例としては、磁気ハードディスク、光学ディスク、フロッピーディスク、フラッシュメモリ、又は電気的プログラム可能メモリ（electrically programmable memory）（ＥＰＲＯＭ）若しくは電気的消去可能及びプログラム可能メモリ（electrically erasable and programmable memory）（ＥＥＰＲＯＭ）の形態を挙げることができる。記憶デバイス（単数又は複数）としては、メモリカード（例えば、セキュアデジタル（Secure Digital）（ＳＤ）メモリカード）、内蔵／外付けハードディスクドライブ、及び／又は内蔵／外付けソリッドステートドライブを挙げることができる。データは、定義されたファイルフォーマットに従って記憶デバイス上に記憶することができる。

図４は、システム１００の一実装形態に含まれ得る構成要素の一例を示す概念図である。図４に示す例示的な実装形態では、システム１００は、１つ以上の演算デバイス４０２Ａ〜４０２Ｎ、テレビサービスネットワーク４０４、テレビサービスプロバイダサイト４０６、ワイドエリアネットワーク４０８、ローカルエリアネットワーク４１０、及び１つ以上のコンテンツプロバイダサイト４１２Ａ〜４１２Ｎを含む。図４に示す実装形態は、例えば、映画、ライブスポーツイベントなどのデジタルメディアコンテンツ、並びにデータ及びアプリケーション及びそれらに関連付けられたメディアプレゼンテーションが、演算デバイス４０２Ａ〜４０２Ｎなどの複数の演算デバイスに配信され、かつ、それらによってアクセスされることが可能となるように構成することができるシステムの一例を表す。図４に示す例では、演算デバイス４０２Ａ〜４０２Ｎは、テレビサービスネットワーク４０４、ワイドエリアネットワーク４０８、及び／又はローカルエリアネットワーク４１０のうちの１つ以上からデータを受信するように構成されている任意のデバイスを含むことができる。例えば、演算デバイス４０２Ａ〜４０２Ｎは、有線通信及び／又は無線通信用に装備されてもよく、１つ以上のデータチャネルを通じてサービスを受信するように構成されてもよく、いわゆるスマートテレビ、セットトップボックス、及びデジタルビデオレコーダを含むテレビを含んでもよい。更に、演算デバイス４０２Ａ〜４０２Ｎは、デスクトップ、ラップトップ又はタブレットコンピュータ、ゲーム機、例えば「スマート」フォン、セルラー電話、及びパーソナルゲーミングデバイスを含むモバイルデバイスを含んでもよい。

テレビサービスネットワーク４０４は、テレビサービスを含み得る、デジタルメディアコンテンツの配信を可能にするように構成されているネットワークの一例である。例えば、テレビサービスネットワーク４０４は、公共地上波テレビネットワーク、公共又は加入ベースの衛星テレビサービスプロバイダネットワーク、並びに公共又は加入ベースのケーブルテレビプロバイダネットワーク及び／又は頭越し型（over the top）サービスプロバイダ若しくはインターネットサービスプロバイダを含んでもよい。いくつかの実施例では、テレビサービスネットワーク４０４は、テレビサービスの提供を可能にするために主に使用され得るが、テレビサービスネットワーク４０４はまた、本明細書で説明した電気通信プロトコルの任意の組み合わせに基づく他の種類のデータ及びサービスの提供も可能とすることに留意されたい。更に、いくつかの実施例では、テレビサービスネットワーク４０４は、テレビサービスプロバイダサイト４０６と、演算デバイス４０２Ａ〜４０２Ｎのうちの１つ以上との間の双方向通信を可能にすることができることに留意されたい。テレビサービスネットワーク４０４は、無線通信媒体及び／又は有線通信媒体の任意の組み合わせを含むことができる。テレビサービスネットワーク４０４は、同軸ケーブル、光ファイバケーブル、ツイストペアケーブル、無線送信機及び受信機、ルータ、スイッチ、リピータ、基地局、又は様々なデバイスとサイトとの間の通信を容易にするために有用であり得る任意の他の機器を含むことができる。テレビサービスネットワーク４０４は、１つ以上の電気通信プロトコルの組み合わせに従って動作することができる。電気通信プロトコルは、独自の態様を含むことができ、及び／又は規格化された電気通信プロトコルを含むことができる。規格化された電気通信プロトコルの例としては、ＤＶＢ規格、ＡＴＳＣ規格、ＩＳＤＢ規格、ＤＴＭＢ規格、ＤＭＢ規格、ケーブルによるデータサービスインターフェース標準（Data Over Cable Service Interface Specification）（ＤＯＣＳＩＳ）規格、ＨｂｂＴＶ規格、Ｗ３Ｃ規格、及びＵＰｎＰ規格が挙げられる。

図４を再び参照すると、テレビサービスプロバイダサイト４０６は、テレビサービスネットワーク４０４を介してテレビサービスを配信するように構成することができる。例えば、テレビサービスプロバイダサイト４０６は、１つ以上の放送局、ケーブルテレビプロバイダ、又は衛星テレビプロバイダ、又はインターネットベースのテレビプロバイダを含み得る。例えば、テレビサービスプロバイダサイト４０６は、衛星アップリンク／ダウンリンクを介したテレビプログラムを含む送信を、受信するように構成することができる。更に、図４に示すように、テレビサービスプロバイダサイト４０６は、ワイドエリアネットワーク４０８と通信することができ、コンテンツプロバイダサイト４１２Ａ〜４１２Ｎからデータを受信するように構成することができる。いくつかの実施例では、テレビサービスプロバイダサイト４０６は、テレビスタジオを含むことができ、コンテンツはそこから発信できることに留意されたい。

ワイドエリアネットワーク４０８は、パケットベースのネットワークを含み、１つ以上の電気通信プロトコルの組み合わせに従って動作することができる。電気通信プロトコルは、独自の態様を含むことができ、及び／又は規格化された電気通信プロトコルを含むことができる。規格化された電気通信プロトコルの例としては、汎欧州デジタル移動電話方式（Global System Mobile Communications）（ＧＳＭ）規格、符号分割多元接続（code division multiple access）（ＣＤＭＡ）規格、３ｒｄＧｅｎｅｒａｔｉｏｎＰａｒｔｎｅｒｓｈｉｐＰｒｏｊｅｃｔ（３ＧＰＰ）規格、欧州電気通信標準化機構（European Telecommunications Standards Institute）（ＥＴＳＩ）規格、欧州規格（ＥＮ）、ＩＰ規格、ワイヤレスアプリケーションプロトコル（Wireless Application Protocol）（ＷＡＰ）規格、及び例えば、ＩＥＥＥ８０２規格のうちの１つ以上（例えば、Ｗｉ−Ｆｉ）などの電気電子技術者協会（Institute of Electrical and Electronics Engineers）（ＩＥＥＥ）規格が挙げられる。ワイドエリアネットワーク４０８は、無線通信媒体及び／又は有線通信媒体の任意の組み合わせを含むことができる。ワイドエリアネットワーク４８０は、同軸ケーブル、光ファイバケーブル、ツイストペアケーブル、イーサネットケーブル、無線送信部及び受信部、ルータ、スイッチ、リピータ、基地局、又は様々なデバイス及びサイト間の通信を容易にするために有用であり得る任意の他の機器を含むことができる。一実施例では、ワイドエリアネットワーク４０８はインターネットを含んでもよい。ローカルエリアネットワーク４１０は、パケットベースのネットワークを含み、１つ以上の電気通信プロトコルの組み合わせに従って動作することができる。ローカルエリアネットワーク４１０は、アクセス及び／又は物理インフラストラクチャのレベルに基づいてワイドエリアネットワーク４０８と区別することができる。例えば、ローカルエリアネットワーク４１０は、セキュアホームネットワークを含んでもよい。

図４を再び参照すると、コンテンツプロバイダサイト４１２Ａ〜４１２Ｎは、マルチメディアコンテンツをテレビサービスプロバイダサイト４０６及び／又は演算デバイス４０２Ａ〜４０２Ｎに提供することができるサイトの例を表す。例えば、コンテンツプロバイダサイトは、マルチメディアファイル及び／又はストリームをテレビサービスプロバイダサイト４０６に提供するように構成されている、１つ以上のスタジオコンテンツサーバを有するスタジオを含むことができる。一実施例では、コンテンツプロバイダのサイト４１２Ａ〜４１２Ｎは、ＩＰスイートを使用してマルチメディアコンテンツを提供するように構成することができる。例えば、コンテンツプロバイダサイトは、リアルタイムストリーミングプロトコル（ＲＴＳＰ）、ＨＴＴＰなどに従って、マルチメディアコンテンツを受信デバイスに提供するように構成されてもよい。更に、コンテンツプロバイダサイト４１２Ａ〜４１２Ｎは、ハイパーテキストベースのコンテンツなどを含むデータを、ワイドエリアネットワーク４０８を通じて、受信デバイスである演算デバイス４０２Ａ〜４０２Ｎ、及び／又はテレビサービスプロバイダサイト４０６のうちの１つ以上に提供するように構成することができる。コンテンツプロバイダサイト４１２Ａ〜４１２Ｎは、１つ以上のウェブサーバを含んでもよい。データプロバイダサイト４１２Ａ〜４１２Ｎによって提供されるデータは、例えば、ＨＴＭＬ、ダイナミックＨＴＭＬ、ＸＭＬ及びＪＳＯＮなどのデータフォーマットに従って定義することができる。

図１を再び参照すると、ソースデバイス１０２は、動画像ソース１０４と、動画像符号化装置１０６と、データカプセル化部１０７と、インターフェース１０８とを含む。動画像ソース１０４は、動画像データをキャプチャ及び／又は記憶するように構成された任意のデバイスを含むことができる。例えば、動画像ソース１０４は、ビデオカメラ及びそれに動作可能に結合された記憶デバイスを含むことができる。動画像符号化装置１０６は、動画像データを受信し、動画像データを表す準拠ビットストリームを生成するように構成された、任意のデバイスを含むことができる。準拠ビットストリームは、動画像復号装置が受信し、それから動画像データを再生することができるビットストリームを指すことがある。準拠ビットストリームの態様は、動画像符号化規格に従って定義することができる。準拠ビットストリームを生成するとき、動画像符号化装置１０６は、動画像データを圧縮することができる。圧縮は、非可逆的（視聴者に認識可能若しくは認識不可能）又は可逆的とすることができる。図５は、本明細書で説明する動画像データを符号化するための技術を実装することができる動画像符号化装置５００の一例を示すブロック図である。実施例の動画像符号化装置５００は、別個の機能ブロックを有するように示されているが、そのような例示は、説明のためのものであり、動画像符号化装置５００及び／又はその下位構成要素を特定のハードウェア又はソフトウェアアーキテクチャに限定するものではないことに留意されたい。動画像符号化装置５００の機能は、ハードウェア、ファームウェア及び／又はソフトウェアの実装形態の任意の組み合わせを用いて実現することができる。

動画像符号化装置５００は、ピクチャ領域のイントラ予測符号化及びインター予測符号化を実行することができ、このため、ハイブリッド動画像符号化装置と呼ばれることがある。図５に示す例では、動画像符号化装置５００は、ソース動画像ブロックを受信する。いくつかの例では、ソース動画像ブロックは、符号化構造に従って分割されているピクチャの部分を含むことができる。例えば、ソース動画像データは、マクロブロック、ＣＴＵ、ＣＢ、その再分割、及び／又は別の同等の符号化ユニットを含むことができる。いくつかの例では、動画像符号化装置５００は、ソース動画像ブロックの追加の再分割を実行するように構成することができる。本明細書で説明する技術は、符号化の前及び／又は符号化中にソース動画像データがどのように分割されるかにかかわらず、動画像符号化に一般的に適用可能であることに留意されたい。図５に示す例では、動画像符号化装置５００は、加算部５０２と、変換係数発生装置５０４と、係数量子化部５０６と、逆量子化及び変換係数処理部５０８と、加算部５１０と、イントラ予測処理部５１２と、インター予測処理部５１４と、エントロピ符号化部５１６と、を含む。図５に示すように、動画像符号化装置５００は、ソース動画像ブロックを受信し、ビットストリームを出力する。

図５に示す例では、動画像符号化装置５００は、ソース動画像ブロックから予測動画像ブロックを減算することにより、残差データを生成することができる。予測動画像ブロックの選択を、以下に詳細に記載する。加算部５０２は、この減算演算を実行するように構成された構成要素を表す。一例では、動画像ブロックの減算は、画素領域で行われる。変換係数発生装置５０４は、離散コサイン変換（ＤＣＴ）、離散サイン変換（ＤＳＴ）、又は概念的に類似の変換などの変換を残差ブロック又はその再分割に適用し（例えば、４つの８×８の変換を残差値の１６×１６のアレイに適用することができる）、残差変換係数のセットを生成する。変換係数発生装置５０４は、離散三角変換の近似物を含め離散三角変換のファミリーに含まれる変換の任意の及び全ての組み合わせを実行するように構成することができる。変換係数発生装置５０４は、変換係数を係数量子化部５０６に出力することができる。係数量子化部５０６は、変換係数の量子化を実行するように構成することができる。量子化プロセスは、係数の一部又は全てに関連付けられたビット深度を低減することができる。量子化の程度により、符号化した動画像データのレートディストーション（すなわち、動画像のビットレート対品質）が変更され得る。量子化の程度は、量子化パラメータ（ＱＰ）を調節することにより、修正することができる。量子化パラメータは、スライスレベル値及び／又はＣＵレベル値（例えば、ＣＵデルタＱＰ値）に基づいて判定することができる。ＱＰデータは、特定の変換係数のセットを量子化するＱＰを判定するために使用される任意のデータを含み得る。図５に示すように、量子化された変換係数（レベル値と呼んでもよい）は、逆量子化及び変換係数処理部５０８に出力される。逆量子化及び変換係数処理部５０８は、逆量子化及び逆変換を適用して、復元された残差データを生成するように構成することができる。図５に示すように、加算器５１０において、復元された残差データを、予測動画像ブロックに加算することができる。このようにして、符号化動画像ブロックを復元することができ、結果として得られる復元された動画像ブロックを使用して、所与の予測、変換、及び／又は量子化についての符号化品質を評価することができる。動画像符号化装置５００は、複数の符号化パスを実行する（例えば、予測、変換パラメータ及び量子化パラメータの１つ以上を変更しながら符号化を実行する）ように構成することができる。ビットストリームのレートディストーション又は他のシステムパラメータは、復元された動画像ブロックの評価に基づいて最適化することができる。更に、復元された動画像ブロックは、その後のブロックを予測するための参照として記憶して使用することができる。

図５を参照すると、イントラ予測処理部５１２は、符号化される動画像ブロックに対してイントラ予測モードを選択するように構成することができる。イントラ予測処理部５１２は、現在のブロックを符号化するために、フレームを評価し、使用するイントラ予測モードを判定するように構成することができる。上述したように、可能なイントラ予測モードは、平面予測モード、ＤＣ予測モード、及び角度予測モードを含んでもよい。更に、いくつかの例では、クロマ成分に対する予測モードは、ルマ予測モードに対する予測モードから推測できることに留意されたい。イントラ予測処理部５１２は、１つ以上の符号化パスを実行した後にイントラ予測モードを選択してもよい。更に、一実施例では、イントラ予測処理部５１２は、レートディストーション解析に基づいて予測モードを選択してもよい。図５に示すように、イントラ予測処理部５１２は、イントラ予測データ（例えば、シンタックス要素）をエントロピ符号化部５１６及び変換係数発生装置５０４に出力する。上述のように、残差データに対して実行される変換は、モード依存性であってもよい（例えば、二次変換行列は、予測モードに基づいて判定することができる）。

図５を再び参照すると、インター予測処理部５１４は、現在の動画像ブロックに対してインター予測符号化を実行するように構成することができる。インター予測処理部５１４は、ソース動画像ブロックを受信し、動画像ブロックのＰＵに対する動きベクトルを計算するように構成することができる。動きベクトルは、参照フレーム内の予測ブロックに対する、現在の動画像フレーム内の動画像ブロックのＰＵの変位を示すことができる。インター予測符号化は、１つ以上の参照ピクチャを使用することができる。更に、動き予測は、単一予測（１つの動きベクトルを用いる）又は双予測（２つの動きベクトルを用いる）とすることができる。インター予測処理部５１４は、例えば、絶対差の合計（sum of absolute difference）（ＳＡＤ）、平方差の合計（sumof square difference）（ＳＳＤ）、又は他の差の測定法によって判定された画素差を計算することにより、予測ブロックを選択するように構成することができる。上述したように、動きベクトルは、動きベクトル予測に従って判定及び判定することができる。インター予測処理部５１４は、上述したように、動きベクトル予測を実行するように構成することができる。インター予測処理部５１４は、動き予測データを用いて予測ブロックを生成するように構成することができる。例えば、インター予測処理部５１４は、フレームバッファ（図５に示さない）内に予測動画像ブロックを配置することができる。インター予測処理部５１４は、復元された残差ブロックに１つ以上の補間フィルタを適用して、動き予測に使用するサブ整数の画素値を計算するように更に構成することができることに留意されたい。インター予測処理部５１４は、計算された動きベクトルに対する動き予測データをエントロピ符号化部５１６に出力することができる。

図５を再び参照すると、エントロピ符号化部５１８は、量子化された変換係数及び予測シンタックスデータ（すなわち、イントラ予測データ、動き予測データ）を受信する。いくつかの例では、係数量子化部５０６は、係数がエントロピ符号化部５１８に出力される前に、量子化された変換係数を含む行列の走査を実行することができることに留意されたい。他の実施例では、エントロピ符号化部５１８は、走査を実行することができる。エントロピ符号化部５１８は、本明細書で説明する技術の１つ以上に従ってエントロピ符号化を実行するように構成することができる。エントロピ符号化部５１８は、準拠ビットストリーム、すなわち、動画像復号装置が受信しそれから動画像データを再生することができるビットストリームを出力するように構成することができる。このように、動画像符号化装置５００は、本開示の１つ以上の技術に従って符号化動画像データを生成するように構成されているデバイスの一例を表す。一実施例では、動画像符号化装置５００は、マルチレイヤＨＥＶＣ表示に使用され得る符号化動画像データを生成することができる。

図１を再び参照すると、データカプセル化部１０７は、準拠ビットストリームを受信し、ファイルフォーマットに従って、準拠ビットストリームをカプセル化することができる。一実施例では、データカプセル化部１０７は、表１に関して上述したＨＥＶＣトラックのうちのいずれかに対応する準拠ビットストリームを受信することができる。更に、データカプセル化部１０７は、プレーンＨＥＶＣトラックに対応する準拠ビットストリームを受信し、ＣＭＡＦで規定されているファイルを出力することができる。上述したように、ＣＭＡＦは現在、マルチレイヤＨＥＶＣをサポートしていない。一実施例では、データカプセル化部１０７は、マルチレイヤＨＥＶＣトラックに対応する準拠ビットストリームを受信し、ＣＭＡＦに基づいてファイルを出力するように構成することができる。すなわち、データカプセル化部１０７は、準拠ビットストリームを受信し、ＩＴＵＨ．２６５、ＩＳＯ−ＶＩＤＥＯ及び／又はＣＭＡＦに概ね適合するファイルを出力することができるが、更に、ＣＭＡＦ型ファイル内のマルチレイヤＨＥＶＣをサポートすることができる。データカプセル化部１０７によって生成されるファイルは、以下に示す制約のうちの１つ以上に更に適合し得ることに留意されたい。以下に示される１つ以上の制約により、ファイルを受信するデバイスによるマルチメディア表示の効率的なレンダリングが可能になることを留意されたい。

一実施例では、データカプセル化部１０７によって生成されたファイルに含まれるビデオトラックは、ＩＳＯ−ＶＩＤＥＯのセクション９に準拠してもよく、ベースレイヤ（ＨＥＶＣ仕様を使用して符号化された場合）は、ＩＳＯ−ＶＩＤＥＯのセクション９．４に記載されるように記憶されてもよい。一実施例では、データカプセル化部１０７によって生成されたファイルに含まれるビデオトラックは、表１において上記で定義されたサンプルエントリ「ｈｖｃ１」若しくは「ｈｅｖ１」又は「ｈｖｃ２」若しくは「ｈｅｖ２」に適合することができる。一実施例では、データカプセル化部１０７によって生成されたファイルは、ＨＥＶＣＤｅｃｏｄｅｒＣｏｎｆｉｇｕｒａｔｉｏｎＲｅｃｏｒｄ及びＬＨＥＶＣＤｅｃｏｄｅｒＣｏｎｆｉｇｕｒａｔｉｏｎＲｅｃｏｒｄを含むことができ、ＣＭＡＦの９．４．１．３における制約は、ＨＥＶＣＤｅｃｏｄｅｒＣｏｎｆｉｇｕｒａｔｉｏｎＲｅｃｏｒｄに適用され、ＨＥＶＣ互換ベースレイヤに適用され得る。一実施例では、ＳＥＩメッセージの包含、ＣＭＡＦプレーヤによるＳＥＩメッセージの使用及び受渡しに関するＣＭＡＦの９．４．１．３における制約は、ＬＨＥＶＣＤｅｃｏｄｅｒＣｏｎｆｉｇｕｒａｔｉｏｎＲｅｃｏｒｄにも適用され、エンハンスメントレイヤにも適用され得る。このようにして、データカプセル化部１０７は、マルチレイヤＨＥＶＣ表示内のベースレイヤがＣＭＡＦに適合する様式でカプセル化されるように構成することができる。

一実施例では、データカプセル化部１０７によって生成されたファイルは、表２に示す動画像プロファイルが、ファイルに含まれる全てのスケーラブルＨＥＶＣエレメンタリストリームに適用されることが必要条件となる場合がある。

この場合、メディアプロファイル名、例えば「ＳＨＶ１０」及び新しいファイルブランド、例えば「ｃｕｓ１」を、そのような新しいメディアプロファイルに対して定義することができる。上記のメディアプロファイル（ＳＨＶ１０）は一例であり、他の同様な２つ以上のメディアプロファイルは、スケーラブルＨＥＶＣを使用するように定義されてもよい。

一実施例では、データカプセル化部１０７によって生成されたファイルは、ビデオストリームに含まれる全てのピクチャを、符号化フレームとして符号化し、符号化フィールドとして符号化しないことを必要とする場合がある。一実施例では、データカプセル化部１０７によって生成されたファイルは、ＨＥＶＣエレメンタリストリームの最大ビットレートが、Ｉ−ＩＴＵＨ．２６５第Ｆ．１３節で定義されたバッファ及びタイミングモデルの実装形態によって計算されることを必要とする場合がある。一実施例では、データカプセル化部１０７によって生成されたファイルは、トラックのフレームレートを判定するためにＩＳＯメディアトラック実行ボックス（ISO Media Track Run Box）に記憶されたサンプル継続時間を必要とする場合がある。この場合、Ｈ．２６５パラメータセットで後述されるフレームレート（ピクチャレートとも呼ばれる）関連のパラメータを含めることは、基礎となる動画像エレメンタリストリームのフレームレート／ピクチャレートを知るのに有用である。

上述したように、マルチレイヤＨＥＶＣ表示のうちの１つ以上の特性及び／又はパラメータは、ＩＴＵ−ＴＨ．２６５で提供されるセマンティクスに従ってシグナリングされ得、更に上述したように、ＩＴＵ−ＴＨ．２６５は、特性及び／又はパラメータがシグナリングされ得る方法及び場合に関して柔軟性を提供する。一実施例では、データカプセル化部１０７によって生成されたファイルに含まれる動画像データは、ＩＴＵ−ＴＨ．２６５の付属書類Ｆ及び付属書類Ｈに適合する一方で、表３で示される例示的な制約のうちの１つ以上に適合してもよい。

一実施例では、データカプセル化部１０７によって生成されたファイルに含まれる動画像データは、ベースレイヤ及びエンハンスメントレイヤが存在する場合、ベースレイヤ及びエンハンスメントレイヤが一定のピクチャレートを有するように制約されてもよい。場合によっては、この制約は、表３に示されるように、制約を通じて達成され得ることに留意されたい。ｃｏｎｓｔａｎｔ＿ｐｉｃ＿ｒａｔｅ＿ｉｄｃ［ｉ］［ｊ］は、全てのｊに対して、全てのｉに対して、１に設定されるものとする。

一実施例では、データカプセル化部１０７によって生成されたファイルに含まれる動画像データは、ベースレイヤとエンハンスメントレイヤが存在する場合、ベースレイヤとエンハンスメントレイヤが同じ数のサブレイヤを有するように制約されてもよい。一実施例では、各レイヤは、２つのサブレイヤがある場合、０及び１に等しいＴｅｍｐｏｒａｌＩｄをもつ最大限でも２つのサブレイヤを含むものとし、各ＳＰＳのｓｐｓ＿ｍａｘ＿ｓｕｂ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１の値は、レイヤ内のサブレイヤの数から１を引いた値に等しく設定されるものとする。

一実施例では、データカプセル化部１０７によって生成されたファイルに含まれる動画像データは、レイヤが２つのサブレイヤを有する場合、０に等しいＴｅｍｐｏｒａｌＩｄを有するサブレイヤ表現が一定のピクチャレート（ｅｌｅｍｅｎｔａｌ＿ｄｕｒａｔｉｏｎ＿ｉｎ＿ｔｃ＿ｍｉｎｕｓ１［０］の存在によって示されるように）を有し、ピクチャレートがレイヤ全体のピクチャレートのちょうど半分であるものとして制約されてもよい（すなわち、ｅｌｅｍｅｎｔａｌ＿ｄｕｒａｔｉｏｎ＿ｉｎ＿ｔｃ＿ｍｉｎｕｓ１［０］は、２^＊ｅｌｅｍｅｎｔａｌ＿ｄｕｒａｔｉｏｎ＿ｉｎ＿ｔｃ＿ｍｉｎｕｓ１［１］に等しい）。

一実施例ではデータカプセル化部１０７によって生成されたファイルに含まれる動画像データは、ピクチャクロッピングがＳＰＳクロッピングパラメータｃｏｎｆ＿ｗｉｎ＿ｌｅｆｔ＿ｏｆｆｓｅｔ、ｃｏｎｆ＿ｗｉｎ＿ｒｉｇｈｔ＿ｏｆｆｓｅｔ、ｃｏｎｆ＿ｗｉｎ＿ｔｏｐ＿ｏｆｆｓｅｔ及びｃｏｎｆ＿ｗｉｎ＿ｂｏｔｔｏｍ＿ｏｆｆｓｅｔによって示されるものとして制約されてもよい。すなわち、ピクチャクロッピングは、ＳＰＳクロッピングパラメータｃｏｎｆ＿ｗｉｎ＿ｌｅｆｔ＿ｏｆｆｓｅｔ、ｃｏｎｆ＿ｗｉｎ＿ｒｉｇｈｔ＿ｏｆｆｓｅｔ、ｃｏｎｆ＿ｗｉｎ＿ｔｏｐ＿ｏｆｆｓｅｔ、ｃｏｎｆ＿ｗｉｎ＿ｂｏｔｔｏｍ＿ｏｆｆｓｅｔによって示される必要があり、従って、ｃｏｎｆ＿ｗｉｎ＿ｖｐｓ＿ｌｅｆｔ＿ｏｆｆｓｅｔ、ｃｏｎｆ＿ｗｉｎ＿ｖｐｓ＿ｒｉｇｈｔ＿ｏｆｆｓｅｔ、ｃｏｎｆ＿ｗｉｎ＿ｖｐｓ＿ｔｏｐ＿ｏｆｆｓｅｔ及びｃｏｎｆ＿ｗｉｎ＿ｂｏｔｔｏｍ＿ｏｆｆｓｅｔは、それぞれ、ＶＰＳを参照する各ＳＰＳに対し、ＳＰＳシンタックス要素ｃｏｎｆ＿ｗｉｎ＿ｌｅｆｔ＿ｏｆｆｓｅｔ、ｃｏｎｆ＿ｗｉｎ＿ｒｉｇｈｔ＿ｏｆｆｓｅｔ、ｃｏｎｆ＿ｗｉｎ＿ｔｏｐ＿ｏｆｆｓｅｔ及びｃｏｎｆ＿ｗｉｎ＿ｂｏｔｔｏｍ＿ｏｆｆｓｅｔの値の推測に使用されない場合がある。なお、本実施例では、ｃｏｎｆｏｒｍａｎｃｅ＿ｗｉｎｄｏｗ＿ｖｐｓ＿ｆｌａｇが１に等しい場合、動画像復号装置は、ファイルが不適合であると判定し、不適合ファイルを処理するための適切なアクションを実行してもよいことに留意されたい。

別の実施例では、データカプセル化部１０７によって生成されたファイルに含まれる動画像データは、ピクチャクロッピングがｖｐｓ拡張クロッピングパラメータｃｏｎｆ＿ｗｉｎ＿ｖｐｓ＿ｌｅｆｔ＿ｏｆｆｓｅｔ、ｃｏｎｆ＿ｗｉｎ＿ｖｐｓ＿ｒｉｇｈｔ＿ｏｆｆｓｅｔ、ｃｏｎｆ＿ｗｉｎ＿ｖｐｓ＿ｔｏｐ＿ｏｆｆｓｅｔ及びｃｏｎｆ＿ｗｉｎ＿ｖｐｓ＿ｂｏｔｔｏｍ＿ｏｆｆｓｅｔによって示されるものとして制約されてもよい。

このようにして、データカプセル化部１０７によって生成されたファイルによってカプセル化されたマルチレイヤＨＥＶＣ表示は、上記で示された１つ以上の制約に基づいて、効率的に解析及び／又はレンダリングされてもよい。例えば、演算デバイスは、データカプセル化部１０７によって生成されたファイルを受信する場合に、特定の動画像コーデックプロファイルを予期することができる。一実施例では、プレゼンテーションアプリケーションは、ＩＥＴＦ「ＲＦＣ６３８１，Ｔｈｅ’Ｃｏｄｅｃｓ’ ａｎｄ’Ｐｒｏｆｉｌｅｓ’ Ｐａｒａｍｅｔｅｒｓｆｏｒ”Ｂｕｃｋｅｔ” ＭｅｄｉａＴｙｐｅｓ」（２０１１年８月）に準拠するパラメータを使用して、データカプセル化部１０７によって生成されたファイルに含まれる各ＨＥＶＣトラック及びスイッチングセットのビデオコーデックのプロファイル並びにレベルをシグナリングすべきであることに留意されたい。［ＲＦＣ６３８１］及びＩＳＯ−ＶＩＤＥＯ、付属書類Ｅ第４節は、セクションＥ．４としても知られる。

表３における制約の一部のみが適用されてもよいことに留意されたい。また、制約の一部が修正されてもよい。例えば、０に制約されたフラグを、代わりに１に制約することができる。上述したシンタックス要素の値に対する制約は、変更することができる。これらは全て、本発明の範囲内にあることが意図されている。

図１を再び参照すると、インターフェース１０８は、データカプセル化部１０７によって生成されたファイルを受信し、そのファイルを通信媒体に送信及び／又は記憶するように構成された任意のデバイスを含んでもよい。インターフェース１０８は、イーサネットカードなどのネットワークインターフェースカードを含むことができ、光送受信機、無線周波数送受信機、又は情報を送信及び／若しくは受信することができる任意の他の種類のデバイスを含むことができる。更に、インターフェース１０８は、ファイルを記憶デバイス上に記憶することを可能にすることができるコンピュータシステムインターフェースを含むことができる。例えば、インターフェース１０８は、ＰｅｒｉｐｈｅｒａｌＣｏｍｐｏｎｅｎｔＩｎｔｅｒｃｏｎｎｅｃｔ（ＰＣＩ）バスプロトコル及びＰｅｒｉｐｈｅｒａｌＣｏｍｐｏｎｅｎｔＩｎｔｅｒｃｏｎｎｅｃｔＥｘｐｒｅｓｓ（ＰＣＩｅ）バスプロトコル、独自のバスプロトコル、ユニバーサルシリアルバス（Universal Serial Bus）（ＵＳＢ）プロトコル、Ｉ２Ｃ、又はピアデバイスを相互接続するために使用することができる任意の他の論理及び物理構造をサポートする、チップセットを含むことができる。

図１を再び参照すると、宛先デバイス１２０は、インターフェース１２２と、データデカプセル化部１２３と、動画像復号装置１２４と、ディスプレイ１２６とを含む。インターフェース１２２は、通信媒体からデータ受信するように構成されている任意のデバイスを含むことができる。インターフェース１２２は、イーサネットカードなどのネットワークインターフェースカードを含むことができ、光送受信機、無線周波数送受信機、又は情報を受信及び／若しくは送信することができる任意の他の種類のデバイスを含むことができる。更に、インターフェース１２２は、準拠動画像ビットストリームを記憶デバイスから取得することを可能にするコンピュータシステムインターフェースを含むことができる。例えば、インターフェース１２２は、ＰＣＩバスプロトコル及びＰＣＩｅバスプロトコル、独自のバスプロトコル、ＵＳＢプロトコル、Ｉ２Ｃ、又はピアデバイスを相互接続するために使用することができる任意の他の論理及び物理構造をサポートする、チップセットを含むことができる。データデカプセル化部１２３は、データカプセル化部１０７によって生成されたファイルをデカプセル化するように構成することができる。動画像復号装置１２４は、準拠ビットストリーム（例えば、デカプセル化されたデータの一部として）及び／又はその許容可能な変形を受信し、そこから動画像データを再生するように構成されている任意のデバイスを含むことができる。ディスプレイ１２６は、動画像データを表示するように構成された任意のデバイスを含むことができる。ディスプレイ１２６は、液晶ディスプレイ（liquid crystal display）（ＬＣＤ）、プラズマディスプレイ、有機発光ダイオード（organic light emitting diode）（ＯＬＥＤ）ディスプレイ、又は別の種類のディスプレイなどの、様々なディスプレイデバイスのうちの１つを含むことができる。ディスプレイ１２６は、高解像度ディスプレイ又は超高解像度ディスプレイを含むことができる。図１に示す例では、動画像復号装置１２４は、データをディスプレイ１２６に出力するように説明されているが、動画像復号装置１２４は、動画像データを様々な種類のデバイス及び／又はその下位構成要素に出力するように構成することができることに留意されたい。例えば、動画像復号装置１２４は、本明細書で説明するような任意の通信媒体に動画像データを出力するように構成することができる。

図６は、本開示の１つ以上の技術に係る、動画像データを復号するように構成することができる動画像復号装置の一例を示すブロック図である。一実施例では、動画像復号装置６００は、変換データを復号し、復号された変換データに基づいて変換係数から残差データを再構築するように構成することができる。動画像復号装置６００は、イントラ予測復号及びインター予測復号を実行するように構成することができ、そのために、ハイブリッド復号装置と呼ばれることがある。図６に示す例では、動画像復号装置６００は、エントロピ復号部６０２、逆量子化部及び変換係数処理部６０４、イントラ予測処理部６０６、インター予測処理部６０８、加算部６１０、ポストフィルタ部６１２、並びに参照バッファ６１４を含む。動画像復号装置６００は、動画像符号化システムと合致するようにして動画像データを復号するように構成することができる。例の動画像復号装置６００が別個の機能ブロックを有するように示されているが、そのような例示は説明のためのものであり、動画像復号装置６００及び／又はその下位構成要素を特定のハードウェア又はソフトウェアアーキテクチャに限定するものではないことに留意されたい。動画像復号装置６００の機能は、ハードウェア、ファームウェア及び／又はソフトウェアの実装形態の任意の組み合わせを用いて実現することができる。

図６に示すように、エントロピ復号部６０２は、エントロピ符号化されたビットストリームを受信する。エントロピ復号部６０２は、エントロピ符号化プロセスとは逆の（reciprocal）プロセスに従って、ビットストリームからシンタックス要素及び量子化された係数を復号するように構成することができる。エントロピ復号部６０２は、上述したエントロピ符号化技術のいずれかに従ってエントロピ復号を実行するように構成することができる。エントロピ復号部６０２は、動画像符号化規格と合致するようにして、符号化されたビットストリーム中のシンタックス要素の値を判定することができる。図６に示すように、エントロピ復号部６０２は、ビットストリームから量子化パラメータ、量子化された係数の値、変換データ、及び予測データを判定することができる。図６に示す実施例では、逆量子化部及び変換係数処理部６０４は、量子化パラメータ、量子化された係数の値、変換データ、及び予測データをエントロピ復号部６０２から受信し、復元された残差データを出力する。

図６を再び参照すると、復元された残差データが加算部６１０に提供されてもよく、加算部６１０は、復元された残差データを予測動画像ブロックに追加し、復元された動画像データを生成することができる。予測動画像ブロックは、予測動画像技術（すなわち、イントラ予測及びフレーム間予測）に従って判定することができる。イントラ予測処理部６０６は、イントラ予測シンタックス要素を受信し、参照バッファ６１４から予測動画像ブロックを取得するように構成することができる。参照バッファ６１４は、動画像データの１つ以上のフレームを記憶するように構成されたメモリデバイスを含むことができる。イントラ予測シンタックス要素は、上述したイントラ予測モードなどのイントラ予測モードを識別することができる。インター予測処理部６０８は、インター予測シンタックス要素を受信し、動きベクトルを生成して、参照バッファ８１４に記憶された１つ以上の参照フレーム内の予測ブロックを識別することができる。インター予測処理部６０８は、場合によっては補間フィルタに基づく補間を実行して、動き補償されたブロックを生成することができる。シンタックス要素には、画素未満の精度を有する動き予測に使用されることになる補間フィルタの識別子を含めることができる。インター予測処理部８０８は、補間フィルタを使用して、参照ブロックのサブ整数の画素に対する補間された値を計算することができる。ポストフィルタ部６１２は、復元された動画像データに対してフィルタリングを実行するように構成することができる。例えば、ポストフィルタ部６１２は、例えば、ビットストリームで規定されたパラメータに基づいて、デブロッキング及び／又はサンプル適応オフセット（ＳＡＯ）フィルタリングを実行するように構成することができる。更に、いくつかの例では、ポストフィルタ部６１２は、独自の任意フィルタリング（例えば、モスキートノイズリダクションなどの視覚強調）を実行するように構成することができることに留意されたい。図６に示すように、復元された動画像ブロックは、動画像復号装置６００によって出力することができる。このようにして、動画像復号装置６００は、本明細書で説明する技術の１つ以上に従って復元された動画像データを生成するように構成することができる。

１つ以上の例では、記載された機能は、ハードウェア、ソフトウェア、ファームウェア、又はこれらの任意の組み合わせで実装することができる。ソフトウェアで実装される場合に、この機能は、コンピュータ可読媒体上の１つ以上の命令又はコードとして記憶するか又は送信され、ハードウェアベースの処理部によって実行することができる。コンピュータ可読媒体は、例えば、通信プロトコルに従って、ある場所から別の場所へのコンピュータプログラムの転送を容易にする任意の媒体を含む、データ記憶媒体又は通信媒体などの有形の媒体に対応する、コンピュータ可読記憶媒体を含むことができる。このようにして、コンピュータ可読媒体は、一般に、（１）非一時的な有形のコンピュータ可読記憶媒体、又は（２）信号又は搬送波などの通信媒体に対応することができる。データ記憶媒体は、本開示中に記載された技術の実装のための命令、コード、及び／又はデータ構造を取り出すために、１つ以上のコンピュータ又は１つ以上のプロセッサによってアクセスされ得る任意の利用可能な媒体であり得る。コンピュータプログラム製品は、コンピュータ可読媒体を含むことができる。

一例として、非限定的に、このようなコンピュータ可読記憶媒体は、ＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ、ＣＤ−ＲＯＭ、又は他の光学ディスク記憶装置、磁気ディスク記憶装置、他の磁気記憶デバイス、フラッシュメモリ、又は任意の他の媒体、すなわち命令又はデータ構造の形式で所望のプログラムコードを記憶するために使用可能であり、かつコンピュータによりアクセス可能な任意の他の媒体を含むことができる。また、任意の接続は、コンピュータ可読媒体と適切に呼ばれる。例えば、命令がウェブサイト、サーバ、又は他のリモートソースから、同軸ケーブル、光ファイバケーブル、ツイストペア、デジタル加入者線（digital subscriber line）（ＤＳＬ）、あるいは赤外線、無線及びマイクロ波などの無線技術を使用して伝送される場合、同軸ケーブル、光ファイバケーブル、ツイストペア、ＤＳＬ、あるいは赤外線、無線及びマイクロ波などの無線技術は、媒体の定義に含まれる。しかし、コンピュータ可読媒体及びデータ記憶媒体は、接続、搬送波、信号、又は他の一過性媒体を含まないが、代わりに非一時的な有形記憶媒体を対象としていることを理解すべきである。本発明で使用する場合、ディスク（disk）及びディスク（disc）は、コンパクトディスク（Compact Disc）（ＣＤ）、レーザーディスク（laser disc）、光学ディスク（optical disc）、デジタル多用途ディスク（Digital VersatileDisc）（ＤＶＤ）、フロッピーディスク（floppy disk）及びブルーレイ（登録商標）ディスク（Blu-ray（登録商標）disc）を含み、ディスク（disk）は通常データを磁気的に再生し、ディスク（disc）はレーザを用いてデータを光学的に再生する。上記の組み合わせもまた、コンピュータ可読媒体の範囲内に含まれなければならない。

命令は、１つ以上のデジタル信号プロセッサ（digital signal processor）（ＤＳＰ）、汎用マイクロプロセッサ、特定用途向け集積回路（general purpose microprocessors,applicationspecific integrated circuit）（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（fieldprogrammable logic array）（ＦＰＧＡ）、又は他の同等の集積又はディスクリートロジック回路などの１つ以上のプロセッサによって実行することができる。したがって、本明細書で使用されるとき、用語「プロセッサ」は、前記の構造、又は本明細書で説明する技術の実装に好適な任意の他の構造のいずれかを指すことができる。加えて、いくつかの態様において、本明細書で説明する機能は、符号化及び復号化するように構成された、又は複合コーデックに組み込まれた専用のハードウェアモジュール及び／又はソフトウェアモジュール内に設けられ得る。また、この技術は、１つ以上の回路又は論理素子中に完全に実装することができる。

本開示の技術は、無線ハンドセット、集積回路（integrated circuit）（ＩＣ）、又はＩＣのセット（例えば、チップセット）を含む多種多様なデバイス又は装置に実装することができる。様々な構成要素、モジュール、又はユニットは、開示された技術を実行するように構成されたデバイスの機能的な態様を強調するために本開示中に記載されているが、異なるハードウェアユニットによる実現は必ずしも必要ではない。むしろ、前述したように、様々なユニットは、コーデックハードウェアユニットと組み合わせてもよく、又は好適なソフトウェア及び／又はファームウェアと共に、前述の１つ以上のプロセッサを含む、相互動作ハードウェアユニットの集合によって提供することができる。

更に、上述の各実装形態で用いた基地局デバイスや端デバイスの各機能ブロックや様々な機能は、一般的には集積回路又は複数の集積回路である電気回路によって実現又は実行することができる。本明細書に記載の機能を実行するように設計された回路は、汎用プロセッサ、デジタル信号プロセッサ（ＤＳＰ）、特定用途向け又は汎用アプリケーション集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）若しくは他のプログラマブルロジックデバイス、ディスクリートゲート若しくはトランジスタロジック、若しくは個々のハードウェア構成要素、又はそれらの組み合わせを備えていてもよい。汎用プロセッサは、マイクロプロセッサでもよく、あるいは、プロセッサは、従来のプロセッサ、コントローラ、マイクロコントローラ、又はステートマシンでもよい。上述した汎用プロセッサ又は各回路は、デジタル回路で構成されても、又はアナログ回路で構成することができる。更に、半導体技術の進歩により現時点での集積回路に置き換わる集積回路化技術が現れれば、この技術による集積回路もまた使用可能となる。

様々な実施例について説明した。これら及び他の実施例は、以下の特許請求の範囲内である。

＜相互参照＞
本特許出願はは、米国特許法第１１９条の下で、２０１７年３月２０日の仮出願第６２／４７３，６０９号の優先権を主張するものであり、その内容の全体は、参照により本明細書に組み込まれる。

Claims

データをカプセル化する方法であって、前記方法は、
マルチレイヤ動画像表示データを含む符号化動画像データを受信することと、
前記符号化動画像データに関連付けられた１つ以上のパラメータ値を設定することと、
前記符号化動画像データをデータ構造内にカプセル化することと、
を含む方法。
前記符号化動画像データに関連付けられた１つ以上のパラメータ値を設定することは、前記符号化動画像データに対応するパラメータセットに対して定義されたフラグの値を設定することを含む、請求項１に記載の方法。
前記符号化動画像データに対応するパラメータセットに対して定義されたフラグの値を設定することは、フラグを定義値に設定することを含む、請求項２に記載の方法。
フラグは、ｇｅｎｅｒａｌｐｒｏｇｒｅｓｓｉｖｅｓｏｕｒｃｅｆｌａｇ、ｇｅｎｅｒａｌｆｒａｍｅｏｎｌｙｃｏｎｓｔｒａｉｎｔｆｌａｇ、ｇｅｎｅｒａｌｉｎｔｅｒｌａｃｅｄｓｏｕｒｃｅｆｌａｇ、ｇｅｎｅｒａｌｎｏｎｐａｃｋｅｄｃｏｎｓｔｒａｉｎｔｆｌａｇ、ｖｉｄｅｏｐａｒａｍｅｔｅｒｓｅｔｅｘｔｅｎｓｉｏｎｆｌａｇ及びｖｉｄｅｏｐａｒａｍｅｔｅｒｖｉｄｅｏｕｓａｂｉｌｉｔｙｉｎｆｏｒｍａｔｉｏｎｐｒｅｓｅｎｔｆｌａｇのうちの１つ以上を含む、請求項３に記載の方法。
フラグは、シーケンスパラメータセットに含まれる１つ以上のフラグを含む、請求項３又は４のいずれかに記載の方法。
通信媒体を介してデータ構造を送信することを更に含む、請求項１から５のいずれかに記載の方法。
データをカプセル化するためのデバイスであって、前記デバイスは、請求項１から６の前記ステップの任意の及び全ての組み合わせを実行するように構成された１つ以上のプロセッサを備える、デバイス。
前記デバイスは、動画像符号化装置を含む、請求項７に記載のデバイス。
データをデカプセル化するためのデバイスであって、前記デバイスは、請求項１から６の前記ステップの任意の及び全ての組み合わせに従ってカプセル化されたデータをデカプセル化するように構成された１つ以上のプロセッサを備える、デバイス。
前記デバイスは、動画像復号装置を含む、請求項９に記載のデバイス。
データをカプセル化するための装置であって、前記装置は、請求項１から６の前記ステップの任意の及び全ての組み合わせを実行する手段を備える、装置。
データをデカプセル化するための装置であって、前記装置は、請求項１から６の前記ステップの任意の及び全ての組み合わせによってカプセル化されたデータをデカプセル化する手段を備える、装置。
命令を含む非一時的コンピュータ可読記憶媒体であって、前記命令は実行されると、デバイスの１つ以上のプロセッサに、請求項１から６に記載の前記ステップの任意の及び全ての組み合わせを実行させる、非一時的コンピュータ可読記憶媒体。
命令を含む非一時的コンピュータ可読記憶媒体であって、前記命令は実行されると、デバイスの１つ以上のプロセッサに、請求項１から６に記載の前記ステップの任意の及び全ての組み合わせに従ってカプセル化されたデータをデカプセル化させる、非一時的コンピュータ可読記憶媒体。
請求項７に記載のデバイスと、
請求項９に記載のデバイスと、
を備える、システム。