JP5947405B2 - ビデオ符号化方法および装置 - Google Patents

ビデオ符号化方法および装置 Download PDF

Info

Publication number
JP5947405B2
JP5947405B2 JP2014555275A JP2014555275A JP5947405B2 JP 5947405 B2 JP5947405 B2 JP 5947405B2 JP 2014555275 A JP2014555275 A JP 2014555275A JP 2014555275 A JP2014555275 A JP 2014555275A JP 5947405 B2 JP5947405 B2 JP 5947405B2
Authority
JP
Japan
Prior art keywords
slice
parameter set
syntax
syntax element
group parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014555275A
Other languages
English (en)
Other versions
JP2015509345A (ja
JP2015509345A5 (ja
Inventor
ミスカ・マティアス ハンヌクセラ
ミスカ・マティアス ハンヌクセラ
Original Assignee
ノキア テクノロジーズ オーユー
ノキア テクノロジーズ オーユー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ノキア テクノロジーズ オーユー, ノキア テクノロジーズ オーユー filed Critical ノキア テクノロジーズ オーユー
Publication of JP2015509345A publication Critical patent/JP2015509345A/ja
Publication of JP2015509345A5 publication Critical patent/JP2015509345A5/ja
Application granted granted Critical
Publication of JP5947405B2 publication Critical patent/JP5947405B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/58Motion compensation with long-term prediction, i.e. the reference frame for a current frame not being the temporally closest one
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/19Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding using optimisation based on Lagrange multipliers

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Description

本出願は概して、ビデオを符号化するおよび復号する装置,方法およびコンピュータプログラムに関する。
背景
本節では、特許請求の範囲で記載される本発明の背景や関連について説明する。本節の説明は、追求されうる概念を含むこともあり、必ずしも既に着想または追求されてきたものだけを含むわけではない。
したがって、本願中で特段の指示がない限り、本節で記述される内容は、本願の明細書および特許請求の範囲に対する先行技術ではなく、本節で記述されていることのみをもって先行技術と認定してはならない。
現在、3次元(3D)ビデオコンテンツを提供する様々な技術が研究・開発されている。特に、一組のステレオビデオだけを特定のビューポイントから見たり、別の一組のステレオビデオを別のビューポイントから見たりすることができる様々なマルチビューアプリケーションに関して集中的に研究されている。こうしたマルチビューアプリケーションに対する最も実現可能なアプローチの一つは、限られた入力ビュー数だけ、例えばモノラルまたはステレオビデオと付加データだけがデコーダ側に提供され、必要なビューが全てディスプレイに表示されるように、デコーダによってローカルにレンダリング(すなわち、合成)されるというものであると理解される。
幾つかのビューレンダリング技術が利用可能であって、例えば深度イメージベース・レンダリング(depth image-based rendering;DIBR)は競合代替技術であると見られている。DIBRの一般的な実装は、入力として立体ビデオと立体基線を伴った対応する深度情報を受取り、2つの入力ビュー間で多数の仮想ビューを合成する。このため、DIBRアルゴリズムは2つの入力ビュー間だけでなく、その外側のビューを外挿することもできる。同様に、DIBRアルゴリズムは単一のテクスチャビューと対応する深度ビューからビューを合成することもできる。
ビデオ符号化規格によっては、スライスレイヤおよびその下位レイヤにヘッダを導入したり、スライスレイヤの上位レイヤにパラメータセットの概念を導入したりする。パラメータセットの例は、全ピクチャやピクチャ群(GOP),ピクチャサイズやディスプレイウィンドウ,採用されたオプション符号化モード,マクロブロック割当マップ等のシーケンスレベルデータを含んでもよい。パラメータセットの各例は、固有識別子を含んでもよい。各スライスヘッダはパラメータセット識別子に対する参照を含んでもよく、参照されたパラメータセットのパラメータ値はそのスライスを復号するときに使われてもよい。パラメータセットは、低頻度で変わるピクチャやGOP,およびシーケンスやGOP,ピクチャの境界からのシーケンスレベルデータの伝送と復号の順序を分断する。パラメータセットは、参照前に復号される限り、信頼性のある伝送プロトコルを用いて帯域外で伝送されることもある。パラメータセットは、帯域内で伝送される場合、従来のビデオ符号化方式よりもエラー耐性を高めるために複数回繰り返されることもある。パラメータセットは、セッションセットアップ時間に伝送されてもよい。しかし、主にブロードキャストシステム等の一部のシステムでは、パラメータセットの帯域外伝送が実現不可能なこともあり、パラメータセットNALユニットにおいて帯域内で運ばれる。
摘要
本発明の例示的実施形態によれば、3次元ビデオ符号化・復号用のスライスヘッダ予測方法およびその装置が提供される。例示的実施形態によっては、ヘッダ予測方法によって次の特徴を生み出すことができる。テクスチャおよび深度コンポーネントに関する任意の復号順序がサポートされる。また、同一アクセスユニット内において復号順で先に現われる任意のスライスヘッダからシンタックス要素を柔軟に予測することができる。予測はビューコンポーネントに基づいてオンにもオフにも切替えられる。スライスヘッダのシンタックス要素は幾つかのセットに分類される。各セットに対して、予測元だけでなく予測の使用も個別に制御することができる。こうした方法の例示的実施形態を用いて、スライスヘッダの全シンタックス要素が予測されてもよい。
例示的実施形態によっては、スライスヘッダの予測ツールは次のように要約される。スライスヘッダのシンタックス要素はスライス群(GOS, Group of Slice)パラメータセットにグループ化される。GOSパラメータセットはアクセスユニットに対して最大限に有効であってもよい。アクセスユニットに対して特定されるGOSパラメータセットが作成されてもよい。ベースビューのテクスチャビューにおけるスライスヘッダは、暗黙のうちにGOSパラメータセットを作成する。GOSパラメータセットはビットストリームにインラインで含められてもよい。
例示的実施形態によっては、GOSパラメータセットは3タイプのシンタックス要素または構造を含む。GOSパラメータセットは、識別されたGOSパラメータセットからコピー可能なシンタックス要素を含んでもよい。こうしたシンタックス構造にはリファレンスピクチャ・リストの変更や予測重みテーブル,復号リファレンスピクチャ・マーキングを含む。GOSパラメータセットはまた、ビューコンポーネント全体で不変なシンタックス構造を含んでもよい。GOSパラメータセットは、アクセスユニット全体で不変なシンタックス要素を含んでもよい。
GOSパラメータセットは、複数の他のGOSパラメータセットからシンタックス構造を継承してもよい。例えば、リファレンスピクチャ・リスト変更は特定のGOSパラメータセットから継承されるが、復号リファレンスピクチャ・マーキングは別のGOSパラメータセットから継承されてもよい。
GOSパラメータセットは反復されてもよい。GOSパラメータセットが各スライスで反復される場合、完全なスライスヘッダを持つのと同程度のエラー耐性が得られてもよい。
本発明の種々の例示的態様は特許請求の範囲に提示されている。
本発明の第1の態様によれば、次の方法が提供される。この方法は、非圧縮ピクチャを、スライスを含む符号化ピクチャに符号化することを含み、前記符号化することは、
・ 前記スライスに対するシンタックス要素を第1のセットおよび第2のセットに分類することと;
・ 前記第1のセットおよび前記第2のセットに対するシンタックス要素値を決定することと;
・ 第1のスライス群パラメータセットまたはスライスヘッダにおいて前記第1のセットを選択的に符号化することであって、前記符号化することは次のこと:
* 別のスライス群パラメータセットから前記関連する第1のセットの包含の標示情報を提供することと;
* 前記第1のセットのシンタックス要素値を符号化することと;
* 前記両方を省略すること
の何れか1つを含む、前記符号化することと;
・ 第2のスライス群パラメータセットまたはスライスヘッダにおいて前記第2のセットを選択的に符号化することであって、前記符号化することは次のこと:
* 別のスライス群パラメータセットから前記関連する第2のセットの包含の標示情報を提供することと;
* 前記第2のセットのシンタックス要素値を符号化することと;
* 前記両方を省略すること
の何れか1つを含む、前記符号化すること
を含む。
本発明の第2の態様によれば、少なくとも1つのプロセッサと、コンピュータプログラムコードを含む少なくとも1つのメモリとを備える装置が提供される。前記少なくとも1つのメモリおよび前記コンピュータプログラムコードは、前記少なくとも1つのプロセッサを用いて、前記装置に:
・ 符号化ピクチャが含むスライスに対するシンタックス要素を第1のセットおよび第2のセットに分類することと;
・ 前記第1のセットおよび前記第2のセットに対するシンタックス要素値を決定することと;
・ 第1のスライス群パラメータセットまたはスライスヘッダにおいて前記第1のセットを選択的に符号化することであって、次のこと:
* 別のスライス群パラメータセットから前記関連する第1のセットの包含の標示情報を提供することと;
* 前記第1のセットのシンタックス要素値を符号化することと;
* 前記両方を省略すること
の何れか1つを含む、前記符号化することと;
・ 第2のスライス群パラメータセットまたはスライスヘッダにおいて前記第2のセットを選択的に符号化することであって、次のこと:
* 別のスライス群パラメータセットから前記関連する第2のセットの包含の標示情報を提供することと;
* 前記第2のセットのシンタックス要素値を符号化することと;
* 前記両方を省略すること
の何れか1つを含む、前記符号化すること
を遂行させるように構成される。
本発明の第3の態様によれば、1つ以上の命令の1つ以上のシーケンスを含むコンピュータプログラム製品が提供される。前記1つ以上の命令の1つ以上のシーケンスは、1つ以上のプロセッサによって実行されると、装置に少なくとも次のこと:
・ 符号化ピクチャが含むスライスに対するシンタックス要素を第1のセットおよび第2のセットに分類することと;
・ 前記第1のセットおよび前記第2のセットに対するシンタックス要素値を決定することと;
・ 第1のスライス群パラメータセットまたはスライスヘッダにおいて前記第1のセットを選択的に符号化することであって、次のこと:
* 別のスライス群パラメータセットから前記関連する第1のセットの包含の標示情報を提供することと;
* 前記第1のセットのシンタックス要素値を符号化することと;
* 前記両方を省略すること
の何れか1つを含む、前記符号化することと;
・ 第2のスライス群パラメータセットまたはスライスヘッダにおいて前記第2のセットを選択的に符号化することであって、次のこと:
* 別のスライス群パラメータセットから前記関連する第2のセットの包含の標示情報を提供することと;
* 前記第2のセットのシンタックス要素値を符号化することと;
* 前記両方を省略すること
の何れか1つを含む、前記符号化すること
を遂行させる。
本発明の第4の態様によれば、次の装置が提供される。この装置は、
・ 符号化ピクチャが含むスライスに対するシンタックス要素を第1のセットおよび第2のセットに分類する手段と;
・ 前記第1のセットおよび前記第2のセットに対するシンタックス要素値を決定する手段と;
・ 第1のスライス群パラメータセットまたはスライスヘッダにおいて前記第1のセットを選択的に符号化する手段であって、次のこと:
* 別のスライス群パラメータセットから前記関連する第1のセットの包含の標示情報を提供することと;
* 前記第1のセットのシンタックス要素値を符号化することと;
* 前記両方を省略すること
の何れか1つを含む、前記符号化する手段と;
・ 第2のスライス群パラメータセットまたはスライスヘッダにおいて前記第2のセットを選択的に符号化する手段であって、次のこと:
* 別のスライス群パラメータセットから前記関連する第2のセットの包含の標示情報を提供することと;
* 前記第2のセットのシンタックス要素値を符号化することと;
* 前記両方を省略すること
の何れか1つを含む、前記符号化する手段
を備える。
本発明の第5の態様によれば、次の方法が提供される。この方法は、符号化ピクチャの符号化スライスを復号することを含む方法であって、前記復号することは:
・ 前記符号化スライスをスライスヘッダまたはスライス群パラメータセットの何れかに復号するために使用される、第1のシンタックス要素セットにおける第1の位置および第2のシンタックス要素セットにおける第2の位置を識別することと;
・ 前記符号化スライスの復号用に使用されるように、前記第1のシンタックス要素セットおよび前記第2のシンタックス要素セットを復号することを含み、該第1および第2のセットを復号することは:
* 第3のスライス群パラメータセットから前記関連する第1のセットの包含を示す第1の標示情報を復号し、前記第3のスライス群パラメータセットを示す前記第1の標示情報への応答として、前記第3のスライス群パラメータセットから前記関連する第1のシンタックス要素セットを復号することと;
* 第4のスライス群パラメータセットから前記関連する第2のセットの包含を示す第2の標示情報を復号し、前記第4のスライス群パラメータセットを示す前記第2の標示情報への応答として、前記第4のスライス群パラメータセットから前記関連する第2のシンタックス要素セットを復号することと;
* 前記復号された第1のシンタックス要素セットおよび第2のシンタックス要素セットを用いて、前記符号化スライスを復号すること
を含む。
本発明の第6の態様によれば、少なくとも1つのプロセッサと、コンピュータプログラムコードを含む少なくとも1つのメモリとを備える装置が提供される。前記少なくとも1つのメモリおよび前記コンピュータプログラムコードは、前記少なくとも1つのプロセッサを用いて、前記装置に符号化ピクチャの符号化スライスを復号させ、ここで、前記復号することは、
・ 前記符号化スライスをスライスヘッダまたはスライス群パラメータセットの何れかに復号するために使用される、第1のシンタックス要素セットにおける第1の位置および第2のシンタックス要素セットにおける第2の位置を識別することと;
・ 前記符号化スライスの復号用に使用されるように、前記第1のシンタックス要素セットおよび前記第2のシンタックス要素セットを復号することを含み、該第1および第2のセットを復号することは:
* 第3のスライス群パラメータセットから前記関連する第1のセットの包含を示す第1の標示情報を復号し、前記第3のスライス群パラメータセットを示す前記第1の標示情報への応答として、前記第3のスライス群パラメータセットから前記関連する第1のシンタックス要素セットを復号することと;
* 第4のスライス群パラメータセットから前記関連する第2のセットの包含を示す第2の標示情報を復号し、前記第4のスライス群パラメータセットを示す前記第2の標示情報への応答として、前記第4のスライス群パラメータセットから前記関連する第2のシンタックス要素セットを復号することと;
* 前記復号された第1のシンタックス要素セットおよび第2のシンタックス要素セットを用いて、前記符号化スライスを復号すること
を含む。
本発明の第7の態様によれば、1つ以上の命令の1つ以上のシーケンスを含むコンピュータプログラム製品が提供される。前記1つ以上の命令の1つ以上のシーケンスは、1つ以上のプロセッサによって実行されると、装置に少なくとも次のこと:
符号化ピクチャの符号化スライスを復号させ、ここで、前記復号することは、
・ 前記符号化スライスをスライスヘッダまたはスライス群パラメータセットの何れかに復号するために使用される、第1のシンタックス要素セットにおける第1の位置および第2のシンタックス要素セットにおける第2の位置を識別することと;
・ 前記符号化スライスの復号用に使用されるように、前記第1のシンタックス要素セットおよび前記第2のシンタックス要素セットを復号することを含み、該第1および第2のセットを復号することは:
* 第3のスライス群パラメータセットから前記関連する第1のセットの包含を示す第1の標示情報を復号し、前記第3のスライス群パラメータセットを示す前記第1の標示情報への応答として、前記第3のスライス群パラメータセットから前記関連する第1のシンタックス要素セットを復号することと;
* 第4のスライス群パラメータセットから前記関連する第2のセットの包含を示す第2の標示情報を復号し、前記第4のスライス群パラメータセットを示す前記第2の標示情報への応答として、前記第4のスライス群パラメータセットから前記関連する第2のシンタックス要素セットを復号することと;
* 前記復号された第1のシンタックス要素セットおよび第2のシンタックス要素セットを用いて、前記符号化スライスを復号すること
を含む。
本発明の第8の態様によれば、次の方法が提供される。この方法は、符号化ピクチャの符号化スライスを復号することを含む方法であって、前記復号することは:
・ 前記符号化スライスをスライスヘッダまたはスライス群パラメータセットの何れかに復号するために使用される、第1のシンタックス要素セットにおける第1の位置および第2のシンタックス要素セットにおける第2の位置を識別することと;
・ 前記符号化スライスの復号用に使用されるように、前記第1のシンタックス要素セットおよび前記第2のシンタックス要素セットを復号することを含み、該第1および第2のセットを復号することは:
* 第3のスライス群パラメータセットから前記関連する第1のセットの包含を示す第1の標示情報を復号し、前記第3のスライス群パラメータセットを示す前記第1の標示情報への応答として、前記第3のスライス群パラメータセットから前記関連する第1のシンタックス要素セットを復号すること、または、前記第1の標示情報が前記第3のスライス群パラメータセットを示さない場合、前記第1のセットのシンタックス要素を復号することと;
* 第4のスライス群パラメータセットから前記関連する第2のセットの包含を示す第2の標示情報を復号し、前記第4のスライス群パラメータセットを示す前記第2の標示情報への応答として、前記第4のスライス群パラメータセットから前記関連する第2のシンタックス要素セットを復号すること、または、前記第2の標示情報が前記第4のスライス群パラメータセットを示さない場合、前記第2のセットのシンタックス要素を復号することと;
* 前記復号された第1のシンタックス要素セットおよび第2のシンタックス要素セットを用いて、前記符号化スライスを復号すること
を含む。
本発明の第9の態様によれば、少なくとも1つのプロセッサと、コンピュータプログラムコードを含む少なくとも1つのメモリとを備える装置が提供される。前記少なくとも1つのメモリおよび前記コンピュータプログラムコードは、前記少なくとも1つのプロセッサを用いて、前記装置に符号化ピクチャの符号化スライスを復号させ、ここで、前記復号することは、
・ 前記符号化スライスをスライスヘッダまたはスライス群パラメータセットの何れかに復号するために使用される、第1のシンタックス要素セットにおける第1の位置および第2のシンタックス要素セットにおける第2の位置を識別することと;
・ 前記符号化スライスの復号用に使用されるように、前記第1のシンタックス要素セットおよび前記第2のシンタックス要素セットを復号することを含み、該第1および第2のセットを復号することは:
* 第3のスライス群パラメータセットから前記関連する第1のセットの包含を示す第1の標示情報を復号し、前記第3のスライス群パラメータセットを示す前記第1の標示情報への応答として、前記第3のスライス群パラメータセットから前記関連する第1のシンタックス要素セットを復号すること、または、前記第1の標示情報が前記第3のスライス群パラメータセットを示さない場合、前記第1のセットのシンタックス要素を復号することと;
* 第4のスライス群パラメータセットから前記関連する第2のセットの包含を示す第2の標示情報を復号し、前記第4のスライス群パラメータセットを示す前記第2の標示情報への応答として、前記第4のスライス群パラメータセットから前記関連する第2のシンタックス要素セットを復号すること、または、前記第2の標示情報が前記第4のスライス群パラメータセットを示さない場合、前記第2のセットのシンタックス要素を復号することと;
* 前記復号された第1のシンタックス要素セットおよび第2のシンタックス要素セットを用いて、前記符号化スライスを復号すること
を含む。
本発明の第10の態様によれば、1つ以上の命令の1つ以上のシーケンスを含むコンピュータプログラム製品が提供される。前記1つ以上の命令の1つ以上のシーケンスは、1つ以上のプロセッサによって実行されると、装置に少なくとも次のこと:
符号化ピクチャの符号化スライスを復号させ、ここで、前記復号することは、
・ 前記符号化スライスをスライスヘッダまたはスライス群パラメータセットの何れかに復号するために使用される、第1のシンタックス要素セットにおける第1の位置および第2のシンタックス要素セットにおける第2の位置を識別することと;
・ 前記符号化スライスの復号用に使用されるように、前記第1のシンタックス要素セットおよび前記第2のシンタックス要素セットを復号することを含み、該第1および第2のセットを復号することは:
* 第3のスライス群パラメータセットから前記関連する第1のセットの包含を示す第1の標示情報を復号し、前記第3のスライス群パラメータセットを示す前記第1の標示情報への応答として、前記第3のスライス群パラメータセットから前記関連する第1のシンタックス要素セットを復号すること、または、前記第1の標示情報が前記第3のスライス群パラメータセットを示さない場合、前記第1のセットのシンタックス要素を復号することと;
* 第4のスライス群パラメータセットから前記関連する第2のセットの包含を示す第2の標示情報を復号し、前記第4のスライス群パラメータセットを示す前記第2の標示情報への応答として、前記第4のスライス群パラメータセットから前記関連する第2のシンタックス要素セットを復号すること、または、前記第2の標示情報が前記第4のスライス群パラメータセットを示さない場合、前記第2のセットのシンタックス要素を復号することと;
* 前記復号された第1のシンタックス要素セットおよび第2のシンタックス要素セットを用いて、前記符号化スライスを復号すること
を含む。
本発明の第11の態様によれば、次の装置が提供される。この装置は、符号化ピクチャの符号化スライスを復号する手段を備える方法であって、前記復号する手段は、
・ 前記符号化スライスをスライスヘッダまたはスライス群パラメータセットの何れかに復号するために使用される、第1のシンタックス要素セットにおける第1の位置および第2のシンタックス要素セットにおける第2の位置を識別する手段と;
・ 前記符号化スライスの復号用に使用されるように、前記第1のシンタックス要素セットおよび前記第2のシンタックス要素セットを復号する手段を備え、該第1および第2のセットを復号する手段は:
* 第3のスライス群パラメータセットから前記関連する第1のセットの包含を示す第1の標示情報を復号し、前記第3のスライス群パラメータセットを示す前記第1の標示情報への応答として、前記第3のスライス群パラメータセットから前記関連する第1のシンタックス要素セットを復号すること、または、前記第1の標示情報が前記第3のスライス群パラメータセットを示さない場合、前記第1のセットのシンタックス要素を復号する手段と;
* 第4のスライス群パラメータセットから前記関連する第2のセットの包含を示す第2の標示情報を復号し、前記第4のスライス群パラメータセットを示す前記第2の標示情報への応答として、前記第4のスライス群パラメータセットから前記関連する第2のシンタックス要素セットを復号すること、または、前記第2の標示情報が前記第4のスライス群パラメータセットを示さない場合、前記第2のセットのシンタックス要素を復号する手段と;
* 前記復号された第1のシンタックス要素セットおよび第2のシンタックス要素セットを用いて、前記符号化スライスを復号する手段
を備える。
本発明の例示的実施形態をよりはっきりと理解するために、次の添付図面を参照しつつ以下の説明を参照されたい。
例示的実施形態に従うビデオ符号化システムのブロック図を示す。 例示的実施形態に従うビデオ符号化装置を示す。 例示的実施形態に従う複数の装置,ネットワークおよびネットワーク要素を含むビデオ符号化構成を示す。 例示的実施形態に従うビデオ符号化および復号化のブロック図を示す。 例示的実施形態に従うビデオ符号化および復号化のブロック図を示す。 DIBRベースの3DVシステムの簡易モデルを示す。 立体カメラセットアップの簡易2次元モデルを示す。 アクセスユニットの定義および符号化順序の実施例を示す。 テクスチャビューおよび深度ビューを符号化することができるエンコーダに関する実施形態の高水準スローチャートを示す。 テクスチャビューおよび深度ビューを復号することができるデコーダに関する実施形態の高水準スローチャートを示す。 例示的実施形態に従うアクセスユニットの構造を簡易的に示す。 1つのコンポーネントピクチャ区切りNALユニットおよび2つの符号化スライスNALユニットを含むコンポーネントピクチャの実施例を示す。 スライスパラメータ構造のCPD間予測の実施例を示す。
実施形態の詳細な説明
つぎに、本発明の複数の実施形態を、ビデオ符号化構成を背景にして説明する。ただし、本発明はこうした特定の構成に限定されるものではないことに留意されたい。
実際に、リファレンスピクチャの取扱いの改良が要求される環境下において、様々な実施形態を幅広く適用することができる。例えば、本発明はストリーミングシステム等のビデオ符号化システムやDVDプレーヤー,デジタルテレビ受像機,パーソナルビデオレコーダーやシステム,パーソナルコンピュータや携帯コンピュータ,通信デバイスで実行されるコンピュータプログラムに対して適用可能でもよい。さらに、ビデオデータを取扱うトランスコーダやクラウドコンピューティング構成等のネットワーク要素に対して適用可能でもよい。
H.264/AVC規格は、ITU-T(国際電気通信連合の電気通信標準化部門)のビデオ符号化専門家グループ(VCEG)およびISO(国際標準化機構)/IEC(国際電気標準会議)の動画専門家グループ(MPEG)による統合ビデオチーム(JVT)によって開発された。H.264/AVC規格は親である両標準化機構によって公開されており、ITU-T勧告H.264およびISO/IEC国際規格14496-10と呼ばれる。ISO/IEC14496-10はMPEG-4パート10アドバンスドビデオ符号化(Advanced Video Coding;AVC)として知られている。H.264/AVC規格には複数のバージンがあり、それぞれが規格に新たな拡張や仕様を統合している。こうした拡張には、スケーラブルビデオ符号化(Scalable Video Coding;SVC)とマルチビュービデオ符号化(Multiview Video Coding;MVC)が含まれる。
また現在では、VCEGとMPEGの共同研究開発チーム(JCT-VC)によって高効率ビデオ符号化(High Efficiency Video Coding;HEVC)の標準化プロジェクトが進められている。
本節では、H.264/AVCおよびHEVCの重要な定義やビットストリーム,符号化構造,概念の一部がビデオのエンコーダやデコーダ,符号化方法,復号方法,ビットストリーム構造の例として説明される。本発明の実施形態はこうした例に実装されてもよい。H.264/AVCの重要な定義やビットストリーム,符号化構造,概念の中には、現在作業中のHEVCのドラフトにあるものと同一のものもある。したがって、以下ではこれらも一緒に説明される。本発明の態様はH.264/AVCやHEVCに限定されるものではない。本明細書は、本発明の一部または全部が実現される上での可能な原理を説明するためのものである。
数ある従来のビデオ符号化規格と同様にH.264/AVCとHEVCでも、エラーの無いビットストリームの復号処理だけでなくビットストリームの構文と意味についても規定されている。符号化処理は規定されていないが、エンコーダは必ずビットストリームの確認を行わなくてはならない。ビットストリームとデコーダの適合性は、仮想リファレンスデコーダ(Hypothetical Reference Decoder;HRD)を用いて検証することができる。標準規格は伝送エラーや伝送損失対策を助ける符号化ツールを含む。しかし、こうしたツールを符号化で使用するのは任意選択であって、誤ったビットストリームに対する復号処理は何も規定されていない。
H.264/AVCまたはHEVCのエンコーダへの入力およびH.264/AVCまたはHEVCのデコーダからの出力のための基本単位はそれぞれピクチャである。H.264/AVCでは、ピクチャはフレームまたはフィールドの何れかでもよい。現在作成中のHEVCドラフトでは、ピクチャはフレームである。フレームは輝度(luma)サンプルと対応する色差(chroma)サンプルの行列を含む。フィールドはフレームの代替サンプル行の組であり、ソース信号がインターレースである場合、エンコーダ入力として用いられてもよい。色差ピクチャは、輝度ピクチャと比較されるときにサブサンプリングされてもよい。例えば、4:2:0サンプリングパターンでは、色差ピクチャの空間解像度は両座標軸で輝度ピクチャの半分である。
H.264/AVCでは、16×16ブロックの輝度サンプルと対応する色差サンプルのブロックがマクロブロックである。例えば、4:2:0サンプリングパターンでは、マクロブロックは各色差成分で8×8ブロックの色差サンプルを含む。H.264/AVCでは、ピクチャは1つ以上のスライスグループに分割され、スライスグループは1つ以上のスライスを含む。H.264/AVCでは、スライスは整数のマクロブロックから成り、特定のスライスグループ内でラスタースキャンの順で連続している。
HEVCドラフト規格では、ビデオピクチャは、ピクチャ領域を覆う複数の符号化単位(CU)に分割される。CUは1つ以上の予測単位(PU)と1つ以上の変換単位(TU)から成る。PUはCU内のサンプルに対する予測処理を規定し、TUはCUのサンプルに対する予測誤差の符号化処理を規定する。通常CUは、正方形のサンプルブロックから成り、既定されている可能なCUサイズのセットから選択可能なサイズを持つ。最大許容サイズのCUは通常、LCU(最大符号化単位)と呼ばれ、ビデオピクチャは重なり合わないLCUに分割される。LCUは、例えばLCUと分割の結果得られるCUを再帰的に分割することによって更に小さいCUの組合せに分割されることもある。分割の結果得られる各CUは通常、少なくとも1つのPUとそれに関連する少なくとも1つのTUを有する。PUとTUはそれぞれ、予測処理と予測誤差符号化処理の粒度を上げるために、更に小さい複数のPUとTUに分割されることもある。PU分割は、CUを同じサイズの4つの正方形PUに分割することで行われてもよい。あるいは、対称的または非対称的方法でCUを縦または横で2つの長方形PUに分割することで行われてもよい。ピクチャをCUに分割し、CUをPUとTUに分割することは通常、デコーダにこうしたユニットから目的の構造を再生させるビットストリーム信号で伝えられる。
HEVCドラフト規格では、ピクチャはタイルに分割される。タイルは長方形で、整数のLCUを含む。現在作業中のHEVCドラフトでは、タイル分割(パーティショニング)は規則的なグリッドを形成し、タイルの高さと幅は最大のLCUによって互いに異なる。HEVCドラフトでは、スライスは整数のCUから成る。CUは、タイル内、またはタイルが使われない場合はピクチャ内でLCUのラスタースキャン順にスキャンされる。LCU内では、CUは特定のスキャン順序を持つ。
HEVCのワーキングドラフト(WD)5では、ピクチャのパーティショニングに関する主要規定と概念が次のように定義されている。パーティショニングとは、1つのセットの各要素が正確にサブセットの1つであるように、そのセットを複数のサブセットに分割することとして定義される。
HEVC WD5の基本符号化単位はツリーブロックである。ピクチャのツリーブロックは、N×Nブロックの輝度サンプルと対応する2ブロックの色差サンプルという3つのサンプル配列持つ。あるいは、モノクロピクチャや3つの別々の色平面を用いて符号化されるピクチャに関するN×Nブロックのサンプルである。ツリーブロックは、別々の符号化および復号処理用に分割されてもよい。ツリーブロック分割(パーティショニング)は、ピクチャのツリーブロック分割によって得られる1ブロックの輝度サンプルと対応する2ブロックの色差サンプルという3つのサンプル配列持つ。あるいは、モノクロピクチャや3つの別々の色平面を用いて符号化されるピクチャのツリーブロック分割によって得られるに関する1ブロックの輝度サンプルである。各ツリーブロックには、イントラまたはインター予測符号化用のブロックサイズと変換符号化用ブロックサイズを識別するパーティション信号が割当てられる。パーティショニングは再帰的4分木パーティショニングである。4分木の根はツリーブロックに関連付けられる。4分木は、符号化ノードとも呼ばれる葉ノードに到達するまで分割される。符号化ノードは、予測ツリーと変換ツリーの2つのツリーの根ノードである。予測ツリーは予測ブロックの位置とサイズを特定する。予測ツリーと関連する予測データは予測単位と呼ばれる。変換ツリーは変換ブロックの位置とサイズを特定する。変換ツリーと関連する変換データは変換単位と呼ばれる。輝度および色差の分割情報は予測ツリーでは同一であるが、変換ツリーでは同一でも異なっていてもどちらでもよい。符号化ノードと関連する予測単位・変換単位は合わせて符号化単位を形成する。
HEVC WD5では、ピクチャはスライスとタイルに分割される。スライスはツリーブロックのシーケンスでもよいが、(いわゆる高精細スライスと呼ばれる場合は)ツリーブロック内の変換単位と予測単位が一致する場所に境界があってもよい。スライス内のツリーブロックは、ラスタースキャン順序で符号化され復号される。最初の符号化ピクチャに対して、各ピクチャをスライスに分割することがパーティショニングである。
HEVC WD5では、タイルは、1つの列または行に存在する整数のツリーブロックとして定義され、このツリーブロックはタイル内でラスタースキャン順に連続している。最初の符号化ピクチャに対して、各ピクチャをタイルに分割することもパーティショニングである。タイルはピクチャ内でラスタースキャン順に連続している。スライスはそこでラスタースキャン順に連続するツリーブロックを含むが、こうしたツリーブロックがピクチャ内でラスタースキャン順に連続している必要はない。また、スライスとタイルは同一のツリーブロック列を含む必要はない。タイルは複数のスライスに含まれるツリーブロックを含んでもよい。同様に、1つのスライスが複数のスライスに含まれるツリーブロックを含んでもよい。
H.264/AVCおよびHEVCでは、ピクチャ内でスライス境界を跨ぐ予測が無効でもよい。したがって、スライスは、符号化ピクチャを独立して復号される部分に分割する方法として考えられることもあり、それ故しばしば、伝送の基本単位と見做される。多くの場合、エンコーダは、ピクチャ内予測のどの種類がスライス境界を跨ぐ際に止められているかをビットストリームで示してもよい。この情報は、デコーダの動作によって、どの予測ソースが利用可能であるかを決定する際などで考慮される。例えば、隣接するマクロブロックやCUが別のスライスに存在する場合、その隣接するマクロブロックやCUからのサンプルはイントラ予測には利用不可であると見做されてもよい。
シンタックス要素はビットストリームで表わされるデータの要素として定義される。シンタックス構造は、特定の順序のビットストリームで表わされる0以上のデータの要素として定義される。
H.264/AVCまたはHEVCのエンコーダからの出力およびH.264/AVCまたはHEVCのデコーダへの入力のための基本単位はそれぞれ、ネットワーク抽象化層(Network Abstraction Layer;NAL)ユニットである。パケット指向ネットワークでの伝送や構造化ファイルへの格納に対して、NALユニットはパケットや同様の構造にカプセル化されてもよい。H.264/AVCおよびHEVCでは、フレーム構造を提供しない伝送や格納の環境に対してバイトストリーム・フォーマットが特定されている。バイトストリーム・フォーマットは、各NALユニットの先頭に開始コードを付与することによってNALユニット同士を分離する。NALユニット境界の誤検出を防止するために、エンコーダはバイト指向開始コードエミュレーション防止アルゴリズムを実行する。これは、開始コードが別の形で生じた場合にNALユニットペイロードにエミュレーション防止バイトを追加する。パケット指向システムとストリーム指向システムとの間の直接的なゲートウェイ動作を可能とするために、バイトストリーム・フォーマットが使用されているか否かに関係なく常に開始コードエミュレーション防止が行われてもよい。
NALユニットはヘッダとペイロードから成る。H.264/AVCおよびHEVCでは、NALユニットヘッダはNALユニットの種類と、NALユニットに含まれる符号化スライスがリファレンスピクチャであるか非リファレンスピクチャであるかを示す。H.264/AVCは2ビットのシンタックス要素nal_ref_idcを含み、これが0のときはNALユニットに含まれる符号化スライスが非リファレンスピクチャの一部であることを示し、0を超えるときはNALユニットに含まれる符号化スライスがリファレンスピクチャの一部であることを示す。HEVCドラフトは1ビットのシンタックス要素nal_ref_idcを含み、nal_ref_flagとも呼ばれる。これが0のときはNALユニットに含まれる符号化スライスが非リファレンスピクチャの一部であることを示し、1のときはNALユニットに含まれる符号化スライスがリファレンスピクチャの一部であることを示す。SVCおよびMVCのNALユニットヘッダは、拡張性とマルチビュー階層の関連する様々な標示を追加で含んでもよい。HEVCでは、NALユニットヘッダはシンタックス要素temporal_idを含み、NALユニットに対する時間識別子を特定する。選択された値以上のtemporal_idを持つ全てのVCL-NALユニットを除外し、それ以外の全てのVCL-NALユニットを含めることによって生成されたビットストリームが適合するものである。その結果、TIDと等しいtemporal_idを持つピクチャは、TIDを超えるtemporal_idを持つどのピクチャもインター予測リファレンスとして使用しない。HEVCドラフトでは、リファレンスピクチャ・リストの初期化は、「リファレンスに使用済」とマークされ、temporal_idが現在のピクチャ(現ピクチャ)のtemporal_id以下であるリファレンスピクチャのみに限定される。
NALユニットはビデオ符号化層(Video Coding Layer;VCL)NALユニットと非VCL-NALユニットに分類される。VCL-NALユニットは通常、符号化スライスNALユニットである。H.264/AVCでは、符号化スライスNALユニットは1つ以上の符号化マクロブロックを表わすシンタックス要素を含み、それぞれが非圧縮ピクチャのサンプルブロックに対応する。HEVCでは、符号化スライスNALユニットは1つ以上のCUを表わすシンタックス要素を含む。H.264/AVCおよびHEVCでは、符号化スライスNALユニットは瞬時復号リフレッシュ(Instantaneous Decoding Refresh;IDR)ピクチャの符号化スライスまたは非IDRピクチャの符号化スライスであると示されることもある。HEVCでは、符号化スライスNALユニットはクリーン復号リフレッシュ(Clean Decoding Refresh;CDR)ピクチャ(クリーン・ランダムアクセス(Clean Random Access)ピクチャとも呼ばれる)の符号化スライスであると示されることもある。
非VCL-NALユニットは、例えば次のタイプの1つでもよい:シーケンスパラメータセット;ピクチャパラメータセット;補助強化情報(supplemental enhancement information;SEI)NALユニット;アクセスユニット区切り;シーケンスNALユニット終端;ストリームNALユニット終端;または補充データNALユニット。パラメータセットは復号ピクチャの再構成に必要であってもよいが、他の非VCL-NALユニットの多くは、復号サンプル値の再構成には必要ない。
符号化ビデオシーケンスで不変のパラメータがシーケンスパラメータセットに含まれてもよい。復号処理に重要であるパラメータに加え、シーケンスパラメータセットがビデオユーザビリティ情報(video usability information;VUI)を含んでもよい。これは、バッファリングやピクチャ出力タイミング,レンダリング,リソース予約に重要なパラメータを含む。H.264/AVCでは、シーケンスパラメータセットを含む3つのNALユニットが規定されている。シーケンスパラメータセットNALユニットは、H.264/AVCのVCL-NALユニット用データ全てをシーケンスに含む。シーケンスパラメータセット拡張NALユニットは補助符号化ピクチャ用データを含む。サブセット・シーケンスパラメータセットNALユニットはMVCとSVCのVCL-NALユニット用である。ピクチャパラメータセットは、複数の符号化ピクチャで不変であるようなパラメータを含む。
HEVCドラフトでは、適応パラメータセット(Adaptation Parameter Set;APS)と呼ばれる第3のタイプのパラメータセットがあり、複数の符号化ピクチャで不変であるようなパラメータを含む。HEVCドラフトでは、APSシンタックス構造は、コンテキスト適応型二値算術符号化(context-based adaptive binary arithmetic coding;CABAC)や適応サンプルオフセット,適応ループフィルタリング,デブロッキング・フィルタリングに関連するパラメータまたはシンタックス要素を含む。HEVCドラフトでは、APSは他のNALユニットから参照または予測されずに符号化されるNALユニットである。シンタックス要素aps_idと呼ばれる識別子はAPS-NALユニットに含まれる。これはスライスヘッダにも含まれ、特定のAPSを表わすために用いられる。
H.264/AVCおよびHEVCのシンタックスは様々なパラメータインスタンスを許容し、各インスタンスは固有の識別子で識別される。H.264/AVCでは、各スライスヘッダは、そのスライスを含むピクチャの復号に対してアクティブなピクチャパラメータセットの識別子を含む。各ピクチャパラメータセットは、アクティブなシーケンスパラメータセットの識別子を含む。その結果、ピクチャとシーケンスパラメータセットの伝送がスライスの伝送と正確に同期されている必要がない。実際に、アクティブシーケンスとピクチャパラメータセットはそれらが参照される前までに受取られていれば十分であり、スライスデータ用のプロトコルよりも高い信頼性のある伝送機構を使って「帯域外」でパラメータセットを伝送することが可能になる。例えば、パラメータセットはリアルタイム転送プロトコル(Real-time Transport Protocol;RTP)セッション用のセッション記述でのパラメータとして含まれてもよい。パラメータセットは、帯域内で伝送される場合、エラー耐性を高めるために繰り返されることもある。
SEI-NALユニットは1つ以上のSEIメッセージを含んでもよい。これらは出力ピクチャの復号には必要ないが、ピクチャ出力タイミングやエラー検出,エラー隠蔽,リソース予約等の関連処理を補助する。複数のSEIメッセージがH.264/AVCおよびHEVCで規定され、ユーザデータのSEIメッセージによって組織や企業が独自に使用するSEIメッセージも規定される。H.264/AVCおよびHEVCは、規定されたSEIメッセージのシンタックスと意味を含むが、受信側でメッセージを取扱う処理については何も定義されない。その結果、エンコーダはSEIメッセージを作成する際、H.264/AVC規格やHEVC規格に従い、デコーダもそれぞれH.264/AVC規格やHEVC規格に準拠する必要がある。しかし、SEIメッセージを出力規定に準じて処理する必要はない。H.264/AVCおよびHEVCでSEIメッセージのシンタックスと意味を含める理由の1つは、異なるシステム仕様でも補助情報を同じ様に解釈し相互運用を可能にすることである。システム仕様は符号化側と復号側の両方で特定のSEIメッセージを使用可能にするように要求するものであり、受信側で特定のSEIメッセージを取扱う処理も規定されてもよい。
符号化ピクチャはピクチャの符号化された表現である。H.264/AVCでの符号化ピクチャは、ピクチャの復号に必要なVCL-NALユニットを含む。H.264/AVCでは、符号化ピクチャはプライマリ符号化ピクチャまたは冗長符号化ピクチャである。プライマリ符号化ピクチャは有効なビットストリームの復号処理で使用される。一方、冗長符号化ピクチャは、プライマリ符号化ピクチャが正しく復号されない場合にだけ復号される冗長表現である。HEVCドラフトでは、冗長符号化ピクチャは規定されていない。
H.264/AVCおよびHEVCでは、アクセスユニットがプライマリ符号化ピクチャとそれに関連付けられるNALユニットを含む。H.264/AVCでは、アクセスユニット内でのNALユニットの出現順序が次の通りに制限されている。追加アクセスユニット区切りのNALユニットは、アクセスユニットの起点を示すことができる。この後に0以上のSEI-NALユニットが続く。プライマリ符号化ピクチャの符号化スライスが次に現われる。H.264/AVCでは、プライマリ符号化ピクチャの符号化スライスの後に0以上の冗長符号化ピクチャの符号化スライスが続いてもよい。冗長符号化ピクチャは、ピクチャまたはピクチャの一部の符号化された表現である。冗長符号化ピクチャは、伝送損失や物理記憶媒体でのデータ破損等によってデコーダがプライマリ符号化ピクチャを受取れない場合に復号されてもよい。
H.264/AVCでは、アクセスユニットは補助符号化ピクチャを含んでもよい。これは、プライマリ符号化ピクチャを補助/補完し、表示処理等で使用することができるピクチャである。補助符号化ピクチャは、例えば復号ピクチャのサンプルの透過レベルを特定するアルファチャンネルやアルファ面として使用されてもよい。アルファチャンネルまたはアルファ面は、レイヤ成分やレンダリングシステムで使用されてもよい。出力ピクチャは、互いに表面で少なくとも一部が透過しているピクチャを重ね合わせることで作成される。補助符号化ピクチャは、モノクロ冗長符号化ピクチャとして同一のシンタックスと意味の制限がある。H.264/AVCでは、補助符号化ピクチャはプライマリ符号化ピクチャと同数のマクロブロックを含む。
符号化ビデオシーケンスは、連続するアクセスユニットのシーケンスとして定義される。このシーケンスは復号処理の順序であって、IDRアクセスユニットを含んでそこから、次のIDRアクセスユニットを含まずその直前かビットストリームの最後のうち先に出現するところまでの順序である。
ピクチャーグループ(GOP)とその特性は次の通りに定義されてもよい。GOPは、その前のピクチャが復号されたどうかに関係なく復号される。オープンGOPとは、復号処理がその最初のイントラピクチャから開始する場合に、出力順で最初のイントラピクチャより先のピクチャが正しく復号されないようなピクチャーグループである。換言すれば、オープンGOPのピクチャは、その前のGOPに属するピクチャを(インター予測で)参照してもよい。H.264/AVCデコーダは、H.264/AVCビットストリームでのリカバリポイントのSEIメッセージによって、オープンGOPの始めのイントラピクチャを認識することができる。そして、HEVCデコーダはオープンGOPの始めのイントラピクチャを認識することができる。これは、符号化スライスに対して特別なNALユニットタイプであるCDR-NALユニットタイプが使用されるからである。クローズドGOPとは、復号処理がその最初のイントラピクチャから開始する場合に、全ピクチャが正しく復号される様なピクチャーグループである。換言すれば、クローズドGOPではその前のGOPに属するピクチャを参照するピクチャは存在しない。H.264/AVCおよびHEVCでは、クローズドGOPはIDRアクセスユニットから始まる。その結果、クローズドGOPの構造はオープンGOPの構造よりも高いエラー回復能力を持つ。しかし、圧縮効率を減らす可能性があるという代償を伴う。オープンGOPの符号化構造は、リファレンスピクチャの選択における高い柔軟性によって、より効率的な圧縮を可能にする。
H.264/AVCおよびHEVCのビットストリームシンタックスは、特定のピクチャが別のピクチャのイントラ予測のためのリファレンスピクチャであるかを示す。任意の符号化タイプ(I,P,B)のピクチャは、H.264/AVCおよびHEVCのリファレンスピクチャまたは非リファレンスピクチャであり得る。NALユニットヘッダはNALユニットの種類と、NALユニットに含まれる符号化スライスがリファレンスピクチャであるか非リファレンスピクチャであるかを示す。
H.264/AVCおよびHEVCを含む多くのハイブリッドビデオコーデックは、ビデオ情報を2段階で符号化する。第1段階では、特定のピクチャ領域または「ブロック」のピクセル値またはサンプル値が予測される。こうしたピクセル値またはサンプル値は、例えば動き補償機構によって予測可能である。この機構には、符号化されるブロックに近くて対応する、先に符号化されたビデオフレームの1つにある領域の検索と標示が含まれる。加えて、ピクセル値またはサンプル値は、空間領域の関係性の検索と標示を含む空間機構によって予測されてもよい。
先に符号化された画像からの画像情報を用いた予測アプローチは、インター予測法とも呼ばれ、また、時間予測および動き補償とも呼ばれる。同一画像内の画像情報を用いた予測アプローチは、イントラ予測法とも呼ばれる。
第2段階は、ピクセルまたはサンプルの予測ブロックとそのピクセルまたはサンプルの元のブロックとの間の誤差の符号化の何れかである。これは、特定の変換を用いてピクセル値またはサンプル値の差を変換することによって達成されてもよい。この変換は、離散コサイン変換(Discrete Cosine Transform;DCT)やその変形でもよい。差の変換後、変換された差は量子化されエントロピー符号化される。
量子化処理の忠実性を変えることによって、エンコーダはピクセルまたはサンプル表現の正確性(すなわち、ピクチャの視覚的品質)と結果として得られる符号化ビデオ表現のサイズ(すなわち、ファイルサイズや伝送ビットレート)との間のバランスを制御することができる。
デコーダは、予測されたピクセルまたはサンプルのブロック表現を形成して予測誤差を復号するために、エンコーダが用いたのと同様の予測機構を適用することによって出力ビデオを再構成する(ここで、予測表現の形成は、エンコーダが作成し、画像の圧縮表現に格納された動き情報や空間情報を使用し、予測誤差の復号は、空間領域で量子化された予測誤差信号を回復する、予測誤差符号化の逆操作を使用して行われる)。
ピクセルまたはサンプルの予測および誤差復号処理の後、デコーダは、出力ビデオフレームを形成するために、予測信号と予測誤差信号(ピクセル値またはサンプル値)を合成する。
デコーダ(およびエンコーダ)は、出力ビデオをディスプレイに送る、および/またはビデオシーケンスにおける後続ピクチャ用の予測リファレンスとして格納する前に、出力ビデオの品質を向上するために追加のフィルタリング処理を適用してもよい。
H.264/AVCおよびHEVCを含む多くのビデオコーデックでは、動き情報は、動き補償された画像ブロックのそれぞれに関連する動きベクトルによって示される。こうした動きベクトルはそれぞれ、(エンコーダで)符号化されるピクチャまたは(デコーダで)復号されるピクチャの画像ブロックと、先に符号化または復号された画像(またはピクチャ)の1つにおける予測元ブロックとの間の移動量を表わす。H.264/AVCおよびHEVCは、その他多くのビデオ圧縮規格と同様にピクチャを長方形のメッシュに分割する。これらの長方形のそれぞれに対し、リファレンスピクチャの1つにある同じブロックがインター予測用に示される。予測ブロックの位置は、符号化されるブロックに対する予測ブロックの相対位置を示す動きベクトルとして符号化される。
インター予測処理は、次のファクタの1つ以上によって特徴付けられてもよい。
動きベクトル表現の正確さ
例えば、動きベクトルは4分の1ピクセルの精度であって、分数ピクセルの位置でのサンプル値は、有限インパルス応答(finite impulse response;FIR)フィルタを用いて得られてもよい。
インター予測用のブロック分割(パーティショニング)
H.264/AVCおよびHEVCを含む多くの符号化規格では、エンコーダでの動き補償予測用に適用される動きベクトルのためにブロックのサイズと形状を選択することができ、エンコーダで行われた動き補償予測をデコーダが再構成できるように、選択されたサイズと形状をビットストリームで示すことができる。
インター予測用リファレンスピクチャの数
インター予測の元データは、先に復号されたピクチャである。H.264/AVCおよびHEVCを含む多くの符号化規格では、インター予測用に複数のリファレンスピクチャを格納し、ブロックバイアスに応じて使用されるリファレンスピクチャを選択することができる。例えば、リファレンスピクチャは、H.264/AVCでのマクロブロックまたはマクロブロックパターンのバイアスや、HEVCのPUまたはCUのバイアスに関して選択されてもよい。H.264/AVCおよびHEVC等の多くの符号化規格は、デコーダが1つ以上のリファレンスピクチャ・リストを作成できるシンタックス構造をビットストリームに含む。リファレンスピクチャ・リストを示すリファレンスピクチャ・インデクスは、複数のリファレンスピクチャの中のどれが特定のブロックに対するインター予測用として使用されるかを示すのに使われてもよい。リファレンスピクチャ・インデクスは、エンコーダによって何らかのインター符号化法でビットストリームに符号化されてもよく、あるいは、他のインター符号化法によって、隣接ブロック等を使って(エンコーダおよびデコーダによって)引出されてもよい。
動きベクトル予測
動きベクトルをビットストリームに効率よく表現するために、動きベクトルは、ブロック毎の予測動きベクトルに関して差動符号化されてもよい。多くのビデオコーデックでは、予測動きベクトルは所定の方法、例えば隣接ブロックの符号化/復号動きベクトルの中央値を計算することによって生成される。動きベクトル予測を行う別の方法は、時間軸上のリファレンスピクチャにおける隣接ブロックおよび/または共存ブロックから予測候補のリストを作成し、選択された候補を動きベクトルの予測として信号で伝えるものである。動きベクトルの値の予測に加え、先に符号化/復号されたピクチャのリファレンスインデクスが予測されてもよい。リファレンスインデクスは通常、時間軸上のリファレンスピクチャにおける隣接ブロックおよび/または共存ブロックから予測される。動きベクトルの差動符号化は通常、スライス境界を跨ぐときは無効にされる。
多仮説動き補償予測
H.264/AVCおよびHEVCでは、Pスライスで単一の予測ブロックを使用することができる(このため、Pスライスは単予測スライスと呼ばれる)。また、Bスライスとも呼ばれる双予測スライスに対しては、2つの動き補償予測ブロックの線形結合を使用することができる。Bスライスの個別ブロックは双予測や単予測,イントラ予測されたものでもよく、Pスライスの個別ブロックは単予測またはイントラ予測されたものでもよい。双予測ピクチャ用のリファレンスピクチャは、出力順で後続ピクチャと先行ピクチャに限定しなくてもよく、任意のリファレンスピクチャが使用されてもよい。H.264/AVCおよびHEVC等の多くの符号化規格では、リファレンスピクチャ・リスト0と呼ばれる特定のリファレンスピクチャ・リストがPスライス用に構成され、2つのリファレンスピクチャ・リストであるリスト0およびリスト1がBスライス用に構成される。Bスライスに関して、前方予測はリファレンスピクチャ・リスト0のリファレンスピクチャからの予測のことであり、後方予測はリファレンスピクチャ・リスト1のリファレンスピクチャからの予測のことである。ここで、予測用リファレンスピクチャは互いに、または現ピクチャに関連する復号処理や出力順序を持っていてもよい。
加重予測
多くの符号化規格は、インター(P)ピクチャの予測ブロックに対して予測重み1、Bピクチャの各予測ブロックに対して予測重み0.5を(結果として平均するのに)用いる。H.264/AVCでは、PとBの両スライスで加重予測を行える。陰加重予測では、重みはピクチャ順序カウント(picture order count)に比例し、陽加重予測では、予測の重みは明示的に示される。
多くのビデオコーデックでは、動き補償後の予測残差は最初に(DCTのような)変換カーネルで変換され、次に符号化される。これは、通常残差間にも相関があり、こうした変換が多くの場合でこのような相関を小さくするのに役立ち、より高い効率での符号化を可能にするからである。
HEVCドラフトでは、各PUは、それぞれのPU内のピクセルに適用される予測の種類を定義する、それぞれのPUに関連した予測情報(例えば、インター予測されたPUに対しては動きベクトルの情報、イントラ予測されたPUに対してはイントラ予測の方向情報等)を持つ。同様に、各TUは、それぞれのTU内のサンプルに対する予測誤差復号処理を記述する情報(DCT係数情報等も含む)に関連付けられる。各CUに対して予測誤差符号化が適用されるか否かがCUレベルで伝達されてもよい。CUに関連する予測誤差の残差がない場合、そのCUに対するTUが存在しないと見做される。
符号化フォーマットやコーデックによっては、いわゆる短期リファレンスピクチャと長期リファレンスピクチャとが区別される。こうした区別は、時間ダイレクトモードや陰加重予測における動きベクトルのスケーリングとして一部の復号処理に影響を与えることもある。時間ダイレクトモードに使われるリファレンスピクチャが両方とも短期リファレンスピクチャである場合、予測で使われる動きベクトルは、現ピクチャと各リファレンスピクチャとの間のピクチャ順序カウント(POC)の差に応じてスケールされてもよい。しかし、時間ダイレクトモード用の少なくとも1つのリファレンスピクチャが長期リファレンスピクチャである場合、デフォルトの動きベクトルスケーリングが使用されてもよく、例えば動きを半分にスケールしてもよい。同様に、陰加重予測で短期リファレンスピクチャが使われる場合、予測の重みは、現ピクチャのPOCとリファレンスピクチャのPOCのPOC差に応じてスケールされてもよい。しかし、陰加重予測で長期リファレンスピクチャが使われる場合、デフォルトの予測重みが使用されてもよく、双予測ブロックに対する陰加重予測では0.5等でもよい。
H.264/AVC等のビデオ符号化フォーマットでは、シンタックス要素frame_numを含み、複数のリファレンスピクチャに関連する様々な復号処理に使用される。H.264/AVCでは、IDRピクチャのframe_num値は0である。非IDRピクチャのframe_num値は0復号順で先のリファレンスピクチャのframe_numに1を加えた値に等しい(モジュロ(modulo)演算の場合、frame_num値は、その最大値の次が0に戻る)。
H.264/AVCおよびHEVCはピクチャ順序カウント(POC)の概念を含む。POC値は各ピクチャに与えられ、出力におけるピクチャの順番が増えても減ることはない。したがって、POCはピクチャの出力順序を示す。POCは復号処理で使用されてもよく、例えば双予測スライスの時間ダイレクトモードでの動きベクトルの陰スケーリングや加重予測で陰に生成される重み,リファレンスピクチャ・リストの初期化等に使用される。また、POCは出力順序適合性の検証に使用されてもよい。H.264/AVCでは、POCは先のIDRピクチャや、全てのピクチャを「リファレンスに未使用」とマークするメモリ管理制御操作を含むピクチャに関連して特定される。
H.264/AVCは、デコーダでのメモリ消費を制御するために、復号リファレンスピクチャのマーキング処理を特定する。インター予測に用いるリファレンスピクチャの数の最大値はMで表わし、シーケンスパラメータセットで決定される。リファレンスピクチャは、復号されるときに「リファレンスに使用済」とマークされる。リファレンスピクチャの復号で「リファレンスに使用済」とマークされるピクチャの数がMを超える場合、少なくとも1つのピクチャは「リファレンスに未使用」とマークされる。復号リファレンスピクチャのマーキング動作には適応メモリ制御とスライディングウィンドウの2種類がある。復号リファレンスピクチャのマーキング動作モードはピクチャに基づいて選択される。適応メモリ制御は、どのピクチャが「リファレンスに未使用」とマークされているかを明示的に信号で伝えられ、短期リファレンスピクチャに長期インデクスを割当ててもよい。適応メモリ制御は、ビットストリームにメモリ管理制御操作(memory management control operation;MMCO)パラメータの存在を要求してもよい。MMCOパラメータは、復号リファレンスピクチャ・マーキングのシンタックス要素に含まれてもよい。スライディングウィンドウ動作モードが使われ、M枚のピクチャが「リファレンスに使用済」とマークされている場合、「リファレンスに使用済」とマークされている短期リファレンスピクチャの中で最初に復号された短期リファレンスピクチャは「リファレンスに未使用」とマークされる。換言すれば、スライディングウィンドウ動作モードは、短期リファレンスピクチャに関して先入れ先出し(first-in-first-out)バッファ動作となる。
H.264/AVCのメモリ管理制御操作によっては、現ピクチャ以外の全てのリファレンスピクチャを「リファレンスに未使用」とマークする。瞬時復号リフレッシュ(IDR)ピクチャはイントラ符号化スライスのみを含み、リファレンスピクチャに対する同一「リセット」を行う。
HEVCドラフトでは、リファレンスピクチャ・マーキングのシンタックス構造と関連する復号処理は、リファレンスピクチャセット(reference picture set;RPS)のシンタックス構造に置換されている。その代わり、復号処理は同じ目的で使われる。特定のピクチャに有効またはアクティブなリファレンスピクチャセットは、そのピクチャに対するリファレンスとして使われる全てのリファレンスピクチャと、復号順で後続の任意のピクチャに対して「リファレンスに使用済」とマークされたままである全てのリファレンスピクチャを含む。リファレンスピクチャセットには6つのサブセットがあり、それぞれRefPicSetStCurr0,RefPicSetStCurr1,RefPicSetStFoll0,RefPicSetStFoll1,RefPicSetLtCurr,およびRefPicSetLtFollと呼ばれる。この6つのサブセットの表記法は次の通りである。「Curr」は現ピクチャのリファレンスピクチャ・リストに含まれるリファレンスピクチャを表わす。このため、現ピクチャに対するインター予測リファレンスとして使用されてもよい。「Foll」は現ピクチャのリファレンスピクチャ・リストに含まれないリファレンスピクチャを表わす。ただし、復号順で後続のピクチャではリファレンスピクチャとして使用されてもよい。「St」は短期リファレンスピクチャを表わし、通常、POC値の特定数の最下位ビットで識別される。「Lt」は長期リファレンスピクチャを表わし、特定の方法で識別される。通常、現ピクチャに対するPOC値の差は、前述した特定数の最下位ビットによって表わされるものよりも大きい。「0」は現ピクチャのPOC値よりも小さいPOC値を持つリファレンスピクチャを表わす。「1」は現ピクチャのPOC値よりも大きいPOC値を持つリファレンスピクチャを表わす。RefPicSetStCurr0,RefPicSetStCurr1,RefPicSetStFoll0およびRefPicSetStFoll1はまとめてリファレンスピクチャセットの短期サブセットと呼ばれ、RefPicSetLtCurrおよびRefPicSetLtFollはまとめてリファレンスピクチャセットの長期サブセットと呼ばれる。リファレンスピクチャセットは、ピクチャパラメータセットで特定され、リファレンスピクチャセットへのインデクスを介してスライスヘッダ用に取込まれてもよい。リファレンスピクチャセットはスライスヘッダで特定されてもよい。リファレンスピクチャセットの長期サブセットは通常スライスヘッダでのみ特定されるが、同じリファレンスピクチャセットの短期サブセットはピクチャパラメータセットで特定されてもよく、スライスヘッダで特定されてもよい。現在のスライス(現スライス)が使うリファレンスピクチャセットに含まれるピクチャは「リファレンスに使用済」とマークされ、現スライスが使うリファレンスピクチャセットに含まれないピクチャは「リファレンスに未使用」とマークされる。現ピクチャがIDRピクチャである場合、RefPicSetStCurr0,RefPicSetStCurr1,RefPicSetStFoll0,RefPicSetStFoll1,RefPicSetLtCurr,およびRefPicSetLtFollは全て空に設定される。
復号ピクチャバッファ(Decoded Picture Buffer;DPB)はエンコーダおよび/またはデコーダで使用されてもよい。復号ピクチャをバッファする理由は2つある。一つはインター予測で参照するためで、もう一つは復号ピクチャを出力順に並べ直すためである。H.264/AVCおよびHEVCはリファレンスピクチャのマーキングと出力の並べ換えの両方で相当な柔軟性を与えるため、リファレンスピクチャのバッファリングと出力ピクチャのバッファリングで別々のバッファを使うことはメモリリソースを浪費する可能性がある。このためDPBは、リファレンスピクチャと出力並び替えのための統合された復号ピクチャバッファリング処理を備えてもよい。復号ピクチャは、リファレンスとして使用されず出力される必要がなくなると、DPBから削除されてもよい。
H.264/AVCおよびHEVC等の多くの符号化モードでは、インター予測用リファレンスピクチャはリファレンスピクチャ・リストへのインデクスで示される。インデクスはCABACや可変長符号化で符号化される。通常、インデクスが小さいほど、対応するシンタックス要素も短くてよい。双予測(B)スライスにはそれぞれ2つのリファレンスピクチャ・リスト(リファレンスピクチャ・リスト0およびリファレンスピクチャ・リスト1)が作成され、インター予測(P)スライスにはそれぞれ1つのリファレンスピクチャ・リスト(リファレンスピクチャ・リスト0)が形成される。
HEVCドラフトコーデック等の典型的な高効率ビデオコーデックでは追加的な動き情報符号化/復号機構を用い、通常、マージング処理/機構またはマージモード処理/機構と呼ばれる。これにより、ブロック/PUの全ての動き情報が予測され、変更/修正をせずに使用される。PUに対する前述の動き情報は次のものを含む:1)PUがリファレンスピクチャ・リスト0のみを用いて単予測されるか、PUがリファレンスピクチャ・リスト1のみを用いて単予測されるか、またはPUがリファレンスピクチャ・リスト0およびリファレンスピクチャ・リスト1の両方を用いて単予測されるかに関する情報;2)リファレンスピクチャ・リスト0に対応する動きベクトル値;3)リファレンスピクチャ・リスト0におけるリファレンスピクチャ・インデクス;4)リファレンスピクチャ・リスト1に対応する動きベクトル値;5)リファレンスピクチャ・リスト1におけるリファレンスピクチャ・インデクス。同様に、動き情報の予測は、時間軸上のリファレンスピクチャにおける隣接ブロックおよび/または共存ブロックの動き情報を用いて行われる。通常、利用可能な隣接/共存ブロックに関連する動き予測候補を含めることによってマージリストと呼ばれるリストが構成され、リスト中で選択された動き予測候補のインデクスが信号で伝えられる。こうして、選択された候補の動き情報は現PUの動き情報にコピーされる。CU全体でマージ機構が用いられ、CU用予測信号が再構成信号として使用される場合、すなわち、予測残差が処理されない場合、CUに対するこの種の符号化/復号は通常、スキップモードやマージベース・スキップモードと呼ばれる。各PUに対しては、スキップモードに加えてマージ機構も使用され、この場合、予測の質を向上させるために予測残差が利用されてもよい。この種の予測モードは通常、インターマージモードと呼ばれる。
リファレンスピクチャ・リスト0およびリファレンスピクチャ・リスト1等のリファレンスピクチャ・リストは2つのステップで作成されてもよい。第1ステップでは、初期リファレンスピクチャ・リストが作成される。初期リファレンスピクチャ・リストは、例えばframe_numやPOC,temporal_id,GOP構造等の予測階層に関する情報,またはこれらの組合せに基づいて作成されてもよい。第2ステップでは、リファレンスピクチャ・リスト記憶(reference picture list reordering;RPLR)命令によって初期リファレンスピクチャ・リストが記憶されてもよい。RPLR命令はリファレンスピクチャ・リスト変更シンタックス構造とも呼ばれ、スライスヘッダに含まれる。RPLR命令は、各リファレンスピクチャ・リストの先頭に並べられるピクチャを示す。第2ステップはリファレンスピクチャ・リスト変更処理とも呼ばれ、RPLR命令がリファレンスピクチャ・リスト変更シンタックス構造に含まれてもよい。リファレンスピクチャセットが用いられる場合、リファレンスピクチャ・リスト0はRefPicSetStCurr0,RefPicSetStCurr1,RefPicSetLtCurrをこの順序で含むように初期化されてもよい。リファレンスピクチャ・リスト1はRefPicSetStCurr1,RefPicSetStCurr0をこの順序で含むように初期化されてもよい。初期リファレンスピクチャ・リストはリファレンスピクチャ・リスト変更シンタックス構造を通じて変更されてもよい。初期リファレンスピクチャ・リストのピクチャはリストに対するエントリインデクスを通じて識別されてもよい。
マージリストは、リファレンスピクチャ・リスト0および/またはリファレンスピクチャ・リスト1に基づいて作成されてもよく、例えばスライスヘッダシンタックスに含まれるリファレンスピクチャ・リスト結合シンタックス構造を用いて作成されてもよい。リファレンスピクチャ・リスト接合シンタックス構造はエンコーダでビットストリーム中に作成され、デコーダでそのビットストリームから復号されてもよい。このシンタックス構造はマージリストの内容を示す。このシンタックス構造は、リファレンスピクチャ・リスト0およびリファレンスピクチャ・リスト1が結合され、単方向予測される予測ユニット用のもう1つのリファレンスピクチャ・リストの組合せであることを示してもよい。このシンタックス構造はフラグを含み、フラグが特定の値に等しいときは、リファレンスピクチャ・リスト0およびリファレンスピクチャ・リスト1が同一であり、リファレンスピクチャ・リストの組合せとしてリファレンスピクチャ・リスト0が使用されることを示してもよい。このシンタックス構造は、エントリのリストであって、各エントリがリファレンスピクチャ・リスト(リスト0またはリスト1)を特定するエントリのリストと、特定されたリストに対するリファレンスインデクスを含んでもよい。エントリは、マージリストに含められるリファレンスピクチャを特定する。
復号リファレンスピクチャ・マーキング用シンタックス構造がビデオ符号化システムに存在してもよい。例えば、ピクチャの復号が完了したとき、復号リファレンスピクチャのマーキングシンタックス構造が存在する場合には、それが「リファレンスに未使用」または「長期リファレンスに使用済」としてピクチャを適応的にマークするのに用いられてもよい。復号リファレンスピクチャのマーキングシンタックス構造が存在せず、「リファレンスに使用済」とマークされたピクチャの数がそれ以上増えることがない場合、スライディングウィンドウのリファレンスピクチャ・マーキングが用いられてもよい。これは基本的には、(復号順で)最初に復号されたリファレンスピクチャをリファレンスに未使用としてマークする。
リファレンスピクチャ・リストのシンタックス構造はリファレンスピクチャ・リスト0記述,リファレンスピクチャ・リスト1記述,アイドル・リファレンスピクチャ・リスト記述の3つの部分を含んでもよい。リファレンスピクチャ・リスト0記述はPおよびBスライス用で、リファレンスピクチャ・リスト1記述はBスライス用である。アイドル・リファレンスピクチャ・リスト記述は、リファレンスピクチャ・リスト0または1の何れにも含まれないが、「リファレンスに使用済」とマークされたままのリファレンスピクチャを含むスライス用である。換言すれば、リファレンスピクチャのマーキングおよびリファレンスピクチャ・リストの作成の両方のための情報を提供する(複数ではない)1つのシンタックス構造等であってもよい。
スライスの復号が開始されると、リファレンスピクチャ・リストのシンタックス構造が解析されてもよい。PおよびBスライスに対して、シンタックス構造はリスト0用のリファレンスピクチャ・リスト記述を含み、復号される。リファレンスピクチャ・リスト記述のシンタックス構造は、ピクチャ順序カウント(POC)値がリファレンスピクチャ・リストで出現する順序で識別されたピクチャをリストしてもよい。Bスライスに対して、リファレンスピクチャ・リストのシンタックス構造はリスト1用のリファレンスピクチャ・リスト記述を含み、復号される。
リファレンスピクチャ・リストの初期化処理および/またはリファレンスピクチャ・リストの変更処理は省略されてもよく、リファレンスピクチャ・リストが直接シンタックス構造に記述されてもよい。
あるいは、または加えて、リファレンスピクチャ・リストのシンタックス構造はアイドル・リファレンスピクチャ・リスト用のリファレンスピクチャ・リスト記述を含んでもよく、それが存在する場合は復号される。
何れかのリファレンスピクチャ・リストにあるピクチャは「リファレンスに使用済」とマークされてもよい。どのリファレンスピクチャ・リストにもないピクチャは「リファレンスに未使用」とマークされてもよい。
換言すれば、リファレンスピクチャ・リストの作成およびリファレンスピクチャのマーキング処理とシンタックス構造は、単一の統合処理およびシンタックス構造で扱われてもよい。
アイドル・リファレンスピクチャ・リストのリファレンスピクチャがリファレンスピクチャ・リスト記述のシンタックス構造によって決定された特定の順序を持っていたとしても、通常、エンコーダがアイドル・リファレンスピクチャをリストすべき順序に関する特定の要求は存在しないことに留意されたい。ある意味では、アイドル・リファレンスピクチャ・リストは大抵、順序のないリストまたはセットであると見做せる。
リファレンスピクチャ・リスト0およびリスト1は、現スライス用リファレンスに未使用であると示されるリファレンスピクチャを含んでもよい。例えば、num_ref_idx_l0_active_minus1を超えるリファレンスインデクスは、現スライス用リファレンスに使用されなくてもよい。リファレンスピクチャ・リスト0およびリスト1におけるリファレンスされていないリファレンスピクチャが「リファレンスに使用済」とマークされるようなことが特定されてもよい。あるいは、特定のリファレンスピクチャがリファレンスされていないリファレンスピクチャとしてリスト0およびリスト1にだけ含まれ、アイドル・リファレンスピクチャ・リストには含まれない場合、あるいは、リファレンスされたリファレンスピクチャとしてリスト0およびリスト1に含まれる場合、そのリファレンスピクチャは「リファレンスに未使用」とマークされることが特定されてもよい。あるいは、前述の2つの場合の間での望ましいマーキング規則やその他の決定論的マーキング規則はエンコーダで制御され、連続パラメータセットのSPSシンタックス等でビットストリームに示されてもよい。リスト0またはリスト1に非リファレンスピクチャとしてリファレンスピクチャを含めることは、例えば符号化時により少ないビット数が消費される場合、アイドル・リファレンスピクチャ・リストに含めることよりも優先されてもよい。
スケーラブルビデオ符号化では、ビデオ信号はベースレイヤおよび1つ以上の拡張レイヤに符号化される。拡張レイヤは時間分解能(すなわち、フレームレート)や空間分解能を上げたり、別のレイヤやその一部によって表わされるビデオコンテンツの品質を単に上げたりしてもよい。各レイヤは、それぞれの全ての従属レイヤと合わせて、特定の空間分解能,時間分解能および品質レベルでのビデオ信号の一表現となる。本願では、全ての従属レイヤを伴うスケーラブルレイヤを「スケーラブルレイヤ表現」と呼ぶ。特定の忠実度で元の信号表現を生成するために、スケーラブルレイヤ表現に対応するスケーラブルビットストリームの一部が抽出され復号される。
場合によっては、特定の位置または任意の位置の後で拡張レイヤのデータが切り捨てられてもよい。ここで切り捨て位置はそれぞれ、視覚的品質を高めて表現する追加データを含んでもよい。こうしたスケーラビリティは細粒度スケーラビリティ(fine-grained/granularity scalability;FGS)と呼ばれる。FGSはSVC規格のドラフトバージョンの一部に含まれていたが、最終版SVC規格からは除外された。よって以降では、FGSはSVC規格のドラフトバージョンの一部を背景として説明される。切り捨てされない拡張レイヤによって提供されるスケーラビリティは、粗粒度スケーラビリティ(coarse-grained/granularity scalability;CGS)と呼ばれる。これは、従来の品質(SNR)スケーラビリティと空間スケーラビリティを合わせて含む。SVC規格はいわゆる中粒度スケーラビリティ(medium-grained/granularity scalability;MGS)をサポートする。MGSでは、高品質ピクチャがSNRスケーラブルレイヤピクチャと同様に符号化されるが、FGSレイヤピクチャと同じ高水準シンタックス要素を用いて、シンタックス要素quality_idが0を超えることによって示される。
SVCはレイヤ間予測機構を用い、現在再構成済みのレイヤ以外のレイヤまたは次の下位レイヤから特定の情報を予測することができる。レイヤ間予測が出来た情報は、イントラテクスチャと動き,残差のデータを含む。レイヤ間動き予測は、ブロック符号化モードやヘッダ情報等の予測を含み、下位レイヤからの動きが上位レイヤの予測に用いられてもよい。イントラ符号化の場合、下位レイヤの周囲マクロブロックや共存マクロブロックからの予測が可能である。こうした予測技術は先に符号化済みのアクセスユニットからの情報を使わないため、イントラ予測技術と呼ばれる。また、下位レイヤからの残差データも現レイヤの予測に用いられる。
SVCは単一ループ復号と呼ばれる概念を特定する。これは制約テクスチャ内予測モードを用いることで可能となる。レイヤ間テクスチャ内予測はマクロブロック(MB)であって、そのMB内にベースレイヤの対応するブロックが位置するMBに対して適用可能である。同時に、ベースレイヤにおけるこうしたイントラMBは、制約イントラ予測を使用する(例えば、シンタックス要素"constrained_intra_pred_flag"が1に等しい)。単一ループ復号では、デコーダは再生に望ましいスケーラブルレイヤ(「希望レイヤ」または「ターゲットレイヤ」と呼ばれる)に対してだけ動き補償および完全ピクチャ再構成を遂行する。こうして、復号における複雑さを大幅に減らせる。希望レイヤ以外の全てのレイヤは完全に復号される必要がない。これは、レイヤ間予測(レイヤ間テクスチャ内予測,レイヤ間動き予測またはレイヤ間残差予測)に使用されないMBデータの全てまたは一部は希望レイヤの再構成に不要であるからである。
単一復号ループは殆どのピクチャの復号に必要であるが、第2の復号ループはベース表現を再構成するために選択的に適用される。このベース表現は、予測リファレンスとして必要であるが、出力または表示される必要はないので、いわゆるキーピクチャ("store_ref_base_pic_flag"が1に等しい)に対してのみ再構成される。
SVCドラフトにおけるスケーラビリティ構造は"temporal_id","dependency_id","quality_id"の3つのシンタックス要素で特徴付けられる。シンタックス要素"temporal_id"は、時間スケーラビリティ階層または間接的にはフレームレートを示すのに用いられる。"temporal_id"の最大値が小さいピクチャを含むスケーラブルレイヤ表現のフレームレートは、"temporal_id"の最大値が大きいピクチャを含むスケーラブルレイヤ表現のフレームレートよりも低い。所与の時間レイヤは通常、下位時間レイヤ(すなわち、"temporal_id"がより小さい値の時間レイヤ)に依存するが、どの上位時間レイヤにも依存しない。シンタックス要素"dependency_id"は、CGSレイヤ間符号化依存階層を示すのに用いられる(前述の通り、SNRと空間スケーラビリティの両方を含む)。どの時間レベル位置でも、"dependency_id"値が小さいピクチャは、"dependency_id"値が大きいピクチャの符号化におけるレイヤ間予測に用いられてもよい。シンタックス要素"quality_id"は、FGSまたはMGSレイヤの品質レベル階層を示すのに用いられる。どの時間レベル位置でも、同一の"dependency_id"値であれば、"quality_id"値がQLに等しいピクチャは"quality_id"値がQL-1に等しいピクチャをレイヤ間予測に使用する。0を超える"quality_id"を持つ符号化スライスは、切り捨て可能なFGSスライスまたは切り捨て不可能なMGSスライスの何れかとして符号化されてもよい。
単純化するために、同一の"dependency_id"値を持つアクセスユニットにおける全てのデータユニット(SVCの場合、ネットワーク抽象化層ユニット/NALユニット等)は、依存ユニットまたは依存表現と呼ばれる。1依存ユニット内では、同一の"quality_id"値を持つ全てのデータユニットは、品質ユニットまたはレイヤ表現と呼ばれる。
復号ベースピクチャとも呼ばれるベース表現は、"quality_id"値が0に等しい依存ユニットにおけるビデオ符号化レイヤ(VCL)NALユニットの復号結果から得られる復号ピクチャで、"store_ref_base_pic_flag"が1に設定される。復号ピクチャとも呼ばれる拡張表現は通常の復号処理結果から得られ、最大依存表現に対して存在する全てのレイヤ表現が復号される。
前述の通り、CGSは空間スケーラビリティとSNRスケーラビリティの両方を含む。空間スケーラビリティは最初に、解像度の異なるビデオ表現をサポートするように設計される。各時間インスタンスに対して、VCL-NALユニットは同一アクセスユニットで符号化され、これらのVCL-NALユニットが別々の解像度に対応している。復号中、低解像度VCL-NALユニットは動きフィールドおよび残差を提供する。これらは、高解像度ピクチャの最終復号および再構成によって引き継がれてもよい。従来のビデオ圧縮規格と比較した場合、SVCの空間スケーラビリティは、ベースレイヤが拡張レイヤをクロップおよびズームしたバージョンとなれるように一般化されている。
MGS品質レイヤはFGS品質レイヤと同様に"quality_id"で示される。各依存ユニット(同一の"dependency_id"を持つ)に対して、"quality_id"が0に等しいレイヤが存在し、"quality_id"が0を超える他のレイヤも存在し得る。"quality_id"が0を超えるこうしたレイヤは、スライスが切り捨て可能スライスとして符号化されたかどうかに応じてMGSレイヤまたはFGSレイヤの何れかである。
FGS拡張レイヤの基本形では、レイヤ間予測のみが使用される。したがって、FGS拡張レイヤは、復号シーケンスで誤差を伝播させず自由に切り捨てられる。しかし、FGSの基本形は圧縮効率が低くなる。この問題は、インター予測リファレンスに低品質ピクチャのみが使用されることで生じる。したがって、インター予測リファレンスとしてFGS拡張ピクチャの使用が提案されている。しかしこうした提案でも、FGSデータの一部が破棄される際、ドリフトと呼ばれる符号化・復号間の不整合が生じる可能性がある。
SVCドラフト規格の特徴はFGS-NALユニットが自由に破棄されたり、切り捨てられたりするが、SVCV規格の特徴は、MGS-NALユニットがビットストリームの適合性を損なわず自由に破棄される(しかし、切り捨てられることはできない)。前述の通り、符号化時にこうしたFGSまたはMGSデータがインター予測リファレンスに対して使用される場合、データの破棄または切り捨てはデコーダ側とエンコーダ側との間で復号ピクチャの不整合を生じさせる。この不整合がドリフトと呼ばれる。
FGSまたはMGSデータの破棄または切り捨てによるドリフトを制御するために、SVCは次の解決方法を適用してきた。特定の依存ユニットにおいて、("quality_id"が0に等しいCGSピクチャのみの復号とそれに依存する全ての下位レイヤデータによる)ベース表現は復号ピクチャバッファに格納される。同一の"dependency_id"値を持つ次の依存ユニットを符号化する際、FGS-NALまたはMGS-NALユニットを含む全てのNALユニットはインター予測リファレンス用にベース表現を使用する。その結果、先のアクセスユニットにおけるFGS/MGS-NALユニットの破棄または切り捨てによるドリフトは全て、このアクセスユニットで止められる。同一の"dependency_id"値を持つ他の依存ユニットに対して、全てのNALユニットは、高い符号化効率のために、インター予測リファレンス用にこの復号ピクチャを使用する。
NALユニットはそれぞれのNALユニットヘッダにシンタックス要素"use_ref_base_pic_flag"を含む。この要素の値が1に等しい場合、NALユニットの復号ではインター予測処理時にリファレンスピクチャのベース表現を使用する。シンタックス要素"store_ref_base_pic_flag"は、後のピクチャに対してインター予測用に現ピクチャのベース表現を格納する(値が1の場合)か否(値が0の場合)かを特定する。
"quality_id"が0を超えるNALユニットはリファレンスピクチャ・リスト作成および加重予測に関するシンタックス要素を含まない。すなわち、シンタックス要素"num_ref_active_lx_minus1"(xは0または1)やリファレンスピクチャ・リスト並び替えシンタックステーブル,加重予測シンタックステーブルは存在しない。その結果、MGSまたはFGSレイヤは、必要に応じて同一の依存ユニットにおける"quality_id"が0に等しいNALユニットからこうしたシンタックス要素を引き継がなくてはならない。
SVCでは、リファレンスピクチャ・リストはベース表現のみ("use_ref_base_pic_flag"が1の場合)または「ベース表現」とマークされていない復号ピクチャのみ("use_ref_base_pic_flag"が0の場合)の何れかから構成され、同時に両方から構成されることはない。
前に示した通り、MVCはH.264/AVCの拡張である。H.264/AVCの定義や概念,シンタックス構造,意味,復号処理の多くはそのまま、または特定の一般化や制約を伴ってMVCにも適用される。MVCの定義や概念,シンタックス構造,意味,復号処理の一部は以下で説明される。
MVCのアクセスユニットは、復号順に連続するNALユニットのセットと定義され、1つ以上のビューコンポーネントから成る単一のプライマリ符号化ピクチャを含む。アクセスユニットは、プライマリ符号化ピクチャの他に1つ以上の冗長符号化ピクチャや補助符号化ピクチャ,符号化ピクチャのスライスまたはスライスデータ分割を含む他のNALユニットを含んでもよい。アクセスユニットの復号の結果、復号誤差やビットストリーム誤差,復号に影響を及ぼす可能性のある他の誤差が生じなければ、1つ以上の復号ビューコンポーネントから成る1つの復号ピクチャが得られる。換言すれば、MVCのアクセスユニットは、1つの出力時間インスタンスに対して複数のビューのビューコンポーネントを含む。
MVCのビューコンポーネントは単一アクセスユニットにおけるビューの符号化表現とも呼ばれる。
MVCではビュー間予測が使用されてもよく、同一アクセスユニットにおける別々のビューコンポーネントの復号サンプルからビューコンポーネントの予測を参照する。MVCでは、ビュー間予測はインター予測と同様にして実現される。例えば、ビュー間リファレンスピクチャはインター予測用リファレンスピクチャとして同一の(1つまたは複数の)リファレンスピクチャ・リストに配置され、動きベクトルだけでなくリファレンスインデクスも、ビュー間およびリファレンスピクチャ間で同様に符号化または推定される。
アンカーピクチャは符号化ピクチャであって、その中の全スライスが同一アクセスユニット内のスライスのみを参照することができる。すなわち、ビュー間予測が使用可能であるが、インター予測は使用されず、出力順で後になる全ての符号化ピクチャは、復号順で符号化ピクチャの前のどのピクチャからもインター予測を使用しない。ビュー間予測は、非ベースビューの一部であるIDRビューコンポーネント用に使用されてもよい。MVCのベースビューは、符号化ビデオシーケンスでビュー順序インデクスの最大値を持つビューである。ベースビューは他のビューとは独立して復号され、ビュー間予測を使用しない。ベースビューは、H.264/AVCのベースプロファイル(Baseline Profile)やハイプロファイル(High Profile)等の単一ビュープロファイルのみをサポートするH.264/AVCデコーダによって復号可能である。
MVC規格では、MVC復号処理のサブ処理の多くは、H.264/AVC規格のサブ処理の仕様にある「ピクチャ」,「フレーム」,「フィールド」という語句をそれぞれ「ビューコンポーネント」,「フレーム・ビューコンポーネント」,「フィールド・ビューコンポーネント」と置き換えることによって、H.264/AVC規格の各サブ処理を利用することができる。これと同様に以下では、「ピクチャ」,「フレーム」,「フィールド」という語句がそれぞれ「ビューコンポーネント」,「フレーム・ビューコンポーネント」,「フィールド・ビューコンポーネント」を意味するものとして頻繁に用いられる。
スケーラブル・マルチビュー符号化では、同一ビットストリームが複数のビューの符号化ビューコンポーネントを含んでもよく、符号化ビューコンポーネントの少なくとも一部は品質および/または空間スケーラビリティを用いて符号化されてもよい。
テクスチャビューは通常のビデオコンテンツを示すビューを指す。これは、例えば普通のカメラで撮影されたもので、通常ディスプレイへのレンダリングに適している。テクスチャビューは通常、1つの輝度(luma)成分と2つの色差(chroma)の3つのコンポーネントを持つピクチャを含む。以下では、テクスチャピクチャは通常、輝度テクスチャピクチャと色差テクスチャピクチャという語句等で示されない限り、そのコンポーネントのピクチャまたはカラーコンポーネントの全てを含む。
深度拡張ビデオは、1つ以上の深度ビューを持つ深度ビデオに関連する1つ以上のビューを持つテクスチャビデオを指す。深度拡張ビデオに関する様々なアプローチが用いられてもよく、ビデオ+深度(video plus depth;V+D)やマルチビュービデオ+深度(multiview video plus depth;MVD),レイヤ深度ビデオ(layered depth video;LDV)の使用を含む。ビデオ+深度(V+D)表現では、単一のテクスチャビューと関連する深度ビューがそれぞれ、テクスチャピクチャと深度ピクチャのシーケンスとして表現される。MVDは複数のテクスチャビューとそれぞれの深度ビューを含む。LDV表現では、中央ビューのテクスチャと深度が従来通りに表現されるが、他のビューのテクスチャと深度は部分的に表現され、中間ビューの正確なビュー合成に関しては遮蔽されていない領域のみをカバーする。
深度拡張ビデオは、テクスチャと深度が互いに独立して符号化される方式で符号化されてもよい。例えば、テクスチャビューはMVCビットストリームとして符号化され、深度ビューは別のMVCビットストリームとして符号化されてもよい。あるいは、深度拡張ビデオは、テクスチャと深度が統合して符号化される方式で符号化されてもよい。テクスチャおよび深度ビューの統合符号化が深度拡張ビデオ表現に適用される場合、テクスチャピクチャの復号サンプルの一部またはテクスチャピクチャの復号用データ要素の一部は、深度ピクチャの復号サンプルの一部または深度ピクチャの復号処理で得られたデータ要素の一部から予測または導出される。あるいは、または加えて、深度ピクチャの復号サンプルの一部または深度ピクチャの復号用データ要素の一部は、テクスチャピクチャの復号サンプルの一部またはテクスチャピクチャの復号処理で得られたデータ要素の一部から予測または導出される。
マルチビュー3次元ビデオ(3DV)アプリケーションに対するソリューションは、限定された入力ビュー数だけ、例えばモノラルまたはステレオビューと付加データだけを持ち、必要なビューの全てをデコーダでローカルにレンダリング(すなわち、合成)するというものであると理解される。幾つかの利用可能なビューレンダリング技術から、深度イメージベース・レンダリング(depth image-based rendering;DIBR)は競合代替技術であると見られている。
DIBRベースの3DVシステムの簡易モデルを図5に示す。3Dビデオコーデックの入力は、立体ビデオと立体ベースラインb0と共に対応する深度情報を含む。3Dビデオコーデックは、ベースライン(bi < b0)と共に、2つの入力ビュー間の複数の仮想ビューを合成する。DIBRアルゴリズムは2つの入力ビュー間だけでなく、その外側のビューを外挿することもできる。同様に、DIBRアルゴリズムは単一のテクスチャビューと対応する深度ビューからビューを合成することもできる。しかし、DIBRベースのマルチビューレンダリングを可能にするために、テクスチャデータが対応する深度データと共にデコーダ側で利用可能であるべきである。
こうした3DVシステムでは、各ビデオフレームに対して深度情報が(深度マップと呼ばれる)深度ピクチャの形式で、エンコーダ側で作成される。深度マップは、ピクセル毎の深度情報を伴う画像である。深度マップの各サンプルは、カメラが配置された面からそれぞれのテクスチャサンプルまでの距離を表わす。換言すれば、z軸がカメラの撮影方向に沿う(したがって、カメラが配置された面に対して直交する)場合、深度マップのサンプルはz軸の値を表わす。
深度情報は様々な手段で取得することができる。例えば、3Dシーンの深度は、撮影するカメラによって記録される視差から計算されてもよい。深度推定アルゴリズムは、立体ビューを入力として受取り、そのビューに関する2つのオフセット画像間のローカルな視差を計算する。各画像は重複ブロックでピクセル毎に処理され、各ピクセルブロックに対してオフセット画像において一致するブロックが水平方向でローカルに探索される。ピクセル方向の視差が計算されると、対応する深度の値zが式(1)によって計算される。

z = (f・b)/(d + Δd) ... 式(1)
ここで、fはカメラの焦点距離、bはカメラ間のベースライン距離であり、図6に示されている。さらに、dは2つのカメラの間で観測される視差を表わし、カメラオフセットΔdは2つのカメラの光学中心に関して生じ得る水平方向の位置のずれを示す。ただし、アルゴリズムはブロックの一致に基づくため、深度を通じた視差推定の質はコンテンツに依存し、殆どの場合正確ではない。例えば、質感がなく非常に滑らかな領域や高いノイズレベルを含む画像部分に対しては、直接深度推定を行うことは不可能である。
ISO/IEC国際規格23002-3で規定されるparallax mapのような格差/視差マップは、深度マップと同様に処理されてもよい。深度と視差には直接的な対応関係があり、数学的方程式を介して一方から他方を算出することができる。
アクセスユニット内のテクスチャおよび深度ビューコンポーネントに関する符号化および復号順序は通常、符号化ビューコンポーネントのデータが他の符号化ビューコンポーネントによってインターリーブされないようになっており、アクセスユニット用データもビットストリームまたは復号順で他のアクセスユニットによってインターリーブされない。例えば、図7に示すように、別々のアクセスユニット(t, t+1, t+2)に2組のテクスチャ・深度ビュー(T0t, T1t, T0t+1, T1t+1, T0t+2, T1t+2, D0t, D1t, D0t+1, D1t+1, D0t+2, D1t+2)が存在してもよい。ここで、テクスチャ・深度ビューコンポーネント(T0t,T1t, D0t,D1t)から成るアクセスユニットtは、ビットストリームおよび復号順でテクスチャ・深度ビューコンポーネント(T0t+1,T1t+1, D0t+1,D1t+1)から成るアクセスユニットt+1よりも先である。
アクセスユニット内のビューコンポーネントの符号化および復号順序は、符号化フォーマットに従ってもよく、エンコーダによって決定されてもよい。テクスチャビューコンポーネントは、同一ビューの関連する深度ビューコンポーネントよりも先に符号化されてもよい。それ故、こうした深度ビューコンポーネントが同一ビューの関連するテクスチャビューコンポーネントから予測されてもよい。こうしたテクスチャビューコンポーネントは、例えばMVCエンコーダで符号化され、MVCデコーダで復号されてもよい。拡張テクスチャビューコンポーネントは本願では、同一ビューの関連する深度ビューコンポーネントの後に符号化されるテクスチャビューコンポーネントを表わす。したがって、関連する深度ビューコンポーネントから予測されてもよい。同一アクセスユニットのテクスチャ・深度ビューコンポーネントは通常、ビューに依存する順序で符号化される。テクスチャ・深度ビューコンポーネントは、前述の制約に従う限りで互いに任意の順序で並べ替えることができる。
テクスチャビューと深度ビューは、テクスチャビューの一部がH.264/AVCおよび/またはMVC等の1つ以上のビデオ規格に準拠した単一ビットストリームに符号化されてもよい。換言すれば、デコーダはこうしたビットストリームのテクスチャビューの一部を復号することができ、残りのテクスチャビューと深度ビューを除外することができてもよい。
こうした背景では、1つ以上のテクスチャ・深度ビューを単一のH.264/AVCおよび/またはMVC準拠ビットストリームに符号化するエンコーダは、3DV-ATMエンコーダとも呼ばれる。こうしたエンコーダによって生成されたビットストリームは、3DV-ATMビットストリームと呼ぶことができる。3DV-ATMビットストリームは、H.264/AVCおよび/またはMVCデコーダが復号することができない一部のテクスチャビューと深度ビューを含んでもよい。3DV-ATMビットストリームからのビュー全てを復号可能なデコーダは3DV-ATMデコーダと呼ぶこともできる。
3DV-ATMビットストリームはAVC/MVC準拠テクスチャビューを選択された数だけ含むことができる。AVC/MVC準拠テクスチャビューに対する深度ビューは、テクスチャビューから予測されてもよい。残りのテクスチャビューは拡張テクスチャ符号化を利用し、深度ビューが深度符号化を利用してもよい。
テクスチャビューおよび深度ビューを符号化できるエンコーダ200の実施形態の高レベルフローチャートを図8に示し、テクスチャビューおよび深度ビューを復号できるデコーダ210を図9に示す。これらの図で、実線は一般的なデータフローを表わし、破線は制御情報信号を表わす。エンコーダ200は、テクスチャエンコーダ202で符号化されるテクスチャコンポーネント201と深度エンコーダ204で符号化される深度マップコンポーネント203を受取ってもよい。エンコーダ200がAVC/MVCに従ってテクスチャコンポーネントを符号化中は、第1のスイッチ205がオフに切替えられてもよい。エンコーダ200が拡張テクスチャコンポーネントを符号化中は、深度エンコーダ204が生成する情報がテクスチャエンコーダ202に提供されるように、第1のスイッチ205がオンに切替えられてもよい。この実施例のエンコーダは、次のように制御される第2のスイッチ206も備える。第2のスイッチ206は、エンコーダがAVC/MVCビューの深度情報を符号化中はオンに切替えられ、エンコーダが拡張テクスチャビューの深度情報を符号化中はオフに切替えられる。エンコーダ200は符号化ビデオ情報を含むビットストリーム207を出力してもよい。
デコーダ210は、少なくとも一部が逆順である以外は同様に動作してもよい。デコーダ210は符号化ビデオ情報を含むビットストリーム207を受信してもよい。デコーダ210は、テクスチャ情報を復号するテクスチャデコーダ211と深度情報を復号する深度デコーダ212を備える。第3のスイッチ213は深度デコーダ212からテクスチャデコーダ211への情報配信を制御するために提供されてもよく、第4のスイッチ214はテクスチャデコーダ211から深度デコーダ212への情報配信を制御するために提供されてもよい。デコーダ210がAVC/MVCテクスチャビューを復号する際は、第3のスイッチ213がオフに切替えられてもよく、デコーダ210が拡張テクスチャビューを復号する際は、第3のスイッチ213がオンに切替えられてもよい。デコーダ210がAVC/MVCテクスチャビューの深度を復号する際は、第4のスイッチ214がオンに切替えられてもよく、デコーダ210が拡張テクスチャビューの深度を復号する際は、第4のスイッチ214がオフに切替えられてもよい。デコーダ210は再構成テクスチャコンポーネント215および再構成深度マップコンポーネント216を出力してもよい。
多くのビデオエンコーダは、レート歪み最適符号化モード、例えば希望マクロブロックモードと関連する動きベクトルを探索するために、ラグランジュ費用関数(Lagrangian cost function)を利用する。この種の費用関数は、非可逆符号化法による正確なまたは推定された画像歪みと、画像領域のピクセル/サンプル値を表現するのに必要である正確なまたは推定された情報量を一緒に固定するために、加重ファクタまたはλを用いる。ラグランジュ費用関数は次式で表わすことができる:

C = D + λR
ここで、Cは最小化すべきラグランジュ費用、Dはこのモードと現在考慮される動きベクトルによる画像歪み(例えば、元の画像ブロックと符号化画像ブロックとの間のピクセル/サンプル値の平均二乗誤差)、λはラグランジュ係数、Rはデコーダで画像ブロックを再構成するために要求されるデータ(候補の動きベクトルを表わすためのデータ量を含む)を表わすのに必要なビット数である。
図1は例示的実施形態に従うビデオ符号化システムのブロック図を示す。このブロック図は、本発明の実施形態に従うコーデックを組込む例示的装置または例示的電子デバイス50の概略を示すブロック図として示されている。図2は、例示的実施形態に従う装置のレイアウトを示す。図1および2の各要素は以下で説明される。
電子デバイス50は、移動端末や無線通信システムにおけるユーザ機器等であってもよい。ただし、本発明の実施形態は、符号化および復号、またはビデオ画像の符号化や復号を要する任意の電子デバイスや装置に実装可能であることを理解されたい。
装置50は、デバイスを組込んで保護するハウジング30を備えてもよい。装置50はまた、液晶表示の形態でディスプレイ32を備えてもよい。本発明の他の実施形態では、ディスプレイは画像やビデオを表示するのに適した任意適当なディスプレイ技術によるものでもよい。装置50はまた、キーパッド34を備えてもよい。本発明の他の実施形態では、任意適当なデータインタフェースやユーザインタフェースの機構が用いられてもよい。例えば、ユーザインタフェースはタッチセンサ式ディスプレイの一部に仮想キーボードやデータ入力システムとして実装されてもよい。装置はマイクロフォン36や、デジタルまたはアナログ信号の任意適当な音声入力を備えてもよい。装置50はまた、音声出力デバイスを備えてもよく、本発明の実施形態では次の何れか1つでもよい:イヤホン38,スピーカ,アナログ音声またはデジタル音声出力接続。装置50はまた、バッテリ40を備えてもよい(または、本発明の他の実施形態では、太陽電池や燃料電池,時計仕掛けの発電機等の任意適当な携帯エネルギー装置によって電源供給されてもよい)。装置はまた、他のデバイスと短可視距離通信する赤外線ポート42を備えてもよい。他の実施形態では、装置50はさらに、ブルートゥース無線通信やUSB/FireWire有線接続等の任意適当な短距離通信ソリューションを備えてもよい。
装置50は、装置50を制御するコントローラ56またはプロセッサを備えてもよい。コントローラ56はメモリ58に接続されてもよい。本発明の実施形態では、メモリは、画像形態におけるデータと音声データの両方を格納してもよく、および/または、コントローラ56に実装される命令を格納してもよい。また、コントローラ56はコーデック回路54に接続されてもよい。コーデック回路は、音声および/またはビデオデータの符号化・復号の遂行や、コントローラ56が遂行する符号化・復号を補助するのに適している。
装置50はまた、カードリーダー48とスマートカード46を備えてもよい。例えば、ユーザ情報を提供し、ネットワークでユーザ認証および認可を行うための認証情報を提供するのに適したUICCおよびUICCリーダーを備えてもよい。
装置50は、コントローラに接続され、無線通信信号を生成するのに適した無線インタフェース回路52を備えてもよい。無線通信は例えば、携帯通信ネットワークや無線通信システム,無線ローカルエリアネットワークでの通信である。また、装置50は無線インタフェース回路52に接続されたアンテナ44を備えてもよい。アンテナは、無線インタフェース回路52で生成された無線信号を他の(1または複数の)装置へ送信し、無線信号を他の(1または複数の)装置から受信する。
本発明の実施形態によっては、装置50は個別のフレームを記録または検出可能なカメラを備え、このフレームは処理用のコーデック54またはコントローラに渡される。本発明の実施形態によっては、装置は、別のデバイスから処理用ビデオ画像データを、送信および/または格納する前に受信してもよい。本発明の実施形態によっては、装置50は、符号化用/復号用画像を無線または有線の何れかで受信してもよい。
図3は、例示的実施形態に従う複数の装置,ネットワークおよびネットワーク要素を含むビデオ符号化構成を示す。図3では、本発明の実施形態において利用可能なシステムの実施例が示されている。システム10は、1つ以上のネットワークを通じて通信可能な複数の通信デバイスを含む。システム10は任意の無線または有線ネットワークの組合せを含んでよく、無線携帯電話ネットワーク(GSM(登録商標)やUMTS,CDMAネットワーク等)やIEEE 802.xの何れかの規格で規定される無線ローカルエリアネットワーク(WLAN),ブルートゥース・パーソナルエリアネットワーク,イーサネット(登録商標)・ローカルエリアネットワーク,トークンリング・ローカルエリアネットワーク,広域ネットワーク,インターネットを含んでもよい。ただし、これらに限定されない。
システム10は無線・有線両方の通信デバイスを含んでもよく、本発明の実施形態を実装するのに適した装置50を含んでもよい。例えば、図3に示すシステムは、携帯電話ネットワーク11とインターネット28を表わす表現を示している。インターネット28への接続は長距離無線接続や短距離無線接続,様々な有線接続を含んでもよいが、これらに限定されない。有線接続には電話回線やケーブル線,電力線,その他同様の通信線が含まれるが、これらに限定されない。
システム10に示される例示的通信デバイスは電子デバイスや装置50,携帯情報端末(PDA)16,PDAと携帯電話14の組合せ,統合通信デバイス(integrated messaging device;IMD)18,デスクトップコンピュータ20,ノート型コンピュータ22を含んでもよい。ただし、これらに限定されない。装置50は固定型でもよく、移動する人が持ち運べる携帯型でもよい。また、装置50は移動手段に配置されてもよい。こうした移動手段には自動車やトラック,タクシー,バス,列車,船/ボート,飛行機,自転車,バイク,その他類似の移動手段が含まれるが、これらに限定されない。
さらに装置によっては、電話・メッセージを送受信したり、基地局24との無線接続25を通じてサービスプロバイダと通信したりしてもよい。基地局24は、携帯電話ネットワーク11とインターネット28間の通信を可能にするネットワークサーバ26に接続されてもよい。システムは、付加的な通信デバイスと様々な種類の通信デバイスを含んでもよい。
通信デバイスは様々な伝送技術を用いて通信してもよく、こうした技術には符号分割多元接続(CDMA)や携帯通信用グローバルシステム(GSM(登録商標)),ユニバーサル携帯電話システム(UMTS),時分割多元接続(TDMA),周波数分割多元接続(FDMA),TCP-IP(transmission control protocol-internet protocol),ショートメッセージサービス(SMS),マルチメディアメッセージサービス(MMS),電子メール,IMS(instant messaging service),ブルートゥース,IEEE 802.11,その他類似の無線通信技術を含む。ただし、これらに限定されない。本発明の様々な実施形態への実装に含まれる通信デバイスは、様々な媒体を介して通信することができる。こうした媒体として、無線,赤外線,レーザー,ケーブル接続,その他適切な接続が含まれるが、これらに限定されない。
図4aおよび4bは、例示的実施形態に従うビデオ符号化・復号のブロック図を示す。
図4aは、ピクセル予測器302と予測誤差エンコーダ303,予測誤差デコーダ304を備えるようなエンコーダを示す。図4aはまた、インター予測器306とイントラ予測器308,モードセレクタ310,フィルタ316,リファレンスフレームメモリ318を備えるようなピクセル予測器302の実施形態を示す。この実施形態では、モードセレクタ310はブロックプロセッサ381とコスト評価器382を備える。エンコーダはまた、ビットストリームのエントロピー符号化を行うエントロピーエンコーダ330を備えてもよい。
図4bはインター予測器306の実施形態を示す。インター予測器306は、1または複数のリファレンスフレームを選択するリファレンスフレームセレクタ360と動きベクトル定義器361,予測リスト作成器363,動きベクトルセレクタ364を備える。こうした構成要素またはその一部は、予測プロセッサ362の一部であってもよく、他の手段で実装されてもよい。
ピクセル予測器302は、インター予測器306とイントラ予測器308の両方で符号化される画像300を受信する(インター予測器306はこの画像と動き補償リファレンスフレーム318との間の差を決定し、イントラ予測器308は現フレームまたはピクチャで処理済みの部分のみに基づいて画像ブロックの予測を決定する)。インター予測器とイントラ予測器の両方からの出力はモードセレクタ310に送られる。インター予測器306とイントラ予測器308の両方とも、複数のイントラ予測モードを持っていてよい。したがって、インター予測とイントラ予測は各モードで遂行され、
予測信号がモードセレクタ310に提供されてもよい。モードセレクタ310も画像300のコピーを受信する。
モードセレクタ310は現ブロックの符号化に使用する符号化モードの種類を決定する。モードセレクタ310は、インター予測モードの使用を決定すると、インター予測器306の出力をモードセレクタ310の出力に送る。モードセレクタ310は、イントラ予測モードの使用を決定すると、イントラ予測モードの1つに関する出力をモードセレクタ310の出力に送る。
モードセレクタ310は、符号化モードとそのパラメータ値を選択するために、コスト評価器ブロック382では例えばラグランジュ費用関数を用いてもよい。ここでパラメータ値とは、通常ブロックに基づく動きベクトルやリファレンスインデクス,イントラ予測の向き等である。この種の費用関数は、非可逆符号化法による(正確なまたは推定された)画像歪みと、画像領域のピクセル/サンプル値を表現するのに必要である(正確なまたは推定された)情報量を一緒に固定するために、加重ファクタλを用い、次式のように表わされる:C = D + λ × R。ここで、Cは最小化すべきラグランジュ費用、Dはこのモードとそのパラメータによる画像歪み(平均二乗誤差等)、Rはデコーダで画像ブロックを再構成するために要求されるデータ(候補の動きベクトルを表わすためのデータ量を含んでもよい)を表わすのに必要なビット数である。
モードセレクタの出力は第1の加算器321に送られる。第1の加算器は、予測誤差エンコーダ303への入力である第1の予測誤差信号320を生成するために、画像300からピクセル予測器302の出力を引いてもよい。
ピクセル予測器302はさらに、画像ブロック312の予測表現と予測誤差デコーダ304の出力338の合成を仮再構成器339から受取る。仮再構成器された画像314は、イントラ予測器308とフィルタ316に送られてもよい。仮表現を受取るフィルタ316は、その仮表現をフィルタリングし、リファレンスフレームメモリ318に保存される最終再構成画像340を出力する。リファレンスフレームメモリ318は、後の画像300がインター予測動作で比較されるためのリファレンス画像として使用されるように、インター予測器306に接続されてもよい。多くの実施形態では、リファレンスフレームメモリ318は複数の復号ピクチャを格納することができる。そうした復号ピクチャの1つ以上は、後の画像300がインター予測動作で比較されるためのリファレンスピクチャとして、インター予測器306で使用されてもよい。場合によっては、リファレンスフレームメモリ318は復号ピクチャバッファとも呼ばれる。
ピクセル予測器302の動作は、本技術分野で周知のあらゆるピクセル予測アルゴリズムを遂行するように構成されてもよい。
ピクセル予測器302はまた、予測値をピクセル予測器302から出力する前にフィルタリングするフィルタ385を備えてもよい。
予測誤差エンコーダ303および予測誤差デコーダ304の動作は以降で詳述される。次の実施例では、エンコーダは、画像を16×16ピクセルのマクロブロック単位で生成する。こうした画像はフル画像またはピクチャを形成するようになる。ただし、図4aは16×16のブロックサイズに限定されるものではなく、任意のサイズおよび形状のブロックが一般に使用可能であることに留意されたい。同様に、図4aはピクチャのマクロブロック分割に限定されるものではなく、その他任意のピクチャ分割によって符号化単位として使用可能なブロックに分割されてもよいことにも留意されたい。したがって、以下の実施例に関して、ピクセル予測器302は16×16ピクセルサイズの予測マクロブロック列を出力し、第1の加算器321は、画像300の第1のマクロブロックと予測マクロブロック(ピクセル予測器302の出力)との間の差を表わす16×16ピクセルの残差データマクロブロック列を出力する。
予測誤差エンコーダ303は、変換ブロック342と量子化器344を備える。変換ブロック342は第1の予測誤差信号320を変換ドメインに変換する。この変換は例えば、DCT変換やその異型である。量子化器344は、量子化係数を得るために、DCT係数等の変換ドメイン信号を量子化する。
予測誤差デコーダ304は予測誤差エンコーダ303からの出力を受取り、復号予測誤差信号338を生成する。復号予測誤差信号は第2の加算器339で画像ブロック312の予測表現と合成され、仮再構成画像314を生成する。予測誤差デコーダは、近似的に変換信号を再構成するために、DCT係数等の量子化係数値を逆量子化(dequantize)する逆量子化器(dequantizer)346と、再構成された変換信号に対して逆変換を行う逆変換ブロック348を備えるように構成されてもよい。逆変換ブロック348の出力は、(1つまたは複数の)再構成ブロックを含む。予測誤差デコーダはまた、さらに復号された情報とフィルタパラメータに従って再構成マクロブロックをフィルタリング可能なマクロブロックフィルタを備えてもよい(図示せず)。
次に、インター予測器306の例示的実施形態の動作を詳述する。インター予測器306はインター予測用に現ブロックを受取る。ここで現ブロックに対して、1つ以上の符号化済み隣接ブロックが既に存在し、それに関する動きベクトルも定義済みであると仮定する。例えば、現ブロックの左側のブロックおよび/または上側のブロックがそうしたブロックであってもよい。現ブロックに対する空間動きベクトルの予測は、例えば同一スライスまたはフレームの符号化済み隣接ブロックおよび/または非隣接ブロックの動きベクトルを用いて行うことができる。または、空間動きベクトル予測の線形関数または非線型関数を用いたり、様々な空間動きベクトル予測器を線形動作または非線形動作で組み合わせたり、あるいは、時間リファレンス情報を使用しない任意適切な手段によって予測が行われてもよい。また、1つ以上の符号化ブロックの空間予測と時間予測の両方の情報を組み合わせて動きベクトル予測器を構成することも可能である。この種の動きベクトル予測器は、時空間(spatio-temporal)動きベクトル予測器とも呼ばれる。
符号化で使用されるリファレンスフレームはリファレンスフレームメモリに格納されてもよい。各リファレンスフレームは、1つ以上のリファレンスピクチャ・リストに含まれてもよい。リファレンスピクチャ・リスト内では、各エントリがリファレンスフレームを識別するリファレンスインデクスを持つ。リファレンスフレームは、リファレンスとしてもう使用されない場合、リファレンスフレームメモリから削除されてもよく、「リファレンスに未使用」とマークされたり、そのリファレンスフレームの格納位置が新規のリファレンスフレームによって占有されて非リファレンスフレームとなったりしてもよい。
リアルタイム転送プロトコル(RTP)は音声とビデオといったタイミングを合わせられたメディアのリアルタイム転送に広く使用されている。RTP転送では、メディアデータは複数のRTPパケットにカプセル化される。RTPペイロードフォーマットは、RTPによる特定フォーマットの符号化ビットストリームの伝送に規定されてもよい。例えば、SVC RTPペイロードフォーマットのドラフトは、インターネット技術タスクフォース(Internet Engineering Task Force;IETF)によってRFC 6190に規定されている。SVC RTPペイロードフォーマットでは、ペイロードコンテンツスケーラビリティ情報(payload content scalability information;PACSI)NALユニットと呼ばれるNALユニットのタイプが規定される。PACSI-NALユニットは、存在する場合、複数のNALユニットを含む集約パケットにおける最初のNALユニットで、他のタイプのパケットには存在しない。PACSI-NALユニットは、ペイロード中の残りのNALユニット全てに共通であるスケーラビリティ特性を示す。これによって、メディアアウェアネットワーク要素(media aware network element;MANE)は集約パケットを転送/処理/破棄するかどうかを決定し易くなる。送信側がPACSI-NALユニットを作成してもよい。受信側はPACSI-NALユニットを無視してもよく、集約パケットを効率的に処理するための手掛りとして使用してもよい。集約パケットの最初の集約ユニットがPACSI-NALユニットを含む場合、その同じパケットには追加集約ユニットが少なくとも1つ存在する。RTPヘッダフィールドは、集約パケットの残りのNALユニットに従って設定される。
前述の通り、アクセスユニットは別のコンポーネントタイプ(例えば、主テクスチャコンポーネントや冗長テクスチャコンポーネント,補助コンポーネント,深度/視差コンポーネント)や別のビュー,別のスケーラブルレイヤのスライスを含んでもよい。スライスに共通のシンタックス要素、例えばスライスヘッダに含まれる従来のシンタックス要素は、同一アクセスユニット内の別々のスライスに対して同一の値を持ってもよい。それでも、こうしたシンタックス要素は従来技術によって各スライスで符号化される。次に、アクセスユニット内の複数のスライスで同じ値を持つ符号化シンタックス要素に使用されるビットレートやビットカウントを減らす様々な実施形態を示す。
こうした多くの実施形態では、従来からスライスヘッダに含まれていたシンタックス要素の少なくとも1つのサブセットは、エンコーダによってGOS(スライス群)パラメータセットに含められる。エンコーダはGOSパラメータセットをNALユニットとして符号化してもよい。GOSパラメータセットのNALユニットは、符号化スライスNALユニット等と共にビットストリームに含まれてもよいが、前述した他のパラメータセットの場合と同様に帯域外で伝送されてもよい。
多くの実施形態では、GOSパラメータセットのシンタックス構造は識別子を含み、例えばスライスヘッダや別のGOSパラメータセットから特定のGOSパラメータセットインスタンスを参照する際に使用されてもよい。実施形態によっては、GOSパラメータセットのシンタックス構造が識別子を含まず、エンコーダおよびデコーダの両方が、例えばGOSパラメータセットのシンタックス構造に関するビットストリームの順序と既定の番号付けスキームを用いて識別子を推定してもよい。
また実施形態によっては、エンコーダおよびデコーダは、符号化済みまたは復号済みであるか、ビットストリームに既存の他のシンタックス構造からGOSパラメータセットの内容やインスタンスを推定する。例えば、ベースビューのテクスチャビューにおけるスライスヘッダからGOSパラメータセットが暗黙のうちに作成されてもよい。エンコーダおよびデコーダは、こうした推定GOSパラメータセットに対して識別値を推定してもよい。例えば、ベースビューのテクスチャビューにおけるスライスヘッダから作成されたGOSパラメータセットが0に等しい識別値を持つと推定されてもよい。
実施形態によっては、GOSパラメータセットはそれに関連する特定のアクセスユニット内で有効である。例えば、GOSパラメータセットのシンタックス構造が特定のアクセスユニットに関するNALユニットシーケンスに含まれ、そのシーケンスは復号順またはビットストリームの順で、GOSパラメータセットはその出現位置からアクセスユニットの最後まで有効であってもよい。実施形態によっては、GOSパラメータセットは様々なアクセスユニットで有効である。
エンコーダは、1つのアクセスユニットに対して様々なGOSパラメータセットを符号化してもよい。スライスヘッダで符号化されるシンタックス要素の値の少なくとも1つのサブセットが後続のスライスヘッダと同一であることが分かっている場合、または予測/推定される場合、エンコーダはGOSパラメータセットを符号化すると決定してもよい。
GOSパラメータセット識別子には、限られた番号付けスペースが使用される。例えば、固定長符号が使用されたり、特定の範囲内の符号なし整数値として判断されたりしてもよい。エンコーダは、最初のGOSパラメータセットに対して特定のGOSパラメータセット識別値を使用してもよい。次に、最初のGOSパラメータセットが、例えば何れのスライスヘッダやGOSパラメータセットによっても参照されない場合には、2番目のGOSパラメータセットに対しても同じGOSパラメータセット識別値を使用してもよい。エンコーダは、例えば伝送エラーに対する高い頑健性を得るために、ビットストリーム内でGOSパラメータセットのシンタックス構造を繰り返してもよい。
多くの実施形態では、GOSパラメータセットに含まれうるシンタックス構造は、概念的に複数のシンタックス要素のセットにまとめられる。GOSパラメータセットのシンタックス要素セットは、例えば次の原則の1つ以上に基づいて形成されてもよい:
スケーラブルレイヤおよび/または他のスケーラブル特性を示すシンタックス要素;
ビューおよび/または他のマルチビュー特性を示すシンタックス要素;
深度/視差等特定のコンポーネントタイプに関連するシンタックス要素;
アクセスユニット識別や復号順序および/または出力順序および/またはアクセスユニットの全スライスに対して不変である他のシンタックス要素に関連するシンタックス要素;
ビューコンポーネントの全スライスで不変であるシンタックス要素;
リファレンスピクチャ・リスト変更に関連するシンタックス要素;
使用されるリファレンスピクチャのセットに関連するシンタックス要素;
復号リファレンスピクチャ・マーキングに関連するシンタックス要素;
加重予測用の予測重みテーブルに関連するシンタックス要素;
デブロッキング・フィルタリングを制御するシンタックス要素;
適応ループフィルタリングを制御するシンタックス要素;
サンプル適応オフセットを制御するシンタックス要素;
上記セットの任意の組合せ。
各シンタックス要素セットに対して、エンコーダはGOSパラメータセットを符号化する際に次のオプションの1つ以上を持っていてもよい:
シンタックス要素セットはGOSパラメータセットのシンタックス構造に符号化されてもよい。すなわち、シンタックス要素セットの符号化されたシンタックス要素の値は、GOSパラメータセットのシンタックス構造に含められてもよい;
シンタックス要素セットは、参照によってGOSパラメータセットに含められてもよい。この参照は、識別子として別のGOSパラメータセットに与えられてもよい。エンコーダは、シンタックス要素セット毎に別々のリファレンスGOSパラメータセットを使用してもよい;
シンタックス要素セットは、GOSパラメータセットに存在しないことが示されてもよく、推定されてもよい。
エンコーダがGOSパラメータセットを符号化する際に特定のシンタックス要素セットに対して選択可能なオプションは、シンタックス要素セットの種類に依存してもよい。例えば、スケーラブルレイヤに関連するシンタックス要素セットはGOSパラメータセットに常時存在してもよい。一方、ビューコンポーネントの全スライスで不変なシンタックス要素のセットは、参照によって包含されるように利用可能ではなく、オプションとしてGOSパラメータセットに存在していてもよい。加えて、リファレンスピクチャ・リスト変更に関連するシンタックス要素は、参照によって含められるか、直接そのままで含められてもよく、あるいはGOSパラメータセットのシンタックス構造に存在しなくてもよい。エンコーダは、GOSパラメータセットのシンタックス構造等のビットストリームにあって、符号化に使用されたオプションの種類を示す標示を符号化してもよい。符号化テーブルおよび/またはエントロピー符号化は、シンタックス要素の種類に依存してもよい。デコーダは、復号されるシンタックス要素の種類に基づいて、エンコーダで使用された符号化テーブルおよび/またはエントロピー符号化に位置する符号化テーブルおよび/またはエントロピー復号を使用してもよい。
エンコーダは、シンタックス要素セットとそのシンタックス要素セットの値に対して元々使用されたGOSパラメータセットとの間の関連を示す複数の手段を備えていてもよい。例えば、エンコーダはシンタックス要素のループを符号化してもよい。こうしたループの各エントリは、参照として使用されたGOSパラメータセットの識別値を示し、参照GOPパラメータセットからコピーされるシンタックス要素セットを識別するシンタックス要素として符号化される。別の実施例では、エンコーダは複数のシンタックス要素でそれぞれがGOSパラメータセットを示すシンタックス要素を符号化してもよい。特定のシンタックス要素セットを含むループにおける最後のGOSパラメータセットは、エンコーダが現在ビットストリームに符号化しているときのGOSパラメータセットにあるシンタックス要素セットに対するリファレンスである。デコーダは、ビットストリームから符号化GOSパラメータセットを解析し、エンコーダと同一のGOSパラメータセットを再生するようにする。
例示的実施形態では、シンタックス構造とシンタックス要素の意味,復号処理は次の通りに規定されてもよい。ビットストリーム中のシンタックス要素は太字体で表わされる。各シンタックス要素はそれぞれの名前(下線文字を伴い全て小文字)で記述され、1または2のシンタックスカテゴリーが使用されたり、符号化表現方法として1または2の記述子が使用されたりすることもある。復号処理はシンタックス要素の値と先に復号済みのシンタックス要素の値に従って行われる。シンタックス要素の値は、シンタックステーブルまたはテキストで使用される際は通常の(太字でない)書式で表わされる。場合によっては、シンタックステーブルはシンタックス要素値から派生する他の変数の値を用いてもよい。こうした変数は、下線文字を伴わず小文字と大文字を用いてシンタックステーブルまたはテキストに表わされる。大文字で始まる変数は、現在のシンタックス構造とそれに従属する全てのシンタックス構造の復号用に生成される。大文字で始まる変数は、その変数の元のシンタックス構造を示さずに後のシンタックス構造用として復号処理に使用されてもよい。小文字で始まる変数は、その変数が生成されたコンテキスト内でも使用される。場合によっては、シンタックス要素値または変数値の数値と変換可能な「ニーモニック」名も使用される。「ニーモニック」名は数値とは無関係に使用されることもある。数値と名前の関連はテキストに規定されている。名前は下線文字で分けられた1つ以上の文字列で構成される。各文字列は大文字で始まり、途中で大文字を含んでもよい。
例示的実施形態では、H.264/AVCやHEVCドラフト等で規定されているような算術演算子や論理演算子,関係演算子,二値演算子,代入演算子,範囲表記といった共通表記が用いられてもよい。また、H.264/AVCやHEVCドラフト等で規定されているような共通の数学的関数が用いられてもよい。演算の優先順位・実行順序に関する共通規則は、H.264/AVCやHEVCドラフト等で規定されているように使用されてもよい。
例示的実施形態では、各シンタックス要素の解析処理を規定するために、次の記述子が用いられる。
・ b(8):任意パターンのビット列を持つバイト(8ビット)。
・ se(v):左ビットを先頭とする符号付き整数型の指数ゴロム(Exp-Golomb)符号化シンタックス要素。
・ u(n):nビットの符号無し整数。シンタックステーブルでnが"v"であるときは、ビット数が他のシンタックス要素の値に依存して変化する。この記述子に対する解析処理は、最初に記述された最上位ビットを伴う符号無し整数の2進表現として解釈されたビットストリームから、次のnビットによって規定される。
・ ue(v):左ビットを先頭とする符号無し整数型のExp-Golomb符号化シンタックス要素。
Exp-Golombビット列は、例えば次の表を用いて符号番号(codeNum)に変換されてもよい。
Exp-Golombビット列に対応する符号番号は、例えば次の表を用いてse(v)に変換されてもよい。
例示的実施形態では、シンタックス構造は次のように規定されてもよい。丸括弧内の一連の文は複文であり、機能的には単文として扱われる。"while"構文は、条件が真であるかどうかの判断を規定し、条件が真であれば、その条件が真でなくなるまで、単文(または複文)の評価を繰り返し指定する。"do…while"構文は、一旦文の評価を規定した後、条件が真であるかどうかの判断が続き、条件が真であれば、その条件が真でなくなるまで、文の評価を繰り返し指定する。"if…else"構文は、条件が真であるかどうかの判断を規定し、条件が真であれば最初の文の評価を指定し、そうでなければ、代替文の評価を指定する。この構文の"else"節と関連する代替文は、代替文の評価が不要であれば省略可能である。"for"構文は、初期値文の評価を指定し、条件判断が続き、条件が真であれば、その条件が真でなくなるまで、最初の文と後に続く文の評価を繰り返し指定する。
次に、3DV-ATMの例示的実施形態を説明する。
GOSパラメータセットと拡張テクスチャビューの符号化スライス,符号化深度スライスに対して、3DV-NALユニットが定義される。3DV-NALユニット(例えば、NALユニットタイプ21を用いる)のNALユニットヘッダ長は2バイトである。第2バイトにはtemporal_idと3dv_nal_unit_type,gos_param_idが含まれる。3dv_nal_unit_typeはNALユニットがGOSパラメータセットを含むか3DVスライスを含むかを規定する。NALユニットがGOSパラメータセットを含む場合、gos_param_idはNALユニットに規定されるGOSパラメータセットの識別値を与える。NALユニットがスライスを含む場合、gos_param_idはそのスライスのスライスヘッダのシンタックス要素の値を含むGOSパラメータセットを参照する。MVC-NALユニットヘッダ拡張に先に含まれていたシンタックス要素は、GOSパラメータセットに存在する。
以下では、nal_unitシンタックスはイタリック体で本節に付記される。3DV-NALユニット用にNALユニットタイプ21が予約済みであると仮定する。
nal_unit_header_3dv_extension( )のシンタックスは次の通りに規定されてもよい。
nal_unit_header_3dv_extension( )の意味は次の通りに規定されてもよい。
3dv_nal_unit_type(原文では太字であり、ビットストリームのシンタックス要素である)が0のときは、NALユニットがGOSパラメータセットを含むことを特定する。3dv_nal_unit_typeが1のときは、NALユニットが符号化スライス3DV拡張を含むことを特定する。
temporal_id(原文では太字であり、ビットストリームのシンタックス要素である)はNALユニットの時間識別子を特定する。nal_unit_typeが1または5で、nal_unit_typeが14であるNALユニットの直前にNALユニットがない場合、temporal_idは同一アクセスユニットの非ベースビューのtemporal_id値に等しいと推定される。temporal_idの値は、アクセスユニットにおけるプレフィックスの符号化スライスMVC拡張と3DV-NALユニットの全てに対して同一でもよい。nal_unit_typeが5またはnon_idr_flagが0のNALユニットをアクセスユニットが含む場合、temporal_idは0でもよい。temporal_idへの値の代入は、サブストリームの抽出処理によって制約されてもよい。
gos_param_id(原文では太字であり、ビットストリームのシンタックス要素である)はGOSパラメータセットの識別子を特定する。3dv_nal_unit_typeが0の場合、gos_param_idはNALユニットに含まれる符号化スライス3DV拡張用に使用されるGOSパラメータセットの識別子を特定する。3dv_nal_unit_typeが1の場合、gos_param_idはNALユニットで特定されるGOSパラメータセットの識別子を特定する。3dv_nal_unit_typeが1の場合、gos_param_idは0から15を含む範囲にあってもよい。3dv_nal_unit_typeが0の場合、gos_param_idは1から15を含む範囲にあってもよい。
3dv_nal_unit( )のシンタックス、すなわち、NALユニットタイプ21は次の通りに規定される。
gos_param_set( )のシンタックス、すなわち、GOSパラメータセットのシンタックス構造は次の通りに規定される。
gos_param_set( )の意味は次の通りに規定される。
slice_param_for_au_flag(原文では太字であり、ビットストリームのシンタックス要素である)が0のときは、slice_param_for_au( )シンタックス構造に含まれるシンタックス要素の値が同一アクセスユニットにおけるGOSパラメータセットまたはスライスヘッダのシンタックス構造の何れかにあるものと同一であることを特定する。slice_param_for_au_flagが1のときは、このGOSパラメータセットにslice_param_for_au( )シンタックス構造が存在することを特定する。
gos_parameter_inheritance_flagが0のときは、ref_pic_list_modification_flag[ i ],pred_weight_flag[ i ],dec_ref_pic_marking_flag[ i ]が次の通りに規定される:
・ ref_pic_list_modification_flag[ i ] ("ref_pic_list_modification_flag"は原文では太字であり、ビットストリームのシンタックス要素である)が1のときは、gos_param_idによって識別されるGOSパラメータセットにref_pic_list_3dv_modification( )シンタックス構造が有効に存在することを特定する。ref_pic_list_modification_flag[ i ]が0のときの意味は規定されていない。
・ pred_weight_flag[ i ] ("pred_weight_flag"は原文では太字であり、ビットストリームのシンタックス要素である)が1のときは、gos_param_idによって識別されるGOSパラメータセットにpred_weight_table( )シンタックス構造が有効に存在することを特定する。pred_weight_flag[ i ]が0のときの意味は規定されていない。
・ dec_ref_pic_marking_flag[ i ] ("dec_ref_pic_marking_flag"は原文では太字であり、ビットストリームのシンタックス要素である)が1のときは、gos_param_idによって識別されるGOSパラメータセットにdec_ref_pic_marking( )シンタックス構造が有効に存在することを特定する。dec_ref_pic_marking_flag[ i ]が0のときの意味は規定されていない。
gos_parameter_inheritance_flagが1のときは、ref_gos_param_id[ i ],ref_pic_list_modification_flag[ i ],pred_weight_flag[ i ],dec_ref_pic_marking_flag[ i ]が次の通りに規定される:
・ ref_gos_param_id[ i ] ("ref_gos_param_id"は原文では太字であり、ビットストリームのシンタックス要素である)は、GOSパラメータセットであって、gos_param_idで識別されるGOSパラメータセットに対して有効なref_pic_list_modification_flag[ i ],pred_weight_flag[ i ],およびdec_ref_pic_marking_flag[ i ]によって識別されるシンタックス構造を取得するためのソースとして使用されるGOSパラメータセットを識別する。ref_gos_param_id[ i ]が0のときは、同一アクセスユニットのベースビューのテクスチャビューコンポーネントのスライスヘッダが、gos_param_idで識別されるGOSパラメータセットに対して有効なref_pic_list_modification_flag[ i ],pred_weight_flag[ i ],およびdec_ref_pic_marking_flag[ i ]によって識別されるシンタックス構造を取得するためのソースとして使用されることを識別する。
・ ref_pic_list_modification_flag[ i ] ("ref_pic_list_modification_flag"は原文では太字であり、ビットストリームのシンタックス要素である)が1のときは、ref_gos_param_id[ i ] によって識別されるGOSパラメータセットのref_pic_list_3dv_modification( )シンタックス構造が、gos_param_idによって識別されるGOSパラメータセットで有効に存在することを特定する。ref_pic_list_modification_flag[ i ]が0のときの意味は規定されていない。
・ pred_weight_flag[ i ] ("pred_weight_flag"は原文では太字であり、ビットストリームのシンタックス要素である)が1のときは、ref_gos_param_id[ i ] によって識別されるGOSパラメータセットのpred_weight_table( )シンタックス構造が、gos_param_idによって識別されるGOSパラメータセットで有効に存在することを特定する。pred_weight_flag[ i ]が0のときの意味は規定されていない。
・ dec_ref_pic_marking_flag[ i ] ("dec_ref_pic_marking_flag"は原文では太字であり、ビットストリームのシンタックス要素である)が1のときは、ref_gos_param_id[ i ] によって識別されるGOSパラメータセットのdec_ref_pic_marking( )シンタックス構造が、gos_param_idによって識別されるGOSパラメータセットで有効に存在することを特定する。dec_ref_pic_marking_flag[ i ]が0のときの意味は規定されていない。
slice_param_for_3dv_view_component( )のシンタックスは次の通りに規定される。シンタックス構造は、ビューコンポーネントの全スライスに対して値が不変であるシンタックス要素を含む。
slice_param_for_3dv_view_component( )の意味は次の通りに規定される。
関連するNALユニットがgos_param_idによって識別されるGOSパラメータセットを参照する3DV-NALユニットである場合、non_idr_flag,priority_id,view_id,anchor_pic_flag,およびinter_view_flagの意味はMVCのときと同じである。
depth_flag(原文では太字であり、ビットストリームのシンタックス要素である)が0のときは、gos_param_idによって識別されるGOSパラメータセットを参照するNALユニットが、拡張テクスチャビューコンポーネントのスライスを含むことを特定する。depth_flagが1のときは、gos_param_idによって識別されるGOSパラメータセットを参照するNALユニットが、深度ビューコンポーネントのスライスを含むことを特定する。
single_slice_flag(原文では太字であり、ビットストリームのシンタックス要素である)が0のときは、gos_param_idによって識別されるGOSパラメータセットを参照するビューコンポーネントが複数のスライスを持つことを特定する。single_slice_flagが1のときは、gos_param_idによって識別されるGOSパラメータセットを参照するビューコンポーネントが厳密に1つスライスのみを持つことを特定する。
initialisation_param_equal_flag(原文では太字であり、ビットストリームのシンタックス要素である)が0のときは、slice_param_for_3dvシンタックス構造が存在しないことを特定する。initialisation_param_equal_flagが1のときは、slice_param_for_3dvシンタックス構造が存在することを特定する。
slice_param_for_3dv( )のシンタックスは次の通りに規定される。このシンタックス構造はslice_param_for_3dv_view_component( )シンタックス構造またはslice_header_in_3dv_extension( )シンタックス構造に含まれてもよい。
slice_param_for_3dv( )の意味は次の通りに規定される。
slice_param_for_3dv( )がslice_param_for_3dv_view_component( )シンタックス構造に含まれる場合、シンタックス要素の値はビューコンポーネントの全スライスに適用される。slice_param_for_3dv( )がslice_header_in_3dv_extension( )シンタックス構造に含まれる場合、シンタックス要素の値は同一NALユニットに含まれるスライスに適用される。
slice_param_for_3dv( )のシンタックス要素に対しては、次の変更と共にH.264/AVCで規定される意味が適用される。slice_type(原文では太字であり、ビットストリームのシンタックス要素である)は、その値が3,4,8または9とは等しくならないという付加制約を持つ。colour_plane_idが存在する場合、H.264/AVCで規定される意味が適用される。depth_flagが0のときは、separate_colour_plane_flagは1であると推定され、colour_plane_idは0であると推定される。direct_spatial_mv_pred_flag(原文では太字であり、ビットストリームのシンタックス要素である)は、次の変更と共にH.264/AVCで規定されるのと同じ意味を持つ。RefPicList1[0]がインタービューのリファレンスコンポーネントまたはインタービューのみのリファレンスコンポーネントを指す場合、このリファレンスコンポーネントは現在のビューコンポーネントとして同一アクセスユニットに属し、direct_spatial_mv_pred_flagは1である。num_ref_idx_l0_active_minus1(原文では太字であり、ビットストリームのシンタックス要素である)およびnum_ref_idx_l1_active_minus1(原文では太字であり、ビットストリームのシンタックス要素である)はMVCで規定されるのと同じ意味を持つ。dmvp_flag(原文では太字であり、ビットストリームのシンタックス要素である)が0のときは、MVCで規定されるインタービューおよびイントラビューの予測処理が適用されることを特定する。dmvp_flagが1のときは、深度ベースのインタービューおよびイントラビュー予測処理が適用されることを特定する。depth_weighted_pred_flag(原文では太字であり、ビットストリームのシンタックス要素である)が0のときは、深度ビューコンポーネントのPまたはBスライスに対して深度範囲ベースの加重予測が使用されないことを特定する。depth_weighted_pred_flagが1のときは、深度ビューコンポーネントのPまたはBスライスに対して深度範囲ベースの加重予測が使用されることを特定する。
slice_param_for_au( )のシンタックスは次の通りに規定される。シンタックス構造は、3DV-NALユニットを含むアクセスユニットの全スライスに対して値が不変であるシンタックス要素を含む。
slice_param_for_au( )の意味は次の通りに規定される。次の付加制約と共にH.264/AVCで規定される意味が適用される。slice_param_for_auの各シンタックス要素の値は、同一アクセスユニットに含まれる全スライスヘッダとslice_header_for_auシンタックス構造で不変であってもよい。
slice_header_in_3dv_extension( )のシンタックスは次の通りに規定される。single_slice_flagおよびinitialisation_param_equal_flagの値は、gos_param_idによって識別されるGOSパラメータセットから得られる。
slice_header_in_3dv_extension( )の意味は次の通りに規定される。H.264/AVCで規定される意味が適用される。slice_header_in_3dv_extension( )にシンタックス要素または構造が存在しない場合、その値はgos_param_idによって識別されるGOSパラメータセットから継承される。
次に、HEVCの例示的実施形態と可能なスケーラブル拡張を説明する。前述のスケーラブル拡張は例えば、中粒度および/または粗粒度品質スケーラビリティや空間スケーラビリティ,拡張空間スケーラビリティ,マルチビュー符号化,深度拡張符号化,補助ピクチャ符号化,ビット深度スケーラブル符号化,またはこれらの組合せを含んでもよい。
スケーラブル拡張を有効にすることによって、アクセスユニットは比較的多数のコンポーネントピクチャで構成できる。これは、依存表現やレイヤ表現だけでなく符号化されたテクスチャ・深度ビューコンポーネント等である。一部のコンポーネントピクチャの符号化サイズは比較的小さいこともある。これは例えば、ベースビューやベースレイヤに対する差分を表現するものと見做されるためであったり、深度コンポーネントが比較的圧縮し易いためであったりすることが理由である。その結果、NALユニットヘッダおよびスライスヘッダのオーバーヘッドは、こうしたコンポーネントピクチャ用に使用されるバイト数の共有に比例して大きくなる。
HEVCコーデックは伝送エラーに対して脆弱であり、あらゆるタイプのエラー隠蔽によって、一定時間におけるエラーの大きさと空間領域の両方が大きくなる結果となり得る。MPEG-DASH等の伝送システムの多くはエラーの無いシステムである。
SVCおよびMVCのスケーラビリティ特性の一部はNALユニットヘッダで提供される。これは、NALユニットヘッダが比較的大きいサイズであるためであって、SVCおよびMVCの符号化スライスに対しては4バイトである。NALユニットヘッダまたはスライスヘッダがパラメータセットのリファレンスを与えられ、スケーラビリティ特性が提供されれば、NALユニットヘッダのサイズをより小さくすることが可能である。しかし、こうした設計には、マルチメディアゲートウェイや多地点会議制御装置(Multipoint Conference Control Unit;MCU)といった、ビットストリームからのサブビットストリーム抽出やスケーラブル適応を遂行するエンティティがパラメータセットにアクセスし、パラメータセットの活性化状態を維持することが要求される。
以下の例示的実施形態では、次の幾つかの技術領域をまとめて対応する解決方法が提供される。第1に、この例示的実施形態はHEVCのスケーラブル拡張のための繋がりを提供することができる。第2に、パラメータセットへのアクセスやその解析,パラメータセットの活性トラックの維持を必要としないサブビットストリームの抽出を可能にする。第3に、例示的実施形態は、NALユニットヘッダのサイズを、SVCおよびMVCの4バイトのヘッダよりも小さくすることができる。第4に、ピクチャが複数のスライスを含む場合、スライスヘッダのオーバーヘッドバイト数を減らすこともできる。第5に、例示的実施形態を更に追加して、スケーラブル拡張におけるスライスヘッダのバイト数の削減も行える。
コンポーネントピクチャは、コンポーネントピクチャ区切りNALユニットと後続の複数の符号化スライスNALユニットとして定義されてもよい。ただし、後続の符号化スライスNALユニットは、アクセスユニットの最後または次のコンポーネントピクチャ区切りNALユニットのうち復号順で早い方のユニットまでに続いている符号化スライスNALユニットであって、最後または次の区切りNALユニットは除く。実際にスケーラブル拡張のないHEVCでは、コンポーネントピクチャはアクセスユニットの符号化ピクチャを含むものと見做されてもよい。そして将来のスケーラブル拡張において、コンポーネントピクチャはビューコンポーネントや深度マップ,依存表現,レイヤ表現等を含むこともできる。
複数のコンポーネントピクチャはコンポーネントピクチャ区切りNALユニットで互いに分けられ、コンポーネントピクチャの符号化スライスの復号に使用される共通のシンタックス要素の値を運んでもよい。
この例示的実施形態では、各コンポーネントピクチャにはコンポーネントピクチャ依存識別子(cpd_id)が付与される。この識別子はコンポーネントピクチャ区切りNALユニットと符号化スライスの両方のために信号送信され、両方の間の関連を形成している。
図10は、例示的実施形態に従うアクセスユニットの構造を簡易的に示す。
アクセスユニットはアクセスユニット区切りNALユニットから始まってもよい。アクセスユニット区切りはあってもなくてもよい。0以上のSEI-NALユニットがアクセスユニット区切りNALユニット(存在する場合)の後に続いてもよい。コンポーネントピクチャ区切りNALユニットは各コンポーネントピクチャより先にある。コンポーネントピクチャは1つ以上の符号化スライスNALユニットを含む。1つのアクセスユニットに1つ以上のコンポーネントピクチャが含まれてもよい。
スライスヘッダのシンタックス要素はシンタックス構造に分類される。各構造は1つのコンポーネントピクチャ内で同じ特性を有する。すなわち、コンポーネントピクチャの全符号化スライスで不変のままか、コンポーネントピクチャの符号化スライス毎に変化する。例えば、次のシンタックス要素の構造またはスライスパラメータ構造が規定されてもよい:
1. ピクチャ識別情報(idr_pic_idおよび関連するPOC)
2. リファレンスピクチャセット
3. 適応パラメータセットID
4. デブロッキングフィルタ制御
5. 適応ループフィルタ制御
6. リファレンスピクチャ・リスト作成
7. 加重予測用の予測重みテーブル。
コンポーネントピクチャ区切りNALユニットを符号化する際、そのコンポーネントピクチャ区切りNALユニットに前述のどちらが存在するかが示され、そのことがコンポーネントピクチャの全符号化スライスで共有されてもよい。コンポーネントピクチャ区切りNALユニットに存在しないシンタックス要素の構造がスライスヘッダに存在してもよい。
図11は、1つのコンポーネントピクチャ区切りNALユニットおよび2つの符号化スライスNALユニットを含むコンポーネントピクチャの実施例を示す。コンポーネントピクチャNALユニットは、上記でリストされた幾つかのスライスパラメータシンタックス構造のうち、ピクチャ識別情報,リファレンスピクチャセット,適応パラメータセットIDの3つを含む。符号化スライスはコンポーネントピクチャNALユニットからこの3つのスライスパラメータ構造を継承する。この実施例では、符号化スライスのスライスヘッダもリファレンスピクチャ・リスト作成構造を含む。この構造は、この実施例においては符号化スライス毎に適合していて、コンポーネントピクチャNALユニットには含まれていない。この実施例では残りの3つの構造が示されていないが、デブロッキングフィルタと適応ループフィルタの動作はAPSによって有効に制御される。加えて、この実施例では加重予測が使用されないため、予測重みテーブルも存在しない。
コンポーネントピクチャ区切りが1つ以上失われてもスライスを独立して復号することが望まれる環境では、次の何れかの戦略を用いることができる。
・ エンコーダは、コンポーネントピクチャ区切りにあるスライスヘッダのシンタックス要素を符号化せず、従来通りにスライスヘッダにあるシンタックス要素を符号化することを選択してもよい。このため、現行のHEVC WDと同じエラー耐性を達成可能である。
・ コンポーネントピクチャ区切りNALユニットを繰り返す機構を採用することもできる。この機構はHEVCでも採用可能で、例えばSEIメッセージをビットストリームの任意の位置に配置することができるSEI機構を採用し、このSEIメッセージと一緒にコンポーネントピクチャ区切りを繰り返すこともできる。あるいは、または加えて、トランスポートレベルでの機構を使用することもできる。例えば、送信側がトランスポートパケット内でコンポーネントピクチャ区切りNALユニットが適切であると分かる場合、例えばSVC RTPペイロードフォーマットのPACSI-NALユニットのような機構で送信される場合、コンポーネントピクチャ区切りNALユニットを繰り返すことができる。
アクセスユニットに複数のコンポーネントピクチャが存在する場合でもスライスヘッダパラメータに使うビット数を減らすために、選択されたパラメータの予測がコンポーネントピクチャ区切りNALユニットを超えて実行されてもよい。例えば、深度強化マルチビュービデオの符号化では、同一view_idのテクスチャビューコンポーネントと深度ビューコンポーネントとの間でスライスパラメータ構造の一部が予測されるという利点がある。他のシンタックス要素に対しても、同一のコンポーネントタイプ(テクスチャまたは深度)における別々のビューコンポーネントからのシンタックス要素を継承する方がよい。
実際に、非ベースコンポーネントピクチャに対するコンポーネントピクチャ区切りNALユニットは、別のコンポーネントピクチャ区切りNALユニットの内容またはそれへの参照によって、示されたシンタックス要素の構造を含むことができる。この参照はcpd_id値を単位として与えられる。cpd_idがCPDID1であるコンポーネントピクチャ区切りNALユニットのシンタックス要素は、シンタックス要素セットにクラスタ化される。各シンタックス要素セットは、同一アクセスユニットにあって、cpd_idがCPDID2で先にあるコンポーネントピクチャ区切りNALユニットから選択的にコピーされてもよい。CPDID1はCPDID2よりも大きいため、スライスヘッダパラメータはコンポーネントピクチャ内で効果的かつ柔軟に共有される。
図12は、2組のテクスチャ・深度コンポーネントピクチャを持つマルチビュー・プラス・深度アクセスユニットの実施例を示す。これらのコンポーネントピクチャのビットストリーム順序は、次のように仮定する:ベースビューテクスチャピクチャ,ベースビュー深度ピクチャ,非ベースビューテクスチャピクチャ,および非ベースビュー深度ピクチャ。この実施例では、ピクチャ識別情報およびリファレンスピクチャセット構造が全コンポーネントピクチャで同一であり、参照によってcpd_idが0を超えるコンポーネントピクチャ区切りNALユニットに含まれる。テクスチャコンポーネントピクチャのリファレンスピクチャ・リストは同一で、深度コンポーネントピクチャに関するリファレンスピクチャ・リストも同一である。ただし、テクスチャコンポーネントピクチャのリファレンスピクチャ・リストは、深度コンポーネントピクチャのリストとは異なる。したがって、予測元はリファレンスピクチャ・リスト作成構造に対して変わる。この実施例では、残りに4つのスライスパラメータ構造はスライスヘッダに含まれるか存在しないものと仮定する。最後の2つのピクチャ区切りNALユニットのcpd_idは、何れもそれ以降のピクチャ区切りNALユニットの予測に使用されないため、同一の値(2)であってもよい。
各コンポーネントピクチャにはコンポーネントピクチャ依存識別子(cpd_id)が付与され、NALユニットヘッダで信号送信される。cpd_idに基づいてサブビットストリームの抽出を実行できるように、cpd_idの値には制約がある。換言すれば、0を超える特定のcpd_idを持つコンポーネントピクチャ区切りNALユニットと符号化スライスNALユニットを除外して形成されたビットストリームが適合ビットストリームである。
この例示的実施形態では、cpd_idはNALユニットヘッダに含まれる。したがって、その値域に制限がある(例えば、5ビットである)。一般的には、アクセスユニット内のコンポーネントピクチャの数はこの値域の最大値(例えば32)よりも大きくなり得る。その結果、cpd_id値はアクセスユニット内で再利用されなくてはならない可能性もある。例示的実施形態によっては、コンポーネントピクチャ区切りNALユニットは入れ子の予測構造を持つ。すなわち、cpd_idがCPDID1であるコンポーネントピクチャ区切りNALユニットは、次のコンポーネントから予測され、それ以外のコンポーネントピクチャ区切りNALユニットからは予測されない。以下では、アクセスユニット内のコンポーネントピクチャ区切りNALユニットが復号順(すなわち、ビットストリーム順)で0,1,2,…とインデクスが振られている。cpd_idがCPDID1である現在のコンポーネントピクチャ区切りNALユニットのインデクスはcurrIndexであり、currIndexは0よりも大きい。これは、次の擬似コードによって示される。
currSmallestCpdId = CPDID1
for( i = currIndex - 1, j = 0; i > 0; i-- ) {
if( cpdId[ i ] < currSmallestCpdId ) {
refCpdIdx[ j ] = i
j++
currSmallestCpdId = cpd_id[ i ]
}
}
numRefCpdIdx = j
この擬似コードは次の通りである:
・ 入力パラメータcpdId[ i ]は、アクセスユニット内のインデクスiを持つコンポーネントピクチャ区切りNALユニットのcpd_id値を与える;
・ 出力パラメータnumRefCpdIdxは、現コンポーネントピクチャ区切りNALユニットの予測に使用されるコンポーネントピクチャ区切りNALユニットの数を与える;
・ numRefCpdIdxが0を超える場合、refCpdIdx[ j ]は、現コンポーネントピクチャ区切りNALユニットの予測に使用されるコンポーネントピクチャ区切りNALユニットのインデクスを与える;ここで、jは0以上numRefCpdIdx - 1以下の範囲である。
この結果、アクセスユニット内のサブビットストリーム抽出も、次のようにより細かい粒度で行える。cpd_idが全てCPDID1であるコンポーネントピクチャ区切りNALユニットとそれに続く符号化スライスNALユニットから成るコンポーネントピクチャが、ビットストリームから削除される場合、ビットストリームから削除されるべきコンポーネントピクチャは次のアルゴリズムによって決定することができる。前述のように、アクセスユニット内のコンポーネントピクチャが復号順(すなわち、ビットストリーム順)で0,1,2,…とインデクスが振られている。現在の(削除されるべき)コンポーネントピクチャのインデクスはcurrIndexであり、アクセスユニット内のコンポーネントピクチャの総数はnumIndexである。
for( i = currIndex + 1, j = 0; i < numIndex; i++) {
if( cpdId[ i ] > CPDID1 ) {
toBeRemovedIdx[ j ] = i
j++
}
else
break
}
numToBeRemovedIdx = j
この擬似コードでは、"break"は(Cプログラミング言語のように)ループから出る。入力と出力は次の通りである:
・ 入力パラメータcpdId[ i ]は、アクセスユニット内のインデクスiを持つコンポーネントピクチャ区切りNALユニットのcpd_id値を与える;
・ 出力パラメータnumToBeRemovedIdxは、現コンポーネントピクチャと共に、アクセスユニットから削除されるべきコンポーネントピクチャの数を与える;
・ numToBeRemovedIdx0を超える場合、toBeRemovedIdx[j]は、現コンポーネントピクチャと共に、アクセスユニットから削除されるべきコンポーネントピクチャのインデクスを与える;ここで、jは0以上numToBeRemoved - 1以下の範囲である。
この種の削除処理またはサブビットストリームの抽出処理では、どのコンポーネントピクチャ区切りNALユニットが実際に予測に使用されるかを調べない。一方、cpd_idの内容による制約によって制御されるように、どのコンポーネントピクチャ区切りNALユニットが予測に使用されるかという情報だけは使用される。しかし、このサブビットストリームの抽出処理は、NALユニットヘッダでアクセス可能なcpd_id値のみで動作してもよく、メディアゲートウェイやMCU等の直接的な方法で利用される。
以下では、シンタックス構造の一部による例示的実施形態が説明される。
NALユニットのシンタックスは次を含んでもよい。
cpd_idの意味は次のように付加される。cpd_id(原文では太字であり、ビットストリームのシンタックス要素である)はコンポーネントピクチャの識別子である。cpd_idの値は前述のように制約を受ける。
NALユニットのテーブルは次を含んでもよい。
例示的実施形態に従うコンポーネントピクチャ区切りNALユニットのシンタックス構造は次の通りである。
structure_idc(原文では太字であり、ビットストリームのシンタックス要素である)はこのシンタックス構造で使用される構造の識別子である。structure_idcは、HEVCスケーラブル拡張で規定されるコンポーネントピクチャのスライスヘッダおよびコンポーネントピクチャ区切りNALユニットに存在する様々なシンタックス要素の有無と組合せを示すのに使用される。認識不可能なstructure_idc値を持つコンポーネントピクチャ区切りNALユニットは、復号処理で無視されてもよい。
single_slice_type_flag(原文では太字であり、ビットストリームのシンタックス要素である)が0のときは、コンポーネントピクチャが別のスライスタイプのスライスを含む可能性があることを特定する。single_slice_type_flagが1のときは、コンポーネントピクチャが同一のスライスタイプのスライスを含む可能性があることを特定する。
pred_flag(原文では太字であり、ビットストリームのシンタックス要素である)が0のときは、次に示されたスライスパラメータ構造が現在のNALユニットに含まれることを特定する。pred_flagが1のときは、次に示されたスライスパラメータ構造が、cpd_idがref_cpd_id[ idx ]であるコンポーネントピクチャ区切りNALユニットからの参照によって示されることを特定する。
ref_cpd_id[ idx ] (原文では太字であり、ビットストリームのシンタックス要素である)は、コンポーネントピクチャ区切りNALユニットが、示されたスライスパラメータ構造に対するリファレンスとして使用されることを特定する。
slice_param_flag[ i ][ idx ] ("slice_param_flag"は原文では太字であり、ビットストリームのシンタックス要素である)は、i番目のスライスパラメータ構造が現在のコンポーネントピクチャ区切りNALユニットに含まれることを特定する。この値は、別のコンポーネントピクチャ区切りNALユニットへの参照によって代入されてもよい。
例示的実施形態に従って、スライスヘッダのシンタックスは次を含んでもよい。
スライスヘッダの復号または解析中は、同一のcpd_idで先行するコンポーネントピクチャ区切りNALユニットに含まれるシンタックス要素が有効である。
次のスライスパラメータシンタックス構造が規定されてもよい。このシンタックス構造は、HEVCドラフト規格のスライスヘッダに在るパラメータを含む。
これらの構造におけるシンタックス要素の意味はHEVCドラフト規格で与えられる意味と比べて変わらない。
HEVCのスケーラブル拡張に対しては、1つ以上の新たなstructure_idc値が使用されるようになってもよい。また、スケーラブル拡張は1つ以上の新たなスライスパラメータ構造を使用できるようにしてもよい。SVCと同様のdependency_idとquality_id similarを持つコンポーネントピクチャ区切りNALユニットに対するスケーラブル拡張の実施を以下に示す。
特定のコンポーネントピクチャ区切りNALユニットから別のものを参照によって予測または包含することは、予測用のリファレンスのコンポーネントピクチャ区切りNALユニットおよび/または予測されるコンポーネントピクチャ区切りNALユニットのstructure_idc値を条件として行われてもよい。例えば、特定のスライスパラメータ構造が深度コンポーネントピクチャに対して有効であってもよく、テクスチャコンポーネントピクチャにはなくてもよい。したがって、こうしたスライスパラメータ構造に対する予測は行われない。
前述の例示的実施形態は、ビットストリームのシンタックスを用いて記述されていた。しかし、対応する構成および/またはコンピュータプログラムがビットストリームを生成するエンコーダおよび/またはビットストリームを復号するデコーダに存在し得ることも理解されるべきである。同様に、エンコーダを参照して例示的実施形態が記述されていたことに対して、結果として得られるビットストリームとデコーダに対応する要素が備わることも理解されるべきである。同様に、デコーダを参照して例示的実施形態が記述されていたことに対して、デコーダによって復号されるビットストリームを生成する構成および/またはコンピュータプログラムをエンコーダが備えることも理解されるべきである。
前述の実施例は電子デバイスのコーデックにおいて動作する本発明の実施形態を記述しているが、以下で記述されるように本発明が任意のビデオコーデックの一部として実装され得ることを理解されたい。したがって例えば、本発明の実施形態は、固定または有線の通信経路を通じてビデオ符号化を実装し得るビデオコーデックに実装されてもよい。
そしてユーザ装置は、前述の本発明の実施形態に記述されるこうしたビデオコーデックを備えてもよい。「ユーザ機器」との語句は、如何なるタイプの無線ユーザ機器を表してもよく、例えば携帯電話やポータブルデータ処理装置、ポータブルWebブラウザであってもよい。
さらに、地上波公共移動通信ネットワーク(public land mobile network;PLMN)が、前述のビデオコーデックを含んでもよい。
一般に、様々な実施形態が、ハードウェアまたは特定用途向け回路、ソフトウェア、ロジック、またはそれらの組み合わせで実装されてもよい。例えば、ある場合ではハードウェアで実装されてもよく、一方別の場合では、コントローラやマイクロプロセッサ等のコンピュータデバイスによって実行されるファームウェアやソフトウェアで実装されてもよい。本発明の種々の形態はブロック図,フローチャート,または他の図的記述を使用して記述ないし図示される。これらのブロック,装置,システム,技術,またはここで記述される方法は、非限定的な例として、ハードウェア,ソフトウェア,ファームウェア,特定用途向け回路やロジック,汎用ハードウェア,コントローラや他のコンピュータデバイス,またはそれらの組み合わせで実装されてもよいと理解されるべきである。
そして本発明の実施形態は、移動デバイスのデータプロセッサによって実行可能なコンピュータソフトウェア,ハードウェア,またはソフトウェアとハードウェアの組合せによって実装されてもよい。またこの点に関して、添付する図面に示される論理フローの任意のブロックが、プログラムのステップや相互接続された論理回路・ブロック・機能,またはプログラムのステップ,論理回路・ブロック・機能の組合せを表現してもよいことに留意されたい。ソフトウェアは、メモリチップ等の物理メディアやプロセッサ内に実装されるメモリブロック,ハードディスクやフレキシブルディスク等の磁気メディア,DVDやそのデータ異形態であるCD等の光学式メディアに格納されてもよい。
本発明の様々な実施形態は、メモリに存在するコンピュータプログラムコードを用いて実装可能であり、関連する装置に本発明を遂行させられる。例えば、端末装置は、データの処理・送受信を行う回路および電子装置と、メモリにコンピュータプログラムコードと、プロセッサを備えてもよい。プロセッサは、コンピュータプログラムコードを実行すると、端末装置に本実施形態の構成を遂行させる。また更に、ネットワーク装置は、データの処理・送受信を行う回路および電子装置と、メモリにコンピュータプログラムコードと、プロセッサを備えてもよい。プロセッサは、コンピュータプログラムコードを実行すると、ネットワーク装置に本実施形態の構成を遂行させる。
メモリは、ローカルな技術環境に適したあらゆるタイプのものであってよい。例えば、半導体ベースのメモリデバイス,磁気メモリデバイス・システム,光学式メモリデバイス・システム,固定式・移動式メモリ等の様々な適合するデータ格納技術を用いて実装されてもよい。データプロセッサは、ローカルな技術環境に適したあらゆるタイプのものであってよく、非限定的な例として、一つ以上の汎用コンピュータ,特定用途向けコンピュータ,マイクロプロセッサ,デジタル信号プロセッサ(DSP),マルチコアプロセッサ・アーキテクチャに基づくプロセッサを含んでもよい。
本発明の実施形態は、集積回路モジュールのような、様々な要素で実施されることもできる集積回路の設計は多くは自動化されたプロセスである。論理レベルの設計を、半導体基板上にエッチング・形成するための半導体回路設計に変換する複雑で強力なソフトウェアツールが利用可能である。
カリフォルニア州マウンテンビューのSynopsys, Incや、カリフォルニア州サンノゼのCadence Designのような業者が提供するプログラムは、定評のある設計ルールと実績のある設計モジュールのライブラリに基づいて、半導体チップ上に導電経路や要素を配する。-半導体回路の設計が完了すると、それは、OpusやGDSII等の標準的な電子フォーマットの形で半導体製造設備または、いわゆる「ファブ(fab)」に送られる。
前述の説明は、本発明の非限定的な実施例を十分かつ詳細に記述している。しかし、こうした前述の説明を、添付する図面および特許請求の範囲と併せて考慮すれば、種々の変更および適応が可能であることは、本願に関連する技術分野の当業者には明らかであろう。さらに、本発明が教示するこうした事項の全ておよび類似する変形は、その全てが本発明の範囲内にある。
さらに、幾つかの実施例を以下に示す。
第1の実施例によれば、非圧縮ピクチャを、スライスを含む符号化ピクチャに符号化する方法であって、非圧縮ピクチャを、スライスを含む符号化ピクチャに符号化することを含む方法が提供される。この符号化することは、
・ 前記スライスに対するシンタックス要素を第1のセットおよび第2のセットに分類することと;
・ 前記第1のセットおよび前記第2のセットに対するシンタックス要素値を決定することと;
・ 第1のスライス群パラメータセットまたはスライスヘッダにおいて前記第1のセットを選択的に符号化することであって、前記符号化することは次のこと:
* 別のスライス群パラメータセットから前記関連する第1のセットの包含の標示情報を提供することと;
* 前記第1のセットのシンタックス要素値を符号化することと;
* 前記両方を省略すること
の何れか1つを含む、前記符号化することと;
・ 第2のスライス群パラメータセットまたはスライスヘッダにおいて前記第2のセットを選択的に符号化することであって、前記符号化することは次のこと:
* 別のスライス群パラメータセットから前記関連する第2のセットの包含の標示情報を提供することと;
* 前記第2のセットのシンタックス要素値を符号化することと;
* 前記両方を省略すること
の何れか1つを含む、前記符号化すること
を含む。
実施形態によっては、前記スライス群パラメータセットにシンタックス要素のサブセットを少なくとも1つ含むことを、前記方法が含む。
実施形態によっては、前記方法は、符号化済みまたは復号済みであるか、ビットストリームに既存の他のシンタックス構造から前記スライス群パラメータセットの内容またはインスタンスを推定することを含む。
実施形態によっては、前記方法は、ベースビューのテクスチャビューコンポーネントのスライスヘッダから前記スライス群パラメータセットを形成することを含む。
実施形態によっては、前記方法は、前記推定されたスライス群パラメータセットに対する識別値を作ることを含む。
前記方法の実施形態によっては、スライス群パラメータセットは、それに関連する特定のアクセスユニット内で有効である。
前記方法の実施形態によっては、前記スライス群パラメータセットのシンタックス構造は、特定のアクセスユニットに関するネットワーク抽象化層ユニットシーケンスに含まれ、前記シーケンスは復号順またはビットストリームの順で、前記スライス群パラメータセットはその出現位置から前記アクセスユニットの最後まで有効である。
前記方法の実施形態によっては、前記スライス群パラメータセットは、複数のアクセスユニットに対して有効である。
実施形態によっては、前記方法は、1つのアクセスユニットに対して複数のスライス群パラメータセットを符号化することを含む。
実施形態によっては、前記方法は、スライスヘッダにおけるシンタックス要素値の少なくとも1つのサブセットであって符号化されるサブセットが、後続のスライスヘッダにあるのと同一であるかを決定することと;そうである場合、ビットストリームにおいて前記スライス群パラメータセットを符号化することを含む。
前記方法の実施形態によっては、前記スライス群パラメータセットのシンタックス構造が識別子を含む。
実施形態によっては、前記方法は、スライス群パラメータセットの特定のインスタンスを参照するために前記識別子を用いることを含む。
実施形態によっては、前記方法は、スライスヘッダまたは別のスライス群パラメータセットから前記スライス群パラメータセットを参照するために、前記識別子を用いることを含む。
前記方法の実施形態によっては、前記識別子に対して所定の番号付け空間が使用される。
実施形態によっては、前記方法は、第1のスライス群パラメータセットに対して特定のスライス群パラメータセット識別値を使用することと、前記第1のスライス群パラメータセットがスライスヘッダまたはスライス群パラメータセットの何れによっても参照されない場合、第2のスライス群パラメータセットに対して前記スライス群パラメータセット識別値を使用することを含む。
実施形態によっては、前記方法は、ビットストリーム内で前記スライス群パラメータセットのシンタックス構造を繰り返すことを含む。
実施形態によっては、前記方法は、前記スライス群パラメータセットのシンタックス構造のビットストリーム順序および所定の番号付け方式を用いて、前記スライス群パラメータセットのシンタックス構造を識別することを含む。
実施形態によっては、前記方法は、次の少なくとも1つから、前記スライス群パラメータセットに対するシンタックス要素セットを形成することを含む:
スケーラブルレイヤおよび/または他のスケーラブル特性を示すシンタックス要素;
ビューおよび/または他のマルチビュー特性を示すシンタックス要素;
マルチビュービデオの特定のコンポーネントタイプに関連するシンタックス要素;
アクセスユニット識別情報に関連するシンタックス要素;
復号順序に関連するシンタックス要素;
出力順序に関連するシンタックス要素;
アクセスユニットの全スライスに対して不変である他のシンタックス要素に関連するシンタックス要素;
ビューコンポーネントの全スライスで不変であるシンタックス要素;
リファレンスピクチャ・リスト変更に関連するシンタックス要素;
使用されるリファレンスピクチャのセットに関連するシンタックス要素;
復号リファレンスピクチャ・マーキングに関連するシンタックス要素;
加重予測用の予測重みテーブルに関連するシンタックス要素;
デブロッキング・フィルタリングを制御するシンタックス要素;
適応ループフィルタリングを制御するシンタックス要素;
サンプル適応オフセットを制御するシンタックス要素。
実施形態によっては、前記要素は、前記スライス群パラメータセットを符号化するとき、次の1つ以上を含む:
前記シンタックス要素をスライス群パラメータセットのシンタックス構造に符号化すること;
前記シンタックス要素セットを参照によってスライス群パラメータセットに含めること;
前記シンタックス要素セットが前記スライス群パラメータセットにないことを標示すること。
実施形態によっては、前記方法は、スケーラブルレイヤに関連するシンタックス要素セットを前記スライス群パラメータセットに含めることと;ビューコンポーネントの全スライスで不変であるシンタックス要素を前記スライス群パラメータセットに含めることを含む。
実施形態によっては、前記方法は、リファレンスピクチャ・リストの変更に関連するシンタックス要素を参照または包含によって前記スライス群パラメータセットのシンタックス構造に含めること、または前記スライス群パラメータセットのシンタックス構造から不在にすることを含む。
実施形態によっては、前記方法は、スライス群パラメータセットをネットワーク抽象化層ユニットとして符号化することを含む。
実施形態によっては、前記方法は、ビットストリームにおけるスライス群パラメータセットのネットワーク抽象化層(NAL)ユニットを符号化スライスNALユニットと共に符号化することを含む。
第2の実施例によれば、少なくとも1つのプロセッサと、コンピュータプログラムコードを含む少なくとも1つのメモリとを備える装置が提供される。前記少なくとも1つのメモリおよび前記コンピュータプログラムコードは、前記少なくとも1つのプロセッサを用いて、前記装置に:
・ 符号化ピクチャが含むスライスに対するシンタックス要素を第1のセットおよび第2のセットに分類することと;
・ 前記第1のセットおよび前記第2のセットに対するシンタックス要素値を決定することと;
・ 第1のスライス群パラメータセットまたはスライスヘッダにおいて前記第1のセットを選択的に符号化することであって、次のこと:
* 別のスライス群パラメータセットから前記関連する第1のセットの包含の標示情報を提供することと;
* 前記第1のセットのシンタックス要素値を符号化することと;
* 前記両方を省略すること
の何れか1つを含む、前記符号化することと;
・ 第2のスライス群パラメータセットまたはスライスヘッダにおいて前記第2のセットを選択的に符号化することであって、次のこと:
* 別のスライス群パラメータセットから前記関連する第2のセットの包含の標示情報を提供することと;
* 前記第2のセットのシンタックス要素値を符号化することと;
* 前記両方を省略すること
の何れか1つを含む、前記符号化すること
を遂行させるように構成される。
前記装置の実施形態によっては、前記少なくとも1つのメモリおよび前記メモリに格納されるコードは、前記少なくとも1つのプロセッサによって実行されると、前記装置に更に、前記スライス群パラメータセットにシンタックス要素のサブセットを少なくとも1つ含めさせる。
前記装置の実施形態によっては、前記少なくとも1つのメモリおよび前記メモリに格納されるコードは、前記少なくとも1つのプロセッサによって実行されると、前記装置に更に、符号化済みまたは復号済みであるか、ビットストリームに既存の他のシンタックス構造から前記スライス群パラメータセットの内容またはインスタンスを推定させる。
前記装置の実施形態によっては、前記少なくとも1つのメモリおよび前記メモリに格納されるコードは、前記少なくとも1つのプロセッサによって実行されると、前記装置に更に、ベースビューのテクスチャビューコンポーネントのスライスヘッダから前記スライス群パラメータセットを形成させる。
前記装置の実施形態によっては、前記少なくとも1つのメモリおよび前記メモリに格納されるコードは、前記少なくとも1つのプロセッサによって実行されると、前記装置に更に、前記推定されたスライス群パラメータセットに対する識別値を作成させる。
前記装置の実施形態によっては、スライス群パラメータセットは、それに関連する特定のアクセスユニット内で有効である。
前記装置の実施形態によっては、前記少なくとも1つのメモリおよび前記メモリに格納されるコードは、前記少なくとも1つのプロセッサによって実行されると、前記装置に更に、前記スライス群パラメータセットのシンタックス構造を、特定のアクセスユニットに関するネットワーク抽象化層ユニットシーケンスに含ませる。ここで、前記シーケンスは復号順またはビットストリームの順で、前記スライス群パラメータセットはその出現位置から前記アクセスユニットの最後まで有効である。
前記装置の実施形態によっては、前記スライス群パラメータセットは、複数のアクセスユニットに対して有効である。
前記装置の実施形態によっては、前記少なくとも1つのメモリおよび前記メモリに格納されるコードは、前記少なくとも1つのプロセッサによって実行されると、前記装置に更に、1つのアクセスユニットに対して複数のスライス群パラメータセットを符号化させる。
前記装置の実施形態によっては、前記少なくとも1つのメモリおよび前記メモリに格納されるコードは、前記少なくとも1つのプロセッサによって実行されると、前記装置に更に、スライスヘッダにおけるシンタックス要素値の少なくとも1つのサブセットであって符号化されるサブセットが、後続のスライスヘッダにあるのと同一であるかを決定することと;そうである場合、ビットストリームにおいて前記スライス群パラメータセットを符号化することを遂行させる。
前記装置の実施形態によっては、前記少なくとも1つのメモリおよび前記メモリに格納されるコードは、前記少なくとも1つのプロセッサによって実行されると、前記装置に更に、前記スライス群パラメータセットのシンタックス構造に識別子を含ませる。
前記装置の実施形態によっては、前記少なくとも1つのメモリおよび前記メモリに格納されるコードは、前記少なくとも1つのプロセッサによって実行されると、前記装置に更に、スライス群パラメータセットの特定のインスタンスを参照するために前記識別子を使用させる。
前記装置の実施形態によっては、前記少なくとも1つのメモリおよび前記メモリに格納されるコードは、前記少なくとも1つのプロセッサによって実行されると、前記装置に更に、スライスヘッダまたは別のスライス群パラメータセットから前記スライス群パラメータセットを参照するために、前記識別子を使用させる。
前記装置の実施形態によっては、前記少なくとも1つのメモリおよび前記メモリに格納されるコードは、前記少なくとも1つのプロセッサによって実行されると、前記装置に更に、前記識別子に対して所定の番号付け空間を使用させる。
前記装置の実施形態によっては、前記少なくとも1つのメモリおよび前記メモリに格納されるコードは、前記少なくとも1つのプロセッサによって実行されると、前記装置に更に、第1のスライス群パラメータセットに対して特定のスライス群パラメータセット識別値を使用することと、前記第1のスライス群パラメータセットがスライスヘッダまたはスライス群パラメータセットの何れによっても参照されない場合、第2のスライス群パラメータセットに対して前記スライス群パラメータセット識別値を使用することを遂行させる。
前記装置の実施形態によっては、前記少なくとも1つのメモリおよび前記メモリに格納されるコードは、前記少なくとも1つのプロセッサによって実行されると、前記装置に更に、ビットストリーム内で前記スライス群パラメータセットのシンタックス構造を反復させる。
前記装置の実施形態によっては、前記少なくとも1つのメモリおよび前記メモリに格納されるコードは、前記少なくとも1つのプロセッサによって実行されると、前記装置に更に、前記スライス群パラメータセットのシンタックス構造のビットストリーム順序および所定の番号付け方式を用いて、前記スライス群パラメータセットのシンタックス構造を識別させる。
前記装置の実施形態によっては、前記少なくとも1つのメモリおよび前記メモリに格納されるコードは、前記少なくとも1つのプロセッサによって実行されると、前記装置に更に、次の少なくとも1つから、前記スライス群パラメータセットに対するシンタックス要素セットを形成させる:
スケーラブルレイヤおよび/または他のスケーラブル特性を示すシンタックス要素;
ビューおよび/または他のマルチビュー特性を示すシンタックス要素;
マルチビュービデオの特定のコンポーネントタイプに関連するシンタックス要素;
アクセスユニット識別情報に関連するシンタックス要素;
復号順序に関連するシンタックス要素;
出力順序に関連するシンタックス要素;
アクセスユニットの全スライスに対して不変である他のシンタックス要素に関連するシンタックス要素;
ビューコンポーネントの全スライスで不変であるシンタックス要素;
リファレンスピクチャ・リスト変更に関連するシンタックス要素;
使用されるリファレンスピクチャのセットに関連するシンタックス要素;
復号リファレンスピクチャ・マーキングに関連するシンタックス要素;
加重予測用の予測重みテーブルに関連するシンタックス要素;
デブロッキング・フィルタリングを制御するシンタックス要素;
適応ループフィルタリングを制御するシンタックス要素;
サンプル適応オフセットを制御するシンタックス要素。
前記装置の実施形態によっては、前記少なくとも1つのメモリおよび前記メモリに格納されるコードは、前記少なくとも1つのプロセッサによって実行されると、前記装置に更に、前記スライス群パラメータセットを符号化するとき、次の1つ以上を遂行させる:
前記シンタックス要素をスライス群パラメータセットのシンタックス構造に符号化すること;
前記シンタックス要素セットを参照によってスライス群パラメータセットに含めること;
前記シンタックス要素セットが前記スライス群パラメータセットにないことを標示すること。
前記装置の実施形態によっては、前記少なくとも1つのメモリおよび前記メモリに格納されるコードは、前記少なくとも1つのプロセッサによって実行されると、前記装置に更に、スケーラブルレイヤに関連するシンタックス要素セットを前記スライス群パラメータセットに含めることと;ビューコンポーネントの全スライスで不変であるシンタックス要素を前記スライス群パラメータセットに含めることを遂行させる。
前記装置の実施形態によっては、前記少なくとも1つのメモリおよび前記メモリに格納されるコードは、前記少なくとも1つのプロセッサによって実行されると、前記装置に更に、リファレンスピクチャ・リストの変更に関連するシンタックス要素を参照または包含によって前記スライス群パラメータセットのシンタックス構造に含めること、または前記スライス群パラメータセットのシンタックス構造から不在にすることを遂行させる。
前記装置の実施形態によっては、前記少なくとも1つのメモリおよび前記メモリに格納されるコードは、前記少なくとも1つのプロセッサによって実行されると、前記装置に更に、スライス群パラメータセットをネットワーク抽象化層ユニットとして符号化させる。
前記装置の実施形態によっては、前記少なくとも1つのメモリおよび前記メモリに格納されるコードは、前記少なくとも1つのプロセッサによって実行されると、前記装置に更に、ビットストリームにおけるスライス群パラメータセットのネットワーク抽象化層(NAL)ユニットを符号化スライスNALユニットと共に符号化させる。
第3の実施例によれば、1つ以上の命令の1つ以上のシーケンスを含むコンピュータプログラム製品が提供される。前記1つ以上の命令の1つ以上のシーケンスは、1つ以上のプロセッサによって実行されると、装置に少なくとも次のこと:
・ 符号化ピクチャが含むスライスに対するシンタックス要素を第1のセットおよび第2のセットに分類することと;
・ 前記第1のセットおよび前記第2のセットに対するシンタックス要素値を決定することと;
・ 第1のスライス群パラメータセットまたはスライスヘッダにおいて前記第1のセットを選択的に符号化することであって、次のこと:
* 別のスライス群パラメータセットから前記関連する第1のセットの包含の標示情報を提供することと;
* 前記第1のセットのシンタックス要素値を符号化することと;
* 前記両方を省略すること
の何れか1つを含む、前記符号化することと;
・ 第2のスライス群パラメータセットまたはスライスヘッダにおいて前記第2のセットを選択的に符号化することであって、次のこと:
* 別のスライス群パラメータセットから前記関連する第2のセットの包含の標示情報を提供することと;
* 前記第2のセットのシンタックス要素値を符号化することと;
* 前記両方を省略すること
の何れか1つを含む、前記符号化すること
を遂行させる。
実施形態によっては、前記コンピュータプログラム製品は1つ以上の命令の1つ以上のシーケンスを含み、前記1つ以上の命令の1つ以上のシーケンスは、1つ以上のプロセッサによって実行されると、前記装置に更に、前記スライス群パラメータセットにシンタックス要素のサブセットを少なくとも1つ含めさせる。
実施形態によっては、前記コンピュータプログラム製品は1つ以上の命令の1つ以上のシーケンスを含み、前記1つ以上の命令の1つ以上のシーケンスは、1つ以上のプロセッサによって実行されると、前記装置に更に、符号化済みまたは復号済みであるか、ビットストリームに既存の他のシンタックス構造から前記スライス群パラメータセットの内容またはインスタンスを推定させる。
実施形態によっては、前記コンピュータプログラム製品は1つ以上の命令の1つ以上のシーケンスを含み、前記1つ以上の命令の1つ以上のシーケンスは、1つ以上のプロセッサによって実行されると、前記装置に更に、ベースビューのテクスチャビューコンポーネントのスライスヘッダから前記スライス群パラメータセットを形成させる。
実施形態によっては、前記コンピュータプログラム製品は1つ以上の命令の1つ以上のシーケンスを含み、前記1つ以上の命令の1つ以上のシーケンスは、1つ以上のプロセッサによって実行されると、前記装置に更に、前記推定されたスライス群パラメータセットに対する識別値を作成させる。
前記コンピュータプログラム製品の実施形態によっては、スライス群パラメータセットは、それに関連する特定のアクセスユニット内で有効である。
実施形態によっては、前記コンピュータプログラム製品は1つ以上の命令の1つ以上のシーケンスを含み、前記1つ以上の命令の1つ以上のシーケンスは、1つ以上のプロセッサによって実行されると、前記装置に更に、前記スライス群パラメータセットのシンタックス構造を、特定のアクセスユニットに関するネットワーク抽象化層ユニットシーケンスに含ませる。ここで、前記シーケンスは復号順またはビットストリームの順で、前記スライス群パラメータセットはその出現位置から前記アクセスユニットの最後まで有効である。
前記コンピュータプログラム製品の実施形態によっては、前記スライス群パラメータセットは、複数のアクセスユニットに対して有効である。
実施形態によっては、前記コンピュータプログラム製品は1つ以上の命令の1つ以上のシーケンスを含み、前記1つ以上の命令の1つ以上のシーケンスは、1つ以上のプロセッサによって実行されると、前記装置に更に、1つのアクセスユニットに対して複数のスライス群パラメータセットを符号化させる。
実施形態によっては、前記コンピュータプログラム製品は1つ以上の命令の1つ以上のシーケンスを含み、前記1つ以上の命令の1つ以上のシーケンスは、1つ以上のプロセッサによって実行されると、前記装置に更に、スライスヘッダにおけるシンタックス要素値の少なくとも1つのサブセットであって符号化されるサブセットが、後続のスライスヘッダにあるのと同一であるかを決定することと;そうである場合、ビットストリームにおいて前記スライス群パラメータセットを符号化することを遂行させる。
実施形態によっては、前記コンピュータプログラム製品は1つ以上の命令の1つ以上のシーケンスを含み、前記1つ以上の命令の1つ以上のシーケンスは、1つ以上のプロセッサによって実行されると、前記装置に更に、前記スライス群パラメータセットのシンタックス構造に識別子を含ませる。
実施形態によっては、前記コンピュータプログラム製品は1つ以上の命令の1つ以上のシーケンスを含み、前記1つ以上の命令の1つ以上のシーケンスは、1つ以上のプロセッサによって実行されると、前記装置に更に、スライス群パラメータセットの特定のインスタンスを参照するために前記識別子を使用させる。
実施形態によっては、前記コンピュータプログラム製品は1つ以上の命令の1つ以上のシーケンスを含み、前記1つ以上の命令の1つ以上のシーケンスは、1つ以上のプロセッサによって実行されると、前記装置に更に、スライスヘッダまたは別のスライス群パラメータセットから前記スライス群パラメータセットを参照するために、前記識別子を使用させる。
実施形態によっては、前記コンピュータプログラム製品は1つ以上の命令の1つ以上のシーケンスを含み、前記1つ以上の命令の1つ以上のシーケンスは、1つ以上のプロセッサによって実行されると、前記装置に更に、前記識別子に対して所定の番号付け空間を使用させる。
実施形態によっては、前記コンピュータプログラム製品は1つ以上の命令の1つ以上のシーケンスを含み、前記1つ以上の命令の1つ以上のシーケンスは、1つ以上のプロセッサによって実行されると、前記装置に更に、第1のスライス群パラメータセットに対して特定のスライス群パラメータセット識別値を使用することと、前記第1のスライス群パラメータセットがスライスヘッダまたはスライス群パラメータセットの何れによっても参照されない場合、第2のスライス群パラメータセットに対して前記スライス群パラメータセット識別値を使用することを遂行させる。
実施形態によっては、前記コンピュータプログラム製品は1つ以上の命令の1つ以上のシーケンスを含み、前記1つ以上の命令の1つ以上のシーケンスは、1つ以上のプロセッサによって実行されると、前記装置に更に、ビットストリーム内で前記スライス群パラメータセットのシンタックス構造を反復させる。
実施形態によっては、前記コンピュータプログラム製品は1つ以上の命令の1つ以上のシーケンスを含み、前記1つ以上の命令の1つ以上のシーケンスは、1つ以上のプロセッサによって実行されると、前記装置に更に、前記スライス群パラメータセットのシンタックス構造のビットストリーム順序および所定の番号付け方式を用いて、前記スライス群パラメータセットのシンタックス構造を識別させる。
実施形態によっては、前記コンピュータプログラム製品は1つ以上の命令の1つ以上のシーケンスを含み、前記1つ以上の命令の1つ以上のシーケンスは、1つ以上のプロセッサによって実行されると、前記装置に更に、次の少なくとも1つから、前記スライス群パラメータセットに対するシンタックス要素セットを形成させる:
スケーラブルレイヤおよび/または他のスケーラブル特性を示すシンタックス要素;
ビューおよび/または他のマルチビュー特性を示すシンタックス要素;
マルチビュービデオの特定のコンポーネントタイプに関連するシンタックス要素;
アクセスユニット識別情報に関連するシンタックス要素;
復号順序に関連するシンタックス要素;
出力順序に関連するシンタックス要素;
アクセスユニットの全スライスに対して不変である他のシンタックス要素に関連するシンタックス要素;
ビューコンポーネントの全スライスで不変であるシンタックス要素;
リファレンスピクチャ・リスト変更に関連するシンタックス要素;
使用されるリファレンスピクチャのセットに関連するシンタックス要素;
復号リファレンスピクチャ・マーキングに関連するシンタックス要素;
加重予測用の予測重みテーブルに関連するシンタックス要素;
デブロッキング・フィルタリングを制御するシンタックス要素;
適応ループフィルタリングを制御するシンタックス要素;
サンプル適応オフセットを制御するシンタックス要素。
実施形態によっては、前記コンピュータプログラム製品は1つ以上の命令の1つ以上のシーケンスを含み、前記1つ以上の命令の1つ以上のシーケンスは、1つ以上のプロセッサによって実行されると、前記装置に更に、前記スライス群パラメータセットを符号化するとき、次の1つ以上を遂行させる:
前記シンタックス要素をスライス群パラメータセットのシンタックス構造に符号化すること;
前記シンタックス要素セットを参照によってスライス群パラメータセットに含めること;
前記シンタックス要素セットが前記スライス群パラメータセットにないことを標示すること。
実施形態によっては、前記コンピュータプログラム製品は1つ以上の命令の1つ以上のシーケンスを含み、前記1つ以上の命令の1つ以上のシーケンスは、1つ以上のプロセッサによって実行されると、前記装置に更に、スケーラブルレイヤに関連するシンタックス要素セットを前記スライス群パラメータセットに含めることと;ビューコンポーネントの全スライスで不変であるシンタックス要素を前記スライス群パラメータセットに含めることを遂行させる。
実施形態によっては、前記コンピュータプログラム製品は1つ以上の命令の1つ以上のシーケンスを含み、前記1つ以上の命令の1つ以上のシーケンスは、1つ以上のプロセッサによって実行されると、前記装置に更に、リファレンスピクチャ・リストの変更に関連するシンタックス要素を参照または包含によって前記スライス群パラメータセットのシンタックス構造に含めること、または前記スライス群パラメータセットのシンタックス構造から不在にすることを遂行させる。
実施形態によっては、前記コンピュータプログラム製品は1つ以上の命令の1つ以上のシーケンスを含み、前記1つ以上の命令の1つ以上のシーケンスは、1つ以上のプロセッサによって実行されると、前記装置に更に、スライス群パラメータセットをネットワーク抽象化層ユニットとして符号化させる。
実施形態によっては、前記コンピュータプログラム製品は1つ以上の命令の1つ以上のシーケンスを含み、前記1つ以上の命令の1つ以上のシーケンスは、1つ以上のプロセッサによって実行されると、前記装置に更に、ビットストリームにおけるスライス群パラメータセットのネットワーク抽象化層(NAL)ユニットを符号化スライスNALユニットと共に符号化させる。
第4の実施例によれば、次の装置が提供され、この装置は、
・ 符号化ピクチャが含むスライスに対するシンタックス要素を第1のセットおよび第2のセットに分類する手段と;
・ 前記第1のセットおよび前記第2のセットに対するシンタックス要素値を決定する手段と;
・ 第1のスライス群パラメータセットまたはスライスヘッダにおいて前記第1のセットを選択的に符号化する手段であって、前記符号化する手段は次のこと:
* 別のスライス群パラメータセットから前記関連する第1のセットの包含の標示情報を提供することと;
* 前記第1のセットのシンタックス要素値を符号化することと;
* 前記両方を省略すること
の何れか1つを含む、前記符号化する手段と;
・ 第2のスライス群パラメータセットまたはスライスヘッダにおいて前記第2のセットを選択的に符号化する手段であって、前記符号化する手段は次のこと:
* 別のスライス群パラメータセットから前記関連する第2のセットの包含の標示情報を提供することと;
* 前記第2のセットのシンタックス要素値を符号化することと;
* 前記両方を省略すること
の何れか1つを含む、前記符号化する手段
を備える。
第5の実施例によれば、次の方法が提供され、この方法は、符号化ピクチャの符号化スライスを復号することを含み、前記復号することは、
・ 前記符号化スライスをスライスヘッダまたはスライス群パラメータセットの何れかに復号するために使用される、第1のシンタックス要素セットにおける第1の位置および第2のシンタックス要素セットにおける第2の位置を識別することと;
・ 前記符号化スライスの復号用に使用されるように、前記第1のシンタックス要素セットおよび前記第2のシンタックス要素セットを復号することを含み、該第1および第2のセットを復号することは:
* 第3のスライス群パラメータセットから前記関連する第1のセットの包含を示す第1の標示情報を復号し、前記第3のスライス群パラメータセットを示す前記第1の標示情報への応答として、前記第3のスライス群パラメータセットから前記関連する第1のシンタックス要素セットを復号することと;
* 第4のスライス群パラメータセットから前記関連する第2のセットの包含を示す第2の標示情報を復号し、前記第4のスライス群パラメータセットを示す前記第2の標示情報への応答として、前記第4のスライス群パラメータセットから前記関連する第2のシンタックス要素セットを復号することと;
* 前記復号された第1のシンタックス要素セットおよび第2のシンタックス要素セットを用いて、前記符号化スライスを復号すること
を含む。
実施形態によっては、前記要素は、前記第1の標示情報が前記第3のスライス群パラメータセットを示さない場合、前記第1のセットのシンタックス要素を復号することを含む。
実施形態によっては、前記要素は、前記第2の標示情報が前記第4のスライス群パラメータセットを示さない場合、前記第2のセットのシンタックス要素を復号することを含む。
第6の実施例によれば、少なくとも1つのプロセッサと、コンピュータプログラムコードを含む少なくとも1つのメモリとを備える装置が提供される。前記少なくとも1つのメモリおよび前記コンピュータプログラムコードは、前記少なくとも1つのプロセッサを用いて、前記装置に:
符号化ピクチャの符号化スライスを復号させるように構成され、前記復号することは、
・ 前記符号化スライスをスライスヘッダまたはスライス群パラメータセットの何れかに復号するために使用される、第1のシンタックス要素セットにおける第1の位置および第2のシンタックス要素セットにおける第2の位置を識別することと;
・ 前記符号化スライスの復号用に使用されるように、前記第1のシンタックス要素セットおよび前記第2のシンタックス要素セットを復号することによって遂行され、該第1および第2のセットを復号することは:
* 第3のスライス群パラメータセットから前記関連する第1のセットの包含を示す第1の標示情報を復号し、前記第3のスライス群パラメータセットを示す前記第1の標示情報への応答として、前記第3のスライス群パラメータセットから前記関連する第1のシンタックス要素セットを復号することと;
* 第4のスライス群パラメータセットから前記関連する第2のセットの包含を示す第2の標示情報を復号し、前記第4のスライス群パラメータセットを示す前記第2の標示情報への応答として、前記第4のスライス群パラメータセットから前記関連する第2のシンタックス要素セットを復号することと;
* 前記復号された第1のシンタックス要素セットおよび第2のシンタックス要素セットを用いて、前記符号化スライスを復号すること
を含む。
前記装置の実施形態によっては、前記少なくとも1つのメモリおよび前記メモリに格納されるコードは、前記少なくとも1つのプロセッサによって実行されると、前記装置に更に、前記第1の標示情報が前記第3のスライス群パラメータセットを示さない場合、前記第1のセットのシンタックス要素を復号させる。
前記装置の実施形態によっては、前記少なくとも1つのメモリおよび前記メモリに格納されるコードは、前記少なくとも1つのプロセッサによって実行されると、前記装置に更に、前記第2の標示情報が前記第4のスライス群パラメータセットを示さない場合、前記第2のセットのシンタックス要素を復号させる。
第7の実施例によれば、1つ以上の命令の1つ以上のシーケンスを含むコンピュータプログラム製品が提供される。前記1つ以上の命令の1つ以上のシーケンスは、1つ以上のプロセッサによって実行されると、装置に少なくとも、
符号化ピクチャの符号化スライスを復号させ、ここで、前記復号することは、
・ 前記符号化スライスをスライスヘッダまたはスライス群パラメータセットの何れかに復号するために使用される、第1のシンタックス要素セットにおける第1の位置および第2のシンタックス要素セットにおける第2の位置を識別することと;
・ 前記符号化スライスの復号用に使用されるように、前記第1のシンタックス要素セットおよび前記第2のシンタックス要素セットを復号することによって遂行され、該第1および第2のセットを復号することは:
* 第3のスライス群パラメータセットから前記関連する第1のセットの包含を示す第1の標示情報を復号し、前記第3のスライス群パラメータセットを示す前記第1の標示情報への応答として、前記第3のスライス群パラメータセットから前記関連する第1のシンタックス要素セットを復号することと;
* 第4のスライス群パラメータセットから前記関連する第2のセットの包含を示す第2の標示情報を復号し、前記第4のスライス群パラメータセットを示す前記第2の標示情報への応答として、前記第4のスライス群パラメータセットから前記関連する第2のシンタックス要素セットを復号することと;
* 前記復号された第1のシンタックス要素セットおよび第2のシンタックス要素セットを用いて、前記符号化スライスを復号すること
を含む。
実施形態によっては、前記コンピュータプログラム製品は1つ以上の命令の1つ以上のシーケンスを含み、前記1つ以上の命令の1つ以上のシーケンスは、1つ以上のプロセッサによって実行されると、前記装置に、前記第1の標示情報が前記第3のスライス群パラメータセットを示さない場合、前記第1のセットのシンタックス要素を復号させる。
実施形態によっては、前記コンピュータプログラム製品は1つ以上の命令の1つ以上のシーケンスを含み、前記1つ以上の命令の1つ以上のシーケンスは、1つ以上のプロセッサによって実行されると、前記装置に、前記第2の標示情報が前記第4のスライス群パラメータセットを示さない場合、前記第2のセットのシンタックス要素を復号させる。
第8の実施例によれば、次の方法が提供され、この方法は、
符号化ピクチャの符号化スライスを復号することを含み、前記復号することは、
・ 前記符号化スライスをスライスヘッダまたはスライス群パラメータセットの何れかに復号するために使用される、第1のシンタックス要素セットにおける第1の位置および第2のシンタックス要素セットにおける第2の位置を識別することと;
・ 前記符号化スライスの復号用に使用されるように、前記第1のシンタックス要素セットおよび前記第2のシンタックス要素セットを復号することによって遂行され、該第1および第2のセットを復号することは:
* 第3のスライス群パラメータセットから前記関連する第1のセットの包含を示す第1の標示情報を復号し、前記第3のスライス群パラメータセットを示す前記第1の標示情報への応答として、前記第3のスライス群パラメータセットから前記関連する第1のシンタックス要素セットを復号すること、または、前記第1の標示情報が前記第3のスライス群パラメータセットを示さない場合、前記第1のセットのシンタックス要素を復号することと;
* 第4のスライス群パラメータセットから前記関連する第2のセットの包含を示す第2の標示情報を復号し、前記第4のスライス群パラメータセットを示す前記第2の標示情報への応答として、前記第4のスライス群パラメータセットから前記関連する第2のシンタックス要素セットを復号すること、または、前記第2の標示情報が前記第4のスライス群パラメータセットを示さない場合、前記第2のセットのシンタックス要素を復号することと;
* 前記復号された第1のシンタックス要素セットおよび第2のシンタックス要素セットを用いて、前記符号化スライスを復号すること
を含む。
実施形態によっては、前記スライス群パラメータセットからシンタックス要素のサブセットを少なくとも1つ復号することを、前記方法が含む。
実施形態によっては、前記方法は、符号化済みまたは復号済みであるか、ビットストリームに既存の他のシンタックス構造から前記スライス群パラメータセットの内容またはインスタンスを推定することを含む。
実施形態によっては、前記方法は、前記推定されたスライス群パラメータセットを示す識別値を復号することを含む。
前記方法の実施形態によっては、スライス群パラメータセットは、それに関連する特定のアクセスユニット内で有効である。
前記方法の実施形態によっては、前記スライス群パラメータセットのシンタックス構造は、特定のアクセスユニットに関するネットワーク抽象化層ユニットシーケンスに含まれ、前記シーケンスは復号順またはビットストリームの順で、前記スライス群パラメータセットはその出現位置から前記アクセスユニットの最後まで有効である。
前記方法の実施形態によっては、前記スライス群パラメータセットは、複数のアクセスユニットに対して有効である。
実施形態によっては、前記方法は、1つのアクセスユニットに対して複数のスライス群パラメータセットを復号することを含む。
前記方法の実施形態によっては、前記スライス群パラメータセットのシンタックス構造が識別子を含む。
実施形態によっては、前記方法は、スライス群パラメータセットの特定のインスタンスを参照するために前記識別子を用いることを含む。
実施形態によっては、前記方法は、スライスヘッダまたは別のスライス群パラメータセットから前記スライス群パラメータセットを参照するために、前記識別子を用いることを含む。
前記方法の実施形態によっては、前記識別子に対して所定の番号付け空間が使用される。
実施形態によっては、前記方法は、第1のスライス群パラメータセットに対して特定のスライス群パラメータセット識別値を使用することと、前記第1のスライス群パラメータセットがスライスヘッダまたはスライス群パラメータセットの何れによっても参照されない場合、第2のスライス群パラメータセットに対して前記スライス群パラメータセット識別値を使用することを含む。
実施形態によっては、前記方法は、ビットストリームから反復してスライス群パラメータセットのシンタックス構造を復号することを含む。
実施形態によっては、前記方法は、前記スライス群パラメータセットのシンタックス構造のビットストリーム順序および所定の番号付け方式を用いて、前記スライス群パラメータセットのシンタックス構造を識別することを含む。
実施形態によっては、前記方法は、次の少なくとも1つを取得するために、前記スライス群パラメータセットに対するシンタックス要素セットを復号することを含む:
スケーラブルレイヤおよび/または他のスケーラブル特性を示すシンタックス要素;
ビューおよび/または他のマルチビュー特性を示すシンタックス要素;
マルチビュービデオの特定のコンポーネントタイプに関連するシンタックス要素;
アクセスユニット識別情報に関連するシンタックス要素;
復号順序に関連するシンタックス要素;
出力順序に関連するシンタックス要素;
アクセスユニットの全スライスに対して不変である他のシンタックス要素に関連するシンタックス要素;
ビューコンポーネントの全スライスで不変であるシンタックス要素;
リファレンスピクチャ・リスト変更に関連するシンタックス要素;
使用されるリファレンスピクチャのセットに関連するシンタックス要素;
復号リファレンスピクチャ・マーキングに関連するシンタックス要素;
加重予測用の予測重みテーブルに関連するシンタックス要素;
デブロッキング・フィルタリングを制御するシンタックス要素;
適応ループフィルタリングを制御するシンタックス要素;
サンプル適応オフセットを制御するシンタックス要素。
実施形態によっては、前記要素は、前記スライス群パラメータセットを復号するとき、次の1つ以上を含む:
スライス群パラメータセットのシンタックス構造から前記シンタックス要素を復号すること;
前記シンタックス要素セットが前記スライス群パラメータセットへの参照によって包含されていたかを決定すること;
前記シンタックス要素セットが前記スライス群パラメータセットにないことが標示されているかを決定すること。
実施形態によっては、前記方法は、前記スライス群パラメータセットからスケーラブルレイヤに関連するシンタックス要素セットを復号することと;前記スライス群パラメータセットからビューコンポーネントの全スライスで不変であるシンタックス要素を復号することを含む。
実施形態によっては、前記方法は、リファレンスピクチャ・リストの変更に関連するシンタックス要素が、参照または包含によって前記スライス群パラメータセットのシンタックス構造に含まれているか、または前記スライス群パラメータセットのシンタックス構造に存在しないかを決定することを含む。
実施形態によっては、前記方法は、ネットワーク抽象化層ユニットからスライス群パラメータセットを復号することを含む。
実施形態によっては、前記方法は、ビットストリームからスライス群パラメータセットのネットワーク抽象化層(NAL)ユニットを符号化スライスNALユニットと共に復号することを含む。
第9の実施例によれば、少なくとも1つのプロセッサと、コンピュータプログラムコードを含む少なくとも1つのメモリとを備える装置が提供される。前記少なくとも1つのメモリおよび前記コンピュータプログラムコードは、前記少なくとも1つのプロセッサを用いて、前記装置に:
符号化ピクチャの符号化スライスを復号させ、ここで、前記復号することは、
・ 前記符号化スライスをスライスヘッダまたはスライス群パラメータセットの何れかに復号するために使用される、第1のシンタックス要素セットにおける第1の位置および第2のシンタックス要素セットにおける第2の位置を識別することと;
・ 前記符号化スライスの復号用に使用されるように、前記第1のシンタックス要素セットおよび前記第2のシンタックス要素セットを復号することによって遂行され、該第1および第2のセットを復号することは:
* 第3のスライス群パラメータセットから前記関連する第1のセットの包含を示す第1の標示情報を復号し、前記第3のスライス群パラメータセットを示す前記第1の標示情報への応答として、前記第3のスライス群パラメータセットから前記関連する第1のシンタックス要素セットを復号すること、または、前記第1の標示情報が前記第3のスライス群パラメータセットを示さない場合、前記第1のセットのシンタックス要素を復号することと;
* 第4のスライス群パラメータセットから前記関連する第2のセットの包含を示す第2の標示情報を復号し、前記第4のスライス群パラメータセットを示す前記第2の標示情報への応答として、前記第4のスライス群パラメータセットから前記関連する第2のシンタックス要素セットを復号すること、または、前記第2の標示情報が前記第4のスライス群パラメータセットを示さない場合、前記第2のセットのシンタックス要素を復号することと;
* 前記復号された第1のシンタックス要素セットおよび第2のシンタックス要素セットを用いて、前記符号化スライスを復号すること
を含む。
前記装置の実施形態によっては、前記少なくとも1つのメモリおよび前記メモリに格納されるコードは、前記少なくとも1つのプロセッサによって実行されると、前記装置に更に、前記スライス群パラメータセットからシンタックス要素のサブセットを少なくとも1つ復号させる。
前記装置の実施形態によっては、前記少なくとも1つのメモリおよび前記メモリに格納されるコードは、前記少なくとも1つのプロセッサによって実行されると、前記装置に更に、符号化済みまたは復号済みであるか、ビットストリームに既存の他のシンタックス構造から前記スライス群パラメータセットの内容またはインスタンスを推定させる。
前記装置の実施形態によっては、前記少なくとも1つのメモリおよび前記メモリに格納されるコードは、前記少なくとも1つのプロセッサによって実行されると、前記装置に更に、前記推定されたスライス群パラメータセットを示す識別値を復号させる。
前記装置の実施形態によっては、スライス群パラメータセットは、それに関連する特定のアクセスユニット内で有効である。
前記装置の実施形態によっては、前記スライス群パラメータセットのシンタックス構造は、特定のアクセスユニットに関するネットワーク抽象化層ユニットシーケンスに含まれ、前記シーケンスは復号順またはビットストリームの順で、前記スライス群パラメータセットはその出現位置から前記アクセスユニットの最後まで有効である。
前記装置の実施形態によっては、前記スライス群パラメータセットは、複数のアクセスユニットに対して有効である。
前記装置の実施形態によっては、前記少なくとも1つのメモリおよび前記メモリに格納されるコードは、前記少なくとも1つのプロセッサによって実行されると、前記装置に更に、1つのアクセスユニットに対して複数のスライス群パラメータセットを復号させる。
前記装置の実施形態によっては、前記スライス群パラメータセットのシンタックス構造が識別子を含む。
前記装置の実施形態によっては、前記少なくとも1つのメモリおよび前記メモリに格納されるコードは、前記少なくとも1つのプロセッサによって実行されると、前記装置に更に、スライス群パラメータセットの特定のインスタンスを参照するために前記識別子を使用させる。
前記装置の実施形態によっては、前記少なくとも1つのメモリおよび前記メモリに格納されるコードは、前記少なくとも1つのプロセッサによって実行されると、前記装置に更に、スライスヘッダまたは別のスライス群パラメータセットから前記スライス群パラメータセットを参照するために、前記識別子を使用させる。
前記装置の実施形態によっては、前記識別子に対して所定の番号付け空間が使用される。
前記装置の実施形態によっては、前記少なくとも1つのメモリおよび前記メモリに格納されるコードは、前記少なくとも1つのプロセッサによって実行されると、前記装置に更に、第1のスライス群パラメータセットに対して特定のスライス群パラメータセット識別値を使用することと、前記第1のスライス群パラメータセットがスライスヘッダまたはスライス群パラメータセットの何れによっても参照されない場合、第2のスライス群パラメータセットに対して前記スライス群パラメータセット識別値を使用することを遂行させる。
前記装置の実施形態によっては、前記少なくとも1つのメモリおよび前記メモリに格納されるコードは、前記少なくとも1つのプロセッサによって実行されると、前記装置に更に、ビットストリームから反復してスライス群パラメータセットのシンタックス構造を復号させる。
前記装置の実施形態によっては、前記少なくとも1つのメモリおよび前記メモリに格納されるコードは、前記少なくとも1つのプロセッサによって実行されると、前記装置に更に、前記スライス群パラメータセットのシンタックス構造のビットストリーム順序および所定の番号付け方式を用いて、前記スライス群パラメータセットのシンタックス構造を識別させる。
前記装置の実施形態によっては、前記少なくとも1つのメモリおよび前記メモリに格納されるコードは、前記少なくとも1つのプロセッサによって実行されると、前記装置に更に、次の少なくとも1つを取得するために、前記スライス群パラメータセットに対するシンタックス要素セットを復号させる:
スケーラブルレイヤおよび/または他のスケーラブル特性を示すシンタックス要素;
ビューおよび/または他のマルチビュー特性を示すシンタックス要素;
マルチビュービデオの特定のコンポーネントタイプに関連するシンタックス要素;
アクセスユニット識別情報に関連するシンタックス要素;
復号順序に関連するシンタックス要素;
出力順序に関連するシンタックス要素;
アクセスユニットの全スライスに対して不変である他のシンタックス要素に関連するシンタックス要素;
ビューコンポーネントの全スライスで不変であるシンタックス要素;
リファレンスピクチャ・リスト変更に関連するシンタックス要素;
使用されるリファレンスピクチャのセットに関連するシンタックス要素;
復号リファレンスピクチャ・マーキングに関連するシンタックス要素;
加重予測用の予測重みテーブルに関連するシンタックス要素;
デブロッキング・フィルタリングを制御するシンタックス要素;
適応ループフィルタリングを制御するシンタックス要素;
サンプル適応オフセットを制御するシンタックス要素。
前記装置の実施形態によっては、前記少なくとも1つのメモリおよび前記メモリに格納されるコードは、前記少なくとも1つのプロセッサによって実行されると、前記装置に更に、前記スライス群パラメータセットを復号するとき、次の1つ以上を遂行させる:
スライス群パラメータセットのシンタックス構造から前記シンタックス要素を復号すること;
前記シンタックス要素セットが前記スライス群パラメータセットへの参照によって包含されていたかを決定すること;
前記シンタックス要素セットが前記スライス群パラメータセットにないことが標示されているかを決定すること。
前記装置の実施形態によっては、前記少なくとも1つのメモリおよび前記メモリに格納されるコードは、前記少なくとも1つのプロセッサによって実行されると、前記装置に更に、前記スライス群パラメータセットからスケーラブルレイヤに関連するシンタックス要素セットを復号することと;前記スライス群パラメータセットからビューコンポーネントの全スライスで不変であるシンタックス要素を復号することを遂行させる。
前記装置の実施形態によっては、前記少なくとも1つのメモリおよび前記メモリに格納されるコードは、前記少なくとも1つのプロセッサによって実行されると、前記装置に更に、リファレンスピクチャ・リストの変更に関連するシンタックス要素が、参照または包含によって前記スライス群パラメータセットのシンタックス構造に含まれているか、または前記スライス群パラメータセットのシンタックス構造に存在しないかを決定させる。
前記装置の実施形態によっては、前記少なくとも1つのメモリおよび前記メモリに格納されるコードは、前記少なくとも1つのプロセッサによって実行されると、前記装置に更に、ネットワーク抽象化層ユニットからスライス群パラメータセットを復号させる。
前記装置の実施形態によっては、前記少なくとも1つのメモリおよび前記メモリに格納されるコードは、前記少なくとも1つのプロセッサによって実行されると、前記装置に更に、ビットストリームからスライス群パラメータセットのネットワーク抽象化層(NAL)ユニットを符号化スライスNALユニットと共に復号させる。
第10の実施例によれば、1つ以上の命令の1つ以上のシーケンスを含むコンピュータプログラム製品が提供される。前記1つ以上の命令の1つ以上のシーケンスは、1つ以上のプロセッサによって実行されると、装置に少なくとも、
符号化ピクチャの符号化スライスを復号させ、ここで、前記復号することは、
・ 前記符号化スライスをスライスヘッダまたはスライス群パラメータセットの何れかに復号するために使用される、第1のシンタックス要素セットにおける第1の位置および第2のシンタックス要素セットにおける第2の位置を識別することと;
・ 前記符号化スライスの復号用に使用されるように、前記第1のシンタックス要素セットおよび前記第2のシンタックス要素セットを復号することによって遂行され、該第1および第2のセットを復号することは:
* 第3のスライス群パラメータセットから前記関連する第1のセットの包含を示す第1の標示情報を復号し、前記第3のスライス群パラメータセットを示す前記第1の標示情報への応答として、前記第3のスライス群パラメータセットから前記関連する第1のシンタックス要素セットを復号すること、または、前記第1の標示情報が前記第3のスライス群パラメータセットを示さない場合、前記第1のセットのシンタックス要素を復号することと;
* 第4のスライス群パラメータセットから前記関連する第2のセットの包含を示す第2の標示情報を復号し、前記第4のスライス群パラメータセットを示す前記第2の標示情報への応答として、前記第4のスライス群パラメータセットから前記関連する第2のシンタックス要素セットを復号すること、または、前記第2の標示情報が前記第4のスライス群パラメータセットを示さない場合、前記第2のセットのシンタックス要素を復号することと;
* 前記復号された第1のシンタックス要素セットおよび第2のシンタックス要素セットを用いて、前記符号化スライスを復号すること
を含む。
実施形態によっては、前記コンピュータプログラム製品は1つ以上の命令の1つ以上のシーケンスを含み、前記1つ以上の命令の1つ以上のシーケンスは、1つ以上のプロセッサによって実行されると、前記装置に、前記スライス群パラメータセットからシンタックス要素のサブセットを少なくとも1つ復号させる。
実施形態によっては、前記コンピュータプログラム製品は1つ以上の命令の1つ以上のシーケンスを含み、前記1つ以上の命令の1つ以上のシーケンスは、1つ以上のプロセッサによって実行されると、前記装置に、符号化済みまたは復号済みであるか、ビットストリームに既存の他のシンタックス構造から前記スライス群パラメータセットの内容またはインスタンスを推定させる。
実施形態によっては、前記コンピュータプログラム製品は1つ以上の命令の1つ以上のシーケンスを含み、前記1つ以上の命令の1つ以上のシーケンスは、1つ以上のプロセッサによって実行されると、前記装置に、前記推定されたスライス群パラメータセットを示す識別値を復号させる。
前記コンピュータプログラム製品の実施形態によっては、スライス群パラメータセットは、それに関連する特定のアクセスユニット内で有効である。
前記コンピュータプログラム製品の実施形態によっては、前記スライス群パラメータセットのシンタックス構造は、特定のアクセスユニットに関するネットワーク抽象化層ユニットシーケンスに含まれ、前記シーケンスは復号順またはビットストリームの順で、前記スライス群パラメータセットはその出現位置から前記アクセスユニットの最後まで有効である。
前記コンピュータプログラム製品の実施形態によっては、前記スライス群パラメータセットは、複数のアクセスユニットに対して有効である。
実施形態によっては、前記コンピュータプログラム製品は1つ以上の命令の1つ以上のシーケンスを含み、前記1つ以上の命令の1つ以上のシーケンスは、1つ以上のプロセッサによって実行されると、前記装置に、1つのアクセスユニットに対して複数のスライス群パラメータセットを復号させる。
前記コンピュータプログラム製品の実施形態によっては、前記スライス群パラメータセットのシンタックス構造が識別子を含む。
実施形態によっては、前記コンピュータプログラム製品は1つ以上の命令の1つ以上のシーケンスを含み、前記1つ以上の命令の1つ以上のシーケンスは、1つ以上のプロセッサによって実行されると、前記装置に、スライス群パラメータセットの特定のインスタンスを参照するために前記識別子を使用させる。
実施形態によっては、前記コンピュータプログラム製品は1つ以上の命令の1つ以上のシーケンスを含み、前記1つ以上の命令の1つ以上のシーケンスは、1つ以上のプロセッサによって実行されると、前記装置に、スライスヘッダまたは別のスライス群パラメータセットから前記スライス群パラメータセットを参照するために、前記識別子を使用させる。
前記コンピュータプログラム製品の実施形態によっては、前記識別子に対して所定の番号付け空間が使用される。
実施形態によっては、前記コンピュータプログラム製品は1つ以上の命令の1つ以上のシーケンスを含み、前記1つ以上の命令の1つ以上のシーケンスは、1つ以上のプロセッサによって実行されると、前記装置に、第1のスライス群パラメータセットに対して特定のスライス群パラメータセット識別値を使用することと、前記第1のスライス群パラメータセットがスライスヘッダまたはスライス群パラメータセットの何れによっても参照されない場合、第2のスライス群パラメータセットに対して前記スライス群パラメータセット識別値を使用することを遂行させる。
実施形態によっては、前記コンピュータプログラム製品は1つ以上の命令の1つ以上のシーケンスを含み、前記1つ以上の命令の1つ以上のシーケンスは、1つ以上のプロセッサによって実行されると、ビットストリームから反復してスライス群パラメータセットのシンタックス構造を復号させる。
実施形態によっては、前記コンピュータプログラム製品は1つ以上の命令の1つ以上のシーケンスを含み、前記1つ以上の命令の1つ以上のシーケンスは、1つ以上のプロセッサによって実行されると、前記装置に、前記スライス群パラメータセットのシンタックス構造のビットストリーム順序および所定の番号付け方式を用いて、前記スライス群パラメータセットのシンタックス構造を識別させる。
実施形態によっては、前記コンピュータプログラム製品は1つ以上の命令の1つ以上のシーケンスを含み、前記1つ以上の命令の1つ以上のシーケンスは、1つ以上のプロセッサによって実行されると、前記装置に、次の少なくとも1つを取得するために、前記スライス群パラメータセットに対するシンタックス要素セットを復号させる:
スケーラブルレイヤおよび/または他のスケーラブル特性を示すシンタックス要素;
ビューおよび/または他のマルチビュー特性を示すシンタックス要素;
マルチビュービデオの特定のコンポーネントタイプに関連するシンタックス要素;
アクセスユニット識別情報に関連するシンタックス要素;
復号順序に関連するシンタックス要素;
出力順序に関連するシンタックス要素;
アクセスユニットの全スライスに対して不変である他のシンタックス要素に関連するシンタックス要素;
ビューコンポーネントの全スライスで不変であるシンタックス要素;
リファレンスピクチャ・リスト変更に関連するシンタックス要素;
使用されるリファレンスピクチャのセットに関連するシンタックス要素;
復号リファレンスピクチャ・マーキングに関連するシンタックス要素;
加重予測用の予測重みテーブルに関連するシンタックス要素;
デブロッキング・フィルタリングを制御するシンタックス要素;
適応ループフィルタリングを制御するシンタックス要素;
サンプル適応オフセットを制御するシンタックス要素。
実施形態によっては、前記コンピュータプログラム製品は1つ以上の命令の1つ以上のシーケンスを含み、前記1つ以上の命令の1つ以上のシーケンスは、1つ以上のプロセッサによって実行されると、前記装置に、前記スライス群パラメータセットを復号するとき、次の1つ以上を遂行させる:
スライス群パラメータセットのシンタックス構造から前記シンタックス要素を復号すること;
前記シンタックス要素セットが前記スライス群パラメータセットへの参照によって包含されていたかを決定すること;
前記シンタックス要素セットが前記スライス群パラメータセットにないことが標示されているかを決定すること。
実施形態によっては、前記コンピュータプログラム製品は1つ以上の命令の1つ以上のシーケンスを含み、前記1つ以上の命令の1つ以上のシーケンスは、1つ以上のプロセッサによって実行されると、前記装置に、前記スライス群パラメータセットからスケーラブルレイヤに関連するシンタックス要素セットを復号することと;前記スライス群パラメータセットからビューコンポーネントの全スライスで不変であるシンタックス要素を復号することを遂行させる。
実施形態によっては、前記コンピュータプログラム製品は1つ以上の命令の1つ以上のシーケンスを含み、前記1つ以上の命令の1つ以上のシーケンスは、1つ以上のプロセッサによって実行されると、前記装置に、リファレンスピクチャ・リストの変更に関連するシンタックス要素が、参照または包含によって前記スライス群パラメータセットのシンタックス構造に含まれているか、または前記スライス群パラメータセットのシンタックス構造に存在しないかを決定させる。
実施形態によっては、前記コンピュータプログラム製品は1つ以上の命令の1つ以上のシーケンスを含み、前記1つ以上の命令の1つ以上のシーケンスは、1つ以上のプロセッサによって実行されると、前記装置に、ネットワーク抽象化層ユニットからスライス群パラメータセットを復号させる。
実施形態によっては、前記コンピュータプログラム製品は1つ以上の命令の1つ以上のシーケンスを含み、前記1つ以上の命令の1つ以上のシーケンスは、1つ以上のプロセッサによって実行されると、前記装置に、ビットストリームからスライス群パラメータセットのネットワーク抽象化層(NAL)ユニットを符号化スライスNALユニットと共に復号させる。
第11の実施例によれば、次の方法が提供され、この方法は、符号化ピクチャの符号化スライスを復号する手段を備え、前記復号する手段は、
・ 前記符号化スライスをスライス群パラメータセットのスライスヘッダの1つに復号するために使用される、第1のシンタックス要素セットにおける第1の位置および第2のシンタックス要素セットにおける第2の位置を識別する手段と;
・ 前記符号化スライスの復号用に使用されるように、前記第1のシンタックス要素セットおよび前記第2のシンタックス要素セットを復号する手段を備え、該第1および第2のセットを復号する手段は:
* 第3のスライス群パラメータセットから前記関連する第1のセットの包含を示す第1の標示情報を復号し、前記第3のスライス群パラメータセットを示す前記第1の標示情報への応答として、前記第3のスライス群パラメータセットから前記関連する第1のシンタックス要素セットを復号すること、または、前記第1の標示情報が前記第3のスライス群パラメータセットを示さない場合、前記第1のセットのシンタックス要素を復号する手段と;
* 第4のスライス群パラメータセットから前記関連する第2のセットの包含を示す第2の標示情報を復号し、前記第4のスライス群パラメータセットを示す前記第2の標示情報への応答として、前記第4のスライス群パラメータセットから前記関連する第2のシンタックス要素セットを復号すること、または、前記第2の標示情報が前記第4のスライス群パラメータセットを示さない場合、前記第2のセットのシンタックス要素を復号する手段と;
* 前記復号された第1のシンタックス要素セットおよび第2のシンタックス要素セットを用いて、前記符号化スライスを復号する手段
を備える。

Claims (18)

  1. テクスチャビューコンポーネントおよび深度ビューコンポーネントを含む3次元(3D)ビデオコンテンツを符号化する方法であって、
    非圧縮ピクチャを前記テクスチャビューコンポーネントの符号化スライスおよび前記深度ビューコンポーネントの符号化スライスを含む符号化ピクチャに符号化することを含む方法であって、前記符号化することは:
    前記深度ビューコンポーネントに関して、シンタックス要素のセットに対するシンタックス要素値を決定することと;
    スライス群パラメータセットまたは前記深度ビューコンポーネントのスライスのスライスヘッダにおいて、前記シンタックス要素値を選択的に符号化することと;
    前記深度ビューコンポーネントのスライスのスライスヘッダに標示情報を提供することであって、前記標示情報は、前記シンタックス要素値前記スライス群パラメータセットから推定されるものであるあるいは、前記深度ビューコンポーネントのスライスのスライスヘッダに含まれるかを示す、前記提供することと;
    を含み、前記スライス群パラメータセットは関連する特定のアクセスユニット内で有効で、前記スライス群パラメータセットのシンタックス構造は、特定のアクセスユニットに関するネットワーク抽象化層ユニットシーケンスに含まれ、前記シーケンスは復号順またはビットストリームの順で、前記スライス群パラメータセットはその出現位置から前記アクセスユニットの最後まで有効である
    方法。
  2. 前記テクスチャビューコンポーネントのスライスのスライスヘッダから前記スライス群パラメータセットを形成することを更に含む、請求項1に記載の方法。
  3. 前記深度ビューコンポーネントのスライスとして、同一ビューの別のスライスのスライスヘッダから、前記スライス群パラメータセットを形成することを更に含む、請求項1に記載の方法。
  4. 次の少なくとも1つから、前記スライス群パラメータセットに対するシンタックス要素セットを形成することを含む、請求項1からの何れかに記載の方法:
    スケーラブルレイヤおよび/または他のスケーラブル特性を示すシンタックス要素;
    ビューおよび/または他のマルチビュー特性を示すシンタックス要素;
    マルチビュービデオの特定のコンポーネントタイプに関連するシンタックス要素;
    アクセスユニット識別情報に関連するシンタックス要素;
    復号順序に関連するシンタックス要素;
    出力順序に関連するシンタックス要素;
    アクセスユニットの全スライスに対して不変である他のシンタックス要素に関連するシンタックス要素;
    ビューコンポーネントの全スライスで不変であるシンタックス要素;
    リファレンスピクチャ・リスト変更に関連するシンタックス要素;
    使用されるリファレンスピクチャのセットに関連するシンタックス要素;
    復号リファレンスピクチャ・マーキングに関連するシンタックス要素;
    加重予測用の予測重みテーブルに関連するシンタックス要素;
    デブロッキング・フィルタリングを制御するシンタックス要素;
    適応ループフィルタリングを制御するシンタックス要素;
    サンプル適応オフセットを制御するシンタックス要素。
  5. テクスチャビューコンポーネントおよび深度ビューコンポーネントを含む3次元(3D)ビデオコンテンツを符号化する装置であって、
    非圧縮ピクチャを前記テクスチャビューコンポーネントの符号化スライスおよび前記深度ビューコンポーネントの符号化スライスを含む符号化ピクチャに符号化する手段を備え、前記符号化する手段は:
    前記深度ビューコンポーネントに関して、シンタックス要素のセットに対するシンタックス要素値を決定する手段と;
    スライス群パラメータセットまたは前記深度ビューコンポーネントのスライスのスライスヘッダにおいて、前記シンタックス要素値を選択的に符号化する手段と;
    前記深度ビューコンポーネントのスライスのスライスヘッダに標示情報を提供する手段であって、前記標示情報は、前記シンタックス要素値前記スライス群パラメータセットから推定されるものであるあるいは、前記深度ビューコンポーネントのスライスのスライスヘッダに含まれるかを示す、前記提供する手段と;
    を備え、前記スライス群パラメータセットは関連する特定のアクセスユニット内で有効で、前記スライス群パラメータセットのシンタックス構造は、特定のアクセスユニットに関するネットワーク抽象化層ユニットシーケンスに含まれ、前記シーケンスは復号順またはビットストリームの順で、前記スライス群パラメータセットはその出現位置から前記アクセスユニットの最後まで有効である
    装置。
  6. 前記テクスチャビューコンポーネントのスライスのスライスヘッダから前記スライス群パラメータセットを形成する手段を更に備える、請求項に記載の装置。
  7. 前記深度ビューコンポーネントのスライスとして、同一ビューの別のスライスのスライスヘッダから、前記スライス群パラメータセットを形成する手段を更に備える、請求項に記載の装置。
  8. 次の少なくとも1つから、前記スライス群パラメータセットに対するシンタックス要素セットを形成する手段を更に備える、請求項からの何れかに記載の方法:
    スケーラブルレイヤおよび/または他のスケーラブル特性を示すシンタックス要素;
    ビューおよび/または他のマルチビュー特性を示すシンタックス要素;
    マルチビュービデオの特定のコンポーネントタイプに関連するシンタックス要素;
    アクセスユニット識別情報に関連するシンタックス要素;
    復号順序に関連するシンタックス要素;
    出力順序に関連するシンタックス要素;
    アクセスユニットの全スライスに対して不変である他のシンタックス要素に関連するシンタックス要素;
    ビューコンポーネントの全スライスで不変であるシンタックス要素;
    リファレンスピクチャ・リスト変更に関連するシンタックス要素;
    使用されるリファレンスピクチャのセットに関連するシンタックス要素;
    復号リファレンスピクチャ・マーキングに関連するシンタックス要素;
    加重予測用の予測重みテーブルに関連するシンタックス要素;
    デブロッキング・フィルタリングを制御するシンタックス要素;
    適応ループフィルタリングを制御するシンタックス要素;
    サンプル適応オフセットを制御するシンタックス要素。
  9. 処理手段によって実行されると、請求項1からの何れかに記載の方法を装置に遂行させるように構成されたプログラム命令を含む、コンピュータプログラム。
  10. テクスチャビューコンポーネントおよび深度ビューコンポーネントを含む符号化3次元(3D)ビデオコンテンツを復号する方法であって、
    前記深度ビューコンポーネントの符号化スライスを復号することと;
    前記深度ビューコンポーネントの符号化スライスを前記深度ビューコンポーネントのスライスのスライスヘッダまたはスライス群パラメータセットの何れかに復号するために使用される、シンタックス要素セットの位置を解析することと;
    前記深度ビューコンポーネントのスライスのスライスヘッダから標示情報を復号することであって、前記標示情報は、前記シンタックス要素のセットに対するシンタックス要素値が前記スライス群パラメータセットから推定されるものであるか、あるいは、前記深度ビューコンポーネントのスライスのスライスヘッダに含まれるかを示す、前記復号することと;
    前記シンタックス要素値が前記深度ビューコンポーネントのスライスのスライスヘッダに含まれることを示す前記標示情報に応答して、前記深度ビューコンポーネントのスライスのスライスヘッダから前記シンタックス要素値を復号することと、そうでない場合には、前記スライス群パラメータセットから前記シンタックス要素値を予測することと;
    前記復号されたシンタックス要素値を用いて、前記深度ビューコンポーネントの符号化スライスを復号することと;
    を含み、前記スライス群パラメータセットは関連する特定のアクセスユニット内で有効で、前記スライス群パラメータセットのシンタックス構造は、特定のアクセスユニットに関するネットワーク抽象化層ユニットシーケンスに含まれ、前記シーケンスは復号順またはビットストリームの順で、前記スライス群パラメータセットはその出現位置から前記アクセスユニットの最後まで有効である
    方法。
  11. 前記テクスチャビューコンポーネントのスライスのスライスヘッダから前記スライス群パラメータセットを形成することを更に含む、請求項10に記載の方法。
  12. 前記深度ビューコンポーネントのスライスとして、同一ビューの別のスライスのスライスヘッダから、前記スライス群パラメータセットを形成することを更に含む、請求項10に記載の方法。
  13. 次の少なくとも1つから、前記スライス群パラメータセットに対するシンタックス要素セットを形成することを含む、請求項10から12の何れかに記載の方法:
    スケーラブルレイヤおよび/または他のスケーラブル特性を示すシンタックス要素;
    ビューおよび/または他のマルチビュー特性を示すシンタックス要素;
    マルチビュービデオの特定のコンポーネントタイプに関連するシンタックス要素;
    アクセスユニット識別情報に関連するシンタックス要素;
    復号順序に関連するシンタックス要素;
    出力順序に関連するシンタックス要素;
    アクセスユニットの全スライスに対して不変である他のシンタックス要素に関連するシンタックス要素;
    ビューコンポーネントの全スライスで不変であるシンタックス要素;
    リファレンスピクチャ・リスト変更に関連するシンタックス要素;
    使用されるリファレンスピクチャのセットに関連するシンタックス要素;
    復号リファレンスピクチャ・マーキングに関連するシンタックス要素;
    加重予測用の予測重みテーブルに関連するシンタックス要素;
    デブロッキング・フィルタリングを制御するシンタックス要素;
    適応ループフィルタリングを制御するシンタックス要素;
    サンプル適応オフセットを制御するシンタックス要素。
  14. テクスチャビューコンポーネントおよび深度ビューコンポーネントを含む符号化3次元(3D)ビデオコンテンツを復号する装置であって、
    前記深度ビューコンポーネントの符号化スライスを復号する手段と;
    前記深度ビューコンポーネントの符号化スライスを前記深度ビューコンポーネントのスライスのスライスヘッダまたはスライス群パラメータセットの何れかに復号するために使用される、シンタックス要素セットの位置を解析する手段と;
    前記深度ビューコンポーネントのスライスのスライスヘッダから標示情報を復号する手段であって、前記標示情報は、前記シンタックス要素のセットに対するシンタックス要素値が前記スライス群パラメータセットから推定されるものであるか、あるいは、前記深度ビューコンポーネントのスライスのスライスヘッダに含まれるかを示す、前記復号する手段と;
    前記シンタックス要素値が前記深度ビューコンポーネントのスライスのスライスヘッダに含まれることを示す前記標示情報に応答して、前記深度ビューコンポーネントのスライスのスライスヘッダから前記シンタックス要素値を復号することと、そうでない場合には、前記スライス群パラメータセットから前記シンタックス要素値を予測する手段と;
    前記復号されたシンタックス要素値を用いて、前記深度ビューコンポーネントの符号化スライスを復号する手段と;
    を備え、前記スライス群パラメータセットは関連する特定のアクセスユニット内で有効で、前記スライス群パラメータセットのシンタックス構造は、特定のアクセスユニットに関するネットワーク抽象化層ユニットシーケンスに含まれ、前記シーケンスは復号順またはビットストリームの順で、前記スライス群パラメータセットはその出現位置から前記アクセスユニットの最後まで有効である
    装置。
  15. 前記テクスチャビューコンポーネントのスライスのスライスヘッダから前記スライス群パラメータセットを形成する手段を更に備える、請求項14に記載の装置。
  16. 前記深度ビューコンポーネントのスライスとして、同一ビューの別のスライスのスライスヘッダから、前記スライス群パラメータセットを形成する手段を更に備える、請求項14に記載の装置。
  17. 次の少なくとも1つから、前記スライス群パラメータセットに対するシンタックス要素セットを形成する手段を更に備える、請求項14から16の何れかに記載の方法:
    スケーラブルレイヤおよび/または他のスケーラブル特性を示すシンタックス要素;
    ビューおよび/または他のマルチビュー特性を示すシンタックス要素;
    マルチビュービデオの特定のコンポーネントタイプに関連するシンタックス要素;
    アクセスユニット識別情報に関連するシンタックス要素;
    復号順序に関連するシンタックス要素;
    出力順序に関連するシンタックス要素;
    アクセスユニットの全スライスに対して不変である他のシンタックス要素に関連するシンタックス要素;
    ビューコンポーネントの全スライスで不変であるシンタックス要素;
    リファレンスピクチャ・リスト変更に関連するシンタックス要素;
    使用されるリファレンスピクチャのセットに関連するシンタックス要素;
    復号リファレンスピクチャ・マーキングに関連するシンタックス要素;
    加重予測用の予測重みテーブルに関連するシンタックス要素;
    デブロッキング・フィルタリングを制御するシンタックス要素;
    適応ループフィルタリングを制御するシンタックス要素;
    サンプル適応オフセットを制御するシンタックス要素。
  18. 処理手段によって実行されると、請求項10から13の何れかに記載の方法を装置に遂行させるように構成されたプログラム命令を含む、コンピュータプログラム。
JP2014555275A 2012-02-01 2013-01-31 ビデオ符号化方法および装置 Active JP5947405B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201261593519P 2012-02-01 2012-02-01
US61/593,519 2012-02-01
PCT/FI2013/050103 WO2013113997A1 (en) 2012-02-01 2013-01-31 Method and apparatus for video coding

Publications (3)

Publication Number Publication Date
JP2015509345A JP2015509345A (ja) 2015-03-26
JP2015509345A5 JP2015509345A5 (ja) 2015-06-11
JP5947405B2 true JP5947405B2 (ja) 2016-07-06

Family

ID=48869870

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014555275A Active JP5947405B2 (ja) 2012-02-01 2013-01-31 ビデオ符号化方法および装置

Country Status (9)

Country Link
US (2) US9479775B2 (ja)
EP (1) EP2810443B1 (ja)
JP (1) JP5947405B2 (ja)
KR (1) KR101669524B1 (ja)
CN (1) CN104205819B (ja)
BR (1) BR112014018856B1 (ja)
CA (1) CA2863131C (ja)
SG (1) SG11201404509QA (ja)
WO (1) WO2013113997A1 (ja)

Families Citing this family (72)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11496760B2 (en) 2011-07-22 2022-11-08 Qualcomm Incorporated Slice header prediction for depth maps in three-dimensional video codecs
US9521418B2 (en) * 2011-07-22 2016-12-13 Qualcomm Incorporated Slice header three-dimensional video extension for slice header prediction
US9288505B2 (en) 2011-08-11 2016-03-15 Qualcomm Incorporated Three-dimensional video with asymmetric spatial resolution
US9485503B2 (en) 2011-11-18 2016-11-01 Qualcomm Incorporated Inside view motion prediction among texture and depth view components
JP2013198059A (ja) * 2012-03-22 2013-09-30 Sharp Corp 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法およびプログラム
WO2013162454A1 (en) * 2012-04-24 2013-10-31 Telefonaktiebolaget L M Ericsson (Publ) Identifying a parameter set for decoding a multi-layer video representation
US9813705B2 (en) 2012-04-26 2017-11-07 Qualcomm Incorporated Parameter set coding
US9332269B2 (en) * 2012-06-27 2016-05-03 Broadcom Corporation Slice overhead coding
EP3079363B1 (en) * 2012-06-29 2017-09-27 Telefonaktiebolaget LM Ericsson (publ) Encoding and decoding video sequences comprising reference picture sets
US9686542B2 (en) 2012-09-05 2017-06-20 Qualcomm Incorporated Network abstraction layer header design
US9491461B2 (en) 2012-09-27 2016-11-08 Qualcomm Incorporated Scalable extensions to HEVC and temporal motion vector prediction
US9380307B2 (en) 2012-11-19 2016-06-28 Qualcomm Incorporated Method and system for intra base layer (BL) transform in video coding
US9648319B2 (en) 2012-12-12 2017-05-09 Qualcomm Incorporated Device and method for scalable coding of video information based on high efficiency video coding
US10021388B2 (en) 2012-12-26 2018-07-10 Electronics And Telecommunications Research Institute Video encoding and decoding method and apparatus using the same
US9584808B2 (en) * 2013-02-22 2017-02-28 Qualcomm Incorporated Device and method for scalable coding of video information
US9294776B2 (en) 2013-03-05 2016-03-22 Qualcomm Incorporated Parallel processing for video coding
US9516306B2 (en) * 2013-03-27 2016-12-06 Qualcomm Incorporated Depth coding modes signaling of depth data for 3D-HEVC
US20140301436A1 (en) * 2013-04-05 2014-10-09 Qualcomm Incorporated Cross-layer alignment in multi-layer video coding
KR102233965B1 (ko) * 2013-07-01 2021-03-30 삼성전자주식회사 필터링을 수반한 비디오 부호화 및 복호화 방법 및 그 장치
US9906768B2 (en) * 2013-07-26 2018-02-27 Qualcomm Incorporated Use of a depth condition in 3DV codec
EP3056004A2 (en) * 2013-10-11 2016-08-17 VID SCALE, Inc. High level syntax for hevc extensions
US9854270B2 (en) * 2013-12-19 2017-12-26 Qualcomm Incorporated Device and method for scalable coding of video information
EP3090558A4 (en) 2014-01-03 2017-08-16 Nokia Technologies OY Parameter set coding
JP2015136057A (ja) * 2014-01-17 2015-07-27 ソニー株式会社 通信装置、通信データ生成方法、および通信データ処理方法
JP2015136060A (ja) * 2014-01-17 2015-07-27 ソニー株式会社 通信装置、通信データ生成方法、および通信データ処理方法
FR3018417B1 (fr) * 2014-03-04 2017-07-28 Sagemcom Broadband Sas Procede de modification d'un flux video binaire.
FR3029381A1 (fr) * 2014-11-27 2016-06-03 Orange Procede de composition d’une representation video intermediaire
US10370060B2 (en) * 2015-10-30 2019-08-06 Shimano Inc. Bicycle electrical component assembly
GB2547442B (en) * 2016-02-17 2022-01-12 V Nova Int Ltd Physical adapter, signal processing equipment, methods and computer programs
CN116962687A (zh) * 2016-11-29 2023-10-27 成均馆大学校产学协力团 影像编码/解码方法、装置以及对比特流进行存储的记录介质
CN108616748A (zh) * 2017-01-06 2018-10-02 科通环宇(北京)科技有限公司 一种码流及其封装方法、解码方法及装置
CN106878753B (zh) * 2017-02-16 2020-04-28 南京理工大学 一种使用纹理平滑信息的3d视频残差编码模式选择方法
EP3489900A1 (en) * 2017-11-23 2019-05-29 Thomson Licensing Method, apparatus and stream for encoding/decoding volumetric video
KR102503743B1 (ko) * 2018-04-11 2023-02-28 삼성전자주식회사 이미지 처리 장치 및 방법
US11451773B2 (en) * 2018-06-01 2022-09-20 Qualcomm Incorporated Block-based adaptive loop filter (ALF) design and signaling
WO2020003274A1 (en) 2018-06-29 2020-01-02 Beijing Bytedance Network Technology Co., Ltd. Checking order of motion candidates in lut
EP3794825A1 (en) 2018-06-29 2021-03-24 Beijing Bytedance Network Technology Co. Ltd. Update of look up table: fifo, constrained fifo
TWI752331B (zh) 2018-06-29 2022-01-11 大陸商北京字節跳動網絡技術有限公司 當向Merge/AMVP添加HMVP候選時的部分/完全修剪
MX2020013828A (es) * 2018-06-29 2021-03-25 Beijing Bytedance Network Tech Co Ltd Interaccion entre lut y amvp.
CN110662057B (zh) 2018-06-29 2022-06-21 北京字节跳动网络技术有限公司 视频处理方法、装置、设备以及存储比特流的方法
CN110662051B (zh) 2018-06-29 2022-06-07 北京字节跳动网络技术有限公司 来自多个查找表(lut)的选择
JP7137008B2 (ja) 2018-06-29 2022-09-13 北京字節跳動網絡技術有限公司 1つまたは複数のルックアップテーブルを使用して、以前コーディングされた動き情報を順に記憶させてそれらを後続のブロックのコーディングに使用する概念
EP3794824A1 (en) 2018-06-29 2021-03-24 Beijing Bytedance Network Technology Co. Ltd. Conditions for updating luts
TWI734133B (zh) 2018-07-02 2021-07-21 大陸商北京字節跳動網絡技術有限公司 更新查找表的規則
US11064196B2 (en) * 2018-09-03 2021-07-13 Qualcomm Incorporated Parametrizable, quantization-noise aware bilateral filter for video coding
CN111064961B (zh) 2018-09-12 2023-06-09 北京字节跳动网络技术有限公司 视频处理方法和装置
AU2019368125B2 (en) 2018-10-27 2023-02-23 Huawei Technologies Co., Ltd. Separate merge list for subblock merge candidates and intra-inter techniques harmonization for video coding
US11051017B2 (en) 2018-12-20 2021-06-29 Qualcomm Incorporated Adaptive loop filter (ALF) index signaling
CN113273186A (zh) 2019-01-10 2021-08-17 北京字节跳动网络技术有限公司 Lut更新的调用
WO2020143824A1 (en) 2019-01-13 2020-07-16 Beijing Bytedance Network Technology Co., Ltd. Interaction between lut and shared merge list
WO2020147773A1 (en) 2019-01-16 2020-07-23 Beijing Bytedance Network Technology Co., Ltd. Inserting order of motion candidates in lut
SG11202107760PA (en) 2019-02-01 2021-08-30 Beijing Bytedance Network Technology Co Ltd Signaling of in-loop reshaping information using parameter sets
WO2020156533A1 (en) 2019-02-01 2020-08-06 Beijing Bytedance Network Technology Co., Ltd. Interactions between in-loop reshaping and palette mode
WO2020184673A1 (ja) * 2019-03-12 2020-09-17 ソニー株式会社 画像復号装置、画像復号方法、画像符号化装置、および画像符号化方法
US11516468B2 (en) 2019-03-12 2022-11-29 Sony Group Corporation Image decoding device, image decoding method, image encoding device, and image encoding method
CN113574889B (zh) 2019-03-14 2024-01-12 北京字节跳动网络技术有限公司 环路整形信息的信令和语法
WO2020192611A1 (en) 2019-03-22 2020-10-01 Beijing Bytedance Network Technology Co., Ltd. Interaction between merge list construction and other tools
JP7417624B2 (ja) 2019-03-23 2024-01-18 北京字節跳動網絡技術有限公司 適応ループフィルタリングパラメータセットに対する制限
KR20210122863A (ko) * 2019-04-15 2021-10-12 엘지전자 주식회사 스케일링 리스트 데이터의 시그널링 기반 비디오 또는 영상 코딩
JP7403245B2 (ja) * 2019-06-21 2023-12-22 キヤノン株式会社 画像復号装置、画像復号方法
EP3987803A1 (en) * 2019-06-24 2022-04-27 InterDigital VC Holdings, Inc. Method and apparatus for signaling decoding data using high level syntax elements
GB2608679B (en) * 2019-08-23 2024-02-21 Imagination Tech Ltd Methods and decompression units for decompressing a compressed block of image data
US11535339B2 (en) * 2019-08-30 2022-12-27 Shimano Inc. Bicycle derailleur
WO2021054720A1 (ko) * 2019-09-16 2021-03-25 엘지전자 주식회사 가중 예측을 이용한 영상 부호화/복호화 방법, 장치 및 비트스트림을 전송하는 방법
US11758193B2 (en) * 2019-11-04 2023-09-12 Hfi Innovation Inc. Signaling high-level information in video and image coding
KR102192631B1 (ko) * 2019-11-28 2020-12-17 주식회사우경정보기술 병렬 포렌식 마킹 장치 및 방법
US11902584B2 (en) 2019-12-19 2024-02-13 Tencent America LLC Signaling of picture header parameters
KR20220119675A (ko) 2020-01-09 2022-08-30 텔레폰악티에볼라겟엘엠에릭슨(펍) 화상 헤더 존재
WO2021195588A1 (en) * 2020-03-26 2021-09-30 Alibaba Group Holding Limited Methods and apparatuses for signaling picture header
US11516514B2 (en) * 2020-03-27 2022-11-29 Tencent America LLC High level control for deblocking operations
CN112468818B (zh) * 2021-01-22 2021-06-29 腾讯科技(深圳)有限公司 视频通信的实现方法及装置、介质和电子设备
EP4113996A1 (en) * 2021-06-30 2023-01-04 Panasonic Intellectual Property Corporation of America Encoding mergable bitstreams with subpictures

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004248124A (ja) 2003-02-17 2004-09-02 Nippon Telegr & Teleph Corp <Ntt> 階層的画像符号化装置および階層的画像復号装置
US7586924B2 (en) * 2004-02-27 2009-09-08 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding an information signal into a data stream, converting the data stream and decoding the data stream
KR20080028361A (ko) * 2005-05-03 2008-03-31 뮤추얼 파마슈티컬 컴퍼니 아이엔씨. 퀴닌-함유 제어-방출형 제제
MY152568A (en) * 2005-10-12 2014-10-31 Thomson Licensing Region of interest h.264 scalable video coding
EP2135454A4 (en) 2007-03-02 2010-09-01 Lg Electronics Inc METHOD AND DEVICE FOR DECODING / CODING A VIDEO SIGNAL
BRPI0815108A2 (pt) * 2007-08-15 2015-01-27 Thomson Licensing Métodos e aparelho para modo de avanço de movimento em vídeo codificado de multi-visitas com o uso de vetores de disparidade regional
US8938009B2 (en) * 2007-10-12 2015-01-20 Qualcomm Incorporated Layered encoded bitstream structure
KR20100105877A (ko) 2008-01-11 2010-09-30 톰슨 라이센싱 비디오 및 깊이 코딩
KR20090089960A (ko) * 2008-02-20 2009-08-25 엘지전자 주식회사 초고해상도 영상 인코딩 및 디코딩 방법 및 장치
WO2009136681A1 (en) * 2008-05-08 2009-11-12 Lg Electronics Inc. Method for encoding and decoding image, and apparatus for displaying image
CN101374243B (zh) * 2008-07-29 2010-06-23 宁波大学 一种应用于3dtv与ftv***的深度图编码压缩方法
CN102257818B (zh) * 2008-10-17 2014-10-29 诺基亚公司 3d视频编码中运动向量的共享
JP2010157821A (ja) * 2008-12-26 2010-07-15 Victor Co Of Japan Ltd 画像符号化装置、画像符号化方法およびそのプログラム
KR20120013966A (ko) * 2009-05-01 2012-02-15 톰슨 라이센싱 3dv를 위한 기준 화상 리스트
US9591320B2 (en) * 2010-07-15 2017-03-07 Texas Instruments Incorporated Context and bypass encoding video
CN102055982B (zh) * 2011-01-13 2012-06-27 浙江大学 三维视频编解码方法及装置
KR101830787B1 (ko) * 2011-07-12 2018-02-21 삼성전자 주식회사 수기로 작성된 메모 데이터 검색 방법 및 장치
US20130188013A1 (en) * 2011-07-22 2013-07-25 Qualcomm Incorporated Mvc based 3dvc codec supporting inside view motion prediction (ivmp) mode
US11496760B2 (en) * 2011-07-22 2022-11-08 Qualcomm Incorporated Slice header prediction for depth maps in three-dimensional video codecs
US9521418B2 (en) * 2011-07-22 2016-12-13 Qualcomm Incorporated Slice header three-dimensional video extension for slice header prediction
US20130188709A1 (en) * 2012-01-25 2013-07-25 Sachin G. Deshpande Video decoder for tiles with absolute signaling
TW201342884A (zh) 2012-01-31 2013-10-16 Sony Corp 編碼裝置及編碼方法、以及解碼裝置及解碼方法

Also Published As

Publication number Publication date
BR112014018856B1 (pt) 2022-09-20
BR112014018856A8 (pt) 2017-07-11
US9479775B2 (en) 2016-10-25
SG11201404509QA (en) 2014-08-28
US20170048550A1 (en) 2017-02-16
EP2810443A1 (en) 2014-12-10
KR101669524B1 (ko) 2016-11-09
BR112014018856A2 (ja) 2017-06-20
KR20140130152A (ko) 2014-11-07
EP2810443B1 (en) 2021-03-31
CN104205819B (zh) 2017-06-30
US10397610B2 (en) 2019-08-27
JP2015509345A (ja) 2015-03-26
EP2810443A4 (en) 2016-11-09
US20130194384A1 (en) 2013-08-01
CN104205819A (zh) 2014-12-10
WO2013113997A1 (en) 2013-08-08
CA2863131C (en) 2017-03-28
CA2863131A1 (en) 2013-08-08

Similar Documents

Publication Publication Date Title
JP5947405B2 (ja) ビデオ符号化方法および装置
US11818385B2 (en) Method and apparatus for video coding
US10511847B2 (en) Method and apparatus for video coding and decoding
JP6057395B2 (ja) ビデオ符号化方法および装置
JP5916266B2 (ja) ビデオコーディング方法および装置
JP6169273B2 (ja) ビデオ符号化・復号装置、方法及びコンピュータプログラム
KR101678321B1 (ko) 비디오 코딩을 위한 방법 및 장치
KR101658324B1 (ko) 비디오 코딩을 위한 방법 및 장치
AU2013210955B2 (en) Method for video coding and an apparatus, a computer-program product, a system, and a module for the same
JP2019075823A (ja) ビデオ符号化・復号装置、方法、及びコンピュータプログラム
US20140085415A1 (en) Method and apparatus for video coding
US20140092977A1 (en) Apparatus, a Method and a Computer Program for Video Coding and Decoding

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150413

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20151014

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151021

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20151112

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20160112

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20160217

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20160314

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160408

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160509

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160602

R150 Certificate of patent or registration of utility model

Ref document number: 5947405

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250