JP7506063B2 - ビデオ符号化および復号のための複数のコーディングユニットの中でグループ化するパラメータ - Google Patents

ビデオ符号化および復号のための複数のコーディングユニットの中でグループ化するパラメータ Download PDF

Info

Publication number
JP7506063B2
JP7506063B2 JP2021524145A JP2021524145A JP7506063B2 JP 7506063 B2 JP7506063 B2 JP 7506063B2 JP 2021524145 A JP2021524145 A JP 2021524145A JP 2021524145 A JP2021524145 A JP 2021524145A JP 7506063 B2 JP7506063 B2 JP 7506063B2
Authority
JP
Japan
Prior art keywords
coding
information
coding units
decoding
grouping
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021524145A
Other languages
English (en)
Other versions
JP2022506629A (ja
JPWO2020096848A5 (ja
Inventor
ル ルアンネック ファブリス
ポワリエ タンギ
ナセル カラム
Original Assignee
インターデイジタル ヴィーシー ホールディングス インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by インターデイジタル ヴィーシー ホールディングス インコーポレイテッド filed Critical インターデイジタル ヴィーシー ホールディングス インコーポレイテッド
Publication of JP2022506629A publication Critical patent/JP2022506629A/ja
Publication of JPWO2020096848A5 publication Critical patent/JPWO2020096848A5/ja
Application granted granted Critical
Publication of JP7506063B2 publication Critical patent/JP7506063B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/436Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本実施形態は概して、ビデオ符号化または復号のための方法および装置に関し、特に、複数のコーディングユニットがカレントブロックから分割され、同一の予測情報を有する複数のコーディングユニットが符号化または復号のために共にグループ化されるビデオの効率的な符号化および復号のための方法および装置に関する。
高い圧縮効率を達成するために、画像およびビデオコーディングスキームは通常、ビデオコンテンツにおける空間的冗長性および時間的冗長性を活用するために、予測コーディングおよび変換コーディングを採用する。一般的に、フレーム内相関またはフレーム間相関を利用するために、イントラ予測またはインター予測が使用され、次いで、予測誤差または予測残差と表わされることが多い、元のブロックと予測されたブロックとの間の差が変換され、量子化され、およびエントロピコーディングされる。ビデオを再構築するために、符号化に対応する逆の処理、例えば、予測、エントロピ復号、逆量子化、および逆変換によって圧縮されたデータが復号される。
ビデオ圧縮技術への直近の追加は、Versatile Video Coding(VVC)として知られる新たなビデオコーディング標準規格の開発の一部としてJoint Video Exploration Team(JVET)によって開発されている、様々なバージョンの参照ソフトウェアならびに/またはドキュメンテーションJoint Exploration Model (JEM)およびVVC(Versatile Video Coding)を含む。
少なくとも1つの実施形態の全体態様に従って、ビデオ符号化のための方法が提供され、方法は、複数のコーディングユニットにカレントブロックを分割するステップと、コーディングユニットの複数のグループに複数のコーディングユニットをグループ化するステップであって、コーディングユニットの複数のグループの各々のグループにおけるグループ化されたコーディングユニットは、同一の予測情報を有する、ステップと、コーディングユニットの複数のグループおよびそれぞれの同一の予測情報に基づいて、カレントブロックを符号化するステップと、を含む。
少なくとも1つの実施形態の全体態様に従って、ビデオ復号のための方法が提供され、方法は、カレントブロックから分割された複数のコーディングユニットに対応するコーディングユニットの複数のグループを取得するステップであって、コーディングユニットの複数のグループの各々のグループにグループ化されたコーディングユニットは、同一の予測情報を有する、ステップと、コーディングユニットの複数のグループおよびそれぞれの同一の予測情報に基づいて、カレントブロックを復号するステップと、を含む。
少なくとも1つの実施形態の全体態様に従って、ビデオ符号化のための装置が提供され、装置は、複数のコーディングユニットにカレントブロックを分割し、コーディングユニットの複数のグループに複数のコーディングユニットをグループ化し、コーディングユニットの複数のグループの各々のグループにおけるグループ化されたコーディングユニットは、同一の予測情報を有し、コーディングユニットの複数のグループおよびそれぞれの同一の予測情報に基づいて、カレントブロックを符号化する、ように構成された1つまたは複数のプロセッサを含む。
少なくとも1つの実施形態の別の全体態様に従って、ビデオ復号のための装置が提供され、装置は、カレントブロックから分割された複数のコーディングユニットに対応するコーディングユニットの複数のグループを取得し、コーディングユニットの複数のグループの各々のグループにグループ化されたコーディングユニットは、同一の予測情報を有し、コーディングユニットの複数のグループおよびそれぞれの同一の予測情報に基づいて、カレントブロックを復号する、ように構成された1つまたは複数のプロセッサを含む。
本開示に従った少なくとも1つの実施形態の全体態様に従って、ビデオ符号化のための装置が提供され、装置は、複数のコーディングユニットにカレントブロックを分割する手段と、コーディングユニットの複数のグループに複数のコーディングユニットをグループ化する手段であって、コーディングユニットの複数のグループの各々のグループにおけるグループ化されたコーディングユニットは、同一の予測情報を有する、手段と、コーディングユニットの複数のグループおよびそれぞれの同一の予測情報に基づいて、カレントブロックを符号化する手段と、を含む。
少なくとも1つの実施形態の全体態様に従って、ビデオ復号のための装置が提供され、装置は、カレントブロックから分割された複数のコーディングユニットに対応するコーディングユニットの複数のグループを取得する手段であって、コーディングユニットの複数のグループの各々のグループにグループ化されたコーディングユニットは、同一の予測情報を有する、手段と、コーディングユニットの複数のグループおよびそれぞれの同一の予測情報に基づいて、カレントブロックを復号する手段と、を含む。
少なくとも1つの実施形態の別の全体態様に従って、ビットストリームが提示され、ビットストリームは、複数のコーディングユニットにカレントブロックを分割し、コーディングユニットの複数のグループに複数のコーディングユニットをグループ化し、コーディングユニットの複数のグループの各々のグループにおけるグループ化されたコーディングユニットは、同一の予測情報を有し、コーディングユニットの複数のグループおよびそれぞれの同一の予測情報に基づいて、カレントブロックを符号化する、ことによって形成される。
本実施形態のうちの1つまたは複数はまた、本明細書で説明される1つまたは複数の態様および/または実施形態に従ってビデオデータを符号化または復号する命令を記憶したコンピュータ可読記憶媒体を提供する。
本実施形態はまた、本明細書で説明される1つまたは複数の態様および/または実施形態に従って生成されたビットストリームを記憶したコンピュータ可読記憶媒体を提供する。
本実施形態はまた、本明細書で説明される1つまたは複数の態様および/または実施形態に従って生成されたビットストリームを送信する方法および装置を提供する。
上述したことは、本開示のいくつかの態様の基本的な理解を提供するために、主題の簡易化された概要を提供する。実施形態の重要な/重大な要素を識別することも、主題の範囲を表現することも意図していない。その唯一の目的は、以下で提供されるより詳細な説明への前置きとして、主題のいくつかの概念を簡易化された形式で提示することである。
添付図面と共に以下の詳細な説明を考慮することによって、本開示をより良好に理解することができる。
ビデオエンコーダの実施形態の例のブロック図を示す。 ビデオデコーダの実施形態の例のブロック図を示す。 圧縮されたHEVCピクチャを表すためにコーディング木ユニット(CTU)およびコーディング木(CT)の概念を示す。 コーディングユニット(CU)、予測ユニット(PU)、および変換ユニット(TU)へのコーディング木ユニット(CTU)の分割を示す。 四分木プラス二分木(QTBT)CTU表現を示す。 CTUの拡張されたQTBT表現において使用することができるCU区画の集合の例を示す。 ピクチャの見本(example)を符号化するよう選択されたコーディング構造の例を示す。 HEVCコーデックにおけるQTBT+ABT(非対称二分木)コーディング構造の使用に起因したコーディング効率の増大を示す。 本明細書で説明されるような四分木分割シンタックス復号処理を示す。 本明細書で説明されるような多タイプ木シンタックスの復号処理の例を示す。 本明細書で説明されるようなコーディングユニットを復号および再構築する処理の例を示す。 本開示に従った少なくとも1つの実施形態の態様の様々な例を示す。 本開示に従った少なくとも1つの実施形態の態様の様々な例を示す。 本開示に従った少なくとも1つの実施形態の態様の様々な例を示す。 本開示に従った少なくとも1つの実施形態の態様の様々な例を示す。 本開示に従った少なくとも1つの実施形態の態様の様々な例を示す。 本開示に従った少なくとも1つの実施形態の態様の様々な例を示す。 CTUのコーディング木を選択するレート歪み最適化処理の例を示す。 本開示に従った少なくとも1つの実施形態の態様の別の例を示す。 仮想パイプライン復号ユニット(VPDU)に対する様々なコーディング木構成を示す。 本開示に従った予測データグループ化を使用する様々な例を示す。 本開示に従った予測データグループ化を使用する様々な例を示す。 本開示に従った様々な態様、実施形態、および特徴のうちの1つまたは複数を実装するために適切なシステムの例のブロック図を示す。
図面は様々な態様および実施形態の例を示す目的のためのものであり、唯一の可能な構成では必ずしもないことが理解されるべきである。様々な図面の全体を通じて、同一の参照符号は、同一または同様の特徴を指す。
ここで、図面に目を向けて、図1は、High Efficiency Video Coding(HEVC)エンコーダなどのビデオエンコーダ100の例を示す。図1はまた、HEVC標準規格に改良がなされたエンコーダ、またはVersatile Video Coding(VVC)として知られる新たなビデオコーディング標準規格の一部としてJVET(Joint Video Exploration Team)による開発の下のJEM(Joint Exploration Model)エンコーダなど、HEVCと同様の技術を採用したエンコーダを示す。
本出願では、用語「再構築される」および「復号される」は、相互に交換可能に使用されてもよく、用語「符号化される」または「コーディングされる」は、相互に交換可能に使用されてもよく、用語「画像」、「ピクチャ」、および「フレーム」は、相互に交換可能に使用されてもよい。通常、必ずしもそうではないが、用語「再構築される」は、エンコーダ側において使用され、用語「復号される」は、デコーダ側において使用される。
符号化される前、ビデオシーケンスは、圧縮に対してより弾力性がある信号分布を得るために(例えば、色成分の1つのヒストグラム均等化を使用して)、事前符号化処理(101)、例えば、入力色ピクチャに色変換を適用すること(例えば、RGB4:4:4からYCbCr4:2:0への変換)、または入力ピクチャ成分の再マッピングを実行することを受けてもよい。メタデータが事前処理と関連付けられてもよく、ビットストリームに付加されてもよい。
HEVCでは、1つまたは複数のピクチャを有するビデオシーケンスを符号化するために、ピクチャが1つまたは複数のスライスに区画化され(102)、各々のスライスは、1つまたは複数のスライスセグメントを含んでもよい。スライスセグメントは、コーディングユニット、予測ユニット、および変換ユニットに編成される。HEVC仕様は、「ブロック」と「ユニット」との間で区別し、「ブロック」は、サンプルアレイ内の特定のエリア(例えば、ルマ、Y)に対処し、「ユニット」は、ブロックと関連付けられた全ての符号化された色成分(Y、Cb、Cr、またはモノクロ)、シンタックス要素、および予測データの併置されたブロック(collocated block)(例えば、動きベクトル)を含む。
HEVCにおけるコーディングについて、ピクチャは、構成可能なサイズを有する正方形形状のコーディング木ブロック(CTB)に区画化され、連続したコーディング木ブロックの集合は、スライスにグループ化される。コーディング木ユニット(CTU)は、符号化された色成分のCTBを包含する。CTBは、コーディングブロック(CB)への四分木区画化のルートであり、コーディングブロックは、1つまたは複数の予測ブロック(PB)に区画化されてもよく、変換ブロック(TB)への四分木区画化のルートを形成する。コーディングブロック、予測ブロック、および変換ブロックに対応して、コーディングユニット(CU)は、予測ユニット(PU)およびツリー構造化された変換ユニット(TU)の集合を含み、PUは、全ての色成分についての予測情報を含み、TUは、各々の色成分についての残差コーディングシンタックス構造を含む。ルマ成分のCB、PB、およびTBのサイズは、対応するCU、PU、およびTUに適用される。
JEMでは、QTBT(四分木プラス二分木)構造は、HEVCにおける複数の区画化タイプの概念を取り除き、すなわち、CU、PU、およびTUの分離の概念を取り除く。コーディング木ユニット(CTU)は、四分木構造によって最初に区画化される。四分木リーフノードは、二分木構造によって更に区画化される。二分木リーフノードは、コーディングユニット(CU)と命名され、CUは、更なる区画化なしに予測および変換に対して使用される。よって、CU、PU、およびTUは、新たなコーディングQTBTブロック構造において同一のブロックサイズを有する。JEMでは、CUは、異なる色成分のコーディングブロック(CB)から構成される。
本出願では、用語「ブロック」は、CTU、CU、PU、TU、CB、PB、およびTBのいずれかを指すために使用されてもよい。加えて、「ブロック」は、H.264/AVCまたは他のビデオコーディング標準規格において規定されているようなマクロブロックおよび区画を指すために、より一般的には、様々なサイズのデータのアレイを指すためにも使用されてもよい。
例示的なエンコーダ100では、ピクチャは、以下で説明されるようにエンコーダ要素によって符号化される。符号化されることになるピクチャは、CUの単位(ユニット)において処理される。各々のCUは、イントラモードまたはインターモードのいずれかを使用して符号化される。CUがイントラモードにおいて符号化されるとき、それは、イントラ予測(160)を実行する。インターモードでは、動き推定(175)および補償(170)が実行される。エンコーダは、CUを符号化するためにイントラモードまたはインターモードのどちらを使用するかを決定し(105)、予測モードフラグによってイントラ/インター決定を示す。予測残差は、元の画像ブロックから予測されたブロックを差し引く(110)ことによって計算される。
イントラモードにおけるCUは、同一のスライス内の再構築された隣接サンプルから予測される。DC予測モード、平面予測モード、および33個の角度予測モードを含む35個のイントラ予測モードの集合がHEVCにおいて利用可能である。イントラ予測参照は、カレントブロックに隣接する行および列から再構築される。参照は、前に再構築されたブロックからの利用可能なサンプルを使用して、水平方向および垂直方向におけるブロックサイズを2倍以上に拡張する。角度予測モードがイントラ予測に対して使用されるとき、角度予測モードによって示される方向に沿って参照サンプルが複製されてもよい。
カレントブロックに対する適用可能なルマイントラ予測モードは、HEVCでは2つの異なるオプションを使用してコーディングされてもよい。適用可能なモードが3つの最確モード(MPM:most probable mode)の再構築されたリストに含まれる場合、モードは、MPMリストにおいてインデックスによってシグナリングされる。そうでなければ、モードは、モードインデックスの固定長二値化によってシグナリングされる。3つの最確モードは、最上隣接ブロック(top neighboring block)および左隣接ブロック(left neighboring block)のイントラ予測モードから導出される。
JEMにおける最近の提案は、HEVCと比較して、イントラ予測モードの数を増大させる。例えば、JEM3.0は、平面モード0およびDCモード1に加えて、65個の指向性イントラ予測モードを使用する。指向性イントラ予測モード、2から34までとHEVCにおいて行われるのと同一の方式において、2から66までで増大する順序において番号付けられる。65個の指向性予測モードは、HEVCにおいて規定された33個の指向性予測モードに加え、2つの元の角度の中間の角度に対応する32個の追加の指向性予測モードを含む。言い換えると、JEMにおける予測方向は、HEVCの2倍の角度分解能を有する。提案されたより大きなブロックサイズを有するより精緻な角度構造の可能性を活用するために、より大きな数の予測モードが提案されてきた。
HEVCにおけるインターCUに対し、対応するコーディングブロックは、1つまたは複数の予測ブロックに更に区画化される。PBレベルでインター予測が実行され、対応するPUは、インター予測がどのように実行されるかに関する情報を含む。動き情報(例えば、動きベクトルおよび参照ピクチャインデックス)は、2つの方法、すなわち、「マージモード」および「進化型動きベクトル予測(AMVP)」においてシグナリングされてもよい。
マージモードでは、ビデオエンコーダまたはデコーダは、既にコーディングされたブロックに基づいて候補リストを組み立て、ビデオエンコーダは、候補リスト内の候補のうちの1つについてのインデックスをシグナリングする。デコーダ側において、動きベクトル(MV)および参照ピクチャインデックスは、シグナリングされた候補に基づいて再構築される。
AMVPでは、ビデオエンコーダまたはデコーダは、既にコーディングされたブロックから判定された動きベクトルに基づいて候補リストを組み立てる。ビデオエンコーダは次いで、動きベクトル予測子(MVP)を識別するよう、候補リストにおいてインデックスをシグナリングし、動きベクトル差(MVD)をシグナリングする。デコーダ側において、動きベクトル(MV)は、MVP+MVDとして再構築される。適用可能な参照ピクチャインデックスも、AMVPに対してPUシンタックスにおいて明示的にコーディングされる。
予測残差は次いで、変換(125)および量子化(130)される。変換は概して、分離可能な変換(separable transform)に基づいている。例えば、DCT変換が水平方向において最初に、次いで、垂直方向において適用される。HEVCに対し、4×4、8×8、16×16、および32×32の変換ブロックサイズがサポートされる。コア変換マトリクスの要素が、スケーリングされた離散コサイン変換(DCT)基本関数を近似させることによって導出されている。HEVC変換は、変換計算についての動的な範囲を制限すること、ならびにマトリクスエントリが整数値として規定されるときの直交性に対する精度および密接度を最大にすること、などの考慮の下に設計されている。簡易化のために、32個の点の長さについての1つの整数マトリクスのみが規定され、他のサイズに対してサブサンプリングされたバージョンが使用される。4×4の変換ブロックサイズに対し、離散サイン変換(DST)から導出された代替的な整数変換は、イントラ予測モードに対するルマ残差ブロックに適用される。
JEMでは、両方向において使用される変換は異なってもよく(例えば、一方の方向においてDCT、もう一方の方向においてDST)、それは、様々な2D変換につながり、前のコーデックでは、所与のブロックサイズに対する様々な2D変換が通常は制限される。
量子化された変換係数と共に動きベクトルおよび他のシンタックス要素は、ビットストリームを出力するようエントロピコーディング(145)される。エンコーダはまた、変換をスキップしてもよく、4×4のTUごとに、変換されていない残差信号に量子化を直接適用してもよい。エンコーダはまた、変換および量子化の両方をバイパスしてもよく、すなわち、変換処理および量子化処理の適用なしに残差が直接コーディングされる。直接PCMコーディングでは、予測が適用されず、コーディングユニットサンプルがビットストリームに直接コーディングされる。
エンコーダは、更なる予測のための参照を提供するよう、符号化されたブロックを復号する。量子化された変換係数は、予測残差を復号するよう、逆量子化(140)および逆変換(150)される。復号された予測残差および予測されたブロックを組み合わせて、画像ブロックが再構築される。例えば、符号化アーチファクトを削減するようデブロッキング/SAO(サンプル適応オフセット)フィルタリングを実行するために、インループフィルタ(165)が再構築されたピクチャに適用される。フィルタリングされた画像は、参照ピクチャバッファ(180)に記憶される。
図2は、HEVCデコーダなどの例示的なビデオデコーダ200のブロック図を示す。例示的なデコーダ200では、ビットストリームは、以下で説明されるようにデコーダ要素によって復号される。ビデオデコーダ200は概して、図1において説明された符号化パスと相互交換の復号パスを実行し、復号パスは、ビデオデータを符号化する一部としてビデオ復号を実行する。図2はまた、HEVC標準規格に改良がなされたデコーダ、またはVCCにおけるJEMデコーダなど、HEVCと同様の技術を採用したデコーダを示す。
特に、デコーダの入力は、ビデオエンコーダ100によって生成することができるビデオビットストリームを含む。ビットストリームは、変換係数、動きベクトル、ピクチャ区画化情報、および他のコーディングされた情報を取得するよう最初にエントロピ復号(230)される。HEVCに対し、ピクチャ区画化情報は、CTUのサイズ、および適用可能なときにCTUがCUに、場合によってはCTUがPUに分割される方式を示す。したがって、デコーダは、復号されたピクチャ区画化情報に従って、CTUにピクチャを、CUに各々のCTUを分割(235)する。JEMに対し、デコーダは、QTBT構造を示す区画化情報に基づいて、ピクチャを分割してもよい。変換係数は、予測残差を復号するよう、逆量子化(240)および逆変換(250)される。
復号された予測残差および予測されたブロックを組み合わせて(255)、画像ブロックが再構築される。予測されたブロックは、イントラ予測(260)または動き補償予測(すなわち、インター予測)(275)から取得されてもよい(270)。上記説明されたように、AMVP技術およびマージモード技術は、参照ブロックの準整数サンプル(sub-integer sample)についての補間された値を計算するために補間フィルタを使用することができる、動き補償に対する動きベクトルを導出するために使用されてもよい。インループフィルタ(265)が再構築された画像に適用される。フィルタリングされた画像は、参照ピクチャバッファ(280)に記憶される。
復号されたピクチャは、復号後処理(285)、例えば、事前符号化処理(101)において実行された再マッピング処理の逆を実行する、逆色変換(例えば、YCbCr4:2:0からRGB4:4:4への変換)または逆再マッピングを更に受けてもよい。復号後処理(285)は、事前符号化処理において導出され、ビットストリームにおいてシグナリングされたメタデータを使用してもよい。
上記説明されたように、本開示は、ビデオ圧縮の分野を含む。概して、態様は、既存のビデオ圧縮システムと比較して圧縮効率を改善することを伴い、別の態様は、何らかのハードウェア復号パイプライン制約を考慮しつつ、高いコーディング効率を共同で保証する方式において、ルマコーディング木およびクロマコーディング木を表現し、ルマ圧縮されたブロックおよびクロマ圧縮されたブロックをコーディングする様々な態様および実施形態を提供することを含む。
HEVCビデオ圧縮標準規格では、ピクチャは、サイズが典型的には64×64、128×128、または256×256の画素である、いわゆるコーディング木ユニット(CTU)に分割される。各々のCTUは、圧縮されたドメインにおいてコーディング木によって表される。これは、CTUの四分木分割であり、各々のリーフは、図3に示されるように、コーディングユニット(CU)と称される。各々のCUは、何らかのイントラ予測パラメータまたはインター予測パラメータ(予測情報)が与えられる。これを行うために、各々のCUは、1つまたは複数の予測ユニット(PU)に空間的に区画化され、各々のPUは、何らかの予測情報が割り当てられる。イントラコーディングモードまたはインターコーディングモードは、図4に示されるように、CUレベルで割り当てられる。
新たに出現するビデオ圧縮ツールは、圧縮されたドメインにおいて更に伸縮自在な方式においてピクチャデータを表すために、圧縮されたドメインにおけるコーディング木ユニット表現を含む。このコーディング木のより伸縮自在な表現の利点は、HEVC標準規格のCU/PU/TU配列と比較して、圧縮効率を増加させることである。
例えば、四分木プラス二分木(QTBT)コーディングツールは、この増加した柔軟性をもたらす。それは、四分木方式および二分木方式の両方においてコーディングユニットを分割することができるコーディング木を含む。コーディング木ユニットのコーディング木表現のQTBTタイプの表示が図5に示される。
コーディングユニットの分割は、例えば、レート歪み最適化手順を通じてエンコーダ側において決定され、レート歪み最適化手順は、最小レート歪みコストによりCTUのQTBT表現を判定することを含む。
QTBT技術では、CUは、正方形形状または長方形形状のいずれかを有する。コーディングユニットのサイズは典型的には、4から128までの範囲で2の累乗である。
コーディングユニットについてのこの様々な長方形形状に加えて、この新たなCTU表現は、HEVCに関して異なる以下のものなどの特性を有する。CTUのQTBT分解は、2つの段階から成り、2つの段階の1つ目では、CTUが四分木方式において分割され、2つ目では次いで、各々の四分木リーフが二分木方式において更に分割されてもよい。これは、図5の右側上で示され、そこでは、実線は、四分木分解フェーズを表し、破線は、四分木リーフに空間的に埋め込まれた(embedded)二分木分解を表す。
イントラスライスでは、ルマブロック区画化構造およびクロマブロック区画化構造が分離され、独立して決定される。
予測ユニットまたは変換ユニットへのCU区画化はもはや採用されない。言い換えると、各々のコーディングユニットは、単一の予測ユニット(2N×2Nの予測ユニット区画化タイプ)および単一の変換ユニット(変換ツリーへの分割なし)から体系的に成る。
その上、図6に示されるように、CTUのコーディング木の表現、例えば、開発下のVVC標準規格において、いくつかの他のCU三分木区画化も採用されてもよい。図6に示されるCU区画は、CTUの拡張されたQTBT表現をもたらすと考えられてもよい。すなわち、図6に示されるとり得る区画の集合につながる、いわゆるCUの三分木区画化が使用されてもよい。三分木区画化は、考慮される方位において、親CUに対してサイズ(1/4、1/2、1/4)を有する3つのサブCUにCUを分割することを含む。
図7は、図6に示された分割モードを採用するビデオエンコーダによって、ピクチャの典型的なブロック分割に基づいてピクチャを符号化するためのコーディング構造の例を示す。図7では、ピクチャ上で重なった格子によって示される様々な正方形は、CTUの四分木分解、ならびに四分木に組み込まれた対称二分木分解および対称三分木分解を表す。QTBT+TT(三分木)などのコーディング構造を含む上記説明されたものなどのトポロジは、HEVCコーデックに対して図8に示されるような著しいコーディング効率の改善をもたらすことができる。
しかしながら、コーデックアーキテクチャは、HEVCにおけるケースにあったような変換ツリーに従ってCUを区画化することをもはや伴わないことがある。CTUのコーディング木を表すために使用される四分木分割ならびに関連するシンタックス(例えば、信号および/またはビットストリーム)を伴うCTUのコーディング木を表すアプローチは、本明細書に添付される表1に示される。
図9は、表1のシンタックスに対応する四分木分割シンタックス復号処理900の例を示す。図9および表1において理解することができるように、例は、コーディングされたフラグqt_split_cu_flagが構文解析されること(901)、およびカレントCUが四分木方式において4つのサブコーディングユニットに分割されるかどうかを示すこと(903)を含む。そうである場合(902においてyes)、コーディング四分木シンタックスは、この四分木分割(903)から発行された各々のサブCUに再帰的に適用される。そうでなければ(902においてno)、三分木方式または二分木方式においてカレントCUを再帰的に更に分割することをシグナリングするために、多タイプ木シンタックスが使用される(904)。
三分木分割/二分木分割をシグナリングするアプローチの例は、本明細書に添付される表2に示されるシンタックスによって示される。そのような多タイプ木シンタックスを復号する処理1000の例は、図10に示される。図10における多タイプ木分割シンタックスの例は、3つのフラグを含む。第1のフラグmtt_split_cu_flagは、構文解析され(1010)、カレントCUが三分木方式または二分木方式において分割されるかどうかを示す(1015)。第2のフラグmtt_split_cu_vertical_flagは、構文解析され(1030)、三分木/二分木分割の方位(垂直または水平)を示す。第3のフラグmtt_split_cu_binary_flagは、構文解析され(1045)、分割のタイプ、すなわち、二分木または三分木を示す。カレントCUが2つまたは3つのサブCUに分割される場合、表2のシンタックスは、カレントCUの各々のサブCUに対して再帰的に適用される。
表2に示されるシンタックスの例などの多タイプ木シンタックスに対する復号処理の例は、表2のシンタックス配列に従ってもよい。第1のステップは、分割フラグを構文解析すること、およびカレントCUの分割モードを復号することを含む。分割モードが分割なし(NO_SPLIT)とは異なる場合、CUは、その復号された分割モードに従って分割され、サブCUの各々の結果に対して処理が再帰的に呼び出される。CUが分割されない場合、CUは、図11に示される例示的な処理1100に従って復号および再構築されてもよい。
概して、本開示の態様は、サブブロックにコーディングユニットを分割することを伴い、サブブロックは、1つまたは複数のコーディングパラメータを共有し、例えば、同一の予測パラメータを有するが、専用変換ステップ、残差コーディングステップ、および事後フィルタリングステップを通じて圧縮および復元される。概して、別の態様は、いくつかの変換ブロックに所与のブロックを更に分割することを可能にすることによって、コーデックのコーディング効率を改善することを含む。概して、更なる別の態様は、ブロックごとに進める復号パイプラインにより復号処理を実装することができることを保証することを含み、例えば、ブロックサイズは、64×64であってもよい。この64×64のブロックの復号ユニットは、仮想パイプライン復号ユニット(VPDU)と称される。デコーダがVPDUごとに進めることができることが望ましく、それは、
-次のVPDUを復号することを開始する前に、ルマおよびクロマにおいて所与のVPDUに対応する全ての圧縮されたデータを復号することができ、
-VPDUに関連するルマおよびクロマの圧縮されたデータがビットストリームに共にパックされるように、ビットストリームが編成される、
ことを意味する。
概して、本開示に従った少なくとも1つの実施形態は、それに限定されないが、
-コーディング木レベルでのフラグが、カレントツリーノードから発行された全ての子CUが1つまたは複数のコーディングパラメータを共有すること、例えば、同一の予測データを有することを示すこと、
-いくつかのコーディングパラメータが同一のツリーノードから発行されたCUによって共有される場合、それらの共有されるパラメータが、デコーダ側の処理順序において、そのグループ内の第1のコーディングCUにおいてコーディングされること、
-フラグが、CTUの全体コーディング木において二分木+三分木レベルにおいて現れることができ、または分割階層における四分木レベルもしくは二分木/三分木レベルのいずれかにおいて現れることができること、
-分離されたルマ/クロマコーディング木のケースでは、考慮されるコーディング木に関係する構成要素においてフラグが適用され、よって、グループ化が、同一の空間的領域内でクロマCUではなくルマCUにおいて現れることができ、またはその逆も同様であること、
-デコーダ側での処理順序が、VPDU制約に従って適合されてもよいこと、
-共有されるパラメータが、変換関連データ、例えば、cu_mts_flagシンタックス要素およびmts_idxシンタックス要素を含むことができ、その結果、変換データも予測データに沿って関連するCUの中でグループ化されてもよいこと、
を含む、様々な態様、特徴、および/または特性のうちの1つまたは複数を含んでもよい。
別の態様は、他のアプローチ、例えば、VVCによって予期されるものうちの1つまたは複数と互換性を有するCU分割と関連付けられたシンタックスを含んでもよい。
概して、本開示の態様は、ルマ/クロマコーディング木および関連するシンタックス、ならびに/またはビットストリーム編成を含む。様々な実施形態の例が図12および13に示される。それらの2つの図は、ルマ成分およびクロマ成分それぞれへの例示的なCTUのブロック分割の例を示す。両方の例では、考慮されるCTUサイズは、128×128である。同一の予測データが使用されるCUは、灰色で強調される。図12に示される第1の例では、ルマコーディング木およびクロマコーディング木は別個であり、灰色で強調して示されるグループ化の例は、考慮されるCTUのルマ成分においてのみ使用される。
より具体的には、図12および13は、コーディングユニットの中での予測データグループ化の例を示す。図12では、いくつかのコーディングユニットの予測データのグループ化の例が示され、そこでは、ルマ/クロマコーディング木が分離されるイントラCTUのコーディング木についての共通の先祖CUの内部にCUがある。対照的に、図13に示される例は、ルマおよびクロマの両方に対して単一のコーディング木を使用することができる非イントラCTUの例を示す。すなわち、図13において網掛けによって示されるように、ジョイントコーディング木がルマ成分およびクロマ成分によって使用される非イントラCTUのケースにおける複数のコーディングユニットの中のグループ化の例である。
概して、実施形態の少なくとも1つの例は、複数のCUの中で予測データをグループ化することを含んでもよい。この第1の例では、予測データシンタックスグループ化は、CUレベルでシグナリングされる。例えば、その親CUに空間的に含まれる第1のコーディングユニットではないコーディングユニットのシグナリングの前に、フラグが導入されてもよい。そのケースでは、grouped_prediction_data_flagなどのフラグは、カレントCUが、デコーダ側の処理順序において、同一の親CUに含まれる先行するCUの予測を使用しているかどうかを示す。次に、フラグgrouped_prediction_data_flagが偽である場合、カレントCUをコーディング/復号するために、典型的なまたは通常のコーディングユニットコーディングシンタックスが使用されてもよい。そうでなければ、カレントCUをコーディング/復号するために、表3に示されるシンタックスの例など、簡易化された「coding_unit_grouped_prediction_data」シンタックスが使用される。表3および本明細書に添付される他の表では、本開示に従ったシンタックスの実施形態の例は、HEVCにおいて使用され、またはVVCに対して提案されたシンタックスなどに関する変更を強調し、または網掛けすることによって示される。示される例は、示される実施形態および/または特徴がHEVCおよびVVC以外の様々な技術、環境、または実施形態に適用されてもよい点で限定されない。表4は、典型的なまたは通常のコーディングユニットコーディングシンタックスの例と、グループ化された予測データのケースについてのシンタックスの実施形態の例との間の差を示す。表4の例について示される差は、CUの予測に関連する全てのシンタックス要素を破棄することを含む。典型的なまたは通常のアプローチと関連付けられたシンタックスについて、変換データコーディングおよび残差データコーディングに関連するシンタックスのみが維持され、変更されない。変形例に従って、予測データのペアのみが、複数のコーディングユニットの中でグループ化される。
まさに説明される実施形態の第1の例の多くの変形例が可能であり、本開示に従って考慮されることになる。例えば、1つの変形例は、grouped_prediction_data_flagが、同一の親CUに含まれるカレントCUの左隣接CUの予測をカレントCUが使用しているかどうかを示す、少なくとも1つの実施形態を含んでもよい。別の変形例は、grouped_prediction_data_flagが、同一の親CUに含まれるカレントCUの最上隣接CUの予測をカレントCUが使用しているかどうかを示す、少なくとも1つの実施形態を含んでもよい。別の変形例は、grouped_prediction_data_flagが、同一の親CUに含まれるカレントCUの左隣接CUの予測をカレントCUが使用しているかどうか(利用可能である場合)、そうでなければ同一の親CUに含まれるカレントCUの最上隣接CUをカレントCUが使用しているかどうかを示す、少なくとも1つの実施形態を含んでもよい。カレントCUがその親CU内の最初の1つでない場合、カレントCUの最上隣接CUまたは左隣接CUのいずれが必然的に利用可能であることに留意されよう。
図14は、実施形態の前に説明された第1の例に対応するCU復号処理1400を表す。処理への入力は、復号するカレントCUである。第1のステップは、grouped_prediction_data_flagシンタックス要素を構文解析する(1410)。それが偽である場合(1420においてno)、予測データの構文解析、予測情報の導出、残差ブロックの構文解析および復号、カレントCUの予測、ならびにカレントCUの再構築を伴う、標準的なCU復号が行われる(1430)。構文解析されたフラグgrouped_prediction_data_flagが真である場合(1420においてyes)、復号順序において前のCUの予測データからカレントCUの予測データが導出される(1440)。この導出処理は、イントラモードまたは並進動き補償モード(translational motion compensation mode)のケースにおいて前のCUから予測データから予測データを複製することを含む。
前のCUがサブブロックに基づく動き情報を通じて予測されたケースでは、前のCUに対してサブブロックに基づく動きフィールドが導出された方式がカレントCUに適用される。アフィンケースでは、カレントCUのアフィン動きフィールドを伝搬および導出するために、前のCUに対して使用された制御点動きベクトルが使用される。ATMVP(代替動きベクトル予測(Alternative Motion Vector Prediction))のケースでは、前のCUの動き情報を取り出すために使用される時間動きベクトルも、その自身のサブブロックに基づく動きフィールドを導出するためにカレントCUに対して使用される。
説明された復号する例の多くの変形例が可能であり、本開示に従って考慮されることになる。例えば、1つの変形例は、イントラ予測および非サブブロックに基づくインター予測のケースにおいてのみ使用される、複数のCUの中での提案された予測データグループ化を含んでもよい。変形例の別の例は、アフィンインター予測のケースにおいのみ非活性化される、複数のCUの中での提案された予測データグループ化を含んでもよい。
概して、複数のCUの中で予測データをグループ化する実施形態の少なくとも1つの他の例は、CUレベルではなく、三分木/二分木コーディング木レベルでいくつかのサブCUの中で予測をグループ化することを含んでもよい。表5および図15はそれぞれ、実施形態のこの第2の例の提案されたシンタックスおよび復号処理を示す。理解することができるように、CU予測データのグループ化をシグナリングするためのフラグは、カレントCUがサブCUに分割され、コーディング木内で上にあるCUに当てはまるようにフラグがまだシグナリングされていないケースにおいてシグナリングされる。
したがって、変数parent_grouped_prediction_dataは、カレントCUの親CUの1つが真に等しいまたは等しくないgrouped_prediction_data_flagによりシグナリングされているかどうかを示す。それが偽であり、カレントCUが二分木または三分木分割される場合、シンタックス要素grouped_prediction_data_flagがコーディングされる。その上、変数grouped_prediction_dataは、parent_grouped_prediction_dataおよびgrouped_prediction_data_flagフラグの1つが真に等しく設定される場合に真に設定され、そうでなければ、偽に設定される。それは、カレントCUの二分木/三分木分割から結果として生じるサブCUの多タイプ木シンタックスに引数して渡される。
図15は、前に説明された第2の実施形態に対応し、表5に示されるシンタックスの実施形態の例に従った復号処理1500の例を示す。初期の多タイプ木復号処理への修正が太線に現れる。理解することができるように、修正の態様は、多タイプ木レベルでgrouped_prediction_data_flagシンタックス要素を復号すること(1560)、およびサブCUへのカレントCUの再帰的な分割処理にgrouped_prediction_data値を渡すこと(1565)に関連する。その上、非分割CU復号処理が、入力としての追加の引数parent_grouped_prediciton_data_flagにより呼び出される(1555)。
概して、実施形態の少なくとも1つの他の例は、四分木構文解析および区画化を提供する。上記説明された実施形態の第2の例に加えて、実施形態のこの第3の例が使用されてもよい。表6および図16は、実施形態の第3の例に従った四分木分割シンタックスおよび復号の例を示す。この第3の実施形態は、四分木分割のケースにおいて、上記説明された第2の実施形態と同様であってもよい。理解することができるように、追加の四分木レベルフラグは、構文解析および判定されることになるシンタックスに追加される(1605、1610)。加えて、追加の引数parent_grouped_prediction_dataが入力として使用される。それが偽である場合(1620においてyes)、カレントCUが四分木方式において分割されるケースでは、フラグgrouped_prediction_data_flagが四分木レベルでシグナリングされる。更に、図16に示されるように計算された変数grouped_prediction_dataは、四分木シンタックス復号処理への再帰的な呼び出しに引数として渡される。
概して、上記説明された第2の実施形態もしくは第3の実施形態、または第2の実施形態および第3の実施形態の組み合わせに従ったCU復号処理1700の実施形態の例が図17に示される。図17の例では、図11のCU復号処理1100への修正が太線で示される。それらの差異は、入力grouped_prediction_data_flag値を試験すること(1705)、および真であり(1705においてyes)、カレントCUが同一の予測データを共有するCUのグループ内の最初の1つでない場合(1710においてno)、同一の予測データを共有するCUのグループ内の第1のCUに基づいて、カレントCUの予測データを導出すること(1725)、を含む。そのグループ内の第1のCUは典型的には、空間アドレスまたは座標(4×4のブロックごとに)を通じて識別され、図17のCU復号処理に入力引数として渡されてもよい。
コーディング木および複数のCUの中での予測データグループ化を共同で決定するための、エンコーダ側レート歪み最適化(RDO)処理1800へのアプローチの例が図18に示される。図18のアプローチは、所与のCUに対し、NO_SPLIT、四分木、二分木および三分木分割モードの中から全ての許容される分割モードを試験すること、ならびに最低レート歪みコストを与える分割モードを選択することを含む。NO_SPLITとは異なる分割モードを試験するとき、カレントCUは、試験された分割モードに従って分割され、図17の処理は、分割から結果として生じる各々のサブCUに対して再帰的に呼び出される。NO_SPLITモードのケースでは、カレントCUのコーディングパラメータのレート歪み最適化された選択が行われる。
概して、少なくとも1つの実施形態の態様が図19に示される。図19では、例えば、上記説明された実施形態の第2の例および/または第3の例において提案されたように、予測データグループ化に対してレート歪み最適化された決定を統合することを含む、レート歪み最適化を通じた修正されたコーディング木決定の例示的な処理1900が示される。
より詳細に、図19に示される実施形態の例は、図18に示されたものなどのアプローチに関する1つまたは複数の修正を含んでもよい。図19では、そのような修正の例が太字にある(1925~1940)。例えば、以下のように、全体RDO処理への2つの追加の入力引数、
-予測データグループ化がカレントCUを含むコーディング木部において使用される場合に真である、parent_grouped_prediction_flag、および
-複数のCUの中でグループ化される予測データ(これは、フラグparent_grouped_prediction_flagが真である場合にカレントCUを含む、複数のCUによって共有される予測データを表す)、
が考慮されてもよい。また、NO_SPLITモードにおいて評価されるCUに対し、その予測データは、カレントCUに対応するピクチャ領域が予測データグループ化モードにおいて試験されるケースにおいて、後続の使用のために記憶されてもよい(1935)。よって、この記憶に続いて、予測データグループ化モードにおいてカレントCUに対して全体コーディング木最適化処理を再帰的に適用する(1940)。このケースでは、NO_SPLITモードにおけるカレントCUのコーディングに対して最適であるとして発見された予測データは、複数のサブCUによって共通して使用される予測データとして選択される。よって、この例示的なRDO処理は、上記説明された実施形態の第2の例もしくは第3の例、またはそれらの組み合わせのいずれかに従って行われる必要がある追加のレート歪み探索の回数を制限する。
概して、実施形態の少なくとも1つの例の態様は、予測データに加えて、複数のCUの中で変換タイプシグナリングシンタックスをグループ化することを含んでもよい。すなわち、CUの中での情報のグループ化は、例えば、transform_unitシンタックスおよびresidual_codingシンタックスのそれぞれの部分である、mts_flagシンタックス要素およびmts_idxシンタックス要素などの変換関連データなどの変換関連データをも含んでもよい。実施形態の少なくとも1つの例は、以下に添付される表7および表8に示されるようなそれらの2つのシンタックスに対して提案される修正を含んでもよい。
表7および8の例の各々への追加の入力は、フラグgrouped_prediction_dataであり、grouped_prediction_dataは、カレント変換ユニット(TU)が別の変換ユニットから発行された、いくつかのコーディングパラメータを使用しているかどうかを示す。それが真である場合、cu_mts_flagがコーディング/復号されない。代わりに、それは、変換ユニットから導出され、変換ユニットから、カレントTUは、予測データおよび変換ユニットパラメータを再使用している。表8に示されるのと同一の方式において、mts_idxシンタックス要素がコーディングまたは復号されず、代わりに推測される。
概して、変換タイプシグナリングのための実施形態の少なくとも1つの他の例は、いくつかの他のCUと共にグループ化されたCUのケースでは、cu_mts_flagは、変換タイプ情報を共有するCUの同一のグループ内の先行するCUに基づいて、予測的方式(predictive way)においてコーディングされる。例として、同一のグループ内のカレントCUの左CUまたは最上CUのcu_mts_flagは、利用可能であるとき、カレントCUのcu_mts_flagシンタックス要素の予測子として使用される。同様に、この実施形態の更なる変形例に従って、カレントCUのmts_idxシンタックス要素は、グループ化されたCUの同一の集合内の周囲のCUから予測される。
概して、変換タイプシグナリングについての実施形態の少なくとも1つの他の例は、いくつかの他のCUとグループ化されるCUのケースでは、変換タイプ情報を共有するグループ化されたCUの同一の集合内のいくつかの先行CUのcu_mts_flagに基づいて選択されたCABACコンテキストによりcu_mts_flagがコーディングされることを含んでもよい。例として、利用可能である場合、同一のグループ内のカレントCUの左CUおよび/または最上CUのcu_mts_flagが、cu_mts_flagシンタックス要素またはカレントCUをコーディング/復号するために使用されるCABACコンテキストを選択する方式として使用されるかに応じて。同様に、この実施形態の更なる変形例に従って、カレントCUのmts_idxシンタックス要素も、いくつかのCABACコンテキスト(複数可)によりコーディングされ、いくつかのCABACコンテキストは、カレントCUの周りのいくつかの最上CUおよび/または左CU、ならびにグループ化されたCUの同一の集合内のいくつかの最上CUおよび/または左CUのcu_mts_flagの値およびmts_idx値に依存する。
概して、実施形態の少なくとも1つの他の例は、いくつかの他のCUとグループ化されるCUのケースでは、グループ化されたCUの同一の集合内のいくつかの他のCUのtu_cbf_lumaシンタックス要素ならびに/またはtu_cbf_cbシンタックス要素およびtu_cbf_crシンタックス要素に条件付きでコーディングされる、カレントCUのtu_cbf_lumaシンタックス要素、ならびに/またはtu_cbf_cbシンタックス要素およびtu_cbf_crシンタックス要素を含んでもよい。これは、グループ化されたCUの同一の集合内のいくつかの他のCUにおける対応するフラグに応じて、それらのフラグの予測の形式を取ってもよい。別の変形例では、それらのフラグは、グループ化されたCUの同一の集合内のいくつかの他のCUにおける対応するフラグ値に応じて選択された関連するコンテキストにより、コンテキストに基づきコーディングされてもよい。
概して、実施形態の少なくとも1つの例の態様は、復号処理に対するVPDU制約を考慮した予測データグループ化を含んでもよい。例えば、実施形態の例は、典型的にはルマにおける64×64(よって、クロマにおける32×32)のサイズのVPDUの制約を満たすために、予測データグループ化機構を適用することを含んでもよい。64×64のVPDUによる復号の実現可能性を保証するために、CTUのコーディング木によって満たされることになる制約の例は、以下の通りである。
-条件1:1つまたは複数のCUを含むVPDUごとに、CUは、VPDUに完全に含まれる。
-条件2:1つまたは複数のVPDUを含むCUごとに、VPDUは、CUに完全に含まれる。
-CTUごとに、上記2つの条件は、違反されない必要があり、CUの処理順序は、VPDUを離れず(leave)、後に再訪問する(re-visit later)必要がある。
問題となることがあるコーディング木構成の例が図20に示される。
VPDU制約を解消するアプローチは、以下のように、許容される分割モードにいくつかの制約を課すことを含んでもよい。
-128×128のCTUに対し、TT分割によってそれが区画化されるべきでなく、
-128×NまたはN×128のCUに対し、TT分割によってそれが区画化されるべきでなく、N<=64であり、
-128×NのCUに対し、水平BTを適用することができず、N<=64であり、
-N×128のCUに対し、垂直BTを適用することができず、N<=64である。
しかしながら、そのような制約は、コーディング効率を減少させることがある。例えば、0.15%の圧縮効率における損失は、それらの制約から結果として生じることがある。
概して、実施形態の少なくとも1つの例は、以下の2つの態様など、VPDU制約に対処する1つまたは複数の態様を含んでもよい。
-2つの異なるVPDUに属するブロックの間で何らかの予測データを共有する可能性をもたらすよう、2つのVPDUと重なるCUを分割するために、予測(任意選択で、変換)データグループ化方法が適用される、
-CUの間の復号順序は、CUの処理順序がVPDUを離れず、後に再訪問する必要があることを表す、処理順序に対するVPDU制約を遵守するように適合される。したがって、コーディングユニットが復号される順序は、VPDU格子に関するコーディング木の構成に従って変化してもよい。
例えば、図21の例では、CU処理順序が変化する必要がない。対照的に、図22の例では、CUの処理が変化する。中間CUは、2つの連続した二分木分割を通じて4つのサブCUに分割される。左CUおよび右CUは、1回の二分木分割を通じて2つのサブCUに分割される。これは、それらの領域全体に対して同一の予測データを使用することを可能にすると共に、VPDUサイズに関して、それらの領域をいくつかのサブCUに分割することを可能にする。しかしながら、所望のCU処理順序に関して、図22に示される走査順序が使用される。言い換えると、CUの走査順序は、次のVPDUを処理することを開始する前に、所与のVPDUの内部に含まれる全てのCUが処理されるようになることである。
様々な方法が上記説明されたが、方法の各々は、説明された方法を達成するための1つまたは複数のステップまたはアクションを含む。方法の適切な動作のためにステップまたはアクションの特定順序が必要とされない限り、特定のステップおよび/またはアクションの順序および/または仕様は修正されてもよく、または組み合わされてもよい。
様々な数値、例えば、イントラ予測モードの数または変換サブセット数が本出願において使用される。特定の値が例示の目的のためであり、本実施形態がそれらの特定の値に限定されないことに留意されるべきである。
上記では、HEVCまたはJEMに関して様々な実施形態が説明されてきた。例えば、本開示に従った態様および実施形態の様々な例は、図1および図2に示されたJEMエンコーダもしくはHEVCエンコーダの変換モジュール(125)もしくは逆変換モジュール(150)および/またはJEMデコーダもしくはHEVCデコーダの逆変換モジュール(150)を修正するために使用されてもよい。しかしながら、本実施形態は、JEMまたはHEVCに限定されず、他の標準規格、推奨、およびその拡張に適用されてもよい。
図23は、様々な態様および実施形態を実装することができるシステム2300の例のブロック図を示す。システム2300は、以下で説明される様々な構成要素を含むデバイスとして具体化されてもよく、本明細書において説明される態様のうちの1つまたは複数を実行するように構成される。そのようなデバイスの例は、それらに限定されないが、パーソナルコンピュータ、ラップトップコンピュータ、スマートフォン、タブレットコンピュータ、デジタルマルチメディアセットトップボックス、デジタルテレビ受信機、パーソナルビデオレコーディングシステム、接続されたホームアプライアンス、およびサーバを含む。システム2300の要素は単独または組み合わせで、単一の集積回路(IC)、複数のIC、および/または離散した構成要素において具体化されてもよい。例えば、少なくとも1つの実施形態では、システム2300処理要素およびエンコーダ/デコーダ要素は、複数のICおよび/または分離した構成要素にわたって分散される。様々な実施形態では、システム2300は、例えば、通信バスを介して、または専用入力および/もしくは出力ポートを通じて、1つまたは複数の他のシステムまたは他の電子デバイスに通信可能に結合される。様々な実施形態では、システム2300は、本明細書において説明される態様のうちの1つまたは複数を実装するように構成される。
システム2300は、例えば、本明細書において説明される様々な態様を実装するためにロードされる命令を実行するように構成された少なくとも1つのプロセッサ2310を含む。プロセッサ2310は、埋め込みメモリ、入力出力インタフェース、および本分野において既知の様々な他の回路を含んでもよい。システム2300は、少なくとも1つのメモリ2320(例えば、揮発性メモリデバイスおよび/または不揮発性メモリデバイス)を含む。システム2300は、記憶装置2340を含み、記憶装置2340は、それらに限定されないが、電気的消去可能プログラマブルリードオンリメモリ(EEPROM)、リードオンリメモリ(ROM)、プログラマブルリードオンリメモリ(PROM)、ランダムアクセスメモリ(RAM)、ダイナミックランダムアクセスメモリ(DRAM)、スタティックランダムアクセスメモリ(SRAM)、フラッシュ、磁気ディスクドライブ、および/または光学ディスクドライブ含む、不揮発性メモリおよび/または揮発性メモリを含んでもよい。記憶装置2340は、非限定的な実施例として、内蔵記憶装置、取り付け記憶装置(取り外し可能記憶装置および非取り外し可能記憶装置を含む)、ならびに/またはネットワークアクセス可能記憶装置を含んでもよい。
システム2300は、例えば、符号化されたビデオまたは復号されたビデオを提供するようデータを処理するように構成されたエンコーダ/デコーダモジュール2330を含み、エンコーダ/デコーダモジュール2330は、その自身のプロセッサおよびメモリを含んでもよい。エンコーダ/デコーダモジュール2330は、符号化機能および/または復号機能を実行するようデバイスに含むことができるモジュール(複数可)を表す。既知なように、デバイスは、符号化モジュールおよび復号モジュールの一方または両方を含んでもよい。加えて、エンコーダ/デコーダモジュール2330は、システム2300の別個の要素として実装されてもよく、または当業者に既知なハードウェアおよびソフトウェアの組み合わせとしてプロセッサ2310内に組み込まれてもよい。
本明細書において説明される様々な態様を実行するようプロセッサ2310またはエンコーダ/デコーダ2310にロードされることになるプログラムコードは、記憶装置2340に記憶されてもよく、その後、プロセッサ2310による実行のためにメモリ2320にロードされてもよい。様々な実施形態に従って、プロセッサ2310、メモリ2320、記憶装置2340、およびエンコーダ/デコーダモジュール2330のうちの1つまたは複数は、本明細書において説明される処理の実行の間に様々な項目のうちの1つまたは複数を記憶してもよい。そのような記憶された項目は、それらに限定されないが、入力されたビデオ、復号されたビデオまたは復号されたビデオの一部、ビットストリーム、マトリクス、変数、ならびに数式、公式、演算、および演算ロジックの処理からの中間結果または最終結果を含んでもよい。
いくつかの実施形態では、プロセッサ2310および/またはエンコーダ/デコーダモジュール2330の内部のメモリは、命令を記憶し、符号化または復号の間に必要な処理のためのワーキングメモリを提供するために使用される。しかしながら、それらの機能のうちの1つ以上に対して、処理デバイス(例えば、処理デバイスは、プロセッサ2310またはエンコーダ/デコーダモジュール2330のいずれかであってもよい)の外部のメモリが使用される。外部メモリは、メモリ2320ならびに/または記憶装置2340、例えば、動的揮発性メモリおよび/もしくは不揮発性フラッシュメモリであってもよい。いくつかの実施形態では、例えば、テレビのオペレーティングシステムを記憶するために外部不揮発性フラッシュメモリが使用される。少なくとも1つの実施形態では、RAMなどの高速外部動的揮発性メモリは、MPEG-2(MPEGは、Moving Picture Experts Groupを指し、MPEG-2はISO/IEC13818とも称され、13818-1もH.222として既知であり、13818-2もH.262として既知である)、HEVC、またはVVC(Versatile Video Coding)などについてのビデオコーディング演算および復号演算のためのワーキングメモリとして使用される。
システム2300の要素への入力は、ブロック2305において示されるように様々な入力デバイスを通じて提供されてもよい。そのような入力デバイスは、それらに限定されないが、(i)ブロードキャスタによって無線で送信されたRF信号を受信する無線周波数(RF)部分、(ii)コンポーネント(COMP)入力端子(または、COMP入力端子のセット)、(iii)USB入力端子、および/または(iv)HDMI入力端子を含む。
様々な実施形態では、ブロック2305の入力デバイスは、本分野において既知の関連するそれぞれの入力処理要素を有する。例えば、RF部分は、(i)所望の周波数を選択し(信号を選択すること、または信号を周波数の帯域に帯域制限することとも称される)、(ii)選択された信号をダウンコンバートし、(iii)例えば、特定の実施形態ではチャネルと称されることがある信号周波数帯域を選択するよう周波数のより狭い帯域に再度帯域制限し、(iv)ダウンコンバートされ、帯域制限された信号を復調し、(v)誤り訂正を実行し、(vi)所望のデータパケットのストリームを選択するよう逆多重化する、野に適切な要素と関連付けられてもよい。様々な実施形態のRF部分は、それらの機能を実行する1つまたは複数の要素、例えば、周波数セレクタ、信号セレクタ、帯域リミッタ、チャネルセレクタ、フィルタ、ダウンコンバータ、復調器、誤り訂正器、およびマルチプレクサを含む。RF部分は、例えば、受信された信号をより低い周波数(例えば、中間周波数もしくはベースバンドに近い周波数)またはベースバンドにダウンコンバートすることを含む、様々なそれらの機能を実行するチューナを含んでもよい。1つのセットトップボックスの実施形態では、RF部分およびその関連する入力処理要素は、有線(例えば、ケーブル)媒体を通じて送信されたRF信号を受信し、所望の周波数帯域へのフィルタリング、ダウンコンバート、および再度のフィルタリングによって周波数選択を実行する。様々な実施形態は、上記説明された(および、他の)要素の順序を再配列し、それらの要素の一部を除去し、および/または類似の機能もしくは異なる機能を実行する他の要素を追加する。要素を追加することは、例えば、増幅器およびアナログ-デジタル変換器を挿入することなど、既存の要素の間に要素を挿入することを含んでもよい。様々な実施形態では、RF部分は、アンテナを含む。
加えて、USB端子および/またはHDMI端子は、USB接続および/またはHDMI接続の間でシステム2300を他の電子デバイスに接続するためのそれぞれのインタフェースプロセッサを含んでもよい。入力処理、例えば、リードソロモン誤り訂正の様々な態様が、例えば、別個の入力処理IC内で、またはプロセッサ1010内で必要に応じて実装されてもよいことが理解されよう。同様に、USBインタフェース処理またはHDMIインタフェース処理の態様は、別個のインタフェースIC内で、またはプロセッサ2310内で必要に応じて実装されてもよい。復調されたストリーム、誤り訂正されたストリーム、および逆多重化されたストリームは、出力デバイス上で提示するために必要に応じてデータストリームを処理するために、例えば、プロセッサ2310、ならびにメモリおよび記憶素子との組み合わせで動作するエンコーダ/デコーダ2330を含む様々な処理要素に提供される。
システム2300の様々な要素は、統合された筐体内で設けられてもよい。統合された筐体内で、様々な要素は、適切な接続配列2315、例えば、I2Cバス、配線、およびプリント回路基板を含む、本分野において既知の内部バスを使用して、相互接続されてもよく、それらの間でデータを伝送してもよい。
システム2300は、通信チャネル2390を介して他のデバイスとの通信を有効にする通信インタフェース2350を含む。通信インタフェース2350は、それらに限定されないが、通信チャネル2390を通じてデータを送信および受信するように構成された送受信機を含んでもよい。通信インタフェース2350は、それらに限定されないが、モデムまたはネットワークカードを含んでもよく、通信チャネル2390は、例えば、有線媒体および/または無線媒体内で実装されてもよい。
様々な実施形態では、Wi-Fiネットワーク、例えば、IEEE802.11(IEEEは、Institute of Electrical and Electronics Engineersを指す)などの無線ネットワークを使用して、データがシステム2300にストリーミングされ、またはそうでなければ、システム2300に提供される。それらの実施形態のWi-Fi信号は、Wi-Fi通信に対して適合された通信チャネル2390および通信インタフェース2350を通じて受信される。それらの実施形態の通信チャネル2390は典型的には、ストリーミングアプリケーションおよび他のオーバザトップ通信を可能にするための、インターネットを含む外部ネットワークへのアクセスを提供するアクセスポイントまたはルータに接続される。他の実施形態は、入力ブロック2305のHDMI接続を通じてデータを配送するセットトップボックスを使用して、システム2300にストリーミングされたデータを提供する。更なる他の実施形態は、入力ブロック2305のRF接続を使用して、システム2300にストリーミングされたデータを提供する。上記示されたように、様々な実施形態は、非ストリーミング方式においてデータを提供する。加えて、様々な実施形態は、Wi-Fi以外の無線ネットワーク、例えば、セルラネットワークまたはBluetoothネットワークを使用する。
システム2300は、ディスプレイ2365、スピーカ2375、および他の周辺デバイス2385を含む、様々な出力デバイスに出力信号を提供してもよい。他の周辺デバイス2385は、実施形態の様々な実施例では、スタンドアロンDVR、ディスクプレイヤ、ステレオシステム、照明システム、およびシステム2300の出力に基づいた機能をもたらす他のデバイスのうちの1つまたは複数を含む。様々な実施形態では、AVリンク、CEC、またはユーザの介入によりもしくはユーザの介入なしにデバイスツーデバイス制御を有効にする他の通信プロトコルなどのシグナリングを使用して、システム2300と、ディスプレイ2365、スピーカ2375、または他の周辺デバイス2385との間で制御信号が通信される。出力デバイスは、それぞれのインタフェース2360、2370、および2360、2370、およびを通じて専用接続を介して、システム2300に通信可能に結合されてもよい。代わりに、出力デバイスは、通信インタフェース2350を介して通信チャネル2390を使用して、システム2300に接続されてもよい。ディスプレイ2365およびスピーカ2375は、例えば、テレビなどの電子デバイスにおいてシステム2300の他の構成要素と単一のユニットにおいて統合されてもよい。様々な実施形態では、ディスプレイインタフェース2360は、例えば、タイミングコントローラ(T Con)チップなどのディスプレイドライバを含む。
ディスプレイ2365およびスピーカ2375は代わりに、例えば、入力2305のRF部が別個のセットトップボックスの部分である場合、他の構成要素の内の1つまたは複数とは別個であってもよい。ディスプレイ2365およびスピーカ2375が外部構成要素である様々な実施形態では、出力信号は、例えば、HDMIポート、USBポート、またはCOMP出力を含む専用出力接続を介して提供されてもよい。
実施形態は、プロセッサ2310もしくはハードウェア、またはハードウェアおよびソフトウェアの組み合わせによって実装されたコンピュータソフトウェアによって実行されてもよい。非限定的な実施例として、実施形態は、1つまたは複数の集積回路によって実装されてもよい。メモリ2320は、技術的環境に適切ないずれかのタイプのメモリであってもよく、非限定的な実施例として、光学メモリデバイス、磁気メモリデバイス、半導体方式メモリデバイス、固定メモリ、および着脱可能メモリなどのいずれかの適切なデータ技術を使用して実装されてもよい。プロセッサ2310は、技術的環境に適切ないずれかのタイプのプロセッサであってもよく、非限定的な実施例として、マイクロプロセッサ、汎用コンピュータ、特殊目的コンピュータ、およびマルチコアアーキテクチャに基づくプロセッサのうちの1つまたは複数を含んでもよい。
本開示の全体を通じて、様々な実装態様は、復号することを含む。本出願において使用される「復号すること」は、例えば、表示のために適切な最終的な出力を生成するために、受信され符号化されたシーケンスにおいて実行される処理の全てまたは一部を含んでもよい。様々な実施形態では、そのような処理は、デコーダ、例えば、エントロピ復号、逆量子化、逆変換、および差分復号によって典型的には実行される処理のうちの1つまたは複数を含む。様々な実施形態では、そのような処理は加えてまたは代わりに、例えば、タイルかされた(パックされた)ピクチャからピクチャを抽出し、使用するアップサンプルフィルタを判定し、ピクチャアップサンプリングし、その意図した方位にピクチャを再度反転することによって、本出願において説明される様々な実装態様のデコーダによって実行される処理を含む。
更なる例として、1つの実施形態では、「復号すること」は、エントロピ復号することのみを指し、別の実施形態では、「復号すること」は、差分復号することのみを指し、別の実施形態では、「復号すること」は、エントロピ復号することおよび差分復号することの組み合わせを指す。フレーズ「復号処理」が演算または全体的により広義に復号処理のサブセットを指すことが、特定の説明のコンテキストに基づいて明確であることが意図され、当業者によって公知であると信じられる。
また、様々な実装態様は、符号化することを含む。「復号すること」と同様の方式では、本出願において使用される「符号化すること」は、例えば、符号化されたビットストリームを生成するために、入力ビデオシーケンスに対して実行される処理の全てまたは一部を含んでもよい。様々な実施形態では、そのような処理は、エンコーダ、例えば、区分化、差分符号化、変換、量子化、およびエントロピ符号化によって典型的には実行される処理のうちの1つまたは複数を含む。様々な実施形態では、そのような処理は加えてまたは代わりに、本出願において説明される様々な実装態様のエンコーダによって実行される処理を含む。
更なる例として、1つの実施形態では、「符号化すること」は、エントロピ符号化することのみを指し、別の実施形態では、「符号化すること」は、差分符号化することのみを指し、別の実施形態では、「符号化すること」は、差分符号化することおよび差分符号化することの組み合わせを指す。フレーズ「符号化処理」が演算または全体的により広義に符号化処理のサブセットを指すことが、特定の説明のコンテキストに基づいて明確であることが意図され、当業者によって公知であると信じられる。
本明細書で使用されるシンタックス要素は、記述的用語であることに留意されたい。それ自体として、それらは、他のシンタックス要素名の使用を排除しない。
図がフローチャートとして表されるとき、それは対応する装置のブロック図も提供することが理解されるべきである。同様に、図がブロック図として表されるとき、それは対応する方法/処理のフローチャートも提供することが理解されるべきである。
様々な実施形態は、レート歪み最適化を指す。特に、計算の複雑性の制約を多くに仮定して、符号化処理の間、レートと歪みとの間のバランスまたはトレードオフが通常考慮される。それは、レート歪み最適化(RDO)メトリック、最小平均二乗(LMS)、絶対誤差平均(MAE)、または他のそのような測定を通じて測定されてもよい。レート歪み最適化は通常、レートの重み付け合計および歪みの重み付け合計である、レート歪み関数を最小化するとして定式化される。レート歪み最適化問題を解く異なるアプローチが存在する。例えば、アプローチは、全ての考慮されるモードまたはコーディングパラメータ値を含む全ての符号化オプションの広範な試験と共に、符号化および復号の後の再構築された信号のそれらの符号化コストおよび関連する歪みの完全な評価に基づいてもよい。符号化の複雑性、特に、再構築されたものではなく、予測信号または予測残差信号に基づいた近似された歪みの計算による符号化の複雑性を抑えるためにより高速なアプローチも使用されてもよい。取り得る符号化オプションの一部のみについての近似された歪み、および他の符号化オプションについての完全な歪みを使用することなどによって、それらの2つのアプローチの混合も使用されてもよい。他のアプローチは、取り得る符号化オプションのサブセットのみを評価する。より一般的に、多くのアプローチは、最適化を実行する様々な技術のいずれかを採用するが、最適化は必ずしも、符号化コストおよび関連する歪みの両方の完全な評価ではない。
本明細書で説明される実装態様および態様は、例えば、方法もしくは処理、装置、ソフトウェアプログラム、データストリーム、または信号において実装されてもよい。単一の形式の実装態様のコンテキストにおいてのみ議論される場合でさえ(例えば、方法として議論される)、議論される特徴の実装態様は、他の形式(例えば、装置またはプログラム)において実装されてもよい。装置は、例えば、適切なハードウェア、ソフトウェア、およびファームウェアにおいて実装されてもよい。方法は、例えば、処理デバイスを指すプロセッサにおいて実装されてもよく、処理デバイスは概して、例えば、コンピュータ、マイクロプロセッサ、集積回路、またはプログラマブル論理回路を含む。プロセッサはまた、例えば、コンピュータ、携帯電話、ポータブル/携帯情報端末(「PDA」)、エンドユーザの間の情報の通信を促進する他のデバイスなどの通信デバイスを含む。
「1つの実施形態」、「実施形態」、「1つの実装態様」、または「実装態様」と共に、それらの他の変形例への言及は、実施形態と関連して説明された特定の特徴、構造、および特性などが、少なくとも1つの実施形態に含まれることを意味する。よって、フレーズ「1つの実施形態では」、「実施形態では」、「1つの実装態様では」、または「実装態様では」の出現と共に、本出願の全体を通じて様々な位置で出現するいずれかの他の変形例は、全てが同一の実施形態を必ずしも指すわけではない。
加えて、本出願は、情報の様々な部分を「判定すること」に言及してもよい。情報を判定することは、例えば、情報を推定すること、情報を計算すること、情報を予測すること、またはメモリから情報を取り出すことのうちの1つまたは複数を含んでもよい。
更に、本明細書は、情報の様々な部分に「アクセスすること」に言及してもよい。情報にアクセスすることは、例えば、情報を受信すること、情報を取り出すこと(例えば、メモリから)、情報を記憶すること、情報を移動すること、情報を複製すること、情報を計算すること、情報を判定すること、情報を予測すること、または情報を推定することのうちの1つまたは複数を含んでもよい。
加えて、本明細書は、情報の様々な部分を「受信すること」に言及してもよい。「アクセスすること」と共に受信することは、広義な用語であることが意図される。情報を受信することは、例えば、情報にアクセスすること、または情報を取り出すこと(例えば、メモリから)のうちの1つまたは複数を含んでもよい。更に、「受信すること」は典型的には、例えば、情報を記憶すること、情報を処理すること、情報を送信すること、情報を移動すること、情報を複製すること、情報を消去すること、情報を計算すること、情報を判定すること、情報を予測すること、または情報を推定することなどの演算の間、1つの方式または別の方式に含まれてもよい。
例えば、「A/B」、「Aおよび/またはB」、ならびに「AおよびBのうちの少なくとも1つ」のケースにおける「/」、「および/または」、ならびに「~のうちの少なくとも1つ」のいずれかの使用は、第1のリスト化されたオプション(A)のみの選択、第2のリスト化されたオプション(B)のみの選択、または両方のオプション(AおよびB)の選択を包含することを認識されよう。更なる実施例として、「A、B、および/またはC」ならびに「A、B、およびCのうちの少なくとも1つ」のケースでは、そのようなフレーズは、第1のリスト化されたオプション(A)のみの選択、第2のリスト化されたオプション(B)のみの選択、第3のリスト化されたオプション(C)のみの選択、第1のリスト化されたオプションおよび第2のリスト化されたオプション(AおよびB)のみの選択、第1のリスト化されたオプションおよび第3のリスト化されたオプション(AおよびC)のみの選択、第2のリスト化されたオプションおよび第3のリスト化されたオプション(BおよびC)のみの選択、または全ての3つのオプション(A、B、およびC)の選択を包含することが意図される。これは、当業者に対して自明であるように、多くの項目がリスト化されるように拡張されてもよい。
また、本明細書で使用されるように、用語「シグナリング」は、とりわけ、対応するデコーダに何かを示すことを指す。例えば、特定の実施形態では、エンコーダは、複数のコーディングモードまたはフラグの特定の1つをシグナリングする。このようにして、実施形態では、エンコーダ側およびデコーダ側の両方において同一のパラメータが使用される。よって、例えば、エンコーダは、デコーダに特定のパラメータを送信することができ(明示的なシグナリング)、その結果、デコーダは、同一の特定のパラメータを使用することができる。逆に、デコーダが特定のパラメータと共に他のパラメータを既に有している場合、デコーダが特定のパラメータを認識および選択することを単純に可能にするよう送信することなく(非明示的なシグナリング)シグナリングが使用されてもよい。いずれかの実際の関数の送信を回避することによって、様々な実施形態では、ビット節約が実現される。様々な方式においてシグナリングを達成することができることが認識されよう。例えば、様々な実施形態では、対応するデコーダに情報をシグナリングするために、1つまたは複数のシンタックス要素およびフラグなどが使用される。先述したことは、用語「シグナリング」の動詞の形式に関連すると共に、用語「シグナリング」は、本明細書では名詞としても使用されてもよい。
当業者にとって明白であるように、実装態様は、例えば、記憶または送信することができる情報を搬送するようフォーマットされた様々な信号を生成することができる。情報は、例えば、方法を実行するための命令、または説明された実装態様の1つによって生成されたデータを含んでもよい。例えば、信号は、説明された実装態様のビットストリームを搬送するようフォーマットされてもよい。そのような信号は、例えば、電磁気波として((例えば、スペクトルの無線周波数部分を使用して)、またはベースバンド信号としてフォーマットされてもよい。フォーマットは、例えば、データストリームを符号化すること、および符号化されたデータストリームにより搬送波を変調することを含んでもよい。信号が搬送する情報は、例えば、アナログ情報またはデジタル情報であってもよい。信号は、既知のように、様々な異なる有線リンクまたは無線リンクを通じて送信されてもよい。信号は、プロセッサ可読媒体に記憶されてもよい。
様々な一般化され、特殊化された実施形態も本開示の全体を通じてサポートおよび考慮される。本開示に従った実施形態の例は、それらに限定されないが、以下を含む。
概して、実施形態の少なくとも1つの例は、ビデオ符号化のための装置を含んでもよく、装置は、1つまたは複数のプロセッサを含み、1つまたは複数のプロセッサは、複数のコーディングユニットにカレントブロックを分割し、コーディングユニットの少なくとも1つのグループに複数のコーディングユニットのうちの2つ以上をグループ化し、コーディングユニットの少なくとも1つのグループ内の複数のコーディングユニットのうちの2つ以上は、少なくとも1つのコーディングパラメータを共有し、コーディングユニットの少なくとも1つのグループおよび少なくとも1つの共有されたコーディングパラメータに基づいて、カレントブロックを符号化する、ように構成されている。
概して、実施形態の少なくとも1つの例は、ビデオ復号のための装置を含んでもよく、装置は、1つまたは複数のプロセッサを含み、1つまたは複数のプロセッサは、カレントブロックから分割された複数のコーディングユニットのうちの2つ以上を含むコーディングユニットの少なくとも1つのグループを取得し、複数のコーディングユニットのうちの2つ以上は、少なくとも1つのコーディングパラメータを共有し、コーディングユニットの少なくとも1つのグループおよび少なくとも1つの共有されたコーディングパラメータに基づいて、カレントブロックを復号する、ように構成されている。
概して、実施形態の少なくとも1つの例は、ビデオ符号化のための方法を含んでもよく、方法は、複数のコーディングユニットにカレントブロックを分割するステップと、コーディングユニットの少なくとも1つのグループに複数のコーディングユニットのうちの2つ以上をグループ化するステップであって、コーディングユニットの少なくとも1つのグループ内の複数のコーディングユニットのうちの2つ以上は、少なくとも1つのコーディングパラメータを共有する、ステップと、コーディングユニットの少なくとも1つのグループおよび少なくとも1つの共有されたコーディングパラメータに基づいて、カレントブロックを符号化するステップと、を含む。
概して、実施形態の少なくとも1つの例は、ビデオ復号のための方法を含んでもよく、方法は、カレントブロックから分割された複数のコーディングユニットのうちの2つ以上を含むコーディングユニットの少なくとも1つのグループを取得するステップであって、複数のコーディングユニットのうちの2つ以上は、少なくとも1つのコーディングパラメータを共有する、ステップと、コーディングユニットの少なくとも1つのグループおよび少なくとも1つの共有されたコーディングパラメータに基づいて、カレントブロックを復号するステップと、含む。
概して、実施形態の少なくとも1つの例は、ビデオ符号化のための装置を含んでもよく、装置は、1つまたは複数のプロセッサを含み、1つまたは複数のプロセッサは、複数のコーディングユニットにカレントブロックを分割し、コーディングユニットの複数のグループに複数のコーディングユニットをグループ化し、コーディングユニットの複数のグループの各々のグループ内のグループ化されたコーディングユニットは、同一の予測情報を有し、コーディングユニットの複数のグループおよびそれぞれの同一の予測情報に基づいて、カレントブロックを符号化する、ように構成されている。
概して、実施形態の少なくとも1つの例は、ビデオ復号のための装置を含んでもよく、装置は、1つまたは複数のプロセッサを含み、1つまたは複数のプロセッサは、カレントブロックから分割された複数のコーディングユニットに対応するコーディングユニットの複数のグループを取得し、複数のグループ化されたコーディングユニットの各々のグループ内のグループ化されたコーディングユニットは、同一の予測情報を有し、コーディングユニットの複数のグループおよびそれぞれの同一の予測情報に基づいて、カレントブロックを復号する、ように構成されている。
概して、実施形態の少なくとも1つの例は、ビデオ符号化のための方法を含んでもよく、方法は、複数のコーディングユニットにカレントブロックを分割するステップと、コーディングユニットの複数のグループに複数のコーディングユニットをグループ化するステップであって、コーディングユニットの複数のグループの各々のグループ内のグループ化されたコーディングユニットは、同一の予測情報を有する、ステップと、コーディングユニットの複数のグループおよびそれぞれの同一の予測情報に基づいて、カレントブロックを符号化するステップと、を含む。
概して、実施形態の少なくとも1つの例は、ビデオ復号のための方法を含んでもよく、方法は、カレントブロックから分割された複数のコーディングユニットに対応するコーディングユニットの複数のグループを取得するステップであって、複数のグループ化されたコーディングユニットの各々のグループ内のグループ化されたコーディングユニットは、同一の予測情報を有する、ステップと、コーディングユニットの複数のグループおよびそれぞれの同一の予測情報に基づいて、カレントブロックを復号するステップと、を含む。
概して、実施形態の少なくとも1つの例は、本明細書で説明された装置または方法を含んでもよく、コーディングユニットの複数のグループのうちの少なくとも1つは、パイプライン化された復号演算と関連付けられた少なくとも2つの異なるパイプラインユニットと重なる。
概して、実施形態の少なくとも1つの例は、ビデオ符号化のための装置を含んでもよく、装置は、1つまたは複数のプロセッサを含み、1つまたは複数のプロセッサは、複数のコーディングユニットにカレントブロックを分割し、コーディングユニットの少なくとも1つのグループに複数のコーディングユニットのうちの2つ以上をグループ化し、コーディングユニットの少なくとも1つのグループ内の複数のコーディングユニットのうちの2つ以上は、少なくとも1つのコーディングパラメータを共有し、コーディングユニットの少なくとも1つのグループは、パイプライン化された復号演算と関連付けられた少なくとも2つの異なるパイプラインユニットと重なり、コーディングユニットの少なくとも1つのグループおよび少なくとも1つの共有されたコーディングパラメータに基づいて、カレントブロックを符号化する、ように構成されている。
概して、実施形態の少なくとも1つの例は、ビデオ復号のための装置を含んでもよく、装置は、1つまたは複数のプロセッサを含み、1つまたは複数のプロセッサは、カレントブロックから分割された複数のコーディングユニットのうちの2つ以上を含むコーディングユニットの少なくとも1つのグループを取得し、複数のコーディングユニットのうちの2つ以上は、少なくとも1つのコーディングパラメータを共有し、コーディングユニットの少なくとも1つのグループは、パイプライン化された復号演算と関連付けられた少なくとも2つの異なるパイプラインユニットと重なり、コーディングユニットの少なくとも1つのグループおよび少なくとも1つの共有されたコーディングパラメータに基づいて、カレントブロックを復号する、ように構成されている。
概して、実施形態の少なくとも1つの例は、ビデオ符号化のための方法を含んでもよく、方法は、複数のコーディングユニットにカレントブロックを分割するステップと、コーディングユニットの少なくとも1つのグループに複数のコーディングユニットのうちの2つ以上をグループ化するステップであって、コーディングユニットの少なくとも1つのグループ内の複数のコーディングユニットのうちの2つ以上は、少なくとも1つのコーディングパラメータを共有し、コーディングユニットの少なくとも1つのグループは、パイプライン化された復号演算と関連付けられた少なくとも2つの異なるパイプラインユニットと重なる、ステップと、コーディングユニットの少なくとも1つのグループおよび少なくとも1つの共有されたコーディングパラメータに基づいて、カレントブロックを符号化するステップと、を含む。
概して、実施形態の少なくとも1つの例は、ビデオ復号のための方法を含んでもよく、方法は、カレントブロックから分割された複数のコーディングユニットのうちの2つ以上を含むコーディングユニットの少なくとも1つのグループを取得するステップであって、複数のコーディングユニットのうちの2つ以上は、少なくとも1つのコーディングパラメータを共有し、コーディングユニットの少なくとも1つのグループは、パイプライン化された復号演算と関連付けられた少なくとも2つの異なるパイプラインユニットと重なる、ステップと、コーディングユニットの少なくとも1つのグループおよび少なくとも1つの共有されたコーディングパラメータに基づいて、カレントブロックを復号するステップと、を含む。
概して、実施形態の少なくとも1つの例は、ビットストリームを含んでもよく、ビットストリームは、複数のコーディングユニットにカレントブロックを分割し、コーディングユニットの少なくとも1つのグループに複数のコーディングユニットのうちの2つ以上をグループ化し、コーディングユニットの少なくとも1つのグループ内の複数のコーディングユニットのうちの2つ以上は、少なくとも1つのコーディングパラメータを共有し、コーディングユニットの少なくとも1つのグループおよび少なくとも1つの共有されたコーディングパラメータに基づいて、カレントブロックを符号化する、ことによって生成される。
概して、実施形態の少なくとも1つの例は、本明細書で説明されたビットストリームを含んでもよく、ビットストリームを生成することは、パイプライン化された復号演算と関連付けられた少なくとも2つの異なるパイプラインユニットと重なるコーディングユニットのグループに基づいている。
概して、実施形態の少なくとも1つの例は、コーディングユニットのグループを含んでもよく、予測情報を含む少なくとも1つのコーディングパラメータは、コーディングユニットのグループに含まれる2つ以上のコーディングユニットの間で共有される。2つ以上のコーディングユニットの間で共有された予測情報は、同一の予測情報を有する2つ以上のコーディングユニットを含んでもよい。
概して、実施形態の少なくとも1つの例は、コーディングユニットのグループ化を示すよう提供される少なくとも1つのシンタックス要素を含んでもよい。少なくとも1つのシンタックス要素は、同一の予測情報を有するコーディングユニットのグループ内の1つのコーディングユニットのみにおいて提供されてもよい。1つのコーディングユニットは、デコーダ側処理順序において、同一の予測情報を有するコーディングユニットのグループ内の第1のコーディングユニットである。
概して、実施形態の少なくとも1つの例は、コーディングユニットのグループを形成するためのコーディングユニットのグループ化を含んでもよく、グループ化は、ルマ成分またはクロマ成分のうちの少なくとも1つに別個に適用されてもよい。
概して、複数のコーディングユニットにカレントブロックを分割することを含む実施形態の少なくとも1つの例は更に、分割が四分木プラス二分木(QTBT)分割に基づいていることを含んでもよい。
概して、パイプライン化された復号演算と関連付けられた少なくとも2つの異なるパイプラインユニットと重なるコーディングユニットのグループを含む実施形態の少なくとも1つの例は更に、複数の仮想パイプライン復号ユニット(VPDU)のそれぞれの1つに対応する少なくとも2つの異なるパイプラインユニットの各々を含んでもよい。
概して、実施形態の少なくとも1つの例は、カレントツリーノードおよびその子の全てに対応するコーディングユニットのグループを含んでもよい。
概して、実施形態の少なくとも1つの例は、同一の予測情報を有するグループ化されたサブコーディングユニットを含むコーディングユニットのグループを含んでもよい。
概して、実施形態の少なくとも1つの例は、本明細書で説明された装置もしくは方法によって生成されたデータコンテンツ、または本明細書で説明されたビットストリームと関連付けられたデータコンテンツを含む非一時的コンピュータ可読媒体。
概して、実施形態の少なくとも1つの例は、1つ以上のプロセッサによって実行されるとき、本明細書で説明された方法を実行する命令を含むコンピュータプログラム製品を含んでもよい。
概して、実施形態の少なくとも1つの例は、本明細書で説明された装置と、(i)ビデオデータを表すデータを含む信号を受信するように構成されたアンテナ、(ii)ビデオデータを表すデータを含む周波数の帯域に、受信された信号を制限するように構成された帯域リミッタ、および(iii)ビデオデータからの画像を表示するように構成されたディスプレイ、のうちの少なくとも1つと、を含むデバイスを含んでもよい。デバイスは、テレビ信号受信機、セットトップボックス、ゲートウェイデバイス、携帯電話などのモバイルデバイス、ラップトップ、タブレットなど、または他の電子デバイスを含んでもよい。
1つまたは複数の実施形態はまた、本明細書で説明された方法に従って生成されたビットストリームを送信または受信する方法および装置を提供する。
様々な他の実施形態が説明されてきた。他の実施形態は、様々な異なる請求項のカテゴリおよびタイプにわたって、単独またはいずれかの組み合わせにおいて、以下の特徴またはエンティティのいずれかを含んでもよい。
-少なくとも2つのコーディングユニットが少なくとも1つのコーディングパラメータを共有していることのインジケーションを取得することと、インジケーションに基づいてビデオ情報を符号化することと、を含み、符号化は、1つのコーディングユニットのみにおいて共有された少なくとも1つのコーディングパラメータをコーディングする、ビデオ符号化をもたらすこと。
-符号化されたビデオ情報の少なくとも2つのコーディングユニットが少なくとも1つのコーディングパラメータを共有していることのインジケーションを取得することと、インジケーションに基づいて符号化されたビデオ情報を復号することと、を含み、復号は、1つのコーディングユニットのみから、共有された少なくとも1つのコーディングパラメータを取得し、共有された少なくとも1つのコーディングパラメータに基づいて、少なくとも2つのコーディングユニットを復号する、ビデオ復号をもたらすこと。
-ビデオ情報の少なくとも2つのコーディングユニットが少なくとも1つのコーディングパラメータを共有していることを示す1つまたは複数のシンタックス要素を提供し、1つまたは複数のシンタックス要素は、共有された少なくとも1つのコーディングパラメータに基づいて、少なくとも2つのコーディングユニットのビデオ情報を符号化および/または復号することを可能にすること。
-ビデオ情報の少なくとも2つのコーディングユニットが少なくとも1つのコーディングパラメータを共有していることのインジケーションを提供する情報を含むことによって形成されたビットストリームを提供し、含まれる情報は、共有された少なくとも1つのコーディングパラメータに基づいて、少なくとも2つのコーディングユニットに対応するビットストリームにおける符号化されたビデオ情報を復号することを可能にすること。
-エンコーダおよび/またはデコーダにおいて、カレントツリーノードから発行された全ての子CUが同一の予測データを使用していることを示す、コーディング木レベルに関するフラグを提供すること。
-エンコーダおよび/またはデコーダにおいて、何らかの予測データが同一のツリーノードから発行されたCUによって共有される場合、この予測データが、デコーダ側処理順序において、そのグループ内の第1のCUにおいてコーディングされること。
-エンコーダおよび/またはデコーダにおいて、CTUの全体コーディング木内に二項+三分木レベルにおいて現れることができ、または分割階層内に四分木レベルもしくは二項/三分木レベルのいずれかにおいて現れることができるフラグを提供すること。
-エンコーダおよび/またはデコーダにおいて、別個のルマ/クロマコーディング木のケースに対し、考慮されるコーディング木によって関連し、構成要素においてのみ適用されるフラグを提供し、よって、同一の空間領域内でクロマCUではなくルマCUにおいてグループ化を行うことができ、または逆もそうであること。
-エンコーダおよび/またはデコーダにおいて、VPDU制約に従って適合されたデコーダ側に対する処理順序を提供すること。
-エンコーダおよび/またはデコーダにおいて、関連するCUの間でグループ化されることになる、変換関連シンタックス、例えば、cu_mts_flagシンタックス要素およびmts_idxシンタックス要素を提供すること。
-エンコーダおよび/またはデコーダにおいて、他のアプローチと互換性を有するCU分割と関連付けられたシンタックス、例えば、VVCによって考慮されるシンタックスのうちの1つまたは複数を提供すること。
-エンコーダおよび/またはデコーダにおいて、複数のCUの中で予測データをグループ化することをもたらし、シンタックスのグループ化は、CUレベルでシグナリングされること。
-エンコーダおよび/またはデコーダにおいて、複数のCUの中で予測データをグループ化することをもたらし、グループ化は、CUレベルではなく、三項/二項コーディング木レベルでいくつかのCUの中で予測をグループ化することを含んでもよいこと。
-多タイプ木レベルでgrouped_prediction_data_flagシンタックス要素を復号し、サブCUへのカレントCUの再帰的分割処理にgrouped_prediction_data値を渡す、デコーダを提供し、非分割CU復号処理は、追加の引数parent_grouped_prediction_data_flagにより呼び出されてもよいこと。
-エンコーダおよび/またはデコーダにおいて、シンタックスに追加の四分木レベルフラグを含めることをもたらし、追加の引数parent_grouped_prediction_dataが入力として使用され、偽である場合、フラグgrouped_prediction_data_flagは、カレントCUが四分木方式において分割されるケースでは、四分木レベルでシグナリングされる。
-入力grouped_prediction_data_flag値を試験することと、真であり、カレントCUが同一の予測データを共有するCUのグループ内の最初の1つでない場合、同一の予測データを共有するCUのグループ内の第1のCUに基づいて、カレントCUの予測データを導出することを、を含むCU復号処理のためのデコーダを提供すること。
-エンコーダにおいて、予測データのグループ化についてのレート歪み最適化された決定を統合するレート歪み最適化をもたらすこと。
-エンコーダにおいて、
-真である場合、カレントCUを含むコーディング木部において予測データグループ化が使用されるparent_grouped_prediction_flagと、
-複数のCUの中でグループ化される予測データであって、これは、フラグparent_grouped_prediction_flagが真である場合、カレントCUを含む複数のCUによって共有される予測データを表す、予測データと、
を含む引数を含むレート歪み最適化をもたらすこと。
-エンコーダおよび/またはデコーダにおいて、カレントCUに対応するピクチャ領域が予測データグループ化モードにおいて試験されるケースでは、後続の使用のために記憶することができる予測データを提供すること。
-エンコーダおよび/またはデコーダにおいて、予測データに加えて、複数のCUの中で変換タイプシグナリングシンタックスをグループ化することをもたらすこと。
-エンコーダおよび/またはデコーダにおいて、予測データに加えて、複数のCUの中で変換タイプシグナリングシンタックスをグループ化することをもたらし、変換関連データは、mts_flagシンタックス要素およびmts_idxシンタックス要素を含んでもよいこと。
-エンコーダおよび/またはデコーダにおいて、CUがいくつかの他のCUと共にグループ化されるケースでは、cu_mts_flagが、変換タイプ情報を共有するCUの同一のグループ内の先行するCUに基づいて、予測的方式においてコーディングされることをもたらすこと。
-エンコーダおよび/またはデコーダにおいて、CUがいくつかの他のCUと共にグループ化されるケースでは、cu_mts_flagが、変換タイプ情報を共有するグループ化されたCUの同一の集合内のいくつかの先行するCUのcu_mts_flagに基づいて選択されたCABACコンテキストによりコーディングされることをもたらすこと。
-エンコーダおよび/またはデコーダにおいて、CUがいくつかの他のCUと共にグループ化されるケースでは、グループ化されたCUの同一の集合内のいくつかの他のCUのtu_cbf_lumaシンタックス要素、ならびに/またはtu_cbf_cbシンタックス要素およびtu_cbf_crシンタックス要素に条件付きでコーディングされるカレントCUのtu_cbf_lumaシンタックス要素、ならびに/またはtu_cbf_cbシンタックス要素およびtu_cbf_crシンタックス要素を提供すること。
-エンコーダおよび/またはデコーダにおいて、復号処理に対するVPDU制約を考慮した予測データグループ化を実装することをもたらすこと。
-ビデオを処理するエンコーダおよび/またはデコーダにおいて、2つの異なるVPDUに属するブロックの間で何らかの予測データを共有する可能性をもたらすよう、2つのVPDUと重なるCUを分割するために適用される予測(任意選択で、変換)データグループ化方法を実装することをもたらすこと。
-ビデオを処理するエンコーダおよび/またはデコーダにおいて、CUの間の復号順序がVPDUを離れず、後に再訪問する必要があることを表す、処理順序に対するVPDU制約を遵守するように適合されたCUの間の復号順序をもたらすこと。
-ビデオを処理するエンコーダおよび/またはデコーダにおいて、コーディングユニットが復号される順序が、VPDU格子に関してコーディング木の構成に従って変化することができることをもたらすこと。
-エンコーダによって、シグナリングシンタックスから複数のコーディングユニットの中での予測データのグループ化のインジケーションをデコーダが取得することを可能にする要素をシグナリングシンタックスに挿入し、インジケーションに従ってビデオ情報を復号すること。
-説明されたシンタックス要素、またはその変形例のうちの1つまたは複数を含むビットストリームまたは信号。
-説明されたシンタックス要素、またはその変形例のうちの1つまたは複数を含むビットストリームまたは信号を生成すること、送信すること、受信すること、および/または復号すること。
-説明された実施形態のいずれかに従ってビデオ符号化および/またはビデオ復号を実行し、結果として生じる画像を表示する(例えば、モニタ、スクリーン、または他のタイプのディスプレイを使用して)TV、セットトップボックス、携帯電話、タブレット、または他の電子デバイス。
-説明された実施形態のいずれかに従って、符号化された画像を含む信号を受信するようチャネルを調整し(例えば、チューナを使用して)、ビデオ符号化および/またはビデオ復号を実行するTV、セットトップボックス、携帯電話、タブレット、または他の電子デバイス。
-説明された実施形態のいずれかに従って符号化された画像を含む信号を無線で受信し(例えば、アンテナを使用して)、ビデオ符号化および/またはビデオ復号を実行するTV、セットトップボックス、携帯電話、タブレット、または他の電子デバイス。
-コンピュータによって実行されるとき、説明された実施形態のいずれかに従ってビデオ符号化および/またはビデオ復号を実装するプログラムコードを記憶したコンピュータプログラム製品。
-説明された実施形態のいずれかに従ってビデオ符号化および/またはビデオ復号をコンピュータに実行させる実行可能プログラム命令を含む非一時的コンピュータ可読媒体。
-本明細書で説明された1つまたは複数の態様および/または実施形態に従って生成されたビットストリームを記憶したコンピュータ可読記憶媒体。
-本明細書で説明された1つまたは複数の態様および/または実施形態に従って生成されたビットストリームを送信する方法および装置。

Claims (18)

  1. ビデオ符号化のための装置であって、
    1つまたは複数のプロセッサを備え、前記1つまたは複数のプロセッサは、
    木構造に従って、複数のコーディングユニットにビデオブロックを分割し、
    コーディングユニットの少なくとも1つのグループに前記複数のコーディングユニットのうちの2つ以上をグループ化し、前記グループ化することは、前記複数のコーディングユニットの各々とインジケーションを関連付けることを含み、前記インジケーションは、共有されている符号化情報がそれぞれ前記コーディングユニットの前記符号化に用いられることになるかどうかを示し、グループ化されたコーディングユニットは、前記木構造のサブ木に対応し
    前記ビデオブロックの前記複数のコーディングユニットを符号化し、
    有されている符号化情報が用いられることになるというインジケーションに関連付けられるコーディングユニットに対して、前記符号化は、符号化されているコーディングユニットを有してグループ化されるという、およびそのグループにて符号化されることになる1番目であるという前記コーディングユニットから導出される符号化情報に基づいて行われ、
    有されている符号化情報が用いられることにならないというインジケーションに関連付けられるコーディングユニットに対して、前記符号化は、前記コーディングユニットに対して決定されるそれぞれの符号化情報に基づいて行われる
    ように構成されることを特徴とする装置。
  2. ビデオ復号のための装置であって、
    1つまたは複数のプロセッサを備え、前記1つまたは複数のプロセッサは、
    木構造に従ってビデオブロックから分割された複数のコーディングユニットを、ビットストリームから取得し、
    前記複数のコーディングユニットの各コーディングユニットに対してインジケーションを取得し、前記インジケーションは、共有されている符号化情報が、前記木構造のサブ木に対応する、それぞれ前記コーディングユニットを含むコーディングユニットのグループについての前記復号に用いられることになるかどうかを示し、
    前記ビデオブロックの前記複数のコーディングユニットを復号し、
    有されている符号化情報が用いられることになるというインジケーションに関連付けられるコーディングユニットに対して、前記復号は、復号されているコーディングユニットを有してグループ化されるという、およびそのグループにて復号されることになる1番目であるという前記コーディングユニットから導出される符号化情報に基づいて行われ、
    前記共有されている符号化情報が用いられることにならないというインジケーションに関連付けられるコーディングユニットに対して、前記復号は、前記ビットストリームから構文解析されるそれぞれの符号化情報に基づいて行われる
    ように構成されることを特徴とする装置。
  3. ビデオ符号化のための方法であって、
    木構造を用いて、複数のコーディングユニットにビデオブロックを分割することと、
    コーディングユニットの少なくとも1つのグループに前記複数のコーディングユニットのうちの2つ以上をグループ化することであって、前記グループ化することは、前記複数のコーディングユニットの各々とインジケーションを関連付けることを含み、前記インジケーションは、共有されている符号化情報がそれぞれ前記コーディングユニットの前記符号化に用いられることになるかどうかを示し、グループ化されたコーディングユニットは、前記木構造のサブ木に対応する、ことと、
    前記ビデオブロックの前記複数のコーディングユニットを符号化することであって、
    有されている符号化情報が用いられることになるというインジケーションに関連付けられるコーディングユニットに対して、前記符号化は、符号化されているコーディングユニットを有してグループ化されるという、およびそのグループにて符号化されることになる1番目であるという前記コーディングユニットから導出される符号化情報に基づいて行われ、
    前記共有されている符号化情報が用いられることにならないというインジケーションに関連付けられるコーディングユニットに対して、前記符号化は、前記コーディングユニットに対して決定されるそれぞれの符号化情報に基づいて行われる、
    ことと
    を備えることを特徴とする方法。
  4. ビデオ復号のための方法であって、
    木構造に従ってビデオブロックから分割された複数のコーディングユニットを、ビットストリームから取得することと、
    前記複数のコーディングユニットの各コーディングユニットに対してインジケーションを取得することであって、前記インジケーションは、共有されている符号化情報が、前記木構造のサブ木に対応する、それぞれ前記コーディングユニットを含むコーディングユニットのグループについての前記復号に用いられることになるかどうかを示す、ことと、
    前記ビデオブロックの前記複数のコーディングユニットを復号することであって、
    有されている符号化情報が用いられることになるというインジケーションに関連付けられるコーディングユニットに対して、前記復号は、復号されているコーディングユニットを有してグループ化されるという、およびそのグループにて復号されることになる1番目であるという前記コーディングユニットから導出される符号化情報に基づいて行われ、
    前記共有されている符号化情報が用いられることにならないというインジケーションに関連付けられるコーディングユニットに対して、前記復号は、前記ビットストリームから構文解析されるそれぞれの符号化情報に基づいて行われる、
    ことと
    を備えることを特徴とする方法。
  5. 前記共有される符号化情報は予測情報を含むことを特徴とする請求項1に記載の装置。
  6. 前記インジケーションは、コーディングユニットのグループ化を示す少なくとも1つのシンタックス要素に関連付けられることを特徴とする請求項1に記載の装置。
  7. 前記グループ化することは、ルマ成分またはクロマ成分のうちの少なくとも1つに別個に適用されることを特徴とする請求項1に記載の装置。
  8. 前記共有される符号化情報は予測情報を含むことを特徴とする請求項2に記載の装置。
  9. 前記インジケーションは、コーディングユニットのグループ化を示す少なくとも1つのシンタックス要素に関連付けられることを特徴とする請求項2に記載の装置。
  10. グループ化することは、ルマ成分またはクロマ成分のうちの少なくとも1つに別個に適用されることを特徴とする請求項2に記載の装置。
  11. 前記1つまたは複数のプロセッサは、
    リーノードの1つまたは複数の親ノードに関連付けられた、先行して符号化されたグループ化情報は、共有されている符号化情報が、前記1つまたは複数の親ノードから導出されたコーディングユニットに対して用いられることにならないことを示すならば、前記木構造の記ツリーノードに関連付けられたグループ化情報を符号化する
    ようにさらに構成されることを特徴とする請求項に記載の装置。
  12. 前記複数のコーディングユニットの各々に対して前記インジケーションを前記取得することは、
    前記木構造のツリーノードの親ノードに関連付けられたグループ化情報を取得することと、
    前記取得されたグループ化情報は、共有されている符号化情報が用いられることになることを示すならば、前記ツリーノードの子を通じて前記取得されたグループ化情報を伝搬させることと、
    前記取得されたグループ化情報は、共有されている符号化情報が用いられることにならないことを示すならば、前記ビットストリームから、前記ツリーノードに関連付けられたグループ化情報を構文解析し、前記ツリーノードの前記子を通じて前記構文解析されたグループ化情報を伝搬させることと
    を含むことを特徴とする請求項に記載の装置。
  13. 1つまたは複数のプロセッサによって実行されると、前記1つまたは複数のプロセッサに請求項3に記載の方法を行わせることを特徴とするコンピュータープログラム。
  14. 1つまたは複数のプロセッサによって実行されると、前記1つまたは複数のプロセッサに請求項4に記載の方法を行わせることを特徴とするコンピュータープログラム。
  15. 請求項1、5,6、または7のいずれか一項に記載の装置と、
    (i)信号を受信するように構成されたアンテナであって、前記信号はビデオデータを表すデータを含む、アンテナ、
    (ii)前記ビデオデータを表す前記データを含む周波数の帯域に、前記受信された信号を制限するように構成された帯域リミッタ、および
    (iii)前記ビデオデータからの画像を表示するように構成されたディスプレイ
    のうちの少なくとも1つと
    を備えたことを特徴とするデバイス。
  16. 請求項2、8、9、10、11、または12のいずれか一項に記載の装置と、
    (i)信号を受信するように構成されたアンテナであって、前記信号はビデオデータを表すデータを含む、アンテナ、
    (ii)前記ビデオデータを表す前記データを含む周波数の帯域に、前記受信された信号を制限するように構成された帯域リミッタ、および
    (iii)前記ビデオデータからの画像を表示するように構成されたディスプレイ
    のうちの少なくとも1つと
    を備えたことを特徴とするデバイス。
  17. 前記デバイスは、テレビ信号受信機、セットトップボックス、ゲートウェイデバイス、モバイルデバイス、または他の電子デバイスのうちの1つを含むことを特徴とする請求項15に記載のデバイス。
  18. 前記デバイスは、テレビ信号受信機、セットトップボックス、ゲートウェイデバイス、モバイルデバイス、または他の電子デバイスのうちの1つを含むことを特徴とする請求項16に記載のデバイス。
JP2021524145A 2018-11-06 2019-10-31 ビデオ符号化および復号のための複数のコーディングユニットの中でグループ化するパラメータ Active JP7506063B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP18306450.0 2018-11-06
EP18306450 2018-11-06
PCT/US2019/059028 WO2020096848A1 (en) 2018-11-06 2019-10-31 Parameter grouping among plural coding units for video encoding and decoding

Publications (3)

Publication Number Publication Date
JP2022506629A JP2022506629A (ja) 2022-01-17
JPWO2020096848A5 JPWO2020096848A5 (ja) 2023-06-01
JP7506063B2 true JP7506063B2 (ja) 2024-06-25

Family

ID=67436900

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021524145A Active JP7506063B2 (ja) 2018-11-06 2019-10-31 ビデオ符号化および復号のための複数のコーディングユニットの中でグループ化するパラメータ

Country Status (6)

Country Link
US (2) US11785236B2 (ja)
EP (1) EP3878179A1 (ja)
JP (1) JP7506063B2 (ja)
CN (1) CN113273198A (ja)
MX (1) MX2021005255A (ja)
WO (1) WO2020096848A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020156572A1 (en) * 2019-02-03 2020-08-06 Beijing Bytedance Network Technology Co., Ltd. Unsymmetrical quad-tree partitioning

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013524708A (ja) 2010-04-13 2013-06-17 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 標本配列のマルチツリーの細分割での継承
JP2013542691A (ja) 2010-11-04 2013-11-21 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ ブロック統合およびスキップモードをサポートする画像符号化
US20140362919A1 (en) 2013-06-07 2014-12-11 Apple Inc. Coherence groups: region descriptors for low bit rate encoding
WO2018164505A1 (ko) 2017-03-09 2018-09-13 주식회사 케이티 영상 부호화 또는 복호화 방법 및 장치

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050024487A1 (en) * 2003-07-31 2005-02-03 William Chen Video codec system with real-time complexity adaptation and region-of-interest coding
KR101356448B1 (ko) 2008-10-01 2014-02-06 한국전자통신연구원 예측 모드를 이용한 복호화 장치
US20120114034A1 (en) * 2010-11-08 2012-05-10 Mediatek Inc. Method and Apparatus of Delta Quantization Parameter Processing for High Efficiency Video Coding
US10244239B2 (en) * 2010-12-28 2019-03-26 Dolby Laboratories Licensing Corporation Parameter set for picture segmentation
US9826244B2 (en) * 2013-01-08 2017-11-21 Qualcomm Incorporated Device and method for scalable coding of video information based on high efficiency video coding
KR102169610B1 (ko) 2013-08-21 2020-10-23 삼성전자주식회사 인트라 예측 모드 결정 방법 및 장치
WO2016074147A1 (en) 2014-11-11 2016-05-19 Mediatek Singapore Pte. Ltd. Separated coding tree for luma and chroma
EP3430808A4 (en) * 2016-03-16 2020-01-15 Mediatek Inc. METHOD AND DEVICE FOR PROCESSING VIDEO DATA WITH RESTRICTED BLOCK SIZE IN VIDEO CODING
CN109076210B (zh) * 2016-05-28 2021-04-09 联发科技股份有限公司 视频编解码方法和装置
US11039147B2 (en) * 2016-05-28 2021-06-15 Mediatek Inc. Method and apparatus of palette mode coding for colour video data
KR102353778B1 (ko) 2016-10-11 2022-01-20 한국전자통신연구원 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
KR102601268B1 (ko) * 2017-02-24 2023-11-10 주식회사 케이티 비디오 신호 처리 방법 및 장치
EP3571842B1 (en) * 2017-03-23 2023-05-31 Huawei Technologies Co., Ltd. Devices and methods for video coding
EP3410722A1 (en) * 2017-05-31 2018-12-05 Thomson Licensing Method and apparatus for low-complexity bi-directional intra prediction in video encoding and decoding
US10645385B2 (en) * 2017-06-28 2020-05-05 Mediatek Inc. Method and apparatus for performing fixed-size slice encoding with slice boundary prediction

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013524708A (ja) 2010-04-13 2013-06-17 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 標本配列のマルチツリーの細分割での継承
JP2013542691A (ja) 2010-11-04 2013-11-21 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ ブロック統合およびスキップモードをサポートする画像符号化
US20140362919A1 (en) 2013-06-07 2014-12-11 Apple Inc. Coherence groups: region descriptors for low bit rate encoding
WO2018164505A1 (ko) 2017-03-09 2018-09-13 주식회사 케이티 영상 부호화 또는 복호화 방법 및 장치

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Raffaele De Forni, and David S. Taubman,ON THE BENEFITS OF LEAF MERGING IN QUAD-TREE MOTION MODELS,ICIP 2005,IEEE,2005年11月,pp.1-4
Reji Mathew, and David S. Taubman,Quad-Tree Motion Modeling with Leaf Merging,IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY,IEEE,2010年10月,VOL.20, NO.10,pp.1331 - 1345

Also Published As

Publication number Publication date
US20210385471A1 (en) 2021-12-09
MX2021005255A (es) 2021-09-08
JP2022506629A (ja) 2022-01-17
US11785236B2 (en) 2023-10-10
EP3878179A1 (en) 2021-09-15
CN113273198A (zh) 2021-08-17
WO2020096848A1 (en) 2020-05-14
US20230421788A1 (en) 2023-12-28

Similar Documents

Publication Publication Date Title
US20210377553A1 (en) Virtual pipeline for video encoding and decoding
JP7509763B2 (ja) ビデオエンコーディングおよびデコーディングにおけるアフィンモードシグナリング
CA3149102A1 (en) Secondary transform for video encoding and decoding
US20220060688A1 (en) Syntax for motion information signaling in video coding
US20210400276A1 (en) Quantization for video encoding and decoding
WO2020226944A1 (en) Chroma processing for video encoding and decoding
CN114270844A (zh) 用于视频编码和解码的运动向量处理
JP7506063B2 (ja) ビデオ符号化および復号のための複数のコーディングユニットの中でグループ化するパラメータ
WO2021122416A1 (en) Subblock merge candidates in triangle merge mode
CN114930831A (zh) 空间预测因子扫描顺序
CN114208194A (zh) 用于视频编码和解码的帧间预测参数推导
US20230018401A1 (en) Motion vector prediction in video encoding and decoding
JP7509773B2 (ja) 二重木を伴う現ピクチャ参照ブロックベクトル初期化
US20220103811A1 (en) Extended motion information comparison
WO2021001514A1 (en) Signaling of merge indices for triangle partitions
KR20220061137A (ko) 비디오 코딩을 위한 코딩 모드 정보 전파
WO2020117628A1 (en) Method and device for picture encoding and decoding
KR20210074388A (ko) 코딩 유형 또는 코딩 트리 유형의 시그널링을 이용한 비디오 인코딩 및 디코딩을 위한 방법 및 장치

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210707

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221031

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230524

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20231102

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231114

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20240209

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240410

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240514

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240613

R150 Certificate of patent or registration of utility model

Ref document number: 7506063

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150