JP7414976B2 - エンコーダ、デコーダ、および、対応する方法 - Google Patents
エンコーダ、デコーダ、および、対応する方法 Download PDFInfo
- Publication number
- JP7414976B2 JP7414976B2 JP2022521050A JP2022521050A JP7414976B2 JP 7414976 B2 JP7414976 B2 JP 7414976B2 JP 2022521050 A JP2022521050 A JP 2022521050A JP 2022521050 A JP2022521050 A JP 2022521050A JP 7414976 B2 JP7414976 B2 JP 7414976B2
- Authority
- JP
- Japan
- Prior art keywords
- layer
- video
- prediction
- syntax element
- index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 145
- 239000010410 layer Substances 0.000 claims description 328
- 239000011229 interlayer Substances 0.000 claims description 69
- 238000004590 computer program Methods 0.000 claims description 6
- 238000013139 quantization Methods 0.000 description 75
- 238000012545 processing Methods 0.000 description 57
- 230000008569 process Effects 0.000 description 37
- 238000004891 communication Methods 0.000 description 29
- 238000000638 solvent extraction Methods 0.000 description 29
- 239000013598 vector Substances 0.000 description 26
- 239000000872 buffer Substances 0.000 description 24
- 238000005192 partition Methods 0.000 description 21
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 20
- 238000010586 diagram Methods 0.000 description 17
- 241000023320 Luma <angiosperm> Species 0.000 description 16
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 16
- 230000005540 biological transmission Effects 0.000 description 14
- 230000006870 function Effects 0.000 description 12
- 239000011449 brick Substances 0.000 description 11
- 238000001914 filtration Methods 0.000 description 11
- 230000007774 longterm Effects 0.000 description 11
- 238000003491 array Methods 0.000 description 10
- 230000003044 adaptive effect Effects 0.000 description 9
- 230000011664 signaling Effects 0.000 description 9
- 230000006835 compression Effects 0.000 description 7
- 238000007906 compression Methods 0.000 description 7
- 230000002123 temporal effect Effects 0.000 description 7
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 6
- 230000001419 dependent effect Effects 0.000 description 6
- 230000009466 transformation Effects 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 5
- 230000000295 complement effect Effects 0.000 description 5
- 238000013500 data storage Methods 0.000 description 5
- 238000009795 derivation Methods 0.000 description 5
- 238000007781 pre-processing Methods 0.000 description 5
- 230000011218 segmentation Effects 0.000 description 4
- 101150114515 CTBS gene Proteins 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000012805 post-processing Methods 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 101150039623 Clip1 gene Proteins 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000007620 mathematical function Methods 0.000 description 2
- 230000007727 signaling mechanism Effects 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 241001482237 Pica Species 0.000 description 1
- 238000012952 Resampling Methods 0.000 description 1
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 1
- 101100108191 Vibrio parahaemolyticus serotype O3:K6 (strain RIMD 2210633) add gene Proteins 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000002146 bilateral effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/184—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/187—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
- H04N19/31—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
ここで、レイヤは、同一のレイヤインデックスを有するコード化ピクチャのシーケンスを含む。
ここで、1つ以上の第2レイヤのレイヤインデックスは、第1レイヤのレイヤインデックスよりも小さい。
ここで、異なる第2シンタックス要素に関連する第2レイヤは、異なるレイヤインデックスを伴う。
ここで、1つ以上の第2シンタックス要素は、1つ以上の第2レイヤと一対一の対応関係にある。
ここで、ビットストリームは1つ以上のコード化ビデオシーケンス(CVS)を形成するビットのシーケンスである。
ここで、コード化ビデオシーケンス(CVS)は、AUのシーケンスである。
ここで、コード化レイヤビデオシーケンス(CLVS)は、同じ値のnuh_layer_idを持つPUのシーケンスである。
ここで、アクセスユニット(AU)は、異なるレイヤに属し、かつ、DPBからの出力について同じ時間に関連付けられたコード化ピクチャを含む、PUの集合である。
ここで、ピクチャユニット(PU)は、指定された分類規則に従って互いに関連し、デコーディングの順番に連続しており、そして、正確に1つのコード化ピクチャを含む、NALユニットの集合である。
ここで、インターレイヤ参照ピクチャ(ILRP)は、現在ピクチャと同じAU内のピクチャであり、nuh_layer_idは現在ピクチャのnuh_layer_idより小さい。
ここで、SPSは、ゼロ以上の全体CLVSに対して適用するシンタックス要素を含んでいるシンタックス構造である。
ここで、レイヤAがレイヤBを参照レイヤとして使用する場合、レイヤBはレイヤAの直接的な参照レイヤである。レイヤAがレイヤBを参照レイヤとして使用し、レイヤBがレイヤCを参照レイヤとして使用るが、レイヤAがレイヤCを参照レイヤとして使用しない場合、レイヤCはレイヤAの直接的な参照レイヤではない。
インデックスiを有するレイヤがインターレイヤ予測を使用するか否かを指定している、第1シンタックス要素を解析するステップであり、iは整数であり、かつ、iは0より大きい、ステップ。
第1条件が満たされた場合、インデックスjを有するレイヤがインデックスiを有するレイヤの直接的な参照レイヤであるか否かを指定している、第2シンタックス要素を解析するステップであり、ここで、第1条件は、第1シンタックス要素が、インデックスiを有するレイヤはインターレイヤ予測を使用することができ、jはi-1に等しく、かつ、jより小さいインデックスを有するレイヤのうちいずれか1つは、インデックスiを有するレイヤの直接的な参照レイヤではないこと、を指定すること、を含むこと。
第2シンタックス要素の値に基づいて、インデックスiを有するレイヤのピクチャを予測するステップ。
インデックスiを有するレイヤがインターレイヤ予測を使用するか否かを指定している、第1シンタックス要素を解析するステップであり、iは整数であり、かつ、iは0より大きい、ステップ。
条件が満たされた場合、インデックスjを有するレイヤの画像を、インデックスiを有するレイヤの直接的な参照レイヤとして使用して、インデックスiを有するレイヤのピクチャを予測するステップであり、ここで、jは整数であり、かつ、jはi-1に等しく、ここで、本条件は、インデックスiを有するレイヤがインターレイヤ予測を使用し得ることを指定するシンタックス要素を含む、ステップ。
少なくとも1つの長期参照ピクチャ(LTRP)が、コード化ビデオシーケンス(CVS)内のコード化ピクチャのインター予測のために使用されるか否かを指定しているシンタックス要素を解析するステップ。ここで、少なくとも1つのLTRPの各ピクチャは「長期参照用(“used for long-term reference”)」としてマーク付けされるが、インターレイヤ参照ピクチャ(ILRP)ではない。
シンタックス要素の値に基づいて、CVS内の1つ以上のコード化ピクチャを予測するステップ。
条件が満たされているか否かを決定するステップであり、ここで、全条件は、現在レイヤのレイヤインデックスがプリセット値よりも大きいことを含む、ステップ。
条件が満たされる場合、少なくとも1つのインターレイヤ参照ピクチャ(ILRP)が、コード化ビデオシーケンス(CVS)内の任意のコード化ピクチャのインター予測のために使用されるか否かを指定している第1シンタックス要素を解析するステップ。
第1シンタックス要素の値に基づいて、CVS内の1つ以上のコード化ピクチャを予測するステップ。
条件が満たされているか否かを決定するステップであり、ここで、全条件は、現在レイヤのレイヤインデックスが、プリセット値より大きく、かつ、参照ピクチャリスト構造内の現在エントリがILRPエントリであることを含む、ステップ。
条件が満たされる場合、現在レイヤの直接的な従属レイヤのリストに対するインデックスを指定しているシンタックス要素を解析するステップ。
直接的な従属レイヤのリストに対するインデックスを使用して現在のILRPが獲得される、現在エントリの参照ピクチャリスト構造に基づいて、CVS内の1つ以上のコード化ピクチャを予測するステップ。
1つ以上のプロセッサ、および、
前記プロセッサに結合され、かつ、前記プロセッサによる実行のためのプログラミングを保管している非一時的コンピュータ読取り可能な記憶媒体であり、前記プログラミングは、前記プロセッサによって実行されると、先行する請求項のいずれか一項に記載の方法を実行するように前記デコーダを構成する、非一時的コンピュータ読取り可能な記憶媒体。
1つ以上のプロセッサ、および、
前記プロセッサに結合され、かつ、前記プロセッサによる実行のためのプログラミングを保管している非一時的コンピュータ読取り可能な記憶媒体であり、前記プログラミングは、前記プロセッサによって実行されると、先行する請求項のいずれか一項に記載の方法を実行するように前記エンコーダを構成する、非一時的コンピュータ読取り可能な記憶媒体。
を介して、もしくは、任意の種類のネットワーク、例えば有線または無線ネットワーク、もしくは、それらの任意の組み合せ、または任意の種類のプライベートおよびパブリックネットワーク、またはそれらの任意の種類の組み合せを介して、エンコーディングされた映像データ21またはエンコーディングされたデータ13を送信または受信するように構成され得る。
図2は、本出願の技術を実施するように構成された、例示的なビデオエンコーダ20の概略ブロック図を示している。図2の例において、ビデオエンコーダ20は、入力201(または、入力インターフェイス201)、残差計算ユニット204、変換処理ユニット206、量子化ユニット208、逆量子化ユニット210、および、逆変換処理ユニット212、再構成ユニット214、ループフィルタユニット220、デコーディングされた映像バッファ230、モード選択ユニット260、エントロピーエンコーディングユニット270、および、出力ユニット272(または、出力インターフェイス272)を含んでいる。モード選択ユニット260は、インター予測ユニット244、イントラ予測ユニット254、およびパーティション分割ユニット262、を含んでよい。インター予測ユニット244は、動き推定ユニットおよび動き補償ユニット(図示なし)を含んでよい。図2に示されるようなビデオエンコーダ20は、また、ハイブリッドビデオコーデックに応じた、ハイブリッドビデオエンコーダまたビデオエンコーダとしても参照される。
エンコーダ20は、例えば入力201を介して、ピクチャ7(または、映像データ17)、例えばビデオまたはビデオシーケンスを形成する一連のピクチャに係る映像を受信するように構成され得る。受信されたピクチャまたは映像データは、また、前処理されたピクチャ19(または、前処理された映像データ19)であってもよい。簡潔のために、以下の説明は、図17を参照する。ピクチャ17は、また、現在ピクチャまたはコーディングされるピクチャとしても参照され得る(特には、ビデオコーディングにおいて、現在ピクチャを、他のピクチャ、例えば、同じビデオシーケンス、すなわち、現在ピクチャも、また、含むビデオシーケンス、に係る以前にエンコーディング及び/又はデコーディングされたピクチャから区別するため)。
残差計算ユニット204は、ピクチャブロック203および予測ブロック265に基づいて、残差ブロック205(残差ブロック205としても、また、参照される)を計算するように構成することができる(予測ブロック265についてのさらなる詳細は後述される)。例えば、ピクチャブロック203のサンプル値から予測ブロック265のサンプル値を差し引くことによって、サンプル毎に(ピクセル毎に)サンプル領域における残差ブロック205を獲得する。
変換処理ユニット206は、変換領域における変換係数207を獲得するために、残差ブロック205のサンプル値について、変換、例えば離散コサイン変換(DCT)または離散サイン変換(DST)、を適用するように構成され得る。変換係数207は、また、変換残差係数としても参照され、そして、変換領域における残差ブロック205を表すことができる。
量子化ユニット208は、例えば、スカラー量子化またはベクトル量子化を適用することによって、量子化係数209を獲得するために、変換係数207を量子化するように構成され得る。量子化係数209は、また、量子化変換係数209または量子化残差係数209としても参照される。
逆量子化ユニット210は、脱量子化(dequantized)係数211を獲得するために、例えば、量子化ユニット208と同じ量子化ステップサイズに基づいて、または、使用して、量子化ユニット208によって適用される量子化スキームの逆数を適用することによって、量子化係数に量子化ユニット208の逆量子化を適用するように構成されている。脱量子化係数211は、また、脱量子化残差係数211しても参照としても参照され、かつ、-典型的には、量子化による損失のために変換係数と同一ではないが-変換係数207に対応している。
逆変換処理ユニット212は、変換処理ユニット206によって適用された変換の逆変換、例えば逆離散コサイン変換(DCT)、逆離散サイン変換(DST)、または、他の逆変換を適用するように構成されており、サンプル領域において再構成された残差ブロック213(または、対応する脱量子化係数213)を獲得する。再構成された残差ブロック213は、また、変換ブロック213としても参照される。
再構成ユニット214(例えば、加算器または足し算器214)は、変換ブロック213(すなわち、再構成された残差ブロック213)を、予測ブロック265に追加するように構成されており、例えば、―サンプル毎に―再構成された残差ブロック213のサンプル値と予測ブロック265のサンプル値を加算することによって、サンプル領域における再構成ブロック215を獲得する。
ループフィルタユニット220(または、短く「ループフィルタ(“loop filter”)」220)は、フィルタリングされたブロック221を獲得するために、再構成されたブロック215をフィルタリングするように、または、一般的に、フィルタリングされたサンプル値を獲得するために、再構成されたサンプルをフィルタリングするように構成されている。ループフィルタユニットは、例えば、ピクセルの遷移を滑らかにするように、または、そうでなければ、ビデオ品質を改善するように構成されている。ループフィルタユニット220は、デブロッキング(deblocking)フィルタ、サンプル適応オフセット(SAO)フィルタ、または、1つ以上の他のフィルタ、例えば、適応ループフィルタ(ALF)、ノイズ抑制フィルタ(NSF)、または、それらの任意の組み合せ、といった1つ以上のループフィルタを含んでもよい。一つの実施形態において、ループフィルタユニット220は、デブロッキングフィルタ、SAOフィルタ、および、ALFフィルタを含んでよい。フィルタリングプロセスの順序は、デブロッキング、SAO、そして、ALFであってよい。別の例においては、クロマスケーリングを用いたルママッピング(LMCS)と呼ばれるプロセス(すなわち、適応ループ内リシェイパ)が追加される。この処理は、デブロッキングの前に実行される。別の例において、デブロッキングプロセスは、また、内部サブブロックエッジ、例えば、アフィンサブブロックエッジ、ATMVPサブブロックエッジ、サブブロック変換(SBT)エッジ、および、イントラサブパーティション(ISP)エッジに対して適用されてもよい。ループフィルタユニット220は、図2ではインループフィルタとして示されているが、他のコンフィグレーションにおいて、ループフィルタユニット220は、ポスト・ループフィルタとして実装されてよい。フィルタリングされたブロック221は、また、フィルタリングされた再構成ブロック221としても参照され得る。
デコーディングされたピクチャバッファ(DPB)230は、ビデオエンコーダ20によってビデオデータをエンコーディングするために、参照ピクチャを保管するメモリであってよく、または、一般的な参照映像データ内にあってよい。DPB 230は、シンクロナスDRAM(ADRAM)、磁気抵抗RAM(MRAM)、抵抗変化型RAM(RRAM)、または他のタイプのメモリデバイスを含む、ダイナミックランダムアクセスメモリ(DRAM)といった、種々のメモリデバイスのいずれかによって形成され得る。デコーディングされたピクチャバッファ(DPB)230は、1つ以上のフィルタリングされたブロック221を保管するように構成され得る。デコーディングされたピクチャバッファ230は、さらに、同じ現在ピクチャまたは異なるピクチャ、例えば以前に再構成されたピクチャ、に係る、他の以前にフィルタリングされたブロック、例えば以前に再構成およびフィルタリングされたブロック221)を保管するように構成され得る。そして、例えば、インター予測のために、完全な以前に再構成、すなわちデコーディング、されたピクチャ(および、対応する参照ブロックおよびサンプル)、及び/又は、部分的に再構成された現在ピクチャ(および、対応する参照ブロックおよびサンプル)を提供し得る。デコーディングされたピクチャバッファ(DPB)230は、また、1つ以上の再構成されたフィルタリングされていないブロック215、または、例えば、再構成されたブロック215がループフィルタユニット220によってフィルタリングされない場合には、一般的にフィルタリングされていない再構成されたサンプル、もしくは、再構成されたブロックまたはサンプルの任意の他のさらに処理されたバージョン、を保管するようにも構成され得る。
モード選択ユニット260は、パーティション分割(partitioning)ユニット262、インター予測ユニット244、およびイントラ予測ユニット254を含み、そして、元の映像データ、例えば元のブロック203(現在ピクチャ17の現在ブロック203)、および、再構成された映像データ、例えばフィルタリングされ、かつ/あるいは、フィルタリングされていない、同じ(現在)ピクチャの再構成されたサンプルまたはブロック、及び/又は、1つ又は複数の以前にデコーディングされたピクチャから、例えば、デコーディングされたピクチャバッファ230または他のバッファ(例えばラインバッファ、図示なし)からのものを、受信または獲得するように構成されている。再構成された映像データは、予測ブロック265または予測器265を獲得するために、予測、例えばインター予測またはイントラ予測、のための参照ピクチャデータとして使用される。
パーティション分割ユニット262は、映像シーケンスからのピクチャをコーディングツリーユニット(CTU)のシーケンスへとパーティション分割するように構成され得る。そして、パーティション分割ユニット262は、コーディングツリーユニット(CTU)203を、より小さなパーティション、例えば正方形または長方形サイズのより小さいブロック、へとパーティション分割(またはスプリット)することができる。3つのサンプルアレイを有するピクチャについて、CTUは、ルマサンプルのN×Nブロックと、クロマサンプルの2つの対応するブロックと一緒に構成されている。CTUにおけるルマブロックの最大許容サイズは、開発中のバーサタイルビデオコーディング(VVC)では128×128であると指定されているが、将来には128×128ではない値、例えば256×256、であると指定することができる。ピクチャのCTUは、スライス/タイル・グループ、タイル、またはブリックとして、クラスタ化/グループ化され得る。タイルは、ピクチャの矩形領域をカバーし、そして、タイルは、1つ又は複数のブリックへと分割することができる。ブリックは、タイル内の複数のCTU列から構成されている。複数のブリックへとパーティション分割されていないタイルは、ブリックとして参照され得る。しかしながら、ブリックは、タイルの真のサブセットであり、かつ、タイルとしては参照されない。VVCでサポートされるタイルグループには2つのモードが存在し、すなわち、ラスタスキャン(raster-scan)スライス/タイル・グループモードおよび矩形スライスモードである。ラスタスキャン・タイルグループモードにおいて、スライス/タイル・グループは、ピクチャのタイル・ラスタスキャンにおけるタイルのシーケンスを含む。矩形スライスモードにおいて、スライスは、ピクチャの矩形領域を集合的に形成するピクチャの多くのブリックを含む。矩形スライス内のブリックは、スライスのブリック・ラスタスキャンの順である。これらのより小さなブロック(サブブロックとしても、また、参照される)は、なおもより小さなパーティションへと、さらにパーティション分割され得る。これは、また、ツリーパーティション分割または階層ツリーパーティション分割としても参照され、ここで、ルートブロック、例えばルートツリーレベル0(階層レベル0、深度0)、は、再帰的に分割され得る。例えば、次の下位ツリーレベル、例としてツリーレベル1(階層レベル1、深度1)、のノードの2つ以上のブロックへとパーティション分割され、ここで、これらのブロックは、パーティション分割が終了するまで、次の下位レベル、例えばツリーレベル2(階層レベル2、深度2)等、の2つ以上のブロックへと再びパーティション分割され得る。終了は、例えば、最大ツリー深度または最小ブロックサイズに達するなどの、終了基準が満たされるからである。それ以上パーティション分割されないブロックは、また、ツリーのリーフブロックまたはリーフノードとしても参照される。2つのパーティションへの分割を使用するツリーはバイナリツリー(BT)として参照され、3つのパーティションへの分割を使用するツリーはターナリツリー(ternary tree、TT)として参照され、そして、4つのパーティションへの分割を使用するツリーはクワッドツリー(quad tree、QT)として参照される。
一つの例として、Intra Sub-Partitions (ISP) ツールは、ブロックサイズに応じて、ルミナンス内予測ブロックを縦方向または横方向に2つまたは4つのサブパーティションに分割することができる。
イントラ予測モードのセットは、35個の異なるイントラ予測モードを含み得る。例として、HEVCで定義されているように、例えば、DC(または平均)モードおよびプラナーモード(planar mode)のような非方向モード、または、方向モードである。もしくは、67個の異なるイントラ予測モードを含み得る。例として、VVCで定義されているように、例えば、DC(または平均)モードおよびプラナーモードのような非方向モード、または、方向モードである。一つの例として、いくつかの従来の角度イントラ予測モードが、例えばVVCで定義されるように、非正方形ブロックについて、広角イントラ予測モードと適応的に置き換えられる。別の例として、DC予測のための分割演算を回避するために、非正方形ブロックについて、平均を計算するために、より長い辺だけが使用される。そして、プレーナモードのイントラ予測の結果は、さらに、位置依存イントラ予測結合(PDPC)法によって修正され得る。
インター予測モードの(または、可能な)セットは、利用可能な参照ピクチャ(すなわち、例えばDBP 230に保管されている、以前に少なくとも部分的にデコーディングされたピクチャ)および他のインター予測パラメータ、例えば、参照ピクチャの全体、または、参照ピクチャの一部、例として、現在ブロックの領域の周囲のサーチウィンドウ領域、が、最良のマッチング参照ブロックをサーチするために使用されるか否か、及び/又は、例えば、ピクセル補間(interpolation)が適用されるか否か、例えば、ハーフ/セミ・ペル(half/4semi-pel)、1/4ペル(quarter-pel)、及び/又は、1/16ペルであるか、または、そうでないか、に依存する。
エントロピーコーディングユニット270は、例えば、エントロピーエンコーディングアルゴリズムまたはスキーム(例えば、可変長コーディング(VLC)スキーム、コンテキスト適応VLCスキーム(CAVLC)、算術コーディングスキーム、バイナリ化、コンテキスト適応バイナリ算術コーディング(CABAC)、シンタックスベースのコンテキスト適応バイナリ算術コーディング(SBAC)、確率間隔パーティション分割エントロピー(PIPE)コーディング、または、別の他のエントロピーエンコーディング方法または技術)を、量子化係数209、インター予測パラメータ、イントラ予測パラメータ、ループフィルタパラメータ、及び/又は、他のシンタックス要素について、適用し、またはバイパス(非圧縮)するように構成されており、例えば、エンコーディングされたビットストリーム21の形式で、出力272を介して出力され得るエンコーディングされた映像データ21を獲得する。その結果、ビデオデコーダ30は、デコーディングされたパラメータを受信し、そして、使用し得る。エンコーディングされたビットストリーム21は、ビデオデコーダ30へ送信されてよく、または、ビデオデコーダ30による後の送信または検索のためにメモリ内に保管され得る。
図3は、この本出願の技術を実施するように構成されたビデオデコーダ30に係る一つの例を示している。ビデオデコーダ30は、デコーディングされたピクチャ331を獲得するために、エンコーディングされた映像データ21(例えばエンコーディングされたビットストリーム21)、例えばエンコーダ20によってエンコーディングされたもの、を受信するように構成されている。エンコーディングされた映像データまたはビットストリームは、エンコーディングされた映像データ、例えば、エンコーディングされたビデオスライスのピクチャブロック(及び/又は、タイルグループまたはタイル)および関連するシンタックス要素を表すデータ、をデコーディングするための情報を含む。
エントロピーデコーディングユニット304は、ビットストリーム21(または、一般的にエンコーディングされた映像データ21)を解析し、そして、例えば、エンコーディングされた映像データ21に対してエントロピーデコーディングを実行するように構成されており、
例えば、量子化係数309及び/又はデコーディングされたコード化パラメータ(図3には示されていない)、例えば、インター予測パラメータ(例えば、参照ピクチャインデックスおよび動きベクトル)、イントラ予測パラメータ(例えば、イントラ予測モードまたはインデックス)、変換パラメータ、量子化パラメータ、ループフィルタパラメータ、及び/又は、他のシンタックス要素、の幾つか又は全てを獲得する。エントロピーデコーディングユニット304は、エンコーダ20のエントロピーコーディングユニット270に関して説明されたように、エンコーディングスキームに対応するデコーディングアルゴリズムまたはスキームを適用するように構成され得る。エントロピーデコーディングユニット304は、さらに、インター予測パラメータ、イントラ予測パラメータ、及び/又は、他のシンタックス要素を、モード適用ユニット360に対して、および、他のパラメータを、デコーダ30の他のユニットに対して提供するように構成され得る。ビデオデコーダ30は、ビデオスライスレベル及び/又はビデオブロックレベルで、シンタックス要素を受信することができる。スライス及びそれぞれのシンタックス要素に加えて、または、代替として、タイルグループ及び/又はタイル、および、それぞれのシンタックス要素が、受信され、かつ/あるいは、使用され得る。
逆量子化ユニット310は、エンコーディングされた映像データ21から(例えば、エントロピーデコーディングユニット304による、例えば、解析及び/又はデコーディングによって)、量子化パラメータ(QP)(または、一般的に逆量子化に関する情報)、および、量子化係数を受信し、かつ、量子化パラメータに基づいて、逆量子化をデコーディングされた量子化閨秀309に適用するように構成することができ、変換係数311としても、また、参照され得る、脱量子化係数311を獲得する。逆量子化プロセスは、量子化の程度、および、同様に、適用されるべき逆量子化の程度を決定するために、ビデオスライス(または、タイル又はタイルグループ)内の各ビデオブロックについて、ビデオエンコーダ20によって決定される量子化パラメータを使用することを含み得る。
逆変換処理ユニット312は、変換係数311としても、また、参照される、脱量子化係数311を受信し、かつ、サンプル領域において再構成された残差ブロック213を獲得するために、脱量子化係数311に変換を適用するように構成され得る。再構成された残差ブロック213は、また、変換ブロック313としても参照され得る。変換は、逆変換、例えば、逆DCT、逆DST、逆整数変換、または、概念的に類似した逆変換プロセス、であり得る。逆変換処理ユニット312は、さらに、エンコーディングされた映像データ21から(例えば、エントロピーデコーディングユニット304による、例えば、解析及び/又はデコーディングによって)、変換パラメータまたは対応する情報を受信するように構成されてよく、脱量子化係数311に対して適用される変換を決定する。
再構成ユニット314(例えば、加算器または足し算器314)は、サンプル領域内の再構成ブロック315を獲得するために、予測ブロック365に対して、再構成残差ブロック313を追加ように構成され得る。例えば、再構成残差ブロック313のサンプル値および予測ブロック365のサンプル値を追加することによる、ものである。
ループフィルタユニット320は、(コーディングループ内、または、コーディングループ後、のいずれかで)再構成ブロック315をフィルタリングするように構成されており、フィルタリングされたブロック321を獲得し、例えば、ピクセルの遷移を滑らかにするか、または、そうでなければ、ビデオ品質を改善する。ループフィルタユニット320は、デブロッキング(de-blocking)フィルタ、サンプル適応オフセット(SAO)フィルタ、または、1つ以上の他のフィルタ、例えば、適応ループフィルタ(ALF)、ノイズ抑制フィルタ(NSF)、または、それらの任意の組み合せ、といった、1つ以上のループフィルタを含み得る。一つの例において、ループフィルタユニット220は、デブロッキングフィルタ、SAOフィルタ、および、ALFフィルタを含み得る。フィルタリングプロセスの順序は、デブロッキングフィルタ、SAO、そして、ALFであってよい。別の例においては、クロマスケーリングを用いたルママッピング(LMCS)と呼ばれるプロセス(すなわち、適応ループ内リシェイパ)が追加される。この処理は、デブロッキングの前に実行される。別の例において、デブロッキングフィルタプロセスは、また、内部サブブロックエッジ、例えば、アフィンサブブロックエッジ、ATMVPサブブロックエッジ、サブブロック変換(SBT)エッジ、および、イントラサブパーティション(ISP)エッジに対して適用されてもよい。ループフィルタユニット320は、図3ではインループフィルタとして示されているが、他のコンフィグレーションにおいて、ループフィルタユニット320は、ポスト・ループフィルタとして実装されてよい。
ピクチャのデコーディングされたビデオブロック321は、次いで、デコーディングされたピクチャバッファ330内に保管される。バッファは、デコーディングされたピクチャ331を、他のピクチャのため、及び/又は、出力それぞれの表示のための、後に続く動き補償のための参照ピクチャとして保管する。
インター予測ユニット344は、インター予測ユニット244(特には、動き補償ユニット)と同一であってよく、そして、イントラ予測ユニット354は、機能において、インター予測ユニット254と同一であってよく、そして、パーティション分割及び/又は予測パラメータ、または、エンコーディングされた映像データ21から受信したそれぞれの情報(例えば、エントロピーデコーディングユニット304による、例えば、解析及び/又はデコーディングによるもの)に基づいて、分割またはパーティション分割の決定および予測を実行する。モード適用ユニット360は、予測ブロック365を獲得するために、再構成されたピクチャ、ブロックまたはそれぞれのサンプル(フィルタリングされているか、または、フィルタリングされていない)に基づいて、ブロックごとに予測(イントラ予測またはインター予測)を実行するように構成され得る。
装置500におけるプロセッサ502は、中央処理装置であり得る。代替的に、プロセッサ502は、現在存在している、または、今後開発される、情報を操作または処理することができる、任意の他のタイプのデバイスまたは複数のデバイスであり得る。開示される実施形態は、図示されるように単一のプロセッサ、例えば、プロセッサ502を用いて実施することができるが、1つより多いプロセッサを使用して、速度および効率における利点が達成され得る。
装置500は、また、ディスプレイ518といった、1つ以上の出力装置も含み得る。ディスプレイ518は、一つの例では、ディスプレイと、タッチ入力を感知するように動作可能なタッチ感応エレメントとを組み合せたタッチ感応ディスプレイであり得る。ディスプレイ518は、バス512を介してプロセッサ502に結合され得る。
スケーラブルコーディングは、品質スケーラブル(PSNRスケーラブル)、空間スケーラブル、等を含んでいる。例えば、図6に示されるように、シーケンスは、低空間分解能バージョンへダウンサンプリングされ得る。低空間分解能バージョンおよび元の空間分解能(高空間分解能)バージョンの両方が、エンコーディングされる。そして、一般的に、低空間分解能が、最初にコード化され、そして、後にコード化される高空間分解能について参照のために使用される。
1に等しいvps_all_independent_layers_flagは、CVS内の全てのレイヤがインターレイヤ予測を使用することなく独立してコード化されることを指定する。
0に等しいvps_all_independent_layers_flagは、CVS内の1つ以上のレイヤがインターレイヤ予測を使用し得ることを指定する。
存在しない場合、vps_all_independent_layers_flagの値は1に等しいものと推定される。
vps_all_independent_layers_flagが1に等しい場合、vps_independent_layer_flag[i]の値は1に等しいものと推定される。
vps_all_independent_layers_flagが0に等しい場合、vps_independent_layer_flag[0]の値は1と推定される。
vps_layer_id[i]は、i番目レイヤのnuh_layer_id値を指定する。mおよびとnの2つの非負の整数値について、mがnより小さい場合、vps_layer_id[m]の値はvps_layer_id[n]より小さい。
1に等しいvps_independent_layer_flag[i]は、インデックスiを有するレイヤがインターレイヤ予測を使用しないことを指定する。
0に等しいvps_independent_layer_flag[i]は、インデックスiを有するレイヤがインターレイヤ予測を使用することができ、かつ、vps_layer_dependency_flag[i]がVPS内に存在することを指定する。
0に等しいvps_direct_direct_dependency_flag[i][j]は、インデックスjを有するレイヤが、インデックスiを有するレイヤについて直接的な参照レイヤではないことを指定する。
1に等しいvps_direct_direct_dependency_flag[i][j]は、インデックスjを有するレイヤが、インデックスiを有するレイヤについて直接的な参照レイヤであることを指定する。
vps_direct_dinercy_dependency_flag[i][j]が、0からvps_max_layers_minus1の範囲内でiおよびjについて存在しない場合は、0に等しいものと推定される。
変数DirectDependentLayerIdx[i][j]は、i番目レイヤのj番目の直接的な依存性レイヤを指定しており、以下のように導出される。
vps_max_layers_minus1 add1は、レイヤの数を意味する。
vps_all_independent_layers_flagは、全てのレイヤが独立してコード化されているか否かを示す。
vps_layer_id[i]は、i番目レイヤのレイヤIDを示す。
vps_independent_layer_flag[i]は、i番目レイヤが独立してコード化されているか否かを示す。
vps_direct_dinercy_dependency_flag[i][j]は、j番目レイヤがi番目レイヤについて参照のために使用されるか否かを示す。
デコーディングプロセスにおけるこれらの参照ピクチャを管理するために、デコーディングされたピクチャは、以降のピクチャデコーディングについて参照使用のために、デコーディングピクチャバッファ(DPB)内に保持することが必要とされる。これらのピクチャを示すために、それらのピクチャオーダーカウント(POC)情報は、直接的または間接的にスライスヘッダにおいて信号化する必要がある。一般的には、2つの参照ピクチャリストが存在する。list0およびlist1である。そして、リスト内のピクチャを信号化するために、参照ピクチャインデックスも含めることが必要とされる。単(uni)予測については、1つの参照ピクチャリストから参照ピクチャがフェッチされ、双(bi)予測については、2つの参照ピクチャリストから参照ピクチャがフェッチされる。全ての参照ピクチャはDPB内に保管される。DPB内の全てのピクチャは、「長期参照用(“used for long-term reference”)」、「短期参照用(“used for short-term reference”)」、または「参照不使用(“unused for reference”)」としてマーク付けされており、そして、3つのステータスについて1つだけである。一旦、ピクチャが「参照不使用」としてマーク付けされると、それは、参照のために全く使用されない。また、出力のために保管する必要がない場合は、DPBから削除され得る。参照ピクチャのステータスは、スライスヘッダ内で信号化することができ、または、スライスヘッダ情報から導出することができる。
RPL(reference picture list)法と呼ばれる、新しい参照ピクチャ管理方法が提案された。RPLは、現在コーディングピクチャについて全体の参照ピクチャセットまたは複数セットを提案し、参照ピクチャセット内の参照ピクチャは、現在ピクチャまたは将来(後の、または、次の)ピクチャデコーディングのために使用される。よって、RPLはDPB内のピクチャ情報を反映しており、現在ピクチャについて参照のために参照ピクチャが使用されていなくても、次のピクチャについて参照のために使用される場合は、RPL内に保存することが必要とされる。
ピクチャは、再構成された後で、DPB内に保存され、そして、デフォルトで「短期参照用」としてマーク付けされる。DPB管理操作は、スライスヘッダ内のRPL情報を解析した後で開始される。
参照ピクチャ情報は、スライスヘッダを介して信号化され得る。また、シーケンスパラメータセット(SPS)においていくつかのRPL候補が存在し得る。この場合に、スライスヘッダは、全体のRPLシンタックス構造を信号化することなく、必要とされるRPL情報を獲得するために、RPLインデックスを含み得る。もしくは、RPLシンタックス構造全体が、スライスヘッダ内で信号化され得る。
RPL信号化のコストビットを節約するために、SPS内にいくつかのRPL候補が存在し得る。ピクチャは、SPSからRPL情報を獲得するために、RPLインデックス(ref_pic_list_idx[i])を使用することができる。RPL候補は、以下のように信号化される。
1に等しいrpl1_sim_as_rpl0_flagは、シンタックス構造num_ref_pic_lists_in_sps[1]およびref_pic_list_struct(1,rplsidx)が存在しないことを指定し、そして、以下を適用する。
- num_ref_pic_lists_in_sps[1]の値は、num_ref_pic_lists_in_sps[0]の値と等しいものと推定される。
-ref_pic_list_struct(1,rplsIdx)における各シンタックス要素の値は、0からnum_ref_pic_lists_in_sps[0]-1の範囲のrplsIdxについてref_pic_list_struct(0,rplsIdx)における対応するシンタックス要素の値と等しいものと推定される。
num_ref_pic_lists_in_sps[i]は、SPSに含まれる1に等しいlistIdxを有するref_pic_list_struct(listIdx,rplsIdx)シンタックス構造の番号を指定する。num_ref_pic_lists_in_sps[i]の値は、0から64まで、を含む範囲とする。
0に等しいref_pic_list_sps_flag[i]は、現在スライスの参照ピクチャリストiが、現在ピクチャのスライスヘッダ内に直接的に含まれるiに等しいlistIdxを有するref_pic_list_struct(listIdx,rplsIdx)シンタックス構造に基づいて導出されることを指定する。
ref_pic_list_sps_flag[i]が存在しない場合は、以下が適用される。
- num_ref_pic_lists_in_sps[i]が0に等しい場合、ref_pic_list_sps_flag[i]の値は0に等しいものと推定される。
-そうでなければ(num_ref_pic_lists_in_sps[i]が0より大きい)、rpl1_idx_present_flagが0に等しい場合、ref_pic_list_sps_flag[1]の値はref_pic_list_sps_flag[0]に等しいものと推定される。
- そうでなければ、ref_pic_list_sps_flag[i]の値は、pps_ref_pic_list_sps_idc[i]-1に等しいものと推定される。
ref_pic_list_idx[i]は、SPS内に含まれるiに等しいlistIdxを有するref_pic_list_struct(listIdx,rplsIdx)シンタックス構造のリストの中へ、現在ピクチャの参照ピクチャリストiの導出のために使用されるiに等しいlistIdxを有するref_pic_list_struct(listIdx,rplsIdx)シンタックス構造のインデックスを指定する。
シンタックス要素ref_pic_list_idx[i]は、Ceil(Log2(num_ref_pic_lists_in_sps[i]))ビットによって表される。
存在しない場合、ref_pic_list_idx[i]の値は0に等しいものと推定される。ref_pic_list_idx[i]の値は、0からnum_ref_pic_lists_in_sps[i]-1まで、を含む範囲とする。
ref_pic_list_sps_flag[i]が1に等しく、かつ、num_ref_pic_lists_in_sps[i]が1に等しい場合、ref_pic_list_idx[i]の値は0に等しいものと推定される。
ref_pic_list_sps_flag[i]が1に等しく、かつ、rpl1_idx_present_flagが0に等しい場合、ref_pic_list_idx[1]の値はref_pic_list_idx[0]に等しいものと推定される。
変数RplsIdx[i]は、以下のように導出される。
変数PocLsbLt[i][j]は、次のように導出される。
0に等しいdelta_poc_msb_present_flag[i][j]は、delta_poc_msb_cycle_lt[i][j]が存在しないことを指定する。
prevTid0Picを、現在ピクチャと同じnuh_layer_idを有し、0に等しいTemporalIdを有し、かつ、RASLまたはRADLピクチャではない、デコーディング順序における以前のピクチャとする。
setOfPrevPocValsを、以下で構成される集合とする。
- prevTid0PicのPicOrderCntVal、
- prevTid0PicのRefPicList[0]またはRefPicList[1]内のエントリによって参照され、かつ、現在ピクチャと同じnuh_layer_idを有する、各ピクチャのPicOrderCntVal、
- デコーディング順序においてprevTid0Picに続く、各ピクチャのPicOrderCntValは、現在ピクチャと同じnuh_layer_idを有し、かつ、デコーディング順序において現在ピクチャに先行する。
setOfPrevPocVals内に値モジュロMaxPicOrderCntLsbがPocLsbLt[i][j]に等しい値が1個より多く存在する場合、delta_poc_msb_present_flag[i][j]の値は1に等しい。
delta_poc_msb_cycle_lt[i][j]は、変数FullPocLt[i][j]の値を以下のように指定する。
存在しない場合、delta_poc_msb_cycle_lt[i][j]の値は0に等しいものと推定される。
0に等しいltrp_in_slice_header_flag[listIdx][rplsIdx]は、ref_pic_list_struct(listIdx,rplsIdx)シンタックス構造内のLTRPエントリのPOC LSBがref_pic_list_struct(listIdx,rplsIdx)シンタックス構造内に存在することを指定する。
1に等しいltrp_in_slice_header_flag[listIdx][rplsIdx]は、ref_pic_list_struct(listIdx,rplsIdx)シンタックス構造内のLTRPエントリのPOC LSBがref_pic_list_struct(listIdx,rplsIdx)シンタックス構造内に存在しないことを指定する。
1に等しいinter_layer_ref_pic_flag[listIdx][rplsIdx][i]は、ref_pic_list_struct(listIdx,rplsIdx)シンタックス構造内のi番目のエントリがILRPエントリであることを指定する。
0に等しいinter_layer_ref_pic_flag[listIdx][rplsIdx][i]は、ref_pic_list_struct(listIdx,rplsIdx)シンタックス構造内のi番目のエントリがILRPエントリではないことを指定する。存在しない場合、inter_layer_ref_pic_flag[listIdx][rplsIdx][i]の値は0に等しいものと推定される。
1に等しいst_ref_pic_flag[listIdx][rplsIdx][i]は、ref_pic_list_struct(listIdx,rplsIdx)シンタックス構造内のi番目のエントリがSTRPエントリであることを指定する。
0に等しいst_ref_pic_flag[listIdx][rplsIdx][i]は、ref_pic_list_struct(listIdx,rplsIdx)シンタックス構造のi番目のエントリがLTRPエントリであることを指定する。
inter_layer_ref_pic_flag[listIdx][rplsIdx][i]が0に等しく、かつ、st_ref_pic_flag[listIdx][rplsIdx][i]が存在しない場合、st_ref_pic_flag[listIdx][rplsIdx][i]の値は1に等しいものと推定される。
変数NumLtrpEntries[listIdx][rplsIdx]は、以下のように導出される。
1に等しいstrp_entry_entry_sign_flag[listIdx][rplsIdx][i]は、シンタックス構造ref_pic_list_struct(listIdx,rplsIdx)内のi番目のエントリが0以上の値を有することを指定する。
0に等しいstrp_entry_sign_flag[listIdx][rplsIdx][i]は、シンタックス構造ref_pic_list_struct(listIdx,rplsIdx)内のi番目のエントリが0未満の値を有することを指定する。存在しない場合、strp_entry_sign_flag[listIdx][rplsIdx][i]の値は1に等しいものと推定される。
リストDeltaPocValSt[listIdx][rplsIdx]は、以下のように導出される。
rpls_poc_lsb_lt[listIdx][rplsIdx][i]シンタックス要素の長さは、log2_max_pic_order_cnt_lsb_minus4+4ビットである。
各リストについて、RPL構造が存在する。最初に、リスト内の参照ピクチャの数を示すためにnum_ref_entries[listIdx][rplsIdx]が信号化される。ltrp_in_slice_header_flag[listIdx][rplsIdx]は、LSB(最下位ビット)情報がスライスヘッダ内で信号化されているか否かを示すために使用される。現在参照ピクチャがインターレイヤ参照ピクチャでない場合、st_ref_pic_flag[listIdx][rplsIdx][i]は、それが長期(long-term)参照ピクチャであるか否かを示す。それが短期(short-term)参照ピクチャである場合、POC情報(abs_delta_poc_stおよびstrp_entry_sign_flag)が信号化される。ltrp_in_in_slice_header_flag[listIdx][rplsIdx]がゼロである場合、現在参照ピクチャのLSB情報を導出するためにrpls_poc_lsb_lt[listIdx][rplsIdx][j+++]が使用される。MSB(最上位ビット)は、直接的に導出され得るか、または、スライスヘッダ内の情報(delta_poc_msb_present_flag[i][j]およびdelta_poc_msb_cycle_lt[i][j])に基づいて導出され得る。
このプロセスは、非IDRピクチャの各スライスについて、デコーディングプロセスの開始において呼び出される。
参考ピクチャは、参考インデックスを通して扱われる。参照インデックスは、参照ピクチャリストのインデックスである。Iスライスをデコーディングするとき、参照ピクチャリストは、スライスデータのデコーディングにおいて使用されない。Pスライスをデコーディングするとき、参照ピクチャリスト0(すなわち、RefPicList[0])のみが、スライスデータのデコーディングにおいて使用される。Bスライスをデコーディングするとき、参照ピクチャリスト0および参照ピクチャリスト1(すなわち、RefPicList[1])の両方が、スライスデータのデコーディングにおいて使用される。
非IDRピクチャの各スライスに対するデコーディングプロセスの開始において、参照ピクチャリストRefPicList[0]およびRefPicList[1]が導出される。参照ピクチャリストは、8.3.3条項に規定される参照ピクチャのマーキングにおいて、または、スライスデータのデコーディングにおいて使用される。
注記1-それがピクチャの最初のスライスではない、非IDRピクチャのIスライスについて、ビットストリーム適合性チェックのためにRefPicList[0]およびRefPicList[1]が導出され得るが、それらの導出は、現在ピクチャ、または、デコーディング順序において現在ピクチャに続くピクチャをデコーディングするためには必要ではない。それがピクチャの最初のスライスではない、Pスライスについて、ビットストリーム適合性検査のためにRefPicList[1]が導出され得るが、その導出は、現在ピクチャ、または、デコーディング順序において現在ピクチャに続くピクチャをデコーディングするためには必要ではない。
参照ピクチャリストRefPicList[0]およびRefPicList[1]は、以下のように構成されている。
このプロセスは、条項8.3.2に指定されているように、スライスヘッダのデコーディング、および、スライスについて参照ピクチャリスト構成のためのデコーディングプロセスの後であるが、スライスデータのデコーディングの以前に、ピクチャ毎に1回呼び出される。この処理は、「参照不使用」または「長期参照用」としてマーク付けされているDPB内の1つ以上の参照ピクチャを結果として生じ得る。
DPB内のデコーディングされたピクチャは、「参照不使用」、「短期参照用」、または「長期参照用」としてマーク付けされ得るが、デコーディングプロセスの動作中の任意所与の時点では、これら3つのうち1つのみである。これらのマーキングの1つをピクチャに割り当てることは、適用可能な場合は、これらのマーキングの別のものを暗黙のうちに削除する。ピクチャが「参照用」としてマーク付けされているものとして参照される場合、これは、「短期参照用」または「長期参照用」(両方ではない)としてマーク付けされているピクチャを集合的に参照する。
STRPおよびILRPは、それらのnuh_layer_idおよびPicOrderCntValの値によって識別される。LTRPは、nuh_layer_id値およびPそれらのPicOrderCntVal値のLog2(MaxLtPicOrderCntLsb)LSBによって識別される。
現在ピクチャがCLVSSピクチャの場合、現在ピクチャと同じnuh_layer_idを有するDPB内の現在の全ての参照ピクチャは(もしあれば)、「参照不使用」としてマーク付けされる。
そうでなければ、以下が適用される。
- RefPicList[0]またはRefPicList[1]内の各LTRPエントリについて、参照されるピクチャが現在ピクチャと同じnuh_layer_idを有するSTRPである場合、そのピクチャは「長期参照用」としてマーク付けされる。
- RefPicList[0]またはRefPicList[1]内の任意のエントリによって参照されないDPB内の現在ピクチャと同じnuh_layer_idを有する各参照ピクチャは、「参照不使用」としてマーク付けされる。
- RefPicList[0]またはRefPicList[1]内の各ILRPエントリについて、参照されるピクチャは「長期参照用」としてマーク付けされる。
0に等しいlong_term_ref_pics_flagは、CVS内の任意のコード化ピクチャのインター予測のためにLTRPが使用されないことを指定する。1に等しいlong_term_ref_pics_flagは、CVS内の1つ以上のコード化ピクチャのインター予測のためにLTRPが使用され得ることを指定する。
0に等しいinter_layer_ref_pics_present_flagは、CVS内の任意のコード化ピクチャのインター予測のためにILRPが使用されないことを指定する。1に等しいinter_layer_ref_pics_flagは、CVS内の1つ以上のコード化ピクチャのインター予測のためにILRPが使用され得ることを指定する。sps_video_parameter_set_idが0に等しい場合、inter_layer_ref_pics_present_flagの値は0であるものと推定される。
long_term_ref_pics_flagは、デコーディングプロセスにおいてLTRPが使用され得るか否かを示すために使用される。
inter_layer_ref_pics_present_flagは、デコーディングプロセスにおいてILRPが使用され得るか否かを示すために使用される。
既存の方法において、インターレイヤ参照情報のためのいくつかのシンタックス要素は、現在レイヤのインデックスを考慮することなく、常に信号化されている。この発明は、信号化効率を改善するために、シンタックス要素に対していくつかの条件を加えることを提案する。
インターレイヤ参照情報のためのシンタックス要素は、現在レイヤのインデックスを考慮して信号化される。情報が現在レイヤのインデックスによって導出できる場合、情報は信号化される必要がない。
インターレイヤ参照情報のためのシンタックス要素は、現在レイヤのインデックスを考慮して信号化される。情報が現在レイヤのインデックスによって導出できる場合、情報は信号化される必要がない。
1に等しいlong_term_ref_pics_flagは、ltrp_in_slice_header_flag、st_ref_pic_flagがシンタックス構造ref_pic_list_struct(listIdx,rplsIdx)内に存在することを指定する。0に等しいlong_term_ref_pics_flagは、これらのシンタックス要素がシンタックス構造ref_pic_list_struct(listIdx,rplsIdx)内に存在しないことを指定する。
また、セマンティックは、ILRPを除外するために、以下のようにも修正され得る。
0に等しいlong_term_ref_pics_flagは、CVS内のコード化ピクチャのインター予測のためにLTRPが使用されないことを指定する。1に等しいlong_term_ref_pics_flagは、CVS内の1つ以上のコード化ピクチャのインター予測のためにLTRPが使用され得ることを指定する。ここで、LTRPはILRP(インターレイヤ参照ピクチャ)を含まない。
ここで、iが1に等しい場合、それはレイヤ1が他のレイヤを参照する必要があることに注意すること。一方、レイヤ0のみが参照レイヤであり得るので、vps_direct_direct_dependency_flag[i][j]は、信号化される必要はない。iが1より大きい場合のみ、vps_direct_direct_dependency_flag[i][j]は、信号化される必要がある。
vps_direct_dinercy_dinercy_flag[i][j]が、iおよびjについて、0からvps_max_layers_minus1まで、を含む範囲内に存在しない場合、iが1に等しく、かつ、vps_independent_layer_flag[i]が0に等しければ、vps_direct_direct_dependenticy_flag[i][j]は、1に等しいものと推定され、そうでなければ、0に等しいものと推定される。
上記の実装方法(オプション1.A)の他に、オプション1.Bが存在する。これは、i、および0からi-1まで、を含む範囲内のjについて、および、vps_independent_layer_flag[i]が0に等しく、かつ、0からi-2まで、を含む範囲のjについて、vps_direct_direct_dependency_flag[i][j]の全ての値が0に等しい場合、vps_direct_direct_dependency_flag[i][i-1]の値は信号化される必要がなく、そして、1に等しいものと推定される、ことを意味する。
vps_direct_dinercy_dinercy_flag[i][j]が、iおよびjについて、0からvps_max_layers_minus1まで、を含む範囲内に存在しない場合、vps_independent_layer_flag[i]が0に等しく、かつ、jが0に等しく、そして、SumDependencyFlagの値が0に等しければ、vps_direct_direct_dependenticy_flag[i][j]は、1に等しいものと推定され、そうでなければ、0に等しいものと推定される。
また、我々は、シンタックス信号化方法、またはシンタックステーブルを変更することなく、vps_direct_direct_depency_flag[i][j]のセマンティックに制約を加えることができる。基本的に、iについて、インデックスiを有するレイヤが従属レイヤ(vps_independent_layer_flag[i]が0に等しい)であれば、vps_direct_direct_dependency_flag[i][j]の少なくとも1つの値は、jが0からi-1の範囲で、1に等しい。代替的に、vps_direct_direct_dependency_flag[i][j]の合計は、jが0からi-1の範囲で、0に等しくないべきである。または、1以上(例えば、>=1)であるべきである。もしくは、0より大きい(例えば、>0)であるべきである。
0に等しいvps_direct_direct_dependency_flag[i][j]は、インデックスjを有するレイヤが、インデックスiを有するレイヤのための直接的な参照レイヤではないことを指定する。1に等しいvps_direct_direct_dependency_flag[i][j]は、インデックスjを有するレイヤが、インデックスiを有するレイヤのための直接的な参照レイヤであることを指定する。
vps_direct_dinercy_dependency_flag[i][j]は、iおよびjについて、0からvps_max_layers_minus1まで、を含む範囲内に存在しない場合、0に等しいものと推定される。ここで、i、および0からi-1まで、を含む範囲内のjについて、、および、vps_independent_layer_flag[i]が0に等しい場合、vps_direct_direct_depency_flag[i][j]の合計は、0より大きい。
0に等しいvps_direct_direct_dependency_flag[i][j]は、インデックスjを有するレイヤが、インデックスiを有するレイヤのための直接的な参照レイヤではないことを指定する。1に等しいvps_direct_direct_dependency_flag[i][j]は、インデックスjを有するレイヤが、インデックスiを有するレイヤのための直接的な参照レイヤであることを指定する。vps_direct_dinercy_dependency_flag[i][j]は、iおよびjについて、0からvps_max_layers_minus1まで、を含む範囲の内に存在しない場合、0に等しいものと推定される。ここで、i、および0からi-1まで、を含む範囲内のjについて、、かつ、vps_independent_layer_flag[i]が0に等しい場合、vps_direct_direct_depency_flag[i][j]の少なくとも1つの値は、1に等しい。
実際には、オプション1とオプション2を組み合せて他の実装方法とすることができる。オペレーション1.B+オペレーション2.Bも同様である。
vps_direct_direct_dependency_flag[i][j]が、iおよびjについて、0からvps_max_layers_minus1まで、を含む範囲の内に存在しない場合、vps_independence_layer_flag[i]が0に等しく、かつ、jがi-1に等しく、そして、SumDependencyFlagの値が0に等しければ、vps_direct_direct_dependency_flag[i][j]は、1に等しいものと推測され、そうでなければ、0に等しいものと推測される。ここで、i、および0からi-1まで、を含む範囲内のjについて、および、vps_independent_layer_flag[i]が0に等しい場合、vps_direct_direct_depency_flag[i][j]の少なくとも1つの値は、1に等しい。
オペレーション1.A+オペレーション2.Bも同様である。
オペレーション1.A+オペレーション2.Aも同様である。
オペレーション1.B+オペレーション2.Aも同様である。
ここでは、sps_video_parameter_set_idが0に等しい場合、それは、複数のレイヤが存在しないこと、よって、inter_layer_ref_pics_flagを信号化する必要は存在しないこと、そして、フラグは、デフォルトによって0であること、を意味することに注意すること。
ここでは、GeneralLayerIdx[nuh_layer_id]が0に等しい場合、現在レイヤは0番目のレイヤであり、あらゆる他のレイヤを参照できないことに注意する。よって、inter_layer_ref_pics_present_flagを信号化する必要は存在せず、そして、値は、デフォルトによって0である。
上記の両方のケースをコーディングして、別のアプリケーションの例を以下に示す。
ここでは、GeneralLayerIdx[nuh_layer_id]が1に等しい場合、現在レイヤはレイヤ1であり、かつ、レイヤ0のみを参照することでき、一方で、レイヤ0のilrp_idcは0でなければならないこと、に注意する。よって、この場合には、irp_idcを信号化する必要は存在しない。
ここでは、実施形態1から実施形態4の実施形態の一部または全てを組み合せて、新たな実施形態を形成することができることに注意する。
例えば、実施形態1+実施形態2+実施形態3+実施形態4、または、実施形態2+実施形態3+実施形態4、もしくは、他の組み合せ、である。
このアプリケーションで使用される数学演算子は、Cプログラミング言語で使用される演算子と同様である。しかしながら、整数除算演算と算術シフト演算の結果がより正確に定義されており、そして、指数化(exponentiation)および実数値除算(real-valued division)といった追加的な演算が定義されている。番号付けとカウントの規定(convention)は、一般的に0から始まる。例えば、「1番(“the first”)」は0番目(0-th)と同等であり、「2番(“the second”)」は2番目と同等である、等。
以下の算術演算子は、次のように定義される。
+ 加算。
- 減算(2引数の演算子として)または否定(単項前置演算子として)。
* 乗算、マトリクス乗算を含む。
xy 指数。xのy乗を指定する。他のコンテキストにおいて、そうした表記は、指数関数としての解釈を意図しない上付き文字として使用される。
/ 結果がゼロに向けて切り捨てられる整数除算。例えば、7/4および-7/-4は1に切り捨てられ、そして、-7/4および7/-4は-1に切り捨てられる。
÷ 切り捨て又は丸めが意図されていない、数式における除算を示すために使用される。
x%y モジュロ。xをyで割った値の余りであり、x>=0かつy>0である整数xおよびyに対してのみ定義される。
以下の論理演算子は、次のように定義される。
x&&y xおよびyに係るブール論理「and」。
x||y xおよびyに係るブール論理「or」。
! ブール論理「not」。
x?y:z xが真(TRUE)または0でない場合はyの値で評価する。そうでなければ、はzの値で評価する。
以下の関係演算子は、次のように定義される。
> より大きい。
>= より大きいか、または、等しい。
< より小さい。
<= より小さいか、または、等しい。
= 等しい。
!= 等しくない。
以下のビット単位の演算子は、次のように定義される。
& ビット単位の「and」。整数引数について操作する場合、整数値の2の補数表示について操作する。別の引数よりも少ないビットを含むバイナリ引数について操作する場合、より短い引数は、0に等しいより最上位のビットを加えることによって拡張される。
| ビット単位の「or」。整数引数について操作する場合、整数値の2の補数表示について操作する。別の引数よりも少ないビットを含むバイナリ引数について操作する場合、より短い引数は、0に等しいより最上位のビットを加えることによって拡張される。
^ ビット単位の「exclusive or」。整数引数について操作する場合、整数値の2の補数表示について操作する。別の引数よりも少ないビットを含むバイナリ引数について操作する場合、より短い引数は、0に等しいより最上位のビットを加えることによって拡張される。
x>>y xの2の補数整数表示をyの二進数だけ算術的に右シフト。この関数は、yの負でない整数値に対してのみ定義される。右シフトの結果として最上位ビット(MSB)へとシフトされたビットは、シフト演算の以前のxのMSBに等しい値を有する。
x<<y xの2の補数整数表示をyの二進数だけ算術的に左シフト。この関数は、yの負でない整数値に対してのみ定義される。左シフトの結果として最下位ビット(LSB)にシフトされたビットは、0に等しい値を有する。
以下の算術演算子は、次のように定義される。
= 代入演算子。
++ 増加、すなわちx++は、x=x+1と等価である。アレイ・インデックスにおいて使用される場合、増加演算の以前の変数の値で評価する。
―― 減少、すなわちx--は、x=x-1と等価であり、アレイ・インデックスおいて使用される場合、減少演算の以前の変数の値で評価する。
+= 指定された量だけの増分、すなわちx+=3は、x=x+3と等価であり、かつ、x+=(-3)は、x=x+(-3)と等価である。
-= 指定された量だけの減少、すなわちx-=3は、x=x-3と等価であり、かつ、x-=(-3)は、x=x-(-3)と等価である。
以下の表記が、値の範囲を指定するために使用される。
x=y..z xはyからzまで、を含む整数値をとり、x、y、およびzは、整数であり、かつ、zはより大きい。
以下の数学的関数が定義される。
Atan(x) 三角法の逆正接(tangent)関数。引数xについて動作する。出力値は、-π÷2からπ÷2まで、を含む範囲内にあり、単位はラジアンである。
Clip1Y(x)=Clip3(0,(1<<BitDepthY)-1,x)
Clip1C(x)=Clip3(0,(1<<BitDepthC)-1,x)
Floor(x) x以下の最大整数。
log2(x) xに係る基底2の対数。
log10(x) xに係る基数10の対数。
Sqrt(x)=√x
Swap(x,y)=(y,x)
Tan(x) 三角法の正接(tangent)関数。引数xについて動作し、単位はラジアンである。
式における優先順位が、括弧を使用して明示的に示されていない場合、以下の規則が適用される。
- より高い優先順位の演算は、より低い優先順位の演算の前に評価される。
- 同じ優先順位の演算は、左から右へ連続的に評価される。
以下のテーブルは、最高から最低まで演算の優先順位を示しており、テーブルにおけるより高い位置は、より高い優先順位を示している。
Cプログラミング言語においても、また、使用される演算子について、この明細書で使用される優先順位は、Cプログラミング言語において使用される優先順位と同じである。
テキストにおいて、論理演算のステートメントは、以下の形式で数学的に記述される。
if(condition 0)
statement 0
if(condition 1)
statement 1
上記は、以下の方法で記述され得る。
When condition 0, statement 0
When condition 1, statement 1
Claims (13)
- コード化されたビデオビットストリームをデコーディングする方法であって、
前記コード化されたビデオビットストリームから、インデックスiを有する第1レイヤがインターレイヤ予測を使用するか否かを指定する、前記インデックスiを有する第1シンタックス要素を獲得するステップと、
前記コード化されたビデオビットストリームから、1つ以上の第2レイヤに関連する1つ以上の第2シンタックス要素を獲得するステップであり、インデックスiおよびインデックスjを有する各第2シンタックス要素は、前記インデックスjを有する前記第2レイヤが前記インデックスiを有する前記第1レイヤの直接的な参照レイヤであるか否かを指定し、
前記第1シンタックス要素の値が、前記インデックスiを有する前記第1レイヤはインターレイヤ予測を使用することが許可されていることを指定する場合に、jは0からi-1までの範囲内にあり、前記インデックスjを有する第2シンタックス要素のうち少なくとも1つの第2シンタックス要素は、1であり、1に等しい前記少なくとも1つの第2シンタックス要素は、前記インデックスjを有する前記第2レイヤが、前記インデックスiを有する前記第1レイヤの直接的な参照レイヤであることを指定する、
ステップと、
前記少なくとも1つの第2シンタックス要素に関連する前記第2レイヤのピクチャを、参照ピクチャとして使用することにより、前記第1レイヤのピクチャについてインターレイヤ予測を実行するステップと、
を含む、方法。 - 1に等しい前記第1シンタックス要素は、前記第1レイヤがインターレイヤ予測を使用しないことを指定し、または、
0に等しい前記第1シンタックス要素は、前記第1レイヤがインターレイヤ予測を使用することを許可されていることを指定する、
請求項1に記載の方法。 - 0に等しい前記第2シンタックス要素は、前記第2シンタックス要素に関連する前記第2レイヤが前記第1レイヤの直接的な参照レイヤではないことを指定する、
請求項1または2に記載の方法。 - 1つ以上の第2シンタックス要素を獲得する前記ステップは、前記第1シンタックス要素の値が、前記第1レイヤがインターレイヤ予測を使用することを許可されていることを指定する場合に、実行される、
請求項1乃至3いずれか一項に記載の方法。 - 前記方法は、さらに、
前記第1シンタックス要素の値が、前記第1レイヤがインターレイヤ予測を使用しないことを指定する場合に、前記少なくとも1つの第2シンタックス要素に関連する前記第2レイヤのピクチャを、参照ピクチャとして使用することなく、前記第1レイヤのピクチャについて予測を実行するステップ、
を含む、請求項1乃至4いずれか一項に記載の方法。 - コード化されたビデオビットストリームをエンコーディングする方法であって、前記方法は、
少なくとも1つの第2レイヤが第1レイヤの直接的な参照レイヤであるか否かを決定するステップと、
インデックスiを有する第1シンタックス要素を前記コード化されたビデオビットストリームへとエンコーディングするステップであり、前記第1シンタックス要素は、前記インデックスiを有する第1レイヤがインターレイヤ予測を使用するか否かを指定する、ステップと、
前記少なくとも1つの第2レイヤに関連する1つ以上の第2シンタックス要素を前記コード化されたビデオビットストリームへとエンコーディングするステップであり、インデックスiおよびインデックスjを有する各第2シンタックス要素は、前記インデックスjを有する第2レイヤが前記インデックスiを有する前記第1レイヤの直接的な参照レイヤであるか否かを指定し、1に等しい前記第2シンタックス要素は、前記インデックスjを有する前記第2レイヤが、前記インデックスiを有する前記第1レイヤの直接的な参照レイヤであることを指定する、ステップと、を含み、
前記第1シンタックス要素の値が、前記インデックスiを有する前記第1レイヤはインターレイヤ予測を使用することが許可されていることを指定する場合に、jは0からi-1までの範囲内にあり、前記インデックスjを有する第2シンタックス要素のうち少なくとも1つの第2シンタックス要素は、1である、
方法。 - 1に等しい前記第1シンタックス要素は、前記第1レイヤがインターレイヤ予測を使用しないことを指定し、または、
0に等しい前記第1シンタックス要素は、前記第1レイヤがインターレイヤ予測を使用することを許可されていることを指定する、
請求項6に記載の方法。 - 0に等しい前記第2シンタックス要素は、前記第2シンタックス要素に関連する前記第2レイヤが前記第1レイヤの直接的な参照レイヤではないことを指定する、
請求項6または7に記載の方法。 - 前記第1シンタックス要素の値が、前記第1レイヤはインターレイヤ予測を使用することを許可されていることを指定する場合に、
前記少なくとも1つの第2レイヤに関連する1つ以上の第2シンタックス要素を前記コード化されたビデオビットストリームへとエンコーディングするステップが実行される、
請求項6乃至8いずれか一項に記載の方法。 - プログラムコードを含むコンピュータプログラムであって、
前記プログラムコードがコンピュータのプロセッサによって実行されると、
請求項1乃至7いずれか一項に記載の方法を、前記コンピュータに実施させる、
コンピュータプログラム。 - デコーダであって、
1つのプロセッサと、
前記プロセッサに結合され、かつ、前記プロセッサによって実行されるプログラミングを保管している、非一時的コンピュータ読取り可能な記憶媒体と、
を含み、
前記プログラミングは、前記プロセッサによって実行されると、請求項1乃至5いずれか一項に記載の方法を、前記デコーダに実施させる、ように構成されている、
デコーダ。 - エンコーダであって、
1つのプロセッサと、
前記プロセッサに結合され、かつ、前記プロセッサによって実行されるプログラミングを保管している、非一時的コンピュータ読取り可能な記憶媒体と、
を含み、
前記プログラミングは、前記プロセッサによって実行されると、請求項6乃至9いずれか一項に記載の方法を、前記エンコーダに実施させる、ように構成されている、
エンコーダ。 - プログラムコードを搬送する非一時的コンピュータ読取り可能な記憶媒体であって、
コンピュータ装置によって実行されると、請求項1乃至7いずれか一項に記載の方法を、前記コンピュータ装置に実施させる、
非一時的コンピュータ読取り可能な記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2023222186A JP2024038193A (ja) | 2019-10-07 | 2023-12-28 | エンコーダ、デコーダ、および、対応する方法 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962912046P | 2019-10-07 | 2019-10-07 | |
US62/912,046 | 2019-10-07 | ||
PCT/CN2020/119696 WO2021068854A1 (en) | 2019-10-07 | 2020-09-30 | An encoder, a decoder and corresponding methods |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023222186A Division JP2024038193A (ja) | 2019-10-07 | 2023-12-28 | エンコーダ、デコーダ、および、対応する方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022550989A JP2022550989A (ja) | 2022-12-06 |
JP7414976B2 true JP7414976B2 (ja) | 2024-01-16 |
Family
ID=75437725
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022521050A Active JP7414976B2 (ja) | 2019-10-07 | 2020-09-30 | エンコーダ、デコーダ、および、対応する方法 |
JP2023222186A Pending JP2024038193A (ja) | 2019-10-07 | 2023-12-28 | エンコーダ、デコーダ、および、対応する方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023222186A Pending JP2024038193A (ja) | 2019-10-07 | 2023-12-28 | エンコーダ、デコーダ、および、対応する方法 |
Country Status (9)
Country | Link |
---|---|
US (1) | US20220232260A1 (ja) |
EP (1) | EP4032308A4 (ja) |
JP (2) | JP7414976B2 (ja) |
KR (1) | KR20220070533A (ja) |
CN (5) | CN117915112A (ja) |
AU (1) | AU2020362795A1 (ja) |
CA (1) | CA3156854C (ja) |
MX (1) | MX2022004193A (ja) |
WO (1) | WO2021068854A1 (ja) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150063453A1 (en) | 2012-04-16 | 2015-03-05 | Electronics And Telecommunications Research Institute | Image information decoding method, image decoding method, and device using same |
WO2015053286A1 (ja) | 2013-10-08 | 2015-04-16 | シャープ株式会社 | 画像復号装置、画像符号化装置、及び、符号化データ |
US20150358641A1 (en) | 2013-01-23 | 2015-12-10 | Samsung Electronics Co., Ltd. | Video encoding method and apparatus, and video decoding method and apparatus |
US20170134742A1 (en) | 2014-06-18 | 2017-05-11 | Sharp Kabushiki Kaisha | Slice type and decoder conformance |
US20210092448A1 (en) | 2019-09-20 | 2021-03-25 | Tencent America LLC | Signaling of inter layer prediction in video bitstream |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007042914A1 (en) * | 2005-10-11 | 2007-04-19 | Nokia Corporation | Efficient decoded picture buffer management for scalable video coding |
US7991236B2 (en) * | 2006-10-16 | 2011-08-02 | Nokia Corporation | Discardable lower layer adaptations in scalable video coding |
US9602827B2 (en) * | 2012-07-02 | 2017-03-21 | Qualcomm Incorporated | Video parameter set including an offset syntax element |
US9992493B2 (en) * | 2013-04-01 | 2018-06-05 | Qualcomm Incorporated | Inter-layer reference picture restriction for high level syntax-only scalable video coding |
WO2014163452A1 (ko) * | 2013-04-05 | 2014-10-09 | 삼성전자 주식회사 | 멀티 레이어 비디오의 복호화 방법 및 장치, 멀티 레이어 비디오의 부호화 방법 및 장치 |
US9485508B2 (en) * | 2013-04-08 | 2016-11-01 | Qualcomm Incorporated | Non-entropy encoded set of profile, tier, and level syntax structures |
US9813736B2 (en) * | 2013-09-27 | 2017-11-07 | Qualcomm Incorporated | Inter-view dependency type in MV-HEVC |
WO2015053598A1 (ko) * | 2013-10-12 | 2015-04-16 | 삼성전자 주식회사 | 멀티 레이어 비디오 부호화 방법 및 장치, 멀티 레이어 비디오 복호화 방법 및 장치 |
EP3090558A4 (en) * | 2014-01-03 | 2017-08-16 | Nokia Technologies OY | Parameter set coding |
US20160286226A1 (en) * | 2015-03-24 | 2016-09-29 | Nokia Technologies Oy | Apparatus, a method and a computer program for video coding and decoding |
US11184607B2 (en) * | 2019-06-13 | 2021-11-23 | Qualcomm Incorporated | Same picture order count (POC) numbering for scalability support |
-
2020
- 2020-09-30 CN CN202410080041.XA patent/CN117915112A/zh active Pending
- 2020-09-30 CA CA3156854A patent/CA3156854C/en active Active
- 2020-09-30 CN CN202410077471.6A patent/CN118138782A/zh active Pending
- 2020-09-30 AU AU2020362795A patent/AU2020362795A1/en active Pending
- 2020-09-30 CN CN202080070703.5A patent/CN114503593B/zh active Active
- 2020-09-30 JP JP2022521050A patent/JP7414976B2/ja active Active
- 2020-09-30 KR KR1020227015162A patent/KR20220070533A/ko unknown
- 2020-09-30 CN CN202410080973.4A patent/CN118138783A/zh active Pending
- 2020-09-30 WO PCT/CN2020/119696 patent/WO2021068854A1/en unknown
- 2020-09-30 EP EP20874710.5A patent/EP4032308A4/en active Pending
- 2020-09-30 CN CN202410078539.2A patent/CN118233660A/zh active Pending
- 2020-09-30 MX MX2022004193A patent/MX2022004193A/es unknown
-
2022
- 2022-04-06 US US17/714,318 patent/US20220232260A1/en active Pending
-
2023
- 2023-12-28 JP JP2023222186A patent/JP2024038193A/ja active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150063453A1 (en) | 2012-04-16 | 2015-03-05 | Electronics And Telecommunications Research Institute | Image information decoding method, image decoding method, and device using same |
JP2018152874A (ja) | 2012-04-16 | 2018-09-27 | エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュートElectronics And Telecommunications Research Institute | 映像情報デコーディング方法、映像デコーディング方法及びそれを利用する装置 |
US20150358641A1 (en) | 2013-01-23 | 2015-12-10 | Samsung Electronics Co., Ltd. | Video encoding method and apparatus, and video decoding method and apparatus |
WO2015053286A1 (ja) | 2013-10-08 | 2015-04-16 | シャープ株式会社 | 画像復号装置、画像符号化装置、及び、符号化データ |
US20160241835A1 (en) | 2013-10-08 | 2016-08-18 | Sharp Kabushiki Kaisha | Image decoding device, image coding device, and coded data |
US20170134742A1 (en) | 2014-06-18 | 2017-05-11 | Sharp Kabushiki Kaisha | Slice type and decoder conformance |
JP2017522792A (ja) | 2014-06-18 | 2017-08-10 | シャープ株式会社 | スライス・タイプおよびデコーダ適合性 |
US20210092448A1 (en) | 2019-09-20 | 2021-03-25 | Tencent America LLC | Signaling of inter layer prediction in video bitstream |
JP2022521519A (ja) | 2019-09-20 | 2022-04-08 | テンセント・アメリカ・エルエルシー | ビデオビットストリームにおけるインターレイヤ予測のシグナリング |
Non-Patent Citations (1)
Title |
---|
Vadim Seregin, Muhammed Coban, Adarsh K. Ramasubramonian, Marta Karczewicz,AHG8: On inter-layer reference for scalability support,JVET-O0243-v1,Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 15th Meeting: Gothenburg,2019年06月26日,pp.1-5 |
Also Published As
Publication number | Publication date |
---|---|
CN118233660A (zh) | 2024-06-21 |
MX2022004193A (es) | 2022-05-02 |
AU2020362795A1 (en) | 2022-04-21 |
CA3156854C (en) | 2024-05-21 |
EP4032308A4 (en) | 2022-11-23 |
EP4032308A1 (en) | 2022-07-27 |
CN114503593A (zh) | 2022-05-13 |
CA3156854A1 (en) | 2021-04-15 |
CN118138783A (zh) | 2024-06-04 |
CN114503593B (zh) | 2024-02-13 |
JP2024038193A (ja) | 2024-03-19 |
KR20220070533A (ko) | 2022-05-31 |
CN118138782A (zh) | 2024-06-04 |
WO2021068854A1 (en) | 2021-04-15 |
CN117915112A (zh) | 2024-04-19 |
JP2022550989A (ja) | 2022-12-06 |
US20220232260A1 (en) | 2022-07-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7509889B2 (ja) | エンコーダ、デコーダ並びに対応する方法及び装置 | |
JP7483869B2 (ja) | エンコーダ、デコーダ、および対応する方法 | |
JP2023508060A (ja) | ビデオコーディングのためのクロスコンポーネント適応ループフィルタリング | |
JP7391991B2 (ja) | イントラ平滑化のための方法および装置 | |
JP7372465B2 (ja) | シーケンスパラメータセット内でのサブピクチャのシグナリングのためのエンコーダ、デコーダ、および対応する方法 | |
JP7408849B2 (ja) | タイル構成のシグナリングのためのエンコーダ、デコーダ、および対応する方法 | |
JP7423758B2 (ja) | 重み付き予測のための高レベルシグナリングの方法および装置 | |
JP2022551313A (ja) | ピクチャヘッダのシグナリングを簡略化するためのエンコーダ、デコーダ及び対応する方法 | |
US20220394242A1 (en) | Reference picture management methods for video coding | |
JP2022549288A (ja) | クロミナンス量子化パラメータのシグナリングのための方法及び装置 | |
JP7436526B2 (ja) | 非線形適応ループフィルタのためのクリッピングレベル | |
JP7470795B2 (ja) | 柔軟なプロファイル構成のエンコーダ、デコーダ及び対応する方法 | |
JP7267444B2 (ja) | イントラ予測のためのイントラモードコーディングを使用するエンコーダ、デコーダ、および対応する方法 | |
JP2023515189A (ja) | スライス用のピクチャパーティション情報をシグナリングするためのデコーダ及び対応する方法 | |
JP7414976B2 (ja) | エンコーダ、デコーダ、および、対応する方法 | |
WO2021136322A1 (en) | An encoder, a decoder and corresponding methods | |
JP2024096145A (ja) | エンコーダ、デコーダ、および対応する方法 | |
CA3172061A1 (en) | An encoder, a decoder and corresponding methods |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220606 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220606 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230718 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230801 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231031 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231128 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231228 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7414976 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |