JP2022548351A - マージ候補リストを構築するための方法 - Google Patents

マージ候補リストを構築するための方法 Download PDF

Info

Publication number
JP2022548351A
JP2022548351A JP2022514661A JP2022514661A JP2022548351A JP 2022548351 A JP2022548351 A JP 2022548351A JP 2022514661 A JP2022514661 A JP 2022514661A JP 2022514661 A JP2022514661 A JP 2022514661A JP 2022548351 A JP2022548351 A JP 2022548351A
Authority
JP
Japan
Prior art keywords
candidate list
merge candidate
candidates
merge
coded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022514661A
Other languages
English (en)
Other versions
JPWO2021055126A5 (ja
Inventor
ワン,ジャオ
イエ,ヤン
ルオ,ジャンコン
Original Assignee
アリババ グループ ホウルディング リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アリババ グループ ホウルディング リミテッド filed Critical アリババ グループ ホウルディング リミテッド
Publication of JP2022548351A publication Critical patent/JP2022548351A/ja
Publication of JPWO2021055126A5 publication Critical patent/JPWO2021055126A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/423Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

Figure 2022548351000001
本開示は、映像処理に使用されるマージ候補リストを構築するためのシステム及び方法を提供する。1つの例示的方法は、コード化ブロックのマージ候補リストに空間的マージ候補の組を挿入することを含み、空間的マージ候補の組は、上の隣接ブロック、左の隣接ブロック、上の隣接ブロック、左の隣接ブロック及び左上の隣接ブロックの順に従って挿入される。この方法は、コロケーテッドコード化単位からの時間的マージ候補、先入れ先出し(FIFO)テーブルからの履歴ベースの動きベクトル予測子(HMVP)、ペアワイズ平均候補又はゼロ動きベクトルのうちの少なくとも1つをマージ候補リストに追加することを更に含み得る。

Description

関連出願の相互参照
[001] 本開示は、参照によりその全体が本明細書に援用される、2019年9月19日に出願された米国仮特許出願第62/902,790号に対する優先権を主張する。
背景
[002] 映像は、視覚情報を捕捉する静的ピクチャ(又は「フレーム」)の組である。記憶メモリ及び伝送帯域幅を減らすために、映像は、記憶又は伝送前に圧縮し、表示前に解凍することができる。圧縮プロセスは、通常、符号化と呼ばれ、解凍プロセスは、通常、復号と呼ばれる。最も一般的には、予測、変換、量子化、エントロピーコード化及びインループフィルタリングに基づく規格化された映像コード化技術を使用する様々な映像コード化形式がある。特定の映像コード化形式を指定するHigh Efficiency Video Coding(HEVC/H.265)規格、Versatile Video Coding(VVC/H.266)規格、AVS規格等の映像コード化規格が規格化組織によって策定されている。一層進化した映像コード化技術が映像規格に採用されるにつれて、新たな映像コード化規格のコード化効率が一層高くなる。
開示の概要
[003] 本開示の実施形態は、マージ候補リストを構築するための方法を提供する。一部の実施形態によれば、1つの例示的方法は、コード化ブロックのマージ候補リストに空間的マージ候補の組を挿入することを含み、空間的マージ候補の組は、上の隣接ブロック、左の隣接ブロック、上の隣接ブロック、左の隣接ブロック及び左上の隣接ブロックの順に従って挿入される。
[004] 一部の実施形態によれば、1つの例示的方法は、予め設定された数値限界に基づいてコード化ブロックのマージ候補リストに空間的マージ候補の組を挿入することを含む。数値限界が2である場合、上の隣接ブロック、左の隣接ブロックの順序に基づいてマージ候補リスト内に空間的マージ候補の組が挿入される。数値限界が3である場合、上の隣接ブロック、左の隣接ブロック、上の隣接ブロックの順序に基づいてマージ候補リスト内に空間的マージ候補の組が挿入される。
[005] 一部の実施形態によれば、1つの例示的方法は、コード化ブロックのマージ候補リストに空間的マージ候補の組を挿入することを含み、第1のコード化モードがコード化ブロックに適用される場合、空間的マージ候補の組は、第1の構築順序に従って挿入され、及び第2のコード化モードがコード化ブロックに適用される場合、空間的マージ候補の組は、第2の構築順序に従って挿入され、第1の構築順序は、第2の構築順序と異なる。
[006] 一部の実施形態によれば、1つの例示的方法は、コード化ブロックのマージ候補リストに空間的マージ候補の組を挿入することを含み、コード化ブロックが低遅延ピクチャの一部である場合、空間的マージ候補の組は、第1の構築順序に従って挿入され、及びコード化ブロックが非低遅延ピクチャの一部である場合、空間的マージ候補の組は、第2の構築順序に従って挿入され、第1の構築順序は、第2の構築順序と異なる。
図面の簡単な説明
[007] 本開示の実施形態及び様々な態様を以下の詳細な説明及び添付図面に示す。図中に示す様々な特徴は、縮尺通りに描かれていない。
[008]本開示の幾つかの実施形態による例示的な映像シーケンスの構造を示す。 [009]本開示の実施形態と合致する、ハイブリッド映像コード化システムの例示的な符号化プロセスの概略図を示す。 [010]本開示の実施形態と合致する、ハイブリッド映像コード化システムの別の例示的な符号化プロセスの概略図を示す。 [011]本開示の実施形態と合致する、ハイブリッド映像コード化システムの例示的な復号プロセスの概略図を示す。 [012]本開示の実施形態と合致する、ハイブリッド映像コード化システムの別の例示的な復号プロセスの概略図を示す。 [013]本開示の実施形態と合致する、映像を符号化又は復号するための例示的な機器のブロック図を示す。 [014]本開示の実施形態と合致する、空間的マージ候補の例示的な位置を示す。 [015]本開示の実施形態と合致する、時間的マージ候補の例示的な位置を示す。 [016]本開示の実施形態と合致する、時間的マージ候補の例示的なスケーリングを示す。 [017]本開示の実施形態と合致する、merge mode with motion vector difference(MMVD)における距離インデックスと既定のオフセットとの例示的関係を示す。 [018]本開示の実施形態と合致する、空間的マージ候補の例示的な位置を示す。 [019]本開示の実施形態と合致する、ランダムアクセス(RA)構成下のVTM-6と比較した例示的な実験結果を示す。 [020]本開示の実施形態と合致する、低遅延(LD)構成下のVTM-6と比較した例示的な実験結果を示す。 [021]本開示の実施形態と合致する、RA構成下のVTM-6と比較した例示的な実験結果を示す。 [022]本開示の実施形態と合致する、LD構成下のVTM-6と比較した例示的な実験結果を示す。 [023]本開示の実施形態と合致する、スライスヘッダの例示的な構文構造を示す。 [024]本開示の実施形態と合致する、シーケンスパラメータセット(SPS)の例示的な構文構造を示す。 [025]本開示の実施形態と合致する、ピクチャパラメータセット(PPS)の例示的な構文構造を示す。 [026]本開示の実施形態と合致する、RA構成下のVTM-6と比較した例示的な実験結果を示す。 [027]本開示の実施形態と合致する、LD構成下のVTM-6と比較した例示的な実験結果を示す。 [028]本開示の実施形態と合致する、RA構成下のVTM-6と比較した例示的な実験結果を示す。 [029]本開示の実施形態と合致する、LD構成下のVTM-6と比較した例示的な実験結果を示す。 [030]本開示の実施形態と合致する、例示的な映像処理方法のフローチャートを示す。
詳細な説明
[031] ここで、その例が添付図面に示される例示的実施形態を詳細に参照する。以下の説明は、添付図面を参照し、添付図面では、他に指示がない限り、異なる図中の同じ数字が同じ又は同様の要素を表す。例示的実施形態についての以下の説明に記載される実装形態は、本開示と合致する全ての実装形態を表すわけではない。代わりに、それらは、単に添付の特許請求の範囲に列挙される、本開示に関係する態様と合致する機器及び方法の例である。本開示の具体的な態様を以下でより詳細に説明する。参照により援用される用語及び/又は定義と矛盾する場合、本明細書で与えられる用語及び定義が優先する。
[032] 上記の通り、映像とは、視覚的情報を記憶するために時系列順に配置されるフレームである。それらのピクチャを時系列順に捕捉し、記憶するために、映像捕捉装置(例えば、カメラ)を使用することができ、かかるピクチャを時系列順に表示するために、映像再生装置(例えば、テレビ、コンピュータ、スマートフォン、タブレットコンピュータ、ビデオプレーヤ又は表示機能を有する任意のエンドユーザ端末)を使用することができる。更に、一部の応用では、監視、会議又は生放送等のために、映像捕捉装置が捕捉映像を映像再生装置(例えば、モニタを有するコンピュータ)にリアルタイムで伝送することができる。
[033] かかる応用が必要とする記憶空間及び伝送帯域幅を減らすために、映像を記憶及び伝送前に圧縮し、表示前に解凍することができる。この圧縮及び解凍は、プロセッサ(例えば、汎用コンピュータのプロセッサ)又は専用ハードウェアによって実行されるソフトウェアによって実装され得る。圧縮のためのモジュールを一般に「符号器」と呼び、解凍のためのモジュールを一般に「復号器」と呼ぶ。符号器及び復号器は、まとめて「コーデック」と呼ぶことができる。符号器及び復号器は、様々な適切なハードウェア、ソフトウェア又はその組み合わせとして実装することができる。例えば、符号器及び復号器のハードウェア実装は、1つ又は複数のマイクロプロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、書換可能ゲートアレイ(FPGA)、ディスクリートロジック又はその任意の組み合わせ等の回路を含み得る。符号器及び復号器のソフトウェア実装は、プログラムコード、コンピュータ実行可能命令、ファームウェア又はコンピュータ可読媒体内に固定される任意の適切なコンピュータによって実装されるアルゴリズム若しくはプロセスを含み得る。一部の応用では、コーデックが第1のコード化規格から映像を解凍し、第2のコード化規格を使用して、解凍された映像を再圧縮することができ、その場合、コーデックを「トランスコーダ」と呼ぶことができる。
[034] 映像符号化プロセスは、ピクチャを再構築するために使用可能な有用な情報を識別し、保つことができ、再構築に重要でない情報を無視することができる。無視された重要でない情報を完全に再構築できない場合、かかる符号化プロセスは、「非可逆」と呼ぶことができる。さもなければ、かかる符号化プロセスは、「可逆」と呼ぶことができる。殆どの符号化プロセスは、非可逆であり、これは、必要な記憶空間及び伝送帯域幅を減らすためのトレードオフである。
[035] 符号化されているピクチャ(「現ピクチャ」と呼ぶ)の有用な情報は、参照ピクチャ(例えば、過去に符号化され、再構築されたピクチャ)に対する変化を含む。かかる変化は、ピクセルの位置変化、光度変化又は色変化を含むことができ、そのうちの位置変化が最も重要である。オブジェクトを表すピクセル群の位置変化は、参照ピクチャと現ピクチャとの間のオブジェクトの動きを反映し得る。
[036] 別のピクチャを参照することなくコード化されるピクチャ(即ちそのようなピクチャが自らの参照ピクチャである)を「Iピクチャ」と呼ぶ。参照ピクチャとして過去のピクチャを使用してコード化されるピクチャを「Pピクチャ」と呼ぶ。参照ピクチャとして過去のピクチャ及び将来のピクチャの両方を使用してコード化される(即ち参照が「双方向」である)ピクチャを「Bピクチャ」と呼ぶ。
[037] 半分の帯域幅を使用してHEVC/H.265と同じ主観的品質を実現するために、JVETは、共同探索モデル(JEM)参照ソフトウェアを使用して、HEVCを上回る技術を開発している。JEMにコード化の技術が組み込まれたため、JEMは、HEVCよりも大幅に高いコード化性能を実現した。
[038] VVC規格は、より優れた圧縮性能を与える更に多くのコード化技術を引き続き含んでいる。VVCは、HEVC、H.264/AVC、MPEG2、H.263等の現代の映像圧縮規格に使用されている同じハイブリッド映像コード化システムに基づく。VVCでは、新たなマージ候補を含むマージ候補リストを構築することができる。異なるインターモードに対して異なるマージリストのサイズが適用される。本開示の実施形態は、VVC内の新たなマージ候補(例えば、HMVP、ペアワイズ平均)及び新たなインターモード(例えば、MMVD、TPM)を考慮に入れる。例えば、空間的マージ候補の順序は、改善することができ、空間的マージ候補の数は、調節することができる。更に、空間的マージ候補の構築は、通常モード、MMVDモード及びTPMモードに関して固定され、空間的マージ候補の構築は、通常モード、MMVDモード及びTPMモードに関して固定される。
[039] 図1は、本開示の幾つかの実施形態による映像シーケンス100の一例の構造を示す。映像シーケンス100は、生中継映像又は捕捉され、アーカイブされている映像であり得る。映像100は、現実の映像、コンピュータによって生成される映像(例えば、コンピュータゲーム映像)又はその組み合わせ(例えば、拡張現実効果を有する現実の映像)であり得る。映像シーケンス100は、映像捕捉装置(例えば、カメラ)、過去に捕捉された映像を含む映像アーカイブ(例えば、記憶装置内に記憶される映像ファイル)又は映像コンテンツプロバイダから映像を受信するための映像フィードインタフェース(例えば、映像ブロードキャストトランシーバ)から入力され得る。
[040] 図1に示すように、映像シーケンス100は、ピクチャ102、104、106及び108を含むタイムラインに沿って時間的に配置される一連のピクチャを含み得る。ピクチャ102~106は、連続的であり、ピクチャ106とピクチャ108との間に更に多くのピクチャがある。図1では、ピクチャ102は、Iピクチャであり、その参照ピクチャは、ピクチャ102自体である。ピクチャ104は、Pピクチャであり、矢印によって示すように、その参照ピクチャは、ピクチャ102である。ピクチャ106は、Bピクチャであり、矢印によって示すように、その参照ピクチャは、ピクチャ104及び108である。一部の実施形態では、ピクチャ(例えば、ピクチャ104)の参照ピクチャは、そのピクチャの直前又は直後になくてもよい。例えば、ピクチャ104の参照ピクチャは、ピクチャ102に先行するピクチャであり得る。ピクチャ102~106の参照ピクチャは、例に過ぎず、本開示は、参照ピクチャの実施形態を、図1に示す例に限定しないことに留意すべきである。
[041] 典型的には、映像コーデックは、全ピクチャを一度に符号化又は復号せず、それは、かかるタスクが計算的に複雑であるためである。むしろ、映像コーデックは、ピクチャを基本セグメントに分割し、ピクチャをセグメントごとに符号化又は復号することができる。本開示では、そのような基本セグメントを基本処理単位(「BPU」)と呼ぶ。例えば、図1の構造110は、映像シーケンス100のピクチャ(例えば、ピクチャ102~108の何れか)の構造の一例を示す。構造110では、ピクチャが4×4の基本処理単位に分けられており、その境界が破線で示されている。一部の実施形態では、基本処理単位は、一部の映像コード化規格(例えば、MPEGファミリ、H.261、H.263又はH.264/AVC)内の「マクロブロック」と呼ぶことができ、他の一部の映像コード化規格(例えば、H.265/HEVC又はH.266/VVC)内の「コード化ツリー単位」(「CTU」)と呼ぶことができる。128×128、64×64、32×32、16×16、4×8、16×32又はピクセルのあらゆる任意の形状及びサイズ等、基本処理単位は、ピクチャ内で可変サイズを有することができる。基本処理単位のサイズ及び形状は、コード化の効率と基本処理単位内で保とうとする詳細度とのバランスに基づいてピクチャについて選択することができる。
[042] 基本処理単位は、コンピュータメモリ内(例えば、映像フレームバッファ内)に記憶される様々な種類の映像データ群を含み得る論理単位であり得る。例えば、カラーピクチャの基本処理単位は、無彩色の輝度情報を表すルマ成分(Y)、色情報を表す1つ又は複数のクロマ成分(例えば、Cb及びCr)並びにルマ成分及びクロマ成分が同じサイズを有し得る基本処理単位の関連構文要素を含むことができる。一部の映像コード化規格(例えば、H.265/HEVC又はH.266/VVC)では、ルマ成分及びクロマ成分が「コード化ツリーブロック」(「CTB」)と呼ばれ得る。基本処理単位に対して行われるいかなる操作も、そのルマ成分及びクロマ成分のそれぞれに対して繰り返し行うことができる。
[043] 映像のコード化は、複数の操作段階を有し、その例を図2A~図2B及び図3A~図3Bで詳述する。それぞれの段階について、基本処理単位のサイズは、依然として処理するのに大き過ぎる場合があり、従って本開示で「基本処理副単位」と呼ぶセグメントに更に分けることができる。一部の実施形態では、基本処理副単位は、一部の映像コード化規格(例えば、MPEGファミリ、H.261、H.263又はH.264/AVC)内の「ブロック」と呼ぶことができるか、又は他の一部の映像コード化規格(例えば、H.265/HEVC又はH.266/VVC)内の「コード化単位」(「CU」)と呼ぶことができる。基本処理副単位は、基本処理単位と同じ又はそれよりも小さいサイズを有し得る。基本処理単位と同様に、基本処理副単位もコンピュータメモリ内(例えば、映像フレームバッファ内)に記憶される様々な種類の映像データ群(例えば、Y、Cb、Cr及び関連構文要素)を含み得る論理単位である。基本処理副単位に対して行われるいかなる操作も、そのルマ成分及びクロマ成分のそれぞれに対して繰り返し行うことができる。処理の必要性に応じて、かかる分割は、更なるレベルに対して行われ得ることに留意すべきである。様々な段階が様々な方式を使用して基本処理単位を分割できることにも留意すべきである。
[044] 例えば、(その一例を図2Bで詳述する)モード決定段階において、基本処理単位に対して何れの予測モード(例えば、イントラピクチャ予測又はインターピクチャ予測)を使用するかを符号器が決定することができ、基本処理単位は、かかる決定を下すには大き過ぎる場合がある。符号器は、基本処理単位を複数の基本処理副単位(例えば、H.265/HEVC又はH.266/VVCにあるCU)に分け、個々の基本処理副単位ごとに予測の種類を決定することができる。
[045] 別の例では、(その一例を図2A~2Bに詳述する)予測段階において、符号器は、基本処理副単位(例えば、CU)のレベルにおいて予測操作を行うことができる。しかし、一部の事例では、処理するのに基本処理副単位が依然として大き過ぎる場合がある。符号器は、基本処理副単位をより小さいセグメント(例えば、H.265/HEVC又はH.266/VVC内で「予測ブロック」又は「PB」と呼ばれる)に更に分けることができ、そのレベルにおいて予測操作を行うことができる。
[046] 別の例では、(その一例を図2A~2Bに詳述する)変換段階において、符号器は、残差基本処理副単位(例えば、CU)に対する変換操作を行うことができる。しかし、一部の事例では、処理するのに基本処理副単位が依然として大き過ぎる場合がある。符号器は、基本処理副単位をより小さいセグメント(例えば、H.265/HEVC又はH.266/VVC内で「変換ブロック」又は「TB」と呼ばれる)に更に分けることができ、そのレベルにおいて変換操作を行うことができる。同じ基本処理副単位の分割方式は、予測段階と変換段階とで異なり得ることに留意すべきである。例えば、H.265/HEVC又はH.266/VVCでは、同じCUについての予測ブロック及び変換ブロックは、異なるサイズ及び数を有し得る。
[047] 図1の構造110では、基本処理単位112が3×3の基本処理副単位に更に分けられており、その境界が点線で示されている。同じピクチャの異なる基本処理単位を異なる方式で基本処理副単位に分けることができる。
[048] 一部の実装形態では、映像の符号化及び復号に並列処理及び誤り耐性の機能を与えるために、ピクチャを処理のための領域に分けることができ、それにより、ピクチャの領域について、符号化又は復号プロセスがピクチャの他の任意の領域の情報に依存しないようにすることができる。換言すれば、ピクチャの各領域を独立に処理することができる。そうすることで、コーデックは、ピクチャの異なる領域を並列に処理し、従ってコード化の効率を高めることができる。更に、領域のデータが処理内で破損するか又はネットワーク伝送内で失われる場合、コーデックは、破損するか又は失われたデータに依存することなく、同じピクチャの他の領域を正しく符号化又は復号することができ、従って誤り耐性の機能を提供する。一部の映像コード化規格では、ピクチャを異なる種類の領域に分割することができる。例えば、H.265/HEVC及びH.266/VVCは、「スライス」及び「タイル」という2種類の領域を提供する。映像シーケンス100の様々なピクチャは、ピクチャを領域に分けるための様々な分割方式を有し得ることにも留意すべきである。
[049] 例えば、図1では、構造110が3つの領域114、116及び118に分けられており、その境界が構造110内の実線として示されている。領域114は、4個の基本処理単位を含む。領域116及び118のそれぞれは、6個の基本処理単位を含む。図1の構造110の基本処理単位、基本処理副単位及び領域は、例に過ぎず、本開示は、その実施形態を限定しないことに留意すべきである。
[050] 図2Aは、本開示の実施形態と合致する、符号化プロセス200Aの一例の概略図を示す。例えば、符号化プロセス200Aは、符号器によって実行され得る。図2Aに示すように、符号器は、プロセス200Aに従って映像シーケンス202を映像ビットストリーム228に符号化することができる。図1の映像シーケンス100と同様に、映像シーケンス202は、時系列順に配置されるピクチャ(「元のピクチャ」と呼ぶ)の組を含み得る。図1の構造110と同様に、映像シーケンス202のそれぞれの元のピクチャは、符号器によって基本処理単位、基本処理副単位又は処理のための領域に分けられ得る。一部の実施形態では、符号器は、映像シーケンス202のそれぞれの元のピクチャに関する基本処理単位のレベルにおいてプロセス200Aを実行することができる。例えば、符号器は、プロセス200Aを反復的な方法で実行することができ、符号器は、プロセス200Aの1回の反復において基本処理単位を符号化することができる。一部の実施形態では、符号器は、映像シーケンス202のそれぞれの元のピクチャの領域(例えば、領域114~118)についてプロセス200Aを並列に実行することができる。
[051] 図2Aでは、符号器は、映像シーケンス202の元のピクチャの基本処理単位(「元のBPU」と呼ぶ)を予測段階204にフィードして、予測データ206及び予測されたBPU208を生成することができる。符号器は、元のBPUから、予測されたBPU208を減算して、残差BPU210を生成することができる。符号器は、残差BPU210を変換段階212及び量子化段階214にフィードして、量子化された変換係数216を生成することができる。符号器は、予測データ206及び量子化された変換係数216をバイナリコード化段階226にフィードして、映像ビットストリーム228を生成することができる。構成要素202、204、206、208、210、212、214、216、226及び228は、「順方向経路」と呼ぶことができる。プロセス200A中、符号器は、量子化段階214後、量子化された変換係数216を逆量子化段階218及び逆変換段階220にフィードして、再構築された残差BPU222を生成することができる。符号器は、再構築された残差BPU222を、予測されたBPU208に加えて、プロセス200Aの次の反復の予測段階204に使用される予測基準224を生成することができる。プロセス200Aの構成要素218、220、222及び224は、「再構築経路」と呼ぶことができる。再構築経路は、符号器及び復号器の両方が予測に同じ参照データを使用することを確実にするために使用され得る。
[052] 符号器は、プロセス200Aを反復的に実行して、(順方向経路内で)元のピクチャのそれぞれの元のBPUを符号化し、(再構築経路内で)元のピクチャの次の元のBPUを符号化するための予測された基準224を生成することができる。元のピクチャの全ての元のBPUを符号化した後、符号器は、映像シーケンス202内の次のピクチャの符号化に進むことができる。
[053] プロセス200Aを参照すると、符号器は、映像捕捉装置(例えば、カメラ)によって生成される映像シーケンス202を受信することができる。本明細書で使用する「受信(する)」という用語は、データを入力するために受信すること、入力すること、取得すること、取り出すこと、得ること、読み出すこと、アクセスすること又は任意の方法の任意のアクションを指すことができる。
[054] 予測段階204では、現在の反復において、符号器が元のBPU及び予測基準224を受信し、予測操作を行って予測データ206及び予測されたBPU208を生成することができる。予測基準224は、プロセス200A前の反復の再構築経路から生成され得る。予測段階204の目的は、予測データ206を抽出することにより、情報の冗長性を減らすことでああり、予測データ206は、予測データ206及び予測基準224から予測されたBPU208として元のBPUを再構築するために使用され得る。
[055] 理想的には、予測されたBPU208は、元のBPUと同一であり得る。しかし、理想的でない予測及び再構築操作により、予測されたBPU208は、概して、元のBPUと僅かに異なる。そのような差を記録するために、符号器は、予測されたBPU208を生成した後、それを元のBPUから減算して残差BPU210を生成することができる。例えば、符号器は、予測されたBPU208のピクセルの値(例えば、グレースケール値又はRGB値)を元のBPUの対応するピクセルの値から減算することができる。元のBPUの対応するピクセルと、予測されたBPU208との間のかかる減算の結果、残差BPU210の各ピクセルは、残差値を有し得る。元のBPUと比較して、予測データ206及び残差BPU210は、より少ないビットを有し得るが、品質を著しく損なうことなく元のBPUを再構築するためにそれらを使用することができる。
[056] 残差BPU210を更に圧縮するために、変換段階212において、符号器は、残差BPU210を2次元「基底パターン」の組に分解することにより、残差BPU210の空間的冗長性を低減することができ、各基底パターンは、「変換係数」に関連する。基底パターンは、同じサイズ(例えば、残差BPU210のサイズ)を有することができる。それぞれの基底パターンは、残差BPU210の変動周波数(例えば、輝度変動周波数)成分を表すことができる。基底パターンの何れも、他の任意の基底パターンの任意の組み合わせ(例えば、線形結合)から再現することができない。換言すれば、分解は、残差BPU210の変動を周波数領域内に分解することができる。かかる分解は、関数の離散フーリエ変換に類似し、基底パターンは、離散フーリエ変換の基底関数(例えば、三角関数)に類似し、変換係数は、基底関数に関連する係数に類似する。
[057] 様々な変換アルゴリズムが様々な基底パターンを使用することができる。例えば、離散コサイン変換、離散サイン変換等、変換段階212では、様々な変換アルゴリズムを使用することができる。変換段階212における変換は、可逆的である。即ち、符号器は、変換の逆操作(「逆変換」と呼ぶ)によって残差BPU210を復元することができる。例えば、残差BPU210のピクセルを復元するために、逆変換は、基底パターンの対応するピクセルの値を、関連するそれぞれの係数で乗算し、積を加算して加重和をもたらすことであり得る。映像コード化規格では、符号器及び復号器の両方が同じ変換アルゴリズム(従って同じ基底パターン)を使用することができる。従って、符号器は、変換係数のみを記録することができ、復号器は、符号器から基底パターンを受信することなく、変換係数から残差BPU210を再構築することができる。残差BPU210と比較して、変換係数の方が少ないビットを有し得るが、それらの変換係数は、品質を著しく損なうことなく残差BPU210を再構築するために使用され得る。従って、残差BPU210が更に圧縮される。
[058] 符号器は、量子化段階214において変換係数を更に圧縮することができる。変換プロセスでは、様々な基底パターンが様々な変動周波数(例えば、輝度変動周波数)を表すことができる。人間の目は、概して、低周波変動を認識することが得意であるため、符号器は、復号の際の著しい品質劣化を引き起こすことなく高周波変動の情報を無視することができる。例えば、量子化段階214において、符号器は、各変換係数を整数値(「量子化パラメータ」と呼ぶ)で除算し、商をその最近隣数に丸めることにより、量子化された変換係数216を生成することができる。かかる操作後、高周波基底パターンの一部の変換係数をゼロに変換することができ、低周波基底パターンの変換係数をより小さい整数に変換することができる。符号器は、ゼロ値の量子化された変換係数216を無視することができ、それにより変換係数が更に圧縮される。量子化プロセスも可逆的であり、量子化された変換係数216は、量子化の逆操作(「逆量子化」と呼ぶ)内で変換係数に再構築することができる。
[059] 符号器は、丸め操作内でかかる除算の剰余を無視するため、量子化段階214は、非可逆であり得る。典型的には、量子化段階214は、プロセス200A内で最大の情報損失に寄与し得る。情報損失が大きいほど、量子化された変換係数216が必要とし得るビットが少なくなる。情報損失の様々なレベルを得るために、符号器は、量子化パラメータの様々な値又は量子化プロセスの他の任意のパラメータを使用することができる。
[060] バイナリコード化段階226において、符号器は、例えば、エントロピーコード化、可変長コード化、算術コード化、ハフマンコード化、コンテキスト適応バイナリ算術コード化、又は他の任意の可逆若しくは非可逆圧縮アルゴリズム等のバイナリコード化技法を使用し、予測データ206及び量子化された変換係数216を符号化することができる。一部の実施形態では、予測データ206及び量子化された変換係数216に加えて、符号器は、例えば、予測段階204で使用される予測モード、予測操作のパラメータ、変換段階212の変換の種類、量子化プロセスのパラメータ(例えば、量子化パラメータ)、符号器制御パラメータ(例えば、ビットレート制御パラメータ)等の他の情報をバイナリコード化段階226において符号化することができる。符号器は、バイナリコード化段階226の出力データを使用して映像ビットストリーム228を生成することができる。一部の実施形態では、映像ビットストリーム228をネットワーク伝送のために更にパケット化することができる。
[061] プロセス200Aの再構築経路を参照すると、逆量子化段階218では、符号器は、量子化された変換係数216に対して逆量子化を行って、再構築された変換係数を生成することができる。逆変換段階220では、符号器は、再構築された変換係数に基づいて、再構築された残差BPU222を生成することができる。符号器は、再構築された残差BPU222を、予測されたBPU208に加えて、プロセス200Aの次の反復内で使用される予測基準224を生成することができる。
[062] 映像シーケンス202を符号化するためにプロセス200Aの他のバリエーションを使用できることに留意すべきである。一部の実施形態では、符号器がプロセス200Aの段階を異なる順序で実行することができる。一部の実施形態では、プロセス200Aの1つ又は複数の段階を単一の段階に組み合わせることができる。一部の実施形態では、プロセス200Aの単一の段階を複数の段階に分けることができる。例えば、変換段階212と量子化段階214とを単一の段階に組み合わせることができる。一部の実施形態では、プロセス200Aは、追加の段階を含み得る。一部の実施形態では、プロセス200Aは、図2A内の1つ又は複数の段階を省くことができる。
[063] 図2Bは、本開示の実施形態に合致する、符号化プロセスの別の例200Bの概略図を示す。プロセス200Bは、プロセス200Aから修正され得る。例えば、プロセス200Bは、ハイブリッド映像コード化規格(例えば、H.26xシリーズ)に準拠する符号器によって使用され得る。プロセス200Aと比較して、プロセス200Bの順方向経路は、モード決定段階230を更に含み、予測段階204を空間的予測段階2042及び時間的予測段階2044に分ける。プロセス200Bの再構築経路は、ループフィルタ段階232及びバッファ234を追加で含む。
[064] 概して、予測技法は、空間的予測及び時間的予測の2つの種類に分類することができる。空間的予測(例えば、イントラピクチャ予測又は「イントラ予測」)は、現BPUを予測するために、同じピクチャ内の既にコード化された1つ又は複数の隣接BPUのピクセルを使用することができる。即ち、空間的予測における予測基準224は、隣接BPUを含み得る。空間的予測は、ピクチャの固有の空間的冗長性を減らすことができる。時間的予測(例えば、インターピクチャ予測又は「インター予測」)は、現BPUを予測するために、既にコード化された1つ又は複数のピクチャの領域を使用することができる。即ち、時間的予測における予測基準224は、コード化されたピクチャを含み得る。時間的予測は、ピクチャの固有の時間的冗長性を減らすことができる。
[065] プロセス200Bを参照すると、順方向経路において、符号器は、空間的予測段階2042及び時間的予測段階2044で予測操作を行う。例えば、空間的予測段階2042では、符号器は、イントラ予測を行うことができる。符号化されているピクチャの元のBPUに関して、予測基準224は、同じピクチャ内の(順方向経路内で)符号化され、(再構築経路内で)再構築されている1つ又は複数の隣接BPUを含み得る。符号器は、隣接BPUを外挿することにより、予測されたBPU208を生成することができる。外挿技法は、例えば、線形外挿又は線形補間、多項式外挿又は多項式補間等を含み得る。一部の実施形態では、予測されたBPU208のピクセルごとに、対応するピクセルの値を外挿することによって等、符号器がピクセルレベルで外挿を行うことができる。外挿に使用される隣接BPUは、垂直方向(例えば、元のBPUの上)、水平方向(例えば、元のBPUの左)、対角線方向(例えば、元のBPUの左下、右下、左上又は右上)又は使用される映像コード化規格内で規定される任意の方向等、様々な方向から元のBPUに対して位置し得る。イントラ予測では、予測データ206は、例えば、使用される隣接BPUの位置(例えば、座標)、使用される隣接BPUのサイズ、外挿のパラメータ、元のBPUに対する使用される隣接BPUの方向等を含み得る。
[066] 別の例では、時間的予測段階2044では、符号器は、インター予測を行うことができる。現ピクチャの元のBPUに関して、予測基準224は、(順方向経路内で)符号化され、(再構築経路内で)再構築されている1つ又は複数のピクチャ(「参照ピクチャ」と呼ぶ)を含み得る。一部の実施形態では、参照ピクチャがBPUごとに符号化され再構築され得る。例えば、符号器は、再構築された残差BPU222を、予測されたBPU208に加えて、再構築されたBPUを生成することができる。同じピクチャの全ての再構築されたBPUが生成されると、符号器は、参照ピクチャとして再構築されたピクチャを生成することができる。符号器は、参照ピクチャの範囲(「探索窓」と呼ぶ)内の一致領域を探すために「動き推定」の操作を行うことができる。参照ピクチャ内の探索窓の位置は、現ピクチャ内の元のBPUの位置に基づいて決定することができる。例えば、探索窓は、参照ピクチャ内において、現ピクチャ内の元のBPUと同じ座標を有する位置に中心を置くことができ、所定の距離にわたって広げることができる。符号器が探索窓内で元のBPUと同様の領域を(例えば、pel再帰アルゴリズム、ブロックマッチングアルゴリズム等を使用することによって)識別すると、符号器は、その領域を一致領域として決定することができる。一致領域は、元のBPUと異なる(例えば、それよりも小さい、等しい、大きい又は異なる形状の)寸法を有し得る。参照ピクチャ及び現ピクチャは、(例えば、図1に示すように)タイムライン内で時間的に隔てられているため、時間が経つにつれて一致領域が元のBPUの位置に「移動する」と見なすことができる。符号器は、かかる動きの方向及び距離を「動きベクトル」として記録することができる。(例えば、図1のピクチャ106のような)複数の参照ピクチャが使用される場合、符号器は、参照ピクチャごとに一致領域を探し、その関連する動きベクトルを求めることができる。一部の実施形態では、符号器は、個々の一致する参照ピクチャの一致領域のピクセル値に重みを割り当てることができる。
[067] 動き推定は、例えば、平行移動、回転、拡大縮小等の様々な種類の動きを識別するために使用することができる。インター予測では、予測データ206は、例えば、一致領域の位置(例えば、座標)、一致領域に関連する動きベクトル、参照ピクチャの数、参照ピクチャに関連する重み等を含み得る。
[068] 予測されたBPU208を生成するために、符号器は、「動き補償」の操作を行うことができる。動き補償は、予測データ206(例えば、動きベクトル)及び予測基準224に基づいて、予測されたBPU208を再構築するために使用することができる。例えば、符号器は、動きベクトルに従って参照ピクチャの一致領域を動かすことができ、その中では、符号器は、現ピクチャの元のBPUを予測することができる。(例えば、図1のピクチャ106のような)複数の参照ピクチャが使用される場合、符号器は、個々の動きベクトルに従って参照ピクチャの一致領域を動かし、一致領域のピクセル値を平均することができる。一部の実施形態では、符号器が、個々の一致する参照ピクチャの一致領域のピクセル値に重みを割り当てた場合、符号器は、動かした一致領域のピクセル値の加重和を加えることができる。
[069] 一部の実施形態では、インター予測は、単方向又は双方向であり得る。単方向のインター予測は、現ピクチャに対して同じ時間的方向にある1つ又は複数の参照ピクチャを使用することができる。例えば、図1のピクチャ104は、参照ピクチャ(即ちピクチャ102)がピクチャ104に先行する単方向のインター予測ピクチャである。双方向のインター予測は、現ピクチャに対して両方の時間的方向にある1つ又は複数の参照ピクチャを使用することができる。例えば、図1のピクチャ106は、参照ピクチャ(即ちピクチャ104及び108)がピクチャ104に対して両方の時間的方向にある双方向のインター予測ピクチャである。
[070] プロセス200Bの順方向経路を引き続き参照すると、空間的予測段階2042及び時間的予測段階2044後、モード決定段階230において、符号器は、プロセス200Bの現在の反復のための予測モード(例えば、イントラ予測又はインター予測の1つ)を選択することができる。例えば、符号器は、レート歪み最適化技法を実行することができ、かかる技法では、符号器は、候補予測モードのビットレート及び候補予測モード下の再構築された参照ピクチャの歪みに応じて、コスト関数の値を最小化するための予測モードを選択することができる。選択される予測モードに応じて、符号器は、対応する予測されたBPU208及び予測されたデータ206を生成することができる。
[071] プロセス200Bの再構築経路において、順方向経路内でイントラ予測モードが選択されている場合、予測基準224(例えば、現ピクチャ内で符号化され再構築されている現BPU)を生成した後、符号器は、後に使用するために(例えば、現ピクチャの次のBPUを外挿するために)空間的予測段階2042に予測基準224を直接フィードすることができる。順方向経路内でインター予測モードが選択されている場合、予測基準224(例えば、全てのBPUが符号化され再構築されている現ピクチャ)を生成した後、符号器は、ループフィルタ段階232に予測基準224をフィードすることができ、ループフィルタ段階232では、符号器は、予測基準224にループフィルタを適用して、インター予測によって引き起こされる歪み(例えば、ブロッキングアーティファクト)を減らすか又はなくすことができる。例えば、デブロッキング、サンプル適応オフセット、適応ループフィルタ等、符号器は、ループフィルタ段階232で様々なループフィルタ技法を適用することができる。ループフィルタされた参照ピクチャは、後に使用するために(例えば、映像シーケンス202の将来のピクチャのためのインター予測参照ピクチャとして使用するために)バッファ234(又は「復号されたピクチャバッファ」)内に記憶することができる。符号器は、時間的予測段階2044で使用するために1つ又は複数の参照ピクチャをバッファ234内に記憶することができる。一部の実施形態では、符号器は、量子化された変換係数216、予測データ206及び他の情報と共にループフィルタのパラメータ(例えば、ループフィルタの強度)をバイナリコード化段階226で符号化することができる。
[072] 図3Aは、本開示の実施形態に合致する、復号プロセス300Aの一例の概略図を示す。プロセス300Aは、図2Aの圧縮プロセス200Aに対応する解凍プロセスであり得る。一部の実施形態では、プロセス300Aは、プロセス200Aの再構築経路と同様であり得る。復号器は、プロセス300Aに従って映像ビットストリーム228を映像ストリーム304に復号することができる。映像ストリーム304は、映像シーケンス202と非常に類似し得る。しかし、圧縮及び解凍プロセス(例えば、図2A~図2Bの量子化段階214)における情報損失により、概して、映像ストリーム304は、映像シーケンス202と同一ではない。図2A~図2Bのプロセス200A及び200Bと同様に、復号器は、映像ビットストリーム228内に符号化される各ピクチャについて、基本処理単位(BPU)のレベルにおいてプロセス300Aを実行することができる。例えば、復号器は、プロセス300Aを反復的な方法で実行することができ、復号器は、プロセス300Aの1回の反復において基本処理単位を復号することができる。一部の実施形態では、復号器は、映像ビットストリーム228内に符号化される各ピクチャの領域(例えば、領域114~118)についてプロセス300Aを並列に実行することができる。
[073] 図3Aでは、復号器は、符号化されたピクチャの基本処理単位(「符号化されたBPU」と呼ぶ)に関連する映像ビットストリーム228の一部をバイナリ復号段階302にフィードすることができる。バイナリ復号段階302では、復号器は、当該一部を予測データ206及び量子化された変換係数216に復号することができる。復号器は、量子化された変換係数216を逆量子化段階218及び逆変換段階220にフィードして、再構築された残差BPU222を生成することができる。復号器は、予測データ206を予測段階204にフィードして、予測されたBPU208を生成することができる。復号器は、再構築された残差BPU222を、予測されたBPU208に加えて、予測された基準224を生成することができる。一部の実施形態では、予測された基準224がバッファ(例えば、コンピュータメモリ内の復号されたピクチャバッファ)内に記憶され得る。復号器は、プロセス300Aの次の反復内で予測操作を行うための予測された基準224を予測段階204にフィードすることができる。
[074] 復号器は、プロセス300Aを反復的に実行して、符号化されたピクチャの各符号化されたBPUを復号し、符号化されたピクチャの次の符号化されたBPUを符号化するための予測された基準224を生成することができる。符号化されたピクチャの全ての符号化されたBPUを復号した後、復号器は、表示するためにピクチャを映像ストリーム304に出力し、映像ビットストリーム228内の次の符号化されたピクチャの復号に進むことができる。
[075] バイナリ復号段階302では、復号器は、符号器が使用したバイナリコード化技法(例えば、エントロピーコード化、可変長コード化、算術コード化、ハフマンコード化、コンテキスト適応バイナリ算術コード化又は他の任意の可逆圧縮アルゴリズム)の逆操作を行うことができる。一部の実施形態では、予測データ206及び量子化された変換係数216に加えて、復号器は、例えば、予測モード、予測操作のパラメータ、変換の種類、量子化プロセスのパラメータ(例えば、量子化パラメータ)、符号器制御パラメータ(例えば、ビットレート制御パラメータ)等の他の情報をバイナリ復号段階302において復号することができる。一部の実施形態では、映像ビットストリーム228がネットワーク上においてパケット単位で伝送される場合、復号器は、映像ビットストリーム228をパケット化解除してからそれをバイナリ復号段階302にフィードすることができる。
[076] 図3Bは、本開示の実施形態に合致する、復号プロセスの別の例300Bの概略図を示す。プロセス300Bは、プロセス300Aから修正され得る。例えば、プロセス300Bは、ハイブリッド映像コード化規格(例えば、H.26xシリーズ)に準拠する復号器によって使用され得る。プロセス300Aと比較して、プロセス300Bは、予測段階204を空間的予測段階2042及び時間的予測段階2044に更に分け、ループフィルタ段階232及びバッファ234を追加で含む。
[077] プロセス300Bでは、復号されている符号化されたピクチャ(「現ピクチャ」と呼ぶ)の符号化された基本処理単位(「現BPU」と呼ぶ)に関して、復号器によってバイナリ復号段階302から復号される予測データ206は、現BPUを符号化するために何れの予測モードが符号器によって使用されたかに応じて様々な種類のデータを含み得る。例えば、現BPUを符号化するためにイントラ予測が符号器によって使用された場合、予測データ206は、イントラ予測、イントラ予測操作のパラメータ等を示す予測モードインジケータ(例えば、フラグ値)を含み得る。イントラ予測操作のパラメータは、例えば、基準として使用される1つ又は複数の隣接BPUの位置(例えば、座標)、隣接BPUのサイズ、外挿のパラメータ、元のBPUに対する隣接BPUの方向等を含み得る。別の例では、現BPUを符号化するためにインター予測が符号器によって使用された場合、予測データ206は、インター予測、インター予測操作のパラメータ等を示す予測モードインジケータ(例えば、フラグ値)を含み得る。インター予測操作のパラメータは、例えば、現BPUに関連する参照ピクチャの数、参照ピクチャにそれぞれ関連する重み、それぞれの参照ピクチャ内の1つ又は複数の一致領域の位置(例えば、座標)、一致領域にそれぞれ関連する1つ又は複数の動きベクトル等を含み得る。
[078] 予測モードインジケータに基づき、復号器は、空間的予測段階2042で空間的予測(例えば、イントラ予測)を行うか、又は時間的予測段階2044で時間的予測(例えば、インター予測)を行うかを決めることができる。かかる空間的予測又は時間的予測の実行の詳細は、図2Bに示されており、以下で繰り返さない。かかる空間的予測又は時間的予測を行った後、復号器は、予測されたBPU208を生成することができる。図3Aに記載したように、復号器は、予測されたBPU208と、再構築された残差BPU222とを加えて、予測基準224を生成することができる。
[079] プロセス300Bでは、復号器は、プロセス300Bの次の反復内で予測操作を行うための予測された基準224を空間的予測段階2042又は時間的予測段階2044にフィードすることができる。例えば、現BPUが空間的予測段階2042においてイントラ予測を使用して復号される場合、予測基準224(例えば、復号された現BPU)を生成した後、復号器は、後に使用するために(例えば、現ピクチャの次のBPUを外挿するために)空間的予測段階2042に予測基準224を直接フィードすることができる。現BPUが時間的予測段階2044においてインター予測を使用して復号される場合、予測基準224(例えば、全てのBPUが復号されている参照ピクチャ)を生成した後、符号器は、ループフィルタ段階232に予測基準224をフィードして歪み(例えば、ブロッキングアーティファクト)を減らすか又はなくすことができる。復号器は、図2Bに記載した方法で予測基準224にループフィルタを適用することができる。ループフィルタされた参照ピクチャは、後に使用するために(例えば、映像ビットストリーム228の将来の符号化ピクチャのためのインター予測参照ピクチャとして使用するために)バッファ234(例えば、コンピュータメモリ内の復号されたピクチャバッファ)内に記憶することができる。復号器は、時間的予測段階2044で使用するために1つ又は複数の参照ピクチャをバッファ234内に記憶することができる。一部の実施形態では、現BPUを符号化するためにインター予測が使用されたことを予測データ206の予測モードインジケータが示す場合、予測データは、ループフィルタのパラメータ(例えば、ループフィルタの強度)を更に含むことができる。
[080] 図4Aは、本開示の実施形態に合致する、映像を符号化又は復号するための機器400の一例のブロック図である。図4Aに示すように、機器400は、プロセッサ402を含み得る。プロセッサ402が本明細書に記載の命令を実行するとき、機器400は、映像を符号化又は復号するための専用マシンになり得る。プロセッサ402は、情報を操作又は処理することができる任意の種類の回路であり得る。例えば、プロセッサ402は、任意の数の中央処理装置(「CPU」)、グラフィックス処理装置(「GPU」)、ニューラル処理ユニット(「NPU」)、マイクロコントローラユニット(「MCU」)、光プロセッサ、プログラム可能論理コントローラ、マイクロコントローラ、マイクロプロセッサ、デジタル信号プロセッサ、知的財産(IP)コア、プログラム可能論理アレイ(PLA)、プログラム可能アレイ論理(PAL)、汎用アレイ論理(GAL)、複合プログラム可能論理装置(CPLD)、書換可能ゲートアレイ(FPGA)、システムオンチップ(SoC)、特定用途向け集積回路(ASIC)等の任意の組み合わせを含み得る。一部の実施形態では、プロセッサ402は、単一の論理構成要素としてグループ化されるプロセッサの組であり得る。例えば、図4Aに示すように、プロセッサ402は、プロセッサ402a、プロセッサ402b及びプロセッサ402nを含む複数のプロセッサを含み得る。
[081] 機器400は、データ(例えば、命令、コンピュータコード、中間データ等の組)を記憶するように構成されるメモリ404も含み得る。例えば、図4Aに示すように、記憶データは、プログラム命令(例えば、プロセス200A、200B、300A又は300B内の段階を実装するためのプログラム命令)及び処理用データ(例えば、映像シーケンス202、映像ビットストリーム228又は映像ストリーム304)を含み得る。プロセッサ402は、プログラム命令及び処理用データに(例えば、バス410を介して)アクセスし、プログラム命令を実行して処理用データに対する操作又は処理を行うことができる。メモリ404は、高速ランダムアクセス記憶装置又は不揮発性記憶装置を含み得る。一部の実施形態では、メモリ404は、任意の数のランダムアクセスメモリ(RAM)、読取専用メモリ(ROM)、光学ディスク、磁気ディスク、ハードドライブ、ソリッドステートドライブ、フラッシュドライブ、セキュリティデジタル(SD)カード、メモリスティック、コンパクトフラッシュ(登録商標)(CF)カード等の任意の組み合わせを含み得る。メモリ404は、単一の論理構成要素としてグループ化される(図4Aには不図示の)メモリ群でもあり得る。
[082] 内蔵バス(例えば、CPUメモリバス)、外部バス(例えば、ユニバーサルシリアルバスポート、周辺機器コンポーネント相互接続エクスプレスポート)等のバス410は、機器400内の構成要素間でデータを転送する通信装置であり得る。
[083] 曖昧さを招くことなく説明を簡単にするために、本開示では、プロセッサ402及び他のデータ処理回路をまとめて「データ処理回路」と呼ぶ。データ処理回路は、完全にハードウェアとして、又はソフトウェア、ハードウェア若しくはファームウェアの組み合わせとして実装することができる。加えて、データ処理回路は、単一の独立したモジュールであり得るか、又は機器400の他の任意の構成要素内に完全に若しくは部分的に組み合わされ得る。
[084] 機器400は、ネットワーク(例えば、インターネット、イントラネット、ローカルエリアネットワーク、モバイル通信ネットワーク等)との有線通信又は無線通信を提供するためのネットワークインタフェース406を更に含み得る。一部の実施形態では、ネットワークインタフェース406は、任意の数のネットワークインタフェースコントローラ(NIC)、無線周波数(RF)モジュール、トランスポンダ、トランシーバ、モデム、ルータ、ゲートウェイ、有線ネットワークアダプタ、無線ネットワークアダプタ、Bluetooth(登録商標)アダプタ、赤外線アダプタ、近距離無線通信(「NFC」)アダプタ、セルラネットワークチップ等の任意の組み合わせを含み得る。
[085] 一部の実施形態では、1つ又は複数の周辺装置への接続を提供するための周辺装置インタフェース408を任意選択的に機器400が更に含み得る。図4Aに示すように、周辺装置は、これのみに限定されないが、カーソル制御装置(例えば、マウス、タッチパッド又はタッチスクリーン)、キーボード、ディスプレイ(例えば、ブラウン管ディスプレイ、液晶ディスプレイ又は発光ダイオードディスプレイ)、映像入力装置(例えば、映像アーカイブに結合されるカメラ又は入力インタフェース)等を含み得る。
[086] 映像コーデック(例えば、プロセス200A、200B、300A又は300Bを実行するコーデック)は、機器400内の任意のソフトウェア又はハードウェアモジュールの任意の組み合わせとして実装できることに留意すべきである。例えば、プロセス200A、200B、300A又は300Bの一部の又は全ての段階は、メモリ404内にロード可能なプログラム命令等の、機器400の1つ又は複数のソフトウェアモジュールとして実装され得る。別の例では、プロセス200A、200B、300A又は300Bの一部の又は全ての段階は、専用データ処理回路(例えば、FPGA、ASIC、NPU等)等の、機器400の1つ又は複数のハードウェアモジュールとして実装され得る。
[087] インター予測を使用してコード化されるCUでは、前に復号されたピクチャ(即ち参照ピクチャ)内の参照ブロックが予測子として識別される。参照ピクチャ内の参照ブロックと現ピクチャ内のコード化ブロックとの間の相対位置が動きベクトル(MV)として定められる。現CUの動き情報は、予測子、参照ピクチャインデックス及び対応するMVの数によって指定される。動き情報に基づく動き補償によって予測を得た後、予測信号と元の信号との間の残差を変換、量子化及びエントロピーコード化に更にかけてから、出力ビットストリーム内にパックすることができる。
[088] 一部の状況では、現CUの空間的及び時間的に隣接するCUの動き情報を使用して、現CUの動き情報を予測することができる。動き情報のコード化ビットを減らすために、マージモードを採用することができる。マージモードでは、空間的又は時間的に隣接するブロックから動き情報が導出され、何れの隣接ブロックから動き情報を導出したかを示すためにマージインデックスをシグナリングすることができる。
[089] HEVCでは、以下の候補に基づいてマージ候補リストを構築することができる。
[090] (1)5つの空間的隣接ブロックから導出される最大4つの空間的マージ候補。
[091] (2)時間的コロケーテッドブロックから導出される1つの時間的マージ候補。
[092] (3)結合双予測候補及びゼロ動きベクトル候補を含む追加のマージ候補。
[093] マージ候補リスト内の第1の候補は、空間的近傍である。図4Bは、5つの空間的候補の位置を示す。{A1,B1,B0,A0,B2}の順序に従って各候補の位置の可用性が検査される。空間的隣接ブロックがイントラ予測されるか、又は位置が現スライス若しくはタイルの外側にある場合、その空間的隣接ブロックは、マージ候補として利用できないと考えることができる。加えて、隣接ブロックからの動きデータが可能な限りユニークであることを確実にするために、幾らかの冗長性検査を行うことができる。冗長性検査に起因する複雑さを減らすために、限られた冗長性検査のみを行うことができ、ユニーク性は、必ずしも保証されない。例えば、{A1,B1,B0,A0,B2}の順序を所与とし、B0は、B1のみを検査し、A0は、A1のみを検査し、B2は、A1及びB1のみを検査する。
[094] 時間的マージ候補では、利用可能である場合、図4Cに示すように、参照ピクチャのコロケーテッドブロックの直接外側の右下位置C0を使用する。さもなければ、代わりに中心位置C1を使用することができる。コロケーテッド参照ピクチャに何れの参照ピクチャリストが使用されるかは、スライスヘッダ内でシグナリングされるインデックスによって示され得る。図5に示すように、コロケーテッドブロックのMVは、ピクチャ順序カウント(POC)差に基づいてスケーリングしてからマージリスト内に挿入することができる。
[095] マージ候補の最大数Cは、スライスヘッダ内で指定され得る。見つかった利用可能なマージ候補の数(時間的候補を含む)がCを上回る場合、最初のC-1の空間的候補及び時間的候補のみが保持される。そうではなく、利用可能なマージ候補の数がC未満である場合、数がCに等しくなるまで追加の候補が生成される。コード化データを構文解析する能力が、利用可能なマージ候補の数に依存しないため、この形態は、構文解析を単純化することができ、構文解析をよりロバストにする。共通実験条件(CTC)では、マージ候補の最大数Cが5に設定される。
[096] Bスライスでは、参照ピクチャリスト0及びリスト1に関する既定の順序に従って利用可能な2つの候補を組み合わせることで、追加のマージ候補が生成される。例えば、生成される第1の候補は、リスト0に関する第1のマージ候補及びリスト1に関する第2のマージ候補を使用する。HEVCは、(0,1)、(1,0)、(0,2)、(2,0)、(1,2)、(2,1)、(0,3)、(3,0)、(1,3)、(3,1)、(2,3)及び(3,2)として、既に構築されたマージ候補リスト内で2つの動きベクトルの合計12個の既定の対を上記の順序で規定し、ここで、(i,j)は、利用可能なマージ候補のインデックスを表す。それらのうち、冗長エントリを除去した後に最大5つの候補を含めることができる。
[097] スライスがPスライスであるか、又はマージ候補の数が依然としてC未満である場合、マージ候補リスト内の残りの任意のエントリを埋めるために、ゼロから参照ピクチャ数マイナス1までの参照インデックスに関連するゼロ動きベクトルが使用される。
[098] VVCでは、以下の5種類の候補を順に含めることによってマージ候補リストが構築される:
空間的隣接CUからの空間的マージ候補、
コロケーテッドCUからの時間的マージ候補、
FIFOテーブルからの履歴ベースの動きベクトル予測子(HMVP)、
ペアワイズ平均候補、及び
ゼロMV。
[099] 空間的マージ候補及び時間的マージ候補の定義は、HEVCにあるのと同じである。空間的マージ候補及び時間的マージ候補後、HMVPマージ候補がマージリストに追加される。HMVPでは、過去にコード化されたブロックの動き情報がテーブル内に記憶され、及び現CUのための動きベクトル予測子として使用される。符号化/復号プロセス中、複数のHMVP候補を有するテーブルが維持される。新たなCTU行に遭遇するとき、テーブルは、リセットされる(空にされる)。非サブブロックのインターコード化されたCUがある場合、関連する動き情報は、新たなHMVP候補としてテーブルの最後のエントリに追加される。
[0100] VVCでは、HMVPテーブルのサイズを6に設定することができ、即ち最大6つのHMVP候補をテーブルに追加することができる。テーブルに新たな動き候補を挿入するとき、制約付きの先入れ先出し(FIFO)規則を利用することができ、テーブル内に同一のHMVPがあるかどうかを見出すために冗長性検査が最初に適用される。見つかる場合、同一のHMVPをテーブルから除去し、その後の全てのHMVP候補を前に移動することができる。
[0101] マージ候補リストの構築プロセス中、テーブル内の最後の幾つかのHMVP候補が順に検査され、時間的動きベクトル予測子(TMVP)候補後にマージ候補リストに挿入される。空間的マージ候補又は時間的マージ候補に対してHMVP候補を検査するために、冗長性検査を適用することができる。
[0102] HMVP候補を挿入した後、マージ候補リストが依然として一杯でない場合、ペアワイズ平均候補を追加する。ペアワイズ平均候補は、既存のマージ候補リスト内の候補の既定の対を平均することによって生成される。既定の対は、{(0,1),(0,2),(1,2),(0,3),(1,3),(2,3)}として定められ、ここで、数字は、マージ候補リスト内のマージインデックスを表す。平均された動きベクトルが参照ピクチャリストごとに別々に計算される。両方の動きベクトルが1つのリスト内で入手可能である場合、それらの2つの動きベクトルは、異なる参照ピクチャを指す場合でも平均される。1つの動きベクトルのみが入手可能である場合、その利用可能なものを直接使用する。動きベクトルが入手できない場合、そのリストは、無効と見なされる。
[0103] ペアワイズ平均マージ候補を追加した後もマージリストが依然として一杯でない場合、最大マージ候補数に達するまでゼロ動きベクトルが末尾に挿入される。
[0104] VVCでは、通常マージモードに加えて、マージ候補リストの構築は、merge mode with motion vector difference(MMVD)及び三角形分割モード(TPM)にも使用することができる。
[0105] MMVDでは、マージ候補がマージ候補リストからまず選択され、シグナリングされる動きベクトル差(MVD)情報によって更にリファインされる。MMVDマージ候補リストのサイズは、2に設定される。2つのMMVD候補の何れがベース動きベクトル(MV)として使用されるかを指定するために、マージ候補フラグがシグナリングされ得る。MVD情報は、距離インデックス及び方向インデックスによってシグナリングされ得る。距離インデックスは、動きの大きさの情報を指定し、ベースMVからの既定のオフセットを示す。距離インデックスと既定のオフセットとの関係を図6の例に示す。方向インデックスは、ベースMVに加えられるオフセットの符号を指定し、例えば、0は、正符号を示し、1は、負符号を示す。
[0106] TPMでは、CUは、対角線分割又は逆対角線分割を使用して2つの三角形区画に均等に分けられる。CU内のそれぞれの三角形区画は、自らの動きを使用してインター予測され得る。それぞれの区画について単予測のみが認められる。即ち、各区画は、1つの動きベクトル及び1つの参照インデックスを有する。双予測と同様に、2つの動き補償予測のみが各CUに必要であることを確実にするために、単予測動き制約が適用される。三角形分割モードが現CUに使用される場合、三角形分割の方向(対角線又は逆対角線)を示すフラグ及び2つのマージインデックス(区画ごとに1つ)が更にシグナリングされ得る。三角形区画のそれぞれを予測した後、適応重みを伴う混合処理を使用して、対角線エッジ又は逆対角線エッジに沿ったサンプル値を調節する。これは、全CUのための予測信号に対応し、通常のインターモードにあるように変換及び量子化プロセスを全CUに適用することができる。マージ候補リストを構築することができる。最大TPMマージ候補の数がスライスヘッダ内で明確にシグナリングされ、CTC内で5に設定され得る。
[0107] VVCでは、空間的候補、時間的候補、HMVP及びペアワイズ平均候補を含むマージ候補リストが構築される。異なるインターモードに対して異なるマージリストのサイズが適用される。例えば、{A1,B1,B0,A0,B2}の順序に従って空間的マージ候補をマージリスト内に挿入することができる。しかし、空間的マージ候補の構築プロセスは、HEVCからVVCまで変更されておらず、それは、VVC内の新たなマージ候補(例えば、HMVP、ペアワイズ平均)及び新たなインターモード(例えば、MMVD、TPM)を考慮に入れていない。これは、現在の空間的マージ候補の様々な欠点につながる。
[0108] 例えば、空間的マージ候補の順序を改善することができる。空間的マージ候補の数を調節することができる。更に、空間的マージ候補の構築は、通常モード、MMVDモード及びTPMモードに関して固定され、それは、マージ方法の潜在性を限定する。加えて、空間的マージ候補の構築は、低遅延ピクチャ及び非低遅延ピクチャに関して固定され、それは、柔軟性を下げる。上記の及び他の問題に対処するために、本開示では、様々な解決策を提供する。
[0109] 例えば、一部の実施形態では、空間的マージ候補の順序を変更することができる。空間的マージ候補の新たな順序{B1,A1,B0,A0,B2}を適用することができる。空間的隣接ブロックB1、A1、B0、A0及びB2の位置を図7に示す。一部の実施形態では、この順序を{B1,A1,B0,A0,B2}に変更することができる。
[0110] 新たな順序は、上の隣接ブロック、左の隣接ブロック、上の隣接ブロック、左の隣接ブロック、及び左上の隣接ブロックに連続して対応し、この順序は、上の近傍と左の近傍とで交互になる。更に、空間的マージ候補の新たな順序は、より高いコード化性能を実現することができる。図8及び図9に示すように、一部の実施形態によれば、提案する方法は、ランダムアクセス(RA)及び低遅延(LD)構成下のVTM-6と比較して平均0.05%及び0.21%のコード化利得をそれぞれ得ることができる。
[0111] 一部の実施形態では、空間的マージ候補の数を変更することができる。計算の複雑さとコード化性能との間のより優れたトレードオフを実現するために、本開示の様々な実施形態において、空間的マージ候補の数の減少が提案され適用される。空間的マージ候補の数を2に制限する場合、構築順序{B1,A1}を適用することができる。例えば、入手可能である場合、隣接ブロックB1を検査し、マージリスト内に挿入することができる。次いで、入手可能であり、B1と同じでない場合、隣接ブロックA1を検査し、マージリスト内に挿入することができる。空間的マージ候補{B1,A1}を挿入した後、その後のTMVP、HMVP及びペアワイズ平均候補をマージリスト内に追加することができる。
[0112] 空間的マージ候補の数を3に制限する場合、構築順序{B1,A1,B0}を適用することができる。隣接ブロックの検査順序は、B1->A1->B0であり、入手可能であり、冗長でない場合、対応するMVをマージリスト内に挿入することができる。
[0113] 空間的マージ候補{B1,A1,B0}を使用する場合、VTM-6と比較した実験結果を図10及び図11に示す。図10及び図11に示すように、一部の実施形態によれば、提案する技法は、RA及びLD構成下で0.00%及び0.10%のコード化利得を実現することができる。
[0114] 更に、一部のVVC技法では、マージ候補の総数をシグナリングすることができる。本開示の一部の実施形態では、マージ候補リストを構築する際に更なる柔軟性を得るために、空間的マージ候補の数を更にシグナリングすることを提案する。現ピクチャの予測構造を考慮し、空間的マージ候補の数は、様々な値に設定することができる。現ピクチャが非低遅延ピクチャである場合、空間的マージ候補の数を第1の値に設定することができる。非低遅延ピクチャは、表示順序に従って過去及び未来の両方からの参照ピクチャを使用してコード化されるピクチャを指し得る。そうではなく、現ピクチャが低遅延ピクチャである場合、空間的マージ候補の数を第2の値に設定することができる。低遅延ピクチャは、表示順序に従って過去からの参照ピクチャのみを使用してコード化されるピクチャを指し得る。第1の値は、第2の値よりも大きい値とすることができる。第1の値及び第2の値は、ビットストリーム内、例えばスライスヘッダ内で明確にシグナリングされ得る。図12に一例を示す。
[0115] 構文要素num_spatial_merge_cand_minus2(例えば、図12の要素1201)は、現スライスに使用される空間的マージ候補の数を示すことができる。num_spatial_merge_cand_minus2の値は、0~3(両端値を含む)の範囲内であり得る。num_spatial_merge_cand_minus2の要素がない場合、num_spatial_merge_cand_minus2は、0に等しいと推論することができる。
[0116] 現スライスをコード化するために使用される参照ピクチャに応じて、スライスは、低遅延又は非低遅延として分類することができ、様々な数のマージ候補を使用することができる。num_spatial_merge_cand_minus2の値は、符号器によって適宜設定され、ビットストリーム内で送信され得る。
[0117] 代替的に、スライスヘッダ内で1つの構文要素をシグナリングする代わりに、図13(例えば、要素1301)及び図14(例えば、要素1401)内で示すように、num_spatial_merge_cand_minus2_non_lowdelay及びnum_spatial_merge_cand_minus2_lowdelayの2つの構文要素をピクチャパラメータセット(PPS)又はシーケンスパラメータセット(SPS)内でシグナリングすることができる。更に、スライスレベルにおいて、スライスの種類に応じて対応する数の空間的マージ候補を使用することができる。
[0118] num_spatial_merge_cand_minus2_non_lowdelay及びnum_spatial_merge_cand_minus2_lowdelayの値は、非低遅延スライス及び低遅延スライスに使用される空間的マージ候補の数をそれぞれ示し得る。num_spatial_merge_cand_minus2_non_lowdelay及びnum_spatial_merge_cand_minus2_lowdelayの値は、0~3(両端値を含む)の範囲内であり得る。num_spatial_merge_cand_minus2_non_lowdelay又はnum_spatial_merge_cand_minus2_lowdelayがない場合、それらは、0に等しいと推論することができる。
[0119] 一部の実施形態では、異なるインターモードに対して空間的マージ候補の別々の構築順序が適用され得る。例えば、{B1,A1,B0,A0,B2}及び{A1,B1,B0,A0,B2}を含む、空間的マージ候補の2つの構築順序を検討することができる。通常マージモード、MMVDモード、及びTPMモードに対して異なる構築順序を採用することができる。一部の実施形態では、{B1,A1,B0,A0,B2}を通常マージモード及びTPMモードに使用し、{A1,B1,B0,A0,B2}をMMVDモードに使用することを提案する。例示的実施形態の実験結果を図15及び図16に示す。提案する方法は、RA及びLD構成下で平均0.07%及び0.16%のコード化利得をそれぞれ実現できることが認められている。
[0120] 本開示に基づき、空間的マージ候補の順序及びマージモードの他の組み合わせを使用できることを当業者であれば理解することができる。例えば、{B1,A1,B0,A0,B2}を通常マージモードのみに使用することができ、{A1,B1,B0,A0,B2}をMMVDモード及びTMPモードに使用することができる。
[0121] 一部の実施形態では、フレームの種類に基づいて空間的マージ候補の適応構築順序を適用することができる。例えば、低遅延ピクチャ及び非低遅延ピクチャ等の異なる種類のインターコード化ピクチャに対して異なる空間的マージ候補構築方法を適用することができる。一部の実施形態では、低遅延ピクチャに関して、空間的マージ候補の構築順序{B1,A1,B0,A0,B2}を、通常マージモード、TPMモード、及びMMVDモードに使用することができる。非低遅延ピクチャに関して、空間的マージ候補の構築順序{B1,A1,B0,A0,B2}を、通常マージモード及びTPMモードに使用することができ、空間的マージ候補の構築順序{A1,B1,B0,A0,B2}をMMVDモードに使用することができる。例示的実施形態の実験結果を図17及び図18に示す。提案する方法は、RA及びLD構成下で平均0.08%及び0.21%のコード化利得をそれぞれ実現できることが認められている。
[0122] 図19は、本開示の実施形態と合致する例示的な映像処理方法1900のフローチャートを示す。一部の実施形態では、方法1900は、符号器、復号器、機器(例えば、図4Aの機器400)の1つ又は複数のソフトウェア又はハードウェアコンポーネントによって実行され得る。例えば、プロセッサ(例えば、図4Aのプロセッサ402)は、方法1900を実行することができる。一部の実施形態では、方法1900は、コンピュータ(例えば、図4Aの機器400)によって実行されるプログラムコード等のコンピュータ実行可能命令を含むコンピュータ可読媒体において具体化されるコンピュータプログラム製品によって実装され得る。
[0123] ステップ802では、例えば符号器、復号器、又は機器(例えば、図4Aの機器400)の1つ若しくは複数のソフトウェア若しくはハードウェアコンポーネントにより、コード化ブロックのマージ候補リストに空間的マージ候補の組を挿入することができる。VVCでは、空間的マージ候補の順序を改善することができる。空間的マージ候補の組は、上の隣接ブロック、左の隣接ブロック、上の隣接ブロック、左の隣接ブロック、及び左上の隣接ブロックの順に従って挿入することができる。例えば、空間的マージ候補の新たな順序{B1,A1,B0,A0,B2}を図7に示す。
[0124] 空間的マージ候補の数は、調節することができる。ステップ804では、空間的マージ候補の予め設定された数値限界を決定する。
[0125] ステップ806では、数値限界が2である場合、上の隣接ブロック、左の隣接ブロックの順序に基づいてマージ候補リスト内に空間的マージ候補の組を挿入する。空間的マージ候補の数を2に制限する場合、構築順序{B1,A1}を適用することができる。例えば、入手可能である場合、隣接ブロックB1を検査し、マージリスト内に挿入することができる。次いで、入手可能であり、B1と同じでない場合、隣接ブロックA1を検査し、マージリスト内に挿入することができる。空間的マージ候補{B1,A1}を挿入した後、その後のTMVP、HMVP及びペアワイズ平均候補をマージリスト内に追加することができる。
[0126] ステップ808では、数値限界が3である場合、上の隣接ブロック、左の隣接ブロック、上の隣接ブロックの順序に基づいてマージ候補リスト内に空間的マージ候補の組を挿入する。空間的マージ候補の数を3に制限する場合、構築順序{B1,A1,B0}を適用することができる。隣接ブロックの検査順序は、B1->A1->B0であり、入手可能であり、冗長でない場合、対応するMVをマージリスト内に挿入することができる。
[0127] 一部の実施形態では、コロケーテッドコード化単位からの時間的マージ候補、先入れ先出し(FIFO)テーブルからの履歴ベースの動きベクトル予測子(HMVP)、ペアワイズ平均候補、又はゼロ動きベクトルの少なくとも1つをマージ候補リストに追加することができる。
[0128] HMVPでは、過去にコード化されたブロックの動き情報がFIFOテーブル内に記憶され、及び現コード化単位のための動きベクトル予測子として使用される。符号化/復号プロセス中、複数のHMVP候補を有するテーブルが維持される。新たなCTU行に遭遇するとき、テーブルは、リセットされる(空にされる)。非サブブロックのインターコード化されたコード化単位がある場合、非サブブロックのインターコード化されたコード化単位に関連する動き情報は、新たなHMVP候補としてFIFOテーブルの最後のエントリに追加される。
[0129] ペアワイズ平均候補は、マージ候補リストが一杯でないことに応じて、マージ候補リスト内の候補の対を平均することによって生成され、及び1つ又は複数のHMVPがマージ候補リストに追加された後、マージ候補リストに追加される。
[0130] ペアワイズ平均マージ候補を追加した後もマージリストが依然として一杯でない場合、最大マージ候補数に達するまでゼロ動きベクトルをマージ候補リストの末尾に挿入する。
[0131] ステップ810では、例えば符号器又は復号器により、コード化ブロックに対して第1のコード化モードを適用するか又は第2のコード化モードを適用するかを決定する。第1のコード化モードは、第2のコード化モードと異なる。一部の実施形態では、第1のコード化モード及び第2のコード化モードのそれぞれが、通常マージモード、merge mode with motion vector difference(MMVD)、及び三角形分割モード(TPM)のうちの1つであり得る。
[0132] ステップ812では、第1のコード化モードがコード化ブロックに適用される場合、空間的マージ候補の組を第1の構築順序に従って挿入する。例えば、MMVDでは、マージ候補がマージ候補リストからまず選択され、シグナリングされる動きベクトル差(MVD)情報によってリファインされ、2つのMMVD候補の何れがベース動きベクトルとして使用されるかを指定するためにマージ候補フラグがシグナリングされる。MVD情報は、距離インデックス及び方向インデックスによってシグナリングされ得る。距離インデックスは、動きの大きさの情報を指定し、ベースMVからの既定のオフセットを示す。距離インデックスと既定のオフセットとの関係を図6の例に示す。方向インデックスは、ベースMVに加えられるオフセットの符号を指定し、例えば、0は、正符号を示し、1は、負符号を示す。
[0133] ステップ814では、第2のコード化モードがコード化ブロックに適用される場合、空間的マージ候補の組を第2の構築順序に従って挿入する。例えば、TPMでは、コード化単位は、対角線分割又は逆対角線分割の少なくとも1つを使用して2つの三角形区画に均等に分けられる。CU内のそれぞれの三角形区画は、自らの動きを使用してインター予測され得る。それぞれの区画について単予測のみが認められる。即ち、各区画は、1つの動きベクトル及び1つの参照インデックスを有する。
[0134] ステップ816では、コード化ブロックが低遅延ピクチャの一部であるか、又は非低遅延ピクチャの一部であるかを決定する。
[0135] ステップ818では、コード化ブロックが低遅延ピクチャの一部である場合、空間的マージ候補の組を第3の構築順序に従って挿入する。一部の実施形態では、低遅延ピクチャに関して、空間的マージ候補の構築順序{B1,A1,B0,A0,B2}を、通常マージモード、TPMモード、及びMMVDモードに使用することができる。
[0136] ステップ820では、コード化ブロックが非低遅延ピクチャの一部である場合、空間的マージ候補の組を第4の構築順序に従って挿入する。第3の構築順序は、第4の構築順序と異なる。第3の構築順序及び第4の構築順序は、MMVDに使用される。一部の実施形態では、非低遅延ピクチャに関して、空間的マージ候補の構築順序{B1,A1,B0,A0,B2}を通常マージモード及びTPMモードに使用することができ、空間的マージ候補の構築順序{A1,B1,B0,A0,B2}をMMVDモードに使用することができる。
[0137] 本開示と合致して、上記の方法の1つ又は複数を組み合わせて使用するか又は別々に使用することができることを当業者であれば理解するであろう。例えば、空間的マージ候補の減少を採用する技法は、異なるインターモードに対して空間的マージ候補の別々の構築順序を使用する提案した方法と組み合わせて使用することができる。
[0138] 一部の実施形態では、命令を含む非一時的コンピュータ可読記憶媒体も提供され、命令は、上記の方法を実行するための装置(開示した符号器及び復号器等)によって実行され得る。一般的な非一時的媒体は、例えば、フロッピ(登録商標)ディスク、フレキシブルディスク、ハードディスク、ソリッドステートドライブ、磁気テープ若しくは他の任意の磁気データ記憶媒体、CD-ROM、他の任意の光学データ記憶媒体、孔のパターンを有する任意の物理媒体、RAM、PROM及びEPROM、フラッシュEPROM若しくは他の任意のフラッシュメモリ、NVRAM、キャッシュ、レジスタ、他の任意のメモリチップ若しくはカートリッジ及びそれらのもののネットワーク化されたバージョンを含む。装置は、1つ又は複数のプロセッサ(CPU)、入力/出力インタフェース、ネットワークインタフェース及び/又はメモリを含み得る。
[0139] 本明細書の「第1の」及び「第2の」等の関係語は、あるエンティティ又は操作を別のエンティティ又は操作と区別するために使用されるに過ぎず、それらのエンティティ又は操作間のいかなる実際の関係又は順序も必要としないか又は含意しないことに留意すべきである。更に、「含む」、「有する」、「含有する」及び「包含する」並びに他の同様の形式の用語は、意味の点で均等であることを意図し、これらの用語の何れか1つの後に続くアイテムがかかるアイテムの網羅的列挙であることを意図していないか、又は列挙するアイテムのみに限定されることを意図していない点で非限定的であることを意図する。
[0140] 本明細書で使用するとき、別段の定めがない限り、「又は」という語は、実行不可能な場合を除いて、あり得る全ての組み合わせを包含する。例えば、あるデータベースがA又はBを含み得ると述べた場合、別段の定めがない限り又は実行不可能でない限り、そのデータベースは、A若しくはB又はA及びBを含むことができる。第2の例として、あるデータベースがA、B又はCを含み得ると述べた場合、別段の定めがない限り又は実行不可能でない限り、そのデータベースは、A、若しくはB、若しくはC、又はA及びB、又はA及びC、又はB及びC、又はA、及びB、及びCを含むことができる。
[0141] 上記で説明した実施形態は、ハードウェア若しくはソフトウェア(プログラムコード)又はハードウェアとソフトウェアとの組み合わせによって実装できることが理解されるであろう。ソフトウェアによって実装される場合、ソフトウェアは、上記のコンピュータ可読媒体に記憶することができる。ソフトウェアは、プロセッサによって実行されるとき、開示した方法を実行することができる。本開示で説明した計算ユニット及び他の機能ユニットは、ハードウェア若しくはソフトウェア又はハードウェアとソフトウェアとの組み合わせによって実装することができる。上記のモジュール/ユニットの複数を1つのモジュール/ユニットとして組み合わせることができ、上記のモジュール/ユニットのそれぞれを複数のサブモジュール/サブユニットに更に分割できることも当業者であれば理解するであろう。
[0142] 実施形態は、以下の条項を使用して更に記載することができる:
1.映像処理方法であって、
コード化ブロックのマージ候補リストに空間的マージ候補の組を挿入することを含み、
空間的マージ候補の組は、上の隣接ブロック、左の隣接ブロック、上の隣接ブロック、左の隣接ブロック、及び左上の隣接ブロックの順に従って挿入される、映像処理方法。
2.コロケーテッドコード化単位からの時間的マージ候補、先入れ先出し(FIFO)テーブルからの履歴ベースの動きベクトル予測子(HMVP)、ペアワイズ平均候補、又はゼロ動きベクトルのうちの少なくとも1つをマージ候補リストに追加することを更に含む、条項1に記載の方法。
3.過去にコード化されたブロックの動き情報は、FIFOテーブル内に記憶され、及び現コード化単位のための動きベクトル予測子として使用される、条項2に記載の方法。
4.非サブブロックのインターコード化されたコード化単位に関連する動き情報は、新たなHMVP候補としてFIFOテーブルの最後のエントリに追加される、条項2及び3の何れか一項に記載の方法。
5.ペアワイズ平均候補は、マージ候補リスト内の候補の対を平均することによって生成され、及びマージ候補リストが一杯でないことに応じて、1つ又は複数のHMVPがマージ候補リストに追加された後、マージ候補リストに追加される、条項2に記載の方法。
6.ゼロ動きベクトルは、最大マージ候補数に達するまでマージ候補リストの末尾に挿入される、条項2に記載の方法。
7.映像処理方法であって、
空間的マージ候補の予め設定された数値限界に基づいてコード化ブロックのマージ候補リストに空間的マージ候補の組を挿入することを含み、
数値限界が2である場合、上の隣接ブロック、左の隣接ブロックの順序に基づいてマージ候補リスト内に空間的マージ候補の組が挿入され、及び
数値限界が3である場合、上の隣接ブロック、左の隣接ブロック、上の隣接ブロックの順序に基づいてマージ候補リスト内に空間的マージ候補の組が挿入される、映像処理方法。
8.表示順序に従って過去の参照ピクチャ及び未来の参照ピクチャを使用して現ピクチャがコード化されていることに応じて、空間的マージ候補の数は、第1の値に設定され、及び
表示順序に従って過去の参照ピクチャを使用して現ピクチャがコード化されていることに応じて、空間的マージ候補の数は、第1の値未満の第2の値に設定される、条項7に記載の方法。
9.マージ候補リスト内に挿入される空間的マージ候補の数をシグナリングすることを更に含む、条項7に記載の方法。
10.コロケーテッドコード化単位からの時間的マージ候補、FIFOテーブルからの履歴ベースの動きベクトル予測子(HMVP)、ペアワイズ平均候補、又はゼロ動きベクトルのうちの少なくとも1つをマージ候補リストに追加することを更に含む、条項7~9の何れか一項に記載の方法。
11.過去にコード化されたブロックの動き情報は、FIFOテーブル内に記憶され、及び現コード化単位のための動きベクトル予測子として使用される、条項10に記載の方法。
12.非サブブロックのインターコード化されたコード化単位に関連する動き情報は、新たなHMVP候補としてFIFOテーブルの最後のエントリに追加される、条項10及び11の何れか一項に記載の方法。
13.ペアワイズ平均候補は、マージ候補リスト内の候補の対を平均することによって生成され、及びマージ候補リストが一杯でないことに応じて、1つ又は複数のHMVPがマージ候補リストに追加された後、マージ候補リストに追加される、条項10に記載の方法。
14.ゼロ動きベクトルは、最大マージ候補数に達するまでマージ候補リストの末尾に挿入される、条項10に記載の方法。
15.映像処理方法であって、
コード化ブロックのマージ候補リストに空間的マージ候補の組を挿入することを含み、
第1のコード化モードがコード化ブロックに適用される場合、空間的マージ候補の組が第1の構築順序に従って挿入され、及び
第2のコード化モードがコード化ブロックに適用される場合、空間的マージ候補の組が第2の構築順序に従って挿入され、
第1の構築順序は、第2の構築順序と異なる、映像処理方法。
16.第1のコード化モード及び第2のコード化モードは、通常マージモード、merge mode with motion vector difference(MMVD)、及び三角形分割モード(TPM)から選択される2つの異なるモードである、条項15に記載の方法。
17.MMVDでは、マージ候補は、マージ候補リストからまず選択され、シグナリングされる動きベクトル差(MVD)情報によってリファインされ、マージ候補フラグは、2つのMMVD候補の何れがベース動きベクトルとして使用されるかを指定するためにシグナリングされる、条項16に記載の方法。
18.TPMでは、コード化単位は、対角線分割又は逆対角線分割の少なくとも1つを使用して2つの三角形区画に均等に分けられる、条項16に記載の方法。
19.コロケーテッドコード化単位からの時間的マージ候補、FIFOテーブルからの履歴ベースの動きベクトル予測子、ペアワイズ平均候補、又はゼロ動きベクトルのうちの少なくとも1つをマージ候補リストに追加することを更に含む、条項15及び16の何れか一項に記載の方法。
20.過去にコード化されたブロックの動き情報は、FIFOテーブル内に記憶され、及び現コード化単位のための動きベクトル予測子として使用される、条項19に記載の方法。
21.非サブブロックのインターコード化されたコード化単位に関連する動き情報は、新たなHMVP候補としてFIFOテーブルの最後のエントリに追加される、条項19及び20の何れか一項に記載の方法。
22.ペアワイズ平均候補は、マージ候補リスト内の候補の対を平均することによって生成され、及びマージ候補リストが一杯でないことに応じて、1つ又は複数のHMVPがマージ候補リストに追加された後、マージ候補リストに追加される、条項19に記載の方法。
23.ゼロ動きベクトルは、最大マージ候補数に達するまでマージ候補リストの末尾に挿入される、条項19に記載の方法。
24.映像処理方法であって、
コード化ブロックのマージ候補リストに空間的マージ候補の組を挿入することを含み、
コード化ブロックが低遅延ピクチャの一部である場合、空間的マージ候補の組が第1の構築順序に従って挿入され、及び
コード化ブロックが非低遅延ピクチャの一部である場合、空間的マージ候補の組が第2の構築順序に従って挿入され、
第1の構築順序は、第2の構築順序と異なる、映像処理方法。
25.第1の構築順序及び第2の構築順序は、merge mode with motion vector difference(MMVD)に使用される、条項24に記載の方法。
26.コロケーテッドコード化単位からの時間的マージ候補、FIFOテーブルからの履歴ベースの動きベクトル予測子(HMVP)、ペアワイズ平均候補、又はゼロ動きベクトルのうちの少なくとも1つをマージ候補リストに追加することを更に含む、条項24に記載の方法。
27.過去にコード化されたブロックの動き情報は、FIFOテーブル内に記憶され、及び現コード化単位のための動きベクトル予測子として使用される、条項26に記載の方法。
28.非サブブロックのインターコード化されたコード化単位に関連する動き情報は、新たなHMVP候補としてFIFOテーブルの最後のエントリに追加される、条項26及び27の何れか一項に記載の方法。
29.ペアワイズ平均候補は、マージ候補リスト内の候補の対を平均することによって生成され、及びマージ候補リストが一杯でないことに応じて、1つ又は複数のHMVPがマージ候補リストに追加された後、マージ候補リストに追加される、条項26に記載の方法。
30.ゼロ動きベクトルは、最大マージ候補数に達するまでマージ候補リストの末尾に挿入される、条項26に記載の方法。
31.映像処理機器であって、
命令の組を記憶するメモリと、
1つ又は複数のプロセッサとを含み、1つ又は複数のプロセッサは、
コード化ブロックのマージ候補リストに空間的マージ候補の組を挿入することを機器に行わせるように、命令の組を実行するように構成され、
空間的マージ候補の組は、上の隣接ブロック、左の隣接ブロック、上の隣接ブロック、左の隣接ブロック、及び左上の隣接ブロックの順に従って挿入される、映像処理機器。
32.1つ又は複数のプロセッサは、コロケーテッドコード化単位からの時間的マージ候補、先入れ先出し(FIFO)テーブルからの履歴ベースの動きベクトル予測子(HMVP)、ペアワイズ平均候補、又はゼロ動きベクトルのうちの少なくとも1つをマージ候補リストに追加することを機器に更に行わせるように、命令の組を実行するように構成される、条項31に記載の機器。
33.過去にコード化されたブロックの動き情報は、FIFOテーブル内に記憶され、及び現コード化単位のための動きベクトル予測子として使用される、条項32に記載の機器。
34.非サブブロックのインターコード化されたコード化単位に関連する動き情報は、新たなHMVP候補としてFIFOテーブルの最後のエントリに追加される、条項32及び33の何れか一項に記載の機器。
35.ペアワイズ平均候補は、マージ候補リスト内の候補の対を平均することによって生成され、及びマージ候補リストが一杯でないことに応じて、1つ又は複数のHMVPがマージ候補リストに追加された後、マージ候補リストに追加される、条項32に記載の機器。
36.ゼロ動きベクトルは、最大マージ候補数に達するまでマージ候補リストの末尾に挿入される、条項32に記載の機器。
37.映像処理機器であって、
命令の組を記憶するメモリと、
1つ又は複数のプロセッサとを含み、1つ又は複数のプロセッサは、
空間的マージ候補の予め設定された数値限界に基づいてコード化ブロックのマージ候補リストに空間的マージ候補の組を挿入することを機器に行わせるように、命令の組を実行するように構成され、
数値限界が2である場合、上の隣接ブロック、左の隣接ブロックの順序に基づいてマージ候補リスト内に空間的マージ候補の組が挿入され、及び
数値限界が3である場合、上の隣接ブロック、左の隣接ブロック、上の隣接ブロックの順序に基づいてマージ候補リスト内に空間的マージ候補の組が挿入される、映像処理機器。
38.表示順序に従って過去の参照ピクチャ及び未来の参照ピクチャを使用して現ピクチャがコード化されていることに応じて、空間的マージ候補の数は、第1の値に設定され、及び
表示順序に従って過去の参照ピクチャを使用して現ピクチャがコード化されていることに応じて、空間的マージ候補の数は、第1の値未満の第2の値に設定される、条項37に記載の機器。
39.1つ又は複数のプロセッサは、
マージ候補リスト内に挿入される空間的マージ候補の数をシグナリングすることを機器に更に行わせるように、命令の組を実行するように構成される、条項37に記載の機器。
40.1つ又は複数のプロセッサは、コロケーテッドコード化単位からの時間的マージ候補、FIFOテーブルからの履歴ベースの動きベクトル予測子(HMVP)、ペアワイズ平均候補、又はゼロ動きベクトルのうちの少なくとも1つをマージ候補リストに追加することを機器に更に行わせるように、命令の組を実行するように構成される、条項37~39の何れか一項に記載の機器。
41.過去にコード化されたブロックの動き情報は、FIFOテーブル内に記憶され、及び現コード化単位のための動きベクトル予測子として使用される、条項40に記載の機器。
42.非サブブロックのインターコード化されたコード化単位に関連する動き情報は、新たなHMVP候補としてFIFOテーブルの最後のエントリに追加される、条項40及び41の何れか一項に記載の機器。
43.ペアワイズ平均候補は、マージ候補リスト内の候補の対を平均することによって生成され、及びマージ候補リストが一杯でないことに応じて、1つ又は複数のHMVPがマージ候補リストに追加された後、マージ候補リストに追加される、条項40に記載の機器。
44.ゼロ動きベクトルは、最大マージ候補数に達するまでマージ候補リストの末尾に挿入される、条項40に記載の機器。
45.映像処理機器であって、
命令の組を記憶するメモリと、
1つ又は複数のプロセッサとを含み、1つ又は複数のプロセッサは、
コード化ブロックのマージ候補リストに空間的マージ候補の組を挿入することを機器に行わせるように、命令の組を実行するように構成され、
第1のコード化モードがコード化ブロックに適用される場合、空間的マージ候補の組が第1の構築順序に従って挿入され、及び
第2のコード化モードがコード化ブロックに適用される場合、空間的マージ候補の組が第2の構築順序に従って挿入され、
第1の構築順序は、第2の構築順序と異なる、映像処理機器。
46.第1のコード化モード及び第2のコード化モードは、通常マージモード、merge mode with motion vector difference(MMVD)及び三角形分割モード(TPM)から選択される2つの異なるモードである、条項45に記載の機器。
47.MMVDでは、マージ候補は、マージ候補リストからまず選択され、シグナリングされる動きベクトル差(MVD)情報によってリファインされ、マージ候補フラグは、2つのMMVD候補の何れがベース動きベクトルとして使用されるかを指定するためにシグナリングされる、条項46に記載の機器。
48.TPMでは、コード化単位は、対角線分割又は逆対角線分割の少なくとも1つを使用して2つの三角形区画に均等に分けられる、条項45及び46の何れか一項に記載の機器。
49.コロケーテッドコード化単位からの時間的マージ候補、FIFOテーブルからの履歴ベースの動きベクトル予測子、ペアワイズ平均候補、又はゼロ動きベクトルのうちの少なくとも1つをマージ候補リストに追加する、条項46に記載の機器。
50.過去にコード化されたブロックの動き情報は、FIFOテーブル内に記憶され、及び現コード化単位のための動きベクトル予測子として使用される、条項49に記載の機器。
51.非サブブロックのインターコード化されたコード化単位に関連する動き情報は、新たなHMVP候補としてFIFOテーブルの最後のエントリに追加される、条項49及び50の何れか一項に記載の機器。
52.ペアワイズ平均候補は、マージ候補リスト内の候補の対を平均することによって生成され、及びマージ候補リストが一杯でないことに応じて、1つ又は複数のHMVPがマージ候補リストに追加された後、マージ候補リストに追加される、条項49に記載の機器。
53.ゼロ動きベクトルは、最大マージ候補数に達するまでマージ候補リストの末尾に挿入される、条項49に記載の機器。
54.映像処理機器であって、
命令の組を記憶するメモリと、
1つ又は複数のプロセッサとを含み、1つ又は複数のプロセッサは、
コード化ブロックのマージ候補リストに空間的マージ候補の組を挿入することを機器に行わせるように、命令の組を実行するように構成され、
コード化ブロックが低遅延ピクチャの一部である場合、空間的マージ候補の組が第1の構築順序に従って挿入され、及び
コード化ブロックが非低遅延ピクチャの一部である場合、空間的マージ候補の組が第2の構築順序に従って挿入され、
第1の構築順序は、第2の構築順序と異なる、映像処理機器。
55.第1の構築順序及び第2の構築順序は、merge mode with motion vector difference(MMVD)に使用される、条項54に記載の機器。
56.1つ又は複数のプロセッサは、コロケーテッドコード化単位からの時間的マージ候補、FIFOテーブルからの履歴ベースの動きベクトル予測子(HMVP)、ペアワイズ平均候補、及びゼロ動きベクトルのうちの少なくとも1つをマージ候補リストに追加することを機器に更に行わせるように、命令の組を実行するように構成される、条項54に記載の機器。
57.過去にコード化されたブロックの動き情報は、FIFOテーブル内に記憶され、及び現コード化単位のための動きベクトル予測子として使用される、条項56に記載の機器。
58.非サブブロックのインターコード化されたコード化単位に関連する動き情報は、新たなHMVP候補としてFIFOテーブルの最後のエントリに追加される、条項56及び57の何れか一項に記載の機器。
59.ペアワイズ平均候補は、マージ候補リスト内の候補の対を平均することによって生成され、及びマージ候補リストが一杯でないことに応じて、1つ又は複数のHMVPがマージ候補リストに追加された後、マージ候補リストに追加される、条項56に記載の機器。
60.ゼロ動きベクトルは、最大マージ候補数に達するまでマージ候補リストの末尾に挿入される、条項56に記載の機器。
61.命令の組を記憶する非一時的コンピュータ可読媒体であって、命令の組は、映像処理方法をコンピュータに行わせるように、コンピュータの少なくとも1つのプロセッサによって実行可能であり、方法は、
コード化ブロックのマージ候補リストに空間的マージ候補の組を挿入することを含み、
空間的マージ候補の組は、上の隣接ブロック、左の隣接ブロック、上の隣接ブロック、左の隣接ブロック、及び左上の隣接ブロックの順に従って挿入される、非一時的コンピュータ可読媒体。
62.命令の組は、コロケーテッドコード化単位からの時間的マージ候補、先入れ先出し(FIFO)テーブルからの履歴ベースの動きベクトル予測子(HMVP)、ペアワイズ平均候補、又はゼロ動きベクトルのうちの少なくとも1つをマージ候補リストに追加することをコンピュータに更に行わせるように、コンピュータによって実行可能である、条項61に記載の非一時的コンピュータ可読媒体。
63.過去にコード化されたブロックの動き情報は、FIFOテーブル内に記憶され、及び現コード化単位のための動きベクトル予測子として使用される、条項62に記載の非一時的コンピュータ可読媒体。
64.非サブブロックのインターコード化されたコード化単位に関連する動き情報は、新たなHMVP候補としてFIFOテーブルの最後のエントリに追加される、条項62及び63の何れか一項に記載の非一時的コンピュータ可読媒体。
65.ペアワイズ平均候補は、マージ候補リスト内の候補の対を平均することによって生成され、及びマージ候補リストが一杯でないことに応じて、1つ又は複数のHMVPがマージ候補リストに追加された後、マージ候補リストに追加される、条項62に記載の非一時的コンピュータ可読媒体。
66.ゼロ動きベクトルは、最大マージ候補数に達するまでマージ候補リストの末尾に挿入される、条項62に記載の非一時的コンピュータ可読媒体。
67.命令の組を記憶する非一時的コンピュータ可読媒体であって、命令の組は、映像処理方法をコンピュータに行わせるように、コンピュータの少なくとも1つのプロセッサによって実行可能であり、方法は、
空間的マージ候補の予め設定された数値限界に基づいてコード化ブロックのマージ候補リストに空間的マージ候補の組を挿入することを含み、
数値限界が2である場合、上の隣接ブロック、左の隣接ブロックの順序に基づいてマージ候補リスト内に空間的マージ候補の組が挿入され、及び
数値限界が3である場合、上の隣接ブロック、左の隣接ブロック、上の隣接ブロックの順序に基づいてマージ候補リスト内に空間的マージ候補の組が挿入される、非一時的コンピュータ可読媒体。
68.表示順序に従って過去の参照ピクチャ及び未来の参照ピクチャを使用して現ピクチャがコード化されていることに応じて、空間的マージ候補の数は、第1の値に設定され、及び
表示順序に従って過去の参照ピクチャを使用して現ピクチャがコード化されていることに応じて、空間的マージ候補の数は、第1の値未満の第2の値に設定される、条項67に記載の非一時的コンピュータ可読媒体。
69.命令の組は、マージ候補リスト内に挿入される空間的マージ候補の数をシグナリングすることをコンピュータに更に行わせるように、コンピュータによって実行可能である、条項67に記載の非一時的コンピュータ可読媒体。
70.少なくとも1つのプロセッサは、コロケーテッドコード化単位からの時間的マージ候補、FIFOテーブルからの履歴ベースの動きベクトル予測子(HMVP)、ペアワイズ平均候補、及びゼロ動きベクトルのうちの少なくとも1つをマージ候補リストに追加することをコンピュータに更に行わせるように、命令の組を実行するように構成される、条項67~69の何れか一項に記載の非一時的コンピュータ可読媒体。
71.過去にコード化されたブロックの動き情報は、FIFOテーブル内に記憶され、及び現コード化単位のための動きベクトル予測子として使用される、条項70に記載の非一時的コンピュータ可読媒体。
72.非サブブロックのインターコード化されたコード化単位に関連する動き情報は、新たなHMVP候補としてFIFOテーブルの最後のエントリに追加される、条項70及び71の何れか一項に記載の非一時的コンピュータ可読媒体。
73.ペアワイズ平均候補は、マージ候補リスト内の候補の対を平均することによって生成され、及びマージ候補リストが一杯でないことに応じて、1つ又は複数のHMVPがマージ候補リストに追加された後、マージ候補リストに追加される、条項70に記載の非一時的コンピュータ可読媒体。
74.ゼロ動きベクトルは、最大マージ候補数に達するまでマージ候補リストの末尾に挿入される、条項70に記載の非一時的コンピュータ可読媒体。
75.命令の組を記憶する非一時的コンピュータ可読媒体であって、命令の組は、映像処理方法をコンピュータに行わせるように、コンピュータの少なくとも1つのプロセッサによって実行可能であり、方法は、
コード化ブロックのマージ候補リストに空間的マージ候補の組を挿入することを含み、
第1のコード化モードがコード化ブロックに適用される場合、空間的マージ候補の組が第1の構築順序に従って挿入され、及び
第2のコード化モードがコード化ブロックに適用される場合、空間的マージ候補の組が第2の構築順序に従って挿入され、
第1の構築順序は、第2の構築順序と異なる、非一時的コンピュータ可読媒体。
76.第1のコード化モード及び第2のコード化モードは、通常マージモード、merge mode with motion vector difference(MMVD)及び三角形分割モード(TPM)から選択される2つの異なるモードである、条項75に記載の非一時的コンピュータ可読媒体。
77.MMVDでは、マージ候補は、マージ候補リストからまず選択され、シグナリングされる動きベクトル差(MVD)情報によってリファインされ、マージ候補フラグは、2つのMMVD候補の何れがベース動きベクトルとして使用されるかを指定するためにシグナリングされる、条項76に記載の非一時的コンピュータ可読媒体。
78.TPMでは、コード化単位は、対角線分割又は逆対角線分割の少なくとも1つを使用して2つの三角形区画に均等に分けられる、条項76に記載の非一時的コンピュータ可読媒体。
79.コロケーテッドコード化単位からの時間的マージ候補、FIFOテーブルからの履歴ベースの動きベクトル予測子、ペアワイズ平均候補、及びゼロ動きベクトルのうちの少なくとも1つをマージ候補リストに追加する、条項75及び76の何れか一項に記載の非一時的コンピュータ可読媒体。
80.過去にコード化されたブロックの動き情報は、FIFOテーブル内に記憶され、及び現コード化単位のための動きベクトル予測子として使用される、条項79に記載の非一時的コンピュータ可読媒体。
81.非サブブロックのインターコード化されたコード化単位に関連する動き情報は、新たなHMVP候補としてFIFOテーブルの最後のエントリに追加される、条項79及び80の何れか一項に記載の非一時的コンピュータ可読媒体。
82.ペアワイズ平均候補は、マージ候補リスト内の候補の対を平均することによって生成され、及びマージ候補リストが一杯でないことに応じて、1つ又は複数のHMVPがマージ候補リストに追加された後、マージ候補リストに追加される、条項79に記載の非一時的コンピュータ可読媒体。
83.ゼロ動きベクトルは、最大マージ候補数に達するまでマージ候補リストの末尾に挿入される、条項79に記載の非一時的コンピュータ可読媒体。
84.命令の組を記憶する非一時的コンピュータ可読媒体であって、命令の組は、映像処理方法をコンピュータに行わせるように、コンピュータの少なくとも1つのプロセッサによって実行可能であり、方法は、
コード化ブロックのマージ候補リストに空間的マージ候補の組を挿入することを含み、
コード化ブロックが低遅延ピクチャの一部である場合、空間的マージ候補の組が第1の構築順序に従って挿入され、及び
コード化ブロックが非低遅延ピクチャの一部である場合、空間的マージ候補の組が第2の構築順序に従って挿入され、
第1の構築順序は、第2の構築順序と異なる、非一時的コンピュータ可読媒体。
85.第1の構築順序及び第2の構築順序は、merge mode with motion vector difference(MMVD)に使用される、条項84に記載の非一時的コンピュータ可読媒体。
86.命令の組は、コロケーテッドコード化単位からの時間的マージ候補、FIFOテーブルからの履歴ベースの動きベクトル予測子(HMVP)、ペアワイズ平均候補、及びゼロ動きベクトルのうちの少なくとも1つをマージ候補リストに追加することをコンピュータに更に行わせるために、コンピュータによって実行可能である、条項84に記載の非一時的コンピュータ可読媒体。
87.過去にコード化されたブロックの動き情報は、FIFOテーブル内に記憶され、及び現コード化単位のための動きベクトル予測子として使用される、条項86に記載の非一時的コンピュータ可読媒体。
88.非サブブロックのインターコード化されたコード化単位に関連する動き情報は、新たなHMVP候補としてFIFOテーブルの最後のエントリに追加される、条項86及び87の何れか一項に記載の非一時的コンピュータ可読媒体。
89.ペアワイズ平均候補は、マージ候補リスト内の候補の対を平均することによって生成され、及びマージ候補リストが一杯でないことに応じて、1つ又は複数のHMVPがマージ候補リストに追加された後、マージ候補リストに追加される、条項86に記載の非一時的コンピュータ可読媒体。
90.ゼロ動きベクトルは、最大マージ候補数に達するまでマージ候補リストの末尾に挿入される、条項86に記載の非一時的コンピュータ可読媒体。
[0143] 上記の本明細書では、実装形態ごとに変わり得る多数の具体的な詳細に関して実施形態を説明してきた。記載した実施形態に対する一定の適応形態及び修正形態がなされ得る。本明細書を検討し、本明細書で開示した本発明を実践することで他の実施形態が当業者に明らかになり得る。本明細書及び例は、専ら例示として検討され、本開示の真の範囲及び趣旨は、添付の特許請求の範囲によって示されることを意図する。図中に示すステップの順序は、例示目的に過ぎず、特定のステップの順序に限定されることを意図しない。そのため、それらのステップは、同じ方法を実装しながら異なる順序で実行できることを当業者であれば理解することができる。
[0144] 図面及び本明細書で例示的実施形態を開示してきた。しかし、それらの実施形態に対する多くの改変形態及び修正形態がなされ得る。従って、特定の用語を使用したが、それらの用語は、限定目的ではなく、全般的及び説明的な意味で使用されたものに過ぎない。

Claims (18)

  1. 映像処理方法であって、
    コード化ブロックのマージ候補リストに空間的マージ候補の組を挿入することを含み、
    前記空間的マージ候補の組は、上の隣接ブロック、左の隣接ブロック、上の隣接ブロック、左の隣接ブロック及び左上の隣接ブロックの順に従って挿入される、映像処理方法。
  2. コロケーテッドコード化単位からの時間的マージ候補、先入れ先出し(FIFO)テーブルからの履歴ベースの動きベクトル予測子(HMVP)、ペアワイズ平均候補又はゼロ動きベクトルのうちの少なくとも1つを前記マージ候補リストに追加することを更に含む、請求項1に記載の方法。
  3. 過去にコード化されたブロックの動き情報は、前記FIFOテーブル内に記憶され、及び現コード化単位のための前記動きベクトル予測子として使用される、請求項2に記載の方法。
  4. 非サブブロックのインターコード化されたコード化単位に関連する動き情報は、新たなHMVP候補として前記FIFOテーブルの最後のエントリに追加される、請求項3に記載の方法。
  5. 前記ペアワイズ平均候補は、前記マージ候補リスト内の候補の対を平均することによって生成され、及び前記マージ候補リストが一杯でないことに応じて、1つ又は複数のHMVPが前記マージ候補リストに追加された後、前記マージ候補リストに追加される、請求項2に記載の方法。
  6. 前記ゼロ動きベクトルは、最大マージ候補数に達するまで前記マージ候補リストの末尾に挿入される、請求項2に記載の方法。
  7. 映像処理機器であって、
    命令の組を記憶するメモリと、
    1つ又は複数のプロセッサとを含み、前記1つ又は複数のプロセッサは、
    コード化ブロックのマージ候補リストに空間的マージ候補の組を挿入することを前記機器に行わせるように、前記命令の組を実行するように構成され、
    前記空間的マージ候補の組は、上の隣接ブロック、左の隣接ブロック、上の隣接ブロック、左の隣接ブロック及び左上の隣接ブロックの順に従って挿入される、映像処理機器。
  8. 前記1つ又は複数のプロセッサは、
    コロケーテッドコード化単位からの時間的マージ候補、先入れ先出し(FIFO)テーブルからの履歴ベースの動きベクトル予測子(HMVP)、ペアワイズ平均候補又はゼロ動きベクトルのうちの少なくとも1つを前記マージ候補リストに追加すること
    を前記機器に更に行わせるように、前記命令の組を実行するように構成される、請求項7に記載の機器。
  9. 過去にコード化されたブロックの動き情報は、前記FIFOテーブル内に記憶され、及び現コード化単位のための前記動きベクトル予測子として使用される、請求項8に記載の機器。
  10. 非サブブロックのインターコード化されたコード化単位に関連する動き情報は、新たなHMVP候補として前記FIFOテーブルの最後のエントリに追加される、請求項9に記載の機器。
  11. 前記ペアワイズ平均候補は、前記マージ候補リスト内の候補の対を平均することによって生成され、及び前記マージ候補リストが一杯でないことに応じて、1つ又は複数のHMVPが前記マージ候補リストに追加された後、前記マージ候補リストに追加される、請求項8に記載の機器。
  12. 前記ゼロ動きベクトルは、最大マージ候補数に達するまで前記マージ候補リストの末尾に挿入される、請求項8に記載の機器。
  13. 命令の組を記憶する非一時的コンピュータ可読媒体であって、前記命令の組は、映像処理方法をコンピュータに行わせるように、前記コンピュータの少なくとも1つのプロセッサによって実行可能であり、前記方法は、
    コード化ブロックのマージ候補リストに空間的マージ候補の組を挿入することを含み、
    前記空間的マージ候補の組は、上の隣接ブロック、左の隣接ブロック、上の隣接ブロック、左の隣接ブロック及び左上の隣接ブロックの順に従って挿入される、非一時的コンピュータ可読媒体。
  14. 前記命令の組は、
    コロケーテッドコード化単位からの時間的マージ候補、先入れ先出し(FIFO)テーブルからの履歴ベースの動きベクトル予測子(HMVP)、ペアワイズ平均候補又はゼロ動きベクトルの少なくとも1つを前記マージ候補リストに追加すること
    を前記コンピュータに更に行わせるように、前記コンピュータによって実行可能である、請求項13に記載の非一時的コンピュータ可読媒体。
  15. 過去にコード化されたブロックの動き情報は、前記FIFOテーブル内に記憶され、及び現コード化単位のための前記動きベクトル予測子として使用される、請求項14に記載の非一時的コンピュータ可読媒体。
  16. 非サブブロックのインターコード化されたコード化単位に関連する動き情報は、新たなHMVP候補として前記FIFOテーブルの最後のエントリに追加される、請求項15に記載の非一時的コンピュータ可読媒体。
  17. 前記ペアワイズ平均候補は、前記マージ候補リスト内の候補の対を平均することによって生成され、及び前記マージ候補リストが一杯でないことに応じて、1つ又は複数のHMVPが前記マージ候補リストに追加された後、前記マージ候補リストに追加される、請求項14に記載の非一時的コンピュータ可読媒体。
  18. 前記ゼロ動きベクトルは、最大マージ候補数に達するまで前記マージ候補リストの末尾に挿入される、請求項14に記載の非一時的コンピュータ可読媒体。
JP2022514661A 2019-09-19 2020-08-18 マージ候補リストを構築するための方法 Pending JP2022548351A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962902790P 2019-09-19 2019-09-19
US62/902,790 2019-09-19
PCT/US2020/046799 WO2021055126A1 (en) 2019-09-19 2020-08-18 Methods for constructing a merge candidate list

Publications (2)

Publication Number Publication Date
JP2022548351A true JP2022548351A (ja) 2022-11-18
JPWO2021055126A5 JPWO2021055126A5 (ja) 2023-04-27

Family

ID=74882289

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022514661A Pending JP2022548351A (ja) 2019-09-19 2020-08-18 マージ候補リストを構築するための方法

Country Status (6)

Country Link
US (2) US11523104B2 (ja)
EP (1) EP4032297A4 (ja)
JP (1) JP2022548351A (ja)
KR (1) KR20220063248A (ja)
CN (1) CN114762332A (ja)
WO (1) WO2021055126A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230079743A1 (en) * 2021-09-16 2023-03-16 Qualcomm Incorporated Multiple inter predictors with decoder side motion vector derivation for video coding
GB2611323A (en) * 2021-09-29 2023-04-05 Canon Kk Video coding and decoding

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107360427B (zh) * 2010-10-08 2020-09-01 Ge视频压缩有限责任公司 编码器和编码方法与解码器和解码方法
CN107295347B (zh) 2011-08-29 2020-06-26 苗太平洋控股有限公司 用于解码合并模式下的运动信息的装置
KR20130050406A (ko) 2011-11-07 2013-05-16 오수미 머지 모드에서의 움직임 정보 생성 방법
KR101347062B1 (ko) * 2012-06-27 2014-01-10 숭실대학교산학협력단 움직임 벡터의 예측을 위한 탐색영역 설정 장치 및 방법
KR102378459B1 (ko) * 2014-06-30 2022-03-24 한국전자통신연구원 움직임 병합 모드에서 시점 합성 예측 후보의 중복성 제거 장치 및 방법
US20170310988A1 (en) * 2014-12-09 2017-10-26 Mediatek Inc. Method of Motion Vector Predictor or Merge Candidate Derivation in Video Coding
US10511835B2 (en) * 2015-09-02 2019-12-17 Mediatek Inc. Method and apparatus of decoder side motion derivation for video coding
US10944963B2 (en) * 2016-05-25 2021-03-09 Arris Enterprises Llc Coding weighted angular prediction for intra coding
US20180242024A1 (en) * 2017-02-21 2018-08-23 Mediatek Inc. Methods and Apparatuses of Candidate Set Determination for Quad-tree Plus Binary-tree Splitting Blocks
CN116866586A (zh) * 2017-05-17 2023-10-10 株式会社Kt 对图像解码的方法以及存储压缩视频数据的装置
US10602180B2 (en) * 2017-06-13 2020-03-24 Qualcomm Incorporated Motion vector prediction
KR20200044967A (ko) * 2017-09-18 2020-04-29 인텔렉추얼디스커버리 주식회사 블록 분할에 따른 병합 후보 리스트를 사용하는 비디오 코딩 방법 및 장치
KR102306562B1 (ko) * 2017-11-27 2021-09-30 엘지전자 주식회사 영상 코딩 시스템에서 인터 예측에 따른 영상 디코딩 방법 및 장치
US10812810B2 (en) * 2018-02-06 2020-10-20 Tencent America LLC Method and apparatus for video coding in merge mode
WO2019183901A1 (en) * 2018-03-29 2019-10-03 Huawei Technologies Co., Ltd. Picture encoding and decoding, picture encoder, and picture decoder
US10587885B2 (en) * 2018-06-04 2020-03-10 Tencent America LLC Method and apparatus for merge mode with additional middle candidates in video coding
US10491902B1 (en) * 2018-07-16 2019-11-26 Tencent America LLC Method and apparatus for history-based motion vector prediction
US11122288B2 (en) * 2018-12-06 2021-09-14 Qualcomm Incorporated Spatio-temporal motion vector prediction patterns for video coding
KR20200083357A (ko) * 2018-12-28 2020-07-08 인텔렉추얼디스커버리 주식회사 화면 간 예측 부호화 및 복호화 방법 및 장치
WO2020141913A1 (ko) * 2019-01-01 2020-07-09 엘지전자 주식회사 인터 예측을 기반으로 비디오 신호를 처리하기 위한 방법 및 장치
US11115653B2 (en) * 2019-02-22 2021-09-07 Mediatek Inc. Intra block copy merge list simplification
CN112425160B (zh) * 2019-02-26 2023-05-12 苹果公司 用于对视频信号进行编码/解码的方法及其设备
US11909960B2 (en) * 2019-03-07 2024-02-20 Lg Electronics Inc. Method and apparatus for processing video signal
US12010305B2 (en) * 2019-03-11 2024-06-11 Apple Inc. Method for encoding/decoding image signal, and device therefor
CN114303375A (zh) * 2019-06-24 2022-04-08 Lg电子株式会社 使用双向预测的视频解码方法和用于该方法的装置
US11601666B2 (en) * 2019-06-25 2023-03-07 Qualcomm Incorporated Derivation of temporal motion vector prediction candidates in video coding
US20210392337A1 (en) * 2020-06-10 2021-12-16 Kt Corporation Method and apparatus for encoding/decoding a video signal based on weighted prediction, and a recording medium storing a bitstream

Also Published As

Publication number Publication date
US20210092357A1 (en) 2021-03-25
EP4032297A4 (en) 2022-11-23
US12010297B2 (en) 2024-06-11
EP4032297A1 (en) 2022-07-27
CN114762332A (zh) 2022-07-15
US11523104B2 (en) 2022-12-06
KR20220063248A (ko) 2022-05-17
WO2021055126A1 (en) 2021-03-25
US20230300321A1 (en) 2023-09-21

Similar Documents

Publication Publication Date Title
US11838541B2 (en) Matrix weighted intra prediction of video signals
JP2022548825A (ja) 映像処理における量子化パラメータのシグナリング
US12047578B2 (en) Lossless coding of video data
US12010297B2 (en) Methods for constructing a merge candidate list
US20230362384A1 (en) Methods and systems for cross-component sample adaptive offset
JP2023514136A (ja) クロマ信号を処理するための方法
JP2023509838A (ja) サブピクチャ分割情報をシグナリングするための方法及び機器
US11638019B2 (en) Methods and systems for prediction from multiple cross-components
CN114788284B (zh) 用于在调色板模式下对视频数据进行编码的方法和装置
KR20220057620A (ko) 변환-스킵 모드에서 비디오 데이터를 코딩하기 위한 방법 및 장치
WO2023131208A1 (en) Fusion of video prediction modes
US20210385485A1 (en) Angular weighted prediction for inter prediction
CN115699744B (zh) 双向预测校正***和方法
US11412250B2 (en) Method and apparatus for deriving temporal motion
US20210266548A1 (en) Signaling of maximum transform size and residual coding method
US11711528B2 (en) Systems and methods for liner model derivation
US11606577B2 (en) Method for processing adaptive color transform and low-frequency non-separable transform in video coding
US11451801B2 (en) Methods for coding video data in palette mode

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220509

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230418

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230418

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20240430

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240510

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240621