JP2022530172A - 適応解像度ビデオ符号化のためのインター符号化 - Google Patents

適応解像度ビデオ符号化のためのインター符号化 Download PDF

Info

Publication number
JP2022530172A
JP2022530172A JP2020561757A JP2020561757A JP2022530172A JP 2022530172 A JP2022530172 A JP 2022530172A JP 2020561757 A JP2020561757 A JP 2020561757A JP 2020561757 A JP2020561757 A JP 2020561757A JP 2022530172 A JP2022530172 A JP 2022530172A
Authority
JP
Japan
Prior art keywords
frame
resolution
current frame
motion
candidate list
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020561757A
Other languages
English (en)
Inventor
ツイシャン・チャン
ユチェン・サン
リン・ジュ
ジアン・ルー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Publication of JP2022530172A publication Critical patent/JP2022530172A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

ビットストリームの現在のフレームを取得することと、参照フレームバッファから1つ以上の参照ピクチャを取得することと、現在のフレームの解像度とは異なる解像度を有する取得された参照ピクチャをアップサンプリングまたはダウンサンプリングすることと、1つ以上の参照ピクチャのインター予測因子をサイズ変更することと、1つ以上の参照ピクチャと現在のフレームの1つ以上のブロックの動き情報とに基づいて、現在のフレームから再構築フレームを生成することであって、動き情報が少なくとも1つのインター予測因子を含む、こととによって、動き予測符号化フォーマットでの解像度適応型ビデオ符号化方法を実装するためのシステムおよび方法が提供され、これにより、これらの節約を相殺するかまたは損なうであろう追加データの伝送を必要とせずに、ビデオ符号化および配信におけるネットワーク伝送コストの大幅な削減を達成する。

Description

本明細書は、適応解像度ビデオ符号化のためのインター符号化に関する。
従来のビデオ符号化形式、例えば、H.264/AVC(Advanced Video Coding)およびH.265/HEVC(High Efficiency Video Coding)規格では、シーケンス内のビデオフレームは、それらのサイズおよび解像度を有し、ヘッダー内のシーケンスレベルで記録する。このため、フレーム解像度を変更するために、イントラ符号化フレームから新たなビデオシーケンスを生成しなければならず、これは、インター符号化フレームよりも伝送にかなり大きな帯域幅コストを伴う。したがって、ネットワーク帯域幅が低くなる、減少される、または調整されるときに、ダウンサンプリングされた低解像度ビデオをネットワーク上で適応的に伝送することが望ましいが、適応的にダウンサンプリングするための帯域幅のコストが帯域幅の利益を相殺するため、従来のビデオ符号化形式を使用しながら帯域幅の節約を実現することは困難である。
インター符号化フレームを伝送しながら解像度の変化をサポートする研究が行われている。AOMが開発したAV1コーデックの実装では、switch_frameと呼ばれる新しいフレームタイプが提供され、これは、以前のフレームとは異なる解像度で伝送することができる。しかしながら、switch_frameの動きベクトル符号化は、以前のフレームの動きベクトルを参照することができないため、switch_frameの使用は制限を受ける。このような参照は、従来、帯域幅コストを削減する別の方法を提供するため、switch_frameの使用は、依然として帯域幅の利益を相殺するより大きな帯域幅の消費を維持する。
さらに、既存の動き符号化ツールは、並進動きモデルのみに基づいて動き補正予測(MCP)を実施する。
次世代ビデオコーデック仕様VVC/H.266の開発では、いくつかの新しい動き予測符号化ツールが提供されており、以前のフレームを参照する動きベクトル符号化、ならびに並進動き以外の不規則なタイプの動きに基づくMCPをさらにサポートしている。これらの新しい符号化ツールに関してビットストリームで解像度の変更を実装するためには、新しい技術が必要である。
本開示の課題を解決するための手段は、特許請求の範囲に記載の構成を少なくとも含む。
詳細な説明は、添付の図面を参照して述べられる。図面では、参照番号の左端の数字(複数可)は、参照番号が最初に現れる図面を同定する。異なる図面における同じ参照番号の使用は、類似または同一の物品または特徴を示す。
4パラメータアフィン動きモデルおよび6パラメータアフィン動きモデルの複数のCMPVの構成をそれぞれ示す図である。 4パラメータアフィン動きモデルおよび6パラメータアフィン動きモデルの複数のCMPVの構成をそれぞれ示す図である。 ブロックのルマ成分の動き情報を導出する図を示す図である。 アフィン動き予測符号化によるフレームのCUに対する動き候補の例示的な選択を示す図である。 継承アフィンマージ候補を導出する例を示す図である。 構築アフィンマージ候補を導出する例を示す図である。 テンプレートマッチングに基づくDMVR双予測プロセスの図を示す図である。 ビデオ符号化プロセスの例示的なブロック図を示す図である。 解像度適応型ビデオ符号化を実装するビデオ符号化方法の例示的なフローチャートを示す図である。 解像度適応型ビデオ符号化を実装するビデオ符号化方法の例示的なフローチャートを示す図である。 解像度適応型ビデオ符号化を実装するビデオ符号化方法の例示的なフローチャートを示す図である。 解像度適応型ビデオ符号化を実装するビデオ符号化方法のさらなる例示的なフローチャートを示す図である。 解像度適応型ビデオ符号化を実装するビデオ符号化方法のさらなる例示的なフローチャートを示す図である。 解像度適応型ビデオ符号化を実装するビデオ符号化方法のさらなる例示的なフローチャートを示す図である。 動き予測符号化形式での解像度適応型ビデオ符号化を実装するためのプロセスおよび方法を実装するための例示的なシステムを示す図である。 動き予測符号化形式での解像度適応型ビデオ符号化を実装するためのプロセスおよび方法を実装するための例示的なシステムを示す図である。
本明細書に記載されるシステムおよび方法は、ビデオエンコーディングにおける適応解像度を可能にすることを対象とし、より具体的には、VVC/H.266規格によって提供される動き予測符号化ツールに基づいて、フレーム間の適応解像度の変更を可能にするために、再構築フレームのアップサンプリングおよびダウンサンプリングを実装することを対象とする。
本開示の例示的な実施形態によれば、動き予測符号化形式は、1つ以上の他のフレームの動き情報および予測単位(PU)への1つ以上の参照を含むことによって、フレームの動き情報およびPUをエンコードするデータ形式を指し得る。動き情報は、動きベクトルおよび現在のフレームまたは別のフレームのブロックへの参照などの、フレームまたはその単位もしくは下位単位のブロック構造の動きを説明するデータを指し得る。PUは、符号化単位(CU)などのフレームの複数のブロック構造の中で、ブロック構造に対応する単位または複数の下位単位を指してもよく、ブロックは、フレームデータに基づいて分割され、確立されたビデオコーデックに従って符号化される。予測単位に対応する動き情報は、本明細書に記載されるものを含むが、これらに限定されない、任意の動きベクトル符号化ツールによってエンコードされる動き予測を説明し得る。
本開示の例示的な実施形態によれば、動き予測符号化形式は、アフィン動き予測符号化およびデコーダ側動きベクトル精緻化(DMVR)を含み得る。本開示の例示的な実施形態に関するこれらの動き予測符号化形式の特徴は、本明細書に記載されるはずである。
アフィン動き予測符号化によるデコーダは、アフィン動きモデルを採用した符号化形式によるエンコードされたビットストリームの現在のフレームを取得し、再構築フレーム(「アフィン動き予測符号化再構築フレーム」)を導出してもよい。現在のフレームは、インター符号化されてもよい。
アフィン動き予測符号化再構築フレームのCUの動き情報は、アフィン動き補償予測によって予測されてもよい。動き情報は、複数の制御点動きベクトル(CPMV)および導出された動きベクトルを含む、複数の動きベクトルを含み得る。図1Aおよび図1Bに示すように、複数のCPMVは、2つの制御点として機能するCUの2つの動き
Figure 2022530172000002
、または3つの制御点として機能するCUの3つの動き
Figure 2022530172000003
を含むことができ、ここで、
Figure 2022530172000004
は、CUの左上隅の制御点であり、
Figure 2022530172000005
は、CUの右上隅の制御点であり、
Figure 2022530172000006
は、CUの左下隅の制御点である。導出された動きベクトルは、制御点から、およびCUのサンプル位置(x、y)ピクセルからアフィン動きモデルによって導出されてもよく、これは、2つの制御点の4パラメータアフィン動きモデル、または3つの制御点の6パラメータアフィン動きモデルであってもよい。
サンプル位置(x、y)における動きベクトルは、以下の演算によって2つの制御点から導出されてもよい:
Figure 2022530172000007
サンプル位置(x、y)における動きベクトルは、以下の演算によって3つの制御点から導出されてもよい:
Figure 2022530172000008
動き情報は、ブロックのルマ成分の動き情報を導出し、またブロックの動き情報にブロックベースのアフィン変換を適用することによってブロックのクロマ成分の動き情報を導出することによって、さらに予測されてもよい。
図2に示すように、ブロックのルマ成分は、4×4ピクセルのルマ下位ブロックに分割されてもよく、各ルマ下位ブロックについて、ルマ下位ブロックの中心のサンプル位置におけるルマ動きベクトルは、全体のCUの制御点から上述の演算に従って導出されてもよい。ルマ下位ブロックの導出されたルマ動きベクトルは、1/16の精度に四捨五入されてもよい。
ブロックのクロマ成分は、4×4ピクセルのクロマ下位ブロックに分割されてもよく、各クロマ下位ブロックは、隣接する4つのルマ下位ブロックを有してもよい。例えば、隣接するルマ下位ブロックは、クロマ下位ブロックの下、左、右、または上のルマ下位ブロックであってもよい。各クロマ下位ブロックについて、動きベクトルは、隣接するルマ下位ブロックのルマ動きベクトルの平均から導出されてもよい。
動き補償補間フィルタを各下位ブロックの導出された動きベクトルに適用して、各下位ブロックの動き予測を生成してもよい。
アフィン動き予測符号化再構築フレームのCUの動き情報は、動き候補リストを含み得る。動き候補リストは、複数の動き候補への参照を含むデータ構造であってもよい。動き候補は、現在のフレームのブロック構造のピクセルもしくは任意の他の好適な下位区分などのブロック構造もしくはその下位単位であってもよいか、または別のフレームの動き候補への参照であってもよい。動き候補は、空間的動き候補または時間的動き候補であってもよい。動きベクトル補償(MVC)を適用することによって、デコーダは、動き候補リストから動き候補を選択し、再構築フレームのCUの動きベクトルとして動き候補の動きベクトルを導出してもよい。
図3は、本開示の例示的な実施形態による、アフィン動き予測符号化によるフレームのCUの動き候補の例示的な選択を示す。
アフィン動き予測符号化再構築フレームのアフィン動き予測モードがアフィンマージモードである本開示の例示的な実施形態によれば、フレームのCUは、8ピクセル以上の幅および高さの両方を有する。動き候補リストは、アフィンマージ候補リストであってもよく、最大で5つのCPMVP候補を含み得る。CUの符号化は、マージインデックスを含み得る。マージインデックスは、アフィンマージのCPMVP候補を指してもよい。
現在のCUのCPMVは、空間的隣接ブロックまたは現在のCUへの時間的隣接ブロックの動き情報から導出される制御点動きベクトル予測因子(CPMVP)候補に基づいて生成されてもよい。
図3に示すように、フレームの現在のCUの複数の空間的隣接ブロックが存在する。現在のCUの空間的隣接ブロックは、現在のCUの左側に隣接するブロックであってもよく、現在のCUの上部に隣接するブロックであってもよい。空間的隣接ブロックは、図3の左右方向および上下方向に対応する左右関係および上下関係を有する。図3の例によって、アフィンマージモードであるアフィン動き予測モードに従って符号化されたフレームのアフィンマージ候補リストは、最大で以下のCPMVP候補を含み得る:
左の空間的隣接ブロック(A)、
上の空間的隣接ブロック(B)、
右上の空間的隣接ブロック(B)、
左下の空間的隣接ブロック(A)、および
左上の空間的隣接ブロック(B)。
本明細書に示される空間的隣接ブロックのうち、ブロックAは、現在のCU302の左のブロックであってもよく、ブロックAは、現在のCU302の左のブロックであってもよく、ブロックBは、現在のCU302の上のブロックであってもよく、ブロックBは、現在のCU302の上のブロックであってもよく、ブロックBは、現在のCU302の上のブロックであってもよい。現在のCU302に対して、または互いに相対的に、各空間的隣接ブロックの相対的な位置決めは、これ以上限定されない。現在のCU302に対して、または互いに、各空間的隣接ブロックの相対的なサイズに関して制限はない。
アフィンマージモードであるアフィン動き予測モードに従って符号化されたフレームのCUのアフィンマージ候補リストは、以下のCPMVP候補を含み得る。
最大で2つの継承アフィンマージ候補、
構築アフィンマージ候補、および
ゼロ動きベクトル。
継承アフィンマージ候補は、アフィン動き情報を有する空間的隣接ブロック、すなわち、CPMVを有するCUに属する空間的隣接ブロックから導出されてもよい。
構築アフィンマージ候補は、アフィン動き情報を有さない空間的隣接ブロックおよび時間的隣接ブロックから導出されてもよく、すなわち、CPMVは、並進動き情報のみを有するCUに属する空間的隣接ブロックおよび時間的隣接ブロックから導出されてもよい。
ゼロ動きベクトルは、(0,0)の動きシフトを有し得る。
最大で1つの継承アフィンマージ候補は、現在のCUの左の空間的隣接ブロックを検索することから導出されてもよく、最大1つの継承アフィンマージ候補は、現在のCUの上の空間的隣接ブロックを検索することから導出されてもよい。左の空間的隣接ブロックは、AおよびAの順序で検索されてもよく、上の空間的隣接ブロックは、B、B、およびBの順序で検索されてもよく、各々の場合、アフィン動き情報を有する第1の空間的隣接ブロックについて検索されてもよい。このような第1の空間的隣接ブロックが左の空間的隣接ブロックの中で見つかった場合、CPMVP候補は、第1の空間的隣接ブロックのCPMVから導出され、アフィンマージ候補リストに追加される。このような第1の空間的隣接ブロックが上の空間的隣接ブロックの中で見つかった場合、CPMVP候補は、第1の空間的隣接ブロックのCPMVから導出され、アフィンマージ候補リストに追加される。このように2つのCPMVP候補が導出された場合、導出されたCPMVP候補間の枝刈りチェック、すなわち、2つの導出されたCPMVP候補が同じCPMVP候補であるかどうかのチェックは実施されない。
図4は、継承アフィンマージ候補を導出する例を示す。現在のCU402は、左の空間的隣接ブロックAを有する。ブロックAは、CU404に属する。ブロックAが4パラメータアフィンモデルに従って符号化されるとき、CU404は、以下のアフィン動き情報を有し得る:
Figure 2022530172000009
は、CU404の左上隅のCPMVであり、
Figure 2022530172000010
は、CU404の右上隅のCPMVである。ブロックAを見つけると、
Figure 2022530172000011
が取得されてもよく、サンプル位置に対する現在のCU402の
Figure 2022530172000012
は、
Figure 2022530172000013
に従って計算されてもよく、結果として4パラメータアフィンマージ候補が得られる。
ブロックAが6パラメータアフィンモデルに従って符号化されるとき、CU404は、追加的に、以下のアフィン動き情報を有してもよい:
Figure 2022530172000014
は、CUの左下隅にあるCPMVである。ブロックAを見つけると、
Figure 2022530172000015
が取得されてもよく、サンプル位置に対する現在のCU402の
Figure 2022530172000016
は、
Figure 2022530172000017
に従って計算されてもよく、結果として6パラメータアフィンマージ候補が得られる。
図5は、構築アフィンマージ候補を導出する例を示す。構築アフィンマージ候補は、現在のCU502の4つのCPMVから導出されてもよく、現在のCU502の各CPMVは、現在のCU502の空間的隣接ブロックを検索することから、または現在のCU502の時間的隣接ブロックから導出される。
CPMVの導出では、以下のブロックが参照されてもよい:
左の空間的隣接ブロック(A)、
左の空間的隣接ブロック(A)、
上の空間的隣接ブロック(B)、
右上の空間的隣接ブロック(B)、
左下の空間的隣接ブロック(A)、
左上の空間的隣接ブロック(B)、
上の空間的隣接ブロック(B)、および
時間的隣接ブロック(T)。
以下のCPMVは、現在のCU502に対して導出されてもよい:
左上のCPMV(CPMV)、
右上のCPMV(CPMV)、
左下のCPMV(CPMV)、および
右下のCPMV(CPMV)。
CPMVは、空間的隣接ブロックB、B、およびAをこの順序で検索し、関連技術で見出された基準に従って最初の利用可能な空間的隣接ブロックを選択することによって導出されてもよく、その詳細は本明細書では説明しない。
CPMVは、空間的隣接ブロックBおよびBをこの順序で検索し、同様に最初の利用可能な空間的隣接ブロックを選択することによって導出されてもよい。
CPMVは、空間的隣接ブロックAおよびAこの順序でを検索し、同様に最初の利用可能な空間的隣接ブロックを選択することによって導出されてもよい。
CPMVは、利用可能である場合、時間的隣接ブロックTから導出されてもよい。
構築アフィンマージ候補は、以下の組み合わせの中で、現在のCU502のCPMVの最初の利用可能な組み合わせを使用して、所与の順序で構築されてもよい。
{CPMV、CPMV、CPMV}、
{CPMV、CPMV、CPMV}、
{CPMV、CPMV、CPMV}、
{CPMV、CPMV、CPMV}、
{CPMV、CPMV}、および
{CPMV、CPMV}。
3つのCPMVの組み合わせが使用される場合、6パラメータアフィンマージ候補が生成される。2つのCPMVの組み合わせが使用される場合、4パラメータアフィンマージ候補が生成される。次いで、構築アフィンマージ候補は、アフィンマージ候補リストに追加される。
アフィン動き情報を有しないブロック、例えば、時間的動きベクトル予測因子(TMVP)符号化形式に従って符号化されたCUに属するブロックについて、CUの符号化は、インター予測インジケータを含み得る。インター予測インジケータは、リスト0として指される第1の参照ピクチャリストを参照するリスト0予測、リスト1として指される第2の参照ピクチャリストを参照するリスト1予測、またはそれぞれリスト0およびリスト1として指される2つの参照ピクチャリストを参照する双予測を示し得る。リスト0予測またはリスト1予測を示すインター予測インジケータの場合、CUの符号化は、それぞれリスト0またはリスト1によって参照される参照フレームバッファの参照ピクチャを指す参照インデックスを含み得る。双予測を示すインター予測インジケータの場合、CUの符号化は、リスト0によって参照される参照フレームバッファの第1の参照ピクチャを指す第1の参照インデックス、およびリスト1によって参照される参照フレームの第2の参照ピクチャを指す第2の参照インデックスを含み得る。
インター予測インジケータは、インター符号化フレームのスライスヘッダ内のフラグとして符号化されてもよい。参照インデックス(複数可)は、インター符号化フレームのスライスヘッダに符号化されてもよい。参照インデックス(複数可)にそれぞれ対応する1つまたは2つの動きベクトル差分(MVD)がさらに符号化されてもよい。
上述したCPMVの特定の組み合わせにおいて、CPMVの参照インデックスが異なる場合、すなわち、CMPVが、異なる解像度を有し得る異なる参照ピクチャを参照するCUから導出され得る場合、CPMVの特定の組み合わせは破棄され、使用されなくてもよい。
任意の導出された継承アフィンマージ候補および任意の構築アフィンマージ候補をCUのアフィンマージ候補リストに追加した後、ゼロ動きベクトル、すなわち(0、0)の動きシフトを示す動きベクトルが、アフィンマージ候補リストの任意の残りの空の位置に追加される。
アフィン動き予測符号化再構築フレームのアフィン動き予測モードがアフィン適応動きベクトル予測(AMVP)モードである本開示の例示的な実施形態によれば、フレームのCUは、16ピクセル以上の幅および高さの両方を有する。AMVPモードの適用可能性、および4パラメータアフィン動きモデルまたは6パラメータアフィン動きモデルが使用されるかどうかは、符号化されたフレームデータを搬送するビデオビットストリームに搬送されるビットレベルフラグによって信号化されてもよい。動き候補リストは、AMVP候補リストであってもよく、最大2つのAMVP候補を含んでもよい。
現在のCUのCPMVは、空間的隣接ブロックの現在のCUへの動き情報から導出されるAMVP候補に基づいて生成されてもよい。
AMVPモードであるアフィン動き予測モードに従って符号化されたフレームのCUのAMVP候補リストは、以下のCPMVP候補を含み得る:
継承AMVP候補、
構築AMVP候補、
隣接CUからの並進動きベクトル、および
ゼロ動きベクトル。
継承AMVP候補は、継承AMVP候補を導出するために検索された各空間的隣接ブロックが、現在のCUと同じ参照ピクチャを参照するCUに属することを除いて、継承アフィンマージ候補を導出するための方法と同じ方法で導出されてもよい。継承AMVP候補とAMVP候補リストとの間では、継承AMVP候補をAMVP候補リストに追加しながら枝刈りチェックは実施されない。
最初の利用可能な空間的隣接ブロックを選択することが、インター符号化されており、現在のCUと同じ参照ピクチャを参照する参照インデックスを有する最初の利用可能な空間的隣接ブロックが選択されるという基準に従ってさらに実施されることを除いて、構築AMVP候補は、構築アフィンマージ候補を導出する方法と同じ方法で導出されてもよい。さらに、時間的制御点がサポートされていないAMVPの実装によれば、時間的隣接ブロックは検索されなくてもよい。
現在のCUが4パラメータアフィン動きモデルで符号化され、現在のCUのCPMVおよびCPMVが利用可能な場合、CPMVおよびCPMVは、1つの候補としてAMVP候補リストに追加される。現在のCUが6パラメータアフィン動きモデルで符号化され、現在のCUのCPMV、CPMV、およびCPMVが利用可能な場合、CPMV、CPMV、およびCPMVは、1つの候補としてAMVP候補リストに追加される。そうでなければ、構築AMVP候補は、AMVP候補リストに追加するために利用可能ではない。
並進動きベクトルは、並進動き情報のみを有するCUに属する空間的隣接ブロックからの動きベクトルであり得る。
ゼロ動きベクトルは、(0,0)の動きシフトを有し得る。
任意の導出された継承アフィンマージ候補および任意の構築アフィンマージ候補をCU、CPMV、CPMV、およびCPMVのアフィンマージ候補リストに追加した後、それぞれの利用可能性に従って、現在のCUのすべてのCPMVを予測するために、並進動きベクトルとして所与の順序でAMVP候補リストに追加される。次いで、ゼロ動きベクトル、すなわち(0、0)の動きシフトを示す動きベクトルが、AMVP候補リストの任意の残りの空の位置に追加される。
DMVRに従って予測される動き情報は、双予測によって予測されてもよい。再構築フレームのブロックの動き情報が、第1の参照ブロックの第1の動きベクトルおよび第2の参照ブロックの第2の動きベクトルへの参照を含んでもよく、第1の参照ブロックは、現在のブロックからの第1の時間的距離を有し、第2の参照ブロックは、現在のブロックからの第2の時間的距離を有するように、現在のフレームに対して双予測を実施してもよい。第1の時間的距離および第2の時間的距離は、現在のブロックとは異なる時間的方向にあってもよい。
第1の動きベクトルは、リスト0として指される第1の参照ピクチャリストの第1の参照ピクチャのブロックの動きベクトルであってもよく、第2の動きベクトルは、リスト1として指される第2の参照ピクチャリストの第2の参照ピクチャのブロックの動きベクトルであってもよい。現在のブロックが属するCUの符号化は、リスト0によって参照される参照フレームの第1の参照ピクチャを指す第1の参照インデックス、およびリスト1によって参照される参照フレームの第2の参照ピクチャを指す第2の参照インデックスを含み得る。
図6は、テンプレートマッチングに基づくDMVR双予測プロセスの図を示す。DMVR双予測プロセスの第1のステップでは、初期の第1の動きベクトルmvによって参照されるリスト0の第1の参照ピクチャ604の初期の第1のブロック602、および初期の第2の動きベクトルmvによって参照されるリスト1の第2の参照ピクチャ608の初期の第2のブロック606は、初期の第1のブロック602と初期の第2のブロック606との重み付けされた組み合わせを生成するために平均化される。重み付けされた組み合わせは、テンプレート610として機能する。現在のブロック612の動き予測は、初期の第1のブロック602を参照する初期の第1の動きベクトルおよび初期の第2のブロック606を参照する初期の第2の動きベクトルを使用して実施されてもよい。
DMVR双予測プロセスの第2のステップでは、テンプレート610は、コスト測定によって、初期の第1のブロック602に近接する第1の参照ピクチャ604の第1のサンプル領域と、初期の第2のブロック606に近接する第2の参照画像608の第2のサンプル領域と比較される。コスト測定は、絶対差分の合計または平均除去された絶対差分の合計などの画像類似性の好適な尺度を利用してもよい。第1のサンプル領域内で、後続の第1のブロック614がテンプレートに対して測定された最小コストを有する場合、後続の第1のブロック614を参照する後続の第1の動きベクトルmv’は、初期の第1の動きベクトルmvを置き換えてもよい。第2のサンプル領域内で、後続の第2のブロック616がテンプレートに対して測定された最小コストを有する場合、後続の第2のブロック616を参照する後続の第2の動きベクトルmv’は、初期の第2の動きベクトルmvを置き換えてもよい。次いで、mv’およびmv’を使用して、現在のブロック612について双予測が実施されてもよい。
図7は、本開示の例示的な実施形態による、ビデオ符号化プロセス700の例示的なブロック図を示す。
ビデオ符号化プロセス700は、ビットストリーム710などのソースから符号化フレームを取得し得る。本開示の例示的な実施形態によれば、ビットストリーム内の位置Nを有する現在のフレーム712を考慮すると、ビットストリーム内の位置N-1を有する以前のフレーム714は、現在のフレームの解像度よりも大きいかまたは小さい解像度を有してもよく、ビットストリーム内の位置N+1を有する次のフレーム716は、現在のフレームの解像度よりも大きいかまたは小さい解像度を有してもよい。
ビデオ符号化プロセス700は、現在のフレーム712を復号して、再構築フレーム718を生成し、参照フレームバッファ790または表示バッファ792などの宛先において再構築フレーム718を出力してもよい。現在のフレーム712は、符号化ループ720に入力されてもよく、これは、現在のフレーム712をビデオデコーダ722に入力するステップを繰り返すことと、参照フレームバッファ790の以前の再構築フレーム794に基づいて再構築フレーム718を生成することと、再構築フレーム718をループ内アップサンプラまたはダウンサンプラ724に入力することと、アップサンプリングまたはダウンサンプリング再構築フレーム796を生成することと、アップサンプリングまたはダウンサンプリング再構築フレーム796を参照フレームバッファ790に出力することと、を含んでもよい。代替的に、再構築フレーム718は、ループから出力されてもよく、これは、再構築フレームをループ後アップサンプラまたはダウンサンプラ726に入力することと、アップサンプリングまたはダウンサンプリング再構築フレーム798を生成することと、アップサンプリングまたはダウンサンプリング再構築フレーム798を表示バッファ792に出力することと、を含んでもよい。
本開示の例示的な実施形態によれば、ビデオデコーダ722は、本明細書に記載されるそれらの符号化形式を含むが、これらに限定されない、動き予測符号化形式を実装する任意のデコーダであってもよい。参照フレームバッファ790の以前の再構築フレームに基づいて再構築フレームを生成することは、本明細書に記載されるインター符号化動き予測を含んでもよく、以前の再構築フレームは、以前の符号化ループ中にループ内アップサンプラまたはダウンサンプラ722によって出力されたアップサンプリングまたはダウンサンプリング再構築フレームであってもよく、以前の再構築フレームは、本明細書に記載されるインター符号化動き予測における参照ピクチャとして機能する。
本開示の例示的な実施形態によれば、ループ内アップサンプラまたはダウンサンプラ724およびループ後アップサンプラまたはダウンサンプラ726は、各々動き予測符号化形式で符号化されたフレームの少なくともアップサンプリングまたはダウンサンプリング符号化ピクセル情報にそれぞれ好適なアップサンプリングまたはダウンサンプリングアルゴリズムを実装してもよい。ループ内アップサンプラまたはダウンサンプラ724およびループ後アップサンプラまたはダウンサンプラ726は、各々動きベクトルなどの動き情報のアップスケールおよびダウンスケールにさらに好適なアップサンプリングまたはダウンサンプリングアルゴリズムをそれぞれ実装してもよい。
ループ内アップサンプラまたはダウンサンプラ724によって出力されるアップサンプリングまたはダウンサンプリング再構築フレーム796が、符号化ループ720の将来の反復において、アップサンプリングまたはダウンサンプリング再構築フレーム796が以前の再構築フレームとして機能するために必要とされる前に、参照フレームバッファ790に入力され得るのに十分なように、ループ内アップサンプラまたはダウンサンプラ724は、ループ後アップサンプラまたはダウンサンプラ426によって利用されるアルゴリズムと比較して、比較的単純で、より大きな計算速度を有するアップサンプリングまたはダウンサンプリングアルゴリズムを利用してもよく、一方、ループ後アップサンプラまたはダウンサンプラ726によって出力されるアップサンプリングまたはダウンサンプリング再構築フレーム798は、アップサンプリングまたはダウンサンプリング再構築フレーム796がこのように必要とされる前に時間内に出力されない場合がある。例えば、ループ内アップサンプラは、訓練に依存しない補間、平均、またはバイリニアアップサンプリングアルゴリズムを利用し得る一方で、ループ後アップサンプラは、訓練されたアップサンプリングアルゴリズムを利用し得る。
したがって、以前の再構築フレーム794などの、現在のフレーム712の再構築フレーム718を生成する際の参照ピクチャとして機能するフレームは、以前のフレーム714および次のフレーム716の解像度に対する現在のフレーム712の解像度に従ってアップサンプリングまたはダウンサンプリングされてもよい。例えば、現在のフレーム712が以前のフレーム714および次のフレーム716のいずれかまたは両方の解像度よりも大きい解像度を有する場合、参照ピクチャとして機能するフレームをアップサンプリングしてもよい。参照ピクチャとして機能するフレームは、現在のフレーム712が以前のフレーム714および次のフレーム716のいずれかまたは両方よりも小さい解像度を有する場合にダウンサンプリングされてもよい。
図8A、図8B、および図8Cは、フレームがアフィン動き予測符号化によって符号化される、本開示の例示的な実施形態による解像度適応型ビデオ符号化を実装するビデオ符号化方法800の例示的なフローチャートを示す。
ステップ802において、ビデオデコーダは、アフィン動き予測符号化によってエンコードされたビットストリームの現在のフレームを取得してもよく、アフィンマージモードまたはAMVPモードは、ビットストリーム信号に従ってさらに有効化されてもよい。現在のフレームは、位置Nを有してもよい。ビットストリーム内の位置N-1を有する以前のフレームは、現在のフレームの解像度よりも大きいかまたは小さい解像度を有してもよく、ビットストリーム内の位置N+1を有する次のフレームは、現在のフレームの解像度よりも大きいかまたは小さい解像度を有してもよい。
ステップ804において、ビデオデコーダは、参照フレームバッファから1つ以上の参照ピクチャを取得し、1つ以上の参照ピクチャの解像度を現在のフレームの解像度と比較してもよい。
ステップ806において、ビデオデコーダは、1つ以上の参照ピクチャの1つ以上の解像度が現在のフレームの解像度と異なると決定すると、利用可能であれば、参照フレームバッファから現在のフレームの解像度と同じ解像度を有するフレームを選択してもよい。
本開示の例示的な実施形態によれば、現在のフレームの解像度と同じ解像度を有するフレームは、現在のフレームの解像度と同じ解像度を有する参照フレームバッファの最新のフレームであってもよく、これは、参照フレームバッファの最新のフレームではない場合もある。
ステップ808において、ループ内アップサンプラまたはダウンサンプラは、現在のフレームの解像度と1つ以上の参照ピクチャの解像度との比率を決定してもよく、その比率に従って、1つ以上の参照ピクチャの動きベクトルをスケーリングしてもよい。
本開示の例示的な実施形態によれば、スケーリング動きベクトルは、動きベクトルの大きさを増加または減少させることを含み得る。
ステップ810Aにおいて、ループ内アップサンプラまたはダウンサンプラは、比率に従って、1つ以上の参照ピクチャのインター予測因子をさらにサイズ変更してもよい。
本開示の例示的な実施形態によれば、インター予測因子は、例えば、異なる解像度を有し得る他の参照ピクチャを参照する動き予測のための動き情報であってもよい。
ステップ810Bにおいて、代替的に、ループ内アップサンプラまたはダウンサンプラは、現在のフレームのシーケンスヘッダまたはピクチャヘッダ内で信号化されたアップサンプルまたはダウンサンプルフィルタ係数を検出し、信号化されたフィルタ係数と現在のフレームのフィルタ係数との間の差分をビデオデコーダに伝送してもよい。フィルタ係数は、インター予測因子の係数であるとみなすことができる。したがって、インター予測因子のフィルタ係数と現在のフレームのフィルタ係数との間の差分により、予測動き情報が現在のフレームのフィルタに適用されることが可能になる。
ステップ812において、ビデオデコーダは、現在のフレームのブロックのアフィンマージ候補リストまたはAMVP候補リストを導出してもよい。アフィンマージ候補リストまたはAMVP候補リストの導出は、本明細書に記載された前述のステップに従って実施されてもよい。アフィンマージ候補リストまたはAMVP候補リストの導出におけるCPMVP候補またはAMVP候補の導出は、それぞれ、本明細書に記載された前述のステップに従ってさらに実施されてもよい。
ステップ814において、ビデオデコーダは、本明細書に記載された前述のステップに従って、アフィンマージ候補リストまたはAMVP候補リストからCPMVP候補またはAMVP候補を選択し、再構築フレームのブロックの動きベクトルとしてCPMVP候補またはAMVP候補の動きベクトルを導出してもよい。
ステップ816において、ビデオデコーダは、1つ以上の参照ピクチャおよび選択されたCPMVPまたはAMVP候補に基づいて、現在のフレームから再構築フレームを生成してもよい。
再構築フレームは、現在のフレームと同じ解像度を有する選択された参照ピクチャへの参照によって、参照フレームバッファの他のフレームの動きベクトルもしくはインター予測因子がそれぞれ現在のフレームと同じ解像度に従ってスケーリングもしくはサイズ変更されることによって、またはフィルタをエンコードしながら、ループ内アップサンプラまたはダウンサンプラから現在のフレームのフィルタに伝送される信号化フィルタ係数と現在のフレームのフィルタ係数との間の差分を適用することによって予測されてもよい。
ステップ818において、再構築フレームは、ループ内アップサンプラまたはダウンサンプラ、およびループ後アップサンプラまたはダウンサンプラのうちの少なくとも1つに入力されてもよい。
ステップ820において、ループ内アップサンプラもしくはダウンサンプラ、またはループ後アップサンプラもしくはダウンサンプラのうちの少なくとも1つは、再構築フレームに基づいて、アップサンプリングまたはダウンサンプリング再構築フレームを生成してもよい。
ビットストリームによってサポートされた複数の解像度の異なる解像度に各々従って、複数のアップサンプリングまたはダウンサンプリング再構築フレームが生成されてもよい。
ステップ822において、再構築フレームおよび1つ以上のアップサンプリングまたはダウンサンプリング再構築フレームのうちの少なくとも1つは、参照フレームバッファおよび表示バッファのうちの少なくとも1つに入力されてもよい。
再構築フレームが参照フレームバッファに入力される場合、再構築フレームは、参照ピクチャとして取得されてもよく、その後、符号化ループの後続の反復において、上記のステップ806に関して説明されたようにアップサンプリングまたはダウンサンプリングされてもよい。1つ以上のアップサンプリングまたはダウンサンプリング再構築フレームが参照フレームバッファに入力される場合、符号化ループの後続の反復において、現在のフレームと同じ解像度を有するフレームとして、1つ以上のアップサンプリングまたはダウンサンプリングフレームのうちの1つを選択してもよい。
図9A、図9B、および図9Cは、動き情報がDMVRによって予測される、本開示の例示的な実施形態による解像度適応型ビデオ符号化を実装するビデオ符号化方法900の例示的なフローチャートを示す。
ステップ902において、ビデオデコーダは、ビットストリームの現在のフレームを取得してもよい。現在のフレームは、位置Nを有してもよい。ビットストリーム内の位置N-1を有する以前のフレームは、現在のフレームの解像度よりも大きいかまたは小さい解像度を有してもよく、ビットストリーム内の位置N+1を有する次のフレームは、現在のフレームの解像度よりも大きいかまたは小さい解像度を有してもよい。
ステップ904において、ビデオデコーダは、参照フレームバッファから1つ以上の参照ピクチャを取得し、1つ以上の参照ピクチャの解像度を現在のフレームの解像度と比較してもよい。
ステップ906において、ビデオデコーダが1つ以上の参照ピクチャの1つ以上の解像度が現在のフレームの解像度と異なると決定すると、ループ内アップサンプラまたはダウンサンプラは、利用可能であれば、参照フレームバッファから現在のフレームの解像度と同じ解像度を有するフレームを選択してもよい。
本開示の例示的な実施形態によれば、ビデオデコーダは、現在のフレームの解像度と同じ解像度を有する参照フレームバッファからフレームを選択してもよい。現在のフレームの解像度と同じ解像度を有するフレームは、現在のフレームの解像度と同じ解像度を有する参照フレームバッファの最新のフレームであってもよく、これは、参照フレームバッファの最新のフレームではない場合もある。
ステップ908において、ループ内アップサンプラまたはダウンサンプラは、現在のフレームの解像度と1つ以上の参照ピクチャの解像度の比率を決定してもよく、その比率に従って、1つ以上の参照ピクチャのピクセルパターンをサイズ変更してもよい。
本開示の例示的な実施形態によれば、1つ以上の参照ピクチャのピクセルパターンのサイズ変更は、例えば、テンプレートを、コスト測定によって、初期の第1のブロックに近接する第1の参照ピクチャの第1のサンプル領域と初期の第2のブロックに近接する第2の参照ピクチャの第2のサンプル領域とを比較する上述されたステップなどの、DMVRによる異なる解像度でのベクトル精緻化プロセスを促進し得る。
ステップ910において、ビデオデコーダは、本明細書に記載した前述のステップに従って、参照フレームバッファの第1の参照フレームおよび第2の参照フレームに基づいて、現在のフレームに対して双予測およびベクトル精緻化を実施してもよい。
ステップ912において、ビデオデコーダは、第1の参照フレームおよび第2の参照フレームに基づいて、現在のフレームから再構築フレームを生成してもよい。
再構築フレームは、現在のフレームと同じ解像度を有する選択された参照ピクチャへの参照によって、または参照フレームバッファの他のフレームのピクセルパターンが現在のフレームと同じ解像度に従ってサイズ変更されることよって、予測されてもよい。
ステップ914において、再構築フレームは、ループ内アップサンプラまたはダウンサンプラ、およびループ後アップサンプラまたはダウンサンプラのうちの少なくとも1つに入力されてもよい。
ステップ916において、ループ内アップサンプラもしくはダウンサンプラ、またはループ後アップサンプラもしくはダウンサンプラのうちの少なくとも1つは、再構築フレームに基づいて、アップサンプリングまたはダウンサンプリング再構築フレームを生成してもよい。
ビットストリームによってサポートされた複数の解像度の異なる解像度に各々従って、複数のアップサンプリングまたはダウンサンプリング再構築フレームが生成されてもよい。
ステップ918において、再構築フレームおよび1つ以上のアップサンプリングまたはダウンサンプリング再構築フレームのうちの少なくとも1つは、参照フレームバッファおよび表示バッファのうちの少なくとも1つに入力されてもよい。
再構築フレームが参照フレームバッファに入力される場合、再構築フレームは、参照ピクチャとして取得されてもよく、その後、符号化ループの後続の反復において、上記のステップ906に関して説明されたようにアップサンプリングまたはダウンサンプリングされてもよい。1つ以上のアップサンプリングまたはダウンサンプリング再構築フレームが参照フレームバッファに入力される場合、符号化ループの後続の反復において、現在のフレームと同じ解像度を有するフレームとして、1つ以上のアップサンプリングまたはダウンサンプリングフレームのうちの1つを選択してもよい。
図10は、動き予測符号化形式での解像度適応型ビデオ符号化を実装するための上述されたプロセスおよび方法を実装するための例示的なシステム1000を示す。
本明細書に記載された技術および機構は、システム1000の複数のインスタンス、ならびに任意の他のコンピューティングデバイス、システム、および/または環境によって実装されてもよい。図10に示されるシステム1000は、システムの一例に過ぎず、上述されたプロセスおよび/または手順を実施するために利用される任意のコンピューティングデバイスの使用範囲または機能性に関するいかなる制限も示唆することを意図していない。実施形態との使用に好適であり得る他の周知のコンピューティングデバイス、システム、環境、および/または構成としては、パーソナルコンピュータ、サーバコンピュータ、ハンドヘルドデバイスもしくはラップトップデバイス、マルチプロセッサシステム、マイクロプロセッサベースシステム、セットトップボックス、ゲームコンソール、プログラム可能な家電製品、ネットワークPC、ミニコンピュータ、メインフレームコンピュータ、上記のシステムもしくはデバイスのいずれかを含む分散コンピューティング環境、ならびに/またはフィールドプログラマブルゲートアレイ(「FPGA」)およびアプリケーション固有の集積回路(「ASIC」)を使用する実装などが挙げられるが、これらに限定されない。
システム1000は、1つ以上のプロセッサ1002およびプロセッサ(複数可)1002に通信可能に結合されたシステムメモリ1004を含み得る。プロセッサ(複数可)1002は、1つ以上のモジュールおよび/またはプロセスを実行して、プロセッサ(複数可)1002に様々な機能を実施されてもよい。いくつかの実施形態では、プロセッサ(複数可)1002は、中央処理単位(CPU)、グラフィックス処理単位(GPU)、CPUとGPUとの両方、または当該技術分野で既知の他の処理単位もしくは構成要素を含み得る。追加的に、プロセッサ(複数可)1002の各々は、プログラムモジュール、プログラムデータ、および/または1つ以上のオペレーティングシステムを記憶することもできる独自のローカルメモリを有してもよい。
システム1000の正確な構成およびタイプに応じて、システムメモリ1004は、RAMなどの揮発性、ROMなどの不揮発性、フラッシュメモリ、ミニチュアハードドライブ、およびメモリカードなど、またはこれらのいくつかの組み合わせであってもよい。システムメモリ1004は、プロセッサ(複数可)1002によって実行可能な1つ以上のコンピュータ実行可能モジュール1006を含み得る。
モジュール1006は、デコーダモジュール1008と、アップサンプラまたはダウンサンプラモジュール1010と、を含み得るが、これらに限定されない。デコーダモジュール1008は、フレーム取得モジュール1012と、参照ピクチャ取得モジュール1014と、フレーム選択モジュール1016と、候補リスト導出モジュール1018と、動き予測モジュール1020と、再構築フレーム生成モジュール1022と、アップサンプラまたはダウンサンプラ入力モジュール1024と、を含み得る。アップサンプラまたはダウンサンプラモジュール1010は、比率決定モジュール1026と、スケーリングモジュール1030と、インター予測因子サイズ変更モジュール1032と、フィルタ係数検出および差分送信モジュール1034と、アップサンプリングまたはダウンサンプリング再構築フレーム生成モジュール1036と、バッファ入力モジュール1038と、を含み得る。
フレーム取得モジュール1012は、図8を参照して上述したように、アフィン動き予測符号化形式でエンコードされたビットストリームの現在のフレームを取得するように構成されてもよい。
参照ピクチャ取得モジュール1014は、図8を参照して上述したように、参照フレームバッファから1つ以上の参照ピクチャを取得し、1つ以上の参照ピクチャの解像度を、現在のフレームの解像度と比較するように構成されてもよい。
フレーム選択モジュール1016は、図8を参照して上述したように、参照ピクチャ取得モジュール1014が、1つ以上の参照ピクチャの1つ以上の解像度が現在のフレームの解像度とは異なると決定すると、参照フレームバッファから現在のフレームの解像度と同じ解像度を有するフレームを選択するように構成されてもよい。
候補リスト導出モジュール1018は、図8を参照して上述したように、現在のフレームのブロックのアフィンマージ候補リストまたはAMVP候補リストを導出するように構成されてもよい。
動き予測モジュール1020は、図8を参照して上述したように、導出されたアフィンマージ候補リストまたはAMVP候補リストからCPMVPまたはAMVP候補を選択し、再構築フレームのブロックの動きベクトルとしてCPMVPまたはAMVP候補の動きベクトルを導出するように構成されてもよい。
再構築フレーム生成モジュール1022は、1つ以上の参照ピクチャおよび選択された動き候補に基づいて、現在のフレームから再構築フレームを生成するように構成されてもよい。
アップサンプラまたはダウンサンプラ入力モジュール1024は、再構築フレームをアップサンプラまたはダウンサンプラモジュール1010に入力するように構成されてもよい。
比率決定モジュール1026は、現在のフレームの解像度と1つ以上の参照ピクチャの解像度との比率を決定するように構成されてもよい。
スケーリングモジュール1030は、比率に従って1つ以上の参照ピクチャの動きベクトルをスケーリングするように構成されてもよい。
インター予測因子サイズ変更モジュール1032は、比率に従って、1つ以上の参照ピクチャのインター予測因子をサイズ変更するように構成されてもよい。
フィルタ係数検出および差分送信モジュール1034は、現在のフレームのシーケンスヘッダまたはピクチャヘッダ内で信号化されたアップサンプルまたはダウンサンプルフィルタ係数を検出し、信号されたフィルタ係数と現在のフレームのフィルタ係数との間の差分をビデオデコーダに送信するように構成されてもよい。
アップサンプリングまたはダウンサンプリング再構築フレーム生成モジュール1036は、再構築フレームに基づいて、アップサンプリングまたはダウンサンプリング再構築フレームを生成するように構成されてもよい。
バッファ入力モジュール1038は、図8を参照して上述したように、アップサンプリングまたはダウンサンプリング再構築フレームを参照フレームバッファおよび表示バッファのうちの少なくとも1つに入力するように構成されてもよい。
システム1000は、追加的に、処理されるビットストリームデータを受信するための、ならびに再構築フレームを参照フレームバッファおよび/または表示バッファに出力するための入力/出力(I/O)インターフェース1040を含み得る。システム1000はまた、システム1000がネットワーク(図示せず)を介して他のデバイス(図示せず)と通信することを可能にする通信モジュール1050も含み得る。ネットワークは、インターネット、有線ネットワークまたは直接有線接続などの有線媒体、ならびに音響、無線周波数(RF)、赤外線、および他の無線媒体などの無線媒体を含み得る。
図11は、動き予測符号化形式での解像度適応型ビデオ符号化を実装するための上述されたプロセスおよび方法を実装するための例示的なシステム1100を示す。
本明細書に記載された技術および機構は、システム1100の複数のインスタンス、ならびに任意の他のコンピューティングデバイス、システム、および/または環境によって実装されてもよい。図11に示されるシステム1100は、システムの一例に過ぎず、上述されたプロセスおよび/または手順を実施するために利用される任意のコンピューティングデバイスの使用範囲または機能性に関するいかなる制限も示唆することを意図していない。実施形態との使用に好適であり得る他の周知のコンピューティングデバイス、システム、環境、および/または構成としては、パーソナルコンピュータ、サーバコンピュータ、ハンドヘルドデバイスもしくはラップトップデバイス、マルチプロセッサシステム、マイクロプロセッサベースシステム、セットトップボックス、ゲームコンソール、プログラム可能な家電製品、ネットワークPC、ミニコンピュータ、メインフレームコンピュータ、上記のシステムもしくはデバイスのいずれかを含む分散コンピューティング環境、ならびに/またはフィールドプログラマブルゲートアレイ(「FPGA」)およびアプリケーション固有の集積回路(「ASIC」)を使用する実装などが挙げられるが、これらに限定されない。
システム1100は、1つ以上のプロセッサ1102およびプロセッサ(複数可)1102に通信可能に結合されたシステムメモリ1104を含み得る。プロセッサ(複数可)1102は、1つ以上のモジュールおよび/またはプロセスを実行して、プロセッサ(複数可)1102に様々な機能を実施されてもよい。いくつかの実施形態では、プロセッサ(複数可)1102は、中央処理単位(CPU)、グラフィックス処理単位(GPU)、CPUとGPUとの両方、または当該技術分野で既知の他の処理単位もしくは構成要素を含み得る。追加的に、プロセッサ(複数可)1102の各々は、プログラムモジュール、プログラムデータ、および/または1つ以上のオペレーティングシステムを記憶することもできる独自のローカルメモリを有してもよい。
システム1100の正確な構成およびタイプに応じて、システムメモリ1104は、RAMなどの揮発性、ROMなどの不揮発性、フラッシュメモリ、ミニチュアハードドライブ、およびメモリカードなど、またはこれらのいくつかの組み合わせであってもよい。システムメモリ1104は、プロセッサ(複数可)1102によって実行可能な1つ以上のコンピュータ実行可能モジュール1106を含み得る。
モジュール1106は、デコーダモジュール1108と、アップサンプラまたはダウンサンプラモジュール1110と、を含み得るが、これらに限定されない。デコーダモジュール1108は、フレーム取得モジュール1112と、参照ピクチャ取得モジュール1114と、双予測モジュール1116と、ベクトル精緻化モジュール1118と、アップサンプリングまたはダウンサンプリング再構築フレーム生成モジュール1120と、アップサンプラまたはダウンサンプラ入力モジュール1122と、を含み得る。アップサンプラまたはダウンサンプラモジュール1110は、比率決定モジュール1124と、ピクセルパターンサイズ変更モジュール1128と、アップサンプリングまたはダウンサンプリング再構築フレーム生成モジュール1130と、バッファ入力モジュール1132と、を含み得る。
フレーム取得モジュール1112は、図9を参照して上述したように、BIO符号化形式でエンコードされたビットストリームの現在のフレームを取得するように構成されてもよい。
参照ピクチャ取得モジュール1114は、図9を参照して上述したように、参照フレームバッファから1つ以上の参照ピクチャを取得し、1つ以上の参照ピクチャの解像度を、現在のフレームの解像度と比較するように構成されてもよい。
双予測モジュール1116は、図9を参照して上述したように、参照フレームバッファの第1の参照フレームおよび第2の参照フレームに基づいて、現在のフレームに対して双予測を実施するように構成されてもよい。
ベクトル精緻化モジュール1118は、図6を参照して上述したように、参照フレームバッファの第1の参照フレームおよび第2の参照フレームに基づいて、双予測プロセス中にベクトル精緻化を実施するように構成されてもよい。
再構築フレーム生成モジュール1120は、第1の参照フレームおよび第2の参照フレームに基づいて、現在のフレームから再構築フレームを生成するように構成されてもよい。
アップサンプラまたはダウンサンプラ入力モジュール1122は、再構築フレームをアップサンプラまたはダウンサンプラモジュール1110に入力するように構成されてもよい。
比率決定モジュール1124は、現在のフレームの解像度と1つ以上の参照ピクチャの解像度との比率を決定するように構成されてもよい。
ピクセルパターンサイズ変更モジュール1128は、比率に従って、1つ以上の参照ピクチャのピクセルパターンをサイズ変更するように構成されてもよい。
アップサンプリングまたはダウンサンプリング再構築フレーム生成モジュール1130は、再構築フレームに基づいて、アップサンプリングまたはダウンサンプリング再構築フレームを生成するように構成されてもよい。
バッファ入力モジュール1132は、図9を参照して上述したように、アップサンプリングまたはダウンサンプリング再構築フレームを参照フレームバッファおよび表示バッファのうちの少なくとも1つに入力するように構成されてもよい。
システム1100は、追加的に、処理されるビットストリームデータを受信するための、ならびに再構築フレームを参照フレームバッファおよび/または表示バッファに出力するための入力/出力(I/O)インターフェース1140を含み得る。システム1100はまた、システム1100がネットワーク(図示せず)を介して他のデバイス(図示せず)と通信することを可能にする通信モジュール1150も含み得る。ネットワークは、インターネット、有線ネットワークまたは直接有線接続などの有線媒体、ならびに音響、無線周波数(RF)、赤外線、および他の無線媒体などの無線媒体を含み得る。
上述の方法のいくつかの動作またはすべての動作は、以下に定義するように、コンピュータ可読記憶媒体に記憶されたコンピュータ可読命令の実行によって実行され得る。明細書および請求項で使用される「コンピュータ可読命令」という用語は、ルーチン、アプリケーション、アプリケーションモジュール、プログラムモジュール、プログラム、構成要素、データ構造、アルゴリズムなどを含む。コンピュータ可読命令は、シングルプロセッサシステムまたはマルチプロセッサシステム、ミニコンピュータ、メインフレームコンピュータ、パーソナルコンピュータ、ハンドヘルドコンピューティングデバイス、マイクロプロセッサベースのプログラム可能な家電製品、それらの組み合わせなど、さまざまなシステム構成で実装され得る。
コンピュータ可読記憶媒体は、揮発性メモリ(ランダムアクセスメモリ(RAM)など)および/または不揮発性メモリ(読み出し専用メモリ(ROM)、フラッシュメモリなど)を含み得る。コンピュータ可読記憶媒体はまた、コンピュータ可読命令、データ構造、プログラムモジュールなどの不揮発性記憶装置を提供し得る、フラッシュメモリ、磁気記憶装置、光学記憶装置および/またはテープ記憶装置を含むが、これらに限定されない、追加の取り外し可能な記憶装置および/または非取り外し可能記憶装置を含み得る。
非一時的コンピュータ可読記憶媒体は、コンピュータ可読媒体の一例である。コンピュータ可読媒体は、少なくとも2つのタイプのコンピュータ可読媒体、すなわちコンピュータ可読記憶媒体およびコンピュータ可読通信媒体を含む。コンピュータ可読記憶媒体は、コンピュータ可読命令、データ構造、プログラムモジュール、または他のデータなどの情報の記憶のための任意のプロセスまたは技術で実装される、揮発性および不揮発性、取り外し可能媒体および非取り外し可能媒体を含む。コンピュータ可読記憶媒体は、相変化メモリ(PRAM)、スタティックランダムアクセスメモリ(SRAM)、ダイナミックランダムアクセスメモリ(DRAM)、他のタイプのランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、電気的に消去可能なプログラム可能な読み出し専用メモリ(EEPROM)、フラッシュメモリまたはその他のメモリ技術、コンパクトディスクの読み出し専用メモリ(CD-ROM)、デジタル多用途ディスク(DVD)または他の光学記憶装置、磁気カセット、磁気テープ、磁気ディスク記憶装置または他の磁気記憶デバイス、あるいはコンピューティングデバイスによるアクセスのための情報を記憶するために使用され得る他の任意の非伝送媒体を含むが、これらに限定されない。対照的に、通信媒体は、コンピュータ可読命令、データ構造、プログラムモジュール、または他のデータを、搬送波などの変調されたデータ信号または他の伝達機構で具体化し得る。本明細書で定義されるように、コンピュータ可読記憶媒体は、通信媒体を含まない。
1つ以上のプロセッサによって実行されたときに、図1~図11を参照して上述した動作を実施し得る、1つ以上の非一時的コンピュータ可読記憶媒体に記憶されたコンピュータ可読命令。一般に、コンピュータ可読命令は、特定の機能を実行するか、または特定の抽象データ型を実装するルーチン、プログラム、オブジェクト、構成要素、データ構造などを含む。動作が説明される順序は、制限として解釈されることを意図するものではなく、説明される動作の任意の数は、プロセスを実装するために任意の順序で、および/または並列に組み合わせられ得る。
上述した技術的解決策によって、本開示は、動き予測符号化形式によってサポートされるインター符号化解像度適応型ビデオ符号化を提供し、動きベクトルが以前のフレームを参照することを可能にしながら、フレーム間の解像度の変化を符号化することを可能にすることによって、複数の動き予測符号化形式においてビデオ符号化プロセスを改善する。したがって、インター符号化の帯域幅の節約が維持され、動き予測符号化の帯域幅の節約が実現され、これにより参照フレームが後続のフレームの動きベクトルを予測するために使用されることが可能になり、帯域幅の可用性に応じた適応的なダウンサンプリングおよびアップサンプリングの帯域幅の節約も、すべて同時に達成され、ビデオ符号化およびコンテンツ配信中のネットワークコストの大幅な改善を達成し、一方で、これらの節約を相殺するかまたは損なうであろう追加のデータ伝送を低減する。
A.方法であって、ビットストリームの現在のフレームを取得することと、参照フレームバッファから現在のフレームの解像度とは異なる解像度を有する1つ以上の参照ピクチャを取得することと、1つ以上の参照ピクチャのインター予測因子をサイズ変更することと、1つ以上の参照ピクチャと現在のフレームの1つ以上のブロックの動き情報とに基づいて、現在のフレームから再構築フレームを生成することであって、動き情報が少なくとも1つのインター予測因子を含む、生成することと、を含む、方法。
B.1つ以上の参照ピクチャの解像度を現在のフレームの解像度と比較することと、1つ以上の参照ピクチャの1つ以上の解像度が現在のフレームの解像度とは異なることを決定すると、参照フレームバッファから現在のフレームの解像度と同じ解像度を有するフレームを選択することと、現在のフレームの解像度と1つ以上の参照ピクチャの解像度との比率を決定することと、現在のフレームの解像度に一致するように、比率に従って、1つ以上の参照ピクチャをサイズ変更することと、比率に従って1つ以上の参照ピクチャのインター予測因子をアップサンプリングまたはダウンサンプリングすることと、比率に従って、1つ以上の参照ピクチャの動きベクトルをスケーリングすることと、をさらに含む、段落Aに記載の方法。
C.現在のフレームのアフィンマージ候補リストまたはAMVP候補リストを導出することと、アフィンマージ候補リストまたはAMVP候補リストからCPMVP候補またはAMVP候補をそれぞれ選択することと、動き候補の動きベクトルを再構築フレームのブロックの動きベクトルとして導出することと、をさらに含む、段落Aに記載の方法。
D.継承アフィンマージ候補および構築アフィンマージ候補のうちの少なくとも1つを導出することと、継承アフィンマージ候補および構築アフィンマージ候補のうちの少なくとも1つを、アフィンマージ候補リストまたはAMVP候補リストに追加することと、をさらに含む、段落Cに記載の方法。
E.1つ以上の参照ピクチャと少なくとも1つのインター予測因子とに基づいて、現在のフレームから再構築フレームを生成することと、再構築フレームを、ループ内アップサンプラまたはダウンサンプラ、およびループ後アップサンプラまたはダウンサンプラのうちの少なくとも1つに入力することと、再構築フレームに基づいて、アップサンプリングまたはダウンサンプリング再構築フレームを生成することと、アップサンプリングまたはダウンサンプリング再構築フレームを、参照フレームバッファおよび表示バッファのうちの少なくとも1つに入力することと、をさらに含む、段落Aに記載の方法。
F.方法であって、ビットストリームの現在のフレームを取得することと、参照フレームバッファから1つ以上の参照ピクチャを取得することと、1つ以上の参照ピクチャの解像度を現在のフレームの解像度と比較することと、1つ以上の参照ピクチャの1つ以上の解像度が現在のフレームの解像度とは異なることを決定すると、現在のフレームの解像度に従って1つ以上の参照ピクチャのピクセルパターンをサイズ変更することと、を含む、方法。
G.参照フレームバッファの第1の参照フレームおよび第2の参照フレームに基づいて、現在のフレームに対して双予測を実施することをさらに含む、段落Fに記載の方法。
H.現在のフレームに対して双予測を実施することが、参照フレームバッファの第1の参照フレームおよび第2の参照フレームに基づいて、現在のフレームに対してベクトル精緻化を実施することをさらに含む、段落Gに記載の方法。
I.第1の参照フレームと第2の参照フレームとに基づいて、現在のフレームから再構築フレームを生成することと、再構築フレームを、ループ内アップサンプラまたはダウンサンプラ、およびループ後アップサンプラまたはダウンサンプラのうちの少なくとも1つに入力することと、再構築フレームに基づいて、アップサンプリングまたはダウンサンプリング再構築フレームを生成することと、アップサンプリングまたはダウンサンプリング再構築フレームを、参照フレームバッファおよび表示バッファのうちの少なくとも1つに入力することと、をさらに含む、段落Hに記載の方法。
J.方法であって、ビットストリームの現在のフレームを取得することであって、ビットストリームは、複数の解像度を有するフレームを含む、取得することと、参照フレームバッファから1つ以上の参照ピクチャを取得することと、1つ以上の参照ピクチャと現在のフレームの1つ以上のブロックの動き情報とに基づいて、現在のフレームから再構築フレームを生成することであって、動き情報が、少なくとも1つのインター予測因子を含む、生成することと、複数の解像度の各解像度について、現在の再構築フレームをアップサンプリングまたはダウンサンプリングして、それぞれの解像度に一致するアップサンプリングまたはダウンサンプリング再構築フレームを生成することと、を含む、方法。
K.1つ以上の参照ピクチャのうちの少なくとも1つについて信号化されたアップサンプルまたはダウンサンプルフィルタ係数を検出することをさらに含む、段落Jに記載の方法。
L.インター予測因子のフィルタ係数と現在のフレームのフィルタ係数との間の差分を、現在のフレームのフィルタの符号化に適用することをさらに含む、段落Kに記載の方法。
M.再構築フレーム、および各アップサンプリングまたはダウンサンプリング再構築フレームを、参照フレームバッファに入力することをさらに含む、段落Jに記載の方法。
N.システムであって、1つ以上のプロセッサと、1つ以上のプロセッサに通信可能に結合されたメモリと、を備え、メモリが、1つ以上のプロセッサによって実行可能なコンピュータ実行可能モジュールを記憶しており、コンピュータ実行可能モジュールが、1つ以上のプロセッサによって実行されたときに関連する動作を実施し、コンピュータ実行可能モジュールが、ビットストリームの現在のフレームを取得するように構成されたフレーム取得モジュールと、参照フレームバッファから1つ以上の参照ピクチャを取得し、1つ以上の参照ピクチャの解像度を現在のフレームの解像度と比較するように構成された参照ピクチャ取得モジュールと、を備える、システム。
O.参照ピクチャ取得モジュールが1つ以上の参照ピクチャの1つ以上の解像度が現在のフレームの解像度とは異なることを決定すると、参照フレームバッファから現在のフレームの解像度と同じ解像度を有するフレームを選択するように構成されたフレーム選択モジュールをさらに備える、段落Nに記載のシステム。
P.現在のフレームのブロックに対するアフィンマージ候補リストまたはAMVP候補リストを導出するように構成された候補リスト導出モジュールをさらに備える、段落Oに記載のシステム。
Q.導出されたアフィンマージ候補リストまたはAMVP候補リストからCPMVPまたはAMVP候補をそれぞれ選択するように構成された動き予測モジュールをさらに備える、段落Pに記載のシステム。
R.動き予測モジュールが、CPMVPまたはAMVP候補の動きベクトルを再構築フレームのブロックの動きベクトルとして導出するようにさらに構成されている、段落Qに記載のシステム。
S.1つ以上の参照ピクチャと選択された動き候補とに基づいて、現在のフレームから再構築フレームを生成するように構成された再構築フレーム生成モジュールと、再構築フレームをアップサンプラまたはダウンサンプラモジュールに入力するように構成されたアップサンプラまたはダウンサンプラ入力モジュールと、現在のフレームの解像度と1つ以上の参照ピクチャの解像度との比率を決定するように構成された比率決定モジュールと、比率に従って1つ以上の参照ピクチャのインター予測因子をサイズ変更するように構成されたインター予測因子サイズ変更モジュールと、現在のフレームのシーケンスヘッダまたはピクチャヘッダ内で信号化されたアップサンプルまたはダウンサンプルフィルタ係数を検出し、信号化されたフィルタ係数と現在のフレームのフィルタ係数との間の差分をビデオデコーダに送信するように構成されたフィルタ係数検出および差分送信モジュールと、比率に従って1つ以上の参照ピクチャの動きベクトルをスケーリングするように構成されたスケーリングモジュールと、再構築フレームに基づいてアップサンプリングまたはダウンサンプリング再構築フレームを生成するように構成されたアップサンプリングまたはダウンサンプリング再構築フレーム生成モジュールと、アップサンプリングまたはダウンサンプリング再構築フレームを参照フレームバッファおよび表示バッファのうちの少なくとも1つに入力するように構成されたバッファ入力モジュールと、をさらに備える、段落Nに記載のシステム。
T.システムであって、1つ以上のプロセッサと、1つ以上のプロセッサに通信可能に結合されたメモリと、を備え、メモリが、1つ以上のプロセッサによって実行可能なコンピュータ実行可能モジュールを記憶しており、コンピュータ実行可能モジュールが、1つ以上のプロセッサによって実行されたときに関連する動作を実施し、コンピュータ実行可能モジュールが、ビットストリームの現在のフレームを取得するように構成されたフレーム取得モジュールと、参照フレームバッファから1つ以上の参照ピクチャを取得し、1つ以上の参照ピクチャの解像度を現在のフレームの解像度と比較するように構成された参照ピクチャ取得モジュールと、を備える、システム。
U.参照フレームバッファの第1の参照フレームと第2の参照フレームとに基づいて、現在のフレームに対して双予測を実施するように構成された双予測モジュールをさらに備える、段落Tに記載のシステム。
V.参照フレームバッファの第1の参照フレームおよび第2の参照フレームに基づいて、双予測プロセス中にベクトル精緻化を実施するように構成されたベクトル精緻化モジュールをさらに備える、段落Uに記載のシステム。
W.第1の参照フレームと第2の参照フレームとに基づいて、現在のフレームから再構築フレームを生成するように構成された再構築フレーム生成モジュールと、再構築フレームをアップサンプラまたはダウンサンプラモジュールに入力するように構成されたアップサンプラまたはダウンサンプラ入力モジュールと、再構築フレームに基づいて、アップサンプリングまたはダウンサンプリング再構築フレームを生成するように構成されたアップサンプリングまたはダウンサンプリング再構築フレーム生成モジュールと、アップサンプリングまたはダウンサンプリング再構築フレームを参照フレームバッファおよび表示バッファのうちの少なくとも1つに入力するように構成されたバッファ入力モジュールと、をさらに備える、段落Vに記載のシステム。
主題について、構造的特徴および/または方法論的動作に特有の言語で説明したが、添付の特許請求の範囲に定義された主題は、必ずしも説明された特定の特徴または動作に限定されないことが理解されるべきである。むしろ、特定の特徴および動作は、特許請求の範囲を実施する例示的な形態として開示されている。
302 現在のCU
402 現在のCU
404 CU
502 現在のCU
602 初期の第1のブロック
604 第1の参照ピクチャ
606 初期の第2のブロック
608 第2の参照ピクチャ
610 テンプレート
612 現在のブロック
614 後続の第1のブロック
616 後続の第2のブロック
700 ビデオ符号化プロセス
710 ビットストリーム
712 現在のフレーム
714 以前のフレーム
716 次のフレーム
718 再構築フレーム
720 符号化ループ
722 ビデオデコーダ
724 ループ内アップサンプラまたはダウンサンプラ
726 ループ後アップサンプラまたはダウンサンプラ
790 参照フレームバッファ
792 表示バッファ
794 以前の再構築フレーム
796 アップサンプリングまたはダウンサンプリング再構築フレーム
798 アップサンプリングまたはダウンサンプリング再構築フレーム
1000 システム
1002 プロセッサ(複数可)
1004 システムメモリ
1006 モジュール
1008 デコーダモジュール
1010 アップサンプラまたはダウンサンプラモジュール
1012 フレーム取得モジュール
1014 参照ピクチャ取得モジュール
1016 フレーム選択モジュール
1018 候補リスト導出モジュール
1020 動き予測モジュール
1022 再構築フレーム生成モジュール
1024 アップサンプラまたはダウンサンプラ入力モジュール
1026 比率決定モジュール
1030 スケーリングモジュール
1032 インター予測因子サイズ変更モジュール
1034 フィルタ係数検出および差分送信モジュール
1036 アップサンプリングまたはダウンサンプリング再構築フレーム生成モジュール
1038 バッファ入力モジュール
1040 入力/出力(I/O)インターフェース
1050 通信モジュール
1100 システム
1102 プロセッサ(複数可)
1104 システムメモリ
1106 モジュール
1108 デコーダモジュール
1110 アップサンプラまたはダウンサンプラモジュール
1112 フレーム取得モジュール
1114 参照ピクチャ取得モジュール
1116 双予測モジュール
1118 ベクトル精緻化モジュール
1120 アップサンプリングまたはダウンサンプリング再構築フレーム生成モジュール
1122 アップサンプラまたはダウンサンプラ入力モジュール
1124 比率決定モジュール
1128 ピクセルパターンサイズ変更モジュール
1130 アップサンプリングまたはダウンサンプリング再構築フレーム生成モジュール
1132 バッファ入力モジュール
1140 入力/出力(I/O)インターフェース
1150 通信モジュール

Claims (20)

  1. ビットストリームの現在のフレームを取得することと、
    参照フレームバッファから1つ以上の参照ピクチャを取得することであって、前記1つ以上の参照ピクチャが、前記現在のフレームの解像度とは異なる解像度を有するものである、ことと、
    1つ以上のインター予測因子をサイズ変更し、および/または前記1つ以上の参照ピクチャから取得された1つ以上の動きベクトルをスケーリングすることと、
    前記現在のフレームの1つ以上のブロックの動き情報に基づいて、前記現在のフレームから再構築フレームを生成することであって、前記動き情報が、少なくとも1つのインター予測因子および/または少なくとも1つの動きベクトルを含む、ことと、を含む方法。
  2. 前記1つ以上のインター予測因子をサイズ変更することが、前記現在のフレームの前記解像度に一致するように、前記現在のフレームの前記解像度と前記1つ以上の参照ピクチャの前記解像度との比率に従って実施され、
    前記再構築フレームを前記参照フレームバッファに参照ピクチャとして入力することをさらに含む、請求項1に記載の方法。
  3. 前記1つ以上の動きベクトルをスケーリングすることが、前記現在のフレームの前記解像度に一致するように、前記現在のフレームの前記解像度と前記1つ以上の参照ピクチャの前記解像度との比率に従って実施され、
    前記再構築フレームを前記参照フレームバッファに参照ピクチャとして入力することをさらに含む、請求項1に記載の方法。
  4. 前記現在のフレームのブロックのアフィンマージ候補リストまたはAMVP候補リストを導出することをさらに含み、前記アフィンマージ候補リストまたは前記AMVP候補リストが、複数のCPMVP候補またはAMVP候補をそれぞれ含む、請求項1に記載の方法。
  5. 前記アフィンマージ候補リストまたは前記AMVP候補リストを導出することが、最大で2つの継承アフィンマージ候補を導出することを含む、請求項4に記載の方法。
  6. 前記動き候補リストを導出することが、構築アフィンマージ候補を導出することを含む、請求項4に記載の方法。
  7. 前記導出されたアフィンマージ候補リストまたはAMVP候補リストから、CPMVP候補またはAMVP候補をそれぞれ選択することと、
    前記CPMVP候補または前記AMVP候補の動き情報を、前記現在のフレームの前記ブロックの動き情報として導出することと、をさらに含む、請求項4に記載の方法。
  8. 前記動き候補が参照ピクチャへの参照を含み、前記動き候補の動き情報を導出することが、
    参照ピクチャの動き情報への前記参照に基づいて、複数のCPMVを生成することをさらに含む、請求項8に記載の方法。
  9. 1つ以上のプロセッサによって実行可能なコンピュータ可読命令を記憶するコンピュータ可読記憶媒体であって、前記コンピュータ可読命令が前記1つ以上のプロセッサによって実行されたときに、前記1つ以上のプロセッサに
    ビットストリームの現在のフレームを取得することと、
    参照フレームバッファから1つ以上の参照ピクチャを取得することと、
    前記1つ以上の参照ピクチャのうちの少なくとも1つについて信号化されたアップサンプルまたはダウンサンプルフィルタ係数を検出することと、
    前記1つ以上の参照ピクチャと前記現在のフレームの1つ以上のブロックの動き情報とに基づいて、前記現在のフレームから再構築フレームを生成することであって、前記動き情報が、別のフレームの動き情報への少なくとも1つの参照を含むものである、ことと、
    解像度に従って、前記現在の再構築フレームをアップサンプリングまたはダウンサンプリングして、前記解像度に一致するアップサンプリングまたはダウンサンプリング再構築フレームを生成することと、を含む動作を実施させる、コンピュータ可読記憶媒体。
  10. 前記動作が、前記インター予測因子のフィルタ係数と前記現在のフレームのフィルタ係数との間の差分を受信することをさらに含む、請求項9に記載のコンピュータ可読記憶媒体。
  11. 前記動作が、前記インター予測因子の前記フィルタ係数と前記現在のフレームの前記フィルタ係数との間の前記差分を、前記現在のフレームのフィルタの符号化に適用することをさらに含む、請求項10に記載のコンピュータ可読記憶媒体。
  12. 前記動作が、前記再構築フレームおよび前記アップサンプリングまたはダウンサンプリングされた再構築フレームを、参照ピクチャとして前記参照フレームバッファに入力することをさらに含む、請求項9に記載のコンピュータ可読記憶媒体。
  13. 1つ以上のプロセッサと、
    前記1つ以上のプロセッサに通信可能に結合されたメモリと、を備え、前記メモリが、前記1つ以上のプロセッサによって実行可能なコンピュータ実行可能モジュールを記憶しており、前記コンピュータ実行可能モジュールが、前記1つ以上のプロセッサによって実行されたときに関連づけられた動作を実施し、前記コンピュータ実行可能モジュールが、
    ビットストリームの現在のフレームを取得するように構成されたフレーム取得モジュールと、
    参照フレームバッファから1つ以上の参照ピクチャを取得するように構成された参照フレーム取得モジュールであって、前記1つ以上の参照ピクチャが、前記現在のフレームの解像度とは異なる解像度を有するものである、参照フレーム取得モジュールと、
    前記1つ以上の参照ピクチャの1つ以上のインター予測因子をサイズ変更するように構成されたインター予測因子サイズ変更モジュールと、
    前記1つ以上の参照ピクチャの1つ以上の動きベクトルをスケーリングするように構成されたスケーリングモジュールと、
    前記現在のフレームの1つ以上のブロックの動き情報に基づいて、前記現在のフレームから再構築フレームを生成するように構成された再構築フレーム生成モジュールであって、前記動き情報が、少なくとも1つのインター予測因子および/または少なくとも1つの動きベクトルを含む、再構築フレーム生成モジュールと、を備える、システム。
  14. 前記インター予測因子サイズ変更モジュールが、前記現在のフレームの前記解像度に基づいて、前記現在のフレームの前記解像度に一致するように、前記現在のフレームの前記解像度と前記1つ以上の参照ピクチャの前記解像度との比率に従って、前記1つ以上のインター予測因子をサイズ変更するようにさらに構成されており、
    前記再構築フレームを前記参照フレームバッファに参照ピクチャとして入力するように構成されたバッファ入力モジュールをさらに備える、請求項13に記載のシステム。
  15. 前記スケーリングモジュールが、前記現在のフレームの前記解像度に基づいて、前記現在のフレームの前記解像度に一致するように、前記現在のフレームの前記解像度と前記1つ以上の参照ピクチャの前記解像度との比率に従って、前記1つ以上の動きベクトルをスケーリングするようにさらに構成されており、
    前記再構築フレームを前記参照フレームバッファに参照ピクチャとして入力するように構成されたバッファ入力モジュールをさらに備える、請求項13に記載のシステム。
  16. 前記現在のフレームのブロック用のアフィンマージ候補リストまたはAMVP候補リストを導出するように構成された候補リスト導出モジュールをさらに備え、前記アフィンマージ候補リストまたは前記AMVP候補リストが、複数のCPMVP候補またはAMVP候補をそれぞれ含む、請求項13に記載のシステム。
  17. 前記アフィンマージ候補リストまたは前記AMVP候補リストを導出することが、最大で2つの継承アフィンマージ候補を導出することを含む、請求項16に記載のシステム。
  18. 前記動き候補リストを導出することが、構築アフィンマージ候補を導出することを含む、請求項16に記載のシステム。
  19. 前記導出されたアフィンマージ候補リストまたはAMVP候補リストから、CPMVP候補またはAMVP候補をそれぞれ選択し、前記CPMVP候補または前記AMVP候補の動き情報を、前記現在のフレームの前記ブロックの動き情報として導出するように構成された動き予測モジュールをさらに備える、請求項16に記載のシステム。
  20. 前記動き候補が、参照ピクチャの動き情報への参照を含み、前記動き予測モジュールが、
    参照ピクチャの動き情報への前記参照に基づいて、複数のCPMVを生成するようにさらに構成されている、請求項19に記載のシステム。
JP2020561757A 2019-03-11 2019-03-11 適応解像度ビデオ符号化のためのインター符号化 Pending JP2022530172A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2019/077665 WO2020181456A1 (en) 2019-03-11 2019-03-11 Inter coding for adaptive resolution video coding

Publications (1)

Publication Number Publication Date
JP2022530172A true JP2022530172A (ja) 2022-06-28

Family

ID=72426146

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020561757A Pending JP2022530172A (ja) 2019-03-11 2019-03-11 適応解像度ビデオ符号化のためのインター符号化

Country Status (5)

Country Link
US (1) US20210084291A1 (ja)
EP (1) EP3777143A4 (ja)
JP (1) JP2022530172A (ja)
CN (1) CN113597764B (ja)
WO (1) WO2020181456A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019144908A1 (en) * 2018-01-26 2019-08-01 Mediatek Inc. Method and apparatus of affine inter prediction for video coding system
US12022059B2 (en) * 2018-12-07 2024-06-25 Beijing Dajia Internet Information Technology Co., Ltd. Video coding using multi-resolution reference picture management
JP7273193B2 (ja) * 2019-05-12 2023-05-12 北京字節跳動網絡技術有限公司 参照ピクチャ再サンプリングのための信号通知
CN114342406A (zh) * 2019-06-28 2022-04-12 Sk电信有限公司 用于推导双向预测权重索引的方法及图像解码设备
WO2023059034A1 (ko) * 2021-10-04 2023-04-13 엘지전자 주식회사 적응적으로 해상도를 변경하는 영상 부호화/복호화 방법, 장치, 및 비트스트림을 전송하는 방법
CN114531596A (zh) * 2022-01-25 2022-05-24 京东方科技集团股份有限公司 图像处理方法和装置
CN116527921B (zh) * 2023-06-29 2024-04-12 浙江大华技术股份有限公司 仿射候选构建方法、仿射预测的方法和相关设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015512216A (ja) * 2012-02-29 2015-04-23 エルジー エレクトロニクス インコーポレイティド インタレイヤ予測方法及びそれを利用する装置
JP2018533286A (ja) * 2015-09-23 2018-11-08 エルジー エレクトロニクス インコーポレイティド 画像の符号化/復号化方法及びこれのために装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100586882B1 (ko) * 2004-04-13 2006-06-08 삼성전자주식회사 모션 스케일러빌리티를 지원하는 코딩 방법 및 장치
CN102075743B (zh) * 2009-11-24 2014-03-12 华为技术有限公司 视频编码方法及装置、视频解码方法及装置
US8340188B2 (en) * 2010-01-08 2012-12-25 Research In Motion Limited Method and device for motion vector estimation in video transcoding using union of search areas
EP2557789B1 (en) * 2011-08-09 2017-09-27 Dolby Laboratories Licensing Corporation Guided image up-sampling in video coding
WO2015053001A1 (ja) * 2013-10-11 2015-04-16 ソニー株式会社 画像処理装置及び画像処理方法
CN106162174B (zh) * 2016-08-31 2019-10-29 北京奇艺世纪科技有限公司 一种视频多分辨率编码方法和装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015512216A (ja) * 2012-02-29 2015-04-23 エルジー エレクトロニクス インコーポレイティド インタレイヤ予測方法及びそれを利用する装置
JP2018533286A (ja) * 2015-09-23 2018-11-08 エルジー エレクトロニクス インコーポレイティド 画像の符号化/復号化方法及びこれのために装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CHEN, JIANLE ET AL.: "Algorithm description for Versatile Video Coding and Test Model 3 (VTM 3)", JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 12TH MEETING: MACA, vol. JVET-L1002 (version 2), JPN6023010823, 24 December 2018 (2018-12-24), ISSN: 0005015618 *
LI, MING AND WU, PING: "AHG18: Comments on the Implementations of Resolution Adaption on HEVC", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11 7TH M, vol. JCTVC-G329 (version 1), JPN6023010825, 8 November 2011 (2011-11-08), ISSN: 0005015617 *

Also Published As

Publication number Publication date
US20210084291A1 (en) 2021-03-18
EP3777143A4 (en) 2022-02-16
CN113597764A (zh) 2021-11-02
CN113597764B (zh) 2022-11-01
WO2020181456A1 (en) 2020-09-17
EP3777143A1 (en) 2021-02-17

Similar Documents

Publication Publication Date Title
JP2022530172A (ja) 適応解像度ビデオ符号化のためのインター符号化
TWI617185B (zh) 具有仿射運動補償的視訊編碼的方法以及裝置
CN113612994B (zh) 具有仿射运动补偿的视频编解码的方法
US20210235111A1 (en) Motion Estimation Using Collocated Blocks
KR102642784B1 (ko) 모션 벡터 리파인먼트를 위한 제한된 메모리 액세스 윈도우
CN111201795B (zh) 存储访问窗口和用于运动矢量修正的填充
JP2022514802A (ja) 解像度適応型ビデオ符号化
JP6574976B2 (ja) 動画像符号化装置および動画像符号化方法
CN111201792B (zh) 指向分数像素点位置的运动矢量的修正运动矢量
CN113170192A (zh) 仿射的merge与mvd
CN111567047B (zh) 进行子预测块运动矢量推导的存储器访问窗口
JP2022533295A (ja) 動画処理方法、装置、及びコンピュータプログラム
JP2024038060A (ja) デコーダ側動きベクトル洗練のための誤差面ベースのサブピクセル精度の洗練方法
KR102126511B1 (ko) 보충 정보를 이용한 영상 프레임의 보간 방법 및 장치
NZ590990A (en) Content adaptive and art directable scalable video coding
JP6280679B2 (ja) フレーム間引き装置、フレーム補間装置、映像符号化装置、映像復号装置、及びこれらのプログラム
JP3513277B2 (ja) 映像符号化装置及び映像復号化装置
US20230239461A1 (en) Inter coding for adaptive resolution video coding
JP6499334B2 (ja) 双方向動きベクトル予測装置、映像符号化装置、映像復号装置、及びこれらのプログラム
US20230388484A1 (en) Method and apparatus for asymmetric blending of predictions of partitioned pictures
JP2004364333A (ja) 画像符号化装置
CN114026867B (zh) 分辨率自适应视频编解码
WO2021046692A1 (en) Resolution-adaptive video coding with conditional interpolation filters
CN111247804A (zh) 图像处理的方法与装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220218

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230307

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230320

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230616

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230919

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231219

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20240318