JP2023527920A - 映像符号化および映像復号のための方法、装置およびコンピュータプログラム製品 - Google Patents

映像符号化および映像復号のための方法、装置およびコンピュータプログラム製品 Download PDF

Info

Publication number
JP2023527920A
JP2023527920A JP2022574519A JP2022574519A JP2023527920A JP 2023527920 A JP2023527920 A JP 2023527920A JP 2022574519 A JP2022574519 A JP 2022574519A JP 2022574519 A JP2022574519 A JP 2022574519A JP 2023527920 A JP2023527920 A JP 2023527920A
Authority
JP
Japan
Prior art keywords
prediction
mode
block
samples
intra
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022574519A
Other languages
English (en)
Inventor
ユヴァラリ ラミン ガズナヴィ
ジャニ ライネマ
Original Assignee
ノキア テクノロジーズ オサケユイチア
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ノキア テクノロジーズ オサケユイチア filed Critical ノキア テクノロジーズ オサケユイチア
Publication of JP2023527920A publication Critical patent/JP2023527920A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本発明の実施形態は、方法および該方法を実施するための技術機器に関する。この方法は、符号化するピクチャを受け取ること、カレントチャネルのピクチャのブロックの内側のサンプルに対して少なくとも1つの予測を第1の予測モードに従って実行すること、参照チャネルの符号化された少なくとも1つのブロックからイントラ予測モードを導出すること、ピクチャのブロックの内側のサンプルに対して少なくとも1つの他の予測を、導出されたイントラ予測モードに従って実行すること、ならびに重みを付けた前記少なくとも1つの第1の予測および前記少なくとも1つの第2の予測に基づいてブロックの最終的な予測を決定することを含む。

Description

本解決策は一般に映像符号化および映像復号に関する。
この項は、特許請求の範囲に記載された発明の背景または状況を提供することを意図したものである。本明細書の説明は、追求しうる発想ではあるが、必ずしも以前に想像または追求された発想ではない発想を含むことがある。したがって、本明細書にそうであると示されている場合を除き、この項に記載された内容は本出願の説明および特許請求の範囲の先行技術ではなく、この項に含まれているからといって先行技術であるとは認められない。
映像符号化システム(video coding system)は、入力された映像を記憶/伝送に適した圧縮表現に変換するエンコーダ、および圧縮映像表現(compressed video representation)を圧縮解除(uncompress)して視ることができる形態に戻すことができるデコーダを備えることがある。エンコーダは、映像をよりコンパクトな形態で表現して、例えばそうしなければ必要となるビットレートよりも低いビットレートで映像情報を記憶/伝送することを可能にするために、原映像シーケンスの中の一部の情報を捨てることがある。
本発明のさまざまな実施形態に対して求めている保護の範囲は独立請求項に記載されている。本明細書に記載されてはいるが独立請求項の範囲には含まれてない実施形態および特徴がある場合、それらの実施形態および特徴は、本発明のさまざまな実施形態を理解するのに役立つ例であると解釈すべきである。
さまざまな態様は、独立請求項に記載された内容を特徴とする方法、装置、およびコンピュータプログラムがその中に記憶されたコンピュータ可読媒体を含む。従属請求項にはさまざまな実施形態が開示されている。
第1の態様によれば方法が提供され、この方法は、
- 符号化するピクチャを受け取ること、
- カレントチャネルのピクチャのブロックの内側のサンプルに対して少なくとも1つの予測を第1の予測モードに従って実行すること、
- 参照チャネル(reference channel)の符号化された少なくとも1つのブロックからイントラ予測モード(intra prediction mode)を導出すること、
- ピクチャのブロックの内側のサンプルに対して少なくとも1つの他の予測を、導出されたイントラ予測モードに従って実行すること、ならびに
- 重みを付けた前記少なくとも1つの第1の予測および前記少なくとも1つの第2の予測に基づいてブロックの最終的な予測を決定すること
を含む。
第2の態様によれば装置が提供され、この装置は、少なくとも1つのプロセッサと、コンピュータプログラムコードを含むメモリとを備え、このメモリおよびコンピュータプログラムコードは、この少なくとも1つのプロセッサとともに、少なくとも、
- 符号化するピクチャを受け取ること、
- カレントチャネルのピクチャのブロックの内側のサンプルに対して少なくとも1つの予測を第1の予測モードに従って実行すること、
- 参照チャネルの符号化された少なくとも1つのブロックからイントラ予測モードを導出すること、
- ピクチャのブロックの内側のサンプルに対して少なくとも1つの他の予測を、導出されたイントラ予測モードに従って実行すること、ならびに
- 重みを付けた少なくとも前記1つの第1の予測および前記少なくとも1つの第2の予測に基づいてブロックの最終的な予測を決定すること
をこの装置に実行させるように構成されている。
第3の態様によれば装置が提供され、この装置は、
- 符号化するピクチャを受け取る手段と、
- カレントチャネルのピクチャのブロックの内側のサンプルに対して少なくとも1つの予測を第1の予測モードに従って実行する手段と、
- 参照チャネルの符号化された少なくとも1つのブロックからイントラ予測モードを導出する手段と、
- ピクチャのブロックの内側のサンプルに対して少なくとも1つの他の予測を、導出されたイントラ予測モードに従って実行する手段と、
- 重みを付けた前記少なくとも1つの第1の予測および前記少なくとも1つの第2の予測に基づいてブロックの最終的な予測を決定する手段と
を備える。
第4の態様によれば、コンピュータプログラム製品が提供され、このコンピュータプログラム製品はコンピュータプログラムコードを含み、このコンピュータプログラムコードは、少なくとも1つのプロセッサ上で実行されたときに、
- 符号化するピクチャを受け取ること、
- カレントチャネルのピクチャのブロックの内側のサンプルに対して少なくとも1つの予測を第1の予測モードに従って実行すること、
- 参照チャネルの符号化された少なくとも1つのブロックからイントラ予測モードを導出すること、
- ピクチャのブロックの内側のサンプルに対して少なくとも1つの他の予測を、導出されたイントラ予測モードに従って実行すること、ならびに
- 重みを付けた前記少なくとも1つの第1の予測および前記少なくとも1つの第2の予測に基づいてブロックの最終的な予測を決定すること
を装置またはシステムに実行させるように構成されている。
一実施形態によれば、第1の予測モードは交差成分線形モード(cross-component linear mode)で実行される。
一実施形態によれば、導出されたイントラ予測モードは、カレントチャネルとは異なるチャネルの少なくとも1つの同一位置ブロック(collocated block)から導出される。
一実施形態によれば、導出されたイントラ予測モードは、カレントチャネルの少なくとも1つの隣接ブロック(neighboring block)から導出される。
一実施形態によれば、導出されたイントラ予測モードは、カレントチャネルの再構成された隣接サンプルからテクスチャ解析法に基づいて決定される。
一実施形態によれば、テクスチャ解析法は、デコーダ側イントラモード導出法(decoder-side intra mode derivation method)、テンプレートマッチングに基づく方法(template matching-based method)、イントラブロックコピー法(intra block copy method)のうちの1つである。
一実施形態によれば、隣接サンプルからの決定は第1の予測の方向を考慮する。
一実施形態によれば、最終的な予測は、ブロックの全サンプルに対する一定の等しい重みを用いた、結合された第1および第2の予測を含む。
一実施形態によれば、最終的な予測は、ブロックの全サンプルに対する一定の等しくない重みを用いた、結合された第1および第2の予測を含む。
一実施形態によれば、最終的な予測は、予測されたそれぞれのサンプルの重みが互いに異なる、等しいまたは等しくないサンプルごとの重み付けを用いた、結合された第1および第2の予測を含む。
一実施形態によれば、サンプルの重み値が、導出されたイントラ予測モードの予測方向またはモード識別子に基づいて決定される。
一実施形態によれば、サンプルの重み値が、交差成分線形モードの予測方向、参照サンプルの位置またはモード識別子に基づいて決定される。
一実施形態によれば、サンプルの重み値が、交差成分線形予測モードおよび導出された予測モードの予測方向、参照サンプルの位置またはモード識別子に基づいて決定される。
一実施形態によれば、サンプルの重み値が、ブロックのサイズに基づいて決定される。
一実施形態によれば、コンピュータプログラム製品は非一過性コンピュータ可読媒体上に実装されている。
以下では、さまざまな実施形態を、添付図面を参照してより詳細に説明する。
符号化プロセスの例を示す図である。 復号プロセスの例を示す図である。 カレントブロックのサンプルの位置の例を示す図である。 予測ブロックに隣接する4本の参照線の例を示す図である。 行列重み付けイントラ予測プロセスの例を示す図である。 クロマチャネルの符号化ブロックおよびルーマチャネルの同一位置ブロックを示す図である。 クロマチャネル(chroma channel)の符号化ブロックおよびルーマチャネル(luma channel)の同一位置ブロック(collocated block)のある近傍のブロックを示す図である。 ジョイント予測法の混合/結合プロセスを示す図である。 一実施形態による方法を示す流れ図である。 一実施形態による装置を示す図である。
以下では、1つの映像符号化構成の文脈でいくつかの実施形態を説明する。しかしながら、本発明の実施形態は、必ずしもこの特定の構成だけに限定されないことに留意すべきである。
Advanced Video Coding規格(AVCまたはH.264/AVCと略されることがある)は、国際電気通信連合電気通信標準化部門(ITU-T)のVideo Coding Experts Group)(VCEG)と、国際標準化機構(ISO)/国際電気標準会議(IEC)のMoving Picture Experts Group)(MPEG)とのJoint Video Team(JVT)によって開発された規格である。H.264/AVC規格は両方の親標準化機構によって発行されており、ITU-T勧告H.264およびISO/IEC国際規格14496-10と呼ばれており、MPEG-4 Part 10 Advanced Video Coding(AVC)としても知られている。H.264/AVC規格には多数の版があり、それらはそれぞれ、この仕様に新しい拡張または特徴を組み入れている。これらの拡張には、Scalable Video Coding(SVC)およびMultiview Video Coding(MVC)が含まれる。
High Efficiency Video Coding規格(HEVCまたはH.265/HEVCと略されることがある)は、VCEGとMPEGのJoint Collaborative Team-Video Coding(JCT-VC)によって開発された規格である。この規格は、両方の親標準化機構によって発行されており、ITU-T勧告H.265およびISO/IEC国際規格23008-2と呼ばれており、MPEG-H Part 2 High Efficiency Video Coding(HEVC)としても知られている。H.265/HEVCに対する拡張は、スケーラブル、マルチビュー、3次元および忠実度範囲拡張を含み、それらはそれぞれSHVC、MV-HEVC、3D-HEVCおよびREXTと呼ばれることがある。特に明記されていない限り、それらの規格仕様の定義、構造または概念の理解のためになされたH.265/HEVC、SHVC、MV-HEVC、3DHEVCおよびREXTに対する本説明における言及は、本出願の出願日前に入手可能であった、これらの規格の最新版に対する言及であると理解すべきである。
Versatile Video Coding規格(VVC、H.266またはH.266/VVC)は、ISO/IEC MPEGとITU-T VCEGの間の共同であるJoint Video Experts Team(JVET)によって現在開発中の規格である。
この項では、H.264/AVCおよびHEVCならびにこれらの拡張規格の一部の鍵となるいくつかの定義、ビットストリームおよび符号化構造ならびに概念が、本発明の実施形態を実施することができる映像エンコーダ、デコーダ、符号化法、復号法およびビットストリーム構造の例として説明される。H.264/AVCの鍵となる定義、ビットストリームおよび符号化構造、ならびに概念の一部はHEVC規格のものと同じであり、したがってそれらは下で一緒に説明される。さまざまな実施形態の態様は、H.264/AVCもしくはHEVCまたはそれらの拡張だけに限定されないが、その説明は、本発明の実施形態を部分的にまたは完全に実現するための可能な1つの基礎として与えられる。
映像コーデックは、入力された映像を記憶/伝送に適した圧縮表現に変換するエンコーダ、および圧縮された映像表現を圧縮解除して視ることができる形態に戻すことができるデコーダを備えることがある。この圧縮表現はビットストリームまたは映像ビットストリームと呼ばれることがある。さらに、映像エンコーダおよび/または映像デコーダは互いに別々のものとすることができる。すなわちそれらがコーデックを形成する必要はない。エンコーダは、映像をよりコンパクトな形態で(すなわちより低いビットレ-トで)表現するために、原映像シーケンスの中の一部の情報を捨てることがある。
符号化プロセスの例が図1に示されている。図1は、符号化する画像(In)、画像ブロックの予測された表現(P’n)、予測誤差信号(Dn)、再構成された予測誤差信号(D’n)、再構成された予備的画像(I’n)、再構成された最終的な画像(R’n)、変換(T)および逆変換(T-1)、量子化(Q)および逆量子化(Q-1)、エントロピー符号化(E)、参照フレームメモリ(RFM)、インター予測(Pinter)、イントラ予測(Pintra)、モード選択(MS)およびフィルタリング(F)を示している。復号プロセスの例が図2に示されている。図2は、画像ブロックの予測された表現(P’n)、再構成された予測誤差信号(D’n)、再構成された予備的画像(I’n)、再構成された最終的な画像(R’n)、逆変換(T-1)、逆量子化(Q-1)、エントロピー復号(E-1)、参照フレームメモリ(RFM)、予測(インターまたはイントラ)(P)、およびフィルタリング(F)を示している。
ハイブリッド映像コーデック、例えばITU-T H.263、H.264/AVCおよびHEVCは、映像情報を2段階で符号化することができる。最初に、あるピクチャエリア(または「ブロック」)の画素値を、例えば(以前に符号化した映像フレームのうちの1つの映像フレームの、符号化中のブロックに密接に対応するエリアを見つけ、それを示す)動き補償手段によって、または(符号化するブロックの周囲の画素値を指定されたやり方で使用する)空間的手段によって予測する。この最初の段階では、予測符号化を、例えばいわゆるサンプル予測および/またはいわゆるシンタックス予測として適用することができる。
このサンプル予測では、あるピクチャエリアまたは「ブロック」の画素値またはサンプル値を予測する。これらの画素値またはサンプル値は、例えば動き補償機構またはイントラ予測機構のうちの1つまたは複数を使用して予測することができる。
動き補償機構(インター予測、時間的予測もしくは動き補正時間的予測、または動き補正予測(motion-compensated prediction)ないしMCPと呼ばれることもある)は、以前に符号化した映像フレームのうちの1つの映像フレームの、符号化中のブロックに密接に対応するエリアを見つけ、それを示すことを含む。インター予測の利点の1つは、時間的冗長性を低減させることができることである。
イントラ予測では、画素値またはサンプル値を空間的機構によって予測することができる。イントラ予測は、空間的領域関係を見つけ、それを示すことを含み、同じピクチャ内の隣接画素は相関している可能性が高いことを利用する。イントラ予測は、空間または変換ドメインで実行することができ、すなわちサンプル値または変換係数を予測することができる。イントラ予測は、インター予測が適用されない、イントラ符号化で利用することができる。
パラメータ予測と呼ばれることもあるシンタックス予測では、シンタックス要素、ならびに/またはシンタックス要素から導出されたシンタックス要素値および/もしくは変数を、それより前に符号化(復号)したシンタックス要素ならびに/またはそれより前に導出した変数から予測する。シンタックス予測の非限定的な例を後に提供する。
動きベクトル予測では、動きベクトル、例えばインター予測および/またはインタービュー予測のための動きベクトルを、特定のブロックの予測された動きベクトルに対して差分的に符号化することができる。多くの映像コーデックで、予測された動きベクトルは所定の方式で生成される。例えば、隣接ブロックの符号化された動きベクトルまたは復号された動きベクトルの中央値(median)を計算することによって生成される。時にアドバンスト動きベクトル予測(advanced motion vector prediciotn)(AMVP)と呼ばれる動きベクトル予測を生成する別の方式は、時間的参照ピクチャの隣接ブロックおよび/または同一位置ブロックから候補予測のリストを作成し、選ばれた候補を動きベクトル予測子(predictor)としてシグナリングするものである。動きベクトル値を予測することに加えて、以前に符号化/復号したピクチャの参照インデックスを予測することができる。参照インデックスは通常、時間的参照ピクチャの隣接ブロックおよび/または同一位置ブロックから予測される。動きベクトルの差分符号化は通常、スライス境界を横切って使用禁止にされる。
ブロックパーティション分割(block partitioning)、例えばコーディングツリーユニット(coding tree unit)(CTU)からコーディングユニット(coding unit)(CU)、次いでプレディクションユニット(prediction unit)(PU)へのブロックパーティション分割を予測することができる。パーティション分割は、そのセットのそれぞれの要素を1つのサブセットとすることができるような態様で、1つのセットを複数のサブセットに分割するプロセスである。ピクチャは、最大サイズ128×128のCTUにパーティション分割することができるが、エンコーダは、64×64などのより小さなサイズを使用することを選ぶことができる。最初に、クオータナリツリー(quaternary tree)(4分木(quadtree)として知られている)構造によって、コーディングツリーユニット(CTU)をパーティション分割することができる。次いで、クオータナリツリーの葉ノードを、マルチタイプツリー構造(multi-type treestructure)によってさらにパーティション分割することができる。マルチタイプツリー構造には4つの分割タイプ(splitting type)、すなわち垂直バイナリ分割(vertical binary splitting)、水平バイナリ分割、垂直ターナリ(ternary)分割および水平ターナリ分割がある。マルチタイプツリーの葉ノードはコーディングユニット(CU)と呼ばれる。最大変換長に対してCUが大きすぎる場合を除き、CU、PUおよびTU(トランスフォームユニット(transform unit))は同じブロックサイズを有する。CTUのセグメント化構造は、バイナリ分割およびターナリ分割を使用するネストされたマルチタイプツリーを有する4分木、すなわち、最大変換長に対して大きすぎるサイズを有するCUに対して必要なときを除き別個のCU、PUおよびTU概念が使用されていない4分木である。CUは、正方形または長方形の形状を有することができる。
フィルタパラメータ予測では、フィルタリングパラメータ、例えばサンプル適応オフセットのためのフィルタリングパラメータを予測することができる。
以前に符号化した画像の画像情報を使用した予測手法はインター予測法と呼ばれることもあり、この方法は時間的予測および動き補償と呼ばれることもある。同じ画像内の画像情報を使用した予測手法はイントラ予測法と呼ばれることもある。
第2の段階では、予測誤差、すなわち予測された画素ブロックと元の画素ブロックとの間の差を符号化する。これは、指定された変換(例えば離散コサイン変換(DCT)またはその変形)を使用して画素値の差を変換し、係数を量子化し、量子化した係数をエントロピー符号化することによって実行することができる。量子化プロセスの忠実度を変更することによって、エンコーダは、画素表現の正確さ(ピクチャ品質)と、結果として生じる符号化された映像表現のサイズ(伝送ビットレートのファイルサイズ)との間のバランスを制御することができる。
H.264/AVCおよびHEVCを含む多くの映像コーデックで、動き情報は、動き補償されたそれぞれの画像ブロックに関連した動きベクトルによって示される。これらの動きベクトルの各々は、(エンコーダで)符号化するピクチャまたは(デコーダで)復号するピクチャの画像ブロックと、以前に符号化または復号した画像(またはピクチャ)のうちの1つの画像(またはピクチャ)の予測ソースブロックとの変位を表す。H.264/AVCおよびHEVCでは、他の多くの映像圧縮規格と同様に、1つのピクチャを複数の長方形のメッシュに分割し、そのそれぞれについて、参照ピクチャのうちの1つの参照ピクチャの同様のブロックがインター予測に対して示される。予測ブロックの位置は、符号化しているブロックに対する予測ブロックの位置を示す動きベクトルとして符号化される。
映像符号化規格は、ビットストリームシンタックスおよびセマンティクス、ならびに誤差のないビットストリームに対する復号プロセスを指定していることがあるが、符号化プロセスは指定していないことがあり、エンコーダは、適合したビットストリームを生成することだけを要求されていることがある。仮想参照デコーダ(Hypothetical Reference Decoder)(HRD)を用いてビットストリームおよびデコーダ適合性を確認することができる。これらの規格は、伝送エラーおよび伝送損失に対処するのに役立つ符号化ツールを含むことがあるが、符号化におけるそれらのツールの使用は任意であることがあり、誤ったビットストリームに対する復号プロセスは指定されていないことがある。
シンタックス要素は、ビットストリームの中に表現されたデータの要素と定義することができる。シンタックス構造体は、指定された順序でビットストリーム中に一緒に存在するゼロ個以上のシンタックス要素と定義することができる。
ほとんどの場合、エンコーダへの入力およびデコーダの出力の基本単位はピクチャである。エンコーダへの入力として与えられるピクチャはソースピクチャと呼ばれることもあり、デコーダによって復号されたピクチャは、復号されたピクチャまたは再構成されたピクチャと呼ばれることがある。
ソースピクチャおよび復号されたピクチャはそれぞれ、1つまたは複数のサンプルアレイ、例えば以下のサンプルアレイセットのうちの1つからなる。
- ルーマ(Y)のみ(モノクローム)
- ルーマおよび2つのクロマ(YCbCrまたはYCgCo)
- グリーン、ブルーおよびレッド(GBR。RGBとしても知られている)
- 指定されていない他のモノクロームまたは三刺激カラーサンプリングを表すアレイ(例えばYZX。XYZとしても知られている)
以下では、これらのアレイをルーマ(またはLもしくはY)およびクロマと呼ぶことがあり、2つのクロマアレイは、使用している実際の色表現法とは無関係にCbおよびCrと呼ぶことがある。使用している実際の色表現法は、例えば符号化されたビットストリームの中に、例えばHEVCのビデオユーザビリティインフォーメーション(Video Usability Information)(VUI)シンタックスなどを使用して示すことができる。成分(component)は、3つのサンプルアレイ(ルーマおよび2つのクロマ)の1つからのアレイまたは単一のサンプル、またはモノクローム形式のピクチャを構成するアレイもしくはアレイの単一のサンプルと定義することができる。
ピクチャは、フレームまたはフィールドであると定義することができる。フレームは、ルーマサンプルおよび場合によっては対応するクロマサンプルの行列を含む。フィールドは、フレームの一組の交互サンプル行であり、ソース信号がインタレースされるときにはエンコーダ入力として使用することができる。クロマサンプルアレイが存在しないこと(したがってモノクロサンプリングが使用されていること)があり、または、ルーマサンプルアレイと比較するときにはクロマサンプルアレイをサブサンプリングすることができる。
いくつかのクロマ形式を以下のように要約することができる。
- モノクロームサンプリングでは、1つのサンプルアレイだけがあり、そのサンプルアレイを名目上ルーマアレイとみなすことができる。
- 4:2:0サンプリングでは、2つのクロマアレイの各々が、ルーマアレイの半分の高さおよび半分の幅を有する。
- 4:2:2サンプリングでは、2つのクロマアレイの各々が、ルーマアレイと同じ高さおよびルーマアレイの半分の幅を有する。
- 別々のカラープレーン(color plane)が使用されていないときの4:4:4サンプリングでは、2つのクロマアレイの各々が、ルーマアレイと同じ高さおよび同じ幅を有する。
符号化形式または規格は、サンプルアレイを別々のカラープレーンとしてビットストリームに符号化し、そのビットストリームから、符号化されたそれぞれのカラープレーンを別々に復号することを可能にすることがある。別個のカラープレーンが使用されているとき、それらのカラープレーンの各々は、モノクロームサンプリングを有するピクチャとして(エンコーダおよび/またはデコーダによって)別々に処理される。
Versatile Video Coding(VVC)は、新しいコーディングツールを提案する。それらのツールには例えばイントラ予測、ピクチャ間予測、変換、量子化および係数符号化、エントロピー符号化、ループ内フィルタ、スクリーンコンテント符号化、360度映像符号化、高水準シンタックスおよび並列処理が含まれる。以下では、これらのツールの詳細を簡単に説明する。
・イントラ予測
- 広角度モード拡張を有する67個のイントラモード
- ブロックサイズおよびモード依存の4タップ補間フィルタ
- 位置依存イントラ予測コンビネーション(position dependent intra prediction combination)(PDPC)
- 交差成分線形モデルイントラ予測(cross component linear model intra prediction)(CCLM)
- 多重参照線イントラ予測
- イントラサブパーティション
- 行列乗算を用いた重み付きイントラ予測
・ピクチャ間予測
- 空間的、時間的、履歴ベースおよびペアワイズアベレージ(pairwise average)マージ候補を用いたブロック動きコピー
- アフィン動きインター予測
- サブブロックベースの時間的動きベクトル予測
- 適応動きベクトルレゾリューション(adaptive motion vector resolution)
- 時間的動き予測のための8×8ブロックベースの動き圧縮
- ルーマ成分用の8タップ補間フィルタおよびクロマ成分用の4タップ補間フィルタを用いた高精度(1/16画素)動きベクトル記憶および動き補償
- 三角形パーティション
- 結合されたイントラおよびインター予測
- 動きベクトル差分(MVD)を用いたマージ(merge with motion vector difference)(MMVD)
- 対称MVD符号化
- 双方向光学フロー
- デコーダ側動きベクトルリファインメント(refinement)
- CUレベル重みを用いた双方向予測(bi-prediction)
・変換、量子化および係数符号化
- DCT2、DST7およびDCT8を用いた多重1次変換選択
- 低周波ゾーンに対する2次変換
- 予測されたインター残差に対するサブブロック変換
- 51から63に増大した最大QPを用いた依存量子化
- サインデータハイディング(sign data hiding)を用いた変換係数符号化
- 変換スキップ残差符号化
・エントロピー符号化
- 適応2重窓確率更新(adaptive double windows probability update)を用いた算術符号化エンジン
・ループ内フィルタ
- インループ内リシェーピング
- 強力でより長いフィルタを用いたデブロッキングフィルタ
- サンプル適応オフセット
- 適応ループフィルタ
・スクリーンコンテント符号化
- 参照領域制限を用いたカレントピクチャレファレンシング
・360度映像符号化
- 水平ラップアラウンド動き補償
・高水準シンタックスおよび並列処理
- 直接参照ピクチャリストシグナリングを用いた参照ピクチャ管理
- 長方形タイルグループを含むタイルグループ
VVCでは、それぞれのピクチャを、HEVCと同様のコーディングツリーユニット(CTU)にパーティション分割することができる。ピクチャを、スライス、タイル、ブリックおよびサブピクチャにパーティション分割することもできる。クオータナリツリー構造を使用して、CTUをより小さなCUに分割することができる。4分木ならびにターナリおよびバイナリ分割を含むネストされたマルチタイプツリーを使用して、それぞれのCUをパーティション分割することができる。ピクチャ境界のパーティション分割を推論するための特定のルールが存在する。ネストされたマルチタイプ分割において冗長分割パターンは許されない。
VVCでは、交差成分冗長性を低減させるために交差成分線形モデル(CCLM)予測モードが使用され、これに関しては、以下の線形モデルを使用することによって、クロマサンプルを、同じCUの再構成されたルーマサンプルに基づいて予測する。
predC(i,j)=α・recL’(i,j)+β
上式で、predC(i,j)は、CUの予測されたクロマサンプルを表し、recL’(i,j)は、同じCUのダウンサンプリングされた再構成後のルーマサンプルを表す。
CCLMパラメータ(αおよびβ)は、最大4つの隣接クロマサンプルおよびそれらの対応するダウンサンプリングされたルーマサンプルを用いて導出する。図3は、左サンプルおよび上サンプルならびにCCLMモードに含まれるカレントブロックのサンプルの位置、すなわちαおよびβの導出に使用するサンプルの位置の例を示している。図3にはRecCおよびRec’Lが示されており、Rec’Lは、ダウンサンプリングされた再構成後のルーマサンプルに対するものであり、RecCは、再構成されたクロマサンプルに対するものである。
カレントクロマブロックの寸法をW×Hとすると、W’およびH’は下記のように設定される。
- LMモードが適用されるときにはW’=W、H’=H
- LM-Aモードが適用されるときにはW’=W+H
- LM-Lモードが適用されるときにはH’=H+W
上隣接位置は、S[0,-1]...S[W’-1,-1]と表され、左隣接位置は、S[-1,0]...S[-1,H’-1]と表される。
次いで、4つのサンプルが以下のように選択される。
- LMモードが適用され、上隣接サンプルと左隣接サンプルの両方が使用可能であるときには、S[W’/4,-1]、S[3*W’/4,-1]、S[-1,H’/4]、S[-1,3*H’/4]
- LM-Aモードが適用されるか、または上隣接サンプルだけが使用可能であるときには、S[W’/8,-1]、S[3*W’/8,-1]、S[5*W’/8,-1]、S[7*W’/8,-1]
- LM-Lモードが適用されるか、または左隣接サンプルだけが使用可能であるときには、S[-1,H’/8]、S[-1,3*H’/8]、S[-1,5*H’/8]、S[-1,7*H’/8]
選択された位置にある4つの隣接ルーマサンプルをダウンサンプリングし、4回比較して、2つのより小さな値x0Aおよびx1Aおよび2つのより大きな値x0Bおよびx1Bを見つける。それらの対応するクロマサンプル値はy0A、y1A、y0Bおよびy1Bと表される。次いで、Xa、Xb、YaおよびYbを下式として導出する。
Xa=(x0A+x1A+1)>>1
Xb=(x0B+x1B+1)>>1
Ya=(y0A+y1A+1)>>1
Yb=(y0B+y1B+1)>>1
最後に、線形モデルパラメータαおよびβを下式に従って取得する。
Figure 2023527920000002
β=Yb-α・Xb
パラメータαを計算する除算演算はルックアップテーブルを用いて実施する。このテーブルを記憶するのに必要なメモリを減らすため、値「diff」(最大値と最小値の差)およびパラメータαは指数関数表記によって表現される。例えば、diffは、4ビット有効桁部分および指数部を用いて近似される。したがって、1/diffのテーブルは、下記のように、有効桁部分の16個の値に対する16個の要素に低減される。
DivTable[]={0,7,6,5,5,4,4,3,3,2,2,1,1,1,1,0}
これには、計算の複雑さを低減させることと、必要なテーブルを記憶するのに必要なメモリサイズを低減させることの両方の利点があることがある。
あるいは、上テンプレートおよび左テンプレートを使用して線形モデル係数を一緒に計算することができることに加えて、それらのテンプレートを、LM_AモードおよびLM_Lモードと呼ばれる残りの2つのLMモードで使用することもできる。
LM_Aモードでは、上テンプレートだけを使用して線形モデル係数を計算する。より多くのサンプルを得るため、上テンプレートは(W+H)に拡張される。LM_Lモードでは、左テンプレートだけを使用して線形モデル係数を計算する。より多くのサンプルを得るため、左テンプレートは(H+W)に拡張される。
非正方ブロックに対しては、上テンプレートはW+Wに拡張され、左テンプレートはH+Hに拡張される。
4:2:0映像シーケンスに対するクロマサンプル位置を整合させるため、2つのタイプのダウンサンプリングフィルタをルーマサンプルに適用して、水平方向と垂直方向の両方で2:1のダウンサンプリング比を達成する。ダウンサンプリングフィルタの選択はSPSレベルフラグによって指定される。これらの2つのダウンサンプリングフィルタは以下の通りであり、それぞれ「タイプ0」および「タイプ2」コンテントに対応する。
Figure 2023527920000003
Figure 2023527920000004
上参照線がCTU境界にあるときには、ダウンサンプリングされたルーマサンプルを作成するのに、1本のルーマ線(イントラ予測における一般的なラインバッファ)だけが使用されることが理解される。
このパラメータ計算は、復号プロセスの一部として実行され、エンコーダ探索演算としてだけ実行されるのではない。その結果、αおよびβ値をデコーダに伝達するのにシンタックスは使用されない。
クロマイントラモード符号化に対して、クロマイントラモード符号化のために合計8つのイントラモードが許されている。それらのモードは、5つの伝統的なイントラモードおよび3つの交差成分線形モデルモード(CCLM、LM_AおよびLM_L)を含む。クロマモードシグナリングおよび導出プロセスが下表1に示されている。クロマモード符号化は、対応するルーマブロックのイントラ予測モードに直接に依存する。ルーマおよびクロマ成分に対する別個のブロックパーティション分割構造はIスライスで使用可能にされるため、1つのクロマブロックは多数のルーマブロックに対応することがある。したがって、クロマDMモードに対して、カレントクロマブロックの中心位置をカバーする対応するルーマブロックのイントラ予測モードが直接に引き継がれる。
Figure 2023527920000005
下表2に示されているように、sps_cclm_enabled_flagの値に関わらず単一の2値化表が使用される。
Figure 2023527920000006
表2において、最初の2進数字は、標準モード(regular mode)であるのか(0)またはLMモードであるのか(1)を示している。最初の2進数字がLMモードである場合、次の2進数字はLM_CHROMAであるのか(0)またはそうでないのかを示している。その2進数字がLM_CHROMAでない場合、次の1つの2進数字は、LM_Lであるのか(0)またはLM_Aであるのか(1)を示している。このケースで、sps_cclm_enabled_flagが0のときには、対応するintra_chroma_pred_modeの2値化表の最初の2進数字をエントロピー符号化の前に捨てることができる。または、言い換えると、最初の2進数字は0であり、したがって符号化されないと推論される。この単一の2値化表は、sps_cclm_enabled_flagが0に等しい場合と1に等しい場合の両方で使用される。表中の最初の2つの2進数字は、それ自体のコンテキストモデルを用いてコンテキスト符号化され、残りの2進数字はバイパス符号化される。
さらに、デュアルツリーにおけるルーマ-クロマ待ち時間を短縮するため、64×64ルーマ符号化ツリーノードが、Not Split(64×64CUに対してISPは使用されない)またはQTでパーティション分割されているとき、32×32/32×16クロマ符号化ツリーノードのクロマCUは、以下の方式でCCLMを使用することが許される。
- 32×32クロマノードが分割されておらず、またはパーティション分割されたQT分割されていない場合、32×32ノードの全てのクロマCUはCCLMを使用することができる。
- 32×32クロマノードがHorizontal BTでパーティション分割されており、32×16子ノードが分割せず、Vertical BT分割を使用する場合、32×16クロマノードの全てのクロマCUはCCLMを使用することができる。
他の全てのルーマおよびクロマ符号化ツリー分割条件で、CCLMは、クロマCUに対して許されていない。
多重参照線(multiple reference line)(MRL)イントラ予測は、イントラ予測により多くの参照線を使用する。図4には、4本の参照線(参照線0、1、2、3)の例が示されており、セグメントAおよびFのサンプルは、再構成された隣接サンプルからフェッチされないが、それぞれセグメントBおよびEからの最も近いサンプルで埋め込まれる。HEVCピクチャ内予測は、最も近い参照線(すなわち参照線0)を使用する。MRLでは、2本の追加の線(参照線1および参照線3)が使用される。
選択された参照線のインデックス(mrl_idx)をビットストリームに入れてまたはビットストリームに沿ってシグナリングし、それを使用してイントラ予測子を生成することができる。0よりも大きい参照線idxについては、追加の参照線モードだけをMPMリストに含めることができ、残りのモードを含めずにmpmインデックスだけをシグナリングすることができる。参照線インデックスは、イントラ予測モードの前にシグナリングすることができ、ゼロでない参照線インデックスがシグナリングされた場合には、イントラ予測モードからPlanarモードを排除することができる。
CTUの内側のブロックの最初の線に対してはMRLを使用禁止にして、カレントのCTU線の外側の拡張された参照サンプルの使用を防ぐことができる。さらに、追加の線が使用されているときにはPDPCを使用禁止にすることもできる。MRLモードについては、ゼロでない参照線インデックスに対するDCイントラ予測モードのDC値の導出を、参照線インデックス0のそれと整列させる。MRLは、予測を生成するために、CTUとの3本の隣接ルーマ参照線の記憶を必要とする。交差成分線形モデル(CCLM)ツールも、そのダウンサンプリングフィルタのために3本の隣接ルーマ参照線を必要とする。デコーダのストレージ必要量を低減させるため、同じ3本の線を使用するMLRの定義をCLMと整列させる。
イントラサブパーティション(ISP)は、イントラ予測されたルーマブロックを垂直または水平に分割して、ブロックサイズに応じた2つまたは4つのサブパーティションにする。例えば、ISPの最小ブロックサイズは4×8(または8×4)である。ブロックサイズが4×8(または8×4)よりも大きい場合、対応するブロックは、4つのサブパーティションによって分割される。M×128(M≦64)および128×N(N≦64)ISPブロックは、64×64VDPUを含む潜在的な問題を生じさせうることが分かった。例えば、単一ツリーの場合のM×128CUは、M×128ルーマTB(変換ブロック)および対応する2つの
Figure 2023527920000007
クロマTBを有する。CUがISPを使用する場合、ルーマTBは4つのM×32TBに分割され(水平分割だけが可能である)、それらはそれぞれ64×64ブロックよりも小さい。しかしながら、ISPのカレント設計ではクロマブロックが分割されない。したがって、両方のクロマ成分が32×32ブロックよりも大きいサイズを有することになる。これに類似して、同様の状況が、ISPを使用する128×N CUでも生み出されうる。したがって、これらの2つのケースは、64×64デコーダパイプラインに関して問題である。この理由から、ISPを使用することができるCUサイズは最大64×64に制限される。全てのサブパーティションは、少なくとも16個のサンプルを有するという条件を満たす。
行列重み付けイントラ予測(matrix weighted intra prediction)(MIP)法は、VVCに新たに追加されたイントラ予測技術である。幅Wおよび高さHの長方形のブロックのサンプルを予測するために、行列重み付けイントラ予測(MIP)は、そのブロックの左のH個の再構成された隣接境界サンプルからなる1本の線およびそのブロックの上のW個の再構成された隣接境界サンプルからなる1本の線を入力としてとる。再構成されたサンプルが使用可能でない場合、それらのサンプルは、従来のイントラ予測でそれが実行されたときに生成される。図5は、行列重み付けイントラ予測プロセスの例を示しており、予測信号の生成は3つのステップ、すなわち平均算出、行列ベクトル乗算および線形補間に基づく。
VVCにおけるインター予測の特徴の1つはMVDを用いたマージである。マージリストは以下の候補を含むことがある。
1)空間的隣接CUからの空間的動きベクトル予測(MVP)
2)同一位置CUからの時間的MVP
3)FIFOテーブルからの履歴ベースのMVP
4)ペアワイズアベレージMVP(リストの中にすでにある候補を使用する)
5)ゼロMV
動きベクトル差分を用いたマージモード(MMVD)は、マージ候補をシグナリングした後にMVDおよびレゾリューションインデックスをシグナリングすることである。
対称MVDでは、双方向予測の場合に、リスト-0の動き情報からリスト-1の動き情報が導出される。
アフィン予測では、ブロックの異なるコーナに対していくつかの動きベクトルが示され/シグナリングされ、それらが、サブブロックの動きベクトルを導出するために使用される。アフィンマージでは、ブロックのアフィン動き情報が、隣接ブロックの通常のまたはアフィン動き情報に基づいて生成される。
サブブロックベースの時間的動きベクトル予測では、(使用可能である場合に)空間的隣接ブロックの動きベクトルによって示された参照フレームの適切なサブブロックから、カレントブロックのサブブロックの動きベクトルが予測される。
適応動きベクトルレゾリューション(AMVR)では、CUごとにMVDの精度がシグナリングされる。
CUレベルの重みを用いた双方向予測では、2つの予測ブロックの重み付けされた平均のための重み値に対するインデックスが示される。
双方向光学フロー(BDOF)は、双方向予測の場合に動きベクトルをリファインする。BDOFは、シグナリングされた動きベクトルを使用して2つの予測ブロックを生成することができる。次いで、2つの予測ブロック間の誤差を最小化する動きリファインメントが、それらのブロックの勾配値を使用して計算される。この動きリファインメントおよび勾配値を使用して、最終的な予測ブロックをリファインする。
変換は、ブロックベースのハイブリッド映像符号化のための予測残差ブロックの空間的冗長性を除去するための解決策である。さらに、既存の方向性イントラ予測は、予測残差の方向性パターンを生じさせ、これが、変換係数に対する予測可能なパターンにつながる。変換係数の予測可能なパターンは主に低周波成分で観察される。したがって、低周波非分離変換(low-frequency non-separable transform)(LFNST)を使用して、従来の方向性イントラ予測からの変換係数である低周波1次変換係数間の冗長性をさらに圧縮することができる。
多重変換選択(Multiple Transform Selection)(MTS)は3つの三角変換に依存し、エンコーダ側で、レート歪み(Rate-Distortion)のコストを最大化する水平変換と垂直変換の対を選択する。
デコーダ側イントラモード導出(DIMD)法では、エンコーダ側とデコーダ側の両方で、以前に符号化/復号した画素からイントラ予測方向またはモードが導出される。したがって、従来のイントラ予測ツールとは異なり、モードのシグナリングは必要ない。DIMDモードを用いた画素/サンプル予測は以下のように実行することができる。
デコーダ側イントラモード導出ブロックのイントラ予測モード(IPM)では、エンコーダ側とデコーダ側の両方でテクスチャ勾配解析が実行される。このプロセスは、異なるangularイントラ予測モードに対応するある数のエントリを有する空の勾配ヒストグラム(histogram of Gradient)(HoG)から始まる。一手法によれば、65個のエントリが定義される。テクスチャ勾配解析中に、これらのエントリの振幅が決定される。このHoG計算は例えば、ブロックの周囲の幅3のテンプレートの画素に水平および垂直ソーベルフィルタ(Sobel filter)を適用することによって実行することができる。テンプレートよりも上の画素が異なるCTUに含まれる場合、このテクスチャ解析ではそれらの画素が使用されない。
このフィルタリングでは、フィルタリングウィンドウAの中の画素値が行列と畳み込まれるように、サイズ3×3の2つのカーネル行列がフィルタリングウィンドウとともに使用される。一方の行列が、フィルタリングウィンドウの中心画素における水平方向の勾配値Gxを生成し、もう一方の行列が、フィルタリングウィンドウの中心画素における垂直方向の勾配値Gyを生成する。言い換えると、中心画素および中心画素の周囲の8つの画素が、中心画素の勾配の計算に使用される。2つの勾配値の絶対値の和が勾配の大きさを示し、比Gy/Gxの逆正接(arctan)が勾配の方向を示す。フィルタリングウィンドウに縁がある場合、この方向は、angularイントラ予測モードも示す。フィルタリングウィンドウをテンプレートの次の画素に移動させ、上の手順を繰り返す。一手法によれば、上で説明した計算は、テンプレート領域の中心行のそれぞれの画素に対して実行される。
交差成分線形モデル(CCLM)は、クロマチャネル(例えばCbおよびCr)のサンプルを予測するための線形モデルを使用する。モデルパラメータは、クロマブロックの近傍の再構成されたサンプル、ルーマブロックの同一位置の隣接サンプル、および同一位置のルーマブロックの内側の再構成されたサンプルに基づいて導出される。
CCLMの目的は、2つ以上のチャネル間のサンプルの相関を見つけることである。しかしながら、CCLM法の線形モデルは、ルーマチャネルとクロマチャネルの間の正確な相関を常に提供することができるわけではなく、したがってその性能は最適とは言えない。
したがって、本発明の実施形態の目的は、クロマ符号化におけるジョイントイントラ予測を提供することによって、交差成分線形モデル(CCLM)予測の予測性能を向上させることにある。ジョイントイントラ予測は、CCLMと参照チャネルから導出されたイントラ予測モードとの結合を使用する。このことは、クロマチャネルのカレントブロックについて、ルーマチャネルの同一位置ブロックから、導出されたイントラ予測モードを引き継ぐことができることを意味する。あるいは、導出されたモードを、クロマチャネル(例えばCbおよびCr)の再構成された隣接ブロックの予測モードに基づくものとすることもできる。
クロマブロックに対する最終的な予測は、CCLMと導出された予測モードとをある重みを付けて結合することによって達成される。
以下では、本発明の実施形態をより詳細に論じる。実施形態によるジョイント予測法は、CCLMと導出されたイントラ予測モードの予測を結合する。このジョイント予測法は、CCLM予測および伝統的な空間的イントラ予測に基づいてブロックのサンプルを予測するように構成されている。伝統的なイントラ予測モードは、CCLMモードの参照チャネル(例えばルーマチャネル)の同一位置ブロックから、または同一位置ブロック内の1つの領域から導出することができる。
導出された伝統的なイントラモードは、2つのチャネルのサンプル間の追加の相関を見つけるために使用される。図6は、クロマチャネル601の符号化ブロック610およびルーマチャネル602の対応する同一位置ブロック620の例を示している。異なるチャネルのブロックセグメント化が互いに対応していない場合には、クロマチャネル601のある1つの位置をルーマチャネル602の1つの位置にマップすることによって同一位置ブロック620を決定することができ、同一位置ブロック620は、決定されたルーマ位置のブロックを同一位置ブロック620として使用する。例えば、このプロセスでは、クロマブロックの左上隅、右下隅または中央の点を参照クロマ位置として使用することができる。
代替的手法によれば、参照チャネルから導出されたモードが常に同一位置ブロックであるとは限らない。導出されたモードは、同一位置の拡張されたエリア内のブロックのうちの少なくとも1つのブロックの予測モードに基づいて決定することができる。これが図7に示されており、図7は、符号化ブロック710に対する同一位置ブロック720および同一位置近傍725を示している。この場合、導出されたモードは、2つ以上の予測モードのレート歪み(RD)性能に基づいて決定することができる。別の例として、拡張された同一位置近傍の最大サンプル面積を有する予測モード、または拡張された同一位置近傍の最大ルーマブロックに関連した予測モードを、導出されたモードとして選択することもできる。
一実施形態による方法のプロセスは、全体として、
- ブロックの内側のサンプルをCCLMモードを用いて予測することを含む、第1の予測、
- 参照チャネルの符号化されたブロックからイントラ予測モードを導出すること、
- 導出されたイントラ予測モードに基づいてブロックの内側のサンプルを予測することを含む、第2の予測、および
- 所定の重みを付けた第1および第2の予測に基づいてブロックの最終的な予測を決定すること
を含む。
図8は、第1の予測と第2の予測とを結合するジョイント予測法のプロセスの例を示している。第1の予測810はCCLMモードを用いた予測であり、第2の予測820は、導出されたモードを用いた予測である。結合850するときには、第1の予測と第2の予測の両方に重みが付けられる。
結合850のための重み付け手法は以下のうちのいずれかとすることができる。
- ブロックの全サンプルに対する一定の等しい重みを用いて第1の予測と第2の予測を結合することができる。
- ブロックの全サンプルに対する一定の等しくない重みを用いて第1の予測と第2の予測を結合することができる。
- 予測されたそれぞれのサンプルの重みを他のサンプルとは異なるものとすることができる等しい/等しくないサンプルごとの重み付けを用いて第1の予測と第2の予測を結合することができる。
- 導出されたモードの予測方向またはモード識別子に基づいてサンプルの重み値を決定することができる。
- CCLMモードの予測方向、参照サンプルの位置またはモード識別子に基づいてサンプルの重み値を決定することができる。
- CCLMモードおよび導出されたモードの予測方向、参照サンプルの位置またはモード識別子に基づいてサンプルの重み値を決定することができる。
- ブロックのサイズに基づいてサンプルの重み値を決定することができる。例えば、ブロックのより大きな側のサンプルは、導出されたモードに対してより大きな重みを使用し、CCLMモードに対してより小さな重みを使用することができ、またはその逆とすることができる。
- 一部のブロック位置については予測ブロックの重み値をゼロに設定することができる。例えば、ブロックの上端または左端からの距離がしきい値よりも大きいときに、導出された予測モードを用いて生成されたブロックの重みをゼロにすることができる。
これらの実施形態によるジョイント予測プロセスを、後述するさまざまなシナリオに適用することができる。
このジョイント予測は、一方のクロマチャネル(例えばCbまたはCr)に適用することができ、もう一方のチャネルは、CCLMモードだけまたは導出されたモードだけに基づいて予測することができる。ジョイント予測を適用するチャネルの選択は固定とすることができ、またはコーデックでのレート歪みプロセスに基づくことができる。
あるいは、クロマチャネルの各々を一方のモードを使用して予測することもできる。例えば、一方のチャネルをCCLMモードに基づいて予測し、もう一方のチャネルを、導出されたイントラモードに基づいて予測することができる。それぞれのチャネルの予測モードの選択は、レート歪みプロセスに基づいて決定することができ、または固定とすることができる。
第2の予測のための導出されたモードは、対応するクロマチャネルの隣接ブロックの予測モードに基づいて決定することができる。
導出されたモードは、planar予測モードまたはDC予測モードなど、所定のモードに設定することができる。導出されたモードは、より高水準のシグナリング、例えば、スライスもしくはピクチャヘッダの中またはビットストリームのパラメータセットの中の、導出されたモードを決定するシンタックス要素を含むより高水準のシグナリング、を使用して示すこともできる。あるいは、導出されたモードは、トランスフォームユニット、プレディクションユニットまたはコーディングユニットレベルで、これらの異なるクロマチャネルに対して別々にまたは共同で示すこともできる。
一実施形態によれば、クロマチャネルに対する導出されたモードが異なる。例えば、参照チャネル(例えばルーマチャネル)の同一位置ブロックに基づいて一方のチャネル(例えばCbまたはCr)に対する導出されたモードを決定することができ、もう一方のクロマチャネルに対する導出されたモードは、そのチャネルの隣接ブロックの予測モードに基づいて決定することができる。
本発明の実施形態に必要なシンタックス要素はいずれも、ビットストリームに入れてまたはビットストリームに沿ってシグナリングすることができる。このシグナリングは、CCLM方向、導出されたモードの方向、ブロックの位置およびサイズなどのある条件で実行することができる。あるいは、例えばCCLMモード、導出されたモード、ブロックサイズなどの可用性をチェックすることによって、デコーダ側でシンタックス要素を決定することもできる。
別の実施形態では、導出されたモードを、テクスチャ解析法に基づいて、符号化チャネルの再構成された隣接サンプルから決定することができる。そのために、ある数の再構成された隣接サンプル(またはサンプルのテンプレート)を考慮することができる。
別の実施形態によれば、イントラ予測モードを導出するためのテクスチャ解析法を、デコーダ側イントラモード導出(DIMD)法、テンプレートマッチングベースの(TMベースの)方法、イントラブロックコピー(IBC)法などのうちの1つまたは複数の方法とすることができる。
隣接サンプルからのモード導出はCCLMモードの方向を考慮することができる。例えば、CCLMモードが上隣接サンプルだけを使用する場合には、上隣接サンプルだけに従ってモードを導出することができ、またはその逆も同様である。
導出されたモードが、再構成された隣接サンプルによって達成される場合には、CCLMモードを用いて結合する対応する隣接サンプルに基づいて、チャネルごとに1つのモードを導出することができる。あるいは、導出されたモードを、両方のクロマチャネルに対して共通とすることもでき、導出されたモードは、一方または両方のチャネルの再構成された隣接サンプルに従って導出することができる。
以前のケースのジョイント予測と同様に、隣接サンプルのテクスチャ解析から達成された導出されたモードを一方のチャネルに適用することができ、もう一方のチャネルは、CCLMモードだけを用いて予測することができる。代替として、ジョイント予測を一方のチャネルだけに適用し、もう一方のチャネルは、CCLMだけまたは導出されたモードだけに基づいて予測することもできる。
2つの予測を結合するための重み値は、再構成された隣接サンプルのテクスチャ解析に基づいて決定することができる。例えば、DIMDモードを用いて導出されたイントラ予測モードは、それぞれのモードの導出プロセスにおいてある重みを含む。導出されたモードおよびCCLMモードの重み決定に対して、これらの重みまたはこれらの重みのある種のマッピングを考慮することができる。
別の実施形態によれば、導出されたモードとCCLMモードの一方または両方に基づいて、変換選択(多重変換選択(MTS)、低周波非分離変換(LFNST)など)、またはLFNSTにおける変換のインデックスを決定することができる。
本発明の実施形態は2つの予測を結合することだけに限定されないことを理解する必要がある。最終的な予測は、3つ以上の予測を結合することによって達成することができる。例えば、最終的な予測は、1つまたは複数のCCLMモードおよび1つまたは複数の導出されたモードを用いて計算することができる。
一実施形態による方法が図9の流れ図に示されている。この方法は一般に、符号化するピクチャを受け取ること910、カレントチャネルのピクチャのブロックの内側のサンプルに対して少なくとも1つの予測を第1の予測モードに従って実行すること920、参照チャネルの符号化された少なくとも1つのブロックからイントラ予測モードを導出すること930、ピクチャのブロックの内側のサンプルに対して少なくとも1つの他の予測を、導出されたイントラ予測モードに従って実行すること940、ならびに重みを付けた前記少なくとも1つの第1の予測および前記少なくとも1つの第2の予測に基づいてブロックの最終的な予測を決定すること950を含む。これらのステップの各々は、コンピュータシステムの対応するそれぞれのモジュールによって実施することができる。
実施形態による装置は、符号化するピクチャを受け取る手段と、カレントチャネルのピクチャのブロックの内側のサンプルに対して少なくとも1つの予測を第1の予測モードに従って実行する手段と、参照チャネルの符号化された少なくとも1つのブロックからイントラ予測モードを導出する手段と、ピクチャのブロックの内側のサンプルに対して少なくとも1つの他の予測を、導出されたイントラ予測モードに従って実行する手段と、重みを付けた前記少なくとも1つの第1の予測および前記少なくとも1つの第2の予測に基づいてブロックの最終的な予測を決定する手段とを備える。これらの手段は、少なくとも1つのプロセッサと、コンピュータプログラムコードを含むメモリとを備え、プロセッサはさらにプロセッサ回路を備えることができる。メモリおよびコンピュータプログラムコードは、少なくとも1つのプロセッサとともに、図9の方法を、さまざまな実施形態に従って、この装置に実行させるように構成されている。
装置の例が図10に示されている。この装置の一般化された構造を、このシステムの機能ブロックに従って説明する。いくつかの機能を単一の物理装置によって実行することができる。例えば、希望する場合には、全ての計算手順を単一のプロセッサで実行することができる。
図10の例による装置のデータ処理システムは、主処理ユニット100、メモリ102、記憶装置104、入力装置106、出力装置108およびグラフィクスサブシステム110を備え、これらはデータバス112を介して互いに接続されている。主処理ユニット100は、このデータ処理システム内でデータを処理するために配置された処理ユニットである。主処理ユニット100は、1つもしくは複数のプロセッサもしくはプロセッサ回路を備えることができ、または1つもしくは複数のプロセッサもしくはプロセッサ回路として実装することができる。メモリ102、記憶装置104、入力装置106および出力装置108は、当業者が知る他の構成要素を含むことができる。メモリ102および記憶装置104は、データ処理システム100内にデータを記憶する。メモリ102内にはコンピュータプログラムコード、例えばニューラルネットワークトレーニングまたは他の機械学習プロセスを実施するためのコンピュータプログラムコードが存在する。入力装置106はシステムにデータを入力し、出力装置108は、データ処理システムからデータを受け取り、そのデータを例えばディスプレイに転送する。データバス112は単一の線として示されているが、プロセッサバス、PCIバス、グラフィカルバス、ISAバスの任意の組合せとすることができる。したがって、この装置は、コンピュータ装置、パーソナルコンピュータ、サーバコンピュータ、移動電話、スマートホンまたはインターネットアクセス装置、例えばインターネットテーブルコンピュータなどの任意のデータ処理装置とすることができることを当業者は容易に理解する。
メモリ内に存在し、関連装置にこの方法を実行させるコンピュータプログラムコードの助けを借りて、さまざまな実施形態を実施することができる。例えば、装置は、データを処理、受信および送信するための回路および電子部品と、メモリ内のコンピュータプログラムコードと、コンピュータプログラムコードを実行したときに装置に実施形態の特徴を実行させるプロセッサとを備えることができる。さらに、サーバのようなネットワーク装置は、データを処理、受信および送信するための回路および電子部品と、メモリ内のコンピュータプログラムコードと、コンピュータプログラムコードを実行したときにネットワーク装置に実施形態の特徴を実行させるプロセッサとを備えることができる。コンピュータプログラムコードは1つまたは複数の動作特性を含む。前記動作特性は、前記プロセッサのタイプに基づく前記コンピュータによる構成によって規定されており、バスによって前記プロセッサにシステムを接続することができ、そのシステムのプログラム可能な動作特性は、さまざまな実施形態に従って方法を実施するためのものである。
非一過性コンピュータ可読媒体上に、一実施形態によるコンピュータプログラム製品を実装することができる。別の実施形態によれば、このコンピュータプログラム製品をネットワークを介してデータパケットの形態でダウンロードすることができる。
希望する場合には、本明細書で論じたさまざまな機能を、異なる順序でおよび/または他の機能と同時に実行することができる。さらに、希望する場合には、上述の機能および実施形態の1つもしくは複数を任意選択とすることができ、または組み合わせることができる。
独立請求項には実施形態のさまざまな態様が記載されているが、他の態様は、記載された実施形態および/または従属請求項の特徴と独立請求項の特徴との他の組合せを含み、特許請求の範囲に明示的に記載された組合せだけに限定されない。
以上では例示的な実施形態を説明したが、それらの説明を限定を意味するものと解釈すべきではないことにも留意されたい。むしろ、添付の特許請求の範囲に定義された本開示の範囲を逸脱することなく実施することができるいくつかの変形および変更が存在する。

Claims (28)

  1. - 符号化するピクチャを受け取ること、
    - カレントチャネルの前記ピクチャのブロックの内側のサンプルに対して少なくとも1つの予測を第1の予測モードに従って実行すること、
    - 参照チャネルの符号化された少なくとも1つのブロックからイントラ予測モードを導出すること、
    - 前記ピクチャの前記ブロックの内側の前記サンプルに対して少なくとも1つの他の予測を、導出された前記イントラ予測モードに従って実行すること、ならびに
    - 重みを付けた前記少なくとも1つの第1の予測および前記少なくとも1つの第2の予測に基づいて前記ブロックの最終的な予測を決定すること
    を含む方法。
  2. 前記第1の予測モードが交差成分線形モードである、請求項1に記載の方法。
  3. 導出された前記イントラ予測モードが、前記カレントチャネルとは異なるチャネルの少なくとも1つの同一位置ブロックから導出される、請求項1に記載の方法。
  4. 導出された前記イントラ予測モードが、前記カレントチャネルの少なくとも1つの隣接ブロックから導出される、請求項1に記載の方法。
  5. 導出された前記イントラ予測モードが、前記カレントチャネルの再構成された隣接サンプルからテクスチャ解析法に基づいて決定される、請求項1に記載の方法。
  6. 前記テクスチャ解析法が、デコーダ側イントラモード導出法、テンプレートマッチングに基づく方法、イントラブロックコピー法のうちの1つである、請求項5に記載の方法。
  7. 前記隣接サンプルからの前記決定が前記第1の予測の方向を考慮する、請求項5に記載の方法。
  8. 最終的な予測が、前記ブロックの全サンプルに対する一定の等しい重みを用いた、結合された第1および第2の予測を含む、請求項1に記載の方法。
  9. 最終的な予測が、前記ブロックの全サンプルに対する一定の等しくない重みを用いた、結合された第1および第2の予測を含む、請求項1に記載の方法。
  10. 最終的な予測が、予測されたそれぞれのサンプルの重みが互いに異なる、等しいまたは等しくないサンプルごとの重み付けを用いた、結合された第1および第2の予測を含む、請求項1に記載の方法。
  11. 前記サンプルの重み値を、導出されたイントラ予測モードの予測方向またはモード識別子に基づいて決定することをさらに含む、請求項1に記載の方法。
  12. 前記サンプルの重み値を、交差成分線形モードの予測方向、参照サンプルの位置またはモード識別子に基づいて決定することをさらに含む、請求項1に記載の方法。
  13. 前記サンプルの重み値を、交差成分線形モードおよび導出された予測モードの予測方向、参照サンプルの位置またはモード識別子に基づいて決定することをさらに含む、請求項1に記載の方法。
  14. 前記サンプルの重み値を、前記ブロックのサイズに基づいて決定することをさらに含む、請求項1に記載の方法。
  15. 少なくとも1つのプロセッサと、コンピュータプログラムコードを含むメモリとを備える装置であって、前記メモリおよび前記コンピュータプログラムコードが、前記少なくとも1つのプロセッサとともに、少なくとも、
    - 符号化するピクチャを受け取ること、
    - カレントチャネルの前記ピクチャのブロックの内側のサンプルに対して少なくとも1つの予測を第1の予測モードに従って実行すること、
    - 参照チャネルの符号化された少なくとも1つのブロックからイントラ予測モードを導出すること、
    - 前記ピクチャの前記ブロックの内側の前記サンプルに対して少なくとも1つの他の予測を、導出された前記イントラ予測モードに従って実行すること、ならびに
    - 重みを付けた前記少なくとも1つの第1の予測および前記少なくとも1つの第2の予測に基づいて前記ブロックの最終的な予測を決定すること
    を前記装置に実行させるように構成されている、装置。
  16. 前記第1の予測モードが交差成分線形モードで実行される、請求項15に記載の装置。
  17. 導出された前記イントラ予測モードが、前記カレントチャネルとは異なるチャネルの少なくとも1つの同一位置ブロックから導出される、請求項15に記載の装置。
  18. 導出された前記イントラ予測モードが、前記カレントチャネルの少なくとも1つの隣接ブロックから導出される、請求項15に記載の装置。
  19. 導出された前記イントラ予測モードが、前記カレントチャネルの再構成された隣接サンプルからテクスチャ解析法に基づいて決定される、請求項15に記載の装置。
  20. 前記テクスチャ解析法が、デコーダ側イントラモード導出法、テンプレートマッチングに基づく方法、イントラブロックコピー法のうちの1つである、請求項19に記載の装置。
  21. 前記隣接サンプルからの前記決定が前記第1の予測の方向を考慮する、請求項19に記載の装置。
  22. 最終的な予測が、前記ブロックの全サンプルに対する一定の等しい重みを用いた、結合された第1および第2の予測を含む、請求項15に記載の装置。
  23. 最終的な予測が、前記ブロックの全サンプルに対する一定の等しくない重みを用いた、結合された第1および第2の予測を含む、請求項15に記載の装置。
  24. 最終的な予測が、予測されたそれぞれのサンプルの重みが互いに異なる、等しいまたは等しくないサンプルごとの重み付けを用いた、結合された第1および第2の予測を含む、請求項15に記載の装置。
  25. 前記サンプルの重み値を、導出されたイントラ予測モードの予測方向またはモード識別子に基づいて決定することをさらに実行する、請求項15に記載の装置。
  26. 前記サンプルの重み値を、交差成分線形モードの予測方向、参照サンプルの位置またはモード識別子に基づいて決定することをさらに実行する、請求項15に記載の装置。
  27. 前記サンプルの重み値を、交差成分線形モードおよび導出された予測モードの予測方向、参照サンプルの位置またはモード識別子に基づいて決定することをさらに実行する、請求項15に記載の装置。
  28. 前記サンプルの重み値を、前記ブロックのサイズに基づいて決定することをさらに実行する、請求項15に記載の装置。
JP2022574519A 2020-06-03 2021-05-27 映像符号化および映像復号のための方法、装置およびコンピュータプログラム製品 Pending JP2023527920A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063034120P 2020-06-03 2020-06-03
US63/034,120 2020-06-03
PCT/EP2021/064190 WO2021244935A1 (en) 2020-06-03 2021-05-27 A method, an apparatus and a computer program product for video encoding and video decoding

Publications (1)

Publication Number Publication Date
JP2023527920A true JP2023527920A (ja) 2023-06-30

Family

ID=76269730

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022574519A Pending JP2023527920A (ja) 2020-06-03 2021-05-27 映像符号化および映像復号のための方法、装置およびコンピュータプログラム製品

Country Status (6)

Country Link
US (1) US20230262223A1 (ja)
EP (1) EP4162688A1 (ja)
JP (1) JP2023527920A (ja)
CN (1) CN115804093A (ja)
CA (1) CA3177794A1 (ja)
WO (1) WO2021244935A1 (ja)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023116716A1 (en) * 2021-12-21 2023-06-29 Mediatek Inc. Method and apparatus for cross component linear model for inter prediction in video coding system
WO2023123495A1 (zh) * 2021-12-31 2023-07-06 Oppo广东移动通信有限公司 预测方法、装置、设备、***、及存储介质
WO2023132622A1 (ko) * 2022-01-04 2023-07-13 엘지전자 주식회사 Dimd 모드 기반 인트라 예측 방법 및 장치
WO2023141970A1 (zh) * 2022-01-28 2023-08-03 Oppo广东移动通信有限公司 解码方法、编码方法、解码器、编码器和编解码***
WO2023192336A1 (en) * 2022-03-28 2023-10-05 Beijing Dajia Internet Information Technology Co., Ltd. Methods and devices for high precision intra prediction
EP4258668A1 (en) * 2022-04-07 2023-10-11 Beijing Xiaomi Mobile Software Co., Ltd. Method and apparatus for dimd region-wise adaptive blending, and encoder/decoder including the same
EP4258662A1 (en) * 2022-04-07 2023-10-11 Beijing Xiaomi Mobile Software Co., Ltd. Method and apparatus for dimd edge detection adjustment, and encoder/decoder including the same
WO2023200560A1 (en) * 2022-04-13 2023-10-19 Qualcomm Incorporated Intra chroma mode list construction for video coding
WO2023212254A1 (en) * 2022-04-27 2023-11-02 Beijing Dajia Internet Information Technology Co., Ltd. Methods and devices for high precision intra prediction
WO2023241347A1 (en) * 2022-06-13 2023-12-21 Mediatek Inc. Adaptive regions for decoder-side intra mode derivation and prediction
WO2023241637A1 (en) * 2022-06-15 2023-12-21 Mediatek Inc. Method and apparatus for cross component prediction with blending in video coding systems
WO2024003441A1 (en) * 2022-06-29 2024-01-04 Nokia Technologies Oy An apparatus, a method and a computer program for video coding and decoding
WO2024008993A1 (en) * 2022-07-05 2024-01-11 Nokia Technologies Oy An apparatus, a method and a computer program for video coding and decoding
WO2024007825A1 (en) * 2022-07-07 2024-01-11 Mediatek Inc. Method and apparatus of explicit mode blending in video coding systems
WO2024025370A1 (ko) * 2022-07-28 2024-02-01 현대자동차주식회사 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
WO2024074129A1 (en) * 2022-10-07 2024-04-11 Mediatek Inc. Method and apparatus of inheriting temporal neighbouring model parameters in video coding system
WO2024079185A1 (en) * 2022-10-11 2024-04-18 Interdigital Ce Patent Holdings, Sas Equivalent intra mode for non-intra predicted coding blocks
WO2024079381A1 (en) * 2022-10-13 2024-04-18 Nokia Technologies Oy An apparatus, a method and a computer program for video coding and decoding
WO2024127909A1 (en) * 2022-12-16 2024-06-20 Sharp Kabushiki Kaisha Prediction image generation apparatus, video decoding apparatus, video coding apparatus, and prediction image generation method

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018236031A1 (ko) * 2017-06-21 2018-12-27 엘지전자(주) 인트라 예측 모드 기반 영상 처리 방법 및 이를 위한 장치

Also Published As

Publication number Publication date
US20230262223A1 (en) 2023-08-17
CN115804093A (zh) 2023-03-14
CA3177794A1 (en) 2021-12-09
EP4162688A1 (en) 2023-04-12
WO2021244935A1 (en) 2021-12-09

Similar Documents

Publication Publication Date Title
JP2023527920A (ja) 映像符号化および映像復号のための方法、装置およびコンピュータプログラム製品
CN113853783B (zh) 对帧内块复制编解码的块的块矢量的编解码
JP6535673B2 (ja) 非対称動き分割を使用するビデオコーディング技法
JP6185143B2 (ja) スキップおよびダイレクトモード用の3dビデオコーディングにおける視差ベクトル導出
AU2023214363B2 (en) Method and apparatus for video encoding or decoding
JP2019519982A (ja) ビデオコーディングにおける適応ループフィルタ処理における複数のフィルタの混同
CN113924783A (zh) 用于视频编解码的组合式帧内和帧内块复制预测
CN110868589B (zh) 帧间预测方法、装置及其应用的编/解方法及装置
JP6545796B2 (ja) ビデオコーディングにおけるデプスピクチャコーディング方法及び装置
CN115152227A (zh) 并行处理的选择性切换
CN112005551A (zh) 一种视频图像预测方法及装置
CN114175636A (zh) 自适应参数集中的自适应环路滤波的指示
CN113966616B (zh) 使用临近块信息的运动候选列表构建
KR20140048784A (ko) 제한적 깊이정보값을 공유하여 움직임 정보를 유도하는 방법 및 장치
KR20220016840A (ko) 비디오 코딩을 위한 움직임 후보 리스트 구성
JP2023159091A (ja) イントラブロックコピーのコーディングおよび復号化
WO2019204386A1 (en) Line buffer for spatial motion vector predictor candidates
CN113966612A (zh) 屏幕内容编解码根据与运动信息之间的相互作用
CN110944184B (zh) 视频解码方法及视频解码器
CN110958452B (zh) 视频解码方法及视频解码器
CN111010565A (zh) 帧间预测方法、装置及其应用的编/解方法及装置
WO2024146712A1 (en) A method, an apparatus and a computer program product for video encoding and decoding
US20220141462A1 (en) Apparatus and method for applying artificial neural network to image encoding or decoding
WO2024069040A1 (en) A method, an apparatus and a computer program product for video encoding and decoding
WO2020042990A1 (zh) 帧间预测方法、装置及其应用的编/解方法及装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221202

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221202

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20231222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240201

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20240430

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240509