JP2020510374A - 映像コーディングシステムにおける変換方法及びその装置 - Google Patents

映像コーディングシステムにおける変換方法及びその装置 Download PDF

Info

Publication number
JP2020510374A
JP2020510374A JP2019552254A JP2019552254A JP2020510374A JP 2020510374 A JP2020510374 A JP 2020510374A JP 2019552254 A JP2019552254 A JP 2019552254A JP 2019552254 A JP2019552254 A JP 2019552254A JP 2020510374 A JP2020510374 A JP 2020510374A
Authority
JP
Japan
Prior art keywords
nsst
transform
kernel
block
target block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019552254A
Other languages
English (en)
Inventor
スンファン キム
スンファン キム
ヒョンムン チャン
ヒョンムン チャン
チェヒョン イム
チェヒョン イム
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of JP2020510374A publication Critical patent/JP2020510374A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】映像コーディング効率を上げる方法及び装置を提供する。【解決手段】本発明による変換方法は、対象ブロックに対する変換係数を取得するステップ、対象ブロックに対する非分離2次変換(NSST)セットを決定するステップ、NSSTインデックスに基づいてNSSTセットに含まれている多数のNSSTカーネルの中から一つを選択するステップ、及び選択されたNSSTカーネルに基づいて変換係数を非分離2次変換して修正された変換係数を生成するステップを含み、対象ブロックに対するNSSTセットは、イントラ予測モード及び対象ブロックのサイズのうち少なくとも一つに基づいて決定されることを特徴とする。本発明によると、レジデュアル処理に必要な送信されるデータ量を減らすことができ、レジデュアルコーディング効率を上げることができる。【選択図】図3

Description

本発明は、映像コーディング技術に関し、より詳しくは、映像コーディングシステムにおける変換(transform)方法及びその装置に関する。
最近、HD(High Definition)画像及びUHD(Ultra High Definition)画像のような高解像度、高品質の画像に対する需要が多様な分野で増加している。画像データが高解像度、高品質になるほど、既存の画像データに比べて相対的に送信される情報量又はビット量が増加するため、既存の有無線広帯域回線のような媒体を利用して画像データを送信するか、又は既存の格納媒体を利用して画像データを格納する場合、送信費用と格納費用が増加する。
これによって、高解像度、高品質画像の情報を効果的に送信又は格納し、再生するために高効率の画像圧縮技術が要求される。
本発明の技術的課題は、映像コーディング効率を上げる方法及び装置を提供することにある。
本発明の他の技術的課題は、変換効率を上げる方法及び装置を提供することにある。
本発明の他の技術的課題は、多重変換に基づいてレジデュアルコーディングの効率を上げる方法及び装置を提供することにある。
本発明の他の技術的課題は、非分離2次変換(non−seperable secondary transform)方法及び装置を提供することにある。
本発明の一実施例によると、デコーディング装置により実行される変換方法が提供される。前記方法は、対象ブロックに対する変換係数を取得するステップ、前記対象ブロックに対する非分離2次変換(non−seperable secondary transform、NSST)セットを決定するステップ、NSSTインデックスに基づいて前記NSSTセットに含まれている多数のNSSTカーネルの中から一つを選択するステップ、及び前記選択されたNSSTカーネルに基づいて前記変換係数を非分離2次変換して修正された(modified)変換係数を生成するステップを含み、前記対象ブロックに対するNSSTセットは、イントラ予測モード及び前記対象ブロックのサイズのうち少なくとも一つに基づいて決定されることを特徴とする。
本発明の他の一実施例によると、変換を実行するデコーディング装置が提供される。前記デコーディング装置は、対象ブロックの量子化された変換係数に逆量子化を実行して前記対象ブロックに対する変換係数を取得する逆量子化部、及び前記対象ブロックに対する非分離2次変換(non−seperable secondary transform、NSST)セットを決定し、NSSTインデックスに基づいて前記NSSTセットに含まれている多数のNSSTカーネルの中から一つを選択し、及び前記選択されたNSSTカーネルに基づいて前記変換係数を非分離2次変換して修正された(modified)変換係数を生成する逆変換部を含み、前記逆変換部は、イントラ予測モード及び前記対象ブロックのサイズのうち少なくとも一つに基づいて前記対象ブロックに対するNSSTセットを決定することを特徴とする。
本発明の他の一実施例によると、エンコーディング装置により実行される変換方法が提供される。前記方法は、対象ブロックに対する変換係数を取得するステップ、前記対象ブロックに対する非分離2次変換(non−seperable secondary transform、NSST)セットを決定するステップ、前記NSSTセットに含まれている多数のNSSTカーネルの中から一つを選択してNSSTインデックスを設定するステップ、及び前記選択されたNSSTカーネルに基づいて前記変換係数を非分離2次変換して修正された(modified)変換係数を生成するステップを含み、前記対象ブロックに対するNSSTセットは、イントラ予測モード及び前記対象ブロックのサイズのうち少なくとも一つに基づいて決定されることを特徴とする。
本発明の他の一実施例によると、変換を実行するエンコーディング装置が提供される。前記エンコーディング装置は、対象ブロックのレジデュアルサンプルに1次変換を実行して前記対象ブロックに対する変換係数を取得し、前記対象ブロックに対する非分離2次変換(non−seperable secondary transform、NSST)セットを決定し、NSSTインデックスに基づいて前記NSSTセットに含まれている多数のNSSTカーネルの中から一つを選択し、及び前記選択されたNSSTカーネルに基づいて前記変換係数を非分離2次変換して修正された(modified)変換係数を生成する変換部を含み、前記変換部は、イントラ予測モード及び前記対象ブロックのサイズのうち少なくとも一つに基づいて前記対象ブロックに対するNSSTセットを決定することを特徴とする。
本発明によると、全般的な映像/ビデオ圧縮効率を上げることができる。
本発明によると、効率的な変換を介してレジデュアル処理に必要な送信されるデータ量を減らすことができ、レジデュアルコーディング効率を上げることができる。
本発明によると、周波数ドメインでの2次変換を介して0でない変換係数を低周波成分に集中させることができる。
本発明によると、非分離2次変換を実行するにあたって変換カーネルを可変的/適応的に適用して変換効率を上げることができる。
本発明が適用されることができるビデオエンコーディング装置の構成を概略的に説明する図面である。 本発明が適用されることができるビデオデコーディング装置の構成を概略的に説明する図面である。 本発明による多重変換技法を概略的に示す。 65個の予測方向のイントラ方向性モードを例示的に示す。 イントラ予測モード及びブロックサイズに基づいてNSSTセットを決定する方法を例示的に示す。 本発明による変換方法を含むビデオ/映像エンコーディング方法の一例を概略的に示す。 本発明による変換方法を含むビデオ/映像デコーディング方法の一例を概略的に示す。
本発明は、多様な変更を加えることができ、様々な実施例を有することができ、特定の実施例を図面に例示して詳細に説明する。しかし、これは本発明を特定の実施例に限定するものではない。本明細書で使用する用語は、単に特定の実施例を説明するために使われたものであり、本発明の技術的思想を限定しようとする意図に使われるものではない。単数の表現は、文脈上明白に異なる意味ではない限り、複数の表現を含む。本明細書において、“含む”又は“有する”などの用語は、明細書上に記載された特徴、数字、ステップ、動作、構成要素、部品又はそれらを組み合わせたものが存在することを指定するものであり、一つ又はそれ以上の他の特徴や数字、ステップ、動作、構成要素、部品又はそれらを組み合わせたものの存在又は付加の可能性を予め排除しないと理解しなければならない。
一方、本発明で説明される図面上の各構成は、互いに異なる特徴的な機能に対する説明の便宜のために独立して図示されたものであり、各構成が互いに別個のハードウェアや別個のソフトウェアで具現されるということを意味しない。例えば、各構成のうち二つ以上の構成が合わせて一つの構成をなすこともあり、一つの構成が複数の構成に分けられることもある。各構成が統合及び/又は分離された実施例も、本発明の本質から外れない限り、本発明の権利範囲に含まれる。
以下、添付図面を参照し、本発明の好ましい実施例をより詳細に説明する。以下、図面上の同一の構成要素については同一の参照符号を使用し、同一の構成要素について重複説明は省略する。
本明細書で、ピクチャ(picture)は、一般的に特定時間帯の一つの画像を示す単位を意味し、スライス(slice)は、コーディングにおいてピクチャの一部を構成する単位である。一つのピクチャは複数のスライスで構成されてもよく、必要に応じて、ピクチャ及びスライスは互いに混用して用いられてもよい。
ピクセル(pixel)又はペル(pel)は、一つのピクチャ(又は画像)を構成する最小の単位を意味することができる。また、ピクセルに対応する用語として「サンプル(sample)」が使用されることができる。サンプルは、一般的にピクセル又はピクセルの値を示し、輝度(ルマ)成分のピクセル/ピクセルの値のみを示してもよく、彩度(クロマ)成分のピクセル/ピクセルの値のみを示してもよい。
ユニット(unit)は、画像処理の基本単位を示す。ユニットは、ピクチャの特定領域及び該当領域に対する情報のうち少なくとも一つを含むことができる。ユニットは、場合によってブロック(block)又は領域(area)などの用語と混用して用いられてもよい。一般的な場合、MxNのブロックは、M個の列とN個の行からなるサンプル又は変換係数(transform coefficient)の集合を示すことができる。
図1は、本発明が適用されることができるビデオエンコーディング装置(video encoding apparatus)の構成を概略的に説明する図面である。
図1を参照すると、ビデオエンコーディング装置100は、ピクチャ分割部(picture partitioning module)105、予測部(prediction module)110、レジデュアル処理部(residual processing module)120、エントロピーエンコーディング部(entropy encoding module)130、加算部(adder)140、フィルタ部(filtering module)150、及びメモリ(memory)160を含むことができる。レジデュアル処理部120は、減算部(substractor)121、変換部(transform module)122、量子化部(quantization module)123、再整列部(rearrangement module)124、逆量子化部(dequantization module)125、及び逆変換部(inverse transform module)126を含むことができる。
ピクチャ分割部105は、入力されたピクチャを少なくとも一つの処理ユニット(processing unit)に分割できる。
一例として、処理ユニットは、コーディングユニット(coding unit、CU)と呼ばれる。この場合、コーディングユニットは、最大コーディングユニット(largest coding unit、LCU)からQTBT(Quad−tree binary−tree)構造によって再帰的に(recursively)分割されることができる。例えば、一つのコーディングユニットは、クアッドツリー構造及び/またはバイナリツリー構造に基づいて下位(deeper)デプスの複数のコーディングユニットに分割されることができる。この場合、例えば、クアッドツリー構造が先に適用され、バイナリツリー構造が後に適用されることができる。または、バイナリツリー構造が先に適用されることもできる。それ以上分割されない最終コーディングユニットに基づいて、本発明によるコーディング手順が実行されることができる。この場合、映像特性によるコーディング効率などに基づいて、最大コーディングユニットが最終コーディングユニットとして使われることができ、または、必要によって、コーディングユニットは、再帰的に(recursively)もっと下位デプスのコーディングユニットに分割されて最適のサイズのコーディングユニットが最終コーディングユニットとして使われることができる。ここで、コーディング手順とは、後述する予測、変換、及び復元などの手順を含むことができる。
他の例として、処理ユニットは、コーディングユニット(coding unit、CU)、予測ユニット(prediction unit、PU)または変換ユニット(transform unit、TU)を含むこともできる。コーディングユニットは、最大コーディングユニット(largest coding unit、LCU)からクアッドツリー構造によって下位(deeper)デプスのコーディングユニットに分割(split)されることができる。この場合、映像特性によるコーディング効率などに基づいて、最大コーディングユニットが最終コーディングユニットとして使われることができ、または、必要によって、コーディングユニットは、再帰的に(recursively)もっと下位デプスのコーディングユニットに分割されて最適のサイズのコーディングユニットが最終コーディングユニットとして使われることができる。最小コーディングユニット(smallest coding unit、SCU)が設定された場合、コーディングユニットは、最小コーディングユニットより小さいコーディングユニットに分割されることができない。ここで、最終コーディングユニットとは、予測ユニットまたは変換ユニットにパーティショニングまたは分割の基盤となるコーディングユニットを意味する。予測ユニットは、コーディングユニットからパーティショニング(partitioning)されるユニットであって、サンプル予測のユニットである。このとき、予測ユニットは、サブブロック(subblock)に分けられることもできる。変換ユニットは、コーディングユニットからクアッドツリー構造によって分割されることができ、変換係数を誘導するユニット及び/または変換係数からレジデュアル信号(residual signal)を誘導するユニットである。以下、コーディングユニットはコーディングブロック(coding block、CB)、予測ユニットは予測ブロック(prediction block、PB)、変換ユニットは変換ブロック(transform block、TB)とも呼ばれる。予測ブロックまたは予測ユニットは、ピクチャ内でブロック形態の特定領域を意味し、予測サンプルのアレイ(array)を含むことができる。また、変換ブロックまたは変換ユニットは、ピクチャ内でブロック形態の特定領域を意味し、変換係数またはレジデュアルサンプルのアレイを含むことができる。
予測部110は、処理対象ブロック(以下、現在ブロックという)に対する予測を実行し、前記現在ブロックに対する予測サンプルを含む予測されたブロック(predicted block)を生成することができる。予測部110で実行される予測の単位は、コーディングブロック、または変換ブロック、または予測ブロックである。
予測部110は、現在ブロックにイントラ予測が適用されるか、またはインター予測が適用されるかを決定することができる。一例として、予測部110は、CU単位にイントラ予測またはインター予測が適用されるかを決定することができる。
イントラ予測の場合、予測部110は、現在ブロックが属するピクチャ(以下、現在ピクチャ)内の現在ブロック外部の参照サンプルに基づいて現在ブロックに対する予測サンプルを誘導することができる。このとき、予測部110は、(i)現在ブロックの隣接(neighboring)参照サンプルの平均(average)または補間(interpolation)に基づいて予測サンプルを誘導することができ、(ii)現在ブロックの隣接参照サンプルのうち、予測サンプルに対して特定(予測)方向に存在する参照サンプルに基づいて前記予測サンプルを誘導することもできる。(i)の場合は非方向性モードまたは非角度モードと呼ばれ、(ii)の場合は方向性(directional)モードまたは角度(angular)モードと呼ばれる。イントラ予測における予測モードは、例えば、33個の方向性予測モードと少なくとも2個以上の非方向性モードを有することができる。非方向性モードは、DC予測モード及びプラナーモード(Planarモード)を含むことができる。予測部110は、隣接ブロックに適用された予測モードを利用し、現在ブロックに適用される予測モードを決定することもできる。
インター予測の場合、予測部110は、参照ピクチャ上で動きベクトルにより特定されるサンプルに基づいて、現在ブロックに対する予測サンプルを誘導することができる。予測部110は、スキップ(skip)モード、マージ(merge)モード、及びMVP(motion vector prediction)モードのうちいずれか一つを適用して現在ブロックに対する予測サンプルを誘導することができる。スキップモードとマージモードの場合、予測部110は、隣接ブロックの動き情報を現在ブロックの動き情報として利用できる。スキップモードの場合、マージモードと違って予測サンプルと原本サンプルとの間の差(レジデュアル)が送信されない。MVPモードの場合、隣接ブロックの動きベクトルを動きベクトル予測子(Motion Vector Predictor)として利用して現在ブロックの動きベクトル予測子として利用して現在ブロックの動きベクトルを誘導することができる。
インター予測の場合、隣接ブロックは、現在ピクチャ内に存在する空間的隣接ブロック(spatial neighboring block)と参照ピクチャ(reference picture)に存在する時間的隣接ブロック(temporal neighboring block)を含むことができる。前記時間的隣接ブロックを含む参照ピクチャは、同一位置ピクチャ(collocated picture、colPic)とも呼ばれる。動き情報(motion information)は、動きベクトルと参照ピクチャインデックスを含むことができる。予測モード情報と動き情報などの情報は、(エントロピー)エンコーディングされてビットストリーム形態で出力されることができる。
スキップモードとマージモードで時間的隣接ブロックの動き情報が利用される場合、参照ピクチャリスト(reference picture list)上の最上位ピクチャが参照ピクチャとして利用されることもできる。参照ピクチャリスト(Picture Order Count)に含まれる参照ピクチャは、現在ピクチャと該当参照ピクチャとの間のPOC(Picture order count)差に基づいて整列されることができる。POCは、ピクチャのディスプレイ順序に対応し、コーディング順序と区分されることができる。
減算部121は、原本サンプルと予測サンプルとの間の差であるレジデュアルサンプルを生成する。スキップモードが適用される場合には、前述したようにレジデュアルサンプルを生成しない。
変換部122は、変換ブロック単位にレジデュアルサンプルを変換して変換係数(transform coefficient)を生成する。変換部122は、該当変換ブロックのサイズと、該当変換ブロックと空間的に重なるコーディングブロックまたは予測ブロックに適用された予測モードによって変換を実行することができる。例えば、前記変換ブロックと重なる前記コーディングブロックまたは前記予測ブロックにイントラ予測が適用され、前記変換ブロックが4×4のレジデュアルアレイ(array)である場合、レジデュアルサンプルは、DST(Discrete Sine Transform)変換カーネルを利用して変換され、その他の場合、レジデュアルサンプルは、DCT(Discrete Cosine Transform)変換カーネルを利用して変換できる。
量子化部123は、変換係数を量子化し、量子化された変換係数を生成することができる。
再整列部124は、量子化された変換係数を再整列する。再整列部124は、係数スキャニング(scanning)方法を介してブロック形態の量子化された変換係数を1次元ベクトル形態で再整列できる。ここで、再整列部124は、別途の構成で説明したが、量子化部123の一部であってもよい。
エントロピーエンコーディング部130は、量子化された変換係数に対するエントロピーエンコーディングを実行することができる。エントロピーエンコーディングは、例えば、指数ゴロム(exponential Golomb)、CAVLC(context−adaptive variable length coding)、CABAC(context−adaptive binary arithmetic coding)などのようなエンコーディング方法を含むことができる。エントロピーエンコーディング部130は、量子化された変換係数外にビデオ復元に必要な情報(例えば、シンタックス要素(syntax element)の値等)を共にまたは別途にエントロピーエンコーディングまたは既設定された方法によってエンコーディングすることもできる。エンコーディングされた情報は、ビットストリーム形態でNAL(network abstraction layer)ユニット単位に送信または格納されることができる。
逆量子化部125は、量子化部123で量子化された値(量子化された変換係数)を逆量子化し、逆変換部126は、逆量子化部125で逆量子化された値を逆変換してレジデュアルサンプルを生成する。
加算部140は、レジデュアルサンプルと予測サンプルを加算してピクチャを復元する。レジデュアルサンプルと予測サンプルは、ブロック単位に加算されて復元ブロックが生成されることができる。ここで、加算部140は、別途の構成で説明したが、予測部110の一部であってもよい。一方、加算部140は、復元部(reconstruction module)または復元ブロック生成部とも呼ばれる。
復元されたピクチャ(reconstructed picture)に対してフィルタ部150は、デブロッキングフィルタ及び/またはサンプル適応的オフセット(sample adaptive offset)を適用することができる。デブロッキングフィルタリング及び/またはサンプル適応的オフセットを介して、復元ピクチャ内のブロック境界のアーチファクトや量子化過程での歪曲が補正されることができる。サンプル適応的オフセットは、サンプル単位に適用されることができ、デブロッキングフィルタリングの過程が完了した後に適用されることができる。フィルタ部150は、ALF(Adaptive Loop Filter)を復元されたピクチャに適用することもできる。ALFは、デブロッキングフィルタ及び/またはサンプル適応的オフセットが適用された後の復元されたピクチャに対して適用されることができる。
メモリ160は、復元ピクチャ(デコーディングされたピクチャ)またはエンコーディング/デコーディングに必要な情報を格納することができる。ここで、復元ピクチャは、前記フィルタ部150によりフィルタリング手順が完了した復元ピクチャである。前記格納された復元ピクチャは、他のピクチャの(インター)予測のための参照ピクチャとして活用されることができる。例えば、メモリ160は、インター予測に使われる(参照)ピクチャを格納することができる。このとき、インター予測に使われるピクチャは、参照ピクチャセット(reference picture set)または参照ピクチャリスト(reference picture list)により指定されることができる。
図2は、本発明が適用されることができるビデオデコーディング装置(video decoding apparatus)の構成を概略的に説明する図面である。
図2を参照すると、ビデオデコーディング装置200は、エントロピーデコーディング部(entropy decoding module)210、レジデュアル処理部(residual processing module)220、予測部(prediction module)230、加算部(adder)240、フィルタ部(filtering module)250、及びメモリ(memory)260を含むことができる。ここで、レジデュアル処理部220は、再整列部(rearrangement module)221、逆量子化部(dequantization module)222、逆変換部(inverse transform module)223を含むことができる。また、図示されていないが、ビデオデコーディング装置200は、ビデオ情報を含むビットストリームを受信する受信部を含むことができる。前記受信部は、別途のモジュールで構成されることもでき、またはエントロピーデコーディング部210に含まれることもできる。
ビデオ情報を含むビットストリームが入力されると、ビデオデコーディング装置200は、ビデオエンコーディング装置でビデオ情報が処理されたプロセスに対応してビデオを復元することができる。
例えば、ビデオデコーディング装置200は、ビデオエンコーディング装置で適用された処理ユニットを利用してビデオデコーディングを実行することができる。したがって、ビデオデコーディングの処理ユニットブロックは、一例としてコーディングユニットであり、他の例としてコーディングユニット、予測ユニットまたは変換ユニットである。コーディングユニットは、最大コーディングユニットからクアッドツリー構造及び/またはバイナリツリー構造によって分割されることができる。
予測ユニット及び変換ユニットが場合によってさらに使用されることができ、この場合、予測ブロックは、コーディングユニットから導出またはパーティショニングされるブロックであって、サンプル予測のユニットである。このとき、予測ユニットは、サブブロックに分けられることもできる。変換ユニットは、コーディングユニットからクアッドツリー構造によって分割されることができ、変換係数を誘導するユニットまたは変換係数からレジデュアル信号を誘導するユニットである。
エントロピーデコーディング部210は、ビットストリームをパーシングしてビデオ復元またはピクチャ復元に必要な情報を出力することができる。例えば、エントロピーデコーディング部210は、指数ゴロム符号化、CAVLCまたはCABACなどのコーディング方法に基づいてビットストリーム内の情報をデコーディングし、ビデオ復元に必要なシンタックスエレメントの値、レジデュアルに対する変換係数の量子化された値を出力することができる。
より詳細に、CABACエントロピーデコーディング方法は、ビットストリームで各シンタックス要素に該当するBINを受信し、デコーディング対象シンタックス要素情報と隣接及びデコーディング対象ブロックのデコーディング情報または以前ステップでデコーディングされたシンボル/BINの情報を利用してコンテキスト(context)モデルを決定し、決定されたコンテキストモデルによってBINの発生確率を予測してBINの算術デコーディング(arithmetic decoding)を実行することで、各シンタックス要素の値に該当するシンボルを生成することができる。このとき、CABACエントロピーデコーディング方法は、コンテキストモデル決定後、次のシンボル/BINのコンテキストモデルのためにデコーディングされたシンボル/BINの情報を利用してコンテキストモデルをアップデートすることができる。
エントロピーデコーディング部210でデコーディングされた情報のうち予測に対する情報は、予測部230に提供され、エントロピーデコーディング部210でエントロピーデコーディングが実行されたレジデュアル値、即ち、量子化された変換係数は、再整列部221に入力されることができる。
再整列部221は、量子化されている変換係数を2次元のブロック形態で再整列できる。再整列部221は、エンコーディング装置で実行された係数スキャニングに対応して再整列を実行することができる。ここで、再整列部221は、別途の構成で説明したが、逆量子化部222の一部であってもよい。
逆量子化部222は、量子化されている変換係数を(逆)量子化パラメータに基づいて逆量子化して変換係数を出力することができる。このとき、量子化パラメータを誘導するための情報は、エンコーディング装置からシグナリングされることができる。
逆変換部223は、変換係数を逆変換してレジデュアルサンプルを誘導することができる。
予測部230は、現在ブロックに対する予測を実行し、前記現在ブロックに対する予測サンプルを含む予測されたブロック(predicted block)を生成することができる。予測部230で実行される予測の単位は、コーディングブロック、または変換ブロック、または予測ブロックである。
予測部230は、前記予測に対する情報に基づいて、イントラ予測を適用するか、またはインター予測を適用するかを決定することができる。このとき、イントラ予測とインター予測のうちいずれかを適用するかを決定する単位と予測サンプルを生成する単位は異なる。併せて、インター予測とイントラ予測において、予測サンプルを生成する単位も異なる。例えば、インター予測とイントラ予測のうちいずれかを適用するかは、CU単位に決定できる。また、例えば、インター予測において、PU単位に予測モードを決定して予測サンプルを生成することができ、イントラ予測において、PU単位に予測モードを決定し、TU単位に予測サンプルを生成することもできる。
イントラ予測の場合、予測部230は、現在ピクチャ内の隣接参照サンプルに基づいて現在ブロックに対する予測サンプルを誘導することができる。予測部230は、現在ブロックの隣接参照サンプルに基づいて方向性モードまたは非方向性モードを適用して現在ブロックに対する予測サンプルを誘導することができる。このとき、隣接ブロックのイントラ予測モードを利用して現在ブロックに適用する予測モードが決定されることもできる。
インター予測の場合、予測部230は、参照ピクチャ上で動きベクトルにより参照ピクチャ上で特定されるサンプルに基づいて現在ブロックに対する予測サンプルを誘導することができる。予測部230は、スキップ(skip)モード、マージ(merge)モード、及びMVPモードのうちいずれか一つを適用して現在ブロックに対する予測サンプルを誘導することができる。このとき、ビデオエンコーディング装置で提供された現在ブロックのインター予測に必要な動き情報、例えば、動きベクトル、参照ピクチャインデックスなどに対する情報は、前記予測に対する情報に基づいて取得または誘導されることができる。
スキップモードとマージモードの場合、隣接ブロックの動き情報が現在ブロックの動き情報として利用されることができる。このとき、隣接ブロックは、空間的隣接ブロックと時間的隣接ブロックを含むことができる。
予測部230は、可用な隣接ブロックの動き情報でマージ候補リストを構成し、マージインデックスがマージ候補リスト上で指示する情報を現在ブロックの動きベクトルとして使用することができる。マージインデックスは、エンコーディング装置からシグナリングされることができる。動き情報は、動きベクトルと参照ピクチャを含むことができる。スキップモードとマージモードで時間的隣接ブロックの動き情報が利用される場合、参照ピクチャリスト上の最上位ピクチャが参照ピクチャとして利用されることができる。
スキップモードの場合、マージモードと違って予測サンプルと原本サンプルとの間の差(レジデュアル)が送信されない。
MVPモードの場合、隣接ブロックの動きベクトルを動きベクトル予測子(motion vector predictor)として利用して現在ブロックの動きベクトルが誘導されることができる。このとき、隣接ブロックは、空間的隣接ブロックと時間的隣接ブロックを含むことができる。
一例として、マージモードが適用される場合、復元された空間的隣接ブロックの動きベクトル及び/または時間的隣接ブロックであるColブロックに対応する動きベクトルを利用し、マージ候補リストが生成されることができる。マージモードではマージ候補リストから選択された候補ブロックの動きベクトルが現在ブロックの動きベクトルとして使われる。前記予測に対する情報は、前記マージ候補リストに含まれている候補ブロックの中から選択された最適の動きベクトルを有する候補ブロックを指示するマージインデックスを含むことができる。このとき、予測部230は、前記マージインデックスを利用し、現在ブロックの動きベクトルを導出することができる。
他の例として、MVP(Motion Vector Prediction)モードが適用される場合、復元された空間的隣接ブロックの動きベクトル及び/または時間的隣接ブロックであるColブロックに対応する動きベクトルを利用し、動きベクトル予測子候補リストが生成されることができる。即ち、復元された空間的隣接ブロックの動きベクトル及び/または時間的隣接ブロックであるColブロックに対応する動きベクトルは、動きベクトル候補として使われることができる。前記予測に対する情報は、前記リストに含まれている動きベクトル候補の中から選択された最適の動きベクトルを指示する予測動きベクトルインデックスを含むことができる。このとき、予測部230は、前記動きベクトルインデックスを利用し、動きベクトル候補リストに含まれている動きベクトル候補の中から、現在ブロックの予測動きベクトルを選択することができる。エンコーディング装置の予測部は、現在ブロックの動きベクトルと動きベクトル予測子との間の動きベクトル差分(MVD)を求めることができ、これをエンコーディングしてビットストリーム形態で出力できる。即ち、MVDは、現在ブロックの動きベクトルから前記動きベクトル予測子を引いた値として求められる。このとき、予測部230は、前記予測に対する情報に含まれている動きベクトル差分を取得し、前記動きベクトル差分と前記動きベクトル予測子の加算を介して現在ブロックの前記動きベクトルを導出することができる。また、予測部は、参照ピクチャを指示する参照ピクチャインデックスなどを前記予測に対する情報から取得または誘導できる。
加算部240は、レジデュアルサンプルと予測サンプルを加算して現在ブロックまたは現在ピクチャを復元することができる。加算部240は、レジデュアルサンプルと予測サンプルをブロック単位に加算して現在ピクチャを復元することもできる。スキップモードが適用された場合にはレジデュアルが送信されないため、予測サンプルが復元サンプルになることができる。ここで、加算部240は、別途の構成で説明したが、予測部230の一部であってもよい。一方、加算部240は、復元部(reconstruction module)または復元ブロック生成とも呼ばれる。
フィルタ部250は、復元されたピクチャにデブロッキングフィルタリングサンプル適応的オフセット、及び/またはALFなどを適用することができる。このとき、サンプル適応的オフセットは、サンプル単位に適用されることができ、デブロッキングフィルタリング以後に適用されることもできる。ALFは、デブロッキングフィルタリング及び/またはサンプル適応的オフセット以後に適用されることもできる。
メモリ260は、復元ピクチャ(デコーディングされたピクチャ)またはデコーディングに必要な情報を格納することができる。ここで、復元ピクチャは、前記フィルタ部250によりフィルタリング手順が完了した復元ピクチャである。例えば、メモリ260は、インター予測に使われるピクチャを格納することができる。このとき、インター予測に使われるピクチャは、参照ピクチャセットまたは参照ピクチャリストにより指定されることもできる。復元されたピクチャは、他のピクチャに対する参照ピクチャとして利用されることができる。また、メモリ260は、復元されたピクチャを出力順序によって出力することもできる。
一方、前述したように、ビデオコーディングを実行するにあたって圧縮効率を上げるために予測を実行する。それによって、コーディング対象ブロックである現在ブロックに対する予測サンプルを含む予測されたブロックを生成することができる。ここで、前記予測されたブロックは、空間ドメイン(または、ピクセルドメイン)での予測サンプルを含む。前記予測されたブロックは、エンコーディング装置及びデコーディング装置で同じに導出され、前記エンコーディング装置は、原本ブロックの原本サンプル値自体でない前記原本ブロックと前記予測されたブロックとの間のレジデュアルに対する情報(レジデュアル情報)をデコーディング装置でシグナリングすることで映像コーディング効率を上げることができる。デコーディング装置は、前記レジデュアル情報に基づいてレジデュアルサンプルを含むレジデュアルブロックを導出し、前記レジデュアルブロックと前記予測されたブロックを加算して復元サンプルを含む復元ブロックを生成することができ、復元ブロックを含む復元ピクチャを生成することができる。
前記レジデュアル情報は、変換及び量子化手順を介して生成されることができる。例えば、エンコーディング装置は、前記原本ブロックと前記予測されたブロックとの間のレジデュアルブロックを導出し、前記レジデュアルブロックに含まれているレジデュアルサンプル(レジデュアルサンプルアレイ)に変換手順を実行して変換係数を導出し、前記変換係数に量子化手順を実行して量子化された変換係数を導出することで、関連したレジデュアル情報を(ビットストリームを介して)デコーディング装置でシグナリングできる。ここで、前記レジデュアル情報は、前記量子化された変換係数の値情報、位置情報、変換技法、変換カーネル、量子化パラメータなどの情報を含むことができる。デコーディング装置は、前記レジデュアル情報に基づいて逆量子化/逆変換手順を実行してレジデュアルサンプル(または、レジデュアルブロック)を導出することができる。デコーディング装置は、予測されたブロックと前記レジデュアルブロックに基づいて復元ピクチャを生成することができる。また、エンコーディング装置は、以後ピクチャのインター予測のための参照のために量子化された変換係数を逆量子化/逆変換してレジデュアルブロックを導出し、これに基づいて復元ピクチャを生成することができる。
一方、本発明によると、前述した変換を実行するにあたって多重変換技法が適用されることができる。
図3は、本発明による多重変換技法を概略的に示す。
図3を参照すると、変換部は、前述した図1のエンコーディング装置内の変換部に対応されることができ、逆変換部は、前述した図1のエンコーディング装置内の逆変換部または図2のデコーディング装置内の逆変換部に対応されることができる。
変換部は、レジデュアルブロック内のレジデュアルサンプル(レジデュアルサンプルアレイ)に基づいて1次変換を実行して(1次)変換係数を導出することができる(S310)。ここで、前記1次変換は、適応的多重核心変換(adaptive multiple core transform)を含むことができる。
適応的多重核心変換は、DCT(Discrete Cosine Transform)タイプ2とDST(Discrete Sine Transform)タイプ7、DCTタイプ8、及び/またはDSTタイプ1を追加的に使用して変換する方式を示すことができる。即ち、前記多重核心変換は、前記DCTタイプ2、前記DSTタイプ7、前記DCTタイプ8、及び前記DSTタイプ1の中から選択された複数の変換カーネルに基づいて空間ドメインのレジデュアル信号(または、レジデュアルブロック)を周波数ドメインの変換係数(または、1次変換係数)に変換する変換方法を示すことができる。ここで、前記1次変換係数は、変換部立場で臨時変換係数と呼ばれる。
即ち、既存の変換方法が適用される場合、DCTタイプ2に基づいて、レジデュアル信号(または、レジデュアルブロック)に対する空間ドメインから周波数ドメインへの変換が適用されて変換係数が生成されることができた。それに対し、前記適応的多重核心変換が適用される場合、DCTタイプ2、DSTタイプ7、DCTタイプ8、及び/またはDSTタイプ1などに基づいて、レジデュアル信号(または、レジデュアルブロック)に対する空間ドメインから周波数ドメインへの変換が適用されて変換係数(または、1次変換係数)が生成されることができる。ここで、DCTタイプ2、DSTタイプ7、DCTタイプ8、及びDSTタイプ1等は、変換タイプ、変換カーネル(kernel)または変換コア(core)と呼ばれる。
参考までに、前記DCT/DST変換タイプは、基底関数に基づいて定義されることができ、前記基底関数は、以下の表のように示される。
前記適応的多重核心変換が実行される場合、前記変換カーネルの中から対象ブロックに対する垂直変換カーネル及び水平変換カーネルが選択されることができ、前記垂直変換カーネルに基づいて前記対象ブロックに対する垂直変換が実行され、前記水平変換カーネルに基づいて前記対象ブロックに対する水平変換が実行されることができる。ここで、前記水平変換は、前記対象ブロックの水平成分に対する変換を示すことができ、前記垂直変換は、前記対象ブロックの垂直成分に対する変換を示すことができる。前記垂直変換カーネル/水平変換カーネルは、レジデュアルブロックを取り囲む(encompass)対象ブロック(CUまたはサブブロック)の予測モード及び/または変換サブセットを示す変換インデックスに基づいて適応的に決定されることができる。
変換部は、前記(1次)変換係数に基づいて2次変換を実行して(2次)変換係数を導出することができる(S320)。前記1次変換が空間ドメインから周波数ドメインへの変換である場合、前記2次変換は、周波数ドメインから周波数ドメインへの変換であるとみることができる。前記2次変換は、非分離変換(non−seperable transform)を含むことができる。この場合、前記2次変換は、非分離2次変換(non−separable secondary transform、NSST)と呼ばれる。前記非分離2次変換は、前記1次変換を介して導出された(1次)変換係数を非分離変換マトリックス(non−separable transform matrix)に基づいて2次変換してレジデュアル信号に対する変換係数(または、2次変換係数)を生成する変換を示すことができる。ここで、前記非分離変換マトリックスに基づいて前記(1次)変換係数に対して垂直変換及び水平変換を分離して(または、水平垂直変換を独立的に)適用せずに一回に変換を適用することができる。即ち、前記非分離2次変換は、前記非分離変換マトリックスに基づいて前記(1次)変換係数の垂直成分及び水平成分を分離せずに共に変換して変換係数(または、2次変換係数)を生成する変換方法を示すことができる。前記非分離2次変換は、(1次)変換係数で構成されたブロック(以下、変換係数ブロックと呼ばれる)の左上段(top−left)領域に対して適用されることができる。例えば、前記変換係数ブロックの幅(W)及び高さ(H)が両方とも8以上である場合、8×8非分離2次変換が前記変換係数ブロックの左上段8×8領域に対して適用されることができる。また、前記変換係数ブロックの幅(W)または高さ(H)が8より小さい場合、4×4非分離2次変換が前記変換係数ブロックの左上段min(8、W)×min(8、H)領域に対して適用されることができる。
具体的に、例えば、4×4入力ブロックが使われる場合、非分離2次変換は、下記のように実行されることができる。
前記4×4入力ブロックXは、下記のように示される。
前記Xをベクトル形態で表す場合、
は、下記のように示される。
この場合、前記2次非分離変換は、下記のように計算されることができる。
ここで、
は変換係数ベクトルを示し、Tは16×16(非分離)変換マトリックスを示す。
前記数式3を介して
が導出されることができ、前記
は、スキャン順序(水平、垂直、対角(diagonal)等)を介して4×4ブロックで再構成(re−organized)されることができる。ただし、前述した計算は、例示に過ぎず、非分離2次変換の計算複雑度を減らすためにHyGT(Hypercube−Givens Transsform)などが非分離2次変換の計算のために使われることもできる。
一方、前記非分離2次変換は、モード依存(mode dependent)に変換カーネル(または、変換コア、変換タイプ)が選択されることができる。ここで、モードは、イントラ予測モード及び/またはインター予測モードを含むことができる。
前述したように、前記非分離2次変換は、前記変換係数ブロックの幅(W)及び高さ(H)に基づいて決定された8×8変換または4×4変換に基づいて実行されることができる。即ち、前記非分離2次変換は、8×8サブブロックサイズまたは4×4サブブロックサイズに基づいて実行されることができる。例えば、前記モード依存変換カーネル選択のために、8×8サブブロックサイズ及び4×4サブブロックサイズの両方ともに対して非分離2次変換のための3個ずつ35個セットの非分離2次変換カーネルが構成されることができる。即ち、8×8サブブロックサイズに対して35個の変換セットが構成され、4×4サブブロックサイズに対して35個の変換セットが構成されることができる。この場合、8×8サブブロックサイズに対する35個の変換セットには各々3個ずつの8×8変換カーネルが含まれることができ、この場合、4×4サブブロックサイズに対する35個の変換セットには各々3個ずつの4×4変換カーネルが含まれることができる。ただし、前記変換サブブロックサイズ、前記セットの数及びセット内の変換カーネルの数は、例示に過ぎず、8×8または4×4以外のサイズが使われることができ、またはn個のセットが構成され、各セット内にk個の変換カーネルが含まれることもできる。
前記変換セットは、NSSTセットと呼ばれ、前記NSSTセット内の変換カーネルは、NSSTカーネルと呼ばれる。前記変換セットの中から特定セットの選択は、例えば、対象ブロック(CUまたはサブブロック)のイントラ予測モードに基づいて実行されることができる。
参考までに、例えば、イントラ予測モードは、2個の非方向性(non−directinoal、または非角度性(non−angular))イントラ予測モードと65個の方向性(directional、または角度性(angular))イントラ予測モードを含むことができる。前記非方向性イントラ予測モードは、0番であるプラナー(planar)イントラ予測モード及び1番であるDCイントラ予測モードを含むことができ、前記方向性イントラ予測モードは、2番乃至66番の65個のイントラ予測モードを含むことができる。ただし、これは例示に過ぎず、本発明は、イントラ予測モードの数が異なる場合にも適用されることができる。一方、場合によって、67番イントラ予測モードがさらに使用されることができ、前記67番イントラ予測モードは、LM(linear model)モードを示すことができる。
図4は、65個の予測方向のイントラ方向性モードを例示的に示す。
図4を参照すると、左上向対角予測方向を有する34番イントラ予測モードを中心にして、水平方向性(horizontal directionality)を有するイントラ予測モードと、垂直方向性(vertical directionality)を有するイントラ予測モードと、を区分することができる。図3のHとVは、各々、水平方向性と垂直方向性を意味し、−32〜32の数字は、サンプルグリッドポジション(sample grid position)上で1/32単位の変位を示す。2番乃至33番イントラ予測モードは水平方向性を有し、34番乃至66番イントラ予測モードは垂直方向性を有する。18番イントラ予測モードと50番イントラ予測モードは、各々、水平イントラ予測モード(horizontal intra prediction mode)、垂直イントラ予測モード(vertical intra prediction mode)を示し、2番イントラ予測モードは左下向対角イントラ予測モードと呼ばれ、34番イントラ予測モードは左上向対角イントラ予測モードと呼ばれ、66番イントラ予測モードは右上向対角イントラ予測モードと呼ばれる。
この場合、前記35個の変換セットと前記イントラ予測モードとの間のマッピング(mapping)は、例えば、以下の表のように示される。参考までに、対象ブロックにLMモードが適用される場合、前記対象ブロックに対しては2次変換が適用されない。
一方、特定セットが使われると決定される場合、NSSTインデックスを介して前記特定セット内の3個の変換カーネルの中から一つが選択されることができる。エンコーディング装置は、RD(rate−distortion)チェックに基づいて特定変換カーネルを示すNSSTインデックスを導出することができ、前記NSSTインデックスをデコーディング装置でシグナリングできる。デコーディング装置は、前記NSSTインデックスに基づいて特定セット内の3個の変換カーネルの中から一つを選択することができる。例えば、NSSTインデックス値0は、1番目のNSSTカーネルを示すことができ、NSSTインデックス値1は、2番目のNSSTカーネルを示すことができ、NSSTインデックス値2は、3番目のNSSTカーネルを示すことができる。または、NSSTインデックス値0は、対象ブロックに対してNSSTが適用されないことを示すことができ、NSSTインデックス値1乃至3は、前記3個の変換カーネルを示すことができる。
再び、図3を参照すると、変換部は、選択された変換カーネルに基づいて前記非分離2次変換を実行して(2次)変換係数を取得することができる。前記(2次)変換係数は、前述したように、量子化部を介して量子化された変換係数として導出されることができ、エンコーディングされてデコーディング装置でシグナリング及びエンコーディング装置内の逆量子化/逆変換部に伝達されることができる。
逆変換部は、前述した変換部で実行された手順の逆順に一連の手順を実行することができる。逆変換部は、(逆量子化された)(2次)変換係数を受信し、2次変換を実行して(1次)変換係数を導出し(S350)、前記(1次)変換係数に対して1次変換を実行してレジデュアルブロック(レジデュアルサンプル)を取得することができる。ここで、前記1次変換係数は、逆変換部立場で修正された(modified)変換係数と呼ばれる。エンコーディング装置及びデコーディング装置は、前記レジデュアルブロックと予測されたブロックに基づいて復元ブロックを生成し、これに基づいて復元ピクチャを生成することができることは、前述した通りである。
一方、非分離2次変換のための変換カーネル(NSSTカーネル)のサイズは、固定的であり、または固定的でなくて一つのセット内に互いに異なるサイズの変換カーネルが共に構成されることもできる。
一例として、対象ブロック(または、サブブロックまたは変換係数ブロック)の大きさによって、4×4NSSTセットの場合、4×4NSSTカーネルのみを含み、8×8NSSTセットの場合、8×8NSSTカーネルのみを含む。
他の例として、次のように混合(Mixed)NSSTセットを構成することもできる。混合NSSTセットの場合、他のサイズのNSSTカーネルを含むことができる。例えば、混合NSSTセットは、8×8NSSTカーネルだけでなく、4×4NSSTカーネルを含むことができる。混合NSSTセットと対比し、前述した8×8NSSTカーネルのみを含み、または4×4NSSTカーネルのみを含むNSSTセットは、非混合NSSTセットと呼ばれる。
前記混合NSSTセットに含まれているNSSTカーネルの数は、固定的または可変的である。例えば、NSSTセット#1は、3個のNSSTカーネルを含み、NSSTセット#2は、4個のNSSTカーネルを含むこともできる。また、前記混合されたNSSTセットに含まれるNSSTカーネルの順序は、固定的でなく、NSSTセットによって異なるように定義されることができる。例えば、NSSTセット#1ではNSSTカーネル1、2、3がNSSTインデックス1、2、3に各々マッピングされ、NSSTセット#2ではNSSTカーネル3、2、1がNSSTインデックス1、2、3に各々マッピングされることもできる。
具体的に、NSSTセット内で使用可能なNSSTカーネルの優先順位決定は、NSSTカーネルの大きさ(例えば、8×8NSSTカーネルまたは4×4NSSTカーネル)に基づいて行われる。例えば、該当対象ブロックが一定サイズ以上である場合、8×8NSSTカーネルが4×4NSSTカーネルより優先順位が高く、この場合、8×8NSSTカーネルに一層少ない値のNSSTインデックスが優先的に割り当てられることができる。
また、NSSTセット内で使用可能なNSSTカーネルの優先順位決定は、NSSTカーネルの順序(1st、2nd、3rd)に基づいて行われる。例えば、4×4NSST 1stカーネルが4×4NSST 2ndカーネルより高い優先順位を有することができる。
具体的に、例えば、NSSTセット内のNSSTカーネルとNSSTインデックスのマッピングは、以下の表3または表4に開示された実施例を含むことができる。
前記混合NSSTセットの使用可否は、多様な方法により指示されることができる。例えば、前記混合NSSTセットの使用可否は、対象ブロック(または、対象ブロックを含むCU)のイントラ予測モード及び/または対象ブロックの大きさに基づいて決定されることができる。
一例として、前記混合NSSTセットの使用可否は、対象ブロックのイントラ予測モードに基づいて決定されることができる。即ち、イントラ予測モードによって前記混合NSSTセットが使われるか、または前述したサブブロックサイズに基づく個別NSSTセットが使われるかがあらかじめ決定されている。それによって、現在対象ブロックに適したNSSTセットを決定し、適切なNSSTカーネルを適用することができる。例えば、イントラ予測モードによって前記混合NSSTセットが使われるかどうかが以下の表のように指示されることができる。
ここで、混合タイプ(mixed type)情報は、前記混合NSSTセットが前記対象ブロックに適用されるかどうかをイントラ予測モードに基づいて開示する。これは前述した表2に開示された方法と連係して使われることができる。例えば、前記混合タイプ情報は、表2で詳述したように、各イントラ予測モード毎に非混合NSSTセットをマッピングして使用するか、または混合NSSTセットを構成して使用するかを示すことができる。具体的に、混合タイプ情報の値が1である場合、非混合NSSTセットの代わりに、システムで定義された混合NSSTセットを構成して使用することができる。ここで、システムで定義された混合NSSTセットは、前述した混合NSSTセットを示すことができる。前記混合タイプ情報の値が0である場合、前述した非混合NSSTセットがイントラ予測モードに基づいて使われることができる。前記混合タイプ情報は、混合NSSTセットが使われるかどうかを示す混合タイプフラグ(flag)と呼ばれる。本実施例によると、混合タイプフラグに基づいて2種類のNSSTセット(非混合NSSTセット、混合NSSTセット)が適応的/可変的に使われることができる。
一方、混合NSSTセットは、二つ以上構成されることができ、この場合、混合タイプ情報は、N(Nは、2より大きいまたは同じである)個の多様な値で示される。この場合、前記混合タイプ情報は、混合タイプインデックスと呼ばれる。
他の例として、前記混合NSSTセットの使用可否は、対象ブロックに関連したイントラ予測モード及び対象ブロックの大きさを同時に考慮して決定されることができる。前記対象ブロックは、サブブロック、変換ブロック、変換係数ブロックなど、多様な名称で呼ばれる。
例えば、前記混合タイプ情報の代わりにモードタイプ情報を構成し、イントラ予測モードに対応するモードタイプ情報の値が0である場合、非混合NSSTセットを設定し、そうでない場合(例えば、モードタイプ情報の値が1である場合)、該当対象ブロックの大きさに基づいて多様な混合NSSTセットが決定されることができる。一例として、イントラモードが非方向性モード(PlanarまたはDC)である場合、混合NSSTが使われることができ、方向性モードである場合、非混合NSSTセットが使われることができる。
図5は、イントラ予測モード及びブロックサイズに基づいてNSSTセットを決定する方法を例示的に示す。
図5を参照すると、コーディング装置(エンコーディング装置及び/またはデコーディング装置)は、(量子化された)変換係数を逆変換して(2次)変換係数を導出し(S540)、前記(2次)変換係数を2次(逆)変換して(1次)変換係数を導出する(S550)。この場合、前記(2次)変換係数は、臨時変換係数と呼ばれ、前記(1次)変換係数は、修正された(modified)変換係数と呼ばれる。ここで、前記2次変換は、前述した非分離2次変換を含むことができる。前記非分離2次変換は、NSSTカーネルに基づいて実行され、前記NSSTカーネルは、NSSTセットから選択されることができる。この場合、NSSTインデックス情報を介して前記NSSTセットから前記NSSTカーネルが指示されることができる。
コーディング装置は、イントラ予測モード及びブロックサイズに基づいてNSSTセット候補の中から前記NSSTセットを選択することができる(S545)。例えば、NSSTセット候補は、少なくとも一つの非混合NSSTセット及び混合NSSTセットを含むことができる。例えば、NSSTセット候補は、8×8NSSTカーネルのみを含む8×8NSSTセット(非混合NSSTセット1)、4×4NSSTカーネルのみを含む4×4NSSTセット(非混合NSSTセット2)のうち少なくとも一つを含むことができ、また、一つまたはそれ以上の混合NSSTセットを含むことができる。この場合、例えば、コーディング装置は、前記対象ブロックの幅(W)及び高さ(H)が両方とも8以上かどうか、現在イントラ予測モードナンバーによって前記NSSTセット候補から特定NSSTセットを決定することができる。NSSTインデックス情報を介して前記特定NSSTセットから特定NSSTカーネルが指示されることができることは、前述した通りである。
一方、前述したNSSTインデックスは、コーディング効率のために多様な方法で二進化(binzarization)されることができ、この場合、コーディングされて送信されるNSSTインデックス値の統計的分布の変化を考慮して効率的に二進化値を設定することができる。即ち、この場合、カーネルサイズを示すシンタックスに基づいて実際適用するカーネルが選択されることができる。
前述したように、本発明によると、変換セット(NSSTセット)毎に含まれるNSSTカーネルの数が異なる場合があり、効率的な二進化方法のためにNSSTセット別に利用可能な最大NSSTインデックス値によって、以下の表のようにTU(truncated unary)に基づいて可変長さ二進化が実行されることができる。
ここで、二進化された“0”または“1”の値は、BINと呼ばれ、このとき、各BINは、前述したCABAC/CAVLC等を介してコンテキスト(context)に基づいてコーディングされることができる。このとき、コンテキストモデリング値は、対象ブロック(サブブロック、変換ブロック、変換係数ブロック等)の大きさ、イントラ予測モード、混合タイプ情報(混合モード情報)の値、該当NSSTセットの最大NSSTインデックス値のうち少なくとも一つに基づいて決定されることができる。ここで、コンテキストモデルは、コンテキストインデックスに基づいて指示されることができ、コンテキストインデックスは、コンテキストオフセット(offset)及びコンテキスト変化度(increment)の和で示される。
図6は、本発明による変換方法を含むビデオ/映像エンコーディング方法の一例を概略的に示す。図6で開示された方法は、図1で開示されたエンコーディング装置により実行されることができる。具体的に、例えば、図6のS600乃至S630は、前記エンコーディング装置の変換部により実行されることができる。
図6を参照すると、エンコーディング装置は、対象ブロックに対する変換係数を取得する(S600)。エンコーディング装置は、原本ブロックと予測されたブロックの比較を介して対象ブロックに対するレジデュアルサンプルを取得することができ、前記レジデュアルサンプルの1次変換を介して対象ブロックに対する変換係数を取得することができる。前記1次変換は、空間ドメインのレジデュアルサンプルを周波数ドメインの変換係数に変換する手順を含む。ここで、前記対象ブロックは、CU内のサブブロック、変換ブロック、変換係数ブロックなどを含むことができる。
エンコーディング装置は、前記対象ブロックに対するNSSTセットを決定する(S610)。前記NSSTセットは、2次変換のために使われるNSSTカーネルを含むことができる。前記2次変換は、非分離2次変換を含む。前記対象ブロックに対するNSSTセットは、イントラ予測モード及び前記対象ブロックのサイズのうち少なくとも一つに基づいて決定されることができる。
前記NSSTセットは、8×8NSSTカーネルまたは4×4NSSTカーネルを含むことができる。この場合、前記NSSTセットは、非混合NSSTセットと呼ばれる。前記NSSTセットが8×8NSSTカーネルを含むか、または4×4NSSTカーネルを含むかは、前述したように、前記対象ブロックのサイズに基づいて決定されることができる。
または、前記NSSTセットは、4×4NSSTカーネル及び8×8NSSTカーネルを含む混合(Mixed)NSSTセットである。この場合、前記8×8NSSTカーネルに割り当てられるインデックス値は、前記4×4NSSTカーネルに割り当てられるインデックス値より小さい。例えば、前記対象ブロックのサイズがあらかじめ定義された基準サイズより大きい場合、前記8×8NSSTカーネルに割り当てられるインデックス値は、前記4×4NSSTカーネルに割り当てられるインデックス値より小さい。または、それに対し、前記4×4NSSTカーネルに割り当てられるインデックス値は、前記8×8NSSTカーネルに割り当てられるインデックス値より小さい。
前記NSSTセットには多数のNSSTカーネルが含まれることができ、前記NSSTカーネルの数は、可変的に設定されることができる。例えば、第1のNSSTセットに含まれるNSSTカーネルの数は、第2のNSSTセットに含まれるNSSTカーネルの数と異なる場合がある。
一方、前記対象ブロックに対するNSSTセットとして、非混合NSSTセットが使われるか、または混合NSSTセットが使われるかは、混合タイプ情報または混合モード情報に基づいて示される。
例えば、前記混合タイプ情報の値が0である場合、8×8NSSTカーネルまたは4×4NSSTカーネルを含む非混合NSSTセットが使われ、前記混合タイプ情報の値が0でない場合、4×4NSSTカーネル及び8×8NSSTカーネルを含む混合NSSTセットが使われることができる。多数の混合NSSTセットが可用な場合、前記混合タイプ情報の値1、2などに基づいて前記多数の混合NSSTセットのうち一つを示すことができる。
前記対象ブロックに対する前記NSSTセットは、イントラ予測モード及び前記対象ブロックのサイズの両方ともに基づいて決定されることができる。前記イントラ予測モードは、例えば、LMモードを含む67個(LMモードを含む場合、68個)のイントラ予測モードのうち一つである。前記イントラ予測モードは、前記対象ブロックに関連した予測モードであり、または前記対象ブロックを空間的にカバーするCUまたはそのサブブロックに設定されたイントラ予測モードである。
エンコーディング装置は、前記NSSTセットに含まれている多数のNSSTカーネルの中から一つを選択してNSSTインデックスを設定する(S620)。エンコーディング装置は、RDコストに基づいて繰り返し計算を介して前記NSSTセットに含まれている多数のNSSTカーネルの中から一つを選択することができる。エンコーディング装置は、前記選択されたNSSTカーネルを示す値として、前記NSSTインデックスを設定することができる。
エンコーディング装置は、前記選択されたNSSTカーネルに基づいて前記変換係数を非分離2次変換して修正された(modified)変換係数を生成する(S630)。エンコーディング装置は、前記修正された変換係数を決まった手順によってエンコーディング及び出力できる。この場合、前記混合タイプ情報、前記混合モード情報及び前記NSSTインデックスに対する情報のうち少なくとも一つは、共にエンコーディングされることができる。エンコーディング装置は、エンコーディングされた情報をビットストリーム形態で出力できる。前記ビットストリームは、ネットワークまたは格納媒体を介してデコーディング装置に送信されることができる。
前記NSSTインデックスに対する情報がエンコーディングされる場合、前記NSSTインデックスの値は、可変長さ二進化されることができる。この場合、例えば、表6で開示されたように、前記NSSTインデックスの値は、TU(truncated unary)技法によって二進化されることができる。一方、前記NSSTインデックスの値は、CABAC、CAVLCなど、コンテキストに基づいてエンコーディングされることができ、この場合、コンテキストモデルは、前記対象ブロックのサイズ、前記イントラ予測モード、混合(mixed)タイプ情報の値、及び前記NSSTセット内の最大インデックス値のうち少なくとも一つに基づいて決定されることができる。
図7は、本発明による変換方法を含むビデオ/映像デコーディング方法の一例を概略的に示す。図7で開示された方法は、図2で開示されたデコーディング装置により実行されることができる。具体的に、例えば、図7のS700は、前記デコーディング装置の逆量子化部により実行され、S710乃至730は、前記デコーディング装置の逆変換部により実行されることができる。一方、本説明ではデコーディング装置を基準にして説明するが、図7に開示された方法は、エンコーディング装置の逆量子化部及び逆変換部でも同じに実行されることができる。
図7を参照すると、デコーディング装置は、対象ブロックに対する変換係数を取得する(S700)。デコーディング装置は、ビットストリームを介して受信された情報から取得した対象ブロックに対する量子化された変換係数を逆量子化することで変換係数を取得することができる。ここで、前記対象ブロックは、CU内のサブブロック、変換ブロック、変換係数ブロックなどを含むことができる。
デコーディング装置は、前記対象ブロックに対するNSSTセットを決定する(S710)。前記NSSTセットは、2次変換のために使われるNSSTカーネルを含むことができる。前記2次変換は、非分離2次変換を含む。前記対象ブロックに対するNSSTセットは、イントラ予測モード及び前記対象ブロックのサイズのうち少なくとも一つに基づいて決定されることができる。
前記NSSTセットは、8×8NSSTカーネルまたは4×4NSSTカーネルを含むことができる。この場合、前記NSSTセットは、非混合NSSTセットと呼ばれる。前記NSSTセットが8×8NSSTカーネルを含むか、または4×4NSSTカーネルを含むかは、前述したように、前記対象ブロックのサイズに基づいて決定されることができる。
または、前記NSSTセットは、4×4NSSTカーネル及び8×8NSSTカーネルを含む混合(Mixed)NSSTセットである。この場合、前記8×8NSSTカーネルに割り当てられるインデックス値は、前記4×4NSSTカーネルに割り当てられるインデックス値より小さい。例えば、前記対象ブロックのサイズがあらかじめ定義された基準サイズより大きい場合、前記8×8NSSTカーネルに割り当てられるインデックス値は、前記4×4NSSTカーネルに割り当てられるインデックス値より小さい。または、それに対し、前記4×4NSSTカーネルに割り当てられるインデックス値は、前記8×8NSSTカーネルに割り当てられるインデックス値より小さい。
前記NSSTセットには多数のNSSTカーネルが含まれることができ、前記NSSTカーネルの数は、可変的に設定されることができる。例えば、第1のNSSTセットに含まれるNSSTカーネルの数は、第2のNSSTセットに含まれるNSSTカーネルの数と異なる場合がある。
一方、前記対象ブロックに対するNSSTセットとして、非混合NSSTセットが使われるか、または混合NSSTセットが使われるかは、混合タイプ情報または混合モード情報に基づいて決定されることができる。
例えば、前記混合タイプ情報の値が0である場合、8×8NSSTカーネルまたは4×4NSSTカーネルを含む非混合NSSTセットが使われ、前記混合タイプ情報の値が0でない場合、4×4NSSTカーネル及び8×8NSSTカーネルを含む混合NSSTセットが使われることができる。多数の混合NSSTセットが可用な場合、前記混合タイプ情報の値1、2などに基づいて前記多数の混合NSSTセットのうち一つを示すことができる。
前記対象ブロックに対する前記NSSTセットは、イントラ予測モード及び前記対象ブロックのサイズの両方ともに基づいて決定されることができる。前記イントラ予測モードは、例えば、67個(LMモードを含む場合、68個)のイントラ予測モードのうち一つである。前記イントラ予測モードは、前記対象ブロックに関連した予測モードであり、または前記対象ブロックを空間的にカバーするCUまたはそのサブブロックに設定されたイントラ予測モードである。
デコーディング装置は、NSSTインデックスに基づいて前記NSSTセットに含まれている多数のNSSTカーネルの中から一つを選択する(S720)。前記NSSTインデックスは、ビットストリームを介して取得できる。デコーディング装置は、(エントロピー)デコーディングを介して前記NSSTインデックスの値を取得することができる。前記NSSTインデックスの値は、可変長さ二進化されることができる。この場合、例えば、表6で開示されたように、前記NSSTインデックスの値は、TU(truncated unary)技法によって二進化されることができる。一方、前記NSSTインデックスの値は、CABAC、CAVLCなど、コンテキストに基づいてデコーディングされることができ、この場合、コンテキストモデルは、前記対象ブロックのサイズ、前記イントラ予測モード、混合(mixed)タイプ情報の値及び前記NSSTセット内の最大インデックス値のうち少なくとも一つに基づいて決定されることができる。
デコーディング装置は、前記選択されたNSSTカーネルに基づいて前記変換係数を非分離2次(逆)変換して修正された(modified)変換係数を生成する(S730)。デコーディング装置は、前記修正された変換係数に対して1次(逆)変換を実行して対象ブロックに対するレジデュアルサンプルを取得することができる。
デコーディング装置は、イントラ予測結果として取得した予測サンプルと、前記レジデュアルサンプルと、を結合して復元サンプルを取得することができ、これに基づいてピクチャを復元することができる。
以後、デコーディング装置は、必要によって主観的/客観的画質を向上させるためにデブロッキングフィルタリング、SAO及び/またはALF手順のようなインループフィルタリング手順を前記復元ピクチャに適用されることができることは、前述した通りである。
前述した本発明による方法は、ソフトウェア形態で具現されることができ、本発明によるエンコーディング装置及び/またはデコーディング装置は、例えば、TV、コンピュータ、スマートフォン、セットトップボックス、ディスプレイ装置などの映像処理を実行する装置に含まれることができる。
本発明で実施例がソフトウェアで具現される時、前述した方法は、前述した機能を遂行するモジュール(過程、機能など)で具現されることができる。モジュールは、メモリに格納され、プロセッサにより実行されることができる。メモリは、プロセッサの内部または外部にあり、よく知られた多様な手段でプロセッサと連結されることができる。プロセッサは、ASIC(application−specific integrated circuit)、他のチップセット、論理回路及び/またはデータ処理装置を含むことができる。メモリは、ROM(read−only memory)、RAM(random access memory)、フラッシュメモリ、メモリカード、格納媒体及び/または他の格納装置を含むことができる。

Claims (15)

  1. デコーディング装置により実行される変換方法において、
    対象ブロックに対する変換係数を取得するステップと、
    前記対象ブロックに対する非分離2次変換(non−seperable secondary transform、NSST)セットを決定するステップと、
    NSSTインデックスに基づいて前記NSSTセットに含まれている多数のNSSTカーネルの中から一つを選択するステップと、
    前記選択されたNSSTカーネルに基づいて前記変換係数を非分離2次変換して修正された(modified)変換係数を生成するステップと、を含み、
    前記対象ブロックに対するNSSTセットは、イントラ予測モード及び前記対象ブロックのサイズのうち少なくとも一つに基づいて決定されることを特徴とする、変換方法。
  2. 前記NSSTセットは、4×4NSSTカーネル及び8×8NSSTカーネルを含む混合(Mixed)NSSTセットであることを特徴とする、請求項1に記載の変換方法。
  3. 前記8×8NSSTカーネルに割り当てられるインデックス値は、前記4×4NSSTカーネルに割り当てられるインデックス値より小さいことを特徴とする、請求項2に記載の変換方法。
  4. 前記対象ブロックのサイズがあらかじめ定義された基準サイズより大きい場合、前記8×8NSSTカーネルに割り当てられるインデックス値は、前記4×4NSSTカーネルに割り当てられるインデックス値より小さいことを特徴とする、請求項2に記載の変換方法。
  5. 前記NSSTセットに含まれているNSSTカーネルの数は、可変的であることを特徴とする、請求項2に記載の変換方法。
  6. 混合(mixed)タイプ情報を取得するステップと、
    前記混合タイプ情報に基づいて混合NSSTセットが使われるかどうかを決定するステップと、を含むことを特徴とする、請求項1に記載の変換方法。
  7. 前記混合タイプ情報の値が0である場合、8×8NSSTカーネルまたは4×4NSSTカーネルを含む非混合NSSTセットが使われ、
    前記混合タイプ情報の値が0でない場合、4×4NSSTカーネル及び8×8NSSTカーネルを含む混合NSSTセットが使われることを特徴とする、請求項6に記載の変換方法。
  8. 前記対象ブロックに対するNSSTセットは、前記イントラ予測モード及び前記対象ブロックのサイズの両方ともに基づいて決定されることを特徴とする、請求項1に記載の変換方法。
  9. 前記NSSTインデックスの値は、可変長さ二進化されることを特徴とする、請求項1に記載の変換方法。
  10. 前記NSSTインデックスの値は、TU(truncated unary)技法によって二進化されることを特徴とする、請求項9に記載の変換方法。
  11. 前記NSSTインデックスの値は、コンテキストベースのデコーディングに基づいて取得され、
    前記NSSTインデックスの値のコンテキストベースのデコーディングのためのコンテキストモデルは、前記対象ブロックのサイズ、前記イントラ予測モード、混合(mixed)タイプ情報の値、及び前記NSSTセット内の最大インデックス値のうち少なくとも一つに基づいて決定されることを特徴とする、請求項1に記載の変換方法。
  12. デコーディング装置において、
    対象ブロックの量子化された変換係数に逆量子化を実行して前記対象ブロックに対する変換係数を取得する逆量子化部と、
    前記対象ブロックに対する非分離2次変換(non−seperable secondary transform、NSST)セットを決定し、NSSTインデックスに基づいて前記NSSTセットに含まれている多数のNSSTカーネルの中から一つを選択し、及び前記選択されたNSSTカーネルに基づいて前記変換係数を非分離2次変換して修正された(modified)変換係数を生成する逆変換部と、を含み、
    前記逆変換部は、イントラ予測モード及び前記対象ブロックのサイズのうち少なくとも一つに基づいて前記対象ブロックに対するNSSTセットを決定することを特徴とする、デコーディング装置。
  13. 前記NSSTセットは、4×4NSSTカーネル及び8×8NSSTカーネルを含む混合(Mixed)NSSTセットであることを特徴とする、請求項12に記載のデコーディング装置。
  14. 前記8×8NSSTカーネルに割り当てられるインデックス値は、前記4×4NSSTカーネルに割り当てられるインデックス値より小さいことを特徴とする、請求項13に記載のデコーディング装置。
  15. 前記NSSTセットに含まれているNSSTカーネルの数は、可変的であることを特徴とする、請求項13に記載のデコーディング装置。
JP2019552254A 2017-03-21 2018-01-31 映像コーディングシステムにおける変換方法及びその装置 Pending JP2020510374A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762474574P 2017-03-21 2017-03-21
US62/474,574 2017-03-21
PCT/KR2018/001320 WO2018174402A1 (ko) 2017-03-21 2018-01-31 영상 코딩 시스템에서 변환 방법 및 그 장치

Publications (1)

Publication Number Publication Date
JP2020510374A true JP2020510374A (ja) 2020-04-02

Family

ID=63585506

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019552254A Pending JP2020510374A (ja) 2017-03-21 2018-01-31 映像コーディングシステムにおける変換方法及びその装置

Country Status (11)

Country Link
US (1) US20200177889A1 (ja)
EP (1) EP3588952B1 (ja)
JP (1) JP2020510374A (ja)
KR (1) KR102171362B1 (ja)
CN (1) CN110546952A (ja)
AU (1) AU2018239635A1 (ja)
BR (1) BR112019019702A2 (ja)
CA (1) CA3057445A1 (ja)
MX (1) MX2019011211A (ja)
RU (2) RU2733279C2 (ja)
WO (1) WO2018174402A1 (ja)

Families Citing this family (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3414906A4 (en) * 2016-02-08 2019-10-02 Sharp Kabushiki Kaisha SYSTEMS AND METHOD FOR INTRAPRADICATION CODING
JP2019017066A (ja) * 2017-07-03 2019-01-31 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 符号化装置、復号装置、符号化方法及び復号方法
WO2019189901A1 (ja) * 2018-03-29 2019-10-03 日本放送協会 画像符号化装置、画像復号装置、及びプログラム
CN117097893A (zh) * 2018-07-06 2023-11-21 Lg电子株式会社 图像编码/解码设备和图像数据发送设备
GB2577318B (en) 2018-09-21 2021-03-10 Canon Kk Video coding and decoding
CN111418206B (zh) * 2018-10-05 2023-12-01 Lg电子株式会社 使用mpm列表的基于帧内预测的视频编码方法及其装置
KR20210096116A (ko) * 2018-12-03 2021-08-04 인터디지털 브이씨 홀딩스 인코포레이티드 픽처 인코딩 및 디코딩을 위한 방법 및 디바이스
JP7200379B2 (ja) 2018-12-06 2023-01-06 エルジー エレクトロニクス インコーポレイティド 二次変換に基づく映像コーディング方法、及びその装置
WO2020130577A1 (ko) * 2018-12-18 2020-06-25 엘지전자 주식회사 이차 변환에 기반한 영상 코딩 방법 및 그 장치
KR20210095138A (ko) * 2018-12-19 2021-07-30 엘지전자 주식회사 이차 변환에 기반한 영상 코딩 방법 및 그 장치
US11546632B2 (en) 2018-12-19 2023-01-03 Lg Electronics Inc. Method and device for processing video signal by using intra-prediction
JP7171920B2 (ja) 2018-12-19 2022-11-15 エルジー エレクトロニクス インコーポレイティド 2次変換に基づく映像コーディング方法及びその装置
CN116781895A (zh) * 2019-01-12 2023-09-19 Lg电子株式会社 解码设备、编码设备和图像数据发送设备
CN113302942B (zh) * 2019-02-01 2024-02-13 Lg电子株式会社 基于二次变换的图像编码方法及其设备
WO2020171671A1 (ko) * 2019-02-24 2020-08-27 엘지전자 주식회사 이차 변환에 기반한 영상 코딩 방법 및 그 장치
CN113365057B (zh) * 2019-03-09 2023-02-28 杭州海康威视数字技术股份有限公司 进行编码和解码的方法、解码端、编码端和***
KR20220122783A (ko) * 2019-04-16 2022-09-02 엘지전자 주식회사 변환 인덱스를 이용하는 영상 코딩
CN114223207B (zh) * 2019-04-16 2023-09-22 寰发股份有限公司 用次要变换编解码视讯数据的方法以及装置
CN118175314A (zh) 2019-04-16 2024-06-11 Lg电子株式会社 解码和编码设备及发送用于图像的数据的设备
KR102470696B1 (ko) * 2019-04-16 2022-11-28 엘지전자 주식회사 영상 코딩에서 매트릭스 기반의 인트라 예측을 위한 변환
CN113711607B (zh) 2019-04-16 2023-10-10 寰发股份有限公司 用适应性次要变换信令编解码视频数据的方法以及装置
CN113785576B (zh) 2019-04-23 2023-05-16 北京字节跳动网络技术有限公司 编解码视频中的二次变换的使用
JP7256296B2 (ja) * 2019-05-08 2023-04-11 エルジー エレクトロニクス インコーポレイティド Mip及びlfnstを行う画像符号化/復号化方法、装置、及びビットストリームを伝送する方法
WO2020231229A1 (ko) * 2019-05-15 2020-11-19 주식회사 엑스리스 영상 신호 부호화/복호화 방법 및 이를 위한 장치
CN113994696A (zh) * 2019-06-15 2022-01-28 北京字节跳动网络技术有限公司 编解码视频中的块尺寸相关的二次变换的使用
US11949872B2 (en) 2019-06-17 2024-04-02 Lg Electronics Inc. Luma mapping-based video or image coding
KR20210142008A (ko) 2019-06-17 2021-11-23 엘지전자 주식회사 루마 맵핑 및 크로마 스케일링 기반 비디오 또는 영상 코딩
CN116916023A (zh) * 2019-06-19 2023-10-20 Lg电子株式会社 图像解码和编码方法、存储介质及发送方法
CN115967811A (zh) * 2019-06-25 2023-04-14 三星电子株式会社 使用二次变换的视频信号处理方法及装置
CN112135148B (zh) * 2019-06-25 2022-05-10 华为技术有限公司 非可分离变换方法以及设备
KR20220024500A (ko) 2019-07-12 2022-03-03 엘지전자 주식회사 변환에 기반한 영상 코딩 방법 및 그 장치
US11677984B2 (en) * 2019-08-20 2023-06-13 Qualcomm Incorporated Low-frequency non-separable transform (LFNST) signaling
BR112022005281A8 (pt) 2019-09-19 2023-03-21 Humax Co Ltd Método e aparelho de processamento de sinal de vídeo usando processo de escala
CN114424538A (zh) * 2019-09-20 2022-04-29 Lg电子株式会社 基于变换的图像编码方法及其装置
WO2021054779A1 (ko) * 2019-09-21 2021-03-25 엘지전자 주식회사 변환에 기반한 영상 코딩 방법 및 그 장치
KR20210042656A (ko) 2019-10-10 2021-04-20 주식회사 엘지화학 배터리 팩
BR112022007946A2 (pt) * 2019-10-29 2022-07-12 Lg Electronics Inc Método para codificação de imagem com base em transformada e aparelho para o mesmo
KR20220122666A (ko) * 2020-01-08 2022-09-02 광동 오포 모바일 텔레커뮤니케이션즈 코포레이션 리미티드 인코딩 방법, 디코딩 방법, 인코더, 디코더 및 저장 매체
WO2021141443A1 (ko) * 2020-01-10 2021-07-15 엘지전자 주식회사 변환에 기반한 영상 코딩 방법 및 그 장치
WO2021169994A1 (en) * 2020-02-25 2021-09-02 Mediatek Inc. Methods and apparatus for secondary transform signaling in video coding
CN115668923A (zh) * 2020-05-27 2023-01-31 抖音视界有限公司 编解码视频中多重变换矩阵的指示
US11683490B2 (en) * 2020-09-10 2023-06-20 Tencent America LLC Context adaptive transform set
CN114845107A (zh) * 2021-02-02 2022-08-02 联咏科技股份有限公司 图像编码方法及其图像编码器

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013531445A (ja) * 2010-07-09 2013-08-01 クゥアルコム・インコーポレイテッド サイズとイントラモードとに基づいて又はエッジ検出に基づいてイントラブロック符号化の周波数変換を適応させること
JP2018530245A (ja) * 2015-09-29 2018-10-11 クゥアルコム・インコーポレイテッドQualcomm Incorporated ビデオコーディングのための非分離可能2次変換

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100261253B1 (ko) * 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치
ES2525557T3 (es) * 2002-05-28 2014-12-26 Sharp Kabushiki Kaisha Método y sistemas para la estimación, comunicación y organización de modos de intra-predicción de imágenes
KR101834825B1 (ko) * 2009-01-27 2018-03-06 톰슨 라이센싱 비디오 인코딩 및 디코딩에서 변환 선택을 위한 방법 및 장치
JP5158003B2 (ja) * 2009-04-14 2013-03-06 ソニー株式会社 画像符号化装置と画像符号化方法およびコンピュータ・プログラム
KR101620441B1 (ko) * 2009-06-17 2016-05-24 주식회사 아리스케일 복수의 보간 필터링 방법 및 이를 적용한 부호화 장치
WO2011016248A1 (ja) * 2009-08-06 2011-02-10 パナソニック株式会社 符号化方法、復号方法、符号化装置及び復号装置
CN102215391B (zh) * 2010-04-09 2013-08-28 华为技术有限公司 视频数据编码、解码方法及装置、变换处理方法及装置
CN107046644B (zh) * 2010-04-09 2020-03-24 三菱电机株式会社 运动图像编码装置以及运动图像解码装置
CN101938654B (zh) * 2010-08-17 2013-04-10 浙江大学 一种变换系数的优化量化方法及装置
US10992958B2 (en) * 2010-12-29 2021-04-27 Qualcomm Incorporated Video coding using mapped transforms and scanning modes
US8755620B2 (en) * 2011-01-12 2014-06-17 Panasonic Corporation Image coding method, image decoding method, image coding apparatus, image decoding apparatus, and image coding and decoding apparatus for performing arithmetic coding and/or arithmetic decoding
CN103096053B (zh) * 2011-11-04 2015-10-07 华为技术有限公司 一种变换模式的编解码方法和装置
CN104885453B (zh) * 2012-11-29 2018-11-02 Lg 电子株式会社 支持多个层的用于编码/解码图像的方法和设备

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013531445A (ja) * 2010-07-09 2013-08-01 クゥアルコム・インコーポレイテッド サイズとイントラモードとに基づいて又はエッジ検出に基づいてイントラブロック符号化の周波数変換を適応させること
JP2018530245A (ja) * 2015-09-29 2018-10-11 クゥアルコム・インコーポレイテッドQualcomm Incorporated ビデオコーディングのための非分離可能2次変換

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CHEN, JIANLE ET AL.: "Algorithm Description of Joint Exploration Test Model 5 (JEM 5)", JOINT VIDEO EXPLORATION TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 5TH MEETING: G, vol. JVET-E1001 (version 2), JPN6020042737, 11 February 2017 (2017-02-11), pages 29 - 31, ISSN: 0004527337 *
JANG, HYEONGMUN ET AL.: "Adaptive NSST Kernel Size Selection", JOINT VIDEO EXPLORATION TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 5TH MEETING: G, vol. JVET-E0047 (version 3), JPN6020042739, 13 January 2017 (2017-01-13), pages 1 - 6, ISSN: 0004382963 *

Also Published As

Publication number Publication date
RU2020116853A (ru) 2020-06-08
RU2733279C2 (ru) 2020-10-01
CN110546952A (zh) 2019-12-06
BR112019019702A2 (pt) 2020-04-14
EP3588952A1 (en) 2020-01-01
US20200177889A1 (en) 2020-06-04
RU2722394C1 (ru) 2020-05-29
MX2019011211A (es) 2019-12-05
AU2018239635A1 (en) 2019-10-17
RU2020116853A3 (ja) 2020-07-24
KR102171362B1 (ko) 2020-10-28
WO2018174402A1 (ko) 2018-09-27
CA3057445A1 (en) 2018-09-27
EP3588952B1 (en) 2021-04-28
EP3588952A4 (en) 2020-03-11
KR20190125482A (ko) 2019-11-06

Similar Documents

Publication Publication Date Title
KR102171362B1 (ko) 영상 코딩 시스템에서 변환 방법 및 그 장치
US11627319B2 (en) Image decoding method and apparatus according to block division structure in image coding system
JP6599552B2 (ja) ビデオコーディングシステムにおけるイントラ予測方法及び装置
KR101857108B1 (ko) 영상 부호화/복호화 방법 및 그 장치
KR101533720B1 (ko) 영상 부호화/복호화 방법 및 그 장치
KR102418700B1 (ko) 영상 코딩 시스템에서 크로마 성분의 효율적 변환에 기반한 영상 디코딩 방법 및 장치
US11838546B2 (en) Image decoding method and apparatus relying on intra prediction in image coding system
CN116489355A (zh) 图像编译***中根据块分离结构的图像解码方法和设备

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191017

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191017

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20201027

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201110

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20210622