CN114026865A - 用于色度分量的编解码工具 - Google Patents

用于色度分量的编解码工具 Download PDF

Info

Publication number
CN114026865A
CN114026865A CN202080045375.3A CN202080045375A CN114026865A CN 114026865 A CN114026865 A CN 114026865A CN 202080045375 A CN202080045375 A CN 202080045375A CN 114026865 A CN114026865 A CN 114026865A
Authority
CN
China
Prior art keywords
transform
video
block
codec
current block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080045375.3A
Other languages
English (en)
Inventor
张凯
张莉
刘鸿彬
邓智玭
王悦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing ByteDance Network Technology Co Ltd
ByteDance Inc
Original Assignee
Beijing ByteDance Network Technology Co Ltd
ByteDance Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing ByteDance Network Technology Co Ltd, ByteDance Inc filed Critical Beijing ByteDance Network Technology Co Ltd
Publication of CN114026865A publication Critical patent/CN114026865A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

描述了用于数字视频编解码的设备,***和方法,其中数字视频编解码包括用于色度分量的编解码工具。在代表性方面中,用于视频处理的方法包括进行视频的当前块与视频的比特流表示之间的转换,其中在比特流表示中是否信令通知多变换集合(MTS)索引和/或变换跳过标志是基于对当前块的基于区块差分脉冲编解码调制(BDPCM)的编解码工具的启用。

Description

用于色度分量的编解码工具
相关申请的交叉引用
根据适用的《专利法》和/或《巴黎公约》的规定,本申请及时要求于2019年6月21日提交的第PCT/CN2019/092388号国际专利申请的优先权和权益。出于法律的所有目的,上述申请的全部公开通过引用并入本文,作为本申请的公开的一部分。
技术领域
本专利文档涉及视频编解码技术、设备和***。
背景技术
尽管在视频压缩方面有了进展,但是数字视频导致了因特网和其它数字通信网络上的最大带宽使用。随着能够接收和显示视频的连接的用户设备的数量的增加,预期用于数字视频用途的带宽需求将继续增长。
发明内容
描述了设备,***和方法,其涉及数字视频编解码,具体涉及用于色度分量的编解码工具。所描述的方法可应用于现有的视频编解码标准(例如,高效视频编解码(HEVC))和未来的视频编解码标准(例如,通用视频编解码(VVC))或编码器。
在一代表性方面中,所公开的技术可用于提供用于视频处理的示例方法。该方法包括:作为视频的当前块和视频的比特流表示之间的转换的一部分,基于对视频的对应亮度分量的编解码工具的选择性应用,将编解码工具应用至视频的一个或多个色度分量;以及进行转换。
在另一代表性方面中,所公开的技术可用于提供用于视频处理的示例方法。该方法包括:作为视频的第一色度分量的当前块和视频的比特流表示之间的转换的一部分,基于编解码工具对视频的其它色度分量的一个或多个对应块的选择性应用,将编解码工具应用至当前块;以及进行转换。
在又一代表性方面中,所公开的技术可用于提供用于视频处理的示例性方法。该方法包括:作为视频的当前块和视频的比特流表示之间的转换的一部分,基于编解码工具对视频的一个或多个对应色度分量的选择性应用,将编解码工具应用至视频的亮度分量;以及进行转换。
在又一代表性方面中,所公开的技术可用于提供用于视频处理的示例性方法。该方法包括:执行视频的当前块和视频的比特流表示之间的转换,其中在比特流表示中是否信令通知多变换集(MTS)索引和/或变换跳过标志是基于用于当前块的基于块差分脉冲编解码调制(BDPCM)的编解码工具的启用。
在又一代表性方面中,所公开的技术可用于提供用于视频处理的示例性方法。该方法包括:基于用于视频的当前块的多变换集(MTS)类型,选择具有多个二进制数的编解码类型;以及将编解码类型作为当前块和视频的比特流表示之间的转换的一部分应用至MTS类型的指示。
在又一代表性方面中,上述方法以处理器可执行代码的形式来实现,并存储在计算机可读程序介质中。
在又一代表性方面中,公开了一种被配置为或可操作为执行上述方法的设备。该设备可包括编程为实施该方法的处理器。
在又一代表性方面中,视频解码器装置可以实施如本文所描述的方法。
在附图,说明书和权利要求书中更详细地描述了所公开的技术的上述和其它方面和特征。
附图说明
图1示出了编码器框图的示例。
图2示出67个帧内预测模式的示例。
图3A和3B示出了用于非方形块的广角帧内预测模式的参考采样的示例。
图4示出了当使用广角帧内预测时不连续性的示例。
图5A-5D示出了依赖于位置的帧内预测组合(PDPC)方法所使用的采样的示例。
图6示出了4×8块和8×4块的划分的示例。
图7示出了除4×8,8×4和4×4之外的所有块的划分的示例。
图8示出了将4×8采样块划分为两个可独立解码区域的示例。
图9示出了利用垂直预测器对像素行进行处理以最大化4×N块的吞吐量的顺序的示例。
图10示出了JEM中的二次变换的示例。
图11示出了所提出的简化二次变换(RST)的示例。
图12示出了正简化变换和逆简化变换的示例。
图13示出了利用16×48矩阵的正RST 8×8过程的示例。
图14示出了对于非零元素在8×8块中扫描位置17到64的示例。
图15示出了子块变换模式SBT-V和SBT-H的示例。
图16A-图16E示出了根据公开的技术的用于多个变换的示例方法的流程图。
图17是用于实施本文档中描述的可视媒体解码技术或可视媒体编码技术的硬件平台的示例的框图。
图18是可以在其中实施公开的技术的示例性视频处理***的框图。
具体实施方式
1介绍
由于对更高分辨率视频的日益增长的需求,视频编解码方法和技术在现代技术中普遍存在。视频编码器通常包括压缩或解压缩数字视频的电子电路或软件,并且被不断改进以提供更高的编解码效率。视频编码器将未压缩的视频转换为压缩格式,反之亦然。在视频质量、用于表示视频的数据量(由比特率确定)、编码和解码算法的复杂性、对数据丢失和错误的敏感性、编辑的方便性、随机访问和端到端时延(延迟)之间存在复杂的关系。压缩格式通常符合标准视频压缩规范,例如,高效视频编解码(HEVC)标准(也称为H.265或MPEG-H第2部分),待最终确定的通用视频编解码(VVC)标准,或其它当前和/或将来的视频编解码标准。
公开的技术的实施例可以应用于现有的视频编解码标准(例如,HEVC,H.265)和未来的标准,以改善运行时性能。在本说明书中使用章节标题来改善说明书的可读性,而不以任何方式将讨论或实施例(和/或实施)仅限制于对应章节。
2用于多种变换的方法的实施例和示例
2.1颜色空间和色度子采样
颜色空间(也称为颜色模型(或颜色***))是抽象的数学模型,其简单地将颜色范围描述为数字元组,通常描述为3个或4个值或颜色分量(例如RGB)。从根本上讲,颜色空间是对坐标系和子空间的详细阐述。
对于视频压缩,最常用的颜色空间是YCbCr和RGB。
YCbCr,Y'CbCr,或YPb/CbPr/Cr,也被写为YCBCR或Y'CBCR,是在视频和数字摄影***中用作彩色图像管线的一部分的颜色空间族。Y'是亮度分量,CB和CR是蓝色色差色度分量和红色色差色度分量。Y'(具有上撇号)与亮度Y不同,这意味着基于伽马校正的RGB基色对光强度进行非线性编码。
色度子采样是通过对色度信息实现比亮度信息更低的分辨率来编码图像的实践,其利用了人类视觉***对色差的敏锐度比对亮度的敏锐度低。
4:4:4格式。三个Y'CbCr分量中的每一个具有相同的采样率,因此没有色度子采样。该方案有时用于高端胶片扫描仪和电影后期制作。
4:2:2格式。两个色度分量以亮度的采样率的一半进行采样:水平色度分辨率被减半。这将未压缩的视频信号的带宽减小了三分之一而具有很小至没有视觉差异。
4:2:0格式。在4:2:0中,水平采样与4:1:1相比被加倍,但是由于在该方案中Cb和Cr信道仅每隔一排被采样,因此垂直分辨率被减半。因此,数据速率是相同的。CB和Cr中的每一个都以2倍的因子水平和垂直地进行子采样。4:2:0方案具有三种不同的变化,具有不同的水平和垂直定位。
ο在MPEG-2中,Cb和Cr水平地共同定位。Cb和Cr在垂直方向上定位在像素之间(间隙地定位)。
ο在JPEG/JFIF,H.261和MPEG-1中,Cb和Cr间隙地定位于间隔的亮度采样之间,定位在间隔的亮度采样之间的中间位置。
ο在4:2:0DV中,Cb和Cr在水平方向上共同定位。在垂直方向上,Cb和Cr共同定位在间隔的行上。
2.2典型视频编码器的编解码流
图1示出了VVC的编码器框图的示例,其包括三个环路内滤波块:去块滤波器(DF)、采样自适应偏移(SAO)和ALF。与使用预定滤波器的DF不同,利用编解码的边信息来信令通知偏移和滤波器系数,SAO和ALF分别通过添加偏移和通过应用有限脉冲响应(FIR)滤波器,使用当前图片的原始采样来减小原始采样和重建采样之间的均方误差。ALF位于每个图片的最后处理阶段,并且可以被认为是尝试捕捉和修补由先前阶段产生的伪像的工具。
2.3利用67个帧内预测模式的帧内模式编解码
为了捕获自然视频中出现的任意边缘方向,方向性帧内模式的数目从如在HEVC中使用的33扩展到65。在图2中,附加的方向性模式被示出为红色虚线箭头,并且平面和DC模式保持相同。这些更密集的方向性帧内预测模式应用于所有的块尺寸以及亮度和色度帧内预测。
如图1所示,传统的角度帧内预测方向被定义为顺时针方向上45度到-135度。在VTM2中,多个传统的角帧内预测模式被用于非方形块的广角帧内预测模式自适应地代替。使用原始方法来信令通知被替换的模式,并且被替换的模式在解析之后被重新映射到广角度模式的索引。帧内预测模式的总数未改变(例如,67),且帧内模式编解码未改变。
在HEVC中,每个帧内编解码块具有方形形状,并且其每一侧的长度是2的幂。因此,不需要除法运算来使用DC模式形成帧内预测器。在VTV2中,块可以具有矩形形状,这在一般情况下需要为每个块使用除法运算。为了避免用于DC预测的除法运算,仅使用较长的一侧来计算非方形块的平均值。
2.4用于非方形块的广角帧内预测
在一些实施例中,传统的角度帧内预测方向被定义为顺时针方向上45度到-135度。在VTM2中,多个传统的角帧内预测模式被用于非方形块的广角帧内预测模式自适应地代替。使用原始方法来信令通知被替换的模式,并且被替换的模式在解析之后被重新映射到广角度模式的索引。帧内预测模式的总数未改变(例如,67),且帧内模式编解码未改变。
如图3A和图3B中的示例所定义,为了支持这些预测方向,长度为2W+1的顶部参考和长度为2H+1的左侧参考被定义。
在一些实施例中,在广角方向模式中被替换模式的模式数目取决于块的纵横比。表1示出了被替换的帧内预测模式。
Figure BDA0003422772000000061
表1:由广角模式替换的帧内预测模式
如图4所示,在广角帧内预测的情况下,两个垂直地相邻的预测采样可以使用两个非相邻的参考采样。因此,低通参考采样滤波和侧平滑应用于广角预测以减小增加的间隙Δpα的负面影响。
2.5依赖于位置的帧内预测组合(PDPC)的示例。
在VTM2中,通过依赖于位置的帧内预测组合(PDPC)方法进一步修改平面模式的帧内预测结果。PDPC是一种帧内预测方法,其调用未滤波的边界参考采样和具有经过滤波的边界参考采样的HEVC式帧内预测的组合。PDPC被应用于以下不具有信令通知的帧内模式:平面、DC、水平、垂直、左下角度模式及其八个相邻角度模式,以及右上角度模式及其八个相邻角度模式。
预测采样pred(x,y)通过使用帧内预测模式(DC、平面、角度)和参考采样的线性组合根据以下等式来预测:
pred(x,y)=(wL×R-1,y+wT×Rx,-1-wTL×R-1,-1+(64-wL-wT+wTL)×pred(x,y)+32)>>shift
本文中,Rx,-1,R-1,y分别表示位于当前采样(x,y)的顶部和左侧的参考采样,而R-1,-1表示位于当前块的左上角的参考采样。
在一些实施例中,并且如果PDPC被应用于DC,平面,水平和垂直帧内模式,则不需要如在HEVC DC模式边界滤波器或水平/垂直模式边缘滤波器的情况下所需的另外的边界滤波器。
图5A-图5D示出了应用于各种预测模式的PDPC的参考采样(Rx,-1,R-1,y和R-1,-1)的定义。预测采样pred(x',y')位于预测块内的(x',y')处。参考采样Rx,-1的坐标x由下式给出:x=x'+y'+1,并且参考采样R-1,y的坐标y类似地由下式给出:y=x'+y'+1。
在一些实施例中,PDPC权重取决于预测模式,并且在表2中示出,其中S=shift。
Figure BDA0003422772000000071
表2:根据预测模式的PDPC权重的示例
2.6帧内子块分割
在JVET-M0102中,提出了ISP,其根据块尺寸维度将亮度帧内预测块垂直地或水平地划分为2个或4个子分割,如表3所示。图6和图7示出了两种可能性的示例。所有子分割满足具有至少16个采样的条件。
Figure BDA0003422772000000072
Figure BDA0003422772000000081
表3:取决于块尺寸的子分割的数目
对于这些子分割中的每一个,通过对由编码器发送的系数进行熵解码,然后进行逆量化和逆变换,来产生残差信号。然后,对子分割进行帧内预测,最后通过将残差信号与预测信号相加来获得对应的重建采样。因此,每个子分割的重建值将可用于生成下一个子分割的预测,这将重复该过程等等。所有子分割共享相同的帧内模式。
基于帧内模式和所利用的划分,使用两个不同类别的处理顺序,其被称为正常和反向顺序。按照正常顺序,待处理的第一子分割是包括CU的左上采样的子分割,然后继续向下(水平划分)或向右(垂直划分)。因此,用于产生子分割预测信号的参考采样仅位于行的左侧和上侧。另一方面,反向处理顺序从包括CU的左下采样的子分割开始并继续向上,或者从包括CU的右上采样的子分割开始并继续向左。
2.7块差分脉冲码调制编解码。
在JVET-M0057中提出了BDPCM。由于使用左(A)(上(B))像素来预测当前像素的水平(垂直)预测器的形状,处理块的最吞吐量有效的方式是并行地处理一列(行)的所有像素,并顺序地处理这些列(行)。为了增加吞吐量,我们引入以下过程:当在该块上选择的预测器是垂直的时,宽度为4的块被分成具有水平前沿的两半,并且当在该块上选择的预测器是水平的时,高度为4的块被分成具有垂直前沿的两半。
在划分块时,不允许来自一个区域的采样使用来自另一区域的像素来计算预测:如果这种情况发生,则预测像素在预测方向上被参考像素代替。在图8中针对垂直地预测的4×8块中的当前像素X的不同位置示出了该情况。
由于该特性,现在可以在2个周期中处理4×4块,并且在4个周期中处理4×8或8×4块,等等,如图9所示。
表4总结了处理块所需的周期的数量,该数量取决于块的尺寸。显然可以以每周期8个像素或更多像素处理两个维度都大于或等于8的任何块。
Figure BDA0003422772000000091
表4:尺寸为4×N、N×4的块的吞吐量
2.8量化的残差域BDPCM
在JVET-N0413中,提出了量化的残差域BDPCM(在下文中表示为RBDPCM)。帧内预测通过在类似于帧内预测的预测方向(水平预测或垂直预测)上的采样复制在整个块上进行。对残差进行量化,并对量化的残差与其预测器(水平或垂直)量化值之间的增量进行编解码。
对于尺寸为M(行)×N(列)的块,令ri,j,0≤i≤M-1,0≤j≤N-1为在使用来自上或左块边界采样的未滤波的采样水平地(在预测块上逐行地复制左邻像素值)或垂直地(将上邻排复制到预测块中的每一排)执行帧内预测之后的预测残差。令Q(ri,j),0≤i≤M-1,0≤j≤N-1代表残差ri,j的量化版本,其中残差是原始块值和预测块值之间的差。然后将块DPCM应用于量化的残差采样ri,j,得到修改的具有元素
Figure BDA0003422772000000095
的M×N阵列
Figure BDA0003422772000000096
当信令通知垂直BDPCM时:
Figure BDA0003422772000000092
对于水平预测,应用类似的规则,并且通过下式获得残差量化采样
Figure BDA0003422772000000093
残差量化采样
Figure BDA0003422772000000094
被发送到解码器。
在解码器侧,上述计算被反向以得到Q(ri,j),0≤i≤M-1,0≤j≤N-1。对于垂直预测情况,
Figure BDA0003422772000000101
值。
该方案的一个优点是,DPCM的倒置可以在系数解析的过程中完成,或者可以在解析之后完成,系数解析简单地添加预测器作为解析的系数。
变换跳过总是用在量化的残差域BDPCM中。
2.9 VVC中多变换集(MTS)
在VTM4中,允许进行大的块尺寸变换(尺寸高达64×64),这主要有益于更高分辨率的视频(例如,1080p和4K序列)。对于尺寸(宽度或高度,或者宽度和高度两者)等于64的变换块,高频变换系数被调零,从而仅保留低频系数。例如,对于M×N变换块,以M为块宽度,N为块高度,当M等于64时,仅保留变换系数的左32列。类似地,当N等于64时,仅保持变换系数的上32行。当变换跳过模式用于大的块时,使用整个块而不调零任何值。
除了已使用在HEVC中的DCT-II之外,多变换选择(MTS)方案被用于帧间编解码块和帧内编解码块两者的残差编解码。该方案使用从DCT8/DST7选择的多个变换。新引入的变换矩阵为DST-VII和DCT-VIII。下面的表4示出了所选择的DST/DCT的基函数。
Figure BDA0003422772000000102
Figure BDA0003422772000000111
表4:在VVC中使用的变换矩阵的基函数
为了保持变换矩阵的正交性,比HEVC中的变换矩阵更精确地量化变换矩阵。为了将变换的系数的中间值保持在16位范围内,在水平变换之后和在垂直变换之后,所有系数将具有10位。
为了控制MTS方案,分别在SPS级别为帧内和帧间指定单独的使能标志。当在SPS启用MTS时,信令通知CU级别标志来指示MTS是否被应用。这里,MTS仅用于亮度。当满足以下条件时,信令通知MTS CU级别标志。
ο宽度和高度均小于或等于32
οCBF标志等于1
如果MTS CU标志等于零,则在两个方向上应用DCT2。然而,如果MTS CU标志等于1,则另外信令通知两个其它标志分别指示水平方向和垂直方向的变换类型。变换和信令映射表如表5所示。对于变换矩阵精度时,使用8位主变换核心。因此,在HEVC中使用的所有变换核心保持相同,包括4点DCT-2和DST-7,8点、16点和32点DCT-2。而且,包括64点DCT-2,4点DCT-8,8点、16点、32点DST-7和DCT-8的其它变换核心使用8位主变换核心。
Figure BDA0003422772000000112
为了降低大尺寸DST-7和DCT-8的复杂度,对于尺寸(宽度或高度,或者宽度和高度两者)等于32的DST-7和DCT-8块,将高频变换系数调零。仅16×16低频区域内的系数被保留。
如在HEVC中,块的残差可以用变换跳过模式来编解码。为了避免语法编解码的冗余,当CU级别MTS_CU_flag不等于零时,不信令通知变换跳过标志。变换跳过的块尺寸限制与JEM4中的MTS的块尺寸限制相同,这表明当块宽度和高度都等于或小于32时,变换跳过可应用于CU。
2.10 JVET-N0193中提出的简化二次变换(RST)
2.10.1 JEM中的不可分二次变换(NSST)
在JEM中,在正主变换和量化(在编码器处)之间以及在去量化和逆主变换(在解码器侧)之间应用二次变换。如图10所示,执行4×4(或8×8)二次变换取决于块尺寸。例如,对于小块(即,min(宽度,高度)<8)应用4×4二次变换,而对于较大块(即,min(宽度,高度)>4),每8×8块应用8×8二次变换。
下面使用输入作为示例来描述不可分变换的应用。为了应用不可分变换,4×4输入块X
Figure BDA0003422772000000121
首先表示为向量:
Figure BDA0003422772000000122
Figure BDA0003422772000000123
不可分变换被计算为
Figure BDA0003422772000000124
其中
Figure BDA0003422772000000125
表示变换系数向量,并且T是16×16变换矩阵。16×1系数向量
Figure BDA0003422772000000126
随后使用该块的扫描顺序(水平的,垂直的或对角线的)被重新组织为4×4块。具有较小索引的系数将以较小的扫描索引被放置在4×4系数块中。总共35个变换集,并且每个变换集使用3个不可分变换矩阵(核)。从帧内预测模式到变换集的映射是预定义的。对于每个变换集,所选择的不可分二次变换(NSST)候选还由明确地信令通知的二次变换索引来指定。在变换系数之后,对于每个帧内CU,在比特流中以信令通知索引一次。
2.10.2JVET-N0193中的简化二次变换(RST)
在JVET-K0099中引入RST(又被称为低频不可分变换(LFNST)),并且在JVET-L0133中引入4个变换集(而不是35个变换集)映射。在该JVET-N0193中,使用16×64(进一步减少到16×48)和16×16矩阵。为了方便表示,16×64(减少到16×48)变换被表示为RST8×8,而16×16变换被表示为RST4×4。图11示出了RST的示例。
RST计算
简化变换(RT)的主要思想是将N维向量映射到不同空间中的R维向量,其中R/N(R<N)是简化因子。
RT矩阵是如下的R×N矩阵:
Figure BDA0003422772000000131
其中变换的R行是N维空间的R基。RT的逆变换矩阵是其正变换的转置。正RT和逆RT在图12中示出。
在该贡献中,应用具有简化因子4(1/4尺寸)的RST8×8。因此,使用了16×64直接矩阵代替64×64,其中64×64为传统的8×8不可分变换矩阵尺寸。换句话说,在解码器侧使用64×16逆RST矩阵在8×8左上区域中产生核心(主)变换系数。前向RST8×8使用16×64(或8×64,对于8×8块)矩阵,使得其只在给定的8×8区域内的左上4×4区域中产生非零系数。换句话说,如果应用RST,则除左上4×4区域外的8×8区域将仅具有零系数。对于RST4×4,应用16×16(或对于4×4块,应用8×16)直接矩阵乘法。
当满足以下两个条件时,有条件地应用逆RST:
ο块尺寸大于或等于给定阈值(W>=4&&H>=4)
ο变换跳过模式标志等于零
如果变换系数块的宽度(W)和高度(H)都大于4,则将RST8×8应用于变换系数块的左上8×8区域。否则,RST4×4应用于变换系数块的左上min(8,W)×min(8,H)区域。
如果RST索引等于0,则不应用RST。否则,应用RST,用RST索引选择其中的核。随后将解释RST选择方法和RST索引的编解码。
此外,RST用于帧内条带(slice)和帧间条带二者中的帧内CU,并且用于亮度和色度两者。如果启用了双树,则分别信令通知用于亮度和色度的RST索引。对于片间(禁用双树),信令通知单个RST索引,并将其用于亮度和色度。
在第13次JVET会议中,采用了帧内子分割(ISP)作为新的帧内预测模式。当选择ISP模式时,RST被禁用,并且RST索引不被信令通知,因为即使RST应用于每个可行的分割块,性能改善也是微不足道的。此外,为ISP预测的残差禁用RST可以降低编码复杂度。
RST选择
从四个变换集中选择RST矩阵,每个变换集由两个变换组成。应用哪个变换集是根据帧内预测模式而确定的,如下所述:
(1)如果指示三个CCLM模式中的一个,则选择变换集0。
(2)否则,根据下表进行变换集选择:
变换集选择表
Figure BDA0003422772000000141
访问上表的索引(表示为IntraPredMode)具有[-14,83]的范围,它是用于广角帧内预测的变换后的模式索引。
降维的RST矩阵
作为进一步的简化,应用16×48矩阵来代替具有相同变换集配置的16×64,其中每个变换集配置从左上8×8块中的除右下4×4块之外的三个4×4块中取48个输入数据(如图13所示)。
RST信令
R=16的正RST 8×8使用16×64矩阵,使得在给定的8×8区域内只在左上4×4区域产生非零系数。换句话说,如果应用RST,则除左上4×4区域外的8×8区域仅产生零系数。因此,当除了左上4×4(在图14中描述)之外的8×8块区域内检测到任何非零元素时,RST索引不被编解码,因为这意味着RST没有被应用。在这种情况下,RST索引被推断为零。
调零范围
通常,在对4×4子块应用逆RST之前,4×4子块中的任何系数可以是非零的。然而,在某些情况下,在对子块应用逆RST之前,4×4子块中的一些系数必须为零。
让nonZeroSize为变量。当在逆RST之前将其重新排列成1-D阵列时,要求索引不小于nonZeroSize的任何系数必须为零。
当nonZeroSize等于16时,左上4×4子块中的系数没有调零约束。
在JVET-N0193中,当当前块尺寸为4×4或8×8时,nonZeroSize被设置为等于8(即,如图14所示,扫描索引在[8,15]范围内的系数将为0)。对于其它的块尺寸,nonZeroSize被设置为等于16。
工作草案中RST的描述
序列参数集RBSP语法
Figure BDA0003422772000000151
Figure BDA0003422772000000161
残差编解码语法
Figure BDA0003422772000000162
Figure BDA0003422772000000171
编解码单元语法
Figure BDA0003422772000000172
Figure BDA0003422772000000181
序列参数集RBSP语义
......
sps_st_enabled_flag等于1指定了st_idx可以存在于用于帧内编解码单元的残差编解码语法中。sps_st_enabled_flag等于0指定了st_idx不存在于用于帧内编解码单元的残差编解码语法中。
......
编解码单元语义
......
st_idx[x0][y0]指定了在所选变换集中的两个候选核之间应用哪个二次变换核。st_idx[x0][y0]等于0指定了不应用二次变换。矩阵索引x0,y0指定了所考虑的变换块的左上采样相对于图片的左上采样的位置(x0,y0)。
当st_idx[x0][y0]不存在时,推断st_idx[x0][y0]等于0。
缩放变换系数的变换过程
一般情况
该过程的输入为:
–亮度位置(xTbY,yTbY),其指定相对于当前图片的左上亮度采样的当前亮度变换块的左上采样;
–变量nTbW,其指定当前变换块的宽度,
–变量nTbH,其指定当前变换块的高度,
–变量cIdx,其指定当前块的颜色分量,
–具有缩放变换系数的(nTbW)x(nTbH)矩阵d[x][y],其中x=0..nTbW-1,y=0..nTbH-1。
该过程的输出是残差采样的(nTbW)x(nTbH)矩阵r[x][y],其中x=0..nTbW-1,y=0..nTbH-1。
如果st_idx[xTbY][yTbY]不等于0,适用以下条件:
1.变量nStSize,log2StSize,numStX,numStY和nonZeroSize推导如下:
–如果nTbW和nTbH都大于或等于8,则log2StSize被设置为3,并且nStOutSize被设置为48。
–否则,log2StSize被设置为2,并且nStOutSize被设置为16。
–nStSize被设置为(1<<log2StSize)。
–如果nTbH等于4并且nTbW大于8,则numStx设置为等于2。
–否则,numStx设置为等于1。
–如果nTbW等于4并且nTbH大于8,则numStY被设置为等于2。
–否则,numStY设置为等于1。
–如果nTbW和nTbH都等于4,或者nTbW和nTbH都等于8,则nonZeroSize被设置为等于8。
–否则,将nonZeroSize设置为等于16。
2.对于xSbIdx=0..numStX-1和ySbIdx=0..numStY-1,适用以下:
–x=0..nonZeroSize-1的变量矩阵u[x]推导如下:
xC=(xSbIdx<<log2StSize)+
DiagScanOrder[log2StSize][log2StSize][x][0]
yC=(ySbIdx<<log2StSize)+
DiagScanOrder[log2StSize][log2StSize][x][1]
u[x]=d[xC][yC]
–通过以下调用如条款8.7.4.4中所指定的一维变换过程而将x=0..nonZeroSize-1的u[x]变换为x=0.nStOutSize-1的变量矩阵v[x]:缩放的变换系数nonZeroSize的变换输入长度、x=0..nonZeroSize-1的列表u[x]的变换输出长度nStOutSize、用于变换集选择的索引stPredModeIntra和变换集st_idx[xTbY][yTbY]中的变换选择的索引作为输入,并且输出是x=0..nStOutSize-1的列表v[x]。变量stPredModeIntra被设置为条款8.4.4.2.1中指定的predModeIntra。
–x=0..nStSize-1,y=0..nStSize-1的阵列d[(xSbIdx<<log2StSize)+x][(ySbIdx<<log2StSize)+y]推导如下:
–如果stPredModeIntra小于或等于34,或等于INTRA_LT_CCLM,INTRA_T_CCLM或INTRA_L_CCLM,则适用以下:
d[(xSbIdx<<log2StSize)+x][(ySbIdx<log2StSize)+y]=(y<4)?V[x+(y<log2StSize)]:((x<4)?V[32+x+((y-4)<2)]:
d[(xSbIdx<<log2StSize)+x][(ySbIdx<log2StSize)+y])
–否则,适用以下:
d[(xSbIdx<<log2StSize)+x][(ySbIdx<log2StSize)+y]=(y<4)?V[y+(x<log2StSize)]:((x<4)?V[32+(y-4)+(x<2)]:
d[(xSbIdx<<log2StSize)+x][(ySbIdx<log2StSize)+y])
二次变换过程
此过程的输入为:
–变量nTrS,其指定变换输出长度,
–变量nonZeroSize,其指定变换输入长度,
–变换输入x[j]的列表,其中j=0..nonZeroSize-1,
–变量stPredModeIntra,指定用于变换集选择的索引。
–变量stIdx,其指定用于集合中的变换选择的索引。
该过程的输出是i=0..nTrS-1的经过变换的采样y[i]的列表。
如条款8.7.4.5中指定的变换矩阵推导过程涉及:变换输出长度nTrS、用于变换集选择的索引stPredModeIntra、用于变换集中变换选择的索引stIdx作为输入,并且变换矩阵secTransMatrix作为输出。
i=0..nTrS-1的经过变换的采样y[i]的列表推导如下:
y[i]=Clip3(CoeffMin,CoeffMax,
Figure BDA0003422772000000211
Figure BDA0003422772000000212
其中,i=0..nTrS-1
CoeffMin=-(1<<15)and CoeffMax=(1<<15)-1;
二次变换矩阵推导过程
此过程的输入为:
–变量nTrS,其指定变换输出长度,
–变量stPredModeIntra,其指定用于变换集选择的索引,
–变量stIdx,其指定用于指定变换集中的变换选择的索引。
这个过程的输出是变换矩阵secTransMatrix。
变量stTrSetIdx推导如下:
Figure BDA0003422772000000221
如下基于nTrS,stTrSetIdx和stIdx推导变换矩阵secTransMatrix:
–如果nTrS等于16,stTrSetIdx等于0,且stIdx等于1,则适用以下:
SecTransMatrix[m][n]=...
–如果nTrS等于16,stTrSetIdx等于0,且stIdx等于2,则适用以下:
SecTransMatrix[m][n]=...
–如果nTrS等于16,stTrSetIdx等于1,且stIdx等于1,则适用以下:
SecTransMatrix[m][n]=...
–如果nTrS等于16,stTrSetIdx等于1,且stIdx等于2,则适用以下:
SecTransMatrix[m][n]=...
–如果nTrS等于16,stTrSetIdx等于2,且stIdx等于1,则适用以下:
SecTransMatrix[m][n]=...
–如果nTrS等于16,stTrSetIdx等于2,且stIdx等于2,则适用以下:
SecTransMatrix[m][n]=...
–如果nTrS等于16,stTrSetIdx等于3,且stIdx等于1,则适用以下:
SecTransMatrix[m][n]=...
–如果nTrS等于16,stTrSetIdx等于3,且stIdx等于2,则适用以下:
SecTransMatrix[m][n]=...
–如果nTrS等于48,stTrSetIdx等于0,并且stIdx等于1,则适用以下:
SecTransMatrix[m][n]=...
–如果nTrS等于48,stTrSetIdx等于0,并且stIdx等于2,则适用以下:
SecTransMatrix[m][n]=...
–如果nTrS等于48,stTrSetIdx等于1,并且stIdx等于1,则适用以下:
SecTransMatrix[m][n]=...
–如果nTrS等于48,stTrSetIdx等于1,并且stIdx等于2,则适用以下:
SecTransMatrix[m][n]=...
–如果nTrS等于48,stTrSetIdx等于2,并且stIdx等于1,则适用以下:
SecTransMatrix[m][n]=...
–如果nTrS等于48,stTrSetIdx等于2,并且stIdx等于2,则适用以下:
SecTransMatrix[m][n]=...
–如果nTrS等于48,stTrSetIdx等于3,并且stIdx等于1,则适用以下:
SecTransMatrix[m][n]=...
–如果nTrS等于48,stTrSetIdx等于3,并且stIdx等于2,则适用以下:
SecTransMatrix[m][n]=...
2.11 HEVC中去量化的削减
在HEVC中,缩放的变换系数d’被计算为
d'=Clip3(coeffMin,coeffMax,d),
其中d是削减之前的缩放的变换系数。
对于亮度分量,
CoeffMin=CoeffMinY,CoeffMax=CoeffMaxY;
对于色度分量,
CoeffMin=CoeffMinC,CoeffMax=CoeffMaxC。
本文中,
CoeffMinY=-(1<<(extended_precision_processing_flag?Max(15,BitDepthY+6):15))
CoeffMinC=-(1<<(extended_precision_processing_flag?Max(15,BitDepthC+6):15))
CoeffMaxY=(1<<(extended_precision_processing_flag?Max(15,BitDepthY+6):15))-1
CoeffMaxC=(1<<(extended_precision_processing_flag?Max(15,BitDepthC+6):15))–1
extended_precision_processing_flag是在SPS中信令通知的语法元素。
2.12仿射线性加权帧内预测(ALWIP,或基于矩阵的帧内预测)
在JVET-N0217中提出了仿射线性加权帧内预测(ALWIP,或基于矩阵的帧内预测(MIP))。
在JVET-N0217中,进行了两个测试。在测试1中,ALWIP被设计为具有8K字节的存储器限制,并且每个采样至多4次乘法。测试2类似于测试1,但在存储器需求和模型结构方面进一步简化了设计。
ο用于所有块形状的矩阵和偏移向量的单个集合。
ο对于所有的块形状,模式数量减少到19。
ο将存储器需求减少到5760个10位值,即7.20千字节。
ο在每个方向的单个步骤中执行预测的采样的线性内插,代替如第一测试中的迭代内插。
2.13子块变换
对于cu_cbf等于1的帧间预测的CU,可以信令通知cu_sbt_flag以指示是否对整个残差块或残差块的子部分进行了解码。在前一种情况下,进一步解析帧间MTS信息以确定CU的变换类型。在后一种情况下,利用推断的适应性变换对残差块的一部分进行编解码,并且将残差块的另一部分调零。SBT不被应用于组合的帧间-帧内模式。
在子块变换中,对SBT-V和SBT-H(总是使用DCT-2的色度TB)中的亮度变换块应用依赖于位置的变换。SBT-H和SBT-V的两个位置与不同的核心转换有关。更具体地,在图15中指定了每个SBT位置的水平和垂直变换。例如,SBT-V位置0的水平和垂直变换分别是DCT-8和DST-7。当残差TU的一侧大于32时,对应的变换被设置为DCT-2。因此,子块变换联合指定残差块的TU平铺,cbf以及水平和垂直变换,这可以被认为是用于块的主要残差在该块的一侧的情况的语法快捷方式。
3现有实现方式中的缺陷示例
MTS的当前设计存在以下问题:
信令通知的索引可能导致开销位。
一些变换的组合在MTS和SBT中可能不是有效的。
在当前VVC中,不论当前块是否以QR-BDPCM模式编解码,都对变换跳过(TS)标志进行编解码。然而,当启用QR-BDPCM时,不需要应用变换。因此,当一个块用QR-BDPCM编解码时,TS标志的信令是冗余的。
在当前的VVC中,用一个上下文对变换跳过标志进行上下文编解码,该上下文也可以用于对指示变换矩阵是否是DCT2的二进制数进行编解码。共享的上下文可能效率较低。
存在使用9个上下文的5个上下文编解码的二进制数(bin),其中该9个上下文用于对影响解析吞吐量的变换矩阵索引进行编解码。
QR-BDPCM/TS也可应用于色度块。如何更好地确定QR-BDPCM/TS的使用需要进一步研究。
4用于多种变换的示例性方法
当前公开的技术的实施例克服了现有实现方式的缺点,从而提供了具有更高编解码效率但计算复杂度更低的视频编解码。在以下针对各种实现方式所描述的示例中阐述了如本文档中所描述的用于多种变换的方法,其可以增强现有的和未来的视频编解码标准。下面提供的所公开的技术的示例解释了一般概念,并且不意味着被解释为限制。在示例中,除非明确指出相反的情况,可以组合在这些示例中描述的各特征。
在以下示例中,假定:
οMax(x,y)返回x和y中较大的一个
οMin(x,y)返回x和y中较小的一个。
隐式MTS
提出根据经过解码的系数来决定应用于一个块的变换(水平变化和/或垂直变换),而不接收变换索引。
1.经过解码的系数可以和与当前块相同的颜色分量或不同颜色分量中的一个或多个代表块相关联。
a.在一个示例中,对第一块的变换的确定可以取决于第一块的经过解码的系数。
b.在一个示例中,对第一块的变换的确定可以取决于第二块的经过解码的系数,该经过解码的系数可以不同于第一块。
i.在一个示例中,第二块可以在与第一块的颜色分量相同的颜色分量(例如亮度分量)中。
1)在一个示例中,第二块可以与第一块相邻。
2)在一个示例中,第二块可具有与第一块相同的帧内预测模式。
3)在一个示例中,第二块可以具有与第一块相同的块维度。
4)在一个示例中,第二块可以是在解码次序中第一块之前的、满足某些条件(例如,相同的帧内预测模式或相同的维度)的最后的经过解码的块。
ii.在一个示例中,第二块可以在与第一块的颜色分量不同的颜色分量中。
1)在一个示例中,第一块可以在亮度分量中,而第二块可以在色度分量(例如,Cb/Cr,B/R分量)中。
a)在一个示例中,三个块在相同的编解码单元中。
b)此外,可替代地,隐式MTS仅应用于亮度块,而不应用于色度块。
2)在一个示例中,第一颜色分量中的第一块和第二颜色分量中的第二块可以彼此位于图片的对应位置。
c.在一个示例中,对第一块的变换的确定可取决于包括与第一块不同的至少一个块的多个块的经过解码的系数。
i.在一个示例中,多个块可以包括第一块。
ii.在一个示例中,多个块可以包括一个块或与第一块相邻的多个块。
iii.在一个示例中,多个块可以包括一个块或具有与第一块相同的块维度的多个块。
iv.在一个示例中,多个块可以包括解码次序中第一块之前的、满足特定条件(例如,相同的帧内预测模式或相同的维度)的最后N个经过解码的块。N是大于1的整数。
v.在一个示例中,多个块可以包括不与第一块处于相同颜色分量的一个或多个块。
1)在一个示例中,第一块可以在亮度分量中。多个块可以包括色度分量中的块(例如,Cb/B分量中的第二块,以及Cr/R分量中的第三块)。
a)在一个示例中,三个块在相同的编解码单元中。
b)此外,可替代地,隐式MTS仅应用于亮度块,而不应用于色度块。
2)在一个示例中,包括在多个块中的第一颜色分量中的第一块和不在第一分量颜色分量中的块中的多个可以位于具有第一块的图片的对应位置。
2.用于变换确定的经过解码的系数是不等于零的系数(表示为重要系数)。用于变换确定的系数被称为代表系数。
a.在一个示例中,代表系数是代表块中的所有重要系数。
b.可替代地,代表系数是代表块中的部分重要系数。
i.在一个示例中,代表系数是大于或不大于阈值的经过解码的重要系数
ii.在一个示例中,代表系数是小于或不大于阈值的经过解码的重要系数
iii.在一个示例中,代表系数是解码次序中的前K(K>=1)个经过解码的重要系数。
iv.在一个示例中,代表系数是解码次序中最后的K(K>=1)个经过解码的重要系数。
v.在一个示例中,代表系数可以是块中预定位置处的那些。
1)在一个示例中,代表系数可以仅包括位于相对于代表性块的(xPos,yPos)坐标处的一个系数。例如,xPos=yPos=0。
2)例如,位置可以取决于块的维度。
vi.在一个示例中,代表系数可以是在系数扫描顺序中的预定位置处的那些。
c.可替代地,代表系数也可以包括零系数。
d.可替代地,代表系数可以是从经过解码的系数推导出的系数,例如通过经由量化削减到一范围。
3.变换确定可以取决于代表系数的函数,诸如以值V作为输出并使用代表系数作为输入的函数。
a.在一个示例中,V被推导为代表系数的数目。
i.可替代地,V被推导为代表系数的和。
1)此外,可替代地,可对和进行削减以得到V。
ii.可替代地,V被推导为代表系数的绝对值之和。
1)此外,可替代地,可对和进行削减以得到V。
b.在一个示例中,可以根据V的奇偶性在解码器处隐式地确定选择。
i.例如,如果V是偶数,则将第一类变换选择为水平变换,并且将第二类变换选择为垂直变换;若V为奇数,则将第三类变换选择为水平变换,将第四类变换选择为垂直变换。
1)在一个示例中,第一类变换与第二类变换相同。
a)可替代地,第一类变换不同于第二类变换。
2)在一个示例中,第三类变换与第四类变换相同。
a)可替代地,第三类变换不同于第四类变换。
3)第一/第二/第三/第四类变换是特定变换,例如DCT-X或DST-Y。X可以是整数,例如2或8。Y可以是整数,例如7或8。
4)此外,可替代地,第三类变换和第四类变换中的至少一个不同于第一和第二类变换。
a)在一个示例中,当V是偶数时,第一类变换和第二类变换是DCT-2,而当V是奇数时,第三类变换和第四类变换是DST-7。
b)可替代地,当V是奇数时,第一类变换和第二类变换是DCT-2,而当V是偶数时,第三类变换和第四类变换是DST-7。
c.在一个示例中,如果V小于阈值T1,则将第五类变换选择为水平变换,并选择第六类变换作为垂直变换。例如,T1=1或2。
i.可替代地,如果V大于阈值T2,则将第五类变换选择为水平变换,并将第六类变换选择为垂直变换。
ii.例如,阈值可以取决于块的维度。
iii.例如,阈值可以取决于QP。
iv.在一个示例中,第五类变换与第六类变换相同。
1)可替代地,第五类变换不同于第六类变换。
v.在一个示例中,第五/第六类变换是特定变换,例如DCT-X或DST-Y。X可以是整数,例如2或8。Y可以是整数,例如7或8。
4.变换确定还可以取决于当前块的经过编解码的信息。
a.在一个示例中,如果当前帧内编解码块处于I-条带/图片中,则当V为偶数时,可将DST-7应用于当前块,且当V为奇数时,可将DCT-2应用于当前块。
b.在一个示例中,如果当前帧内编解码块处于P/B-条带/图片中,且V为偶数,则可将DCT-2应用至当前块,且当V为奇数时,可将DST-7应用至当前块。
c.在一个示例中,所述确定可进一步取决于模式信息(例如,帧内或帧间)。
5.可以预先定义可以从中选择隐式MTS变换的变换集。
a.在一个示例中,水平和垂直变换集可以不相同。
i.可替代地,水平和垂直变换集可以不相同。
b.在一个示例中,变换集可以包括DCT-2和DST-7。
c.在一个示例中,变换集可以包括DCT-2,DST-7和识别变换。
d.在一个示例中,变换集可以取决于经过编解码的信息,颜色分量,分割结构(例如,双树/单树;四叉树/二叉树/三叉树/扩展四叉树),条带/图片类型等。
i.在一个示例中,变换集可以取决于块维度。
ii.在一个示例中,对于帧内编解码块,可以包括DCT-2和DST-7。
iii.在一个示例中,对于在同一图片(例如,帧内块拷贝)中利用参考采样进行编解码的块,可以包括DST-7和身份变换(即,不应用变换)。
6.在一个示例中,项目1-5中公开的方法中的一个或多个只能应用于特定的块。
a.例如,项目1-5中公开的方法中的一个或多个只能应用于帧内编解码块。
简化MTS/SBT
7.在一个示例中,在MTS中垂直变换和水平变换必须是相同的。
a.在一个示例中,块只能选择如下两类转换之一:
i.水平变换中的DCT-2和垂直变换中的DCT-2;
ii.水平变换中的DST-7和垂直变换中的DST-7;
b.在一个示例中,用于MTS的信令可以包括用于块的至多一个标志。
i.在一个示例中,如果标志等于0,水平变换中的DCT-2和垂直变换中的DCT-2;如果标志等于1,水平变换中的DST-7和垂直变换中的DST-7。
ii.在一个示例中,如果标志等于1,水平变换中的DCT-2和垂直变换中的DCT-2;如果标志等于0,水平变换中的DST-7和垂直变换中的DST-7。
8.假设块的宽度和高度分别为W和H。仅当以下情况时,项目7被应用
a.W>=T1且H>=T2,例如T1=T2=8;
b.W<=T1且H<=T2,例如T1=T2=16;
c.Min(W,H)>=T1,例如T1=8;
d.Max(W,H)<=T1,例如T1=32;
e.W*H>=T1,例如T1=64;
f.W*H<=T1,例如T1=256。
9.在一个示例中,可以在用SBT进行编解码的块中应用除DST-8之外的变换。
a.在一个示例中,只有DCT-2和DST-7可以应用于用SBT进行编解码的块中。
b.在一个示例中,在用于如图15所示的SBT的(SBT-V,位置0)的情况下,水平地应用DCT-2并且垂直地应用DST-7。
c.在一个示例中,在用于如图15所示的SBT的(SBT-H,位置0)的情况下,水平地应用DST-7并且垂直地应用DCT-2。
10.假设变换块的宽度和高度分别是W和H。在一个示例中,对用SBT进行编解码的块的变换的选择可取决于变换块维度,其中当应用SBT时,变换块可小于编解码块。
a.在一个示例中,在如图15所示的用于SBT的(SBT-V,位置0)的情况下,如果W>=T1,则水平地应用DCT-2并且垂直地应用DST-7。否则,水平地应用DCT-8并且垂直地应用DST-7。例如,T1=8。
b.在一个示例中,在用于如图15所示的SBT的(SBT-H,位置0)的情况下,如果H>=T1,则水平地应用DST-7并且垂直地应用DCT-2。否则,水平地应用DST-7并且垂直地应用DCT-8。例如,T1=8。
一般特征
11.变换矩阵的决定可以在CU/CB级别或TU级别中完成。
a.在一个示例中,在CU级别中做出决定,其中所有TU共享相同的变换矩阵。
i.此外,可替代地,当一个CU被划分成多个TU时,可以利用一个TU(例如,第一个或最后一个TU)或者部分或全部TU中的系数来确定变换矩阵。
b.使用CU级别解决方案还是TU级别解决方案可以取决于块尺寸和/或VPDU尺寸和/或一个块的最大CTU尺寸和/或经过编解码的信息。
i.在一个示例中,当块尺寸大于VPDU尺寸时,可应用CU级别确定方法。
12.在本文档中公开的方法中,可以对系数或代表系数进行量化或去量化。
13.变换跳过也可以由系数或代表系数隐式地利用本文档中公开的任何方法来确定。
14.在本文档中公开的方法中,系数或代表系数可以在用于推导变换之前被修改。
a.例如,系数或代表系数可以在用于推导变换之前被削减。
b.例如,系数或代表系数可以在用于推导变换之前被缩放。
c.例如,系数或代表系数可以在用于推导变换之前与一个偏移相加。
d.例如,系数或代表系数可以在用于推导变换之前被进行滤波。
e.例如,系数或代表系数可以在用于推导变换之前被映射到其它值(例如,经由查找表)。
15.本文档中公开的方法也可以被用于通过系数或代表系数隐式地推导其它编解码模式/信息。
a.在一个示例中,所公开的方法可用于推导可应用于块的子区域的二次变换。
b.此外,可替代地,代表系数来自与子区域而不是整个块对应的系数。
16.在一个示例中,可以在序列级别/图片级别/条带级别/片组级别(tilegrouplevel),诸如在序列标头/图片标头/SPS/VPS/DPS/PPS/APS/条
带标头/片组标头,信令通知是否和/或如何应用上文所公开的方法。
17.在一个示例中,是否和/或如何应用上文所公开的方法可以取决于编解码信息,其中编解码信息可以包括:
a.块维度。
i.在一个示例中,对于宽度和高度都不大于阈值(例如,32)的块,可以应用上述隐式MTS方法。
b.QP
c.图片或条带类型(例如I-帧或P/B-帧,I-条带或P/B-条带)
i.在一个示例中,所提出的方法可在I-帧上启用,但在P/B-帧上禁用。
d.一种结构划分方法(单树或双树)
i.在一个示例中,对于单树划分应用的条带/图片/砖块/片,可以应用上述隐式MTS方法。
e.编解码模式(例如帧间模式/帧内模式/IBC模式等)
i.在一个示例中,对于帧内编解码块,可应用上述隐式MTS方法。
f.编解码方法(例如,帧内子块分割,派生树(DT)方法等)
i.在一个示例中,对于应用DT的帧内编解码块,可以禁用上述隐式MTS方法。
ii.在一个示例中,对于应用了ISP的帧内编解码块,可以禁用上述隐式MTS方法。
g.颜色分量
i.在一个示例中,对于亮度块,可以应用上述隐式MTS方法,而对于色度块,可以不应用上述隐式MTS方法。
h.帧内预测模式(例如DC,垂直,水平等)
i.运动信息(例如MV和参考索引)。
j.标准配置文件/级别/层级
用于色度分量的编解码工具
18.提出了取决于编解码工具X是否被应用于一个或多个对应的亮度块,编解码工具X可以被应用于块的一个或多个色度分量。在下面的讨论中,"色度分量"可以指"一个或多个色度分量"。
a.在一个示例中,用于色度块的编解码工具X的使用是从编解码工具是否被应用于对应亮度块的信息推导出的。因此,不需要额外的用于色度块的编解码工具X的使用的信令通知。
i.在一个示例中,如果编解码工具X应用于对应的亮度块,则编解码工具X可以应用于块的色度分量;并且,如果编解码工具X没有应用于对应的亮度块,则不将编解码工具X应用于该块的色度分量。
ii.在一个示例中,当编解码工具X应用于对应的亮度块时,编解码工具X可以以相同的方式应用于亮度分量和色度分量。
b.在一个示例中,可以有条件地信令通知消息(例如标志或索引)以指示编解码工具X是否被应用于块的色度分量。该条件可以被定义为编解码工具X是否应用于对应的亮度块。另外,可替代地,如果编解码工具X没有应用于对应的亮度块,则编解码工具X在没有信令通知的情况下不被应用于块的色度分量。
i.在一个示例中,当编解码工具X应用于对应的亮度块并且消息指示编解码工具X也被应用于色度分量时,编解码工具X可以以相同的方式应用于亮度分量和色度分量。
ii.在一个示例中,编解码工具X可以以不同的方式应用于亮度分量和色度分量。
1)可以信令通知如何将编解码工具X分别应用于亮度分量和色度分量。
c.在上述讨论中,“对应的亮度块”可以指覆盖色度块的至少一个“对应采样”的亮度块。采样位置可以根据颜色格式来缩放,例如4:4:4或4:2:0。假设色度块的左上角位置是(x0,y0),并且色度块的宽度和高度是W和H,所有这些都被缩放到亮度采样单元。
i.在一个示例中,对应的采样可以在(x0,y0)处;
ii.在一个示例中,对应的采样可以在(x0+W-1,y0+H-1)处;
iii.在一个示例中,对应的采样可以在(x0+W/2-1,y0+H/2-1)处;
iv.在一个示例中,对应的采样可以在(x0+W/2,y0+H/2)处;
v.在一个示例中,对应的采样可以在(x0+W/2,y0+H/2-1)处;
vi.在一个示例中,对应的采样可以在(x0+W/2-1,y0+H/2)处;
19.提出了取决于编解码工具X是否被应用于另一色度分量的一个或多个对应块,编解码工具X可以被应用于块的一个色度分量。
a.在一个示例中,用于色度块的编解码工具X的使用是从编解码工具是否被应用于其它色度分量的对应块的信息推导出来的。因此,不需要额外的用于色度块的编解码工具X的使用的信令通知。
b.在一个示例中,可有条件地信令通知消息(例如标志)以指示编解码工具X是否被应用于块的色度分量。该条件可以被定义为编解码工具X是否被应用于其它色度分量的对应块。另外,可替代地,如果编解码工具X没有应用于其它色度分量的对应的块,则编解码工具X在没有信令的情况下不被应用于块的色度分量。
20.提出了取决于编解码工具X是否应用于色度分量的一个或多个对应的块,编解码工具X可以应用于块的亮度分量。
a.在一个示例中,用于亮度块的编解码工具X的使用是从编解码工具是否被应用于色度分量的对应块的信息推导出来的。因此,不需要额外的用于色度块的编解码工具X的使用的信令通知。
b.在一个示例中,可有条件地信令通知消息(例如标志)以指示编解码工具X是否被应用于块的亮度分量。该条件可以被定义为编解码工具X是否被应用于色度分量的对应块。可替代地,如果编解码工具X没有应用于色度分量的对应的块,则编解码工具X在没有信令的情况下不被应用于块的亮度分量。
21.上述编解码工具X可以定义如下。
a.在一个示例中,编解码工具X可以是MTS。
b.在一个示例中,编解码工具X可以是变换跳过。
c.在一个示例中,编解码工具X可以是RST。
d.在一个示例中,编解码工具X可以是RBDPCM。
e.在一个示例中,编解码工具X可以是BDPCM。
MTS索引和变换跳过标志的信令
22.提出了取决于BDPCM或QR-BDPCM的使用或BDPCM的任何变型,可以有条件地信令通知MTS索引和/或变换跳过标志。
a.在一个示例中,当对于比特流中的块启用BDPCM或QR-BDPCM或BDPCM的任何变型时(例如intra_bdpcm_flag等于真),对于该块可以不信令通知MTS索引和/或变换跳过标志。
i.此外,可替代地,当在块中启用BDPCM或QR-BDPCM或BDPCM的任何变型时,可以推断块的变换跳过标志为真。
b.在一个示例中,当在块中启用BDPCM或QR-BDPCM或BDPCM的任何变型时,可以推断块的MTS索引为0。
23.可应用固定长度编解码以对除TS和DCT-2之外的不同MTS类型(诸如VVC规范中的DST7-DST7,DCT8-DST7,DST7-DCT8,DCT8-DCT8)进行编解码。
a.在一个示例中,可以应用具有2个二进制数的固定长度。
b.在一个示例中,每个二进制数可以是上下文编解码的。
c.在一个示例中,第一二进制数或最后的二进制数可以是上下文编解码的,而剩余的二进制数是旁路编解码的。
d.在一个示例中,所有的二进制数都被旁路编解码。
24.变换矩阵索引(例如,TS,DCT-2,其它变换矩阵)的上下文建模可取决于经过编解码的模式,变换块尺寸和/或QT深度和/或MTT深度和/或BT深度和/或TT深度。
a.在一个示例中,用于变换矩阵索引的上下文建模可取决于块的编解码模式,例如块是否以帧内/帧间/IBC模式进行编解码。
b.在一个示例中,用于变换矩阵索引的上下文建模可取决于多个分割深度的函数,其中该多个分割深度可包括QT深度、MTT深度、BT深度、TT深度。
c.在一个示例中,变换矩阵索引的上下文建模可取决于TU/TB相对于CU/PU的变换深度。
d.在一个示例中,可以将上下文索引增量设置为TU/TB维度的函数。
i.在一个示例中,上下文索引增量可以被设置为((Log2(TbW)+log2(TbH))>>1)–X,其中TBW和TBH指示变换块的宽度和高度,X是整数(诸如X=2)。
ii.在一个示例中,上下文索引增量可被设置为Log2(max(TbW,TbH))–X,其中TBW和TBH指示变换块的宽度和高度,X是整数(诸如X=2),max(a,b)返回较大的值。
iii.在一个示例中,上下文索引增量可以被设置为Log2(min(TbW,TbH))–X,其中TBW和TBH指示变换块的宽度和高度,X是整数(诸如X=2),min(a,b)返回较小的值。
iv.上述上下文索引增量可以进一步被裁剪到例如[k0,k1]的范围,其中k0和k1是整数。
e.在一个示例中,可以将上下文索引增量设置为TU/TB宽度或高度的函数。
f.在一个示例中,可以将上下文索引增量设置为MTT深度的函数。
g.在一个示例中,可以将上下文索引增量设置为min(K,四叉树深度),其中函数min(a,b)返回a和b之间的较小值,K是诸如4或5的整数。
h.在一个示例中,上述方法可应用于矩阵索引编解码中使用的特定于代码的二进制数。
i.在一个示例中,用于指示它是否是DCT2的二进制数是上下文编解码的,并且上下文建模基于上述方法,例如tu_mts_idx的第一二进制数。
25.提出了可以共享用于对是TS还是DCT2的指示进行编解码的上下文建模。
a.在一个示例中,用于编解码transform_skip_flag和tu_mts_idx的第一二进制数的上下文建模(即,如何选择上下文索引)可以是相同的。
b.此外,可替代地,用于对这两个二进制数进行编解码的上下文可以是不同的或部分共享的。
i.在一个示例中,第一集合上下文可用于对transform_skip_flag进行编解码,且第二集合上下文可用于对tu_mts_idx的第一二进制数进行编解码。并且这两个集合不共享。
c.此外,可替代地,用于对这两个二进制数进行编解码的上下文也可以完全共享。
26.提出了可以将单个上下文用于语法元素tu_mts_idx的部分或全部上下文编解码的二进制数。
a.例如,可以将单个上下文用于tu_mts_idx的第一二进制数。
b.例如,可以将单个上下文用于除tu_mts_idx的第一二进制数之外的所有二进制数。
i.此外,可替代地,可以使用项目24中提到的上下文建模方法对tu_mts_idx的第一二进制数进行上下文编解码。
1.在一个示例中,取决于变换尺寸,第一二进制数可以用N个上下文进行上下文编解码(例如,上下文索引增量可以被设置为((Log2(TbW)+log2(TbH))>>1)–2,使得N=4),并且所有剩余二进制数可以是用单个上下文进行编解码的上下文。
c.此外,可替代地,可以对tu_mts_idx的第一二进制数和第二二进制数进行上下文编解码,并且可以对所有剩余的二进制数进行旁路编解码。
d.在一个示例中,可以根据变换尺寸(例如,N=4),用N个上下文对第一二进制数进行上下文编解码,而可以用单个上下文对第二二进制数进行上下文编解码,并且可以对剩余的二进制数进行旁路编解码。例如,tu_mts_idx的所有二进制数可以被旁路编解码。
27.可以以以下方式定义变换矩阵的二进制化:
a.在一个示例中,下表示出了映射的二进制数和对应的矩阵。
变换矩阵 二进制数串
TS 0
DCT2-DCT2 1 0
DST7-DST7 1 1 0
DCT8-DST7 1 1 1 0
DST7-DCT8 1 1 1 1 0
DCT8-DCT8 1 1 1 1 1
b.在一个示例中,下表示出了映射的二进制数和对应的矩阵。
变换矩阵 二进制数串
TS 0
DCT2-DCT2 1 0
DST7-DST7 1 1 0 0
DCT8-DST7 1 1 0 1
DST7-DCT8 1 1 1 0
DCT8-DCT8 1 1 1 1
c.在一个示例中,下表示出了映射的二进制数和对应的矩阵。
变换矩阵 二进制数串
TS 1
DCT2-DCT2 0 1
DST7-DST7 0 0 0 0
DCT8-DST7 0 0 0 1
DST7-DCT8 0 0 1 0
DCT8-DCT8 0 0 1 1
d.在一个示例中,下表示出了映射的二进制数和对应的矩阵。
Figure BDA0003422772000000411
Figure BDA0003422772000000421
e.在一个示例中,下表示出了映射的二进制数和对应的矩阵。
变换矩阵 二进制数串
TS 0
DCT2-DCT2 11
DST7-DST7 10
f.在一个示例中,下表示出了映射的二进制数和对应的矩阵。
变换矩阵 二进制数串
TS 1
DCT2-DCT2 00
DST7-DST7 01
g.在一个示例中,下表示出了映射的二进制数和对应的矩阵。
变换矩阵 二进制数串
TS 1
DCT2-DCT2 01
DST7-DST7 00
28.提出了MTS仅具有转换的两种候选组合:DCT2-DCT2和DST7-DST7。
上述示例可以结合在下文中描述的方法的上下文中,例如,方法1610、1620、1630、1640和1650,其可以在视频编码器和/或解码器处实现。
图16A示出了用于视频处理的示例性方法的流程图。方法1610包括:在操作1612中,作为视频的当前块和视频的比特流表示之间的转换的一部分,基于编解码工具对视频的对应亮度分量的选择性应用,将编解码工具应用至视频的一个或多个色度分量。
方法1610包括:在操作1614中,进行转换。
图16B示出了用于视频处理的示例性方法的流程图。方法1620包括:在操作1622中,作为视频的第一色度分量的当前块和视频的比特流表示之间的转换的一部分,基于编解码工具对视频的其它色度分量的一个或多个对应块的选择性应用,将编解码工具应用至当前块。
方法1620包括:在操作1624中,进行转换。
图16C示出了用于视频处理的示例性方法的流程图。方法1630包括:在操作1632中,作为视频的当前块和视频的比特流表示之间的转换的一部分,基于编解码工具对视频的一个或多个对应色度分量的选择性应用,将编解码工具应用至视频的亮度分量。
方法1630包括:在操作1634中,进行转换。
图16D示出了用于视频处理的示例性方法的流程图。方法1640包括:在操作1642中,执行视频的当前块与视频的比特流表示之间的转换。在一些实施例中,多变换集(MTS)索引和/或变换跳过标志是否在比特流表示中信令通知是基于用于当前块的、基于块差分脉冲编解码调制(BDPCM)的编解码工具的启用。
图16E示出了用于视频处理的示例性方法的流程图。方法1650包括:在操作1652中,基于用于视频的当前块的多变换集(MTS)类型,选择具有多个二进制数的编解码类型。
方法1650包括:在操作1654中,作为当前块和视频的比特流表示之间的转换的一部分,将编解码类型应用至MTS类型的指示。
5所公开的技术的示例性实施
在以下实施例中,使用粗体双大括号指示添加,例如,{{a}}指示已添加“a”,而使用粗体双括号指示删除,例如,[[a]]指示已删除“a”。
5.1实施例#1
JVET-N1001-v7中指定的工作草案可以如下改变。
8.7.4用于缩放的变换系数的变换过程
8.7.4.1一般情况
...
表8-17-取决于cu_sbt_horizontal_flag和cu_sbt_pos_flag的trTypeHor和trTypeVer的说明
cu_sbt_horizontal_flag cu_sbt_pos_flag trTypeHor trTypeVer
0 0 {{nTbW>=8?0:}}2 1
0 1 1 1
1 0 1 {{nTbH>=8?0:}}2
1 1 1 1
5.2实施例2
JVET-N1001-v8中指定的工作草案可以如下改变。
7.3.7.10变换单元语法
Figure BDA0003422772000000451
可替代地,可应用以下:
Figure BDA0003422772000000461
5.3实施例3
JVET-N1001-v8中指定的工作草案可以如下改变。
9.5.3.7固定长度二进制化过程
...
{{
9.5.3.8用于tu_mts_idx的二进制化过程
该过程的输入是对语法元素tu_mts_idx的二进制化的请求。该过程的输出是语法元素的二进制化。
用于语法元素tu_mts_idx的二进制化在表9-14中指定。
表9-14—tu_mts_idx的二进制化
Figure BDA0003422772000000471
}}
5.4实施例4
JVET-N1001-v8中指定的工作草案可以如下改变。
9.5.4.2用于ctxTable、ctxIdx和bypassFlag的推导过程
9.5.4.2.1一般情况
...
表9-17–对具有经过上下文编解码的二进制数的语法元素分配ctxInc
Figure BDA0003422772000000472
5.5实施例5
JVET-N1001-v8中指定的工作草案可以如下改变。
9.5.4.3用于ctxTable、ctxIdx和bypassFlag的推导过程
9.5.4.3.1一般情况
...
表9-17–对具有经过上下文编解码的二进制数的语法元素分配ctxInc
Figure BDA0003422772000000481
5.6实施例6
JVET-N1001-v8中指定的工作草案可以如下改变。
9.5.4.4用于ctxTable、ctxIdx和bypassFlag的推导过程
9.5.4.4.1一般情况
...
表9-17–对具有经过上下文编解码的二进制数的语法元素分配ctxInc
Figure BDA0003422772000000482
5.7实施例6
JVET-N1001-v8中指定的工作草案可以如下改变。
9.5.4.5用于ctxTable、ctxIdx和bypassFlag的推导过程
9.5.4.5.1一般情况
...
表9-17–对具有经过上下文编解码的二进制数的语法元素分配ctxInc
Figure BDA0003422772000000491
5.8实施例7
JVET-N1001-v8中指定的工作草案可以如下改变。
9.5.4.6用于ctxTable、ctxIdx和bypassFlag的推导过程
9.5.4.6.1一般情况
...
表9-17–对具有经过上下文编解码的二进制数的语法元素分配ctxInc
Figure BDA0003422772000000492
可替代地,可应用以下内容:
Figure BDA0003422772000000493
图17是视频处理装置1700的框图。设备1700可以用于实现本文中描述的一个或多个方法。装置1700可以实施在智能电话、平板计算机、计算机、物联网(IoT)接收器等中。装置1700可以包括一个或多个处理器1702,一个或多个存储器1704和视频处理硬件1706。处理器1702可经配置以实现本文档中所描述的一个或多个方法(包括但不限于方法1610、1620、1630、1640和1650)。一个或多个存储器1704可用于存储用于实现本文中描述的方法和技术的数据和代码。视频处理硬件1706可用于在硬件电路中实现本文档中描述的一些技术。
在一些实施例中,如参照图17所描述的,可以使用在硬件平台上实现的设备来实现视频编解码方法。
所公开的技术的一些实施例包括决定或确定启用视频处理工具或模式。在一个示例中,当启用视频处理工具或模式时,编码器将在视频块的处理中使用或实现该工具或模式,但是可以不必基于工具或模式的使用来修改所产生的比特流。也就是说,从视频的块到视频的比特流表示的转换将在基于决定或确定启用视频处理工具或模式时使用视频处理工具或模式。在另一示例中,当启用视频处理工具或模式时,解码器将利用已经知晓比特流已基于视频处理工具或模式被修改而来处理比特流。也就是说,将使用基于决定或确定而启用的视频处理工具或模式来执行从视频的比特流表示到视频的块的转换。
所公开的技术的一些实施例包括决定或确定禁用视频处理工具或模式。在一个示例中,当视频处理工具或模式被禁用时,编码器将不在从视频的块到视频的比特流表示的转换中使用工具或模式。在另一示例中,当视频处理工具或模式被禁用时,解码器将利用已经知晓比特流还没有使用基于决定或确定而被启用的视频处理工具或模式被修改而来处理比特流。
图18是示出可在其中实现本文所公开的各种技术的示例性视频处理***1800的框图。各种实现方式可以包括***1800的一些或全部部件。***1800可以包括用于接收视频内容的输入1802。视频内容可以以原始或未压缩格式(例如,8或10位多分量像素值)来接收,或者可以以压缩或编码格式来接收。输入1802可表示网络接口、***总线接口或存储接口。网络接口的示例包括诸如以太网、无源光网络(PON)等的有线接口,以及诸如Wi-Fi或蜂窝接口的无线接口。
***1800可以包括编解码部件1804,其可以实现本文档中描述的各种编解码和编码方法。编解码组件1804可将来自输入1802的视频的平均比特率降低到编解码部件1804的输出,以产生视频的经过编解码的表示。因此,编解码技术有时被称为视频压缩或视频代码转换技术。编解码部件1804的输出可以被存储,或者通过连接的通信部件(如部件1806所示)被发送。在输入1802处接收的视频的存储的或传送的比特流(或经过编解码的)表示可以由组件1808用于生成被发送到显示接口1810的像素值或可显示视频。从比特流表示生成用户可视视频的过程有时被称为视频解压缩。此外,虽然某些视频处理操作被称为“编解码”操作或工具,但是应理解,编解码工具或操作在编码器处使用,并且反转编解码结果的对应解码工具或操作将由解码器执行。
***总线接口或显示器接口的示例可包括通用串行总线(USB)或高清晰度多媒体接口(HDMI)或显示器端口(Displayport)等。存储接口的示例包括SATA(串行高级技术附件)、PCI、IDE接口等。本文档中描述的技术可以实施在各种电子设备中,例如移动电话、膝上型计算机、智能电话或能够进行数字数据处理和/或视频显示的其它设备。
在一些实施例中,可以实施以下技术方案:
1.一种用于视频处理的方法,包括:进行视频的当前块与视频的比特流表示之间的转换,其中,在比特流表示中是否信令通知多变换集(MTS)索引和/或变换跳过标志是基于用于当前块的基于块差分脉冲编解码调制(BDPCM)的编解码工具的启用。
2.如技术方案1所述的方法,其中,基于BDPCM的编解码工具为量化残差域BDPCM(QR-BDPCM)。
3.如技术方案1或2所述的方法,其中,当基于BDPCM的编解码工具对于当前块被启用时,将MTS索引和/或变换跳过标志从比特流表示中排除。
4.如技术方案1或2所述的方法,其中,当基于BDPCM的编解码工具对于当前块被启用时,推断MTS索引和/或变换跳过标志为假。
5.如技术方案1或2所述的方法,其中,当基于BDPCM的编解码工具对于当前块被启用时,推断变换跳过标志为真。
6.如技术方案1至5中任一项所述的方法,其中,MTS过程包括:基于MTS索引,在转换期间使用多个预定变换中的至少一个。
7.如技术方案1至5中任一项所述的方法,其中,在基于变换跳过标志的变换跳过模式中,在不应用变换的情况下,将当前视频块与参考视频块之间的预测误差的残差量化。
8.如技术方案1至5中任一项所述的方法,其中,在基于BDPCM的编解码工具中,使用差分脉冲编解码调制(DPCM)将当前视频块的帧内预测的残差与残差的预测之间的差表示在比特流表示中。
9.一种用于视频处理的方法,包括:作为视频的当前块和视频的比特流表示之间的转换的一部分,基于编解码工具对视频的对应亮度分量的选择性应用,将编解码工具应用至视频的一个或多个色度分量;以及进行转换。
10.如技术方案9所述的方法,其中,从比特流表示中排除了将编解码工具应用至一个或多个色度分量的指示。
11.如技术方案9所述的方法,其中,基于条件,在比特流表示中信令通知将编解码工具应用至一个或多个色度分量的指示。
12.如技术方案11所述的方法,其中,条件包括将编解码工具应用至视频的对应亮度分量。
13.如技术方案10至12中任一项所述的方法,其中,指示包括标志或索引。
14.如技术方案9至13中任一项所述的方法,其中,亮度分量覆盖了一个或多个色度分量中的色度分量的对应采样。
15.如技术方案14的方法,其中,基于当前块的颜色格式来缩放对应采样。
16.一种用于视频处理的方法,包括:作为视频的第一色度分量的当前块与视频的比特流表示之间的转换的一部分,基于编解码工具对视频的其它色度分量的一个或多个对应块的选择性应用,将编解码工具应用至当前块;以及进行转换。
17.如技术方案16所述的方法,其中,从比特流表示中排除了将编解码工具应用至当前块的指示。
18.如技术方案16所述的方法,其中,基于条件,在比特流表示中信令通知将编解码工具应用至当前块的指示。
19.如技术方案18所述的方法,其中,条件包括将编解码工具应用至其它色度分量的一个或多个对应块。
20.一种用于视频处理的方法,包括:作为视频的当前块和视频的比特流表示之间的转换的一部分,基于编解码工具对视频的一个或多个对应色度分量的选择性应用,将编解码工具应用至视频的亮度分量;以及进行转换。
21.如技术方案20所述的方法,其中,从比特流表示中排除了将编解码工具应用至亮度分量的指示。
22.如技术方案20所述的方法,其中,基于条件,在比特流表示中信令通知将编解码工具应用至亮度分量的指示。
23.如技术方案22所述的方法,其中,条件包括将编解码工具应用至一个或多个对应色度分量。
24.如技术方案9至23中任一项所述的方法,其中,编解码工具选自由以下构成的组:多变换集(MTS)、变换跳过、简化二次变换(RST)、块差分脉冲编解码调制(BDPCM)和量化残差域BDPCM(QR-BDPCM)。
25.一种用于视频处理的方法,包括:基于用于视频的当前块的多变换集(MTS)类型,选择具有多个二进制数的编解码类型;以及作为当前块和视频的比特流表示之间的转换的一部分,将编解码类型应用至MTS类型的指示。
26.如技术方案25所述的方法,其中,编解码类型为固定长度编解码,其中MTS类型为DST7-DST7、DCT8-DST7、DST7-DCT8或DCT8-DCT8,其中DST#为类型#的离散正弦变换,而DCT#为类型#的离散余弦变换。
27.如技术方案26所述的方法,其中,多个二进制数中的每个是上下文编解码的。
28.如技术方案26所述的方法,其中,多个二进制数中的每个是旁路编解码的。
29.如技术方案25所述的方法,其中,MTS类型为变换跳过(TS)或类型II的离散余弦变换(DCT-II),并且其中指示的上下文模型基于当前块的编解码模式、用于当前块的变换块尺寸和/或应用至当前块的编解码树的深度。
30.如技术方案29所述的方法,其中,编解码模式为帧内模式、帧间模式或帧内块复制(IBC)模式。
31.如技术方案29所述的方法,其中,编解码树为四叉树(QT)、多类型树(MTT)、三叉树(TT)或二叉树(BT)。
32.如技术方案29所述的方法,其中,上下文模型的索引的增加基于变换单元(TU)的维度或与当前块相关联的变换块(TB)的维度。
33.如技术方案29所述的方法,其中,上下文模型的索引的增加基于编解码树的深度,并且其中编解码树为多类型树(MTT)。
34.如技术方案25所述的方法,其中,MTS类型为变换跳过(TS)或类型II的离散余弦变换(DCT-II),并且其中用于指示的上下文模型被共享。
35.如技术方案25所述的方法,其中,指示为语法元素,并且其中单个上下文用于多个二进制数中的一个或多个。
36.如技术方案35所述的方法,其中,语法元素为tu_mts_idx。
37.如技术方案35或36所述的方法,其中,单个上下文用于多个二进制数中的第一二进制数。
38.如技术方案35或36所述的方法,其中,单个上下文用于多个二进制数中的第一二进制数和第二二进制数,并且多个二进制数中的剩余二进制数被旁路编解码。
39.如技术方案25所述的方法,其中,MTS类型为变换跳过(TS)、DCT2-DCT2、DST7-DST7、DCT8-DST7、DST7-DCT8或DCT8-DCT8,其中DST#为类型#的离散正弦变换,并且DCT#为类型#的离散余弦变换,并且其中编解码类型为基于如下定义的表的二进制化:
变换矩阵 二进制数串
TS 0
DCT2-DCT2 1 0
DST7-DST7 1 1 0
DCT8-DST7 1 1 1 0
DST7-DCT8 1 1 1 1 0
DCT8-DCT8 1 1 1 1 1
40.如技术方案25所述的方法,其中,MTS类型为DCT2-DCT2或DST7-DST7,其中DST#为类型#的离散正弦变换,并且DCT为类型#的离散余弦变换。
41.如技术方案1至40中任一项所述的方法,其中,转换从比特流表示生成当前块。
42.如技术方案1至40中任一项所述的方法,其中,转换从当前块生成比特流表示。
43.一种视频***中的装置,该装置包括:处理器;以及非瞬态存储器,该非瞬态存储器上具有指令,其中该指令在由处理器执行时使得处理器实现如技术方案1至42中任一项所述的方法。
44.一种存储在非瞬态计算机可读介质上的计算机程序产品,该计算机程序产品包括用于执行如技术方案1至42中任一项所述的方法的程序代码。
从上文可以理解,本文中出于说明的目的已经描述了当前公开的技术的具体实施例,但是可以在不背离本发明的范围的情况下进行各种修改。因此,当前公开的技术并不限于此,而是由所附权利要求限定。
在本专利文件中描述的主题和功能操作的实现方式可以实现在各种***、数字电子电路中,或者计算机软件、固件或硬件中,包括在本说明书中公开的结构及其等同结构,或者上述的一个或多个的组合。本说明书中描述的主题的实现方式可以被实现为一个或多个计算机程序产品,即,在有形的非瞬态计算机可读介质上编解码的计算机程序指令的一个或多个模块,用于由数据处理设备执行或控制数据处理设备的操作。计算机可读介质可以是机器可读存储设备、机器可读存储基板、存储器设备、影响机器可读传播信号的物质组合物,或上述的一个或多个的组合。术语“数据处理单元”或“数据处理装置”包括用于处理数据的所有装置、设备和机器,包括例如可编程处理器、计算机或多个处理器或计算机。除了硬件之外,该装置还可以包括为所讨论的计算机程序创建执行环境的代码,例如构成处理器固件、协议栈、数据库管理***、操作***或上述的一个或多个的组合的代码。
计算机程序(也称为程序、软件、软件应用、脚本或代码)可以以任何形式的编程语言(包括编译或解释语言)来编写,并且可以以任何形式来部署,包括作为独立的程序或作为模块、部件、子例程或其它适合在计算环境中使用的单元。计算机程序不必对应于文件***中的文件。程序可以存储在保持其它程序或数据(例如,存储在标记语言文档中的一个或多个脚本)的文件的一部分,存储在专用于所讨论的程序的单个文件中,或者存储在多个协同文件(例如,存储一个或多个模块、子程序或代码部分的文件)中。计算机程序可被部署为在一个计算机上执行或在位于一个站点或分布在多个站点上并通过通信网络互连的多个计算机上执行。
本说明书中描述的过程和逻辑流程可以由一个或多个可编程处理器来执行,这些可编程处理器执行一个或多个计算机程序,以通过对输入数据进行操作并生成输出来执行功能。过程和逻辑流程也可以由专用逻辑电路(例如,FPGA(现场可编程门阵列)或ASIC(专用集成电路))来执行,并且装置也可以实现为专用逻辑电路。
例如,适于执行计算机程序的处理器包括通用和专用微处理器,以及任何类型的数字计算机的任何一个或多个处理器。通常,处理器将从只读存储器或随机存取存储器或只读存储器和随机存取存储器接收指令和数据。计算机的必要元件是用于执行指令的处理器和用于存储指令和数据的一个或多个存储器设备。通常,计算机还将包括或被可操作地耦合以从一个或多个大容量存储设备接收数据或向一个或多个大容量存储设备传送数据,所述大容量存储设备用于存储数据,例如磁盘、磁光盘或光盘。然而,计算机不需要具有这样的设备。适于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、介质和存储器设备,包括例如半导体存储器设备,例如EPROM、EEPROM和闪存设备。处理器和存储器可以由专用逻辑电路补充或结合在专用逻辑电路中。
虽然本专利文档包括许多细节,但这些不应被解释为对任何发明的范围或所要求保护的范围的限制,而应被解释为对具体发明的具体实施例可能特定的特征的描述。在本专利文档中在单独实施例的上下文中描述的某些特征也可以在单个实施例中组合实现。相反,在单个实施例的上下文中描述的各种特征也可以在多个实施例中单独地或以任何合适的子组合来实现。此外,尽管上面可以将特征描述为在某些组合中起作用,并且甚至最初如此要求保护,但是在一些情况下,可以从组合中去除要求保护的组合中的一个或多个特征,并且要求保护的组合可以针对子组合或子组合的变型。
类似地,虽然在附图中以特定顺序描述了操作,但这不应被理解为要求以所示的特定顺序或以顺序的顺序执行这些操作,或者要求执行所有示出的操作以获得期望的结果。此外,在本专利文献中描述的实施例中的各种***组件的分离不应被理解为在所有实施例中需要这种分离。
仅描述了一些实现方式和示例,并且可以基于在本专利文档中描述和示出的内容来进行其它实现方式、增强和变化。

Claims (44)

1.一种用于视频处理的方法,包括:
进行视频的当前块与所述视频的比特流表示之间的转换,
其中,在所述比特流表示中是否信令通知多变换集(MTS)索引和/或变换跳过标志是基于用于所述当前块的基于块差分脉冲编解码调制(BDPCM)的编解码工具的启用。
2.如权利要求1所述的方法,其中,所述基于BDPCM的编解码工具为量化残差域BDPCM(QR-BDPCM)。
3.如权利要求1或2所述的方法,其中,当所述基于BDPCM的编解码工具对于所述当前块被启用时,将所述MTS索引和/或所述变换跳过标志从所述比特流表示中排除。
4.如权利要求1或2所述的方法,其中,当所述基于BDPCM的编解码工具对于所述当前块被启用时,推断所述MTS索引和/或所述变换跳过标志为假。
5.如权利要求1或2所述的方法,其中,当所述基于BDPCM的编解码工具对于所述当前块被启用时,推断所述变换跳过标志为真。
6.如权利要求1至5中任一项所述的方法,其中,MTS过程包括:基于所述MTS索引,在所述转换期间使用多个预定变换中的至少一个。
7.如权利要求1至5中任一项所述的方法,其中,在基于所述变换跳过标志的变换跳过模式中,在不应用变换的情况下,将所述当前视频块与参考视频块之间的预测误差的残差量化。
8.如权利要求1至5中任一项所述的方法,其中,在所述基于BDPCM的编解码工具中,使用差分脉冲编解码调制(DPCM)将所述当前视频块的帧内预测的残差与所述残差的预测之间的差表示在所述比特流表示中。
9.一种用于视频处理的方法,包括:
作为视频的当前块和所述视频的比特流表示之间的转换的一部分,基于编解码工具对所述视频的对应亮度分量的选择性应用,将所述编解码工具应用至所述视频的一个或多个色度分量;以及
进行所述转换。
10.如权利要求9所述的方法,其中,从所述比特流表示中排除了将所述编解码工具应用至所述一个或多个色度分量的指示。
11.如权利要求9所述的方法,其中,基于条件,在所述比特流表示中信令通知将所述编解码工具应用至所述一个或多个色度分量的指示。
12.如权利要求11所述的方法,其中,所述条件包括将所述编解码工具应用至所述视频的对应亮度分量。
13.如权利要求10至12中任一项所述的方法,其中,所述指示包括标志或索引。
14.如权利要求9至13中任一项所述的方法,其中,所述亮度分量覆盖了所述一个或多个色度分量中的色度分量的对应采样。
15.如权利要求14所述的方法,其中,基于所述当前块的颜色格式来缩放所述对应采样。
16.一种用于视频处理的方法,包括:
作为视频的第一色度分量的当前块与所述视频的比特流表示之间的转换的一部分,基于编解码工具对所述视频的其它色度分量的一个或多个对应块的选择性应用,将所述编解码工具应用至所述当前块;以及
进行所述转换。
17.如权利要求16所述的方法,其中,从所述比特流表示中排除了将所述编解码工具应用至所述当前块的指示。
18.如权利要求16所述的方法,其中,基于条件,在所述比特流表示中信令通知将所述编解码工具应用至所述当前块的指示。
19.如权利要求18所述的方法,其中,所述条件包括将所述编解码工具应用至所述其它色度分量的一个或多个对应块。
20.一种用于视频处理的方法,包括:
作为视频的当前块和所述视频的比特流表示之间的转换的一部分,基于编解码工具对所述视频的一个或多个对应色度分量的选择性应用,将所述编解码工具应用至所述视频的亮度分量;以及
进行所述转换。
21.如权利要求20所述的方法,其中,从所述比特流表示中排除了将所述编解码工具应用至所述亮度分量的指示。
22.如权利要求20所述的方法,其中,基于条件,在所述比特流表示中信令通知将所述编解码工具应用至所述亮度分量的指示。
23.如权利要求22所述的方法,其中,所述条件包括将所述编解码工具应用至所述一个或多个对应色度分量。
24.如权利要求9至23中任一项所述的方法,其中,所述编解码工具选自由以下构成的组:多变换集(MTS)、变换跳过、简化二次变换(RST)、块差分脉冲编解码调制(BDPCM)和量化残差域BDPCM(QR-BDPCM)。
25.一种用于视频处理的方法,包括:
基于用于视频的当前块的多变换集(MTS)类型,选择具有多个二进制数的编解码类型;以及
作为所述当前块和所述视频的比特流表示之间的转换的一部分,将所述编解码类型应用至所述MTS类型的指示。
26.如权利要求25所述的方法,其中,所述编解码类型为固定长度编解码,其中所述MTS类型为DST7-DST7、DCT8-DST7、DST7-DCT8或DCT8-DCT8,其中DST#为类型#的离散正弦变换,而DCT#为类型#的离散余弦变换。
27.如权利要求26所述的方法,其中,所述多个二进制数中的每个是上下文编解码的。
28.如权利要求26所述的方法,其中,所述多个二进制数中的每个是旁路编解码的。
29.如权利要求25所述的方法,其中,所述MTS类型为变换跳过(TS)或类型II的离散余弦变换(DCT-II),并且其中所述指示的上下文模型基于所述当前块的编解码模式、用于所述当前块的变换块尺寸和/或应用至所述当前块的编解码树的深度。
30.如权利要求29所述的方法,其中,所述编解码模式为帧内模式、帧间模式或帧内块复制(IBC)模式。
31.如权利要求29所述的方法,其中,所述编解码树为四叉树(QT)、多类型树(MTT)、三叉树(TT)或二叉树(BT)。
32.如权利要求29所述的方法,其中,所述上下文模型的索引的增加基于变换单元(TU)的维度或与所述当前块相关联的变换块(TB)的维度。
33.如权利要求29所述的方法,其中,所述上下文模型的索引的增加基于所述编解码树的深度,并且其中所述编解码树为多类型树(MTT)。
34.如权利要求25所述的方法,其中,所述MTS类型为变换跳过(TS)或类型II的离散余弦变换(DCT-II),并且其中所述指示的上下文模型被共享。
35.如权利要求25所述的方法,其中,所述指示为语法元素,并且其中单个上下文用于所述多个二进制数中的一个或多个。
36.如权利要求35所述的方法,其中,所述语法元素为tu_mts_idx。
37.如权利要求35或36所述的方法,其中,所述单个上下文用于所述多个二进制数中的第一二进制数。
38.如权利要求35或36所述的方法,其中,所述单个上下文用于所述多个二进制数中的第一二进制数和第二二进制数,并且其中所述多个二进制数中的剩余二进制数被旁路编解码。
39.如权利要求25所述的方法,其中,所述MTS类型为变换跳过(TS)、DCT2-DCT2、DST7-DST7、DCT8-DST7、DST7-DCT8或DCT8-DCT8,其中DST#为类型#的离散正弦变换,并且DCT#为类型#的离散余弦变换,并且其中所述编解码类型为基于如下定义的表的二进制化:
变换矩阵 二进制数串 TS 0 DCT2-DCT2 1 0 DST7-DST7 1 1 0 DCT8-DST7 1 1 1 0 DST7-DCT8 1 1 1 1 0 DCT8-DCT8 1 1 1 1 1
40.如权利要求25所述的方法,其中,所述MTS类型为DCT2-DCT2或DST7-DST7,其中DST#为类型#的离散正弦变换,并且DCT为类型#的离散余弦变换。
41.如权利要求1至40中任一项所述的方法,其中,所述转换从所述比特流表示生成所述当前块。
42.如权利要求1至40中任一项所述的方法,其中,所述转换从所述当前块生成所述比特流表示。
43.一种视频***中的装置,包括:处理器;以及非瞬态存储器,所述非瞬态存储器上具有指令,其中所述指令在由所述处理器执行时使得所述处理器实现如权利要求1至42中任一项所述的方法。
44.一种存储在非瞬态计算机可读介质上的计算机程序产品,所述计算机程序产品包括用于执行如权利要求1至42中任一项所述的方法的程序代码。
CN202080045375.3A 2019-06-21 2020-06-19 用于色度分量的编解码工具 Pending CN114026865A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CNPCT/CN2019/092388 2019-06-21
CN2019092388 2019-06-21
PCT/CN2020/097021 WO2020253810A1 (en) 2019-06-21 2020-06-19 Coding tools for chroma components

Publications (1)

Publication Number Publication Date
CN114026865A true CN114026865A (zh) 2022-02-08

Family

ID=74036853

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080045375.3A Pending CN114026865A (zh) 2019-06-21 2020-06-19 用于色度分量的编解码工具

Country Status (2)

Country Link
CN (1) CN114026865A (zh)
WO (1) WO2020253810A1 (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130308708A1 (en) * 2012-05-11 2013-11-21 Panasonic Corporation Video coding method, video decoding method, video coding apparatus and video decoding apparatus
US20130343464A1 (en) * 2012-06-22 2013-12-26 Qualcomm Incorporated Transform skip mode
WO2014071439A1 (en) * 2012-11-08 2014-05-15 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding the transform units of a coding unit
US20140355616A1 (en) * 2013-05-31 2014-12-04 Qualcomm Incorporated Single network abstraction layer unit packets with decoding order number for video coding
CN105556963A (zh) * 2013-10-14 2016-05-04 联发科技(新加坡)私人有限公司 用于hevc范围扩展的残差差分脉冲编码调制方法
US20180205949A1 (en) * 2017-01-13 2018-07-19 Mediatek Inc. Method and Apparatus of Transform Coding
CN109089117A (zh) * 2017-05-11 2018-12-25 联发科技股份有限公司 编码或解码视频数据的方法及装置
KR20190067732A (ko) * 2017-12-07 2019-06-17 한국전자통신연구원 채널들 간의 선택적인 정보 공유를 사용하는 부호화 및 복호화를 위한 방법 및 장치

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9549182B2 (en) * 2012-07-11 2017-01-17 Qualcomm Incorporated Repositioning of prediction residual blocks in video coding
US9716894B2 (en) * 2013-03-25 2017-07-25 Qualcomm Incorporated Intra prediction modes for lossy coding when transform is skipped
WO2018226067A1 (ko) * 2017-06-08 2018-12-13 엘지전자 주식회사 비디오 압축을 위한 변환 커널의 저복잡도 연산을 수행하는 방법 및 장치
CN109922348B (zh) * 2017-12-13 2020-09-18 华为技术有限公司 图像编解码方法和装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130308708A1 (en) * 2012-05-11 2013-11-21 Panasonic Corporation Video coding method, video decoding method, video coding apparatus and video decoding apparatus
US20130343464A1 (en) * 2012-06-22 2013-12-26 Qualcomm Incorporated Transform skip mode
WO2014071439A1 (en) * 2012-11-08 2014-05-15 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding the transform units of a coding unit
US20140355616A1 (en) * 2013-05-31 2014-12-04 Qualcomm Incorporated Single network abstraction layer unit packets with decoding order number for video coding
CN105556963A (zh) * 2013-10-14 2016-05-04 联发科技(新加坡)私人有限公司 用于hevc范围扩展的残差差分脉冲编码调制方法
US20180205949A1 (en) * 2017-01-13 2018-07-19 Mediatek Inc. Method and Apparatus of Transform Coding
CN109089117A (zh) * 2017-05-11 2018-12-25 联发科技股份有限公司 编码或解码视频数据的方法及装置
KR20190067732A (ko) * 2017-12-07 2019-06-17 한국전자통신연구원 채널들 간의 선택적인 정보 공유를 사용하는 부호화 및 복호화를 위한 방법 및 장치

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
B. BROSS: "Non-CE8: Unified Transform Type Signalling and Residual Coding for Transform Skip", JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 13TH MEETING: MARRAKECH, MA, 9–18 JAN. 2019, JVET-M0464, 18 January 2019 (2019-01-18), pages 1 - 5 *

Also Published As

Publication number Publication date
WO2020253810A1 (en) 2020-12-24

Similar Documents

Publication Publication Date Title
WO2020207492A1 (en) Interaction between matrix-based intra prediction and other coding tools
CN113812162B (zh) 视频中的简化二次变换的上下文建模
WO2020244662A1 (en) Simplified transform coding tools
CN113875233B (zh) 使用上采样的基于矩阵的帧内预测
CN113728636B (zh) 编解码视频中二次变换的选择性使用
WO2020228717A1 (en) Block dimension settings of transform skip mode
WO2021238828A1 (en) Indication of multiple transform matrices in coded video
US20220094987A1 (en) Implicit selection of transform candidates
WO2020228716A1 (en) Usage of transquant bypass mode for multiple color components
US20220094929A1 (en) Applicability of implicit transform selection
WO2020253642A1 (en) Block size dependent use of secondary transforms in coded video
WO2020253810A1 (en) Coding tools for chroma components

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination