CN113994679A - 关于上下文编解码二进制位的数量的限制 - Google Patents

关于上下文编解码二进制位的数量的限制 Download PDF

Info

Publication number
CN113994679A
CN113994679A CN202080044963.5A CN202080044963A CN113994679A CN 113994679 A CN113994679 A CN 113994679A CN 202080044963 A CN202080044963 A CN 202080044963A CN 113994679 A CN113994679 A CN 113994679A
Authority
CN
China
Prior art keywords
block
codec
context
maximum number
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202080044963.5A
Other languages
English (en)
Other versions
CN113994679B (zh
Inventor
张莉
许继征
张凯
刘鸿彬
朱维佳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing ByteDance Network Technology Co Ltd
ByteDance Inc
Original Assignee
Beijing ByteDance Network Technology Co Ltd
ByteDance Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing ByteDance Network Technology Co Ltd, ByteDance Inc filed Critical Beijing ByteDance Network Technology Co Ltd
Publication of CN113994679A publication Critical patent/CN113994679A/zh
Application granted granted Critical
Publication of CN113994679B publication Critical patent/CN113994679B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

公开了关于上下文编解码二进制位的数量的限制。一种用于视频处理的方法包括:针对视频和视频的比特流表示之间的转换,对与该视频相关联的每预定单元的上下文编解码二进制位的最大数量应用控制;以及基于该控制执行该转换。

Description

关于上下文编解码二进制位的数量的限制
相关申请的交叉引用
根据适用的《专利法》和/或《巴黎公约》的规定,本申请及时要求于2019年6月21日提交的国际专利申请号PCT/CN2019/092365以及于2019年7月9日提交的国际专利申请号PCT/CN2019/095329的优先权和利益。将国际专利申请号PCT/CN2019/092365和PCT/CN2019/095329的全部公开以引用方式并入本文,作为本申请公开的一部分。
技术领域
本专利文件总体上涉及视频编解码和解码技术。
背景技术
目前,正在努力提高当前视频编解码器技术的性能,以提供更好的压缩比或提供允许较低复杂度或并行实施的视频编解码和解码方案。业内专家最近提出了一些新的视频编解码工具,并且目前正在进行测试以确定其有效性。
发明内容
描述了涉及数字视频编解码,尤其涉及运动矢量管理的设备、***和方法。可以将所述方法应用于现有的视频编解码标准(例如,高效率视频编解码(HEVC)或多功能视频编解码)以及将来的视频编解码标准或视频编解码器。
在一个代表性方面中,可以使用所公开的技术提供一种用于视频处理的方法。这种方法包括执行视频单元和视频单元的比特流表示之间的转换,其中,该转换包括在可对与该视频单元相关联的第一处理单元的上下文编解码二进制位的最大数量应用的限制的基础上对该视频单元进行上下文建模,其中,将上下文建模的信息包含到该视频单元的比特流表示当中。
在另一代表性方面中,可以使用所公开的技术提供另一种用于视频处理的方法。这种方法包括执行视频单元和视频单元的比特流表示之间的转换,其中,该转换包括在可对与该视频单元相关联的第一处理单元的上下文编解码二进制位的最大数量应用的限制的基础上对该视频单元进行上下文建模,其中,该转换包括根据上下文对处理单元分组的步骤,使得第一处理单元与第一上下文相关联,并且第二处理单元与第二上下文相关联。
在另一代表性方面中,可以使用所公开的技术提供另一种用于视频处理的方法。这种方法包括执行视频单元和视频单元的比特流表示之间的转换,其中,该转换包括在可对与该视频单元相关联的第一处理单元的上下文编解码二进制位的最大数量应用的限制的基础上对该视频单元进行上下文建模,其中,采用计数器记录第一处理单元中的上下文编解码二进制位的数量,并且其中,该计数器可在满足一个或多个条件时重置。
在另一代表性方面中,可以使用所公开的技术提供另一种用于视频处理的方法。这种方法包括:针对视频和视频的比特流表示之间的转换,对与该视频相关联的每预定单元的上下文编解码二进制位的最大数量应用控制;以及基于该控制执行该转换。
在另一代表性方面中,可以使用所公开的技术提供另一种用于视频处理的方法。这种方法包括:针对视频的块和该块的比特流表示之间的转换,将与该块相关联的语法元素划分成不同群组;对语法元素的不同群组应用单独控制;以及基于这些控制执行转换。
在另一代表性方面中,可以使用所公开的技术提供另一种用于视频处理的方法。这种方法包括:针对视频的块和该块的比特流表示之间的转换,将与该块相关联的用于残差编解码的上下文划分成不同群组;对上下文的不同群组应用单独控制;以及基于这些控制执行转换。
在另一代表性方面中,可以使用所公开的技术提供另一种用于视频处理的方法。这种方法包括:针对视频和该视频的比特流表示之间的转换,通过使用一个或多个计数器对与该视频相关联的每预定单元上下文编解码二进制位的数量应用控制,其中,按照预定义方式重置计数器;以及基于计数器执行转换。
此外,在代表性方面中,公开了一种视频***中的装置,该装置包括处理器和其上具有指令的非暂态存储器。这些指令在由处理器执行时,使处理器实施所公开方法中的任何一种或多种。
而且,公开了一种存储在非暂态计算机可读介质上的计算机程序产品,该计算机程序产品包括用于执行所公开方法中的任一种或多种的程序代码。
在附图、说明书和权利要求中更详细地描述了所公开技术的以上和其他方面和特征。
附图说明
图1示出了编码器框图的示例。
图2示出了帧内方向性模式的示例。
图3示出了针对4×4块的仿射线性加权帧内预测(ALWIP)的示例。
图4示出了针对8×8块的仿射线性加权帧内预测(ALWIP)的示例。
图5示出了针对8×4块的仿射线性加权帧内预测(ALWIP)的示例。
图6示出了针对16×16块的仿射线性加权帧内预测(ALWIP)的示例。
图7示出了与预测块相邻的参考线的示例。
图8示出了块的划分的示例。
图9示出了块的划分的示例连同例外。
图10示出了二次变换的示例。
图11示出了缩减二次变换(RST)的示例。
图12示出了正向缩减变换和逆缩减变换的示例。
图13示出了正向RST的示例。
图14示出了RST扫描的示例。
图15示出了子块变换模式的示例。
图16示出了扫描顺序的示例。
图17示出了扫描顺序的另一示例。
图18示出了用于选择概率模型的示例性模板。
图19示出了标量量化器的示例。
图20示出了与标量量化器相关联的状态变换机的示例。
图21是用于实施本文件中描述的视觉媒体解码或视觉媒体编码技术的硬件平台的示例的框图。
图22是用于视频编解码的示例性方法的流程图。
图23是用于视频编解码的示例性方法的流程图。
图24是用于视频编解码的示例性方法的流程图。
图25是用于视频编解码的示例性方法的流程图。
图26是用于视频编解码的示例性方法的流程图。
具体实施方式
1.HEVC/H.265中的视频编解码
视频编解码标准主要是通过开发公知的ITU-T和ISO/IEC标准而发展起来的。ITU-T开发了H.261和H.263,ISO/IEC开发了MPEG-1和MPEG-4视觉,并且两个组织联合开发了H.262/MPEG-2视频、H.264/MPEG-4高级视频编解码(AVC)和H.265/HEVC标准。自H.262以来,视频编解码标准基于混合视频编解码结构,其中采用了时域预测加变换编解码。为探索HEVC之外的未来视频编解码技术,VCEG和MPEG于2015年共同成立了联合视频探索团队(JVET)。从那时起,JVET采用了许多新的方法,并将其应用到了名为联合探索模型(JEM)的参考软件中。2018年4月,在VCEG(Q6/16)和ISO/IEC JTC1 SC29/WG11(MPEG)之间创建了联合视频专家团队(JVET),其致力于研究以相较于HEVC有50%的比特率下降为目标的VVC标准。
2.1.典型视频编解码器的编解码流程
图1示出了VVC的编码器框图的示例,其含有三个环路滤波框:去方块滤波器(DF)、样点自适应偏移(SAO)和ALF。与使用预定义滤波器的DF不同,SAO和ALF借助于信令通知偏移和滤波器系数的编解码边信息分别通过添加偏移以及应用有限脉冲响应(FIR)滤波器而利用当前图片的原始样点来减少原始样点和重建样点之间的均方误差。ALF位于每一图片的最后处理阶段上,并且可以被视为尝试捕捉并且修复先前阶段建立的伪像的工具。
2.2.VVC中的帧内编解码
2.2.1.具有67种帧内预测模式的帧内模式编解码
为了俘获自然视频中存在的任意边缘方向,将方向性帧内模式的数量从33(如HEVC中使用的)扩展到65。在图2中将附加的方向性模式绘示为虚线箭头,并且平面模式和DC模式保持相同。这些更密集的方向性帧内预测模式适用于所有块尺寸以及亮度帧内预测和色度帧内预测两者。
常规的有角度帧内预测方向是沿顺时针方向从45度到-135度定义的,如图2所示。在VTM2中,针对非方形块,几个常规的角度帧内预测模式被宽角度帧内预测模式自适应地替代。采用原始方法信令通知被替代的模式,并且在解析之后将被替代的模式重新映射至宽角度模式的索引。帧内预测模式的总数是不变的,即67个,并且帧内模式编解码是不变的。
在HEVC中,每一帧内编解码块具有方形形状,并且其每条边的长度均为2的幂。因而,在使用DC模式的情况下,不需要划分操作来生成帧内预测子。在VVV2中,块可以具有矩形形状,其在一般情况下必须使用针对每一块的划分操作。为了避免用于DC预测的划分操作,仅采用较长边来计算非方形块的均值。
除了这67个帧内预测模式之外,对某些块进一步启用针对非方形块的宽角度帧内预测(WAIP)方法以及位置相关帧内预测组合(PDPC)方法。PDPC被应用于下述帧内模式而无需信令通知:平面、DC、水平、垂直、左下角度模式及其八个相邻角度模式以及右上角度模式及其八个相邻角度模式。
2.2.2.仿射线性加权帧内预测(ALWIP,又名基于矩阵的帧内预测)
提出了仿射线性加权帧内预测(ALWIP,又名基于矩阵的帧内预测(MIP))。
2.2.2.1.通过矩阵矢量乘法生成缩减预测信号
首先通过求均值对相邻参考样点进行降采样,以生成缩减参考信号bdryred。之后,通过计算矩阵矢量乘积并添加偏移量而计算出缩减预测信号predred
predred=A·bdryred+b。
这里,A为矩阵,其具有Wred·Hred行,并且在W=H=4的情况下具有4列,而在所有其他情况下则具有8列。b为具有尺寸Wred·Hred的矢量。
2.2.2.2.对整个ALWIP过程的举例说明
在图3-6中针对不同形状例示了求均值、矩阵矢量乘法和线性插值的整个过程。注意,像在所描绘的情况之一当中那样对待其他形状。
1.在给定4×4块的情况下,ALWIP沿边界的每一轴取两个平均值。所得到的四个输入样点参加矩阵矢量乘法。矩阵是从集合S0取得的。在添加偏移量之后,其得到了16个最终预测样点。线性插值对于生成预测信号是不必要的。因而,每样点执行总共(4·16)/(4·4)=4次乘法。
2.在给定8×8块的情况下,ALWIP沿边界的每一轴取四个平均值。所得到的八个输入样点参加矩阵矢量乘法。矩阵是从集合S1取得的。其获得了处于预测块的奇数位置上的16个样点。因而,每样点执行总共(8·16)/(8·8)=2次乘法。在添加偏移量之后,通过使用缩减顶部边界垂直地对这些样点插值。水平插值通过使用原始左边界而紧随其后。
3.在给定8×4块的情况下,ALWIP沿边界的水平轴取得四个平均值并且取得左边界上的四个原始边界值。所得到的八个输入样点参加矩阵矢量乘法。矩阵是从集合S1取得的。其获得了处于预测块的奇数水平位置上和每一垂直位置上的16个样点。因而,每样点执行总共(8·16)/(8·4)=4次乘法。在添加偏移量之后,通过使用原始左侧边界水平地对这些样点插值。
相应地对待转置后的情况。
4.在给定16×16块的情况下,ALWIP沿边界的每一轴取四个平均值。所得到的八个输入样点参加矩阵矢量乘法。矩阵是从集合S2取得的。其获得了处于预测块的奇数位置上的64个样点。因而,每样点执行总共(8·64)/(16·16)=2次乘法。在添加偏移量之后,通过使用顶部边界的八个平均值垂直地对这些样点插值。水平插值通过使用原始左边界而紧随其后。在这种情况下,插值过程不增加任何乘法。因此,每样点有两次乘法与计算ALWIP预测相关联。
对于更大形状,流程基本相同,并且易于检查每样点的乘法数量小于四。
对于W×8块(其中,W>8)而言,只有水平插值是必需的,因为样点是在奇数水平位置上和每一垂直位置上给出的。
最后,对于W×4块(其中,W>8)而言,使A_k是通过遗漏沿降采样块的水平轴对应于奇数条目的每一行而出现的矩阵。因而,输出尺寸为32,并且仍然只需执行水平插值。
相应地对待转置后的情况。
2.2.2.3.语法和语义
7.3.6.5编解码单元语法
下文具有粗体、斜体和/或下划线的部分指示所提出的对该标准的修改。
Figure BDA0003420300030000071
Figure BDA0003420300030000081
2.2.3.多参考线(MRL)
多参考线(MRL)帧内预测使用更多参考线进行帧内预测。在图7中,绘示了4条参考线的示例,其中,片段A和F的样点并非是从重建的相邻样点取出的,而是分别用来自片段B和E的最接近样点填充的。HEVC帧内预测使用最近的参考线(即,参考线0)。在MRL中,使用2条附加的线(参考线1和参考线3)。
选定参考线的索引(mrl_idx)被信令通知并用于生成帧内预测子。对于大于0的参考线索引,在MPM列表中仅包括附加的参考线模式,并且仅信令通知MPM索引而没有剩余模式。在帧内预测模式之前信令通知参考线索引,在信令通知非零参考线索引的情况下,从帧内预测模式排除平面模式和DC模式。
对于CTU内部的块的第一条线,禁用MRL,以防止使用当前CTU线外部的扩展参考样点。而且,在使用附加线时,禁用PDPC。
2.2.4.帧内子分割(ISP)
提出了ISP,其将亮度帧内预测块垂直或者水平划分成2个或4个子分割,具体取决于块尺寸维度,如表1中所示。图8和图9示出了两种可能性的示例。所有子分割满足具有至少16个样点的条件。如果允许的话,对于块尺寸4×N或N×4(其中,N>8)而言,可以存在1×N或N×1子分割。
表格1:取决于块尺寸(由maxTBSize表示的最大变换尺寸)的子分割数量
Figure BDA0003420300030000082
Figure BDA0003420300030000091
对于这些子分割中的每者,通过对编码器发送的系数进行熵解码,继而对其进行逆量化和逆变换而生成残差信号。之后,对子分割进行帧内预测,最后通过将残差信号加到预测信号上而获得对应的重建样点。因此,每一子分割的重建值将可用于生成下一子分割的预测,下一子分割又重复该过程,以此类推。所有子分割共享相同的帧内模式。
表格2:取决于predModeIntra的trTypeHor和trTypeVer的规范
Figure BDA0003420300030000092
2.2.4.1.语法和语义
7.3.7.5Coding unit syntax
下文具有粗体和/或下划线的部分指示所提出的对该标准的修改。
Figure BDA0003420300030000101
Figure BDA0003420300030000111
Figure BDA0003420300030000121
等于1的intra_subpartitions_mode_flag[x0][y0]规定当前帧内编解码单元被分割成NumIntraSubPartitions[x0][y0]个矩形变换块子分割。等于0的intra_subpartitions_mode_flag[x0][y0]规定当前帧内编解码单元未被分割成矩形变换块子分割。
当intra_subpartitions_mode_flag[x0][y0]不存在时,推断其等于0。
intra_subpartitions_split_flag[x0][y0]规定帧内子分割划分类型是水平的还是垂直的。当intra_subpartitions_split_flag[x0][y0]不存在时,对其作如下推断:
–如果cbHeight大于MaxTbSizeY,那么intra_subpartitions_split_flag[x0][y0]被推断为等于0。
–否则(cbWidth大于MaxTbSizeY),intra_subpartitions_split_flag[x0][y0]被推断为等于1。
变量IntraSubPartitionsSplitType规定用于当前亮度编解码块的划分类型,如表3中所例示的。对IntraSubPartitionsSplitType作如下推导:
–如果intra_subpartitions_mode_flag[x0][y0]等于0,那么IntraSubPartitionsSplitType被设置为等于0。
–否则,IntraSubPartitionsSplitType被设置为等于1+intra_subpartitions_split_flag[x0][y0]。
表格3–与IntraSubPartitionsSplitType的名称关联
Figure BDA0003420300030000122
变量NumIntraSubPartitions规定帧内亮度编解码块被划分成的变换块子分割的数量。对NumIntraSubPartitions作如下推导:
–如果IntraSubPartitionsSplitType等于ISP_NO_SPLIT,那么NumIntraSubPartitions被设置为等于1。
–否则,如果下述条件之一为真,那么NumIntraSubPartitions被设置为等于2:
–cbWidth等于4并且cbHeight等于8,
–cbWidth等于8并且cbHeight等于4。
–否则,NumIntraSubPartitions被设置为等于4。
2.3.VVC中的变换编解码
2.3.1.VVC中的多变换集(MTS)
2.3.1.1.显式多变换集(MTS)
在VTM4中,启用了在尺寸上高达64×64的大块尺寸变换,其主要可用于较高分辨率视频,例如,1080p序列和4K序列。对于具有等于64的尺寸(宽度或高度,或者宽度和高度两者)的变换块,使高频变换系数归零,从而只保留低频系数。例如,对于M×N变换块(其中,M作为块宽度,N作为块高度),当M等于64时,仅留下左侧的32列变换系数。类似地,当N等于64时,仅保持顶部的32行变换系数。在将变换跳过模式用于大块时,使用整个块而不使任何值归零。
除了已经在HEVC中采用的DCT-II之外,还将多变换选择(MTS)方案用于对帧间编解码块和帧内编解码块两者进行残差编解码。其采用来自DCT8/DST7的多种选定变换。新引入的变换矩阵是DST-VII和DCT-VIII。下面的表格4示出了选定DST/DCT的基函数。
表格4:VVC中使用的变换矩阵的基函数
Figure BDA0003420300030000131
为了保持变换矩阵的正交性,要对这些变换矩阵做出比HEVC中的变换矩阵更准确的量化。为了使经变换的系数的中间值保持在16比特范围内,在水平变换之后以及在垂直变换之后,所有的系数都将具有10比特。
为了控制MTS方案,分别针对帧内和帧间在SPS级上规定单独的启用标志。当在SPS上启用MTS时,信令通知CU级标志,以指示是否应用MTS。这里,仅对亮度应用MTS。在满足下述条件时信令通知MTS CU级标志。
-宽度和高度两者都小于或者等于32
-CBF标志等于1
如果MTS CU标志等于0,那么在两个方向内都应用DCT2。然而,如果MTS CU标志等于1,那么附加地信令通知其他两个标志,从而分别指示水平方向和垂直方向的变换类型。变换和信令通知映射表格如表格5中所示。在涉及到变换矩阵精确度时,采用8比特主变换核心。因此,使HEVC中使用的所有变换核心保持相同,其包括4点DCT-2和DST-7以及8点、16点和32点DCT-2。而且,其他变换核心包括64点DCT-2、4点DCT-8以及8点、16点、32点DST-7和DCT-8主变换核心。
表格5:tu_mts_idx的解码值与水平和垂直方向的对应变换矩阵的映射
Figure BDA0003420300030000141
为了降低大尺寸DST-7和DCT-8的复杂性,对于具有等于32的尺寸(宽度或高度,或者宽度和高度两者)的DST-7块和DCT-8块使高频变换系数归零。仅保留处于16×16较低频率区域内的系数。
除了应用不同变换的情况之外,VVC还支持被称为变换跳过(TS)的模式,其与HEVC中的TS的概念类似。TS被作为MTS的特例对待。
2.3.2.缩减二次变换(RST)
2.3.2.1.JEM中的不可分二次变换(NSST)
在JEM中,在正向主变换和量化(编码器处)之间以及在逆量化和逆主变换(解码器侧)之间应用二次变换。如图10所示,4×4(或8×8)二次变换的执行取决于块尺寸。例如,对于小块(即,min(宽度,高度)<8)应用4×4二次变换,并且对较大块(即,min(宽度,高度)>4)按照每一8×8块应用8×8二次变换。
下文将使用作为示例的输入描述不可分变换的应用。为了应用不可分变换,输入块X
Figure BDA0003420300030000151
被首先表示为矢量
Figure BDA0003420300030000152
Figure BDA0003420300030000153
计算
Figure BDA0003420300030000154
作为该不可分变换,其中,
Figure BDA0003420300030000155
指示变换系数矢量,并且T是16×16变换矩阵。接下来,使用针对该块的扫描顺序(水平、垂直或对角)将16×1系数矢量
Figure BDA0003420300030000156
重新组织成4×4块。在4×4系数块中,具有较小索引的系数将被该较小扫描索引替代。总共有35个变换集,并且每变换集采用3个不可分变换矩阵(内核)。从帧内预测模式到变换集的映射是预定义的。对于每一变换集,通过显式信令通知的二次变换索引进一步指定所选的不可分二次变换(NSST)候选。在变换系数之后在比特流中对索引进行每帧内CU一次的信令通知。
2.3.2.2.缩减二次变换(RST)
引入了RST(又名低频不可分变换(LFNST))并且还引入了4变换集(而非35个变换集)映射。采用16x64(进一步缩减至16×48)矩阵和16×16矩阵。为了标记方便,将16×64(缩减至16×48)变换表示为RST8×8,将16×16变换表示为RST4×4。图11示出了RST的示例。
2.3.2.2.1.RST计算
缩减变换(RT)的主要思路是将N维矢量映射至不同空间内的R维矢量,其中,R/N(R<N)是缩减因子。
RT矩阵是如下的R×N矩阵:
Figure BDA0003420300030000161
其中,该变换的R行是该N维空间的R个基。RT的逆变换矩阵是其正向变换的转置。在图12中绘示了正向RT和逆RT。
在本文献中,应用具有缩减因子4(1/4尺寸)的RST8×8。因而,采用16×64直接矩阵,而非作为常规8×8不可分变换矩阵尺寸的64×64。换言之,在解码器侧使用64×16逆RST矩阵来生成8×8左上区域内的核心(主)变换系数。正向RST8×8使用16×64(或者针对8×8块的8×64)矩阵,使得其仅在给定8×8区域内的左上4×4区域内产生非零系数。换言之,如果应用RST,那么该8×8区域除了左上的4×4区域之外将仅具有零系数。对于RST4×4,应用16×16(或者针对4×4块的8×16)直接矩阵乘法。
在满足下述两个条件时有条件地应用逆RST:
–块尺寸大于或等于给定阈值(W>=4&&H>=4)
–变换跳过模式标志等于0
如果变换系数块的宽度(W)和高度(H)两者均大于4,那么对变换系数块的左上8×8区域应用RST8×8。否则,在变换系数块的左上min(8,W)×min(8,H)区域上应用RST4×4。
如果RST索引等于0,则不应用RST。否则,应用RST,借助于RST索引选择其内核。稍后将解释RST选择方法和RST索引的编解码。
此外,在帧内条带和帧间条带两者内并且既针对亮度又针对色度对帧内CU应用RST。如果启用双树,那么单独信号通知亮度和色度的RST索引。对于帧间条带(禁用双树),信令通知单RST索引,并且将该索引既用于亮度,又用于色度。
2.3.2.2.2.RST的限制
在选择ISP模式时,禁用RST,并且不对RST索引进行信令通知,因为即使对每一可行的分割块应用RST,所带来的性能提高也是微不足道的。此外,对ISP预测残差禁用RST可能降低编码复杂性。
2.3.2.2.3.RST选择
从四个每者由两项变换构成的变换集中选择RST矩阵。如下文所述由帧内预测确定应用哪一变换集:
1)如果指示三个CCLM模式之一,那么选择变换集0。
2)否则,根据下述表格执行变换集选择:
变换集选择表格
IntraPredMode 变换集索引
IntraPredMode<0 1
0<=IntraPredMode<=1 0
2<=IntraPredMode<=12 1
13<=IntraPredMode<=23 2
24<=IntraPredMode<=44 3
45<=IntraPredMode<=55 2
56<=IntraPredMode 1
被表示为IntraPredMode的访问该表格的索引具有范围[-14,83],其为用于宽角度帧内预测的变换后模式索引。
2.3.2.2.4.具有缩减维度的RST矩阵
作为进一步的简化,就相同的变换集配置而言,应用16×48矩阵而非16×64矩阵,这些16×48矩阵的每者采取来自左上8×8块中的排除右下4×4块之外的三个4×4块的输入数据(图13)。
2.3.2.2.5.RST信令通知
正向RST8×8(其中,R=16)使用16×64矩阵,使得其仅在给定8×8区域内的左上4×4区域内产生非零系数。换言之,如果应用RST,那么该8×8区域除了左上的4×4区域之外均生成唯零系数。因此,当除了左上4×4区域(图14中所示)之外在8×8块区域内检测到任何非零元素时不对RST索引编解码,因为其暗示未应用RST。在这样的情况下,将RST索引推断为零。
2.3.2.2.6.归零范围
在对4×4子块应用逆RST之前,往往该4×4子块内的任何系数都可以是非零的。然而,存在这样的约束条件:在一些情况下,在对该4×4子块应用RST之前,该子块内的一些系数为零。
令nonZeroSize为变量。任何具有不小于nonZeroSize的索引的系数,当其在逆RST之前被重新布置成1-D数组时,可以为零。
当nonZeroSize等于16时,对左上4×4子块中的系数不存在任何归零约束条件。
在当前块尺寸为4×4或8×8时,将nonZeroSize设置为等于8。对于其他块维度而言,将nonZeroSize设置为等于16。
2.3.2.2.7.工作草案中的RST的描述
7.3.2.3序列参数集RBSP语法
下文具有粗体、斜体和/或下划线的部分指示所提出的对该标准的修改。
Figure BDA0003420300030000181
7.3.7.11残差编解码语法
下文具有粗体、斜体和/或下划线的部分指示所提出的对该标准的修改。
Figure BDA0003420300030000182
Figure BDA0003420300030000191
7.3.7.5Coding unit syntax
下文具有粗体、斜体和/或下划线的部分指示所提出的对该标准的修改。
Figure BDA0003420300030000192
Figure BDA0003420300030000201
Figure BDA0003420300030000211
等于1的sps_st_enabled_flag规定st_idx可以存在于用于帧内编解码单元的残差编解码语法当中。等于0的sps_st_enabled_flag规定st_idx不存在于用于帧内编解码单元的残差编解码语法当中。
st_idx[x0][y0]规定在选定变换集中的两个候选内核之间应用哪一二次变换内核。等于0的st_idx[x0][y0]规定不应用二次变换。数组索引x0,y0指定所考虑变换块的左上样点相对于该图片的左上样点的位置(x0,y0)。
当st_idx[x0][y0]不存在时,推断st_idx[x0][y0]等于0。
st_idx的二进制位受到下文编解码。更具体而言,以下适用:
表格6-语法元素和相关联的二值化
Figure BDA0003420300030000212
表格7–对具有上下文编解码二进制位的语法元素的ctxInc分配
Figure BDA0003420300030000213
Figure BDA0003420300030000221
9.5.4.2.8用于语法元素st_idx的ctxInc的推导过程
这一过程的输入为颜色分量索引、相对于取决于cIdx的当前图片的左上样点指定当前亮度或色度编解码块的左上样点的亮度或色度位置(x0,y0)、数类型treeType、如条款8.4.2中规定的亮度帧内预测模式IntraPredModeY[x0][y0]、如条款7.4.7.5中规定的指定色度样点的帧内预测模式的语法元素intra_chroma_pred_mode[x0][y0]以及多变换选择索引tu_mts_idx[x0][y0]。
这一过程的输出为变量ctxInc。
如下推导变量intraModeCtx:
如果cIdx等于0,那么如下推导intraModeCtx:
intraModeCtx=(IntraPredModeY[x0][y0]<=1)?1:0
否则(cIdx大于0),如下推导intraModeCtx:
intraModeCtx=(intra_chroma_pred_mode[x0][y0]>=4)?1:0
如下推导变量mtsCtx:
mtsCtx=(tu_mts_idx[x0][y0]==0&&treeType!=SINGLE_TREE)?1:0
如下推导变量ctxInc:
ctxInc=(binIdx<<1)+intraModeCtx+(mtsCtx<<2)
2.3.2.2.8.RST使用的总结
仅当一个块内的非零系数的数量对于单一树和分离树而言分别大于2和大于1时,可以启用RST。此外,在启用RST时,可以应用如下对应用了RST的编解码群组(CG)的非零系数的位置的限制。
表格8:RST的使用
Figure BDA0003420300030000222
Figure BDA0003420300030000231
2.3.3.子块变换
对于具有等于1的cu_cbf的帧间预测CU而言,可以信令通知cu_sbt_flag,以指示是对整个残差块解码,还是对残差块的子部分解码。在前一种情况下,对帧间MTS信息做进一步解析,以确定CU的变换类型。在后一种情况下(即,启用SBT),采用推断出的自适应变换对残差块的部分编解码,并且使残差块的其他部分归零。不对组合帧间-帧内模式和三角形预测模式应用SBT。
在子块变换中,对SBT-V和SBT-H中的亮度变换块应用位置相关变换(色度TB总是使用DCT-2)。SBT-H和SBT-V的两个位置与不同的核心变换相关联。更具体地,在图15中指定了针对每一SBT位置的水平变换和垂直变换。例如,针对SBT-V位置0的水平变换和垂直变换分别为DCT-8和DST-7。当残差TU的一侧大于32时,对应的变换被设置为DCT-2。因此,子块变换联合指定残差块的TU划片、cbf以及水平变换和垂直变换,其可以被视为块的主要残差处于块的一侧的情况的语法快捷方式。
2.3.3.1.语法元素
7.3.7.5编解码单元语法
下文具有粗体、斜体和/或下划线的部分指示所提出的对该标准的修改。
Figure BDA0003420300030000241
Figure BDA0003420300030000251
Figure BDA0003420300030000261
等于1的cu_sbt_flag规定针对当前编解码单元使用子块变换。等于0的cu_sbt_flag规定针对当前编解码单元不使用子块变换。
当cu_sbt_flag不存在时,那么推断其值等于0。
注释:在采用子块变换时,编解码单元被划分成两个变换单元;一个变换单元具有残差数据,另一个不具有残差数据。
等于1的cu_sbt_quad_flag规定,对于当前编解码单元,子块变换包括当前编解码单元的1/4尺寸的变换单元。等于0的cu_sbt_quad_flag规定,对于当前编解码单元,子块变换包括当前编解码单元的1/2尺寸的变换单元。
当cu_sbt_quad_flag不存在时,那么推断其值等于0。
等于1的cu_sbt_horizontal_flag规定当前编解码单元被水平划分成2个变换单元。等于0的cu_sbt_horizontal_flag[x0][y0]规定当前编解码单元被垂直划分成2个变换单元。
当cu_sbt_horizontal_flag不存在时,对其值的推导如下:
–如果cu_sbt_quad_flag等于1,那么cu_sbt_horizontal_flag被设置为等于allowSbtHorQ。
–否则(cu_sbt_quad_flag等于0),cu_sbt_horizontal_flag被设置为等于allowSbtHorH。
等于1的cu_sbt_pos_flag规定当前编解码单元中的第一变换单元的tu_cbf_luma、tu_cbf_cb和tu_cbf_cr不存在于比特流当中。等于0的cu_sbt_pos_flag规定当前编解码单元中的第二变换单元的tu_cbf_luma、tu_cbf_cb和tu_cbf_cr不存在于比特流当中。
变量SbtNumFourthsTb0的推导如下:
sbtMinNumFourths=cu_sbt_quad_flag?1:2 (7-117)
SbtNumFourthsTb0=cu_sbt_pos_flag?(4-sbtMinNumFourths):sbtMinNumFourths (7-118)
等于0的sps_sbt_max_size_64_flag规定允许子块变换的最大CU宽度和高度为32个亮度样点。等于1的sps_sbt_max_size_64_flag规定允许子块变换的最大CU宽度和高度为64个亮度样点。
MaxSbtSize=sps_sbt_max_size_64_flag?64:32 (7-33)
2.3.4.量化残差域块差分脉冲编解码调制编解码(QR-BDPCM)
提出了量化残差域BDPCM(下文表示为QR-BDPCM)。不同于BDPCM,通过在类似于帧内预测的预测方向(水平或垂直预测)内进行样点复制来对整个块进行帧内预测。对残差进行量化,并对量化残差及其预测子(水平或垂直)量化值之间的Δ进行编解码。
对于尺寸为M(行)×N(列)的块,令ri,j,0≤i≤M-1,0≤j≤N-1为使用来自上方或左侧块边界样点的未滤波样点水平地(跨越预测块逐条线地复制左侧邻居像素值)或垂直地(将顶部邻居线复制到预测块中的每条线)执行帧内预测之后的预测残差。令Q(ri,j),0≤i≤M-1,0≤j≤N-1表示残差ri,j的量化版本,其中,残差是初始块和预测块值之间的差值。然后,将块DPCM应用于量化残差样点,获得修改的M×N数组
Figure BDA0003420300030000271
其元素为
Figure BDA0003420300030000272
在信令通知垂直BDPCM:
Figure BDA0003420300030000273
对于水平预测而言,适用类似规则,并且通过如下方程获得残差量化样点
Figure BDA0003420300030000274
将残差量化样点
Figure BDA0003420300030000275
发送到解码器。
在解码器侧,逆转以上计算,从而产生Q(ri,j),0≤i≤M-1,0≤j≤N-1。对于垂直预测情况,
Figure BDA0003420300030000276
对于水平情况,
Figure BDA0003420300030000277
将逆量化残差Q-1(Q(ri,j))加到帧内块预测值上,以产生重建样点值。
在QR-BDPCM中总是使用变换跳过。
2.4.系数的熵编解码
2.4.1.应用了变换的块的系数编解码
在HEVC中,采用不重叠系数群组(CG,或子块)对编解码块的变换系数编解码,并且每一CG含有编解码块的4x4块的系数。根据预定义扫描顺序对编解码块内的CG以及CG内的变换系数编解码。
根据预定义扫描顺序对编解码块内的CG以及CG内的变换系数编解码。CG和CG内的系数两者均遵循朝右上的对角线扫描顺序。在图16和图17中分别描绘了4×4块和8×8扫描顺序的示例。
注意,编解码顺序是颠倒的扫描顺序(即,从图17中的CG3到CG0解码),在对一个块解码时,首先对最后的非零系数的坐标解码。
对具有至少一个非零变换系数的CG的变换系数幅值的编解码可以被分成多趟扫描。在VVC3中,对于每一CG,按照编解码顺序划分常规编解码二进制位和旁路编解码二进制位;首先传输子块的所有常规编解码二进制位,而后传输旁路编解码二进制位。在扫描位置范围内通过五趟对子块的变换系数幅值进行编解码,具体如下:
–第1趟:按照编解码顺序处理对有效性(sig_flag)、大于1标志(gt1_flag)、奇偶性(par_level_flag)和大于2标志(gt2_flag)的编解码。如果sig_flag等于1,那么对第一gt1_flag编解码(其规定绝对幅值是否大于1)。如果gt1_flag等于1,那么附加地对par_flag编解码(其规定绝对幅值减2的奇偶性)。
–第2趟:针对所有具有等于1的gt2_flag或者等于1的gt1_flag的扫描位置处理对剩余绝对幅值(余数)。采用Golomb-Rice编解码使非二进制语法元素二值化,并且在算术编解码引擎的旁路模式中对所得到的二进制位编解码。
–第3趟:使用Golomb-Rice编解码在算术编解码引擎的旁路模式中对在第一趟中未对其sig_flag进行编解码(由于达到了常规编解码二进制位的极限)的系数的绝对幅值(absLevel)进行完全编解码。
–第4趟:在sig_coeff_flag等于1的情况下对所有扫描位置的符号(sign_flag)编解码
保证了对于4×4子块而言对不超过32个的常规编解码二进制位(sig_flag、par_flag、gt1_flag和gt2_flag)进行编码或解码。对于2×2色度子块而言,常规编解码二进制位的数量局限于8。
按照与HEVC类似的方式推导用于非二进制语法元素余数的编解码(第3趟中)的Rice参数(ricePar)。在每一子块开始时,将ricePar设置为等于0。在对语法元素余数编解码之后,根据预定义公式修改Rice参数。对于非二进制语法元素absLevel的编解码(第4趟中)而言,确定局部模板中的绝对值的和sumAbs。通过表格查找在依赖性量化和sumAbs的基础上确定变量ricePar和posZero。对中间变量codeValue的推导如下:
–如果absLevel[k]等于0,那么codeValue被设置为等于posZero;
–否则,如果absLevel[k]小于或者等于posZero,那么codeValue被设置为等于absLevel[k]–1;
–否则(absLevel[k]大于posZero),那么codeValue被设置为等于absLevel[k]。
借助于Rice参数ricePar,使用Golomb-Rice编解码对codeValue的值进行编解码。
2.4.1.1.用于系数编解码的上下文建模
对用于与变换系数幅值的绝对值相关的语法元素的概率模型的选择取决于局部邻域中的绝对幅值或者部分重建绝对幅值的值。在图18中示出了所使用的模板。
所选择的概率模型取决于局部邻域中的绝对幅值(或者部分重建绝对幅值)之和以及局部邻域中的大于0的绝对幅值的数量(通过等于1的sig_coeff_flags的数量给出)。上下文建模和二值化取决于下述针对局部邻域的度量:
·numSig:局部邻域中的非零幅值的数量,
·sumAbs1:局部邻域中第一趟之后部分重建绝对幅值(absLevel1)之和,
·sumAbs:局部邻域中重建绝对幅值之和,以及
·对角位置(d):变换块内的当前扫描位置的水平坐标和垂直坐标之和。
基于numSig、sumAbs1和d的值,选择用于对sig_flag、par_flag、gt1_flag和gt2_flag编解码的概率模式。基于sumAbs和numSig的值选择用于使abs_remainder二值化的Rice参数。
2.4.1.2.依赖性量化(DQ)
此外,还将同样的HEVC标量量化与一种被称为依赖性标量量化的新的理念相结合。依赖性标量量化是指一种方案,其中,变换系数的一组可容许的重建值依赖于在重建顺序中处于当前变换系数幅值之前的变换系数幅值的值。这一方案的主要作用在于,与HEVC中使用的常规独立标量量化相比,在N维矢量空间(N表示变换块中的变换系数的数量)内更致密地填充可容许重建矢量。这意味着,对于给定的每一个N维单元体积的可容许重建矢量的平均数量而言,降低了输入矢量与最接近的重建矢量之间的平均失真。该依赖性标量量化方案是通过下述操作实现的:(a)定义两个具有不同重建幅值的标量量化器以及(b)定义用于在两个标量量化器之间切换的过程。
在图19中示出了通过Q0和Q1表示的所使用的两个标量量化器。通过量化步长尺寸Δ唯一地指定可用重建幅值的位置。所使用的标量量化器(Q0或Q1)未在比特流中显式信令通知。相反,通过按照编解码/重建顺序处于当前变换系数之前的变换系数的奇偶性确定用于当前变换系数的量化器。
如图20所示,通过具有四个状态的状态机实现两个标量量化器(Q0和Q1)之间的切换。状态可以采取四个不同值:0、1、2、3。其由按照编解码/重建顺序处于当前变换系数之前的变换系数幅值的奇偶性唯一地确定。在针对变换块的反量化开始时,状态被设置为0。按照扫描顺序(即,按照它们被熵解码的相同顺序)重建变换系数。在重建当前变换系数之后,对状态进行更新,如图20所示,其中,k表示变换系数幅值的值。
2.4.1.3.语法和语义
7.3.7.11残差编解码语法
下文具有粗体、斜体和/或下划线的部分指示所提出的对该标准的修改。
Figure BDA0003420300030000301
Figure BDA0003420300030000311
Figure BDA0003420300030000321
Figure BDA0003420300030000331
Figure BDA0003420300030000341
Figure BDA0003420300030000351
Figure BDA0003420300030000361
2.4.2.TS编解码块和QR-BDPCM编解码块的系数编解码
QR-BDPCM跟随在用于TS编解码块的上下文建模方法之后。
2.4.2.1.编解码趟
用于TS残差的经修改的变换系数幅值编解码。如果CG含有非零系数,那么应用多趟对每一CG编解码。
·第一趟:如果需要的话,对大于0标志(sig_coeff_flag)、符号标志(coeff_sign_flag)、大于1标志(abs_level_gtx_flag[0])和奇偶性标志(par_level_flag)编解码
·第2趟到第5趟:
ο对于第j趟,对大于(2*j)标志(abs_level_gtx_flag[j-1])编解码
·第6趟:对该系数的幅度的剩余部分(abs_remainder)编解码
2.4.2.2.相较于非TS残差编解码的变化总结
相对于常规残差编解码情况,用于TS的残差编解码包括下述改变:
1)不对最后的x/y位置进行信令通知
2)在所有的先前标志都等于0时针对除了最后子块的每一子块对coded_sub_block_flag编解码;
3)采用缩减模板的sig_coeff_flag上下文建模,
4)用于abs_level_gtX_flag[0]和par_level_flag的单个上下文模型,
5)用于符号标志以及附加的大于5标志、大于7标志、大于9标志的上下文建模,
6)用于余数二值化的经修改的Rice参数推导
7)每样点的上下文编解码二进制位的数量的极限,一个块内每样点2个二进制位。
2.4.2.3.语法和语义
7.3.6.10变换单元语法
下文具有粗体、斜体和/或下划线的部分指示所提出的对该标准的修改。
Figure BDA0003420300030000371
Figure BDA0003420300030000381
Figure BDA0003420300030000391
Figure BDA0003420300030000401
Figure BDA0003420300030000411
上下文编解码二进制位的数量局限于对于每CG而言不大于每样点2个二进制位。
表格9–对具有上下文编解码二进制位的语法元素的ctxInc分配
Figure BDA0003420300030000421
表格9–对具有上下文编解码二进制位的语法元素的ctxInc分配
Figure BDA0003420300030000431
3.现有实施方式的缺点
当前设计具有下述问题:
1.为了符合上下文自适应二进制算术编解码(CABAC)的吞吐量,设置每块的上下文编解码二进制位的最大数量,并且采用计数器记录在一个块内包含多少上下文编解码二进制位。在当前设计中,通过W*H表示亮度块,并且采用计数器记录已经编解码了多少二进制位。一旦计数器达到K*W*H(在当前VVC中k=2,等于在最近VVC工作草案中为2*(1<<log2TbWidth)*(1<<log2TbHeight)的MaxCcbs),对其余二进制位全部进行旁路编解码。然而,同样的每块的上下文编解码二进制位的最大数量的设置在CABAC上下文编解码二进制位的吞吐量方面带来了严重问题。
2.如果还对色度块应用变换跳过模式(包括QR-BDPCM),那么如何设置上下文编解码二进制位的最大数量是未知的。
3.在PCT/CN2019/086814中已经描述了进一步提高CABAC上下文编解码二进制位的吞吐量的几种方式,通过引用将该文献全文并入本文。
4.示例技术和实施例
下文描述的详细实施例应被视为解释一般概念的示例。不应狭义地解释这些实施例。此外,这些实施例可以以任何方式组合。
在下文的讨论中,就单一树编解码结构而言,CU可以包括与所有的三色分量相关联的信息。或者,就单色编解码而言,CU可以包括仅与亮度颜色分量相关联的信息。或者,就双树编解码结构而言,CU可以包括仅与亮度颜色分量(例如,YCbCr格式中的Y分量或者GBR格式中的G分量)相关联的信息。或者,就双树编解码结构而言,CU可以包括仅与两个色度分量(例如,YCbCr中的Cb和Cr分量或者GBR格式中的B和R分量)相关联的信息。
在下文的描述当中,“块”可以指编解码单元(CU)或变换单元(TU)或编解码块(CB)或变换块(TB)。
除了控制每块的上下文编解码二进制位的最大数量之外,提出了可以限制每X的上下文编解码二进制位的最大数量。X是视频单元(砖块/片/CTU行/一个或多个CTU或VPDU或视频数据的子区域)/块(TU/CU/PU/TB/CB等)/CG/块内的子区域/编解码趟/语法元素/语法元素的群组/样点/像素/上下文/上下文的群组。当存在每X(例如,编解码趟、块)的限制时,分配计数器,以记录对于每X(例如,编解码趟、块)已经对多少二进制位进行了上下文编解码。
1.对于色度分量,上下文编解码二进制位的最大数量可以小于或者不大于亮度分量的上下文编解码二进制位的最大数量。
a.在一个示例中,两个色度分量的上下文编解码二进制位的最大数量可以都小于或者不大于亮度分量的上下文编解码二进制位的最大数量。
b.在一个示例中,一个色度分量的上下文编解码二进制位的最大数量可以小于或者不大于亮度分量的上下文编解码二进制位的最大数量。
2.对于帧内编解码视频单元(例如,条带/片/砖块/图片),上下文编解码二进制位的最大数量可以大于或者不小于帧间编解码视频单元(例如,P/B条带/片/砖块/图片)的上下文编解码二进制位的最大数量。
3.假定块宽度和高度为W和H,将不再总是使用K(K=2)*W*H作为所有块的上下文编解码二进制位的最大数量,相反上下文编解码二进制位的最大数量和/或K可以分别取决于该块的编解码特性。
a.在一个示例中,从一个块到另一块,K可以改变。
b.在另一个示例中,K可以取决于W和/或H。
i.在一个示例中,对于两个块而言,具有较大块尺寸的一个块的K值不大于或者小于具有较小块尺寸的另一个块的K值。
ii.在一个示例中,上下文编解码二进制位的最大数量和/或K可以取决于块形状(例如,方形(W=H)或者非方形(W!=H))。
iii.在一个示例中,对于W*H>T0,K=1.75(例如,T0=64)。
c.在一个示例中,上下文编解码二进制位的最大数量和/或K可以取决于编解码模式,诸如帧内/帧间/IBC。
d.在一个示例中,上下文编解码二进制位的最大数量和/或K可以取决于所应用的变换矩阵类型。
e.在一个示例中,上下文编解码二进制位的最大数量和/或K可以取决于编解码技术,例如,是否应用变换。
f.在一个示例中,上下文编解码二进制位的最大数量和/或K可以取决于编解码模式,例如,是否启用QR-BDPCM。
i.在一个示例中,对于W*H=T0并且应用QR-BDPCM,K=1.75(例如,T0=64)。
ii.在一个示例中,对于W*H<=T0&&W*H>=T1并且应用QR-BDPCM,K=1.75(例如,T0=64,T1=32)。
g.在一个示例中,上下文编解码二进制位的最大数量和/或K可以取决于一个块的位置,例如,在图片/条带/砖块/片边界内。
h.在一个示例中,上下文编解码二进制位的最大数量和/或K可以取决于量化参数。
i.上下文编解码二进制位的最大数量和/或K可以取决于预测信号是从何处生成的、空域邻居、当前图片中的样点、不同于当前图片的一个或多个图片中的样点。
j.在一个示例中,上下文编解码二进制位的最大数量和/或K可以取决于块分割深度和/或分割结构。
k.在一个示例中,每块的上下文编解码二进制位的最大数量可以取决于是否应用无损编解码模式。
4.一个块的每样点上下文编解码二进制位的最大数量可以取决于该块的编解码特性。
a.在一个示例中,对于两个块而言,具有较大尺寸的一个块的每样点上下文编解码二进制位的最大数量不大于或小于具有较小块尺寸的另一块的每样点上下文编解码二进制位的最大数量
b.在一个示例中,块的每样点上下文编解码二进制位的最大数量可以取决于块形状(方形或非方形)。
c.在一个示例中,块的每样点上下文编解码二进制位的最大数量可以取决于编解码模式,诸如帧内/帧间/IBC。
d.在一个示例中,块的每样点上下文编解码二进制位的最大数量可以取决于所应用的变换矩阵类型。
e.在一个示例中,块的每样点上下文编解码二进制位的最大数量可以取决于编解码技术,例如,是否应用变换。
f.在一个示例中,块的每样点上下文编解码二进制位的最大数量可以取决于编解码模式,例如,是否启用QR-BDPCM。
g.在一个示例中,块的每样点上下文编解码二进制位的最大数量可以取决于一个块的位置,例如,在图片/条带/砖块/片边界内。
h.在一个示例中,块的每样点上下文编解码二进制位的最大数量可以取决于量化参数。
i.在一个示例中,块的每样点上下文编解码二进制位的最大数量可以取决于预测信号是从何处生成的、空域邻居、当前图片中的样点、不同于当前图片的一个或多个图片中的样点。
j.在一个示例中,块的每样点上下文编解码二进制位的最大数量可以取决于块分割深度和/或分割结构。
k.在一个示例中,每样点上下文编解码二进制位的最大数量可以取决于是否应用无损编解码模式。
5.可以将语法元素(用于残差编解码的上下文编解码语法元素)划分成具有单独控制的不同群组。
a.在一个示例中,可以将所应用的不同控制策略应用于不同群组。
b.在一个示例中,可以将上下文编解码语法元素划分成N个群组。每一群组具有其自身的阈值,以控制是否可以应用上下文编解码方法。
i.在一个示例中,对于群组i而言,可以保持计数器Ci,以控制可以采用CABAC方法对多少个二进制位编解码。在上下文编解码二进制位的数量大于阈值时,可以不允许上下文编解码方法。
ii.该阈值可以取决于群组内的语法元素的初始上下文/概率。
1)替代性地,可以在SPS/PPS/条带/图片/片组级上信令通知阈值。
c.如何对语法元素分组可以取决于语法元素的初始上下文/概率。
d.如何对语法元素分组可以取决于在何处对语法元素编解码,例如,在分割级内,在CU或PU或TU级或者残差编解码级内。
e.可以动态改变分组。
i.在一个示例中,在将语法元素的上下文更新为处于预定义上下文集合内时,可以将该语法元素分配给某一群组。
ii.在一个示例中,可以基于每一语法元素的上下文/概率允许重新分组。
1)在一个示例中,在从最近一次重新分组开始已经对一定数量的样点编解码之后,可以允许重新分组。
2)在一个示例中,在从最近一次重新分组开始已经向比特流生成了给定数量的比特之后,可以允许重新分组。
3)在一个示例中,在从最近一次重新分组开始已经处理了给定数量的CG之后,可以允许重新分组。
4)在一个示例中,在群组中的概率差异超过某一阈值时,可以允许重新分组。
5)在一个示例中,在上下文编解码二进制位的数量超过某一阈值时,可以允许重新分组。
6)在一个示例中,在重新初始化上下文/概率时,可以允许重新分组。
6.可以将上下文(用于残差编解码的那些)划分成具有单独控制的不同群组。
a.在一个示例中,可以将不同控制策略应用于不同群组。
b.在一个示例中,可以将上下文划分成N个群组。每一群组具有其自身的阈值,以控制是否可以应用上下文编解码方法。
i.在一个示例中,对于上下文群组i而言,可以保持计数器Ci,以控制可以采用该群组内的上下文对多少个二进制位编解码。在上下文编解码二进制位的数量大于阈值时,可以不允许采用该群组内的上下文的上下文编解码方法。
ii.该阈值可以取决于群组内的上下文的初始状态/概率。
1)替代性地,可以在SPS/PPS/条带/图片/片组级上信令通知阈值。
c.如何对上下文分组可以取决于上下文的初始状态/概率。
d.可以动态改变分组。
i.在一个示例中,在将上下文的状态更新为处于预定状态集内时,可以将该上下文分配给某一群组。
ii.在一个示例中,可以基于每一上下文的状态/概率允许重新分组。
1)在一个示例中,在从最近一次重新分组开始已经对一定数量的样点编解码之后,可以允许重新分组。
2)在一个示例中,在从最近一次重新分组开始已经向比特流生成了给定数量的比特之后,可以允许重新分组。
3)在一个示例中,在从最近一次重新分组开始已经处理了给定数量的CG之后,可以允许重新分组。
4)在一个示例中,在群组中的上下文概率差异超过某一阈值时,可以允许重新分组。
5)在一个示例中,在上下文编解码二进制位的数量超过某一阈值时,可以允许重新分组。
6)在一个示例中,在重新初始化状态/概率时,可以允许重新分组。
7.可以按照预定义方式重置控制上下文编解码二进制位的数量的计数器/阈值(例如,K*W*H)。
a.在一个示例中,在从最近一次计数器重置开始已经对给定数量的样点编解码之后,可以重置计数器。
b.在一个示例中,在从最近一次计数器重置开始已经向比特流生成了给定数量的比特之后,可以重置计数器。
c.在一个示例中,在从最近一次计数器重置开始已经处理了给定数量的CG之后,可以重置计数器。
d.在一个示例中,可以在每一CTU行处重置计数器。
e.在一个示例中,可以在每一片组处重置计数器。
f.在一个示例中,可以在每一片处重置计数器。
g.在一个示例中,可以在每一CTU处重置计数器。
h.在一个示例中,可以在接收某一标志时重置计数器。
i.可以周期性地发送该标志,以告知是否应当重置计数器。
ii.在一个示例中,可以在PPS/SPS/图片/片组/条带
/CTU行/CTU/CU/块/视频砖块级上信令通知该标志。
8.上述方法可以适用于每X上下文编解码二进制位的最大数量(例如,X是视频单元(砖块/片/CTU行/一个或多个CTU或者VPDU/CG/编解码趟/语法元素/语法元素群组/像素))。
a.在一个示例中,X为CG或编解码趟或语法元素或语法元素群组。
i.替代性地,每CG的上下文编解码二进制位的最大数量可以取决于一个CG在一个块内的位置。
b.上述方法可以适用于每片组/每片/每CTU或每CTU行的上下文编解码二进制位的最大数量。
c.上述方法可以适用于每VPDU上下文编解码二进制位的最大数量。
d.对于视频编解码标准的不同简表/级别/层次而言,每图片/每条带/每片组/每片/CTU行/CTU/VPDU/块/样点的上下文编解码二进制位的最大数量可以是不同的。
9.在一个CU具有多个TU时,可以每CU控制上下文编解码二进制位的最大数量。
a.在一个示例中,将计数器分配给CU,以记录当前CU中多少个上下文编解码二进制位。可以在对CU编码/解码之前将该计数器重置为0。
b.替代性地,可以每TU控制上下文编解码二进制位的最大数量。
i.替代性地,此外,为TU分配计数器,以记录当前TU中多少个上下文编解码二进制位。可以在对TU编码/解码之前将该计数器重置为0。
c.可以根据某些规则,例如,基于CU的维度决定是否控制CU或TU中的上下文编解码二进制位。
10.当一个CU/TU/PU具有多个颜色分量(例如,单树中的3个颜色分量;双树色度编解码中的2个颜色分量)时,可以每颜色分量控制上下文编解码二进制位的最大数量。
a.在一个示例中,为CU/TU/PU中的块(例如,亮度块)
分配计数器,以记录当前块中多少个上下文编解码二进制位。可以在对块编码/解码之前将该计数器重置为0。也就是说,不同的颜色分量具有单独控制。
b.替代性地,可以每CU/TU/PU控制上下文编解码二进制位的最大数量。
i.替代性地,此外,为CU/TU/PU分配计数器,以记录当前CU/TU/PU中多少个上下文编解码二进制位。可以在对CU/TU/PU编码/解码之前将该计数器重置为0。
c.可以根据某些规则(诸如分割结构(双树或单树)、是否对颜色分量应用变换)来决定是否控制一个或多个颜色分量中的上下文编解码二进制位。
11.对于不同编解码方法,可以将每X上下文编解码二进制位的最大数量(例如,X为图片/条带/CTU行/CTU/VPDU/块/样点/语法元素群组/TB/TU/子块/CG)设置成相同值。
a.在一个示例中,对TS或非TS编解码视频块的操纵可以遵循相同值(例如,控制上下文编解码二进制位的数量的相同阈值)来确定对剩余二进制位进行上下文编解码还是旁路编解码。
b.在一个示例中,采用视频块(例如,TB中的变换块)的面积推导TB的上下文编解码二进制位的最大数量。对于TB,上下文编解码二进制位的最大数量等于tb_width*tb_height*K(例如,K=1.75),其中,例如,tb_width和tb_height是系数归零之后TB的宽度和高度。可以对所有种类的视频块应用阈值K,而不管其为TS模式还是非TS模式。
i.替代性地,此外,可以在对视频块编码/解码之前将计数器设置为tb_width*tb_height*K。在对一个上下文编解码二进制位解码之后,可以使计数器减1。当在对语法元素或子块解码之后上下文编解码二进制位的数量小于第二阈值时,对所有剩余二进制位或全部进行旁路编解码。
1)在一个示例中,第二阈值可以取决于对一个视频块应用的编解码方法(例如,TS或TS)。
a.例如,K0(例如,4)用于非TS编解码块,并且K1(例如,8)用于TS编解码块。K0和/或K1可以取决于对该视频块编码/解码过程中的编解码趟/子块/CG。
2)在一个示例中,第二阈值可以取决于对一个视频块应用的编解码方法(例如,TS或TS)。
a.例如,在非TS编解码块中,语法元素可以是“abs_level_gt3_flag”
b.例如,在非TS编解码块中,语法元素可以是“par_level_flag”
12.可以在(例如)VPS/SPS/DPS/PPS/APS/图片标头/条带标头/片组标头中信令通知每X上下文编解码二进制位的最大数量(例如,X是图片/条带/CTU行/CTU/VPDU/块/样点/语法元素群组)。
5.所公开技术的示例性实施方式
图21是视频处理装置2100的框图。装置2100可以用于实施本文描述的方法中的一者或多者。装置2100可以被体现到智能手机、平板电脑、计算机、物联网(IoT)接收器等当中。装置2100可包括一个或多个处理器2102、一个或多个存储器2104和视频处理硬件2106。(一个或多个)处理器2102可以被配置为实施本文件中描述的一种或多种方法。(一个或多个)存储器2104可以用于存储用于实施本文描述的方法和技术的数据和代码。视频处理硬件2106可以用于在硬件电路中实施本文中描述的一些技术,并且可以部分或完全是处理器2102的部分(例如,图形处理器内核GPU或其他信号处理电路)。
在本文中,术语“视频处理”可以指视频编码、视频解码、视频压缩或视频解压缩。例如,可以在从视频的像素表示变换到对应比特流表示或反之期间应用视频压缩算法。当前视频块的比特流表示可以(例如)对应于比特流之内位于一处或散布在不同地方的比特,如语法所定义。例如,可以在依据变换和编解码的误差残差值并且还使用比特流中的标头和其他字段中的比特的情况下来编码宏块。
应当理解,所公开的方法和技术将通过允许使用本文件中公开的技术而有益于结合在视频处理设备之内的视频编码器和/或解码器实施例,例如,视频处理设备可以是智能电话、膝上型电脑、台式计算机和类似设备。
图22是视觉媒体处理的示例性方法2200的流程图。方法2200包括:在2210中执行视频单元和视频单元的比特流表示之间的转换,其中,该转换包括在可对与该视频单元相关联的第一处理单元的上下文编解码二进制位的最大数量应用的限制的基础上对该视频单元进行上下文建模,其中,将上下文建模的信息包含到该视频单元的比特流表示当中。
可以利用以下基于条款的格式来描述一些实施例。
1.一种视觉媒体处理的方法,包括:
执行视频单元和视频单元的比特流表示之间的转换,其中,该转换包括在可对与该视频单元相关联的第一处理单元的上下文编解码二进制位的最大数量应用的限制的基础上对该视频单元进行上下文建模,其中,将上下文建模的信息包含到该视频单元的比特流表示当中。
2.根据条款1所述的方法,其中,第一处理单元包括一个或多个色度分量和一个亮度分量,并且这一个或多个亮度分量的每者的上下文编解码二进制位的最大数量不大于该亮度分量的上下文编解码二进制位的最大数量。
3.根据条款1所述的方法,其中,第一处理单元包括帧内编解码单元和帧间编解码单元,并且帧内编解码视频单元的上下文编解码二进制位的最大数量不大于帧间编解码视频单元的上下文编解码二进制位的最大数量。
4.根据条款1所述的方法,其中,第一处理单元的上下文编解码二进制位的最大数量与该视频单元的各维度有关。
5.根据条款1所述的方法,其中,第一处理单元的上下文编解码二进制位的最大数量与该视频单元中的QR-BDPCM编解码步骤、TS编解码步骤的使用或者变换矩阵类型有关。
6.根据条款1所述的方法,其中,第一处理单元的上下文编解码二进制位的最大数量与和该视频单元相关联的一个或多个量化参数有关。
7.根据条款1所述的方法,其中,第一处理单元的上下文编解码二进制位的最大数量与该视频单元的空间位置有关。
8.根据条款1所述的方法,其中,第一处理单元的上下文编解码二进制位的最大数量与预测信号有关。
9.根据条款9所述的方法,其中,预测信号由下述选项中的任何一者或多者生成:该视频单元的一个或多个空间相邻视频单元、该视频单元内包含的样点或者来自其他视频单元的一个或多个样点。
10.根据条款1所述的方法,其中,第一处理单元的上下文编解码二进制位的最大数量与该视频单元的块分割深度和/或分割结构有关。
11.根据条款1所述的方法,其中,第一处理单元包括两个块,并且具有较大块尺寸的块的每样点上下文编解码二进制位的最大数量不大于具有较小块尺寸的块的每样点上下文编解码二进制位的最大数量。
12.根据条款1所述的方法,其中,第一处理单元的上下文编解码二进制位的最大数量与该视频单元的形状有关。
13.一种视觉媒体处理的方法,包括:
执行视频单元和视频单元的比特流表示之间的转换,其中,该转换包括在可对与该视频单元相关联的第一处理单元的上下文编解码二进制位的最大数量应用的限制的基础上对该视频单元进行上下文建模,其中,该转换包括根据上下文对处理单元分组的步骤,使得第一处理单元与第一上下文相关联,并且第二处理单元与第二上下文相关联。
14.根据条款13所述的方法,其中,第一处理单元与用于选择性地启用或禁用上下文建模的阈值相关联。
15.根据条款14所述的方法,其中,如果第一处理单元的上下文编解码二进制位的最大数量超过该阈值,对该视频单元禁用上下文建模。
16.根据条款14所述的方法,其中,用于选择性地启用或禁用上下文建模的阈值取决于第一处理单元内的第一上下文的初始状态/概率。
17.根据条款14所述的方法,其中,将用于选择性地启用或禁用上下文建模的阈值作为比特流表示的部分进行信令通知。
18.根据条款14所述的方法,其中,根据上下文对处理单元的分组是可动态更改的。
19.根据条款18所述的方法,其中,基于一个或多个条件启用或禁用根据上下文对处理单元的重新分组。
20.根据条款19所述的方法,其中,该一个或多个条件包括下述选项中的一者或多者:(a)每一上下文的状态/概率,(b)自最近的重新分组以来编解码的样点的数量(c)自最近的重新分组以来在该转换中生成的比特的数量,(d)自最近的重新分组以来处理的编解码群组的数量,(e)群组中的上下文概率差异超过阈值,(f)群组中的上下文编解码二进制位的数量超过阈值,或者(g)上下文的状态/概率的重新初始化。
21.一种视觉媒体处理的方法,包括:
执行视频单元和视频单元的比特流表示之间的转换,其中,该转换包括在可对与该视频单元相关联的第一处理单元的上下文编解码二进制位的最大数量应用的限制的基础上对该视频单元进行上下文建模,其中,采用计数器记录第一处理单元中的上下文编解码二进制位的数量,并且其中,该计数器可在满足一个或多个条件时重置。
22.根据条款21所述的方法,其中,该一个或多个条件是预定义条件。
23.根据条款21所述的方法,其中,该一个或多个条件与自计数器的最近重置以来所编解码的样点的数量有关。
24.根据条款21所述的方法,其中,该一个或多个条件与自计数器的最近重置以来作为比特流表示的部分生成的比特的数量有关。
25.根据条款21所述的方法,其中,该一个或多个条件与自计数器的最近重置以来所处理的编解码群组的数量有关。
26.根据条款21所述的方法,其中,在该视频单元的编解码树单元(CTU)的每一行处,在每一片处,在每一片组处,或者在检测到比特流表示中的标志时重置计数器。
27.根据条款26所述的方法,其中,该标志指示是否将重置计数器。
28.根据条款1-27中的任一项或多项所述的方法,其中,第一处理单元的上下文编解码二进制位的最大数量取决于该视频单元的颜色分量。
29.根据条款1-28中的任一项或多项所述的方法,其中,第一处理单元包括编解码群组、编解码趟、语法元素或者语法元素的群组。
30.根据条款1-29中的任一项或多项所述的方法,其中,第一处理单元的上下文编解码二进制位的最大数量取决于该视频单元的位置。
31.根据条款1-30中的任一项或多项所述的方法,其中,第一处理单元的上下文编解码二进制位的最大数量取决于与该视频单元相关联的条带/片/片组/图片类型。
32.根据条款1-31中的任一项或多项所述的方法,其中,第一处理单元的上下文编解码二进制位的最大数量取决于DPS/SPS/PPS/APS/VPS/序列标头/图片标头/条带标头/片组标头/片/编解码树单元(CTU)的群组。
33.一种处于视频***中的装置,包括处理器以及具有位于其上的指令的非暂态存储器,其中,指令在被处理器执行时使得处理器实施根据条款1到32中的任一项所述的方法。
34.一种存储在非暂态计算机可读介质上的计算机程序产品,该计算机程序产品包括用于实施根据条款1到32中的任一项所述的方法的程序代码。
图23是视觉媒体处理的示例性方法2300的流程图。方法2300包括在2302中针对视频和该视频的比特流表示之间的转换,对与该视频相关联的每预定单元的上下文编解码二进制位的最大数量应用控制;以及在2304中基于该控制执行该转换。
在一些示例中,该预定单元包括下述选项中的至少一者:
包括编解码单元(CU)、变换单元(TU)、预测单元(PU)、编解码块(CB)和变换块(TB)中的至少一者的块;
包括砖块、片、编解码树单元(CTU)行、一个或多个CTU行、虚拟管线数据单元(VPDU)和视频数据的子区域的视频单元;
编解码群组(CG);
块内的子区域;
编解码趟;
语法元素或语法元素的群组;
样点或像素;
图片、条带、片组或片;
上下文或者上下文的群组;以及
包括色度分量和亮度分量的颜色分量。
在一些示例中,对于色度分量,上下文编解码二进制位的最大数量小于或者不大于亮度分量的上下文编解码二进制位的最大数量。
在一些示例中,两个色度分量的上下文编解码二进制位的最大数量都小于或者不大于亮度分量的上下文编解码二进制位的最大数量。
在一些示例中,一个色度分量的上下文编解码二进制位的最大数量小于或者不大于亮度分量的上下文编解码二进制位的最大数量。
在一些示例中,对于帧内编解码视频单元,上下文编解码二进制位的最大数量大于或者不小于帧间编解码视频单元的上下文编解码二进制位的最大数量。
在一些示例中,该预定单元包括具有块尺寸为宽度W和高度H的块,块的上下文编解码二进制位的最大数量为K*W*H,K为变量,其中,每块的上下文编解码二进制位的最大数量和/或K分别取决于该块的编解码特性。
在一些示例中,从一个块到另一块,K发生变化。
在一些示例中,K取决于W和/或H。
在一些示例中,对于两个块而言,具有较大块尺寸的一个块的K值不大于或者小于具有较小块尺寸的另一个块的K值。
在一些示例中,每块的上下文编解码二进制位的最大数量和/或K取决于块的块形状,其中,块形状包括W=H的情况下的方形形状和W!=H的情况下的非方形形状之一。
在一些示例中,在W*H>T0时,K=1.75,其中,T0为整数。
在一些示例中,T0=64。
在一些示例中,每块的上下文编解码二进制位的最大数量和/或K取决于块的编解码模式,其中,编解码模式包括帧内模式、帧间模式和帧内块复制(IBC)模式中的至少一者。
在一些示例中,每块的上下文编解码二进制位的最大数量和/或K取决于所应用的变换矩阵类型。
在一些示例中,每块的上下文编解码二进制位的最大数量和/或K取决于该块的编解码技术,其中,编解码技术包括是否应用变换。
在一些示例中,每块的上下文编解码二进制位的最大数量和/或K取决于该块的编解码技术,其中,编解码技术包括是否应用量化残差域块差分脉冲编解码调制(QR-BDPCM)。
在一些示例中,在W*H=T0并且应用QR-BDPCM时,K=1.75,其中,T0为整数。
在一些示例中,T0=64。
在一些示例中,在W*H<=T0&&W*H>=T1并且应用QR-BDPCM时,K=1.75,其中,T0和T1为整数。
在一些示例中,T0=64并且T1=32。
在一些示例中,每块的上下文编解码二进制位的最大数量和/或K取决于该块的位置。
在一些示例中,每块的上下文编解码二进制位的最大数量和/或K取决于该块的量化参数。
在一些示例中,每块的上下文编解码二进制位的最大数量和/或K取决于生成预测信号的来源,其中,来源包括空域邻居、当前图片中的样点、不同于当前图片的一个或多个图片中的样点中的至少一者。
在一些示例中,每块的上下文编解码二进制位的最大数量和/或K取决于该块的块分割深度和/或分割结构。
在一些示例中,每块的上下文编解码二进制位的最大数量取决于是否应用无损编解码模式。
在一些示例中,在该预定单元包括样点时,块的每样点上下文编解码二进制位的最大数量取决于该块的编解码特性。
在一些示例中,对于两个块而言,具有较大尺寸的一个块的每样点上下文编解码二进制位的最大数量不大于或小于具有较小块尺寸的另一块的每样点上下文编解码二进制位的最大数量
在一些示例中,块的每样点上下文编解码二进制位的最大数量取决于该块的块形状,其中,块形状包括方形形状和非方形形状之一。
在一些示例中,块的每样点上下文编解码二进制位的最大数量取决于该块的编解码模式,其中,编解码模式包括帧内模式、帧间模式和帧内块复制(IBC)模式中的至少一者。
在一些示例中,块的每样点上下文编解码二进制位的最大数量取决于所应用的变换矩阵类型。
在一些示例中,块的每样点上下文编解码二进制位的最大数量取决于该块的编解码技术,其中,编解码技术包括是否应用变换。
在一些示例中,块的每样点上下文编解码二进制位的最大数量取决于该块的编解码技术,其中,编解码技术包括是否应用量化残差域块差分脉冲编解码调制(QR-BDPCM)。
在一些示例中,块的每样点上下文编解码二进制位的最大数量取决于该块的位置。
在一些示例中,块的每样点上下文编解码二进制位的最大数量取决于该块的量化参数。
在一些示例中,块的每样点上下文编解码二进制位的最大数量取决于生成预测信号的来源,其中,来源包括空域邻居、当前图片中的样点、不同于当前图片的一个或多个图片中的样点中的至少一者。
在一些示例中,块的每样点上下文编解码二进制位的最大数量取决于该块的块分割深度和/或分割结构。
在一些示例中,块的每样点上下文编解码二进制位的最大数量取决于是否应用无损编解码模式。
在一些示例中,该预定单元包括CG、编解码趟或语法元素或者语法元素的群组中的至少一者。
在一些示例中,每CG的上下文编解码二进制位的最大数量取决于一个CG在一个块内的位置。
在一些示例中,该预定单元包括片组、片、CTU或CTU行中的至少一者。
在一些示例中,该预定单元包括VPDU。
在一些示例中,对于视频编解码标准的不同简表、级别、层次而言,每图片、每条带、每片组、每片、每CTU行、每CTU、每VPDU、每块或者每样点的上下文编解码二进制位的最大数量是不同的。
在一些示例中,该预定单元包括CU,并且一个CU包括多个TU。
在一些示例中,每CU控制上下文编解码二进制位的最大数量。
在一些示例中,为CU分配计数器,以记录当前CU中上下文编解码二进制位的数量。
在一些示例中,在对该CU编码或解码之前,将该计数器重置为0。
在一些示例中,每TU控制上下文编解码二进制位的最大数量。
在一些示例中,为TU分配计数器,以记录当前TU中上下文编解码二进制位的数量。
在一些示例中,在对该TU编码或解码之前,将该计数器重置为0。
在一些示例中,根据某些规则确定是否在CU或TU级内控制上下文编解码二进制位,这些规则包括CU的维度。
在一些示例中,该预定单元包括CU、TU或PU之一,并且一个CU、TU或PU包括多个颜色分量,其中,该多个颜色分量包括单树中的三个颜色分量和双树色度编解码中的两个颜色分量。
在一些示例中,每颜色分量控制上下文编解码二进制位的最大数量。
在一些示例中,为CU、TU或PU中的块分配计数器,以记录当前块内上下文编解码二进制位的数量。
在一些示例中,在对该块编码或解码之前,将该计数器重置为0。
在一些示例中,每CU、TU或PU控制上下文编解码二进制位的最大数量。
在一些示例中,为CU、TU或PU中的块分配计数器,以记录当前当前CU、TU或PU内上下文编解码二进制位的数量。
在一些示例中,在对该CU、TU或PU编码或解码之前,将该计数器重置为0。
在一些示例中,根据某些规则来确定是否控制一个或多个颜色分量中的上下文编解码二进制位,其中,这些规则包括双树或单树的分割结构以及/或者是否对颜色分量应用变换。
在一些示例中,对于不同编解码方法,将每预定单元的上下文编解码二进制位的最大数量设置为相同值。
在一些示例中,变换跳过(TS)或非TS编解码视频块遵循相同的规则来确定对剩余二进制位进行上下文编解码还是旁路编解码,其中,这些规则包括使用相同的控制上下文编解码二进制位的数量的阈值。
在一些示例中,采用TB中的视频块的面积推导TB的上下文编解码二进制位的最大数量。
在一些示例中,TB的上下文编解码二进制位的最大数量等于tb_width*tb_height*K,其中,tb_width和tb_height是系数归零之后TB的宽度和高度,并且K为阈值。
在一些示例中,对所有种类的视频块应用阈值K,而不管其为TS模式还是非TS模式。
在一些示例中,在对该视频块编码或解码之前,将计数器设置为tb_width*tb_height*K。
在一些示例中,在对一个上下文编解码二进制位解码之后使计数器减1。
在一些示例中,当在对语法元素或子块解码之后上下文编解码二进制位的数量小于第二阈值时,对所有剩余二进制位或全部进行旁路编解码。
在一些示例中,第二阈值取决于对该视频块应用的编解码方法,其中,该编解码方法包括TS或非TS模式。
在一些示例中,对于非TS编解码块,该第二阈值为K0,对于TS编解码块,该第二阈值为K1,其中,K0和K1为整数。
在一些示例中,K0=4并且K1=8。
在一些示例中,K0和/或K1取决于对视频块编码或解码的过程中的编解码趟、子块或CG中的至少一者。
在一些示例中,在非TS编解码块中,语法元素为“abs_level_gt3_flag”。
在一些示例中,在非TS编解码块中,语法元素为“par_level_flag”。
在一些示例中,在VPS、SPS、DPS、PPS、APS、图片标头、条带标头或片组标头中的至少一者当中信令通知每预定单元的上下文编解码二进制位的最大数量。
图24是视觉媒体处理的示例性方法2400的流程图。方法2400包括:在2402中,针对视频的块和该块的比特流表示之间的转换,将与该块相关联的语法元素划分成不同群组;在2404中,对语法元素的不同群组应用单独控制;以及在2406中,基于这些控制执行转换。
在一些示例中,将不同控制策略应用于不同群组。
在一些示例中,语法元素包括用于残差编解码的上下文编解码语法元素,并且将上下文编解码语法元素分类成N个群组,其中,每一群组具有用以控制是否能够应用上下文编解码方法的阈值,N为整数。
在一些示例中,对于这N个群组中的一个群组,保持对应的计数器,以控制能够采用基于上下文的自适应二进制算术编解码(CABAC)方法进行编解码的上下文编解码二进制位的数量。
在一些示例中,在上下文编解码二进制位的数量大于阈值时,不允许上下文编解码方法。
在一些示例中,阈值取决于群组内的语法元素的初始上下文和/或概率。
在一些示例中,在SPS、PPS、条带、图片和片组级中的至少一者当中信令通知该阈值。
在一些示例中,基于语法元素的初始上下文和/或概率将语法元素划分成不同群组。
在一些示例中,基于在何处对语法元素编解码而将语法元素划分成不同群组,其中,在分割级、在CU或PU或TU级或者在残差编解码级内对语法元素编解码。
在一些示例中,该分组是动态变化的。
在一些示例中,在将语法元素的上下文更新为处于预定义上下文集合内时,将该语法元素分配给某一群组。
在一些示例中,基于每一语法元素的上下文和/或概率允许重新分组。
在一些示例中,在从最近一次重新分组开始已经对一定数量的样点编解码之后,允许重新分组。
在一些示例中,在从最近一次重新分组开始已经向比特流生成了给定数量的比特之后,允许重新分组。
在一些示例中,在从最近一次重新分组开始已经处理了给定数量的CG之后,允许重新分组。
在一些示例中,在群组中的概率差异超过某一阈值时,允许重新分组。
在一些示例中,在上下文编解码二进制位的数量超过某一阈值时,允许重新分组。
在一些示例中,在对上下文和/或概率重新初始化之后,允许重新分组。
图25是视觉媒体处理的示例性方法2500的流程图。方法2500包括:在2502中,针对视频的块和该块的比特流表示之间的转换,将与该块相关联的用于残差编解码的上下文划分成不同群组;在2504中对上下文的不同群组应用单独控制;以及在2506中基于这些控制执行转换。
在一些示例中,将不同控制策略应用于不同群组。
在一些示例中,将上下文分类成N个群组,其中,每一群组具有用以控制是否能够应用上下文编解码方法的阈值,N为整数。
在一些示例中,对于这N个群组中的一个群组,保持对应的计数器,以控制能够采用该群组中的上下文编解码的上下文进行编解码二进制位的数量。
在一些示例中,在上下文编解码二进制位的数量大于阈值时,不允许采用该群组内的上下文的上下文编解码方法。
在一些示例中,阈值取决于群组内的上下文的初始状态和/或概率。
在一些示例中,在SPS、PPS、条带、图片和片组级中的至少一者当中信令通知该阈值。
在一些示例中,基于上下文的初始状态和/或概率将上下文划分成不同群组。
在一些示例中,该分组是动态变化的。
在一些示例中,在将上下文的状态更新为处于预定状态集内时,可以将该上下文分配给某一群组。
在一些示例中,基于每一上下文的状态和/或概率允许重新分组。
在一些示例中,在从最近一次重新分组开始已经对一定数量的样点编解码之后,允许重新分组。
在一些示例中,在从最近一次重新分组开始已经向比特流生成了给定数量的比特之后,允许重新分组。
在一些示例中,在从最近一次重新分组开始已经处理了给定数量的CG之后,允许重新分组。
在一些示例中,在群组中的概率差异超过某一阈值时,允许重新分组。
在一些示例中,在上下文编解码二进制位的数量超过某一阈值时,允许重新分组。
在一些示例中,在对上下文和/或概率重新初始化之后,允许重新分组。
图26是视觉媒体处理的示例性方法2600的流程图。方法2600包括:在2602中,针对视频和该视频的比特流表示之间的转换,通过使用一个或多个计数器对与该视频相关联的每预定单元上下文编解码二进制位的数量应用控制,其中,按照预定义方式重置该计数器;以及在2604中,基于该计数器执行转换。
在一些示例中,该预定单元包括具有块尺寸为宽度W和高度H的块,并且计数器具有阈值K*W*H,其中,K为变量。
在一些示例中,在从最近一次计数器重置开始已经对给定数量的样点编解码之后,重置计数器。
在一些示例中,在从最近一次计数器重置开始已经向比特流生成了给定数量的比特之后,重置计数器。
在一些示例中,在从最近一次计数器重置开始已经处理了给定数量的CG之后,重置计数器。
在一些示例中,在每一CTU行处重置计数器。
在一些示例中,在每一片组处重置计数器。
在一些示例中,在每一片处重置计数器。
在一些示例中,在每一CTU行处重置计数器。
在一些示例中,在接收某一标志时重置计数器。
在一些示例中,周期性地发送该标志,以指示是否应当重置计数器。
在一些示例中,在PPS、SPS、图片、片组、条带、CTU行、CTU、CU、块或视频砖块级中的至少一者上信令通知该标志。
在一些示例中,该转换从比特流表示生成视频。
在一些示例中,该转换从视频生成比特流表示。
本文件中描述的所公开的以及其他的解决方案、示例、实施例、模块和功能操作可以在数字电子电路、或计算机软件、固件或硬件中实施,其包括本文中所公开的结构及其结构等价方案或者它们当中的一者或多者的组合。所公开的实施例和其他实施例可以被实施成一个或多个计算机程序产品,即编码在计算机可读介质上的计算机程序指令的一个或多个模块,以供数据处理装置执行或控制数据处理装置的操作。计算机可读介质可以是机器可读存储设备、机器可读存储基板、存储设备、影响机器可读传播信号的物质组成或者它们当中的一者或多者的组合。术语“数据处理装置”涵盖用于处理数据的所有装置、设备和机器,包括(例如)可编程处理器、计算机或者多个处理器或计算机。除硬件外,该装置还可以包括为计算机程序创建执行环境的代码,例如,构成处理器固件的代码、协议栈、数据库管理***、操作***或者它们当中的一者或多者的组合。传播的信号是人为生成的信号,例如,机器生成的电、光或电磁信号,其被生成为对信息编码,以便传输到合适的接收器装置。
计算机程序(也称为程序、软件、软件应用、脚本或代码)可以用任何形式的编程语言(包括编译语言或解释语言)编写,并且可以按照任何形式部署,包括作为独立程序或作为模块、部件、子例程或其他适合在计算环境中使用的单元。计算机程序不一定与文件***中的文件对应。程序可以存储在保存其他程序或数据的文件(例如,存储在标记语言文档中的一个或多个脚本)的部分中,专用于该程序的单个文件中,或者多个协调文件(例如,存储一个或多个模块、子程序或代码部分的文件)中。可以将计算机程序部署为在一个或多个计算机上执行,这一个或多个计算机位于一个站点上,或者跨越多个站点分布并通过通信网络互连。
本说明书中描述的过程和逻辑流可以通过由一个或多个可编程处理器执行一个或多个计算机程序来执行,从而通过对输入数据进行操作并生成输出来执行功能。这些过程和逻辑流也可以通过专用逻辑电路来执行,并且装置也可以被实施成专用逻辑电路,例如,FPGA(现场可编程门阵列)或ASIC(专用集成电路)。
例如,适于执行计算机程序的处理器包括通用和专用微处理器,以及任何种类的数字计算机的任何一个或多个处理器。一般来讲,处理器将从只读存储器或随机存取存储器或这两者接收指令和数据。计算机的基本元件是执行指令的处理器以及存储指令和数据的一个或多个存储设备。通常,计算机还将包括一个或多个用于存储数据的大容量存储设备,例如,磁盘、磁光盘或光盘,或***作性地耦接为从一个或多个大容量存储设备接收数据或向其传输数据,或两者兼有。然而,计算机不一定具有这样的设备。适于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、介质和存储器设备,包括(例如)半导体存储设备,例如EPROM、EEPROM和闪存设备;磁盘,例如,内部硬盘或可移动盘;磁光盘;以及CD ROM和DVD ROM盘。处理器和存储器可以由专用逻辑电路来补充,或合并到专用逻辑电路中。
虽然本专利文件包含许多细节,但不应将其解释为对任何主题或权利要求范围的限制,而应解释为对特定技术的特定实施例的具体特征的描述。本专利文件在各单独实施例的语境下描述的某些特征也可以在单个实施例中组合实施。相反地,在单个实施例的语境下描述的各种特征也可单独地或者以任何合适的子组合的形式在多个实施例中实现。此外,虽然某些特征可能在上面被描述为以某些组合来起作用并且甚至最初也这样地来要求对其的权利保护,但是来自要求权利保护的组合的一个或多个特征在某些情况下可从该组合中去除,并且要求权利保护的组合可涉及子组合或子组合的变型。
类似地,虽然操作在附图中以特定次序示出,但不应将这种情况理解为需要以相继次序或所示的特定次来执行此类操作,或者需要执行所有所示的操作以实现期望的结果。此外,在本专利文件中描述的实施例当中对各种***部件的划分不应被理解为在所有实施例中都要求这样的划分。
仅描述了几种实施方式和示例,其他实施方式、增强和变化可以基于本专利文件中描述和说明的内容做出。

Claims (125)

1.一种用于视频处理的方法,包括:
针对视频和所述视频的比特流表示之间的转换,对与所述视频相关联的每预定单元的上下文编解码二进制位的最大数量应用控制;以及
基于所述控制执行所述转换。
2.根据权利要求1所述的方法,其中,所述预定单元包括下述选项中的至少一者:
包括编解码单元(CU)、变换单元(TU)、预测单元(PU)、编解码块(CB)和变换块(TB)中的至少一者的块;
包括砖块、片、编解码树单元(CTU)行、一个或多个CTU行、虚拟管线数据单元(VPDU)和视频数据的子区域的视频单元;
编解码群组(CG);
块内的子区域;
编解码趟;
语法元素或语法元素的群组;
样点或像素;
图片、条带、片组或片;
上下文或者上下文的群组;以及
包括色度分量和亮度分量的颜色分量。
3.根据权利要求2所述的方法,其中,对于色度分量,上下文编解码二进制位的最大数量小于或者不大于亮度分量的上下文编解码二进制位的最大数量。
4.根据权利要求3所述的方法,其中,两个色度分量的上下文编解码二进制位的最大数量都小于或者不大于亮度分量的上下文编解码二进制位的最大数量。
5.根据权利要求3所述的方法,其中,一个色度分量的上下文编解码二进制位的最大数量小于或者不大于亮度分量的上下文编解码二进制位的最大数量。
6.根据权利要求2所述的方法,其中,对于帧内编解码视频单元,上下文编解码二进制位的最大数量大于或者不小于帧间编解码视频单元的上下文编解码二进制位的最大数量。
7.根据权利要求2所述的方法,其中,所述预定单元包括具有块尺寸为宽度W和高度H的块,所述块的上下文编解码二进制位的最大数量为K*W*H,K为变量,其中,每块的上下文编解码二进制位的最大数量和/或K分别取决于所述块的编解码特性。
8.根据权利要求7所述的方法,其中,从一个块到另一块,K发生变化。
9.根据权利要求7所述的方法,其中,K取决于W和/或H。
10.根据权利要求9所述的方法,其中,对于两个块而言,具有较大块尺寸的一个块的K值不大于或者小于具有较小块尺寸的另一个块的K值。
11.根据权利要求9所述的方法,其中,每块的上下文编解码二进制位的最大数量和/或K取决于所述块的块形状,其中,所述块形状包括W=H的情况下的方形形状和W!=H的情况下的非方形形状之一。
12.根据权利要求9所述的方法,其中,在W*H>T0时,K=1.75,其中,T0为整数。
13.根据权利要求12所述的方法,其中,T0=64。
14.根据权利要求7所述的方法,其中,每块的上下文编解码二进制位的最大数量和/或K取决于所述块的编解码模式,其中,所述编解码模式包括帧内模式、帧间模式和帧内块复制(IBC)模式中的至少一者。
15.根据权利要求7所述的方法,其中,每块的上下文编解码二进制位的最大数量和/或K取决于所应用的变换矩阵类型。
16.根据权利要求7所述的方法,其中,每块的上下文编解码二进制位的最大数量和/或K取决于所述块的编解码技术,其中,所述编解码技术包括是否应用变换。
17.根据权利要求7所述的方法,其中,每块的上下文编解码二进制位的最大数量和/或K取决于所述块的编解码技术,其中,所述编解码技术包括是否应用量化残差域块差分脉冲编解码调制(QR-BDPCM)。
18.根据权利要求17所述的方法,其中,在W*H=T0并且应用QR-BDPCM时,K=1.75,其中,T0为整数。
19.根据权利要求18所述的方法,其中,T0=64。
20.根据权利要求17所述的方法,其中,在W*H<=T0&&W*H>=T1并且应用QR-BDPCM时,K=1.75,其中,T0和T1为整数。
21.根据权利要求20所述的方法,其中,T0=64并且T1=32。
22.根据权利要求7所述的方法,其中,每块的上下文编解码二进制位的最大数量和/或K取决于所述块的位置。
23.根据权利要求7所述的方法,其中,每块的上下文编解码二进制位的最大数量和/或K取决于所述块的量化参数。
24.根据权利要求7所述的方法,其中,每块的上下文编解码二进制位的最大数量和/或K取决于生成预测信号的来源,其中,所述来源包括空域邻居、当前图片中的样点、不同于当前图片的一个或多个图片中的样点中的至少一者。
25.根据权利要求7所述的方法,其中,每块的上下文编解码二进制位的最大数量和/或K取决于所述块的块分割深度和/或分割结构。
26.根据权利要求7所述的方法,其中,每块的上下文编解码二进制位的最大数量取决于是否应用无损编解码模式。
27.根据权利要求2所述的方法,其中,在所述预定单元包括样点时,块的每样点上下文编解码二进制位的最大数量取决于所述块的编解码特性。
28.根据权利要求27所述的方法,其中,对于两个块而言,具有较大尺寸的一个块的每样点上下文编解码二进制位的最大数量不大于或小于具有较小块尺寸的另一块的每样点上下文编解码二进制位的最大数量。
29.根据权利要求27所述的方法,其中,块的每样点上下文编解码二进制位的最大数量取决于所述块的块形状,其中,所述块形状包括方形形状和非方形形状之一。
30.根据权利要求27所述的方法,其中,块的每样点上下文编解码二进制位的最大数量取决于所述块的编解码模式,其中,所述编解码模式包括帧内模式、帧间模式和帧内块复制(IBC)模式中的至少一者。
31.根据权利要求27所述的方法,其中,块的每样点上下文编解码二进制位的最大数量取决于所应用的变换矩阵类型。
32.根据权利要求27所述的方法,其中,块的每样点上下文编解码二进制位的最大数量取决于所述块的编解码技术,其中,所述编解码技术包括是否应用变换。
33.根据权利要求27所述的方法,其中,块的每样点上下文编解码二进制位的最大数量取决于所述块的编解码技术,其中,所述编解码技术包括是否应用量化残差域块差分脉冲编解码调制(QR-BDPCM)。
34.根据权利要求27所述的方法,其中,块的每样点上下文编解码二进制位的最大数量取决于所述块的位置。
35.根据权利要求27所述的方法,其中,块的每样点上下文编解码二进制位的最大数量取决于所述块的量化参数。
36.根据权利要求27所述的方法,其中,块的每样点上下文编解码二进制位的最大数量取决于生成预测信号的来源,其中,所述来源包括空域邻居、当前图片中的样点、不同于当前图片的一个或多个图片中的样点中的至少一者。
37.根据权利要求27所述的方法,其中,块的每样点上下文编解码二进制位的最大数量取决于所述块的块分割深度和/或分割结构。
38.根据权利要求27所述的方法,其中,块的每样点上下文编解码二进制位的最大数量取决于是否应用无损编解码模式。
39.根据权利要求2所述的方法,其中,所述预定单元包括CG、编解码趟或语法元素或者语法元素的群组中的至少一者。
40.根据权利要求39所述的方法,其中,每CG的上下文编解码二进制位的最大数量取决于一个CG在一个块内的位置。
41.根据权利要求2所述的方法,其中,所述预定单元包括片组、片、CTU或CTU行中的至少一者。
42.根据权利要求2所述的方法,其中,所述预定单元包括VPDU。
43.根据权利要求2所述的方法,其中,对于视频编解码标准的不同简表、级别、层次而言,每图片、每条带、每片组、每片、每CTU行、每CTU、每VPDU、每块或者每样点的上下文编解码二进制位的最大数量是不同的。
44.根据权利要求2所述的方法,其中,所述预定单元包括CU,并且一个CU包括多个TU。
45.根据权利要求44所述的方法,其中,每CU控制上下文编解码二进制位的最大数量。
46.根据权利要求44或45所述的方法,其中,为CU分配计数器,以记录当前CU中上下文编解码二进制位的数量。
47.根据权利要求46所述的方法,其中,在对所述CU编码或解码之前,将所述计数器重置为0。
48.根据权利要求44所述的方法,其中,每TU控制上下文编解码二进制位的最大数量。
49.根据权利要求48所述的方法,其中,为TU分配计数器,以记录当前TU中上下文编解码二进制位的数量。
50.根据权利要求49所述的方法,其中,在对所述TU编码或解码之前,将所述计数器重置为0。
51.根据权利要求44-50中任一项所述的方法,其中,根据某些规则确定是否在CU或TU级内控制上下文编解码二进制位,所述的某些规则包括所述CU的维度。
52.根据权利要求2所述的方法,其中,所述预定单元包括CU、TU或PU之一,并且一个CU、TU或PU包括多个颜色分量,其中,所述多个颜色分量包括单树中的三个颜色分量和双树色度编解码中的两个颜色分量。
53.根据权利要求52所述的方法,其中,每颜色分量控制上下文编解码二进制位的最大数量。
54.根据权利要求52或53所述的方法,其中,为CU、TU或PU中的块分配计数器,以记录当前块中上下文编解码二进制位的数量。
55.根据权利要求54所述的方法,其中,在对所述块编码或解码之前,将所述计数器重置为0。
56.根据权利要求52所述的方法,其中,每CU、TU或PU控制上下文编解码二进制位的最大数量。
57.根据权利要求56所述的方法,其中,为CU、TU或PU中的块分配计数器,以记录当前CU、TU或PU中上下文编解码二进制位的数量。
58.根据权利要求57所述的方法,其中,在对所述CU、TU或PU编码或解码之前,将所述计数器重置为0。
59.根据权利要求52-58中任一项所述的方法,其中,根据某些规则来确定是否控制一个或多个颜色分量中的上下文编解码二进制位,其中,所述的某些规则包括双树或单树的分割结构以及/或者是否对颜色分量应用变换。
60.根据权利要求1-59中任一项所述的方法,其中,对于不同编解码方法,将每预定单元的上下文编解码二进制位的最大数量设置为相同值。
61.根据权利要求60所述的方法,其中,变换跳过(TS)或非TS编解码视频块遵循相同的规则来确定对剩余二进制位进行上下文编解码还是旁路编解码,其中,所述规则包括使用相同的控制上下文编解码二进制位的数量的阈值。
62.根据权利要求60所述的方法,其中,采用TB中的视频块的面积推导TB的上下文编解码二进制位的最大数量。
63.根据权利要求62所述的方法,其中,TB的上下文编解码二进制位的最大数量等于tb_width*tb_height*K,其中,tb_width和tb_height是系数归零之后TB的宽度和高度,并且K为阈值。
64.根据权利要求63所述的方法,其中,对所有种类的视频块应用阈值K,而不管其为TS模式还是非TS模式。
65.根据权利要求64所述的方法,其中,在对所述视频块编码或解码之前将计数器设置为tb_width*tb_height*K。
66.根据权利要求65所述的方法,其中,在对一个上下文编解码二进制位解码之后使计数器减1。
67.根据权利要求63-66中任一项所述的方法,其中,当在对语法元素或子块解码之后上下文编解码二进制位的数量小于第二阈值时,对所有剩余二进制位或全部进行旁路编解码。
68.根据权利要求67所述的方法,其中,所述第二阈值取决于对所述视频块应用的编解码方法,其中,所述编解码方法包括TS或非TS模式。
69.根据权利要求68所述的方法,其中,对于非TS编解码块,所述第二阈值为K0,对于TS编解码块,所述第二阈值为K1,其中,K0和K1为整数。
70.根据权利要求69所述的方法,其中,K0=4并且K1=8。
71.根据权利要求69所述的方法,其中,K0和/或K1取决于对所述视频块编码或解码的过程中的编解码趟、子块或CG中的至少一者。
72.根据权利要求68所述的方法,其中,所述语法元素是非TS编解码块中的abs_level_gt3_flag。
73.根据权利要求68所述的方法,其中,所述语法元素是非TS编解码块中的par_level_flag。
74.根据权利要求1-73中任一项所述的方法,其中,在VPS、SPS、DPS、PPS、APS、图片标头、条带标头或片组标头中的至少一者当中信令通知每预定单元的上下文编解码二进制位的最大数量。
75.一种用于视频处理的方法,包括:
针对视频的块和所述块的比特流表示之间的转换,将与所述块相关联的语法元素划分成不同群组;
对所述的语法元素的不同群组应用单独控制;以及
基于所述控制执行所述转换。
76.根据权利要求75所述的方法,其中,对所述不同群组应用不同控制策略。
77.根据权利要求76所述的方法,其中,所述语法元素包括用于残差编解码的上下文编解码语法元素,并且将所述上下文编解码语法元素分类成N个群组,其中,每一群组具有用以控制是否能够应用上下文编解码方法的阈值,N为整数。
78.根据权利要求77所述的方法,其中,对于所述N个群组中的一个群组,保持对应的计数器,以控制能够采用基于上下文的自适应二进制算术编解码(CABAC)方法进行编解码的上下文编解码二进制位的数量。
79.根据权利要求78所述的方法,其中,在上下文编解码二进制位的数量大于阈值时,不允许上下文编解码方法。
80.根据权利要求79所述的方法,其中,所述阈值取决于群组内的语法元素的初始上下文和/或概率。
81.根据权利要求79所述的方法,其中,在SPS、PPS、条带、图片和片组级中的至少一者当中信令通知所述阈值。
82.根据权利要求75-81中任一项所述的方法,其中,基于语法元素的初始上下文和/或概率将语法元素划分成不同群组。
83.根据权利要求75-81中任一项所述的方法,其中,基于在何处对语法元素编解码而将语法元素划分成不同群组,其中,在分割级、在CU或PU或TU级或者在残差编解码级内对所述语法元素编解码。
84.根据权利要求75-83中任一项所述的方法,其中,动态地改变所述分组。
85.根据权利要求84所述的方法,其中,在将语法元素的上下文更新为处于预定义上下文集合内时,将所述语法元素分配给某一群组。
86.根据权利要求84所述的方法,其中,基于每一语法元素的上下文和/或概率允许重新分组。
87.根据权利要求86所述的方法,其中,在从最近一次重新分组开始已经对一定数量的样点编解码之后,允许重新分组。
88.根据权利要求86所述的方法,其中,在从最近一次重新分组开始已经向比特流生成了给定数量的比特之后,允许重新分组。
89.根据权利要求86所述的方法,其中,在从最近一次重新分组开始已经处理了给定数量的CG之后,允许重新分组。
90.根据权利要求86所述的方法,其中,在群组中的概率差异超过某一阈值时,允许重新分组。
91.根据权利要求86所述的方法,其中,在上下文编解码二进制位的数量超过某一阈值时,允许重新分组。
92.根据权利要求86所述的方法,其中,在对上下文和/或概率重新初始化时允许重新分组。
93.一种用于视频处理的方法,包括:
针对视频的块和所述块的比特流表示之间的转换,将与所述块相关联的用于残差编解码的上下文划分成不同群组;
对所述的上下文的不同群组应用单独控制;以及
基于所述控制执行所述转换。
94.根据权利要求93所述的方法,其中,对所述不同群组应用不同控制策略。
95.根据权利要求93所述的方法,其中,将所述上下文分类成N个群组,其中,每一群组具有用以控制是否能够应用上下文编解码方法的阈值,N为整数。
96.根据权利要求95所述的方法,其中,对于所述N个群组中的一个群组,保持对应的计数器,以控制能够采用所述群组中的上下文进行编解码的上下文编解码二进制位的数量。
97.根据权利要求96所述的方法,其中,在上下文编解码二进制位的数量大于阈值时,不允许采用所述群组中的上下文的上下文编解码方法。
98.根据权利要求97所述的方法,其中,所述阈值取决于群组中的上下文的初始状态和/或概率。
99.根据权利要求97所述的方法,其中,在SPS、PPS、条带、图片和片组级中的至少一者当中信令通知所述阈值。
100.根据权利要求93-99中任一项所述的方法,其中,基于上下文的初始状态和/或概率将所述上下文划分成不同群组。
101.根据权利要求93-99中任一项所述的方法,其中,动态地改变所述分组。
102.根据权利要求101所述的方法,其中,在将上下文的状态更新为处于预定状态集内时,将所述上下文分配给某一群组。
103.根据权利要求101所述的方法,其中,基于每一上下文的状态和/或概率允许重新分组。
104.根据权利要求103所述的方法,其中,在从最近一次重新分组开始已经对一定数量的样点编解码之后,允许重新分组。
105.根据权利要求103所述的方法,其中,在从最近一次重新分组开始已经向比特流生成了给定数量的比特之后,允许重新分组。
106.根据权利要求103所述的方法,其中,在从最近一次重新分组开始已经处理了给定数量的CG之后,允许重新分组。
107.根据权利要求103所述的方法,其中,在群组中的概率差异超过某一阈值时,允许重新分组。
108.根据权利要求103所述的方法,其中,在上下文编解码二进制位的数量超过某一阈值时,允许重新分组。
109.根据权利要求103所述的方法,其中,在对上下文和/或概率重新初始化时允许重新分组。
110.一种用于视频处理的方法,包括:
针对视频和所述视频的比特流表示之间的转换,通过使用一个或多个计数器对与所述视频相关联的每预定单元上下文编解码二进制位的数量应用控制,其中,按照预定义方式重置所述计数器;以及
基于所述计数器执行所述转换。
111.根据权利要求110所述的方法,其中,所述预定单元包括具有块尺寸为宽度W和高度H的块,并且所述计数器具有阈值K*W*H,其中,K为变量。
112.根据权利要求110或111所述的方法,其中,在从最近一次计数器重置开始已经对给定数量的样点编解码之后,重置计数器。
113.根据权利要求110或111所述的方法,其中,在从最近一次计数器重置开始已经向比特流生成了给定数量的比特之后,重置计数器。
114.根据权利要求110或111所述的方法,其中,在从最近一次计数器重置开始已经处理了给定数量的CG之后,重置计数器。
115.根据权利要求110或111所述的方法,其中,在每一CTU行处重置计数器。
116.根据权利要求110或111所述的方法,其中,在每一片组处重置计数器。
117.根据权利要求110或111所述的方法,其中,在每一片处重置计数器。
118.根据权利要求110或111所述的方法,其中,在每一CTU处重置计数器。
119.根据权利要求110或111所述的方法,其中,在接收到某一标志时重置计数器。
120.根据权利要求119所述的方法,其中,周期性地发送所述标志,以指示是否应当重置计数器。
121.根据权利要求119所述的方法,其中,在PPS、SPS、图片、片组、条带、CTU行、CTU、CU、块或视频砖块级中的至少一者上信令通知所述标志。
122.根据权利要求1-121中任一项所述的方法,其中,所述转换从所述比特流表示生成所述视频。
123.根据权利要求1-121中任一项所述的方法,其中,所述转换从所述视频生成所述比特流表示。
124.一种处于视频***中的装置,包括处理器以及具有位于其上的指令的非暂态存储器,其中,所述指令在被所述处理器执行时使得所述处理器实施根据权利要求1-123中任一项所述的方法。
125.一种存储在非暂态计算机可读介质上的计算机程序产品,所述计算机程序产品包括用于实施根据权利要求1-123中任一项所述的方法的程序代码。
CN202080044963.5A 2019-06-21 2020-06-22 关于上下文编解码二进制位的数量的限制 Active CN113994679B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
CN2019092365 2019-06-21
CNPCT/CN2019/092365 2019-06-21
CNPCT/CN2019/095329 2019-07-09
CN2019095329 2019-07-09
PCT/CN2020/097478 WO2020253874A1 (en) 2019-06-21 2020-06-22 Restriction on number of context coded bins

Publications (2)

Publication Number Publication Date
CN113994679A true CN113994679A (zh) 2022-01-28
CN113994679B CN113994679B (zh) 2024-07-12

Family

ID=74040656

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080044963.5A Active CN113994679B (zh) 2019-06-21 2020-06-22 关于上下文编解码二进制位的数量的限制

Country Status (3)

Country Link
US (1) US20220109845A1 (zh)
CN (1) CN113994679B (zh)
WO (1) WO2020253874A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023191261A1 (ko) * 2022-03-30 2023-10-05 엘지전자 주식회사 영상 코딩 시스템에서 레지듀얼 정보를 코딩하는 방법 및 장치

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120082218A1 (en) * 2010-10-01 2012-04-05 Kiran Misra Methods and Systems for Entropy Coder Initialization
WO2015194185A1 (en) * 2014-06-20 2015-12-23 Sharp Kabushiki Kaisha Efficient palette coding for screen content codings
EP3270591A2 (en) * 2012-01-19 2018-01-17 Huawei Technologies Co., Ltd. Modified coding for a transform skipped block for cabac in hevc
CN107710759A (zh) * 2015-06-23 2018-02-16 联发科技(新加坡)私人有限公司 用于非正方形块的转换系数编解码的方法及装置
US20190110080A1 (en) * 2017-10-10 2019-04-11 Qualcomm Incorporated Binary arithmetic coding with progressive modification of adaptation parameters

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2777259A2 (en) * 2011-11-08 2014-09-17 Motorola Mobility LLC Devices and methods for sample adaptive offset coding and/or signaling
US9497488B2 (en) * 2014-01-10 2016-11-15 Sony Corporation Conditional golomb based adaptive entropy coding
WO2016127889A1 (en) * 2015-02-13 2016-08-18 Mediatek Inc. Method and apparatus for palette index coding in video and image compression
US11233998B2 (en) * 2015-05-29 2022-01-25 Qualcomm Incorporated Coding data using an enhanced context-adaptive binary arithmetic coding (CABAC) design
US10869062B2 (en) * 2017-12-21 2020-12-15 Qualcomm Incorporated Probability initialization and signaling for adaptive arithmetic coding in video coding
US11336918B2 (en) * 2018-09-05 2022-05-17 Qualcomm Incorporated Regular coded bin reduction for coefficient coding

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120082218A1 (en) * 2010-10-01 2012-04-05 Kiran Misra Methods and Systems for Entropy Coder Initialization
EP3270591A2 (en) * 2012-01-19 2018-01-17 Huawei Technologies Co., Ltd. Modified coding for a transform skipped block for cabac in hevc
WO2015194185A1 (en) * 2014-06-20 2015-12-23 Sharp Kabushiki Kaisha Efficient palette coding for screen content codings
CN107710759A (zh) * 2015-06-23 2018-02-16 联发科技(新加坡)私人有限公司 用于非正方形块的转换系数编解码的方法及装置
US20190110080A1 (en) * 2017-10-10 2019-04-11 Qualcomm Incorporated Binary arithmetic coding with progressive modification of adaptation parameters

Also Published As

Publication number Publication date
US20220109845A1 (en) 2022-04-07
CN113994679B (zh) 2024-07-12
WO2020253874A1 (en) 2020-12-24

Similar Documents

Publication Publication Date Title
CN113812162B (zh) 视频中的简化二次变换的上下文建模
CN114208190B (zh) 视频编解码中缩减二次变换的矩阵的选择
CN113950828B (zh) 视频比特流中的简化二次变换的有条件信令
CN113853785B (zh) 用于残差编解码的上下文建模
CN113785576B (zh) 编解码视频中的二次变换的使用
CN114223208A (zh) 为视频中的缩减二次变换的边信息的上下文建模
CN113841410B (zh) 多种帧内预测方法的编解码
CN113994679B (zh) 关于上下文编解码二进制位的数量的限制
CN113728631B (zh) 帧内子块分割和多变换选择

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant