CN113785306A - 基于编解码树结构类型的编解码模式 - Google Patents

基于编解码树结构类型的编解码模式 Download PDF

Info

Publication number
CN113785306A
CN113785306A CN202080032961.4A CN202080032961A CN113785306A CN 113785306 A CN113785306 A CN 113785306A CN 202080032961 A CN202080032961 A CN 202080032961A CN 113785306 A CN113785306 A CN 113785306A
Authority
CN
China
Prior art keywords
block
current video
video block
tree structure
mode
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202080032961.4A
Other languages
English (en)
Other versions
CN113785306B (zh
Inventor
朱维佳
张莉
许继征
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ByteDance Inc
Original Assignee
ByteDance Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ByteDance Inc filed Critical ByteDance Inc
Priority to CN202311562576.2A priority Critical patent/CN117615130A/zh
Publication of CN113785306A publication Critical patent/CN113785306A/zh
Application granted granted Critical
Publication of CN113785306B publication Critical patent/CN113785306B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

描述了用于变换跳跃模式下的系数编解码的设备、***和方法。一种用于可视媒体处理的示例性方法包括为了将可视媒体数据的视频区域中的当前视频块编码为可视媒体数据的比特流表示,做出关于至少基于与当前视频块相关联的编解码树结构或至少从与当前视频块相关联的编解码树结构推断的帧内块复制(IBC)模式的应用的决定;以及在比特流表示中选择性地包括指示至少基于编解码树结构或至少从编解码树结构推断的IBC模式的应用的语法元素。

Description

基于编解码树结构类型的编解码模式
相关申请的交叉引用
根据适用的专利法和/或依据巴黎公约的规则,本申请旨在及时要求2019年5月2日提交的国际专利申请No.PCT/CN2019/085405和2019年5月7日提交的国际专利申请No.PCT/CN2019/085860的优先权和利益。出于根据法律的所有目的,前述申请的全部公开通过引用而并入本文作为本申请的公开的一部分。
技术领域
本文档涉及视频和图像编码/解码技术。
背景技术
数字视频占互联网和其他数字通信网络上最大的带宽使用。随着能够接收和显示视频的连接用户设备的数量增加,预计对数字视频使用的带宽需求将继续增长。
发明内容
描述了与数字视频编码/解码有关的设备、***和方法,并且具体地,描述了用于视频编码/解码的变换跳过模式下的系数编解码。所描述的方法可以被应用于现有的视频编解码标准(例如,高效视频编解码(HEVC))和未来的视频编解码标准(例如,通用视频编解码(VVC))或编解码器。
在一个示例性方面,公开了一种用于可视媒体编码的方法。该方法包括:为了将可视媒体数据的视频区域中的当前视频块编码为可视媒体数据的比特流表示,做出关于至少基于与当前视频块相关联的编解码树结构或至少从与当前视频块相关联的编解码树结构推断的帧内块复制(IBC)模式的应用的决定;以及在比特流表示中选择性地包括指示至少基于编解码树结构或至少从编解码树结构推断的IBC模式的应用的语法元素。
在另一个示例性方面,公开了一种用于可视媒体解码的方法。该方法包括从包括包含当前视频块的视频区域的可视媒体数据的比特流表示确定与当前视频块相关联的编解码树结构;基于编解码树结构来确定语法元素是否被包括在比特流表示中,其中语法元素指示帧内块复制(IBC)模式;以及从比特流表示生成当前视频块。
在又一个示例性方面,公开了一种用于可视媒体编码的方法。该方法包括:为了将可视媒体数据的视频区域中的当前视频块编码为可视媒体数据的比特流表示,做出关于至少基于确定帧内块复制(IBC)模式被应用或至少从确定帧内块复制(IBC)模式被应用而推断的编解码树结构对当前视频块的应用的决定;并且在比特流表示中选择性地包括指示将编解码树结构应用于当前视频块的语法元素。
在又一个示例性方面,公开了一种用于可视媒体解码的方法。该方法包括从包括包含当前视频块的视频区域的可视媒体数据的比特流表示解析语法元素,其中语法元素指示至少基于确定帧内块复制(IBC)模式被应用或至少从确定帧内块复制(IBC)模式被应用而推断的编解码树结构对当前视频块的应用;以及通过根据语法元素解码当前视频块,从比特流表示生成解码的视频区域。
在又一个示例性方面,公开了一种用于可视媒体编码的方法。该方法包括为了将可视媒体数据的视频区域中的当前视频块编码为可视媒体数据的比特流表示,做出关于至少基于与当前视频块相关联的编解码树结构或至少从与当前视频块相关联的编解码树结构推断的调色板模式的应用的决定,其中在调色板模式下,当前视频块中包括的样点使用调色板中包括的代表性色彩值集合来表达;以及在比特流表示中选择性地包括指示调色板模式的应用的语法元素。
在又一个示例性方面,公开了一种用于可视媒体解码的方法。该方法包括从包括包含当前视频块的视频区域的可视媒体数据的比特流表示解析语法元素,其中语法元素指示至少基于与当前视频块相关联的编解码树结构或至少从与当前视频块相关联的编解码树结构推断的调色板模式,其中在调色板模式下,当前视频块中包括的样点使用调色板中包括的代表性色彩值集合来表达;以及通过根据语法元素解码当前视频块,从比特流表示生成解码的视频区域。
在又一个示例性方面,公开了一种用于可视媒体编码的方法。该方法包括为了将可视媒体数据的视频区域中的当前视频块编码为可视媒体数据的比特流表示,做出关于至少基于确定调色板模式被应用或至少从确定调色板模式被应用而推断的编解码树结构对当前视频块的应用的决定,其中在调色板模式下,当前视频块中包括的样点使用调色板中包括的代表性色彩值集合来表达;并且在比特流表示中选择性地包括指示将编解码树结构应用于当前视频块的语法元素。
在又一个示例性方面,公开了一种用于可视媒体解码的方法。该方法包括从包括包含当前视频块的视频区域的可视媒体数据的比特流表示解析语法元素,其中语法元素指示至少基于确定调色板模式被应用或至少从确定调色板模式被应用而推断的编解码树结构对当前视频块的应用,其中在调色板模式下,当前视频块中包括的样点使用调色板中包括的代表性色彩值集合来表达;以及通过根据语法元素解码当前视频块,从比特流表示生成解码的视频区域。
在又一个示例方面,上述方法可以由包括处理器的视频编码器装置实施。
在又一个示例方面,上述方法可以由包括处理器的视频解码器装置实施。
在又一个示例方面,这些方法可以以处理器可执行指令的形式体现,并被存储在计算机可读程序介质上。
这些和其他方面在本文档中进一步描述。
附图说明
图1示出了帧内块复制的示例。
图2示出了以调色板模式编解码的块的示例。
图3示出了使用调色板预测值来信令通知调色板条目的示例。
图4示出了水平和垂直遍历扫描的示例。
图5示出了调色板索引的编解码的示例。
图6示出了多类型树划分模式的示例。
图7示出了用于在跨分量线性模型(CCLM)预测模式下推导参数的样点的示例。
图8示出了利用色度缩放的亮度映射的示例性架构。
图9A-图9E是视频处理方法的示例的流程图。
图10是用于实施本文档中描述的可视媒体解码或可视媒体编码技术的硬件平台的示例的框图。
图11是所公开的技术可以被实施的示例视频处理***的框图。
图12是可视媒体编码方法的示例的流程图。
图13是可视媒体解码方法的示例的流程图。
图14是可视媒体编码方法的示例的流程图。
图15是可视媒体解码方法的示例的流程图。
图16是可视媒体编码方法的示例的流程图。
图17是可视媒体解码方法的示例的流程图。
图18是可视媒体编码方法的示例的流程图。
图19是可视媒体解码方法的示例的流程图。
具体实施方式
本文档提供了图像或视频比特流的解码器可以用于提高解压缩或解码的数字视频或图像的质量的各种技术。为简洁起见,术语“视频”在本文用于包括图像序列(传统上称为视频)和单独图像。此外,视频编码器也可以在编码过程期间实施这些技术,以便重构用于进一步编码的解码帧。
为了便于理解,在本文档中使用了章节标题,并且不将实施例和技术限制于对应章节。这样,来自一个章节的实施例可以与来自其他章节的实施例组合。
1.摘要
本文档涉及视频编解码技术。具体地,它涉及视频编解码中的变换跳过模式下的系数编解码。它可以应用于现有的视频编解码标准,如HEVC,或即将要定案的标准(多功能视频编解码)。它也可以应用于未来的视频编解码标准或视频编解码器。
2.初步讨论
视频编解码标准主要是通过熟知的ITU-T和ISO/IEC标准的发展而演变的。ITU-T制定了H.261和H.263,ISO/IEC制定了MPEG-1和MPEG-4可视化,并且这两个组织联合制定了H.262/MPEG-2视频和H.264/MPEG-4高级视频编解码(Advanced Video Coding,AVC)和H.265/HEVC标准[1,2]。自H.262以来,视频编解码标准基于混合视频编解码结构,其中利用了时域预测加变换编解码。为了探索HEVC以外的未来视频编解码技术,VCEG和MPEG于2015年联合成立了联合视频探索组(Joint Video Exploration Team,JVET)。此后,JVET采用了许多新方法,并将其放入名为联合探索模型(Joint Exploration Model,JEM)的参考软件中。2018年4月,VCEG(Q6/16)和ISO/IEC JTC1 SC29/WG11(MPEG)之间的联合视频专家组(JVET)成立,以致力于VVC(Versatile Video Coding,多功能视频编解码)标准,目标是与HEVC相比比特率降低50%。
VVC草案的最新版本,即通用视频编解码(草案4)可以在以下处找到:
http://phenix.it-udparis.eu/jvet/doc_end_user/current_document.php?id=5755
VVC的最新参考软件(名为VTM)可以在以下处找到:
https://vcgit.hhi.fraunhofer.de/jvet/VVCSoftware_VTM/tags/VTM-4.0
2.1帧内块复制
HEVC屏幕内容编解码扩展(HEVC-SCC)和当前VVC测试模型(VTM-4.0)采用了帧内块复制(IBC),也称为当前图片参考。IBC将运动补偿的概念从帧间编解码扩展到帧内编解码。如图1所示范的,当应用IBC时,当前块由相同图片中的参考块预测。在当前块被编解码或解码之前,参考块中的样点必须已经被重构。尽管IBC对大多数相机捕捉的序列并不那么有效,但它示出对屏幕内容的显著编解码增益。原因是屏幕内容图片中有很多重复的图案,诸如图标和文本字符。IBC可以有效地移除这些重复图案之间的冗余。在HEVC-SCC中,如果帧间编解码单元(CU)选择当前图片作为其参考图片,则它可以应用IBC。在这种情况下,MV被重命名为块矢量(BV),并且BV总是具有整数像素精度。为了与主简档HEVC兼容,当前图片在解码图片缓冲区(DPB)中被标记为“长期”参考图片。应当注意,类似地,在多视图/3D视频编解码标准中,帧间视图参考图片也被标记为“长期”参考图片。
在BV找到其参考块之后,可以通过复制参考块来生成预测。残差可以通过从原始信号中减去参考像素得到。然后,可以像在其他编解码模式下一样应用变换和量化。
然而,当参考块在图片之外,或与当前块重叠,或在重构区域之外,或在受一些约束限制的有效区域之外时,部分或全部像素值没有被定义。基本上,有两种解决方案来处理这样的问题。一种是不允许这样的情况,例如在比特流一致性中。另一种是对那些未定义的像素值应用填充。以下子章节详细描述了解决方案。
2.2HEVC屏幕内容编解码扩展中的IBC
在HEVC的屏幕内容编解码扩展中,当块使用当前图片作为参考时,它应该保证整个参考块在可用的重构区域内,如以下规范文本所指示的:
变量offsetX和offsetY被推导如下:
offsetX=(ChromaArrayType==0)?0:(mvCLX[0]&0x7?2:0) (8-106)
offsetY=(ChromaArrayType==0)?0:(mvCLX[1]&0x7?2:0) (8-107)
比特流一致性的要求是,当参考图片是当前图片时,亮度运动矢量mvLX应当遵守以下约束:
-当调用第6.4.1条中指定的z扫描顺序块可用性的推导过程时,其中以设置为等于(xCb,yCb)的(xCurr,yCurr)和设置为等于(xPb+(mvLX[0]>>2)-offsetX,yPb+(mvLX[1]>>2)-offsetY)的邻近亮度位置(xNbY,yNbY)作为输入,输出应当等于TRUE(真)。
-当调用第6.4.1条中指定的z扫描顺序块可用性的推导过程时,其中以设置为等于(xCb,yCb)的(xCurr,yCurr)和设置为等于(xPb+(mvLX[0]>>2)+nPbW-1+offsetX,yPb+(mvLX[1]>>2)+nPbH-1+offsetY)的邻近亮度位置(xNbY,yNbY)作为输入,输出应当等于TRUE。
-一个或两个以下条件应当为真:
-(mvLX[0]>>2)+nPbW+xB1+offsetX的值小于或等于0。
-(mvLX[1]>>2)+nPbH+yB1+offsetY的值小于或等于0。
-以下条件应当为真:
(xPb+(mvLX[0]>>2)+nPbSw-1+offsetX)/CtbSizeY-xCurr/CtbSizeY<=yCurr/CtbSizeY-(yPb+(mvLX[1]>>2)+nPbSh-1+offsetY)/CtbSizeY (8-108)
因此,参考块与当前块重叠或者参考块在图片之外的情况将不会发生。不需要填充参考或预测块。
2.3 VVC测试模型中的IBC
在当前VVC测试模型(即,VTM-4.0设计)中,整个参考块应该与当前编解码树单元(CTU)一起,并且不与当前块重叠。因此,不需要填充参考或预测块。IBC标志被编解码为当前CU的预测模式。因此,对于每个CU,总共有三种预测模式,MODE_INTRA、MODE_INTER和MODE_IBC。
2.3.1 IBC Merge模式
在IBC Merge模式中,从比特流中解析指向IBC Merge候选列表中的条目的索引。IBC Merge列表的构建可以根据以下步骤顺序进行总结:
·步骤1:推导空域候选
·步骤2:***HMVP候选
·步骤3:***成对平均候选
在空域Merge候选的推导中,在位于位置A1、B1、B0、A0和B2的候选当中最多选择四个Merge候选。推导的顺序为A1、B1、B0、A0和B2。仅当位置A1、B1、B0、A0的任何PU不可用(例如,因为它属于另一个条带或片)或未以IBC模式编解码时,才考虑位置B2。在位置A1处的候选被添加之后,剩余候选的***经受冗余检查,该冗余检查确保具有相同运动信息的候选从列表中排除,以便提高编解码效率。
在***空域候选之后,如果IBC Merge列表尺寸仍然小于最大IBC Merge列表尺寸,则可以***来自HMVP表的IBC候选。在***HMVP候选时执行冗余检查。
最终,成对平均候选被***到IBC Merge列表中。
当由Merge候选标识的参考块在图片之外,或者与当前块重叠,或者在重构区域之外,或者在受一些约束限制的有效区域之外时,该Merge候选被称为无效Merge候选。
注意,无效Merge候选可以被***到IBC Merge列表中。
2.3.2 IBC AMVP模式
在IBC AMVP模式下,从比特流中解析指向IBC AMVP列表中的条目的AMVP索引。IBCAMVP列表的构建可以根据以下步骤顺序进行总结:
·步骤1:推导空域候选
ο检查A0、A1,直到找到可用候选。
ο检查B0、B1、B2,直到找到可用候选。
·步骤2:***HMVP候选
·步骤3:***零候选
在***空域候选之后,如果IBC AMVP列表尺寸仍然小于最大IBC AMVP列表尺寸,则可以***HMVP表中的IBC候选。
最后,零候选被***到IBC AMVP列表中。
2.4自适应运动矢量分辨率(AMVR)
在HEVC中,当条带头中的use_integer_mv_flag等于0时,(CU的运动矢量和预测运动矢量之间的)运动矢量差以四分之一亮度样点为单元进行信令通知。在VVC中,引入了CU级别自适应运动矢量分辨率(AMVR)方案。AMVR允许以不同的精度对CU的MVD进行编解码。根据当前CU的模式(正常AMVP模式或仿射AVMP模式),可以如下自适应地选择当前CU的MVD:
-正常AMVP模式:四分之一亮度样点、整数亮度样点或四亮度样点。
-仿射AMVP模式:四分之一亮度样点、整数亮度样点或1/16亮度样点。
如果当前CU具有至少一个非零MVD分量,则有条件地信令通知CU级别MVD分辨率指示。如果所有MVD分量(即,参考列表L0和参考列表L1的水平和垂直MVD)都为零,则推断四分之一亮度样点MVD分辨率。
对于具有至少一个非零MVD分量的CU,第一标志被信令通知以指示四分之一亮度样点MVD精度是否用于CU。如果第一标志为0,则不需要进一步信令通知,并且四分之一亮度样点MVD精度用于当前CU。否则,第二标志被信令通知,以指示整数亮度样点还是四亮度样点MVD精度用于正常AMVP CU。相同的第二标志用于指示整数亮度样点还是1/16亮度样点MVD精度用于仿射AMVP CU。为了确保重构MV具有预期的精度(四分之一亮度样点、整数亮度样点或四亮度样点),在与MVD加在一起之前,CU的运动矢量预测值将被取整到与MVD相同的精度。运动矢量预测值向零取整(即,负运动矢量预测值向正无穷大取整,并且正运动矢量预测值向负无穷大取整)。
编码器使用RD检查确定当前CU的运动矢量分辨率。为了避免总是对每个MVD分辨率执行三次CU级别RD检查,在VTM4中,除了四分之一亮度样点之外,MVD精度的RD检查仅有条件地调用。对于正常AVMP模式,首先计算四分之一亮度样点MVD精度和整数亮度样点MV精度的RD成本。然后,将整数亮度样点MVD精度的RD成本与四分之一亮度样点MVD精度的RD成本进行比较,以决定是否有必要进一步检查四亮度样点MVD精度的RD成本。当四分之一亮度样点MVD精度的RD成本远小于整数亮度样点MVD精度的RD成本时,跳过四亮度样点MVD精度的RD检查。对于仿射AMVP模式,如果在检查仿射Merge/跳过模式、Merge/跳过模式、四分之一亮度样点MVD精度正常AMVP模式和四分之一亮度样点MVD精度仿射AMVP模式的率失真成本之后没有选择仿射帧间模式,则不检查1/16亮度样点MV精度和1像素MV精度仿射帧间模式。此外,在1/16亮度样点和四分之一亮度样点MV精确仿射帧间模式下,在四分之一亮度样点MV精确仿射帧间模式下获得的仿射参数用作开始搜索点。
2.5调色板模式
调色板模式背后的基本思想是CU中的样点由代表性色彩值的小集合表示。该集合被称为调色板。也可以通过信令通知逸出符号(escape symbol)(其后是(可能是量化的)分量值)来指示调色板之外的样点。这在图2中示出。
2.6 HEVC屏幕内容编解码扩展(HEVC-SCC)中的调色板模式
在HEVC-SCC中的调色板模式下,使用预测方式对调色板和索引图进行编解码。
2.6.1调色板条目的编解码
对于调色板条目的编解码,保持调色板预测值。调色板的最大尺寸以及调色板预测值在SPS中被信令通知。在HEVC-SCC中,在PPS中引入了palette_predictor_initializer_present_flag。当该标志为1时,用于初始化调色板预测值的条目在比特流中信令通知。调色板预测值在每个CTU行、每个条带和每个片的开头初始化。根据palette_predictor_initializer_present_flag的值,调色板预测值被重置为0或使用PPS中信令通知的调色板预测值初始化器条目进行初始化。在HEVC-SCC中,启用了尺寸为0的调色板预测值初始化器,以允许在PPS级别显式禁用调色板预测值初始化。
对于调色板预测值中的每个条目,信令通知重用标志,以指示它是否是当前调色板的一部分。这在图3中示出。使用零的游程长度编解码来传送重用标志。此后,新调色板条目的数量使用0阶的指数Golomb码来信令通知。最终,新调色板条目的分量值被信令通知。
2.6.2调色板索引的编解码
如图4所示,使用水平和垂直遍历扫描对调色板索引进行编解码。使用palette_transpose_flag在比特流中显式信令通知扫描顺序。对于该子章节的其余部分,假设扫描为水平。
调色板索引使用两种主要的调色板样点模式进行编解码:“INDEX”和“COPY_ABOVE”。如前所解释的,逸出符号也作为“INDEX”模式被信令通知,并被分配等于最大调色板尺寸的索引。除了顶行或先前模式为“COPY_ABOVE”时,该模式使用标志来信令通知。在“COPY_ABOVE”模式下,复制上面行中的样点的调色板索引。在“INDEX”模式下,调色板索引是显式信令通知的。对于“INDEX”和“COPY_ABOVE”模式两者,指定也使用相同模式进行编解码的后续样点的数量的游程值被信令通知。当逸出符号是“INDEX”或“COPY_ABOVE”模式下的游程的一部分时,针对每个逸出符号信令通知逸出分量值。调色板索引的编解码在图5中示出。
该语法顺序按如下方式完成。首先,信令通知CU的索引值的数量。随后是使用截断二进制编解码的整个CU的实际索引值的信令通知。索引数量以及索引值都在旁路模式下进行编解码。这将索引相关的旁路二进制位分组在一起。然后调色板样点模式(如有必要)和游程以交错方式信令通知。最终,对应于整个CU的逸出样点的分量逸出值被分组在一起,并在旁路模式下进行编解码。
附加语法元素,last_run_type_flag,在信令通知索引值之后被信令通知。该语法元素与索引的数量相结合,消除了信令通知与块中的最后游程相对应的游程值的需要。
在HEVC-SCC中,也针对4:2:2、4:2:0和单色色度格式启用调色板模式。对于所有色度格式,调色板条目和调色板索引的信令通知几乎是相同的。在非单色格式的情况下,每个调色板条目由3个分量组成。对于单色格式,每个调色板条目由单个分量组成。对于子采样色度方向,色度样点与可被2整除的亮度样点索引相关联。在为CU重构调色板索引后,如果样点只有与其相关联的单个分量,则只使用调色板条目的第一分量。信令通知的唯一差别是逸出分量值。对于每个逸出样点,根据与该样点相关联的分量的数量,信令通知的逸出分量值的数量可能不同。
2.7变换跳过模式下的系数编解码
在JVET-M0464和JVET-N0280中,为了使残差编解码适应变换跳过级别的统计和信号特征,对变换跳过(TS)模式下的系数编解码提出了几个修改。
提议的修改列出如下。
没有最后的显著扫描位置:由于残差信号反映了预测之后的空域残差,并且没有对TS执行通过变换的能量集中,所以不再给出在变换块的右下角的尾随零或不显著级别的更高概率。因此,在这种情况下,省略了最后显著扫描位置信令。
子块CBF:最后显著扫描位置信令的缺失要求TS的具有coded_sub_block_flag的子块CBF信令被修改如下:
ο由于量化,前述无意义序列可能仍然局部地出现在变换块内。因此,如上所述移除最后显著扫描位置,并为所有子块编解码coded_sub_block_flag。
ο覆盖DC频率位置的子块(左顶部子块)的coded_sub_block_flag呈现了特殊情况。在VVC草案3中,该子块的coded_sub_block_flag从不被信令通知并且总是被推断为等于1。当最后显著扫描位置位于另一个子块中时,这意味着在DC子块之外有至少一个显著级别。因此,DC子块可以只包含零/非显著级别,尽管该子块的coded_sub_block_flag被推断为等于1。在TS中缺失最后扫描位置信息的情况下,每个子块的coded_sub_block_flag被信令通知。这还包括DC子块的coded_sub_block_flag,除了当所有其他coded_sub_block_flag语法元素已经等于0时。在这种情况下,DCcoded_sub_block_flag被推断为等于1(inferDcSbCbf=1)。因为在该DC子块中必须有至少一个显著级别,所以如果该DC子块中的所有其他sig_coeff_flag语法元素都等于0,则反而(0,0)处的第一位置的sig_coeff_flag语法元素不被信令通知并被推导为等于1(injectsbdcsigcoefflag=1)。
οcoded_sub_block_flag的上下文建模被改变。上下文模型索引被计算为当前子块的左边的coded_sub_block_flag和上方的coded_sub_block_flag之和,而不是两者的逻辑析取(disjunction)。
sig_coeff_flag上下文建模:修改sig_coeff_flag上下文建模中的局部模板,以仅包括当前扫描位置左边的邻居(NB0)和上方的邻居(NB1)。上下文模型偏移只是重要邻近位置sig_coeff_flag[NB0]+sig_coeff_flag[NB1]的数量。因此,根据当前变换块内的对角线d的不同上下文集的选择被移除。这产生了三个上下文模型和用于编解码sig_coeff_flag标志的单个上下文模型集。
abs_level_gt1_flag和par_level_flag上下文建模:对abs_level_gt1_flag和par_level_flag采用单个上下文模型。
abs_remainder编解码:尽管变换跳过残差绝对级别的经验分布通常仍然符合拉普拉斯或几何分布,但是存在比变换系数绝对级别更大的不稳定性。具体地,对于残差绝对级别,连续实现窗口内的方差更高。这激发了对abs_remainder语法二值化和上下文建模的以下修改:
ο在二值化中使用更高的截止值(即,从利用sig_coeff_flag、abs_level_gt1_flag、par_level_flag和abs_level_gt3_flag的编解码到abs_remainder的Rice码的转变点)、以及每个二进制位位置的专用上下文模型产生更高的压缩效率。增加截止值将导致更多的“大于X”标志,例如引入abs_level_gt5_flag、abs_level_gt7_flag等,直到达到截止值。截止值本身固定为5(numGtFlags=5)。
ο修改Rice参数推导的模板,即仅当前扫描位置的左边的邻居和上方的邻居被认为类似于sig_coeff_flag上下文建模的局部模板。
coeff_sign_flag上下文建模:由于记号序列内的不稳定性以及预测残差常常偏置的事实,即使当全局经验分布几乎均匀分布时,也可以使用上下文模型对记号进行编解码。单个专用上下文模型用于记号的编解码,并且符号在sig_coeff_flag之后被解析,以将所有上下文编解码二进制位保持在一起。
2.8量化残差块差分脉冲码调制(QR-BDPCM)
在JVET-M0413中,提出了量化残差块差分脉冲码调制(QR-BDPCM)来有效编解码屏幕内容。
QR-BDPCM中使用的预测方向可以是垂直和水平预测模式。通过在类似于帧内预测的预测方向(水平或垂直预测)上的样点复制,对整个块进行帧内预测。残差被量化,量化残差与其预测值(水平或垂直)量化值之间的增量(delta)被编解码。这可以通过以下进行描述:对于尺寸为M(行)×N(列)的块,假设ri,j,0≤i≤M-1,0≤j≤N-1是在使用来自上方或左边块边界样点的未滤波样点水平地(跨预测块逐线复制左边邻近像素值)或垂直地(在预测块中将顶部邻近线复制到每条线)执行帧内预测之后的预测残差。假设Q(ri,j),0≤i≤M-1,0≤j≤N-1表示残差ri,j的量化版本,其中残差是原始块和预测块值之间的差。然后将块DPCM应用于量化残差样点,得到具有元素
Figure BDA0003332975320000121
的修改后的M×N阵列
Figure BDA0003332975320000122
当信令通知垂直BDPCM时:
Figure BDA0003332975320000123
对于水平预测,应用类似的规则,通过以下获得残差量化样点
Figure BDA0003332975320000131
残差量化样点
Figure BDA0003332975320000132
被传送到解码器。
在解码器侧,使上面计算相反,以产生Q(ri,j),0≤i≤M-1,0≤j≤N-1。对于垂直预测情况,
Figure BDA0003332975320000133
对于水平情况,
Figure BDA0003332975320000134
逆量化残差Q-1(Q(ri,j))被添加到帧内块预测值,以产生重构样点值。
该方案的主要好处是,在系数解析期间可以动态地执行逆DPCM,只要在解析系数时添加预测值,或者其可以在解析之后被执行。
QR-BDPCM的草案文本改变如下所示。
7.3.6.5编解码单元语法
Figure BDA0003332975320000135
Figure BDA0003332975320000141
等于1的bdpcm_flag[x0][y0]指定bdpcm_dir_flag存在于包括位置(x0,y0)处的亮度编解码块的编解码单元中
等于0的bdpcm_dir_flag[x0][y0]指定要在bdpcm块中使用的预测方向为水平,否则为垂直。
2.9分割结构
2.9.1使用树结构分割CTU
在HEVC中,通过使用表示为编解码树的四元树结构来适应各种局部特征,CTU被划分为CU。使用帧间图片(时域)预测还是帧内图片(空域)预测来编解码图片区域的决定是在叶CU级别做出的。根据PU划分类型,每个叶CU可以被进一步划分为一个、两个或四个PU。在一个PU内,应用相同的预测过程,并且在PU的基础上将相关信息发送到解码器。在通过应用基于PU划分类型的预测过程获得残差块之后,可以根据与CU的编解码树类似的另一四元树结构将叶CU分割为变换单元(TU)。HEVC结构的一个重要特征是它具有多个分割概念,包括CU、PU和TU。
在VVC中,具有使用二元和三元划分段结构的嵌套多类型树的四叉树代替多个分割单元类型的概念,即,除了对于对最大变换长度来说尺寸太大的CU的需要之外,它移除了CU、PU和TU概念的分离,并且支持CU分割形状的更大灵活性。在编解码树结构中,CU可以具有正方形或矩形形状。编解码树单元(CTU)首先通过四元树(也称为四叉树)结构分割。然后,可以通过多类型树结构进一步分割四元树叶节点。如图6所示,多类型树结构中有四种划分类型,垂直二元划分(SPLIT_BT_VER)、水平二元划分(SPLIT_BT_HOR)、垂直三元划分(SPLIT_TT_VER)和水平三元划分(SPLIT_TT_HOR)。多类型树叶节点被称为编解码单元(CU),除非CU对于最大变换长度来说太大,否则该段用于预测和变换处理,而不需要任何进一步分割。这意味着,在大多数情况下,在具有嵌套的多类型树编解码块结构的四叉树中,CU、PU和TU具有相同的块尺寸。当最大支持的变换长度小于CU的色彩分量的宽度或高度时,出现异常。此外,亮度和色度分量在I片上具有单独的分割结构。
2.10跨分量线性模型预测
为了减少跨分量冗余,在VTM4中使用跨分量线性模型(CCLM)预测模式,为此,通过使用线性模型,基于相同CU的重构亮度样点来预测色度样点,如下:
predC(i,j)=α·recL′(i,j)+β
其中predC(i,j)表示CU中的预测色度样点,并且recL(i,j)表示相同CU的下采样的重构亮度样点。线性模型参数α和β是从两个样点的亮度值和色度值之间的关系推导的,这两个样点是下采样的邻近亮度样点集合内具有最小样点值和最大样点的亮度样点、以及它们的对应色度样点。线性模型参数α和β根据以下等式获得。
Figure BDA0003332975320000151
β=Yb-α·Xb
其中Ya和Xa表示具有最大亮度样点值的亮度样点的亮度值和色度值。Xb和Yb分别表示具有最小亮度样点的亮度样点的亮度值和色度值。图7示出了左边和上方样点以及CCLM模式下涉及的当前块的样点的位置的示例。
2.11亮度映射与色度缩放(LMCS)
在VTM4中,称为亮度映射与色度缩放(LMCS)的编解码工具被添加作为环路滤波器之前的新处理模块。LMCS具有两个主要部件:1)基于自适应分段线性模型的亮度分量的环路映射;2)对于色度分量,应用依赖于亮度的色度残差缩放。图8示出了从解码器的角度的LMCS架构。图8中的阴影块指示映射域中在哪里应用该处理;并且这些包括逆量化、逆变换、亮度帧内预测以及亮度预测与亮度残差加在一起。图8中的无阴影块指示原始(即,未映射)域中在哪里应用该处理;并且这些包括诸如去方块、ALF和SAO的环路滤波器、运动补偿预测、色度帧内预测、色度预测与色度残差加在一起以及解码图片作为参考图片的存储。图8中的浅黄色阴影块是新的LMCS功能块,包括亮度信号的正映射和逆映射以及依赖于亮度的色度缩放过程。像VVC中的大多数其他工具一样,可以使用SPS标志在序列级别启用/禁用LMCS。
3.实施例解决的问题的示例
尽管JVET-N0280中的系数编解码可以在屏幕内容编解码上实现编解码益处,但系数编解码和TS模式可能仍有一些缺点。
(1)TS模式的最大允许宽度或高度由PPS中的一个共同值控制,这可能限制灵活性。
(2)每个编解码组(CG)需要信令通知TS模式的cbf标志,这可能增加开销成本。
(3)系数扫描顺序不考虑帧内预测模式。
(4)符号标志编解码仅采用一个上下文。
(5)不支持色度分量上的变换跳过。
(6)变换跳过标志被应用于所有预测模式,这增加了开销成本和编码复杂性。
4.实施例的示例
下面的详细发明应该被认为是解释一般构思的示例。这些发明不应该被狭义地解释。此外,这些发明可以以任何方式组合。
1.变换跳过的最大允许宽度和高度的指示都可以在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组中被信令通知。
a.在一个示例中,变换跳过的最大允许宽度和高度可以由在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组中信令通知的不同消息指示。
b.在一个示例中,最大允许宽度和/或高度可以首先在SPS/PPS中被信令通知,然后在图片头/条带头/片组头/LCU行/LCU组中被更新。
2.TS编解码块可以被分为几个系数组(CG),并且至少一个CG的编解码块标志(Cbf)标志的信令通知可以被跳过。
a.在一个示例中,可以跳过所有CG的Cbf标志的信令通知,例如,对于TS编解码块。
b.在一个示例中,对于TS模式,CG的跳过的cbf标志可以被推断为1
c.在一个示例中,跳过CG的部分还是全部Cbf标志可以取决于编解码模式。
i.在一个示例中,对于TS编解码帧内块,跳过CG的所有Cbf标志的信令通知。
d.在一个示例中,CG的跳过的Cbf标志可以基于以下来推断
i.SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组/LCU/CU中信令通知的消息
ii.CG的位置
iii.当前块和/或其邻近块的块大小
iv.当前块和/或其邻近块的块形状
v.当前块和/或其邻近块的最可能模式
vi.当前块的邻近块的预测模式(帧内/帧间)
vii.当前块的邻近块的帧内预测模式
viii.当前块的邻近块的运动矢量
ix.当前块的邻近块的QR-BDPCM模式的指示
x.当前块的当前量化参数和/或其邻近块的当前量化参数
xi.色彩格式的指示(诸如4:2:0、4:4:4)
xii.单独/双编解码树结构
xiii.条带/片组类型和/或图片类型
3.TS编解码块中的系数扫描顺序可以取决于在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组/LCU/CU中信令通知的消息。
a.可替代地,当采用TS时,CG和/或系数扫描顺序可以取决于帧内预测模式
i.在一个示例中,如果帧内预测模式是水平主导的,则扫描顺序可以为垂直
1.在一个示例中,如果帧内预测模式索引的范围从2到34,则扫描顺序可以为垂直。
2.在一个示例中,如果帧内预测模式索引的范围从2到33,则扫描顺序可以为垂直。
ii.在一个示例中,如果帧内预测模式是垂直主导的,则扫描顺序可以为垂直
1.在一个示例中,如果帧内预测模式索引的范围从34-66,则扫描顺序可以为垂直。
2.在一个示例中,如果帧内预测模式索引的范围从35-66,则扫描顺序可以为垂直。
iii.在一个示例中,如果帧内预测模式是垂直主导的,则扫描顺序可以为水平
1.在一个示例中,如果帧内预测模式索引的范围从34到66,则扫描顺序可以为垂直。
2.在一个示例中,如果帧内预测模式索引的范围从35到66,则扫描顺序可以为垂直。
iv.在一个示例中,如果帧内预测模式是水平主导的,则扫描顺序可以为水平
1.在一个示例中,如果帧内预测模式索引的范围从2到34,则扫描顺序可以为垂直。
2.在一个示例中,如果帧内预测模式索引的范围从2到33,则扫描顺序可以为垂直。
4.提出了符号标志编解码的上下文可以取决于TS模式的系数块中的邻近信息。
a.在一个示例中,对当前符号标志进行编解码的上下文可以取决于TS模式的邻近符号标志的值。
i.在一个示例中,对当前符号标志进行编解码的上下文可以取决于左邻居(neighbor)和/或上邻居的符号标志的值。
1.在一个示例中,当前符号标志的上下文可以被推导为C=(L+A),其中C是上下文id,L是其左邻居的符号标志,并且A是其上邻居的符号标志
2.在一个示例中,当前符号标志的上下文可以被推导为C=(L+A*2),其中C是上下文id,L是其左邻居的符号标志,并且A是其上邻居的符号标志
3.在一个示例中,当前符号标志的上下文可以被推导为C=(L*2+A),其中C是上下文id,L是其左邻居的符号标志,并且A是其上邻居的符号标志
ii.在一个示例中,对当前符号标志进行编解码的上下文可以取决于左邻居、上邻居和左上邻居的符号标志的值。
iii.在一个示例中,对当前符号标志进行编解码的上下文可以取决于左邻居、上邻居、左上邻居、右上邻居的符号标志的值。
b.在一个示例中,对当前符号标志进行编解码的上下文可以取决于系数的位置。
i.在一个示例中,符号标志的上下文在不同位置可以不同。
ii.在一个示例中,符号标志的上下文可以取决于x+y,其中x和y是位置的水平和垂直位置。
iii.在一个示例中,符号标志的上下文可以取决于min(x,y),其中x和y是位置的水平和垂直位置。
iv.在一个示例中,符号标志的上下文可以取决于max(x,y),其中x和y是位置的水平和垂直位置。
5.提出了可以支持色度变换跳过模式。
a.在一个示例中,色度变换跳过模式的使用可以基于在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组/LCU/CU/视频数据单元中信令通知的消息。
b.可替代地,色度变换跳过模式的使用可以基于相同色彩分量或其他色彩分量中的一个或多个代表性先前编解码块的解码信息。
i.在一个示例中,如果代表性块的TS标志的指示为假,则色度TS标志的指示可以被推断为假。可替代地,如果代表性块的TS标志的指示为真,则色度TS标志的指示可以被推断为真。
ii.在一个示例中,代表性块可以是亮度块或色度块。
iii.在一个示例中,代表性块可以是并置亮度块内的任何块。
iv.在一个示例中,代表性块可以是当前色度块的邻近色度块中的一个。
v.在一个示例中,代表性块可以是覆盖当前色度块内的中心色度样点的对应亮度样点的块。
vi.在一个示例中,代表性块可以是覆盖当前色度块内的右底部色度样点的对应亮度样点的块。
6.是否和/或如何应用变换跳过模式可以取决于在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组/LCU/CU/视频数据单元中信令通知的消息。
a.在一个示例中,何时和/或如何应用变换跳过模式的指示可以取决于
i.当前块和/或其邻近块的块大小
ii.当前块和/或其邻近块的块形状
iii.当前块和/或其邻近块的最可能模式
iv.当前块的邻近块的预测模式(帧内/帧间)
v.当前块的邻近块的帧内预测模式
vi.当前块的邻近块的运动矢量
vii.当前块的邻近块的QR-BDPCM模式的指示
viii.当前块的当前量化参数和/或其邻近块的当前量化参数
ix.色彩格式的指示(诸如4:2:0、4:4:4)
x.单独/双编解码树结构
xi.条带/片组类型和/或图片类型
xii.时域层ID
b.在一个示例中,当预测模式是IBC模式并且块宽度和/或高度小于/大于/等于阈值时,可以应用变换跳过模式
i.在一个示例中,阈值可以为4、8、16或32。
ii.在一个示例中,可以在比特流中信令通知阈值。
iii.在一个示例中,阈值可以基于
1.在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组/LCU/CU中信令通知的消息
2.当前块和/或其邻近块的块大小
3.当前块和/或其邻近块的块形状
4.当前块和/或其邻近块的最可能模式
5.当前块的邻近块的预测模式(帧内/帧间)
6.当前块的邻近块的帧内预测模式
7.当前块的邻近块的运动矢量
8.当前块的邻近块的QR-BDPCM模式的指示
9.当前块的当前量化参数和/或其邻近块的当前量化参数
10.色彩格式的指示(诸如4:2:0、4:4:4)
11.单独/双编解码树结构
12.条带/片组类型和/或图片类型
13.时域层ID
7.是否信令通知TS模式的指示可以取决于解码/推导的帧内预测模式。
a.此外,可替代地,它可以取决于在QR-BDPCM编解码块中使用的允许帧内预测模式/方向以及QR-BDPCM的使用。
b.对于解码或推导的帧内预测模式,如果它是在QR-BDPCM编解码块中使用的允许的帧内预测模式/方向集合的一部分,则可以跳过TS标志的信令通知。
i.在一个示例中,如果允许QR-BDPCM用于对一个条带/图片/片/砖块(brick)进行编解码,则垂直和水平模式是QR-BDPCM过程中的两种允许模式,并且解码/推导的帧内模式是垂直或水平模式,则不信令通知TS模式的指示。
c.在一个示例中,当QR-BDPCM模式的指示(例如,bdpcm_flag)为1时,可以推断变换跳过模式被启用。
d.以上方法可以基于以下来应用
i.在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组/LCU/CU中信令通知的消息
ii.当前块和/或其邻近块的块大小
iii.当前块和/或其邻近块的块形状
iv.当前块和/或其邻近块的最可能模式
v.当前块的邻近块的预测模式(帧内/帧间)
vi.当前块的邻近块的帧内预测模式
vii.当前块的邻近块的运动矢量
viii.当前块的邻近块的QR-BDPCM模式的指示
ix.当前块的当前量化参数和/或其邻近块的当前量化参数
x.色彩格式的指示(诸如4:2:0、4:4:4)
xi.单独/双编解码树结构
xii.条带/片组类型和/或图片类型
xiii.时域层ID
8.是否和/或如何应用QR-BDPCM可以取决于TS模式的指示。
a.在一个示例中,是否应用QR-BDPCM的指示可以在变换单元(TU)级别上被信令通知,而不是在CU中被信令通知。
i.在一个示例中,是否应用QR-BDPCM的指示可以在将TS模式的指示应用于TU之后被信令通知。
b.在一个示例中,QR-BDPCM被视为TS模式的特殊情况。
i.当一个块以TS模式进行编解码时,可以进一步信令通知另一个标志,以指示应用QR-BDPCM还是传统TS模式。如果它用QR-BDPCM进行编解码,则可以进一步信令通知在QR-BDPCM中使用的预测方向。
ii.可选地,当一个块以TS模式进行编解码时,可以进一步信令通知另一个标志,以指示应用哪种QR-BDPCM(例如,基于水平/垂直预测方向的QR-BDPCM)或传统TS模式。
c.在一个示例中,是否进行QR-BDPCM的指示可以基于TS模式的指示来推断。
i.在一个示例中,如果是否将变换跳过标志应用于相同块的指示为真,则是否将QR-BDPCM应用于亮度和/或色度块的指示可以被推断为真。可替代地,如果是否将变换跳过标志应用于亮度和/或色度块的指示为真,则是否将QR-BDPCM应用于相同块的指示可以被推断为真。
ii.在一个示例中,如果是否将变换跳过标志应用于相同块的指示为假,则是否将QR-BDPCM应用于亮度和/或色度块的指示可以被推断为假。可替代地,如果是否将变换跳过标志应用于亮度和/或色度块的指示为假,则是否将QR-BDPCM应用于相同块的指示可以被推断为假。
9.是否和/或如何应用单独/双树可以取决于在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组/LCU/CU/视频数据单元中信令通知的消息。
a.在一个示例中,是否应用单独/双树的指示可以取决于当前条带/片/LCU/LCU行/LCU组/视频数据单元是否被确定为屏幕内容。
i.此外,在一个示例中,条带/片/LCU/LCU行/LCU组/视频数据单元是否被确定为屏幕内容可以取决于
1.在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组/LCU/CU/视频数据单元中信令通知的消息/标志。
2.当前CTU和/或其邻近CTU的块大小
3.当前CTU和/或其邻近CTU的块形状
4.当前CTU和/或其邻近CTU的当前量化参数
5.色彩格式的指示(诸如4:2:0、4:4:4)
6.先前条带/片/LCU/LCU行/LCU组/视频数据单元的单独/双编解码树结构类型
7.条带/片组类型和/或图片类型
8.时域层ID
b.在一个示例中,可以推断是否应用单独/双树的指示,这可以取决于
i.在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组/LCU/CU/视频数据单元中信令通知的消息。
ii.先前编解码图片/片/条带/重构区域中的IBC/帧间模式的哈希命中率
iii.当前CTU和/或其邻近CTU的块大小
iv.当前CTU和/或其邻近CTU的块形状
v.当前CTU和/或其邻近CTU的当前量化参数
vi.色彩格式的指示(诸如4:2:0、4:4:4)
vii.先前条带/片/LCU/LCU行/LCU组/视频数据单元的单独/双编解码树结构类型
viii.条带/片组类型和/或图片类型
ix.时域层ID
c.在一个示例中,是否应用CCLM和/或LMCS的指示可以取决于单独/双编解码树结构类型
i.在一个示例中,当使用单独树时,指示CCLM和/或LMCS可以被推断为假。
d.以上方法也可以适用于单树分割情况、或单/双编解码树结构类型。
10.是否启用IBC可以取决于编解码树结构类型。
a.在一个示例中,对于给定的编解码树结构类型(例如,双树),可以跳过并推断IBC模式的指示和/或在IBC模式下使用的块矢量的信令通知。
b.在一个示例中,当应用双编解码树结构类型时,IBC模式的指示可以被推断为假。
c.在一个示例中,当应用双编解码树结构类型时,亮度块的IBC模式的指示可以被推断为假。
d.在一个示例中,当应用双编解码树结构类型时,色度块的IBC模式的指示可以被推断为假。
e.在一个示例中,IBC模式的指示可以基于以下来推断
i.在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组/LCU/CU/视频数据单元中信令通知的消息。
ii.先前编解码图片/片/条带/重构区域中的IBC/帧间模式的哈希命中率
iii.当前CTU和/或其邻近CTU的块大小
iv.当前CTU和/或其邻近CTU的块形状
v.当前CTU和/或其邻近CTU的当前量化参数
vi.色彩格式的指示(诸如4:2:0、4:4:4)
vii.先前条带/片/LCU/LCU行/LCU组/视频数据单元的编解码树结构类型
viii.条带/片组类型和/或图片类型
ix.时域层ID
11.编解码树结构可以取决于是否使用IBC。
a.在一个示例中,可以不在序列/图片/片/砖块/CTU/VPDU/32x32块/64x32块/32x64块级别同时启用双树结构和IBC方法。
b.此外,可替代地,在一个示例中,如果启用了IBC方法,则可以在序列/图片/片/砖块/CTU/VPDU/32x32块/64x32块/32x64块级别禁用双树结构。
c.在一个示例中,当在区域中使用IBC时,色度编解码树结构可以与亮度编解码树结构对齐
i.在一个示例中,区域可以是序列/图片/片/砖块/CTU/VPDU/32x32块/64x32块/32x64块。
ii.在一个示例中,当并置亮度块被划分为子块时,如果色度块被允许划分,则它可以被划分为子块。
iii.在一个示例中,是否以及如何划分色度块可以从其并置亮度块的编解码结构推断。
iv.在一个示例中,当从亮度编解码树结构推断色度编解码树结构时,可以跳过对色度编解码树结构进行编解码的信号。
v.在一个示例中,标志可以用于指示是否可以从亮度编解码结构推断色度编解码结构。标志的信令通知可以取决于
1.在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组/LCU/CU/视频数据单元中信令通知的消息。
2.先前编解码图片/片/条带/重构区域中的IBC/帧间模式的哈希命中率
3.当前CTU和/或其邻近CTU的块大小
4.当前CTU和/或其邻近CTU的块形状
5.当前CTU和/或其邻近CTU的当前量化参数
6.色彩格式的指示(诸如4:2:0、4:4:4)
7.先前条带/片/LCU/LCU行/LCU组/视频数据单元的编解码树结构类型
8.条带/片组类型和/或图片类型
9.时域层ID
12.是否启用调色板编解码模式可以取决于编解码树结构类型。
a.在一个示例中,对于给定的编解码树结构类型(例如,双树),可以跳过并推断调色板编解码模式的指示的信令通知。
b.在一个示例中,当应用双编解码树结构类型时,调色板编解码模式的指示可以被推断为假。
c.在一个示例中,当应用双编解码树结构类型时,亮度块的调色板编解码模式的指示可以被推断为假。
d.在一个示例中,当应用双编解码树结构类型时,色度块的调色板编解码模式的指示可以被推断为假。
e.在一个示例中,调色板编解码模式的指示可以基于以下来推断
i.在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组/LCU/CU/视频数据单元中信令通知的消息。
ii.先前编解码图片/片/条带/重构区域中的IBC/帧间模式的哈希命中率
iii.当前CTU和/或其邻近CTU的块大小
iv.当前CTU和/或其邻近CTU的块形状
v.当前CTU和/或其邻近CTU的当前量化参数
vi.色彩格式的指示(诸如4:2:0、4:4:4)
vii.先前条带/片/LCU/LCU行/LCU组/视频数据单元的编解码树结构类型
viii.条带/片组类型和/或图片类型
ix.时域层ID
13.编解码树结构可以取决于是否使用调色板编解码模式。
a.在一个示例中,当在区域中使用调色板编解码模式时,色度编解码树结构可以与亮度编解码树结构对齐
i.在一个示例中,区域可以是序列/图片/片/砖块/CTU/VPDU/32x32块/64x32块
ii.在一个示例中,当并置亮度块被划分为子块时,如果色度块被允许划分,则它可以被划分为子块。
iii.在一个示例中,是否以及如何划分色度块可以从其并置亮度块的编解码结构推断。
iv.在一个示例中,当从亮度编解码树结构推断色度编解码树结构时,可以跳过对色度编解码树结构进行编解码的信号。
v.在一个示例中,标志可以用于指示是否可以从亮度编解码结构推断色度编解码结构。标志的信令通知可以取决于
1.在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组/LCU/CU/视频数据单元中信令通知的消息。
2.先前编解码图片/片/条带/重构区域中的IBC/帧间模式的哈希命中率
3.当前CTU和/或其邻近CTU的块大小
4.当前CTU和/或其邻近CTU的块形状
5.当前CTU和/或其邻近CTU的当前量化参数
6.色彩格式的指示(诸如4:2:0、4:4:4)
7.先前条带/片/LCU/LCU行/LCU组/视频数据单元的编解码树结构类型
8.条带/片组类型和/或图片类型
9.时域层ID
14.色度IBC编解码块中的子块/样点的运动/块矢量可以从并置亮度块内的第一可用IBC编解码子区域推导。
a.在一个示例中,可以定义并置亮度块内的子区域的扫描顺序,诸如光栅扫描顺序。
b.在一个示例中,子区域可以被定义为最小编解码单元/最小变换单元。
c.在一个示例中,色度IBC模式下的整体样点的运动/块矢量可以基于并置亮度块中在IBC或帧间模式下编解码的最左顶部样点的运动矢量来推导。
15.运动/块矢量可以在色度IBC模式下被信令通知。
a.在一个示例中,可以信令通知运动矢量和运动矢量预测值之间的差。
i.在一个示例中,运动矢量预测值可以基于并置亮度块、并置亮度块的邻近亮度块、当前色度块的邻近色度块的运动矢量来推导。
1.在一个示例中,运动/块矢量预测值可以基于并置亮度块中的左顶部样点的运动矢量来推导。
2.在一个示例中,运动/块矢量预测值可以基于并置亮度块中具有中心位置的样点的运动矢量来推导。
3.在一个示例中,运动/块矢量预测值可以基于并置亮度块中在IBC或帧间模式下编解码的最左顶部样点的运动矢量来推导。
ii.在一个示例中,与亮度分量的一个子区域相关联的运动矢量预测值可以在用作预测值之前被缩放。
iii.在一个示例中,块矢量可以从邻近(相邻或非相邻)色度块的运动矢量/块矢量推导。
b.在一个示例中,可以构建块矢量候选列表,并且可以信令通知列表的索引。
i.在一个示例中,候选列表可以包括来自并置亮度块、并置亮度块的邻近亮度块、邻近色度块的运动矢量/块矢量。
c.在一个示例中,可以推断AMVR标志的指示
i.在一个示例中,AMVR标志的指示可以在色度IBC模式下编解码的块中被推断为假(0)
ii.在一个示例中,运动矢量差的指示可以在色度IBC模式下编解码的块中被推断为整数精度
d.在一个示例中,是否在色度IBC模式下信令通知块/运动矢量可以基于
i.是否以IBC模式对并置亮度块内的所有子区域进行编解码。
1.如果是,则不需要信令通知色度块的块矢量。
否则,可以信令通知色度块的块矢量。
ii.是否以IBC模式对并置亮度块内的所有子区域进行编解码以及所有相关联的块矢量是否有效。
1.如果是,则不需要信令通知色度块的块矢量。
否则,可以信令通知色度块的块矢量。
iii.在SPS/VPS/PPS/图片头/条带头/片组头/LCU行/LCU组/LCU/CU/视频数据单元中信令通知的消息。
iv.先前编解码图片/片/条带/重构区域中的IBC/帧间模式的哈希命中率
v.当前CTU和/或其邻近CTU的块大小
vi.当前CTU和/或其邻近CTU的块形状
vii.当前CTU和/或其邻近CTU的当前量化参数
viii.色彩格式的指示(诸如4:2:0、4:4:4)
ix.先前条带/片/LCU/LCU行/LCU组/视频数据单元的编解码树结构类型
x.条带/片组类型和/或图片类型
xi.时域层ID
上面描述的示例可以并入在下面描述的方法(例如,方法900、910、920、930和940)的上下文,其可以在视频解码器或视频编码器处实施。
一种用于视频处理的示例性方法包括执行当前视频块和包括当前视频块的视频的比特流表示之间的转换,其中该转换基于被包括在比特流表示中的指示符来选择性地使用变换跳过模式用于转换,并且其中使用变换跳过模式,当前视频块的预测误差的残差被表示在比特流表示中,而不应用变换。
在一些实施例中,指示符是变换跳过模式的最大允许宽度和最大允许高度。
在一些实施例中,最大允许宽度和高度在序列参数集(SPS)、视频参数集(VPS)、图片参数集(PPS)、图片头、条带头、片组头、最大编解码单元(LCU)行或LCU组中被信令通知。
在一些实施例中,最大允许宽度和高度在不同的消息中被信令通知。
在一些实施例中,最大允许宽度和高度在序列参数集(SPS)或图片参数集(PPS)中被信令通知,并且其中最大允许宽度和高度的更新值在图片头、条带头、片组头、最大编解码单元(LCU)行或LCU组中被信令通知。
图9A示出了用于视频处理的另一示例性方法的流程图。方法900包括,在步骤902,确定当前视频块使用变换跳过模式进行编解码。
方法900包括,在步骤904,基于该确定,执行当前视频块和包括当前视频块的视频的比特流表示之间的转换。
在一些实施例中,当前视频块被划分为多个系数组,并且比特流表示省略多个系数组中的至少一个的编解码块标志的信令。在示例中,比特流表示省略多个系数组中的每一个的编解码块标志的信令。
在一些实施例中,在比特流表示中的信令中省略的编解码块标志是基于以下中的一个或多个来推断的:(1)在序列参数集(SPS)、视频参数集(VPS)、图片参数集(PPS)、图片头、条带头、片组头、最大编解码单元(LCU)、LCU行、LCU组或编解码单元(CU)中信令通知的消息,(2)多个系数组中的至少一个的位置,(3)当前视频块或当前视频块的至少一个邻近块的块大小,(4)当前视频块或至少一个邻近块的块形状,(5)当前视频块或至少一个邻近块的最可能模式,(6)至少一个邻近块的预测模式,(7)至少一个邻近块的帧内预测模式,(8)至少一个邻近块的一个或多个运动矢量,(9)至少一个邻近块的量化残余块差分脉冲编解码调制(QR-BDPCM)模式的指示,(10)当前视频块或至少一个邻近块的当前量化参数(QP),(11)当前视频块的色彩格式的指示,(12)与当前视频块相关联的单独编解码树结构或双编解码树结构,或者(13)当前视频块的条带类型、片组类型或图片类型。
在一些实施例中,当前视频块被划分为多个系数组,并且方法900还包括确定多个系数组的系数扫描顺序的步骤。在示例中,系数扫描顺序基于在序列参数集(SPS)、视频参数集(VPS)、图片参数集(PPS)、图片头、条带头、片组头、最大编解码单元(LCU)、LCU行、LCU组或编解码单元(CU)中信令通知的消息。
在一些实施例中,多个系数组或系数扫描顺序基于当前视频块的帧内预测模式。在示例中,系数扫描顺序为垂直,并且其中帧内预测模式是水平主导的。在另一示例中,系数扫描顺序为水平,并且其中帧内预测模式是水平主导的。例如,帧内预测模式的索引的范围从2到33或者从2到34。
在一些实施例中,多个系数组或系数扫描顺序基于当前视频块的帧内预测模式。在示例中,系数扫描顺序为垂直,并且其中帧内预测模式是垂直主导的。在另一示例中,系数扫描顺序为水平,并且其中帧内预测模式是垂直主导的。例如,帧内预测模式的索引的范围从34到66或者从35到66。
在一些实施例中,符号标志的上下文基于与当前视频块相关联的系数块中的邻近信息。在示例中,符号标志的上下文进一步基于系数块的系数的位置。在另一示例中,符号标志的上下文基于(x+y)、min(x,y)或max(x,y),其中x和y分别是系数的位置的水平值和垂直值。
图9B示出了用于视频处理的又一示例性方法的流程图。方法910包括,在步骤912,对于当前视频块,确定色度变换跳过模式是适用的。
方法910包括,在步骤914,基于该确定,执行当前视频块和包括当前视频块的视频的比特流表示之间的转换。
在一些实施例中,该确定基于在序列参数集(SPS)、视频参数集(VPS)、图片参数集(PPS)、图片头、条带头、片组头、最大编解码单元(LCU)、LCU行、LCU组、编解码单元(CU)或视频数据单元中信令通知的消息。
在一些实施例中,该确定基于来自在执行转换之前解码的一个或多个代表性视频块的解码信息,并且其中一个或多个代表性视频块和当前视频块中的每一个中的样点基于公共色彩信息。在示例中,一个或多个代表性视频块包括亮度块或色度块。在另一示例中,一个或多个代表性视频块包括并置亮度块内的块。
图9C示出了用于视频处理的又一示例性方法的流程图。方法920包括在步骤922,在当前视频块和包括当前视频块的视频的比特流表示之间的转换期间,基于条件做出关于对当前视频块选择性应用变换跳过模式的决定。
方法920包括,在步骤924,基于该决定来执行转换。
在一些实施例中,该条件基于在序列参数集(SPS)、视频参数集(VPS)、图片参数集(PPS)、图片头、条带头、片组头、最大编解码单元(LCU)、LCU行、LCU组、编解码单元(CU)或视频数据单元中信令通知的消息。
在一些实施例中,该条件基于以下中的一个或多个:(1)当前视频块或当前视频块的至少一个邻近块的块大小,(2)当前视频块或至少一个邻近块的块形状,(3)当前视频块或至少一个邻近块的最可能模式,(4)至少一个邻近块的预测模式,(5)至少一个邻近块的帧内预测模式,(6)至少一个邻近块的一个或多个运动矢量,(7)至少一个邻近块的量化残余块差分脉冲编解码调制(QR-BDPCM)模式的指示,(8)当前视频块或至少一个邻近块的当前量化参数(QP),(9)当前视频块的色彩格式的指示,(10)与当前视频块相关联的单独编解码树结构或双编解码树结构,(11)当前视频块的条带类型、片组类型或图片类型,或者(12)时域层标识(ID)。
在一些实施例中,变换跳过模式的应用被执行,当前视频块的预测模式是帧间块复制(IBC)模式,并且当前视频块的宽度或高度与阈值进行比较。在示例中,阈值在比特流表示中被信令通知。在另一示例中,阈值为4、8、16或32。
在又一示例中,阈值基于以下中的一个或多个:(1)在序列参数集(SPS)、视频参数集(VPS)、图片参数集(PPS)、图片头、条带头、片组头、最大编解码单元(LCU)、LCU行、LCU组或编解码单元(CU)中信令通知的消息,(2)时域层标识(ID),(3)当前视频块或当前视频块的至少一个邻近块的块大小,(4)当前视频块或至少一个邻近块的块形状,(5)当前视频块或至少一个邻近块的最可能模式,(6)至少一个邻近块的预测模式,(7)至少一个邻近块的帧内预测模式,(8)至少一个邻近块的一个或多个运动矢量,(9)至少一个邻近块的量化残余块差分脉冲编解码调制(QR-BDPCM)模式的指示,(10)当前视频块或至少一个邻近块的当前量化参数(QP),(11)当前视频块的色彩格式的指示,(12)与当前视频块相关联的单独编解码树结构或双编解码树结构,或者(13)当前视频块的条带类型、片组类型或图片类型。
图9D示出了用于视频处理的又一示例性方法的流程图。方法930包括,在步骤932,在当前视频块和包括当前视频块的视频的比特流表示之间的转换期间,基于比特流表示中的变换跳过模式的指示,做出关于量化残差块差分脉冲编解码调制(QR-BDPCM)的选择性应用的决定。
方法930包括,在步骤934,基于该决定来执行转换。
在一些实施例中,变换跳过模式的指示在变换单元(TU)级别上被信令通知。
图9E示出了用于视频处理的又一示例性方法的流程图。方法940包括,在步骤942,在当前视频块和包括当前视频块的视频的比特流表示之间的转换期间,基于条件做出关于单独树或双树的选择性应用的决定。
方法940包括,在步骤944,基于该决定来执行转换。
在一些实施例中,该条件基于在序列参数集(SPS)、视频参数集(VPS)、图片参数集(PPS)、图片头、条带头、片组头、最大编解码单元(LCU)、LCU行、LCU组、编解码单元(CU)或视频数据单元中信令通知的消息。
在一些实施例中,该条件基于确定包括当前视频块的条带、片、最大编解码单元(LCU)、LCU行、LCU组或视频数据单元是否是屏幕内容。在示例中,该确定基于以下中的一个或多个:(1)在序列参数集(SPS)、视频参数集(VPS)、图片参数集(PPS)、图片头、条带头、片组头、LCU、LCU行、LCU组、编解码单元(CU)或视频数据单元中信令通知的消息,(2)当前视频块或当前视频块的至少一个邻近块的块大小,(3)当前视频块或至少一个邻近块的块形状,(4)当前视频块或至少一个邻近块的当前量化参数(QP),(5)当前视频块的色彩格式的指示,(6)与当前视频块相关联的单独编解码树结构或双编解码树结构,(7)当前视频块的条带类型、片组类型或图片类型,或者(8)时域层标识(ID)。
图10是视频处理装置1000的框图。装置1000可以用于实施本文描述的一个或多个方法。装置1000可以体现在智能手机、平板电脑、计算机、物联网(IoT)接收器等中。装置1000可以包括一个或多个处理器1002、一个或多个存储器1004和视频处理硬件1006。(多个)处理器1002可以被配置为实施本文档中描述的一种或多种方法(包括但不限于方法900、910、920、930和940)。存储器(多个存储器)1004可以用于存储用于实施本文描述的方法和技术的数据和代码。视频处理硬件1006可以用于在硬件电路***中实施本文档中描述的一些技术。
在一些实施例中,视频编解码方法可以使用如参考图10所述的在硬件平台上实施的装置来实施。
在一些实施例中,例如,如以上项5和项10及以下所述,视频处理的方法包括基于对应于当前视频块的编解码树结构的类型,做出关于帧内块复制模式是否适用于视频的当前视频块和比特流表示之间的转换的确定;以及基于该确定来执行转换。
在以上方法中,比特流表示排除帧内块复制模式的指示。换句话说,比特流不携带IBC模式的显式信令。
在以上方法中,编解码树结构的类型是双编解码树结构,并且该确定是帧内块复制模式不适用。
图11是所公开的技术可以被实施的示例视频处理***的框图。各种实施方式可以包括***1100的一些或所有组件。***1100可以包括用于接收视频内容的输入1102。视频内容可以以例如8或10比特多分量像素值的原始或未压缩格式而接收,或者可以是压缩或编码格式。输入1102可以表示网络接口、***总线接口或存储接口。网络接口的示例包括诸如以太网、无源光网络(PON)等的有线接口和诸如Wi-Fi或蜂窝接口的无线接口。
***1100可以包括可以实施本文档中描述的各种编解码或编码方法的编解码组件1104。编解码组件1104可以将来自输入1102的视频的平均比特率减小到编解码组件1104的输出,以产生视频的编解码表示。编解码技术因此有时被称为视频压缩或视频转码技术。编解码组件1104的输出可以被存储,或者经由如由组件1106表示的通信连接而发送。在输入1102处接收的视频的存储或通信传送的比特流(或编解码)表示可以由组件1108用于生成像素值或传送到显示接口1110的可显示视频。从比特流表示生成用户可视视频的过程有时被称为视频解压缩。此外,虽然特定视频处理操作被称为“编解码”操作或工具,但是将理解,编解码工具或操作在编码器处被使用,并且反转编解码结果的对应的解码工具或操作将由解码器执行。
***总线接口或显示接口的示例可以包括通用串行总线(USB)、或高清晰度多媒体接口(HDMI)、或显示端口(Displayport)等。存储接口的示例包括SATA(串行高级技术附件)、PCI、IDE接口等。本文档中描述的技术可以体现在各种电子设备中,诸如移动电话、膝上型电脑、智能电话、或能够执行数字数据处理和/或视频显示的其他设备。
图12是可视媒体编码方法的示例的流程图。在步骤1202,该过程为了将可视媒体数据的视频区域中的当前视频块编码为可视媒体数据的比特流表示,做出关于至少基于与当前视频块相关联的编解码树结构或至少从与当前视频块相关联的编解码树结构推断的帧内块复制(IBC)模式的应用的决定。在步骤1204,该过程在比特流表示中选择性地包括指示至少基于编解码树结构或至少从编解码树结构推断的IBC模式的应用的语法元素。
图13是可视媒体解码方法的示例的流程图。在步骤1302,该过程从包括包含当前视频块的视频区域的可视媒体数据的比特流表示确定与当前视频块相关联的编解码树结构。在步骤1304,该过程基于编解码树结构来确定语法元素是否被包括在比特流表示中,其中语法元素指示帧内块复制(IBC)模式。在步骤1306,该过程从比特流表示生成当前视频块。
图14是可视媒体编码方法的示例的流程图。在步骤1402,该过程为了将可视媒体数据的视频区域中的当前视频块编码为可视媒体数据的比特流表示,做出关于至少基于确定帧内块复制(IBC)模式被应用或至少从确定帧内块复制(IBC)模式被应用而推断的编解码树结构对当前视频块的应用的决定。在步骤1404,该过程在比特流表示中选择性地包括指示将编解码树结构应用于当前视频块的语法元素。
图15是可视媒体解码方法的示例的流程图。在步骤1502,该过程为了将可视媒体数据的视频区域中的当前视频块编码为可视媒体数据的比特流表示,做出关于至少基于与当前视频块相关联的编解码树结构或至少从与当前视频块相关联的编解码树结构推断的调色板模式的应用的决定,其中在调色板模式下,当前视频块中包括的样点使用调色板中包括的代表性色彩值集合来表达。在步骤1504,该过程在比特流表示中选择性地包括指示调色板模式的应用的语法元素。
图16是可视媒体编码方法的示例的流程图。在步骤1602,该过程为了将可视媒体数据的视频区域中的当前视频块编码为可视媒体数据的比特流表示,做出关于至少基于与当前视频块相关联的编解码树结构或至少从与当前视频块相关联的编解码树结构推断的调色板模式的应用的决定,其中在调色板模式下,当前视频块中包括的样点使用调色板中包括的代表性色彩值集合来表达。在步骤1604,该过程在比特流表示中选择性地包括指示调色板模式的应用的语法元素。
图17是可视媒体解码方法的示例的流程图。在步骤1602,该过程从包括包含当前视频块的视频区域的可视媒体数据的比特流表示解析语法元素,其中语法元素指示至少基于与当前视频块相关联的编解码树结构或至少从与当前视频块相关联的编解码树结构推断的调色板模式,其中在调色板模式下,当前视频块中包括的样点使用调色板中包括的代表性色彩值集合来表达。在步骤1704,该过程通过根据语法元素解码当前视频块,从比特流表示生成解码的视频区域。
图18是可视媒体编码方法的示例的流程图。在步骤1802,该过程为了将可视媒体数据的视频区域中的当前视频块编码为可视媒体数据的比特流表示,做出关于至少基于确定调色板模式被应用或至少从确定调色板模式被应用而推断的编解码树结构对当前视频块的应用的决定,其中在调色板模式下,当前视频块中包括的样点使用调色板中包括的代表性色彩值集合来表达。在步骤1804,该过程在比特流表示中选择性地包括指示将编解码树结构应用于当前视频块的语法元素。
图19是可视媒体解码方法的示例的流程图。在步骤1902,该过程从包括包含当前视频块的视频区域的可视媒体数据的比特流表示解析语法元素,其中语法元素指示至少基于确定调色板模式被应用或至少从确定调色板模式被应用而推断的编解码树结构对当前视频块的应用,其中在调色板模式下,当前视频块中包括的样点使用调色板中包括的代表性色彩值集合来表达。在步骤1904,该过程通过根据语法元素解码当前视频块,从比特流表示生成解码的视频区域。
本文档的一些实施例现在以基于条款的格式呈现。
1.一种用于可视媒体编码的方法,包括:
为了将可视媒体数据的视频区域中的当前视频块编码为可视媒体数据的比特流表示,做出关于至少基于与当前视频块相关联的编解码树结构或至少从与当前视频块相关联的编解码树结构推断的帧内块复制(IBC)模式的应用的决定;以及
在比特流表示中选择性地包括指示至少基于编解码树结构或至少从编解码树结构推断的IBC模式的应用的语法元素。
2.一种用于可视媒体解码的方法,包括:
从包括包含当前视频块的视频区域的可视媒体数据的比特流表示确定与当前视频块相关联的编解码树结构;
基于编解码树结构来确定语法元素是否被包括在比特流表示中,其中语法元素指示帧内块复制(IBC)模式;以及
从比特流表示生成当前视频块。
3.根据条款1-2中任一项或多项所述的方法,其中,语法元素在比特流表示中被排除,并且进一步其中,指示IBC模式的应用和在IBC模式下使用的相关联的块矢量的语法元素被推断。
4.根据条款1-2中任一项或多项所述的方法,其中,如果编解码树结构是双编解码树结构类型,则语法元素被推断为布尔假值。
5.根据条款4所述的方法,其中,当前视频块是亮度块。
6.根据条款4所述的方法,其中,当前视频块是色度块。
7.根据条款1-6中任一项或多项所述的方法,其中,语法元素从比特流表示中排除,并且基于以下中的一个或多个来推断:
(1)在序列参数集(SPS)、视频参数集(VPS)、图片参数集(PPS)、图片头、条带头、片组头、最大编解码单元(LCU)、LCU行、LCU组或编解码单元(CU)中信令通知的消息,
(2)与其他视频块相关联的编解码图片/片/条带/重构区域中的IBC模式和/或帧间模式的哈希命中率,
(3)当前视频块或当前视频块的至少一个邻近块的块大小,
(4)当前视频块或至少一个邻近块的块形状,
(5)当前视频块或至少一个邻近块的当前量化参数(QP),
(6)当前视频块的色彩格式的指示,
(7)与当前视频块相关联的单独编解码树结构或双编解码树结构
(8)当前视频块的条带类型、片组类型或图片类型,或者
(9)时域层ID。
8.一种用于可视媒体编码的方法,包括:
为了将可视媒体数据的视频区域中的当前视频块编码为可视媒体数据的比特流表示,做出关于至少基于确定帧内块复制(IBC)模式被应用或至少从确定帧内块复制(IBC)模式被应用而推断的编解码树结构对当前视频块的应用的决定;以及
在比特流表示中选择性地包括指示将编解码树结构应用于当前视频块的语法元素。
9.一种用于可视媒体解码的方法,包括:
从包括包含当前视频块的视频区域的可视媒体数据的比特流表示解析语法元素,其中语法元素指示至少基于确定帧内块复制(IBC)模式被应用或至少从确定帧内块复制(IBC)模式被应用而推断的编解码树结构对当前视频块的应用;以及
通过根据语法元素解码当前视频块,从比特流表示生成解码的视频区域。
10.根据条款8-9中任一项或多项所述的方法,其中,编解码树结构是双树结构,还包括:
在确定IBC模式被禁用时,禁用双树结构的应用。
11.根据条款8-9中任一项或多项所述的方法,其中,编解码树结构是双树结构,还包括:
在确定IBC模式被应用时,应用双树结构。
12.根据条款8-9中任一项或多项所述的方法,其中,IBC模式被应用于第一视频区域,并且其中当前视频块包括色度色彩分量和亮度色彩分量,还包括:
将当前视频块的色度色彩分量的编解码树结构与当前视频块的亮度色彩分量的编解码树结构对齐。
13.根据条款F5所述的方法,其中,第一视频区域对应于以下之一:序列、图片、片、砖块、编解码树单元(CTU)、虚拟流水线数据单元(VPDU)、尺寸为32x32的视频块、尺寸为64x32的视频块或尺寸为32x64的视频块。
14.根据条款12所述的方法,其中,该对齐包括如果并置亮度色彩块被划分为子块,则将色度色彩块选择性地划分为子块。
15.根据条款14所述的方法,其中,选择性地划分至少部分取决于并置亮度色彩块的编解码树结构。
16.根据条款12所述的方法,其中,该对齐包括从当前视频块的亮度色彩分量的编解码树结构推断当前视频块的色度色彩分量的编解码树结构。
17.根据条款16所述的方法,其中,当前视频块的色度色彩分量的编解码树结构的指示从比特流表示中排除。
18.根据条款16所述的方法,其中,标志被选择性地包括在比特流表示中以指示推断。
19.根据条款18所述的方法,其中,基于以下中的一个或多个选择性地包括标志:
(1)在序列参数集(SPS)、视频参数集(VPS)、图片参数集(PPS)、图片头、条带头、片组头、最大编解码单元(LCU)、LCU行、LCU组或编解码单元(CU)中信令通知的消息,
(2)与其他视频块相关联的编解码图片/片/条带/重构区域中的IBC模式和/或帧间模式的哈希命中率,
(3)当前视频块或当前视频块的至少一个邻近块的块大小,
(4)当前视频块或至少一个邻近块的块形状,
(5)当前视频块或至少一个邻近块的当前量化参数(QP),
(6)当前视频块的色彩格式的指示,
(7)与当前视频块相关联的单独编解码树结构或双编解码树结构
(8)当前视频块的条带类型、片组类型或图片类型,或者
(9)时域层ID。
20.一种用于可视媒体编码的方法,包括:
为了将可视媒体数据的视频区域中的当前视频块编码为可视媒体数据的比特流表示,做出关于至少基于与当前视频块相关联的编解码树结构或至少从与当前视频块相关联的编解码树结构推断的调色板模式的应用的决定,其中在调色板模式下,当前视频块中包括的样点使用调色板中包括的代表性色彩值集合来表达;以及
在比特流表示中选择性地包括指示调色板模式的应用的语法元素。
21.一种用于可视媒体解码的方法,包括:
从包括包含当前视频块的视频区域的可视媒体数据的比特流表示解析语法元素,其中语法元素指示至少基于与当前视频块相关联的编解码树结构或至少从与当前视频块相关联的编解码树结构推断的调色板模式,其中在调色板模式下,当前视频块中包括的样点使用调色板中包括的代表性色彩值集合来表达;以及
通过根据语法元素解码当前视频块,从比特流表示生成解码的视频区域。
22.根据条款20-21中任一项或多项所述的方法,其中,如果编解码树结构是双树编解码结构,则语法元素从比特流表示中排除。
23.根据条款22所述的方法,其中,语法元素被推断为布尔假。
24.根据条款23所述的方法,其中,当前视频块是亮度块。
25.根据条款23所述的方法,其中,当前视频块是色度块。
26.根据条款20-21中任一项或多项所述的方法,其中,语法元素进一步从以下中的一个或多个推断:
(1)在序列参数集(SPS)、视频参数集(VPS)、图片参数集(PPS)、图片头、条带头、片组头、最大编解码单元(LCU)、LCU行、LCU组或编解码单元(CU)中信令通知的消息,
(2)与其他视频块相关联的编解码图片/片/条带/重构区域中的IBC模式和/或帧间模式的哈希命中率,
(3)当前视频块或当前视频块的至少一个邻近块的块大小,
(4)当前视频块或至少一个邻近块的块形状,
(5)当前视频块或至少一个邻近块的当前量化参数(QP),
(6)当前视频块的色彩格式的指示,
(7)与当前视频块相关联的单独编解码树结构或双编解码树结构
(8)当前视频块的条带类型、片组类型或图片类型,或者
(9)时域层ID。
27.一种用于可视媒体编码的方法,包括:
为了将可视媒体数据的视频区域中的当前视频块编码为可视媒体数据的比特流表示,做出关于至少基于确定调色板模式被应用或至少从确定调色板模式被应用而推断的编解码树结构对当前视频块的应用的决定,其中在调色板模式下,当前视频块中包括的样点使用调色板中包括的代表性色彩值集合来表达;以及
在比特流表示中选择性地包括指示将编解码树结构应用于当前视频块的语法元素。
28.一种用于可视媒体解码的方法,包括:
从包括包含当前视频块的视频区域的可视媒体数据的比特流表示解析语法元素,其中语法元素指示至少基于确定调色板模式被应用或至少从确定调色板模式被应用而推断的编解码树结构对当前视频块的应用,其中在调色板模式下,当前视频块中包括的样点使用调色板中包括的代表性色彩值集合来表达;以及
通过根据语法元素解码当前视频块,从比特流表示生成解码的视频区域。
29.根据条款27-28中任一项或多项所述的方法,其中,调色板模式被应用于第一视频区域,并且其中当前视频块包括色度色彩分量和亮度色彩分量,还包括:
将当前视频块的色度色彩分量的编解码树结构与当前视频块的亮度色彩分量的编解码树结构对齐。
30.根据条款29所述的方法,其中,第一视频区域对应于以下之一:序列、图片、片、砖块、编解码树单元(CTU)、虚拟流水线数据单元(VPDU)、尺寸为32x32的视频块或尺寸为64x32的视频块。
31.根据条款29所述的方法,其中,该对齐包括如果并置亮度色彩块被划分为子块,则将色度色彩块选择性地划分为子块。
32.根据条款31所述的方法,其中,选择性地划分至少部分取决于并置亮度色彩块的编解码树结构。
33.根据条款29所述的方法,其中,该对齐包括从当前视频块的亮度色彩分量的编解码树结构推断当前视频块的色度色彩分量的编解码树结构。
34.根据条款33所述的方法,其中,当前视频块的色度色彩分量的编解码树结构的指示从比特流表示中排除。
35.根据条款33所述的方法,其中,标志被选择性地包括在比特流表示中以指示推断。
36.根据条款35所述的方法,其中,基于以下中的一个或多个选择性地包括标志:
(1)在序列参数集(SPS)、视频参数集(VPS)、图片参数集(PPS)、图片头、条带头、片组头、最大编解码单元(LCU)、LCU行、LCU组或编解码单元(CU)中信令通知的消息,
(2)与其他视频块相关联的编解码图片/片/条带/重构区域中的IBC模式和/或帧间模式的哈希命中率,
(3)当前视频块或当前视频块的至少一个邻近块的块大小,
(4)当前视频块或至少一个邻近块的块形状,
(5)当前视频块或至少一个邻近块的当前量化参数(QP),
(6)当前视频块的色彩格式的指示,
(7)与当前视频块相关联的单独编解码树结构或双编解码树结构
(8)当前视频块的条带类型、片组类型或图片类型,或者
(9)时域层ID。
37.一种视频编码器装置,包括被配置为实施根据条款1-36中任一项或多项所述的方法的处理器。
38.一种视频解码器装置,包括被配置为实施根据条款1-36中任一项或多项所述的方法的处理器。
39.一种存储有代码的计算机可读介质,该代码体现用于实施根据条款1-36中任一项或多项所述的方法的处理器可执行指令。
在本文档中,术语“视频处理”或“可视媒体处理”可以指视频编码、视频解码、视频压缩或视频解压缩。例如,视频压缩算法可以在从视频的像素表示到对应的比特流表示的转换期间被应用,反之亦然。当前视频块的比特流表示可以例如对应于比特流内并置的或分散在不同地方的比特,如通过语法定义的。例如,宏块可以根据变换和编解码误差残差值并且也使用比特流中的头和其它字段中的比特进行编码。此外,在转换期间,解码器可以基于该确定,在知道一些字段可能存在或不存在的情况下解析比特流,如以上解决方案所述。类似地,编码器可以确定是否包括特定语法字段,并通过从编解码表示中包括或排除语法字段来相应地生成编解码表示。
从前面可以理解,为了说明的目的,本文已经描述了当前公开的技术的特定实施例,但是在不脱离本发明的范围的情况下,可以进行各种修改。因此,当前公开的技术不受除了所附权利要求之外的限制。
本专利文档中描述的主题和功能操作的实施方式可以在各种***、数字电子电路中被实施,或者在计算机软件、固件或硬件(包括本说明书中公开的结构及其结构等同物)中被实施,或者在它们中的一个或多个的组合中被实施。本说明书中描述的主题的实施方式可以被实施为一个或多个计算机程序产品,即编码在有形和非暂时性计算机可读介质上的计算机程序指令的一个或多个模块,该计算机程序指令用于由数据处理装置执行或控制数据处理装置的操作。计算机可读介质可以是机器可读存储设备、机器可读存储基板、存储器设备、影响机器可读传播信号的物质的组合、或它们中的一个或多个的组合。术语“数据处理单元”或“数据处理装置”包含用于处理数据的所有装置、设备和机器,包括例如可编程处理器、计算机、或多个处理器或计算机。除了硬件之外,装置还可以包括为所讨论的计算机程序创建执行环境的代码,例如,构成处理器固件、协议栈、数据库管理***、操作***、或它们中的一个或多个的组合的代码。
计算机程序(也已知为程序、软件、软件应用、脚本或代码)可以以任何形式的编程语言(包括编译或解释语言)编写,并且其可以以任何形式部署,包括作为独立程序或作为适合在计算环境中使用的模块、组件、子例程或其他单元。计算机程序不一定对应于文件***中的文件。程序可以存储在保存其他程序或数据(例如,存储在标记语言文档中的一个或多个脚本)的文件的一部分中,存储在专用于所讨论的程序的单个文件中,或存储在多个协调文件中(例如,存储一个或多个模块、子程序或代码部分的文件)。计算机程序可以被部署以在一个计算机上或在位于一个站点上或跨多个站点分布并通过通信网络互连的多个计算机上执行。
本说明书中描述的过程和逻辑流程可以由执行一个或多个计算机程序的一个或多个可编程处理器执行,以通过对输入数据进行操作并生成输出来执行功能。过程和逻辑流程也可以由专用逻辑电路执行,并且装置也可以被实施为专用逻辑电路,例如,FPGA(现场可编程门阵列)或ASIC(专用集成电路)。
适合于执行计算机程序的处理器包括例如通用和专用微处理器、以及任何类型的数字计算机的任何一个或多个处理器。通常,处理器将从只读存储器或随机存取存储器或两者接收指令和数据。计算机的基本元件是用于执行指令的处理器和用于存储指令和数据的一个或多个存储器设备。通常,计算机还将包括用于存储数据的一个或多个大容量存储设备(例如,磁盘、磁光盘或光盘),或可操作地耦合以从该一个或多个大容量存储设备接收数据或向该一个或多个大容量存储设备传递数据、或者从其接收数据并向其传递数据。然而,计算机不需要这样的设备。适用于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、介质和存储器设备,包括例如半导体存储器设备,例如EPROM、EEPROM和闪存设备。处理器和存储器可以由专用逻辑电路补充或并入专用逻辑电路中。
本说明书以及附图旨在被认为仅是示例性的,其中示例性意味着示例。如本文所使用的,单数形式“一个”、“一个”和“该”旨在也包括复数形式,除非上下文另外清楚地指示。此外,“或”的使用旨在包括“和/或”,除非上下文另外清楚地指示。
虽然本专利文档包含许多细节,但这些细节不应被解释为对任何发明或可能要求保护的范围的限制,而是作为特定于特定发明的特定实施例的特征的描述。在本专利文档中在单独的实施例的上下文中描述的某些特征也可以在单个实施例中组合实施。相反,在单个实施例的上下文中描述的各种特征也可以在多个实施例中分开实施或以任何合适的子组合实施。此外,尽管特征可以在上面描述为以某些组合起作用并且甚至最初如此要求保护,但是在一些情况下可以从组合排除来自所要求保护的组合的一个或多个特征,并且所要求保护的组合可以针对子组合或子组合的变化。
类似地,虽然在附图中以特定顺序描绘了操作,但是这不应该被理解为需要以所示的特定顺序或以先后顺序执行这样的操作或者执行所有示出的操作以实现期望的结果。此外,在本专利文档中描述的实施例中的各种***组件的分离不应被理解为在所有实施例中都需要这样的分离。
仅描述了一些实施方式和示例,并且可以基于本专利文档中描述和示出的内容来进行其他实施方式、增强和变化。

Claims (39)

1.一种用于可视媒体编码的方法,包括:
为了将可视媒体数据的视频区域中的当前视频块编码为可视媒体数据的比特流表示,做出关于至少基于与当前视频块相关联的编解码树结构或至少从与当前视频块相关联的编解码树结构推断的帧内块复制(IBC)模式的应用的决定;以及
在比特流表示中选择性地包括指示至少基于编解码树结构或至少从编解码树结构推断的IBC模式的应用的语法元素。
2.一种用于可视媒体解码的方法,包括:
从包括包含当前视频块的视频区域的可视媒体数据的比特流表示确定与当前视频块相关联的编解码树结构;
基于编解码树结构来确定语法元素是否被包括在比特流表示中,其中所述语法元素指示帧内块复制(IBC)模式;以及
从比特流表示生成当前视频块。
3.根据权利要求1-2中任一项或多项所述的方法,其中,所述语法元素在比特流表示中被排除,并且进一步其中,指示IBC模式的应用和在IBC模式下使用的相关联的块矢量的语法元素被推断。
4.根据权利要求1-2中任一项或多项所述的方法,其中,如果编解码树结构是双编解码树结构类型,则语法元素被推断为布尔假值。
5.根据权利要求4所述的方法,其中,所述当前视频块是亮度块。
6.根据权利要求4所述的方法,其中,所述当前视频块是色度块。
7.根据权利要求1-6中任一项或多项所述的方法,其中,所述语法元素从比特流表示中排除,并且基于以下中的一个或多个来推断:
(1)在序列参数集(SPS)、视频参数集(VPS)、图片参数集(PPS)、图片头、条带头、片组头、最大编解码单元(LCU)、LCU行、LCU组或编解码单元(CU)中信令通知的消息,
(2)与其他视频块相关联的编解码图片/片/条带/重构区域中的IBC模式和/或帧间模式的哈希命中率,
(3)当前视频块或当前视频块的至少一个邻近块的块大小,
(4)当前视频块或至少一个邻近块的块形状,
(5)当前视频块或至少一个邻近块的当前量化参数(QP),
(6)当前视频块的色彩格式的指示,
(7)与当前视频块相关联的单独编解码树结构或双编解码树结构,
(8)当前视频块的条带类型、片组类型或图片类型,或者
(9)时域层ID。
8.一种用于可视媒体编码的方法,包括:
为了将可视媒体数据的视频区域中的当前视频块编码为可视媒体数据的比特流表示,做出关于至少基于确定帧内块复制(IBC)模式被应用或至少从确定帧内块复制(IBC)模式被应用而推断的编解码树结构对当前视频块的应用的决定;以及
在比特流表示中选择性地包括指示将编解码树结构应用于当前视频块的语法元素。
9.一种用于可视媒体解码的方法,包括:
从包括包含当前视频块的视频区域的可视媒体数据的比特流表示解析语法元素,其中所述语法元素指示至少基于确定帧内块复制(IBC)模式被应用或至少从确定帧内块复制(IBC)模式被应用而推断的编解码树结构对当前视频块的应用;以及
通过根据语法元素解码当前视频块,从比特流表示生成解码的视频区域。
10.根据权利要求8-9中任一项或多项所述的方法,其中,所述编解码树结构是双树结构,还包括:
在确定IBC模式被禁用时,禁用双树结构的应用。
11.根据权利要求8-9中任一项或多项所述的方法,其中,所述编解码树结构是双树结构,还包括:
在确定IBC模式被应用时,应用双树结构。
12.根据权利要求8-9中任一项或多项所述的方法,其中,所述IBC模式被应用于第一视频区域,并且其中所述当前视频块包括色度色彩分量和亮度色彩分量,还包括:
将当前视频块的色度色彩分量的编解码树结构与当前视频块的亮度色彩分量的编解码树结构对齐。
13.根据权利要求12所述的方法,其中,所述第一视频区域对应于以下之一:序列、图片、片、砖块、编解码树单元(CTU)、虚拟流水线数据单元(VPDU)、尺寸为32x32的视频块、尺寸为64x32的视频块或尺寸为32x64的视频块。
14.根据权利要求12所述的方法,其中,所述对齐包括如果并置亮度色彩块被划分为子块,则将色度色彩块选择性地划分为子块。
15.根据权利要求14所述的方法,其中,所述选择性地划分至少部分取决于并置亮度色彩块的编解码树结构。
16.根据权利要求12所述的方法,其中,所述对齐包括从当前视频块的亮度色彩分量的编解码树结构推断当前视频块的色度色彩分量的编解码树结构。
17.根据权利要求16所述的方法,其中,所述当前视频块的色度色彩分量的编解码树结构的指示从比特流表示中排除。
18.根据权利要求16所述的方法,其中,标志被选择性地包括在比特流表示中以指示推断。
19.根据权利要求18所述的方法,其中,基于以下中的一个或多个选择性地包括所述标志:
(1)在序列参数集(SPS)、视频参数集(VPS)、图片参数集(PPS)、图片头、条带头、片组头、最大编解码单元(LCU)、LCU行、LCU组或编解码单元(CU)中信令通知的消息,
(2)与其他视频块相关联的编解码图片/片/条带/重构区域中的IBC模式和/或帧间模式的哈希命中率,
(3)当前视频块或当前视频块的至少一个邻近块的块大小,
(4)当前视频块或至少一个邻近块的块形状,
(5)当前视频块或至少一个邻近块的当前量化参数(QP),
(6)当前视频块的色彩格式的指示,
(7)与当前视频块相关联的单独编解码树结构或双编解码树结构,
(8)当前视频块的条带类型、片组类型或图片类型,或者
(9)时域层ID。
20.一种用于可视媒体编码的方法,包括:
为了将可视媒体数据的视频区域中的当前视频块编码为可视媒体数据的比特流表示,做出关于至少基于与当前视频块相关联的编解码树结构或至少从与当前视频块相关联的编解码树结构推断的调色板模式的应用的决定,其中在调色板模式下,当前视频块中包括的样点使用调色板中包括的代表性色彩值集合来表达;以及
在比特流表示中选择性地包括指示调色板模式的应用的语法元素。
21.一种用于可视媒体解码的方法,包括:
从包括包含当前视频块的视频区域的可视媒体数据的比特流表示解析语法元素,其中所述语法元素指示至少基于与当前视频块相关联的编解码树结构或至少从与当前视频块相关联的编解码树结构推断的调色板模式,其中在调色板模式下,当前视频块中包括的样点使用调色板中包括的代表性色彩值集合来表达;以及
通过根据语法元素解码当前视频块,从比特流表示生成解码的视频区域。
22.根据权利要求20-21中任一项或多项所述的方法,其中,如果编解码树结构是双树编解码结构,则语法元素从比特流表示中排除。
23.根据权利要求22所述的方法,其中,所述语法元素被推断为布尔假。
24.根据权利要求23所述的方法,其中,所述当前视频块是亮度块。
25.根据权利要求23所述的方法,其中,所述当前视频块是色度块。
26.根据权利要求20-21中任一项或多项所述的方法,其中,所述语法元素进一步从以下中的一个或多个推断:
(1)在序列参数集(SPS)、视频参数集(VPS)、图片参数集(PPS)、图片头、条带头、片组头、最大编解码单元(LCU)、LCU行、LCU组或编解码单元(CU)中信令通知的消息,
(2)与其他视频块相关联的编解码图片/片/条带/重构区域中的IBC模式和/或帧间模式的哈希命中率,
(3)当前视频块或当前视频块的至少一个邻近块的块大小,
(4)当前视频块或至少一个邻近块的块形状,
(5)当前视频块或至少一个邻近块的当前量化参数(QP),
(6)当前视频块的色彩格式的指示,
(7)与当前视频块相关联的单独编解码树结构或双编解码树结构,
(8)当前视频块的条带类型、片组类型或图片类型,或者
(9)时域层ID。
27.一种用于可视媒体编码的方法,包括:
为了将可视媒体数据的视频区域中的当前视频块编码为可视媒体数据的比特流表示,做出关于至少基于确定调色板模式被应用或至少从确定调色板模式被应用而推断的编解码树结构对当前视频块的应用的决定,其中在调色板模式下,当前视频块中包括的样点使用调色板中包括的代表性色彩值集合来表达;以及
在比特流表示中选择性地包括指示将编解码树结构应用于当前视频块的语法元素。
28.一种用于可视媒体解码的方法,包括:
从包括包含当前视频块的视频区域的可视媒体数据的比特流表示解析语法元素,其中所述语法元素指示至少基于确定调色板模式被应用或至少从确定调色板模式被应用而推断的编解码树结构对当前视频块的应用,其中在调色板模式下,当前视频块中包括的样点使用调色板中包括的代表性色彩值集合来表达;以及
通过根据语法元素解码当前视频块,从比特流表示生成解码的视频区域。
29.根据权利要求27-28中任一项或多项所述的方法,其中,所述调色板模式被应用于第一视频区域,并且其中所述当前视频块包括色度色彩分量和亮度色彩分量,还包括:
将当前视频块的色度色彩分量的编解码树结构与当前视频块的亮度色彩分量的编解码树结构对齐。
30.根据权利要求29所述的方法,其中,所述第一视频区域对应于以下之一:序列、图片、片、砖块、编解码树单元(CTU)、虚拟流水线数据单元(VPDU)、尺寸为32x32的视频块或尺寸为64x32的视频块。
31.根据权利要求29所述的方法,其中,所述对齐包括如果并置亮度色彩块被划分为子块,则将色度色彩块选择性地划分为子块。
32.根据权利要求31所述的方法,其中,所述选择性地划分至少部分取决于并置亮度色彩块的编解码树结构。
33.根据权利要求29所述的方法,其中,所述对齐包括从当前视频块的亮度色彩分量的编解码树结构推断当前视频块的色度色彩分量的编解码树结构。
34.根据权利要求33所述的方法,其中,所述当前视频块的色度色彩分量的编解码树结构的指示从比特流表示中排除。
35.根据权利要求33所述的方法,其中,标志被选择性地包括在比特流表示中以指示推断。
36.根据权利要求35所述的方法,其中,基于以下中的一个或多个选择性地包括所述标志:
(1)在序列参数集(SPS)、视频参数集(VPS)、图片参数集(PPS)、图片头、条带头、片组头、最大编解码单元(LCU)、LCU行、LCU组或编解码单元(CU)中信令通知的消息,
(2)与其他视频块相关联的编解码图片/片/条带/重构区域中的IBC模式和/或帧间模式的哈希命中率,
(3)当前视频块或当前视频块的至少一个邻近块的块大小,
(4)当前视频块或至少一个邻近块的块形状,
(5)当前视频块或至少一个邻近块的当前量化参数(QP),
(6)当前视频块的色彩格式的指示,
(7)与当前视频块相关联的单独编解码树结构或双编解码树结构,
(8)当前视频块的条带类型、片组类型或图片类型,或者
(9)时域层ID。
37.一种视频编码器装置,包括被配置为实施根据权利要求1-36中任一项或多项所述的方法的处理器。
38.一种视频解码器装置,包括被配置为实施根据权利要求1-36中任一项或多项所述的方法的处理器。
39.一种存储有代码的计算机可读介质,所述代码体现用于实施根据权利要求1-36中任一项或多项所述的方法的处理器可执行指令。
CN202080032961.4A 2019-05-02 2020-05-01 基于编解码树结构类型的编解码模式 Active CN113785306B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311562576.2A CN117615130A (zh) 2019-05-02 2020-05-01 基于编解码树结构类型的编解码模式

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
CNPCT/CN2019/085405 2019-05-02
CN2019085405 2019-05-02
CNPCT/CN2019/085860 2019-05-07
CN2019085860 2019-05-07
PCT/US2020/030984 WO2020223615A1 (en) 2019-05-02 2020-05-01 Coding mode based on a coding tree structure type

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202311562576.2A Division CN117615130A (zh) 2019-05-02 2020-05-01 基于编解码树结构类型的编解码模式

Publications (2)

Publication Number Publication Date
CN113785306A true CN113785306A (zh) 2021-12-10
CN113785306B CN113785306B (zh) 2024-06-14

Family

ID=73029379

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202311562576.2A Pending CN117615130A (zh) 2019-05-02 2020-05-01 基于编解码树结构类型的编解码模式
CN202080032961.4A Active CN113785306B (zh) 2019-05-02 2020-05-01 基于编解码树结构类型的编解码模式

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202311562576.2A Pending CN117615130A (zh) 2019-05-02 2020-05-01 基于编解码树结构类型的编解码模式

Country Status (6)

Country Link
US (1) US11438602B2 (zh)
EP (1) EP3948663A4 (zh)
JP (1) JP7288083B2 (zh)
KR (1) KR20220002917A (zh)
CN (2) CN117615130A (zh)
WO (1) WO2020223615A1 (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102630415B1 (ko) 2019-04-24 2024-01-29 바이트댄스 아이엔씨 코딩 된 비디오의 양자화된 잔차 차동 펄스 코드 변조 표현의 제약
WO2020223467A1 (en) 2019-05-01 2020-11-05 Bytedance Inc. Intra coded video using quantized residual differential pulse code modulation coding
JP2022542083A (ja) * 2019-07-21 2022-09-29 エルジー エレクトロニクス インコーポレイティド パレットモードの適用有無に応じてクロマ成分予測情報をシグナリングする画像符号化/復号化方法、装置、及びビットストリームを伝送する方法
BR112022001981A2 (pt) * 2019-08-06 2022-05-10 Beijing Bytedance Network Tech Co Ltd Método e aparelho de processamento de vídeo, e, mídia legível por computador
MX2022002188A (es) 2019-09-02 2022-03-11 Beijing Bytedance Network Tech Co Ltd Determinacion de modo de codificacion basada en formato de color.
KR102649584B1 (ko) 2019-09-21 2024-03-21 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 크로마 인트라 모드에 기초한 크기 제한
US20220400275A1 (en) * 2021-06-10 2022-12-15 Tencent America LLC Zero Residual Flag Coding

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180288415A1 (en) * 2015-06-09 2018-10-04 Microsoft Technology Licensing, Llc Robust encoding/decoding of escape-coded pixels in palette mode
CN109076210A (zh) * 2016-05-28 2018-12-21 联发科技股份有限公司 视频编解码的当前图像参考的方法和装置

Family Cites Families (70)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11275592A (ja) 1998-01-22 1999-10-08 Victor Co Of Japan Ltd 動画像符号列変換装置及びその方法
KR100813963B1 (ko) 2005-09-16 2008-03-14 세종대학교산학협력단 동영상의 무손실 부호화, 복호화 방법 및 장치
US8208545B2 (en) 2006-06-01 2012-06-26 Electronics And Telecommunications Research Institute Method and apparatus for video coding on pixel-wise prediction
TW201028018A (en) 2009-01-07 2010-07-16 Ind Tech Res Inst Encoder, decoder, encoding method and decoding method
KR101379185B1 (ko) 2009-04-14 2014-03-31 에스케이 텔레콤주식회사 예측 모드 선택 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치
UA109312C2 (uk) 2011-03-04 2015-08-10 Імпульсно-кодова модуляція з квантуванням при кодуванні відеоінформації
EP2777258B1 (en) 2011-11-04 2017-01-11 Huawei Technologies Co., Ltd. Binarization of prediction residuals for lossless video coding
US10390046B2 (en) 2011-11-07 2019-08-20 Qualcomm Incorporated Coding significant coefficient information in transform skip mode
US9332259B2 (en) 2012-01-18 2016-05-03 Qualcomm Incorporated Indication of use of wavefront parallel processing in video coding
US9838684B2 (en) 2012-04-11 2017-12-05 Qualcomm Incorporated Wavefront parallel processing for video coding
US9621921B2 (en) 2012-04-16 2017-04-11 Qualcomm Incorporated Coefficient groups and coefficient coding for coefficient scans
US9426466B2 (en) 2012-06-22 2016-08-23 Qualcomm Incorporated Transform skip mode
US9264713B2 (en) 2012-07-11 2016-02-16 Qualcomm Incorporated Rotation of prediction residual blocks in video coding with transform skipping
US9549182B2 (en) 2012-07-11 2017-01-17 Qualcomm Incorporated Repositioning of prediction residual blocks in video coding
US9407915B2 (en) 2012-10-08 2016-08-02 Google Inc. Lossless video coding with sub-frame level optimal quantization values
US20140286412A1 (en) 2013-03-25 2014-09-25 Qualcomm Incorporated Intra dc prediction for lossless coding in video coding
ES2665908T3 (es) 2013-04-08 2018-04-30 Ge Video Compression, Llc Predicción inter-componente
US9667990B2 (en) 2013-05-31 2017-05-30 Qualcomm Incorporated Parallel derived disparity vector for 3D video coding with neighbor-based disparity vector derivation
US11323747B2 (en) 2013-06-05 2022-05-03 Qualcomm Incorporated Residual differential pulse code modulation (DPCM) extensions and harmonization with transform skip, rotation, and scans
US9558567B2 (en) 2013-07-12 2017-01-31 Qualcomm Incorporated Palette prediction in palette-based video coding
US9648335B2 (en) 2013-07-12 2017-05-09 Qualcomm Incorporated Bitstream restrictions on picture partitions across layers
KR20150055858A (ko) 2013-11-14 2015-05-22 삼성전자주식회사 차분 레지듀얼 신호를 이용한 비디오의 부호화 방법 및 장치, 그 복호화 방법 및 장치
GB201321851D0 (en) 2013-12-10 2014-01-22 Canon Kk Run length parameters coding for palette mode
TWI536811B (zh) 2013-12-27 2016-06-01 財團法人工業技術研究院 影像處理方法與系統、解碼方法、編碼器與解碼器
US20150189321A1 (en) 2014-01-02 2015-07-02 Mediatek Inc. Method of Binarization and Context Adaptive Binary Arithmetic Coding of Depth Coding Syntax
US9860540B2 (en) 2014-01-03 2018-01-02 Qualcomm Incorporated Inference of nooutputofpriorpicsflag in video coding
EP3120561B1 (en) 2014-03-16 2023-09-06 VID SCALE, Inc. Method and apparatus for the signaling of lossless video coding
US9877035B2 (en) 2014-03-17 2018-01-23 Qualcomm Incorporated Quantization processes for residue differential pulse code modulation
WO2015165030A1 (en) 2014-04-29 2015-11-05 Microsoft Technology Licensing, Llc Encoder-side decisions for sample adaptive offset filtering
CA2959682C (en) 2014-09-30 2022-12-06 Microsoft Technology Licensing, Llc Rules for intra-picture prediction modes when wavefront parallel processing is enabled
GB2531004A (en) 2014-10-06 2016-04-13 Canon Kk Residual colour transform signalled at sequence level for specific coding modes
WO2016074147A1 (en) 2014-11-11 2016-05-19 Mediatek Singapore Pte. Ltd. Separated coding tree for luma and chroma
EP3032830A1 (en) 2014-12-08 2016-06-15 Thomson Licensing Differential coding of intra modes
WO2016115981A1 (en) 2015-01-22 2016-07-28 Mediatek Singapore Pte. Ltd. Method of video coding for chroma components
US10924743B2 (en) 2015-02-06 2021-02-16 Microsoft Technology Licensing, Llc Skipping evaluation stages during media encoding
US10057574B2 (en) 2015-02-11 2018-08-21 Qualcomm Incorporated Coding tree unit (CTU) level adaptive loop filter (ALF)
WO2017045101A1 (en) 2015-09-14 2017-03-23 Mediatek Singapore Pte. Ltd. Advanced deblocking filter in video coding
US10575013B2 (en) * 2015-10-19 2020-02-25 Mediatek Inc. Method and apparatus for decoded picture buffer management in video coding system using intra block copy
WO2017083553A1 (en) 2015-11-10 2017-05-18 Vid Scale, Inc. Systems and methods for coding in super-block based video coding framework
WO2017088093A1 (en) 2015-11-23 2017-06-01 Mediatek Singapore Pte. Ltd. On the smallest allowed block size in video coding
WO2017139937A1 (en) 2016-02-18 2017-08-24 Mediatek Singapore Pte. Ltd. Advanced linear model prediction for chroma coding
US11223852B2 (en) 2016-03-21 2022-01-11 Qualcomm Incorporated Coding video data using a two-level multi-type-tree framework
WO2017184970A1 (en) 2016-04-22 2017-10-26 Vid Scale, Inc. Prediction systems and methods for video coding based on filtering nearest neighboring pixels
KR20190015216A (ko) 2016-05-05 2019-02-13 브이아이디 스케일, 인크. 인트라 코딩을 위한 제어 포인트 기반의 인트라 방향 표현
US10390015B2 (en) 2016-08-26 2019-08-20 Qualcomm Incorporated Unification of parameters derivation procedures for local illumination compensation and cross-component linear model prediction
US20200045322A1 (en) * 2016-10-04 2020-02-06 Mediatek Inc. Method and apparatus for intra chroma coding in image and video coding
US10194147B2 (en) 2017-01-19 2019-01-29 Google Llc DC coefficient sign coding scheme
AU2018311926B2 (en) 2017-08-03 2022-08-18 FG Innovation Company Limited Systems and methods for partitioning video blocks in an inter prediction slice of video data
WO2019234672A1 (en) 2018-06-07 2019-12-12 Beijing Bytedance Network Technology Co., Ltd. Partial cost calculation
CN110636298B (zh) 2018-06-21 2022-09-13 北京字节跳动网络技术有限公司 对于Merge仿射模式和非Merge仿射模式的统一约束
WO2019244115A2 (en) 2018-06-21 2019-12-26 Beijing Bytedance Network Technology Co., Ltd. Automatic partition for cross blocks
CN112369022A (zh) * 2018-06-27 2021-02-12 韩国电子通信研究院 图像编码/解码方法和装置以及存储比特流的记录介质
TWI731360B (zh) 2018-06-29 2021-06-21 大陸商北京字節跳動網絡技術有限公司 查找表的使用條件
CN110662052B (zh) 2018-06-29 2022-07-08 北京字节跳动网络技术有限公司 更新查找表(lut)的条件
WO2020008349A1 (en) 2018-07-02 2020-01-09 Beijing Bytedance Network Technology Co., Ltd. Merge index coding
CN113170116A (zh) 2018-11-22 2021-07-23 北京字节跳动网络技术有限公司 为帧内模式视频处理使用参考行
KR20240000610A (ko) 2019-01-15 2024-01-02 로즈데일 다이나믹스 엘엘씨 변환 스킵 플래그를 이용한 영상 코딩 방법 및 장치
US11012701B2 (en) 2019-02-22 2021-05-18 Tencent America LLC Residual coding for transform skip mode and block differential pulse-code modulation
CN113330749B (zh) 2019-02-24 2024-05-10 腾讯美国有限责任公司 视频编解码的方法和装置
US11825120B2 (en) 2019-02-28 2023-11-21 Qualcomm Incorporated Subblock coding by generalized intra prediction in video coding
US11202100B2 (en) 2019-03-11 2021-12-14 Qualcomm Incorporated Coefficient coding for transform skip mode
US11070812B2 (en) 2019-03-12 2021-07-20 Qualcomm Incorporated Coefficient domain block differential pulse-code modulation in video coding
US11128876B2 (en) 2019-03-12 2021-09-21 Qualcomm Incorporated Joint coefficient coding of transform skip and BDPCM mode for 4:4:4 color formats
US11451826B2 (en) 2019-04-15 2022-09-20 Tencent America LLC Lossless coding mode and switchable residual coding
US20220210430A1 (en) 2019-04-16 2022-06-30 Lg Electronics Inc. Method and device for coding/decoding image using differential coding of residual coefficient, and method for transmitting bitstream
BR112021020435A2 (pt) 2019-04-19 2021-12-14 Bytedance Inc Método de processamento de dados de vídeo, aparelho para processar dados de vídeo, meio de armazenamentoe meio de gravação legíveis por computador não transitório
KR20210145123A (ko) 2019-04-23 2021-12-01 주식회사 윌러스표준기술연구소 다중 변환 커널을 사용하는 비디오 신호 처리 방법 및 장치
KR102630415B1 (ko) 2019-04-24 2024-01-29 바이트댄스 아이엔씨 코딩 된 비디오의 양자화된 잔차 차동 펄스 코드 변조 표현의 제약
WO2020223467A1 (en) 2019-05-01 2020-11-05 Bytedance Inc. Intra coded video using quantized residual differential pulse code modulation coding
WO2020223612A1 (en) 2019-05-02 2020-11-05 Bytedance Inc. Signaling in transform skip mode

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180288415A1 (en) * 2015-06-09 2018-10-04 Microsoft Technology Licensing, Llc Robust encoding/decoding of escape-coded pixels in palette mode
CN109076210A (zh) * 2016-05-28 2018-12-21 联发科技股份有限公司 视频编解码的当前图像参考的方法和装置

Also Published As

Publication number Publication date
KR20220002917A (ko) 2022-01-07
JP7288083B2 (ja) 2023-06-06
US11438602B2 (en) 2022-09-06
US20220038717A1 (en) 2022-02-03
WO2020223615A1 (en) 2020-11-05
CN113785306B (zh) 2024-06-14
CN117615130A (zh) 2024-02-27
EP3948663A4 (en) 2022-06-08
JP2022531587A (ja) 2022-07-07
EP3948663A1 (en) 2022-02-09

Similar Documents

Publication Publication Date Title
JP7448559B2 (ja) 変換スキップモードのためのコンテキスト符号化
CN113728642B (zh) 编解码视频的量化残差差分脉冲编解码调制表示
CN113785568B (zh) 变换跳过模式下的信令通知
CN113785306B (zh) 基于编解码树结构类型的编解码模式
US11490089B2 (en) Transform bypass coded residual blocks in digital video
CN113796069B (zh) 使用量化残差差分脉冲编解码调制编解码的帧内编解码视频
CN113892267A (zh) 使用编解码树结构类型控制编解码模式
RU2817139C2 (ru) Способ контекстно-зависимого кодирования для режима с пропуском преобразования

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant