CN111602394B

CN111602394B - 视频编解码***中的视频处理方法及装置

Info

Publication number: CN111602394B
Application number: CN201880086475.3A
Authority: CN
Inventors: 向时达
Original assignee: MediaTek Inc
Current assignee: MediaTek Inc
Priority date: 2018-01-18
Filing date: 2018-12-06
Publication date: 2021-07-09
Anticipated expiration: 2038-12-06
Also published as: US11051009B2; CN111602394A; US20210037237A1; TW201933871A; TWI687092B; WO2019141012A1

Abstract

视频编码或解码***中用于处理拆分成多个编码单元(CU)的条带的视频数据处理方法以及装置。视频编码或解码***接收当前CU的输入数据以及检查所述当前CU的尺寸。如果所述当前CU的尺寸大于最大尺寸阈值，将所述当前CU的残差设置为0或者在跳过模式中对该当前CU进行编解码。CU具有0残差意味着一个或多个对应的转换块中系数层级值都是0，因此避免了大尺寸块的复杂的转换处理。

Description

视频编解码***中的视频处理方法及装置

相关引用

本发明要求于2018年1月18日提交的，美国临时专利申请号为62/618,660，标题“Methods and apparatus for coding units of video data”、于2018年1月18 日提交的，美国临时专利申请号为62/618,662，标题为“Methods and apparatus forpartitioning coding units of video data”、于2018年1月18日提交的，美国临时专利申请号为62/618,664，标题为“Methods and apparatus for low-complexity coding unitsof video data”，以及于2018年1月22日提交的，美国临时专利申请号为 62/620,005，标题为“Methods and apparatus for coding units of video data”的优先权。这些美国临时专利申请整体在此通过参考纳入其中。

技术领域

本发明涉及使用大尺寸编码单元(coding unit，CU)对视频数据进行编码或解码，特别地，本发明涉及用于处理尺寸大于指定最大转换尺寸的编码单元方法及装置，并且每一编码单元包含单个转换单元(transform unit，TU)。

背景技术

高效视频编码(High-Efficiency Video Coding，HEVC)也称为H.265，是由来自ITU-T研究小组的视频编码专家组成的视频编解码联合合作小组(JCT-VC)所开发的视频压缩标准。HEVC标准大大提高了其先前标准(H.264)的编码效率。两个标准通过比较视频图像的不同区域来找到视频图像与相邻图像中的冗余来压缩视频数据，以及这些区域用描述原始像素的短信息来替代这些区域。HEVC 中的编码工具之一能够将这些区域的尺寸扩展成更大或更小的块，称为编码树单元(Coding Tree Unit，CTU)，而H.264只允许这些区域的固定尺寸。HEVC的编码结构将每一视频图像拆分成多个非重叠的正方形CTU。编码的图像由一个或一组条带(slice)表示，以及每一条带由整数个CTU组成。以光栅扫描次序(rasterscanning order)处理条带中的每一单独的CTU。使用帧内预测(intra prediction)或帧间预测(inter prediction)对双向预测(Bi-predictive，B)条带中的块进行编码，其中使用至多两个运动向量以及参考索引来预测每一帧间编码块中的采样值 (sample value)。也使用帧内预测或帧间预测对预测(Predictive，P)条带中的块进行编码，但是使用至多一个运动向量以及参考索引来预测每一帧间编码块中的采样值。仅使用帧内预测对帧内(Intra，I)条带中的块进行编码。

在HEVC主规格中，CTU的最大以及最小尺寸由在序列参数集(Sequence ParameterSet，SPS)中发信的语法元素指定。使用四叉树(QuadTree，QT)拆分结构进一步将每一CTU递归地拆分成一个或多个非重叠的编码单元以适应各种局部运动以及纹理特性(texturecharacteristic)。CTU的尺寸从64×64、32×32以及 16×16像素采样中选择。在QT拆分结构的每一深度处，N×N块是单个叶CU 或者拆分成具有等尺寸N/2×N/2的四个较小块。具有尺寸M×M像素采样的CTU 是四叉树编码树的根节点(root node)，以及四个M/2×M/2块是从根节点拆分的子四叉树节点(child quadtree node)。四个M/2×M/2块的每一个可以成为另一个拆分成四个子节点的父节点，该子节点在每一空间维度具有减少一半的尺寸。如果编码树节点没有进一步拆分，则它是叶CU。叶CU尺寸被限制为大于或等于最小允许的CU尺寸，以及在SPS中指定最小以及最大CU尺寸。在图1中示出了递归四叉树拆分结构的示例，其中实线指示CTU 100中的CU边界。

一旦CTU被拆分成多个叶CU，每一叶CU根据用于预测的预测单元(PredictionUnit，PU)拆分类型被进一步拆分成一个或多个PU。图2示出了在 HEVC标准中定义的8种不同的PU拆分类型。根据图2中示出的8种PU拆分类型之一，每一CU被拆分成一个、两个或4个PU。不同于CU的递归四叉树拆分，每一叶CU可以仅被拆分一次来形成PU。因为相同的预测进程应用于PU 中的所有像素，PU作为共享预测信息的基础代表块(basic representativeblock)。在PU的基础上将预测信息传达到解码器。

在获得基于PU拆分类型的预测进程所生成的残差数据后，根据残差四叉树(Residual QuadTree，RQT)拆分结构，将属于叶CU的残差数据拆分成一个或多个TU，以将残差数据转换成用于紧凑数据表示的转换系数。图1中的虚线指示 CTU 100中的TU边界。TU是将转换与量化应用于残差数据或转换系数的基础代表块。对于每一TU，具有与TU相同尺寸的转换矩阵被应用于残差数据来生成转换系数，以及在TU的基础上量化这些系数并将其传达到解码器。4:2:0色彩格式中视频图像的每一TU由尺寸8×8、16×16或32×32的亮度采样的一个转换块(Transform Block，TB)或尺寸4×4亮度采样的四个TB以及色度采样的两个对应的TB组成。在SPS中指定了最小以及最大TB尺寸。

术语CTB(coding tree block，编码树块)、CB(coding block，编码块)、 PB(prediction block，预测块)以及TB被定义为指定分别与CTU、CU、PU以及 TU有关的一个色彩分量的二维(2-D)采样数组。例如，一个CTU包含一个亮度 CTB、两个色度CTB以及其相关的语法元素。类似的关系对CU、PU以及TU 是有效的。在HEVC***中，除非达到了色度块的最小尺寸，否则相同的四叉树拆分结构通常应用于亮度以及色度分量两者。

二叉树(binary-tree，BT)拆分结构是四叉树拆分结构的可替换结构，其递归地将块拆分成两个较小的块。图3示出了二叉树拆分结构的6种示例性拆分类型，其包括对称拆分类型31与32以及非对称拆分类型33、34、35以及36。最简单的二叉树拆分结构是对称水平拆分类型21以及对称垂直拆分类型31。对于尺寸M×N的给定块，发信第一旗标来指示块是否被拆分成两个较小块，如果第一旗标指示拆分，紧接着发信指示拆分类型的第二旗标。如果拆分类型是对称水平拆分，这一M×N块被拆分成尺寸为M×N/2的两个块。这一拆分进程可以重复直到拆分块的块尺寸、宽度或高度达到在高层级语法集(如SPS)中定义的最小块尺寸、宽度或高度。因为二叉树拆分结构能够水平地或垂直地拆分块，需要指示最小块宽度以及高度两者。如果块高度小于最小块高度意味着不允许水平拆分，以及类似地，如果块宽度小于最小块宽度意味着不允许垂直拆分。

图4A以及图4B示出了根据二叉树拆分结构以及其对应的编码树结构的块拆分的示例。在图4B中，在二叉树编码树的每一拆分节点(也就是，非叶节点) 的一个旗标用于指示拆分类型，旗标值等于0指示对称水平拆分，而旗标值等于1指示对称垂直拆分。

ITU-T SG16WP3以及ISO/IEC JTC1/SC29/WG11的联合视频专家组(Joint VideoExpert Team，JVET)目前正在开发名为多功能视频编码(Versatile Video Coding，VVC)的下一代视频编码标准。在联合勘探模块(Joint Exploration Model， JEM)以及VVC工作草案(WD)1中已采用了一些有前途的新编码工具用于进一步研究。JEM中采用了一种称为四叉树加二叉树(Quadtree plus Binary Tree， QTBT)结构的新拆分结构来平衡四叉树拆分结构以及二叉树拆分结构的编码效率以及编码复杂性之间的权衡。图5A示出了示例性的QTBT结构，其中CTU 首先由四叉树拆分结构拆分然后由二叉树拆分结构拆分。CU可以由四叉树拆分结构递归地拆分直到当前CU尺寸达到最小四叉树叶节点尺寸。如果叶四叉树块尺寸不大于最大的二叉树根节点尺寸，每一叶四叉树块可以由二叉树结构进一步拆分。可以递归地应用二叉树拆分直到当前CU尺寸、宽度或高度达到最小二叉树叶节点尺寸、宽度或高度或者二叉树深度达到最大二叉树深度。在JEM中，仅对称水平拆分以及对称垂直拆分是两个允许的二叉树拆分类型。从JEM中 QTBT拆分生成的叶CU是用于预测以及转换处理两者而没有任何进一步的拆分的基础代表块，其意味着每一CU恰好包含用于预测处理的一个PU以及每一 CU恰好包含用于转换处理的一个TU。与HEVC相反，没有额外的信息用于指定从CU到多个PU以及从CU到多个TU的拆分结构。

图5A示出了根据QTBT拆分结构的块拆分结构的示例以及图5B示出了图 5A中示出的QTBT拆分结构的对应的编码树图。图5A以及图5B中的实线指示四叉树拆分而虚线指示二叉树拆分。类似于图4B，在二叉树结构的每一拆分节点(也就是，非叶节点)，一个旗标指示使用了哪一拆分类型，0表示对称水平拆分以及1指示对称垂直拆分。在QTBT拆分结构中，在高层级语法中(如在SPS 中)指示了最小的四叉树叶节点尺寸、最大二叉树根节点尺寸、最小二叉树叶节点宽度与高度以及最大二叉树深度与高度。在P以及B条带中，每一CTU由三个色彩分量的CTB组成。在I条带中，三个色彩分量的CTB分别由两个CTU 表示，一个CTU用于亮度CTB以及另一个CTU用于两个色度CTB。单独地控制两个CTU的拆分结构以及为每一CTU发信指示从CTU到多个CU的拆分的编码树表示。每一亮度CU包含来自亮度分量的一个CB而每一色度CU包含分别来自色度cb以及色度cr分量的两个CB。对于在I条带中编码的CTU，用于每一色度CTU的编码树表示可能不同于用于对应亮度CTU的编码树表示。对P 以及B条带中编码的CTU，相同的编码树表示应用于色度CTB以及亮度CTB 两者。

VVC中采用的多类型树(Multi-Type-Tree，MTT)拆分结构通过允许MTT拆分结构的第二层级中的二叉树拆分以及三叉树拆分两者，扩展了QTBT拆分树结构中两层级树结构的概念。MTT中树的两层级也分别称为区域树(Region Tree， RT)以及预测树(PredictionTree，PT)。第一层级RT总是QT拆分，而第二层级 PT是BT拆分或中心侧三叉树拆分(Triple-Tree，TT)。例如，CU首先由RT拆分，即QT拆分，以及每一RT叶节点可以进一步由PT拆分，PT是BT或TT 拆分。由PT拆分的块可以进一步用PT拆分直到达到最大PT深度。PT叶节点是用于预测以及转换的叶CU，并且不会被进一步拆分。图6示出了MTT拆分结构中所使用的5种拆分类型，其中拆分类型包括QT拆分类型61、BT拆分类型62与63以及TT拆分类型64与65。垂直中心侧TT拆分类型64与水平中心侧TT拆分类型65将块拆分成三个较小块，所有块在一个空间维度具有减小的尺寸而在另一个空间维度保持相同的尺寸。

HEVC标准中的编码块旗标(coded block flag，cbf)用于指示转换块中是否有任何非0系数，以及当cbf等于1，相关转换块包含至少一个非0系数，否则，不进一步对相关的转换块进行编码并且转换块中所有系数被推断为0。在HEVC 中，发信语法元素cbf_luma、cbf_cb以及cbf_cr来分别从亮度、cb以及cr分量中推导转换块的cbf。在帧间编码的CU中利用语法元素rqt_root_cbf(residual quadtree root cbf，残差四叉树根cbf)简要地指示帧间编码的CU中的转换块的所有编码块旗标是否都为0。例如，当rqt_root_cbf等于1时，该CU中一转换块的至少一个cbf为1，而当rqt_root_cbf等于0时，不对该CU中多个转换块的所有编码块旗标进行编码并且推断为0。在VVC WD1中，在CU的视频流中存在类似的语法元素cu_cbf(coding unit coded block flag，编码单元编码块旗标)来指示与该CU相关的所有编码块旗标是否为0。

在HEVC标志中定义的另一语法元素cu_skip_flag被发信于用于帧间预测条带中的每一CU来指示当前CU是否在跳过模式(MODE_SKIP)中进行编码。当 cu_skip_flag是1，表示当前CU在跳过模式中进行编码，对于当前CU，除了运动向量合并候选索引(merge_idx)之外没有其他语法元素被编码。从所选择的相邻帧间预测的分区中推断在跳过模式中编码的当前CU的帧间预测参数，以及当前CU的相关参考被推断为等于0。

发明内容

视频编解码***中视频处理的方法及装置，包括接收与当前条带中当前CU 有关的输入视频数据，确定该当前CU的尺寸是否大于最大尺寸阈值，当该当前 CU的该尺寸大于该最大尺寸阈值时，将该当前CU的残差设置为0，以及对该当前条带中该当前CU进行编码来形成视频比特流，或者对来自该视频比特流的该当前条带中的该当前CU进行解码。该当前条带由递归拆分结构(如四叉树、 QTBT、MTT或其他拆分结构)拆分成多个非重叠的CU，以及每一CU仅包含一个转换单元(TU)。该当前CU作为预测以及转换处理两者的基础代表块，因此其不被拆分成多个较小块用于预测以及转换处理。

该当前CU的该尺寸以及该最大尺寸阈值以一维或二维进行测量，例如，当以一维测量该尺寸时，该当前CU的该尺寸是该当前CU的宽度或高度，以及当以二维测量该尺寸时，该当前CU的该尺寸是面积。在一些实施例中，该当前 CU中的当前TU包含一个亮度TB以及两个色度TB，以及当该当前CU大于该最大尺寸阈值时，将亮度以及色度TB中所有系数层级值设置为0。

当该当前CU的该尺寸大于该最大尺寸阈值时，视频编码器跳过发信与该当前CU的相关残差有关的信息，以及当该当前CU的该尺寸大于该最大尺寸阈值时，对应的视频解码器推断该当前CU的该相关残差等于0。

可以在该视频比特流的高层级语法集中显示发信或隐式推导该最大尺寸阈值。在一些示例中，设置该最大尺寸阈值或从最大转换尺寸推导该最大尺寸阈值，以及该最大转换尺寸是最大转换单元尺寸或最大转换块尺寸。

在一个特定实施例中，当该当前CU大于该最大尺寸阈值时，通过选择跳过模式对该当前CU进行编码或解码，视频编码器或解码器将该当前CU的残差设置为0。在这一实施例中，当该当前CU的尺寸大于该最大尺寸阈值，该当前 CU推断为由跳过模式进行编码，当该当前CU的尺寸大于该最大尺寸阈值时，因为视频解码器推断跳过旗标为1，该视频编码器可以跳过发信跳过旗标 (cu_skip_flag)。

当该当前CU的尺寸大于该最大尺寸阈值时，示例性视频编码器或解码器通过将该当前CU中一个或多个TB的cbf设置为0，来将该当前CU的残差设置为0。当TB的cbf等于0时，推断TB中所有系数层级值为0。当该当前CU的尺寸大于该最大尺寸阈值时，编码器可以跳过发信该当前CU中TB的cbf，因此对应的解码器推断该cbf等于0。类似地，当该当前CU的尺寸大于该最大尺寸阈值时，编码器可以跳过发信残差四叉树根cbf、CU预测模式旗标以及合并旗目标一个或其组合，以及对应的解码器推断该残差四叉树根cbf等于0，CU 预测模式旗标为帧间预测模式，以及该合并旗标为不在合并模式中编码。

视频处理方法的变体不仅将该当前CU的该尺寸与该最大尺寸阈值进行比较，还将该当前CU的该尺寸与最小尺寸阈值进行比较。当该当前CU的该尺寸小于该最小尺寸阈值时，将该当前CU的残差设置为0。在视频比特流的高层级语法集中显示发信或隐式推导该最小尺寸阈值。例如，设置该最小尺寸阈值或者从指定最小转换尺寸推导该最小尺寸阈值。

在一些实施例中，该当前条带是B条带或P条带，因此仅允许B条带以及P条带中的CU以大于最大尺寸阈值的尺寸进行编码。I条带中的CU被限制为尺寸小于或等于最大尺寸阈值。在一些其他实施例中，仅允许帧间编码的CU具有大于该最大尺寸阈值的尺寸，而所有帧内编码的CU被限制为具有小于或等该最大尺寸阈值的尺寸。当该当前CU的尺寸大于该最大尺寸阈值时，用具有0 残差的跳过模式或AMVP模式对该当前CU进行编码。

根据一个实施例，在视频比特流中发信额外的语法元素指示是否允许大尺寸CU，以及如果该语法元素指示不允许大尺寸CU，当该当前CU的该尺寸大于该最大尺寸阈值时，该视频编码器或解码器强制将该当前CU拆分成多个较小的CU。

本发明方面进一步提供了视频编解码***中用于处理视频的装置，其包括一个或多个电子电路，用于接收与当前CU有关的输入数据，确定该当前CU的尺寸是否大于最大尺寸阈值，当该当前CU的该尺寸大于该最大尺寸阈值时，将该当前CU的残差设置为0，在没有进一步拆分的情况下，通过预测以及转换处理对该当前CU进行编码或解码。

本发明的各方面进一步提供了存储程序指令的非暂态计算机可读媒介，该程序指令使得装置的处理电路执行视频编码处理，当该当前CU的尺寸大于该最大尺寸阈值时，通过将该当前CU的残差设置为0来对当前CU进行编码或解码。在阅读后续描述以及具体实施例后，本发明的其他方面及特征对本领域技术人员将是显而易见的。

本发明当编码单元的尺寸大于最大尺寸阈值或最小尺寸阈值时，将编码单元的残差设置为0，对具有0残差的编码单元进行编码以避免需要对大尺寸编码单元进行进一步拆分，降低了编码复杂度，提高了压缩效率。

附图说明

将参考以下附图详细描述作为示例提出的本发明的各种实施例，其中相同的附图标记表示相同的组件，以及其中：

图1示出了根据四叉树拆分结构的将CTU拆分成CU以及将每一CU拆分成一个或多个TU的示例性编码树。

图2示出了在HEVC标准中定义的用于将CU拆分成一个或多个PU的8 种不同的PU拆分类型。

图3示出了二叉树拆分结构的6种示例性拆分类型。

图4A示出了根据二叉树拆分结构的一示例性块拆分结构。

图4B示出了对应于图4A中示出的二叉树拆分结构的编码树结构。

图5A示出了根据QTBT拆分结构的示例性块拆分结构。

图5B示出了对应于图5A的QTBT拆分结构的编码树结构。

图6示出了示例性MTT拆分结构中所使用的5种拆分类型。

图7示出了用于对当前条带中当前CU进行编码或解码的视频处理方法的一个实施例的流程图。

图8示出了用于对当前条带中当前CU进行编码或解码的视频处理方法的另一个实施例的流程图。

图9示出了根据本发明实施例的结合视频处理方法的视频编码***的示例性***框图。

图10示出了根据本发明实施量的结合视频处理方法的视频解码***的示例性***框图。

具体实施方式

容易理解的是，如在此描述及在附图中示出的，本发明的组件可以以多种的不同配置进行排列和设计。如在附图所示出的本发明的***及方法的实施例的后续更具体的描述不旨在限制所要求保护的本发明的范围，而是仅代表本发明的所选实施例。

在整个说明书提及的“一个实施例”、“一些实施例”或者类似的语言意味着结合实施例描述的特定特征、结构或者特性可以包括于本发明的至少一个实施例中。因此，贯穿本说明书各个地方的短语“在一个实施例中”或者“在一些实施例中”的出现并不所有都指同一个实施例，这些实施例可以单独地或结合一个或多个实施例来实施。此外，所描述的特征、结构或特性可以在一个或多个实施例中以任何合适的方式组合。然而，本领域技术人员将认识到到，本发明可以在没有一个或多个具体细节或利用其他方法、组件等等的情况下实施，在其他实施例中，没有详细示出或描述公知的结构或操作以避免混淆本发明的各方面。

下一代视频压缩标准VVC WD1中的CU被设计为用于预测以及转换操作两者的基础代表块，因此每一CU恰好包含用于预测操作的一个PU以及恰好包含用于转换操作的一个TU。HEVC所支持的CTU尺寸多达64×64亮度采样以及由HEVC标准支持的转换块尺寸多达32×32采样。下一代视频压缩标准希望允许较大CTU尺寸以及转换块尺寸的使用以用于高分辨率视频应用，例如，JEM 中CTU尺寸高达256×256采样以及最大TU尺寸是128×128亮度采样，以及 VVC WD1支持CTU尺寸高达128×128亮度采样以及TU尺寸高达64×64亮度采样。因为随着转换块尺寸的增加，与转换处理有关的硬件实施复杂度以及计算成本趋向于显着扩展，最大转换尺寸被指定以限制TU尺寸。理论上，因为 CTU可以仅包括一个CU，最大CU尺寸与指定的CTU尺寸相同。然而，当一个CU仅包括一个TU时，具有最大CU尺寸(例如，在VVC WD1中定义的 128×128亮度采样)的CU在其超过最大TU尺寸(例如，在VVC WD1中定义的 64×64亮度采样)时被强制拆分成多个较小的CU。

在HEVC中，在SPS中指定都以亮度采样为单元中的CTU尺寸以及最大 TU尺寸，如果当前CU尺寸大于指定的最大TU尺寸，当前CU的残差强制被拆分成四个TU。当TU的块尺寸大于最大TU尺寸时，用于指示是否拆分TU 的相关语法split_transform_flag没有被编码并被推断为等于1。在正在开发的下一代视频压缩标准中，因为CU仅包括一个TU，宽度或高度大于最大TU尺寸的宽度或高度的大尺寸CU强制被拆分成较小的CU，直到每一CU小于或等于最大TU尺寸。这种用于处理大尺寸CU的强制拆分解决方法根据最大TU尺寸来减小最大CU尺寸。处理这些大尺寸CU的可替代解决方法是允许“一个CU 包含一个TU规则”的例外，也就是每一大尺寸CU包含多个TU而不是一个TU，以及每一TU的尺寸小于或等于最大TU尺寸。因为强制拆分解决方法避免使用大尺寸CU以及另一种解决方法违反了一个CU包含一个TU规则，另一种解决方法意味着更多的比特用于发信每一大尺寸CU中的多个TU，这两种解决方法可能会导致所生成的比特流的压缩率的损失。

对于大尺寸CU，残差被推断为0。本发明中视频编码器或视频解码器的各种实施例能够使用大尺寸CU以及同时遵循一个CU包含一个TU的规则对视频数据进行编解码，同时维持与转换处理相关的相当的实施复杂度以及计算成本。实施0残差方法的实施例的视频编码器或解码器可以在不支持与增加的转换尺寸有关的额外处理模块的情况下，使用大尺寸CU对视频数据进行编码或解码。大尺寸CU定义为尺寸大于最大尺寸阈值的CU。最大尺寸阈值的一示例是设置为指定的最大转换尺寸，如在HEVC标准中的32×32亮度采样或VVC WD1中给的64×64亮度采样。因为CU是用于预测以及转换处理的基础代表单元，编码器或解码器能够处理大尺寸CU表示具有能力来处理尺寸大于指定最大转换尺寸的转换块。根据该0残差方法，当当前CU的尺寸大于最大尺寸阈值时，视频编码器或解码器将当前CU的残差设置为0。可以在高层级语法集(例如SPS、 PPS以及条带数据头)中明确发信或者可以隐式推导最大尺寸阈值。在一些实施例中，设置最大尺寸阈值或者从最大转换尺寸推导最大尺寸阈值，例如设置最大尺寸阈值小于或等于最大转换尺寸以确保大于最大转换尺寸的转换块包含所有0系数。设置当前CU的残差等于0意味着当前CU中的每一TB仅包含0系数。可以跳过仅具有0系数的TB的量化以及转换处理。这样，视频编码器或解码器可以使用大尺寸CU来表示视频数据而不需要进一步支持与增加的转换尺寸有关的额外处理模块。

0残差方法的优点是给编码器提供了灵活性来根据率失真优化 (rate-distortion)或复杂度性能选择以具有0残差的大尺寸CU或者将大尺寸CU 拆分成正常尺寸CU的方式对视频数据进行编码。正常尺寸CU是尺寸小于或等于最大尺寸阈值的CU，以及允许这些正常尺寸CU中的对应的TB具有非0系数。这与总是递归地强制拆分大尺寸CU直到所有相关的TB的尺寸小于或等于最大转换尺寸的传统方法形成对比。本发明中最大转换尺寸可以指最大TU尺寸或最大TB尺寸。在本发明中，可以以二维或一维测量尺寸，当在二维测量尺寸时，CU的面积与最大转换面积进行比较；以及当在一维测量尺寸时，CU的宽度以及高度与最大转换尺寸进行比较以确定这一CU是否是大尺寸CU。例如，如果当前CU的宽度以及高度的一个或两个大于最大转换尺寸，该当前CU是大尺寸CU以及该当前CU的残差被设置为0。

在0残差方法中，如果当前CU是大尺寸CU，将当前CU的残差设置为0，以及当前CU可以以帧间预测模式或帧内预测模式进行编码。当CU预测模式是帧间预测时，视频编码器可以选择高级运动向量预测(Advance Motion Vector Prediction，AMVP)模式或跳过模式来对大尺寸CU进行编码。当选择跳过模式用于大尺寸CU时，视频编码器仅发信运动向量合并候选索引来指示相邻帧间预测的分区，以及视频编码器从相邻帧间预测的分区推导运动信息。当选择AMVP 模式时，视频编码器发信运动向量差(Motion Vector Difference，MVD)与指示向量帧间预测的分区的运动向量预测子(Motion Vector Predictor，MVP)索引，以及视频解码器通过将MVD与相邻帧间预测的分区的MVP相加来推导大尺寸CU 的运动向量(Motion Vector，MV)。在一个实施例中，0残差方法仅应用于使用帧间预测编码的CU，使用帧内预测编码的所有CU被限制为具有小于或等于最大尺寸阈值的尺寸。在另一实施例中，0残差方法仅应用于B条带以及P条带中的CU，I条带中的所有CU被限制为具有小于或等于最大尺寸阈值的尺寸。

在用于实现进一步比特率降低的一些实施中，当当前CU的宽度、高度或面积大于最大转换尺寸，视频编码器跳过发信与当前CU的残差相关的信息。当当前CU的宽度、高度或面积大于最大转换尺寸时，对应的视频解码器推断当前 CU的残差等于0。

在一个特定示例中，在采用所公开的0残差方法后，视频编码器可以对尺寸大于128×128的CU进行编码而不需要进一步实施用于在宽度与高度上256 采样的转换块的额外的转换处理模块，其中该视频编码器支持256×256采样的 CTU尺寸以及在宽度与高度两者上128采样的最大TU尺寸。在采用所公开的0 残差方法后，对应的视频解码器也可以对尺寸大于128×128采样的CU进行解码而不需要实施用于256×256采样的转换块尺寸的额外的转换处理模块。

图7示出了视频编解码***中用于处理视频数据的0残差方法的流程图。在步骤S702中，示例性的编码器或解码器接收与当前条带中当前CU有关的输入视频数据或者从视频比特流接收与当前条带中当前CU有关的编码的视频数据。该当前CU是从该当前条带拆分的叶CU，其中根据四叉树拆分结构、QTBT 拆分结构、MTT拆分结构或者其他递归拆分结构，该当前条带被拆分成多个非重叠CU。在步骤S704中，编码器或解码器将该当前CU的尺寸与最大尺寸阈值进行比较，并在步骤S706中，确定该当前CU的该尺寸是否大于该最大尺寸阈值。最大尺寸阈值的示例设置为等于最大转换尺寸。如果该当前CU的所述尺寸大于所述最大尺寸阈值，在步骤S708中，编码器或解码器将该当前CU的残差设置为0。该当前CU可以仅包含一个TB或其可以包含两个或多个TB，如一个亮度TB与两个色度TB。在一些实施例中，通过将与每一TB有关的每一 cbf设置为0或者将残差四叉树根cbf设置为0，该当前CU中所有TB中的系数层级值被推断为0。在步骤S710中，通过预测以及转换处理对该当前CU进行编码或解码，而不需要进一步拆分。在步骤S708中，将该当前CU的残差设置为0指该当前TU中所有系数层级值是0以及跳过了转换处理中复杂的计算。

用于小尺寸CU的0残差方法在一个实施例中，0残差方法可以应用于极其小尺寸的CU，其中小于最小尺寸阈值的当前CU的残差被设置为0。对于那些极其小的尺寸CU，预测更有可能具有高精度，因此期望残差较小。视频编码器或解码器强制这些小尺寸CU的残差以及相关的系数层级值等于0。通过强制所有极其小尺寸CU的残差为0，可以节省用于发信以及处理这些极其小尺寸 CU的大量的数据比特与计算。最小尺寸阈值也可以在高层级语法集(如SPS、 PPS以及条带数据头)中被显示发信或者隐式推导。本实施例中的视频编码器或解码器将当前CU的尺寸与最大尺寸阈值以及最小尺寸阈值两者进行比较，以及如果当前CU大于最大尺寸阈值或小于最小尺寸阈值，设置0残差或0系数层级值。

对于大尺寸CU，编码模式推断为跳过模式0残差方法的一个特定实施例是跳过模式方法。在跳过模式方法中，视频编码器以及解码器总是选择跳过模式用于对B以及P条带中的大尺寸CU进行编码或解码。本发明中的大尺寸CU 可以被定义为尺寸大于最大尺寸阈值的CU，或者大尺寸CU可以被定义为尺寸在指定尺寸范围内的CU。示例性指定尺寸范围包括大于最大尺寸阈值的任何尺寸或者小于最小尺寸阈值的任何尺寸。该指定尺寸范围可以从在高层级语法集 (如SPS、PPS以及条带数据头)中发信的一个或多个语法元素推导。该指定尺寸范围可以与CU的总像素采样、宽度或高度有关。跳过模式是HEVC中有效的帧间预测编码模式，其表示许多CU在B以及P条带中精确运动补偿预测后具有低能量的残差信号。因为当当前CU在跳过模式中进行编码时，在比特流中既不计算也没有发信当前CU的残差以及MVD，相比于其他编码模式，跳过模式通常涉及相对较低的比特成本以及计算与实施复杂性。视频编码器或解码器的实施例有效地使用跳过模式来提高在压缩效率方面的的编码性能并降低视频编码***中计算与硬件复杂性。

在跳过模式方法的一些实施例中，对于每一大尺寸CU，视频编码器或解码器跳过信令或者跳过编码或解码跳过旗标，如语法元素cu_skip_flag。对于当CU 的尺寸大于最大尺寸阈值或者在指定尺寸范围内时的CU，这一跳过旗标推断为等于1。跳过模式方法限制大尺寸CU在跳过模式中进行编码，从而降低与CU 模式决策有关的计算复杂性以及加快处理这些大尺寸CU的编码时间。对于在跳过模式中编码的每一大尺寸CU，仅运动向量合并候选索引被编码为残差以及 MVD总是0。大尺寸CU的帧间预测参数系从通过运动向量合并候选索引所选择的相邻帧间预测的分区被简单地推测。

在一个示例中，当当前CU的宽度、高度或面积大于B或P条带中最大尺寸阈值时，视频编码器跳过发信当前CU的语法元素cu_skip_flag。在解码器，当当前CU的宽度、高度或面积大于B或P条带中最大尺寸阈值时，推断该当前CU在跳过模式中进行编码。该示例中最大尺寸阈值是指定的最大转换尺寸，例如VVC WD1中的64×64采样。在另一实施例中，当当前CU的宽度、高度或面积大于最大尺寸阈值或小于最小尺寸阈值时，视频编码器或解码器总是选择跳过模式来对B或P条带中的当前CU进行编码。视频编码器或解码器可以进一步跳过信令或者跳过对CU的语法元素cu_skip_flag进行编码或解码，其中该CU的尺寸大于最大尺寸阈值或小于最小尺寸阈值。在又一示例中，仅应用最小尺寸阈值，因此编码器或解码器被强制在跳过模式中对尺寸小于最小尺寸阈值的多个CU进行编码。

根据跳过模式方法，当最大尺寸阈值被设置为小于或等于最大TU尺寸时，视频编码器或解码器支持对尺寸大于最大TU尺寸的CU进行编码或解码。在这一特定条件下，尺寸超过最大TU尺寸的所有CU都在跳过模式中进行编码以及相关转换块的系数层级值被推断为0。最大以及最小尺寸阈值可以在高层级语法集(例如，SPS、PPS以及条带数据头)中发信或者这些阈值可以从当前比特流的指定的最大以及最小转换尺寸中推导。

例如，理论上JEM中的最大CU尺寸等于CTU尺寸，其是256×256亮度采样，因为大于128×128亮度采样的最大TU尺寸的每一CU被拆分成小于或等于最大TU尺寸的多个CU，JEM中的实际最大CU尺寸减少为128×128亮度采样。通过实施所公开的0残差方法或跳过模式方法，修正的视频编码器或解码器可以对宽度或高度大于128亮度采样的大尺寸CU进行编码以及解码。最大CU尺寸变得跟指定CTU尺寸一样大，其在这一示例中是256×256亮度采样。

用于定义大尺寸CU的额外语法元素在本发明的一方面，视频编码器在视频比特流的HLS集合中***一个或多个语法元素来发信用于推导一个或多个阈值的信息，其中该一个或多个阈值用于定义大尺寸CU、小尺寸CU或两者。阈值可以包括最大尺寸阈值、最小尺寸阈值或者最大以及最小尺寸阈值两者。在所公开的跳过模式方法的后续示例中，阈值仅包括最大尺寸阈值。视频编码器在跳过模式中对当前CU进行编码以及当当前CU的宽度、高度或面积大于阈值时，跳过发信该当前CU的CU跳过旗标。在解码器端，当该当前CU的宽度、高度或面积大于阈值时，该CU跳过旗标被推断为等于1，指示该当前CU在跳过模式中进行编码，在0残差方法的示例中，在视频比特流的HLS集合中的一个或多个语法元素中发信用于推导最大总阈值或最小总阈值的信息，以及如果当前CU中像素的总数目大于最大尺寸阈值或小于最小尺寸阈值，视频编码器或解码器通常将当前CU的残差示为0。

用于I条带或帧内编码的CU的不同方法在一些实施例中，因为在运动补偿预测后，B以及P条带中CU的残差趋向于具有低量级(magnitude)，视频编码器或解码器仅采用0残差方法用于B以及P条带中的CU。对于在I条带中编码的视频数据，视频编码器或解码器总是将包含尺寸小于最大转换尺寸的任意TB 的CU或TU拆分成较小的多个CU或多个TU。

在后续的示例中，CTU尺寸是128×128，最大转换尺寸是64×64，色彩格式是4:2:0，以及亮度采样与色度采样被编码成各自的CTU，其中亮度CTU以及色度CTU的CU拆分结构在I条带中独立地控制。在一个示例中，0残差方法仅应用于B以及P条带中的CU，因此由于CTU尺寸大于最大转换尺寸，I条带中的亮度以及色度CTU两者都强制被拆分成尺寸64×64的四个较小的CU。在将0残差方法应用于B以及P条带中CU的另一示例中，因为亮度CTU中相关的多个亮度TB大于指定的最大转换尺寸，视频编码器或解码器仅强制去拆分亮度CTU。因为色度CTU中相关的色度转换块等于最大转换尺寸，其是64×64，不强制拆分色度CTU。

在另一个实施例中，视频编码器或解码器可以进一步施加约束，如0残差方法仅用于使用任何帧间预测模式在B或P条带中编码的CU。如果对应的TB 尺寸超出最大转换尺寸，I条带中的所有大尺寸CU以及B与P条带中所有帧内编码的大尺寸CU被强制拆分，或者在可选的实施例中，这些大尺寸CU不被强制拆分成多个小CU，但是每一大尺寸CU包含多个TU以及每一TU的尺寸小于或等于最大转换尺寸。

图8示出了仅在B以及P条带中采用0残差方法的视频处理方法实施例的流程图。在步骤S802中，示例性视频编码器或解码器接收当前条带中当前CU 的输入视频数据或者从视频比特流接收当前条带中当前CU的编码的视频数据，以及在步骤S804中，该编码器或解码器将该当前CU的尺寸与最大尺寸阈值进行比较，并确定该当前条带是否是I条带还是B或P条带。在步骤S806中，检测该当前CU的尺寸是否大于最大尺寸阈值，以及如果该该当前CU的尺寸小于或等于最大尺寸阈值，在步骤S814中，通过一个标准编码或解码进程，该编码器或解码器处理该当前CU。当该当前CU是尺寸大于最大尺寸阈值的大尺寸 CU时，步骤S808进一步检查该当前条带是否是I条带。在步骤S810中，如果该当前条带是I条带，该编码器或解码器推断将该当前CU拆分成小于或等于该最大尺寸阈值的多个CU。如果当前条带是B或P条带，在步骤S812中，该编码器或解码器将该当前CU的残差设置为0。在步骤S814中，通过预测以及转换处理对该当前CU进行编码或解码，或者如果该当前CU不是叶CU，进一步拆分该当前CU。在采用跳过模式方法的视频处理方法的另一个实施例中，当该当前CU是大尺寸CU以及该当前条带是B或P条带时，可以通过推断该当前 CU的编码模式为跳过模式来替换图8中的步骤S812。

仅编码器的方法所公开的0残差方法以及所公开的跳过模式方法的一些实施例被实施为仅编码器的方法，因此对应的解码器不需要修正它的解析以及解码算法。如果当前CU的宽度、高度或面积大于最大尺寸阈值，视频编码器的一个实施例强制将该当前CU的预测残差设置为等于0，以及视频编码器用0残差方法的当前CU进行编码。视频编码器可以将与该当前CU中每一TB相关的cbf 设置为等于0以跳过转换以及量化处理。最大尺寸阈值可以从指定的最大转换尺寸中推导。视频编码器的另一个实施例通过施加比特流约束来实施所公开的0 残差方法，以致当该当前CU的宽度、高度或面积大于最大尺寸阈值时，相关的语法值限制为发信0残差给当前CU。视频编码器也可以施加比特流约束来限制转换块中的系数层级值，当该转换块的宽度、高度或面积大于最大尺寸阈值时，该系数层级值等于0。以上所公开的在视频编码器中实施的实施例每一修正现有语法，因此不需要改变解码算法。

使能所公开的方法或控制最大转换尺寸的语法元素本发明一方面在比特流中高层级语法(HLS)(如序列参数集(SPS)、图像参数集(PPS)以及条带数据头) 中引入了一个或多个额外的语法元素来控制一个或多个所公开方法的使用。该一个或多个语法元素可以用于指示是否使能或禁用具体的所公开的方法，其支持对大尺寸CU进行编码而不需要进一步拆分，大尺寸CU包含宽度、高度或面积大于最大转换尺寸的多个转换块。在另一个实施例中，一个或多个HLS语法元素可以发信用于推导最大转换尺寸的信息，最大转换尺寸可以是最大TB尺寸与最大TU尺寸的一个或两者。对于宽度与高度，可以分别发信用于推导最大转换尺寸的信息。当可以选择不同的CU拆分结构用于亮度以及色度分量时，对亮度转换块以及色度转换块，可以分别地发信用于推导最大转换尺寸的信息。可以从相关亮度与色度TB的最大TB尺寸中推导最大TU尺寸。对于I条带以及 B与P条带，可以在SPS或PPS中分别发信用于推导最大转换尺寸的信息，以致可以为不同的条带类型选择不同的CU拆分结构。可以在条带数据头中发信用于推导最大转换尺寸的信息来允许来条带到条带适应性地调整CU拆分结构。

用于跳过某些语法元素的一些特定示例通过使用QT结构、QTBT结构、 MTT结构或其他递归性拆分结构，首先将每一视频图像拆分成多个非重叠的 CTU，然后将每一单个CTU拆分成一个或多个非重叠的CU，视频编码器或解码器的实施例对视频数据进行编码或解码。每一CU不仅作为预测处理的基础单元而且也是转换处理的基础单元，换句话说，每一CU恰好包含一个TU。为B 以及P条带中每一CU发信语法元素cu_skip_flag来指示当前CU是否在跳过模式中进行编码，其中cu_skip_flag等于1表示该当前CU在跳过模式中进行编码。当当前CU没有在跳过模式中进行编码，cu_skip_flag等于0时，发信语法元素 pred_mode_flag来指示该当前CU是否在帧间预测或帧内预测中进行编码，以及当该当前CU在帧间预测中进行编码时，进一步发信语法元素merge_flag来指示该当前CU是否在合并模式中进行编码，合并模式具有从指示的相邻帧间预测的分区中推断的相关帧间预测参数。在0残差方法的第一实施例中，每一大尺寸CU的预测残差设置为0，当当前CU的尺寸大于最大尺寸阈值时，视频编码器跳过发信该当前CU中每一转换块的cbf，以及当该当前CU的尺寸大于最大尺寸阈值时，视频解码器推断该当前CU中每一转换块的相关cbf等于0。在0 残差方法的第二实施例中，当当前CU的尺寸大于最大尺寸阈值时，视频编码器跳过发信该当前CU的相关语法元素rqt_root_cbf或cu_cbf，以及当该当前CU 的尺寸大于最大尺寸阈值时，视频解码器推断该当前CU的相关rqt_root_cbf或cu_cbf等于0。在0残差方法的第三实施例中，当当前CU的尺寸大于最大尺寸阈值时，视频编码器跳过发信B以及P条带中CU预测模式旗标(也就是 pred_mode_flag)。当该当前CU的尺寸大于最大尺寸阈值时，视频解码器推断 CU预测模式为帧间预测。在0残差方法的第四实施例中，当当前CU的尺寸大于最大尺寸阈值时，视频编码器跳过发信合并旗标(也就是merge_flag)，以及当该当前C的尺寸大于最大尺寸阈值时，对应的视频解码器推断合并旗标为0，指示该当前CU不在合并模式中进行编码。在第三以及第四实施例中，0残差方法仅应用于帧间预测的CU，更具体地，第三实施例中的大尺寸CU可以仅由具有 0残差的跳过模式或AMVP模式进行编码。在0残差方法的优选实施例中，视频编码器跳过发信每一大尺寸CU的所有cbf、rqt_root_cbf或cu_cbf、 pred_mode_flag以及merge_flag，以及视频解码器推断cbf以及rqt_root_cbf或 cu_cbf为0，推断预测模式为帧间预测，以及推断合并旗标为不在合并模式中进行编码。在跳过模式方法的实施例中，当当前CU的尺寸大于最大尺寸阈值时，视频编码器跳过发信CU跳过旗标(也就是cu_skip_flag)，以及当该当前CU的尺寸大于最大尺寸阈值时，视频解码器推断CU跳过旗标为1，指示该当前CU在跳过模式中进行编码。上述实施例可以单独地或与其他实施例结合来实施。在上述实施例中，最大尺寸阈值可以简单的是最大转换尺寸，以及最大尺寸阈值可以在视频比特流中明确发信或隐式推断。

为单个色彩分量考虑TB尺寸在另一个实施例中，视频编码器以及解码器基于对应的色彩分量的相关转换块的尺寸决定拆分大尺寸CU。不同于先前所描述实施例中的将CU的尺寸与最大尺寸阈值进行比较，其将每一单个TB的尺寸与最大尺寸阈值进行比较。该最大尺寸阈值可以被设置为等于由具体编码标准指定的最大转换尺寸或者该最大转换尺寸中推导。在这一实施例中，亮度采样以及色度采样可以被编码为各自的CTU，其中单独地控制亮度CTU以及色度 CTU的CU拆分结构，以及为每一CTU发信指示CU拆分结构的编码树表示。一个示例是由JEM采用I条带的CU/TU结构，JEM允许为每一亮度CTU以及它对应的色度CTU发信不同的编码树表示。示例性视频编码器或解码器采用CU 作为转换处理的基础代表单元，因此每一CU恰好包含一个TU，以及视频编码器或解码器使用QT结构、QTBT结构、MTT结构或其他递归拆分结构将CTU 拆分成多个CU。来自一个亮度分量以及两个色度分量的像素采样由各自的CU 表示。一个亮度CU包含一个亮度TB，而一个色度CU包含两个色度TB。亮度 TB的尺寸可以不同于相关色度TB的尺寸，因此当亮度TB的尺寸大于最大尺寸阈值时，色度TB的尺寸可以不超过最大尺寸阈值。例如，64×64亮度TB超出HEVC最大转换尺寸(也就是32×32)，但根据4:2:0色彩格式，每一相关的 32×32色度TB在HEVC最大转换尺寸范围内。当当前CU中相关的转换块的宽度、高度或面积大于最大尺寸阈值时，视频编码器强制将当前CU拆分成多个较小尺寸的CU。强制拆分决定可以由视频解码器隐式推导或明确地发信到视频解码器。例如，通过根据相关转换块尺寸推断该强制拆分决定或根据拆分旗标，视频解码器拆分该当前CU。

在一个特定示例中，使用以亮度采样为单元的256×256的CTU尺寸对4:2:0 色彩格式的视频图像进行编码，以及指定的最大转换尺寸在宽度以及高度上均等于128采样。当视频编码器或解码器处理具有256×256尺寸的亮度CTU时，因为对应的转换块尺寸256×256大于最大转换尺寸，视频编码器或解码器强制将每一亮度CTU拆分成四个四分之一大小的亮度CU。基于编码器算法(如率失真优化)，四个四分之一大小的亮度CU可以进一步拆分成多个甚至更小尺寸的 CU，以及最终的CU拆分结构可以被发信到解码器。因为4:2:0格式在色度分量上应用2:1的下采样(down sampling)，对应的色度CTU的每一相关TB的最大尺寸是128×128。因为每一相关的色度TB未超过最大转换尺寸，视频编码器或解码器将不强制拆分色度CTU。视频编码器具有灵活性来决定使用单个CU还是进一步拆分成较小尺寸的CU来对每一色度CTU进行编码。在这一示例中，因为色度CTU可以被编码为一个单个CU，仅亮度CTU需要被强制拆分。与之相比，在指定的最大转换单元尺寸等于I条带中128×128采样的情况下，传统的编码器或解码器总是以亮度采样为单元拆分亮度CTU以及尺寸256×256的相关色度CTU两者。

示例性***框图图9示出了实施本发明各种实施例的视频编码器900的示例性***框图。CU结构拆分模块902接收视频条带的输入数据以及确定将要编码的每一条带的块拆分结构。在CU结构拆分模块902中，条带首先被拆分成多个非重叠块以及每一块进一步由递归拆分结构拆分成多个叶块，例如，根据 QTBT拆分结构或MTT拆分结构，条带中的多个CTU被拆分成多个CU。当前条带中的每一CU在帧内预测模块904由帧内预测来预测或在帧间预测模块906 中由帧间预测来预测以移除空间冗余或时间冗余。帧内预测模块904基于相同图像中重构的视频数据为当前CU提供帧内预测子。帧间预测模块906基于来自其他一个或多个图像的视频数据执行运动估计(motion estimation，ME)以及运动补偿(motioncompensation，MC)来为当前CU提供预测子。开关908选择帧内预测模块904或帧间预测模块906来提供预测子到加法器910来形成预测误差，也称为残差。当前CU的残差进一步由转换模块(T)912处理，紧接着由量化模块 (Q)914处理。已转换以及已量化残差然后由熵编码器926编码以形成视频比特流。视频比特流然后和辅助信息(side information)一起打包。当前CU的已转换以及已量化残差由逆量化模块(IQ)916以及逆转换模块(IT)918处理来恢复预测残差。如图9所示，通过在重构模块(REC)920添加回所选择的预测子来恢复残差，以生成重构的视频数据。重构的视频数据可以存储于参考图像缓冲器 (Ref.Pict.Buffer)924中并由帧间预测模块906使用以用于其他图像的预测。由于编码处理，来自REC920的重构视频数据可能受到各种损害，因此，在存储到参考图像缓冲器924之前将至少一个环路处理滤波器(滤波)922应用于已重构的视频数据来进一步加强质量。环路处理滤波器的一些示例是去块滤波器以及采样自我调整偏移(Sample Adaptive Offset，SAO)。根据本发明的实施例，如果当前条带中当前CU的尺寸大于最大尺寸阈值，视频编码器900将当前CU的残差设为等于0，其加速了视频编码器900，因为转换模块912以及量化模块914以及逆量化模块916以及逆转换模块914可以跳过处理所有大尺寸CU。在一些实施例中，当当前CU大于最大尺寸阈值时，视频编码器900跳过发信一个或多个语法元素，如CU跳过旗标。

在图10中示出了对由图9的视频编码器900生成的视频比特流进行解码的对应的视频解码器1000。输入到视频解码器1000的是与当前条带中CU有关的编码的视频数据，以及每一CU由熵解码器1002进行解码来解析预测信息、转换的以及量化的残差信号以及其他***信息。CU结构拆分模块1004确定每一视频条带的CU拆分。解码器1000的解码过程类似于在编码器900的重构过程，除了解码器1000仅需要帧间预测模块1008中的运动补偿预测。每一CU由帧内预测模块1006或帧间预测模块1008进行预测，以及开关1010根据解码的模式信息选择帧内预测子或帧间预测子。由逆量化模块(IQ)1016以及逆转换模块 (IT)1014恢复与每一CU有关的已转换及已量化的残差。通过在REC 1012添加回预测子重构所恢复的残差来生成重构视频。重构视频由环路处理滤波器(滤波器)1018进一步处理来生成最终的解码视频。如果当前的解码图像是参考图像，当前的解码图像的重构视频也存储于参考图像缓冲器1020中用于解码顺序中的后续图像。在一些实施例中，当仅在视频编码器900中实施0残差方法时，没有修正应用于视频解码器1000。在一些实施例中，当当前CU大于最大尺寸阈值时，视频解码器1000推断当前CU的残差为0或者推断当前CU在跳过模式中进行编码。例如，根据跳过模式方法，视频解码器1000推断大尺寸CU的 cu_skip_flag为1，或者根据0残差方法，视频解码器1000推断大尺寸CU中所有TB的cbf为0。

图9以及图10中视频编码器900以及视频解码器1000的各种组件可以由硬件组件、用于执行存储于存储器中的程序指令的一个或多个处理器，或者硬件与处理器的结合来实施。例如，处理器执行程序指令来控制接收与当前条带有关的输入数据。处理器配备有单个或多个处理核心。在一些实施例中，处理器执行程序指令来执行编码器900与解码器1000中一些组件的功能，以及电性耦合于处理器的存储器用于存储程序指令、对应于CU的重构图像的信息和/或编码或解码进程中的中间数据。一些实施例中的存储器包括非暂态计算器可读介质，例如半导体或固态存储器、随机存取存储器(RAM)、只读存储器(ROM)、硬盘、光盘或其他合适的存储介质。存储器也可以是上述列出的两个或多个非暂态计算机可读介质的组合。如图9以及图10所述，编码器900与解码器1000 可以在相同的电子装置中实施，因此如果在相同的电子装置中实施，可以共享或重新使用编码器900以及解码器1000的各种功能组件。

能够处理大尺寸CU的视频数据处理方法的实施例可以在集成到视频压缩芯片的电路或者集成到视频压缩软件的软件代码来实施，以执行以上所描述的处理。例如，可以以在计算机处理器、数字信号处理器(DSP)、微处理器或现场可程序门阵列(FPGA)上执行的程序代码中实现为当前块设置的当前模式的确定。这些处理器可以被配置于通过执行定义由本发明实施的特定方法的机器可读软件代码或固件代码来执行根据本发明的特定任务。

可以在不背离本发明精神及基本特征的情况下以其他特定形式实施本发明。所描述的示例在所有方面仅被认为是说明性的而非限制性的。因此，本发明的范围由所附权利要求而非前面的描述所指示。在权利要求等同意义和范围内的所有变化都包括在它们的范围内。

Claims

1.一种视频编解码***中的视频处理方法，其特征在于，所述方法包括：

接收与当前条带中当前编码单元有关的输入视频数据或者从视频比特流中接收与所述当前条带中所述当前编码单元有关的编码的视频数据，其中所述当前条带被拆分成多个非重叠编码单元以及每一编码单元仅包含一个转换单元；

确定所述当前编码单元的尺寸是否大于最大尺寸阈值；

当所述当前编码单元的所述尺寸大于所述最大尺寸阈值时，将所述当前编码单元的残差设置为0；以及

编码所述当前编码单元或解码所述当前编码单元，其中所述当前编码单元不会进一步被拆分成多个较小块以用于预测以及转换处理。

2.如权利要求1所述的视频编解码***中的视频处理方法，其特征在于，其以一维或在以二维测量所述当前编码单元的所述尺寸以及所述最大尺寸阈值，以及当以一维测量所述尺寸时，所述当前编码单元的所述尺寸是所述当前编码单元的宽度或高度。

3.如权利要求1所述的视频编解码***中的视频处理方法，其特征在于，其中所述当前编码单元的一个当前转换单元包含一个亮度转换块以及两个色度转换块，以及将所述当前编码单元的所述残差设置为0包括当所述当前编码单元的所述尺寸大于所述最大尺寸阈值时，将所述一个亮度转换块以及两个色度转换块中所有系数层级值设置为0。

4.如权利要求1所述的视频编解码***中的视频处理方法，其特征在于，其中编码所述当前编码单元进一步包括当所述当前编码单元的所述尺寸大于所述最大尺寸阈值时，跳过发信与所述当前编码单元的相关残差有关的信息，以及其中解码所述当前编码单元进一步包括当所述当前编码单元的所述尺寸大于所述最大尺寸阈值时，推断所述当前编码单元的所述相关残差等于0。

5.如权利要求1所述的视频编解码***中的视频处理方法，其特征在于，其中所述最大尺寸阈值在所述视频比特流的高层级语法集中被显示发信或被隐式推导。

6.如权利要求1所述的视频编解码***中的视频处理方法，其特征在于，其中设置所述最大尺寸阈值或从最大转换尺寸推导所述最大尺寸阈值，以及所述最大转换尺寸是最大转换单元尺寸或最大转换块尺寸。

7.如权利要求1所述的视频编解码***中的视频处理方法，其特征在于，其中将所述当前编码单元的残差设置为0进一步包括当所述当前编码单元的所述尺寸大于所述最大尺寸阈值时，选择跳过模式来编码或解码所述当前编码单元。

8.如权利要求7所述的视频编解码***中的视频处理方法，其特征在于，其中编码所述当前编码单元进一步包括当所述当前编码单元的所述尺寸大于所述最大尺寸阈值时，跳过发信跳过旗标，以及其中解码所述当前编码单元进一步包括当所述当前编码单元的所述尺寸大于所述最大尺寸阈值时，推断所述跳过旗标为1，指示所述当前编码单元在跳过模式中进行编解码。

9.如权利要求1所述的视频编解码***中的视频处理方法，其特征在于，其中编码所述当前编码单元进一步包括当所述当前编码单元的所述尺寸大于所述最大尺寸阈值时，跳过发信所述当前编码单元中转换块的编码块旗标，以及其中解码所述当前编码单元进一步包括当所述当前编码单元的所述尺寸大于所述最大尺寸阈值时，推断所述转换块的所述编码块旗标为0。

10.如权利要求1所述的视频编解码***中的视频处理方法，其特征在于，其中编码所述当前编码单元进一步包括当所述当前编码单元的所述尺寸大于所述最大尺寸阈值时，跳过发信所述当前编码单元的编码单元编码块旗标，以及其中解码所述当前编码单元进一步包括当所述当前编码单元的所述尺寸大于所述最大尺寸阈值时，推断所述编码单元编码块旗标为0。

11.如权利要求1所述的视频编解码***中的视频处理方法，其特征在于，其中编码所述当前编码单元进一步包括当所述当前编码单元的所述尺寸大于所述最大尺寸阈值时，跳过发信编码单元预测模式旗标，以及其中解码所述当前编码单元进一步包括当所述当前编码单元的所述尺寸大于所述最大尺寸阈值时，推断所述当前编码单元的所述编码单元预测模式为帧间预测。

12.如权利要求1所述的视频编解码***中的视频处理方法，其特征在于，其中编码所述当前编码单元进一步包括当所述当前编码单元的所述尺寸大于所述最大尺寸阈值时，跳过发信合并旗标，以及其中解码所述当前编码单元进一步包括当所述当前编码单元的所述尺寸大于所述最大尺寸阈值时，推断所述合并旗标为0，指示所述当前编码单元不在合并模式中进行编解码。

13.如权利要求1所述的视频编解码***中的视频处理方法，其特征在于，进一步包括确定所述当前编码单元的所述尺寸是否小于最小尺寸阈值，以及当所述当前编码单元的所述尺寸小于所述最小尺寸阈值时，将所述当前编码单元的残差设置为0。

14.如权利要求13所述的视频编解码***中的视频处理方法，其特征在于，其中所述最小尺寸阈值在所述视频比特流的高层级语法集中被显示发信或被隐式推导。

15.如权利要求1所述的视频编解码***中的视频处理方法，其特征在于，其中所述当前条带是B条带或P条带，以及I条带中所有编码单元的尺寸被限制为小于或等于所述最大尺寸阈值。

16.如权利要求1所述的视频编解码***中的视频处理方法，其特征在于，其中所述当前编码单元在帧间预测模式进行编解码，以及所有帧内编码的编码单元的尺寸被限制为小于或等于所述最大尺寸阈值。

17.如权利要求1所述的视频编解码***中的视频处理方法，其特征在于，进一步包括确定在所述视频比特流中发信的语法元素来指示是否允许大尺寸编码单元，其中所述大尺寸编码单元是尺寸大于所述最大尺寸阈值的编码单元，以及如果所述语法元素指示不允许大尺寸编码单元，当所述当前编码单元的所述尺寸大于所述最大尺寸阈值时，强制将所述当前编码单元拆分成多个较小的编码单元。

18.如权利要求1所述的视频编解码***中的视频处理方法，其特征在于，其中将所述当前编码单元的残差设置为0包括当所述当前编码单元的所述尺寸大于所述最大尺寸阈值时，将所述当前编码单元中一个或多个转换块的编码块旗标设置为0。

19.一种视频编解码***中处理视频数据的装置，其特征在于，所述装置包括一个或多个电子电路用于：

确定所述当前编码单元的尺寸是否大于最大尺寸阈值；

20.一种存储程序指令的非暂态计算机可读媒介，所述程序指令使得装置的处理电路执行视频处理方法，其特征在于，所述方法包括：

确定所述当前编码单元的尺寸是否大于最大尺寸阈值；