CN111107368A

CN111107368A - 用于分割树决定的快速方法

Info

Publication number: CN111107368A
Application number: CN201911033440.6A
Authority: CN
Inventors: 张莉; 张凯; 刘鸿彬; 王悦
Original assignee: Beijing ByteDance Network Technology Co Ltd; ByteDance Inc
Current assignee: Beijing ByteDance Network Technology Co Ltd; ByteDance Inc
Priority date: 2018-10-26
Filing date: 2019-10-28
Publication date: 2020-05-05
Anticipated expiration: 2039-10-28
Also published as: WO2020084604A1; CN111107368B

Abstract

一种用于视频处理的方法，包括用于分割树决定的快速方法，其包括对于视频的当前块和视频的比特流表示之间的转换，基于规则来确定扩展四叉树(EQT)分割过程是否适用于当前块，并且基于该确定来执行该转换。EQT分割过程包括将给定块恰好分割成四个子块，其中至少一个子块的尺寸不同于给定块的宽度的一半乘以给定块的高度的一半，并且该规则基于与当前块相关联的属性来指定EQT分割过程的最大深度。

Description

用于分割树决定的快速方法

相关申请的交叉引用

根据适用的专利法和/或巴黎公约的规则，本申请旨在及时要求2018年10月26日提交的国际专利申请PCT/CN2018/111990和2018年12月5日提交的国际专利申请PCT/CN2018/119316的优先权和利益。上述申请的全部公开内容通过引用而并入，作为本专利文献公开内容的一部分。

技术领域

本文档涉及视频和图像编码技术。

背景技术

目前，正在努力提高当前的视频编解码器技术的性能，以提供更好的压缩比或提供允许更低复杂性或并行实施的视频编码和解码方案。行业专家最近提出了几种新的视频编码工具，目前正在进行测试以确定其有效性。

发明内容

一些公开的实施例涉及使用基于规则的扩展四叉树分割过程对图像和视频图片进行编码和解码。在一个有益的方面，规则的某些方面是预定义的，允许编码器和解码器实施例生成分割树，以及使用比传统图像和视频编码技术更少的计算资源来执行解码。

在一个示例方面，公开了一种用于视频处理的方法。该方法包括，对于视频的当前块和视频的比特流表示之间的转换，基于规则来确定扩展四叉树(Extended Quad Tree，EQT)分割过程是否适用于当前块，并且基于该确定来执行该转换。EQT分割过程包括将给定块恰好分割成四个子块，其中至少一个子块的尺寸不同于给定块的宽度的一半乘以给定块的高度的一半，并且该规则基于与当前块相关联的属性来指定EQT分割过程的最大深度。

在另一示例方面，一种可视媒体处理的方法包括使用对于使用扩展四叉树(EQT)分割过程的规则来执行可视媒体数据的当前块和该块的对应比特流表示之间的转换，其中EQT分割过程包括将给定块恰好分割成四个子块，其中至少一个子块的尺寸不同于给定块的宽度的一半乘以给定块的高度的一半，并且其中该规则指定，在该规则用于分割当前块的情况下，每个子块进一步被划分成二叉树(Binary Tree，BT)分割或另一EQT分割，并且BT分割和另一EQT分割都具有满足预定义关系的深度。

在另一示例方面，公开了一种可视媒体处理方法。该方法包括使用对于使用扩展四叉树(EQT)分割过程的规则来执行可视媒体数据的当前块和该块的对应比特流表示之间的转换，其中EQT分割过程包括将给定块恰好分割成四个子块，其中至少一个子块的尺寸不同于给定块的宽度的一半乘以给定块的高度的一半，并且其中该规则允许基于当前块的宽度或高度对当前块进行EQT分割过程。

在又一方面，公开了另一种可视媒体处理的方法。该方法包括使用对于使用扩展四叉树(EQT)分割过程的规则来执行可视媒体数据的当前块和该块的对应比特流表示之间的转换，其中EQT分割过程包括将给定块恰好分割成四个子块，其中至少一个子块的尺寸不同于给定块的宽度的一半乘以给定块的高度的一半，并且其中该规则允许基于当前块的位置对当前块进行EQT分割过程。

在又一方面，公开了另一种可视媒体处理的方法。该方法包括使用对于使用扩展四叉树(EQT)分割过程的规则来执行可视媒体数据的当前块和该块的对应比特流表示之间的转换，其中EQT分割过程包括将给定块恰好分割成四个子块，其中至少一个子块的尺寸不同于给定块的宽度的一半乘以给定块的高度的一半，并且其中该规则允许EQT分割过程的最大深度取决于当前块的当前图片和当前块的参考图片之间的距离或者当前块的量化参数或者当前图片的时域层标识符。

在整个文档中更详细地描述了这些以及其他方面。

附图说明

图1示出了视频编码和解码的示例实施方式的框图。

图2示出了根据H.264/音频视频编解码器(Audio Video Codec，AVC)标准的宏块(MacroBlock，MB)分割的示例。

图3示出了用于受某些尺寸约束而将编码块(Coding Block，CB)划分成预测块(Prediction block，PB)的模式的示例。例如，帧内图片只允许使用M×M和M/2×M/2尺寸。

图4示出了将编码树块(Coding Tree Block，CTB)细分成CB和变换块(TransformBlock，TB)的示例。在该图中，实线指示CB边界，并且虚线指示TB边界。左侧是具有其分割的CTB，并且右侧是对应的四叉树。

图5是四叉树二叉树(Quad Tree Binary Tree，QTBT)结构的示例图示。

图6示出了块分割的各种示例。

图7A-图7K示出了块分割的示例。

图8A-图8D示出了块分割的示例。

图9A-图9B示出了广义三叉树(Generalized Triple Tree，GTT)分割的示例。

图10示出了多功能边界分割的语法和语义的示例。

图11A-图11B示出了可以进一步划分成EQT或BT的允许的EQT模式的示例。

图12示出了分割的二值化的示例。

图13A和图13B示出了水平和垂直EQT的示例。

图14示出了用于实施一些公开的方法的示例硬件平台。

图15示出了用于实施一些公开的方法的另一示例硬件平台。

图16是可视媒体处理的示例方法的流程图。

图17示出了在EQT分割提前终止中使用的7个特定位置的示例。

图18是可以实施所公开技术的示例视频处理***的框图。

图19是根据本公开的用于视频处理的方法的流程图表示。

具体实施方式

本文档提供了几种可以体现在数字视频或图像(统称为可视媒体)、编码器和解码器中的技术。为了理解清楚，在本文档中使用了章节标题，并且不将每个章节中公开的技术和实施例的范围仅限制于该章节。

1.简要概述

本文档涉及图像/视频编码，特别是关于分割结构的图像/视频编码，即如何将一个编码树单元(Coding Tree Unit，CTU)划分成多个编码单元(Coding Unit，CU)，以及如何加速编码器以选择最佳分割结构。它可以应用于现有的视频编码标准，如HEVC(HighEfficiency Video Coding，高效视频编码)，或即将定案的标准(通用视频编码)。它也可以适用于未来的视频编码标准或视频编解码器。

2.视频编码和解码技术介绍

视频编码标准主要是通过熟知的ITU-T和ISO/IEC标准的发展而演进的。ITU-T制订了H.261和H.263，ISO/IEC制订了MPEG-1和MPEG-4Visual，并且这两个组织联合制订了H.262/MPEG-2Video和H.264/MPEG-4Advanced Video Coding(高级视频编码，AVC)以及H.265/HEVC标准。自H.262以来，视频编码标准基于混合视频编码结构，其中采用了时域预测加变换编码。图1中描绘了典型HEVC编码器框架的示例。

2.1H.264/AVC中的分割树结构

在以前的标准中，编码层的核心是宏块，包含16×16亮度样点块，而在通常的4:2:0颜色样点情况下，包含两个对应的8×8色度样点块。

帧内编码块使用空域预测来利用像素之间的空域相关性。定义了两种分割：16×16和4×4。

帧间编码块通过估计图片之间的运动来使用时域预测，而不是空域预测。可以针对16×16的宏块或其任何子宏块分区(partition)(16×8、8×16、8×8、8×4、4×8、4×4(见图5))独立地估计运动。每个子宏块分区只允许一个运动矢量(Motion Vector，MV)。

图2示出了H.264/AVC中的MB分割的示例。

2.2HEVC中的分割树结构

在HEVC中，通过使用表示为编码树的四叉树结构将CTU划分成CU来适应各种局部特性。使用帧间图片(时域)预测还是帧内图片(空域)预测来对图片区域进行编码的决定是在CU级别做出的。根据PU(Prediction Unit，预测单元)划分类型，每个CU可以被进一步划分成一个、两个或四个PU。在一个PU内部，应用相同的预测过程，并且相关信息在PU的基础上被发送到解码器。在通过应用基于PU划分类型的预测过程获得残差块(residual block)之后，可以根据类似于CU的编码树的另一四叉树结构将CU划分成变换单元(TransformUnit，TU)。HEVC结构的一个重要特征在于它具有多个分割概念，包括CU、PU和TU。

在下文中，使用HEVC的混合视频编码所涉及的各种特征强调如下。

1)编码树单元和编码树块(CTB)结构：HEVC中的类比结构是编码树单元(CTU)，其尺寸由编码器选择，并且可以大于传统宏块。CTU由亮度CTB和对应的色度CTB和语法元素组成。亮度CTB的尺寸L×L可以被选择为L＝16、32或64个样点，更大的尺寸通常能够实现更好的压缩。然后，HEVC支持使用树结构和类似四叉树的信令将CTB分割成更小的块。

2)编码单元(CU)和编码块(CB)：CTU的四叉树语法指定其亮度CB和色度CB的尺寸和位置。四叉树的根与CTU相关联。因此，亮度CTB的尺寸是亮度CB的最大支持尺寸。将CTU划分成亮度CB和色度CB是联合信令通知的。一个亮度CB通常和两个色度CB、以及相关联的语法，形成编码单元(CU)。CTB可以仅包含一个CU或者可以被划分以形成多个CU，并且每个CU都具有分割为预测单元(PU)的相关联分割和变换单元(TU)的树。

3)预测单元和预测块(PB)：使用帧间图片预测还是帧内图片预测来对图片区域进行编码的判定是在CU级别做出的。PU分割结构的根在CU级别。取决于基本的预测类型判定，亮度CB和色度CB然后可以在尺寸上被进一步划分，并且从亮度和色度预测块(PB)中来预测。HEVC支持从64×64降到4×4个样点的可变PB尺寸。

4)TU和变换块：使用块变换对预测残差进行编码。TU树结构的根在CU级别。亮度CB残差可以与亮度变换块(TB)相同，或者可以进一步被划分成更小的亮度TB。色度TB也是如此。针对尺寸为4×4、8×8、16×16和32×32的正方形TB定义了类似于离散余弦变换(Discrete Cosine Transform，DCT)的整数基函数。对于亮度帧内图片预测残差的4×4变换，可选地指定从离散正弦变换(discrete sine transform，DST)的形式导出的整数变换。

图3示出了用于受某些尺寸约束而将编码块(CB)划分成预测块(PB)的模式的示例。例如，帧内图片只允许使用M×M和M/2×M/2尺寸。

图4示出了将编码树块(CTB)细分成CB和变换块(TB)的示例。在该图中，实线指示CB边界，并且虚线指示TB边界。左侧是具有分割的CTB，并且右侧是对应的四叉树。

2.3JEM中具有更大CTU的四叉树加二叉树块结构

为了探索HEVC以外的未来视频编码技术，VCEG和MPEG于2015年联合成立了联合视频探索团队(Joint Video Exploration Team，JVET)。自那以后，JVET采用了许多新方法，并将其放入名为联合探索模型(Joint Exploration Model，JEM)的参考软件中。

2.3.1QTBT块分割结构

与HEVC不同的是，QTBT结构移除了多个分割类型的概念，即它移除了CU、PU和TU概念的分离，并支持CU分割形状的更多灵活性。在QTBT块结构中，CU可以是正方形或矩形。如图5所示，编码树单元(CTU)首先由四叉树结构分割。四叉树叶节点通过二叉树结构被进一步分割。在二叉树划分中有对称水平划分和对称垂直划分两种划分类型。二叉树叶节点被称为编码单元(CU)，并且该分段用于预测和变换处理，而无需任何进一步的分割。这意味着在QTBT编码块结构中，CU、PU和TU具有相同的块尺寸。在JEM中，CU有时由不同颜色分量的编码块(CB)组成，例如，在4:2:0色度格式的P条带和B条带的情况下，一个CU包含一个亮度CB和两个色度CB；CB有时由单个分量的CB组成，例如，在I条带的情况下，一个CU仅包含一个亮度CB，或者仅包含两个色度CB。

针对QTBT分割方案定义以下参数。

–CTU尺寸：四叉树的根节点尺寸，与HEVC中的概念相同

–MinQTSize：最小允许四叉树叶节点尺寸

–MaxBTSize：最大允许二叉树根节点尺寸

–MaxBTDepth：最大允许二叉树深度

–MinBTSize：最小允许二叉树叶节点尺寸

在QTBT分割结构的一个示例中，CTU尺寸被设置为具有两个对应的64×64色度样点块的128×128个亮度样点，MinQTSize被设置为16×16，MaxBTSize被设置为64×64，MinBTSize(对于宽度和高度两者)被设置为4×4，MaxBTDepth被设置为4。四叉树分割首先应用于CTU，以生成四叉树叶节点。四叉树叶节点可以具有从16×16(例如，MinQTSize)到128×128(例如，CTU尺寸)的尺寸。如果四叉树叶节点是128×128，则由于尺寸超过MaxBTSize(例如，64×64)，所以它将不会通过二叉树被进一步划分。否则，四叉树叶节点可以通过二叉树被进一步分割。因此，四叉树叶节点也是二叉树的根节点，并且其二叉树深度为0。当二叉树深度达到MaxBTDepth(例如，4)时，不考虑进一步的划分。当二叉树节点的宽度等于MinBTSize(例如，4)时，不考虑进一步的水平划分。类似地，当二叉树节点的高度等于MinBTSize时，不考虑进一步的垂直划分。通过预测和变换处理进一步处理二叉树的叶节点，而无需任何进一步的分割。在JEM中，最大CTU尺寸是256×256个亮度样点。

在二叉树的每个划分(即非叶)节点中，例如，如图5所示，信令通知一个标志来指示使用哪种划分类型(即水平或垂直)，其中0指示水平划分，并且1指示垂直划分。对于四叉树划分，不需要指示划分类型，因为四叉树划分总是水平和垂直地划分块，以产生具有相等尺寸的4个子块。

另外，QTBT方案支持亮度和色度具有单独的QTBT结构的能力。目前，对于P条带和B条带，一个CTU中的亮度CTB和色度CTB共享相同的QTBT结构。然而，对于I条带，通过QTBT结构将亮度CTB分割成亮度CU，通过另一QTBT结构将色度CTB分割成色度CU。这意味着，I条带中的CU由亮度分量的编码块或两个色度分量的编码块组成，并且P条带或B条带中的CU由所有三种颜色分量的编码块组成。

在HEVC中，小块的帧间预测被限制，以减少运动补偿的存储器访问，使得对于4×8块和8×4块不支持双向预测，并且对于4×4块不支持帧间预测。在JEM的QTBT中，这些限制被移除。

2.4VVC(Versatile Video Coding，多功能视频编码)的三叉树

在一些情况下，支持四叉树和二叉树以外的树类型。在实施方式中，引入了另外两个三叉树(Triple Tree，TT)分割，即水平和垂直中心侧三叉树，如图6的项(d)和6(e)所示。

图6示出了块分割模式的示例。(a)四叉树分割(b)垂直二叉树分割(c)水平二叉树分割(d)垂直中心侧三叉树分割(e)水平中心侧三叉树分割。

存在两个级别的树，区域树(四叉树)和预测树(二叉树或三叉树)。首先通过区域树(Region Tree，RT)对CTU进行分割。可以用预测树(Prediction Tree，PT)进一步划分RT叶。也可以用PT进一步划分PT叶，直到达到最大PT深度。PT叶是基本的编码单位。为了方便起见，它仍然被称为CU。CU不能被进一步划分。预测和变换都以与JEM相同的方式应用于CU。整个分割结构被称为“多类型树”。

2.5扩展四叉树

一种扩展四叉树(EQT)分割结构，对应于包括用于视频数据块的扩展四叉树分割过程的块分割过程，其中扩展四叉树分割结构表示将视频数据块分割成最终子块，并且当扩展四叉树分割过程决定将扩展四叉树分割应用于一个给定块时，所述一个给定块总是被划分成四个子块；基于视频比特流对最终子块进行解码；以及基于根据推导出的EQT结构而解码的最终子块，对视频数据块进行解码。EQT在上面标题的专利申请中提出，在此引入作为参考。

EQT分割过程可以递归地应用于给定块，以生成EQT叶节点。可替代地，当EQT被应用于某个块时，对于由于EQT而产生的每个子块，每个子块可以进一步被划分成BT、和/或QT、和/或TT、和/或EQT、和/或其他种类的分割树。

在一个示例中，EQT和QT可以共享相同的深度增量过程和相同的叶节点尺寸约束。在这种情况下，当一个节点的尺寸达到最小允许四叉树叶节点尺寸或者与该节点相关联的EQT深度达到最大允许四叉树深度时，可以隐式地终止该节点的分割。

在一些实施例中，EQT和QT可以共享不同的深度增量过程和/或叶节点尺寸约束。当一个节点的尺寸达到最小允许EQT叶节点尺寸或者与该节点相关联的EQT深度达到最大允许EQT深度时，隐式地终止EQT对该节点的分割。此外，在一个示例中，EQT深度和/或最小允许EQT叶节点尺寸可以在序列参数集(Sequence Parameter Set，SPS)、和/或图片参数集(Picture Parameter Set，PPS)、和/或条带头、和/或CTU、和/或区域、和/或片、和/或CU中信令通知。

代替使用应用于正方形块的当前四叉树分割，对于具有M×N(M和N是非零正整数值，相等或不相等)尺寸的块，在EQT中，一个块可以被均等地划分成四个分区，诸如M/4×N或M×N/4(在图7A和图7B中描绘了示例)，或者被均等地划分成四个分区并且分区尺寸取决于M和N的最大值和最小值。在一个示例中，一个4×32块可以被划分成四个4×8子块，而一个32×4块可以被划分成四个8×4子块。

代替使用应用于正方形块的当前四叉树分割，对于具有M×N(M和N是非零正整数值，相等或不相等)尺寸的块，在EQT中，一个块可以被不均等地划分成四个分区，诸如两个分区的尺寸等于(M*w0/w)×(N*h0/h)，并且另外两个分区的尺寸等于(M*(w-w0)/w)×(N*(h-h0)/h)。

例如，w0和w可以分别等于1和2，即，宽度减少一半，而高度可以使用其他比率而不是2:1，以获得子块。在图7C和图7E中描绘了这种情况的示例。可替代地，h0和h可以分别等于1和2，即，高度减少一半，而宽度可以使用其他比率而不是2:1。在图7D和图7F中描述了这种情况的示例。

图7G和图7H示出了四叉树分割的两个替代示例。

图7I示出了具有不同分割形状的四叉树分割的更一般的情况。

图7J和图7K示出了图7A和图7B的一般示例。

图7C示出了宽度固定为M/2、高度等于N/4或3N/4的子块，顶部两个分区较小；图7D示出了高度固定为N/2、宽度等于M/4或3M/4的子块，左边两个分区较小。

图7E示出了宽度固定为M/2、高度等于3N/4或N/4的子块，底部两个分区较小。图7F示出了高度固定为N/2、宽度等于3M/4或M/4的子块，右边两个分区较小。示出以下示例维度：图7G：M×N/4和M/2×N/2；图7H：N×M/4和N/2×M/2；图7I：M1×N1、(M-M1)×N1、M1×(N-N1)和(M-M1)×(N-N1)；图7J：M×N1、M×N2、M×N3和M×N4，其中N1+N2+N3+N4＝N；图7K：M1×N、M2×N、M3×N和M4×N，其中M1+M2+M3+M4＝M。

一种灵活树(Flexible Tree，FT)分割结构，对应于包括视频数据块的FT分割过程的块分割过程，其中FT分割结构表示将视频数据块分割成最终子块，并且当FT分割过程决定将FT分割应用于一个给定块时，所述一个给定块被划分成K个子块，其中K可以大于4；基于视频比特流对最终子块进行解码；以及基于根据推导出的FT结构而解码的最终子块，对视频数据块进行解码。

FT分割过程可以递归地应用于给定块，以生成FT树叶节点。当一个节点达到最小允许FT叶节点尺寸或者与该节点相关联的FT深度达到最大允许FT深度时，隐式地终止该节点的分割。

在一些实施例中，当FT被应用于某个块时，对于由于FT而产生的每个子块，每个子块可以进一步被划分成BT、和/或QT、和/或EQT、和/或TT、和/或其他种类的分割树。

此外，在一些实施例中，FT深度或最小允许FT叶节点尺寸或FT的最小允许分区尺寸可以在序列参数集(SPS)、和/或图片参数集(PPS)、和/或条带头、和/或CTU、和/或区域、和/或片、和/或CU中信令通知。

类似于所提出的EQT，所有由于FT分割而产生的子块可以具有相同的尺寸；可替代地，不同子块的尺寸可以不同。

在一个示例中，K等于6或8。图8A-图8D中描绘了一些示例，其示出了FT分割的示例(在图8C和图8D中K＝6，或者在图8A和图8B中K＝8)。

对于TT，可以移除沿水平或垂直方向划分的约束。

在一个示例中，广义TT(GTT)分割模式可以被定义为水平和垂直的划分。示例如图9A和图9B所示。

所提出的方法可以在某些条件下应用。换句话说，当不满足(多个)条件时，没有必要信令通知分割类型。

在一些实施例中，所提出的方法可以用来替代现有的分割树类型。可替代地，此外，所提出的方法只能在某些条件下用作替代。

在一个示例中，条件可以包括图片和/或条带类型；和/或块尺寸；和/或编码模式；和/或一个块是否位于图片/条带/片边界。

在一个示例中，所提出的EQT可以以与QT相同的方式来看待。在这种情况下，当指示分割树类型是QT时，可以进一步信令通知详细的四叉树分割模式的更多标志/指示。可替代地，EQT可以被视为附加的分割模式。

在一个示例中，EQT或FT或GTT的分割方法的信令可以是有条件的，例如，在一些情况下可能不使用一种或一些EQP/FT/GTT分割方法，并且不信令通知与这些分割方法相对应的比特。

2.6边缘(Border)处理

在一些实施例中，提出了一种多功能视频编码(VVC)的边界处理方法。AVS-3.0也采用了类似的方法。

由于VVC中的强制四叉树边界分割解决方案没有被优化，所以已经提出了边界分割方法可以使用规则块(regular block)分割语法来保持CABAC引擎的连续性以及匹配图片边界。

多功能边界分割获得以下规则(编码器和解码器两者)：

对于位于边界的块，使用正常块(非边界)(例如，VTM-1.0，如图10)的完全相同的分割语法，语法需要不被改变。

如果没有为边界CU解析划分模式，则使用强制边界分割(forced boundarypartition，FBP)来匹配图片边界。在强制边界分割(非单一边界分割)之后，不再进行进一步分割。强制边界分割描述如下：

如果块的尺寸大于最大允许BT尺寸，则使用强制QT来以当前强制分割级别执行FBP；

否则，如果当前CU的右下方样点低于底图片边界且没有扩展右边界，则使用强制水平BT来以当前强制分割级别执行FBP；

否则，如果当前CU的右下方样点位于右图片边界的右侧且不低于底边界，则使用强制垂直BT来以当前强制分割级别执行FBP；

否则，如果当前CU的右下方样点位于右图片边界的右侧且低于底边界，则使用强制QT来以当前强制分割级别执行FBP。

3.当前实施方式的问题和缺点

EQT和QT/BT/TT的分区之间可能存在一些冗余。例如，对于尺寸为M×N的块，它可以被划分成垂直BT三次(首先被划分成两个M/2*N分区，然后对于每个M/2*N分区，进一步应用垂直BT划分)，以获得四个M/4*N分区。并且，为了得到四个M/4×N分区，该块可以直接选择使用EQT，如图7B所示。如何有效地信令通知EQT仍然存在问题。

4.示例技术和实施例

为了解决上述问题和其他问题，提出了几种方法来处理EQT的情况。实施例可以包括图像或视频编码器和解码器。

下面列举的技术应被视为对一般概念的解释。这些实施例不应以狭隘的方式解释。此外，这些实施例可以以任何方式组合。

示例1：当EQT被应用于某个块时，对于由于EQT而产生的每个子块，每个子块可以进一步被划分成BT和/或EQT，并且BT和EQT可以共享相同的、由D_BTMax表示的最大深度值(例如，第2.3.1节中的MaxBTDepth)。

在一个示例中，可以只允许图7A-图7K中描绘的两种EQT。在图11A和图11B中描绘了两个允许的EQT模式，图11A和图11B示出了可以进一步被划分成EQT或BT的允许的EQT模式的示例。例如，一个允许的EQT模式可以包括完全宽度和四分之一高度的顶部分区，接着是块的一半宽度和一半高度的两个并排分区，接着是块的完全宽度和四分之一高度的底部分区(例如，图11A)。另一个允许的分区包括完全高度和四分之一宽度的左侧部分，接着是两个一半宽度和一半高度、彼此垂直堆叠的分区，接着是完全高度和四分之一宽度的右侧分区(例如，图11B)。应当理解，在一个方面，每个分区具有相等的面积。

类似地，当BT被应用于某个块时，对于由于BT而产生的每个子块，每个子块可以进一步被划分成BT和/或EQT，并且BT和EQT可以共享相同的最大深度值。

EQT和BT可以使用不同的深度增量过程。例如，当每个块可以被分配有由D_BT表示的深度值时(D_BT可以从0开始)。如果用EQT来划分一个块(深度值等于D_BT)，则每个子块的深度值都被设置为D_BT+2。

每当一个块的关联深度小于D_BTMax时，它可能会进一步被划分成EQT或BT。

在一些实施例中，EQT允许的最大深度值可以被设置为QT允许的最大深度值和BT允许的最大深度值之和。

示例2：当允许EQT对片/条带/图片/序列进行编码时，它可以共享相同的用于对相同视频数据单元进行编码的、最大允许二叉树根节点尺寸(例如，第2.3.1节中的MaxBTSize)。可替代地，EQT可以使用与BT不同的最大允许根节点尺寸。

在一个示例中，最大EQT尺寸被设置为M×N，例如，M＝N＝64或32。在一些实施例中，可以在VPS/SPS/PPS/图片头/条带头/片组头/片/CTU中从编码器向解码器信令通知对于EQT的最大允许根节点尺寸。

示例3：在信令通知BT或EQT的方向(例如，水平或垂直)之前，首先信令通知一个标志来指示它是BT还是EQT，并且可以进一步信令通知另一个标志来指示它使用水平或垂直划分方向。

在一个示例中，分割的二值化在图12中示出。表1示出了每个二进制(bin)索引的二进制值示例。应该注意，这相当于交换表中的所有“0”和“1”。

表1：分区划分模式的示例

在一些实施例中，BT或EQT的方向被定义为平行于或垂直于当前划分方向。

在一些实施例中，可以首先信令通知一个标志来指示是否使用QT或EQT或两者都不使用(非EQT非QT)。如果选择了非EQT非QT，则可以进一步信令通知BT划分信息。

示例4：指示是使用EQT还是BT的标志可以是上下文编码的，并且上下文取决于当前块及其临近块两者的深度信息。

在一个示例中，临近块可以被定义为相对于当前块的上面和左边的块。

在一个示例中，四叉树深度和BT/EQT深度都可以用于标志的编码。

基于每个块的深度信息，可以为每个块推导一个变量D_ctx，例如，它被设置为(2*QT深度+BT/EQT深度)。在一些实施例中，(2*QT深度+BT/EQT深度)可以在用于上下文选择之前被进一步量化。

可以利用三个上下文来对该标志进行编码。在一个示例中，上下文索引被定义为：((上方块的D_ctx>当前块的D_ctx)？1:0)+((左边块的D_ctx>当前块的D_ctx)？1:0)。在一些实施例中，当临近块不可用时，其相关联的D_ctx被设置为0。

示例5：在一些实施例中，是否以及如何应用EQT划分可以取决于要划分的块的宽度和高度(表示为W和H)。

在一个示例中，当W>＝T1和H>＝T2时，不允许EQT划分，其中T1和T2是预定义的整数，例如，T1＝T2＝128或T1＝T2＝64。可替代地，T1和/或T2可以在VPS/SPS/PPS/图片头/条带头/片组头/片/CTU中从编码器信令通知给解码器。

在一个示例中，当W>＝T1或H>＝T2时，不允许EQT划分，其中T1和T2是预定义的整数，例如，T1＝T2＝128或T1＝T2＝64。可替代地，T1和/或T2可以在VPS/SPS/PPS/图片头/条带头/片组头/片/CTU中从编码器信令通知给解码器。

在一个示例中，当W<＝T1和H<＝T2时，不允许EQT划分，其中T1和T2是预定义的整数，例如，T1＝T2＝8或T1＝T2＝16。可替代地，T1和/或T2可以在VPS/SPS/PPS/图片头/条带头/片组头/片/CTU中从编码器信令通知给解码器。

在一个示例中，当W<＝T1或H<＝T2时，不允许EQT划分，其中T1和T2是预定义的整数，例如，T1＝T2＝8或T1＝T2＝16。可替代地，T1和/或T2可以在VPS/SPS/PPS/图片头/条带头/片组头/片/CTU中从编码器信令通知给解码器。

在一个示例中，当W>＝T时，不允许如图11A所示的水平EQT，其中T是预定义的整数，例如，T＝128或T＝64。可替代地，T可以在VPS/SPS/PPS/图片头/条带头/片组头/片/CTU中从编码器信令通知给解码器。

在一个示例中，当H>＝T时，不允许如图11A所示的水平EQT，其中T是预定义的整数，例如，T＝128或T＝64。可替代地，T可以在VPS/SPS/PPS/图片头/条带头/片组头/片/CTU中从编码器信令通知给解码器。

在一个示例中，当W<＝T时，不允许如图11A所示的水平EQT，其中T是预定义的整数，例如，T＝8或T＝16。可替代地，T可以在VPS/SPS/PPS/图片头/条带头/片组头/片/CTU中从编码器信令通知给解码器。

在一个示例中，当H<＝T时，不允许如图11A所示的水平EQT，其中T是预定义的整数，例如，T＝8或T＝16。可替代地，T可以在VPS/SPS/PPS/图片头/条带头/片组头/片/CTU中从编码器信令通知给解码器。

在一个示例中，当W>＝T时，不允许如图11B所示的垂直EQT，其中T是预定义的整数，例如，T＝128或T＝64。可替代地，T可以在VPS/SPS/PPS/图片头/条带头/片组头/片/CTU中从编码器信令通知给解码器。

在一个示例中，当H>＝T时，不允许如图11B所示的垂直EQT，其中T是预定义的整数，例如，T＝128或T＝64。可替代地，T可以在VPS/SPS/PPS/图片头/条带头/片组头/片/CTU中从编码器信令通知给解码器。

在一个示例中，当W<＝T时，不允许如图11B所示的垂直EQT，其中T是预定义的整数，例如，T＝8或T＝16。可替代地，T可以在VPS/SPS/PPS/图片头/条带头/片组头/片/CTU中从编码器信令通知给解码器。

在一个示例中，当H<＝T时，不允许如图11B所示的垂直EQT，其中T是预定义的整数，例如，T＝8或T＝16。可替代地，T可以在VPS/SPS/PPS/图片头/条带头/片组头/片/CTU中从编码器信令通知给解码器。

在一个示例中，当由于EQT划分而产生的四个子块中的任何一个的宽度或高度等于K并且编解码器中不支持/定义K×K变换时，不允许EQT划分。

在一些实施例中，是否以及如何应用EQT划分可以取决于由于一个块的EQT划分而产生的子块的宽度和/或高度(表示为W和H)。

示例6：在一些实施例中，是否以及如何应用EQT划分可以取决于要划分的块的位置。

在一个示例中，是否以及如何应用EQT划分可以取决于要划分的当前块是否位于图片的边缘处。在一个示例中，假设(x，y)是当前块左上方位置的坐标，(PW，PH)是图片的宽度和高度，(W，H)是具有当前QT深度和BT/EQT深度的块的宽度和高度。当y+H>PH时，当前块位于底边缘；当x+W>PW时，当前块位于右边缘；当y+H>PH且x+W>PW时，当前块位于右下角边缘。

在一个示例中，当当前块位于底边缘时，不允许EQT分割。

在一个示例中，当当前块位于右边缘时，不允许EQT分割。

在一个示例中，当当前块位于右下角边缘时，不允许EQT分割。

在一个示例中，当当前块位于底边缘时，不允许如图11A所示的水平EQT。

在一个示例中，当当前块位于右边缘时，不允许如图11A所示的水平EQT。

在一个示例中，当当前块位于右下角边缘时，不允许如图11A所示的水平EQT。

在一个示例中，当当前块位于底边缘时，不允许如图11B所示的垂直EQT。

在一个示例中，当当前块位于右边缘时，不允许如图11B所示的垂直EQT。

在一个示例中，当当前块位于右下角边缘时，不允许如图11B所示的垂直EQT。

在一个示例中，当当前块位于底边缘时，可以允许水平EQT和水平BT。

在一个示例中，当当前块位于右边缘时，可以允许垂直EQT和垂直BT。

示例7：当不允许使用一种或几种EQT时，以下情况可能适用。

在一个示例中，解析过程取决于是否不允许一种或几种EQT。如果不允许一种或几种EQT，则不会信令通知与EQT相关的对应语法元素。

在另一示例中，解析过程不取决于是否不允许一种或几种EQT。无论是否允许使用一种或几种EQT，都会信令通知与EQT相关的对应语法元素。

在一个示例中，如果不允许一种或几种EQT，则一致性(conformance)编码器不会信令通知这一种或几种EQT。

在一个示例中，当一致性解码器解析出EQT划分但这种EQT是不允许的时，它可以将EQT解释为一些其他类型的划分，诸如QT、BT或没有划分。

示例8：最大EQT深度可以取决于与当前块和/或当前图片相关联的属性。在一个示例中，最大EQT深度可以取决于当前图片和参考图片之间的距离，例如，图片顺序计数(Picture Order Count，POC)差。

在一个示例中，最大EQT深度可以取决于当前图片的时域层标识符。

在一个示例中，最大EQT深度可以取决于当前图片是否被其他图片引用。

在一个示例中，最大EQT深度可以取决于(多个)量化参数。

示例9：率失真优化(Rate-Distortion Optimization，RDO)是一种在视频压缩中提高视频质量的方法。该方法针对编码视频所需的数据量来优化失真(视频质量损失)量。率失真成本估计对于许多H.264/高级视频编码(AVC)应用非常有用，包括对于模式决定和率控制的率失真优化(RDO)。在一些实施例中，在某个BT/EQT深度处，当当前块及其临近块的最佳模式都是跳过模式(skip mode)时，不需要进一步检查率失真成本计算以进行进一步划分。

在一个示例中，当当前块及其临近块的最佳模式是跳过模式或Merge模式时，不需要进一步检查率失真成本计算以进行进一步划分。

在一个示例中，如果父块的最佳模式是跳过模式，则不需要进一步检查率失真成本计算以进行进一步划分。

示例10：在一些实施例中，记录先前编码的图片/条带/片的EQT划分的块的平均EQT深度。当对当前视频单元进行编码时，不需要进一步检查与所记录的平均深度相比更大的EQT深度的率失真成本计算。

在一个示例中，可以针对每个时域层记录平均EQT值。在这种情况下，对于要编码的每个视频数据，它只利用相同时域层的记录平均值。

在一个示例中，仅记录第一时域层的平均EQT值。在这种情况下，对于要编码的每个视频数据，它总是利用第一时域层的记录平均值。

示例11：在一些实施例中，记录先前编码的图片/条带/片的EQT划分的块的平均尺寸。当对当前视频单元进行编码时，不需要进一步检查与所记录的块尺寸相比更小的块尺寸的率失真成本计算。

在一个示例中，可以针对每个时域层记录平均EQT块尺寸。在这种情况下，对于要编码的每个视频数据，它只利用相同时域层的记录平均值。

在一个示例中，仅记录第一时域层的平均EQT块尺寸。在这种情况下，对于要编码的每个视频数据，它总是利用第一时域层的记录平均值。

示例12：在一些实施例中，是否检查尚未检查的EQT划分可以取决于已经针对当前块检查的QT/BT/EQT划分的深度。

在一些实施例中，是否跳过对EQT划分分区的检查可以取决于当前块的平均QT/BT划分深度；

在检查BT水平划分之后，估计平均划分深度；

在检查BT垂直划分之后，估计平均划分深度；

在检查BT水平和垂直划分之后，估计平均划分深度；

在一个示例中，为了估计，在与EQT划分特性相协调的一些特定位置处收集块深度，然后求平均值。图17中描绘了具有7个特定位置的一个示例。在图17中，所有水平线表示块在水平方向上的四分之一划分，并且垂直线描绘了块在垂直方向上的四分之一划分。

在一个示例中，阈值被计算为估计的平均划分深度和当前划分深度的函数。

另外，在一些实施例中，应用阈值表来找到阈值。估计的平均划分深度和当前划分深度被用作取得存储在表中的对应阈值的关键字。

当平均划分深度小于阈值时，不需要进一步检查EQT划分分区。

在一个示例中，上述方法可适用于某些条带/图片类型，诸如I条带或I图片。

5.实施例示例

现有设计之上的语法更改以粗体显示。

语义的示例

eqt_split_flag

-用来指示对于一个块是启用还是禁用EQT的标志。

eqt_split_dir

-用来指示是使用水平EQT还是使用垂直EQT的标志。图13A和图13B示出了水平EQT分割和垂直EQT分割的四叉树分割的示例。

图14是示出计算机***或其他控制设备1400的架构的示例的框图，该计算机***或其他控制设备1400可以用于实施本公开的技术的各个部分。在图14中，计算机***1400包括经由互连1425连接的一个或多个处理器1405和存储器1410。互连1425可以表示通过适当的桥、适配器或控制器而连接的任何一个或多个单独的物理总线、点对点连接或两者。因此，互连1425可以包括例如***总线、***组件互连(Peripheral ComponentInterconnect，PCI)总线、超传输或工业标准架构(Industrial Standard Architecture，ISA)总线、小型计算机***接口(Small Computer System Interface，SCSI)总线、通用串行总线(Universal Serial Bus，USB)、IIC(I2C)总线或电气和电子工程师协会(Instituteof Electrical and Electronics Engineers，IEEE)标准674总线(有时称为“火线”)。

(多个)处理器1405可以包括中央处理单元(Central Processing Unit，CPU)，以控制例如主计算机的整体操作。在某些实施例中，(多个)处理器1405通过运行存储在存储器1410中的软件或固件来实现这一点。(多个)处理器1405可以是或可以包括一个或多个可编程通用或专用微处理器、数字信号处理器(Digital Signal Processor，DSP)、可编程控制器、专用集成电路(Application Specific Integrated Circuit，ASIC)、可编程逻辑器件(Programmable Logic Device，PLD)等，或者这些设备的组合。

存储器1410可以是或包括计算机***的主存储器。存储器1410代表任何合适形式的随机存取存储器(Random Access Memory，RAM)、只读存储器(Read-Only Memory，ROM)、闪存等，或者这些设备的组合。在使用时，存储器1410尤其可以包含机器指令集，当该机器指令集由处理器1405运行时，使得处理器1405执行操作以实施本公开的技术的实施例。

并且，(可选的)网络适配器1415也通过互连1425连接到(多个)处理器1405。网络适配器1415向计算机***1400提供与远程设备(诸如存储客户端和/或其他存储服务器)通信的能力，并且可以是例如以太网适配器或光纤通道适配器。

图15示出了可以用于实施本公开的技术的各个部分的设备1500的示例性实施例的框图。移动设备1500可以是膝上型电脑、智能手机、平板电脑、便携式摄像机或能够处理视频的其他类型的设备。移动设备1500包括处理数据的处理器或控制器1501，以及与处理器1501通信以存储和/或缓冲数据的存储器1502。例如，处理器1501可以包括中央处理单元(CPU)或微控制器单元(MicroController Unit，MCU)。在一些实施方式中，处理器1501可以包括现场可编程门阵列(Field-Programmable Gate-Array，FPGA)。在一些实施方式中，移动设备1500包括图形处理单元(Graphics Processing Unit，GPU)、视频处理单元(VideoProcessing Unit，VPU)和/或无线通信单元，或者与GPU、VPU和/或无线通信单元通信，以用于智能手机设备的各种可视和/或通信数据处理功能。例如，存储器1502可以包括并存储处理器可运行代码，当处理器可运行代码由处理器1501运行时，将移动设备1500配置为执行各种操作，例如，诸如接收信息、命令和/或数据，处理信息和数据，以及将处理后的信息/数据发送或提供给另一设备，诸如致动器或外部显示器。为了支持移动设备1500的各种功能，存储器1502可以存储信息和数据，诸如由处理器1501处理或引用的指令、软件、值、图像和其他数据。例如，各种类型的随机存取存储器(RAM)设备、只读存储器(RAM)设备、闪存设备和其他合适的存储介质可以用于实施存储器1502的存储功能。在一些实施方式中，移动设备1500包括输入/输出(I/O)单元1503，以将处理器1501和/或存储器1502接合到其他模块、单元或设备。例如，I/O单元1503可以接合处理器1501和存储器1502，以利用与典型数据通信标准兼容的各种类型的无线接口，例如，诸如在云中的一个或多个计算机和用户设备之间。在一些实施方式中，移动设备1500可以经由I/O单元1503使用有线连接与其他设备接合。移动设备1500还可以与诸如数据存储和/或可视或音频显示设备1504的其他外部接口接合，以检索和传输可以由处理器处理、存储在存储器中或展现在显示设备1504或外部设备的输出单元上的数据和信息。例如，显示设备1504可以根据公开的技术显示视频帧。

图16是可视媒体处理的方法1600的流程图。方法1600包括使用对于使用扩展四叉树(EQT)分割过程的规则来执行(1602)可视媒体数据的当前块和该块的对应比特流表示之间的转换，其中EQT分割过程包括将给定块恰好分割成四个子块，其中至少一个子块的尺寸不同于给定块的宽度的一半乘以给定块的高度的一半，并且其中该规则指定，在该规则用于分割当前块的情况下，每个子块进一步被划分成二叉树(BT)分割或另一EQT分割，并且BT分割和另一EQT分割都具有满足预定义关系的深度。

另一种可视媒体处理的方法包括使用对于使用扩展四叉树(EQT)分割过程的规则来执行可视媒体数据的当前块和该块的对应比特流表示之间的转换，其中EQT分割过程包括将给定块恰好分割成四个子块，其中至少一个子块的尺寸不同于给定块的宽度的一半乘以给定块的高度的一半，并且其中该规则允许基于当前块的宽度或高度对当前块进行EQT分割过程。

另一种可视媒体处理的方法包括使用对于使用扩展四叉树(EQT)分割过程的规则来执行可视媒体数据的当前块和该块的对应比特流表示之间的转换，其中EQT分割过程包括将给定块恰好分割成四个子块，其中至少一个子块的尺寸不同于给定块的宽度的一半乘以给定块的高度的一半，并且其中该规则允许基于当前块的位置对当前块进行EQT分割过程。

另一种可视媒体处理的方法包括使用对于使用扩展四叉树(EQT)分割过程的规则来执行可视媒体数据的当前块和该块的对应比特流表示之间的转换，其中EQT分割过程包括将给定块恰好分割成四个子块，其中至少一个子块的尺寸不同于给定块的宽度的一半乘以给定块的高度的一半，并且其中该规则允许EQT分割过程的最大深度取决于当前块的当前图片和当前块的参考图片之间的距离或者当前块的量化参数或者当前图片的时域层标识符。

在所公开的实施例中，视频的当前块的比特流表示可以包括比特流的比特(视频的压缩表示)，该比特流可以是不连续的，并且可以取决于头信息，如视频压缩领域中已知的。此外，当前块可以包括代表亮度和色度分量中的一个或多个的样点、或其旋转变体(例如，YCrCb或YUM等)。

下面的条款列表描述了如下一些实施例和技术。

1.一种可视媒体处理的方法，包括：使用对于使用扩展四叉树(EQT)分割过程的规则，执行可视媒体数据的当前块和该块的对应比特流表示之间的转换，其中EQT分割过程包括将给定块恰好分割成四个子块，其中至少一个子块的尺寸不同于给定块的宽度的一半乘以给定块的高度的一半；并且其中该规则指定，在该规则用于分割当前块的情况下，每个子块进一步被划分成二叉树(BT)分割或另一EQT分割，并且BT分割和另一EQT分割都具有满足预定义关系的深度。

2.根据条款1所述的方法，其中，该转换包括从比特流表示生成当前块。

3.根据条款1所述的方法，其中，该转换包括从当前块生成比特流表示。

4.根据条款1至3中任何一项所述的方法，其中，该EQT分割过程将当前块分割成仅两个可能的分割中的一个。

5.根据条款4所述的方法，其中，该当前块包括M×N个像素，其中M和N是整数，并且其中两个可能的分割包括第一分割或者第二分割，第一分割包括M×N/4顶部部分，接着是两个并排的M/2×N/2中间部分，接着是M×N/4底部部分，而第二分割包括M/4×N左侧部分、两个M/2×N/2中间部分和一个M/4×N右侧部分。

6.根据条款1所述的方法，其中，该预定义关系指定BT分割和EQT分割具有不同的值，或者该预定义关系指定EQT分割的深度等于BT分割和四叉树(QT)分割的深度之和。

7.根据条款1所述的方法，其中，该预定义关系指定BT分割和EQT分割具有相同的值。

8.根据条款1所述的方法，其中，该规则指定，在使用BT来分割当前块的情况下，使用BT分割或EQT分割中的一个来分割每个分区。

9.根据条款1所述的方法，其中，该规则指定，在使用EQT来分割当前块的情况下，每个得到的子块的深度值比当前块的深度值多二。

10.根据条款1至9中任何一项所述的方法，其中，该规则还指定对图片片或条带或图片或图片序列中的所有块使用与用于二叉树分割的相同的允许根节点尺寸。

11.根据条款1至9中任何一项所述的方法，其中，该规则还指定对图片片或条带或图片或图片序列中的所有块使用与用于二叉树分割的不同的允许根节点尺寸。

12.根据条款1至9中任何一项所述的方法，其中，该比特流表示被配置为指示在视频级别、序列级别、图片级别、图片头级别、条带头级别、片组头级别、片级别、或编码树单元级别进行EQT分割过程的最大允许根节点尺寸。

13.根据条款1至11中任何一项所述的方法，其中，该比特流表示被配置为包括指示在EQT分割或BT分割之间当前块的分割的第一字段和指示在水平方向和垂直方向之间当前块的划分方向的第二字段。

14.根据条款11至13中任何一项所述的方法，其中，划分方向相对于前一块的划分方向。

15.根据条款11至14中任何一项所述的方法，其中，取决于一个或多个临近块的深度信息或当前块的深度信息对第一字段或第二字段进行上下文编码。

16.根据条款15所述的方法，其中，该临近块是相对于当前块的上面的块或左边的块。

17.根据条款15和16中任何一项所述的方法，其中，该一个或多个临近块的深度信息或当前块的深度信息的量化值被用于上下文编码。

18.一种可视媒体处理的方法，包括：使用对于使用扩展四叉树(EQT)分割过程的规则，执行可视媒体数据的当前块和该块的对应比特流表示之间的转换，其中EQT分割过程包括将给定块恰好分割成四个子块，其中至少一个子块的尺寸不同于给定块的宽度的一半乘以给定块的高度的一半；并且其中该规则允许基于当前块的宽度或高度对当前块进行EQT分割过程。

19.根据条款18所述的方法，其中，该转换包括从比特流表示生成当前块。

20.根据条款18所述的方法，其中，该转换包括从当前块生成比特流表示。

21.根据条款18至20中任何一项所述的方法，其中，当宽度大于或等于T1或者高度大于或等于T2时，该规则不允许EQT分割，其中T1和T2是整数。

22.根据条款21所述的方法，其中，T1和T2是预定义的。

23.根据条款21所述的方法，其中，该比特流表示被配置为携带T1和T2的指示。

24.根据条款23所述的方法，其中，该T1和T2的指示在视频级别或序列级别或图片级别或条带头级别或片组头级别或片级别或编码树单元级别来指示。

25.根据条款18至20中任何一项所述的方法，其中，当宽度小于或等于T1或者高度小于或等于T2时，该规则不允许EQT分割，其中T1和T2是整数。

26.根据条款18至20中任何一项所述的方法，其中，当宽度大于或等于高度时，该规则不允许EQT分割。

27.根据条款18至20中任何一项所述的方法，其中，当宽度小于高度时，该规则不允许EQT分割。

28.一种可视媒体处理的方法，包括：使用对于使用扩展四叉树(EQT)分割过程的规则，执行可视媒体数据的当前块和该块的对应比特流表示之间的转换，其中EQT分割过程包括将给定块恰好分割成四个子块，其中至少一个子块的尺寸不同于给定块的宽度的一半乘以给定块的高度的一半；并且其中该规则允许基于当前块的位置对当前块进行EQT分割过程。

29.根据条款28所述的方法，其中，该转换包括从比特流表示生成当前块。

30.根据条款28所述的方法，其中，该转换包括从当前块生成比特流表示。

31.根据条款28至30中任何一项所述的方法，其中，该规则不允许对位于视频区域的底边缘的当前块进行EQT分割处理。

32.根据条款28至30中任何一项所述的方法，其中，该规则不允许对位于视频区域的右边缘的当前块进行EQT分割处理。

33.根据条款28至30中任何一项所述的方法，其中，该规则不允许对作为视频区域的角落块的当前块进行EQT分割处理。

34.根据条款33所述的方法，其中，该角落对应于视频区域的右下角。

35.根据条款28所述的方法，其中，该规则允许对位于视频区域的底边缘的当前块使用水平EQT分割或水平二叉树分割。

36.根据条款28所述的方法，其中，该规则允许对位于视频区域的右边缘的当前块使用水平EQT分割或水平二叉树分割。

37.根据条款1至34中任何一项所述的方法，其中，在该规则不允许对当前块进行EQT分割过程的情况下，从比特流表示中省略对应的语法元素。

38.根据条款1至33中任何一项所述的方法，其中，在该规则不允许对当前块进行EQT分割过程的情况下，在比特流表示中包括具有默认值的对应的语法元素。

39.一种可视媒体处理的方法，包括：使用对于使用扩展四叉树(EQT)分割过程的规则，执行可视媒体数据的当前块和该块的对应比特流表示之间的转换，其中EQT分割过程包括将给定块恰好分割成四个子块，其中至少一个子块的尺寸不同于给定块的宽度的一半乘以给定块的高度的一半；并且其中该规则指定(1)EQT分割过程的最大深度取决于当前块的当前图片和当前块的参考图片之间的距离、或者当前块的量化参数或者当前图片的时域层标识符，或者(2)在决定检查附加的EQT分割时使用可视媒体数据的当前块的划分深度。

40.根据条款39所述的方法，其中，该转换包括从比特流表示生成当前块。

41.根据条款39所述的方法，其中，该转换包括从当前块生成比特流表示。

42.根据条款1至40中任何一项所述的方法，其中，该规则指定，在使用跳过模式对当前块和临近块进行编码的情况下，或者在当前块的编码深度高于先前编码的块的平均编码深度的情况下，禁用EQT分割过程。

43.根据条款42所述的方法，其中，该平均编码深度是在当前块所在的先前编码的图片或条带或片上计算的。

44.根据条款42所述的方法，其中，该平均编码深度是针对当前块所在的时域层计算的。

45.根据条款39所述的方法，其中，该规则指定在当前块的平均划分深度满足条件的情况下跳过对EQT分割的检查。

46.根据条款45所述的方法，其中，该平均划分深度是在检查二叉树水平划分之后估计的。

47.根据条款45-46中任何一项所述的方法，其中，该平均划分深度在检查二叉树垂直划分之后估计的。

48.根据条款45-47中任何一项所述的方法，其中，该平均划分深度是以当前块中像素的特定位置的数量而确定的。

49.根据条款48所述的方法，其中，该数量等于7。

50.根据条款45-49中任何一项所述的方法，其中，该条件包括将平均划分深度与阈值进行比较。

51.一种视频处理装置，包括被配置为实施根据条款1至50中任何一项或多项所述的方法的处理器。

52.根据条款51所述的装置，其中，该装置是视频编码器。

53.根据条款51所述的装置，其中，该装置是视频解码器。

54.一种计算机可读介质，包括程序，该程序包括用于处理器执行根据条款1至50中任何一项或多项所述的方法的代码。

关于上面列出的条款和第4章节中的技术列表，分割技术可以使用参数集(图片或视频参数集)来指定，或者基于规则来预先指定。因此，可以减少信令通知块的分割所需的比特数。类似地，由于本文档中指定的各种规则，分割决定也可以被简化，从而允许编码器或解码器的较低复杂性的实施方式。

此外，分割规则的位置依赖性可以基于当前块所存在的视频区域(例如，条款26)。视频区域可以包括当前块或更大的部分，诸如当前块所存在的片、条带或图片。

图18是示出示例视频处理***1800的框图，其中可以实施本文公开的各种技术。各种实施方式可以包括***1800的一些或所有组件。***1800可以包括用于接收视频内容的输入1802。视频内容可以以原始或未压缩格式接收，例如，8或10比特多分量像素值，或者可以以压缩或编码格式。输入1802可以代表网络接口、***总线接口或存储接口。网络接口的示例包括有线接口，诸如以太网、无源光网络(Passive Optical Network，PON)等，以及无线接口，诸如Wi-Fi或蜂窝接口。

***1800可以包括编码组件1804，编码组件1804可以实施本文档中描述的各种编码或译成密码(encoding)方法。编码组件1804可以降低从编码组件1804的输入1802到输出的视频的平均比特率，以产生视频的编码表示。因此，编码技术有时被称为视频压缩或视频转码技术。编码组件1804的输出可以被存储，或者经由连接的通信来发送，如组件1806所示。组件1808可以使用在输入1802处接收的视频的存储或传送的比特流(或编码)表示，用于生成发送到显示接口1810的像素值或可显示视频。从比特流表示生成用户可视视频的过程有时被称为视频解压缩。此外，虽然某些视频处理操作被称为“编码”操作或工具，但是应当理解，编码工具或操作在编码器处使用，并且将由解码器执行对应的解码工具或操作来逆转编码的结果。

***总线接口或显示接口的示例可以包括通用串行总线(USB)或高清多媒体接口(High Definition Multimedia Interface，HDMI)或显示端口等。存储接口的示例包括SATA(Serial Advanced Technology Attachment，串行高级技术附件)、PCI、IDE接口等。本文档中描述的技术可以体现在各种电子设备中，诸如移动电话、膝上型电脑、智能手机或能够执行数字数据处理和/或视频显示的其他设备。

图19是根据本公开的用于视频处理的方法1900的流程图表示。方法1900包括，在操作1902处，对于视频的当前块和视频的比特流表示之间的转换，基于规则来确定扩展四叉树(EQT)分割过程是否适用于当前块。EQT分割过程包括将给定块恰好分割成四个子块，其中至少一个子块的尺寸不同于给定块的宽度的一半乘以给定块的高度的一半。该规则基于与当前块相关联的属性来指定EQT分割过程的最大深度。方法1900包括，在操作1904处，基于该确定来执行该转换。该转换包括从比特流表示生成当前块。在一些实施例中，转换还包括从当前块生成比特流表示。

在一些实施例中，属性包括当前块的当前图片和当前块的参考图片之间的距离。在一些实施例中，属性包括图片顺序计数(POC)的差。在一些实施例中，属性包括当前块的当前图片的时域层标识符。在一些实施例中，属性包括当前块的当前图片是否被视频的其他图片引用。在一些实施例中，属性包括当前块的量化参数。

在一些实施例中，规则还指定，在当前块的预定义编码深度处，在当前块和临近块使用跳过模式进行编码的情况下，禁用后续分割过程。在一些实施例中，该规则还指定在当前块和临近块使用Merge模式进行编码的情况下禁用后续分割过程。在一些实施例中，该规则还指定在当前块的父块使用跳过模式进行编码的情况下禁用后续分割过程。

在一些实施例中，该规则还指定在当前块的编码深度大于先前编码的块的平均编码深度的情况下禁用EQT分割过程。先前编码的块的平均编码深度可以基于二叉树分割过程、四叉树分割过程或EQT分割过程来计算。在一些实施例中，将表示当前块的编码深度和先前编码的块的平均编码深度之间的关系的阈值与阈值表进行比较，以确定是否禁用EQT分割过程。在一些实施例中，平均编码深度是在先前编码的图片、条带或片上计算的。在一些实施例中，平均编码深度是针对当前块所在的时域层计算的。在一些实施例中，平均编码深度是仅针对视频的第一时域层计算的。在一些实施例中，平均编码深度是基于二叉树水平分割计算的。在一些实施例中，平均编码深度是基于二叉树垂直分割计算的。在一些实施例中，平均编码深度是以当前块中的特定位置的数量而确定的。在一些实施例中，特定位置的数量等于7。

在一些实施例中，该规则还指定在当前块的尺寸小于先前编码的块的平均尺寸的情况下禁用EQT分割过程。在一些实施例中，平均尺寸是针对先前编码的图片、条带或片的块计算的。在一些实施例中，平均尺寸是针对当前块所在的时域层的块计算的。在一些实施例中，平均尺寸是仅针对视频的第一时域层的块计算。

所公开的技术的一些实施例包括做出启用视频处理工具或模式的决定或确定。在一个示例中，当视频处理工具或模式被启用时，编码器将在视频块的处理中使用或实施该工具或模式，但是不一定基于该工具或模式的使用来修改得到的比特流。也就是说，当基于决定或确定启用视频处理工具或模式时，从视频块到视频的比特流表示的转换将使用视频处理工具或模式。在另一示例中，当启用视频处理工具或模式时，解码器将在知道已经基于视频处理工具或模式修改了比特流的情况下处理比特流。也就是说，将使用基于决定或确定而启用的视频处理工具或模式来执行从视频的比特流表示到视频块的转换。

所公开的技术的一些实施例包括做出禁用视频处理工具或模式的决定或确定。在一个示例中，当视频处理工具或模式被禁用时，编码器将在视频块到视频的比特流表示的转换中不使用该工具或模式。在另一示例中，当视频处理工具或模式被禁用时，解码器将在知道还没有使用基于决定或确定而启用的视频处理工具或模式来修改比特流的情况下处理比特流。

本文档中描述的公开的内容和其他实施例、模块和功能操作可以在数字电子电路中实施，或者在计算机软件、固件或硬件中实施，包括本文档中公开的结构及其结构等同物，或者在它们中的一个或多个的组合中实施。所公开的内容和其他实施例可以实施为一个或多个计算机程序产品，即编码在计算机可读介质上的计算机程序指令的一个或多个模块，用于由数据处理装置执行或控制数据处理装置的操作。计算机可读介质可以是机器可读存储设备、机器可读存储基底、存储器设备、产生机器可读传播信号的物质的合成物、或者它们中的一个或多个的组合。术语“数据处理装置”涵盖用于处理数据的所有装置、设备和机器，包括例如可编程处理器、计算机或者多个处理器或计算机。除了硬件之外，该装置还可以包括为所讨论的计算机程序创建运行环境的代码，例如，构成处理器固件、协议栈、数据库管理***、操作***或它们中的一个或多个的组合的代码。传播信号是人工生成的信号，例如，机器生成的电信号、光信号或电磁信号，其被生成来编码信息以传输到合适的接收器装置。

计算机程序(也称为程序、软件、软件应用、脚本或代码)可以以任何形式的编程语言编写，包括编译或解释语言，并且可以以任何形式部署，包括作为独立程序或作为模块、组件、子例程或适合在计算环境中使用的其他单元。计算机程序不一定对应于文件***中的文件。程序可以存储在保存其他程序或数据的文件的一部分中(例如，以标记语言文档的形式存储的一个或多个脚本)，存储在专用于所讨论的程序的单个文件中，或者存储在多个协调文件中(例如，存储一个或多个模块、子程序或代码部分的文件)。计算机程序可以被部署为在位于一个站点或分布在多个站点并通过通信网络互连的一个或多个计算机上运行。

本文档中描述的过程和逻辑流程可以由一个或多个可编程处理器执行，该处理器运行一个或多个计算机程序以通过对输入数据进行操作并生成输出来执行功能。过程和逻辑流程也可以由专用逻辑电路来执行，并且装置也可以实施为专用逻辑电路，例如，FPGA(现场可编程门阵列)或ASIC(专用集成电路)。

举例来说，适于运行计算机程序的处理器包括通用和专用微处理器，以及任何类型的数字计算机的任何一个或多个处理器。通常，处理器将从只读存储器或随机存取存储器或两者接收指令和数据。计算机的基本元素是用于执行指令的处理器和用于存储指令和数据的一个或多个存储器设备。通常，计算机还将包括一个或多个用于存储数据的大容量存储设备，例如，磁盘、磁光盘或光盘，或者被可操作地耦合以从这样的大容量存储设备接收数据，或者将数据传输到这样的大容量存储设备，或者两者兼有。然而，计算机不需要这样的设备。适于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、介质和存储器设备，包括例如半导体存储器设备，例如，EPROM、EEPROM和闪存设备；磁盘，例如，内部硬盘或可移动磁盘；磁光盘；以及CD ROM和DVD-ROM盘。处理器和存储器可以由专用逻辑电路来补充或并入专用逻辑电路。

虽然本专利文档包含许多细节，但这些不应被解释为对任何发明或所要求保护的范围的限制，而是特定于特定发明的特定实施例的描述。本专利文档中在单独实施例的上下文中描述的某些特征也可以在单个实施例中组合实施。相反，在单个实施例的上下文中描述的各种特征也可以在多个实施例中单独或以任何合适的子组合来实施。此外，尽管上述特征可以被描述为以某些组合起作用，甚至最初被要求这样保护，但是在一些情况下，可以从该组合中删除所要求保护的组合中的一个或多个特征，并且所要求保护的组合可以指向子组合或子组合的变体。

类似地，尽管在附图中以特定顺序描述了操作，但这不应理解为要求以所示的特定顺序或以依次顺序执行这些操作，或者要求执行所有所示的操作，以获得期望的结果。此外，在本专利文档中描述的实施例中的各种***组件的分离不应该理解为在所有实施例中都需要这种分离。

仅描述了几个实施方式和示例，并且可以基于本专利文档中所描述和图示的内容进行其他实施、增强和变化。

Claims

1.一种用于视频处理的方法，包括：

对于视频的当前块和所述视频的比特流表示之间的转换，基于规则确定扩展四叉树(EQT)分割过程是否适用于所述当前块，其中所述EQT分割过程包括将给定块恰好分割成四个子块，其中至少一个子块的尺寸不同于所述给定块的宽度的一半乘以所述给定块的高度的一半，并且其中所述规则基于与所述当前块相关联的属性来指定所述EQT分割过程的最大深度；和

基于所述确定执行所述转换。

2.根据权利要求1所述的方法，其中，所述转换包括从所述比特流表示生成所述当前块。

3.根据权利要求1所述的方法，其中，所述转换包括从所述当前块生成所述比特流表示。

4.根据权利要求1至3中任何一项所述的方法，其中，所述属性包括所述当前块的当前图片和所述当前块的参考图片之间的距离。

5.根据权利要求1至4中任何一项所述的方法，其中，所述属性包括图片顺序计数(POC)的差。

6.根据权利要求1至3中任何一项所述的方法，其中，所述属性包括所述当前块的当前图片的时域层标识符。

7.根据权利要求1至3中任何一项所述的方法，其中，所述属性包括所述当前块的当前图片是否被所述视频的其他图片引用。

8.根据权利要求1至3中任何一项所述的方法，其中，所述属性包括所述当前块的量化参数。

9.根据权利要求1至8中任何一项所述的方法，其中，所述规则还指定在所述当前块的预定义编码深度处，在使用跳过模式对所述当前块和临近块进行编码的情况下，禁用后续分割过程。

10.根据权利要求1至8中任何一项所述的方法，其中，所述规则还指定在使用Merge模式对所述当前块和临近块进行编码的情况下，禁用后续分割过程。

11.根据权利要求1至8中任何一项所述的方法，其中，所述规则还指定在使用跳过模式对所述当前块的父块进行编码的情况下，禁用后续分割过程。

12.根据权利要求1至8中任何一项所述的方法，其中，所述规则还指定在所述当前块的编码深度大于先前编码的块的平均编码深度的情况下，禁用所述EQT分割过程。

13.根据权利要求12所述的方法，其中，基于对所述先前编码的块执行的二叉树分割过程、四叉树分割过程或EQT分割过程，来计算所述先前编码的块的平均编码深度。

14.根据权利要求12或13所述的方法，其中，将表示所述当前块的编码深度和所述先前编码的块的平均编码深度之间的关系的阈值与阈值表进行比较，以确定是否禁用所述EQT分割过程。

15.根据权利要求12至14中任何一项所述的方法，其中，所述平均编码深度是在先前编码的图片、条带或片上计算的。

16.根据权利要求12至15中任何一项所述的方法，其中，所述平均编码深度是针对所述当前块所在的时域层计算的。

17.根据权利要求12至15中任何一项所述的方法，其中，所述平均编码深度是仅针对所述视频的第一时域层计算的。

18.根据权利要求12至17中任何一项所述的方法，其中，所述平均编码深度是基于二叉树水平划分计算的。

19.根据权利要求12至18中任何一项所述的方法，其中，所述平均编码深度是基于二叉树垂直划分计算的。

20.根据权利要求12至19中任何一项所述的方法，其中，所述平均编码深度是以所述当前块中的特定位置的数量而确定的。

21.根据权利要求20所述的方法，其中，所述特定位置的数量等于7。

22.根据权利要求1至20中任何一项所述的方法，其中，所述规则还指定在所述当前块的尺寸小于先前编码的块的平均尺寸的情况下，禁用所述EQT分割过程。

23.根据权利要求22所述的方法，其中，所述平均尺寸是针对先前编码的图片、条带或片的块计算的。

24.根据权利要求22或23所述的方法，其中，所述平均尺寸是针对所述当前块所在的时域层的块计算的。

25.根据权利要求22至24中任何一项所述的方法，其中，所述平均尺寸是仅针对所述视频的第一时域层的块计算的。

26.一种视频处理装置，包括被配置为实施根据权利要求1至25中任何一项所述的方法的处理器。

27.一种计算机可读介质，包括程序，该程序包括用于处理器执行根据权利要求1至25中任何一项所述的方法的代码。