CN117044207A

CN117044207A - 图像/视频编解码中的边界填充尺寸

Info

Publication number: CN117044207A
Application number: CN202280016193.2A
Authority: CN
Inventors: 邓智玭; 张凯; 张莉; 张娜; 王洋
Original assignee: Douyin Vision Co Ltd; ByteDance Inc
Current assignee: Douyin Vision Co Ltd; ByteDance Inc
Priority date: 2021-02-20
Filing date: 2022-02-18
Publication date: 2023-11-10
Also published as: WO2022174801A1; US20230396796A1

Abstract

一种由视频编解码装置实现的方法。该方法包括根据视频单元的特性确定视频的视频单元的填充尺寸，其中填充尺寸为水平填充尺寸(padW)或垂直填充尺寸(padH)。该方法还包括根据所确定的填充尺寸在视频的视频单元和比特流之间进行转换。

Description

图像/视频编解码中的边界填充尺寸

相关申请的交叉引用

本申请是北京字节跳动网络技术有限公司于2021年2月20日提交的且申请名称为“图像/视频编解码中的边界填充尺寸”的国际申请No.PCT/CN2021/077047的继续申请，其内容通过引用并入本文。

技术领域

本公开一般涉及视频编解码，具体地涉及图像/视频编解码中的帧间预测。

背景技术

在互联网和其他数字通信网络中，数字视频占用了最大的带宽。随着能够接收和显示视频的连接用户设备数量的增加，预计数字视频使用的带宽需求将继续增长。

发明内容

所公开的方面/实施例根据视频单元的特性来确定视频的视频单元的填充尺寸，而不是基于运动矢量在运动补偿过程期间恰好落在何处。因此，视频编解码相对于现有技术得到改进。

第一方面涉及一种由视频编解码装置实现的用于编解码视频数据的方法。该方法包括：根据视频单元的特性确定视频的视频单元的填充尺寸，其中填充尺寸包括水平填充尺寸(padW)或垂直填充尺寸(padH)；以及根据所确定的填充尺寸在视频的视频单元和比特流之间进行转换。

可选地，在前述方面中的任一项中，该方面的另一实现方式规定，视频单元的特性包括编解码树单元(CTU)的尺寸、插值滤波器的长度或视频单元的尺寸。

可选地，在前述方面中的任一项中，该方面的另一实现方式规定，水平填充尺寸和垂直填充尺寸根据公式a×尺寸来确定，a是正整数，并且尺寸是基于CTU的尺寸的正整数。

可选地，在前述方面中的任一项中，该方面的另一实现方式规定，根据公式a×(尺寸+偏移)确定水平填充尺寸和垂直填充尺寸，a是正整数，尺寸是基于CTU的尺寸的正整数，并且偏移是基于插值滤波器的长度的正整数。

可选地，在前述方面中的任一项中，该方面的另一实现方式规定，水平填充尺寸和垂直填充尺寸基于是否应用参考图片重采样(RPR)或者基于参考图片重采样因子的尺寸。

可选地，在前述方面中的任一项中，该方面的另一实现方式规定，视频单元的水平填充尺寸和垂直填充尺寸不同于第二视频单元的第二水平填充尺寸和第二垂直填充尺寸。

可选地，在前述方面中的任一项中，该方面的另一实现方式规定，水平填充尺寸和垂直填充尺寸基于视频单元的颜色分量或颜色格式。

可选地，在前述方面中的任一项中，该方面的另一实现方式规定，水平填充尺寸和垂直填充尺寸定义视频单元周围的填充区域，并且第一填充区域可具有与第二填充区域不同的尺寸。

可选地，在前述方面中的任一项中，该方面的另一实现方式规定，水平填充尺寸和垂直填充尺寸是根据具有第一最大尺寸的第一填充过程来确定的，并且第二水平填充尺寸和第二垂直填充尺寸是根据在第一填充过程之后实现的并且具有第二最大尺寸的第二填充过程来确定的。

可选地，在前述方面中的任一项中，该方面的另一实现方式规定，第一最大尺寸不同于第二最大尺寸。

可选地，在前述方面中的任一项中，该方面的另一实现方式规定，根据公式a×(尺寸+偏移)来确定第二水平填充尺寸和第二垂直填充尺寸。

可选地，在前述方面中的任一项中，该方面的另一实现方式规定，第二水平填充尺寸和第二垂直填充尺寸基于是否应用参考图片重采样或者参考图片重采样因子的尺寸。

可选地，在前述方面中的任一项中，该方面的另一实现方式规定，水平填充尺寸和垂直填充尺寸定义视频单元周围的相邻填充区域和角填充区域，并且在用填充样点填充角填充区域之前用填充样点填充相邻填充区域。

可选地，在前述方面中的任一项中，该方面的另一实现方式规定，水平填充尺寸和垂直填充尺寸定义视频单元周围的相邻填充区域和角填充区域，并且在用填充样点填充角填充区域之后用填充样点填充相邻填充区域。

可选地，在前述方面中的任一项中，该方面的另一实现方式规定，根据第一预定义顺序来填充相邻填充区域，并且根据第二预定义顺序来填充角填充区域。

可选地，在前述方面中的任一项中，该方面的另一实现方式规定，水平填充尺寸和垂直填充尺寸定义视频单元周围的相邻填充区域和角填充区域，并且角填充区域用来自视频单元的边界样点或来自相邻填充区域的填充样点来填充。

可选地，在前述方面中的任一项中，该方面的另一实现方式规定，使用与角填充区域中的第一角填充区域紧邻的填充样点之一来填充第一角填充区域。

可选地，在前述方面中的任一项中，该方面的另一实现方式规定，视频单元的角中的重建样点被用来填充角填充区域中的第一角填充区域。

可选地，在前述方面中的任一项中，该方面的另一实现方式规定，水平填充尺寸和垂直填充尺寸定义视频单元周围的相邻填充区域和角填充区域，并且相邻填充区域和角填充区域填充有M×N填充样点，其中M表示亮度样点中的每个填充样点的宽度，并且N表示亮度样点中每个填充样点的高度。

可选地，在前述方面中的任一项中，该方面的另一实现方式规定，M不等于N。

可选地，在前述方面中的任一项中，该方面的另一实现方式规定，M和N中的一个或多个基于水平填充尺寸或垂直填充尺寸。

可选地，在前述方面中的任一项中，该方面的另一实现方式规定，填充样点的宽度或填充样点的高度基于视频单元内的边界样点的尺寸。

可选地，在前述方面中的任一项中，该方面的另一实现方式规定，视频单元的列或行中的一个或多个边界样点被用来填充相邻填充区域或角填充区域。

可选地，在前述方面中的任一项中，该方面的另一实现方式规定，视频单元的一侧上的列或行中的一个或多个边界样点被用来填充视频单元的相对侧上的相邻填充区域。

可选地，在前述方面中的任一项中，该方面的另一实现方式规定，水平填充尺寸和垂直填充尺寸定义视频单元周围的相邻填充区域和角填充区域，并且视频单元中的一个或多个边界样点的运动矢量被取整为整数像素精度以导出用于填充相邻填充区域和角填充区域的填充样点。

第二方面涉及一种用于编解码视频数据的装置，包括处理器和其上具有指令的非暂时性存储器，其中指令在由处理器执行时使得处理器执行本文公开的方法中的任一个。

第三方面涉及一种非暂时性计算机可读介质，包括供编解码装置使用的计算机程序产品，计算机程序产品包括存储在非暂时性计算机可读介质上的计算机可执行指令，计算机可执行指令在由一个或多个处理器执行时使编解码装置执行本文公开的方法中的任一个。

为清晰起见，任何一个前述实施例可与任何一个或多个其他前述实施例组合，以在本公开的范围内形成新的实施例。

从以下结合附图和权利要求的详细说明中，可更清楚地理解这些和其他特征。

附图说明

为了更全面地理解本公开内容，现结合附图和详细说明参考以下简要说明，其中相同的参考数字代表相同的部件。

图1是图示单向帧间预测的示例的示意图；

图2是图示双向帧间预测的示例的示意图；

图3是视频比特流的实施例的示意图；

图4是使用设置在视频单元周围的填充区域将视频单元填充或扩大至较大的视频单元的示意图；

图5是使用设置在视频单元周围的扩展区域将视频单元填充或扩大至较大的视频单元的示意图；

图6是根据本公开的实施例的一种用于编解码视频数据的方法；

图7是一种编码器的示意图；

图8是显示示例视频处理***的框图；

图9是一种视频处理装置的框图；

图10是图示视频编解码***的示例的框图；

图11是图示视频编码器的示例的框图；以及

图12是图示视频解码器的示例的框图。

具体实施方式

首先应理解，尽管下文提供了一个或多个实施例的说明性实现方式，但可使用任何数量的技术实现所公开的***和/或方法，无论是当前已知的还是现有的。本公开不应以任何方式限于以下示出的示例性实现方式、附图和技术，包括在此示出和描述的示例性设计和实现方式，而是可以在所附权利要求及其等同物的全部范围内进行修改。

视频编解码标准主要是通过众所周知的ITU-T和ISO/IEC标准的发展而得以演进。ITU-T制作了H.261和H.263标准，ISO/IEC制作了MPEG-1和MPEG-4Visual标准，并且两个组织联合制作了H.262/MPEG-2视频标准和H.264/MPEG-4高级视频编解码(AVC)标准和H.265/HEVC标准。

从H.262开始，视频编解码标准基于混合视频编解码结构，其中利用时域预测加变换编解码。为了探索HEVC之外的未来视频编解码技术，由VCEG和MPEG于2015年联合成立联合视频探索团队(JVET)。从那时起，JVET采用了许多新方法并将其纳入名为联合探索模型(JEM)的参考软件。

2018年4月，VCEG(Q6/16)和ISO/IEC JTC1SC29/WG11(MPEG)之间成立了联合视频专家团队(JVET)，致力于制定多功能视频编解码(VVC)标准(也称为H.266)，目标是与HEVC相比降低50％比特率。VVC的第一个版本于2020年7月完成。

在一些描述中使用H.266术语只是为了便于理解，而不是为了限制所公开技术的范围。因此，本文描述的技术也适用于其他视频编解码器协议和设计。这些思想可以单独地或以各种组合应用于任何图像/视频编解码标准或非标准图像/视频编解码器，例如下一代图像/视频编解码标准。

图1是图示单向帧间预测100的示例的示意图。单向帧间预测100可用于确定在分割图片时创建的编码的和/或解码的块的运动矢量。

单向帧间预测100采用具有参考块131的参考帧130来预测当前帧110中的当前块111。如图所示，参考帧130可以在时间上定位在当前帧110之后(例如，作为后续参考帧)，但是在一些示例中，参考帧130也可以在时间上定位在当前帧110之前(例如，作为先前参考帧)。当前帧110是在特定时间被编码/解码的示例帧/图片。当前帧110包含与参考帧130的参考块131中的对象匹配的当前块111中的对象。参考帧130是用作对当前帧110进行编码的参考的帧，并且参考块131是参考帧130中的包含也包含在当前帧110的当前块111中的对象的块。

当前块111是在编解码过程中的规定点处正在被编码/解码的任意编解码单元。当前块111可以是整个分割块，或者当采用仿射帧间预测模式时可以是子块。当前帧110与参考帧130分开某个时域距离(TD)133。TD 133指示视频序列中当前帧110与参考帧130之间的时间量，并且可以以帧为单位来测量。当前块111的预测信息可以通过指示帧之间的方向和时域距离的参考索引来参考参考帧130和/或参考块131。在由TD 133表示的时间段内，当前块111中的对象从当前帧110中的位置移动到参考帧130中的另一个位置(例如，参考块131的位置)。例如，对象可以沿着运动轨迹113移动，运动轨迹113是对象随时间的移动方向。运动矢量135描述对象在TD 133上沿运动轨迹113移动的方向和幅度。因此，编码的运动矢量135、参考块131和包括当前块111与参考块131之间的差的残差提供足以重建当前块111以及在当前帧110中定位当前块111的信息。

图2是图示双向帧间预测200的示例的示意图。双向帧间预测200可用于确定在分割图片时创建的编解的码和/或解码的块的运动矢量。

双向帧间预测200类似于单向帧间预测100，但是采用一对参考帧来预测当前帧210中的当前块211。因此，当前帧210和当前块211分别基本上类似于当前帧110和当前块111。当前帧210在时间上定位在视频序列中当前帧210之前出现的先前参考帧220和视频序列中当前帧210之后出现的后续参考帧230之间。先前参考帧220和后续参考帧230在其他方面基本上类似于参考帧130。

当前块211与先前参考帧220中的先前参考块221匹配，并且与后续参考帧230中的后续参考块231匹配。这样的匹配指示，在视频序列的过程中，对象沿着运动轨迹213并经由当前块211从先前参考块221处的位置移动到后续参考块231处的位置。当前帧210与先前参考帧220分开某个先前时域距离(TD0)223，并且与后续参考帧230分开某个后续时域距离(TD1)233。TD0223以帧为单位指示视频序列中的先前参考帧220与当前帧210之间的时间量。TD1 233以帧为单位指示视频序列中的当前帧210和后续参考帧230之间的时间量。因此，对象在TD0 223指示的时间段内沿着运动轨迹213从先前参考块221移动到当前块211。对象还在TD1 233指示的时间段内沿着运动轨迹213从当前块211移动到后续参考块231。当前块211的预测信息可通过指示帧之间的方向和时域距离的一对参考索引来参考先前参考帧220和/或先前参考块221以及后续参考帧230和/或后续参考块231。

先前运动矢量(MV0)225描述对象沿着TD0 223上的运动轨迹213(例如，在先前参考帧220与当前帧210之间)的移动的方向和幅度。后续运动矢量(MV1)235描述对象沿着TD1233上的运动轨迹213(例如，在当前帧210与后续参考帧230之间)的运动的方向和幅度。这样，在双向帧间预测200中，可以通过采用先前参考块221和/或后续参考块231、MV0 225和MV1 235来对当前块211进行编解码和重建。

在一个实施例中，帧间预测和/或双向帧间预测可以在逐个样点(例如，逐个像素)的基础上而不是在逐块的基础上执行。即，可以针对当前块211中的每个样点确定指向先前参考块221和/或后续参考块231中的每个样点的运动矢量。在这样的实施例中，图2中描绘的运动矢量225和运动矢量235表示与当前块211、先前参考块221和后续参考块231中的多个样点对应的多个运动矢量。

在merge模式和高级运动矢量预测(AMVP)模式中，通过以候选列表确定模式定义的顺序将候选运动矢量添加至候选列表，来生成候选列表。这样的候选运动矢量可以包括根据单向帧间预测100、双向帧间预测200或其组合的运动矢量。具体地，当对相邻块进行编码时，为这些块生成运动矢量。这样的运动矢量被添加到当前块的候选列表，并且从候选列表中选择当前块的运动矢量。然后可以信令通知该运动矢量，作为候选列表中所选运动矢量的索引。解码器可以使用与编解码器相同的过程来构建候选列表，并且可以基于信令通知的索引从候选列表确定所选择的运动矢量。因此，候选运动矢量包括根据单向帧间预测100和/或双向帧间预测200生成的运动矢量，这取决于当对这样的相邻块进行编码时使用哪种方法。

图3是视频比特流300的实施例的示意图。如本文所使用的，视频比特流300也可以被称为编解码视频比特流、比特流或其变体。如图3所示，比特流300包括以下一项或多项：序列参数集(SPS)306、图片参数集(PPS)308、图片标头(PH)312和图片314。SPS 306和PPS308可以统称为参数集。在一个实施例中，图3中未示出的其他参数集也可以包括在比特流300中，例如视频参数集(VPS)、自适应参数集(APS)等。

SPS 306包含图片序列(SOP)中的所有图片所共用的数据。SPS 306是包含应用于零个或多个完整CLVS的语法元素的语法结构，如由在PPS中找到的语法元素的内容所确定的，PPS由在每个图片标头中找到的语法元素所参考。相反，PPS 308包含整个图片所共用的数据。PPS 308是包含应用于零个或多个完整编解码图片的语法元素的语法结构。

SPS 306和PPS 308包含在不同类型的网络抽象层(NAL)单元中。NAL单元是包含要跟随的数据类型(例如，编解码视频数据)的指示的语法结构。NAL单元被分类为视频编解码层(VCL)和非VCL NAL单元。VCL NAL单元包含表示视频图片中样点的值的数据，并且非VCLNAL单元包含任何相关的附加信息，例如参数集(可应用于多个VCL NAL单元的重要数据)和补充增强信息(定时信息和其他补充数据，其可以增强解码视频信令通知的可用性，但是对于解码视频图片中的样点的值不是必需的)。

在一个实施例中，SPS 306是被指定为SPS NAL单元的非VCL NAL单元。因此，SPSNAL单元具有SPS NUT。在一个实施例中，PPS 308包含在被指定为PPS NAL单元的非VCL NAL单元中。因此，PPS NAL单元具有PPS NUT。

PH 312是包含适用于编解码图片(例如，图片314)的所有条带(例如，条带318)的语法元素的语法结构。在一个实施例中，PH 312在被指定为PH NAL单元的非VCL NAL单元中。因此，PH NAL单元具有PH NUT(例如，PH_NUT)。在一个实施例中，对于比特流300中的每个图片314存在一个PH NAL单元。

图片314为单色格式的亮度样点阵列或4:2:0、4:2:2和4:4:4彩色格式的亮度样点阵列和两个对应的色度样点阵列。图片314可以是帧或场。然而，在一个编解码视频序列(CVS)316中，所有图片314都是帧，或者所有图片314都是场。CVS 316是视频比特流300中每个编解码层视频序列(CLVS)的编解码视频序列。值得注意的是，当视频比特流300包括单层时，CVS 316和CLVS是相同的。只有当视频比特流300包括多层时，CVS 316和CLVS才不同。

每个图片314包含一个或多个条带318。条带318是图片(例如，图片314)的片内的整数个完整片或整数个连续完整编解码树单元(CTU)行。每个条带318被排他地包含在单个NAL单元(例如，VCL NAL单元)中。片(未示出)是图片(例如图片314)中的特定片列和特定片行内的CTU的矩形区域。CTU(未示出)是亮度样点的编解码树块(CTB)、具有三个样点阵列的图片的色度样点的两个对应的CTB、或者单色图片或使用三个单独的颜色平面和用于对样点进行编解码的语法结构来编解码的图片的样点的CTB。CTB(未示出)是针对某个N值的N×N样点块，使得将分量划分为CTB是分割。块(未示出)是样点(例如，像素)的M×N(M列乘N行)阵列，或者变换系数的M×N阵列。

每个CTB可以被不同地划分成多个编解码块(CB)。CB是执行图片间预测还是执行图片内预测的决策点。更准确地，预测类型在编解码单元(CU)中被编解码。CU由三个CB(Y、Cb和Cr)和关联的语法元素组成。

在一个实施例中，每个条带318包含条带标头320。条带标头320是编解码条带318的一部分，其包含与条带318中表示的片内的所有片或CTU行有关的数据元素。也就是说，条带标头320包含关于条带318的信息，例如条带类型、将使用哪个参考图片等等。

图片314及其条带318包括与正被编码或解码的图像或视频相关联的数据。因此，图片314及其条带318可以简单地称为比特流300中携带的有效负载或数据。

本领域技术人员应当理解，在实际应用中，比特流300可以包含其他参数和信息。

复制或重复填充可用于将图片扩大到更大的尺寸。更具体地，参考图片(例如，图1中的参考帧130，或者图2中的先前参考帧220或后续参考帧231)被扩大以形成更大的图片。例如，位于参考图片的左边界处的边界样点被复制到参考图片的左边，位于参考图片的右边界处的边界样点被复制到参考图片的右边，位于参考图片的顶部边界处的边界样点被复制到参考图片的上方，并且位于参考图片的底部边界处的边界样点被复制到参考图片的下方。这些位于参考图片外部的复制边界样点被称为填充样点。

对于当前图片编解码，当当前块(例如，当前块111)的运动矢量(例如，MV135)指向(部分或完全)位于参考图片(例如，参考帧130)外部的参考块(例如，参考块131)时，从参考图片边界外部的填充样点生成当前块的预测块。

运动补偿边界填充在2018年Y.W.Chen等人的JEVT文档JVET-J0021“高通和Technicolor的SDR HDR和360°视频编解码技术提案的描述-低和高复杂性版本”中讨论。当解码器执行运动补偿时，如果运动矢量指向参考帧边界之外的块，则参考块的一部分不可用。为了解决这个问题，可以使用填充样点来扩大或放大参考图片/帧。对于沿着要填充的参考图片的边界的尺寸为4×M或M×4的每个区域，M是期望的帧边界扩展，从帧内最近的4×4块导出运动矢量。如果最近的4×4块被帧内编解码，则使用零运动矢量。如果用双向帧间预测对最近的4×4块进行编解码，则只有指向远离帧边界的像素的运动矢量被用于填充的运动补偿。在运动矢量导出之后，然后执行运动补偿以获得填充区域中的像素，同时考虑最近的4×4块与其参考图片中的对应块之间的平均像素值偏移。

由于现有标准中复制填充的基本原理，填充长度可以是任意值，只要填充长度不超过运动矢量的允许范围。当应用运动补偿填充时，这种基本原理不再有效。

本文公开了解决上述问题和一些未提及的其他问题的技术。例如，本文公开的技术根据视频单元的特性而不是基于运动补偿过程期间运动矢量恰好落在何处来确定视频的视频单元的填充尺寸。本文描述的技术应被视为解释一般概念的示例，并且不应以狭隘的方式解释。此外，这些项目可以单独应用或以任意方式组合应用。

图4是使用设置在视频单元400周围的填充区域404将视频单元400(例如，图片、条带、片、子图片、参考图片等)填充或扩大为较大的视频单元402的示意图。视频单元400具有高度406(PicH)和宽度408(PicW)。每个填充区域404具有水平填充尺寸410(PadH)和垂直填充尺寸412(PadW)。因此，较大视频单元402具有(picW+2×padW)×(picH+2×padH)的总体尺寸。为了讨论的目的，填充区域404被标记为区域0、区域1、区域2、区域3、区域4、区域5、区域6和区域7。标记为区域0、区域1、区域2、区域3的填充区域404在本文中可以被称为相邻填充区域。另外，标记为区域4、区域5、区域6和区域7的填充区域404在本文中可以被称为角填充区域。

在本公开中，视频单元(picW×picH)被填充为更大的图片(picW+2×padW)×(picH+2×padH)。PicW和picH分别表示宽度和高度上的视频单元(例如，图片)尺寸。padW和padH分别表示沿着宽度和高度方向的一侧的填充长度，如图4所示。

注意，在下面的描述中，假设视频单元是图片。还假设仅将图片picW×picH编解码为压缩比特流，而在编码器侧和解码器侧两处生成填充区域以形成更大的参考图片，用于按解码顺序对未来图片进行帧间预测。

图5是使用设置在视频单元500周围的扩展区域504将视频单元500填充或扩大为较大视频单元502的示意图。图5的视频单元500和较大视频单元502分别类似于图4的视频单元400和较大视频单元402。图5中的扩展区域504相当于图4中填充区域404的顶点。

如图所示，视频单元500包括设置在视频单元500内的边界样点506。当边界样点506与扩展区域504中的填充样点508相邻时，视频单元500中的边界样点506被认为对应于扩展区域504中的填充样点508。也就是说，边界样点506与扩展区域504中的填充样点508紧邻或直接穿过扩展区域504中的填充样点508。扩展区域504被认为对应于填充样点508。

设置在视频单元500的顶部处的边界样点506被认为是在顶行510中。类似地，设置在视频单元500的左侧处的边界样点506被认为是在左列512中。以类似的方式，本领域技术人员将认识到，设置在视频单元500的底部(未示出)处的边界样点506被认为是在底行(未示出)中并且设置在视频单元500的右侧(未示出)处的边界样点506被认为是在右列(未示出)中。行和列(例如，行510和列512)的交叉点处的边界样点506可以被称为角边界样点。

与边界样点506类似，填充样点508也可以被认为是按行和列组织的。例如，区域2(见图4-5)的顶部处的填充样点508(或多个样点)被认为是在顶行510中。区域0的最左边处的填充样点508(或多个样点)被认为是在左列512中。

图5中的边界样点506和填充样点508在本文中可分别称为边界块/单元和填充块/单元。图5中的扩展区域508类似于图4中填充区域404的累积。在一个实施例中，边界样点506被称为重建样点或预测样点，并且填充样点508被称为样点或亮度样点。

从前述内容中，应理解，图5描绘了视频单元500内的边界样点506和视频单元500外的填充样点508之间的关系。

图6是根据本公开的实施例的一种用于编解码视频数据的方法600。方法600可以由具有处理器和存储器的视频编解码装置(例如，编码器或解码器)来执行。方法600可在确定如何填充视频单元时实现，作为其中利用帧间预测(也称为运动补偿预测)的运动补偿过程的一部分。

在框602中，视频编解码设备根据视频单元的特性来确定视频的视频单元(例如，视频单元400、500)的填充尺寸。在一个实施例中，填充尺寸包括水平填充尺寸(例如，padW412)或垂直填充尺寸(例如，padH 410)。

在框604中，视频编解码装置根据所确定的填充尺寸在视频的视频单元和比特流(例如，比特流300)之间进行转换。当在编码器中实现时，转换包括接收视频单元(例如，媒体文件)并且将视频单元和任何对应的参数编码成比特流。当在解码器中实现时，转换包括接收包括视频单元和任何对应参数的比特流，以及对比特流进行解码以获得视频单元和任何对应参数。

1.在一个示例中，一个方向上(例如，沿着图片的左/右/上/下侧)的图片的填充长度(例如padW和/或padH)可取决于CTU尺寸和/或帧间插值滤波器长度和/或图片尺寸。在一个实施例中，插值滤波器的长度可以由与滤波器相关联的抽头的数量来指示(例如，滤波器是2抽头滤波器、4抽头滤波器等)。

a.例如，可基于a×(SIZE+偏移)来计算填充长度padW和/或padH，其中a是整数，例如a＝1，SIZE是可能依赖或可能不依赖于CTU宽度或高度的整数，且偏移是可能依赖或可能不依赖于视频单元中使用的插值滤波器长度的整数。

i.在一个示例中，padW和/或padH可以是padW＝a×SIZE(或padH＝a×SIZE)的形式。例如，padW和/或padH必须是偶数，或者padW和/或padH必须是a×B的形式，其中B是常数/变量。

b.例如，padW和/或padH的值可能取决于是否应用参考图片重采样(RPR)和/或参考图片重采样因子有多大。在一个实施例中，RPR是一种算法，用于在参考参考图片之前改变参考图片的尺寸和形状，以便匹配要预测的帧的尺寸和形状。在一个实施例中，重采样因子大于某个值(例如，1)指示上采样，而重采样因子小于某个值则指示下采样。

c.可选地，填充长度padW和/或padH可以是预定义的数字，例如144等。

d.例如，填充长度padW和/或padH可能取决于编码器或解码器(也称为编码器/解码器或“编解码器”)中是否允许第二填充方法。

i.此外，填充长度padW和/或padH可以取决于第二填充方法的允许填充长度。

e.例如，不同的填充长度可以用于视频比特流中的不同图片。

i.可选地，一个填充长度用于视频比特流中的所有图片。

ii.例如，不同的填充长度可以用于不同的条带类型(例如，P或B条带)，或者不同的时域层。

iii.例如在SPS/PPS/图片标头/条带标头/CTU/CU中，可以从编码器向解码器信令通知填充长度。

f.例如，填充长度可以取决于颜色分量和/或颜色格式。讨论了色彩空间和色度子采样。色彩空间，也称为色彩模型(或色彩***)，是一种抽象的数学模型，其简单地将颜色范围描述为数字元组，通常为3或4个值或颜色分量(例如，红绿蓝(RGB))。从根本上说，色彩空间是坐标***和子空间的阐述。

对于视频压缩，最常用的色彩空间是YCbCr和RGB。Y′CbCr或Y Pb/Cb Pr/Cr(也记作YC_BC_R或Y′C_BC_R)是一个色彩空间系列，用作视频和数码摄影***中彩色图像管道的一部分。Y’是亮度分量，并且CB和CR是蓝差和红差色度分量。Y’(带上标符号)不同于Y，Y是亮度，这意味着光强度是基于伽马校正的RGB原色非线性编码的。

色度子采样是利用人类视觉***对色差的敏感度低于对亮度的敏感度，通过对色度信息实现比亮度信息更低的分辨率来对图像进行编码的实践。

对于4:4:4色度子采样，三个Y’CbCr分量中的每一个具有相同的采样率，因此没有色度子采样。这种方案有时用于高端胶片扫描仪和电影后期制作。

对于4:2:2色度子采样，以亮度采样率的一半对两个色度分量进行采样：水平色度分辨率减半。这将未压缩视频信令通知的带宽减少了三分之一，但几乎没有视觉差异。

对于4:2:0色度子采样，与4:1:1相比，水平采样加倍，但由于在该方案中Cb和Cr信道仅在每条交替线上采样，垂直分辨率减半。因此，数据速率是相同的。Cb和Cr分别在水平和垂直两个方向上以两倍的系数进行子采样。4:2:0方案有三种变体，具有不同的水平和垂直选址。

在MPEG-2中，Cb和Cr水平共址。Cb和Cr被选址在垂直方向上的像素之间(选址在空隙中)。在联合图像专家组(JPEG)/JPEG文件交换格式(JFIF)、H.261和MPEG-1中，Cb和Cr被选址在交替亮度样点中间的空隙中。在4:2:0DV中，Cb和Cr在水平方向上共址。在垂直方向上，它们共址在交替线上。

g.例如，图片上方的填充长度(例如，用于区域0的padH)和图片下方的填充长度(例如，用于区域1的padH)可以不同。

h.例如，图片左边的填充长度(例如，区域2的padW)和图片右边的填充长度(例如，区域3的padW)可以不同。

2.在一个示例中，如果允许第二填充方法(除了诸如重复填充的第一填充方法之外)，则第二填充方法的最大允许填充长度可以不同于第一填充方法的填充长度。

a.例如，第二填充方法的最大允许填充长度可以小于(或大于)第一填充方法的填充长度。

b.可选地，第二填充方法的最大允许填充长度可以等于第一填充方法的填充长度。

c.可选地，第二填充方法的最大允许填充长度可以等于任意值(例如，无限制)。

d.例如，第二填充方法的最大允许填充长度可以是预定义的数，例如64、144、160等。

e.例如，第二填充方法的最大允许填充长度可基于a×(SIZE+偏移)来计算，其中a是整数，例如a＝1，SIZE是整数，可取决于或不取决于CTU宽度或高度，偏移是整数，可取决于或不取决于视频单元中使用的插值滤波器长度。

f.例如，第二填充方法的最大允许填充长度可以取决于是否应用RPR和/或参考图片重采样因子有多大。

g.例如，可使用视频单元中的语法元素(例如，SPS/PPS/图片标头/条带标头/CTU/CU)来信令通知使用第一填充方法还是第二填充方法。

3.在一个示例中，为了填充图片的填充区域(例如，区域0…区域7)，可以用以下过程顺序来处理：

a.例如，首先以预定义的顺序填充区域{区域0，区域1，区域2，区域3}，然后以另一个预定义的顺序填充区域{区域4，区域5，区域6，区域7}。

b.例如，首先以任意顺序填充区域{区域0，区域1，区域2，区域3}，然后以任意顺序填充区域{区域4，区域5，区域6，区域7}。

c.例如，首先以预定义的顺序填充区域{区域4，区域5，区域6，区域7}，然后以另一个预定义的顺序填充区域{区域0，区域1，区域2，区域3}。

d.例如，首先以任意顺序填充区域{区域4，区域5，区域6，区域7}，然后以另一个预定义的顺序填充区域{区域0，区域1，区域2，区域3}。

e.在一个示例中，在第一填充区域在第二填充区域之前被填充的情况下，第一填充区域可以用于填充第二填充区域。

4.在一个示例中，当填充较大图片(例如，较大图片402)的角部分处的区域(左上角处的区域4、右上角处的区域5、左下角处的区域6、右下角处的区域7)时，样点直接从来自当前图片或已经填充的区域的可用边界样点复制。

a.例如，为了填充左上角处的样点(例如较大图片的区域4)，可以复制在右边上的已经填充的区域(例如区域0)的最接近的样点。例如，位于区域0的最左列处的边界样点被复制到左侧并填充区域4。

i.可选地，可以复制在底部上的已经填充的区域(例如区域2)的最接近的样点。例如，位于区域2最上面一行处的边界样点被复制到上侧并填充区域4。

ii.可选地，可以复制当前图片的一个或多个重建样点。例如，位于当前图片的左上角(即最上面一行和最左列)处的样点被复制以填充区域4。

b.例如，为了填充右上角处的样点(例如较大图片的区域5)，可以复制在左边上的已经填充的区域(例如区域0)的最接近的样点。例如，位于区域0的最右列处的边界样点被复制到右侧并填充区域5。

i.可选地，可以复制在底部上的已经填充的区域(例如区域3)的最接近的样点。例如，位于区域3最上面一行处的边界样点被复制到上侧并填充区域5。

ii.可选地，可以复制当前图片的重建样点。例如，位于当前图片的右上角(即最顶部一行和最右列)处的样点被复制以填充区域5。

c.例如，为了填充左下角处的样点(例如较大图片的区域6)，可以复制在右边上的已经填充的区域(例如区域1)的最接近的样点。例如，位于区域1的最左列处的边界样点被复制到左侧并填充区域6。

i.可选地，可以复制在上面的已经填充的区域(例如区域2)的最接近的样点。例如，位于区域2最底部一行处的边界样点被向下复制并填充区域6。

ii.可选地，可以复制当前图片的重建样点。例如，位于当前图片的左下角(即，最底部一行和最左列)处的样点被复制以填充区域6。

d.例如，为了填充右下角处的样点(例如较大图片的区域7)，可以复制在左边上的已经填充的区域(例如区域1)的最接近的样点。例如，位于区域1的最右列处的边界样点被复制到右侧并填充区域7。

i.可选地，可以复制在上面的已经填充的区域(例如区域3)的最接近的样点。例如，位于区域3的最底部一行处的边界样点被向下复制并填充区域7。

ii.可选地，可以复制当前图片的重建样点。例如，位于当前图片的右下角(即最底部一行和最右列)处的样点被复制以填充区域7。

5.在一个示例中，对于要填充的某个扩展区域(例如图4中的区域0…区域7)，可以以M×N粒度的方式填充，其中M是亮度样点中填充单元/块的宽度，并且N是亮度样点中填充单元/块的高度。

a.例如，当将扩展区域直接填充到图片的上方和/或下方时(例如图4中的区域0和/或区域1)。

i.例如，M和/或N可以取决于运动压缩单元的尺寸，例如4×4、8×8或16×16，这取决于编解码器的类型。

ii.例如，M不等于n。

iii.例如，M可以是预定义的数，例如M＝4、8或16等。

iv.例如，M和/或N可以取决于预定义的填充长度，例如图4中的padW和/或padH。

b.例如，当将扩展区域直接填充到图片的左边和/或右边时(例如图4中的区域2和/或区域3)。

i.例如，N可取决于运动压缩单元的尺寸，例如4×4或8×8或16×16，其取决于编解码器的类型。

ii.例如，M不等于n。

iii.例如，N是预定义的数字，如N＝4、8或16等。

iv.例如，M可以取决于预定义的填充长度，例如图4中的padW。

c.例如，如何导出M×N填充单元/块的填充样点可取决于位于图片内的一个或多个边界块/样点的编解码信息，其中边界块指示位于图片的第一行或最后一行或第一列或最后一列的块/样点。

i.例如，用于图片边界填充的边界块的尺寸可取决于填充单元/块的尺寸，例如M和/或N。

ii.例如，用于图片边界填充的边界块的尺寸可以被预定义。

iii.例如，用于图片边界填充的边界块可以只是位于图片的第一行或最后一行或第一列或最后一列的一个或多个样点。

d.例如，为了填充顶侧处的样点(例如较大图片的区域0)，直接从当前图片的底部处的可用边界样点复制样点。

e.例如，为了填充底侧的样点(例如较大图片的区域1)，直接从当前图片的顶部处的可用边界样点中复制样点。

f.例如，为了填充左侧的样点(例如较大图片的区域2)，直接从当前图片的右边处的可用边界样点中复制样点。

g.例如，为了填充右侧的样点(例如较大图片的区域3)，直接从当前图片的左边处的可用边界样点中复制样点。

6.在一个示例中，如何导出M×N填充单元/块的填充样点可取决于位于图片内的一个或多个边界块/样点的运动信息，其中边界块指示位于图片的第一行或最后一行或第一列或最后一列的块/样点。

a.在一个示例中，当导出填充样点时，位于图片内的一个或多个边界块/样点的运动矢量被取整到整数像素精度，其中整数运动矢量可以是其最接近的整数运动矢量。在一个实施例中，整数像素精度意味着在运动补偿期间运动矢量落在像素上(而不是相邻像素之间)。

b.在一个示例中，当导出填充样点时，使用N抽头插值滤波来获得子像素位置处的参考样点。例如，N可以是2、4、6或8。

7.不同边界(例如，顶、左、右、底)的填充方法和/或填充尺寸可以不同。

图7是一种编码器700的示意图。编码器700适合于实现VVC技术。编码器700包括三个环路滤波器，即去块滤波器(DF)702、样点自适应偏移(SAO)704和自适应环路滤波器(ALF)706。与使用预定义滤波器的DF 702不同，SAO 704和ALF 706利用当前图片的原始样点，通过分别添加偏移和应用有限脉冲响应(FIR)滤波器，利用编解码的辅助信息信令通知偏移和滤波器系数，来减小原始样点和重构样点之间的均方误差。ALF 706位于每个图片的最后处理阶段，并且可以被视为试图捕捉和修复由先前阶段产生的伪像的工具。

编码器700还包括帧内预测组件708和运动估计/补偿(ME/MC)组件710，配置为接收输入视频。帧内预测组件708被配置成执行帧内预测，而ME/MC组件710被配置成利用从参考图片缓冲器712获得的参考图片来执行帧间预测。来自帧间预测或帧内预测的残差块被馈送到变换组件714和量化组件716中，以生成量化的残差变换系数，这些系数被馈送到熵编解码组件718中。熵编解码组件718对预测结果和量化的变换系数进行熵编解码，并将其向视频解码器(未示出)发送。从量化组件716输出的量化组件可以被馈送到逆量化组件720、逆变换组件722和重构(REC)组件724。REC组件724能够将图像输出到DF 702、SAO 704和ALF 706，以便在这些图片被存储在参考图片缓冲器712中之前进行滤波。

DF 702的输入是环路滤波器之前的重建样点。首先滤波图片中的垂直边缘。然后，利用由垂直边缘滤波过程修改的样点作为输入，对图片中的水平边缘进行滤波。每个CTU的CTB中的垂直和水平边缘在编解码单元的基础上被单独处理。编解码单元中的编解码块的垂直边缘从编解码块的左手侧上的边缘开始被滤波，按它们的几何顺序通过边缘向编解码块的右手侧前进。编解码单元中编解码块的水平边缘从编解码块的顶部上的边缘开始被滤波，按它们的几何顺序通过边缘向编解码块的底部前进。

图8是可实现本文中所公开的各种技术的示例视频处理***800的框图。各种实现方式可以包括视频处理***800中的一些或全部组件。视频处理***800可以包括用于接收视频内容的输入802。视频内容可以以原始或未压缩的格式(例如8或10比特多分量像素值)接收，或者可以以压缩或编码的格式接收。输入802可以代表网络接口、***总线接口或存储接口。网络接口的示例包括有线接口(诸如以太网、无源光网络(PON)等)和无线接口(诸如Wi-Fi或蜂窝接口)。

视频处理***800可以包括可以实现本文档中描述的各种编解码或编码方法的编解码组件804。编解码组件804可以减少从输入802到编解码组件804的输出的视频的平均比特率，以产生视频的编解码表示。因此，编解码技术有时称为视频压缩或视频转码技术。编解码组件804的输出可以被存储或经由所连接的通信来发送，如组件806所表示的。在输入802处接收的视频的存储或通信的比特流(或编解码)表示可以由组件808使用，以生成被发送到显示接口810的像素值或可显示视频。从比特流表示中生成用户可见的视频的过程有时称为视频解压缩。此外，尽管某些视频处理操作被称为“编解码”操作或工具，但是应当理解，在编码器处使用编解码工具或操作，并且将由解码器进行反演编解码的结果的对应解码工具或操作。

***总线接口或显示接口的示例可以包括通用串行总线(USB)或高清晰度多媒体接口(HDMI)或Displayport等。存储接口的示例包括SATA(串行高级技术附件)、***组件互连(PCI)、集成驱动电子设备(IDE)接口等。本文中描述的技术可以实施在各种电子设备中，诸如移动电话、笔记本电脑、智能电话或其它能够进行数字数据处理和/或视频显示的设备。

图9是一种视频处理装置900的框图。装置900可以用于实现本文中所述的方法中的一个或多个。装置900可以实施在智能电话、平板电脑、计算机、物联网(IoT)接收器等中。装置900可以包括一个或多个处理器902、一个或多个存储器904和视频处理硬件906。(多个)处理器902可以配置为实现本文中所述的一个或多个方法。(多个)存储器904可以用于存储数据和代码，该代码用于实现本文所描述的方法和技术。视频处理硬件906可以用于在硬件电路中实现本文中所描述的一些技术。在一些实施例中，视频处理硬件906可以部分或完全位于处理器902内，例如图形处理器。

图10是示出可利用本公开的技术的示例视频编解码***1000的框图。如图10所示，视频编解码***1000可以包括源设备1010和目标设备1020。源设备1010生成编码的视频数据，其可以被称为视频编码设备。目标设备1020可以解码由源设备1010生成的编码的视频数据，该目标设备1020可以被称为视频解码设备。

源设备1010可以包括视频源1012、视频编码器1014和输入/输出(I/O)接口1016。

视频源1012可以包括源，例如视频捕获设备、从视频内容提供者接收视频数据的接口、和/或生成视频数据的计算机图形***，或这些源的组合。视频数据可以包括一个或多个图片。视频编码器1014对来自视频源1012的视频数据进行编码以生成比特流。比特流可以包括形成视频数据的编解码表示的比特序列。比特流可以包括编解码图片和相关联的数据。编解码图片是图片的编解码表示。相关联的数据可以包括序列参数集、图片参数集和其他语法元素。I/O接口1016包括调制器/解调器(调制解调器)和/或发送器。可以将编码的视频数据经由I/O接口1016通过网络1030直接发送到目标设备1020。还可以将编码的视频数据存储到存储介质/服务器1040上，用于由目标设备1020存取。

目标设备1020可以包括I/O接口1026、视频解码器1024和显示设备1022。

I/O接口1026可以包括接收器和/或调制解调器。I/O接口1026可以从源设备1010或存储介质/服务器1040获取编码的视频数据。视频解码器1024可以对编码的视频数据进行解码。显示设备1022可以向用户显示解码的视频数据。显示设备1022可以与目标设备1020集成，或可以在配置为与外置显示设备相接的目标设备1020外部。

视频编码器1014和视频解码器1024可以根据视频压缩标准，例如，高效视频编解码(HEVC)标准、多功能视频编解码(VVC)标准和其他当前和/或其他标准，进行操作。

图11是示出视频编码器1100的示例的框图，该视频编码器1100可以是图10中示出的视频编解码***1000中的视频编码器1014。

视频编码器1100可以被配置为执行本公开的任何或全部技术。在图11的示例中，视频编码器1100包括多个功能组件。本公开所描述的技术可以在视频编码器1100的各种组件之间共享。在一些示例中，处理器可以配置为进行本公开中描述的任何或全部技术。

视频编码器1100的功能组件可以包括分割单元1101、预测单元1102(其可以包括模式选择单元1103、运动估计单元1104、运动补偿单元1105、帧内预测单元1106)、残差生成单元1107、变换单元1108、量化单元1109、逆量化单元1110、逆变换单元1111、重建单元1112、缓冲器1113和熵编码单元1114。

在其他示例中，视频编码器1100可以包括更多、更少或不同的功能组件。在一个示例中，预测单元1102可以包括帧内块复制(IBC)单元。IBC单元可以以IBC模式进行预测，其中至少一个参考图片是当前视频块所在的图片。

此外，例如运动估计单元1104和运动补偿单元1105的一些组件可以被高度集成，但是出于解释的目的在图11的示例中分开表示。

分割单元1101可以将图片分割成一个或多个视频块。图10的视频编码器1014和视频解码器1024可以支持各种视频块尺寸。

模式选择单元1103可以例如基于误差结果选择帧内或帧间的编解码模式中的一个，并且将得到的帧内或帧间编解码块提供到残差生成单元1107来生成残差块数据以及提供到重建单元1112来重建编解码块以用作参考图片。在一些示例中，模式选择单元1103可以选择帧内和帧间预测的组合(CIIP)模式，其中预测是基于帧间预测信号和帧内预测信号。模式选择单元1103还可以为帧间预测情况下的块选择运动矢量的分辨率(例如子像素或整像素精度)。

为了对当前视频块进行帧间预测，运动估计单元1104可以通过将来自缓冲器1113的一个或多个参考帧与当前视频块进行比较，生成当前视频块的运动信息。运动补偿单元1105可以基于来自缓冲器1113的图片(而不是与当前视频块相关联的图片)的运动信息和解码样点来为当前视频块确定预测的视频块。

运动估计单元1104和运动补偿单元1105可以为当前视频块进行不同操作，例如执行不同操作取决于当前视频块是在I条带、P条带还是B条带中。I条带(或I帧)是压缩率最低的，但不需要其他视频帧来解码。S条带(或P帧)可以使用来自先前帧的数据来解压缩，并且比I帧更容易压缩。B条带(或B帧)可以使用先前帧和前向帧两者作为数据参考，以获得最高的数据压缩量。

在一些示例中，运动估计单元1104可以对当前视频块进行单向预测，并且运动估计单元1104可以在列表0或列表1的参考图片中搜索当前视频块的参考视频块。运动估计单元1104然后可以生成指示列表0或列表1的参考图片中含有参考视频块的参考索引以及指示在当前视频块与参考视频块之间的空域位移的运动矢量。运动估计单元1104可以输出参考索引、预测方向指示符、以及运动矢量作为当前视频块的运动信息。运动补偿单元1105可以基于由当前视频块的运动信息指示的参考视频块来生成当前块的预测视频块。

在其他示例中，运动估计单元1104可以对当前视频块进行双向预测，运动估计单元1104可以在列表0的参考图片中搜索当前视频块的参考视频块并且还可以在列表1的参考图片中搜索当前视频块的另一个参考视频块。运动估计单元1104然后可以生成指示列表0或列表1的参考图片中含有参考视频块的参考索引以及指示在参考视频块与当前视频块之间的空域位移的运动矢量。运动估计单元1104可以输出参考索引和当前视频块的运动矢量作为当前视频块的运动信息。运动补偿单元1105可以基于由当前视频块的运动信息指示的参考视频块来生成当前视频块的预测视频块。

在一些示例中，运动估计单元1104可以输出运动信息的全部集合，用于解码器的解码处理。

在一些示例中，运动估计单元1104可以不输出当前视频的运动信息的全部集合。而是，运动估计单元1104可以参考另一个视频块的运动信息来信令通知当前视频块的运动信息。例如，运动估计单元1104可以确定当前视频块的运动信息与相邻视频块的运动信息足够相似。

在一个示例中，运动估计单元1104可以在与当前视频块相关联的语法结构中指示：向视频解码器1024指示当前视频块具有与另一个视频块相同的运动信息的值。

在另一个示例中，运动估计单元1104可以在与当前视频块相关联的语法结构中标识另一个视频块和运动矢量差(MVD)。运动矢量差指示当前视频块的运动矢量与指示视频块的运动矢量之间的差。视频解码器1024可以使用指示视频块的运动矢量和运动矢量差来确定当前视频块的运动矢量。

如上所讨论的，视频编码器1014可以预测性地信令通知运动矢量。可以由视频编码器1014实现的预测性的信令通知技术的两个示例包括高级运动矢量预测(AMVP)和merge模式信令通知。

帧内预测单元1106可以对当前视频块进行帧内预测。当帧内预测单元1106对当前视频块进行帧内预测时，帧内预测单元1106可以基于相同图片中其他视频块的解码样点来生成当前视频块的预测数据。当前视频块的预测数据可以包括预测视频块和各种语法元素。

残差生成单元1107可以通过从当前视频块中减去(例如，由减号指示)当前视频块的(多个)预测视频块来生成当前视频块的残差数据。当前视频块的残差数据可以包括对应于当前视频块中样点的不同样点分量的残差视频块。

在其他示例中，例如在跳过模式下，对于当前视频块可能不存在当前视频块的残差数据，并且残差生成单元1107可以不进行减去操作。

变换单元1108可以通过将一个或多个变换应用于与当前视频块相关联的残差视频块来生成当前视频块的一个或多个变换系数视频块。

在变换单元1108生成与当前视频块相关联的变换系数视频块之后，量化单元1109可以基于与当前视频块相关联的一个或多个量化参数(QP)值来量化与当前视频块相关联的变换系数视频块。

逆量化单元1110和逆变换单元1111可以将逆量化和逆变换分别应用于变换系数视频块，来从变换系数视频块重建残差视频块。重建单元1112可以将重建的残差视频块添加到来自由预测单元1102生成的一个或多个预测视频块的对应样点，以产生与当前块相关联的重建视频块用于存储在缓冲器1113中。

在重建单元1112重建视频块之后，可以进行环路滤波操作以降低视频块中视频块化伪影。

熵编码单元1114可以从视频编码器1100的其他功能组件接收数据。当熵编码单元1114接收数据时，熵编码单元1114可以进行一个或多个熵编码操作以生成熵编码数据并且输出包括熵编码数据的比特流。

图12是示出视频解码器1200的示例的框图，该视频解码器1200可以是图10中示出的视频编解码***1000中的视频解码器1024。

视频解码器1200可以被配置为进行本公开的任何或全部技术。在图12的示例中，视频解码器1200包括多个功能组件。本公开所描述的技术可以在视频解码器1200的各种组件之间共享。在一些示例中，处理器可以配置为进行本公开中描述的任何或全部技术。

在图12的示例中，视频解码器1200包括熵解码单元1201、运动补偿单元1202、帧内预测单元1203、逆量化单元1204、逆变换单元1205、重建单元1206和缓冲器1207。在一些示例中，视频解码器1200可以进行与关于视频编码器1014(图10)所描述的编码过程总体反演的解码过程。

熵解码单元1201可以检索编码比特流。编码比特流可以包括熵编解码视频数据(例如，视频数据的编解码块)。熵解码单元1201可以对熵编解码视频进行解码，并且根据熵解码视频数据，运动补偿单元1202可以确定包括运动矢量、运动矢量精度、参考图片列表索引和其他运动信息的运动信息。运动补偿单元1202例如可以通过进行AMVP和merge模式信令通知来确定此类信息。

运动补偿单元1202可以产生运动补偿块，可能地基于插值滤波器进行插值。要以子像素精度使用的插值滤波器的标识符可以包括在语法元素中。

运动补偿单元1202可以使用由视频编码器1014在编码视频块的期间所使用的插值滤波器，来计算出参考块的子整数个像素的插值的值。运动补偿单元1202可以根据接收的语法信息确定由视频编码器1014所使用的插值滤波器并且使用插值滤波器来产生预测块。

运动补偿单元1202可以使用一些语法信息来确定：用于对编码视频序列的(多个)帧和/或(多个)条带进行编码的块的尺寸，描述编码视频序列的图片的每个宏块如何被分割的分割信息，指示如何编码每个分割的模式，每个帧间编码块的一个或多个参考帧(和参考帧列表)，以及对编码视频序列进行解码的其他信息。

帧内预测单元1203可以使用例如在比特流中接收的帧内预测模式来从空域相邻块形成预测块。逆量化单元1204逆量化(即去量化)在比特流中提供的且由熵解码单元1201解码的量化的视频块系数。逆变换单元1205应用逆变换。

重建单元1206可以用由运动补偿单元1202或帧内预测单元1203生成的对应预测块求和残差块，以形成解码块。如所期望的，去块滤波器还可以应用于滤波解码块以便移除块效应伪影。解码视频块然后存储在缓冲器1207中，该缓冲器1307提供用于随后的运动补偿/帧内预测的参考块，并且还产生用于在显示设备上呈现的解码视频。

接下来提供了一些实施例优选的解决方案的列表。

以下解决方案显示了本公开中讨论的技术的示例实施例。

以下解决方案示出了前一章节(例如，上面的项目1)中讨论的技术的示例实施例。

1.一种视频处理方法，包括：针对视频的视频单元和视频的比特流之间的转换，根据填充尺寸规则确定视频单元的填充样点；并且基于该确定来执行转换；其中，填充尺寸规则指定水平填充长度padW或垂直填充长度padH是视频单元的特性的函数。

2.根据解决方案1所述的方法，其中，视频单元的特性包括视频单元的编解码树单元尺寸、视频单元的插值滤波器长度或视频单元的尺寸。

3.根据解决方案1-2中任一项所述的方法，其中，padW或padH等于a×(SIZE+偏移)，a是整数，SIZE是整数，并且偏移是整数。

4.根据解决方案3所述的方法，其中，SIZE取决于编解码树单元尺寸和/或偏移取决于插值滤波器长度。

以下解决方案示出了前一章节(例如，项目2)中讨论的技术的示例实施例。

5.一种视频处理方法，包括：执行视频的视频单元与视频的比特流之间的转换；其中，在转换期间，根据规则使用第一填充方法或作为不同填充方法的第二填充方法来填充视频单元的样点。

6.根据解决方案5所述的方法，其中，第一填充方法包括重复填充，其中边界样点值被重复作为填充样点。

7.根据解决方案5-6中任一项所述的方法，其中，第二填充方法取决于是否将参考图片重采样应用于视频单元。

以下解决方案示出了前一章节(例如，项目3)中讨论的技术的示例实施例。

8.一种视频处理方法，包括：执行视频的视频单元与视频的比特流之间的转换；其中，在转换过程中，视频单元的样点按规则定义的顺序沿着包括顶(区域0)、底(区域1)、左(区域2)、右(区域3)、左顶(区域4)、右顶(区域5)、左底(区域6)、右底(区域7)的八个方向进行填充。

9.根据解决方案8所述的方法，其中，该规则指定：首先以预定义顺序填充区域{区域0、区域1、区域2、区域3}，然后以另一预定义顺序填充区域{区域4、区域5、区域6、区域7}。

10.根据解决方案8所述的方法，其中，该规则指定：首先以任意顺序填充区域{区域0、区域1、区域2、区域3}，然后以任意顺序填充区域{区域4、区域5、区域6、区域7}。

以下解决方案示出了前一章节(例如，项目4)中讨论的技术的示例实施例。

11.根据解决方案8所述的方法，其中，区域4、区域5、区域6和区域7中的填充样点是视频单元的样点或根据第二规则的区域0、区域1、区域2、区域3、区域4中的填充样点的直接副本。

12.根据解决方案11所述的方法，其中，第二规则指定区域4样点直接从区域0样点复制。

13.根据解决方案11所述的方法，其中，第二规则指定区域4样点直接从区域2样点复制。

以下解决方案示出了前一章节(例如，项目5)中讨论的技术的示例实施例。

14.一种视频处理方法，包括：执行视频的视频单元和视频的比特流之间的转换；其中，在转换过程中，根据M×N粒度，将视频单元的样点沿包括顶(区域0)、底(区域1)、左(区域2)、右(区域3)、左顶(区域4)、右顶(区域5)、左底(区域6)、右底(区域7)的八个方向进行填充，其中M为亮度样点中填充单元的宽度，并且N为亮度样点中填充单元的高度。

15.根据解决方案14所述的方法，其中，M或N取决于视频单元的编解码单元尺寸。

16.根据解决方案14所述的方法，其中，M或N取决于视频单元的最小编解码单元尺寸。

17.根据解决方案14所述的方法，其中，M或N是预定义整数。

18.根据解决方案14-17中任一项所述的方法，其中，M×N块的样点取决于视频单元内的边界块或边界样点的编解码信息。

以下解决方案示出了前一章节(例如，项目6)中讨论的技术的示例实施例。

19.根据解决方案14-18中任一项所述的方法，其中，根据取决于位于视频单元内的一个或多个边界块或样点的运动信息的方法来导出M×N粒度的填充样点。

20.根据解决方案19所述的方法，其中，运动信息包括运动矢量是否被取整到整数像素精度。

21.根据解决方案14-20中任一项所述的方法，其中，使用L抽头插值滤波器导出子像素位置处的样点，其中L是整数。

22.根据解决方案21所述的方法，其中L＝2、4、6或8。

23.根据解决方案1-22中任一项所述的方法，其中，视频单元是视频图片。

24.根据解决方案1-23中任一项所述的方法，其中，执行转换包括从视频生成比特流。

25.根据解决方案1-24中任一项所述的方法，其中，执行转换包括从比特流生成视频。

26.一种视频解码装置，包括被配置为实现解决方案1至25中的一个或多个中记载的方法的处理器。

27.一种视频编码装置，包括被配置为实现解决方案1至25中的一个或多个中记载的方法的处理器。

28.一种其上存储有计算机代码的计算机程序产品，该计算机代码在由处理器执行时使该处理器实现解决方案1至25中任一项所述的方法。

29.一种计算机可读介质，其上具有符合根据解决方案1至25中任一项生成的比特流格式的比特流。

30.一种方法，包括根据解决方案1至25中任一项所述的方法生成比特流，并将该比特流写入计算机可读介质。

31.一种方法、一种装置、一种根据本文中描述的所公开的方法或***生成的比特流。

在本文所述的解决方案中，编码器可通过根据格式规则产生编解码表示来符合格式规则。在本文描述的解决方案中，解码器可以使用格式规则来解析编解码表示中的语法元素，根据格式规则知道语法元素的存在和不存在，以产生解码的视频。

在本文档中，术语“视频处理”可指视频编码、视频解码、视频压缩或视频解压缩。例如，在从视频的像素表示到对应的比特流表示的转换期间，可以应用视频压缩算法，反之亦然。如语法所定义，当前视频块的比特流表示可(例如)对应于共位或散布在比特流内不同位置的比特。例如，可以根据变换和编解码的误差残差值并且还使用头中的比特和比特流中的其他字段，对宏块进行编码。此外，在转换期间，解码器可以基于该确定，在知道一些字段可能存在或不存在的情况下解析比特流，如以上解决方案中所述。类似地，编码器可确定包括或不包括某些语法字段，并通过从编解码表示中包括或排除语法字段来相应地生成编解码表示。

本文档中所述的公开和其他方案、示例、实施例、模块和功能操作可以被实现在数字电子电路中或者在计算机软件、固件或硬件中，含有本文档中所公开的结构以及其结构的等同物，或者它们中的一个或多个的组合。所公开的和其他实施例可以被实现为计算机可读介质上所编码的一个或多个计算机程序产品，即一个或多个计算机程序指令模块，用于由数据处理装置执行或者控制数据处理装置的操作。该计算机可读介质可以是机器可读存储设备、机器可读存储基板、存储器设备、影响机器可读可传播信号的复合物，或其一个或多个的组合。术语“数据处理装置”涵盖用于处理数据的所有装置、设备和机器，包括例如可编程处理器、计算机或多个处理器或计算机。除了硬件之外，该装置还可以包括为所讨论的计算机程序创建执行环境的代码，例如，构成处理器固件、协议栈、数据库管理***、操作***、或者它们中的一个或多个的组合的代码。传播信号是人工生成的信号，例如，机器生成的电、光或电磁信号，其被生成来编码信息以传输到合适的接收器装置。

计算机程序(也称为程序、软件、软件应用、脚本或代码)可以用任何形式的编程语言编写，包括编译或解释语言，并且可以以任何形式来部署计算机程序，包括独立程序或适合在计算环境中使用的模块、组件、子例程或其它单元。计算机程序不必须对应于文件***中的文件。程序可以存储在保存其他程序或数据的文件的部分中(例如，在标记语言文档中存储的一个或多个脚本)、在专用于所讨论的程序的单个文件中、或在多个协同文件中(例如存储一个或多个模块、子程序或代码部分的文件)。计算机程序可以部署为在一个计算机上或者在多个计算机上执行，该多个计算机位于一个站点处或者分布跨多个站点并由通信网络互连。

可以由执行一个或多个计算机程序的一个或多个可编程处理器来进行在本文档中所描述的过程和逻辑流，以通过在输入数据上操作并且生成输出来进行功能。也可以由专用逻辑电路(例如，现场可编程门阵列(FPGA)或专用集成电路(ASIC))进行过程和逻辑流，并且装置可以实现为专用逻辑电路(例如FPGA或ASIC)。

适合于计算机程序的执行的处理器包括例如通用和专用微处理器两者，以及任何类型的数字计算机的任何一个或多个处理器。通常，处理器将从只读存储器或随机存取存储器或者该两者接收指令和数据。计算机的基本元件是用于进行指令的处理器和用于存储指令和数据的一个或多个存储器设备。通常，计算机还将包括用于存储数据的一个或多个海量存储设备(例如磁、磁光盘或光盘)，或者可操作地耦合以从海量存储设备(例如磁、磁光盘或光盘)接收数据或者将数据传输到海量存储设备(例如磁、磁光盘或光盘)，或者以上两者。但是，计算机不必具有此类设备。适用于存储计算机程序指令和数据的计算机可读介质含有所有形式的非易失性存储器、介质和存储器设备，含有例如半导体存储器设备(例如EPROM、EEPROM和闪速存储器设备)；磁盘(例如内部硬盘或可移动磁盘)；磁光盘；和CD ROM和DVD-ROM盘。处理器和存储器可以由专用逻辑电路补充，或者合并在专用逻辑电路中。

虽然本专利文档含有许多细节，但这些细节不应被解释为对任何主题或可要求保护的范围的限制，而是作为规定于特定技术的特定实施例的特征的描述。在本专利文档中，在单独的实施例的上下文中描述的某些特征也可以在单个实施例中组合实现。相反地，在单个实施例的上下文中所描述的各种特征还可以分别在多个实施例中来实现或者以各种合适的子组合来实现。此外，尽管特征可以如上文描述为以某些组合起作用并且甚至最初同样地要求，但是在某些情况下来自所要求保护的组合的一个或多个特征可以从组合中去除，并且所要求保护的组合可以针对子组合或子组合的变化。

类似地，尽管在附图中以特定顺序描绘了操作，但这不应当理解为要求按所示的特定次序或顺序次序进行此类操作或者进行所有示出的操作，以实现期望的结果。此外，在本专利文档中描述的实施例中的各种***组件的分开不应被理解为在所有实施例中都要求这种分开。

仅描述了几个实现方式和示例，并且可以基于本专利文档中描述和示出的内容来作出其它实现方式、增强和变型。

Claims

1.一种由视频编解码装置实现的用于编解码视频数据的方法，包括：

根据视频单元的特性确定视频的所述视频单元的填充尺寸，其中，所述填充尺寸包括水平填充尺寸(padW)或垂直填充尺寸(padH)；以及

根据所确定的填充尺寸在所述视频的所述视频单元和比特流之间进行转换。

2.根据权利要求1所述的方法，其中，所述视频单元的所述特性包括编解码树单元(CTU)的尺寸、插值滤波器的长度或所述视频单元的尺寸。

3.根据权利要求2所述的方法，其中，所述水平填充尺寸和所述垂直填充尺寸根据公式a×尺寸来确定，a是正整数，并且尺寸是基于所述CTU的尺寸的正整数。

4.根据权利要求1-3中任一项所述的方法，其中，根据公式a×(尺寸+偏移)确定所述水平填充尺寸和所述垂直填充尺寸，a是正整数，尺寸是基于所述CTU的尺寸的正整数，并且偏移是基于所述插值滤波器的长度的正整数。

5.根据权利要求1-4中任一项所述的方法，其中，所述水平填充尺寸和所述垂直填充尺寸基于是否应用参考图片重采样(RPR)或者基于参考图片重采样因子的尺寸。

6.根据权利要求1-5中任一项所述的方法，其中，所述视频单元的所述水平填充尺寸和所述垂直填充尺寸不同于第二视频单元的第二水平填充尺寸和第二垂直填充尺寸。

7.根据权利要求1-6中任一项所述的方法，其中，所述水平填充尺寸和所述垂直填充尺寸基于所述视频单元的颜色分量或颜色格式。

8.根据权利要求1-7中任一项所述的方法，其中，所述水平填充尺寸和所述垂直填充尺寸定义所述视频单元周围的填充区域，并且第一填充区域可具有与第二填充区域不同的尺寸。

9.根据权利要求1-8中任一项所述的方法，其中，所述水平填充尺寸和所述垂直填充尺寸是根据具有第一最大尺寸的第一填充过程来确定的，并且第二水平填充尺寸和第二垂直填充尺寸是根据在所述第一填充过程之后实现的并且具有第二最大尺寸的第二填充过程来确定的。

10.根据权利要求9所述的方法，其中，所述第一最大尺寸不同于所述第二最大尺寸。

11.根据权利要求9所述的方法，其中，根据公式a×(尺寸+偏移)来确定所述第二水平填充尺寸和所述第二垂直填充尺寸。

12.根据权利要求9所述的方法，其中，所述第二水平填充尺寸和所述第二垂直填充尺寸基于是否应用参考图片重采样或者参考图片重采样因子的尺寸。

13.根据权利要求1所述的方法，其中，所述水平填充尺寸和所述垂直填充尺寸定义所述视频单元周围的相邻填充区域和角填充区域，并且在用填充样点填充所述角填充区域之前用所述填充样点填充所述相邻填充区域。

14.根据权利要求1所述的方法，其中，所述水平填充尺寸和所述垂直填充尺寸定义所述视频单元周围的相邻填充区域和角填充区域，并且在用填充样点填充所述角填充区域之后用所述填充样点填充所述相邻填充区域。

15.根据权利要求13或14所述的方法，其中，根据第一预定义顺序来填充所述相邻填充区域，并且根据第二预定义顺序来填充所述角填充区域。

16.根据权利要求1所述的方法，其中，所述水平填充尺寸和所述垂直填充尺寸定义所述视频单元周围的相邻填充区域和角填充区域，并且所述角填充区域用来自所述视频单元的边界样点或来自所述相邻填充区域的填充样点来填充。

17.根据权利要求16所述的方法，其中，使用与所述角填充区域中的第一角填充区域紧邻的填充样点之一来填充所述第一角填充区域。

18.根据权利要求16所述的方法，其中，所述视频单元的角中的重建样点被用来填充所述角填充区域中的第一角填充区域。

19.根据权利要求1所述的方法，其中，所述水平填充尺寸和所述垂直填充尺寸定义所述视频单元周围的相邻填充区域和角填充区域，并且所述相邻填充区域和所述角填充区域填充有M×N填充样点，其中M表示亮度样点中的每个填充样点的宽度，并且N表示所述亮度样点中每个所述填充样点的高度。

20.根据权利要求19所述的方法，其中，M不等于N。

21.根据权利要求19或20所述的方法，其中，M和N中的一个或多个基于所述水平填充尺寸或所述垂直填充尺寸。

22.根据权利要求19-21所述的方法，其中，所述填充样点的宽度或所述填充样点的高度基于所述视频单元内的边界样点的尺寸。

23.根据权利要求19-22所述的方法，其中，所述视频单元的列或行中的一个或多个边界样点被用来填充所述相邻填充区域或所述角填充区域。

24.根据权利要求19-22所述的方法，其中，所述视频单元的一侧上的列或行中的一个或多个边界样点被用来填充所述视频单元的相对侧上的所述相邻填充区域。

25.根据权利要求1所述的方法，其中，所述水平填充尺寸和所述垂直填充尺寸定义所述视频单元周围的相邻填充区域和角填充区域，并且所述视频单元中的一个或多个边界样点的运动矢量被取整为整数像素精度以导出用于填充所述相邻填充区域和角填充区域的填充样点。

26.一种用于编解码视频数据的装置，包括处理器和其上具有指令的非暂时性存储器，其中，所述指令在由所述处理器执行时使得所述处理器执行根据权利要求1-25中任一项所述的方法。

27.一种非暂时性计算机可读介质，包括供编解码装置使用的计算机程序产品，其中，所述计算机程序产品包括存储在所述非暂时性计算机可读介质上的计算机可执行指令，所述计算机可执行指令在由一个或多个处理器执行时使得所述编解码装置执行根据权利要求1-25中任一项所述的方法。