CN113491118A

CN113491118A - 视频编解码方法及装置

Info

Publication number: CN113491118A
Application number: CN202080016914.0A
Authority: CN
Inventors: 李贵春; 李翔; 刘杉
Original assignee: Tencent America LLC
Current assignee: Tencent America LLC
Priority date: 2019-03-06
Filing date: 2020-03-06
Publication date: 2021-10-08
Anticipated expiration: 2040-03-06
Also published as: JP7233539B2; US11166015B2; US20210400262A1; US20200288124A1; CN113491118B; EP3854084A1; EP3854084A4; WO2020181222A1; US11949855B2; JP2022511843A

Abstract

本公开的各方面提供视频编解码方法和装置。一些实施例中，一种装置包括处理电路，该处理电路将当前块划分为多个子块，获取多个子块的多条子块运动信息，根据多条子块运动信息生成子块的预测子块样本，并根据预测子块样本的组合生成当前块的预测块。该处理电路还从多条子块运动信息中选择一条子块运动信息作为当前块的代表运动信息，并将代表运动信息存储在基于历史的运动矢量预测(HMVP)缓冲器中。

Description

视频编解码方法及装置

相关文件

本申请要求2019年3月6日递交的题目为“HMVP缓冲器更新方法”的美国临时申请62/814,536的优先权，以及2020年3月3日递交的题目为“视频编解码方法及装置”的美国申请16/808,213的优先权，其全部内容通过引用结合在本文中。

技术领域

本申请实施例主要涉及视频编解码技术。

背景技术

本文提供的背景描述是为了呈现本申请的背景。记名的发明人的工作，在该背景部分描述的工作以及本说明书各实施例的范围内的内容，在递交时可能并不算作现有技术，均未被明示或暗示地承认作为不利于本申请的现有技术。

视频编码和解码可以使用具有运动补偿的图像间预测来进行。未压缩的数字视频可包括一系列图像，每个图像具有一定的空间维度，例如1920x1080的亮度采样和相关的色度采样。图像序列可具有固定或可变的图像速率(俗称帧率)，例如，每秒60张图像或60Hz。未压缩的视频需要较高的比特率。例如，每个采样为8比特的1080p604：2：0(60Hz帧率下的1920x1080亮度采样分辨率)的视频需要接近1.5G比特/秒的带宽。长度为一小时的这种视频需要600G字节以上的存储空间。

视频编码和解码的一个目的是，通过压缩来降低输入视频信号的冗余。在一些情况下，压缩可将带宽或存储器的需求减小至少两个数量级。可使用无损压缩、有损压缩，或其组合。无损压缩指可从经过压缩的原始信号中重建原始信号的准确副本的技术。当使用有损压缩时，重建信号可与原始信号不一致，但原始信号和重建信号之间的失真足够小，以使重建信号能够实现所期望的用途。视频领域中广泛采用有损压缩。容许的失真量取决于应用，例如，一些消费型直播应用的用户比电视节目应用的用户能容忍更大的失真。可实现的压缩比可以反映出：可允许/可容忍的失真越大，可产生的压缩比越高。

运动补偿可以是有损压缩技术，且可关联以下技术：对于来自先前已重建的图像或其中一部分(参考图像)的样本数据块，在由运动矢量(motion vector，MV)指示的方向上发生空间偏移之后，可用于预测新重建的图像或图像的一部分。在一些情况下，参考图像可与当前正在重建的图像相同。各个MV可具有两个维度X和Y，或三个维度，第三维度指示正在使用的参考图像(间接地，第三维度还可以是时间维度)。

在一些视频压缩技术中，可根据其它MV预测适用于某一样本数据区域的MV，所述其它MV例如是，与正在重建的区域空间相邻近的另一样本数据区域相关、且解码次序是在所述某一样本数据区域的MV之前。如此，可极大减少对MV进行编码所需的数据量，由此消除冗余且提高压缩。举例来说，当对来自相机的输入视频信号(称为原始视频)进行编码时，存在如下的统计可能性：比单个MV区域更大的多个区域会在相似的方向上移动，因此，在一些情况下，可使用从相邻区域的MV提取的相似运动矢量进行预测，因此，MV预测非常有效。采用这种方式，使得针对给定区域确定的MV与根据周围MV预测的MV类似或相同，且在熵编码之后，表示MV的位数小于在对MV直接编码的情况下所使用的位数。在一些情况下，MV预测可以是针对从原始信号(即：样本流)提取的信号(即：MV)进行无损压缩的实施例。在其它情况下，MV预测本身可能是有损的，例如，在根据周围若干MV计算预测因子时，由于取整误差导致的有损。

H.265/HEVC(ITU-T H.265建议书，“高效视频编解码(High Efficiency VideoCoding)”，2016年12月)中描述了各种MV预测机制。在H.265提供的多种MV预测机制中，本申请描述的是下文称作“空间合并”的技术。

请参考图1，当前块(101)包括在运动搜索过程期间已由编码器发现的样本，根据已产生空间偏移的相同大小的先前块，可预测所述样本。另外，可从一个或多个参考图像相关联的元数据中导出所述MV，而非对MV直接编码。例如，使用关联于A0、A1和B0、B1、B2(分别对应102到106)五个相邻块中的任一块的MV，(按解码次序)从最近的参考图像的元数据中导出所述MV。在H.265中，MV预测可使用相邻块也正在使用的相同参考图像的预测因子。

发明内容

本申请的各方面提供了用于视频编码/解码的方法和装置。一些实施例中，一种装置包括处理电路，该处理电路将当前块划分为多个子块，得出多个子块的多条子块运动信息，根据多条子块运动信息生成子块的预测子块样本，并根据预测子块样本的组合生成当前块的预测块。该处理电路还从多条子块运动信息中选择一条子块运动信息作为当前块的代表运动信息，并将代表运动信息存储在基于历史的运动矢量预测(HMVP)缓冲器中。

一些实施例中，所选的一条子块运动信息对应于所述多个子块中在所述当前块中特定位置处的一个子块。一些实施例中，特定子块可以在当前块中的右下位置。一些实施例中，特定子块可以邻近当前块的中心位置。在至少一个实施例中，特定子块的左上角在当前块的中心位置。

一些实施例中，处理电路还根据在序列参数集(SPS)、图像参数集(PPS)、切片标头、图块组头或图块头中传输的控制信息来确定特定位置。

一些实施例中，根据仿射帧间预测，基于子块的时间运动矢量预测和三角帧间预测之一来对当前块进行编码。

本申请各方面还提供了一种非暂时性计算机可读介质，存储有指令，该指令在由计算机执行以用于视频解码时，使计算机执行用于视频解码的方法中的任何一种或方法的组合。

附图说明

根据以下详细描述和附图，本申请实施例的其它特征、性质和各种优点将变得更加明显，在附图中：

图1为一个实施例的当前块及其周围的空间合并候选块的示意图。

图2为一个实施例的通信***(200)的简化框图。

图3为一个实施例的通信***(300)的简化框图。

图4为一个实施例的解码器的简化框图。

图5为一个实施例的编码器的简化框图。

图6为另一实施例的编码器的简化框图。

图7为另一实施例的解码器的简化框图。

图8为一个实施例的合并模式的当前块和对应的合并候选块的示意图。

图9为一个实施例的当前块的空间相邻块和时间相邻块的示意图。

图10A为一个实施例的空间相邻块的示意图，该空间相邻块可用于使用基于子块的时间运动矢量预测方法来确定当前块的预测运动信息。

图10B为一个实施例的为基于子块的时间运动矢量预测方法选择的空间相邻块的示意图。

图11A为一个实施例的使用基于历史的运动矢量预测方法来构建和更新运动信息候选列表的方法的概述流程图。

图11B为一个实施例的使用基于历史的运动矢量预测方法来更新运动信息候选列表的示意图。

图12为一个实施例的基于具有运动矢量差(motion vector difference，MMVD)的合并中的合并候选块的运动矢量来确定与两个参考图像列表相关联的两个参考图像中的起始点的示意图。

图13为一个实施例的将在MMVD模式下被评估的两个起始点周围的预定点的示意图。

图14A-14B为一个实施例的合并共享区域的示意图。

图15A为一个实施例的三角预测模式下当前块的两个分割实施例的示意图。

图15B为一个实施例的构造三角预测模式的单向预测候列表使用的空间相邻块和时间相邻块的实施例。

图16A为一个实施例的在自适应混合过程中应用一组加权因子的编码单元的实施例。

图16B为一个实施例的在自适应混合过程中应用一组加权因子的编码单元的实施例。

图17A为一个实施例的编码单元的实施例，该编码单元将该条子块运动信息用于当前块中的右下位置处的子块。

图17B为一个实施例的编码单元的实施例，该编码单元使用当前块中位于中心位置的子块的子块运动信息。

图18为本申请一些实施例的方法的概述流程图。

图19为一个实施例的计算机***的示意图。

具体实施方式

I.视频编解码的编码器和解码器

图2是根据本申请公开的实施例的通信***(200)的简化框图。通信***(200)包括多个终端装置，所述终端装置可通过例如网络(250)彼此通信。举例来说，通信***(200)包括通过网络(250)互连的第一终端装置(210)和第二终端装置(220)。在图2的实施例中，第一终端装置(210)和第二终端装置(220)执行单向数据传输。举例来说，第一终端装置(210)可对视频数据(例如由终端装置(210)采集的视频图像流)进行编码以通过网络(250)传输到第二端装置(220)。已编码的视频数据以一个或多个已编码视频码流形式传输。第二终端装置(220)可从网络(250)接收已编码视频数据，对已编码视频数据进行解码以恢复视频数据，并根据恢复的视频数据显示视频图像。单向数据传输在媒体服务等应用中是较常见的。

在另一实施例中，通信***(200)包括执行已编码视频数据的双向传输的第三终端装置(230)和第四终端装置(240)，所述双向传输可例如在视频会议期间发生。对于双向数据传输，第三终端装置(230)和第四终端装置(240)中的每个终端装置可对视频数据(例如由终端装置采集的视频图像流)进行编码，以通过网络(250)传输到第三终端装置(230)和第四终端装置(240)中的另一终端装置。第三终端装置(230)和第四终端装置(240)中的每个终端装置还可接收由第三终端装置(230)和第四终端装置(240)中的另一终端装置传输的已编码视频数据，且可对所述已编码视频数据进行解码以恢复视频数据，且可根据恢复的视频数据在可访问的显示装置上显示视频图像。

在图2的实施例中，第一终端装置(210)、第二终端装置(220)、第三终端装置(230)和第四终端装置(240)可为服务器、个人计算机和智能电话，但本申请公开的原理可不限于此。本申请公开的实施例适用于膝上型计算机、平板电脑、媒体播放器和/或专用视频会议设备。网络(250)表示在第一终端装置(210)、第二终端装置(220)、第三终端装置(230)和第四终端装置(240)之间传送已编码视频数据的任何数目的网络，包括例如有线(连线的)和/或无线通信网络。通信网络(250)可在电路交换和/或分组交换信道中交换数据。该网络可包括电信网络、局域网、广域网和/或互联网。出于本申请的目的，除非在下文中有所解释，否则网络(250)的架构和拓扑对于本申请公开的操作来说可能是无关紧要的。

作为实施例，图3示出视频编码器和视频解码器在流式传输环境中的部署方式。本申请所公开主题可同等地适用于其它支持视频的应用，包括例如视频会议、数字TV、在包括CD、DVD、存储棒等的数字介质上存储压缩视频等等。

流式传输***可包括采集子***(313)，所述采集子***可包括数码相机等视频源(301)，所述视频源创建未压缩的视频图像流(302)。在实施例中，视频图像流(302)包括由数码相机拍摄的样本。相较于已编码的视频数据(304)(或已编码的视频码流)，视频图像流(302)被描绘为粗线以强调高数据量的视频图像流，视频图像流(302)可由电子装置(320)处理，所述电子装置(320)包括耦接到视频源(301)的视频编码器(303)。视频编码器(303)可包括硬件、软件或软硬件组合以实现或实施如下文更详细地描述的所公开主题的各方面。相较于视频图像流(302)，已编码的视频数据(304)(或已编码的视频码流(304))被描绘为细线以强调较低数据量的已编码的视频数据(304)(或已编码的视频码流(304))，其可存储在流式传输服务器(305)上以供将来使用。一个或多个流式传输客户端子***，例如图3中的客户端子***(306)和客户端子***(308)，可访问流式传输服务器(305)以检索已编码的视频数据(304)的副本(307)和副本(309)。客户端子***(306)可包括例如电子装置(330)中的视频解码器(310)。视频解码器(310)对已编码的视频数据的传入副本(307)进行解码，且产生可在显示器(312)(例如显示屏)或另一呈现装置(未描绘)上呈现的输出视频图像流(311)。在一些流式传输***中，可根据某些视频编码/压缩标准对已编码的视频数据(304)、视频数据(307)和视频数据(309)(例如视频码流)进行编码。该些标准的实施例包括ITU-T H.265。在实施例中，正在开发的视频编码标准非正式地称为下一代视频编码(Versatile Video Coding，VVC)，本申请可用于VVC标准的上下文中。

应注意，电子装置(320)和电子装置(330)可包括其它组件(未示出)。举例来说，电子装置(320)可包括视频解码器(未示出)，且电子装置(330)还可包括视频编码器(未示出)。

图4是根据本申请公开的实施例的视频解码器(410)的框图。视频解码器(410)可设置在电子装置(430)中。电子装置(430)可包括接收器(431)(例如接收电路)。视频解码器(410)可用于代替图3实施例中的视频解码器(310)。

接收器(431)可接收将由视频解码器(410)解码的一个或多个已编码视频序列；在同一实施例或另一实施例中，一次接收一个已编码视频序列，其中每个已编码视频序列的解码独立于其它已编码视频序列。可从信道(401)接收已编码视频序列，所述信道可以是通向存储已编码的视频数据的存储装置的硬件/软件链路。接收器(431)可接收已编码的视频数据以及其它数据，例如，可转发到它们各自的使用实体(未标示)的已编码音频数据和/或辅助数据流。接收器(431)可将已编码视频序列与其它数据分开。为了防止网络抖动，缓冲存储器(415)可耦接在接收器(431)与熵解码器/解析器(420)(此后称为“解析器(420)”)之间。在某些应用中，缓冲存储器(415)是视频解码器(410)的一部分。在其它情况下，所述缓冲存储器(415)可设置在视频解码器(410)外部(未标示)。而在其它情况下，视频解码器(410)的外部设置缓冲存储器(未标示)以例如防止网络抖动，且在视频解码器(410)的内部可配置另一缓冲存储器(415)以例如处理播出定时。而当接收器(431)从具有足够带宽和可控性的存储/转发装置或从等时同步网络接收数据时，也可能不需要配置缓冲存储器(415)，或可以将所述缓冲存储器做得较小。当然，为了在互联网等业务分组网络上使用，也可能需要缓冲存储器(415)，所述缓冲存储器可相对较大且可具有自适应性大小，且可至少部分地实施于操作***或视频解码器(410)外部的类似元件(未标示)中。

视频解码器(410)可包括解析器(420)以根据已编码视频序列重建符号(421)。这些符号的类别包括用于管理视频解码器(410)的操作的信息，以及用以控制显示装置(412)(例如，显示屏)等显示装置的潜在信息，所述显示装置不是电子装置(430)的组成部分，但可耦接到电子装置(430)，如图4中所示。用于显示装置的控制信息可以是辅助增强信息(Supplemental Enhancement Information，SEI消息)或视频可用性信息(VideoUsability Information，VUI)的参数集片段(未标示)。解析器(420)可对接收到的已编码视频序列进行解析/熵解码。已编码视频序列的编码可根据视频编码技术或标准进行，且可遵循各种原理，包括可变长度编码、霍夫曼编码(Huffman coding)、具有或不具有上下文灵敏度的算术编码等等。解析器(420)可基于对应于群组的至少一个参数，从已编码视频序列提取用于视频解码器中的像素的子群中的至少一个子群的子群参数集。子群可包括图像群组(Group of Pictures，GOP)、图像、图块、切片、宏块、编码单元(Coding Unit，CU)、块、变换单元(Transform Unit，TU)、预测单元(Prediction Unit，PU)等等。解析器(420)还可从已编码视频序列提取信息，例如变换系数、量化器参数值、运动矢量等等。

解析器(420)可对从缓冲存储器(415)接收的视频序列执行熵解码/解析操作，从而创建符号(421)。

取决于已编码视频图像或一部分已编码视频图像(例如：帧间图像和帧内图像、帧间块和帧内块)的类型以及其它因素，符号(421)的重建可涉及多个不同单元。涉及哪些单元以及涉及方式可由解析器(420)从已编码视频序列解析的子群控制信息控制。为了简洁起见，未描述解析器(420)与下文的多个单元之间的此类子群控制信息流。

除已经提及的功能块以外，视频解码器(410)可在概念上细分成如下文所描述的数个功能单元。在商业约束下运行的实际实施例中，这些单元中的许多单元彼此紧密交互并且可以彼此集成。然而，出于描述所公开主题的目的，概念上细分成下文的功能单元是适当的。

第一单元是缩放器/逆变换单元(451)。缩放器/逆变换单元(451)从解析器(420)接收作为符号(421)的量化变换系数以及控制信息，包括使用哪种变换方式、块大小、量化因子、量化缩放矩阵等。缩放器/逆变换单元(451)可输出包括样本值的块，所述样本值可输入到聚合器(455)中。

在一些情况下，缩放器/逆变换单元(451)的输出样本可属于帧内编码块；即：不使用来自先前重建的图像的预测性信息，但可使用来自当前图像的先前重建部分的预测性信息的块。此类预测性信息可由帧内图像预测单元(452)提供。在一些情况下，帧内图像预测单元(452)采用从当前图像缓冲器(458)提取的已重建信息生成大小和形状与正在重建的块相同的周围块。举例来说，当前图像缓冲器(458)缓冲部分重建的当前图像和/或完全重建的当前图像。在一些情况下，聚合器(455)基于每个样本，将帧内预测单元(452)生成的预测信息添加到由缩放器/逆变换单元(451)提供的输出样本信息中。

在其它情况下，缩放器/逆变换单元(451)的输出样本可属于帧间编码和潜在运动补偿块。在此情况下，运动补偿预测单元(453)可访问参考图像存储器(457)以提取用于预测的样本。在根据符号(421)对提取的样本进行运动补偿之后，这些样本可由聚合器(455)添加到缩放器/逆变换单元(451)的输出(在这种情况下被称作残差样本或残差信号)，从而生成输出样本信息。运动补偿预测单元(453)从参考图像存储器(457)内的地址获取预测样本可受到运动矢量控制，且所述运动矢量以所述符号(421)的形式而供运动补偿预测单元(453)使用，所述符号(421)例如是包括X、Y和参考图像分量。运动补偿还可包括在使用子样本精确运动矢量时，从参考图像存储器(457)提取的样本值的内插、运动矢量预测机制等等。

聚合器(455)的输出样本可在环路滤波器单元(456)中被各种环路滤波技术采用。视频压缩技术可包括环路内滤波器技术，所述环路内滤波器技术受控于包括在已编码视频序列(也称作已编码视频码流)中的参数，且所述参数作为来自解析器(420)的符号(421)可用于环路滤波器单元(456)。然而，在其他实施例中，视频压缩技术还可响应于在解码已编码图像或已编码视频序列的先前(按解码次序)部分期间获得的元信息，以及响应于先前重建且经过环路滤波的样本值。

环路滤波器单元(456)的输出可以是样本流，所述样本流可输出到显示装置(412)以及存储在参考图像存储器(457)，以用于后续的帧间图像预测。

一旦完全重建，某些已编码图像就可用作参考图像以用于将来预测。举例来说，一旦对应于当前图像的已编码图像被完全重建，且已编码图像(通过例如解析器(420))被识别为参考图像，则当前图像缓冲器(458)可变为参考图像存储器(457)的一部分，且可在开始重建后续已编码图像之前重新分配新的当前图像缓冲器。

视频解码器(410)可根据例如ITU-T H.265标准中的预定视频压缩技术执行解码操作。在已编码视频序列遵循视频压缩技术或标准的语法以及视频压缩技术或标准中记录的配置文件的意义上，已编码视频序列可符合所使用的视频压缩技术或标准指定的语法。具体地说，配置文件可从视频压缩技术或标准中可用的所有工具中选择某些工具作为在所述配置文件下可供使用的仅有工具。对于合规性，还要求已编码视频序列的复杂度处于视频压缩技术或标准的层级所限定的范围内。在一些情况下，层级限制最大图像大小、最大帧率、最大重建取样率(以例如每秒兆(mega)个样本为单位进行测量)、最大参考图像大小等。在一些情况下，由层级设定的限制可通过假想参考解码器(Hypothetical ReferenceDecoder，HRD)规范和在已编码视频序列中用信号表示的HRD缓冲器管理的元数据来进一步限定。

在实施例中，接收器(431)可连同已编码视频一起接收附加(冗余)数据。所述附加数据可以是已编码视频序列的一部分。所述附加数据可由视频解码器(410)用以对数据进行适当解码和/或较准确地重建原始视频数据。附加数据可呈例如时间、空间或信噪比(signal noise ratio，SNR)增强层、冗余切片、冗余图像、前向纠错码等形式。

图5是根据本申请公开的实施例的视频编码器(503)的框图。视频编码器(503)设置于电子装置(520)中。电子装置(520)包括传输器(540)(例如传输电路)。视频编码器(503)可用于代替图3实施例中的视频编码器(303)。

视频编码器(503)可从视频源(501)(并非图5实施例中的电子装置(520)的一部分)接收视频样本，所述视频源可采集将由视频编码器(503)编码的视频图像。在另一实施例中，视频源(501)是电子装置(520)的一部分。

视频源(501)可提供将由视频编码器(503)编码的呈数字视频样本流形式的源视频序列，所述数字视频样本流可具有任何合适位深度(例如：8位、10位、12位……)、任何色彩空间(例如BT.601Y CrCB、RGB……)和任何合适取样结构(例如Y CrCb 4:2:0、Y CrCb 4:4:4)。在媒体服务***中，视频源(501)可以是存储先前已准备的视频的存储装置。在视频会议***中，视频源(501)可以是采集本地图像信息作为视频序列的相机。可将视频数据提供为多个单独的图像，当按顺序观看时，这些图像被赋予运动。图像自身可构建为空间像素阵列，其中取决于所用的取样结构、色彩空间等，每个像素可包括一个或多个样本。所属领域的技术人员可以很容易理解像素与样本之间的关系。下文侧重于描述样本。

根据实施例，视频编码器(503)可实时或在由应用所要求的任何其它时间约束下，将源视频序列的图像编码且压缩成已编码视频序列(543)。施行适当的编码速度是控制器(550)的一个功能。一些实施例中，控制器(550)控制如下文所描述的其它功能单元且在功能上耦接到这些单元。为了简洁起见，图中未标示耦接。由控制器(550)设置的参数可包括速率控制相关参数(图像跳过、量化器、率失真优化技术的λ值等)、图像大小、图像群组(group of pictures，GOP)布局，最大运动矢量搜索范围等。控制器(550)可用于具有其它合适的功能，这些功能涉及针对某一***设计优化的视频编码器(503)。

一些实施例中，视频编码器(503)在编码环路中进行操作。作为简单的描述，在实施例中，编码环路可包括源编码器(530)(例如，负责基于待编码的输入图像和参考图像创建符号，例如符号流)和嵌入于视频编码器(503)中的(本地)解码器(533)。解码器(533)以类似于(远程)解码器创建样本数据的方式重建符号以创建样本数据(因为在本申请所考虑的视频压缩技术中，符号与已编码视频码流之间的任何压缩是无损的)。将重建的样本流(样本数据)输入到参考图像存储器(534)。由于符号流的解码产生与解码器位置(本地或远程)无关的位精确结果，因此参考图像存储器(534)中的内容在本地编码器与远程编码器之间也是按比特位精确对应的。换句话说，编码器的预测部分“看到”的参考图像样本与解码器将在解码期间使用预测时所“看到”的样本值完全相同。这种参考图像同步性基本原理(以及在例如因信道误差而无法维持同步性的情况下产生的漂移)也用于一些相关技术。

“本地”解码器(533)的操作可与例如已在上文结合图4详细描述视频解码器(410)的“远程”解码器相同。然而，另外简要参考图4，当符号可用且熵编码器(545)和解析器(420)能够无损地将符号编码/解码为已编码视频序列时，包括缓冲存储器(415)和解析器(420)在内的视频解码器(410)的熵解码部分，可能无法完全在本地解码器(533)中实施。

此时可以观察到，除存在于解码器中的解析/熵解码之外的任何解码器技术，也必定以基本上相同的功能形式存在于对应的编码器中。出于此原因，本申请侧重于解码器操作。可简化编码器技术的描述，因为编码器技术与全面地描述的解码器技术互逆。仅在某些区域中需要更详细的描述，并且在下文提供。

在操作期间，一些实施例中，源编码器(530)可执行运动补偿预测编码。参考来自视频序列中被指定为“参考图像”的一个或多个先前已编码图像，所述运动补偿预测编码对输入图像进行预测性编码。以此方式，编码引擎(532)对输入图像的像素块与参考图像的像素块之间的差异进行编码，所述参考图像可被选作所述输入图像的预测参考。

本地视频解码器(533)可基于源编码器(530)创建的符号，对可指定为参考图像的图像的已编码视频数据进行解码。编码引擎(532)的操作可为有损过程。当已编码视频数据可在视频解码器(图5中未示)处被解码时，重建的视频序列通常可以是带有一些误差的源视频序列的副本。本地视频解码器(533)复制解码过程，所述解码过程可由视频解码器对参考图像执行，且可使重建的参考图像存储在参考图像高速缓存(534)中。以此方式，视频编码器(503)可在本地存储重建的参考图像的副本，所述副本与将由远端视频解码器获得的重建参考图像具有共同内容(不存在传输误差)。

预测器(535)可针对编码引擎(532)执行预测搜索。即，对于将要编码的新图像，预测器(535)可在参考图像存储器(534)中搜索可作为所述新图像的适当预测参考的样本数据(作为候选参考像素块)或某些元数据，例如参考图像运动矢量、块形状等。预测器(535)可基于样本块逐像素块操作，以找到合适的预测参考。在一些情况下，根据预测器(535)获得的搜索结果，可确定输入图像可具有从参考图像存储器(534)中存储的多个参考图像取得的预测参考。

控制器(550)可管理源编码器(530)的编码操作，包括例如设置用于对视频数据进行编码的参数和子群参数。

可在熵编码器(545)中对所有上述功能单元的输出进行熵编码。熵编码器(545)根据例如霍夫曼编码、可变长度编码、算术编码等技术对各种功能单元生成的符号进行无损压缩，从而将所述符号转换成已编码视频序列。

传输器(540)可缓冲由熵编码器(545)创建的已编码视频序列，从而为通过通信信道(560)进行传输做准备，所述通信信道可以是通向将存储已编码的视频数据的存储装置的硬件/软件链路。传输器(540)可将来自视频编码器(503)的已编码视频数据与要传输的其它数据合并，所述其它数据例如是已编码音频数据和/或辅助数据流(未示出来源)。

控制器(550)可管理视频编码器(503)的操作。在编码期间，控制器(550)可以为每个已编码图像分配某一已编码图像类型，但这可能影响可应用于相应的图像的编码技术。例如，通常可将图像分配为以下任一种图像类型：

帧内图像(I图像)，其可以是不将序列中的任何其它图像用作预测源就可被编码和解码的图像。一些视频编解码器容许不同类型的帧内图像，包括例如独立解码器刷新(Independent Decoder Refresh，“IDR”)图像。所属领域的技术人员了解I图像的变体及其相应的应用和特征。

预测性图像(P图像)，其可以是可使用帧内预测或帧间预测进行编码和解码的图像，所述帧内预测或帧间预测使用至多一个运动矢量和参考索引来预测每个块的样本值。

双向预测性图像(B图像)，其可以是可使用帧内预测或帧间预测进行编码和解码的图像，所述帧内预测或帧间预测使用至多两个运动矢量和参考索引来预测每个块的样本值。类似地，多个预测性图像可使用多于两个参考图像和相关联元数据以用于重建单个块。

源图像通常可在空间上细分成多个样本块(例如，4×4、8×8、4×8或16×16个样本的块)，且逐块进行编码。这些块可参考其它(已编码)块进行预测编码，根据应用于块的相应图像的编码分配来确定所述其它块。举例来说，I图像的块可进行非预测编码，或所述块可参考同一图像的已经编码的块来进行预测编码(空间预测或帧内预测)。P图像的像素块可参考一个先前编码的参考图像通过空间预测或通过时域预测进行预测编码。B图像的块可参考一个或两个先前编码的参考图像通过空间预测或通过时域预测进行预测编码。

视频编码器(503)可根据例如ITU-T H.265建议书的预定视频编码技术或标准执行编码操作。在操作中，视频编码器(503)可执行各种压缩操作，包括利用输入视频序列中的时间和空间冗余的预测编码操作。因此，已编码视频数据可符合所用视频编码技术或标准指定的语法。

在实施例中，传输器(540)可在传输已编码的视频时传输附加数据。源编码器(530)可将此类数据作为已编码视频序列的一部分。附加数据可包括时间/空间/SNR增强层、冗余图像和切片等其它形式的冗余数据、SEI消息、VUI参数集片段等。

采集到的视频可作为呈时间序列的多个源图像(视频图像)。帧内图像预测(常常简化为帧内预测)利用给定图像中的空间相关性，而帧间图像预测则利用图像之间的(时间或其它)相关性。在实施例中，将正在编码/解码的特定图像分割成块，正在编码/解码的特定图像被称作当前图像。在当前图像中的块类似于视频中先前已编码且仍被缓冲的参考图像中的参考块时，可通过称作运动矢量的矢量对当前图像中的块进行编码。所述运动矢量指向参考图像中的参考块，且在使用多个参考图像的情况下，所述运动矢量可具有识别参考图像的第三维度。

一些实施例中，双向预测技术可用于帧间图像预测中。根据双向预测技术，使用两个参考图像，例如按解码次序都在视频中的当前图像之前(但按显示次序可能分别是过去和将来)第一参考图像和第二参考图像。可通过指向第一参考图像中的第一参考块的第一运动矢量和指向第二参考图像中的第二参考块的第二运动矢量对当前图像中的块进行编码。具体来说，可通过第一参考块和第二参考块的组合来预测所述块。

此外，合并模式技术可用于帧间图像预测中以改善编码效率。

根据本申请公开的一些实施例，帧间图像预测和帧内图像预测等预测的执行以块为单位。举例来说，根据HEVC标准，将视频图像序列中的图像分割成编码树单元(codingtree unit，CTU)以用于压缩，图像中的CTU具有相同大小，例如64×64像素、32×32像素或16×16像素。一般来说，CTU包括三个编码树块(coding tree block，CTB)，所述三个编码树块是一个亮度CTB和两个色度CTB。更进一步的，还可将每个CTU以四叉树拆分为一个或多个编码单元(coding unit，CU)。举例来说，可将64×64像素的CTU拆分为一个64×64像素的CU，或4个32×32像素的CU，或16个16×16像素的CU。在实施例中，分析每个CU以确定用于CU的预测类型，例如帧间预测类型或帧内预测类型。此外，取决于时间和/或空间可预测性，将CU拆分为一个或多个预测单元(prediction unit，PU)。通常，每个PU包括亮度预测块(prediction block，PB)和两个色度PB。在实施例中，编码(编码/解码)中的预测操作以预测块为单位来执行。以亮度预测块作为预测块为例，预测块包括像素值(例如，亮度值)的矩阵，例如8×8像素、16×16像素、8×16像素、16×8像素等等。

图6是根据本申请公开的另一实施例的视频编码器(603)的图。视频编码器(603)用于接收视频图像序列中的当前视频图像内的样本值的处理块(例如预测块)，且将所述处理块编码到作为已编码视频序列的一部分的已编码图像中。在本实施例中，视频编码器(603)用于代替图3实施例中的视频编码器(303)。

在HEVC实施例中，视频编码器(603)接收用于处理块的样本值的矩阵，所述处理块为例如8×8样本的预测块等。视频编码器(603)使用例如率失真(rate-distortion，RD)优化来确定是否使用帧内模式、帧间模式或双向预测模式来编码所述处理块。当在帧内模式中编码处理块时，视频编码器(603)可使用帧内预测技术以将处理块编码到已编码图像中；且当在帧间模式或双向预测模式中编码处理块时，视频编码器(603)可分别使用帧间预测或双向预测技术将处理块编码到已编码图像中。在某些视频编码技术中，合并模式可以是帧间图像预测子模式，其中，在不借助预测因子外部的已编码运动矢量分量的情况下，从一个或多个运动矢量预测因子导出运动矢量。在某些其它视频编码技术中，可存在适用于主题块的运动矢量分量。在实施例中，视频编码器(603)包括其它组件，例如用于确定处理块模式的模式决策模块(未示出)。

在图6的实施例中，视频编码器(603)包括如图6所示的耦接到一起的帧间编码器(630)、帧内编码器(622)、残差计算器(623)、开关(626)、残差编码器(624)、通用控制器(621)和熵编码器(625)。

帧间编码器(630)用于接收当前块(例如处理块)的样本、比较所述块与参考图像中的一个或多个参考块(例如先前图像和后来图像中的块)、生成帧间预测信息(例如根据帧间编码技术的冗余信息描述、运动矢量、合并模式信息)、以及基于帧间预测信息使用任何合适的技术计算帧间预测结果(例如已预测块)。一些实施例中，参考图像是基于已编码的视频信息解码的已解码参考图像。

帧内编码器(622)用于接收当前块(例如处理块)的样本、在一些情况下比较所述块与同一图像中已编码的块、在变换之后生成量化系数、以及在一些情况下还(例如根据一个或多个帧内编码技术的帧内预测方向信息)生成帧内预测信息。在实施例中，帧内编码器(622)还基于帧内预测信息和同一图像中的参考块计算帧内预测结果(例如已预测块)。

通用控制器(621)用于确定通用控制数据，且基于所述通用控制数据控制视频编码器(603)的其它组件。在实施例中，通用控制器(621)确定块的模式，且基于所述模式将控制信号提供到开关(626)。举例来说，当所述模式是帧内模式时，通用控制器(621)控制开关(626)以选择供残差计算器(623)使用的帧内模式结果，且控制熵编码器(625)以选择帧内预测信息且将所述帧内预测信息添加在码流中；以及当所述模式是帧间模式时，通用控制器(621)控制开关(626)以选择供残差计算器(623)使用的帧间预测结果，且控制熵编码器(625)以选择帧间预测信息且将所述帧间预测信息添加在码流中。

残差计算器(623)用于计算所接收的块与选自帧内编码器(622)或帧间编码器(630)的预测结果之间的差(残差数据)。残差编码器(624)用于基于残差数据操作，以对残差数据进行编码以生成变换系数。在实施例中，残差编码器(624)用于将残差数据从时域转换到频域，且生成变换系数。变换系数接着经由量化处理以获得量化的变换系数。在各种实施例中，视频编码器(603)还包括残差解码器(628)。残差解码器(628)用于执行逆变换，且生成已解码残差数据。已解码残差数据可适当地由帧内编码器(622)和帧间编码器(630)使用。举例来说，帧间编码器(630)可基于已解码残差数据和帧间预测信息生成已解码块，且帧内编码器(622)可基于已解码残差数据和帧内预测信息生成已解码块。适当处理已解码块以生成已解码图像，且一些实施例中，所述已解码图像可在存储器电路(未示出)中缓冲并用作参考图像。

熵编码器(625)用于将码流格式化以产生已编码的块。熵编码器(625)根据HEVC标准等合适标准产生各种信息。在实施例中，熵编码器(625)用于获得通用控制数据、所选预测信息(例如帧内预测信息或帧间预测信息)、残差信息和码流中的其它合适的信息。应注意，根据所公开的主题，当在帧间模式或双向预测模式的合并子模式中对块进行编码时，不存在残差信息。

图7是本申请另一实施例的视频解码器(710)的图。视频解码器(710)用于接收作为已编码视频序列的一部分的已编码图像，且对所述已编码图像进行解码以生成重建的图像。在实施例中，视频解码器(710)用于代替图3实施例中的视频解码器(310)。

在图7实施例中，视频解码器(710)包括如图7中所示耦接到一起的熵解码器(771)、帧间解码器(780)、残差解码器(773)、重建模块(774)和帧内解码器(772)。

熵解码器(771)可用于根据已编码图像来重建某些符号，这些符号表示构成所述已编码图像的语法元素。此类符号可包括例如用于对所述块进行编码的模式(例如帧内模式、帧间模式、双向预测模式、后两者的合并子模式或另一子模式)、可分别识别供帧内解码器(772)或帧间解码器(780)用以进行预测的某些样本或元数据的预测信息(例如帧内预测信息或帧间预测信息)、呈例如量化的变换系数形式的残差信息等等。在实施例中，当预测模式是帧间或双向预测模式时，将帧间预测信息提供到帧间解码器(780)；以及当预测类型是帧内预测类型时，将帧内预测信息提供到帧内解码器(772)。残差信息可经由逆量化并提供到残差解码器(773)。

帧间解码器(780)用于接收帧间预测信息，且基于所述帧间预测信息生成帧间预测结果。

帧内解码器(772)用于接收帧内预测信息，且基于所述帧内预测信息生成预测结果。

残差解码器(773)用于执行逆量化以提取解量化的变换系数，且处理所述解量化的变换系数，以将残差从频域转换到空间域。残差解码器(773)还可能需要某些控制信息(用以获得量化器参数QP)，且所述信息可由熵解码器(771)提供(未标示数据路径，因为这仅仅是低量控制信息)。

重建模块(774)用于在空间域中组合由残差解码器(773)输出的残差与预测结果(可由帧间预测模块或帧内预测模块输出)以形成重建的块，所述重建的块可以是重建的图像的一部分，所述重建的图像继而可以是重建的视频的一部分。应注意，可执行解块操作等其它合适的操作来改善视觉质量。

应注意，可使用任何合适的技术来实施视频编码器(303)、视频编码器(503)和视频编码器(603)以及视频解码器(310)、视频解码器(410)和视频解码器(710)。在实施例中，可使用一个或多个集成电路来实施视频编码器(303)、视频编码器(503)和视频编码器(603)以及视频解码器(310)、视频解码器(410)和视频解码器(710)。在另一实施例中，可使用执行软件指令的一个或多个处理器来实施视频编码器(303)、视频编码器(503)和视频编码器(603)以及视频解码器(310)、视频解码器(410)和视频解码器(710)。

II.帧间预测模式

在各实施例中，一幅图像可被分割成多个块，例如，使用基于树结构的分割方案进行分割。分割得到的多个块可以用不同的处理模式进行处理，例如，帧内预测模式、帧间预测模式(例如，合并模式、跳过模式、高级运动矢量预测(advanced motion vectorprediction，AVMP)模式)等。帧内编码块可以是用帧内预测模式编码的块。相应地，帧间编码块可以是用帧间预测模式处理的块。

1、常规合并模式

在对当前被处理的块(称为当前块)进行合并模式下的处理时，可以根据一组空间相邻块和/或时间相邻块来构造该当前块的合并候选列表。可以选择合并候选列表中的候选运动信息之一来确定或得出当前块的运动信息。编码器可以用信号向解码器表示合并索引，以指示所选择的候选信息。

图8为一个实施例的合并模式下的当前块和对应的合并候选块的示意图。在该实施例中，将要为在合并模式下处理的当前块(810)构造合并候选列表。为合并模式处理定义了一组相邻块，分别表示为A1，B1，B0，A0，B2，C0和C1。可以根据与当前块(810)位于同一图像中的空间相邻块A1，B1，B0，A0和B2来确定用于构造合并候选列表的空间候选块。此外，可以根据时间相邻块C0和C1来确定用于构造合并候选列表的时间候选块，所述时间相邻块C0和C1对应于与当前块(810)在另一已编码图像中的同位块相邻或重叠的块。一个实施例中，时间相邻块C1的位置可以与当前块(810)的中心附近的位置接近(例如，相邻)。

一些实施例中，合并候选列表可以具有预定义最大数目，表示为Cm，个合并候选块。这些合并候选块可以按照一定顺序排列在合并候选列表中。一个实施例中，按照预定的顺序，可以从空间相邻块中得出第一数量Ca个合并候选块，其顺序为{A1，B1，B0，A0，B2}，并从时间相邻块中得出第二数量Cb＝Cm-Ca个合并候选块，其顺序为{C0，C1}。

在一些情形中，特定相邻块的候选运动信息可能是不可用的。例如，一个相邻块可被帧内预测为位于包括当前块(810)的条带或图块之外，或者与当前块(810)位于编码树块(coding tree block，CTB)的不同行。在一些场景中，多个相邻块的候选运动信息可能是冗余的。一些实施例中，可以从合并候选列表中删除冗余的合并候选项(例如，通过执行剪枝过程)。当(去除冗余候选项后的)合并候选列表中可用的合并候选项的总数小于合并候选项的最大数目Cm时，可以(例如，根据预先配置的规则)利用一个或多个额外的合并候选项填充合并候选列表，使得候选列表可以保持固定的长度。例如，额外的合并候选项可以包括组合双向预测候选项和/或零运动矢量候选项。

在构建合并候选列表之后，可在编码器处执行评估过程以从合并候选列表中选择合并候选项。例如，可以计算每个合并候选项对应的率失真(rate-distortion，RD)性能，并选择具有最佳RD性能的一个合并候选项。相应地，可以为当前块(810)确定与所选的合并候选项关联的合并索引，并用信号表示该合并索引以通知解码器。

在解码器处，可以接收当前块(810)的合并索引。如上所述，可以执行相似的候选列表构建过程以生成与编码器侧生成的合并候选列表相同的合并候选列表。一些实施例中，在构建合并候选列表之后，可以基于接收的合并索引从合并候选列表中选择合并候选项，而无需执行任何进一步的评估。所选的合并候选项的运动信息可用于后续的当前块(810)的运动补偿预测。

一些实施例中还采用了跳过模式。例如，在跳过模式中，可以如上所述使用合并模式对当前块进行预测以确定一组运动信息，而不引入残差信息。可以将跳过标志与当前块相关联。可以用信号向视频解码器表示跳过标志和指示当前块的相关运动信息的合并索引。例如，在帧间图像预测条带中的CU的开始处，可用信号表示跳过标志，其暗示以下内容：该CU仅包含一个PU(2Nx2N)；使用合并模式得出运动信息；以及在码流中不存在残差信息。在解码器侧，基于跳过标志，可以基于用于解码相应当前块的合并索引来确定预测块，而不添加残差信息。因此，可以结合跳过模式来利用本文所公开的带有合并模式的视频编解码的各种方法。

一些实施例中，码流中用信号表示的合并标志或跳过标志指示当前块是否以合并模式编码。如果合并标志设为真，则用信号表示合并索引，以指示合并候选列表中的哪个候选项用于提供当前块的运动信息。一些实施例中，可以在合并候选列表中添加(来自四个空间相邻块的)至多四个空间合并候选项和(来自一个时间间相邻块的)至多一个时间合并候选项。语法元素MaxMergeCandsNum可定义为合并候选列表的大小。可以在码流中用信号表示语法元素MaxMergeVandsNum。

2、仿射合并模式

图9是一个实施例的当前块(或称为编码单元(coding unit，CU))(901)的空间相邻块和时间相邻块的示意图。如图所示，空间相邻块表示为A0、A1、A2、B0、B1、B2和B3(分别为902、903、907、904、905、906和908)，而时间相邻块表示为C0(912)。一些实施例中，空间相邻块A0、A1、A2、B0、B1、B2和B3以及当前块(901)位于同一图像中。一些实施例中，时间相邻块C0位于参考图像中，并且对应于在当前块(901)之外且与当前块(901)的右下角相邻的位置。

一些实施例中，可以使用仿射模型(例如，6参数仿射模型或4参数仿射模型)得出当前块(901)的运动矢量和/或当前块的子块的运动矢量。一些实施例中，仿射模型具有6个参数(例如，6参数仿射模型)，用于描述块或子块的运动矢量。例如，仿射编码块的6个参数可由该块的三个不同位置(例如，图9中左上角、右上角及左下角处的控制点CP0、CP1及CP2)处的三个运动矢量(也称为三个控制点运动矢量(control point motion vectors，CPMV))来表示。在另一实施例中，简化的仿射模型使用4个参数来描述仿射编码块的运动信息，其可由该块的两个不同位置(例如，图9中的左上角和右上角处的控制点CP0和CP1)处的两个运动矢量(也称为两个CPMV)来表示。

可以使用仿射合并模式基于一个或多个空间相邻块和/或时间相邻块的运动信息来构建运动信息候选列表(也被称为仿射合并候选列表)。一些实施例中，在当前块(901)的宽度和高度等于或大于8个样本时，可以应用仿射合并模式。根据仿射合并模式，可以基于列表中的候选运动信息来确定当前块(901)的CPMV。一些实施例中，运动信息候选列表可以包括至多五个候选CPMV，并且可用信号表示一个索引，用于指示当前块使用哪个候选CPMV。一些实施例中，一个候选CPMV包括仿射模式的所有CPMV。

一些实施例中，仿射合并候选列表可以具有三种类型的候选CPVM，包括继承的仿射候选项、构建的仿射候选项和零MV。可通过外推法从相邻块的CPMV得出继承的仿射候选项。可对相邻块的MV进行平移来得出构建的仿射候选项。

例如，可存在至多两个继承仿射候选项，从相邻块的对应仿射运动模型得出，包括来自左相邻块(A0和A1)的一个块和来自上方相邻块(B0，B1和B2)的一个块。对于来自左边的候选项，可依次检查相邻块A0和A1，并将来自相邻块A0和A1的第一可用继承仿射候选项用作从左边继承的仿射候选项。对于来自上方的候选项，可依次检查相邻块B0、B1和B2，并将来自相邻块B0、B1和B2的第一可用继承仿射候选项用作从上方继承的仿射候选。一些实施例中，在两个继承仿射候选项之间不执行剪枝检查。

当识别出相邻仿射块时，可从该相邻仿射块的控制点运动矢量得出待添加到当前块(901)的仿射合并列表的相应的继承仿射候选项。在图9的例子中，如果相邻块A1用仿射模式进行编码，则可以获得块A1的左上角(控制点CP0_A1)、右上角(控制点CP1_A1)和左下角(控制点CP2_A1)的运动矢量。当块A1使用4参数仿射模型进行编码时，可以根据控制点CP0_A1和控制点CP1_A1的运动矢量来计算当前块(901)的继承仿射候选的两个CPMV。当块A1使用6参数仿射模型进行编码时，可以根据控制点CP0_A1、控制点CP1_A1和控制点CP2_A1的运动矢量来计算当前块(901)的继承仿射候选的三个CPMV。

此外，可以通过组合每个控制点的相邻平移运动信息来得出构建的仿射候选项。控制点CP0、CP1和CP2的运动信息是从指定的空间相邻块A0、A1、A2、B0、B1、B2和B3得出的。

例如，CPMV_k(k＝1，2，3，4)表示第k个控制点的运动矢量，其中CPMV₁对应控制点CP0，CPMV₂对应控制点CP1，CPMV₃对应控制点CP2，而CPMV₄对应时间相邻块C0的时间控制点。对于CPMV₁，可以依次检查相邻块B2、B3和A2，并且将来自相邻块B2、B3和A2的第一可用运动矢量用作CPMV₁。对于CPMV₂，可以依次检查相邻块B1和B0，并且将来自相邻块B1和B0的第一可用运动矢量用作CPMV₂。对于CPMV₃，可以依次检查相邻块A1和A0，并且将来自相邻块A1和A0的第一可用运动矢量用作CPMV₃。此外，如果可用，时间相邻块C0的运动矢量可以用作CPMV₄。

在获得四个控制点CP0、CP1、CP2和时间控制点的CPMV₁、CPMV₂、CPMV₃和CPMV₄之后，可以构建仿射合并候选列表以包括按照以下顺序构建的仿射合并候选项：{CPMV₁，CPMV₂，CPMV₃}、{CPMV₁，CPMV₂，CPMV₄}、{CPMV₁，CPMV₃，CPMV₄}、{CPMV₂，CPMV₃，CPMV₄}、{CPMV₁，CPMV₂}，以及{CPMV₁，CPMV₃}。三个CPMV的组合可以形成一个6参数仿射合并候选项，而两个CPMV的任何组合可以形成一个4参数仿射合并候选项。一些实施例中，为了避免运动缩放过程，如果一组控制点的参考索引不同，则可以丢弃对应的CPMV组合。

3、基于子块的时间运动矢量预测(Subblock-Based Temporal Motion VectorPrediction，SbTMVP)模式

图10A是一个实施例的空间相邻块的示意图，该空间相邻块可以用于使用基于子块的时间MV预测(SbTMVP)方法来确定当前块(1011)的预测运动信息。图10A示出了当前块(1011)及其空间相邻块，空间相邻块表示为A0、A1、B0和B1(分别为1012、1013、1014和1015)。一些实施例中，空间相邻块A0、A1、B0和B1以及当前块(1011)位于同一图像中。

图10B是一个实施例的使用SbTMVP方法基于所选空间相邻块(例如在该非限制性实施例中的块A1)来确定当前块(1011)的子块的运动信息的示意图。在该实施例中，当前块(1011)在当前图像(1010)中，而参考块(1061)在参考图像(1060)中，可由运动矢量(1022)指示的当前块(1011)与参考块(1061)之间的运动移位(或位移)确定。

一些实施例中，类似于HEVC中的时间运动矢量预测(temporal motion vectorprediction，TMVP)，SbTMVP将参考图像中的各种参考子块中的运动信息用于当前图像中的当前块。一些实施例中，SbTVMP与TMVP使用相同的参考图像。一些实施例中，TMVP预测CU级别的运动信息，而SbTMVP预测子CU级别的运动。一些实施例中，TMVP使用来自参考图像中同位块的时间运动矢量，该同位块对应的位置与当前块的右下角或中心相邻，并且SbTMVP使用来自参考块的时间运动矢量，其可以通过基于当前块的空间相邻块之一的运动矢量执行运动移位来确定。

例如，如图10A所示，可以在SbTVMP过程中依次检查相邻块A1、B1、B0和A0。一旦识别出具有使用参考图像(1060)作为其参考图像的运动矢量的第一空间相邻块，例如具有指向参考图像(1060)中的参考块AR1的运动矢量(1022)的块A1，该运动矢量(1022)就可以用于执行运动移位。如果没有从空间相邻块A1、B1、B0和A0识别出这种运动矢量，则可以将运动移位设置为(0，0)。

在确定了运动移位之后，可以基于当前块(1011)的位置和所确定的运动移位来确定参考块(1061)。在图10B中，参考块(1061)可以被进一步划分为具有参考运动信息MRa至MRp的16个子块。一些实施例中，可以基于覆盖相应子块的中心样本的最小运动网格来确定参考块(1061)中的每个子块的参考运动信息。该运动信息可以包括运动矢量和相应的参考索引。当前块(1011)可被进一步划分成16个子块，并且当前块(1011)中的子块的运动信息MVa至MVp可以以类似于TMVP过程的方式从参考运动信息MRa至MRp得出，一些实施例中可以使用时间缩放。

在SbTMVP过程中使用的子块大小可以是固定的(或者是预定的)或用信号表示。一些实施例中，SbTMVP过程中使用的子块大小可以是8×8个样本。一些实施例中，SbTMVP过程仅适用于宽度和高度等于或大于固定的或用信号表示的大小(例如8个像素)的块。

一个实施例中，包含SbTVMP候选项和仿射合并候选项的组合的基于子块的合并列表用于基于子块的合并模式的信号表示。SbTVMP模式可以由序列参数集(sequenceparameter set，SPS)标志启用或停用。一些实施例中，当启用SbTMVP模式时，将SbTMVP候选项添加为基于子块的合并候选列表的第一条目，然后是仿射合并候选项。一些实施例中，设置最大允许的基于子块的合并列表的大小为5。然而，在其它实施例中可以使用其它大小。

一些实施例中，额外的SbTMVP合并候选项的编码逻辑与其它合并候选项相同。即，对于P条带或B条带中的每个块，可以执行额外的速率失真检查以确定是否使用SbTMVP候选项。

4、基于历史的运动矢量预测(History-Based Motion Vector Prediction，HMVP)模式

图11A是一个实施例使用基于历史的MV预测(HMVP)方法来构建和更新运动信息候选列表的方法(1100)的概述流程图。

一些实施例中，可在编码或解码过程中构建并更新使用HMVP方法的运动信息候选列表。该列表也称为历史列表。历史列表可以HMVP表或HMVP缓冲区的形式存储。当一个新的已编码分割部分，例如一个新条带，开始时，可以清空历史列表。一些实施例中，每当存在刚被编码或解码的帧间编码的非仿射块时，相关联的运动信息可以被添加为历史列表的最后一条，作为新的候选HMVP。因此，在处理(编码或解码)当前块之前，可以加载具有候选HMVP的历史列表(S1112)。可以使用历史列表中的候选HMVP对当前块进行编码或解码(S1114)。然后，可以使用用于编码或解码当前块的运动信息来更新历史列表(S1116)。

图11B是一个实施例的使用HMVP方法更新候选运动信息列表的示意图。图11B示出了大小为L的历史列表，列表中的每个候选项可以用范围从0到L-1的索引来标识。L是等于或大于0的整数。在对当前块进行编码或解码之前，历史列表(1120)包括L个候选项HMVP₀、HMVP₁、HMVP₂、...HMVP_m、...、HMVP_L-2和HMVP_L-1，其中m是0至L的整数。在对当前块进行编码或解码之后，将新条目HMVP_C添加到历史列表中。

一个实施例中，历史列表的大小可被设置为6，这指示可将至多6个候选HMVP添加到历史列表。当在历史列表中***新的运动候选项(例如，HMVP_C)时，可以利用受约束的先进先出(first-in-first-out，FIFO)规则，其中首先进行冗余校验来确定历史列表中是否存在冗余的候选HMVP。当未发现冗余的候选HMVP时，从列表中移除第一候选HMVP(图11B实施例中的HMVP₁，其索引＝0)，然后将其它候选HMVP向前移动，例如将其索引减1。例如，HMVP_m+1被向前移动一位，从而与索引＝m相关联。新的候选项HMVP_C可被添加为列表的最后一条(例如，图11B中的索引＝L-1)，如生成的列表(1130)中所示。另一方面，如果找到冗余的候选HMVP(例如图11B实施例中的HMVP₂)，则从列表中移除历史列表中的冗余的候选HMVP，并且将所有之后的HMVP候选向前移动，例如将其索引减小1。新的候选项HMVP_C可被添加为列表的最后一条(例如，图11B中索引＝L-1)，如生成的列表(1140)中所示。

一些实施例中，HMVP候选项可以用于构建合并候选列表。例如，列表中最近的几个HMVP候选项被依次检查并且***到候选列表中的TMVP候选项之后。一些实施例中，可以针对空间或时间合并候选项，对HMVP候选项进行剪枝，而不是对子块运动候选项(例如，SbTMVP候选项)进行剪枝。

一些实施例中，为了减少剪枝操作的次数，可以遵循以下规则中的一个或多个：

(a)由M表示的要检查的HMPV候选项的数目设置如下：

M＝(N<＝4)？L：(8-N)，

其中，N表示可用的非子块合并候选项的数目，L表示历史列表中可用的HMVP候选项的数目。

(b)另外，一旦可用合并候选项的总数仅比用信号表示的合并候选项的最大数目少一个，就可终止根据HMVP列表的合并候选列表构建过程。

(c)此外，用于得出组合的双向预测合并候选项的数目从12对减少到6对。

一些实施例中，HMVP候选项可以用于AMVP候选列表构建过程。历史列表中的最后K个HMVP候选项的运动矢量可以添加到AMVP候选列表中的TMVP候选项之后。一些实施例中，仅将与AMVP目标参考图像具有相同的参考图像的HMVP候选项添加到AMVP候选列表。对HMVP候选项进行剪枝。一些实施例中，K设为4，而AMVP列表大小保持不变，例如等于2。

5、成对平均运动矢量候选项(Pairwise Average Motion Vector Candidates)

一些实施例中，成对平均候选项(pairwise average candidate)可以通过对当前合并候选列表中的预定义候选项对进行平均来生成。例如，一个实施例中，预定义对可以定义为{(0，1)，(0，2)，(1，2)，(0，3)，(1，3)，(2，3)}，其中数字表示合并候选列表的合并索引。例如，可以为每个参考图像列表分别计算平均运动矢量。如果两个待平均的运动矢量在一个列表中都可用，则即使当这两个运动矢量指向不同的参考图像时，也可以对它们进行平均。如果仅一个运动矢量可用，则可以直接使用这一个运动矢量。如果没有可用的运动矢量，则一个实施例中，可以跳过相应的对。一些实施例中，构建合并候选列表时，可以用成对平均候选项替换组合候选项。

6、运动矢量差分合并(Merge with Motion Vector Difference，MMVD)模式

一些实施例中，使用运动矢量差分合并(MMVD)模式来确定当前块的运动矢量预测因子。当启用跳过模式或合并模式时，可以使用MMVD模式。MMVD模式重复使用跳过模式或合并模式的合并候选列表上的合并候选项。例如，从合并候选列表中选择的合并候选项可以用于提供参考图像处的起始点。当前块的运动矢量可以用起始点和运动偏移来表示，运动偏移包括相对于起始点的运动幅度和运动方向。在编码器侧，合并候选项的选择和运动偏移的确定可以基于搜索过程(评估过程)。在解码器侧，可以基于来自编码器侧的信令来确定选择的合并候选项和运动偏移。

MMVD模式可以重复使用以本文中描述的各种帧间预测模式构建的合并候选列表。一些实施例中，针对MMVD模式仅考虑合并候选列表中的默认合并类型(例如，MRG_TYPE_DEFAULT_N)的候选项。默认合并类型的合并候选项的例子可以包括：(i)合并模式中采用的合并候选项，(ii)HMVP模式中来自历史缓冲区的合并候选项，和(iii)如本文中描述的成对平均运动矢量候选项。一些实施例中，仿射模式或SbTMVP模式中的合并候选项不用于MMVD模式中的扩展。

基本候选索引(base candidate index，IDX)可以用于定义起始点。例如，表1中示出了与从0到3的索引相关联的合并候选项(运动矢量预测因子(motion vectorpredicator，MVP))的列表。基本候选索引之一的索引对应的合并候选项可以从列表中确定，并用于提供起始点。

表1.基本候选IDX

距离索引可以被用于提供运动幅度信息。例如，在表2中示出了多个预定义的像素距离，每个预定义像素距离与从0到7的索引相关联。具有距离索引之一的索引对应的像素距离可以从这多个像素距离中确定，并用于提供运动幅度。

表2.距离IDX

距离IDX	0	1	2	3	4	5	6	7
									像素距离	1/4像素	1/2-pel	1像素	2像素	4像素	8像素	16像素	32像素

方向索引可以用于提供运动方向信息。例如，在表3中示出了索引从00到11(二进制)的四个方向。方向索引之一的索引对应的方向可以从这四个方向中确定，并用于提供相对于起始点的运动偏移的方向。

表3.方向IDX

方向IDX	00	01	10	11
					x轴	+	-	N/A	N/A
y轴	N/A	N/A	+	-

MMVD语法元素可以在码流中传输，以用信号表示MMVD模式中的一组MMVD索引，包括基本候选索引、方向索引和距离IDX。

一些实施例中，在发送用于对当前块进行编解码的跳过和合并标志之后用信号表示MMVD启用标志。例如，当跳过和合并标志为真时，解析MMVD标志。一个实施例中，当MMVD标志等于1时，解析MMVD语法元素(上述一组MMVD索引)。一个实施例中，当MMVD标志不为1时，解析与另一模式相关联的标志，例如仿射标志。当仿射标志等于1时，使用仿射模式处理当前块。一个实施例中，当仿射标志不为1时，解析跳过/合并索引，从而用跳过/合并模式处理当前块。

图12和图13为本申请一个实施例的在MMVD模式下的搜索过程的示例。通过执行搜索过程，可以为当前图像(或称为当前帧，1210)中的当前块(1212)确定一组MMVD索引，包括基本候选索引、方向索引和距离索引。

图12和图13示出了第一合并候选项指示的第一运动矢量(1222)和第二运动矢量(1224)。第一合并候选项可以是为当前块(1212)构建的合并候选列表中的合并候选项。第一运动矢量(1222)和第二运动矢量(1224)可以分别与参考图像列表L0和L1中的两个参考图像(1240)和(1260)相关联。这样，可以在参考图像(1240)和(1260)中确定图13中的两个起始点(1241)和(1261)。

一个实施例中，基于起始点(1241)和(1261)，可以评估参考图像(1240)和(1260)中从起始点(1241)和(1261)沿垂直方向(由+Y或-Y表示)或水平方向(由+X和-X表示)延伸的多个预定义点。一个实施例中，关于各个起始点(1312)或(1314)彼此镜像的一对点，例如点对(1322)和(1324)，或点对(1241)和(1261)，可以用于确定一对运动矢量，这对运动矢量可形成当前块(1212)的运动矢量预测因子候选项。可以对基于围绕起始点(1241)或(1261)的预定义点确定的那些运动矢量预测因子候选项进行评估。

除了第一合并候选项，还可以以相似方式评估当前块(1212)的合并候选列表中的其它可用的或有效的合并候选项。一个实施例中，对于单向预测的合并候选项，仅评估与两个参考图像列表中的一个参考图像列表相关联的一个预测方向。

基于以上评估，可以确定运动矢量预测因子候选项。因此，对应于该运动矢量预测因子候选项，可以从合并列表中选择合并候选项，还可以确定运动方向和运动距离。例如，基于选择的合并候选项和表1，可以确定基本候选索引。基于选择的运动矢量预测因子，例如预定义点(1314)(或(1322))对应的运动矢量预测因子，可以确定点(1314)相对于起始点(1241)的方向和距离。根据表2和表3，可以相应地确定方向索引和距离索引。

应当注意，以上描述的实施例仅用于阐释性说明。在其它实施例中，基于MMVD模式提供的运动矢量表达方法，可以以不同方式定义运动距离和运动方向。另外，可以以不同方式执行评估过程(搜索过程)。例如，对于双向预测合并候选项，可基于一组预定义的距离和方向来评估三种类型的预测方向(例如，L0、L1以及L0和L1)，从而选择运动矢量预测因子。另一实施例中，可通过镜像或缩放将单向预测合并候选项转换为双向预测合并候选项，且随后对其进行评估。在以上实施例中，可以用信号表示额外的语法元素，指示评估过程产生的预测方向(例如，L0、L1或L0和L1)。

如上所述，在编码器处评估合并候选列表中的合并候选项以确定MMVD模式的基本候选项。在解码器处，使用基本候选索引作为输入，可以从合并候选列表中选择运动矢量预测因子。因此，除了用于存储合并候选项的线缓冲区之外，MMVD模式不需要额外的线缓冲区。

7.具有共享合并列表的合并共享区域

一些实施例中，当前块的大小和/或当前块内的子块的大小满足某些条件时，采用具有共享合并列表的合并共享区域。例如，CU分割树中的特定节点(例如，祖先节点)的叶CU可以共享合并候选列表。以此方式，可以避免针对每个叶CU单独构造合并候选列表，这使得能够在合并共享区域内并行处理小的合并/跳过编码的CU。该特定节点可被称为合并共享节点，其对应于一个合并共享区域。为合并共享节点生成共享合并候选列表，将合并共享节点当作叶CU。

在解码的解析阶段，可以为CTU内部的每个节点确定是否可以将拆分树节点视为合并共享节点。一个实施例中，当叶CU的祖先节点满足以下标准时，可以将该祖先节点确定为合并共享节点：

(a)该祖先节点的块大小等于或大于一尺寸阈值(例如32像素，64像素等)；

(b)在该祖先节点内，一个子CU的大小小于该尺寸阈值。

图14A示出了基于64个像素的尺寸阈值定义的合并共享区域(1410)、(1420)、(1430)、(1440)的实施例。合并共享区域(1410)-(1440)中的每个区域的块大小为64个像素，等于该尺寸阈值。合并共享区域(1410)-(1440)中的每个区域包括至少一个尺寸小于尺寸阈值的叶CU。

图14B示出了基于64个像素的尺寸阈值定义的合并共享区域(1450)的另一实施例。合并共享区域(1450)包括尺寸分别为32、64和32个像素的三个子块(1452)、(1454)、(1456)。合并共享区域(1450)的尺寸为128个像素，大于尺寸阈值，并且包括尺寸小于尺寸阈值的两个子块(1452)和(1456)。

其它实施例中，可以基于不同的定义确定合并共享区域。例如，块大小小于阈值的叶CU的祖先节点可以被确定为合并共享区域。以图14B为例，当使用64个像素作为阈值时，可以将块1452-1456中的任何一个块确定为一个独立的合并共享区域。

采用64个像素作为阈值仅是一个非限制性的例子。在其他实施例中，该阈值可以被设置为32个像素或其他合适的值。

另外，一些实施例中，合并共享节点没有任何样本在图像边界之外。在解析阶段，如果祖先节点满足合并共享区域的定义，但是有一些样本在图像边界之外，则该祖先节点不被作为合并共享节点。接下来，可以对该节点内的子CU进行评估以确定合并共享区域。

共享合并候选列表算法可以支持平移合并/跳过模式，例如常规合并模式、帧内块复制(Intra Block Copying)模式(或IBC模式)、三角分割模式、sbTMVP模式、MMVD模式等。一些实施例中，仿射合并模式不用于对合并共享区域中的块进行编码。在合并共享区域中使用这些合并/跳过模式时，可以将其与HMVP表合并。对于这些合并/跳过模式，共享合并候选列表算法的操作类似于基于常规合并候选列表的操作。一方面，将合并共享节点当作叶CU，共享合并候选列表算法对应于为合并共享节点生成候选项。

一些实施例中，可以使用除合并/跳过模式以外的编码模式来对合并共享区域内的叶CU进行编码。例如，可以用帧内模式或除合并/跳过模式之外的帧间模式(例如，AMVP模式)对合并共享节点内的CU进行编码。

8、三角预测

一些实施例中，三角预测模式(triangular prediction mode，TPM)可以用于帧间预测。一个实施例中，应用TPM的CU为尺寸大于或等于8×8个样本、且使用跳过或合并模式编码的CU。一个实施例中，对于满足这些条件(尺寸大于或等于8×8样本并且采用跳过或合并模式编码)的CU，用信号表示一个CU级的标志以指示是否使用TPM。

图15A是一个实施例的按照三角预测模式对当前块进行分割的两个例子的示意图。一些实施例中，当使用TPM时，如图15A所示，可以沿从左上角到右下角的对角线(例如，对角线分割)或沿从右上角到左下角的对角线(例如，反对角线分割)将CU均匀地分割成两个三角分区。在图15A中，当前块(或者也称为CU)(1510A)可以从左上角到右下角进行分割，从而产生两个三角预测单元(1512)和(1514)。CU(1510B)也可以从右上角到左下角进行分割，从而产生两个三角预测单元(1516)和(1518)。两个例子(1510A)和(1510B)中的每个三角预测单元(1512)、(1514)、(1516)和(1518)的帧间预测可以使用其自身的运动信息。

一些实施例中，仅允许对每个三角预测单元进行单向预测。因此，每个三角预测单元具有一个运动矢量和一个参考图像索引。可以应用单向预测运动约束以确保，像常规的双向预测方法中那样，对每个CU执行不超过两个运动补偿预测。这样，可以降低处理复杂度。可以从单向预测合并候选列表得出每个三角预测单元的单向预测运动信息。一些其它实施例中，允许对每个三角预测单元进行双向预测。因此，可以从双向预测合并候选列表得出每个三角预测单元的双向预测运动信息。

一些实施例中，当CU级标志指示当前CU使用TPM进行编码时，进一步用信号表示一个索引，称为三角分区索引。例如，三角分区索引可具有在[0,39]范围内的值。使用该三角分区索引，可以通过在解码器侧查表来获得三角分区的方向(对角线或反对角线)以及每个分区的运动信息(例如，相应的单向预测候选列表的合并索引(或称为TPM索引))。

一个实施例中，在基于所获得的运动信息预测每个三角预测单元之后，通过执行具有自适应权重的混合过程来调整沿着当前CU的对角线或反对角线边线的样本值。混合过程的结果是可以获得整个CU的预测信号。随后，可以利用类似于其它预测模式的方式对整个CU应用变换和量化过程。最后，可以为利用三角分区模式预测的CU创建运动场，例如，可以通过将运动信息存储在从CU分割得到的一组4×4单元中进行创建。运动场可以用于，例如，在后续的运动矢量预测过程中用于构建合并候选列表。

8.1单向预测候选列表的构建

一些实施例中，可以基于一个编码块的一组空间相邻块和时间相邻块来构建用于对经过TPM处理的该编码块的两个三角预测单元进行预测的合并候选列表。这种合并候选列表可被称为TPM候选列表，其中具有本文中列出的TPM候选项。一个实施例中，合并候选列表是单向预测候选列表。

图15B为一个实施例的用于构建三角预测模式的单向预测候选列表的空间相邻块和时间相邻块的示意图。一些实施例中，一个实施例中，单向预测候选列表包括五个单向预测候选运动矢量。例如，五个单向预测候选运动矢量可从七个相邻块得出，其中包括五个空间相邻块(在图15B中由S1到S5表示)和两个时间相邻块(在图15B中由T6和T7表示)。

一个实施例中，按照以下顺序收集该七个相邻块的运动矢量并将其放入单向预测候选列表中：首先，单向预测相邻块的运动矢量；(b)然后，对于双向预测相邻块，L0运动矢量(即，双向预测MV的L0运动矢量部分)、L1运动矢量(即，双向预测MV的L1运动矢量部分)，以及双向预测MV的L0和L1运动矢量的平均运动矢量。一个实施例中，如果候选项的数目小于五，则将零运动矢量添加到列表的末尾。一些其它实施例中，合并候选列表可以包括少于5个或多于5个单向预测候选项或双向预测合并候选项，这些候选项可从与图15B中所示的候选位置相同或不同的候选位置中选出。

8.2查找表和表索引

一个实施例中，用具有五个TPM候选项的TPM(或合并)候选列表的三角分区模式对CU进行编码。相应地，当每个三角形PU使用5个合并候选项时，存在40种可能的方式来预测CU。换言之，可以有40种不同的分割方向和合并(或TPM)索引的组合：2(个可能的分割方向)×(5(个第一三角预测单元的可能的合并索引)×5(个第二三角预测单元的可能的合并索引)-5(当第一和第二预测单元对共享相同合并索引时相同合并索引的可能的数目))。例如，当为两个三角预测单元确定一个相同合并索引时，可以使用常规合并模式而非三角预测模式来处理CU。

因此，一个实施例中，基于如下面的表4中所示的查找表，值域为[0,39]的三角分区索引可以用于表示使用40个组合中的哪一个组合。

表4.用于基于三角形索引得出三角方向和分区运动的查找表

triangle_idx	0	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17	18	19
																					triangle dir	0	1	1	0	0	1	1	1	0	0	0	0	1	0	0	0	0	1	1	1
Part 1cand	1	0	0	0	2	0	0	1	3	4	0	1	1	0	0	1	1	1	1	2
																					Part 2cand	0	1	2	1	0	3	4	0	0	0	2	2	2	4	3	3	4	4	3	1

triangle_idx	20	21	22	23	24	25	26	27	28	29	30	31	32	33	34	35	36	37	38	39
																					triangle dir	1	0	0	1	1	1	1	1	1	1	0	0	1	0	1	0	0	1	0	0
Part 1cand	2	2	4	3	3	3	4	3	2	4	4	2	4	3	4	3	2	2	4	3
																					Part 2cand	0	1	3	0	2	4	0	1	3	1	1	3	2	2	3	1	4	4	2	4

表4的第一行(triangle_idx)指示范围从0到39的三角分区索引。表4的第二行(triangle dir)指示由0或1表示的可能分割方向。第三行(Part 1cand)包括对应于第一三角预测单元的可能的第一合并索引，其范围从0到4。第四行(Part 2cand)包括对应于第二三角预测单元可能的第二合并索引，其范围从0到4。

例如，当在解码器处接收到值为1的三角分区索引时，基于对应于triangle_idx＝1的查找表的列，可以确定分割方向是由值1表示的分区方向(例如，反对角线分割)，并且第一合并索引和第二合并索引分别是0和1。由于三角分区索引与查找表相关联，因此三角分区索引在本申请中也称为表索引。

8.3沿三角分区边线的自适应混合

一个实施例中，在对每个三角预测单元使用相应的运动信息进行预测之后，对两个三角预测单元的两个预测信号执行混合过程以得出对角线或反对角线边线周围的样本。混合过程根据两个三角预测单元之间的运动矢量差在两组加权因子之间自适应地选择。一个实施例中，两个加权因子组如下：

(1)第一加权因子组：用于样本的亮度分量的{7/8，6/8，4/8，2/8，1/8}，及用于样本的色度分量的{7/8，4/8，1/8}；以及

(2)第二加权因子组：用于样本的亮度分量的{7/8，6/8，5/8，4/8，3/8，2/8，1/8}，及用于样本的色度分量的{6/8，4/8，2/8}。

第二加权因子组具有更多的亮度加权因子并沿着分区边线混合更多的亮度样本。

一个实施例中，以下条件用于从两个加权因子组中选择一个。当两个三角分区的参考图像不同、或者当两个三角分区之间的运动矢量差大于阈值(例如，16个亮度样本)时，可以选择第二加权因子组。否则，可以选择第一加权因子组。

图16A为一个实施例的在自适应混合过程中使用第一个加权因子集合的编码单元的示意图。在图16A中，第一编码块(1610)包括CU的亮度样本，而第二编码块(1620)包括同一CU的色度样本。每个块被分割成两个三角分区P1、P2、P1'和P2'。对于分区P1或分区P1'，编码块(1610)或(1620)中沿着对角线边线的像素的集合分别用加权因子1/8、2/8、4/8、6/8和7/8对应的数字1、2、4、6和7来标记；对于分区P2或分区P2'，用加权因子7/8、6/8、4/8、2/8和1/8对应的数字来标记。例如，对于用2标记的像素，混合操作后的该像素的样本值可根据下式获得：

混合的样本值＝2/8x S1+6/8x S2，

其中，S1和S2表示相应像素处的样本值，但分别属于第一三角预测单元P1和第二三角预测单元P2的预测值。

此外，没有任何加权的空白区域表示三角分区P1(或P1')对应的预测样本没有经过合并而被直接采用。类似地，没有任何加权的阴影区域表示采用三角分区P2对应的预测样本没有经过合并而被直接采用。

图16B为一个实施例的在自适应混合过程中使用第二个加权因子的集合的编码单元的示意图。在图16B中，第三编码块(1630)包括CU的亮度样本，而第四编码块(1640)包括同一CU的色度样本。每个块被分割成两个三角分区P1、P2、P1'和P2'。对于分区P1或分区P1'，编码块(1630)或(1640)中沿着对角线边线的像素的集合分别用加权因子1/8、2/8、3/8、4/8、5/8、6/8和7/8对应的数字1、2、3、4、5、6和7来标记；而对于分区P2或分区P2'，用加权因子7/8、6/8、5/8、4/8、3/8、2/8和1/8对应的数字来标记。此外，没有任何加权的空白区域表示三角分区P1(或P1')对应的预测样本而没有经过合并被直接采用。类似地，没有任何加权的阴影区域表示三角分区P2对应的预测样本没有经过合并被直接采用。

III.使用子块运动信息更新HMVP缓冲器

一些实施例中，除了根据常规帧间预测模式对CU进行编码之外，还可以使用根据各种基于子块的模式(例如上述的帧间预测模式)编码的CU来更新HMVP缓冲器。可使用的基于子块的帧间预测模式可以包括基于子块的TMVP模式、仿射帧间模式、三角帧间预测模式或任何其它合适的基于子块的帧间预测模式。

一些实施例中，可以将当前块划分为多个子块。可以得出多个子块的多条子块运动信息。可以根据多条子块运动信息生成这些子块的预测子块样本。可以根据预测子块样本的组合生成当前块的预测块。并且，可以从多条子块运动信息中选择一条子块运动信息作为当前块的代表运动信息，并且可以以参考图10B描述的方式将代表运动信息存储在HMVP缓冲器中。

一些实施例中，所选择的一条子块运动信息可以用于这些子块中在当前块中特定位置处的一个子块。一个实施例中，如图17A所示，对子块(1714)使用该条子块运动信息的编码单元(1710)在当前块中的右下位置处。另一个实施例中，如图17B所示，对子块(1724)使用该条子块运动信息的编码单元(1720)在当前块中的中心位置处。一些实施例中，中心位置处的块被定义为邻近中心位置的块，例如在当前块的中心位置(1722)的左上角处的块。

一些实施例中，按照仿射帧间预测对当前块进行编码。一个实施例中，位于当前块中右下位置处的子块(如图17A所描绘的)的运动信息可以用于更新HMVP缓冲器。一个实施例中，位于当前块中中心位置处的子块(如图17B所描绘)的运动信息可以用于更新HMVP缓冲器。又一个实施例中，位于当前块中另一预定位置处的子块的运动信息可以用于更新HMVP缓冲器。

一些实施例中，根据基于子块的TMVP(SbTMVP)模式对当前块进行编码。一个实施例中，位于当前块中右下位置处的子块的运动信息(如图17A所描绘)可以用于更新HMVP缓冲器。一个实施例中，位于当前块中中心位置处的子块的运动信息(如图17B所描绘)可以用于更新HMVP缓冲器。在又一个实施例中，位于当前块中另一预定位置处的子块的运动信息可以用于更新HMVP缓冲器。

一些实施例中，根据三角帧间预测模式对当前块进行编码。一个实施例中，对应于位于当前块中右下位置处的子块(如图17A所描绘的)的区域的运动信息可以用于更新HMVP缓冲器。一个实施例中，位于当前块中中心位置处的子块的运动信息(如图17B所描绘)可以用于更新HMVP缓冲器。在又一实施例中，对应于位于当前块中另一预定位置处的子块的区域的运动信息可以用于更新HMVP缓冲器。

一些实施例中，可以根据控制信息来确定或用信号表示特定位置，控制信息可以在，例如，序列参数集(SPS)、图像参数集(PPS)、条带头、图块组头或图块头，中传输。

图18为本申请的一些实施例的方法(1800)的概述流程图。方法(1800)可以用于对当前图像的当前块进行编码或解码，包括在利用基于子块的帧间预测模式对当前块进行编码时，根据用于对当前块进行编码的运动信息来更新HMVP缓冲器。一些实施例中，在方法(1800)之前或之后执行至少一个操作，并且图18中所示的一些操作可以重新排序或省略。

各实施例中，方法(1800)由处理电路执行，例如终端设备(210)、(220)、(230)和(240)中的处理电路、执行视频解码器(310)的功能的处理电路、执行视频解码器(410)的功能的处理电路等。一些实施例中，方法(1800)由软件指令实现，因此当处理电路执行这些软件指令时，处理电路执行该方法(1800)。该方法开始于(S1801)并进行到(S1810)。

在(S1810)，将当前块划分为多个子块。当前块可以根据基于子块的帧间预测模式(例如，基于子块的TMVP模式、仿射帧间模式、三角形帧间预测模式等)进行编码。一些实施例中，每个子块的尺寸可以为4×4像素或8×8像素。一些实施例中，子块的形状可以是正方形或矩形，或任何合适的形状。

在(S1820)，可以根据例如图9、图10和图15A至图16B描述的可用的基于子块的帧间预测模式获取多个子块的多条子块运动信息。

在(S1830)，根据多条子块运动信息生成子块的预测子块样本。

在(S1840)，根据S1830的预测子块样本的组合生成当前块的预测块。

在(S1850)，从多条子块运动信息中选择一条子块运动信息作为当前块的代表运动信息。一些实施例中，所选择的一条子块运动信息对应于各子块中在当前块中的特定位置处的一个子块。一个实施例中，特定子块在当前块中的右下位置处。另一个实施例中，特定子块邻近当前块的中心位置。在至少一个实施例中，特定子块的左上角在当前块的中心位置处。

一些实施例中，可以根据控制信息来确定或用信号表示该特定位置，控制信号可以在序列参数集(SPS)、图像参数集(PPS)、条带头、图块组头或图块头中传输。

在(S1860)，将代表运动信息存储在HMVP缓冲器中。一些实施例中，可以根据图11B描述的方法将代表运动信息存储在HMVP缓冲器中。

在将代表运动信息存储在HMVP缓冲器中之后，方法1800可以进行到(S1899)并终止。

本文中所描述的实施例可以单独使用或以任何顺序组合使用。并且，实施例、编码器和解码器中的每一个可以由处理电路(例如，至少一个处理器或至少一个集成电路)实现。一个实施例中，至少一个处理器执行存储在非易失性计算机可读介质中的程序。

上述技术可以使用计算机可读指令实现为计算机软件，并且以物理方式存储在一个或多个计算机可读介质中。例如，图19为适于实现本申请一些实施例的计算机***(1900)。

计算机软件可利用任何合适的机器代码或计算机语言来编码，可采用汇编、编译、链接或类似机制生成指令代码。这些指令代码可由一个或多个计算机中央处理单元(CPU)、图形处理单元(GPU)等直接执行或通过代码解释、微代码执行等操作来执行。

这些指令可在多种类型的计算机或计算机组件中执行，包括，例如，个人计算机、平板电脑、服务器、智能电话、游戏设备、物联网设备等。

图19所示的用于计算机***(1900)的组件本质上是实施例性的，而非旨在对实现本申请实施例的计算机软件的使用或功能范围做任何限制。也不应将组件的配置方式解释为对计算机***(1900)的实施例性实施例中的任一部件或其组合具有任何的依赖性或要求。

计算机***(1900)可以包括某些人机界面输入设备。这样的人机界面输入设备可以响应于一个或多个人类用户通过例如触觉输入(诸如键击、挥动、数据手套移动)、音频输入(诸如语音、拍击)、视觉输入(诸如姿势)、嗅觉输入(未示出)的输入。人机界面设备还可用于捕捉不必直接与人类有意识输入相关的某些介质，例如音频(诸如语音、音乐、环境声音)、图像(诸如扫描的图像、从静止图像相机获得的摄影图像)、视频(诸如二维视频，包括立体视频的三维视频)。

人机界面输入设备可包括以下项中的一种或多种(每一种仅描绘一个)：键盘(1901)、鼠标(1902)、触控板(1903)、触摸屏(1910)、数据手套(未示出)、操纵杆(1905)、麦克风(1906)、扫描仪(1907)、照相机(1908)。

计算机***(1900)还可以包括某些人机界面输出设备。这样的人机界面输出设备可以通过例如触觉输出、声音、光和气味/味道来刺激一个或多个人类用户的感觉。这种人机界面输出设备可以包括触觉输出设备(例如通过触摸屏(1910)、数据手套(未示出)或操纵杆(1905)的触觉反馈，但是也可以有不用作输入设备的触觉反馈设备)、音频输出设备(诸如扬声器(1909)、耳机(未示出))、可视输出设备以及打印机(未示出)，其中可视输出设备诸如屏幕(1910)、虚拟现实眼镜(未示出)、全息显示器和烟雾箱(未示出)，屏幕(1910)包括阴极射线管(CRT)屏幕、液晶显示器(LCD)屏幕、等离子屏幕、有机发光二极管(OLED)屏幕，每一种都具有或不具有触摸屏输入能力，每一种都具有或不具有触觉反馈能力，这些屏幕中的一些能够通过手段(诸如立体图像输出)输出二维可视输出或多于三维的输出。

计算机***(1900)还可以包括人类可访问的存储设备及其相关联的介质，诸如光学介质(包括具有CD/DVD的CD/DVDROM/RW(1920))或类似介质(1921)、拇指驱动器(1922)、可移动硬盘驱动器或固态驱动器(1923)、传统磁介质(诸如磁带和软盘(未示出))、基于专用ROM/ASIC/PLD的设备(诸如安全道尔芯片(未示出))，等等。

本领域技术人员还应当理解，结合当前公开的主题使用的术语“计算机可读介质”不包括传输介质、载波或其它瞬时信号。

计算机***(1900)还可以包括连接一个或多个通信网络的接口。网络可以是，例如，无线网络、有线网络、光网络。网络还可以是本地网、广域网、城域网、车联网的和工业网络、实时网络、延迟容忍网络等等。网络的实施例包括局域网(诸如以太网、无线LAN)、蜂窝网络(包括全球移动通信***(GSM)、第三代移动通信***(3G)、***移动通信***(4G)、第五代移动通信***(5G)、长期演进(LTE)等)、电视有线或无线广域数字网络(包括有线电视、***和地面广播电视)、车辆和工业网络(包括CANBus)，等等。某些网络通常需要外部网络接口适配器，该外部网络接口适配器连接到某些通用数据端口或***总线(1949)(诸如计算机***(1900)的通用串行总线(USB)端口)；其他的通常通过如下所述连接到***总线而集成到计算机***(1900)的内核中(例如，进入个人计算机***的以太网接口或进入智能手机计算机***的蜂窝网络接口)。通过使用这些网络中的任何一个，计算机***(1900)可以与其它实体通信。这种通信可以是使用局域或广域数字网络的到其它计算机***的单向的、仅接收的(例如广播TV)、单向仅发送的(例如到某些CAN总线设备的CAN总线)或双向的通信。可以在如上所述的那些网络和网络接口中的每一个上使用某些协议和协议栈。

上述人机界面设备、人类可访问存储设备和网络接口可以连接到计算机***(1900)的内核(1940)。

内核(1940)可以包括一个或多个中央处理单元(CPU)(1941)、图形处理单元(GPU)(1942)、以现场可编程门阵列(FPGA)(1943)形式存在的专用可编程处理单元、用于特定任务的硬件加速器(1944)等。这些设备，以及只读存储器(ROM)(1945)，随机存取存储器(1946)，内部大容量存储器(如内部非用户可访问硬盘驱动器，SSD)(1947)等，可以通过***总线(1948)相互连接。在一些计算机***中，***总线(1948)可以以一个或多个物理插头的形式访问，从而通过附加的CPU，GPU等实现扩展。***设备可以直接，或者通过***总线(1949)，连接到内核的***总线(1948)。***总线的架构包括PCI，USB等。

CPU(1941)、GPU(1942)、FPGA(1943)和加速器(1944)可以执行某些指令，这些指令组合起来可以构成前述的计算机代码。该计算机代码可以存储在ROM(1945)或RAM(1946)中。中间数据也可以存储在RAM(1946)中，而永久数据可以存储在，例如，内部大容量存储器(1947)中。可以通过使用高速缓冲存储器来实现到任何存储器设备的快速存储和读取，高速缓存存储器可以与一个或多个CPU(1941)、GPU(1942)、大容量存储器(1947)、ROM(1945)、RAM(1946)等紧密关联。

计算机可读介质上可以具有计算机代码，在计算机代码上执行各种计算机执行的操作。介质和计算机代码可以是为本申请的目的而特别设计和构造的，也可以是计算机软件领域的技术人员所熟知和可用的介质和代码。

作为实施例而非限制，具有体系结构(1900)的计算机***，特别是内核(1940)，可以提供处理器(包括CPU、GPU、FPGA、加速器等)执行在一个或多个有形的计算机可读介质中的软件而实现的功能。这样的计算机可读介质可以是与如上所述的用户可访问大容量存储器相关联的介质，以及非易失性的内核(1940)的某些存储，诸如内核内部大容量存储器(1947)或ROM(1945)。实现本申请各实施例的软件可以存储在这样的设备中并由内核(1940)执行。根据特定需要，计算机可读介质可包括一个或多个存储器设备或芯片。该软件可以使内核(1940)，特别是其中的处理器(包括CPU，GPU，FPGA等)，执行本文描述的特定过程或特定过程的特定部分，包括定义存储在RAM(1946)中的数据结构，以及根据软件定义的过程修改这些数据结构。作为补充或作为替代，计算机***可提供与电路(例如加速器1944)中的逻辑硬连线或其它组件相同的功能，可代替软件或与软件一起操作以执行本文所述的特定过程或特定过程的特定部分。在适当的情况下，对软件的引用可以包括逻辑，反之亦然。在适当的情况下，对计算机可读介质的引用可包括存储执行软件的电路(如集成电路(IC))，包括执行逻辑的电路，或两者兼备。本申请包括硬件和软件的任何适当组合。

附录A：缩略语

AMVP:Advanced Motion Vector Prediction 高级运动矢量预测

ASIC:Application-Specific Integrated Circuit 专用集成电路

BMS:benchmark set 基准集合

CANBus:Controller Area Network Bus 控制器区域网络总线

CD:Compact Disc 压缩盘

CPMV:Control Point Motion Vector 控制点运动矢量

CPUs:Central Processing Units 中央处理单元

CRT:Cathode Ray Tube 阴极射线管

CTUs:Coding Tree Units 编码树单元

CU:Coding Unit 编码单元

DVD:Digital Video Disc 数字视频盘

FPGA:Field Programmable Gate Array 现场可编程门阵列

FIFO:First In First Out 先入先出

GBi:Generalized Bi-prediction 广义双向预测

GOPs:Groups of Pictures 图像组

GPUs:Graphics Processing Units 图形处理单元

GSM:Global System for Mobile communications 全球移动通信***

HDR:High Dynamic Range 高动态范围

HEVC:High Efficiency Video Coding 高效视频编码

HMVP:History-based Motion Vector Prediction 基于历史的运动矢量预测

HRD:Hypothetical Reference Decoder 假想参考解码器

IC:Integrated Circuit 集成电路

JEM:joint exploration model 联合勘探模型

JVET:Joint Video Exploration Team 联合视频开发组

LAN:Local Area Network 局域网

LCD:Liquid-Crystal Display 液晶显示器

LTE:Long-Term Evolution 长期演进

MMVD:Merge with MVD 具有运动矢量差的合并模式

MV:Motion Vector 运动向量

MVD:Motion Vector Difference 运动矢量差

MVP:Motion Vector Predictor 运动矢量预测因子

OLED:Organic Light-Emitting Diode 有机发光二极管

PBs:Prediction Blocks 预测块

PCI:Peripheral Component Interconnect ***设备组件互联

PLD:Programmable Logic Device 可编程逻辑设备

PPS:Picture Parameter Set 图像参数组

PUs:Prediction Units 预测单元

RAM:Random Access Memory 随机存取存储器

RD:Rate Distortion 率失真

ROM:Read-Only Memory 只读存储器

SDR:Standard Dynamic Range 标准动态范围

SEI:Supplementary Enhancement Information 补充增强信息

SNR:Signal Noise Ratio 信噪比

SSD:solid-state drive 固态硬盘

SPS:Sequence Parameter Set 序列参数集

SbTMVP:Subblock-based Temporal Motion Vector Prediction 基于子块的时间运动矢量预测

TMVP:Temporal Motion Vector Prediction 时间运动矢量预测

TUs:Transform Units 变换单元

USB:Universal Serial Bus 通用串行总线

VTM:Versatile Test Model 多功能测试模型

VUI:Video Usability Information 视频可用性信息

VVC:versatile video coding 多功能视频编码

虽然本申请已对多个实施例性实施例进行了描述，但实施例的各种变更、置换和各种替代属于本申请的范围内。因此应理解，本领域技术人员能够设计多种***和方法，所述***和方法虽然未在本文中明确展示或描述，但其体现了本申请的原则，因此属于本申请的精神和范围之内。

Claims

1.一种在解码器中进行视频解码的方法，其特征在于，包括：

将当前块划分为多个子块；

获取所述多个子块的多条子块运动信息；

根据所述多条子块运动信息生成所述子块的预测子块样本；

根据所述预测子块样本的组合生成所述当前块的预测块；

从所述多条子块运动信息中选择一条子块运动信息作为所述当前块的代表运动信息；及

将所述代表运动信息存储在基于历史的运动矢量预测(HMVP)缓冲器中。

2.根据权利要求1所述的方法，其特征在于：

所选的一条子块运动信息对应于所述多个子块中在所述当前块中特定位置处的一个特定子块。

3.根据权利要求2所述的方法，其特征在于：

所述特定子块在所述当前块中的右下位置处。

4.根据权利要求2所述的方法，其特征在于：

所述特定子块邻近所述当前块的中心位置。

5.根据权利要求4所述的方法，其特征在于：

所述特定子块的左上角在所述当前块的中心位置处。

6.根据权利要求2所述的方法，其特征在于，进一步包括：

根据在序列参数集(SPS)、图像参数集(PPS)、条带头、图块组头或图块头中传输的控制信息来确定所述特定位置。

7.根据权利要求1所述的方法，其特征在于：

根据仿射帧间预测、基于子块的时间运动矢量预测和三角帧间预测之一对所述当前块进行编解码。

8.一种装置，其特征在于，包括：

处理电路，用于：

将当前块划分为多个子块；

获取所述多个子块的多条子块运动信息；

根据所述多条子块运动信息生成所述子块的预测子块样本；

根据所述预测子块样本的组合生成所述当前块的预测块；

9.根据权利要求8所述的装置，其特征在于：

所选的一条子块运动信息对应于所述多个子块中在所述当前块中的特定位置处的一个特定子块。

10.根据权利要求9所述的装置，其特征在于：

所述特定子块在所述当前块中的右下位置处。

11.根据权利要求9所述的装置，其特征在于：

所述特定子块邻近所述当前块的中心位置。

12.根据权利要求11所述的装置，其特征在于：

所述特定子块的左上角在所述当前块的中心位置处。

13.根据权利要求9所述的装置，其特征在于，所述处理电路进一步被配置为：

14.根据权利要求9所述的装置，其特征在于：

15.一种非易失性计算机可读介质，存储有指令，其特征在于，所述指令由计算机执行以用于视频解码时，使得所述计算机执行：

将当前块划分为多个子块；

获取所述多个子块的多条子块运动信息；

根据所述多条子块运动信息生成所述子块的预测子块样本；

根据所述预测子块样本的组合生成所述当前块的预测块；

16.根据权利要求15所述的非易失性计算机可读介质，其特征在于：

17.根据权利要求16所述的非易失性计算机可读介质，其特征在于：

所述特定子块在所述当前块中的右下位置处。

18.根据权利要求16所述的非易失性计算机可读介质，其特征在于：

所述特定子块邻近所述当前块的中心位置，并且

所述特定子块的左上角在所述当前块的所述中心位置处。

19.根据权利要求15所述的非易失性计算机可读介质，其特征在于，所述指令当由所述计算机执行时进一步使得所述计算机执行：

20.根据权利要求15所述的非易失性计算机可读介质，其特征在于：