CN113728645A

CN113728645A - 用于基于尾数-指数表示的帧间预测的运动矢量舍入、裁剪和存储的方法和装置

Info

Publication number: CN113728645A
Application number: CN202080029237.6A
Authority: CN
Inventors: 修晓宇; 陈漪纹; 王祥林
Original assignee: Beijing Dajia Internet Information Technology Co Ltd
Current assignee: Beijing Dajia Internet Information Technology Co Ltd
Priority date: 2019-02-20
Filing date: 2020-02-19
Publication date: 2021-11-30
Also published as: WO2020172345A1; WO2020172342A1; US20210377558A1; US20210377557A1; CN113784132A; US11800140B2; WO2020172342A9; EP3928513A4; CN113784132B; US20210409722A1; US11871024B2; EP3925222A4; EP3925222A1; CN113491114A; EP3928513A1

Abstract

提供了一种用于视频编解码的方法。该方法可以包括：识别分别用于空间运动矢量(MV)预测和仿射运动继承的MV和控制点运动矢量(CPMV)；将MV和CPMV转换为尾数‑指数格式；并且将MV和CPMV的尾数‑指数表示存储在存储器中。

Description

用于基于尾数-指数表示的帧间预测的运动矢量舍入、裁剪和存储的方法和装置

相关申请的交叉引用

本申请要求于2019年2月20日提交的题为“用于帧间预测的运动矢量舍入和存储的方法和装置”的申请号为62/808,276的美国临时申请、以及于2019年3月8日提交的题为“用于帧间预测的运动矢量舍入和存储的方法和装置”的申请号为62/816,025的美国临时申请的优先权，这两个美国临时申请通过引用全部包含于此以用于所有目的。

技术领域

本申请总体涉及视频编解码和压缩，并且具体涉及但不限于用于视频编解码的运动矢量舍入、裁剪和存储的方法及装置。

背景技术

数字视频由各种电子设备支持，诸如数字电视、膝上型或台式计算机、平板计算机、数码相机、数字记录设备、数字媒体播放器、视频游戏机、智能电话、视频电话会议设备、视频流传输设备等。电子设备通过实施视频压缩/解压来发送、接收、编码、解码和/或存储数字视频数据。数字视频设备实施视频编解码技术，诸如由通用视频编解码(VVC)、联合探索测试模型(JEM)、MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4、Part 10、高级视频编解码(AVC)、ITU-T H.265/高效视频编解码(HEVC)定义的标准以及这些标准的扩展中所描述的那些技术。

视频编解码通常利用预测方法(例如，帧间预测、帧内预测)，预测方法利用视频图像或序列中存在的冗余。视频编解码技术的重要目标是将视频数据压缩为使用较低比特率的形式，同时避免或最小化视频质量的劣化。随着不断发展的视频服务变得可用，需要具有更好编解码效率的编码技术。

视频压缩通常包括执行空间(帧内)预测和/或时间(帧间)预测以减少或去除视频数据中固有的冗余。在基于块的视频编解码中，逐块地对输入视频信号进行处理。针对每个块(也称为编解码单元(CU))，可执行空间预测和/或时间预测。每个CU可在帧内模式、帧间模式或IBC模式下被编解码。使用关于同一视频帧内的邻近块中的参考样点的空间预测，对视频帧的帧内编解码(I)条带中的视频块进行编码。视频帧的帧间编解码(P或B)条带中的视频块可使用关于同一视频帧内的邻近块中的参考样点的空间预测，或者使用关于其他先前和/或未来参考视频帧中的参考样点的时间预测。

基于先前已被编码的参考块(例如，邻近块)的空间预测或时间预测得出用于待编解码的当前视频块的预测块。找到参考块的过程可通过块匹配算法来完成。表示待编解码的当前块与预测块之间的像素差的残差数据被称为残差块或预测误差。帧间编解码块根据运动矢量和残差块被编码，运动矢量指向参考帧中的形成预测块的参考块。确定运动矢量的过程通常被称为运动估计。帧内编解码块根据帧内预测模式和残差块被编码。为了进一步压缩，将残差块从像素域变换到变换域(例如，频域)，从而得出残差变换系数，残差变换系数然后可被量化。最初以二维阵列布置的量化的变换系数可被扫描以产生变换系数的一维向量，并且然后被熵编码为视频比特流以实现甚至更大的压缩。

经编码的视频比特流然后被保存于计算机可读存储介质(例如，闪存存储器)中，以由具有数字视频能力的另一电子设备访问或者有线或无线地直接发送到电子设备。电子设备然后执行视频解压缩(其为与上文描述的视频压缩相反的过程)，例如，通过对经编码的视频比特流进行解析来从比特流获得语义元素，并且至少部分地基于从比特流获得的语义元素从经编码的视频比特流将数字视频数据重建为其原始格式，并且电子设备在电子设备的显示器上呈现重建的数字视频数据。

随着数字视频质量从高清变为4K×2K或甚至8K×4K，待编码/解码的视频数据量呈指数增长。在如何能够更有效率地对视频数据进行编码/解码，同时保持解码视频数据的图像质量方面，是一个长久挑战。

在联合视频专家组(JVET)会议中，JVET定义了通用视频编解码(VVC)的第一草案和VVC测试模型1(VTM1)编码方法。决定了包括使用二元划分和三元划分编解码块结构的具有嵌套多类型树的四叉树作为VVC的初始新编解码特征。从那时起，在JVET会议期间已经研发了用于实现编码方法的参考软件VTM和草案VVC解码过程。

发明内容

总体上，本公开描述了与用于视频编解码的运动矢量存储相关的技术的示例。

根据本公开的第一方面，提供了一种用于视频编解码的方法，包括：识别分别用于空间运动矢量(MV)预测和仿射运动继承的MV和控制点运动矢量(CPMV)；将MV和CPMV转换为尾数-指数格式；并且将MV和CPMV的尾数-指数表示存储在存储器中。

根据本公开的第二方面，提供了一种用于视频编解码的装置，包括：处理器；以及存储器，被配置为存储可由处理器执行的指令；其中处理器在执行指令时被配置为：识别分别用于空间运动矢量(MV)预测和仿射运动继承的MV和控制点运动矢量(CPMV)；将MV和CPMV转换为尾数-指数格式；并且将空间MV和CPMV的尾数-指数表示存储在存储器中。

根据本发明的第三方面，提供了一种非暂时性计算机可读存储介质，包括存储在其中的指令，其中在由处理器执行指令时，指令使处理器：识别分别用于空间运动矢量(MV)预测和仿射运动继承的MV和控制点运动矢量(CPMV)；将MV和CPMV转换为尾数-指数格式；并且将空间MV和CPMV的尾数-指数表示存储在存储器中。

附图说明

将通过参照附图中所示的具体示例来呈现本公开的示例的更详细的描述。鉴于这些附图仅描绘了一些示例并且因此不被认为是对范围的限制，示例将通过使用附图利用附加的详情和细节来描述和解释。

图1是示出根据本公开的一些实施方式的示例性视频编码器的框图。

图2是示出根据本公开的一些实施方式的示例性视频解码器的框图。

图3是示出根据本公开的一些实施方式的多类型树结构中的块分割的示意图。

图4是示出根据本公开的一些实施方式的VVC中的空间合并候选的位置的示意图。

图5是示出根据本公开的一些实施方式的用于时间运动矢量预测(TMVP)的MV伸缩操作的示意图。

图6是示出根据本公开的一些实施方式的4参数仿射模型的示意图。

图7是示出根据本公开的一些实施方式的6参数仿射模型的示意图。

图8是示出根据本公开的一些实施方式的仿射CPMV存储方法的示意图。

图9是示出根据本公开的一些实施方式的三角预测分割的示意图。

图10是示出根据本公开的一些实施方式的用于生成三角预测模式的单向预测MV列表的候选块的位置的示意图。

图11是示出根据本公开的一些实施方式的针对三角预测模式的沿着分割边缘的两个单向预测样点的加权平均的示意图。

图12是示出根据本公开的一些实施方式的基于绝对值的MV舍入的映射函数的示意图。

图13是示出根据本公开的一些实施方式的基于TMVP/ATMVP的MV舍入的映射函数的示意图。

图14是示出根据本公开的一些实施方式的常规MV舍入的映射函数的示意图。

图15是示出根据本公开的一些实施方式的用于实际VVC实施方式的CPMV和MV上下文更新过程的示例的示意图。

图16是示出根据本公开的一些实施方式的时间MV存储的尾数-指数表示的示例的示意图。

图17是示出根据本公开的一些实施方式的用于视频编解码的示例性装置的框图。

图18是示出根据本公开的一些实施方式的用于视频编解码的运动矢量存储的示例性过程的流程图。

具体实施方式

现在将详细参照具体实施方式，其示例在附图中示出。在以下详细描述中，阐述了很多非限制性具体细节以便帮助理解本文呈现的主题。但是对于本领域普通技术人员将显而易见的是，可使用各种替代方案。例如，对于本领域普通技术人员将显而易见的是，本文呈现的主题可在具有数字视频能力的许多类型的电子设备上实现。

贯穿本说明书对“一个实施例”、“一种实施例”、“一种示例”、“一些实施例”、“一些示例”或类似语言的引用表示所描述的特定特征、结构或特性被包括在至少一个实施例或示例中。除非另有明确说明，否则结合一个或一些实施例描述的特征、结构、元件或特性也适用于其他实施例。

贯穿本公开，除非另有明确说明，否则术语“第一”、“第二”、“第三”等都用作仅用于提及相关元素(例如，设备、组件、组合物、步骤等)的命名法，而不暗示任何空间顺序或时间顺序。例如，“第一设备”和“第二设备”可指两个单独形成的设备，或者同一设备的两个部分、组件或操作状态，并且可被任意命名。

如本文所使用的，取决于上下文，术语“如果”或“当......时”可被理解为表示“一经......”或“响应于......”。这些术语如果出现在权利要求中，则可不指示相关限制或特征是有条件的或可选的。

术语“模块”、“子模块”、“电路”、“子电路”、“电路***”、“子电路***”、“单元”或“子单元”可包括存储器(共享的、专用的或群组)，存储器存储可由一个或更多个处理器执行的代码或指令。模块可包括具有或不具有存储的代码或指令的一个或更多个电路。模块或电路可包括直接或间接连接的一个或更多个组件。这些组件可以或可以不物理地附接到彼此或彼此相邻定位。

单元或模块可纯粹通过软件、纯粹通过硬件、或通过硬件和软件的组合来实现。在纯软件实施方式中，例如，单元或模块可包括直接或间接联系在一起的功能上相关的代码块或软件组件，以便执行特定功能。

图1示出了说明示例性基于块的混合视频编码器100的框图，编码器100可与使用基于块的处理的许多视频编解码标准结合使用。在编码器100中，视频帧被分割为多个视频块以进行处理。针对每个给定视频块，基于帧间预测方法或帧内预测方法而形成预测。在帧间预测中，一个或更多个预测值基于来自先前重建的帧的像素通过运动估计和运动补偿而形成。在帧内预测中，预测值基于当前帧中的重建像素而形成。通过模式决策，可选择最佳预测值来预测当前块。

表示当前视频块与其预测值之间的差的预测残差被发送到变换电路***102。变换系数然后从变换电路***102被发送到量化电路***104以进行熵减。量化系数然后被馈送到熵编解码电路***106以生成压缩的视频比特流。如图1中所示，来自帧间预测电路***和/或帧内预测电路***112的预测相关信息110，诸如视频块分割信息、运动矢量、参考图片索引和帧内预测模式，也通过熵编解码电路***106被馈送并被保存到压缩的视频比特流114中。

在编码器100中，为了预测的目的，还需要解码器相关电路***以便重建像素。首先，通过反量化116和逆变换电路***118重建预测残差。这个重建的预测残差与块预测值120组合以生成针对当前视频块的未经滤波的重建像素。

空间预测(或“帧内预测”)使用来自与当前视频块相同的视频帧中的已经编解码的相邻块的样点(被称为参考样点)的像素来预测当前视频块。

时间预测(也称为“帧间预测”或“运动补偿预测”)使用来自已经编解码的视频图片的重建像素来预测当前视频块。时间预测减少了视频信号中固有的时间冗余。针对给定编解码单元(CU)或编解码块的时间预测信号通常通过一个或更多个运动矢量(MV)被用信号发送，该一个或更多个运动矢量指示当前CU与其时间参考之间的运动量和运动方向。此外，如果支持多个参考图片，则另外发送一个参考图片索引，该参考图片索引被用于识别时间预测信号来自参考图片库中的哪个参考图片。

在执行空间预测和/或时间预测之后，编码器100中的帧内/帧间模式决策电路***121例如基于率失真优化方法来选择最佳预测模式。块预测值120然后从当前视频块减去；并且使用变换电路***102和量化电路***104对所得出的预测残差进行去相关。所得出的量化的残差系数由反量化电路***116反量化并且由逆变换电路***118逆变换以形成重建残差，重建残差随后被加回到预测块以形成CU的重建信号。在重建CU被放入图片缓冲器117的参考图片库中并被用于对未来视频块进行编解码之前，可对重建CU应用进一步的环路滤波115，诸如去块滤波器、样点自适应偏移(SAO)和/或自适应环路滤波器(ALF)。为了形成输出视频比特流114，编解码模式(帧间或帧内)、预测模式信息、运动信息和量化残差系数都被发送到熵编解码单元106，以被进一步压缩和打包以形成比特流。

例如，去块滤波器在AVC、HEVC以及VVC的现在当前版本中可用。在HEVC中，称为SAO(样点自适应偏移)的另外的环路滤波器被定义以进一步提高编解码效率。在VVC标准的现在当前版本中，称为ALF(自适应环路滤波器)的又一环路滤波器正被积极地研究，并且它很有希望被包括在最终标准中。

这些环路滤波器操作是可选的。执行这些操作有助于提高编解码效率和视觉质量。它们也可以作为由编码器100作出的决策而被关闭，以节省计算复杂度。

应注意，如果编码器100开启这些滤波器选项，则帧内预测通常基于未经滤波的重建像素，而帧间预测基于经滤波的重建像素。

图2是示出示例性基于块的视频解码器200的框图，解码器200可与许多视频编解码标准结合使用。该解码器200类似于存在于图1的编码器100中的重建相关部分。在解码器200中，首先通过熵解码202对传入视频比特流201进行解码，以导出量化系数等级和预测相关信息。量化系数等级然后通过反量化204和逆变换206被处理，以获得重建的预测残差。在帧内/帧间模式选择器212中实现的块预测值机制被配置为基于经解码的预测信息执行帧内预测208或运动补偿210。通过使用求和器214对来自逆变换206的重建预测残差和通过块预测值机制生成的预测输出进行求和，来获得未经滤波的重建像素的集合。

重建块在其被存储在用作参考图片库的图片缓冲器213中之前可以进一步通过环路滤波器209。图片缓冲器213中的重建视频可被发送以驱动显示设备，并且被用于预测未来视频块。在开启环路滤波器209的情况下，对这些重建像素执行滤波操作以导出最终重建的视频输出222。

图3是示出VVC中的多类型树结构中的块分割的示意图。与HEVC类似，VVC构建在基于块的混合视频编解码框架上。然而，与仅基于四叉树(即，四元树)对块进行分割的HEVC不同，在VVC中，基于四叉树、二叉树或三叉树将一个编解码树单元(CTU)划分为编解码单元(CU)以适应各种局部特性。此外，在VVC中去除了HEVC中的多个分割单元类型的概念，也即，在VVC中不存在CU、预测单元(PU)和变换单元(TU)的分离；替代地，每个CU总是被用作用于预测和变换两者的基本单元，而无需进一步的分割。在多类型树结构中，首先通过四叉树结构分割一个CTU。然后，每个四叉树叶节点可通过二叉树结构或三叉树结构被进一步分割为CU。如图3中所示，在当前VVC中采用了五种划分类型：四元分割301、水平二元分割302、竖直二元分割303、水平三元分割304和竖直三元分割305。

常规合并模式

与HEVC类似，在VVC中支持合并模式，在合并模式中，一个编解码块的运动信息不被用信号发送，而是基于一个基于竞争的方案从空间合并候选和/或时间合并候选的集合导出；并且对应地，仅需要将所选的合并候选的索引从编码器用信号发送到解码器以重新建立运动信息。

为了构建合并候选的列表，空间运动矢量候选首先被检查并被添加到列表中。图4示出空间合并候选的位置。五个空间合并候选按照A₁→B₁→B₀→A₀→B₂的顺序被检查并添加。如果位于这些空间位置中的一个空间位置处的块是帧内编解码的或者在当前条带、瓦片(tile)和/或图片的边界之外，则认为它是不可用的。

在将所有有效空间候选***到合并候选列表中之后，通过时间运动矢量预测(TMVP)技术从同位参考图片中的同位块的运动信息生成时间候选。基于在瓦片组或条带头中用信号发送的同位参考图片中的同位块的运动信息，导出一个伸缩的运动矢量。图5示出用于时间运动矢量预测(TMVP)的运动矢量伸缩操作。通过使用图片顺序计数(POC)距离tb和td从同位块col_PU的运动矢量进行伸缩，如图5中的虚线所示获得针对时间合并候选的伸缩运动矢量，其中tb被定义为当前图片curr_ref的参考图片与当前图片curr_pic之间的POC差，并且td被定义为同位图片col_ref的参考图片与同位图片col_pic之间的POC差。

当空间运动矢量和时间运动矢量两者被***到合并候选列表中并且列表中的已有合并候选的总数小于合并列表的最大大小(其在瓦片组头中被用信号发送)时，添加基于历史的合并候选。所谓的基于历史的合并候选包括来自先前编解码的CU的那些运动矢量，这些运动矢量被保持在单独的运动矢量列表中并且基于某些规则被管理，诸如先进先出(FIFO)规则。

在***基于历史的候选之后，如果合并候选列表未填满，则进一步将成对平均运动矢量候选添加到该列表中。如其名称所指示，这种类型的候选通过对已经在当前列表中的候选求平均来构建。更具体地，基于某种顺序或规则，每次获取合并候选列表中的两个候选，并且将这两个候选的平均运动矢量附加到当前列表。在***成对平均运动矢量之后，如果合并候选列表仍未填满，则将添加零运动矢量以使该列表填满。

仿射模式

在HEVC中，仅平移运动模型被应用于运动补偿预测。然而，在现实世界中，存在许多种类的运动，例如，放大/缩小、旋转、透视运动和其他不规则运动。在VVC中，通过针对每个帧间编解码块用信号发送一个标志以指示是平移运动模型还是仿射运动模型被应用于帧间预测，而使用仿射运动补偿预测。在当前VVC设计中，针对一个仿射编解码块支持两个仿射模式，包括4参数仿射模型和6参数仿射模型。图6和图7分别示出4参数仿射模型和6参数仿射模型。

4参数仿射模型具有以下参数：分别用于水平方向和竖直方向上的平移运动的两个参数、针对水平方向和竖直方向两者的用于缩放运动的一个参数以及用于旋转运动的一个参数，其中水平缩放参数等于竖直缩放参数，并且水平旋转参数等于竖直旋转参数。为了实现运动矢量和仿射参数的更好适应，在VVC中，将那些仿射参数转换为位于当前块的左上角和右上角的两个MV(也被称为控制点运动矢量(CPMV))。如图6中所示，块的仿射运动场由两个控制点MV(v₀,v₁)描述。基于控制点运动，一个仿射编解码块的运动场(v_x,v_y)由以下等式描述：

6参数仿射模式具有以下参数：分别用于水平方向和竖直方向上的平移运动的两个参数，水平方向上的用于缩放运动的一个参数和用于旋转运动的一个参数，竖直方向上的用于缩放运动的一个参数和用于旋转运动的一个参数。6参数仿射运动模型利用三个MV被编解码，这三个MV也可被称为三个CPMV。如图7中所示，一个6参数仿射块的三个控制点位于块的左上角、右上角和左下角。左上控制点处的运动与平移运动相关；右上控制点处的运动与水平方向上的旋转运动和缩放运动相关；并且左下控制点处的运动与竖直方向上的旋转运动和缩放运动相关。与4参数仿射运动模型相比，6参数仿射运动模型的水平方向上的旋转运动和缩放运动可以不与竖直方向上的那些运动相同。假设(v₀,v₁,v₂)是图7中的当前块的左上角、右上角和左下角处的MV，则通过以下等式使用控制点处的三个MV来导出每个子块(v_x,v_y)的运动矢量：

在VVC中，仿射编解码块的CPMV被存储在单独的缓冲器中。所存储的CPMV仅被用于生成针对仿射合并模式(即，从相邻仿射块的仿射CPMV继承仿射CPMV)和仿射显式模式(即，根据基于预测的方案用信号发送仿射CPMV)的仿射CPMV预测值。从CPMV导出的子块MV被用于运动补偿、平移MV的MV预测、以及去块。

图8示出VVC中的仿射CPMV存储方法。为了避免用于另外存储CPMV的图片行缓冲器大小增加，与从同一CTU中的相邻CU的仿射运动数据继承不同地处理从来自上方CTU的编解码块的仿射运动数据继承。具体地，对于当前CU，如果用于仿射运动数据继承的空间邻居在上方CTU行中，则行缓冲器中的子块MV替代CPMV被用于针对当前CU的AMVP导出。以此方式，CPMV仅被存储在局部缓冲器(即，一个CTU内的仿射块)中而不是行缓冲器中。如果候选CU是6参数仿射编解码的，则仿射模型降级为4参数模型。如图8中所示，沿着上方CTU边界，块的左下方子块运动矢量和右下方子块运动矢量被用于底部CTU中的CU的仿射继承。

三角预测模式

在VVC中，三角预测模式被引入用于运动补偿预测。图9示出VVC中的三角预测分割。如图9中所示，CU 902、904在对角线方向或反对角线方向上(即，从左上角到右下角划分或从右上角到左下角划分)被划分为两个三角形预测单元PU₁和PU₂。CU中的每个三角形预测单元使用其自己的从单向预测候选列表导出的单向预测运动矢量和参考帧索引进行帧间预测。沿着两个三角形预测单元之间的对角线边界，使用两个单向预测信号来预测每个4×4的子块。在对三角形预测单元进行预测之后，向对角线边缘执行自适应加权过程。然后，将变换和量化过程应用于整个CU。注意，该模式仅被应用于当前VVC中的跳过模式和合并模式。尽管在图9中CU被示出为正方形块，但是三角预测模式也可被应用于非正方形(即，矩形)形状CU。

单向预测MV候选列表可以包括一个或更多个候选，并且每个候选可以是运动矢量。图10示出用于生成针对三角预测模式的单向预测MV列表的候选块的位置。在一些示例中，单向预测运动矢量候选列表可包括两个到五个单向预测运动矢量候选。在一些其他示例中，其他数量也是可能的。如图10中所示，单向预测运动矢量候选列表是从包括五个空间相邻块(1至5)以及两个时间同位块(6至7)的七个相邻块导出的。将七个相邻块的运动矢量收集到第一合并列表中。然后，根据特定顺序基于第一合并列表运动矢量形成单向预测候选列表。基于该顺序，首先将来自第一合并列表的单向预测运动矢量放入单向预测运动矢量候选列表中，接着是双向预测运动矢量的参考图片列表0或L0运动矢量，并且然后是双向预测运动矢量的参考图片列表1或L1运动矢量，并且然后接着是双向预测运动矢量的L0运动矢量和L1运动矢量的平均运动矢量。此时，如果候选的数量仍然小于目标数量(在当前VVC中为5)，则将零运动矢量添加到该列表以满足目标数量。

每个三角形分割的相应预测信号是基于其单向预测MV导出的。此外，为了减轻沿着两个分割之间的对角线边缘或反对角线边缘的块效应，将加权过程应用于沿着分割边缘的样点的两个单向预测信号，以导出针对CU的最终预测。图11示出加权过程的示例，其中值{7/8,6/8,5/8,4/8,3/8,2/8,1/8}和{6/8,4/8,2/8}分别被用于亮度样点1102和色度样点1104。

利用运动矢量差(MMVD)的合并模式

除了常规合并模式(其中隐式地导出的运动信息被直接用于生成当前CU的预测样点)之外，在VVC中引入利用运动矢量差(MMVD)的合并模式。在发送跳过标志和合并标志之后，用信号发送MMVD标志以指定MMVD模式是否被用于CU。

在MMVD中，在合并基本候选被选择之后，其通过用信号发送的运动矢量差(MVD)信息进一步被精细化。进一步的信息包括合并候选标志、用于指定运动幅度的距离索引、以及用于指示运动方向的方向索引。在MMVD模式下，合并列表中的前两个候选中的一个候选被选择为用作MV基础(或起始点)。用信号发送合并候选标志以指定哪一个被使用。

距离索引指定运动幅度信息并指示距起始点的预定义偏移。如表1中所示，偏移被加到起始MV的水平分量或竖直分量。

表1距离索引与预定义偏移之间的关系

距离IDX	0	1	2	3	4	5	6	7
									偏移(以亮度样点为单位)	1/4	1/2	1	2	4	8	16	32

方向索引表示MVD相对于起始点的方向。方向索引可表示如表2中所示的四个方向。MVD符号(例如，+或-)的含义可根据起始MV的信息而不同。当起始MV为单向预测MV或两个MV均指向当前图片的同一侧的双向预测MV(即，两个参考的POC均大于当前图片的POC，或者均小于当前图片的POC)时，表2中的符号指定加到起始MV的MV偏移的符号。当起始MV为两个MV指向当前图片的不同侧的双向预测MV(即，一个参考的POC大于当前图片的POC，并且另一参考的POC小于当前图片的POC)时，表2中的符号指定加到起始MV的列表0MV分量的MV偏移的符号，并且针对列表1MV的符号具有相反值。

表2由方向索引指定的MV偏移的符号

方向IDX	00	01	10	11
					x轴	+	–	N/A	N/A
y轴	N/A	N/A	+	–

解码器侧运动矢量导出(DMVR)

解码器侧运动矢量导出(DMVR)是用于具有两个初始用信号发送的MV的合并块的双向预测技术，其中这两个MV可通过使用双边匹配预测进一步被精细化。通过在两个不同参考图片中的沿着当前CU的运动轨迹的两个块之间找到最佳匹配，双边匹配被用于导出当前CU的运动信息。在匹配过程中使用的代价函数是行-子采样的绝对差之和(SAD)。在完成匹配过程之后，细化后的MV被用于预测阶段中的运动补偿、去块滤波器中的边界强度计算、以及针对后续图片的时间运动矢量预测。在连续运动轨迹的假设下，指向两个参考块的运动矢量MV0和MV1应与当前图片和两个参考图片之间的时间距离(即，TD0和TD1)成比例。作为特殊情况，在当前图片在时间上在两个参考图片之间并且从当前图片到两个参考图片的时间距离TD0和TD1相同时，双边匹配变为基于镜像的双向MV。

在VVC中的运动补偿预测的多个阶段需要执行MV舍入操作：

1)对于导出TMVP和替代时间运动矢量预测(ATMVP)的MV预测值，其中基于以下比率来对时间同位块的MV进行伸缩：当前图片的参考图片与当前图片之间的POC距离(即，图5中的tb)和同位图片的参考图片与同位图片之间的POC距离(即，图5中的td)的比率；

2)对于通过对两个空间/时间MV候选的MV求平均来生成成对合并候选；

3)对于仿射编解码块，其中根据用于4参数仿射模型的等式(1)和用于6参数仿射模型的等式(2)从对应CPMV导出相应子块的运动场；以及

4)对于三角预测模式，其中通过对双向预测合并候选的L0 MV和L1 MV求平均，将附加的单向预测MV候选添加到最终MV候选列表中。

此外，根据当前VVC规范，不同的MV舍入方法被应用于上述帧间预测方法。具体地，假设A是舍入之前的MV值，并且Shift是被应用于MV舍入的右逐位移位，对于不同的帧间预测方法，通过下式计算舍入后的MV的值，即L：

L＝(A>＝0)？(A+Offset)>>Shift:-((-A+Offset)>>Shift (3)

用于仿射模式、成对合并候选生成和三角预测模式；

或者，

L＝(A+Offset+(A<0？1:0))>>Shift (4)

用于TMVP和ATMVP；

其中offset是被设置为等于(Shift>0)？1<<(Shift-1):0的舍入偏移；并且L是舍入后的MV的值。

在当前VVC中，对于成对合并候选、三角预测模式和仿射模式，如等式(3)中所指出的，应用基于绝对值的MV舍入方法。这样的MV舍入方法相对复杂，因为它涉及多个计算步骤。具体地，编解码设备可能首先计算输入的绝对值，然后执行该绝对值的舍入，并且最后将舍入后的绝对值与输入的符号相乘。另一方面，对于TMVP和ATMVP，应用另一舍入方法，其中在逐位右移之前应用的偏移值取决于输入值的符号。这样的非统一设计意味着需要针对编解码器硬件实现来实现不同的MV舍入方法。

为了降低硬件实现复杂度，提出了以下方法来统一VVC中的被用于帧间预测的MV舍入操作。

在一个示例中，基于等式(3)的基于绝对值的MV舍入方法被用于所有MV舍入操作。也就是说，基于等式(3)的相同MV舍入过程被应用于在不同预测工具中使用的MV，其中不同预测工具至少包括成对合并候选、三角预测模式、仿射模式、TMVP、ATMVP和MMVD。

在另一示例中，基于等式(4)的舍入方法被用于帧间预测中使用的所有MV舍入操作。用于当前VCC中的TMVP和ATMP的舍入方法也被应用于成对合并候选、三角预测模式和仿射模式中的舍入操作。也就是说，基于等式(4)的相同MV舍入过程被应用于不同预测工具中使用的MV，其中不同预测工具至少包括成对合并候选、三角预测模式、仿射模式、TMVP、ATMVP和MMVD。

在又一示例中，常规舍入方法被用于对帧间预测中的所有MV进行舍入。在此示例中，通过将逐位移位应用于以偏移偏置的输入值来直接获得舍入后的MV值，也即，L由下式计算：

L＝(A+Offset)>>Shift (5)

上述舍入方法(即，基于等式(5)的常规MV舍入)也是用于当前VVC规范中的样点舍入操作的舍入方法，样点舍入操作诸如运动补偿样点插值、自适应环路滤波器(ALF)、双向光流(BDOF)、广义双向预测(GBi)等。因此，在常规舍入方法被应用于成对合并候选、三角预测模式、仿射模式、TMVP、ATMVP和MMVD的此示例中，VVC中的所有样点和MV舍入操作是完全统一的。

图13示出基于绝对值的MV舍入的映射函数；图14示出基于TMVP/ATMVP的MV舍入的映射函数；以及图15示出常规MV舍入的映射函数。基于映射函数的比较，通过三种方法计算出的舍入后的值之间的差异非常微小。具体地，仅当输入值等于-0.5、-1.5、-2.5……时存在差异。因此，可以预期到使用不同MV舍入方法的编解码性能影响是相对可忽略的。

在当前VVC中，以18比特表示MV，也即，有效MV的动态范围在[-131072,131071]中。对于MMVD模式，通过将一个用信号发送的偏移加到由比特流中用信号发送的MMVD基本索引所指定的一个选择的合并候选，来生成所应用的MV。类似地，对于DMVR模式，通过将一个运动细化对称地应用于L0 MV和L1 MV以使两个预测信号之间的双边匹配代价最小化，从而增强每个双向预测合并块的MV。然而，即使选择的合并候选MV的比特深度在18比特内，但是归因于MV偏移(其针对MMVD模式显式地用信号发送并且针对DMVR模式隐式地导出)，应用于通过MMVD模式或DMVR模式被编解码的每个块的最终MV可能潜在地在有效MV的动态范围之外，从而导致MV值的算术溢出并且在导出用于不同实现平台的最终MV值时引起模糊性。此外，在仿射继承模式下也存在类似的MV溢出问题，在仿射继承模式中，一个当前的仿射编解码块的CPMV是基于4参数仿射模型或6参数仿射模型，而从其相邻仿射编解码块的CPMV或其相邻编解码块的子块MV导出的。在任一情况下，归因于所应用的线性运算(例如，加法、减法、乘法)，导出的CPMV可能在可由有效比特深度(即，18比特)表示的值的范围之外。

为了避免MV值的溢出，可使用几种方法。在一种示例中，增加裁剪操作来对MMVD模式和DMVR模式的导出的MV以及仿射继承模式的导出的CPMV执行，以将它们裁剪到有效比特深度(即，18比特)内。

在另一示例中，使用一个比特流一致性来确保MMVD模式和DMVR模式的所有导出的MV以及仿射继承模式的导出的CPMV在18比特动态范围内。也就是说，在对应导出的MV或CPMV超出[-2¹⁷,2¹⁷-1]的范围的情况下，编码器不发送信号通知解码器针对当前块启用MMVD模式、DMVR模式或仿射继承模式。

在当前的VVC中，两种不同的MV裁剪方法被应用于各种帧间预测模式。具体地，对于AMVP、ATMVP、三角预测模式和仿射模式中涉及的MV裁剪操作，当MV值在由有效比特深度(即，18比特)表示的范围之外时，应用常规裁剪方法以将MV值裁剪到范围边界值，也即，大于2¹⁷-1的MV值被裁剪到2¹⁷-1并且小于-2¹⁷的MV值被裁剪到-2¹⁷。常规裁剪方法由以下等式描述：

其中L是舍入之前的MV值；并且L_clip是裁剪后的MV的值。

另一方面，对于显式正常帧间模式和显式仿射模式中涉及的MV裁剪操作，应用周期性裁剪方法，其周期性地重复以将MV值保持在范围[-2¹⁷,2¹⁷-1]内，如由以下等式所指示：

M＝(L+2¹⁸)％2¹⁸

L_clip＝(M≥2¹⁷)？(M-2¹⁸)：M (7)

其中L是舍入之前的MV值；M是MV裁剪操作期间的中间值；并且L_clip是裁剪后的MV的值。

为了在实现统一设计的同时降低复杂度，应用于VVC中的不同帧间模式的MV裁剪方法可以被统一。在一个示例中，如等式(6)中所指示的常规裁剪方法被用于所有MV裁剪操作。也就是说，基于等式(6)的相同裁剪过程被应用于包括AMVP模式、ATMVP模式、三角模式、MMVD模式、DMVR模式、仿射继承模式、显式正常帧间模式和显式仿射模式的预测工具中所使用的MV。此裁剪过程还可被应用于MMVD模式、DMVR模式和仿射继承模式中的导出的CPMV。

在另一示例中，如等式(7)中所示的周期性裁剪方法被用于所有MV裁剪操作。也就是说，基于等式(7)的相同裁剪过程被应用于包括AMVP模式、ATMVP模式、三角模式、MMVD模式、DMVR模式、仿射继承模式、显式正常帧间模式和显式仿射模式的预测工具中所使用的MV。此裁剪过程还可被应用于MMVD模式、DMVR模式和仿射继承模式中的导出的CPMV。

运动矢量存储

对于VVC中的空间MV预测，仿射CPMV(以8×8粒度)和子块MV(以4×4粒度)的一个混合运动场被用于仿射运动继承以及合并/跳过和高级运动矢量预测(AMVP)。此外，除了基于历史的运动矢量预测之外，在VVC标准中，一个编解码块的CPMV和/或MV仅可从其随意的相邻块的CPMV和/或MV预测出。这意味着在完全重建了当前块的CPMV和/或MV之后，编解码块的非邻近块的CPMV和/或MV可被清除。因此，在实际硬件实现中，不需要针对整个CTU存储CPMV和MV。替代地，解码器仅需要存储CPMV和MV的上方行和左侧列作为上下文。图15示出了CPMV和MV上下文更新过程以说明这样的概念。在图15中，CPMV上下文在浅点区域1502中被示出(假设最小仿射块尺寸是8×8)，并且常规MV上下文在深点区域1504中被示出(假设最小帧间预测块尺寸是4×4)。如图15中所示，在当前编解码块的CPMV或MV被解码之后，对应的左侧上下文和上方上下文被更新，从而将两个区域1502和1504进一步向下和向右移位，直到跨越一个CTU内的所有编解码块为止。

在一种示例中，假设CTU尺寸为128×128并且针对每个4样点片段存储MV，则存在针对上方行的32个片段、针对左侧列的32个片段、以及用于存储左上方上下文的32个片段。此外，VVC中的MV范围是例如18比特。因此，本地MV存储可能需要(32+32+32)×(18×2(hor/ver)×2(L0/L1))＝6912个比特＝864个字节。类似地，假设针对每个8样点片段存储CPMV，则存在针对上方行的16个片段、针对左侧列的16个片段、以及需要被存储为CPMV上下文的16个片段。因此，本地CPMV存储可能需要(16+16+16)×(18×3(CPMV)×2(hor/ver)×2(L0/L1))＝10368个比特＝1296个字节。此外，假定MV预测和CPMV预测可跨CTU边界发生，则需要针对图片宽度的每4样点片段的一个额外的行缓冲器存储，也即，picWidth/4×(18×2×2)。因此，当使用4K视频时，用于VVC中的空间CPMV和MV预测的CPMV和MV存储使用被总结在下表3中。

表3 VVC中用于存储空间CPMV和MV所需的存储器大小

在当前VVC设计中，基于8×8亮度样点的子采样网格来压缩时间MV，以降低存储用于时间运动预测(诸如TMVP和替代的时间运动矢量预测(ATMVP))的时间MV的存储器存储要求。与保持在18比特的空间MV不同，为了进一步降低MV存储要求，时间MV在被存储到外部缓冲器之前被转换为尾数-指数格式。将18比特的时间MV表示为尾数-指数格式的动机是更粗略地量化大MV值，同时维持小MV值的精度。如图16中所示，在当前VVC规范中，用于存储时间MV的尾数-指数表示被配置为7比特有符号尾数(1比特用于符号)和4比特无符号指数。

因此，在当前VVC中，应用不同的表示方法来存储空间MV和时间MV。具体地，空间MV和CPMV被存储为18比特有符号值，而时间MV使用7比特有符号尾数和4比特无符号指数(即，总共11比特)来存储。也就是说，时间MV比空间MV和CPMV更有效率地被存储。然而，在实践中，存储空间MV和CPMV的实现成本比时间MV存储的实现成本更昂贵，这是因为空间MV和CPMV需要使用片上存储器来存储，而时间MV使用外部存储器来存储。

在当前VVC中，仿射CPMV和子块MV的一个混合运动场被用于仿射运动继承以及合并/跳过和高级运动矢量预测(AMVP)。此外，因为MV和CPMV两者以18比特准确度来存储，所以大量片上存储器(如表3中所示的约10800个字节)变得有必要，以存储用于空间MV和CPMV预测的相邻块的MV和CPMV。为了降低这样的存储器要求，提出以下方法以在存储空间MV和CPMV之前将空间MV和CPMV完全地或部分地转换为尾数-指数表示格式。

在一种示例中，所有空间运动信息在被存储到片上存储器中之前被转换为尾数-指数格式。转换后的运动信息不仅可包括空间相邻块的MV和CPMV，而且还包括被用于基于历史的合并候选的MV(即，基于历史的运动矢量预测(HMVP)MV)。此外，尾数参数和指数参数的不同组合可以被应用，这可在存储使用与MV精度之间提供各种权衡。在一个示例性实施方式中，尾数被设置为8个比特且指数被设置为4个比特，并且表4总结了当这样的尾数-指数设置被应用时的粗略的片上存储器使用。与表3相比，使用针对空间MV和CPMV以及针对HMVP MV的尾数-指数表示可有效率地将片上MV/CPMV存储的总存储器大小减少约33％。在另一示例中，尾数-指数表示被应用于空间MV和CPMV，但不被应用于基于历史的MV候选，也即，查找表(LUT)中的基于历史的MV候选仍被存储在原始18比特中。

表4应用基于尾数(8)-指数(4)的MV表示用于存储空间CPMV和MV所需的存储器大小

归因于MV量化引起的精度损失，针对所有空间MV和CPMV以及基于历史的MV候选的向尾数-指数格式的转换可能导致一些显著的编解码性能下降。同时，MV值和CPMV值在原始MV域与尾数-指数MV域之间的频繁转换可能在编码器侧和解码器侧两者引入额外的编解码复杂度。此外，从表3可以看出，与本地MV和CPMV相比，存储在行缓冲器中的MV消耗多得多的片上存储器用于存储，也即，总存储器大小的80％。为了在MV和CPMV预测效率与片上存储器减少之间实现更好的权衡，在另一示例中，尾数-指数表示仅被应用于存储在行缓冲器中的MV(即，来自上方CTU的相邻MV)，而存储在本地缓冲器中的所有MV和CPMV(即，同一CTU内的相邻MV和CPMV)仍以原始18比特被存储。由于MV量化仅被应用于行缓冲器中的MV，因此在此示例中，与所有空间MV和CPMV以及基于历史的MV候选被转换的先前示例相比，可有效地减小对应的编解码性能影响。同时，转换MV和CMPV的复杂度开销减少，这是因为不需要转换本地缓冲器中的MV或CPMV，并且仅来自上方CTU行的相邻MV和CPMV被转换到尾数-指数域(针对MV存储)或者从尾数-指数域被转换(针对MV提取)。

表5示出了当行缓冲器MV以11比特尾数(7)-指数(4)表示格式被存储时的对应片上存储器使用。以这种方式，片上MV/CPMV存储的总存储器大小减少约32％，与表3中所示的示例中实现的33％的减少相当。

表5使用尾数(7)-指数(4)格式存储行缓冲器CPMV和MV所需的存储器大小

在又一示例中，基于尾数-指数表示来压缩所有空间MV和CPMV。为了在MV/CPMV预测效率与存储要求之间实现更好的权衡，不同的尾数-指数参数被用于压缩不同的空间MV。例如，可使用不同参数来压缩存储在本地缓冲器中的MV和CPMV以及存储在行缓冲器中的MV。归因于用于将MV存储在行缓冲器中的存储器大小比用于将MV和CPMV存储在本地缓冲器中的存储器大小显著得多的事实，行缓冲器中的MV可以比本地缓冲器中存储的MV和/或CPMV更激进地被压缩。在一个示例性实施方式中，可以使用用于压缩本地存储库中的MV和CPMV的12比特的尾数(8)-指数(4)表示格式、以及用于压缩行缓冲器中的MV的11比特的尾数(7)-指数(4)表示格式。此外，本地缓冲器中的压缩的MV可以包括或不包括用于HMVP的MV。也就是说，LUT中的基于历史的MV候选可以以压缩格式或原始18比特被存储。

在以上示例中，用于空间MV和CPMV的存储要求降低，从而降低编解码器实现成本。使用尾数-指数表示来表示存储库中的空间MV和CPMV以及时间MV进一步降低了硬件实现复杂度。

图17是示出根据本公开的一些实施方式的用于视频编解码的装置的框图。装置1700可以是终端，诸如移动电话、平板计算机、数字广播终端、平板设备或个人数字助理。

如图17所示，装置1700可包括以下组件中的一个或更多个：处理组件1702、存储器1704、电源组件1706、多媒体组件1708、音频组件1710、输入/输出(I/O)接口1712、传感器组件1714和通信组件1716。

处理组件1702通常控制装置1700的整体操作，诸如与显示、电话呼叫、数据通信、相机操作和记录操作有关的操作。处理组件1702可包括一个或多个处理器1720，用于执行指令以完成上述方法的全部或部分步骤。此外，处理组件1702可包括用于促进处理组件1702与其他组件之间的交互的一个或多个模块。例如，处理组件1702可包括多媒体模块，用于促进多媒体组件1708与处理组件1702之间的交互。

存储器1704被配置为存储不同类型的数据以支持装置1700的操作。此类数据的示例包括用于在装置1700上操作的任何应用或方法的指令、联系人数据、电话簿数据、消息、图片、视频等。存储器1704可由任何类型的易失性或非易失性存储设备或其组合来实现，并且存储器1704可以是静态随机存取存储器(SRAM)、电可擦除可编程只读存储器(EEPROM)、可擦除可编程只读存储器(EPROM)、可编程只读存储器(PROM)、只读存储器(ROM)、磁存储器、闪存、磁盘或紧凑盘。

电源组件1706为装置1700的不同组件供电。电源组件1706可包括电源管理***、一个或更多个电源、以及与为装置1700生成、管理和分配电力相关联的其他组件。

多媒体组件1708包括在装置1700和用户之间提供输出接口的屏幕。在一些示例中，屏幕可包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板，则屏幕可被实现为从用户接收输入信号的触摸屏。触摸面板可包括用于感测触摸面板上的触摸、滑动和手势的一个或更多个触摸传感器。触摸传感器不仅可感测触摸动作或滑动动作的边界，而且还可检测与触摸或滑动操作相关的持续时间和压力。在一些示例中，多媒体组件1708可包括前置相机和/或后置相机。当装置1700处于操作模式(诸如拍摄模式或视频模式)时，前置相机和/或后置相机可接收外部多媒体数据。

音频组件1710被配置为输出和/或输入音频信号。例如，音频组件1710包括麦克风(MIC)。当装置1700处于操作模式(诸如呼叫模式、录音模式和语音识别模式)时，麦克风被配置为接收外部音频信号。接收的音频信号可进一步被存储在存储器1704中或经由通信组件1716被发送。在一些示例中，音频组件1710还包括用于输出音频信号的扬声器。

I/O接口1712提供处理组件1702与***接口模块之间的接口。上述***接口模块可以是键盘、点击轮、按钮等。这些按钮可包括但不限于主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件1714包括一个或更多个传感器，用于在针对装置1700的不同方面中提供状态评估。例如，传感器组件1714可检测装置1700的开/关状态和组件的相对位置。例如，组件是装置1700的显示器和键盘。传感器组件1714还可检测装置1700或装置1700的组件的位置变化、用户在装置1700上的接触的存在或不存在、装置1700的取向或加速/减速、以及装置1700的温度变化。传感器组件1714可包括接近传感器，接近传感器被配置为在没有任何物理接触的情况下检测附近物体的存在。传感器组件1714还可包括光学传感器，诸如在成像应用中使用的CMOS或CCD图像传感器。在一些示例中，传感器组件1714还可包括加速度传感器、陀螺仪传感器、磁传感器、压力传感器或温度传感器。

通信组件1716被配置为促进装置1700与其他设备之间的有线或无线通信。装置1700可以基于通信标准(诸如WiFi、4G或其组合)来接入无线网络。在一种示例中，通信组件1716经由广播信道从外部广播管理***接收广播信号或广播相关信息。在一种示例中，通信组件1716还可以包括用于促进短距离通信的近场通信(NFC)模块。例如，NFC模块可以基于射频识别(RFID)技术、红外数据协会(IrDA)技术、超宽带(UWB)技术、蓝牙(BT)技术和其他技术来实现。

在一种示例中，装置1700可由专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件中的一个或更多个来实现，以执行上述方法。

非暂时性计算机可读存储介质可以是例如硬盘驱动器(HDD)、固态驱动器(SSD)、闪存、混合驱动器或固态混合驱动器(SSHD)、只读存储器(ROM)、紧凑盘只读存储器(CD-ROM)、磁带、软盘等。

图18是示出用于视频编解码的运动矢量存储的示例性过程的流程图。

在步骤1802中，处理器1720识别分别用于空间运动矢量(MV)预测和仿射运动继承的MV和控制点运动矢量(CPMV)。

在步骤1804中，处理器1720将MV和CPMV转换为尾数-指数格式。

在步骤1806中，处理器1720将MV和CPMV的尾数-指数表示存储在存储器中。

在一种示例中，处理器1720还可以识别用于基于历史的运动矢量预测(HMVP)的MV，并将用于HMVP的MV转换为尾数-指数格式；并且将用于HMVP的MV的尾数-指数表示存储在存储器中。

在一种示例中，处理器1720可以识别用于HMVP的MV，并将用于HMVP的MV存储到存储器中而无需转换。

在一种示例中，处理器1720可以识别位于上方编解码树单元(CTU)行中的MV和CPMV的所选择的子集；将该子集中的MV和CPMV转换为尾数-指数格式；并且识别其余的MV和CPMV，并将其余的MV和CPMV存储在存储器中而无需转换。

在一种示例中，处理器1720可以识别位于上方编解码树单元(CTU)行中的MV和CPMV的所选择的子集；将该子集中的MV和CPMV转换为第一尾数-指数格式；并且将其余的MV和CPMV转换为第二尾数-指数格式。第一尾数-指数格式可以具有比第二尾数-指数格式更激进的压缩比。

在一些示例中，提供了一种用于视频编解码的装置。该装置包括处理器1720；以及存储器1704，被配置为存储可由处理器执行的指令；其中处理器在执行指令时被配置为执行如图18所示的方法。

在一些其他示例中，提供了一种非暂时性计算机可读存储介质1704，具有存储在其中的指令。当指令由处理器1720执行时，指令使处理器执行如图18所示的方法。

本公开的描述已经出于说明的目的被呈现，并且不旨在穷举或限于本公开。受益于在前面的描述和相关联的附图中呈现的教导，许多修改、变化和替代实施方式对于本领域普通技术人员将是显而易见的。

选择和描述示例是为了解释本公开的原理，并且使本领域的其他技术人员能够理解针对各种实施方式的公开，并且最好地利用基本原理和具有适合于预期的特定用途的各种修改的各种实施方式。因此，将理解，本公开的范围不限于所公开的实施方式的具体示例，并且修改和其他实施方式旨在被包括在本公开的范围内。

Claims

1.一种用于视频编解码的方法，包括：

识别分别用于空间运动矢量MV预测和仿射运动继承的MV和控制点运动矢量CPMV；

将所述MV和所述CPMV转换为尾数-指数格式；并且

将所述MV和所述CPMV的尾数-指数表示存储在存储器中。

2.如权利要求1所述的方法，还包括：

识别用于基于历史的运动矢量预测HMVP的MV，并将用于HMVP的MV转换为尾数-指数格式；并且

将用于HMVP的MV的尾数-指数表示存储在所述存储器中。

3.如权利要求1所述的方法，还包括：

识别用于HMVP的MV，并将用于HMVP的MV存储到所述存储器中而无需转换。

4.如权利要求1所述的方法，还包括：

识别位于上方编解码树单元CTU行中的MV和CPMV的所选择的子集；

将所述子集中的MV和CPMV转换为尾数-指数格式；并且

识别其余的MV和CPMV，并将所述其余的MV和CPMV存储在所述存储器中而无需转换。

5.如权利要求1所述的方法，还包括：

识别位于上方CTU行中的MV和CPMV的所选择的子集；

将所述子集中的MV和CPMV转换为第一尾数-指数格式；并且

将其余的MV和CPMV转换为第二尾数-指数格式。

6.如权利要求5所述的方法，其中第一尾数-指数格式具有比第二尾数-指数格式更激进的压缩比。

7.一种用于视频编解码的装置，包括：

处理器；以及

存储器，被配置为存储由处理器可执行的指令；

其中处理器在执行所述指令时被配置为：

将所述MV和所述CPMV转换为尾数-指数格式；并且

将空间MV和所述CPMV的尾数-指数表示存储在存储器中。

8.如权利要求7所述的装置，其中处理器还被配置为：

将用于HMVP的MV的尾数-指数表示存储在所述存储器中。

9.如权利要求7所述的装置，其中处理器还被配置为：

10.如权利要求7所述的装置，其中处理器还被配置为：

将所述子集中的MV和CPMV转换为尾数-指数格式；并且

11.如权利要求7所述的装置，其中处理器还被配置为：

识别位于上方CTU行中的MV和CPMV的所选择的子集；

将所述子集中的MV和CPMV转换为第一尾数-指数格式；并且

将其余的MV和CPMV转换为第二尾数-指数格式。

12.如权利要求11所述的装置，其中第一尾数-指数格式具有比第二尾数-指数格式更激进的压缩比。

13.一种非暂时性计算机可读存储介质，包括存储在其中的指令，其中在由处理器执行所述指令时，所述指令使处理器：

将所述MV和所述CPMV转换为尾数-指数格式；并且

将空间MV和所述CPMV的尾数-指数表示存储在存储器中。

14.如权利要求13所述的非暂时性计算机可读存储介质，其中所述指令还使处理器：

将用于HMVP的d个MV的尾数-指数表示存储在所述存储器中。

15.如权利要求13所述的非暂时性计算机可读存储介质，其中处理器还被配置为：

16.如权利要求13所述的非暂时性计算机可读存储介质，其中所述指令还使处理器：

将所述子集中的MV和CPMV转换为尾数-指数格式；并且

17.如权利要求13所述的非暂时性计算机可读存储介质，其中所述指令还使处理器：

识别位于上方CTU行中的MV和CPMV的所选择的子集；

将所述子集中的MV和CPMV转换为第一尾数-指数格式；并且

将其余的MV和CPMV转换为第二尾数-指数格式。

18.如权利要求17所述的非暂时性计算机可读存储介质，其中第一尾数-指数格式具有比第二尾数-指数格式更激进的压缩比。