CN112369031B

CN112369031B - 对于视频编译码的波前处理的基于多个历史的非毗邻mvp

Info

Publication number: CN112369031B
Application number: CN201980045341.1A
Authority: CN
Inventors: L.法姆范; W-J.钱; V.塞雷金; M.卡尔切维茨; H.黄
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2018-07-10
Filing date: 2019-07-10
Publication date: 2022-12-02
Anticipated expiration: 2039-07-10
Also published as: AU2019302660B2; TW202032994A; US11606575B2; CN112369031A; US20200021839A1; IL279538A; AU2023236294A1; MX2021000073A; CO2021000057A2; CN115811619A; US20220329844A1; SG11202012683VA; IL279538B1; TW202410697A; CA3105379A1; ZA202100877B; JP2023145518A; JP7314248B2; IL279538B2; JP2021530904A

Abstract

一种用于对视频数据进行编译码的示例设备包括：存储器，被配置为存储视频数据；以及一个或多个处理单元，其在电路***中实施，被配置为：将图片的第一编译码树单元(CTU)行的运动信息存储在存储器的第一历史运动矢量预测子(MVP)缓冲器中；重置存储器的第二历史MVP缓冲器；以及在重置第二历史MVP缓冲器之后，将图片的第二CTU行的运动信息存储在第二历史MVP缓冲器中，第二CTU行不同于第一CTU行。在一些示例中，由一个或多个处理器执行的视频编译码过程的单独线程可以处理相应的CTU行。

Description

对于视频编译码的波前处理的基于多个历史的非毗邻MVP

相关申请的交叉引用

本申请要求2018年7月10日提交的第62/696,281号美国临时申请、2018年8月2日提交的第62/713,944号美国临时申请和2019年7月9日提交的第16/506,720号美国申请的权益，其全部内容通过引用结合于此。

技术领域

本公开涉及视频编译码，包括视频编码和视频解码。

背景技术

数字视频能力可以被结合到广泛的设备中，包括数字电视、数字直接广播***、无线广播***、个人数字助理(PDA)、膝上型或台式计算机、平板计算机、电子书阅读器、数码相机、数字记录设备、数字媒体播放器、视频游戏设备、视频游戏控制台、蜂窝或卫星无线电电话、所谓的“智能电话”、视频电话会议设备、视频流设备等。数字视频设备实施视频编译码技术，诸如由MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4第10部分、高级视频编码(Advanced Video Coding，AVC)、高效视频编译码(High Efficiency Video Coding，HEVC)标准、ITU-T H.265/高效视频编译码(HEVC)定义的标准以及这些标准的扩展版本中描述的那些技术。通过实施这种视频编译码技术，视频设备可以更有效地发送、接收、编码、解码和/或存储数字视频信息。

视频编译码技术包括空域(图片内)预测和/或时域(图片间)预测，以减少或消除视频序列中固有的冗余。对于基于块的视频编译码，视频条带(例如，视频图片或视频图片的一部分)可以被分割成视频块，这些视频块也可以被称为编译码树单元(coding treeunits，CTU)、编译码单元(coding units，CU)和/或编译码节点。使用对于同一图片中相邻块中的参考样点的空域预测，对图片的帧内编译码的(I)条带中的视频块进行编码。图片的帧间编译码的(P或B)条带中的视频块可以使用对于同一图片中相邻块中的参考样点的空间预测，或者对于其他参考图片中的参考样点的时域预测。图片可以称为帧，并且参考图片可以称为参考帧。

发明内容

通常，本公开描述了用于对视频数据块的运动信息进行编译码的技术。这些技术可以在波前并行(wavefront parallel)处理期间使用。运动信息可以包括从历史运动矢量预测子(history motion vector predictors，HMVP)预测的运动矢量。HMVP候选可以指先前编译码的块的运动信息。视频编译码器(编码器或解码器)可以在编译码(编码或解码)过程中维护具有多个HMVP候选的表。当新的条带出现时，视频编译码器可以清空该表。当存在帧间编译码的块时，视频编译码器可以将与帧间编译码的块相关联的运动信息附加到表中。

在一个示例中，一种用于对视频数据进行编译码(编码或解码)的方法包括：将图片的第一编译码树单元(CTU)行的运动信息存储在存储器的第一历史运动矢量预测子(MVP)缓冲器中；重置存储器的第二历史MVP缓冲器；以及在重置第二历史MVP缓冲器之后，将图片的第二CTU行的运动信息存储在第二历史MVP缓冲器中，第二CTU行不同于第一CTU行。在一些示例中，视频编译码过程的第一线程可以对第一CTU行进行编译码，并且不同于第一线程的视频编译码过程的第二线程可以对第二CTU行进行编译码。

在另一个示例中，用于对视频数据进行编译码的设备包括：被配置为存储视频数据的存储器；以及在电路***中实施的一个或多个处理单元，并且其被配置为：将图片的第一编译码树单元(CTU)行的运动信息存储在存储器的第一历史运动矢量预测子(MVP)缓冲器中；重置存储器的第二历史MVP缓冲器；以及在重置第二历史MVP缓冲器之后，将图片的第二CTU行的运动信息存储在第二历史MVP缓冲器中，第二CTU行不同于第一CTU行。

在另一个示例中，计算机可读存储介质上存储有指令，当执行这些指令时，使处理器：将图片的第一编译码树单元(CTU)行的运动信息存储在存储器的第一历史运动矢量预测子(MVP)缓冲器中；重置存储器的第二历史MVP缓冲器；以及在重置第二历史MVP缓冲器之后，将图片的第二CTU行的运动信息存储在第二历史MVP缓冲器中，第二CTU行不同于第一CTU行。

在另一个示例中，用于对视频数据进行编译码的设备包括：被配置为存储视频数据的存储器；用于将图片的第一编译码树单元(CTU)行的运动信息存储在存储器的第一历史运动矢量预测子(MVP)缓冲器中的装置；用于重置存储器的第二历史MVP缓冲器的装置；以及用于在重置第二历史MVP缓冲器之后，将图片的第二CTU行的运动信息存储在第二历史MVP缓冲器中的装置，第二CTU行不同于第一CTU行。

一个或多个示例的细节在附图和以下描述中阐述。从说明书和附图以及权利要求书中，其他特征、目的和优点将变得显而易见。

附图说明

图1是示出可以执行本公开的技术的示例视频编码和解码***的框图。

图2A和图2B是示出示例四叉树二叉树(quadtree binary tree，QTBT)结构和相应的编译码树单元(CTU)的概念图。

图3是示出使用历史运动矢量预测子(HMVP)对运动信息进行编译码的示例过程的流程图。

图4是示出更新HMVP表的示例的概念图。

图5是示出用于运动信息编译码的非毗邻块的示例选择的概念图。

图6是示出基于父块的非毗邻块的示例选择的概念图。

图7是示出编译码树单元(CTU)的期望波前处理的示例的概念图。

图8是示出用于HMVP的运动信息的示例的概念图。

图9是示出被分割成多行编译码树单元(CTU)的图片的示例的概念图。

图10A和图10B是示出用于合并和高级运动矢量预测(AMVP)模式的示例空域相邻运动矢量候选的框图。

图11A和图11B是示出时域运动矢量预测(temporal motion vector prediction，TMPV)候选的概念图。

图12是示出编译码树单元(CTU)和相邻块的示例的框图。

图13是示出当前CTU中的当前CU的框图。

图14是示出可以执行本公开的技术的示例视频编码器的框图。

图15是示出可以执行本公开的技术的示例视频解码器的框图。

图16是示出根据本公开的技术对视频数据的当前块进行编码的示例方法的流程图。

图17是示出根据本公开的技术对视频数据的当前块进行解码的示例方法的流程图。

图18是示出根据本公开的技术对视频数据进行编译码(编码或解码)的示例方法的流程图。

具体实施方式

图1是示出可以执行本公开的技术的示例视频编码和解码***100的框图。本公开的技术一般涉及对视频数据进行编译码(编码和/或解码)。通常，视频数据包括用于处理视频的任何数据。因此，视频数据可以包括原始的、未编译码的视频、编码的视频、解码的(例如，重构的)视频以及视频元数据，诸如信令数据。

如图1所示，在该示例中，***100包括源设备102，其提供要由目的设备116解码和显示的编码的视频数据。特别地，源设备102经由计算机可读介质110向目的设备116提供视频数据。源设备102和目的设备116可以包括多种设备中的任何一种，包括台式计算机、笔记本(即，膝上型)计算机、平板计算机、机顶盒、诸如智能手机的电话手持机、电视、照相机、显示设备、数字媒体播放器、视频游戏控制台、视频流设备等。在一些情况下，源设备102和目的设备116可以被配备用于无线通信，因此可以被称为无线通信设备。

在图1的示例中，源设备102包括视频源104、存储器106、视频编码器200和输出接口108。目的设备116包括输入接口122、视频解码器300、存储器120和显示设备118。根据本公开，源设备102的视频编码器200和目的设备116的视频解码器300可以被配置为应用用于对运动信息进行编译码的技术。因此，源设备102代表视频编码设备的示例，而目的设备116代表视频解码设备的示例。在其他示例中，源设备和目的设备可以包括其他组件或布置。例如，源设备102可以从外部视频源(诸如外部相机)接收视频数据。同样，目的地设备116可以与外部显示设备接口，而不包括集成的显示设备。

图1所示的***100仅仅是一个示例。通常，任何数字视频编码和/或解码设备可以执行用于对运动信息进行编译码的技术。源设备102和目的设备116仅仅是这种编译码设备的示例，其中源设备102生成编译码的视频数据以传输到目的设备116。本公开将“编译码”设备称为执行数据编译码(编码和/或解码)的设备。因此，视频编码器200和视频解码器300分别代表编译码设备的示例，特别是视频编码器和视频解码器。在一些示例中，源设备102和目的设备116可以以基本对称的方式操作，使得源设备102和目的设备116中的每一个都包括视频编码和解码组件。因此，***100可以支持源设备102和目的设备116之间的单向或双向视频传输，例如用于视频流式传输、视频回放、视频广播或视频电话。

通常，视频源104代表视频数据的源(即，原始的、未编译码的视频数据)，并向视频编码器200提供视频数据的一系列连续图片(也称为“帧”)，视频编码器200对图片的数据进行编码。源设备102的视频源104可以包括视频捕获设备，例如摄像机、包含先前捕获的原始视频的视频存档(archive)和/或从视频内容提供者接收视频的视频馈送接口。作为另外的替代，视频源104可以生成基于计算机图形的数据作为源视频，或者实况视频、存档视频和计算机生成视频的组合。在每种情况下，视频编码器200对捕获的、预捕获的或计算机生成的视频数据进行编码。视频编码器200可以将图片从接收顺序(有时称为“显示顺序”)重新排列成编译码顺序以用于编译码。视频编码器200可以生成包括编码的视频数据的比特流。源设备102然后可以经由输出接口108将编码的视频数据输出到计算机可读介质110上，用于由例如目的设备116的输入接口122接收和/或检索。

源设备102的存储器106和目的设备116的存储器120代表通用存储器。在一些示例中，存储器106、120可以存储原始视频数据，例如来自视频源104的原始视频和来自视频解码器300的原始的、解码的视频数据。附加地或替代地，存储器106、120可以存储可分别由例如视频编码器200和视频解码器300执行的软件指令。尽管在该示例中存储器106、120与视频编码器200和视频解码器300分开示出，但是应当理解，视频编码器200和视频解码器300也可以包括用于功能上类似或等同目的的内部存储器。此外，存储器106、120可以存储编码的视频数据，例如，从视频编码器200输出并输入到视频解码器300。在一些示例中，存储器106、120的部分可以被分配为一个或多个视频缓冲器，例如，用于存储原始的、解码的和/或编码的视频数据。

计算机可读介质110可以代表能够将编码的视频数据从源设备102传输到目的设备116的任何类型的介质或设备。在一个示例中，计算机可读介质110代表通信介质，以使源设备102能够例如经由射频网络或基于计算机的网络实时地将编码的视频数据直接发送到目的设备116。根据通信标准，诸如无线通信协议，输出接口108可以调制包括编码的视频数据的传输信号，并且输入接口122可以解调接收的传输信号。通信介质可以包括任何无线或有线通信介质，诸如射频(radio frequency，RF)频谱或一条或多条物理传输线。通信介质可以形成基于分组的网络的一部分，诸如局域网、广域网或全球网络，诸如因特网。通信介质可以包括路由器、交换机、基站或可以对促进从源设备102到目的设备116的通信有用的任何其他设备。

在一些示例中，源设备102可以从输出接口108向存储设备112输出编码的数据。类似地，目的设备116可以经由输入接口122从存储设备112访问编码的数据。存储设备112可以包括各种分布式或本地访问的数据存储介质中的任何一种，诸如硬盘驱动器、蓝光光盘、DVD、CD-ROM、闪存、易失性或非易失性存储器，或者用于存储编码的视频数据的任何其他合适的数字存储介质。

在一些示例中，源设备102可以向文件服务器114或可以存储由源设备102生成的编码视频的另一中间存储设备输出编码的视频数据。目的设备116可以通过流式传输或下载从文件服务器114访问存储的视频数据。文件服务器114可以是能够存储编码的视频数据并将该编码的视频数据发送到目的设备116的任何类型的服务器设备。文件服务器114可以代表网络服务器(例如，用于网站)、文件传输协议(File Transfer Protocol，FTP)服务器、内容传递网络设备或网络附加存储(network attached storage，NAS)设备。目的设备116可以通过任何标准数据连接，包括因特网连接，从文件服务器114访问编码的视频数据。这可以包括无线信道(例如，Wi-Fi连接)、有线连接(例如，数字用户线路(digitalsubscriber line，DSL)、电缆调制解调器等)，或者两者的组合，该组合适于访问存储在文件服务器114上的编码的视频数据。文件服务器114和输入接口122可以被配置成根据流传输协议、下载传输协议或其组合来操作。

输出接口108和输入接口122可以代表无线发射器/接收器、调制解调器、有线网络组件(例如，以太网卡)、根据多种IEEE 802.11标准中的任何一种操作的无线通信组件，或其他物理组件。在输出接口108和输入接口122包括无线组件的示例中，输出接口108和输入接口122可以被配置为根据蜂窝通信标准(诸如4G、4G-LTE(长期演进)、高级LTE、5G等)传输数据(诸如编码的视频数据)。在输出接口108包括无线发射器的一些示例中，输出接口108和输入接口122可以被配置为根据其他无线标准(诸如IEEE 802.11规范、IEEE 802.15规范(例如，ZigBee^TM)、蓝牙^TM标准等)传输数据(诸如编码的视频数据)。在一些示例中，源设备102和/或目的设备116可以包括各自的片上***(system-on-a-chip，SoC)设备。例如，源设备102可以包括执行被认为是视频编码器200和/或输出接口108的功能的SoC设备，并且目的设备116可以包括执行被认为是视频解码器300和/或输入接口122的功能的SoC设备。

本公开的技术可以应用于视频编译码，以支持各种多媒体应用中的任何一种，诸如空中电视广播、有线电视传输、***传输、因特网流式视频传输(诸如基于HTTP的动态自适应流式传输(dynamic adaptive streaming over HTTP，DASH))、编码到数据存储介质上的数字视频、存储在数据存储介质上的数字视频的解码或其他应用。

目的设备116的输入接口122从计算机可读介质110(例如，存储设备112、文件服务器114等)接收编码的视频比特流。编码的视频比特流可以包括由视频编码器200定义的信令信息，其也被视频解码器300使用，诸如具有描述视频块或其他编译码单元(例如，条带、图片、图片组、序列等)的特征和/或处理的值的语法元素。显示设备118向用户显示解码的视频数据的解码图片。显示设备118可以代表各种显示设备中的任何一种，诸如阴极射线管(cathode ray tube，CRT)、液晶显示器(liquid crystal display，LCD)、等离子显示器、有机发光二极管(organic light emitting diode，OLED)显示器或另一种类型的显示设备。

虽然在图1中未示出，但是在一些示例中，视频编码器200和视频解码器300可以各自与音频编码器和/或音频解码器集成，并且可以包括适当的MUX-DEMUX(多路复用器-多路分解器)单元或其他硬件和/或软件，以处理包括公共数据流中的音频和视频两者的多路复用流。如果适用，MUX-DEMUX单元可以符合ITU H.223多路复用器协议，或者诸如用户数据报协议(user datagram protocol，UDP)的其他协议，。

视频编码器200和视频解码器300可以各自实施为各种合适的编码器和/或解码器电路***中的任何一种，诸如一个或多个微处理器、数字信号处理器(digital signalprocessor，DSP)、专用集成电路(application specific integrated circuit，ASIC)、现场可编程门阵列(field programmable gate array，FPGA)、离散逻辑、软件、硬件、固件或其任意组合。当这些技术部分地以软件实施时，设备可以将软件的指令存储在合适的非暂时性计算机可读介质中，并且使用一个或多个处理器在硬件中执行这些指令以执行本公开的技术。视频编码器200和视频解码器300中的每一个可以被包括在一个或多个编码器或解码器中，其中任一个可以被集成为相应设备中的组合编码器/解码器(CODEC)的一部分。包括视频编码器200和/或视频解码器300的设备可以包括集成电路、微处理器和/或无线通信设备，诸如蜂窝电话。

视频编码器200和视频解码器300可以根据视频编译码标准操作，诸如ITU-TH.265，也称为高效视频编译码(HEVC)或其扩展，诸如多视图和/或可缩放视频编译码扩展。可选地，视频编码器200和视频解码器300可以根据其他专有或行业标准(诸如，联合探索测试模型(Joint Exploration Test Model，JEM)或ITU-T H.266，也称为多功能视频编译码(Versatile Video Coding，VVC))操作。在Bross等人的“Versatile Video Coding(草案5)”，ITU-T SG16WP 3和ISO/IEC JTC 1/SC 29/WG 11的联合视频专家小组(Joint VideoExperts Team，JVET)，第14次会议：2019年3月19-27日，瑞士日内瓦，JVET-N1001-v3(以下简称“VVC草案5”)中描述了VVC标准的最新草案。然而，本公开的技术不限于任何特定的编译码标准。

通常，视频编码器200和视频解码器300可以执行图片的基于块的编译码。术语“块”通常是指包括要处理的数据(例如，编码的、解码的或在编码和/或解码处理中使用的数据)的结构。例如，块可以包括亮度数据和/或色度数据的样点的的二维矩阵。通常，视频编码器200和视频解码器300可以对以YUV(例如，Y、Cb、Cr)格式表示的视频数据进行编译码。也就是说，视频编码器200和视频解码器300可以对亮度分量和色度分量进行编译码，而不是对图片样点的红、绿和蓝(RGB)数据进行编译码，其中色度分量可以包括红色调和蓝色调色度分量。在一些示例中，视频编码器200在编码之前将接收到的RGB格式的数据转换成YUV表示，并且视频解码器300将YUV表示转换成RGB格式。可替代的，预处理单元和后处理单元(未示出)可以执行这些转换。

本公开通常可以指图片的编译码(例如，编码和解码)，以包括对图片的数据进行编码或解码的处理。类似地，本公开可以指图片的块的编译码，以包括对块的数据进行编码或解码的过程，例如预测和/或残差编译码。编码的视频比特流通常包括表示编译码决策(例如，编译码模式)和将图片分割成块的语法元素的一系列值。因此，对图片或块的编译码的引用通常应理解为形成图片或块的语法元素的值进行编译码。

HEVC定义了各种块，包括编译码单元(coding units，CU)、预测单元(predictionunit，PU)和变换单元(transform unit，TU)。根据HEVC，视频编译码器(诸如视频编码器200)根据四叉树结构将编译码树单元(CTU)分割为CU。也就是说，视频编译码器将CTU和CU分割成四个相等的、不重叠的正方形，并且四叉树的每个节点有零个或四个子节点。没有子节点的节点可以被称为“叶节点”，并且这种叶节点的CU可以包括一个或多个PU和/或一个或多个TU。视频编译码器可以进一步分割PU和TU。例如，在HEVC中，一个残差四叉树(residual quadtree，RQT)代表了TU的分割。在HEVC中，PU代表帧间预测数据，而TU代表残差数据。帧内预测的CU包括帧内预测信息，诸如帧内模式指示。

作为另一个示例，视频编码器200和视频解码器300可以被配置为根据JEM或VVC操作。根据JEM或VVC，视频编译码器(诸如视频编码器200)将图片分割成多个编译码树单元(CTU)。视频编码器200可以根据树结构(诸如四叉树二叉树(QTBT)结构或多类型树(Multi-Type Tree，MTT)结构)来分割CTU。QTBT结构移除了多个分割类型的概念，诸如HEVC的CU、PU和TU之间的分离。QTBT结构可以包括两个层级：根据四叉树分割来分割的第一层级，以及根据二叉树分割来分割的第二层级。QTBT结构的根节点对应于CTU。二叉树的叶节点对应于编译码单元(CU)。

在MTT分割结构中，可以使用四叉树(quadtree，QT)分割、二叉树(binary tree，BT)分割和一种或多种类型的三叉树(triple tree，TT)分割来分割块。三叉树分割是将一个块划分成三个子块的分割。在一些示例中，三叉树分割将块分成三个子块，而不通过中心划分原始块。MTT(例如，QT、BT和TT)中的分割类型可以是对称的，也可以是不对称的。

在一些示例中，视频编码器200和视频解码器300可以使用单个QTBT或MTT结构来表示亮度分量和色度分量中的每一个，而在其他示例中，视频编码器200和视频解码器300可以使用两个或更多个QTBT或MTT结构，诸如一个QTBT或MTT结构用于亮度分量，并且另一个QTBT或MTT结构用于两个色度分量(或者两个QTBT或MTT结构用于相应的色度分量)。

视频编码器200和视频解码器300可以被配置为使用按照HEVC的四叉树分割、使用根据JEM的QTBT分割或其他分割结构。出于解释的目的，本公开的技术的描述是相对于QTBT分割来呈现的。然而，应当理解，本公开的技术也可以应用于被配置为使用四叉树分割或其他类型的分割的视频编译码器。

本公开可以互换地使用“N×N”和“N乘N”来指代块(诸如CU或其他视频块)在垂直和水平维度方面的样点维度，例如16×16样点或16乘16样点。通常，16×16CU在垂直方向上有16个样点(y＝16)，并且在水平方向上有16个样点(x＝16)。同样，N×N CU通常在垂直方向上具有N个样点，并且在水平方向上具有N个样点，其中N代表非负整数值。CU中的样点可以按行和列排列。此外，CU不一定需要在水平方向和垂直方向上具有相同数量的样点。例如，CU可以包括N×M个样点，其中M不一定等于N。

视频编码器200对表示预测和/或残差信息以及其他信息的CU的视频数据进行编码。预测信息指示如何预测该CU，以便形成该CU的预测块。残差信息通常表示编码之前的CU样点和预测块之间的逐样点差值。

为了预测CU，视频编码器200通常可以通过帧间预测或帧内预测来形成CU的预测块。帧间预测通常是指根据先前编译码的图片的数据来预测CU，而帧内预测通常是指根据同一图片的先前编译码的数据来预测CU。为了执行帧间预测，视频编码器200可以使用一个或多个运动矢量来生成预测块。视频编码器200通常可以执行运动搜索以识别与CU紧密匹配的参考块，例如，相对于CU和参考块之间的差值。视频编码器200可以使用绝对差之和(sum of absolute difference，SAD)、平方差之和(sum of squared differences，SSD)、平均绝对差(mean absolute difference，MAD)、均方差(mean squared differences，MSD)或其它这种差值计算来计算差值度量，以确定参考块是否与当前CU紧密匹配。在一些示例中，视频编码器200可以使用单向预测或双向预测来预测当前CU。

JEM还提供了仿射运动补偿模式，其可以被认为是帧间预测模式。在仿射运动补偿模式中，视频编码器200可以确定表示非平移运动的两个或更多个运动矢量，诸如放大或缩小、旋转、透视运动或其他不规则运动类型。

为了执行帧内预测，视频编码器200可以选择帧内预测模式来生成预测块。JEM提供67种帧内预测模式，包括各种方向模式，以及平面模式和DC模式。通常，视频编码器200选择帧内预测模式，该模式描述当前块(例如，CU的块)的相邻样点，根据该相邻样点来预测当前块的样点。假设视频编码器200以光栅扫描顺序(从左到右、从上到下)对CTU和CU进行编译码，这种样点通常可以在与当前块相同的图片中的当前块的上方、左上方或者左侧。

视频编码器200对表示当前块的预测模式的数据进行编码。例如，对于帧间预测模式，视频编码器200可以对表示使用各种可用帧间预测模式中的哪一种的数据以及对应模式的运动信息进行编码。例如，对于单向或双向帧间预测，视频编码器200可以使用高级运动矢量预测(advanced motion vector prediction，AMVP)或合并(merge)模式来编码运动矢量。视频编码器200可以使用类似的模式来编码仿射运动补偿模式的运动矢量。

在预测之后，诸如块的帧内预测或帧间预测，视频编码器200可以计算该块的残差数据。残差数据(诸如残差块)代表该块和该块的使用相应的预测模式形成的预测块之间的逐样点差值。视频编码器200可以对残差块应用一个或多个变换，以在变换域而不是样点域中产生变换数据。例如，视频编码器200可以对残差视频数据应用离散余弦变换(discretecosine transform，DCT)、整数变换、小波变换或概念上类似的变换。此外，视频编码器200可以在一次变换之后应用二次变换，诸如模式相关的不可分离二次变换(mode-dependentnon-separable secondary transform，MDNSST)、信号相关的变换、卡尔亨-洛夫变换(Karhunen-Loeve transform，KLT)等。视频编码器200在应用一个或多个变换后产生变换系数。

如上所述，在为产生变换系数的任何变换之后，视频编码器200可以执行变换系数的量化。量化通常是指量化变换系数以尽可能减少用于表示系数的数据量，从而提供进一步压缩的处理。通过执行量化处理，视频编码器200可以减少与一些或所有系数相关联的比特深度。例如，视频编码器200可以在量化期间将n比特值向下舍入到m比特值，其中n大于m。在一些示例中，为了执行量化，视频编码器200可以对要量化的值执行按比特右移。

在量化之后，视频编码器200可以扫描变换系数，从包括量化的变换系数的二维矩阵中产生一维矢量。扫描可以被设计成将较高能量(因此较低频率)的系数放置在矢量的前面，并将较低能量(因此较高频率)的变换系数放置在矢量的后面。在一些示例中，视频编码器200可以利用预定义的扫描顺序来扫描量化的变换系数以产生串行化的矢量，然后对该矢量的量化的变换系数进行熵编码。在其他示例中，视频编码器200可以执行自适应扫描。在扫描量化的变换系数以形成一维矢量之后，视频编码器200可以例如根据上下文自适应二进制算术编译码(context-adaptive binary arithmetic coding，CABAC)对一维矢量进行熵编码。视频编码器200还可以对描述与编码的视频数据相关联的元数据的语法元素的值进行熵编码，以供视频解码器300在解码视频数据时使用。

为了执行CABAC，视频编码器200可以将上下文模型中的上下文分配给要发送的符号。该上下文可以涉及例如该符号的相邻值是否为零值。概率确定可以基于分配给符号的上下文。

视频编码器200还可以例如在图片报头、块报头、条带报头中向视频解码器300生成语法数据(诸如基于块的语法数据、基于图片的语法数据和基于序列的语法数据)或诸如诸如序列参数集(sequence parameter set，SPS)、图片参数集(picture parameter set，PPS)或视频参数集(video parameter set，VPS)的其他语法数据。视频解码器300同样可以解码这样的语法数据，以确定如何解码相应的视频数据。

以这种方式，视频编码器200可以生成包括编码的视频数据的比特流，例如，描述将图片分割成块(例如，CU)的语法元素以及块的预测和/或残差信息。最终，视频解码器300可以接收比特流并对编码的视频数据进行解码。

通常，视频解码器300执行与视频编码器200执行的过程相反的过程，以对比特流的编码的视频数据进行解码。例如，视频解码器300可以使用CABAC以与视频编码器200的CABAC编码处理基本相似但相反的方式来对比特流的语法元素的值进行解码。语法元素可以定义从图片到CTU的分割信息，并根据相应的分割结构(诸如QTBT结构)对每个CTU进行分割，以定义CTU的CU。语法元素还可以定义视频数据块(例如，CU)的预测和残差信息。

残差信息可以由例如量化的变换系数来表示。视频解码器300可以对块的量化变换系数进行逆量化和逆变换，以再现该块的残差块。视频解码器300使用信令通知的预测模式(帧内预测或帧间预测)和相关预测信息(例如，用于帧间预测的运动信息)来形成块的预测块。视频解码器300然后可以(在逐样点的基础上)组合预测块和残差块，以再现原始块。视频解码器300可执行附加的处理，诸如执行去块处理，以减少沿着块边界的视觉伪像。

本公开通常可以指“信令通知”某些信息，诸如语法元素。术语“信令通知”通常可以指用于对编码的视频数据进行解码的语法元素和/或其他数据的值的通信。也就是说，视频编码器200可以在比特流中信令通知语法元素的值。通常，信令通知是指在比特流中生成值。如上所述，源设备102可以基本上实时地或者非实时地将比特流传输到目的设备116，诸如当将语法元素存储到存储设备112以供目的设备116稍后检索时可能发生的情况。

根据本公开的技术，视频编码器200和视频解码器300可以被配置为在对视频数据的图片进行编译码时执行波前并行处理。通常，波前并行处理可以包括使用单独的处理线程对编译码树单元(CTU)的个别行进行编译码。例如，由视频编码器200或视频解码器300执行的第一线程可以处理CTU的第一行，第二线程可以处理CTU的第二行，以此类推。对CTU进行编译码包括对CTU的运动预测的编译码单元(CU)的运动信息进行编译码，以及其他，其中该运动信息可以指同一CTU或先前编译码的CTU(例如，左相邻和/或上相邻CTU)内的运动信息。这种运动信息可以存储在运动矢量预测子(MVP)缓冲器中。根据本公开的技术，视频编码器200和视频解码器300可以被配置为在对当前CTU行的视频数据进行编译码之前，重置当前CTU行的MVP缓冲器。MVP缓冲器可以是当前CTU行的个别MVP缓冲器，或者可以用于多行CTU的公共MVP缓冲器。

在一些示例中，当将运动信息存储到MVP缓冲器时，视频编码器200和视频解码器300可以在MVP缓冲器内仅存储唯一的运动信息。例如，视频编码器200和视频解码器300可以使用当前运动矢量对当前CU进行编译码，确定该运动矢量当前是否存储在用于当前CU的MVP缓冲器中，以及如果是，则阻止将该运动矢量存储在MVP缓冲器中，如果不是，则将该运动矢量存储在MVP缓冲器中。

在一些示例中，当MVP缓冲器变满时，视频编码器200和视频解码器300可以使用先进先出(first-in-first-out，FIFO)规则来从MVP缓冲器移除运动矢量。也就是说，为了向MVP缓冲器添加新的运动矢量，视频编码器200和视频解码器300可以从MVP缓冲器移除最早***的运动矢量，并将新的运动矢量***MVP缓冲器。以这种方式，MVP缓冲器可以具有类似队列的行为。

在一些示例中，视频编码器200和视频解码器300可以为各种类型的不同运动模型中的每一个维护单独的MVP缓冲器。例如，视频编码器200和视频解码器300可以为仿射运动模型维护仿射MVP缓冲器、为块内复制模式的运动信息维护块内复制MVP缓冲器、为局部照度(illumination)补偿的运动信息维护照度补偿MVP缓冲器、为子块MVP维护子块MVP缓冲器和/或为时间运动预测维护时域MVP缓冲器。

在一些示例中，视频编码器200和视频解码器300可以从一个或多个MVP缓冲器中的两个或更多个MVP生成合成MVP，并将该合成MVP***到MVP缓冲器之一中。两个或更多个MVP可以符合相同或不同的运动模型(即，具有不同的运动信息类型)。

图2A和图2B是说明示例四叉树二叉树(QTBT)结构130和对应的编译码树单元(CTU)132的概念图。实线表示四叉树划分，并且虚线指示二叉树划分。在二叉树的每个划分(即，非叶)节点中，一个标志被信令通知以指示使用哪种划分类型(即，水平或垂直)，其中在该示例中，0指示水平划分，并且1指示垂直划分。对于四叉树划分，不需要指示划分类型，因为四叉树节点将块水平和垂直地划分成4个大小相等的子块。因此，视频编码器200可以编码，并且视频解码器300可以解码用于QTBT结构130的区域树级(即实线)的语法元素(诸如划分信息)和用于QTBT结构130的预测树级(即虚线)的语法元素(诸如划分信息)。视频编码器200可以对由QTBT结构130的终端叶节点表示的CU的视频数据(诸如预测和变换数据)进行编码，并且视频解码器300可对由QTBT结构130的终端叶节点表示的CU的视频数据(诸如预测和变换数据)进行解码。

通常，图2B的CTU 132可以与定义与在第一级和第二级(例如，区域树级和预测树级)的QTBT结构130的节点相对应的块的大小的参数相关联。这些参数可以包括CTU大小(表示样点中CTU 132的大小)、最小四叉树大小(MinQTSize，表示最小允许的四叉树叶节点大小)、最大二叉树大小(MaxBTSize，表示最大允许的二叉树根节点大小)、最大二叉树深度(MaxBTDepth，表示最大允许的二叉树深度)和最小二叉树大小(MinBTSize，表示最小允许的二叉树叶节点大小)。

相应于CTU的QTBT结构的根节点可以在QTBT结构的第一级具有四个子节点，其中，所述四个子节点中的每一个可以根据四叉树分割来被分割。也就是说，第一级的节点是叶节点(没有子节点)或具有四个子节点。QTBT结构130的示例将这样的节点表示为包括具有用于分支的实线的父节点和子节点。如果第一级的节点不大于最大允许的二叉树根节点大小(MaxBTSize)，那么它们可以通过各自的二叉树被进一步分割。可以迭代一个节点的二叉树划分，直到由划分产生的节点达到最小允许的二叉树叶节点大小(MinBTSize)或最大允许的二叉树深度(MaxBTDepth)。QTBT结构130的示例将这样的节点表示为具有用于分支的虚线。二叉树叶节点被称为编译码单元(CU)，其中，所述编译码单元用于预测(例如，图像内或图像间预测)和变换，而无需任何进一步分割。如上所论述的，CU也可被称为“视频块”或“块”。

在QTBT分割结构的一个示例中，CTU大小被设置为128×128(亮度样点和两个相应的64×64色度样点)，MinQTSize被设置为16×16，MaxBTSize被设置为64×64，MinBTSize(针对宽度和高度两者)被设置为4，并且MaxBTDepth被设置为4。首先将四叉树分割应用于CTU以产生四叉树叶节点。四叉树叶节点可以具有从16×16(即，MinQTSize)到128×128(即，CTU大小)的大小。如果叶四叉树节点为128×128，那么其将不被二叉树进一步划分，因为大小超过MaxBTSize(即，在该示例中为64×64)。否则，叶四叉树节点将由二叉树进一步分割。因此，四叉树叶节点也是二叉树的根节点，并且具有二叉树深度为0。当二叉树深度达到MaxBTDepth(在该示例中为4)时，不允许进一步划分。当二叉树节点具有等于MinBTSize(在该示例中为4)的宽度时，其意味着不允许进一步水平划分。类似地，具有等于MinBTSize的高度的二叉树节点意味着针对所述二叉树节点不允许进一步垂直划分。如上所述，二叉树的叶节点被称为CU，并且在没有进一步分割的情况下根据预测和变换来进一步处理。

图3是示出使用历史运动矢量预测子(HMVP)对运动信息进行编译码的示例过程的流程图。最初，视频编译码器，诸如视频编码器200或视频解码器300，加载具有HMVP候选的表(140)。然后，视频编译码器使用HMVP候选对视频数据的块进行编译码(142)。然后，视频编译码器用编译码的块的运动信息更新该表(144)。

图4是示出更新HMVP表的示例的概念图。在JVET-K0104中，该表的大小设置为16，并应用先进先出(FIFO)规则。图4描绘了一个示例，在该示例中应用FIFO规则来移除HMVP候选并向本公开的技术的示例中使用的表添加新的HMVP候选。

视频编译码器，诸如视频编码器200或视频解码器300，可以在候选列表中的时域运动矢量预测(TMVP)候选之后，***来自表中的最后一个条目到第一个条目的HMVP候选。视频编译码器可以对HMVP候选应用修剪(pruning)。当可用合并候选的总数达到信令通知的合并候选的最大允许数量时，视频编码器可以终止该修剪处理。

在图4的示例中，更新前的表包括历史MVP₀(HMVP₀)到历史MVP_L-1(HMVP_L-1)，其中下标数字0到L-1表示添加历史MVP的顺序。C_L-1表示要添加到表中的新历史MVP。因此，根据FIFO规则，在该示例中，在添加C_L-1之前，从表中移除HMVP₀。

图5是示出用于运动信息编译码的非毗邻块的示例选择的概念图。在图5的示例中，标记为“Curr”的当前块表示当前编译码单元(CU)，可以使用标记为A_i、B_j和NA_k的毗邻和/或非毗邻的相邻块对其运动信息进行编译码。例如，在2018年6月8日提交的美国申请第16/003,269号中描述了非毗邻运动矢量预测。视频编译码器可以对非毗邻块应用FIFO规则和运动候选的最大缓冲器大小。

图6是示出基于父块的非毗邻块的示例选择的概念图。也就是说，父块是被分割成子块的块，包括当前块。例如，父块可以是CTU或CTU已被分割成的子块。类似于图5，在图6中，当前CU被标记为“Curr”，并且可以从中检索运动信息并用于预测当前CU的运动信息的非毗邻块被标记为“NA_i，j”。

除了运动矢量H和C(即，在同位(collocated)块的中心和右下角的运动矢量)之外，并同位的毗邻空域块的运动矢量可以用作合并模式的运动矢量预测(MVP)候选。

本公开的技术可以用于改进运动矢量预测，例如，通过添加用于AMVP和/或合并编译码模式的候选，其中所添加的候选可以取自非毗邻块。例如，所添加的候选可以对应于图6的NA_1,1至NA_1,9中的任何一个。

图7是示出编译码树单元(CTU)的期望的波前处理的示例的概念图。如图7所示，各种线程可以被分配来处理不同行的CTU。也就是说，视频编译码器，诸如视频编码器200或视频解码器300，在对不同的CTU行进行编译码时，可以执行多个不同的线程，用于例如波前并行处理(wavefront parallel processing，WPP)。在一些示例中，如果要从先前CTU行的最后一个块确定概率，例如，假设最后一个块还没有被编译码，则不能确定对帧间预测块的运动信息进行基于上下文编译码(例如，CABAC编译码)的某些概率。因此，根据本公开的技术，视频编码器200和视频解码器300可以在对CTU行进行编译码之前重置CTU行的CTU缓冲器，以确保CTU行可以被正确处理。

图8是示出用于HMVP的运动信息的示例的概念图。图8示出了FIFO的使用如何从候选列表中移除与当前块更接近的块的运动矢量，同时可以考虑其他块的运动矢量。特别地，在图8中，X表示当前正在被编译码的运动信息，并且阴影块的MV在历史缓冲器中。本公开认识到，至少部分由于FIFO规则的使用，传统的HMVP技术没有完全利用非毗邻块的运动矢量，如图8所示。

特别地，当块X被编译码时，左上CTU、上方CTU和右上CTU的非毗邻块(TL0、T0、T1、TR0、TR1、TR2、TR3)的运动信息已经从历史缓冲器中移除。因此，不考虑将这些块的运动信息添加到候选列表中，即使非毗邻块比例如CTU LL0、CTU LL1和CTU F0–F3(它们的运动矢量在历史缓冲器中)更靠近X。

本公开还认识到用于HVMP的单个缓冲器不适用于波前并行处理。如果只使用单个缓冲器，缓冲器的大小将非常大，以包含每个线程(例如，CTU行)中正在处理的块的潜在空域候选。例如，如果四个线程被设置为并行运行，缓冲器的大小可以达到64。结果，需要更多的比特来向视频解码器300信令通知MVP的索引。同样，可能会出现冗余条目。也就是说，历史缓冲器中的条目可能对该行中的块潜在地有用，但对其他行(例如，图8中的X和F)的块可能没有用。因此，可能很难找到块的最佳候选。

图9是示出被分割成多行编译码树单元(CTU)的图片的示例的概念图。特别地，在图9的示例中，图片150包括CTU行152A-152E(CTU行152)。CTU行152中的每一行包括各自的一组CTU：CTU行152A包括CTU 154A-154J，CTU行152B包括CTU 156A-156J，CTU行152C包括CTU 158A-158J，CTU行152D包括CTU 160A-160J，并且CTU行152E包括CTU 162A-162J。

视频编码器200和视频解码器300可以根据本公开的技术配置为对基于历史的MVP使用多个缓冲器。在一些示例中，视频编码器200和视频解码器300可以为CTU行152的每一行维护单独的历史MVP缓冲器(其中每个可以由单独的、各自的处理线程来处理)，或者当应用波前并行处理时，可以存在在每个CTU行的开头处重置的单个缓冲器。

在一个示例中，CTU 158C可以表示当前CTU。CTU 154A-154F、156A-156D、158A和158B(在图9中使用灰色阴影示出)的运动信息可以在一个或多个相应的历史MVP缓冲器中是可用的，以便在对CTU 158C的运动信息进行编译码时使用。

附加地或替代地，视频编码器200和视频解码器300可以单独或组合地使用以下技术中的任何一种或全部来执行历史MVP缓冲器的初始化。视频编码器200和视频解码器300可以将每个CTU行的历史MVP缓冲器重置为空。视频编码器200和视频解码器300可以用具有不同参考帧索引和/或帧间预测方向的零运动矢量或其他预定义或推导的运动信息来预填充每个CTU行的历史MVP缓冲器。视频编码器200和视频解码器300可以用来自同一时域层或更低时域层中的编译码的帧(图片)(对于当前帧/图片可用的参考图片)的运动信息来预填充每个CTU行的历史MVP缓冲器。

视频编码器200和视频解码器300可以例如基于时域距离缩放运动信息，或者处理/修改运动信息，例如将该运动信息与另一个MV组合。通常，视频编码器200和视频解码器300可以将运动信息与来自编译码的帧/图片中的先前历史MVP缓冲器的运动信息，或者编译码的帧/图片中的同位区域(可以是CTU，或者大于某个块大小，例如4×4块)的运动信息进行组合。当当前CTU的右上方CTU被编译码时，视频编码器200和视频解码器300可以预填充上方CTU行的历史MVP缓冲器。视频编码器200和视频解码器300可以使用具有不同参考帧索引和/或帧间预测方向的零运动矢量，或者其他预定义或推导的运动信息。

附加地或替代地，每当CTU行的CTU被编译码(编码或解码)时，视频编码器200和视频解码器300可以使用相关联的历史MVP缓冲器来初始化或修改当前CTU行以下的CTU行的历史缓冲器。

附加地或替代地，视频编码器200和视频解码器300可以应用FIFO规则来从相关联的历史MVP缓冲器中移除条目。

附加地或替代地，当相关联的CTU行被完全编码/解码时，视频编码器200和视频解码器300可以清除历史MVP缓冲器。

视频编码器200和视频解码器300可以维护比AMVP/合并或其他模式候选列表更大的MVP缓冲器大小。缓冲器中的任何一个MV或多个MV可被选择作为用于某一模式(例如AMPV、合并模式、仿射或任何其他帧间模式)的候选列表的(多个)MV候选。可以定义如何从缓冲器中选择MV的规则，例如，取出最后添加到缓冲器中的N个MV，或者从缓冲器的开头取出一些MV，和/或从缓冲器的中间取出一些MV，和/或从缓冲器的末尾取出一些MV。可选地，可以应用信令通知来指示选择了哪些MV(例如，视频编码器200可以编码信令通知的数据，并且视频解码器300可以解码信令通知的数据)。MVP缓冲器大小可以在任何参数集(例如，视频参数集、序列参数集、图片参数集等)、条带报头或其他地方里被信令通知。MVP缓冲器可以与条带、图片和/或视频序列相关联。

当视频编码器200和视频解码器300处理帧间编译码的块时，块中使用的MV可以被添加到MVP缓冲器中，并且只有唯一的MV可以被保留在缓冲器中。当缓冲器已满时，可以在添加新的MV时从缓冲器中移除旧的MV。可以有一个规则，通过该规则可以将MV添加到缓冲器中，例如，仅可以添加信令通知的MV(诸如在AMVP模式中)，并且如果在合并模式中对块进行编译码，则该块的MV不被添加到缓冲器中。

视频编码器200和视频解码器300可以向缓冲器中已经存在的一个或多个MV附加(append)MV。例如，如果缓冲器中已经存在的MV是单向的，则当添加新MV时，可以通过附加新MV来将那些存在的MV修改为双向的。

在添加新MV时，可以应用一些MV处理。例如，如果新的MV接近(close)缓冲器中已经存在的MV，则可以移除那些接近的MV。接近可能是指通过比较MV分量值(例如x分量和y分量)的接近。在一些示例中，只有与缓冲器中已存在的MV相差一个阈值的MV才可以添加到缓冲器中。可以为不同的缓冲器配置相同的阈值。

缓冲器中的运动矢量可以是单向的(L0或L1)、双向的或任何其他运动模型MV。

模式信息可以与缓冲器中的MV相关联，并且如果缓冲器中的MV的索引在块中被信令通知或者应用关于从缓冲器获得MV的其他规则，则模式信息可以从与该MV信息相关联的数据中推导。例如，如果该信息是合并模式，则在合并模式下用指示的MV对该块进行编译码。

本公开还认识到，传统的基于历史MVP仅保存常规运动预测子，并且仅用于常规运动预测，而无需修改运动信息。根据本公开的技术，视频编码器200和视频解码器300可以使用至少一个历史MVP缓冲器，该历史MVP缓冲器不仅保存编译码的运动信息，还保存其他类型的运动预测子，例如仿射运动模型、块内复制模式的运动信息、局部照度补偿的运动信息、子块MVP或时域运动预测子。

附加地或替代地，视频编码器200和视频解码器300可以为不同的运动模型使用多个历史MVP缓冲器，诸如仿射运动模型、块内复制模式的运动信息、局部照度补偿的运动信息、子块MVP或时域运动预测子。

附加地或替代地，基于当前MVP和其他运动预测子(诸如其他空域MVP或时域MVP)的合成运动矢量也可以被添加到候选列表。

附加地或替代地，视频编码器200和视频解码器300可以从历史MVP缓冲器中的两个或更多个MVP或历史MVP缓冲器中的一个或多个MVP与其他类型的MVP(诸如空域或时域MVP)生成合成MVP。

视频编码器200和视频解码器300可以实施块分割方案。在HEVC中，图片被分成一系列的编译码树单元(CTU)。对于具有三个样点阵列的图片，CTU包括N×N的亮度样点块以及两个相应的色度样点块。通过使用树结构，CTU被划分成编译码单元(CU)。根据PU划分类型，每个叶CU可以进一步划分成一个、两个或四个预测单元(PU)。在通过应用基于PU划分类型的预测处理获得残差块之后，可以将叶CU分割成变换单元(TU)。

在VVC中，使用二叉树和三叉树划分分段结构的具有嵌套多类型树的四叉树取代了多个分割单元类型的概念，即嵌套多类型树分割消除了CU、PU和TU概念的分离，除非需要其大小对于最大变换长度来说太大的CU，并支持CU分割形状的更大灵活性。在编译码树结构中，CU可以是正方形或矩形。

视频编码器200和视频解码器300可以利用运动信息来预测视频数据的块。对于每个块，一组运动信息可以是可用的。该组运动信息包含对于前向和后向预测方向的运动信息。这里，前向和后向预测方向是与当前图片或条带的参考图片列表0(RefPicList0)和参考图片列表1(RefPicList1)相对应的两个预测方向。术语“前向”和“后向”不一定具有几何意义。相反，它们用于区分运动矢量是基于哪个参考图片列表。前向预测是指基于参考列表0形成的预测，而后向预测是指基于参考列表1形成的预测。在参考列表0和参考列表1两者都用于形成给定块的预测的情况下，这被称为双向预测。

对于给定的图片或条带，如果仅使用一个参考图片列表，则图片或条带内的每个块都是前向预测的。如果两个参考图片列表都用于给定的图片或条带，则图片或条带内的块可以是前向预测、后向预测或双向预测。

对于每个预测方向，运动信息包含参考索引和运动矢量。参考索引用于识别相应参考图片列表(例如，RefPicList0或RefPicList1)中的参考图片。运动矢量具有水平分量和垂直分量两者，每个分量分别表示沿水平和垂直方向的偏移值。在一些描述中，为简单起见，“运动矢量”一词可与运动信息互换使用，以指示运动矢量及其相关联的参考索引两者。

图片顺序计数(picture order count，POC)在视频编译码标准中被广泛用于识别图片的显示顺序。虽然在一个编译码的视频序列中的两个图片可能具有相同的POC值，但是在编译码的视频序列中一般不会发生这种情况。当比特流中呈现多个编译码的视频序列时，具有相同POC值的图片在解码顺序方面可能彼此更接近。

在HEVC中，有两种帧间预测模式，对于PU，分别命名为合并模式(其中跳过被认为是合并模式的特殊情况)和高级运动矢量预测(AMVP)模式。

在AMVP或合并模式下，为多个运动矢量预测子维护运动矢量(MV)候选列表。通过从MV候选列表中取出一个候选来生成当前PU的(多个)运动矢量以及合并模式下的参考索引。

MV候选列表最多包含对于合并模式的5个候选，并且对于AMVP模式只有两个候选。合并候选可以包含一组运动信息，例如与参考图片列表(列表0和列表1)两者相对应的运动矢量和参考索引。如果通过合并索引来识别合并候选，则参考图片被用于当前块的预测，并且相关联的运动矢量被确定。然而，在AMVP模式下，对于来自列表0或列表1的每个潜在预测方向，参考索引与MV候选列表的MVP索引一起被显式地信令通知，因为AMVP候选仅包含运动矢量。在AMVP模式下，可以进一步细化预测的运动矢量。

如上所述，合并候选对应于一组完整的运动信息，而AMVP候选仅包含对于特定预测方向的一个运动矢量和参考索引。两种模式的候选可以从相同的空域和时域相邻块中类似地推导。

图10A和图10B是示出用于合并模式和高级运动矢量预测(AMVP)模式的示例空域相邻运动矢量候选的框图。图10A示出了用于合并模式的空域相邻MV候选的示例，并且图10B示出了用于AMVP模式的空域相邻MV候选的示例。如图10A和图10B所示，从相邻块中推导空域MV候选。对于特定的PU(PU0)，从块中生成候选的方法对于合并模式和AMVP模式是不同的。

在合并模式下，可以按照图10A所示的顺序推导多达四个空域MV候选。具体来说，顺序如下：左侧(0)、上方(1)、右上方(2)、左下方(3)和左上方(4)，如图10A所示。

在AVMP模式下，相邻块被分成两组。第一组是包括块0和1的左侧组。第二组是包括块2、3和4的上方组，如图10B所示。对于每一个组，相邻块中的潜在候选(其参考与信令通知的参考索引所指示的参考图片相同的参考图片)具有最高的优先级以被选择来形成该组的最终候选。有可能所有相邻块不包含指向相同参考图片的运动矢量。因此，如果不能找到这种候选，则第一个可用的候选将被缩放以形成最终的候选，从而可以补偿时域距离差异。

图11A和图11B是示出时域运动矢量预测(TMPV)候选的概念图。图11A示出了TMVP候选的示例。TMVP候选(如果启用且可用的话)被添加到MV候选列表中的空域运动矢量候选之后。对于合并模式和AMVP模式，TMVP候选的运动矢量推导过程是相同的，但是在合并模式中，TMVP候选的目标参考索引总是设置为0。

用于TMVP候选推导的主块位置是如图11A中块“T”所示的同位的PU外部的右下块，以补偿用于生成空域相邻候选的左和上块的偏置。但是，如果该块位于当前CTB行之外，或者运动信息不可用，则该块被PU的中心块替换。

TMVP候选的运动矢量是从同位图片的同位PU推导的，以条带层级指示。同位PU的运动矢量称为同位MV。

图11B示出了MV缩放的示例。为了推导TMVP候选运动矢量，可能需要缩放同位MV以补偿时域距离差异，如图11B所示。

合并模式和AMVP模式的其他几个方面值得如下一提。例如，视频编码器200和视频解码器300可以执行运动矢量缩放。假设运动矢量的值与呈现时间中图片的距离成比例。运动矢量将两个图片相关联，即参考图片和包含运动矢量的图片(即含有(containing)图片)。当利用运动矢量来预测另一个运动矢量时，基于图片顺序计数(POC)值来计算含有图片和参考图片的距离。

对于要预测的运动矢量，其相关的含有图片和参考图片可能不同。因此，计算新的距离(基于POC)。并且基于这两个POC距离来缩放运动矢量。对于空域相邻候选，两个运动矢量的含有图片是相同的，而参考图片是不同的。在HEVC中，对于空域和时域相邻候选，运动矢量缩放应用于TMVP和AMVP两者。

作为另一个示例，视频编码器200和视频解码器300可以执行人工(artificial)运动矢量候选生成。如果运动矢量候选列表不完整，则生成人工运动矢量候选，并将其***列表的末端，直到该列表具有所有候选。

在合并模式下，有两种类型的人工MV候选：仅为B条带推导的组合候选和仅用于AMVP的零候选(如果第一种类型没有提供足够的人工候选)。对于已经在候选列表中并且具有必要的运动信息的每对候选，通过参考列表0中的图片的第一候选的运动矢量和参考列表1中的图片的第二候选的运动矢量的组合来推导双向组合运动矢量候选。

作为另一个示例，视频编码器200和视频解码器300可以为候选***执行修剪处理。来自不同块的候选可能碰巧是相同的，这降低了合并/AMVP候选列表的效率。应用修剪处理来解决这个问题。它将一个候选与当前候选列表中的其他候选进行比较，以避免在一定程度上***相同的候选。为了降低复杂性，只应用有限数量的修剪处理，而不是将每个潜在的候选与所有其他现有的候选进行比较。如果适用，则仅应用以下比较：将上方的合并候选与左边的合并候选进行比较、将右上方的合并候选与上方的合并候选进行比较、将左下方的合并候选与左侧的合并候选进行比较，将左上方的合并候选与左侧的合并候选和上方的合并候选进行比较。

视频编码器200和视频解码器300也可以使用其他运动预测方法。在多功能视频编译码(VCC)的发展过程中，L.Zhang等人的“CE4相关：History-based Motion VectorPrediction”，联合视频专家组文件：JVET-K0104(以下简称“K0104”)提出了一种基于历史的运动矢量预测(HMVP)方法。HMVP方法允许每个块，除了那些紧邻的因果相邻运动场之外，从过去解码的MV列表中找到它的MV预测子。在编码/解码处理期间维护具有多个HMVP候选的表。当遇到新的条带时，表被清空。每当存在帧间编译码的块时，相关联的运动信息以先进先出(FIFO)的方式、作为新的HMVP候选被***到表中。然后，可以应用约束FIFO规则。当向表中***HMVP时，可以首先应用冗余校验来发现表中是否有相同的HMVP。如果找到，可以从表中移除该特定的HMVP，之后会移动所有HMVP候选。

在合并候选列表构建过程中，可以使用HMVP候选。例如，从表中最后一个条目到第一个条目的所有HMVP候选可以被***在TMVP候选之后。修剪可以应用于HMVP候选。一旦可用合并候选的总数达到信令通知的最大允许合并候选，合并候选列表构建过程就终止。

同样，在AMVP候选列表构建过程中也可以使用HMVP候选。表中最后K个HMVP候选的运动矢量可以***到TMVP候选之后。在一些示例中，只有具有与AMVP目标参考图片相同的参考图片的HMVP候选被用于构建AMVP候选列表。修剪可以应用于HMVP候选。

在HEVC，当前CTU的编译码可能仅取决于左侧、左上方、上方和右上方的CTU。因此，波前并行处理(WPP)可以在HEVC得到支持。然而，K0104中的HMVP方法可能会导致当前块和条带中所有先前编译码的CTU之间的依赖性。因此，如果使用HMVP方法，可能不会应用WPP。本公开描述了关于使用具有CTU初始化的HMVP的技术，其中依赖性保持与HEVC中相同。本公开还描述了关于具有CTU行初始化(复位)的HMVP的技术。

根据本公开的技术，视频编码器200和视频解码器300可以执行具有CTU初始化的HMVP。HMVP表在每个CTU开始时初始化。初始化可以将来自当前CTU的紧邻的编译码的块的MV添加到HMVP表中。与HEVC一样，紧邻的编译码的块可以在当前CTU的左侧、上方、左上方或右上方。如果启用时域运动矢量预测，则紧邻的编译码的块也可以是参考图片中的同位块。

图12是示出编译码树单元(CTU)和相邻块的示例的框图。在一个示例中，仅当前CTU块的空域和时域合并候选被用于初始化HMVP表。图12中示出了使用HEVC空域和时域合并候选的示例。***顺序如下：左侧(0)、上方(1)、右上方(2)和左上方(4)。时域合并候选的位置由“T”指示。请注意，右下方时域合并候选和左下方(3)候选不可用，因为它们的位置低于当前CTU行。

在另一个示例中，当前CTU块的合并候选推导过程用于初始化HMVP表。除了空域和时域合并候选之外，其他合并候选(例如人工运动矢量候选)也可以用于初始化。

图13是示出当前CTU中的当前CU的框图。在一些示例中，在对当前CTU进行编译码的开始处，HMVP表被初始化为空。然而，在第一CU被编译码之后，第一CU的空域和时域合并候选被添加到HMVP表中，如图13所示。然后，如果第一CU是帧间预测编译码的，则第一CU的MV也被添加。注意，如果第一CU不等于当前CTU，则可以依次添加两个时域合并候选“T0”和“T1”。图13示出了CTU中第一CU的合并候选的示例。

在另一个示例中，在对当前CTU进行编译码的开始处，HMVP表被初始化为空。然而，在第一CU被编译码之后，第一CU的所有合并候选被添加到HMVP表中。然后如果第一CU是帧间预测编译码的，第一CU的MV也会被添加。

视频编码器200和视频解码器300也可以执行具有CTU行初始化的HMVP。在另一个示例中，上述HMVP的CTU初始化仅应用于CTU行中的第一CTU。类似于K0104中的HMVP，修剪处理可以应用于初始化的表，以移除一些或所有重复项。修剪处理也可以不应用于初始化的表以降低复杂性。

图14是示出可以执行本公开的技术的示例视频编码器200的框图。图14是出于解释的目的而提供的，并且不应被认为是对本公开中广泛示例和描述的技术的限制。出于解释的目的，本公开在视频编译码标准(诸如HEVC视频编译码标准和正在开发的H.266视频编译码标准)的上下文下描述了视频编码器200。然而，本公开的技术不限于这些视频编译码标准，并且通常适用于视频编码和解码。

在图14的示例中，视频编码器200包括视频数据存储器230、模式选择单元202、残差生成单元204、变换处理单元206、量化单元208、逆量化单元210、逆变换处理单元212、重构单元214、滤波单元216、解码图片缓冲器(decoded picture buffer，DPB)218和熵编码单元220。视频数据存储器230、模式选择单元202、残差生成单元204、变换处理单元206、量化单元208、逆量化单元210、逆变换处理单元212、重构单元214、滤波单元216、DPB218和熵编码单元220中的任何一个或全部可以在一个或多个处理器或处理电路******中实施。此外，视频编码器200可以包括附加的或替代的处理器或处理电路******来执行这些和其他功能。

视频数据存储器230可以存储要由视频编码器200的组件编码的视频数据。视频编码器200可以从例如视频源104(图1)接收存储在视频数据存储器230中的视频数据。DPB218可以充当参考图片存储器，其存储参考视频数据，用于视频编码器200对后续视频数据的预测。视频数据存储器230和DPB 218可以由各种存储器设备中的任何一种形成，诸如动态随机存取存储器(DRAM)，包括同步DRAM(SDRAM)、磁阻RAM(MRAM)、电阻RAM(RRAM)或其他类型的存储器设备。视频数据存储器230和DPB 218可以由相同的存储器设备或单独的存储器设备提供。在各种示例中，视频数据存储器230可以与视频编码器200的其他组件在片上(on-chip)，如图所示，或者相对于那些组件在片外(off-chip)。

在本公开中，对视频数据存储器230的参考不应被解释为限于视频编码器200内部的存储器，除非具体如此描述，或者限于视频编码器200外部的存储器，除非具体如此描述。相反，对视频数据存储器230的参考应该理解为存储视频编码器200接收用于编码的视频数据(例如，要被编码的当前块的视频数据)的参考存储器。图1的存储器106还可以提供来自视频编码器200的各个单元的输出的临时存储。

示出图14的各个单元以帮助理解视频编码器200执行的操作。这些单元可以实施为固定功能电路、可编程电路或其组合。固定功能电路是指提供特定功能的电路，并预设在可执行的操作上。可编程电路是指可被编程以执行各种任务并在可执行的操作中提供灵活功能性的电路。例如，可编程电路可以执行软件或固件，使得可编程电路以软件或固件的指令定义的方式操作。固定功能电路可以执行软件指令(例如，接收参数或输出参数)，但是固定功能电路执行的操作类型通常是不可变的。在一些示例中，一个或多个单元可以是不同的电路块(固定功能的或可编程的)，并且在一些示例中，一个或多个单元可以是集成电路。

视频编码器200可以包括由可编程电路形成的算术逻辑单元(arithmetic logicunits，ALU)、基本功能单元(elementary function units，EFU)、数字电路、模拟电路和/或可编程核心。在使用由可编程电路执行的软件来执行视频编码器200的操作的示例中，存储器106(图1)可以存储视频编码器200接收和执行的软件的目标代码，或者视频编码器200内的另一个存储器(未示出)可以存储这样的指令。

视频数据存储器230被配置为存储接收的视频数据。视频编码器200可以从视频数据存储器230检索视频数据的图片，并将该视频数据提供给残差生成单元204和模式选择单元202。视频数据存储器230中的视频数据可以是待编码的原始视频数据。

模式选择单元202包括运动估计单元222、运动补偿单元224和帧内预测单元226。模式选择单元202可以包括附加的功能单元，以根据其他预测模式来执行视频预测。作为示例，模式选择单元202可以包括调色板(palette)单元、块内复制单元(其可以是运动估计单元222和/或运动补偿单元224的一部分)、仿射单元、线性模型(linear model，LM)单元等。

模式选择单元202通常协调多个编码遍次(encoding pass)，以测试编码参数的组合以及这种组合的结果速率失真值。编码参数可以包括从CTU到CU的分割、CU的预测模式、CU的残差数据的变换类型、CU的残差数据的量化参数等。模式选择单元202可以最终选择具有比其他测试组合更好的速率失真值的编码参数的组合。

视频编码器200可以将从视频数据存储器230中检索到的图片分割成一系列CTU，并将一个或多个CTU封装在一个条带内。模式选择单元202可以根据树结构，诸如上述HEVC的四叉树结构或QTBT结构，来分割图片的CTU。如上所述，视频编码器200可以根据树结构通过分割CTU来形成一个或多个CU。这样的CU也可以通常被称为“视频块”或“块”。

通常，模式选择单元202还控制其组件(例如，运动估计单元222、运动补偿单元224和帧内预测单元226)，以生成当前块的预测块(例如，当前CU，或者在HEVC中，PU和TU的重叠部分)。对于当前块的帧间预测，运动估计单元222可以执行运动搜索以识别一个或多个参考图片(例如，存储在DPB218中的一个或多个先前编译码的图片)中的一个或多个紧密匹配的参考块。特别地，运动估计单元222可以例如根据绝对差值总和(SAD)、平方差总和(SSD)、平均绝对差值(MAD)、均方差值(MSD)等来计算表示潜在参考块与当前块有多相似的值。运动估计单元222通常可以使用当前块和所考虑的参考块之间的逐样点的差值来执行这些计算。运动估计单元222可以识别具有由这些计算产生的最低值的参考块，指示最紧密匹配当前块的参考块。

运动估计单元222可以形成一个或多个运动矢量(MV)，该运动矢量定义参考图片中的参考块相对于当前图片中的当前块的位置的位置。运动估计单元222然后可以向运动补偿单元224提供运动矢量。例如，对于单向帧间预测，运动估计单元222可以提供单个运动矢量，而对于双向帧间预测，运动估计单元222可以提供两个运动矢量。运动补偿单元224然后可以使用运动矢量生成预测块。例如，运动补偿单元224可以使用运动矢量来获取参考块的数据。作为另一个示例，如果运动矢量具有分数采样精度，则运动补偿单元224可以根据一个或多个插值滤波器对预测块的值进行插值。此外，对于双向帧间预测，运动补偿单元224可以获取由相应运动矢量识别的两个参考块的数据，并例如通过逐样点平均或加权平均来组合所获取的数据。

根据本公开的技术，解码图片缓冲器218可以包括一个或多个用于CTU行的历史MVP缓冲器。也就是说，每个CTU行可以被分配其自己的MVP缓冲器，或者单个MVP缓冲器可以用于多个CTU行。在任何情况下，视频编码器200可以在解码CTU行的视频数据开始时，重置该CTU行的MVP缓冲器。运动补偿单元224或视频编码器200的另一个单元可以被配置为仅向MVP缓冲器存储唯一的运动矢量。如上所述，运动补偿单元224或视频编码器200的另一单元可以被配置为使用FIFO规则来管理存储在MVP缓冲器中的运动信息，使得当向MVP缓冲器添加运动矢量时，如果MVP缓冲器满了，则运动补偿单元224可以从MVP缓冲器中移除最早添加的运动矢量。在一些示例中，视频编码器200可以为各种运动模型中的每一个维护不同的相应MVP缓冲器，例如仿射运动模型、块内复制模式的运动信息、局部照度补偿的运动信息、子块MVP和时域运动预测。

作为另一示例，对于帧内预测或帧内预测编译码，帧内预测单元226可以从与当前块相邻的样点生成预测块。例如，对于方向模式，帧内预测单元226通常可以算术地组合相邻样点的值，并且跨当前块在定义的方向上填充这些计算值，以产生预测块。作为另一个示例，对于DC模式，帧内预测单元226可以计算当前块的相邻样点的平均值，并且生成预测块以包括预测块的每个样点的结果平均值。

模式选择单元202将预测块提供给残差生成单元204。残差生成单元204从视频数据存储器230接收当前块的原始、未编译码的版本，以及从模式选择单元202接收预测块。残差生成单元204计算当前块和预测块之间的逐样点差值。得到的逐样点差值定义了当前块的残差块。在一些示例中，残差生成单元204还可以确定残差块中的样点值之间的差值，以使用残差差分脉冲编译码调制(residual differential pulse code modulation，RDPCM)来生成残差块。在一些示例中，残差生成单元204可以使用执行二进制减法的一个或多个减法器电路来形成。

在模式选择单元202将CU分割成PU的示例中，每个PU可以与亮度预测单元和相应的色度预测单元相关联。视频编码器200和视频解码器300可以支持具有各种大小的PU。如上所述，CU的大小可以是指CU的亮度编译码块的大小，并且PU的大小可以是指PU的亮度预测单元的大小。假设特定CU的大小为2N×2N，视频编码器200可以支持用于帧内预测的2N×2N或N×N的PU大小，以及用于帧间预测的2N×2N、2N×N、N×2N、N×N或类似的对称PU大小。视频编码器200和视频解码器300还可以支持用于帧间预测的2N×nU、2N×nD、nL×2N和nR×2N的PU大小的非对称分割。

在模式选择单元没有进一步将CU分割为PU的示例中，每个CU可以与亮度编译码块和相应的色度编译码块相关联。如上所述，CU的大小可以是指CU的亮度编译码块的大小。视频编码器200和视频解码器120可以支持2N×2N、2N×N或N×2N的CU大小。

对于其他视频编译码技术，诸如块内复制模式编译码、仿射模式编译码和线性模型(LM)模式编译码，作为少数示例，模式选择单元202，经由与编译码技术相关联的相应单元，为正在编码的当前块生成预测块。在一些示例中，诸如调色板模式编译码，模式选择单元202可以不生成预测块，而是生成指示基于所选调色板而重构块的方式的语法元素。在这种模式下，模式选择单元202可以将这些语法元素提供给熵编码单元220进行编码。

如上所述，残差生成单元204接收当前块的视频数据和相应预测块。残差生成单元204然后为当前块生成残差块。为了生成残差块，残差生成单元204计算预测块和当前块之间的逐样点差值。

变换处理单元206对残差块应用一个或多个变换，以生成变换系数的块(本文称为“变换系数块”)。变换处理单元206可以对残差块应用各种变换，以形成变换系数块。例如，变换处理单元206可以对残差块应用离散余弦变换(discrete cosine transform，DCT)、方向变换、卡尔亨-洛夫变换(Karhunen-Loeve transform，KLT)或概念上类似的变换。在一些示例中，变换处理单元206可以对残差块执行多个变换，例如主变换和次变换，诸如旋转变换。在一些示例中，变换处理单元206不对残差块应用变换。

量化单元208可以量化变换系数块中的变换系数，以产生量化的变换系数块。量化单元208可以根据与当前块相关联的量化参数(quantization parameter，QP)值来量化变换系数块的变换系数。视频编码器200(例如，经由模式选择单元202)可以通过调整与CU相关联的QP值来调整应用于与当前块相关联的变换系数块的量化程度。量化可以引入信息损失，因此，量化的变换系数可以比由变换处理单元206产生的原始变换系数具有更低的精度。

逆量化单元210和逆变换处理单元212可以分别对量化的变换系数块应用逆量化和逆变换，以从变换系数块重构残差块。重构单元214可以基于重构的残差块和由模式选择单元202生成的预测块来产生对应于当前块的重构块(尽管可能具有一定程度的失真)。例如，重构单元214可以将重构的残差块的样点添加到由模式选择单元202生成的预测块的对应样点中，以产生重构的块。

滤波单元216可以对重构的块执行一个或多个滤波操作。例如，滤波单元216可以执行去块操作以减少沿CU边缘的块效应伪影(blockiness artifacts)。在一些示例中，可以跳过滤波单元216的操作。

视频编码器200在DPB 218中存储重构的块。例如，在不需要滤波单元216的操作的示例中，重构单元214可以将重构的块存储到DPB 218。在需要滤波单元216的操作的示例中，滤波单元216可以将滤波后的重构块存储到DPB 218。运动估计单元222和运动补偿单元224可以从DPB 218中检索参考图片，该参考图片由重构的(并且潜在滤波的)块形成，以对随后编码的图片的块进行帧间预测。此外，帧内预测单元226可以使用当前图片的DPB 218中的重构块来对当前图片中的其他块进行帧内预测。

通常，熵编码单元220可以对从视频编码器200的其他功能组件接收的语法元素进行熵编码。例如，熵编码单元220可以对来自量化单元208的量化的变换系数块进行熵编码。作为另一个示例，熵编码单元220可以对来自模式选择单元202的预测语法元素(例如，用于帧间预测的运动信息或用于帧内预测的帧内模式信息)进行熵编码。熵编码单元220可以对作为视频数据的另一示例的语法元素执行一个或多个熵编码操作，以生成熵编码的数据。例如，熵编码单元220可以对数据执行上下文自适应可变长度编译码(CAVLC)操作、CABAC操作、变量到变量(V2V)长度编译码操作、基于语法的上下文自适应二进制算术编译码(SBAC)操作、概率区间分割熵(Probability Interval Partitioning Entropy，PIPE)编译码操作、指数-戈伦(Exponential-Golomb)编码操作或另一种类型的熵编码操作。在一些示例中，熵编码单元220可以在语法元素未被熵编码的旁路(bypass)模式下操作。

视频编码器200可以输出包括重构条带或图片的块所需的熵编码语法元素的比特流。特别地，熵编码单元220可以输出比特流。

以上描述的操作是相对于块描述的。这种描述应该理解为亮度编译码块和/或色度编译码块的操作。如上所述，在一些示例中，亮度编译码块和色度编译码块是CU的亮度分量和色度分量。在一些示例中，亮度编译码块和色度编译码块是PU的亮度分量和色度分量。

在一些示例中，对于色度编译码块，不需要重复针对亮度编译码块执行的操作。作为一个示例，识别亮度编译码块的运动矢量(MV)和参考图片的操作不需要为了识别色度块的MV和参考图片而重复。相反，亮度编译码块的MV可以被缩放以确定色度块的MV，并且参考图片可以是相同的。作为另一个示例，对于亮度编译码块和色度编译码块，帧内预测过程可以是相同的。

视频编码器200表示被配置为对视频数据进行编码的设备的示例，该设备包括被配置为存储视频数据的存储器，以及在电路***中实施的一个或多个处理单元，该一个或多个处理单元被配置为将第一编译码树单元(CTU)行的运动信息存储在存储器的第一历史运动矢量预测子(MVP)缓冲器中，并将第二CTU行的运动信息存储在存储器的第二历史MVP缓冲器中，第二CTU行不同于第一CTU行。

视频编码器200还表示被配置为对视频数据进行编码的设备的示例，该设备包括被配置为存储视频数据的存储器，以及在电路***中实施的一个或多个处理单元，该一个或多个处理单元被配置为将编译码的运动信息存储到历史运动矢量预测子(MVP)缓冲器，将不同类型的运动信息存储到历史MVP缓冲器，并且使用历史MVP缓冲器的运动信息来对视频数据的块的运动信息进行编译码。

视频编码器200还表示被配置为对视频数据进行编码的设备的示例，该设备包括被配置为存储视频数据的存储器，以及在电路***中实施的一个或多个处理单元，并且该一个或多个处理单元被配置为将多种不同类型的运动信息存储在相应的不同的历史运动矢量预测子(MVP)缓冲器中。

图15是示出可以执行本公开的技术的示例视频解码器300的框图。图15是出于解释的目的而提供的，并不限制本公开中广泛例示和描述的技术。出于解释的目的，本公开描述了根据JEM和HEVC的技术的视频解码器300。然而，本公开的技术可以由根据其他视频编译码标准配置的视频编译码设备来执行。

在图15的示例中，视频解码器300包括编译码图片缓冲器(coded picturebuffer，CPB)存储器320、熵解码单元302、预测处理单元304、逆量化单元306、逆变换处理单元308、重构单元310、滤波单元312和解码图片缓冲器(decoded picture buffer，DPB)314。CPB存储器320、熵解码单元302、预测处理单元304、逆量化单元306、逆变换处理单元308、重构单元310、滤波单元312和DPB 314中的任何一个或全部可以在一个或多个处理器或处理电路***中实施。此外，视频解码器300可以包括附加的或替代的处理器或处理电路***来执行这些和其他功能。

预测处理单元304包括运动补偿单元316和帧内预测单元318。预测处理单元304可以包括附加单元，以根据其他预测模式执行预测。作为示例，预测处理单元304可以包括调色板单元、块内复制单元(其可以形成运动补偿单元316的一部分)、仿射单元、线性模型(LM)单元等。在其他示例中，视频解码器300可以包括更多、更少或不同的功能组件。

CPB存储器320可以存储要由视频解码器300的组件解码的视频数据，诸如编码的视频比特流。存储在CPB存储器320中的视频数据可以例如从计算机可读介质110(图1)获得。CPB存储器320可以包括存储来自编码的视频比特流的编码的视频数据(例如，语法元素)的CPB。此外，CPB存储器320可以存储除编译码的图片的语法元素之外的视频数据，诸如表示来自视频解码器300的各个单元的输出的临时数据。DPB 314通常存储解码的图片，当对编码的视频比特流的后续数据或图片进行解码时，视频解码器300可以输出和/或用作参考视频数据。CPB存储器320和DPB 314可以由各种存储器设备中的任何一种形成，诸如动态随机存取存储器(DRAM)，包括同步DRAM(SDRAM)、磁阻RAM(MRAM)、电阻RAM(RRAM)或其他类型的存储器设备。CPB存储器320和DPB 314可以由相同的存储器设备或单独的存储器设备提供。在各种示例中，CPB存储器320可以与视频解码器300的其他组件在片上，或者相对于这些组件在片外。

附加地或替代地，在一些示例中，视频解码器300可以从存储器120(图1)检索编译码的视频数据。也就是说，存储器120可以如上所述利用CPB存储器320存储数据。同样，当视频解码器300的一些或全部功能以由视频解码器300的处理电路***执行的软件实施时，存储器120可以存储由视频解码器300执行的指令。

图15中所示的各种单元被示出以帮助理解视频解码器300执行的操作。这些单元可以实施为固定功能电路、可编程电路或其组合。类似于图14，固定功能电路是指提供特定功能性的电路，并且被预设在可执行的操作上。可编程电路是指可被编程以执行各种任务并在可执行的操作中提供灵活功能性的电路。例如，可编程电路可以执行软件或固件，使得可编程电路以软件或固件的指令定义的方式操作。固定功能电路可以执行软件指令(例如，接收参数或输出参数)，但是固定功能电路执行的操作类型通常是不可变的。在一些示例中，一个或多个单元可以是不同的电路块(固定功能的或可编程的)，并且在一些示例中，一个或多个单元可以是集成电路。

视频解码器300可以包括ALU、EFU、数字电路、模拟电路和/或由可编程电路形成的可编程核心。在视频解码器300的操作由在可编程电路上执行的软件来执行的示例中，片上或片外存储器可以存储视频解码器300接收和执行的软件的指令(例如，目标代码)。

熵解码单元302可以从CPB接收编码的视频数据，并对视频数据进行熵解码以再现语法元素。预测处理单元304、逆量化单元306、逆变换处理单元308、重构单元310和滤波单元312可以基于从比特流提取的语法元素来生成解码的视频数据。

通常，视频解码器300在逐块的基础上重构图片。视频解码器300可以对每个块独立地执行重构操作(其中当前正在重构，即解码的块可以被称为“当前块”)。

熵解码单元302可以对定义量化变换系数块的量化变换系数的语法元素进行熵解码，以及变换信息，诸如量化参数(quantization parameter，QP)和/或(多个)变换模式指示。逆量化单元306可以使用与量化的变换系数块相关联的QP来确定量化程度，并且类似地，确定要应用的逆量化单元306的逆量化程度。逆量化单元306可以例如执行逐位左移操作来逆量化量化的变换系数。逆量化单元306由此可以形成包括变换系数的变换系数块。

在逆量化单元306形成变换系数块之后，逆变换处理单元308可以对变换系数块应用一个或多个逆变换，以生成与当前块相关联的残差块。例如，逆变换处理单元308可以对系数块应用逆DCT、逆整数变换、逆卡尔亨-洛夫变换(KLT)、逆旋转变换、逆方向变换或另一逆变换。

此外，预测处理单元304根据由熵解码单元302熵解码的预测信息语法元素生成预测块。例如，如果预测信息语法元素指示当前块是帧间预测的，则运动补偿单元316可以生成预测块。在这种情况下，预测信息语法元素可以指示从中检索参考块的DPB 314中的参考图片，以及识别参考图片中的参考块相对于当前图片中的当前块的位置的运动矢量。运动补偿单元316通常可以以基本上类似于关于运动补偿单元224(图14)所描述的方式来执行帧间预测处理。

根据本公开的技术，解码图片缓冲器314可以包括一个或多个对于CTU行的历史MVP缓冲器。也就是说，每个CTU行可以被分配其自己的MVP缓冲器，或者单个MVP缓冲器可以用于多个CTU行。在任何情况下，视频解码器300可以在对CTU行的视频数据进行编码的开始处，重置对于CTU行的MVP缓冲器。运动补偿单元316或视频解码器300的另一个单元可以被配置为仅向MVP缓冲器存储唯一的运动矢量。如上所述，运动补偿单元316或视频解码器300的另一个单元可以被配置为使用FIFO规则来管理存储在MVP缓冲器中的运动信息，使得当向MVP缓冲器添加运动矢量时，如果MVP缓冲器满了，则运动补偿单元316可以从MVP缓冲器中移除最早添加的运动矢量。在一些示例中，视频解码器300可以为各种运动模型(诸如，例如仿射运动模型、块内复制模式的运动信息、局部照度补偿的运动信息、子块MVP和时域运动预测)中的每一个维护不同的相应MVP缓冲器。

作为另一示例，如果预测信息语法元素指示当前块是帧内预测的，则帧内预测单元318可以根据由预测信息语法元素指示的帧内预测模式来生成预测块。同样，帧内预测单元318通常可以以基本上类似于关于帧内预测单元226(图14)描述的方式来执行帧内预测过程。帧内预测单元318可以从DPB314检索当前块的相邻样点的数据。

重构单元310可以使用预测块和残差块来重构当前块。例如，重构单元310可以将残差块的样点添加到预测块的对应样点，以重构当前块。

滤波单元312可以对重构的块执行一个或多个滤波操作。例如，滤波单元312可以执行去块操作以减少沿着重构块的边缘的块效应伪影。滤波单元312的操作不一定在所有示例中执行。

视频解码器300可以将重构的块存储在DPB 314中。例如，在不需要滤波单元312的操作的示例中，重构单元310可以将重构的块存储到DPB 314。在需要滤波单元312的操作的示例中，滤波单元312可以将滤波后的重构块存储到DPB 314。如上所述，DPB 314可以向预测处理单元304提供参考信息，诸如用于帧内预测的当前图片的样点和用于后续运动补偿的先前解码的图片。此外，视频解码器300可以输出来自DPB 314的解码的图片，以用于后续在显示设备上呈现，诸如图1的显示设备118。

视频解码器300表示被配置为对视频数据进行解码的设备的示例，该设备包括被配置为存储视频数据的存储器，以及在电路***中实施的一个或多个处理单元，并且该一个或多个处理单元被配置为将第一编译码树单元(CTU)行(其可以由视频编译码过程的第一线程处理)的运动信息存储在存储器的第一历史运动矢量预测子(MVP)缓冲器中，并且将第二CTU行(其可以由视频编译码过程的第二线程处理)的运动信息存储在存储器的第二历史MVP缓冲器中，第二CTU行不同于第一CTU行。第二线程可以不同于第一线程。

视频解码器300还表示被配置为对视频数据进行解码的设备的示例，该设备包括被配置为存储视频数据的存储器，以及在电路***中实施的一个或多个处理单元，该一个或多个处理单元被配置为将编译码的运动信息存储到历史运动矢量预测子(MVP)缓冲器，将不同类型的运动信息存储到历史MVP缓冲器，并且使用历史MVP缓冲器的运动信息对视频数据块的运动信息进行编译码。

视频解码器300还表示被配置为对视频数据进行解码的设备的示例，该设备包括被配置为存储视频数据的存储器，以及在电路***中实施的一个或多个处理单元，并且该一个或多个处理单元被配置为在相应的、不同的历史运动矢量预测子(MVP)缓冲器中存储多种不同类型的运动信息。

图16是示出根据本公开的技术对当前块进行编码的示例方法的流程图。当前块可以包括当前CU。尽管关于视频编码器200(图1和图14)进行了描述，但是应当理解，其他设备可以被配置为执行类似于图16的方法。

在该示例中，视频编码器200最初使用运动信息预测当前块(350)。例如，视频编码器200可以使用运动信息形成当前块的预测块。然后，视频编码器200可以计算当前块的残差块(352)。为了计算残差块，视频编码器200可以计算原始、未编译码的块和当前块的预测块之间的差值。然后，视频编码器200可以变换和量化残差块的系数(354)。接下来，视频编码器200可以扫描残差块的量化的变换系数(356)。在扫描期间或扫描之后，视频编码器200可以使用本公开的技术对系数和运动信息进行熵编码(358)。视频编码器200可以使用CAVLC或CABAC对系数进行编码。

根据本公开的任何或所有技术，视频编码器200可以构建包括例如HMVP候选的运动信息候选列表，选择表示块的运动信息的预测子的候选索引，并对该候选索引进行熵编码。根据本公开的技术，视频编码器200可以在使用MVP缓冲器存储相应CTU行的运动信息之前重置MVP缓冲器。在一些示例中，每个CTU行可以具有其自己的MVP缓冲器，或者一个MVP缓冲器可以用于多个CTU行。此外，视频编码器200可以在MVP缓冲器中存储多种类型的运动信息，例如，相同的缓冲器或不同的相应运动模型缓冲器。视频编码器200可以使用从MVP缓冲器的数据中选择的运动矢量预测子来对当前块的运动信息进行编码。然后，视频编码器200可以输出块的熵编译码的数据(360)，例如包括系数和运动信息的数据，诸如候选索引。

以这种方式，图16的方法表示一种方法的示例，该方法包括将图片的第一编译码树单元(CTU)行的运动信息存储在存储器的第一历史运动矢量预测子(MVP)缓冲器中；重置存储器的第二历史MVP缓冲器；以及在重置第二历史MVP缓冲器之后，将图片的第二CTU行的运动信息存储在第二历史MVP缓冲器中，第二CTU行不同于第一CTU行。

图16的方法还表示一种方法的示例，该方法包括将运动信息存储到历史运动矢量预测子(MVP)缓冲器；将不同类型的运动信息存储到历史MVP缓冲器；以及使用历史MVP缓冲器的运动信息来对视频数据块的运动信息进行编译码。

图16的方法还表示一种方法的示例，该方法包括将多种不同类型的运动信息存储在相应的不同的历史运动矢量预测子(MVP)缓冲器。

图17是示出根据本公开的技术对视频数据的当前块进行解码的示例方法的流程图。当前块可以包括当前CU。尽管关于视频解码器300(图1和图15)进行了描述，但是应当理解，其他设备可以被配置为执行类似于图17的方法。

视频解码器300可以接收当前块的熵编译码的数据，诸如与当前块相对应的残差块的系数的熵编译码的预测信息和熵编译码的数据(370)。如上所述，根据本公开的技术，熵编译码的预测信息可以包括例如候选列表中的候选索引，该候选列表可以包括HMVP候选。视频解码器300可以对熵编译码的数据进行熵解码，以确定当前块的预测信息，并再现残差块的系数(372)。视频解码器300可预测当前块(374)，例如，使用由当前块的预测信息指示的帧间预测模式，来计算当前块的预测块。

特别地，视频解码器300可以如上所述构建包括HMVP候选的候选列表，然后使用解码的候选索引从候选列表中确定候选以用作当前块的运动矢量预测子。根据本公开的技术，视频解码器300可以在使用MVP缓冲器存储相应CTU行的运动信息之前重置MVP缓冲器。在一些示例中，每个CTU行可以具有其自己的MVP缓冲器，或者一个MVP缓冲器可以用于多个CTU行。此外，视频解码器300可以将多种类型的运动信息存储到MVP缓冲器，例如，相同的缓冲器或不同的相应运动模型缓冲器。视频解码器300可以使用运动矢量预测子来从MVP缓冲器的数据中进行选择。

然后，视频解码器300可以使用运动矢量预测子来重构当前块的运动矢量，然后使用该运动矢量来预测当前块以生成预测块。然后，视频解码器300可以逆扫描再现的系数(376)，以创建量化的变换系数的块。然后，视频解码器300可以对系数进行逆量化和逆变换，以产生残差块(378)。视频解码器300可通过组合预测块和残差块来最终解码当前块(380)。

以这种方式，图17的方法表示一种方法的示例，该方法包括将图片的第一编译码树单元(CTU)行的运动信息存储到存储器的第一历史运动矢量预测子(MVP)缓冲器中；重置存储器的第二历史MVP缓冲器；以及在重置第二历史MVP缓冲器之后，将图片的第二CTU行的运动信息存储到第二历史MVP缓冲器，第二CTU行不同于第一CTU行。

图17的方法还表示一种方法的示例，该方法包括将运动信息存储到历史运动矢量预测子(MVP)缓冲器；将不同类型的运动信息存储到历史MVP缓冲器；以及使用历史MVP缓冲器的运动信息来对视频数据块的运动信息进行编译码。

图17的方法还表示一种方法的示例，该方法包括将多种不同类型的运动信息存储在相应的不同的历史运动矢量预测子(MVP)缓冲器。

图18是示出根据本公开的技术对视频数据进行编译码(编码或解码)的示例方法的流程图。例如，图18的方法可以在图16的步骤350或图17的步骤374期间执行。出于示例和解释的目的，图18的方法是相对于视频解码器300来解释的，尽管视频编码器200也可以执行这种或类似的方法。

视频解码器300可以例如使用帧内预测或帧间预测来对图片的第一CTU行的块进行编译码(390)。视频解码器300将图片的第一编译码树单元(CTU)行的运动信息存储在例如DPB 314的第一缓冲器中(392)。视频解码器300可以使用第一缓冲器的运动信息来对在帧间预测编译码期间使用的运动信息进行编译码。在一些示例中，由视频解码器300执行的视频编译码过程的第一线程可以对第一CTU行进行编译码。

视频解码器300还可以重置例如DPB 314的第二缓冲器(394)。第二缓冲器可以与第一缓冲器相同，或者是不同的缓冲器。视频解码器300还可以对第二CTU行的块进行编译码(396)。视频解码器300可以将第二CTU行的运动信息存储在第二缓冲器中(398)。在一些示例中，由视频解码器300执行的视频编译码过程的第二线程可以对第二CTU行进行编译码，其中第二线程不同于第一线程。

以这种方式，图18的方法表示一种方法的示例，该方法包括将图片的第一编译码树单元(CTU)行的运动信息存储到存储器的第一历史运动矢量预测子(MVP)缓冲器；重置存储器的第二历史MVP缓冲器；以及在重置第二历史MVP缓冲器之后，将图片的第二CTU行的运动信息存储到第二历史MVP缓冲器中，第二CTU行不同于第一CTU行。

应当认识到，根据示例，本文描述的任何技术的某些动作或事件可以以不同的顺序执行，可以被添加、合并或一起省略(例如，并非所有描述的动作或事件对于技术的实践都是必要的)。此外，在某些示例中，动作或事件可以同时执行，例如通过多线程处理、中断处理或多个处理器，而不是顺序执行。

在一个或多个示例中，所描述的功能可以在硬件、软件、固件或其任意组合中实施。如果以软件实施，这些功能可以作为一个或多个指令或代码存储在计算机可读介质上或通过其传输，并由基于硬件的处理单元执行。计算机可读介质可以包括与诸如数据存储介质的有形介质相对应的计算机可读存储介质，或者包括例如根据通信协议有助于将计算机程序从一个地方传送到另一个地方的任何介质的通信介质。以这种方式，计算机可读介质通常可以对应于(1)非暂时性的有形计算机可读存储介质，或者(2)诸如信号或载波的通信介质。数据存储介质可以是可由一个或多个计算机或一个或多个处理器访问以检索指令、代码和/或数据结构来实施本公开中描述的技术的任何可用介质。计算机程序产品可以包括计算机可读介质。

作为示例而非限制，这种计算机可读存储介质可以包括RAM、ROM、EEPROM、CD-ROM或其他光盘存储设备、磁盘存储设备或其他磁存储设备、闪存或任何其他可以用于以指令或数据结构的形式存储期望的程序代码并且可以由计算机访问的介质。此外，任何连接都被恰当地称为计算机可读介质。例如，如果使用同轴电缆、光纤电缆、双绞线、数字用户线路(DSL)或无线技术(如红外线、无线电和微波)从网站、服务器或其他远程源发送指令，则同轴电缆、光纤电缆、双绞线、DSL或无线技术(如红外线、无线电和微波)包括在介质的定义中。然而，应当理解，计算机可读存储介质和数据存储介质不包括连接、载波、信号或其他暂时性介质，而是指向非暂时的有形存储介质。本文使用的光盘和磁盘包括压缩光盘(compact disc，CD)、激光盘、光学光盘、数字多功能盘(DVD)、软盘和蓝光光盘，其中磁盘通常磁性地再现数据，而光盘用激光光学地再现数据。以上的组合也应该包括在计算机可读介质的范围内。

指令可以由一个或多个处理器执行，诸如一个或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其他等效的集成或离散的逻辑电路***。因此，本文使用的术语“处理器”和“处理电路***”可以指任何前述结构或者适合于实施本文描述的技术的任何其他结构。此外，在一些方面，本文描述的功能可以在被配置用于编码和解码的专用硬件和/或软件模块中提供，或者合并在组合编解码器中。同样，这些技术可以完全在一个或多个电路或逻辑元件中实施。

本公开的技术可以在多种设备或装置中实施，包括无线手机、集成电路(IC)或一组IC(例如，芯片集)。在本公开中描述了各种组件、模块或单元，以强调被配置为执行所公开的技术的设备的功能方面，但是不一定需要通过不同的硬件单元来实现。相反，如上所述，各种单元可以组合在编解码器硬件单元中，或者由包括如上所述的一个或多个处理器的互操作硬件单元的集合，结合合适的软件和/或固件来提供。

已经描述了各种示例。这些和其他示例在所附权利要求的范围内。

Claims

1.一种对视频数据进行编译码的方法，所述方法包括：

对图片的第一编译码树单元CTU行的运动信息进行编译码，所述第一CTU行的运动信息包括所述第一CTU行的第一一个或多个运动矢量；

使用通过所述第一CTU行的运动信息识别的第一参考块来形成用于所述第一CTU行的第一一个或多个编译码单元CU的第一一个或多个预测块；

对所述第一一个或多个CU的第一一个或多个残余块进行编译码，所述第一一个或多个残余块表示所述第一一个或多个预测块与所述第一一个或多个CU之间的相应差异；

将所述图片的所述第一CTU行的运动信息存储在存储器的第一历史运动矢量预测子MVP缓冲器中，这包括在所述第一历史MVP缓冲器中存储所述第一CTU行的第一一个或多个运动矢量，所述第一一个或多个运动矢量用作第一运动矢量预测子以预测所述图片的第一一个或多个其他运动矢量；

重置所述存储器的第二历史MVP缓冲器；

对所述图片的第二CTU行的运动信息进行编译码，所述第二CTU行的运动信息包括所述第二CTU行的第二一个或多个运动矢量；

使用通过所述第二CTU行的运动信息识别的第二参考块来形成用于所述第二CTU行的第二一个或多个CU的第二一个或多个预测块；

对所述第二一个或多个CU的第二一个或多个残余块进行编译码，所述第二一个或多个残余块表示所述第二一个或多个预测块与所述第二一个或多个CU之间的相应差异；以及

在重置所述第二历史MVP缓冲器之后，将所述图片的所述第二CTU行的运动信息存储在所述第二历史MVP缓冲器中，所述第二CTU行不同于所述第一CTU行，该存储包括存储所述第二CTU行的第二一个或多个运动矢量，所述第二一个或多个运动矢量用作第二运动矢量预测子以预测所述图片的第二一个或多个其他运动矢量。

2.根据权利要求1所述的方法，其中，所述第二历史MVP缓冲器不同于所述第一历史MVP缓冲器，其中，存储所述第一CTU行的运动信息包括通过视频编译码过程的第一线程存储所述第一CTU行的运动信息，并且其中存储所述第二CTU行的运动信息包括通过所述视频编译码过程的第二线程存储所述第二CTU行的运动信息，所述第一线程不同于所述第二线程。

3.根据权利要求1所述的方法，其中，所述第二历史MVP缓冲器与所述第一历史MVP缓冲器不同，并且其中，重置所述第二历史MVP缓冲器包括响应于在波前并行处理期间处理所述第二CTU行的开头而重置所述第二历史MVP缓冲器。

4.根据权利要求1所述的方法，

其中，存储所述第一CTU行的运动信息包括仅将在所述第一历史MVP缓冲器内唯一的运动信息存储到所述第一历史MVP缓冲器中，并且

其中，存储所述第二CTU行的运动信息包括仅将在所述第二历史MVP缓冲器内唯一的运动信息存储到所述第二历史MVP缓冲器中。

5.根据权利要求1所述的方法，还包括：

当所述第一历史MVP缓冲器变满时，根据先进先出(FIFO)规则从所述第一历史MVP缓冲器中移除一个或多个最早***的运动矢量；和

当所述第二历史MVP缓冲器变满时，根据所述FIFO规则从所述第二历史MVP缓冲器中移除一个或多个最早***的运动矢量。

6.根据权利要求1所述的方法，

其中，存储所述第一CTU行的运动信息包括将多个不同类型的运动模型的每一个的运动信息存储到包括所述第一历史MVP缓冲器的第一多个历史MVP缓冲器的相应的不同的历史MVP缓冲器中；和

其中，存储所述第二CTU行的运动信息包括将所述多个不同类型的运动模型的每一个的运动信息存储到包括所述第二历史MVP缓冲器的第二多个历史MVP缓冲器的相应的不同的历史MVP缓冲器中。

7.根据权利要求6所述的方法，其中，所述多个不同类型的运动模型包括仿射运动模型、块内复制模式的运动信息、局部照度补偿的运动信息、子块运动矢量预测MVP或时域运动预测中的一个或多个。

8.根据权利要求1所述的方法，还包括从一个或多个历史MVP缓冲器中的两个或更多个MVP生成合成MVP。

9.根据权利要求8所述的方法，其中，所述两个或更多个MVP具有不同的运动信息类型，包括编译码的运动信息、仿射运动模型运动信息、块内复制模式的运动信息、局部照度补偿的运动信息、子块MVP运动信息、时域运动预测子运动信息、基于MVP运动信息的合成运动矢量信息、空域MVP运动信息或时域MVP运动信息中的两个或更多个。

10.根据权利要求1所述的方法，

其中，存储所述第一CTU行的运动信息还包括用第一预定义运动信息预填充所述第一历史MVP缓冲器，其中，所述第一预定义运动信息包括具有第一参考帧索引和第一帧间预测方向的第一零运动矢量，以及

其中，存储第二CTU行的运动信息还包括用第二预定义运动信息预填充所述第二历史MVP缓冲器，其中，所述第二预定义运动信息包括具有第二参考帧索引和第二帧间预测方向的第二零运动矢量。

11.根据权利要求1所述的方法，其中，包括所述第一CTU行和所述第二CTU行的图片在第一时域层中，

其中，存储所述第一CTU行的运动信息还包括用来自所述第一时域层或低于所述第一时域层的一个或多个时域层中的第一一个或多个编译码的图片的第一运动信息来预填充所述第一历史MVP缓冲器，以及

其中，存储所述第二CTU行的运动信息还包括用来自所述第一时域层或低于所述第一时域层的一个或多个时域层中的第二一个或多个编译码的图片的第二运动信息来预填充所述第二历史MVP缓冲器，

所述方法还包括根据时域差值缩放所述第一运动信息或所述第二运动信息中的至少一个。

12.根据权利要求1所述的方法，还包括：

用具有第一参考帧索引和第一帧间预测方向的第一零运动矢量来初始化所述第一历史MVP缓冲器；和

用具有第二参考帧索引和第二帧间预测方向的第二零运动矢量来初始化所述第二历史MVP缓冲器。

13.根据权利要求1所述的方法，其中，所述第二CTU行位于所述第一CTU行的正下方，所述方法还包括使用所述第一历史MVP缓冲器初始化或修改所述第二历史MVP缓冲器。

14.根据权利要求1所述的方法，还包括：

使用所述第一历史MVP缓冲器解码所述第一CTU行的CTU的编译码单元(CU)；和

使用所述第二历史MVP缓冲器解码所述第二CTU行的CTU的CU。

15.根据权利要求1所述的方法，还包括：

使用所述第一历史MVP缓冲器编码所述第一CTU行的CTU的编译码单元(CU)；和

使用所述第二历史MVP缓冲器编码所述第二CTU行的CTU的CU。

16.根据权利要求1所述的方法，还包括：

使用所述第一历史MVP缓冲器对所述第一CTU行的CTU的编译码单元(CU)的第一运动信息进行编译码，其中，对所述第一运动信息进行编译码包括使用AMVP模式、合并模式或仿射模式对所述第一运动信息进行编译码；和

使用所述第二历史MVP缓冲器对所述第二CTU行的CTU的CU的第二运动信息进行编译码，其中，对所述第二运动信息进行编译码包括使用AMVP模式、合并模式或仿射模式来对所述第二运动信息进行编译码。

17.根据权利要求1所述的方法，还包括：

将一个或多个运动矢量添加到所述第一历史MVP缓冲器中的第一单向运动信息的第一一个或多个运动矢量，以将所述第一单向运动信息转换成第一双向运动信息，以及

将一个或多个运动矢量添加到所述第二历史MVP缓冲器中的第二单向运动信息的第二一个或多个运动矢量，以将所述第二单向运动信息转换成第二双向运动信息。

18.根据权利要求1所述的方法，

其中，存储所述第一CTU行的运动信息包括仅将与所述第一历史MVP缓冲器内的其他运动矢量相差阈值的运动矢量存储到所述第一历史MVP缓冲器中，以及

其中，存储所述第一CTU行的运动信息包括仅将与所述第二历史MVP缓冲器内的其它运动矢量相差所述阈值的运动矢量存储到所述第二历史MVP缓冲器中。

19.根据权利要求1所述的方法，

其中，存储所述第一CTU行的运动信息包括存储指示所述第一CTU行的运动信息的运动矢量是否与合并模式编译码的编译码单元(CU)或AMVP编译码的CU相关联的数据，以及

其中，存储所述第一CTU行的运动信息包括存储指示所述第二CTU行的运动信息的运动矢量是否与合并模式编译码的CU或AMVP编译码的CU相关联的数据。

20.根据权利要求1所述的方法，其中，所述第一CTU行具有小于所述图片的全宽的长度。

21.根据权利要求1所述的方法，其中，存储所述第一CTU行的运动信息包括存储所述第一CTU行中数量小于所述第一CTU行中CU总数的若干CU的运动信息。

22.一种用于对视频数据进行编译码的设备，所述设备包括：

存储器，被配置为存储视频数据；和

一个或多个处理单元，其在电路***中实施，并且被配置为：

将所述图片的所述第一CTU行的运动信息存储在存储器的第一历史运动矢量预测子MVP缓冲器中，所述第一CTU行的运动信息包括所述第一CTU行的第一一个或多个运动矢量，所述第一一个或多个运动矢量用作第一运动矢量预测子以预测所述图片的第一一个或多个其他运动矢量；

重置所述存储器的第二历史MVP缓冲器；

在重置所述第二历史MVP缓冲器之后，将所述图片的所述第二CTU行的运动信息存储在所述第二历史MVP缓冲器中，所述第二CTU行不同于所述第一CTU行，所述第二CTU行的运动信息包括所述第二CTU行的第二一个或多个运动矢量，所述第二一个或多个运动矢量用作第二运动矢量预测子以预测所述图片的第二一个或多个其他运动矢量。

23.根据权利要求22所述的设备，其中，所述第二历史MVP缓冲器不同于所述第一历史MVP缓冲器，其中，所述一个或多个处理器执行视频编译码过程的第一线程以存储所述第一CTU行的运动信息，并且其中，所述一个或多个处理器执行所述视频编译码过程的第二线程以存储所述第二CTU行的运动信息，所述第一线程不同于所述第二线程。

24.根据权利要求22所述的设备，其中，所述第二历史MVP缓冲器与所述第一历史MVP缓冲器不同，并且其中，为了重置所述第二历史MVP缓冲器，所述一个或多个处理单元被配置为响应于在波前并行处理期间处理所述第二CTU行的开头而重置所述第二历史MVP缓冲器。

25.根据权利要求22所述的设备，

其中，所述一个或多个处理单元被配置为仅将所述第一历史MVP缓冲器内唯一的运动信息存储到所述第一历史MVP缓冲器中，并且

其中，所述一个或多个处理单元被配置为仅将所述第二历史MVP缓冲器内唯一的运动信息存储到所述第二历史MVP缓冲器中。

26.根据权利要求22所述的设备，其中，所述一个或多个处理单元还被配置为：

27.根据权利要求22所述的设备，

其中，所述一个或多个处理单元被配置为将多个不同类型的运动模型中的每一个的运动信息存储到包括所述第一历史MVP缓冲器的第一多个历史MVP缓冲器的相应的不同的历史MVP缓冲器中；和

其中，所述一个或多个处理单元被配置为将所述多个不同类型的运动模型中的每一个的运动信息存储到包括所述第二历史MVP缓冲器的第二多个历史MVP缓冲器的相应的不同的历史MVP缓冲器中。

28.根据权利要求27所述的设备，其中，所述多个不同类型的运动模型包括仿射运动模型、块内复制模式的运动信息、局部照度补偿的运动信息、子块运动矢量预测MVP或时域运动预测中的一个或多个。

29.根据权利要求22所述的设备，其中，所述一个或多个处理单元还被配置为从一个或多个历史MVP缓冲器中的两个或更多个MVP生成合成MVP。

30.根据权利要求29所述的设备，其中，所述两个或更多个MVP具有不同的运动信息类型，包括编译码的运动信息、仿射运动模型运动信息、块内复制模式的运动信息、局部照度补偿的运动信息、子块MVP运动信息、时域运动预测子运动信息、基于MVP运动信息的合成运动矢量信息、空域MVP运动信息或时域MVP运动信息中的两个或更多个。

31.根据权利要求22所述的设备，还包括被配置为显示所述视频数据的显示器。

32.根据权利要求22所述的设备，还包括被配置为捕获所述视频数据的相机。

33.根据权利要求22所述的设备，其中，所述设备包括相机、计算机、移动设备、广播接收器设备或机顶盒中的一个或多个。

34.根据权利要求22所述的设备，其中，所述设备包括以下至少一个：

集成电路；

微处理器；或者

无线通信设备。

35.根据权利要求22所述的设备，其中，所述第一CTU行具有小于所述图片的全宽的长度。

36.根据权利要求22所述的设备，其中，所述一个或多个处理单元被配置为执行如下以存储所述第一CTU行的运动信息：

在所述存储器中存储所述第一CTU行中数量小于所述第一CTU行中CU总数的若干CU的运动信息。

37.一种其上存储有指令的计算机可读存储介质，所述指令在被执行时使得处理器：

重置所述存储器的第二历史MVP缓冲器；

38.根据权利要求37所述的计算机可读存储介质，其中，所述第二历史MVP缓冲器不同于所述第一历史MVP缓冲器，其中，使所述处理器存储所述第一CTU行的运动信息的指令包括使所述处理器执行视频编译码过程的第一线程以存储所述第一CTU行的运动信息的指令，并且其中，使所述处理器存储所述第二CTU行的运动信息的指令包括使所述处理器执行所述视频编译码过程的第二线程以存储所述第二CTU行的运动信息的指令，所述第一线程不同于所述第二线程。

39.根据权利要求37所述的计算机可读存储介质，其中，所述第二历史MVP缓冲器与所述第一历史MVP缓冲器不同，并且其中，使所述处理器重置所述第二历史MVP缓冲器的指令包括使所述处理器响应于在波前并行处理期间处理所述第二CTU行的开头而重置所述第二历史MVP缓冲器的指令。

40.根据权利要求37所述的计算机可读存储介质，

其中，使所述处理器存储所述第一CTU行的运动信息的指令包括使所述处理器仅将所述第一历史MVP缓冲器内唯一的运动信息存储到所述第一历史MVP缓冲器中的指令，以及

其中，使处理器存储所述第二CTU行的运动信息的指令包括使所述处理器仅将所述第二历史MVP缓冲器内唯一的运动信息存储到所述第二历史MVP缓冲器中的指令。

41.根据权利要求37所述的计算机可读存储介质，还包括使所述处理器执行如下操作的指令：

当所述第二历史运动矢量缓冲器变满时，根据所述FIFO规则从所述第二历史MVP缓冲器中移除一个或多个最早***的运动矢量。

42.根据权利要求37所述的计算机可读存储介质，

其中，使所述处理器存储所述第一CTU行的运动信息的指令包括使所述处理器将多个不同类型的运动模型的每一个的运动信息存储到包括所述第一历史MVP缓冲器的第一多个历史MVP缓冲器的相应的不同的历史MVP缓冲器中的指令；和

其中，使所述处理器存储所述第二CTU行的运动信息的指令包括使所述处理器将所述多个不同类型的运动模型的每一个的运动信息存储到包括所述第二历史MVP缓冲器的第二多个历史MVP缓冲器的相应的不同的历史MVP缓冲器中的指令。

43.根据权利要求42所述的计算机可读存储介质，其中，所述多个不同类型的运动模型包括仿射运动模型、块内复制模式的运动信息、局部照度补偿的运动信息、子块运动矢量预测MVP或时域运动预测中的一个或多个。

44.根据权利要求37所述的计算机可读存储介质，还包括使所述处理器从一个或多个历史MVP缓冲器中的两个或更多个MVP生成合成MVP的指令。

45.根据权利要求44所述的计算机可读存储介质，其中，所述两个或更多个MVP具有不同的运动信息类型，包括编译码的运动信息、仿射运动模型运动信息、块内复制模式的运动信息、局部照度补偿的运动信息、子块MVP运动信息、时域运动预测子运动信息、基于MVP运动信息的合成运动矢量信息、空域MVP运动信息或时域MVP运动信息中的两个或更多个。

46.根据权利要求37所述的计算机可读存储介质，其中，所述第一CTU行具有小于所述图片的全宽的长度。

47.根据权利要求37所述的计算机可读存储介质，其中，使所述处理器存储所述第一CTU行的运动信息的指令包括使所述存储器存储所述第一CTU行中数量小于所述第一CTU行中CU总数的若干CU的运动信息。

48.一种用于对视频数据进行编译码的设备，所述设备包括：

存储器，被配置为存储视频数据；

用于对图片的第一编译码树单元CTU行的运动信息进行编译码的装置，所述第一CTU行的运动信息包括所述第一CTU行的第一一个或多个运动矢量；

用于使用通过所述第一CTU行的运动信息识别的第一参考块来形成用于所述第一CTU行的第一一个或多个编译码单元CU的第一一个或多个预测块的装置；

用于对所述第一一个或多个CU的第一一个或多个残余块进行编译码的装置，所述第一一个或多个残余块表示所述第一一个或多个预测块与所述第一一个或多个CU之间的相应差异；

用于将所述图片的所述第一CTU行的运动信息存储在存储器的第一历史运动矢量预测子MVP缓冲器中的装置，这包括用于在所述第一历史MVP缓冲器中存储所述第一CTU行的第一一个或多个运动矢量的装置，所述第一一个或多个运动矢量用作第一运动矢量预测子以预测所述图片的第一一个或多个其他运动矢量；

用于重置所述存储器的第二历史MVP缓冲器的装置；

用于对所述图片的第二CTU行的运动信息进行编译码的装置，所述第二CTU行的运动信息包括所述第二CTU行的第二一个或多个运动矢量；

用于使用通过所述第二CTU行的运动信息识别的第二参考块来形成用于所述第二CTU行的第二一个或多个CU的第二一个或多个预测块的装置；

用于对所述第二一个或多个CU的第二一个或多个残余块进行编译码的装置，所述第二一个或多个残余块表示所述第二一个或多个预测块与所述第二一个或多个CU之间的相应差异；以及

用于在重置所述第二历史MVP缓冲器之后，将所述图片的第二CTU行的运动信息存储在所述第二历史MVP缓冲器中的装置，所述第二CTU行不同于所述第一CTU行，该用于存储的装置包括用于存储所述第二CTU行的第二一个或多个运动矢量的装置，所述第二一个或多个运动矢量用作第二运动矢量预测子以预测所述图片的第二一个或多个其他运动矢量。

49.根据权利要求48所述的设备，其中，所述第二历史MVP缓冲器不同于所述第一历史MVP缓冲器，其中，用于存储所述第一CTU行的运动信息的装置包括视频编译码过程的第一线程，并且其中，用于存储所述第二CTU行的运动信息的装置包括所述视频编译码过程的第二线程。

50.根据权利要求48所述的设备，其中，所述第二历史MVP缓冲器与所述第一历史MVP缓冲器不同，并且其中，所述用于重置所述第二历史MVP缓冲器的装置包括用于响应于在波前并行处理期间处理所述第二CTU行的开头而重置所述第二历史MVP缓冲器的装置。

51.根据权利要求48所述的设备，

其中，用于存储所述第一CTU行的运动信息的装置包括用于仅将所述第一历史MVP缓冲器内唯一的运动信息存储在所述第一历史MVP缓冲器中的装置，以及

其中，用于存储所述第二CTU行的运动信息的装置包括用于仅将所述第二历史MVP缓冲器中唯一的运动信息存储在所述第二历史MVP缓冲器中的装置。

52.根据权利要求48所述的设备，还包括：

用于当所述第一历史MVP缓冲器变满时，根据先进先出(FIFO)规则从所述第一历史MVP缓冲器移除一个或多个最早***的运动矢量的装置；和

用于当所述第二历史MVP缓冲器变满时，根据所述FIFO规则从所述第二历史MVP缓冲器中移除一个或多个最早***的运动矢量的装置。

53.根据权利要求48所述的设备，

其中，用于存储所述第一CTU行的运动信息的装置包括用于将多个不同类型的运动模型的每一个的运动信息存储到包括所述第一历史MVP缓冲器的第一多个历史MVP缓冲器的相应的不同的历史MVP缓冲器中的装置；和

其中，用于存储所述第二CTU行的运动信息的装置包括用于将所述多个不同类型的运动模型的每一个的运动信息存储到包括所述第二历史MVP缓冲器的第二多个历史MVP缓冲器的相应的不同的历史MVP缓冲器中的装置。

54.根据权利要求53所述的设备，其中，所述多个不同类型的运动模型包括仿射运动模型、块内复制模式的运动信息、局部照度补偿的运动信息、子块运动矢量预测MVP或时域运动预测中的一个或多个。

55.根据权利要求48所述的设备，还包括用于从一个或多个历史MVP缓冲器中的两个或更多个MVP生成合成MVP的装置。

56.根据权利要求55所述的设备，其中，所述两个或更多个MVP具有不同的运动信息类型，包括编译码的运动信息、仿射运动模型运动信息、块内复制模式的运动信息、局部照度补偿的运动信息、子块MVP运动信息、时域运动预测子运动信息、基于MVP运动信息的合成运动矢量信息、空域MVP运动信息或时域MVP运动信息中的两个或更多个。

57.根据权利要求48所述的设备，其中，所述第一CTU行具有小于所述图片的全宽的长度。

58.根据权利要求48所述的设备，其中，用于存储所述第一CTU行的运动信息的装置包括用于存储所述第一CTU行中数量小于所述第一CTU行中CU总数的若干CU的运动信息的装置。