CN114222135A - 视频编码方法以及设备 - Google Patents

视频编码方法以及设备 Download PDF

Info

Publication number
CN114222135A
CN114222135A CN202111573130.0A CN202111573130A CN114222135A CN 114222135 A CN114222135 A CN 114222135A CN 202111573130 A CN202111573130 A CN 202111573130A CN 114222135 A CN114222135 A CN 114222135A
Authority
CN
China
Prior art keywords
control point
control points
control
affine
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111573130.0A
Other languages
English (en)
Inventor
陈漪纹
王祥林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dajia Internet Information Technology Co Ltd
Original Assignee
Beijing Dajia Internet Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dajia Internet Information Technology Co Ltd filed Critical Beijing Dajia Internet Information Technology Co Ltd
Publication of CN114222135A publication Critical patent/CN114222135A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/527Global motion vector estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/537Motion estimation other than block-based
    • H04N19/54Motion estimation other than block-based using feature points or meshes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明涉及一种视频编码方法以及设备。该方法包括:编码器获取一个或多个控制点集合,其中每个控制点集合包括控制点集合索引和多个控制点;检查与参考列表中的参考索引相关联的控制点集合是否有效;以及在相关联的控制点集合有效的情况下,根据所述相关联的控制点集合导出仿射运动模型;其中,确定所述相关联的控制点集合内的控制点集合索引的每个控制点的参考索引是否大于或等于零、且每个控制点的参考索引是否彼此相等。

Description

视频编码方法以及设备
本申请是申请号为“201980080919.7”,申请日为“2019年12月13日”,发明名称为“导出构造的仿射合并候选的方法”的中国发明专利申请的分案申请。
技术领域
本申请涉及视频编解码和压缩,更具体地,本申请涉及视频编解码中的仿射运动预测***和方法。
背景技术
各种视频编解码技术可以用来对视频数据进行压缩。视频编解码是根据一种或多种视频编解码标准进行的。例如,视频编解码标准包括通用视频编解码(VVC)、联合探索测试模型(JEM)、高效视频编解码(H.265/HEVC)、高级视频编解码(H.264/AVC)、运动图片专家组(MPEG)编解码,等等。视频编解码通常利用预测方法(如帧间预测、帧内预测等),这些方法利用了视频图像或序列中存在的冗余。视频编解码技术的一个重要目标是将视频数据压缩为使用较低比特率的形式,而同时避免或减少视频质量的降低。
发明内容
本发明的实施例提供一种视频编码方法以及设备。
根据本发明的第一方面,提供一种视频编码方法,包括:
编码器获取一个或多个控制点集合,其中每个控制点集合包括控制点集合索引和多个控制点;
检查与参考列表中的参考索引相关联的控制点集合是否有效;以及
在相关联的控制点集合有效的情况下,根据所述相关联的控制点集合导出仿射运动模型;其中,确定所述相关联的控制点集合内的控制点集合索引的每个控制点的参考索引是否大于或等于零、且每个控制点的参考索引是否彼此相等。
根据本发明的第二方面,提供一种视频编码设备,包括:
一个或多个处理器;
一种非暂时性计算机可读存储器,所述存储器存储由所述一个或多个处理器可执行的指令,
其中,所述一个或多个处理器被配置为:
获取一个或多个控制点集合,其中每个控制点集合包括控制点集合索引和多个控制点;
检查与参考列表中的参考索引相关联的控制点集合是否有效;以及
在相关联的控制点集合有效的情况下,根据所述相关联的控制点集合导出仿射运动模型;其中,确定所述相关联的控制点集合内的控制点集合索引的每个控制点的参考索引是否大于或等于零、且每个控制点的参考索引是否彼此相等。
根据本发明的第三方面,提供一种非暂时性计算机可读存储介质,所述存储介质存储由具有一个或多个处理器的视频编码设备执行的多个程序,其中,所述多个程序在由所述一个或多个处理器执行时使得所述视频编码设备执行操作,所述操作包括:
获取一个或多个控制点集合,其中每个控制点集合包括控制点集合索引和多个控制点;
检查与参考列表中的参考索引相关联的控制点集合是否有效;以及
在相关联的控制点集合有效的情况下,根据所述相关联的控制点集合导出仿射运动模型;其中,确定所述相关联的控制点集合内的控制点集合索引的每个控制点的参考索引是否大于或等于零、且每个控制点的参考索引是否彼此相等。
根据本发明的第四方面,提供一种非暂时性计算机可读存储介质,存储根据前面所述的视频编码方法而获得的码流。
应理解前面的总体描述和下面的具体描述仅为示例,而并不是对本发明的限制。
附图说明
结合在本说明书中并构成本说明书的一部分的附图,示出了与本发明一致的示例,并且与说明书一起用于说明本发明的原理。
图1是根据本发明的示例的编码器的框图;
图2是根据本发明的示例的解码器的框图;
图3是根据本发明的示例示出的用于导出构造的仿射合并候选的方法的流程图;
图4是根据本发明的示例示出的用于导出构造的仿射合并候选的方法的流程图;
图5是根据本发明的示例示出的用于导出构造的仿射合并候选的方法的流程图;
图6A是根据本发明的示例的基于控制点的仿射运动模型;
图6B是根据本发明的示例的基于控制点的仿射运动模型;
图7是根据本发明的示例的每个子块的仿射运动矢量场(MVF);
图8是根据本发明的示例的候选的位置;
图9是根据本发明的示例的控制点运动矢量;
图10是根据本发明的示例的候选的位置;
图11是根据本发明的示例的导出构造的仿射合并候选的流程图;
图12是根据本发明的示例的运动矢量用法的示图;
图13是根据本发明的示例的用于导出仿射合并候选的方法;
图14是根据本发明的示例的仿射运动模型的导出;
图15是根据本发明的示例的仿射运动模型的导出;
图16是根据本发明的示例的仿射运动模型的导出;
图17是根据本发明的示例的计算环境的框图。
具体实施方式
详细参考示例性实施例,这些实施例的示例在附图中示出。以下描述参考附图,其中,不同附图中的相同附图标记表示相同或类似的要素,除非另有说明。在示例性实施例的以下描述中,阐述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求中所述的与本发明相关的几个方面一致的装置和方法的示例。
在本发明中使用的术语仅出于描述具体实施例的目的,而并不旨在对本发明进行限制。在本发明和所附的权利要求书中,所使用的单数形式“一”、“一个”和“该”也旨在包括复数形式,除非上下文另有明确说明。还应当理解,本文中使用的术语“和/或”旨在表示并包括一个或多个相关联的所列项目的任何或所有可能的组合。
应当理解,尽管在本文中可以使用术语“第一”、“第二”、“第三”等来描述各种信息,但是这些信息不应受到这些术语的限制。这些术语仅用于区分信息的种类。例如,在不脱离本发明的范围的情况下,第一信息可以被称为第二信息,类似地,第二信息可以被称为第一信息。在本文所使用的术语“如果”可以根据上下文被理解为是指“在……的时候”、“此时”或“响应于判断”。
从概念上讲,视频编解码标准是相似的。例如,许多编解码标准使用基于块的处理并共享相似的视频编码框图来实现视频压缩。
图1示出了典型的编码器100。编码器100具有视频输入110,运动补偿112,运动估计114,帧内/帧间模式判定116,块预测器140,加法器128,变换130,量化132,与预测有关的信息142,帧内预测118,图片缓冲器120,逆量化134,逆变换136,加法器126,存储器124,环内滤波器122,熵编码138和比特流144。
在该编码器的示例性实施例中,视频帧被划分成块以进行处理。对于每个给定的视频块,基于帧间预测或帧内预测来形成预测。在帧间预测中,可以基于来自先前重构的帧的像素,通过运动估计和运动补偿来形成预测器。在帧内预测中,可以基于当前帧中的重构像素来形成预测器。通过模式判定,可以选择最佳预测器来预测当前块。
预测残差(即当前块与其预测器之间的差)被发送到变换模块。然后变换系数被发送到量化模块以降低熵。量化系数被馈送到熵编码模块以生成压缩视频比特流。如图1所示,来自帧间和/或帧内预测模块的与预测有关的信息,例如分块信息、运动矢量、参考图片索引和帧内预测模式等,也经过熵编码模块并被保存到比特流中。
在编码器中,还需要与解码器相关的模块,从而对像素进行重建以进行预测。首先,通过逆量化和逆变换来重构预测残差。将这种重构后的预测残差与块预测器组合起来以生成当前块的未滤波的重构像素。
为了提高编码效率和视觉质量,通常使用环内滤波器(In-loop Filter)。例如,在AVC、HEVC和当前的VVC中都可以使用去块滤波器(Deblocking Filter)。在HEVC中,定义了一种称为采样自适应偏移(SAO,Sample Adaptive Offset)的附加环内滤波器,以进一步提高编码效率。在最新的VVC中,正在积极研究另一种称为自适应环路滤波器(ALF,AdaptiveLoop Filter)的环内滤波器,这种环内滤波器很有可能被纳入最终标准。
这些环内滤波器操作是可选的。通常,打开它们有助于提高编码效率和视觉质量。它们也可以作为编码器判定而被关闭,以降低计算复杂性。
应该注意的是,帧内预测通常基于未滤波的重构像素,而如果这些滤波器选项由编码器打开的话帧间预测基于滤波后的重构像素。
图2示出了典型的解码器200的框图。解码器200具有比特流210,熵解码212,逆量化214,逆变换216,加法器218,帧内/帧间模式选择220,帧内预测222,存储器230,环内滤波器228,运动补偿224,图片缓冲器226,与预测有关的信息234和视频输出232。
在解码器中,比特流首先通过熵解码模块被解码,以导出量化系数水平和与预测有关的信息。然后,量化系数水平通过逆量化和逆变换模块被处理以获得重构的预测残差。基于解码后的预测信息,通过帧内预测或运动补偿过程来形成块预测器。通过将重构的预测残差和块预测器相加来获得未滤波的重构像素。在环内滤波器开启的情况下,对这些像素执行滤波操作,以导出(Derive)最终的重构视频进行输出。
图3示出了阐述本发明的方法300的步骤的示例性流程图。
该构造的仿射合并导出(Constructed Affine Merge Derivation)包括:在编码器和解码器侧都检查相关联的控制点集合是否有效。
在步骤310中,从解码器获取一个或多个控制点集合,其中一个或多个控制点集合包括控制点集合索引和控制点;其中每个控制点集合包括多个控制点;其中每个控制点包括第一参考图片索引,list0运动矢量,list1参考图片索引和list1运动矢量。
在一个示例性实施例中,从该解码器获取该控制点集合包括:从视频输入获取空间相邻块和时序块;基于该空间相邻块和时序块确定控制点;基于这些控制点从该空间相邻块和时序块中导出运动信息;以及基于这些控制点定义多个控制点集合,其中一个控制点集合包括该控制点集合索引。
每个控制点具有两个参考索引。一个控制点的参考索引指向参考图片列表0中的参考图片,另一个控制点的参考索引指向参考图片列表1中的参考图片。在VVC标准中使用两个标志来指示是否使用list0/list1预测。例如,flag one flag X one被用于指示是否使用列表X。(其中X可以是0或1)
对于仅利用list0预测(我们通常将其称为单预测)的控制点,其list0参考索引应指向一个参考图片,因此索引值应大于或等于0。其list1参考索引不指向任何参考图片,并且其值设置为表示无效的值(例如,在VVC标准中为-1)。此外,在这种情况下,将flag one N设置为1/true,并且将flag two N设置为0/false。
对于仅利用list1预测(我们通常将其称为单预测)的控制点,其list1参考索引应指向一个参考图片,因此索引值应大于或等于0。其list0参考索引不指向任何参考图片,并且其值设置为表示无效的值(例如,在VVC标准中为-1)。此外,在这种情况下,将flag one N设置为0/false,并且将flag two N设置为1/true。
对于既利用list0预测又利用list1预测的控制点,其list0参考索引和list1参考索引均大于或等于0。此外,在这种情况下,将flag one N设置为1/true,并且将flag two N设置为1/true。
在步骤312中,该解码器确定针对与指向第一参考图片列表中的参考图片的参考索引相关联的控制点集合内的控制点集合索引的每个控制点的参考索引是否大于或等于零且每个控制点的参考索引是否彼此相等。
在步骤314中,该解码器确定针对与指向第二参考图片列表中的参考图片的参考索引相关联的控制点集合内的控制点集合索引的每个控制点的参考索引是否大于或等于零且每个控制点的参考索引是否彼此相等。
在步骤316中,该解码器基于确定结果确定仿射运动模型可用,而与该控制点集合中的控制点的运动矢量无关。
图4示出了阐述本发明的方法400的步骤的示例性流程图。
在步骤410中,该解码器确定针对与指向参考图片列表0的参考索引相关联的该控制点集合内的控制点集合索引的每个控制点的参考索引大于或等于零且每个控制点的参考索引彼此相等。
在步骤412中,该解码器确定针对与指向参考图片列表0的运动矢量相关联的控制点集合内的控制点集合索引的第一控制点的运动矢量不等于针对与指向参考图片列表0的运动矢量相关联的控制点集合内的控制点集合索引的第二控制点的运动矢量,或者该第一控制点的运动矢量不等于针对与指向第一参考图片列表0的运动矢量相关联的控制点集合内的控制点集合索引的第三控制点的运动矢量。
在步骤414中,该解码器将该控制点集合索引的该控制点集合中的控制点的运动信息设置为当前块的关联控制点的运动信息,以导出第一列表仿射运动模型。
在步骤416中,该解码器确定针对与指向参考图片列表0的参考索引相关联的控制点集合内的控制点集合索引的控制点x的参考索引大于或等于零。
在步骤418中,该解码器将针对与指向参考图片列表0的参考索引相关联的控制点集合内的控制点集合索引的控制点x的运动信息设置为当前块的所有控制点的运动信息,以导出所述第一列表仿射运动模型。
图5示出了阐述本发明的方法500的步骤的示例性流程图。
在步骤510中,该解码器确定针对与指向第一参考图片列表中的参考图片的参考索引相关联的控制点集合内的控制点集合索引的每个控制点的参考索引大于或等于零。
在步骤512中,该解码器将控制点集合索引中的控制点的运动信息设置为当前块的关联控制点的运动信息,以导出第一列表仿射运动模型。
在步骤514中,该解码器将该控制点集合索引的参考图片索引设置为当前块的参考图片索引。
在HEVC中,仅平移运动模型被应用于运动补偿预测(MCP,Motion CompensationPrediction)。在现实世界中存在多种运动,例如放大/缩小、旋转、透视运动和其它不规则运动。在VVC的当前的参考软件(VTM3)中,应用了基于块的仿射变换运动补偿预测。如图6A和6B(如下所述)所示,通过两个控制点(4参数)或三个控制点运动矢量(6参数)的运动信息来描述块的仿射运动场。
图6A示出了用于4参数仿射模型的基于控制点的仿射运动模型。
图6B示出了用于6参数仿射模型的基于控制点的仿射运动模型。
对于该4参数仿射模型而言,在块的采样位置(x,y)的运动矢量被导出为:
Figure BDA0003423910820000071
对于该6参数仿射模型而言,在块的采样位置(x,y)的运动矢量被导出为:
Figure BDA0003423910820000072
其中,(mv0x,mv0y)是左上角控制点的运动矢量,(mv1x,mv1y)是右上角控制点的运动矢量,(mv2x,mv2y)是左下角控制点的运动矢量。
为了简化运动补偿预测,基于块的仿射变换预测被应用。为了导出每个4×4亮度子块的运动矢量,根据上述等式计算每个子块的中心样本的运动矢量,如图7所示(如下所述),并四舍五入为1/16分数精度。然后,应用运动补偿插值滤波器生成具有导出的运动矢量的每个子块的预测。色度分量的子块大小也设置为4×4。4×4色度子块的运动矢量(MV)被计算为四个对应的4×4亮度子块的MV的平均值。
图7示出了每个子块的仿射运动矢量场(MVF)。
如对平移运动帧间预测所做的那样,还有两种仿射运动帧间预测模式:仿射合并模式和仿射AMVP模式。
仿射合并预测
AF_MERGE模式能够应用于宽度和高度均大于或等于8的CU。在此模式中,基于空间相邻CU的运动信息生成当前CU的控制点运动矢量(CPMV)。最多可以有五个CPMVP候选,并且通过信号发送索引以指示要用于当前CU的一个CPMVP候选。以下三种类型的CPMV候选被用于形成仿射合并候选列表:
1.从相邻CU的CPMV推断出的继承的仿射合并候选;
2.使用相邻CU的平移MV导出的构造的仿射合并候选CPMVP;
3.零MV。
在VTM3中,最多有两个继承的仿射候选,它们是从相邻块的仿射运动模型中导出的,一个来自于左边相邻CU且另一个来自于上边相邻的CU。这些候选块在图8中被示出(如下所述)。对于左预测器,扫描顺序为A0->A1,而对于上预测器,扫描顺序为B0->B1->B2。来自每一侧的仅第一个继承的候选被选择。在两个继承的候选之间不进行修剪检查。当相邻仿射CU被识别时,其控制点运动矢量被用于导出当前CU的仿射合并列表中的CPMVP候选。如图9所示(如下所述),如果相邻的左下块A以仿射模式被编码,则获得包含块A的CU的左上角、右上角和左下角的运动矢量v2、v3和v4。当使用4参数仿射模型对块A进行编码时,根据v2和v3计算当前CU的两个CPMV。在使用6参数仿射模型对块A进行编码的情况下,根据v2、v3和v4计算当前CU的三个CPMV。
图8示出了继承的仿射运动预测器的位置。
图9示出了控制点运动矢量继承。
构造的仿射候选是指通过将每个控制点的相邻平移运动信息结合起来以构造候选。这些控制点的运动信息是从图10(如下所述)所示的指定空间邻居和时序邻居中导出的。CPk(k=1、2、3、4)表示第k个控制点。CP1是在当前块的左上角的控制点,B2->B3->A2块被检查,并且第一个可用块的MV被用作CP1的运动信息。CP2是在当前块的右上角的控制点,B1->B0块被检查,并且第一个可用块的MV被用作CP2的运动信息。CP3是在当前块的左下角的控制点,并且A1->A0块被检查。时序运动矢量预测器(TMVP)被用作右下控制点CP4(如果有的话)。
图10示出了用于构造的仿射合并模式的候选位置的定位。
在获得四个控制点之后,基于这些控制点的运动信息来构造仿射合并候选。控制点的以下六个组合被用于按顺序构造所述构造的仿射合并候选:
{CP1,CP2,CP3},{CP1,CP2,CP4},{CP1,CP3,CP4},
{CP2,CP3,CP4},{CP1,CP2},{CP1,CP3}。
三个控制点的组合构成一个6参数的仿射合并候选,两个控制点的组合构成一个4参数的仿射合并候选。为了避免运动缩放过程,如果控制点的参考索引不同,则丢弃控制点MV的相关组合。此外,当2个CPMV在4参数仿射模型中相同(在6参数仿射模型中,3个CPMV相同)时,控制点MV的相关组合也被丢弃。在图11(如下所述)中示出了导出该构造的仿射合并候选的流程图。
图11示出了导出构造的仿射合并候选的流程图。
仿射AMVP预测
仿射AMVP模式能够应用于宽度和高度均大于或等于16的CU。在比特流中通过信号发送该CU水平的仿射标志以指示是否使用仿射AMVP模式,然后通过信号发送另一个标志以指示是否使用4参数仿射或6参数仿射。在这种模式中,在比特流中用信号发送当前CU的CPMV与其预测器CPMVP的差异。仿射AMVP候选列表大小为2,它是通过依次使用以下四种CPMV候选类型生成的:
1.从邻居CU的CPMV推断的继承的仿射AMVP候选
2.使用邻居CU的平移MV导出的构造的仿射AMVP候选CPMVP
3.来自相邻CU的平移MV
4.零MV
继承的仿射AMVP候选的检查顺序与继承的仿射合并候选的检查顺序相同。唯一的区别是,对于AMVP候选,仅考虑与当前块具有相同参考图片的仿射CU。将继承的仿射运动预测器***候选列表时,不应用修剪过程。
构造的AMVP候选仅从图3所示的指定空间邻居中导出。使用与仿射合并候选构造中相同的检查顺序。另外,该相邻块的参考图片索引也被检查。使用检查顺序中的第一个块,该块进行了帧间编码并具有与当前CU中相同的参考图片。
如果所有三个CPMV均已附加,则将它们按照本来的样子***到该仿射AMVP列表中。若仅有mv0和mv1可用,则mv2导出如下:
Figure BDA0003423910820000101
其中,当前CU的大小为w×h。若仅有mv0和mv2可用,则mv1导出如下:
Figure BDA0003423910820000102
如果仿射AMVP列表候选仍小于2,则添加mv0、mv1和mv2,以在这些平移MV可用时预测当前CU的所有控制点MV。
仿射运动信息存储
在VTM3中,仿射CU的CPMV存储在单独的缓存中。存储的这些CPMV仅用于以仿射合并模式和仿射AMVP模式为最近编码的CU生成继承的CPMVP。从CPMV导出的子块MV被用于运动补偿、合并的MV导出/平移MV的AMVP列表以及去块(De-blocking)。
为了避免用于额外CPMV的图片行缓存,来自上方CTU的CU的仿射运动数据继承被进行不同于来自正常相邻CU的继承的处理。如果用于仿射运动数据继承的候选CU在上方CTU行中,则行缓存中的左下和右下子块MV(而不是这些CPMV)被用于仿射MVP导出。这样,这些CPMV仅存储在本地缓存中。如果该候选CU是6参数仿射编码的,则将该仿射模型降级为4参数模型。如图12(如下所述)所示,沿着顶部CTU边界,CU的左下和右下子块运动矢量被用于底部CTU中的CU的仿射继承。
图12示出了所提出的组合方法的运动矢量用法的示意图。
在一个实施例中,当导出这些构造的仿射合并候选时,平移运动模型被视为有效的仿射合并候选,因为控制点之间的MV可以是相同的。为了允许所构造的仿射合并候选的平移运动模型,提出了去除控制点的MV之间的比较。由于去除了MV之间的比较,因此所提出的方案可以简化这些构造的仿射合并候选的导出。在图13(如下所述)中示出了基于现有方法的示例性流程图。
图13示出了用于导出仿射合并候选的方法的流程图。
在另一个实施例中,当控制点之间的参考索引不同时,由相关联的控制点集合导出的仿射运动模型被认为是不可用的。在另一个提出的方案中,对控制点之间的运动信息的检查进行修改以考虑控制点之间的参考索引不同时的条件。在所提出的这些方案中,当控制点之间的参考索引不同时,选择的一个控制点的运动信息被用作所有控制点的运动信息。在图14和15(如下所述)中给出了两个例子以展示对列表0(或称为前向参考图片列表)6参数仿射运动模型的导出提出的修改。在不失一般性的前提下,相同的修改也可以应用于列表1或4参数仿射运动模型导出。
图14示出了仿射运动模型的导出,其中考虑了控制点之间的不同参考索引。
图15示出了仿射运动模型的导出,其中考虑了控制点之间的不同参考索引。
在提出的另一个方案中,所有控制点之间的运动信息的检查都被禁止。在所提出的这些方案中,只要控制点具有运动信息,即使它们具有不同的参考图片索引,它们也被用于构造仿射运动模型。在图16(下面描述)中示出了基于现有方法的示例性流程图。
考虑到此处公开的实施例的说明和实践,其他实施例对于本领域技术人员将是显而易见的。本申请旨在覆盖遵循实施例的一般原理的实施例的任何变化、使用或适应,并且包括在本领域的已知或惯常实践之内的与本发明的偏离。说明书和实例旨在仅被认为是示例性的,实施例的真实范围和精神由所附的权利要求书指明。
将会理解,本实施例不限于上面所描述的和附图中所示出的确切示例,并且在不脱离其范围的情况下可以进行各种修改和变化。实施例的范围旨在仅由所附的权利要求书限制。
图16示出了考虑参考图片索引的仿射运动模型的导出。
图17示出了与用户界面1760耦合的计算环境1710。计算环境1710可以是数据处理服务器的一部分。计算环境1710包括处理器1720、存储器1740和I/O接口1750。
处理器1720通常控制计算环境1710的整体操作,例如与显示、数据采集、数据通信和图像处理相关的操作。处理器1720可包括一个或多个处理器以执行指令以执行上述方法中的所有或一些步骤。此外,处理器1720可以包括有利于处理器1720与其他部件之间的交互的一个或多个模块。该处理器可以是中央处理器(CPU)、微处理器、单片机和GPU等。
存储器1740被配置为存储各种类型的数据以支持计算环境1710的操作。此类数据的示例包括用于在计算环境1710上操作的任何应用程序或方法的指令、MRI数据集、图像数据等。可以通过使用任何类型的易失性或非易失性存储设备或其组合来实现存储器1740,例如静态随机存取存储器(SRAM)、电可擦除可编程只读存储器(EEPROM)、可擦除可编程只读存储器(EPROM)、可编程只读存储器(PROM)、只读存储器(ROM)、磁存储器、闪存、磁盘或光盘。
I/O接口1750在处理器1720与***接口模块之间提供接口,这些***接口模块如键盘、点击轮、按钮等。这些按钮可以包括但不限于主页按钮、开始扫描按钮和停止扫描按钮。I/O接口1750可与编码器和解码器耦合。
在一个实施例中,还提供了一种非暂时性计算机可读存储介质,其包括多个程序,如包括在存储器1740中的程序,该程序可以由计算环境1710中的处理器1720执行,以实现上述方法。例如,非暂时性计算机可读存储介质可以是ROM、RAM、CD-ROM、磁带、软盘、光学数据存储设备等。
在该非暂时性计算机可读存储介质中存储了多个程序,以供具有一个或多个处理器的计算设备执行,其中,在由一个或多个处理器执行时,这些程序使得该计算设备执行上述用于运动预测的方法。
在一个实施例中,可以用一个或多个专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑设备(PLD)、现场可编程门阵列(FPGA)、图形处理单元(GPU)、控制器、微控制器、微处理器或其他电子组件来实现计算环境1710。

Claims (10)

1.一种视频编码方法,包括:
编码器获取一个或多个控制点集合,其中每个控制点集合包括控制点集合索引和多个控制点;
检查与参考列表中的参考索引相关联的控制点集合是否有效;以及
在相关联的控制点集合有效的情况下,根据所述相关联的控制点集合导出仿射运动模型;其中,确定所述相关联的控制点集合内的控制点集合索引的每个控制点的参考索引是否大于或等于零、且每个控制点的参考索引是否彼此相等。
2.如权利要求1所述的方法,其中,所述参考列表包括第一参考列表和第二参考列表,所述方法还包括:
在针对与所述第一参考列表中的参考索引相关联的控制点集合内的控制点集合索引的每个控制点的参考索引大于或等于零且每个控制点的参考索引彼此相等,和/或,针对与所述第二参考列表中的参考索引相关联的控制点集合内的控制点集合索引的每个控制点的参考索引大于或等于零且每个控制点的参考索引彼此相等的情况下,设置指示所述仿射运动模型可用的标志。
3.如权利要求1所述的方法,其中,所述编码器获取所述控制点集合包括:
从输入视频获取空间相邻块和时序块;
基于所述空间相邻块和时序块确定控制点;
基于所述控制点从所述空间相邻块和所述时序块中导出运动信息;以及
基于所述控制点定义所述控制点集合,其中所述控制点集合包括控制点集合索引。
4.如权利要求3所述的方法,其中,所述控制点集合包括至少两个控制点;其中每个控制点包括第一参考索引,第一运动矢量,第二参考索引和第二运动矢量。
5.如权利要求1所述的方法,其中,所述方法还包括:
设置所述控制点集合中的所述控制点的运动信息相同于当前块的关联控制点的运动信息,以导出构造的仿射运动模型;
确定所述构造的仿射运动模型可用,并将所述构造的仿射运动模型***仿射合并候选列表中。
6.如权利要求5所述的方法,其中,所述方法还包括:
设置所述仿射合并候选列表中的一个构造的仿射运动模型的参考索引相同于当前块的参考索引。
7.如权利要求1所述的方法,其中,所述方法还包括:
确定针对与第一参考列表中的运动矢量相关联的控制点集合内的控制点集合索引的第一控制点的运动矢量不等于针对与所述第一参考列表中的运动矢量相关联的所述控制点集合内的所述控制点集合索引的第二控制点的运动矢量,或者所述第一控制点的运动矢量不等于针对与所述第一参考列表中的运动矢量相关联的所述控制点集合内的所述控制点集合索引的第三控制点的运动矢量;以及
设置所述控制点集合索引的所述控制点集合中的所述控制点的运动信息相同于当前块的关联控制点的运动信息,以导出构造的仿射运动模型。
8.一种视频编码设备,包括:
一个或多个处理器;以及
一种非暂时性计算机可读存储器,所述存储器存储由所述一个或多个处理器可执行的指令,
其中,所述一个或多个处理器被配置为:
获取一个或多个控制点集合,其中每个控制点集合包括控制点集合索引和多个控制点;
检查与参考列表中的参考索引相关联的控制点集合是否有效;以及
在相关联的控制点集合有效的情况下,根据所述相关联的控制点集合导出仿射运动模型;其中,确定所述相关联的控制点集合内的控制点集合索引的每个控制点的参考索引是否大于或等于零、且每个控制点的参考索引是否彼此相等。
9.一种非暂时性计算机可读存储介质,所述存储介质存储由一个或多个处理器的执行的多个程序,其中,所述多个程序由所述一个或多个处理器执行如权利要求1至7任一项所述的视频编码方法。
10.一种非暂时性计算机可读存储介质,存储根据权利要求1至7中任一项所述的视频编码方法而获得的码流。
CN202111573130.0A 2018-12-13 2019-12-13 视频编码方法以及设备 Pending CN114222135A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201862779423P 2018-12-13 2018-12-13
US62/779,423 2018-12-13
PCT/US2019/066385 WO2020124040A1 (en) 2018-12-13 2019-12-13 Method for deriving constructed affine merge candidates
CN201980080919.7A CN113170187A (zh) 2018-12-13 2019-12-13 导出构造的仿射合并候选的方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201980080919.7A Division CN113170187A (zh) 2018-12-13 2019-12-13 导出构造的仿射合并候选的方法

Publications (1)

Publication Number Publication Date
CN114222135A true CN114222135A (zh) 2022-03-22

Family

ID=71077535

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201980080919.7A Pending CN113170187A (zh) 2018-12-13 2019-12-13 导出构造的仿射合并候选的方法
CN202111573130.0A Pending CN114222135A (zh) 2018-12-13 2019-12-13 视频编码方法以及设备

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201980080919.7A Pending CN113170187A (zh) 2018-12-13 2019-12-13 导出构造的仿射合并候选的方法

Country Status (7)

Country Link
US (4) US11729408B2 (zh)
EP (1) EP3895430A4 (zh)
JP (2) JP7247345B2 (zh)
KR (2) KR20220031771A (zh)
CN (2) CN113170187A (zh)
MX (4) MX2021007018A (zh)
WO (1) WO2020124040A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3744094A4 (en) * 2018-01-26 2021-11-03 MediaTek Inc. METHOD AND DEVICE FOR AFFINE INTER-PREDICTION FOR A VIDEO ENCODING SYSTEM

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2711199C (en) 2010-07-29 2013-11-12 Messier-Dowty Inc. Hydraulic shimmy damper for aircraft landing gear
KR101952103B1 (ko) * 2010-10-08 2019-02-27 지이 비디오 컴프레션, 엘엘씨 블록 분할 및 블록 병합을 지원하는 픽처 코딩
GB2561507B (en) * 2016-01-07 2021-12-22 Mediatek Inc Method and apparatus for affine merge mode prediction for video coding system
KR102584349B1 (ko) * 2016-03-28 2023-10-04 로즈데일 다이나믹스 엘엘씨 인터 예측 모드 기반 영상 처리 방법 및 이를 위한 장치
WO2018128380A1 (ko) * 2017-01-03 2018-07-12 엘지전자(주) 어파인 예측을 이용하여 비디오 신호를 처리하는 방법 및 장치
CN118233624A (zh) * 2017-06-26 2024-06-21 交互数字Vc控股公司 用于视频编码和解码的方法及设备
CN107314077B (zh) 2017-07-13 2023-01-24 盐城市步高汽配制造有限公司 一种内外双线圈的双筒式磁流变减振器
US11877001B2 (en) * 2017-10-10 2024-01-16 Qualcomm Incorporated Affine prediction in video coding
US20190208211A1 (en) * 2018-01-04 2019-07-04 Qualcomm Incorporated Generated affine motion vectors
WO2019235822A1 (ko) * 2018-06-04 2019-12-12 엘지전자 주식회사 어파인 움직임 예측을 이용하여 비디오 신호를 처리하는 방법 및 장치
SG11202012701XA (en) * 2018-07-02 2021-01-28 Huawei Tech Co Ltd Motion vector prediction method and apparatus, encoder, and decoder
CN110891176B (zh) * 2018-09-10 2023-01-13 华为技术有限公司 基于仿射运动模型的运动矢量预测方法及设备
JP7157152B2 (ja) * 2018-09-12 2022-10-19 エルジー エレクトロニクス インコーポレイティド 画像コーディングシステムにおけるサブブロック単位の動き予測に基づく画像デコーディング方法及び装置
US11943467B2 (en) * 2018-09-21 2024-03-26 Vid Scale, Inc. Affine motion estimation for affine model-based video coding
WO2020067835A1 (ko) * 2018-09-28 2020-04-02 엘지전자 주식회사 어파인 예측을 이용하여 비디오 신호를 처리하기 위한 방법 및 장치
CN111010571B (zh) * 2018-10-08 2023-05-16 北京字节跳动网络技术有限公司 组合仿射Merge候选的生成和使用
CN112970253B (zh) * 2018-11-13 2024-05-07 北京字节跳动网络技术有限公司 用于预测的运动候选列表构建
CN113170192B (zh) * 2018-11-15 2023-12-01 北京字节跳动网络技术有限公司 仿射的merge与mvd
CN113039802B (zh) * 2018-11-16 2024-05-14 北京字节跳动网络技术有限公司 基于历史的仿射参数的使用
WO2020137850A1 (ja) * 2018-12-28 2020-07-02 株式会社Jvcケンウッド 動画像符号化装置、動画像符号化方法及び動画像符号化プログラム、動画像復号装置、動画像復号方法及び動画像復号プログラム
WO2020177682A1 (en) * 2019-03-03 2020-09-10 Beijing Bytedance Network Technology Co., Ltd. Motion vector management for decoder side motion vector refinement
JP2022523350A (ja) * 2019-03-11 2022-04-22 アリババ グループ ホウルディング リミテッド マージモードのための予測重み付けを決定する方法、装置及びシステム
US11146813B2 (en) * 2019-05-23 2021-10-12 Tencent America LLC Method and apparatus for video coding
WO2021110017A1 (en) * 2019-12-02 2021-06-10 Beijing Bytedance Network Technology Co., Ltd. Merge with motion vector differencing in affine mode
CN115443650A (zh) * 2020-06-06 2022-12-06 阿里巴巴(中国)有限公司 用于帧间预测的角度加权预测

Also Published As

Publication number Publication date
US20230353769A1 (en) 2023-11-02
KR20210091778A (ko) 2021-07-22
EP3895430A4 (en) 2022-10-12
KR20220031771A (ko) 2022-03-11
MX2023013376A (es) 2023-11-27
JP2022513492A (ja) 2022-02-08
MX2023013379A (es) 2023-11-27
US20230362395A1 (en) 2023-11-09
JP2023063506A (ja) 2023-05-09
US20230262246A1 (en) 2023-08-17
MX2023013408A (es) 2023-12-06
CN113170187A (zh) 2021-07-23
EP3895430A1 (en) 2021-10-20
WO2020124040A1 (en) 2020-06-18
US11729408B2 (en) 2023-08-15
MX2021007018A (es) 2021-07-21
JP7247345B2 (ja) 2023-03-28
US20210306649A1 (en) 2021-09-30
KR102387873B1 (ko) 2022-04-18

Similar Documents

Publication Publication Date Title
CN117041556B (zh) 用于视频编码的方法、计算设备、存储介质和程序产品
US20190058896A1 (en) Method and apparatus of video coding with affine motion compensation
US20230362395A1 (en) Method for deriving constructed affine merge candidates
CN116368799A (zh) 用于帧间编解码的增强型运动估计
KR102489605B1 (ko) 조합된 인터 및 인트라 예측을 위한 시스템 및 방법
JP2023030061A (ja) ビデオ符号化のための動きベクトル予測
CN116708802A (zh) 用于针对视频编解码的预测相关残差缩放的方法和设备
CN117014615B (zh) 视频编码方法、设备和非暂时性计算机可读存储介质
WO2024017224A1 (en) Affine candidate refinement
KR20230013163A (ko) 조합된 인터 및 인트라 예측을 위한 시스템 및 방법
CN116506610A (zh) 对视频信号编码的方法、计算设备、存储介质、程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination