CN117981315A - 视频编码中仿射合并模式的候选推导 - Google Patents

视频编码中仿射合并模式的候选推导 Download PDF

Info

Publication number
CN117981315A
CN117981315A CN202280063298.3A CN202280063298A CN117981315A CN 117981315 A CN117981315 A CN 117981315A CN 202280063298 A CN202280063298 A CN 202280063298A CN 117981315 A CN117981315 A CN 117981315A
Authority
CN
China
Prior art keywords
block
affine
scan
candidate
current block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280063298.3A
Other languages
English (en)
Inventor
陈伟
修晓宇
陈漪纹
朱弘正
郭哲玮
闫宁
王祥林
于冰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dajia Internet Information Technology Co Ltd
Original Assignee
Beijing Dajia Internet Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dajia Internet Information Technology Co Ltd filed Critical Beijing Dajia Internet Information Technology Co Ltd
Publication of CN117981315A publication Critical patent/CN117981315A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/537Motion estimation other than block-based
    • H04N19/54Motion estimation other than block-based using feature points or meshes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/129Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

提供了一种视频编解码的方法、装置及其非暂态计算机可读存储介质。所述方法包括从与当前块不相邻的多个不相邻邻近块获得一个或多个仿射候选。所述方法可以进一步包括基于一个或多个仿射候选来获得当前块的一个或多个控制点运动矢量(CPMV)。

Description

视频编码中仿射合并模式的候选推导
相关申请的交叉引用
本申请要求于2021年9月24日提交的名称为“Candidate Derivation for AffineMerge Mode in Video Coding[视频编码中仿射合并模式的候选推导]”的美国临时申请号63/248,401的优先权,所述美国临时申请的全文通过引用并入。
技术领域
本公开涉及视频编解码和压缩,并且具体地但不限于改进视频编码或解码过程中仿射运动预测模式的仿射合并候选推导的方法和装置。
背景技术
可以使用各种视频编解码技术来压缩视频数据。视频编解码是根据一个或多个视频编解码标准来执行的。例如,如今,一些众所周知的视频编解码标准包括通用视频编解码(VVC)、高效视频编解码(HEVC,也被称为H.265或MPEG-H第2部分)和高级视频编解码(AVC,也被称为H.264或MPEG-4第10部分),所述视频编解码标准由ISO/IEC MPEG和ITU-T VECG联合开发。AO媒体视频1(AV1)由开放媒体联盟(AOM)开发作为其先前标准VP9的后续标准。音视频编解码(AVS)(其是指数字音频和数字视频压缩标准)是中国数字音视频编解码技术标准工作组(Audio and Video Coding Standard Workgroup of China)开发的另一个视频压缩系列标准。大多数现有视频编解码标准建立在著名的混合视频编解码框架上,即,使用基于块的预测方法(例如,帧间预测、帧内预测)来减少视频图像或序列中存在的冗余,并使用变换编解码来压缩预测误差的能量。视频编解码技术的一个重要目标在于将视频数据压缩成使用较低比特率的形式同时避免或最小化视频质量降级。
第一代AVS标准包括中国国家标准“信息技术高级音视频编解码第2部分:视频”(被称为AVS1)和“信息技术高级音视频编解码第16部分:广播电视视频”(被称为AVS+)。与MPEG-2标准相比,第一代AVS标准可以在相同的感知质量下提供大约50%的比特率节省。AVS1标准视频部分于2006年2月作为中国国家标准颁布。第二代AVS标准包括中国国家标准“信息技术高效多媒体编解码”(被称为AVS2)系列,其主要针对额外HD TV节目的传输。AVS2的编解码效率是AVS+的编解码效率的两倍。2016年5月,AVS2作为中国国家标准发布。同时,AVS2标准视频部分由电气和电子工程师协会(IEEE)作为一项国际应用标准提交。AVS3标准是针对UHD视频应用的新一代视频编解码标准,旨在超越最新国际标准HEVC的编解码效率。2019年3月,在第68届AVS会议上,AVS3-P2基线已经完成,其提供了超过HEVC标准大约30%的比特率节省。目前,一款被称为高性能模型(HPM)的参考软件,由AVS工作组维护以展示AVS3标准的参考实施方式。
发明内容
本公开提供了与改进视频编码或解码过程中仿射运动预测模式的仿射合并候选推导相关的技术的示例。
根据本公开的第一方面,提供了一种视频编解码的方法。所述方法可以包括从与当前块不相邻的多个不相邻邻近块获得一个或多个仿射候选。进一步地,所述方法可以包括基于一个或多个仿射候选来获得当前块的一个或多个控制点运动矢量(CPMV)。
根据本公开的第二方面,提供了一种用于修剪仿射候选的方法。所述方法可以包括计算与第一仿射候选的一个或多个CPMV相关联的第一组仿射模型参数。此外,所述方法可以包括计算与第二仿射候选的一个或多个CPMV相关联的第二组仿射模型参数。此外,所述方法可以包括基于所述第一组仿射模型参数和所述第二组仿射模型参数来执行所述第一仿射候选与所述第二仿射候选之间的相似性检查。
根据本公开的第三方面,提供了一种用于视频编解码的装置。所述装置包括存储器和一个或多个处理器,所述存储器被配置为存储可由一个或多个处理器执行的指令。进一步地,所述一个或多个处理器在执行所述指令时被配置为执行根据第一方面或第二方面的方法。
根据本公开的第四方面,提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令在由一个或多个计算机处理器执行时使所述一个或多个计算机处理器执行根据第一方面或第二方面的方法。
附图说明
本公开的示例的更具体的描述将通过参照在附图中图示的具体示例来呈现。鉴于这些附图仅描绘了一些示例并且因此不应被认为是对范围的限制,将通过使用所附附图更具体和详细地描述和解释这些示例。
图1是根据本公开的一些示例的编码器的框图。
图2是根据本公开的一些示例的解码器的框图。
图3A是图示了根据本公开的一些示例的多类型树结构中的块分区的图。
图3B是图示了根据本公开的一些示例的多类型树结构中的块分区的图。
图3C是图示了根据本公开的一些示例的多类型树结构中的块分区的图。
图3D是图示了根据本公开的一些示例的多类型树结构中的块分区的图。
图3E是图示了根据本公开的一些示例的多类型树结构中的块分区的图。
图4A图示了根据本公开的一些示例的4参数仿射模型。
图4B图示了根据本公开的一些示例的4参数仿射模型。
图5图示了根据本公开的一些示例的6参数仿射模型。
图6图示了根据本公开的一些示例的用于继承的仿射合并候选的相邻邻近块。
图7图示了根据本公开的一些示例的用于构建的仿射合并候选的相邻邻近块。
图8图示了根据本公开的一些示例的用于继承的仿射合并候选的不相邻邻近块。
图9图示了根据本公开的一些示例的使用不相邻邻近块对构建的仿射合并候选的推导。
图10是图示了根据本公开的一些示例的不相邻邻近块的垂直扫描。
图11是图示了根据本公开的一些示例的不相邻邻近块的平行扫描。
图12是图示了根据本公开的一些示例的不相邻邻近块的组合垂直和平行扫描。
图13A图示了根据本公开的一些示例的具有与当前块相同尺寸的邻近块。
图13B图示了根据本公开的一些示例的具有与当前块不同尺寸的邻近块。
图14A图示了根据本公开的一些示例的将先前距离中的最底部块的左下块或右上块或将先前距离中的最右侧块的左下块或右上块用作当前距离的最底部块或最右侧块的示例。
图14A图示了根据本公开的一些示例的将先前距离中的最底部块的左侧块或顶部块或将先前距离中的最右侧块的左侧块或顶部块用作当前距离的最底部块或最右侧块的示例。
图15A图示了根据本公开的一些示例的用于上方和左侧不相邻邻近块的左下位置和右上位置的扫描位置。
图15B图示了根据本公开的一些示例的用于上方和左侧不相邻邻近块二者的右下位置的扫描位置。
图15C图示了根据本公开的一些示例的用于上方和左侧不相邻邻近块二者的左下位置的扫描位置。
图15D图示了根据本公开的一些示例的用于上方和左侧不相邻邻近块二者的右上位置的扫描位置。
图16图示了根据本公开的一些示例的用于推导构建的合并候选的简化扫描过程。
图17是图示了根据本公开的一些示例的与用户界面耦接的计算环境的图。
图18是图示了根据本公开的一些示例的用于视频编解码的方法的流程图。
图19是图示了根据本公开的一些示例的用于修剪仿射候选的方法的流程图。
图20是图示了根据本公开的一些示例的用于对视频块进行编码和解码的***的框图。
具体实施方式
现在将详细参照具体实施方式,附图中图示了所述实施方式的示例。在以下详细描述中,阐述了许多非限制性的具体细节,以便帮助理解本文提出的主题。但是对于本领域普通技术人员将显而易见的是,可以使用各种替代方案。例如,对于本领域普通技术人员将显而易见的是,本文提出的主题可以在具有数字视频能力的许多类型的电子设备上实施。
贯穿本说明书对“一个实施例”、“实施例”、“示例”、“一些实施例”、“一些示例”、或类似语言的提及意味着所描述的特定特征、结构、或特性包括在至少一个实施例或示例中。除非另有明确说明,否则结合一个或一些实施例描述的特征、结构、要素、或特性也适用于其他实施例。
贯穿本公开,术语“第一”、“第二”、“第三”等都用作命名法,仅用于提及相关要素,例如设备、部件、组分、步骤等,除非另有明确说明,否则不暗示任何空间或时间顺序。例如,“第一设备”和“第二设备”可以指两个单独形成的设备,或者同一设备的两个部分、部件或工作状态,并且可以任意命名。
术语“模块”、“子模块”、“电路(circuit)”、“子电路(sub-circuit)”、“电路(circuitry)”、“子电路(sub-circuitry)”、“单元”、或“子单元”可以包括存储器(共享、专用、或组),所述存储器存储可以由一个或多个处理器执行的代码或指令。模块可以包括具有或不具有存储的代码或指令的一个或多个电路。模块或电路可以包括直接或间接连接的一个或多个部件。这些部件可能会或可能不会物理地附接到彼此或彼此相邻。
如本文所使用的,取决于上下文,术语“如果”或“当……时”可以被理解为意指“在……时”或“响应于”。这些术语如果出现在权利要求中,可能并不指示相关限制或特征是有条件的或可选的。例如,一种方法可以包括以下步骤:i)当或如果条件X存在时,执行功能或动作X',以及ii)当或如果条件Y存在时,执行功能或动作Y'。所述方法可以同时具备执行功能或动作X'的能力和执行功能或动作Y’的能力。因此,功能X'和Y'可以在不同的时间在所述方法的多次执行中被执行。
单元或模块可以纯软件实施,也可以纯硬件实施,也可以硬件与软件结合实施。例如,在纯软件实施方式中,单元或模块可以包括直接或间接链接在一起的功能相关的代码块或软件部件,以执行特定功能。
图20是图示了根据本公开的一些实施方式的用于并行地对视频块进行编码和解码的示例性***10的框图。如图20所示,***10包括源设备12,所述源设备生成并编码要由目的地设备14在稍后时间解码的视频数据。源设备12和目的地设备14可以包括多种电子设备中的任一种,所述多种电子设备包括台式计算机或膝上型计算机、平板计算机、智能电话、机顶盒、数字电视、相机、显示设备、数字媒体播放器、视频游戏机、视频流式传输设备等。在一些实施方式中,源设备12和目的地设备14配备有无线通信能力。
在一些实施方式中,目的地设备14可以经由链路16接收要解码的已编码视频数据。链路16可以包括能够将已编码视频数据从源设备12移到目的地设备14的任何类型的通信介质或设备。在一个示例中,链路16可以包括用于使源设备12能够实时地将已编码视频数据直接传输到目的地设备14的通信介质。已编码视频数据可以根据如无线通信协议等通信标准来调制并传输到目的地设备14。通信媒体可以包括任何无线或有线通信媒体,如射频(RF)频谱或一条或多条物理传输线。通信介质可以形成基于分组的网络(如局域网、广域网、或全球网(如互联网))的一部分。通信介质可以包括路由器、交换机、基站、或可以用于促进从源设备12到目的地设备14的通信的任何其他装置。
在一些其他实施方式中,已编码视频数据可以从输出接口22传输到存储设备32。随后,存储设备32中的已编码视频数据可以由目的地设备14经由输入接口28访问。存储设备32可以包括各种分布式或本地访问的数据存储介质中的任一种,如硬盘驱动器、蓝光光盘、数字通用盘(DVD)、光碟只读存储器(CD-ROM)、闪速存储器、易失性存储器或非易失性存储器、或用于存储已编码视频数据的任何其他合适的数字存储介质。在进一步的示例中,存储设备32可以对应于可以保持由源设备12生成的已编码视频数据的文件服务器或另一个中间存储设备。目的地设备14可以经由流传输或下载从存储设备32访问所存储的视频数据。文件服务器可以是能够存储已编码视频数据并且将已编码视频数据传输到目的地设备14的任何类型的计算机。示例性文件服务器包括web服务器(例如,用于网站)、文件传输协议(FTP)服务器、网络附加存储(NAS)设备、或本地磁盘驱动器。目的地设备14可以通过任何标准数据连接来访问已编码视频数据,所述连接包括适于访问存储在文件服务器上的已编码视频数据的无线信道(例如,无线保真(Wi-Fi)连接)、有线连接(例如,数字用户线(DSL)、电缆调制解调器等)、或两者的组合。从存储设备32传输已编码视频数据可以是流式传输、下载传输、或两者的组合。
如图20所示,源设备12包括视频源18、视频编码器20和输出接口22。视频源18可以包括如视频捕获设备等源,例如摄像机、包含先前捕获的视频的视频档案、用于从视频内容提供方接收视频的视频馈送接口和/或用于生成计算机图形数据作为源视频的计算机图形***或这种源的组合。作为一个示例,如果视频源18是安全监控***的摄像机,则源设备12和目的地设备14可以形成拍照电话或视频电话。然而,本申请中描述的实施方式通常可以适用于视频编解码并且可以应用于无线和/或有线应用。
捕获的、预先捕获的、或计算机生成的视频可以由视频编码器20进行编码。已编码视频数据可以经由源设备12的输出接口22直接传输到目的地设备14。已编码视频数据也可以(或替代性地)存储到存储设备32上,以供目的地设备14或其他设备以后访问,以进行解码和/或回放。输出接口22可以进一步包括调制解调器和/或发射器。
目的地设备14包括输入接口28、视频解码器30、以及显示设备34。输入接口28可以包括接收器和/或调制解调器,并且通过链路16接收已编码视频数据。通过链路16传送的或提供在存储设备32上的已编码视频数据可以包括由视频编码器20生成的各种语法元素,以供视频解码器30用于解码视频数据。这种语法元素可以被包括于在通信介质上传输的、存储在存储介质上的、或存储在文件服务器上的已编码视频数据内。
在一些实施方式中,目的地设备14可以包括显示设备34,所述显示设备可以是集成显示设备和被配置为与目的地设备14通信的外部显示设备。显示设备34向用户显示经解码视频数据并且可以包括各种显示设备中的任一种,如液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器、或另一种类型的显示设备。
视频编码器20和视频解码器30可以根据专有或行业标准(如VVC、HEVC、MPEG-4第10部分、AVC、或这种标准的扩展)进行操作。应当理解,本申请不限于特定的视频编码/解码标准,并且可以适用于其他视频编码/解码标准。通常设想,源设备12的视频编码器20可以被配置为根据这些当前或未来标准中的任一种来对视频数据进行编码。类似地,通常还设想,目的地设备14的视频解码器30可以被配置为根据这些当前或未来标准中的任一种来对视频数据进行解码。
视频编码器20和视频解码器30各自可以实施为各种合适的编码器和/或解码器电路中的任一种,如一个或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合。当部分地在软件中实施时,电子设备可以将用于软件的指令存储在合适的非暂态计算机可读介质中并且使用一个或多个处理器在硬件中执行指令以执行本公开中公开的视频编码/解码操作。视频编码器20和视频解码器30中的每一个可以包括在一个或多个编码器或解码器中,所述一个或多个编码器或解码器中的任一个可以集成为相应设备中的组合编码器/解码器(CODEC)的一部分。
与HEVC一样,VVC在基于块的混合视频编解码框架上构建。图1是图示了根据本公开的一些实施方式的基于块的视频编码器的框图。在编码器100中,逐块(称为编解码单元(CU))对输入视频信号进行处理。编码器100可以是如图20所示的视频编码器20。在VTM-1.0中,CU可以高达128×128像素。然而,不同于仅仅基于四叉树来将块分区的HEVC,在VVC中,一个编码树单元(CTU)被拆分成多个CU,以适应基于四/二/三叉树而不同的局部特性。另外,HEVC中的多种分区单元类型的概念被移除了,即,CU、预测单元(PU)和变换单元(TU)的划分不再存在于VVC中;相反,每个CU一直用作预测和变换两者的基本单元,而不进行进一步分割。在多类型树结构中,一个CTU首先被四叉树结构分区。然后,每个四叉树叶节点可以进一步被二叉树结构和三叉树结构分区。
图3A至图3E是图示了根据本公开的一些实施方式的多类型树划分模式的示意图。图3A至图3E分别示出了五种划分类型,包括四元分区(图3A)、垂直二元分区(图3B)、水平二元分区(图3C)、垂直扩展三元分区(图3D)和水平扩展三元分区(图3E)。
对于每个给定的视频块,可以执行空间预测和/或时间预测。空间预测(或“帧内预测”)使用来自同一视频图片/条带中的已经编解码的邻近块的样点(被称为参考样点)的像素来预测当前视频块。空间预测减少了视频信号中固有的空间冗余。时间预测(也被称为“帧间预测”或“运动补偿预测”)使用来自已经编解码的视频图片的重建像素来预测当前视频块。时间预测减少了在视频信号中固有的时间冗余。给定CU的时间预测信号通常由指示当前CU与其时间参考之间的运动量和运动方向的一个或多个运动矢量(MV)用信号发送。同样,如果支持多个参考图片,则另外发送一个参考图片索引,所述参考图片索引用于标识时间预测信号来自参考图片存储中的哪个参考图片。
在空间预测和/或时间预测之后,编码器100中的帧内/帧间模式决策电路121例如基于率失真优化方法来选择最佳预测模式。然后,从当前视频块减去块预测值120;并且使用变换电路102和量化电路104对所产生的预测残差进行解相关。通过反量化电路116对所产生的量化残差系数进行反量化,并通过逆变换电路118对所述量化残差系数进行逆变换,以形成重建残差,然后将所述重建残差加回到预测块以形成CU的重建信号。进一步地,在将重建的CU置于图片缓冲器117的参考图片存储中并将其用于对未来的视频块进行编解码之前,可以对所述重建的CU应用环路滤波115,如去块滤波器、样点自适应偏移(SAO)和/或自适应环路滤波器(ALF)。为了形成输出视频比特流114,将编码模式(帧间或帧内)、预测模式信息、运动信息、以及量化残差系数都发送至熵编码单元106,以进行进一步压缩和打包来形成比特流。
例如,去块滤波器在VVC的当前版本以及AVC、HEVC中是可用的。在HEVC中,定义了称为SAO的附加环路滤波器以进一步提高编解码效率。在VVC标准的当前版本中,称为ALF的另一种环路滤波器正在积极研究,并且其很有可能被纳入最终标准中。
这些环路滤波器操作是可选的。执行这些操作有助于提高编码效率和视觉质量。这些操作也可以按照编码器100做出的决策而被取消,以节省计算复杂度。
应该注意的是,如果这些滤波器选项被编码器100开启,则帧内预测通常基于未滤波的重建像素,而帧间预测基于滤波的重建像素。
图2是图示了可以与许多视频编解码标准结合使用的基于块的视频解码器200的框图。该解码器200与位于图1的编码器100中的重建相关的部分类似。基于块的视频解码器200可以是如图20所示的视频解码器30。在解码器200中,首先通过熵解码202对传入视频比特流201进行解码以得到量化系数级别和预测相关信息。然后,通过反量化204和逆变换206来处理量化系数等级,以获得重建预测残差。在帧内/帧间模式选择器212中实施的块预测值机制被配置为基于经解码的预测信息来执行帧内预测208或运动补偿210。通过使用加法器214对来自逆变换206的重建预测残差与由块预测值机制生成的预测输出进行求和来获得一组未滤波的重建像素。
重建块在被存储在用作参考图片存储的图片缓冲器213之前可以经过环路滤波器209。图片缓冲器213中的重建视频可以被发送以驱动显示设备,并用于预测未来的视频块。在环路滤波器209被开启的情况下,对这些重建像素执行滤波操作,从而得到最终的重建视频输出222。
在当前的VVC和AVS3标准中,当前编码块的运动信息要么是从由合并候选索引指定的空间或时间邻近块复制的,要么是通过运动估计的显式信令获得的。本公开的重点是通过改进仿射合并候选的推导方法来提高仿射合并模式的运动矢量的准确性。为了便于描述本公开,使用VVC标准中的现有仿射合并模式设计作为示例来说明所提出的思想。请注意,虽然在整个公开中使用VVC标准中的现有仿射模式设计作为示例,但是对于现代视频编解码技术领域的技术人员来说,所提出的技术也可以应用于仿射运动预测模式的不同设计或具有相同或相似设计精神的其他编解码工具。
仿射模型
在HEVC中,仅将平移运动模型应用于运动补偿预测。然而在现实世界中,存在很多种运动,例如,放大/缩小、旋转、透视运动和其他不规则运动。在VVC和AVS3中,通过针对每个帧间编码块用信号发送一个标志来指示是平移运动模型还是仿射运动模型被应用于帧间预测,以此应用仿射运动补偿预测。在当前VVC和AVS3设计中,一个仿射编码块支持两种仿射模式,包括4参数仿射模式和6参数仿射模式。
4参数仿射模型具有以下参数:分别用于水平方向和垂直方向上的平移运动的两个参数,用于缩放运动的一个参数和用于这两个方向的旋转运动的一个参数。在该模型中,水平缩放参数等于垂直缩放参数,而水平旋转参数等于垂直旋转参数。为了更好地适应运动矢量和仿射参数,这些仿射参数将从位于当前块的左上角和右上角的两个MV(也被称为控制点运动矢量(CPMV))中推导出。如图4A至图4B所示,块的仿射运动场由两个CPMV(V0,V1)来描述。基于控制点运动,一个仿射编码块的运动场(vx,vy)被描述为:
6参数仿射模式具有以下参数:分别用于水平方向和垂直方向上的平移运动的两个参数,分别用于水平方向上的缩放运动和旋转运动的两个参数,分别用于垂直方向上的缩放运动和旋转运动的两个参数。6参数仿射运动模型是用三个CPMV来编解码的。如图5所示,一个6参数仿射块的三个控制点位于所述块的左上角、右上角和左下角。左上控制点处的运动与平移运动相关,并且右上控制点处的运动与水平方向的旋转和缩放运动相关,并且左下控制点处的运动与垂直方向的旋转和缩放运动相关。与4参数仿射运动模型相比,6参数在水平方向上的旋转和缩放运动可能与在垂直方向上的那些运动不同。假设(V0,V1,V2)是图5中当前块的左上角、右上角和左下角的MV,则使用控制点处的这三个MV可以得到每个子块的运动矢量(vx,vy)为:
仿射合并模式
在仿射合并模式中,当前块的CPMV没有显式地用信号发送,而是从邻近块推导出。具体地,在该模式中,空间邻近块的运动信息被用来生成当前块的CPMV。仿射合并模式候选列表的大小有限。例如,在当前VVC设计中,最多可能有五个候选。编码器可以基于率失真优化算法来评估和选择最佳候选索引。然后将所选择的候选索引用信号发送到解码器侧。仿射合并候选可以用三种方式来决定。在第一种方式中,仿射合并候选可以从邻近的仿射编码块继承。在第二种方式中,仿射合并候选可以根据来自邻近块的平移MV来构建。在第三种方式中,零MV被用作仿射合并候选。
对于继承的方法,最多可能有两个候选。这些候选是从位于当前块左下的邻近块(例如,如图6所示,扫描顺序是从A0到A1)以及从位于当前块右上的邻近块获得的(例如,如图6所示,扫描顺序是从B0到B2)(如果可用的话)。
对于构建的方法,候选是邻***移MV的组合,这可以通过两个步骤生成。
步骤1:从可用邻***移MV获得四个平移MV,包括MV1、MV2、MV3和MV4。
MV1:来自靠近当前块左上角的三个邻近块之一的MV。如图7所示,扫描顺序为B2、B3和A2。
MV2:来自靠近当前块右上角的这两个邻近块之一中的一个的MV。如图7所示,扫描顺序为B1和B0。
MV3:来自靠近当前块左下角的这两个邻近块之一中的一个的MV。如图7所示,扫描顺序为A1和A0。
MV4:来自靠近当前块右下角的邻近块的时间上同位的块的MV。如图所示,邻近块为T。
步骤2:基于来自步骤1中的四个平移MV来推导出组合。
组合1:MV1、MV2、MV3;
组合2:MV1、MV2、MV4;
组合3:MV1、MV3、MV4;
组合4:MV2、MV3、MV4;
组合5:MV1、MV2;
组合6:MV1、MV3。
当合并候选列表在用继承的候选和构建的候选填充之后未满时,零MV被***在列表的末尾。
当前视频标准VVC和AVS仅使用相邻的邻近块来推导当前块的仿射合并候选,如图6和图7中分别针对继承的候选和构建的候选所示。为了增加合并候选的多样性并进一步探索空间相关性,可以直接将邻近块的覆盖范围从相邻区域扩展到不相邻区域。
在本公开中,通过不仅使用相邻邻近块而且还使用不相邻邻近块来扩展仿射合并模式的候选推导过程。详细方法可以概括为三个方面,包括仿射合并候选修剪、继承的仿射合并候选的基于不相邻邻近块的推导过程、以及构建的仿射合并候选的基于不相邻邻近块的推导过程。
仿射合并候选修剪
由于典型视频编解码标准中的仿射合并候选列表的大小通常有限,因此候选修剪是移除冗余的仿射合并候选的必要过程。对于继承的仿射合并候选和构建的仿射合并候选二者,都需要这种修剪过程。如引言部分中所解释的,当前块的CPMV不直接用于仿射运动补偿。而是,需要将CPMV转换为当前块内每个子块位置处的平移MV。通过按照如下所示的一般仿射模型来执行转换过程:
其中,(a,b)是差量平移参数,(c,d)是水平方向的差量缩放和旋转参数,(e,f)是垂直方向的差量缩放和旋转参数,(x,y)是子块的枢转位置(例如,中心或左上角)相对于当前块的左上角(例如,图5所示的坐标(x,y))的水平距离和垂直距离,并且(vx,vy)是子块的目标平移MV。
对于6参数仿射模型,三个CPMV(被称为V0、V1和V2)可用。然后这六个模型参数a、b、c、d、e和f可以被计算为
对于4参数仿射模型,如果左上角的CPMV和右上角的CPMV(被称为V0和V1)可用,则这六个参数a、b、c、d、e和f可以被计算为
对于4参数仿射模型,如果左上角的CPMV和左下角的CPMV(被称为V0和V2)可用,则这六个参数a、b、c、d、e和f可以被计算为
在上面的等式(4)、(5)和(6)中,w和h分别表示当前块的宽度和高度。
当比较CPMV的两个合并候选集以进行冗余检查时,建议检查6个仿射模型参数的相似性。因此,候选修剪过程可以分两步进行。
在步骤1中,在给定CPMV的两个候选集的情况下,推导出每个候选集的对应仿射模型参数。更具体地,CPMV的这两个候选集可以由两组仿射模型参数来表示,例如(a1,b1,c1,d1,e1,f1)和(a2,b2,c2,d2,e2,f2)。
在步骤2中,基于一个或多个预定义的阈值,对这两组仿射模型参数进行相似性检查。在一个实施例中,当(a1-a2)、(b1-b2)、(c1-c2)、(d1-d2)、(e1-e2)和(f1-f2)的绝对值都低于正阈值(比如值1)时,这两个候选被认为是相似的并且其中之一可以被修剪/移除并且不被放入合并候选列表中。
在一些实施例中,可以移除步骤1中的除法或右移操作以简化CPMV修剪过程中的计算。
具体地,可以在不除以当前块的宽度w和高度h的情况下来计算模型参数c、d、e和f。例如,以上面的等式(4)作为示例,近似模型参数c'、d'、e'和f'可以如下式(7)计算。
在只有两个CPMV可用的情况下,模型参数的一部分是取决于当前块的宽度或高度从模型参数的另一部分推导出的。在这种情况下,可以转换模型参数以考虑宽度和高度的影响。例如,在等式(5)的情况下,可以基于下面的等式(8)来计算近似模型参数c'、d'、e'和f'。在等式(6)的情况下,可以基于下面的等式(9)来计算近似模型参数c'、d'、e'和f'。
当在上面的步骤1中计算了近似模型参数c'、d'、e'和f'时,在上面的步骤2中相似性检查所需的绝对值的计算可以相应地改变:(a1-a2)、(b1-b2)、(c1′-c2′)、(d1′-d2′)、(e1′-e2′)和(f1′-f2′)。
在上面的步骤2中,需要阈值来评估CPMV的两个候选集之间的相似性。可以有多种方式来定义阈值。在一个实施例中,可以为每个可比较的参数定义阈值。表1是该实施例中的一个示例,示出了为每个可比较的模型参数定义的阈值。在另一实施例中,可以通过考虑当前编码块的尺寸来定义阈值。表2是该实施例中的一个示例,示出了由当前编码块的尺寸定义的阈值。
表1
可比较的参数 阈值
a 1
b 1
c 2
d 2
e 2
f 2
表2
当前块的尺寸 阈值
尺寸<=64像素 1
64像素<尺寸<=256像素 2
256像素<尺寸<=1024像素 4
1024像素<尺寸 8
在另一实施例中,可以通过考虑当前块的权重或高度来定义阈值。表3和表4是该实施例的示例。表3示出了由当前编码块的宽度定义的阈值,并且表4示出了由当前编码块的高度定义的阈值。
表3
当前块的宽度 阈值
宽度<=8像素 1
8像素<宽度<=32像素 2
32像素<宽度<=64像素 4
64像素<宽度 8
表4
当前块的高度 阈值
高度<=8像素 1
8像素<高度<=32像素 2
32像素<高度<=64像素 4
64像素<高度 8
在另一实施例中,阈值可以被定义为一组固定值。在另一实施例中,阈值可以由以上实施例的任意组合来定义。在一个示例中,可以通过考虑不同的参数以及当前块的权重和高度来定义阈值。表5是该实施例中的一个示例,示出了由当前编码块的高度定义的阈值。注意,在任何上述提出的实施例中,如果需要的话,可比较的参数可以表示从等式(4)到等式(9)的任何等式中定义的任何参数。
表5
/>
使用转换后的仿射模型参数以进行候选冗余检查的好处包括:它为具有不同仿射模型类型的候选创建统一的相似性检查过程,例如,一个合并候选可能使用具有三个CPMV的6参数仿射模型,而另一候选可能使用具有两个CPMV的4参数仿射模型;在推导出每个子块的目标MV时,考虑合并候选中每个CPMV的不同影响;以及它提供两个仿射合并候选的与当前块的宽度和高度相关的相似性意义。
继承的仿射合并候选的基于不相邻邻近块的推导过程
对于继承的合并候选,基于不相邻邻近块的推导过程可以分三个步骤来执行。步骤1是用于候选扫描。步骤2是用于CPMV投影。步骤3是候选修剪。
在步骤1中,通过以下方法扫描并选择不相邻邻近块。
扫描区域及距离
在一些示例中,可以从当前编码块的左侧区域和上方区域扫描不相邻邻近块。扫描距离可以定义为从扫描位置到当前编码块的左侧或顶侧的编码块的数量。
如图8所示,在当前编码块的左侧或上方,可以扫描多行不相邻邻近块。如图8所示的距离表示从每个候选位置到当前块的左侧或顶侧的编码块的数量。例如,当前块左侧具有“距离2”的区域指示位于该区域中的候选邻近块与当前块相距2个块。类似的指示可以应用于具有不同距离的其他扫描区域。
在一个或多个实施例中,每个距离处的不相邻邻近块可以具有与当前编码块相同的块尺寸,如图13A所示。如图13A所示,左侧的不相邻邻近块1301和上侧的不相邻邻近块1302具有与当前块1303相同的尺寸。在一些实施例中,每个距离处的不相邻邻近块可以与当前编码块不同的块尺寸,如图13B所示。邻近块1304是与当前块1303相邻邻近块。如图13B所示,左侧的不相邻邻近块1305和上侧的不相邻邻近块1306具有与当前块1307相同的尺寸。邻近块1308是与当前块1307相邻邻近块。
注意,当每个距离处的不相邻邻近块具有与当前编码块相同的块尺寸时,根据图像中的每个不同区域处的分区粒度来自适应地改变块尺寸的值。注意,当每个距离处的不相邻邻近块的具有与当前编码块不同的块尺寸时,块尺寸的值可以被预定义为恒定值,比如4×4、8×8或16×16。
基于定义的扫描距离,当前编码块左侧或上方的扫描区域的总尺寸可以通过可配置的距离值来确定。在一个或多个实施例中,左侧和上侧的最大扫描距离可以使用相同的值或不同的值。图13示出了左侧和上侧的最大距离共享相同值2的示例。(多个)最大扫描距离值可以由编码器侧确定并在比特流中用信号发送。可替代地,(多个)最大扫描距离值可以被预定义为(多个)固定值,比如值2或4。当最大扫描距离预定义为值4时,这指示当候选列表已满或所有最大距离为4的不相邻邻近块都已经被扫描时(以先到者为准),扫描过程终止。
在一个或多个实施例中,在特定距离的每个扫描区域内,起始邻近块和结束邻近块可以是位置相关的。
在一些实施例中,对于左侧扫描区域,起始邻近块可以是具有较小距离的相邻扫描区域中的起始邻近块的相邻左下块。例如,如图8所示,当前块左侧的“距离2”扫描区域的起始邻近块是“距离1”扫描区域的起始邻近块的相邻的左下邻近块。结束邻近块可以是与具有较小距离的上方扫描区域中的结束邻近块的相邻的左侧块。例如,如图8所示,当前块左侧的“距离2”扫描区域的结束邻近块是当前块上方的“距离1”扫描区域的结束邻近块的相邻的左侧邻近块。
类似地,对于上侧扫描区域,起始邻近块可以是具有较小距离的相邻扫描区域中的起始邻近块的右上相邻块。结束邻近块可以是具有较小距离的相邻扫描区域中的结束邻近块的左上相邻块。
扫描顺序
当在不相邻区域中扫描邻近块时,可以遵循一定的顺序或/和规则来确定对扫描的邻近块的选择。
在一些实施例中,首先可以扫描左侧区域,然后再扫描上方区域。如图8所示,首先可以扫描左侧的三行不相邻区域(例如从距离1到距离3),然后再扫描当前块上方的三行不相邻区域。
在一些实施例中,可以交替地扫描左侧区域和上方区域。例如,如图8所示,首先扫描具有“距离1”的左侧扫描区域,然后再扫描具有“距离1”的上方区域。
对于位于同一侧的扫描区域(例如左侧区域或上方区域),扫描顺序是从距离较小的区域到距离较大的区域。该顺序可以与扫描顺序的其他实施例灵活组合。例如,可以交替地扫描左侧区域和上方区域,并且将同一侧区域的顺序安排为从小距离到大距离。
可以定义在特定距离的每个扫描区域内的扫描顺序。在一个实施例中,对于左侧扫描区域,扫描可以从底部邻近块开始到顶部邻近块。对于上方扫描区域,扫描可以从右侧块开始到左侧块。
扫描终止
对于继承的合并候选,用仿射模式编码的邻近块被定义为合格候选。在一些实施例中,扫描过程可以交互式地执行。例如,在特定距离的特定区域中执行的扫描可以在识别出前X个合格候选的时刻停止,其中X是预定义的正值。例如,如图8所示,距离1的左侧扫描区域中的扫描可以在识别出第一一个或多个合格候选时停止。然后,通过针对另一扫描区域来开始扫描过程的下一次迭代,这通过预定义的扫描顺序/规则来调节。
在一些实施例中,扫描过程可以连续地执行。例如,在特定距离处的特定区域中执行的扫描可以在扫描了所有覆盖的邻近块并且没有识别出更多的合格候选或者达到最大可允许候选数的时刻停止。
在候选扫描过程中,通过按照上面提出的扫描方法来确定和扫描每个候选不相邻邻近块。为了更容易实施,每个候选不相邻邻近块可以由特定的扫描位置来指示或定位。一旦通过按照上面提出的方法决定了具体扫描区域和距离,就可以基于以下方法相应地确定扫描位置。
在一种方法中,左下和右上位置分别用于上方和左侧不相邻邻近块,如图15A所示。
在另一种方法中,右下位置用于上方和左侧不相邻邻近块二者,如图15B所示。
在另一种方法中,左下位置用于上方和左侧不相邻邻近块二者,如图15C所示。
在另一种方法中,右上位置用于上方和左侧不相邻邻近块二者,如图15D所示。
为了更容易说明,在图15A至图15D中,假设每个不相邻邻近块具有与当前块相同的块尺寸。不失一般性,该图示可以容易地扩展到具有不同块尺寸的不相邻邻近块。
进一步地,在步骤2中,可以利用与当前AVS和VVC标准中使用的相同的CPMV投影过程。在这种CPMV投影过程中,假设当前块与所选邻近块共享相同的仿射模型,则将两个或三个角像素的坐标(例如,如果当前块使用4参数模型,则使用两个坐标(左上像素/样点位置和右上像素/样点位置);如果当前块使用6参数模型,则使用三个坐标(左上像素/样点位置、右上像素/样点位置和左下像素/样点位置))代入等式(1)或(2)中(这取决于邻近块是用4参数仿射模型还是6参数仿射模型进行编码)以生成两个或三个CPMV。
在步骤3中,在步骤1中识别并在步骤2中转换的任何合格候选都可以对照已经在合并候选列表中的所有现有候选进行相似性检查。相似性检查的细节已经在上面的仿射合并候选修剪部分中进行了描述。如果发现新的合格候选与候选列表中的任何现有候选相似,则移除/修剪该新的合格候选。
构建的仿射合并候选的基于不相邻邻近块的推导过程
在推导继承的合并候选的情况下,一次识别一个邻近块,其中该单个邻近块需要以仿射模式编解码,并且可以包含两个或三个CPMV。在推导构建的合并候选的情况下,可以一次识别两个或三个邻近块,其中每个识别的邻近块不需要以仿射模式编解码,并且仅从该块中获取一个平移MV。
图9呈现了可以通过使用不相邻邻近块来推导出构建的仿射合并候选的示例。在图9中,A、B、C为三个不相邻邻近块的地理位置。通过使用A位置作为左上角、B位置作为右上角以及C位置作为左下角来形成虚拟编码块。如果将虚拟CU视为仿射编码块,则位置A'、B'和C'处的MV可以通过按照等式(3)来推导出,其中模型参数(a,b,c,d,e,f)可以通过位置A、B、C处的平移MV来计算。一旦推导出,位置A'、B'、C'处的MV就可以被用作当前块的三个CPMV,并且可以使用生成构建的仿射合并候选的现有过程(在AVS和VVC标准中使用的过程)。
对于构建的合并候选,基于不相邻邻近块的推导过程可以分五个步骤来执行。基于不相邻邻近块的推导过程可以在诸如编码器或解码器的装置中分五个步骤来执行。步骤1是用于候选扫描。步骤2是用于仿射模型确定。步骤3是用于CPMV投影。步骤4是用于候选生成。并且步骤5是用于候选修剪。在步骤1中,可以通过以下方法扫描并选择不相邻邻近块。
扫描区域及距离
在一些实施例中,为了维持矩形编码块,仅对两个不相邻邻近块执行扫描过程。第三个不相邻邻近块可以取决于第一个不相邻邻近块和第二个不相邻邻近块的水平和垂直位置。
在一些实施例中,如图9所示,仅对位置B和C执行扫描过程。位置A可以通过C的水平位置和B的垂直位置来唯一确定。在这种情况下,扫描区域和距离可以根据特定的扫描方向来定义。
在一些实施例中,扫描方向可以垂直于当前块的一侧。图10中示出了一个示例,其中扫描区域被定义为当前块左侧或上方的一行连续运动场。扫描距离被定义为从扫描位置到当前块的一侧的运动场数。注意,运动场的尺寸可以取决于适用的视频编解码标准的最大粒度。在图10所示的示例中,假设运动场的尺寸与当前VVC标准一致并被设置为4×4。
在一些实施例中,扫描方向可以平行于当前块的一侧。图11中示出了一个示例,其中扫描区域被定义为当前块左侧或上方的一行连续编码块。
在一些实施例中,扫描方向可以是垂直于和平行于当前块的一侧的扫描的组合。图12中示出了一个示例。如图12所示,扫描方向也可以是平行和对角线的组合。位置B处的扫描从左到右开始,然后沿对角线方向扫描到左上的块。将重复位置B处的扫描,如图12所示。类似地,位置C处的扫描从上到下开始,然后沿对角线方向扫描到左上的块。将重复位置C处的扫描,如图12所示。
扫描顺序
在一些实施例中,扫描顺序可以被定义为从距当前编码块距离较小的位置到距当前编码块距离较大的位置。该顺序可以应用于垂直扫描的情况。
在一些实施例中,扫描顺序可以被定义为固定模式。该固定模式扫描顺序可以用于具有相似距离的候选位置。一个示例是平行扫描的情况。在一个示例中,对于左侧扫描区域,扫描顺序可以被定义为从上到下的方向,并且对于上方扫描区域,扫描顺序可以被定义为从左到右的方向,如图11所示的示例。
对于组合扫描方法的情况,扫描顺序可以是固定模式和与距离相关的组合,如图12所示的示例。
扫描终止
对于构建的合并候选,合格候选不需要是仿射编解码的,因为只需要平移MV。
根据所需的候选数量,当识别出前X个合格候选时,可以终止扫描过程,其中X是正值。
如图9所示,为了形成虚拟编码块,需要被命名为A、B和C的三个角。为了更容易实施,步骤1中的扫描过程可以仅用于识别位于角B和角C的不相邻邻近块,而A的坐标可以通过取C的水平坐标和B的垂直坐标来精确确定。这样,形成的虚拟编码块被限制为矩形。当B点或C点不可用(例如超出边界)时,或者与B或C相对应的不相邻邻近块处的运动信息不可用时,C的水平坐标或垂直坐标可以被分别定义为当前块左上点的水平坐标或垂直坐标。
为了统一的目的,所提出的用于推导继承的合并候选的定义扫描区域和距离、扫描顺序和扫描终止的方法可以完全或部分地重新用于推导构建的合并候选。在一个或多个实施例中,为继承的合并候选扫描定义的相同方法(包括但不限于扫描区域和距离、扫描顺序和扫描终止)可以完全重新用于构建的合并候选扫描。
在一些实施例中,为继承的合并候选扫描定义的相同方法可以部分地重新用于构建的合并候选扫描。图16示出了这种情况的示例。在图16中,每个不相邻邻近块的块尺寸与当前块相同,这与继承的候选扫描的定义类似,但是整个过程是简化的版本,因为每个距离处的扫描被限制为仅一个块。
在步骤2中,评估在步骤1之后选择的候选的位置处的平移MV,并且可以确定适当的仿射模型。为了更容易说明且不失一般性,图9再次被用作示例。
由于诸如硬件限制、实施复杂性和不同的参考索引等因素,扫描过程可能在识别出足够数量的候选之前终止。例如,步骤1之后所选择的候选中的一个或多个处的运动场的运动信息可能不可用。
如果所有三个候选的运动信息都可用,则对应的虚拟编码块表示6参数仿射模型。如果三个候选之一的运动信息是不可用,则对应的虚拟编码块表示4参数仿射模型。如果三个候选中多于一个的运动信息不可用,则对应的虚拟编码块可能不能表示有效的仿射模型。
在一些实施例中,如果虚拟编码块的左上角(例如图9中的角A)处的运动信息不可用,或者右上角(例如图9中的角B)和左下角(例如图9中的角C)的运动信息都不可用,则虚拟块可以被设置为无效,并且不能表示有效的模型,那么对于当前迭代,可以跳过步骤3和步骤4。
在一些实施例中,如果右上角(例如,图9中的角B)或左下角(例如,图9中的角C)不可用,但不是两者都不可用,则虚拟块可以表示有效的4参数仿射模型。
在步骤3中,如果虚拟编码块能够表示有效的仿射模型,则可以使用用于继承的合并候选的相同投影过程。
在一个或多个实施例中,可以使用与用于继承的合并候选的相同投影过程。在这种情况下,由来自步骤2的虚拟编码块表示的4参数模型被投影到当前块的4参数模型,并且由来自步骤2的虚拟编码块表示的6参数模型被投影到当前块的6参数模型。
在一些实施例中,由来自步骤2的虚拟编码块表示的仿射模型总是被投影到当前块的4参数模型或6参数模型。
注意,根据等式(5)和(6),可以有两种类型的4参数仿射模型,其中,类型A是左上角CPMV和右上角CPMV(被称为V0和V1)可用,并且类型B是左上角CPMV和左下角CPMV(被称为V0和V2)可用。
在一个或多个实施例中,投影的4参数仿射模型的类型与由虚拟编码块表示的4参数仿射模型的类型相同。例如,由来自步骤2的虚拟编码块表示的仿射模型是类型A或类型B的4参数仿射模型,则当前块的投影仿射模型也分别是类型A或类型B。
在一些实施例中,由来自步骤2的虚拟编码块表示的4参数仿射模型总是被投影到当前块的相同类型的4参数模型。例如,由虚拟编码块表示的类型A或类型B的4参数仿射模型总是被投影到类型A的4参数仿射模型。
在步骤4中,在一个示例中,基于步骤3之后投影的CPMV,可以使用当前VVC或AVS标准中使用的相同候选生成过程。在另一实施例中,基于不相邻邻近块的推导方法可能不使用在当前VVC或AVS标准的候选生成过程中使用的时间运动矢量。当不使用时间运动矢量时,其指示生成的组合不包含任何时间运动矢量。
在步骤5中,步骤4之后的任何新生成的候选都可以对照已经在合并候选列表中的所有现有候选进行相似性检查。相似性检查的细节已经在仿射合并候选修剪部分中进行了描述。如果发现新生成的候选与候选列表中的任何现有候选相似,则移除或修剪该新生成的候选。
图17示出了与用户界面1760耦接的计算环境(或计算设备)1710。计算环境1710可以是数据处理服务器的一部分。在一些实施例中,计算设备1710可以执行如上文根据本公开的各种示例所述的各种方法或过程(如编码/解码方法或过程)中的任一种。计算环境1710可以包括处理器1720、存储器1740以及I/O接口1750。
处理器1720通常控制计算环境1710的整体操作,比如与显示、数据获取、数据通信以及图像处理相关联的操作。处理器1720可以包括一个或多个处理器以执行指令以执行上述方法中的所有或一些步骤。此外,处理器1720可以包括促进处理器1720与其他部件之间的交互的一个或多个模块。处理器可以是中央处理单元(CPU)、微处理器、单片机、GPU等。
存储器1740被配置为存储各种类型的数据以支持计算环境1710的操作。存储器1740可以包括预定软件1742。这种数据的示例包括用于在计算环境1710上操作的任何应用程序或方法的指令、视频数据集、图像数据等。存储器1740可以通过使用任何类型的易失性或非易失性存储器设备或其组合来实施,比如静态随机存取存储器(SRAM)、电可擦可编程只读存储器(EEPROM)、可擦可编程只读存储器(EPROM)、可编程只读存储器(PROM)、只读存储器(ROM)、磁存储器、闪速存储器、磁盘或光盘。
I/O接口1750提供处理器1720与***接口模块(比如键盘、点击轮、按钮等)之间的接口。按钮可以包括但不限于主页按钮、开始扫描按钮和停止扫描按钮。I/O接口1750可以与编码器和解码器耦接。
在一些实施例中,还提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质包括多个程序,所述程序比如包括在存储器1740中,可由计算环境1710中的处理器1720执行,用于执行上述方法。例如,所述非暂态计算机可读存储介质可以是ROM、RAM、CD-ROM、磁带、软盘、光学数据存储设备等。
所述非暂态计算机可读存储介质中存储有用于由具有一个或多个处理器的计算设备执行的多个程序,其中,所述多个程序在由所述一个或多个处理器执行时,使所述计算设备执行上述运动预测方法。
在一些实施例中,计算环境1710可以用一个或多个专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑设备(PLD)、现场可编程门阵列(FPGA)、图形处理单元(GPU)、控制器、微控制器、微处理器、或其他电子部件来实施,用于执行上述方法。
图18是图示了根据本公开的示例的用于视频编解码的方法的流程图。
在步骤1801中,处理器1720可以从与当前块或CU不相邻的多个不相邻邻近块获得一个或多个仿射候选。
在一些示例中,多个不相邻邻近块可以包括如图11至图12、图13A至图13B、图14A至图14B、图15A至图15D和图16中所示的不相邻的编码块。
在一些示例中,处理器1720可以根据扫描规则获得一个或多个仿射候选。
在一些示例中,可以基于至少一个扫描区域、至少一个扫描距离以及扫描顺序来确定扫描规则。
在一些示例中,至少一个扫描距离指示距当前块的一侧的块的数量。
在一些示例中,在至少一个扫描距离之一处的多个不相邻邻近块之一可以具有与当前块相同的尺寸,如图13A所示,或者具有与当前块不同的尺寸,如图13B所示。
在一些示例中,至少一个扫描区域可以包括第一扫描区域和第二扫描区域,所述第一扫描区域是根据指示距当前块的第一侧的最大块数的第一最大扫描距离确定的,所述第二扫描区域是根据指示距当前块的第二侧的最大块数的第二最大扫描距离确定的,并且第一最大扫描距离与第二最大扫描距离相同或不同。在一些示例中,第一最大扫描距离或第二最大扫描距离可以被设置为固定值,比如3、4等。
例如,第一扫描区域可以是当前块1303的左侧区域,并且第一最大扫描距离与当前块1303的左侧相距3个块。也就是说,块1301位于第一最大扫描距离处,即与当前块1303的左侧相距3个块。此外,第二扫描区域可以是当前块1303的上侧区域,并且第二最大扫描距离与当前块1303的上方或上侧相距3个块。也就是说,块1302位于第二最大扫描距离处,即与当前块1303的上方/上侧相距3个块。
在一些示例中,编码器可以在要发送到解码器的比特流中用信号发送第一最大扫描距离和第二最大扫描距离。
在一些示例中,处理器1720可以响应于确定第一最大扫描距离或第二最大扫描距离等于固定值,并且响应于确定候选列表已满或者确定第一最大扫描距离或第二最大扫描距离内的所有不相邻邻近块都已被扫描,停止在至少一个扫描区域中的扫描,作为扫描终止。
在一些示例中,处理器1720可以扫描第一扫描区域中的多个不相邻邻近块以获得用仿射模式编码的一个或多个不相邻邻近块,并将用仿射模式编码的一个或多个不相邻邻近块确定为一个或多个仿射候选。
在一些示例中,处理器1720可以从第一起始不相邻邻近块沿着与当前块的左侧平行的扫描线扫描,其中,第一起始不相邻的块是第一扫描区域中底部的块,第一扫描区域中的块与当前块的左侧相距第一扫描距离(例如图14A中的D2)。
在一些示例中,第一起始不相邻的块可以位于第二扫描区域中的第二起始不相邻邻近块的左下,并且第二扫描区域中的块可以与当前块的左侧相距第二扫描距离(例如图14A中的D1),如图14A所示。在一些其他示例中,第一起始不相邻的块可以位于第二扫描区域中的第二起始不相邻邻近块的左侧,并且第二扫描区域中的块可以与当前块的左侧相距第二扫描距离,如图14B所示。
在一些示例中,处理器1720可以从第三起始不相邻邻近块沿着与当前块的上侧平行的扫描线扫描,其中,第三起始不相邻的块可以是第一扫描区域中右侧的块,并且第一扫描区域中的块可以与当前块的上侧相距第一扫描距离(例如图14A中的D2)。
在一些示例中,第三起始不相邻的块可以位于第二扫描区域中的第四起始不相邻邻近块的右上,并且第二扫描区域中的块可以与当前块的上侧相距第二扫描距离(例如图14A中的D1),如图14A所示。在一些其他示例中,第三起始不相邻的块可以位于第二扫描区域中的第四起始不相邻邻近块的右侧,并且第二扫描区域中的块可以与当前块的上侧相距第二扫描距离,如图14B所示。
在一些示例中,处理器1720可以在扫描位置处定位不相邻邻近块。例如,为了更容易实施,每个候选不相邻邻近块可以由特定的扫描位置来指示或定位。
在一些示例中,扫描位置可以包括如图15A所示的当前块上方的第二扫描区域中的不相邻邻近块的左下位置、如图15A所示的当前块左侧的第一扫描区域中的不相邻邻近块的右上位置、如图15B所示的第一扫描区域或第二扫描区域中的不相邻邻近块的右下位置、如图15C所示的第一扫描区域或第二扫描区域中的不相邻邻近块的左下位置、以及如图15D所示的第一扫描区域或第二扫描区域中的不相邻邻近块的右上位置。
在一些示例中,处理器1720可以基于扫描规则获得第一仿射候选的第一候选位置和第二仿射候选的第二候选位置;基于第一候选位置和第二候选位置为第三仿射候选确定第三候选位置;基于第一候选位置、第二候选位置和第三候选位置获得虚拟块;基于第一候选位置、第二候选位置和第三候选位置处的平移MV来获得虚拟块的三个CPMV;以及基于虚拟块的这三个CPMV通过使用用于继承的候选推导的相同投影过程来获得当前块的两个或三个CPMV。
在一些示例中,虚拟块可以是矩形编码块,并且可以基于第一候选位置的垂直位置和第二候选位置的水平位置来确定第三候选位置。例如,虚拟块可以是包括如图9所示的位置A、B和C的虚拟块。
在一些示例中,处理器1720可以响应于确定第一候选位置或第二候选位置不可用,或者响应于确定第一候选位置或第二候选位置处的运动信息不可用,将第三候选位置的垂直位置确定为当前块的左上点的垂直位置,并将第三候选位置的水平位置确定为当前块的左上点的水平位置。
在一些示例中,处理器1720可以响应于确定第一候选位置、第二候选位置或第三候选位置处的运动信息不可用,确定虚拟块不能表示有效的仿射模型。
在一些示例中,处理器1720可以响应于确定第一候选位置或第二候选位置处的至少一个运动信息可用,确定虚拟块能够表示有效的仿射模型。
在一些示例中,一个或多个仿射候选可以包括一个或多个继承的仿射候选和一个或多个构建的仿射候选,并且处理器1720可以进一步根据第一扫描规则获得一个或多个继承的仿射候选,并且根据第二扫描规则获得一个或多个构建的仿射候选,其中第二扫描规则与第一扫描规则完全相同或部分相同。
在一些示例中,处理器1720可以进一步基于至少一个第二扫描区域、至少一个第二扫描距离和第二扫描顺序来确定第二扫描规则,并且在与当前块相同的块尺寸相等的每个距离处扫描至少一个第二扫描区域。
在一些示例中,处理器1720可以基于虚拟块的这三个CPMV通过使用用于继承候选推导的相同投影过程来获得当前块的两个或三个CPMV,所述投影过程包括:处理器1720可以响应于确定虚拟块表示第一类型的仿射模型,基于虚拟块的这三个CPMV,通过将由虚拟块表示的第一类型的仿射模型投影到当前块的第一类型的仿射模型来获得当前块的这两个或三个CPMV;处理器1720可以响应于确定虚拟块表示第二类型的仿射模型,基于虚拟块的这三个CPMV,通过将由虚拟块表示的第二类型仿射模型投影到当前块的第二类型仿射模型来获得当前块的这两个或三个CPMV;或者,处理器1720可以基于虚拟块的这三个CPMV,通过将由虚拟块表示的仿射模型投影到当前块的某一类型的仿射模型来获得当前块的这两个或三个CPMV,其中,当前块的类型是第一类型或第二类型。
在步骤1802中,处理器1720可以基于一个或多个仿射候选来获得当前块的一个或多个CPMV。
图19是图示了根据本公开的示例的用于修剪仿射候选的方法的流程图。
在步骤1901中,处理器1720可以计算与第一仿射候选的一个或多个CPMV相关联的第一组仿射模型参数。
在步骤1902中,处理器1720可以计算与第二仿射候选的一个或多个CPMV相关联的第二组仿射模型参数。
在步骤1903中,处理器1720可以基于第一组仿射模型参数和第二组仿射模型参数来执行第一仿射候选与第二仿射候选之间的相似性检查。
在一些示例中,处理器1720可以响应于确定第一组仿射模型参数类似于第二组仿射模型参数,确定第一仿射候选与第二仿射候选相似并且对第一仿射候选和第二仿射候选之一进行修剪。
在一些示例中,处理器1720可以响应于确定多个差值分别小于多个阈值,确定第一仿射候选与第二仿射候选相似,其中,所述多个差值包括第一组仿射模型参数中的一个参数与第二组仿射模型参数中的一个对应参数之间的差值。
在一些示例中,可以根据可与第二组仿射模型参数进行比较的第一组仿射模型参数来确定多个阈值,如表1所示。
在一些示例中,可以根据当前块的尺寸来确定多个阈值。例如,根据当前块的宽度或高度来确定多个阈值,如表2、表3或表4所示。又例如,可以将多个阈值确定为一组固定值,如表5所示。
在一些示例中,处理器1720可以根据当前块的宽度和高度来计算与第一仿射候选的一个或多个CPMV相关联的第一组仿射模型参数中的一个或多个仿射模型参数,并且根据当前块的宽度和高度来计算与第二仿射候选的一个或多个CPMV相关联的第二组仿射模型参数中的一个或多个仿射模型参数。
在一些示例中,提供了一种用于视频编解码的装置。所述装置包括处理器1720和存储器1740,所述存储器被配置为存储可由所述处理器执行的指令;其中,所述处理器在执行所述指令时被配置为执行如图18中所图示的方法。
在一些其他示例中,提供了一种其中存储有指令的非暂态计算机可读存储介质。当所述指令由处理器1720执行时,所述指令使所述处理器执行如图18中所图示的方法。
在一些示例中,提供了一种用于视频编解码的装置。所述装置包括处理器1720和存储器1740,所述存储器被配置为存储可由所述处理器执行的指令;其中,所述处理器在执行所述指令时被配置为执行如图19中所图示的方法。
在一些其他示例中,提供了一种其中存储有指令的非暂态计算机可读存储介质。当所述指令由处理器1720执行时,所述指令使所述处理器执行如图19中所图示的方法。
考虑在此公开的公开内容的说明书和实践,本公开的其他示例对于本领域技术人员而言将是显而易见的。本申请旨在涵盖遵循其一般原则对公开内容进行的任何改变、使用或改编,包括在本领域中已知或惯用实践内与本公开的偏离。旨在将说明书和示例仅视为示例性的。
应理解的是,本公开不限于上文描述和附图中所示的确切示例,并且可以在不脱离其范围的情况下进行各种修改和变化。

Claims (38)

1.一种用于视频编解码的方法,所述方法包括:
从与当前块不相邻的多个不相邻邻近块获得一个或多个仿射候选;以及
基于所述一个或多个仿射候选来获得所述当前块的一个或多个控制点运动矢量(CPMV)。
2.如权利要求1所述的方法,其中,获得一个或多个仿射候选包括:
根据扫描规则获得所述一个或多个仿射候选。
3.如权利要求2所述的方法,进一步包括:
基于至少一个扫描区域、至少一个扫描距离以及扫描顺序来确定所述扫描规则。
4.如权利要求3所述的方法,其中,所述至少一个扫描距离指示距所述当前块的一侧的块的数量。
5.如权利要求4所述的方法,其中,位于所述至少一个扫描距离之一处的所述多个不相邻邻近块之一具有与所述当前块相同的尺寸。
6.如权利要求5所述的方法,其中,位于所述至少一个扫描距离之一处的所述多个不相邻邻近块之一具有与所述当前块不同的尺寸。
7.如权利要求3所述的方法,进一步包括:
根据所述至少一个扫描距离确定所述至少一个扫描区域。
8.如权利要求7所述的方法,其中,所述至少一个扫描区域包括第一扫描区域和第二扫描区域,所述第一扫描区域是根据指示距所述当前块的第一侧的最大块数的第一最大扫描距离确定的,所述第二扫描区域是根据指示距所述当前块的第二侧的最大块数的第二最大扫描距离确定的,并且所述第一最大扫描距离与所述第二最大扫描距离相同或不同。
9.如权利要求8所述的方法,进一步包括:
通过编码器用信号发送所述第一最大扫描距离和所述第二最大扫描距离。
10.如权利要求8所述的方法,进一步包括:
将所述第一最大扫描距离或所述第二最大扫描距离预先确定为固定值。
11.如权利要求10所述的方法,进一步包括:
响应于确定所述第一最大扫描距离或所述第二最大扫描距离等于4,响应于确定包括所述一个或多个仿射候选的候选列表已满或者响应于确定所述第一最大扫描距离和所述第二最大扫描距离内的所有不相邻邻近块都已被扫描,停止在所述至少一个扫描区域中的扫描。
12.如权利要求4所述的方法,进一步包括:
扫描第一扫描区域内的多个不相邻邻近块,以获得用仿射模式编码的一个或多个不相邻邻近块;以及
将所述用仿射模式编码的一个或多个不相邻邻近块确定为所述一个或多个仿射候选。
13.如权利要求4所述的方法,进一步包括:
从第一起始不相邻邻近块沿着与所述当前块的左侧平行的扫描线扫描,其中,所述第一起始不相邻的块是第一扫描区域中底部的块,并且所述第一扫描区域中的块与所述当前块的左侧相距第一扫描距离。
14.如权利要求13所述的方法,其中,所述第一起始不相邻的块位于第二扫描区域中的第二起始不相邻邻近块的左下,并且所述第二扫描区域中的块与所述当前块的左侧相距第二扫描距离。
15.如权利要求13所述的方法,其中,所述第一起始不相邻的块位于第二扫描区域中的第二起始不相邻邻近块的左侧,并且所述第二扫描区域中的块与所述当前块的左侧相距第二扫描距离。
16.如权利要求5所述的方法,进一步包括:
从第三起始不相邻邻近块沿着与所述当前块的上侧平行的扫描线扫描,其中,所述第三起始不相邻的块是第一扫描区域中右侧的块,所述第一扫描区域中的块与所述当前块的上侧相距第一扫描距离。
17.如权利要求16所述的方法,其中,所述第三起始不相邻的块位于第二扫描区域中的第四起始不相邻邻近块的右上,并且所述第二扫描区域中的块与所述当前块的上侧相距第二扫描距离。
18.如权利要求16所述的方法,其中,所述第三起始不相邻的块位于第二扫描区域中的第四起始不相邻邻近块的右侧,并且所述第二扫描区域中的块与所述当前块的上侧相距第二扫描距离。
19.如权利要求4所述的方法,进一步包括:
在扫描位置处定位不相邻邻近块。
20.如权利要求19所述的方法,其中,所述扫描位置包括以下位置之一:
所述当前块上方的第二扫描区域中的所述不相邻邻近块的左下位置,
所述当前块左侧的第一扫描区域中的所述不相邻邻近块的右上位置,
所述第一扫描区域或所述第二扫描区域中的所述不相邻邻近块的右下位置,
所述第一扫描区域或所述第二扫描区域中的所述不相邻邻近块的左下位置,或者
所述第一扫描区域或所述第二扫描区域中的所述不相邻邻近块的右上位置。
21.如权利要求1所述的方法,进一步包括:
基于扫描规则获得第一仿射候选的第一候选位置和第二仿射候选的第二候选位置;
基于所述第一候选位置和所述第二候选位置为第三仿射候选确定第三候选位置;
基于所述第一候选位置、所述第二候选位置和所述第三候选位置获得虚拟块;
基于所述第一候选位置、所述第二候选位置和所述第三候选位置处的平移MV来获得所述虚拟块的三个CPMV;以及
基于所述虚拟块的所述三个CPMV通过使用用于继承的候选推导的相同投影过程来获得所述当前块的两个或三个CPMV。
22.如权利要求21所述的方法,其中,所述虚拟块是矩形编码块,并且所述第三候选位置是基于所述第一候选位置的垂直位置和所述第二候选位置的水平位置来确定的。
23.如权利要求21所述的方法,进一步包括:
响应于确定所述第一候选位置或所述第二候选位置不可用,或者响应于确定所述第一候选位置或所述第二候选位置处的运动信息不可用,将所述第三候选位置的垂直位置确定为所述当前块的左上点的垂直位置,并将所述第三候选位置的水平位置确定为所述当前块的左上点的水平位置。
24.如权利要求21所述的方法,进一步包括:
响应于确定所述第一候选位置、所述第二候选位置或所述第三候选位置处的运动信息不可用,确定所述虚拟块不能表示有效的仿射模型。
25.如权利要求21所述的方法,进一步包括:
响应于确定所述第一候选位置或所述第二候选位置处的至少一个运动信息可用,确定所述虚拟块能够表示有效的仿射模型。
26.如权利要求1所述的方法,其中,所述一个或多个仿射候选包括一个或多个继承的仿射候选以及一个或多个构建的仿射候选,
所述方法进一步包括:
根据第一扫描规则获得所述一个或多个继承的仿射候选;以及
根据第二扫描规则获得所述一个或多个构建的仿射候选,其中,所述第二扫描规则与所述第一扫描规则完全相同或部分相同。
27.如权利要求26所述的方法,进一步包括:
基于至少一个第二扫描区域、至少一个第二扫描距离以及第二扫描顺序来确定所述第二扫描规则;以及
在与所述当前块相同的块尺寸相等的每个距离处扫描所述至少一个第二扫描区域。
28.如权利要求21所述的方法,其中,基于所述虚拟块的所述三个CPMV通过使用用于继承的候选推导的相同投影过程来获得所述当前块的两个或三个CPMV进一步包括以下各项中的至少一项:
响应于确定所述虚拟块表示第一类型的仿射模型,基于所述虚拟块的所述三个CPMV,通过将由所述虚拟块表示的所述第一类型的仿射模型投影到所述当前块的第一类型的仿射模型来获得所述当前块的所述两个或三个CPMV;
响应于确定所述虚拟块表示第二类型的仿射模型,基于所述虚拟块的所述三个CPMV,通过将由所述虚拟块表示的所述第二类型的仿射模型投影到所述当前块的第二类型的仿射模型来获得所述当前块的所述两个或三个CPMV;或者
基于所述虚拟块的所述三个CPMV,通过将由所述虚拟块表示的仿射模型投影到所述当前块的某一类型的仿射模型来获得所述当前块的所述两个或三个CPMV,其中,所述当前块的所述类型是所述第一类型或所述第二类型。
29.一种用于修剪仿射候选的方法,所述方法包括:
计算与第一仿射候选的一个或多个控制点运动矢量(CPMV)相关联的第一组仿射模型参数;
计算与第二仿射候选的一个或多个CPMV相关联的第二组仿射模型参数;以及
基于所述第一组仿射模型参数和所述第二组仿射模型参数来执行所述第一仿射候选与所述第二仿射候选之间的相似性检查。
30.如权利要求29所述的方法,进一步包括:
响应于确定所述第一组仿射模型参数与所述第二组仿射模型参数相似,确定所述第一仿射候选与所述第二仿射候选相似并且对所述第一仿射候选和所述第二仿射候选之一进行修剪。
31.如权利要求30所述的方法,进一步包括:
响应于确定多个差值分别小于多个阈值,确定所述第一仿射候选与所述第二仿射候选相似,其中,所述多个差值包括所述第一组仿射模型参数的一个参数与所述第二组仿射模型参数的一个对应参数之间的差值。
32.如权利要求31所述的方法,其中,所述多个阈值是根据可与所述第二组仿射模型参数进行比较的所述第一组仿射模型参数确定的。
33.如权利要求31所述的方法,其中,所述多个阈值是根据当前块的尺寸确定的。
34.如权利要求31所述的方法,其中,所述多个阈值是根据当前块的宽度或高度确定的。
35.如权利要求31所述的方法,其中,所述多个阈值被确定为一组固定值。
36.如权利要求29所述的方法,进一步包括:
根据当前块的宽度和高度,计算与所述第一仿射候选的所述一个或多个CPMV相关联的所述第一组仿射模型参数中的一个或多个仿射模型参数;以及
根据所述当前块的宽度和高度,计算与所述第二仿射候选的所述一个或多个CPMV相关联的所述第二组仿射模型参数中的一个或多个仿射模型参数。
37.一种用于视频编解码的装置,所述装置包括:
一个或多个处理器;以及
存储器,所述存储器耦接到所述一个或多个处理器并且被配置为存储可由所述一个或多个处理器执行的指令,
其中,所述一个或多个处理器在执行所述指令时被配置为执行如权利要求1至36中任一项所述的方法。
38.一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令在由一个或多个计算机处理器执行时使所述一个或多个计算机处理器执行如权利要求1至36中任一项所述的方法。
CN202280063298.3A 2021-09-24 2022-09-21 视频编码中仿射合并模式的候选推导 Pending CN117981315A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202163248401P 2021-09-24 2021-09-24
US63/248,401 2021-09-24
PCT/US2022/044297 WO2023049219A1 (en) 2021-09-24 2022-09-21 Candidate derivation for affine merge mode in video coding

Publications (1)

Publication Number Publication Date
CN117981315A true CN117981315A (zh) 2024-05-03

Family

ID=85719615

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280063298.3A Pending CN117981315A (zh) 2021-09-24 2022-09-21 视频编码中仿射合并模式的候选推导

Country Status (4)

Country Link
EP (1) EP4393156A1 (zh)
KR (1) KR20240066273A (zh)
CN (1) CN117981315A (zh)
WO (1) WO2023049219A1 (zh)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10448010B2 (en) * 2016-10-05 2019-10-15 Qualcomm Incorporated Motion vector prediction for affine motion models in video coding
US10602180B2 (en) * 2017-06-13 2020-03-24 Qualcomm Incorporated Motion vector prediction
US11503333B2 (en) * 2017-11-14 2022-11-15 Qualcomm Incorporated Unified merge candidate list usage
WO2019235822A1 (ko) * 2018-06-04 2019-12-12 엘지전자 주식회사 어파인 움직임 예측을 이용하여 비디오 신호를 처리하는 방법 및 장치
JP2021530154A (ja) * 2018-07-01 2021-11-04 北京字節跳動網絡技術有限公司Beijing Bytedance Network Technology Co., Ltd. 効率的なアフィンマージ動きベクトル導出

Also Published As

Publication number Publication date
EP4393156A1 (en) 2024-07-03
WO2023049219A1 (en) 2023-03-30
KR20240066273A (ko) 2024-05-14

Similar Documents

Publication Publication Date Title
TWI717586B (zh) 於視訊解碼器中導出運動向量資訊
US11252436B2 (en) Video picture inter prediction method and apparatus, and codec
TWI688262B (zh) 用於視訊寫碼之重疊運動補償
TW201931854A (zh) 統一合併候選列表運用
US20200021850A1 (en) Video data decoding method, decoding apparatus, encoding method, and encoding apparatus
CN110876282A (zh) 运动矢量预测方法以及相关装置
KR102407912B1 (ko) 양방향 인트라 예측 시그널링
CN114009041A (zh) 双向预测光流计算和双向预测校正中用于块级边界样本梯度计算的整数网格参考样本位置的计算方法
CN116250240A (zh) 图像编码方法、图像解码方法及相关装置
US20210360274A1 (en) Video Processing Methods and Apparatuses of Determining Motion Vectors for Storage in Video Coding Systems
CN112997499A (zh) 基于经全局运动补偿的运动矢量预测值的视频编码
CN117981315A (zh) 视频编码中仿射合并模式的候选推导
US20240259554A1 (en) Candidate derivation for affine merge mode in video coding
US20240214587A1 (en) Candidate derivation for affine merge mode in video coding
CN118020302A (zh) 视频编解码中针对仿射合并模式的候选导出
CN118160309A (zh) 视频编解码中仿射合并模式的候选推导
CN118140480A (zh) 用于视频编解码中仿射合并模式的候选推导的方法和设备
CN118176724A (zh) 用于视频编解码中仿射合并模式的候选推导的方法和设备
CN118414832A (zh) 用于视频编解码中仿射合并模式的候选推导的方法和设备
US20240073438A1 (en) Motion vector coding simplifications
US20230300341A1 (en) Predictive video coding employing virtual reference frames generated by direct mv projection (dmvp)
US12015780B2 (en) Inter prediction method and apparatus, video encoder, and video decoder
KR20240112899A (ko) 비디오 코딩에서 아핀 병합 모드의 후보 도출을 위한 방법 및 장치
KR20230081711A (ko) 비디오 압축을 위한 기하학적 모델을 사용한 모션 코딩
WO2023133160A1 (en) Methods and devices for candidate derivation for affine merge mode in video coding

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination