CN113597764B - 视频解码方法、***和存储介质 - Google Patents

视频解码方法、***和存储介质 Download PDF

Info

Publication number
CN113597764B
CN113597764B CN201980007184.5A CN201980007184A CN113597764B CN 113597764 B CN113597764 B CN 113597764B CN 201980007184 A CN201980007184 A CN 201980007184A CN 113597764 B CN113597764 B CN 113597764B
Authority
CN
China
Prior art keywords
frame
current frame
motion
candidate list
resolution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201980007184.5A
Other languages
English (en)
Other versions
CN113597764A (zh
Inventor
张翠姗
孙域晨
朱玲
楼剑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Publication of CN113597764A publication Critical patent/CN113597764A/zh
Application granted granted Critical
Publication of CN113597764B publication Critical patent/CN113597764B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

通过获得比特流的当前帧,从参考帧缓存获得一个或更多个参考图片,对所获得的具有与当前帧的分辨率具有不同分辨率的图像进行上采样或下采样,调整所述一个或更多个参考图片的帧间预测器的大小,和基于所述一个或更多个参考图片和所述当前帧的一个或更多个块的运动信息从所述当前帧生成重建帧,所述运动信息包括至少一个帧间预测器,提供了以运动预测编码格式实现的用于分辨率自适应视频编码的方法的***和方法,从而在视频编码和传送中实现了网络传送成本的大幅降低,而无需传送会抵消或损害这些节省的附加数据。

Description

视频解码方法、***和存储介质
背景技术
在诸如H.264/AVC(高级视频编码)和H.265/HEVC(高效率视频编码)标准之类的常规视频编码格式中,序列中的视频帧的大小和分辨率以序列级被记录在头部中。因此,为了改变帧的分辨率,必须从帧内编码帧开始生成新的视频序列,与帧间编码帧相比,帧内编码帧要传输的带宽成本要大得多。因此,尽管期望当网络带宽变低、减小或节流时在网络上自适应地发送下采样的低分辨率视频,但是在使用常规视频编码格式时难以实现带宽节省,因为自适应地下采样的带宽成本抵消了带宽增益。
已经进行了研究以支持在发送帧间编码帧时改变分辨率。在由 AOM开发的AV1编解码器的实现中,提供了一种称为切换帧 (switch_frame)的新帧类型,其可以以与以前的帧不同的分辨率进行传输。但是,由于switch_frame的运动矢量编码无法参考先前帧的运动矢量,因此switch_frame的使用受到限制。此类参考通常提供降低带宽成本的另一种方法,因此使用switch_frames仍会维持更大的带宽消耗,从而抵消了带宽增益。
此外,现有的运动编码工具仅基于平移运动模型执行运动补偿预测(MCP)。
在下一代视频编解码器规范VVC/H.266的开发中,提供了几种新的运动预测编码工具,以进一步支持参考先前帧的运动矢量编码以及基于除了平移运动的不规则运动类型的MCP。需要新技术以便针对这些新编码工具在比特流中实现分辨率变化。
附图说明
详细描述参照附图得以阐述。在附图中,附图标记的最左边的数字标识该附图标记首次出现的附图。在不同附图中使用相同的附图标记表示相似或相同的项目或特征。
图1A和1B分别示出了用于4参数仿射运动模型和6参数仿射运动模型的多个CMPV的配置。
图2示出了获得块的亮度分量的运动信息的示意图。
图3示出了根据仿射运动预测编码选择帧的CU的运动候选的示例。
图4示出了获得继承的仿射合并候选的示例。
图5示出了获得构造的仿射合并候选的示例。
图6示出了基于模板匹配的DMVR双向预测过程的示意图。
图7示出了视频编码过程的示例性框图。
图8A、图8B和图8C示出了实现分辨率自适应视频编码的视频编码方法的示例流程图。
图9A、图9B和图9C示出了实现分辨率自适应视频编码的视频编码方法的其他示例流程图。
图10示出了用于以运动预测编码格式实现用于实现分辨率自适应视频编码的过程和方法的示例***。
图11示出了用于以运动预测编码格式实现用于实现分辨率自适应视频编码的过程和方法的示例***。
具体实施例
本文讨论的***和方法旨在实现视频编码中的自适应分辨率,更具体地,涉及基于VVC/H.266标准提供的运动预测编码工具的对重建帧进行上采样和下采样以实现帧间自适应分辨率变化。
根据本公开的示例实施例,运动预测编码格式可以指通过包含对运动信息和一个或更多个其他帧的预测单元(Prediction Unit,PU)的一个或更多个参考来对帧的运动信息和PU进行编码的数据格式。运动信息可以指的是描述帧或其单元或子单元的块结构的运动的数据,诸如运动矢量以及对当前帧或另一帧的块的参考。PU可指代帧的多个块结构中的与块结构相对应的一单元或多个子单元,例如编码单元(CU),其中,基于帧数据对块进行划分,并根据已建立的视频编解码器对块进行编码。对应于预测单元的运动信息可以描述由任何运动矢量编码工具编码的运动预测,包括但不限于本文所述的那些。
根据本公开的示例实施例,运动预测编码格式可以包括仿射运动预测编码和解码器侧运动矢量细化(Decoder-side Motion Vector Refinement DMVR)。这里将描述与本公开的示例实施例有关的这些运动预测编码格式的特征。
根据仿射运动预测编码的解码器可以获得比特流(该比特流根据采用仿射运动模型的编码格式编码)的当前帧,并且获得重建帧 (“仿射运动预测编码的重建帧”)。当前帧可以被帧间编码。
可以通过仿射运动补偿预测来预测仿射运动预测编码的重建帧的CU的运动信息。运动信息可以包括多个运动矢量,包括多个控制点运动矢量(Control Point MotionVector,CPMV)和获得的运动矢量。如图 1A和图1B所示,多个CPMV可包括用作两个控制点的CU的两个运动矢量
Figure BDA0002564138930000031
和v1或作为三个控制点的CU的三个运动矢量
Figure BDA0002564138930000032
Figure BDA0002564138930000033
其中
Figure BDA0002564138930000034
是CU左上角的控制点,
Figure BDA0002564138930000035
是CU右上角的控制点,
Figure BDA0002564138930000036
是CU左下角的控制点。可以通过仿射运动模型从控制点和CU的采样位置(x,y)像素中获得获得的运动矢量,其可以是两个控制点的4参数仿射运动模型,也可以是三个控制点的6 参数仿射运动模型。
采用位置(x,y)处的运动矢量可以通过以下操作从两个控制点得出:
Figure BDA0002564138930000037
采用位置(x,y)处的运动矢量可以通过以下操作从三个控制点得出:
Figure BDA0002564138930000038
可以通过获得块的亮度分量的运动信息,以及通过对块的运动信息应用基于块的仿射变换来获得块的色度分量的运动信息,来进一步预测运动信息。
如图2所示,可以将块的亮度分量划分为4×4像素的亮度子块,其中对于每个亮度子块,可以根据上述的操作,从整个CU控制点获得亮度子块的中心在采样位置处的亮度运动矢量。从整个CU的控制点进行上述操作。获得的亮度子块的亮度运动矢量可以被精确到1/16的精度。
所述块的色度分量可以被划分为4×4像素的色度子块,其中每个色度子块可以具有四个相邻的亮度子块。例如,相邻的亮度子块可以是色度子块下方、左侧、右侧或上方的亮度子块。对于每个色度子块,可以从相邻亮度子块的亮度运动矢量的平均值得出运动矢量。
运动补偿插值滤波器可以被应用于每个子块的获得的运动矢量以生成每个子块的运动预测。
仿射运动预测编码重建帧的CU的运动信息可以包括运动候选列表。运动候选列表可以是包含对多个运动候选的参考的数据结构。运动候选可以是块结构或其子单元,例如像素或当前帧的块结构的任何其他合适的细分,或者可以是对另一帧的运动候选的参考。运动候选可以是空间运动候选或时间运动候选。通过应用运动矢量补偿(Motion VectorCompensation,MVC),解码器可以从运动候选列表中选择运动候选,并获得运动候选的运动矢量作为重建帧的CU的运动矢量。
图3示出了根据本公开的示例实施例的根据仿射运动预测编码的用于帧的CU的运动候选的示例选择。
根据本公开的示例实施例,其中,仿射运动预测编码重建帧的仿射运动预测模式是仿射合并模式,帧的CU的宽度和高度均大于或等于8个像素。运动候选列表可以是仿射合并候选列表,并且可以包括多达五个CPMVP候选。CU的编码可包含合并索引。合并索引可以指仿射合并的CPMVP候选。
可以基于从当前CU的空间相邻块或时间相邻块的运动信息获得的控制点运动矢量预测值(Control Point Motion Vector Predictor, CPMVP)候选来生成当前CU的CPMV。
如图3所示,存在帧的当前CU的多个空间上相邻的块。当前 CU的空间上邻近的块可以是邻近当前CU的左侧的块和邻近当前CU的顶部的块。空间上相邻的块具有与图3的左右方向和上下方向相对应的左右关系和上下关系。通过图3的示例,根据作为仿射合并模式的仿射运动预测模式编码的帧的仿射合并候选列表可以包括多达以下CPMVP 候选:
左侧空间相邻块(A0);
上方空间相邻块(B0);
右上空间相邻块(B1);
左下空间相邻块(A1);和
左上空间相邻块(B2)。
在本文中示出的在空间上相邻的块中,块A0可以是当前CU 302的左侧的块;块A1可以是当前CU 302的左侧的块;块B0可以是当前CU 302上方的块;块B1可以是当前CU 302上方的块;B2可以是当前CU 302上方的块;每个空间上的相邻块相对于当前CU 302或相邻块相对于彼此的相对位置将不被进一步限制。关于每个空间相邻块与当前 CU 302或相邻块彼此的相对大小也将不被限制。
根据作为仿射合并模式的仿射运动预测模式编码的帧的CU的仿射合并候选列表可以包括以下CPMVP候选:
至多两个继承的仿射合并候选;
构造的仿射合并候选;和
零运动矢量。
继承的仿射合并候选可以从具有仿射运动信息的空间上邻近的块获得。即,空间上相邻的块属于具有CPMV的CU。
可以从不具有仿射运动信息的空间上相邻块和时间上相邻块中获得构造的仿射合并候选,即,可以从属于仅具有平移运动信息的CU 的空间上相邻块和时间上相邻块中获得CPMV。
零运动矢量可具有(0,0)的运动偏移。
最多一个继承的仿射合并候选可以通过搜索当前CU的左侧空间相邻的块而得到,并且最多一个继承的仿射合并候选可以通过搜索当前CU上方的空间相邻的块而得到。在每种情况下,对于具有仿射运动信息的第一空间相邻块,可以以A0和A1的顺序搜索左空间相邻块,并且可以以B0、B1和B2的顺序搜索上方空间相邻块。在左空间相邻块中找到这样的第一空间相邻块的情况下,从第一空间相邻块的CPMV获得 CPMVP候选,并将其添加到仿射合并候选列表。在上方空间相邻块中找到这样的第一空间相邻块的情况下,从第一空间相邻块的CPMV获得 CPMVP候选,并将其添加到仿射合并候选列表。在以这种方式获得两个 CPMVP候选的情况下,在获得的CPMVP候选中不执行修剪检查,即,不检查两个获得的CPMVP候选是否为相同的CPMVP候选。
图4示出了获得继承的仿射合并候选的示例。当前CU 402具有在空间上左侧相邻的块A。该块A属于CU 404。当根据4参数仿射模型对块A进行编码时,CU 404可具有以下仿射运动信息:
Figure BDA0002564138930000061
是 CU 404左上角的CPMV,
Figure BDA0002564138930000062
是CU 404右上角的CPMV。在找到块A时,可以获得CPMV的
Figure BDA0002564138930000063
Figure BDA0002564138930000064
并且可以根据CPMV的
Figure BDA0002564138930000065
Figure BDA0002564138930000066
来计算用于采样位置的当前CU 402的CPMV
Figure BDA0002564138930000067
Figure BDA0002564138930000068
从而得到4参数仿射合并候选。
当根据6参数仿射模型对块A进行编码时,CU 404可另外具有以下仿射运动信息:
Figure BDA0002564138930000069
是在CU的左下角处的CPMV。在找到块A时,可以获得CPMV
Figure BDA00025641389300000610
Figure BDA00025641389300000611
并且可以根据CPMV
Figure BDA00025641389300000612
Figure BDA00025641389300000613
来计算用于采样位置的当前CU 402的CPMV
Figure BDA00025641389300000614
Figure BDA00025641389300000615
从而得到6参数仿射合并候选。
图5示出了获得构造的仿射合并候选的示例。可以从当前CU 502的四个CPMV中获得仿射合并候选,其中当前CU 502的每个CPMV 可以对从当前CU 502的空间相邻块或从当前CU 502的时间相邻块中搜索而获得。
推导CPMV时可以参考以下块:
左侧空间相邻块(A1);
左侧空间相邻块(A2);
上方空间相邻块(B1);
右上空间相邻块(B0);
左下空间相邻块(A0);
左上空间相邻块(B2);
上方空间相邻块(B3);和
时间相邻块(T)。
可以为当前CU 502获得以下CPMV:
左上方的CPMV(CPMV1);
右上方的CPMV(CPMV2);
左下CPMV(CPMV3);和
右下方的CPMV(CPMV4)。
可以通过按照B2、B3和A2的顺序搜索空间上的相邻块并根据相关技术中发现的标准选择第一可用的空间上相邻的块来获得CPMV1,在此不再赘述。
可以通过按照B1和B0的顺序搜索空间相邻块并且同样选择第一可用空间相邻块来获得CPMV2
可以通过按照A1和A0的顺序搜索空间相邻块并且同样选择第一可用空间相邻的块来获得CPMV3
可以从时间相邻块T(如果有)获得CPMV4
构造的仿射合并候选可以使用以下组合中的当前CU 502的 CPMV的给定顺序的第一个可用组合来构造:
{CPMV1,CPMV2,CPMV3};
{CPMV1,CPMV2,CPMV4};
{CPMV1,CPMV3,CPMV4};
{CPMV2,CPMV3,CPMV4};
{CPMV1,CPMV2};和
{CPMV1,CPMV3}。
在使用三个CPMV的组合的情况下,将生成6参数仿射合并候选。如果使用两个CPMV的组合,则会生成4参数仿射合并候选对象。然后将构造的仿射合并候选添加到仿射合并候选列表。
对于不具有仿射运动信息的块,例如属于根据时间运动矢量预测器(TemporalMotion Vector Predictor,TMVP)编码格式编码的CU的块,CU的编码可以包括帧间预测指示器。帧间预测指示器可以参考被称为列表0的第一参考图片列表来指示列表0预测,参考被称为列表1的第二参考图片列表来指示列表1预测或参考分别被称为列表0和列表1 两个参考图片来指示双向预测。在帧间预测指示器指示列表0预测或列表1预测的情况下,CU的编码可以包括参考索引,该参考索引参考分别由列表0或列表1参考的参考帧缓存的参考图片。在帧间预测指示器指示双向预测的情况下,CU的编码可以包括参考由列表0参考的参考帧缓存的第一参考图片的第一参考索引,以及参考由列表1参考的参考帧缓存的第二参考图片的第二参考索引。
帧间预测指示器可以被编码为帧间编码的帧的切片头中的标志。一个或更多个参考索引可以被编码在帧间编码的帧的切片头中。可以进一步分别对相应于一个或更多个参考索引的一个或两个运动矢量差 (Motion Vector Difference,MVD)进行编码。
在如上所述的CPMV的特定组合中,CPMV的多个参考索引不同的情况下,即CMPV可以从参考具有不同分辨率的不同参考图片的 CU派生而来,CPMV的特定组合可以被丢弃而不被使用。
在将任何获得的继承的仿射合并候选和任何构造的仿射合并候选添加到CU的仿射合并候选列表之后,将零运动矢量,即,指示(0, 0)的运动偏移的运动矢量添加到仿射合并候选列表的所有剩余空白位置。
根据本公开的示例实施例,其中,仿射运动预测编码重建帧的仿射运动预测模式是仿射自适应运动矢量预测(AMVP)模式,帧的CU 的宽度和高度均大于或等于16像素。无论使用4参数仿射运动模型还是 6参数仿射运动模型,AMVP模式的适用性都可以通过携带编码帧数据的视频比特流中携带的比特级标志来标识。运动候选列表可以是AMVP 候选列表,并且可以包括最多两个AMVP候选。
可以基于从与当前CU的空间相邻块的运动信息中得出的 AMVP候选来生成当前CU的CPMV。
根据AMVP模式的仿射运动预测模式编码的帧的CU的 AMVP候选列表可以包括以下CPMVP候选:
继承的AMVP候选;
构造的AMVP候选;
来自相邻CU的平移运动矢量;和
零运动矢量。
可以按照与用于获得继承的仿射合并候选的方式相同的方式来获得继承的AMVP候选,不同的是,搜索用于获得继承的AMVP候选的每个空间相邻块都属于参考与当前CU相同参考图片的CU。将继承的 AMVP候选添加到AMVP候选列表时,不会在继承的AMVP候选和AMVP候选列表之间执行修剪检查。
除了根据帧间编码的第一可用空间邻近块的标准进一步选择第一可用空间邻近块,以及选择具有参考与当前CU相同的参考图片的参考索引,可以以与用于获得构造的仿射合并候选相同的方式来获得构造的AMVP候选。而且,根据其中不支持时间控制点的AMVP的实现,可以不搜索时间上相邻的块。
在通过4参数仿射运动模型对当前CU进行编码并且当前CU 的CPMV1和CPMV2可用的情况下,将CPMV1和CPMV2作为一个候选添加到AMVP候选列表中。如果当前CU通过6参数仿射运动模型编码,并且当前CU的CPMV1、CPMV2和CPMV3可用,则将CPMV1、 CPMV2和CPMV3作为一个候选添加到AMVP候选列表中。否则,无法将构造的AMVP候选添加到AMVP候选列表中。
平移运动矢量可以是来自空间相邻块的运动矢量,该空间相邻块属于仅具有平移运动信息的CU。
零运动矢量可具有(0,0)的运动偏移。
在将任何获得的继承的仿射合并候选和任何构造的仿射合并候选添加到CU的仿射合并候选列表之后,根据各自的可用性,将 CPMV1、CPMV2和CPMV3以给定的顺序添加到AMVP候选列表中,作为平移运动矢量来预测当前CU的所有CPMV。然后,将零运动矢量,即指示运动偏移为(0,0)的运动矢量添加到AMVP候选列表的任何剩余空白位置。
可以通过双向预测来预测根据DMVR预测的运动信息。可以对当前帧执行双预测,使得重建帧的块的运动信息可以包括对第一参考块的第一运动矢量和第二参考块的第二运动矢量的参考,所述第一参考块与当前帧具有第一时间距离,所述第二参考块与当前帧具有第二时间距离。所述第一时间距离和第二时间距离可以在与当前块不同的时间方向上。
第一运动矢量可以是被称为列表0的第一参考图片列表的第一参考图片的块的运动矢量,并且第二运动矢量可以是被称为列表1的第二参考图片列表的第二参考图片的块的运动矢量。当前块所属的CU的编码可以包括参考由列表0参考的参考帧的第一参考图片的第一参考索引,以及由列表1参考的参考帧的第二参考图片的第二参考索引。
图6示出了基于模板匹配的DMVR双向预测过程的示意图。在DMVR双向预测过程的第一步中,平均由初始第一运动矢量mv0所参考的列表0的第一参考图片604的初始第一块602,和由第二运动矢量 mv1所参考的列表1的第二参考图片608的初始第二块606,以生成所述初始第一块602和初始第二块606的加权组合。将所述加权组合作为模板610。可以使用参考所述初始第一块602的初始第一运动矢量和参考所述初始第一块606的初始第二运动矢量来执行对当前块612的运动预测。
在DMVR双向预测过程的第二步骤中,通过成本测量将模板 610与第一参考图片604的接近所述初始第一块602的第一采样区域和第二参考图片608的接近所述初始第二块606的第二采样区域进行比较。成本测量可以使用图像相似性的适合的方法,例如绝对差值和(sum of absolute differences)或去除的绝对差值和的平均(mean removed sum ofabsolute differences)。在第一样本区域内,如果后续的第一块614具有针对模板测量的最小成本,则参考后续的第一块614的后续第一运动矢量 mv0'可以代替初始第一运动矢量mv0。在第二样本区域内,如果后续的第二块616具有针对模板测量的最小成本,则参考后续的第二块616的随后的第二运动矢量mv1′可以代替初始的第二运动矢量mv1。然后可以使用mv0′和mv1′对当前块612执行双预测。
图7示出了根据本公开的示例实施例的视频编码过程700的示例性框图。
视频编码过程700可以从诸如比特流710之类的源获得编码帧。根据本公开的示例实施例,给定当前帧712在比特流中具有位置 N,在比特流中具有位置N-1的前一帧714可以具有大于或小于当前帧的分辨率的分辨率,并且比特流中位置为N+1的下一帧716可以具有大于或小于当前帧的分辨率的分辨率。
视频编码过程700可以解码当前帧712以生成重建帧718,并且在诸如参考帧缓存790或显示缓存792的目的地输出重建帧718。可以将当前帧712输入一编码循环720,其可以包括重复以下步骤:将当前帧712输入到视频解码器722中;基于参考帧缓存790的先前重建帧 794生成重建帧718;将重建帧718输入循环中的上采样器或下采样器 724,生成上采样或下采样的重建帧796,并将上采样或下采样的重建帧 796输出到参考帧缓存790。可替代地,重建帧718可以从循环中输出,其可以包括将重建帧输入到循环后上采样器或下采样器726中,生成上采样或下采样的重建帧798,将上采样或下采样的重建帧798输出到显示缓存792。
根据本公开的示例实施例,视频解码器722可以是实现运动预测编码格式的任何解码器,包括但不限于本文描述的那些编码格式。基于参考帧缓存790的先前重建帧来生成重建帧可以包括如本文所述的帧间编码运动预测,其中先前重建帧可以是由先前编码循环期间的循环中的上采样器或下采样器722输出的上采样或下采样的重建帧。并且如前所述,先前重建帧用作帧间编码运动预测中的参考图片。
根据本公开的示例实施例,循环中上采样器或下采样器724 和循环后上采样器或下采样器726可以各自实现分别适合于至少上采样或下采样以运动预测编码格式编码的帧的编码像素信息的上采样或下采样算法。循环中上采样器或下采样器724和循环后上采样器或下采样器 726的每一个可以实现进一步分别适合于按比例放大和按比例缩小运动信息(例如运动矢量)的上采样或下采样算法。
与循环后上采样器或下采样器426所利用的算法相比,循环内上采样器或下采样器724可以使用相对更简单的上采样或下采样算法,并且具有更高的计算速度,足以使得由循环内上采样器或下采样器 724输出的上采样或下采样的重建帧796可以在该上采样或下采样的重建帧796需要在将来的编码循环迭代中作为先前重建帧之前输入至参考帧缓存790中,而循环后上采样器或下采样器726输出的上采样或下采样的重建帧798在如上需要的上采样或下采样的重建帧796之前可能不会被及时输出。例如,循环内上采样器可以利用不依赖训练的差值、平均或双线性上采样算法,而循环后上采样器可以利用训练的上采样算法。
因此,可以根据当前帧712相对于前一帧714和下一帧716 的分辨率,对在为当前帧712生成重建帧718(例如先前的重建帧794) 时用作参考图片的帧进行上采样或下采样。例如,在当前帧712的分辨率大于前一帧714和下一帧716中的任何一个或大于两者的分辨率的情况下,可以对用作参考图片的帧进行上采样。在当前帧712的分辨率小于前一帧714和下一帧716之一或大于两者的分辨率的情况下,可以对用作参考图片的帧进行下采样。
图8A、图8B和图8C示出了根据本公开的示例性实施例的实现分辨率自适应视频编码的视频编码方法800的示例流程图,其中,帧通过仿射运动预测编码来编码。
在步骤802,视频解码器可以获得通过仿射运动预测编码而编码的比特流的当前帧,其中可以根据比特流信号进一步启用仿射合并模式或AMVP模式。当前帧可以具有位置N。在比特流中具有位置N-1 的前一帧的分辨率可以大于或小于当前帧的分辨率,而在比特流中具有位置N+1的下一帧可以具有大于或小于当前帧分辨率的分辨率。
在步骤804,视频解码器可从参考帧缓存中获得一个或更多个参考图片,并将一个或更多个参考图片的分辨率与当前帧的分辨率进行比较。
在步骤806,在视频解码器确定一个或更多个参考图片的一个或更多个分辨率不同于当前帧的分辨率时,视频解码器可以从参考帧缓存中选择具有与当前帧分辨率相同的分辨率的帧(如果有)。
根据本公开的示例实施例,具有与当前帧的分辨率相同的分辨率的帧可以是参考帧缓存中具有与当前帧的分辨率相同的分辨率的很新的帧,其可以不是参考帧缓冲区的最新帧。
在步骤808中,循环内上采样器或下采样器可以确定当前帧的分辨率与一个或更多个参考图片的分辨率的比率;并根据该比率缩放一个或更多个参考图片的运动矢量。
根据本公开的示例实施例,缩放运动矢量可以包括增加或减小运动矢量的大小。
在步骤810A,循环内上采样器或下采样器可以根据所述比率进一步调整一个或更多个参考图片的帧间预测器的大小。
根据本公开的示例实施例,帧间预测器可以是例如参考可能具有不同分辨率的其他参考图片的用于运动预测的运动信息。
在步骤810B,可选地,循环内上采样器或下采样器可以检测在当前帧的帧头或图片头中标识的上采样或下采样的滤波器系数,并将所述标识的滤波器系数与当前帧的滤波器系数的差值发送到视频解码器。滤波器系数可以被认为是帧间预测器的系数。因此,帧间预测器的滤波器系数与当前帧的滤波器系数之间的差值使得预测运动信息能够被应用于当前帧的滤波器。
在步骤812,视频解码器可获得当前帧的块的仿射合并候选列表或AMVP候选列表。仿射合并候选列表或AMVP候选列表的推导可以根据本文所述的上述步骤来执行。可以根据本文所述上述步骤在仿射合并候选列表或AMVP候选列表的推导中分别推导CPMVP候选或AMVP候选。
在步骤814,根据本文所述的前述步骤,视频解码器可以从仿射合并候选列表或AMVP候选列表中选择CPMVP候选或AMVP候选,并获得CPMVP候选或AMVP候选的运动矢量作为重建帧的块的运动矢量。
在步骤816,视频解码器可基于一个或更多个参考图片以及所选择的CPMVP或AMVP候选从当前帧生成重建帧。
可以通过参考具有与当前帧相同的分辨率的所选参考图片,通过根据与当前帧的相同分辨率分别缩放或调整参考帧缓存的其他帧的运动矢量或帧间预测器,或者通过在编码滤波器时将由循环内上采样器或下采样器发送的标识的滤波器系数和当前帧的滤波器系数的差值应用于所述当前帧的滤波器。
在步骤818,可将重建帧输入到循环内上采样器或下采样器和循环后上采样器或下采样器中的至少一个中。
在步骤820,循环内上采样器或下采样器或循环后上采样器或下采样器中的至少一个可基于重建帧生成上采样或下采样的重建帧。
可以根据比特流所支持的多个分辨率的不同分辨率来分别生成多个上采样或下采样的重建帧。
在步骤822,可以将重建帧和一个或更多个上采样或下采样的重建帧中的至少一个输入到参考帧缓存和显示缓存中的至少一个中。
在将重建帧输入到参考帧缓存的情况下,可以将重建帧作为参考图片获得,并随后如上文关于步骤806所描述的在后续编码循环迭代中进行上采样或下采样。在将一个或更多个上采样或下采样的重建帧输入到参考帧缓存的情况下,可以选择一个或更多个上采样或下采样帧中的一个作为在编码循环的后续迭代中具有与当前帧分辨率相同的分辨率的帧。
图9A、9B和9C示出了根据本公开的示例实施例的实现分辨率自适应视频编码的视频编码方法900的示例流程图,其中运动信息由 DMVR预测。
在步骤902,视频解码器可以获得比特流的当前帧。当前帧可以具有位置N。在比特流中具有位置N-1的前一帧的分辨率可以大于或小于当前帧的分辨率,而在比特流中具有位置N+1的下一帧的分辨率可以大于或小于当前帧的分辨率。
在步骤904,视频解码器可从参考帧缓存获得一个或更多个参考图片,并将所述一个或更多参考图片的分辨率与当前帧的分辨率相比较。
在步骤906,在视频解码器确定一个或更多个参考图片的一个或更多个分辨率与当前帧的分辨率不同时,循环内上采样器或下采样器可以从参考帧缓存中选择与当前帧的分辨率相同分辨率的帧(如果有)。
根据本公开的示例实施例,视频解码器可以从参考帧缓存中选择具有与当前帧的分辨率相同的分辨率的帧。具有与当前帧的分辨率相同的分辨率的帧可以是参考帧缓存的具有与当前帧的分辨率相同的分辨率的很新的帧,其可以不是参考帧缓存的最新帧。
在步骤908,循环内上采样器或下采样器可以确定当前帧的分辨率与一个或更多个参考图片的分辨率之比率;并根据所述比率调整所述一个或更多参考图片的像素图案的大小。
根据本公开的示例实施例,根据DMVR,调整一个或更多个参考图片的像素图案的大小可以便于在不同分辨率下的矢量细化处理,例如,上述的步骤中通过成本测量将模板与第一参考图片的靠近初始的第一块的第一采样区域,以及与第二参考图片的靠近初始第二块的第二采样区域进行比较。
在步骤910,根据本文所述的前述步骤,视频解码器可基于参考帧缓存的第一参考帧和第二参考帧对当前帧执行双向预测和矢量细化。
在步骤912,视频解码器可以基于第一参考帧和第二参考帧从当前帧生成重建帧。
可以通过参考具有与当前帧相同的分辨率的所选参考图片或者通过根据与当前帧相同的分辨率来调整参考帧缓存的其他帧的像素图案的尺寸来预测重建帧。
在步骤914,可以将重建帧输入到循环内上采样器或下采样器以及循环后上采样器或下采样器中的至少一个中。
在步骤916,循环内上采样器或下采样器或循环后上采样器或下采样器中的至少一个可基于重建帧生成上采样或下采样的重建帧。
可以根据比特流所支持的多个分辨率的不同分辨率来分别生成多个上采样或下采样的重建帧。
在步骤918,可以将重建帧和一个或更多个上采样或下采样的重建帧中的至少一个输入到参考帧缓存和显示缓存中的至少一个中。
在将重建帧输入到参考帧缓存中的情况下,可以将重建帧作为参考图片获得,并随后如上文关于步骤906所描述的在后续编码循环迭代中进行上采样或下采样。在将一个或更多个上采样或下采样的重建帧输入到参考帧缓存的情况下,编码循环的后续迭代中,可以选择一个或更多个上采样或下采样帧中的一个作为具有与当前帧分辨率相同的分辨率的帧。
图10示出了用于实现上述用于以运动预测编码格式来实现分辨率自适应视频编码的过程和方法的示例性***1000。
本文描述的技术和机制可以由***1000的多个实例以及由任何其他计算设备、***和/或环境来实现。图10所示的***1000仅是***的一个示例,并且无意于暗示对用于执行上述过程和/或程序的任何计算设备的使用范围或功能的任何限制。适用于实施例的其他众所周知的计算设备、***、环境和/或配置包括但不限于:个人计算机、服务器计算机、手持式或膝上型设备、多处理器***、基于微处理器的***、机顶盒、游戏机、可编程消费电子产品、网络PC、小型计算机、大型计算机、包括上述任何***或设备的分布式计算环境、使用现场可编程门阵列(“FPGA”)的实现以及专用集成电路(“ASIC”)等。
***1000可以包括一个或更多个处理器1002和可通信地连接到所述一个或更多个处理器1002的***存储器1004。一个或更多个处理器1002可以执行一个或更多个模块和/或处理以使一个或更多个处理器1002执行各种功能。在一些实施例中,处理器1002可以包括中央处理单元(CPU)、图形处理单元(GPU)、CPU和GPU两者均包括,或者本领域已知的其他处理单元或组件。另外,每个处理器1002可以拥有其自己的本地存储器,该本地存储器还可以存储程序模块、程序数据和/ 或一个或更多个操作***。
取决于***1000的确切配置和类型,***存储器1004可以是易失性的,例如RAM,或者是非易失性的,例如ROM、闪存、微型硬盘驱动器、存储卡等,或者它们的某种组合。***存储器1004可以包括一个或更多个可由处理器1002执行的计算机可执行模块1006。
模块1006可以包括但不限于解码器模块1008和上采样器或下采样器模块1010。解码器模块1008可以包括帧获得模块1012、参考图片获得模块1014、帧选择模块1016、候选列表获得模块1018、运动预测模块1020、重建帧生成模块1022以及上采样器或下采样器输入模块 1024。上采样器或下采样器模块1010可以包括比率确定模块1026、缩放模块1030、帧间预测器大小调整模块1032、滤波器系数检测和差值发送模块1034、上采样或下采样的重建帧生成模块1036以及缓存输入模块1038。
帧获得模块1012可以被配置为获得以仿射运动预测编码格式编码的比特流的当前帧,参考如上图8所述。
参考图片获得模块1014可以被配置为从参考帧缓存获得一个或更多个参考图片,并且将一个或更多个参考图片的分辨率与当前帧的分辨率进行比较,参考如上图8所述。
帧选择模块1016可以被配置为在参考图片获得模块1014确定一个或更多个参考图片的一个或更多个分辨率与当前帧的分辨率不同后,从参考帧缓存中选择具有与当前帧的分辨率相同的分辨率的帧。参考图8如上所述。
候选列表获得模块1018可以被配置为针对当前帧的块获得仿射合并候选列表或AMVP候选列表,参考如上图8所述。
运动预测模块1020可以被配置为从获得的仿射合并候选列表或AMVP候选列表中选择CPMVP或AMVP候选,并获得CPMVP或 AMVP候选的运动矢量作为重建帧的块的运动矢量,参考图8如上所述。
重建帧生成模块1022可以被配置为基于一个或更多个参考图片和所选择的运动候选从当前帧生成重建帧。
上采样器或下采样器输入模块1024可以被配置为将重建帧输入到上采样器或下采样器模块1010中。
比率确定模块1026可以被配置为确定当前帧的分辨率与一个或更多个参考图片的分辨率的比率。
缩放模块1030可以被配置为根据所述比率来缩放一个或更多个参考图片的运动矢量。
帧间预测器调整大小模块1032可以被配置为根据该比率来调整一个或更多个参考图片的帧间预测器的大小。
滤波器系数检测和差值发送模块1034可以被配置为检测在当前帧的序列头或图片头中标识的上采样或下采样滤波器系数,并将标识的滤波器系数和当前帧的滤波器系数的差值发送至视频解码器。
上采样或下采样的重建帧生成模块1036可以被配置为基于重建帧来生成上采样或下采样的重建帧。
缓存输入模块1038可以被配置为将上采样或下采样的重建帧输入到参考帧缓存和显示缓存中的至少一个中,参考图8如上所述。
***1000可以另外包括输入/输出(I/O)接口1040,所述输入/输出(I/O)接口1040用于接收要处理的比特流数据,并且用于将重建帧输出到参考帧缓存和/或显示缓存中。***1000还可以包括通信模块1050,其允许***1000通过网络(未示出)与其他设备(未示出)通信。该网络可以包括互联网、诸如有线网络或直接有线连接之类的有线介质,以及诸如声学、射频(RF)、红外和其他无线介质之类的无线介质。
图11示出了用于实现上述用于以运动预测编码格式来实现分辨率自适应视频编码的过程和方法的示例性***1100。
本文描述的技术和机制可以由***1100的多个实例以及由任何其他计算设备、***和/或环境来实现。图11中所示的***1100仅是***的一个示例,并且无意于暗示对用于执行上述过程和/或程序的任何计算设备的使用范围或功能的任何限制。适用于实施例的其他众所周知的计算设备、***、环境和/或配置包括但不限于个人计算机、服务器计算机、手持式或膝上型设备、多处理器***、基于微处理器的***、机顶盒、游戏机、可编程消费电子产品、网络PC、小型计算机、大型计算机、包括上述任何***或设备的分布式计算环境、使用现场可编程门阵列(“FPGA”)的实现以及专用集成电路(“ASIC”)等。
***1100可以包括一个或更多个处理器1102和可通信地连接到所述一个或更多个处理器1102的***存储器1104。一个或更多个处理器1102可以执行一个或更多个模块和/或处理以使一个或更多个处理器1102执行各种功能。在一些实施例中,一个或更多个处理器1102可以包括中央处理单元(CPU)、图形处理单元(GPU)CPU和GPU两者都包括,或者本领域已知的其他处理单元或组件。另外,每个处理器 1102可拥有其自己的本地存储器,该本地存储器还可存储程序模块,程序数据和/或一个或更多个操作***。
取决于***1100的确切配置和类型,***存储器1104可以是易失性的,例如RAM,或者是非易失性的,例如ROM、闪存、微型硬盘驱动器、存储卡等,或者它们的某种组合。***存储器1104可以包括可由一个或更多个处理器1102执行的一个或更多个计算机可执行模块 1106。
模块1106可以包括但不限于解码器模块1108和上采样器或下采样器模块1110。解码器模块1108可以包括帧获得模块1112、参考图片获得模块1114、双向预测模块1116、矢量细化模块1118、上采样或下采样的重建帧生成模块1120以及上采样器或下采样器输入模块1122。上采样器或下采样器模块1110可以包括比率确定模块1124、像素图案调整大小模块1128、上采样或下采样的重建帧生成模块1130以及缓存输入模块1132。
帧获得模块1112可以被配置为获得以BIO编码格式编码的比特流的当前帧,参考如上图9所述。
参考图片获得模块1114可以被配置为从参考帧缓存获得一个或更多个参考图片,并且将一个或更多个参考图片的分辨率与当前帧的分辨率进行比较,参考如上图9所述。
双预测模块1116可以被配置为基于参考帧缓存的第一参考帧和第二参考帧,对当前帧执行双预测。参考如上图9所述。
矢量细化模块1118可以被配置为在双向预测处理期间基于参考帧缓存的第一参考帧和第二参考帧来执行矢量细化,参考如上图6所述。
重建帧生成模块1120可以被配置为基于第一参考帧和第二参考帧从当前帧生成重建帧。
上采样器或下采样器输入模块1122可以被配置为将重建帧输入到上采样器或下采样器模块1110中。
比率确定模块1124可以被配置为确定当前帧的分辨率与一个或更多个参考图片的分辨率的比率。
像素图案调整大小模块1128可以被配置为根据所述比率调整一个或更多个参考图片的像素图案的大小。
上采样或下采样的重建帧生成模块1130可以被配置为基于重建帧来生成上采样或下采样的重建帧。
缓存输入模块1132可以被配置为将上采样或下采样的重建帧输入到参考帧缓存和显示缓存中的至少一个中,参照如上图9所述。
***1100可以另外包括输入/输出(I/O)接口1140,输入/输出(I/O)接口1140用于接收要处理的比特流数据,并且用于将重建帧输出到参考帧缓存和/或显示缓存中。***1100还可包括通信模块 1150,其允许***1100通过网络(未示出)与其他设备(未示出)通信。该网络可以包括互联网,诸如有线网络或直接有线连接之类的有线介质,以及诸如声学、射频(RF)、红外和其他无线介质之类的无线介质。
如下所述,可以通过执行存储在计算机可读存储介质上的计算机可读指令来执行上述方法的部分或全部操作。在说明书和权利要求书中使用的术语“计算机可读指令”包括例程、应用程序、应用程序模块、程序模块、程序、组件、数据结构、算法等。可以在各种***配置上实现计算机可读指令,包括单处理器或多处理器***、小型计算机、大型计算机、个人计算机、手持式计算设备、基于微处理器的设备、可编程消费电子产品、及其组合等。
计算机可读存储介质可以包括易失性存储器(例如,随机存取存储器(RAM))和/或非易失性存储器(例如,只读存储器 (ROM)、闪存等)。计算机可读存储介质还可包括其他可移动存储器和/或不可移动存储器,包括但不限于可提供计算机的可读指令、数据结构、程序模块等的非易失性存储的闪存、磁存储、光存储和/或磁带存储。
非暂时性计算机可读存储介质是计算机可读介质的示例。计算机可读介质包括至少两种类型的计算机可读介质,即计算机可读存储介质和通信介质。计算机可读存储介质包括以任何处理或技术实现的用于存储诸如计算机可读指令、数据结构、程序模块或其他数据之类的信息的易失性和非易失性、可移动和不可移动介质。计算机可读存储介质包括但不限于相变存储器(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦可编程只读存储器(EEPROM)、闪存或其他存储技术、光盘只读存储器(CD-ROM)、数字通用光盘(DVD) 或其他光学存储器、磁带盒、磁带、磁盘存储或其他磁性存储设备、或可用于存储信息以供计算设备访问的任何其他非传输介质。相反,通信介质可以在诸如载波的调制数据信号或其他传输机制中体现计算机可读指令、数据结构、程序模块或其他数据。如本文所定义,计算机可读存储介质不包括通信介质。
存储在一个或更多个非暂时性计算机可读存储介质上的计算机可读指令,当由一个或更多个处理器执行时,该计算机可读指令可以执行以上参考图1至图11所描述的操作。通常,计算机可读指令包括执行特定功能或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等。描述操作的顺序不旨在被理解为限制,并且可以以任何顺序和/或并行地组合任意数量的所描述的操作以实现处理。
通过上述技术方案,本公开提供了运动预测编码格式所支持的帧间编码分辨率视频编码,通过允许在要编码的帧之间改变分辨率的同时允许运动矢量参考先前帧,从而改进了多运动预测编码格式下的视频编码处理。因此,保持了帧间编码的带宽节省,实现了运动预测编码的带宽节省,从而允许使用参考帧来预测后续帧的运动矢量,并且实现了根据可用带宽的自适应地下采样和上采样的带宽节省。同时,从而在视频编码和内容交付期间实现了网络成本的显着改善,同时减少了可抵消或损害这些节省的额外数据的传输。
条款示例
A.一种方法,包括:获得比特流的当前帧;以及从参考帧缓存中获得分辨率不同于当前帧的分辨率的一个或更多个参考图片;调整所述一个或更多个参考图片的帧间预测器的大小;基于所述一个或更多个参考图片和当前帧的一个或更多个块的运动信息,从当前帧生成重建帧,该运动信息包括至少一个帧间预测器。
B.如段落A所述的方法,还包括:将所述一个或更多个参考图片的分辨率与当前帧的分辨率进行比较;以及在确定一个或更多个参考图片的一个或更多个分辨率与当前帧的分辨率不同时,从参考帧缓存中选择具有与当前帧的分辨率相同的分辨率的帧;确定所述当前帧的分辨率与所述一个或更多个参考图片的分辨率的比率;根据所述比率调整所述一个或多个参考图片的大小以匹配所述当前帧的分辨率;根据所述比率,对所述一个或更多个参考图片的帧间预测器进行上采样或下采样;根据所述比率缩放所述一个或更多个参考图片的运动矢量。
C.如段落A所述的方法,还包括:获得当前帧的仿射合并候选列表或AMVP候选列表;从所述仿射合并候选列表或AMVP候选列表中分别选择CPMVP候选或AMVP候选;获得所述候选候选的运动矢量作为所述重建帧的块的运动矢量。
D.如段落C所述的方法,其进一步包括:获得继承的仿射合并候选和构造的仿射合并候选中的至少一个,以及将继承的仿射合并候选和构造的仿射合并候选中的至少一个添加到仿射合并候选列表或 AMVP候选列表。
E.如段落A所述的方法,还包括:基于所述一个或更多个参考图片和至少一个帧间预测器,从所述当前帧生成重建帧;将所述重建帧输入到循环内上采样器或下采样器和循环后上采样器或下采样器中的至少一个中;基于所述重建帧生成上采样或下采样的重建帧;将所述上采样或下采样的重建帧输入到参考帧缓存和显示缓存的至少其中一个中。
F.一种方法,包括:获得比特流的当前帧;以及从参考帧缓存中获得一个或更多个参考图片,并将所述一个或更多个参考图片的分辨率与当前帧的分辨率进行比较;当确定所述一个或更多个参考图片的一个或更多个分辨率与所述当前帧的分辨率不同时,根据当前帧的分辨率调整所述一个或更多个参考图片的像素图案的大小。
G.如段落F所述的方法,还包括:基于参考帧缓存的第一参考帧和第二参考帧,对当前帧执行双向预测。
H.如段G所述,其中对当前帧执行双向预测还包括基于参考帧缓存的第一参考帧和第二参考帧对当前帧执行矢量细化。
I.如段落H所述的方法,还包括:基于所述第一参考帧和第二参考帧,从当前帧生成重建帧;将所述重建帧输入到循环内上采样器或下采样器和循环后上采样器或下采样器中的至少一个中;基于所述重建帧生成上采样或下采样的重建帧;将所述上采样或下采样的重建帧输入参考帧缓存和显示缓存的至少其中之一中。
J.一种方法,包括:获得比特流的当前帧,所述比特流包括具有多个分辨率的帧;从参考帧缓存中获得一个或更多个参考图片;基于所述一个或更多个参考图片和当前帧的一个或更多个块的运动信息从当前帧生成重建帧,该运动信息包括至少一个帧间预测器;针对多个分辨率中的每个分辨率对当前重建帧进行上采样或下采样,以生成与各个分辨率匹配的上采样或下采样的重建帧。
K.如段落J所述的方法,其进一步包括检测检测用于标识所述一个或更多个参考图片中的至少一个的上采样或下采样滤波器系数。
L.如段落K所述的方法,还包括:将帧间预测器的滤波器系数与当前帧的滤波器系数之间的差值应用于编码当前帧的滤波器。
M.如段落J所述的方法,还包括将重建帧和每个上采样或下采样的重建帧输入到参考帧缓存中。
N.一种***,包括:一个或更多个处理器和可通信地连接到所述一个或更多个处理器的存储器,该存储器存储可由所述一个或更多个处理器执行的计算机可执行模块,该模块在由所述一个或更多个处理器执行时,执行相关操作,所述计算机可执行模块包括:帧获得模块,所述帧获得模块被配置为获得比特流的当前帧;以及参考图片获得模块,所述参考图片获得模块用于从参考帧缓存中获得一个或更多个参考图片,并将所述一个或更多个参考图片的分辨率与当前帧的分辨率进行比较。
O.如段落N所述的***,还包括:帧选择模块,所述帧选择模块被配置为在参考图片获得模块确定所述一个或更多个参考图片的一个或更多个分辨率与当前帧的分辨率不同的情况下,从参考帧缓存中选择帧与当前帧的分辨率具有相同分辨率的帧。
P.如段落O所述的***,其进一步包括:候选列表获得模块,所述候选列表获得模块被配置为获得当前帧的块的仿射合并候选列表或AMVP候选列表。
Q.如段落P所述的***,还包括运动预测模块,该运动预测模块被配置为分别从获得的仿射合并候选列表或AMVP候选列表中分别选择CPMVP或AMVP候选。
R.如段落Q所述的***,其中,运动预测模块还被配置为获得CPMVP或AMVP候选的运动矢量作为重建帧的块的运动矢量。
S.如段落N所述的***,还包括:重建帧生成模块,所述重建帧生成模块被配置为基于所述一个或更多个参考图片和所选择的运动候选从当前帧生成重建帧;上采样器或下采样器输入模块,所述上采样器或下采样器输入模块用于将所述重建帧输入到上采样器或下采样器模块;比率确定模块,所述比率确定模块用于确定当前帧的分辨率与所述一个或更多个参考图片的分辨率的比率;帧间预测器调整大小模块,所述帧间预测器调整大小模块被配置为根据所述比率调整所述一个或更多个参考图片的帧间预测器的大小;滤波器系数检测和差值发送模块,所述滤波器系数检测和差值发送模块用于检测在当前帧的序列头或图片头中标识的上采样或下采样滤波器系数,并将标识的滤波器系数和当前帧滤波器系数之间的差值帧到视频解码器;缩放模块,所述缩放模块用于根据所述比率缩放所述一个或更多个参考图片的运动矢量;上采样或下采样的重建帧生成模块,所述上采样或下采样的重建帧生成模块用于根据所述重建帧生成上采样或下采样的重建帧;缓存输入模块,所述缓存输入模块用于将所述上采样或下采样的重建帧输入到参考帧缓存和显示缓存中的至少一个中。
T.一种***,包括:一个或更多个处理器和可通信地连接到所述一个或更多个处理器的存储器,该存储器存储可由所述一个或更多个处理器执行的计算机可执行模块,该模块在由一个或更多个处理器执行时,执行相关操作,所述计算机可执行模块包括:帧获得模块,所述帧获得模块被配置为获得比特流的当前帧;以及参考图片获得模块,所述参考图片获得模块用于从参考帧缓存中获得一个或更多个参考图片,并将所述一个或更多个参考图片的分辨率与当前帧的分辨率进行比较。
U.如段落T所述的***,还包括:双向预测模块,所述双向预测模块被配置为基于参考帧缓存的第一参考帧和第二参考帧对当前帧执行双向预测。
V.如段落U所述的***,其进一步包括:矢量细化模块,所述矢量细化模块被配置为基于所述参考帧缓存的第一参考帧和第二参考帧在双向预测过程期间执行矢量细化。
W.如段落V所述的***,还包括:重建帧生成模块,所述重建帧生成模块被配置为基于第一参考帧和第二参考帧从当前帧生成重建帧;上采样器或下采样器输入模块,所述上采样器或下采样器输入模块被配置为将重建帧输入到上采样器或下采样器模块;上采样或下采样的重建帧生成模块,所述上采样或下采样的重建帧生成模块被配置为根据所述重建帧生成上采样或下采样的重建帧;以及缓存输入模块,所述缓存输入模块用于将上采样或下采样的重建帧输入到参考帧缓存和显示缓存中的至少一个中。
尽管已经以特定于结构特征和/或方法动作的语言描述了主题,但是应该理解,所附权利要求书中定义的主题不必限于所描述的特定特征或动作。而是,将特定特征和动作公开为实现权利要求的示例性形式。

Claims (15)

1.一种视频解码方法,包括:
获得比特流的当前帧;
从参考帧缓存中获得一个或更多个参考图片,所述一个或更多个参考图片具有与当前帧的分辨率不同的分辨率;
检测在当前帧的帧头或图片头中标识的上采样或下采样的滤波器系数,并将所述标识的滤波器系数与当前帧的滤波器系数的差值发送到视频解码器;和
基于一个或更多个参考图片和所述当前帧的一个或更多个块的运动信息从所述当前帧生成重建帧,所述运动信息至少包括所述标识的滤波器系数与当前帧的滤波器系数的差值。
2.根据权利要求1所述的方法,其进一步包括获得针对所述当前帧的块的仿射合并候选列表或仿射自适应运动矢量预测(AMVP)候选列表,所述仿射合并候选列表或所述AMVP候选列表分别包括多个控制点运动矢量预测器(CPMVP)候选或AMVP候选。
3.根据权利要求2所述的方法,其中,获得所述仿射合并候选列表或所述AMVP候选列表包括获得至多两个继承的仿射合并候选。
4.根据权利要求2所述的方法,其中获得所述运动候选列表包括获得所构造的仿射合并候选。
5.根据权利要求2所述的方法,还包括:
从获得的所述仿射合并候选列表或所述AMVP候选列表中分别选择CPMVP候选或AMVP候选;和
获得所述CPMVP候选或所述AMVP候选的运动信息作为所述当前帧的块的运动信息。
6.根据权利要求5所述的方法,其中,所述运动信息包括对参考图片的参考,并获得出所述运动候选的运动信息还包括:
基于所述参考图片的运动信息的参考,生成多个CPMV。
7.一种计算机可读存储介质,其存储可由一个或更多个处理器执行的计算机可读指令,所述计算机可读指令在由所述一个或更多个处理器执行时使所述一个或更多个处理器执行以下操作:
获得比特流的当前帧;
从参考帧缓存中获得一个或更多个参考图片,所述一个或更多个参考图片具有与当前帧的分辨率不同的分辨率;检测用于标识所述一个或更多个参考图片中的至少一个的上采样或下采样滤波器系数;
基于一个或更多个参考图片和所述当前帧的一个或更多个块的运动信息从当前帧生成重建帧,所述运动信息至少包括所述标识的滤波器系数与当前帧的滤波器系数的差值;和
根据一分辨率对当前重建帧进行上采样或下采样,以生成与所述分辨率匹配的上采样或下采样的重建帧。
8.根据权利要求7所述的计算机可读存储介质,其中,所述标识的滤波器系数为帧间预测器的滤波器系数,所述操作还包括:将帧间预测器的滤波器系数与当前帧的滤波器系数之间的差值应用于编码所述当前帧的滤波器。
9.根据权利要求7所述的计算机可读存储介质,其中,所述操作还包括:将所述重建帧和所述上采样或下采样的重建帧输入到所述参考帧缓存中作为参考图片。
10.一种视频解码***,包括:
一个或更多个处理器;和
存储器,所述存储器可通信地连接到所述一个或更多个处理器,所述存储器存储可由所述一个或更多个处理器执行的计算机可执行模块,所述计算机可执行模块在由所述一个或更多个处理器执行时执行相关的操作,所述计算机可执行模块包括:
帧获得模块,所述帧获得模块被配置为获得比特流的当前帧;
参考帧获得模块,所述参考帧获得模块被配置为从参考帧缓存中获得一个或更多个参考图片,所述一个或更多个参考图片具有与当前帧的分辨率不同的分辨率;
滤波器系数检测和差值发送模块,所述滤波器系数检测和差值发送模块被配置为检测在当前帧的帧头或图片头中标识的上采样或下采样的滤波器系数,并将所述标识的滤波器系数与当前帧的滤波器系数的差值发送到视频解码器;
重建帧生成模块,所述重建帧生成模块被配置为基于一个或更多个参考图片和所述当前帧的一个或更多个块的运动信息从所述当前帧生成重建帧,所述运动信息至少包括所述标识的滤波器系数与当前帧的滤波器系数的差值。
11.如权利要求10所述的***,其特征在于,还包括候选列表获得模块,所述候选列表获得模块被配置为获得用于当前帧的块的仿射合并候选列表或AMVP候选列表,所述仿射合并候选列表或AMVP候选列表分别包括多个CPMVP候选或AMVP候选。
12.根据权利要求11所述的***,其中,获得所述仿射合并候选列表或所述AMVP候选列表包括获得至多两个继承的仿射合并候选。
13.根据权利要求11所述的***,其中,获得所述运动候选列表包括:获得构造的仿射合并候选。
14.根据权利要求11所述的***,其进一步包含运动预测模块,所述运动预测模块被配置为分别从所获得的仿射合并候选列表或AMVP候选列表中选择CPMVP候选或AMVP候选,并获得所述CPMVP候选或所述AMVP候选的运动信息,作为所述当前帧的块的运动信息。
15.根据权利要求14所述的***,其中,所述运动候选包括对参考图片的运动信息的参考,并且所述运动预测模块还被配置为:
基于对参考图片的运动信息的参考,生成多个CPMV。
CN201980007184.5A 2019-03-11 2019-03-11 视频解码方法、***和存储介质 Active CN113597764B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2019/077665 WO2020181456A1 (en) 2019-03-11 2019-03-11 Inter coding for adaptive resolution video coding

Publications (2)

Publication Number Publication Date
CN113597764A CN113597764A (zh) 2021-11-02
CN113597764B true CN113597764B (zh) 2022-11-01

Family

ID=72426146

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980007184.5A Active CN113597764B (zh) 2019-03-11 2019-03-11 视频解码方法、***和存储介质

Country Status (5)

Country Link
US (1) US20210084291A1 (zh)
EP (1) EP3777143A4 (zh)
JP (1) JP2022530172A (zh)
CN (1) CN113597764B (zh)
WO (1) WO2020181456A1 (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3744094A4 (en) * 2018-01-26 2021-11-03 MediaTek Inc. METHOD AND DEVICE FOR AFFINE INTER-PREDICTION FOR A VIDEO ENCODING SYSTEM
MX2021006688A (es) * 2018-12-07 2021-07-07 Beijing Dajia Internet Information Tech Co Ltd Codificacion de video utilizando el manejo de imagen de referencia de resolucion multiple.
JP7273193B2 (ja) * 2019-05-12 2023-05-12 北京字節跳動網絡技術有限公司 参照ピクチャ再サンプリングのための信号通知
CN114342406A (zh) * 2019-06-28 2022-04-12 Sk电信有限公司 用于推导双向预测权重索引的方法及图像解码设备
WO2023059034A1 (ko) * 2021-10-04 2023-04-13 엘지전자 주식회사 적응적으로 해상도를 변경하는 영상 부호화/복호화 방법, 장치, 및 비트스트림을 전송하는 방법
CN114531596A (zh) * 2022-01-25 2022-05-24 京东方科技集团股份有限公司 图像处理方法和装置
CN116527921B (zh) * 2023-06-29 2024-04-12 浙江大华技术股份有限公司 仿射候选构建方法、仿射预测的方法和相关设备

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100586882B1 (ko) * 2004-04-13 2006-06-08 삼성전자주식회사 모션 스케일러빌리티를 지원하는 코딩 방법 및 장치
CN102075743B (zh) * 2009-11-24 2014-03-12 华为技术有限公司 视频编码方法及装置、视频解码方法及装置
US8340188B2 (en) * 2010-01-08 2012-12-25 Research In Motion Limited Method and device for motion vector estimation in video transcoding using union of search areas
EP2557789B1 (en) * 2011-08-09 2017-09-27 Dolby Laboratories Licensing Corporation Guided image up-sampling in video coding
US9554149B2 (en) * 2012-02-29 2017-01-24 Lg Electronics, Inc. Inter-layer prediction method and apparatus using same
WO2015053001A1 (ja) * 2013-10-11 2015-04-16 ソニー株式会社 画像処理装置及び画像処理方法
EP3355581A4 (en) * 2015-09-23 2019-04-17 LG Electronics Inc. BILDCODING / DECODING METHOD AND DEVICE THEREFOR
CN106162174B (zh) * 2016-08-31 2019-10-29 北京奇艺世纪科技有限公司 一种视频多分辨率编码方法和装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
AHG18: Comments on the Implementations of Resolution Adaption on HEVC;Ming LI;《Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 7th Meeting》;20111108;全文 *
CE2: Adaptive Motion Vector Resolution for Affine Inter Mode (Test 2.1.2);Hongbin Liu;《Joint Video Experts Team (JVET)of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 13th Meeting》;20190109;全文 *
Ming LI.AHG18: Comments on the Implementations of Resolution Adaption on HEVC.《Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 7th Meeting》.2011, *

Also Published As

Publication number Publication date
EP3777143A1 (en) 2021-02-17
WO2020181456A1 (en) 2020-09-17
JP2022530172A (ja) 2022-06-28
US20210084291A1 (en) 2021-03-18
EP3777143A4 (en) 2022-02-16
CN113597764A (zh) 2021-11-02

Similar Documents

Publication Publication Date Title
CN113597764B (zh) 视频解码方法、***和存储介质
CN110809887B (zh) 用于多参考预测的运动矢量修正的方法和装置
US10097826B2 (en) Method and device for generating a predicted value of an image using interpolation and motion vectors
TWI617185B (zh) 具有仿射運動補償的視訊編碼的方法以及裝置
US11539976B2 (en) Motion estimation using collocated blocks
KR102642784B1 (ko) 모션 벡터 리파인먼트를 위한 제한된 메모리 액세스 윈도우
CN111201795B (zh) 存储访问窗口和用于运动矢量修正的填充
US20160080769A1 (en) Encoding system using motion estimation and encoding method using motion estimation
CN111642141B (zh) 一种分辨率自适应视频编码方法和***
BR112020026988A2 (pt) Método e aparelho de refinamento exato de subpixel baseado em superfície de erro para refinamento de vetor de movimento do lado do decodificador
US10015508B2 (en) Video encoding device and video encoding method
US20230239461A1 (en) Inter coding for adaptive resolution video coding
JP2008085674A (ja) 動き検出装置及びその方法
WO2021046692A1 (en) Resolution-adaptive video coding with conditional interpolation filters
US20220224925A1 (en) Resolution-adaptive video coding
WO2015182692A1 (ja) 動画像符号化装置及び動画像復号装置並びに方法
KR20080107668A (ko) 블록 기반의 영상 움직임 추정 방법 및 그 장치
JPH1198508A (ja) 動きベクトル検出方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant