CN110337810B - 用于视频处理的方法和设备 - Google Patents

用于视频处理的方法和设备 Download PDF

Info

Publication number
CN110337810B
CN110337810B CN201880012518.3A CN201880012518A CN110337810B CN 110337810 B CN110337810 B CN 110337810B CN 201880012518 A CN201880012518 A CN 201880012518A CN 110337810 B CN110337810 B CN 110337810B
Authority
CN
China
Prior art keywords
reconstructed image
image block
motion vector
matching
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201880012518.3A
Other languages
English (en)
Other versions
CN110337810A (zh
Inventor
马思伟
傅天亮
王苫社
郑萧桢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
SZ DJI Technology Co Ltd
Original Assignee
Peking University
SZ DJI Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University, SZ DJI Technology Co Ltd filed Critical Peking University
Publication of CN110337810A publication Critical patent/CN110337810A/zh
Application granted granted Critical
Publication of CN110337810B publication Critical patent/CN110337810B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本申请实施例提供一种用于视频处理的方法和设备,可以减少在获取运动矢量的过程中的硬件资源消耗和占用的存储空间。该方法包括:在获取当前图像块的运动矢量的过程中,对用于匹配的已重构图像块进行匹配之前,对已重构图像数据进行降采样;利用所述已重构图像块的降采样后的所述已重构图像数据进行匹配,以得到匹配结果;基于所述匹配结果,获取所述当前图像块的运动矢量。

Description

用于视频处理的方法和设备
版权申明
本专利文件披露的内容包含受版权保护的材料。该版权为版权所有人所有。版权所有人不反对任何人复制专利与商标局的官方记录和档案中所存在的该专利文件或者该专利披露。
技术领域
本申请涉及视频处理领域,并且更具体地,涉及一种用于视频处理的方法和设备。
背景技术
预测是主流视频编码框架的重要模块,其中,帧间预测通过运动补偿的方式来实现。对于视频中的一帧图像,可以先分成等大的编码树单元(Coding Tree Unit,CTU),例如64x64、128x128大小。每个CTU可以进一步划分成方形或矩形的编码单元(Coding Unit,CU),可以针对每个CU在参考帧中寻找最相似块作为当前CU的预测块。当前块与相似块之间的相对位移为运动矢量(Motion Vector,MV)。在参考帧中寻找相似块作为当前块的预测值的过程就是运动补偿。
解码端导出运动信息技术是近来出现的新技术,主要用于在解码端对解码出的运动矢量进行修正,在不增加码率的情况下,可以提升编码质量,进而提高编码器的性能。
然而,在获取运动矢量时,会进行大量的匹配代价计算,并且需要消耗大量硬件资源对计算匹配代价时所需的重构块进行存储,从而占用大量存储空间。
发明内容
本申请实施例提供一种用于视频处理的方法和设备,可以减少在获取运动矢量的过程中的硬件资源消耗和占用的存储空间。
第一方面,提供了一种用于视频处理的方法,包括:
在获取当前图像块的运动矢量的过程中,对用于匹配的已重构图像块进行匹配之前,对已重构图像数据进行降采样;
利用所述已重构图像块的降采样后的所述已重构图像数据进行匹配,以得到匹配结果;
基于所述匹配结果,获取所述当前图像块的运动矢量。
第二方面,提供了一种用于视频处理的设备,包括:
降采样单元,用于在获取当前图像块的运动矢量的过程中,对用于匹配的已重构图像块进行匹配之前,对已重构图像数据进行降采样;
匹配单元,用于利用所述已重构图像块的降采样后的所述已重构图像数据进行匹配,以得到匹配结果;
获取单元,用于基于所述匹配结果,获取所述当前图像块的运动矢量。
第三方面,提供了一种计算机***,包括:存储器,用于存储计算机可执行指令;处理器,用于访问该存储器,并执行该计算机可执行指令,以进行上述第一方面的方法中的操作。
第四方面,提供了一种计算机存储介质,该计算机存储介质中存储有程序代码,该程序代码可以用于指示执行上述第一方面的方法。
第五方面,提供了一种计算机程序产品,该程序产品包括程序代码,该程序代码可以用于指示执行上述第一方面的方法。
因此,在本申请实施例中,在获取当前图像块的运动矢量MV的过程中,对用于匹配的已重构图像块进行匹配之前,对该已重构图像进行降采样,降采样之后再进行匹配代价的计算,可以减少处理的数据量,从而可以降低数据处理过程中的硬件资源消耗和占用的存储空间。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本申请实施例的编解码***的示意性图。
图2是根据本申请实施例的用于视频处理的方法的示意性流程图。
图3是根据本申请实施例的用于视频处理的方法的示意性流程图。
图4是根据本申请实施例的获取双向模板的示意图。
图5是根据本申请实施例的基于双向模板匹配法获取运动矢量的示意性图。
图6是根据本申请实施例的基于模板匹配法获取运动矢量的示意性图。
图7是根据本申请实施例的基于双向匹配法获取运动矢量的示意性图。
图8是根据本申请实施例的用于视频处理的方法的示意性流程图。
图9是根据本申请实施例的用于视频处理的设备的示意性框图。
图10是根据本申请实施例的计算机***的示意性框图。
具体实现方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
除非另有说明,本申请实施例所使用的所有技术和科学术语与本申请的技术领域的技术人员通常理解的含义相同。本申请中所使用的术语只是为了描述具体的实施例的目的,不是旨在限制本申请的范围。
图1是应用本申请实施例的技术方案的架构图。
如图1所示,***100可以接收待处理数据102,对待处理数据102进行处理,产生处理后的数据108。例如,***100可以接收待编码数据,对待编码数据进行编码以产生编码后的数据,或者,***100可以接收待解码数据,对待解码数据进行解码以产生解码后的数据。在一些实施例中,***100中的部件可以由一个或多个处理器实现,该处理器可以是计算设备中的处理器,也可以是移动设备(例如无人机)中的处理器。该处理器可以为任意种类的处理器,本发明实施例对此不做限定。在一些可能的设计中,该处理器可以包括编码器、解码器或编解码器等。***100中还可以包括一个或多个存储器。该存储器可用于存储指令和数据,例如,实现本发明实施例的技术方案的计算机可执行指令,待处理数据102、处理后的数据108等。该存储器可以为任意种类的存储器,本发明实施例对此也不做限定。
待编码数据可以包括文本,图像,图形对象,动画序列,音频,视频,或者任何需要编码的其他数据。在一些情况下,待编码数据可以包括来自传感器的传感数据,该传感器可以为视觉传感器(例如,相机、红外传感器),麦克风,近场传感器(例如,超声波传感器、雷达),位置传感器,温度传感器,触摸传感器等。在一些情况下,待编码数据可以包括来自用户的信息,例如,生物信息,该生物信息可以包括面部特征,指纹扫描,视网膜扫描,嗓音记录,DNA采样等。
其中,在对每个图像进行编码时,图像可以最初被分成多个图像块。在一些实施例中,图像可以被分成多个图像块,所述图像块在一些编码准中被称为宏块或最大编码单元(LCU,Largest Coding Unit)。图像块可以具有或者可以不具有任何重叠部分。该图像可以被分成任何数量的图像块。举例而言,该图像可以被分成一个m×n图像块阵列。图像块可以具有矩形形状、正方形形状、圆形形状或任何其他形状。图像块可以具有任何尺寸,如p×q像素。在现代视频编码标准中,可以通过首先将该图像分成多个小块来对不同分辨率的图像进行编码。对于H.264,图像块被称为宏块,其大小可以是16×16像素,并且对于HEVC,图像块被称为最大编码单元,其大小可以是64×64。每个图像块都可以具有相同尺寸和/或形状。替代地,两个或更多图像块可以具有不同的尺寸和/或形状。在一些实施例中,一个图像块也可以不是一个宏块或最大编码单元,而是包含一个宏块或最大编码单元的部分,或者包含至少两个完整的宏块(或最大编码单元),或者包含至少一个完整的宏块(或最大编码单元)和一个宏块(或最大编码单元)的部分,或者包含至少两个完整的宏块(或最大编码单元)和一些宏块(或最大编码单元)的部分。如此,在图像被分成多个图像块之后,可以分别对图像数据中的这些图像块进行编码。
在编码过程中,为了去除冗余,可以对图像进行预测。视频中不同的图像可采用不同的预测方式。根据图像所采用的预测方式,可以将图像区分为帧内预测图像和帧间预测图像,其中帧间预测图像包括前向预测图像和双向预测图像。I图像是帧内预测图像,也称为关键帧;P图像是前向预测图像,也即采用之前已编码的一个P图像或者I图像作为参考图像;B图像是双向预测图像,也即采用前后的图像作为参考图像。一种实现方式是编码端将多张图像进行编码后产生一段一段的图像组(group of picture,GOP),该GOP是由一张I图像,以及多张B图像(或双向预测图像)和/或P图像(或前向预测图像)构成的图像组。解码端在播放时则是读取一段一段的GOP进行解码后读取画面再渲染显示。
其中,在进行帧间预测时,可以为每个图像块在参考帧中(一般为时域附近的已重构帧)寻找最相似块作为当前图像块的预测块。当前块与预测块之间的相对位移为运动矢量(Motion Vector,MV)。
为了减少编码端与解码端之间的码率,可以在码率中不传输运动信息,由此需要解码端导出运动信息,也即运动矢量。解码端在导出运动信息时,可能会导致数据吞吐量过大,这样将会引起解码端占用大量硬件资源和空间的问题。
为此,本申请实施例提出一种用于视频处理的方法,可以减少解码端导出运动信息时所需处理的数据量,从而可以避免解码端占用大量的硬件资源和空间的问题。同样,在本申请实施例的方法用于编码端时,可以减少编码端占用的硬件资源和空间。
图2是根据本申请实施例的用于视频处理的方法的示意性流程图。以下方法可选地可以由解码端实现,或者也可以由编码端实现。
其中,在该方法由解码端实现时,以下提到的当前图像块可以是待解码的图像块(也可以称为待重构的图像块)。或者,在该方法由编码端实现时,以下提到的当前图像块可以是待编码的图像块。
在210中,处理设备在获取当前图像块的运动矢量MV的过程中,对用于匹配的已重构图像块进行匹配之前,对已重构图像数据进行降采样。
其中,该处理设备可以是编码端的设备,也可以是解码端的设备。
以及,当前图像块的MV可以理解为当前图像块与选择的预测块之间的MV。
可选地,在本申请实施例中,已重构图像块还可以称为参考块。
可选地,在本申请实施例中,对已重构图像数据降采样可以通过以下两种实现方式来实现。
在一种实现方式中,通过间隔一定数量的像素的采样方式,对该已重构图像数据进行降采样。其中,间隔一定数量的像素的采样方式可以在水平方向和垂直方向上分别间隔一定的数量的采用方式。
例如,假设降采样的对象为已重构图像块为128×128的块,则可以取其中的一些列或一些行的像素作为降采样后的已重构图像块。
可选地,可以利用间隔相同数量的像素的采样方式,对该已重构图像数据进行降采样。其中,间隔相同数量的像素的采样方式可以指水平方向和/或垂直方向上分别间隔相同数量的像素进行采用。
例如,假设降采样的对象为已重构图像块,对该已重构图像块的水平和垂直方向间隔为2进行降采样,可以取左上角的像素点作为降采样结果;当然,也可以取四个像素点的其余三个点作为降采样结果。
例如,假设降采样的对象为已重构图像块,对该已重构图像块的水平方向间隔为2降采样,垂直方向不进行降采样。
例如,假设降采样的对象为已重构图像块,对该已重构图像块的垂直方向间隔为2降采样,水平方向不进行降采样。
在一种实现方式中,对多个像素进行取平均的方式,对该已重构图像数据进行降采样。其中,该多个像素可以是相邻的像素。
例如,假设降采样的对象为已重构图像块,对于12×12的已重构图像块,则可以对四个像素的像素进行取平均的方式,对该已重构图像块进行降采样,其中,四个像素可以是相邻的像素,例如,可以是一个2×2的图像块中的像素。
可选地,降采样的已重构图像数据可以包括用于匹配的已重构图像块的降采样的已重构图像数据。
在一种实现方式中,可以对用于匹配的已重构图像块所属的整帧图像进行降采样,也就是说,在进行降采样时,不对各个已重构图像块进行区分,则此时,降采样的已重构图像数据可以包括用于匹配的已重构图像块的已重构图像数据。
在另一种实现方式中,可以确定用于匹配的已重构图像块,并对确定的该已重构图像块进行降采样。
以下将具体介绍如何对用于匹配的已重构图像块进行降采样。
可选地,在本申请实施例中,根据该已重构图像块的内容,对该已重构图像块的已重构图像数据进行降采样。其中,对已重构图像块的已重构图像数据进行降采样可以称为对已重构图像块进行降采样。
具体地,处理设备可以根据已重构图像块的内容,确定降采样的比例;利用该降采样比例,对该已重构图像块的已重构图像数据进行降采样。
其中,本申请实施例提到的降采样比例可以是指降采样后的图像块包括的像素数量与采样之前的图像块包括的像素数量之间的比例。
其中,已重构图像块的复杂度较高则采样间隔小(也即,降采样比例大),图像块复杂度较低则采样间隔大(也即,降采样比例小),从而根据图像内容进行自适应降采样,可以降低数据采样带来的性能损失。
可选地,本申请实施例提到的已重构图像块的内容可以包括:已重构图像块包括的像素数量、像素灰度、边缘特征中的至少一项。
具体地,处理设备可以根据该已重构图像块包括的像素数量、像素灰度、边缘特征中的至少一项,确定降采样比例;利用该降采样比例,对该已重构图像块进行降采样。
可选地,在本申请实施例中,已重构图像块的像素灰度可以通过已重构图像块的灰度直方图的方差来表征。
可选地,在本申请实施例中,已重构图像块的边缘特征可以通过已重构图像块包括的像素中属于纹理的边缘点的像素数量来表征。
可选地,在本申请实施例中,在用于匹配的已重构图像块包括至少两个已重构图像块时,按照相同的降采样比例,对该至少两个已重构图像块的已重构图像数据进行降采样。
具体地,在一次确定MV的过程中,在匹配过程中,如果需要采用至少两个已重构图像块,则可以采用相同的降采样比例,对至少两个已重构图像块的已重构图像数据进行降采样。
例如,在依据该至少两个已重构图像块的像素灰度和/或包括的像素中属于纹理的边缘点的像素数量,确定出该至少两个已重构图像块需要分别采用不同的降采样比例时,则可以对该不同的降采样比例取平均,平均值用于对该至少两个已重构图像块进行降采样,或者,可以采用最高的降采样比例或最低的降采样比例,对该至少两个已重构图像块的已重构图像数据进行降采样。
例如,在表征该至少两个已重构图像块的像素灰度的值和/或表征该至少两个已重构图像块的边缘特征的值不同时,可以将这些值取平均(如果表征像素灰度的值和表征边缘特征的值同时采用,则可以分别对表征像素灰度的值和表征边缘特征的值进行取平均),利用取平均的值计算一个降采样比例,并利用该一个降采样比例分别对该至少两个已重构图像块的已重构图像数据进行降采样;或者,也可以取这些值中的最大值(如果表征像素灰度的值和表征边缘特征的值同时采用,则可以取表征像素灰度的值中的最大值和以及取表征边缘特征的值中的最大值)或最小值(如果表征像素灰度的值和表征边缘特征的值同时采用,则可以取表征像素灰度的值中的最小值和以及取表征边缘特征的值中的最小值),计算一个降采样比例,并利用该一个降采样比例,分别对该至少两个已重构图像块的已重构图像数据进行降采样。
应理解,在本申请实施例中,用于匹配的已重构图像块可以与当前图像块包括的像素数量相同,则此时根据用于匹配的已重构图像块包括的像素数量确定降采样比例,可以是通过根据当前图像块包括的像素数量确定降采样比例来实现。
可选地,在本申请实施例中,在满足以下条件中的至少一个时,处理设备确定对匹配过程中的已重构图像块进行降采样:
该已重构图像块包括的像素数量大于或等于第一预定值;
该已重构图像块的灰度直方图的方差大于或等于第二预定值;
该已重构图像块包括的像素中属于纹理的边缘像素的数量大于或等于第三预定值。
也就是说,在满足以上条件时,对已重构图像块进行降采样,否则不进行降采样,由此可以避免盲目进行降采样造成的编解码性能较差的问题。
其中,在用于匹配的已重构图像块包括至少两个已重构图像块时,可以是每个已重构图像块包括的像素数量、灰度直方图的方差和包括的像素中属于纹理的边缘像素的数量均满足以上条件,或者也可以是该至少两个已重构图像块包括的像素数量的平均、灰度直方图的方差和包括的像素中属于纹理的边缘像素的数量的平均满足以上条件。
应理解,在本申请实施例中,用于匹配的已重构图像块可以与当前图像块包括的像素数量相同,则此时根据用于匹配的已重构图像块包括的像素数量确定是否对已重构图像块进行降采样,可以是通过根据当前图像块包括的像素数量确定是否对已重构图像块进行降采样来实现。
以上依据已重构图像块的内容确定是否对已重构图像块进行降采样以及降采样的比例,但应理解本申请实施例并不限于此,处理设备在对已重构图像帧进行降采样处理时,也可以根据该已重建图像帧的内容确定是否对该已重建图像帧进行降采样和/或降采样的比例。
具体地,可以根据该已重构图像帧的包括的像素数量、像素灰度、边缘特征中的至少一项,确定降采样比例;利用该降采样比例,对该已重构图像帧进行降采样。
或者,在对该已重构图像帧进行降采样之前,需要满足以下条件:
该已重构图像帧包括的像素数量大于或等于一特定值;
该已重构图像帧的灰度直方图的方差大于或等于一特定值;
该已重构图像帧包括的像素中属于纹理的边缘像素的数量大于或等于一特定值。
在220中,处理设备利用用于匹配的已重构图像块的降采样后的所述已重构图像数据进行匹配,以得到匹配结果。
可选地,在本申请实施例中,匹配还可以称为失真匹配,匹配结果可以为已重构图像块之间进行失真匹配所得到的匹配代价。
在230中,处理设备基于该匹配结果获取该当前图像块的MV。
可选地,在本申请实施例中,在该处理设备为编码端的设备时,则可以利用该MV,对该当前图像块进行编码或重构。
其中,编码端可以将该MV对应的已重构图像块作为预测块,基于该预测块对当前图像块进行编码或重构。
在一种实现方式中,编码端可以直接将该预测块的像素作为当前图像块的重构像素,此种模式可以称为skip模式,skip模式的特点是当前图像块的重构像素值可以等于预测块的像素值,在编码端采用skip模式时,可以在码流中传输一个标识,用于向解码端指示采用的模式为skip模式。
在另一种实现方式中,编码端可以将当前图像块的像素与预测块的像素相减,得到像素残差,并在码流中向解码端传递该像素残差。
应理解,在得到MV之后,便码端可以采用其他的方式对当前图像块进行编码和重构,本申请实施例对此不做具体限定。
可选地,在本申请实施例,本申请实施例可以用于高级运动矢量预测(AdvancedMotion Vector Prediction,AMVP)模式,也就是说,进行匹配得到的结果可以是运动矢量的预测值(Motion Vector Prediction,MVP),编码端在得到MVP之后,可以根据MVP确定运动估计的起始点,在起始点附近,进行运动搜索,搜索完毕之后得到最优的MV,由MV确定参考块在参考图像中的位置,参考块减去当前块得到残差块,MV减去MVP得到运动矢量差值(Motion Vector Difference,MVD),并将该MVD通过码流传输给解码端。
可选地,在本申请实施例中,本申请实施可以用于Merge(合并)模式,也就是说,进行匹配得到的结果可以为MVP,编码端可以直接将该MVP确定为MV,换句话说,进行匹配得到的结果是MV。对于编码端而言,编码端在得到MVP(也即MV)之后,无需传输MVD,因为MVD默认为0。
可选地,在本申请实施例中,在该处理设备为解码端的设备时,则可以利用该MV,对该当前图像块进行解码。
其中,解码端可以将该MV对应的已重构图像块作为预测块,基于该预测块对当前图像块进行解码。
在一种实现方式中,解码端可以直接将该预测块的像素作为当前图像块的像素,此种模式可以称为skip模式,skip模式的特点是当前图像块的重构像素值可以等于预测块的像素值,在编码端采用skip模式时,可以在码流中传输一个标识,用于向解码端指示采用的模式为skip模式。
在另一种实现方式中,解码端可以从编码端传送的码流中的获取像素残差,将预测块的像素与该像素残差相加,得到当前图像块的像素。
应理解,在得到MV之后,可以采用其他的方式对该当前图像块进行解码,本申请实施例对此不做具体限定。
可选地,在本申请实施例,本申请实施例可以用于AMVP模式,也就是说,进行匹配得到的结果可以是MVP,解码端可以结合编码端传送的码流中的MVD,得到当前图像块的MV。
可选地,在本申请实施例中,本申请实施可以用于Merge(合并)模式,也就是说,进行匹配得到的结果可以MVP,解码端可以直接将该MVP确定为MV,换句话说,进行匹配得到的结果是MV。
可选地,在本申请实施例中,在获取基于该匹配结果对该当前图像块的初始MV进行修正,得到该当前图像块的MV。
也就是说,处理设备可以得到初始MV,但是该初始MV可能并不是最优的MV或MVP,处理设备可以对该初始MV进行修正,来得到当前图像块的MV。
对于编码端而语言,可以将该初始MV的索引进行编码,并传递给解码端,该索引可以使得解码端从初始MV列表中选择初始MV,其中,该索引指向了以下的信息:参考帧的索引以及参考块相对于当前图像块在空域上的偏移,解码端基于这些信息可以选择初始MV。
对于解码端而言,该初始MV可以是基于编码端发送的码流得到的,该码流中可以包括索引,基于该索引,解码端可以得到该初始MV。
可选地,该初始MV可以包括多个初始MV,该多个初始MV可以分别属于不同的帧。其中,初始MV所属的帧是指该MV对应的已重构图像块所属的帧。
假设该多个初始MV包括第一MV和第二MV,则第一MV所属的帧和第二MV所属的帧为不同的帧。
例如,该第一MV对应的已重构图像块属于当前图像块的前向帧,该第二MV对应的已重构图像块属于当前图像块的后向帧。
或者,该第一MV对应的已重构图像块属于当前图像块的前向帧,该第二MV对应的已重构图像块属于当前图像块的前向帧。
当然,该第一MV对应的已重构图像块和该第二MV对应的已重构图像块分别属于该当前图像块的不同的后向帧,本申请实施例对此不做具体限定。
为了更加清楚地理解本申请,以下将结合实现方式A对初始MV如何进行修正进行说明。
实现方式A
具体地,处理设备可以基于该多个初始MV对应的已重构图像块的降采样的已重构图像数据,生成模板(例如,对像素进行求平均的方式),利用生成的模板,分别对该多个初始MV进行修正。
应理解,除了利用多个已重构图像块的降采样的已重构图像数据生成模板,还可以利用多个初始MV对应的已重构图像块的未降采样的已重构图像数据生成模板,并对该模板进行降采样,本申请实施例对此不做具体限定。
具体地,假设初始MV包括第一MV和第二MV,第一MV对应的已重构图像块为属于第一帧的第一已重构图像块,第二MV对应的已重构图像块属于第二帧的第二已重构图像块,基于该第一已重构图像块的降采样的已重构图像数据和该第二已重构图像块的降采样的已重构图像数据生成模板。其中,该模板可以称为双向模板。
则可以利用N个第三已重构图像块的降采样后的已重构图像数据(可以称为N个降采样后的第三已重构图像块),分别与该模板进行匹配,其中,该N个第三已重构图像块对应于N个第三MV;利用M个第四已重构图像块的降采样后的已重构图像数据(可以称为M个降采样后的第四已重构图像块),分别与该模板进行匹配,其中,该M个第四已重构图像块对应于M个第四MV;基于该匹配结果,从该N个第三MV中选择一个第三MV,以及从该M个第四MV中选择一个第四MV。
可选地,该选择的第三MV可以为最小的失真代价对应的MV。或者,该选择的第三MV可以为小于某一特定的值的失真代价对应的MV。
可选地,该选择的第四MV可以为最小的失真代价对应的MV。或者,该选择的第四MV可以为小于某一特定的值失真代价对应的MV。
其中,所述一个第三MV和所述一个第四MV作为所述当前图像块的MV,此时,可以将所述一个第三MV和所述一个第四MV对应的已重构图像块可以进行加权平均得到预测块
或者,所述一个第三MV和所述一个第四MV可以用于确定所述当前图像块的MV,也即所述一个第三MV和所述一个第四MV可以分别作为MVP。此时,可以基于该第三MVP和第四MVP分别进行运动搜索和运动补偿过程得到最终的MV。
可选地,在本申请实施例中,该N个第三已重构图像块可以属于该第一帧,以及该M个第四已重构图像块可以属于第二帧。
可选地,该N和M可以相等。
可选地,该第三MV包括该第一MV,该第四MV包括该第二MV,也就是说,用于生成模板的第一MV对应的已重构图像块和第二MV对应的已重构图像块,也需要分别与模板进行匹配。
可选地,在本申请实施例中,该N个第三MV中的至少部分MV是基于该第一MV进行偏移得到,该M个第四MV中的至少部分MV是基于该第二MV进行偏移得到的。
例如,该N个第三MV中除第一MV之外的MV可以是基于该第一MV进行偏移得到,例如,N可以等于9,则其中的8个MV可以是基于第一MV进行偏移得到的,例如,可以在八个方向上进行偏移得到的,或者在垂直方向或水平方向上偏移不同的像素得到的。
再例如,该M个第四MV中除第二MV之外的MV可以是基于该第二MV进行偏移得到,例如,M可以等于9,则其中的8个MV可以是基于第二MV进行偏移得到的,例如,可以在八个方向上进行偏移得到的或者在垂直方向或水平方向上偏移不同的像素得到的。
可选地,可以将实现方式A中的方法称为双向模板匹配法的MV选择。
为了更加清楚地理解本申请,以下将结合图3至图5对实现方式A进行详细说明。
在310中,确定当前图像块的大小的宽度和高度是否分别小于8个像素(当然,也可以是其他数量的像素)。在321,如果是,在参考列表0和列参考表1中的MV0和MV1分别对应的已重构图像块进行降采样,并求平均得到双向模板。其中,参考列表0中的MV可以是当前图像块与前向参考帧中的已重构图像块之间的运动矢量,参考列表1中的MV可以是当前图像块与后向参考帧中的已重构图像块之间的运动矢量。
具体地,如图4所示,针对当前图像块,将MV0对应的参考块0(已重构图像块)和MV1对应的参考块1(已重构图像块)进行降采样,再对降采样之后的两个参考块求平均得到降采样之后的双向模板。
在322中,对列表0中的MV0对应的降采样后的已重构图像块与模板进行匹配。在323中,对MV0进行偏移得到多个MV0′。在324中,将多个MV0′对应的已重构图像块进行降采样,并分别与模板进行匹配。
例如,如图5所示,可以对MV0对应的参考块的周围像素(具体可以包括MV0′对应的参考块包括的像素)进行降采样。具体地,如图5所示,可以对MV0对应的参考块周围的像素值进行填充,获取MV0′对应的参考块(偏移后的参考块),并对偏移后的参考块进行降采样。最终在计算匹配代价时,使用的是降采样之后的双向模板和降采样之后的参考块。
在325中,得到匹配代价最小的MV0′,其中,匹配代价最小的MV0′可以是MV0。
在331中,对列表1中的MV1对应的降采样后的已重构图像块与模板进行匹配。
在332中,对MV1进行偏移得到多个MV1′。在333中,将多个MV1′对应的已重构图像块进行降采样,并分别与模板进行匹配。在334中,得到匹配代价最小的MV1′,其中,匹配代价最小的MV1′可以是MV1。
例如,如图5所示,可以对MV1对应的参考块的周围像素(具体可以包括MV1′对应的参考块包括的像素)进行降采样。具体地,如图5所示,可以对MV1对应的参考块周围的像素值进行填充,获取MV1′对应的参考块(偏移后的参考块),并对偏移后的参考块进行降采样。最终在计算匹配代价时,使用的是降采样之后的双向模板和降采样之后的参考块。
在335中,根据匹配代价最小的MV0′和MV1′对应的已重构图像块,生成预测块。
在336中,基于该预测块,对当前图像块进行解码。
本申请实施例的双向模板匹配法的实现不应仅限于上述的描述。
可选地,以上实现方式A以及其可选实现方式可由DMVR技术来实现。
可选地,在本申请实施例中处理设备获取当前图像块对应的初始运动矢量MV;针对所述初始MV,确定所述用于匹配的已重构图像块。
其中,该初始MV可以是待选择的MV。可选地,可以将该待选择的MV称为MV候选列表。
以下将结合实现方式B和实现方式C描述如何从待选择的MV中选择MV。
实现方式B
具体地,该初始MV包括K个第五MV,利用K个第五已重构图像块的邻近已重构图像块的降采样后的已重构图像数据与该当前图像块的邻近已重构图像块的降采样后的已重构图像数据进行匹配,以得到该匹配结果,其中,该K个第五已重构图像块与该K个第五MV一一对应,K为大于或等于1的整数;基于该匹配结果,从该K个第五MV中,选择一个该第五MV。
可选地,该选择的第五MV可以为最小的失真代价对应的MV。或者,该选择的第五MV可以为小于某一特定的值失真代价对应的MV。
其中,选择的该一个第五MV可以作为该当前图像块的MV。此时,可以将该一个第五MV对应的已重构图像块作为当前图像块的预测块。
或者,选择的该一个第五MV可以用于确定当前图像块的MV。
例如,该一个第五MV可以作为MVP。此时,可以根据该MVP进一步进行运动搜索和运动补偿,得到最终的MV。将该优化后的MV对应的已重构图像块作为预测块。
再例如,该第一个第五MV是下文提到的基于编码单元(Coding Unit,CU)级的MV,则MV可以用于确定子CU(Sub-CU)级的MV。
可选地,可以将该K个第五MV称为MV候选列表。
可选地,可以将当前图像块的邻近已重构图像块称为该当前图像块的模板。其中,该实现方式B可以称为基于模板匹配法的MV选择。
可选地,如图6所示,第五已重构图像块的邻近已重构图像块可以包括上邻块和/或左邻块,以及当前图像块的邻近已重构图像块可以包括上邻块和/或左邻块。
实现方式C
具体地,该初始MV包括W个第六MV,其中,W为大于或等于1的整数;针对W个MV对中每个MV对对应的两个所述已重构图像块,将其中一个所述已重构图像块的降采样后的所述已重构图像数据与另一个所述已重构图像块的降采样后的所述已重构图像数据进行匹配,以得到所述匹配结果,其中,每个MV对包括一个第六MV以及一个基于所述第六MV确定的第七MV;基于该W个MV对对应的匹配结果,选择一个MV对。
其中,选择的MV对中的第六MV确定为该当前图像块的MV。此时,可以将选择的MV对中的第六MV对应的已重构图像块作为当前图像块的预测块。
或者,选择的MV对中的第六MV可以用于确定当前图像块的MV。
例如,该第六MV可以作为MVP。此时,可以根据该MVP进一步进行运动搜索和运动补偿,得到最终的MV。将该最终的MV对应的已重构图像块作为预测块。
再例如,该第一个第六MV是下文提到的基于CU级的MV,则MV可以用于确定sub-CU级的MV。
可选地,在本申请实施例中,该第七MV是在运动轨迹是连续的假定下基于该第六MV确定的。
可选地,可以将该W个第六MV为MV候选列表。
可选地,在本申请实施例中,该第六已重构图像块属于当前图像块的所属的帧的前向帧,该第七已重构图像块属于当前图像块的所属的帧的后向帧。
可选地,在本申请实施例中,第六已重构图像块与当前图像块之间的时域距离可以等于当前图像块与第七已重构图像块之间的时域距离。
可选地,对实现方式C,W个第六MV中的每个第六MV可以作为输入,并基于双向匹配法的假设,得到一个MV对。例如,MV候选列表中的一个有效MVa对应的参考块属于在参考列表A中的参考帧a,而与之配对的MVb对应的参考块所在的参考帧b在参考列表B中,那么参考帧a和参考帧b在时域上位于当前帧的两边。如果在参考列表B中不存在这样的一个参考帧b,则参考帧b为一个不同于参考帧a的参考帧且它与当前帧的时域距离在参考列表B中是最小的。确定参考帧b之后,基于当前帧分别与参考帧a和参考帧b的时域距离对MVa进行缩放即可得到MVb。
例如,如图7所示,对于双向匹配法,可以根据各个候选MV分别生成MV对,计算每个MV对中的两个MV(MV0和MV1)对应的两个参考块之间的失真。其中,在本申请的实施例中,可以对两个参考块都进行降采样,再对降采样后的两个参考块计算失真。失真最小时,对应的候选MV(MV0)即为最终的MV。
其中,该实现方式C可以称为基于双向匹配法的MV选择。
可选地,以上实现方式B和C可以用于AMVP模式;也可以用于merge模式,具体地可以采用模式匹配的运动矢量导出技术,其中,该PMMVD技术是基于帧率上转换(Frame RateUp Conversion,FRUC)技术的一种特殊的merge模式。这种模式下,一个块的运动信息不会在码流中进行编码,而是直接在解码端生成。
其中,编码端可以在多个编码模式中进行选择,具体地,可以进行普通的merge模式编码,得到最小的率失真代价(Rate Distortion Cost,RD-Cost),即cost0;然后,使用PMMVD模式进行编码,得到RD-Cost,其中,双向匹配法得到的MV对应的RD-Cost为cost1,模板匹配法得到的MV对应的RD-Cost为cost2,cost3=min(cost1,cost2)。
若cost0<cost3,则FRUC标志位为假;否则,FRUC标志位为真,同时使用一个额外的FRUC模式标志位表示使用哪种方式(双向匹配法或模板匹配法)。
其中,RD-Cost是编码器中用来衡量决策使用哪种模式的一种准则,既考虑了视频质量,又考虑了编码码率。RD-Cost=Cost+lambda*bitrate,其中cost表示视频质量的损失,通过计算原始像素块和重构像素块之间的相似性(SAD,SSD等指标);bitrate表示使用该模式需要消耗的比特数。
由于计算RD-Cost需要使用到原始像素值,而在解码端原始像素值是不可得的,因此需要传递一个额外的FRUC模式标志位表示使用哪种方式获取运动信息。
可选地,在本申请实施例中,FRUC merge模式的运动信息的导出过程可以分为两步。其中,第一步是基于CU级的运动信息的导出过程,第二步是基于Sub-CU级的运动信息的导出过程。
其中,在基于CU级的运动信息的导出过程中,可以导出整个CU的初始MV,也即一个CU级的MV候选列表,其中,该MV候选列表可以包括:
1)若当前CU使用的是AMVP模式,则包含原始的AMVP候选MV,具体地,若当前CU使用的是AMVP模式,则可以将原始的AMVP候选MV添加到CU级的MV候选列表中。
2)若当前CU使用的是merge模式,则包含所有的merge候选MV。
3)在插值运动矢量场中的MV,其中,插值运动矢量场的MV可以为4个,插值的这四个MV可选地分别位于当前CU的(0,0),(W/2,0),(0,H/2)和(W/2,H/2)位置。
4)上方和左方的相邻MV。
可选地,在AMVP模式的候选列表中(列表的长度可选地是2),建立流程可以包括空域列表的建立和时域列表的建立。
其中,在AMVP的空域列表的建立中,假设当前PU的左下角是A0,左侧是A1,左上角是B2,上方是B1,右上角是B0。当前PU的左侧和上方可以各产生一个候选MV。对于左侧的候选MV的筛选,处理顺序是A0->A1->scaled A0->scaled A1其中,scaled A0表示将A0的MV进行比例伸缩,scaled A1表示将A1的MV进行比例伸缩。对上侧的候选MV的筛选,处理的顺序是B0->B1->B2(如果这几个都不存在,那么继续处理->scaled B0->scaled B2),scaled B0表示将B0的MV进行比例伸缩,scaled B2表示将B2的MV进行比例伸缩。对于左侧(上方)来说,只要找到一个候选MV,就不继续处理后面的候选者了。以及,在AMVP的时域列表的建立中,时域候选列表可以不直接使用候选块的运动信息,可以根据当前帧和参考帧之间的时域位置关系做相应的伸缩调整。时域最多可以提供一个候选MV。如果此时候选列表的候选MV的数量还不足2个,那么可以填充零向量。
可选地,在AMVP模式的候选列表中(列表的长度可选地是5),建立流程可以包括空域列表的建立和时域列表的建立。
其中,在merge模式的空域列表的建立中,假设当前PU的左下角是A0,左侧是A1,左上角是B2,上方是B1,右上角是B0。空域最多可以提供4个候选MV,候选的顺序是A1->B1->B0->A0->B2,优先处理前面四个,如果前面四个当中有一个或者多个不存在,那么才处理B2。在merge模式的时域列表的建立中,时域候选列表不能直接使用候选块的运动信息,可以根据当前帧和参考帧之间的位置关系做相应的伸缩调整。时域最多可以提供一个候选MV,这就意味着,如果处理完空域和时域之后,如果列表中的MV数量还没有达到五个,可以填充零向量。
换句话说,merge候选MVP的选取,可以按照左边->上边->右上角->左下角>左上角的顺序遍历空域上相邻的CU的MV,然后处理时域上参考的预测MV,最后整理合并。
其中,在基于sub-CU级的运动信息的导出过程中,把基于CU级得到的MV作为起始点,在Sub-CU级对运动信息进行进一步的求精。其中,在Sub-CU级求精后的MV就是整个CU的MV,其中,基于子CU级的MV候选列表可以包括:
1)基于CU级得到的MV。
2)该基于CU级得到的MV的上、左、左上和右上相邻的MV。
3)参考帧中的对应时域相邻CU的MV缩放后所得的MV,其中,参考帧中对应时域相邻CU的缩放MV可以按如下方式得到:在两个参考列表中的所有参考帧都遍历一遍,将参考帧中与Sub-CU时域相邻的CU的MV缩放到基于CU级得到的MV所在的参考帧中去。
4)至多4个可选时域运动矢量预测(alternative temporal motion vectorprediction,ATMVP)候选MV,其中,ATMVP允许每个CU从参考帧中的小于当前CU尺寸的多个块中得到多个运动信息集。
5)至多4个时空运动矢量预测(spatial temporal motion vector prediction,STMVP)候选MV,其中,在STMVP中,子CU的运动矢量通过重复使用时域预测运动矢量和空域相邻的运动矢量得到。
可选地,以上实现方法B和实现方式C可以用于CU级的MV的获取,也可以用于sub-CU级的MV的获取。
为了更加清楚地理解PMMVD技术,以下将结合图8进行说明。
在410中,确定当前CU是否采用Merge模式,如果否,则采用AMVP模式(未示出)。
在420中,确定当前CU是否使用双向匹配法,如果是,执行431,如果否,执行441。
在431中,生成MV候选列表。
在432中,从候选列表中选出最优的MV,其中,可以采用双向匹配法择优,具体可以参照上述实现方式C中的描述。
在433中,在最优的MV周围进行局部搜索,对该最优MV进一步求精。具体地,可以对最优的MV进行偏移得到多个初始MV,对该多个初始MV中选择一个MV,其中,可以采用双向匹配法择优,具体可以参照上述实现方式C中的描述。
在434中,若得到CU级的MV,则可以采用上述实现方式C中的双向匹配法,在子CU级对MV进一步求精。
在441中,生成MV候选列表。
在442中,从候选列表中选出最优的MV,其中,可以采用模板匹配法择优,具体可以参照上述实现方式B中的描述。
在443中,在最优的MV周围进行局部搜索,对该最优MV进一步求精。具体地,可以对最优的MV进行偏移得到多个初始MV,对该多个初始MV中选择一个MV,其中,可以采用模板匹配法择优,具体可以参照上述实现方式B中的描述。
在444中,若得到CU级的MV,则可以采用上述实现方式B中的模板匹配法,在子CU级对MV进一步求精。
可见,本申请实施例的用于导出解码端运动矢量求精(Decode Motion VectorRefinement,DMVR)技术和模式匹配的运动矢量导出(Pattern Matching Motion VectorDerivation,PMMVD)的数据采样方法能够大大减少其在解码器中的硬件资源消耗和空间占用,同时,只带来较小的编码性能损失。
因此,在本申请实施例中,在获取当前图像块的运动矢量MV的过程中,对用于匹配的已重构图像块进行匹配之前,对该已重构图像进行降采样,降采样之后再进行匹配代价的计算,可以减少处理的数据量,大大降低了硬件资源消耗和占用的空间。
图9是根据本申请实施例的用于视频处理的设备500的示意性框图。该设备500包括:
降采样单元510,用于在获取当前图像块的运动矢量的过程中,对用于匹配的已重构图像块进行匹配之前,对已重构图像数据进行降采样;
匹配单元520,用于利用该已重构图像块的降采样后的该已重构图像数据进行匹配,以得到匹配结果;
获取单元530,用于基于该匹配结果,获取该当前图像块的运动矢量。
可选地,在本申请实施例中,该设备500用于解码端,该设备500还包括:
解码单元,用于基于该当前图像块的运动矢量,对该当前图像块进行解码。
可选地,该设备500用于编码端,该设备500还包括:
编码单元,用于基于该当前图像块的运动矢量,对该当前图像块进行编码。
可选地,在本申请实施例中,该降采样单元510进一步用于:
确定用于匹配的该已重构图像块;
对该已重构图像块的该已重构图像数据进行降采样。
可选地,在本申请实施例中,该降采样单元510进一步用于:
根据该已重构图像块的内容,对该已重构图像块的该已重构图像数据进行降采样。
可选地,在本申请实施例中,该降采样单元510进一步用于:
根据该已重构图像块包括的像素数量、像素灰度、边缘特征中的至少一项,对该已重构图像块的该已重构图像数据进行降采样。
可选地,在本申请实施例中,该降采样单元510进一步用于:
根据该已重构图像块包括的像素数量、像素灰度、边缘特征中的至少一项,确定降采样比例;
利用该降采样比例,对该已重构图像块的该已重构图像数据进行降采样。
可选地,在本申请实施例中,该降采样单元510进一步用于:
确定该已重构图像块包括的像素数量大于或等于第一预定值;和/或,
确定该已重构图像块的灰度直方图的方差大于或等于第二预定值;和/或
确定该已重构图像块包括的像素中属于纹理的边缘点的像素数量大于或等于第三预定值。
可选地,在本申请实施例中,该降采样单元510进一步用于:
利用间隔相同数量的像素的采样方式,对该已重构图像数据进行降采样;或,
对多个像素进行取平均的方式,对该已重构图像数据进行降采样。
可选地,在本申请实施例中,该用于匹配的已重构图像块包括至少两个已重构图像块;
该降采样单元510进一步用于:
按照相同的采样比例,对该至少两个已重构图像块的该已重构图像数据进行降采样。
可选地,在本申请实施例中,该获取单元530进一步用于:
基于该匹配结果对该当前图像块的初始运动矢量进行修正,得到该当前图像块的运动矢量。
可选地,在本申请实施例中,该获取单元530进一步用于:
获取当前图像块对应的初始运动矢量;
针对该初始运动矢量,确定该用于匹配的已重构图像块。
可选地,在本申请实施例中,该初始运动矢量包括第一运动矢量和第二运动矢量;
该匹配单元520进一步用于:
基于第一已重构图像块的降采样后的该已重构图像数据和第二已重构图像块的降采样后的该已重构图像数据生成模板,其中,该第一已重构图像块对应于该第一运动矢量且属于第一帧,该第二已重构图像块对应于该第二运动矢量且属于第二帧;
基于该模板和降采样后的该已重构图像数据进行匹配,以得到匹配结果。
可选地,在本申请实施例中,该匹配单元520进一步用于:
利用N个第三已重构图像块的降采样后的该已重构图像数据,分别与该模板进行匹配,其中,该N个第三已重构图像块对应于N个第三运动矢量且属于该第一帧;
利用M个第四已重构图像块的降采样后的该已重构图像数据,分别与该模板进行匹配,其中,该M个第四已重构图像块对应于M个第四运动矢量且属于该第二帧;
该获取单元530进一步用于:
基于该匹配结果,从该N个第三运动矢量中选择一个第三运动矢量,以及从该M个第四运动矢量中选择一个第四运动矢量,该一个第三运动矢量和该一个第四运动矢量作为该当前图像块的运动矢量,或者用于确定该当前图像块的运动矢量。
可选地,在本申请实施例中,该第三运动矢量包括该第一运动矢量,该第四运动矢量包括该第二运动矢量。
可选地,在本申请实施例中,该N个第三运动矢量中的至少部分运动矢量是基于该第一运动矢量进行偏移得到,该M个第四运动矢量中的至少部分运动矢量是基于该第二运动矢量进行偏移得到的。
可选地,在本申请实施例中,该N等于该M。
可选地,在本申请实施例中,该第一帧为该当前图像块的前向帧,该第二帧是该当前图像块的后向帧;或,
该第一帧为该当前图像块的前向帧,该第二帧是该当前图像块的前向帧。
可选地,在本申请实施例中,该初始运动矢量包括K个第五运动矢量,该匹配单元520进一步用于:
利用K个第五已重构图像块的邻近已重构图像块的降采样后的该已重构图像数据,分别与该当前图像块的邻近已重构图像块的降采样后的该已重构图像数据进行匹配,以得到该匹配结果,其中,该K个第五已重构图像块与该K个第五运动矢量一一对应;
该获取单元530进一步用于:
基于该匹配结果,从该K个第五运动矢量中,选择一个该第五运动矢量作为该当前图像块的运动矢量,或者用于确定该当前图像块的运动矢量。
可选地,在本申请实施例中,该初始运动矢量包括W个第六运动矢量;
该匹配单元520进一步用于:
针对W个运动矢量对中每个运动矢量对对应的两个该已重构图像块,将其中一个该已重构图像块的降采样后的该已重构图像数据与另一个该已重构图像块的降采样后的该已重构图像数据进行匹配,以得到该匹配结果,其中,每个运动矢量对包括一个第六运动矢量以及一个基于该第六运动矢量确定的第七运动矢量;
该获取单元530进一步用于:
基于该W个运动矢量对对应的匹配结果,选择一个运动矢量对,其中,选择的运动矢量对中的第六运动矢量作为该当前图像块的运动矢量,或者用于确定该当前图像块的运动矢量。
可选地,在本申请实施例中,该第七运动矢量是在运动轨迹是连续的假定下基于该第六运动矢量确定的。
可选地,在本申请实施例中,该第六已重构图像块属于该当前图像块所属的帧的前向帧,该第七已重构图像块属于该当前图像块所属的帧的后向帧。
可选地,该设备500可以实现上述方法中的处理设备的操作,为了简洁,在此不再赘述。
应理解,上述本申请实施例的用于视频处理的设备可以是芯片,其具体可以由电路实现,但本申请实施例对具体的实现形式不做限定。
本申请实施例还提供了一种编码器,该编码器用于实现本申请实施例中编码端的功能,可以包括上述本申请实施例的用于视频处理的设备中用于编码端的模块。
本申请实施例还提供了一种解码器,该解码器用于实现本申请实施例中解码端的功能,可以包括上述本申请实施例的用于视频处理的设备中用于解码端的模块。
本申请实施例还提供了一种编解码器,该编解码器包括上述本申请实施例的用于视频处理的设备。
图10示出了本申请实施例的计算机***600的示意性框图。
如图10所示,该计算机***600可以包括处理器610和存储器620。
应理解,该计算机***600还可以包括其他计算机***中通常所包括的部件,例如,输入输出设备、通信接口等,本申请实施例对此并不限定。
存储器620用于存储计算机可执行指令。
存储器620可以是各种种类的存储器,例如可以包括高速随机存取存储器(RandomAccess Memory,RAM),还可以包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器,本申请实施例对此并不限定。
处理器610用于访问该存储器620,并执行该计算机可执行指令,以进行上述本申请实施例的用于视频处理的方法中的操作。
处理器610可以包括微处理器,现场可编程门阵列(Field-Programmable GateArray,FPGA),中央处理器(Central Processing unit,CPU),图形处理器(GraphicsProcessing Unit,GPU)等,本申请实施例对此并不限定。
本申请实施例的用于视频处理的设备和计算机***可对应于本申请实施例的用于视频处理的方法的执行主体,并且用于视频处理的设备和计算机***中的各个模块的上述和其它操作和/或功能分别为了实现前述各个方法的相应流程,为了简洁,在此不再赘述。
本申请实施例还提供了一种电子设备,该电子设备可以包括上述本申请各种实施例的用于视频处理的设备或者计算机***。
本申请实施例还提供了一种计算机存储介质,该计算机存储介质中存储有程序代码,该程序代码可以用于指示执行上述本申请实施例的环路滤波的方法。
应理解,在本申请实施例中,术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系。例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的***、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的***、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本申请实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (42)

1.一种用于视频处理的方法,其特征在于,包括:
在获取当前图像块的运动矢量的过程中,对用于匹配的已重构图像块进行匹配之前,对已重构图像数据进行降采样;
利用所述已重构图像块的降采样后的所述已重构图像数据进行匹配,以得到匹配结果;
基于所述匹配结果,获取所述当前图像块的运动矢量;
其中,所述方法还包括:获取当前图像块对应的初始运动矢量;针对所述初始运动矢量,确定所述用于匹配的已重构图像块,所述初始运动矢量为多个,多个所述初始运动矢量分别属于不同的帧;
所述利用所述已重构图像块的降采样后的所述已重构图像数据进行匹配包括:基于所述多个初始运动矢量对应的所述已重构图像块的降采样后的所述已重构图像数据生成模板,或者,所述对已重构图像数据进行降采样包括:基于所述多个初始运动矢量对应的所述已重构图像块的未降采样重构图像数据生成模板,并对所述模板进行降采样。
2.根据权利要求1所述的方法,其特征在于,所述方法用于解码端,所述方法还包括:
基于所述当前图像块的运动矢量,对所述当前图像块进行解码。
3.根据权利要求1所述的方法,其特征在于,所述方法用于编码端,所述方法还包括:
基于所述当前图像块的运动矢量,对所述当前图像块进行编码。
4.根据权利要求1至3中任一项所述的方法,其特征在于,所述对已重构图像数据进行降采样,包括:
确定用于匹配的所述已重构图像块;
对所述已重构图像块的所述已重构图像数据进行降采样。
5.根据权利要求4所述的方法,其特征在于,所述对所述已重构图像块的所述已重构图像数据进行降采样,包括:
根据所述已重构图像块的内容,对所述已重构图像块的所述已重构图像数据进行降采样。
6.根据权利要求5所述的方法,其特征在于,所述根据所述已重构图像块的内容,对所述已重构图像块的所述已重构图像数据进行降采样,包括:
根据所述已重构图像块包括的像素数量、像素灰度、边缘特征中的至少一项,对所述已重构图像块的所述已重构图像数据进行降采样。
7.根据权利要求6所述的方法,其特征在于,所述根据所述已重构图像块包括的像素数量、像素灰度、边缘特征中的至少一项,对所述已重构图像块的所述已重构图像数据进行降采样,包括:
根据所述已重构图像块包括的像素数量、像素灰度、边缘特征中的至少一项,确定降采样比例;
利用所述降采样比例,对所述已重构图像块的所述已重构图像数据进行降采样。
8.根据权利要求1至3,5至7中任一项所述的方法,其特征在于,在所述对所述已重构图像块的所述已重构图像数据进行降采样之前,所述方法还包括:
确定所述已重构图像块包括的像素数量大于或等于第一预定值;和/或,
确定所述已重构图像块的灰度直方图的方差大于或等于第二预定值;和/或
确定所述已重构图像块包括的像素中属于纹理的边缘点的像素数量大于或等于第三预定值。
9.根据权利要求1至3,5至7中任一项所述的方法,其特征在于,所述对已重构图像数据进行降采样,包括:
利用间隔相同数量的像素的采样方式,对所述已重构图像数据进行降采样;或,
对多个像素进行取平均的方式,对所述已重构图像数据进行降采样。
10.根据权利要求1至3,5至7中任一项所述的方法,其特征在于,所述用于匹配的已重构图像块包括至少两个已重构图像块;
所述对所述已重构图像数据进行降采样,包括:
按照相同的采样比例,对所述至少两个已重构图像块的所述已重构图像数据进行降采样。
11.根据权利要求1至3,5至7中任一项所述的方法,其特征在于,所述基于所述匹配结果获取所述当前图像块的运动矢量,包括:
基于所述匹配结果对所述当前图像块的初始运动矢量进行修正,得到所述当前图像块的运动矢量。
12.根据权利要求1所述的方法,其特征在于,所述初始运动矢量包括第一运动矢量和第二运动矢量;
所述利用所述已重构图像块的降采样后的所述已重构图像数据进行匹配,包括:
基于第一已重构图像块的降采样后的所述已重构图像数据和第二已重构图像块的降采样后的所述已重构图像数据生成模板,其中,所述第一已重构图像块对应于所述第一运动矢量且属于第一帧,所述第二已重构图像块对应于所述第二运动矢量且属于第二帧;
基于所述模板和降采样后的所述已重构图像数据进行匹配,以得到匹配结果。
13.根据权利要求12所述的方法,其特征在于,所述基于所述模板和降采样后的所述已重构图像数据进行匹配,以得到匹配结果,包括:
利用N个第三已重构图像块的降采样后的所述已重构图像数据,分别与所述模板进行匹配,其中,所述N个第三已重构图像块对应于N个第三运动矢量且属于所述第一帧;
利用M个第四已重构图像块的降采样后的所述已重构图像数据,分别与所述模板进行匹配,其中,所述M个第四已重构图像块对应于M个第四运动矢量且属于所述第二帧;
所述基于所述匹配结果对所述初始运动矢量进行修正,包括:
基于所述匹配结果,从所述N个第三运动矢量中选择一个第三运动矢量,以及从所述M个第四运动矢量中选择一个第四运动矢量,所述一个第三运动矢量和所述一个第四运动矢量作为所述当前图像块的运动矢量,或者用于确定所述当前图像块的运动矢量。
14.根据权利要求13所述的方法,其特征在于,所述第三运动矢量包括所述第一运动矢量,所述第四运动矢量包括所述第二运动矢量。
15.根据权利要求13或14所述的方法,其特征在于,所述N个第三运动矢量中的至少部分运动矢量是基于所述第一运动矢量进行偏移得到,所述M个第四运动矢量中的至少部分运动矢量是基于所述第二运动矢量进行偏移得到的。
16.根据权利要求15所述的方法,其特征在于,所述N等于所述M。
17.根据权利要求13或14所述的方法,其特征在于,所述第一帧为所述当前图像块的前向帧,所述第二帧是所述当前图像块的后向帧;或,
所述第一帧为所述当前图像块的前向帧,所述第二帧是所述当前图像块的前向帧。
18.根据权利要求11所述的方法,其特征在于,所述初始运动矢量包括K个第五运动矢量,所述利用所述已重构图像块的降采样后的所述已重构图像数据进行匹配,包括:
利用K个第五已重构图像块的邻近已重构图像块的降采样后的所述已重构图像数据,分别与所述当前图像块的邻近已重构图像块的降采样后的所述已重构图像数据进行匹配,以得到所述匹配结果,其中,所述K个第五已重构图像块与所述K个第五运动矢量一一对应;
所述基于所述匹配结果获取所述当前图像块的运动矢量,包括:
基于所述匹配结果,从所述K个第五运动矢量中,选择一个所述第五运动矢量作为所述当前图像块的运动矢量,或者用于确定所述当前图像块的运动矢量。
19.根据权利要求11所述的方法,其特征在于,所述初始运动矢量包括W个第六运动矢量;
所述利用所述已重构图像的降采样后的所述已重构图像数据进行匹配,包括:
针对W个运动矢量对中每个运动矢量对对应的两个所述已重构图像块,将其中一个所述已重构图像块的降采样后的所述已重构图像数据与另一个所述已重构图像块的降采样后的所述已重构图像数据进行匹配,以得到所述匹配结果,其中,每个运动矢量对包括一个第六运动矢量以及一个基于所述第六运动矢量确定的第七运动矢量;
所述基于所述匹配结果获取所述当前图像块的运动矢量,包括:
基于所述W个运动矢量对对应的匹配结果,选择一个运动矢量对,其中,选择的运动矢量对中的第六运动矢量作为所述当前图像块的运动矢量,或者用于确定所述当前图像块的运动矢量。
20.根据权利要求19所述的方法,其特征在于,所述第七运动矢量是在运动轨迹是连续的假定下基于所述第六运动矢量确定的。
21.根据权利要求19或20所述的方法,其特征在于,第六已重构图像块属于所述当前图像块所属的帧的前向帧,所述第六已重构图像块与所述第六运动矢量对应,第七已重构图像块属于所述当前图像块所属的帧的后向帧,所述第七已重构图像块与所述第七运动矢量对应。
22.一种用于视频处理的设备,其特征在于,包括:
降采样单元,用于在获取当前图像块的运动矢量的过程中,对用于匹配的已重构图像块进行匹配之前,对已重构图像数据进行降采样;
匹配单元,用于利用所述已重构图像块的降采样后的所述已重构图像数据进行匹配,以得到匹配结果;
获取单元,用于基于所述匹配结果,获取所述当前图像块的运动矢量;
其中,获取当前图像块对应的初始运动矢量;针对所述初始运动矢量,确定所述用于匹配的已重构图像块,所述初始运动矢量为多个,多个所述初始运动矢量分别属于不同的帧;
所述匹配单元进一步用于:基于所述多个初始运动矢量对应的所述已重构图像块的降采样后的所述已重构图像数据生成模板;或者,所述降采样单元进一步用于:基于所述多个初始运动矢量对应的所述已重构图像块的未降采样重构图像数据生成模板,并对所述模板进行降采样。
23.根据权利要求22所述的设备,其特征在于,所述设备用于解码端,所述设备还包括:
解码单元,用于基于所述当前图像块的运动矢量,对所述当前图像块进行解码。
24.根据权利要求22所述的设备,其特征在于,所述设备用于编码端,所述设备还包括:
编码单元,用于基于所述当前图像块的运动矢量,对所述当前图像块进行编码。
25.根据权利要求22至24中任一项所述的设备,其特征在于,所述降采样单元进一步用于:
确定用于匹配的所述已重构图像块;
对所述已重构图像块的所述已重构图像数据进行降采样。
26.根据权利要求25所述的设备,其特征在于,所述降采样单元进一步用于:
根据所述已重构图像块的内容,对所述已重构图像块的所述已重构图像数据进行降采样。
27.根据权利要求26所述的设备,其特征在于,所述降采样单元进一步用于:
根据所述已重构图像块包括的像素数量、像素灰度、边缘特征中的至少一项,对所述已重构图像块的所述已重构图像数据进行降采样。
28.根据权利要求27所述的设备,其特征在于,所述降采样单元进一步用于:
根据所述已重构图像块包括的像素数量、像素灰度、边缘特征中的至少一项,确定降采样比例;
利用所述降采样比例,对所述已重构图像块的所述已重构图像数据进行降采样。
29.根据权利要求22至24,26至28中任一项所述的设备,其特征在于,所述降采样单元进一步用于:
确定所述已重构图像块包括的像素数量大于或等于第一预定值;和/或,
确定所述已重构图像块的灰度直方图的方差大于或等于第二预定值;和/或
确定所述已重构图像块包括的像素中属于纹理的边缘点的像素数量大于或等于第三预定值。
30.根据权利要求22至24,26至28中任一项所述的设备,其特征在于,所述降采样单元进一步用于:
利用间隔相同数量的像素的采样方式,对所述已重构图像数据进行降采样;或,
对多个像素进行取平均的方式,对所述已重构图像数据进行降采样。
31.根据权利要求22至24,26至28中任一项所述的设备,其特征在于,所述用于匹配的已重构图像块包括至少两个已重构图像块;
所述降采样单元进一步用于:
按照相同的采样比例,对所述至少两个已重构图像块的所述已重构图像数据进行降采样。
32.根据权利要求22至24,26至28中任一项所述的设备,其特征在于,所述获取单元进一步用于:
基于所述匹配结果对所述当前图像块的初始运动矢量进行修正,得到所述当前图像块的运动矢量。
33.根据权利要求22所述的设备,其特征在于,所述初始运动矢量包括第一运动矢量和第二运动矢量;
所述匹配单元进一步用于:
基于第一已重构图像块的降采样后的所述已重构图像数据和第二已重构图像块的降采样后的所述已重构图像数据生成模板,其中,所述第一已重构图像块对应于所述第一运动矢量且属于第一帧,所述第二已重构图像块对应于所述第二运动矢量且属于第二帧;
基于所述模板和降采样后的所述已重构图像数据进行匹配,以得到匹配结果。
34.根据权利要求33所述的设备,其特征在于,所述匹配单元进一步用于:
利用N个第三已重构图像块的降采样后的所述已重构图像数据,分别与所述模板进行匹配,其中,所述N个第三已重构图像块对应于N个第三运动矢量且属于所述第一帧;
利用M个第四已重构图像块的降采样后的所述已重构图像数据,分别与所述模板进行匹配,其中,所述M个第四已重构图像块对应于M个第四运动矢量且属于所述第二帧;
所述获取单元进一步用于:
基于所述匹配结果,从所述N个第三运动矢量中选择一个第三运动矢量,以及从所述M个第四运动矢量中选择一个第四运动矢量,所述一个第三运动矢量和所述一个第四运动矢量作为所述当前图像块的运动矢量,或者用于确定所述当前图像块的运动矢量。
35.根据权利要求34所述的设备,其特征在于,所述第三运动矢量包括所述第一运动矢量,所述第四运动矢量包括所述第二运动矢量。
36.根据权利要求34或35所述的设备,其特征在于,所述N个第三运动矢量中的至少部分运动矢量是基于所述第一运动矢量进行偏移得到,所述M个第四运动矢量中的至少部分运动矢量是基于所述第二运动矢量进行偏移得到的。
37.根据权利要求36所述的设备,其特征在于,所述N等于所述M。
38.根据权利要求33至35中任一项所述的设备,其特征在于,所述第一帧为所述当前图像块的前向帧,所述第二帧是所述当前图像块的后向帧;或,
所述第一帧为所述当前图像块的前向帧,所述第二帧是所述当前图像块的前向帧。
39.根据权利要求32所述的设备,其特征在于,所述初始运动矢量包括K个第五运动矢量,所述匹配单元进一步用于:
利用K个第五已重构图像块的邻近已重构图像块的降采样后的所述已重构图像数据,分别与所述当前图像块的邻近已重构图像块的降采样后的所述已重构图像数据进行匹配,以得到所述匹配结果,其中,所述K个第五已重构图像块与所述K个第五运动矢量一一对应;
所述获取单元进一步用于:
基于所述匹配结果,从所述K个第五运动矢量中,选择一个所述第五运动矢量作为所述当前图像块的运动矢量,或者用于确定所述当前图像块的运动矢量。
40.根据权利要求32所述的设备,其特征在于,所述初始运动矢量包括W个第六运动矢量;
所述匹配单元进一步用于:
针对W个运动矢量对中每个运动矢量对对应的两个所述已重构图像块,将其中一个所述已重构图像块的降采样后的所述已重构图像数据与另一个所述已重构图像块的降采样后的所述已重构图像数据进行匹配,以得到所述匹配结果,其中,每个运动矢量对包括一个第六运动矢量以及一个基于所述第六运动矢量确定的第七运动矢量;
所述获取单元进一步用于:
基于所述W个运动矢量对对应的匹配结果,选择一个运动矢量对,其中,选择的运动矢量对中的第六运动矢量作为所述当前图像块的运动矢量,或者用于确定所述当前图像块的运动矢量。
41.根据权利要求40所述的设备,其特征在于,所述第七运动矢量是在运动轨迹是连续的假定下基于所述第六运动矢量确定的。
42.根据权利要求40或41所述的设备,其特征在于,第六已重构图像块属于所述当前图像块所属的帧的前向帧,所述第六已重构图像块与所述第六运动矢量对应,第七已重构图像块属于所述当前图像块所属的帧的后向帧,所述第七已重构图像块与所述第七运动矢量对应。
CN201880012518.3A 2018-04-02 2018-04-02 用于视频处理的方法和设备 Expired - Fee Related CN110337810B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2018/081651 WO2019191889A1 (zh) 2018-04-02 2018-04-02 用于视频处理的方法和设备

Publications (2)

Publication Number Publication Date
CN110337810A CN110337810A (zh) 2019-10-15
CN110337810B true CN110337810B (zh) 2022-01-14

Family

ID=68099798

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880012518.3A Expired - Fee Related CN110337810B (zh) 2018-04-02 2018-04-02 用于视频处理的方法和设备

Country Status (2)

Country Link
CN (1) CN110337810B (zh)
WO (1) WO2019191889A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111462190B (zh) * 2020-04-20 2023-11-17 海信集团有限公司 一种智能冰箱及食材录入方法
CN113329228B (zh) * 2021-05-27 2024-04-26 杭州网易智企科技有限公司 视频编码方法、解码方法、装置、电子设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6968011B2 (en) * 2001-11-08 2005-11-22 Renesas Technology Corp. Motion vector detecting device improved in detection speed of motion vectors and system employing the same devices
CN101605262A (zh) * 2009-07-09 2009-12-16 杭州士兰微电子股份有限公司 可变块尺寸运动预测方法和装置
CN102067601A (zh) * 2008-04-11 2011-05-18 汤姆森特许公司 视频编码和解码中模板匹配预测(tmp)的方法和装置
WO2015009132A1 (en) * 2013-07-19 2015-01-22 Samsung Electronics Co., Ltd. Hierarchical motion estimation method and apparatus based on adaptive sampling
CN106454349A (zh) * 2016-10-18 2017-02-22 哈尔滨工业大学 一种基于h.265视频编码的运动估计块匹配方法
CN107431820A (zh) * 2015-03-27 2017-12-01 高通股份有限公司 视频译码中运动向量推导

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010016010A1 (en) * 2000-01-27 2001-08-23 Lg Electronics Inc. Apparatus for receiving digital moving picture
EP1662800A1 (en) * 2004-11-30 2006-05-31 Humax Co., Ltd. Image down-sampling transcoding method and device
CN101459842B (zh) * 2008-12-17 2011-05-11 浙江大学 一种空间降采样解码方法和装置
CN102647594B (zh) * 2012-04-18 2014-08-20 北京大学 一种整像素精度运动估计方法及其***
CN102790884B (zh) * 2012-07-27 2016-05-04 上海交通大学 一种基于分层运动估计的搜索方法及其实现***
KR101783990B1 (ko) * 2012-12-21 2017-10-10 한화테크윈 주식회사 디지털 영상 처리 장치 및 영상의 대표 움직임 예측 방법
CN106210449B (zh) * 2016-08-11 2020-01-07 上海交通大学 一种多信息融合的帧率上变换运动估计方法及***

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6968011B2 (en) * 2001-11-08 2005-11-22 Renesas Technology Corp. Motion vector detecting device improved in detection speed of motion vectors and system employing the same devices
CN102067601A (zh) * 2008-04-11 2011-05-18 汤姆森特许公司 视频编码和解码中模板匹配预测(tmp)的方法和装置
CN101605262A (zh) * 2009-07-09 2009-12-16 杭州士兰微电子股份有限公司 可变块尺寸运动预测方法和装置
WO2015009132A1 (en) * 2013-07-19 2015-01-22 Samsung Electronics Co., Ltd. Hierarchical motion estimation method and apparatus based on adaptive sampling
CN107431820A (zh) * 2015-03-27 2017-12-01 高通股份有限公司 视频译码中运动向量推导
CN106454349A (zh) * 2016-10-18 2017-02-22 哈尔滨工业大学 一种基于h.265视频编码的运动估计块匹配方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Zhao Wang ; Juncheng Ma ; Falei Luo ; Siwei Ma.Adaptive motion vector resolution prediction in block-based video coding.《2015 Visal Communication and Image Processing》.2015, *

Also Published As

Publication number Publication date
CN110337810A (zh) 2019-10-15
WO2019191889A1 (zh) 2019-10-10

Similar Documents

Publication Publication Date Title
US11375226B2 (en) Method and apparatus of video coding with affine motion compensation
TWI617185B (zh) 具有仿射運動補償的視訊編碼的方法以及裝置
US11463726B2 (en) Apparatus and method for motion vector refinement for multi-reference prediction
US11095898B2 (en) Inter-prediction mode based image processing method, and apparatus therefor
KR101718886B1 (ko) 영상 복호화 방법 및 장치
WO2017148345A1 (en) Method and apparatus of video coding with affine motion compensation
KR102642784B1 (ko) 모션 벡터 리파인먼트를 위한 제한된 메모리 액세스 윈도우
CN111213381B (zh) 视频处理方法和设备
CN111279701B (zh) 视频处理方法和设备
TWI738236B (zh) 視訊編碼中具有運動精化的雙向預測視訊處理方法和裝置
CN110710212A (zh) 通过子像素运动矢量细化对视频数据进行编码或解码的方法和装置
US20200336747A1 (en) Inter prediction mode-based image processing method and device therefor
CN110337810B (zh) 用于视频处理的方法和设备
CN112154666A (zh) 视频编解码方法和装置
CN111713109B (zh) 视频处理方法、装置和设备
CN112204986A (zh) 视频编解码的方法和装置
NZ760521B2 (en) Motion vector refinement for multi-reference prediction

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20220114

CF01 Termination of patent right due to non-payment of annual fee