CN1835594A - 在计算机上执行运动矢量检测处理的检测方法以及装置 - Google Patents

在计算机上执行运动矢量检测处理的检测方法以及装置 Download PDF

Info

Publication number
CN1835594A
CN1835594A CNA2006100678462A CN200610067846A CN1835594A CN 1835594 A CN1835594 A CN 1835594A CN A2006100678462 A CNA2006100678462 A CN A2006100678462A CN 200610067846 A CN200610067846 A CN 200610067846A CN 1835594 A CN1835594 A CN 1835594A
Authority
CN
China
Prior art keywords
motion vector
similarity
search
point
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2006100678462A
Other languages
English (en)
Inventor
儿玉知也
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Publication of CN1835594A publication Critical patent/CN1835594A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/533Motion estimation using multistep search, e.g. 2D-log search or one-at-a-time search [OTS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

一种运动矢量检测方法,包括:第一获得单元,获得多个初始搜索点附近的图像和当前帧的部分区域的图像的相似度;设置单元,根据分别在所述多个初始搜索点获得的相似度的梯度设置多个后续候选搜索点;第二获得单元,获得如此设置的所述多个候选搜索点附近的图像与所述当前帧的所述部分区域的图像的相似度;和检测单元,用于基于提供为该多个候选搜索点分别获得的相似度中的最高相似度的该多个候选搜索点中的一个的位置,检测当前帧的部分区域的图像的运动矢量。

Description

在计算机上执行运动矢量检测 处理的检测方法以及装置
技术领域
本发明涉及在例如MPEG-2(运动图像专家组阶段2)或MPEG-4(运动图像专家组阶段4)的运动图像上执行运动补偿预测编码所需要的运动矢量检测。
背景技术
用于累积以及传输图像的运动图像编码处理(例如MPEG-2)中,通过利用图像帧之间的相关来缩减运动图像的信息量以便实现压缩。这里,关于各个部分图像在时间上相继的帧图像之间的运动之后检测运动矢量,当前图像中的由多个像素组成的部分图像(块图像)是要处理的对象,要处理的块存在于先前编码图像中的相对于当前图像的位置(要处理的块的图像与其最相似的编码图像的位置)通过所谓的块匹配方法来检查。于是,可检测表示图像运动方向以及运动量的运动矢量。
总体来讲,此运动矢量检测处理在运动图像压缩编码处理的处理量中占很高比例。作为此问题的解决方案,存在一种根据最陡下降(steepest-descent)法的运动矢量检测方法,例如这样一种方法,其中执行递归梯度法(recursive gradient method),即从一个像素信号的空间梯度与其帧间差的关系估计一个运动矢量,直到收敛以便获得一个高精度运动矢量,或利用一种菱形搜索方法,其中根据用于获得粗略运动矢量的搜索模式顺序地获得最小化帧间差的运动矢量,然后根据获得精确运动矢量的搜索模式获得一运动矢量。已经显示根据这些方法可以比完全搜索方法即最简单的运动矢量搜索方法大规模地降低需要的计算量。人们已经知道,当在使用最陡下降法之前将具有作为运动矢量的最大可能分值的点设定为初始搜索点时可以更加节省计算量。
为了更进一步削减运动矢量检测期间的搜索处理,获得具有整数精度的运动矢量步骤之后通常在运动矢量搜索中使用分级化(hierarchization)以便获得具有子像素精度的运动矢量。
这里,当得到高精度的初始搜索点时,在处理运动矢量搜索时应用最陡下降法时有可能缩短处理时间。但是,存在一个问题,即后续步骤中引出了以子像素精度进行运动矢量搜索所用的时间。
非专利文件1中公开的菱形搜索(以下具体说明)是用于搜索整数精度像素运动矢量的方法。另一方面,在例如MPEG-1/-2/-4或MPEG-4/AVC/H.264(高级视频编码/H.264)的国际标准***中,运动矢量精度是半像素或四分之一像素。特别地,在MPEG-4或MPEG-4AVC/H.264的简档(profile)中进行半像素精度运动矢量搜索时,6抽头FIR滤波器(有限冲激响应滤波器)用于以高精度内插像素间值。因此,当以子像素精度围绕由菱形搜索获得的整数精度运动矢量执行完全搜索时,检测量的增加成为获得软件实时编码的障碍。此外,在硬件中,存在的问题是由于运动矢量搜索处理,完全搜索引起功率损耗、存储器带宽或电路规模增加。
另一方面,根据非专利文件2中公开的以下具体说明的改进的菱形搜索方法,可以以较少的计算量实现整数精度像素运动矢量的检测。根据此方法,在两像素精度运动矢量搜索(初步搜索)之后的最佳初始搜索点周围执行详细的搜索,以便执行一像素精度的运动矢量搜索(二级搜索)。可以认为本方法中可以通过较少的计算量检测运动矢量。这是因为在初步搜索中检测粗略运动时使用的搜索模式相对于上述的菱形搜索是低密度的。
但是,为了执行运动矢量检测同时保证搜索精度,必须保证初步搜索之后至少八个点作为详细搜索(二级搜索)中的候选点(candidate)。然后,通过在各个候选点周围重复八次块匹配过程而在详细搜索中来检测运动矢量,而在菱形搜索中,通过在每个候选点周围重复四次块匹配处理而在详细搜索中检测运动矢量。因此有一个问题,即不能节省运动矢量详细搜索(二级搜索)的处理量,在很多图像中不能缩短处理时间。
非专利文件1:S.Zhu以及K.K.Ma,“用于快速块匹配运动估计的新菱形搜索算法,图像处理IEEE Trans.第9卷,第2号,287-290页,2000年2月。
非专利文件2:K.Ramkishor,PSSBK Gupta,等人著“仅用软件的MPEG-2编码的优化算法”,IEEE Trans.On Consumer Electronics,Vol.50,No.1,2004年2月。
发明内容
如上所述,在任何背景技术的运动矢量检测方法中,试图通过分级化运动矢量搜索范围来节省总的处理量。但是,详细搜索(二级搜索)中候选搜索点的数目无法减少。因此,存在一个问题,即二级搜索的处理量无法减少,处理时间无法缩短。
根据本发明第一方面,提供一种运动矢量检测方法,用于检测表示参考帧的一图像的一部分到当前帧的部分区域的图像的位移的运动矢量,该方法包括:获得当前帧的所述部分区域的图像与多个初始搜索点附近的图像的相似度,所述初始点设置于所述参考帧上;设置多个后续候选搜索点,这是基于:(1)为多个初始搜索点分别获得的相似度的梯度,或(2)为多个初始搜索点分别获得的相似度的分布;获得设置的多个候选搜索点附近的图像与当前帧的所述部分区域的图像的相似度;基于提供为所述多个候选搜索点分别获得的相似度中的最高相似度的所述多个候选搜索点中的一个的位置检测当前帧的所述部分区域的图像的运动矢量。
根据本发明第二方面,提供一种运动矢量检测装置,用于检测表示参考帧的一图像的一部分到当前帧的部分区域的图像的位移的运动矢量,该参考帧与当前帧在时间上相连续,该运动矢量检测装置包括:第一获得单元,用于获得当前帧的所述部分区域的图像与多个初始搜索点附近的图像的相似度,所述初始搜索点设置于该参考帧上;设置单元,用于设置多个后续候选搜索点,这是基于:(1)为多个初始搜索点分别获得的相似度的梯度,或(2)为多个初始搜索点分别获得的相似度的分布;第二获得单元,用于获得设置的多个候选搜索点附近的图像与当前帧的所述部分区域的图像的相似度;检测单元,用于基于提供为所述多个候选搜索点分别获得的相似度中的最高相似度的所述多个候选搜索点中的一个的位置检测当前帧的所述部分区域的图像的运动矢量。
附图说明
在附图中:
图1是显示根据本发明一实施例的运动图像编码设备的整体结构的简图。
图2是显示根据本发明的运动矢量检测方法的第一实施例的流程图;
图3是显示短LDSP运动矢量搜索模式的简图;
图4是显示根据利用短LDSP的最陡下降法的粗略的矢量搜索的流程图;
图5为显示SAD的更新实例的表;
图6是显示利用根据本发明的运动矢量检测方法的一像素精度的运动矢量搜索点的设置实例的简图;
图7是显示用于运动矢量搜索(SAD计算)的程序代码实例的简图;
图8是显示根据本发明的搜索点迁移(transition)的实例的简图;
图9是显示根据本发明的运动矢量检测方法的第二实施例的流程图;
图10是显示利用根据本发明的运动矢量检测方法设置半像素精度运动矢量搜索点的实例的简图。
具体实施方式
现在参考附图,将在下面详细说明本发明的实施例。
图1显示根据本发明的用于检测运动矢量的方法和装置所应用于其上的MPEG编码设备的整体方框图的实例。该MPEG编码设备包括:运动估计器101;运动补偿器102;帧存储器103;减法器104;加法器105;离散余弦变换器(DCT)106;逆离散余弦变换器(逆DCT)107;量化器108;逆量化器109;可变长度编码器110;和量化控制器111。
过去编码的图像在逆量化器109和逆DCT 107中进行逆量化和逆DCT,并在帧存储器103中累积。当要进行新编码的图像输入时,运动补偿器102检测表示输入图像的部分区域(宏块)的图像从帧存储器103中累积的图像的哪个部分移来的运动矢量。根据运动估计器101检测到的该运动矢量和该帧存储器累积的图像产生要新编码的估计图像。估计图像与输入图像之间的误差信息被转换成一个DCT系数(106),进行量化处理(108),利用可变长度编码进行编码(110),并输出作为压缩编码序列(输出比特流)。
接下来,将要详细说明用于检测运动矢量的方法与装置,该方法与装置用于上述的运动估计器101中。图2是显示根据本发明的第一实施例的运动矢量检测方法的流程图。图2中所示的处理例行程序大致分为用于以粗略的精度检测运动矢量的处理(初步搜索S001)和用于根据该初步搜索的结果以精细的精度检测运动矢量的处理(二级搜索:S002及其后步骤)。此实施例的目的为通过该二级运动矢量搜索最终获得整数精度的运动矢量。
该实施例中,运动估计器101用作:第一获得单元,用于获得多个初始搜索点附近的图像和当前帧的该部分区域的图像的相似度,该初始搜索点设置在参考帧上;设置单元,用于设置多个后续候选搜索点,这是基于:(1)为多个初始搜索点分别获得的相似度的梯度,或(2)为多个初始搜索点分别获得的相似度的分布;第二获得单元,用于获得设置的多个候选搜索点附近的图像与当前帧的该部分区域的图像的相似度;检测单元,用于基于提供为该多个候选搜索点分别获得的相似度中的最高相似度的该多个候选搜索点中一个的位置检测当前帧的该部分区域的图像的运动矢量。
假定如非专利文件2公开的称为短LDSP(简短大菱形搜索模式)的方法被用作初步搜索算法(一级运动矢量搜索),用于在步骤S001获得一个运动矢量。另外,本发明不仅适用于短LDSP而且直接适用于菱形搜索和其它层级式搜索方法。
图3显示用于利用短LDSP的运动矢量搜索的初始搜索点。在步骤S001,利用图3所示的短LDSP的各个搜索点根据最陡下降法获得一个粗略精度的运动矢量。此流程图显示在图4中。
首先,在步骤S100,在搜索中心点r(x0,y0)∈R(设置在参考图像R上)与位于点c(x,y)∈C(位于当前编码图像C上)的宏块(由16×16像素构成的矩形区域)之间执行块匹配。于是,表示该搜索中心点和当前宏块之间相似度的SAD(绝对差之和)通过以下表达式获得。
[表达式1]
SAD 0 = D ( x 0 , y 0 )
= Σ i = 0 15 Σ j = 0 15 | r ( x 0 + j , y 0 + i ) - c ( x + j , y + i ) |
一个小的SAD值表示搜索点和当前宏块之间的差很小,该搜索点与当前宏块相似(相似度值大)。相反,一个大的SAD值表示搜索点与当前宏块不相似(相似度值小)。即可以说,当相对于同一个宏块,SAD不同的两个搜索点互相比较时,提供较小值SAD的搜索点是与当前宏块差别较小的搜索点,并表示一个较好的运动矢量。
另外,可以使用用于获得SSD(平方差之和)而非SAD的方法。本发明中的块匹配方法不局限于SAD。此外,此实施例的说明中,通过要编码的图像与参考图像之间的“相似度(相似程度)”的概念评价匹配程度。但是,可以通过将图像之间相似程度较小的情况评价为“大成本值(编码需要的信息量大)”来定义获得提供小成本值的搜索点的评价函数。
在步骤S101,按照与表达式1中同样的方式,为以点(x0,y0)为中心的上、下、左、右点(x0,y0+2),(x0,y0-2),(x0-2,y0)与(x0+2,y0)获得SAD。当这些点的SAD标记为SAD1、SAD2、SAD3和SAD4时,SAD可以通过以下表达式获得。
[表达式2]
SAD 1 = Σ i = 0 15 Σ j = 0 15 | r ( x 0 + 2 + j , y 0 + i ) - c ( x + j , y + i ) |
SAD 2 = Σ i = 0 15 Σ j = 0 15 | r ( x 0 + j , y 0 + 2 + i ) - c ( x + j , y + i ) |
SAD 3 = Σ i = 0 15 Σ j = 0 15 | r ( x 0 - 2 + j , y 0 + i ) - c ( x + j , y + i ) |
SAD 4 = Σ i = 0 15 Σ j = 0 15 | r ( x 0 + j , y 0 - 2 + i ) - c ( x + j , y + i ) |
接下来,在步骤S102,比较SAD0到SAD4的值,确定SAD0是否是最小的。当SAD0是最小的时,表示点(x0,y0)的运动矢量被认为是要在步骤S001获得的运动矢量,图4显示的处理例行程序终止。当SAD0不是最小的时,在步骤S103,具有SAD0到SAD4中最小SAD的点被设置作为新的搜索中心点。也就是说:
[表达式3]
Figure A20061006784600125
Figure A20061006784600126
因为新设置的搜索中心点的SAD已经计算,可以根据以下表达式在步骤Sl04获得新的SAD0。
[表达式4]
SAD0=min(SAD1,SAD2,SAD3,SAD4)
此外相对于新的搜索中心点的新的上、下、左和右搜索点之一的SAD已经获得。因此,已经搜索的SAD在图5的步骤S105中被替换。
在步骤S106,重新根据表达式2计算步骤S105中被视为“未定义”的SAD。当新设置的搜索中心点周围的上、下、左、右SAD如此获得时,处理的例行程序返回到步骤S102,其中再确定SAD0是否为SAD0到SAD4中最小的。
重复步骤S103到步骤S106的处理直到步骤S102的确定结果是真。于是,以两像素精度选择了与要编码的图像的宏块最相似的参考图像的区域,以及相应的运动矢量,也就是说,获得了一个粗略精度的运动矢量。
如上所述的处理是步骤S001中的处理。这样设置这里获得的运动矢量:
[表达式5]
MV0=(x0-x,y0-y)
=(X0,Y0)
此时,SAD1,SAD2,SAD3和SAD4分别表示在右、下、左以及上方向上距离搜索点(x0、y0)两个像素的搜索点的相似度。
在步骤S002,从获得的***搜索点的SAD估计相对于当前运动矢量MV0在左边还是在右边的哪一边存在一像素精度的运动矢量。当通过最陡下降法适当地获得一个运动矢量时,可以估计SAD由一个函数表示,其中互相相邻的搜索点处的值彼此平稳地连续。因此,当SAD3远大于SAD1时,很可能要获得的一像素精度的运动矢量位于当前运动矢量MV0的右侧。相反地,当SAD3远小于SAD1时,很可能要获得的该一像素精度的运动矢量位于运动矢量MV0的左侧。因此在上述的假设基础上,根据以下表达式决定显示搜索点水平范围的列表。
[表达式6]
Figure A20061006784600131
这里Xlist表示一个显示要新搜索的搜索点相对于当前运动矢量的位移的列表。例如,(0,1)表示块匹配是在没有水平位移的搜索点,以及向右位移一个像素的搜索点上执行的。另一方面,T表示一个预定阈值。即使当SAD平滑地连续,它们并不总在最小值附近画一条对称曲线。因此当SAD1和SAD3之间没有大的差别时,必需检查当前运动矢量的左和右侧两侧。
同样,当SAD4大于SAD2时,很可能要获得的一像素精度的运动矢量位于当前运动矢量MV0下面。相反地,当SAD4小于SAD2时,很可能要获得的该一像素精度的运动矢量位于当前运动矢量MV0的上面。因此,在步骤S003,根据以下表达式决定搜索点垂直范围的列表Ylist。
[表达式7]
Figure A20061006784600141
在步骤S004,在步骤S002中获得的搜索点的所有组合中,为还没有获得SAD的各个搜索点获得SAD。图7显示此过程以伪程序代码编写的结构实例。
在图7中,初始搜索点(x0,y0)的SAD存储在SAD[0](步骤(a))。X方向和Y方向搜索范围根据在围绕初始搜索点的搜索点获得的SAD值间的大小关系决定(步骤(b))。该初始搜索点(x0,y0)是由当前粗略精度运动矢量表示的一个点。因此不必新计算初始搜索点(x0,y0)的SAD。其它点是未搜索点。因此,分别在那些点获得SAD,并存储在阵列SAD[j](步骤(c))。在这样的过程中获得总共N个SAD(SAD[0]到SAD[N-1])。
在步骤S005,在步骤S001中获得的当前运动矢量指定的SAD和在步骤S004中在所有搜索点获得的SAD被检查,以获得最小的SAD。如先前描述的,最小的SAD表示与当前宏块最相似的一个区域。因此,在步骤S006,对应于获得的最小SAD的搜索点被认为是一像素精度的运动矢量。即整数精度的运动矢量MVint根据以下表达式定义。
[表达式8]
MVint=(X0+cx[m],Y0+cy[m])
其中m=arg min(SAD[0],...,SAD[N-1])
这里“arg min(x[0],...,x[k-l])”表示选择从x[0]到x[k-l]的阵列的一个最小值并返回其索引号码的函数。
非专利文件2公开的运动矢量搜索实例中,围绕一个两像素精度的运动矢量的八个搜索点必需总是被搜索而不管这些围绕搜索点间的大小关系。于是,运动矢量搜索过程(块匹配)变得很大以致需要花费大量处理时间。但是根据本发明,初步搜索中各个搜索点的SAD按照梯度或是帧间分布来进行比较,新的运动矢量搜索点被限制性地设定为只在SAD小的方向被搜索。于是,检测上述的一像素精度运动矢量的搜索点数目可以缩减到3点(参看图6)。
这里假定搜索点处相似度的梯度即SAD的梯度表示搜索点SAD值间的帧内变化的程度。新搜索点在SAD值将变小的方向设定。此外,假定搜索点相似度的帧内分布即SAD的帧内分布表示搜索点SAD的值的帧内存在状态。因此初步搜索中的搜索点的SAD值的分布被检查并且新的搜索点在SAD值将变小的方向上设定。
图8显示一个简图,其中上述的一系列操作的实例以搜索点移位(shifting)的形式表示。首先假定初步搜索中心点位于点5。为位于中央的点5,6,7,8和9和根据短LDSP的搜索模式1的一个区域的顶点获得SAD。
假定结果为对应于点9的SAD是最小的。下面为短LDSP搜索模式2的顶点(以点9为中心)的未搜索点10,11和12获得SAD。从由此获得的点10、11、12和先前获得的点5和9中选出具有最小SAD的点。假定选择的搜索点是点12。在类似过程中,为点13和14获得SAD,从点6,9,12,13和14中选出具有最小SAD的搜索点。
假定结果为本搜索模式的中心点12是具有最小的SAD的搜索点。这里,对应于两像素精度的运动矢量搜索的步骤S001终止。
接下来互相比较点13的SAD和点6的SAD的大小。假定点13的SAD小得多(步骤S002)。以相同方式,互相比较点9的SAD和点14的SAD的大小。假定点14的SAD小得多(步骤S003)。
结果,要为一像素精度的运动矢量搜索的点是点16,17和18。在非专利文件2中示出的搜索点是点15、19、20、21和22以及点16、17和18。因而搜索点数目可以从八个减少到三个。为要搜索的三个点获得SAD(步骤S004),从点12,16,17和18中选出具有最小的SAD的一个点(步骤S005)。
假定结果为点17为具有最小的SAD的点。于是,指定点17的一个运动矢量被认为是要获得的一像素精度的运动矢量(步骤S006)。
图9是显示根据本发明的第二实施例的运动矢量检测方法的流程图。此流程图显示一实例,其中在如上述的第一实施例所示获得一像素精度运动矢量之后获得半像素精度运动矢量。
在步骤S301,获得一像素精度的运动矢量。假定通过利用上述的第一实施例的方法获得该一像素精度的运动矢量。在此情况下,在由一像素精度的运动矢量指定的搜索点周围的点中,例如图10所示的点已经被搜索。
在步骤S302,确定要搜索半像素精度的运动矢量的方向是否已经为可决定的。为了以和上述的第一实施例同样的方式指定该搜索方向,需要上、下、左、右相邻的搜索点的SAD。但是,当已经在步骤S301中指定很可能存在该运动矢量的方向时,可以不测量SAD而决定该搜索方向。
在图10显示的实例中,假定作为步骤S30l的结果已经选择点A作为一像素精度的运动矢量。在此情况下,很可能该半像素精度的运动矢量存在于右、下和右下方的点之一。因此在这种情况下,可以推断搜索方向是可决定的。此时,执行步骤S304的处理。但是,当点B,C或D已经被选择为一像素精度的运动矢量时,搜索半像素精度的运动矢量的方向不是可决定的。此时,执行步骤S303的处理。
在步骤S303,为上、下、左和右相邻搜索点中还没有获得SAD的每个搜索点获得SAD。在图10的实例中,当该一像素精度的运动矢量指定B点时获得点e的SAD,当该运动矢量指定点C时,获得点f的SAD,当该运动矢量指定点D时,获得点g和h的SAD。
在步骤5305,以和第一实施例中步骤S002和S003同样的方法,决定要搜索半像素精度的运动矢量的方向。即,基于上、下、左、右相邻搜索点的SAD间的大小关系决定搜索该运动矢量的方向。
另一方面,在步骤S304,基于已经执行了处理的步骤S301的结果决定搜索半像素精度运动矢量的方向。
在步骤S306,以和先前描述的步骤S004同样的方法获得各个半像素精度搜索点的SAD。此外在步骤S307,以和先前描述的步骤S005同样的方法获得半像素精度运动矢量。
如上所述,根据本发明可以节省任何整数像素精度运动矢量搜索和半像素精度运动矢量搜索的处理量。不需说明,这里描述的方法以同样的方式也适合于没有描述为实施例的其它情况,例如四分之一像素精度运动矢量搜索的情况。
如上面参考实施例所述,提供了一种运动矢量检测方法和设备,分级执行在搜索精度方面不同的多个运动矢量搜索。例如,具有一像素精度或半像素精度的更详细的运动矢量可根据具有粗略精度例如两像素精度的运动矢量搜索的结果来搜索。在所述运动矢量检测方法和设备中,即使在子像素精度运动矢量搜索中也可以减小搜索点的数目,以便可以节省所述运动矢量搜索的处理量,可以改进所述处理速度。

Claims (16)

1.一种用于检测运动矢量的运动矢量检测方法,该运动矢量表示一个参考帧的图像的一部分到当前帧的部分区域的图像的位移,该方法包括:
获得多个初始搜索点附近的图像和当前帧的所述部分区域的图像的相似度,所述初始搜索点设置在参考帧上;
根据下述二者之一设置多个后续候选搜索点:(1)分别为所述多个初始搜索点获得的相似度的梯度;或(2)分别为所述多个初始搜索点获得的相似度的分布;
获得设置的多个候选搜索点附近的图像和当前帧的所述部分区域的图像的相似度;和
根据所述多个候选搜索点中的提供分别为所述多个候选搜索点获得的相似度中的最高相似度的一个候选搜索点的位置,检测当前帧的所述部分区域的图像的运动矢量。
2.根据权利要求1所述的运动矢量检测方法,其中所述多个初始搜索点以两像素精度设置在所述参考帧上,并且
其中所述多个候选搜索点以一象素或更少像素的精度设置在所述参考帧上。
3.根据权利要求1所述的运动矢量检测方法,其中当设置所述多个后续候选搜索点时,所述多个初始搜索点中的具有分别为所述多个初始搜索点获得的相似度中的大相似度值的一个初始搜索点附近的候选搜索点被优先设置。
4.根据权利要求1所述的运动矢量检测方法,其中当分别为所述多个初始搜索点获得相似度时,分别获得所述多个初始搜索点附近的图像与所述当前帧的所述部分区域的图像之间的绝对差之和作为所述相似度的评价分值。
5.根据权利要求1所述的运动矢量检测方法,其中根据预定搜索中心点附近的图像和当前帧的所述部分区域的图像之间的相似度的值,以及围绕所述预定搜索中心点的候选搜索点附近的图像与所述当前帧的所述部分区域的图像之间的相似度的值,递归地重复搜索,并且在多个初始候选搜索点中,各自具有大的相似度值的那些点被确定为所述多个初始搜索点。
6.根据权利要求1所述的运动矢量检测方法,其中所述多个初始搜索点的相似度是通过计算作为预定搜索范围内的一部分候选搜索点的搜索点的相似度而获得的。
7.根据权利要求1所述的运动矢量检测方法,其中当设置所述多个后续候选搜索点时,在所述多个初始搜索点中,对于在垂直方向和水平方向中的一个方向上彼此对齐的多个初始搜索点的相似度值进行比较,并且所述多个后续候选搜索点在所述参考帧上以垂直方向或水平方向设置以增加所述相似度值。
8.根据权利要求1所述的运动矢量检测方法,其中当设置所述多个后续候选搜索点时,在所述多个初始搜索点中,对于在垂直方向和水平方向中的一个方向上彼此邻接的多个初始搜索点的相似度值进行比较,并且当所述相似度值之间的差是零或不大于一个预定阈值时,所述多个后续候选搜索点被设置成包括所述互相邻接的多个初始搜索点之间的候选点。
9.一种用于检测运动矢量的运动矢量检测装置,所述运动矢量表示一个参考帧的图像的一部分到当前帧的部分区域的图像的位移,所述运动矢量检测装置包括:
第一获得单元,用于获得多个初始搜索点附近的图像与当前帧的所述部分区域的图像的相似度,所述初始搜索点设置在所述参考帧上;
设置单元,用于基于以下二者之一设置多个后续候选搜索点:(1)分别为多个初始搜索点获得的相似度的梯度;或(2)分别为多个初始搜索点获得的相似度的分布;
第二获得单元,用于获得设置的多个候选搜索点附近的图像与当前帧的所述部分区域的图像的相似度;和
检测单元,用于基于所述多个候选搜索点中的提供分别为所述多个候选搜索点获得的相似度中的最高相似度的一个候选搜索点的位置,检测当前帧的所述部分区域的图像的运动矢量。
10.根据权利要求9所述的运动矢量检测装置,其中所述多个初始搜索点以两像素精度设置在所述参考帧上,并且
其中所述多个候选搜索点以一像素或更少像素的精度设置在所述参考帧上。
11.根据权利要求9所述的运动矢量检测装置,其中当设置所述多个后续候选搜索点时,所述设置单元优先设置多个初始搜索点中的具有分别为所述多个初始搜索点获得的相似度值中的大相似度值的一个初始搜索点附近的候选搜索点。
12.根据权利要求9所述的运动矢量检测装置,其中当分别为所述多个初始搜索点获得相似度时,所述设置单元分别获得所述多个初始搜索点附近的图像与所述当前帧的所述部分区域的图像之间的绝对差之和,作为所述相似度的评价分值。
13.根据权利要求9所述的运动矢量检测装置,其中根据预定搜索中心点附近的图像和当前帧的所述部分区域的图像之间的相似度的值,以及围绕所述预定搜索中心点的候选搜索点附近的图像与所述当前帧的所述部分区域的图像之间的相似度的值,递归地重复搜索,并且在多个初始候选搜索点中,各自具有大的相似度值的那些点被确定为所述多个初始搜索点。
14.根据权利要求9所述的运动矢量检测装置,其中所述第一获得单元通过计算作为预定搜索范围内的一部分候选搜索点的搜索点的相似度,获得所述多个初始搜索点的相似度。
15.根据权利要求9所述的运动矢量检测装置,其中当设置所述多个后续候选搜索点时,在所述多个初始搜索点中,对于在垂直方向和水平方向中的一个方向上互相邻接的多个初始搜索点的相似度值进行比较,并且所述设置单元在参考帧上以垂直方向或水平方向设置所述多个后续候选搜索点以增加相似度值。
16.根据权利要求9所述的运动矢量检测装置,其中当设置所述多个后续候选搜索点时,第二获得单元对于所述多个初始搜索点中的在垂直方向和水平方向中的一个方向上彼此邻接的多个初始搜索点的相似度值进行比较,并且
其中当相似度值间的差是零或不大于预定阈值时,第二获得单元设置多个后续候选搜索点以包括所述互相邻接的多个初始搜索点之间的候选点。
CNA2006100678462A 2005-03-14 2006-03-14 在计算机上执行运动矢量检测处理的检测方法以及装置 Pending CN1835594A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2005071448A JP2006254349A (ja) 2005-03-14 2005-03-14 動きベクトル検出方法、動きベクトル検出装置およびコンピュータ上で動きベクトル検出処理を実行するコンピュータプログラム
JP2005071448 2005-03-14

Publications (1)

Publication Number Publication Date
CN1835594A true CN1835594A (zh) 2006-09-20

Family

ID=36970870

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2006100678462A Pending CN1835594A (zh) 2005-03-14 2006-03-14 在计算机上执行运动矢量检测处理的检测方法以及装置

Country Status (3)

Country Link
US (1) US20060203912A1 (zh)
JP (1) JP2006254349A (zh)
CN (1) CN1835594A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103384332A (zh) * 2013-06-29 2013-11-06 张新安 一种avs视频编码hfps算法的改进算法
CN115278228A (zh) * 2015-11-11 2022-11-01 三星电子株式会社 对视频进行解码的方法和对视频进行编码的方法

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007074592A (ja) * 2005-09-09 2007-03-22 Sony Corp 画像処理装置および方法、プログラム、並びに記録媒体
US20070199011A1 (en) * 2006-02-17 2007-08-23 Sony Corporation System and method for high quality AVC encoding
CN101031088A (zh) * 2006-02-28 2007-09-05 展讯通信(上海)有限公司 一种用于视频编码器实现的快速十字运动估计方法
US7912129B2 (en) * 2006-03-16 2011-03-22 Sony Corporation Uni-modal based fast half-pel and fast quarter-pel refinement for video encoding
JP5155159B2 (ja) * 2006-05-24 2013-02-27 パナソニック株式会社 動画像復号装置
WO2009032255A2 (en) * 2007-09-04 2009-03-12 The Regents Of The University Of California Hierarchical motion vector processing method, software and devices
JP2009065283A (ja) * 2007-09-04 2009-03-26 For-A Co Ltd 画像ぶれ補正装置
JP5141633B2 (ja) * 2009-04-24 2013-02-13 ソニー株式会社 画像処理方法及びそれを用いた画像情報符号化装置
US8498493B1 (en) * 2009-06-02 2013-07-30 Imagination Technologies Limited Directional cross hair search system and method for determining a preferred motion vector
EP2469468A4 (en) * 2009-08-18 2014-12-03 Univ Osaka Prefect Public Corp OBJECT DETECTION METHOD
CN104581186B (zh) * 2013-10-14 2019-12-17 北京康吉森技术有限公司 一种图像压缩中对帧内移动矢量进行编码和解码的方法
CN106572354B (zh) * 2015-10-09 2021-10-15 腾讯科技(北京)有限公司 基于图像块的搜索匹配方法、***及视频处理设备
CN109729363B (zh) 2017-10-31 2022-08-19 腾讯科技(深圳)有限公司 一种视频图像的处理方法和装置
JP7281661B2 (ja) 2018-08-30 2023-05-26 パナソニックIpマネジメント株式会社 変位計測装置及び変位計測方法
JP7281660B2 (ja) 2018-08-30 2023-05-26 パナソニックIpマネジメント株式会社 変位計測装置及び変位計測方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6400996B1 (en) * 1999-02-01 2002-06-04 Steven M. Hoffberg Adaptive pattern recognition based control system and method
US6611559B1 (en) * 1996-09-24 2003-08-26 Matsushita Electric Industrial Co., Ltd. Apparatus and method of detecting motion vectors by calculating a correlation degree between each candidate block
US6269174B1 (en) * 1997-10-28 2001-07-31 Ligos Corporation Apparatus and method for fast motion estimation
US6266443B1 (en) * 1998-12-22 2001-07-24 Mitsubishi Electric Research Laboratories, Inc. Object boundary detection using a constrained viterbi search
US6470050B1 (en) * 1999-04-09 2002-10-22 Matsushita Electric Industrial Co., Ltd. Image coding apparatus and its motion vector detection method
US7072398B2 (en) * 2000-12-06 2006-07-04 Kai-Kuang Ma System and method for motion vector generation and analysis of digital video clips
WO2002098137A1 (en) * 2001-06-01 2002-12-05 Nanyang Technological University A block motion estimation method

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103384332A (zh) * 2013-06-29 2013-11-06 张新安 一种avs视频编码hfps算法的改进算法
CN115278228A (zh) * 2015-11-11 2022-11-01 三星电子株式会社 对视频进行解码的方法和对视频进行编码的方法
US12003761B2 (en) 2015-11-11 2024-06-04 Samsung Electronics Co., Ltd. Method and apparatus for decoding video, and method and apparatus for encoding video

Also Published As

Publication number Publication date
JP2006254349A (ja) 2006-09-21
US20060203912A1 (en) 2006-09-14

Similar Documents

Publication Publication Date Title
CN1835594A (zh) 在计算机上执行运动矢量检测处理的检测方法以及装置
CN1675848A (zh) 用于执行高质量快速预测运动搜索的方法和设备
CN1160965C (zh) 运动图象编码串变换装置及其方法
US9451255B2 (en) Image encoding apparatus, image encoding method, image decoding apparatus, and image decoding method
CN107046645B (zh) 图像编解码方法及装置
CN1719901A (zh) 基于运动估计多分辨率方法及存储执行其程序的记录介质
CN102047665A (zh) 运动图像编码方法以及运动图像解码方法
CN104067619A (zh) 视频解码器、视频编码器、视频解码方法以及视频编码方法
CN1658673A (zh) 视频压缩编解码方法
CN1926875A (zh) 运动补偿方法
CN1669330A (zh) 采用加权预测的运动估计
CN1809165A (zh) 预测频率变换系数方法和设备、编码器和解码器及其方法
CN106170093B (zh) 一种帧内预测性能提升编码方法
CN1925617A (zh) 提高的运动估计、视频编码方法及使用所述方法的设备
CN102291581B (zh) 支持帧场自适应运动估计的实现方法
CN102598670A (zh) 参考多个帧对图像进行编码/解码的方法和设备
CN1956547A (zh) 运动矢量检测装置及运动矢量检测方法
CN1320830C (zh) 噪声估计方法和设备、以及利用其编码视频的方法和设备
CN1144469C (zh) 编码和解码图像中的像素的运动向量的方法
CN1236624C (zh) 多种块模式的快速整像素运动估计方法
CN1794816A (zh) 运动图像压缩编码方法、运动图像压缩编码装置以及程序
WO2019080892A1 (zh) 确定仿射编码块的运动矢量的方法和装置
CN1604653A (zh) 差分编码方法
WO2015115645A1 (ja) 動画像符号化装置及び動画像符号化方法
CN1627825A (zh) 用于运动图像编码的运动估计方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication