CN101268623B - 用于创建可变形状区块的方法和装置 - Google Patents

用于创建可变形状区块的方法和装置 Download PDF

Info

Publication number
CN101268623B
CN101268623B CN2006800340685A CN200680034068A CN101268623B CN 101268623 B CN101268623 B CN 101268623B CN 2006800340685 A CN2006800340685 A CN 2006800340685A CN 200680034068 A CN200680034068 A CN 200680034068A CN 101268623 B CN101268623 B CN 101268623B
Authority
CN
China
Prior art keywords
combination
block
permission
distortion
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2006800340685A
Other languages
English (en)
Other versions
CN101268623A (zh
Inventor
苗周荣
詹姆斯·J·卡里格
马里奥·帕尼科尼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Electronics Inc
Original Assignee
Sony Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Electronics Inc filed Critical Sony Electronics Inc
Publication of CN101268623A publication Critical patent/CN101268623A/zh
Application granted granted Critical
Publication of CN101268623B publication Critical patent/CN101268623B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/94Vector quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/57Motion estimation characterised by a search window with variable size or shape
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/12Systems in which the television signal is transmitted via one channel or a plurality of parallel channels, the bandwidth of each channel being less than the bandwidth of the television signal

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Analysis (AREA)

Abstract

一种创建目标图像中的可变形状区块的方法包括生成目标区块的初始模式,识别目标区块的允许组合,计算每个允许组合的组合值,使用组合值来选择多个允许组合中的一个,以及执行所选的允许组合来创建可变形状区块。

Description

用于创建可变形状区块的方法和装置
技术领域
本发明涉及视频压缩领域。 
背景技术
视频序列的高压缩增益可通过去除图像(帧)之间的时间冗余来获得。例如,为了对图像进行编码,基于前面的已编码图像来生成待编码图像的时间预测。将时间预测与实际图像相比较以确定预测误差,并对预测误差进行编码。可以使用被广泛应用的基于区块(block)的运动估计和补偿方法(例如,MPEG标准)来做出预测。 
使用运动补偿和估计方法来在一个或多个参考图像中寻找参考区块以预测目标图像中相应目标区块的位置,所以只需要对目标区块的预测残差(residual)进行编码,该残差通常是预测误差和运动向量。这些方法执行区块匹配以在参考图像中识别与目标图像中相应目标区块最相似的参考像素区块。 
图1是示例性运动向量、参考区块和目标区块的示意图。对目标图像120的编码将使用来自参考图像110的信息。参考区块115被识别为参考图像110中与目标图像120中的目标区块125最匹配的区块。在参考区块被识别后,运动向量130(示为箭头,仅作示例目的)被生成,以识别相对于参考区块115位置的目标区块125位置。运动向量130具有两个表示参考区块115和目标区块125之间关系的元素:水平位移和垂直位移。例如,作为示例性3×3像素组的参考区块115处于位置(i’,j’),目标区块125处于位置(i,j)。两个区块之间的距离为运动向量(i’-i,j’-j)。 
运动向量的值与参考区块一起在视频压缩中使用,以生成目标区块的预测值。例如,若目标区块S与运动向量和相应的参考区块相关联,则目标区块中的每个像素被预测为: 
Figure GSB00000878991200021
对于所有v(x,y,t)∈S    (1) 
其中 
Figure GSB00000878991200022
为目标区块中位于像素坐标(x,y)处的被预测像素值,t为目标图像的时间索引,v(x+mx,y+my,k)为(被k索引的)参考区块中的像素值,且[mx,my]为表示参考区块中的像素相对于目标区块中的待预测像素位置的偏移量的运动向量。 
为了预测整个目标图像,一种典型方法将目标图像划分为多个不重叠目标区块。然后,为每个目标区块执行运动估计以确定其相应的参考区块和运动向量。一般地,运动估计过程创建的目标和参考区块具有同样的形状并包含同样数量的像素,所以每个目标和参考像素之间存在一对一映射。 
创建目标区块的方法的一个示例可在MPEG中找到,其将目标图像划分为具有固定数量像素(即,16×16个像素)的目标区块。更高级的视频编解码器允许目标区块的形状和尺寸(在某些限制下)变化。例如,MPEG/AVC允许区块尺寸在4×4个像素到16×16个像素间变化。 
一般地,传统的区块创建方法在创建固定尺寸的目标和参考区块的规则模式(pattern)时很有效。另一方面,运动估计方法在目标和参考区块具有可变形状和尺寸时具有更好的预测性能。但是,创建尺寸和形状变化的目标区块的有效模式不在传统的区块创建方法的能力范围之内。需要一种有效地创建将被运动估计方法使用的目标图像中的可变形状区块的方法。 
发明内容
一种创建目标图像中的可变形状区块的方法包括生成目标区块的初始模式,识别目标区块的允许组合(allowable combination),计算每个允许组合的组合值,使用组合值来选择多个允许组合中的一个,以及执行所选的允许组合来创建可变形状区块。 
一种用于创建可变形状区块的方法,包括:生成目标区块的初始模式;识别目标区块的允许组合;计算每个允许组合的组合值,其中所述组合值是在执行组合的情况下失真的增大与在执行组合的情况下运动向量的 减少之间的比值;迭代地将每个允许组合的组合值与合并阈值相比较直到识别出具有小于合并阈值的组合值的一个允许组合为止,其中,随后的允许组合不被迭代;选择所识别出的允许组合;以及使用所选的允许组合来创建可变形状区块。 
一种用于创建可变形状区块的装置,包括:用于生成目标区块的初始模式的装置;用于识别目标区块的允许组合的装置;用于计算每个允许组合的组合值的装置,其中所述组合值是在执行组合的情况下失真的增大与在执行组合的情况下运动向量的减少之间的比值;用于迭代地将每个允许组合的组合值与合并阈值相比较直到识别出具有小于合并阈值的组合值的一个允许组合为止的装置,其中,随后的允许组合不被迭代;用于选择所识别出的允许组合的装置;以及用于使用所选的允许组合来创建可变形状区块的装置。 
附图说明
本发明通过示例的方式加以阐述,并且通过结合附图参考下面的描述将得到更好的理解,图中: 
图1是示例性运动向量、参考区块和目标区块的示意图; 
图2是创建用于运动估计的可变形状区块的方法的一个示例; 
图3A、3B、3C和3D示出被创建用于运动估计的可变形状区块的方法使用的允许形状和形状组合的示例; 
图4示出被创建用于运动估计的可变形状区块的方法使用的区块的允许组合的允许位置的一个示例; 
图5是创建用于运动估计的可变形状区块的方法的另一个示例; 
图6示出使用可变形状区块创建方法的***的一个示例; 
具体实施方式
下面的描述中,参考形成本文一部分的附图,所述附图中通过图解的方式示出可实施本发明的具体实施例。应该理解,在不脱离本发明范围的前提下,可以使用其他实施例,并做出结构改变。例如,本领域技术人员 将理解,用来描述各种实施例的术语图像在参考视频数据来使用时一般可与术语场、帧或图片互换。 
一种方法创建用于运动估计中的可变形状目标区块的模式。该方法接收目标图像和参考图像,将目标图像划分为各种形状和尺寸的目标区块,并为每个可变形状目标区块生成运动向量。在一个实施例中,该方法通过迭代和自适应地将较小区块组合为较大区块来创建可变形状区块。 
该方法可以开始于任何初始目标区块模式,例如规则目标区块模式,例如每个目标区块包含2×2个像素。该方法识别可以形成较大区块的较小区块的允许组合。对于每个允许组合,确定反映其代价(cost)和收益(benefit)的值。组合的代价是预测误差的增大,收益是针对较大区块的运动向量数目的减少。在识别了具有可接受值的允许组合之后,组合相关的较小区块以形成较大区块,并确定用于较大区块的新运动向量。该方法可一直重复直至达到期望的结束点。例如,在一个实施例中,该方法持续到目标图像中的区块数目降低到给定数目以下为止。 
创建可变形状区块的方法的一个示例示于图2。在210中,定义目标区块的允许形状。一般地,该方法可以从具有任何形状的区块的初始模式开始,并可以执行区块的任何组合来创建具有任意形状的区块的输出模式。该方法创建的形状越多,运动估计的性能越好。但是,执行该方法的复杂性随形状数目的增加而增大。为了以合理的复杂度来执行该方法,一些实施例使用预定数目的允许形状和预定数目的允许组合。 
在本例中,为了减少复杂性,在210中定义一组简单形状,例如矩形区块,这样不用执行过多计算就能将较小形状组合成较大形状。210中定义的允许形状的示例示于图3A,包括2×2的像素区块302、2×4的区块304和4×4的区块306。 
在215中,定义较小区块变为较大区块的允许组合。允许组合的一些示范性定义包括:(1)只有相互连接的现有(较小)形状可被组合成单个较大形状,(2)较大形状是现有的预定义形状,以及(3)较大形状位于目标图像内的允许位置。这些定义大大减少了整个图片中的允许组合的数目,从而减少了创建可变形状区块的复杂性。该定义可由***设定或由 用户选择,使得允许组合的数目对于充分执行运动估计足够大,而对于将创建可变形状区块的复杂性减少到可控制的程度又足够小。 
较小区块变为较大区块的允许组合的示例示于图3B、3C和3D。在图3B中,允许2×2像素区块与另一个2×2像素区块组合以形成较大的2×4像素区块。在图3C中,允许四个2×2像素区块组合成较大的4×4像素区块。在图3D中,允许两个2×2的区块和一个2×4的区块组合成一个较大的4×4像素区块。 
允许组合的定义也可包括该组合的允许位置。例如,若2×4形状的区块中的被选像素位于y坐标为2的倍数或x坐标为4的倍数处(例如,y=0,2,4,...或x=0,4,8,...),则在特定位置允许该区块。组合区块的允许和禁止位置的示例示于图4。因为较大区块410的位置具有的x坐标为2的倍数4,所以允许较小区块组合成较大区块。另一方面,因为区块420的x坐标为9,不是2的倍数,所以形成区块420的组合被禁止。 
作为另一个示例,若某个4×4的区块的被选像素位于x和y坐标为2的倍数处(y=0,2,4,8...且x=0,2,4,8...),则用户可以允许创建该区块。在图4中,因为被选像素具有的x坐标为2且y坐标为2,所以允许创建区块430。因为区块440的x坐标为9,所以即使其y坐标为2的倍数,也禁止创建区块440。如这些预定允许位置的示例所示,不是所有的2×2的区块都能组合以创建2×4或4×4的区块。允许位置的数目平衡了运动估计性能和计算复杂度。 
在220中,生成用于整个目标图像的目标区块的初始模式。在本例中,使用在210中定义的允许形状来生成初始模式。生成的初始模式可以是固定尺寸小区块(例如,2×2的区块)的规则模式。在生成初始模式后,在215中为每个目标区块确定运动向量。很多现有算法可用来寻找运动向量(例如,在MPEG中)。这一区块的初始数目Nblock和运动向量的初始数目Nmv被记录。 
在230中,使用运动向量为每个区块执行运动估计,生成目标区块的预测和相关的预测误差。在235中,使用预测误差来计算目标区块的运动补偿预测的失真Ds。失真是对目标区块的预测性能的衡量。可以使用不同 的函数来确定失真。一个示例是像素预测误差的平方和: 
Figure GSB00000878991200061
其中x,y ∈S代表目标区块S中的所有像素,vx,y是目标图片中的原始像素值, 
Figure GSB00000878991200062
是该目标像素的预测值。通过使用运动向量识别参考图像中的像素来确定预测值。 
另一个失真函数的示例是预测误差的绝对值之和: 
Figure GSB00000878991200063
用户可以选择这些函数中的任一个或别的函数来衡量目标区块的失真。 
在240中,使用允许组合的定义来识别目标图像中现有区块的允许组合。可以通过任何允许组合形成的每个较大区块的运动向量也被确定。可使用本领域技术人员公知的运动估计方法来确定运动向量。 
在245中,为每个允许组合确定组合值。若允许组合被执行,则结果是失真增大而运动向量数目减少。因此,虽然通过将较小区块组合成较大区块而增大了失真,但较小区块不再需要的运动向量变得可为该运动估计方法所用。这将导致被预测目标图像的失真整体减小。为了确定允许组合是否该执行,再次对比收益来权衡执行组合的代价。该代价与收益的关系可表示为增大的失真和减少的运动向量数的函数。对比收益来权衡组合代价的函数的一个示例是如下的比值: 
M=ΔD|ΔR    (4) 
其中M为组合值。组合值用来比较目标图像特定区域中区块的多个允许组合。 
通过从产生的较大区块的失真中减去该允许组合中较小区块的总失真以确定失真差ΔD,从而计算失真的增大。较小形状的总失真D0是该允许组合中较小形状的预测失真Ds的和。每个较小形状的失真使用诸如式(2)或式(3)之类的失真函数来计算。较小区块的总失真为: 
D 0 = Σ S ∈ S L D S - - - ( 5 )
其中S∈SL代表允许组合中的所有较小区块。组合后的失真D1是通过组合较小区块创建的较大区块的失真。一般地,较大区块的失真量大于多个较 小区块的失真量。组合引起的增大的失真为: 
ΔD=D1-D0    (6) 
组合产生的运动向量数目的减少ΔR通过从组合前存在的较小区块中的运动向量数目R0中减去由组合创建的较大区块中的运动向量数目R1来确定。(若使用单个参考图像,则每区块中的运动向量数目为1)。组合产生的运动向量数量的减少为: 
ΔR=R1-R0    (7) 
在计算失真ΔD的增大和运动向量的减少ΔR之后,使用式(4)来确定组合值。 
在250中,使用组合值来选择将要执行的允许组合。在一个实施例中,在目标图像的特定区域中将特定允许组合的组合值与其他允许组合的值相比较。然后,具有最小组合值的允许组合被选择。 
在255中,执行被选组合。被选组合的较小区块被替换为较大区块。另外,较小区块的运动向量被替换为与较大区块相关联的运动向量。 
在260中,该方法确定是否执行另一组合。可用来确定是否执行另一组合的函数示例包括固定终止函数和自适应终止函数。 
固定终止函数在目标图像中区块的数目小于或等于阈值数目Thblock之后终止方法。例如,对于尺寸为720×480(720个垂直线和480个水平线)的图像,用户可以将目标图像中区块的最大数目设为1350,即Thblock=1350。形状的阈值数目可由编码器设定或由用户指定为输入参数。或者,固定终止函数在目标图像中的运动向量数目小于或等于阈值数目Thmv之后终止方法。(若使用单个参考图像来预测目标图像,则目标形状的数目等于目标图像中运动向量的数目(Thblock=Thmv))。每次迭代后,剩余的形状数(Nblock)或运动向量数(Nmv)被记录。当编码器检测到Nblock≤Thblock(或Nmv≤Thmv)时,其终止方法。 
另一个终止函数在执行另一组合的收益可忽略时使用阈值Thstop来终止该方法。例如,当当前被选允许组合的组合值超过阈值Thstop时,该方法终止。通过这种方式,目标图片中形状和运动向量的数目可与目标图像的内容相适应。这在视频流的图像含有大量时间变化时很有用。 
若另一组合被执行,则在265中,目标图片的形状模式被更新以反映最新的组合。另外,形状数目值和运动向量数目值Nblock和Nmv被更新以反映组合产生的变化。然后,方法返回240。 
若不再执行更多组合,则方法终止于270。 
创建可变形状区块的方法的另一个示例示于图5,其利用简单函数替换图2方法的若干个计算。例如,在图2所示方法的每次迭代中,为所有允许组合计算组合值。但是,特定迭代中的很多允许组合在前一次迭代期间出现过,所以,它们的组合值在前一次迭代期间被计算过。为当前迭代执行的计算的数量可以通过重用先前计算过的值来减少。 
图5的方法在为运动估计创建可变形状时重用先前计算过的比值,并更新和存储该方法的当前迭代中出现的任何值的变化。在510中,在第一次迭代期间,该方法为允许组合计算M的值,并将该值存储在诸如电子存储设备之类的计算机可读介质中的多维数组中。在该数组中,M的值被索引为Ml,x,y。索引中使用的l,x和y的定义在表1中给出。 
表1M值的索引描述 
Figure GSB00000878991200081
可通过将特定允许组合的组合值与阈值而不是多个其他值相比较以确定是否执行该组合来进一步减小图2的方法的复杂性。例如,在图2的方法中,具有M=ΔD|ΔR的最小值的组合被选择。但是,识别最小值需要该方法扫描所有允许组合。除了扫描所有组合,图5的方法在520中将特定允许组合的组合值与预定阈值Thmerge相比较。若M<Thmerge,则立即选择并执行该组合,且在本次迭代中忽略其他允许组合。若组合值不小于阈 值,则将数组中的下一个组合值与阈值相比较。(阈值Thmerge与上面讨论的阈值Thstop不同)。 
在530中,该方法决定是否执行另一组合。若不执行,则过程终止于550。若执行,则受本组合影响的Ml,x,y的值在540中被更新且过程返回520。结果,在第一次迭代后,数组中只有小部分的M值被重新计算,剩余的M值保持不变。这减小了复杂性并减少了该方法的处理时间。 
在执行可变形状区块创建方法后,重建可变形状区块的模式的信息以及用于可变形状区块的运动向量被发送到解码器供重建。解码器使用运动向量和可变形状区块的模式来执行目标图像的运动补偿。 
创建可变形状区块的模式的方法可应用于任何视频压缩或执行运动估计和运动补偿的任何其他应用。该方法既可独立工作也可与视频压缩中与运动预测有关的其他方法共同工作。图6示出使用可变形状区块创建方法的***的示例。数字摄像机610捕获电子形式的图像,并使用压缩设备620处理该图像,该压缩设备620在压缩和编码过程期间实现可变形状区块创建方法。编码的图像通过电子传输介质630发送到数字重放设备640。图像被在解码过程中使用该方法的解码设备650解码。 
虽然在具体***环境中根据示例性实施例描述了本发明,但是本领域普通技术人员将理解,在所附权利要求的精神和范围内,可在其他不同硬件和软件环境中通过各种方式实施本发明。 

Claims (10)

1.一种用于创建用于运动估计的可变形状区块的方法,包括:
生成通过划分目标图像获得的目标区块的初始模式;
识别目标区块的允许组合;
计算每个允许组合的组合值,其中所述组合值是在执行组合的情况下失真的增大与在执行组合的情况下运动向量的减少之间的比值,所述失真的增大是通过从该组合产生的较大区块的失真中减去该组合中较小区块的总失真以确定失真差来计算的,所述运动向量的减少是通过从该组合前存在的较小区块中的运动向量数目中减去由该组合创建的较大区块中的运动向量数目来确定的;
迭代地将每个允许组合的组合值与合并阈值相比较直到识别出具有小于合并阈值的组合值的一个允许组合为止,其中,随后的允许组合不被迭代;
选择所识别出的允许组合;以及
使用所选的允许组合来创建可变形状区块。
2.如权利要求1所述的方法,还包括:
使用一组组合规则来定义所述允许组合。
3.如权利要求1所述的方法,其中所述组合值使用下式来计算:
M=ΔD|ΔR
其中所述ΔD为源于所述组合的失真增大,所述ΔR为源于所述组合的运动向量减少,M=ΔD|ΔR是ΔD与ΔR的比值,并且M为所述组合值。
4.如权利要求1所述的方法,还包括:
如果可变形状区块的数目不小于阈值,则更新目标区块的模式并且重复所述方法中的识别目标区块的允许组合的步骤及其后的步骤。
5.如权利要求1所述的方法,还包括:
如果所选允许组合的组合值不小于阈值,则更新目标区块的模式并且重复所述方法中的识别目标区块的允许组合的步骤及其后的步骤。
6.一种用于创建用于运动估计的可变形状区块的装置,包括:
用于生成通过划分目标图像获得的目标区块的初始模式的装置;
用于识别目标区块的允许组合的装置;
用于计算每个允许组合的组合值的装置,其中所述组合值是在执行组合的情况下失真的增大与在执行组合的情况下运动向量的减少之间的比值,所述失真的增大是通过从由执行该组合产生的较大区块的失真中减去该组合中较小区块的总失真以确定失真差来计算的,所述运动向量的减少是通过从该组合前存在的较小区块中的运动向量数目中减去由该组合创建的较大区块中的运动向量数目来确定的;
用于迭代地将每个允许组合的组合值与合并阈值相比较直到识别出具有小于合并阈值的组合值的一个允许组合为止的装置,其中,随后的允许组合不被迭代;
用于选择所识别出的允许组合的装置;以及
用于使用所选的允许组合来创建可变形状区块的装置。
7.如权利要求6所述的装置,还包括:
用于使用一组组合规则来定义所述允许组合的装置。
8.如权利要求6所述的装置,其中所述组合值使用下式来计算:
M=ΔD|ΔR
其中所述ΔD为源于所述组合的失真增大,所述ΔR为源于所述组合的运动向量减少,M=ΔD|ΔR是ΔD与ΔR的比值,并且M为所述组合值。
9.如权利要求6所述的装置,还包括:
用于在可变形状区块的数目不小于阈值的情况下更新目标区块的模式并使得用于识别的装置、用于计算的装置、用于迭代地比较的装置、用于选择的装置和用于使用所选的允许组合来创建可变形状区块的装置重复操作的装置。
10.如权利要求6所述的装置,还包括:
用于在所选允许组合的组合值不小于阈值的情况下更新目标区块的模式并使得用于识别的装置、用于计算的装置、用于迭代地比较的装置、用于选择的装置和用于使用所选的允许组合来创建可变形状区块的装置重复操作的装置。
CN2006800340685A 2005-09-16 2006-09-01 用于创建可变形状区块的方法和装置 Expired - Fee Related CN101268623B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/229,387 US7885335B2 (en) 2005-09-16 2005-09-16 Variable shape motion estimation in video sequence
US11/229,387 2005-09-16
PCT/US2006/034386 WO2007035236A2 (en) 2005-09-16 2006-09-01 Variable shape motion estimation in video sequence

Publications (2)

Publication Number Publication Date
CN101268623A CN101268623A (zh) 2008-09-17
CN101268623B true CN101268623B (zh) 2013-05-22

Family

ID=37884055

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006800340685A Expired - Fee Related CN101268623B (zh) 2005-09-16 2006-09-01 用于创建可变形状区块的方法和装置

Country Status (6)

Country Link
US (1) US7885335B2 (zh)
EP (1) EP1925095A4 (zh)
JP (1) JP5043849B2 (zh)
KR (1) KR101362545B1 (zh)
CN (1) CN101268623B (zh)
WO (1) WO2007035236A2 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100809354B1 (ko) * 2007-02-02 2008-03-05 삼성전자주식회사 복원된 프레임의 프레임율을 업컨버팅하는 장치 및 방법
US20090168871A1 (en) * 2007-12-31 2009-07-02 Ning Lu Video motion estimation
CN102547103A (zh) * 2010-12-28 2012-07-04 华晶科技股份有限公司 电子装置、影像拍摄装置及其方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997017797A2 (en) * 1995-10-25 1997-05-15 Sarnoff Corporation Apparatus and method for quadtree based variable block size motion estimation
WO2002037859A2 (en) * 2000-11-03 2002-05-10 Compression Science Video data compression system

Family Cites Families (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3877105D1 (zh) * 1987-09-30 1993-02-11 Siemens Ag, 8000 Muenchen, De
US5690934A (en) * 1987-12-31 1997-11-25 Tanox Biosystems, Inc. Peptides relating to the extracellular membrane-bound segment of human alpha chain
US5047850A (en) * 1989-03-03 1991-09-10 Matsushita Electric Industrial Co., Ltd. Detector for detecting vector indicating motion of image
US5872866A (en) 1995-04-18 1999-02-16 Advanced Micro Devices, Inc. Method and apparatus for improved video decompression by predetermination of IDCT results based on image characteristics
US5654771A (en) * 1995-05-23 1997-08-05 The University Of Rochester Video compression system using a dense motion vector field and a triangular patch mesh overlay model
ES2182972T3 (es) * 1996-04-19 2003-03-16 Nokia Corp Codificador y descodificador de video utilizando procedimientos de segmentacion y fusion de movimiento.
US6101276A (en) * 1996-06-21 2000-08-08 Compaq Computer Corporation Method and apparatus for performing two pass quality video compression through pipelining and buffer management
JP3967405B2 (ja) * 1996-10-09 2007-08-29 テキサス インスツルメンツ インコーポレイテツド 画像信号の符号化方法
JP4034380B2 (ja) * 1996-10-31 2008-01-16 株式会社東芝 画像符号化/復号化方法及び装置
DE19648016A1 (de) * 1996-11-20 1998-05-28 Philips Patentverwaltung Verfahren zur fraktalen Bildkodierung und Anordnung zur Durchführung des Verfahrens
US6775326B2 (en) * 1997-02-13 2004-08-10 Mitsubishi Denki Kabushiki Kaisha Moving image estimating system
US6633611B2 (en) * 1997-04-24 2003-10-14 Mitsubishi Denki Kabushiki Kaisha Method and apparatus for region-based moving image encoding and decoding
US6178205B1 (en) * 1997-12-12 2001-01-23 Vtel Corporation Video postfiltering with motion-compensated temporal filtering and/or spatial-adaptive filtering
US6208692B1 (en) * 1997-12-31 2001-03-27 Sarnoff Corporation Apparatus and method for performing scalable hierarchical motion estimation
US6591015B1 (en) * 1998-07-29 2003-07-08 Matsushita Electric Industrial Co., Ltd. Video coding method and apparatus with motion compensation and motion vector estimator
KR100301833B1 (ko) 1998-08-20 2001-09-06 구자홍 오류은폐방법
US6711278B1 (en) 1998-09-10 2004-03-23 Microsoft Corporation Tracking semantic objects in vector image sequences
US6466624B1 (en) * 1998-10-28 2002-10-15 Pixonics, Llc Video decoder with bit stream based enhancements
JP2000308064A (ja) * 1999-04-22 2000-11-02 Mitsubishi Electric Corp 動きベクトル検出装置
US6480615B1 (en) * 1999-06-15 2002-11-12 University Of Washington Motion estimation within a sequence of data frames using optical flow with adaptive gradients
JP3753578B2 (ja) * 1999-12-07 2006-03-08 Necエレクトロニクス株式会社 動きベクトル探索装置および方法
US6864994B1 (en) * 2000-01-19 2005-03-08 Xerox Corporation High-speed, high-quality descreening system and method
EP1277347A1 (en) 2000-04-11 2003-01-22 Koninklijke Philips Electronics N.V. Video encoding and decoding method
US6782054B2 (en) * 2001-04-20 2004-08-24 Koninklijke Philips Electronics, N.V. Method and apparatus for motion vector estimation
CA2491679A1 (en) * 2002-07-09 2004-01-15 Nokia Corporation Method and system for selecting interpolation filter type in video coding
US7068722B2 (en) * 2002-09-25 2006-06-27 Lsi Logic Corporation Content adaptive video processor using motion compensation
JP4462823B2 (ja) 2002-11-20 2010-05-12 ソニー株式会社 画像信号の処理装置および処理方法、それに使用される係数データの生成装置および生成方法、並びに各方法を実行するためのプログラム
JP3997171B2 (ja) * 2003-03-27 2007-10-24 株式会社エヌ・ティ・ティ・ドコモ 動画像符号化装置、動画像符号化方法、動画像符号化プログラム、動画像復号装置、動画像復号方法、及び動画像復号プログラム
JP2005012439A (ja) * 2003-06-18 2005-01-13 Nippon Hoso Kyokai <Nhk> 符号化装置、符号化方法および符号化プログラム
US20040258147A1 (en) * 2003-06-23 2004-12-23 Tsu-Chang Lee Memory and array processor structure for multiple-dimensional signal processing
KR20050045746A (ko) * 2003-11-12 2005-05-17 삼성전자주식회사 계층 구조의 가변 블록 크기를 이용한 움직임 추정 방법및 장치
US6872866B1 (en) * 2003-12-15 2005-03-29 Uop Llc Liquid phase process for C8 alkylaromatic isomerization
US7480334B2 (en) * 2003-12-23 2009-01-20 Genesis Microchip Inc. Temporal motion vector filtering
KR20050075483A (ko) 2004-01-15 2005-07-21 삼성전자주식회사 비디오 코딩 및 디코딩 방법, 및 이를 위한 장치

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997017797A2 (en) * 1995-10-25 1997-05-15 Sarnoff Corporation Apparatus and method for quadtree based variable block size motion estimation
WO2002037859A2 (en) * 2000-11-03 2002-05-10 Compression Science Video data compression system

Also Published As

Publication number Publication date
EP1925095A2 (en) 2008-05-28
EP1925095A4 (en) 2010-04-28
WO2007035236A3 (en) 2007-08-02
WO2007035236A2 (en) 2007-03-29
JP2009509405A (ja) 2009-03-05
JP5043849B2 (ja) 2012-10-10
US7885335B2 (en) 2011-02-08
KR101362545B1 (ko) 2014-02-14
US20070064810A1 (en) 2007-03-22
CN101268623A (zh) 2008-09-17
KR20080053935A (ko) 2008-06-16

Similar Documents

Publication Publication Date Title
US8385628B2 (en) Image encoding and decoding method, apparatuses therefor, programs therefor, and storage media for storing the programs
CN1980393B (zh) 图像编码装置、方法及集成电路
CN111526361B (zh) 图像编解码方法及装置
CN107135392B (zh) 基于异步模式的hevc运动搜索并行方法
RU2706228C1 (ru) Способ и устройство выбора порядка сканирования
CN101584215B (zh) 综合空时预测
KR101449435B1 (ko) 움직임 벡터 정규화에 기초한 영상의 부호화 방법 및 장치, 영상의 복호화 방법 및 장치
CN106170093B (zh) 一种帧内预测性能提升编码方法
CN110636313B (zh) 变换、二次变换矩阵训练方法、编码器及相关装置
US8374443B2 (en) System and method for predicting the file size of images subject to transformation by scaling and a change of quality-controlling parameters
CN109348234A (zh) 一种高效亚像素运动估计方法及***
EP2362655B1 (en) Motion-vector estimation
CN101268623B (zh) 用于创建可变形状区块的方法和装置
CN105678718A (zh) 图像去噪方法和装置
CN106658024A (zh) 一种快速的视频编码方法
Tok et al. Compressed domain global motion estimation using the Helmholtz tradeoff estimator
CN106101731B (zh) 图像无损压缩方法及装置
CN101365133B (zh) 一种dct域插值舍入误差补偿方法
JP4730144B2 (ja) 復号化装置、逆量子化方法及びこれらのプログラム
Heithausen et al. Temporal Prediction of Motion Parameters with Interchangeable Motion Models
CN104837027A (zh) 一种分像素的运动估计方法和装置
CN116828184B (zh) 视频编码、解码方法、装置、计算机设备和存储介质
US20230326090A1 (en) Point cloud decoding method, point cloud encoding method, and decoder
CN110876082B (zh) 一种视频帧的复杂度的确定方法及装置
US20070211949A1 (en) Two-Dimensional Adaptive Image Compression Method

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130522

Termination date: 20150901

EXPY Termination of patent right or utility model