CN103918267A - 增加有效缩放比的运动向量缩放方法与装置 - Google Patents

增加有效缩放比的运动向量缩放方法与装置 Download PDF

Info

Publication number
CN103918267A
CN103918267A CN201280054067.2A CN201280054067A CN103918267A CN 103918267 A CN103918267 A CN 103918267A CN 201280054067 A CN201280054067 A CN 201280054067A CN 103918267 A CN103918267 A CN 103918267A
Authority
CN
China
Prior art keywords
motion vector
candidate
distance
image
convergent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201280054067.2A
Other languages
English (en)
Other versions
CN103918267B (zh
Inventor
庄子德
林建良
陈庆晔
陈渏纹
黄毓文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HFI Innovation Inc
Original Assignee
MediaTek Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by MediaTek Inc filed Critical MediaTek Inc
Priority to CN201710243546.3A priority Critical patent/CN107197290B/zh
Publication of CN103918267A publication Critical patent/CN103918267A/zh
Application granted granted Critical
Publication of CN103918267B publication Critical patent/CN103918267B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/58Motion compensation with long-term prediction, i.e. the reference frame for a current frame not being the temporally closest one
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/567Motion estimation based on rate distortion criteria

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明揭露一种基于与候选块相关的候选运动向量来推导当前块的缩放运动向量的方法和装置。依据本发明的实施例能够增加运动向量缩放的有效缩放因子。在一个实施例中,先计算出第一图像距离和第二图像距离之间的距离比,其中第一图像距离为当前图像与当前块的当前运动向量指向的目标参考图像之间的距离,第二图像距离为对应于候选块的候选图像与候选运动向量指向的候选参考图像之间的距离。随后,依据所述距离比并基于候选运动向量生成缩放运动向量,其中此缩放运动向量具有介于-m与n之间的有效缩放比,且m和n皆为大于4的正整数。所述m和n的值可以是8、16或者32。

Description

增加有效缩放比的运动向量缩放方法与装置
相关申请的交叉引用
本申请要求如下申请的优先权:2011年11月7日递交的申请号为61/556,480,标题为“Division-Free MV Scaling”的美国临时案。在此合并参考上述申请案的全部内容。
技术领域
本发明是有关于视频编码,且特别地,本发明是有关于高效视频编码(High-Efficiency Video coding,以下简称HEVC)中以增加的有效缩放比来缩放候选运动向量以推导运动向量预测子(Motion Vector Predictor,以下简称MVP)。
背景技术
高效视频编码(High-Efficiency Video coding,HEVC)是由视频编码联合组(Joint Collaborative Team on Video Coding,以下简称JCT-VC)开发的一种新的国际编码标准。HEVC是基于混合型分块运动补偿的类余弦变换的变换编码架构(hybrid block-based motion-compensated DCT-like transform codingarchitecture)。其用于压缩的基本单元是一个2N×2N的方块,被称为编码单元(Coding Unit,以下简称CU),且每一个CU皆可被递归地分割为4个更小的CU,直到产生预设的最小尺寸。每一个CU可包含一个或多个预测单元(Prediction Units,以下简称PU)。PU的尺寸可以是2N×2N、2N×N、2N×nU、2N×nD、N×2N、nL×2N、nR×2N、或者N×N,其中2N×N、2N×nU、2N×nD以及N×2N、nL×2N、nR×2N分别对应于具有对称或不对称PU尺寸分割的2N×2N尺寸PU的水平和垂直划分。
为进一步增强HEVC中运动向量编码的编码效率,基于运动向量竞争的机制被用于从既定运动向量预测子(Motion Vector Predictor,以下简称MVP)候选项集合中选择一个运动向量预测子(MVP),所述MVP集合包含空间及时间MVP。在HEVC测试模型版本3.0(HEVC test model version3.0,以下简称HM-3.0)中,包含帧间(Inter)、跳过(Skip)以及合并(Merge)三种帧间预测模式。所述帧间模式是利用可与MVP一起使用的传输的运动向量差(Motion Vector Difference,以下简称MVD)来执行运动补偿预测,以推导运动向量(Motion Vectors,以下简称MV)。而跳过及合并模式则利用运动推理方法(MV=MVP+MVD,其中MVD为0)以从空间相邻块(空间候选项)或位于同位图像(co-located picture)中的时间块(时间候选项)来获取运动信息。上述同位图像为列表0(list0)或列表1(list1)中的第一参考图像,并于条带头(slice header)中表示。
当PU在跳过或者合并模式下编码时,除了所选候选项的索引之外,并不传输任何运动信息。至于跳过的PU(skip PU),则连残差信号(residual signal)也可以省略。对于HM-3.0中的帧间模式来说,先进运动向量预测(AdvancedMotion Vector Prediction,以下简称AMVP)机制被用于从包含两个空间MVP以及一个时间MVP的AMVP候选项集合中选择一个MVP。此处的MVP是指运动向量预测子(Motion Vector Predictor)或者运动向量预测(Motion VectorPrediction)。而对于HM-3.0中的合并和跳过模式来说,合并机制则被用于从包含四个空间MVP及一个时间MVP的合并候选项集合中选择一个MVP。
对于帧间模式来说,参考图像索引被明确地传输到解码器。随后,可从用于既定参考图像索引的候选项集合中选择MVP。图1是依据HM-3.0用于帧间模式的MVP候选项集合的示意图,其中MVP候选项集合包含两个空间MVP和一个时间MVP:
1、左侧预测子(来自A0及A1的第一可用MV);
2、顶部预测子(来自B0、B1及Bn+1的第一可用MV);以及
3、时间预测子(来自TBR及TCTR的第一可用MV)。
上述时间预测子是从同位图像中的块(TBR或TCTR)中推导出来的,而所述的同位图像则是列表0或列表1中的第一参考图像。与所述时间预测子(MVP)相关的块可具有两个MV:一个MV来自列表0,一个MV来自列表1。所述时间MVP则依据下述规则从来自列表0或列表1的MV推导出来:
1、穿过(cross)当前图像的MV首先被选中;以及
2、若两个MV皆穿过或皆不穿过当前图像,则具有与当前列表相同的参考列表的MV被选中。
在HM-3.0中,若特定块是在合并模式下被编码,则MVP索引会被传送以表明MVP候选项集合中的哪一MVP被用于此欲被合并的块。为遵循运动信息共享的精神,每一合并的PU(merged PU)可重用被选候选项的MV、预测方向以及参考图像索引。请注意,若被选的MVP为时间MVP,则参考图形索引总是被设定为第一参考图像。图2是依据HM-3.0用于合并模式的MVP候选项集合的示意图,其中MVP候选项集合包含四个空间MVP和一个时间MVP:
1、左侧预测子(Am);
2、顶部预测子(Bn);
3、时间预测子(来自TBR及TCTR的第一可用MV);
4、右上方预测子(B0);以及
5、左下方预测子(A0)。
在HM-3.0中,为了避免出现空的候选项集合,帧间模式和合并模式都采用了一种程序(process)。当在帧间、跳过或合并模式下未推测出候选项时,此程序可以将具有0值的MV作为候选项添加至候选项集合。
基于率失真优化(Rate-Distortion Optimization,以下简称RDO)决策,编码器可从用于帧间、跳过、或合并模式的既定MVP列表中选择一个最终MVP,并在移除列表中的冗余MVP之后将所选MVP的索引传输至解码器。然而,由于时间MVP包含在MVP列表中,因此任何传输错误都可能导致解码器端的解析错误(parsing error),同时这种错误可能会传播(propagate)。当先前图像的MV未被正确解码时,将会出现编码器端的MVP列表与解码器端的MVP列表失配的状况。从而,后续MV的解码也可能受到影响,且此状况可能会在后续的多个图像中存在。
在HM-4.0中,为了解决与HM-3.0中合并/AMVP相关的解析问题,其使用了固定的MVP列表尺寸(fixed MVP list size)以解耦(decouple)MVP列表架构与MVP索引解析。此外,为了补偿因固定的MVP列表尺寸导致的编码性能损失,额外的MVP被分配给MVP列表中的空位。在此程序中,合并索引是利用截断的一元码来编码,其具有等于或者小于5的固定长度,而AMVP索引则是利用等于或者小于2的固定长度来编码。
HM-4.0的另一个变化是MVP位置的统一。如图3所示,合并及跳过皆使用相同的位置。对于HM-4.0中的合并模式来说,多达四个空间MVP可从A0、A1、B0和B1中推导出来,且一个时间MVP可从TBR或TCTR中推导出来。对于时间MVP来说,TBR首先被使用。若TBR不可用,则使用TCTR来替代。若四个空间MVP中有任何一个不可用,则块位置B2被使用以推导MVP来作为替代。在四个空间MVP和一个时间MVP推导程序之后,执行移除冗余MVP的程序。在冗余MVP移除之后,若可用的MVP数量小于5,则三种类型的额外MVP被推导出来并添加至MVP列表中。
在用于空间及时间MVP的推导中,MVP可与指向作为目标参考图像的相同参考图像的MV一并推导。另一方面,MVP可从指向不同参考图像的候选MV中推导出来。图4是基于与空间相邻候选块相关的各种类型的运动向量来推导空间MVP的范例的示意图,其中所述候选块包含空间相邻块A0、A1、B0、B1和B2,以及时间同位块TBR或TCTR。圆圈中的数字代表用于从各自的候选项中决定MVP的搜寻顺序。所述搜寻的最高优先级对应于指向既定参考列表中目标参考图像的MV。所述搜寻的第二高优先级对应于指向另一参考列表中目标参考图像的MV。所述搜寻的第三和第四优先级则分别对应于既定参考列表和其他参考列表中其他参考图像。在图4的特定范例中,运动向量1和2的可用性可以一并检查,而运动向量3和4的可用性可一并检查。运动向量1和2的可用性先从候选块A0到A1检查,再从B0到B2检查。若不存在任何MV,则所述搜寻在所有块中检查运动向量3和4的可用性。当MVP是从指向不同参考图像的MV或者用于同位图像的MV中推导出时,所述MV需要被缩放以考虑不同的图像距离。图4所示的用于MVP推导的搜寻类型范例并非本发明的限制。举例来说,每一个块中运动向量1至4的可用性可一并检查。在另一范例中,运动向量1可按顺序先从A0到A1、再从B0到B2检查。若没有任何MV存在,则此搜寻可先从A0到A1、再从B0到B2检查运动向量2。若仍未得出MVP,则此程序会继续对运动向量3和运动向量4执行。
在空间和时间MVP的推导过程中,需要除法运算来缩放运动向量。缩放因子可基于图像距离比(picture distance ratio)而计算出来。举例来说,MVP可基于同位块的MV推导出来。图像距离缩放因子DistScaleFactor可根据下式计算:
DistScaleFactor = POC curr - POC ref POC temp - POC temp _ ref - - - ( 1 )
其中POCcurr和POCref分别代表当前图像的图像顺序计数(Picture OrderCounts,以下简称POC)和目标参考图像的图像顺序数值(POC),而POCtemp和POCtemp_ref则分别代表同位图像的POC和同位块的MV指向的参考图像的POC。虽然此处是以使用同位块的MV为例说明图像距离缩放因子的推导,然而,空间相邻块的MV也可被用于推导MVP,且对应的图像距离缩放因子的推导也可类似地说明。
在依据HM-4.0的实作中,当前图像和目标参考图像之间的POC距离,以及同位图像和同位块的MV指向的参考图像之间的POC距离,可首先被约束至一个既定范围,即:
DiffPOCcurr=clip(-128,127,POCcurr-POCref),
DiffPOCtemp=clip(-128,127,POCtemp-POCtemp_ref).
接着,可依据下式来计算缩放因子:
X = 2 14 + | DiffPOC temp 2 | DiffPOC temp , - - - ( 2 )
DistScaleFactor=clip(-1024,1023,(DiffPOCcurr×X+32)>>6)(3)
而缩放MVP则可通过将MV与距离缩放因子相乘得到,即:
ScaledMV=sign(DistScaleFactor×MV)×
((|DistScaleFactor×MV|+127)>>8)    (4)
依公式(1)中形式的图像缩放因子需要除法运算,其硬件实施较为复杂,或者基于实作的软件需要消耗更多的CPU时间。基于HM-4.0的实施例的精髓在于利用乘数因子(公式(2)中的214)自左乘(pre-multiply)距离比,以使距离比变成整数。在公式(2)中,偏置项|DiffPOCtemp/2|被添加至214以照顾具有舍入(rounding)的数据转换。类似地,偏置32和127被添加至公式(2)和(3)以用于数据转换。所述乘数因子可利用简单的右移位操作进行补偿。由于缩放MV(ScaledMV)的计算不需要任何除法运算,因此,与公式(1)-(4)相关的实施例是一种较佳的实施方式。
在HM-4.0,如公式(3)所示,缩放因子(DistScaleFactor)被截断至范围[-1024,1023]。如公式(4)所示,缩放因子被右移位8位,其意味着有效缩放范围被限制在[-4,4)。Li等人揭露了一种用于低延迟编码***以提升编码效率的参考图像选择方法(“Encoding optimization to improve coding efficiencyfor low delay cases”,Li等人,ITU-T SG16WP3及ISO/IEC JTC1/SC29/WG11视频编码联合组第6次会议:Torino,IT,2011年7月14-22日,档案编号:JCTVC-F701)。依据Li等人的方法,最近的(nearest)一个图像和三个高品质图像(具有低QP的图像)作为参考图像被用于低延迟的情形。图5是用于低延迟***的参考图像配置范例的示意图,其中图像10为当前图像,图像9为最近的图像,以及图像0、4和8为三个高品质参考图像。块525对应于当前块,而块515则对应于相邻块。相邻块515有一个相关的MV510,其被用于推导当前块525的当前MV520的MVP。与当前MV相关的图像距离为6,而与候选MV相关的图像距离为1。因此,此实施例中的图像缩放因子为6,其超过可支持的缩放因子范围。从而,对应某些应用来说,有效缩放范围[-4,4]变得不足。
因此,需要开发一种机制来增加用于MV缩放的有效缩放比,而结合了增加的缩放因子的***亦可提升其自身性能。
发明内容
本发明揭露一种基于与候选块相关的候选运动向量来推导当前块的缩放运动向量的方法和装置。依据本发明的实施例能够增加运动向量缩放的有效缩放因子。在本发明的一个实施例中,先计算出第一图像距离和第二图像距离之间的距离比,其中第一图像距离为当前图像与当前块的当前运动向量指向的目标参考图像之间的距离,第二图像距离为对应于候选块的候选图像与候选运动向量指向的候选参考图像之间的距离。随后,依据所述距离比并基于候选运动向量生成缩放运动向量,其中此缩放运动向量具有介于-m与n之间的有效缩放比,且m和n皆为大于4的正整数。所述m和n的值可以是8、16或者32。在另一个实施例中,距离比与第一缩放因子和第二缩放因子有关,而第一缩放因子与第一距离值有关且第二缩放因子与第二距离值有关。随后,第一缩放因子可通过将一乘积值截断至介于-p到(p-1)的范围来产生,其中所述乘积值与通过将第一距离值与第二缩放因子相乘得出的第一组分以及将第一组分右移位8位有关,且p大于1024。所述缩放MV与有关于通过将候选MV与第一缩放因子相乘得出的第二组分以及将第二组分右移位6位有关。其中p的数值可以是2048、4096、或者8192。
附图说明
图1是基于HM-3.0中先进运动向量预测(AMVP)的、用于推导帧间模式的MVP候选项集合的相邻块的配置范例的示意图。
图2是HM-3.0中用于推导跳过及合并模式的MVP候选项集合的相邻块的配置范例的示意图。
图3是HM-4.0中用于推导AMVP/合并模式的MVP候选项集合的相邻块的配置范例的示意图。
图4是HM-4.0中先进运动向量预测(AMVP)的MVP列表的搜寻顺序范例的示意图。
图5是低延迟编码***中参考帧配置范例的示意图。
图6是整合了本发明实施例的***的流程图范例的示意图,其中有效缩放比增加至超出-4至4的范围。
具体实施方式
如前文所述,有效缩放因子的范围对于某些视频编码***来说是不足的,例如使用一个最近图像和三个最高品质图像的低延迟***。为了克服与MVP推导相关的缩放因子的范围不足的问题,本发明的实施例增加了有效缩放范围。整合了本发明实施例的***具有[-8,8)、[-16,16)或者[-32,32)的有效缩放范围,以适应具有较长时间距离的参考图像。
在依据HM-4.0的运动向量预测子(MVP)推导中,当MVP自指向不同参考图像的MV得出时,MV被缩放至目标参考图像以作为最终的MVP。在MV的缩放过程中,缩放因子由下述方程式(5)来定义:
ScalingFactor=(POCcurr–PoCref)/(POCcol–POCcol_ref)=tb/td,(5)
其中,td为同位图像与同位图像的MV指向的参考图像之间的POC距离,而tb为当前图像与目标图像之间的POC距离。用于基于空间相邻块的MVP推导的缩放因子可以很容易计算出来。在HM-4.0中,缩放因子依据下列方程式计算:
X=(214+|td/2|)/td,以及    (6)
ScalingFactor=clip(-1024,1023,(tb×X+32)>>6)    (7)随后,缩放的MV可由下述方程式得出:
ScaledMV=sign(ScalingFactor×MV)×((abs(ScalingFactor×MV)+127))>>8)    (8)
通过将方程式(7)的截断值增加至2048、4096或者8192,依据本发明的实施例可增加有效缩放比。举例来说,对方程式(7)可做出如下改变:
ScalingFactor=clip(-2048,2047,(tb×X+32)>>6),    (9)
ScalingFactor=clip(-4096,4095,(tb×X+32)>>6),或者(10)
ScalingFactor=clip(-8192,8191,(tb×X+32)>>6)    (11)
从而,有效缩放范围可分别增加至[-8,8)、[-16,16)或者[-32,32)。
上述与图像距离缩放相关的无除法运算(division free operation)是通过数值X来达成的,数值X是由(1/td)与214相乘得到,如方程式(6)所示。随后在方程式(7)所示的ScalingFactor的推导中,乘数214可利用右移位8位来补偿,而在方程式(8)所示的缩放的MV的推导中,则利用右移位6位来补偿。虽然方程式(7)和(8)中分别利用了右移位8位和6位,但也可以利用其他配置。举例来说,可在方程式(7)和(8)中利用右移位7位和右移位7位来分别替代右移位8位和6位。在此实施例中,ScalingFactor的推导是基于(tb×X)右移位7位来替代右移位6位,从而ScalingFactor的最后数值被因子2缩小。从而,截断范围也被因子2缩小。在此实施例中,方程式(9)-(11)中的截断值分别变为1024、2048以及4096。从而,方程式(6)可被一般化为下述方程式:
ix=(2k+|td/2|)/td,以及  (12)
其中k为整数,且k=q+m。q和m都是整数,其中q对应距离缩放因子DistScalefactor推导过程中的右移位,而m则对应于缩放的MV scaled_MV_xy推导过程中的右移位。DistScalefactor和scaled_MV_xy可推导如下:
DistScalefactor=clip(-p,(p-1),(tb*ix+(1<<(q-1)))>>q),以及  (13)
scaled_MV_xy=(DistScaleFactor*MV_xy+(1<<(m-1))–1+(((DistScaleFactor*MV_xy)<0)?1:0))>>m    (14)
其中p是与所需截断范围相关的整数,且p大于1024。举例来说,p可对应于2048、4096、或者8192,且q和m可分别对应于6和8。
图6是整合了本发明实施例的***的流程图范例的示意图。首先,在步骤610中,决定对应于当前块的当前图像与当前块的当前运动向量指向的目标参考图像之间的第一图像距离。在步骤620中,决定对应于候选块的候选图像与候选块的候选MV指向的候选参考图像之间的第二图像距离。在步骤630中,决定对应于第一距离值与第二距离值之比的距离比。所述第一距离值与第一图像距离有关,而所述第二距离值则与第二图像距离有关。随后,在步骤640中,基于候选MV并依据所述距离比来产生缩放的MV,其中缩放的MV具有介于-m与n之间的有效缩放比,而m和n皆为大于4的正整数。在某些实施例中,m和n的值可以是8、16或者32。图6中的流程图仅为了说明具有增加的有效缩放比的运动向量缩放的范例,本领域的技术人员亦可通过重排步骤顺序、分割一或多个步骤、或整合一或多个步骤来实施本发明。
步骤630中的距离比可通过第一缩放因子和第二缩放因子计算得出,其中第一缩放因子与步骤610中决定的第一距离值有关,而第二缩放因子与步骤620中决定第二距离值有关。接着,通过将一乘积值截断至介于-p与(p-1)之间的范围来产生第一缩放因子,其中所述乘积值有关于通过将第一距离值与第二缩放因子相乘得到的第一组分以及将所述第一组分右移位8位,而p则大于1024。所述缩放的MV有关于通过将候选MV与第一缩放因子相乘得到的第二组分以及将第二组分右移位6位。
以上描述是为了使本领域的技术人员能够以上文中的特定实施方式及其需求来实现本发明。然而,本领域的技术人员应可对其进行各种变型与修饰,而本发明的基本精神也可以应用至其他实施例中。因此,本发明并非以所述特定实施例为限,而应以符合本发明宗旨及新特征的最广的范围为界。在上述详细描述中,阐述各种特定细节是为了便于对本发明有全面的了解,然而,本领域的技术人员应可理解,本发明也可得以实施。
上述的根据本发明的实施例可以不同硬件、软件代码、或两者的结合来实施。举例来说,依据本发明的一个实施例,其可以是用来实施所述方法的、整合至视频压缩芯片中的电路,或是整合至视频压缩软件中的程序代码。依据本发明的另一个实施例,其也可以是数字信号处理器(Digital SignalProcessor,DSP)上执行的、用来实施所述方法的程序代码。本发明亦可包含由计算机处理器、DSP、微处理器、或现场可编程门阵列(Field ProgrammableGate Array,FPGA)执行的一系列功能。通过执行定义了本发明实施例特定方法的机器可读软件代码或固件代码,这些处理器可被设置为执行依据本发明的特定任务。所述软件代码或固件代码可通过不同的编程语言及不同格式/样式来开发。所述软件代码亦可符合不同的目标平台。然而,执行与本发明相应的任务的、具有不同代码格式、样式及语言的软件代码,以及其他方式形成的代码都应包含在本发明的范围内。
在不脱离本发明的精神及基本特征的前提下,本发明亦可用其他特定形式来实施。以上所述的实施例仅仅是为了说明本发明,并非本发明的限制。本发明的范围当所附的权利要求为准,凡依本发明权利要求所做的均等变化与修饰,皆应属本发明的涵盖范围。

Claims (20)

1.一种推导缩放的运动向量的方法,用于基于与候选块相关的候选运动向量来推导当前块的缩放的运动向量,该方法包含:
决定对应于该当前块的当前图像与该当前块的当前运动向量指向的目标参考图像之间的第一图像距离;
决定对应于该候选块的候选图像与该候选块的该候选运动向量指向的候选参考图像之间的第二图像距离;
决定对应于第一距离值与第二距离值之比的距离比,其中该第一距离值与该第一图像距离有关,且该第二距离值与该第二图像距离有关;以及
依据该距离比并基于该候选运动向量产生该缩放的运动向量,其中该缩放的运动向量具有介于-m与n之间的有效缩放比,且m和n皆为大于4的正整数。
2.如权利要求1所述的方法,其特征在于,m和n对应于8、16、或者32。
3.如权利要求1所述的方法,其特征在于,该候选块对应于空间相邻块或时间同位块。
4.如权利要求1所述的方法,其特征在于:
该距离比与第一缩放因子和第二缩放因子有关,该第一缩放因子与该第一距离值有关,且该第二缩放因子与该第二距离值有关;
该第一缩放因子是通过将一乘积值截断至介于-p与(p-1)之间的范围来产生,其中该乘积值有关于通过将该第一距离值与该第二缩放因子相乘得到的第一组分以及将该第一组分右移位8位,且p大于1024;以及
该缩放的运动向量有关于通过将该候选运动向量与该第一缩放因子相乘得到的第二组分以及将该第二组分右移位6位。
5.如权利要求4所述的方法,其特征在于,p对应于2048、4096、或者8192。
6.一种推导缩放的运动向量的方法,用于基于与候选块相关的候选运动向量来推导当前块的缩放的运动向量,该方法包含:
决定对应于该当前块的当前图像与该当前块的当前运动向量指向的目标参考图像之间的第一图像距离tb;
决定对应于该候选块的候选图像与该候选块的该候选运动向量指向的候选参考图像之间的第二图像距离td;
依据ix=(2k+|td/2|)/td决定第一值ix;
依据DistScalefactor=clip(-p,(p-1),(tb*ix+(1<<(q-1)))>>q)决定距离缩放因子DistScalefactor,其中clip(u,v,w)代表将w限制为介于u与v之间范围的截断函数;
基于该候选运动向量的候选运动向量组分MV_xy,依据scaled_MV_xy=(DistScaleFactor*MV_xy+(1<<(m-1))–1+(((DistScaleFactor*MV_xy)<0)?1:0))>>m来计算缩放的运动向量组分;以及
其中k、p、q为正整数,p大于1024,且k=q+m。
7.如权利要求6所述的方法,其特征在于,p对应于2048、4096、或者8192,且q和m分别对应于6和8。
8.如权利要求6所述的方法,其特征在于,p对应于1024、2048、或者4096,且q和m分别对应于7和7。
9.如权利要求6所述的方法,其特征在于,p对应于(1<<(m+3))、(1<<(m+4))、或者(1<<(m+5))。
10.如权利要求6所述的方法,其特征在于,该候选块对应于空间相邻块或时间同位块。
11.一种推导缩放的运动向量的装置,用于基于与候选块相关的候选运动向量来推导当前块的缩放的运动向量,该装置包含:
决定第一图像距离的模块,用于决定对应于该当前块的当前图像与该当前块的当前运动向量指向的目标参考图像之间的该第一图像距离;
决定第二图像距离的模块,用于决定对应于该候选块的候选图像与该候选块的该候选运动向量指向的候选参考图像之间的该第二图像距离;
决定距离比的模块,用于决定对应于第一距离值与第二距离值之比的该距离比,其中该第一距离值与该第一图像距离有关,且该第二距离值与该第二图像距离有关;以及
产生该缩放的运动向量的模块,用于依据该距离比并基于该候选运动向量产生该缩放的运动向量,其中该缩放的运动向量具有介于-m与n之间的有效缩放比,且m和n皆为大于4的正整数。
12.如权利要求11所述的装置,其特征在于,m和n对应于8、16、或者32。
13.如权利要求11所述的装置,其特征在于,该候选块对应于空间相邻块或时间同位块。
14.如权利要求11所述的装置,其特征在于:
该距离比与第一缩放因子和第二缩放因子有关,该第一缩放因子与该第一距离值有关,且该第二缩放因子与该第二距离值有关;
该第一缩放因子是通过将一乘积值截断至介于-p与(p-1)之间的范围来产生,其中该乘积值有关于通过将该第一距离值与该第二缩放因子相乘得到的第一组分以及将该第一组分右移位8位,且p大于1024;以及
该缩放的运动向量有关于通过将该候选运动向量与该第一缩放因子相乘得到的第二组分以及将该第二组分右移位6位。。
15.如权利要求14所述的装置,其特征在于,p对应于2048、4096、或者8192。
16.一种推导缩放的运动向量的装置,用于基于与候选块相关的候选运动向量来推导当前块的缩放的运动向量,该装置包含:
决定第一图像距离tb的模块,用于决定对应于该当前块的当前图像与该当前块的当前运动向量指向的目标参考图像之间的该第一图像距离tb;
决定第二图像距离td的模块,用于决定对应于该候选块的候选图像与该候选块的该候选运动向量指向的候选参考图像之间的该第二图像距离td;
决定第一值ix的模块,用于依据ix=(2k+|td/2|)/td决定该第一值ix;
决定距离缩放因子DistScalefactor的模块,用于依据DistScalefactor=clip(-p,(p-1),(tb*ix+(1<<(q-1)))>>q)决定该距离缩放因子DistScalefactor,其中clip(u,v,w)代表将w限制为介于u与v之间范围的截断函数;
计算缩放的运动向量组分的模块,用于基于该候选运动向量的候选运动向量组分MV_xy,依据scaled_MV_xy=(DistScaleFactor*MV_xy+(1<<(m-1))–1+(((DistScaleFactor*MV_xy)<0)?1:0))>>m来计算该缩放的运动向量组分;以及
其中k、p、q为正整数,p大于1024,且k=q+m。
17.如权利要求16所述的装置,其特征在于,p对应于2048、4096、或者8192,且q和m分别对应于6和8。
18.如权利要求16所述的装置,其特征在于,p对应于1024、2048、或者4096,且q和m分别对应于7和7。
19.如权利要求16所述的装置,其特征在于,p对应于(1<<(m+3))、(1<<(m+4))、或者(1<<(m+5))。
20.如权利要求16所述的装置,其特征在于,该候选块对应于空间相邻块或时间同位块。
CN201280054067.2A 2011-11-07 2012-11-07 推导缩放的运动向量的方法 Active CN103918267B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710243546.3A CN107197290B (zh) 2011-11-07 2012-11-07 推导缩放的运动向量的方法、装置和计算机可读媒介

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161556480P 2011-11-07 2011-11-07
US61/556,480 2011-11-07
PCT/CN2012/084215 WO2013067932A1 (en) 2011-11-07 2012-11-07 Method and apparatus for mv scaling with increased effective scaling ratio

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN201710243546.3A Division CN107197290B (zh) 2011-11-07 2012-11-07 推导缩放的运动向量的方法、装置和计算机可读媒介

Publications (2)

Publication Number Publication Date
CN103918267A true CN103918267A (zh) 2014-07-09
CN103918267B CN103918267B (zh) 2017-05-17

Family

ID=48288532

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201280054067.2A Active CN103918267B (zh) 2011-11-07 2012-11-07 推导缩放的运动向量的方法
CN201710243546.3A Active CN107197290B (zh) 2011-11-07 2012-11-07 推导缩放的运动向量的方法、装置和计算机可读媒介

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201710243546.3A Active CN107197290B (zh) 2011-11-07 2012-11-07 推导缩放的运动向量的方法、装置和计算机可读媒介

Country Status (6)

Country Link
US (2) US9641837B2 (zh)
EP (1) EP2740271B1 (zh)
JP (1) JP5801492B2 (zh)
CN (2) CN103918267B (zh)
WO (1) WO2013067932A1 (zh)
ZA (1) ZA201401775B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103748879A (zh) * 2011-06-28 2014-04-23 Lg电子株式会社 设置运动矢量列表的方法及使用其的装置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11876957B2 (en) * 2018-12-18 2024-01-16 Lg Electronics Inc. Method and apparatus for processing video data

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1523896A (zh) * 2003-09-12 2004-08-25 浙江大学 视频编解码中运动矢量的预测方法和装置
US20090060038A1 (en) * 2007-08-31 2009-03-05 Fujitsu Microelectronics Limited Encoding device and encoding method and decoding device and decoding method
WO2011126345A2 (ko) * 2010-04-09 2011-10-13 엘지전자 주식회사 비디오 신호 처리 방법 및 장치

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7327788B2 (en) * 2002-07-02 2008-02-05 Matsushita Electric Industrial.Co., Ltd. Motion vector derivation method, dynamic image encoding method, and dynamic image decoding method

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1523896A (zh) * 2003-09-12 2004-08-25 浙江大学 视频编解码中运动矢量的预测方法和装置
US20090060038A1 (en) * 2007-08-31 2009-03-05 Fujitsu Microelectronics Limited Encoding device and encoding method and decoding device and decoding method
WO2011126345A2 (ko) * 2010-04-09 2011-10-13 엘지전자 주식회사 비디오 신호 처리 방법 및 장치

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
BENJAMIN BROSS ET AL: ""WD4:Working draft 4 of High-Efficiency Video Coding"", 《JCTVC-F803》 *
T.YAMAGUCHI ET AL: ""SHD Movie Distribution System Using Image Container with 4096x2160 Pixel Resolution and 36 Bit Color"", 《IEEE INTERNATIONAL SYMPOSIUM ON CIRCUITS AND SYSTEMS》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103748879A (zh) * 2011-06-28 2014-04-23 Lg电子株式会社 设置运动矢量列表的方法及使用其的装置
CN103748879B (zh) * 2011-06-28 2018-03-06 Lg电子株式会社 设置运动矢量列表的方法及使用其的装置
US10491918B2 (en) 2011-06-28 2019-11-26 Lg Electronics Inc. Method for setting motion vector list and apparatus using same
US11128886B2 (en) 2011-06-28 2021-09-21 Lg Electronics Inc. Method for setting motion vector list and apparatus using same
US11743488B2 (en) 2011-06-28 2023-08-29 Lg Electronics Inc. Method for setting motion vector list and apparatus using same

Also Published As

Publication number Publication date
EP2740271B1 (en) 2020-07-15
EP2740271A1 (en) 2014-06-11
CN107197290A (zh) 2017-09-22
US9877041B2 (en) 2018-01-23
CN107197290B (zh) 2020-02-18
WO2013067932A1 (en) 2013-05-16
JP5801492B2 (ja) 2015-10-28
US20170195687A1 (en) 2017-07-06
US20140247884A1 (en) 2014-09-04
US9641837B2 (en) 2017-05-02
ZA201401775B (en) 2016-08-31
EP2740271A4 (en) 2016-09-21
JP2014527777A (ja) 2014-10-16
CN103918267B (zh) 2017-05-17

Similar Documents

Publication Publication Date Title
KR102094896B1 (ko) 비디오 신호 처리 방법 및 장치
TWI711299B (zh) 利用部分成本計算的視頻解碼方法和裝置
TWI753281B (zh) 仿射的運動向量差精度
KR101548063B1 (ko) 공간 움직임 벡터 예측 방법 및 장치
KR101429407B1 (ko) 동화상 부호화 장치, 동화상 부호화 방법 및 컴퓨터 판독가능한 기록 매체
CN103238319B (zh) 推导运动向量预测项或运动向量预测项候选项的方法及装置
CN103621090A (zh) 移除运动向量预测子中冗余的方法与装置
JP5895469B2 (ja) 動画像符号化装置、および動画像復号装置
CN103535040A (zh) 选择运动矢量预测值的方法和使用其的设备
CN103098467A (zh) 用于对运动矢量进行编码和解码的方法和设备
JP5821542B2 (ja) 動画像符号化装置、および動画像復号装置
EP2445218A1 (en) Dynamic image encoding device, dynamic image decoding device, dynamic image encoding method, dynamic image decoding method, dynamic image encoding program, and dynamic image decoding program
CN103918267A (zh) 增加有效缩放比的运动向量缩放方法与装置
JP6032367B2 (ja) 動画像符号化装置、動画像符号化方法及び動画像復号装置ならびに動画像復号方法
TWI753280B (zh) Bio中的mv精度
CN108432252A (zh) 视频编码中的运动矢量选择及预测***和方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20160914

Address after: Hsinchu County, Taiwan, China

Applicant after: Atlas Limited by Share Ltd

Address before: China Taiwan Hsinchu Science Park Hsinchu city Dusing a road No.

Applicant before: MediaTek.Inc

GR01 Patent grant
GR01 Patent grant