CN107396102A - 一种基于Merge技术运动矢量的帧间模式快速选择方法及装置 - Google Patents
一种基于Merge技术运动矢量的帧间模式快速选择方法及装置 Download PDFInfo
- Publication number
- CN107396102A CN107396102A CN201710762301.1A CN201710762301A CN107396102A CN 107396102 A CN107396102 A CN 107396102A CN 201710762301 A CN201710762301 A CN 201710762301A CN 107396102 A CN107396102 A CN 107396102A
- Authority
- CN
- China
- Prior art keywords
- mrow
- mtd
- coded unit
- current coded
- merge
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/109—Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/147—Data rate or code amount at the encoder output according to rate distortion criteria
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明公开了一种基于Merge技术运动矢量的帧间模式快速选择方法及装置,该方法通过当前编码单元CU的运动矢量MV投影到参考帧,从而找到参考帧中对应当前CU的投影块,利用两者者在预测模式上的相关性,利用投影块的特征决定是否跳过当前CU是否跳过运动估计和运动补偿的帧间模式;相较于现有技术,通过已知的投影块的信息,来对当前编码单元进行预测,降低了视频编码器的帧间预测计算复杂度,减少了编码时间,提高了编码效率;且本发明算法简单,计算量小,可方便地投入实际应用。
Description
技术领域
本发明属于视频编码领域,特别涉及一种基于Merge技术运动矢量的帧间模式快速选择方法及装置。
背景技术
在编码框架中,预测编码是视频编码的核心技术之一,预测编码又分为帧内预测和帧间预测。帧内预测是根据视频图像的空间相关性,利用图像内已编码的邻近像素预测当前像素。帧间编码是根据视频图像的时间相关性,利用已编码图像预测待编码图像。经过帧内和帧间预测,编码器可以消除视频的时空相关性,对预测后的残差而不是原始像素值进行变换、量化、熵编码,由此大幅提高编码效率。
目前主要的视频编码标准帧间预测部分都采用了基于块的运动补偿技术。其主要原理是为当前图像的每个像素块在之前已编码图像中寻找一个最佳匹配块,该过程称为运动估计。其中用于预测的图像称为参考图像,参考块到当前像素块的位移称为运动矢量,当前块与参考块的差值称为预测残差。由于视频图像序列的连续性,通常运动矢量在空间和时间上也存在一定的相关性,同理,利用空间或时间上相邻的运动矢量对当前块运动矢量进行预测,仅对预测残差进行编码,也能大幅节省运动矢量的编码比特数。这种预测运动矢量的技术称为Merge。
2013年,ITU-T的VCEG(视频编码专家组)和ISO/IEC的MPEG(动态图像专家组)联合推出了HEVC(高效视频编码)视频压缩方案。自2016年始,VCEG和MPEG开始研究新一代视频编码器,并成立了一个专家小组——JVET(联合视频研究小组),旨在进一步提升HEVC的压缩率。新一代视频编码标准是在HEVC的基础上发展而来,二者在帧间预测过程中都采用了Merge技术,不同的是,新一代视频的Merge模式有三种:基于仿射变换的AffineMerge模式、基于模板匹配的FRUC Merge模式以及基于时空相关性的2Nx2N Merge模式。这些模式的应用提高了编码器的压缩性能,也大大增加了编码时间,影响了标准的研发速度和应用价值。在关于新一代视频编码标准的第三次会议上就有提案指出这种弊端,并请求对其复杂度采取行动。
新一代视频编码标准在做帧间预测时步骤如下:
步骤一:先做Affine Merge模式,即仿射运动补偿预测,保存其率失真代价以及预测信息,并将当前最佳模式置为Affine Merge模式,;
步骤二:再做2Nx2N Merge模式,即普通运动补偿预测,若该模式的率失真代价小于Affine Merge模式的率失真代价,则将最佳模式置为2Nx2N Merge模式并保存其率失真代价以及预测信息;
步骤三:然后做FRUC Merge模式,即基于模板匹配的运动矢量生成,若该模式的率失真代价小于当前最佳模式的率失真代价,则将最佳模式置为FRUC Merge模式并保存其率失真代价以及预测信息。以上三种模式均属于Merge模式;
步骤四:接着做运动估计和运动补偿的帧间预测模式,该模式通过运动搜索找出参考帧中的匹配块得出运动矢量和预测残差,因此耗时较多。
若该模式的率失真代价小于当前最佳模式的率失真代价,则将最佳模式置为运动估计和运动补偿的帧间预测模式并保存其率失真代价以及预测信息。
其中,运动估计和运动补偿的帧间模式的编码时间占总编码时间的41%,因此,如果能在运动估计和运动补偿之前就预测出最佳帧间模式是三种Merge模式中的一种从而跳过运动估计和运动补偿则将减少大量编码时间。
虽然目前有许多针对HM视频编码器的帧间快速算法,如T.Mallikarachchi学者在2014年IEEE图像处理国际会议上提出根据运动匀质性跳过特定尺寸CU的预测编码,S.Ahn在2015年的Circuits and System for Video Technology,IEEE Transactions上提出用同位CU的像素自适应补偿参数评估当前CU的纹理复杂度,根据纹理复杂度跳过某些帧间预测模式。但是由于新一代视频编码标准采用了QTBT(四叉二叉划分)的编码结构并取消了预测单元PU的概念,所以以上算法并不适用于新一代视频编码标准。另外一些,例如基于方差的、基于贝叶斯的方法,由于计算复杂度太高并不适用于实际应用。
2016年五月的日内瓦会议提出了新一代视频编码标准的测试模型JEM2.0,此时JEM编码器在随机配置下的平均编码时间是HEVC编码器的5.3倍。其中,帧间预测在总的编码时间中占据约68%的时间,同样地,在以往的编码标准中,帧间预测也占据了大量编码时间,因此帧间预测是减少编码时间的重要模块,具有很大的改进空间,如果能将帧间预测的时间减少将大大提高编码器的效率。
发明内容
本发明的目的是针对帧间预测编码时间过长的缺陷以及现有技术的不足,提出一种基于Merge技术运动矢量的帧间模式快速选择方法,缩短其编码时间,提高其实际应用性,同时也为其进一步的研究开发提供了便利。
一种基于Merge技术运动矢量的帧间模式快速选择方法,包括以下步骤:
步骤一:获取当前编码单元在最佳帧间预测模式下,对应于参考帧上的投影块;
在当前编码单元CU做完Affine Merge、2Nx2N Merge和FRUC Merge模式后,根据率失真代价决策出当前编码单元CU的最佳帧间预测模式;
基于最佳帧间预测模式获取当前编码单元CU的运动矢量MV,将当前编码单元CU中的每个像素点平移MV后得到与当前编码单元CU大小相同的平移块,最后将该平移块投影到参考帧中,得到参考帧中对应当前编码单元CU的投影块;
步骤二:计算步骤一得到的投影块中帧间模式为Merge的面积:
SM=∑f(Mode(x,y)) (1)
其中,SM为投影块中帧间模式为Merge的面积,(x,y)为投影块中像素点的坐标,Mode(x,y)为坐标为(x,y)的像素点的最佳帧间预测模式;当坐标为(x,y)的像素点的最佳模式为Merge时,Mode(x,y)取1,否则取0;
步骤三:计算当前编码单元CU的总面积:
SC=∑g(x1,y1) (3)
其中,SC为当前编码单元CU的总面积,Cur_CU表示当前编码单元CU的像素坐标范围;(x1,y1)为当前帧图像中像素点的坐标,当像素点(x1,y1)的坐标在当前编码单元CU范围内时,g(x1,y1)取1,否则取0;
步骤四:由步骤二的投影块的Merge面积和步骤三中的当前编码单元CU总面积计算投影块中Merge模式的面积占总面积的比例γ:
步骤五:当步骤四的比例γ大于设定阈值λ时,跳过步骤六,结束当前编码单元CU的预测编码;否则,进入步骤六;
其中,λ可取[0,1]中的任意实数;
步骤六:对当前编码单元CU进行运动估计和运动补偿的帧间预测。
进一步地,所述λ取值为0.85。
一种基于Merge技术运动矢量的帧间模式快速选择装置,包括:
投影块获取单元:获取当前编码单元在最佳帧间预测模式下,对应于参考帧上的投影块;
在当前编码单元CU做完Affine Merge、2Nx2N Merge和FRUC Merge模式后,根据率失真代价决策出当前编码单元CU的最佳帧间预测模式;
基于最佳帧间预测模式获取当前编码单元CU的运动矢量MV,将当前编码单元CU中的每个像素点平移MV后得到与当前编码单元CU大小相同的平移块,最后将该平移块投影到参考帧中,得到参考帧中对应当前编码单元CU的投影块;
帧间模式Merge的面积计算单元:依据投影块中各像素点的帧间模式,计算帧间模式为Merge的面积:
SM=∑f(Mode(x,y))
其中,SM为投影块中帧间模式为Merge的面积,(x,y)为投影块中像素点的坐标,Mode(x,y)为坐标为(x,y)的像素点的最佳帧间预测模式;当坐标为(x,y)的像素点的最佳模式为Merge时,Mode(x,y)取1,否则取0;
当前编码单元CU的总面积计算单元:依据当前帧图像中各像素点是否属于当前编码单元CU,计算当前编码单元CU的总面积:
SC=∑g(x1,y1)
其中,SC为当前编码单元CU的总面积,Cur_CU表示当前编码单元CU的像素坐标范围;(x1,y1)为当前帧图像中像素点的坐标,当像素点(x1,y1)的坐标在当前编码单元CU范围内时,g(x1,y1)取1,否则取0;
投影块Merge模式比例计算单元:由投影块的Merge面积和当前编码单元CU总面积计算投影块中Merge模式的面积占总面积的比例γ:
跳过单元:当比例γ大于设定阈值λ时,跳过对当前编码单元CU进行运动估计和运动补偿的帧间预测,结束当前编码单元CU的预测编码;
其中,λ可取[0,1]中的任意实数。
进一步地,所述跳过单元中的阈值λ取值为0.85。
有益效果
本发明提供了一种基于Merge技术运动矢量的帧间模式快速选择方法及装置,该方法通过当前编码单元CU的运动矢量MV投影到参考帧,从而找到参考帧中对应当前CU的投影块,利用两者者在预测模式上的相关性,利用投影块的特征决定是否跳过当前CU是否跳过运动估计和运动补偿的帧间模式;相较于现有技术,通过已知的投影块的信息,来对当前编码单元进行预测,降低了视频编码器的帧间预测计算复杂度,减少了编码时间,提高了编码效率;且本发明算法简单,计算量小,可方便地投入实际应用。
附图说明
图1为当前编码单元及其投影块对应关系和运动矢量示意图,其中,(a)为对应关系,(b)为运动矢量示意图;
图2为CU的信息存储方式;
图3为本发明所述方法的流程图。
具体实施方式
下面结合附图以一个优选实施例来对本发明的技术方案进行详细说明。所选实施例所用的编码器为下一代视频编码标准专家组发布的测试模型——JEM4.0,具体编码参数的配置选用JEM标准配置文件:encoder_randomaccess_jvet10.cfg,以及对应测试序列的标准配置文件。
为减少编码时间,提高工作效率,本发明具体采用的技术方案为:通过当前CU(编码块)的运动矢量MV投影到参考帧,从而找到参考帧中对应当前CU的投影块,理论上可近似认为该投影块经过运动矢量MV的位移运动到了当前帧的当前编码CU的位置(见图一左)。因此该投影块的一些性质与当前编码CU的一些性质应该是吻合的,例如像素分布情况、帧间预测模式等。本发明就根据二者在预测模式上的相似度,设定一个阈值(以下记为skip阈值),根据该阈值决定是否跳过运动估计和运动补偿的帧间模式。
如图3所示,本发明的具体方法如下:
步骤一:JEM编码器在当前CU做完Affine Merge、2Nx2N Merge和FRUC Merge模式后,此时会根据率失真代价决策出一个最佳模式。首先根据最佳模式中的运动矢量MV将当前CU进行平移(见图一右)。其中,运动矢量包含水平位移分量MVx和垂直位移分量MVy,平移的方法是先记录当前CU的顶点坐标、CU的宽和高,分别记为(x,y)、width和height,则平移块顶点在参考帧的坐标为(x+MVx,y+MVy),平移块的大小与当前编码CU一致,然后再将平移块投影到参考帧中(如图1a所示)。
步骤二:统计在步骤一中所得的投影块中帧间模式最终为Merge的面积。由于新一代视频编码标准的模式信息存储方式是以像素4x4大小的块为单位存储而不是以像素点为单位(见图2),所以统计方式是遍历投影块的各个小块,面积可以用下式计算。
SM=∑f(Mode(x,y))
其中,SM为投影块中帧间模式最终为Merge的面积,(x,y)为投影块中像素点的坐标。Mode(x,y)为投影块中坐标为(x,y)的像素点的最佳帧间预测模式。当投影块中像素点坐标(x,y)的最佳模式为Merge时,Mode(x,y)取1,否则取0。
步骤三:计算当前编码单元CU的总面积。同步骤二,CU总面积的统计方式也是遍历当前编码单元CU的各个小块,获得当前编码单元CU内像素点的数量。具体计算方式如下:
SC=∑g(x1,y1)
其中,SC为当前编码单元CU的总面积,Cur_CU为当前编码单元CU的坐标范围,(x1,y1)为图像中像素点的坐标,当像素点的坐标在当前编码单元CU范围内时,g(x1,y1)取1,否则取0。
步骤四:由步骤二的投影块的Merge面积和步骤三中的当前编码单元CU总面积计算投影块中Merge模式的面积占总面积的比例γ。
任意一个投影块的Merge模式的面积占总面积的比例可以由下式得到:
步骤五:当步骤四的比例γ大于阈值λ时,说明当前编码单元CU的最佳帧间模式也极有可能为Merge,因此跳过步骤六,结束当前CU的预测编码。其中,γ可取[0,1]中的任意实数,当对视频质量要求较高,编码时间要求不严格时,λ可取范围内较大的值,反之可取较小的值。经过大量实验统计,当λ取0.85时能在视频质量和编码时间之间取得较好的平衡。
步骤六:进行运动估计和运动补偿的帧间预测。
一种基于Merge技术运动矢量的帧间模式快速选择装置,包括:
投影块获取单元:获取当前编码单元在最佳帧间预测模式下,对应于参考帧上的投影块;
在当前编码单元CU做完Affine Merge、2Nx2N Merge和FRUC Merge模式后,根据率失真代价决策出当前编码单元CU的最佳帧间预测模式;
基于最佳帧间预测模式获取当前编码单元CU的运动矢量MV,将当前编码单元CU中的每个像素点平移MV后得到与当前编码单元CU大小相同的平移块,最后将该平移块投影到参考帧中,得到参考帧中对应当前编码单元CU的投影块;
帧间模式Merge的面积计算单元:依据投影块中各像素点的帧间模式,计算帧间模式为Merge的面积:
SM=∑f(Mode(x,y))
其中,SM为投影块中帧间模式为Merge的面积,(x,y)为投影块中像素点的坐标,Mode(x,y)为坐标为(x,y)的像素点的最佳帧间预测模式;当坐标为(x,y)的像素点的最佳模式为Merge时,Mode(x,y)取1,否则取0;
当前编码单元CU的总面积计算单元:依据当前帧图像中各像素点是否属于当前编码单元CU,计算当前编码单元CU的总面积:
SC=∑g(x1,y1)
其中,SC为当前编码单元CU的总面积,Cur_CU表示当前编码单元CU的像素坐标范围;(x1,y1)为当前帧图像中像素点的坐标,当像素点(x1,y1)的坐标在当前编码单元CU范围内时,g(x1,y1)取1,否则取0;
投影块Merge模式比例计算单元:由投影块的Merge面积和当前编码单元CU总面积计算投影块中Merge模式的面积占总面积的比例γ:
跳过单元:当比例γ大于设定阈值λ时,跳过对当前编码单元CU进行运动估计和运动补偿的帧间预测,结束当前编码单元CU的预测编码;
其中,λ可取[0,1]中的任意实数。
所述跳过单元中的阈值λ取值为0.85。
为了验证所提出的帧间快速算法的可行性以及有效性,基于新一代视频编码标准测试模型JEM4.0实现了上文提到的快速算法。并且最后的数据都是在学校的高性能平台中运行得到,保证实验数据的真实和准确。所有实验的具体编码参数的配置选用JEM标准配置文件:encoder_randomaccess_jvet10.cfg,以及对应测试序列的标准配置文件。
实验结果如表1所示。其中,QP为量化参数,ΔBits%为与传统的编码器相比比特率变化百分比,ΔPSNR/dB为与传统的编码器相比峰值信噪比变化,TS/%为与传统的编码器相比所节省的时间百分比。ΔBDBR表示了在同样的客观质量下,传统编码器和改进的编码器的码率节省情况。ΔBDBR越小说明算法效果越好。
表1实验结果
通过在实验仿真,本发明中所提出的快速帧间算法的实验结果如表1所示。由表1可知,该算法达到了在保证视频的质量的前提下,提高了编码的效率的目的。
本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。
Claims (4)
1.一种基于Merge技术运动矢量的帧间模式快速选择方法,其特征在于,包括以下步骤:
步骤一:获取当前编码单元在最佳帧间预测模式下,对应于参考帧上的投影块;
在当前编码单元CU做完Affine Merge、2Nx2N Merge和FRUC Merge模式后,根据率失真代价决策出当前编码单元CU的最佳帧间预测模式;
基于最佳帧间预测模式获取当前编码单元CU的运动矢量MV,将当前编码单元CU中的每个像素点平移MV后得到与当前编码单元CU大小相同的平移块,最后将该平移块投影到参考帧中,得到参考帧中对应当前编码单元CU的投影块;
步骤二:计算步骤一得到的投影块中帧间模式为Merge的面积:
SM=∑f(Mode(x,y)) (1)
<mrow>
<mi>f</mi>
<mrow>
<mo>(</mo>
<mi>M</mi>
<mi>o</mi>
<mi>d</mi>
<mi>e</mi>
<mo>(</mo>
<mrow>
<mi>x</mi>
<mo>,</mo>
<mi>y</mi>
</mrow>
<mo>)</mo>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfenced open = "{" close = "">
<mtable>
<mtr>
<mtd>
<mrow>
<mn>1</mn>
<mo>,</mo>
</mrow>
</mtd>
<mtd>
<mrow>
<mi>i</mi>
<mi>f</mi>
<mi> </mi>
<mi>M</mi>
<mi>o</mi>
<mi>d</mi>
<mi>e</mi>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mo>,</mo>
<mi>y</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mi>M</mi>
<mi>e</mi>
<mi>r</mi>
<mi>g</mi>
<mi>e</mi>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<mn>0</mn>
<mo>,</mo>
</mrow>
</mtd>
<mtd>
<mrow>
<mi>i</mi>
<mi>f</mi>
<mi> </mi>
<mi>M</mi>
<mi>o</mi>
<mi>d</mi>
<mi>e</mi>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mo>,</mo>
<mi>y</mi>
<mo>)</mo>
</mrow>
<mo>!</mo>
<mo>=</mo>
<mi>M</mi>
<mi>e</mi>
<mi>r</mi>
<mi>g</mi>
<mi>e</mi>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>2</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,SM为投影块中帧间模式为Merge的面积,(x,y)为投影块中像素点的坐标,Mode(x,y)为坐标为(x,y)的像素点的最佳帧间预测模式;当坐标为(x,y)的像素点的最佳模式为Merge时,Mode(x,y)取1,否则取0;
步骤三:计算当前编码单元CU的总面积:
SC=∑g(x1,y1) (3)
<mrow>
<mi>g</mi>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mn>1</mn>
<mo>,</mo>
<mi>y</mi>
<mn>1</mn>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfenced open = "{" close = "">
<mtable>
<mtr>
<mtd>
<mrow>
<mn>1</mn>
<mo>,</mo>
</mrow>
</mtd>
<mtd>
<mrow>
<mi>i</mi>
<mi>f</mi>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mn>1</mn>
<mo>,</mo>
<mi>y</mi>
<mn>1</mn>
<mo>)</mo>
</mrow>
<mo>&Element;</mo>
<mi>C</mi>
<mi>u</mi>
<mi>r</mi>
<mo>_</mo>
<mi>C</mi>
<mi>U</mi>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<mn>0</mn>
<mo>,</mo>
</mrow>
</mtd>
<mtd>
<mrow>
<mi>i</mi>
<mi>f</mi>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mn>1</mn>
<mo>,</mo>
<mi>y</mi>
<mn>1</mn>
<mo>)</mo>
</mrow>
<mo>&NotElement;</mo>
<mi>C</mi>
<mi>u</mi>
<mi>r</mi>
<mo>_</mo>
<mi>C</mi>
<mi>U</mi>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>4</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,SC为当前编码单元CU的总面积,Cur_CU表示当前编码单元CU的像素坐标范围;(x1,y1)为当前帧图像中像素点的坐标,当像素点(x1,y1)的坐标在当前编码单元CU范围内时,g(x1,y1)取1,否则取0;
步骤四:由步骤二的投影块的Merge面积和步骤三中的当前编码单元CU总面积计算投影块中Merge模式的面积占总面积的比例γ:
<mrow>
<mi>&gamma;</mi>
<mo>=</mo>
<mfrac>
<msub>
<mi>S</mi>
<mi>M</mi>
</msub>
<msub>
<mi>S</mi>
<mi>C</mi>
</msub>
</mfrac>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>5</mn>
<mo>)</mo>
</mrow>
</mrow>
步骤五:当步骤四的比例γ大于设定阈值λ时,跳过步骤六,结束当前编码单元CU的预测编码;否则,进入步骤六;
其中,λ可取[0,1]中的任意实数;
步骤六:对当前编码单元CU进行运动估计和运动补偿的帧间预测。
2.根据权利要求1所述的方法,其特征在于,所述λ取值为0.85。
3.一种基于Merge技术运动矢量的帧间模式快速选择装置,其特征在于,包括:
投影块获取单元:获取当前编码单元在最佳帧间预测模式下,对应于参考帧上的投影块;
在当前编码单元CU做完Affine Merge、2Nx2N Merge和FRUC Merge模式后,根据率失真代价决策出当前编码单元CU的最佳帧间预测模式;
基于最佳帧间预测模式获取当前编码单元CU的运动矢量MV,将当前编码单元CU中的每个像素点平移MV后得到与当前编码单元CU大小相同的平移块,最后将该平移块投影到参考帧中,得到参考帧中对应当前编码单元CU的投影块;
帧间模式Merge的面积计算单元:依据投影块中各像素点的帧间模式,计算帧间模式为Merge的面积:
SM=∑f(Mode(x,y))
<mrow>
<mi>f</mi>
<mrow>
<mo>(</mo>
<mi>M</mi>
<mi>o</mi>
<mi>d</mi>
<mi>e</mi>
<mo>(</mo>
<mrow>
<mi>x</mi>
<mo>,</mo>
<mi>y</mi>
</mrow>
<mo>)</mo>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfenced open = "{" close = "">
<mtable>
<mtr>
<mtd>
<mrow>
<mn>1</mn>
<mo>,</mo>
</mrow>
</mtd>
<mtd>
<mrow>
<mi>i</mi>
<mi>f</mi>
<mi> </mi>
<mi>M</mi>
<mi>o</mi>
<mi>d</mi>
<mi>e</mi>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mo>,</mo>
<mi>y</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mi>M</mi>
<mi>e</mi>
<mi>r</mi>
<mi>g</mi>
<mi>e</mi>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<mn>0</mn>
<mo>,</mo>
</mrow>
</mtd>
<mtd>
<mrow>
<mi>i</mi>
<mi>f</mi>
<mi> </mi>
<mi>M</mi>
<mi>o</mi>
<mi>d</mi>
<mi>e</mi>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mo>,</mo>
<mi>y</mi>
<mo>)</mo>
</mrow>
<mo>!</mo>
<mo>=</mo>
<mi>M</mi>
<mi>e</mi>
<mi>r</mi>
<mi>g</mi>
<mi>e</mi>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
</mrow>
其中,SM为投影块中帧间模式为Merge的面积,(x,y)为投影块中像素点的坐标,Mode(x,y)为坐标为(x,y)的像素点的最佳帧间预测模式;当坐标为(x,y)的像素点的最佳模式为Merge时,Mode(x,y)取1,否则取0;
当前编码单元CU的总面积计算单元:依据当前帧图像中各像素点是否属于当前编码单元CU,计算当前编码单元CU的总面积:
SC=∑g(x1,y1)
<mrow>
<mi>g</mi>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mn>1</mn>
<mo>,</mo>
<mi>y</mi>
<mn>1</mn>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfenced open = "{" close = "">
<mtable>
<mtr>
<mtd>
<mrow>
<mn>1</mn>
<mo>,</mo>
</mrow>
</mtd>
<mtd>
<mrow>
<mi>i</mi>
<mi>f</mi>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mn>1</mn>
<mo>,</mo>
<mi>y</mi>
<mn>1</mn>
<mo>)</mo>
</mrow>
<mo>&Element;</mo>
<mi>C</mi>
<mi>u</mi>
<mi>r</mi>
<mo>_</mo>
<mi>C</mi>
<mi>U</mi>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<mn>0</mn>
<mo>,</mo>
</mrow>
</mtd>
<mtd>
<mrow>
<mi>i</mi>
<mi>f</mi>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mn>1</mn>
<mo>,</mo>
<mi>y</mi>
<mn>1</mn>
<mo>)</mo>
</mrow>
<mo>&NotElement;</mo>
<mi>C</mi>
<mi>u</mi>
<mi>r</mi>
<mo>_</mo>
<mi>C</mi>
<mi>U</mi>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
</mrow>
其中,SC为当前编码单元CU的总面积,Cur_CU表示当前编码单元CU的像素坐标范围;(x1,y1)为当前帧图像中像素点的坐标,当像素点(x1,y1)的坐标在当前编码单元CU范围内时,g(x1,y1)取1,否则取0;
投影块Merge模式比例计算单元:由投影块的Merge面积和当前编码单元CU总面积计算投影块中Merge模式的面积占总面积的比例γ:
<mrow>
<mi>&gamma;</mi>
<mo>=</mo>
<mfrac>
<msub>
<mi>S</mi>
<mi>M</mi>
</msub>
<msub>
<mi>S</mi>
<mi>C</mi>
</msub>
</mfrac>
</mrow>
跳过单元:当比例γ大于设定阈值λ时,跳过对当前编码单元CU进行运动估计和运动补偿的帧间预测,结束当前编码单元CU的预测编码;
其中,λ可取[0,1]中的任意实数。
4.根据权利要求1所述的装置,其特征在于,所述跳过单元中的阈值λ取值为0.85。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710762301.1A CN107396102B (zh) | 2017-08-30 | 2017-08-30 | 一种基于Merge技术运动矢量的帧间模式快速选择方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710762301.1A CN107396102B (zh) | 2017-08-30 | 2017-08-30 | 一种基于Merge技术运动矢量的帧间模式快速选择方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107396102A true CN107396102A (zh) | 2017-11-24 |
CN107396102B CN107396102B (zh) | 2019-10-08 |
Family
ID=60348165
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710762301.1A Active CN107396102B (zh) | 2017-08-30 | 2017-08-30 | 一种基于Merge技术运动矢量的帧间模式快速选择方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107396102B (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108174204A (zh) * | 2018-03-06 | 2018-06-15 | 中南大学 | 一种基于决策树的帧间快速模式选择方法 |
CN108347616A (zh) * | 2018-03-09 | 2018-07-31 | 中南大学 | 一种基于可选时域运动矢量预测的深度预测方法及装置 |
CN110662041A (zh) * | 2018-06-29 | 2020-01-07 | 北京字节跳动网络技术有限公司 | 扩展Merge模式与其他视频编码工具之间的交互 |
CN110809155A (zh) * | 2018-08-04 | 2020-02-18 | 北京字节跳动网络技术有限公司 | 使用更新的运动信息的限制 |
CN111698502A (zh) * | 2020-06-19 | 2020-09-22 | 中南大学 | 基于vvc编码的仿射运动估计加速方法、设备及存储介质 |
CN112637592A (zh) * | 2020-12-11 | 2021-04-09 | 百果园技术(新加坡)有限公司 | 一种视频预测编码的方法及装置 |
CN112839224A (zh) * | 2019-11-22 | 2021-05-25 | 腾讯科技(深圳)有限公司 | 一种预测模式选择方法、装置、视频编码设备及存储介质 |
CN114339231A (zh) * | 2021-12-27 | 2022-04-12 | 杭州当虹科技股份有限公司 | 利用运动矢量快速跳Cu级模式选择的方法 |
US11778170B2 (en) | 2018-10-06 | 2023-10-03 | Beijing Bytedance Network Technology Co., Ltd | Temporal gradient calculations in bio |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080165855A1 (en) * | 2007-01-08 | 2008-07-10 | Nokia Corporation | inter-layer prediction for extended spatial scalability in video coding |
CN103338372A (zh) * | 2013-06-15 | 2013-10-02 | 浙江大学 | 一种视频处理方法及装置 |
CN103379324A (zh) * | 2012-04-16 | 2013-10-30 | 乐金电子(中国)研究开发中心有限公司 | 一种先进运动矢量预测amvp的并行实现方法、装置及*** |
CN104038764A (zh) * | 2014-06-27 | 2014-09-10 | 华中师范大学 | 一种h.264到h.265的视频转码方法及转码器 |
CN104601988A (zh) * | 2014-06-10 | 2015-05-06 | 腾讯科技(北京)有限公司 | 视频编码器、方法和装置及其帧间模式选择方法和装置 |
US20150222904A1 (en) * | 2011-03-08 | 2015-08-06 | Texas Instruments Incorporated | Parsing friendly and error resilient merge flag coding in video coding |
CN105959611A (zh) * | 2016-07-14 | 2016-09-21 | 同观科技(深圳)有限公司 | 一种自适应的从h264到hevc的帧间快速转码方法及装置 |
TW201637449A (zh) * | 2015-01-29 | 2016-10-16 | Vid衡器股份有限公司 | 區塊間複製檢索 |
US20160373766A1 (en) * | 2015-06-22 | 2016-12-22 | Cisco Technology, Inc. | Block-based video coding using a mixture of square and rectangular blocks |
-
2017
- 2017-08-30 CN CN201710762301.1A patent/CN107396102B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080165855A1 (en) * | 2007-01-08 | 2008-07-10 | Nokia Corporation | inter-layer prediction for extended spatial scalability in video coding |
US20150222904A1 (en) * | 2011-03-08 | 2015-08-06 | Texas Instruments Incorporated | Parsing friendly and error resilient merge flag coding in video coding |
CN103379324A (zh) * | 2012-04-16 | 2013-10-30 | 乐金电子(中国)研究开发中心有限公司 | 一种先进运动矢量预测amvp的并行实现方法、装置及*** |
CN103338372A (zh) * | 2013-06-15 | 2013-10-02 | 浙江大学 | 一种视频处理方法及装置 |
CN104601988A (zh) * | 2014-06-10 | 2015-05-06 | 腾讯科技(北京)有限公司 | 视频编码器、方法和装置及其帧间模式选择方法和装置 |
CN104038764A (zh) * | 2014-06-27 | 2014-09-10 | 华中师范大学 | 一种h.264到h.265的视频转码方法及转码器 |
TW201637449A (zh) * | 2015-01-29 | 2016-10-16 | Vid衡器股份有限公司 | 區塊間複製檢索 |
US20160373766A1 (en) * | 2015-06-22 | 2016-12-22 | Cisco Technology, Inc. | Block-based video coding using a mixture of square and rectangular blocks |
CN105959611A (zh) * | 2016-07-14 | 2016-09-21 | 同观科技(深圳)有限公司 | 一种自适应的从h264到hevc的帧间快速转码方法及装置 |
Non-Patent Citations (1)
Title |
---|
黄晗: "《HEVC帧间帧内预测及优化技术研究》", 《中国优秀硕士学位论文全文数据库》 * |
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108174204A (zh) * | 2018-03-06 | 2018-06-15 | 中南大学 | 一种基于决策树的帧间快速模式选择方法 |
CN108347616A (zh) * | 2018-03-09 | 2018-07-31 | 中南大学 | 一种基于可选时域运动矢量预测的深度预测方法及装置 |
CN108347616B (zh) * | 2018-03-09 | 2020-02-14 | 中南大学 | 一种基于可选时域运动矢量预测的深度预测方法及装置 |
CN110662041B (zh) * | 2018-06-29 | 2022-07-29 | 北京字节跳动网络技术有限公司 | 视频比特流处理的方法和装置,存储视频比特流的方法和非暂时性计算机可读记录介质 |
CN110662041A (zh) * | 2018-06-29 | 2020-01-07 | 北京字节跳动网络技术有限公司 | 扩展Merge模式与其他视频编码工具之间的交互 |
US11451819B2 (en) | 2018-08-04 | 2022-09-20 | Beijing Bytedance Network Technology Co., Ltd. | Clipping of updated MV or derived MV |
CN110809155A (zh) * | 2018-08-04 | 2020-02-18 | 北京字节跳动网络技术有限公司 | 使用更新的运动信息的限制 |
US11470341B2 (en) | 2018-08-04 | 2022-10-11 | Beijing Bytedance Network Technology Co., Ltd. | Interaction between different DMVD models |
CN110809156B (zh) * | 2018-08-04 | 2022-08-12 | 北京字节跳动网络技术有限公司 | 不同解码器侧运动矢量推导模式之间的交互 |
US11109055B2 (en) | 2018-08-04 | 2021-08-31 | Beijing Bytedance Network Technology Co., Ltd. | MVD precision for affine |
CN110809156A (zh) * | 2018-08-04 | 2020-02-18 | 北京字节跳动网络技术有限公司 | 不同解码器侧运动矢量推导模式之间的交互 |
US11330288B2 (en) | 2018-08-04 | 2022-05-10 | Beijing Bytedance Network Technology Co., Ltd. | Constraints for usage of updated motion information |
US11778170B2 (en) | 2018-10-06 | 2023-10-03 | Beijing Bytedance Network Technology Co., Ltd | Temporal gradient calculations in bio |
CN112839224A (zh) * | 2019-11-22 | 2021-05-25 | 腾讯科技(深圳)有限公司 | 一种预测模式选择方法、装置、视频编码设备及存储介质 |
CN112839224B (zh) * | 2019-11-22 | 2023-10-10 | 腾讯科技(深圳)有限公司 | 一种预测模式选择方法、装置、视频编码设备及存储介质 |
CN111698502A (zh) * | 2020-06-19 | 2020-09-22 | 中南大学 | 基于vvc编码的仿射运动估计加速方法、设备及存储介质 |
WO2022121786A1 (zh) * | 2020-12-11 | 2022-06-16 | 百果园技术(新加坡)有限公司 | 视频预测编码的方法及装置 |
CN112637592A (zh) * | 2020-12-11 | 2021-04-09 | 百果园技术(新加坡)有限公司 | 一种视频预测编码的方法及装置 |
CN112637592B (zh) * | 2020-12-11 | 2024-07-05 | 百果园技术(新加坡)有限公司 | 一种视频预测编码的方法及装置 |
CN114339231A (zh) * | 2021-12-27 | 2022-04-12 | 杭州当虹科技股份有限公司 | 利用运动矢量快速跳Cu级模式选择的方法 |
CN114339231B (zh) * | 2021-12-27 | 2023-10-27 | 杭州当虹科技股份有限公司 | 利用运动矢量快速跳Cu级模式选择的方法 |
Also Published As
Publication number | Publication date |
---|---|
CN107396102B (zh) | 2019-10-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107396102B (zh) | 一种基于Merge技术运动矢量的帧间模式快速选择方法及装置 | |
CN107147911A (zh) | 基于局部亮度补偿lic的快速帧间编码模式选择方法及装置 | |
CN110519600B (zh) | 帧内帧间联合预测方法、装置、编解码器及存储装置 | |
CN108781284A (zh) | 具有仿射运动补偿的视频编解码的方法及装置 | |
CN102025995B (zh) | 一种可伸缩视频编码的空间增强层快速模式选择方法 | |
CN107222742B (zh) | 基于时空域相关性的视频编码Merge模式快速选择方法及装置 | |
CN101888546B (zh) | 一种运动估计的方法及装置 | |
CN108347616A (zh) | 一种基于可选时域运动矢量预测的深度预测方法及装置 | |
CN105120290B (zh) | 一种深度视频快速编码方法 | |
CN107079165A (zh) | 使用预测残差的视频编码方法及装置 | |
CN107087200A (zh) | 针对高效率视频编码标准的跳过编码模式提前判决方法 | |
CN102932642A (zh) | 一种帧间编码快速模式选择方法 | |
CN104811729B (zh) | 一种视频多参考帧编码方法 | |
CN107197297A (zh) | 一种检测基于dct系数隐写的视频隐写分析方法 | |
CN107318016A (zh) | 一种基于零块分布的hevc帧间预测模式快速判定方法 | |
CN102647598A (zh) | 基于极大极小mv差值的h.264帧间模式优化方法 | |
CN108769696A (zh) | 一种基于Fisher判别式的DVC-HEVC视频转码方法 | |
CN101102492A (zh) | 实现基于感兴趣区域的压缩域mpeg-2到h.264视频转换的方法 | |
CN110519591A (zh) | 一种基于多用途编码中帧内编码的预测模式快速选择方法 | |
CN106331700A (zh) | 参考图像编码和解码的方法、编码设备和解码设备 | |
CN106131573B (zh) | 一种hevc空间分辨率转码方法 | |
CN109688411B (zh) | 一种视频编码率失真代价估计方法和装置 | |
CN106060555A (zh) | 一种基于多核处理器的编码器 | |
CN110225339A (zh) | 一种hevc视频序列编解码加速方法 | |
CN101783956A (zh) | 基于时空邻居信息的后向预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |