CN104301723A - 基于最优停止理论的高效视频快速编码方法 - Google Patents
基于最优停止理论的高效视频快速编码方法 Download PDFInfo
- Publication number
- CN104301723A CN104301723A CN201310297983.5A CN201310297983A CN104301723A CN 104301723 A CN104301723 A CN 104301723A CN 201310297983 A CN201310297983 A CN 201310297983A CN 104301723 A CN104301723 A CN 104301723A
- Authority
- CN
- China
- Prior art keywords
- sigma
- pattern
- encoded
- coding
- current
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明涉及一种基于最优停止理论的高效视频快速编码方法,该方法包括以下步骤:1)获取视频序列中的待编码帧和N个高效视频编码模式,并初始化待编码帧中每个PU的概率信息;2)计算当前待编码PU在每个编码模式下对应的概率^,k=1,2,...,N,并将N个编码模式按其概率降序排列;3)应用最优停止理论根据步骤2)的顺序依次检查各编码模式,计算并获得最佳编码模式和最优停止点;4)采用得到的最佳编码模式对当前待编码PU进行编码,并根据当前最佳编码模式和最优停止点更新参数,直至整个视频序列编码完成。与现有技术相比,本发明降低了HEVC在预测单元模式决定部分的计算量,提高编码速度,促进其在实际中的广泛应用。
Description
技术领域
本发明涉及视频压缩编码领域,尤其是涉及一种基于最优停止理论的高效视频快速编码方法。
背景技术
随着高清视频,甚至是超高清视频的兴起,大分辨率视频的应用在市场上愈发普及,并且广受欢迎。超高清视频的分辨率可以达到4Kx2K,甚至8Kx4K,这对视频压缩效率提出了新的挑战。目前广泛使用的视频压缩编码标准H.264/AVC于1999年至2003年间初步制定,并于2003年至2009年间又做了多次扩展和补充。迄今为止,H.264/AVC标准已经广泛应用于卫星视频广播、有线电视、视频会议、视频聊天和安保监控等众多领域。然而,针对目前新兴的高清视频领域,H.264/AVC标准的压缩效率和性能还不能很好地满足要求。在这种情况下,高效视频编码标准(High Efficiency Video Coding,HEVC)应运而生。
HEVC是ITU-T视频编码专家组(VCEG)和ISO/IEC运动图像专家组(MPEG)组成的联合视频编码组(JCT-VC)制定的,旨在H.264/AVC的基础上进一步提高压缩效率,并且在相同视频质量的情况下,达到2倍于H.264/AVC的压缩比。和H.264/AVC相比,HEVC编码技术最大的不同在于其四叉树结构。H.264/AVC中的宏块(MB)兼具预测和变换信息;在HEVC中,基本的编码单元是Coding Tree Unit(CTU)。CTU和MB的功能类似,但是CTU的预测信息携带单位是PU(Prediction Unit)。针对每一个CU(Coding Unit),可进一步划分为4个子PU。在HEVC中,CU的大小可以是以下值:64x64、32x32、16x16、8x8。当对CU进行帧间(Inter)预测时,PU的大小可以为2Nx2N、2NxN、Nx2N、NxN、2NxnU、2NxnD、nLx2N、nRx2N。在这里,2Nx2N代表不进行子划分的CU大小,2NxN代表宽度为原CU一半的PU,2NxnU中n的大小为四分之一,各PU的大小如图1所示;当对CU进行帧内(Intra)预测时,PU的大小可以是2Nx2N或NxN(对亮度分量,N=32、16、 8、4)。相对于H.264/AVC中最多有9种帧内预测方式(分别是垂直预测、水平预测、平均预测、左对角预测、右对角预测、垂直右对角预测、水平向下预测、垂直左对角预测和水平向上预测),HEVC的帧内预测方式最多可达35种。当进行帧内预测时,每个PU都需要在35种预测方式中选择一种最佳模式进行预测编码。在HEVC中,采用RQT(Residual QuadTree)技术对预测产生的残差进行量化;和PU类似,HEVC采用TU(Transform Unit)对残差进行基于四叉树的量化和变换编码。对于亮度分量,TU的大小可以是32x32、16x16、8x8和4x4;对于色度分量,其TU的长宽分别是对应亮度分量TU长宽的二分之一。
和H.264/AVC相似,HEVC采用了基于拉格朗日率失真优化策略RDO(Rate Distortion Optimization)技术的模式选择算法,即通过遍历所有可能的模式,最后选择率失真代价最小的模式作为最佳编码模式,公式为:
J(s,c,m|QP,λm)=D(s,c,m|QP)+λmR(s,c,m|QP)
式中,QP是量化参数;λm是拉格朗日常数,与QP有关;D是原始像素块s与重建块c之间的失真;R是利用模式m进行编码后产生的比特数。
相比于H.264/AVC中仅仅需要对MB进行所有模式的遍历计算选择,HEVC需要分别对每一层的CU、PU和TU进行最优选择,选择出最佳单元大小和模式进行编码。因此,HEVC中模式选择的计算复杂度是巨大的,在移动设备和实时环境下很难应用HEVC进行高效编码。这就需要快速算法来缩短编码时间以满足实际需要,同时又要在一定范围内满足视频质量的要求。
最优停止理论可以在某个适当的点停止,从而避免遍历待编码CU的所有模式来达到缩短编码时间的目的。最优停止理论问题可以归结如下:存在一个联合分布已知的随机变量的序列和一组实值奖励函数,决策者按照顺序一个个检查这些变量,同时获得相应的奖励函数值,并且在合适的时间停止检查余下的变量,最终的目的是获得的奖励函数值最大,这样获得最好的候选变量的概率也最大。通过把各种编码模式当作上面提到的变量,并且研究各种模式相互之间的关系,最优停止理论就可以应用到模式决定的快速算法中。
Ferguson等又提出了名为持续问题的一种最优停止问题,简单叙述为:在决策的过程中,如果某个变量比其他变量的观测值更好,那么它便成为是一个Relative Best Object(RBO)。持续问题的目标是在遇到下一个RBO之前,找到一个适当的时间停止观测,同时获得观测值最大的变量。持续问题的期望值越大,表明在停止点 之后遇到下一个RBO的时间越长,同时能够节约的不必要时间也越多。换句话说,持续问题的解决方法在判定准确性和时间减少比例上能够很好地进行权衡,这点可以借鉴到视频编码的快速算法中,相对应的是既要尽可能选择到编码的最佳模式,同时又要尽量减少编码时间,这和持续问题的目的很类似。
发明内容
本发明的目的就是为了克服上述现有技术存在的计算量大、编码速度慢等缺陷提供一种基于最优停止理论的高效视频快速编码方法,降低了HEVC在预测单元模式决定部分的计算量,提高编码速度,促进其在实际中的广泛应用。
本发明的目的可以通过以下技术方案来实现:
一种基于最优停止理论的高效视频快速编码方法,该方法包括以下步骤:
1)获取视频序列中的待编码帧和N个高效视频编码模式,并初始化待编码帧中每个PU的概率信息;
2)计算当前待编码PU在每个编码模式下对应的概率pk,k=1,2,...,N,并将N个编码模式按其概率降序排列;
3)应用最优停止理论根据步骤2)的顺序依次检查各编码模式,计算并获得最佳编码模式和最优停止点;
4)采用得到的最佳编码模式对当前待编码PU进行编码,并根据当前最佳编码模式和最优停止点更新参数;
5)返回步骤2),直至当前待编码帧的所有PU全部编码完成;
6)返回步骤1),直至整个视频序列编码完成。
所述的当前待编码PU在每个编码模式下对应的概率pk通过以下公式获取:
其中,Tu(Mu,k)为当前待编码PU的上方PU最佳编码模式为Mu时,当前待编码PU最佳编码模式为k的概率预测矩阵;Tl(Ml,k)为当前待编码PU的左方PU最佳编码模式为Ml时,当前待编码PU最佳编码模式为k的概率预测矩阵。
所述的步骤3)具体为:
3.1)依次检查各候选模式,在第k个模式停止检查,设在模式k后的下一个相对最佳目标为Tk,则Tk=j的概率为:
其中,j为自然数且j∈(k,N],Xr(r=k+1,k+2,...,j-1)表示第k+1、k+2一直到第j-1个模式在所有N个模式中被选为最佳模式的概率排名,P(Xj=1)表示第j个模式是N个模式中的最佳模式的概率;
Tk的位置由下式得到
若E(Tk)大于设定的阈值τ,τ∈[N,N+1),则当前的第k个模式为最佳编码模式;
3.2)计算最优停止点K*:
K*=max{Kα,Kβ}
式中
所述的更新参数是指根据当前的编码模式对各概率预测矩阵进行更新,更新公式如下:
T′(M,k)=T(M,k)·(1-γ)+pm·γ
其中,T(M,k)为更新前的概率预测矩阵,T′(M,k)为更新后的概率预测矩阵,γ为更新参数,pm表示在已编码PU的最佳模式为j,且满足j≤K*的前提下,模式m成为最佳模式的后验概率,由以下公式计算得到:
与现有技术相比,本发明通过最优停止理论快速选择最佳的编码模式,在最优停止点后停止检查,减少了计算量,在保证视频编码质量的同时,又尽量减少了编码时间,提高了编码效率。
附图说明
图1为预测单元PU的划分示意图;
图2为本发明方法的流程示意图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
如图2所示,一种基于最优停止理论的高效视频快速编码方法,该方法包括以下步骤:
1)获取视频序列中的待编码帧和N个高效视频编码模式,并初始化待编码帧中每个PU的概率信息,初始值皆为1/N。
本实施例采用11种编码模式,包括MERGE、2N×2N、2N×N、N×2N、N×N、2N×nU、2N×nD、nL×2N、nR×2N、Intra2N×2N、IntraN×N。
2)计算当前待编码PU在每个编码模式下对应的概率pk,k=1,2,...,N,并将N个编码模式按其概率降序排列。
各种研究资料表明,待编码PU和其相邻PU(一般是其上方和其左方PU)在最优模式上有紧密的关联,所以当前待编码PU在每个编码模式下对应的概率pk通过以下公式获取:
其中,Tu(Mu,k)为当前待编码PU的上方PU最佳编码模式为Mu时,当前待 编码PU最佳编码模式为k的概率预测矩阵;Tl(Ml,k)为当前待编码PU的左方PU最佳编码模式为Ml时,当前待编码PU最佳编码模式为k的概率预测矩阵。
降序排列公式为:
3)应用最优停止理论根据步骤2)的顺序依次检查各编码模式,计算并获得最佳编码模式和最优停止点。
3.1)依次检查各候选模式,在第k个模式停止检查,设在模式k后的下一个相对最佳目标为Tk,则Tk=j的概率为:
其中,j为自然数且j∈(k,N],Xr(r=k+1,k+2,...,j-1)表示第k+1、k+2一直到第j-1个模式在所有N个模式中被选为最佳模式的概率排名,P(Xj=1)表示第j个模式是N个模式中的最佳模式的概率;
Tk的位置由下式得到
若E(Tk)大于设定的阈值τ,τ∈[N,N+1),则当前的第k个模式为最佳编码模式,τ可取为N+4/5;
3.2)计算最优停止点K*:
K*=max{Kα,Kβ} (5)
式中
4)采用得到的最佳编码模式对当前待编码PU进行编码,并根据当前最佳编码模式和最优停止点更新参数。
更新参数是指根据当前的编码模式对各概率预测矩阵进行更新,更新公式如下:
T′(M,k)=T(M,k)·(1-γ)+pm·γ
其中,T(M,k)为更新前的概率预测矩阵,T′(M,k)为更新后的概率预测矩阵,γ为更新参数,一般取0.08,pm表示在已编码PU的最佳模式为j,且满足j≤K*的前提下,模式m成为最佳模式的后验概率,由以下公式计算得到:
5)编码完一帧中所有的PU后,当前帧完成编码;
6)重复步骤1)至步骤5),直到整个视频序列都完成编码。
本实施例通过以下实验验证上述方法的可行性和有效性,最后得到编码之后的实验结果,包含三个实验数据:编码时间、峰值信噪比PSNR和编码比特数BitRates。
在实验前,首先编写编码器配置文件,部分配置如表1所示:
表1
为了检验基于最优停止理论的高效视频编码的快速算法的性能,选取20个视频序列用于编码测试,分别是分辨率为2560×1600的Traffic、NebutaFestival、 SteamLocomotiveTrain;分辨率1920×1080的Kimono1、ParkScene、Cactus和BQTerrace;分辨率为1280×720的KristenAndSara、Johny、Vidyo1、Vidyo3、Vidyo4、FourPeople;分辨率832×480的RaceHorses、BasketballDrill、BQMall、PartyScene;分辨率416×240的RaceHorses、BasketballPass、BlowingBubbles。实验结果以三个标准来进行评价:
1)时间减少比例TS:
2)峰值性噪比(Y-PSNR)下降值:ΔPSNR=Pp-Po;
3)比特率(BR)上升值:
TO,Po,BRO分别代表HM参考软件的编码时间、峰值性噪比和比特率。同样,Tp,Pp,BRp代表采用了基于最优停止理论的快速模式决定的HM参考软件的编码时间、峰值性噪比和比特率。
对各个测试视频序列的测试结果如表格2所示:
表2
在上面的实验结果中,分辨率大的视频能很好地减少计算复杂度,同时又很好地保持视频压缩质量。如分辨率2500x1600的视频序列SteamLocomotiveTrain,时间平均减少63.1%,Y-PSNR平均降低0.03dB,Bitrates平均上升0.82%;分辨率1920x1080的视频序列ParkScene,时间平均减少64.8%,Y-PSNR平均降低0.04dB,Bitrates平均上升1.27%;分辨率1024x768的视频序列Johny,时间平均减少62.2%,Y-PSNR平均降低0.02dB,Bitrates平均上升0.43%。分辨率稍小的视频序列时间减少27%至33%,同时能较好地保持视频压缩质量。综合来说,算法能能很好地减少计算复杂度,同时较好地保持视频压缩质量。
Claims (4)
1.一种基于最优停止理论的高效视频快速编码方法,其特征在于,该方法包括以下步骤:
1)获取视频序列中的待编码帧和N个高效视频编码模式,并初始化待编码帧中每个PU的概率信息;
2)计算当前待编码PU在每个编码模式下对应的概率pk,k=1,2,...,N,并将N个编码模式按其概率降序排列;
3)应用最优停止理论根据步骤2)的顺序依次检查各编码模式,计算并获得最佳编码模式和最优停止点;
4)采用得到的最佳编码模式对当前待编码PU进行编码,并根据当前最佳编码模式和最优停止点更新参数;
5)返回步骤2),直至当前待编码帧的所有PU全部编码完成;
6)返回步骤1),直至整个视频序列编码完成。
2.根据权利要求1所述的一种基于最优停止理论的高效视频快速编码方法,其特征在于,所述的当前待编码PU在每个编码模式下对应的概率pk通过以下公式获取:
其中,Tu(Mu,k)为当前待编码PU的上方PU最佳编码模式为Mu时,当前待编码PU最佳编码模式为k的概率预测矩阵;Tl(Ml,k)为当前待编码PU的左方PU最佳编码模式为Ml时,当前待编码PU最佳编码模式为k的概率预测矩阵。
3.根据权利要求2所述的一种基于最优停止理论的高效视频快速编码方法,其特征在于,所述的步骤3)具体为:
3.1)依次检查各候选模式,在第k个模式停止检查,设在模式k后的下一个相对最佳目标为Tk,则Tk=j的概率为:
其中,j为自然数且j∈(k,N],Xr(r=k+1,k+2,...,j-1)表示第k+1、k+2一直到第j-1个模式在所有N个模式中被选为最佳模式的概率排名,P(Xj=1)表示第j个模式是N个模式中的最佳模式的概率;
Tk的位置由下式得到
若E(Tk)大于设定的阈值τ,τ∈[N,N+1),则当前的第k个模式为最佳编码模式;
3.2)计算最优停止点K*:
K*=max{Kα,Kβ}
式中
4.根据权利要求3所述的一种基于最优停止理论的高效视频快速编码方法,其特征在于,所述的更新参数是指根据当前的编码模式对各概率预测矩阵进行更新,更新公式如下:
T′(M,k)=T(M,k)·(1-γ)+pm·γ
其中,T(M,k)为更新前的概率预测矩阵,T′(M,k)为更新后的概率预测矩阵,γ为更新参数,pm表示在已编码PU的最佳模式为j,且满足j≤K*的前提下,模式m成为最佳模式的后验概率,由以下公式计算得到:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310297983.5A CN104301723A (zh) | 2013-07-16 | 2013-07-16 | 基于最优停止理论的高效视频快速编码方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310297983.5A CN104301723A (zh) | 2013-07-16 | 2013-07-16 | 基于最优停止理论的高效视频快速编码方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104301723A true CN104301723A (zh) | 2015-01-21 |
Family
ID=52321256
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310297983.5A Pending CN104301723A (zh) | 2013-07-16 | 2013-07-16 | 基于最优停止理论的高效视频快速编码方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104301723A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101179729A (zh) * | 2007-12-20 | 2008-05-14 | 清华大学 | 一种基于帧间模式统计分类的h.264宏块模式选择方法 |
CN102148974A (zh) * | 2010-02-04 | 2011-08-10 | 成都市世嘉电子实业有限公司 | 一种时域帧编码中的快速空域预测算法 |
CN102957932A (zh) * | 2012-11-02 | 2013-03-06 | 同济大学 | 基于最优停止理论的编码模式快速自动选择方法 |
CN102984521A (zh) * | 2012-12-12 | 2013-03-20 | 四川大学 | 基于时域相关性的高性能视频编码帧间模式判决方法 |
-
2013
- 2013-07-16 CN CN201310297983.5A patent/CN104301723A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101179729A (zh) * | 2007-12-20 | 2008-05-14 | 清华大学 | 一种基于帧间模式统计分类的h.264宏块模式选择方法 |
CN102148974A (zh) * | 2010-02-04 | 2011-08-10 | 成都市世嘉电子实业有限公司 | 一种时域帧编码中的快速空域预测算法 |
CN102957932A (zh) * | 2012-11-02 | 2013-03-06 | 同济大学 | 基于最优停止理论的编码模式快速自动选择方法 |
CN102984521A (zh) * | 2012-12-12 | 2013-03-20 | 四川大学 | 基于时域相关性的高性能视频编码帧间模式判决方法 |
Non-Patent Citations (1)
Title |
---|
TIESONG ZHAO等: "《H.264/SVC Mode Decision Based on Optimal Stopping Theory》", 《IEEE TRANSACTIONS ON IMAGE PROCESSING》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102611892B (zh) | 在编码过程中实现自适应量化的方法及装置 | |
CN103873861B (zh) | 一种用于hevc的编码模式选择方法 | |
CN103888762B (zh) | 一种基于hevc标准的视频编码框架 | |
CN107979756A (zh) | 一种视频编码***所使用的视频编码方法及装置 | |
CN105049850A (zh) | 基于感兴趣区域的hevc码率控制方法 | |
CN101895756B (zh) | 视频图像块的编码、解码、重构方法及*** | |
CN107566846B (zh) | 视频编码跳过模式决策方法、装置、设备及存储介质 | |
CN104243997B (zh) | 一种质量可分级hevc视频编码方法 | |
CN102932642B (zh) | 一种帧间编码快速模式选择方法 | |
TR201908743T4 (tr) | Hiyerarşik kodlanmış blok düzeni bilgisine göre video kodu çözme usulü. | |
CN104796705A (zh) | 一种基于ssim的hevc视频编码率失真优化与码率控制算法 | |
MX2014000165A (es) | Metodo y aparato para codificar video y metodo y aparato para decodificar video, acompañados con intra prediccion. | |
KR20110010324A (ko) | 영상의 부호화 방법 및 장치, 영상 복호화 방법 및 장치 | |
KR20110112178A (ko) | 변환 인덱스를 이용하는 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법 및 그 장치 | |
CN104954788A (zh) | Hevc帧内预测模式选择方法及装置 | |
CN105681797A (zh) | 一种基于预测残差的dvc-hevc视频转码方法 | |
CN105120282A (zh) | 一种时域依赖的码率控制比特分配方法 | |
CN103596003B (zh) | 高性能视频编码的帧间预测快速模式选择方法 | |
CN104853191A (zh) | 一种hevc的快速编码方法 | |
CN103997645A (zh) | 一种快速的hevc帧内编码单元和模式决策方法 | |
CN104767999A (zh) | 一种基于失真测量的hevc码率控制模型参数更新算法 | |
CN106412611B (zh) | 一种高效视频编码的复杂度控制方法 | |
CN104038769B (zh) | 帧内编码的码率控制方法 | |
CN110446052A (zh) | 一种3d-hevc帧内深度图快速cu深度选择方法 | |
CN105721866A (zh) | 一种编码单元划分方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20150121 |
|
RJ01 | Rejection of invention patent application after publication |