CN103546749A - 利用残差系数分布特征和贝叶斯定理优化hevc残差编码的方法 - Google Patents

利用残差系数分布特征和贝叶斯定理优化hevc残差编码的方法 Download PDF

Info

Publication number
CN103546749A
CN103546749A CN201310480055.2A CN201310480055A CN103546749A CN 103546749 A CN103546749 A CN 103546749A CN 201310480055 A CN201310480055 A CN 201310480055A CN 103546749 A CN103546749 A CN 103546749A
Authority
CN
China
Prior art keywords
residual
coding
encoding
block
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310480055.2A
Other languages
English (en)
Other versions
CN103546749B (zh
Inventor
沈礼权
赵文强
曹志明
胡乾乾
赵振军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Shanghai for Science and Technology
Original Assignee
University of Shanghai for Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Shanghai for Science and Technology filed Critical University of Shanghai for Science and Technology
Priority to CN201310480055.2A priority Critical patent/CN103546749B/zh
Publication of CN103546749A publication Critical patent/CN103546749A/zh
Application granted granted Critical
Publication of CN103546749B publication Critical patent/CN103546749B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明涉及一种利用残差系数分布特征和贝叶斯定理优化残差编码的方法。本方法的操作步骤如下:(1)按照控制文件里设定的顺序读取视频序列的每一帧图像,(2)对每帧图像的亮度和色度值进行帧内预测和帧间预测,从而求得残差系数,(3)根据残差系数对残差块TU(最大为32×32)进行纹理判定或进行贝叶斯模型判定,从而决定是否提前中止分块编码,(4)对整块TU进行DCT变换和量化,从而求得量化参数,(5)对量化系数进行熵编码,最后以比特流的形式输出。本发明在保证编码质量的损失可以忽略不计的情况下,提高了视频编码速度,更有利于视频的实时采集。

Description

利用残差系数分布特征和贝叶斯定理优化HEVC残差编码的方法
技术领域
本发明涉及高分辨率视频编码技术领域,特别是利用残差系数分布特征和贝叶斯定理优化HEVC残差编码的方法,适用于高分辨率视频编码和实时视频采集。
背景技术
近些年由于多媒体技术的迅猛发展,高清电视(HDTV),3D立体视频,视频通信等新技术已逐渐为大家所熟知,人们被带入了一个崭新的视频时代。所有这些技术在提供给人们多式多样的高质量视频享受的同时,也对视频编码技术提出了更高的要求。其中,一个最重要的特征就是相比于之前的标清二维视频这些新技术要处理更为巨大的数据量,现有的视频编码标准如H.264已经力不从心,于是具有更高压缩效率的视频编码标准HEVC应用而生。为提高编码效率HEVC采用了许多新的技术,如更大的编码块,循环递归编码结构,更多的帧内预测模式等,这些改进在提高编码效率的同时,也使得整个算法变得相当复杂,很不利于其投入实际应用。为此,如何有效地降低HEVC编码复杂度成为现今一个研究热点。
帧内预测、帧间预测在整个视频编码过程中占用了大部分的时间,成为主要研究方向,并且方法已趋于成熟。而包括整数变换、量化以及反变换和反量化的残差编码也占用了不少编码时间,一些学者对其进行了研究。其中,文献[1]在分析了HEVC残差编码块TU(Transform Unit)的树形结构和循环递归编码基础上提出了一种简便的TU提前中止方案。通过统计残差块经过整数变换和量化后的量化系数中的非零系数个数,来决定是否要中止分块编码。该方法节省的编码时间很多,但编码质量损失也比较大。
文献[2]提出的HEVC残差编码优化算法比较完善。作者首先分析了最优编码模式判定标准:率失真代价函数,然后找出整块TU及其四个子块TU在编码比特率上的相互关系,并分析了全零块类型在整块TU和其子块之间的相互推导关系。通过对比TU四个子块的率失真代价和与预设阈值的大小,实现跳过大块残差编码和中止小块残差编码。
文献[3]针对HEVC帧内预测和帧间预测的残差编码不同点,分别提出了关于帧内预测的快速编码算法和关于帧间预测的快速残差编码算法。前者在参考代码HM2.0中原有方案的基础上进一步减少帧内预测中参与率失真计算的帧内预测模式个数,但对每种模式都进行穷尽的残差树搜索,从而在降少编码时间的基础上也保证了编码质量。后者首先找出四个子TU的参数系数中的最大值和最小值并让它们作差,然后该差值与设定阈值相比较从而判定是否要提前中止分块残差编码。
            文献[1]: Kiho Choi and Euee S.Jang, “Early TU decision method for fast video encoding in high efficiency video coding,”ELECTRONICS LETTERS, Vol. 48, No. 12, 7th June,2012. 
            文献[2]: Su-Wei Teng, Hsueh-Ming Hang and Yi-Fu Chen, “Fast Mode Decision Algorithm for Residual Quadtree Coding in HEVC,” IEEE Visual Communications and Image Processing.VCIP.2011.6116062, pp. 1-4, 2011.
            文献[3]: Yih Han Tan, Chuohao Yeo, Hui Li Tan and Zhengguo Li, “On Residual  Quad-tree Coding In HEVC,” IEEE Multimedia Signal Processing, 13th International Workshop. MMSP.2011.6093805, pp. 1–4, 2011.
发明内容              
本发明的目的是针对HEVC特有的残差编码结构和技术缺陷,提供一种利用残差系数分部特征和贝叶斯定理优化HEVC残差编码的方法,在保证主观质量不变的情况下,可有效地提高视频编码速度。为达到上述目的,本发明的构思是:第一,在保证视频编码质量变化不大的前提下,利用残差系数的高斯分布特征,对残差块TU上下两个子块和左右两个子块进行两次假设检验,从而判断出当前残差块TU的内部纹理特性,以减少不必要的子块残差编码。第二,利用贝叶斯判定模型,对TU进行提前中止子块编码使得编码速度得到提高。
根据上述发明构思,本发明采用如下的技术方案:
一种利用残差系数分布特征和贝叶斯定理优化HEVC残差编码的方法,其特征在于操作步骤如下:
(1) 输入视频序列:按照控制文件里设定的顺序读取视频序列的每一帧图像,
(2) 帧内/帧间预测:对每帧图像的亮度和色度值进行帧内预测和帧间预测,从而求得残差系数,
(3) TU提前中止判定:根据残差系数对残差块TU(最大为32×32)进行纹理判定或进行贝叶斯模型判定,从而决定是否提前中止分块编码,
(4) DCT变换和量化:对整块TU进行DCT变换和量化,从而求得量化参数,
(5) 熵编码:对量化系数进行熵编码,最后以比特流的形式输出。
本发明与已有技术相比较,具有如下显而易见的突出实质性特点和显著技术进步:
1)、本HEVC视频编码优化方法在保证视频编码质量不变的同时,使得编码过程在残差编码这个子过程就能提高编码速度,实验中可以节省的残差编码时间最多为60%;
2)、本HEVC视频编码优化方案中关于残差系数分布特性的优化算法是基于假设检测的,所以可以根据实际需求通过修改显著水平实现编码质量和编码速度之间的折中;
3)、本HEVC视频编码优化方案中基于贝叶斯判定模型的优化算法选取预测误差和残差系数的均方差MAD为特征向量因子进行模式判断,而这两个值在帧内和帧间预测中就已求出,所以该优化方法不会额外地增加编码时间。
附图说明
图1是本发明中的利用残差系数分布特征和贝叶斯定理优化HEVC残差编码的方法的原理框图。
图2是Skip、帧间和帧内预测的框图。
图3是基于残差系数分布特征算法框图。
图4是TU的结构框图。
图5是在不同CU、PU以及帧间和帧内预测时,可用于残差编码的TU类型。
图6是熵编码示意框图。
图 7a是分辨率为832×480 的测试序列RaceHorses在基于残差系数分布特征的优化算法下的RD曲线图。
图7b是分辨率为1280×720的测试序列vidvo1在基于残差系数分布特征的优化算法下的RD曲线图。
图8是基于残差系数分布特征优化算法与HM5.0中原始方法相比较的实验结果,主要参数包括:亮度的PSNR,比特率以及残差编码时间。
图 9a是分辨率为832×480 的测试序列RaceHorses在基于贝叶斯判定模型的优化算法下的RD曲线图。
图9b是分辨率为1280×720的测试序列vidvo1在基于贝叶斯判定模型的优化算法下的RD曲线图。
图10是基于贝叶斯判定模型优化算法与HM5.0中原始方法相比较的实验结果,主要参数包括:亮度的PSNR,比特率以及残差编码时间。
具体实施方式
以下结合附图对本发明的优选实施例作进一步的详细说明:
实施例一:
利用残差块系数的分布特征和贝叶斯定理优化HEVC残差编码的方法(参见图1)包括以下步骤:
(1) 输入视频序列:按照控制文件里设定的顺序读取视频序列的每一帧图像,
(2) 帧内/帧间:对每帧图像的亮度和色度值进行帧内预测和帧间预测,从而求得残差
系数,
(3) TU提前中止判定:根据残差系数对残差块TU(最大为32×32)进行纹理判定或
进行贝叶斯模型判定,从而决定是否提前中止分块编码,
(4) DCT变换和量化:对整块TU进行DCT变换和量化,从而求得量化参数,
(5) 熵编码:对量化系数进行熵编码,最后以比特流的形式输出。
实施例二:本实施例与实施例一基本相同,特别之处如下:(见图2至图10)
上述步骤(2)是对输入视频序列进行帧内和帧间预测,参见图2,其具体步骤如下:
(2-1)帧内预测是利用编码块周围(左边和上边)已编码参考像素对当前块进行预测从而消除视频图像在空间上的冗余;帧间预测通过参考编码块所在帧的前后帧对其进行运动估计和运动补偿从而消除视频序列的时间冗余。HEVC按照率失真最优的判定标准从多个帧内和帧间候选模式中选出最优的帧内和帧间预测模式。率失真代价函数为:
                                                 
Figure 2013104800552100002DEST_PATH_IMAGE001
                             (1)
其中
Figure 148225DEST_PATH_IMAGE002
为率失真代价值,为预测失真值,
Figure 485665DEST_PATH_IMAGE004
为在不同预测模式下输出的比特数,
Figure 2013104800552100002DEST_PATH_IMAGE005
为拉格朗日参数。
(2-2)与之前的视频编码标准H.264不同,为提高编码效率,HEVC采用更大的编码块(64×64),循环递归的编码方式,帧内预测模式增加到35种,这些改进在提高编码效率的同时也使得帧内和帧间预测变得更为复杂。
(2-3)若输入的是I帧,则只对其进行帧内预测并进行率失真优化;若为P帧或B帧,则先对其进行Skip模式预测和帧间预测,然后再进行帧内预测。最后按率失真优化标准从三种模式中选出最优的预测模式。
上述步骤(3)对残差块的系数进行判定的方法有两种,具体步骤如下:
(3-1)基于高斯分布的假设检验法
由相关文献研究可知,残差系数服从期望值为零的高斯分布,即满足以下表达式:
                                                                     (2)
其中
Figure 2013104800552100002DEST_PATH_IMAGE007
为均值,
Figure 526620DEST_PATH_IMAGE008
为方差。
为判断整块TU是否适合划分成四个子TU可以把整块TU分为两种划分方式,如图3所示。如果两种划分方式都满足,则可认为TU适合分成四个子TU。如果采用图3中的划分方式编码效果较好,则残差系数应该服从高斯分布,由于服从同一分布则两个部分的期望值
Figure 2013104800552100002DEST_PATH_IMAGE009
应该没有显著性差别。因此,我们可以通过假设检验判断该模式的预测效果,根据概率论的知识得到:
Figure 255541DEST_PATH_IMAGE010
                        (3)
上式中
Figure 334356DEST_PATH_IMAGE012
分布为学生氏分布,
Figure 2013104800552100002DEST_PATH_IMAGE013
是该分布的自由度,
Figure 396115DEST_PATH_IMAGE014
,
Figure DEST_PATH_IMAGE015
是每种划分方式中两部分像素亮度的均值,
Figure 167762DEST_PATH_IMAGE016
是两个部分各自的数学期望值,上式中
Figure 180717DEST_PATH_IMAGE018
如下:
                        
Figure DEST_PATH_IMAGE019
                         (4)
很显然,把一个32×32宏块分成相等的两个部分,则两个部分的像素数目应该相等,即:
Figure 63222DEST_PATH_IMAGE020
。根据假设检验应满足,同时取显著性水平=0.05,查t分布表可以得到
Figure DEST_PATH_IMAGE021
,则我们可以得到如下结论:
                      
Figure 478023DEST_PATH_IMAGE022
                 (5)
上式等价于:
           
Figure DEST_PATH_IMAGE023
           (6)
上式是针对32×32的TU计算的。在HEVC残差编码中TU采用和CU类似的四叉树编码结构,即除了32×32还要对其子块16×16、8×8以及4×4进行遍历式编码,然后从所有模式中选出最优模式,为此我们可以对16×16和8×8的TU进行与32×32类似的处理,从而得到
                   (7)
         
Figure DEST_PATH_IMAGE025
          (8)
上述三个式子分别是计算32×32、16×16和8×8块的判断条件。如果满足式(6)可以认为32×32TU中的该种划分没有显著区别,如果满足式(7)、(8)则可以认为16×16、8×8TU中的该种划分没有显著区别。残差系数和编码模式有关,为了计算的简单,我们只。基于以上分析,本文提出的处理步骤如下:       
1)首先,采用对32×32的整块TU进行残差编码。 
2)当按照图3中所示的两种划分方式都没有显著区别时,跳转3);否则,TU深度加1,并返回1)。
 3)对整块TU进行分块残差编码。
(3-2)基于贝叶斯理论的判定算法
某一尺寸的TU进行分块编码和不分块编码是两件完全对立的事件,将TU分块编码这一事件定义为,而TU不进行分块编码定义为
Figure DEST_PATH_IMAGE027
。TU的向量特征
Figure 341440DEST_PATH_IMAGE028
用来帮助提高分类的准确性。是TU特征向量为F时被划分为
Figure 814010DEST_PATH_IMAGE030
类的后验概率。在残差编码过程中,如果做出错误的决定,即本来应该分块编码的实际上没分块编码,而本来不应该分块的却分块编码了,这将会造成率失真损失。我们把本应该分块而实际却没分块造成的损失标记为
Figure DEST_PATH_IMAGE031
,而本来不应该分块实际上却分块了所造成的损失标记为。他们之间具有以下关系:
                           
Figure DEST_PATH_IMAGE033
                           (9)
                            
Figure 413542DEST_PATH_IMAGE034
                             (10)
其中,
Figure DEST_PATH_IMAGE035
Figure 700167DEST_PATH_IMAGE036
是当TU进行分块编码和不分块编码时所产生的率失真代价。由上述公式可知当TU做出正确选择时,即本应分块编码事实上也分块了或者本应该不分块实际上也确实没分块,将不会造成任何率失真损失,因此
Figure DEST_PATH_IMAGE037
。基于以上分析可以得出情况
Figure 761664DEST_PATH_IMAGE038
时的贝叶斯风险代价
Figure DEST_PATH_IMAGE039
             
Figure 108331DEST_PATH_IMAGE040
             (11)
                           (12)
    当<
Figure DEST_PATH_IMAGE043
时,选择
Figure 611174DEST_PATH_IMAGE027
造成的代价较小,应中止对TU进行分块编码。而当
Figure 792756DEST_PATH_IMAGE042
>
Figure 982429DEST_PATH_IMAGE043
时,选择
Figure 882252DEST_PATH_IMAGE026
造成的代价较小,应按照原有算法对TU进行分块编码。上式中:
                       
Figure 12145DEST_PATH_IMAGE044
                      (13)
其中
Figure DEST_PATH_IMAGE045
表示TU进行Splite和None-Splite编码时,其特征向量F的概率密度分布函数,
Figure 313813DEST_PATH_IMAGE046
是情况Splite和None-Splite的先验概率密度函数。由式(11)、(12)和(13)可以求出对TU是否进行分块编码的判定公式如下:
                       
Figure DEST_PATH_IMAGE047
                     (14)
为有效地预测出的概率分布,本文中将残差块系数的均方差MAD和以及当前TU块的预测误差作为向量特征F的要素。按照D.Chai等人提出的非参数密度估计法求得条件概率密度函数
Figure 674387DEST_PATH_IMAGE045
并放在一个查询表中。为减小统计工作量,可将两个特征向量要素量化成10等分,这样整个特征向量F将被分成100个刻度。而(14)式中不等式左边判定阈值中的
Figure 123823DEST_PATH_IMAGE031
Figure 493624DEST_PATH_IMAGE032
Figure 384220DEST_PATH_IMAGE048
Figure DEST_PATH_IMAGE049
与视频的分辨率、QP大小以及TU的深度均有关。因此,本文事先对一组不同分辨率的视频序列在不同的QP下进行统计,从而求出在不同分变率、不同QP和不同TU深度下的判定阈值,并将这些阈值放在另外一个查询表中。
综上所述,基于贝叶斯理论的TU类型判定方法包括以下几个步骤:
1)对(14)式中不等式右边的判定门限进行初始化,从而获得能够对视频分辨率和
QP自适应变化的判定阈值。
2)对一个TU块从其根节点(即32×32)开始,对整块TU进行残差编码。求出编码误差和残差系数的MAD.
3) 由整块编码误差和残差系数的MAD查表找出TU的向量特征F概率分布函数
Figure DEST_PATH_IMAGE051
。按(14)式进行判定,若不等式满足要求,跳到(4)。否则,TU分成四个相同子TU,深度Depth加1,转到(2)。
4)按逐行扫描顺序对下一TU进行同样处理。
上述步骤(4)对残差数据进行整数变换(DCT)和量化,其具体步骤如下:
(4-1)HEVC进行整数变换和量化时TU的编码结构如图4所示,TU的最大尺寸为32×32,最小尺寸为4×4,类似于CU的四叉树结构。
(4-2)针对不同的CU、PU、帧内以及帧间预测,TU有不同的可用类型,如图5所示。其中,红色斜体表示帧内预测时可用的TU,而表中所列所有模式都可在帧间预测时运用。 
上述步骤(5)对经过残差编码得到的量化系数进行熵编码,最终形成二进制比特流以
便于在网络中传输。参见图7,其具体步骤如下:
(5-1)对量化系数进行可变长熵编码(VLC)或算术编码(CABAC),从而消除量化系数的符号冗余,实现对视频序列的进一步压缩。
(5-2)经熵编码的数据最终以比特流的形式输出。通过相关码率控制技术可实现比特率的自适应改变,这大大提高了HEVC编码器的网络友好性。
为验证本文提出的基于残差系数分布特性和基于贝叶斯理论的两种快速残差块类型判
定方法的有效性,下面对对大量测试序列进行了仿真实验。实验平台(PC机)配置为:Intel Core2 Duo CPU, 2.53 GHz,1G Internal Memory,Windows XP Operation System;标准校验模型为HEVC标准参考代码HM 5.0;采用亮度色度分开编码方式(本文只对亮度进行了优化);仿真实验对分辨率为416×240、832×480、1280×720和1920×1080的测试序列的前20帧进行统计,其中BASIC QP设为22,27,32,37;编解码预测结构选用HHI-IPPP。
基于残差系数分布特性的方法(Proposed A)实验结果如图7a~7b、图8所示。图7a、7b分别是分辨率为832×480和1280×720的视频序列PartyScene和vidyo1在HM5.0原始残差编码方法和Proposed A两种方法下的RD曲线图。可以看出图7a和图7b中两条曲线几乎完全重合,这说明本发明中基于参数系数分布特性的方法的编码质量几乎与HM5.0中原始方法相同。图8是HEVC原始残差编码和Proposed A两种方法在不同QP的情况下对不同分辨率的视频序列进行测试的结果,主要指标有DPSNR、DBR和DTime,各自定义为:
             
Figure 852428DEST_PATH_IMAGE052
                    (15)
             
Figure DEST_PATH_IMAGE053
                      (16)
             
Figure 25920DEST_PATH_IMAGE054
                  (17)
其中,PSNR为峰值信噪比,BR为视频编码比特率,Time为残差编码时间。可以看出在保证编码质量不变的情况下(编码比特率平均降低0.15%,亮度的PSNR平均降低0.024dB),本发明中的优化方法残差编码时间平均降低了约42%。
基于贝叶斯理论的快速残差编码方法(Proposed B)实验结果如图9a~9b、图10所示。图9a、9b分别是分辨率为832×480和1280×720的视频序列PartyScene和vidyo1在HM5.0原始残差编码方法和Proposed B两种方法下的RD曲线图。可以看出图9a和图9b中两条曲线几乎完全重合,这说明本发明中基于贝叶斯判定理论的方法的编码质量几乎与HM5.0中原始方法相同。图10是HEVC原始残差编码和Proposed B两种方法在不同QP的情况下对不同分辨率的视频序列进行测试的结果,主要指标与图8中的完全一样。可以看出保持编码质量不变的情况下(编码比特率平均增加0.3%,亮度的PSNR平均降低0.02dB),本发明中的优化方法残差编码时间平均降低了约40%。
由上述各图表可以看出,本发明通过对残差块系数进行假设检验,以及利用贝叶斯理论对残参考块TU进行提前中止判断,从而减少DCT变换和量化过程的编码时间,在编码质量损失可以忽略不计的情况下,大幅降低了HEVC残差编码的时间。 

Claims (5)

1.一种利用残差系数分布特征和贝叶斯定理优化HEVC残差编码的方法,其特征在于:
(1) 输入视频序列:按照控制文件里设定的顺序读取视频序列的每一帧图像;
(2) 帧内/帧间预测:对每帧图像的亮度和色度值进行帧内预测和帧间预测,从而求得残差系数;
(3) TU提前中止判定:根据残差系数对残差块TU (Transform Unit)(最大为32×32)进行纹理判定或进行贝叶斯模型判定,从而决定是否提前中止分块编码;
(4) DCT变换和量化:对整块TU进行DCT变换和量化,从而求得量化参数;
(5) 熵编码:对量化系数进行熵编码,最后以比特流的形式输出。
2.根据权利要求1所述的利用残差系数分布特征和贝叶斯定理优化HEVC残差编码的方法,其特征在于所述步骤(2)帧内/帧间预测的具体步骤如下:
(2-1)帧内预测是利用编码块左边和上边已编码参考像素对当前块进行预测从而消除视频图像在空间上的冗余;帧间预测通过参考编码块所在帧的前后帧对其进行运动估计和运动补偿从而消除视频序列的时间冗余;HEVC按照率失真最优的判定标准从多个帧内和帧间候选模式中选出最优的帧内和帧间预测模式;率失真代价函数为:
                                                  
Figure 2013104800552100001DEST_PATH_IMAGE002
                             (1)
其中为率失真代价值,
Figure 2013104800552100001DEST_PATH_IMAGE006
为预测失真值,
Figure 2013104800552100001DEST_PATH_IMAGE008
为在不同预测模式下输出的比特数,
Figure 2013104800552100001DEST_PATH_IMAGE010
为拉格朗日参数;
(2-2)与之前的视频编码标准H.264不同,为提高编码效率,HEVC采用更大的编码块(64×64),循环递归的编码方式,帧内预测模式增加到35种,这些改进在提高编码效率的同时也使得帧内和帧间预测变得更为复杂;
(2-3)若输入的是I帧,则只对其进行帧内预测并进行率失真优化;若为P帧或B帧,则先对其进行Skip模式预测和帧间预测,然后再进行帧内预测。最后按率失真优化标准从三种模式中选出最优的预测模式。
3.根据权利要求1所述的利用残差系数分布特征和贝叶斯定理优化HEVC残差编码的方法,其特征在于所述步骤(3)TU提前中止判定的具体步骤如下:
① 基于高斯分布的假设检验法
由相关文献研究可知,残差系数服从期望值为零的高斯分布,即满足以下表达式:
                                                                   (2)
其中
Figure DEST_PATH_IMAGE014
表示残差系数,为均值,
Figure DEST_PATH_IMAGE018
为方差, 
Figure DEST_PATH_IMAGE020
表示高斯分布;
为判断整块TU是否适合划分成四个子TU可以把整块TU分为两种划分方式,如图3所示。如果两种划分方式都满足,则可认为TU适合分成四个子TU。如果采用图3中的划分方式编码效果较好,则残差系数应该服从高斯分布,由于服从同一分布则两个部分的期望值
Figure DEST_PATH_IMAGE022
应该没有显著性差别。因此,可以通过假设检验判断该模式的预测效果,根据概率论的知识得到:
                                    (3)
上式中
Figure DEST_PATH_IMAGE026
Figure DEST_PATH_IMAGE028
分别表示图3中A和B两个子块中残差系数的个数,
Figure DEST_PATH_IMAGE030
分布为学生氏分布,
Figure DEST_PATH_IMAGE032
是该分布的自由度,
Figure DEST_PATH_IMAGE034
,
Figure DEST_PATH_IMAGE036
是每种划分方式中两部分像素亮度的均值,
Figure DEST_PATH_IMAGE038
Figure DEST_PATH_IMAGE040
是两个部分各自的数学期望值,上式中
Figure DEST_PATH_IMAGE042
如下:
                          
Figure DEST_PATH_IMAGE044
                         (4)
上式中
Figure DEST_PATH_IMAGE046
分别表示图3中A和B两个子块中残差系数的值;很显然,把一个32×32宏块分成相等的两个部分,则两个部分的像素数目应该相等,即:
Figure DEST_PATH_IMAGE050
,根据假设检验应满足,同时取显著性水平=0.05,查t分布表可以得到
Figure DEST_PATH_IMAGE052
,则得到如下结论:
                       
Figure DEST_PATH_IMAGE054
                 (5)
上式等价于:
            
Figure DEST_PATH_IMAGE056
           (6)
上式是针对32×32的TU计算的;在HEVC残差编码中残差块TU采用和编码块CU(Coding Unit)类似的四叉树编码结构,即除了32×32还要对其子块16×16、8×8以及4×4进行遍历式编码,然后从所有模式中选出最优模式,为此我们可以对16×16和8×8的TU进行与32×32类似的处理,从而得到
           
Figure DEST_PATH_IMAGE058
         (7)
          
Figure DEST_PATH_IMAGE060
          (8)
上述三个式子分别是计算32×32、16×16和8×8块的判断条件。如果满足式(6)可以认为32×32TU中的该种划分没有显著区别,如果满足式(7)、(8)则可以认为16×16、8×8TU中的该种划分没有显著区别。残差系数和编码模式有关,为了计算的简单,基于以上分析的处理步骤如下:       
1)首先,采用对32×32的整块TU进行残差编码;
2)当基于残差系数分部特征算法的两种划分方式都没有显著区别时,跳转3);否则,TU深度加1,并返回1);
 3)对整块TU进行分块残差编码。
② 基于贝叶斯理论的判定算法
某一尺寸的TU进行分块编码和不分块编码是两件完全对立的事件,将TU分块编码这一事件定义为,而TU不进行分块编码定义为;TU的向量特征
Figure DEST_PATH_IMAGE066
用来帮助提高分类的准确性,其中等表示与TU是否分块关系密切的一些特征值;
Figure DEST_PATH_IMAGE070
是TU特征向量为F时被划分为
Figure DEST_PATH_IMAGE072
类的后验概率;在残差编码过程中,如果做出错误的决定,即本来应该分块编码的实际上没分块编码,而本来不应该分块的却分块编码了,这将会造成率失真损失;我们把本应该分块而实际却没分块造成的损失标记为
Figure DEST_PATH_IMAGE074
,而本来不应该分块实际上却分块了所造成的损失标记为;他们之间具有以下关系:
                            
Figure DEST_PATH_IMAGE078
                           (9)
                             
Figure DEST_PATH_IMAGE080
                             (10)
其中,
Figure DEST_PATH_IMAGE082
Figure DEST_PATH_IMAGE084
是当TU进行分块编码和不分块编码时所产生的率失真代价;由上述公式可知当TU做出正确选择时,即本应分块编码事实上也分块了或者本应该不分块实际上也确实没分块,将不会造成任何率失真损失,因此
Figure DEST_PATH_IMAGE086
均为0。基于以上分析可以得出情况
Figure DEST_PATH_IMAGE090
时的贝叶斯风险代价
Figure DEST_PATH_IMAGE092
                           (11)
               
Figure DEST_PATH_IMAGE096
             (12)
    当
Figure DEST_PATH_IMAGE098
<
Figure DEST_PATH_IMAGE100
时,选择造成的代价较小,应中止对TU进行分块编码;而当
Figure 107566DEST_PATH_IMAGE098
>
Figure 824987DEST_PATH_IMAGE100
时,选择
Figure 220196DEST_PATH_IMAGE062
造成的代价较小,应按照原有算法对TU进行分块编码;上式中:
                        
Figure DEST_PATH_IMAGE102
                      (13)
其中
Figure DEST_PATH_IMAGE104
表示TU进行Splite和None-Splite编码时,其特征向量F的概率密度分布函数,
Figure DEST_PATH_IMAGE106
是情况Splite和None-Splite的先验概率密度函数;由式(11)、(12)和(13)可以求出对TU是否进行分块编码的判定公式如下:
                        
Figure DEST_PATH_IMAGE108
                     (14)
为有效地预测出的概率分布,本文中将残差块系数的均方差MAD和以及当前TU块的预测误差作为向量特征F的要素;按照D.Chai等人提出的非参数密度估计法求得条件概率密度函数
Figure 494224DEST_PATH_IMAGE104
并放在一个查询表中;为减小统计工作量,可将两个特征向量要素量化成10等分,这样整个特征向量F将被分成100个刻度。而(14)式中不等式左边判定阈值中的
Figure 316687DEST_PATH_IMAGE074
Figure DEST_PATH_IMAGE110
Figure DEST_PATH_IMAGE112
与视频的分辨率、量化参数QP(Quantization Parameter)的大小以及TU的深度均有关;因此,事先对一组不同分辨率的视频序列在不同的QP下进行统计,从而求出在不同分变率、不同QP和不同TU深度下的判定阈值,并将这些阈值放在另外一个查询表中。
综上所述,基于贝叶斯理论的TU类型判定方法包括以下几个步骤:
1)对(14)式中不等式右边的判定门限进行初始化,从而获得能够对视频分辨率和
QP自适应变化的判定阈值;
2)对一个TU块从其根节点(即32×32)开始,对整块TU进行残差编码,求出编码误差和残差系数的MAD;
3) 由整块编码误差和残差系数的MAD查表找出TU的向量特征F概率分布函数
Figure DEST_PATH_IMAGE114
Figure DEST_PATH_IMAGE116
;按(14)式进行判定,若不等式满足要求,跳到(4);否则,TU分成四个相同子TU,深度Depth加1,转到(2);
4)按逐行扫描顺序对下一TU进行同样处理。
4.根据权利要求1所述的利用残差系数分布特征和贝叶斯定理优化HEVC残差编码的方法,其特征在于:所述步骤(4)DCT变换和量化的具体步骤如下:
① HEVC进行整数变换和量化时,TU的最大尺寸为32×32,最小尺寸为4×4,类似于CU的四叉树结构;
② 针对不同的CU、PU、帧内以及帧间预测,TU有不同的可用类型。
5.根据权利要求1所述的利用残差系数分布特征和贝叶斯定理优化HEVC残差编码的方法,其特征在于:所述步骤(4)熵编码的具体步骤如下:
① 对量化系数进行可变长熵编码(VLC)或算术编码(CABAC),从而消除量化系数的符号冗余,实现对视频序列的进一步压缩;
② 经熵编码的数据最终以比特流的形式输出;通过相关码率控制技术可实现比特率的自适应改变,这大大提高了HEVC编码器的网络友好性。
CN201310480055.2A 2013-10-14 2013-10-14 利用残差系数分布特征和贝叶斯定理优化hevc残差编码的方法 Expired - Fee Related CN103546749B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310480055.2A CN103546749B (zh) 2013-10-14 2013-10-14 利用残差系数分布特征和贝叶斯定理优化hevc残差编码的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310480055.2A CN103546749B (zh) 2013-10-14 2013-10-14 利用残差系数分布特征和贝叶斯定理优化hevc残差编码的方法

Publications (2)

Publication Number Publication Date
CN103546749A true CN103546749A (zh) 2014-01-29
CN103546749B CN103546749B (zh) 2017-05-10

Family

ID=49969744

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310480055.2A Expired - Fee Related CN103546749B (zh) 2013-10-14 2013-10-14 利用残差系数分布特征和贝叶斯定理优化hevc残差编码的方法

Country Status (1)

Country Link
CN (1) CN103546749B (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103873866A (zh) * 2014-03-18 2014-06-18 天津大学 多视点立体视频在丢包网络中的GGoP级失真递归方法
CN104038760A (zh) * 2014-06-13 2014-09-10 南京理工大学 一种3d视频深度图像帧内楔形分割模式选择方法及***
CN104079937A (zh) * 2014-07-16 2014-10-01 山东大学 一种基于运动矢量分析的由h.264到hevc的快速帧间转码方法及转码装置
CN105681797A (zh) * 2016-01-12 2016-06-15 四川大学 一种基于预测残差的dvc-hevc视频转码方法
WO2018076827A1 (zh) * 2016-10-26 2018-05-03 北京大学深圳研究生院 视频编码中帧内编码的码率估计方法
CN109168002A (zh) * 2018-07-26 2019-01-08 西安电子科技大学 基于压缩感知和卷积神经网络的视频信号测量域估计方法
CN109743575A (zh) * 2018-12-05 2019-05-10 四川大学 一种基于朴素贝叶斯的dvc-hevc视频转码方法
CN110234011A (zh) * 2019-04-19 2019-09-13 网宿科技股份有限公司 一种视频压缩方法及***
CN110430011A (zh) * 2019-07-09 2019-11-08 武汉大学 基于规则变量节点度分布的bats码编码方法
CN110913215A (zh) * 2019-12-03 2020-03-24 北京数码视讯软件技术发展有限公司 一种预测模式的选择方法及装置、可读存储介质
WO2020244022A1 (zh) * 2019-06-03 2020-12-10 Tcl华星光电技术有限公司 补偿表压缩方法、显示器制造设备和存储器
CN113301347A (zh) * 2021-05-08 2021-08-24 广东工业大学 一种hevc高清视频编码的优化方法
CN115278235A (zh) * 2022-09-27 2022-11-01 北京达佳互联信息技术有限公司 视频编码方法、装置、电子设备及存储介质
CN117294861A (zh) * 2023-11-24 2023-12-26 淘宝(中国)软件有限公司 一种基于帧间预测的编码块划分方法及编码器

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1674677A (zh) * 2005-04-21 2005-09-28 上海大学 改进的fgs视频编码方法及其编解码器
CN101106695A (zh) * 2007-03-29 2008-01-16 上海大学 基于h.264实时精细粒度可伸缩编码方法
EP2063645B1 (en) * 2007-11-20 2011-02-16 Kabushiki Kaisha Toshiba Coding apparatus, coding method, and coding system

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1674677A (zh) * 2005-04-21 2005-09-28 上海大学 改进的fgs视频编码方法及其编解码器
CN101106695A (zh) * 2007-03-29 2008-01-16 上海大学 基于h.264实时精细粒度可伸缩编码方法
EP2063645B1 (en) * 2007-11-20 2011-02-16 Kabushiki Kaisha Toshiba Coding apparatus, coding method, and coding system

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103873866A (zh) * 2014-03-18 2014-06-18 天津大学 多视点立体视频在丢包网络中的GGoP级失真递归方法
CN104038760A (zh) * 2014-06-13 2014-09-10 南京理工大学 一种3d视频深度图像帧内楔形分割模式选择方法及***
CN104038760B (zh) * 2014-06-13 2017-03-15 南京理工大学 一种3d视频深度图像帧内楔形分割模式选择方法及***
CN104079937A (zh) * 2014-07-16 2014-10-01 山东大学 一种基于运动矢量分析的由h.264到hevc的快速帧间转码方法及转码装置
CN104079937B (zh) * 2014-07-16 2017-06-23 山东大学 一种基于运动矢量分析的由h.264到hevc的快速帧间转码方法及转码装置
CN105681797A (zh) * 2016-01-12 2016-06-15 四川大学 一种基于预测残差的dvc-hevc视频转码方法
CN105681797B (zh) * 2016-01-12 2018-09-04 四川大学 一种基于预测残差的dvc-hevc视频转码方法
US10917646B2 (en) 2016-10-26 2021-02-09 Peking University Shenzhen Graduate School Intra code-rate predicting with rate distortion optimization method in video coding
WO2018076827A1 (zh) * 2016-10-26 2018-05-03 北京大学深圳研究生院 视频编码中帧内编码的码率估计方法
CN109168002A (zh) * 2018-07-26 2019-01-08 西安电子科技大学 基于压缩感知和卷积神经网络的视频信号测量域估计方法
CN109743575A (zh) * 2018-12-05 2019-05-10 四川大学 一种基于朴素贝叶斯的dvc-hevc视频转码方法
CN110234011A (zh) * 2019-04-19 2019-09-13 网宿科技股份有限公司 一种视频压缩方法及***
CN110234011B (zh) * 2019-04-19 2021-09-24 网宿科技股份有限公司 一种视频压缩方法及***
WO2020244022A1 (zh) * 2019-06-03 2020-12-10 Tcl华星光电技术有限公司 补偿表压缩方法、显示器制造设备和存储器
CN110430011A (zh) * 2019-07-09 2019-11-08 武汉大学 基于规则变量节点度分布的bats码编码方法
CN110913215A (zh) * 2019-12-03 2020-03-24 北京数码视讯软件技术发展有限公司 一种预测模式的选择方法及装置、可读存储介质
CN110913215B (zh) * 2019-12-03 2022-04-12 北京数码视讯软件技术发展有限公司 一种预测模式的选择方法及装置、可读存储介质
CN113301347A (zh) * 2021-05-08 2021-08-24 广东工业大学 一种hevc高清视频编码的优化方法
CN113301347B (zh) * 2021-05-08 2023-05-05 广东工业大学 一种hevc高清视频编码的优化方法
CN115278235A (zh) * 2022-09-27 2022-11-01 北京达佳互联信息技术有限公司 视频编码方法、装置、电子设备及存储介质
CN115278235B (zh) * 2022-09-27 2023-01-20 北京达佳互联信息技术有限公司 视频编码方法、装置、电子设备及存储介质
CN117294861A (zh) * 2023-11-24 2023-12-26 淘宝(中国)软件有限公司 一种基于帧间预测的编码块划分方法及编码器
CN117294861B (zh) * 2023-11-24 2024-03-22 淘宝(中国)软件有限公司 一种基于帧间预测的编码块划分方法及编码器

Also Published As

Publication number Publication date
CN103546749B (zh) 2017-05-10

Similar Documents

Publication Publication Date Title
CN103546749A (zh) 利用残差系数分布特征和贝叶斯定理优化hevc残差编码的方法
CN105049850B (zh) 基于感兴趣区域的hevc码率控制方法
CN100488254C (zh) 一种基于上下文的熵编码方法及解码方法
CN102065298B (zh) 高性能宏块编码实现方法
CN106937116B (zh) 基于随机训练集自适应学习的低复杂度视频编码方法
CN106170092A (zh) 用于无损编码的快速编码方法
CN108989802B (zh) 一种利用帧间关系的hevc视频流的质量估计方法及***
CN104067617A (zh) 用于对图像进行编码/解码的方法及装置
US10554965B2 (en) Motion-compensated partitioning
CN103581647A (zh) 一种基于彩***运动矢量的深度图序列分形编码方法
CN112738511B (zh) 一种结合视频分析的快速模式决策方法及装置
CN104853191B (zh) 一种hevc的快速编码方法
CN106791848B (zh) 一种基于HEVC的Two-Pass码率控制方法
CN104038764A (zh) 一种h.264到h.265的视频转码方法及转码器
CN104320657A (zh) Hevc无损视频编码的预测模式选择方法及相应的编码方法
CN103546758A (zh) 一种快速深度图序列帧间模式选择分形编码方法
CN104601992B (zh) 基于贝叶斯最小风险决策的skip模式快速选择方法
CN106412611B (zh) 一种高效视频编码的复杂度控制方法
CN103442229B (zh) 适用于hevc标准的编码器中sao模式判决的比特率估计方法
CN103384327A (zh) 基于自适应阈值的avs快速模式选择算法
CN104333755B (zh) HEVC中B帧的基于SKIP/Merge RD Cost的CU提前终止方法
CN106888379B (zh) 应用于h.264到hevc的帧间快速视频转码方法
CN103747272B (zh) 用于hevc的残余四叉树编码的快速变换方法
CN104702959A (zh) 一种视频编码的帧内预测方法及***
CN101179729A (zh) 一种基于帧间模式统计分类的h.264宏块模式选择方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170510