CN107580224B - 一种面向hevc熵编码的自适应扫描方法 - Google Patents

一种面向hevc熵编码的自适应扫描方法 Download PDF

Info

Publication number
CN107580224B
CN107580224B CN201710671930.3A CN201710671930A CN107580224B CN 107580224 B CN107580224 B CN 107580224B CN 201710671930 A CN201710671930 A CN 201710671930A CN 107580224 B CN107580224 B CN 107580224B
Authority
CN
China
Prior art keywords
coeff
sig
flag
syntactic element
entropy coding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201710671930.3A
Other languages
English (en)
Other versions
CN107580224A (zh
Inventor
李维
张二虎
赵凡
范彩霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian University of Technology
Original Assignee
Xian University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian University of Technology filed Critical Xian University of Technology
Priority to CN201710671930.3A priority Critical patent/CN107580224B/zh
Publication of CN107580224A publication Critical patent/CN107580224A/zh
Application granted granted Critical
Publication of CN107580224B publication Critical patent/CN107580224B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开了一种面向HEVC熵编码的自适应扫描方法,具体为:首先对TU中最后一个非零系数位置相关的语法元素进行自适应扫描及熵编码;然后确定TU中每一个子块的语法元素CSBF以及子块内每一个系数位置上的语法元素sig_coeff_flag;分别计算CSBF值和sig_coeff_flag值等于最小概率符号LPS的预测概率,并分别进行排序、扫描、编码;最后对TU中所有非零系数幅值相关语法元素的自适应扫描及熵编码。本发明自适应扫描方法,使得符号间的相关性被HEVC充分的利用,进一步提升编码效率;无需为解码端多传输额外码流信息;且具有较低的编码复杂度,仅为现有算法的0.33%。

Description

一种面向HEVC熵编码的自适应扫描方法
技术领域
本发明属于视频编码技术领域,涉及一种面向HEVC熵编码的自适应扫描方法。
背景技术
视频能够给用户带来更为生动的主观感受,其已逐步渗透到我们生活的各个角落。随着“高分辨率、高帧率、高像素位深”这样高清/超高清视频的出现,越来越多的用户参与到相关视频业务中,身临其境地感受着高清/超高清视频所带来的独特魅力。然而庞大的视频数据量不仅增加了视频存储***和全球通信网络的负担,也影响了新业务的部署与实际应用。因此新一代视频编码标准HEVC(High Efficiency Video Coding,高效视频编码)以预测编码、变换编码、熵编码为基础,结合人类视觉特性,尽可能地去除空域、时域上的视觉冗余来满足存储带宽或传输带宽。
HEVC仍然沿用了传统的基于块的混合编码结构,主要有帧内/帧间预测,变换,量化,熵编码,去块效应滤波等几个模块。与以前的编码标准相比,HEVC也引入了一些新的编码技术:基于四叉树结构的块表示,统一的方向性帧内预测,先进的运动矢量预测,大尺寸的离散余弦变换,自适应扫描,性能更好的上下文自适应二元算术编码,样点自适应补偿滤波等。
在描述预测残差上,HEVC采用了基于四叉树分割结构的TU(Transform unit,变换单元)模式,TU可选的尺寸有4×4,8×8,16×16,32×32。经过自适应扫描技术,TU内一个二维的预测残差被映射到一维数组中以实现后续的熵编码操作。其中自适应扫描技术作为HEVC的关键一步,直接影响着最终编码比特率的大小。依据率失真优化原理,在给定视频重构质量的前提下,应保证自适应扫描技术得到的一维系数的最终编码比特数最少。
Zigzag扫描技术被广泛应用到视频编码中,帧内/帧间块中的残差系数以固定的扫描顺序被映射到一维数组中(见Wiegand T.,Sullivan G.,Bjontegaard G.,LuthraA..Overview of the H.264/AVC video coding standard[J].IEEE Trans.CircuitsSyst.Video Technol.,2003)。Fouak等人将Zigzag扫描方式、水平扫描方式、垂直扫描方式和Hibert扫描方式结合在一起,建立了一种新的扫描方法(Fouak F.,Benzid R.,Benoudjit N..Color image compression algorithm based onthe DCT transformcombined to an adaptive block scanning[J].Int.J.Electron.Commun.,2011)。由于对角扫描能够较好的降低数据冗余信息,Sole等人提出用对角扫描取代Zigzag扫描,结合水平扫描和垂直扫描,得出一种新的自适应扫描方法,并且将该方法应用到了HEVC编码中(Sole J.,Joshi R.,Nguyen N..Transform coefficient coding in HEVC[J].IEEETrans.Circuits Syst.Video Technol.,2012)。上述方法考虑了预测参数系数的分布特性,一定程度上改善了编码效率。但由于扫描模型比较固定,忽略了后续熵编码的特性,其限制了编码性能的进一步提升。因此在对TU层的预测残差进行编码时,建立适于HEVC熵编码的自适应扫描方法是很有必要的。
发明内容
本发明的目的是提供一种面向HEVC熵编码的自适应扫描方法,能够提高HEVC的编码性能,且具有较低的编码复杂度。
本发明所采用的技术方案是,一种面向HEVC熵编码的自适应扫描方法,具体按以下步骤实施:
步骤1,对TU中最后一个非零系数位置相关的语法元素进行自适应扫描及熵编码;
步骤2,对TU中其他非零系数位置相关的语法元素进行自适应扫描及熵编码:
2.1将一个TU分割为1个或多个4×4大小的子块;依据量化后的残差系数,确定每一个子块的语法元素CSBF以及子块内每一个系数位置上的语法元素sig_coeff_flag;CSBF用于标识每一个子块是否含有非零系数,sig_coeff_flag用于标识子块内非零系数的位置;
2.2计算每一个语法元素CSBF值和每一个语法元素sig_coeff_flag值等于最小概率符号LPS的预测概率,并分别进行排序、扫描、编码;
步骤3,对TU中所有非零系数幅值相关语法元素的自适应扫描及熵编码。
本发明的特点还在于,
步骤1具体为:利用HEVC中原有的自适应扫描方法,获取TU内的预测残差最后一个非零系数的坐标(X,Y);根据该坐标值,得到最后一个非零系数位置相关的语法元素:last_sig_coeff_x_prefix,last_sig_coeff_y_prefix,last_sig_coeff_x_suffix,last_sig_coeff_y_suffix,并对四个语法元素依次进行扫描和熵编码。
步骤2.2具体为:
①分别获取每一个CSBF和sig_coeff_flag对应的上下文概率索引和LPS;
②预测每一个CSBF值和sig_coeff_flag值等于它所对应的LPS时的概率;
③分别对CSBF和sig_coeff_flag进行区域划分,分别将具有相同的上下文概率索引值的CSBF和sig_coeff_flag归到相应同一子区域中;
④分别对CSBF和sig_coeff_flag相对应的子区域进行排序,进行扫描和熵编码。
预测所对应的LPS时的概率,具体为:定义符号s表示语法元素,S表示已编码的语法元素序列;根据K-T估计方法,则s=1的概率p1和s=0的概率p0分别是:
p0=1-p1
其中n0和n1分别表示语法元素序列S中值为0和值为1出现的频次。
子区域排序要求为:子区域间按照对应的上下文概率索引值由大到小进行排序,子区域内按照对应的预测概率值由小到大进行排序。
步骤3具体为:利用HEVC中原有的自适应扫描方法,获取TU中每一个非零系数对应的语法元素:coeff_abs_level_greater1_flag、coeff_abs_level_greater2_flag、coeff_sign_flag和coeff_abs_level_remaining,并对四个语法元素依次进行扫描和熵编码。
本发明的有益效果是,
(1)本发明从概率论的角度预测待编码语法元素值出现的概率,为HEVC自适应扫描方法的建立奠定了理论基础。
(2)本发明考虑熵编码的运行机制来建立自适应扫描方法,使得符号间的相关性被HEVC充分的利用,进一步提升编码效率。
(3)本发明利用已知的编码信息来建立自适应扫描方法,无需为解码端多传输额外码流信息。
(4)本发明所提的自适应扫描方法具有较低的编码复杂度,仅为现有算法的0.33%。
附图说明
图1是本发明一种面向HEVC熵编码的自适应扫描方法流程图;
图2是测试序列为BQMall下本发明方法与HEVC现有算法的率失真性能比较图;
图3是测试序列为FourPeople下本发明方法与HEVC现有算法的率失真性能比较图。
具体实施方式
下面结合附图和具体实施方式对本发明进行详细说明。
本发明提供了一种面向HEVC熵编码的自适应扫描方法的流程如图1所示,具体按照以下步骤实施:
步骤1,按照HEVC现有的自适应扫描方法,获取TU中最后一个非零系数位置的二维坐标;
步骤2,根据步骤1中的二位数坐标,确定最后一个非零系数位置相关的语法元素last_sig_coeff_x_prefix,last_sig_coeff_y_prefix,last_sig_coeff_x_suffix,last_sig_coeff_y_suffix值,然后进行熵编码;
步骤3,获取TU中每个非零系数位置相关的语法元素CSBF;
步骤4,获取每一个CSBF对应的上下文概率索引和LPS;
步骤5,根据式(1)预测每一个CSBF值等于它所对应的LPS时的概率;
其中,s表示语法元素,S表示已编码的语法元素序列,p1为s=1的概率和p0为s=0的概率,n0和n1分别表示语法元素序列S中值为0和值为1出现的频次
步骤6,对CSBF进行区域划分,将具有相同的上下文概率索引值的CSBF归到一个子区域中;
步骤7,子区域之间按照CSBF对应的上下文概率索引值由大到小进行排序,子区域内按照CSBF对应的预测概率值由小到大进行排序。按照排好的CBFS序列进行扫描和熵编码;
步骤8,获取TU中每个非零系数位置相关的语法元素sig_coeff_flag;
步骤9,获取sig_coeff_flag对应的上下文概率索引和LPS;
步骤10,根据式(1)预测每一个sig_coeff_flag值等于它所对应的LPS时的概率;
步骤11,对sig_coeff_flag进行区域划分,将具有相同的上下文概率索引值的sig_coeff_flag归到一个子区域中;
步骤12,子区域之间按照sig_coeff_flag对应的上下文概率索引值由大到小进行排序,子区域内按照sig_coeff_flag对应的预测概率值由小到大进行排序。按照排好的sig_coeff_flag序列进行扫描和熵编码;
步骤13,获取非零系数幅值相关的语法元素coeff_abs_level_greater1_flag、coeff_abs_level_greater2_flag、coeff_sign_flag和coeff_abs_level_remaining,对这四个语法元素依次进行扫描和熵编码。
本发明在TU中最后一个非零系数位置相关的语法元素自适应扫描中,一方面考虑到最后一个非零系数位置涉及的语法元素数量很少,另一方面为保证所提技术不影响HEVC解码端的运行,因此沿用HEVC中原有的自适应扫描方法进行扫描。
在TU中非零系数位置信息采用熵编码中的常路模型进行编码,HEVC采用何种自适应扫描方法直接影响这最终的编码效率,因此通过考虑熵编码的运行模式来建立非零系数位置相关的语法元素自适应扫描方法是很有必要的。具体做法是首先将一个TU分割为1个或多个4×4大小的子块;依据量化后的残差系数,确定每一个子块的语法元素CSBF(coded_sub_block_flag)以及子块内每一个系数位置上的语法元素sig_coeff_flag。CSBF用于标识每一个子块是否含有非零系数,sig_coeff_flag用于标识子块内非零系数的位置。
其次定义符号s表示语法元素,S表示已编码的语法元素序列。根据K-T估计方法,则s=1的概率p1和s=0的概率p0分别是:
p0=1-p1
其中n0和n1分别表示语法元素序列S中值为0和值为1出现的频次。计算每一个语法元素CSBF值等于最小概率符号(LPS)的预测概率,计算每一个语法元素sig_coeff_flag值等于LPS的预测概率。
根据熵编码原理,获取语法元素CSBF所使用的上下文概率索引。将上下文概率索引号相同的CSBF语法元素归为一个子区域,子区域之间根据上下文概率索引号值由大到小进行排序,子区域内根据每一个语法元素CSBF的预测概率值由小到大进行排序,对排序后的CSBF依次扫描并送入熵编码器中。
根据熵编码原理,获取语法元素sig_coeff_flag所使用的上下文概率索引。将上下文概率索引号相同的sig_coeff_flag语法元素归为一个子区域,子区域之间根据上下文概率索引号值由大到小进行排序,子区域内根据每一个语法元素sig_coeff_flag的预测概率值由小到大进行排序,对排序后的sig_coeff_flag依次扫描并送入熵编码器中。
在TU中非零系数幅值主要采用熵编码中的旁路模型进行编码,HEVC采用何种自适应扫描方法对最终的编码比特数影响较小,因此沿用HEVC中原有的自适应扫描方法进行扫描。利用HEVC中原有的自适应扫描方法,获取TU中每一个非零系数对应的语法元素:coeff_abs_level_greater1_flag、coeff_abs_level_greater2_flag、coeff_sign_flag和coeff_abs_level_remaining,对这四个语法元素依次进行扫描和熵编码。
本发明的效果通过实验进一步说明。
实验测试了不同分辨率,不同应用场景下的本文所提方法的编码性能。图2给出了测试序列为Cactus下本发明与HEVC原有算法的率失真性能比较图。图3给出了测试序列为BQMall下本发明与HEVC原有算法的率失真性能比较图。由图2和3可以看出,本发明所提的面向HEVC熵编码的自适应扫描方法比HEVC原有的扫描方法的编码效率高。统计结果表明本发明得到的视频质量峰值信噪比PSNR比HEVC原有方法得到的视频质量峰值信噪比PSNR平均高出0.09dB。

Claims (1)

1.一种面向HEVC熵编码的自适应扫描方法,其特征在于,具体按以下步骤实施:
步骤1,对TU中最后一个非零系数位置相关的语法元素进行自适应扫描及熵编码,具体为:利用HEVC中原有的自适应扫描方法,获取TU内的预测残差最后一个非零系数的坐标(X,Y);根据该坐标值,得到最后一个非零系数位置相关的语法元素:last_sig_coeff_x_prefix,last_sig_coeff_y_prefix,last_sig_coeff_x_suffix,last_sig_coeff_y_suffix,并对四个语法元素依次进行扫描和熵编码;
步骤2,对TU中其他非零系数位置相关的语法元素进行自适应扫描及熵编码:
2.1 将一个TU分割为1个或多个4×4大小的子块;依据量化后的残差系数,确定每一个子块的语法元素CSBF以及子块内每一个系数位置上的语法元素sig_coeff_flag;CSBF用于标识每一个子块是否含有非零系数,sig_coeff_flag用于标识子块内非零系数的位置;
2.2 计算每一个语法元素CSBF值和每一个语法元素sig_coeff_flag值等于最小概率符号LPS的预测概率,并分别进行排序、扫描、编码,具体为:
①分别获取每一个CSBF和sig_coeff_flag对应的上下文概率索引和LPS;
②预测每一个CSBF值和sig_coeff_flag值等于它所对应的LPS时的概率,具体为:定义符号s表示语法元素,S表示已编码的语法元素序列;根据K-T估计方法,则s=1的概率p1和s=0的概率p0分别是:
p0=1-p1
其中n0和n1分别表示语法元素序列S中值为0和值为1出现的频次;
③分别对CSBF和sig_coeff_flag进行区域划分,分别将具有相同的上下文概率索引值的CSBF和sig_coeff_flag归到相应同一子区域中;
④分别对CSBF和sig_coeff_flag相对应的子区域进行排序,进行扫描和熵编码;
子区域排序要求为:子区域间按照对应的上下文概率索引值由大到小进行排序,子区域内按照对应的预测概率值由小到大进行排序;
步骤3,对TU中所有非零系数幅值相关语法元素的自适应扫描及熵编码,具体为:利用HEVC中原有的自适应扫描方法,获取TU中每一个非零系数对应的语法元素:coeff_abs_level_greater1_flag、coeff_abs_level_greater2_flag、coeff_sign_flag和coeff_abs_level_remaining,并对四个语法元素依次进行扫描和熵编码。
CN201710671930.3A 2017-08-08 2017-08-08 一种面向hevc熵编码的自适应扫描方法 Expired - Fee Related CN107580224B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710671930.3A CN107580224B (zh) 2017-08-08 2017-08-08 一种面向hevc熵编码的自适应扫描方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710671930.3A CN107580224B (zh) 2017-08-08 2017-08-08 一种面向hevc熵编码的自适应扫描方法

Publications (2)

Publication Number Publication Date
CN107580224A CN107580224A (zh) 2018-01-12
CN107580224B true CN107580224B (zh) 2019-11-22

Family

ID=61034045

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710671930.3A Expired - Fee Related CN107580224B (zh) 2017-08-08 2017-08-08 一种面向hevc熵编码的自适应扫描方法

Country Status (1)

Country Link
CN (1) CN107580224B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10873765B2 (en) * 2018-03-29 2020-12-22 Apple Inc. Techniques for high efficiency entropy coding of video data
EP3700206A4 (en) * 2018-12-17 2020-11-18 LG Electronics Inc. METHOD AND APPARATUS FOR DECISION OF THE TRANSFORMATION COEFFICIENT SCANNING SEQUENCE BASED ON THE HIGH-FREQUENCY ZERO-POINT RESET
CN109996068A (zh) * 2019-04-12 2019-07-09 中国科学技术大学 一种视频运动信息编码方法及装置
CN112449184B (zh) * 2019-08-28 2022-01-25 腾讯科技(深圳)有限公司 变换系数优化方法、编解码方法、装置、介质及电子设备
CN112449188B (zh) * 2019-08-28 2021-08-20 腾讯科技(深圳)有限公司 视频解码方法、编码方法、装置、介质及电子设备

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102238387A (zh) * 2011-05-25 2011-11-09 深圳市融创天下科技股份有限公司 一种视频熵编码、熵解码方法、装置及介质
CN102650969A (zh) * 2011-02-27 2012-08-29 浙江大学 一种获取、更新bin的上下文概率模型值的方法及装置
CN103959790A (zh) * 2011-11-18 2014-07-30 华为技术有限公司 高效视频编码中的预测残余的扫描
CN103975532A (zh) * 2011-11-03 2014-08-06 高通股份有限公司 用于上下文自适应性熵译码的上下文状态和概率初始化
CN104104949A (zh) * 2013-04-12 2014-10-15 浙江大学 一种方向信息语法元素的熵编解码方法和装置
CN104509115A (zh) * 2012-07-02 2015-04-08 高通股份有限公司 用于高效视频译码(hevc)和扩展的视频参数集
CN105052132A (zh) * 2012-10-01 2015-11-11 Ge视频压缩有限责任公司 利用增强层中变换系数区块的基于子区块编码的可伸缩视频编码
CN105657421A (zh) * 2016-01-15 2016-06-08 珠海全志科技股份有限公司 8x8残差系数块编码方法及***

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9591320B2 (en) * 2010-07-15 2017-03-07 Texas Instruments Incorporated Context and bypass encoding video

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102650969A (zh) * 2011-02-27 2012-08-29 浙江大学 一种获取、更新bin的上下文概率模型值的方法及装置
CN102238387A (zh) * 2011-05-25 2011-11-09 深圳市融创天下科技股份有限公司 一种视频熵编码、熵解码方法、装置及介质
CN103975532A (zh) * 2011-11-03 2014-08-06 高通股份有限公司 用于上下文自适应性熵译码的上下文状态和概率初始化
CN103959790A (zh) * 2011-11-18 2014-07-30 华为技术有限公司 高效视频编码中的预测残余的扫描
CN104509115A (zh) * 2012-07-02 2015-04-08 高通股份有限公司 用于高效视频译码(hevc)和扩展的视频参数集
CN105052132A (zh) * 2012-10-01 2015-11-11 Ge视频压缩有限责任公司 利用增强层中变换系数区块的基于子区块编码的可伸缩视频编码
CN104104949A (zh) * 2013-04-12 2014-10-15 浙江大学 一种方向信息语法元素的熵编解码方法和装置
CN105657421A (zh) * 2016-01-15 2016-06-08 珠海全志科技股份有限公司 8x8残差系数块编码方法及***

Also Published As

Publication number Publication date
CN107580224A (zh) 2018-01-12

Similar Documents

Publication Publication Date Title
CN107580224B (zh) 一种面向hevc熵编码的自适应扫描方法
KR102517346B1 (ko) 변환 계수의 엔트로피 부호화/복호화 방법 및 장치
CN103493488B (zh) 用于视频译码的变换系数的译码
CN103238322B (zh) 在视频译码中单独地译码视频块的最后有效系数的位置
CN104685875B (zh) 用于视频译码的方法、设备、计算机可读存储媒体
CN104937936B (zh) 用于视频译码的方法和装置
CN104094601B (zh) 用于采样自适应偏移编码和/或信令的装置和方法
CN103718554B (zh) 用于视频译码的变换系数的译码
JP6382807B2 (ja) Sao符号化又は復号化のための方法及び装置
CN103096070B (zh) 推导量化参数的方法
EP3270591B1 (en) Modified coding for a transform skipped block for cabac in hevc
Pan et al. A low-complexity screen compression scheme for interactive screen sharing
JP5893790B2 (ja) 最大符号化単位別ピクセル分類によるオフセット調整を利用するビデオ符号化方法及びその装置、並びにビデオ復号化方法及びその装置
CN104969552B (zh) 存储减少的帧内预测模式决策
CN103636223B (zh) 用于视频译码的多区扫描次序
CN104054343B (zh) 图像解码装置、图像编码装置
KR101483750B1 (ko) 영상의 부호화 방법 및 장치, 영상 복호화 방법 및 장치
EP3206403A1 (en) Video encoding method and apparatus therefor, and video decoding method and apparatus therefor, in which edge type offset is applied
CN104159117A (zh) 一种hevc视频的信息隐藏方法
CN104270641A (zh) 变换系数的处理方法和装置
CN105993173A (zh) Hevc中cabac的变换跳过块的改进编码
KR20170025538A (ko) 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
CN103283229B (zh) 视频块系数的可变长度译码
CN102256126A (zh) 混合图像的编码方法
KR20120076815A (ko) 적응적 스캔 장치 및 그 스캔 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20191122