CN107580224B

CN107580224B - 一种面向hevc熵编码的自适应扫描方法

Info

Publication number: CN107580224B
Application number: CN201710671930.3A
Authority: CN
Inventors: 李维; 张二虎; 赵凡; 范彩霞
Original assignee: Xian University of Technology
Current assignee: Xian University of Technology
Priority date: 2017-08-08
Filing date: 2017-08-08
Publication date: 2019-11-22
Anticipated expiration: 2037-08-08
Also published as: CN107580224A

Abstract

本发明公开了一种面向HEVC熵编码的自适应扫描方法，具体为：首先对TU中最后一个非零系数位置相关的语法元素进行自适应扫描及熵编码；然后确定TU中每一个子块的语法元素CSBF以及子块内每一个系数位置上的语法元素sig_coeff_flag；分别计算CSBF值和sig_coeff_flag值等于最小概率符号LPS的预测概率，并分别进行排序、扫描、编码；最后对TU中所有非零系数幅值相关语法元素的自适应扫描及熵编码。本发明自适应扫描方法，使得符号间的相关性被HEVC充分的利用，进一步提升编码效率；无需为解码端多传输额外码流信息；且具有较低的编码复杂度，仅为现有算法的0.33％。

Description

一种面向HEVC熵编码的自适应扫描方法

技术领域

本发明属于视频编码技术领域，涉及一种面向HEVC熵编码的自适应扫描方法。

背景技术

视频能够给用户带来更为生动的主观感受，其已逐步渗透到我们生活的各个角落。随着“高分辨率、高帧率、高像素位深”这样高清/超高清视频的出现，越来越多的用户参与到相关视频业务中，身临其境地感受着高清/超高清视频所带来的独特魅力。然而庞大的视频数据量不仅增加了视频存储***和全球通信网络的负担，也影响了新业务的部署与实际应用。因此新一代视频编码标准HEVC(High Efficiency Video Coding，高效视频编码)以预测编码、变换编码、熵编码为基础，结合人类视觉特性，尽可能地去除空域、时域上的视觉冗余来满足存储带宽或传输带宽。

HEVC仍然沿用了传统的基于块的混合编码结构，主要有帧内/帧间预测，变换，量化，熵编码，去块效应滤波等几个模块。与以前的编码标准相比，HEVC也引入了一些新的编码技术：基于四叉树结构的块表示，统一的方向性帧内预测，先进的运动矢量预测，大尺寸的离散余弦变换，自适应扫描，性能更好的上下文自适应二元算术编码，样点自适应补偿滤波等。

在描述预测残差上，HEVC采用了基于四叉树分割结构的TU(Transform unit，变换单元)模式，TU可选的尺寸有4×4，8×8，16×16，32×32。经过自适应扫描技术，TU内一个二维的预测残差被映射到一维数组中以实现后续的熵编码操作。其中自适应扫描技术作为HEVC的关键一步，直接影响着最终编码比特率的大小。依据率失真优化原理，在给定视频重构质量的前提下，应保证自适应扫描技术得到的一维系数的最终编码比特数最少。

Zigzag扫描技术被广泛应用到视频编码中，帧内/帧间块中的残差系数以固定的扫描顺序被映射到一维数组中(见Wiegand T.,Sullivan G.,Bjontegaard G.,LuthraA..Overview of the H.264/AVC video coding standard[J].IEEE Trans.CircuitsSyst.Video Technol.,2003)。Fouak等人将Zigzag扫描方式、水平扫描方式、垂直扫描方式和Hibert扫描方式结合在一起，建立了一种新的扫描方法(Fouak F.,Benzid R.,Benoudjit N..Color image compression algorithm based onthe DCT transformcombined to an adaptive block scanning[J].Int.J.Electron.Commun.,2011)。由于对角扫描能够较好的降低数据冗余信息，Sole等人提出用对角扫描取代Zigzag扫描，结合水平扫描和垂直扫描，得出一种新的自适应扫描方法，并且将该方法应用到了HEVC编码中(Sole J.,Joshi R.,Nguyen N..Transform coefficient coding in HEVC[J].IEEETrans.Circuits Syst.Video Technol.,2012)。上述方法考虑了预测参数系数的分布特性，一定程度上改善了编码效率。但由于扫描模型比较固定，忽略了后续熵编码的特性，其限制了编码性能的进一步提升。因此在对TU层的预测残差进行编码时，建立适于HEVC熵编码的自适应扫描方法是很有必要的。

发明内容

本发明的目的是提供一种面向HEVC熵编码的自适应扫描方法，能够提高HEVC的编码性能，且具有较低的编码复杂度。

本发明所采用的技术方案是，一种面向HEVC熵编码的自适应扫描方法，具体按以下步骤实施：

步骤1，对TU中最后一个非零系数位置相关的语法元素进行自适应扫描及熵编码；

步骤2，对TU中其他非零系数位置相关的语法元素进行自适应扫描及熵编码：

2.1将一个TU分割为1个或多个4×4大小的子块；依据量化后的残差系数，确定每一个子块的语法元素CSBF以及子块内每一个系数位置上的语法元素sig_coeff_flag；CSBF用于标识每一个子块是否含有非零系数，sig_coeff_flag用于标识子块内非零系数的位置；

2.2计算每一个语法元素CSBF值和每一个语法元素sig_coeff_flag值等于最小概率符号LPS的预测概率，并分别进行排序、扫描、编码；

步骤3，对TU中所有非零系数幅值相关语法元素的自适应扫描及熵编码。

本发明的特点还在于，

步骤1具体为：利用HEVC中原有的自适应扫描方法，获取TU内的预测残差最后一个非零系数的坐标(X,Y)；根据该坐标值，得到最后一个非零系数位置相关的语法元素：last_sig_coeff_x_prefix，last_sig_coeff_y_prefix，last_sig_coeff_x_suffix，last_sig_coeff_y_suffix，并对四个语法元素依次进行扫描和熵编码。

步骤2.2具体为：

①分别获取每一个CSBF和sig_coeff_flag对应的上下文概率索引和LPS；

②预测每一个CSBF值和sig_coeff_flag值等于它所对应的LPS时的概率；

③分别对CSBF和sig_coeff_flag进行区域划分，分别将具有相同的上下文概率索引值的CSBF和sig_coeff_flag归到相应同一子区域中；

④分别对CSBF和sig_coeff_flag相对应的子区域进行排序，进行扫描和熵编码。

预测所对应的LPS时的概率，具体为：定义符号s表示语法元素，S表示已编码的语法元素序列；根据K-T估计方法，则s＝1的概率p₁和s＝0的概率p₀分别是：

p₀＝1-p₁

其中n₀和n₁分别表示语法元素序列S中值为0和值为1出现的频次。

子区域排序要求为：子区域间按照对应的上下文概率索引值由大到小进行排序，子区域内按照对应的预测概率值由小到大进行排序。

步骤3具体为：利用HEVC中原有的自适应扫描方法，获取TU中每一个非零系数对应的语法元素：coeff_abs_level_greater1_flag、coeff_abs_level_greater2_flag、coeff_sign_flag和coeff_abs_level_remaining，并对四个语法元素依次进行扫描和熵编码。

本发明的有益效果是，

(1)本发明从概率论的角度预测待编码语法元素值出现的概率，为HEVC自适应扫描方法的建立奠定了理论基础。

(2)本发明考虑熵编码的运行机制来建立自适应扫描方法，使得符号间的相关性被HEVC充分的利用，进一步提升编码效率。

(3)本发明利用已知的编码信息来建立自适应扫描方法，无需为解码端多传输额外码流信息。

(4)本发明所提的自适应扫描方法具有较低的编码复杂度，仅为现有算法的0.33％。

附图说明

图1是本发明一种面向HEVC熵编码的自适应扫描方法流程图；

图2是测试序列为BQMall下本发明方法与HEVC现有算法的率失真性能比较图；

图3是测试序列为FourPeople下本发明方法与HEVC现有算法的率失真性能比较图。

具体实施方式

下面结合附图和具体实施方式对本发明进行详细说明。

本发明提供了一种面向HEVC熵编码的自适应扫描方法的流程如图1所示，具体按照以下步骤实施：

步骤1，按照HEVC现有的自适应扫描方法，获取TU中最后一个非零系数位置的二维坐标；

步骤2，根据步骤1中的二位数坐标，确定最后一个非零系数位置相关的语法元素last_sig_coeff_x_prefix，last_sig_coeff_y_prefix，last_sig_coeff_x_suffix，last_sig_coeff_y_suffix值，然后进行熵编码；

步骤3，获取TU中每个非零系数位置相关的语法元素CSBF；

步骤4，获取每一个CSBF对应的上下文概率索引和LPS；

步骤5，根据式(1)预测每一个CSBF值等于它所对应的LPS时的概率；

其中，s表示语法元素，S表示已编码的语法元素序列，p₁为s＝1的概率和p₀为s＝0的概率，n₀和n₁分别表示语法元素序列S中值为0和值为1出现的频次

步骤6，对CSBF进行区域划分，将具有相同的上下文概率索引值的CSBF归到一个子区域中；

步骤7，子区域之间按照CSBF对应的上下文概率索引值由大到小进行排序，子区域内按照CSBF对应的预测概率值由小到大进行排序。按照排好的CBFS序列进行扫描和熵编码；

步骤8，获取TU中每个非零系数位置相关的语法元素sig_coeff_flag；

步骤9，获取sig_coeff_flag对应的上下文概率索引和LPS；

步骤10，根据式(1)预测每一个sig_coeff_flag值等于它所对应的LPS时的概率；

步骤11，对sig_coeff_flag进行区域划分，将具有相同的上下文概率索引值的sig_coeff_flag归到一个子区域中；

步骤12，子区域之间按照sig_coeff_flag对应的上下文概率索引值由大到小进行排序，子区域内按照sig_coeff_flag对应的预测概率值由小到大进行排序。按照排好的sig_coeff_flag序列进行扫描和熵编码；

步骤13，获取非零系数幅值相关的语法元素coeff_abs_level_greater1_flag、coeff_abs_level_greater2_flag、coeff_sign_flag和coeff_abs_level_remaining，对这四个语法元素依次进行扫描和熵编码。

本发明在TU中最后一个非零系数位置相关的语法元素自适应扫描中，一方面考虑到最后一个非零系数位置涉及的语法元素数量很少，另一方面为保证所提技术不影响HEVC解码端的运行，因此沿用HEVC中原有的自适应扫描方法进行扫描。

在TU中非零系数位置信息采用熵编码中的常路模型进行编码，HEVC采用何种自适应扫描方法直接影响这最终的编码效率，因此通过考虑熵编码的运行模式来建立非零系数位置相关的语法元素自适应扫描方法是很有必要的。具体做法是首先将一个TU分割为1个或多个4×4大小的子块；依据量化后的残差系数，确定每一个子块的语法元素CSBF(coded_sub_block_flag)以及子块内每一个系数位置上的语法元素sig_coeff_flag。CSBF用于标识每一个子块是否含有非零系数，sig_coeff_flag用于标识子块内非零系数的位置。

其次定义符号s表示语法元素，S表示已编码的语法元素序列。根据K-T估计方法，则s＝1的概率p₁和s＝0的概率p₀分别是：

p₀＝1-p₁

其中n₀和n₁分别表示语法元素序列S中值为0和值为1出现的频次。计算每一个语法元素CSBF值等于最小概率符号(LPS)的预测概率，计算每一个语法元素sig_coeff_flag值等于LPS的预测概率。

根据熵编码原理，获取语法元素CSBF所使用的上下文概率索引。将上下文概率索引号相同的CSBF语法元素归为一个子区域，子区域之间根据上下文概率索引号值由大到小进行排序，子区域内根据每一个语法元素CSBF的预测概率值由小到大进行排序，对排序后的CSBF依次扫描并送入熵编码器中。

根据熵编码原理，获取语法元素sig_coeff_flag所使用的上下文概率索引。将上下文概率索引号相同的sig_coeff_flag语法元素归为一个子区域，子区域之间根据上下文概率索引号值由大到小进行排序，子区域内根据每一个语法元素sig_coeff_flag的预测概率值由小到大进行排序，对排序后的sig_coeff_flag依次扫描并送入熵编码器中。

在TU中非零系数幅值主要采用熵编码中的旁路模型进行编码，HEVC采用何种自适应扫描方法对最终的编码比特数影响较小，因此沿用HEVC中原有的自适应扫描方法进行扫描。利用HEVC中原有的自适应扫描方法，获取TU中每一个非零系数对应的语法元素：coeff_abs_level_greater1_flag、coeff_abs_level_greater2_flag、coeff_sign_flag和coeff_abs_level_remaining，对这四个语法元素依次进行扫描和熵编码。

本发明的效果通过实验进一步说明。

实验测试了不同分辨率，不同应用场景下的本文所提方法的编码性能。图2给出了测试序列为Cactus下本发明与HEVC原有算法的率失真性能比较图。图3给出了测试序列为BQMall下本发明与HEVC原有算法的率失真性能比较图。由图2和3可以看出，本发明所提的面向HEVC熵编码的自适应扫描方法比HEVC原有的扫描方法的编码效率高。统计结果表明本发明得到的视频质量峰值信噪比PSNR比HEVC原有方法得到的视频质量峰值信噪比PSNR平均高出0.09dB。

Claims

1.一种面向HEVC熵编码的自适应扫描方法，其特征在于，具体按以下步骤实施：

步骤1，对TU中最后一个非零系数位置相关的语法元素进行自适应扫描及熵编码，具体为：利用HEVC中原有的自适应扫描方法，获取TU内的预测残差最后一个非零系数的坐标(X,Y)；根据该坐标值，得到最后一个非零系数位置相关的语法元素：last_sig_coeff_x_prefix，last_sig_coeff_y_prefix，last_sig_coeff_x_suffix，last_sig_coeff_y_suffix，并对四个语法元素依次进行扫描和熵编码；

2.1 将一个TU分割为1个或多个4×4大小的子块；依据量化后的残差系数，确定每一个子块的语法元素CSBF以及子块内每一个系数位置上的语法元素sig_coeff_flag；CSBF用于标识每一个子块是否含有非零系数，sig_coeff_flag用于标识子块内非零系数的位置；

2.2 计算每一个语法元素CSBF值和每一个语法元素sig_coeff_flag值等于最小概率符号LPS的预测概率，并分别进行排序、扫描、编码，具体为：

②预测每一个CSBF值和sig_coeff_flag值等于它所对应的LPS时的概率，具体为：定义符号s表示语法元素，S表示已编码的语法元素序列；根据K-T估计方法，则s＝1的概率p₁和s＝0的概率p₀分别是：

p₀＝1-p₁

其中n₀和n₁分别表示语法元素序列S中值为0和值为1出现的频次；

④分别对CSBF和sig_coeff_flag相对应的子区域进行排序，进行扫描和熵编码；

子区域排序要求为：子区域间按照对应的上下文概率索引值由大到小进行排序，子区域内按照对应的预测概率值由小到大进行排序；

步骤3，对TU中所有非零系数幅值相关语法元素的自适应扫描及熵编码，具体为：利用HEVC中原有的自适应扫描方法，获取TU中每一个非零系数对应的语法元素：coeff_abs_level_greater1_flag、coeff_abs_level_greater2_flag、coeff_sign_flag和coeff_abs_level_remaining，并对四个语法元素依次进行扫描和熵编码。