CN111586405B

CN111586405B - 一种多功能视频编码中基于alf滤波的预测模式快速选择方法

Info

Publication number: CN111586405B
Application number: CN202010331912.2A
Authority: CN
Inventors: 张昊; 钟培雄; 傅枧根; 冯冰雪; 马学睿
Original assignee: Central South University
Current assignee: Central South University
Priority date: 2020-04-24
Filing date: 2020-04-24
Publication date: 2022-03-29
Anticipated expiration: 2040-04-24
Also published as: CN111586405A

Abstract

本发明提供了一种多功能视频编码中基于ALF滤波的预测模式快速选择方法，该方法的发明构思是利用ALF滤波过程中得到的方向梯度值来预测当前块的帧内预测的角度模式，缩小角度预测模式的搜索范围，以尽可能地降低编码时间，利用ALF滤波得到的方向梯度值来提前跳过不必要的CU划分模式，加速帧间编码的CU划分过程，步骤简单，计算量小，可方便地投入实际应用。

Description

一种多功能视频编码中基于ALF滤波的预测模式快速选择方法

技术领域

本发明属于视频处理技术领域，具体涉及一种多功能视频编码中基于ALF滤波的预测模式快速选择方法。

背景技术

近年来，随着各种应用场景下视频业务的发展，人们对于视频的需求也越来越多，对视频质量的要求也越来越高。例如一些视频网站和直播平台提供4K乃至8K的超高清视频流，同时引入高动态范围(High-Dynamic Range，简称HDR)技术，来给用户提供更加高质量的视频服务体验。随着5G技术的商用化，网络带宽大幅提升，各种新型的视频创作内容，视频应用以及视频业务都将应运而生，会进一步丰富整个互联网中的视频生态；但是与此同时，视频流量在互联网流量中的占比会持续增加，这会对当前全球的计算机通信网络带来更大的挑战。传统的高效率视频编码(High Efficiency Video Coding，简称HEVC)技术已无法达到较好的压缩性能，所以运动图像专家组(Moving Picture Epert Group，简称MPEG)和视频编码专家组(VideoCoding Epert Group，简称VCEG)于2015年10月成立了联合视频探索组(Joint Video Eploration Team，简称JVET)，研究出了新的视频编码标准，并命名为多功能视频编码(Versatile Video Coding，简称VVC)，并发布了相应的编码器测试模型VTM1.0。目前编码器测试模型已经更新到VTM7.0版本。VTM采用了四叉树以及嵌套的多类型树结构(QTMT)，使得编码单元(Coding Unit，简称CU)的划分更加灵活；许多新的编码工具，如亮度与色度分离的划分结构以及多变换选择均被VVC采用，并集成到VTM中。同时在前代标准HEVC的基础上，除了去块滤波(Deblocking Filter，简称DBF)和样点自适应补偿滤波(Sample Adaptive Offset，简称SAO)的滤波方法，提出了自适应环路滤波(AdaptiveLoop Filte，简称ALF)的方法，亮度分量根据局部水平，垂直，45度角和135度角对角线的梯度方向和值(activity)为每个4×4的块选择25种滤波器中的一个，进一步提高了滤波效果。

VTM中共有三个环路滤波器。除了HEVC中就有的DBF和SAO，还采用了ALF。VTM中滤波过程的顺序是：DBF>>SAO>>ALF。在VTM中，SAO和DBF与HEVC中的过程几乎相同。

ALF滤波的执行过程为：

(1)确定滤波形状。在VTM中，使用了如图1中的两种菱形滤波器。色度分量采用5×5菱形滤波器滤波，亮度分量采用7×7菱形滤波器滤波；

(2)对于亮度分量，对每个4×4的块计算其梯度值D和活动值A，并根据D和A计算出所需的滤波器索引值；对于色度分量，不应用分类方法，即对每个色度分量应用单个ALF系数集；

(3)对相应的滤波器系数和滤波器限幅值进行几何变换，相当于把几何变换应用到滤波器覆盖的区域；

(4)对相应区域进行滤波。

ALF滤波技术有以下几个特点：

(1)ALF是根据局部梯度的方向和活动性，对于亮度分量的每个4×4块选择25个滤波器之一，而对于色度分量只采用1个；

(2)ALF滤波是在整帧视频图像编码完成之后进行的；

(3)ALF应用二次采样的一维拉普拉斯算法来降低块分类的复杂性。如图2所示，对四种梯度的计算都采样相同的下采样位置。

(4)ALF简化了滤波操作，针对滤波器系数和滤波器限幅值采用了三种变换操作：对角线变换、垂直翻转、旋转。

与HEVC以及H.264/AVC一样，多功能视频编码(Versatile Video Coding，简称VVC)也采用了基于块的混合编码框架。图3所示为典型的VVC视频编码流程。输入的图像首先被划分为大小相等的正方形图像块，这些图像块被称为树形编码单元(Coding TreeUnit，简称CTU)，CTU是四叉树以及嵌套的多类型树划分结构的根节点。CTU将根据四叉树及嵌套多类型树的划分结构进一步划分为编码单元(Coding Unit，简称CU)，CU是进行预测的基本单位。一个CU首先会根据其帧内帧间属性进行帧内预测或者帧间预测。如果是帧内预测，则主要利用空间相邻的参考像素经过线性插值得到当前CU的像素预测值，如果是帧间预测，则是利用时间相邻(前一帧或前几帧)的参考像素经过位移补偿得到当前CU的像素预测值。然后将CU的预测值与原始值相减得到残差，残差经过变换进一步减少相邻像素点误差的空间相关性并得到相应的残差系数。残差系数经量化后一方面会结合编码模式以及相关的编码参数等信息进行熵编码，从而得到压缩后的码流。另一方面，量化后的残差系数会经反量化反变换，然后将反量化反变换后的残差和预测值相加得到重建像素，重建图像经滤波后生成参考帧并存储在解码图像缓存器中，用于后面的CU帧内预测或帧间预测时作参考像素。

为了适应图像更丰富的纹理，HEVC设定了更多的帧内预测模式，对应不同的预测方向。HEVC有35种帧内亮度预测模式，其中33种是方向预测模式或称角度预测模式，另外两种是直流(DC)和平面(Planar)模式，如图4所示。色度预测模式有5种，模式0是Planar模式，相当于亮度模式0；模式1是是垂直模式，相当于亮度模式1；模式2是水平模式，相当于亮度模式10，模式3是DC模式，相当于亮度模式1；模式4又称为导出模式，采用和对应亮度块相同的模式。

为了更好的刻画视频图像中任意的边界方向特征，VVC中的帧内预测模式增加到了67种，其中包括65种角度预测模式、DC模式和平面模式，其中65种角度预测模式中包含了HEVC中的33种模式，DC模式和平面模式与HEVC中的一样，如图5所示。在VTM5.0中，对于亮度分量，有多个低频不可分离变换(Low-Frequency Non-Separable Transform，简称LFNST)通道。在第一个LFNST通道下，预测模式的过程为：1)亮度预测模式的初始化；2)遍历67种预测模式，跳过VVC中新加的33种角度模式，只对HEVC中存在的35种模式进行SATD的计算，从中选出SATD最小的几个模式和它们的SATD值并存入模式列表和cost列表，并且将模式数目、模式列表和cost列表保存到LFNST通道；3)遍历上一步选出来的几种模式，这几种模式如果是在2—66之间，则将每种模式与其相邻的两个模式比较SATD，从中选出SATD值最小的一个，更新模式列表和cost列表中的值，但模式数目不变；4)构建MPM列表并遍历MPM列表中的6种模式，计算这6种模式的SATD，并与上一步中的cost列表中的SATD值比较，选择SATD最小的那个模式，再次更新模式列表和cost列表中的值；5)用哈达玛变换导出MIP候选模式；6)将MIP的MPM模式添加到模式列表并更新模式数目和cost列表；7)从ISP列表中删除非MPM模式；8)把常规帧内、MIP和ISP模式组合到一起创建完整的模式列表；9)遍历模式列表中所有的模式，用RDCost检测每个模式，选择RDCost最小的模式作为最佳预测模式。

视频图像在进行编码时，首先会划分成若干个固定大小的方形编码单元CTU，CTU会以自身为划分的起点，根据图像具体特征自适应地划分为若干个编码单元CU。

在日益多样的应用场景下，VVC针对性地提出嵌套二叉和三叉划分的四叉树结构的概念，以更加灵活多样的CU划分方式代替HEVC较简单的划分方式，并将最大CU的尺寸扩大为128×128。采用这样的划分结构，VVC中便不再区分CU和PU，TU的概念，同时增加了四种二叉和三叉划分方式：水平二叉划分，垂直二叉划分，水平三叉划分，垂直三叉划分(如图6所示)。灵活的划分方式，使得CU可以得到更优划分结构，有效提高编码效率。

VVC编码器在图像进行编码时，遵循基于四叉树的嵌套多类型树的划分方式。首先，将图像划分为若干个基本编码单元CTU(128×128像素大小)。然后，以每个CTU作为划分的起点，用四叉树的结构进行划分。对于得到的每个四叉划分的叶子结点，以多类型树结构进行递归划分，当CU的划分深度达到设定的最大值便不再划分。在划分过程中，会计算每种划分方式在各种预测模式下的率失真代价，选择率失真代价最小的划分方式对应的预测模式，作为最佳预测模式。

VVC所采用的嵌套多类型树的四叉树划分结构，给视频图像中编码单元CU的划分带来更灵活多样的方式，如图7所示，基于嵌套多类型树的四叉树结构划分的CTU；同时可以得到适应于图像特征更优的CU划分，取得更好的编码质量和编码效率。但这种划分结构也带来很大的问题，由于需要遍历每种划分方式至最小的CU划分，并计算其率失真代价，编码的计算复杂度大大增加。因此，如何降低CU划分的计算复杂度是节省编码时间，加速编码的关键。

发明内容

本发明旨在至少解决现有技术中存在的技术问题之一。为此，本发明提出一种多功能视频编码中基于ALF滤波的预测模式快速选择方法。

根据本发明第一方面实施例的一种多功能视频编码中基于ALF滤波的预测模式快速选择方法，所述一种多功能视频编码中基于ALF滤波的预测模式快速选择方法，包括以下步骤：

S1：获得编码数据，所述编码数据由VTM5.0对视频序列编码码流统计分析后得到；

S2：对当前CU进行帧间预测，获得当前PU的最佳MV，保留最佳MV的矢量值，确定对应的最佳参考块；

S3：对所述最佳参考块的梯度信息进行统计分析；

S4：计算当前CU参考块最大的平均像素梯度值AvgGrad；

S5：获得最优划分模式；

S6：进入当前PU帧内预测，遍历67种帧内预测模式，跳过VVC中新增加的角度模式，对HEVC中的35种预测模式进行SATD计算，确定模式列表CandList中的模式；

S7：若模式列表CandList中的模式介于2～66之间，比较每种模式与其相邻的两种模式的SATD值，将SATD值最小的模式加入模式列表CandList；

S8：根据当前块左边和上边的相邻块，构建MPM，遍历MPM列表中的模式，若MPM中的模式不包括在CandList中，则将其加入到CandList中；

S9：分别执行MIP模块和ISP模块，更新候选列表CandList；

S10：获取参考块中每个像素点所对应的ALF滤波四种梯度值；

S11：统计参考块中各方向ALF滤波梯度值之和，选取梯度值之和最小的ALF滤波梯度方向作为当前PU帧内预测的候选方向模式并保存；

S12：计算当前PU的预测方向的范围；

S13：保留位于CandList中的候选模式，确定最终的候选预测模式范围，选择最优的帧内预测模式；

S14：确定当前CU的最佳预测模式和划分模式，进行下一CU的预测编码。

步骤S1中，

主要编码参数如表1所示，分别使用VVC的Encoder_lowdelay_P_vtm.cfg配置文件，对3个序列在四个量化参数(QP)下编码10帧。这3个视频序列均来自VVC发布的官方测试序列，具有不同的分辨率、纹理特征。需要说明的是，编码数据的获取条件并不局限于表1，可以根据具体需求场景自行设置。

表1测试条件

根据本发明的一些实施方式，步骤S3中，所述梯度信息包括四个方向。

根据本发明的一些实施方式，所述统计分析的方法为：分别计算参考块中各像素的四个方向梯度之和SumGradV，SumGradH，SumGradG1和SumGradG2，然后计算四个梯度和中的最大值MaxGrad与最小值MinGrad之间的差值，并进行归一化处理，求出差值占梯度和最大值的比率GradRatio。

GradRatio反映了各个方向梯度的均衡性和一致性，若该值比较小，则证明各个方向梯度的分布较均匀。同时需要保证各个方向梯度的绝对大小在一定的范围以内，说明沿各个梯度方向像素变比较缓慢；反之，图像像素变化则比较剧烈。

步骤S4中，计算当前CU参考块最大的平均像素梯度值AvgGrad，来描述最大梯度和方向的梯度变化情况。在此处，设立变量阈值α，β，α和β的值为经验值，通过大量的实验，不断的测试优化得到。若当前CU的GradRatio小于α且AvgGrad小于β，则说明当前CU区域像素值变化较为平缓，图像较为平坦，可以跳过当前块的划分；反之，则说明当前区域图像变化剧烈，局部的细节信息较多，不同图像部分的差异较大，需要进行进一步的划分。

步骤S5中，通过计算各模式下划分子块的GradRatio和AvgGrad，来确定可能的划分模式。对于三叉划分和二叉划分，若其中存在子块的满足GradRatio大于设定阈值α或AvgGrad大于β，则当前划分模式即加入候选划分模式列表；否则，跳过当前划分模式。最后再对候选划分模式进行RDcost的筛选，得到最优划分模式。

根据本发明的一些实施方式，步骤S6中，所述模式列表CandList中的模式为SATD值最小的几种模式。

根据本发明的一些实施方式，步骤S10中，ALF滤波四种梯度值包括四种梯度方向：Hor，Ver，Diag1，Diag2。

步骤S10中，参考块的大小必须与当前PU的大小相同，所以遍历参考块的每个像素点时，用当前PU的宽和高作为循环的最大值。

步骤S12中，判断上一步选出候选方向模式Dir是否与CandList候选模式列表中的角度模式重复。若无重复，则直接将CandList列表中的默认预测模式作为预测方向的范围；若选出的梯度方向位于CandList列表中，则将梯度方向Dir作为候选模式之一进行筛选：此时如果上一步选出的梯度方向Dir为Diag2，即对应于模式索引为2和66的角度模式，则当前PU的预测方向范围为[2，4]和[64，66]；否则，当前PU的预测范围为最小值为Dir-2，最大值为Dir+2。

根据本发明实施例的预测模式快速选择方法，至少具有如下技术效果：

本发明实施例提出了一种VVC中基于ALF滤波的预测模式快速选择方法，该方法的发明构思是：(1)ALF滤波过程中得到的方向梯度值来预测当前块的帧内预测的角度模式，缩小角度预测模式的搜索范围，以尽可能地降低编码时间；(2)利用ALF滤波得到的方向梯度值来提前跳过不必要的CU划分模式，加速帧间编码的CU划分过程。

本发明实施例提供的预测模式快速选择方法步骤简单，计算量小，可方便地投入实际应用。

附图说明

图1是ALF滤波亮度和色度分量采用的菱形滤波器示意图。

图2是ALF滤波中四种梯度方向的下采样方式示意图。

图3是典型的VCC视频编码流程图。

图4为HEVC的35种帧内预测方向示意图。

图5为VVC的67种帧内预测方向示意图。

图6为VVC的CU多类型划分方式示意图。

图7为嵌套多类型树CTU划分示例示意图。

图8为VVC中基于ALF滤波的预测模式快速选择方法流程图。

图9为帧内编码流程图。

具体实施方式

以下是本发明的具体实施例，并结合实施例对本发明的技术方案作进一步的描述，但本发明并不限于这些实施例。

实施例1

本例提供了一种VVC中基于ALF滤波的预测模式快速选择方法，流程如图8所示，具体步骤包括：

S1：准备数据。

具体来说，为了得到编码数据，基于VVC的官方测试软件VTM5.0对3个不同类型的视频序列编码码流进行统计分析。主要编码参数如表1所示，使用VVC的Encoder_lowdelay_P_vtm配置文件，对3个序列在四个量化参数(QP)下编码10帧。

S2：对当前CU进行帧间预测，获取当前PU的最佳MV，保留最佳MV的矢量值，找到对应的最佳参考块。

S3：对参考块的四个方向梯度信息进行统计。分别计算参考块中各像素的四个方向梯度之和SumGradV，SumGradH，SumGradG1，SumGradG2。然后，计算四个梯度和中的最大值MaxGrad与最小值MinGrad之间的差值，并进行归一化处理，求出差值占梯度和最大值的比率GradRatio。GradRatio反映了各个方向梯度的均衡性和一致性，若该值比较小，则证明各个方向梯度的分布较均匀。同时需要保证各个方向梯度的绝对大小在一定的范围以内，说明沿各个梯度方向像素变比较缓慢；反之，图像像素变化则比较剧烈。

S4：计算当前CU参考块最大的平均像素梯度值AvgGrad，来描述最大梯度和方向的梯度变化情况。在此处，设立变量阈值α，β，α和β的值为经验值，通过大量的实验，不断的测试优化得到。若当前CU的GradRatio小于α且AvgGrad小于β，则说明当前CU区域像素值变化较为平缓，图像较为平坦，可以跳过当前块的划分；反之，则说明当前区域图像变化剧烈，局部的细节信息较多，不同图像部分的差异较大，需要进行进一步的划分。

S5：通过计算各模式下划分子块的GradRatio和AvgGrad，来可能的划分模式。对于三叉划分和二叉划分，若其中存在子块的满足GradRatio大于设定阈值α或AvgGrad大于β，则当前划分模式即加入候选划分模式列表；否则，跳过当前划分模式。最后再对候选划分模式进行RDcost的筛选，得到最优划分模式。

S6：进入当前PU帧内预测，遍历67种帧内预测模式，跳过VVC中新增加的角度模式，只对HEVC中的35种预测模式进行SATD计算，选出SATD值最小的几种模式加入模式列表CandList，如图9所示。

S7：对于上述选出的模式，若介于模式2-66之间，则比较每种模式与其相邻的两种模式的SATD值，选出SATD值最小的模式加入模式列表CandList。

S8：根据当前块左边和上边的相邻块，构建MPM，遍历MPM列表中的几种模式，若MPM中的模式不包括在CandList中，则将其加入到CandList中。

S9：分别执行MIP模块和ISP模块，更新候选列表CandList。

S10：获取参考块中每个像素点所对应的ALF滤波四种梯度值，分为四种梯度方向：Hor，Ver，Diag1，Diag2。参考块的大小必须与当前PU的大小相同，所以遍历参考块的每个像素点时，用当前PU的宽和高作为循环的最大值。

S11：统计参考块中上述各个方向ALF滤波梯度值之和，选取梯度值之和最小值MinGrad的ALF滤波梯度方向作为当前PU帧内预测的候选方向模式，并保存。

S12：计算当前PU的预测方向的范围。判断上一步选出候选方向模式Dir是否与CandList候选模式列表中的角度模式重复。若无重复，则直接将CandList列表中的默认预测模式作为预测方向的范围；若选出的梯度方向位于CandList列表中，则将梯度方向Dir作为候选模式之一进行筛选：此时如果上一步选出的梯度方向Dir为Diag2，即对应于模式索引为2和66的角度模式，则当前PU的预测方向范围为[2,4]和[64,66]；否则，当前PU的预测范围为最小值为Dir-2，最大值为Dir+2。

S13：在上述预测范围中，仅保留位于CandList中的候选模式，确定最终的候选预测模式范围，选择最优的帧内预测模式。

在编码器的设置上，分别使用默认的lowdelay_P配置中的设置，测试所用视频序列为官方推荐的采样格式为4:2:0的视频序列。编码性能主要由BDBR(Bjotegaard DeltaBit rate)和TS两个指标进行评估，并以原始的VTM5.0编码器为基准评估算法的编码性能。其中，BDBR表示在同样的客观质量下两种编码方法的码率差值，由同一段视频在四个QP取值下(22，27，32，37)分别编码并计算码率和PSNR所得到。BDBR能够综合反映视频的码率和质量，它表示在同样的客观质量下，较优的编码方法可以节省的码率百分比。一般为负值，表示相同psnr下，码率减少，性能提高。正值表示码率增加，性能下降。TS则用于衡量快速算法在原编码器的基础上对编码时间的缩减程度，其计算方式如下：

其中，T_p为将快速算法嵌入VTM5.0后的总编码时间，T_O为原编码器VTM5.0的总编码时间。实验结果如表2和表3所示。

表2帧内模式快速选择实验结果

序列	Y(BDBR)	TS
			FourPeople	1.83％	10.21％
BasketballPass	1.27％	11.86％
			RaceHorses	1.42％	12.31％
Average	1.51％	11.46％

表3帧间CU划分模式快速决策实验结果

根据实验结果，从平均意义上看，本发明的帧内预测模式快速选择算法和帧间CU快速划分决策算法使Y分量的BDBR分别平均增加了1.51％和1.42％，说明其码率并无明显增加，有效地保证了编码器的压缩性能，而编码时间相比原编码器分别减少了11.46％和12.7％，降低了编码复杂度。

Claims

1.一种多功能视频编码中基于ALF滤波的预测模式快速选择方法，其特征在于，包括以下步骤：

S3：对所述最佳参考块的梯度信息进行统计分析，所述梯度信息包括四个方向，所述统计分析的方法为：分别计算参考块中各像素的四个方向梯度之和SumGradV，SumGradH，SumGradG1和SumGradG2，然后计算四个梯度和中的最大值MaxGrad与最小值MinGrad之间的差值，并进行归一化处理，求出差值占梯度和最大值的比率GradRatio；

S4：计算当前CU参考块最大的平均像素梯度值AvgGrad，设立两个变量阈值α和β，若当前CU的GradRatio小于α且AvgGrad小于β，则说明当前CU区域像素值变化较为平缓，图像较为平坦，可以跳过当前块的划分；反之，若当前CU的GradRatio大于α且AvgGrad大于β，则说明当前区域图像变化剧烈，局部的细节信息较多，不同图像部分的差异较大，需要进行进一步的划分；

S5：通过计算各模式下划分子块的GradRatio和AvgGrad，来确定可能的划分模式，对于三叉划分和二叉划分，若其中存在子块的满足GradRatio大于设定阈值α或AvgGrad大于β，则当前划分模式即加入候选划分模式列表；否则，跳过当前划分模式，最后再对候选划分模式进行RDcost的筛选，得到最优划分模式；

S9：分别执行MIP模块和ISP模块，更新候选列表CandList；

S10：获取参考块中每个像素点所对应的ALF滤波四种梯度值；

S12：计算当前PU的预测方向的范围，方法为：判断上一步选出候选方向模式Dir是否与CandList候选模式列表中的角度模式重复，若无重复，则直接将CandList列表中的默认预测模式作为预测方向的范围；若选出的梯度方向位于CandList列表中，则将梯度方向Dir作为候选模式之一进行筛选：此时如果上一步选出的梯度方向Dir为Diag2，即对应于模式索引为2和66的角度模式，则当前PU的预测方向范围为[2,4]和[64,66]；否则，当前PU的预测范围为最小值为Dir-2，最大值为Dir+2；

2.根据权利要求1所述的一种多功能视频编码中基于ALF滤波的预测模式快速选择方法，其特征在于，步骤S6中，所述模式列表CandList中的模式为SATD值最小的几种模式。

3.根据权利要求1所述的一种多功能视频编码中基于ALF滤波的预测模式快速选择方法，其特征在于，步骤S10中，ALF滤波四种梯度值包括四种梯度方向：Hor，Ver，Diag1，Diag2。