CN110225339A

CN110225339A - 一种hevc视频序列编解码加速方法

Info

Publication number: CN110225339A
Application number: CN201910390721.0A
Authority: CN
Inventors: 张军
Original assignee: Shanghai DC Science Co Ltd
Current assignee: Shanghai DC Science Co Ltd
Priority date: 2019-05-10
Filing date: 2019-05-10
Publication date: 2019-09-10
Also published as: US20210203919A1; US11212518B2; WO2020227911A1

Abstract

本发明公开了一种HEVC视频序列编解码加速方法，包括对原始视频流进行解码，提取最大编码单元LCU以及预测单元PU1，计算当前预测单元PU1的复杂度；根据预测单元PU1的复杂度进行块大小划分，得到解码后的原始视频流编码单元CU1；根据编码单元CU1及预测单元PU1，记录原始视频流量化步长QP1；对解码后的视频流进行再编码，设定再编码流量化步长QP2，同时提取待编码帧前一帧的编码单元CU2和编码后的1～N‑1帧的编码单元CU3；根据编码单元CU1、待编码帧前一帧的编码单元CU2得到当前编码帧的编码单元；根据预测单元PU1确定最终的预测单元模式；根据当前编码帧的编码单元的深度信息类别，决定当前编码帧的编码单元划分模式。本发明大幅减少了CU模式和PU模式的计算复杂度。

Description

一种HEVC视频序列编解码加速方法

技术领域

本发明涉及视频编解码技术领域，更具体的说是涉及一种HEVC视频序列编解码加速方法。

背景技术

当前社会是一个信息交互高度发达的社会，相比于传统的文本图片等形式，视频展现出的信息具有更加生动、直观的优势，因而受到更广泛的关注。随着人们对视频质量要求的不断提高，以H.264为代表的第二代视频编码标准已经逐渐无法满足对高清、超高清视频的压缩要求。2013年1月，ISO/IEC Moving Picture Experts Group(MPEG)和ITU-TVideo Coding Experts Group(VCEG)联合制定了新一代视频编码标准HEVC(HighEfficiency Video Coding)。与上一代编码标准相比，HEVC展现出了显著的优势。在得到视频质量相同的情况下，仅需要原来50％的码率，具有广阔的应用前景。

因此，如何提供一种HEVC视频序列编解码加速方法是本领域技术人员亟需解决的问题。

发明内容

有鉴于此，本发明提供了一种HEVC视频序列编解码加速方法，降低了编解码时间。

为了实现上述目的，本发明采用如下技术方案：

一种HEVC视频序列编解码加速方法，包括以下步骤：

步骤1：对原始视频流进行解码，提取最大编码单元LCU以及预测单元PU1，将最大编码单元LCU内部可进行操作的点进行梯度计算，得到当前点周边像素值的变化情况；

步骤2：将预测单元模式信息PU1内所有点的梯度计算结果相加，得到当前预测单元PU1的复杂度；

步骤3：根据当前预测单元PU1的复杂度进行块大小划分，得到解码后的原始视频流编码单元CU1；

步骤4：根据原始视频流编码单元CU1及预测单元PU1，记录原始视频流量化步长QP1，其中，解码后的视频流1～N帧为训练帧，剩余帧为加速帧，0＜N＜M，M为解码后的视频流总帧数；

步骤5、对解码后的视频流进行再编码，设定再编码流量化步长QP2，同时提取待编码帧前一帧的编码单元CU2和编码后的1～N-1帧的编码单元CU3；

步骤6、根据解码后的原始视频流编码单元CU1、待编码帧前一帧的编码单元CU2得到当前编码帧的编码单元；

步骤7、根据解码后的预测单元PU1确定最终的预测单元模式；

步骤8、根据步骤6得到的当前编码帧的编码单元的深度信息类别，决定当前编码帧的编码单元划分模式。

进一步，引入梯度算法，大致获得当前预测单元PU1的图像复杂度，具体计算过程为：

基于sobel算子的计算，获得当前像素点在X、Y两个不同方向上的梯度值；

基于sobel算子的梯度计算步骤为：

将当前像素点左侧和右侧的3个点像素值按1∶2∶1加权后相减，得到X方向的梯度变化情况Gx，将当前像素点上下两侧3个点像素值按1∶2∶1加权后相减，得到Y方向的梯度变化情况Gy，Gx及Gy的计算如下：

Gx＝Pi-1，j-1+2*Pi-1，j+Pi-1，j+1-Pi+1，j-1-2*Pi+1，j-Pi+1，j+1

Gy＝Pi-1，j-1+2*Pi，j-1+Pi+1，j-1-Pi-1，j+1-2*Pi，j+1-Pi+1，j+1 (1)

式中，Px，y指不同像素点的数值，下标i，j分别代表其在X、Y轴方向上与中心点的位置关系；

对某一个预测单元PU1，将其中所有点的梯度值相加得到当前PU1的图像复杂度K，其公式如公式(2)所示：

K＝∑(|Gx|+|Gy|) (2)

依据图像复杂度信息，确定原始视频流编码单元CU1。

进一步，步骤6中根据解码后的原始视频流编码单元CU1、待编码帧前一帧的编码单元CU2得到当前编码帧的编码单元，具体方法为：

步骤6.1、以解码后的原始视频流第2～N帧的编码单元及待编码帧前一帧的编码单元CU2即1～N-1帧的编码单元信息作为adaboost分类器的两个特征，以编码后的1～N-1帧的编码单元CU3为训练结果，对adaboost分类器进行训练，得到训练完成的adaboost分类器；

步骤6.2、取解码后的视频流加速帧中的编码单元信息和待编码帧前一帧编码单元信息为分类器的两个特征，利用训练完成的分类器，训练得到当前编码帧的编码单元信息。

进一步，步骤6中得到的当前编码帧的编码单元深度信息为0，1，2，3四类。

进一步，步骤7中根据解码后的预测单元模式PU1确定最终的预测单元模式，具体确定方法为：

步骤7.1、设定预测单元模式信息PU候选列表，所述候选列表包括原有预测单元模式和2N*2N预测单元模式；

步骤7.2、利用率失真函数计算两种预测单元模式信息PU的率失真代价,选择率失真代价小的模式作为最终的PU模式。

进一步，步骤7.2中利用率失真函数计算两种预测单元模式信息PU的率失真代价，具体为：

J＝D(Motion)+λModeR(Motion) (3)

式中，J为率失真代价，D(Motion)、R(Motion)分别表示运动模式下的失真数和比特数；λMode表示拉格朗日因子，为常数。

进一步，步骤8中根据步骤6得到的当前编码帧的编码单元的深度信息类别，决定当前编码帧的编码单元划分模式，具体决定方法为：

若深度信息为0类，则设定标志：在64*64尺寸时不进行编码单元分割，深度信息为0类为最优编码单元信息深度；

若深度信息为1类，则跳过64*64大小的率失真代价计算，并设定标志：当尺寸为32*32时，不进行编码单元信息分割；

若深度信息为2类，则跳过64*64及32*32大小的率失真代价计算，并设定标志：当尺寸为16*16时，不进行编码单元信息分割；

若深度信息为3类，则跳过64*64、32*32及16*16大小的率失真代价计算，无需设定flag终止编码单元信息划分。

进一步，N的取值为10。

进一步，QP2&gt；QP1。

经由上述的技术方案可知，与现有技术相比，本发明公开提供了一种HEVC视频序列编解码加速方法，具有以下优点：

1)本发明综合考量CU和PU的编码计算复杂度，从两方面着手降低编码时间。

2)本发明从原始码流中包含的信息出发，在解码端获取所需模式信息，在编码端加以处理利用，流程科学合理，方法易于理解。

3)本发明通过分析实验结果，对CU和PU模式分两种方法处理。CU选用adaboost分类器，通过训练学习，对当前帧CU模式进行分类，免除了冗杂的CU模式率失真代价计算；PU通过实验数据，分析出PU size大量集中的两种模式，大幅减少PU模式的计算复杂度。

4)在处理CU模式时，选取与当前编码帧关联性最大的两个CU模式，原始码流对应帧和当前码流前一帧的信息作为adaboost分类器的输入特征，保证了结果的高精确度。

5)将视频编码与机器学习结合起来，选用的adaboost分类器是所有机器学习方法中表现较好的分类器之一，并且且该类分类器具有便于实现，泛化错误率低且无参数调整等优势。

6)处理PU模式时，将其分为帧内帧间两部分处理，使两种类别的模式决定均能实现时间节省。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1附图为本发明提供的基于HEVC视频序列编解码加速方法的流程图。

图2附图为本发明编码单元信息模式的结构划分及对应深度示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例公开了一种HEVC视频序列编解码加速方法，包括以下步骤：

步骤2：将预测单元模式信息PU1内所有点的梯度计算结果相加，得到当前预测单元PU1的复杂度；具体为：

引入梯度算法，大致获得当前预测单元PU1的图像复杂度，具体计算过程为：

基于sobel算子的梯度计算步骤为：

Gx＝Pi-1，j-1+2*Pi-1，j+Pi-1，j+1-Pi+1，j-1-2*Pi+1，j-Pi+1，j+1

Gy＝Pi-1，j-1+2*Pi，j-1+Pi+1，j-1-Pi-1，j+1-2*Pi，j+1-Pi+1，j+1 (1)

K＝∑(|Gx|+|Gy|) (2)

依据图像复杂度信息，得出最有可能的块大小划分方法。这里的判断可以根据经验阈值完成，下面给出一种基于经验阈值，从大块到小块依次判断的划分方法。

以64x64块为例，如果64x64块中每一个32x32子块的图像复杂度均小于某一阈值，则可认为这个64x64块图像复杂度较低，不需要划分，此时选用64x64作为最有可能的块大小划分；若不满足，则将64x64块划分为4个32x32子块，并对四个32x32子块依次进行图像复杂度分析。依次类推，可以完成32x32、16x16、8x8块的划分选择，并最后得到最有可能的块大小划分方案。这里的经验阈值与图像特性相关，一个可能的经验阈值方案如下表所示

预测单元大小	经验阈值
		64x64	13000
32x32	5000
		16x16	4000
8x8	3000

通过梯度算法，可以快速得出PU1的图像复杂度，继而依据图像复杂度数据可以完成一个最大编码单元(LCU)的块大小划分，得到解码后的原始视频流编码单元CU1。

步骤6、根据解码后的原始视频流编码单元CU1、待编码帧前一帧的编码单元CU2得到当前编码帧的编码单元；具体为：

当前编码帧的编码单元深度信息为0，1，2，3四类。

步骤7、根据解码后的预测单元PU1确定最终的预测单元模式；具体为：

步骤7.2、利用率失真函数计算两种预测单元模式信息PU的率失真代价,选择率失真代价小的模式作为最终的PU模式，其计算公式为：

J＝D(Motion)+λModeR(Motion) (3)

步骤8、根据步骤6得到的当前编码帧的编码单元的深度信息类别，决定当前编码帧的编码单元划分模式。具体决定方法为：

进一步，N的取值为10。

本发明公开的一种HEVC视频序列编解码加速方法适用于各种特征的视频编解码，包括不同视频分辨率(包括高分辨率，中分辨率，低分辨率)；不同视频运动类型(包括高速运动，中速运动，低速运动)，不同视频纹理(包括细致纹理，粗糙纹理等多种类型)等。

本发明在同一视频序列中既实现了数据的提取训练过程，同时利用预测出的结果进行编码，即做到了视频的训练和加速编码过程的一体化，不需要预先训练分类器，保证了结果的准确性和实时性。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种HEVC视频序列编解码加速方法，其特征在于，包括以下步骤：

步骤7、根据解码后的预测单元PU1确定最终的预测单元模式；

2.根据权利要求1所述的一种HEVC视频序列编解码加速方法，其特征在于，引入梯度算法，大致获得当前预测单元PU1的图像复杂度，具体计算过程为：

基于sobel算子的梯度计算步骤为：

Gx＝Pi-1，j-1+2*Pi-1，j+Pi-1，j+1-Pi+1，j-1-2*Pi+1，j-Pi+1，j+1

Gy＝Pi-1，j-1+2*Pi，j-1+Pi+1，j-1-Pi-1，j+1-2*Pi，j+1-Pi+1，j+1 (1)

K＝∑(|Gx|+|Gy|) (2)

依据图像复杂度信息，确定原始视频流编码单元CU1。

3.根据权利要求1所述的一种HEVC视频序列编解码加速方法，其特征在于，步骤6中根据解码后的原始视频流编码单元CU1、待编码帧前一帧的编码单元CU2得到当前编码帧的编码单元，具体方法为：

4.根据权利要求1所述的一种HEVC视频序列编解码加速方法，其特征在于，步骤6中得到的当前编码帧的编码单元深度信息为0，1，2，3四类。

5.根据权利要求1所述的一种HEVC视频序列编解码加速方法，其特征在于，步骤7中根据解码后的预测单元模式PU1确定最终的预测单元模式，具体确定方法为：

6.根据权利要求5所述的一种HEVC视频序列编解码加速方法，其特征在于，步骤7.2中利用率失真函数计算两种预测单元模式信息PU的率失真代价，具体为：

J＝D(Motion)+λModeR(Motion) (3)

7.根据权利要求1所述的一种HEVC视频序列编解码加速方法，其特征在于，步骤8中根据步骤6得到的当前编码帧的编码单元的深度信息类别，决定当前编码帧的编码单元划分模式，具体决定方法为：

8.根据权利要求1所述的一种HEVC视频序列编解码加速方法，其特征在于，N的取值为10。

9.根据权利要求1所述的一种HEVC视频序列编解码加速方法，其特征在于，QP2&gt；QP1。