CN116634150B

CN116634150B - 基于频繁模式分类的帧间图像编码方法、装置及存储介质

Info

Publication number: CN116634150B
Application number: CN202310898183.2A
Authority: CN
Inventors: 蒋先涛; 柳云夏; 郭咏梅; 郭咏阳
Original assignee: Ningbo Kangda Kaineng Medical Technology Co ltd
Current assignee: Ningbo Kangda Kaineng Medical Technology Co ltd
Priority date: 2023-07-21
Filing date: 2023-07-21
Publication date: 2023-12-12
Anticipated expiration: 2043-07-21
Also published as: CN116634150A

Abstract

本发明公开了一种基于频繁模式分类的帧间图像编码方法、装置及存储介质，涉及图像处理技术领域，包括步骤：以编码划分相关参数为特征向量集进行项目集度量逐次增加下的频繁项目集筛选；以最终筛选出的满足最小支持度的频繁项目集为基础进行关联规则的生成；将关联规则作为特征扩展数据与对应参数学习帧作为输入数据对径向基神经网络进行编码划分模式训；基于训练后的径向基神经网络对参数学习帧对应画面组中的帧间图像进行编码划分模式的判定。本发明通过分析帧内编码帧不同编码划分相关参数不同聚类下的支持度关系，从而使得训练后的径向基神经网络能以更高效的处理方式进行编码划分模式判定。

Description

基于频繁模式分类的帧间图像编码方法、装置及存储介质

技术领域

本发明涉及图像处理技术领域，具体涉及一种基于频繁模式分类的帧间图像编码方法、装置及存储介质。

背景技术

现有的视频编码技术中，H.266（VVC）在提供更高压缩效率的同时，同时也带来了更高的计算复杂度。这是由于H.266采用了更为复杂的算法和技术，相比于H.265，H.266需要更多的算力资源和运存空间来执行编解码操作。这就导致在实际应用中，H.266的编码和解码速度可能很慢，因此它对硬件设备和***性能具有更高的需求。为了降低H.266的计算复杂度，目前提出了一些改进方案：（1）硬件加速：利用专用的硬件加速器（如GPU、FPGA等）来提高H.266的编解码速度。这样可以充分利用硬件的并行计算能力，加快编解码过程。（2）并行处理：利用并行处理技术，将编解码任务分解为多个子任务，并同时在多个处理单元上进行处理。这可以提高整体的编解码效率，缩短处理时间。（3）算法优化：通过改进编解码算法和技术，减少计算复杂度。例如，通过减少冗余计算、优化运算顺序、引入快速算法等方法来提高编解码效率。之前的方法没有很好地平衡好H.266编码质量、编码计算复杂度和编码效率的关系，因此，亟需一种新的编码方法以解决上述问题。

发明内容

为了更好的兼顾编码质量的同时降低编码复杂度、提高编码效率，本发明提出了一种基于频繁模式分类的帧间图像编码方法，包括步骤：

S1：提取各目标视频各画面组中的帧内编码帧作为参数学习帧；

S2：以编码划分相关参数为特征向量集进行项目集度量逐次增加下的频繁项目集筛选；

S3：以最终筛选出的满足最小支持度的频繁项目集为基础进行关联规则的生成；

S4：将关联规则作为特征扩展数据与对应参数学习帧作为输入数据对径向基神经网络进行编码划分模式训练；

S5：基于训练后的径向基神经网络对参数学习帧对应画面组中的帧间图像进行编码划分模式的判定。

进一步地，所述S2步骤中，特征向量集包括编码划分模式、率失真函数、预测残差、编码深度、纹理复杂度和运动矢量预测。

进一步地，所述S2步骤中，频繁项目集的筛选具体包括如下步骤：

A1：以单个特征向量为起始度量，获取各频繁单项集对应特征向量在参数学习帧进行编码划分时的支持度，并筛选出大于最小支持度的频繁单项集；

A2：度量加一，并在上一度量筛选结果的基础上进行当前度量满足最小支持度各频繁多项集的筛选；

A3：判断当前度量下是否存在满足最小支持度的频繁多项集筛选结果，若是，返回A2步骤，若否，以上一度量筛选出的各频繁多项集为最终筛选结果。

进一步地，所述S3步骤中，关联规则通过如下方式获取：

提取最终筛选出频繁项目集的所有真子集，以排列组合的方式生成关联规则。

进一步地，所述S4步骤中，输入数据包括特征向量集和特征扩展数据，径向基神经网络通过编码划分模式训练获得径向基函数的中心、径向基函数的方差，以及隐含层到输出层的权值。

进一步地，所述S4步骤中，径向基神经网络基于选择的径向基函数中心，将输入数据映射到高维特征空间，通过获取每个特征向量的活跃程度，并与特征扩展数据相比较实现模型的训练，进而获得径向基函数的中心、径向基函数的方差，以及隐含层到输出层的权值。

进一步地，所述S5步骤中，编码划分模式的判定表示为如下公式：

式中，r为欧式径向基函数，x为输入数据，为径向基函数隐含层中第i个节点的中心，/>为激活函数，/>为径向基函数的方差，/>为径向基神经网络输出层中第j个节点的编码划分模式判定结果，i为隐含层节点序号，h为隐含层节点总数，/>为隐含层第i个节点到输出层第j个节点的权值。

还包括一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现一种基于频繁模式分类的帧间图像编码方法的步骤。

还包括一种处理数据的装置，包括：

存储器，其上存储有计算机程序；

处理器，用于执行所述存储器中的计算机程序，以实现一种基于频繁模式分类的帧间图像编码方法的步骤。

与现有技术相比，本发明至少含有以下有益效果：

本发明所述的一种基于频繁模式分类的帧间图像编码方法、装置及存储介质，利用同一图像组中各帧间图像具有相似编码划分模式选择趋势的特点，通过分析帧内编码帧不同编码划分相关参数不同聚类下的支持度关系，对径向基神经网络进行训练，从而使得训练后的网络能够通过分析输入数据与对应中心点的距离，从而实现高效准确的编码划分模式判定，而无需对所有特征向量进行参考计算，降低计算复杂度。

附图说明

图1为一种基于频繁模式分类的帧间图像编码方法的步骤图。

具体实施方式

以下是本发明的具体实施例并结合附图，对本发明的技术方案作进一步的描述，但本发明并不限于这些实施例。

实施例一

VVC依旧沿袭了传统的混合编码结构，相比HEVC，它扩充了编码块的结构划分方式，并在量化变换、预测编码、熵编码等多个模块增添了许多新的编码技术。在编码块结构方面，VVC采用四叉树嵌套多叉树（Quad-tree nested in Multi-Type tree，QTMT）的划分结构。VVC中CU共有六种划分方式：不划分（NS），四叉树划分（QT）、水平二叉树划分（BTH）、垂直二叉树划分（BTV）、水平三叉树划分（TTH）、垂直三叉树划分（TTV）。多类型树划分结构大大增加了VVC编码的计算复杂度，使得其编码效率反而有所下降，因此传统的VVC编码技术并不适用于实时处理的应用场景。为此，如图1所示，本发明提出了一种基于频繁模式分类的帧间图像编码方法，具体包括步骤：

一般来说，决定CU编码划分的特征向量有率失真函数、预测残差、编码深度、纹理复杂度和运动矢量预测。本发明考虑到同一图像组中帧间图像之间的目标运动是连续的，因此帧间图像之间的画面大致相同，这也就导致了决定编码块相同节点处编码划分模式的特征向量具有极大的相似性。因此，本发提出了一种基于分析各特征向量以及编码划分模式判定之间的聚类分析方法，通过获取各特征向量以及特征向量之间聚合的频繁程度实现对帧间图像的编码划分模式判定。

同时，由于视频数据是由一组一组的画面组组成的，画面组中包含若干帧的帧间图像，而在这些帧间图像中，时序上排在第一帧的帧间图像（也即是帧内编码帧，I帧）往往具有全部的编码信息，简单的理解就是一帧画面的全部保留，无需参考其他图像便可独立进行解码。

结合上述，本发明提出将帧内编码帧用于频繁聚类下的编码划分模式分析判定。具体地，首先对目标视频当前画面组中的帧内编码帧进行特征向量的提取，具体包括率失真函数、预测残差、编码深度、纹理复杂度和运动矢量预测，以及相对应的编码划分模式。根据这些提取的特征向量，为了研究各特征向量之间不同的组合排列与编码划分模式的关系，我们用频繁项目集（以K表示项目集的度量，也即是长度）表示这些特征向量的组合（为满足后续的计算需求，这些特征向量需先进行归一化处理）。

在这里，为了保证所有的特征向量组合都能够被考虑到，先令K=1，也即是以单个特征向量为起始度量，形成多个频繁单项集，获取这些频繁单项集对应特征向量在参数学习帧进行编码划分时的支持度。支持度越高说明，该组合下的特征向量集对于编码划分模式的判定影响越大，因此，在保证充分分析的同时为了降低计算量，在这里还设置了最小支持度的限制，只有那些支持度大于最小支持度的频繁单项集才能进入下一度量的筛选。

而在完成了度量1下的频繁项目集筛选后，度量加一（也即是K=2），进行该度量最小支持度下的筛选，同时，也是从该度量开始，为了避免已经被剔除的频繁项目集再次进入筛选，造成计算量的浪费，在K=2以后，都是以K-1度量下的筛选结果进行当前度量K的频繁项目集筛选。

在度量增长的情况下重读上述操作，直到无法筛选出满足最小支持度的频繁项目集。将最终获得的频繁多项集全部取出，而后提取出这些频繁项目集的所有真子集，并以排列组合的形式生成所需要的关联规则，并对这些关联规则进行置信度以及提升度的计算，筛选出符合要求的关联则。

将关联规则作为特征扩展数据的一部分作为后续神经网络的输入。在这里，本发明选用径向基神经网络（RBFNN）进行分析编码划分模式的训练分析工具。径向基神经网络是一种以径向基函数（RBF）为激活函数的神经网络，由于RBF的存在，使得RBFNN相较于反向传播网络（BP）具有局部响应的特性，更加适用于这类多分类以及多输入的分析判定。RBFNN的网络结构包括输入层、隐含层和输出层。要实现通过RBFNN对帧间图像的编码划分模式判定，就需要先确定径向基函数的中心、径向基函数的方差，以及隐含层到输出层的权值。为此，我们以帧内编码帧中提取到的特征向量集，结合特征扩展数据作为神经网络的输入对RBFNN进行训练，并提取训练结果中最接近真实帧内编码帧编码划分模式时对应的径向基函数的中心、径向基函数的方差，以及隐含层到输出层的权值。

在普通的RBFNN中，其激活函数表示为如下公式：

式中，r为欧式径向基函数，x为输入数据，为径向基函数隐含层中第i个节点的中心。

而在本发明中，在上述基础上对激活函数进行了进一步改进，采用的是拟多二次函数：

式中，为激活函数，/>为径向基函数的方差。那么改进后RBFNN的输出函数则为：

式中，为径向基神经网络输出层中第j个节点的编码划分模式判定结果，i为隐含层节点序号，h为隐含层节点总数，/>为隐含层第i个节点到输出层第j个节点的权值。

这么改进的好处在于，由于提供了更明确的梯度方向和梯度幅值，从而可以加速神经网络的训练过程，减少训练时间和计算成本，帮助神经网络更快地收敛到全局最优解。

这样，再通过帧内编码帧对径向基神经网络进行训练后，就可以利用训练好的模型对同一画面组中的后续帧间图像进行编码划分模式的判定分析。

同时，本发明还包括一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现一种基于频繁模式分类的帧间图像编码方法的步骤。

还包括一种处理数据的装置，包括：

存储器，其上存储有计算机程序；

综上所述，本发明所述的一种基于频繁模式分类的帧间图像编码方法、装置及存储介质，利用同一图像组中各帧间图像具有相似编码划分模式选择趋势的特点，通过分析帧内编码帧不同编码划分相关参数不同聚类下的支持度关系，对径向基神经网络进行训练，从而使得训练后的网络能够通过分析输入数据与对应中心点的距离，从而实现高效准确的编码划分模式判定，而无需对所有特征向量进行参考计算，降低计算复杂度。

需要说明，本发明实施例中所有方向性指示（诸如上、下、左、右、前、后……）仅用于解释在某一特定姿态（如附图所示）下各部件之间的相对位置关系、运动情况等，如果该特定姿态发生改变时，则该方向性指示也相应地随之改变。

另外，在本发明中如涉及“第一”、“第二”、“一”等的描述仅用于描述目的，而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。

在本发明中，除非另有明确的规定和限定，术语“连接”、“固定”等应做广义理解，例如，“固定”可以是固定连接，也可以是可拆卸连接，或成一体；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通或两个元件的相互作用关系，除非另有明确的限定。对于本领域的普通技术人员而言，可以根据具体情况理解上述术语在本发明中的具体含义。

另外，本发明各个实施例之间的技术方案可以相互结合，但是必须是以本领域普通技术人员能够实现为基础，当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在，也不在本发明要求的保护范围之内。

Claims

1.一种基于频繁模式分类的帧间图像编码方法，其特征在于，包括步骤：

S5：基于训练后的径向基神经网络对参数学习帧对应画面组中的帧间图像进行编码划分模式的判定；

所述S2步骤中，频繁项目集的筛选具体包括如下步骤：

2.如权利要求1所述的一种基于频繁模式分类的帧间图像编码方法，其特征在于，所述S2步骤中，特征向量集包括编码划分模式、率失真函数、预测残差、编码深度、纹理复杂度和运动矢量预测。

3.如权利要求1所述的一种基于频繁模式分类的帧间图像编码方法，其特征在于，所述S3步骤中，关联规则通过如下方式获取：

4.如权利要求1所述的一种基于频繁模式分类的帧间图像编码方法，其特征在于，所述S4步骤中，输入数据包括特征向量集和特征扩展数据，径向基神经网络通过编码划分模式训练获得径向基函数的中心、径向基函数的方差，以及隐含层到输出层的权值。

5.如权利要求4所述的一种基于频繁模式分类的帧间图像编码方法，其特征在于，所述S4步骤中，径向基神经网络基于选择的径向基函数中心，将输入数据映射到高维特征空间，通过获取每个特征向量的活跃程度，并与特征扩展数据相比较实现模型的训练，进而获得径向基函数的中心、径向基函数的方差，以及隐含层到输出层的权值。

6.如权利要求4所述的一种基于频繁模式分类的帧间图像编码方法，其特征在于，所述S5步骤中，编码划分模式的判定表示为如下公式：

式中，r为欧式径向基函数，x为输入数据，为径向基函数隐含层中第i个节点的中心，为激活函数，/>为径向基函数的方差，/>为径向基神经网络输出层中第j个节点的编码划分模式判定结果，i为隐含层节点序号，h为隐含层节点总数，/>为隐含层第i个节点到输出层第j个节点的权值。

7.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现权利要求1至6中任一项所述编码方法的步骤。

8.一种处理数据的装置，其特征在于，包括：

存储器，其上存储有计算机程序；

处理器，用于执行所述存储器中的计算机程序，以实现权利要求1至6中任一项所述编码方法的步骤。