CN110909796A

CN110909796A - 一种图像分类方法及相关装置

Info

Publication number: CN110909796A
Application number: CN201911159360.5A
Authority: CN
Inventors: 姜金哲; 张新; 朱效民
Original assignee: Inspur Electronic Information Industry Co Ltd
Current assignee: Inspur Electronic Information Industry Co Ltd
Priority date: 2019-11-22
Filing date: 2019-11-22
Publication date: 2020-03-24
Anticipated expiration: 2039-11-22
Also published as: CN110909796B

Abstract

本申请公开了一种图像分类方法，包括利用交叉熵函数进行模型训练得到的图像分类模型执行以下步骤：接收目标图像，并对目标图像进行量子化转换；通过预设通道个数的卷积核作用于量子化转换后的目标图像得到预设个数个特征图像；对特征图像进行卷积操作并通过2×2大小的池化窗口对卷积操作后的卷积输出进行乘积池化；乘积池化后在输出层得到目标图像对各目标种类的得分值，并利用softmax函数基于各所述得分值计算目标图像属于各目标种类的概率值，以及确定概率值最大的目标种类为目标图像所属类别。该方法可有效提高图像分类的准确性与可靠性。本申请还公开了一种图像分类装置、设备以及计算机可读存储介质，均具有上述技术效果。

Description

一种图像分类方法及相关装置

技术领域

本申请涉及人工智能技术领域，特别涉及一种图像分类方法；还涉及一种图像分类装置、设备以及计算机可读存储介质。

背景技术

卷积神经网络具有局部感知、参数共享及多核卷积等特性，在图像识别领域广泛使用，包括人脸识别、行人检测、语音识别、医学图像处理等，即使目标物体的方向、形状、光照条件等发生变化，仍拥有良好的分类精度。量子计算采用一种与传统的计算方式截然不同的新型计算方法，量子并行处理极大地提高了量子计算的效率，使其达到常规计算技术不能达到的解题速度，还可以解决常规计算不能解决的某些计算复杂度很高的问题。量子计算与神经网络融合进行图像分类正逐步成为一个崭新的研究方向。目前，现有的量子门线路神经网络是一种基于量子理论所设计的量子神经网络模型。利用该量子神经网络模型进行图像分类取得了良好的分类效果，在各方面性能上均优于普通BP神经网络。但在，目前的量子门线路神经网络存在如下不足之处：一是在池化过程中，采用的是相邻两个位置进行乘积达到池化目的，这种二维数据上不对称的采样使得量子门线路神经网络在运算过程中大部分处于不对称的状态，同时需面临采样方向的选择问题；二是输出层的损失函数选择，采用的是预测值与目标值的差的平方，导致收敛速度较慢；上述两点技术缺陷均回影响图像分类的准确度与可靠性。

因此，如何提供解决上述技术缺陷已成为本领域技术人员亟待解决的技术问题。

发明内容

本申请的目的是提供一种图像分类方法，能够有效保障图像分类的准确度与可靠性；本申请的另一目的是提供一种图像分类装置、设备以及计算机可读存储介质，均具有上述技术效果。

为解决上述技术问题，本申请提供了一种图像分类方法，包括：

训练图像分类模型；其中，在训练所述图像分类模型的过程中，利用交叉熵函数计算输出层参数的梯度，并根据所述梯度调整所述参数得到符合要求的所述图像分类模型；

利用训练完成的所述图像分类模型执行以下步骤：

接收目标图像，并对所述目标图像进行量子化转换；

通过预设通道个数的卷积核作用于量子化转换后的所述目标图像得到预设个数个特征图像；

对所述特征图像进行卷积操作并通过2×2大小的池化窗口对所述卷积操作后的卷积输出进行乘积池化；

乘积池化后在输出层得到目标图像对各目标种类的得分值，并利用softmax函数基于各得分值计算所述目标图像属于各所述目标种类的概率值，以及确定概率值最大的所述目标种类为所述目标图像所属类别。

可选的，所述对所述目标图像进行量子化转换，包括：

将所述目标图像的像素点的实值的最大值与最小值做差得到基准值；

分别计算各所述像素点的实值与所述最小值的差值并基于所述差值与所述基准值得到各所述像素点对应的概率角度；

基于所述概率角度将所述像素点的实值转化为量子态。

可选的，所述通过预设通道个数的卷积核作用于量子化转换后的所述目标图像得到预设个数个特征图像，包括：

利用Hadamard门将各所述像素点的量子态的概率角度旋转π/4；

利用量子旋转门将概率角度旋转π/4后的所述像素点的量子态的概率角度旋转预设角度；

将所述预设通道个数的卷积核作用于像素点的量子态的概率角度旋转了所述目标角度后的所述目标图像；

对各层卷积输出添加偏置项后得到所述预设个数个特征图像。

可选的，所述对所述特征图像进行卷积操作，包括：

利用量子旋转门对所述特征图像进行卷积操作并对隐藏层各通道添加偏置项。

可选的，所述乘积池化后在输出层得到目标图像对各目标种类的得分值包括：

在输出层利用量子旋转门根据乘积池化后的输出值得到所述目标图像对各目标种类的得分值。

为解决上述技术问题，本申请还提供了一种图像分类装置，包括：

训练模块，用于训练图像分类模型；其中，在训练所述图像分类模型的过程中，利用交叉熵函数计算输出层参数的梯度，并根据所述梯度调整所述参数得到符合要求的所述图像分类模型；

转换模块，用于接收目标图像，并对所述目标图像进行量子化转换；

提取模块，用于通过预设通道个数的卷积核作用于量子化转换后的所述目标图像得到预设个数个特征图像；

卷积与池化模块，用于对所述特征图像进行卷积操作，并通过2×2大小的池化窗口对所述卷积操作后的卷积输出进行乘积池化；

确定模块，用于乘积池化后在输出层得到目标图像对各目标种类的得分值，并利用softmax函数基于各得分值计算所述目标图像属于各所述目标种类的概率值，以及确定概率值最大的所述目标种类为所述目标图像所属类别。

可选的，所述转换模块包括：

第一计算单元，用于将所述目标图像的像素点的实值的最大值与最小值做差得到基准值；

第二计算单元，用于分别计算各所述像素点的实值与所述最小值的差值并基于所述差值与所述基准值得到各所述像素点对应的概率角度；

转换单元，用于基于所述概率角度将所述像素点的实值转化为量子态。

可选的，所述提取模块包括：

第一旋转单元，用于利用Hadamard门将各所述像素点的量子态的概率角度旋转π/4；

第二旋转单元，用于利用量子旋转门将概率角度旋转π/4后的所述像素点的量子态的概率角度旋转预设角度；

提取单元，用于将所述预设通道个数的卷积核作用于像素点的量子态的概率角度旋转了所述目标角度后的所述目标图像，并对各层卷积输出添加偏置项后得到所述预设个数个特征图像。

为解决上述技术问题，本申请还提供了一种图像分类设备，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现如上所述的图像分类方法的步骤。

为解决上述技术问题，本申请还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现如上所述的图像分类方法的步骤。

本申请所提供的图像分类方法，包括训练图像分类模型；其中，在训练所述图像分类模型的过程中，利用交叉熵函数计算输出层参数的梯度，并根据所述梯度调整所述参数得到符合要求的所述图像分类模型；利用训练完成的所述图像分类模型执行以下步骤：接收目标图像，并对所述目标图像进行量子化转换；通过预设通道个数的卷积核作用于量子化转换后的所述目标图像得到预设个数个特征图像；对所述特征图像进行卷积操作并通过2×2大小的池化窗口对所述卷积操作后的卷积输出进行乘积池化；乘积池化后在输出层得到目标图像对各目标种类的得分值，并利用softmax函数基于各得分值计算所述目标图像属于各所述目标种类的概率值，以及确定概率值最大的所述目标种类为所述目标图像所属类别。

可见，在对目标图像进行量子化转换以及得到特征图像的基础上，本申请通过2×2大小的池化窗口进行乘积池化操作，从而无需选择池化方向，有效简化了操作。并且通过2×2大小的池化窗口遍历特征图像可使网络结构的两个维度在池化后共同缩小二分之一，维持相同的尺寸，有效保持了图层的对称性与稳定性，提高了图像分类的准确性。此外，相较于训练过程中使用平方损失函数的传统方式，本申请在模型训练过程中利用交叉熵函数计算输出层参数的梯度，从而可以更好的惩罚不好的预测，在误差较大时梯度下降更快，避免在梯度下降过程中出现梯度消散现象，提高图像分类模型的稳定性，保障图像分类的可靠性。

本申请所提供的图像分类装置、设备以及计算机可读存储介质，均具有上述技术效果。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对现有技术和实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例所提供的一种图像分类方法的流程示意图；

图2为本申请实施例所提供的一种卷积层量子卷积电路图；

图3为本申请实施例所提供的一种输出层全连接量子电路图；

图4为本申请实施例所提供的一种图像分类装置的示意图；

图5为本申请实施例所提供的一种图像分类设备的示意图。

具体实施方式

本申请的核心是提供一种图像分类方法，能够有效保障图像分类的准确度与可靠性；本申请的另一核心是提供一种图像分类装置、设备以及计算机可读存储介质，均具有上述技术效果。

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

请参考图1，图1为本申请实施例所提供的一种图像分类方法的流程示意图；参考图1所示，该图像分类方法包括：

S101：训练图像分类模型；其中，在训练图像分类模型的过程中，利用交叉熵函数计算输出层参数的梯度，并根据梯度调整参数得到符合要求的图像分类模型；

具体的，本步骤旨在进行图像分类模型的训练，以后续利用训练完成的图像分类模型进行图像分类。具体而言，本申请采用梯度下降的方法训练图像分类模型，从图像分类模型的最后一层向第一层逐层反向传播需要训练的参数的梯度，并在梯度方向上调整参数的值，以得到复合要求的图像分类模型。其中，本申请利用交叉熵函数计算输出层的各个参数的梯度，从而较之使用平方损失函数的传统方式，本申请可以更好的惩罚不好的预测，在误差较大时梯度下降更快，避免在梯度下降过程中出现梯度消散现象，提高图像分类模型的稳定性，保障图像分类的可靠性。

可以明白的是，上述训练图像分类模型的步骤可以只执行一次，即图像分类模型训练完成后，后续利用此图像分类模型进行图像分类即可，而无需重复进行图像分类模型的训练。

S102：接收目标图像，并对所述目标图像进行量子化转换；

具体的，本申请所提供的图像分类方法利用量子计算与卷积神经网络相融合的图像分类模型进行图像分类，该图像分类模型训练完成后，便可利用此图像分类模型进行图像分类。其中，本步骤旨在在图像分类模型的表示层对接收到的目标图像进行量子化转换，即将目标图像的各像素点的实值转换为概率分布的量子态，从而利用量子计算的特性，提高运算效率。

在一种具体的实施方式中，上述对目标图像进行量子化转换包括将目标图像的像素点的实值的最大值与最小值做差得到基准值；分别计算各像素点的实值与最小值的差值并基于差值与基准值得到各像素点对应的概率角度；基于概率角度将像素点的实值转化为量子态。

具体的，本实施例采取全局量化的方式对目标图像进行量子化转换，以更好的表征目标图像的整体特性，利于后续准确的进行图像分类。具体而言，首先计算目标图像的各像素点的实值的最大值与最小值的差值，并将此最大值与最小值的差值作为基准值。进一步，分别计算各像素点的实值与该最小值的差值，并基于基准值以及各像素点的实值与该最小值的差值分别得到各像素点对应的概率角度，进而基于概率角度将对应像素点的实值转化为量子态，如如下公式所示：

其中，

表示概率角度，x表示像素点的实值，b＝max(x)，即b表示像素点的实值的最大值，a＝min(x)，即a表示像素点的实值的最小值。

S103：通过预设通道个数的卷积核作用于量子化转换后的目标图像得到预设个数个特征图像；

具体的，将目标图像的各像素点的实值转换为量子态后，本步骤旨在在图像分类模型的表示层进一步将单通道或少数通道的输入值转换为多通道的特征，具体即通过预设通道个数的卷积核作用于量子化转换后的目标图像，从而得到预设个数个特征图像，以为后续进行卷积操作做准备，提升图像分类的准确性。其中，特征图像的个数等于卷积核的通道个数，而对于卷积核的通道个数本申请不做具体限定，可以根据实际需要进行差异性设置。例如，通过m通道的n×n大小的卷积核作用于量子化转换后的目标图像，从而得到m个的n'×n'大小的特征图像。

另外，在一种具体的实施方式中，上述通过预设通道个数的卷积核作用于量子化转换后的目标图像得到预设个数个特征图像包括：利用Hadamard门(哈达玛门)将各像素点的量子态的概率角度旋转π/4；利用量子旋转门将概率角度旋转π/4后的像素点的量子态的概率角度旋转预设角度；将预设通道个数的卷积核作用于像素点的量子态的概率角度旋转了目标角度后的目标图像；对各层卷积输出添加偏置项后得到预设个数个特征图像。

具体的，较之传统的卷积操作，本实施例利用量子门组对量子态进行偏移操作，首先利用Hadamard门对原始的量子态进行H操作，以将各像素点的量子态的概率角度旋转π/4。然后，在此基础上进一步利用量子旋转门R(θ)再将各像素点的量子态的概率角度旋转预设角度θ，如如下公式所示：

R(θ_ij)H|x_ij＞＝cos(φ_ij)|0＞+sin(φ_ij)|1＞＝|φ_ij＞；其中，

完成上述初始化准备后，进一步将预设通道个数的卷积核作用于初始化后的输入值，将各卷积核扫过输入值，对应位置的初始化后的输入值与权重系数ω相乘并求和，进而得到特征图像相应位置的输出，计算公式如下所示：

其中，

进一步，由量子旋转门R(r)对各层卷积输出加上一个偏置项，得到表示层每层的输出为：|y_i'j'＞＝sin(ψ_i'j'+r)；对于n×n大小的卷积核，n'×n'大小的特征图像，则i,j∈n，i',j'∈n'。其中，本实施例选取量子位处于|1＞的状态为表示层每层的实际输出值。

S104：对特征图像进行卷积操作并通过2×2大小的池化窗口对卷积操作后的卷积输出进行乘积池化；

具体的，表示层的输出为隐藏层的输入，且隐藏层由卷积层与池化层的组合叠加构成，即一个卷积层伴随着后面的一个池化层，多个该结构的叠加构成隐藏层，隐藏层的层数由表示层输入的维度和最终输出的大小决定。本步骤即旨在在卷积层与池化层分别对特征图像进行卷积与池化操作。具体而言，在卷积层，采用1×1大小的卷积核进行卷积操作，实现跨通道的交互与信息整合。对于L层卷积层输入|x＞来说，通道数为k_L-1，以及L-1层隐藏层的输出，且需要通过1×1×k_L-1×k_L大小的卷积核进行卷积操作。

其中，在一种具体的实施方式中，上述对所述特征图像进行卷积操作包括利用量子旋转门对所述特征图像进行卷积操作并对隐藏层各通道添加偏置项。具体而言，本实施例中卷积操作同样由量子旋转门R(θ)完成，可以得到k_L通道的n_L维度的卷积输出，k_L表示第L层隐藏层的通道数，计算公式如下所述：

其中，i,j∈n_L。进一步，由量子旋转门R(r)对每一通道再加入偏置项，从而得到卷积层的输出：

卷积层量子卷积电路图如图2所示。

在卷积层完成上述卷积操作后，进一步在池化层进行乘积池化操作。且具体的本申请通过2×2大小的池化窗口进行乘积池化，即通过2×2大小的池化窗口以步长为2扫过输入值，从而达到保持池化后维度减半，并且两个维度上的大小仍然一致的目的，计算公式如下所示：

S105：乘积池化后在输出层得到目标图像对各目标种类的得分值，并利用softmax函数(归一化指数函数)基于各得分值计算目标图像属于各目标种类的概率值，以及确定概率值最大的目标种类为目标图像所属类别。

具体的，通过隐藏层中的多层池化的操作后，输出层的输入为1×1×k_L维度的值，故在图像分类模型的输出层首先将1×1×k_L维度的值转化为k个输出值，即根据乘积池化后的输出值得到目标图像对k个目标种类的得分值。

其中，在一种具体的实施方式中，上述乘积池化后在输出层得到目标图像对各目标种类的得分值包括在输出层利用量子旋转门根据乘积池化后的输出值得到目标图像对各目标种类的得分值。具体而言，本实施例同样利用量子旋转门R(r)完成上述根据乘积池化后的输出值得到目标图像对各目标分类得分值的操作，计算公式如下所示：

输出层的全连接量子电路图如图3所示。

进一步，区别于将各目标种类直接输出的传统方式，本申请在得到目标图像对各目标种类的得分值后，首先利用softmax函数基于各得分值计算目标图像属于各目标种类的概率值，以此作为输出层最终的输出，以后续基于各概率值确定目标图像所属类别，具体即确定概率值最大的目标种类为目标图像所属类别。

综上所述，在对目标图像进行量子化转换以及得到特征图像的基础上，本申请通过2×2大小的池化窗口进行乘积池化操作，从而无需选择池化方向，有效简化了操作。并且通过2×2大小的池化窗口遍历特征图像可使网络结构的两个维度在池化后共同缩小二分之一，维持相同的尺寸，有效保持了图层的对称性与稳定性，提高了图像分类的准确性。此外，相较于训练过程中使用平方损失函数的传统方式，本申请在模型训练过程中利用交叉熵函数计算输出层参数的梯度，从而可以更好的惩罚不好的预测，在误差较大时梯度下降更快，避免在梯度下降过程中出现梯度消散现象，提高图像分类模型的稳定性，保障图像分类的可靠性。

本申请还提供了一种图像分类装置，下文描述的该装置可以与上文描述的方法相互对应参照。请参考图4，图4为本申请实施例所提供的一种图像分类装置的示意图；参考图4所示，该图像分类装置包括：

训练模块10，用于训练图像分类模型；其中，在训练所述图像分类模型的过程中，利用交叉熵函数计算输出层参数的梯度，并根据所述梯度调整所述参数得到符合要求的所述图像分类模型；

转换模块20，用于接收目标图像，并对所述目标图像进行量子化转换；

提取模块30，用于通过预设通道个数的卷积核作用于量子化转换后的所述目标图像得到预设个数个特征图像；

卷积与池化模块40，用于对所述特征图像进行卷积操作，并通过2×2大小的池化窗口对所述卷积操作后的卷积输出进行乘积池化；

确定模块50，用于乘积池化后在输出层得到目标图像对各目标种类的得分值，并利用softmax函数基于各得分值计算所述目标图像属于各所述目标种类的概率值，以及确定概率值最大的所述目标种类为所述目标图像所属类别。

在上述实施例的基础上，作为一种具体的实施方式，转换模块20包括：

在上述实施例的基础上，作为一种具体的实施方式，提取模块30包括：

在上述实施例的基础上，作为一种具体的实施方式，卷积与池化模块40具体用于利用量子旋转门对所述特征图像进行卷积操作并对隐藏层各通道添加偏置项。

在上述实施例的基础上，作为一种具体的实施方式，确定模块50具体用于在输出层利用量子旋转门根据乘积池化后的输出值得到所述目标图像对各目标种类的得分值。

本申请还提供了一种图像分类设备，该图像分类设备包括：存储器1与处理器2；其中，存储器1用于存储计算机程序；处理器2用于执行该计算机程序时实现如下的步骤：

训练图像分类模型；其中，在训练所述图像分类模型的过程中，利用交叉熵函数计算输出层参数的梯度，并根据所述梯度调整所述参数得到符合要求的所述图像分类模型；接收目标图像，并对所述目标图像进行量子化转换；通过预设通道个数的卷积核作用于量子化转换后的所述目标图像得到预设个数个特征图像；对所述特征图像进行卷积操作并通过2×2大小的池化窗口对所述卷积操作后的卷积输出进行乘积池化；乘积池化后在输出层得到所述目标图像对各目标种类的得分值，并利用softmax函数基于各得分值计算所述目标图像属于各所述目标种类的概率值，以及确定概率值最大的所述目标种类为所述目标图像所属类别。

对于本申请所提供的文件***的介绍请参照上述方法的实施例，本申请在此不做赘述。

本申请还提供了一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现如下的步骤：

该计算机可读存储介质可以包括：U盘、移动硬盘、只读存储器(Read-OnlyMemory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

对于本发明所提供的计算机可读存储介质的介绍请参照上述方法实施例，本发明在此不做赘述。

说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置、设备以及计算机可读存储介质而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

专业人员还可以进一步意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块，或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦写可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

以上对本申请所提供的图像分类方法、装置、设备以及计算机可读存储介质进行了详细介绍。本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想。应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请原理的前提下，还可以对本申请进行若干改进和修饰，这些改进和修饰也落入本申请权利要求的保护范围。

Claims

1.一种图像分类方法，其特征在于，包括：

利用训练完成的所述图像分类模型执行以下步骤：

接收目标图像，并对所述目标图像进行量子化转换；

对所述特征图像进行卷积操作，并通过2×2大小的池化窗口对所述卷积操作后的卷积输出进行乘积池化；

2.根据权利要求1所述的图像分类方法，其特征在于，所述对所述目标图像进行量子化转换，包括：

基于所述概率角度将所述像素点的实值转化为量子态。

3.根据权利要求2所述的图像分类方法，其特征在于，所述通过预设通道个数的卷积核作用于量子化转换后的所述目标图像得到预设个数个特征图像，包括：

利用Hadamard门将各所述像素点的量子态的概率角度旋转π/4；

4.根据权利要求3所述的图像分类方法，其特征在于，对所述特征图像进行卷积操作，包括：

5.根据权利要求4所述的图像分类方法，其特征在于，所述乘积池化后在输出层得到目标图像对各目标种类的得分值包括：

6.一种图像分类装置，其特征在于，包括：

7.根据权利要求1所述的图像分类装置，其特征在于，所述转换模块包括：

8.根据权利要求7所述的图像分类装置，其特征在于，所述提取模块包括：

9.一种图像分类设备，其特征在于，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现如权利要求1至5任一项所述的图像分类方法的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至5任一项所述的图像分类方法的步骤。