CN113420786A

CN113420786A - 一种特征混合图像的半监督分类方法

Info

Publication number: CN113420786A
Application number: CN202110599001.2A
Authority: CN
Inventors: 姚博; 文成林; 徐晓滨
Original assignee: Hangzhou Dianzi University
Current assignee: Hangzhou Dianzi University
Priority date: 2021-05-31
Filing date: 2021-05-31
Publication date: 2021-09-21

Abstract

本发明提供一种特征混合图像的半监督分类方法，涉及计算机图像处理领域。本发明包括以下步骤：制作半监督数据集；对无标签数据做特征融合增广处理；为网络添加一致性度量方法，设计新的目标函数；最后训练网络，测试网络对特征混合图像的分类效果。本发明将多图像混合样本增容技术融入到半监督模型的增广框架，增加训练数据的多样性，引入多种类型噪声干扰，提升了模型的泛化能力，增强模型的鲁棒性，实现对特征混合图像的准确分类。

Description

一种特征混合图像的半监督分类方法

技术领域

本发明属于计算机图像处理领域，尤其涉及一种特征混合图像的半监督分类方法

背景技术

半监督学习是当前机器学习领域的一个重要研究方向，在半监督学习领域中，训练数据通常包含大量的无标签数据，仅针对标注数据进行增广已经不能满足模型的训练要求，尤其当标注数据数量较少时，模型很容易发生过拟合。为解决这一问题，主流的半监督学习模型依靠目标函数中的一致性正则化项，对增广前后的数据分布进行一致性度量，从无标签数据中提取有效信息，增广类型的多样性和复杂性可以有效提高模型的泛化性能及其鲁棒性。

半监督分类领域中，一致性正则化方法主要使用RandAugment增广框架，它定义了一个仅有单图像增广方法的策略空间，每幅图像随机选取增广方法，生成对应的增广数据。除单图像增广外，Mixup混合数据增广方法采用对不同类别数据之间进行建模的方式实现数据增强，在监督学习下的图像分类领域取得了显著的性能提升。Mixup作为混合增广方法，通常会生成包含有多个目标特征的混合图像，混合图像常见于人工修改的图像或者杂交物种图像。由于混合图像不属于任何确定已知类别，无法直接加入RandAugment的策略空间，进行一致性度量，这给半监督下混合图像的分类带来了困难。

发明内容

本发明旨在提出一种特征混合图像的半监督分类方法，实现在仅有少量标注数据时，对特征混合图像的快速、准确分类。

本发明具体步骤如下：

步骤1，搜集整理需要分类对象的图像作为数据集，对每种类别的图像仅做部分标注。

步骤2，对数据集中每一幅无标注图像做多次特征混合增广。

步骤3，为卷积网络设计有关无标注图像及增广图像的一致性度量方法，改进网络的目标函数。

步骤4，将包含标注图像、无标注图像和增广图像的数据集输入改进后的卷积网络，进行训练直至网络收敛。

步骤5，将具有多目标特征的混合图像作为测试集，得到图像分类结果。

进一步地，步骤1中，为保证网络训练中类别概率相等，每种类别的标注图像数目一致，即类别标注均衡。

进一步地，步骤2中，在做无标注图像增广时，除去常用的拉伸、反转、剪裁等单图像增广以外，还使用了Mixup混合数据增广方法，生成具有多种类别特征的混合图像。

进一步地，步骤3中，包括如下子步骤：

3.1选择KL散度作为一致性度量方式，表示输入增广前后模型预测输出的偏差。

3.2改进后的网络目标函数不仅包括传统标注图像的交叉熵，还包括无标注图像的一致性度量。

进一步地，步骤4中，网络训练的每一步中，标注图像、无标注图像和增广图像同时被输入网络，标注图像经过特征提取后根据标注计算交叉熵，对无标注图像及其增广图像做网络输出的一致性度量，二者共同参与梯度计算。

进一步地，步骤5中，网络对难以分类的多特征混合图像输出类别概率，表明混合特征的类别来源，得到混合图像的分类结果。

本发明的有益效果是：

(1)提高模型的泛化能力。将多图像混合样本增容技术融入到半监督模型的增广框架，增加训练数据的多样性，提升了模型的泛化能力。

(2)增强模型的鲁棒性。混合图像在增容的多样数据样本上引入多种类型噪声干扰，降低模型对受扰样本数据的敏感性。

(3)提升对混合图像的分类能力。多模式生成的特征混合样本，建立起与原图像一致性度量的评估方法，并将其纳入半监督学习模型中，在进一步提高模型的泛化能力的同时，提升了对混合图像的分类能力。

附图说明

图1是半监督学习下特征混合图像的分类流程图；

图2是本发明中Mixup混合图像的信息保存示意图。

具体实施方式

本发明提供了一种特征混合图像的半监督分类方法，下面结合附图对本发明作进一步说明。

如图1所示，本发明提供了一种特征混合图像的半监督分类方法，包括以下步骤：

步骤1制作半监督数据集：

选择CIFAR-10数据集作为分类对象，共有50000张训练图片，分为10个类别，每个类别有5000张标注图像。随机选择每个类别中的N_ul个图片保留标签，其余所有训练数据删除标签，仅保留图像，作为半监督训练集。

步骤2特征混合增广：

对数据集中每一幅无标注图像做多次特征混合增广。Mixup混合数据增广方法通过对图像和标签进行插值，达到数据增强的目的，以x表示图像，y表示标签，具体如下式：

其中λ代表混合系数，由参数为α,β的Beta分布抽样取得。(x₁,y₁)和(x₂,y₂)是随机抽取的两个样本。

本方法中无标签数据没有用于混合的标签，仅能对图像进行插值生成混合张量mixed_x，因此，把特征混合图像的标签处理放在步骤3的一致性正则化中。

Mixup多图像混合与单图像增广另一点不同是需要枚举并记录两张或以上的图像，以便进一步融合、做一致性度量。为了保证方法的随机性，采用双端队列(Queue)记录参与多图像混合的数据。

如图2所示，队列(Queue)内部存储用于混合的原始图像，若在上一时刻，原始图像x₁与原始图像x₂生成混合图像A，存储为混合信息A；则当前时刻将原始图像x₁弹出队列，原始图像x₂加入，生成混合图像B，存储为混合信息B；下一时刻将原始图像x₂弹出队列，原始图像x₃加入队进行混合并存储信息。继续进行直至遍历所有需要进行混合增强的输入图像。其中混合信息记录混合图像以及混合前的两张原图信息。

步骤3一致性度量：

一致性度量方法目的在于向网络的目标函数中添加正则化项，防止在少量的标注数据情况下网络过拟合的发生。一致性正则化的主要思想是对于一个输入，即使受到微小的干扰，其预测应该都是一致的，即同一对象增广前后，网络预测输出不变。这与大多数目标函数的目的是一致的，也就是希望预测能够与标签一致。针对增广前后的数据进行一致性度量，KL散度的度量方式D_KL可以表示为下式：

其中

是样本x的增广数据，f_θ(.)表示训练中的模型，模型参数为θ。将混合张量mixed_x传递给训练中的模型f_θ(.)可以得到输出张量mixed_out。在训练过程中，将模型的输出张量mixed_out分别对混合前的原图进行一致性度量，并根据图像的混合系数λ对多个度量值加权求和，作为正则化项加入目标函数，具体表达如下式：

d_kl＝λD_KL(x₁||mixed_out)+(1-λ)D_KL(x₂||mixed_out)(3)

最终网络的目标函数L如下式：

L＝H(N_l)+d_kl(N_ul)(4)

其中N_l代表标注数据，H(N_l)代表标注数据的交叉熵，N_ul代表无标注数据，d_kl(N_ul)代表无标注数据的一致性正则化项。

步骤4：网络训练

网络采用基于TensorFlow实现的WRN-28-10，相比深度残差网络(ResNet)，WRN增加了残差块(Resblock)内卷积核的宽度，即增加卷积层的特征数，使得相同深度下WRN比传统ResNet效果更好，同时削减网络深度，加快网络收敛速度。

步骤5：对特征混合图像分类

将具有多目标特征的混合图像作为测试集，网络对难以分类的多特征混合图像输出类别概率，表明混合特征的类别来源，得到混合图像的分类结果。

本发明通过将多图像混合增广技术融入半监督领域，增加了训练数据的多样性，提升了模型泛化能力的同时在训练阶段引入了多种噪声，增强模型的鲁棒性。多模式生成的特征混合样本，建立起与原图像一致性度量的评估方法，并将其纳入半监督学习模型中，在进一步提高模型的泛化能力的同时，提升了对混合图像的分类能力。实现了在仅有少量标注数据时，对特征混合图像的快速、准确的分类。

Claims

1.一种特征混合图像的半监督分类方法，其特征在于，该方法包括以下步骤：

步骤1，搜集整理需要分类对象的图像作为数据集，对每种类别的图像仅做部分标注；

步骤2，对数据集中每一幅无标注图像做多次特征混合增广；

步骤3，为卷积网络设计有关无标注图像及增广图像的一致性度量方法，改进网络的目标函数；

步骤4，将包含标注图像、无标注图像和增广图像的数据集输入改进后的卷积网络，进行训练直至网络收敛；

2.根据权利要求1所述的一种特征混合图像的半监督分类方法，其特征在于，在步骤1中，每种类别的标注图像数目一致，即类别标注均衡。

3.根据权利要求1所述的一种特征混合图像的半监督分类方法，其特征在于，在步骤2中，做图像增广时，除去常用的拉伸、反转、剪裁的单图像增广以外，还使用了Mixup混合数据增广方法，生成具有多种类别特征的混合图像。

4.根据权利要求1所述的一种特征混合图像的半监督分类方法，其特征在于，在步骤3中，选择KL散度作为一致性度量方式，表示输入增广前后模型预测输出的偏差。

5.根据权利要求1所述的一种特征混合图像的半监督分类方法，其特征在于，在步骤3中，改进后的网络目标函数不仅包括传统标注图像的交叉熵，还包括无标注图像的一致性度量。

6.根据权利要求1所述的一种特征混合图像的半监督分类方法，其特征在于，在步骤4中，网络训练的每一步中，标注图像、无标注图像和增广图像同时被输入网络，标注图像经过特征提取后根据标注计算交叉熵，对无标注图像及其增广图像做网络输出的一致性度量，二者共同参与梯度计算。

7.根据权利要求1所述的一种特征混合图像的半监督分类方法，其特征在于，在步骤5中，网络对难以分类的多特征混合图像输出类别概率，表明混合特征的类别来源，得到混合图像的分类结果。