CN111598119A

CN111598119A - 一种基于残差网络的图像聚类方法

Info

Publication number: CN111598119A
Application number: CN202010097908.4A
Authority: CN
Inventors: 邹强; 李旺
Original assignee: Tianjin University
Current assignee: Tianjin University
Priority date: 2020-02-18
Filing date: 2020-02-18
Publication date: 2020-08-28

Abstract

本发明公开了一种基于残差网络的聚类算法，利用深层次的残差网络Resnet50进行特征提取，将输入的高维数据映射到低维特征空间，在低维特征空间上进行K均值算法聚类从而得出分类标签，其中聚类网络利用神经网络框架中的可训练权值进行定义。同时在低维特征空间使用Softmax分类器进行分类，以聚类产生的标签作为参考标签，进行训练。相较于传统的聚类算法，本发明大大提升了无监督学习的准确度。

Description

一种基于残差网络的图像聚类方法

技术领域

本发明属于图像处理技术领域，具体涉及一种基于残差网络的图像聚类方法。

背景技术

图像分类，根据各自在图像信息中所反映的不同特征，把不同类别的目标区分开来的图像处理方法。它利用计算机对图像进行定量分析，把图像或图像中的每个像元或区域划归为若干个类别中的某一种，以代替人的视觉判读。特征空间的分类方法—首先将原图像经过某种变换如K-L变换，小波变换等变换到特征空间,然后在特征空间提取图像的高层特征以实现图像的分类。基于深度学习的图像分类，通常使用卷积神经网络对输入图像进行特征提取，映射到新的特征空间，然后利用softmax等分类器进行分类。

无监督学习的特点是，模型学习的数据没有标签，因此无监督学习的目标是通过对这些无标签样本的学习来揭示数据的内在特性及规律，其代表就是聚类。聚类算法是机器学习中涉及对数据进行分组的一种算法。在理论上，相同的组的数据之间有相同的属性或者是特征，不同组数据之间的属性或者特征相差就会比较大。K均值聚类算法是最常见的聚类算法。k-均值聚类算法的核心思想是通过迭代把数据对象划分到不同的簇中，以求目标函数最小化，从而使生成的簇尽可能地紧凑和独立。首先，随机选取k个对象作为初始的k个簇的质心；然后，将其余对象根据其与各个簇质心的距离分配到最近的簇；再求新形成的簇的质心。这个迭代重定位过程不断重复，直到目标函数最小化为止。

残差网络是由来自Microsoft Research的4位学者提出的卷积神经网络，在2015年的ImageNet大规模视觉识别竞赛(中获得了图像分类和物体识别的优胜。残差网络的特点是容易优化，并且能够通过增加相当的深度来提高准确率。其内部的残差块使用了跳跃连接，缓解了在深度神经网络中增加深度带来的梯度消失问题。

发明内容

本发明的目的在于克服现有技术的不足，提供一种基于残差网络的图像聚类方法。

本发明是通过以下技术方案实现的：

一种基于残差网络的图像聚类方法，包括以下步骤：

步骤一：对图像数据集进行数据处理；

步骤二：搭建基于残差模块的卷积神经网络Resnet50，并导入基于ImageNet数据集预训练的权重，根据输入尺寸配置输入层，输入层的输出作为Resnet50的输入，之后用展开层展平Resnet50的输出特征向量，再通过连接全连接层调整特征向量的维度，最后连接一层Softmax作为分类器；

步骤三：定义一种基于Keras中Layer类的聚类层，将步骤二的卷积神经网络中分类器的输入也作为聚类层的输入，以聚类层产生的聚类结果作为分类器的参考标签，对新的整个神经网络进行训练；

步骤四：结束训练后，利用该神经网络对图像数据集进行分类。

在上述技术方案中，神经网络进行训练过程中，其中聚类层的更新依据K均值聚类算法中各个向量与均值之间的方差作为损失函数，使得各个类中的特征向量与各个类质心之间的方差和最小；分类器模块的更新，通过分类器产生的标签和聚类层产生的标签之间的交叉熵作为损失函数进行梯度下降更新。

在上述技术方案中，步骤三中，将Keras中的可训练权重设置为与分类类别数量相同的聚类中心，采用统计学中的T分布，根据特征向量与聚类中心之间的距离进行属于各类概率的计算，进行归一化处理，输出一个维度与分类种类相同的向量，向量中各个值对应着属于各类的概率，总和为1。

本发明的优点和有益效果为：

本发明提出的一种基于残差网络的聚类算法，利用深层次的残差网络Resnet50进行特征提取，将输入的高维数据映射到低维特征空间，在低维特征空间上进行K均值算法聚类从而得出分类标签，其中聚类网络利用神经网络框架中的可训练权值进行定义。同时在低维特征空间使用Softmax分类器进行分类，以聚类产生的标签作为参考标签，进行训练。相较于传统的聚类算法，本发明大大提升了无监督学习的准确度，在没有任何先验知识的支撑下，仅仅对图像数据本身的训练，可以达到较好的效果，避免了图像分类任务中难度较大成本较高的标注难题。

附图说明

图1是本发明的整个神经网络的结构示意图。

图2是步骤二中构建的卷积神经网络的结构示意图。

图3是步骤二的卷积神经网络中分类器的输入作为该聚类层的输入的结构示意图。

对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，可以根据以上附图获得其他的相关附图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面结合具体实施例进一步说明本发明的技术方案。

一种基于残差网络的图像聚类方法，包括以下步骤：

步骤一：对图像数据集进行数据处理，所有图像按照顺序存进一个多维的数组，将图像数据每一个像素除以255，转化为0到1的值，然后对图像进行均值方差归一化处理，每张图像减去数据值的均值并除以数据集的方差，另外对数据集进行一定的数据增强，例如采用随机角度旋转的方式。

步骤二：搭建基于残差模块的卷积神经网络Resnet50，并导入基于ImageNet数据集预训练的权重，根据输入尺寸配置输入层，输入层的输出作为Resnet50的输入，之后用展开层展平Resnet50的输出特征向量，再通过连接全连接层调整特征向量的维度，最后连接一层Softmax作为分类器，组成卷积神经网络，如图2所示。

步骤三：定义一种基于Keras中Layer类的聚类层，将Keras中的可训练权重设置为与分类类别数量相同的聚类中心，采用统计学中的T分布，根据特征向量与聚类中心之间的距离进行属于各类概率的计算，进行归一化处理，输出一个维度与分类种类相同的向量，向量中各个值对应着属于各类的概率，总和为1；将步骤二的卷积神经网络中分类器的输入也作为该聚类层的输入(如图3所示)，并以聚类层的输出，进行最大值的取值，得出One-hot编码的标签结果作为分类器的参考标签，从而构成新的神经网络；

步骤四：对新的神经网络进行训练，其中聚类层的更新依据K均值聚类算法中各个向量与均值之间的方差作为损失函数，使得各个类中的特征向量与各个类质心之间的方差和最小，为确保聚类层训练效果的准确，可以先对数据集进行PCA降维至与聚类层输入相同尺寸的特征空间，之后利用传统K均值聚类算法在PCA降维后的特征空间产生的聚类中心初始化聚类层的权重；分类器模块的更新，通过分类器产生的标签和聚类层产生的标签之间的交叉熵作为损失函数进行梯度下降更新。

例如，在HAM10000数据集上进行训练测试，采用学习率为0.01，动量为0.9的随机梯度下降算法，设置批尺寸为1，对整个数据集进行150次循环训练，以分类结果更新程度结合交叉熵的值作为是否停止训练的参考，根据当前分类结果与上一次分类结果进行比较，若分类结果变化较小，变化的标签占数据集小于阈值0.001，且交叉熵下降到一定值，则训练结束。

步骤五：结束训练后，利用该神经网络对数据集进行分类。

以上对本发明做了示例性的描述，应该说明的是，在不脱离本发明的核心的情况下，任何简单的变形、修改或者其他本领域技术人员能够不花费创造性劳动的等同替换均落入本发明的保护范围。

Claims

1.一种基于残差网络的图像聚类方法，其特征在于，包括以下步骤：

步骤一：对图像数据集进行数据处理；

2.根据权利要求1所述的基于残差网络的图像聚类方法，其特征在于：神经网络进行训练过程中，其中聚类层的更新依据K均值聚类算法中各个向量与均值之间的方差作为损失函数，使得各个类中的特征向量与各个类质心之间的方差和最小；分类器模块的更新，通过分类器产生的标签和聚类层产生的标签之间的交叉熵作为损失函数进行梯度下降更新。

3.根据权利要求1所述的基于残差网络的图像聚类方法，其特征在于：步骤三中，将Keras中的可训练权重设置为与分类类别数量相同的聚类中心，采用统计学中的T分布，根据特征向量与聚类中心之间的距离进行属于各类概率的计算，进行归一化处理，输出一个维度与分类种类相同的向量，向量中各个值对应着属于各类的概率，总和为1。