CN111598119A - 一种基于残差网络的图像聚类方法 - Google Patents
一种基于残差网络的图像聚类方法 Download PDFInfo
- Publication number
- CN111598119A CN111598119A CN202010097908.4A CN202010097908A CN111598119A CN 111598119 A CN111598119 A CN 111598119A CN 202010097908 A CN202010097908 A CN 202010097908A CN 111598119 A CN111598119 A CN 111598119A
- Authority
- CN
- China
- Prior art keywords
- clustering
- layer
- input
- residual error
- neural network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 17
- 238000012549 training Methods 0.000 claims abstract description 15
- 238000013528 artificial neural network Methods 0.000 claims abstract description 12
- 239000013598 vector Substances 0.000 claims description 21
- 238000013527 convolutional neural network Methods 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 8
- 238000003064 k means clustering Methods 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 2
- 230000006870 function Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 3
- 238000000513 principal component analysis Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Probability & Statistics with Applications (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于残差网络的聚类算法,利用深层次的残差网络Resnet50进行特征提取,将输入的高维数据映射到低维特征空间,在低维特征空间上进行K均值算法聚类从而得出分类标签,其中聚类网络利用神经网络框架中的可训练权值进行定义。同时在低维特征空间使用Softmax分类器进行分类,以聚类产生的标签作为参考标签,进行训练。相较于传统的聚类算法,本发明大大提升了无监督学习的准确度。
Description
技术领域
本发明属于图像处理技术领域,具体涉及一种基于残差网络的图像聚类方法。
背景技术
图像分类,根据各自在图像信息中所反映的不同特征,把不同类别的目标区分开来的图像处理方法。它利用计算机对图像进行定量分析,把图像或图像中的每个像元或区域划归为若干个类别中的某一种,以代替人的视觉判读。特征空间的分类方法—首先将原图像经过某种变换如K-L变换,小波变换等变换到特征空间,然后在特征空间提取图像的高层特征以实现图像的分类。基于深度学习的图像分类,通常使用卷积神经网络对输入图像进行特征提取,映射到新的特征空间,然后利用softmax等分类器进行分类。
无监督学习的特点是,模型学习的数据没有标签,因此无监督学习的目标是通过对这些无标签样本的学习来揭示数据的内在特性及规律,其代表就是聚类。聚类算法是机器学习中涉及对数据进行分组的一种算法。在理论上,相同的组的数据之间有相同的属性或者是特征,不同组数据之间的属性或者特征相差就会比较大。K均值聚类算法是最常见的聚类算法。k-均值聚类算法的核心思想是通过迭代把数据对象划分到不同的簇中,以求目标函数最小化,从而使生成的簇尽可能地紧凑和独立。首先,随机选取k个对象作为初始的k个簇的质心;然后,将其余对象根据其与各个簇质心的距离分配到最近的簇;再求新形成的簇的质心。这个迭代重定位过程不断重复,直到目标函数最小化为止。
残差网络是由来自Microsoft Research的4位学者提出的卷积神经网络,在2015年的ImageNet大规模视觉识别竞赛(中获得了图像分类和物体识别的优胜。残差网络的特点是容易优化,并且能够通过增加相当的深度来提高准确率。其内部的残差块使用了跳跃连接,缓解了在深度神经网络中增加深度带来的梯度消失问题。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于残差网络的图像聚类方法。
本发明是通过以下技术方案实现的:
一种基于残差网络的图像聚类方法,包括以下步骤:
步骤一:对图像数据集进行数据处理;
步骤二:搭建基于残差模块的卷积神经网络Resnet50,并导入基于ImageNet数据集预训练的权重,根据输入尺寸配置输入层,输入层的输出作为Resnet50的输入,之后用展开层展平Resnet50的输出特征向量,再通过连接全连接层调整特征向量的维度,最后连接一层Softmax作为分类器;
步骤三:定义一种基于Keras中Layer类的聚类层,将步骤二的卷积神经网络中分类器的输入也作为聚类层的输入,以聚类层产生的聚类结果作为分类器的参考标签,对新的整个神经网络进行训练;
步骤四:结束训练后,利用该神经网络对图像数据集进行分类。
在上述技术方案中,神经网络进行训练过程中,其中聚类层的更新依据K均值聚类算法中各个向量与均值之间的方差作为损失函数,使得各个类中的特征向量与各个类质心之间的方差和最小;分类器模块的更新,通过分类器产生的标签和聚类层产生的标签之间的交叉熵作为损失函数进行梯度下降更新。
在上述技术方案中,步骤三中,将Keras中的可训练权重设置为与分类类别数量相同的聚类中心,采用统计学中的T分布,根据特征向量与聚类中心之间的距离进行属于各类概率的计算,进行归一化处理,输出一个维度与分类种类相同的向量,向量中各个值对应着属于各类的概率,总和为1。
本发明的优点和有益效果为:
本发明提出的一种基于残差网络的聚类算法,利用深层次的残差网络Resnet50进行特征提取,将输入的高维数据映射到低维特征空间,在低维特征空间上进行K均值算法聚类从而得出分类标签,其中聚类网络利用神经网络框架中的可训练权值进行定义。同时在低维特征空间使用Softmax分类器进行分类,以聚类产生的标签作为参考标签,进行训练。相较于传统的聚类算法,本发明大大提升了无监督学习的准确度,在没有任何先验知识的支撑下,仅仅对图像数据本身的训练,可以达到较好的效果,避免了图像分类任务中难度较大成本较高的标注难题。
附图说明
图1是本发明的整个神经网络的结构示意图。
图2是步骤二中构建的卷积神经网络的结构示意图。
图3是步骤二的卷积神经网络中分类器的输入作为该聚类层的输入的结构示意图。
对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,可以根据以上附图获得其他的相关附图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面结合具体实施例进一步说明本发明的技术方案。
一种基于残差网络的图像聚类方法,包括以下步骤:
步骤一:对图像数据集进行数据处理,所有图像按照顺序存进一个多维的数组,将图像数据每一个像素除以255,转化为0到1的值,然后对图像进行均值方差归一化处理,每张图像减去数据值的均值并除以数据集的方差,另外对数据集进行一定的数据增强,例如采用随机角度旋转的方式。
步骤二:搭建基于残差模块的卷积神经网络Resnet50,并导入基于ImageNet数据集预训练的权重,根据输入尺寸配置输入层,输入层的输出作为Resnet50的输入,之后用展开层展平Resnet50的输出特征向量,再通过连接全连接层调整特征向量的维度,最后连接一层Softmax作为分类器,组成卷积神经网络,如图2所示。
步骤三:定义一种基于Keras中Layer类的聚类层,将Keras中的可训练权重设置为与分类类别数量相同的聚类中心,采用统计学中的T分布,根据特征向量与聚类中心之间的距离进行属于各类概率的计算,进行归一化处理,输出一个维度与分类种类相同的向量,向量中各个值对应着属于各类的概率,总和为1;将步骤二的卷积神经网络中分类器的输入也作为该聚类层的输入(如图3所示),并以聚类层的输出,进行最大值的取值,得出One-hot编码的标签结果作为分类器的参考标签,从而构成新的神经网络;
步骤四:对新的神经网络进行训练,其中聚类层的更新依据K均值聚类算法中各个向量与均值之间的方差作为损失函数,使得各个类中的特征向量与各个类质心之间的方差和最小,为确保聚类层训练效果的准确,可以先对数据集进行PCA降维至与聚类层输入相同尺寸的特征空间,之后利用传统K均值聚类算法在PCA降维后的特征空间产生的聚类中心初始化聚类层的权重;分类器模块的更新,通过分类器产生的标签和聚类层产生的标签之间的交叉熵作为损失函数进行梯度下降更新。
例如,在HAM10000数据集上进行训练测试,采用学习率为0.01,动量为0.9的随机梯度下降算法,设置批尺寸为1,对整个数据集进行150次循环训练,以分类结果更新程度结合交叉熵的值作为是否停止训练的参考,根据当前分类结果与上一次分类结果进行比较,若分类结果变化较小,变化的标签占数据集小于阈值0.001,且交叉熵下降到一定值,则训练结束。
步骤五:结束训练后,利用该神经网络对数据集进行分类。
以上对本发明做了示例性的描述,应该说明的是,在不脱离本发明的核心的情况下,任何简单的变形、修改或者其他本领域技术人员能够不花费创造性劳动的等同替换均落入本发明的保护范围。
Claims (3)
1.一种基于残差网络的图像聚类方法,其特征在于,包括以下步骤:
步骤一:对图像数据集进行数据处理;
步骤二:搭建基于残差模块的卷积神经网络Resnet50,并导入基于ImageNet数据集预训练的权重,根据输入尺寸配置输入层,输入层的输出作为Resnet50的输入,之后用展开层展平Resnet50的输出特征向量,再通过连接全连接层调整特征向量的维度,最后连接一层Softmax作为分类器;
步骤三:定义一种基于Keras中Layer类的聚类层,将步骤二的卷积神经网络中分类器的输入也作为聚类层的输入,以聚类层产生的聚类结果作为分类器的参考标签,对新的整个神经网络进行训练;
步骤四:结束训练后,利用该神经网络对图像数据集进行分类。
2.根据权利要求1所述的基于残差网络的图像聚类方法,其特征在于:神经网络进行训练过程中,其中聚类层的更新依据K均值聚类算法中各个向量与均值之间的方差作为损失函数,使得各个类中的特征向量与各个类质心之间的方差和最小;分类器模块的更新,通过分类器产生的标签和聚类层产生的标签之间的交叉熵作为损失函数进行梯度下降更新。
3.根据权利要求1所述的基于残差网络的图像聚类方法,其特征在于:步骤三中,将Keras中的可训练权重设置为与分类类别数量相同的聚类中心,采用统计学中的T分布,根据特征向量与聚类中心之间的距离进行属于各类概率的计算,进行归一化处理,输出一个维度与分类种类相同的向量,向量中各个值对应着属于各类的概率,总和为1。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010097908.4A CN111598119A (zh) | 2020-02-18 | 2020-02-18 | 一种基于残差网络的图像聚类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010097908.4A CN111598119A (zh) | 2020-02-18 | 2020-02-18 | 一种基于残差网络的图像聚类方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111598119A true CN111598119A (zh) | 2020-08-28 |
Family
ID=72181407
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010097908.4A Pending CN111598119A (zh) | 2020-02-18 | 2020-02-18 | 一种基于残差网络的图像聚类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111598119A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113012156A (zh) * | 2021-05-10 | 2021-06-22 | 南京林业大学 | 实木板材颜色智能分类方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108364006A (zh) * | 2018-01-17 | 2018-08-03 | 超凡影像科技股份有限公司 | 基于多模式深度学习的医学图像分类装置及其构建方法 |
CN109086805A (zh) * | 2018-07-12 | 2018-12-25 | 华南理工大学 | 一种基于深度神经网络和成对约束的聚类方法 |
CN110309868A (zh) * | 2019-06-24 | 2019-10-08 | 西北工业大学 | 结合无监督学习的高光谱图像分类方法 |
CN110569793A (zh) * | 2019-09-09 | 2019-12-13 | 西南交通大学 | 一种无监督相似性判别学习的目标跟踪方法 |
-
2020
- 2020-02-18 CN CN202010097908.4A patent/CN111598119A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108364006A (zh) * | 2018-01-17 | 2018-08-03 | 超凡影像科技股份有限公司 | 基于多模式深度学习的医学图像分类装置及其构建方法 |
CN109086805A (zh) * | 2018-07-12 | 2018-12-25 | 华南理工大学 | 一种基于深度神经网络和成对约束的聚类方法 |
CN110309868A (zh) * | 2019-06-24 | 2019-10-08 | 西北工业大学 | 结合无监督学习的高光谱图像分类方法 |
CN110569793A (zh) * | 2019-09-09 | 2019-12-13 | 西南交通大学 | 一种无监督相似性判别学习的目标跟踪方法 |
Non-Patent Citations (2)
Title |
---|
王惠等: "视频序列中自适应背景的运动目标提取", 《微计算机信息》 * |
王改华等: "采用无监督学习算法与卷积的图像分类模型", 《华侨大学学报(自然科学版)》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113012156A (zh) * | 2021-05-10 | 2021-06-22 | 南京林业大学 | 实木板材颜色智能分类方法 |
CN113012156B (zh) * | 2021-05-10 | 2022-02-01 | 南京林业大学 | 实木板材颜色智能分类方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103605972B (zh) | 一种基于分块深度神经网络的非限制环境人脸验证方法 | |
CN108038122B (zh) | 一种商标图像检索的方法 | |
Yin et al. | Scene classification based on single-layer SAE and SVM | |
CN112528928B (zh) | 一种基于自注意力深度网络的商品识别方法 | |
CN111652236A (zh) | 弱监督场景下跨层特征交互的轻量级细粒度图像识别方法 | |
CN106408039A (zh) | 一种基于形变方法进行数据扩展的脱机手写汉字识别方法 | |
CN105469080B (zh) | 一种人脸表情识别方法 | |
CN110751027B (zh) | 一种基于深度多示例学习的行人重识别方法 | |
Djeddi et al. | Artificial immune recognition system for Arabic writer identification | |
CN105631416A (zh) | 采用新型密度聚类进行人脸识别的方法 | |
CN114444600A (zh) | 基于记忆增强原型网络的小样本图像分类方法 | |
CN111652273A (zh) | 一种基于深度学习的rgb-d图像分类方法 | |
CN111371611B (zh) | 一种基于深度学习的加权网络社区发现方法及装置 | |
CN112163114B (zh) | 一种基于特征融合的图像检索方法 | |
CN113239859A (zh) | 一种焦点引导的人脸子空间模糊聚类方法及*** | |
CN109948662B (zh) | 一种基于K-means和MMD的人脸图像深度聚类方法 | |
CN108229505A (zh) | 基于fisher多级字典学习的图像分类方法 | |
CN111598830A (zh) | 一种基于无监督学习的皮肤癌疾病检测方法 | |
CN111598119A (zh) | 一种基于残差网络的图像聚类方法 | |
Yan et al. | A parameter-free framework for general supervised subspace learning | |
Saini et al. | Moment based wavelet filter design for fingerprint classification | |
Nguyen et al. | Tens of thousands of nom character recognition by deep convolution neural networks | |
CN107563287B (zh) | 人脸识别方法和装置 | |
CN109685146A (zh) | 一种基于双卷积和主题模型的场景识别方法 | |
CN114037931B (zh) | 一种自适应权重的多视图判别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200828 |