CN110443318B

CN110443318B - 一种基于主成分分析和聚类分析的深度神经网络方法

Info

Publication number: CN110443318B
Application number: CN201910734831.4A
Authority: CN
Inventors: 金勇�
Original assignee: Wuhan Firehome Putian Information Technology Co ltd
Current assignee: Wuhan Firehome Putian Information Technology Co ltd
Priority date: 2019-08-09
Filing date: 2019-08-09
Publication date: 2023-12-08
Anticipated expiration: 2039-08-09
Also published as: CN110443318A

Abstract

本发明涉及一种基于主成分分析和聚类分析的深度神经网络方法，具体包括以下步骤：S1：将标签数据划分为训练数据和测试数据，训练数据用于模型的训练学习；S2：利用PCA将训练数据的所有初始数据特征进行特征降维，提取新的主成分；S3：根据PCA提取的主成分，对所有训练样本进行K‑Means聚类分析；S4：将上层数据结果作为输入，再结合聚类得到的标签，组成单层神经网络进行训练，得到网络权重参数。本发明提出的一种基于主成分分析和聚类分析的深度神经网络方法，将统计特征学习方法与神经网络的结合应用，从训练过程中优化了传统多层神经网络的训练方式，针对普通深度神经网络的学习，得到了更好的测试效果。

Description

一种基于主成分分析和聚类分析的深度神经网络方法

技术领域

本发明涉及机器学习及人工智能技术领域，特别是涉及一种基于主成分分析和聚类分析的深度神经网络方法。

背景技术

近年来，人工智能技术在工业界和学术界都引起了广泛关注，而机器学习方法在人工智能领域则扮演着核心作用，并且在很多领域已经得到应用，例如生物特征序列、自然语言处理、计算机视觉、图像识别、金融市场分析等多个领域得到快速发展。其中，深度学习在很多领域的表现很显著。深度信念网络(Deep Belief Network,DBN)作为经典的深度学习方法，在特征提取与分类学习方面具有较高的研究意义。

深度信念网络(DBN)的主要思想分为两阶段学习，第一阶段是利用限制玻尔兹曼机(Restricted Boltzmann Machine，RBM)进行无监督预训练(unsupervised pre-training)提取特征，第二阶段是结合第一阶段得到的特征以及数据对应的标签，采用传统的反向传播算法(Back propagation,BP)对模型参数进行微调。其中，第一阶段类似于一种特征抽象的过程，对于此过程，聚类分析和主成分分析方法都是基于统计的特征提取方法，另一方面，聚类分析对于大量的输入特征来说，聚类效率较慢，所以综上考虑，急于研发一种将主成分分析(Principle Component Analysis，PCA)与聚类分析(Cluster analysis)方法结合起来嵌入到深度神经网络模型中做无监督的预训练，然后在第二阶段进行相同的BP算法，以提高深度神经网络的训练学习效果。

发明内容

为了克服现有技术的上述不足，本发明提出了一种基于主成分分析和聚类分析的深度神经网络方法，解决现有普通深度神经网络学习效果差的问题。

本发明是通过以下技术方案实现的：

一种基于主成分分析和聚类分析的深度神经网络方法，具体包括以下步骤：

S1：图像集划分：将标签数据划分为训练数据和测试数据，训练数据用于模型的训练学习，测试集用于测试模型的综合效果；

S2：PCA特征降维：利用PCA将训练数据的所有初始数据特征进行特征降维，提取新的主成分；

S3：K-Means聚类分析：根据PCA提取的主成分，对所有训练样本进行K-Means聚类分析，聚类的数目为网络结构的隐含层数量，聚类结果的类别作为每个训练样本对应的隐含标签；

S4：将上层数据结果作为输入，再结合聚类得到的标签，组成单层神经网络进行训练，得到网络权重参数；

S5：利用S4得到的单层神经网络权重作为整个神经网络的初始权重，然后利用反向传播算法对权重进行调优；

S6：将上述训练模型参数用于模型的应用预测。

进一步的，S2中所述的PCA特征降维是在保留初始输入大部分信息的前提下对初始特征维数进行大幅度降低。

与现有技术相比，本发明的有益效果在于：

本发明提出的一种基于主成分分析和聚类分析的深度神经网络方法，统计特征学习方法与神经网络的结合应用，从训练过程中优化了传统多层神经网络的训练方式，针对普通深度神经网络的学习，得到了更好的测试效果，同时对深度神经网络的训练学习起到了积极效果。

附图说明

图1为本发明实施例所述的一种基于主成分分析和聚类分析的深度神经网络方法的实施流程图。

具体实施方式

展示一下实例来具体说明本发明的某些实施例，且不应解释为限制本发明的范围。对本发明公开的内容可以同时从材料、方法和反应条件进行改进，所有这些改进，均应落入本发明的的精神和范围之内。

如图1所示，一种基于主成分分析和聚类分析的深度神经网络方法，具体包括以下步骤：

S2：PCA特征降维：利用PCA将训练数据的所有初始数据特征进行特征降维，提取新的主成分；例如784维，经过PCA分析保留其中95％以上的主成分信息，得到60维特征，作为下一步聚类分析的变量；

S3：K-Means聚类分析：根据PCA提取的主成分，对所有训练样本进行K-Means聚类分析，聚类的数目为网络结构的隐含层数量，隐含层数量大于或者等于1，聚类结果的类别作为每个训练样本对应的隐含标签；例如网络结构为784-500-300-300-10，第一个聚类的结果数目为500；

S6：将上述训练模型参数用于模型的应用预测。

实验过程采用了四个数据集(图像分类)进行训练测试，数据集简介如下表1：

表1训练数据基本信息

基于主成分分析和聚类分析的深度神经网络方法(PCA-KMeans-NN)的实验效果相对普通深度神经网络(DNN，仅用BP算法训练)学习要好，在对应测试数据集上的错误率较低(错误率如下表2所示)，测试分析中对于四个数据集的错误率表现方面PCA-KMeans-NN都要优于DNN。

表2测试结果(测试集错误率)

数据集	PCA-KMeans-NN	DNN
			MNIST	1.70％	1.98％
smallMNIST	3.50％	4.10％
			USPS	2.46％	2.85％
COIL20	0.68％	1.56％

因此，该发明方法实现了将统计特征学习方法与神经网络的结合应用，从训练过程中优化了传统多层神经网络的训练方式，针对普通深度神经网络的学习，得到了更好的测试效果。该方法在对深度神经网络的预训练特征训练方面提出了一种新的学习方法，对深度神经网络的训练学习起到了积极效果。

以上所述仅为本发明的实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种基于主成分分析和聚类分析的深度神经网络方法，其特征在于，具体包括以下步骤：

S6：将上述训练模型参数用于模型的应用预测。

2.根据权利要求1所述的一种基于主成分分析和聚类分析的深度神经网络方法，其特征在于，S2中所述的PCA特征降维是在保留初始输入大部分信息的前提下对初始特征维数进行大幅度降低。