CN108898157A - 基于卷积神经网络的数值型数据的雷达图表示的分类方法 - Google Patents

基于卷积神经网络的数值型数据的雷达图表示的分类方法 Download PDF

Info

Publication number
CN108898157A
CN108898157A CN201810525151.7A CN201810525151A CN108898157A CN 108898157 A CN108898157 A CN 108898157A CN 201810525151 A CN201810525151 A CN 201810525151A CN 108898157 A CN108898157 A CN 108898157A
Authority
CN
China
Prior art keywords
feature
numeric type
type data
data
neural networks
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810525151.7A
Other languages
English (en)
Other versions
CN108898157B (zh
Inventor
程诚
任佳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN201810525151.7A priority Critical patent/CN108898157B/zh
Publication of CN108898157A publication Critical patent/CN108898157A/zh
Application granted granted Critical
Publication of CN108898157B publication Critical patent/CN108898157B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种基于卷积神经网络的数值型数据的雷达图表示的分类方法,步骤如下:数值型数据进行特征排序;利用特征排序过后的数据选出最优的特征组合;利用雷达图将最优特征组合数值型数据表示成图像数据;构建卷积神经网络基本结构;训练卷积神经网络模型。本发明通过雷达图表示方法,将数值型数据转换成图像数据,同时又尽可能的保留数据间的信息,从而充分利用卷积神经网络的强大特征提取能力,将图像数据中数值型数据之间的拓扑结构特征及更深层次特征提取出来用于分类,与传统的数据驱动分类方法相比,有效提高了数值型数据的分类准确率。

Description

基于卷积神经网络的数值型数据的雷达图表示的分类方法
技术领域
本发明属于模式识别技术领域,涉及卷积神经网络分类技术,具体是指一种基于卷积神经网络的数值型数据的雷达图表示的分类方法。
背景技术
作为一种图像识别方法,卷积神经网络近年来引起了广泛的关注。它是一个深度前馈神经网络,其本质是构建大量过滤器来提取输入数据的特征。随着网络越来越深,所提取的特征越来越抽象。最后,输入数据表示为一系列已翻译,旋转和缩放多次的抽象特征的组合。此外,卷积神经网络具有连接稀疏,权重共享,空间或时间子采样的特点。稀疏连接建立了非完全连接的空间关系,并通过拓扑结构减少了训练参数的数量。权重共享可以使算法有效避免过度拟合。二次采样充分利用数据的局部特征,减少数据维数,优化网络结构,保证一定程度的位移不会造成变形。
基于以上结构和特点,卷积神经网络在计算机视觉方面取得巨大成就。2012年,在ImageNet LSVRC竞赛中取得了最令人印象深刻的成就。与其他算法相比,带有卷积神经网络深度的模型获得了前所未有的低错误率。在目标检测领域,从R-CNN,R-CNN到YOLO,其结构变得越来越简单,而检测能力越来越强。除此之外,卷积神经网络也被引入到语音识别领域,其中原始频域特征被它提取以表达一些变化性语音。
鉴于其优异的性能,一些学者已经考虑将卷积神经网络引入工业数据处理领域。在工业故障诊断领域。它的应用可以归纳为两个方面。在第一个方面,卷积神经网络及其改进的算法用于特征提取和识别。第二个方面是使用卷积神经网络作为分类器。基于目前在工业方面的研究,可以得出结论卷积神经网络是一种有效的识别或分类工具,但它通常处理图像数据。如果我们想使用卷积神经网络来处理数值型数据,我们必须首先找到一种合适的方式将数值型数据表示为图像数据。这个图像数据能表达出原始数值型数据之间隐藏的特征,又能使数据特征之间的相关性表现出来。
TE(Tennessee Eastman)是一个基于伊士曼化工公司研究的实际工业过程的基准过程控制案例。到目前为止,对TE过程的21中故障的检测大部分都集中在传统的数据驱动的方法上如SVM、ELM等方法。传统的数据驱动方法对某些故障的特征难以提取,导致难以检测出该故障,整体的故障检测率低。
综上,需要对现有技术进行改进。
发明内容
本发明要解决的技术问题是利用卷积神经网络对图像数据的强大特征提取能力,克服现有技术中卷积神经网络难以对数值型数据进行特征提取的不足,提供一种基于卷积神经网络的数值型数据的雷达图表示的分类方法。
为了解决上述技术问题,本发明提出基于卷积神经网络的数值型数据的雷达图表示的分类方法,包括如下步骤:
S1、采集并预处理数值型数据,建立训练集:
每个数值型数据包含其特征及标签;
S2、将步骤S1所得数据集中数值型数据表示成图像数据,利用所得图像数据建立图片数值化数据集train_x;步骤如下:
2.1、将训练集中数值型数据的特征依次进行归一化处理;
其中,表示第i个数值型数据的第j维特征,表示归一化后的第i个数值型数据的第j维特征;xj表示训练集中所有数值型数据的第j维特征,max xj表示xj中的最大值,minxj表示xj中的最小值;
2.2、根据步骤2.1所得利用polar函数绘制对应数值型数据的雷达图,并利用所得雷达图建立图片数值化数据集train_x;
S3、构建卷积神经网络基本结构;
S4、利用步骤S2所得图片数值化数据集train_x及其标签训练获得卷积神经网络模型;
S5、将待分类数值型数据表示为图像数据后输入卷积神经网络模型进行分类。
作为本发明基于卷积神经网络的数值型数据的雷达图表示的分类方法的改进:
所述卷积神经网络包括输入层,两个卷积层、两个池化层,全连接层以及输出层;
所述卷积层的激活函数选取sigmoid函数,输出层采用RBF神经网络进行概率分类;
所述卷积神经网络的最终代价函数选取均方根误差函数,误差采用反向传播对权重W和偏置b进行调整。
作为本发明基于卷积神经网络的数值型数据的雷达图表示的分类方法的进一步改进:
所述步骤S1采集并预处理数值型数据的方法为:
1.1、采集数值型数据,并将其进行特征排序:
1.2、利用特征排序后的数据选出最优的特征组合,根据最优的特征组合所对应的数值型数据,建立训练集。
作为本发明基于卷积神经网络的数值型数据的雷达图表示的分类方法的进一步改进:
所述步骤1.1采集数值型数据,并将其进行特征排序的方法如下:
(1a)、采集数值型数据,建立初始训练集S;
(1b)、对步骤(1a)所建立初始训练集S中的数值型数据进行标准化处理,处理公式如下:
S={(x1,y1),(x2,y2),…,(xN,yN)}
其中:i=1,2,...,N,j=1,2,...,d;xi表示第i个数值型数据,yi表示第i个数值型数据的标签;表示第i个训练数据的第j维特征;μj表示第j维特征的平均值,σj表示第j维特征的方差,表示xi的第j维特征经过标准化处理过后的新特征;
标准化后的初始训练集为:
其中表示经过标准化处理过后的第i个数值化数据;
(1c)、分别计算步骤(1b)所得标准化处理后的初始训练集中特征与标签之间的欧式距离:
(1d)、根据步骤(1c)所得各个特征与标签之间的欧氏距离按照从大到小进行排序,获得特征组合
其中示步骤(1c)所得各个特征与标签之间的欧氏距离dj最小的一维特征数据。
作为本发明基于卷积神经网络的数值型数据的雷达图表示的分类方法的进一步改进:
所述步骤1.2中利用特征排序后的数据选出最优的特征组合的方法为:
(2a)、建立一个空的特征子集F;
(2b)、按照步骤(1d)所得特征组合中各维特征数据的顺序依次将其特征进行组合并加入到特征子集F中;特征子集
即,将特征组合(dj最大的一维特征数据)作为一个特征组合放入特征子集F中,再将作为一个特征组合放入F中,以此类推,直至将所有特征作为一个特征组合放入特征子集F中,获得d个特征组合。
计算所得特征子集F中每个特征组合中特征与特征,特征与标签之间的欧式距离,并再求其平均值;
选择平均值最大且至少含有4个特征的特征组合则为最优的特征组合;
注:上述欧式距离的计算方式可参照步骤(1c)。
当平均值最大的特征组合中特征个数小于4个,则取步骤(1d)所得特征组合中前4个特征组成其最优特征组合;
所述步骤1.2中根据最优的特征组合所对应的数值型数据建立训练集的方法为:
根据步骤(2b)选出的最优特征组合,从步骤(1a)所建立初始训练集中取出该最优特征组合所对应特征,建立训练集。
作为本发明基于卷积神经网络的数值型数据的雷达图表示的分类方法的进一步改进:
所述步骤2.2中利用polar函数绘制对应数值型数据的雷达图的方法为:
根据最优特征组合中特征个数确定雷达图半径的个数,每个半径代表对应的特征,半径的长度即为该特征归一化过后的数值。
作为本发明基于卷积神经网络的数值型数据的雷达图表示的分类方法的进一步改进:
所述S5将待分类数值型数据表示为图像数据后输入卷积神经网络模型进行分类的方法为:
利用polar函数绘制待分类数值型数据的雷达图后输入卷积神经网络模型进行分类;
所述polar函数绘制待分类数值型数据的雷达图的方式包括以下两种:
方式1、根据待分类数值型数据的特征利用polar函数绘制对应的雷达图;
方式2、将待分类数值型数据按照步骤S1进行预处理,获取其选出最优特征组合后,再利用polar函数根据最优特征组合所对应的特征绘制其雷达图。
注:对待分类数值型数据进行预处理,以及利用polar函数绘制雷达图的具体步骤可参照上述对数值型数据的处理方法。
本发明一方面采用雷达图的方法将数值型数据形象的表示出来,保留了数值型数据之间的相关性,使得数值型数据之间的信息损失尽可能的小,充分利用了卷积神经网络的提取特征的优势,提取到雷达图之间的拓扑结构特征。另一方面,相比传统的数据驱动方法,本发明也给其他技术人员提供了面思维的形象思路,使得海量的工业数值型数据得到识别与分类。
本发明与现有技术相比,具有如下技术优势:
1、本发明通过雷达图表示方法,将数值型的数据从面思维的角度进行图形化的有效表示,充分利用了数值数据各维度之间的关系。
2、本发明通过卷积神经网络提取雷达图的拓扑结构特征和深层次特征进行分类,相比于传统的数据驱动分类方法,本发明提高了数值型数据的分类准确率。
附图说明
下面结合附图对本发明的具体实施方式作进一步详细说明。
图1为本发明的基于卷积神经网络的数值型数据的雷达图表示的分类方法的流程图;
图2为本发明的卷积神经网络基本结构示意图。
具体实施方式
下面结合具体实施例对本发明进行进一步描述,但本发明的保护范围并不仅限于此。
TE工艺主要由反应器,冷凝器,蒸汽/液体分离器,循环压缩机和汽提塔五个操作单元和八种成分:A,B,C,D,E,F,G和H组成。
实施例1、基于卷积神经网络的数值型数据的雷达图表示的分类方法,如图1~2所示,本发明先将数值型数据进行特征排序,利用特征排序过后的数据选出最优的特征组合,再利用雷达图将最优特征组合数值型数据表示成图像数据,从而构建卷积神经网络基本结构,训练获得卷积神经网络模型。之后通过雷达图表示方法,将数值型数据从面思维的角度进行图形化的有效表示,充分利用了数值数据各维度之间的关系。最后通过卷积神经网络模型提取雷达图的拓扑结构特征和深层次特征进行分类,分类准确度高。
本实施例结合TE过程的产生的数值型故障数据。TE过程共有52个变量和22个工作条件(1个正常工作条件和21个故障工作条件),本发明中每隔180s收集一次数据获得d00和21种故障情况数据集。
d00是正常工作条件下的训练数据集,包括500组数据(训练数据)。
每种故障情况数据集包括对应故障工作条件下的训练数据集da和测试数据集da_test,其中a∈{01,02,…,21}。训练数据集包括480组训练数据;测试数据集包括960组测试数据,前160组测试数据是正常数据。每组数据(即,训练数据及测试数据)都为53维,前52维分别表示52个变量的值(即,特征),最后一维为标签,正常工条件的标签为0,其余21种故障的标签依次为1,2,…,21。
基于卷积神经网络的数值型数据的雷达图表示的分类方法具体包括如下步骤:
(1)、对TE过程中产生的数值型故障数据进行特征排序,具体包括以下步骤:
(1a)、建立初始训练集S和初始测试集。
初始训练集S由d00和da构成。初始测试集由da_test构成。
注:依次采用21种故障情况数据集中的训练数据集da和测试数据集da_test建立对应故障工作条件的初始训练集和测试集。
由于每种故障工作条件检测方法均相同,故本实施例中仅针对故障1进行具体介绍,即,本实施例中初始训练集由d00和d01构成。初始测试集由d01_test构成。
(1b)、对初始训练集S中的训练数据进行标准化处理,处理公式如下:
S={(x1,y1),(x2,y2),…,(xN,yN)}
其中:i=1,2,...,N,j=1,2,...,d,N=980,d=52。S表示步骤(1a)建立的初始训练集,xi表示第i个训练数据,yi表示第i个训练数据的标签。表示第i个训练数据的第j维特征,如,表示xi的第一个特征。μj表示第j维特征的平均值,σj表示第j维特征的方差,表示xi的第j维特征经过标准化处理过后的新特征。
训练数据的特征即为影响该故障工况的52维变量,正常工况下标签为0,本实施例采用第一种故障工况的故障情况数据集,其对应标签为1。
注:在工业中特征指的就是影响输出的有关因素。
标准化后的初始训练集为:
其中表示经过标准化处理过后的第i个数值化数据;
(1c)、依次计算步骤(1b)所得标准化处理后的初始训练集中特征与标签之间的欧式距离:
其中:i=1,2,...,N,j=1,2,...,d,N=980,d=52。dj表示第j维特征与其对应标签yi之间的欧氏距离。表示xi的第j维特征经过标准化处理过后的新特征;yi表示第i个训练数据的标签,也就是输出,该输出可以是实际的输出值,也可以是人为给定的输出值。
(1d)、按照步骤(1c)所得各个特征与标签之间的欧氏距离按照从大到小进行排序,将所得特征组合记为
其中表示步骤(1c)所得标准化处理后训练数据中dj最小的一维特征数据。
(2)、利用步骤(1d)所得特征排序后的训练数据选出最优的特征组合。
最优的特征组合根据特征与特征之间以及特征与标签之间的欧氏距离平均值大小来选定,选定方法如下:
(2a)、建立一个空的特征子集F。
(2b)、按照步骤(1d)所得重新排序的特征组合的顺序,依次将中的特征进行组合并加入到特征子集F中;
特征子集即,将特征组合(dj最大的一维特征数据)作为一个特征组合放入特征子集F中,再将作为一个特征组合放入F中,以此类推,直至将所有特征作为一个特征组合放入特征子集F中。
计算所得特征子集F中每个特征组合中特征与特征,特征与标签之间的欧式距离(可参照上述步骤(1c)中计算欧式距离的方式),并再求其平均值。平均值最大且含至少4个特征的特征组合则为最优的特征组合。
如果平均值最大的特征组合中特征个数小于4个,则从步骤(1d)中重新排序的训练数据中选取前4个特征组成其最优特征组合。
由于计算特征与特征,特征与标签之间的欧式距离,以及计算其平均值的方法均为现有技术,故在此处不再详细告知。
如:特征组合为其平均值的算法如下:
y指该特征所对应的标签。
本发明中采用特征与特征,特征与标签之间的欧式距离对特征进行组合与排序,使得新的特征组合之间能充分反映与输出之间的关系。
(3)、利用雷达图将最优特征组合表示成图像数据。利用MATLAB工具,画出32*32大小的封闭雷达图图像。
利用雷达图将数值型数据表示成图像数据过程包括有:
(3a)、根据步骤(2b)选出的最优特征组合,从步骤(1a)所建立初始训练集(即,未进行标准化处理的训练集)中取出该最优特征组合所对应特征,从而建立训练集,即,训练集中的训练数据,仅包含最优特征组合所对应特征。
(3b)、对步骤(3a)所选出的特征进行归一化处理:
其中,xj表示步骤(3a)所建立训练集中所有训练数据的第j维特征,表示归一化后的第i个数据的第j维特征。max xj表示xj中的最大值,min xj表示xj中的最小值。
(3c)、根据步骤(3b)归一化之后的数据利用MATLAB中的polar函数画出封闭的雷达图,即与训练数据一一对应的雷达图。
本实施例按照上述步骤所选取的最优特征组合中特征个数为7,则雷达图的半径个数为7,每个半径代表对应的特征,半径的长度即为该特征归一化过后的数值。将这些半径连接起来组成一个封闭图形。每个训练数据对应一个雷达图。
注:初始测试集中的每个测试数据以及每个实际待分类的数值型数据均按照上述步骤进行相应处理,获得其对应的雷达图。
(3d)、去除步骤(3c)所得雷达图中的坐标轴,并保存成32*32大小的灰度图片,图片为PNG格式。
将画好的雷达图保存为图片训练数据集train_x和图片测试数据集test_x,本实施例中图片训练数据集train_x含980张图片,图片测试数据集test_x含960张图片。
本发明中将TE过程中的数值型故障数据利用雷达图方法表示出来,使得数据之间的信息得到转换,数据之间的相关性得到保留。完成了数值型数据与图像型数据之间的转换。
在实际工作中,可根据其需要确定图片训练数据集train_x和图片测试数据集test_x对应的标签,即,卷积神经网络模型的输出值。
本实施例采用one-hot编码(独热码)确定图片训练数据集标签train_y和图片测试数据集标签test_y。由于本实施例包括正常工况和故障工况,正常工况的编码为(1,0),故障工况编码为(0,1)。因此train_y大小为980*2,前500组数据的标签为(1,0),501-980组数据的标签为(0,1)。test_y大小为960*2,前160组数据的标签为(1,0),161-960组数据的标签为(0,1)。
通过one-hot编码,可以方便的对预测输出最大值对应的位置和实际输出最大值对应的位置进行对比,如果位置相同,就认为是同一类。
综上,本发明根据上述的特征和标签选出最优特征,画出最优特征的雷达图,组成新的图像训练集,其标签我们采用one-hot编码重新赋予。本实施例中我们画出的雷达图组成train_x,和test_x,且train_y和test_y采用one-hot编码组成,即,最终输入到卷积神经网络的数据为train_x,test_x,train_y,test_y。
(4)、构建卷积神经网络基本结构:确定基本的卷积神经网络的整体结构以及初始化的参数。
本实施例中构建卷积神经网络基本结构如图2所示,包括输入层,卷积层1,池化层1,卷积层2,池化层2,全连接层以及输出层。
图中卷积层1和卷积层2的卷积核大小可选5*5或3*3;权重W是从(0~1)中随机的选出,偏置b的初始值为0,激活函数均选取sigmoid函数。
池化层1和池化层2的池化方式均为平均池化。
输出层采用RBF神经网络进行概率分类。
本实施例所构建的卷积神经网络的代价函数选取均方根误差函数。误差采用反向传播对权值W和偏置b进行调整,调整方式为梯度下降法。
注:上述sigmoid函数、均方根误差函数均为现有技术,反向传播、梯度下降法也为现有常用技术手段,故在本说明书中省略其具体工作内容。
本实施例中每个故障工况的卷积神经网络参数选取如下表1:
表1不同工况卷积神经网络参数选取.
注:表1中特征图的个数指(卷积核的个数)。
(5)、将图片训练数据集train_x和图片测试数据集test_x,以及图片训练数据集标签train_y和图片测试数据集标签test_y(即,输出)放到卷积神经网络中训练得到训练分类准确率和测试分类准确率并记录大小。
利用训练集及测试集训练卷积神经网络构建卷积神经网络模型为常规的技术手段,本实施中通过分别改变卷积核大小,移动的步长,学习率的大小,每个批次的大小,以及迭代的次数等对卷积神经网络进行训练。
最终选取一组卷积神经网络参数,实现一方面令TE测试分类准确率最大,另外一方面令训练分类准确率和测试分类准确率大小接近,从而防止欠拟合或者过拟合现象的发生。最终得到的每种故障的分类准确率如表2。
表2:不同故障的训练和测试分类准确率
按照上述步骤依次建立每种故障工作条件对应的卷积神经网络模型。将每种故障的测试数据带入到各自的模型中,检测出是否有故障的发生。
在实际使用过程中,如果待分类的数值型数据的特征之间存在冗余或者无用的特征,那么将按照上述步骤进行特征选择,选出最优特征组合,绘制雷达图,利用建立好的卷积神经网络模型进行分类。如果数值型数据的特征之间都是有用的信息,不存在用于或者无用的特征,那么无需进行特征选择,可以直接利用原始数据绘制雷达图,利用建立好的卷积神经网络进行分类。
与现有技术相比,采用了该发明中的基于卷积神经网络的数值型数据的雷达图表示的分类方法,通过雷达图的方法将数值型数据有效的表示成图像数据,保留了数值型数据的信息以及数据间的相关性,利用卷积神经网络提取出图像数据的拓扑结构特征,图像数据之间的相似性以及旋转不变形都得到很好的利用,提高了分类准确率,故障的检测能力和平均检测水平得到提高。
本发明能够将TE过程产生的数值型故障数据转换成图像数据,同时又尽可能的保留数据间的信息。充分利用卷积神经网络的强大特征提取能力,将图像数据中数值型数据之间的拓扑结构特征及更深层次特征提取出来用于分类。与传统的数据驱动方法如ELM相比较,普通方法的平均分类精度只能达到65%,本发明可以达到86.79,这充分说明了本发明将数值型数据利用雷达图进行形象表示之后,可以充分挖掘数据之间的关系,提高分类精度。
综上,本发明利用雷达图的方法将工业中的数值型数据转换成图像数据,进而可以使用卷积神经网络在图像数据处理的优势,与现有技术相比,直接将数值型数据送入至卷积神经网络中,会造成信息的损失,数据之间的相关性得不到体现。本发明可以弥补这个缺点。
最后,还需要注意的是,以上列举的仅是本发明的若干个具体实施例。显然,本发明不限于以上实施例,还可以有许多变形。本领域的普通技术人员能从本发明公开的内容直接导出或联想到的所有变形,均应认为是本发明的保护范围。

Claims (7)

1.基于卷积神经网络的数值型数据的雷达图表示的分类方法,其特征包括如下步骤:
S1、采集并预处理数值型数据,建立训练集:
每个数值型数据包含其特征及标签;
S2、将步骤S1所得数据集中数值型数据表示成图像数据,利用所得图像数据建立图片数值化数据集train_x;步骤如下:
2.1、将训练集中数值型数据的特征依次进行归一化处理;
其中,表示第i个数值型数据的第j维特征,定示归一化后的第i个数值型数据的第j维特征;xj表示训练集中所有数值型数据的第j维特征,max xj表示xj中的最大值,min xj表示xj中的最小值;
2.2、根据步骤2.1所得利用polar函数绘制对应数值型数据的雷达图,并利用所得雷达图建立图片数值化数据集train_x;
S3、构建卷积神经网络基本结构;
S4、利用步骤S2所得图片数值化数据集train_x及其标签训练获得卷积神经网络模型;
S5、将待分类数值型数据表示为图像数据后输入卷积神经网络模型进行分类。
2.根据权利要求1所述的基于卷积神经网络的数值型数据的雷达图表示的分类方法,其特征在于:
所述卷积神经网络包括输入层,两个卷积层、两个池化层,全连接层以及输出层;
所述卷积层的激活函数选取sigmoid函数,输出层采用RBF神经网络进行概率分类;
所述卷积神经网络的最终代价函数选取均方根误差函数,误差采用反向传播对权重W和偏置b进行调整。
3.根据权利要求1或2所述的基于卷积神经网络的数值型数据的雷达图表示的分类方法,其特征在于:
所述步骤S1采集并预处理数值型数据的方法为:
1.1、采集数值型数据,并将其进行特征排序:
1.2、利用特征排序后的数据选出最优的特征组合,根据最优的特征组合所对应的数值型数据,建立训练集。
4.根据权利要求3所述的基于卷积神经网络的数值型数据的雷达图表示的分类方法,其特征在于,
所述步骤1.1采集数值型数据,并将其进行特征排序的方法如下:
(1a)、采集数值型数据,建立初始训练集S;
(1b)、对步骤(1a)所建立初始训练集S中的数值型数据进行标准化处理,处理公式如下:
S={(x1,y1),(x2,y2),…,(xN,yN)}
其中:i=1,2,...,N,j=1,2,...,d;xi表示第i个数值型数据,yi表示第i个数值型数据的标签;表示第i个训练数据的第j维特征;μj表示第j维特征的平均值,σj表示第j维特征的方差,表示xi的第i维特征经过标准化处理过后的新特征;
标准化后的初始训练集为:
其中表示经过标准化处理过后的第i个数值化数据;
(1c)、分别计算步骤(1b)所得标准化处理后的初始训练集中特征与标签之间的欧式距离:
(1d)、根据步骤(1c)所得各个特征与标签之间的欧氏距离dj,按照从大到小进行排序,获得特征组合
其中表示步骤(1c)所得各个特征与标签之间的欧氏距离dj最小的一维特征数据。
5.根据权利要求4所述的基于卷积神经网络的数值型数据的雷达图表示的分类方法,其特征在于:
所述步骤1.2中利用特征排序后的数据选出最优的特征组合的方法为:
(2a)、建立一个空的特征子集F;
(2b)、按照步骤(1d)所得才中各维特征数据的顺序依次将其特征进行组合并加入到特征子集F中;特征子集
计算所得特征子集F中每个特征组合中特征与特征,特征与标签之间的欧式距离,并再求其平均值;
选择平均值最大且至少含有4个特征的特征组合则为最优的特征组合;
当平均值最大的特征组合中特征个数小于4个,则取步骤(1d)所得特征组合中前4个特征组成其最优特征组合;
所述步骤1.2中根据最优的特征组合所对应的数值型数据建立训练集的方法为:
根据步骤(2b)选出的最优特征组合,从步骤(1a)所建立初始训练集中取出该最优特征组合所对应特征,建立训练集。
6.根据权利要5所述的基于卷积神经网络的数值型数据的雷达图表示的分类方法,其特征在于:
所述步骤2.2中利用polar函数绘制对应数值型数据的雷达图的方法为:
根据最优特征组合中特征个数确定雷达图半径的个数,每个半径代表对应的特征,半径的长度即为该特征归一化过后的数值。
7.根据权利要6所述的基于卷积神经网络的数值型数据的雷达图表示的分类方法,其特征在于:
所述S5将待分类数值型数据表示为图像数据后输入卷积神经网络模型进行分类的方法为:
利用polar函数绘制待分类数值型数据的雷达图后输入卷积神经网络模型进行分类;
所述polar函数绘制待分类数值型数据的雷达图的方式包括以下两种:
方式1、根据待分类数值型数据的特征利用polar函数绘制对应的雷达图;
方式2、将待分类数值型数据按照步骤S1进行预处理,获取其选出最优特征组合后,再利用polar函数根据最优特征组合所对应的特征绘制其雷达图。
CN201810525151.7A 2018-05-28 2018-05-28 基于卷积神经网络的数值型数据的雷达图表示的分类方法 Expired - Fee Related CN108898157B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810525151.7A CN108898157B (zh) 2018-05-28 2018-05-28 基于卷积神经网络的数值型数据的雷达图表示的分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810525151.7A CN108898157B (zh) 2018-05-28 2018-05-28 基于卷积神经网络的数值型数据的雷达图表示的分类方法

Publications (2)

Publication Number Publication Date
CN108898157A true CN108898157A (zh) 2018-11-27
CN108898157B CN108898157B (zh) 2021-12-24

Family

ID=64343388

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810525151.7A Expired - Fee Related CN108898157B (zh) 2018-05-28 2018-05-28 基于卷积神经网络的数值型数据的雷达图表示的分类方法

Country Status (1)

Country Link
CN (1) CN108898157B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113156391A (zh) * 2021-04-25 2021-07-23 电子科技大学 一种雷达信号多维特征智能分选方法
CN113688931A (zh) * 2021-09-01 2021-11-23 什维新智医疗科技(上海)有限公司 一种基于深度学习的超声图像筛选方法和装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103971129A (zh) * 2014-05-27 2014-08-06 浙江大学 一种基于学习跨数据域子空间的图像内容识别的分类方法及装置
CN105354223A (zh) * 2015-10-05 2016-02-24 北京工商大学 一种针对非连续层次数据的可视化方法和应用
CN105389569A (zh) * 2015-11-17 2016-03-09 北京工业大学 一种人体姿态估计方法
CN106874957A (zh) * 2017-02-27 2017-06-20 苏州大学 一种滚动轴承故障诊断方法
CN107844755A (zh) * 2017-10-23 2018-03-27 重庆邮电大学 一种结合dae和cnn的脑电信号特征提取与分类方法
CN107944412A (zh) * 2017-12-04 2018-04-20 国网山东省电力公司电力科学研究院 基于多层卷积神经网络的输电线路自动识别***及方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103971129A (zh) * 2014-05-27 2014-08-06 浙江大学 一种基于学习跨数据域子空间的图像内容识别的分类方法及装置
CN105354223A (zh) * 2015-10-05 2016-02-24 北京工商大学 一种针对非连续层次数据的可视化方法和应用
CN105389569A (zh) * 2015-11-17 2016-03-09 北京工业大学 一种人体姿态估计方法
CN106874957A (zh) * 2017-02-27 2017-06-20 苏州大学 一种滚动轴承故障诊断方法
CN107844755A (zh) * 2017-10-23 2018-03-27 重庆邮电大学 一种结合dae和cnn的脑电信号特征提取与分类方法
CN107944412A (zh) * 2017-12-04 2018-04-20 国网山东省电力公司电力科学研究院 基于多层卷积神经网络的输电线路自动识别***及方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
FRANCISCO, AT EL.: ""Cascade Feature Selection and ELM for automatic fault diagnosis of the Tennessee Eastman process"", 《SCIENCE DIRECT》 *
JIHEN AMARA,AT EL.: ""CNN based Chart Image Classification"", 《25TH INTERNATIONAL CONFERENCE IN CENTRAL EUROPE ON COMPUTER GRAPHICS, VISUALIZATION AND COMPUTER VISION 2017》 *
刘文远等: ""基于多维数据雷达图表示的图形分类器研究"", 《计算机工程与应用》 *
王金甲等: ""雷达图图形特征提取中的特征排序"", 《燕山大学学报》 *
陆汝华等: ""基于雷达图重心特征提取的轴承故障诊断方法"", 《轴承》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113156391A (zh) * 2021-04-25 2021-07-23 电子科技大学 一种雷达信号多维特征智能分选方法
CN113688931A (zh) * 2021-09-01 2021-11-23 什维新智医疗科技(上海)有限公司 一种基于深度学习的超声图像筛选方法和装置
CN113688931B (zh) * 2021-09-01 2024-03-29 什维新智医疗科技(上海)有限公司 一种基于深度学习的超声图像筛选方法和装置

Also Published As

Publication number Publication date
CN108898157B (zh) 2021-12-24

Similar Documents

Publication Publication Date Title
CN111967502B (zh) 一种基于条件变分自编码器的网络入侵检测方法
CN110532859A (zh) 基于深度进化剪枝卷积网的遥感图像目标检测方法
CN107679250A (zh) 一种基于深度自编码卷积神经网络的多任务分层图像检索方法
CN108520275A (zh) 一种基于邻接矩阵的连接信息规整***、图特征提取***、图分类***和方法
CN108062551A (zh) 一种基于邻接矩阵的图特征提取***、图分类***和方法
Robert et al. Hybridnet: Classification and reconstruction cooperation for semi-supervised learning
CN110969191B (zh) 基于相似性保持度量学习方法的青光眼患病概率预测方法
CN106023065A (zh) 一种基于深度卷积神经网络的张量型高光谱图像光谱-空间降维方法
CN110827260B (zh) 一种基于lbp特征与卷积神经网络的布匹缺陷分类方法
CN107679509A (zh) 一种小环藻识别方法及装置
CN113643228B (zh) 一种基于改进的CenterNet网络的核电站设备表面缺陷检测方法
Ma et al. A supervised progressive growing generative adversarial network for remote sensing image scene classification
CN112347908B (zh) 一种基于空间分组注意力模型的外科手术器械图像识别方法
CN111652171B (zh) 一种基于双分支网络的面部表情识别模型的构建方法
CN110363230A (zh) 基于加权基分类器的stacking集成污水处理故障诊断方法
CN107341505A (zh) 一种基于图像显著性与Object Bank的场景分类方法
CN105930792A (zh) 一种基于视频局部特征字典的人体动作分类方法
CN104281835A (zh) 基于局部敏感的核稀疏表示的人脸识别方法
CN110414626A (zh) 一种猪只品种识别方法、装置和计算机可读存储介质
Jiang et al. Object recognition in remote sensing images using combined deep features
CN108898157A (zh) 基于卷积神经网络的数值型数据的雷达图表示的分类方法
CN115358337A (zh) 一种小样本故障诊断方法、装置及存储介质
Xia et al. Exploring an easy way for imbalanced data sets in semantic image segmentation
CN108537266A (zh) 一种深度卷积网络的织物纹理疵点分类方法
CN110335244A (zh) 一种基于多迭代分类器的轮胎x光病疵检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20181127

Assignee: Zhejiang Zhongjing Bearing Co.,Ltd.

Assignor: ZHEJIANG SCI-TECH University

Contract record no.: X2022330000080

Denomination of invention: Classification method of radar chart representation of numerical data based on convolutional neural network

Granted publication date: 20211224

License type: Common License

Record date: 20220506

Application publication date: 20181127

Assignee: CHANGSHAN XINLONG BEARING Co.,Ltd.

Assignor: ZHEJIANG SCI-TECH University

Contract record no.: X2022330000079

Denomination of invention: Classification method of radar chart representation of numerical data based on convolutional neural network

Granted publication date: 20211224

License type: Common License

Record date: 20220506

EE01 Entry into force of recordation of patent licensing contract
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20211224