CN111738309A - 多尺度分析和集成学习的气敏传感器故障模式识别方法 - Google Patents
多尺度分析和集成学习的气敏传感器故障模式识别方法 Download PDFInfo
- Publication number
- CN111738309A CN111738309A CN202010496367.2A CN202010496367A CN111738309A CN 111738309 A CN111738309 A CN 111738309A CN 202010496367 A CN202010496367 A CN 202010496367A CN 111738309 A CN111738309 A CN 111738309A
- Authority
- CN
- China
- Prior art keywords
- fault
- scale
- gas sensor
- feature
- entropy
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 69
- 238000004458 analytical method Methods 0.000 title claims abstract description 34
- 239000013598 vector Substances 0.000 claims abstract description 30
- 239000002131 composite material Substances 0.000 claims abstract description 26
- 230000009467 reduction Effects 0.000 claims abstract description 13
- 238000003909 pattern recognition Methods 0.000 claims abstract description 9
- 238000007636 ensemble learning method Methods 0.000 claims abstract description 7
- 238000012850 discrimination method Methods 0.000 claims abstract description 5
- 238000012549 training Methods 0.000 claims description 35
- 239000011159 matrix material Substances 0.000 claims description 31
- 230000008569 process Effects 0.000 claims description 23
- 239000006185 dispersion Substances 0.000 claims description 14
- 238000013507 mapping Methods 0.000 claims description 11
- 230000006870 function Effects 0.000 claims description 10
- 238000003066 decision tree Methods 0.000 claims description 8
- 230000009466 transformation Effects 0.000 claims description 8
- 238000012935 Averaging Methods 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 238000004422 calculation algorithm Methods 0.000 description 20
- 238000000605 extraction Methods 0.000 description 17
- 238000011156 evaluation Methods 0.000 description 14
- 238000012706 support-vector machine Methods 0.000 description 7
- 238000002474 experimental method Methods 0.000 description 6
- 238000012567 pattern recognition method Methods 0.000 description 6
- 238000005070 sampling Methods 0.000 description 6
- 239000000243 solution Substances 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000000354 decomposition reaction Methods 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 238000002790 cross-validation Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 241000005398 Figaro Species 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 230000007786 learning performance Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 230000008786 sensory perception of smell Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/285—Selection of pattern recognition techniques, e.g. of classifiers in a multi-classifier system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Investigating Or Analyzing Materials By The Use Of Fluid Adsorption Or Reactions (AREA)
Abstract
本发明公开的一种基于多尺度分析和集成学习的气敏传感器故障模式识别方法,包括:对气敏传感器故障信号进行多尺度分析,得到不同尺度因子下的时间序列,分别计算每个时间序列的加权排列熵构成复合多尺度加权排列熵特征向量;通过Fisher判别法对复合多尺度加权排列熵进行降维,作为模式识别的故障特征样本;利用集成学习方法构建多个基学习器,用于对故障特征样本集的子样本集进行分类预测,然后将多个基学习器的分类结果进行汇总,得到气敏传感器故障模式识别结果。本发明能够突出不同故障类型的差异性,并且选择的集成学习分类器对气敏传感器故障识别具有更优越的泛化性能和更好的分类准确率,避免严重事故发生。
Description
技术领域
本发明属于机器嗅觉技术领域,涉及一种基于多尺度分析和集成学习的气敏传感器故障模式识别方法。
背景技术
模式识别是当前实现传感器故障识别的主要方法。主要过程是:首先,对传感器正常情况下和各种不同故障情况下的传感器信号进行采集,构成传感器各种不同状态的训练样本集;然后选择合适的故障信号特征提取方法,提取不同故障状态下的故障特征信息,构成故障特征训练样本集;接下来,利用故障特征训练样本集训练基于模式识别方法的分类器;最后,利用训练好的分类器对传感器测试样本进行模式识别,并由分类器输出识别出的故障类型。通过以上的过程描述可知,传感器模式识别方法主要有两个关键步骤,分别是故障特征提取方法的选择和分类器的选择。
时频分析方法是当前传感器信号故障特征分析的主要方法,其主要通过傅里叶变换、小波变换、经验模态分解等方法在时域和频域对传感器信号进行分解。将原始故障信号分解成若干个简单的平稳分量信号,然后通过对各分量信号进行处理获取时频域的数据信息,实现特征提取。但是由于传感器信号通常表现为非线性行为,时频分析的信号分解过程,难免会丢失一定的故障信息。非线性分析的方法可以不对信号进行分解,而是直接对传感器信号中的数据信息进行特征提取。非线性分析方法主要包括关联维数、样本熵、排列熵、多尺度熵等。但从MOS气敏传感器故障信号中提取的特征信息对于不同故障类型区分性较差。
传感器故障识别过程中的分类方法多采用模式识别方法,通过训练样本对分类器进行模型构建,然后将测试样本输入到训练模型中得到分类结果,例如决策树、贝叶斯分类器、K近邻法(KNN)、支持向量机(SVM)、神经网络等算法均被广泛应用在传感器故障识别中。而为了提高各分类器的分类性能,研究学者们提出了各种分类器的改进方法,包括基于SLIQ算法的决策树、Tan贝叶斯网络、LS-SVM、SVR等等。但上述改进方法都比较复杂,并且分类结果依赖模型本身的性能,不同的参数设置很大程度影响最终分类结果,模型训练过程容易发生过拟合现象,从而导致分类准确率不高。
因此,提供一种对不同故障类型区分性强,且分类准确率高的基于多尺度分析和集成学习的气敏传感器故障模式识别方法是本领域技术人员亟待解决的技术问题。
发明内容
本发明针对传感器故障模式识别过程中,提取的故障特征对不同故障类型区分性差以及分类器分类准确率不佳的问题。提出一种基于复合多尺度加权排列熵,Fisher判别和bagging集成学习分类器的气敏传感器故障模式识别方法。该方法能够突出不同故障类型的差异性,并且选择的基于bagging集成学习的分类器对MOS气敏传感器最终故障识别具有更优越的泛化性能和更好的分类准确率。
为实现上述目的其具体方案如下:
一种基于多尺度分析和集成学习的气敏传感器故障模式识别方法,包括如下步骤:
S1、对气敏传感器输出的故障信号进行复合多尺度分析,得到不同尺度因子下的时间序列,分别计算每个时间序列的加权排列熵并构成复合多尺度加权排列熵特征向量,作为故障信号的特征;
S2、通过Fisher判别法计算复合多尺度加权排列熵的最优鉴别矢量集,对复合多尺度加权排列熵进行降维,作为模式识别的故障特征样本集;
S3、利用bagging集成学习方法构建多个基学习器,基学习器用于对故障特征样本集的子样本集进行分类预测,然后将多个基学习器的分类结果进行筛选汇总,得到气敏传感器故障模式识别结果。
优选的,所述S1包括:
其中,τ为尺度因子;
S13、将得到的CMWPE表示成尺度因子τ的函数,得到复合多尺度加权排列熵,其中给定τmax,则τ∈[1,τmax]。
优选的,所述S2中,将m组故障信号时间序列对应的CMWPE作为样本矩阵XL进行映射变换,使同类别故障信号时间序列间距离最近,具体包括:
定义Fisher判别的目标函数:
其中,W为映射矩阵,Sw为类内离散度矩阵,Sb为类间离散度矩阵;
调整W的值,使得类内离散度矩阵Sw的值达到最小,类间离散度矩阵Sb达到最大,得到映射矩阵W的最优鉴别矢量解;
确定样本矩阵从m维空间到K-1维空间的降维的线性变换过程为:
ZL=WTXL
得到故障特征样本集ZL。
优选的,所述S3中,采用决策树进行基学习器的训练,并基于故障特征样本集的信息增益率作为属性选择度量进行类别划分。
本发明相较现有技术具有以下有益效果:
本发明针对现有技术中不同传感器故障类型区分性差以及故障模式识别准确率低的问题,提出一种基于复合多尺度加权排列熵(CMWPE),Fisher判别(FDA)和bagging集成学习分类器的MOS气敏传感器故障模式识别方法。根据综合特征评估方法计算提取的特征样本集中复合多尺度加权排列熵特征向量的评估因子可知,本发明提出的特征提取方法相对于传统方法提取的特征值包含更为丰富的特征信息,很好的突出不同故障类型的差异性。并且选择的基于bagging集成学习的分类器对MOS气敏传感器最终故障识别准确率达到97.85%。集成学习方法通过集合多个弱学习器可以采用投票方式获取最终分类结果,相比传统单一学习器具有更优越的泛化性能和更好的分类准确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1是本发明基于多尺度分析和集成学习的气敏传感器故障模式识别方法流程图;
图2是本发明Bagging算法原理框图;
图3是本发明实施例提供的不同故障类型下CMWPE值示意图;
图4是本发明实施例提供的不同故障类型下CMWPE值的FDA降维结果比较结果示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见附图1,为本实施例提供的一种基于多尺度分析和集成学习的气敏传感器故障模式识别方法流程图,本实施例的具体执行过程如下:
S1、对气敏传感器输出的故障信号时间序列进行加权排列熵的多尺度分析,得到故障信号在不同尺度因子下的复合多尺度加权排列熵。
S1的执行过程是在现有加权排列熵的技术基础之上提出的,因此,首先对加权排列熵WPE进行说明:
排列熵是一种不需要考虑时间序列的具体大小的非线性分析方法,它通过相邻数据对时间序列的复杂性进行度量,进而获得时间序列的特征信息。然而排列熵忽略了相同序数模式之间的幅度差异,丢失了有关信号幅值的信息。因此保留了信号中有用的幅值信息并提出了加权排列熵(WPE)。具体计算方法如下:
考虑长度为N的时间序列{x(1),x(2),...x(N)},对其进行相空间重构,得到如下时间序列:
式中,m为嵌入维度,λ为时延。
将X(i)的m个数据按升序排列,得到
如果存在x(i+(j1-1)τ)=x(i+(j2-1)τ),则按j值的大小进行排序。当ji1<ji2,有x(i+(ji1-1)τ)≤x(i+(ji2-1)τ)。因此,任意数据X(i)都可以得到一组符号序列:
Se(g)={j1,j2,...,jm} (3)
其中,g=1,2,...k,k≤m!,m个不同的符号{j1,j2,...,jm}共有m!种不同的排列,共有m!种不同的序号序列,Se(g)是m!中符号序列中的一种。
时间序列中第g个时间序列出现的频率为:
其中s=1,2,...,S,S表示相同序数模式中可能的时间序列的数目,ωg为权值。每个序数模式的加权概率为
最终,加权排列熵计算为
同样,对加权排列熵进行标准化得到Hω
由于上述介绍的加权排列熵只能分析时间序列在单一尺度上的复杂性和动力学突变行为。因此本实施例对WPE进行复合多尺度分析。
复合多尺度排列熵(CMWPE)在粗粒化过程中采用统一尺度因子τ下,能够得到τ组不同的粗粒化时间序列,具体过程如下:
对每一个故障信号时间序列的不同τ值计算CMWPE,得到1×m维的加权排列熵向量,再将得到的熵值表示成尺度因子τ的函数,此过程即为复合多尺度加权排列熵的分析过程。CMWPE综合了统一尺度下所有粗粒化序列的排列熵信息,相对于传统的多尺度分析方法更为合理。复合多尺度加权排列熵曲线也反映了时间序列在不同尺度因子下的复杂性。当某一时间序列的熵值在大部分尺度上都比里一个时间序列的值大,则认为前者比后者更为复杂。
S2、通过Fisher判别法计算复合多尺度加权排列熵的最优鉴别矢量集,对复合多尺度加权排列熵进行降维,得到故障特征样本集。
Fisher判别分析(FDA)本身属于一种有监督的降维技术,该方法在投影过程中将数据的类型考虑进去,因此被广泛应用于模式识别领域当中。Fisher判别方法的目标是求取一组最优投影轴组成鉴别矢量集,通过该映射集,能够使得各类样本经投影后,在新的空间中能保证方差最小的情况下,实现不同类别样本的有效分离。具体实现过程如下:
定义nl个训练样本矩阵XL=[x1,x2,...,nl],将m组故障信号时间序列对应的CMWPE作为训练样本矩阵,其中xi∈Rm。假设所有nl个训练样本包含K个类别,且第k个(1≤k≤K)类别Ck中有nk个样本。将原始样本经过映射矩阵W变换后变成样本矩阵ZL=[z1,z2,...,zl],zi∈Rm。则变换规则为:
ZL=WTXL (12)
变换的目的在于使得同一类别的样本被映射矩阵W作用后距离更近,而不同类别的样本被映射矩阵W作用后距离更远。
定义类内离散度矩阵Sw,类间离散度矩阵Sb,:
由于Fisher判别的目的是通过投影使得同类样本之间距离最近,不同类样本之间距离最远,以此来获取最后参数。通过定义的类内离散度矩阵Sw和类间离散度矩阵Sb,并依据判别准则求解最优向量,不断循环,最终获得最优鉴别矢量集。基于方法如下:
首先定义Fisher判别的目标函数:
算法的最终目的就是求取W值,使得W令目标函数J最大。上式中,调节W的幅值并不会使J(W)的幅值发生变化,同时也不会影响W的方向。因此,可以通过调整W的值,使得类内离散度矩阵Sw的值达到最小,类间离散度矩阵Sb达到最大,便可以得到转换矩阵W最优鉴别矢量解。
为了求解令目标函数最大的矢量解,借助拉格朗日算法,将目标函数的分子最大化,分母为非零常数,则有
WTSwW=c≠0 (16)
拉格朗日的无约束极值表示为
L(W,λ)=WTSbW-λ(WTSw-c) (17)
式中λ为拉格朗日乘子,当对上式求取极值点是,有
令式得零,有
SbW=λSwW (19)
当样本数大于数据特征维数时,即Sw可逆是,左右乘以Sw -1,有
Sw -1SbW=λW (20)
通过对公式(20)进行求解,W为矩阵Sw -1Sb的特征向量构成的矩阵,λ为所有特征值构成的矩阵。这里特征值λ的大小代表通过把所有类别的样本投影到W上,其整体的分离程度。由于Sb的秩小于类个数K,所以至多可以求出有K-1个不等于零的特征值。因此Fisher判别只在非零特征值对应的方向上对特征向量进行有意义的排序。用K-1个向量作为列组成投影矩阵W∈Rm×(K-1),因此,通过上述过程就实现了训练样本数据从m维空到K-1维空间的降维过程。线性变换过程为:
ZL=WTXL (21)
ZL为k-1×m维的故障特征样本集[Z1,Z2,…,ZK-1]T。
综上所述,Fisher判别通过计算鉴别矢量集W,把包含K个类别的数据样本集x1,x2,...,nl映射到K-1维空间上,实现了对多类别数据的最优分离。
S3、利用bagging集成学习方法构建多个基学习器,基学习器用于对故障特征样本集的子样本集进行分类预测,然后将多个基学习器的分类结果进行筛选汇总,得到气敏传感器故障模式识别结果。
首先,集成学习(Ensemble Method,EM)是一种通过合并多个学习模型进而提升机器学习性能的方法。集成学习法利用训练样本数据构建一组基分类器,然后通过对每个基分类器的预测结果进行投票,来确定最终的集成算法的分类结果。
如图2是基于bagging的集成学***滑处理”,因此能够很好地提升不稳定学习方法的预测精度。
Bagging算法的具体实现原理如下:
1.训练数据获取:对原始训练样本集使用Boostrap采样,有放回的从M个训练样本中抽取M个样本作为训练样本集,经过T次采样后,获得原始训练样本的T个样本子集,用于对基学习器进行训练;
2.分类器训练:利用生成的T个训练样本训练T个基学习器,构成集成学习模型;
3.分类结果汇总:将测试样本输入到训练好的分类模型中,输出T个分类结果,利用投票的方式得到最终分类结果;
本发明采用决策树作为bagging集成学习的基学习器,它在机器学习领域是常用的分类算法,它有分类速度快,准确率高得优点。虽然决策树算法得到的分类器存在过拟合的现象,但当它作为bagging算法的基学习器时,由于训练样本采样的随机性,使得最终投票结果一定程度避免了过拟合的情况。
本实施例采用决策树算法中的C4.5算法进行基学习器的训练,它主要采用基于信息增益率作为属性选择度量。具体过程如下:
(1)令训样本集为xi=(xi,1,xi,2,...,xi,n)T,类标号集合为Y={y1,y2,...,ym},将根节点作为这个样本集合。其中,训练样本集为经过T次采样后,获得的原始训练样本的T个样本子集,用这T个样本子集对T个决策树进行训练。
(2)针对每一个样本属性,分别计算当概述作为节点***属性是对应的信息增益率,选择具有最高信息增益率的属性。具体信息增益率计算过程如下:
对训练样本集进行封,假设分为个m不同部分,表示为Ti(1≤i≤m)。设属性集合An={A1,A2,...,An},按照第j(1≤j≤n)个属性Aj,原始数据集T被划分为w个不同的子集绝对值表示相应集合中的样本个数。
原始数据集T的信息熵Entrogy(T)为:
其中,pi=|Ci|/|T|。
Gain(Aj)依据Aj划分的T的信息增益:
GainRatio(Aj)为依据Aj划分的T的信息增益率:
(3)根据第(2)不的信息增益率作为最佳属性划分当前节点,将节点分成两个子集,建立分支,得到两个新的节点。
(4)对于产生的两个新的节点,分别重复步骤(2)(3),知道所有分支达到最大深度,即所有节点中的样本都属于同一类,分类终止。
为了验证本实施例提出的针对MOS气敏传感器故障模式识别方法的有效性,实验采用基于实验获取的MOS气体传感器阵列采集得到的数据集。以装配有20个FIGARO公司生产的商用MOS气敏传感器组成的传感器阵列作为研究对象,建立了数据采集***。在气体传感器阵列正常工作情况下,进行长时间采集获取充足的实验样本,作为算法验证的数据集。并利用故障注入方式叠加故障信号,产生不同故障类型的实验样本。具体故障类型包括:正常情况、冲击故障、偏置故障、恒定输出、掉电故障、噪声干扰、漂移故障。
实验样本为MOS气体传感器阵列正常工作输出信号,随机选择某一MOS气敏传感器作为故障传感器,叠加上述的不同故障类型的仿真故障信号,其中故障开始时间为随机设置。共获得各种故障类型下各200组信号,每组信号长度为1000个样本点,并随机选择100组数据作为训练样本,另外100组数据为测试样本。
气敏传感器的故障特征提取方法实验结果和分析:
为了提取不同故障类型下的MOS气敏传感器故障特征,首先利用CMWPE对不同故障类型下的MOS气敏传感器训练样本进行多尺度化分析。通过实验分析,分别设置复合多尺度加权排列熵主要包括三个参数:延迟时间λ=1、尺度因子τ=25和嵌入维度m=4。
如图3所示为不同故障类型的CMWPE值。复合多尺度分析方法能够有效的对单一维度的MOS气敏传感器信号进行多尺度扩维,得到不同粗粒化程度下的时间序列片段。由图中曲线可以看出,通过计算每一尺度时间序列的加权排列熵可以得到每一尺度信号的复杂性。不同尺度下的WPE值可以构成传感器故障信号的特征向量。同时,通过对比不同故障类型的CMWPE曲线可以看出,该方法能够突出不同故障类型的差异性。
本实验选取了不同故障类型下的实验样本计算了相应复合多尺度加权排列熵,构建了基本的故障特征样本集。在多尺度分析过程中,尺度因子设置为25,因此获得的故障特征中包含了25个特征值。如果采用所有尺度下的特征值对分类器进行训练和测试,可能会有一些无关和冗余的信息对模式识别结果产生影响。因此为了提高模式识别的速度和精度,本实验采用一种有监督的降维方法——FDA方法对高维故障特征进行降维处理。
如图4所示为不同故障类型下CMWPE值的FDA降维结果比较。通过直方图幅值大小对比可以看出,不同故障类型下获得的特征向量中各元素存在差异,这说明本章提出的故障特征提取方法可以使得不同故障类别很好的得到区分。
为了说明提出的基于CMWPE和FDA的特征提取方法的优越性,本实验采用综合特征评估方法对基于不同的特征提取方法进行评估。该方法主要思想是当特征向量中的某一特征在同类别的类内距离最小,而不同类别之间类间距离最大,则对于所有故障类别而言,该特征的可区分性最大。下面对综合特征评估方法的原理进行说明:
为了对提出的基于CMWPE和FDA的MOS气敏传感器故障特征提取方法得到的特征向量的可分性进行评估,研究基于距离的类别可分性判据原理。该综合特征评估方法的主要思想是为特征向量中的某一特征在同类别的类内距离最小,而不同类别之间类间距离最大,则对于所有故障类别而言,该特征的可区分性最大。传感器信号综合特征评估方法具体原理如下:
计算第i类特征向量中的第k个特征的类内距离
m,n=1,2,...,N,m≠n,k=1,2,...,K,i=1,2,...,M
利用式(2-27)求特征向量第k个特征M个类别的平均类内距离
可以获得第k个特征M个类别的类间距离的均值
第k个特征的综合评估因子为
βk=D'k/Dk (33)
βk的大小可以综合评定第k个特征对M个类的可分性,βk越大则表示第k个特征对M个类的区分能力越强。
利用上述综合评估方法即可对传感器故障特征进行可分性评估,区分度因子能够评价某一个特征对两个类别的区分能力,综合评估因子能够评价某一个特征对所有类别的区分能力。
具体不同特征提取方法的综合特征评估结果如表格1所示,表格中的方法包括:采用时频分析方法的基于集合经验模态分解(EEMD)和排列熵(PE)的特征提取方法,将信号分解为5个本征模态函数(IMFs)和一个残余分量。采用复合多尺度排列熵(CMPE)作为了实验对比算法,相关参数延迟时间λ、尺度因子τ和嵌入维度m设置同上文CMWPE的参数相同。基于CMWPE和PCA降维的特征提取方法中,PCA方法中主元个数选择与FDA降维方法相同的6个。
表1不同特征提取方法综合特征评估结果
特征提取方法 | 综合特征评估因子 |
EEMD+PE | [5.5917,2.4954,1.6760,0.9547,0.3991,0.1040] |
CMPE+FDA | [8.8575,6.6729,3.9535,1.3697,0.5308,0.2373] |
CMWPE+PCA | [9.2955,3.9232,2.8992,1.1615,0.9680,0.5381] |
CMWPE+FDA | [13.7618,4.1107,2.2459,1.3889,0.7550,0.4057] |
由表1所示的不同特征提取方法的综合特征评估结果说明,相对于EEMD排列熵时频分析方法获得的特征向量,CMWPE分析方法能够更好的提取出隐含在传感器时间信号序列中的丰富信息。同时与CMPE相比,CMWPE方法因为将信号幅值信息也加入排列熵的计算过程中,使得获得故障特征对不同故障类型的可分性更好。最后对比利用PCA和FDA对CMWPE进行降维后的综合特征评估因子,可以知道有监督的FDA方法能够进一步提高不同故障特征的可分性。
故障模式识别实验结果与分析:
如表2所示为传感器故障模式识别算法性能比较结果。对比算法中的SVM采用高斯核。其中,惩罚因子c和核参数g利用网格搜索和三折交叉验证的方法确定。通过对一定范围内的c和g取值,对于取定的c和g把训练样本作为原始数据利用三折交叉验证得到相应c和g下训练样本集的分类准确率,确定最终选定的c和g,并作为SVM模型的最佳参数。
表2不同故障识别算法性能比较结果
由故障模式识别结果可以看出,相对于时频分析的EEMD排列熵与SVM结合方法,CMPE、FDA和SVM相结合的故障识别方法,基于CMWPE和FDA的特征提取方法与基于Bagging的集成学***均故障识别准确率高了8.42%和5.56%。
以上对本发明所提供的一种基于多尺度分析和集成学习的气敏传感器故障模式识别方法进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本发明的限制。
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
Claims (4)
1.基于多尺度分析和集成学习的气敏传感器故障模式识别方法,其特征在于,包括如下步骤:
S1、对气敏传感器输出的故障信号进行复合多尺度分析,得到不同尺度因子下的时间序列,分别计算每个时间序列的加权排列熵并构成复合多尺度加权排列熵特征向量;
S2、通过Fisher判别法计算复合多尺度加权排列熵特征向量的最优鉴别矢量集,对复合多尺度加权排列熵进行降维,作为模式识别的故障特征样本集;
S3、利用bagging集成学习方法构建多个基学习器,基学习器用于对故障特征样本集的子样本集进行分类预测,然后将多个基学习器的分类结果进行筛选汇总,得到气敏传感器故障模式识别结果。
4.根据权利要求1所述的基于多尺度分析和集成学习的气敏传感器故障模式识别方法,其特征在于,所述S3中,采用决策树进行基学习器的训练,并基于故障特征样本集的信息增益率作为属性选择度量进行类别划分。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010496367.2A CN111738309A (zh) | 2020-06-03 | 2020-06-03 | 多尺度分析和集成学习的气敏传感器故障模式识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010496367.2A CN111738309A (zh) | 2020-06-03 | 2020-06-03 | 多尺度分析和集成学习的气敏传感器故障模式识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111738309A true CN111738309A (zh) | 2020-10-02 |
Family
ID=72648455
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010496367.2A Pending CN111738309A (zh) | 2020-06-03 | 2020-06-03 | 多尺度分析和集成学习的气敏传感器故障模式识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111738309A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112529096A (zh) * | 2020-12-22 | 2021-03-19 | 哈尔滨工业大学 | 基于pca的多维航天器遥测数据的故障诊断方法 |
CN112580741A (zh) * | 2020-12-28 | 2021-03-30 | 天津同阳科技发展有限公司 | 一种基于多传感器快速学习的气体种类识别方法及*** |
CN112598022A (zh) * | 2020-11-30 | 2021-04-02 | 北京化工大学 | 基于集成学习方法的改进fda流程工业故障诊断方法 |
CN112733289A (zh) * | 2020-12-31 | 2021-04-30 | 杭州朗阳科技有限公司 | 一种新的基于多尺度排列熵的诊断电机轴承故障机器学习方法 |
CN112761843A (zh) * | 2021-02-18 | 2021-05-07 | 哈尔滨工程大学 | 一种共轨喷油器故障诊断方法 |
CN113326472A (zh) * | 2021-05-28 | 2021-08-31 | 东北师范大学 | 一种基于时序多变量数据的模式提取与演化可视分析方法 |
CN117455890A (zh) * | 2023-11-20 | 2024-01-26 | 浙江大学 | 一种基于改进集成深度学习的儿童肠套叠空气灌肠结果预测装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008014679A (ja) * | 2006-07-03 | 2008-01-24 | Ritsumeikan | 設備診断方法、設備診断システム及びコンピュータプログラム |
US20130148817A1 (en) * | 2011-12-09 | 2013-06-13 | Tokyo Electron Limited | Abnormality detection apparatus for periodic driving system, processing apparatus including periodic driving system, abnormality detection method for periodic driving system, and computer program |
CN106980822A (zh) * | 2017-03-14 | 2017-07-25 | 北京航空航天大学 | 一种基于选择性集成学习的旋转机械故障诊断方法 |
CN108228716A (zh) * | 2017-12-05 | 2018-06-29 | 华南理工大学 | 基于加权极限学习机的SMOTE_Bagging集成污水处理故障诊断方法 |
CN110025322A (zh) * | 2019-04-11 | 2019-07-19 | 辽宁师范大学 | 基于滤波与集成分类器的多模态生理信号情感分类方法 |
CN111191740A (zh) * | 2020-01-10 | 2020-05-22 | 福州大学 | 一种滚动轴承故障诊断方法 |
-
2020
- 2020-06-03 CN CN202010496367.2A patent/CN111738309A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008014679A (ja) * | 2006-07-03 | 2008-01-24 | Ritsumeikan | 設備診断方法、設備診断システム及びコンピュータプログラム |
US20130148817A1 (en) * | 2011-12-09 | 2013-06-13 | Tokyo Electron Limited | Abnormality detection apparatus for periodic driving system, processing apparatus including periodic driving system, abnormality detection method for periodic driving system, and computer program |
CN106980822A (zh) * | 2017-03-14 | 2017-07-25 | 北京航空航天大学 | 一种基于选择性集成学习的旋转机械故障诊断方法 |
CN108228716A (zh) * | 2017-12-05 | 2018-06-29 | 华南理工大学 | 基于加权极限学习机的SMOTE_Bagging集成污水处理故障诊断方法 |
CN110025322A (zh) * | 2019-04-11 | 2019-07-19 | 辽宁师范大学 | 基于滤波与集成分类器的多模态生理信号情感分类方法 |
CN111191740A (zh) * | 2020-01-10 | 2020-05-22 | 福州大学 | 一种滚动轴承故障诊断方法 |
Non-Patent Citations (4)
Title |
---|
JINDEZHENG等: "Composite multi-scale weighted permutation entropy and extreme learning machine based intelligent fault diagnosis for rolling bearing", MEASUREMENT, 31 December 2019 (2019-12-31) * |
XIONGGAN等: "Rolling Bearing Diagnosis Based on Composite Multiscale Weighted Permutation Entropy", ENTROPY, 31 December 2018 (2018-12-31) * |
瞿金秀;石长全;丁锋;王文娟;: "基于多尺度排列熵和支持向量机的轴承故障诊断", no. 09 * |
董治麟;郑近德;潘海洋;刘庆运;丁克勤;: "基于复合多尺度排列熵与FO-SVM的滚动轴承故障诊断方法", no. 02 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112598022A (zh) * | 2020-11-30 | 2021-04-02 | 北京化工大学 | 基于集成学习方法的改进fda流程工业故障诊断方法 |
CN112529096A (zh) * | 2020-12-22 | 2021-03-19 | 哈尔滨工业大学 | 基于pca的多维航天器遥测数据的故障诊断方法 |
CN112580741A (zh) * | 2020-12-28 | 2021-03-30 | 天津同阳科技发展有限公司 | 一种基于多传感器快速学习的气体种类识别方法及*** |
CN112733289A (zh) * | 2020-12-31 | 2021-04-30 | 杭州朗阳科技有限公司 | 一种新的基于多尺度排列熵的诊断电机轴承故障机器学习方法 |
CN112761843A (zh) * | 2021-02-18 | 2021-05-07 | 哈尔滨工程大学 | 一种共轨喷油器故障诊断方法 |
CN113326472A (zh) * | 2021-05-28 | 2021-08-31 | 东北师范大学 | 一种基于时序多变量数据的模式提取与演化可视分析方法 |
CN117455890A (zh) * | 2023-11-20 | 2024-01-26 | 浙江大学 | 一种基于改进集成深度学习的儿童肠套叠空气灌肠结果预测装置 |
CN117455890B (zh) * | 2023-11-20 | 2024-05-31 | 浙江大学 | 一种基于改进集成深度学习的儿童肠套叠空气灌肠结果预测装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111738309A (zh) | 多尺度分析和集成学习的气敏传感器故障模式识别方法 | |
CN110132598B (zh) | 旋转设备滚动轴承故障噪声诊断算法 | |
Bai et al. | Time series classification based on multi-feature dictionary representation and ensemble learning | |
He et al. | Detecting the number of clusters in n-way probabilistic clustering | |
US7724961B2 (en) | Method for classifying data using an analytic manifold | |
O’Reilly et al. | Univariate and multivariate time series manifold learning | |
CN113962259B (zh) | 一种燃料电池***多模式双层故障诊断方法 | |
Huang et al. | Exploiting local coherent patterns for unsupervised feature ranking | |
CN112819059B (zh) | 一种基于流行保持迁移学习的滚动轴承故障诊断方法 | |
CN107292225B (zh) | 一种人脸识别方法 | |
CN111835707B (zh) | 一种基于改进后的支持向量机的恶意程序识别方法 | |
Dai | Research on SVM improved algorithm for large data classification | |
CN112861066B (zh) | 基于机器学习和fft的盲源分离信源数目并行估计方法 | |
Wang et al. | Multiple manifolds metric learning with application to image set classification | |
Pucci et al. | Human activities classification using biaxial seismic sensors | |
CN115577357A (zh) | 一种基于堆叠集成技术的Android恶意软件检测方法 | |
Jia et al. | An effective imbalanced JPEG steganalysis scheme based on adaptive cost-sensitive feature learning | |
CN101877065A (zh) | 小样本条件下的人脸图像非线性鉴别特征抽取和识别方法 | |
Shu et al. | An anomaly detection method based on random convolutional kernel and isolation forest for equipment state monitoring | |
CN107909090A (zh) | 基于测度学习半监督的钢琴乐谱难度识别方法 | |
Chakraborty | A proposal for classification of multisensor time series data based on time delay embedding | |
CN112465054B (zh) | 一种基于fcn的多变量时间序列数据分类方法 | |
Ade | Students performance prediction using hybrid classifier technique in incremental learning | |
CN114218991A (zh) | 一种基于加权BP-AdaBoost的转子故障诊断方法 | |
Shu-Juan | Fast incremental spectral clustering in titanate application via graph Fourier transform |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |