CN111738309A - 多尺度分析和集成学习的气敏传感器故障模式识别方法 - Google Patents

多尺度分析和集成学习的气敏传感器故障模式识别方法 Download PDF

Info

Publication number
CN111738309A
CN111738309A CN202010496367.2A CN202010496367A CN111738309A CN 111738309 A CN111738309 A CN 111738309A CN 202010496367 A CN202010496367 A CN 202010496367A CN 111738309 A CN111738309 A CN 111738309A
Authority
CN
China
Prior art keywords
fault
scale
gas sensor
feature
entropy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010496367.2A
Other languages
English (en)
Inventor
许永辉
刘玉奇
杨子萱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Institute of Technology
Original Assignee
Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Institute of Technology filed Critical Harbin Institute of Technology
Priority to CN202010496367.2A priority Critical patent/CN111738309A/zh
Publication of CN111738309A publication Critical patent/CN111738309A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/285Selection of pattern recognition techniques, e.g. of classifiers in a multi-classifier system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Investigating Or Analyzing Materials By The Use Of Fluid Adsorption Or Reactions (AREA)

Abstract

本发明公开的一种基于多尺度分析和集成学习的气敏传感器故障模式识别方法,包括:对气敏传感器故障信号进行多尺度分析,得到不同尺度因子下的时间序列,分别计算每个时间序列的加权排列熵构成复合多尺度加权排列熵特征向量;通过Fisher判别法对复合多尺度加权排列熵进行降维,作为模式识别的故障特征样本;利用集成学习方法构建多个基学习器,用于对故障特征样本集的子样本集进行分类预测,然后将多个基学习器的分类结果进行汇总,得到气敏传感器故障模式识别结果。本发明能够突出不同故障类型的差异性,并且选择的集成学习分类器对气敏传感器故障识别具有更优越的泛化性能和更好的分类准确率,避免严重事故发生。

Description

多尺度分析和集成学习的气敏传感器故障模式识别方法
技术领域
本发明属于机器嗅觉技术领域,涉及一种基于多尺度分析和集成学习的气敏传感器故障模式识别方法。
背景技术
模式识别是当前实现传感器故障识别的主要方法。主要过程是:首先,对传感器正常情况下和各种不同故障情况下的传感器信号进行采集,构成传感器各种不同状态的训练样本集;然后选择合适的故障信号特征提取方法,提取不同故障状态下的故障特征信息,构成故障特征训练样本集;接下来,利用故障特征训练样本集训练基于模式识别方法的分类器;最后,利用训练好的分类器对传感器测试样本进行模式识别,并由分类器输出识别出的故障类型。通过以上的过程描述可知,传感器模式识别方法主要有两个关键步骤,分别是故障特征提取方法的选择和分类器的选择。
时频分析方法是当前传感器信号故障特征分析的主要方法,其主要通过傅里叶变换、小波变换、经验模态分解等方法在时域和频域对传感器信号进行分解。将原始故障信号分解成若干个简单的平稳分量信号,然后通过对各分量信号进行处理获取时频域的数据信息,实现特征提取。但是由于传感器信号通常表现为非线性行为,时频分析的信号分解过程,难免会丢失一定的故障信息。非线性分析的方法可以不对信号进行分解,而是直接对传感器信号中的数据信息进行特征提取。非线性分析方法主要包括关联维数、样本熵、排列熵、多尺度熵等。但从MOS气敏传感器故障信号中提取的特征信息对于不同故障类型区分性较差。
传感器故障识别过程中的分类方法多采用模式识别方法,通过训练样本对分类器进行模型构建,然后将测试样本输入到训练模型中得到分类结果,例如决策树、贝叶斯分类器、K近邻法(KNN)、支持向量机(SVM)、神经网络等算法均被广泛应用在传感器故障识别中。而为了提高各分类器的分类性能,研究学者们提出了各种分类器的改进方法,包括基于SLIQ算法的决策树、Tan贝叶斯网络、LS-SVM、SVR等等。但上述改进方法都比较复杂,并且分类结果依赖模型本身的性能,不同的参数设置很大程度影响最终分类结果,模型训练过程容易发生过拟合现象,从而导致分类准确率不高。
因此,提供一种对不同故障类型区分性强,且分类准确率高的基于多尺度分析和集成学习的气敏传感器故障模式识别方法是本领域技术人员亟待解决的技术问题。
发明内容
本发明针对传感器故障模式识别过程中,提取的故障特征对不同故障类型区分性差以及分类器分类准确率不佳的问题。提出一种基于复合多尺度加权排列熵,Fisher判别和bagging集成学习分类器的气敏传感器故障模式识别方法。该方法能够突出不同故障类型的差异性,并且选择的基于bagging集成学习的分类器对MOS气敏传感器最终故障识别具有更优越的泛化性能和更好的分类准确率。
为实现上述目的其具体方案如下:
一种基于多尺度分析和集成学习的气敏传感器故障模式识别方法,包括如下步骤:
S1、对气敏传感器输出的故障信号进行复合多尺度分析,得到不同尺度因子下的时间序列,分别计算每个时间序列的加权排列熵并构成复合多尺度加权排列熵特征向量,作为故障信号的特征;
S2、通过Fisher判别法计算复合多尺度加权排列熵的最优鉴别矢量集,对复合多尺度加权排列熵进行降维,作为模式识别的故障特征样本集;
S3、利用bagging集成学习方法构建多个基学习器,基学习器用于对故障特征样本集的子样本集进行分类预测,然后将多个基学习器的分类结果进行筛选汇总,得到气敏传感器故障模式识别结果。
优选的,所述S1包括:
S11、对故障信号时间序列{x(1),x(2),...x(N)}进行改进的粗粒化处理,得到粗粒化序列
Figure BDA0002522996710000031
Figure BDA0002522996710000032
其中,τ为尺度因子;
S12、计算每个尺度因子τ对应的粗粒化序列
Figure BDA0002522996710000033
的加权排列熵,再对当前τ对应的加权排列熵求均值,则得到当前尺度因子下的CMWPE:
Figure BDA0002522996710000034
S13、将得到的CMWPE表示成尺度因子τ的函数,得到复合多尺度加权排列熵,其中给定τmax,则τ∈[1,τmax]。
优选的,所述S2中,将m组故障信号时间序列对应的CMWPE作为样本矩阵XL进行映射变换,使同类别故障信号时间序列间距离最近,具体包括:
定义Fisher判别的目标函数:
Figure BDA0002522996710000035
其中,W为映射矩阵,Sw为类内离散度矩阵,Sb为类间离散度矩阵;
调整W的值,使得类内离散度矩阵Sw的值达到最小,类间离散度矩阵Sb达到最大,得到映射矩阵W的最优鉴别矢量解;
确定样本矩阵从m维空间到K-1维空间的降维的线性变换过程为:
ZL=WTXL
得到故障特征样本集ZL
优选的,所述S3中,采用决策树进行基学习器的训练,并基于故障特征样本集的信息增益率作为属性选择度量进行类别划分。
本发明相较现有技术具有以下有益效果:
本发明针对现有技术中不同传感器故障类型区分性差以及故障模式识别准确率低的问题,提出一种基于复合多尺度加权排列熵(CMWPE),Fisher判别(FDA)和bagging集成学习分类器的MOS气敏传感器故障模式识别方法。根据综合特征评估方法计算提取的特征样本集中复合多尺度加权排列熵特征向量的评估因子可知,本发明提出的特征提取方法相对于传统方法提取的特征值包含更为丰富的特征信息,很好的突出不同故障类型的差异性。并且选择的基于bagging集成学习的分类器对MOS气敏传感器最终故障识别准确率达到97.85%。集成学习方法通过集合多个弱学习器可以采用投票方式获取最终分类结果,相比传统单一学习器具有更优越的泛化性能和更好的分类准确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1是本发明基于多尺度分析和集成学习的气敏传感器故障模式识别方法流程图;
图2是本发明Bagging算法原理框图;
图3是本发明实施例提供的不同故障类型下CMWPE值示意图;
图4是本发明实施例提供的不同故障类型下CMWPE值的FDA降维结果比较结果示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见附图1,为本实施例提供的一种基于多尺度分析和集成学习的气敏传感器故障模式识别方法流程图,本实施例的具体执行过程如下:
S1、对气敏传感器输出的故障信号时间序列进行加权排列熵的多尺度分析,得到故障信号在不同尺度因子下的复合多尺度加权排列熵。
S1的执行过程是在现有加权排列熵的技术基础之上提出的,因此,首先对加权排列熵WPE进行说明:
排列熵是一种不需要考虑时间序列的具体大小的非线性分析方法,它通过相邻数据对时间序列的复杂性进行度量,进而获得时间序列的特征信息。然而排列熵忽略了相同序数模式之间的幅度差异,丢失了有关信号幅值的信息。因此保留了信号中有用的幅值信息并提出了加权排列熵(WPE)。具体计算方法如下:
考虑长度为N的时间序列{x(1),x(2),...x(N)},对其进行相空间重构,得到如下时间序列:
Figure BDA0002522996710000051
式中,m为嵌入维度,λ为时延。
将X(i)的m个数据按升序排列,得到
Figure BDA0002522996710000052
如果存在x(i+(j1-1)τ)=x(i+(j2-1)τ),则按j值的大小进行排序。当ji1<ji2,有x(i+(ji1-1)τ)≤x(i+(ji2-1)τ)。因此,任意数据X(i)都可以得到一组符号序列:
Se(g)={j1,j2,...,jm} (3)
其中,g=1,2,...k,k≤m!,m个不同的符号{j1,j2,...,jm}共有m!种不同的排列,共有m!种不同的序号序列,Se(g)是m!中符号序列中的一种。
时间序列中第g个时间序列出现的频率为:
Figure BDA0002522996710000053
其中s=1,2,...,S,S表示相同序数模式中可能的时间序列的数目,ωg为权值。每个序数模式的加权概率为
Figure BDA0002522996710000061
已知
Figure BDA0002522996710000062
其中权值ωg(s)计算公式
Figure BDA0002522996710000063
其中
Figure BDA0002522996710000064
为算数平均值
Figure BDA0002522996710000065
最终,加权排列熵计算为
Figure BDA0002522996710000066
同样,对加权排列熵进行标准化得到Hω
Figure BDA0002522996710000067
由于上述介绍的加权排列熵只能分析时间序列在单一尺度上的复杂性和动力学突变行为。因此本实施例对WPE进行复合多尺度分析。
复合多尺度排列熵(CMWPE)在粗粒化过程中采用统一尺度因子τ下,能够得到τ组不同的粗粒化时间序列,具体过程如下:
(1)对m组气敏传感器故障信号时间序列{x(1),x(2),...x(N)}进行改进的粗粒化处理,定义
Figure BDA0002522996710000068
Figure BDA0002522996710000069
(2)对每个尺度因子τ,计算每个粗粒化序列
Figure BDA00025229967100000610
的加权排列熵,再对每个τ熵值求均值,则得到这一尺度因子下的CMWPE:
Figure BDA00025229967100000611
对每一个故障信号时间序列的不同τ值计算CMWPE,得到1×m维的加权排列熵向量,再将得到的熵值表示成尺度因子τ的函数,此过程即为复合多尺度加权排列熵的分析过程。CMWPE综合了统一尺度下所有粗粒化序列的排列熵信息,相对于传统的多尺度分析方法更为合理。复合多尺度加权排列熵曲线也反映了时间序列在不同尺度因子下的复杂性。当某一时间序列的熵值在大部分尺度上都比里一个时间序列的值大,则认为前者比后者更为复杂。
S2、通过Fisher判别法计算复合多尺度加权排列熵的最优鉴别矢量集,对复合多尺度加权排列熵进行降维,得到故障特征样本集。
Fisher判别分析(FDA)本身属于一种有监督的降维技术,该方法在投影过程中将数据的类型考虑进去,因此被广泛应用于模式识别领域当中。Fisher判别方法的目标是求取一组最优投影轴组成鉴别矢量集,通过该映射集,能够使得各类样本经投影后,在新的空间中能保证方差最小的情况下,实现不同类别样本的有效分离。具体实现过程如下:
定义nl个训练样本矩阵XL=[x1,x2,...,nl],将m组故障信号时间序列对应的CMWPE作为训练样本矩阵,其中xi∈Rm。假设所有nl个训练样本包含K个类别,且第k个(1≤k≤K)类别Ck中有nk个样本。将原始样本经过映射矩阵W变换后变成样本矩阵ZL=[z1,z2,...,zl],zi∈Rm。则变换规则为:
ZL=WTXL (12)
变换的目的在于使得同一类别的样本被映射矩阵W作用后距离更近,而不同类别的样本被映射矩阵W作用后距离更远。
定义类内离散度矩阵Sw,类间离散度矩阵Sb,:
Figure BDA0002522996710000071
Figure BDA0002522996710000072
其中
Figure BDA0002522996710000073
是第k个类别内的样本均值,而
Figure BDA0002522996710000074
是所有样本均值。
由于Fisher判别的目的是通过投影使得同类样本之间距离最近,不同类样本之间距离最远,以此来获取最后参数。通过定义的类内离散度矩阵Sw和类间离散度矩阵Sb,并依据判别准则求解最优向量,不断循环,最终获得最优鉴别矢量集。基于方法如下:
首先定义Fisher判别的目标函数:
Figure BDA0002522996710000081
算法的最终目的就是求取W值,使得W令目标函数J最大。上式中,调节W的幅值并不会使J(W)的幅值发生变化,同时也不会影响W的方向。因此,可以通过调整W的值,使得类内离散度矩阵Sw的值达到最小,类间离散度矩阵Sb达到最大,便可以得到转换矩阵W最优鉴别矢量解。
为了求解令目标函数最大的矢量解,借助拉格朗日算法,将目标函数的分子最大化,分母为非零常数,则有
WTSwW=c≠0 (16)
拉格朗日的无约束极值表示为
L(W,λ)=WTSbW-λ(WTSw-c) (17)
式中λ为拉格朗日乘子,当对上式求取极值点是,有
Figure BDA0002522996710000082
令式得零,有
SbW=λSwW (19)
当样本数大于数据特征维数时,即Sw可逆是,左右乘以Sw -1,有
Sw -1SbW=λW (20)
通过对公式(20)进行求解,W为矩阵Sw -1Sb的特征向量构成的矩阵,λ为所有特征值构成的矩阵。这里特征值λ的大小代表通过把所有类别的样本投影到W上,其整体的分离程度。由于Sb的秩小于类个数K,所以至多可以求出有K-1个不等于零的特征值。因此Fisher判别只在非零特征值对应的方向上对特征向量进行有意义的排序。用K-1个向量作为列组成投影矩阵W∈Rm×(K-1),因此,通过上述过程就实现了训练样本数据从m维空到K-1维空间的降维过程。线性变换过程为:
ZL=WTXL (21)
ZL为k-1×m维的故障特征样本集[Z1,Z2,…,ZK-1]T
综上所述,Fisher判别通过计算鉴别矢量集W,把包含K个类别的数据样本集x1,x2,...,nl映射到K-1维空间上,实现了对多类别数据的最优分离。
S3、利用bagging集成学习方法构建多个基学习器,基学习器用于对故障特征样本集的子样本集进行分类预测,然后将多个基学习器的分类结果进行筛选汇总,得到气敏传感器故障模式识别结果。
首先,集成学习(Ensemble Method,EM)是一种通过合并多个学习模型进而提升机器学习性能的方法。集成学习法利用训练样本数据构建一组基分类器,然后通过对每个基分类器的预测结果进行投票,来确定最终的集成算法的分类结果。
如图2是基于bagging的集成学***滑处理”,因此能够很好地提升不稳定学习方法的预测精度。
Bagging算法的具体实现原理如下:
1.训练数据获取:对原始训练样本集使用Boostrap采样,有放回的从M个训练样本中抽取M个样本作为训练样本集,经过T次采样后,获得原始训练样本的T个样本子集,用于对基学习器进行训练;
2.分类器训练:利用生成的T个训练样本训练T个基学习器,构成集成学习模型;
3.分类结果汇总:将测试样本输入到训练好的分类模型中,输出T个分类结果,利用投票的方式得到最终分类结果;
本发明采用决策树作为bagging集成学习的基学习器,它在机器学习领域是常用的分类算法,它有分类速度快,准确率高得优点。虽然决策树算法得到的分类器存在过拟合的现象,但当它作为bagging算法的基学习器时,由于训练样本采样的随机性,使得最终投票结果一定程度避免了过拟合的情况。
本实施例采用决策树算法中的C4.5算法进行基学习器的训练,它主要采用基于信息增益率作为属性选择度量。具体过程如下:
(1)令训样本集为
Figure BDA0002522996710000101
xi=(xi,1,xi,2,...,xi,n)T,类标号集合为Y={y1,y2,...,ym},将根节点作为这个样本集合。其中,训练样本集为经过T次采样后,获得的原始训练样本的T个样本子集,用这T个样本子集对T个决策树进行训练。
(2)针对每一个样本属性,分别计算当概述作为节点***属性是对应的信息增益率,选择具有最高信息增益率的属性。具体信息增益率计算过程如下:
对训练样本集进行封,假设分为个m不同部分,表示为Ti(1≤i≤m)。设属性集合An={A1,A2,...,An},按照第j(1≤j≤n)个属性Aj,原始数据集T被划分为w个不同的子集
Figure BDA0002522996710000102
绝对值表示相应集合中的样本个数。
原始数据集T的信息熵Entrogy(T)为:
Figure BDA0002522996710000103
其中,pi=|Ci|/|T|。
Figure BDA0002522996710000104
依据Aj划分的T的信息熵:
Figure BDA0002522996710000105
Figure BDA0002522996710000106
为子集
Figure BDA0002522996710000107
占整个数据集的百分比,
Figure BDA0002522996710000108
为子集
Figure BDA0002522996710000109
的信息熵。
Gain(Aj)依据Aj划分的T的信息增益:
Figure BDA00025229967100001010
Figure BDA00025229967100001011
为划分信息:
Figure BDA0002522996710000111
GainRatio(Aj)为依据Aj划分的T的信息增益率:
Figure BDA0002522996710000112
(3)根据第(2)不的信息增益率作为最佳属性划分当前节点,将节点分成两个子集,建立分支,得到两个新的节点。
(4)对于产生的两个新的节点,分别重复步骤(2)(3),知道所有分支达到最大深度,即所有节点中的样本都属于同一类,分类终止。
为了验证本实施例提出的针对MOS气敏传感器故障模式识别方法的有效性,实验采用基于实验获取的MOS气体传感器阵列采集得到的数据集。以装配有20个FIGARO公司生产的商用MOS气敏传感器组成的传感器阵列作为研究对象,建立了数据采集***。在气体传感器阵列正常工作情况下,进行长时间采集获取充足的实验样本,作为算法验证的数据集。并利用故障注入方式叠加故障信号,产生不同故障类型的实验样本。具体故障类型包括:正常情况、冲击故障、偏置故障、恒定输出、掉电故障、噪声干扰、漂移故障。
实验样本为MOS气体传感器阵列正常工作输出信号,随机选择某一MOS气敏传感器作为故障传感器,叠加上述的不同故障类型的仿真故障信号,其中故障开始时间为随机设置。共获得各种故障类型下各200组信号,每组信号长度为1000个样本点,并随机选择100组数据作为训练样本,另外100组数据为测试样本。
气敏传感器的故障特征提取方法实验结果和分析:
为了提取不同故障类型下的MOS气敏传感器故障特征,首先利用CMWPE对不同故障类型下的MOS气敏传感器训练样本进行多尺度化分析。通过实验分析,分别设置复合多尺度加权排列熵主要包括三个参数:延迟时间λ=1、尺度因子τ=25和嵌入维度m=4。
如图3所示为不同故障类型的CMWPE值。复合多尺度分析方法能够有效的对单一维度的MOS气敏传感器信号进行多尺度扩维,得到不同粗粒化程度下的时间序列片段。由图中曲线可以看出,通过计算每一尺度时间序列的加权排列熵可以得到每一尺度信号的复杂性。不同尺度下的WPE值可以构成传感器故障信号的特征向量。同时,通过对比不同故障类型的CMWPE曲线可以看出,该方法能够突出不同故障类型的差异性。
本实验选取了不同故障类型下的实验样本计算了相应复合多尺度加权排列熵,构建了基本的故障特征样本集。在多尺度分析过程中,尺度因子设置为25,因此获得的故障特征中包含了25个特征值。如果采用所有尺度下的特征值对分类器进行训练和测试,可能会有一些无关和冗余的信息对模式识别结果产生影响。因此为了提高模式识别的速度和精度,本实验采用一种有监督的降维方法——FDA方法对高维故障特征进行降维处理。
如图4所示为不同故障类型下CMWPE值的FDA降维结果比较。通过直方图幅值大小对比可以看出,不同故障类型下获得的特征向量中各元素存在差异,这说明本章提出的故障特征提取方法可以使得不同故障类别很好的得到区分。
为了说明提出的基于CMWPE和FDA的特征提取方法的优越性,本实验采用综合特征评估方法对基于不同的特征提取方法进行评估。该方法主要思想是当特征向量中的某一特征在同类别的类内距离最小,而不同类别之间类间距离最大,则对于所有故障类别而言,该特征的可区分性最大。下面对综合特征评估方法的原理进行说明:
为了对提出的基于CMWPE和FDA的MOS气敏传感器故障特征提取方法得到的特征向量的可分性进行评估,研究基于距离的类别可分性判据原理。该综合特征评估方法的主要思想是为特征向量中的某一特征在同类别的类内距离最小,而不同类别之间类间距离最大,则对于所有故障类别而言,该特征的可区分性最大。传感器信号综合特征评估方法具体原理如下:
计算第i类特征向量中的第k个特征的类内距离
Figure BDA0002522996710000131
m,n=1,2,...,N,m≠n,k=1,2,...,K,i=1,2,...,M
式中,N表示特征向量样本总数量,K表示特征向量中特征的个数,M为类别总个数,
Figure BDA0002522996710000132
Figure BDA0002522996710000133
分别是第i类的第m个和第n个特征向量中的第k个特征。
利用式(2-27)求特征向量第k个特征M个类别的平均类内距离
Figure BDA0002522996710000134
再计算特征向量中第k个特征对第i类与第j类的类内距离
Figure BDA0002522996710000135
Figure BDA0002522996710000136
其中,
Figure BDA0002522996710000137
表示第i类N个样本第k个特征的均值,公式如下
Figure BDA0002522996710000138
可以获得第k个特征M个类别的类间距离的均值
Figure BDA0002522996710000139
根据第k个特征类内距离与类间距离可以定义区分度因子
Figure BDA00025229967100001310
Figure BDA00025229967100001311
Figure BDA00025229967100001312
的大小决定第k个特征对第i类与第j类的可区分性,
Figure BDA00025229967100001313
越大表示第k个特征对第i类与第j类的可区分性越强。
第k个特征的综合评估因子为
βk=D'k/Dk (33)
βk的大小可以综合评定第k个特征对M个类的可分性,βk越大则表示第k个特征对M个类的区分能力越强。
利用上述综合评估方法即可对传感器故障特征进行可分性评估,区分度因子能够评价某一个特征对两个类别的区分能力,综合评估因子能够评价某一个特征对所有类别的区分能力。
具体不同特征提取方法的综合特征评估结果如表格1所示,表格中的方法包括:采用时频分析方法的基于集合经验模态分解(EEMD)和排列熵(PE)的特征提取方法,将信号分解为5个本征模态函数(IMFs)和一个残余分量。采用复合多尺度排列熵(CMPE)作为了实验对比算法,相关参数延迟时间λ、尺度因子τ和嵌入维度m设置同上文CMWPE的参数相同。基于CMWPE和PCA降维的特征提取方法中,PCA方法中主元个数选择与FDA降维方法相同的6个。
表1不同特征提取方法综合特征评估结果
特征提取方法 综合特征评估因子
EEMD+PE [5.5917,2.4954,1.6760,0.9547,0.3991,0.1040]
CMPE+FDA [8.8575,6.6729,3.9535,1.3697,0.5308,0.2373]
CMWPE+PCA [9.2955,3.9232,2.8992,1.1615,0.9680,0.5381]
CMWPE+FDA [13.7618,4.1107,2.2459,1.3889,0.7550,0.4057]
由表1所示的不同特征提取方法的综合特征评估结果说明,相对于EEMD排列熵时频分析方法获得的特征向量,CMWPE分析方法能够更好的提取出隐含在传感器时间信号序列中的丰富信息。同时与CMPE相比,CMWPE方法因为将信号幅值信息也加入排列熵的计算过程中,使得获得故障特征对不同故障类型的可分性更好。最后对比利用PCA和FDA对CMWPE进行降维后的综合特征评估因子,可以知道有监督的FDA方法能够进一步提高不同故障特征的可分性。
故障模式识别实验结果与分析:
如表2所示为传感器故障模式识别算法性能比较结果。对比算法中的SVM采用高斯核。其中,惩罚因子c和核参数g利用网格搜索和三折交叉验证的方法确定。通过对一定范围内的c和g取值,对于取定的c和g把训练样本作为原始数据利用三折交叉验证得到相应c和g下训练样本集的分类准确率,确定最终选定的c和g,并作为SVM模型的最佳参数。
表2不同故障识别算法性能比较结果
Figure BDA0002522996710000151
由故障模式识别结果可以看出,相对于时频分析的EEMD排列熵与SVM结合方法,CMPE、FDA和SVM相结合的故障识别方法,基于CMWPE和FDA的特征提取方法与基于Bagging的集成学***均故障识别准确率高了8.42%和5.56%。
以上对本发明所提供的一种基于多尺度分析和集成学习的气敏传感器故障模式识别方法进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本发明的限制。
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims (4)

1.基于多尺度分析和集成学习的气敏传感器故障模式识别方法,其特征在于,包括如下步骤:
S1、对气敏传感器输出的故障信号进行复合多尺度分析,得到不同尺度因子下的时间序列,分别计算每个时间序列的加权排列熵并构成复合多尺度加权排列熵特征向量;
S2、通过Fisher判别法计算复合多尺度加权排列熵特征向量的最优鉴别矢量集,对复合多尺度加权排列熵进行降维,作为模式识别的故障特征样本集;
S3、利用bagging集成学习方法构建多个基学习器,基学习器用于对故障特征样本集的子样本集进行分类预测,然后将多个基学习器的分类结果进行筛选汇总,得到气敏传感器故障模式识别结果。
2.根据权利要求1所述的基于多尺度分析和集成学习的气敏传感器故障模式识别方法,其特征在于,所述S1包括:
S11、对故障信号时间序列{x(1),x(2),...x(N)}进行改进的粗粒化处理,得到粗粒化序列
Figure FDA0002522996700000011
Figure FDA0002522996700000012
其中,τ为尺度因子;
S12、计算每个尺度因子τ对应的粗粒化序列
Figure FDA0002522996700000013
的加权排列熵,再对当前τ对应的加权排列熵求均值,则得到当前尺度因子下的CMWPE:
Figure FDA0002522996700000014
S13、将得到的CMWPE表示成尺度因子τ的函数,得到复合多尺度加权排列熵,其中给定τmax,则τ∈[1,τmax]。
3.根据权利要求1所述的基于多尺度分析和集成学习的气敏传感器故障模式识别方法,其特征在于,所述S2中,将m组故障信号时间序列对应的CMWPE作为样本矩阵XL进行映射变换,使同类别故障信号时间序列间距离最近,具体包括:
定义Fisher判别的目标函数:
Figure FDA0002522996700000021
其中,W为映射矩阵,Sw为类内离散度矩阵,Sb为类间离散度矩阵;
调整W的值,使得类内离散度矩阵Sw的值达到最小,类间离散度矩阵Sb达到最大,得到映射矩阵W的最优鉴别矢量解;
确定样本矩阵从m维空间到K-1维空间的降维的线性变换过程为:
ZL=WTXL
得到故障特征样本集ZL
4.根据权利要求1所述的基于多尺度分析和集成学习的气敏传感器故障模式识别方法,其特征在于,所述S3中,采用决策树进行基学习器的训练,并基于故障特征样本集的信息增益率作为属性选择度量进行类别划分。
CN202010496367.2A 2020-06-03 2020-06-03 多尺度分析和集成学习的气敏传感器故障模式识别方法 Pending CN111738309A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010496367.2A CN111738309A (zh) 2020-06-03 2020-06-03 多尺度分析和集成学习的气敏传感器故障模式识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010496367.2A CN111738309A (zh) 2020-06-03 2020-06-03 多尺度分析和集成学习的气敏传感器故障模式识别方法

Publications (1)

Publication Number Publication Date
CN111738309A true CN111738309A (zh) 2020-10-02

Family

ID=72648455

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010496367.2A Pending CN111738309A (zh) 2020-06-03 2020-06-03 多尺度分析和集成学习的气敏传感器故障模式识别方法

Country Status (1)

Country Link
CN (1) CN111738309A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112529096A (zh) * 2020-12-22 2021-03-19 哈尔滨工业大学 基于pca的多维航天器遥测数据的故障诊断方法
CN112580741A (zh) * 2020-12-28 2021-03-30 天津同阳科技发展有限公司 一种基于多传感器快速学习的气体种类识别方法及***
CN112598022A (zh) * 2020-11-30 2021-04-02 北京化工大学 基于集成学习方法的改进fda流程工业故障诊断方法
CN112733289A (zh) * 2020-12-31 2021-04-30 杭州朗阳科技有限公司 一种新的基于多尺度排列熵的诊断电机轴承故障机器学习方法
CN112761843A (zh) * 2021-02-18 2021-05-07 哈尔滨工程大学 一种共轨喷油器故障诊断方法
CN113326472A (zh) * 2021-05-28 2021-08-31 东北师范大学 一种基于时序多变量数据的模式提取与演化可视分析方法
CN117455890A (zh) * 2023-11-20 2024-01-26 浙江大学 一种基于改进集成深度学习的儿童肠套叠空气灌肠结果预测装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008014679A (ja) * 2006-07-03 2008-01-24 Ritsumeikan 設備診断方法、設備診断システム及びコンピュータプログラム
US20130148817A1 (en) * 2011-12-09 2013-06-13 Tokyo Electron Limited Abnormality detection apparatus for periodic driving system, processing apparatus including periodic driving system, abnormality detection method for periodic driving system, and computer program
CN106980822A (zh) * 2017-03-14 2017-07-25 北京航空航天大学 一种基于选择性集成学习的旋转机械故障诊断方法
CN108228716A (zh) * 2017-12-05 2018-06-29 华南理工大学 基于加权极限学习机的SMOTE_Bagging集成污水处理故障诊断方法
CN110025322A (zh) * 2019-04-11 2019-07-19 辽宁师范大学 基于滤波与集成分类器的多模态生理信号情感分类方法
CN111191740A (zh) * 2020-01-10 2020-05-22 福州大学 一种滚动轴承故障诊断方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008014679A (ja) * 2006-07-03 2008-01-24 Ritsumeikan 設備診断方法、設備診断システム及びコンピュータプログラム
US20130148817A1 (en) * 2011-12-09 2013-06-13 Tokyo Electron Limited Abnormality detection apparatus for periodic driving system, processing apparatus including periodic driving system, abnormality detection method for periodic driving system, and computer program
CN106980822A (zh) * 2017-03-14 2017-07-25 北京航空航天大学 一种基于选择性集成学习的旋转机械故障诊断方法
CN108228716A (zh) * 2017-12-05 2018-06-29 华南理工大学 基于加权极限学习机的SMOTE_Bagging集成污水处理故障诊断方法
CN110025322A (zh) * 2019-04-11 2019-07-19 辽宁师范大学 基于滤波与集成分类器的多模态生理信号情感分类方法
CN111191740A (zh) * 2020-01-10 2020-05-22 福州大学 一种滚动轴承故障诊断方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
JINDEZHENG等: "Composite multi-scale weighted permutation entropy and extreme learning machine based intelligent fault diagnosis for rolling bearing", MEASUREMENT, 31 December 2019 (2019-12-31) *
XIONGGAN等: "Rolling Bearing Diagnosis Based on Composite Multiscale Weighted Permutation Entropy", ENTROPY, 31 December 2018 (2018-12-31) *
瞿金秀;石长全;丁锋;王文娟;: "基于多尺度排列熵和支持向量机的轴承故障诊断", no. 09 *
董治麟;郑近德;潘海洋;刘庆运;丁克勤;: "基于复合多尺度排列熵与FO-SVM的滚动轴承故障诊断方法", no. 02 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112598022A (zh) * 2020-11-30 2021-04-02 北京化工大学 基于集成学习方法的改进fda流程工业故障诊断方法
CN112529096A (zh) * 2020-12-22 2021-03-19 哈尔滨工业大学 基于pca的多维航天器遥测数据的故障诊断方法
CN112580741A (zh) * 2020-12-28 2021-03-30 天津同阳科技发展有限公司 一种基于多传感器快速学习的气体种类识别方法及***
CN112733289A (zh) * 2020-12-31 2021-04-30 杭州朗阳科技有限公司 一种新的基于多尺度排列熵的诊断电机轴承故障机器学习方法
CN112761843A (zh) * 2021-02-18 2021-05-07 哈尔滨工程大学 一种共轨喷油器故障诊断方法
CN113326472A (zh) * 2021-05-28 2021-08-31 东北师范大学 一种基于时序多变量数据的模式提取与演化可视分析方法
CN117455890A (zh) * 2023-11-20 2024-01-26 浙江大学 一种基于改进集成深度学习的儿童肠套叠空气灌肠结果预测装置
CN117455890B (zh) * 2023-11-20 2024-05-31 浙江大学 一种基于改进集成深度学习的儿童肠套叠空气灌肠结果预测装置

Similar Documents

Publication Publication Date Title
CN111738309A (zh) 多尺度分析和集成学习的气敏传感器故障模式识别方法
CN110132598B (zh) 旋转设备滚动轴承故障噪声诊断算法
Bai et al. Time series classification based on multi-feature dictionary representation and ensemble learning
He et al. Detecting the number of clusters in n-way probabilistic clustering
US7724961B2 (en) Method for classifying data using an analytic manifold
O’Reilly et al. Univariate and multivariate time series manifold learning
CN113962259B (zh) 一种燃料电池***多模式双层故障诊断方法
Huang et al. Exploiting local coherent patterns for unsupervised feature ranking
CN112819059B (zh) 一种基于流行保持迁移学习的滚动轴承故障诊断方法
CN107292225B (zh) 一种人脸识别方法
CN111835707B (zh) 一种基于改进后的支持向量机的恶意程序识别方法
Dai Research on SVM improved algorithm for large data classification
CN112861066B (zh) 基于机器学习和fft的盲源分离信源数目并行估计方法
Wang et al. Multiple manifolds metric learning with application to image set classification
Pucci et al. Human activities classification using biaxial seismic sensors
CN115577357A (zh) 一种基于堆叠集成技术的Android恶意软件检测方法
Jia et al. An effective imbalanced JPEG steganalysis scheme based on adaptive cost-sensitive feature learning
CN101877065A (zh) 小样本条件下的人脸图像非线性鉴别特征抽取和识别方法
Shu et al. An anomaly detection method based on random convolutional kernel and isolation forest for equipment state monitoring
CN107909090A (zh) 基于测度学习半监督的钢琴乐谱难度识别方法
Chakraborty A proposal for classification of multisensor time series data based on time delay embedding
CN112465054B (zh) 一种基于fcn的多变量时间序列数据分类方法
Ade Students performance prediction using hybrid classifier technique in incremental learning
CN114218991A (zh) 一种基于加权BP-AdaBoost的转子故障诊断方法
Shu-Juan Fast incremental spectral clustering in titanate application via graph Fourier transform

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination