CN112766303B - 一种基于cnn的航空发动机故障诊断方法 - Google Patents

一种基于cnn的航空发动机故障诊断方法 Download PDF

Info

Publication number
CN112766303B
CN112766303B CN202011535827.4A CN202011535827A CN112766303B CN 112766303 B CN112766303 B CN 112766303B CN 202011535827 A CN202011535827 A CN 202011535827A CN 112766303 B CN112766303 B CN 112766303B
Authority
CN
China
Prior art keywords
data
model
value
class
convolution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011535827.4A
Other languages
English (en)
Other versions
CN112766303A (zh
Inventor
全哲
高晋峰
肖桐
郭燕
李磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan University
Original Assignee
Hunan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan University filed Critical Hunan University
Priority to CN202011535827.4A priority Critical patent/CN112766303B/zh
Publication of CN112766303A publication Critical patent/CN112766303A/zh
Application granted granted Critical
Publication of CN112766303B publication Critical patent/CN112766303B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/10Pre-processing; Data cleansing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T90/00Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于CNN的航空发动机故障诊断方法,本防使用的数据集为航空发动机传感器收集到的气路参数,其中包含发生各种故障时的气路参数以及正常情况下的气路参数,并且是按照时间序列采集的数据,使用了卷积神经网络可以充分的挖掘气路参数之间前后变化的特征,相比于传统方法对离散数据进行建模(针对具体某个时刻的数据进行分析)来说,不仅考虑到了不同时刻气路参数具体数值的变化,进一步考虑了连续时刻参数变化的趋势特征和前后的联系,由于使用了CNN具有一定的平移不变性,所以泛化能力更好,可以取得更加全面更加高级更加复杂的特征,紧接着提出了一种新型的损失函数,用于评价模型的分类结果,从而实现故障的诊断。

Description

一种基于CNN的航空发动机故障诊断方法
技术领域
本发明属于发动机领域,尤其是涉及一种基于CNN的航空发动机故障诊断 方法。
背景技术
航空发动机是飞机最为核心的部件之一,是一个复杂度很高的***,其健康 状况是保证飞机飞行安全的重要前提。相关资料显示,在最近十年的飞行事故中, 50%以上是由于航空发动机发生故障所引起的,此外,航空发动机的维修支出在 全球飞机维修产业中占据的比例高达40%,因此,保障发动机可靠稳定地工作, 对航空公司以及制造商降低维修费用,缩短维修周期和发动机停机时间,提高发 动机运行效率都具有十分重大的意义。而航空发动机的故障检测技术是其中非常 重要的核心技术之一。目前主流的智能故障检测算法主要是基于神经网络的方法 和支持向量回归机的方法,通过将航空发动机气路测量参数转换为标准状态下并 与对应的发动机性能基线(或基准值)进行求差值获得偏移量,通过偏移量及其 变化趋势来进行故障诊断和性能预测。另一方面,通过人工智能技术对有限的气路测量数据变化进行特征提取成为航空发动机故障诊断的一种新手段。
目前通常的做法主要分以下几种:
1.基于神经网络的基线建模方法。随着人工智能的快速发展,神经网络为解 决诸如发动机基线建模中存在的不确定输入和输出描述提供了可能,通过对厂家 监控***性能参数的分析,采用非线性回归分析方法构建航空发动机性能参数基 线库,采用基于过程神经网络(Process Neural Network,PNN)的发动机气路状 态参数预测方法。或者使用NeuroSolution6软件实现径向基函数(Radical Basis Function,RBF)神经网络算法,并建立EGT、FF和N2健康基线。利用遗传 算法优化的反向传播(Back Propagation,BP)神经网络建立航空发动机气路参 数(EGT、FF和N2)的基线模型。尽管神经网络具有强大的非线性拟合能力,但其自身也存在缺陷,当训练样本集较小时,容易出现发散的问题。
2.基于支持向量回归机(SupportVector Regression,SVR)的基线建模方法。 近年来,支持向量回归机被众多学者当作数据挖掘的方法进行研究,能够很好地 避免神经网络的缺陷。SVR算法在处理非线性回归问题时具有处理速度快、计算准确的优点,进行多参数和单参数的回归分析。但是基于SVR的算法还存在模 型参数和核函数选取较敏感等问题,对于多分类的问题效果一般。
3.基于深度置信网络的特征提取器以及故障分类方法,深度学习作为机器学 习的一个热点技术,以其优异的特征提取能力,已经成功应用于故障诊断领域, 利用深度学习强大的特征学习能力对发动机实时监控数据和历史数据进行特征 提取,利用分类器对特征进行分类,可以更好的完成发动机故障的分类及诊断,并且具有较强的泛化性和实用性。但是如果神经网络层数过深很容易出现过拟合 的问题,需要使用极大的数据集进行训练,如果使用传统的浅层网络则很容易出 现局部最小值以及过学习问题,影响***的泛化性。
综上所述,其实各个方法都有一定的局限性,最接近本发明的方法其实上述 第三种方案,但是由于使用传统的神经网络很容易出现难以训练、泛化能力差等 问题,所以本发明依据航空发动机的时间序列的气路监控数据,使用一维的卷积 神经网络进行特征提取,综合多个监控参数的变化趋势,可以得到更好的多分类 的故障特征。使用浅层的一维卷积神经网络提取特征,同时使用SVM、softmax 分类器对提取的特征进行融合学习,可以在避免了深层神经网络的高额计算代价的情况下得到泛化效果更好,准确率更高的故障检测技术。
名词解释:
one hot:是一种编码方式,one hot编码是多分类中常用的标签编码方式, 又称为一位有效编码,采用一个N维向量表示N个状态,在多分类中N表示类 别的总数,当类别标签为i的时候,在这个N维向量中除了第i个索引的位置为 1外,其他位置均为0值。
Relu激活函数:Rectified linear Unit,修正线性单元,形式如下
是一种非线性的激活函数,使一部分神经元的输出为0,这样就造成了网络 的稀疏性,并且减少了参数的相互依存关系,缓解了过拟合问题的发生。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于CNN 的航空发动机故障诊断方法。本发明首先使用一维卷积神经网络对基于时间序列 的航空发动机气路参数进行智能的特征提取,取代了传统的人工特征的设计,而 且具有更好的泛化性、稳定性,并且由于是浅层的卷积神经网络计算代价很低。 对卷积之后的结果进行池化操作进一步提取特征从而得到固定规模的特征大小 使得该技术可以应用于不同长度的序列数据,具有很好的灵活性。最后通过分类器结合反向传播算法对序列特征进行分类,从而对故障的模式进行准确的诊断。
本发明的目的可以通过以下技术方案来实现:
一种基于CNN的航空发动机故障诊断方法,包括以下步骤:
步骤一、收集航空发动机发生故障时的运行数据,对故障类别进行分类并打 标签构建数据集,将数据集进行切分形成训练集和测试集;
步骤二、对训练集的数据进行预处理,完成数据清洗,采用min-max归一化 对数据进行去量纲;
步骤三、构建多分类模型,多分类模型包含浅层的卷积层以及池化层,以及 分类器的融合;
步骤四、将采样的气路参数作为输入,经过卷积,池化后和输出层之后,将 输出值输送给分类器,优化交叉熵损失函数,然后继续训练;
步骤五、经过多次迭代计算至预设次数,即得到训练后的模型;
步骤六、将测试集进行同样的数据预处理,进行测试;
步骤七、将发动机的运行数据实时输入训练后的模型得到发动机出现故障时 的诊断结果。
进一步的改进,所述步骤一中,将数据集中包含有空值或者异常值的数据进 去去除,剔除干扰数据;然后对数据的切分保证训练集、测试集的分布一致;其 中80%的数据作为训练集和20%的数据作为测试集。
进一步的改进,所述步骤二包括如下步骤:
2.1对发动机参数进行统计,整理出各发动机参数的实用数据,得到统计结 果;素数实用数据包括实际范围区间和出现频率;发动机参数包括扭矩、涡轮间 温度、低压涡轮压气机转速、高压涡轮压气机转速、螺旋桨转速、高压压气机出 口压力、燃油流量、起飞高度、飞行速度马赫数和飞行高度;
2.2根据统计结果利用箱线图原理,统计出离群点或脏数据;
2.3剔除离群点或脏数据,得到数据集;
2.4对数据集中的数据进行归一化处理;
2.5对数据进行离差标准化处理,将原始的数据进行线性的变换,使得结果 映射到[0,1]之间,转换函数如下所示:
其中x*表示归一化之后的数据,x表示归一化之前的数据,max为样本数据 的最大值,min为样本数据的最小值;
2.6将归一化之后的数据集进一步进行整理,形成发动机参数矩阵:
其中,故障label表示故障类型,X0 m表示0时刻时第m个变量的状态值, n表示第n个时刻。
进一步的改进,所述步骤三中,构建多分类模型包括如下步骤:
3.1首先在发动机气路参数矩阵中采样连续的n个时刻的数据作为模型的输 入。
3.2模型输出y的真实值使用one hot编码,y表示输入矩阵对应的故障label, y的真实值维度和实际的标签保持一致,其中每一个元素分别对应一个故障类别 可能的概率,并且所有概率之和为1;
3.3模型使用一维卷积神经网络进行特征提取,一维卷积具有两个基本特征: 一是数据为一维的矩阵;二是每一行按照时间序列排列,具有前后关联关系;一 维卷积的计算公式如下所示:
其中u为序列长度为s的一维数据,u作为模型的输入;一维数据中每个元 素是一个固定大小的向量;f(i,j)表示一维卷积核中行索引为i,列索引为j表示 卷积核参数;i表示一维卷积核的行索引,j表示一维卷积核的列索引,u(i,j) 表示输入参数u中行索引为i,列索引为j表示的元素,b表示偏置参数, Conv1D(u)表示输入参数u经过一维卷积运算之后的输出;σ表示Relu激活函 数,用于增加神经网络的非线性拟合能力并克服梯度消失的问题,加快训练的速 度;
3.4 SVM分类器的公式如下所示:
其中Li表示第i个输入矩阵经过模型计算之后得到的损失函数值,
yi表示实际上正确的标签,sj表示模型实际的输出的类别j的概率值;表示模型实际预测输出的类别为yi的概率值;Δ表示一个阈值,如果/>等于或高出阈值,则判断为正确类别和所比对类别的区分很好,给一个0损失值; 若小于阈值,说明模型对正确类别和所比对类别的类别区分很糟糕,把类别分值 之差加上阈值Δ作为损失;
3.5 Softmax分类器:
首先softmax分类器会通过上式的归一化函数将模型实际输出归一化,保证每一个都是正,且各个类别之和为1;归一化之后如果某个类别值越大越接近于1,则说明模型判断最可能的类别为对应类别,相反如果模型判断正确类别概率值越 接近于0,则模型越糟糕,根据这个特性,通过正确类别的-log值来作为损失值, 正确类别概率越小,损失越大,如下式所示:
其中,P(s)表示模型实际预测的向量经过softmax归一化之后的概率,s表示模 型实际输出向量,k表示第k个故障类别,es表示对某个类别的预测概率值进行 指数运算,M表示类别的数量,表示0或者1,若样本i的实际类别与c一致 则为1,否则为0,/>表示模型实际预测样本i的类别为c的概率;N表示样本 个数;
3.6组合损失函数
其中i表示第i个样本,N表示样本总数,α表示Lsvm损失函数所占的因子。
进一步的改进,所述步骤四包括如下步骤:
4.1一维卷积过程:
4.1.1遍历输入特征中与卷积核尺寸一致的滑动窗口;
4.1.3将卷积核与上一步中对应的特征矩阵窗口进行点乘运算;
4.1.4遍历整个特征矩阵计算出点乘的结果进行求和;
4.1.5将求和之后的结果送入Relu激活函数,增加模型的非线性特征的拟合能力;
4.1.6求和之后将原来的特征矩阵降维并且提取为与前后时间序列相关的高级特征;
4.1.7返回已经提取的高级特征;
4.2池化过程:
在卷积层之后会添加一个池化层,减少数据的复杂程度,同时防止模型的过拟合,根据最后需要选择最大值池化或者说平均值池化;
4.2.1全局最大池化是按照特征值的尺寸,在特征值中选取最大的特征值作为最大 池化的输出;
4.2.2全局平均池化指按照特征值的尺寸,选择特征中的平均值组为最后平均池化 层的输出;
4.3分类器:连接所有的提取到的特征,将输出值送给分类器
4.3.1将网络的输出值转换成一个向量;
4.3.2采用全局平均池化技术络代替全连接层;或使用全连接层技术,并配合使用dropout层;
4.4 dropout层:
Dropout层是在训练过程中随机的丢弃一部分输入,此时丢失部分的输入对应 的参数不会更新,以解决过拟合的问题,减少神经元之间复杂的共适问题;
4.4.1首先随机删掉网络中一半的隐藏神经元,输入输出神经元保持不变;
4.4.2然后把输入x通过修改后的网络前向传播,然后把得到的损失结果通过 修改的网络反向传播;部分训练样本执行完上述过程后,在没有被删除的神经元 上按照随机梯度下降法更新对应的参数;
4.4.3重复步骤4.4.1和步骤4.4.2。
进一步的改进,所述步骤五包括如下步骤:
5.1实验得到超参数batch size即批量大小的范围;
5.2在卷积的过程中使用不同尺寸的卷积核相结合方式;
5.3在预设的范围内根据预设的规则对卷积核个数甚至尺寸大小进行网格搜 索或者网络模型的超参数搜索。
因为每个时刻发动机参数的状态m是固定的,因此卷积核尺寸可以选择(3, m)、(5,m)、(7,m)、(9,m)等不同的组合方式,卷积核的个数可以使用64, 128,256等不同组合。针对不同的组合进行模型的训练,从而选取最优的组合方 式。设置训练的epoch为400,在每个epoch训练的过程中固定batchsize的大小, 以及卷积核的组合,在每一个batch的训练中使用梯度下降算法进行反向传播调 节模型的参数,反复迭代运行完成模型训练。从而得到最优的参数完成参数搜索。
与现有技术相比,采用本发明有一下的优势和特点:
1.第一步和第二步对数据进行更合理的预处理,利用统计学的方法统计出航空发动机的气路参数的有效范围区间,使用箱线图分析离群点进去异常值剔除同时对 噪声进行剔除,使得数据更加的合理;同时对数据进行min-max归一化处理,去掉不同变量之间的量纲,归一化之后的数据可以加快模型的训练速度,加快模型 的收敛。
2.第三步构建更为合理的模型架构,使用卷积神经网络进行气路参数特征的 提取可以提取到更多传统人工办法无法提取的特征,避免了人工选取特征的大量 工作量,实现了特征的自动化提取完全依赖与模型的提取能力,采用池化层对提 取的特征进行进一步的甄选,是模型更加简单、轻量级。同时使用了dropout层 进一步提高模型的泛化能力,同时也可以很大程度的减少模型
附图说明
图1为本发明的处理流程图;
图2为特征提取结构图。
具体实施方式
下面结合附图和具体实施方案对本发明进行详细说明。
本发明首先使用一维卷积神经网络对基于时间序列的航空发动机气路参数 进行智能的特征提取,取代了传统的人工特征的设计,而且具有更好的泛化性、 稳定性,并且由于是浅层的卷积神经网络计算代价很低。对卷积之后的结果进行 池化操作进一步提取特征从而得到固定规模的特征大小使得该技术可以应用于不同长度的序列数据,具有很好的灵活性。最后通过分类器结合反向传播算法对 序列特征进行分类,从而对故障的模式进行准确的诊断。本发明的具体技术方案 为:
第一步、构建数据集:
1.1将数据集进行切分,打乱,包括80%的训练集和20%的测试集,测试集 用来检验模型效果。
1.2将数据集按照航空发动机的故障类别进行分类并打标签,对于一些包含 有空值或者其他异常值的数据进去去除,剔除干扰数据可以显著提高准确度。
1.3对数据的切分保证训练集、测试集的分布一致。
第二步、对训练集的数据进行预处理,完成数据清洗,采用min-max归一化 对数据进行去量纲
2.1对扭矩、涡轮间温度、低压涡轮压气机转速、高压涡轮压气机转速、螺 旋桨转速、高压压气机出口压力、燃油流量、起飞高度、飞行速度马赫数、飞行 高度等参数进行统计,整理出各参数的实际范围区间、出现频率等实用数据;
2.2根据统计结果利用箱线图原理,统计出离群点或脏数据;
2.3剔除不符合要求的部分数据。
2.4因为不同评价指标(参数)往往具有不同的量纲和量纲单位,这样的情 况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准 化处理。
2.5对数据进行离差标准化,将原始的数据进行线性的变换,是结果映射到[0, 1]之间,转换函数如下图2所示:
图2.min-max标准化(Min-Max Normalization)
其中max为样本数据的最大值,min为样本数据的最小值,也可以根据经验 值设置一个合理的值。
2.6将归一化之后的数据集进一步进行整理,使得其如下式所示:
矩阵中第一行X0 0到X0 m表示0时刻m个变量的状态值,从第0行至第n行 分别为时刻0到时刻n的基于时间序列的变量状态。整个矩阵对应的label就是 某种类型的故障作为标签。
第三步、构建分类模型(多分类),包含特征提取器和分类器两部分:
3.1输入一个上式中所示的矩阵作为变量,以及一个one hot编码形式的类别 标签作为监督信号;
3.2对于模型输出y的真实值使用one hot编码,其中维度应该和实际的标签 保持一致,其中每一个元素分别对应一个故障类别可能的概率,并且其所有概率 之和为1;
3.3模型使用一维卷积神经网络,一维卷积具有两个基本特征:一是数据为 一维的矩阵,其中看起来是2维,其实每一行是一个整体;二是图中的每一行是 按照时间序列排列的具有一定的前后关联关系;下图为一维卷积的计算公式,其中u为输入中一定长度序列维度的数据:
u:序列长度为s的一维数据,其中每个元素也是一个固定大小的向量;
f(i,j):一维卷积核参数;
σ:Relu激活函数,增加神经网络的非线性拟合能力,达到更好的拟合效果,同 时可以克服梯度消失的问题,加快训练的速度。
此公式将按照固定的卷积步长按照卷积核参数和对应的状态参数矩阵以点 乘的形式计算,得到一个对应的卷积特征,同时可以将原本的维度进行压缩。严 格按照步长将卷积核以类似滑动窗口的形式移动直到状态矩阵遍历完毕,即可得 到该输入矩阵的特征参数,即一种特征集合。
3.4SVM分类器:公式如下所示
其中Li表示第i个输入矩阵经过模型计算之后得到的损失函数值,
yi表示实际上正确的标签,sj表示模型实际的输出的类别j的分数。
Δ表示一个阈值如果如果高出阈值,我们认为正确类别和某个类别的区分很好,我们给一个0损失给这两个类别的区分,相反说明模型对这两类类别区分很糟糕, 我们把类别分值之差加上阈值作为损失。
3.5Softmax分类器:
首先softmax分类器会通过上式中的归一化函数将模型实际输出(可能有正有负)归一化,保证每一个都是正,且各个类别之和为1。归一化之后如果某个类别值 越大越接近于1,则说明模型判断最可能的类别为该类别,相反如果模型判断正 确类别概率值越接近于0,则模型越糟糕,根据这个特性,可以通过正确类别的-log值来作为损失(正确类别概率越小,损失越大),公式如下所示:
第四步、将采样的气路参数作为输入,经过卷积,池化操作后,将输出值输 送给分类器,优化损失函数,继续训练。具体过程如图2所示:
4.1一维卷积过程:
4.1.1遍历输入特征中与卷积核尺寸一致的滑动窗口;
4.1.3将卷积核与上一步中对应的特征矩阵窗口进行点乘运算;
4.1.4遍历整个特征矩阵计算出点乘的结果进行求和;
4.1.5将求和之后的结果送入Relu激活函数,增加模型的非线性特征的拟合能力;
4.1.6求和之后会将原来的特征矩阵降维并且提取为更高级的与前后时间序列相关的特征;
4.1.7返回已经提取的高级特征。
4.2池化过程:
通常在卷积层之后会添加一个池化层,可以减少数据的复杂程度,同时防止模型的 过拟合,可以根据最后需要选择最大值池化或者说平均值池化
4.2.1最大池化是按照池化核的尺寸,在相邻的几个特征值中选择最大的特征值作 为最大池化的输出;
4.2.2平均池化是指不是去特征值的最大值,而是选择特征中的平均值组为最后平 均池化层的输出。
4.3分类器:
连接所有的提取到的特征,将输出值送给分类器
4.3.1将网络的输出值转换成一个向量。
4.3.2可以采用全局平均池化技术络代替全连接层
4.3.3如果使用全连接层技术,因为全连接是尺度敏感的,所以需要配合使用dropout层
4.4 dropout层:
Dropout层是在训练过程中随机的丢弃一部分输入,此时丢失部分的输入对应的参数不会更新,可以很大程度上解决过拟合的问题,减少神经元之间复杂的共适问 题。
4.4.1首先随机(临时按照一定的概率)删掉网络中一半的隐藏神经元,输入输 出神经元保持不变。
4.4.2然后把输入x通过修改后的网络前向传播,然后把得到的损失结果通过修改的网络反向传播。一小批训练样本执行完这个过程后,在没有被删除的神经元 上按照随机梯度下降法更新对应的参数。
4.4.3不断重复这一过程。
第五步、经过多次迭代计算,得到训练后的模型:
5.1在进行随机梯度下降训练中有一个重要的超参数batch size(批量大小), 其大小对整个模型训练影响很大。更大的批尺寸会计算更精确的梯度估计,因为 每次参数更新所用到的数据越多,越能代表整体损失函数的梯度,因此梯度精确 度更高,但是可能是网络陷入局部的最小值。而且如果数据量太大,一次性加载 到GPU显存中的数据可能过多瓶颈,批尺寸太小则可能会导致模型不收敛,因 为需要在合理的范围内增加批大小。
5.2在卷积的过程中可以使用不同尺寸的卷积核相结合方式,因为卷积核尺 寸越大,对应就会有越大的感受野,可以学习到的特征越多学习能力越强,但也 是增加模型的参数量,增加模型的训练难度。相反如果卷积核尺寸太小则会导致 感受野太小,模型学习能力可能会受限,因为可以考虑使用不同尺寸卷积核相结合的方式,兼顾不同的感受野,增加模型的学习能力,也不会对模型造参数造成 很大幅度的增加。
5.3一维卷积核个数也是一个重要的超参数,因为模型最后采用了全局的平 均值池化层,所以一个卷积核对应的就是一个高级的特征,如果卷积核数目太少 会导致最后提取到的特征个数过少,进而可能会导致模型的学习能力太差,如果 卷积核的参数过多则会导致模型变得过于复杂,训练时间过长等问题,因为选择合适的卷积核个数既能减少模型的复杂度,也能很好的挖掘到数据的特征,如果 硬件条件允许的话,可以考虑在一定范围内根据一定的规则对卷积核个数甚至尺 寸大小进行网格搜索或者网络模型的超参数搜索是更好的选择。
第六步、将开测试集通过同样的预处理,进行测试。
本发明使用的数据集为航空发动机传感器收集到的气路参数,其中包含发生 各种故障时的气路参数以及正常情况下的气路参数,并且是按照时间序列采集的 数据,本发明使用了卷积神经网络可以充分的挖掘气路参数之间前后变化的特征, 相比于传统方法对离散数据进行建模(针对具体某个时刻的数据进行分析)来说, 不仅考虑到了不同时刻气路参数具体数值的变化,进一步考虑了连续时刻参数变 化的趋势特征和前后的联系,由于使用了CNN具有一定的平移不变性,所以泛 化能力更好,可以取得更加全面更加高级更加复杂的特征,紧接着本发明提出了 一种新型的损失函数,用于评价模型的分类结果,从而实现故障的诊断。

Claims (3)

1.一种基于CNN的航空发动机故障诊断方法,其特征在于,包括以下步骤:
步骤一、收集航空发动机发生故障时的运行数据,对故障类别进行分类并打标签构建数据集,将数据集进行切分形成训练集和测试集;
步骤二、对训练集的数据进行预处理,完成数据清洗,采用min-max归一化对数据进行去量纲;
步骤三、构建多分类模型,多分类模型包含浅层的卷积层以及池化层,以及分类器的融合;
步骤四、将采样的气路参数作为输入,经过卷积,池化后和输出层之后,将输出值输送给分类器,优化交叉熵损失函数,然后继续训练;
步骤五、经过多次迭代计算至预设次数,即得到训练后的模型;
步骤六、将测试集进行同样的数据预处理,进行测试;
步骤七、将发动机的运行数据实时输入训练后的模型得到发动机出现故障时的诊断结果;
所述步骤二包括如下步骤:
2.1对发动机参数进行统计,整理出各发动机参数的实用数据,得到统计结果;所述实用数据包括实际范围区间和出现频率;发动机参数包括扭矩、涡轮间温度、低压涡轮压气机转速、高压涡轮压气机转速、螺旋桨转速、高压压气机出口压力、燃油流量、起飞高度、飞行速度马赫数和飞行高度;
2.2根据统计结果利用箱线图原理,统计出离群点或脏数据;
2.3剔除离群点或脏数据,得到数据集;
2.4对数据集中的数据进行归一化处理;
2.5对数据进行离差标准化处理,将原始的数据进行线性的变换,使得结果映射到[0,1]之间,转换函数如下所示:
其中x*表示归一化之后的数据,x表示归一化之前的数据,max为样本数据的最大值,min为样本数据的最小值;
2.6将归一化之后的数据集进一步进行整理,形成发动机参数矩阵:
其中,故障label表示故障类型,表示0时刻时第m个变量的状态值,n表示第n个时 刻;
所述步骤三中,构建多分类模型包括如下步骤:
3.1首先在发动机参数矩阵中采样连续的n个时刻的数据作为模型的输入;
3.2模型输出y的真实值使用one hot编码,y表示输入矩阵对应的故障label,y的真实值维度和实际的标签保持一致,其中每一个元素分别对应一个故障类别可能的概率,并且所有概率之和为1;
3.3模型使用一维卷积神经网络进行特征提取,一维卷积具有两个基本特征:一是数据为一维的矩阵;二是每一行按照时间序列排列,具有前后关联关系;一维卷积的计算公式如下所示:
其中u为序列长度为s的一维数据,u作为模型的输入;一维数据中每个元素是一个固定大小的向量;f(i ,j)表示一维卷积核中行索引为i,列索引为j表示卷积核参数;i表示一维卷积核的行索引,j表示一维卷积核的列索引,u(i,j)表示输入参数u中行索引为i,列索引为j表示的元素,b表示偏置参数,Conv1D(u)表示输入参数u经过一维卷积运算之后的输出;σ表示Relu激活函数,用于增加神经网络的非线性拟合能力并克服梯度消失的问题,加快训练的速度;
3.4 SVM分类器的公式如下所示:
其中Lsvm表示第i个输入矩阵经过模型计算之后得到的损失函数值,
yi表示实际上正确的标签,sr表示模型实际的输出的故障类别r的概率值;Syi表示模型实际预测输出的类别为yi的概率值;Δ表示一个阈值,如果(Syi-Sr)等于或高出阈值,则判断为正确类别和所比对类别的区分很好,给一个0损失值;若小于阈值,说明模型对正确类别和所比对类别的类别区分很差,把类别分值之差加上阈值Δ作为损失;
3.5 Softmax分类器:
首先softmax分类器会通过上式的归一化函数将模型实际输出归一化,保证每一个都是正,且各个类别之和为1;归一化之后如果某个类别值越大越接近于1,则说明模型判断最可能的类别为对应类别,相反如果模型判断正确类别概率值越接近于0,则模型越差,根据这个特性,通过正确类别的-log值来作为损失值,正确类别概率越小,损失越大,如下式所示:
其中,P(s)表示模型实际预测的向量经过softmax归一化之后的概率,s表示模型实际输出向量,k表示第k个故障类别,es表示对某个类别的预测概率值进行指数运算,M表示类别的数量,yic表示0或者1,若样本i的实际类别与c一致则为1,否则为0,Pic表示模型实际预测样本i的类别为c的概率;N表示样本个数;
3.6组合损失函数
其中i表示第i个样本,N表示样本总数,α表示Lsvm损失函数所占的因子;
所述步骤四包括如下步骤:
4.1一维卷积过程:
4.1.1遍历输入特征中与卷积核尺寸一致的滑动窗口;
4.1.3将卷积核与上一步中对应的特征矩阵窗口进行点乘运算;
4.1.4遍历整个特征矩阵计算出点乘的结果进行求和;
4.1.5将求和之后的结果送入Relu激活函数,增加模型的非线性特征的拟合能力;
4.1.6求和之后将原来的特征矩阵降维并且提取为与前后时间序列相关的高级特征;
4.1.7返回已经提取的高级特征;
4.2池化过程:
在卷积层之后会添加一个池化层,减少数据的复杂程度,同时防止模型的过拟合,根据最后需要选择最大值池化或者说平均值池化;
4.2.1全局最大池化是按照特征值的尺寸,在特征值中选取最大的特征值作为最大池化的输出;
4.2.2全局平均池化指按照特征值的尺寸,选择特征中的平均值组为最后平均池化层的输出;
4.3分类器:连接所有的提取到的特征,将输出值送给分类器
4.3.1将网络的输出值转换成一个向量;
4.3.2采用全局平均池化技术络代替全连接层;或使用全连接层技术,并配合使用dropout层;
4.4 dropout层:
Dropout层是在训练过程中随机的丢弃一部分输入,此时丢失部分的输入对应的参数不会更新,以解决过拟合的问题,减少神经元之间复杂的共适问题;
4.4.1首先随机删掉网络中一半的隐藏神经元,输入输出神经元保持不变;
4.4.2然后把输入x通过修改后的网络前向传播,然后把得到的损失结果通过修改的网络反向传播;部分训练样本执行完上述过程后,在没有被删除的神经元上按照随机梯度下降法更新对应的参数;
4.4.3重复步骤4.4.1和步骤4.4.2。
2.根据权利要求1所述的一种基于CNN的航空发动机故障诊断方法,其特征在于,所述步骤一中,将数据集中包含有空值或者异常值的数据进去去除,剔除干扰数据;然后对数据的切分保证训练集、测试集的分布一致;其中80%的数据作为训练集和20%的数据作为测试集。
3.根据权利要求1所述的一种基于CNN的航空发动机故障诊断方法,其特征在于,所述步骤五包括如下步骤:
5.1实验得到超参数batch size即批量大小的范围;
5.2在卷积的过程中使用不同尺寸的卷积核相结合方式;
5.3在预设的范围内根据预设的规则对卷积核个数甚至尺寸大小进行网格搜索或者网络模型的超参数搜索。
CN202011535827.4A 2020-12-23 2020-12-23 一种基于cnn的航空发动机故障诊断方法 Active CN112766303B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011535827.4A CN112766303B (zh) 2020-12-23 2020-12-23 一种基于cnn的航空发动机故障诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011535827.4A CN112766303B (zh) 2020-12-23 2020-12-23 一种基于cnn的航空发动机故障诊断方法

Publications (2)

Publication Number Publication Date
CN112766303A CN112766303A (zh) 2021-05-07
CN112766303B true CN112766303B (zh) 2024-03-29

Family

ID=75695321

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011535827.4A Active CN112766303B (zh) 2020-12-23 2020-12-23 一种基于cnn的航空发动机故障诊断方法

Country Status (1)

Country Link
CN (1) CN112766303B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113536658B (zh) * 2021-05-21 2023-04-25 西北工业大学 基于stm32嵌入式处理器的机电设备轻量化故障诊断方法
CN113486868B (zh) * 2021-09-07 2022-02-11 中南大学 一种电机故障诊断方法及***
CN114781507B (zh) * 2022-04-18 2024-04-05 杭州电子科技大学 一种基于1dcnn-ds的冷水机组故障诊断方法
CN115204031B (zh) * 2022-05-13 2023-06-20 哈尔滨工业大学 航空发动机装配过程的振动值预测方法
CN115014445B (zh) 2022-08-10 2022-11-15 中国农业大学 一种智慧渔场多维全景感知监控方法、***与装置
CN115169505B (zh) * 2022-09-06 2022-12-02 杭州浅水数字技术有限公司 特种设备运动部件机械故障预警方法及其预警***
CN115542172A (zh) * 2022-12-01 2022-12-30 湖北工业大学 动力电池故障检测方法、***、装置及存储介质
CN116835540B (zh) * 2023-04-28 2024-05-21 福建省龙德新能源有限公司 一种五氟化磷的制备方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109001557A (zh) * 2018-06-11 2018-12-14 西北工业大学 一种基于随机卷积神经网络的飞机机电***故障识别方法
CN109115501A (zh) * 2018-07-12 2019-01-01 哈尔滨工业大学(威海) 一种基于cnn与svm的民航发动机气路故障诊断方法
CN110321603A (zh) * 2019-06-18 2019-10-11 大连理工大学 一种用于航空发动机气路故障诊断的深度计算模型
CN110555479A (zh) * 2019-09-05 2019-12-10 北京工业大学 基于1dcnn与gru融合的故障特征学习与分类方法
CN111222458A (zh) * 2020-01-06 2020-06-02 浙江工业大学 一种基于集合经验模态分解和卷积神经网络的滚动轴承故障诊断方法
CN111581763A (zh) * 2019-02-15 2020-08-25 中国航发商用航空发动机有限责任公司 航空发动机气路故障诊断结果评价方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109001557A (zh) * 2018-06-11 2018-12-14 西北工业大学 一种基于随机卷积神经网络的飞机机电***故障识别方法
CN109115501A (zh) * 2018-07-12 2019-01-01 哈尔滨工业大学(威海) 一种基于cnn与svm的民航发动机气路故障诊断方法
CN111581763A (zh) * 2019-02-15 2020-08-25 中国航发商用航空发动机有限责任公司 航空发动机气路故障诊断结果评价方法
CN110321603A (zh) * 2019-06-18 2019-10-11 大连理工大学 一种用于航空发动机气路故障诊断的深度计算模型
CN110555479A (zh) * 2019-09-05 2019-12-10 北京工业大学 基于1dcnn与gru融合的故障特征学习与分类方法
CN111222458A (zh) * 2020-01-06 2020-06-02 浙江工业大学 一种基于集合经验模态分解和卷积神经网络的滚动轴承故障诊断方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
steady-state process fault detection for liquid rocket engines based on convolutional auto-enconder and one-class support vector machine;Xiaobin Zhu et al;《IEEE》;20191223;3144-3158 *
基于1D-CNN的采煤机摇臂齿轮故障诊断;牛乃平 等;《煤矿机械》;第41卷(第11期);148-150 *
基于分段卷积神经网络的文本情感极性分析;韩开旭;黎永壹;邱桂华;钱威;;计算机仿真(第06期);366-369+383 *
基于双层长短时记忆网络的齿轮故障诊断方法;王维锋;邱雪欢;孙剑桥;张惠民;;装甲兵工程学院学报(第02期);86-90 *
基于深度特征挖掘的民航发动机故障诊断技术研究;付松;《中国博士学位论文全文数据库工程科技II辑》;20200215;C031-941 *

Also Published As

Publication number Publication date
CN112766303A (zh) 2021-05-07

Similar Documents

Publication Publication Date Title
CN112766303B (zh) 一种基于cnn的航空发动机故障诊断方法
CN114997051B (zh) 一种基于迁移学习的航空发动机寿命预测与健康评估方法
CN111368885B (zh) 一种航空发动机气路故障诊断方法
CN109141847B (zh) 一种基于mscnn深度学习的飞机***故障诊断方法
Ang et al. RSPOP: Rough set–based pseudo outer-product Fuzzy rule identification algorithm
CN109766583A (zh) 基于无标签、不均衡、初值不确定数据的航空发动机寿命预测方法
CN111340292B (zh) 一种基于聚类的集成神经网络pm2.5预测方法
CN114282579A (zh) 基于变分模态分解和残差网络的航空轴承故障诊断方法
CN112580263A (zh) 基于时空特征融合的涡扇发动机剩余使用寿命预测方法
CN114297910A (zh) 一种基于改进lstm的航空发动机寿命预测方法
CN114218872B (zh) 基于dbn-lstm半监督联合模型的剩余使用寿命预测方法
Shi et al. Health index synthetization and remaining useful life estimation for turbofan engines based on run-to-failure datasets
CN112381965A (zh) 一种基于数据挖掘的航空发动机健康状态识别***及方法
CN114462459A (zh) 一种基于1dcnn-lstm网络模型的液压机故障诊断方法
CN114354194A (zh) 基于全卷积自编码器和优化支持向量机的滚动轴承故障诊断方法
CN115375026A (zh) 一种多故障模式下的航空发动机寿命预测方法
Li et al. Remaining useful life prediction of aero-engine based on PCA-LSTM
CN117633688A (zh) 一种基于岭回归-k均值聚类-LOF-LSTM融合算法的大规模电力数据异常检测方法
CN115048873B (zh) 一种用于飞机发动机的剩余使用寿命预测***
CN113609480B (zh) 基于大规模网络流的多路学习入侵检测方法
CN115758187A (zh) 一种基于k-cnn--n-gru的煤矿机械电机状态预测方法
CN113158537B (zh) 基于lstm结合注意力机制的航空发动机气路故障诊断方法
CN113836787A (zh) 基于区分性特征学习的超声速进气道流动状态监测方法
CN115081514A (zh) 一种数据不平衡情况下的工业设备故障识别方法
Shu et al. A Novel Similarity-based Method for Remaining Useful Life Prediction under Multiple Fault Modes

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant