CN116448419A - 基于深度模型高维参数多目标高效寻优的零样本轴承故障诊断方法 - Google Patents
基于深度模型高维参数多目标高效寻优的零样本轴承故障诊断方法 Download PDFInfo
- Publication number
- CN116448419A CN116448419A CN202310237866.3A CN202310237866A CN116448419A CN 116448419 A CN116448419 A CN 116448419A CN 202310237866 A CN202310237866 A CN 202310237866A CN 116448419 A CN116448419 A CN 116448419A
- Authority
- CN
- China
- Prior art keywords
- sample
- model
- semantic
- visual
- index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 98
- 238000003745 diagnosis Methods 0.000 title claims abstract description 46
- 238000005457 optimization Methods 0.000 title claims abstract description 27
- 230000000007 visual effect Effects 0.000 claims abstract description 62
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 59
- 239000011159 matrix material Substances 0.000 claims abstract description 24
- 238000013507 mapping Methods 0.000 claims abstract description 21
- 230000002159 abnormal effect Effects 0.000 claims abstract description 20
- 238000000605 extraction Methods 0.000 claims abstract description 20
- 238000006243 chemical reaction Methods 0.000 claims abstract description 11
- 238000012549 training Methods 0.000 claims description 48
- 230000006870 function Effects 0.000 claims description 40
- 238000012360 testing method Methods 0.000 claims description 40
- 238000011156 evaluation Methods 0.000 claims description 37
- 230000008569 process Effects 0.000 claims description 30
- 239000013598 vector Substances 0.000 claims description 22
- 239000003795 chemical substances by application Substances 0.000 claims description 13
- 238000001228 spectrum Methods 0.000 claims description 12
- 238000009826 distribution Methods 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 10
- 230000007547 defect Effects 0.000 claims description 9
- 238000005259 measurement Methods 0.000 claims description 9
- 238000010276 construction Methods 0.000 claims description 8
- 238000013528 artificial neural network Methods 0.000 claims description 7
- 238000013527 convolutional neural network Methods 0.000 claims description 7
- 230000014509 gene expression Effects 0.000 claims description 6
- 238000007667 floating Methods 0.000 claims description 5
- 230000008859 change Effects 0.000 claims description 4
- 238000012512 characterization method Methods 0.000 claims description 4
- 230000005484 gravity Effects 0.000 claims description 4
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 claims description 3
- 230000000694 effects Effects 0.000 claims description 3
- 239000012014 frustrated Lewis pair Substances 0.000 claims description 3
- 235000019580 granularity Nutrition 0.000 claims description 3
- 230000007246 mechanism Effects 0.000 claims description 3
- 238000013508 migration Methods 0.000 claims description 3
- 230000005012 migration Effects 0.000 claims description 3
- 230000035945 sensitivity Effects 0.000 claims description 3
- 230000003595 spectral effect Effects 0.000 claims description 2
- 238000001514 detection method Methods 0.000 abstract description 5
- 238000011161 development Methods 0.000 abstract description 2
- 238000012423 maintenance Methods 0.000 abstract 1
- 238000005096 rolling process Methods 0.000 description 7
- 238000002474 experimental method Methods 0.000 description 6
- 238000005070 sampling Methods 0.000 description 5
- 230000001133 acceleration Effects 0.000 description 4
- 230000004913 activation Effects 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 238000011176 pooling Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 3
- 230000035772 mutation Effects 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 102100031102 C-C motif chemokine 4 Human genes 0.000 description 1
- 101100054773 Caenorhabditis elegans act-2 gene Proteins 0.000 description 1
- 101100000858 Caenorhabditis elegans act-3 gene Proteins 0.000 description 1
- 235000007627 Caesalpinia Nutrition 0.000 description 1
- 241000522234 Caesalpinia Species 0.000 description 1
- HEFNNWSXXWATRW-UHFFFAOYSA-N Ibuprofen Chemical compound CC(C)CC1=CC=C(C(C)C(O)=O)C=C1 HEFNNWSXXWATRW-UHFFFAOYSA-N 0.000 description 1
- 235000019687 Lamb Nutrition 0.000 description 1
- 238000000585 Mann–Whitney U test Methods 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 238000009760 electrical discharge machining Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012821 model calculation Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000010248 power generation Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01M—TESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
- G01M13/00—Testing of machine parts
- G01M13/04—Bearings
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于深度模型高维参数多目标高效寻优的零样本轴承故障诊断方法,涉及轴承故障智能诊断领域。方法包括如下步骤:高维空间域转换的视觉特征提取器构建;基于代理辅助多目标进化算法的视觉特征提取器组件寻优策略构建;序列信号统计特征辅助下的语义矩阵构建;异常值插补的视觉‑语义自编码零样本映射策略构建。本发明改善了现有旋转机器故障诊断中固有的检测判别特征提取不充分、模型重构检测性能均衡效率低、各类样本数量不平衡、异常类/零样本识别受限等技术性瓶颈问题等问题,保障设备运行得安全可靠,最大限度地减少备件成本、机械***停机时间和维护时间,为解决制约当前实际工程场景中轴承故障诊断发展的关键问题提供新方法。
Description
技术领域
本发明涉及轴承故障智能诊断领域,具体为一种基于深度模型高维参数多目标高效寻优的零样本轴承故障诊断方法。
背景技术
在现代化的发展中,从风力发电、航空航天组件、矿山机械等大型制造业到小型企业的自动化制造设备,都离不开旋转机械设备的运用。为了满足不断发展的工业生产和制造业的需求,机械设备被设计得愈加精密、复杂与智能。但是,由于受运行环境、制作工艺等因素的影响,机械设备的故障率也逐渐攀升。
传统的故障诊断方法在诊断过程中,通常采用基于模型或基于信号处理的故障诊断方法。然而随着现代机械设备日益大型化、复杂化,前者往往难以建立能可靠反应机械***工作特性的数值模型,后者因过于依赖人的技术经验,难以应对海量数据进行有效的故障特征提取。当前,数据驱动的智能故障诊断算法凭借强大的特征提取能力,逐渐代替了建立复杂的数值模型或繁琐的信号处理,成为国内外旋转机械故障诊断领域的研究热点。但是,现有数据驱动的智能故障诊断方法严重依赖于大量理想的标记数据,而实际工程场景下,尽管设备因长期运转积累了海量数据,却缺乏可用数据用以训练智能故障诊断模型,具体表现如下。
(1)故障类型无历史训练数据问题,即零样本条件下的故障诊断。相较于实验室流程操作产生的典型故障类型,实际工程场景中,滚动轴承因载荷大、冲击强等恶劣工况,极易产生复杂多样的故障类型,导致没有任何已标记或未标记的历史训练数据可用于训练智能故障诊断模型。在不进行停机检查的情况下,利用已有的状态监测数据,如何识别无历史记录的故障类型(即未见类故障)、提高未见类故障识别的准确性,是现阶段故障诊断领域的关键问题,且亟需解决。
(2)较主流的故障诊断模型结构普遍由人工设计方法进行选取,这在很大程度上依赖于设计者的经验知识,往往需要通过反复实验来确定最终的模型结构,很难权衡模型诊断速度和检测性能等多项指标,过程费时低效并且难以保证诊断模型泛化性。因此,如何在实现诊断模型性能自动均衡寻优的同时,给出拥有可信输出的最优模型组件结构尚需进行更加深入的研究。
发明内容
本发明为了进一步改善现有旋转机器故障诊断中固有的检测判别特征提取不充分、模型重构检测性能均衡效率低、各类样本数量不平衡、异常类/零样本识别受限等技术性瓶颈问题等问题,提出供一种基于深度模型高维参数多目标高效寻优的零样本轴承故障诊断方法。
本发明是通过如下技术方案来实现的:一种基于深度模型高维参数多目标高效寻优的零样本轴承故障诊断方法,包括如下步骤:
1)高维空间域转换的视觉特征提取器构建:
通常对轴承的故障诊断只是利用传感器采集到的振动信号进行分析,收集所得到的一维时域序列包含的故障特征信息不明显且特征之间相关性表达不充分。本发明围绕此类问题,利用卷积神经网络深度模型构建出高维空间域转换的视觉特征提取器,首先利用传感器来收集多种状态下的序列信号,并将采集得到的数据映射入高维格拉姆角和场域(Gramain Angular Summation Field,GASF)中,在高维空间中以全连接层方式进行特征拆解,发掘数据样本高维空间维度上特征的可行性,搭配以卷积神经网络实现对数据样本视觉特征的高效提取;GASF变化表达函数如式(1)所示,构造视觉特征提取器的总体框架,如表1所示;
式中为转换后的极坐标序列,I为单位行向量[1,1,…,1];具体转换过程即将时间序列在极坐标***内进行编码,展现样本的不同信息粒度;在格拉姆矩阵中的每个元素是角度的三角函数值,利用三角函数的和运算则构建出格拉姆角和场域;
表1视觉特征提取器的总体框架
2)基于代理辅助多目标进化算法的视觉特征提取器组件寻优策略构建:
本发明搭建出高维空间域转换的视觉特征提取器仅为大致框架,除最后一层全连接视觉特征提取层节点数确定以外,所涉及的内部诸多结构组件以及参数/超参数如何设定未知,仅利用人工经验方式对其操作将存在主观因素不合理且重新设计成本高的问题。因此,本发明构建出一种基于约束型Dropout神经网络的代理辅助进化算法(ConstrainedDropout Neural Network based Surrogate-assisted Evolution Algorithm,CDNNEA)作为视觉特征提取器组件寻优策略,利用该寻优策略对进行视觉特征提取的深度模型内部组件进行自适应搜索,优化目标扩展为识别准确度、模型复杂度、训练时间三项维度,同时为了降低单目标寻优过程中模型训练和评估过程中的时间成本和硬件成本,构建扩展性强的代理模型对搜索策略进行辅助,具体实现如下:
CDNNEA算法总体框架如图3所示,输入为:最大评价次数MaxFE,评价次数FE,种群大小P,决策变量维度d,代价函数f,真实评价解的数量σ,评判比率ρ,输出为真实问题的非支配解集(X,Y),具体包括如下步骤:
①生成初始解部分:X=LatinHypercubeSample(11d-1),Y=f(X);
②FE=11d-1;
③开始算法迭代:WHILE FE≤MaxFE DO;
④利用训练数据集训练代理模型:C-dropout=TrainingData(X,Y);
⑤对种群中的非支配解集进行优化搜索:(X1,Y1,ρ1,ρ2)=Estimate(P,C-dropout);
⑥根据管理准则选择σ个先前所得非支配解进行真实评估:
X2=Selection(X1,Y1,ρ1,ρ2,C-dropout,σ),Y2=f(X2);
⑦X'=X∪X2,Y'=Y∪Y2;
⑧对训练数据集进行更新:(X,Y)=Update(X',Y',11d-1,σ);
⑨FE=FE+1,ρ1=ρ2;
⑩END WHILE;
其中,步骤①为生成初始解部分,用来采样经过真实计算后的部分初始样本,并基于此生成初始训练数据集。步骤③到步骤⑩为算法的主要迭代过程,步骤④主要利用训练数据集训练代理模型;步骤⑤则对种群中的非支配解集进行优化搜索,期间所涉及到的目标评估无需进行代价昂贵的真实计算,仅依赖计算低廉的代理模型便可实现;最后,由于最初所建代理模型优化导向不一定正确,若无任何更新策略的操作,非支配解的质量以及模型估值准确度将难以保证。故步骤⑥根据管理准则选择σ个先前所得非支配解进行真实评估,步骤⑧对训练数据集进行更新。
步骤①即在优化开始前,CDNNEA使用拉丁超立方体采样方式在决策空间中生成11d-1大小的均匀采样点,其中d为决策变量维度,并对其使用待优化的目标函数进行真实计算,所获得的决策变量以及相应目标解将被作为数据集训练代理模型。采样次数设置为11d-1的适宜性可参考文献。
3)序列信号统计特征辅助下的语义矩阵构建:
对监督分类由于标签信息通常使用的是独热码,导致监督分类的标签之间往往没有关联性,从而使得监督分类无法对未见类进行分类,但已见类和未见类的辅助信息之间是有关联性的,这种辅助信息主要来自于人为定义的语义描述信息、用自然语言处理技术得到的词向量信息或两者的混合,通过这种间接的方式使得已见类和未见类之间产生关联性,让未见类能够被正确分类成为可能。
语义描述信息主要是人根据先前的知识对类别特征的总结,人为定义的语义描述信息有两种形式,一种是二值描述,另一个种是连续值描述。对于轴承故障类序列信号的语义描述信息的设计需要满足以下条件:
(1)具有语义性,即能够通过人的描述信息来获取;
(2)具有判别性,即不同故障类型的语义描述是不同的;
(3)具有一致性,即一旦属性个数确定,那么故障语义描述向量的维度是固定的,且向量相同位置代表相同的属性。
二值描述主要表示属性的有无问题,对于故障语义描述的属性可以是传感器的各种指标,如果异常,则该属性值为1,如果正常,则该属性的值为0。故障语义描述信息中每一个故障由一个向量表示,其中的每个属性值是0或者1,属性值组成的向量就是故障的语义描述信息。使用二值表示时,其语义描述向量的构建往往比较容易,但是其对属性的描述往往是不全面的,因为很多情况下故障状态下的属性不一定是始终确定的。
语义描述信息的连续值表示相比于二值表示往往能够更准确地描述故障,相比于二值描述,连续值描述往往比较困难,且其受个体主观性的影响要高于二值描述,因此通常需要由领域内的专家对该属性进行打分,分数越高,异常越严重,最后通过对多人进行取平均来获得其最终的属性连续值。但由于零样本学习在故障诊断领域研究较少,且在设计故障连续值语义描述时需要采用的语义描述信息难以表述,因此在故障诊断领域的序列信号语义矩阵构建方面有待进一步研究。
基于统计分析是一种遵循随机过程的理论统计规律,其主要运用概率统计的相关方法来进行事物随机过程的探索与发现。轴承故障智能诊断过程中,由于实验环境及轴承材料引起振动频率存在不确定性,进而采集到的信号中含有随机成分。所以这种信号用确切的数学表达式来描述是很困难的。然而,这种随机信号数据往往在经过丰富的实验后会展现出一种特定的统计规律。在轴承故障智能诊断中干扰信号往往也是随机的,受材料内部结构影响,振动加速度信号识别会出现声波偏转、声束畸变等情况,因此,符合缺陷信号本质且适量的特征量对缺陷识别有重要的影响,为了能找到同时满足体现故障信号本质且数量最优的语义向量,选择均方根值、方根幅值、绝对平均幅值、标准差、最大值、最小值、峰峰值、峭度、峰态、偏度、八阶矩系数、十六阶矩系数、波形指标、峰值指标、脉冲指标、裕度指标、峭度指标、偏态指标、均方频谱、频谱重心、频域方差、相关因子、谐波因子、谱原点矩,这24种时域或频域特征作为轴承故障的统计特征语义表征模型;具体如下:
均方根值:方根幅值/>绝对平均幅值/>
标准差最大值Xmax=max|xi|,最小值Xmin=min|xi|;
峰峰值Vpp=max|xi|-min|xi|,峭度峰态/>
偏度八阶矩系数/>十六阶矩系数/>
波形指标峰值指标/>脉冲指标/>裕度指标/>
峭度指标偏态指标/>
均方频谱频谱重心/>
频域方差相关因子/>
谐波因子谱原点矩/>
4)异常值插补的视觉-语义自编码零样本映射策略构建:
建立好视觉-语义映射,便可以计算任意未见类数据和未见类原型之间的相似度,并基于该相似度对未见类进行分类。本发明在映射层添加具体语义信息的限制,约束重建效果,实现有监督下的投影函数学习,以语义属性描述或词向量作为迁移知识,将隐藏层的信息设定为样本语义属性,利用自动编码器将视觉特征映射到语义空间中,并利用解码器重构原始的视觉特征,结构图如图3所示。具体步骤如下:
构建零样本学习模型的目标函数为:
式中,输入样本数据即为X∈Rd×N,d是样本的特征维度,N是样本总数;投影矩阵W∈Rk×d,k是样本属性的维度,样本属性S∈Rk×N;为了简化模型运算,令W*=WT,同时考虑解决约束WX=S困难,故将上式重写为:
其中||·||F是Frobenius范式,第一项是零样本特征学***衡这两项;对上式的优化先求导,再利用矩阵迹的性质化简,结果如下:
-2SXT+2SSTW+2λWXXT-2λXTS (10)
令式(10)等于0,可得:
SSTW+λWXXT=SXT+λSXT (11)
再令A=SST,B=λXXT,C=(1+λ)SXT,则上式最终可写成如下形式:
AW+WB=C (12)
公式(12)为一个西尔维斯特(Sylvester equation)方程,采用Bartels-Stewart算法求解,即可求得最优的视觉-语义映射矩阵W与WT;同时,为消除Sylvester equation求解过程中一些不完整的异常数据对映射矩阵W合理性的影响,本发明基于平均插值理论,设定映射矩阵W中若判断有异常值的出现,则对异常值进行按当前属性列的平均值插补替换,即对数据异常值由滑动平均窗口法进行数据插补,对该列的非异常值求和后求出平均值作为插补数据,将数据赋值给缺失值,最后将插补后新列赋值给原始列;经实验验证,平均插值的数据处理方法极大提高了视觉空间到语义空间的映射相似性,可有效的解决模型中视觉-语义空间映射过程数据异常问题。
最后,在未见类样本标签预测阶段,利用式(13)结合余弦相似性(CosineSimilarity),将推导出的未见类样本属性与未知类原型属性进行对比,从而预测得到未知类样本的标签:
式中是目标域中第i个样本的预测属性,/>是第j个未知类的原型属性,d(·)是余弦距离方程,f(·)是预测得到的样本标签。
进一步的,步骤2)的步骤④中,利用训练数据集训练代理模型,使用的一种约束型Dropout神经网络可扩展代理模型,以缩减不同子模型输出间分布的差异性为出发点,新增样本填充机制以及损失约束项来提升多目标问题求解过程中代理模型的可信度,对于批次大小为d的样本组成的训练集T={(Xi,Yi)}(i=1,2,...,d),d与决策变量大小一致,原始进行反向传播的目的即最小化式(2)所示的均方误差函数;在C-dropout过程中,每个批次的训练数据Xi都将被复制后堆叠为新样本再输入,其目的在于模拟相同数据的两次正向传播过程以获取模型预测结果的两个分布P1=P(Xi|Yi)与P2=P'(X'i|Y'i),同时凭借Dropout网络结构动态变化的特性,堆叠新样本的方式可对昂贵优化问题中稀缺的真实计算样本进行一定程度上的数据扩充;此时误差损失最小化的目标则变化为式(3),且对子模型差异性的缩减问题便转化为如何对输出后的分布P1与P2进行约束;结合斯皮尔曼相关系数对变量间相关程度的有效度量,将其应用于衡量两次输出的不一致性,即构造式(4)所示的约束项,并与l2联立成最终的训练损失函数如式(5)所示,以此降低原始网络空间中参数的自由度;求取误差后,模型将按照所设迭代次数,结合由梯度与链式法更新后的权值和偏差进行反向传播,最终完成训练阶段;
进一步的,步骤2)的步骤⑤中,对种群中的非支配解集进行优化搜索,使用具有良好高维多目标问题求解性能的PeEA算法进行代理模型的最优解集搜索,通过对高维空间中Pareto前沿曲率的敏感性以及解集之间相似度的评估,在Pareto前沿形状、连续性等特点未知的环境下,搜寻得到表现性能优越的解,以此组成候选解集提供若干需要真实评估的个体来引导代理模型更新;
PeEA在自身环境选择策略中首先利用成就尺度函数定位最能表征Pareto前沿曲率的关键点,计算点间距离的比值来近似获取前沿曲率;之后根据估计出的曲率值由构建的自适应尺度函数来选择合适的指标实现算法的最大化收敛;同时利用独特的相似度度量方式提升高维环境下存在异常值时解集的一致性;在PeEA中,对于m目标维度优化问题中的前沿面上点x=(x1,x2,…,xm),则有式(6)的Pareto前沿形状估计:
其中q为代表前沿曲率的正参数,对于0<q<1、q=1、q>1分别表示前沿属凹形、线性、凸形;在确定q值时,PeEA首先利用每个目标上最小值点与极值点实现目标标准化,以期提供与目标轴等距的超平面作为基平面。当预估前沿形状为凹形或线形时,则利用线性缩放形式衡量种群收敛性。当预估前沿形状为凸形时,则利用切比雪夫距离形式衡量种群收敛性。
步骤2)CDNNEA对视觉特征提取模型的应用中,测试时间即对测试集识别过程所需的总时间,计算量则以模型的每秒浮点运行次数(Floating Point Operations PerSecond,FLOPs)来衡量,测试误差以式(7)计算:
式中,t(i)代表真实标签,p(i)为预测标签,batch为批量大小。
本发明所提供的一种基于深度模型高维参数多目标高效寻优的零样本轴承故障诊断方法,与现有技术相比本发明具有以下有益效果:①目前主流的滚动轴承故障诊断模型多停留在需大量标注样本进行训练的阶段,在面对一些在实际工程测试中突现的复杂/未见类新故障时,将会束手无策。因此,本发明创新性的以少样本和零样本条件下的轴承故障诊断为研究对象,拟通过视觉与语义层面的嵌入空间来建立已标注故障类别与新增未见类故障之间的耦合关系,抽离已知以及未见类的语义向量用以搭建语义空间,学***均幅值、均方频谱、频谱重心和八阶矩系数等24种时域/频域特征作为轴承故障的统计特征语义表征模型。致力于发掘符合缺陷信号本质且适量的特征量;③零样本诊断方法中的视觉特征提取模型中结构、参数等组件的设计若均由人工手动调整,则实现最高性能的重构模型将是极为耗时乃至无法实现的,并且设计后模型中的结构和参数大概率将存在冗余。本发明为有效提高模型泛化以及重构性能,均衡诊断模型的效率与精度间的矛盾,构建出待优化模型架构组件的搜索空间,确定模型中待优化参数并将其作为决策变量,设置各变量内部中存在的约束条件和搜索范围,制定能够反映评估速度、故障样本评估准确性、模型计算复杂度等需求项的评价指标,根据具体实际工程需要,选择合适的帕累托最优解优化设置诊断模型的可信度组件,最终实现均衡兼顾重构模型快速性和准确性的要求,以更快的效率提取出更高质的样本视觉特征。
附图说明
图1为本发明步骤2)的CDNNEA应用流程图。
图2为本发明步骤2)的算法1CDNNEA总体框架流程图。
图3为本发明步骤4)的视觉-语义映射结构图。
图4为本发明具体实施例中,三种代理方式在DTLZ测试问题上获得的平均IGD值(最优结果以粗体标记)。
图5为本发明具体实施例中,三种代理方式在WFG测试问题上获得的平均IGD值(最优结果以粗体标记)。
图6为本发明具体实施例中,CDNNEA与六种对比算法在3-m DTLZ测试问题上获得的平均IGD值。
图7为本发明具体实施例中,CDNNEA与六种对比算法在40-d DTLZ测试问题上获得的平均IGD值。
图8为本发明具体实施例中,CWRU数据集划分描述表格。
图9为本发明具体实施例中,视觉特征提取模型优化前各参数预设范围表格。
图10为本发明具体实施例中,三组偏好解决方案附带的参数值表格。
图11为本发明具体实施例中,与四种对比算法应用于特征提取模型上的性能对比表格。
图12为本发明具体实施例中,零样本诊断模型未知类识别样本分布。
具体实施方式
以下结合具体实施例对本实施例作进一步说明。
一种基于深度模型高维参数多目标高效寻优的零样本轴承故障诊断方法,包括如下步骤:
1)高维空间域转换的视觉特征提取器构建:
利用卷积神经网络深度模型构建出高维空间域转换的视觉特征提取器,首先利用传感器来收集多种状态下的序列信号,并将采集得到的数据映射入高维格拉姆角和场域GASF中,在高维空间中以全连接层方式进行特征拆解,发掘数据样本高维空间维度上特征的可行性,搭配以卷积神经网络实现对数据样本视觉特征的高效提取;GASF变化表达函数如式(1)所示,构造视觉特征提取器的总体框架;
式中为转换后的极坐标序列,I为单位行向量[1,1,...,1];具体转换过程即将时间序列在极坐标***内进行编码,展现样本的不同信息粒度;在格拉姆矩阵中的每个元素是角度的三角函数值,利用三角函数的和运算则构建出格拉姆角和场域;
2)基于代理辅助多目标进化算法的视觉特征提取器组件寻优策略构建:
构建出一种基于约束型Dropout神经网络的代理辅助进化算法CDNNEA作为视觉特征提取器组件寻优策略,利用该寻优策略对进行视觉特征提取的深度模型内部组件进行自适应搜索,优化目标扩展为识别准确度、模型复杂度、训练时间三项维度,同时为了降低单目标寻优过程中模型训练和评估过程中的时间成本和硬件成本,构建扩展性强的代理模型对搜索策略进行辅助,具体实现如下:
CDNNEA算法总体框架,输入为:最大评价次数MaxFE,评价次数FE,种群大小P,决策变量维度d,代价函数f,真实评价解的数量σ,评判比率ρ,输出为真实问题的非支配解集(X,Y),具体包括如下步骤:
①生成初始解部分:X=LatinHypercubeSample(11d-1),Y=f(X);
②FE=11d-1;
③开始算法迭代:WHILE FE≤MaxFE DO;
④利用训练数据集训练代理模型:C-dropout=TrainingData(X,Y);
⑤对种群中的非支配解集进行优化搜索:(X1,Y1,ρ1,ρ2)=Estimate(P,C-dropout);
⑥根据管理准则选择σ个先前所得非支配解进行真实评估:
X2=Selection(X1,Y1,ρ1,ρ2,C-dropout,σ),Y2=f(X2);
⑦X'=X∪X2,Y'=Y∪Y2;
⑧对训练数据集进行更新:(X,Y)=Update(X',Y',11d-1,σ);
⑨FE=FE+1,ρ1=ρ2;
⑩END WHILE;
步骤④中,利用训练数据集训练代理模型,使用的一种约束型Dropout神经网络可扩展代理模型,以缩减不同子模型输出间分布的差异性为出发点,新增样本填充机制以及损失约束项来提升多目标问题求解过程中代理模型的可信度,对于批次大小为d的样本组成的训练集T={(Xi,Yi)}(i=1,2,...,d),d与决策变量大小一致,原始进行反向传播的目的即最小化式(2)所示的均方误差函数;在C-dropout过程中,每个批次的训练数据Xi都将被复制后堆叠为新样本再输入,其目的在于模拟相同数据的两次正向传播过程以获取模型预测结果的两个分布P1=P(Xi|Yi)与P2=P'(X'i|Y'i),同时凭借Dropout网络结构动态变化的特性,堆叠新样本的方式可对昂贵优化问题中稀缺的真实计算样本进行一定程度上的数据扩充;此时误差损失最小化的目标则变化为式(3),且对子模型差异性的缩减问题便转化为如何对输出后的分布P1与P2进行约束;结合斯皮尔曼相关系数对变量间相关程度的有效度量,将其应用于衡量两次输出的不一致性,即构造式(4)所示的约束项,并与l2联立成最终的训练损失函数如式(5)所示,以此降低原始网络空间中参数的自由度;求取误差后,模型将按照所设迭代次数,结合由梯度与链式法更新后的权值和偏差进行反向传播,最终完成训练阶段;
步骤⑤中,对种群中的非支配解集进行优化搜索,使用具有良好高维多目标问题求解性能的PeEA算法进行代理模型的最优解集搜索,通过对高维空间中Pareto前沿曲率的敏感性以及解集之间相似度的评估,在Pareto前沿形状、连续性等特点未知的环境下,搜寻得到表现性能优越的解,以此组成候选解集提供若干需要真实评估的个体来引导代理模型更新;
PeEA在自身环境选择策略中首先利用成就尺度函数定位最能表征Pareto前沿曲率的关键点,计算点间距离的比值来近似获取前沿曲率;之后根据估计出的曲率值由构建的自适应尺度函数来选择合适的指标实现算法的最大化收敛;同时利用独特的相似度度量方式提升高维环境下存在异常值时解集的一致性;在PeEA中,对于m目标维度优化问题中的前沿面上点x=(x1,x2,…,xm),则有式(6)的Pareto前沿形状估计:
其中q为代表前沿曲率的正参数,对于0<q<1、q=1、q>1分别表示前沿属凹形、线性、凸形;在确定q值时,PeEA首先利用每个目标上最小值点与极值点实现目标标准化,以期提供与目标轴等距的超平面作为基平面。当预估前沿形状为凹形或线形时,则利用线性缩放形式衡量种群收敛性;当预估前沿形状为凸形时,则利用切比雪夫距离形式衡量种群收敛性。
图1展示了CDNNEA对视觉特征提取模型的应用流程图。首先按比例划分好训练集与测试集并预设完成卷积神经网络模型。之后明确CDNNEA算法的决策变量维度即网络模型中待优化的参数。如:卷积核个数、卷积核尺寸、卷积层中激活函数、池化方式、全连接层节点个数、梯度下降函数、学习率、批次大小。其中,除激活函数、池化方式、学习率、梯度下降函数外的待定参数由于信息的整数规划问题,需要对其第一位小数进行取整操作。接着进入到CDNNEA算法优化流程,在每次迭代中,对网络参数进行优化,以寻得网络模型的测试时间、计算量、测试误差即三个目标的最小值。实例中,测试时间即对测试集识别过程所需的总时间,计算量则以模型的每秒浮点运行次数(Floating Point Operations Per Second,FLOPs)来衡量,测试误差以式(7)计算。
式中,t(i)代表真实标签,p(i)为预测标签,batch为批量大小。
3)序列信号统计特征辅助下的语义矩阵构建:
符合缺陷信号本质且适量的特征量对缺陷识别有重要的影响,为了能找到同时满足体现故障信号本质且数量最优的语义向量,选择均方根值、方根幅值、绝对平均幅值、标准差、最大值、最小值、峰峰值、峭度、峰态、偏度、八阶矩系数、十六阶矩系数、波形指标、峰值指标、脉冲指标、裕度指标、峭度指标、偏态指标、均方频谱、频谱重心、频域方差、相关因子、谐波因子、谱原点矩,这24种时域或频域特征作为轴承故障的统计特征语义表征模型;时域或频域特征如下:
均方根值:方根幅值/>绝对平均幅值/>标准差/>最大值Xmax=max|xi|,最小值Xmin=min|xi|;
峰峰值Vpp=max|xi|-min|xi|,峭度峰态/>偏度/>八阶矩系数/>十六阶矩系数/>波形指标/>峰值指标/>脉冲指标/>裕度指标/>峭度指标/>偏态指标均方频谱/>频谱重心/>频域方差相关因子/>谐波因子/>谱原点矩/>
4)异常值插补的视觉-语义自编码零样本映射策略构建:
在映射层添加具体语义信息的限制,约束重建效果,实现有监督下的投影函数学习,以语义属性描述或词向量作为迁移知识,将隐藏层的信息设定为样本语义属性,利用自动编码器将视觉特征映射到语义空间中,并利用解码器重构原始的视觉特征。构建零样本学习模型的目标函数为:
式中,输入样本数据即为X∈Rd×N,d是样本的特征维度,N是样本总数;投影矩阵W∈Rk×d,k是样本属性的维度,样本属性S∈Rk×N;为了简化模型运算,令W*=WT,同时考虑解决约束WX=S困难,故将上式重写为:
其中||·||F是Frobenius范式,第一项是零样本特征学***衡这两项;对上式的优化先求导,再利用矩阵迹的性质化简,结果如下:
-2SXT+2SSTW+2λWXXT-2λXTS (10)
令式(10)等于0,可得:
SSTW+λWXXT=SXT+λSXT (11)
再令A=SST,B=λXXT,C=(1+λ)SXT,则上式最终可写成如下形式:
AW+WB=C (12)
公式(12)为一个西尔维斯特方程,采用Bartels-Stewart算法求解,即可求得最优的视觉-语义映射矩阵W与WT;同时,基于平均插值理论,设定映射矩阵W中若判断有异常值的出现,则对异常值进行按当前属性列的平均值插补替换,即对数据异常值由滑动平均窗口法进行数据插补,对该列的非异常值求和后求出平均值作为插补数据,将数据赋值给缺失值,最后将插补后新列赋值给原始列;
最后,在未见类样本标签预测阶段,利用式(13)结合余弦相似性,将推导出的未见类样本属性与未知类原型属性进行对比,从而预测得到未知类样本的标签:
式中是目标域中第i个样本的预测属性,/>是第j个未知类的原型属性,d(·)是余弦距离方程,f(·)是预测得到的样本标签。
5)应用上述过程进行评价分析:
5.1)CDNNEA视觉特征提取器组件寻优策略性能验证:
①对比算法:
为对CDNNEA算法性能进行全面分析,本实施例首先将C-dropout、Dropout、Kriging三种不同的代理辅助模型分别与PeEA算法联立测试,对比证明出C-dropout作为可扩展代理模型的可行性。其次将CDNNEA与六种领域内先进算法进行了性能比较。本实施例的实验均在Intel Core i5-9400F CPU、Microsoft Windows 10操作***的计算机上由MATLAB R2020b软件设计实现,其中对比算法的结果在PlatEMO平台上运行得到。
②测试问题集:
实验选用DTLZ和WFG测试问题作为基准测试问题。对于每个测试问题,最大的决策变量和目标数分别设置为100和20。其中,在WFG测试集上,当目标维数m为3或5时,相关位置参数的个数γ设置为m-1,当m为10或20时,对应γ设置为2(m-1)。
③参数设置:
(1)独立运行次数:对于每个测试问题,每种算法独立运行20次。
(2)最大真实评估次数:除初始真实采样的11d-1个训练数据外,另外采用120次真实求解来测试比较算法的性能,因此最大真实评估次数设置为11d+119。
(4)C-dropout相关参数:两层神经元失活概率值p1与p2分别为0.2与0.5,学习率大小设为0.01,批次大小设置与决策变量个数一致,模型训练迭代次数Itrain设为1*104,测试迭代次数Itest设为100。
(5)PeEA算法参数:种群大小设置为50,对代理模型最大评估次数设置为20次。
(6)变异算子:采用多项式突变方式,设变异概率为1/d,分布指数为20。
(7)交叉算子:采用模拟二进制交叉方式,设交叉概率为1.0,分布指数为20。
④评价指标:
实验选用反向世代距离评价指标(Inverted Generational Distance,IGD)作为评价指标。
相关计算公式如式(14)所示。
式中,P为均匀分布在真实Pareto前沿上的目标向量集合,Q为经算法计算得到的目标向量集合。dist(v,Q)表示P中的一个目标向量v∈P到Q中最近向量的欧式距离。本实施例将|P|设置为10000,即在Pareto前沿上均匀采样10000个点作为IGD指标计算时的参考点。
同时,本实施例采用置信度水平为0.05的Wilcoxon秩和检验来对CDNNEA与其它对比算法的性能差异性进行统计检验,符号‘+’、‘-’以及‘=’分别表示CDNNEA算法性能相较于对比算法好、差以及没有明显差异。
⑤C-dropout代理模型的可行性:
图4和图5为以Kriging、Dropout、C-dropout三种代理方式辅助PeEA算法在DTLZ、WFG问题集上取得的IGD指标平均值。实验中,在目标数量m=3的前提下改变决策变量维度d(20、40、60、100)来检验C-dropout在高维决策空间中的可扩展性。从结果可发现,在64组测试实例中:CDNNEA在40组实例上优于其余两种方式;在10组实例上处于近似最优;在14组实例上,由于模型管理部分对解的多样性与收敛性均衡搭配问题,可能会错失部分真实评估较好的解,因此性能表现略差。总体上即以C-dropout作为代理模型综合性能表现较好,且相对于Kriging代理模型方式,CDNNEA在大部分测试问题上可获得较好或者相似的IGD值,进一步证明高维MOP中C-dropout的适用性,同时验证了本实施例将C-dropout作为代理模型方案的可行性。
⑥CDNNEA与先进算法的对比实验结果:
验证CDNNEA性能时所对比的算法包括两种未使用代理辅助的进化算法(ARMOEA、PeEA)以及四种具备代表性的代理辅助进化算法(EDN-ARMOEA、ParEGO、K-RVEA、MOEA/D-EGO)。性能比较主要针对决策空间维度以及目标数量对算法的影响,故在DTLZ测试集上分别开展了固定目标数量m=3并改变决策变量维度d(20、40、60、100)以及固定决策变量维度d=40并改变目标数量m(3、5、10、20)两组实验。其中,由于ParEGO算法的提出仅针对解决目标数量不超过4个的多目标问题,故仅将其在3个目标的问题上对比测试。七种算法最终取得的IGD平均值结果如图6、图7所示。可以发现,面对共46组测试问题,CDNNEA在23组上相比其余对比算法有最优的性能表现,在15组上性能表现近似最优,且相关情形均属测试问题中决策变量或目标数量较高维,表明CDNNEA相比其它算法在高维问题空间中具备较优的求解能力。
5.2)轴承故障数据集应用实例
为了评估本实施例中提出的基于深度模型高维参数多目标高效寻优的零样本轴承故障诊断方法的有效性和准确性,验证时以滚动轴承为对象,采用来自美国凯斯西储大学(CWRU)的轴承数据进行实验验证。
CWRU数据集由凯斯西储大学承载数据中心提供,被广泛用于滚动轴承故障诊断。试验台主要由2马力的电动机、轴承加速度计、扭矩传感器、功率测试仪组成。驱动端与风扇端测试轴承型号分别为6205-2rs JEM SKF与6203。通过电火花加工技术,分别在轴承的滚动体、内滚道和外滚道上布置了单点故障,故障损伤等级包括7mils,14mils和21mils。电动机驱动端与风扇端的轴承座上各放置一个加速度传感器来采集故障轴承的振动加速度信号,振动信号由16通道数据记录仪采集获得,采样频率为12kHz。
实例中,针对驱动端与风扇端轴承座上不同源的传感器,共研究驱动端滚动轴承的滚动元件、内滚道和外滚道上存在不同严重程度的10类故障。10类故障样本按照长度1024个时间点窗口大小,窗口移动步长为1000个时间点的方式生成样本集合,每类状态的样本个数为1200,共计12000个样本。实验数据的详细描述见图8。
①CDNNEA策略优化模型组件可靠性验证:
首先对于CWRU数据集按6:1比例划分好训练集与测试集并预设表1所示的视觉特征提取模型。之后明确CDNNEA算法的决策变量维度即网络模型中待优化的参数。对于CWRU数据集视觉特征提取模型共包含16个参数,即:三层卷积核个数(Channel_1、Channel_2、Channel_3),三层卷积核尺寸(C_s_1、C_s_2、C_s_3),卷积层中三个激活函数(Act_1、Act_2、Act_3),三层池化方式(pool_1、pool_2、pool_3),第一层全连接层节点个数(f_1),梯度下降函数(Op),学习率(L_rate),批次大小(Batch),对各参数的范围设置如图9所示。其中,除激活函数、池化方式、学习率、梯度下降函数外的待定参数由于信息的整数规划问题,需要对其第一位小数进行取整操作。图10为算法经过最后一次迭代后在视觉特征提取模型中搜索到的三种不同偏好类型解决方案各自附带的决策变量数值。从图中可以明显观察得到,A项解决方案网络测试时间最短,B项解决方案网络计算量最小,C项解决方案模型有着最低的测试误差。同时,将前文ARMOEA、PeEA、EDN-ARMOEA与K-RVEA四种种对比算法应用于视觉特征提取模型组件寻优过程中,性能对比如图11所示,在216次最大评估次数的设定下,CDNNEA算法在保证较低计算时间损耗的同时,搜索得到拥有较高的识别精度的网络架构。
②零样本轴承诊断方法性能验证
对于零样本方法有效性的验证,首先提取利用CDNNEA算法构建好的C项解决方案模型中倒数第二个全连接层的维度输出作为零样本学习模型中视觉特征X。语义特征S以构建好的基于统计特征语义属性关系矩阵为标准。通过训练可见评价结果类型数据的视觉特征XY,结合语义空间中的可见类型语义特征SY,求出映射矩阵W,测试集中未见类数据通过其视觉特征XZ由W反映射出语义向量并与原始未见类语义特征矩阵SZ比对由余弦相似度得出分类结果。验证过程中,CWRU数据集中可见类设定为Class Label中的1、2、3、4、5种标签,剩余5种标签设定为未知类。图12展示了基于上述设定下,由可见类训练的模型在不可见类上测试的评价指标识别准确率,CWRU数据集上对5种未见类样本分类精度达82.43%。分析可得,即使在训练过程中完全不使用未见类样本,在本实施例所建方法下,仍对此类样本有着高效的识别率。
本发明要求保护的范围不限于以上具体实施方式,而且对于本领域技术人员而言,本发明可以有多种变形和更改,凡在本发明的构思与原则之内所作的任何修改、改进和等同替换都应包含在本发明的保护范围之内。
Claims (6)
1.一种基于深度模型高维参数多目标高效寻优的零样本轴承故障诊断方法,其特征在于:包括如下步骤:
1)高维空间域转换的视觉特征提取器构建:
利用卷积神经网络深度模型构建出高维空间域转换的视觉特征提取器,首先利用传感器来收集多种状态下的序列信号,并将采集得到的数据映射入高维格拉姆角和场域GASF中,在高维空间中以全连接层方式进行特征拆解,发掘数据样本高维空间维度上特征的可行性,搭配以卷积神经网络实现对数据样本视觉特征的高效提取;GASF变化表达函数如式(1)所示,构造视觉特征提取器的总体框架;
式中为转换后的极坐标序列,I为单位行向量[1,1,…,1];具体转换过程即将时间序列在极坐标***内进行编码,展现样本的不同信息粒度;在格拉姆矩阵中的每个元素是角度的三角函数值,利用三角函数的和运算则构建出格拉姆角和场域;
2)基于代理辅助多目标进化算法的视觉特征提取器组件寻优策略构建:
构建出一种基于约束型Dropout神经网络的代理辅助进化算法CDNNEA作为视觉特征提取器组件寻优策略,利用该寻优策略对进行视觉特征提取的深度模型内部组件进行自适应搜索,优化目标扩展为识别准确度、模型复杂度、训练时间三项维度,同时为了降低单目标寻优过程中模型训练和评估过程中的时间成本和硬件成本,构建扩展性强的代理模型对搜索策略进行辅助,具体实现如下:
CDNNEA算法总体框架,输入为:最大评价次数MaxFE,评价次数FE,种群大小P,决策变量维度d,代价函数f,真实评价解的数量σ,评判比率ρ,输出为真实问题的非支配解集(X,Y),具体包括如下步骤:
①生成初始解部分:X=LatinHypercubeSample(11d-1),Y=f(X);
②FE=11d-1;
③开始算法迭代:WHILE FE≤MaxFE DO;
④利用训练数据集训练代理模型:C-dropout=TrainingData(X,Y);
⑤对种群中的非支配解集进行优化搜索:(X1,Y1,ρ1,ρ2)=Estimate(P,C-dropout);
⑥根据管理准则选择σ个先前所得非支配解进行真实评估:
X2=Selection(X1,Y1,ρ1,ρ2,C-dropout,σ),Y2=f(X2);
⑦X'=X∪X2,Y'=Y∪Y2;
⑧对训练数据集进行更新:(X,Y)=Update(X',Y',11d-1,σ);
⑨FE=FE+1,ρ1=ρ2;
⑩END WHILE;
3)序列信号统计特征辅助下的语义矩阵构建:
符合缺陷信号本质且适量的特征量对缺陷识别有重要的影响,为了能找到同时满足体现故障信号本质且数量最优的语义向量,选择均方根值、方根幅值、绝对平均幅值、标准差、最大值、最小值、峰峰值、峭度、峰态、偏度、八阶矩系数、十六阶矩系数、波形指标、峰值指标、脉冲指标、裕度指标、峭度指标、偏态指标、均方频谱、频谱重心、频域方差、相关因子、谐波因子、谱原点矩,这24种时域或频域特征作为轴承故障的统计特征语义表征模型;
4)异常值插补的视觉-语义自编码零样本映射策略构建:
在映射层添加具体语义信息的限制,约束重建效果,实现有监督下的投影函数学习,以语义属性描述或词向量作为迁移知识,将隐藏层的信息设定为样本语义属性,利用自动编码器将视觉特征映射到语义空间中,并利用解码器重构原始的视觉特征。
2.根据权利要求1所述的一种基于深度模型高维参数多目标高效寻优的零样本轴承故障诊断方法,其特征在于:步骤2)的步骤④中,利用训练数据集训练代理模型,使用的一种约束型Dropout神经网络可扩展代理模型,以缩减不同子模型输出间分布的差异性为出发点,新增样本填充机制以及损失约束项来提升多目标问题求解过程中代理模型的可信度,对于批次大小为d的样本组成的训练集T={(Xi,Yi)}(i=1,2,...,d),d与决策变量大小一致,原始进行反向传播的目的即最小化式(2)所示的均方误差函数;在C-dropout过程中,每个批次的训练数据Xi都将被复制后堆叠为新样本再输入,其目的在于模拟相同数据的两次正向传播过程以获取模型预测结果的两个分布P1=P(Xi|Yi)与P2=P'(X'i|Y'i),同时凭借Dropout网络结构动态变化的特性,堆叠新样本的方式可对昂贵优化问题中稀缺的真实计算样本进行一定程度上的数据扩充;此时误差损失最小化的目标则变化为式(3),且对子模型差异性的缩减问题便转化为如何对输出后的分布P1与P2进行约束;结合斯皮尔曼相关系数对变量间相关程度的有效度量,将其应用于衡量两次输出的不一致性,即构造式(4)所示的约束项,并与l2联立成最终的训练损失函数如式(5)所示,以此降低原始网络空间中参数的自由度;求取误差后,模型将按照所设迭代次数,结合由梯度与链式法更新后的权值和偏差进行反向传播,最终完成训练阶段;
3.根据权利要求2所述的一种基于深度模型高维参数多目标高效寻优的零样本轴承故障诊断方法,其特征在于:步骤2)的步骤⑤中,对种群中的非支配解集进行优化搜索,使用具有良好高维多目标问题求解性能的PeEA算法进行代理模型的最优解集搜索,通过对高维空间中Pareto前沿曲率的敏感性以及解集之间相似度的评估,在Pareto前沿形状、连续性等特点未知的环境下,搜寻得到表现性能优越的解,以此组成候选解集提供若干需要真实评估的个体来引导代理模型更新;
PeEA在自身环境选择策略中首先利用成就尺度函数定位最能表征Pareto前沿曲率的关键点,计算点间距离的比值来近似获取前沿曲率;之后根据估计出的曲率值由构建的自适应尺度函数来选择合适的指标实现算法的最大化收敛;同时利用独特的相似度度量方式提升高维环境下存在异常值时解集的一致性;在PeEA中,对于m目标维度优化问题中的前沿面上点x=(x1,x2,…,xm),则有式(6)的Pareto前沿形状估计:
其中q为代表前沿曲率的正参数,对于0<q<1、q=1、q>1分别表示前沿属凹形、线性、凸形;在确定q值时,PeEA首先利用每个目标上最小值点与极值点实现目标标准化,以期提供与目标轴等距的超平面作为基平面;当预估前沿形状为凹形或线形时,则利用线性缩放形式衡量种群收敛性;当预估前沿形状为凸形时,则利用切比雪夫距离形式衡量种群收敛性。
4.根据权利要求3所述的一种基于深度模型高维参数多目标高效寻优的零样本轴承故障诊断方法,其特征在于:步骤2)CDNNEA对视觉特征提取模型的应用中,测试时间即对测试集识别过程所需的总时间,计算量则以模型的每秒浮点运行次数FLOPs来衡量,测试误差以式(7)计算:
式中,t(i)代表真实标签,p(i)为预测标签,batch为批量大小。
5.根据权利要求1所述的一种基于深度模型高维参数多目标高效寻优的零样本轴承故障诊断方法,其特征在于:步骤3)中作为轴承故障的统计特征语义表征模型的时域或频域特征如下:
均方根值:方根幅值/>绝对平均幅值/>标准差最大值Xmax=max|xi|,最小值Xmin=min|xi|;
峰峰值Vpp=max|xi|-min|xi|,峭度峰态/>偏度/>八阶矩系数/>十六阶矩系数/>波形指标/>峰值指标/>脉冲指标/>裕度指标/>峭度指标/>偏态指标/>均方频谱/>频谱重心/>频域方差/>相关因子谐波因子/>谱原点矩/>
6.根据权利要求1所述的一种基于深度模型高维参数多目标高效寻优的零样本轴承故障诊断方法,其特征在于:步骤4)中,构建零样本学习模型的目标函数为:
式中,输入样本数据即为X∈Rd×N,d是样本的特征维度,N是样本总数;投影矩阵W∈Rk×d,k是样本属性的维度,样本属性S∈Rk×N;为了简化模型运算,令W*=WT,同时考虑解决约束WX=S困难,故将上式重写为:
其中||·||F是Frobenius范式,第一项是零样本特征学***衡这两项;对上式的优化先求导,再利用矩阵迹的性质化简,结果如下:
-2SXT+2SSTW+2λWXXT-2λXTS (10)
令式(10)等于0,可得:
SSTW+λWXXT=SXT+λSXT (11)
再令A=SST,B=λXXT,C=(1+λ)SXT,则上式最终可写成如下形式:
AW+WB=C (12)
公式(12)为一个西尔维斯特方程,采用Bartels-Stewart算法求解,即可求得最优的视觉-语义映射矩阵W与WT;同时,基于平均插值理论,设定映射矩阵W中若判断有异常值的出现,则对异常值进行按当前属性列的平均值插补替换,即对数据异常值由滑动平均窗口法进行数据插补,对该列的非异常值求和后求出平均值作为插补数据,将数据赋值给缺失值,最后将插补后新列赋值给原始列;
最后,在未见类样本标签预测阶段,利用式(13)结合余弦相似性,将推导出的未见类样本属性与未知类原型属性进行对比,从而预测得到未知类样本的标签:
式中是目标域中第i个样本的预测属性,/>是第j个未知类的原型属性,d(·)是余弦距离方程,f(·)是预测得到的样本标签。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310237866.3A CN116448419A (zh) | 2023-03-14 | 2023-03-14 | 基于深度模型高维参数多目标高效寻优的零样本轴承故障诊断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310237866.3A CN116448419A (zh) | 2023-03-14 | 2023-03-14 | 基于深度模型高维参数多目标高效寻优的零样本轴承故障诊断方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116448419A true CN116448419A (zh) | 2023-07-18 |
Family
ID=87131092
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310237866.3A Pending CN116448419A (zh) | 2023-03-14 | 2023-03-14 | 基于深度模型高维参数多目标高效寻优的零样本轴承故障诊断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116448419A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116680459A (zh) * | 2023-07-31 | 2023-09-01 | 长沙紫喇叭电子商务有限公司 | 基于ai技术的外贸内容数据处理*** |
CN116957365A (zh) * | 2023-09-20 | 2023-10-27 | 深圳市鸿效节能股份有限公司 | 水泵电机的维护效果评估方法及其*** |
CN116976531A (zh) * | 2023-09-25 | 2023-10-31 | 华夏天信智能物联股份有限公司 | 用于井下电控设备的集成管理方法及*** |
CN117146647A (zh) * | 2023-10-31 | 2023-12-01 | 南通蓬盛机械有限公司 | 一种光学瞄准镜的速调校准方法及*** |
CN117151229A (zh) * | 2023-11-01 | 2023-12-01 | 青岛聚远网络科技有限公司 | 一种基于云边端架构的云端推理方法及*** |
CN117172099A (zh) * | 2023-08-03 | 2023-12-05 | 西华大学 | 基于多目标脉冲神经膜***优化算法的电网故障诊断方法 |
CN117174899A (zh) * | 2023-11-01 | 2023-12-05 | 南通江海储能技术有限公司 | 一种氟化碳正极材料制备方法 |
CN117348605A (zh) * | 2023-12-05 | 2024-01-05 | 东莞栢能电子科技有限公司 | 应用于离型膜撕除机控制***的优化方法及*** |
-
2023
- 2023-03-14 CN CN202310237866.3A patent/CN116448419A/zh active Pending
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116680459B (zh) * | 2023-07-31 | 2023-10-13 | 长沙紫喇叭电子商务有限公司 | 基于ai技术的外贸内容数据处理*** |
CN116680459A (zh) * | 2023-07-31 | 2023-09-01 | 长沙紫喇叭电子商务有限公司 | 基于ai技术的外贸内容数据处理*** |
CN117172099A (zh) * | 2023-08-03 | 2023-12-05 | 西华大学 | 基于多目标脉冲神经膜***优化算法的电网故障诊断方法 |
CN116957365A (zh) * | 2023-09-20 | 2023-10-27 | 深圳市鸿效节能股份有限公司 | 水泵电机的维护效果评估方法及其*** |
CN116957365B (zh) * | 2023-09-20 | 2023-11-24 | 深圳市鸿效节能股份有限公司 | 水泵电机的维护效果评估方法及其*** |
CN116976531A (zh) * | 2023-09-25 | 2023-10-31 | 华夏天信智能物联股份有限公司 | 用于井下电控设备的集成管理方法及*** |
CN116976531B (zh) * | 2023-09-25 | 2024-02-20 | 华夏天信智能物联股份有限公司 | 用于井下电控设备的集成管理方法及*** |
CN117146647B (zh) * | 2023-10-31 | 2023-12-22 | 南通蓬盛机械有限公司 | 一种光学瞄准镜的速调校准方法及*** |
CN117146647A (zh) * | 2023-10-31 | 2023-12-01 | 南通蓬盛机械有限公司 | 一种光学瞄准镜的速调校准方法及*** |
CN117174899A (zh) * | 2023-11-01 | 2023-12-05 | 南通江海储能技术有限公司 | 一种氟化碳正极材料制备方法 |
CN117151229A (zh) * | 2023-11-01 | 2023-12-01 | 青岛聚远网络科技有限公司 | 一种基于云边端架构的云端推理方法及*** |
CN117174899B (zh) * | 2023-11-01 | 2024-01-26 | 南通江海储能技术有限公司 | 一种氟化碳正极材料制备方法 |
CN117151229B (zh) * | 2023-11-01 | 2024-01-26 | 青岛聚远网络科技有限公司 | 一种基于云边端架构的云端推理方法及*** |
CN117348605A (zh) * | 2023-12-05 | 2024-01-05 | 东莞栢能电子科技有限公司 | 应用于离型膜撕除机控制***的优化方法及*** |
CN117348605B (zh) * | 2023-12-05 | 2024-03-12 | 东莞栢能电子科技有限公司 | 应用于离型膜撕除机控制***的优化方法及*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116448419A (zh) | 基于深度模型高维参数多目标高效寻优的零样本轴承故障诊断方法 | |
CN109766583B (zh) | 基于无标签、不均衡、初值不确定数据的航空发动机寿命预测方法 | |
CN111222549B (zh) | 一种基于深度神经网络的无人机故障预测方法 | |
CN111860982A (zh) | 一种基于vmd-fcm-gru的风电场短期风电功率预测方法 | |
CN111814956B (zh) | 一种基于多维度二次特征提取的多任务学习的空气质量预测方法 | |
CN106156401B (zh) | 基于多组合分类器的数据驱动***状态模型在线辨识方法 | |
CN107273924B (zh) | 基于模糊聚类分析的多数据融合的电厂故障诊断方法 | |
CN109472088B (zh) | 一种页岩气调产井生产压力动态预测方法 | |
CN111638707B (zh) | 基于som聚类和mpca的间歇过程故障监测方法 | |
Ayodeji et al. | Causal augmented ConvNet: A temporal memory dilated convolution model for long-sequence time series prediction | |
CN105183928A (zh) | 铸铝构件中的残余应力和变形的快速分析 | |
CN116380445B (zh) | 基于振动波形的设备状态诊断方法及相关装置 | |
CN116384224A (zh) | 一种基于条件化参数动态卷积神经网络的航空发动机寿命预测方法 | |
CN114548199A (zh) | 一种基于深度迁移网络的多传感器数据融合方法 | |
CN114266289A (zh) | 一种复杂装备健康状态评估方法 | |
Ye et al. | A deep learning-based method for automatic abnormal data detection: Case study for bridge structural health monitoring | |
CN116109039A (zh) | 一种数据驱动异常检测与预警*** | |
Zhao et al. | A capsnet-based fault diagnosis method for a digital twin of a wind turbine gearbox | |
CN112184037B (zh) | 一种基于加权svdd的多模态过程故障检测方法 | |
CN115730255A (zh) | 基于迁移学习和多源信息融合的电机故障诊断分析方法 | |
Luo et al. | A novel method for remaining useful life prediction of roller bearings involving the discrepancy and similarity of degradation trajectories | |
CN112365022A (zh) | 一种基于多阶段的发动机轴承故障预测方法 | |
CN111160715A (zh) | 基于bp神经网络新旧动能转换绩效评价方法和装置 | |
CN114841000B (zh) | 一种基于模态共有特征分离的软测量建模方法 | |
CN116595883B (zh) | 数值反应堆实时在线***状态修正方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |