CN116448419A

CN116448419A - 基于深度模型高维参数多目标高效寻优的零样本轴承故障诊断方法

Info

Publication number: CN116448419A
Application number: CN202310237866.3A
Authority: CN
Inventors: 张睿; 白晓露; 张永梅; 潘理虎; 胡立华; 谢斌红
Original assignee: Taiyuan University of Science and Technology
Current assignee: Taiyuan University of Science and Technology
Priority date: 2023-03-14
Filing date: 2023-03-14
Publication date: 2023-07-18

Abstract

本发明公开了一种基于深度模型高维参数多目标高效寻优的零样本轴承故障诊断方法，涉及轴承故障智能诊断领域。方法包括如下步骤：高维空间域转换的视觉特征提取器构建；基于代理辅助多目标进化算法的视觉特征提取器组件寻优策略构建；序列信号统计特征辅助下的语义矩阵构建；异常值插补的视觉‑语义自编码零样本映射策略构建。本发明改善了现有旋转机器故障诊断中固有的检测判别特征提取不充分、模型重构检测性能均衡效率低、各类样本数量不平衡、异常类/零样本识别受限等技术性瓶颈问题等问题，保障设备运行得安全可靠，最大限度地减少备件成本、机械***停机时间和维护时间，为解决制约当前实际工程场景中轴承故障诊断发展的关键问题提供新方法。

Description

基于深度模型高维参数多目标高效寻优的零样本轴承故障诊断方法

技术领域

本发明涉及轴承故障智能诊断领域，具体为一种基于深度模型高维参数多目标高效寻优的零样本轴承故障诊断方法。

背景技术

在现代化的发展中，从风力发电、航空航天组件、矿山机械等大型制造业到小型企业的自动化制造设备，都离不开旋转机械设备的运用。为了满足不断发展的工业生产和制造业的需求，机械设备被设计得愈加精密、复杂与智能。但是，由于受运行环境、制作工艺等因素的影响，机械设备的故障率也逐渐攀升。

传统的故障诊断方法在诊断过程中，通常采用基于模型或基于信号处理的故障诊断方法。然而随着现代机械设备日益大型化、复杂化，前者往往难以建立能可靠反应机械***工作特性的数值模型，后者因过于依赖人的技术经验，难以应对海量数据进行有效的故障特征提取。当前，数据驱动的智能故障诊断算法凭借强大的特征提取能力，逐渐代替了建立复杂的数值模型或繁琐的信号处理，成为国内外旋转机械故障诊断领域的研究热点。但是，现有数据驱动的智能故障诊断方法严重依赖于大量理想的标记数据，而实际工程场景下，尽管设备因长期运转积累了海量数据，却缺乏可用数据用以训练智能故障诊断模型，具体表现如下。

(1)故障类型无历史训练数据问题，即零样本条件下的故障诊断。相较于实验室流程操作产生的典型故障类型，实际工程场景中，滚动轴承因载荷大、冲击强等恶劣工况，极易产生复杂多样的故障类型，导致没有任何已标记或未标记的历史训练数据可用于训练智能故障诊断模型。在不进行停机检查的情况下，利用已有的状态监测数据，如何识别无历史记录的故障类型(即未见类故障)、提高未见类故障识别的准确性，是现阶段故障诊断领域的关键问题，且亟需解决。

(2)较主流的故障诊断模型结构普遍由人工设计方法进行选取，这在很大程度上依赖于设计者的经验知识，往往需要通过反复实验来确定最终的模型结构，很难权衡模型诊断速度和检测性能等多项指标，过程费时低效并且难以保证诊断模型泛化性。因此，如何在实现诊断模型性能自动均衡寻优的同时，给出拥有可信输出的最优模型组件结构尚需进行更加深入的研究。

发明内容

本发明为了进一步改善现有旋转机器故障诊断中固有的检测判别特征提取不充分、模型重构检测性能均衡效率低、各类样本数量不平衡、异常类/零样本识别受限等技术性瓶颈问题等问题，提出供一种基于深度模型高维参数多目标高效寻优的零样本轴承故障诊断方法。

本发明是通过如下技术方案来实现的：一种基于深度模型高维参数多目标高效寻优的零样本轴承故障诊断方法，包括如下步骤：

1)高维空间域转换的视觉特征提取器构建：

通常对轴承的故障诊断只是利用传感器采集到的振动信号进行分析，收集所得到的一维时域序列包含的故障特征信息不明显且特征之间相关性表达不充分。本发明围绕此类问题，利用卷积神经网络深度模型构建出高维空间域转换的视觉特征提取器，首先利用传感器来收集多种状态下的序列信号，并将采集得到的数据映射入高维格拉姆角和场域(Gramain Angular Summation Field,GASF)中，在高维空间中以全连接层方式进行特征拆解，发掘数据样本高维空间维度上特征的可行性，搭配以卷积神经网络实现对数据样本视觉特征的高效提取；GASF变化表达函数如式(1)所示，构造视觉特征提取器的总体框架，如表1所示；

式中为转换后的极坐标序列，I为单位行向量[1,1,…，1]；具体转换过程即将时间序列在极坐标***内进行编码，展现样本的不同信息粒度；在格拉姆矩阵中的每个元素是角度的三角函数值，利用三角函数的和运算则构建出格拉姆角和场域；

表1视觉特征提取器的总体框架

2)基于代理辅助多目标进化算法的视觉特征提取器组件寻优策略构建：

本发明搭建出高维空间域转换的视觉特征提取器仅为大致框架，除最后一层全连接视觉特征提取层节点数确定以外，所涉及的内部诸多结构组件以及参数/超参数如何设定未知，仅利用人工经验方式对其操作将存在主观因素不合理且重新设计成本高的问题。因此，本发明构建出一种基于约束型Dropout神经网络的代理辅助进化算法(ConstrainedDropout Neural Network based Surrogate-assisted Evolution Algorithm,CDNNEA)作为视觉特征提取器组件寻优策略，利用该寻优策略对进行视觉特征提取的深度模型内部组件进行自适应搜索，优化目标扩展为识别准确度、模型复杂度、训练时间三项维度，同时为了降低单目标寻优过程中模型训练和评估过程中的时间成本和硬件成本，构建扩展性强的代理模型对搜索策略进行辅助，具体实现如下：

CDNNEA算法总体框架如图3所示，输入为：最大评价次数MaxFE，评价次数FE，种群大小P，决策变量维度d，代价函数f，真实评价解的数量σ，评判比率ρ，输出为真实问题的非支配解集(X,Y)，具体包括如下步骤：

①生成初始解部分：X＝LatinHypercubeSample(11d-1)，Y＝f(X)；

②FE＝11d-1；

③开始算法迭代：WHILE FE≤MaxFE DO；

④利用训练数据集训练代理模型：C-dropout＝TrainingData(X,Y)；

⑤对种群中的非支配解集进行优化搜索：(X₁,Y₁,ρ₁,ρ₂)＝Estimate(P,C-dropout)；

⑥根据管理准则选择σ个先前所得非支配解进行真实评估：

X₂＝Selection(X₁,Y₁,ρ₁,ρ₂,C-dropout,σ),Y₂＝f(X₂)；

⑦X'＝X∪X₂,Y'＝Y∪Y₂；

⑧对训练数据集进行更新：(X,Y)＝Update(X',Y',11d-1,σ)；

⑨FE＝FE+1,ρ₁＝ρ₂；

⑩END WHILE；

其中，步骤①为生成初始解部分，用来采样经过真实计算后的部分初始样本，并基于此生成初始训练数据集。步骤③到步骤⑩为算法的主要迭代过程，步骤④主要利用训练数据集训练代理模型；步骤⑤则对种群中的非支配解集进行优化搜索，期间所涉及到的目标评估无需进行代价昂贵的真实计算，仅依赖计算低廉的代理模型便可实现；最后，由于最初所建代理模型优化导向不一定正确，若无任何更新策略的操作，非支配解的质量以及模型估值准确度将难以保证。故步骤⑥根据管理准则选择σ个先前所得非支配解进行真实评估，步骤⑧对训练数据集进行更新。

步骤①即在优化开始前，CDNNEA使用拉丁超立方体采样方式在决策空间中生成11d-1大小的均匀采样点，其中d为决策变量维度，并对其使用待优化的目标函数进行真实计算，所获得的决策变量以及相应目标解将被作为数据集训练代理模型。采样次数设置为11d-1的适宜性可参考文献。

3)序列信号统计特征辅助下的语义矩阵构建：

对监督分类由于标签信息通常使用的是独热码，导致监督分类的标签之间往往没有关联性，从而使得监督分类无法对未见类进行分类，但已见类和未见类的辅助信息之间是有关联性的，这种辅助信息主要来自于人为定义的语义描述信息、用自然语言处理技术得到的词向量信息或两者的混合，通过这种间接的方式使得已见类和未见类之间产生关联性，让未见类能够被正确分类成为可能。

语义描述信息主要是人根据先前的知识对类别特征的总结，人为定义的语义描述信息有两种形式，一种是二值描述，另一个种是连续值描述。对于轴承故障类序列信号的语义描述信息的设计需要满足以下条件：

(1)具有语义性，即能够通过人的描述信息来获取；

(2)具有判别性，即不同故障类型的语义描述是不同的；

(3)具有一致性，即一旦属性个数确定，那么故障语义描述向量的维度是固定的，且向量相同位置代表相同的属性。

二值描述主要表示属性的有无问题，对于故障语义描述的属性可以是传感器的各种指标，如果异常，则该属性值为1，如果正常，则该属性的值为0。故障语义描述信息中每一个故障由一个向量表示，其中的每个属性值是0或者1，属性值组成的向量就是故障的语义描述信息。使用二值表示时，其语义描述向量的构建往往比较容易，但是其对属性的描述往往是不全面的，因为很多情况下故障状态下的属性不一定是始终确定的。

语义描述信息的连续值表示相比于二值表示往往能够更准确地描述故障，相比于二值描述，连续值描述往往比较困难，且其受个体主观性的影响要高于二值描述，因此通常需要由领域内的专家对该属性进行打分，分数越高，异常越严重，最后通过对多人进行取平均来获得其最终的属性连续值。但由于零样本学习在故障诊断领域研究较少，且在设计故障连续值语义描述时需要采用的语义描述信息难以表述，因此在故障诊断领域的序列信号语义矩阵构建方面有待进一步研究。

基于统计分析是一种遵循随机过程的理论统计规律，其主要运用概率统计的相关方法来进行事物随机过程的探索与发现。轴承故障智能诊断过程中，由于实验环境及轴承材料引起振动频率存在不确定性，进而采集到的信号中含有随机成分。所以这种信号用确切的数学表达式来描述是很困难的。然而，这种随机信号数据往往在经过丰富的实验后会展现出一种特定的统计规律。在轴承故障智能诊断中干扰信号往往也是随机的，受材料内部结构影响，振动加速度信号识别会出现声波偏转、声束畸变等情况，因此，符合缺陷信号本质且适量的特征量对缺陷识别有重要的影响，为了能找到同时满足体现故障信号本质且数量最优的语义向量，选择均方根值、方根幅值、绝对平均幅值、标准差、最大值、最小值、峰峰值、峭度、峰态、偏度、八阶矩系数、十六阶矩系数、波形指标、峰值指标、脉冲指标、裕度指标、峭度指标、偏态指标、均方频谱、频谱重心、频域方差、相关因子、谐波因子、谱原点矩，这24种时域或频域特征作为轴承故障的统计特征语义表征模型；具体如下：

均方根值：方根幅值/>绝对平均幅值/>

标准差最大值X_max＝max|x_i|，最小值X_min＝min|x_i|；

峰峰值V_pp＝max|x_i|-min|x_i|，峭度峰态/>

偏度八阶矩系数/>十六阶矩系数/>

波形指标峰值指标/>脉冲指标/>裕度指标/>

峭度指标偏态指标/>

均方频谱频谱重心/>

频域方差相关因子/>

谐波因子谱原点矩/>

4)异常值插补的视觉-语义自编码零样本映射策略构建：

建立好视觉-语义映射，便可以计算任意未见类数据和未见类原型之间的相似度，并基于该相似度对未见类进行分类。本发明在映射层添加具体语义信息的限制，约束重建效果，实现有监督下的投影函数学习，以语义属性描述或词向量作为迁移知识，将隐藏层的信息设定为样本语义属性，利用自动编码器将视觉特征映射到语义空间中，并利用解码器重构原始的视觉特征，结构图如图3所示。具体步骤如下：

构建零样本学习模型的目标函数为：

式中，输入样本数据即为X∈R^d×N，d是样本的特征维度，N是样本总数；投影矩阵W∈R^k×d，k是样本属性的维度，样本属性S∈R^k×N；为了简化模型运算，令W^*＝W^T，同时考虑解决约束WX＝S困难，故将上式重写为：

其中||·||_F是Frobenius范式，第一项是零样本特征学***衡这两项；对上式的优化先求导，再利用矩阵迹的性质化简，结果如下：

-2SX^T+2SS^TW+2λWXX^T-2λX^TS (10)

令式(10)等于0，可得：

SS^TW+λWXX^T＝SX^T+λSX^T (11)

再令A＝SS^T,B＝λXX^T,C＝(1+λ)SX^T，则上式最终可写成如下形式：

AW+WB＝C (12)

公式(12)为一个西尔维斯特(Sylvester equation)方程，采用Bartels-Stewart算法求解，即可求得最优的视觉-语义映射矩阵W与W^T；同时，为消除Sylvester equation求解过程中一些不完整的异常数据对映射矩阵W合理性的影响，本发明基于平均插值理论，设定映射矩阵W中若判断有异常值的出现，则对异常值进行按当前属性列的平均值插补替换，即对数据异常值由滑动平均窗口法进行数据插补，对该列的非异常值求和后求出平均值作为插补数据，将数据赋值给缺失值，最后将插补后新列赋值给原始列；经实验验证，平均插值的数据处理方法极大提高了视觉空间到语义空间的映射相似性，可有效的解决模型中视觉-语义空间映射过程数据异常问题。

最后，在未见类样本标签预测阶段，利用式(13)结合余弦相似性(CosineSimilarity)，将推导出的未见类样本属性与未知类原型属性进行对比，从而预测得到未知类样本的标签：

式中是目标域中第i个样本的预测属性，/>是第j个未知类的原型属性，d(·)是余弦距离方程，f(·)是预测得到的样本标签。

进一步的，步骤2)的步骤④中，利用训练数据集训练代理模型，使用的一种约束型Dropout神经网络可扩展代理模型，以缩减不同子模型输出间分布的差异性为出发点，新增样本填充机制以及损失约束项来提升多目标问题求解过程中代理模型的可信度，对于批次大小为d的样本组成的训练集T＝{(X_i,Y_i)}(i＝1,2,...,d)，d与决策变量大小一致，原始进行反向传播的目的即最小化式(2)所示的均方误差函数；在C-dropout过程中，每个批次的训练数据X_i都将被复制后堆叠为新样本再输入，其目的在于模拟相同数据的两次正向传播过程以获取模型预测结果的两个分布P₁＝P(X_i|Y_i)与P₂＝P'(X'_i|Y'_i)，同时凭借Dropout网络结构动态变化的特性，堆叠新样本的方式可对昂贵优化问题中稀缺的真实计算样本进行一定程度上的数据扩充；此时误差损失最小化的目标则变化为式(3)，且对子模型差异性的缩减问题便转化为如何对输出后的分布P₁与P₂进行约束；结合斯皮尔曼相关系数对变量间相关程度的有效度量，将其应用于衡量两次输出的不一致性，即构造式(4)所示的约束项，并与l₂联立成最终的训练损失函数如式(5)所示，以此降低原始网络空间中参数的自由度；求取误差后，模型将按照所设迭代次数，结合由梯度与链式法更新后的权值和偏差进行反向传播，最终完成训练阶段；

进一步的，步骤2)的步骤⑤中，对种群中的非支配解集进行优化搜索，使用具有良好高维多目标问题求解性能的PeEA算法进行代理模型的最优解集搜索，通过对高维空间中Pareto前沿曲率的敏感性以及解集之间相似度的评估，在Pareto前沿形状、连续性等特点未知的环境下，搜寻得到表现性能优越的解，以此组成候选解集提供若干需要真实评估的个体来引导代理模型更新；

PeEA在自身环境选择策略中首先利用成就尺度函数定位最能表征Pareto前沿曲率的关键点，计算点间距离的比值来近似获取前沿曲率；之后根据估计出的曲率值由构建的自适应尺度函数来选择合适的指标实现算法的最大化收敛；同时利用独特的相似度度量方式提升高维环境下存在异常值时解集的一致性；在PeEA中，对于m目标维度优化问题中的前沿面上点x＝(x₁,x₂,…,x_m)，则有式(6)的Pareto前沿形状估计：

其中q为代表前沿曲率的正参数，对于0<q<1、q＝1、q>1分别表示前沿属凹形、线性、凸形；在确定q值时，PeEA首先利用每个目标上最小值点与极值点实现目标标准化，以期提供与目标轴等距的超平面作为基平面。当预估前沿形状为凹形或线形时，则利用线性缩放形式衡量种群收敛性。当预估前沿形状为凸形时，则利用切比雪夫距离形式衡量种群收敛性。

步骤2)CDNNEA对视觉特征提取模型的应用中，测试时间即对测试集识别过程所需的总时间，计算量则以模型的每秒浮点运行次数(Floating Point Operations PerSecond,FLOPs)来衡量，测试误差以式(7)计算：

式中，t(i)代表真实标签，p(i)为预测标签，batch为批量大小。

本发明所提供的一种基于深度模型高维参数多目标高效寻优的零样本轴承故障诊断方法，与现有技术相比本发明具有以下有益效果：①目前主流的滚动轴承故障诊断模型多停留在需大量标注样本进行训练的阶段，在面对一些在实际工程测试中突现的复杂/未见类新故障时，将会束手无策。因此，本发明创新性的以少样本和零样本条件下的轴承故障诊断为研究对象，拟通过视觉与语义层面的嵌入空间来建立已标注故障类别与新增未见类故障之间的耦合关系，抽离已知以及未见类的语义向量用以搭建语义空间，学***均幅值、均方频谱、频谱重心和八阶矩系数等24种时域/频域特征作为轴承故障的统计特征语义表征模型。致力于发掘符合缺陷信号本质且适量的特征量；③零样本诊断方法中的视觉特征提取模型中结构、参数等组件的设计若均由人工手动调整，则实现最高性能的重构模型将是极为耗时乃至无法实现的，并且设计后模型中的结构和参数大概率将存在冗余。本发明为有效提高模型泛化以及重构性能，均衡诊断模型的效率与精度间的矛盾，构建出待优化模型架构组件的搜索空间，确定模型中待优化参数并将其作为决策变量，设置各变量内部中存在的约束条件和搜索范围，制定能够反映评估速度、故障样本评估准确性、模型计算复杂度等需求项的评价指标，根据具体实际工程需要，选择合适的帕累托最优解优化设置诊断模型的可信度组件，最终实现均衡兼顾重构模型快速性和准确性的要求，以更快的效率提取出更高质的样本视觉特征。

附图说明

图1为本发明步骤2)的CDNNEA应用流程图。

图2为本发明步骤2)的算法1CDNNEA总体框架流程图。

图3为本发明步骤4)的视觉-语义映射结构图。

图4为本发明具体实施例中，三种代理方式在DTLZ测试问题上获得的平均IGD值(最优结果以粗体标记)。

图5为本发明具体实施例中，三种代理方式在WFG测试问题上获得的平均IGD值(最优结果以粗体标记)。

图6为本发明具体实施例中，CDNNEA与六种对比算法在3-m DTLZ测试问题上获得的平均IGD值。

图7为本发明具体实施例中，CDNNEA与六种对比算法在40-d DTLZ测试问题上获得的平均IGD值。

图8为本发明具体实施例中，CWRU数据集划分描述表格。

图9为本发明具体实施例中，视觉特征提取模型优化前各参数预设范围表格。

图10为本发明具体实施例中，三组偏好解决方案附带的参数值表格。

图11为本发明具体实施例中，与四种对比算法应用于特征提取模型上的性能对比表格。

图12为本发明具体实施例中，零样本诊断模型未知类识别样本分布。

具体实施方式

以下结合具体实施例对本实施例作进一步说明。

一种基于深度模型高维参数多目标高效寻优的零样本轴承故障诊断方法，包括如下步骤：

1)高维空间域转换的视觉特征提取器构建：

利用卷积神经网络深度模型构建出高维空间域转换的视觉特征提取器，首先利用传感器来收集多种状态下的序列信号，并将采集得到的数据映射入高维格拉姆角和场域GASF中，在高维空间中以全连接层方式进行特征拆解，发掘数据样本高维空间维度上特征的可行性，搭配以卷积神经网络实现对数据样本视觉特征的高效提取；GASF变化表达函数如式(1)所示，构造视觉特征提取器的总体框架；

式中为转换后的极坐标序列，I为单位行向量[1,1,...，1]；具体转换过程即将时间序列在极坐标***内进行编码，展现样本的不同信息粒度；在格拉姆矩阵中的每个元素是角度的三角函数值，利用三角函数的和运算则构建出格拉姆角和场域；

构建出一种基于约束型Dropout神经网络的代理辅助进化算法CDNNEA作为视觉特征提取器组件寻优策略，利用该寻优策略对进行视觉特征提取的深度模型内部组件进行自适应搜索，优化目标扩展为识别准确度、模型复杂度、训练时间三项维度，同时为了降低单目标寻优过程中模型训练和评估过程中的时间成本和硬件成本，构建扩展性强的代理模型对搜索策略进行辅助，具体实现如下：

CDNNEA算法总体框架，输入为：最大评价次数MaxFE，评价次数FE，种群大小P，决策变量维度d，代价函数f，真实评价解的数量σ，评判比率ρ，输出为真实问题的非支配解集(X,Y)，具体包括如下步骤：

①生成初始解部分：X＝LatinHypercubeSample(11d-1)，Y＝f(X)；

②FE＝11d-1；

③开始算法迭代：WHILE FE≤MaxFE DO；

④利用训练数据集训练代理模型：C-dropout＝TrainingData(X,Y)；

⑥根据管理准则选择σ个先前所得非支配解进行真实评估：

X₂＝Selection(X₁,Y₁,ρ₁,ρ₂,C-dropout,σ),Y₂＝f(X₂)；

⑦X'＝X∪X₂,Y'＝Y∪Y₂；

⑧对训练数据集进行更新：(X,Y)＝Update(X',Y',11d-1,σ)；

⑨FE＝FE+1,ρ₁＝ρ₂；

⑩END WHILE；

步骤④中，利用训练数据集训练代理模型，使用的一种约束型Dropout神经网络可扩展代理模型，以缩减不同子模型输出间分布的差异性为出发点，新增样本填充机制以及损失约束项来提升多目标问题求解过程中代理模型的可信度，对于批次大小为d的样本组成的训练集T＝{(X_i,Y_i)}(i＝1,2,...,d)，d与决策变量大小一致，原始进行反向传播的目的即最小化式(2)所示的均方误差函数；在C-dropout过程中，每个批次的训练数据X_i都将被复制后堆叠为新样本再输入，其目的在于模拟相同数据的两次正向传播过程以获取模型预测结果的两个分布P₁＝P(X_i|Y_i)与P₂＝P'(X'_i|Y'_i)，同时凭借Dropout网络结构动态变化的特性，堆叠新样本的方式可对昂贵优化问题中稀缺的真实计算样本进行一定程度上的数据扩充；此时误差损失最小化的目标则变化为式(3)，且对子模型差异性的缩减问题便转化为如何对输出后的分布P₁与P₂进行约束；结合斯皮尔曼相关系数对变量间相关程度的有效度量，将其应用于衡量两次输出的不一致性，即构造式(4)所示的约束项，并与l₂联立成最终的训练损失函数如式(5)所示，以此降低原始网络空间中参数的自由度；求取误差后，模型将按照所设迭代次数，结合由梯度与链式法更新后的权值和偏差进行反向传播，最终完成训练阶段；

步骤⑤中，对种群中的非支配解集进行优化搜索，使用具有良好高维多目标问题求解性能的PeEA算法进行代理模型的最优解集搜索，通过对高维空间中Pareto前沿曲率的敏感性以及解集之间相似度的评估，在Pareto前沿形状、连续性等特点未知的环境下，搜寻得到表现性能优越的解，以此组成候选解集提供若干需要真实评估的个体来引导代理模型更新；

其中q为代表前沿曲率的正参数，对于0<q<1、q＝1、q>1分别表示前沿属凹形、线性、凸形；在确定q值时，PeEA首先利用每个目标上最小值点与极值点实现目标标准化，以期提供与目标轴等距的超平面作为基平面。当预估前沿形状为凹形或线形时，则利用线性缩放形式衡量种群收敛性；当预估前沿形状为凸形时，则利用切比雪夫距离形式衡量种群收敛性。

图1展示了CDNNEA对视觉特征提取模型的应用流程图。首先按比例划分好训练集与测试集并预设完成卷积神经网络模型。之后明确CDNNEA算法的决策变量维度即网络模型中待优化的参数。如：卷积核个数、卷积核尺寸、卷积层中激活函数、池化方式、全连接层节点个数、梯度下降函数、学习率、批次大小。其中，除激活函数、池化方式、学习率、梯度下降函数外的待定参数由于信息的整数规划问题，需要对其第一位小数进行取整操作。接着进入到CDNNEA算法优化流程，在每次迭代中，对网络参数进行优化，以寻得网络模型的测试时间、计算量、测试误差即三个目标的最小值。实例中，测试时间即对测试集识别过程所需的总时间，计算量则以模型的每秒浮点运行次数(Floating Point Operations Per Second,FLOPs)来衡量，测试误差以式(7)计算。

式中，t(i)代表真实标签，p(i)为预测标签，batch为批量大小。

3)序列信号统计特征辅助下的语义矩阵构建：

符合缺陷信号本质且适量的特征量对缺陷识别有重要的影响，为了能找到同时满足体现故障信号本质且数量最优的语义向量，选择均方根值、方根幅值、绝对平均幅值、标准差、最大值、最小值、峰峰值、峭度、峰态、偏度、八阶矩系数、十六阶矩系数、波形指标、峰值指标、脉冲指标、裕度指标、峭度指标、偏态指标、均方频谱、频谱重心、频域方差、相关因子、谐波因子、谱原点矩，这24种时域或频域特征作为轴承故障的统计特征语义表征模型；时域或频域特征如下：

均方根值：方根幅值/>绝对平均幅值/>标准差/>最大值X_max＝max|x_i|，最小值X_min＝min|x_i|；

峰峰值V_pp＝max|x_i|-min|x_i|，峭度峰态/>偏度/>八阶矩系数/>十六阶矩系数/>波形指标/>峰值指标/>脉冲指标/>裕度指标/>峭度指标/>偏态指标均方频谱/>频谱重心/>频域方差相关因子/>谐波因子/>谱原点矩/>

4)异常值插补的视觉-语义自编码零样本映射策略构建：

在映射层添加具体语义信息的限制，约束重建效果，实现有监督下的投影函数学习，以语义属性描述或词向量作为迁移知识，将隐藏层的信息设定为样本语义属性，利用自动编码器将视觉特征映射到语义空间中，并利用解码器重构原始的视觉特征。构建零样本学习模型的目标函数为：

-2SX^T+2SS^TW+2λWXX^T-2λX^TS (10)

令式(10)等于0，可得：

SS^TW+λWXX^T＝SX^T+λSX^T (11)

AW+WB＝C (12)

公式(12)为一个西尔维斯特方程，采用Bartels-Stewart算法求解，即可求得最优的视觉-语义映射矩阵W与W^T；同时，基于平均插值理论，设定映射矩阵W中若判断有异常值的出现，则对异常值进行按当前属性列的平均值插补替换，即对数据异常值由滑动平均窗口法进行数据插补，对该列的非异常值求和后求出平均值作为插补数据，将数据赋值给缺失值，最后将插补后新列赋值给原始列；

最后，在未见类样本标签预测阶段，利用式(13)结合余弦相似性，将推导出的未见类样本属性与未知类原型属性进行对比，从而预测得到未知类样本的标签：

5)应用上述过程进行评价分析：

5.1)CDNNEA视觉特征提取器组件寻优策略性能验证：

①对比算法：

为对CDNNEA算法性能进行全面分析，本实施例首先将C-dropout、Dropout、Kriging三种不同的代理辅助模型分别与PeEA算法联立测试，对比证明出C-dropout作为可扩展代理模型的可行性。其次将CDNNEA与六种领域内先进算法进行了性能比较。本实施例的实验均在Intel Core i5-9400F CPU、Microsoft Windows 10操作***的计算机上由MATLAB R2020b软件设计实现，其中对比算法的结果在PlatEMO平台上运行得到。

②测试问题集：

实验选用DTLZ和WFG测试问题作为基准测试问题。对于每个测试问题，最大的决策变量和目标数分别设置为100和20。其中，在WFG测试集上，当目标维数m为3或5时，相关位置参数的个数γ设置为m-1，当m为10或20时，对应γ设置为2(m-1)。

③参数设置：

(1)独立运行次数：对于每个测试问题，每种算法独立运行20次。

(2)最大真实评估次数：除初始真实采样的11d-1个训练数据外，另外采用120次真实求解来测试比较算法的性能，因此最大真实评估次数设置为11d+119。

(4)C-dropout相关参数：两层神经元失活概率值p₁与p₂分别为0.2与0.5，学习率大小设为0.01，批次大小设置与决策变量个数一致，模型训练迭代次数I_train设为1*10⁴，测试迭代次数I_test设为100。

(5)PeEA算法参数：种群大小设置为50，对代理模型最大评估次数设置为20次。

(6)变异算子：采用多项式突变方式，设变异概率为1/d，分布指数为20。

(7)交叉算子：采用模拟二进制交叉方式，设交叉概率为1.0，分布指数为20。

④评价指标：

实验选用反向世代距离评价指标(Inverted Generational Distance,IGD)作为评价指标。

Claims

1.一种基于深度模型高维参数多目标高效寻优的零样本轴承故障诊断方法，其特征在于：包括如下步骤：

1)高维空间域转换的视觉特征提取器构建：

①生成初始解部分：X＝LatinHypercubeSample(11d-1)，Y＝f(X)；

②FE＝11d-1；

③开始算法迭代：WHILE FE≤MaxFE DO；

④利用训练数据集训练代理模型：C-dropout＝TrainingData(X,Y)；

⑥根据管理准则选择σ个先前所得非支配解进行真实评估：

X₂＝Selection(X₁,Y₁,ρ₁,ρ₂,C-dropout,σ),Y₂＝f(X₂)；

⑦X'＝X∪X₂,Y'＝Y∪Y₂；

⑧对训练数据集进行更新：(X,Y)＝Update(X',Y',11d-1,σ)；

⑨FE＝FE+1,ρ₁＝ρ₂；

⑩END WHILE；

3)序列信号统计特征辅助下的语义矩阵构建：

符合缺陷信号本质且适量的特征量对缺陷识别有重要的影响，为了能找到同时满足体现故障信号本质且数量最优的语义向量，选择均方根值、方根幅值、绝对平均幅值、标准差、最大值、最小值、峰峰值、峭度、峰态、偏度、八阶矩系数、十六阶矩系数、波形指标、峰值指标、脉冲指标、裕度指标、峭度指标、偏态指标、均方频谱、频谱重心、频域方差、相关因子、谐波因子、谱原点矩，这24种时域或频域特征作为轴承故障的统计特征语义表征模型；

4)异常值插补的视觉-语义自编码零样本映射策略构建：

在映射层添加具体语义信息的限制，约束重建效果，实现有监督下的投影函数学习，以语义属性描述或词向量作为迁移知识，将隐藏层的信息设定为样本语义属性，利用自动编码器将视觉特征映射到语义空间中，并利用解码器重构原始的视觉特征。

2.根据权利要求1所述的一种基于深度模型高维参数多目标高效寻优的零样本轴承故障诊断方法，其特征在于：步骤2)的步骤④中，利用训练数据集训练代理模型，使用的一种约束型Dropout神经网络可扩展代理模型，以缩减不同子模型输出间分布的差异性为出发点，新增样本填充机制以及损失约束项来提升多目标问题求解过程中代理模型的可信度，对于批次大小为d的样本组成的训练集T＝{(X_i,Y_i)}(i＝1,2,...,d)，d与决策变量大小一致，原始进行反向传播的目的即最小化式(2)所示的均方误差函数；在C-dropout过程中，每个批次的训练数据X_i都将被复制后堆叠为新样本再输入，其目的在于模拟相同数据的两次正向传播过程以获取模型预测结果的两个分布P₁＝P(X_i|Y_i)与P₂＝P'(X'_i|Y'_i)，同时凭借Dropout网络结构动态变化的特性，堆叠新样本的方式可对昂贵优化问题中稀缺的真实计算样本进行一定程度上的数据扩充；此时误差损失最小化的目标则变化为式(3)，且对子模型差异性的缩减问题便转化为如何对输出后的分布P₁与P₂进行约束；结合斯皮尔曼相关系数对变量间相关程度的有效度量，将其应用于衡量两次输出的不一致性，即构造式(4)所示的约束项，并与l₂联立成最终的训练损失函数如式(5)所示，以此降低原始网络空间中参数的自由度；求取误差后，模型将按照所设迭代次数，结合由梯度与链式法更新后的权值和偏差进行反向传播，最终完成训练阶段；

3.根据权利要求2所述的一种基于深度模型高维参数多目标高效寻优的零样本轴承故障诊断方法，其特征在于：步骤2)的步骤⑤中，对种群中的非支配解集进行优化搜索，使用具有良好高维多目标问题求解性能的PeEA算法进行代理模型的最优解集搜索，通过对高维空间中Pareto前沿曲率的敏感性以及解集之间相似度的评估，在Pareto前沿形状、连续性等特点未知的环境下，搜寻得到表现性能优越的解，以此组成候选解集提供若干需要真实评估的个体来引导代理模型更新；

其中q为代表前沿曲率的正参数，对于0<q<1、q＝1、q>1分别表示前沿属凹形、线性、凸形；在确定q值时，PeEA首先利用每个目标上最小值点与极值点实现目标标准化，以期提供与目标轴等距的超平面作为基平面；当预估前沿形状为凹形或线形时，则利用线性缩放形式衡量种群收敛性；当预估前沿形状为凸形时，则利用切比雪夫距离形式衡量种群收敛性。

4.根据权利要求3所述的一种基于深度模型高维参数多目标高效寻优的零样本轴承故障诊断方法，其特征在于：步骤2)CDNNEA对视觉特征提取模型的应用中，测试时间即对测试集识别过程所需的总时间，计算量则以模型的每秒浮点运行次数FLOPs来衡量，测试误差以式(7)计算：

式中，t(i)代表真实标签，p(i)为预测标签，batch为批量大小。

5.根据权利要求1所述的一种基于深度模型高维参数多目标高效寻优的零样本轴承故障诊断方法，其特征在于：步骤3)中作为轴承故障的统计特征语义表征模型的时域或频域特征如下：

均方根值：方根幅值/>绝对平均幅值/>标准差最大值X_max＝max|x_i|，最小值X_min＝min|x_i|；

峰峰值V_pp＝max|x_i|-min|x_i|，峭度峰态/>偏度/>八阶矩系数/>十六阶矩系数/>波形指标/>峰值指标/>脉冲指标/>裕度指标/>峭度指标/>偏态指标/>均方频谱/>频谱重心/>频域方差/>相关因子谐波因子/>谱原点矩/>

6.根据权利要求1所述的一种基于深度模型高维参数多目标高效寻优的零样本轴承故障诊断方法，其特征在于：步骤4)中，构建零样本学习模型的目标函数为：

-2SX^T+2SS^TW+2λWXX^T-2λX^TS (10)

令式(10)等于0，可得：

SS^TW+λWXX^T＝SX^T+λSX^T (11)

AW+WB＝C (12)