CN112903294B

CN112903294B - 基于vmd与深度卷积神经网络的滚动轴承故障诊断方法

Info

Publication number: CN112903294B
Application number: CN202110017359.XA
Authority: CN
Inventors: 丁承君; 朱雪宏; 冯玉伯; 贾丽臻
Original assignee: Taihua Hongye Tianjin Intelligent Technology Co ltd; Hebei University of Technology
Current assignee: Taihua Hongye Tianjin Intelligent Technology Co ltd; Hebei University of Technology
Priority date: 2021-01-07
Filing date: 2021-01-07
Publication date: 2023-07-14
Anticipated expiration: 2041-01-07
Also published as: CN112903294A

Abstract

本发明涉及一种基于VMD与深度卷积神经网络的滚动轴承故障诊断方法，包括：步骤1：对滚动轴承采集原始振动数据；步骤2：对训练集振动数据进行变分模态分解数据处理及神经网络训练过程：步骤3：对测试振动数据使用变分模态分解进行数据处理及使用神经网络进行故障诊断。针对滚动轴承故障检测，提出将变分模态分解和深度卷积神经网络相结合的方法，实现了在变工况情况下滚动轴承不同故障类型及损伤程度的诊断。变分模态分解能够将振动数据分解成不同的限带本征模态函数分量，而深度卷积神经网络的卷积层能够从不同角度提取各个限带本征模态函数的局部特征，保证特征提取的多样性和全面性。

Description

基于VMD与深度卷积神经网络的滚动轴承故障诊断方法

技术领域

本发明涉及机械故障诊断技术领域，尤其涉及一种基于VMD与深度卷积神经网络的滚动轴承故障诊断方法。

背景技术

滚动轴承是机械设备中最为常见不可或缺的通用机械部件之一，被广泛的应用在冶金、航天、化工等领域。滚动轴承为机械结构提供了可靠支撑，其运行状态直接影响设备运行的安全和相关性能，由于滚动轴承的工作面与接触应力的长期反复作用以及长期处于高转速、高负荷、高温的环境下，导致滚动轴承极易产生损失、裂痕等故障，从而造成滚动轴承的异常，然而，由于机械设备运转时工况复杂，产生的振动信号常混有强烈的外部噪音，导致故障特征信号常被淹没其中，不易识别和提取，因此，如何精准提取滚动轴承的故障特征就显得越发重要。由于滚动轴承在运转过程中出现异常时，其动力学特性呈非线性，相应的振动信号会表现出非平稳、非线性特点，如何从这类信号中进行有效特征提取是对机械***进行故障诊断和早期故障征兆预警的关键。传统故障诊断方法多以信号平稳性为假设，无法兼顾非平稳信号在时域与频域的全局与局部化特征，因此呈现出一定的局限性。

经验模态分解(Empirical Mode Decomposition，EMD)是由Huang等提出的一种信号局部特征信息自适应分解的方法，该方法将信号表示为若干具有不同局部时间尺度特征的固有模态函数(Intrinsic Mode Function，IMF)之和。而EMD十分适用于处理非线性、非平稳信号，广泛应用于机械设备故障诊断领域。例如，使用EMD和频谱自相关方法对轴承故障特征进行提取，能够有效识别滚动轴承故障频率。使用EMD对振动信号分解，然后重构与原信号相关的模态信号，利用形态学提取重构信号特征频率，实现了滚动轴承的故障判别。借鉴于EMD方法，Simth在2005年提出了局部均值分解(Local MeanDecomposition，LMD)方法，该方法同样引起了故障诊断领域技术人员的广泛关注，基于LMD的许多轴承故障诊断方法也被陆续提出。例如，针对特征提取局部均值分解中的端点效应及传统神经网络收敛速度慢等问题，提出基于内积延拓的LMD和支持向量机相结合的轴承故障诊断方法，提出了基于LMD多尺度熵和概率神经网络的滚动轴承故障诊断方法。

虽然EMD和LMD对轴承故障诊断提供了相应的借鉴与参考，但EMD与LMD方法存在端点效应、过拟合、欠拟合及模态混叠等问题，会导致分解出的信号失真，影响故障特征提取。与之相比较，变分模态分解(Variational Mode Decomposition,VMD)是由Dragomiretskiy提出了一种可变尺度的非平稳、非线性信号处理方法。该方法可以将复杂信号分解为一系列的调幅调频(AM-FM)信号，通过采用非递归变分模式分解模型实现了原始信号的自适应分解，具有牢固的数学基础、较小的端点效应、较高的运算效率和良好的噪声鲁棒性。在滚动轴承故障诊断中，当滚动轴承发生异常时，其振动信号的能量结构会随着轴承故障类型和程度发生变化，振动信号的主要频率成分在频率域上的位置也会随之变化，采用VMD方法，将振动信号以无冗余方式进行正交分解，分解后的信号可以反映出原信号在不同频带上的分布特征。而卷积神经网络(Convolutional Neural Network,CNN)是近年来发展起来的一种高效特征识别和分类方法，其实质是构建能够提取输入数据多个不同特征的滤波器，通过这些滤波器对输入数据进行卷积、池化、非线性激活等操作，可以充分提取输入数据局部和全局化拓扑结构特征，随着网络层数的增加，所提取的特征也变得更加抽象，最终的特征具有平移、旋转和缩放不变性，提高了网络分类的鲁棒性，相关研究表明，卷积神经网络的这种特性对于时间序列同样有效。CNN通过稀疏交互、参数共享，时间或空间上的降采样改进了机器学习***性能。其中，稀疏连接通过层间非全连接空间关系降低网络训练参数数量和模型规模；权值共享可以避免算法过拟合；降采样利用数据自包含这一局部特性减少了数据维度，优化了网络结构。

本发明将VMD和CNN相结合，提出了基于变分模态分解与深度卷积神经网络的滚动轴承故障诊断方法，用于实现变工况情况下滚动轴承故障类别和损伤轻度的精确诊断。

发明内容

为此，本发明提供一种基于VMD与深度卷积神经网络的滚动轴承故障诊断方法，用以部分的克服现有技术中滚动轴承诊断中无法兼顾平稳信号在时域与频域的全局与局部化的问题。

为实现上述目的，本发明提供基于VMD与深度卷积神经网络的滚动轴承故障诊断方法，其特征在于，包括，

步骤1：对滚动轴承采集原始振动数据；

步骤2：对训练集振动数据进行变分模态分解数据处理及神经网络训练过程：其中，所述步骤2包括，

步骤201：对振动传感器采集到的振动信号采用N倍工频为基准进行子序列划分，形成子序列样本集，其中，N为整数；

步骤202：使用变分模态分解算法对子序列进行处理，生成若干限带本征模式序列，并构造多维限带本征模态函数矩阵，每个限带本征模态函数作为矩阵的一个行向量，

所述变分模态分解包含三个超参数设置，即限带本征模式函数数量K、有限带宽参数α和中心角频率的初值；通过估算，得到K个中心角频率ω_k，然后由中心角频率ω_k计算出各个模态函数u_k(t)，每个本征模态函数被定义为一个调幅调频信号，表示为：

u_k(t)＝A_k(t)cos(φ_k(t))

其中：包络线A_k(t)为u_k(t)的瞬时幅值，并且A_k(t)≥0；ω_k(t)为u_k(t)的瞬时频率，ω_k(t)＝φ’_k(t)，并且ω_k(t)≥0；A_k(t)和ω_k(t)相对于相位φ_k(t)是缓慢变化的；在[t-δ，t+δ](δ≈2π/φ’_k(t))的时间范围内，u_k(t)为幅值A_k(t)、ω_k(t)的谐波信号；

估算限带本征模式函数带宽，根据卡森原理得：

B_AM-FM＝2(Δf+f_FM+f_AM)

其中：Δf表示瞬时频率最大偏移；f_FM表示调频信号最高调制频率；f_AM表示包络线A_k(t)的最高频率；

步骤203：构建深度卷积神经网络，设置网络超参数，包括网络层数，每层卷积核数目、卷积核大小、非线性激活函数、损失函数和最大池化方式，并采用随机方式初始化网络参数，

所述深度卷积神经网络是一个九层结构，其中三个卷积层，三个池化层，一个用于数据结构变换的数据扁平化层，两个用于数据分类的全连接层，称为VmdCnn9模型，所述VmdCnn9模型包括：

第一步：数据处理，将经由变分模态分解处理后所生成的样本集，划分为训练集和测试集，分别记为：

其中，train代表训练，test代表测试；x_i∈R^m×k，m为限带本征模态函数分量长度，k为限带本征模态函数数量；y_i∈[0，1，......，C]C为故障类别数；

第二步：构建模型，用于特征学习的卷积网络和用于故障诊断的分类器网络，相应公式为：

其中，x为输入信号；X为x经由卷积网络提取的层次化特征，ω为卷积核，b为网络偏置，ω和b的公式如下：

对于用于故障诊断的分类器，其表达为：

其中k＝0，1，……，C为故障类别；对于任意给定的振动子序列，最后输出的故障类别标签为：

第三步：优化目标函数，在振动序列训练数据集上构造交叉熵函数作为优化目标函数：

在优化目标函数的过程中，后两项为正则项，详细描述为：

第四步：求解，求解对于VmdCnn9模型中的全连接网络使用梯度下降法，采用反向传播公式对网络中的参数进行求解，

首先建立深度卷积神经网络相关参数更新公式：

其次反向传播梯度参数更新公式为：

其中，r＝1，2，3，4，5，6，7，8；s＝1，3，5，8；

步骤204：设置深度卷积神经网络对训练集数据的训练次数和迭代次数，对网络模型进行编译后，执行模型的前向计算；

步骤205：根据网络计算结果和数据标签，计算交差熵损失函数；

步骤206：执行反向传播算法，更新深度卷积神经网络权值，完成对网络的训练；

步骤3：对测试振动数据使用变分模态分解进行数据处理及使用神经网络进行故障诊断：在该步骤3过程中，包括，

步骤301：对振动信号经由子序列划分、变分模态分解处理后，形成测试集；

步骤302：使用训练完成的深度卷积神经网络对测试集数据进行分类，实现故障诊断。

进一步地，所述步骤201中的子序列样本集构造包括：

首先，由于振动传感器采集到的振动信号在时域上为随时间而变化的物理量，将原始振动信号视为按时间先后顺序排列成的物理量，即时间序列，记为：

S＝{s₁，s₂，......，s_N}

其中，N为时间序列长度；s为振动位移、速度或者加速度；

其次，使用长度为m的滑动窗口，按步长k(m，k为正整数，在实际振动信号处理中k一般设定为工频的整数倍)将S划分为子序列集合，记为：

S_sub＝{s_i}，0＜i≤N％m(％表示整除)

s_i＝[s_i，s_i+1，......，s_i+k-1]，1≤i≤N-K+1。

进一步地，所述步骤202中，使用变分模态分解算法生成若干限带本征模式序列，构造多维限带本征模态函数矩阵，并结合原始振动序列对应的故障类别，生成样本集，记为：

x_i＝[BIMF₁，BIMF₂，......，BIMF_k]^T

Samples＝{x_n，y_n}

其中x表示多维限带本征模态函数矩阵；Samples表示样本集；y_n∈[0，1，......，C]，C为故障类别数。

进一步地，所述VmdCnn9模型的训练包括计算目标函数值及更新模型参数值，最后使用训练好的模型对测试振动数据进行故障诊断。

进一步地，在轴承故障诊断中，深度卷积神经网络通过卷积层引入局部稀疏连接与参数共享机制输出限带本征模式函数多维局部特征的观察结果。

进一步地，所述数据经过深度卷积运算后，进行池化操作，池化为最大池化。

进一步地，所述卷积网络之后连接一个全连接层，并使用Softmax解决多分类问题，其中，全连接层为：

其中，x_i∈R^m为经卷积层处理后的输入；h∈Rⁿ为隐藏层输出；

和b⁽¹⁾∈Rⁿ分别为输出层到隐藏层的权值连接矩阵和偏置；y∈R^k为网络输出；/>

和b⁽²)∈R^k分别为隐藏层到输出层的权值连接矩阵和偏置；/>

和/>

为非线性激活函数。

与现有技术相比，本发明的有益效果在于，本发明提出了一种基于变分模态分解与深度卷积神经网络的滚动轴承故障诊断方法，针对滚动轴承故障检测，提出将变分模态分解和深度卷积神经网络相结合的方法，实现了在变工况情况下滚动轴承不同故障类型及损伤程度的诊断。VMD能够将振动数据分解成不同的BIMF分量，而深度卷积神经网络的卷积层能够从不同角度提取各个BIMF的局部特征，保证特征提取的多样性和全面性。最大池化层能够对多个局部特征进行融合，保证了特征提取的逐步抽象，使得最终的故障分类准确率更高。

进一步地，深度卷积神经网络所设计的深度卷积神经网络训练收敛速度快且训练好的网络具有很强鲁棒性，在测试集上表现出很好的泛化能力。VMD所分解的信号具有良好的鲁棒性、端点效应抑制和模态伪分量少等特点。在滚动轴承故障诊断中，使用VMD方法对原始信号进行分解，分解后的每个模态分量能够反映出原信号在不同频带上的分布特征，本质上是原信号的一种增强表示，而CNN能够自适应提取多维数据抽象特征，在和全连接网络融合后，实现了面向诊断目标的自动化特征提取效果，避免人工特征筛选的不确定性。

尤其是，VMD具有自适应信号分解的特点，而卷积神经网络具有自动提取数据特征的优良性能，免除了人工特征提取的主观性和不确定性。此外卷积网络自适应特征提取的特点也保证了所提方法具有一定的适应性，可以应用不同类型的机械设备故障诊断。

附图说明

图1为本发明VMD数据处理流程及深度CNN神经网络结构的示意图；

图2为对训练集振动数据进行VMD数据处理及神经网络训练流程图。

图3为对测试振动数据使用VMD进行数据处理及使用神经网络进行故障诊断的流程图；

图4为全连接的图像化解释；

图5为稀疏连接的图像化解释；

图6为深层的神经元与浅层的神经元交互方式；

图7为神经元连接方式；

图8为最大池化；

图9为卷积神经网络中卷积层和最大池化层示意图；

图10为Sigmoid系函数；

图11为Softplus函数与Relu函数；

图12为单层全连接前馈神经网络；

图13为标准神经网络连接和Dropout后的神经网络连接示意图；

图14为轴承装置示意图；

图15为数据处理流程图及VmdCnn9模型的训练使用；

图16为深度卷积神经网络训练过程准确率变化；

图17为不同样本卷积池化后的数据特征可视化图；

图18为不同限带模态数对卷积网络训练过的影响；

图19为不同学习率对深度CNN训练的影响；

图20为不同BatchSize对损失值与准确率的影响；

图21为不同BatchSize对训练时间的影响；

图22为不同类型神经网络训练过程准确率。

具体实施方式

为了使本发明的目的和优点更加清楚明白，下面结合实施例对本发明作进一步描述；应当理解，此处所描述的具体实施例仅仅用于解释本发明，并不用于限定本发明。

下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是，这些实施方式仅仅用于解释本发明的技术原理，并非在限制本发明的保护范围。

需要说明的是，在本发明的描述中，术语“上”、“下”、“左”、“右”、“内”、“外”等指示的方向或位置关系的术语是基于附图所示的方向或位置关系，这仅仅是为了便于描述，而不是指示或暗示所述装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。

此外，还需要说明的是，在本发明的描述中，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域技术人员而言，可根据具体情况理解上述术语在本发明中的具体含义。

首先，对本说明书一个或多个实施例涉及的名词术语进行解释。

VMD：英文全称：Variational Mode Decomposition，中文全称：变分模态分解，一种信号分解估计方法。

CNN：英文全称：Convolutional Neural Network，中文全称：卷积神经网络，是一类包含卷积计算且具有深度结构的前馈神经网络。

BIMF：英文全称：Banded Instrinsic Mode Function，中文全称：限带本征模态函数，一个调幅调频函数。

ADMM：英文全称：Alternate Direction Method of Multipliers，中文全称：乘子交替方向算法，求解非约束算法。

Lagrange乘子法：英文全称：Lagrange Multiplier Method，中文全称：拉格朗日乘数法，是一种寻找变量受一个或多个条件所限制的多元函数的极值的方法。

本发明提供了一种基于VMD与深度卷积神经网络的滚动轴承故障诊断方法，在下面的实施例中逐一进行详细说明。

请参阅图1所示，图1示出了根据本发明一个实施例的基于VMD与深度卷积神经网络的滚动轴承故障诊断方法的结构示意图，包括VMD变分模态分解算法对原始振动信号处理和深度卷积神经网络的对经VMD分解的信号的处理。具体而言，本发明实施例中，首先将变工况情况下不同故障类别的振动信号划分为子序列集合并进行故障类别标定，对每个子序列进行变分模态分解，将分解后的子序列模态分量以矩阵形式组合成多维限带IMF(Intrinsic Mode Function)数据网格，将IMF矩阵输入到所设计的深度卷积神经网络中进行自适应局部与全局特征提取，最后通过全连接神经网络对滚动轴承故障类别进行判断，以此实现变工况情况下滚动轴承故障类别和损伤轻度的精确诊断。

请参阅图2-图3所示，本发明构建了基于变分模态分解与深度卷积神经网络的滚动轴承故障诊断方法，主要分为两个流程，具体的，包括对训练集振动数据进行VMD数据处理及神经网络训练过程和对测试振动数据使用VMD进行数据处理及使用神经网络进行故障诊断。具体包括步骤201对振动传感器采集到的振动信号采用N倍工频(N为整数)为基准进行子序列划分，形成子序列样本集；步骤202使用VMD算法对子序列进行处理，生成若干限带本征模式序列，并构造多维BIMF矩阵，每个BIMF作为矩阵的一个行向量；步骤203构建深度卷积神经网络，设置网络超参数，包括网络层数，每层卷积核数目、卷积核大小、非线性激活函数、损失函数和最大池化方式。并采用随机方式初始化网络参数；步骤204设置深度卷积神经网络对训练集数据的训练次数和迭代次数，对网络模型进行编译后，执行模型的前向计算；步骤205根据网络计算结果和数据标签，计算交差熵损失函数；步骤206执行反向传播算法，更新深度卷积神经网络权值，完成对网络的训练。对测试振动数据使用VMD进行数据处理及使用神经网络进行故障诊断包括步骤301对振动信号经由子序列划分、VMD处理后，形成测试集；步骤302使用训练完成的深度卷积神经网络对测试集数据进行分类，实现故障诊断。

具体而言，本发明实施例中，VMD算法对原始振动信号处理流程如下：

步骤一：由于振动传感器采集到的振动信号在时域上为随时间而变化的物理量，故可将原始振动信号视为按时间先后顺序排列成的物理量，即时间序列，记为：

S＝{s₁，s₂，......，s_N}

其中，N为时间序列长度；s_i为振动位移、速度或者加速度。

步骤二：使用长度为m的滑动窗口，按步长k(m,k为正整数，在实际振动信号处理中k一般设定为工频的整数倍)将S划分为子序列集合，记为：

S_sub={s_i}，0＜i≤N％m(％表示整除)

S_i＝[s_i，s_i+1，......，S_i+k-1]，1≤i≤N-K+1。

步骤三：使用变分模态分解算法生成若干限带本征模式序列，构造多维BIMF矩阵，并结合原始振动序列对应的故障类别，生成样本集，记为：

x_i＝[BIMF₁，BIMF₂，......，BIMF_k]^T

Samples＝{x_n，y_n}

其中x_i表示多维BIMF矩阵；Samples表示样本集；y_n∈[0，1，......，C]C为故障类别数。

具体而言，在VMD算法中，限带本征模态函数(Banded Instrinsic ModeFunction，BIMF)是被定义为一个调幅调频函数，每个BIMF中心频率不同且具有有限带宽。VMD通过指定预设尺度K将复杂信号分解为K个限带本征模态函数，分解的约束条件是所有模态函数对应的估计带宽之和最小。VMD算法首先构造变分约束问题，并通过拉格朗日乘子法将约束问题转化为无约束问题，最后通过ADMM乘子交替方向算法进行求解。

VMD包含三个超参数设置，即限带本征模式函数(BIMF)数量K、有限带宽参数α和中心角频率的初值。通过估算，可以得到K个中心角频率ω_k，然后由中心角频率ω_k计算出各个模态函数u_k(t)，每个本征模态函数被定义为一个调幅调频信号，表示为：

其中：包络线A_k(t)为u_k(t)的瞬时幅值，并且A_k(t)≥0；ω_k(t)为u_k(t)的瞬时频率，

并且ω_k(t)≥0；A_k(t)和ω_k(t)相对于相位/>

是缓慢变化的；在

的时间范围内，u_k(t)为幅值A_k(t)、ω_k(t)的谐波信号。

估算BIMF带宽(限带宽度)，根据卡森原理(Carson’s formula)得：

B_AM-FM＝2(Δf+f_FM+f_AM)

其中：Δf表示瞬时频率最大偏移；f_FM表示调频信号最高调制频率；f_AM表示包络线A_k(t)的最高频率。

VMD算法的目标是通过构造并求解约束变分问题将原始信号分解为K个BIMF分量，变分问题构造过程如下：

第一步：对每个BIMF模态信号u_k(t)，通过希尔伯特变换获得信号解析形式，并计算得到相应的单边频谱。

(δ(t)+j/πt)*u_k(t)

其中，δ(t)为单位脉冲函数。

第二步：对每个模态函数都预先估计一个中心频率ω_k，通过指数修正将模态频谱调制到相应得基频带。

第三步：使用高斯平滑(即解调信号梯度的L₂范数)对解调信号进行处理，获取各个BIMF分量的估计带宽，最终构造的约束变分模型如下公式所示：

其中，{u_k}＝{u₁,u₂,…,u_k}表示k个BIMF分量；{ω_k}＝{ω₁,ω₂,…,ω₃}表示各分量的中心频率；*表示卷积运算，

表示函数对时间t的梯度运算。

为了对第三步公式所表示的约束变分模型求取最优解，引入二次惩罚参数α和拉格朗日算子λ(t)，使用Lagrange乘子法，将约束变分问题转换为非约束变分问题，得出增广拉格朗日函数如下：

其中，α为惩罚因子，其可以保证信号的重构精度；λ(t)为拉格朗日乘子；<λ(t)，f(t)-∑_ku_k(t)>表示内积算子。

利用ADMM乘子交替方向算法对参数u_k，ω_k，λ进行迭代更新，求取无约束变分问题的鞍点，即为约束变分问题的最终解。

VMD算法流程如下：

(1)初始化

(2)迭代次数n＝n+1；

(3)for k＝1 to K：

end

end

其中，

表示频域中对应的本征模态函数；/>

表示频域中的Lagrange乘子。

(4)

更新/>

其中，γ为噪声容限参数；一般设定γ＝0，这样可以对原信号中的噪声进行良好的去噪处理。

(5)重复执行步骤(2)至步骤(4)，对于任意给定的精度ε＞0，直到满足如下公式。则终止：

请继续参阅图1所示，本发明实施例中，深度卷积神经网络为一个九层结构，其中，包含3个卷积层，3个池化层，1个用于数据结构变换的数据扁平化层，2个用于数据分类的全连接层，也常称为VmdCnn9模型，每个卷积层包含多个不同的卷积核，用于提取多维BIMF数据网格的不同特征，保证了特征提取的多样性，多组卷积池化层的联合使用，使得最后的高层特征即保留了原始数据的局部特征，又获取了原始数据全局特征。在卷积层之后使用数据扁平化层将卷积网络输出的多维特征进行“压平”，即进行多维特征的一维化，以适应全连接层的故障识别与分类，全连接层输出分类误差，采用误差梯度反向传播算法，实现对整个网络权值的更新。VmdCnn9模型具体描述如下：

首先：将经由VMD处理后所生成的样本集，划分为训练集和测试集，分别记为：

其中，train代表训练，test代表测试；x_i∈R^m×k，m为BIMF分量长度，k为BIMF数量；y_i∈[0，1，......，C]，C为故障类别数。

其次：构建模型，如图1所示左侧虚线框表示用于特征学习的卷积网络，右侧虚线框表示用于故障诊断的分类器网络，相应公式为：

对于用于故障诊断的分类器，其公式表达为：

其中k＝0,1,……C为故障类别；对于任意给定的振动子序列，最后输出的故障类别标签为：

然后，优化目标函数，在振动序列训练数据集上构造交叉熵函数作为优化目标函数：

在优化目标函数的过程中，后两项为正则项，详细描述为：

最后，求解对于VmdCnn9模型中的全连接网络使用梯度下降法，采用反向传播公式对网络中的参数进行求解。但在卷积神经网络部分，使用反向传播算法时，由于存在卷积层向池化层传递误差和池化层向卷积层传递误差公式，所以需要对这两部分误差传递进行建模。首先，建立深度卷积神经网络相关参数更新公式：

为对深度卷积神经网络中隐藏层(即卷积层和池化层部分)偏导数求解，使用如下符号***，本发明实施例中假定输入数据维度为1200×9，其公式为：

其中，

表示第一个隐藏层(卷积层Conv1)；/>

表示第二个隐藏层(最大池化层Pooling1)；l＝1,2,……16表示隐藏层中的第l个卷积核；/>

表示对3×3的矩形区域进行池化，池化间隔为3×3。

其中，

表示第三个隐藏层(卷积层Conv2)；/>

表示第四个隐藏层(最大池化层Pooling2)；s＝1,2,……8表示隐藏层中的第s个卷积核；/>

c^10×1表示对10×1的矩形区域进行池化，池化间隔为10×1。

其中，

表示第五个隐藏层(卷积层Conv3)；/>

表示第六个隐藏层(最大池化层Pooling3)；p＝1,2,3,4表示隐藏层中的第p个卷积核；/>

c^5×1表示对5×1的矩形区域进行池化，池化间隔为5×1。

其中，h⁷表示第七隐藏层(数据扁平化层Flatten)。

其中，h⁸表示第八隐藏层(第一个全连接层)；h⁹是使用Softmax进行分类的输出层。

目标函数，即关于第八隐藏层误差反向传播梯度为：

其中，r＝1,2,3,4,5,6,7,8；与之对应的参数更新公式为：

其中s＝1，3，5，8。

而深度卷积神经网络的参数如表1深度卷积神经网络参数所示(表中采用数据边界扩展方式，即same卷积运算，保证数据经卷积运算后相对维度保持不变)。

表1深度卷积神经网络参数

在神经网络训练过程中，网络参数的更新策略会对网络训练性能产生影响，Adam算法是一种能够替代传统随机梯度下降法的优化算法，能够根据训练数据迭代更新网络参数，即Adam算法通过计算梯度的一阶矩和二阶矩估计为不同参数设置自适应学习率。因此，在VmdCnn9模型中，采用Adam算法动态调整网络参数的学习率。

其中，卷积神经网络(Convolutional Neural Networks，CNN)属于深层前馈神经网络模型，是近年来发展起来的一种高效特征识别方法，是用来处理类似网格结构数据的神经网络，最初用于解决图像识别问题，但是随着卷积网络模型的成熟，其在人脸识别、语音识别、智能控制、医学诊断等多个领域的研究与应用均取得了重要进展。通过对生物的视觉神经***研究发现，视觉***对图像的识别并不是按照逐像素进行的，而是按照局部特征到全局特征的方式进行，即通过视觉***获取图像的局部特征，并由大脑对局部特征进行汇总与综合，最终完成图像的识别，在这一过程中，视觉***只对图像的局部特征进行提取，而忽略全局信息。CNN网络模拟了生物的神经***，通过使用稀疏连接构建目标图像特征感知的空间局部感受野(local perceptual field)，这一过程充分利用了图像空间局部相关性特点。当使用CNN网络进行振动信号故障诊断时，稀疏连接的目的是构建振动信号的时间局部感受野，这一方式充分利用了时间序列信号的时间局部相关性特点。由于在输入和输出信号之间采用了稀疏连接，使得神经网络模型的参数规模得到极大降低。

而卷积网络一般由多组卷积层和池化层堆叠构成，前一层的输出作为后一层的输入，逐级提取更加抽象化的有效特征。在振动信号处理中，将振动信号视为在时间轴上有规侓采样形成的一维数据网格，其经由VMD分解后构成多维数据网格。一个卷积层中包含多个不同的卷积核，这些卷积核对振动信号的各本征模态信号的局部特征进行观察，从而保证所提取特征的多样性，每个卷积层通过池化层中的降采样对特征数据进行聚合，减少了下一层数据节点数量，也促使了局部特征向全局特征的不断抽象。CNN池化层中一般采用最大池化算法(max pooling)，即对固定窗口长度内的节点选取最大值进行输出。最后通过全连接网络对CNN提取的多个特征进行综合和区分，实现故障的精确分类。

卷积流是卷积神经网络的基础构成模块，包括卷积(一般使用多个卷积核对数据进行维数扩展，用于提取数据多样化特征)、池化(用于进行特征类型聚合)、非线性激活函数(通过对数据非线性变换提升数据的表征能力)和归一化操作(主要为优化操作，加快训练过程中的收敛速度，避免陷入局部最优)。而卷积层是卷积神经网络的核心，也称为特征提取层，其是卷积神经网络与传统神经网络相互区别的重要特征之一，CNN网络的主要计算量集中在卷积层。卷积层使用多个固定尺寸的卷积核与上一层的输出数据进行卷积运算，从而得到多个不同的特征激活图。当输入数据与卷积核特征相似时，卷积运算就会对原始输入数据进行增强，反之，则对原始输入数据进行抑制。CNN网络通过训练自适应调节卷积核的参数，从而实现面向故障诊断结果的最优振动数据特征的提取。

在振动信号处理中，卷积相当于一种线性滤波方法，卷积运算可以通过卷积核参数的不同分布形式实现振动信号的增强、抑制、降噪、偏移、带通等效果。卷积核等效为使用一个权值矩阵表示一个振动向量与其时间邻域内多个向量之间的关系。当卷积核中各元素的相对差值较大时，可以突出当前时刻振动向量与时间邻域向量的差别，实现特征增强效果；而当这种相对差值较小时，相当于对当前时刻振动向量与时间邻域向量进行平均，可以实现降噪功能。由于振动信号的信息密度相对较低，在构造深度卷积神经网络时，初始卷积层的卷积核尺寸一般相对较大，并且随着网络层数的增加而逐渐减小，其效果相当于使用窗口函数对振动信号进行卷积运算，以提取振动信号的短时特征，由于这种窗口函数是CNN网络面向诊断结果通过自适应学习而得到的，即一种由果及因的方法，因此其所提取的振动特征具有有效性。

卷积运算是一种线性运算，其首先让卷积核沿着振动信号的时间轴做横向移动，并在每个移动位置与相应的输入振动向量做卷积运算，当卷积核在一个时间序列移动完毕后，就可以得到一个新的振动特征激活图，其值为卷积核在输入数据不同时间点的响应。卷积核沿时间轴移动的距离称为步长(stride)，卷积核和步长的尺寸共同决定了特征激活图的大小。

卷积运算一般包括三种类型，即full卷积、same卷积和valid卷积。假设输入信号为振动传感器采集到的一维信号，即x∈Rⁿ，相应卷积核也是一维的，即卷积核ω∈Rⁿ，则有：

full卷积，full卷积是卷积核与输入数据在初始相交位置开始计算卷积，其需要对输入数据进行边界扩展，即对原始输入数据边界扩展0值，0值数量为2×(|ω|₀-1)，|ω|₀为卷积核长度。full卷积计算公式如下：

其中，t＝1，2，…，n+m-1；conv表示x与ω进行卷积。

same卷积：same卷积是卷积核中心与输入数据在初始相交位置开始计算卷积，其需要通过0值填充方式对输入数据边界进行扩展，0值数量为

表示不超过χ的最大整数。same卷积计算公式如下：

y＝conv(x，ω,′same′)＝center(conv(x，ω′，full′)，n)∈Rⁿ

same卷积公式返回的结果为full卷积中与输入信号x∈Rⁿ尺寸相同的中心部分。

valid卷积：valid卷积是卷积核完全位于输入数据内部初始位置开始计算卷积，其无需对输入数据进行边界扩展。valid卷积计算公式如下：

其中，t＝1，2，...，n+m-1；n＞m。

卷积运算通过稀疏连接(sparse connectivity)、参数共享(parameter sharing)和等变表示(equivariant representations)三个重要的方法对机器学习***进行改进。

传统神经网络每一层输入输出之间的关系通过矩阵乘法进行建立，其中矩阵中的每一个独立元素都建立了一个输入向量元素与输出向量元素之间的映射关系。而卷积神经网络具有稀疏连接特性，使得卷积核大小远远小于输入向量长度。例如当输入向量的维度为m，输出向量的维度为n，在全连接神经网络中矩阵的参数个数为m×n，相应算法的时间复杂度为O(m×n)。在CNN网络中使用稀疏连接可以将每个输出向量元素的连接数限制为k个，那么稀疏连接方式只需要k×n个参数并且运算的时间复杂度为O(k×n)。实际应用中，当k＜＜m时，就能保证CNN网络良好地完成机器学习任务。

请参阅图4所示，在全连接中稀疏连接的图像化解释，在全连接中，每个输出元素都受所有输入元素的影响，输出由矩阵乘法产生，输入输出之间的连接不是稀疏的。

请参阅图5所示，而在稀疏连接中，当输出元素是由卷积核宽度为3的卷积产生时，每个输出元素只受3个输入元素的影响。

请参阅图6所示，在深度卷积神经网络中，处于网络深层的神经元与处于浅层的神经元以间接方式进行交互，位于深层网络中的神经元比浅层神经元的接受域更大。当卷积网络中包含卷积步长参数和池化层之类结构时，这种接受域会变得更大，这使得在深度CNN网络中，神经元之间的直接连接是稀疏的，但是位于深层的神经元可以间接获取大部分或者全部的输入信息。

请参阅图7所示，各种神经元之间连接方式的对比，图7a分别为全连接类型、图7b为局部连接和图7c为参数共享连接时的连接结构。从图中可知全连接参数为15个(不含偏置)，局部连接为7个，权值共享连接为3个。由此可见，权值共享连接能够极大减少网络连接参数数量。具体而言，参数共享是卷积层中的卷积核使用相同的参数设置并在输入数据上重复使用，而传统的神经网络，权重矩阵的每个参数值只使用一次。在卷积神经网络中，卷积核通过移动方式与输入向量每一个位置的元素进行计算(输入的边界元素处理方式取决于所采用的卷积运算类型)，这样就保证了卷积运算只需要学习一个参数集合，而不是对输入数据的每个元素都单独学习一个参数集合。从运算的时间复杂度上看，卷积运算的前向传播时间仍然为O(k×n)，但是从存储效率上看，这种方式把存储需求降低到k个参数(k＜＜m)。

因此，在轴承故障诊断中，使用VMD方法将振动信号分解为多维BIMF矩阵，将多维BIMF矩阵输入到卷积网络中，卷积层的输出是对多维BIMF局部特征的观察结果，它通过引入局部稀疏连接与参数共享机制，约简了不必要的权值连接，而权值共享策略极大的减少了参数数量，并有效的避免过拟合现象的发生。

卷积神经网络中的参数共享机制使得神经网络层具有等变表示性质，等变表示定义为：若函数f(x)与g(x)满足f(g(x))＝g(f(x))，则称函数f(x)对于函数g(x)具有等变性。在卷积运算中，如果令g表示任意平移函数，f表示卷积函数，那么卷积函数对于平移函数具有等变性。在处理振动时间序列时，如果输入序列中的某个特征在时间上延后出现，其在输入中仍有完全相同的表示，但是在时间上具有滞后性。因此使用卷积核对振动时间序列进行处理，可以学习到鲁棒性较高的数据特征。

请参阅图8所示，对数据进行池化，池化在本发明中相当于降采样操作，它在一个小区域内以一个指定的值作为这个区域的输出值，从而实现数据特征的聚合，降低特征的空间维度并保证了数据某种程度的平移不变特性。数据通过池化操作约减了下一层数据的输入维度，使得对应的参数数量有效降低，降低了过拟合风险。池化操作包括最大池化、平均池化、范数池化和对数概率池化等，其中最大池化比较常用。其中，池化半径为2x2，滑动窗口步长(Stride)为2x2，属于无重叠最大池化。在实际构建池化层时，需要设定这两个参数。

请参阅图9所示，在滚动轴承信号识别中，采用最大池化方法进行特征聚合，多维BIMF矩阵经过卷积运算后，然后进行池化操作，池化层中P1的输出是选择C1和C2的最大值作为输出值，故而池化层的目的是进行数据降维，因此可以减少模型输出节点数，控制模型计算量。通过在若干节点中选择最大值进行输出，增加了模型与振动频谱特征的鲁棒性。设窗口尺寸为P，移动步长为F(P,F为正整数)，则池化后的输出为：

y_i＝max(x_F×i+j)j∈[1，P]

请参阅图10所示，显示出了非线性Sigmoid函数和Tanh函数的图形，这类函数对输入数据中央区域产生较大增益，而对两侧区域产生较小增益。在神经网络中，该类函数是将重点特征向中央区域集中，而将非重点特征区域推向两侧。而激活函数是用于实现神经网络层级之间的非线性映射，通过使用激活函数使得整个网络对特征的非线性刻画能力得到提高。若神经网络缺少非线性函数，则层级间为线性映射，这种情况下即使使用更多的层级组合，仍然是一种线性组合，会使得整个网络对数据的高层语义特征的挖掘能力受到限制。在实际应用中，常用激活函数有Relu(Rectified Linear Unit)函数、Softplus函数、Tanh函数、Sigmoid函数等。对应的公式如下：

Relu(x)＝max(0，x)

Softplus(x)＝ln(1+e^x)

请参阅图11所示，显示了Relu函数和Softplus函数的图形，其中Relu函数具有激活边界宽阔、单侧抑制和稀疏激活特性(对于小于0的输入则完全没有激活)；而Softplus函数只具有宽阔的激活边界和单侧抑制两点特性。当输入数据的值比较大时，Sigmoid和Tanh在该点的导数值会变得很小，当网络层数增加时，利用反向误差传播算法更新权值，会导致误差无法传播，产生梯度弥散现象。Relu函数在输入数据值大于0时，其导数值为1，使得梯度弥散现象得以解决，所以在深度学习中使用比较简单的且计算速度更快的Relu一般更为有效。

请参阅图12所示，在使用深度卷积神经网络进行滚动轴承故障诊断时，需要在卷积网络之后连接一个全连接层，并使用Softmax解决多分类问题。全连接层相当于一个单层全连接前馈神经网络，对应的表述为：

和b⁽²⁾∈R^k分别为隐藏层到输出层的权值连接矩阵和偏置；/>

和/>

为非线性激活函数。

全连接神经网络使用Softmax分类器进行分类，该函数将多个标量所代表分类结果映射为和为1的概率分布，并依概率分布判定数据所属类别。假设训练集中样本数据为x，相应类别标签为y，则样本判断为某个类别的概率为p(y＝j|x)。所以对于K类分类器，输出为一个K维向量，如下所示：

其中：θ₁，θ₂，...，θ_k∈Rⁿ⁺¹为模型参数；

为归一化函数，用于归一化概率分布，使得满足所有概率之和为1的要求。

在训练神经网络的时候，采用有监督训练方式和反向传播算法进行训练，利用梯度下降法，通过多次迭代使得损失函数Loss最小化，进而完成网络训练。

本例中，采用交叉熵函数作为损失函数，交叉熵函数公式如下：

式中，C为数据标签数；y_i为数据标签；f(xi)为Softmax函数；

为依据网络参数生成的正则化约束项，以防止数据过拟合。

请参阅图13所示，图中13a是原神经网络也就是标准神经网络连接，右边图13b是经Dropout处理后的神经网络，在全连接层中一般会使用Dropout方法。Dropout是一种抑制数据过拟合的方法，可以尽量避免隐藏层神经元相互耦合而导致提取到重复特征。本质上，Dropout是在神经网络前向传播过程中，让某些神经元以一定的概率P停止工作，即将隐藏层神经元的输出值按照概率P随机置零，这些神经元不再参与训练过程，这将导致在测试过程，神经元的输出值按Dropout比例值减少，保证了测试神经网络的均衡性。Dropout的实现公式如下：

r^l～Bernoulli(P)

y^l＝r^l·y^l

其中，r^l是由Bernoulli函数生成的一个概率为P的[0，1]值随机向量；

r^l·y^l表示将隐藏层神经元的输入随机设置为零，间接地使得这些神经元不参与网络训练，因此其对神经网络的反向传播中的损失函数也不产生影响。而在测试过程中，所有神经元都参与运算，但是网络中神经元的输出按照dropout比例缩减，使得网络均衡性得到保持。

在本发明实施例中，以美国凯斯西储大学提供的轴承振动测试开放数据集进行实验分析，该数据集一般被认为是检验滚动轴承故障诊断方法的基准。近年来，滚动轴承故障诊断方法发展较快，为了衡量各种算法的优越性，比较客观的方式是使用第三方标准数据进行比较。指出截止到2015年为止，在故障诊断领域国际顶级期刊《MechanicalSystemsand Signal Processing》就有41篇关于故障诊断的论文使用了CWRU提供的数据，故本文所有实验均以CWRU滚动轴承数据为基准，对所提滚动轴承故障检测方法进行实验分析与检验。

请参阅图14所示，1是感应电机，2是振动传感器，3是联轴器，4是扭矩传感器，5是负载，6是风扇端，7是驱动端，8是驱动端轴承，本发明实施例中，CWRU滚动轴承实验装置，该装置包括一个三向感应电动机(2HP)，右侧是能够产生额定负载的测力计，两者通过扭矩传感器连接，电机驱动端安装待测试轴承，振动传感器安装在电机驱动端上方。该实验中电动机轴承采用SKF6205-2RSJEM型轴承，在内轴承、滚动体、外轴承上使用电火花加工方式(Electro-Discharge Machining，EDM)以人为方式分别制造单点故障缺陷，缺陷直径尺寸为0.1778mm，0.3556mm，0.5334mm(对应不同的损伤程度：轻微损伤，中度损伤，重度损伤)，缺陷深度均为0.2794mm，每种故障分别在负载为0w，1492w，2338w，2984w负载(对应转速分别为1797r/min，1772r/min，1750r/min，1730r/min)工况下进行实验，振动信号采样频率f＝12KHz。

具体而言，本发明实施例中采用变工况、不同故障位置及损伤程度数据为40种，划分为10个类别，包括1类正常振动数据和9类轴承故障振动数据(包含变负载、变转速情况下不同位置及不同损伤程度的各类故障，故障类型与工况变化无关，即以故障位置以及损伤程度为故障分类依据。)，如下表2所示，把原始振动数据按照公式n＝f/(ω/60)(f为采样频率，ω为转速，单位rpm)，计算出每个周期内约采样400个数据点。将原始振动数据按照长度1200个时间点(即3个周期采样长度)窗口大小，窗口移动步长为1200个时间点的方式生成样本集合，10类数据共生成4044个样本，对每个样本进行类别归属划分，形成<数据，标签>格式的样本集，从中随机选择3/4作为训练样本，剩余的1/4作为测试样本，每个样本为包含1200个数据的向量。

表2滚动轴承振动数据及类别标定

具体而言，本发明实施例中，以Google公司提供的深度学习框架Tensorflow为基础对所提深度卷积模型进行构建，计算机配置为CPU i77700，16G内存，显卡采用nVidiaGeforce GTX 1700Ti。在Wndows10操作***上使用Python编程，并配置nVidia公司的cudn和cuDnn库以支持GPU并行计算，提高计算效率。训练数据经过预处理及VMD处理后，对所构建的模型进行训练，包括计算目标函数值及更新模型参数值，最后使用训练好的模型对测试振动数据进行故障诊断。

请参阅图15所示，数据处理流程图及VmdCnn9模型的训练使用，使用训练数据集对VmdCnn9深度卷积神经网络训练时，采用随机方式对网络参数进行初始化，参数优化Adam算法的学习率设置为0.01，对参数更新的数据批量BatchSize为200，对所有数据共进行100轮训练。

请参阅图16所示，将经过VMD处理的多维BIMF子序列训练样本集输入到所设计的深度卷积神经网络，经过多次迭代后故障分类准确率最高为100％，模型准确率随训练次数的变化而变化，所设计的深度卷积神经网络经过6次训练后，准确率超过98％，说明所设计的深度卷积神经网络具有很快的收敛速度，且在训练过程中，准确率波动较小，说明VMD与深度CNN相结合的方法能够有效地识别滚动轴承在变工况情况的故障类别和损伤程度的故障诊断，具有良好的鲁棒性。

请参阅图17所示，在本发明实施例中，为了进一步了解所设计的深度CNN对轴承故障数据特征提取的方式，从10种样本数据中各随机选取一个样本作为网络输入，对经过Conv1，Pooling1层处理后的数据进行特征可视化，可得结果如图17a所示鼓掌0卷积池化结果，图17b所示故障1卷积池化结果，图17c故障2卷积池化结果，图17d为故障3卷积池化结果，图17e故障4卷积池化结果，图17f故障5卷积池化结果，图17g故障6卷积池化结果，图17h故障7卷积池化结果，图17i故障8卷积池化结果，图17j故障9卷积池化结果。对各类别数据的特征图进行比较能够发现，同一卷积层中不同卷积核对同一类别数据的特征提取具有显著差异性，每个子图代表16个卷积核对振动数据特征效果，每个卷积核所提取的400个特征点呈现规律性层次排布，表明卷积层对振动数据的特征提取具有差异性和多样性。比较10种振动类别数据特征提取效果，可以发现不同类别振动数据特征差异明显(卷积池化后序列值的值域，由卷积值构成的序列形状均具有明显差异)，这表明卷积核所学习到的参数在特征提取上是有效的。

请参阅图18所示，本发明实施例中，在使用VMD对振动序列进行限带本征模式分解时，不同的模态分解数目会对卷积网络的故障分类性能产生影响，进一步地，针对这些不同影响，分别将原始振动子序列以及VMD模态分解数目设置为3、5、7、9、11、13、15个的BIMF序列矩阵作为神经网络的输入，在相应的训练过程和模型在测试集上的性能。当使用原始振动子序列作为输入时，由于其为一维数据网格，将所设计的卷积神经网络进行调整(第一卷积层卷积核调整为30X1，池化层调节为3X1形式)以适应输入数据。在训练集上，分类准确率随训练次数变化情况，不同模态分解数目对应准确率变化曲线标定为vmd-n，n为模态分解数目。从图中可以看出，直接使用原始振动子序列对神经网络进行训练，准确率收敛相对较慢，存在准确率不稳定现象(即出现随训练次数变化，准确率出现较大波动的情况)。此外vmd-5准确率也出现大的波动，而vmd-11，vmd-13，vmd-15的准确率也存在一定幅度的波动。卷积神经网络在训练集上的分类最终准确率和测试集上的准确率如表3所示，可以看出网络对于原始振动子序列的分类，在训练集和测试集上效果较差，而在其它BIMF分解数量下，网络在训练集上的准确率相差不大，但在测试集上BIMF为9时，网络表现出良好的泛化能力(训练集上准确率为100％，而在测试集上为99.87)，故本发明实施例中选择BIMF数为9作为所设计的卷积神经网络的输入。

表3不同数量BIMF对准确率影响表3不同数量BIMF对准确率影响

请参阅图19所示，在深度卷积神经网络的训练过程中，使用梯度下降法对损失误差反向传播进行网络优化，网络的权值参数、误差的收敛会受到网络学习率这一参数的影响，为了选择合适的学习率，在保持网络其它参数不变的情况下，选择不同的学习率对神经网络进行训练的影响。不同学习率对深度CNN训练的影响中可以发现，学习率太大或者太小会使得损失值变大，准确率降低。选择合适的学习率能够加快网络收敛速度，提高网络分类准确率，依据上述实验结果，本例中选择学习率为0.007。

请参阅图20-21所示，使用样本数据对深度卷积神经网络进行训练时，需要根据样本数据更新网络权重参数，每次更新参数所选用的样本数量称为BatchSize，BatchSize用于将样本平均分成大小不同的数据子集，不同大小的BatchSize会对神经网络的训练产生影响，本实验中选择不同大小的BatchSize对网络进行训练，在其它参数相对不变的情况下，网络训练情况中可以看出当BatchSize较小的时候，网络最终的损失值较大，而分类准确率较低，但是随着训练批次的增大，准确率也出现下降趋势。而且在随着不同BatchSize对训练时间的影响，随着训练批次的增加，网络的训练时间成递减趋势。综合损失值、准确率及训练时间因素，选择BatchSize＝200作为所设计深度卷积神经网络的训练批次数。

为了说明所提滚动轴承故障检测方法的优势，使用该方法同其它轴承故障检测方法进行对，各种方法均以本发明实施例中数据样本为基准，是在变工况情况下实现故障类别和故障程度的检测。

轴承故障检测传统方法主要包括特征提取与故障识别两个主要过程。将本发明实施例中所提方法与传统的方法，如PCA+SVM，EMD+SVM，小波包络谱特征+IPA-SVM，VMD+排列熵等方法进行对比，实验结果如表4所示。其中基于PCA+SVM的效果最低，因为PCA本质上是线性处理方法，在处理非线性问题能力不足。当使用EMD对振动信号进行自适应分解，使用IMF作为SVM分类器的输入时，其分类效果优于以小波包络谱为特征的故障诊断方法。VMD、EEMD和排列熵相结合的方法对故障诊断结果相对较好，分类准确率分别达到了93.6％和92.83％。而VMD与深度卷积神经网络在变工况情况下，故障诊断准确率达到了99.87％，这是因为VMD对振动信号进行了分解，实际上是对振动信号进行了不同幅频特性分离，结合深度卷积神经网络自适应特征提取与特征抽象能力以及全连接网络的强大分类能力，使得分类准确率接近100％。本实验中，对神经网络的构建基于Tensorflow框架，采用I7-7700k处理器(4核心)，16G内存，nvidia 1070显卡，在训练过程中采用GPU计算，在训练集上对网络进行训练，所需时间约为100秒，而在1011个测试样本上进行测试，所需时间约为几百毫秒，故所提方法适用于实际工程中机械设备基于振动信号的故障诊断。

表4不同故障诊断方法的性能

请参阅图22所示，使用上述数据中的样本集，在最大限度保持神经网络参数前提下(采用同样的训练次数、激活函数和损失函数)，将所设计的深度卷积神经网络(VmdCnn9)同三层卷积神经网络(VmdCnn-3)，五层卷积神经网络(VmdCnn-5)、两层全连接神经网络(fullnet-2)，三层全连接神经网络(fullnet-3)，五层全连接神经网络(fullnet-5)进行对比，训练集上模型准确率随训练次数变化情况，由图可得在训练集上，卷积神经网络具有收敛速度快，准确率高且稳定的特点，三种卷积神经网络在训练集上的准确率相差不大。全连接神经网络的准确率相对较低，且收敛速度慢。对于全连接神经网络，提高网路层数可以提高网络分类准确率，但训练效果仍不及卷积神经网络。如表5所示，显示了不同网络在训练集上的所需训练时间和测试集上的准确率，从表中可以看出，全连接神经网络在训练时间较卷积神经网络增加了一个数量级，说明了全连接神经网络比卷积神经网络模型规模大的多，不同层数的卷积神经网络训练时间相差不大，且9层卷积神经网络在测试集上的准确率最高，泛化能力强，故本发明实施例中选择9层的卷积神经网络。

表5不同类型神经网络的性能

至此，已经结合附图所示的优选实施方式描述了本发明的技术方案，但是，本领域技术人员容易理解的是，本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下，本领域技术人员可以对相关技术特征做出等同的更改或替换，这些更改或替换之后的技术方案都将落入本发明的保护范围之内。

以上所述仅为本发明的优选实施例，并不用于限制本发明；对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于VMD与深度卷积神经网络的滚动轴承故障诊断方法，其特征在于，包括，

步骤1：对滚动轴承采集原始振动数据；

u_k(t)＝A_k(t)cos(φ_k(t))

其中：包络线A_k(t)为u_k(t)的瞬时幅值，并且A_k(t)≥0；ω_k(t)为u_k(t)的瞬时频率，ω_k(t)＝φ’_k(t)，并且ω_k(t)≥0；A_k(t)和ω_k(t)相对于相位φ_k(t)是缓慢变化的；在[t-δ，t+δ]的时间范围内，其中，δ＝2π/φ’_k(t)，u_k(t)为幅值A_k(t)、ω_k(t)的谐波信号；

估算限带本征模式函数带宽，根据卡森原理得：

B_AM-FM＝2(Δf+f_FM+f_AM)