CN113609933B

CN113609933B - 一种基于后缀树的故障检测方法、***、装置及存储介质

Info

Publication number: CN113609933B
Application number: CN202110823447.9A
Authority: CN
Inventors: 岳夏; 王亚东; 张春良; 翁润庭; 朱厚耀; 李植鑫; 陆凤清
Original assignee: Guangzhou University
Current assignee: Guangzhou University
Priority date: 2021-07-21
Filing date: 2021-07-21
Publication date: 2022-09-16
Anticipated expiration: 2041-07-21
Also published as: CN113609933A

Abstract

本发明公开了一种基于后缀树的故障检测方法、***、装置及存储介质，方法包括：获取第一故障信号，并通过后缀树算法对第一故障信号进行分解，得到故障重复波形和重复时间序列；根据故障重复波形和重复时间序列确定第一故障信号的第一时频特征图，并根据第一时频特征图构建训练图片集；将训练图片集输入到预先构建的卷积神经网络中进行训练，得到训练好的故障识别模型；获取待检测的第二故障信号，并通过后缀树算法确定第二故障信号的第二时频特征图，进而将第二时频特征图输入到故障识别模型，输出得到故障类型识别结果。本发明提高了训练样本的准确性和可靠性，进而提高了故障识别模型的精度和故障检测的准确度，可广泛应用于故障检测技术领域。

Description

一种基于后缀树的故障检测方法、***、装置及存储介质

技术领域

本发明涉及故障检测技术领域，尤其是一种基于后缀树的故障检测方法、***、装置及介质。

背景技术

现如今，对滚动轴承的故障诊断分析大多基于振动信号，而振动信号具有非线性、非平稳性等特点，利用它可获取充分表达信号特征的信息。现有技术中，对于振动信号的处理，一般采用傅里叶变换等进行时频转化方法，例如基于Daubechies小波变换的滚动轴承故障特征提取方法。这种方法在处理过程中会出现混叠现象从而产生误差，且该类误差由傅里叶算法原理产生，不可避免。由于对振动信号的特征提取存在较大误差，因此，现有的关于振动信号的故障检测方法往往并不准确。

发明内容

本发明的目的在于至少一定程度上解决现有技术中存在的技术问题之一。

为此，本发明实施例的一个目的在于提供一种基于后缀树的故障检测方法，该方法通过对故障信号进行分解，获取故障重复波形和重复时间序列两个不同尺度的信息，避免了傅里叶算法的混叠现象产生的误差，提高了训练样本的准确性和可靠性，进而提高了故障识别模型的精度，从而提高了故障检测的准确度。

本发明实施例的另一个目的在于提供一种基于后缀树的故障检测***。

为了达到上述技术目的，本发明实施例所采取的技术方案包括：

第一方面，本发明实施例提供了一种基于后缀树的故障检测方法，包括以下步骤：

获取第一故障信号，并通过后缀树算法对所述第一故障信号进行分解，得到故障重复波形和重复时间序列；

根据所述故障重复波形和所述重复时间序列确定所述第一故障信号的第一时频特征图，并根据所述第一时频特征图构建训练图片集；

将所述训练图片集输入到预先构建的卷积神经网络中进行训练，得到训练好的故障识别模型；

获取待检测的第二故障信号，并通过后缀树算法确定所述第二故障信号的第二时频特征图，进而将所述第二时频特征图输入到所述故障识别模型，输出得到故障类型识别结果。

进一步地，在本发明的一个实施例中，所述通过后缀树算法对所述第一故障信号进行分解，得到故障重复波形和重复时间序列这一步骤，其具体包括：

通过平均分布或高斯分布对所述第一故障信号进行编码得到第一时域信号；

通过后缀树算法对所述第一时域信号进行分解，得到多个故障波形信息和对应的时刻信息，并根据所述故障波形信息和所述时刻信息构建第一后缀树；

对所述第一后缀树的各个节点进行遍历，获取重复出现的故障波形信息作为故障重复波形，并确定所述故障重复波形的重复时间序列。

进一步地，在本发明的一个实施例中，所述对所述第一后缀树的各个节点进行遍历，获取重复出现的故障波形信息作为故障重复波形，并确定所述故障重复波形的重复时间序列这一步骤，其具体包括：

从所述第一后缀树的根节点开始，通过深度优先的嵌套遍历算法对所述第一后缀树的各个节点进行遍历；

获取重复出现的故障波形信息作为故障重复波形，并确定所述故障重复波形对应的多个时刻信息；

根据所述故障重复波形对应的多个时刻信息确定所述故障重复波形的重复时间序列。

进一步地，在本发明的一个实施例中，所述故障检测方法还包括以下步骤：

获取超过预设的重复次数阈值的故障重复波形的最大重复长度，当所述最大重复长度大于等于预设的长度阈值且残差编码的次数小于等于预设的编码次数阈值，对残差编码的参数进行更新后再进行残差编码和信号分解。

进一步地，在本发明的一个实施例中，所述根据所述故障重复波形和所述重复时间序列确定所述第一故障信号的第一时频特征图，并根据所述第一时频特征图构建训练图片集这一步骤，其具体包括：

根据预设的重复长度范围，对所述故障重复波形和所述重复时间序列进行归一化处理，得到所述第一故障信号的第一时频特征图；

根据所述第一时频特征图确定训练样本；

获取所述第一故障信号的故障类型，根据所述故障类型生成故障类型标签；

根据所述训练样本和所述故障类型标签构建训练图片集。

进一步地，在本发明的一个实施例中，所述将所述训练图片集输入到预先构建的卷积神经网络中进行训练这一步骤，其具体包括：

将所述训练图片集输入到所述卷积神经网络，得到故障预测结果；

根据所述故障预测结果和所述故障类型标签确定训练的损失值；

根据所述损失值对所述卷积神经网络的参数进行更新。

进一步地，在本发明的一个实施例中，所述卷积神经网络包括输入层、低隐层、全连接层以及输出层，所述低隐层由多个卷积层和多个池化层交替组成。

第二方面，本发明实施例提出了一种基于后缀树的故障检测***，包括：

信号分解模块，用于获取第一故障信号，并通过后缀树算法对所述第一故障信号进行分解，得到故障重复波形和重复时间序列；

训练图片集构建模块，用于根据所述故障重复波形和所述重复时间序列确定所述第一故障信号的第一时频特征图，并根据所述第一时频特征图构建训练图片集；

故障识别模型训练模块，用于将所述训练图片集输入到预先构建的卷积神经网络中进行训练，得到训练好的故障识别模型；

故障类型识别模块，用于获取待检测的第二故障信号，并通过后缀树算法确定所述第二故障信号的第二时频特征图，进而将所述第二时频特征图输入到所述故障识别模型，输出得到故障类型识别结果。

第三方面，本发明实施例提供了一种基于后缀树的故障检测装置，包括：

至少一个处理器；

至少一个存储器，用于存储至少一个程序；

当所述至少一个程序被所述至少一个处理器执行时，使得所述至少一个处理器实现上述的一种基于后缀树的故障检测方法。

第四方面，本发明实施例还提供了一种计算机可读存储介质，其中存储有处理器可执行的程序，所述处理器可执行的程序在由处理器执行时用于执行上述的一种基于后缀树的故障检测方法。

本发明的优点和有益效果将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到：

本发明实施例获取已知故障类型的第一故障信号，通过后缀树算法对第一故障信号进行分解得到故障重复波形和重复时间序列，然后根据故障重复波形和重复时间序列确定第一时频特征图，进而根据第一时频特征图构建用于卷积神经网络模型训练的训练图片集，训练得到故障识别模型，从而可以根据该故障识别模型对待检测的第二故障信号进行检测识别。本发明实施例通过对故障信号进行分解，获取故障重复波形和重复时间序列两个不同尺度的信息，避免了傅里叶算法的混叠现象产生的误差，提高了训练样本的准确性和可靠性，进而提高了故障识别模型的精度，从而提高了故障检测的准确度。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面对本发明实施例中所需要使用的附图作以下介绍，应当理解的是，下面介绍中的附图仅仅为了方便清晰表述本发明的技术方案中的部分实施例，对于本领域的技术人员来说，在无需付出创造性劳动的前提下，还可以根据这些附图获取到其他附图。

图1为本发明实施例提供的一种基于后缀树的故障检测方法的步骤流程图；

图2为本发明实施例提供的后缀树算法的分解示意图；

图3为本发明实施例提供的叶节点递归调用顺序示意图；

图4为本发明实施例提供的时频特征示意图；

图5为本发明实施例提供的一种基于后缀树的故障检测***的结构框图；

图6为本发明实施例提供的一种基于后缀树的故障检测装置的结构框图。

具体实施方式

下面详细描述本发明的实施例，实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能理解为对本发明的限制。对于以下实施例中的步骤编号，其仅为了便于阐述说明而设置，对步骤之间的顺序不做任何限定，实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。

在本发明的描述中，多个的含义是两个或两个以上，如果有描述到第一、第二只是用于区分技术特征为目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。此外，除非另有定义，本文所使用的所有的技术和科学术语与本技术领域的技术人员通常理解的含义相同。

参照图1，本发明实施例提供了一种基于后缀树的故障检测方法，具体包括以下步骤：

S101、获取第一故障信号，并通过后缀树算法对第一故障信号进行分解，得到故障重复波形和重复时间序列；

具体地，运用传感器采集已知故障类型的第一故障信号f(n)，n为采样点数。单次处理的数据量要求至少包含2个关注信号的完整周期，一般应达到关注特征周期的3～5倍以上，以获取更多的故障重复特征。

进一步作为可选的实施方式，通过后缀树算法对第一故障信号进行分解，得到故障重复波形和重复时间序列这一步骤，其具体包括：

A1、通过平均分布或高斯分布对第一故障信号进行编码得到第一时域信号；

A2、通过后缀树算法对第一时域信号进行分解，得到多个故障波形信息和对应的时刻信息，并根据故障波形信息和时刻信息构建第一后缀树；

A3、对第一后缀树的各个节点进行遍历，获取重复出现的故障波形信息作为故障重复波形，并确定故障重复波形的重复时间序列。

具体地，按照第一故障信号的幅值区间，依照平均分布或者高斯分布按预设编码位数对第一故障信号进行编码。

按照平均分布对第一故障信号进行编码的公式如下：

C₁(n)＝Int[(f(n)-f_1，min)*L_code/(f_1，max-f_1，min)]

按照高斯分布对第一故障信号进行编码的公式如下：

C₁(n)＝Int[IGD((f(n)-μ₁)/σ₁)*L_code]

其中，C₁(n)为n次采样数据对应的第一码带的编码值，也即第一时域信号，Int()为取整函数，L_code为预设的编码位数，f_1,max为第一故障信号的值域最大值，也即第一码带编码时的值域最大值，f_1,min为第一故障信号的值域最小值，也即第一码带编码时的值域最小值；μ₁为第一码带高斯分布均值，σ₁为第一码带的高斯分布方差，IGD为标准正态分布积分概率查表返回函数。

同时获得残差信号R₁(n)：R₁(n)＝f(n)-C₁(n)。

将编码后的C₁(n)进行后缀树重建。后缀树构建过程中遵循三个传递规则：

Relu1：当向根节点root***新后缀时使用。active_node保持为root，active_edge被设置为即将被***的新后缀的首字符，active_length减1。

Relu2：***(Split)一条边并且***(Insert)一个新的节点时，如果该新节点不是当前步骤中创建的第一个节点，则将先前***的节点与该新节点通过一个特殊的指针连接，称为后缀连接(Suffix Link)，在图示中通常以虚线绘制。

Relu3：当从active_node不为根节点root的节点***边时，沿着后缀连接(SuffixLink)的方向寻找节点，如果存在一个节点，则设置该节点为active_node；如果不存在，则设置active_node为root。active_edge和active_length保持不变。

下面对本发明实施例采用的后缀树算法进行介绍。存在一个原始数据列T＝t₁t₂...t_n，其中t_i(1≤i≤n+1)，n为数据长度，欲从t₁到t_n将原始数据依次分解为n+1个不重复子序列，第n+1个子序列为规定的终止符，用‘#’表示。为便于表达，相关符号说明如下：

O：(root)根节点，序列起点，无具体意义；

P：(acitve_piont)活动点，指定活动起始点；

N：(active_node)活动节点，指定某一子节点；

E：(active_edge)活动边，指定序列连接方向；

L：(active_edge)活动长度，指定序列移动的数据量；

R：(remainder)剩余后缀数，指明未连接的后缀的数目；

#：终止符；

Street(T)：最终分解结果。

从根节点O开始，从左到右依次分解原始数据序列，直到产生第n+1个序列。如下式：

STree(T)＝(F_i,f_i,g_i),i∈[1,n]

其中，F_i表示主边序列，f_i表示子边序列，g_i表示数据i的连接方式，包括活动点P和剩余后缀数R的取值。当数据处于t_i(1≤i≤n)位置时，通过如下传递方式，完成各条边的连接。

1)i＝1时

P₁＝(O,'F₁',1)，R＝1。起始位置选定根节点O；活动边E设为‘F₁’；活动长度L和剩余后缀数R设置为1，表明只需传入一个数据量。STree(T¹)＝(F₁,g₁)。

2)i>1时

①

即t_i为STree(T^i-1)后新出现的数据，设置P_i＝(O,'F₁',i)，R＝i。直接连接在全部主边之后，从F₁开始迭代更新P_ik＝(O,'F_k',i-k+1)，其中k表示主边数目，k∈(0,i]，k＝k+1,R＝R-1，直至i＝k，停止更新P_ik。在对已有边进行延展后，创建一个新的主序列F^k+1，以根节点O作为起始点，以t_i作为其第一条边。STree(Tⁱ)＝(F_i,g_i)。

②t_i∈T^i-1，即t_i已经在前缀中出现，被视为重复数据。从主链F₁的第一个数据t₀开始，寻找与t_i重复的数据出现的位置，取j表示边长L。设置P_i＝(O,'F₁',j)，R＝1。由于未知t_i+1的数据特点，暂时只能取定活动点P_i和剩余后缀数R，并不能给出具体的数据序列的方向。由j可断定所有前j个主链中均存在与t_i重复的数据，因此，j从1开始，迭代更新P_ij＝(O,'F_j',i-j)，L∈(0,j]，L＝L-1，R＝1，每次更新中，主边续接t_i，R值不变，恒为1，只对t_i这一个数据量进行操作。此步骤可参考规则1，活动点为根节点，活动边设置为新后缀的初始数据，操作一次后，活动边长减1。该过程未创建新边。活动点的更新用于连接后缀数据，不能作为创建新边的标准。

③在第②步的前提下，创建子序列f_i，f_i均以活动点P_ij为起点，从主边F_j中分离，沿用主边F_j的前缀数据。子序列f_i中导入数据同主边F_j一致，将数据t_i续接在序列后即可。

STree(Tⁱ)＝(F_i,f_i,g_i),i<n。

④建立后缀连接(Suffix Link)。重复数据t_i出现后，每一主边均会产生一个或多个子边节点P_Fi，如果该节点不是当前数据***过程中创建的第一个节点P_F1，则将先前***的节点与该新节点通过一个特殊的指针连接，称为后缀连接。

⑤当从N不为根节点O的节点***边时，沿着后缀连接(Suffix Link)的方向寻找节点，如果存在一个节点，则设置该节点为N；如果不存在，则设置N为O。E和L保持不变。

⑥循环上述②-⑤步，直到i＝n时，完成了所有数据的分解。

以‘abcabxabcd’字符串为例，完成字符串的后缀树分解，如图2所示，序号为主从边编号，‘#’为结束符，空心圆表示父节点，三角形编号表示叶节点，箭头表示搜索顺序。

加入终止符后，总共分成11个子串，如下表1所示：

序号	字符串	类
			1	abcabxabcd#	主边
2	bcabxabcd#	主边
			3	cabxabcd#	主边
4	abxabcd#	子边
			5	bxabcd#	子边
6	xabcd#	主边
			7	abcd#	子边
8	bcd#	子边
			9	cd#	子边
10	d#	主边
			11	#	子边

表1

由表1可以清晰看出，原字符串可分解为若干个不重复子串，子串所能携带的信息量也不尽相同。后缀树分解，仅仅是对原数据的处理，完成了数据编码的再编排过程，以牺牲存储量来换取特征数据段的读取时间，完整保留了所有数据信号。

进一步作为可选的实施方式，对第一后缀树的各个节点进行遍历，获取重复出现的故障波形信息作为故障重复波形，并确定故障重复波形的重复时间序列这一步骤A3，其具体包括：

A31、从第一后缀树的根节点开始，通过深度优先的嵌套遍历算法对第一后缀树的各个节点进行遍历；

A32、获取重复出现的故障波形信息作为故障重复波形，并确定故障重复波形对应的多个时刻信息；

A33、根据故障重复波形对应的多个时刻信息确定故障重复波形的重复时间序列。

进一步作为可选的实施方式，通过深度优先的嵌套遍历算法对第一后缀树的各个节点进行遍历这一步骤，其具体包括：

B1、创建与第一时域信号等长的重复时刻存储数组；

B2、创建与第一后缀树的非叶节点数量一致的重复特征记录数组；

B3、运行Depth_First嵌套函数，输入节点编号和父节点重复波形长度，输出重复时刻起始位置、重复波形长度、波形重复次数、节点重复字符串长度以及多个重复时刻；

其中，重复特征记录数组用于存储重复时刻起始位置、重复波形长度、波形重复次数以及节点重复字符串长度，重复时刻存储数组用于存储重复时刻。

具体地，算法伪代码如下：

Depth_First嵌套函数(简写为DF)：

输入：节点编号nNodeID，父节点重复波形长度nFatherNodeRepeatLength；

输出：重复时刻起始位置，重复波形长度nNodeRepeatLength，波形重复次数nWRIndex，重复时刻存储数组(全局变量)；

1：重复波形长度＝当前节点字符长度+父节点重复波形长度

2：记录节点重复时刻起始位置

3：按照节点编号访问该节点的第一个子节点

4：波形重复次数＝0

5：repeat

6：if子节点是非叶节点

7：递归调用子节点DF函数，获取子节点波形重复次数

8：波形重复次数＝波形重复次数+子节点波形重复次数

9：else//子节点是叶节点

10：波形重复次数＝波形重复次数+1

11：将叶节点编号填入重复时刻存储数组

12：end if

13：until所有子节点均已访问

14：return重复波形长度

深度优先算法：

1：创建与待处理信号等长的重复时刻存储数组；

2：创建与非叶节点数量一致的重复特征记录数组，包含如下信息：{重复波形字符串终止地址，节点重复字符串长度，重复时刻起始位置，波形重复次数}；

3：运行DF(根节点编号，0)//父节点重复波形长度为0；

4：获得故障的特征波形与对应重复时间序列的特征。

时频特征提取算法将后缀树算法中创建的节点仅遍历了一次。由于后缀树算法的复杂度为O(n)，所以时频特征提取算法的复杂度同样是O(n)。

下面以abcabxabcd字符串的后缀树结构为例，进一步说明本发明实施例时频特征提取算法的基本原理。

DF函数递归调用顺序如图3所示，依次为DF(0,0)，DF(1,0)，DF(3,2)，DF(4,1)，DF(2,0)，DF(5,0)，DF(0,0)，每条主边中，访问完叶节点均需回到父节点处，等待下一次节点搜索。

根据图2中非叶节点次序完成子序列特征数组，分解结果见表2，表3。

1	2	3	4	5	6	7	8	9	10	11
											a	b	c	a	b	x	a	b	c	d	#
1	7	4	2	8	5	3	9	6	10	11

表2

表2第1行为原字符串‘abcabxabcd’各字符编号，第2行为原字符串，第3行为提取后的重复性特征分解序列，其值对应图2中叶节点编号，也对应值所示采样点的时刻。该数组的存储量与原始数据长度一致，其最后一位始终对应字符串终止符，该位可以省略。

表3

表3中记录了每一个非叶节点的重复特征数组信息，包括重复特征波形终止点，重复特征波形长度ReLen，重复时间特征向量起始点Start_RTV，重复次数RepTimes。为了便于理解，表3中添加了节点编号NUM与节点字符串Node_str。表3中节点编号与节点字符串均与图2中标注一致，均可由后缀树算法直接获取。

进一步作为可选的实施方式，故障检测方法还包括以下步骤：

获取超过预设的重复次数阈值的故障重复波形的最大重复长度，当最大重复长度大于等于预设的长度阈值且残差编码的次数小于等于预设的编码次数阈值，对残差编码的参数进行更新后再进行残差编码和信号分解。

具体地，检验超过预设重复次数波形的最大重复长度，如该长度小于预设值或者残差分析次数i大于预设值则终止分析。如该长度大于等于预设值且残差分析次数i小于等于预设值，则对第i次残差信号R_i(n)继续执行分解。

其中残差编码时参数修正的规则如下：

如果依照平均分布进行编码，则采用下式更新上下限：

如果依照高斯分布进行编码，则：

a)可重新依照平均分布进行残差编码，同样采用上式更新上下限。

b)依然依照高斯分布编码，采用下式更新参数：

μ_i＝0

再利用下式进行残差编码：

C_i(n)＝Int[(IGD((R_i-1(n)-μ_i)/σ_i)-0.5)*2*L_code]

S102、根据故障重复波形和重复时间序列确定第一故障信号的第一时频特征图，并根据第一时频特征图构建训练图片集。

具体地，输出故障特征包含故障重复波形与重复时间序列两个信息。如表3中重复特征波形长度ReLen最大为3，对应重复特征波形终止点W_End为3，因此该特征的波形为表2第2行前3位所示的“abc”，而对应的重复时间序列特征为表2第3行从重复时间特征向量起始点Start_RTV即第1位开始的共重复次数RepTimes的2个序列，即“1,7”。因此重复波形长度为3采样点的故障特征为：

{“abc”，“1,7”}

同理，重复长度为2的特征有：

{“ab”，“1,7,4”}、{“bc”，“2,8”}

重复特征波形与重复时间序列可单独或共同作为故障特征用于后续故障诊断。结合动力学模型，也可将多个重复时间序列的交、并集及其补集等集合运算结果作为故障特征。其中某时刻最大波形重复长度越长意味着该时刻附近更长时间内的数据结构稳定性越好。当干扰近似白噪声时，该时刻的瞬时频率也相对越低。反之某时刻最大波形重复长度越短，意味该时刻数据结构越不稳定，该时刻的瞬时信号也越接近于突变或冲击信号。

进一步作为可选的实时方式，根据故障重复波形和重复时间序列确定第一故障信号的第一时频特征图，并根据第一时频特征图构建训练图片集这一步骤S102，其具体包括：

S1021、根据预设的重复长度范围，对故障重复波形和重复时间序列进行归一化处理，得到第一故障信号的第一时频特征图；

S1022、根据第一时频特征图确定训练样本；

S1023、获取第一故障信号的故障类型，根据故障类型生成故障类型标签；

S1024、根据训练样本和故障类型标签构建训练图片集。

具体地，第一时频特征图的横坐标表示时刻信息，第一时频特征图的纵坐标表示重复波形长度，第一时频特征图的像素点的色彩值表示对应时刻的数据在对应重复波形长度的故障重复波形中的参与程度，从而可以实现第一故障信号的故障特征可视化。

如图4所示为本发明实施例提供的时频特征示意图。将字符串数据类比于故障信号，图4中颜色深浅代表着不同时刻数据在当前重复长度中的活跃程度。第2行“b”字符的对应的色彩值较亮，表示其处很可能存在频率较低的周期性信号。第1行“x”、“d”字符处数值存在低值，表明该时刻信号极不稳定，可能存在冲击等突变信号。第1行2处“a”字符数值也存在低值，但第二行对应位置值反而更大，表示“a”字符对应信号隶属于后续的“ab”字符，在处理数据中不会脱离“ab”单独出现。

后缀树分解后，得到具有时频特征的图像结果。图像中出现的低频凹坑位置，可视为故障件受到冲击的时刻；图像中出现的高频高亮的区域，可视为***的固有振动信号。对于一个旋转***而言，旋转周期小，振动频率高，很难直接判断出图像各色块之间的差异(色块表征为信号时频特征)，因此，本发明实施例引入卷积神经网络，用识别图像的方式识别各类别故障的时频特征图，借以判断具体的故障类型。

后缀树分解完成了对原始故障信号的处理，以图片格式保留了信号的时频信息，并完整保存在本地文件中，便于卷积神经网络的直接输入。在Tensorflow平台中，图片读入后，图像信息转换为矩阵形式的计算数据，便于后续的计算、训练和识别。

将经过后缀树处理后的图片按照故障类型构造训练图片集(用于训练模型，确定参数值)和测试集(预测模型准确率)，并把对应的故障类型作为标签值(用于表达故障类别)，最后把数据导入卷积网络模型中，完成具体的故障类型的识别。在后续的故障检测识别过程中，对于实时采集的数字信号，直接投入到已训练好的网络模型中，进行相应的故障判断。

S103、将训练图片集输入到预先构建的卷积神经网络中进行训练，得到训练好的故障识别模型。

本发明实施例中，采用卷积神经网络完成故障诊断模型的训练。卷积神经网络是一种多层的监督学习神经网络，隐含层的卷积层和池化层是实现卷积神经网络特征提取功能的核心模块。卷积神经网络的低隐层是由卷积层和池化层交替组成，高隐层是全连接层，对应着传统多层感知器的隐含层和逻辑回归分类器。

基础卷积神经网络包括五个部分，输入层，卷积层，池化层，全连接层，输出层。每一层有多个特征图，每个特征图通过一种卷积滤波器提取输入的一种特征，每个特征图有多个神经元。输入层将每一个像素代表一个特征节点输入进来。卷积层由多个滤波器组成，对输入数据进行特征提取，组成卷积核的每一个元素都对应一个权重系数和一个偏差量。

卷积层的参数是由一系列可以学习的滤波器构成的，每个滤波器在宽度和高度上都比较小，输入和数据保持一致。当滤波器沿着图像的宽和高滑动时，会生成一个二维的激活图。

每个滤波器会有一整个滤波器的集合，会形成多个激活图。

(i,j)∈{0,1,...,L+1}

上式中，b为偏差量，Z^l和Z^l+1表示第l+1层的卷积输入和输出，L_l+1为Z^l+1的尺寸，Z(i,j)对应特征图的像素，K为特征图的通道数，f对应卷积核大小，s₀卷积步长，p填充层数。

数据的分布绝大多数是非线性的，引入激励函数，是在神经网络中引入非线性关系，强化网络的学习能力。激励函数让网络的输入数据服从特定的分布：

a.数据分布零均值化，即：通过分布计算得到的均值约等于0。非零均值化的分布可能导致梯度消失或训练抖动。

b.数据分布呈正态分布。非正态分布可能导致算法过拟合。

c.训练过程中，面对不同的数据尺度batch时，神经网络每一层的输入数据分布应自始至终保持一致，未能保持一致的现象叫做Internal Covaraite Shift，会严重影响训练过程。

卷积层中包含激励函数以协助表达复杂特征，其表示形式如下：

上式中，f(z)为表征激活函数，z^l为L为第L层的输出，经激励函数处理后的输出值为A^l。

目前ReLU函数虽存在一些缺点，但使用ReLU也能取得很好的效果。相较于其他激活函数，ReLU有着最低的计算代价和最简单的代码实现。有能力生成零均值分布的激活函数，相较于其他激活函数更优。需要注意的是使用ReLU的神经网络训练和推理都会更慢一些，因为需要更复杂的指数运算得到函数激活值。

池化层对卷积结果进行特征选择和信息过滤，可以有效的缩小参数矩阵的尺寸，从而减少最后连接层的中的参数数量，起到加快计算速度和防止过拟合的作用。池化层包含预设定的池化函数，其功能是将特征图中单个点的结果替换为其相邻区域的特征图统计量。池化层选取池化区域与卷积核扫描特征图步骤相同，由池化大小、步长和填充控制。池化模型的一般表示形式为：

式中，步长s₀、像素(i,j)的含义与卷积层相同，p是预定的参数。类比于向量范数，当p＝1时，池化过程在池化区域内取均值，被称为平均池化(average pooling)；当p＝2时，池化过程在区域内取极大值，被称为最大池化(max pooling)。

全连接层(fully connected layers，FC)在整个卷积神经网络中起到“分类器”的作用。卷积、池化和激活等操作将原始数据映射到隐藏层特征控件，全连接层起到将学到的“分布式特征”映射到样本标签的作用。网络的最后一层作为全连接层的输入。相关公式如下：

Z_j＝W_jX+b_j＝ω_j1x₁+ω_j2x₂+…+ω_jnx_n+b_j

将W_j视为第j类下特征的权重，即每维特征的重要程度，通过对特征加权求和得到每个类别的分数，在经过Softmax函数映射为概率。经过全连接层，获得了K个类别(-∞,+∞)范围内的分数Z_j，为了得到属于每个类别的概率，先通过

将分数映射到(0,+∞)，然后再归一化到(0,1)。如下式：

把所有的e的Z_j次方计算出来并进行求和，再算出每个值占的比率，保证总和为1，就可以认为softmax得出的就是分类的概率。

dropout是指在深度学习网络的训练过程中,对于神经网络单元,按照一定的概率将其暂时从网络中丢弃。使用Dropout之后，传递过程发生改变，具体形式如下：

1)随机(临时)删掉网络中的隐藏神经元，输入输出神经元保持不变；

2)输入x通过修改后的网络进行前向传播，利用得到的损失结果，在修改后的网络中反向传播。一小批训练样本执行完这个过程后，在没有被删除的神经元上按照随机梯度下降法更新对应的参数(w，b)；

3)然后继续重复这一过程：

a.恢复被删掉的神经元(被删除的神经元保持原样，没有被删除的神经元已经有所更新)；

b.从隐藏层神经元中随机选择一个子集临时删除掉(备份被删除神经元的参数)；

c.对一小批训练样本，先前向传播，然后反向传播损失，并根据随机梯度下降法更新参数(没有被删除的那一部分参数得到更新，删除的神经元参数保持被删除前的结果)。

4)不断重复这一过程，直到迭代次数结束。

对应的计算公式如下：

y^～(l)＝r^(l)y^(l)

上面公式中Bernoulli函数是为了生成概率r向量，也就是随机生成一个0、1的向量。

每个神经元的权重都乘以一个概率p，在“总体上”使得测试数据和训练数据是大致一样的。标准的模型没有Dropout层，相同的训练数据去训练5个不同的神经网络，一般会得到5个不同的结果，采用“5个结果取均值”或者“多数取胜的投票策略”去决定最终结果。不同的网络产生不同的过拟合，一些互为“反向”的拟合相互抵消就可以达到整体上减少过拟合。权值的更新不再依赖于有固定关系的隐含节点的共同作用，阻止了某些特征仅仅在其它特定特征下才有效果的情况。

最大似然损失函数softmax_loss的计算包含2步：

1)计算softmax归一化概率，公式如下：

x_i＝x_i-max(x₁,...,x_n)

2)计算损失函数，公式如下：

其中，N为样本数，K为标签数目。

Adam算法利用梯度的一阶矩估计和二阶矩估计动态调整每个参数的学***稳。在TensorFlow的默认初始背景下，步长α＝0.001，动力值大小β₁＝0.9，β₂＝0.999，epsilion为一个很小的数，用以避免除数为0，取ε＝10^-8。在确定了参数α、β₁、β₂和随机目标函数f(w)之后，需要初始化参数向量、一阶矩向量、二阶矩向量和时间步。

Adam中将动量直接并入梯度一阶矩m₀(指数加权)的估计。相比于缺少修正因子导致二阶矩估计可能在训练初期具有很高偏置的RMSProp，Adam包括偏置修正，修正从原点初始化的一阶矩(动量项)和(非中心的)二阶矩估计。

其中，m_t和v_t分别为一阶动量项和二阶动量项。

分别为各自的修正值。w_t表示t时刻即第t迭代模型的参数，

表示第t次迭代时损失函数关于w的梯度大小。当参数w没有收敛时，循环迭代更新各个部分。即时间步t加1、更新目标函数在该时间步上对参数w所求的梯度、更新偏差的一阶矩估计和二阶原始矩估计、计算偏差修正的一阶矩估计和偏差修正的二阶矩估计，然后用以上计算出来的值更新模型的参数w_t。

将上述各层网络按照实际需要，选定各层函数，连接各层，完成卷积神经网络整体结构的搭建。在第一层网络中添加输入数据的维度，选定激活函数为relu函数；选定填充padding，保证数据维度的一致性；选定最大池化，步长为2。后面网络参照第一层网络设置适度更改。Dropout层设置参数为0.5，运算中屏蔽一半的神经元，但加快了网络模型的运算速度。全连接层选定激活函数为relu函数和softmax函数，适用于多分类问题。优化器选择Adam，损失函数选择categorical_crossentropy，输出矩阵选择参量accuracy。至此，初始的卷积神经网络模型搭建完成。

如下表4所示为本发明实施例搭建的卷积神经网络模型的模型参数表。

表4

表4中，第一列为各层类型，即层名称；第二列为该层处理数据后的数据量，此处None代指图片数目，2、3维度表示图像的纵横宽度，第4维表示卷积核数目；第三列为参数个数，在整个网络中，卷积运算和全连接层会进行参数运算，其余各层均是数据的提取和维度的调整。

进一步作为可选的实施方式，将训练图片集输入到预先构建的卷积神经网络中进行训练这一步骤，其具体包括：

C1、将训练图片集输入到卷积神经网络，得到故障预测结果；

C2、根据故障预测结果和故障类型标签确定训练的损失值；

C3、根据损失值对卷积神经网络的参数进行更新。

具体地，将训练图片集中的数据输入到初始化后的卷积神经网络模型后，可以得到模型输出的识别结果，即故障预测结果，可以根据故障预测结果和前述的标签值来评估识别模型预测的准确性，从而对模型的参数进行更新。对于故障识别模型来说，模型预测结果的准确性可以通过损失函数(Loss Function)来衡量，损失函数是定义在单个训练数据上的，用于衡量一个训练数据的预测误差，具体是通过单个训练数据的标签和模型对该训练数据的预测结果确定该训练数据的损失值。而实际训练时，一个训练数据集有很多训练数据，因此一般采用代价函数(Cost Function)来衡量训练数据集的整体误差，代价函数是定义在整个训练数据集上的，用于计算所有训练数据的预测误差的平均值，能够更好地衡量出模型的预测效果。对于一般的机器学***方损失函数、绝对损失函数、对数损失函数、交叉熵损失函数等均可以作为机器学习模型的损失函数，在此不再一一阐述。本发明实施例中，可以从中任选一种损失函数来确定训练的损失值。基于训练的损失值，采用反向传播算法对模型的参数进行更新，迭代几轮即可得到训练好的故障诊断模型。具体地迭代轮数可以预先设定，或者在测试集达到精度要求时认为训练完成。

本发明实施例中，卷积核识别到具体重复波形及其对应时间序列后，将其作为新的训练数据反向更新网络。将识别到的故障特征设定为卷积核，并在正反向传递中不断更新网络，利用新的卷积核直接读取故障特征，可大幅提高训练模型的识别速率和预测精度。

进一步作为可选的实施方式，卷积神经网络包括输入层、低隐层、全连接层以及输出层，低隐层由多个卷积层和多个池化层交替组成。

S104、获取待检测的第二故障信号，并通过后缀树算法确定第二故障信号的第二时频特征图，进而将第二时频特征图输入到故障识别模型，输出得到故障类型识别结果。

本发明实施例中，对待检测的第二故障信号的处理过程与第一故障信号的处理过程一致，在此不作赘述。在得到第二故障信号的第二时频特征图后，将其输入步骤S103训练好的故障识别模型后，即可得到故障类型识别结果。

以上对本发明的方法步骤进行了说明。可以认识到，本发明实施例通过对故障信号进行分解，获取故障重复波形和重复时间序列两个不同尺度的信息，避免了傅里叶算法的混叠现象产生的误差，提高了训练样本的准确性和可靠性，进而提高了故障识别模型的精度，从而提高了故障检测的准确度。

与现有技术相比，本发明实施例还具有以下优点：

1)本发明实施例直接对时域信号进行分解，获取故障重复波形与重复时间序列两个不同尺度的信息，获取特征的物理含义明确，可解释性强。

2)本发明实施例计算复杂度为O(n)，运行速度快，普通台式机单一码带的处理能力可达到1M采样点/秒，特别适合高采样频率、多通道数据处理等大规模数据实时处理时的特征提取。

3)故障重复波形与重复时间序列均可直接与动力学模型分析结果比对，适用于非平稳故障，极大地增加了故障特征的可靠性。

4)引入神经网络模型识别故障类型，识别速度可达毫秒级别，并实时反馈训练数据，更新网络模型，实现实时诊断的目标。

参照图5，本发明实施例提供了一种基于后缀树的故障检测***，包括：

信号分解模块，用于获取第一故障信号，并通过后缀树算法对第一故障信号进行分解，得到故障重复波形和重复时间序列；

训练图片集构建模块，用于根据故障重复波形和重复时间序列确定第一故障信号的第一时频特征图，并根据第一时频特征图构建训练图片集；

故障识别模型训练模块，用于将训练图片集输入到预先构建的卷积神经网络中进行训练，得到训练好的故障识别模型；

故障类型识别模块，用于获取待检测的第二故障信号，并通过后缀树算法确定第二故障信号的第二时频特征图，进而将第二时频特征图输入到故障识别模型，输出得到故障类型识别结果。

上述方法实施例中的内容均适用于本***实施例中，本***实施例所具体实现的功能与上述方法实施例相同，并且达到的有益效果与上述方法实施例所达到的有益效果也相同。

参照图6，本发明实施例提供了一种基于后缀树的故障检测装置，包括：

至少一个处理器；

至少一个存储器，用于存储至少一个程序；

当上述至少一个程序被上述至少一个处理器执行时，使得上述至少一个处理器实现上述的一种基于后缀树的故障检测方法。

上述方法实施例中的内容均适用于本装置实施例中，本装置实施例所具体实现的功能与上述方法实施例相同，并且达到的有益效果与上述方法实施例所达到的有益效果也相同。

本发明实施例还提供了一种计算机可读存储介质，其中存储有处理器可执行的程序，该处理器可执行的程序在由处理器执行时用于执行上述一种基于后缀树的故障检测方法。

本发明实施例的一种计算机可读存储介质，可执行本发明方法实施例所提供的一种基于后缀树的故障检测方法，可执行方法实施例的任意组合实施步骤，具备该方法相应的功能和有益效果。

本发明实施例还公开了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存介质中。计算机设备的处理器可以从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行图1所示的方法。

在一些可选择的实施例中，在方框图中提到的功能/操作可以不按照操作示图提到的顺序发生。例如，取决于所涉及的功能/操作，连续示出的两个方框实际上可以被大体上同时地执行或上述方框有时能以相反顺序被执行。此外，在本发明的流程图中所呈现和描述的实施例以示例的方式被提供，目的在于提供对技术更全面的理解。所公开的方法不限于本文所呈现的操作和逻辑流程。可选择的实施例是可预期的，其中各种操作的顺序被改变以及其中被描述为较大操作的一部分的子操作被独立地执行。

此外，虽然在功能性模块的背景下描述了本发明，但应当理解的是，除非另有相反说明，上述的功能和/或特征中的一个或多个可以被集成在单个物理装置和/或软件模块中，或者一个或多个功能和/或特征可以在单独的物理装置或软件模块中被实现。还可以理解的是，有关每个模块的实际实现的详细讨论对于理解本发明是不必要的。更确切地说，考虑到在本文中公开的装置中各种功能模块的属性、功能和内部关系的情况下，在工程师的常规技术内将会了解该模块的实际实现。因此，本领域技术人员运用普通技术就能够在无需过度试验的情况下实现在权利要求书中所阐明的本发明。还可以理解的是，所公开的特定概念仅仅是说明性的，并不意在限制本发明的范围，本发明的范围由所附权利要求书及其等同方案的全部范围来决定。

上述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例上述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(R AM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行***、装置或设备(如基于计算机的***、包括处理器的***或其他可以从指令执行***、装置或设备取指令并执行指令的***)使用，或结合这些指令执行***、装置或设备而使用。就本说明书而言，“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行***、装置或设备或结合这些指令执行***、装置或设备而使用的装置。

计算机可读介质的更具体的示例(非穷尽性列表)包括以下：具有一个或多个布线的电连接部(电子装置)，便携式计算机盘盒(磁装置)，随机存取存储器(RAM)，只读存储器(ROM)，可擦除可编辑只读存储器(EPROM或闪速存储器)，光纤装置，以及便携式光盘只读存储器(CDROM)。另外，计算机可读介质甚至可以是可在其上打印上述程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得上述程序，然后将其存储在计算机存储器中。

应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行***执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(PGA)，现场可编程门阵列(FPGA)等。

在本说明书的上述描述中，参考术语“一个实施方式/实施例”、“另一实施方式/实施例”或“某些实施方式/实施例”等的描述意指结合实施方式或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施方式或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施方式或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施方式或示例中以合适的方式结合。

尽管已经示出和描述了本发明的实施方式，本领域的普通技术人员可以理解：在不脱离本发明的原理和宗旨的情况下可以对这些实施方式进行多种变化、修改、替换和变型，本发明的范围由权利要求及其等同物限定。

以上是对本发明的较佳实施进行了具体说明，但本发明并不限于上述实施例，熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换，这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

Claims

1.一种基于后缀树的故障检测方法，其特征在于，包括以下步骤：

获取待检测的第二故障信号，并通过后缀树算法确定所述第二故障信号的第二时频特征图，进而将所述第二时频特征图输入到所述故障识别模型，输出得到故障类型识别结果；所述通过后缀树算法对所述第一故障信号进行分解，得到故障重复波形和重复时间序列这一步骤，其具体包括：

2.根据权利要求1所述的一种基于后缀树的故障检测方法，其特征在于，所述对所述第一后缀树的各个节点进行遍历，获取重复出现的故障波形信息作为故障重复波形，并确定所述故障重复波形的重复时间序列这一步骤，其具体包括：

3.根据权利要求1所述的一种基于后缀树的故障检测方法，其特征在于，所述故障检测方法还包括以下步骤：

4.根据权利要求1所述的一种基于后缀树的故障检测方法，其特征在于，所述根据所述故障重复波形和所述重复时间序列确定所述第一故障信号的第一时频特征图，并根据所述第一时频特征图构建训练图片集这一步骤，其具体包括：

根据所述第一时频特征图确定训练样本；

根据所述训练样本和所述故障类型标签构建训练图片集。

5.根据权利要求4所述的一种基于后缀树的故障检测方法，其特征在于，所述将所述训练图片集输入到预先构建的卷积神经网络中进行训练这一步骤，其具体包括：

根据所述损失值对所述卷积神经网络的参数进行更新。

6.根据权利要求1至5中任一项所述的一种基于后缀树的故障检测方法，其特征在于：所述卷积神经网络包括输入层、低隐层、全连接层以及输出层，所述低隐层由多个卷积层和多个池化层交替组成。

7.一种基于后缀树的故障检测***，其特征在于，包括：

故障类型识别模块，用于获取待检测的第二故障信号，并通过后缀树算法确定所述第二故障信号的第二时频特征图，进而将所述第二时频特征图输入到所述故障识别模型，输出得到故障类型识别结果；

所述通过后缀树算法对所述第一故障信号进行分解，得到故障重复波形和重复时间序列这一步骤，其具体包括：

8.一种基于后缀树的故障检测装置，其特征在于，包括：

至少一个处理器；

至少一个存储器，用于存储至少一个程序；

当所述至少一个程序被所述至少一个处理器执行，使得所述至少一个处理器实现如权利要求1至6中任一项所述的一种基于后缀树的故障检测方法。

9.一种计算机可读存储介质，其中存储有处理器可执行的程序，其特征在于，所述处理器可执行的程序在由处理器执行时用于执行如权利要求1至6中任一项所述的一种基于后缀树的故障检测方法。