CN116229991A

CN116229991A - 基于mfcc语音特征提取与机器学习的电机故障诊断方法

Info

Publication number: CN116229991A
Application number: CN202211672733.0A
Authority: CN
Inventors: 杨磊; 王镜淇; 李亮; 雷成; 李峥; 和丹; 郭莉侠; 王亚东; 许列琦; 高帆; 于轩; 胡明
Original assignee: Suzhou Veizu Equipment Diagnosis Technology Co ltd; Jiangsu Nuclear Power Corp
Current assignee: Suzhou Veizu Equipment Diagnosis Technology Co ltd; Jiangsu Nuclear Power Corp
Priority date: 2022-12-26
Filing date: 2022-12-26
Publication date: 2023-06-06

Abstract

本发明属于电机故障检测技术领域，具体涉及一种基于MFCC语音特征提取与机器学习的电机故障诊断方法。本发明包括以下步骤：S1：设定采样频率；S2：对采样成功的音频进行预加重处理；S3：对加重后的信号进行分帧处理；S4：对于分帧后的信号进行加窗处理；S5：通过傅里叶变换对加窗后的信号进行处理，计算其MFCC特征向量；S6：以采样点为单位进行样本的划分；S7：对S6样本中的MFCC特征向量进行分类，计算第一组特征向量与其他特征向量的切比雪夫距离；S8：对S6中计算的切比雪夫距离特征进行PCA降维；S9：将S8中降维后的数据输入BP神经网络模型进行训练。本发明针对不同的电机故障类型有较高的识别率，且在诊断过程无需人员参与，降低了人力成本。

Description

基于MFCC语音特征提取与机器学习的电机故障诊断方法

技术领域

本发明属于电机故障检测技术领域，具体涉及一种基于MFCC语音特征提取与机器学习的电机故障诊断方法。

背景技术

电机在工业生产过程中的应用随处可见，是实现机电自动化的主要设备，在工业生产中占有重要地位。电机作为各类电驱设备主要的动力装置，具有控制方便、能效高、无污染等有点。但在电机运行过程中，受载荷多变、零部件老化、工作环境复杂等条件影响，易发生故障进而降低电驱装置的工作效率和稳定性。

由于电机故障类型繁多，各种故障的表现形式不同，不同故障产生的原因也错综复杂，这极大的提高了电机故障诊断的难度。传统电机故障诊断过程主要是对单一的特征信号进行分析，存在不确定性大，诊断精度低等问题，并且电机在工作状态下的信号采集也存在较多的噪声信号，在实际生产过程中，通过人耳对电机故障进行判定也存在易受主观条件和周围环境影响，造成判定结果不准确。如何针对电机故障的诊断建立精确的模型，进行有效的状态估计和参数估计是目前故障诊断领域研究发展的方向。

目前对电机的故障的诊断方法有基于电机模型的故障诊断方法，此类方法主要对电机运行过程中的参数进行建模推导，通过一个可以测量的变量来反映模型的变化。此类方法相对简单快捷，易于诊断，但是诊断的准确率与模型建立的完整程度有着很大的关系，针对实际工作过程中的电机，在诸多因素的影响下难以建立一个精确的模型。基于信号处理的电机故障诊断方法是通过对采集到的工况信息进行处理，加强故障特征在信息中的表达，利用这些有效的信息对电机故障进行诊断，此类方法可以有效的突出信号中的故障信息，提高模型对特征的识别精度。但在数据的采集过程中，由于采集条件的影响，存在所获取的数据价值不高，噪声影响等现象，同时处理后的特征变量较为单一，训练的模型泛化性能较差。

发明内容

本发明解决的技术问题，为克服目前电机故障诊断领域存在的技术缺点，本发明提供了一种基于MFCC语音特征提取与机器学习的电机故障诊断方法，针对不同的电机故障类型有较高的识别率，且在诊断过程无需人员参与，降低了人力成本。

本发明采用的技术方案：

一种基于MFCC语音特征提取与机器学习的电机故障诊断方法，包括以下步骤：

S1：设定采样频率f_s，采集电机处于工作状态的音频信号并标记为x₁(t)，x₂(t)，…，x_n(t)；并对其打标签；

S2：对采样成功的音频进行预加重处理；

S3：对加重后的信号进行分帧处理；

S4：对于分帧后的信号进行加窗处理；

S5：通过傅里叶变换对加窗后的信号进行处理，将时域信号转换为频域信号，在对转换后的信号计算其MFCC特征向量；

S6：对S5中计算的特征向量以采样点为单位进行样本的划分，进一步细化为每m个采样点作为一个样本；

S7：对S6样本中的MFCC特征向量进行分类，计算第一组特征向量与其他特征向量的切比雪夫距离；

S8：对S6中计算的切比雪夫距离特征进行PCA降维，将高纬度的数据中重要的特征保留并且去除噪声特征；

S9：将S8中降维后的数据输入BP神经网络模型进行训练，并对训练完成的模型进行测试。

所述S2中，假设音频信号第t个采样时间点为x[t]，则预加重函数如下：

y[t]＝x[t]-α·x[t-1]

α一般取0.9-1.0，此例中α取0.97；t为采样时间点。

所述S3中，帧长设置为25ms，帧移设置为10ms，对于总体信号来说，帧长和帧移为：帧长＝f_s·0.025，帧移＝f_s·0.001，f_s为采样频率。

所述S4中，采用hamming窗处理，过程如下：

s(t)＝y(t)×W(t)

s(t)为加窗处理后的信号；y(t)为预加重处理信号；W(t)为hamming窗函数；

其中W(t)的形式如下：

W(t，a)＝(1-a)-a×cos(2πq/(L-1)，0≤q≤L-1

其中a为窗参数，在此例中a取0.46；L为hamming窗长度，q为采样点个数，t为采样时间点。

所述S5中，具体步骤如下：

S501、首先对信号进行快速傅里叶变换，将时域信号转变为频域信号，通过频谱图反应能量分布的相关信息；第n帧信号的频谱x(k)公式如下：

其中x(k)为k时刻的频域信号，N为采样点数，s(n)为n时刻的时域信号；

S502、计算梅尔系数，梅尔值更加贴近人耳听觉机制，在低频范围增长较快，高频范围内增长缓慢，信号频率f与梅尔值f_mel对应关系如下所示：

S503、通过梅尔滤波器组对信号进行处理，对频谱进行平滑化，梅尔滤波器组的基本单元是三角滤波器组，滤波器总数量为M，中心频率为f(m)；梅尔滤波器组的频率响应函数为：

其中m表示第m个滤波器，k为谱线索引；

S504、计算每个滤波器组输出的对数能量，在对能量谱进行离散余弦变换得到MFCC系数，其中对数能量公式为：

其中k为谱线索引，m表示第m个滤波器，S(m)表示第m个滤波器输出的对数能量；

MFCC系数计算公式为：

其中i为帧数，n为第n个频率倒谱系数，m为第m个滤波器，M为滤波器总数；

S505、计算升倒谱系数，公式为：

其中r为阶数，这里取值为13，K(j)表示第j个频率升倒谱系数；

S506、计算MFCC特征向量，计算公式为：

feat(i，j)＝mfcc(i，j)·K(j)

其中i为帧数，j为第j个升倒谱系数；由此式得到的是MFCC的第一组特征参数；通过对第一组特征参数一阶微分得到第二组特征参数；同样通过对第一组特征参数二阶微分得到第三组特征参数。

所述S6中，具体公式如下：

n为总采样点数。

所述S7中，距离公式如下：

dis(x，y)＝max(|x₁-x₂|，|y₁-y₂|)

x，y为向量坐标。

与现有技术相比，本发明的有益效果在于：

(1)本发明提供一种基于MFCC语音特征提取与机器学习的电机故障诊断方法，利用MFCC语音特征提取算法对电机工作状态下的声音信号进行处理，MFCC算法在对音频信号的处理过程中能够反应人耳对声音的感知习惯，提取的特征能够有效的提取出符合人耳听觉特性的故障特征。

(2)本发明提供一种基于MFCC语音特征提取与机器学习的电机故障诊断方法，通过计算MFCC特征向量之间的切比雪夫距离作为识别电机故障状态的特征参数，能够有效的描述电机处于正常工作状态与异常状态的区别，提高了后期网络模型对特征学习的效率。

(3)本发明提供一种基于MFCC语音特征提取与机器学习的电机故障诊断方法，采用主成分分析(PCA降维)对获取的特征进行降维处理，输出分类效果更好的特征子集，提升了高维小样本数据集在训练过程中的准确率。

附图说明

图1为本发明方法的实施流程图；

图2为电机正常工作状态下原始音频信号图；

图3为电机异常工作状态下原始音频信号图；

图4为样本划分后的MFCC特征图；

图5为BP神经网络训练损失函数图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在本发明的描述中，需要说明的是，术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。此外，术语“第一”、“第二”、“第三”仅用于描述目的，而不能理解为指示或暗示相对重要性。

在本发明的描述中，需要说明的是，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域的普通技术人员而言，可以具体情况理解上述术语在本发明中的具体含义。

所采集样本为国内某电站电机工作状态音频信号，如图1所示，本发明提供的一种基于MFCC语音特征提取与机器学习的电机故障诊断方法，具体包括以下步骤：

步骤1：设定采样频率f_s，采集电机处于工作状态的音频信号并标记为x₁(t)，x₂(t)，…，x_n(t)；并对其打标签。图2和图3分别展示了采集的电机正常工作状态下的音频信号和异常工作状态下的音频信号；

步骤2：对采样成功的音频进行预加重处理，增强音频文件中的高频信息，假设音频信号第t个采样时间点为x[t]，则预加重函数如下：

y[t]＝x[t]-α·x[t-1]

α一般取0.9-1.0，此例中α取0.97；t为采样时间点；

步骤3：对加重后的信号进行分帧处理，帧长设置为25ms，帧移设置为10ms，对于总体信号来说，帧长和帧移为：

帧长＝f_s·0.025，帧移＝f_s·0.001，f_s为采样频率；

步骤4：对于分帧后的信号进行加窗处理，消除信号中的频谱泄露，在本文中主要采用hamming窗，处理过程如下：

s(t)＝y(t)×W(t)

其中W(t)的形式如下：

W(t，a)＝(1-a)-a×cos(2πq/(L-1)，0≤q≤L-1

其中a为窗参数，在此例中a取0.46；L为hamming窗长度，q为采样点个数，t为采样时间点；

步骤5：通过傅里叶变换对加窗后的信号进行处理，将时域信号转换为频域信号，在对转换后的信号计算其MFCC特征向量，具体步骤如下：

1)首先对信号进行快速傅里叶变换，将时域信号转变为频域信号，通过频谱图反应能量分布的相关信息；第n帧信号的频谱x(k)公式如下：

2)计算梅尔系数，梅尔值更加贴近人耳听觉机制，在低频范围增长较快，高频范围内增长缓慢，信号频率f与梅尔值f_mel对应关系如下所示：

3)通过梅尔滤波器组对信号进行处理，对频谱进行平滑化，梅尔滤波器组的基本单元是三角滤波器组，滤波器总数量为M(M一般取22-26)，在此例中M取26，中心频率为f(m)。梅尔滤波器组的频率响应函数为：

其中m表示第m个滤波器，k为谱线索引；

4)计算每个滤波器组输出的对数能量，在对能量谱进行离散余弦变换得到MFCC系数，其中对数能量公式为：

MFCC系数计算公式为：

/>

5)计算升倒谱系数，公式为：

6)计算MFCC特征向量，计算公式为：

feat(i，j)＝mfcc(i，j)·K(j)

步骤6：对步骤5中计算的特征向量以采样点为单位进行样本的划分，进一步细化为每m个采样点作为一个样本，图4为划分样本后的MFCC特征图，具体公式如下：

n为总采样点数

步骤7：对步骤6样本中的MFCC特征向量进行分类，计算第一组特征向量与其他特征向量的切比雪夫距离，计算完成的特征为38维，距离公式如下：

dis(x，y)＝max(|x₁-x₂|，|y₁-y₂|)

x，y为向量坐标；

步骤8：对步骤6中计算的切比雪夫距离特征进行PCA降维，将高纬度的数据中重要的特征保留并且去除噪声特征；

步骤9：将步骤8中降维后的数据输入BP神经网络模型进行训练，并对训练完成的模型进行测试，图5为训练过程中损失函数的变化，经过测试模型准确率为85％。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

此外，应当理解，虽然本说明书按照实施方式加以描述，但并非每个实施方式仅包含一个独立的技术方案，说明书的这种叙述方式仅仅是为清楚起见，本领域技术人员应当将说明书作为一个整体，各实施例中的技术方案也可以经适当组合，形成本领域技术人员可以理解的其他实施方式。