CN116229991A - 基于mfcc语音特征提取与机器学习的电机故障诊断方法 - Google Patents
基于mfcc语音特征提取与机器学习的电机故障诊断方法 Download PDFInfo
- Publication number
- CN116229991A CN116229991A CN202211672733.0A CN202211672733A CN116229991A CN 116229991 A CN116229991 A CN 116229991A CN 202211672733 A CN202211672733 A CN 202211672733A CN 116229991 A CN116229991 A CN 116229991A
- Authority
- CN
- China
- Prior art keywords
- mfcc
- signal
- frequency
- follows
- motor fault
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000003745 diagnosis Methods 0.000 title claims abstract description 27
- 238000000605 extraction Methods 0.000 title claims abstract description 18
- 238000010801 machine learning Methods 0.000 title claims abstract description 17
- 238000005070 sampling Methods 0.000 claims abstract description 32
- 239000013598 vector Substances 0.000 claims abstract description 27
- 238000012545 processing Methods 0.000 claims abstract description 16
- 230000008569 process Effects 0.000 claims abstract description 15
- 230000009467 reduction Effects 0.000 claims abstract description 10
- 238000009432 framing Methods 0.000 claims abstract description 8
- 238000012549 training Methods 0.000 claims abstract description 7
- 238000003062 neural network model Methods 0.000 claims abstract description 4
- 230000009466 transformation Effects 0.000 claims abstract description 4
- 230000005236 sound signal Effects 0.000 claims description 13
- 238000001228 spectrum Methods 0.000 claims description 10
- 230000037433 frameshift Effects 0.000 claims description 9
- 230000006870 function Effects 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 6
- 230000004069 differentiation Effects 0.000 claims description 6
- 238000009826 distribution Methods 0.000 claims description 3
- 230000007246 mechanism Effects 0.000 claims description 3
- 238000005316 response function Methods 0.000 claims description 3
- 230000000630 rising effect Effects 0.000 claims description 3
- 230000003595 spectral effect Effects 0.000 claims description 3
- 238000012360 testing method Methods 0.000 claims description 3
- 238000009499 grossing Methods 0.000 claims description 2
- 238000002372 labelling Methods 0.000 claims description 2
- 238000007670 refining Methods 0.000 claims description 2
- 238000001514 detection method Methods 0.000 abstract description 2
- 230000002159 abnormal effect Effects 0.000 description 3
- 210000005069 ears Anatomy 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000009776 industrial production Methods 0.000 description 2
- 230000032683 aging Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/26—Recognition of special voice characteristics, e.g. for use in lie detectors; Recognition of animal voices
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/24—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
- G10L25/30—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
- Y04S10/52—Outage or fault management, e.g. fault detection or location
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Control Of Electric Motors In General (AREA)
- Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)
Abstract
本发明属于电机故障检测技术领域,具体涉及一种基于MFCC语音特征提取与机器学习的电机故障诊断方法。本发明包括以下步骤:S1:设定采样频率;S2:对采样成功的音频进行预加重处理;S3:对加重后的信号进行分帧处理;S4:对于分帧后的信号进行加窗处理;S5:通过傅里叶变换对加窗后的信号进行处理,计算其MFCC特征向量;S6:以采样点为单位进行样本的划分;S7:对S6样本中的MFCC特征向量进行分类,计算第一组特征向量与其他特征向量的切比雪夫距离;S8:对S6中计算的切比雪夫距离特征进行PCA降维;S9:将S8中降维后的数据输入BP神经网络模型进行训练。本发明针对不同的电机故障类型有较高的识别率,且在诊断过程无需人员参与,降低了人力成本。
Description
技术领域
本发明属于电机故障检测技术领域,具体涉及一种基于MFCC语音特征提取与机器学习的电机故障诊断方法。
背景技术
电机在工业生产过程中的应用随处可见,是实现机电自动化的主要设备,在工业生产中占有重要地位。电机作为各类电驱设备主要的动力装置,具有控制方便、能效高、无污染等有点。但在电机运行过程中,受载荷多变、零部件老化、工作环境复杂等条件影响,易发生故障进而降低电驱装置的工作效率和稳定性。
由于电机故障类型繁多,各种故障的表现形式不同,不同故障产生的原因也错综复杂,这极大的提高了电机故障诊断的难度。传统电机故障诊断过程主要是对单一的特征信号进行分析,存在不确定性大,诊断精度低等问题,并且电机在工作状态下的信号采集也存在较多的噪声信号,在实际生产过程中,通过人耳对电机故障进行判定也存在易受主观条件和周围环境影响,造成判定结果不准确。如何针对电机故障的诊断建立精确的模型,进行有效的状态估计和参数估计是目前故障诊断领域研究发展的方向。
目前对电机的故障的诊断方法有基于电机模型的故障诊断方法,此类方法主要对电机运行过程中的参数进行建模推导,通过一个可以测量的变量来反映模型的变化。此类方法相对简单快捷,易于诊断,但是诊断的准确率与模型建立的完整程度有着很大的关系,针对实际工作过程中的电机,在诸多因素的影响下难以建立一个精确的模型。基于信号处理的电机故障诊断方法是通过对采集到的工况信息进行处理,加强故障特征在信息中的表达,利用这些有效的信息对电机故障进行诊断,此类方法可以有效的突出信号中的故障信息,提高模型对特征的识别精度。但在数据的采集过程中,由于采集条件的影响,存在所获取的数据价值不高,噪声影响等现象,同时处理后的特征变量较为单一,训练的模型泛化性能较差。
发明内容
本发明解决的技术问题,为克服目前电机故障诊断领域存在的技术缺点,本发明提供了一种基于MFCC语音特征提取与机器学习的电机故障诊断方法,针对不同的电机故障类型有较高的识别率,且在诊断过程无需人员参与,降低了人力成本。
本发明采用的技术方案:
一种基于MFCC语音特征提取与机器学习的电机故障诊断方法,包括以下步骤:
S1:设定采样频率fs,采集电机处于工作状态的音频信号并标记为x1(t),x2(t),…,xn(t);并对其打标签;
S2:对采样成功的音频进行预加重处理;
S3:对加重后的信号进行分帧处理;
S4:对于分帧后的信号进行加窗处理;
S5:通过傅里叶变换对加窗后的信号进行处理,将时域信号转换为频域信号,在对转换后的信号计算其MFCC特征向量;
S6:对S5中计算的特征向量以采样点为单位进行样本的划分,进一步细化为每m个采样点作为一个样本;
S7:对S6样本中的MFCC特征向量进行分类,计算第一组特征向量与其他特征向量的切比雪夫距离;
S8:对S6中计算的切比雪夫距离特征进行PCA降维,将高纬度的数据中重要的特征保留并且去除噪声特征;
S9:将S8中降维后的数据输入BP神经网络模型进行训练,并对训练完成的模型进行测试。
所述S2中,假设音频信号第t个采样时间点为x[t],则预加重函数如下:
y[t]=x[t]-α·x[t-1]
α一般取0.9-1.0,此例中α取0.97;t为采样时间点。
所述S3中,帧长设置为25ms,帧移设置为10ms,对于总体信号来说,帧长和帧移为:帧长=fs·0.025,帧移=fs·0.001,fs为采样频率。
所述S4中,采用hamming窗处理,过程如下:
s(t)=y(t)×W(t)
s(t)为加窗处理后的信号;y(t)为预加重处理信号;W(t)为hamming窗函数;
其中W(t)的形式如下:
W(t,a)=(1-a)-a×cos(2πq/(L-1),0≤q≤L-1
其中a为窗参数,在此例中a取0.46;L为hamming窗长度,q为采样点个数,t为采样时间点。
所述S5中,具体步骤如下:
S501、首先对信号进行快速傅里叶变换,将时域信号转变为频域信号,通过频谱图反应能量分布的相关信息;第n帧信号的频谱x(k)公式如下:
其中x(k)为k时刻的频域信号,N为采样点数,s(n)为n时刻的时域信号;
S502、计算梅尔系数,梅尔值更加贴近人耳听觉机制,在低频范围增长较快,高频范围内增长缓慢,信号频率f与梅尔值fmel对应关系如下所示:
S503、通过梅尔滤波器组对信号进行处理,对频谱进行平滑化,梅尔滤波器组的基本单元是三角滤波器组,滤波器总数量为M,中心频率为f(m);梅尔滤波器组的频率响应函数为:
其中m表示第m个滤波器,k为谱线索引;
S504、计算每个滤波器组输出的对数能量,在对能量谱进行离散余弦变换得到MFCC系数,其中对数能量公式为:
其中k为谱线索引,m表示第m个滤波器,S(m)表示第m个滤波器输出的对数能量;
MFCC系数计算公式为:
其中i为帧数,n为第n个频率倒谱系数,m为第m个滤波器,M为滤波器总数;
S505、计算升倒谱系数,公式为:
其中r为阶数,这里取值为13,K(j)表示第j个频率升倒谱系数;
S506、计算MFCC特征向量,计算公式为:
feat(i,j)=mfcc(i,j)·K(j)
其中i为帧数,j为第j个升倒谱系数;由此式得到的是MFCC的第一组特征参数;通过对第一组特征参数一阶微分得到第二组特征参数;同样通过对第一组特征参数二阶微分得到第三组特征参数。
所述S6中,具体公式如下:
所述S7中,距离公式如下:
dis(x,y)=max(|x1-x2|,|y1-y2|)
x,y为向量坐标。
与现有技术相比,本发明的有益效果在于:
(1)本发明提供一种基于MFCC语音特征提取与机器学习的电机故障诊断方法,利用MFCC语音特征提取算法对电机工作状态下的声音信号进行处理,MFCC算法在对音频信号的处理过程中能够反应人耳对声音的感知习惯,提取的特征能够有效的提取出符合人耳听觉特性的故障特征。
(2)本发明提供一种基于MFCC语音特征提取与机器学习的电机故障诊断方法,通过计算MFCC特征向量之间的切比雪夫距离作为识别电机故障状态的特征参数,能够有效的描述电机处于正常工作状态与异常状态的区别,提高了后期网络模型对特征学习的效率。
(3)本发明提供一种基于MFCC语音特征提取与机器学习的电机故障诊断方法,采用主成分分析(PCA降维)对获取的特征进行降维处理,输出分类效果更好的特征子集,提升了高维小样本数据集在训练过程中的准确率。
附图说明
图1为本发明方法的实施流程图;
图2为电机正常工作状态下原始音频信号图;
图3为电机异常工作状态下原始音频信号图;
图4为样本划分后的MFCC特征图;
图5为BP神经网络训练损失函数图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
所采集样本为国内某电站电机工作状态音频信号,如图1所示,本发明提供的一种基于MFCC语音特征提取与机器学习的电机故障诊断方法,具体包括以下步骤:
步骤1:设定采样频率fs,采集电机处于工作状态的音频信号并标记为x1(t),x2(t),…,xn(t);并对其打标签。图2和图3分别展示了采集的电机正常工作状态下的音频信号和异常工作状态下的音频信号;
步骤2:对采样成功的音频进行预加重处理,增强音频文件中的高频信息,假设音频信号第t个采样时间点为x[t],则预加重函数如下:
y[t]=x[t]-α·x[t-1]
α一般取0.9-1.0,此例中α取0.97;t为采样时间点;
步骤3:对加重后的信号进行分帧处理,帧长设置为25ms,帧移设置为10ms,对于总体信号来说,帧长和帧移为:
帧长=fs·0.025,帧移=fs·0.001,fs为采样频率;
步骤4:对于分帧后的信号进行加窗处理,消除信号中的频谱泄露,在本文中主要采用hamming窗,处理过程如下:
s(t)=y(t)×W(t)
s(t)为加窗处理后的信号;y(t)为预加重处理信号;W(t)为hamming窗函数;
其中W(t)的形式如下:
W(t,a)=(1-a)-a×cos(2πq/(L-1),0≤q≤L-1
其中a为窗参数,在此例中a取0.46;L为hamming窗长度,q为采样点个数,t为采样时间点;
步骤5:通过傅里叶变换对加窗后的信号进行处理,将时域信号转换为频域信号,在对转换后的信号计算其MFCC特征向量,具体步骤如下:
1)首先对信号进行快速傅里叶变换,将时域信号转变为频域信号,通过频谱图反应能量分布的相关信息;第n帧信号的频谱x(k)公式如下:
其中x(k)为k时刻的频域信号,N为采样点数,s(n)为n时刻的时域信号;
2)计算梅尔系数,梅尔值更加贴近人耳听觉机制,在低频范围增长较快,高频范围内增长缓慢,信号频率f与梅尔值fmel对应关系如下所示:
3)通过梅尔滤波器组对信号进行处理,对频谱进行平滑化,梅尔滤波器组的基本单元是三角滤波器组,滤波器总数量为M(M一般取22-26),在此例中M取26,中心频率为f(m)。梅尔滤波器组的频率响应函数为:
其中m表示第m个滤波器,k为谱线索引;
4)计算每个滤波器组输出的对数能量,在对能量谱进行离散余弦变换得到MFCC系数,其中对数能量公式为:
其中k为谱线索引,m表示第m个滤波器,S(m)表示第m个滤波器输出的对数能量;
MFCC系数计算公式为:
其中i为帧数,n为第n个频率倒谱系数,m为第m个滤波器,M为滤波器总数;
5)计算升倒谱系数,公式为:
其中r为阶数,这里取值为13,K(j)表示第j个频率升倒谱系数;
6)计算MFCC特征向量,计算公式为:
feat(i,j)=mfcc(i,j)·K(j)
其中i为帧数,j为第j个升倒谱系数;由此式得到的是MFCC的第一组特征参数;通过对第一组特征参数一阶微分得到第二组特征参数;同样通过对第一组特征参数二阶微分得到第三组特征参数。
步骤6:对步骤5中计算的特征向量以采样点为单位进行样本的划分,进一步细化为每m个采样点作为一个样本,图4为划分样本后的MFCC特征图,具体公式如下:
步骤7:对步骤6样本中的MFCC特征向量进行分类,计算第一组特征向量与其他特征向量的切比雪夫距离,计算完成的特征为38维,距离公式如下:
dis(x,y)=max(|x1-x2|,|y1-y2|)
x,y为向量坐标;
步骤8:对步骤6中计算的切比雪夫距离特征进行PCA降维,将高纬度的数据中重要的特征保留并且去除噪声特征;
步骤9:将步骤8中降维后的数据输入BP神经网络模型进行训练,并对训练完成的模型进行测试,图5为训练过程中损失函数的变化,经过测试模型准确率为85%。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
Claims (7)
1.一种基于MFCC语音特征提取与机器学习的电机故障诊断方法,其特征在于,包括以下步骤:
S1:设定采样频率fs,采集电机处于工作状态的音频信号并标记为x1(t),x2(t),…,xn(t);并对其打标签;
S2:对采样成功的音频进行预加重处理;
S3:对加重后的信号进行分帧处理;
S4:对于分帧后的信号进行加窗处理;
S5:通过傅里叶变换对加窗后的信号进行处理,将时域信号转换为频域信号,在对转换后的信号计算其MFCC特征向量;
S6:对S5中计算的特征向量以采样点为单位进行样本的划分,进一步细化为每m个采样点作为一个样本;
S7:对S6样本中的MFCC特征向量进行分类,计算第一组特征向量与其他特征向量的切比雪夫距离;
S8:对S6中计算的切比雪夫距离特征进行PCA降维,将高纬度的数据中重要的特征保留并且去除噪声特征;
S9:将S8中降维后的数据输入BP神经网络模型进行训练,并对训练完成的模型进行测试。
2.根据权利要求1所述的基于MFCC语音特征提取与机器学习的电机故障诊断方法,其特征在于,所述S2中,假设音频信号第t个采样时间点为x[t],则预加重函数如下:
y[t]=x[t]-α·x[t-1]
α一般取0.9-1.0,此例中α取0.97;t为采样时间点。
3.根据权利要求2所述的基于MFCC语音特征提取与机器学习的电机故障诊断方法,其特征在于,所述S3中,帧长设置为25ms,帧移设置为10ms,对于总体信号来说,帧长和帧移为:帧长=fs·0.025,帧移=fs·0.001,fs为采样频率。
4.根据权利要求3所述的基于MFCC语音特征提取与机器学习的电机故障诊断方法,其特征在于,所述S4中,采用hamming窗处理,过程如下:
s(t)=y(t)×W(t)
s(t)为加窗处理后的信号;y(t)为预加重处理信号;W(t)为hamming窗函数;
其中W(t)的形式如下:
W(t,a)=(1-a)-a×cos(2πq/(L-1),0≤q≤L-1
其中a为窗参数,在此例中a取0.46;L为hamming窗长度,q为采样点个数,t为采样时间点。
5.根据权利要求4所述的基于MFCC语音特征提取与机器学习的电机故障诊断方法,其特征在于,所述S5中,具体步骤如下:
S501、首先对信号进行快速傅里叶变换,将时域信号转变为频域信号,通过频谱图反应能量分布的相关信息;第n帧信号的频谱x(k)公式如下:
其中x(k)为k时刻的频域信号,N为采样点数,s(n)为n时刻的时域信号;
S502、计算梅尔系数,梅尔值更加贴近人耳听觉机制,在低频范围增长较快,高频范围内增长缓慢,信号频率f与梅尔值fmel对应关系如下所示:
S503、通过梅尔滤波器组对信号进行处理,对频谱进行平滑化,梅尔滤波器组的基本单元是三角滤波器组,滤波器总数量为M,中心频率为f(m);梅尔滤波器组的频率响应函数为:
其中m表示第m个滤波器,k为谱线索引;
S504、计算每个滤波器组输出的对数能量,在对能量谱进行离散余弦变换得到MFCC系数,其中对数能量公式为:
其中k为谱线索引,m表示第m个滤波器,S(m)表示第m个滤波器输出的对数能量;
MFCC系数计算公式为:
其中i为帧数,n为第n个频率倒谱系数,m为第m个滤波器,M为滤波器总数;
S505、计算升倒谱系数,公式为:
其中r为阶数,这里取值为13,K(j)表示第j个频率升倒谱系数;
S506、计算MFCC特征向量,计算公式为:
feat(i,j)=mfcc(i,j)·K(j)
其中i为帧数,j为第j个升倒谱系数;由此式得到的是MFCC的第一组特征参数;通过对第一组特征参数一阶微分得到第二组特征参数;同样通过对第一组特征参数二阶微分得到第三组特征参数。
7.根据权利要求6所述的基于MFCC语音特征提取与机器学习的电机故障诊断方法,其特征在于,所述S7中,距离公式如下:
dis(x,y)=max(|x1-x2|,|y1-y2|)
x,y为向量坐标。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211672733.0A CN116229991A (zh) | 2022-12-26 | 2022-12-26 | 基于mfcc语音特征提取与机器学习的电机故障诊断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211672733.0A CN116229991A (zh) | 2022-12-26 | 2022-12-26 | 基于mfcc语音特征提取与机器学习的电机故障诊断方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116229991A true CN116229991A (zh) | 2023-06-06 |
Family
ID=86581475
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211672733.0A Pending CN116229991A (zh) | 2022-12-26 | 2022-12-26 | 基于mfcc语音特征提取与机器学习的电机故障诊断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116229991A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117116290A (zh) * | 2023-08-03 | 2023-11-24 | 中科航迈数控软件(深圳)有限公司 | 基于多维特征的数控机床部件缺陷定位方法和相关设备 |
CN117711430A (zh) * | 2023-11-16 | 2024-03-15 | 哈尔滨工业大学 | 一种基于音频信号和视觉Transformer的电机转子故障诊断方法 |
-
2022
- 2022-12-26 CN CN202211672733.0A patent/CN116229991A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117116290A (zh) * | 2023-08-03 | 2023-11-24 | 中科航迈数控软件(深圳)有限公司 | 基于多维特征的数控机床部件缺陷定位方法和相关设备 |
CN117116290B (zh) * | 2023-08-03 | 2024-05-24 | 中科航迈数控软件(深圳)有限公司 | 基于多维特征的数控机床部件缺陷定位方法和相关设备 |
CN117711430A (zh) * | 2023-11-16 | 2024-03-15 | 哈尔滨工业大学 | 一种基于音频信号和视觉Transformer的电机转子故障诊断方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109357749B (zh) | 一种基于dnn算法的电力设备音频信号分析方法 | |
CN116229991A (zh) | 基于mfcc语音特征提取与机器学习的电机故障诊断方法 | |
CN104819846B (zh) | 一种基于短时傅里叶变换和稀疏层叠自动编码器的滚动轴承声音信号故障诊断方法 | |
CN109034046B (zh) | 一种基于声学检测的电能表内异物自动识别方法 | |
CN109949823B (zh) | 一种基于dwpt-mfcc与gmm的车内异响识别方法 | |
CN108490349A (zh) | 基于Mel频率倒谱系数的电机异音检测方法 | |
CN105244038A (zh) | 一种基于hmm的选矿设备故障异常音频分析与识别方法 | |
CN114155879B (zh) | 一种利用时频融合补偿异常感知及稳定性的异音检测方法 | |
CN111948487A (zh) | 一种基于人工智能的高压电力设备故障诊断方法及*** | |
CN111508517A (zh) | 一种基于噪声特征的微电机智能品控方法 | |
CN114358082A (zh) | 一种基于多传感器特征融合的火电厂风机设备故障诊断方法 | |
CN116230013A (zh) | 一种基于x-vector的变压器故障声纹检测方法 | |
CN116861303A (zh) | 一种变电站数字孪生多源信息融合诊断方法 | |
CN113345399A (zh) | 一种强噪声环境下的机器设备声音监测方法 | |
CN116741148A (zh) | 一种基于数字孪生的语音识别*** | |
CN105916090A (zh) | 一种基于智能化语音识别技术的助听器*** | |
CN115376526A (zh) | 一种基于声纹识别的电力设备故障检测方法及*** | |
CN115910097A (zh) | 一种高压断路器潜伏性故障可听声信号识别方法及*** | |
CN117292713A (zh) | 基于端边云协同的变压器声纹监测方法及*** | |
CN111860246A (zh) | 面向深度卷积神经网络的心音信号分类的数据扩充方法 | |
CN112329819A (zh) | 基于多网络融合的水下目标识别方法 | |
CN115452378A (zh) | 基于功率正则化倒谱系数的滚动轴承故障声纹识别方法 | |
CN214796752U (zh) | 一种基于声纹识别和声源定位的工程车辆识别定位装置 | |
CN113821888B (zh) | 基于周期性冲击特征提取和回声状态网络的振动数据故障诊断方法 | |
CN115862639A (zh) | 一种基于k—均值聚类分析的人工智能语音分析方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |