CN112735468A - 一种基于mfcc的汽车座椅电机异常噪声检测方法 - Google Patents

一种基于mfcc的汽车座椅电机异常噪声检测方法 Download PDF

Info

Publication number
CN112735468A
CN112735468A CN202011618805.4A CN202011618805A CN112735468A CN 112735468 A CN112735468 A CN 112735468A CN 202011618805 A CN202011618805 A CN 202011618805A CN 112735468 A CN112735468 A CN 112735468A
Authority
CN
China
Prior art keywords
mel
data
motor
frequency
noise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011618805.4A
Other languages
English (en)
Inventor
高小清
张光
张�浩
刘浩
罗挺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dongfeng Motor Corp
Original Assignee
Dongfeng Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dongfeng Motor Corp filed Critical Dongfeng Motor Corp
Priority to CN202011618805.4A priority Critical patent/CN112735468A/zh
Publication of CN112735468A publication Critical patent/CN112735468A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/24Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/175Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
    • G10K11/178Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
    • G10K11/1785Methods, e.g. algorithms; Devices
    • G10K11/17853Methods, e.g. algorithms; Devices of the filter
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/26Recognition of special voice characteristics, e.g. for use in lie detectors; Recognition of animal voices
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
    • G10L25/30Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

本发明提供了一种基于MFCC的汽车座椅电机异常噪声检测方法,通过融合声纹识别及模式识别技术,得到的MFCC特征值考虑了人耳对音色的感知规律,实现了对汽车座椅电机异响噪声进行快速、有效的识别的功能。本发明针对汽车座椅电机异常噪声,较传统的频谱分析方法有更高的识别率。本发明对座椅电机异响噪声识别率高,工作效率高,有利于实现座椅电机噪声的自动化检测,降低了检测成本。

Description

一种基于MFCC的汽车座椅电机异常噪声检测方法
技术领域
本发明属于噪声检测技术领域,具体涉及一种基于MFCC的汽车座椅电机异常噪声检测方法。
背景技术
对于汽车,尤其是轿车来说,电动座椅电机异响噪声通常是客户投诉的重点问题之一。各大汽车厂商投入了大量的人力、物力、财力对座椅电机异响噪声进行检测。
目前,对汽车座椅电机异响噪声的检测有两种方法。
第一种方法为主观评价法,依靠有经验的人员对座椅电机噪声进行检查,判断有无异响噪声。这种方式主观性强(对同一电机噪声,不同的人有不同的判断结果),工作效率低下,且人员长时间工作时易引起听觉疲劳从而导致错检、漏检等问题,不利于产品的自动化生产。
第二种方法为频谱分析法,采集座椅电机噪声信号,对其进行频谱分析,依据频谱结果判断有无异响噪声。这种方式有很大的局限性,只能甄别出总声压级过大的电机噪声。对于电机噪声异响但总声压级不大的电机不能有效识别,造成很高的错检率,致使该方法不实用。
MFCC(Mel频率倒谱系数),是Mel Frequency Cepstrum Coefficient的缩写。Mel(美尔)是主观音高的单位,而Hz(赫兹)则是客观音高的单位。Mel频率是基于人耳听觉特性提出来的,它与Hz(赫兹)频率是非线性关系。Mel频率倒谱系数(MFCC)是利用它们之间的这种关系,计算得到的倒谱特征。
现有一种汽车座椅滑轨异响检测方法及***,属于异音异响模式识别技术领域,解决了目前采取将滑轨单独搬运到静音室里面,由熟练工人将其在工装上滑动,辅助以声级计等技术手段,来进行异响检测,检测效率低下的问题,该方法包括以下步骤:S1:获取作为训练样本的原始振动信号并对其进行降噪处理,得到有效振动信号;S2:从有效振动信号中提取时域特征、频域特征、包络特征等特征参数;S3:将特征参数输入到混合模型中以对模型进行训练,得到异响识别模型及其对应的混淆矩阵;该混淆矩阵包括异响识别模型的测试准确率;S4:将待测的原始振动信号输入到测试准确率高于预设值时对应的异响识别模型中,实现待测振动信号的自动判定;本发明通过基于工业大数据和机器学习模型的检测手段,不仅能够实现自动识别,而且检测效率高,排除了人为不稳定因素,提高了检测的准确性。该方法未测量噪声信号,未考虑人耳的听觉特性,未考虑所测得信号与人的主观感受的一致性。
另有一种基于MFCC和SVM的车窗电机异常噪声检测方法及装置,采集电机空载运转时声音信号并对信号进行预处理。预处理阶段采用二阶汉宁自卷积窗作为窗函数对声音信号进行截取。预处理后数据提取MFCC参数并输入SVM中进行异常噪声判断。将MFCC特征值及判断结果Label存入历史数据库。为提高SVM判别准确率,采用人工蜂群算法实现SVM参数自动调整及更新;方法具有可靠性高,实用性强等特点,在实际生产应用中能有效判别电机异常噪声。该模式识别方法为支持向量机(SVM)模型,相比BP神经网络模型,其拟合精度较低,致使其最终的识别可靠性相对较差。该专利未能正确阐述Mel滤波器的建立过程,未能正确阐明离散余弦变换算法。
发明内容
本发明要解决的技术问题是:提供一种基于MFCC的汽车座椅电机异常噪声检测方法,用于对汽车座椅电机异响噪声进行快速、有效的识别。
本发明为解决上述技术问题所采取的技术方案为:一种基于MFCC的汽车座椅电机异常噪声检测方法,包括以下步骤:
S1:获取座椅电机噪声信号;
S2:对座椅电机噪声信号进行预处理;
S3:对预处理后的数据进行频谱分析得到频谱数据;
S4:对频谱数据进行滤波;
S5:对滤波后的数据求对数,并进行离散余弦变换提取MFCC特征值;
S6:根据MFCC特征值生成BP神经网络训练数据集;
S7:通过BP神经网络训练数据集建立BP神经网络模型;
S8:对BP神经网络模型进行训练;
S9:采用训练好的BP神经网络模型检测座椅电机噪声。
按上述方案,所述的步骤S1中,具体步骤为:在一致的环境和条件下,采集带负荷的座椅电机的包括前后移动、上下移动、座椅靠背翻转运动的噪声信号{s0(q)},1≤q≤Ns0,Ns0为信号{s0(q)}的长度;采样时间为座椅进行最大程度的运动的时长。
进一步的,所述的步骤S2中,具体步骤为:
S21:设s0(q)为噪声信号{s0(q)}的第q个数据,μ的取值范围为0.9~1.0;采用数字滤波器对噪声信号{s0(q)}进行预加重以提升信号的高频部分,使信号的频谱变得平坦,得到预加重后的信号{s(q)}:
s(q)=s0(q+1)-μ*s0(q),1≤q≤(Ns0-1) (1);
S22:帧是N个连续采样点集合成的一个数据分析单位,对预加重后的信号分帧,用于保证电机噪声分析有足够高的时间分辨率;设分帧后的第i帧数据为x(i),则一帧对应的时间长度为N/电机噪声采集频率;
S23:对分帧后的数据施加窗函数用于减少频谱泄露;将窗函数设定为汉明窗,设p、P为整数,自变量为p,因变量w(p)为窗函数的幅度,P为常数,窗函数的总长度L=P+1,L等于帧长N;则窗函数的表达式为:
w(p)=0.54-0.46*cos(2*π*p/P),0≤p≤P (2)
为避免窗函数边缘数据的衰减,充分利用采集的数据,将数据帧进行重叠。
进一步的,所述的步骤S3中,具体步骤为:
S31:对预处理后的各帧数据进行FFT变换,设第i帧数据为x(i),第i帧频谱数据中第k条谱线的频谱为X(i,k),则各帧的频谱为:
X(i,k)=fft[x(i)] (3)
频谱为复数,用||表示取模运算,对频谱取模得到幅值谱,则第i帧频谱数据中第k条谱线的幅值为A(i,k)为:
A(i,k)=|X(i,k)| (4)
对A(i,k)取平方得到数据的能量谱,则第i帧频谱数据中第k条谱线的能量E(i,k)为:
E(i,k)=|X(i,k)|2 (5)。
进一步的,所述的步骤S4中,具体步骤为:
S41:设置Mel三角滤波器组,并计算Mel三角滤波器组的数据;
设频率为f,Mel值为mel,则Mel刻度和频率(Hz)的关系为:
mel=2595*log10(1+f/700) (6)
设1≤m≤M,滤波器的个数为M,第k条谱线的幅值为H(k),第m个滤波器的中心频率为f(m),则第m个三角滤波器的传递函数为:
Figure BDA0002877624120000041
Mel三角滤波器组各滤波器的端点频率及中心频率f(m)计算如下:
依据香农采样定理,电机噪声采样频率的分析频率上限为电机噪声采样频率/2,依据式6求mel值记为mel_max;
将电机噪声的频率下限代入式6求mel值记为mel_min;
在Mel刻度上,将区间[mel_min,mel_max]均匀分成M+1段,段长mel_step为:
mel_step=(mel_max-mel_min)/(M+1) (8)
Mel刻度上Mel三角滤波器组的第j个端点频率m1(j)为:
m1(j)=mel_min+j*mel_step,0≤j≤(M+1) (9)
式6的反函数为:
Figure BDA0002877624120000042
将m1(j)代入式10得到f1(j);设数据帧的长度为N,数据的采样频率为fs,将f1(j)乘以N/fs得到f(j)为:
f(j)=f1(j)*N/fs,0≤j≤(M+1) (11)
第一个滤波器的中心频率为f(1),左端点频率为f(0),右端点频率为f(2);
第j个滤波器的中心频率为f(j),左端点频率为f(j-1),右端点频率为f(j+1);
最后一个滤波器M的中心频率为f(M),左端点频率为f(M-1),右端点频率为f(M+1);
S42:对频谱数据进行Mel滤波Mel处理;
设滤波器的个数为M,每一帧的数据长度由N个变为M个,用于缩减数据维数;则每一帧频谱数据通过Mel滤波器后的频谱能量为数据能量谱E(i,k)与Mel三角滤波器组传递函数Hm(k)的乘积和为:
F(i,m)=∑kE(i,k)*Hm(k),1≤m≤M (12)。
进一步的,所述的步骤S5中,具体步骤为:设C为Mel倒谱系数MFCC,则对滤波后的数据求对数,进行离散余弦变换得到第i帧数据的第t个系数为C(i,t)为:
Figure BDA0002877624120000051
其中:
Figure BDA0002877624120000052
进一步的,所述的步骤S6中,具体步骤为:
S61:对采集正常电机信号和座椅电机噪声信号得到的音频分别提取MFCC特征值得到R列M行矩阵input_mat,为BP神经网络训练数据集的输入矩阵;所有电机数据的帧数之和为R,input_mat的一列代表某个电机某帧数据的M个Mel倒谱系数;
S62:将正常电机标记为0,存在异常噪声的电机标记为1,得到数据与input_mat的数据一一对应的维数为R的行向量output_mat,为BP神经网络训练数据集的输出矩阵。
进一步的,所述的步骤S7中,具体步骤为:
S71:BP神经网络的体系结构包括三层:第一层为输入层,共n1个节点,对应表示n1个输入参数;第二层为隐含层,共n2个节点,由网络的训练过程以自适应的方式确定;第三层为输出层,共n3个节点,由***实际需要输出的响应确定;
BP神经网络的数学模型为:
设输入向量为x=(x1,x2,...,xn1)T
中间层向量为y=(y1,y2,...,yn2)T
输出向量为o=(o1,o2,...,on3)T
则输入向量x与输出向量o的函数关系为:
o=F2(H*F1(W*x+b1)+b2) (15)
中间层向量y的表达式为:
y=W*x+b1 (16)
其中输入层与中间层之间的权重系矩阵为W,中间层与输出层数之间的权重系矩阵为H;输入层与中间层之间的偏置矩阵为b1,中间层与输出层之间的偏置矩阵为b2;激活函数为F1(z)、F2(z)采用sigmoid函数:
Figure BDA0002877624120000061
输入层节点数n1等于滤波器的个数M,输出层节点数为n3=1,隐藏层节点数n2由下式估算得出:
n2=[log2n1] (18);
S72:BP神经网络的输入信号为训练数据集的输入矩阵input_mat;
在输入BP人工神经网络之前,将矩阵input_mat规格化为0~1之间的数:
设所有帧第i个系数的最大值和最小值即input_mat矩阵的最大值和最小值分别为cmax和cmin,滤波器个数即矩阵input_mat的行数为M,input_mat中的每一列为某帧数据的MFCC,对input_mat中某MFCC的第i个系数c按如下公式进行规格化,规格化系数xi为:
Figure BDA0002877624120000062
BP神经网络的输出信号为训练数据集的输出矩阵output_mat。
进一步的,所述的步骤S8中,具体步骤为:
S81:设输入节点i和中间层节点j之间的连接权值为Wij,中间节点j和输出层节点k之间的连接权值为Hjk,中间节点j的偏置值为b1j,输出层节点k的偏置值为b2k,这4个矩阵的初始值均为-1到1之间的随机数;
S82:根据输入向量x、矩阵W、偏置矩阵b1,运用式16计算中间层向量y;
S83:根据中间层向量y、矩阵H、偏置矩阵b2,运用式17和式15计算输出向量o;
S84:计算输出向量o与取值为0或1的电机噪声标记值之间的偏差;
S85:根据偏差运用误差反向传播算法不断修正Wij和Hjk的值,直至***误差小于等于设定的输出误差限值时完成BP神经网络的训练过程,并保存各层之间的权重系数矩阵和偏置矩阵。
进一步的,所述的步骤S9中,具体步骤为:
S91:执行步骤S1至步骤S5,得到待检测座椅电机噪声各帧数据的MFCC共T帧;
S92:将T帧MFCC输入到步骤S8得到的训练好的BP神经网络中,得到T个BP神经网络的输出值,记为ri,1≤i≤T;
S93:分别计算ri与正常电机噪声标记0和异常噪声的电机标记1的方差和,结果分别记为R0、R1:
Figure BDA0002877624120000071
Figure BDA0002877624120000072
比较R0、R1并取小,结果记为Rmin;若Rmin=R0,则将待测座椅电机噪声标记为0,为正常电机噪声;若Rmin=R1,则将待测座椅电机噪声标记为1,座椅电机存在异响噪声;
S94:若发现新的异响电机噪声不在用于训练BP神经网络的电机噪声样本中,则执行步骤S1将新的电机加入到原有的电机训练样本中,并重新对BP神经网络进行训练。
本发明的有益效果为:
1.本发明的一种基于MFCC的汽车座椅电机异常噪声检测方法,通过融合声纹识别及模式识别技术,得到的MFCC特征值考虑了人耳对音色的感知规律,实现了对汽车座椅电机异响噪声进行快速、有效的识别的功能。
2.针对汽车座椅电机异常噪声,本发明较传统的频谱分析方法有更高的识别率。
3.本发明对座椅电机异响噪声识别率高,工作效率高,有利于实现座椅电机噪声的自动化检测,降低了检测成本。
附图说明
图1是本发明实施例的流程图。
图2是本发明实施例的Mel刻度和频率(Hz)的关系曲线图。
具体实施方式
下面结合附图和具体实施方式对本发明作进一步详细的说明。
参见图1,本发明实施例的一种基于MFCC的汽车座椅电机异常噪声检测方法,包括以下步骤:
S1:获取座椅电机噪声信号。
采集座椅电机前后移动(或上下移动、座椅靠背翻转运动)的噪声信号{s0(q)}(1≤q≤Ns0,Ns0为信号{s0(q)}的长度)。采样频率8000Hz,采样时间为座椅从最前端移动到最后端的时长,采集到的数据以wave格式保存。上述数据采集环境、条件应一致;须在座椅带负荷的条件下进行,即将标准假人置于座椅上并进行固定。
S2:读取座椅电机噪声信号,对其进行预处理。
预处理过程包括预加重,分帧,加窗。
预加重的目的是提升高频部分,使信号的频谱变得平坦,保持从低频到高频的整个频带中,能用同样的信噪比求频谱。预加重用数字滤波器实现:
s(q)=s0(q+1)-μ*s0(q),1≤q≤(Ns0-1) (1)
其中,μ的取值介于0.9~1.0之间,通常取0.97;s0(q)为噪声信号{s0(q)}的第q个数据,{s(q)}为预加重后得到的信号。
将N个连续采样点集合成一个数据分析单位,称为帧。本发明中N取值为256,电机噪声采集频率为8000Hz,则一帧对应的时间长度为256/8000×1000=32ms。分帧的目的是保证电机噪声分析有足够高的时间分辨率;分帧后,第i帧数据记为x(i)。
窗函数设定为汉明窗。加窗(施加窗函数)的目的是减少频谱泄露。其表达式为:
w(p)=0.54-0.46*cos(2*π*p/P),0≤p≤P (2)
其中,p、P为整数。p为自变量,w(p)为因变量,为窗函数的幅度。P为常数(窗函数的总长度L=P+1,L须等于帧长N。)
考虑到对数据进行施加窗函数时,窗函数边缘的数据有很大的衰减。为充分利用采集的数据,数据帧之间须有重叠。
本实施例中,重叠数为128,即重叠率为50%。
S3:对数据进行频谱分析。
对各帧数据进行FFT(快速傅里叶变换)变换,得到各帧的频谱:
X(i,k)=fft[x(i)] (3)
其中x(i)表示第i帧数据;X(i,k)表示第i帧频谱数据中第k条谱线的频谱。
频谱为复数,||表示取模运算,对其取模,得到幅值谱:
A(i,k)=|X(i,k)| (4)
A(i,k)表示第i帧频谱数据中第k条谱线的幅值。
对A(i,k)取平方,得到数据的能量谱:
E(i,k)=|X(i,k)|2 (5)
E(i,k)表示第i帧频谱数据中第k条谱线的能量。
S4:对能量谱数据进行滤波。
S41:计算Mel三角滤波器组数据。
人耳对声音的感知程度,与频率(Hz)不成线性关系,但在Mel刻度上,人对音调的主观感知与Mel刻度则为线性关系。
Mel刻度和频率(Hz)的关系如下:
mel=2595*log10(1+f/700) (6)
其中,f为频率(Hz),mel为Mel值。Mel刻度和频率(Hz)的关系曲线如图2所示。
由式6及图2可以看出,Mel刻度在低频(Hz)部分的分辨率高,在高频(Hz)的分辨率低,与人耳的听觉特性是相符的,Mel刻度模拟了人耳的听觉特性。结合人耳的掩蔽效应,人们设计了Mel三角滤波器组,这些滤波器在低频段较密集,在高频段较稀疏。
第m个三角滤波器的传递函数为:
Figure BDA0002877624120000091
其中,1≤m≤M,M为滤波器个数;H(k)为第k条谱线的幅值;f(m)为第m个滤波器的中心频率。
Mel三角滤波器组各滤波器的端点频率及中心频率f(m)可依照如下方式计算:
本实施例中电机噪声采样频率8000Hz,依据香农采样定理,其分析频率上限为8000/2=4000Hz,依据式6,将4000Hz代入其中,求出其mel值,记为mel_max。
选定所关注电机噪声的频率下限,如20Hz,代入式6,求出其mel值,记为mel_min。
在Mel刻度上,将区间[mel_min,mel_max]均匀分成M+1段,段长mel_step为:
mel_step=(mel_max-mel_min)/(M+1) (8)
m1(j)=mel_min+j*mel_step,0≤j≤(M+1) (9)
m1(j)为Mel刻度上Mel三角滤波器组的第j个端点频率。
式6的反函数为:
Figure BDA0002877624120000101
将m1(j)(0≤j≤(M+1))代入式10中,得到f1(j),0≤j≤(M+1)。
将f1(j)乘以N/fs,得f(j),即:
f(j)=f1(j)*N/fs,0≤j≤(M+1) (11)
其中,N为数据帧的长度,fs为数据的采样频率。本实施例中,N=256,fs=8000Hz。
则第一个滤波器的中心频率为f(1),左端点频率为f(0),右端点频率为f(2);
则第j个滤波器的中心频率为f(j),左端点频率为f(j-1),右端点频率为f(j+1)。
最后一个滤波器M的中心频率为f(M),左端点频率为f(M-1),右端点频率为f(M+1)。
S42:对频谱数据进行Mel滤波Mel处理。
每一帧频谱数据通过Mel滤波器后的频谱能量为数据能量谱E(i,k)与Mel三角滤波器组传递函数Hm(k)的乘积和:
F(i,m)=∑kE(i,k)*Hm(k),1≤m≤M (12)
其中,M为滤波器个数,典型值为24。
至此,每一帧的数据长度由N个变为M个,数据维数大幅缩减。
S5:对滤波后的数据求对数,进行离散余弦变换。
Figure BDA0002877624120000111
其中,
Figure BDA0002877624120000112
M为滤波器个数。
C即为MFCC(Mel倒谱系数),C(i,t)为第i帧数据的第t个系数。
S6:生成BP神经网络训练数据集。
按照步骤S1,采集100个座椅电机噪声信号,包括正常电机40个,存在异常噪声的电机60个,得到100段音频。
按照步骤S2至步骤S5,对这100段音频分别提取MFCC特征值,可得到R列M行矩阵,记为input_mat。每一列代表某个电机某帧数据的M个Mel倒谱系数。R为100个电机的帧数之和。
将正常电机标记为0,存在异常噪声的电机标记为1,则可得到与input_mat相对应的一个维数为R的行向量,记为output_mat。
input_mat与output_mat的数据要一一对应。如input_mat的第一列对应正常电机,则output_mat的第一列数值应为0;反之亦然。
input_mat即为BP神经网络训练数据集的输入矩阵,output_mat即为BP神经网络训练数据集的输出矩阵。
S7:建立BP神经网络模型。
本发明采用的BP神经网络体系结构由三层组成,第一层为输入层,共n1个节点,对应了表示n1个输入参数。第二层为隐含层,共n2个节点,由网络的训练过程以自适应的方式确定。第三层为输出层,共n3个节点,由***实际需要输出的响应确定。
该网络的数学模型为:
输入向量:x=(x1,x2,...,xn1)T
中间层向量:y=(y1,y2,...,yn2)T
输出向量:o=(o1,o2,...,on3)T
输入向量与输出向量的函数关系为:
o=F2(H*F1(W*x+b1)+b2) (15)
其中,x、o即为输入向量和输出向量,中间层向量y的表达式为:
y=W*x+b1 (16)
其中,W、H分别为输入层与中间层(隐藏层)、中间层与输出层之间的权重系数矩阵;b1、b2分别为输入层与中间层(隐藏层)、中间层与输出层之间的偏置矩阵。
F1(z)、F2(z)为激活函数,一般采用sigmoid函数。
Figure BDA0002877624120000121
输入层节点数n1等于滤波器个数M,输出层节点数为n3=1(正常电机取值为0,存在异常噪声的电机取值为1)。隐藏层节点数n2由下式估算得出:
n2=[log2n1] (18)
BP神经网络输入信号为训练数据集的输入矩阵input_mat。
在矩阵input_mat输入BP人工神经网络之前,需要将其规格化为0~1之间的数。
具体而言,input_mat中的每一列即为某帧数据的MFCC,对于input_mat中某MFCC中的第i个系数c,按如下公式进行规格化:
Figure BDA0002877624120000122
其中,cmax和cmin分别为所有帧第i个系数的最大值和最小值(即input_mat矩阵的最大值和最小值),xi即为所求的规格化系数,M为矩阵input_mat的行数(也即滤波器个数)。
BP神经网络输出信号为训练数据集的输出矩阵output_mat。
S8:对BP神经网络进行训练。
建立好BP神经网络节点模型后,即可进行BP神经网络的训练。设定输入节点i和隐含层节点j之间的连接权值Wij,隐层节点j和输出层节点k之间的连接权值Hjk,隐层节点j的偏置值b1j,输出层节点k的偏置值b2k这4个矩阵的初始值,其均为-1到1之间的随机数。
根据输入向量x、矩阵W、偏置矩阵b1,运用式16,计算得到中间层(隐含层)向量y。
根据中间层向量y、矩阵H、偏置矩阵b2,运用式17和式15,计算得到输出向量o。
计算输出向量o与电机噪声标记值(取值为0或1)之间的偏差。根据这个偏差,运用误差反向传播算法(BP算法),不断修正Wij和Hjk的值,直至***误差小于等于设定的输出误差限值时,完成BP神经网络的训练过程并保存各层之间的权重系数矩阵和偏置矩阵。
S9:座椅电机噪声检测。
依据步骤S1至步骤S5,得到待检测座椅电机噪声各帧数据的MFCC,如得到T帧MFCC。
将T帧MFCC输入到已训练好的BP神经网络中(步骤八中得到的BP神经网络),可以得到T个BP神经网络的输出值,记为ri,1≤i≤T。
分别计算ri与0和1的方差和(0、1为电机噪声的标记值,正常电机噪声标记为0;存在异常噪声的电机标记为1),如下式,结果分别记为R0、R1。
Figure BDA0002877624120000131
Figure BDA0002877624120000132
将R0、R1进行比较,取小,结果记为Rmin。如Rmin=R0,则待测座椅电机噪声标记为0,即为正常电机噪声;如Rmin=R1,则待测座椅电机噪声标记为1,即座椅电机存在异响噪声。
一般来说,步骤S141、S160、S170、S180用于训练阶段,只需进行一次,用于建立座椅电机噪声BP神经网络检测模型。在检测阶段,是不需要进行这些步骤的,如图1所示。
特别地,当发现新的异响电机噪声时(即这个新的电机异常噪声类型不在原有的用于训练BP神经网络的电机噪声样本中),须将这个新的电机加入到原有的电机训练样本中,并重新对BP神经网络进行训练。
以上实施例仅用于说明本发明的设计思想和特点,其目的在于使本领域内的技术人员能够了解本发明的内容并据以实施,本发明的保护范围不限于上述实施例。所以,凡依据本发明所揭示的原理、设计思路所作的等同变化或修饰,均在本发明的保护范围之内。

Claims (10)

1.一种基于MFCC的汽车座椅电机异常噪声检测方法,其特征在于:包括以下步骤:
S1:获取座椅电机噪声信号;
S2:对座椅电机噪声信号进行预处理;
S3:对预处理后的数据进行频谱分析得到频谱数据;
S4:对频谱数据进行滤波;
S5:对滤波后的数据求对数,并进行离散余弦变换提取MFCC特征值;
S6:根据MFCC特征值生成BP神经网络训练数据集;
S7:通过BP神经网络训练数据集建立BP神经网络模型;
S8:对BP神经网络模型进行训练;
S9:采用训练好的BP神经网络模型检测座椅电机噪声。
2.根据权利要求1所述的一种基于MFCC的汽车座椅电机异常噪声检测方法,其特征在于:所述的步骤S1中,具体步骤为:
在一致的环境和条件下,采集带负荷的座椅电机的包括前后移动、上下移动、座椅靠背翻转运动的噪声信号{s0(q)},1≤q≤Ns0,Ns0为信号{s0(q)}的长度;
采样时间为座椅进行最大程度的运动的时长。
3.根据权利要求2所述的一种基于MFCC的汽车座椅电机异常噪声检测方法,其特征在于:所述的步骤S2中,具体步骤为:
S21:设s0(q)为噪声信号{s0(q)}的第q个数据,μ的取值范围为0.9~1.0;采用数字滤波器对噪声信号{s0(q)}进行预加重以提升信号的高频部分,使信号的频谱变得平坦,得到预加重后的信号{s(q)}:
s(q)=s0(q+1)-μ*s0(q),1≤q≤(Ns0-1) (1);
S22:帧是N个连续采样点集合成的一个数据分析单位,对预加重后的信号分帧,用于保证电机噪声分析有足够高的时间分辨率;设分帧后的第i帧数据为x(i),则一帧对应的时间长度为N/电机噪声采集频率;
S23:对分帧后的数据施加窗函数用于减少频谱泄露;将窗函数设定为汉明窗,设p、P为整数,自变量为p,因变量w(p)为窗函数的幅度,P为常数,窗函数的总长度L=P+1,L等于帧长N;则窗函数的表达式为:
w(p)=0.54-0.46*cos(2*π*p/P),0≤p≤P (2)
为避免窗函数边缘数据的衰减,充分利用采集的数据,将数据帧进行重叠。
4.根据权利要求3所述的一种基于MFCC的汽车座椅电机异常噪声检测方法,其特征在于:所述的步骤S3中,具体步骤为:
S31:对预处理后的各帧数据进行FFT变换,设第i帧数据为x(i),第i帧频谱数据中第k条谱线的频谱为X(i,k),则各帧的频谱为:
X(i,k)=fft[x(i)] (3)
频谱为复数,用||表示取模运算,对频谱取模得到幅值谱,则第i帧频谱数据中第k条谱线的幅值为A(i,k)为:
A(i,k)=|X(i,k)| (4)
对A(i,k)取平方得到数据的能量谱,则第i帧频谱数据中第k条谱线的能量E(i,k)为:
E(i,k)=|X(i,k)|2 (5)。
5.根据权利要求4所述的一种基于MFCC的汽车座椅电机异常噪声检测方法,其特征在于:所述的步骤S4中,具体步骤为:
S41:设置Mel三角滤波器组,并计算Mel三角滤波器组的数据;
设频率为f,Mel值为mel,则Mel刻度和频率(Hz)的关系为:
mel=2595*log10(1+f/700) (6)
设1≤m≤M,滤波器的个数为M,第k条谱线的幅值为H(k),第m个滤波器的中心频率为f(m),则第m个三角滤波器的传递函数为:
Figure FDA0002877624110000021
Mel三角滤波器组各滤波器的端点频率及中心频率f(m)计算如下:
依据香农采样定理,电机噪声采样频率的分析频率上限为电机噪声采样频率/2,依据式6求mel值记为mel_max;
将电机噪声的频率下限代入式6求mel值记为mel_min;
在Mel刻度上,将区间[mel_min,mel_max]均匀分成M+1段,段长mel_step为:
mel_step=(mel_max-mel_min)/(M+1) (8)
Mel刻度上Mel三角滤波器组的第j个端点频率m1(j)为:
m1(j)=mel_min+j*mel_step,0≤j≤(M+1) (9)
式6的反函数为:
Figure FDA0002877624110000031
将m1(j)代入式10得到f1(j);设数据帧的长度为N,数据的采样频率为fs,将f1(j)乘以N/fs得到f(j)为:
f(j)=f1(j)*N/fs,0≤j≤(M+1) (11)
第一个滤波器的中心频率为f(1),左端点频率为f(0),右端点频率为f(2);
第j个滤波器的中心频率为f(j),左端点频率为f(j-1),右端点频率为f(j+1);
最后一个滤波器M的中心频率为f(M),左端点频率为f(M-1),右端点频率为f(M+1);
S42:对频谱数据进行Mel滤波Mel处理;
设滤波器的个数为M,每一帧的数据长度由N个变为M个,用于缩减数据维数;则每一帧频谱数据通过Mel滤波器后的频谱能量为数据能量谱E(i,k)与Mel三角滤波器组传递函数Hm(k)的乘积和为:
F(i,m)=∑kE(i,k)*Hm(k),1≤m≤M (12)。
6.根据权利要求5所述的一种基于MFCC的汽车座椅电机异常噪声检测方法,其特征在于:所述的步骤S5中,具体步骤为:设C为Mel倒谱系数MFCC,则对滤波后的数据求对数,进行离散余弦变换得到第i帧数据的第t个系数为C(i,t)为:
Figure FDA0002877624110000032
其中:
Figure FDA0002877624110000033
7.根据权利要求6所述的一种基于MFCC的汽车座椅电机异常噪声检测方法,其特征在于:所述的步骤S6中,具体步骤为:
S61:对采集正常电机信号和座椅电机噪声信号得到的音频分别提取MFCC特征值得到R列M行矩阵input_mat,为BP神经网络训练数据集的输入矩阵;所有电机数据的帧数之和为R,input_mat的一列代表某个电机某帧数据的M个Mel倒谱系数;
S62:将正常电机标记为0,存在异常噪声的电机标记为1,得到数据与input_mat的数据一一对应的维数为R的行向量output_mat,为BP神经网络训练数据集的输出矩阵。
8.根据权利要求7所述的一种基于MFCC的汽车座椅电机异常噪声检测方法,其特征在于:所述的步骤S7中,具体步骤为:
S71:BP神经网络的体系结构包括三层:第一层为输入层,共n1个节点,对应表示n1个输入参数;第二层为隐含层,共n2个节点,由网络的训练过程以自适应的方式确定;第三层为输出层,共n3个节点,由***实际需要输出的响应确定;
BP神经网络的数学模型为:
设输入向量为x=(x1,x2,...,xn1)T
中间层向量为y=(y1,y2,...,yn2)T
输出向量为o=(o1,o2,...,on3)T
则输入向量x与输出向量o的函数关系为:
o=F2(H*F1(W*x+b1)+b2) (15)
中间层向量y的表达式为:
y=W*x+b1 (16)
其中输入层与中间层之间的权重系矩阵为W,中间层与输出层数之间的权重系矩阵为H;输入层与中间层之间的偏置矩阵为b1,中间层与输出层之间的偏置矩阵为b2;激活函数为F1(z)、F2(z)采用sigmoid函数:
Figure FDA0002877624110000041
输入层节点数n1等于滤波器的个数M,输出层节点数为n3=1,隐藏层节点数n2由下式估算得出:
n2=[log2n1] (18);
S72:BP神经网络的输入信号为训练数据集的输入矩阵input_mat;
在输入BP人工神经网络之前,将矩阵input_mat规格化为0~1之间的数:
设所有帧第i个系数的最大值和最小值即input_mat矩阵的最大值和最小值分别为cmax和cmin,滤波器个数即矩阵input_mat的行数为M,input_mat中的每一列为某帧数据的MFCC,对input_mat中某MFCC的第i个系数c按如下公式进行规格化,规格化系数xi为:
Figure FDA0002877624110000051
BP神经网络的输出信号为训练数据集的输出矩阵output_mat。
9.根据权利要求8所述的一种基于MFCC的汽车座椅电机异常噪声检测方法,其特征在于:所述的步骤S8中,具体步骤为:
S81:设输入节点i和中间层节点j之间的连接权值为Wij,中间节点j和输出层节点k之间的连接权值为Hjk,中间节点j的偏置值为b1j,输出层节点k的偏置值为b2k,这4个矩阵的初始值均为-1到1之间的随机数;
S82:根据输入向量x、矩阵W、偏置矩阵b1,运用式16计算中间层向量y;
S83:根据中间层向量y、矩阵H、偏置矩阵b2,运用式17和式15计算输出向量o;
S84:计算输出向量o与取值为0或1的电机噪声标记值之间的偏差;
S85:根据偏差运用误差反向传播算法不断修正Wij和Hjk的值,直至***误差小于等于设定的输出误差限值时完成BP神经网络的训练过程,并保存各层之间的权重系数矩阵和偏置矩阵。
10.根据权利要求9所述的一种基于MFCC的汽车座椅电机异常噪声检测方法,其特征在于:所述的步骤S9中,具体步骤为:
S91:执行步骤S1至步骤S5,得到待检测座椅电机噪声各帧数据的MFCC共T帧;
S92:将T帧MFCC输入到步骤S8得到的训练好的BP神经网络中,得到T个BP神经网络的输出值,记为ri,1≤i≤T;
S93:分别计算ri与正常电机噪声标记0和异常噪声的电机标记1的方差和,结果分别记为R0、R1:
Figure FDA0002877624110000061
Figure FDA0002877624110000062
比较R0、R1并取小,结果记为Rmin;若Rmin=R0,则将待测座椅电机噪声标记为0,为正常电机噪声;若Rmin=R1,则将待测座椅电机噪声标记为1,座椅电机存在异响噪声;
S94:若发现新的异响电机噪声不在用于训练BP神经网络的电机噪声样本中,则执行步骤S1将新的电机加入到原有的电机训练样本中,并重新对BP神经网络进行训练。
CN202011618805.4A 2020-12-31 2020-12-31 一种基于mfcc的汽车座椅电机异常噪声检测方法 Pending CN112735468A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011618805.4A CN112735468A (zh) 2020-12-31 2020-12-31 一种基于mfcc的汽车座椅电机异常噪声检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011618805.4A CN112735468A (zh) 2020-12-31 2020-12-31 一种基于mfcc的汽车座椅电机异常噪声检测方法

Publications (1)

Publication Number Publication Date
CN112735468A true CN112735468A (zh) 2021-04-30

Family

ID=75607938

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011618805.4A Pending CN112735468A (zh) 2020-12-31 2020-12-31 一种基于mfcc的汽车座椅电机异常噪声检测方法

Country Status (1)

Country Link
CN (1) CN112735468A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115512716A (zh) * 2021-06-23 2022-12-23 华晨宝马汽车有限公司 用于识别车辆异响的方法、设备和***
CN116718218A (zh) * 2023-05-30 2023-09-08 恩迈智能数字医疗(嘉兴)有限公司 一种光电集成式传感芯片测试数据处理方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105841797A (zh) * 2016-03-15 2016-08-10 中南大学 一种基于mfcc和svm的车窗电机异常噪声检测方法及装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105841797A (zh) * 2016-03-15 2016-08-10 中南大学 一种基于mfcc和svm的车窗电机异常噪声检测方法及装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115512716A (zh) * 2021-06-23 2022-12-23 华晨宝马汽车有限公司 用于识别车辆异响的方法、设备和***
CN116718218A (zh) * 2023-05-30 2023-09-08 恩迈智能数字医疗(嘉兴)有限公司 一种光电集成式传感芯片测试数据处理方法
CN116718218B (zh) * 2023-05-30 2023-12-22 恩迈智能数字医疗(嘉兴)有限公司 一种光电集成式传感芯片测试数据处理方法

Similar Documents

Publication Publication Date Title
CN112560822B (zh) 一种基于卷积神经网络的道路声信号分类方法
CN109949823B (zh) 一种基于dwpt-mfcc与gmm的车内异响识别方法
CN113707176B (zh) 一种基于声信号及深度学习技术的变压器故障检测方法
WO2019232829A1 (zh) 声纹识别方法、装置、计算机设备及存储介质
CN112735456B (zh) 一种基于dnn-clstm网络的语音增强方法
CN111261189B (zh) 一种车辆声音信号特征提取方法
CN111653289B (zh) 一种回放语音检测方法
CN113405825B (zh) 一种基于声音信号的带式输送机故障诊断方法
CN101829689B (zh) 一种基于声信号的热轧带钢甩尾故障识别方法
CN103440869A (zh) 一种音频混响的抑制装置及其抑制方法
CN110299141B (zh) 一种声纹识别中录音回放攻击检测的声学特征提取方法
CN112735468A (zh) 一种基于mfcc的汽车座椅电机异常噪声检测方法
CN110570880A (zh) 一种鼾声信号识别方法
CN101426168A (zh) 一种发声体异常音检测方法及***
CN102968990A (zh) 说话人识别方法和***
CN112908344B (zh) 一种鸟鸣声智能识别方法、装置、设备和介质
Wang et al. Vocal folds disorder detection using pattern recognition methods
CN114487733A (zh) 一种基于声纹的局部放电检测方法
CN116741148A (zh) 一种基于数字孪生的语音识别***
CN111508504A (zh) 基于听觉中枢感知机理的说话人识别方法
CN114093385A (zh) 一种无人机检测方法及装置
CN115910097A (zh) 一种高压断路器潜伏性故障可听声信号识别方法及***
Dang et al. Cochlear filter cepstral coefficients of acoustic signals for mechanical faults identification of power transformer
CN111785262A (zh) 一种基于残差网络及融合特征的说话人年龄性别分类方法
CN115002642A (zh) 一种基于听觉掩蔽结合svd-mrmr的扬声器异常声的特征提取方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210430