CN109034046A - 一种基于声学检测的电能表内异物自动识别方法 - Google Patents
一种基于声学检测的电能表内异物自动识别方法 Download PDFInfo
- Publication number
- CN109034046A CN109034046A CN201810804638.9A CN201810804638A CN109034046A CN 109034046 A CN109034046 A CN 109034046A CN 201810804638 A CN201810804638 A CN 201810804638A CN 109034046 A CN109034046 A CN 109034046A
- Authority
- CN
- China
- Prior art keywords
- electric energy
- energy meter
- foreign matter
- time
- voice signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/02—Preprocessing
- G06F2218/04—Denoising
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/08—Feature extraction
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
本发明公开了一种基于声学检测的电能表内异物自动识别方法,它包括:采集电能表内的声音信号数据;对采集到的声音信号数据进行通道变换,提取含有异物通道的声音信号数据;对提取的声音信号数据进行去噪处理;对去噪后的声音信号数据进行预处理,组合成特征矩阵,对特征矩阵进行处理得到最大特征值对应的特征向量;将特征向量输入基于Adaboost的神经网络弱分类器中,以该特征向量作为电能表内异物声音信号的特征进行分类识别。本发明提高了的电能表的检测效率,有利于提高电能表检测的自动化进程;缩短了电能表检测的时间,提高了生产效率和设备的利用率,实现了快速、高效、安全可靠的电能表异物声音检测工作;大大提高了异物电能表的识别率。
Description
技术领域
本发明涉及电能表技术领域,特别是一种基于声学检测的电能表内异物自动识别方法。
背景技术
现有电能表内异物的检测一般采用“手摇+人耳听”的方式。在检定车间内,检定人员晃动电能表听声音,每次只能摇一只表,检测效率较低;此外,手工摇表方式动作的一致性差,会导致检测结果不稳定。针对现在手工摇表检测效率低和一致性差的问题,急需一种能自动检测电能表异物声音的***。
声音检测技术日趋成熟,采用声音检测技术用于电能表异物检测已经成为可能,但是受限于电能表本身特征和电能表生产线环境噪音的影响,如何对电能表进行固定及如何屏蔽削弱电能表异物检测过程中的外界干扰音等问题亟待解决。在目前异常声音检测过程中,主要采用特征参数与分类器结合进行识别,因此特征参数与分类器的选择将会直接影响异物声音的识别率。
文献《基于MFCC和短时能量混合的异常声音识别算法》将MFCC、差分MFCC以及短时能量三种特征用于GMM的训练与识别,虽然识别率可达90%以上,相对复杂度不高,但处理不同的研究对象和研究背景时,需通过大量实验重新确定不同阶高斯混合模型的参数,所以对GMM混合阶数的选择存在局限性;此外,由于只提取了三种特征参数,并不能全面的反映声音特征,在声音识别上不能够得到精准的判断与识别。
专利《一种基于噪声特征统计量的矿山设备健康状态判决方法》(专利号:CN201610841099.7)基于噪声特征统计量的矿山设备健康状态判决方法,通过计算的特征参数,计算出其均值和方差两个统计量,形成一维的特征统计向量,并利用改进的短时模糊C均值聚类算法实现测试样本状态的汇聚,从而实现设备健康状态的判决,由于仅存在特征统计量,判定的准确率不高。
专利《基于时频域统计特征提取的自然环境声音识别方法》(专利号:CN201610634966.X)对声音样本信号的加窗分帧处理,提取所有帧信号在时域上的统计特征并标记特征向量所属声音来源的种类,建立样本特征库,利用支持向量机对目标声音的特征向量进行匹配分类。该方法虽然弥补了传统的声音LPCC和MFCC特征提取方法在时频结合方面的不足,能够判断各类目标声音的所属类型,但是并没有对声音信号进行降噪处理,采样提取的声音信号含有环境中的噪音,会受到噪声信号的干扰,提取的特征参数会与实际声音信号的特征参数有较大的误差,会影响声音信号的识别。
并且现有技术还存在如下缺陷:
(1)人工检测方式容易因为人为因素造成检测结果不准确
人工晃动过程中由于电能表自带铅封、表壳固定螺钉没有拧紧等因素会在晃动过程中产生和异物相近频率的噪音造成听声识别方法判断错误。
(2)现有声音信号识别***的检测正确率不高
现有的声音信号识别***,通常采用提取声音短时能量、梅尔倒谱系数或LPC系数组成混合特征参数,用训练样本的特征系数向量对分类器进行训练,最后将测试样本声音信号的特征系数向量输入到训练好的分类器中进行分类识别。
针对上述问题,亟需一套集成度高、可扩展性强、高效的电能表内异物声音识别方法来实现电能表内异物检测的自动化。
发明内容
有鉴于现有技术的上述缺陷,本发明的目的就是提供一种基于声学检测的电能表内异物自动识别方法,提高了的电能表的检测效率,有利于提高电能表检测的自动化进程;缩短了电能表检测的时间,提高了生产效率和设备的利用率,实现了快速、高效、安全可靠的电能表异物声音检测工作;大大提高了异物电能表的识别率。
本发明的目的是通过这样的技术方案实现的,一种基于声学检测的电能表内异物自动识别方法,它包括有:
S1:采集电能表内的声音信号数据;
S2:对采集到的声音信号数据进行通道变换,提取含有异物通道的声音信号数据;
S3:通过变步长LMS自适应滤波算法对提取的声音信号数据进行去噪处理;
S4:对去噪后的声音信号数据进行预处理,提取短时能量、MFCC系数和LPC系数并将其组合成特征矩阵,对特征矩阵进行降维处理得到最大特征值对应的特征向量;
S5:将所述特征向量输入基于Adaboost的多个BP神经网络弱分类器中,以该特征向量作为电能表内异物声音信号的特征进行分类识别。
进一步,步骤S3中变步长LMS自适应滤波算法的计算公式如下:
u(n)=αu(n-1)+βe(n)2 (1);
式(1)中,α,β为参数,α主要是控制步长变化函数的陡峭程度;β主要用来控制步长的变化范围。
进一步,所述步骤S4中对去噪后的声音信号数据进行预处理的流程包括有:通道转换、归一化、预加重、分帧和加窗。
进一步,还包括有判断电能表内异物声音信号幅度是否正常,判断公式如下:
S41:设这种变换或运算用T[]表示,x(n)为输入语音信号,W(n)为窗序列,h(n)是与W(n)有关的滤波器,则各帧经处理后的输出可以表示为:
S42:声音的能量随时间而变化,经过预处理之后计算第i帧声音信号xi(n)的短时能量的公式为:
其中,E(i)反应声音信号的幅度或能量随时间缓慢变化的规律;
S43:由于需要计算信号样值的平方和,在定点实现时很容易产生溢出;为了克服这个缺点,定义一个短时平均幅度函数Mn来衡量声音幅度变化:
S44:单位时间内过零的次数称为过零率,一段长时间内的过零率称为平均过零率;过零率在一定程度上可以反映信号的频率信息;短时平均过零率的定义为:
S45:自相关函数用于衡量信号自身时间波形的相似性,时域离散确定信号的自相关函数定义为:
S46:由语音信号序列求出一组线性预测系数ai,将这组预测系数当做语音产生模型中***函数H(z)的参数。
进一步,所述步骤S4还包括有对声音信号的时域和频域的特征处理:
将短时能量、LPC系数和MFCC系数构成混合特征矩阵,第一维为短时能量,第二维为LPC系数,第三维到第二十六维为MFCC系数。
进一步,所述步骤S5还包括有:
S51:采用留出法将数据集分为互斥的两部分,将m组数据作为训练集,剩余的作为测试集;初始化测试集数据的分布权值和初始化BP神经网络权值和阈值;
S52:用训练集数据训练第i个弱分类器BP神经网络并预测训练数据输出,得到预测序列g(i)和预测误差ei;
ei=∑iDi(i) (7);
S53:根据预测序列的预测误差计算序列的权重ai;
S54:然后根据预测序列权重调整下一轮训练样本的权重,调整公式为,
其中Bi为归一化因子,目的是在权重比例不变的情况下使分布权值和为1;
S55:训练i轮之后的到i组弱分类函数f(gi,ai),由这些弱分类函数可以得到强分类函数h(x);
S56:通过强分类函数h(x)对电能表内异物声音信号的特征进行分类识别。
由于采用了上述技术方案,本发明具有如下的优点:
(1)利用声卡采集声音信号,采集到的声音信号中含有大量的工业背景噪声。故将背景噪音与有用声音信号分开是正确识别的关键点所在。本发明专利提出的一种新的变步长LMS自适应滤波算法,建立了一种新的步长和误差的非线性关系,此算法在一定程度上解决了收敛速度和稳态误差的矛盾关系,计算简单,复杂度低。而且新算法能够使步长在收敛稳态期不会产生较大的变化,增大算法的适应性,有利于算法稳定性。
(2)基于传统时频域提取的短时能量、MFCC系数构成组合特征参数,并不能全面反映声音信号特征,会导致声音识别出现较大的误差,不能达到精准判断的结果。本发明采用对声音信号进行时、频域和倒谱分析并同时提取其短时平均能量、短时平均幅度、短时平均过零率以及LPC系数和MFCC系数,构成特征向量,对特征向量进行组合。采取短时平均幅度与短时平均过零率,经短时自相关分析来衡量信号自身时间波形的相似性。LPC系数使得到的语音参数更加精准具体且有效,弥补了现有技术提取特征参数的不足。MFCC系数是静态特征系数,动、静态特征结合起来才能最有效提高***的识别性能,实现对声音特征系数的全面采集,综合反映时频域的声音信息,充分利用声音信号独有的特征参数进行声音的识别与判断。
(3)为了使得到的声音特征参数能全面的反映声音信号的时、频特征。故对声音特征参数进行排列和处理。短时能量、MFCC系数和LPC系数构成混合特征参数并对混合参数矩阵进行降维得到最大特征值对应的特征向量。以该向量作为分类器的输入,得到的分类器识别率最高且计算复杂度较低。
(4)常见的分类器有高斯混合模型、支持向量机和BP神经网络等模型,虽然这些分类器都能识别分类,但是识别率低,计算复杂度高。本发明的分类器采用将多个BP神经网络通过Adaboost模型组合成强分类器,不仅计算量少而且识别率高。
本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。
附图说明
本发明的附图说明如下:
图1为基于声学检测的电能表内异物自动识别方法的流程示意图。
图2为对采集的声音信号去噪前的结果示意图。
图3为对采集的声音信号去噪后的结果示意图。
图4为基于声学检测的电能表内异物自动识别方法中声音信号特征值组合方式示意图。
图5为基于声学检测的电能表内异物自动识别方法中构建的分类器示意图。
图6为一具体实施例对电能表内异物的识别率示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步说明。
实施例1:如图1至图6所示;一种基于声学检测的电能表内异物自动识别方法,它包括有:
S1:采集电能表内的声音信号数据;
S2:对采集到的声音信号数据进行通道变换,提取含有异物通道的声音信号数据;
S3:通过变步长LMS自适应滤波算法对提取的声音信号数据进行去噪处理;
S4:对去噪后的声音信号数据进行预处理,提取短时能量、MFCC系数和LPC系数并将其组合成特征矩阵,对特征矩阵进行降维处理得到最大特征值对应的特征向量;
S5:将所述特征向量输入基于Adaboost的多个BP神经网络弱分类器中,以该特征向量作为电能表内异物声音信号的特征进行分类识别。
步骤S3中变步长LMS自适应滤波算法的计算公式如下:
u(n)=αu(n-1)+βe(n)2 (1);
式(1)中,α,β为参数,α主要是控制步长变化函数的陡峭程度;β主要用来控制步长的变化范围。
所述步骤S4中对去噪后的声音信号数据进行预处理的流程包括有:通道转换、归一化、预加重、分帧和加窗。
(1)通道转换:在采集的多通道声音中提取所检测通道的声音数据,并能有效减弱不同通道声音信号之间的干扰。
(2)归一化:消除不同样本声音信号之间的差异,并将其幅值限定在[-1,1]区间。
(3)预加重:使声音信号通过一个一阶高通滤波器,降低低频信号的干扰并加重突出信号的高频部分并光滑信号的频谱。
(4)分帧和加窗:声音信号是一个非平稳过程,但是在较短的时间内可以视为稳态的。如果对声音信号直接切分成帧会造成Gibbs效应,故为了减少声音信号的频谱泄漏和增加不同帧之间的连续性,对声音信号进行加窗处理。
还包括有判断电能表内异物声音信号幅度是否正常,判断公式如下:
S41:设这种变换或运算用T[]表示,x(n)为输入语音信号,W(n)为窗序列,h(n)是与W(n)有关的滤波器,则各帧经处理后的输出可以表示为:
S42:声音的能量随时间而变化,经过预处理之后计算第i帧声音信号xi(n)的短时能量的公式为:
其中,E(i)反应声音信号的幅度或能量随时间缓慢变化的规律;
S43:短时能量的一个主要问题是E(i)对信号电平值过于敏感。由于需要计算信号样值的平方和,在定点实现时很容易产生溢出;为了克服这个缺点,可以定义一个短时平均幅度函数Mn来衡量声音幅度变化:
S44:单位时间内过零的次数称为过零率,一段长时间内的过零率称为平均过零率;过零率在一定程度上可以反映信号的频率信息;短时平均过零率的定义为:
S45:自相关函数用于衡量信号自身时间波形的相似性,时域离散确定信号的自相关函数定义为:
S46:线性预测的基本问题就是由语音信号序列求出一组线性预测系数,这组预测系数可被看作语音产生模型中***函数的参数,它使得在一段语音波形中均方预测误差最小。
梅尔倒谱系数(MFCC)是通过Mel尺度频率域提取出来的倒谱参数,具有较好的鲁棒性,能准确反映声音信号的特征。因此,MFCC的全部组成其实是由:N维MFCC参数(N/3MFCC系数+N/3一阶差分参数+N/3二阶差分参数)+帧能量。
所述步骤S4还包括有对声音信号的时域和频域的特征处理:
将短时能量、LPC系数和MFCC系数构成混合特征矩阵,第一维为短时能量,第二维为LPC系数,第三维到第二十六维为MFCC系数。并对特征矩阵进行降维得到最大特征值对的特征向量。以该向量作为分类器的输入,得到的分类器识别率最高且计算复杂度较低。
所述步骤S5还包括有:
S51:通过Adaboost算法得到多个BP神经网络弱分类器组成强分类器。并反复训练BP神经网络预测样本输出,使输出正确率最高。采用留出法将数据集分为互斥的两部分,将m组数据作为训练集,剩余的作为测试集;初始化测试集数据的分布权值和初始化BP神经网络权值和阈值;
S52:用训练集数据训练第i个弱分类器BP神经网络并预测训练数据输出,得到预测序列g(i)和预测误差ei;
ei=∑iDi(i) (7);
S53:根据预测序列的预测误差计算序列的权重ai;
S54:然后根据预测序列权重调整下一轮训练样本的权重,调整公式为,
其中Bi为归一化因子,目的是在权重比例不变的情况下使分布权值和为1;
S55:训练i轮之后的到i组弱分类函数f(gi,ai),由这些弱分类函数可以得到强分类函数h(x);
S56:通过强分类函数h(x)对电能表内异物声音信号的特征进行分类识别。
图4是本发明方法的声音信号特征值组合方式示意图。特征矩阵的第一维为短时能量,第二维为LPC系数,第三维到第二十六维为MFCC系数,通过矩阵变换降维得到最大特征值对应的特征向量。以该特征向量作为电能表内异物声音信号的特征并输入分类器进行分类识别。
图5是本发明方法的构建的分类器示意图。根据样本的输入输出确定神经网络结构为26-6-1。每组数据的输入为26维,输出为1维。当强分类函数输出为1时,表示电能表不含有异物;为-1时,表示电能表含有异物。
图6为采用本发明方法针对电能表内异物的一个识别率。实验采用留出法将数据集分为互斥的两部分,一部分作为训练集,一部分作为测试集,经过重复实验1000次,通过图发现每一次的识别率在90%左右甚至100%,计算1000次得到的平均识别率在96%左右。
实施例2:如图1至图6所示;一种基于声学检测的电能表内异物自动识别方法,它包括有:首先对采集的声音数据进行一个通道转换,提取含有异物通道的声音数据,其次通过一种变步长自适应滤波算法对提取的声音信号进行去噪处理,然后通过预处理,提取短时能量、MFCC系数和LPC系数,将其组合成特征矩阵并对其进行降维处理以减少数据量,通过矩阵变换降维得到最大特征值对应的特征向量;最后将特征向量输入基于Adaboost的多个BP神经网络弱分类器,以该特征向量作为电能表内异物声音信号的特征并输入分类器进行分类识别。
1、声音信号去噪
根据采集的声音信号自身的特点提出了一种新的变步长LMS自适应滤波算法,针对固定步长的LMS自适应滤波算法存在的收敛速度与稳态误差矛盾的问题,建立了一种新的步长和误差的非线性关系,此算法在一定程度上解决了收敛速度和稳态误差的矛盾关系,计算简单,复杂度低。而且新算法能够使步长在收敛稳态期不会产生较大的变化,增大算法的适应性,有利于算法稳定性,新的步长因子为
u(n)=αu(n-1)+βe(n)2 (1);
式(1)中,α,β为参数,α主要是控制步长变化函数的陡峭程度;β主要用来控制步长的变化范围。
2、声音信号预处理及特征提取
常见的声音信号预处理流程包括:通道转换、归一化、预加重、分帧和加窗。
(1)通道转换:在采集的多通道声音中提取所检测通道的声音数据,并能有效减弱不同通道声音信号之间的干扰。
(2)归一化:消除不同样本声音信号之间的差异,并将其幅值限定在[-1,1]区间。
(3)预加重:使声音信号通过一个一阶高通滤波器,降低低频信号的干扰并加重突出信号的高频部分并光滑信号的频谱。
(4)分帧和加窗:声音信号是一个非平稳过程,但是在较短的时间内可以视为稳态的。如果对声音信号直接切分成帧会造成Gibbs效应,故为了减少声音信号的频谱泄漏和增加不同帧之间的连续性,对声音信号进行加窗处理。
设这种变换或运算用T[]表示,x(n)为输入语音信号,W(n)为窗序列,h(n)是与W(n)有关的滤波器,则各帧经处理后的输出可以表示为:
声音的能量随时间而变化,经过前面的预处理之后计算第i帧声音信号xi(n)的短时能量的公式为:
E(i)反应声音信号的幅度或能量随时间缓慢变化的规律。
短时能量的一个主要问题是E(i)对信号电平值过于敏感。由于需要计算信号样值的平方和,在定点实现时很容易产生溢出;为了克服这个缺点,可以定义一个短时平均幅度函数Mn来衡量声音幅度变化,
单位时间内过零的次数称为过零率,一段长时间内的过零率称为平均过零率;过零率在一定程度上可以反映信号的频率信息;短时平均过零率的定义为:
自相关函数用于衡量信号自身时间波形的相似性。时域离散确定信号的自相关函数定义为:
线性预测的基本问题就是由语音信号序列求出一组线性预测系数ai,这组预测系数可被看作语音产生模型中***函数H(z)的参数,它使得在一段语音波形中均方预测误差最小。
梅尔倒谱系数(MFCC)是通过Mel尺度频率域提取出来的倒谱参数,具有较好的鲁棒性,能准确反映声音信号的特征。因此,MFCC的全部组成其实是由:N维MFCC参数(N/3MFCC系数+N/3一阶差分参数+N/3二阶差分参数)+帧能量。
3、声音特征处理
为了使得到的声音特征参数能全面的反映声音信号的时、频特征。故对声音特征参数进行排列和处理。短时能量、LPC系数和MFCC系数构成混合特征矩阵,其第一维为短时能量,第二维为LPC系数,第三维到第二十六维为MFCC系数。并对特征矩阵进行降维得到最大特征值对的特征向量。以该向量作为分类器的输入,得到的分类器识别率最高且计算复杂度较低。
4、声音信号识别
通过Adaboost算法得到多个BP神经网络弱分类器组成强分类器。并反复训练BP神经网络预测样本输出,使输出正确率最高。采用留出法将数据集分为互斥的两部分,一部分作为训练集(m组数据),一部分作为测试集。初始化测试集数据的分布权值和初始化BP神经网络权值和阈值。
用训练集数据训练第i个弱分类器BP神经网络并预测训练数据输出,得到预测序列g(i)和预测误差ei。
ei=∑iDi(i) (7);
根据预测序列的预测误差计算序列的权重ai。
然后根据预测序列权重调整下一轮训练样本的权重,调整公式为,
其中Bi为归一化因子,目的是在权重比例不变的情况下使分布权值和为1。
训练i轮之后的到i组弱分类函数f(gi,ai),由这些弱分类函数可以得到强分类函数h(x)。
图4是本发明方法的声音信号特征值组合方式示意图。特征矩阵的第一维为短时能量,第二维为LPC系数,第三维到第二十六维为MFCC系数,通过矩阵变换降维得到最大特征值对应的特征向量。以该特征向量作为电能表内异物声音信号的特征并输入分类器进行分类识别。
图5是本发明方法的构建的分类器示意图。根据样本的输入输出确定神经网络结构为26-6-1。每组数据的输入为26维,输出为1维。强分类函数输出为1时,表示电能表不含有异物;为-1时,表示电能表含有异物。
图6为采用本发明方法针对电能表内异物的一个识别率。实验采用留出法将数据集分为互斥的两部分,一部分作为训练集,一部分作为测试集,经过重复实验1000次,通过图发现每一次的识别率在90%左右甚至100%,计算1000次得到的平均识别率在96%左右。
本发明取得的有益效果是:
(1)利用声卡采集声音信号,采集到的声音信号中含有大量的工业背景噪声。故将背景噪音与有用声音信号分开是正确识别的关键点所在。本发明专利提出的一种新的变步长LMS自适应滤波算法,建立了一种新的步长和误差的非线性关系,此算法在一定程度上解决了收敛速度和稳态误差的矛盾关系,计算简单,复杂度低。而且新算法能够使步长在收敛稳态期不会产生较大的变化,增大算法的适应性,有利于算法稳定性。
(2)基于传统时频域提取的短时能量、MFCC系数构成组合特征参数,并不能全面反映声音信号特征,会导致声音识别出现较大的误差,不能达到精准判断的结果。本发明采用对声音信号进行时、频域和倒谱分析并同时提取其短时平均能量、短时平均幅度、短时平均过零率以及LPC系数和MFCC系数,构成特征向量,对特征向量进行组合。采取短时平均幅度与短时平均过零率,经短时自相关分析来衡量信号自身时间波形的相似性。LPC系数使得到的语音参数更加精准具体且有效,弥补了现有技术提取特征参数的不足。MFCC系数是静态特征系数,动、静态特征结合起来才能最有效提高***的识别性能,实现对声音特征系数的全面采集,综合反映时频域的声音信息,充分利用声音信号独有的特征参数进行声音的识别与判断。
(3)为了使得到的声音特征参数能全面的反映声音信号的时、频特征。故对声音特征参数进行排列和处理。短时能量、MFCC系数和LPC系数构成混合特征参数并对混合参数矩阵进行降维得到最大特征值对应的特征向量。以该向量作为分类器的输入,得到的分类器识别率最高且计算复杂度较低。
(4)常见的分类器有高斯混合模型、支持向量机和BP神经网络等模型,虽然这些分类器都能识别分类,但是识别率低,计算复杂度高。本发明的分类器采用将多个BP神经网络通过Adaboost模型组合成强分类器,不仅计算量少而且识别率高。
应当理解的是,本说明书未详细阐述的部分均属于现有技术。最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (6)
1.一种基于声学检测的电能表内异物自动识别方法,其特征在于,所述方法的具体步骤如下:
S1:采集电能表内的声音信号数据;
S2:对采集到的声音信号数据进行通道变换,提取含有异物通道的声音信号数据;
S3:通过变步长LMS自适应滤波算法对提取的声音信号数据进行去噪处理;
S4:对去噪后的声音信号数据进行预处理,提取短时能量、MFCC系数和LPC系数并将其组合成特征矩阵,对特征矩阵进行降维处理得到最大特征值对应的特征向量;
S5:将所述特征向量输入基于Adaboost的多个BP神经网络弱分类器中,以该特征向量作为电能表内异物声音信号的特征进行分类识别。
2.如权利要求1所述的基于声学检测的电能表内异物自动识别方法,其特征在于,步骤S3中变步长LMS自适应滤波算法的计算公式如下:
u(n)=αu(n-1)+βe(n)2 (1);
式(1)中,α,β为参数,α主要是控制步长变化函数的陡峭程度;β主要用来控制步长的变化范围。
3.如权利要求1所述的基于声学检测的电能表内异物自动识别方法,其特征在于,所述步骤S4中对去噪后的声音信号数据进行预处理的流程包括有:通道转换、归一化、预加重、分帧和加窗。
4.如权利要求1所述的基于声学检测的电能表内异物自动识别方法,其特征在于,还包括有判断电能表内异物声音信号幅度是否正常,判断公式如下:
S41:设这种变换或运算用T[]表示,x(n)为输入语音信号,W(n)为窗序列,h(n)是与W(n)有关的滤波器,则各帧经处理后的输出可以表示为:
S42:声音的能量随时间而变化,经过预处理之后计算第i帧声音信号xi(n)的短时能量的公式为:
其中,E(i)反应声音信号的幅度或能量随时间缓慢变化的规律;
S43:由于需要计算信号样值的平方和,在定点实现时很容易产生溢出;为了克服这个缺点,定义一个短时平均幅度函数Mn来衡量声音幅度变化:
S44:单位时间内过零的次数称为过零率,一段长时间内的过零率称为平均过零率;过零率在一定程度上可以反映信号的频率信息;短时平均过零率的定义为:
S45:自相关函数用于衡量信号自身时间波形的相似性,时域离散确定信号的自相关函数定义为:
S46:由语音信号序列求出一组线性预测系数ai,将这组预测系数当做语音产生模型中***函数H(z)的参数。
5.如权利要求1所述的基于声学检测的电能表内异物自动识别方法,其特征在于,所述步骤S4还包括有对声音信号的时域和频域的特征处理:
将短时能量、LPC系数和MFCC系数构成混合特征矩阵,第一维为短时能量,第二维为LPC系数,第三维到第二十六维为MFCC系数。
6.如权利要求1所述的基于声学检测的电能表内异物自动识别方法,其特征在于,所述步骤S5还包括有:
S51:采用留出法将数据集分为互斥的两部分,将m组数据作为训练集,剩余的作为测试集;初始化测试集数据的分布权值和初始化BP神经网络权值和阈值;
S52:用训练集数据训练第i个弱分类器BP神经网络并预测训练数据输出,得到预测序列g(i)和预测误差ei;
ei=∑i Di(i) (7);
S53:根据预测序列的预测误差计算序列的权重ai;
S54:然后根据预测序列权重调整下一轮训练样本的权重,调整公式为,
其中Bi为归一化因子,目的是在权重比例不变的情况下使分布权值和为1;
S55:训练i轮之后的到i组弱分类函数f(gi,ai),由这些弱分类函数可以得到强分类函数h(x);
S56:通过强分类函数h(x)对电能表内异物声音信号的特征进行分类识别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810804638.9A CN109034046B (zh) | 2018-07-20 | 2018-07-20 | 一种基于声学检测的电能表内异物自动识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810804638.9A CN109034046B (zh) | 2018-07-20 | 2018-07-20 | 一种基于声学检测的电能表内异物自动识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109034046A true CN109034046A (zh) | 2018-12-18 |
CN109034046B CN109034046B (zh) | 2022-03-22 |
Family
ID=64643898
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810804638.9A Active CN109034046B (zh) | 2018-07-20 | 2018-07-20 | 一种基于声学检测的电能表内异物自动识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109034046B (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109946055A (zh) * | 2019-03-22 | 2019-06-28 | 武汉源海博创科技有限公司 | 一种汽车座椅滑轨异响检测方法及*** |
CN110020685A (zh) * | 2019-04-09 | 2019-07-16 | 山东超越数控电子股份有限公司 | 一种基于自适应滤波和受限玻尔兹曼机的预处理方法,终端及可读存储介质 |
CN110427918A (zh) * | 2019-08-15 | 2019-11-08 | 国网重庆市电力公司电力科学研究院 | 一种电子式电力互感器的故障分类方法及可读存储介质 |
CN110503046A (zh) * | 2019-08-26 | 2019-11-26 | 华北电力大学(保定) | 一种基于图像识别技术的铅封识别法 |
CN110531736A (zh) * | 2019-08-13 | 2019-12-03 | 中国航空工业集团公司西安飞行自动控制研究所 | 一种大功率电机控制器故障监控电路及其方法 |
CN110988137A (zh) * | 2019-12-31 | 2020-04-10 | 四川长虹电器股份有限公司 | 一种基于时频域特征的异音检测***及方法 |
CN111795791A (zh) * | 2020-07-06 | 2020-10-20 | 浙江大学 | 一种变步长液压振动台自适应幅相控制方法 |
CN112272019A (zh) * | 2020-10-22 | 2021-01-26 | 广东美的制冷设备有限公司 | 声控敲击开关的控制方法、装置、家用电器及存储介质 |
CN113267330A (zh) * | 2021-05-14 | 2021-08-17 | 国网重庆市电力公司电力科学研究院 | 一种基于声学成像的gis设备机械故障检测***及方法 |
CN113793613A (zh) * | 2021-07-28 | 2021-12-14 | 辽宁工业大学 | 一种多特征融合的说话人识别方法 |
CN114234061A (zh) * | 2021-12-20 | 2022-03-25 | 北京工业大学 | 一种基于神经网络的带压运行供水管道漏水音智能判别方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150089963A1 (en) * | 2012-04-06 | 2015-04-02 | Zhongxi Tan | Central air-conditioning system and control method thereof |
CN105882687A (zh) * | 2016-05-13 | 2016-08-24 | 南京雅信科技集团有限公司 | 道岔转辙机的故障类别分析方法 |
CN106199492A (zh) * | 2016-07-18 | 2016-12-07 | 国网重庆市电力公司电力科学研究院 | 一种电能表异物检测摇表机构 |
CN107657964A (zh) * | 2017-08-15 | 2018-02-02 | 西北大学 | 基于声学特征和稀疏数学的抑郁症辅助检测方法及分类器 |
RU2016131483A (ru) * | 2016-08-01 | 2018-02-06 | Общество С Ограниченной Ответственностью "Авп Технология" | Автономная система информирования машиниста с функцией электронного маршрута |
CN107807170A (zh) * | 2017-10-20 | 2018-03-16 | 国网重庆市电力公司电力科学研究院 | 六氟化硫分解产物检测的一维纵向谐振腔的声传输线模型 |
CN107976649A (zh) * | 2017-11-22 | 2018-05-01 | 国网重庆市电力公司电力科学研究院 | 一种电能表内异物声音采集结构 |
-
2018
- 2018-07-20 CN CN201810804638.9A patent/CN109034046B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150089963A1 (en) * | 2012-04-06 | 2015-04-02 | Zhongxi Tan | Central air-conditioning system and control method thereof |
CN105882687A (zh) * | 2016-05-13 | 2016-08-24 | 南京雅信科技集团有限公司 | 道岔转辙机的故障类别分析方法 |
CN106199492A (zh) * | 2016-07-18 | 2016-12-07 | 国网重庆市电力公司电力科学研究院 | 一种电能表异物检测摇表机构 |
RU2016131483A (ru) * | 2016-08-01 | 2018-02-06 | Общество С Ограниченной Ответственностью "Авп Технология" | Автономная система информирования машиниста с функцией электронного маршрута |
CN107657964A (zh) * | 2017-08-15 | 2018-02-02 | 西北大学 | 基于声学特征和稀疏数学的抑郁症辅助检测方法及分类器 |
CN107807170A (zh) * | 2017-10-20 | 2018-03-16 | 国网重庆市电力公司电力科学研究院 | 六氟化硫分解产物检测的一维纵向谐振腔的声传输线模型 |
CN107976649A (zh) * | 2017-11-22 | 2018-05-01 | 国网重庆市电力公司电力科学研究院 | 一种电能表内异物声音采集结构 |
Non-Patent Citations (2)
Title |
---|
杜世斌: "基于音频特征的电气设备故障监测算法研究", 《中国优秀硕士学位论文全文数据库》 * |
杨锐: "配电变压器常见故障分析及技术管理", 《科技风》 * |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109946055A (zh) * | 2019-03-22 | 2019-06-28 | 武汉源海博创科技有限公司 | 一种汽车座椅滑轨异响检测方法及*** |
CN109946055B (zh) * | 2019-03-22 | 2021-01-12 | 宁波慧声智创科技有限公司 | 一种汽车座椅滑轨异响检测方法及*** |
CN110020685A (zh) * | 2019-04-09 | 2019-07-16 | 山东超越数控电子股份有限公司 | 一种基于自适应滤波和受限玻尔兹曼机的预处理方法,终端及可读存储介质 |
CN110531736A (zh) * | 2019-08-13 | 2019-12-03 | 中国航空工业集团公司西安飞行自动控制研究所 | 一种大功率电机控制器故障监控电路及其方法 |
CN110427918B (zh) * | 2019-08-15 | 2022-03-08 | 国网重庆市电力公司电力科学研究院 | 一种电子式电力互感器的故障分类方法及可读存储介质 |
CN110427918A (zh) * | 2019-08-15 | 2019-11-08 | 国网重庆市电力公司电力科学研究院 | 一种电子式电力互感器的故障分类方法及可读存储介质 |
CN110503046A (zh) * | 2019-08-26 | 2019-11-26 | 华北电力大学(保定) | 一种基于图像识别技术的铅封识别法 |
CN110988137A (zh) * | 2019-12-31 | 2020-04-10 | 四川长虹电器股份有限公司 | 一种基于时频域特征的异音检测***及方法 |
CN111795791A (zh) * | 2020-07-06 | 2020-10-20 | 浙江大学 | 一种变步长液压振动台自适应幅相控制方法 |
CN111795791B (zh) * | 2020-07-06 | 2021-06-04 | 浙江大学 | 一种变步长液压振动台自适应幅相控制方法 |
CN112272019A (zh) * | 2020-10-22 | 2021-01-26 | 广东美的制冷设备有限公司 | 声控敲击开关的控制方法、装置、家用电器及存储介质 |
CN113267330A (zh) * | 2021-05-14 | 2021-08-17 | 国网重庆市电力公司电力科学研究院 | 一种基于声学成像的gis设备机械故障检测***及方法 |
CN113793613A (zh) * | 2021-07-28 | 2021-12-14 | 辽宁工业大学 | 一种多特征融合的说话人识别方法 |
CN114234061A (zh) * | 2021-12-20 | 2022-03-25 | 北京工业大学 | 一种基于神经网络的带压运行供水管道漏水音智能判别方法 |
CN114234061B (zh) * | 2021-12-20 | 2024-06-21 | 北京工业大学 | 一种基于神经网络的带压运行供水管道漏水音智能判别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109034046B (zh) | 2022-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109034046A (zh) | 一种基于声学检测的电能表内异物自动识别方法 | |
Thomas et al. | Estimation of glottal closing and opening instants in voiced speech using the YAGA algorithm | |
CN108417228B (zh) | 乐器音色迁移下的人声音色相似性度量方法 | |
CN102324229B (zh) | 语音输入设备使用异常的检测方法及*** | |
Kumar et al. | Design of an automatic speaker recognition system using MFCC, vector quantization and LBG algorithm | |
CN108305639B (zh) | 语音情感识别方法、计算机可读存储介质、终端 | |
CN105825852A (zh) | 一种英语口语朗读考试评分方法 | |
CN109448726A (zh) | 一种语音控制准确率的调整方法及*** | |
CN105448291A (zh) | 基于语音的帕金森症检测方法及检测*** | |
CN112259104A (zh) | 一种声纹识别模型的训练装置 | |
Archana et al. | Gender identification and performance analysis of speech signals | |
Dubuisson et al. | On the use of the correlation between acoustic descriptors for the normal/pathological voices discrimination | |
Sigmund | Statistical analysis of fundamental frequency based features in speech under stress | |
CN105916090A (zh) | 一种基于智能化语音识别技术的助听器*** | |
He et al. | Stress detection using speech spectrograms and sigma-pi neuron units | |
Rahman et al. | Dynamic time warping assisted svm classifier for bangla speech recognition | |
CN111489763A (zh) | 一种基于gmm模型的复杂环境下说话人识别自适应方法 | |
Panek et al. | Quantification of linear and non-linear acoustic analysis applied to voice pathology detection | |
CN116895287A (zh) | 一种基于shap值的抑郁症语音表型分析方法 | |
Kaminski et al. | Automatic speaker recognition using a unique personal feature vector and Gaussian Mixture Models | |
Costa et al. | Pathological voice discrimination using cepstral analysis, vector quantization and hidden Markov models | |
Dov et al. | Voice activity detection in presence of transients using the scattering transform | |
CN111091816B (zh) | 一种基于语音评测的数据处理***及方法 | |
CN115641839A (zh) | 一种智能语音识别方法和*** | |
CN111599345B (zh) | 语音识别算法评估方法、***、移动终端及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |