CN112885368A - 基于改进胶囊网络的多频带谱减法振动信号去噪方法 - Google Patents

基于改进胶囊网络的多频带谱减法振动信号去噪方法 Download PDF

Info

Publication number
CN112885368A
CN112885368A CN202110096683.5A CN202110096683A CN112885368A CN 112885368 A CN112885368 A CN 112885368A CN 202110096683 A CN202110096683 A CN 202110096683A CN 112885368 A CN112885368 A CN 112885368A
Authority
CN
China
Prior art keywords
vibration signal
denoising
spectrum
noise
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110096683.5A
Other languages
English (en)
Other versions
CN112885368B (zh
Inventor
汪友明
秦钰玺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian University of Posts and Telecommunications
Original Assignee
Xian University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian University of Posts and Telecommunications filed Critical Xian University of Posts and Telecommunications
Priority to CN202110096683.5A priority Critical patent/CN112885368B/zh
Publication of CN112885368A publication Critical patent/CN112885368A/zh
Application granted granted Critical
Publication of CN112885368B publication Critical patent/CN112885368B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
    • G10L25/30Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T90/00Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Complex Calculations (AREA)

Abstract

本发明公开了一种基于改进胶囊网络的多频带谱减法振动信号去噪方法。该方法的主要步骤为:1、获取两路振动信号,分别为含噪振动信号以及纯净振动信号;2、对含噪振动信号进行加窗,分帧,傅里叶变换得到含噪振动信号的幅度谱和相位谱;3、将含噪振动信号的幅度谱切割成任意不重复且彼此互不干扰的多个子带;4、采用谱减法对每个子带中含噪振动信号进行初步去噪,获得初步去噪后的振动信号;5、采用神经网络对初步去噪后的振动信号进行二次去噪。通过该方法结合了谱减法易于实现和理解的优点以及深度神经网络强大学习能力的特点,避免了噪声种类繁多的问题,同时也大大提升了去噪效果。

Description

基于改进胶囊网络的多频带谱减法振动信号去噪方法
技术领域
本发明涉及一种噪声处理方法,特别涉及一种基于改进胶囊网络的多频带谱减法振动信号去噪方法。
背景技术
由于工业现场环境复杂,在振动信号采集时混入噪声是无法避免的,这样就造成了振动信号特征提取及分析的不准确或不可靠,工作人员就不能准确检测设备的运行状况,更不能准确分析判断设备的安全性。在对振动信号进行特征提取及相关分析前,需要进行降噪处理。利用经过处理分析的信号,可以迅速、准确地对设备出现的异常状态或故障状态做出诊断、预防和消除,对设备的运行进行必要的指导,提高设备的可靠性、安全性和有效性,从而将故障损失降到最低水平。
传统的谱减算法简单高效,其基本思路是,从带噪信号的功率谱中减去估计到的噪声功率谱,从而得到纯净的信号频谱。谱减法物理意义直接,实现简单,相对于其它一些基于参数统计及训练的方法,运算量小,在实时性方面具有突出的优势,同时降噪效果也不错。
传统的谱减算法中噪声估计采用无振动信号段噪声的统计平均代替当前帧的噪声,但在实际检测中,这种理想的平稳噪声几乎不存在,对于有振动信号部分,由于噪声和振动信号叠加在一起,如果仅使用无振动信号段噪声的统计平均代替当前帧的噪声,在进行功率谱相减时,会残留谱峰,这些谱峰会产生新的残余噪声,该残余噪声在频域上成为离散的谱峰,相应地在时域上就呈现出类正弦信号的叠加,这种残余噪声就是“音乐噪声”。“音乐噪声”的产生会降低振动信号的去噪效果。
发明内容
为了解决采用传统的谱减算法对振动信号进行去噪时会产生新的残余噪声,从而大大降低振动信号去噪效果的问题,本发明提供给了一种基于改进胶囊网络的多频带谱减法振动信号去噪方法。
本发明的具体技术方案是:
提供了一种基于改进胶囊网络的多频带谱减法振动信号去噪方法,具体实现步骤如下:
步骤1:获取两路振动信号,分别为含噪振动信号y(n)以及纯净振动信号x(n);
其中,含噪振动信号y(n)是由纯净振动信号x(n)和加性噪声d(n)组成,其表达式为:
y(n)=x(n)+d(n)
式中,n表示采样点;
步骤2:对含噪振动信号进行加窗,分帧,傅里叶变换得到含噪振动信号的幅度谱|Y(f)|和相位谱
Figure BDA0002914562980000021
f表示频率;
步骤3:将含噪振动信号的幅度谱|Y(f)|切割成任意不重复且彼此互不干扰的多个子带;
步骤4:采用谱减法对每个子带中含噪振动信号进行初步去噪,获得初步去噪后的振动信号;
步骤4.1:任意子带K的第1帧信号的处理
步骤4.1.1:设置第1帧噪声信号幅度谱估计值
Figure BDA0002914562980000031
并将其代入谱减公式计算第1帧去噪振动信号幅度谱估计值
Figure BDA0002914562980000032
Figure BDA0002914562980000033
其中,|Y1(f)|为第1帧含噪振动信号的幅度谱,δ为减法因子,β为谱下限参数;
步骤4.1.2:给定第1帧自适应平滑参数c1,c1=min[θ,1],θ为平滑控制常数,θ>0;
步骤4.1.3:计算第1帧平滑的噪声谱估计;
Figure BDA0002914562980000034
步骤4.1.4:计算第1帧去噪信号的平滑功率谱;
Figure BDA0002914562980000035
步骤4.2:第j帧去噪振动信号幅度谱估计值的求解,j≥2;
步骤4.2.1:基于第j-1帧平滑的噪声谱估计
Figure BDA0002914562980000036
以及第j-1帧去噪信号的平滑功率谱
Figure BDA0002914562980000037
构建第j帧维纳滤波器模型,具体表达式为:
Figure BDA0002914562980000038
步骤4.2.2:计算第j帧噪声幅度谱的估计值
Figure BDA0002914562980000039
Figure BDA0002914562980000041
其中,|Yj(f)|为第j帧含噪振动信号的幅度谱;
步骤4.2.3:根据谱减法获取第j帧去噪振动信号的幅度谱估计值
Figure BDA0002914562980000042
Figure BDA0002914562980000043
步骤4.2.4:确定第j帧自适应平滑参数cj
Figure BDA0002914562980000044
式中:θ为平滑控制常数,θ>0;
步骤4.2.5:计算第j帧平滑的噪声谱估计
Figure BDA0002914562980000045
Figure BDA0002914562980000046
步骤4.2.6:计算第j帧去噪信号的平滑功率谱
Figure BDA0002914562980000047
Figure BDA0002914562980000048
步骤4.2.7:重复步骤4.2.1-4.2.6,获取当前子带K内所有帧去噪振动信号的幅度谱估计值
Figure BDA0002914562980000049
步骤4.3:对每个子带重复执行步骤4.1和4.2,获得每个子带初步去噪后的振动信号幅度谱;
步骤4.4:对每个子带初步去噪后的振动信号幅度谱进行叠加,并结合含噪振动信号的相位谱
Figure BDA00029145629800000410
进行逆傅里叶变换,恢复出初步去噪后的振动信号;
步骤5:采用神经网络对初步去噪后的振动信号进行二次去噪;
步骤5.1:将步骤4.4中恢复出初步去噪后的振动信号,结合纯净振动信号组合生成数据集,并将该数据集分为训练集和测试集;
步骤5.2:利用训练集对神经网络进行训练;
所述神经网络模型包括输入层、空洞卷积层、BiLSTM网络、胶囊网络层、第一全连接层、特征融合层、第二全连接层以及输出层,且神经网络模型中从输入层至输出层的各个连接权值赋予取值范围为[-1,1]的随机值,初始化胶囊网络动态路由过程中间变量bij为0;
步骤5.3:将测试集输入训练完成的神经网络模型中进一步去噪;
步骤5.3.1:首先空洞卷积层提取一维振动信号Y′的卷积特征;
步骤5.3.2:空洞卷积层输出的卷积特征经胶囊网络层处理得到为特征标量,然后通过第一全连接层进行映射,并输出特征图Iq
同时,空洞卷积层输出卷积特征经BiLSTM网络处理输出特征图Ip
步骤5.3.3:利用特征融合层对特征图Iq以及特征图Ip进行拼接得到特征图Ijoin,再进行降维处理得到特征图yconv
步骤5.3.4:最后对特征图yconv通过第二全连接层进行映射,最终得到进一步去噪后的振动信号。
进一步地,执行完步骤4.2之后,还包括采用粒子群算法对平滑控制常数θ、减法因子δ以及谱下限参数β进行优化,并采用优化后的平滑控制常数θ、减法因子δ以及谱下限参数β再次对当前子带K采用步骤4.1和4.2的方式进行初步去噪,获得当前子带K所有去噪振动信号的幅度谱估计值
Figure BDA0002914562980000061
进一步地,上述采用粒子群算法对平滑控制常数θ、减法因子δ以及谱下限参数β进行优化的具体步骤为:
步骤A1:设置粒子群算法的初始参数:最大迭代次数为50,随机初始化得到任意粒子i的初始位置和速度;任意粒子i的位置表示为xi,速度表示为vi;所述粒子i为平滑控制常数θ、减法因子δ以及谱下限参数β;
步骤A2:根据当前含噪振动信号的幅度谱和步骤4.2.7获得的去噪振动信号的幅度谱估计值
Figure BDA0002914562980000062
将输出信噪比作为适应度函数,公式如下:
Figure BDA0002914562980000063
步骤A3:依据适应度函数依次求得各个粒子适应度值;
步骤A4:依据各个粒子适应度值计算每个粒子的个体最优位置pid和整个种群的最优位置pgd
步骤A5:更新粒子速度和位置;
粒子的速度和位置更新策略如下:
Figure BDA0002914562980000064
Figure BDA0002914562980000065
w为惯性权重,c1,c2代表学习因子,c1=1.4945,c2=1.4945,r1,r2为[0,1]之间的随机数,增加搜索的随机性;vid表示粒子i速度矢量的第d维分量,xid表示粒子i位置矢量的第d维分量,t表示迭代次数;
步骤A6:更新粒子的个体最优位置及种群的全局最优位置;
粒子位置更新后求出相应的适应度函数值,并与之前所找到的粒子个体最优值及群体最优值进行比较,从而更新pid和pgd,更新公式如下,f为适应度函数;
Figure BDA0002914562980000071
步骤A7:重复执行步骤A5和A6,若达到最大迭代次数则退出循环,输出平滑控制常数θ,减法因子δ,谱下限参数β的最优解。
进一步地,上述空洞卷积层包括由扩张系数σ分别为1、2、3的卷积核,且大小均为1×3的卷积层串联而成,扩张系数σ为1的卷积层就是普通的卷积层,扩张系数σ为2的卷积核相邻两个卷积核权值之间会有一个空洞,扩张系数σ为3的卷积核相邻两个卷积核权值之间会有2个空洞。
进一步地,上述步骤2的具体实现过程为:
对含噪振动信号使用汉明窗加窗分帧:
yw(n)=w(n)y(n)=w(n)[x(n)+d(n)]=xw(n)+dw(n)
Figure BDA0002914562980000072
其中,w(n)表示汉明窗函数,L表示窗长;
假设信号是经过加窗处理的,将信号的下标w省略,再进行傅里叶变换得到含噪振动信号的幅度谱|Y(f)|和相位谱
Figure BDA0002914562980000073
相比现有技术,本发明的有益效果是:
1、本发明在不同频带内独立使用扩展谱减法进行去噪,更具有针对性,且更加准确。在每个频带内单独使用谱减法,可以满足不同频带噪声的抑制需求,达到更好的去噪效果。
2、在神经网络处理之前使用扩展谱减法进行噪声估计和频谱相减,经过初步谱减降噪后的振动信号含有的噪声相比于原始的含噪振动信号减轻了许多,同时含有的噪声类型也变得比较统一,而不像原始的带噪振动信号可能包含各种各样的噪声,并且使用神经网络也可用来减少谱减法中带来的音乐噪声。这个算法结合了谱减法易于实现和理解的优点以及深度神经网络强大学习能力的特点,避免了噪声种类繁多的问题。
3、采用粒子群算法优化参数打破了传统的扩展谱减法需要人工选择和微调参数的弊端,提高了去噪效果。
4、使用胶囊网络处理振动信号的去噪问题。胶囊网络擅长识别重叠物体,而含噪信号就是纯净信号和噪声信号的重叠,因此胶囊网络也非常适合处理振动信号的去噪问题。
附图说明
图1为本发明的实现流程图。
图2为粒子群优化算法的流程图。
图3为神经网络模型图。
图4为本发明的空洞卷积层结构示意图。
图5为BiLSTM网络结构图。
图6为LSTM网络结构图。
图7(a)为含噪振动信号时域波形图。
图7(b)为含噪振动信号频谱图。
图7(c)为采用本发明进行去噪处理后的时域波形图。
图7(d)为采用本发明进行去噪处理后的信号频谱图。
具体实施方式
下面结合附图对本发明的方法作进一步详细的描述。
一种基于改进胶囊网络的多频带谱减法振动信号去噪方法,其具体实现流程如图1所示:
1、获取纯净振动信号x(n)以及与之对应的含噪振动信号y(n);
设y(n)表示含噪振动信号,其由纯净振动信号x(n)和加性噪声d(n)组成,即:
y(n)=x(n)+d(n)
2、对含噪振动信号进行加窗,分帧,傅里叶变换(FFT)得到含噪振动信号的幅度谱|Y(f)|和相位谱
Figure BDA0002914562980000091
其具体过程为:
对含噪振动信号使用汉明窗加窗分帧:
yw(n)=w(n)y(n)=w(n)[x(n)+d(n)]=xw(n)+dw(n)
Figure BDA0002914562980000092
其中,w(n)表示汉明窗函数,L表示窗长;
假设信号是经过加窗处理的,为了简便,将信号的下标w省略,通过傅里叶变换(FFT)得到含噪振动信号y(n)的幅度谱|Y(f)|和相位谱
Figure BDA0002914562980000101
3、划分频带
将含噪振动信号的幅度谱|Y(f)|切割成任意不重复且彼此互不干扰的K个子带。
4、采用谱减法对含噪振动信号进行初步去噪
扩展谱减法是基于维纳滤波与谱减原理的结合,使用维纳滤波器估计噪声幅度谱,即利用前一帧的纯净信号和噪声信号对这一帧的噪声信号进行估计,也就是由谱减的输出作为维纳滤波器的输入信号,通过维纳滤波器再作用回谱减运算中,形成了循环结构。
针对任意子带K中去噪振动信号的幅度谱估计值的获取过程如下:
4.1、第1帧信号的处理
4.1.1、设置第1帧噪声信号幅度谱估计值
Figure BDA0002914562980000102
并将其代入谱减公式计算第1帧去噪振动信号幅度谱估计值
Figure BDA0002914562980000103
Figure BDA0002914562980000104
其中,|Y1(f)|为第1帧含噪振动信号的幅度谱,δ为减法因子,β为谱下限参数;
4.1.2、给定第1帧自适应平滑参数c1,c1=min[θ,1],θ为平滑控制常数,θ>0;
4.1.3、计算第1帧平滑的噪声谱估计;
Figure BDA0002914562980000105
4.1.4、计算第1帧去噪信号的平滑功率谱;
Figure BDA0002914562980000111
4.2、第j帧去噪振动信号幅度谱估计值的求解,j≥2;
4.2.1、基于第j-1帧平滑的噪声谱估计
Figure BDA0002914562980000112
以及第j-1帧去噪信号的平滑功率谱
Figure BDA0002914562980000113
构建第j帧维纳滤波器模型,具体表达式为:
Figure BDA0002914562980000114
4.2.2、计算第j帧噪声幅度谱的估计值
Figure BDA0002914562980000115
Figure BDA0002914562980000116
其中,|Yj(f)|为第j帧含噪振动信号的幅度谱;
4.2.3、根据谱减法获取第j帧去噪振动信号的幅度谱估计值:
Figure BDA0002914562980000117
其中,δ为减法因子,可以独立设置,以满足不同频带噪声的抑制需求,β为谱下限参数;
4.2.4、确定第j帧自适应平滑参数cj
Figure BDA0002914562980000118
式中:θ为平滑控制常数,θ>0;
4.2.5、计算第j帧平滑的噪声谱估计
Figure BDA0002914562980000119
Figure BDA0002914562980000121
4.2.6、计算第j帧去噪信号的平滑功率谱
Figure BDA0002914562980000122
Figure BDA0002914562980000123
4.2.7、重复步骤4.2.1-4.2.6,获取子带K内所有帧去噪振动信号的幅度谱估计值
Figure BDA0002914562980000124
上述运算过程中,由于平滑控制常数θ、减法因子δ以及谱下限参数β主观选择会存在很大的偶然性和随机性,影响信号去噪的结果,因此本发明还增加粒子群算法对参数进行优化后再次对子带K进行谱减从而获得更加精确的子带K内所有去噪振动信号的幅度谱估计值,其具体执行过程,如图2所示:
4.3:采用粒子群算法对子带K中平滑控制常数θ、减法因子δ以及谱下限参数β进行优化;
4.3.1、设置粒子群算法的初始参数:最大迭代次数为50,随机初始化得到任意粒子i的初始位置和速度;任意粒子i的位置表示为xi,速度表示为vi
所述粒子为步骤4.1和4.2中的平滑控制常数θ、减法因子δ以及谱下限参数β;
4.3.2、根据当前含噪振动信号的幅度谱|Y(f)|和步骤4.2.7获得的去噪振动信号的幅度谱估计值
Figure BDA0002914562980000125
计算输出信噪比SNR作为适应度函数,公式如下:
Figure BDA0002914562980000126
4.3.3、依据适应度函数依次求得各个粒子适应度值;
4.3.4、依据各个粒子适应度值计算每个粒子的个体最优位置pid和整个种群的最优位置pgd
4.3.5、更新粒子速度和位置;
粒子的速度和位置更新策略如下:
Figure BDA0002914562980000131
Figure BDA0002914562980000132
w为惯性权重,c1,c2代表学习因子,c1=1.4945,c2=1.4945,r1,r2为[0,1]之间的随机数,增加搜索的随机性;vid表示粒子i速度矢量的第d维分量,xid表示粒子i位置矢量的第d维分量,t表示迭代次数;
4.3.6、更新粒子的个体最优位置及种群的全局最优位置;
粒子位置更新后求出相应的适应度函数值,并与之前所找到的粒子个体最优值及群体最优值进行比较,从而更新pid和pgd,更新公式如下,f为适应度函数。
Figure BDA0002914562980000133
4.3.7、重复执行步骤4.3.5和4.3.6,若达到最大迭代次数则退出循环,输出平滑控制常数θ、减法因子δ以及谱下限参数β的最优解;
4.3.8、根据优化后的平滑控制常数θ、减法因子δ以及谱下限参数β值的最优解重新执行步骤4.1和4.2,获得当前子带(即子带K)去噪内所有去噪振动信号的幅度谱估计值
Figure BDA0002914562980000134
4.4、对每个子带重复执行步骤4.1-4.3,获得每个子带初步去噪后的振动信号幅度谱;
4.5、对每个子带初步去噪后的振动信号幅度谱进行叠加,并结合相位谱
Figure BDA0002914562980000141
进行逆傅里叶变换,恢复出初步去噪后的振动信号。
5、采用神经网络进行进一步去噪
为了提高传统的神经网络模型泛化性不佳的问题,对神经网络从模型层面进行优化。胶囊网络擅长识别重叠物体,而含噪信号就是纯净信号和噪声的重叠,因此胶囊网络非常适合处理信号的去噪问题。
应用空洞卷积层替代传统胶囊网络单一卷积层进行特征提取,得到更深层次的特征数据。更大的感受野有助于利用信号的全局信息,提升特征的表达能力,随之胶囊网络和BiLSTM网络两个支路分别提取信号的局部空间特征信息和时间序列特征信息,并且使用特征融合层融合特征信息。这样的网络会比使用单一网络表现更出色、更具鲁棒性。
如图3所示,本发明使用的神经网络具体模型结构:包括输入层、空洞卷积层、BiLSTM网络、胶囊网络层、第一全连接层、特征融合层、第二全连接层以及输出层,且神经网络模型中从输入层至输出层的各个连接权值赋予取值范围为[-1,1]的随机值,初始化胶囊网络动态路由过程中间变量bij为0;
以下对模型中每层进行具体介绍:
空洞卷积层
本发明中采用级联三层空洞卷积来对信号进行特征提取,得到信号的卷积特征。空洞卷积在进行卷积操作的时候,会在卷积核元素之间填充空洞。假定原来的一维卷积核的尺寸为n,膨胀因子为l,则填充空洞后得到的卷积核的尺寸为k:
k=n+(n-1)×(l-1)=l×(n-1)+1
在保证网络参数量相同的情况下,空洞卷积核拥有更大的感受野。更大的感受野有助于利用信号的全局信息,提升特征的表达能力。
本发明的空洞卷积层的示意图如图4所示,包括由扩张系数σ分别为1、2、3的卷积核且大小均为1×3的卷积层串联而成,扩张系数为1的卷积层就是普通的卷积层,扩张系数为2的卷积核相邻两个卷积核权值之间会有一个空洞,扩张系数为3的卷积核相邻两个卷积核权值之间会有2个空洞。
BiLSTM网络
BiLSTM相比LSTM还考虑了振动信号反向时序信息的影响,也即“未来”对“现在”的影响。输入分别以从前和从后输入到两个独立的LSTM网络中,两者的输出共同汇集到一个线性输出层,线性合并后进行输出。图6是沿时间展开的双向LSTM结构图:
LSTM网络如图6所示,由一个记忆单元和三个控制单元组成,即遗忘门,输入门,输出门。相应的计算公式为:
it=σ(Wixt+Uiht-1+bi)
Figure BDA0002914562980000151
ft=σ(Wfxt+Ufht-1+bf)
Figure BDA0002914562980000152
ot=σ(Woxt+Uoht-1+bo)
ht=ot×tanh(Ct)
其中,xt:t时刻记忆单元的输入,it:输入门的激活值;ft:遗忘门的激活值;ot:输出门的激活值;ht,ht-1:t时刻和t-1时刻的记忆单元的输出,Ct,Ct-1:t时刻和t-1时刻记忆单元的状态;
Figure BDA0002914562980000164
记忆单元的候选状态;Wi,Ui,Wc,Uc,Wf,Uf,Wo,Uo分别是记忆单元中对应门的权重向量;bi,bc,bf,bo分别为记忆单元中对应门的偏置。
由图5所示,BiLSTM中有两个隐藏层,分别是正向隐藏层和反向隐藏层。自前向后的正向隐藏层更新公式为:
Figure BDA0002914562980000161
自后向前的反向隐藏层更新公式为:
Figure BDA0002914562980000162
综合了网络的正反向隐藏层信息的输出层更新公式为:
Figure BDA0002914562980000163
胶囊网络层
基础胶囊层将每个卷积层的不同通道的信息组合成高维向量,然后通过数字胶囊层将高维向量进行全连接映射。数字胶囊层输出向量可以表征输入信息的多个特征属性,因此可以获得更多的局部特征信息。
首先将空洞卷积层输出的特征标量进行向量重组,得到基础胶囊层u。构建向量神经元的方法是将特征层的每4个通道合并成为一个新的胶囊单元,新组成胶囊单元的每个神经元向量的维度则为4,而所得到的胶囊单元的通道数将由减少为原来通道数的1/4。
基础胶囊层和数字胶囊层之间使用动态路算法来进行选择性连接,数字胶囊层中的第j个数字胶囊表示的向量为:
Figure BDA0002914562980000171
其中Wij是第i个基础胶囊与第j个数字胶囊之间的连接权重。ui是第i个基础胶囊表示的向量,其中cij是第i个基础胶囊与第j个数字胶囊之间的耦合系数。
耦合系数c根据下面公式计算:
Figure BDA0002914562980000172
其中bij的初始值为0,更新方式为:
bij=bij+Wijui·hj
数字胶囊表示的向量经过非线性激活函数处理后得到胶囊输出向量h,利用||·||表示向量的范数,则数字胶囊层中第j个数字胶囊对应的胶囊输出向量hj为:
Figure BDA0002914562980000173
综上所述,胶囊网络的输入为空洞卷积层的输出,胶囊网络的输出向量为h;将胶囊网络的输出向量h转换为特征标量,然后通过第一全连接层进行映射,最终维度为1×N的特征图。
特征融合层
融合对象为胶囊网络层和BiLSTM网络的输出特征图,定义fjoin为拼接函数,特征图的拼接操作定义如下:
Ijoin=fjoin(Ip,Iq)
其中,Ip,Iq分别为BiLSTM网络和胶囊网络层对应的输出特征图,维度均为D,Ijoin为拼接后的特征图,维度为2D,保留两个特征图的特征信息。其中D=1。
再通过卷积融合方法对拼接特征图执行卷积操作,实现对特征图的降维处理:
yconv=Ijoinw+b
其中,w为卷积核,b为偏置项。
基于上述对改进性胶囊网络的介绍,现对采用改进性胶囊网络进一步去噪的过程进行描述:
5.1、将步骤4.5获得的初步去噪后的振动信号和纯净振动信号组合生成数据集,并将该数据集分为训练集和测试集;
5.2、利用训练集对上述神经网络模型进行训练;
5.3、将测试集输入训练完成的网络模型中进一步去噪;
5.3.1、首先空洞卷积层提取一维振动信号Y′的卷积特征;
5.3.2、空洞卷积层输出的卷积特征经胶囊网络层处理得到为特征标量,然后通过第一全连接层进行映射,并输出特征图Iq
同时,空洞卷积层输出卷积特征经BiLSTM网络处理输出特征图Ip
5.3.3、利用特征融合层对特征图Iq以及特征图Ip进行拼接得到特征图Ijoin,再进行降维处理得到特征图yconv
5.3.4、最后对特征图yconv通过第二全连接层进行映射,最终进一步去噪后的振动信号。
5、试验验证
为了验证本发明所提方法的有效性,实际采集某型滚动轴承振动加速度信号,将采集到的数据进行适当地预处理后,将数据集分为训练数据集和测试数据集。实际的振动测试不可能采集到纯粹干净的加速度信号,因此原始信号在实际测试中已经受到了不同级别和不同种类的噪声的污染。含噪信号是通过对预处理后的原始信号进一步加入一定信噪比的高斯白噪声而产生的。将含噪信号与原始信号组合成对并进行归一化处理,便于训练的稳定性。归一化过程如下式所示:
Figure BDA0002914562980000191
使用信噪比SNR评价去噪后信号的质量,以分贝(dB)表示的信噪比计算公式为:
Figure BDA0002914562980000192
其中,yi为含噪信号,yi′为纯净信号,n是采样点的数量。
图7(a)和7(b)分别为含噪振动信号时域波形图及频谱图,图7(c)和7(d)使用本方法进行去噪处理后振动信号的时域波形图及频谱图,结合附图可以看出本方法的去噪效果好,波形未出现失真现象。
使用四种不同的信号去噪方法进行降噪处理,四种方法分别为胶囊网络,BiLSTM网络,谱减法以及本专利所提方法,含噪信号和去噪后信号的信噪比如表1所示。
表1四种方法的输出信噪比比较
Figure BDA0002914562980000201
四种算法的去噪效果在不同信噪比的噪声强度下作用不同。低信噪比时本发明方法去噪效果最好,信噪比得以很大提升。10dB高信噪比时,四种算法均有效减少了背景噪声,但噪声谱对信号的影响较小,因此本专利所提算法对于信噪比的改善效果没有低信噪比时明显。总体而言,采用基于改进胶囊网络的多频带谱减法振动信号去噪方法充分考虑了谱减法易于实现和理解的优点以及深度神经网络强大的学习能力的特点,可以有效地抑制背景噪声和“音乐噪声”。

Claims (5)

1.一种基于改进胶囊网络的多频带谱减法振动信号去噪方法,其特征在于,具体实现步骤如下:
步骤1:获取两路振动信号,分别为含噪振动信号y(n)以及纯净振动信号x(n);
其中,含噪振动信号y(n)是由纯净振动信号x(n)和加性噪声d(n)组成,其表达式为:
y(n)=x(n)+d(n)
式中,n表示采样点;
步骤2:对含噪振动信号进行加窗,分帧,傅里叶变换得到含噪振动信号的幅度谱|Y(f)|和相位谱
Figure FDA0002914562970000011
f表示频率;
步骤3:将含噪振动信号的幅度谱|Y(f)|切割成任意不重复且彼此互不干扰的多个子带;
步骤4:采用谱减法对每个子带中含噪振动信号进行初步去噪,获得初步去噪后的振动信号;
步骤4.1:任意子带K的第1帧信号的处理
步骤4.1.1:设置第1帧噪声信号幅度谱估计值
Figure FDA0002914562970000012
并将其代入谱减公式计算第1帧去噪振动信号幅度谱估计值
Figure FDA0002914562970000013
Figure FDA0002914562970000014
其中,|Y1(f)|为第1帧含噪振动信号的幅度谱,δ为减法因子,β为谱下限参数;
步骤4.1.2:给定第1帧自适应平滑参数c1,c1=min[θ,1],θ为平滑控制常数,θ>0;
步骤4.1.3:计算第1帧平滑的噪声谱估计;
Figure FDA0002914562970000021
步骤4.1.4:计算第1帧去噪信号的平滑功率谱;
Figure FDA0002914562970000022
步骤4.2:第j帧去噪振动信号幅度谱估计值的求解,j≥2;
步骤4.2.1:基于第j-1帧平滑的噪声谱估计
Figure FDA0002914562970000023
以及第j-1帧去噪信号的平滑功率谱
Figure FDA0002914562970000024
构建第j帧维纳滤波器模型,具体表达式为:
Figure FDA0002914562970000025
步骤4.2.2:计算第j帧噪声幅度谱的估计值
Figure FDA0002914562970000026
Figure FDA0002914562970000027
其中,|Yj(f)|为第j帧含噪振动信号的幅度谱;
步骤4.2.3:根据谱减法获取第j帧去噪振动信号的幅度谱估计值
Figure FDA0002914562970000028
Figure FDA0002914562970000029
步骤4.2.4:确定第j帧自适应平滑参数cj
Figure FDA0002914562970000031
式中:θ为平滑控制常数,θ>0;
步骤4.2.5:计算第j帧平滑的噪声谱估计
Figure FDA0002914562970000032
Figure FDA0002914562970000033
步骤4.2.6:计算第j帧去噪信号的平滑功率谱
Figure FDA0002914562970000034
Figure FDA0002914562970000035
步骤4.2.7:重复步骤4.2.1-4.2.6,获取当前子带K内所有帧去噪振动信号的幅度谱估计值
Figure FDA0002914562970000036
步骤4.3:对每个子带重复执行步骤4.1和4.2,获得每个子带初步去噪后的振动信号幅度谱;
步骤4.4:对每个子带初步去噪后的振动信号幅度谱进行叠加,并结合含噪振动信号的相位谱
Figure FDA0002914562970000037
进行逆傅里叶变换,恢复出初步去噪后的振动信号;
步骤5:采用神经网络对初步去噪后的振动信号进行二次去噪;
步骤5.1:将步骤4.4中恢复出初步去噪后的振动信号,结合纯净振动信号组合生成数据集,并将该数据集分为训练集和测试集;
步骤5.2:利用训练集对神经网络进行训练;
所述神经网络模型包括输入层、空洞卷积层、BiLSTM网络、胶囊网络层、第一全连接层、特征融合层、第二全连接层以及输出层,且神经网络模型中从输入层至输出层的各个连接权值赋予取值范围为[-1,1]的随机值,初始化胶囊网络动态路由过程中间变量bij为0;
步骤5.3:将测试集输入训练完成的神经网络模型中进一步去噪;
步骤5.3.1:首先空洞卷积层提取一维振动信号Y′的卷积特征;
步骤5.3.2:空洞卷积层输出的卷积特征经胶囊网络层处理得到为特征标量,然后通过第一全连接层进行映射,并输出特征图Iq
同时,空洞卷积层输出卷积特征经BiLSTM网络处理输出特征图Ip
步骤5.3.3:利用特征融合层对特征图Iq以及特征图Ip进行拼接得到特征图Ijoin,再进行降维处理得到特征图yconv
步骤5.3.4:最后对特征图yconv通过第二全连接层进行映射,最终得到进一步去噪后的振动信号。
2.根据权利要求1所述的基于改进胶囊网络的多频带谱减法振动信号去噪方法,其特征在于:执行完步骤4.2之后,还包括采用粒子群算法对平滑控制常数θ、减法因子δ以及谱下限参数β进行优化,并采用优化后的平滑控制常数θ、减法因子δ以及谱下限参数β再次对当前子带K采用步骤4.1和4.2的方式进行初步去噪,获得当前子带K所有去噪振动信号的幅度谱估计值
Figure FDA0002914562970000041
3.根据权利要求2所述的基于改进胶囊网络的多频带谱减法振动信号去噪方法,其特征在于:所述粒子群算法对平滑控制常数θ、减法因子δ以及谱下限参数β进行优化的具体步骤为:
步骤A1:设置粒子群算法的初始参数:最大迭代次数为50,随机初始化得到任意粒子i的初始位置和速度;任意粒子i的位置表示为xi,速度表示为vi;所述粒子i为平滑控制常数θ、减法因子δ以及谱下限参数β;
步骤A2:根据当前含噪振动信号的幅度谱和步骤427获得的去噪振动信号的幅度谱估计值
Figure FDA0002914562970000051
将输出信噪比作为适应度函数,公式如下:
Figure FDA0002914562970000052
步骤A3:依据适应度函数依次求得各个粒子适应度值;
步骤A4:依据各个粒子适应度值计算每个粒子的个体最优位置pid和整个种群的最优位置pgd
步骤A5:更新粒子速度和位置;
粒子的速度和位置更新策略如下:
Figure FDA0002914562970000053
Figure FDA0002914562970000054
w为惯性权重,c1,c2代表学习因子,c1=1.4945,c2=1.4945,r1,r2为[0,1]之间的随机数,增加搜索的随机性;vid表示粒子i速度矢量的第d维分量,xid表示粒子i位置矢量的第d维分量,t表示迭代次数;
步骤A6:更新粒子的个体最优位置及种群的全局最优位置;
粒子位置更新后求出相应的适应度函数值,并与之前所找到的粒子个体最优值及群体最优值进行比较,从而更新pid和pgd,更新公式如下,f为适应度函数;
Figure FDA0002914562970000055
步骤A7:重复执行步骤A5和A6,若达到最大迭代次数则退出循环,输出平滑控制常数θ,减法因子δ,谱下限参数β的最优解。
4.根据权利要求1所述的基于改进胶囊网络的多频带谱减法振动信号去噪方法,其特征在于:所述空洞卷积层包括由扩张系数σ分别为1、2、3的卷积核,且大小均为1×3的卷积层串联而成,扩张系数σ为1的卷积层就是普通的卷积层,扩张系数σ为2的卷积核相邻两个卷积核权值之间会有一个空洞,扩张系数σ为3的卷积核相邻两个卷积核权值之间会有2个空洞。
5.根据权利要求1所述的基于改进胶囊网络的多频带谱减法振动信号去噪方法,其特征在于:所述步骤2的具体实现过程为:
对含噪振动信号使用汉明窗加窗分帧:
yw(n)=w(n)y(n)=w(n)[x(n)+d(n)]=xw(n)+dw(n)
Figure FDA0002914562970000061
其中,w(n)表示汉明窗函数,L表示窗长;
假设信号是经过加窗处理的,将信号的下标w省略,再进行傅里叶变换得到含噪振动信号的幅度谱|Y(f)|和相位谱
Figure FDA0002914562970000062
CN202110096683.5A 2021-01-25 2021-01-25 基于改进胶囊网络的多频带谱减法振动信号去噪方法 Active CN112885368B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110096683.5A CN112885368B (zh) 2021-01-25 2021-01-25 基于改进胶囊网络的多频带谱减法振动信号去噪方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110096683.5A CN112885368B (zh) 2021-01-25 2021-01-25 基于改进胶囊网络的多频带谱减法振动信号去噪方法

Publications (2)

Publication Number Publication Date
CN112885368A true CN112885368A (zh) 2021-06-01
CN112885368B CN112885368B (zh) 2023-07-21

Family

ID=76050972

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110096683.5A Active CN112885368B (zh) 2021-01-25 2021-01-25 基于改进胶囊网络的多频带谱减法振动信号去噪方法

Country Status (1)

Country Link
CN (1) CN112885368B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113687433A (zh) * 2021-09-15 2021-11-23 湖南师范大学 一种基于Bi-LSTM的大地电磁信号去噪方法及***
CN114239759A (zh) * 2022-02-25 2022-03-25 武汉工程大学 电动汽车的故障诊断方法、装置、电子设备及存储介质
CN115116446A (zh) * 2022-06-21 2022-09-27 成都理工大学 一种噪声环境下说话人识别模型构建方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200019073A (ko) * 2018-08-13 2020-02-21 한국과학기술원 캡슐 네트워크 기반의 종단간 음성 인식 방법 및 장치
CN111914883A (zh) * 2020-06-18 2020-11-10 西安交通大学 一种基于深度融合网络的主轴轴承状态评估方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200019073A (ko) * 2018-08-13 2020-02-21 한국과학기술원 캡슐 네트워크 기반의 종단간 음성 인식 방법 및 장치
CN111914883A (zh) * 2020-06-18 2020-11-10 西安交通大学 一种基于深度融合网络的主轴轴承状态评估方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
汪友明等: "改进的CNN-LSTM轴承故障诊断方法", 《西安邮电大学学报》 *
鲍长春;项扬;: "基于深度神经网络的单通道语音增强方法回顾", 信号处理, no. 12 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113687433A (zh) * 2021-09-15 2021-11-23 湖南师范大学 一种基于Bi-LSTM的大地电磁信号去噪方法及***
CN114239759A (zh) * 2022-02-25 2022-03-25 武汉工程大学 电动汽车的故障诊断方法、装置、电子设备及存储介质
CN115116446A (zh) * 2022-06-21 2022-09-27 成都理工大学 一种噪声环境下说话人识别模型构建方法

Also Published As

Publication number Publication date
CN112885368B (zh) 2023-07-21

Similar Documents

Publication Publication Date Title
CN110619885B (zh) 基于深度完全卷积神经网络的生成对抗网络语音增强方法
CN107845389B (zh) 一种基于多分辨率听觉倒谱系数和深度卷积神经网络的语音增强方法
CN110867181B (zh) 基于scnn和tcnn联合估计的多目标语音增强方法
CN112885368A (zh) 基于改进胶囊网络的多频带谱减法振动信号去噪方法
CN109841226B (zh) 一种基于卷积递归神经网络的单通道实时降噪方法
CN108682418B (zh) 一种基于预训练和双向lstm的语音识别方法
CN110634502B (zh) 基于深度神经网络的单通道语音分离算法
CN110246510B (zh) 一种基于RefineNet的端到端语音增强方法
CN110148420A (zh) 一种适用于噪声环境下的语音识别方法
CN107452389A (zh) 一种通用的单声道实时降噪方法
CN109890043B (zh) 一种基于生成式对抗网络的无线信号降噪方法
CN111899757B (zh) 针对目标说话人提取的单通道语音分离方法及***
CN112735456A (zh) 一种基于dnn-clstm网络的语音增强方法
CN105957537A (zh) 一种基于l1/2稀疏约束卷积非负矩阵分解的语音去噪方法和***
CN112331224A (zh) 轻量级时域卷积网络语音增强方法与***
CN113936681B (zh) 一种基于掩膜映射和混合空洞卷积网络的语音增强方法
CN112259119B (zh) 基于堆叠沙漏网络的音乐源分离方法
WO2019014890A1 (zh) 一种通用的单声道实时降噪方法
CN114446314A (zh) 一种深度生成对抗网络的语音增强方法
CN110808057A (zh) 一种基于约束朴素生成对抗网络的语音增强方法
CN117111000A (zh) 一种基于双通道注意力残差网络的sar梳状谱干扰抑制方法
Xu et al. U-former: Improving monaural speech enhancement with multi-head self and cross attention
CN112201276B (zh) 基于TC-ResNet网络的麦克风阵列语音分离方法
CN114339539A (zh) 一种采用麦克风阵列拾音的多通道语音增强方法
Xue et al. Real-Time Multi-Channel Speech Enhancement Based on Neural Network Masking with Attention Model.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant