CN104157295A - 用于检测及抑制瞬态噪声的方法 - Google Patents
用于检测及抑制瞬态噪声的方法 Download PDFInfo
- Publication number
- CN104157295A CN104157295A CN201410418126.0A CN201410418126A CN104157295A CN 104157295 A CN104157295 A CN 104157295A CN 201410418126 A CN201410418126 A CN 201410418126A CN 104157295 A CN104157295 A CN 104157295A
- Authority
- CN
- China
- Prior art keywords
- frame
- noise
- transient noise
- frequency
- transient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Circuit For Audible Band Transducer (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
Abstract
一种用于检测及抑制瞬态噪声的方法,涉及声信号处理技术领域,所解决的是现有方法实时性差,及对瞬态噪声的抑制效果差的技术问题。该方法先利用传声器拾取声信号,再对声信号进行预处理,并忽略平稳态噪声残留,得到预处理后的声信号x(n),再通过快速傅里叶变换计算x(n)每一帧的短时谱,再采用基于高采样或基于自谱相干的瞬态噪声检测方法对x(n)进行瞬态噪声检测,再采用基于语音谐波及基于语音和音频时频连续性的保护方法进行瞬态噪声的鲁棒抑制,然后再计算各个帧的最终瞬态噪声抑制增益,最后再通过时域重叠相加重构各个帧。本发明提供的方法,适用于语音和音频信号,既可应用于实时语音和音频通信***,也可以应用非实时的语音和音频信号增强中。
Description
技术领域
本发明涉及声信号处理技术,特别是涉及一种用于检测及抑制瞬态噪声的方法的技术。
背景技术
当前,绝大多数的单通道语音增强方法都假定噪声的平稳特性,即噪声相对于语音信号更加平稳,可以通过噪声估计方法对平稳态噪声进行估计,最后进行平稳态噪声的抑制。多通道语音增强方法都利用目标语音和干扰噪声的空间分离度,通过波束形成等手段进行空域滤波,实现平稳态和非平稳态噪声抑制。
现有方法都采用基于监督学习的瞬态噪声抑制方法,需要通过在线或者离线监督学习瞬态噪声特性,以实现瞬态噪声的检测,最终实现瞬态噪声抑制,因此无法做到实时性,也无法适用于所有类型的瞬态噪声,对瞬态噪声的抑制效果较差,导致声信号失真严重,无法应用于实时语音通信***中,同时该方法也不具普遍适用性。
发明内容
针对上述现有技术中存在的缺陷,本发明所要解决的技术问题是提供一种实时性好,且对瞬态噪声的抑制效果好,能有效减少声信号失真的用于检测及抑制瞬态噪声的方法。
为了解决上述技术问题,本发明所提供的一种用于检测及抑制瞬态噪声的方法,其特征在于,具体步骤如下:
1)利用单传声器或多传声器拾取声信号;
2)对传声器所拾取的声信号进行预处理,并忽略平稳态噪声残留,得到预处理后的声信号为:
x(n)=s(n)+dt(n);
其中,x(n)为预处理后的声信号,s(n)为预处理后的声信号中的目标语音成分,dt(n)为预处理后的声信号中的瞬态噪声成分;
如果声信号是采用单传声器拾取的,其预处理方式为采用谱减法来抑制声信号的平稳态噪声;
如果声信号是采用多传声器拾取的,其预处理方式为先采用波束形成法来抑制方向性干扰噪声,再采用多通道后滤波法来抑制环境噪声;
3)通过快速傅里叶变换计算x(n)每一帧的短时谱,具体计算公式为:
X(k,l)=S(k,l)+Dt(k,l);
其中,X(k,l)为x(n)中的第l帧的第k个频带短时谱,S(k,l)为s(n)中的第l帧的第k个频带短时谱,Dt(k,l)为dt(n)中的第l帧的第k个频带短时谱;
4)采用基于高采样的瞬态噪声检测方法对x(n)进行瞬态噪声检测,或采用基于自谱相干的瞬态噪声检测方法对x(n)进行瞬态噪声检测,从而得到各个帧的初步瞬态噪声抑制增益;
5)采用基于语音谐波的保护方法进行瞬态噪声的鲁棒抑制,得出各个帧的基频及谐频对应频带的第一种增益保护函数,并采用基于语音和音频时频连续性的保护方法进行瞬态噪声的鲁棒抑制,得出语音和音频时频连续性对应频带的第二种增益保护函数;
6)计算各个帧的最终瞬态噪声抑制增益,具体计算公式为:
G(k,l)=max{G1(k,l),Gp,1(k,l),Gp,2(k,l),Gmin};
其中,G(k,l)为第l帧第k个频带的最终瞬态噪声抑制增益,G1(k,l)为第l帧第k个频带的初步瞬态噪声抑制增益,Gp,1(k,l)为第l帧第k个频带的第一种增益保护函数,Gp,2(k,l)为第l帧第k个频带的第二种增益保护函数,Gmin为最大瞬态噪声抑制量,Gmin的取值在-30dB到-20dB之间,对G(k,l)进行进一步约束如下:
G(k,l)=min{G(k,l),1};
7)通过时域重叠相加重构各个帧,重构公式为:
其中,为各帧重构后得到的声信号,IFFT为逆快速傅里叶变换。
进一步的,所述步骤4)中,基于高采样的瞬态噪声检测方法的检测步骤如下:
4.1.1)对x(n)采用高采样率进行采样,设x(n)中,目标语音的频率范围为[0,fU],所采用的高采样率为fs1,则有fs1>>2fU,fs1>>2fU是指fs1在2fU的1.5倍以上;
4.1.2)利用子带分析滤波器或快速傅里叶变换,将采样样本按一帧一个子带的方式分成多个子带,并计算各个子带的能量,具体计算公式为:
其中,Enersub,p为采样样本中的第p个子带的能量,nl为计算子带能量的采样点下限,nu为计算子带能量的采样点上限,xsub,p(n)为采样样本中的第p个子带,q为指数,q取值为1为幅度求和,q取值为2为平方求和;
4.1.3)在x(n)的频率域对每个子带进行噪声能量粗略分带估算,并根据各个子带的噪声能量粗略分带估算值设定当前子带的瞬态噪声标志;
对于每一个子带,如果存在Enersub,p≥R×Noise_Enersub,p,则将该子带的瞬态噪声标志设置为1,表征当前子带具有瞬态噪声,反之则将该子带的瞬态噪声标志设置为0,表征当前子带没有瞬态噪声;
其中,R为门限,R的取值范围为5~10,Noise_Enersub,p为采样样本中的第p个子带的噪声能量粗略分带估算值;
4.1.4)降低采样率对步骤4.1.3)处理后的每个子带进行重采样后重构,设重采样的采样率为fs2,则有fs2=2fU;
4.1.5)根据步骤4.1.4)的瞬态噪声检测结果,得到各个帧的初步瞬态噪声抑制增益为:
G1(k,l)=min{1-F1(k,l)};
其中,G1(k,l)为第l帧的初步瞬态噪声抑制增益,F1(k,l)为第l帧的瞬态噪声标志。
进一步的,所述步骤4)中,基于自谱相干的瞬态噪声检测方法的检测步骤如下:
4.2.1)计算每个频带的自谱相干,具体计算公式为:
其中,Cxx(k,l)为第l帧的第k个频带的自谱相干,k0和K0均为正整数,k0的取值为2或3或4,K0的典型值为8,K=[k-K0 … k+K0];
4.2.2)将每个频带的自谱相干与门限对比,检测每个频带的瞬态噪声;
对于每一个频带,如果存在Cxx(k,l)≥Cth1,则将该频带的瞬态噪声标志设置为1,表征当前帧的当前频带具有瞬态噪声,反之则将该频带的瞬态噪声标志设置为0,表征当前帧的当前频带没有瞬态噪声;
其中,Cth1是检测门限,取值范围为[0.5,1];
4.2.3)计算帧自谱相干,具体计算公式为:
其中,Cxx(l)为第l帧的自谱相干,k0是正整数,其取值为2或3或4,Kl=[klow … kup],klow的取值为11,kup是一常数;
4.2.4)将帧自谱相干与门限对比,检测每个帧的瞬态噪声:
对于每一个帧,如果存在Cxx(l)≥Cth2,则将该帧的瞬态噪声标志设置为1,表征当前帧具有瞬态噪声,反之则将该帧的瞬态噪声标志设置为0,表征当前帧没有瞬态噪声;
其中,Cth2是检测门限,其取值范围为[0.1,1];
4.2.5)根据步骤4.2.4)的瞬态噪声检测结果,得到各个帧的初步瞬态噪声抑制增益为:
G1(k,l)=min{1-Fj(k,l),j=2,3};
其中,G1(k,l)为第l帧的初步瞬态噪声抑制增益,F2(k,l)为第l帧的瞬态噪声标志,F3(k,l)为第l帧的第k个频带的瞬态噪声标志设置。
进一步的,所述步骤4.2.3)中,传声器拾取声信号的采样频率为8000Hz时,kup的取值为129,传声器拾取声信号的采样频率为16000Hz时,kup的取值为257,传声器拾取声信号的采样频率大于等于32000Hz时,kup的取值为513。
进一步的,所述步骤5)中,基于语音谐波的保护方法的计算步骤如下:
5.1.1)采用基频估计方法提取各个帧的基频,并计算基频频带,具体计算公式为:
其中,为第l帧的基频频带,f0,l为第l帧的基频,fs为传声器拾取声信号的采样频率,N为传声器拾取声信号的数据分帧帧长;
5.1.2)对各个帧的基频及谐频对应的频带进行保护,保护策略为:
对于每一个帧,如果存在且则令Gp,1(k,l)=1;
其中,k为第l帧的第k个频带,Gp,1(k,l)为第l帧第k个频带的第一种增益保护函数,其初始值为0;
其中,j为小于等于6的正整数。
进一步的,所述步骤5)中,基于语音和音频时频连续性的保护方法采用的是基于语音和音频连续性的实时保护方法,该方法的计算步骤如下:
5.2.1.1)在频域内对谱进行平滑处理,具体处理公式为:
其中,w(k)为窗函数,具体为矩形窗,或三角窗,或汉宁窗;
5.2.1.2)计算各个帧的增益保护函数,具体计算公式为:
其中,Gp,2(k,l)为第l帧第k个频带的第二种增益保护函数,q为指数,q的典型取值为0.5或1或2,l0为帧偏移。
进一步的,所述步骤5)中,基于语音和音频时频连续性的保护方法采用的是基于语音和音频连续性的非实时保护方法,该方法的计算步骤如下:
5.2.2.1)在频域内对谱进行平滑处理,具体处理公式为:
其中,w(k)为窗函数,具体为矩形窗,或三角窗,或汉宁窗;
5.2.1.2)计算各个帧的增益保护函数,具体计算公式为:
其中,Gp,2(k,l)为第l帧第k个频带的第二种增益保护函数,q为指数,q的典型取值为0.5或1或2,l0为帧偏移。
本发明提供的用于检测及抑制瞬态噪声的方法,考虑瞬态噪声的时频特性,采用高采样和自谱相干两个手段实现高瞬态噪声检测率和低虚警率的目标,不需要监督学习瞬态噪声特性,具有实时性较好的特点,还保护了清音信号及辅助保护了浊音信号,而且还利用语音和音频的时间相关性和频域相关性,同时考虑瞬态噪声的短时特性,对瞬态噪声的抑制效果好,在瞬态噪声抑制过程中还通过基于语音谐波特性的保护策略,避免语音尤其是浊音的谐波失真,通过基于信号连续性的保护策略,减少语音和音频信号的失真。
附图说明
图1是本发明实施例的用于检测及抑制瞬态噪声的方法处理单传声器所拾取的声信号的原理图;
图2是本发明实施例的用于检测及抑制瞬态噪声的方法处理多传声器所拾取的声信号的原理图;
图3是本发明实施例的用于检测及抑制瞬态噪声的方法中,基于高采样的瞬态噪声检测方法的原理图;
图4是本发明实施例的用于检测及抑制瞬态噪声的方法中,基于自谱相干的瞬态噪声检测方法的原理图;
图5是本发明实施例的用于检测及抑制瞬态噪声的方法中,进行瞬态噪声鲁棒抑制的原理图。
具体实施方式
以下结合附图说明对本发明的实施例作进一步详细描述,但本实施例并不用于限制本发明,凡是采用本发明的相似结构及其相似变化,均应列入本发明的保护范围。
如图1-图5所示,本发明实施例所提供的一种用于检测及抑制瞬态噪声的方法,其特征在于,具体步骤如下:
1)利用单传声器或多传声器拾取声信号,声信号模型公式为:
xi(n)=si(n)+ds,i(n)+dt,i(n);
其中,1≤i≤M,M为传声器的数量,xi(n)为第i个传声器拾取到的声信号,si(n)为第i个传声器拾取到的声信号中的目标语音信号(如人说话的声音),ds,i(n)为第i个传声器拾取到的声信号中的平稳态噪声(如汽车噪声),dt,i(n)为第i个传声器拾取到的声信号中的瞬态噪声(如敲击键盘、鼠标的声音);
2)对传声器所拾取的声信号进行预处理,并忽略平稳态噪声残留;
如果声信号是采用单传声器拾取的(即M=1),其预处理方式为采用谱减法来抑制声信号的平稳态噪声;
如果声信号是采用多传声器拾取的(即M>1),其预处理方式为先采用波束形成法来抑制方向性干扰噪声,再采用多通道后滤波法来抑制环境噪声;
其中,谱减法、波束形成法、后滤波法均为现有技术;
其中,波束形成法主要有固定波束形成法及自适应波束形成法,固定波束形成法主要有延迟相加(DSB:Delay-and-Sum Beamforming)、延迟滤波(DFB:Delay-and-Filtering Beaforming)及鲁棒超指向性波束形成(RSB:RobustSuperdirective Beamforming)等,自适应波束形成法主要有广义旁瓣抑制法(GSC:Generalized Sidelobe Canceller)、最小方差无失真响应法(MVDR:MinimumVariance Distortionless Response)、多通道维纳滤波方法(MWF:Multi-channelWiener Filtering);
其中,多通道后滤波法可以采用基于相位的方法、基于相干的方法或基于能量的方法等;
得到预处理后的声信号为:
x(n)=s(n)+dt(n);
其中,x(n)为预处理后的声信号,s(n)为预处理后的声信号中的目标语音成分,dt(n)为预处理后的声信号中的瞬态噪声成分;
3)通过快速傅里叶变换计算x(n)每一帧的短时谱,具体计算公式为:
X(k,l)=S(k,l)+Dt(k,l);
其中,X(k,l)为x(n)中的第l帧的第k个频带短时谱,S(k,l)为s(n)中的第l帧的第k个频带短时谱,Dt(k,l)为dt(n)中的第l帧的第k个频带短时谱;
4)采用基于高采样的瞬态噪声检测方法对x(n)进行瞬态噪声检测,或采用基于自谱相干的瞬态噪声检测方法对x(n)进行瞬态噪声检测;
4.1)基于高采样的瞬态噪声检测方法的检测步骤如下:
4.1.1)对x(n)采用高采样率进行采样,设x(n)中,目标语音的频率范围为[0,fU],所采用的高采样率为fs1,则有fs1>>2fU,fs1>>2fU是指fs1在2fU的1.5倍以上;
其中,fU常用的频率有4000Hz、5512.5Hz、8000Hz,则fs1的取值可以是22050Hz、32000Hz、44100Hz甚至48000Hz等常用的音频采样率;
4.1.2)利用子带分析滤波器或快速傅里叶变换,将采样样本按一帧一个子带的方式分成多个子带,并计算各个子带的能量,具体计算公式为:
其中,Enersub,p为采样样本中的第p个子带的能量,nl为计算子带能量的采样点下限,nu为计算子带能量的采样点上限,xsub,p(n)为采样样本中的第p个子带,q为指数,q取值为1为幅度求和,q取值为2为平方求和;
其中,利用子带分析滤波器或快速傅里叶变换将采样样本方式分成多个子带的方法为现有技术;
4.1.3)在x(n)的频率域对每个子带进行噪声能量粗略分带估算,并根据各个子带的噪声能量粗略分带估算值设定当前子带的瞬态噪声标志;
对于每一个子带,如果存在Enersub,p≥R×Noise_Enersub,p,则将该子带的瞬态噪声标志设置为1,表征当前子带具有瞬态噪声,反之则将该子带的瞬态噪声标志设置为0,表征当前子带没有瞬态噪声;
其中,R为门限,R的取值范围为5~10,Noise_Enersub,p为采样样本中的第p个子带的噪声能量粗略分带估算值;
其中,对子带进行噪声能量粗略分带估算的方法为现有技术;
4.1.4)降低采样率对步骤4.1.3)处理后的每个子带进行重采样后重构,设重采样的采样率为fs2,则有fs2=2fU;
其中,fs2的取值可以是8000Hz、11025Hz、16000Hz;
4.1.5)根据步骤4.1.4)的瞬态噪声检测结果,得到各个帧的初步瞬态噪声抑制增益为:
G1(k,l)=min{1-F1(k,l)};
其中,G1(k,l)为第l帧的初步瞬态噪声抑制增益,F1(k,l)为第l帧的瞬态噪声标志;
4.2)基于自谱相干的瞬态噪声检测方法的检测步骤如下:
4.2.1)计算每个频带的自谱相干,具体计算公式为:
其中,Cxx(k,l)为第l帧的第k个频带的自谱相干,k0和K0均为正整数,k0的取值为2或3或4,K0的典型值为8,K0决定了用于计算自谱相干的频带个数,K0越大,方差越小,频率分辨率越低,K=[k-K0 … k+K0],即(k-K0)≤K≤(k+K0);
4.2.2)将每个频带的自谱相干与门限对比,检测每个频带的瞬态噪声;
对于每一个频带,如果存在Cxx(k,l)≥Cth1,则将该频带的瞬态噪声标志设置为1,表征当前帧的当前频带具有瞬态噪声,反之则将该频带的瞬态噪声标志设置为0,表征当前帧的当前频带没有瞬态噪声;
其中,Cth1是检测门限,取值范围为[0.5,1],Cth1取值越大,瞬态噪声检测概率越低,语音和音频失真越小;
4.2.3)计算帧自谱相干,具体计算公式为:
其中,Cxx(l)为第l帧的自谱相干,k0是正整数,其取值为2或3或4,Kl=[klow … kup],即klow≤K≤kup,klow的取值为11,使得频率低于300Hz的帧不用于计算自谱相干,以减少低频噪声对自谱相干的影响,kup是一常数,kup的取值由传声器拾取声信号的采样频率决定,传声器拾取声信号的采样频率越大,kup的取值也越大,传声器拾取声信号的采样频率为8000Hz时,kup的典型值为129,传声器拾取声信号的采样频率为16000Hz时,kup的典型值为257,传声器拾取声信号的采样频率大于等于32000Hz时,kup的典型值为513;
4.2.4)将帧自谱相干与门限对比,检测每个帧的瞬态噪声:
对于每一个帧,如果存在Cxx(l)≥Cth2,则将该帧的瞬态噪声标志设置为1,表征当前帧具有瞬态噪声,反之则将该帧的瞬态噪声标志设置为0,表征当前帧没有瞬态噪声;
其中,Cth2是检测门限,其取值范围为[0.1,1],Cth2取值越大,瞬态噪声检测概率越低,同时语音和音频失真越小;
4.2.5)根据步骤4.2.4)的瞬态噪声检测结果,得到各个帧的初步瞬态噪声抑制增益为:
G1(k,l)=min{1-Fj(k,l),j=2,3};
其中,G1(k,l)为第l帧的初步瞬态噪声抑制增益,F2(k,l)为第l帧的瞬态噪声标志,F3(k,l)为第l帧的第k个频带的瞬态噪声标志设置;
5)采用基于语音谐波的保护方法进行瞬态噪声的鲁棒抑制,得出各个帧的基频及谐频对应频带的第一种增益保护函数,并采用基于语音和音频时频连续性的保护方法进行瞬态噪声的鲁棒抑制,得出语音和音频时频连续性对应频带的第二种增益保护函数;
瞬态噪声的鲁棒抑制方法还可以采用现有的中值滤波等其他方法;
5.1)基于语音谐波的保护方法的计算步骤如下:
5.1.1)采用基频估计方法提取各个帧的基频,并计算基频频带,具体计算公式为:
其中,为第l帧的基频频带,f0,l为第l帧的基频,fs为传声器拾取声信号的采样频率,N为传声器拾取声信号的数据分帧帧长,即计算一次快速傅里叶变换的点数;
5.1.2)对各个帧的基频及谐频对应的频带进行保护,保护策略为:
对于每一个帧,如果存在且则令Gp,1(k,l)=1;
其中,k为第l帧的第k个频带,Gp,1(k,l)为第l帧第k个频带的第一种增益保护函数,其初始值为0;
其中,j为小于等于6的正整数,表征基频及其谐频对应的频带,j=1时对应于基频,当j大于2时对应于第j次谐频,表征基频和谐频对应频带的临近频带,保护基频及临近频带可以减少语音失真;
5.2)基于语音和音频时频连续性的保护方法有两种,一种是基于语音和音频连续性的实时保护方法,另一种是基于语音和音频连续性的非实时保护方法;
5.2.1)基于语音和音频连续性的实时保护方法的计算步骤如下:
5.2.1.1)在频域内对谱进行平滑处理,具体处理公式为:
其中,w(k)为窗函数,具体为矩形窗,或三角窗,或汉宁窗;
5.2.1.2)计算各个帧的增益保护函数,具体计算公式为:
其中,Gp,2(k,l)为第l帧第k个频带的第二种增益保护函数,q为指数,q的典型取值为0.5或1或2,q的取值越大瞬态噪声抑制量也越大,语音失真也随之增大,l0为帧偏移,l0的取值与瞬态噪声持续时间、分帧长度、帧重叠等参数直接相关;
5.2.2)基于语音和音频连续性的非实时保护方法的计算步骤如下:
5.2.2.1)在频域内对谱进行平滑处理,具体处理公式为:
其中,w(k)为窗函数,具体为矩形窗,或三角窗,或汉宁窗;
5.2.1.2)计算各个帧的增益保护函数,具体计算公式为:
其中,Gp,2(k,l)为第l帧第k个频带的第二种增益保护函数,q为指数,q的典型取值为0.5或1或2,q的取值越大瞬态噪声抑制量也越大,语音失真也随之增大,l0为帧偏移,l0的取值与瞬态噪声持续时间、分帧长度、帧重叠等参数直接相关,相比基于语音和音频连续性的实时保护方法,基于语音和音频连续性的非实时保护方法利用了当前帧之后的数据帧信息进行相关的保护;
6)计算各个帧的最终瞬态噪声抑制增益,具体计算公式为:
G(k,l)=max{G1(k,l),Gp,1(k,l),Gp,2(k,l),Gmin};
其中,G(k,l)为第l帧第k个频带的最终瞬态噪声抑制增益,Gmin为最大瞬态噪声抑制量,Gmin的取值在-30dB到-20dB之间,Gmin取值越小,残留噪声愈大,语音失真越小,为了确保G(k,l)取值小于1,对G(k,l)进行进一步约束如下:
G(k,l)=min{G(k,l),1};
7)通过时域重叠相加重构各个帧,重构公式为:
其中,为各帧重构后得到的声信号,IFFT为逆快速傅里叶变换。
本发明实施例的方法对声信号的检测延迟在8ms以内,且检测瞬态噪声的概率在99%的情况下,清音误判断成瞬态噪声的概率仅不到1%,具有实时性、检测率高的特点,瞬态噪声抑制量可以达到30dB以上,而且语音失真小于3dB,有效解决了瞬态噪声(如鼠标声、键盘声、敲击声、鼓掌声等)对语音和音频信号的影响,提高了语音识别率和语音通信质量,适用于语音和音频信号,既可应用于实时语音和音频通信***,也可以应用非实时的语音和音频信号增强中。
Claims (7)
1.一种用于检测及抑制瞬态噪声的方法,其特征在于,具体步骤如下:
1)利用单传声器或多传声器拾取声信号;
2)对传声器所拾取的声信号进行预处理,并忽略平稳态噪声残留,得到预处理后的声信号为:
x(n)=s(n)+dt(n);
其中,x(n)为预处理后的声信号,s(n)为预处理后的声信号中的目标语音成分,dt(n)为预处理后的声信号中的瞬态噪声成分;
如果声信号是采用单传声器拾取的,其预处理方式为采用谱减法来抑制声信号的平稳态噪声;
如果声信号是采用多传声器拾取的,其预处理方式为先采用波束形成法来抑制方向性干扰噪声,再采用多通道后滤波法来抑制环境噪声;
3)通过快速傅里叶变换计算x(n)每一帧的短时谱,具体计算公式为:
X(k,l)=S(k,l)+Dt(k,l);
其中,X(k,l)为x(n)中的第l帧的第k个频带短时谱,S(k,l)为s(n)中的第l帧的第k个频带短时谱,Dt(k,l)为dt(n)中的第l帧的第k个频带短时谱;
4)采用基于高采样的瞬态噪声检测方法对x(n)进行瞬态噪声检测,或采用基于自谱相干的瞬态噪声检测方法对x(n)进行瞬态噪声检测,从而得到各个帧的初步瞬态噪声抑制增益;
5)采用基于语音谐波的保护方法进行瞬态噪声的鲁棒抑制,得出各个帧的基频及谐频对应频带的第一种增益保护函数,并采用基于语音和音频时频连续性的保护方法进行瞬态噪声的鲁棒抑制,得出语音和音频时频连续性对应频带的第二种增益保护函数;
6)计算各个帧的最终瞬态噪声抑制增益,具体计算公式为:
G(k,l)=max{G1(k,l),Gp,1(k,l),Gp,2(k,l),Gmin};
其中,G(k,l)为第l帧第k个频带的最终瞬态噪声抑制增益,G1(k,l)为第l帧第k个频带的初步瞬态噪声抑制增益,Gp,1(k,l)为第l帧第k个频带的第一种增益保护函数,Gp,2(k,l)为第l帧第k个频带的第二种增益保护函数,Gmin为最大瞬态噪声抑制量,Gmin的取值在-30dB到-20dB之间,对G(k,l)进行进一步约束如下:
G(k,l)=min{G(k,l),1};
7)通过时域重叠相加重构各个帧,重构公式为:
其中,为各帧重构后得到的声信号,IFFT为逆快速傅里叶变换。
2.根据权利要求1所述的用于检测及抑制瞬态噪声的方法,其特征在于,所述步骤4)中,基于高采样的瞬态噪声检测方法的检测步骤如下:
4.1.1)对x(n)采用高采样率进行采样,设x(n)中,目标语音的频率范围为[0,fU],所采用的高采样率为fs1,则有fs1>>2fU,fs1>>2fU是指fs1在2fU的1.5倍以上;
4.1.2)利用子带分析滤波器或快速傅里叶变换,将采样样本按一帧一个子带的方式分成多个子带,并计算各个子带的能量,具体计算公式为:
其中,Enersub,p为采样样本中的第p个子带的能量,nl为计算子带能量的采样点下限,nu为计算子带能量的采样点上限,xsub,p(n)为采样样本中的第p个子带,q为指数,q取值为1为幅度求和,q取值为2为平方求和;
4.1.3)在x(n)的频率域对每个子带进行噪声能量粗略分带估算,并根据各个子带的噪声能量粗略分带估算值设定当前子带的瞬态噪声标志;
对于每一个子带,如果存在Enersub,p≥R×Noise_Enersub,p,则将该子带的瞬态噪声标志设置为1,表征当前子带具有瞬态噪声,反之则将该子带的瞬态噪声标志设置为0,表征当前子带没有瞬态噪声;
其中,R为门限,R的取值范围为5~10,Noise_Enersub,p为采样样本中的第p个子带的噪声能量粗略分带估算值;
4.1.4)降低采样率对步骤4.1.3)处理后的每个子带进行重采样后重构,设重采样的采样率为fs2,则有fs2=2fU;
4.1.5)根据步骤4.1.4)的瞬态噪声检测结果,得到各个帧的初步瞬态噪声抑制增益为:
G1(k,l)=min{1-F1(k,l)};
其中,G1(k,l)为第l帧的初步瞬态噪声抑制增益,F1(k,l)为第l帧的瞬态噪声标志。
3.根据权利要求1所述的用于检测及抑制瞬态噪声的方法,其特征在于,所述步骤4)中,基于自谱相干的瞬态噪声检测方法的检测步骤如下:
4.2.1)计算每个频带的自谱相干,具体计算公式为:
其中,Cxx(k,l)为第l帧的第k个频带的自谱相干,k0和K0均为正整数,k0的取值为2或3或4,K0的典型值为8,K=[k-K0 … k+K0];
4.2.2)将每个频带的自谱相干与门限对比,检测每个频带的瞬态噪声;
对于每一个频带,如果存在Cxx(k,l)≥Cth1,则将该频带的瞬态噪声标志设置为1,表征当前帧的当前频带具有瞬态噪声,反之则将该频带的瞬态噪声标志设置为0,表征当前帧的当前频带没有瞬态噪声;
其中,Cth1是检测门限,取值范围为[0.5,1];
4.2.3)计算帧自谱相干,具体计算公式为:
其中,Cxx(l)为第l帧的自谱相干,k0是正整数,其取值为2或3或4,Kl=[klow … kup],klow的取值为11,kup是一常数;
4.2.4)将帧自谱相干与门限对比,检测每个帧的瞬态噪声:
对于每一个帧,如果存在Cxx(l)≥Cth2,则将该帧的瞬态噪声标志设置为1,表征当前帧具有瞬态噪声,反之则将该帧的瞬态噪声标志设置为0,表征当前帧没有瞬态噪声;
其中,Cth2是检测门限,其取值范围为[0.1,1];
4.2.5)根据步骤4.2.4)的瞬态噪声检测结果,得到各个帧的初步瞬态噪声抑制增益为:
G1(k,l)=min{1-Fj(k,l),j=2,3};
其中,G1(k,l)为第l帧的初步瞬态噪声抑制增益,F2(k,l)为第l帧的瞬态噪声标志,F3(k,l)为第l帧的第k个频带的瞬态噪声标志设置。
4.根据权利要求3所述的用于检测及抑制瞬态噪声的方法,其特征在于,所述步骤4.2.3)中,传声器拾取声信号的采样频率为8000Hz时,kup的取值为129,传声器拾取声信号的采样频率为16000Hz时,kup的取值为257,传声器拾取声信号的采样频率大于等于32000Hz时,kup的取值为513。
5.根据权利要求1所述的用于检测及抑制瞬态噪声的方法,其特征在于,所述步骤5)中,基于语音谐波的保护方法的计算步骤如下:
5.1.1)采用基频估计方法提取各个帧的基频,并计算基频频带,具体计算公式为:
其中,为第l帧的基频频带,f0,l为第l帧的基频,fs为传声器拾取声信号的采样频率,N为传声器拾取声信号的数据分帧帧长;
5.1.2)对各个帧的基频及谐频对应的频带进行保护,保护策略为:
对于每一个帧,如果存在且则令Gp,1(k,l)=1;
其中,k为第l帧的第k个频带,Gp,1(k,l)为第l帧第k个频带的第一种增益保护函数,其初始值为0;
其中,j为小于等于6的正整数。
6.根据权利要求1所述的用于检测及抑制瞬态噪声的方法,其特征在于,所述步骤5)中,基于语音和音频时频连续性的保护方法采用的是基于语音和音频连续性的实时保护方法,该方法的计算步骤如下:
5.2.1.1)在频域内对谱进行平滑处理,具体处理公式为:
其中,w(k)为窗函数,具体为矩形窗,或三角窗,或汉宁窗;
5.2.1.2)计算各个帧的增益保护函数,具体计算公式为:
其中,Gp,2(k,l)为第l帧第k个频带的第二种增益保护函数,q为指数,q的典型取值为0.5或1或2,l0为帧偏移。
7.根据权利要求1所述的用于检测及抑制瞬态噪声的方法,其特征在于,所述步骤5)中,基于语音和音频时频连续性的保护方法采用的是基于语音和音频连续性的非实时保护方法,该方法的计算步骤如下:
5.2.2.1)在频域内对谱进行平滑处理,具体处理公式为:
其中,w(k)为窗函数,具体为矩形窗,或三角窗,或汉宁窗;
5.2.1.2)计算各个帧的增益保护函数,具体计算公式为:
其中,Gp,2(k,l)为第l帧第k个频带的第二种增益保护函数,q为指数,q的典型取值为0.5或1或2,l0为帧偏移。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410418126.0A CN104157295B (zh) | 2014-08-22 | 2014-08-22 | 用于检测及抑制瞬态噪声的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410418126.0A CN104157295B (zh) | 2014-08-22 | 2014-08-22 | 用于检测及抑制瞬态噪声的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104157295A true CN104157295A (zh) | 2014-11-19 |
CN104157295B CN104157295B (zh) | 2018-03-09 |
Family
ID=51882777
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410418126.0A Expired - Fee Related CN104157295B (zh) | 2014-08-22 | 2014-08-22 | 用于检测及抑制瞬态噪声的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104157295B (zh) |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104599677A (zh) * | 2014-12-29 | 2015-05-06 | 中国科学院上海高等研究院 | 基于语音重建的瞬态噪声抑制方法 |
CN105788607A (zh) * | 2016-05-20 | 2016-07-20 | 中国科学技术大学 | 应用于双麦克风阵列的语音增强方法 |
CN106052852A (zh) * | 2016-06-01 | 2016-10-26 | 中国电子科技集团公司第三研究所 | 一种脉冲声信号的检测方法及装置 |
CN107924684A (zh) * | 2015-12-30 | 2018-04-17 | 谷歌有限责任公司 | 使用半盲自适应滤波器模型的通信终端的声学击键瞬态消除器 |
CN108597527A (zh) * | 2018-04-19 | 2018-09-28 | 北京微播视界科技有限公司 | 多声道音频处理方法、装置、计算机可读存储介质和终端 |
CN108899043A (zh) * | 2018-06-15 | 2018-11-27 | 深圳市康健助力科技有限公司 | 数字助听器瞬时噪声抑制算法的研究及实现 |
CN109215677A (zh) * | 2018-08-16 | 2019-01-15 | 北京声加科技有限公司 | 一种适用于语音和音频的风噪检测和抑制方法和装置 |
WO2019205798A1 (zh) * | 2018-04-27 | 2019-10-31 | 深圳市沃特沃德股份有限公司 | 语音增强的方法、装置及设备 |
CN110503973A (zh) * | 2019-08-28 | 2019-11-26 | 浙江大华技术股份有限公司 | 音频信号瞬态噪音抑制方法、***以及存储介质 |
CN110689905A (zh) * | 2019-09-06 | 2020-01-14 | 西安合谱声学科技有限公司 | 一种用于视频会议***的语音活动检测*** |
CN111081269A (zh) * | 2018-10-19 | 2020-04-28 | ***通信集团浙江有限公司 | 通话过程中的噪声检测方法及*** |
CN111192569A (zh) * | 2020-03-30 | 2020-05-22 | 深圳市友杰智新科技有限公司 | 双麦语音特征提取方法、装置、计算机设备和存储介质 |
CN111341347A (zh) * | 2020-03-11 | 2020-06-26 | 腾讯音乐娱乐科技(深圳)有限公司 | 一种噪声检测方法及相关设备 |
CN111986694A (zh) * | 2020-09-01 | 2020-11-24 | 平安科技(深圳)有限公司 | 基于瞬态噪声抑制的音频处理方法、装置、设备及介质 |
WO2021093807A1 (zh) * | 2019-11-13 | 2021-05-20 | 腾讯音乐娱乐科技(深圳)有限公司 | 一种瞬态噪声的检测方法、装置及设备 |
CN113205826A (zh) * | 2021-05-12 | 2021-08-03 | 北京百瑞互联技术有限公司 | 一种lc3音频噪声消除方法、装置及存储介质 |
CN113312797A (zh) * | 2021-06-25 | 2021-08-27 | 西北工业大学 | 一种熔体超声空化强度计算方法及*** |
CN113380266A (zh) * | 2021-05-28 | 2021-09-10 | 中国电子科技集团公司第三研究所 | 一种微型双麦克风语音增强方法及微型双麦克风 |
CN115954012A (zh) * | 2023-03-03 | 2023-04-11 | 成都启英泰伦科技有限公司 | 一种周期性瞬态干扰事件检测方法 |
CN115985337A (zh) * | 2023-03-20 | 2023-04-18 | 全时云商务服务股份有限公司 | 一种基于单麦克风的瞬态噪声检测与抑制的方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102549659A (zh) * | 2009-10-01 | 2012-07-04 | 高通股份有限公司 | 抑制音频信号中的噪声 |
US20120201390A1 (en) * | 2011-02-03 | 2012-08-09 | Sony Corporation | Device and method for audible transient noise detection |
CN103440872A (zh) * | 2013-08-15 | 2013-12-11 | 大连理工大学 | 瞬态噪声的去噪方法 |
-
2014
- 2014-08-22 CN CN201410418126.0A patent/CN104157295B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102549659A (zh) * | 2009-10-01 | 2012-07-04 | 高通股份有限公司 | 抑制音频信号中的噪声 |
US20120201390A1 (en) * | 2011-02-03 | 2012-08-09 | Sony Corporation | Device and method for audible transient noise detection |
CN103440872A (zh) * | 2013-08-15 | 2013-12-11 | 大连理工大学 | 瞬态噪声的去噪方法 |
Non-Patent Citations (2)
Title |
---|
王世伟,胡笑浒,郑成诗,李晓东: "双通道能量差后滤波语音增强算法统计分析和改进", 《信号处理》 * |
郑成诗,胡笑浒等: "基于噪声谱结构特性的谱减法", 《声学学报》 * |
Cited By (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104599677A (zh) * | 2014-12-29 | 2015-05-06 | 中国科学院上海高等研究院 | 基于语音重建的瞬态噪声抑制方法 |
CN104599677B (zh) * | 2014-12-29 | 2018-03-09 | 中国科学院上海高等研究院 | 基于语音重建的瞬态噪声抑制方法 |
CN107924684B (zh) * | 2015-12-30 | 2022-01-11 | 谷歌有限责任公司 | 使用半盲自适应滤波器模型的通信终端的声学击键瞬态消除器 |
CN107924684A (zh) * | 2015-12-30 | 2018-04-17 | 谷歌有限责任公司 | 使用半盲自适应滤波器模型的通信终端的声学击键瞬态消除器 |
CN105788607A (zh) * | 2016-05-20 | 2016-07-20 | 中国科学技术大学 | 应用于双麦克风阵列的语音增强方法 |
CN106052852B (zh) * | 2016-06-01 | 2019-03-08 | 中国电子科技集团公司第三研究所 | 一种脉冲声信号的检测方法及装置 |
CN106052852A (zh) * | 2016-06-01 | 2016-10-26 | 中国电子科技集团公司第三研究所 | 一种脉冲声信号的检测方法及装置 |
CN108597527A (zh) * | 2018-04-19 | 2018-09-28 | 北京微播视界科技有限公司 | 多声道音频处理方法、装置、计算机可读存储介质和终端 |
WO2019205798A1 (zh) * | 2018-04-27 | 2019-10-31 | 深圳市沃特沃德股份有限公司 | 语音增强的方法、装置及设备 |
CN108899043A (zh) * | 2018-06-15 | 2018-11-27 | 深圳市康健助力科技有限公司 | 数字助听器瞬时噪声抑制算法的研究及实现 |
CN109215677A (zh) * | 2018-08-16 | 2019-01-15 | 北京声加科技有限公司 | 一种适用于语音和音频的风噪检测和抑制方法和装置 |
CN109215677B (zh) * | 2018-08-16 | 2020-09-29 | 北京声加科技有限公司 | 一种适用于语音和音频的风噪检测和抑制方法和装置 |
CN111081269A (zh) * | 2018-10-19 | 2020-04-28 | ***通信集团浙江有限公司 | 通话过程中的噪声检测方法及*** |
CN110503973B (zh) * | 2019-08-28 | 2022-03-22 | 浙江大华技术股份有限公司 | 音频信号瞬态噪音抑制方法、***以及存储介质 |
CN110503973A (zh) * | 2019-08-28 | 2019-11-26 | 浙江大华技术股份有限公司 | 音频信号瞬态噪音抑制方法、***以及存储介质 |
CN110689905A (zh) * | 2019-09-06 | 2020-01-14 | 西安合谱声学科技有限公司 | 一种用于视频会议***的语音活动检测*** |
CN110689905B (zh) * | 2019-09-06 | 2021-12-21 | 西安合谱声学科技有限公司 | 一种用于视频会议***的语音活动检测*** |
WO2021093807A1 (zh) * | 2019-11-13 | 2021-05-20 | 腾讯音乐娱乐科技(深圳)有限公司 | 一种瞬态噪声的检测方法、装置及设备 |
CN111341347B (zh) * | 2020-03-11 | 2023-07-18 | 腾讯音乐娱乐科技(深圳)有限公司 | 一种噪声检测方法及相关设备 |
CN111341347A (zh) * | 2020-03-11 | 2020-06-26 | 腾讯音乐娱乐科技(深圳)有限公司 | 一种噪声检测方法及相关设备 |
CN111192569B (zh) * | 2020-03-30 | 2020-07-28 | 深圳市友杰智新科技有限公司 | 双麦语音特征提取方法、装置、计算机设备和存储介质 |
CN111192569A (zh) * | 2020-03-30 | 2020-05-22 | 深圳市友杰智新科技有限公司 | 双麦语音特征提取方法、装置、计算机设备和存储介质 |
CN111986694A (zh) * | 2020-09-01 | 2020-11-24 | 平安科技(深圳)有限公司 | 基于瞬态噪声抑制的音频处理方法、装置、设备及介质 |
WO2021143249A1 (zh) * | 2020-09-01 | 2021-07-22 | 平安科技(深圳)有限公司 | 基于瞬态噪声抑制的音频处理方法、装置、设备及介质 |
CN111986694B (zh) * | 2020-09-01 | 2023-12-22 | 平安科技(深圳)有限公司 | 基于瞬态噪声抑制的音频处理方法、装置、设备及介质 |
CN113205826A (zh) * | 2021-05-12 | 2021-08-03 | 北京百瑞互联技术有限公司 | 一种lc3音频噪声消除方法、装置及存储介质 |
CN113205826B (zh) * | 2021-05-12 | 2022-06-07 | 北京百瑞互联技术有限公司 | 一种lc3音频噪声消除方法、装置及存储介质 |
CN113380266B (zh) * | 2021-05-28 | 2022-06-28 | 中国电子科技集团公司第三研究所 | 一种微型双麦克风语音增强方法及微型双麦克风 |
CN113380266A (zh) * | 2021-05-28 | 2021-09-10 | 中国电子科技集团公司第三研究所 | 一种微型双麦克风语音增强方法及微型双麦克风 |
CN113312797B (zh) * | 2021-06-25 | 2022-11-25 | 西北工业大学 | 一种熔体超声空化强度计算方法及*** |
CN113312797A (zh) * | 2021-06-25 | 2021-08-27 | 西北工业大学 | 一种熔体超声空化强度计算方法及*** |
CN115954012A (zh) * | 2023-03-03 | 2023-04-11 | 成都启英泰伦科技有限公司 | 一种周期性瞬态干扰事件检测方法 |
CN115954012B (zh) * | 2023-03-03 | 2023-05-09 | 成都启英泰伦科技有限公司 | 一种周期性瞬态干扰事件检测方法 |
CN115985337A (zh) * | 2023-03-20 | 2023-04-18 | 全时云商务服务股份有限公司 | 一种基于单麦克风的瞬态噪声检测与抑制的方法及装置 |
CN115985337B (zh) * | 2023-03-20 | 2023-09-22 | 全时云商务服务股份有限公司 | 一种基于单麦克风的瞬态噪声检测与抑制的方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN104157295B (zh) | 2018-03-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104157295A (zh) | 用于检测及抑制瞬态噪声的方法 | |
CN109215677B (zh) | 一种适用于语音和音频的风噪检测和抑制方法和装置 | |
EP2633519B1 (en) | Method and apparatus for voice activity detection | |
CN103021420B (zh) | 一种基于相位调整和幅值补偿的多子带谱减法的语音增强方法 | |
EP2031583B1 (en) | Fast estimation of spectral noise power density for speech signal enhancement | |
US9467775B2 (en) | Method and a system for noise suppressing an audio signal | |
EP2372700A1 (en) | A speech intelligibility predictor and applications thereof | |
CN106885971B (zh) | 一种用于电缆故障检测定点仪的智能背景降噪方法 | |
WO2010144577A1 (en) | Systems, methods, apparatus, and computer-readable media for phase-based processing of multichannel signal | |
CN103109320A (zh) | 噪声抑制装置 | |
CN104835503A (zh) | 一种改进gsc自适应语音增强方法 | |
CN104464722A (zh) | 基于时域和频域的语音活性检测方法和设备 | |
Yousefian et al. | Using power level difference for near field dual-microphone speech enhancement | |
CN109102823B (zh) | 一种基于子带谱熵的语音增强方法 | |
Zhang et al. | A soft decision based noise cross power spectral density estimation for two-microphone speech enhancement systems | |
Amehraye et al. | Perceptual improvement of Wiener filtering | |
CN113593599A (zh) | 一种去除语音信号中噪声信号的方法 | |
CN111225317B (zh) | 一种回声消除方法 | |
May et al. | Generalization of supervised learning for binary mask estimation | |
Ngo et al. | Incorporating the conditional speech presence probability in multi-channel Wiener filter based noise reduction in hearing aids | |
CN111161753A (zh) | 基于智能终端的安全语音交互方法及*** | |
Rao et al. | Speech enhancement using sub-band cross-correlation compensated Wiener filter combined with harmonic regeneration | |
KR20100009936A (ko) | 음원 검출 시스템에서 돌발잡음 추정/제거 장치 및 방법 | |
Sun et al. | An efficient feature selection method for speaker recognition | |
Wang et al. | Speech endpoint detection in fixed differential beamforming combined with modulation domain |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20180309 |
|
CF01 | Termination of patent right due to non-payment of annual fee |