CN103646648B - 一种噪声功率估计方法 - Google Patents

一种噪声功率估计方法 Download PDF

Info

Publication number
CN103646648B
CN103646648B CN201310585440.3A CN201310585440A CN103646648B CN 103646648 B CN103646648 B CN 103646648B CN 201310585440 A CN201310585440 A CN 201310585440A CN 103646648 B CN103646648 B CN 103646648B
Authority
CN
China
Prior art keywords
analysis frame
frequency
present analysis
noise power
noisy speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201310585440.3A
Other languages
English (en)
Other versions
CN103646648A (zh
Inventor
徐敬德
崔慧娟
唐昆
许科
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
XINRUIDI (BEIJING) SCIENCE & TECHNOLOGY Co Ltd
Tsinghua University
Original Assignee
XINRUIDI (BEIJING) SCIENCE & TECHNOLOGY Co Ltd
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by XINRUIDI (BEIJING) SCIENCE & TECHNOLOGY Co Ltd, Tsinghua University filed Critical XINRUIDI (BEIJING) SCIENCE & TECHNOLOGY Co Ltd
Priority to CN201310585440.3A priority Critical patent/CN103646648B/zh
Publication of CN103646648A publication Critical patent/CN103646648A/zh
Application granted granted Critical
Publication of CN103646648B publication Critical patent/CN103646648B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明公开了一种噪声功率估计方法,该方法首先对输入带噪语音进行采样得到输入带噪语音信号样点,并按时间顺序对样点进行分帧,并得到一系列分析帧。随后根据当前分析帧中的带噪语音信号样点计算得到当前分析帧的最大归一化自相关值、当前分析帧中各频点的带噪语音功率和后验信噪比,并计算当前分析帧中各频点的语音存在概率。最后根据前一分析帧中各频点的噪声功率估计值、当前分析帧中各频点的带噪语音功率和语音存在概率计算得到当前分析帧中各频点的噪声功率估计值。本发明运算简单,占用存储资源小,能够快速估计各种噪声的功率。

Description

一种噪声功率估计方法
技术领域
本发明涉及噪声抑制技术领域,具体地说,涉及一种噪声功率估计方法。
背景技术
语音在通信过程中往往会受到各种各样噪声的干扰,例如环境噪声、线路噪声等。噪声的存在不仅会影响通信质量,而且会严重干扰低速率语音编码中参数的提取,降低合成语音质量。对于语音识别领域,噪声的存在会大大降低识别的准确率,使得语音识别在实用化过程中难以取得令人满意的结果。由此可见,噪声抑制对语音通信、语音编码、语音识别等领域有着重大的影响和深远的意义。目前的噪声抑制算法,虽然能够对噪声由一定的抑制作用,但往往对语音的损伤也比较厉害,大大降低语音的可懂度。
对于噪声抑制,噪声功率估计是其中最重要的组成部分之一。基于最优平滑和最小统计的噪声估计,凭借着良好的性能得到了广泛的使用。基于最优平滑和最小统计量的噪声功率估计方法,具有良好的鲁棒性和优越的性能,能够准确估计平稳噪声的功率。然而,该方法主要基于后验信噪比进行噪声功率估计,对于非平稳噪声跟踪较慢,往往需要0.5s~1.5s的延时。同时,该方法需要保存过去多个帧中各频点的噪声功率,需要复杂的运算过程和较大的存储资源。
基于上述情况,亟需一种能够快速跟踪平稳噪声与非平稳噪声,并对其噪声功率进行估计方法。
发明内容
为解决上述问题,本发明提供了一种噪声功率估计方法,该方法包括以下步骤:
带噪语音分帧步骤,对输入带噪语音按照一预设的采样频率进行采样得到输入带噪语音信号样点,并按时间顺序对所述样点进行分帧,并得到一系列分析帧;
最大归一化自相关值计算步骤,根据当前分析帧中的带噪语音信号样点计算得到当前分析帧的最大归一化自相关值;
后验信噪比计算步骤,根据当前分析帧中的带噪语音信号样点分别计算得到当前分析帧中各频点的带噪语音功率和后验信噪比;
各频点语音存在概率计算步骤,根据所述当前分析帧的最大归一化自相关值和当前分析帧中各频点的后验信噪比计算所述当前分析帧中各频点的语音存在概率;
各频点噪声功率估计值计算步骤,根据前一分析帧中各频点的噪声功率估计值、所述当前分析帧中各频点的带噪语音功率和当前分析帧中各频点的语音存在概率计算得到所述当前分析帧中各频点的噪声功率估计值。
根据本发明的一个实施例,所述当前分析帧的带噪语音信号样点包括前一帧的部分带噪语音信号样点和当前帧的全部带噪语音信号样点。
根据本发明的一个实施例,所述最大归一化自相关值计算步骤包括下列步骤:
S202a、利用一预设截止频率的带通滤波器对所述当前分析帧中的带噪语音信号样点进行滤波得到带通语音信号样点,记为当前分析帧的信号样点;
S202b、根据所述当前分析帧的信号样点计算当前分析帧能量和相关值;
S202c、根据所述当前分析帧能量和相关值计算所述当前分析帧的最大归一化自相关值。
根据本发明的一个实施例,根据下列公式计算所述当前分析帧的相关值:
r ( n , τ ) = Σ i = 0 I - 1 - τ [ x ( n , i ) × x ( n , i + τ ) ]
其中,x(n,i)表示第n分析帧中的第i个信号样点,x(n,i+τ)表示第n分析帧中的第i+τ个信号样点,τ表示在基音周期内进行取值的信号样点的偏移量,I表示当前分析帧中的信号样点总数,r(n,τ)表示偏移量为τ时第n分析帧的相关值。
根据本发明的一个实施例,所述后验信噪比计算步骤包括下列步骤:
S203a、对当前分析帧的信号样点进行离散傅里叶变换得到所述当前分析帧中各频点的带噪语音功率;
S203b、根据所述当前分析帧中各频点的带噪语音功率和前一分析帧中对应的各频点的噪声功率估计值计算当前分析帧中各频点的后验信噪比。
根据本发明的一个实施例,根据下列公式计算当前分析帧中各频点的语音存在概率:
p ( n , k ) = ϵ 1 × exp [ ∂ ( n , k ) ] / { α + exp [ ∂ ( n , k ) ] } r ‾ ( n ) ≥ r 1 ϵ 2 × exp [ ∂ ( n , k ) ] / { α + exp [ ∂ ( n , k ) ] } r 1 > r ‾ ( n ) > r 2 ϵ 3 × exp [ ∂ ( n , k ) ] / { α + exp [ ∂ ( n , k ) ] } r ‾ ( n ) ≤ r 2
其中,p(n,k)表示第n分析帧中的第k个频点的语音存在概率,表示第n分析帧中的第k个频点的后验信噪比,α为常数,ε1、ε2、ε3表示加权系数,exp表示求指数,r1、r2表示门限值。
根据本发明的一个实施例,所述各频点噪声功率估计值计算步骤包括下列步骤:
S205a、根据所述当前分析帧中各频点的带噪语音功率、所述当前分析帧中各频点的语音存在概率和前一分析帧中对应的各频点的噪声功率估计值计算当前分析帧的噪声功率更新值;
S205b、根据所述当前分析帧中各频点的噪声功率更新值和前一分析帧中对应的各频点的噪声功率估计值加权得到所述当前分析帧中各频点的噪声功率估计值。
根据本发明的一个实施例,根据下列公式计算所述当前分析帧中各频点的噪声功率更新值:
U(n,k)=p(n,k)×D(n-1,k)+[1-p(n,k)]×Y(n,k)k=0,1,...,K-1
其中,U(n,k)表示第n分析帧中的第k个频点的噪声功率更新值,p(n,k)表示第n分析帧中的第k个频点的语音存在概率,D(n-1,k)表示第n-1分析帧中的第k个频点的噪声功率估计值,Y(n,k)表示第n分析帧中的第k个频点的带噪语音功率,K表示第n分析帧中的频点总数。
根据本发明的一个实施例,根据下列公式计算所述当前分析帧中各频点的噪声功率估计值:
D(n,k)=β×D(n-1,k)+(1-β)×U(n,k)k=0,1,...,K-1
其中,D(n,k)表示第n分析帧中的第k个频点的噪声功率估计值,U(n,k)表示第n分析帧中的第k个频点的噪声功率更新值,β表示一预设加权系数。
根据本发明的一个实施例,所述方法还包括更新当前分析帧各频点的后验信噪比和先验信噪比并计算最终增益系数步骤。
本发明对于平稳噪声功率的估计与现有技术相当,对于非平稳噪声能够快速跟踪噪声的变化。同时,本发明无需保存过去的多个帧中各频点的噪声功率,只需要当前帧和前一帧的数据,所以本发明运算简单,占用存储资源小,对于噪声功率的估计实用有效。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要的附图做简单的介绍:
图1是现有技术中基于最优平滑和最小统计量的噪声功率估计方法的流程图;
图2是根据本发明的一个实施例的噪声功率估计方法的流程图;
图3是根据本发明的一个实施例的噪声功率估计方法的具体流程图。
具体实施方式
以下将结合附图及实施例来详细说明本发明的实施方式,借此对本发明如何应用技术手段来解决技术问题,并达成技术效果的实现过程能充分理解并据以实施。需要说明的是,只要不构成冲突,本发明中的各个实施例以及各实施例中的各个特征可以相互结合,所形成的技术方案均在本发明的保护范围之内。
另外,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1示出了基于最优平滑和最小统计的噪声估计方法的流程图。
如图1所示,首先在步骤S101中进行带噪语音分帧。首先对输入带噪语音按照设定的采样频率(例如8KHz)进行采样,得到输入带噪语音信号样点。随后对输入带噪语音信号样点按时间顺序分帧,其中帧号用n表示。
在步骤S102中,首先对前一帧的部分带噪语音信号样点以及当前帧的信号样点进行K点的离散傅里叶变换,并计算各个频点的功率,记为Y(n,k),其中k=(0,1,2...,K-1)。
随后在步骤S103中基于最小均方误差准则利用前一帧估计的平滑带噪语音信号功率Q(n-1,k)和前一帧估计的噪声功率D(n-1,k)计算得到加权因子α(n,k)。α(n,k)也被称为平滑系数,其用下列公式计算得到:
α ( n , k ) = 1 1 + [ Q ( n - 1 , k ) / D ( n - 1 , k ) - 1 ] 2 - - - ( 1 )
结合前一帧估计的平滑带噪语音信号功率Q(n-1,k)和步骤S102中得到的个频点的功率Y(n,k),在步骤S104中利用加权因子α(n,k)得到当前各频点的平滑带噪语音信号功率Q(n,k),其可以用下列公式表示:
Q(n,k)=α(n,k)×Q(n-1,k)+[1-α(n,k)]×Y(n,k)k=0,1,...,K-1(2)
得到当前帧各频点的平滑带噪语音信号功率Q(n,k)之后,在步骤S105中结合当前帧之前L-1帧的平滑带噪语音信号功率,计算连续L帧的平滑带噪语音信号功率的最小值Qmin(n,k),其可以用下列公式表示:
Qmin(n,k)=min{Q(l,k)}l=n-L+1,n-L+2,...,n(3)
随后在步骤S106中根据当前帧平滑带噪语音信号功率的方差、前一帧噪声功率的估计值以及帧数L得到偏置补偿因子B(L,n,k),其可以用下列公式表示:
B ( L , n , k ) ≈ 1 + ( L - 1 ) × 2 × [ 1 - M ( L ) ] S ( n , k ) - 2 × M ( L ) - - - ( 4 )
其中,M(L)是与L相关的函数,其用下列公式表示:
M(L)≈0.025+0.23(1+log(L)0.8)+2.7·10-6L-2-1.14·10-3L-7·10-2(5)
S(n,k)是当前帧各频点的平滑带噪语音信号的自由度,它根据当前帧带噪音频信号功率的方差var(Q(n,k))和前一帧的噪声功率估计值D(n-1,k)计算得到,其采用下列公式表示:
1 S ( n , k ) = var ( Q ( n , k ) ) 2 D ( n - 1 , k ) - - - ( 6 )
最后在步骤S107中根据偏置补偿因子B(L,n,k)和平滑带噪语音信号功率的最小值Qmin(n,k)得到当前帧各频点噪声功率的估计值D(n,k),其可以用下列公式表示:
D(n,k)=B(L,n,k)×Qmin(n,k)(7)
针对现有噪声功率估计方法对非平稳噪声跟踪速度慢的问题,本发明提出了一种基于归一化自相关和后验信噪比的噪声功率估计方法。本发明利用各频点的语音存在概率和后验信噪比实现对各频点噪声功率的估计,提高了对于非平稳噪声的跟踪速度,减小了对于非平稳噪声的噪声功率估计时间。图2示出根据本发明一个实施例的噪声功率估计流程。
如图2所示,首先在步骤S201中对输入的带噪语音进行带噪语音分帧,取前一帧的部分带噪语音信号样点和当前帧的全部带噪语音信号样点构成当前分析帧。
随后利用步骤S201中得到的当前分析帧在步骤S202中分别计算当前分析帧的能量和最大归一化自相关值。本实施例中,最大归一化自相关值为当前分析帧的最大相关值和当前分析帧能量的比值。
本发明中的各频点语音存在概率通过最大归一化自相关值和各频点的后验信噪比得到。而当前分析帧中各频点的后验信噪比在步骤S203中计算得到,本实施例中,当前分析帧中各频点的后验信噪比为当前分析帧中各频点的带噪语音功率和前一分析帧中对应各频点的噪声功率估计值的比值。
在步骤S204中,根据步骤S202得到的当前分析帧的最大归一化自相关值和步骤S203中得到的当前分析帧中各频点的后验信噪比计算得到当前分析帧中对应各频点的语音存在概率。本实施例中,通过多次试验,对于不同的最大归一化自相关值,各频点的语音存在概率通过不同的公式计算得到。
最后根据前一分析帧的各频点的噪声功率估计值、当前分析帧中各频点的带噪语音功率和步骤S204中得到的当前分析帧中对应的各频点的语音存在概率计算得到当前分析帧中对应各频点的噪声功率估计值。
图3示出了一个根据图2所示噪声功率估计方法的具体流程图。
如图3所示,在步骤S201中对输入的带噪语音进行带噪语音分帧,并得到一系列分析帧。本实施例中,对输入的带噪语音按照8KHz的采样频率进行采样,得到输入带噪语音信号样点。随后将得到的输入带噪语音信号样点按照时间顺序进行分帧,当前帧的帧号使用n表示。本实施例中,每一帧的时间长度设为20ms,但本发明不限于此,由此每一帧中含有160个带噪语音信号样点。本实施例中,当前分析帧中的带噪语音信号样点由前一帧中后80个带噪语音信号样点和当前帧的全部带噪语音信号样点构成。需要说明的是,在本发明的其他实施例中,当前分析帧中包含的前一帧的带噪语音信号样点数目和当前帧的带噪语音信号样点数目也可以选取其他合理值,本发明不限于此。
随后在步骤S202中根据当前分析帧中的带噪语音信号样点计算得到当前分析帧的最大归一化自相关值。本实施例中,首先在步骤S202a中利用通带频率为[f1,f2]的带通滤波器对当前分析帧中的带噪语音信号样点进行滤波得到带通语音信号样点x(n,i),记为当前分析帧的信号样点,其中样点i=0,1,...,I-1,I为当前分析帧中的样点总数,本实施例中,I为240。本实施例中,带通滤波器的通带频率范围[f1,f2]取[250,800],但本发明不限于此。
得到当前分析帧的信号样点后,在步骤S202b中计算当前分析帧能量和相关值。本实施例中,根据下列公式计算当前分析帧能量:
r ( n , 0 ) = Σ i = 0 I - 1 [ x ( n , i ) × x ( n , i ) ] - - - ( 8 )
其中,r(n,0)表示第n分析帧的能量,即当前分析帧能量;x(n,i)表示第n分析帧的第i个信号样点,I为当前分析帧中的信号样点总数。
随后遍历所有可能的偏移量τ,即遍历基音周期所有可能的取值,计算对应各个偏移量的当前分析帧的相关值。其中本实施例中,基音周期优选的为[20,120],偏移量处于该基音周期范围以外的概率极小。各偏移量对应的相关值采用下列公式计算得到:
r ( n , τ ) = Σ i = 0 I - 1 - τ [ x ( n , i ) × x ( n , i + τ ) ] τ = 20,21 , . . . , 120 - - - ( 9 )
其中,x(n,i)表示第n分析帧中的第i个信号样点,x(n,i+τ)表示第n分析帧中的第i+τ个信号样点,τ表示在基音周期内进行取值的信号样点的偏移量,I表示当前分析帧中的信号样点总数,r(n,τ)表示当偏移量为τ时第n分析帧的相关值。
得到各偏移量对应的相关值后,在步骤S202c中取其中最大相关值r(n,τ'),并根据该最大相关值r(n,τ')和当前分析帧能量r(n,0)的比值得到当前分析帧的最大归一化自相关值其可以用下列公式表示:
r ‾ ( n ) = r ( n , τ ′ ) r ( n , 0 ) - - - ( 10 )
其中,τ'表示当第n分析帧的相关值取最大值时对应的偏移量。
在步骤S203中根据当前分析帧中的信号样点分别计算得到当前分析帧各频点的带噪语音功率和后验信噪比。首先在步骤S203a中对当前分析帧进行K点离散傅里叶变化计算得到当前分析帧各频点的带噪语音信号功率Y(n,k),其中,当前分析帧频点k=0,1,...,K-1。
随后在步骤S203b中根据步骤S203a中得到的当前分析帧中各频点的带噪语音功率Y(n,k)和前一分析帧中各频点噪声功率估计值D(n-1,k)的比值计算得到当前分析帧中各频点的后验信噪比其采用下列公式计算得到:
∂ ( n , k ) = Y ( n , k ) D ( n - 1 , k ) , k = 0,1 , . . . , K - 1 - - - ( 11 )
根据步骤S202c中得到的当前分析帧的最大归一化自相关值和步骤S203b中得到的当前分析帧中各频点的后验信噪比在步骤S204中计算当前分析帧中各频点的语音存在概率p(n,k),其根据下列公式计算得到:
p ( n , k ) = ϵ 1 × exp [ ∂ ( n , k ) ] / { α + exp [ ∂ ( n , k ) ] } r ‾ ( n ) ≥ r 1 ϵ 2 × exp [ ∂ ( n , k ) ] / { α + exp [ ∂ ( n , k ) ] } r 1 > r ‾ ( n ) > r 2 ϵ 3 × exp [ ∂ ( n , k ) ] / { α + exp [ ∂ ( n , k ) ] } r ‾ ( n ) ≤ r 2 - - - ( 12 )
其中,p(n,k)表示第n分析帧中的第k个频点的语音存在概率,α为常数,ε1、ε2、ε3表示加权系数,exp表示求指数,r1、r2表示门限值。
本实施例中,为了避免噪声功率发生突变,根据多次试验结果,ε1和ε3分别取值为1.0、0.6;根据归一化自相关值超过0.4一般为语音、低于0.2一般为非语音的原则,r1、r2分别取值为0.4、0.2;为了更快更新噪声功率,α取值为1,综上可以推出ε2的取值为[2×r(n)+0.2]。此时当前分析帧中各频点的语音存在概率p(n,k)用下列公式得到:
p ( n , k ) = 1.0 × exp ( ∂ ( n , k ) ) / ( 1 + exp ( ∂ ( n , k ) ) ) r ‾ ( n ) ≥ 0.4 ( 2 × r ‾ ( n ) + 0.2 ) × exp ( ∂ ( n , k ) ) / ( 1 + exp ( ∂ ( n , k ) ) ) 0.4 > r ‾ ( n ) > 0.2 0.6 × exp ( ∂ ( b , k ) / ( 1 + exp ( ∂ ( n , k ) ) ) r ‾ ( n ) ≤ 0.2 - - - ( 13 )
对于非平衡噪声,当输入语音信号中存在突然增大的噪声信号时,当前分析帧中各频点语音存在概率将减小,从而加快了对非平衡噪声的跟踪。
最后在步骤S205中根据前一分析帧中各频点的噪声功率估计值、当前分析帧中各频点的带噪语音功率和当前分析帧中各频点的语音存在概率加权得到当前分析帧中各频点的噪声功率估计值。
首先在步骤S205a中根据步骤S203a中得到的当前分析帧中各频点的带噪语音功率Y(n,k)和语音存在概率p(n,k)以及前一分析帧中各频点的噪声功率估计值D(n-1,k)计算当前分析帧中各频点的噪声功率更新值U(n,k),其可以用下列公式表示:
U(n,k)=p(n,k)×D(n-1,k)+[1-p(n,k)]×Y(n,k)k=0,1,...,K-1(14)
随后根据当前分析帧中各频点的噪声功率更新值U(n,k)和前一分析帧的各频点噪声功率估计值D(n-1,k)在步骤S205b中加权得到当前分析帧各频点的噪声功率估计值D(n,k),其采用下来公式求得:
D(n,k)=β×D(n-1,k)+(1-β)×U(n,k)k=0,1,...,K-1(15)
其中,β为加权系数,本实施例中,根据多次试验结果,β设为0.8。
因为噪声功率估计最终是用于噪声抑制,所以当用于噪声抑制时,本发明还包括步骤S206进行当前分析帧各频点的后验信噪比和先验信噪比η(n,k)的更新,并计算最终的增益系数G(n,k),以用于噪声抑制。本实施例中,后验信噪比采用下列公式计算得到:
∂ ( n , k ) = Y ( n , k ) D ( n , k ) - - - ( 16 )
本发明对于平稳噪声功率与现有技术相当,对于非平稳噪声能够快速跟踪噪声的变化。对于诸多噪声的平均跟踪时间为0.2s,而现有技术对于诸多噪声的平均跟踪时间为0.5s~1.5s,所以本发明大大提高了噪声的跟踪速度。同时,本发明无需保存过去的多个帧中各频点的噪声功率,只需要当前帧和前一帧的数据,所以本发明运算简单,占用存储资源小,对于噪声功率的估计实用有效。
虽然本发明所揭露的实施方式如上,但所述的内容只是为了便于理解本发明而采用的实施方式,并非用以限定本发明。任何本发明所属技术领域内的技术人员,在不脱离本发明所揭露的精神和范围的前提下,可以在实施的形式上及细节上作任何的修改与变化,但本发明的专利保护范围,仍须以所附的权利要求书所界定的范围为准。

Claims (10)

1.一种噪声功率估计方法,其特征在于,所述方法包括以下步骤:
带噪语音分帧步骤,对输入带噪语音按照一预设的采样频率进行采样得到输入带噪语音信号样点,并按时间顺序对所述样点进行分帧,并得到一系列分析帧;
最大归一化自相关值计算步骤,根据当前分析帧中的带噪语音信号样点计算得到当前分析帧的最大归一化自相关值;
后验信噪比计算步骤,根据所述当前分析帧中的带噪语音信号样点分别计算得到当前分析帧中各频点的带噪语音功率和后验信噪比;
各频点语音存在概率计算步骤,根据所述当前分析帧的最大归一化自相关值和当前分析帧中各频点的后验信噪比计算所述当前分析帧中各频点的语音存在概率;
各频点噪声功率估计值计算步骤,根据前一分析帧中各频点的噪声功率估计值、所述当前分析帧中各频点的带噪语音功率和当前分析帧中各频点的语音存在概率计算得到所述当前分析帧中各频点的噪声功率估计值。
2.如权利要求1所述的方法,其特征在于,所述当前分析帧的带噪语音信号样点包括前一帧的部分带噪语音信号样点和当前帧的全部带噪语音信号样点。
3.如权利要求1所述的方法,其特征在于,所述最大归一化自相关值计算步骤包括下列步骤:
S202a、利用一预设截止频率的带通滤波器对所述当前分析帧中的带噪语音信号样点进行滤波得到带通语音信号样点,记为当前分析帧的信号样点;
S202b、根据所述当前分析帧的信号样点计算当前分析帧能量和相关值;
S202c、根据所述当前分析帧能量和相关值计算所述当前分析帧的最大归一化自相关值。
4.如权利要求3所述的方法,其特征在于,根据下列公式计算所述当前分析帧的相关值:
r ( n , τ ) = Σ i = 0 I - 1 - τ [ x ( n , i ) × x ( n , i + τ ) ]
其中,x(n,i)表示第n分析帧中的第i个信号样点,x(n,i+τ)表示第n分析帧中的第i+τ个信号样点,τ表示在基音周期内进行取值的信号样点的偏移量,I表示当前分析帧中的信号样点总数,r(n,τ)表示偏移量为τ时第n分析帧的相关值。
5.如权利要求1所述的方法,其特征在于,所述后验信噪比计算步骤包括下列步骤:
S203a、对当前分析帧的信号样点进行离散傅里叶变换得到所述当前分析帧中各频点的带噪语音功率;
S203b、根据所述当前分析帧中各频点的带噪语音功率和前一分析帧中对应的各频点的噪声功率估计值计算当前分析帧中各频点的后验信噪比。
6.如权利要求1所述的方法,其特征在于,根据下列公式计算当前分析帧中各频点的语音存在概率:
p ( n , k ) = ϵ 1 × exp [ ∂ ( n , k ) ] / { α + exp [ ∂ ( n , k ) ] } r ‾ ( n ) ≥ r 1 ϵ 2 × exp [ ∂ ( n , k ) ] / { α + exp [ ∂ ( n , k ) ] } r 1 > r ‾ ( n ) > r 2 ϵ 3 × exp [ ∂ ( n , k ) ] / { α + exp [ ∂ ( n , k ) ] } r ‾ ( n ) ≤ r 2
其中,p(n,k)表示第n分析帧中的第k个频点的语音存在概率,表示第n分析帧中的第k个频点的后验信噪比,α为常数,ε1、ε2、ε3表示加权系数,exp表示求指数,r1、r2表示门限值,表示第n分析帧的最大归一化自相关值。
7.如权利要求1所述的方法,其特征在于,所述各频点噪声功率估计值计算步骤包括下列步骤:
S205a、根据所述当前分析帧中各频点的带噪语音功率、所述当前分析帧中各频点的语音存在概率和前一分析帧中对应的各频点的噪声功率估计值计算当前分析帧的噪声功率更新值;
S205b、根据所述当前分析帧中各频点的噪声功率更新值和前一分析帧中对应的各频点的噪声功率估计值加权得到所述当前分析帧中各频点的噪声功率估计值。
8.如权利要求7所述的方法,其特征在于,根据下列公式计算所述当前分析帧中各频点的噪声功率更新值:
U(n,k)=p(n,k)×D(n-1,k)+[1-p(n,k)]×Y(n,k)k=0,1,...,K-1
其中,U(n,k)表示第n分析帧中的第k个频点的噪声功率更新值,p(n,k)表示第n分析帧中的第k个频点的语音存在概率,D(n-1,k)表示第n-1分析帧中的第k个频点的噪声功率估计值,Y(n,k)表示第n分析帧中的第k个频点的带噪语音功率,K表示第n分析帧中的频点总数。
9.如权利要求7所述的方法,其特征在于,根据下列公式计算所述当前分析帧中各频点的噪声功率估计值:
D(n,k)=β×D(n-1,k)+(1-β)×U(n,k)k=0,1,...,K-1
其中,D(n,k)表示第n分析帧中的第k个频点的噪声功率估计值,U(n,k)表示第n分析帧中的第k个频点的噪声功率更新值,β表示一预设加权系数,K表示第n分析帧中的频点总数。
10.如权利要求1所述的方法,其特征在于,所述方法还包括更新所述当前分析帧中各频点的后验信噪比和先验信噪比并计算最终增益系数步骤。
CN201310585440.3A 2013-11-19 2013-11-19 一种噪声功率估计方法 Expired - Fee Related CN103646648B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310585440.3A CN103646648B (zh) 2013-11-19 2013-11-19 一种噪声功率估计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310585440.3A CN103646648B (zh) 2013-11-19 2013-11-19 一种噪声功率估计方法

Publications (2)

Publication Number Publication Date
CN103646648A CN103646648A (zh) 2014-03-19
CN103646648B true CN103646648B (zh) 2016-03-23

Family

ID=50251850

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310585440.3A Expired - Fee Related CN103646648B (zh) 2013-11-19 2013-11-19 一种噪声功率估计方法

Country Status (1)

Country Link
CN (1) CN103646648B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105788606A (zh) * 2016-04-03 2016-07-20 武汉市康利得科技有限公司 一种用于拾音器的基于递归最小追踪的噪声估计方法

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105225673B (zh) * 2014-06-09 2020-12-04 杜比实验室特许公司 用于噪声水平估计的方法、***和介质
CN106161751B (zh) * 2015-04-14 2019-07-19 电信科学技术研究院 一种噪声抑制方法及装置
CN106997768B (zh) * 2016-01-25 2019-12-10 电信科学技术研究院 一种语音出现概率的计算方法、装置及电子设备
CN106297818B (zh) * 2016-09-12 2019-09-13 广州酷狗计算机科技有限公司 一种获取去噪语音信号的方法和装置
CN108074582B (zh) * 2016-11-10 2021-08-06 电信科学技术研究院 一种噪声抑制信噪比估计方法和用户终端
WO2018161429A1 (zh) * 2017-03-07 2018-09-13 华为技术有限公司 一种噪声检测方法及终端设备
CN109643554B (zh) * 2018-11-28 2023-07-21 深圳市汇顶科技股份有限公司 自适应语音增强方法和电子设备
CN110827858B (zh) * 2019-11-26 2022-06-10 思必驰科技股份有限公司 语音端点检测方法及***
CN113611319B (zh) * 2021-04-07 2023-09-12 珠海市杰理科技股份有限公司 基于语音成分实现的风噪抑制方法、装置、设备及***
CN113782011B (zh) * 2021-08-26 2024-04-09 清华大学苏州汽车研究院(相城) 频带增益模型的训练方法及用于车载场景的语音降噪方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5012519A (en) * 1987-12-25 1991-04-30 The Dsp Group, Inc. Noise reduction system
CN101814290A (zh) * 2009-02-25 2010-08-25 三星电子株式会社 增强语音识别***稳健性的方法
CN103000174A (zh) * 2012-11-26 2013-03-27 河海大学 语音识别***中基于快速噪声估计的特征补偿方法
CN103295582A (zh) * 2012-03-02 2013-09-11 联芯科技有限公司 噪声抑制方法及其***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5012519A (en) * 1987-12-25 1991-04-30 The Dsp Group, Inc. Noise reduction system
CN101814290A (zh) * 2009-02-25 2010-08-25 三星电子株式会社 增强语音识别***稳健性的方法
CN103295582A (zh) * 2012-03-02 2013-09-11 联芯科技有限公司 噪声抑制方法及其***
CN103000174A (zh) * 2012-11-26 2013-03-27 河海大学 语音识别***中基于快速噪声估计的特征补偿方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105788606A (zh) * 2016-04-03 2016-07-20 武汉市康利得科技有限公司 一种用于拾音器的基于递归最小追踪的噪声估计方法

Also Published As

Publication number Publication date
CN103646648A (zh) 2014-03-19

Similar Documents

Publication Publication Date Title
CN103646648B (zh) 一种噪声功率估计方法
CN103489446B (zh) 复杂环境下基于自适应能量检测的鸟鸣识别方法
US10134417B2 (en) Method and apparatus for detecting a voice activity in an input audio signal
CN108447495B (zh) 一种基于综合特征集的深度学习语音增强方法
CN101976566B (zh) 语音增强方法及应用该方法的装置
CN101894563B (zh) 语音增强的方法
CN106885971B (zh) 一种用于电缆故障检测定点仪的智能背景降噪方法
KR100745977B1 (ko) 음성 구간 검출 장치 및 방법
CN104409078A (zh) 异常声音检测和识别***
CN109192200B (zh) 一种语音识别方法
CN106340292A (zh) 一种基于连续噪声估计的语音增强方法
CN103594094A (zh) 自适应谱减法实时语音增强
CN103646649A (zh) 一种高效的语音检测方法
US9754608B2 (en) Noise estimation apparatus, noise estimation method, noise estimation program, and recording medium
CN101510426A (zh) 一种噪声消除方法及***
CN101976565A (zh) 基于双麦克风语音增强装置及方法
CN107331386B (zh) 音频信号的端点检测方法、装置、处理***及计算机设备
CN110265065B (zh) 一种构建语音端点检测模型的方法及语音端点检测***
KR101892733B1 (ko) 켑스트럼 특징벡터에 기반한 음성인식 장치 및 방법
CN106875938A (zh) 一种改进的非线性自适应语音端点检测方法
CN103544961A (zh) 语音信号处理方法及装置
CN110942766A (zh) 音频事件检测方法、***、移动终端及存储介质
CN112526602B (zh) 一种基于长短时窗和ar模型方差激增效应的p波到时拾取方法
Meduri et al. A survey and evaluation of voice activity detection algorithms
CN109377982A (zh) 一种有效语音获取方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160323

Termination date: 20161119

CF01 Termination of patent right due to non-payment of annual fee