CN105575397A

CN105575397A - 语音降噪方法及语音采集设备

Info

Publication number: CN105575397A
Application number: CN201410525618.XA
Authority: CN
Inventors: 吴晟; 蒋斌; 林福辉
Original assignee: Spreadtrum Communications Shanghai Co Ltd
Current assignee: Spreadtrum Communications Shanghai Co Ltd
Priority date: 2014-10-08
Filing date: 2014-10-08
Publication date: 2016-05-11
Anticipated expiration: 2034-10-08
Also published as: CN105575397B

Abstract

本发明提供一种语音降噪方法及语音采集设备，其中，通过一滤波组件，对一滤波形成的消噪语音信号，以及一滤波形成的参考噪声信号进行频域转换并滤波，以滤波输出、对应所述参考噪声信号的原始噪声信号、以及对应所述消噪语音信号的含噪语音信号，分别控制形成所述参考噪声信号的第一抗串扰滤波单元，以及形成所述消噪语音信号的第二抗串扰滤波单元进行滤波系数更新。其技术方案的有益效果是：通过仅使用一对自适应滤波器，并通过后滤波器控制该一对自适应滤波器的滤波系数更新，从而简化了的结构；通过对语音信号和噪声信号的滤波系数更新权重分别进行有针对性的调整，实现优秀的抗串扰和降噪效果。

Description

语音降噪方法及语音采集设备

技术领域

本发明涉及通讯领域，尤其涉及语音降噪方法及语音采集设备。

背景技术

随着通讯技术的革新，人们对于语音通讯的质量要求不断提高。其中，移动通讯终端的抗噪性能是语音通讯质量的重要关注点。在经历了单麦克风***通过单通道语音增强方案降低噪声，提高语音质量的阶段以后，越来越多的移动通讯终端开始配置双麦克风(DualMic)***。这种双麦克风***通常采用主次麦克风的结构，它将一个主麦克风放置在手机下端，靠近嘴的位置，用于接收含噪语音信号，另一个次麦克风放置在手机上端的背部或顶部，靠近耳朵的位置，用于接收以噪声为主的参考噪声信号，如图1所示。

基于这种物理结构，自适应噪声消除(AdaptiveNoiseCancellation，ANC)可以利用含噪语音信号和参考噪声信号这两个信号来进行分析和计算，得到干净的语音。但是，采用目前的技术方案在实际应用中起到的降噪效果并不是很理想，输出的语音还是有存在较大的失真。

因此，如何进一步提高通话质量一直为本领域技术人员所致力研究的方向。

发明内容

针对现有的自适应噪声消除技术中存在的上述问题，本发明旨在提供一种结构简单，并可有效实现有效的抗串扰以及提高语音质量的语音降噪方法及语音采集设备。

具体技术方案如下：

一种语音降噪方法，其中，

通过一滤波组件，对一滤波形成的消噪语音信号，以及一滤波形成的参考噪声信号进行频域转换并滤波，以滤波输出、对应所述参考噪声信号的原始噪声信号、以及对应所述消噪语音信号的含噪语音信号，分别控制形成所述参考噪声信号的第一抗串扰滤波单元，以及形成所述消噪语音信号的第二抗串扰滤波单元进行滤波系数更新。

优选的，所述滤波组件采用离散傅立叶变换，或离散余弦变换，或改进余弦变换对所述消噪语音信号进行频域转换得到第一幅度谱；和/或

所述滤波组件采用离散傅立叶变换，或离散余弦变换，或改进余弦变换对所述参考噪声信号进行频域转换得到第二幅度谱。

优选的，采用离散傅立叶变换得到所述第一幅度谱的公式为：

E_{a 1} {[k]}_{t} = | Σ_{n = 1}^{M} w_{ana} (n) e_{1} (t - M + n) e^{\frac{- 2 πj (n - 1) (k - 1)}{M}} |, k = 1,2,3, . . . M

其中，E_a1为所述第一幅度谱，e₁(t)为所述参考噪声信号，e为自然对数的底数，j为虚数单位，j＝(-1)^0.5，w_ana(n)为窗函数，n＝1,2,…M，M为频域分析的时间窗长度；和/或

采用离散傅立叶变换得到所述第二幅度谱的公式为：

E_{a 2} {[k]}_{t} = | Σ_{n = 1}^{M} w_{ana} (n) e_{2} (t - M + n) e^{\frac{- 2 πj (n - 1) (k - 1)}{M}} |, k = 1,2,3, . . . M

其中，E_a2为第二幅度谱，e₂(t)为所述消噪语音信号，e为自然对数的底数，j为虚数单位，j＝(-1)^0.5，w_ana(n)为窗函数，n＝1，2，…M，M为频域分析的时间窗长度。

优选的，所述窗函数w_ana(n)为矩形窗，或者正弦窗，或者汉宁窗，或者海明窗，或者Tukey窗。

优选的，M的取值范围为f_s/100/2<M<0.4f_s，其中f_s为采样频率。

优选的，所述滤波组件提供一后滤波器，所述后滤波器为具有M点冲激响应的频域维纳滤波器，通过下式计算所述频域维纳滤波器的解：

G {[k]}_{t} = \sqrt{\frac{\max (P_{s 1} {[k]}_{t} - P_{n} {[k]}_{t}, 0)}{P_{s 1} {[k]}_{t}}}, k = 1,2,3, . . ., M,

其中，G为所述维纳滤波器的解，P_sl为所述消噪语音信号的自功率谱，P_n为噪声的自功率谱；或者

所述滤波组件提供一后滤波器，所述后滤波器为具有M点冲激响应的频域维纳滤波器，通过下式计算所述频域维纳滤波器的解：

G {[k]}_{t} = \frac{SNR {[k]}_{t}}{SNR {[k]}_{t} + 1}, k = 1,2,3, . . ., M,

SNR[k]_t＝αG[k]_t-1 ²SNR_P[k]_t-1+(1-α)max(SNR_P[k]_t-1,0)

{SNR}_{P} {[k]}_{t} = \frac{P_{s 1} {[k]}_{t}}{P_{n} {[k]}_{t}},

其中，G为所述维纳滤波器的解，SNR为信噪比，SNR_p为先验信噪比，Psl为所述消噪语音信号的自功率谱，P_n为噪声的自功率谱，0<α<1。

优选的，所述消噪语音信号的自功率谱P_sl通过下式计算：

P_s1[k]_t＝|E_a1[k]_t|²，

其中，E_a1为所述消噪语音信号经频域转换后获得的第一幅度谱。

优选的，所述噪声的自功率谱P_n通过下式进行估计：

P_{n} {[k]}_{t} = \{\begin{matrix} η_{1} P_{n} {[k]}_{t - 1} + (1 - η_{1}) P_{s} {[k]}_{t} & , P_{n} {[k]}_{t - 1} > P_{s} {[k]}_{t} \\ \max (P_{n} {[k]}_{t - 1}, η_{2} P_{n} {[k]}_{t - 1} + (1 - η_{2}) \frac{P_{s} {[k]}_{t} - η_{3} P_{s} {[k]}_{t - 1}}{(1 - η_{3})}) & , P_{n} {[k]}_{t - 1} \leq P_{s} {[k]}_{t} \end{matrix},

其中，η₁，η₂，η₃为平滑因子，0<η₁，η₂，η₃<1；

P_s为所述消噪语音信号的自功率谱，或者P_s为所述消噪语音信号的自功率谱与所述参考噪声信号的自功率谱两者之间的较小值。

优选的，P_s为所述消噪语音信号的自功率谱时，P_s通过下式计算：

P_s[k]_t＝|E_a1[k]_t|²；

优选的，P_s为所述消噪语音信号的自功率谱与所述参考噪声信号的自功率谱两者之间的较小值时，P_s通过下式计算：

P_s[k]_t＝min(|E_a1[k]_t|²,|E_a2[k]_t|²)；

其中，

E_a1为所述消噪语音信号经频域转换后获得的第一幅度谱；

E_a2为所述参考噪音信号经频域转换后获得的第二幅度谱。

优选的，提供一语音激活检测单元，所述语音激活检测单元连接所述滤波组件；

所述语音激活检测单元根据所述含噪语音信号，或者所述含噪语音信号和所述原始噪声器信号，判断是否采集到语音信号，并向所述滤波组件输出判断结果。

优选的，P_s通过下式计算：

P_{s} {[k]}_{t} = \{\begin{matrix} \min ({| E_{a 1} {[k]}_{t} |}^{2}, {| E_{a 2} {[k]}_{t} |}^{2}), VAD is true \\ \min [\max ({| E_{a 1} {[k]}_{t} |}^{2}, {| E_{a 2} {[k]}_{t} |}^{2}), β {| E_{a 1} {[k]}_{t} |}^{2}], VAD is false \end{matrix};

其中，VAD为所述语音激活检测单元的输出值，true为采集到语音信号，false为未采集到语音信号；

E_a1为所述消噪语音信号经频域转换后获得的第一幅度谱；

E_a2为所述参考噪音信号经频域转换后获得的第二幅度谱；

β为控制因子，1<β<5。

优选的，所述滤波组件提供一第一自适应滤波器，及一第二自适应滤波器；

所述第一自适应滤波器根据所述频域维纳滤波器的解G、所述参考噪声信号以及所述含噪语音信号计算所述第一抗串扰滤波单元的滤波系数更新项并通过所述滤波系数更新项更新所述第一抗串扰滤波单元的滤波系数g_1,t；

所述第二自适应滤波器根据所述频域维纳滤波器的解G、所述消噪语音信号以及所述噪声信号，计算所述第二抗串扰滤波单元的滤波系数更新项并采用所述滤波系数更新项更新所述第二抗串扰滤波单元的滤波系数g_2,t。

优选的，所述第一抗串扰滤波单元通过下式更新滤波系数g_1,t：

g_{1} {[k]}_{t + 1} = g_{1} {[k]}_{t} + {\hat{g}}_{1} {[k]}_{t}, k = 1,2, . . ., N;

和/或

所述第二抗串扰滤波单元通过下式更新滤波系数g_2,t：

g_{2} {[k]}_{t + 1} = g_{2} {[k]}_{t} + {\hat{g}}_{2} {[k]}_{t}, k = 1,2, . . ., N .

优选的，所述第一自适应滤波器通过频域最小均方算法计算所述第一抗串扰滤波单元的滤波系数更新项具体算式如下：

其中，G₁＝G^λ；

λ为大于0的非线性控制因子；

μ为更新步长，且0＜μ＜2；

ε为防止除零错误的微小正数；

·为点乘符号；

上标*为共轭操作；

下标N×N表示矩阵为N行N列；

下标N×(M-N)表示矩阵为N行M-N列；

S_1,t为所述含噪语音信号s₁(t)的M点傅立叶变换；

E_2,t为所述参考噪声信号e₂(t)的M点傅立叶变换；

F-为反傅立叶变换矩阵；

E[|S_1,t|²]为|S_1,t|²在t时刻的短期数学期望。

优选的，S_1,t通过下式计算：

S_1,t＝F[s₁(t-M+1),s₁(t-M+2),…,s₁(t)]^T，

其中，上标T为转置操作；和/或

E_2,t通过下式计算：

E_2,t＝F{[0,0,…,0]_1×N[e₂(t-(M-N)+1),e₂(t-(M-N)+2),…,e₂(t)]}^T，

其中，上标T为转置操作；和/或

E[|S_1,t|²]通过自回归法进行获取，具体算式如下：

E[|S_1,t|²]＝γE[|S_1,t-1|²]+(1-γ)|S_1,t|²,0<γ<1。

优选的，所述第二自适应滤波器通过频域最小均方算法计算所述第二抗串扰滤波单元的滤波系数更新项具体算式如下：

其中，G₂＝1–G^λ或G₂＝(1–G)^λ；

λ为大于0的非线性控制因子；

μ为更新步长，且0＜μ＜2；

ε为防止除零错误的微小正数；

·为点乘符号；

上标*为共轭操作；

下标N×N表示矩阵为N行N列；

下标N×(M-N)表示矩阵为N行M-N列；

S_2,t为噪声信号s₂(t)的M点傅立叶变换；

E_1,t为消噪语音信号e₁(t)的M点傅立叶变换；

F-为反傅立叶变换矩阵；

E[|S_2,t|²]为|S_2,t|²在t时刻的短期数学期望。

优选的，S_2,t通过下式计算：

S_2,t＝F[s₂(t-M+1),s₂(t-M+2),…,s₂(t)]^T，

其中，F为傅立叶变换矩阵，上标T为转置操作；和/或

E_1,t通过下式计算：

E_1,t＝F{[0,0,…,0]_1×N[e₁(t-(M-N)+1),e₁(t-(M-N)+2),…,e1(t)]}^T，

其中，F为傅立叶变换矩阵，上标T为转置操作；和/或

E[|S_2,t|²]通过自回归法进行获取，具体算式如下：

E[|S_2,t|²]＝γE[|S_2,t-1|²]+(1-γ)|S_2,t|²,0<γ<1。

优选的，所述第一自适应滤波器通过加窗频域最小均方算法计算所述第一抗串扰滤波单元的滤波系数更新项具体算式如下：

其中，G₁＝G^λ；

λ为大于0的非线性控制因子；

μ为更新步长且0＜μ＜2；

ε为防止除零错误的微小正数；

·为点乘符号；

上标*为共轭操作；

下标N×N表示矩阵为N行N列；

下标N×(M-N)表示矩阵为N行M-N列；

S_w1,t为含噪语音信号s₁(t)的M点窗傅立叶变换；

E_w2,t为参考噪声信号e₂(t)的M点窗傅立叶变换；

F-为反傅立叶变换矩阵；

E[|S_w1,t|²]为|S_w1,t|²在t时刻的短期数学期望。

优选的，S_w1,t通过下式计算：

S_w1,t＝F[w_adf(t-M+1)s₁(t-M+1),w_adf(t-M+2)s₁(t-M+2),…,w_adf(t)s₁(t)]^T

，

其中，F为傅立叶变换矩阵，上标T为转置操作，w_adf(k)为窗函数，k＝1,2,…M；和/或

E_w2,t通过下式计算：

E_w2,t＝F[w_adf(t-M+1)e₂(t-M+1),w_adf(t-M+2)e₂(t-M+2),…,w_adf(t)e₂(t)]^T

E[|S_w1,t|²]通过自回归法进行获取，具体算式如下：

E[|S_w1,t|²]＝γE[|S_w1,t-1|²]+(1-γ)|S_w1,t|²,0<γ<1。

优选的，所述第二自适应滤波器通过加窗频域最小均方算法计算所述第二抗串扰滤波单元的滤波系数更新项具体算式如下：

其中，G₂＝1–G^λ或G₂＝(1–G)^λ；

λ为大于0的非线性控制因子；

μ为更新步长且0＜μ＜2；

ε为防止除零错误的微小正数；

·为点乘符号；

上标*为共轭操作；

下标N×N表示矩阵为N行N列；

下标N×(M-N)表示矩阵为N行M-N列；

S_w2,t为噪声信号s₂(t)的M点窗傅立叶变换；

E_w1,t为消噪语音信号e₁(t)的M点窗傅立叶变换；

F-为反傅立叶变换矩阵；

E[|S_w2,t|²]为|S_w2,t|²在t时刻的短期数学期望。

优选的，S_w2,_t通过下式计算：

S_w2,t＝F[w_adf(t-M+1)s₂(t-M+1),w_adf(t-M+2)s₂(t-M+2),…,w_adf(t)s₂(t)]^T

E_w1,t通过下式计算：

E_w1,t＝F[w_adf(t-M+1)e₁(t-M+1),w_adf(t-M+2)e₁(t-M+2),…,w_adf(t)e₁(t)]^T

，

E[|S_w2,t|²]通过自回归法进行获取，具体算式如下：

E[|S_w2,t|²]＝γE[|S_w2,t-1|²]+(1-γ)|S_w2,t|²,0<γ<1。

优选的，所述窗函数w_adf为矩形窗，或者正弦窗，或者汉宁窗，或者海明窗，或者Tukey窗。

优选的，所述第一抗串扰滤波单元包括第一有限冲激响应滤波器，所述第一有限冲激响应滤波器通过下式对所述含噪语音信号进行滤波以获取第一滤波信号：

p_{1} (t) = Σ_{k = 1}^{N} s_{1} (t - k + 1) g_{1} {[k]}_{t}

其中，k为自然序列，g_1,t为所述第一有限冲激响应滤波器的滤波系数，N为所述第一有限冲激响应滤波器的冲激响应长度，p₁(t)为所述第一滤波信号，s₁(t)为所述含噪语音信号，t为采样时刻的序号，下标t表示变量所处的采样时刻；和/或

所述第二抗串扰滤波单元包括第二有限冲激响应滤波器，所述第二有限冲激响应滤波器通过下式对所述原始噪声信号进行滤波以获取所述第二滤波信号：

p_{2} (t) = Σ_{k = 1}^{N} s_{2} (t - k + 1) g_{2} {[k]}_{t}

其中，k为自然序列，g_2,t为所述第二有限冲激响应滤波器的滤波系数，N为所述第二有限冲激响应滤波器的冲激响应长度，p₂(t)为所述第二滤波信号，s₂(t)为所述原始噪声信号，t为采样时刻序号，下标t表示变量所处的采样时刻。

优选的，所述N的取值范围为f_s/100/2<N<0.2f_s，其中f_s为采样频率；或者

当f_s＝8000Hz时N＝256，其中f_s为采样频率。

优选的，第二抗串扰滤波单元还包括一第一减法器，所述第一减法器用以将所述含噪语音信号减去所述第二滤波信号以获得所述消噪语音信号；和/或

第一抗串扰滤波单元还包括一第二减法器，所述第二减法器用以将所述原始噪声信号减去所述第一滤波信号以获得所述参考噪声信号。

优选的，第一抗串扰滤波单元还包括一第一延迟单元，所述第一延迟单元用以将所述含噪语音信号延迟后提供至所述第一减法器；和/或

第二抗串扰滤波单元还包括一第二延迟单元，所述第二延迟单元用以将所述原始噪声信号延迟后提供至所述第二减法器。

还包括一种语音采集设备，其中，采用如上述语音降噪方法。

上述技术方案的有益效果为：

1、通过仅使用一对自适应滤波器(ADF)，通过后滤波器控制该一对自适应滤波器的滤波系数更新，从而简化了的结构。

2、通过对语音信号和噪声信号的滤波系数更新权重分别进行有针对性的调整，实现优秀的抗串扰和降噪效果。

附图说明

通过阅读参照以下附图对非限制性实施例所作的详细描述，本发明及其特征、外形和优点将会变得更明显。在全部附图中相同的标记指示相同的部分。并未刻意按照比例绘制附图，重点在于示出本发明的主旨。

图1为现有技术中在无串扰的理想情况的自适应噪声消除原理图；

图2为现有技术中在有串扰的实际情况的自适应噪声消除原理；

图3为现有技术中双自适应滤波器结构的抗串扰自适应噪声消除原理图；

图4为现有技术中多级自适应滤波器结构的抗串扰自适应噪声消除原理图；

图5为现有技术中语音激活检测控制的多级自适应滤波器结构的抗串扰自适应噪声消除原理图；

图6为本发明提供的一种语音降噪方法的实施例的原理示意图；

图7为本发明提供的一种语音降噪方法的滤波组件的一种实施例的结构示意图；

图8为本发明提供的一种语音降噪方法的一种实施例的结构示意图；

图9为本发明提供的一种语音降噪方法的实施例在单噪声源环境下降噪前后的语谱演示对比图；

图10为本发明提供的一种语音降噪方法的实施例在单噪声源环境下降噪前后的波形演示对比图；

图11为在本发明提供的一种语音降噪方法的实施例在扩散噪声场降噪前主麦克风和次麦克风的语谱演示图；

图12为在本发明提供的一种语音降噪方法的实施例在扩散噪声场降噪后主麦克风和次麦克风的语谱演示图；

图13为本发明提供的一种语音降噪方法的实施例在扩散噪声场主麦克风降噪前后的波形演示图；

图14为本发明提供的一种语音降噪方法的实施例在扩散噪声场次麦克风降噪前后的波形演示图。

具体实施方式

在下文的描述中，给出了大量具体的细节以便提供对本发明更为彻底的理解。然而，对于本领域技术人员而言显而易见的是，本发明可以无需一个或多个这些细节而得以实施。在其他的例子中，为了避免与本发明发生混淆，对于本领域公知的一些技术特征未进行描述。

应当理解的是，本发明能够以不同形式实施，而不应当解释为局限于这里提出的实施例。相反地，提供这些实施例将使公开彻底和完全，并且将本发明的范围完全地传递给本领域技术人员。在附图中，为了清楚，层和区的尺寸以及相对尺寸可能被夸大。自始至终相同附图标记表示相同的元件。

在此使用的术语的目的仅在于描述具体实施例并且不作为本发明的限制。在此使用时，单数形式的“一”、“一个”和“所述/该”也意图包括复数形式，除非上下文清楚指出另外的方式。还应明白术语“组成”和/或“包括”，当在该说明书中使用时，确定所述特征、整数、步骤、操作、元件和/或部件的存在，但不排除一个或更多其它的特征、整数、步骤、操作、元件、部件和/或组的存在或添加。在此使用时，术语“和/或”包括相关所列项目的任何及所有组合。

需要指出的是，本发明技术方案中的实施方式和/或技术特征在不冲突于本发明主旨的前提下可相互组合。

为了彻底理解本发明，将在下列的描述中提出详细的步骤以及详细的结构，以便阐释本发明的技术方案。本发明的较佳实施例详细描述如下，然而除了这些详细描述外，本发明还可以具有其他实施方式。

本发明基于如下发现，在一个理想的无串扰的情况下，ANC技术的实现过程如图1所示，语音信号s_s经过传输途径h₁到达主麦克风1；噪声信号s_n经过传输途径h₂到达次麦克风2，与此同时噪声信号s_n经过传输途径h₄到达麦克风1。

那么主麦克风1收到了含噪语音信号s₁，次麦克风2收到了噪音信号s₂；

\begin{matrix} s_{1} = h_{1} &CircleTimes; s_{s} + h_{4} &CircleTimes; s_{n} \\ s_{2} = h_{2} &CircleTimes; s_{n} \end{matrix},

其中代表信号和传递函数的卷积或滤波。图1所示的ANC实现过程使用一个滤波系数为g₁的自适应滤波器，它利用主麦克风1收到的含噪语音信号s₁和次麦克风2收到的噪声信号s₂进行滤波和更新，滤波过程以下式体现：

s_{f 1} = g_{1} &CircleTimes; s_{2}

滤波信号s_f1和主麦克风1收到的含噪语音信号s₁相减得到误差信号s_e1，其获得过程以下式体现：

s_{e 1} = s_{1} - s_{f 1} = h_{1} &CircleTimes; s_{s} + h_{4} &CircleTimes; s_{n} - g_{1} &CircleTimes; h_{2} &CircleTimes; s_{n}

误差信号s_e1反馈给自适应滤波器进行滤波器系数更新。显然，当自适应滤波器收敛到时，就能够将主麦克风1收到的含噪语音信号s1中的噪声分量全部消除，达到了消噪的目的。

然而，理想的情况实际上并不会出现，在真实的使用环境中，如图2所示，总存在着一个串扰路径h₃，使语音信号s_s泄漏到次麦克风2。这个串扰将严重干扰自适应滤波器的更新。如果没有很好地解决串扰问题，ANC技术将不会带来有益效果，反而会损害语音质量。

为了能够解决串扰问题，很多改进的结构得到推出，它们一般称为抗串扰自适应噪声消除(Cross-talkResistantANC，CR-ANC)技术。

参照图3所示，图3中展示了现有技术中的一种对实时性要求很高的CR-ANC结构，它用一对自适应滤波器实现，并且要用互相的滤波误差作为滤波输入，对延迟要求很高，因此几乎难以实现。见文献[1]。

现有技术中还有一种级联的CR-ANC结构，如图4所示，在第一级自适应滤波器1输出得到相对有所降噪的语音之后，作为第二级自适应滤波器2的输入来估计次麦克风2采集到的信号中的串扰成分并将其削弱，第二级自适应滤波器2的输出中串扰成分得到降低以后，再用它作为噪声参考输入到第三级自适应滤波器3，并在最后一级得到降噪的语音输出。见文献[2]。

在现有技术的某些实施例中，通过在图4所示结构的基础上，通过增加一个语音激活检测模块用于控制3个自适应滤波器的开启和更新，如图5所示，它进一步提高了工作稳定性。见文献[3]。

尽管现有技术有多种CR-ANC的方案被提出，但是ANC的性能有限，因为语音串扰的传递途径是实时发生改变的，例如当说话人或者设备移动，其传递途径就会发生变化，若说话人更迭，则信号也会产生突变。上述CR-ANC方案在实际运作时，有时不能降低串扰，反而会引入更大的串扰，导致ANC的性能急剧下降。

因此，现有技术存在有诸多缺陷，从而导致降噪效果并不理想，而本发明是针对现有技术进行的改进，从而可实现改善语音质量的效果。

本发明的技术方案中提供一种语音降噪方法，如图6所示，其主旨是，通过一滤波组件，对一滤波形成的消噪语音信号，以及一滤波形成的参考噪声信号进行频域转换并滤波，以滤波输出、对应所述参考噪声信号的原始噪声信号、以及对应所述消噪语音信号的含噪语音信号，分别控制形成所述参考噪声信号的第一抗串扰滤波单元g₁，以及形成所述消噪语音信号的第二抗串扰滤波单元g₂进行滤波系数更新。

上述技术方案的主要目的是，通过一滤波组件对一对实施语音降噪的抗串扰滤波单元进行滤波系数更新。其中，

第一抗串扰滤波单元g₁对含噪语音信号进行滤波，以滤除由于串扰作用进入含噪语音信号的噪音成分，然后通过将滤除噪音成分的语音信号与原始噪声信号比较，以期获得一不含有语音成分的参考噪音信号输出。

第二抗串扰滤波单元g₂对原始噪声信号进行滤波，以滤除由于串扰作用进入原始噪声信号的语音成分，然后通过将滤除语音成分的噪音信号与含噪语音信号比较，以期获得一不含有噪音成分的消噪语音信号输出。

需要说明的是，上述第一抗串扰滤波单元与第二抗串扰滤波单元的具体结构在本发明的技术方案中并不被具体的限定，本领域技术人员完全可以在不付出创造性劳动的前提下，以现有的手段，获得多种可实现上述第一抗串扰滤波单元与第二抗串扰滤波单元的结构，因此，不可以下文中为体现上述技术方案可行性而描述的具体实施例作为对本发明保护范围的限定。

滤波组件根据消噪语音信号，以及参考噪声信号形成滤波输出，使滤波组件的滤波输出实时的根据消噪语音信号，以及参考噪声信号产生变化，从而使第一抗串扰滤波单元g₁与第二抗串扰滤波单元g₂的滤波系数可根据消噪语音信号，以及参考噪声信号的变化进行更新，从而可实现有效的语音降噪，进而提高语音质量，同时由于通过一额外的滤波组件控制第一抗串扰滤波单元g₁与第二抗串扰滤波单元g₂的滤波系数进行更新，使***的实时性要求降低，结构也得到了简化。

于一种较优的实施方式中，滤波组件可采用离散傅立叶变换，或离散余弦变换，或改进余弦变换对消噪语音信号进行频域转换得到第一幅度谱；和/或

滤波组件可采用离散傅立叶变换，或离散余弦变换，或改进余弦变换对参考噪声信号进行频域转换得到第二幅度谱。

由于离散余弦变换及改进余弦变换均为本领域公知的方法，因此不再展开叙述，以下以离散傅里叶变换来说明上述技术方案的可行性。

于可选的实施方式中，采用离散傅立叶变换得到第一幅度谱的公式为：

E_{a 1} {[k]}_{t} = | Σ_{n = 1}^{M} w_{ana} (n) e_{1} (t - M + n) e^{\frac{- 2 πj (n - 1) (k - 1)}{M}} |, k = 1,2,3, . . . M

其中，E_a1为第一幅度谱，e₁(t)为参考噪声信号，e为自然对数的底数，j为虚数单位，j＝(-1)^0.5，w_ana(n)为窗函数，n＝1,2,…M，M为频域分析的时间窗长度。

于可选的实施方式中，采用离散傅立叶变换得到第二幅度谱的公式为：

E_{a 2} {[k]}_{t} = | Σ_{n = 1}^{M} w_{ana} (n) e_{2} (t - M + n) e^{\frac{- 2 πj (n - 1) (k - 1)}{M}} |, k = 1,2,3, . . . M

其中，E_a2为第二幅度谱，e₂(t)为消噪语音信号，e为自然对数的底数，j为虚数单位，j＝(-1)^0.5，w_ana(n)为窗函数，n＝1，2，…M，M为频域分析的时间窗长度。

在进一步的实施方式中，窗函数w_ana(n)可采用矩形窗，或者正弦窗，或者汉宁窗，或者海明窗，或者Tukey窗。由于上述窗函数均为本领域技术人员公知的方法，因此不再展开叙述。

在进一步的实施方式中，由于M的大小对应着频域分析的时间窗长度，并决定频域的分辨率，基于频域分辨率大于100Hz，时间窗小于0.4秒的要求，因此，M的取值范围可以是f_s/100/2<M<0.4f_s，其中f_s为采样频率。优选的，当f_s＝8000Hz时，可令M＝512。

于一种较优的实施方式中，滤波组件提供一后滤波器，后滤波器为具有M点冲激响应的频域维纳滤波器，可通过下式计算频域维纳滤波器的解：

G {[k]}_{t} = \sqrt{\frac{\max (P_{s 1} {[k]}_{t} - P_{n} {[k]}_{t}, 0)}{P_{s 1} {[k]}_{t}}}, k = 1,2,3, . . ., M,

其中，G为维纳滤波器的解，P_sl为消噪语音信号的自功率谱，P_n为噪声的自功率谱；或者

于可选的实施方式中，基于获取更优性能的考虑，M点冲激响应的频域维纳滤波器的解也可以通过下式进行计算：

G {[k]}_{t} = \frac{SNR {[k]}_{t}}{SNR {[k]}_{t} + 1}, k = 1,2,3, . . ., M,

SNR[k]_t＝αG[k]_t-1 ²SNR_P[k]_t-1+(1-α)max(SNR_P[k]_t-1,0)

{SNR}_{P} {[k]}_{t} = \frac{P_{s 1} {[k]}_{t}}{P_{n} {[k]}_{t}},

其中，G为维纳滤波器的解，SNR为信噪比，SNR_p为先验信噪比，P_sl为消噪语音信号的自功率谱，P_n为噪声的自功率谱，0<α<1，优选的α＝0.5。

在进一步的实施方式中，消噪语音信号的自功率谱P_sl通过下式计算：

P_s1[k]_t＝|E_a1[k]_t|²，

其中，E_a1为消噪语音信号经频域转换后获得的第一幅度谱。

噪声的自功率谱P_n需要通过估计获得，其估计方法有跟踪信号频谱短时最小值，时间递归平均等方法，在进一步的实施方式中，可采用G.Doblinger噪声估计法(见文献[4])实现噪声自功率谱P_n的估计，G.Doblinger噪声估计法为频谱短时最小值和时间递归平均方法的一种结合，具体的估计方法见下式：

P_{n} {[k]}_{t} = \{\begin{matrix} η_{1} P_{n} {[k]}_{t - 1} + (1 - η_{1}) P_{s} {[k]}_{t} & , P_{n} {[k]}_{t - 1} > P_{s} {[k]}_{t} \\ \max (P_{n} {[k]}_{t - 1}, η_{2} P_{n} {[k]}_{t - 1} + (1 - η_{2}) \frac{P_{s} {[k]}_{t} - η_{3} P_{s} {[k]}_{t - 1}}{(1 - η_{3})}) & , P_{n} {[k]}_{t - 1} \leq P_{s} {[k]}_{t} \end{matrix}

其中，η₁，η₂，η₃为平滑因子，0<η₁，η₂，η₃<1；优选的，平滑因子η₁＝0.99，η₂＝0.99，η₃＝0.8；

P_s为消噪语音信号的自功率谱，或者P_s为消噪语音信号的自功率谱与参考噪声信号的自功率谱两者之间的较小值。

基于上述实施方式，当P_s为消噪语音信号的自功率谱时，P_s可通过下式计算：

P_s[k]_t＝|E_a1[k]_t|²；

其中，E_a1为消噪语音信号经频域转换后获得的第一幅度谱。

在可选的实施方式中，当P_s为消噪语音信号的自功率谱与参考噪声信号的自功率谱两者之间的较小值时，P_s可通过下式计算：

P_s[k]_t＝min(|E_a1[k]_t|²,|E_a2[k]_t|²)；

其中，

E_a1为消噪语音信号经频域转换后获得的第一幅度谱；

E_a2为参考噪音信号经频域转换后获得的第二幅度谱。

基于上述技术方案，在一种可选的实施方式中，可提供一语音激活检测单元(未于图中示出)，语音激活检测单元连接滤波组件；

语音激活检测单元根据含噪语音信号，或者含噪语音信号和原始噪声器信号，判断是否采集到语音信号，并向滤波组件输出判断结果。

进一步的，基于语音激活检测单元的输出结果，P_s可通过下式计算：

P_{s} {[k]}_{t} = \{\begin{matrix} \min ({| E_{a 1} {[k]}_{t} |}^{2}, {| E_{a 2} {[k]}_{t} |}^{2}), VAD is true \\ \min [\max ({| E_{a 1} {[k]}_{t} |}^{2}, {| E_{a 2} {[k]}_{t} |}^{2}), β {| E_{a 1} {[k]}_{t} |}^{2}], VAD is false \end{matrix};

其中，VAD为语音激活检测单元的输出值，true为采集到语音信号，false为未采集到语音信号；

E_a1为消噪语音信号经频域转换后获得的第一幅度谱；

E_a2为参考噪音信号经频域转换后获得的第二幅度谱；

β为控制因子，1<β<5，优选的，β＝2。

于一种优选的实施方式中，如图7所示，滤波组件可提供一第一自适应滤波器及一第二自适应滤波器

第一自适应滤波器根据频域维纳滤波器的解G、参考噪声信号以及含噪语音信号计算第一抗串扰滤波单元的滤波系数更新项并通过滤波系数更新项更新第一抗串扰滤波单元的滤波系数g_1,t；

第二自适应滤波器根据频域维纳滤波器的解G、消噪语音信号以及噪声信号，计算第二抗串扰滤波单元的滤波系数更新项并采用滤波系数更新项更新第二抗串扰滤波单元的滤波系数g_2,t。

于一种优选的实施方式中，第一抗串扰滤波单元通过下式更新滤波系数g_1,t：

g_{1} {[k]}_{t + 1} = g_{1} {[k]}_{t} + {\hat{g}}_{1} {[k]}_{t}, k = 1,2, . . ., N;

和/或

于进一步的实施方式中第二抗串扰滤波单元通过下式更新滤波系数g_2,t：

g_{2} {[k]}_{t + 1} = g_{2} {[k]}_{t} + {\hat{g}}_{2} {[k]}_{t}, k = 1,2, . . ., N .

滤波系数更新项和须由自适应滤波器计算得到。由于语音能量大的频段对应着后滤波器G的值较大的频段，第一抗串扰滤波单元g₁及第二抗串扰滤波单元g₂可以通过后滤波器G来控制更新权重，使第一抗串扰滤波单元g₁的滤波系数更新项提高语音能量大的频段的更新权重，从而使第一抗串扰滤波单元g₁可有效的滤除含噪语音信号中的噪音成分；同时使第二抗串扰滤波单元g₂的滤波系数更新项降低语音能量大的频段的更新权重，从而使第二抗串扰滤波单元g₂可有效的滤除原始噪声信号中的语音成分。

滤波系数更新项的算法包括最小均方算法(LMS)、归一化最小均方算法(NLMS)、最小二乘算法(RLS)、仿射投影算法(AP)见文献[5]、快速仿射投影算法(FAP)见文献[6]、块最小均方算法(BLMS)见文献[7-8]、频域最小均方算法(FDAF)见文献[9]、加窗频域最小均方算法(WDAF)见文献[10]等多种，由于上述更新算法均为本领域公知的方法，因此不再赘述。基于频域维纳滤波器控制便利的考虑，可选择频域算法作为滤波系数更新项的算法，当然也不排除在增加控制元素的基础上采用其他类型算法作为滤波系数更新项的算法。

于一种优选的实施方式中，第一自适应滤波器可通过频域最小均方算法计算第一抗串扰滤波单元的滤波系数更新项具体算式如下：

其中，G₁＝G^λ；

λ为大于0的非线性控制因子，优选的，λ＝1；

μ为更新步长，且0＜μ＜2，μ取值过大则稳定性较差，μ取值过小则更新太慢，优选的，μ＝0.5；

ε为防止除零错误的微小正数；

·为点乘符号；

上标*为共轭操作；

下标N×N表示矩阵为N行N列；

下标N×(M-N)表示矩阵为N行M-N列；

S_1,t为含噪语音信号s₁(t)的M点傅立叶变换；

E_2,t为参考噪声信号e₂(t)的M点傅立叶变换；

F-为反傅立叶变换矩阵；

E[|S_1,t|²]为|S_1,t|²在t时刻的短期数学期望。

于上述技术方案基础上，进一步的，S_1,t通过下式计算：

S_1,t＝F[s₁(t-M+1),s₁(t-M+2),…,s₁(t)]^T，

其中，上标T为转置操作；和/或

E_2,t通过下式计算：

E_2,t＝F{[0,0,…,0]_1×N[e₂(t-(M-N)+1),e₂(t-(M-N)+2),…,e2(t)]}^T，

其中，上标T为转置操作；和/或

E[|S_1,t|²]通过自回归法进行获取，具体算式如下：

E[|S_1,t|²]＝γE[|S_1,t-1|²]+(1-γ)|S_1,t|²,0<γ<1。

于一种优选的实施方式中，第二自适应滤波器可通过频域最小均方算法计算第二抗串扰滤波单元的滤波系数更新项具体算式如下：

其中，G₂＝1–G^λ或G₂＝(1–G)^λ；

λ为大于0的非线性控制因子，优选的，λ＝1；

ε为防止除零错误的微小正数；

·为点乘符号；

上标*为共轭操作；

下标N×N表示矩阵为N行N列；

下标N×(M-N)表示矩阵为N行M-N列；

S_2,t为噪声信号s₂(t)的M点傅立叶变换；

E_1,t为消噪语音信号e₁(t)的M点傅立叶变换；

F-为反傅立叶变换矩阵；

E[|S_2,t|²]为|S_2,t|²在t时刻的短期数学期望。

于上述技术方案基础上，进一步的，S_2,t通过下式计算：

S_2,t＝F[s₂(t-M+1),s₂(t-M+2),…,s₂(t)]^T，

其中，F为傅立叶变换矩阵，上标T为转置操作；和/或

E_1,t通过下式计算：

E_1,t＝F{[0,0,…,0]_1×N[e₁(t-(M-N)+1),e₁(t-(M-N)+2),…,e1(t)]}^T，

其中，F为傅立叶变换矩阵，上标T为转置操作；和/或

E[|S_2,t|²]通过自回归法进行获取，具体算式如下：

E[|S_2,t|²]＝γE[|S_2,t-1|²]+(1-γ)|S_2,t|²,0<γ<1。

于一种可选的实施方式中，第一自适应滤波器通过加窗频域最小均方算法计算第一抗串扰滤波单元的滤波系数更新项具体算式如下：

其中，G₁＝G^λ；

λ为大于0的非线性控制因子，优选的，λ＝1；

μ为更新步长且0＜μ＜2，μ取值过大则稳定性较差，μ取值过小则更新太慢，优选的，μ＝0.5；

ε为防止除零错误的微小正数；

·为点乘符号；

上标*为共轭操作；

下标N×N表示矩阵为N行N列；

下标N×(M-N)表示矩阵为N行M-N列；

S_w1,t为含噪语音信号s₁(t)的M点窗傅立叶变换；

E_w2,t为参考噪声信号e₂(t)的M点窗傅立叶变换；

F-为反傅立叶变换矩阵；

E[|S_w1,t|²]为|S_w1,t|²在t时刻的短期数学期望。

于上述技术方案基础上，进一步的，S_w1,t通过下式计算：

E_w2,t通过下式计算：

E[|S_w1,t|²]通过自回归法进行获取，具体算式如下：

E[|S_w1,t|²]＝γE[|S_w1,t|-1²]+(1-γ)|S_w1,t|²,0<γ<1。

于一种可选的实施方式中，第二自适应滤波器通过加窗频域最小均方算法计算第二抗串扰滤波单元的滤波系数更新项具体算式如下：

其中，G₂＝1–G^λ或G₂＝(1–G)^λ；

λ为大于0的非线性控制因子，优选的，λ＝1；

ε为防止除零错误的微小正数；

·为点乘符号；

上标*为共轭操作；

下标N×N表示矩阵为N行N列；

下标N×(M-N)表示矩阵为N行M-N列；

S_w2,t为噪声信号s₂(t)的M点窗傅立叶变换；

E_w1,t为消噪语音信号e₁(t)的M点窗傅立叶变换；

F-为反傅立叶变换矩阵；

E[|S_w2,t|²]为|S_w2,t|²在t时刻的短期数学期望。

于上述技术方案基础上，进一步的，S_w2,t通过下式计算：

E_w1,t通过下式计算：

E[|S_w2,t|²]通过自回归法进行获取，具体算式如下：

E [{| S_{1 . w 2, t} |}^{2}] = γE [{| S_{w 2, t - 1} |}^{2}] + (1 - γ) {| S_{w 2, t} |}^{2}, 0 < γ <

于一种优选的实施方式中，上述窗函数w_adf为矩形窗，或者正弦窗，或者汉宁窗，或者海明窗，或者Tukey窗。由于上述列举的窗函数均为本领域技术人员公知的方法，因此不再展开叙述。

为表明本发明技术方案的可行性，现基于图8中所示结构对本发明的实现进行说明，需指出的是，如上文中所述，图8中所示结构仅仅是本发明的一种实施例，并不能以此限定本发明的保护范围。

于一种较优的实施方式中，上述的含噪语音信号可通过一第一换能器获得，上述原始噪声信号可通过以第二换能器获得。于优选的实施方式中，上述第一换能器可通过一主麦克风m₁实现，上述第二换能器可通过一次麦克风m₂实现。

于一种较优的实施方式中，第一抗串扰滤波单元可包括第一有限冲激响应滤波器FIR₁，第一有限冲激响应滤波器FIR₁通过下式对含噪语音信号进行滤波以获取第一滤波信号：

p_{1} (t) = Σ_{k = 1}^{N} s_{1} (t - k + 1) g_{1} {[k]}_{t}

其中，k为自然序列，g_1,t为第一有限冲激响应滤波器FIR₁的滤波系数，N为第一有限冲激响应滤波器FIR₁的冲激响应长度，p₁(t)为第一滤波信号，s₁(t)为含噪语音信号，t为采样时刻的序号，下标t表示变量所处的采样时刻。第一抗串扰滤波单元可通过第一有限冲激响应滤波器实现滤除含噪语音信号中的噪音成分。滤波组件中的第一自适应滤波器通过计算滤波系数更新项对第一有限冲激响应滤波器FIR₁的滤波系数g_1,t进行更行。

在此实施方式基础上，选择对参考噪声信号进行频域变换的窗函数时，须使频域分析的时间窗长度M大于第一有限冲激响应滤波器FIR₁的冲激响应长度N。

在此基础上，进一步的，第二抗串扰滤波单元可包括第二有限冲激响应滤波器FIR₂，第二有限冲激响应滤波器FIR₂通过下式对原始噪声信号进行滤波以获取第二滤波信号：

p_{1} (t) = Σ_{k = 1}^{N} s_{1} (t - k + 1) g_{1} {[k]}_{t}

其中，k为自然序列，g_2,t为第二有限冲激响应滤波器FIR2的滤波系数，N为第二有限冲激响应滤波器FIR₂的冲激响应长度，p₂(t)为第二滤波信号，s₂(t)为原始噪声信号，t为采样时刻序号，下标t表示变量所处的采样时刻。第二抗串扰滤波单元可通过第二有限冲激响应滤波器FIR₂实现滤除原始噪声信号中的语音成分。滤波组件中的第二自适应滤波器通过计算滤波系数更新项对第二有限冲激响应滤波器FIR₂的滤波系数g_2,t进行更行。

在此实施方式基础上，选择对消噪语音信号进行频域变换的窗函数时，须使频域分析的时间窗长度M大于第二有限冲激响应滤波器FIR₂的冲激响应长度N。

于进一步的实施方式中，N的取值范围为f_s/100/2<N<0.2f_s，其中f_s为采样频率；或者当f_s＝8000Hz时N＝256，其中f_s为采样频率。

于一种优选的实施方式中，第二抗串扰滤波单元还可包括一第一减法器sub₁，第一减法器sub₁用以将含噪语音信号减去第二滤波信号以获得消噪语音信号。

于进一步的实施方式中，第一抗串扰滤波单元还可包括一第二减法器sub₂，第二减法器sub₂用以将原始噪声信号减去第一滤波信号以获得参考噪声信号。

于一种优选的实施方式中，第一抗串扰滤波单元还可包括一第一延迟单元z₁，第一延迟单元z₁用以将含噪语音信号s₁(t)延迟后提供至第一减法器sub₁，第一延迟单元z₁可通过下式进行延迟计算：

z₁(t)＝s₁(t-t_z1)，

其中，z₁(t)为含噪语音信号s₁(t)经延迟后形成的第一延迟信号，t_z1为第一延迟单元z₁的延迟采样数。

于进一步的实施方式中，第二抗串扰滤波单元还可包括一第二延迟单元z₂，第二延迟单元z₂用以将原始噪声信号s₂(t)延迟后提供至第二减法器sub₂，第二延迟单元z₂可通过下式进行延迟计算：

z₂(t)＝s₂(t-t_z2)

其中，z₂(t)为原始噪声信号s₂(t)经延迟后形成的第二延迟信号，t_z2为第二延迟单元z₂的延迟采样数。

上述的t_z1与t_z2和主麦克风m₁及次麦克风m₂之间的物理距离L_distence有关，在较优的实施方式中，t_z1的取值范围为f_sL_distence/c_sound<t_z1<10f_sL_distence/c_sound，和/或t_z2的取值范围为f_sL_distence/c_sound<t_z2<10f_sL_distence/c_sound，其中c_sound是声传播速度，f_s是采样频率。在进一步的实施方式中，以空气中声速340米/秒，语音采集设备长度0.15米，采样频率8000Hz为例，t_z1、t_z2的取值范围为，3.52<t_z1＝t_z2<35.2。优选的，t_z1＝t_z2＝8。

基于上述具有第一延迟单元z₁和第二延迟单元z₁的技术方案，一种更进一步的实施方式中，第一减法器sub₁可通过下式计算消噪语音信号：

e₁(t)＝z₁(t)-p₂(t)，

其中，e₁(t)为消噪语音信号，z₁(t)为含噪语音信号s₁(t)经延迟后形成的第一延迟信号，p₂(t)为原始噪声信号s₂(t)经滤波后形成的第二滤波信号。

于进一步的实施方式中，第二减法器sub₂可通过下式计算参考噪声信号：

e₂(t)＝z₂(t)-p₁(t)，

其中，e₂(t)为参考噪声信号，z₂(t)为原始噪声信号s₂(t)经延迟后形成的第二延迟信号，p₁(t)为含噪语音信号s₁(t)经滤波后形成的第一滤波信号。

基于上述技术方案，进一步的，后滤波器G将消噪语音信号e₁(t)和参考噪声信号e2(t)经频域转换并滤波形成滤波输出。第一自适应滤波器在后滤波器G的输出的控制下，根据参考噪声信号e₂(t)和含噪语音信号s₁(t)计算第一有限冲激响应滤波器FIR1的更新项第一有限冲激响应滤波器FIR₁通过更新项更新滤波系数g_1,t。第二自适应滤波器在后滤波器G的输出的控制下，根据消噪语音信号e₁(t)和原始噪声信号s₂(t)计算第二有限冲激响应滤波器FIR₂的更新项第二有限冲激响应滤波器FIR₂通过更新项更新滤波系数g_2,t。

通过变化的消噪语音信号e₁(t)及参考噪声信号e₂(t)，使后滤波器G的输出根据实际情况实时的改变，进而控制第一自适应滤波器及第二自适应滤波器根据实际情况的并且有针对性的形成更新权重不同的更新项及更新项以更新第一有限冲激响应滤波器FIR1，及第二有限冲激响应滤波器FIR₂。

上述实施方仅仅用以表明本发明技术方案的可行性，不应当以此限制本发明的保护范围。

本发明的技术方案中，还包括一种语音采集设备，其中，采用如上述语音降噪方法。

以下通过两种典型情况来展现本发明的有益效果。情况1是噪声源为单点声源的情况，理论上在没有串扰的时候ANC可以将噪声消除干净。情况2是扩散噪声场情况，噪声是从各个方向过来的。因为串扰的存在，两种情况语音都有很强的泄漏，次麦克风中语音能量很强，这样情况1很难将主麦克风信号中的噪声消除到理想状况，情况2则很难将主麦克风信号中的噪声消除，而次麦克风则很难消除其中的语音串扰。

通过对本发明技术方案的实施，如图9的单噪声源降噪效果的语谱演示(上方为降噪前，下方为降噪后)所示，上方语谱中有大量噪声，而下方语谱已经很清晰，噪声谱变淡；如图10的单噪声源降噪效果的波形演示(上方为降噪前，下方为降噪后)所示，音节间的噪声已经被大幅度的消除。

通过对本发明技术方案的实施，如图11的扩散噪声场降噪前语谱演示(上方为主麦克风信号，下方为次麦克风信号)所示，一个随时间逐渐增大后逐渐减小的噪音几乎将主麦克风信号中的语音谱完全淹没，而次麦克风信号中的串扰语音清晰可见。如图12扩散噪声场降噪后的语谱演示(上方为主麦克风信号，下方为次麦克风信号)所示，噪声最大处，原来被淹没的主麦克风信号中的语音谱已清晰可见，而次麦克风信号中的串扰语音谱已接近完全抹去。如图13扩散噪声场主麦克风降噪前后的波形演示(黑色为降噪前，灰色为降噪后)可见，灰色的处理后信号波形，在噪声段已明显减小；如图14扩散噪声场次麦克风降噪前后的波形演示(黑色为降噪前，灰色为降噪后)可见，灰色的处理后信号波形，在语音段接近完全消除。这样处理后的双麦克风信号，很容易进行语音增强处理，进一步提高其语音质量。

综上所述，由于本发明采用了如上技术方案，提供了一种新的抗串扰自适应噪声消除(CR-ANC)结构，通过仅使用一对自适应滤波器(ADF)，并采用后滤波器控制该一对自适应滤波器的滤波系数更新，从而简化了结构，通过对语音信号和噪声信号的滤波系数权重分别进行有针对性的调整，实现优秀的抗串扰和降噪效果。

以上对本发明的较佳实施例进行了描述。需要理解的是，本发明并不局限于上述特定实施方式，其中未尽详细描述的设备和结构应该理解为用本领域中的普通方式予以实施；任何熟悉本领域的技术人员，在不脱离本发明技术方案范围情况下，都可利用上述揭示的方法和技术内容对本发明技术方案作出许多可能的变动和修饰，或修改为等同变化的等效实施例，这并不影响本发明的实质内容。因此，凡是未脱离本发明技术方案的内容，依据本发明的技术实质对以上实施例所做的任何简单修改、等同变化及修饰，均仍属于本发明技术方案保护的范围内。

引用文献：

[1]M.J.Al-KindiandJ.Dunlop,"Alowdistortionadaptivenoisecancellationstructureforrealtimeapplications"Proc.ICASSP'87,pp.2153-2156,1987；

[2]H.Kubota,T.Furukawa,andH.Itakura,"Pre-processednoisecancellerdesignanditsperformance,"IEICETrans.vol.J69-A,no.5,pp.584-591,May1986；

[3]R.L.Bouquin,G.Faucon.StudyofaVoiceActivityDetectoranditsInfluenceonaNoiseReductionSystem.SpeechCommunication,Vol.16,pp.245-254,1995；

[4]GerhardDoblinger,“Computaionallyefficientspeechenhancementbyspectralminimatrackinginsubbands,”Proc.EUROSPEECH’95,Madrid,pp.1513-1516；

[5]S.S.Haykin,Adaptivefiltertheory,4thed.,UpperSaddleRiver,N.J.:PrenticeHall,2002；

[6]S.L.Gay,andS.Tavathia,“Thefastaffineprojectionalgorithm,”inAcoustics,Speech,andSignalProcessing,1995.ICASSP-95.,1995InternationalConferenceon,1995,pp.3023-3026；

[7]E.Ferrara,“FastimplementationsofLMSadaptivefilters,”Acoustics,SpeechandSignalProcessing,IEEETransactionson,vol.28,no.4,pp.474-475,1980；

[8]G.Clark,S.Mitra,andS.Parker,“Blockimplementationofadaptivedigitalfilters,”Acoustics,SpeechandSignalProcessing,IEEETransactionson,vol.29,no.3,pp.744-752,1981；

[9]J.J.Shynk,“Frequency-domainandmultirateadaptivefiltering,”IEEESignalProcessingMagazine,vol.9,no.1,pp.14-37,Jan,1992；

[10]WuSheng,QiuXiaojun,“AWindowingFrequencyDomainAdaptiveFilterforAcousticEchoCancellation”,IEICETransactionsonFundamentalsofElectronics,CommunicationsandComputerSciences,VolumeE92.A,Issue10,pp.2626-2628(2009)。

Claims

1.一种语音降噪方法，其特征在于，

2.如权利要求1所述语音降噪方法，其特征在于，所述滤波组件采用离散傅立叶变换，或离散余弦变换，或改进余弦变换对所述消噪语音信号进行频域转换得到第一幅度谱；和/或

3.如权利要求2所述语音降噪方法，其特征在于，采用离散傅立叶变换得到所述第一幅度谱的公式为：

E_{al} {[k]}_{t} = | Σ_{n = 1}^{M} w_{ana} (n) e_{1} (t - M + n) e^{\frac{- 2 πj (n - 1) (k - 1)}{M}} |, k = 1,2,3, . . . M

其中，E_a1为所述第一幅度谱，e₁(t)为所述消噪语音信号，e为自然对数的底数，j为虚数单位，j＝(-1)^0.5，w_ana(n)为窗函数，n＝1,2,…M，M为频域分析的时间窗长度；和/或

采用离散傅立叶变换得到所述第二幅度谱的公式为：

E_{a 2} {[k]}_{t} = | Σ_{n = 1}^{M} w_{ana} (n) e_{2} (t - M + n) e^{\frac{- 2 πj (n - 1) (k - 1)}{M}} |, k = 1,2,3, . . . M

其中，E_a2为所述第二幅度谱，e₂(t)为所述参考噪声信号，e为自然对数的底数，j为虚数单位，j＝(-1)^0.5，w_ana(n)为窗函数，n＝1，2，…M，M为频域分析的时间窗长度。

4.如权利要求3所述语音降噪方法，其特征在于，所述窗函数w_ana(n)为矩形窗，或者正弦窗，或者汉宁窗，或者海明窗，或者Tukey窗。

5.如权利要求3所述所述语音降噪方法，其特征在于，M的取值范围为f_s/100/2<M<0.4f_s，其中f_s为采样频率。

6.如权利要求1所述语音降噪方法，其特征在于，所述滤波组件提供一后滤波器，所述后滤波器为具有M点冲激响应的频域维纳滤波器，通过下式计算所述频域维纳滤波器的解：

G {[k]}_{t} = \sqrt{\frac{\max (P_{sl} {[k]}_{t} - P_{n} {[k]}_{t}, 0)}{P_{sl} {[k]}_{t}}}, k = 1,2,3, . . ., M,

{G [k]}_{t} = \frac{{SNR [k]}_{t}}{{SNR [k]}_{t} + 1}, k = 1,2,3, . . . M,

SNR[k]_t＝αG[k]_t-1 ²SNR_P[k]_t-1+(1-α)max(SNR_P[k]_t-1,0)

{{SNR}_{P} [k]}_{t} = \frac{{P_{sl} [k]}_{t}}{{P_{n} [k]}_{t}},

其中，G为所述维纳滤波器的解，SNR为信噪比，SNR_p为先验信噪比，P_sl为所述消噪语音信号的自功率谱，P_n为噪声的自功率谱，0<α<1。

7.如权利要求6所述语音降噪方法，其特征在于，所述消噪语音信号的自功率谱P_sl通过下式计算：

P_s1[k]_t＝|E_a1[k]_t|²，

8.如权利要求6所述语音降噪方法，其特征在于，所述噪声的自功率谱P_n通过下式进行估计：

P_{n} {[k]}_{t} = \{\begin{matrix} η_{1} P_{n} {[k]}_{t - 1} + (1 - η_{1}) P_{s} {[k]}_{t} & , P_{n} {[k]}_{t - 1} > P_{s} {[k]}_{t} \\ \max (P_{n} {[k]}_{t - 1}, η_{2} P_{n} {[k]}_{t - 1} + (1 - η_{2}) \frac{P_{s} {[k]}_{t} - η_{3} P_{s} {[k]}_{t - 1}}{(1 - η_{3})}) & , P_{n} {[k]}_{t - 1} \leq P_{s} {[k]}_{t} \end{matrix},

其中，η₁，η₂，η₃为平滑因子，0<η₁，η₂，η₃<1；

9.如权利要求8所述语音降噪方法，其特征在于，P_s为所述消噪语音信号的自功率谱时，P_s通过下式计算：

P_s[k]_t＝|E_a1[k]_t|²；

10.如权利要求8所述语音降噪方法，其特征在于，P_s为所述消噪语音信号的自功率谱与所述参考噪声信号的自功率谱两者之间的较小值时，P_s通过下式计算：

P_s[k]_t＝min(|E_a1[k]_t|²,|E_a2[k]_t|²)；

其中，

E_a1为所述消噪语音信号经频域转换后获得的第一幅度谱；

E_a2为所述参考噪音信号经频域转换后获得的第二幅度谱。

11.如权利要求8所述语音降噪方法，其特征在于，提供一语音激活检测单元，所述语音激活检测单元连接所述滤波组件；

12.如权利要求11所述语音降噪方法，其特征在于，P_s通过下式计算：

P_{s} {[k]}_{t} = \{\begin{matrix} \min ({| E_{a 1} {[k]}_{t} |}^{2}, {| E_{a 2} {[k]}_{t} |}^{2}), VAD is true \\ \min [\max ({| E_{a 1} {[k]}_{t} |}^{2}, {| E_{a 2} {[k]}_{t} |}^{2}), β {| E_{a 1} {[k]}_{t} |}^{2}], VAD is false \end{matrix};

E_a1为所述消噪语音信号经频域转换后获得的第一幅度谱；

E_a2为所述参考噪音信号经频域转换后获得的第二幅度谱；

β为控制因子，1<β<5。

13.如权利要求6所述语音降噪方法，其特征在于，所述滤波组件提供一第一自适应滤波器，及一第二自适应滤波器；

14.如权利要求13所述语音降噪方法，其特征在于，所述第一抗串扰滤波单元通过下式更新滤波系数g_1,t：

g_{1} {[k]}_{t + 1} = g_{1} {[k]}_{t} + {\hat{g}}_{1} {[k]}_{t}, k = 1,2, . . ., N;

和/或

所述第二抗串扰滤波单元通过下式更新滤波系数g_2,t：

g_{2} {[k]}_{t + 1} = g_{2} {[k]}_{t} + {\hat{g}}_{2} {[k]}_{t}, k = 1,2, . . ., N .

15.如权利要求13所述语音降噪方法，其特征在于，所述第一自适应滤波器通过频域最小均方算法计算所述第一抗串扰滤波单元的滤波系数更新项具体算式如下：

其中，G₁＝G^λ；

λ为大于0的非线性控制因子；

μ为更新步长，且0＜μ＜2；

ε为防止除零错误的微小正数；

·为点乘符号；

上标*为共轭操作；

下标N×N表示矩阵为N行N列；

下标N×(M-N)表示矩阵为N行M-N列；

S_1,t为所述含噪语音信号s₁(t)的M点傅立叶变换；

E_2,t为所述参考噪声信号e₂(t)的M点傅立叶变换；

F^-为反傅立叶变换矩阵；

E[|S_1,t|²]为|S_1,t|²在t时刻的短期数学期望。

16.如权利要求15所述语音降噪方法，其特征在于，S_1,t通过下式计算：

S_1,t＝F[s₁(t-M+1),s₁(t-M+2),…,s₁(t)]^T，

其中，上标T为转置操作；和/或

E_2,t通过下式计算：

E_2,t＝F{[0,0,…,0]_1×N[e₂(t-(M-N)+1),e₂(t-(M-N)+2),…,e₂(t)]}^T，

其中，上标T为转置操作；和/或

E[|S_1,t|²]通过自回归法进行获取，具体算式如下：

E[|S_1,t|²]＝γE[|S_1,t-1|²]+(1-γ)|S_1,t|²,0<γ<1。

17.如权利要求13所述语音降噪方法，其特征在于，所述第二自适应滤波器通过频域最小均方算法计算所述第二抗串扰滤波单元的滤波系数更新项具体算式如下：

其中，G₂＝1–G^λ或G₂＝(1–G)^λ；

λ为大于0的非线性控制因子；

μ为更新步长，且0＜μ＜2；

ε为防止除零错误的微小正数；

·为点乘符号；

上标*为共轭操作；

下标N×N表示矩阵为N行N列；

下标N×(M-N)表示矩阵为N行M-N列；

S_2,t为噪声信号s₂(t)的M点傅立叶变换；

E_1,t为消噪语音信号e₁(t)的M点傅立叶变换；

F^-为反傅立叶变换矩阵；

E[|S_2,t|²]为|S_2,t|²在t时刻的短期数学期望。

18.如权利要求17所述语音降噪方法，其特征在于，S_2,t通过下式计算：

S_2,t＝F[s₂(t-M+1),s₂(t-M+2),…,s₂(t)]^T，

其中，F为傅立叶变换矩阵，上标T为转置操作；和/或

E_1,t通过下式计算：

E_1,t＝F{[0,0,…,0]_1×N[e₁(t-(M-N)+1),e₁(t-(M-N)+2),…,e₁(t)]}^T，

其中，F为傅立叶变换矩阵，上标T为转置操作；和/或

E[|S_2,t|²]通过自回归法进行获取，具体算式如下：

E[|S_2,t|²]＝γE[|S_2,t-1|²]+(1-γ)|S_2,t|²,0<γ<1。

19.如权利要求13所述语音降噪方法，其特征在于，所述第一自适应滤波器通过加窗频域最小均方算法计算所述第一抗串扰滤波单元的滤波系数更新项具体算式如下：

其中，G₁＝G^λ；

λ为大于0的非线性控制因子；

μ为更新步长且0＜μ＜2；

ε为防止除零错误的微小正数；

·为点乘符号；

上标*为共轭操作；

下标N×N表示矩阵为N行N列；

下标N×(M-N)表示矩阵为N行M-N列；

S_w1,t为含噪语音信号s₁(t)的M点窗傅立叶变换；

E_w2,t为参考噪声信号e₂(t)的M点窗傅立叶变换；

F-为反傅立叶变换矩阵；

E[|S_w1,t|²]为|S_w1,t|²在t时刻的短期数学期望。

20.如权利要求19所述语音降噪方法，其特征在于，S_w1,t通过下式计算：

，

E_w2,t通过下式计算：

，

E[|S_w1,t|²]通过自回归法进行获取，具体算式如下：

E[|S_w1,t|²]＝γE[|S_w1,t-1|²]+(1-γ)|S_w1,t|²,0<γ<1。

21.如权利要求13所述语音降噪方法，其特征在于，所述第二自适应滤波器通过加窗频域最小均方算法计算所述第二抗串扰滤波单元的滤波系数更新项具体算式如下：

其中，G₂＝1–G^λ或G₂＝(1–G)^λ；

λ为大于0的非线性控制因子；

μ为更新步长且0＜μ＜2；

ε为防止除零错误的微小正数；

·为点乘符号；

上标*为共轭操作；

下标N×N表示矩阵为N行N列；

下标N×(M-N)表示矩阵为N行M-N列；

S_w2,t为噪声信号s₂(t)的M点窗傅立叶变换；

E_w1,t为消噪语音信号e₁(t)的M点窗傅立叶变换；

F-为反傅立叶变换矩阵；

E[|S_w2,t|²]为|S_w2,t|²在t时刻的短期数学期望。

22.如权利要求21所述语音降噪方法，其特征在于，S_w2,t通过下式计算：

，

E_w1,t通过下式计算：

，

E[|S_w2,t|²]通过自回归法进行获取，具体算式如下：

E[|S_w2,t|²]＝γE[|S_w2,t-1|²]+(1-γ)|S_w2,t|²,0<γ<1。

23.如权利要求20或22所述语音降噪方法，其特征在于，所述窗函数w_adf为矩形窗，或者正弦窗，或者汉宁窗，或者海明窗，或者Tukey窗。

24.如权利要求1所述语音降噪方法，其特征在于，所述第一抗串扰滤波单元包括第一有限冲激响应滤波器，所述第一有限冲激响应滤波器通过下式对所述含噪语音信号进行滤波以获取第一滤波信号：

p_{1} (t) = Σ_{k = 1}^{N} s_{1} (t - k + 1) g_{1} {[k]}_{t}

p_{2} (t) = Σ_{k = 1}^{N} s_{2} (t - k + 1) g_{2} {[k]}_{t}

25.如权利要求24所述语音降噪方法，其特征在于，所述N的取值范围为f_s/100/2<N<0.2f_s，其中f_s为采样频率；或者

当f_s＝8000Hz时N＝256，其中f_s为采样频率。

26.如权利要求24所述语音降噪方法，其特征在于，所述第二抗串扰滤波单元还包括一第一减法器，所述第一减法器用以将所述含噪语音信号减去所述第二滤波信号以获得所述消噪语音信号；和/或

所述第一抗串扰滤波单元还包括一第二减法器，所述第二减法器用以将所述原始噪声信号减去所述第一滤波信号以获得所述参考噪声信号。

27.如权利要求24所述语音降噪方法，其特征在于，所述第一抗串扰滤波单元还包括一第一延迟单元，所述第一延迟单元用以将所述含噪语音信号延迟后提供至所述第一减法器；和/或

所述第二抗串扰滤波单元还包括一第二延迟单元，所述第二延迟单元用以将所述原始噪声信号延迟后提供至所述第二减法器。

28.一种语音采集设备，其特征在于，采用如权利要求1-27中任一所述语音降噪方法。