CN114373475A

CN114373475A - 一种基于麦克风阵列的语音降噪方法、装置以及存储介质

Info

Publication number: CN114373475A
Application number: CN202111621218.5A
Authority: CN
Inventors: 王向辉; 高朴; 韩冬; 陈捷; 王瑞琪; 王姣; 李梅
Original assignee: Shaanxi University of Science and Technology
Current assignee: Shaanxi University of Science and Technology
Priority date: 2021-12-28
Filing date: 2021-12-28
Publication date: 2022-04-19

Abstract

本申请公开了一种基于麦克风阵列的语音降噪方法，解决了现有技术中求解滤波器的复杂度会随着滤波器长度的增大而迅速增大，并且对语音信号和噪声统计特性变化的跟踪能力下降的问题，该方法包括：获取带噪语音信号；对带噪语音信号进行预处理，确定频域带噪语音信号；估计频域带噪语音信号和噪声信号的统计特性；将麦克风阵列分为多个子阵列，分别估计出多个子滤波器，并确定频域降噪滤波器；根据频域降噪滤波器对频域带噪语音信号进行降噪处理，并转换为时域降噪语音信号，使得在滤波器的求解过程中所需的信号协方差矩阵维数更小，从而显著降低了求解语音降噪滤波器的复杂度，并且提高滤波器对语音信号和噪声统计特性变化的跟踪能力。

Description

一种基于麦克风阵列的语音降噪方法、装置以及存储介质

技术领域

本申请涉及麦克风阵列技术领域，尤其涉及一种基于麦克风阵列的语音降噪方法、装置以及存储介质。

背景技术

语音降噪在智能语音、人机交互、远程会议、助听设备、车载、虚拟现实、临境通讯和军用超高背景噪声的语音通信等***中都起到举足轻重的作用，其性能的好坏直接影响着语音交互的体验。

早期的语音交互***通常只装备一个麦克风，对应的降噪方法则为单道语音降噪。单通道语音降噪方法具有实现简单、运算效率高等优点，能取得一定的效果，但也有较大的局限性。研究表明，在一定条件下单通道降噪一定会引入语音失真，且信噪比提升越大，引入的语音失真也越大。相比之下，多通道语音降噪方法更有潜力在少引入或者不引入语音失真的前提下显著提升信噪比。经典的多通道语音降噪方法包括多通道维纳滤波，多通道折中滤波，最小方差无失真响应滤波、线性约束最小方差滤波、以及广义旁瓣对消等。近年来，国内外研究人员提出了基于深度学习的语音降噪方法，可取得较好的性能，但由于其泛化能力通常较弱，当前还难以大范围地应用在实际***中。

为取得更好的语音降噪性能，通常需要装备更多的麦克风，以获取更加丰富的空时频信息。但这通常也意味着需要设计更长的滤波器。而应用更长的滤波器会带来以下的两个问题。第一，求解滤波器的复杂度会随着滤波器长度的增大而迅速增大；第二，在滤波器的求解过程中所需的信号协方差矩阵的维数会更大，因此需要更多的观测样本来估计信号的协方差矩阵，用以计算滤波器的系数，导致对语音信号和噪声统计特性变化的跟踪能力下降，无法更好地处理实际中常见的非平稳噪声。

发明内容

本申请实施例通过提供一种基于麦克风阵列的语音降噪方法，解决了在现有技术中当滤波器长度较长时所导致的两个问题，即，第一，求解滤波器的复杂度会随着滤波器长度的增大而迅速增大；第二，在滤波器的求解过程中所需的信号协方差矩阵的维数会更大，因此需要更多的观测样本来估计信号的协方差矩阵，用以计算滤波器的系数，导致对语音信号和噪声统计特性变化的跟踪能力下降，无法更好地处理实际中常见的非平稳噪声。本申请实施例显著降低了求解滤波器的复杂度，且在滤波器的求解过程中所需的信号协方差矩阵维数更小，因此可以用更少的信号观测样本来估计其协方差矩阵，从而提高滤波器对语音信号和噪声统计特性变化的跟踪能力。

第一方面，本发明实施例提供了一种基于麦克风阵列的语音降噪方法，该方法包括：

获取带噪语音信号；

对所述带噪语音信号进行预处理，确定频域带噪语音信号；

估计所述频域带噪语音信号的统计特性，估计噪声信号的统计特性；

将麦克风阵列分为多个子阵列，分别估计出多个子滤波器；

根据所述多个子滤波器，确定频域降噪滤波器；

根据所述频域降噪滤波器对所述频域带噪语音信号进行降噪处理，确定频域降噪语音信号；

将所述频域降噪语音信号转换为时域降噪语音信号。

结合第一方面，在一种可能的实现方式中，所述对所述带噪语音信号进行预处理，包括：对所述带噪语音信号进行分帧、加窗后进行快速傅里叶变换。

结合第一方面，在一种可能的实现方式中，所述估计所述频域带噪语音信号的统计特性，包括根据时间平滑估计方式进行带噪语音信号统计特性的估计。

结合第一方面，在一种可能的实现方式中，所述估计噪声信号的统计特性，包括根据现有噪声估计算法估计噪声信号的统计特性。

结合第一方面，在一种可能的实现方式中，所述将麦克风阵列分为多个子阵列，分别估计出多个子滤波器，包括利用降噪滤波器的低秩结构迭代估计出多个子滤波器。

第二方面，本发明实施例提供了一种基于麦克风阵列的语音降噪装置，其特征在于，包括

信号获取模块，用于获取带噪语音信号；

信号预处理模块，用于对所述带噪语音信号进行预处理，确定频域带噪语音信号；

统计特性估计模块，用于估计所述频域带噪语音信号的统计特性，估计噪声信号的统计特性；

子滤波器确定模块，用于将麦克风阵列分为多个子阵列，分别估计出多个子滤波器；

频域降噪滤波器确定模块，用于根据所述多个子滤波器，确定频域降噪滤波器；

降噪模块，用于根据所述频域降噪滤波器对所述频域带噪语音信号进行降噪处理，确定频域降噪语音信号；

时域降噪语音信号确定模块，用于将所述频域降噪语音信号转换为时域降噪语音信号。

结合第二方面，在一种可能的实现方式中，所述信号预处理模块，包括：对所述带噪语音信号进行分帧、加窗后进行快速傅里叶变换。

结合第二方面，在一种可能的实现方式中，所述统计特性估计模块，包括：包括根据时间平滑估计方式进行带噪语音信号统计特性的估计。

结合第二方面，在一种可能的实现方式中，所述统计特性估计模块，包括：包括根据现有噪声估计算法估计噪声信号的统计特性。

结合第二方面，在一种可能的实现方式中，所述频域降噪滤波器确定模块，包括：利用降噪滤波器的低秩结构迭代估计出多个子滤波器。

第三方面，本发明实施例提供了一种基于麦克风阵列的语音降噪服务器，包括存储器和处理器；

所述存储器用于存储计算机可执行指令；

所述处理器用于执行所述计算机可执行指令，以实现如第一方面所述的方法。

第四方面，本发明实施例提供了一种计算机可读存储介质，所述计算机可读存储介质存储有可执行指令，计算机执行所述可执行指令时能够实现如第一方面任一项所述的方法。

本发明实施例中提供的一个或多个技术方案，至少具有如下技术效果或优点：

本发明实施例采用了一种基于麦克风阵列的语音降噪方法，该方法包括，获取带噪语音信号；对带噪语音信号进行预处理，确定频域带噪语音信号；估计频域带噪语音信号的统计特性，估计噪声信号的统计特性；将麦克风阵列分为多个子阵列，分别估计出多个子滤波器；根据多个子滤波器，确定频域降噪滤波器；根据频域降噪滤波器对频域带噪语音信号进行降噪处理，确定频域降噪语音信号；将频域降噪语音信号转换为时域降噪语音信号。有效解决了在现有技术中当滤波器长度较长时所导致的两个问题，即，第一，求解滤波器的复杂度会随着滤波器长度的增大而迅速增大；第二，在滤波器的求解过程中所需的信号协方差矩阵的维数会更大，因此需要更多的观测样本来估计信号的协方差矩阵，用以计算滤波器的系数，导致对语音信号和噪声统计特性变化的跟踪能力下降，无法更好地处理实际中常见的非平稳噪声。本发明实施例显著降低了求解滤波器的复杂度，且在滤波器的求解过程中所需的信号协方差矩阵维数更小，因此可以用更少的信号观测样本来估计其协方差矩阵，从而提高滤波器对语音信号和噪声统计特性变化的跟踪能力。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对本发明实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的基于麦克风阵列的语音降噪方法的步骤流程图；

图2为本申请实施例提供的基于麦克风阵列的语音降噪的装置的示意图；

图3为本申请实施例提供的基于麦克风阵列的语音降噪的服务器示意图；

图4为本申请实施例提供的方法的复杂度和传统方法复杂度的对比图；

图5为本申请实施例提供的方法的均方误差随迭代次数的变化的图像；

图6为本申请实施例提供的当噪声统计特性突然发生变化时，本申请实施例提供的方法和传统方法的均方误差随时间变化的对比图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。显然，所描述的实施例是本发明的一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在早期的语音交互***中通常只配备一个麦克风，对应的语音降噪方法为单通道语音降噪。单通道语音降噪方法具有实现简单、运算效率高等优点，能取得一定的效果，但也具有很大的局限性。研究表明，在一定的条件下单通道降噪一定会引入语音失真，且信噪比提升越大，引入的语音失真也就越大。相比之下，多通道语音降噪方法更具有潜力，在少引入或者不引入语音失真的前提下，显著提升信噪比。多通道语音降噪通常需要装备更多的麦克风，以获取更加丰富的空时频信息。但相应的会导致两个问题，第一，求解滤波器的复杂度会随着滤波器长度的增加而迅速的增大；第二，在滤波器的求解过程中所需的信号协方差矩阵的维数更大，因此需要更多的测样本来估计信号的协方差矩阵，用以计算滤波器的系数，导致其对语音信号和噪声统计变化的跟踪能力下降，无法更好地处理在实际中常见的非平稳噪声。

本发明实施例提供了一种基于麦克风阵列的语音降噪方法，如图1所示，该方法包括以下步骤，

步骤S101，获取带噪语音信号。

步骤S102，对带噪语音信号进行预处理，确定频域带噪语音信号。

步骤S103，估计频域带噪语音信号的统计特性，估计噪声信号的统计特性。

步骤S104，将麦克风阵列分为多个子阵列，分别估计出多个子滤波器。

步骤S105，根据多个子滤波器，确定频域降噪滤波器。

步骤S106，根据频域降噪滤波器对频域带噪语音信号进行降噪处理，确定频域降噪语音信号。

步骤S107，将频域降噪语音信号转换为时域降噪语音信号。

综合上述的方法步骤，构建一个更加合理的滤波器，避免了像现有的多通道语音降噪方法一样整体计算一个很长的滤波器，更短的滤波器意味着少的滤波器系数。因此，相校于现有的方法，本申请提供的方法显著降低了求解语音降噪滤波器的复杂度，且在滤波器的求解过程中所需的信号协方差矩阵维数小，所以可以用更少的信号观测样本来估计其协方差矩阵，从而可提高滤波器对语音信号和噪声统计特性变化的跟踪能力。

在本申请的一个具体的实施例中，我们将时域带噪语音信号表示为，

y_m(t)＝x_m(t)+v_m(t),m＝1,2,...,M (1)

其中，y_m(t)表示第m个麦克风接收到的带噪语音信号；x_m(t)表示第m个麦克风接收到的纯净语音信号；v_m(t)表示第m个麦克风接收到的背景噪声信号； t表示离散时间点；M表示麦克风的个数。

在本申请中的一个具体的实施例中，假设所有的信号都是零均值、带宽信号，同时，假设语音信号和噪声信号不相关。语音降噪地目的为，通过带噪语音信号恢复出纯净语音信号。为不失一般性，本申请中，将麦克风1设置为参考麦克风，即设x₁(t)为期望信号(需要恢复的信号)。

对带噪语音信号进行预处理，包括：对带噪语音信号进行分帧、加窗后进行快速傅里叶变换，得到频域带噪语音信号，表示为：

其中，w表示窗函数；T表示窗函数的长度(也是语音信号帧的长度)；L 表示两个相邻帧之间的步进长度；零均值随机变量Y_m(k,n),X_m(k,n),V_m(k,n)分别为 y_m(t),x_m(t),v_m(t),在第n帧第k个频带的傅里叶变换值，其中k∈{0,1,...,K-1}。

为方便起见，将信号模型用向量形式表示为

y(k,n)＝x(k,n)+v(k,n) (3)

其中，

y(k,n)＝[Y₁(k,n),Y₂(k,n),...,Y_M(k,n)]^T (4)

x(k,n)和x(k,n)的定义与y(k,n)类似，上标T为转置符。

在传统方法中，通常需要设计一个长为M的滤波器h(k,n)来实现语音降噪，即：

Z(k,n)＝h^H(k,n)y(k,n) (5)

其中

h(k,n)＝[H₁(k,n),H₂(k,n),...,H_M(k,n)]^T (6)

Z(k,n)为X₁(k,n)的估计值。但当M较大时，则会导致在背景技术中所述的两个问题。

估计频域带噪语音信号的统计特性，包括根据时间平滑方式进行带噪语音信号统计特性的估计。估计噪声信号的统计特性，包括根据现有噪声估计算法估计噪声信号的统计特性。

由于语音信号和噪声不相关，所以Z(k,n)的方差可表示为：

Φ_Z(k,n)＝h^H(k,n)Φ_y(k,n)h(k,n)

＝h^H(k,n)Φ_x(k,n)h(k,n)+h^H(k,n)Φ_v(k,n)h(k,n) (7)

其中，Φ_a(k,n)＝E[a(k,n)a^H(k,n)],a(k,n)∈{y(k,n),x(k,n),v(k,n)}。通常，我们可以应用时间平滑的方式估计Φ_y(k,n)，而Φ_v(k,n)则可以根据现有文献中的噪声估计算法得到。得到Φ_y(k,n)及Φ_v(k,n)的估计值后，则可通过Φ_y(k,n)-Φ_v(k,n)得到 Φ_x(k,n)。

为导出本发明中的方法，将麦克风阵列分为M₂个子阵，每个子阵中有M₁个麦克风，即M＝M₁*M₂，第1至M₁个麦克风组成第一个子阵，第M₁+1至2M₁个麦克风组成第二个子阵，以此类推。在本发明中，我们假设M₁≤M₂。同样，可以将滤波器h(k,n)按上述方式分解，即

其中，

此时，可以将子滤波器h_m(k,n),m＝1,2,...,M₂组成一个维数为M₁×M₂的矩阵，即：

H(k,n)＝[h₁(k,n),h₂(k,n),...,h_M2(k,n)] (10)

需要注意的是，h(k,n)＝vec[H(k,n)]，vec(·)表示矩阵的向量化操作符。为简便起见，在后面不会引起歧义的地方将去掉符号k和n。对矩阵H进行奇异值分解(SingularValue Decomposition，SVD)，可将H分解为:

其中，

为一个M₂×M₂的矩阵，

为一个M₂×M₂的矩阵。H₁和H₂为两个正交矩阵，∑为一个M₁×M₂的对角矩阵，其对角线元素为非负实数。在本申请中，将它们按从大到小的顺序排列，即

上标H为共轭转置符。

各个通道接收到的带噪语音信号强相关，所以子滤波器h_m(k,n),m＝1,2,...,M₂之间通常也是是强相关的，导致矩阵H通常不是行满秩矩阵。所以矩阵H通常可以用前P个最大的奇异值及对应的奇异向量进行较好地近似，即：

其中，

需要注意的是，由

引起的歧义对矩阵H没有影响。相应的，滤波器h可以近似表示为:

需要注意的是，当P＝M₁时,h_P＝h。

应用关系式：

可将h_P写为：

其中，

大小为M×M₂，

大小为M×M₁。此时，滤波器的输出值Z(k,n)可写为：

其中，

H_σ1,P＝[H_σ1,1 H_σ1,2...H_σ1,P]^H (24)

H_σ2,P＝[H_σ2,1 H_σ2,2...H_σ2,P]^H (25)

h _σ1,P，h _σ2,P，y_σ1,P(t)，y_σ2,P(t),H_σ1,P和H_σ2,P的大小分别是M₁P×1，M₂P×1，M₂P×1，M₁P×1，M₂P×M，M₁P×M。可以看出，当参数P较小时，子滤波器h _σ1,P和h _σ2,P的长度远小于滤波器h的长度。

期望信号X₁和其估计值Z的均方误差(mean square error,MSE)为

其中，

E(·)表示数学期望，

表示取实部，上标^*表示复共轭。

为导出本发明中的滤波器，将MSE写为如下形式：

其中，

需要注意的是，当参数P较小时，矩阵Φ_yσ1,p(M₂P×M₂P),和Φ_yσ2,p(M₁P×M₁P)的维数远远小于矩阵Φ_y(M×M)的维数。

由此可带来两个优势：

1)相较于求解基于Φ_y的逆矩阵的传统多通道语音降噪滤波器，求解基于 Φ_yσ1,p和Φ_yσ2,p的逆矩阵的子滤波器h _σ1，P和h _σ2，P，所需的复杂度显著降低；

2)相较于估计矩阵Φ_y，可用更少的信号观测样本估计矩阵Φ_yσ1,p和 Φ_yσ2,p，使得子滤波器h _σ1，P,和h _σ2，P可更加快速地跟踪信号统计特性的变化。

对近似滤波器进行运算，包括：采用迭代求解的方式，得到维纳滤波器。

基于式(27)和(28)，很难导出子滤波器h _σ1，P和h _σ2，P的闭式解。所以，本发明中采用迭代求解的方式。为此，在求解其中一个子滤波器时，假设另一个子滤波器固定，即

将子滤波器h _σ1，P按如下方式初始化：

其中，

x_p的定义与y_p类似。可以看出，h_σ1,W,p为第p个子矩阵的维也纳滤波器，长为M₁。

应用

构建

并将其带入式(29)和(30)，可得

将式(38)和(39)带入至式(34)中可得：

将式(40)对

求导并将结果置零，可得子滤波器

的维纳解:

应用

构建

并将其带入至式(31)和(32)，可得：

将

和

带入式(33)中得：

基于(44)，可得子滤波器

的维纳解：

按上述方式，迭代至第n步时，我们有：

其中，

此时，可以得到本申请中的迭代维纳滤波器：

本发明实施例提供了一种基于麦克风阵列的语音降噪装置，如图2所示，包括信号获取模块201，信号预处理模块202，统计特性估计模块203，子滤波器确定模块204，频域降噪滤波器确定模块205，降噪模块206，时域降噪语音信号确定模块207。信号获取模块201，用于获取带噪语音信号；信号预处理模块202，用于对所述带噪语音信号进行预处理，确定频域带噪语音信号；统计特性估计模块203，用于估计所述频域带噪语音信号的统计特性及噪声信号的统计特性；子滤波器确定模块204，用于将麦克风阵列分为多个子阵列，分别估计出多个子滤波器；频域降噪滤波器确定模块205，用于根据所述多个子滤波器，确定频域降噪滤波器；降噪模块206，用于根据所述频域降噪滤波器对所述频域带噪语音信号进行降噪处理，确定频域降噪语音信号；时域降噪语音信号确定模块207，用于将所述频域降噪语音信号转换为时域降噪语音信号。

图4为本申请提供的方法的复杂度与传统方法复杂度的对比，图5为本申请提供的方法的均方误差随迭代次数的变化，图6为噪声统计特性突然发生变化时，本申请所提方法及传统方法的均方误差随时间的变化图。即本申请提供的方法有效降低了复杂度，提高了滤波器对语音信号和噪声统计特性变化的跟踪能力。

本发明实施例提供了一种基于麦克风阵列的语音降噪的服务器，如图3所示，包括存储器301和处理器302；存储器301用于存储计算机可执行指令；处理器302用于执行计算机可执行指令。

本发明实施例提供了一种计算机可读存储介质，计算机可读存储介质存储有可执行指令，计算机执行可执行指令时能够。

上述存储介质包括但不限于随机存取存储器(英文：Random Access Memory；简称：RAM)、只读存储器(英文：Read-Only Memory；简称：ROM)、缓存(英文：Cache)、硬盘(英文：Hard Disk Drive；简称：HDD)或者存储卡(英文：Memory Card)。所述存储器可以用于存储计算机程序指令。

虽然本申请提供了如实施例或流程图所述的方法操作步骤，但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。本实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式，不代表唯一的执行顺序。在实际中的装置或客户端产品执行时，可以按照本实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。

上述实施例阐明的装置或模块，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。为了描述的方便，描述以上装置时以功能分为各种模块分别描述。在实施本申请时可以把各模块的功能在同一个或多个软件和/或硬件中实现。当然，也可以将实现某功能的模块由多个子模块或子单元组合实现。

本申请中所述的方法、装置或模块可以以计算机可读程序代码方式实现控制器按任何适当的方式实现，例如，控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(英文：Application Specific Integrated Circuit；简称：ASIC)、可编程逻辑控制器和嵌入微控制器的形式，控制器的例子包括但不限于以下微控制器：ARC625D、Atmel AT91SAM、 Microchip PIC18F26K20以及Silicone Labs C8051F320，存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道，除了以纯计算机可读程序代码方式实现控制器以外，完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件，而对其内部包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至，可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

本申请所述装置中的部分模块可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构、类等。也可以在分布式计算环境中实践本申请，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

通过以上的实施方式的描述可知，本领域的技术人员可以清楚地了解到本申请可借助软件加必需的硬件的方式来实现。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，也可以通过数据迁移的实施过程中体现出来。该计算机软件产品可以存储在存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，移动终端，服务器，或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。

本说明书中的各个实施方式采用递进的方式描述，各个实施方式之间相同或相似的部分互相参见即可，每个实施方式重点说明的都是与其他实施方式的不同之处。本申请的全部或者部分可用于众多通用或专用的计算机***环境或配置中。例如：个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、移动通信终端、多处理器***、基于微处理器的***、可编程的电子设备、网络PC、小型计算机、大型计算机、包括以上任何***或设备的分布式计算环境等等。

以上实施例仅用以说明本申请的技术方案，而非对本申请限制；尽管参照前述实施例对本申请进行了详细的说明，本领域普通技术人员应当理解：其依然可以对前述实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请技术方案的范围。

Claims

1.一种基于麦克风阵列的语音降噪方法，其特征在于，包括

获取带噪语音信号；

对所述带噪语音信号进行预处理，确定频域带噪语音信号；

将麦克风阵列分为多个子阵列，分别估计出多个子滤波器；

根据所述多个子滤波器，确定频域降噪滤波器；

将所述频域降噪语音信号转换为时域降噪语音信号。

2.根据权利要求1所述的方法，其特征在于，所述对所述带噪语音信号进行预处理，包括：对所述带噪语音信号进行分帧、加窗后进行快速傅里叶变换。

3.根据权利要求1所述的方法，其特征在于，所述估计所述频域带噪语音信号的统计特性，包括根据时间平滑估计方式进行带噪语音信号统计特性的估计。

4.根据权利要求1所述的方法，其特征在于，所述估计噪声信号的统计特性，包括根据现有噪声估计算法估计噪声信号的统计特性。

5.根据权利要求1所述的方法，其特征在于，所述将麦克风阵列分为多个子阵列，分别估计出多个子滤波器，包括利用降噪滤波器的低秩结构迭代估计出多个子滤波器。

6.一种基于麦克风阵列的语音降噪装置，其特征在于，包括

信号获取模块，用于获取带噪语音信号；

7.一种基于麦克风阵列的语音降噪服务器，其特征在于，包括存储器和处理器；

所述存储器用于存储计算机可执行指令；

所述处理器用于执行所述计算机可执行指令，以实现权利要求1-5任一项所述的方法。

8.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有可执行指令，计算机执行所述可执行指令时能够实现如权利要求1-5任一项所述的方法。