CN109188362B

CN109188362B - 一种麦克风阵列声源定位信号处理方法

Info

Publication number: CN109188362B
Application number: CN201811019390.1A
Authority: CN
Inventors: 孟晓辉; 理华; 肖灵
Original assignee: Institute of Acoustics CAS
Current assignee: Institute of Acoustics CAS
Priority date: 2018-09-03
Filing date: 2018-09-03
Publication date: 2020-09-08
Anticipated expiration: 2038-09-03
Also published as: CN109188362A

Abstract

本发明提出一种麦克风阵列声源定位方法，包括：步骤1)在测量空间内将估计声源位置划分为Q个网格点，每个网格点三维坐标为

对M个麦克风信号进行采样，计算网格点

到两个不同麦克风信号的时延差；步骤2)采集M个麦克风通道的当前帧数据，计算麦克风对的时延值；基于该时延值和步骤1)的时延差计算第q个网格点的加权值w_q；然后计算第q个网格点的SRP‑PHAT值p_q，在Q个网格点中找到w_qp_q的最大值对应的网格点

从而得出该帧数据对应估计声源位置的网格点坐标

本发明能够解决现有技术中SRP‑PHAT方法的定位精度受环境噪声和混响条件的影响严重、急剧下降的问题。

Description

一种麦克风阵列声源定位信号处理方法

技术领域

本发明属于音频信号处理和阵列信号处理技术领域，具体而言，涉及一种麦克风阵列声源定位信号处理方法。

背景技术

目前麦克风阵列定位算法大致分为三大类，即基于到达时间差(TDOA)定位、可控响应功率(SRP)和基于高分辨率谱估计的算法。基于高分辨率谱估计的算法最初被应用于窄带源的定位，后来逐渐被众多学者变换引用到宽带源定位问题中。拓展到宽带信号估计时，需要在频域将信号频率划分为多个子带，或者进行频率聚焦以转化为窄带信号处理的方式。该类算法定位分辨率很高，但由于要进行宽带到窄带的转化，使得算法运算量大大增加，实际中更是因为声源个数未知以及噪声环境不满足理想的高斯白噪声条件而性能急剧下降。

基于到达时间差(TDOA)定位算法的核心在于对声传播时延的准确估计，一般通过对麦克风间信号做互相关或者广义互相关处理得到。最后通过对于几何算法的应用将声源的位置加以确定。基于到达时间差的定向算法运算量相对较小，实时性较好，硬件成本较低，因而倍受关注，成为声源定向中广泛采用的方法。该方法中时延估计值是否精确决定了声源定位是否精确，环境噪声与室内混响会对其准确度产生一定的影响。

SRP方法将空间划分成一个一个网格，每个网格都有一个假设的声源，可以算出每个假想声源到一对指定位置麦克风的时延差，将所有麦克风对在其时延差对应的互相关值求和，就可以得到响应功率，使得响应功率取得最大值对应的假想声源位置即为真实声源位置的估计值。联合可控响应功率和相位变换的声源定位方法(SRP-PHAT)将可控响应功率方法固有的鲁棒性、短时分析特征与时延估计中相位变换方法对信号周围环境的不敏感性相结合，使声源定位***具有一定的抗噪性、抗混响性。但是，SRP-PHAT方法在恶劣环境下(噪声干扰大、混响影响严重)性能急剧下降。

发明内容

本发明的目的在于解决现有技术中SRP-PHAT方法的定位精度受环境噪声和混响条件的影响严重、急剧下降的问题。

为实现上述目的，本发明公开一种麦克风阵列声源定位信号处理方法，包括：

步骤1)在测量空间内将估计声源位置划分为Q个网格点，每个网格点三维坐标为

对M个麦克风信号进行采样，计算网格点

到两个不同麦克风信号的时延差；

步骤2)采集M个麦克风通道的当前帧数据，计算麦克风对的时延值；基于该时延值和步骤1)的时延差计算第q个网格点的加权值w_q；然后计算第q个网格点的SRP-PHAT值p_q，在Q个网格点中找到w_qp_q的最大值对应的网格点

从而得出该帧数据对应估计声源位置的网格点坐标

作为上述方法的一种改进，所述步骤1)包括：

步骤1-1)设M个麦克风组成的麦克风阵列分布在三维空间中，各麦克风坐标为

步骤1-2)在测量空间内将声源所有可能位置划分为Q个网格点，其三维坐标为

步骤1-3)每个麦克风对应一个通道，设信号的采样频率为f_s，每帧每通道采样长度为L，每通道采样信号为x_i1(n),i1＝1,…,M,n＝1,…,L；傅里叶变换点数等于2L-1；

步骤1-4)计算网格点

到第i1和第i2个通道的时延差Δτ_i1i2(q)：

其中，i2＝1,…,M,i2≠i1，c为声速。

作为上述方法的一种改进，所述步骤2)包括：

步骤2-1)分别计算每个麦克风通道信号x_i1(n),i1＝1,…,M,n＝1,…,L的2L-1点快速傅里叶变换，得到X_i1(k),i1＝1,…,M,k＝1,…,2L-1；

步骤2-2)计算第i1和第i2个麦克风通道的相位变换PHAT互相关值R_i1i2(l)：

其中，X_i1(k)是第i1个通道接收信号x_i1(n),i1＝1,…,M,n＝1,…,L的频域表示，快速傅里叶变换FFT计算的点数为2L-1；X_i2(k)是第i2个通道接收信号x_i2(n),i2＝1,…,M,n＝1,…,L的频域表示，

是X_i2(k)的共轭；|X_i1(k)|是X_i1(k)的幅度；l＝1,…,L；

步骤2-3)根据R_i1i2(l)计算第i1和第i2个麦克风通道之间的时延值

步骤2-4)计算Δτ_i1i2(q)与

间的标准差得到每个网格点的加权值w_q：

步骤2-5)计算每个网格点的可控响应功率-相位变换SRP-PHAT值p_q；

步骤2-6)计算第q个网格点的加权可控响应功率-相位变换SRP-PHAT值w_qp_q，在Q个w_qp_q找出其中的最大值，根据w_qp_q的最大值得到对应的网格点

步骤2-7)根据w_qp_q最大值对应的网格点

得到该帧数据对应的声源位置

本发明的优势在于：

1、本发明公开一种麦克风阵列声源定位信号处理方法，采用加权SRP-PHAT声源定位信号处理技术方案，用PHAT互相关值估计的时延与搜索点对应的正确时延值间的标准差的倒数作为SRP-PHAT值的加权值求空间网格点的响应功率，采用本方法，可以进一步提高声源定位的准确性；

2本发明的声源位置与麦克风的相对时延值和PHAT互相关方法计算得到的时延值更相近，响应功率值更大；

3、本发明能够解决现有技术中SRP-PHAT方法的定位精度受环境噪声和混响条件的影响严重、急剧下降的问题。

附图说明

图1为本发明信号处理方法流程图。

具体实施方式

下面结合附图和具体实施例对本发明进行详细的说明。

设M个麦克风组成的麦克风阵列分布在三维空间中，各麦克风坐标为

依据***对估计精度要求，声源所有可能位置可简化为测量空间内三维网格的格点。假设共划分为Q个网格点，其坐标为

设信号的采样速率为f_s，每帧每通道采样长度为L。

本发明公开的加权SRP-PHAT声源定位方法通过搜索网格中的加权SRP-PHAT值最大的位置，确定声源位置的估计值

其中，p_q为搜索点

的SRP-PHAT值，其计算公式如下：

其中，PHAT互相关值R_i1i2(Δτ_i1i2(q))的计算公式如下：

其中，X_i1(k)是第i1个通道接收信号x_i1(n),i1＝1,…,M,n＝1,…,L的频域表示，FFT计算的点数为2L-1；X_i2(k)是第i2个通道接收信号x_i2(n),i2＝1,…,M,n＝1,…,L的频域表示，

是X_i2(k)的共轭；|X_i1(k)|是X_i1(k)的幅度；l＝1,…,L；

其中，Δτ_i1i2(q)是网格点

到第i1和第i2个通道的时延差，其计算公式为：

其中，i2＝1,…,M,i2≠i1，c为声速。

加权值w_q的计算公式如下：

其中

为用R_i1i2(τ)最大值位置估计出来的时延值：

实施例

每个麦克风对应一个通道，设信号的采样频率为f_s，每帧每通道采样长度为L，记为x_i1(n),i1＝1,…,M,n＝1,…,L。傅里叶变换点数等于2L-1。

如图1所示，本发明公开的信号处理方法具体步骤如下：

步骤1)根据麦克风位置坐标和搜索网格点坐标，用公式(4)计算每个网格点到麦克风对位置的时延差，存储备用。这一步骤只执行一次；

步骤2)处理每帧数据，得到该帧数据对声源位置估计。

每帧数据处理的具体步骤如下：

步骤2-1)分别计算每个通道信号x_i1(n),i1＝1,…,M,n＝1,…,L的2L-1点快速傅里叶变换(FFT)，得到X_i1(k),i1＝1,…,M,k＝1,…,2L-1；

步骤2-2)根据公式(3)计算所有通道麦克风对信号的PHAT互相关值R_i1i2(l)；

步骤2-3)根据公式(6)用PHAT互相关值R_i1i2(τ)计算所有通道对间的延时估计值

步骤2-4)根据公式(5)计算Δτ_i1i2(q)与

间的标准差得到每个网格点的加权值w_q；

步骤2-5)根据公式(2)计算每个网格点的SRP-PHAT值p_q；

步骤2-6)根据公式(1)计算所有网格点的加权SRP-PHAT值p_q，找出其中最大值对应的网格点

步骤2-7)根据w_qp_q最大值对应的网格点

得到该帧数据对应的声源位置

本发明公开的一种加权SRP-PHAT麦克风阵列声源定位信号处理方法，用PHAT互相关值估计的时延与搜索点对应的正确时延值间的标准差的倒数作为SRP-PHAT值的加权值求空间网格点的响应功率。其指导思想是如果网格点是正确的声源位置，则其与麦克风对的相对时延值应该和PHAT互相关方法计算得到的时延值更相近，进而使该点的响应功率值更大。采用本方法，可以进一步提高声源定位的准确性。

最后所应说明的是，以上实施例仅用以说明本发明的技术方案而非限制。尽管参照实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，对本发明的技术方案进行修改或者等同替换，都不脱离本发明技术方案的精神和范围，其均应涵盖在本发明的权利要求范围当中。