CN109188362B - 一种麦克风阵列声源定位信号处理方法 - Google Patents
一种麦克风阵列声源定位信号处理方法 Download PDFInfo
- Publication number
- CN109188362B CN109188362B CN201811019390.1A CN201811019390A CN109188362B CN 109188362 B CN109188362 B CN 109188362B CN 201811019390 A CN201811019390 A CN 201811019390A CN 109188362 B CN109188362 B CN 109188362B
- Authority
- CN
- China
- Prior art keywords
- grid point
- microphone
- sound source
- value
- calculating
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000003672 processing method Methods 0.000 title description 8
- 238000000034 method Methods 0.000 claims abstract description 21
- 238000005070 sampling Methods 0.000 claims abstract description 12
- 238000005259 measurement Methods 0.000 claims abstract description 7
- 230000004807 localization Effects 0.000 claims description 9
- 230000009466 transformation Effects 0.000 claims description 8
- 230000021615 conjugation Effects 0.000 claims description 3
- 230000007613 environmental effect Effects 0.000 abstract description 4
- 238000004422 calculation algorithm Methods 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000004576 sand Substances 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S5/00—Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
- G01S5/18—Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
- G01S5/22—Position of source determined by co-ordinating a plurality of position lines defined by path-difference measurements
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Circuit For Audible Band Transducer (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Abstract
Description
技术领域
本发明属于音频信号处理和阵列信号处理技术领域,具体而言,涉及一种麦克风阵列声源定位信号处理方法。
背景技术
目前麦克风阵列定位算法大致分为三大类,即基于到达时间差(TDOA)定位、可控响应功率(SRP)和基于高分辨率谱估计的算法。基于高分辨率谱估计的算法最初被应用于窄带源的定位,后来逐渐被众多学者变换引用到宽带源定位问题中。拓展到宽带信号估计时,需要在频域将信号频率划分为多个子带,或者进行频率聚焦以转化为窄带信号处理的方式。该类算法定位分辨率很高,但由于要进行宽带到窄带的转化,使得算法运算量大大增加,实际中更是因为声源个数未知以及噪声环境不满足理想的高斯白噪声条件而性能急剧下降。
基于到达时间差(TDOA)定位算法的核心在于对声传播时延的准确估计,一般通过对麦克风间信号做互相关或者广义互相关处理得到。最后通过对于几何算法的应用将声源的位置加以确定。基于到达时间差的定向算法运算量相对较小,实时性较好,硬件成本较低,因而倍受关注,成为声源定向中广泛采用的方法。该方法中时延估计值是否精确决定了声源定位是否精确,环境噪声与室内混响会对其准确度产生一定的影响。
SRP方法将空间划分成一个一个网格,每个网格都有一个假设的声源,可以算出每个假想声源到一对指定位置麦克风的时延差,将所有麦克风对在其时延差对应的互相关值求和,就可以得到响应功率,使得响应功率取得最大值对应的假想声源位置即为真实声源位置的估计值。联合可控响应功率和相位变换的声源定位方法(SRP-PHAT)将可控响应功率方法固有的鲁棒性、短时分析特征与时延估计中相位变换方法对信号周围环境的不敏感性相结合,使声源定位***具有一定的抗噪性、抗混响性。但是,SRP-PHAT方法在恶劣环境下(噪声干扰大、混响影响严重)性能急剧下降。
发明内容
本发明的目的在于解决现有技术中SRP-PHAT方法的定位精度受环境噪声和混响条件的影响严重、急剧下降的问题。
为实现上述目的,本发明公开一种麦克风阵列声源定位信号处理方法,包括:
步骤2)采集M个麦克风通道的当前帧数据,计算麦克风对的时延值;基于该时延值和步骤1)的时延差计算第q个网格点的加权值wq;然后计算第q个网格点的SRP-PHAT值pq,在Q个网格点中找到wqpq的最大值对应的网格点从而得出该帧数据对应估计声源位置的网格点坐标
作为上述方法的一种改进,所述步骤1)包括:
步骤1-3)每个麦克风对应一个通道,设信号的采样频率为fs,每帧每通道采样长度为L,每通道采样信号为xi1(n),i1=1,…,M,n=1,…,L;傅里叶变换点数等于2L-1;
其中,i2=1,…,M,i2≠i1,c为声速。
作为上述方法的一种改进,所述步骤2)包括:
步骤2-1)分别计算每个麦克风通道信号xi1(n),i1=1,…,M,n=1,…,L的2L-1点快速傅里叶变换,得到Xi1(k),i1=1,…,M,k=1,…,2L-1;
步骤2-2)计算第i1和第i2个麦克风通道的相位变换PHAT互相关值Ri1i2(l):
其中,Xi1(k)是第i1个通道接收信号xi1(n),i1=1,…,M,n=1,…,L的频域表示,快速傅里叶变换FFT计算的点数为2L-1;Xi2(k)是第i2个通道接收信号xi2(n),i2=1,…,M,n=1,…,L的频域表示,是Xi2(k)的共轭;|Xi1(k)|是Xi1(k)的幅度;l=1,…,L;
步骤2-5)计算每个网格点的可控响应功率-相位变换SRP-PHAT值pq;
本发明的优势在于:
1、本发明公开一种麦克风阵列声源定位信号处理方法,采用加权SRP-PHAT声源定位信号处理技术方案,用PHAT互相关值估计的时延与搜索点对应的正确时延值间的标准差的倒数作为SRP-PHAT值的加权值求空间网格点的响应功率,采用本方法,可以进一步提高声源定位的准确性;
2本发明的声源位置与麦克风的相对时延值和PHAT互相关方法计算得到的时延值更相近,响应功率值更大;
3、本发明能够解决现有技术中SRP-PHAT方法的定位精度受环境噪声和混响条件的影响严重、急剧下降的问题。
附图说明
图1为本发明信号处理方法流程图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细的说明。
设M个麦克风组成的麦克风阵列分布在三维空间中,各麦克风坐标为依据***对估计精度要求,声源所有可能位置可简化为测量空间内三维网格的格点。假设共划分为Q个网格点,其坐标为设信号的采样速率为fs,每帧每通道采样长度为L。
其中,PHAT互相关值Ri1i2(Δτi1i2(q))的计算公式如下:
其中,Xi1(k)是第i1个通道接收信号xi1(n),i1=1,…,M,n=1,…,L的频域表示,FFT计算的点数为2L-1;Xi2(k)是第i2个通道接收信号xi2(n),i2=1,…,M,n=1,…,L的频域表示,是Xi2(k)的共轭;|Xi1(k)|是Xi1(k)的幅度;l=1,…,L;
其中,i2=1,…,M,i2≠i1,c为声速。
加权值wq的计算公式如下:
实施例
设M个麦克风组成的麦克风阵列分布在三维空间中,各麦克风坐标为依据***对估计精度要求,声源所有可能位置可简化为测量空间内三维网格的格点。假设共划分为Q个网格点,其坐标为每个麦克风对应一个通道,设信号的采样频率为fs,每帧每通道采样长度为L,记为xi1(n),i1=1,…,M,n=1,…,L。傅里叶变换点数等于2L-1。
如图1所示,本发明公开的信号处理方法具体步骤如下:
步骤1)根据麦克风位置坐标和搜索网格点坐标,用公式(4)计算每个网格点到麦克风对位置的时延差,存储备用。这一步骤只执行一次;
步骤2)处理每帧数据,得到该帧数据对声源位置估计。
每帧数据处理的具体步骤如下:
步骤2-1)分别计算每个通道信号xi1(n),i1=1,…,M,n=1,…,L的2L-1点快速傅里叶变换(FFT),得到Xi1(k),i1=1,…,M,k=1,…,2L-1;
步骤2-2)根据公式(3)计算所有通道麦克风对信号的PHAT互相关值Ri1i2(l);
步骤2-5)根据公式(2)计算每个网格点的SRP-PHAT值pq;
本发明公开的一种加权SRP-PHAT麦克风阵列声源定位信号处理方法,用PHAT互相关值估计的时延与搜索点对应的正确时延值间的标准差的倒数作为SRP-PHAT值的加权值求空间网格点的响应功率。其指导思想是如果网格点是正确的声源位置,则其与麦克风对的相对时延值应该和PHAT互相关方法计算得到的时延值更相近,进而使该点的响应功率值更大。采用本方法,可以进一步提高声源定位的准确性。
最后所应说明的是,以上实施例仅用以说明本发明的技术方案而非限制。尽管参照实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,对本发明的技术方案进行修改或者等同替换,都不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (3)
3.根据权利要求2所述的麦克风阵列声源定位方法,其特征在于,所述步骤2)包括:
步骤2-1)分别计算每个麦克风通道信号xi1(n),i1=1,…,M,n=1,…,L的2L-1点快速傅里叶变换,得到Xi1(k),i1=1,…,M,k=1,…,2L-1;
步骤2-2)计算第i1和第i2个麦克风通道的相位变换PHAT互相关值Ri1i2(l):
其中,Xi1(k)是第i1个通道接收信号xi1(n),i1=1,…,M,n=1,…,L的频域表示,快速傅里叶变换FFT计算的点数为2L-1;Xi2(k)是第i2个通道接收信号xi2(n),i2=1,…,M,n=1,…,L的频域表示,是Xi2(k)的共轭;|Xi1(k)|是Xi1(k)的幅度;l=1,…,L;
步骤2-5)计算每个网格点的可控响应功率-相位变换SRP-PHAT值pq;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811019390.1A CN109188362B (zh) | 2018-09-03 | 2018-09-03 | 一种麦克风阵列声源定位信号处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811019390.1A CN109188362B (zh) | 2018-09-03 | 2018-09-03 | 一种麦克风阵列声源定位信号处理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109188362A CN109188362A (zh) | 2019-01-11 |
CN109188362B true CN109188362B (zh) | 2020-09-08 |
Family
ID=64917807
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811019390.1A Expired - Fee Related CN109188362B (zh) | 2018-09-03 | 2018-09-03 | 一种麦克风阵列声源定位信号处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109188362B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110082725B (zh) * | 2019-03-12 | 2023-02-28 | 西安电子科技大学 | 基于麦克风阵列的声源定位时延估计方法、声源定位*** |
CN111445920B (zh) * | 2020-03-19 | 2023-05-16 | 西安声联科技有限公司 | 一种多声源的语音信号实时分离方法、装置和拾音器 |
CN111650559B (zh) * | 2020-06-12 | 2022-11-01 | 深圳市裂石影音科技有限公司 | 一种实时处理的二维声源定位方法 |
CN112379330B (zh) * | 2020-11-27 | 2023-03-10 | 浙江同善人工智能技术有限公司 | 一种多机器人协同的3d声源识别定位方法 |
CN113470682B (zh) * | 2021-06-16 | 2023-11-24 | 中科上声(苏州)电子有限公司 | 一种用麦克风阵列估计说话人方位的方法、装置及存储介质 |
CN116047413B (zh) * | 2023-03-31 | 2023-06-23 | 长沙东玛克信息科技有限公司 | 一种封闭混响环境下的音频精准定位方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101762806B (zh) * | 2010-01-27 | 2013-03-13 | 华为终端有限公司 | 声源定位方法和装置 |
KR101767925B1 (ko) * | 2012-07-26 | 2017-08-18 | 한화테크윈 주식회사 | 음원 위치 추정 장치 및 방법 |
CN105044675B (zh) * | 2015-07-16 | 2017-09-08 | 南京航空航天大学 | 一种srp声源定位的快速实现方法 |
WO2017129239A1 (en) * | 2016-01-27 | 2017-08-03 | Nokia Technologies Oy | System and apparatus for tracking moving audio sources |
CN107102296B (zh) * | 2017-04-27 | 2020-04-14 | 大连理工大学 | 一种基于分布式麦克风阵列的声源定位*** |
-
2018
- 2018-09-03 CN CN201811019390.1A patent/CN109188362B/zh not_active Expired - Fee Related
Non-Patent Citations (4)
Title |
---|
Multichannel Audio Processing for Speaker Localization, Separation and Enhancement;Amparo Martí Guerola;《Universitat Politècnica de València doctoral thesis》;20131231;全文 * |
Speaker Localization and Detection in Videoconferencing Environments Using a Modified SRP-PHAT Algorithm;A. Marti,et al;《Waves》;20111231;全文 * |
SRP-PHAT的改进算法综述;袁晓坤,等;《电声技术》;20121031;第36卷(第10期);全文 * |
基于分布式麦克风阵列的声源定位算法;蔡卫平,等;《计算机应用与软件》;20140531;第31卷(第5期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN109188362A (zh) | 2019-01-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109188362B (zh) | 一种麦克风阵列声源定位信号处理方法 | |
CN104076331B (zh) | 一种七元麦克风阵列的声源定位方法 | |
CN110082725B (zh) | 基于麦克风阵列的声源定位时延估计方法、声源定位*** | |
WO2020042708A1 (zh) | 基于时频掩蔽和深度神经网络的声源方向估计方法 | |
CN104898091B (zh) | 基于迭代优化算法的麦克风阵列自校准声源定位*** | |
CN108375763B (zh) | 一种应用于多声源环境的分频定位方法 | |
CN107644650B (zh) | 一种基于渐进串行正交化盲源分离算法的改进声源定位方法及其实现*** | |
CN111123192B (zh) | 一种基于圆形阵列和虚拟扩展的二维doa定位方法 | |
CN103308889A (zh) | 复杂环境下被动声源二维doa估计方法 | |
CN108957403B (zh) | 一种基于广义互相关的高斯拟合包络时延估计方法及*** | |
CN111798869B (zh) | 一种基于双麦克风阵列的声源定位方法 | |
CN107167770A (zh) | 一种混响条件下的麦克风阵列声源定位装置 | |
CN105607042A (zh) | 用麦克风阵列时延估计定位声源的方法 | |
CN109031261B (zh) | 一种时差估计方法及装置 | |
CN109212481A (zh) | 一种利用麦克风阵列进行声源定位的方法 | |
CN104811886A (zh) | 基于相位差测量的麦克风阵列测向方法 | |
Dang et al. | A feature-based data association method for multiple acoustic source localization in a distributed microphone array | |
CN110007276B (zh) | 一种声源定位方法及*** | |
CN206114888U (zh) | 语音声源测向装置 | |
CN103837858A (zh) | 一种用于平面阵列的远场波达角估计方法及*** | |
KR20090128221A (ko) | 음원 위치 추정 방법 및 그 방법에 따른 시스템 | |
Liu et al. | Research on acoustic source localization using time difference of arrival measurements | |
CN103778288A (zh) | 基于蚁群优化的非均匀阵元噪声条件下近场声源定位方法 | |
CN111443328A (zh) | 基于深度学习的声音事件检测与定位方法 | |
CN106779091B (zh) | 一种基于超限学习机及到达距离的周期振动信号定位方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20200908 |