CN109188362B - 一种麦克风阵列声源定位信号处理方法 - Google Patents

一种麦克风阵列声源定位信号处理方法 Download PDF

Info

Publication number
CN109188362B
CN109188362B CN201811019390.1A CN201811019390A CN109188362B CN 109188362 B CN109188362 B CN 109188362B CN 201811019390 A CN201811019390 A CN 201811019390A CN 109188362 B CN109188362 B CN 109188362B
Authority
CN
China
Prior art keywords
grid point
microphone
sound source
value
calculating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201811019390.1A
Other languages
English (en)
Other versions
CN109188362A (zh
Inventor
孟晓辉
理华
肖灵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Acoustics CAS
Original Assignee
Institute of Acoustics CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Acoustics CAS filed Critical Institute of Acoustics CAS
Priority to CN201811019390.1A priority Critical patent/CN109188362B/zh
Publication of CN109188362A publication Critical patent/CN109188362A/zh
Application granted granted Critical
Publication of CN109188362B publication Critical patent/CN109188362B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S5/00Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
    • G01S5/18Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
    • G01S5/22Position of source determined by co-ordinating a plurality of position lines defined by path-difference measurements

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

本发明提出一种麦克风阵列声源定位方法,包括:步骤1)在测量空间内将估计声源位置划分为Q个网格点,每个网格点三维坐标为
Figure DDA0001786932370000011
对M个麦克风信号进行采样,计算网格点
Figure DDA0001786932370000012
到两个不同麦克风信号的时延差;步骤2)采集M个麦克风通道的当前帧数据,计算麦克风对的时延值;基于该时延值和步骤1)的时延差计算第q个网格点的加权值wq;然后计算第q个网格点的SRP‑PHAT值pq,在Q个网格点中找到wqpq的最大值对应的网格点
Figure DDA0001786932370000013
从而得出该帧数据对应估计声源位置的网格点坐标
Figure DDA0001786932370000014
本发明能够解决现有技术中SRP‑PHAT方法的定位精度受环境噪声和混响条件的影响严重、急剧下降的问题。

Description

一种麦克风阵列声源定位信号处理方法
技术领域
本发明属于音频信号处理和阵列信号处理技术领域,具体而言,涉及一种麦克风阵列声源定位信号处理方法。
背景技术
目前麦克风阵列定位算法大致分为三大类,即基于到达时间差(TDOA)定位、可控响应功率(SRP)和基于高分辨率谱估计的算法。基于高分辨率谱估计的算法最初被应用于窄带源的定位,后来逐渐被众多学者变换引用到宽带源定位问题中。拓展到宽带信号估计时,需要在频域将信号频率划分为多个子带,或者进行频率聚焦以转化为窄带信号处理的方式。该类算法定位分辨率很高,但由于要进行宽带到窄带的转化,使得算法运算量大大增加,实际中更是因为声源个数未知以及噪声环境不满足理想的高斯白噪声条件而性能急剧下降。
基于到达时间差(TDOA)定位算法的核心在于对声传播时延的准确估计,一般通过对麦克风间信号做互相关或者广义互相关处理得到。最后通过对于几何算法的应用将声源的位置加以确定。基于到达时间差的定向算法运算量相对较小,实时性较好,硬件成本较低,因而倍受关注,成为声源定向中广泛采用的方法。该方法中时延估计值是否精确决定了声源定位是否精确,环境噪声与室内混响会对其准确度产生一定的影响。
SRP方法将空间划分成一个一个网格,每个网格都有一个假设的声源,可以算出每个假想声源到一对指定位置麦克风的时延差,将所有麦克风对在其时延差对应的互相关值求和,就可以得到响应功率,使得响应功率取得最大值对应的假想声源位置即为真实声源位置的估计值。联合可控响应功率和相位变换的声源定位方法(SRP-PHAT)将可控响应功率方法固有的鲁棒性、短时分析特征与时延估计中相位变换方法对信号周围环境的不敏感性相结合,使声源定位***具有一定的抗噪性、抗混响性。但是,SRP-PHAT方法在恶劣环境下(噪声干扰大、混响影响严重)性能急剧下降。
发明内容
本发明的目的在于解决现有技术中SRP-PHAT方法的定位精度受环境噪声和混响条件的影响严重、急剧下降的问题。
为实现上述目的,本发明公开一种麦克风阵列声源定位信号处理方法,包括:
步骤1)在测量空间内将估计声源位置划分为Q个网格点,每个网格点三维坐标为
Figure BDA0001786932350000021
对M个麦克风信号进行采样,计算网格点
Figure BDA0001786932350000022
到两个不同麦克风信号的时延差;
步骤2)采集M个麦克风通道的当前帧数据,计算麦克风对的时延值;基于该时延值和步骤1)的时延差计算第q个网格点的加权值wq;然后计算第q个网格点的SRP-PHAT值pq,在Q个网格点中找到wqpq的最大值对应的网格点
Figure BDA0001786932350000029
从而得出该帧数据对应估计声源位置的网格点坐标
Figure BDA0001786932350000023
作为上述方法的一种改进,所述步骤1)包括:
步骤1-1)设M个麦克风组成的麦克风阵列分布在三维空间中,各麦克风坐标为
Figure BDA0001786932350000024
步骤1-2)在测量空间内将声源所有可能位置划分为Q个网格点,其三维坐标为
Figure BDA0001786932350000025
步骤1-3)每个麦克风对应一个通道,设信号的采样频率为fs,每帧每通道采样长度为L,每通道采样信号为xi1(n),i1=1,…,M,n=1,…,L;傅里叶变换点数等于2L-1;
步骤1-4)计算网格点
Figure BDA0001786932350000026
到第i1和第i2个通道的时延差Δτi1i2(q):
Figure BDA0001786932350000027
其中,i2=1,…,M,i2≠i1,c为声速。
作为上述方法的一种改进,所述步骤2)包括:
步骤2-1)分别计算每个麦克风通道信号xi1(n),i1=1,…,M,n=1,…,L的2L-1点快速傅里叶变换,得到Xi1(k),i1=1,…,M,k=1,…,2L-1;
步骤2-2)计算第i1和第i2个麦克风通道的相位变换PHAT互相关值Ri1i2(l):
Figure BDA0001786932350000028
其中,Xi1(k)是第i1个通道接收信号xi1(n),i1=1,…,M,n=1,…,L的频域表示,快速傅里叶变换FFT计算的点数为2L-1;Xi2(k)是第i2个通道接收信号xi2(n),i2=1,…,M,n=1,…,L的频域表示,
Figure BDA0001786932350000031
是Xi2(k)的共轭;|Xi1(k)|是Xi1(k)的幅度;l=1,…,L;
步骤2-3)根据Ri1i2(l)计算第i1和第i2个麦克风通道之间的时延值
Figure BDA0001786932350000032
Figure BDA0001786932350000033
步骤2-4)计算Δτi1i2(q)与
Figure BDA0001786932350000034
间的标准差得到每个网格点的加权值wq
Figure BDA0001786932350000035
步骤2-5)计算每个网格点的可控响应功率-相位变换SRP-PHAT值pq
Figure BDA0001786932350000036
步骤2-6)计算第q个网格点的加权可控响应功率-相位变换SRP-PHAT值wqpq,在Q个wqpq找出其中的最大值,根据wqpq的最大值得到对应的网格点
Figure BDA0001786932350000037
Figure BDA0001786932350000038
步骤2-7)根据wqpq最大值对应的网格点
Figure BDA0001786932350000039
得到该帧数据对应的声源位置
Figure BDA00017869323500000310
本发明的优势在于:
1、本发明公开一种麦克风阵列声源定位信号处理方法,采用加权SRP-PHAT声源定位信号处理技术方案,用PHAT互相关值估计的时延与搜索点对应的正确时延值间的标准差的倒数作为SRP-PHAT值的加权值求空间网格点的响应功率,采用本方法,可以进一步提高声源定位的准确性;
2本发明的声源位置与麦克风的相对时延值和PHAT互相关方法计算得到的时延值更相近,响应功率值更大;
3、本发明能够解决现有技术中SRP-PHAT方法的定位精度受环境噪声和混响条件的影响严重、急剧下降的问题。
附图说明
图1为本发明信号处理方法流程图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细的说明。
设M个麦克风组成的麦克风阵列分布在三维空间中,各麦克风坐标为
Figure BDA0001786932350000041
依据***对估计精度要求,声源所有可能位置可简化为测量空间内三维网格的格点。假设共划分为Q个网格点,其坐标为
Figure BDA0001786932350000042
设信号的采样速率为fs,每帧每通道采样长度为L。
本发明公开的加权SRP-PHAT声源定位方法通过搜索网格中的加权SRP-PHAT值最大的位置,确定声源位置的估计值
Figure BDA0001786932350000043
Figure BDA0001786932350000044
其中,pq为搜索点
Figure BDA0001786932350000045
的SRP-PHAT值,其计算公式如下:
Figure BDA0001786932350000046
其中,PHAT互相关值Ri1i2(Δτi1i2(q))的计算公式如下:
Figure BDA0001786932350000047
其中,Xi1(k)是第i1个通道接收信号xi1(n),i1=1,…,M,n=1,…,L的频域表示,FFT计算的点数为2L-1;Xi2(k)是第i2个通道接收信号xi2(n),i2=1,…,M,n=1,…,L的频域表示,
Figure BDA0001786932350000048
是Xi2(k)的共轭;|Xi1(k)|是Xi1(k)的幅度;l=1,…,L;
其中,Δτi1i2(q)是网格点
Figure BDA0001786932350000049
到第i1和第i2个通道的时延差,其计算公式为:
Figure BDA00017869323500000410
其中,i2=1,…,M,i2≠i1,c为声速。
加权值wq的计算公式如下:
Figure BDA00017869323500000411
其中
Figure BDA00017869323500000412
为用Ri1i2(τ)最大值位置估计出来的时延值:
Figure BDA00017869323500000413
实施例
设M个麦克风组成的麦克风阵列分布在三维空间中,各麦克风坐标为
Figure BDA00017869323500000414
依据***对估计精度要求,声源所有可能位置可简化为测量空间内三维网格的格点。假设共划分为Q个网格点,其坐标为
Figure BDA00017869323500000415
每个麦克风对应一个通道,设信号的采样频率为fs,每帧每通道采样长度为L,记为xi1(n),i1=1,…,M,n=1,…,L。傅里叶变换点数等于2L-1。
如图1所示,本发明公开的信号处理方法具体步骤如下:
步骤1)根据麦克风位置坐标和搜索网格点坐标,用公式(4)计算每个网格点到麦克风对位置的时延差,存储备用。这一步骤只执行一次;
Figure BDA0001786932350000051
步骤2)处理每帧数据,得到该帧数据对声源位置估计。
每帧数据处理的具体步骤如下:
步骤2-1)分别计算每个通道信号xi1(n),i1=1,…,M,n=1,…,L的2L-1点快速傅里叶变换(FFT),得到Xi1(k),i1=1,…,M,k=1,…,2L-1;
步骤2-2)根据公式(3)计算所有通道麦克风对信号的PHAT互相关值Ri1i2(l);
Figure BDA0001786932350000052
步骤2-3)根据公式(6)用PHAT互相关值Ri1i2(τ)计算所有通道对间的延时估计值
Figure BDA0001786932350000053
Figure BDA0001786932350000054
步骤2-4)根据公式(5)计算Δτi1i2(q)与
Figure BDA0001786932350000055
间的标准差得到每个网格点的加权值wq
Figure BDA0001786932350000056
步骤2-5)根据公式(2)计算每个网格点的SRP-PHAT值pq
Figure BDA0001786932350000057
步骤2-6)根据公式(1)计算所有网格点的加权SRP-PHAT值pq,找出其中最大值对应的网格点
Figure BDA0001786932350000058
Figure BDA0001786932350000059
步骤2-7)根据wqpq最大值对应的网格点
Figure BDA00017869323500000510
得到该帧数据对应的声源位置
Figure BDA00017869323500000511
本发明公开的一种加权SRP-PHAT麦克风阵列声源定位信号处理方法,用PHAT互相关值估计的时延与搜索点对应的正确时延值间的标准差的倒数作为SRP-PHAT值的加权值求空间网格点的响应功率。其指导思想是如果网格点是正确的声源位置,则其与麦克风对的相对时延值应该和PHAT互相关方法计算得到的时延值更相近,进而使该点的响应功率值更大。采用本方法,可以进一步提高声源定位的准确性。
最后所应说明的是,以上实施例仅用以说明本发明的技术方案而非限制。尽管参照实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,对本发明的技术方案进行修改或者等同替换,都不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (3)

1.一种麦克风阵列声源定位方法,包括:
步骤1)在测量空间内将估计声源位置划分为Q个网格点,每个网格点三维坐标为
Figure FDA0002475631410000011
对M个麦克风信号进行采样,计算网格点
Figure FDA0002475631410000012
到两个不同麦克风信号的时延差;
步骤2)采集M个麦克风通道的当前帧数据,计算麦克风对的时延值;基于该时延值和步骤1)的时延差计算第q个网格点的加权值wq;然后计算第q个网格点的SRP-PHAT值pq,在Q个网格点中找到wqpq的最大值对应的网格点
Figure FDA0002475631410000013
从而得出该帧数据对应估计声源位置的网格点坐标
Figure FDA0002475631410000014
2.根据权利要求1所述的麦克风阵列声源定位方法,其特征在于,所述步骤1)包括:
步骤1-1)设M个麦克风组成的麦克风阵列分布在三维空间中,各麦克风坐标为
Figure FDA0002475631410000015
步骤1-2)在测量空间内将声源所有可能位置划分为Q个网格点,其三维坐标为
Figure FDA0002475631410000016
步骤1-3)每个麦克风对应一个通道,设信号的采样频率为fs,每帧每通道采样长度为L,每通道采样信号为xi1(n),i1=1,…,M,n=1,…,L;傅里叶变换点数等于2L-1;
步骤1-4)计算网格点
Figure FDA0002475631410000017
到第i1和第i2个通道的时延差Δτi1i2(q):
Figure FDA0002475631410000018
其中,i2=1,…,M,i2≠i1,c为声速。
3.根据权利要求2所述的麦克风阵列声源定位方法,其特征在于,所述步骤2)包括:
步骤2-1)分别计算每个麦克风通道信号xi1(n),i1=1,…,M,n=1,…,L的2L-1点快速傅里叶变换,得到Xi1(k),i1=1,…,M,k=1,…,2L-1;
步骤2-2)计算第i1和第i2个麦克风通道的相位变换PHAT互相关值Ri1i2(l):
Figure FDA0002475631410000019
其中,Xi1(k)是第i1个通道接收信号xi1(n),i1=1,…,M,n=1,…,L的频域表示,快速傅里叶变换FFT计算的点数为2L-1;Xi2(k)是第i2个通道接收信号xi2(n),i2=1,…,M,n=1,…,L的频域表示,
Figure FDA0002475631410000021
是Xi2(k)的共轭;|Xi1(k)|是Xi1(k)的幅度;l=1,…,L;
步骤2-3)根据Ri1i2(l)计算第i1和第i2个麦克风通道之间的时延值
Figure FDA00024756314100000210
Figure FDA0002475631410000022
步骤2-4)计算Δτi1i2(q)与
Figure FDA0002475631410000023
间的标准差得到每个网格点的加权值wq
Figure FDA0002475631410000024
步骤2-5)计算每个网格点的可控响应功率-相位变换SRP-PHAT值pq
Figure FDA0002475631410000025
步骤2-6)计算第q个网格点的加权可控响应功率-相位变换SRP-PHAT值wqpq,在Q个wqpq找出其中的最大值,根据wqpq的最大值得到对应的网格点
Figure FDA0002475631410000026
Figure FDA0002475631410000027
步骤2-7)根据wqpq最大值对应的网格点
Figure FDA0002475631410000028
得到该帧数据对应的声源位置
Figure FDA0002475631410000029
CN201811019390.1A 2018-09-03 2018-09-03 一种麦克风阵列声源定位信号处理方法 Expired - Fee Related CN109188362B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811019390.1A CN109188362B (zh) 2018-09-03 2018-09-03 一种麦克风阵列声源定位信号处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811019390.1A CN109188362B (zh) 2018-09-03 2018-09-03 一种麦克风阵列声源定位信号处理方法

Publications (2)

Publication Number Publication Date
CN109188362A CN109188362A (zh) 2019-01-11
CN109188362B true CN109188362B (zh) 2020-09-08

Family

ID=64917807

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811019390.1A Expired - Fee Related CN109188362B (zh) 2018-09-03 2018-09-03 一种麦克风阵列声源定位信号处理方法

Country Status (1)

Country Link
CN (1) CN109188362B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110082725B (zh) * 2019-03-12 2023-02-28 西安电子科技大学 基于麦克风阵列的声源定位时延估计方法、声源定位***
CN111445920B (zh) * 2020-03-19 2023-05-16 西安声联科技有限公司 一种多声源的语音信号实时分离方法、装置和拾音器
CN111650559B (zh) * 2020-06-12 2022-11-01 深圳市裂石影音科技有限公司 一种实时处理的二维声源定位方法
CN112379330B (zh) * 2020-11-27 2023-03-10 浙江同善人工智能技术有限公司 一种多机器人协同的3d声源识别定位方法
CN113470682B (zh) * 2021-06-16 2023-11-24 中科上声(苏州)电子有限公司 一种用麦克风阵列估计说话人方位的方法、装置及存储介质
CN116047413B (zh) * 2023-03-31 2023-06-23 长沙东玛克信息科技有限公司 一种封闭混响环境下的音频精准定位方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101762806B (zh) * 2010-01-27 2013-03-13 华为终端有限公司 声源定位方法和装置
KR101767925B1 (ko) * 2012-07-26 2017-08-18 한화테크윈 주식회사 음원 위치 추정 장치 및 방법
CN105044675B (zh) * 2015-07-16 2017-09-08 南京航空航天大学 一种srp声源定位的快速实现方法
WO2017129239A1 (en) * 2016-01-27 2017-08-03 Nokia Technologies Oy System and apparatus for tracking moving audio sources
CN107102296B (zh) * 2017-04-27 2020-04-14 大连理工大学 一种基于分布式麦克风阵列的声源定位***

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Multichannel Audio Processing for Speaker Localization, Separation and Enhancement;Amparo Martí Guerola;《Universitat Politècnica de València doctoral thesis》;20131231;全文 *
Speaker Localization and Detection in Videoconferencing Environments Using a Modified SRP-PHAT Algorithm;A. Marti,et al;《Waves》;20111231;全文 *
SRP-PHAT的改进算法综述;袁晓坤,等;《电声技术》;20121031;第36卷(第10期);全文 *
基于分布式麦克风阵列的声源定位算法;蔡卫平,等;《计算机应用与软件》;20140531;第31卷(第5期);全文 *

Also Published As

Publication number Publication date
CN109188362A (zh) 2019-01-11

Similar Documents

Publication Publication Date Title
CN109188362B (zh) 一种麦克风阵列声源定位信号处理方法
CN104076331B (zh) 一种七元麦克风阵列的声源定位方法
CN110082725B (zh) 基于麦克风阵列的声源定位时延估计方法、声源定位***
WO2020042708A1 (zh) 基于时频掩蔽和深度神经网络的声源方向估计方法
CN104898091B (zh) 基于迭代优化算法的麦克风阵列自校准声源定位***
CN108375763B (zh) 一种应用于多声源环境的分频定位方法
CN107644650B (zh) 一种基于渐进串行正交化盲源分离算法的改进声源定位方法及其实现***
CN111123192B (zh) 一种基于圆形阵列和虚拟扩展的二维doa定位方法
CN103308889A (zh) 复杂环境下被动声源二维doa估计方法
CN108957403B (zh) 一种基于广义互相关的高斯拟合包络时延估计方法及***
CN111798869B (zh) 一种基于双麦克风阵列的声源定位方法
CN107167770A (zh) 一种混响条件下的麦克风阵列声源定位装置
CN105607042A (zh) 用麦克风阵列时延估计定位声源的方法
CN109031261B (zh) 一种时差估计方法及装置
CN109212481A (zh) 一种利用麦克风阵列进行声源定位的方法
CN104811886A (zh) 基于相位差测量的麦克风阵列测向方法
Dang et al. A feature-based data association method for multiple acoustic source localization in a distributed microphone array
CN110007276B (zh) 一种声源定位方法及***
CN206114888U (zh) 语音声源测向装置
CN103837858A (zh) 一种用于平面阵列的远场波达角估计方法及***
KR20090128221A (ko) 음원 위치 추정 방법 및 그 방법에 따른 시스템
Liu et al. Research on acoustic source localization using time difference of arrival measurements
CN103778288A (zh) 基于蚁群优化的非均匀阵元噪声条件下近场声源定位方法
CN111443328A (zh) 基于深度学习的声音事件检测与定位方法
CN106779091B (zh) 一种基于超限学习机及到达距离的周期振动信号定位方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20200908