CN106093864B - 一种麦克风阵列声源空间实时定位方法 - Google Patents

一种麦克风阵列声源空间实时定位方法 Download PDF

Info

Publication number
CN106093864B
CN106093864B CN201610391351.9A CN201610391351A CN106093864B CN 106093864 B CN106093864 B CN 106093864B CN 201610391351 A CN201610391351 A CN 201610391351A CN 106093864 B CN106093864 B CN 106093864B
Authority
CN
China
Prior art keywords
sound source
candidate points
power response
microphone array
controllable power
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610391351.9A
Other languages
English (en)
Other versions
CN106093864A (zh
Inventor
杨毅
孙甲松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN201610391351.9A priority Critical patent/CN106093864B/zh
Publication of CN106093864A publication Critical patent/CN106093864A/zh
Application granted granted Critical
Publication of CN106093864B publication Critical patent/CN106093864B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S5/00Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
    • G01S5/18Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明一种麦克风阵列声源空间实时定位方法,以麦克风阵列作为信号采集和输出设备,通过使用可控功率响应‑相位变换法初步给出声源空间位置候选点;通过先验知识进行初步的候选点筛选,并使用可控功率响应‑相位变换法计算候选点的可控功率响应输出;用改进的随机区域收缩重新确定搜索边界,提高可控功率响应‑相位变换法的效率;最后计算剩余候选点的可控功率响应,选取最大的位置作为最终的声源估计位置;本发明声源定位原理明确,实时性好,实验证明该方法在平面上的定位误差范围可控制在厘米量级上,性能优于基于现有技术的方法;具有较高的运算速度和鲁棒性,可应用于智能家居和智能机器人等需要进行实时声源定位的场景。

Description

一种麦克风阵列声源空间实时定位方法
技术领域
本发明属于语音技术领域,特别涉及一种麦克风阵列声源空间实时定位方法。
背景技术
语音处理技术中通常需要掌握声源的空间位置信息,为声纹识别、语音内容识别等交互技术提供帮助。例如,当用户与智能机器人进行语音对话时,通常要确定人的空间位置并进行转向和靠近,即使在黑暗中也可以仅仅根据声音确定用户的具体方位,并自动靠近说话人附近,提供必要的服务和帮助;在视频会议中一般需要自动调整会议摄像头,朝向发言人,并能够对不同发言人进行视频切换。
常见的用于声源定位的设备是麦克风阵列,一般定义为:由多个(通常大于三个)麦克风按照指定的几何规则摆放并完全同步采集声音信号的设备。目前麦克风阵列定位的常用方法主要包括:基于到达时间差(Time Delay ofArrival,TDOA)的声源定位,定位首先通过时延估计得到声源信号到达不同阵元的时间差,再通过麦克风阵列的几何构造进行声源位置判断;基于可控功率响应(Steered Response Power,SRP)的声源定位以及基于高分辨率谱估计(High-resolution Spectral Estimation)的声源定位等。
1、到达时间差(Time Delay ofArrival,TDOA)法:
该方法首先通过时延估计得到声源信号到达不同阵元的时间差,再通过麦克风阵列的几何构造进行声源位置判断。常用的时延估计方法是基于广义互相关(GeneralizedCross Correlation,GCC)法,其具体步骤为,设Xi(ω)和Xi(ω)分别代表第i个麦克风接收信号xi(t)和第j个麦克风接收信号xj(t)的傅里叶变换,则有如下等式:
其中Ψij(ω)表示两个信号的互功率谱密度,Rij表示两个信号的互相关函数,为声源到第i个麦克风与第j个麦克风之间的延时估计,Wij(ω)是频域加权系数,当此加权系数为1时,就是基本互相关。常用的频域加权函数还有相位变换(PhAse Transform,PHAT)加权、ROTH加权、最大似然加权、SCOT加权等,其中PHAT加权较为常用,因为基于广义互相关的时延估计信息隐藏在互功率谱的相位信息中,与幅度无关,PHAT加权法则去除了幅度信息的影响,使得相关函数峰值更加尖锐。PHAT加权函数公式为Wij(ω)=1/|Ψij(ω)|。
上述基于到达时间差的定位方法原理简单,计算效率高,但在较大的噪声或混响干扰下其时延估计性能急剧下降,因此不适用于低信噪比或高混响的声学场景。此外,还有一些时延估计方法,比如利用信息论中联合熵和互信息,使用迭代方法,或者考虑不同信道的非对称性等方法,但在强混响和噪声条件下,结果都不太理想,且部分方法计算速度缓慢,比如迭代法等。
2、可控功率响应-相位变换(Steered Response Power-PhAse Transform,SRP-PHAT)法
基于可控功率响应-相位变换的定位方法通过对全局空间进行搜索,找到最大可控功率输出的点,网格越小,搜索分辨率越高。其声源定位原理如下:
假定声源位于s处,τi表示声源到第i个麦克风的传输延迟。声源s的可控功率响应-相位变换输出PPHAT(s)为:
其中表示两个信号的互功率谱密度,τji表示s处声源到第j个麦克风和第i个麦克风的时延差。估计的声源位置为:
经过以上分析可以知道,SRP-PHAT算法的思路是假定空间中某一位置存在声源,然后求出该位置的基于相位加权的可控功率输出,最终选取使得PPHAT(s)最大的空间位置s作为估计出的声源位置。但是SRP-PHAT的思路是先假定空间中某一位置有声源,为了精确定位出声源信息,一般需要用网格搜索法,遍历空间中所有的网格位置。假设搜索空间c长宽高分别为X,Y,Z,网格间隔为δ,则网格点数N为:
假定X=3m,Y=3m,Z=2m,网格间隔δ=0.01m,则网格点数N=301*301*201=18210801,也就是说要计算接近1800多万个点的即使只有二维,也要计算301*301=90601次,因此效率很低。
3、随机区域收缩法
基于SRP-PHAT的随机区域收缩(Stochastic Region Contraction,SRC)方法是DoH,Silverman H F为了提高SRP-PHAT效率在2007年提出的一种算法,该算法主要思路是通过随机采样,选取基于PHAT可控功率响应最大的一部分点,根据这部分点重新确定搜索边界,然后在新的区域内重复上面操作,直至找到全局最大值。该算法鲁棒性的前提是随机采样时,错失最高峰的概率几乎为零,也就是没有采样到声源所在位置的概率几乎为零。假设声源体积为Vs,房间体积为Vroom,则每次随机采样采到峰值的概率phit为phit=Vs/Vroom,错失峰值概率pmiss为phit=Vs/Vrom。假设第一次采样共采集到M个点,则错失峰值概率Pmiss(N)为同时,为了确保第一次采样错失峰值概率低于某个阈值pthre,采样点个数M要满足Pmiss(M)≤pthre的条件,所以可以得到在一般情况下,取pthre=0.005pthre=0.001就能满足鲁棒性的需要。但是在该算法中由于采样点完全是随机的,对于每个随机采样点都要计算相关向量,因此比计算该点的可控功率响应还要付出更多计算代价。
4、高分辨率谱估计法
基于高分辨率谱估计的声源定位方法借鉴了雷达阵列中的定位技术,但是雷达信号多为窄带信号,相比之下语音信号频带较宽,因此这种方法的效果不尽理想。
声源定位在人机交互技术中有广泛的应用,但是传统方法无法同时达到高鲁棒性和实时的效果。
可见,基于麦克风阵列的声源定位方法已被广泛研究,与其他方法相比,基于可控功率响应的定位方法具有抗环境噪声和混响干扰的优势,但其计算实时性较差,在实际应用场景中难以发挥作用。
发明内容
为了克服上述现有技术的缺点,本发明的目的在于提供一种麦克风阵列声源空间实时定位方法,其声源定位原理明确,实时性好,实验证明该方法在平面上的定位误差范围可控制在厘米量级上,性能优于基于现有技术的方法;本发明提出的基于麦克风阵列的声源空间实时定位方法具有较高的运算速度和鲁棒性,可应用于智能家居和智能机器人等需要进行实时声源定位的场景。
为了实现上述目的,本发明采用的技术方案是:
一种麦克风阵列声源空间实时定位方法,包括以下步骤:
首先,以麦克风阵列作为信号采集和输出设备,通过使用可控功率响应-相位变换(SRP-PHAT)法初步给出声源空间位置候选点;
其次,通过先验知识进行初步的候选点筛选,并使用可控功率响应-相位变换(SRP-PHAT)法计算候选点的可控功率响应输出;
随后,用改进的随机区域收缩(Stochastic Region Contraction,SRC)重新确定搜索边界,提高可控功率响应-相位变换法的效率;
最后,计算剩余候选点的可控功率响应,选取最大的位置作为最终的声源估计位置。
所述初步给出声源空间位置候选点是指确定全部声源的空间位置候选点,方法如下:
假设待搜索空间c的长宽高分别为X,Y,Z,网格间隔为δ,则网格点数即声源空间位置的候选点为N个。
所述初步的候选点筛选是指初步降低候选点数目,方法如下:
假设麦克风阵列包含m个麦克风,则可得到位于s处的声源到麦克风阵列的到达时延向量TDOAs=[τ1,2,s,τ1,3,s,...,τ1,m,s,τ2,3,s,.....,τ2,m,s,...,τm-1m,s]T,其中τi,j,s=(di,s-dj,s)/v为位于s处的声源到第i个麦克风和第j个麦克风的时延,v表示空气中声音传播速度,di,s表示位于s处的声源到第i个麦克风的物理距离,dj,s表示位于s处的声源到第j个麦克风的物理距离;
定义采样点个数差(Sample number Difference,SD)向量为:
SDs=[sd1,2,s,sd1,3,s,...,sd1,m,s,sd2,3,s,...,sd2,m,s,...,sdm-1m,s]T
当信号采样频率为fs时,有:
sdi,j,s=round(fs·τi,j,s)
其中round表示对每个元素向最近的方向取整,如果某些候选点所求出的采样点差向量SD等同,则只保留其中任意一个候选点,删除其他候选点,避免重复计算;
进一步求出每两个候选点s1,s2之间的采样点个数差:
SDs1,s2=abs(SDs1-SDs2)
其中abs表示求取绝对值,并选出所有满足max(SDs1,s2)≤threshold的候选点,只保留其中任意一个候选点,删除其他候选点,避免重复计算,Threshold定义为:
其中,λ表示声音波长。在采样频率fs为16000Hz时,设置threshold=1可以有效降低候选点的个数。
在实际应用中,上述TDOA向量和采样点差SD向量的计算,以及候选点的挑选需要预先做好并存储在一个查找表中,这样在声源定位时,只需根据索引查找即可,不用重复计算。预先建立查找表也是提速的关键。
所述候选点的可控功率响应输出计算方法如下:
假定筛选得到的候选点位于空间位置s处,Xi(ω)和Xi(ω)分别代表第i个麦克风接收信号xi(t)和第j个麦克风接收信号xj(t)的傅里叶变换,τi表示声源到第i个麦克风的传输延迟,τji表示s处声源到第,个麦克风和第i个麦克风的时延差,根据可控功率响应-相位变换法的定义,可得声源s的可控功率响应输出PPHAT(s)为:
其中表示两者之间的互功率谱密度,m为麦克风的总个数,对所有筛选得到的候选点计算PPHAT(s)。
所述重新确定搜索边界是指用快速随机区域收缩算法搜索全局最大值,方法如下:
并非通过随机采样,而是对筛选得到的候选点(且其TDOA向量和采样点差SD向量都可以在第二步的查找表中直接得到)通过计算得到对应的可控功率响应输出,选取前N个最大值,在其对应的候选点中随机选取M个,随后从这些点出发重新确定搜索边界,然后在新的区域内重复进行这种选取和搜索,直至满足精度要求。
所述N的值的选择以及之后的随机采样M值的确定与具体的麦克风阵列形状及房间尺寸等有关,M和N的选择有很多策略,可选择采用如下方式:
方式一,选为定值,M也选为定值;例如在四元麦克风阵列条件下,一般来说N=100时效率和准确度达到最好,性能最佳。
方式二,每次都根据上一次的N个候选点对应的可控功率响应输出,挑选出其中比均值大的可控功率响应输出对应的候选点,其总数为N′,如果N-N′≤N′,则在这些候选点中随机挑选N-N′个作为候选点;如果N-N′>N′,则保留全部N′个候选点,这样可以保证每次区域收缩后,均值不断增加,当这些候选点的可控功率响应输出计算次数多于某个给定的阈值时停止选取和搜索。
通过这样的方法得到的定位结果能够满足一般的精度要求。如果要更精确的定位,则可以在最终确定的声源结果附近小范围内使用网格法精确搜索;或者根据查找表,首先得到若干可控功率响应输出最大值的对应区域,找到这些区域附近网格中的所有候选点,然后计算这些候选点的可控功率响应,选取最大的位置作为最终的声源估计位置。
与现有技术相比,本发明的有益效果是:
(1)本发明提出的通过先验信息进行候选点初步筛除的方法,很大程度上降低了基于候选点上的可控功率响应输出的计算代价,可以适用于多种场景;
(2)本发明提出的将候选点位置相关向量预先保存在查找表中的方法,原理简单,计算代价低,可有效提高实时效果;
(3)本发明提出的两种基于候选点再次精确搜索声源位置的方法,可进一步提高声源定位的分辨率和精度,且计算复杂度较低,适用于硬件环境配置较低的设备和场景中。
本发明提出基于麦克风阵列的声源空间实时定位方法在对声源信号进行空间定位时,计算代价优于现有技术水平。本发明的声源定位方法具有应用广泛、响应实时等优点,适用于智能机器人和智能家居等需要使用声音进行准确定位的场景。
附图说明
图1是基于麦克风阵列的声源空间实时定位方法总体示意图。
具体实施方式
下面结合附图和实施例详细说明本发明的实施方式。
如图1所示,本发明实施例的整个计算过程细节构成如下:
1、确定全部声源的空间位置候选点
假设待搜索空间c长宽高分别为X,Y,Z,网格间隔为δ,则网格点数N为:
即声源空间位置的候选点为N个。
2、计算到达时延向量和采样点差向量
假设麦克风阵列包含m≥4个麦克风,则可得到位于s处的声源到麦克风阵列的到达时延向量TDOA3为:
TDOAs=[τ1,2,s,τ1,3,s,...,τ1,m,s,τ2,3,s,.....,τ2,m,s,...,τm-1m,s]T (公式2)
其中τi,j,s=(di,s-dj,s)/v为位于s处的声源到第i个麦克风和第j个麦克风的时延,其中v表示空气中声音传播速度,di,s表示位于s处的声源到第i个麦克风的物理距离,dj,s表示位于s处的声源到第j个麦克风的物理距离。
定义采样点个数差向量SDs为:
SDs=[sd1,2,s,sd1,3,s,...,sd1,m,s,sd2,3,s,…,sd2,m,s,…,sdm-1,m,s]T (公式3)
当信号采样频率为fs时,有:
SDi,j,s=round(fs·τi,j,s) (公式4)
其中round表示对每个元素向最近的方向取整,fs为采样频率。进一步求出每两个候选点s1,s2之间的采样点个数差:
SDS1,S2=abs(SDS1-SDS2) (公式5)
其中abs表示求取绝对值。
3、删除部分候选点
在上述第二步计算中,如果某些候选点用公式4所求出的采样点差向量SD等同,则只保留其中任意一个候选点,删除其他候选点,避免重复计算。并对剩下的候选点通过公式5再次计算,选出所有满足max(SDS1,s2)≤threshold的候选点,只保留其中任意一个候选点,删除其他候选点,避免重复计算。此处Threshold定义为:
其中,λ表示声音波长。在采样频率fs为16000Hz时,设置threshold=1可以有效降低候选点的个数。
另外,在实际应用中,上述TDOA向量和采样点差SD向量的计算,以及候选点的挑选需要预先做好并存储在一个查找表中,这样在声源定位时,只需根据索引查找即可,不用重复计算。预先建立查找表也是提速的关键。
4、计算候选点的可控功率响应输出
假定上述步骤完成后得到的候选点位于空间位置s处,Xi(ω)和Xj(ω)分别代表第i个麦克风接收信号xi(t)和第j个麦克风接收信号xj(t)的傅里叶变换,τi表示声源到第i个麦克风的传输延迟,τji表示s处声源到第j个麦克风和第i个麦克风的时延差。根据可控功率响应-相位变换法的定义,可得声源s的可控功率输出PPHAT(s)为:
其中表示两者之间的互功率谱密度。对所有第二步得到的候选点计算PPHAT(s)。
5、确定M和N,重新确定搜索边界
对通过上述步骤计算得到对应的PPHAT(s),选取前N个最大值,在其对应的候选点中随机选取M个,随后从这些点出发重新确定搜索边界。
N的值如何选择以及之后的随机采样M和N值的确定与具体的麦克风阵列形状及房间尺寸等有关。M和N的选择有很多策略,最简单的是固定M和N为确定值。例如在四元麦克风阵列条件下,一般来说N=100时效率和准确度达到最好,性能最佳。另一种选择N的策略是,每次都根据上一次的N个候选点对应的PPHAT(s)挑选出其中比均值大的PPHAT(s)对应的候选点,其总数为N′,如果N-N′≤N′,则在这些候选点中随机挑选N-N′个作为候选点;如果N-N′>N′,则保留全部N′个候选点。这样可以保证每次区域收缩后,均值不断增加。当这些候选点的PPHAT(s)计算次数多于某个给定的阈值时停止选取和搜索。
6、重复进行这种选取和搜索,直至满足精度要求后输出候选点
在上述步骤完成后,得到新的搜素区域,在此区域内重复进行这种选取和搜索,直至满足精度要求,随后输出这些满足要求的候选点。通过这样的方法得到的定位结果能够满足一般的精度要求。
7、进一步用网格法或查表法实现更精细的定位
如果要更精确的定位,则可以在最终确定的声源结果附近小范围内使用网格法精确搜索;或者根据查找表,首先得到若干PPHAT(s)最大值的对应区域,找到这些区域附近网格中的所有候选点,然后计算这些候选点的可控功率响应,选取最大的位置作为最终的声源估计位置。

Claims (8)

1.一种麦克风阵列声源空间实时定位方法,包括以下步骤:
首先,以麦克风阵列作为信号采集和输出设备,通过使用可控功率响应-相位变换(SRP-PHAT)法初步给出声源空间位置候选点;
其次,通过先验知识进行初步的候选点筛选,并使用可控功率响应-相位变换(SRP-PHAT)法计算候选点的可控功率响应输出;
随后,用改进的随机区域收缩(Stochastic Region Contraction,SRC)重新确定搜索边界,提高可控功率响应-相位变换法的效率,方法如下:
对筛选得到的候选点通过计算得到对应的可控功率响应输出,选取前N个最大值,在其对应的候选点中随机选取M个,随后从这些点出发重新确定搜索边界,然后在新的区域内重复进行这种选取和搜索,直至满足精度要求;
最后,计算剩余候选点的可控功率响应,选取最大的位置作为最终的声源估计位置;
其特征在于,所述N的值的选择以及之后的随机采样M值的确定与具体的麦克风阵列形状及房间尺寸有关,N的值的选择采用如下方式:
方式一,选为定值,M也选为定值;
方式二,每次都根据上一次的N个候选点对应的可控功率响应输出,挑选出其中比均值大的可控功率响应输出对应的候选点,其总数为N',如果N-N'≤N',则在这些候选点中随机挑选N-N'个作为候选点;如果N-N'>N',则保留全部N'个候选点,当这些候选点的可控功率响应输出计算次数多于某个给定的阈值时停止选取和搜索。
2.根据权利要求1所述麦克风阵列声源空间实时定位方法,其特征在于,所述初步给出声源空间位置候选点是指确定全部声源的空间位置候选点,方法如下:
假设待搜索空间c的长宽高分别为X,Y,Z,网格间隔为δ,则网格点数即声源空间位置的候选点为N个。
3.根据权利要求1所述麦克风阵列声源空间实时定位方法,其特征在于,所述初步的候选点筛选是指初步降低候选点数目,方法如下:
假设麦克风阵列包含m个麦克风,则可得到位于s处的声源到麦克风阵列的到达时延向量TDOAs=[τ1,2,s1,3,s,...,τ1,m,s2,3,s,.....,τ2,m,s,...,τm-1,m,s]T,其中τi,j,s=(di,s-dj,s)/v为位于s处的声源到第i个麦克风和第j个麦克风的时延,v表示空气中声音传播速度,di,s表示位于s处的声源到第i个麦克风的物理距离,dj,s表示位于s处的声源到第j个麦克风的物理距离;
定义采样点个数差(Sample number Difference,SD)向量为:
SDs=[sd1,2,s,sd1,3,s,...,sd1,m,s,sd2,3,s,...,sd2,m,s,...,sdm-1,m,s]T
当信号采样频率为fs时,有:
sdi,j,s=round(fs·τi,j,s)
其中round表示对每个元素向最近的方向取整,如果某些候选点所求出的采样点差向量SD等同,则只保留其中任意一个候选点,删除其他候选点,避免重复计算;
进一步求出每两个候选点s1,s2之间的采样点个数差:
SDs1,s2=abs(SDs1-SDs2)
其中abs表示求取绝对值,并选出所有满足max(SDs1,s2)≤threshold的候选点,只保留其中任意一个候选点,删除其他候选点,避免重复计算,Threshold定义为:
<mrow> <mi>t</mi> <mi>h</mi> <mi>r</mi> <mi>e</mi> <mi>s</mi> <mi>h</mi> <mi>o</mi> <mi>l</mi> <mi>d</mi> <mo>=</mo> <mrow> <mo>(</mo> <mfrac> <mn>1</mn> <mn>5</mn> </mfrac> <mo>&amp;times;</mo> <mfrac> <mi>&amp;lambda;</mi> <mi>v</mi> </mfrac> <mo>&amp;times;</mo> <mi>f</mi> <mi>s</mi> <mo>)</mo> </mrow> </mrow>
其中,λ表示声音波长。
4.根据权利要求3所述麦克风阵列声源空间实时定位方法,其特征在于,所述采样频率fs为16000Hz时,设置threshold=1。
5.根据权利要求3所述麦克风阵列声源空间实时定位方法,其特征在于,所述TDOA向量和采样点差SD向量的计算以及候选点的挑选,预先做好并存储在一个查找表中,在声源定位时,直接根据索引查找,不用重复计算。
6.根据权利要求3所述麦克风阵列声源空间实时定位方法,其特征在于,所述候选点的可控功率响应输出计算方法如下:
假定筛选得到的候选点位于空间位置s处,Xi(ω)和Xj(ω)分别代表第i个麦克风接收信号xi(t)和第j个麦克风接收信号xj(t)的傅里叶变换,τi表示声源到第i个麦克风的传输延迟,τji表示s处声源到第j个麦克风和第i个麦克风的时延差,根据可控功率响应-相位变换法的定义,可得声源s的可控功率响应输出PPHAT(s)为:
<mrow> <msup> <mi>P</mi> <mrow> <mi>P</mi> <mi>H</mi> <mi>A</mi> <mi>T</mi> </mrow> </msup> <mrow> <mo>(</mo> <mi>s</mi> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>m</mi> </munderover> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>m</mi> </munderover> <msubsup> <mo>&amp;Integral;</mo> <mrow> <mo>-</mo> <mi>&amp;infin;</mi> </mrow> <mi>&amp;infin;</mi> </msubsup> <mfrac> <mrow> <msub> <mi>&amp;Psi;</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>&amp;omega;</mi> <mo>)</mo> </mrow> </mrow> <mrow> <mo>|</mo> <msub> <mi>&amp;Psi;</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>&amp;omega;</mi> <mo>)</mo> </mrow> <mo>|</mo> </mrow> </mfrac> <msup> <mi>e</mi> <mrow> <msub> <mi>j&amp;omega;&amp;tau;</mi> <mrow> <mi>j</mi> <mi>i</mi> </mrow> </msub> </mrow> </msup> <mi>d</mi> <mi>&amp;omega;</mi> </mrow>
其中表示两者之间的互功率谱密度,m为麦克风的总个数,对所有筛选得到的候选点计算PPHAT(s)。
7.根据权利要求1所述麦克风阵列声源空间实时定位方法,其特征在于,所述方式一中,在四元麦克风阵列条件下,选择N=100时。
8.根据权利要求1所述麦克风阵列声源空间实时定位方法,其特征在于,在最终确定的声源结果附近小范围内使用网格法精确搜索;或者根据查找表,首先得到若干可控功率响应输出最大值的对应区域,找到这些区域附近网格中的所有候选点,然后计算这些候选点的可控功率响应,选取最大的位置作为最终的声源估计位置。
CN201610391351.9A 2016-06-03 2016-06-03 一种麦克风阵列声源空间实时定位方法 Active CN106093864B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610391351.9A CN106093864B (zh) 2016-06-03 2016-06-03 一种麦克风阵列声源空间实时定位方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610391351.9A CN106093864B (zh) 2016-06-03 2016-06-03 一种麦克风阵列声源空间实时定位方法

Publications (2)

Publication Number Publication Date
CN106093864A CN106093864A (zh) 2016-11-09
CN106093864B true CN106093864B (zh) 2018-04-17

Family

ID=57447696

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610391351.9A Active CN106093864B (zh) 2016-06-03 2016-06-03 一种麦克风阵列声源空间实时定位方法

Country Status (1)

Country Link
CN (1) CN106093864B (zh)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107167770B (zh) * 2017-06-02 2019-04-30 厦门大学 一种混响条件下的麦克风阵列声源定位装置
CN107621625B (zh) * 2017-06-23 2020-07-17 桂林电子科技大学 基于双微麦克风阵的声源定位方法
CN109669158B (zh) * 2017-10-16 2021-04-20 杭州海康威视数字技术股份有限公司 一种声源定位方法、***、计算机设备及存储介质
US11079462B2 (en) 2017-10-24 2021-08-03 International Business Machines Corporation Facilitation of efficient signal source location employing a coarse algorithm and high-resolution computation
CN108549052B (zh) * 2018-03-20 2021-04-13 南京航空航天大学 一种时频-空域联合加权的圆谐域伪声强声源定位方法
CN108872939B (zh) * 2018-04-29 2020-09-29 桂林电子科技大学 基于声学镜像模型的室内空间几何轮廓重构方法
CN108417036A (zh) * 2018-05-07 2018-08-17 北京中电慧声科技有限公司 智能交通***中车辆鸣笛声源定位方法及装置
CN109709517B (zh) * 2018-12-10 2022-08-16 东南大学 基于模拟退火算法的srp-phat声源定位网格搜索方法
CN109741609B (zh) * 2019-02-25 2021-05-04 南京理工大学 一种基于麦克风阵列的机动车鸣笛声监测方法
CN110082724B (zh) * 2019-05-31 2021-09-21 浙江大华技术股份有限公司 一种声源定位方法、装置及存储介质
CN110544490B (zh) * 2019-07-30 2022-04-05 南京工程学院 一种基于高斯混合模型和空间功率谱特征的声源定位方法
CN111273231A (zh) * 2020-03-23 2020-06-12 桂林电子科技大学 基于不同麦克风阵列拓扑结构分析的室内声源定位方法
CN111443329A (zh) * 2020-03-25 2020-07-24 北京东方振动和噪声技术研究所 声源定位方法及装置、计算机存储介质和电子设备
CN111856400B (zh) * 2020-07-29 2021-04-09 中北大学 一种水下目标声源定位方法及***
CN111929645B (zh) * 2020-09-23 2021-01-26 深圳市友杰智新科技有限公司 特定人声的声源定位方法、装置和计算机设备
CN113419216B (zh) * 2021-06-21 2023-10-31 南京信息工程大学 一种适用于混响环境的多声源定位方法
CN113791386B (zh) * 2021-08-06 2024-03-29 浙江大华技术股份有限公司 声源的定位方法、装置、设备及计算机可读存储介质
CN115184868B (zh) * 2022-07-04 2024-07-02 杭州爱谱科技有限公司 一种定位噪声源三维位置的方法
CN115452141B (zh) * 2022-11-08 2023-03-31 杭州兆华电子股份有限公司 一种非均匀声学成像方法
CN117368847B (zh) * 2023-12-07 2024-03-15 深圳市好兄弟电子有限公司 基于麦克风射频通信网络的定位方法及***

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101483269B1 (ko) * 2008-05-06 2015-01-21 삼성전자주식회사 로봇의 음원 위치 탐색 방법 및 그 장치
CN101762806B (zh) * 2010-01-27 2013-03-13 华为终端有限公司 声源定位方法和装置
KR101767925B1 (ko) * 2012-07-26 2017-08-18 한화테크윈 주식회사 음원 위치 추정 장치 및 방법
CN104142492B (zh) * 2014-07-29 2017-04-05 佛山科学技术学院 一种srp‑phat多源空间定位方法

Also Published As

Publication number Publication date
CN106093864A (zh) 2016-11-09

Similar Documents

Publication Publication Date Title
CN106093864B (zh) 一种麦克风阵列声源空间实时定位方法
US11064294B1 (en) Multiple-source tracking and voice activity detections for planar microphone arrays
Do et al. A real-time SRP-PHAT source location implementation using stochastic region contraction (SRC) on a large-aperture microphone array
CN102103200B (zh) 一种分布式非同步声传感器的声源空间定位方法
CN111474521B (zh) 多径环境中基于麦克风阵列的声源定位方法
US9706298B2 (en) Method and apparatus for localization of an acoustic source and acoustic beamforming
CN105388459B (zh) 分布式麦克风阵列网络的鲁棒声源空间定位方法
CN110610718B (zh) 一种提取期望声源语音信号的方法及装置
Badali et al. Evaluating real-time audio localization algorithms for artificial audition in robotics
CN110495185B (zh) 语音信号处理方法及装置
CN112799017B (zh) 声源定位方法、装置、存储介质及电子设备
Pujol et al. BeamLearning: An end-to-end deep learning approach for the angular localization of sound sources using raw multichannel acoustic pressure data
Hosseini et al. Time difference of arrival estimation of sound source using cross correlation and modified maximum likelihood weighting function
Dmochowski et al. Steered beamforming approaches for acoustic source localization
US11474194B2 (en) Controlling a device by tracking movement of hand using acoustic signals
CN108872939B (zh) 基于声学镜像模型的室内空间几何轮廓重构方法
Velázquez et al. DOA estimation for spherical microphone array using spherical convolutional neural networks
CN111933182B (zh) 声源跟踪方法、装置、设备和存储介质
Dmochowski et al. Fast steered response power source localization using inverse mapping of relative delays
CN109239665B (zh) 一种基于信号子空间相似度谱和粒子滤波器的多声源连续定位方法和装置
Lim et al. Improved generalized cross correlation-phase transform based time delay estimation by frequency domain autocorrelation
Ihara et al. Multichannel speech separation and localization by frequency assignment
Sledevič et al. An evaluation of hardware-software design for sound source localization based on SoC
CN105676167A (zh) 一种基于声学矢量传感器和双谱变换的鲁棒单语者声源doa估计方法
Simon et al. Acoustic source localization in sensor networks with low communication bandwidth

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant