CN106291469B - 一种三维空间音源定位方法及*** - Google Patents

一种三维空间音源定位方法及*** Download PDF

Info

Publication number
CN106291469B
CN106291469B CN201610909122.1A CN201610909122A CN106291469B CN 106291469 B CN106291469 B CN 106291469B CN 201610909122 A CN201610909122 A CN 201610909122A CN 106291469 B CN106291469 B CN 106291469B
Authority
CN
China
Prior art keywords
sound
source
microphone
cosh
microphones
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610909122.1A
Other languages
English (en)
Other versions
CN106291469A (zh
Inventor
王恒
张聪
郭峰林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Polytechnic University
Original Assignee
Wuhan Polytechnic University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Polytechnic University filed Critical Wuhan Polytechnic University
Priority to CN201610909122.1A priority Critical patent/CN106291469B/zh
Publication of CN106291469A publication Critical patent/CN106291469A/zh
Application granted granted Critical
Publication of CN106291469B publication Critical patent/CN106291469B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S5/00Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
    • G01S5/18Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
    • G01S5/22Position of source determined by co-ordinating a plurality of position lines defined by path-difference measurements

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

本发明提出一种三维空间音源定位方法及***,包括设置包括多个麦克风的麦克风组,利用多个麦克风分别录制的声源信号估计声源的距离;对设置的多个麦克风两两组合,任意两个组合为一对麦克风,对于每一对麦克风分别计算声源处于两个麦克风间的角度,得到声源处于两个麦克风之间的方位角;对于每一对麦克风,结合估算得到的声源距离,确定三维空间中一虚拟音源的位置;选择一个观测点,对于各对麦克风确定的虚拟音源进行正交分解,计算音源的水平角和高度角,定位音源的三维空间位置。本发明实时获取声源的三维空间方位及其大小,为安防监控和机器人等领域在非可见区域提供可靠的发声物体的定位技术方案。

Description

一种三维空间音源定位方法及***
技术领域
本发明属于声学处理领域,特别涉及一种三维空间音源定位方法及***。
背景技术
在安防监控的应用中,要随时捕抓突发事件的发生,而只有及时准确的获得周围的有用信息,做出准确的判断,才能采取快速有效的应急措施。
传统安防应用中主要是依赖监控影像内容来判断,这需要有专门的人员对各个监控点进行查看,而且无法察觉到在监控范围以外发生的突发事件。理想情况是,在无人职守、专业人员闭目养神、监控盲点等的情况下,能够自动实现对突发事件的预警,相关监控人员可快速定位事件发生方位、初步判断事件发生的主体等信息,再通过监控影像进行查看验证,从而做到尽量不遗漏任何发生的突发事件。同时在应急措施执行方面,对存在的危险状况的快速传递也不可或缺。如在事故发生现场,应急措施首先通过广播等方式快速传递,以免在相关处理人员到达现场前发生更大的无谓损失。通过及时判断,才能及时采取应急措施,但是目前尚没有相关技术方案出现。
发明内容
本发明针对现有技术及设备的不足,提供了一种三维空间音源定位方法及***。
本发明通过不在平面上的多个麦克风对空间声音信号进行录音,用本发明提供的定位方法获取音源的空间位置和距离。
本发明的技术方案提供一种三维空间音源定位方法,包括以下步骤,
步骤1,设置包括多个麦克风的麦克风组,利用多个麦克风分别录制的声源信号估计声源的距离,得到声源距离D;
步骤2,对设置的多个麦克风两两组合,任意两个组合为一对麦克风,对于每一对麦克风分别计算声源处于两个麦克风间的角度,得到声源处于两个麦克风之间的方位角α;
步骤3,对于每一对麦克风,获得声源处于两个麦克风之间的方位角α后,结合估算得到的声源距离D,确定三维空间中一虚拟音源的位置;
步骤4,选择一个观测点,对于各对麦克风确定的虚拟音源进行正交分解,计算音源的水平角和高度角,定位音源的三维空间位置。
而且,步骤2中,基于任意一对麦克风,进行双耳线索的空间音源定位,得到声源处于两个麦克风之间的方位角α,实现方式如下,
包括以下子步骤,
步骤2.1,通过两个麦克风对空间声音信号进行录音,对录制信号进行降噪处理,确定声源类型;
步骤2.2,对降噪后的信号进行时频变换和频带划分处理,得到三个频带,分别为中低频、中高频和高频;
步骤2.3,对三个频带分别提取双耳线索参数,包括双耳强度差、双耳时间差以及双耳相关性;
步骤2.4,对各频带分别确定参数组合,包括在中低频选择ITD和IC参数,在中高频和高频选择ILD和IC参数;
步骤2.5,根据步骤2.4所选参数的参数值,确定各频带相应的声源方位及大小,得到低频、中高频、高频带相应水平角α1、α2、α3,对应的声源大小分别为β1、β2、β3
步骤2.6,根据声源类型和各频带的方位和大小估计原始声源方位和大小,实现方式如下,
设估计得到的原始声源水平角为α,对应的声源大小分别为β,则声源的最终方位和大小计算如下,
α=(α1N12N23N3)/3
β=(β1N12N23N3)/3
其中,权值N1、N2、N3计算方式如下,
设n1、n2、n3表示声源在三个频带覆盖的子频带个数,
其中,i=1、2、3。
而且,频带划分处理方式为,1.5kHz以下部分为中低频区,1.5~6kHz部分为中高频,6kHz以上部分为高频。
而且,步骤2.5中,通过参照预设的查找表进行查表,或者根据预设的函数关系计算,确定各频带相应的声源方位及大小。
而且,麦克风组包括正三角形分布的三个麦克风,步骤5中,观测点选择应用场景中仪器的中心点,与麦克风组的中心点重合,
设虚拟音源A、B、C和真实音源V所对应的水平角分别为αA、αB、αC、αV,对应的高度角分别为βA、βB、βC、βV,三个虚拟音源对应的增益系数g1=g2=g3=g,g为虚拟音源或实际音源到坐标原点的距离;
假设球形声场半径为单位1,各个虚拟音源到坐标轴原点的距离均为1,各点坐标如下:
A(x1 y1 z1)=(g1cosβAcosαA g1cosβAsinαA g1sinβA)
B(x2 y2 z2)=(g2cosβBcosαB g2cosβBsinαB g2sinβB)
C(x3 y3 z3)=(g3cosβCcosαC g3cosβCsinαC g3sinβC)
V(x y z)=(gcosβVcosαV gcosβVsinαV gsinβV)
V点坐标由A、B、C三点坐标进行表示如下,
g1cosβacosαa+g2cosβbcosαb+g3cosβccosαc=gcosβvcosαv
g1cosβasinαa+g2cosβbsinαb+g3cosβcsinαc=gcosβvsinαv
g1sinβa+g2sinβb+g3sinβc=gsinβv
根据以上两式得到音源相对于球心的坐标。
本发明相应提供一种三维空间音源定位***,包括以下单元,
第一单元,用于设置包括多个麦克风的麦克风组,利用多个麦克风分别录制的声源信号估计声源的距离,得到声源距离D;
第二单元,用于对设置的多个麦克风两两组合,任意两个组合为一对麦克风,对于每一对麦克风分别计算声源处于两个麦克风间的角度,得到声源处于两个麦克风之间的方位角α;
第三单元,用于对于每一对麦克风,获得声源处于两个麦克风之间的方位角α后,结合估算得到的声源距离D,确定三维空间中一虚拟音源的位置;
第四单元,用于选择一个观测点,对于各对麦克风确定的虚拟音源进行正交分解,计算音源的水平角和高度角,定位音源的三维空间位置。
而且,第二单元包括以下模块,
第一模块,用于通过两个麦克风对空间声音信号进行录音,对录制信号进行降噪处理,确定声源类型;
第二模块,用于对降噪后的信号进行时频变换和频带划分处理,得到三个频带,分别为中低频、中高频和高频;
第三模块,用于对三个频带分别提取双耳线索参数,包括双耳强度差、双耳时间差以及双耳相关性;
第四模块,用于对各频带分别确定参数组合,包括在中低频选择ITD和IC参数,在中高频和高频选择ILD和IC参数;
第五模块,用于根据第四模块所选参数的参数值,确定各频带相应的声源方位及大小,得到低频、中高频、高频带相应水平角α1、α2、α3,对应的声源大小分别为β1、β2、β3
第六模块,用于根据声源类型和各频带的方位和大小估计原始声源方位和大小,实现方式如下,
设估计得到的原始声源水平角为α,对应的声源大小分别为β,则声源的最终方位和大小计算如下,
α=(α1N12N23N3)/3
β=(β1N12N23N3)/3
其中,权值N1、N2、N3计算方式如下,
设n1、n2、n3表示声源在三个频带覆盖的子频带个数,
其中,i=1、2、3。
而且,频带划分处理方式为,1.5kHz以下部分为中低频,1.5~6kHz部分为中高频,6kHz以上部分为高频。
而且,第五模块中,通过参照预设的查找表进行查表,或者根据预设的函数关系计算,确定各频带相应的声源方位及大小。
而且,麦克风组包括正三角形分布的三个麦克风,第五模块中,观测点选择应用场景中仪器的中心点,与麦克风组的中心点重合,
设虚拟音源A、B、C和真实音源V所对应的水平角分别为αA、αB、αC、αV,对应的高度角分别为βA、βB、βC、βV,三个虚拟音源对应的增益系数g1=g2=g3=g,g为虚拟音源或实际音源到坐标原点的距离;
假设球形声场半径为单位1,各个虚拟音源到坐标轴原点的距离均为1,各点坐标如下:
A(x1 y1 z1)=(g1cosβAcosαA g1cosβAsinαA g1sinβA)
B(x2 y2 z2)=(g2cosβBcosαB g2cosβBsinαB g2sinβB)
C(x3 y3 z3)=(g3cosβCcosαC g3cosβCsinαC g3sinβC)
V(x y z)=(gcosβVcosαV gcosβVsinαV gsinβV)
V点坐标由A、B、C三点坐标进行表示如下,
g1cosβa cosαa+g2cosβb cosαb+g3cosβc cosαc=gcosβv cosαv
g1cosβa sinαa+g2cosβb sinαb+g3cosβc sinαc=gcosβv sinαv
g1sinβa+g2sinβb+g3sinβc=gsinβv
根据以上两式得到音源相对于球心的坐标。采用本发明提供的三维空间音源定位方法及***,能实时获取声源的三维空间位置及其大小,为安防监控和机器人等领域在非可见区域提供可靠的发声物体的定位技术方案能够预防风险,降低损失,具有重要的市场价值。
附图说明
图1为本发明实施例三个麦克风的布置图。
图2为本发明实施例通过方位角和距离确定虚拟音源示意图。
图3为本发明实施例的音源定位示意图。
具体实施方式
以下结合附图对本发明技术方案进行说明。
步骤1,设置包括多个麦克风的麦克风组,利用多个麦克风分别录制的声源信号估计声源的距离;
麦克风组包括三个以上麦克风,实施例采用优选方案,设置三个麦克风进行录制。麦克风数目越多越精确,但成本和复杂度会相应提高。声源距离的估计方法有很多,如现有技术中直反比的估算方法,首先选择一个离其他麦克风距离和最小的麦克风,分离其直接声音和回声,通过计算分离直达声和反射声的能量比,针对不同的环境估计声源距离,例如应用环境可以分为室内和室外,进一步可以分不同类型的室外场景。
由于本步骤进行的初步声源距离估算精度不高,且一般麦克风之间距离较小,因此便于计算起见,具体实施时可以选择一个靠近麦克风组中心位置的麦克风来估算,作为距离估算得到的声源距离D。
步骤2,对设置的多个麦克风两两组合,即任意两个组合为一对麦克风,对于每一对麦克风分别计算声源处于两个麦克风间的角度,得到声源处于两个麦克风之间的方位角α;
本实施例以三个麦克风摆放成正三角形,且有一边与参考平面(一般为地平面)平行,三角形与地面垂直放置。参见图1,设三个麦克风分别为a、b、c,相应有三对{a、b}、{b、c}、{c、a},麦克风间的距离记为L,设声源处于麦克风{a、b}、{b、c}、{c、a}之间的方位角α分别记为αab、αbc、αca
本发明进一步提出,基于任意一对麦克风,进行双耳线索的空间音源定位,得到声源处于两个麦克风之间的方位角α,实现方式如下,
步骤2.1,通过两个麦克风对空间声音信号进行录音,对录制信号进行降噪处理,确定声源的类型;
根据这对麦克风对空间声音信号进行录音的结果,先将录制信号进行降噪处理,以消除录制设备和环境中的本底噪声。对录制的信号进行声源类型检测,如静音,则无发声源,不用进行以下步骤;如有声源发声,则需检测声源类型,如人声,枪声,汽车声等等,再进入以下步骤。各种声音信号的频率范围已经有大量的统计结果,具体实施时,可以根据各种声音信号的频率范围、能量变化趋势等实现声源类型检测。
步骤2.2,对降噪后的信号进行时频变换和频带划分处理;
对降噪后的信号先进行时频变换,再将音频信号的频谱进行频带划分,本实施例中将频带划分为三部分,1.5kHz以下部分的中低频,1.5~6kHz部分的中高频,6kHz以上部分的高频。
现有技术的常规划分方法是按照人感知特性划分为24个子频带,具体划分如下:
本发明是由于ILD在1.5kHz以上起主要作用,ITD在1.5kHz以下起主要作用,因此提出对这些子频带进行合并处理,优选方案为:第一个频带合并前十个子频带,第二个合并中间九个子频带,最后五个子频带作为一个频带。
步骤2.3,对各频带提取双耳线索参数,包括双耳强度差,双耳时间差以及双耳相关性;
对录制信号的每个子带进行双耳线索提取。三个线索参数计算方法很多,优选地,本实施例采用如下方式计算:
(1)双耳强度差ILD线索的提取
ILD定义为两个麦克风录制信号对应子带的能量比。计算方法如式(1)所示:
其中,x1(n)和x2(n)分别表示两个麦克风录制信号的子带信号,N为子带信号长度。
(2)双耳时间差ITD线索的提取
计算方法如式(2)所示:
其中,d则表示延迟采样数。
(3)双耳相关性IC线索的提取
计算方式如式(3)所示:
步骤2.4,确定各频带相应的参数组合;
由于ILD在1.5kHz以上起主要作用,ITD在1.5kHz以下起主要作用,因此在选择参数的时候参照此规则,实施例根据相应频带划分方式,在中低频选择ITD和IC参数,在中高频和高频选择ILD和IC参数。当采用其他频带划分方式时,也应参考此规则。
步骤2.5,根据参数值,参照预设的查找表进行查表,或者根据预设的函数关系计算,确定各频带相应声源的方位及其大小,得到低频、中高频、高频带相应水平角α1、α2、α3,对应的声源大小分别为β1、β2、β3
得到ILD、ITD值之后,根据ILD、ILD与水平角的对应关系可以计算或者查找其相应的角度值。ILD、ITD与水平角的对应关系可通过实验获得查找表或者函数关系,从而通过查表或者计算得到声源的水平角。得到IC之后,根据IC与声源大小的对应关系可以计算或者查找声源的大小。IC与声源大小的对应关系可通过实验获得查找表或者函数关系,从而通过查表或者计算得到声源的大小。在本步骤根据步骤2.4的选择,利用步骤2.3的结果即可。
ILD、ILD与水平角的对应关系的规律是:ILD值在[0,15]之间变化水平方位角在[0,90°],大于15都是90°;ITD在[0,700ms]之间变化水平方位角在[0,90°],大于700ms也都是90°;且他们都是随着参数值变大逐渐增大到90°。IC与声源大小的对应关系规律是:IC在[0,1]之间变化声源大小,是从完全独立的两个声源到一个点。具体实施时,建议预先建立相应查找表,运行本方法流程时直接调用以提高效率。
步骤2.6,根据声源类型和各频带的方位和大小估算声源方位和大小。
由于不同的音源的频率范围不同,因此估算声源在不同频带的比重不一样:比如敲门声的频率范围是500—1000Hz,主要集中在中低频,因此在估算声源方位时,中低频频带的计算权值接近与1,其他两个频带接近于0;门铃声频率范围是1000—2000Hz,主要集中在中高频带,部分在中低频带,因此在估算声源方位时,中低频频带的计算权值可取0.3,中高频频带的计算权值可取0.7,另一个频带可取0;汽车喇叭声的频率范围是1500—3000Hz,主要集中在中高频,因此在估算声源方位时,中高频频带的计算权值接近于1,其他两个频带接近于0。因此根据频率范围落在不同频带的重合区域不同,不同频带计算权值可取不同值,计算方式为:因为声源的频率可能包括在三个大频带中的几个子频带,用n1、n2、n3表示声源在三个频带覆盖的子频带个数。则权值的计算公式为:
(i为1、2、3)
频带参数权值计算具体取值可在实际使用时由本领域技术人员自行微调,以便定位更加准确。
根据不同频带计算的声源水平角和声源大小乘以他们的权值,最后估算出声源的最终方位和大小。
设中低频、中高频、高频带算出的水平角以及最后计算得到的声源水平角分别为α1、α2、α3、α(取值介于0度到180度),对应的声源大小分别为β1、β2、β3、β(取值介于0到1)。则声源的最终方位和大小的计算公式为:
α=(α1N12N23N3)/3
β=(β1N12N23N3)/3
步骤3,对于每一对麦克风,获得声源处于两个麦克风之间的方位角α后,结合步骤1估算得到的声源距离D,可确定三维空间中一虚拟音源的位置;
如图2所示,该平面是包含两个麦克风并与三个麦克风所处的平面垂直,Y轴是两个麦克风的中垂线,获得声源处于两个麦克风之间的方位角α后,结合估算得到的声源距离D,可确定三维空间中一虚拟音源的位置;
设声源处于麦克风{a、b}、{b、c}、{c、a}之间的方位角α分别记为αab、αbc、αca,结合估算得到的声源距离D,各确定三维空间中一虚拟音源的位置,三个虚拟音源记为A、B、C。
步骤4,选择一个观测点,对于各对麦克风确定的虚拟音源进行正交分解,计算音源的水平角和高度角,定位音源的三维空间位置;
优选地,观测点选择应用场景中仪器的中心点,比如监控应用中是摄像头的中心点。更进一步地,仪器的中心点与麦克风组的中心点重合,便于运算。
如图3所示,三维空间的笛卡尔坐标系的三个轴XYZ两两垂直,以3D球形声场的球心为原点(即观测点,)建立三维坐标模型(各虚拟音源位于球形声场的球面上),已知虚拟音源A、B、C和真实音源V所对应的水平角分别为αA、αB、αC、αV(取值介于0度到359度),对应的高度角分别为βA、βB、βC、βV(取值介于-90度到90度),由于麦克风组的三个麦克风为正三角形分布,三个虚拟音源对应的增益系数g1=g2=g3=g,g为虚拟音源或实际音源到坐标原点的距离。假设球形声场半径为单位1,那么各个虚拟音源到坐标轴原点的距离均为1,各点坐标如下:
V点坐标可以由A、B、C三点坐标进行表示,分别进行表示则有:
g1cosβacosαa+g2cosβbcosαb+g3cosβccosαc=gcosβvcosαv
g1cosβasinαa+g2cosβbsinαb+g3cosβcsinαc=gcosβvsinαv (4)
g1sinβa+g2sinβb+g3sinβc=gsinβv
结合公式(3)、(4)可得到音源相对于球心的坐标,即可定位音源的三维空间位置。
上述方法用于根据估计所得原始声源位置和大小,控制摄像头向安防声源转动,并根据声源距离和大小调整焦距。
具体实施时,本发明所提供方法可基于软件技术实现自动运行流程,也可采用模块化方式实现相应***。
本发明实施例相应提供一种三维空间音源定位***,包括以下单元,
第一单元,用于设置包括多个麦克风的麦克风组,利用多个麦克风分别录制的声源信号估计声源的距离,得到声源距离D;
第二单元,用于对设置的多个麦克风两两组合,任意两个组合为一对麦克风,对于每一对麦克风分别计算声源处于两个麦克风间的角度,得到声源处于两个麦克风之间的方位角α;
第三单元,用于对于每一对麦克风,获得声源处于两个麦克风之间的方位角α后,结合估算得到的声源距离D,确定三维空间中一虚拟音源的位置;
第四单元,用于选择一个观测点,对于各对麦克风确定的虚拟音源进行正交分解,计算音源的水平角和高度角,定位音源的三维空间位置,
进一步地,第二单元包括以下模块,
第一模块,用于通过两个麦克风对空间声音信号进行录音,对录制信号进行降噪处理,确定声源类型;
第二模块,用于对降噪后的信号进行时频变换和频带划分处理,得到三个频带,分别为中低频、中高频和高频;
第三模块,用于对三个频带分别提取双耳线索参数,包括双耳强度差、双耳时间差以及双耳相关性;
第四模块,用于对各频带分别确定参数组合,包括在中低频选择ITD和IC参数,在中高频和高频选择ILD和IC参数;
第五模块,用于根据第四模块所选参数的参数值,确定各频带相应的声源方位及大小,得到低频、中高频、高频带相应水平角α1、α2、α3,对应的声源大小分别为β1、β2、β3
第六模块,用于根据声源类型和各频带的方位和大小估计原始声源方位和大小,实现方式如下,
设估计得到的原始声源水平角为α,对应的声源大小分别为β,则声源的最终方位和大小计算如下,
α=(α1N12N23N3)/3
β=(β1N12N23N3)/3
其中,权值N1、N2、N3计算方式如下,
设n1、n2、n3表示声源在三个频带覆盖的子频带个数,
其中,i=1、2、3。
各部分具体实现可参见方法部分,本发明不予赘述。
本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

Claims (8)

1.一种三维空间音源定位方法,其特征在于:包括以下步骤,
步骤1,设置包括多个麦克风的麦克风组,利用多个麦克风分别录制的声源信号估计声源的距离,包括选择一个靠近麦克风组中心位置的麦克风估算得到声源距离D;
步骤2,对设置的多个麦克风两两组合,任意两个组合为一对麦克风,对于每一对麦克风分别计算声源处于两个麦克风间的角度,得到声源处于两个麦克风之间的方位角α;
步骤3,对于每一对麦克风,获得声源处于两个麦克风之间的方位角α后,结合估算得到的声源距离D,确定三维空间中一虚拟音源的位置,包括根据两个麦克风的中垂线偏移方位角α后,确定声源距离D处为虚拟音源的位置;
步骤4,选择一个观测点,对于各对麦克风确定的虚拟音源进行正交分解,计算音源的水平角和高度角,定位音源的三维空间位置,包括观测点选择应用场景中仪器的中心点,仪器的中心点与麦克风组的中心点重合,以观测点为原点建立三维坐标模型,各虚拟音源位于球形声场的球面上,根据各个虚拟音源的坐标得到音源相对于球心的坐标,实现定位音源的三维空间位置;
麦克风组包括正三角形分布的三个麦克风,步骤4中,观测点选择应用场景中仪器的中心点,与麦克风组的中心点重合,
设虚拟音源A、B、C和真实音源V所对应的水平角分别为SA、SB、SC、SV,对应的高度角分别为HA、HB、HC、HV,三个虚拟音源对应的增益系数g1=g2=g3=g,g为虚拟音源或实际音源到坐标原点的距离;
假设球形声场半径为单位1,各个虚拟音源到坐标轴原点的距离均为1,各点坐标如下:
A(x1 y1 z1)=(g1cosHAcosSA g1cosHAsinSA g1sinHA)
B(x2 y2 z2)=(g2cosHBcosSB g2cosHBsinSB g2sinHB)
C(x3 y3 z3)=(g3cosHCcosSC g3cosHCsinSC g3sinHC)
V(x y z)=(gcosHVcosSV gcosHVsinSV gsinHV)
V点坐标由A、B、C三点坐标进行表示如下,
g1cosHAcosSA+g2cosHBcosSB+g3cosHCcosSC=gcosHVcosSV
g1cosHAsinSA+g2cosHBsinSB+g3cosHCsinSC=gcosHVsinSV
g1sinHA+g2sinHB+g3sinHC=gsinHV
根据以上两式得到音源相对于球心的坐标。
2.根据权利要求1所述三维空间音源定位方法,其特征在于:步骤2中,基于任意一对麦克风,进行双耳线索的空间音源定位,得到声源处于两个麦克风之间的方位角α,实现方式如下,
包括以下子步骤,
步骤2.1,通过两个麦克风对空间声音信号进行录音,对录制信号进行降噪处理,确定声源类型;
步骤2.2,对降噪后的信号进行时频变换和频带划分处理,得到三个频带,分别为中低频、中高频和高频;
步骤2.3,对三个频带分别提取双耳线索参数,包括双耳强度差、双耳时间差以及双耳相关性;
步骤2.4,对各频带分别确定参数组合,包括在中低频选择ITD和IC参数,在中高频和高频选择ILD和IC参数;
步骤2.5,根据步骤2.4所选参数的参数值,确定各频带相应的声源方位及大小,得到低频、中高频、高频带相应方位角α1、α2、α3,对应的声源大小分别为β1、β2、β3
步骤2.6,根据声源类型和各频带的方位和大小估计原始声源方位和大小,实现方式如下,
设估计得到的原始声源方位角为α,对应的声源大小分别为β,则声源的最终方位和大小计算如下,
α=(α1N12N23N3)/3
β=(β1N12N23N3)/3
其中,权值N1、N2、N3计算方式如下,
设n1、n2、n3表示声源在三个频带覆盖的子频带个数,
其中,i=1、2、3。
3.根据权利要求2所述三维空间音源定位方法,其特征在于:频带划分处理方式为,1.5kHz以下部分为中低频区,1.5~6kHz部分为中高频,6kHz以上部分为高频。
4.根据权利要求2所述三维空间音源定位方法,其特征在于:步骤2.5中,通过参照预设的查找表进行查表,或者根据预设的函数关系计算,确定各频带相应的声源方位及大小。
5.一种三维空间音源定位***,其特征在于:包括以下单元,
第一单元,用于设置包括多个麦克风的麦克风组,利用多个麦克风分别录制的声源信号估计声源的距离,包括选择一个靠近麦克风组中心位置的麦克风估算得到声源距离D;
第二单元,用于对设置的多个麦克风两两组合,任意两个组合为一对麦克风,对于每一对麦克风分别计算声源处于两个麦克风间的角度,得到声源处于两个麦克风之间的方位角α;
第三单元,用于对于每一对麦克风,获得声源处于两个麦克风之间的方位角α后,结合估算得到的声源距离D,确定三维空间中一虚拟音源的位置,包括根据两个麦克风的中垂线偏移方位角α后,确定声源距离D处为虚拟音源的位置;
第四单元,用于选择一个观测点,对于各对麦克风确定的虚拟音源进行正交分解,计算音源的水平角和高度角,定位音源的三维空间位置,包括观测点选择应用场景中仪器的中心点,仪器的中心点与麦克风组的中心点重合,以观测点为原点建立三维坐标模型,各虚拟音源位于球形声场的球面上,根据各个虚拟音源的坐标得到音源相对于球心的坐标,实现定位音源的三维空间位置;
麦克风组包括正三角形分布的三个麦克风,第四单元中,观测点选择应用场景中仪器的中心点,与麦克风组的中心点重合,
设虚拟音源A、B、C和真实音源V所对应的水平角分别为SA、SB、SC、SV,对应的高度角分别为HA、HB、HC、HV,三个虚拟音源对应的增益系数g1=g2=g3=g,g为虚拟音源或实际音源到坐标原点的距离;
假设球形声场半径为单位1,各个虚拟音源到坐标轴原点的距离均为1,各点坐标如下:
A(x1 y1 z1)=(g1cosHAcosSA g1cosHAsinSA g1sinHA)
B(x2 y2 z2)=(g2cosHBcosSB g2cosHBsinSB g2sinHB)
C(x3 y3 z3)=(g3cosHCcosSC g3cosHCsinSC g3sinHC)
V(x y z)=(gcosHVcosSV gcosHVsinSV gsinHV)
V点坐标由A、B、C三点坐标进行表示如下,
g1cosHAcosSA+g2cosHBcosSB+g3cosHCcosSC=gcosHVcosSV
g1cosHAsinSA+g2cosHBsinSB+g3cosHCsinSC=gcosHVsinSV
g1sinHA+g2sinHB+g3sinHC=gsinHV
根据以上两式得到音源相对于球心的坐标。
6.根据权利要求5所述三维空间音源定位***,其特征在于:第二单元包括以下模块,
第一模块,用于通过两个麦克风对空间声音信号进行录音,对录制信号进行降噪处理,确定声源类型;
第二模块,用于对降噪后的信号进行时频变换和频带划分处理,得到三个频带,分别为中低频、中高频和高频;
第三模块,用于对三个频带分别提取双耳线索参数,包括双耳强度差、双耳时间差以及双耳相关性;
第四模块,用于对各频带分别确定参数组合,包括在中低频选择ITD和IC参数,在中高频和高频选择ILD和IC参数;
第五模块,用于根据第四模块所选参数的参数值,确定各频带相应的声源方位及大小,得到低频、中高频、高频带相应方位角α1、α2、α3,对应的声源大小分别为β1、β2、β3
第六模块,用于根据声源类型和各频带的方位和大小估计原始声源方位和大小,实现方式如下,
设估计得到的原始声源方位角为α,对应的声源大小分别为β,则声源的最终方位和大小计算如下,
α=(α1N12N23N3)/3
β=(β1N12N23N3)/3
其中,权值N1、N2、N3计算方式如下,
设n1、n2、n3表示声源在三个频带覆盖的子频带个数,
其中,i=1、2、3。
7.根据权利要求6所述三维空间音源定位***,其特征在于:频带划分处理方式为,1.5kHz以下部分为中低频,1.5~6kHz部分为中高频,6kHz以上部分为高频。
8.根据权利要求6所述三维空间音源定位***,其特征在于:第五模块中,通过参照预设的查找表进行查表,或者根据预设的函数关系计算,确定各频带相应的声源方位及大小。
CN201610909122.1A 2016-10-18 2016-10-18 一种三维空间音源定位方法及*** Active CN106291469B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610909122.1A CN106291469B (zh) 2016-10-18 2016-10-18 一种三维空间音源定位方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610909122.1A CN106291469B (zh) 2016-10-18 2016-10-18 一种三维空间音源定位方法及***

Publications (2)

Publication Number Publication Date
CN106291469A CN106291469A (zh) 2017-01-04
CN106291469B true CN106291469B (zh) 2018-11-23

Family

ID=57719605

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610909122.1A Active CN106291469B (zh) 2016-10-18 2016-10-18 一种三维空间音源定位方法及***

Country Status (1)

Country Link
CN (1) CN106291469B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107422305B (zh) 2017-06-06 2020-03-13 歌尔股份有限公司 一种麦克风阵列声源定位方法和装置
CN108919188B (zh) * 2018-07-25 2022-04-08 南京信息工程大学 一种基于七元十字阵的空间声源定位反演方法
CN111312295B (zh) * 2018-12-12 2022-06-28 深圳市冠旭电子股份有限公司 一种全息声音的记录方法、装置及录音设备
CN109998553B (zh) * 2019-04-29 2022-04-19 天津大学 听觉空间定位能力的参数化检测***及最小可听角的方法
CN110580914A (zh) * 2019-07-24 2019-12-17 安克创新科技股份有限公司 一种音频处理方法、设备及具有存储功能的装置
CN110672313B (zh) * 2019-10-22 2021-06-01 上海声茵科技有限公司 一种基于声音信号的故障诊断方法及其设备
CN111610491B (zh) * 2020-05-28 2022-12-02 东方智测(北京)科技有限公司 声源定位***及方法
CN111486537B (zh) * 2020-06-15 2020-10-02 江苏新科电器有限公司 一种带安防和监控功能的空调器
CN113949967A (zh) * 2020-07-16 2022-01-18 华为技术有限公司 一种会议语音增强的方法、装置和***
CN112599144B (zh) * 2020-12-03 2023-06-06 Oppo(重庆)智能科技有限公司 音频数据处理方法、音频数据处理装置、介质与电子设备
CN112684413B (zh) * 2021-03-17 2021-05-25 杭州灵伴科技有限公司 声源寻向方法和xr设备
CN114089277B (zh) * 2022-01-24 2022-05-03 杭州兆华电子股份有限公司 三维声源声场重构方法及***

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101201399A (zh) * 2007-12-18 2008-06-18 北京中星微电子有限公司 一种声源定位方法及***
CN102305925A (zh) * 2011-07-22 2012-01-04 北京大学 一种机器人连续声源定位方法
CN102854493A (zh) * 2011-06-27 2013-01-02 无锡物联网产业研究院 多声测阵列定位跟踪***坐标角度值标定方法
CN103472434A (zh) * 2013-09-29 2013-12-25 哈尔滨工程大学 一种机器人声音定位方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101201399A (zh) * 2007-12-18 2008-06-18 北京中星微电子有限公司 一种声源定位方法及***
CN102854493A (zh) * 2011-06-27 2013-01-02 无锡物联网产业研究院 多声测阵列定位跟踪***坐标角度值标定方法
CN102305925A (zh) * 2011-07-22 2012-01-04 北京大学 一种机器人连续声源定位方法
CN103472434A (zh) * 2013-09-29 2013-12-25 哈尔滨工程大学 一种机器人声音定位方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
一种基于麦克风阵列的声源定位方案;段文锋 等;《信号处理》;20070831;第23卷(第4A期);第73-76页 *
移动机器人空间声源目标定位;陈涛 等;《计算机应用研究》;20091031;第26卷(第10期);第3703-3705页 *

Also Published As

Publication number Publication date
CN106291469A (zh) 2017-01-04

Similar Documents

Publication Publication Date Title
CN106291469B (zh) 一种三维空间音源定位方法及***
CN106603878B (zh) 语音定位方法、装置和***
Aytekin et al. The bat head-related transfer function reveals binaural cues for sound localization in azimuth and elevation
US10726861B2 (en) Semi-private communication in open environments
CN106328156A (zh) 一种音视频信息融合的麦克风阵列语音增强***及方法
Ishi et al. Evaluation of a MUSIC-based real-time sound localization of multiple sound sources in real noisy environments
US7386133B2 (en) System for determining the position of a sound source
CN103235287B (zh) 一种声源定位摄像追踪装置
Bahu et al. Comparison of different egocentric pointing methods for 3D sound localization experiments
CN102771144A (zh) 用于方向相关空间噪声减低的设备和方法
JP3627058B2 (ja) ロボット視聴覚システム
Hwang et al. Sound direction estimation using an artificial ear for robots
US11212613B2 (en) Signal processing device and signal processing method
CN106501772B (zh) 一种基于双耳线索的空间音源定位方法及***
Kan et al. A psychophysical evaluation of near-field head-related transfer functions synthesized using a distance variation function
CN109460063A (zh) 一种无人机搜救***及其方法
CN115902776B (zh) 一种基于被动式声音信号的声源定位方法
US20240223986A1 (en) Directional sound emission method, device and apparatus
CN111551921A (zh) 一种声像联动的声源定向***及方法
JP2004198656A (ja) ロボット視聴覚システム
CN111142073B (zh) 一种机载3d音频方向定位准确度的测试方法
Huopaniemi et al. Measurement and modeling techniques for directional sound radiation from the mouth
Reid et al. Active stereo sound localization
CN116343808A (zh) 柔性麦克风阵列语音增强方法及装置、电子设备、介质
Fontana et al. Auditory distance perception in an acoustic pipe

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant