CN105607042A - 用麦克风阵列时延估计定位声源的方法 - Google Patents

用麦克风阵列时延估计定位声源的方法 Download PDF

Info

Publication number
CN105607042A
CN105607042A CN201410663512.6A CN201410663512A CN105607042A CN 105607042 A CN105607042 A CN 105607042A CN 201410663512 A CN201410663512 A CN 201410663512A CN 105607042 A CN105607042 A CN 105607042A
Authority
CN
China
Prior art keywords
sound source
array
time delay
microphone array
array element
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410663512.6A
Other languages
English (en)
Inventor
张梦巧
王洁莹
张喜明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Changfeng Science Technology Industry Group Corp
Original Assignee
China Changfeng Science Technology Industry Group Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Changfeng Science Technology Industry Group Corp filed Critical China Changfeng Science Technology Industry Group Corp
Priority to CN201410663512.6A priority Critical patent/CN105607042A/zh
Publication of CN105607042A publication Critical patent/CN105607042A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

本发明提供一种用麦克风阵列时延估计定位声源的方法,包括时延估计和声源定位,其特征在于:首先,通过算法估计声源信号到达阵列中麦克风阵元的相对时间差;第二步则利用估计时间差来计算出声源到达各阵元的距离差,然后结合阵列拓扑结构用几何算法或搜索确定声源位置。

Description

用麦克风阵列时延估计定位声源的方法
技术领域
本发明涉及计算机信号处理领域,具体涉及一种用麦克风阵列时延估计定位声源的方法。
背景技术
20世纪80年代以来,麦克风阵列信号处理技术得到迅猛的发展,并在雷达、声纳及通信中得到广泛的应用。这种阵列信号处理的思想后来应用到语音信号处理中。在国际上将麦克风阵列***用于语音信号处理的研究源于1970年。1976年,Gabfid将雷达和声纳中的自适应波束形成技术直接应用于简单的声音获取问题。1985年,美国AT&T/Bell实验室的Flanagan采用21个麦克风组成现行阵列,首次用电子控制的方式实现了声源信号的获取,该***采用简单的波束形成方法,通过计算预先设定位置的能量,找到具有最大能量的方向。同年,Flanagan等人又将二维麦克风阵列应用于大型房间内的声音拾取,以抑制混响和噪声对声源信号的影响。由于当时技术的制约,使得该算法还不能够借助于数字信号处理技术以数字的方式实现,而主要采用了模拟器件实现,1991年,Kellermann借助于数字信号处理技术,用全数字的方式实现了这一算法,进一步改善了算法的性能,降低了硬件成本,提高了***的灵活性。随后,麦克风阵列***已经应用于许多场合,包括视频会议、语音识别、说话人识别、汽车环境语音获取、混响环境声音拾取、声源定位和助听装置等。目前,基于麦克风阵列的语音处理技术正成为一个新的研究热点,但相关应用技术还不成熟。
发明内容
鉴于麦克风阵列的声源定位方法具有广泛的应用前景和潜在的经济效益,本发明旨在提供一种用麦克风阵列时延估计定位声源的方法,以期应用在包括语音识别、强噪声环境下的语音获取、大型场所的会议记录、声音检测和助听装置等领域。
为实现上述目的,本发明采用以下技术方案:
一种用麦克风阵列时延估计定位声源的方法,包括时延估计和声源定位,其特征在于:首先,通过算法估计声源信号到达阵列中麦克风阵元的相对时间差;第二步则利用估计时间差来计算出声源到达各阵元的距离差,然后结合阵列拓扑结构用几何算法或搜索确定声源位置。
所述时延估计的具体方法是:假设只有唯一的声源,麦克风阵列为均匀直线形阵列的情况,远场环境中有一个待定位的声源信号s(k),选择第一个麦克风阵元为参考点,第n个阵元在k时刻接收到的信号表示为:
yn(k)=αns(k-t-τn1)+vn(k)
=αns[k-t-Fn(τ)]+vn(k)
=xn(k)+vn(k),n=1,2,…,N
其中αn(n=1,2,…,N)为信号在传播过程中的衰减,其值介于[0,1]之间;t表示信号从s(k)传播到1号阵元之间的传播时间;vn(k)表示在第n个阵元上接收到的加性噪声;τ表示1号麦克风阵元与2号麦克风阵元所接收到的信号时延差;Fn(τ)函数表示第n个阵元与第一个阵元之间的信号时延。
所述声源定位的具体方法是:根据声源和阵列之间的几何关系确定出声源方向角与距离。
本发明可实际应用于以下领域:视频会议,声源定位技术可为视频会议中的发言人跟踪定位;机器人技术,利用双耳时延模型及互相关操作来实现机器人对声源的定位及跟踪;噪声检测,为了更好的控制汽车、摩托车等发动机及大型器械中的噪声,声源定位技术是对发动机性能评估、大型机械稳定性测试的重要方法;医疗诊断及医疗设备,在医疗设备中,声源定位技术可用于病变部位的分析,疾病的诊断起到极大的促进推动作用。
附图说明
图1是本发明的声源定位原理图。
具体实施方式
基于时延估计的声源定位方法通常分为两个步骤,即时延估计和声源定位。本发明首先通过算法估计声源信号到达阵列中麦克风阵元的相对时间差;第二步则利用估计时间差来计算出声源到达各阵元的距离差,然后结合阵列拓扑结构用几何算法或搜索确定声源位置。
1.时延估计
阵列的几何形状对声源定位性能至关重要,根据麦克风阵列所处的环境,时延估计的模型可以被分为理想模型与混响模型。我们把麦克风阵元这种只接收通过直接路径到达麦克风阵列的声音信号的模型称作理想模型。把这种不仅考虑通过直接路径到达的信号,还考虑声源发出的信号遇到墙壁、桌子等反射后间接到达阵列的信号的这种模型称作混响模型。由于混响信号的路径的数量具有不确定性,基于混响模型的算法复杂度与理想模型相比其算法复杂度相对比较大,基于混响模型的算法是用数学模型去拟合干扰的影响并不像理想模型回避间接路径信号的干扰,因此基于混响模型的算法的时延估计效果比较好。尽管如此,为了降低算法的复杂度,本发明主要就理想模型来研究麦克风阵列的时延估计。
假设只有唯一的声源,麦克风阵列为均匀直线形阵列的情况。远场环境中有一个待定位的声源信号s(k),如果我们选择第一个麦克风阵元为参考点,那么第n个阵元在k时刻接收到的信号可以表示为:
yn(k)=αns(k-t-τn1)+vn(k)
=αns[k-t-Fn(τ)]+vn(k)
=xn(k)+vn(k),n=1,2,…,N
其中αn(n=1,2,…,N)为信号在传播过程中的衰减,其值介于[0,1]之间。t表示信号从s(k)传播到1号阵元之间的传播时间。vn(k)表示在第n个阵元上接收到的加性噪声。假设噪声与语音信号以及其它阵元的噪声信号互不相关。τ(注意)表示1号麦克风阵元与2号麦克风阵元所接收到的信号时延差。Fn(τ)函数表示第n个阵元与第一个阵元之间的信号时延。这里假设使用的麦克风阵列模型为位于远场环境中的均匀直线阵列,于是可以得到:
F1(τ)=0,F2(τ)=τ,Fn(τ)=(n-1)τ,n=2,…,N
在近场中,信号是以球面波形式到达麦克风阵列的,所以Fn是τ的非线性函数。这时Fn既与麦克风阵元间距有关,而且对声源信号相对于阵列的位置有着很大的依赖性。对于均匀直线形阵列,Fn函数已知,所以求时延估计的问题就等价于估计τ的问题,通过时延估计算法,从采集到的有限帧的多通道声音信号中计算出
2.声源定位
麦克风阵列时延估计后,就可以根据声源和阵列之间的几何关系确定出声源方向角与距离,但在定位精度会受到很多因素的影响,其中影响定位精度的主要因素是时延估计方法和定位方法。本技术采用改进的声源定位算法,将声源看作是点声源并假设声源在无穷远处,那么波前就垂直于波面。麦克风A和B接收到信号的时间先后如图1所示,其中L是两个麦克风阵元间的间距,c是声音在空气中传播速度,τAB是声源到两个麦克风的时间差也就是阵元间的时延,θ是声源的方向角。

Claims (3)

1.一种用麦克风阵列时延估计定位声源的方法,包括时延估计和声源定位,其特征在于:首先,通过算法估计声源信号到达阵列中麦克风阵元的相对时间差;第二步则利用估计时间差来计算出声源到达各阵元的距离差,然后结合阵列拓扑结构用几何算法或搜索确定声源位置。
2.根据权利要求1所述的用麦克风阵列时延估计定位声源的方法,其特征在于所述时延估计的具体方法是:假设只有唯一的声源,麦克风阵列为均匀直线形阵列的情况,远场环境中有一个待定位的声源信号s(k),选择第一个麦克风阵元为参考点,第n个阵元在k时刻接收到的信号表示为:
yn(k)=αns(k-t-τn1)+vn(k)
=αns[k-t-Fn(τ)]+vn(k)
=xn(k)+vn(k),n=1,2,…,N
其中αn(n=1,2,…,N)为信号在传播过程中的衰减,其值介于[0,1]之间;t表示信号从s(k)传播到1号阵元之间的传播时间;vn(k)表示在第n个阵元上接收到的加性噪声;τ表示1号麦克风阵元与2号麦克风阵元所接收到的信号时延差;Fn(τ)函数表示第n个阵元与第一个阵元之间的信号时延。
3.根据权利要求1所述的用麦克风阵列时延估计定位声源的方法,其特征在于所述声源定位的具体方法是:根据声源和阵列之间的几何关系确定出声源方向角与距离。
CN201410663512.6A 2014-11-19 2014-11-19 用麦克风阵列时延估计定位声源的方法 Pending CN105607042A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410663512.6A CN105607042A (zh) 2014-11-19 2014-11-19 用麦克风阵列时延估计定位声源的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410663512.6A CN105607042A (zh) 2014-11-19 2014-11-19 用麦克风阵列时延估计定位声源的方法

Publications (1)

Publication Number Publication Date
CN105607042A true CN105607042A (zh) 2016-05-25

Family

ID=55987120

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410663512.6A Pending CN105607042A (zh) 2014-11-19 2014-11-19 用麦克风阵列时延估计定位声源的方法

Country Status (1)

Country Link
CN (1) CN105607042A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107144820A (zh) * 2017-06-21 2017-09-08 歌尔股份有限公司 声源定位方法及装置
CN107820037A (zh) * 2016-09-14 2018-03-20 南京中兴新软件有限责任公司 音频信号、图像处理的方法、装置和***
CN108398675A (zh) * 2018-03-01 2018-08-14 英华达(上海)科技有限公司 定位***及定位方法
CN109478366A (zh) * 2016-07-27 2019-03-15 罗伯特·博世有限公司 用于监视机动车用的停车场的方案
WO2019080156A1 (zh) * 2017-10-24 2019-05-02 深圳市沃特沃德股份有限公司 机器人的移动方法、装置和机器人
CN112540347A (zh) * 2020-11-17 2021-03-23 普联国际有限公司 一种声源远近的判断方法、装置、终端设备及存储介质
CN113419217A (zh) * 2021-06-03 2021-09-21 宁波大学 基于麦克风非线性特性的无声室内多目标定位方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101668243A (zh) * 2008-09-01 2010-03-10 深圳华为通信技术有限公司 一种麦克风阵列及麦克风阵列校准的方法和模块
CN101771923A (zh) * 2009-01-07 2010-07-07 王青云 一种眼镜数字助听器声源定位方法
CN101866446A (zh) * 2010-03-08 2010-10-20 李爱国 社区矫正工作的方法及矫正装置
CN102707262A (zh) * 2012-06-20 2012-10-03 太仓博天网络科技有限公司 一种基于麦克风阵列的声源定位***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101668243A (zh) * 2008-09-01 2010-03-10 深圳华为通信技术有限公司 一种麦克风阵列及麦克风阵列校准的方法和模块
CN101771923A (zh) * 2009-01-07 2010-07-07 王青云 一种眼镜数字助听器声源定位方法
CN101866446A (zh) * 2010-03-08 2010-10-20 李爱国 社区矫正工作的方法及矫正装置
CN102707262A (zh) * 2012-06-20 2012-10-03 太仓博天网络科技有限公司 一种基于麦克风阵列的声源定位***

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109478366A (zh) * 2016-07-27 2019-03-15 罗伯特·博世有限公司 用于监视机动车用的停车场的方案
CN107820037A (zh) * 2016-09-14 2018-03-20 南京中兴新软件有限责任公司 音频信号、图像处理的方法、装置和***
CN107820037B (zh) * 2016-09-14 2021-03-26 中兴通讯股份有限公司 音频信号、图像处理的方法、装置和***
CN107144820A (zh) * 2017-06-21 2017-09-08 歌尔股份有限公司 声源定位方法及装置
WO2019080156A1 (zh) * 2017-10-24 2019-05-02 深圳市沃特沃德股份有限公司 机器人的移动方法、装置和机器人
CN108398675A (zh) * 2018-03-01 2018-08-14 英华达(上海)科技有限公司 定位***及定位方法
CN112540347A (zh) * 2020-11-17 2021-03-23 普联国际有限公司 一种声源远近的判断方法、装置、终端设备及存储介质
CN113419217A (zh) * 2021-06-03 2021-09-21 宁波大学 基于麦克风非线性特性的无声室内多目标定位方法
CN113419217B (zh) * 2021-06-03 2023-04-25 宁波大学 基于麦克风非线性特性的无声室内多目标定位方法

Similar Documents

Publication Publication Date Title
CN105607042A (zh) 用麦克风阵列时延估计定位声源的方法
CN104076331B (zh) 一种七元麦克风阵列的声源定位方法
CN103308889B (zh) 复杂环境下被动声源二维doa估计方法
Brandstein et al. A practical time-delay estimator for localizing speech sources with a microphone array
CN109212481A (zh) 一种利用麦克风阵列进行声源定位的方法
CN101762806B (zh) 声源定位方法和装置
CN109188362B (zh) 一种麦克风阵列声源定位信号处理方法
CN102305925A (zh) 一种机器人连续声源定位方法
CN103176166B (zh) 一种用于水声被动定位的信号到达时延差跟踪算法
KR100877914B1 (ko) 음원위치-지연시간차 상관관계 역 추정에 의한 음원 방향검지 시스템 및 방법
CN103278801A (zh) 一种变电站噪声成像侦测装置及侦测计算方法
Ren et al. A novel multiple sparse source localization using triangular pyramid microphone array
CN105158734B (zh) 一种基于阵不变量的单矢量水听器被动定位方法
Nakadai et al. Robust tracking of multiple sound sources by spatial integration of room and robot microphone arrays
CN108549052A (zh) 一种时频-空域联合加权的圆谐域伪声强声源定位方法
CN107396244B (zh) 一种基于麦克风阵列的声源定位***及方法
Nakadai et al. Sound source tracking with directivity pattern estimation using a 64 ch microphone array
CN103901400A (zh) 一种基于时延补偿和双耳一致性的双耳声音源定位方法
KR20090128221A (ko) 음원 위치 추정 방법 및 그 방법에 따른 시스템
Svaizer et al. Environment aware estimation of the orientation of acoustic sources using a line array
CN101771923A (zh) 一种眼镜数字助听器声源定位方法
Hadad et al. Multi-speaker direction of arrival estimation using SRP-PHAT algorithm with a weighted histogram
Himawan et al. Clustering of ad-hoc microphone arrays for robust blind beamforming
Astapov et al. A two-stage approach to 2D DOA estimation for a compact circular microphone array
CN111157949A (zh) 一种语音识别及声源定位方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20160525