CN102147458B - 一种针对宽带声源的波达方向估计方法及其装置 - Google Patents

一种针对宽带声源的波达方向估计方法及其装置 Download PDF

Info

Publication number
CN102147458B
CN102147458B CN 201010608798 CN201010608798A CN102147458B CN 102147458 B CN102147458 B CN 102147458B CN 201010608798 CN201010608798 CN 201010608798 CN 201010608798 A CN201010608798 A CN 201010608798A CN 102147458 B CN102147458 B CN 102147458B
Authority
CN
China
Prior art keywords
voice data
data
mould
coherence function
microphone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN 201010608798
Other languages
English (en)
Other versions
CN102147458A (zh
Inventor
冯大航
鲍明
管鲁阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Acoustics CAS
Original Assignee
Institute of Acoustics CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Acoustics CAS filed Critical Institute of Acoustics CAS
Priority to CN 201010608798 priority Critical patent/CN102147458B/zh
Publication of CN102147458A publication Critical patent/CN102147458A/zh
Application granted granted Critical
Publication of CN102147458B publication Critical patent/CN102147458B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明涉及一种针对宽带声源的波达方向估计方法及装置,从传声器阵列采集的声音数据中,选取一段声音数据X(n)=[x1(n),...,xP(n)]T,n∈Z*,选择的声音数据X(n)均匀分成L帧,对每一帧声音数据Xl(n)做N点快速傅里叶变换,得到声音数据的频域表示Xl(k)=[xl1(k),...,xlP(k)]T,k=1,...,N/2;然后计算传声器阵列中的两个传声器间相干函数的模平方η(k);从η(k)中随机挑选出q个相干函数的模平方值,仅使用这q个相干函数的模平方对应的频带进行波达方向估计。本发明在保证精度基本不降低的情况下极大降低算法的运算量。

Description

一种针对宽带声源的波达方向估计方法及其装置
技术领域
本发明涉及目标测向技术领域,特别涉及一种针对宽带声源的波达方向估计方法及其装置。
背景技术
目标测向在声呐、雷达、导航及无线传感器网络等领域都有重要的应用。而传感器阵列是目标测向的主要方式。
在目标测向技术中,一个重要技术问题是如何对宽带声源进行定位。对于这方面已经有很多的算法。宽带MUSIC算法是先将宽带信号通过傅里叶变换到频域上,然后对每个频带用窄带的MUSIC法处理,最后将各个频带的结果综合得到声源的方向估计。即非相干子空间方法(ISM,Incoherent Sub-space Method)。这类方法运算量小,但精度差,并且只能处理非相干信号;最大似然(ML,Maximum Likelihood)估计算法为代表的拟合类算法,以其良好的渐进性,灵活的适用性,可低的计算复杂度,得到了广泛关注。针对宽带信号,Yao Kung教授等人提出了针对宽带声源的AML(Approximated Maximum Likelihood)波达方向估计算法。这类算法精度高,能处理相干信号,但运算量很大。同时,对于相干信号源还可以用聚焦矩阵的方法处理。首先需要利用低复杂度算法对声源方向进行一个预估,通过这个预估的角度构造聚焦矩阵,通过聚焦矩阵把不同频带的信号聚焦到一个中心频率上,然后把它当成一个窄带信号来处理,这种方法的缺点是需要知道声源的预估角度,并且预估角度的选择对于算法的性能影响很大。
发明内容
本发明的目的在于,在保证精度基本不降低的情况下极大降低算法的运算量。
为达到上述目的,提出一种针对宽带声源的波达方向估计方法,该方法具体步骤包括:
步骤1):从传声器阵列采集的声音数据中,选取一段声音数据X(n)=[x1(n),...,xP(n)]T,其中,P表示传声器阵列中传声器的个数,P≥2;将该段声音数据X(n)均匀分成L帧,每帧的数据Xl(n)的长度为N,X(n)的数据长度为N×L,l=1,...,L;n∈Z*
对每一帧声音数据Xl(n)做N点快速傅里叶变换,得到声音数据的频域表示Xl(k)=[xl1(k),...,xlP(k)]T,其中k=1,2,...,N/2;
步骤2):根据所述的步骤1)得到的Xl(k)按照下式(1)计算传声器阵列中的两个传声器间相干函数的模平方η(k);
η ( k ) = | γ i , j ( k ) | 2 = | Φ i , j ( k ) | 2 Φ i , i ( k ) Φ j , j ( k ) - - - ( 1 )
其中,k=1,2,...,N/2;i,j∈[1,2,...,P];Φi,j(k)为第i个传声器和第j个传声器的互功率谱,Φi,i(k)为第i个传声器的自功率谱,
Figure BSA00000401124000023
Φj,j(k)为第j个传声器的自功率谱,
Figure BSA00000401124000024
步骤3):根据所述的步骤2)得到的η(k)随机选出q个相干函数模的平方;
步骤4):根据所述的步骤3)选出的q个相干函数模的平方对应的声音数据Xl(k)进行波达方向估计,其中,k∈[k1,...,kq],kq表示频带序号,且[k1,...,kq]∈[1,...,N/2]。
所述的步骤1)还包括:保存所述的传声器阵列到当前为止采集的连续L帧声音数据;并保存来自所述传声器阵列最新的1帧声音数据后,将保存的连续L帧声音数据中最早的1帧声音数据删除。
所述的步骤2)中,两个传声器为传声器阵列中空间距离最大的两个传声器。
所述的步骤2)中,两个传声器之间连续(L-1)帧的数据作为数据缓存,根据当前获得第L帧的N个数据和缓存的N×(L-1)个数据来求取相干函数的模平方。
所述的步骤4)中,根据所述的步骤3)选出的q个相干函数模的平方对应的第L帧声音数据XL(k)进行波达方向估计,其中,k∈[k1,...,kq],kq表示频带序号,且[k1,...,kq]∈[1,...,N/2]。
所述的步骤3)中,比较所述的步骤2)中得到的η(k)大小,从最大的开始依次挑选前q个η(k)值,即η(k1)≥η(k2)≥...≥η(kq)≥η(km),其中,kq表示频带序号,[k1,...,kq]∈[1,2,....,N/2],
Figure BSA00000401124000031
为实现上述目的,提出一种针对宽带声源的波达方向估计装置,其特征在于,该装置包括:傅里叶变换模块、相干函数的模平方模块和波达方向估计模块;
所述的傅里叶变换模块,包括:数据选择单元、数据分帧单元和傅里叶变换单元;用于所述的数据选择单元从传声器阵列采集的声音数据中,选取一段声音数据X(n)=[x1(n),...,xP(n)]T,所述的数据分帧单元将所述的数据选择单元选择的声音数据X(n)均匀分成L帧,所述的傅里叶变换单元对每一帧声音数据Xl(n)做N点快速傅里叶变换,得到声音数据的频域表示Xl(k)=[xl1(k),...,xlP(k)]T;并将所述频域的声音数据输出至所述的相干函数的模平方模块;其中,P表示传声器阵列中传声器的个数,P≥2;每帧的数据Xl(n)的长度为N,l=1,...,L,X(n)的数据长度为N×L;n∈Z*;k=1,2,...,N/2;
所述的相干函数的模平方模块,用于根据所述的傅里叶变换模块得到的Xl(k)按照式(2)计算传声器阵列中的两个传声器间相干函数的模平方η(k);
η ( k ) = | γ i , j ( k ) | 2 = | Φ i , j ( k ) | 2 Φ i , i ( k ) Φ j , j ( k ) - - - ( 2 )
其中,k=1,2,...,N/2;i,j∈[1,2,...,P];Φi,j(k)为第i个传声器和第j个传声器的互功率谱,
Figure BSA00000401124000033
Φi,i(k)为第i个传声器的自功率谱,
Figure BSA00000401124000034
Φj,j(k)为第j个传声器的自功率谱,
Figure BSA00000401124000035
所述的波达方向估计模块,用于根据从所述的相干函数的模平方模块得到的相干函数的模平方中随机选出q个相干函数模的平方对应的声音数据Xl(k)进行波达方向估计,其中,k∈[k1,...,kq],kq表示频带序号,且[k1,...,kq]∈[1,...,N/2]。
所述的相干函数的模平方模块中,两个传声器为传声器阵列中空间距离最大的两个传声器。
所述的装置还包括声音数据缓存模块;所述的声音数据缓存模块,用于保存传声器阵列到当前为止采集的连续L帧声音数据;并保存接收到来自传声器阵列最新的1帧声音数据后,将保存的连续L帧声音数据中最早的1帧声音数据删除;并将缓存的声音数据输出至所述的傅里叶变换模块。
所述的相干函数的模平方模块将选取的两个传声器之间连续(L-1)帧的数据作为数据缓存,根据当前获得第L帧的N个数据和缓存的N×(L-1)个数据来求取相干函数的模平方。
所述的波达方向估计模块根据所述的比较模块得到的q个相干函数模的平方对应的第L帧声音数据XL(k)进行波达方向估计,其中,k∈[k1,...,kq],kq表示频带序号,且[k1,...,kq]∈[1,...,N/2]。
该装置还包括一比较模块,用于根据比较所述的相干函数的模平方模块得到的η(k)大小,从最大的开始依次挑选前q个η(k)值,即η(k1)≥η(k2)≥...≥η(kq)≥η(km),其中,kq表示频带序号,[k1,...,kq]∈[1,2,....,N/2],
Figure BSA00000401124000041
;将挑选出的相干函数的模平方输出至所述的波达方向估计模块。
本发明的优点在于,本发明可以大大降低运算量。同时这种简化算法可适用于背景技术部分所讨论的任何算法。以AML算法为例,由于AML算法的运算量最大,通过验证可以得出在定向效果相当的情况下,大大降低了运算量。
附图说明
图1为传声器阵列的空间结构示意图;
图2为本发明提出的一种针对宽带声源的波达方向估计方法流程图;
图3为仿真试验中白噪声情况下本发明实施例方案与全频带方案进行波达方向估计的结果比较图;
图4为仿真试验中有色噪声情况下本发明实施例方案与全频带方案进行波达方向估计的结果比较图;
图5为野外试验中本发明实施例方案与全频带方案进行波达方向估计的结果比较图。
具体实施方式
下面结合附图和实施例对本发明进一步说明。
设有R个全向(omni-directional)传声器,第p个传声器接收信号为:
x p ( n ) = Σ m = 1 M s 0 ( m ) ( n - t p ( m ) ) + w p ( n ) - - - ( 1 )
其中:n=0,...,L-1,L为一帧信号采样点个数;p=1,...,R,R为接收阵列中传声器的个数;m=1,...,M,M为声源数量(M<R)。为源信号,为用采样点数表示的时间延迟。wp(n)为阵列接收信号中噪声分量。其中,时间延迟
Figure BSA00000401124000051
根据阵型及目标声源位置的几何关系获得。对于一个远场条件下的R元圆阵,即R个传声器等距排列在一个圆周上,第p个传声器的用采样点数表示的时间延迟为:
t p ( m ) = f s r c cos ( 2 π ( p - 1 ) R - θ m ) - - - ( 2 )
其中,fs为信号采样频率,r为圆阵半径,c为各向同性介质中的波速,θm为第m个源的远场方位角。
对接收信号做N点的FFT变换,得频率域信号模型:
X(k)=D(Θ,k)S0(k)+η(k)    (3)
式中,k=0,...,N/2;频域阵列输出信号:X(k)=[X1(k),...,XR(k)]T;M个声源的频谱:
Figure BSA00000401124000053
方向矩阵(Steering Matrix)为:D(Θ,k)=[d(1)(k),...,d(M)(k)];方向矢量(Steering Vector)为:
Figure BSA00000401124000055
Figure BSA00000401124000056
η(k)为噪声频谱。
噪声谱向量η(k)是方差为Lσ2零均值复数高斯白噪声。注意到即使w(n)为任意独立同分布的随机变量,根据中心极限定理,都可推知η(k)服从高斯分布。
定义    S(k)=D(k)S0(k)     (4)
得到NR/2维空间-时频向量:
X=G(θ)+ξ1                (5)
其中,G(θ)=[S(0)T,...,S(N/2)T]T,并且有:
R ξ = E [ ξξ H ] = L σ 2 I R 0 σ 2 I R L 0 σ 2 I R - - - ( 6 )
其中,上角标H代表复矩阵的共轭转置。
假设初始未知参数空间为:
Θ = [ θ s T , S 0 ( 1 ) T , . . . , S 0 ( M ) T ] T - - - ( 7 )
其中,源方位角
Figure BSA00000401124000059
源频谱
Figure BSA000004011240000510
所以有最大似然函数:
f ( Θ ) = 1 ( 2 π ) NR / 2 / 2 | R ξ | 1 / 2 exp { - 1 2 [ X - G ( Θ ) ] H R ξ - 1 [ X - G ( Θ ) ] } - - - ( 8 )
对数化该似然函数并略去常数项得:
L ( Θ ) = - | | X - G ( Θ ) | | 2 R ξ - - - ( 9 )
可以得到最优化准则:
max Θ L ( Θ ) = min Θ Σ k = 0 N / 2 | | X ( k ) - D ( k ) S 0 ( k ) | | 2 R ξ ( k )
= min Θ Σ k = 0 N / 2 | | X ( k ) - D ( k ) S 0 ( k ) | | 2 σ 2 - - - ( 10 )
这等价于对所有k个函数,找到又由于σ2为常数,f(k)可简写为:
f(k)=||X(k)-D(k)S0(k)||2            (11)
使f(k)取的极小值的源信号矢量S0(k)一定满足因此为了对任何源定位有最小的残差,源矢量的估计给定:
Figure BSA00000401124000066
其中,
Figure BSA00000401124000067
是方向矩阵D(k)的伪逆矩阵(pseudo-inverse)。定义正交规划那么AML算法的波达方向估计可以通过下式得到。
θ s = max θ s Σ k = 0 N / 2 | | P ( k , θ s ) X ( k ) | | 2 - - - ( 13 )
声音信号虽然是宽带的,但信号一般都不可能是白的,它一般都存在一些谐频结构,即信号主要集中在某些频段上;或由于噪声是有色的,某些频带的信号完全被噪声湮没掉了,因此在计算时,这些频带上的信息是冗余的,甚至会影响最后的结果。所以采用一定的方法来选取某些频带是必要的,本发明方案中,将频带上的相干函数作为选择频带的标准。
相干函数(coherence)用于描述两组数据之间的相关性。本发明方案中,相干函数的定义为:
γ xy = G xy ( f ) G xx ( f ) G yy ( f ) - - - ( 14 )
其中,x和y代表两组不同的数据,Gxy(f)为x和y的互谱,Gxx(f)和Gyy(f)分别为x和y的自谱。Gxy(f)=E{X(f)Y*(f)},Gxx(f)=E{X(f)X*(f)},Gyy(f)=E{Y(f)Y*(f)}。
幅度平方相干函数(MSC)为相干函数γxy的模的平方:
| γ xy ( f ) | 2 = | G xy ( f ) | 2 G xx ( f ) G yy ( f ) - - - ( 15 )
由此,可见相干函数指的都是频域上的运算。
相干函数的取值为0到1之间,即:
0≤|γxy|2≤1                (16)
当取值为0时表示频段x和y上的频谱完全不相关,取值为1表示频段x和y上的频谱完全相关。
在特定的情况下有:信噪比
Figure BSA00000401124000072
由此可见MSC可以用来衡量信号某个频带上的信噪比的大小。当|γxy(k)|2较大时,表明第k个频带上有用的信号较多;反之,则说明第k频带上噪声占主要部分。
传声器阵列的空间结构示意图,如图1所示。使用图1所示的十字阵型的传声器阵列进行风噪信号采集,圆圈101表示12枚B&K 4189型标准传声器,并配有直径为10cm的球形海绵风罩。102表示用于固定这些传声器的支架。十字阵上三个4元阵列的孔径分别是0.2米,0.6米,1.2米。采用SONY SIR-1000型16通道同步数字录音机,采样频率为48kHz。数据分析时,通过低通滤波、归一化、降采样到1kHz进行分析。
使用实测数据,统计阵列风噪声的空间相关性。采用下式计算通道间平均相关系数:
γ ‾ ( k ) = 2 R ( R - 1 ) Σ i = 1 R Σ j = i + 1 R | γ ij ( k ) | - - - ( 17 )
其中,k=0,...,N/2;R为通道数,γij(k)为第i通道与第j通道的互相关系数,
Figure BSA00000401124000074
为平均相关系数。
表1  风噪声通道间平均相关系数
Figure BSA00000401124000075
表1说明,与低频风噪声的空间相关性不同,中高频处的风噪声通道间相关系数小,空间相关性微弱,阵列风噪声基本可以认为通道间相互独立。
本发明方案是在采集了声音数据之后,根据相干系数对声音数据进行筛选,筛选出携带有用信号较多的频段的声音数据,而放弃其他频段的声音数据,这样一来,就减少了波达方向估计所需的数据量,从而减小后续的波达方向估计的运算量。
本发明提出的一种针对宽带声源的波达方向估计方法流程图;如图2所示,包括如下步骤:
步骤201:从由P个传声器组成的传声器阵列采集的声音数据中,选择一段声音数据x(n)=[x1(n),...,xP(n)]T,其中,n∈Z*
步骤202:将所选择的声音数据x(n)均匀分成L段xl(n),l=1,...,L,每段的数据xl(n)的长度为N,x(n)的数据数据长度为N×L。
步骤203:对每一段声音数据xl(n)做N点快速傅里叶变换(FFT),得到声音数据的频域表示为Xl(k)=[Xl1(k),...,XlP(k)]T,其中,k=1,2,...,N/2。
步骤204:计算传声器阵列中的两个传声器间的相干函数模的平方(MSC)
Figure BSA00000401124000081
其中,i,j∈[1,2,...,P],Φi,j(k)为第i个传声器和第j个传声器的互功率谱,Φi,i(k)和Φj,j(k)分别为第i个传声器和第j个传声器的自功率谱:
Φ i , i ( k ) = Σ l = 1 L | X li ( k ) | 2 ; Φ j , j ( k ) = Σ l = 1 L | X lj ( k ) | 2 ; Φ i , j ( k ) = Σ l = 1 L X li ( k ) X lj * ( k ) .
较佳地,所述两个传声器可以为传声器阵列中空间距离最大的两个传声器。
步骤205:从相干函数模的平方η(k)中挑选出较大的q个相干函数模的平方值,即η(k1)≥η(k2)≥...≥η(kq)≥η(km),其中,kq为频带序号,[k1,...,kq]∈[1,2,....,N/2],
Figure BSA00000401124000085
步骤206:使用挑选出的q个相干函数模的平方对应的声音数据Xl(k)进行波达方向估计。其中,k∈[k1,...,kq];以AML算法为例,则角度的计算公式由(18)可知,
θ s = max θ s Σ k = k 1 k q | | P ( k , θ s ) X l ( k ) | | 2 - - - ( 18 )
由于相干函数的计算需要较多数据,即N×L要较大,因此可能影响方法的实时性。在相干函数的计算中,保存了之前连续(L-1)帧的数据作为数据缓存,根据当前获得的N个数据和缓存的N×(L-1)个数据求取MSC。并且每次获得新一帧数据之后,都丢弃最前一帧的数据,更新整个数据缓存。如***中的全部数据为xl(n),l=1,...,L,其中xL(n)为当前获得的一帧数据,而xl(n),l=1,...,L-1为以前的数据。使用xl(n),l=1,...,L算MSC,而仅使用xL(n)进行角度估计。
本发明还提出一种针对宽带声源的波达方向估计的装置,包括:
傅立叶变换模块,用于对P个传声器组成的传声器阵列采集的声音数据进行快速傅立叶变换,得到声音数据的频域表示,并将所述频域声音数据输出至相干函数的模平方模块;
相干函数的模平方模块,用于计算传声器阵列中两个传声器间的声音数据的相干函数的模平方,并将计算得到的相干函数的模平方输出至比较模块;
比较模块,用于从相干函数的模平方中挑选出较大的q个值;
波达方向估计模块,用于根据比较模块所挑选出的相干函数的模平方对应的声音数据的频带进行波达方向估计。
较佳地,所述相干函数的模平方模块用于计算传声器阵列中距离最远的两个传声器间声音数据的相干函数的模平方,并将计算得到的相干函数的模平方输出至比较模块。
较佳地,所述傅立叶变换模块包括:
数据选择单元,用于从由P个传声器组成的传声器阵列采集的声音数据中选择长度为N×L的一段声音数据作为待处理声音数据x(n)=[x1(n),...,xP(n)]T,其中,n∈Z*
数据分帧单元,用于将所述数据选择单元所选择的待处理声音数据x(n)分成L段,其中任一段的声音数据为xl(n),l=1,...,L,并将分段后的声音数据输出;以及
傅立叶变换单元,用于对所述数据分帧单元输出的每一段声音数据xl(n)做N点快速傅里叶变换,得到声音数据的频域表示为Xl(k)=[Xl1(k),...,XlP(k)]T,其中,k=1,2,...,N/2。
较佳地,相干函数的模平方模块计算传声器阵列第i个传声器和第j个传声器之间的相干函数的模平方为:
Figure BSA00000401124000091
其中,i,j∈[1,2,...,P],Φi,j(k)为第i个传声器和第j个传声器的互功率谱,Φi,i(k)和Φj,j(k)分别为第i个传声器和第j个传声器的自功率谱。
较佳地,所述比较模块从N/2个相干函数的模平方η(k)中挑选出较大的q个相干函数的模平方值,即η(k1)≥η(k2)≥...≥η(kq),kq表示频带序号,k=1,2,...,N/2,[k1,...,kq]∈[1,2,....,N/2]。
较佳地,所述DOA估计模块根据比较模块所挑选出的相干函数的模平方对应的声音数据的频带进行波达方向估计。
较佳地,该装置进一步包括:
声音数据缓存模块,用于保存所述传声器阵列到当前为止采集的连续L帧声音数据;并当接收到来自所述传声器阵列最新的1帧声音数据后,将保存的连续L帧声音数据中最早的1帧声音数据删除。
所述傅立叶变换模块用于对声音数据缓存模块中存储的声音数据进行行快速傅立叶变换得到声音数据的频域表示,并将所述频域声音数据输出至相干函数的模平方模块。
以下通过仿真实验以及实地实验的结果对本发明方案的技术效果进行说明。在仿真试验中,传声器组阵列为圆阵,阵元数为4,圆阵的半径为0.2m,声源为白噪声,个数为1,入射角为70°。使用全频带的AML算法和频带选取的AML算法结果对比分别如图3和图4所示,其中,图3为白噪声的情况,图4为有色噪声的情况。其中有色噪声是由白噪声通过一个50阶的FIR滤波器所产生的。
从图3可以看出,当背景为白噪声的条件时,低信噪比下全频带的AML算法要优于频带选取的AML算法;高信噪比下这两种算法的偏差相近都趋向于零。从图4可以看出,当背景为有色噪声时,低信噪比使用全频带的AML算法已经不是最优的,从图中可以看出在不同信噪比下应选取不同的频带数,这是由于背景为有色噪声,在某些频带上信噪比会很大,而在某些频带上信噪比会很小,因此选取过多的频带会使这些信噪比低的频带也参与运算,从而使算法的偏差增大;高信噪比下,两种算法的偏差也都趋近于0。
在野外实际实验中,阵列为圆阵,阵元数为4,圆阵半径为0.2m,声源为坦克绕阵列做圆周运动。实验结果如图5所示,图标“*”是全频带搜索的结果,图标“o”是只取相干系数最大的20个频带计算所得的结果,从图中可以看出,两者定位精度基本一样,但使用相干系数选择频带后,运算量是原来的1/15。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的硬件平台的方式来实现,当然也可以全部通过硬件来实施,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案对背景技术做出贡献的全部或者部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备执行本发明各个实施例或者实施例的某些部分所述的方法。计算机设备如:个人计算机,服务器,或者网络设备等。
最后所应说明的是,以上实施例仅用以说明本发明的技术方案而非限制。尽管参照实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,对本发明的技术方案进行修改或者等同替换,都不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (12)

1.一种针对宽带声源的波达方向估计方法,该方法具体步骤包括:
步骤1):从传声器阵列采集的声音数据中,选取一段声音数据X(n)=[x1(n),...,xP(n)]T,其中,P表示传声器阵列中传声器的个数,P≥2;将该段声音数据X(n)均匀分成L帧,每帧的数据Xl(n)的长度为N,X(n)的数据长度为N×L,l=1,...,L;n∈Z*
对每一帧声音数据Xl(n)做N点快速傅里叶变换,得到声音数据的频域表示Xl(k)=[xl1(k),...,xlP(k)]T,其中k=1,2,...,N/2;
步骤2):根据所述的步骤1)得到的Xl(k)按照下式(1)计算传声器阵列中的两个传声器间相干函数的模平方η(k);
η ( k ) = | γ i , j ( k ) | 2 = | Φ i , j ( k ) | 2 Φ i , i ( k ) Φ j , j ( k ) - - - ( 1 )
其中,k=1,2,...,N/2;i,j∈[1,2,...,P];Φi,j(k)为第i个传声器和第j个传声器的互功率谱,
Figure FDA00002275865200012
Φi,i(k)为第i个传声器的自功率谱, Φ i , i ( k ) = Σ l = 1 L | x li ( k ) | 2 ; Φj,j(k)为第j个传声器的自功率谱, Φ j , j ( k ) = Σ l = 1 L | x lj | 2 ;
步骤3):根据所述的步骤2)得到的η(k)从最大的开始依次选出q个相干函数模的平方;
步骤4):根据所述的步骤3)选出的q个相干函数模的平方对应的声音数据Xl(k)进行波达方向估计,其中,k∈[k1,...,kq],kq表示频带序号,且[k1,...,kq]∈[1,...,N/2]。
2.根据权利要求1所述的针对宽带声源的波达方向估计方法,其特征在于,所述的步骤1)还包括:保存所述的传声器阵列到当前为止采集的连续L帧声音数据;并保存来自所述传声器阵列最新的1帧声音数据后,将保存的连续L帧声音数据中最早的1帧声音数据删除。
3.根据权利要求1所述的针对宽带声源的波达方向估计方法,其特征在于,所述的步骤2)中,两个传声器为传声器阵列中空间距离最大的两个传声器。
4.根据权利要求2所述的针对宽带声源的波达方向估计方法,其特征在于,所述的步骤2)中,两个传声器之间连续(L-1)帧的数据作为数据缓存,根据当前获得第L帧的N个数据和缓存的N×(L-1)个数据来求取相干函数的模平方。
5.根据权利要求4所述的针对宽带声源的波达方向估计方法,其特征在于,所述的步骤4)中,根据所述的步骤3)选出的q个相干函数模的平方对应的第L帧声音数据XL(k)进行波达方向估计,其中,k∈[k1,...,kq],kq表示频带序号,且[k1,...,kq]∈[1,...,N/2]。
6.根据权利要求1所述的针对宽带声源的波达方向估计方法,其特征在于,所述的步骤3)中,比较所述的步骤2)中得到的η(k)大小,从最大的开始依次挑选前q个η(k)值,即η(k1)≥η(k2)≥...≥η(kq)≥η(km),其中,kq表示频带序号,[k1,...,kq∈[1,2,....,N/2],
Figure FDA00002275865200021
7.一种针对宽带声源的波达方向估计装置,其特征在于,该装置包括:傅里叶变换模块、相干函数的模平方模块和波达方向估计模块;
所述的傅里叶变换模块,包括:数据选择单元、数据分帧单元和傅里叶变换单元;所述的数据选择单元从传声器阵列采集的声音数据中,选取一段声音数据X(n)=[x1(n),...,xP(n)]T,所述的数据分帧单元将所述的数据选择单元选择的声音数据X(n)均匀分成L帧,所述的傅里叶变换单元对每一帧声音数据Xl(n)做N点快速傅里叶变换,得到声音数据的频域表示Xl(k)=[xl1(k),...,xlP(k)]T;并将所述频域声音数据输出至所述的相干函数的模平方模块;其中,P表示传声器阵列中传声器的个数,P≥2;每帧的数据Xl(n)的长度为N,l=1,...,L,X(n)的数据长度为N×L;n∈Z*;k=1,2,...,N/2;
所述的相干函数的模平方模块,用于根据所述的傅里叶变换模块得到的Xl(k)按照式(2)计算传声器阵列中的两个传声器间相干函数的模平方η(k);
η ( k ) = | γ i , j ( k ) | 2 = | Φ i , j ( k ) | 2 Φ i , i ( k ) Φ j , j ( k ) - - - ( 2 )
其中,k=1,2,...,N/2;i,j∈[1,2,...,P];Φi,j(k)为第i个传声器和第j个传声器的互功率谱,
Figure FDA00002275865200023
Φi,i(k)为第i个传声器的自功率谱,
Φ i , i ( k ) = Σ l = 1 L | X lj ( k ) | ; 2 Φj,j(k)为第j个传声器的自功率谱, Φ j , j ( k ) = Σ l = 1 L | X lj ( k ) | 2 ;
所述的波达方向估计模块,用于根据从所述的相干函数的模平方模块得到的相干函数的模平方中从最大的开始依次选出q个相干函数模的平方对应的声音数据Xl(k)进行波达方向估计,其中,k∈[k1,...,kq],kq表示频带序号,且[k1,...,kq]∈[1,...,N/2]。
8.根据权利要求7所述的针对宽带声源的波达方向估计装置,其特征在于,所述的相干函数的模平方模块中,两个传声器为传声器阵列中空间距离最大的两个传声器。
9.根据权利要求7所述的针对宽带声源的波达方向估计装置,其特征在于,所述的装置还包括声音数据缓存模块;
所述的声音数据缓存模块,用于保存传声器阵列到当前为止采集的连续L帧声音数据;并保存接收到来自传声器阵列最新的1帧声音数据后,将保存的连续L帧声音数据中最早的1帧声音数据删除;并将缓存的声音数据输出至所述的傅里叶变换模块。
10.根据权利要求9所述的针对宽带声源的波达方向估计装置,其特征在于,所述的相干函数的模平方模块将选取的两个传声器之间连续(L-1)帧的数据作为数据缓存,根据当前获得第L帧的N个数据和缓存的N×(L-1)个数据来求取相干函数的模平方。
11.根据权利要求10所述的针对宽带声源的波达方向估计装置,其特征在于,所述的波达方向估计模块根据比较模块得到的q个相干函数模的平方对应的第L帧声音数据XL(k)进行波达方向估计,其中,k∈[k1,...,kq]。
12.根据权利要求7所述的针对宽带声源的波达方向估计装置,其特征在于,该装置还包括一比较模块,用于根据比较所述的相干函数的模平方模块得到的η(k)大小,从最大的开始依次挑选前q个η(k)值,即η(k1)≥η(k2)≥...≥η(kq)≥η(km),其中,kq表示频带序号,[k1,...,kq]∈[1,2,....,N/2],
Figure FDA00002275865200033
将挑选出的相干函数的模平方输出至所述的波达方向估计模块。
CN 201010608798 2010-12-17 2010-12-17 一种针对宽带声源的波达方向估计方法及其装置 Expired - Fee Related CN102147458B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201010608798 CN102147458B (zh) 2010-12-17 2010-12-17 一种针对宽带声源的波达方向估计方法及其装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201010608798 CN102147458B (zh) 2010-12-17 2010-12-17 一种针对宽带声源的波达方向估计方法及其装置

Publications (2)

Publication Number Publication Date
CN102147458A CN102147458A (zh) 2011-08-10
CN102147458B true CN102147458B (zh) 2013-03-13

Family

ID=44421826

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201010608798 Expired - Fee Related CN102147458B (zh) 2010-12-17 2010-12-17 一种针对宽带声源的波达方向估计方法及其装置

Country Status (1)

Country Link
CN (1) CN102147458B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103217671B (zh) * 2013-04-10 2014-09-17 哈尔滨工程大学 色噪声环境下的多输入多输出雷达收发角度快速估计方法
CN104811886B (zh) * 2015-04-10 2018-04-17 西安电子科技大学 基于相位差测量的麦克风阵列测向方法
CN104811867B (zh) * 2015-04-29 2017-11-21 西安电子科技大学 基于阵列虚拟扩展的麦克风阵列空域滤波方法
CN106054132B (zh) * 2016-06-06 2018-06-08 西北工业大学 一种基于有效子带选择和检测统计量加权的ism方法
CN106019214B (zh) * 2016-07-08 2018-11-27 天津大学 宽带相干信号源doa估计方法
CN106500820B (zh) * 2016-10-13 2019-08-20 华南理工大学 一种用于二维波达方向估计的声速测量方法及装置
CN106526533B (zh) * 2016-11-14 2019-03-05 中国科学院上海微***与信息技术研究所 一种微孔径mems声阵列传感器及其使用方法
CN108710101A (zh) * 2018-04-10 2018-10-26 贵州理工学院 一种利用正交性获取相干信号子空间的doa估计算法
CN113219399B (zh) * 2020-08-05 2023-03-10 哈尔滨工业大学(威海) 基于全实值计算的远场窄带无线电信号波达方向估计方法
CN112485761B (zh) * 2021-02-03 2021-04-09 成都启英泰伦科技有限公司 一种基于双麦克风的声源定位方法
CN115497501B (zh) * 2022-11-18 2023-04-07 国网山东省电力公司济南供电公司 基于sw-music的变压器故障声纹定位方法及***

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3932620A1 (de) * 1989-09-29 1991-04-11 Mantel Juval Ortungssystem fuer schallimpulse
US6198693B1 (en) * 1998-04-13 2001-03-06 Andrea Electronics Corporation System and method for finding the direction of a wave source using an array of sensors
JP2001166025A (ja) * 1999-12-14 2001-06-22 Matsushita Electric Ind Co Ltd 音源の方向推定方法および収音方法およびその装置
WO2005024461A1 (en) * 2003-09-04 2005-03-17 Sonartech Atlas Pty Ltd Resolving directional information in sonar arrays
US8233353B2 (en) * 2007-01-26 2012-07-31 Microsoft Corporation Multi-sensor sound source localization
CN101470187B (zh) * 2007-12-26 2011-12-28 中国科学院声学研究所 一种用于线列阵的高精度测向方法

Also Published As

Publication number Publication date
CN102147458A (zh) 2011-08-10

Similar Documents

Publication Publication Date Title
CN102147458B (zh) 一种针对宽带声源的波达方向估计方法及其装置
CN103308889B (zh) 复杂环境下被动声源二维doa估计方法
Blandin et al. Multi-source TDOA estimation in reverberant audio using angular spectra and clustering
CN110491403A (zh) 音频信号的处理方法、装置、介质和音频交互设备
CN109839612A (zh) 基于时频掩蔽和深度神经网络的声源方向估计方法
Pavlidi et al. 3D localization of multiple sound sources with intensity vector estimates in single source zones
CN111123192B (zh) 一种基于圆形阵列和虚拟扩展的二维doa定位方法
WO2020024816A1 (zh) 音频信号处理方法、装置、设备和存储介质
Salvati et al. Acoustic source localization from multirotor UAVs
Swartling et al. Source localization for multiple speech sources using low complexity non-parametric source separation and clustering
US10670694B1 (en) System and method for hybrid-weighted, multi-gridded acoustic source location
Grobler et al. Sound based localization and identification in industrial environments
CN111798869B (zh) 一种基于双麦克风阵列的声源定位方法
CN108549052A (zh) 一种时频-空域联合加权的圆谐域伪声强声源定位方法
CN106526563B (zh) 一种基于互相关虚拟阵的五元体积阵多目标方位估计方法
Li et al. Sound source localization for mobile robot based on time difference feature and space grid matching
Hosseini et al. Time difference of arrival estimation of sound source using cross correlation and modified maximum likelihood weighting function
Suo et al. Single acoustic vector sensor DOA enhanced by unsaturated bistable stochastic resonance with linear amplitude response constrained
CN110838303B (zh) 一种利用传声器阵列的语音声源定位方法
Tourbabin et al. Speaker localization by humanoid robots in reverberant environments
Astapov et al. Simplified acoustic localization by linear arrays for wireless sensor networks
Georgiou et al. Robust maximum likelihood source localization: The case for sub-Gaussian versus Gaussian
Pertilä Acoustic source localization in a room environment and at moderate distances
CN101645701B (zh) 一种基于滤波器组的时延估计方法及其***
CN109239665B (zh) 一种基于信号子空间相似度谱和粒子滤波器的多声源连续定位方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130313