CN111352075B - 一种基于深度学习的水下多声源定位方法及*** - Google Patents

一种基于深度学习的水下多声源定位方法及*** Download PDF

Info

Publication number
CN111352075B
CN111352075B CN201811564007.0A CN201811564007A CN111352075B CN 111352075 B CN111352075 B CN 111352075B CN 201811564007 A CN201811564007 A CN 201811564007A CN 111352075 B CN111352075 B CN 111352075B
Authority
CN
China
Prior art keywords
sound
sound source
signal
source
hydrophone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811564007.0A
Other languages
English (en)
Other versions
CN111352075A (zh
Inventor
徐及
黄兆琼
颜永红
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Acoustics CAS
Original Assignee
Institute of Acoustics CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Acoustics CAS filed Critical Institute of Acoustics CAS
Priority to CN201811564007.0A priority Critical patent/CN111352075B/zh
Publication of CN111352075A publication Critical patent/CN111352075A/zh
Application granted granted Critical
Publication of CN111352075B publication Critical patent/CN111352075B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S5/00Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
    • G01S5/18Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
    • G01S5/22Position of source determined by co-ordinating a plurality of position lines defined by path-difference measurements

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

本发明公开了一种基于深度学习的水下多声源定位方法及***,所述方法包括:通过水听器阵列接收待检测的信号,估计声源的方位;在可能存在声源的方位上做子阵波束形成,然后计算待检测信号的空间相关矩阵,形成特征向量,输入到预先训练的时延神经网络,输出声源的距离。本发明的水下多声源定位方法,可以不依赖环境参数的先验知识;利用子阵波束形成的方法在特征层面将多个声源区分开,从而实现对水下多个目标同时定位。

Description

一种基于深度学习的水下多声源定位方法及***
技术领域
本发明涉及水下定位领域,具体涉及一种基于深度学习的水下多声源定位方法及***。
背景技术
声源定位包括单声源定位和多声源定位,声源定位技术可以指示声源目标所在的空间方位,为后续的信息采集与处理提供重要的空间信息。
传统方法主要利用现代数字信号处理的技术来估计水下声源的位置信息,通过格点匹配搜索或解析方式给出声源位置,这些方法往往依赖于环境信息的准确性,环境的扰动会影响定位的准确度和鲁棒性。
近年来,少部分方法将神经网络引入水下声源定位任务中,然而之前的研究都是针对水下单声源定位任务,相对于单声源定位,多声源定位任务更加复杂由于空间中存在多个声源相互干扰,解决实际环境下多声源定位问题有着重要意义。
发明内容
本发明的目的在于克服上述技术缺陷,提出了一种基于深度学习的水下多声源定位方法,该方法利用深度神经网络,实现鲁棒而高效的水下多声源定位。
为了实现上述目的,一种基于深度学习的水下多声源定位方法,包括:
通过水听器阵列接收待检测的信号,估计声源的方位;在可能存在声源的方位上做子阵波束形成,然后计算待检测信号的空间相关矩阵,形成特征向量,输入到预先训练的时延神经网络,输出声源的距离。
作为上述方法的一种改进,所述时延神经网络的训练步骤包括:
步骤1)在信号带宽内每个频率上做子阵波束形成,实现声源信号的聚焦;
步骤2)计算信号宽带内每个频率上对所有子阵在每个声源位置上聚焦的信号的空间相关矩阵,形成特征向量;
步骤3)将特征向量作为输入,已知声源的距离作为标签,采用最小均方误差准则对时延神经网络进行训练,得到训练好的时延神经网络。
作为上述方法的一种改进,所述步骤1)具体为:
将水听器阵列分成B个子阵,{Ω1,…,ΩB},分别在每个子阵上对已知声源做波束形成;那么在第b个子阵的聚焦信号表示为:
Figure BDA0001914060190000021
Figure BDA0001914060190000022
其中,上标τk表示声源在第k个水听器相对于第一个麦克风上的延时,lk
Figure BDA0001914060190000023
表示第k个水听器和第一个水听器之间的距离和单位方向向量,Ωb为第b个子阵包含的水听器索引号集合,c为声速,j为虚部单位,fi为频率,i为频率索引;Yk(fi)为将第k个水听器接收的声源信号转换成数字声音信号再进行傅里叶变换得到的信号;β为已知声源的方位;在所有B个子阵上进行子阵波束形成:
G(fi)=[g1(fi),…,gB(fi)]T
作为上述方法的一种改进,所述步骤2)具体为:
计算声源的空间相关矩阵R(fi):
Figure BDA0001914060190000024
Figure BDA0001914060190000025
将空间相关矩阵R(fi)的每个元素的实部虚部串联形成特征向量。
作为上述方法的一种改进,所述采用最小均方误差准则对时延神经网络进行训练的步骤为:
Figure BDA0001914060190000026
其中,rl为时延神经网络输出的声源距离值,r′l为已知的声源距离值,L为样本个数;E为最小化代价函数,通过随机梯度下降反向传播进行迭代,得到时延神经网络的权值矩阵。
作为上述方法的一种改进,所述估计声源的方位具体包括:
步骤S1)计算待检测信号Y(fi)的空间相关矩阵E[Y(fi)YH(fi)]:
Figure BDA0001914060190000027
其中,E(·)代表期望平均操作,(·)H代表共轭转置,
Figure BDA0001914060190000028
Figure BDA0001914060190000029
分别为特征值和特征向量矩阵对应信号子空间,
Figure BDA00019140601900000210
Figure BDA00019140601900000211
别为特征值和特征向量矩阵对应噪声子空间;
步骤S2)求取PMUSIC函数的极大值获得θ作为声源方位估计值α1,…,αD
Figure BDA0001914060190000031
其中,H(θ,fi)为声源的导向矢量,F为频率点的个数,D为声源的数量。
作为上述方法的一种改进,所述在可能存在声源的方位上做子阵波束形成具体为:
将水听器阵列分成B个子阵,{Ω1,…,ΩB},分别在每个子阵上对各个声源做波束形成,那么在第b个子阵对第d个声源的聚焦信号表示为:
Figure BDA0001914060190000032
Figure BDA0001914060190000033
其中,上标σk,d表示第d个声源在第k个水听器相对于第一个麦克风上的延时,1≤d≤D,lk
Figure BDA0001914060190000034
表示第k个水听器和第一个水听器之间的距离和单位方向向量,Ωb为第b个子阵包含的水听器索引号集合,c为声速,j为虚部单位,fi为频率,i为频率索引;对d个声源在所有B个子阵上进行子阵波束形成:
Figure BDA0001914060190000035
作为上述方法的一种改进,所述计算待检测信号的空间相关矩阵,形成特征向量具体为:
待检测信号的第d个可能声源的空间相关矩阵Sd(fi)为:
Figure BDA0001914060190000036
Figure BDA0001914060190000037
将空间相关矩阵Sd(fi)的每个元素的实部虚部进行串联形成特征向量。
一种基于深度学习的水下多声源定位***,包括存储器、处理器和存储在存储器上的并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现上述方法的步骤。
本发明的优点在于:
1、本发明的水下多声源定位方法,利用了深度神经网络,不依赖于环境参数的先验知识;利用子阵波束形成的方法在特征层面将多个声源区分开,从而实现对水下多个目标同时定位的目的;
2、本发明的方法在训练阶段只需要单声源数据,然而能实现在多源场景下的定位任务,大幅减小了模型的复杂度。
附图说明
图1是本发明的基于深度学习的水下多声源定位方法的流程图。
具体实施方式
现结合附图对本发明作进一步的描述。
参考图1,本发明提出了一种基于深度学习的水下多声源定位方法,包括以下步骤:
步骤1)将通过水听器阵列接收的声源信号转换成数字声音信号;
将通过水听器阵列接收的声源信号转换成数字声音信号;其中,所述水听器阵列包括有K个麦克风。
步骤2)对数字声音信号做傅里叶变换;
步骤3)在信号带宽内每个频率上做子阵波束形成,实现对不同方位声源信号的聚焦,具体步骤为:
3-1)将水听器阵列分成B个子阵,{Ω1,…,ΩB},分别在每个子阵上对各个声源做波束形成,假设有D个声源,那么在第b个子阵对第d个声源的聚焦信号可以表示为:
Figure BDA0001914060190000041
Figure BDA0001914060190000042
其中上标τk,d表示第d个声源在第k个水听器相对于第一个麦克风上的延时,lk
Figure BDA0001914060190000043
表示第k个水听器和第一个水听器之间的距离和单位方向向量,Ωb为第b个子阵包含的水听器索引号集合,c为声速,j为虚部单位,f为频率,i为频率索引。对d个声源在所有B个子阵上进行子阵波束形成,得到
Figure BDA0001914060190000044
步骤4)在信号宽带内每个频率上对所有子阵在每个声源位置上聚焦的信号求取空间相关矩阵,得到特征向量,具体步骤为:
求取每个声源的协方差矩阵,第d个声源的空间相关阵可以表示为:
Figure BDA0001914060190000045
其中
Figure BDA0001914060190000046
将有效频带上
Figure BDA0001914060190000047
的实部虚部串联作为神经网络的输入特征向量;
步骤5)在训练阶段,利用时延神经网络学习训练样本,得到特征向量和声源距离的映射关系模型。神经网络训练的准则为最小均方误差准则:
Figure BDA0001914060190000051
其中rl代表声源距离的估计值,r′l为声源距离的参考值,L为样本个数;通过随机梯度下降反向传播算法最小化代价函数E,得到神经网络的权值矩阵;
步骤6)在测试阶段,输入测试样本进行方位估计,将可能存在声源的方位上做子阵波束形成,然后求取空间相关矩阵得到测试信号的特征向量,输入到训练好的模型,得到声源的距离估计值,具体步骤为:
步骤6-1)、对测试样本进行方位估计,估计可能出现信号的方位,基于MUSIC(多重信号分类)方法,首先求取观察信号的空间相关矩阵,表示为:
Figure BDA0001914060190000052
其中E(·)代表期望平均操作,(·)H代表共轭转置,
Figure BDA0001914060190000053
Figure BDA0001914060190000054
分别为特征值和特征向量矩阵对应信号子空间,
Figure BDA0001914060190000055
Figure BDA0001914060190000056
别为特征值和特征向量矩阵对应噪声子空间。信号方位可以通过求取下面函数的极大值来获得:
Figure BDA0001914060190000057
最终目标方位估计为Θ={θ1,…,θD};
步骤6-2)、对Θ中所有可能出现声源的方向根据步骤3-1)和4-1)提取特征,输入模型得到目标的距离信息;
通过上述步骤3)和步骤4)抽取的特征向量在特征层面将多个声源区分开来,因此我们可以通过单声源信号数据来训练神经网络模型,得到特征与目标距离的对应关系,在测试时,先通过一个方位估计模块来估计可能存在声源的方位,然后抽取不同声源的特征,输入神经网络模型即可分别得到多个声源距离的估计值,从而实现对多声源进行定位。
最后所应说明的是,以上实施例仅用以说明本发明的技术方案而非限制。尽管参照实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,对本发明的技术方案进行修改或者等同替换,都不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (7)

1.一种基于深度学习的水下多声源定位方法,包括:
通过水听器阵列接收待检测的信号,估计声源的方位;在可能存在声源的方位上做子阵波束形成,然后计算待检测信号的空间相关矩阵,形成特征向量,输入到预先训练的时延神经网络,输出声源的距离;
所述在可能存在声源的方位上做子阵波束形成具体为:
将水听器阵列分成B个子阵,{Ω1,…,ΩB},分别在每个子阵上对各个声源做波束形成,那么在第b个子阵对第d个声源的聚焦信号表示为:
Figure FDA0003292942030000011
Figure FDA0003292942030000012
其中,上标σk,d表示第d个声源在第k个水听器相对于第一个麦克风上的延时,1≤d≤D,lk
Figure FDA0003292942030000013
表示第k个水听器和第一个水听器之间的距离和单位方向向量,Ωb为第b个子阵包含的水听器索引号集合,c为声速,j为虚部单位,fi为频率,i为频率索引;对d个声源在所有B个子阵上进行子阵波束形成:
Figure FDA0003292942030000014
所述计算待检测信号的空间相关矩阵,形成特征向量具体为:
待检测信号的第d个可能声源的空间相关矩阵Sd(fi)为:
Figure FDA0003292942030000015
Figure FDA0003292942030000016
将空间相关矩阵Sd(fi)的每个元素的实部虚部进行串联形成特征向量。
2.根据权利要求1所述的基于深度学习的水下多声源定位方法,其特征在于,所述时延神经网络的训练步骤包括:
步骤1)在信号带宽内每个频率上做子阵波束形成,实现声源信号的聚焦;
步骤2)计算信号宽带内每个频率上对所有子阵在每个声源位置上聚焦的信号的空间相关矩阵,形成特征向量;
步骤3)将特征向量作为输入,已知声源的距离作为标签,采用最小均方误差准则对时延神经网络进行训练,得到训练好的时延神经网络。
3.根据权利要求2所述的基于深度学习的水下多声源定位方法,其特征在于,所述步骤1)具体为:
将水听器阵列分成B个子阵,{Ω1,…,ΩB},分别在每个子阵上对已知声源做波束形成;那么在第b个子阵的聚焦信号表示为:
Figure FDA0003292942030000021
Figure FDA0003292942030000022
其中,上标τk表示声源在第k个水听器相对于第一个麦克风上的延时,lk
Figure FDA0003292942030000023
表示第k个水听器和第一个水听器之间的距离和单位方向向量,Ωb为第b个子阵包含的水听器索引号集合,c为声速,j为虚部单位,fi为频率,i为频率索引;Yk(fi)为将第k个水听器接收的声源信号转换成数字声音信号再进行傅里叶变换得到的信号;β为已知声源的方位;在所有B个子阵上进行子阵波束形成:
G(fi)=[g1(fi),…,gB(fi)]T
4.根据权利要求3所述的基于深度学习的水下多声源定位方法,其特征在于,所述步骤2)具体为:
计算声源的空间相关矩阵R(fi):
Figure FDA0003292942030000024
Figure FDA0003292942030000025
将空间相关矩阵R(fi)的每个元素的实部虚部串联形成特征向量。
5.根据权利要求4所述的基于深度学习的水下多声源定位方法,其特征在于,所述采用最小均方误差准则对时延神经网络进行训练的步骤为:
Figure FDA0003292942030000026
其中,rl为时延神经网络输出的声源距离值,rl′为已知的声源距离值,L为样本个数;E为最小化代价函数,通过随机梯度下降反向传播进行迭代,得到时延神经网络的权值矩阵。
6.根据权利要求1所述的基于深度学习的水下多声源定位方法,其特征在于,所述估计声源的方位具体包括:
步骤S1)计算待检测信号Y(fi)的空间相关矩阵E[Y(fi)YH(fi)]:
Figure FDA0003292942030000027
其中,E(·)代表期望平均操作,(·)H代表共轭转置,
Figure FDA0003292942030000031
Figure FDA0003292942030000032
分别为特征值和特征向量矩阵对应信号子空间,
Figure FDA0003292942030000033
Figure FDA0003292942030000034
别为特征值和特征向量矩阵对应噪声子空间;
步骤S2)求取PMUSIC函数的极大值获得θ作为声源方位估计值α1,…,αD
Figure FDA0003292942030000035
其中,H(θ,fi)为声源的导向矢量,F为频率点的个数,D为声源的数量。
7.一种基于深度学习的水下多声源定位***,包括存储器、处理器和存储在存储器上的并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1~6之一所述方法的步骤。
CN201811564007.0A 2018-12-20 2018-12-20 一种基于深度学习的水下多声源定位方法及*** Active CN111352075B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811564007.0A CN111352075B (zh) 2018-12-20 2018-12-20 一种基于深度学习的水下多声源定位方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811564007.0A CN111352075B (zh) 2018-12-20 2018-12-20 一种基于深度学习的水下多声源定位方法及***

Publications (2)

Publication Number Publication Date
CN111352075A CN111352075A (zh) 2020-06-30
CN111352075B true CN111352075B (zh) 2022-01-25

Family

ID=71195256

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811564007.0A Active CN111352075B (zh) 2018-12-20 2018-12-20 一种基于深度学习的水下多声源定位方法及***

Country Status (1)

Country Link
CN (1) CN111352075B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113419216B (zh) * 2021-06-21 2023-10-31 南京信息工程大学 一种适用于混响环境的多声源定位方法
CN115047408B (zh) * 2022-06-13 2023-08-15 天津大学 一种基于单层大卷积核神经网络的水下多声源定位方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5621858A (en) * 1992-05-26 1997-04-15 Ricoh Corporation Neural network acoustic and visual speech recognition system training method and apparatus
WO2006107230A1 (en) * 2005-03-30 2006-10-12 Intel Corporation Multiple-input multiple-output multicarrier communication system with joint transmitter and receiver adaptive beamforming for enhanced signal-to-noise ratio
CN105005026A (zh) * 2015-06-08 2015-10-28 中国船舶重工集团公司第七二六研究所 一种近场目标声源三维被动定位方法
CN105609113A (zh) * 2015-12-15 2016-05-25 中国科学院自动化研究所 基于双谱加权空间相关矩阵的语音声源定位方法
CN108828566A (zh) * 2018-06-08 2018-11-16 苏州桑泰海洋仪器研发有限责任公司 基于拖曳线列阵的水下脉冲信号识别方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6463904B2 (ja) * 2014-05-26 2019-02-06 キヤノン株式会社 信号処理装置及び音源分離方法及びプログラム
JP6567832B2 (ja) * 2015-01-29 2019-08-28 日本電産株式会社 レーダシステム、レーダ信号処理装置、車両走行制御装置および方法、ならびにコンピュータプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5621858A (en) * 1992-05-26 1997-04-15 Ricoh Corporation Neural network acoustic and visual speech recognition system training method and apparatus
WO2006107230A1 (en) * 2005-03-30 2006-10-12 Intel Corporation Multiple-input multiple-output multicarrier communication system with joint transmitter and receiver adaptive beamforming for enhanced signal-to-noise ratio
CN105005026A (zh) * 2015-06-08 2015-10-28 中国船舶重工集团公司第七二六研究所 一种近场目标声源三维被动定位方法
CN105609113A (zh) * 2015-12-15 2016-05-25 中国科学院自动化研究所 基于双谱加权空间相关矩阵的语音声源定位方法
CN108828566A (zh) * 2018-06-08 2018-11-16 苏州桑泰海洋仪器研发有限责任公司 基于拖曳线列阵的水下脉冲信号识别方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Multiple Source Localization in a Shallow Water Waveguide Exploiting Subarray Beamforming and Deep Neural Networks;Zhaoqiong Huang et al.;《sensors》;20191102;正文第1-22页 *
水声信号处理的模式识别方法 11实验研究;宫先仪 等;《声学与电子工程》;19921231;第1-6页 *
深度学习在水下目标被动识别中的应用进展;徐及 等;《信号处理》;20190930;第1460-1475页 *

Also Published As

Publication number Publication date
CN111352075A (zh) 2020-06-30

Similar Documents

Publication Publication Date Title
CN109975762B (zh) 一种水下声源定位方法
Qi et al. Spatial difference smoothing for DOA estimation of coherent signals
CN108375763B (zh) 一种应用于多声源环境的分频定位方法
CN109782231B (zh) 一种基于多任务学习的端到端声源定位方法及***
CN111123192B (zh) 一种基于圆形阵列和虚拟扩展的二维doa定位方法
CN106093921B (zh) 基于稀疏分解理论的声矢量阵宽带测向方法
CN105929386B (zh) 一种基于高阶累积量的波达估计方法
CN111352075B (zh) 一种基于深度学习的水下多声源定位方法及***
CN108089146B (zh) 一种对预估角误差鲁棒的高分辨宽带波达方向估计方法
CN108398659B (zh) 一种矩阵束与求根music结合的波达方向估计方法
CN103837858B (zh) 一种用于平面阵列的远场波达角估计方法及***
CN110515034B (zh) 一种声信号方位角测量***及方法
Zhang et al. Deep learning-based direction-of-arrival estimation for multiple speech sources using a small scale array
CN109932679B (zh) 一种传感器列***最大似然角度分辨率估计方法
CN108614235B (zh) 一种多鸽群信息交互的单快拍测向方法
CN116559778B (zh) 一种基于深度学习的车辆鸣笛定位方法及***
CN109541573A (zh) 一种弯曲水听器阵列的阵元位置校准方法
CN109541572B (zh) 一种基于线性环境噪声模型的子空间方位估计方法
CN109283487B (zh) 基于支持向量机可控功率响应的music-doa方法
CN113075645B (zh) 一种基于主成分分析-密度聚类的畸变阵形线谱增强方法
CN116299176A (zh) 一种基于霍夫变换的目标空间特征提取及融合定位方法
CN110632605A (zh) 一种宽容的大孔径拖线阵时域单波束处理方法
CN113109760B (zh) 一种基于组稀疏的多线谱联合doa估计和聚类方法及***
CN110471026B (zh) 一种相位增强的米波雷达目标低仰角doa估计方法
Rajani et al. Direction of arrival estimation by using artificial neural networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant