CN113138366B

CN113138366B - 一种基于深度迁移学习的单矢量水听器方位估计方法

Info

Publication number: CN113138366B
Application number: CN202010054130.9A
Authority: CN
Inventors: 曹怀刚; 王文博; 倪海燕; 苏林; 任群言; 马力
Original assignee: Institute of Acoustics CAS
Current assignee: Institute of Acoustics CAS
Priority date: 2020-01-17
Filing date: 2020-01-17
Publication date: 2022-12-06
Anticipated expiration: 2040-01-17
Also published as: CN113138366A

Abstract

本发明属于水声物理和水听器方位估计技术领域，具体涉及一种基于深度迁移学习的单矢量水听器方位估计方法，该方法包括：将原有的已训练好的深度学习模型中的隐知识迁移到当前场景的深度迁移学习模型中；对单矢量水听器接收的实测数据进行预处理，获得预处理后的数据；其中，所述预处理后的数据包括：带标签的数据和不带标签的数据；将预处理后的数据中的不带标签的数据输入至训练好的当前场景的深度迁移学习模型中，获得预处理后的不带标签的数据对应的标签，作为声源的方位角，完成单矢量水听器方位估计。

Description

一种基于深度迁移学习的单矢量水听器方位估计方法

技术领域

本发明属于水声物理和水听器方位估计技术领域，具体涉及一种基于深度迁移学习的单矢量水听器方位估计方法。

背景技术

目前，利用单矢量水听器进行声源方位估计，是近年来研究的热点。由于矢量水听器三个通道的指向性是固定的，无法像阵一样通过波束形成来使指向性发生改变从而抑制干扰，因此，当声场中存在较多的强干扰且无法从频谱上将这些干扰与目标区分开来时，现有的基于单矢量水听器的方位估计方法就不再适用。

基于深度学习的单矢量水听器方位估计方法已通过实验证明其有效性和可靠性，深度迁移学习是在深度学习的模型基础上，利用数据、任务、或模型之间的相似性，将在旧领域学习过的模型，应用于新领域的一种学习过程。

目前，传统的深度学习对不同的学习任务需要建立不同的模型学习不同的参数，从头建立模型并进行训练是复杂和耗时的。因此，现有的基于深度学习的单矢量水听器方位估计方法主要有两方面的技术问题：

1、基于仿真数据训练的深度学习模型由于训练的数据量大，因此特征提取能力较强，但是，这个普适化的模型针对具体的某一个复杂的应用场景(比如强干扰下的方位估计)时，其估计准确率和估计精度就会差很多；

2、基于实测数据的深度学习模型，因为带标签的实测数据是比较难获取到的，所以利用实测数据训练的模型主要问题在于训练数据量较少导致模型的特征提取能力不强，所以目标方位的估计准确率和估计精度也不高。

发明内容

本发明的目的在于，为解决现的单矢量水听器方位估计方法存在上述缺陷，本发明提出了一种基于深度迁移学习的单矢量水听器方位估计方法，对于迁移学习只需要利用源域中的数据将知识迁移到目标域，就能完成模型建立，通过迁移学习的方法可以加快学习效率。同时针对不同用户、不同设备、不同环境、不同需求，通过迁移学习都可以很好地进行满足。

为了实现上述目的，本发明提出了一种基于深度迁移学习的单矢量水听器方位估计方法，该方法包括：

将原有的已训练好的深度学习模型中的隐知识迁移到当前场景的深度迁移学习模型中；

对单矢量水听器接收的实测数据进行预处理，获得预处理后的数据；其中，所述预处理后的数据包括：带标签的数据和不带标签的数据；

将预处理后的数据中的不带标签的数据输入至训练好的当前场景的深度迁移学习模型中，获得预处理后的不带标签的数据对应的标签，作为声源的方位角，完成单矢量水听器方位估计。

作为上述技术方案的改进之一，所述当前场景的深度迁移学习模型为卷积神经网络，其包括：输入层、三个卷积层、四个全连接层和输出层；

所述输入层和三个卷积层为从原有的已训练好的深度学习模型中迁移过来的，即将原有的已训练好的深度学习模型中的隐知识迁移到当前场景的深度迁移学习模型中，

其中，所述三个卷积层包括：第一卷积层、第二卷积层和第三卷积层；第一卷积层包含64个卷积核，每个卷积核的大小为3×3；第二卷积层包含32个卷积核，每个卷积核的大小为3×3；第三卷积层包含32个卷积核，每个卷积核的大小为3×3；

在卷积层和全连接层之间加入了dropout层，系数为0.2；

在全连接层和输出层之间也有一个dropout层，系数为0.3；

所述四个全连接层中，每个全连接层有2048个神经元；

输出层的神经元个数为360；

采用的激活函数为线性整流函数。

作为上述技术方案的改进之一，所述当前场景的深度迁移学习模型的训练步骤具体包括：

将预处理后的数据中带标签的数据作为训练集，采用MATLAB中的trainNetwork函数作为目标函数，对当前场景的深度迁移学习模型进行训练；

在深度迁移学习神经网络模型进行训练的过程中，输入层输入带标签的实测数据，输出层的输出与标签之差称为衰减系数，整个训练的过程就是使该衰减系数趋于零，使深度迁移学习模型的输出与对应的标签无限接近的过程。

作为上述技术方案的改进之一，所述对单矢量水听器接收的实测数据进行预处理，获得预处理后的数据；具体为：

对单矢量水听器接收带标签的实测数据进行预处理过程如下：

单矢量水听器接收带标签的实测数据；其中，带标签的实测数据的频域表示为R(f)＝[p(f),a_x(f),a_y(f),a_z(f)]，将带标签的实测数据进行归一化处理：

其中，p(f)为频点f处的声压；a_x(f)为频点f处的x方向的加速度；a_y(f)为频点f处的y方向的加速度；a_z(f)为频点f处的z方向的加速度；

为归一化后的带标签的实测数据，即

其中，

为归一化后的声压；

为归一化后的x方向的加速度；

为归一化后的y方向的加速度；

为归一化后的z方向的加速度；其中，

统称为归一化后的加速度

将归一化后的声压

和归一化后的加速度

求其互谱后，再进行快拍平均：

其中，

为归一化后的声压

和归一化后的加速度

在频点f处的互谱后的快拍平均；N为快拍数；

为归一化后频点f处归一化后的声压的第s个快拍；

为归一化后频点f处归一化后的加速度的第s个快拍，i＝x,y,z；H表示复共轭；

归一化后的声压

和归一化后的加速度

互谱的实部和虚部组成一个3×2F的矩阵，形成带标签的数据；其中，F为总的频点个数；

实测带标签数据的标签的预处理：将声源方位角的估计看作一个回归问题，带标签数据对应的标签用一个以方位角真值为中心的高斯分布来表示：

其中，t_n为第n个采样点的预处理后的数据的标签；d为所有的取值角度；d＝1°-360°，步长为1；d_nr为真实角度；σ表示方位角的模糊度范围；

对单矢量水听器接收不带标签的实测数据进行预处理过程如下：

单矢量水听器接收不带标签的实测数据，其中，不带标签的实测数据的频域表示为R(f)′＝[p(f)′,a_x(f)′,a_y(f)′,a_z(f)′]，将不带标签的实测数据进行归一化处理：

其中，p(f)′为频点f处的不带标签声压；a_x(f)′为频点f处的x方向的不带标签加速度；a_y(f)′为频点f处的y方向的不带标签加速度；a_z(f)′为频点f处的z方向的不带标签加速度；

为归一化后的不带标签的实测数据，即

其中，

为归一化后的不带标签声压；

为归一化后的x方向的不带标签加速度；

为归一化后的y方向的不带标签加速度；

为归一化后的z方向的不带标签加速度；其中，

统称为归一化后的不带标签加速度

将归一化后的不带标签声压p(f)′和归一化后的不带标签加速度

求其互谱后，再进行快拍平均：

其中，

为归一化后的不带标签声压p(f)′和归一化后的不带标签加速度

在频点f处的互谱后的快拍平均；N为快拍数；

为归一化后频点f处不带标签声压的第s个快拍；

为为归一化后频点f处不带标签加速度的第s个快拍，i＝x,y,z；H表示复共轭；

归一化后的不带标签声压p(f)′和归一化后的不带标签加速度

互谱的实部和虚部组成一个3×2F的矩阵，形成不带标签的数据；其中，F为总的频点个数；

将带标签的数据和不带标签的数据组成预处理后的数据，即获得预处理后的数据。

本发明还提供了一种计算机设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现上述方法。

本发明还提供了一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序当被处理器执行时使所述处理器执行上述方法。

本发明与现有技术相比的有益效果是：

本发明的方法无需针对不同的应用需求重新训练深度学习模型，节省训练的时间；还可以有效提取目标声源的特征，抑制其他声源的干扰，大大提高声源方位估计的精度。

附图说明

图1是本发明的一种基于深度迁移学习的单矢量水听器方位估计方法的深度迁移学习模型的的神经网络结构图；

图2是本发明的一种基于深度迁移学习的单矢量水听器方位估计方法的深度迁移学习模型的算法流程图；

图3是本发明的一种基于深度迁移学习的单矢量水听器方位估计方法的用来训练迁移后的神经网络的带标签数据和用来测试迁移神经网络性能的不带标签数据的GPS航迹图；

图4(a)是实验过程中矢量水听器的航向角变化示意图；

图4(b)是实验过程中矢量水听器的横滚角变化示意图；

图4(c)是实验过程中矢量水听器的俯仰角变化示意图；

图5(a)是实验过程中矢量水听器接收到测试数据的声压的时域信号波形示意图；

图5(b)是实验过程中矢量水听器接收到测试数据的x方向的加速度的时域信号波形示意图；

图5(c)是实验过程中矢量水听器接收到测试数据的y方向的加速度的时域信号波形示意图；

图5(d)是实验过程中矢量水听器接收到测试数据的z方向的加速度的时域信号波形示意图；

图6(a)是实验过程中矢量水听器接收到测试数据的650s处声压的频域波形示意图；

图6(b)是实验过程中矢量水听器接收到测试数据的650s处x方向加速度的频域波形示意图；

图6(c)是实验过程中矢量水听器接收到测试数据的650s处y方向加速度的频域波形示意图；

图6(d)是实验过程中矢量水听器接收到测试数据的650s处z方向加速度的频域波形示意图；

图7(a)是利用传统复声强法估计到的测试数据的方位角与真实的GPS测得的方位角的比较示意图；

图7(b)是利用深度学习法估计到的测试数据的方位角与真实的GPS测得的方位角的比较示意图；

图7(c)是利用深度迁移学习法估计到的测试数据的方位角与真实的GPS测得的方位角的比较。

具体实施方式

现结合附图对本发明作进一步的描述。

将原有的已训练好的深度学习模型中的隐知识迁移到当前场景的深度前移学习模型中；原有的深度学习模型不能很好的满足当前环境下的方位估计要求，但是，原有的深度学习模型的训练数据量很大，特征提取能力较强，而深度学习模型中前几层一般为数据中的通用特征，因此将原有的深度学习模型中的前几层迁移到新的当前场景的深度前移学习模型中，可以使新的当前场景的深度前移学习模型在训练数据量不大的情况下，具有强特征提取的能力。

如图1所示，本发明提供了一种基于深度迁移学习的单矢量水听器方位估计方法，与深度学习方法相比，深度迁移学习无需针对不同的应用场景重新训练深度迁移学习神经网络模型，节省了时间提高了效率；当声场中有较强的干扰且无法在频谱上将其区分时，深度迁移学习的方法可以有效的抑制干扰的影响，提高方位估计的精度。

该方法包括：

将原有的已训练好的深度学习模型中的隐知识迁移到当前场景的深度前移学习模型中；

对单矢量水听器接收的实测数据进行预处理，获得预处理后的数据；其中，所述预处理后的数据包括：带标签的数据和不带标签的数据；其中，带标签的数据(少部分)用来训练新的深度迁移学习模型，使新的深度迁移学习模型具备原有的深度学习模型的特征提取能力，又适用于当前的应用环境；

具体地，对单矢量水听器接收带标签的实测数据进行预处理过程如下：

单矢量水听器接收带标签的实测数据；其中，带标签的实测数据的频域表示为R(f)＝[p(f),a_x(f),a_y(f),a_z(f)]，为减少声源谱的影响，将带标签的实测数据进行归一化处理，去除干扰：

为归一化后的带标签的实测数据，即

其中，

为归一化后的声压；

为归一化后的x方向的加速度；

为归一化后的y方向的加速度；

为归一化后的z方向的加速度；其中，

统称为归一化后的加速度

将归一化后的声压

和归一化后的加速度

求其互谱后，再进行快拍平均：

其中，

为归一化后的声压

和归一化后的加速度

在频点f处的互谱后的快拍平均；N为快拍数；

为归一化后频点f处归一化后的声压的第s个快拍；

归一化后的声压

和归一化后的加速度

深度迁移神经网络在训练的过程中，需要训练集中的带标签数据需要对应的标签作为参照，为增加训练的深度迁移学习神经网络模型的鲁棒性，使其具有一定的误差适应能力，需要对带标签数据对应的标签进行预处理：将声源方位角的估计看作一个回归问题，带标签数据对应的标签用一个以方位角真值为中心的高斯分布来表示：

其中，t_n为第n个采样点的预处理后的数据的标签；d为所有的取值角度；d＝1°-360°，步长为1°；d_nr为真实角度；σ表示方位角的模糊度范围；

标签数据的预处理是专指对训练过程中进行监督的标签进行预处理，这里就是指带标签数据的标签的预处理。神经网络在进行训练的时候需要矢量水听器测的数据作为输入，还需要对应的方位角作为标签对网络进行监督，标签数据的预处理很关键，特别是利用实验的实测数据进行训练的时候，因为实验根据GPS测得的方位角也是有误差的，对标签进行预处理就是想把可能存在的误差包含进去，从而使神经网络的鲁棒性更好。

单矢量水听器接收不带标签的实测数据，其中，不带标签的实测数据的频域表示为R(f)′＝[p(f)′,a_x(f)′,a_y(f)′,a_z(f)′]，为减少声源谱的影响，将不带标签的实测数据进行归一化处理，去除干扰：

为归一化后的不带标签的实测数据，即

其中，

为归一化后的不带标签声压；

为归一化后的x方向的不带标签加速度；

为归一化后的y方向的不带标签加速度；

为归一化后的z方向的不带标签加速度；其中，

统称为归一化后的不带标签加速度

求其互谱后，再进行快拍平均：

其中，

在频点f处的互谱后的快拍平均；N为快拍数；

为归一化后频点f处不带标签声压的第s个快拍；

归一化后的不带标签声压p(f)′和归一化后的不带标签加速度

将上述不带标签的实测数据输入到训练好的深度迁移学习模型中，输出为模型估计到的数据的标签，因为训练的时候参照的标签为高斯分布的形式，所以此时输出的标签也为高斯分布，取高斯分布的最大值为最终目标声源的方位估计结果。

将预处理后的数据中的不带标签的数据输入至训练好的当前场景的深度迁移学习模型中，获得预处理后的不带标签的数据对应的标签，此时的标签是高斯分布的形式，取高斯分布的最大值作为声源的方位角，完成单矢量水听器方位估计。

所述当前场景的深度前移学习模型为卷积神经网络，其包括：输入层、三个卷积层、四个全连接层和输出层；

所述输入层和三个卷积层为从原有的已训练好的深度学习模型中迁移过来的，即将原有的已训练好的深度学习模型中的隐知识迁移到当前场景的深度前移学习模型中，

在卷积层和全连接层之间加入了dropout层，系数为0.2；

在全连接层和输出层之间也有一个dropout层，系数为0.3；

所述四个全连接层中，每个全连接层有2048个神经元；

输出层的神经元个数为360；

采用的激活函数为线性整流函数。

所述当前场景的深度迁移学习模型的训练步骤具体包括：

有标签的机器学习的训练过程叫监督学习，标签就是相当于一个参照物，相当于对网络进行监督，让神经网络往我们希望的方向进行调整。因此，训练过程中神经网络的输出并不是标签，一开始是随机的一个值，神经网络的训练是进行很多个循环的，每次循环输出一个值，根据这个值与标签值的差值也就是衰减系数的大小对网络进行调整，然后再循环，再输出一个值，再根据衰减系数进行调整，当衰减系数不再变化或者变化不大的时候就认为网络训练好了。

所述深度学习神经网络模型网络模型为卷积神经网络，其包括：输入层、隐含层和输出层；

其中，所述隐含层进一步包括：三个卷积层、激活函数和四个全连接层；

所述三个卷积层包括：第一卷积层、第二卷积层和第三卷积层；其中，第一卷积层包含64个卷积核，每个卷积核的大小为3×3；第二卷积层包含32个卷积核，每个卷积核的大小为3×3；第三卷积层包含32个卷积核，每个卷积核的大小为3×3；

激活函数为线性整流函数；

在卷积层和全连接层之间增设dropout层，系数为0.2；

在全连接层和输出层之间也增设dropout层，系数为0.3；

所述四个全连接层中，每个全连接层有2048个神经元；

输出层的神经元个数为360；

输入层输入预处理后的数据；输出层输出预处理后的数据对应的的标签。

卷积层是主要的特征提取层，其通过对输入数据进行卷积处理后从数据中提取特征，卷积不仅限于对原始输入的卷积，而且还可以将卷积后提取到的特征(神经网络类似于一个黑盒子，内部具体提取的是什么特征并不清楚)进行进一步的卷积，所以隐含层中一般包含多个卷积层，多个卷积的叠加可以将特征不断的提取和压缩，最终得到比较高层次的特征；

所述深度学习神经网络模型的训练步骤，具体包括：

用KRAKEN仿真的矢量声场数据及其对应的标签，即带标签的仿真数据作为训练集，用KRAKEN仿真的矢量声场数据包括：单矢量水听器采集的声压矢量信号和加速度矢量信号；其中，声压为标量，加速度为矢量；

其中，单矢量水听器接收带标签的仿真数据，其中，带标签的仿真数据的频域表示为R(f)′^m＝[p(f)′^m,a_x(f)′^m,a_y(f)′^m,a_z(f)′^m]，为减少声源谱的影响，将带标签的仿真数据进行归一化处理，去除干扰：

其中，p(f)′^m为频点f处的带标签声压；a_x(f)′^m为频点f处的x方向的带标签加速度；a_y(f)′^m为频点f处的y方向的带标签加速度；a_z(f)′^m为频点f处的z方向的带标签加速度；

为归一化后的带标签的仿真数据，即

其中，

为归一化后的带标签声压；

为归一化后的x方向的带标签加速度；

为归一化后的y方向的带标签加速度；

为归一化后的z方向的带标签加速度；其中，

统称为归一化后的带标签加速度

将归一化后的带标签声压p(f)^′m和归一化后的带标签加速度

求其互谱后，再进行快拍平均：

其中，

为归一化后的带标签声压p(f)^′m和归一化后的带标签加速度

在频点f处的互谱后的快拍平均；N为快拍数；

为归一化后频点f处带标签声压的第s个快拍；

为为归一化后频点f处带标签加速度的第s个快拍，i＝x,y,z；H表示复共轭；

归一化后的带标签声压p(f)′^m和归一化后的带标签加速度

仿真数据的标签页需要进行预处理，

其中，t_n′^m为第n个采样点的预处理后的数据的标签；d′^m为所有的取值角度；d′^m＝1°-360°，步长为1°；d_nr′^m为真实角度；σ′^m表示方位角的模糊度范围；

利用MATLAB中的trainNetwork函数作为目标函数，对深度学习神经网络模型进行训练；

在深度学习神经网络模型进行训练的过程中，输入层输入带标签的仿真数据，输出层的输出与标签之差称为衰减系数，整个训练的过程就是使该衰减系数趋于零，使深度迁移学习模型的输出与对应的标签无限接近的过程。

深度迁移学习模型和深度学习模型的主要区别在于其网络层的选择和训练上，深度学习模型是从头设计卷积神经网络的各个层，并从头训练，十分的耗费时间；而深度迁移学习模型是将已经训练好的深度学习模型的部分网络层迁移到深度迁移学习模型的网络层中，然后再根据具体的应用场景的带标签的数据训练新的深度迁移学习模型，大大缩短了训练的时间，提高了效率。

实施例1.

2018年3月份进行了单矢量水听器的被动方位估计海上实验。实验过程中将船的辐射噪声作为声源，作为声源的船只船长60米，船宽26米，声源船的航行轨迹如图3所示。矢量水听器采用锚底布放的形式，海深61米，矢量水听器的深度保持在44米，实验过程中矢量水听器的姿态如图4所示，其中图4(a)为矢量水听器的航向角随时间的变化，可以看到水平航向角有较大的起伏；图4(b)和图4(c)为横滚角和俯仰角，它们代表了矢量水听器的竖直姿态，可以看到实验过程中横滚角和俯仰角变化很小，说明水听器的垂直姿态保持良好。矢量水听器的有效工作频段为20Hz-3kHz。图5为矢量水听器接收得到的信号的时域波形，图5(a)、图5(b)、图5(c)和图5(d)分别为声压通道、x方向的加速度通道、y方向加速度通道和z方向加速度通道的时域波形，由于声源为舰船辐射噪声，所以在时域上无法观察到明显的信号特征。图6为矢量水听器接收到的信号对应时域800s处的频域波形，图6(a)、图6(b)、图6(c)和图6(d)分别为声压通道、x方向的加速度通道、y方向加速度通道和z方向加速度通道的频域波形，声压通道的频域波形符合声场的能量分布规律，即低频段能量整体上要高于高频段；但加速度通道的频域波形并不符合这个规律，这主要是由于加速度通道对不同频率信号的灵敏度响应不一样。由于实验采用船只的辐射噪声作为声源，所以其他船只的辐射噪声会有较大的影响。实验海区选在靠近三亚港口的位置，附近有非常多的船只来往，主要为渔船和货船。实验过程中的干扰来源主要为港口的噪声和其他船只的噪声。

选取已经训练好的深度学习网络的卷积层、激活函数和池化层然后加入新的全连接层组成深度迁移学习的神经网络，如图1所示，以图3中黑色航迹对应的数据作为输入数据，标签数据为实测GPS转换的方位角并且同样采用高斯分布的形式，输入数据和标签数据经过预处理后用来训练深度迁移网络。按照图2所示流程，利用训练好的迁移深度学习的模型估计得到图3中测试数据对应航迹的方位角，此时得到的结果并非最终的估计结果，因为实验过程中矢量水听器受海流影响一直在转动，其航向角一直在变化，如图4(a)所示，所以要对估计结果针对航向角的变化进行修正，图7(c)即为修正后的深度迁移学习的声源方位估计结果。图7(a)和图7(b)分别为采用传统互谱法和深度学习法估计得到的图3中测试数据对应的方位角。

采用估计准确率来衡量估计结果的精度，估计值与真实值之差小于10°的估计结果为正确的估计结果，估计正确的结果数与总的估计结果数之比为估计准确率，表示为：

其中N_C表示估计正确的估计结果的个数，N为总的估计结果数。

图7(a)、7(b)为传统互谱法和深度学习法的方位角估计结果，其估计准确率E_Accu分别为37％、46％，从图中来看，在较近距离上两种方法还能估计到目标的方位角，但是当声源距离边远时估计到的结果主要就是干扰的方位了。图7(c)为深度迁移学习法的估计结果，其估计准确率E_Accu＝82％，远远大于传统互谱法和深度学习法。从图中可以看到，无论声源距矢量水听器近还是远，深度迁移学习的方法都能估计得到目标声源的方位，而且具有较高的估计准确率，说明深度迁移学习的方法可以有效的提取目标声源的特征，抑制干扰，提高方位估计结果的精度，具有较高的实用价值。

在本发明中，训练神经网络的电脑为清华同方(CPU为Intel酷睿八核，[email protected])训练深度迁移学习的神经网络仅用了11分钟，而重新训练一个新的深度学习的网络则需要611分钟，说明利用深度迁移学习节省了训练的时间，提高了效率。

最后所应说明的是，以上实施例仅用以说明本发明的技术方案而非限制。尽管参照实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，对本发明的技术方案进行修改或者等同替换，都不脱离本发明技术方案的精神和范围，其均应涵盖在本发明的权利要求范围当中。