CN113283278A

CN113283278A - 一种抗干扰的激光水下目标识别仪

Info

Publication number: CN113283278A
Application number: CN202110025036.5A
Authority: CN
Inventors: 吕以豪; 陈金水; 高洁; 王文海; 卢建刚; 刘兴高
Original assignee: Zhejiang University ZJU
Current assignee: Zhejiang University ZJU
Priority date: 2021-01-08
Filing date: 2021-01-08
Publication date: 2021-08-20
Anticipated expiration: 2041-01-08
Also published as: CN113283278B

Abstract

本发明公开了一种抗干扰的激光水下目标识别仪，由水下激光扫描装置、计算装置与显示装置依次相连组成，水下激光扫描装置对待检测水下区域进行扫描，将所得激光点云传输至计算装置，将其转化为二维图像数据，进行目标识别工作。所述的计算装置包括神经网络识别模块与存储模块。神经网络识别模块利用EfficientNet卷积神经网络与注意力机制相结合，引导网络忽略图像中的噪声，提高对于目标有效特征位置的关注，从而增加网络的抗干扰能力。本发明实现了智能化、抗干扰、高精度的激光水下目标识别。

Description

一种抗干扰的激光水下目标识别仪

技术领域

本发明涉及激光水下目标识别领域，具体地，涉及一种抗干扰的激光水下目标识别仪。

背景技术

激光水下目标识别技术是一项目前正在发展的先进的探测技术，它集激光技术、通信技术、信号处理与目标识别和电子技术等于一体，并且具有广阔的应用前景。对该技术的研究与开发无论是在理论上还是在实际应用上都具有十分重要的价值。

为了改善已有的深度学习网络的表现与能力，许多学者提出进一步模仿人类大脑的工作模式，将注意力机制引入神经网络模型中。目前在自然语言处理与图像理解分析两大深度学习经典应用场景已经有了许多成功的尝试。前者将注意力机制引入循环神经网络(RNN)中，对输入文本语句中的关键字、词汇、句子、段落甚至章节关系在模型训练过程中赋予不同的重要性，从而更加准确地完成内容理解，机器翻译等复杂任务。后者将注意力机制与卷积神经网络相结合，在训练过程中不断学习特征图中对于最终任务完成更加重要的部分，从而赋予这部分内容更高的权重，相当于对自身训练结果的二次强化，在分类，检测，分割等许多视觉应用场景都有十分成功的应用。

发明内容

本发明的目的是针对现有技术的不足，提供一种抗干扰的激光水下目标识别仪。

本发明解决其技术问题所采用的技术方案是：一种抗干扰的激光水下目标识别仪，包括依次相连的水下激光扫描装置、计算装置与显示装置，所述水下激光扫描装置对待检测水下区域进行扫描，将所得激光点云传输至计算装置，将其转化为二维图像数据，进行目标识别工作。所述的计算装置包括将传统通道域深度学习注意力模型与类激活映射图相结合，利用结构高度优化的EfficientNet卷积神经网络完成识别的神经网络识别模块与储存网络参数、操作***等数据的存储模块。

进一步地，所述神经网络识别模块实现目标识别工作，过程如下：

(1)将激光点云数据处理为三通道的图片数据，输入储存在数据存储模块中的包含注意力机模块的EfficientNet卷积神经网络模型。

(2)卷积神经网络对输入图片进行特征提取，生成多个阶段的特征图，赋予特征图每个通道一个权重，再将该权重回乘到该通道特征图的每个元素中，从而使得该层特征图不同通道的激活量在原本基础上呈现新的数值差异，其中某通道的权重越高，新生成的该通道的特征图的数值越大，即重要性越高。其实现过程为：

(2.1)对原特征图在通道维度上做全局平均池化，其表达式如(1)式。其中p_i是图像中的第i 个像素点，n是图像中的总像素点数，

是输出的池化值。因此可将通道数为C的特征图转化为1×1×C的特征向量F。

(2.2)将特征向量F输入几层全连接结构，特征维度通过映射先降低再升高，最终得到与输入维度相同的权重向量W。

(2.3)将W经过sigmoid激活函数层后乘回到原特征图中，赋予该特征图不同通道以不同权重。

(3)生成类激活映射图(CAM)，这是一种卷积神经网络抽象特征提取情况的可视化方式，也可以看做对于网络关注区域的可视化手段，具体过程如下：

(3.1)对输入特征图做全局平均池化，最终得到维度与CONV通道数相同的特征向量。

(3.2)利用式(2)计算对应当前输入样本的类激活映射图(CAM)。

其中w₁,w₂...w_n是当前输入样本所属类别在全连接层中对应的权重向量w，其维度与特征向量相同；M_i是特征图的第i通道图像；f是将图像中小于均值像素点置零的函数。式(2)表示权重向量w与对应的特征图相乘再做和，最终得到的热图即为网络关注的区域对应到输入图像中的情况。因为w中的元素代表着网络做出此输入样本属于该类别判断所依据的特征向量中各元素的权重，又因为此方法中特征向量由最后一层特征图经过GAP而来，则特征向量代表着特征图各通道的激活情况，即相应代表的特征在输入样本中的分布情况。

(4)对于EfficientNet卷积神经网络的每一个block输出的特征图，计算注意力热图，其实现如式(3)。其中h_i是步骤(2)所述的特征图每个通道的权重，n是该层特征图的通道数，M_i是特征图的第i个通道图像。

(5)将EfficientNet卷积神经网络的每一个block生成的热图(Heat)与其更深层的block生成的热图(Heat)做式(4)的平方误差损失(MSE Loss)，最后一层特征图的热图(Heat)与网络的类激活映射图(CAM)做平方误差损失(MSE Loss)，并将计算的所有损失加入网络的总损失中。

其中，p_i，q_i分别为输入的两个图像的第i个像素点，n是图片的总像素点数。

上述过程是一个层级结构，使网络由浅至深每个block输出的特征图都能受到注意力机制的引导，从而增强关键特征，提高网络的识别精度。因为特征图的每个通道都对一类输入数据中的特征敏感，因此通道的权重即为特征的权重，上述过程是一个特征选择过程。

本发明的技术构思为：将水下激光扫描装置、计算装置与显示装置，水下激光扫描装置、计算装置与显示装置依次相连，其特征是所述水下激光扫描装置对待检测水下区域进行扫描，将所得激光点云传输至计算装置，将其转化为二维图像数据，进行目标识别工作。所述的计算装置包括将传统通道域深度学习注意力模型与类激活映射图相结合，利用结构高度优化的 EfficientNet卷积神经网络完成识别的神经网络识别模块与储存网络参数、操作***等数据的储存模块。由于水体的流动与折射率的变化，采集到的各类水下目标的激光图像中存在较多的噪点，对深度学习网络的识别效果造成影响。本专利中的神经网络识别模块利用EfficientNet 卷积神经网络与注意力机制相结合，引导网络忽略图像中的噪声，提高对于目标有效特征位置的关注，从而增加网络的抗干扰能力。

本发明的有益效果主要表现在：本发明抗干扰的激光水下目标识别仪具有很快的推理速度与抗干扰能力，能够迅速稳定准确地完成激光水下目标的识别。

附图说明

图1是抗干扰的激光水下目标识别仪识别实现过程流程图。

具体实施方式

下面根据附图具体说明本发明。

本发明的抗干扰的激光水下目标识别仪包括依次相连的水下激光扫描装置、计算装置与显示装置，所述水下激光扫描装置对待检测水下区域进行扫描，将所得激光点云传输至计算装置，将其转化为二维图像数据，进行目标识别工作，识别结果由显示装置显示。所述的计算装置包括将传统通道域深度学习注意力模型与类激活映射图相结合，利用结构高度优化的 EfficientNet卷积神经网络完成识别的神经网络识别模块与储存网络参数、操作***等数据的存储模块。

本发明的工作过程如图1，具体步骤如下：

1)水下激光扫描装置在作业区域进行激光扫描，形成点云数据后通过线缆回传计算装置。

2)计算装置中集成了包含注意力机模块的EfficientNet卷积神经网络模型和数据存储模块，其识别过程如下：

2.1)将激光点云数据处理为三通道的图片数据，输入储存在数据存储模块中的包含注意力机模块的EfficientNet卷积神经网络模型。

2.2)卷积神经网络对输入图片进行特征提取，生成多个阶段的特征图，赋予特征图每个通道一个权重，再将该权重回乘到该通道特征图的每个元素中，从而使得该层特征图不同通道的激活量在原本基础上呈现新的数值差异，其中某通道的权重越高，新生成的该通道的特征图的数值越大，即重要性越高。其实现过程为：

2.2.1)对原特征图在通道维度上做全局平均池化，其表达式如(1)式。其中p_i是图像中的第i个像素点，n是图像中的总像素点数，

2.2.2)将特征向量F输入几层全连接结构，特征维度通过映射先降低再升高，最终得到与输入维度相同的权重向量W。

2.2.3)将W经过sigmoid激活函数层后乘回到原特征图中，赋予该特征图不同通道以不同权重。

2.3)生成类激活映射图(CAM)，这是一种卷积神经网络抽象特征提取情况的可视化方式，也可以看做对于网络关注区域的可视化手段，具体过程如下：

2.3.1)对输入特征图做全局平均池化，最终得到维度与CONV通道数相同的特征向量。

2.3.2)利用式(2)计算对应当前输入样本的类激活映射图(CAM)：

其中，w₁,w₂...w_n是当前输入样本所属类别在全连接层中对应的权重向量w，其维度与特征向量相同；M_i是特征图的第i通道图像；f是将图像中小于均值像素点置零的函数。式(2) 表示权重向量w与对应的特征图相乘再做和，最终得到的热图即为网络关注的区域对应到输入图像中的情况。因为w中的元素代表着网络做出此输入样本属于该类别判断所依据的特征向量中各元素的权重，又因为此方法中特征向量由最后一层特征图经过GAP而来，则特征向量代表着特征图各通道的激活情况，即相应代表的特征在输入样本中的分布情况。

2.4)对于EfficientNet卷积神经网络的每一个block输出的特征图，计算注意力热图，其实现如式(3)。其中h_i是2.2)所述的特征图每个通道的权重，n是该层特征图的通道数，M_i是特征图的第i个通道图像。

2.5)将EfficientNet卷积神经网络的每一个block生成的热图(Heat)与其更深层的block 生成的热图(Heat)做式(4)的平方误差损失(MSE Loss)。最后一层特征图的热图(Heat)与网络的类激活映射图(CAM)做平方误差损失(MSE Loss)。将计算得到的所有损失加入网络的总损失中。

其中p_i，q_i分别为输入的两个图像的第i个像素点，n是图片的总像素点数。

上述实施例用来解释说明本发明，而不是对本发明进行限制，在本发明的精神和权利要求的保护范围内，对本发明作出的任何修改和改变，都落入本发明的保护范围。

Claims

1.一种抗干扰的激光水下目标识别仪，其特征在于，包括依次相连的水下激光扫描装置、计算装置与显示装置，所述水下激光扫描装置对待检测水下区域进行扫描，将所得激光点云传输至计算装置，将其转化为二维图像数据，进行目标识别工作，识别结果由显示装置显示。所述的计算装置包括将传统通道域深度学习注意力模型与类激活映射图相结合，利用结构高度优化的EfficientNet卷积神经网络完成识别的神经网络识别模块与储存网络参数、操作***等数据的存储模块。

2.根据权利要求1所述抗干扰的激光水下目标识别仪，其特征在于，所述神经网络识别模块实现目标识别工作，过程如下：

(2.1)对原特征图在通道维度上做全局平均池化，其表达式如(1)式。其中p_i是图像中的第i个像素点，n是图像中的总像素点数，

(3.2)利用式(2)计算对应当前输入样本的类激活映射图(CAM)。