CN116797938A

CN116797938A - 一种基于对比学习预训练的sar舰船分类方法

Info

Publication number: CN116797938A
Application number: CN202310567081.2A
Authority: CN
Inventors: 王英华; 张超; 刘宏伟
Original assignee: Xidian University
Current assignee: Xidian University
Priority date: 2023-05-19
Filing date: 2023-05-19
Publication date: 2023-09-22

Abstract

本发明公开了一种基于对比学习预训练的SAR舰船分类方法，包括：构建特征融合网络，特征融合网络包括依次连接的特征提取模块、第一特征融合模块和第二特征融合模块；构建以特征融合网络为特征提取网络的SimCLR对比学习网络框架；获取多组mat格式训练数据集和多组JPG格式图片训练数据集，并将多组JPG图片训练数据集分别输入SimCLR网络框架中进行训练，获得多组预训练模型；将多组预训练模型的参数加载到特征融合网络中，并利用多组mat格式训练数据集进行进一步训练，获得训练后的特征融合网络；将待分类的原始SAR图片输入至训练后的特征融合网络中，获得分类结果。本发明使用无监督对比学习获得预训练模型并结合特征融合网络，提升了舰船分类性能。

Description

一种基于对比学习预训练的SAR舰船分类方法

技术领域

本发明属于图像目标分类技术领域，具体涉及一种基于对比学习预训练的SAR舰船分类方法。

背景技术

自SAR(Synthetic Aperture Radar，合成孔径雷达)于20世纪50年代问世以来，SAR图像目标分类技术也在飞速发展。在基于机器学习的SAR图像舰船目标分类中，Ji等人提取了舰船的RCS(Radar Cross Section，雷达散射截面积)统计特征中的位置特征参数(均值、方差和极差)、分布特征参数(偏度系数、峰度系数)、分布分析(概率密度函数、累计分布函数)和百分概率值分布(10％概率值、50％概率值和90％概率值)并使用BP神经网络实现了舰船图像的分类。在基于深度学习的SAR图像舰船目标分类中，主要是通过使用卷积神经网络提取SAR图像的特征进行分类，卷积神经网络开始于1998年的LeNet-5网络，实现了手写数字识别的功能，兴起于2012年Alex于ImageNet图像分类比赛上提出的AlexNet网络，后来不断出现新的经典网络(如VGG、GoogLeNet和ResNet等)都被应用到了SAR图像舰船目标分类中。

申请号为CN201911238758.8，专利名称为“基于深度密集连接和度量学习的SAR舰船目标识别方法”的发明专利提出了一种基于深度密集连接网络和度量学习的SAR舰船目标识别方法，该方法基于度量学习的思想，通过三元组网络获取同类样本和异类样本的深度特征，通过优化损失函数拉近在特征空间中同类样本的距离，推远异类样本的距离。其中三元组网络中的特征提取网络是改进后的DenseNet网络，损失函数是将交叉熵损失函数、三元组损失函数和Fisher判别正则项加权联合起来的联合损失函数。该发明专利对特征提取网络DenseNet和损失函数的改进，一定程度上提升了分类结果。但由于网络的参数量大，训练比较耗时，而且该方法只使用到了深层特征，比较抽象，忽视了图像中存在的纹理信息等特征，故该方法的结果仍然有提升空间。

目前SAR图像舰船目标分类方法主要是使用卷积神经网络提取到图像的深层特征进行分类，训练方式通常是从头训练。一方面，深层特征具有更强的语义信息，但是分辨率很低，对细节的感知能力较差；浅层特征分辨率更高，包括更多位置、细节信息，仅使用深层特征进行分类没有充分利用到浅层特征。

发明内容

为了解决现有技术中存在的上述问题，本发明提供了一种基于对比学习预训练的SAR舰船分类方法。本发明要解决的技术问题通过以下技术方案实现：

本发明提供了一种基于对比学习预训练的SAR舰船分类方法，包括：

S1：构建特征融合网络，所述特征融合网络包括依次连接的特征提取模块、第一特征融合模块和第二特征融合模块，其中，所述特征提取模块用于对输入的SAR图像进行初步特征提取，获取所述SAR图像的浅层特征和深层特征；所述第一特征融合模块用于实现从所述深层特征向所述浅层特征的融合，获得融合后的浅层特征；所述第二特征融合模块用于实现从所述融合后的浅层特征向所述深层特征的继续融合，并输出图像类别概率；

S2：构建以所述特征融合网络为特征提取网络的SimCLR对比学习网络框架，所述SimCLR对比学习网络框架包括级联的特征提取网络和特征映射网络；

S3：获取多组mat格式训练数据集和多组JPG格式图片训练数据集，并将所述多组JPG图片训练数据集分别输入所述SimCLR对比学习网络框架中进行训练，获得多组预训练模型；

S4：将所述多组预训练模型的参数加载到所述特征融合网络中，并利用所述多组mat格式训练数据集对所述特征融合网络进行进一步训练，获得训练后的特征融合网络；

S5：将待分类的原始SAR图片输入至训练后的特征融合网络中，获得分类结果。

在本发明的一个实施例中，所述特征提取模块包括依次连接的第一卷积层CO₁、第一批归一化层B₁、第一激活函数层R₁、第二卷积层CO₂、第二批归一化层B₂，第二激活函数层R₂、第一密集连接和过渡模块M₁、第二密集连接和过渡模块M₂、第三密集连接和过渡模块M₃以及第四密集连接和过渡模块M₄。

在本发明的一个实施例中，所述第一密集连接和过渡模块M₁、所述第二密集连接和过渡模块M₂、所述第三密集连接和过渡模块M₃以及所述第四密集连接和过渡模块M₄的结构均相同，均包括级联的密集连接单元和过渡单元，其中，

所述密集连接单元包括串联的四个子单元，每个子单元包括一个批归一化层、一个激活函数层、一个卷积层以及一个拼接层，并且前一个子单元的输入和输出拼接后作为后一个子单元的输入，最后一个子单元的输入和输出拼接后作为该密集连接单元的输出；

所述过渡单元包括依次连接的一个批归一化层、一个激活函数层、一个卷积层和一个池化层。

在本发明的一个实施例中，所述第一特征融合模块包括第一反卷积层T₁、第一拼接层CA₁、第三卷积层CO₃、第二反卷积层T₂、第二拼接层CA₂、第四卷积层CO₄、第三反卷积层T₃、第三拼接层CA₃、第五卷积层CO₅、第四反卷积层T₄、第四拼接层CA₄和第六卷积层CO₆，其中，

所述第一反卷积层T₁的输入连接所述第四密集连接和过渡模块M₄的输出，所述第一拼接层CA₁的两个输入分别连接所述第三密集连接和过渡模块M₃的输出和所述第一反卷积层T₁的输出，所述第一拼接层CA₁的输出连接所述第三卷积层CO₃的输入；所述第二反卷积层T₂的输入连接所述第三卷积层CO₃的输出，所述第二拼接层CA₂的两个输入分别连接所述第二密集连接和过渡模块M₂的输出和所述第二反卷积层T₂的输出，所述第二拼接层CA₂的输出连接所述第四卷积层CO₄的输入；所述第三反卷积层T₃的输入连接所述第四卷积层CO₄的输出，所述第三拼接层CA₃的两个输入分别连接所述第一密集连接和过渡模块M₁的输出和所述第三反卷积层T₃的输出，所述第三拼接层CA₃的输出连接所述第五卷积层CO₅的输入；所述第四反卷积层T₄的输入连接所述第五卷积层CO₅的输出，所述第四拼接层CA₄的两个输入分别连接所述第二激活函数层R₂的输出和所述第四反卷积层T₄的输出，所述第四拼接层CA₄的输出连接所述第六卷积层CO₆的输入。

在本发明的一个实施例中，所述第二特征融合模块包括第七卷积层CO₇、第三批归一化层B₃、第三激活函数层R₃、第一池化层P₁、第五拼接层CA₅、第八卷积层CO₈、第四批归一化层B₄、第四激活函数层R₄、第二池化层P₂、第六拼接层CA₆、第九卷积层CO₉、第五批归一化层B₅、第五激活函数层R₅、第三池化层P₃、第七拼接层CA₇、第十卷积层CO₁₀、第六批归一化层B₆、第六激活函数层R₆、第四池化层P₄、第八拼接层CA₈、第十一卷积层CO₁₁、第七批归一化层B₇、第七激活函数层R₇、第五池化层P₅、第八批归一化层B₈、第八激活函数层R₈、第六池化层P₆、展平层FL、第一全连接层FC₁和第二全连接层FC₂，其中，

所述第七卷积层CO₇、所述第三批归一化层B₃、所述第三激活函数层R₃和所述第一池化层P₁依次级联，且所述第七卷积层CO₇的输入连接所述第六卷积层CO₆的输出，所述第一池化层P₁的输出与所述第五卷积层CO₅的输出连接所述第五拼接层CA₅的输入；所述第八卷积层CO₈、所述第四批归一化层B₄、所述第四激活函数层R₄和所述第二池化层P₂依次级联，且所述第八卷积层CO₈的输入连接所述第五拼接层CA₅的输出，所述第二池化层P₂的输出与所述第四卷积层CO₄的输出连接所述第六拼接层CA₆的输入；

所述第九卷积层CO₉、所述第五批归一化层B₅、所述第五激活函数层R₅和所述第三池化层P₃依次级联，并且所述第九卷积层CO₉的输入连接所述第六拼接层CA₆的输出，所述第三池化层P₃的输出与所述第三卷积层CO₃的输出连接所述第七拼接层CA₇的输入；所述第十卷积层CO₁₀、所述第六批归一化层B₆、所述第六激活函数层R₆和所述第四池化层P₄依次级联，并且所述第十卷积层CO₁₀的输入连接第七拼接层CA₇的输出，所述第四池化层P₄的输出与所述第四密集连接和过渡模块M₄的输出连接所述第八拼接层CA₈的输入；所述第十一卷积层CO₁₁、所述第七批归一化层B₇、所述第七激活函数层R₇和所述第五池化层P₅依次连接，所述第十一卷积层CO₁₁的输入连接所述第八拼接层CA₈的输出，所述第五池化层P₅的输出依次连接所述第八批归一化层B₈、所述第八激活函数层R₈、所述第六池化层P₆、所述展平层FL、所述第一全连接层FC₁和所述第二全连接层FC₂。

在本发明的一个实施例中，所述特征映射网络为多层感知机，包括依次级联的第三全连接层FC₃、第九激活函数层R₉和第四全连接层FC₄，并且所述第三全连接层FC₃的输入连接所述第二全连接层FC₂的输出。

在本发明的一个实施例中，所述S3包括：

S3.1：对OpenSARShip数据集按照8:2的比例进行5次训练集和测试集的划分得到5份训练集{φ₁,φ₂,φ₃,φ₄,φ₅}和对应的5份测试集{t₁,t₂,t₃,t₄,t₅}，并将训练集{φ₁,φ₂,φ₃,φ₄,φ₅}进行数据扩充和裁剪得到训练集{Φ₁,Φ₂,Φ₃,Φ₄,Φ₅}，将测试集{t₁,t₂,t₃,t₄,t₅}进行裁剪得到测试集{T₁,T₂,T₃,T₄,T₅}，将mat格式训练集{Φ₁,Φ₂,Φ₃,Φ₄,Φ₅}转换为JPG格式图片训练集{Φ₁',Φ₂',Φ₃',Φ₄',Φ₅'}；

S3.2：将所述JPG格式图片数据集{Φ₁',Φ₂',Φ₃',Φ₄',Φ₅'}输入至所述SimCLR对比学习框架中进行预训练，得到预训练模型{ψ'₁,ψ'₂,ψ'₃,ψ'₄,ψ'₅}，所使用的损失函数为对比损失：

其中，z_i表示训练数据集中的第i条训练数据经过特征提取和特征映射得到的特征向量，z_j表示训练数据集中的第j条训练数据经过特征提取和特征映射得到的特征向量，s_i,j表示第i条训练数据与第j条训练数据的特征向量的相似度，l(i,j)表示经过函数变换之后的特征向量相似度，τ表示温度系数，L表示一个含N个样本的数据中所有由每一个样本经过数据增强得到的样本对的相似度的平均值。在计算过程中，对于N个样本的数据中的第k个样本，通过随机裁剪并缩放和高斯模糊两种数据增强方式得到数据增强后2N个样本的数据中的第2k-1和第2k个样本。

在本发明的一个实施例中，所述S4包括：

将所述预训练模型{ψ'₁,ψ'₂,ψ'₃,ψ'₄,ψ'₅}中每一个预训练模型的参数加载到所述特征融合网络ψ中，将与所述JPG格式图片数据集{Φ₁',Φ₂',Φ₃',Φ₄',Φ₅'}对应的mat格式数据集{Φ₁,Φ₂,Φ₃,Φ₄,Φ₅}输入到所述特征融合网络ψ中进行微调训练，获得训练后的特征融合网络。

与现有技术相比，本发明的有益效果有：

1、本发明基于对比学习预训练的SAR舰船分类方法使用无监督对比学习获得预训练模型，通过使用一个简单的SimCLR框架实现无监督对比学习，无需标签信息就能使得网络获得较好的特征提取能力；使用加载预训练模型微调的方法，相较于直接训练能获得更优的网络参数，网络收敛的速度变得更快，分类准确率也变得更高。

2、本发明使用了结合路径聚合网络(Path Aggregation Network，PANet)的双向特征融合结构的卷积神经网络，将浅层特征和深层特征结合起来，提高了卷积神经网络的图像特征提取能力和分类准确率。

以下将结合附图及实施例对本发明做进一步详细说明。

附图说明

图1是本发明实施例提供的一种基于对比学习预训练的SAR舰船分类方法的流程图；

图2是本发明实施例提供的一种特征融合网络的网络框架结构图；

图3是本发明实施例提供的一种密集连接单元的结构示意图；

图4是本发明实施例提供的一种过渡单元的结构示意图；

图5是本发明实施例提供的一种SimCLR对比学习网络框架的结构示意图；

图6是本发明实施例所使用的三类SAR舰船图像；

图7是本发明实施例对比实验所使用的基于三元组网络和Fisher判别准则的密集连接网络的结构示意图；

图8是本发明实施例在三类SAR舰船图像上的TriDenseNet和改进网络加载预训练模型微调的学习曲线图。

具体实施方式

为了进一步阐述本发明为达成预定发明目的所采取的技术手段及功效，以下结合附图及具体实施方式，对依据本发明提出的基于对比学习预训练的SAR舰船分类方法进行详细说明。

有关本发明的前述及其他技术内容、特点及功效，在以下配合附图的具体实施方式详细说明中即可清楚地呈现。通过具体实施方式的说明，可对本发明为达成预定目的所采取的技术手段及功效进行更加深入且具体地了解，然而所附附图仅是提供参考与说明之用，并非用来对本发明的技术方案加以限制。

应当说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者任何其他变体意在涵盖非排他性的包括，从而使得包括一系列要素的物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的物品或者设备中还存在另外的相同要素。

请参见图1，图1是本发明实施例提供的一种基于对比学习预训练的SAR舰船分类方法的流程图。该SAR舰船分类方法包括如下步骤：

S1：构建结合PANet和DenseNet的特征融合网络ψ，该特征融合网络ψ包括依次连接的特征提取模块、第一特征融合模块和第二特征融合模块，其中，所述特征提取模块用于对输入的SAR图像进行初步特征提取，获取所述SAR图像的浅层特征和深层特征；所述第一特征融合模块用于实现从所述深层特征向所述浅层特征的融合，获得融合后的浅层特征；所述第二特征融合模块用于实现从所述融合后的浅层特征向所述深层特征的继续融合，并输出图像类别概率。

请参见图2，图2是本发明实施例提供的一种特征融合网络的网络框架结构图。本实施例的特征提取模块包括两层卷积层、两层批归一化层、两层激活函数层和四层密集连接模块，具体地，该特征提取模块包括依次连接的第一卷积层CO₁、第一批归一化层B₁、第一激活函数层R₁、第二卷积层CO₂、第二批归一化层B₂，第二激活函数层R₂、第一密集连接和过渡模块M₁、第二密集连接和过渡模块M₂、第三密集连接和过渡模块M₃以及第四密集连接和过渡模块M₄。

进一步地，第一密集连接和过渡模块M₁、第二密集连接和过渡模块M₂、第三密集连接和过渡模块M₃以及第四密集连接和过渡模块M₄的结构均相同，均包括级联的密集连接单元和过渡模块单元，请参见图3和图4，图3是本发明实施例提供的一种密集连接单元的结构示意图；图4是本发明实施例提供的一种过渡单元的结构示意图。密集连接单元包括串联的四个子单元，每个子单元包括一个批归一化层、一个激活函数层、一个卷积层以及一个拼接层，并且前一个子单元的输入和输出拼接后作为后一个子单元的输入，最后一个子单元的输入和输出拼接后作为该密集连接单元的输出；过渡单元包括依次连接的一个批归一化层、一个激活函数层、一个卷积层和一个池化窗口。

在本实施例中，所述特征提取模块的输入为即待分类的SAR图片，其各层的输入、输出和参数设置及关系如下：

第一卷积层CO₁，其卷积核K¹的窗口大小为3×3，滑动步长S¹为1，用于输出1个特征图该层作为第一批归一化层B₁的输入；第一批归一化层B₁，其归一化方式为/>(其中，x为批归一化层输入的一批特征图，μ为该一批特征图对应位置所有元素的均值，σ²为该一批特征图对应位置所有元素的方差，ε是一个特别小的数，防止分母为0)，用于输出32个特征图/>该层作为第一激活函数层R₁的输入；第一激活函数层R₁，其激活函数为ReLU函数，用于输出32个权重特征图/>作为第二卷积层CO₂的输入；第二卷积层CO₂，其卷积核K²的窗口大小为3×3，滑动步长S²为1，用于输出32个特征图/>该层作为第二批归一化层B₂的输入；第二批归一化层B₂，其归一化方式为/>用于输出32个特征图/>该层作为第二激活函数层R₂的输入；第二激活函数层R₂，其激活函数为ReLU函数，用于输出32个权重特征图作为第一密集连接和过渡模块M₁的输入。

第一密集连接和过渡模块M₁，包括一个密集连接单元和一个过渡单元的级联，其中，密集连接单元包括串联的四个子单元，每个子单元包括一个批归一化层、一个激活函数层、一个卷积核大小为3×3×6且步长为1的卷积层以及一个拼接层，并且前一个子单元的输入和输出在拼接层进行拼接后作为后一个子单元的输入，最后一个子单元的输入和输出拼接后作为该密集连接单元的输出。所述过渡单元包括依次连接的一个批归一化层、一个激活函数层、一个卷积核大小为3×3×56且步长为1的卷积层和一个池化窗口。该第一密集连接和过渡模块M₁用于输出56个特征图该层作为第二密集连接和过渡模块M₂的输入。

第二密集连接和过渡模块M₂，包括级联的一个密集连接单元和一个过渡单元，其中，该密集连接单元包括四个串联的子单元，每个子单元包括串联的一个批归一化层、一个激活函数层、一个卷积核大小为3×3×12且步长为1的卷积层和一个拼接层，过渡单元包括串联的一个批归一化层、一个激活函数层、一个卷积核大小为3×3×104且步长为1的卷积操作和一个池化窗口。该第二密集连接和过渡模块M₂用于输出104个特征图该层作为第三密集连接和过渡模块M₃的输入。

类似的，第三密集连接和过渡模块M₃包括级联的一个密集连接单元和一个过渡单元，其中，该密集连接单元包括四个子单元，每个子单元包括串联的一个批归一化层、一个激活函数层、一个卷积核大小为3×3×18且步长为1的卷积层以及一个拼接层，该过渡单元包括串联的一个批归一化层、一个激活函数层、一个卷积核大小为3×3×176且步长为1的卷积层和一个池化窗口，该第三密集连接和过渡模块M₃用于输出176个特征图该层作为第四密集连接和过渡模块M₄的输入。

第四密集连接和过渡模块M₄，包括级联的一个密集连接单元和一个过渡单元，其中，该密集连接单元包括四个子单元，每个子单元包括串联的一个批归一化层、一个激活函数层、一个卷积核大小为3×3×24且步长为1的卷积层以及一个拼接层，该过渡单元包括串联的一个批归一化层、一个激活函数层、一个卷积核大小为3×3×272且步长为1的卷积层和一个池化窗口，该第四密集连接和过渡模块M₄用于输出272个特征图该层作为第一特征融合模块的输入。

继续参见图2，本实施例的第一特征融合模块包括四个反卷积层(TransposeConvolution)、四个拼接层和四个卷积层。具体地，该第一特征融合模块包括第一反卷积层T₁、第一拼接层CA₁、第三卷积层CO₃、第二反卷积层T₂、第二拼接层CA₂、第四卷积层CO₄、第三反卷积层T₃、第三拼接层CA₃、第五卷积层CO₅、第四反卷积层T₄、第四拼接层CA₄和第六卷积层CO₆，其中，第一反卷积层T₁的输入连接第四密集连接和过渡模块M₄的输出，第一拼接层CA₁的两个输入分别连接第三密集连接和过渡模块M₃的输出和第一反卷积层T₁的输出，第一拼接层CA₁的输出连接第三卷积层CO₃的输入；第二反卷积层T₂的输入连接第三卷积层CO₃的输出，第二拼接层CA₂的两个输入分别连接第二密集连接和过渡模块M₂的输出和第二反卷积层T₂的输出，第二拼接层CA₂的输出连接第四卷积层CO₄的输入；第三反卷积层T₃的输入连接第四卷积层CO₄的输出，第三拼接层CA₃的两个输入分别连接第一密集连接和过渡模块M₁的输出和第三反卷积层T₃的输出，第三拼接层CA₃的输出连接第五卷积层CO₅的输入；第四反卷积层T₄的输入连接第五卷积层CO₅的输出，第四拼接层CA₄的两个输入分别连接第二激活函数层R₂的输出和第四反卷积层T₄的输出，第四拼接层CA₄的输出连接第六卷积层CO₆的输入。

具体地，所述第一特征融合模块的输入为即第四密集连接和过渡模块M₄的输出，j＝1,2…272，其各层的输入、输出和参数设置及关系如下：

第一反卷积层T₁，其卷积核TK¹的窗口大小为4×4，滑动步长TS¹为2，用于输出176个特征图该层作为第一拼接层CA₁的输入；第一拼接层CA₁，其拼接维度为通道维，用于输出352个特征图/>该层作为第三卷积层CO₃的输入；第三卷积层CO₃，其卷积核K³的窗口大小为3×3，滑动步长S³为1，用于输出176个特征图该层作为第二反卷积层T₂的输入。

第二反卷积层T₂，其卷积核TK²的窗口大小为4×4，滑动步长TS²为2，用于输出104个特征图该层作为第二拼接层CA₂的输入；第二拼接层CA₂，其拼接维度为通道维，用于输出208个特征图/>该层作为第四卷积层CO₄的输入；第四卷积层CO₄，其卷积核K⁴的窗口大小为3×3，滑动步长S⁴为1，用于输出104个特征图该层作为第三反卷积层T₃的输入。

第三反卷积层T₃，其卷积核TK³的窗口大小为4×4，滑动步长TS³为2，用于输出56个特征图该层作为第三拼接层CA₃的输入；第三拼接层CA₃，其拼接维度为通道维，用于输出112个特征图/>该层作为第五卷积层CO₅的输入；第五卷积层CO₅，其卷积核K⁵的窗口大小为3×3，滑动步长S⁵为1，用于输出56个特征图该层作为第四反卷积层T₄的输入。

第四反卷积层T₄，其卷积核TK⁴的窗口大小为4×4，滑动步长TS⁴为2，用于输出32个特征图该层作为第四拼接层CA₄的输入；第四拼接层CA₄，其拼接维度为通道维，用于输出64个特征图/>该层作为第六卷积层CO₆的输入；第六卷积层CO₆，其卷积核K⁶的窗口大小为3×3，滑动步长S⁶为1，用于输出32个特征图该层作为所述第二特征融合模块的输入。

进一步地，本实施例的第二特征融合模块包括五个卷积层、六个批归一化层、六个激活函数层、六个池化层、四个拼接层、一个展平层和两个全连接层。具体地，本实施例的第二特征融合模块包括第七卷积层CO₇、第三批归一化层B₃、第三激活函数层R₃、第一池化层P₁、第五拼接层CA₅、第八卷积层CO₈、第四批归一化层B₄、第四激活函数层R₄、第二池化层P₂、第六拼接层CA₆、第九卷积层CO₉、第五批归一化层B₅、第五激活函数层R₅、第三池化层P₃、第七拼接层CA₇、第十卷积层CO₁₀、第六批归一化层B₆、第六激活函数层R₆、第四池化层P₄、第八拼接层CA₈、第十一卷积层CO₁₁、第七批归一化层B₇、第七激活函数层R₇、第五池化层P₅、第八批归一化层B₈、第八激活函数层R₈、第六池化层P₆、展平层FL、第一全连接层FC₁和第二全连接层FC₂。

具体地，第七卷积层CO₇、第三批归一化层B₃、第三激活函数层R₃和第一池化层P₁依次连接，且第七卷积层CO₇的输入连接第六卷积层CO₆的输出，第一池化层P₁的输出和第五卷积层CO₅的输出连接第五拼接层CA₅的输入；第八卷积层CO₈、第四批归一化层B₄、第四激活函数层R₄和第二池化层P₂依次连接，第八卷积层CO₈的输入连接第五拼接层CA₅的输出，第二池化层P₂的输出和第四卷积层CO₄的输出连接第六拼接层CA₆的输入；第九卷积层CO₉、第五批归一化层B₅、第五激活函数层R₅和第三池化层P₃依次连接，第九卷积层CO₉的输入连接第六拼接层CA₆的输出，第三池化层P₃的输出和第三卷积层CO₃的输出连接第七拼接层CA₇的输入。

第十卷积层CO₁₀、第六批归一化层B₆、第六激活函数层R₆和第四池化层P₄依次连接，第十卷积层CO₁₀的输入为第七拼接层CA₇的输出，第四池化层P₄的输出和第四密集连接和过渡模块M₄的输出连接第八拼接层CA₈的输入；第十一卷积层CO₁₁、第七批归一化层B₇、第七激活函数层R₇和第五池化层P₅依次连接，第十一卷积层CO₁₁的输入连接第八拼接层CA₈的输出，第五池化层P₅的输出依次连接第八批归一化层B₈、第八激活函数层R₈、第六池化层P₆、展平层FL、第一全连接层FC₁和第二全连接层FC₂。

具体地，所述第二特征融合模块的输入为即第六卷积层CO₆的输出，j＝1,2…32，其各层的输入、输出和参数设置及关系如下：

第七卷积层CO₇：其卷积核K⁷的窗口大小为3×3，滑动步长S⁷为1，用于输出32个特征图该层作为第三批归一化层B₃的输入；第三批归一化层B₃：其归一化方式为/>用于输出32个特征图/> 该层作为第三激活函数层R₃的输入；第三激活函数层R₃：其激活函数为ReLU函数，用于输出32个权重特征图作为第一池化层P₁的输入；第一池化层P₁：其池化维度为空间维，池化窗口大小为2×2，滑动步长PS¹为2，用于输出32个权重特征图/>该层作为第五拼接层CA₅的输入；第五拼接层CA₅：其拼接维度为通道维，用于输出88个特征图该层作为第八卷积层CO₈的输入。

第八卷积层CO₈：其卷积核K⁸的窗口大小为3×3，滑动步长S⁸为1，用于输出88个特征图该层作为第四批归一化层B₄的输入；第四批归一化层B₄：其归一化方式为/>用于输出88个特征图/> 该层作为第四激活函数层R₄的输入；第四激活函数层R₄：其激活函数为ReLU函数，用于输出88个权重特征图该层作为第二池化层P₂的输入；第二池化层P₂：其池化维度为空间维，池化窗口大小为2×2，滑动步长PS²为2，用于输出88个权重特征图/>该层作为第六拼接层CA₆的输入；第六拼接层CA₆：其拼接维度为通道维，用于输出192个特征图该层作为第九卷积层CO₉的输入。

第九卷积层CO₉：其卷积核K⁹的窗口大小为3×3，滑动步长S⁹为1，用于输出192个特征图该层作为第五批归一化层B₅的输入；第五批归一化层B₅：其归一化方式为/>用于输出192个特征图/>j＝1,2…192，该层作为第五激活函数层R₅的输入；第五激活函数层R₅：其激活函数为ReLU函数，用于输出192个权重特征图该层作为第三池化层P₃的输入；第三池化层P₃：其池化维度为空间维，池化窗口大小为2×2，滑动步长PS³为2，用于输出192个权重特征图/>该层作为第七拼接层CA₇的输入；第七拼接层CA₇：其拼接维度为通道维，用于输出368个特征图该层作为第十卷积层CO₁₀的输入。

第十卷积层CO₁₀：其卷积核K¹⁰窗口大小为3×3，滑动步长S¹⁰为1，用于输出368个特征图该层作为第六批归一化层B₆的输入；第六批归一化层B₆：其归一化方式为/>用于输出368个特征图/>j＝1,2…368，该层作为第六激活函数层R₆的输入；第六激活函数层R₆：其激活函数为ReLU函数，用于输出368个权重特征图该层作为第四池化层P₄的输入；第四池化层P₄：其池化维度为空间维，池化窗口大小为2×2，滑动步长PS₄为2，用于输出368个权重特征图/>该层作为第八拼接层CA₈的输入；第八拼接层CA₈：其拼接维度为通道维，用于输出640个特征图该层作为第十一卷积层CO₁₁的输入。

第十一卷积层CO₁₁：其卷积核K¹¹的窗口大小为3×3，滑动步长S¹¹为1，用于输出640个特征图该层作为第七批归一化层B₇的输入；第七批归一化层B₇：其归一化方式为/>用于输出640个特征图/> 该层作为第七激活函数层R₇的输入；第七激活函数层R₇：其激活函数为ReLU函数，用于输出640个权重特征图该层作为第五池化层P₅的输入；第五池化层P₅：其池化维度为空间维，池化窗口大小为2×2，滑动步长PS⁵为2，用于输出640个权重特征图/>该层作为第八批归一化层B₈的输入。

第八批归一化层B₈：其归一化方式为用于输出640个特征图/> 该层作为第八激活函数层R₈的输入；第八激活函数层R₈：其激活函数为ReLU函数，用于输出640个权重特征图/>该层作为第六池化层P₆的输入；第六池化层P₆：其池化维度为空间维，池化窗口大小为2×2，滑动步长PS⁶为2，用于输出640个权重特征图/>该层作为展平层FL的输入；展平层FL：用于输出1个640维列向量X₂ ²⁸，该层作为第一全连接层FC₁的输入；第一全连接层FC₁：其设有128个神经元，用于输出1个128维列向量X₂ ²⁹，该层作为第二全连接层FC₂的输入；第二全连接层FC₂：其设有3个神经元，用于输出1个3维列向量X₂ ³⁰。

S2：构建以所述特征融合网络ψ为特征提取网络的SimCLR对比学习网络框架，所述SimCLR对比学习网络框架包括级联的特征提取网络和特征映射网络。

具体地，请参见图5，图5是本发明实施例提供的一种SimCLR对比学习网络框架的结构示意图。本实施例的特征提取网络即为上述特征融合网络ψ，并且将所述特征融合网络ψ最后一层全连接层的输出节点个数修改为128。

所述特征映射网络为多层感知机E，包括两个全连接层和一个激活函数层，即依次级联的第三全连接层FC₃、第九激活函数层R₉和第四全连接层FC₄，并且所述第三全连接层FC₃的输入连接所述第二全连接层FC₂的输出。

具体地，该多层感知机E的输入为X₂ ³⁰，即为第二特征融合模块的第二全连接层FC₂的输出，其各层的输入、输出和参数设置及关系如下：

第三全连接层FC₃：其设有128个神经元，用于输出1个128维列向量X₂ ³¹，该层作为第九激活函数层R₉的输入；第九激活函数层R₉：其激活函数为ReLU函数，用于输出1个128维列向量X₂ ³²，该层作为第四全连接层FC₄的输入；第四全连接层FC₄：其设有128个神经元，用于输出1个128维列向量X₂ ³³。

S3：获取多组mat格式训练数据集和多组JPG格式图片训练数据集，并将所述多组JPG图片训练数据集分别输入所述SimCLR对比学习网络框架中进行训练，获得多组预训练模型。

在本实施例中，步骤S3包括：

S3.1：获取训练数据集和测试数据集。

具体地，对OpenSARShip数据集按照8:2的比例进行训练集和测试集的划分得到5份训练集{φ₁,φ₂,φ₃,φ₄,φ₅}和对应的5份测试集{t₁,t₂,t₃,t₄,t₅}，并将训练集{φ₁,φ₂,φ₃,φ₄,φ₅}进行数据扩充和裁剪得到训练集{Φ₁,Φ₂,Φ₃,Φ₄,Φ₅}，将测试集{t₁,t₂,t₃,t₄,t₅}进行裁剪得到测试集{T₁,T₂,T₃,T₄,T₅}，将mat格式训练集{Φ₁,Φ₂,Φ₃,Φ₄,Φ₅}转换为JPG格式图片训练集{Φ₁',Φ₂',Φ₃',Φ₄',Φ₅'}。

具体地，本步骤中数据集的划分和训练集的数据扩充具体操作步骤如下：

(a)对OpenSARShip数据集中的三类数据中的每一类均按照8:2的比例随机划分训练数据和测试数据，随后将三类数据的训练数据集合在一起作为本次划分的训练集φ_i，将三类数据的测试数据集合在一起作为本次划分的测试集t_i。通过5次划分得到了5份训练集{φ₁,φ₂,φ₃,φ₄,φ₅}和5份测试集{t₁,t₂,t₃,t₄,t₅}。

(b)对5份训练集{φ₁,φ₂,φ₃,φ₄,φ₅}进行数据扩充。具体扩充方式为：①将训练集中的舰船图片进行翻转，包括水平翻转和垂直翻转；②将舰船切片旋转90°、180°和270°；③将舰船切片随机左右平移0～5个像素；④向舰船图片中加入高斯噪声，其中高斯噪声的均值为0，方差为0.001。经过数据扩充后，每一类训练数据数量变为了原来的8倍，即原始样本和7倍的扩充样本，然后数量最少的一类训练数据数量为扩充后的每一类的训练数据数量，其余类别训练数据是所有原始训练数据加上随机选择的部分扩充训练数据组合而成，从而保证每一类的训练数据数量相同，随后取舰船图片中心64

×64区域为最终的mat格式训练集{Φ₁,Φ₂,Φ₃,Φ₄,Φ₅}，同时对测试集{t₁,t₂,t₃,t₄,t₅}

取舰船图片中心64×64区域为最终的测试集{T₁,T₂,T₃,T₄,T₅}；

(2c)对5份训练集{Φ₁,Φ₂,Φ₃,Φ₄,Φ₅}，将每份训练集中的每张SAR图像转换为JPG格式图片，得到了5份训练集{Φ₁',Φ₂',Φ₃',Φ₄',Φ₅'}。

S3.2：将JPG格式图片数据集{Φ₁',Φ₂',Φ₃',Φ₄',Φ₅'}输入到SimCLR对比学习框架Ω中进行预训练，得到训练好的预训练模型{ψ'₁,ψ'₂,ψ'₃,ψ'₄,ψ'₅}。

也就是说，将5份JPG格式图片数据集中的每份数据集输入到SimCLR对比学习框架Ω中，均可以得到一个对应的预训练模型，并且所使用的损失函数为对比损失：

其中，z_i表示训练数据集中的第i条训练数据经过特征提取和特征映射得到的特征向量，z_j表示训练数据集中的第j条训练数据经过特征提取和特征映射得到的特征向量，s_i,j表示第i条训练数据与第j条训练数据的特征向量的相似度。l(i,j)表示经过函数变换之后的特征向量相似度，τ表示温度系数，是一个超参数，设置为0.07，L表示一个含N个样本的小批量数据中所有由每一个样本经过数据增强得到的样本对的相似度的平均值，k是求和公式中的变量，表示N个数据中的第k个数据。在计算过程中，对于N个样本的数据中的第k个样本，通过随机裁剪并缩放和高斯模糊两种数据增强方式得到数据增强后2N个样本的数据中的第2k-1和第2k个样本。

S4：将所述多组预训练模型的参数加载到所述特征融合网络中，并利用所述多组mat格式训练数据集对所述特征融合网络进行进一步训练，获得训练后的特征融合网络。

具体地，将所述预训练模型{ψ'₁,ψ'₂,ψ'₃,ψ'₄,ψ'₅}中每一个预训练模型的参数加载到所述特征融合网络ψ中，将与所述JPG格式图片数据集{Φ₁',Φ₂',Φ₃',Φ₄',Φ₅'}对应的mat格式数据集{Φ₁,Φ₂,Φ₃,Φ₄,Φ₅}输入到所述特征融合网络ψ中进行微调训练，获得训练后的特征融合网络。示例性地，将预训练模型ψ'₁的参数加载到所述特征融合网络ψ中，将与JPG格式图片数据集Φ₁'对应的mat格式数据集Φ₁输入到所述特征融合网络ψ中进行微调训练，以此类推。

在本实施例中，训练300轮，每轮训练之后都利用测试集进行测试，取最后10轮测试准确率的平均值，得到最终的分类结果。在本步骤中，训练所使用的损失函数如下：

联合损失：

其中，λ₁是交叉熵损失函数权值设置为0.6，J_s(X,W,B)是交叉熵损失函数，X是网络输出的特征向量，W,B是网络参数权重和偏置，1-λ₁是三元组损失函数权值设置为0.4，J_t(X,W,B)是三元组损失函数，λ₂是Fisher判别正则项权值设置为0.005，J_f(X,W,B)是Fisher判别正则项，λ₃是L2正则项权值设置为0.0005，J_w(W,B)是权重衰减正则项，为第i个样本属于第c类的概率真值，/>为第i个样本属于第c类的概率预测值，N为一批数据的数据量；/>为三元组样本中锚点样本的特征向量，/>为三元组样本中正样本的特征向量，/>为三元组样本中负样本的特征向量，/>表示锚点样本的特征向量和正样本的特征向量的欧氏距离，/>表示锚点样本的特征向量和负样本的特征向量的欧氏距离，α为欧式距离阈值设置为0.2；/>表示/>时取它本身，/>时取0；m₁和m₂分别是同类样本数据对和不同类样本数据对在特征空间中的欧氏距离的平均值，/>和/>分别是对应的方差值；/>表示对网络参数矩阵施加F范数的平方，/>表示对网络参数向量施加2范数的平方。

以下通过对比实验对本发明基于对比学习预训练的SAR舰船分类方法的效果进行说明，请参见图7，图7是本发明实施例对比实验所使用的基于三元组网络和Fisher判别准则的密集连接网络的结构示意图，该密集连接网络简称TriDenseNet，出自论文《SAR图像舰船目标检测与分类方法研究》，西安电子科技大学博士论文，何敬鲁，2019。对比实验是在该密集连接网络TriDenseNet上直接进行训练。

在TriDenseNet直接训练过程中，实验使用PyTorch框架实现，使用到的是Ubuntu16.04操作***，torch 1.6.0版本，CUDA版本为10.0.130。学习率、动量参数、交叉熵损失函数权重、批次大小分别设置为0.1、0.9、0.6和100，并且学习率在训练的第150、200和250轮衰减为上一次的0.1倍。网络开始训练的10轮只使用交叉熵损失，10轮以后将交叉熵损失函数联合三元组损失和Fisher判别准则一起训练，训练300轮。

在利用本发明的方法通过在特征融合网络上加载预训练模型进行微调的实验过程中：首先对比学习预训练使用PyTorch框架实现，使用到的是Ubuntu 16.04操作***，torch 1.6.0版本，CUDA版本为10.0.130。在对比学习时，学习率、温度、动量参数分别设置为0.0003、0.07和0.0001，训练1000轮得到预训练模型；在微调时，学习率、动量参数、交叉熵损失函数权重、批次大小分别设置为0.1、0.9、0.6和100，并且学习率在训练的第150、200和250轮衰减为上一次的0.1倍。网络开始训练的10轮只使用交叉熵损失，10轮以后将交叉熵损失函数联合三元组损失和Fisher判别准则一起训练，训练300轮。

表1.三类SAR舰船图像利用TriDenseNet和本发明实施例方法获得的测试准确率

从图8和表1中可以看出，TriDenseNet直接训练和改进网络加载预训练模型微调两种方式经过300轮训练，在每一份数据集上都达到了收敛。两种方法在200轮以后训练曲线和测试曲线都收敛。从表1中可以看出，与TriDenseNet相比，改进网络加载预训练模型微调方式的准确率高0.64个百分点，标准差低0.29个百分点，拥有更高的分类准确率和更低的标准差，说明了在卷积神经网络中加入了特征融合模块并加载对比学习预训练模型微调的方式能够提高在SAR图像舰船目标上的分类准确率。

本发明基于对比学习预训练的SAR舰船分类方法使用无监督对比学习获得预训练模型，通过使用一个简单的SimCLR框架实现无监督对比学习，无需标签信息就能使得网络获得较好的特征提取能力；使用加载预训练模型微调的方法，相较于直接训练能获得更优的网络参数，网络收敛的速度变得更快，分类准确率也变得更高。本发明使用了结合路径聚合网络的双向特征融合结构的卷积神经网络，将浅层特征和深层特征结合起来，提高了卷积神经网络的图像特征提取能力和分类准确率。

在本发明所提供的几个实施例中，应该理解到，本发明所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个模块或组件可以结合或者可以集成到另一个***，或一些特征可以忽略，或不执行。

另外，在本发明各个实施例中的各功能模块可以集成在一个处理模块中，也可以是各个模块单独物理存在，也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用硬件加软件功能模块的形式实现。

以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明，不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干简单推演或替换，都应当视为属于本发明的保护范围。

Claims

1.一种基于对比学习预训练的SAR舰船分类方法，其特征在于，包括：

2.根据权利要求1所述的基于对比学习预训练的SAR舰船分类方法，其特征在于，所述特征提取模块包括依次连接的第一卷积层CO₁、第一批归一化层B₁、第一激活函数层R₁、第二卷积层CO₂、第二批归一化层B₂，第二激活函数层R₂、第一密集连接和过渡模块M₁、第二密集连接和过渡模块M₂、第三密集连接和过渡模块M₃以及第四密集连接和过渡模块M₄。

3.根据权利要求2所述的基于对比学习预训练的SAR舰船分类方法，其特征在于，所述第一密集连接和过渡模块M₁、所述第二密集连接和过渡模块M₂、所述第三密集连接和过渡模块M₃以及所述第四密集连接和过渡模块M₄的结构均相同，均包括级联的密集连接单元和过渡单元，其中，

4.根据权利要求2所述的基于对比学习预训练的SAR舰船分类方法，其特征在于，所述第一特征融合模块包括第一反卷积层T₁、第一拼接层CA₁、第三卷积层CO₃、第二反卷积层T₂、第二拼接层CA₂、第四卷积层CO₄、第三反卷积层T₃、第三拼接层CA₃、第五卷积层CO₅、第四反卷积层T₄、第四拼接层CA₄和第六卷积层CO₆，其中，

5.根据权利要求4所述的基于对比学***层FL、第一全连接层FC₁和第二全连接层FC₂，其中，

6.根据权利要求5所述的基于对比学习预训练的SAR舰船分类方法，其特征在于，所述特征映射网络为多层感知机，包括依次级联的第三全连接层FC₃、第九激活函数层R₉和第四全连接层FC₄，并且所述第三全连接层FC₃的输入连接所述第二全连接层FC₂的输出。

7.根据权利要求1所述的基于对比学习预训练的SAR舰船分类方法，其特征在于，所述S3包括：

S3.1：对OpenSARShip数据集按照8:2的比例进行5次训练集和测试集的划分得到5份训练集{φ₁,φ₂,φ₃,φ₄,φ₅}和对应的5份测试集{t₁,t₂,t₃,t₄,t₅}，并将训练集{φ₁,φ₂,φ₃,φ₄,φ₅}进行数据扩充和裁剪得到训练集{Φ₁,Φ₂,Φ₃,Φ₄,Φ₅}，将测试集{t₁,t₂,t₃,t₄,t₅}进行裁剪得到测试集{T₁,T₂,T₃,T₄,T₅}，将mat格式训练集{Φ₁,Φ₂,Φ₃,Φ₄,Φ₅}转换为JPG格式图片训练集{Φ₁',Φ′₂,Φ′₃,Φ′₄,Φ′₅'}；

S3.2：将所述JPG格式图片数据集{Φ₁',Φ′₂,Φ′₃,Φ′₄,Φ′₅}输入至所述SimCLR对比学习框架中进行预训练，得到预训练模型{ψ′₁,ψ'₂,ψ'₃,ψ'₄,ψ'₅}，所使用的损失函数为对比损失：

其中，z_i表示训练数据集中的第i条训练数据经过特征提取和特征映射得到的特征向量，z_j表示训练数据集中的第j条训练数据经过特征提取和特征映射得到的特征向量，s_i,j表示第i条训练数据与第j条训练数据的特征向量的相似度，l(i,j)表示经过函数变换之后的特征向量相似度，τ表示温度系数，L表示一个含N个样本的数据中所有由每一个样本经过数据增强得到的样本对的相似度的平均值，在计算过程中，对于N个样本的数据中的第k个样本，通过随机裁剪并缩放和高斯模糊两种数据增强方式得到数据增强后2N个样本的数据中的第2k-1和第2k个样本。

8.根据权利要求7所述的基于对比学习预训练的SAR舰船分类方法，其特征在于，所述S4包括：

将所述预训练模型{ψ′₁,ψ'₂,ψ'₃,ψ'₄,ψ'₅}中每一个预训练模型的参数加载到所述特征融合网络ψ中，将与所述JPG格式图片数据集{Φ₁',Φ′₂,Φ′₃,Φ′₄,Φ′₅}对应的mat格式数据集{Φ₁,Φ₂,Φ₃,Φ₄,Φ₅}输入到所述特征融合网络ψ中进行微调训练，获得训练后的特征融合网络。