CN112668440B - 基于平衡样本回归损失的sar舰船目标检测方法 - Google Patents

基于平衡样本回归损失的sar舰船目标检测方法 Download PDF

Info

Publication number
CN112668440B
CN112668440B CN202011544100.2A CN202011544100A CN112668440B CN 112668440 B CN112668440 B CN 112668440B CN 202011544100 A CN202011544100 A CN 202011544100A CN 112668440 B CN112668440 B CN 112668440B
Authority
CN
China
Prior art keywords
layer
training
module
loss function
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011544100.2A
Other languages
English (en)
Other versions
CN112668440A (zh
Inventor
王英华
杨振东
刘宏伟
唐天顾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
Original Assignee
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University filed Critical Xidian University
Priority to CN202011544100.2A priority Critical patent/CN112668440B/zh
Publication of CN112668440A publication Critical patent/CN112668440A/zh
Application granted granted Critical
Publication of CN112668440B publication Critical patent/CN112668440B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)
  • Complex Calculations (AREA)

Abstract

本发明公开了一种基于平衡样本回归损失的SAR舰船目标检测方法,主要解决现有深度学***衡导致训练出的网络模型对舰船目标检测性能低的问题。其实现方案是:1)获取舰船数据,并分为训练数据和测试数据;2)选取Faster‑RCNN网络为训练网络模型;3)对训练网络的原始损失函数进行改进,构成新的总损失函数;4)将训练数据送入2)所选的网络中,使用新的总损失函数对网络进行训练,得到最终训练好的网络模型;5)将测试数据送到训练好的网络模型中,得到舰船目标检测结果。本发明能更好的提取舰船目标的深度特征,提高了舰船目标检测性能,可用于对舰船目标的检测。

Description

基于平衡样本回归损失的SAR舰船目标检测方法
技术领域
本发明属于雷达技术领域,主要涉及一种SAR图像舰船目标检测方法,可用于后续的舰船目标识别与分类。
背景技术
合成孔径雷达是一种主动成像传感器,具有全天候、全天时、高分辨的数据获取能力。并具有多频段、多极化、视角可变和穿透性等特点。目前,SAR已广泛应用于军事侦察、地质普查、地形测绘和制图、灾情预报、海洋应用以及科学研究等领域,具有广阔的研究和应用前景。SAR图像自动目标识别ATR是SAR图像的重要应用之一。基本的SAR图像自动目标识别ATR***一般包括目标检测、目标鉴别和目标识别三个阶段。目标检测的性能将直接影响鉴别和分类阶段的性能和效率,因此对于SAR目标检测的研究就显得十分重要。
传统的SAR图像目标检测算法主要是恒虚警率CFAR方法,该类方法根据预先建立的杂波统计模型来确定检测阈值,但这些模型存在应用场景受限的缺点,并且检测效率较低。当前比较热门的深度学习方法能够通过训练自动获得数据的特征进行目标检测,在数据充足的情况下,能保证准确率和检测速度,更能适用不同的场景,因此通过深度学习方法对SAR图像舰船目标检测进行研究引起了普遍的关注。
Jianwei Li等人在IEEE发表的文章《SHIP DETECTION IN SAR IMAGES BASED ONAN IMPROVED FASTER R-CNN》中整理发布了SSDD舰船数据集并提出了使用改进的Faster-RCNN网络进行检测的方法,该方法将网络的多层特征进行融合,充分利用了底层特征,为SSDD数据的检测效果建立了基准线,但该方法由于未考虑训练数据中的难易样本非平衡问题,因而会使网络倾向于学习其中的一类样本,导致对另一类样本的学习较差,制约检测性能。
Yuanyuan Wang等人在remote sensing发表的文章《Automatic Ship DetectionBased on RetinaNet Using Multi-Resolution Gaofen-3 Imagery》中对RetinaNet检测网络进行改进,并将其应用于高分3号SAR图像舰船数据,取得较好的检测性能。该方法使用Focal loss分类损失函数解决了分类上的难易样本不平衡问题,然而,未考虑回归上的不平衡问题,检测结果依然有待进一步提高。
发明内容
本发明的目的在于提出一种基于平衡样本回归损失的SAR舰船目标检测方法,以解决现有深度学***衡导致训练出的网络模型对舰船目标检测效果不佳的问题,提高舰船目标检测性能。
本发明的技术方案是:首先将SSDD数据分为训练数据和测试数据,然后使用训练数据训练Faster-RCNN深度神经网络模型,网络使用改进后的回归损失函数,待模型收敛后,将训练好的神经网络应用于测试数据之上,得到最终的舰船检测结果,其实现步骤包括如下:
(1)获取SSDD舰船数据集,并将其按照8:2的比例分为训练数据Φx和测试数据Φc
(2)选择由共享基础模块VGG、区域选取模块RPN和区域精修模块Fast-RCNN依次连接组成的训练网络模型Ω;
(3)构建改进后的损失函数;
(3a)将网络RPN模块回归损失中的
Figure BDA0002855456390000021
函数改进为
Figure BDA0002855456390000022
函数,其形式为:
Figure BDA0002855456390000023
Figure BDA0002855456390000024
其中,j为RPN模块第j个训练样本,tn为RPN模块为训练样本预测的位置信息,
Figure BDA0002855456390000025
为训练样本对应的目标框的位置信息,n∈{x,y,w,h},a为超参数,a=2;
(3b)将网络Fast-RCNN模块回归损失中的
Figure BDA0002855456390000026
函数改进为
Figure BDA0002855456390000027
函数,其形式为:
Figure BDA0002855456390000028
Figure BDA0002855456390000031
其中,p为Fast-RCNN模块第p个训练样本,em为Fast-RCNN模块为训练样本预测的位置信息,
Figure BDA0002855456390000032
为训练样本对应的目标框的位置信息,m∈{x,y,w,h}。
(3c)根据(3a)和(3b)改进的回归损失函数,得到训练网络改进后的总损失函数Js,其表示如下:
Figure BDA0002855456390000033
其中,Js1、λrpn和Ns1分别为RPN模块的分类损失函数、损失平衡常数和训练样本数量,Js3、λfast和Ns2为Fast-RCNN模块的分类损失函数、损失平衡常数和训练样本数量,
Figure BDA0002855456390000034
为RPN模块第j个样本是否为正样本的标签,
Figure BDA0002855456390000035
为Fast-RCNN模块第p个样本是否为正样本的标签。
(4)将训练数据Φx输入到构建好的训练网络模型Ω中,使用网络总的损失函数Js对该网络模型Ω进行训练,直到损失函数收敛,得到训练好的网络模型Ω';
(5)将舰船测试数据Φc输入到最终训练好的网络模型Ω'中,得到舰船的检测结果。
本发明与现有技术相比具有以下优点:
本发明针对现有深度学***衡的问题,改进了回归损失函数,能更好的提取舰船目标的深度特征,提高了舰船目标检测性能。
附图说明
图1为本发明的实现流程图;
图2为本发明中使用的训练网络模型结构图;
图3为本发明中设计的回归损失函数梯度图。
具体实施方式
下面结合附图对本发明的实施例和效果进行详细说明:
参照图1,本发明的实现步骤如下:
步骤1,获取SSDD舰船数据集,划分训练数据和测试数据。
SSDD舰船数据集由多个雷达卫星拍摄,并经过专家整理标注而成,本实例通过申请获取数据后按照8:2的比例划分为训练数据Φx和测试数据Φc
步骤2,选取训练网络模型Ω。
现有的目标检测网络有YOLO系列、SSD网络和Faster-RCNN网络等,本实例选取经典的Faster-RCNN网络作为训练网络模型Ω进行检测。
参照图2,本实例选取的训练网络模型Ω由共享基础模块VGG、区域选取模块RPN和区域精修模块Fast-RCNN依次连接组成,各模块结构如下:
2.1)VGG基础模块:
该模块包括5个卷积块和4个平均池化层,依次为第一卷积块V1→第一平均池化层P1→第二卷积块V2→第二平均池化层P2→第三卷积块V3→第三平均池化层P3→第四卷积块V4→第四平均池化层P4→第五卷积块V5,各层参数设置及关系如下:
2.1a)卷积块V1,其由两个完全相同的卷积块级联而成,每个卷积块由两层结构组成,即第一层为卷积层
Figure BDA0002855456390000041
第二层为ReLU激活函数层
Figure BDA0002855456390000042
i表示第i个卷积块,i=1,2,其中:
第一层卷积层
Figure BDA0002855456390000043
其卷积核K1的窗口大小为3×3,滑动步长S1为1,填充方式为SAME,用于对输入进行卷积,输出64个特征图
Figure BDA0002855456390000044
作为第二层激活函数层
Figure BDA0002855456390000045
的输入;
第二层ReLU激活函数层
Figure BDA0002855456390000046
用于对上一层
Figure BDA0002855456390000047
层的输出进行非线性的映射,非线性映射公式如下:
ReLU(x)=max(0,x)
式中x为输入,ReLU(x)为输出,该层的输入和输出的维度一致。
2.1b)平均池化层P1,用于对输入下采样,其下采样核U1的窗口大小为2×2,滑动步长V1为2,输出64个特征图Y1,作为卷积块V2层的输入。
2.1c)卷积块V2,其由两个完全相同的卷积块级联而成,每个卷积块由两层结构组成,即第一层为卷积层
Figure BDA0002855456390000048
第二层为ReLU激活函数层
Figure BDA0002855456390000049
i表示第i个卷积块,i=1,2,其中:
第一层卷积层
Figure BDA00028554563900000410
其卷积核K2的窗口大小为3×3,滑动步长S2为1,填充方式为SAME,用于对输入进行卷积,输出128个特征图
Figure BDA00028554563900000411
作为第二层激活函数层
Figure BDA00028554563900000412
的输入;
第二层ReLU激活函数层
Figure BDA0002855456390000051
用于对上一层
Figure BDA0002855456390000052
层的输出进行非线性的映射,非线性映射公式如下:
ReLU(x)=max(0,x)
式中x为输入,ReLU(x)为输出,该层的输入和输出的维度一致。
2.1d)平均池化层P2,用于对输入下采样,其下采样核U2的窗口大小为2×2,滑动步长V2为2,输出128个特征图Y2,作为卷积块V3的输入。
2.1e)卷积块V3,其由三个完全相同的卷积块级联而成,每个卷积块由两层结构组成,即第一层为卷积层
Figure BDA0002855456390000053
第二层为ReLU激活函数层
Figure BDA0002855456390000054
i表示第i个卷积块,i=1,2,3,其中:
第一层卷积层
Figure BDA0002855456390000055
其卷积核K3的窗口大小为3×3,滑动步长S3为1,填充方式为SAME,用于对输入进行卷积,输出256个特征图
Figure BDA0002855456390000056
作为第二层激活函数层
Figure BDA0002855456390000057
的输入;
第二层ReLU激活函数层
Figure BDA0002855456390000058
用于对上一层
Figure BDA0002855456390000059
层的输出进行非线性的映射,非线性映射公式如下:
ReLU(x)=max(0,x)
式中x为输入,ReLU(x)为输出,该层的输入和输出的维度一致。
2.1f)平均池化层P3,用于对输入下采样,其下采样核U3的窗口大小为2×2,滑动步长V3为2,输出256个特征图Y3,作为卷积块V4的输入。
2.1g)卷积块V4,其由三个完全相同的卷积块级联而成,每个卷积块由两层结构组成,即第一层为卷积层
Figure BDA00028554563900000510
第二层为ReLU激活函数层
Figure BDA00028554563900000511
i表示第i个卷积块,i=1,2,3,其中:
第一层卷积层
Figure BDA00028554563900000512
其卷积核K4的窗口大小为3×3,滑动步长S4为1,填充方式为SAME,用于对输入进行卷积,输出512个特征图
Figure BDA00028554563900000513
作为第二层激活函数层
Figure BDA00028554563900000514
的输入;
第二层ReLU激活函数层
Figure BDA00028554563900000515
用于对上一层
Figure BDA00028554563900000516
层的输出进行非线性的映射,非线性映射公式如下:
ReLU(x)=max(0,x)
式中x为输入,ReLU(x)为输出,该层的输入和输出的维度一致。
2.1h)平均池化层P4,用于对输入下采样,其下采样核U4的窗口大小为2×2,滑动步长V4为2,输出512个特征图Y4,作为卷积块V5的输入。
2.1i)卷积块V5,其由三个完全相同的卷积块级联而成,每个卷积块由两层结构组成,即第一层为卷积层
Figure BDA0002855456390000061
第二层为ReLU激活函数层
Figure BDA0002855456390000062
i表示第i个卷积块,i=1,2,3,其中:
第一层卷积层
Figure BDA0002855456390000063
其卷积核K5的窗口大小为3×3,滑动步长S5为1,填充方式为SAME,用于对输入进行卷积,输出512个特征图
Figure BDA0002855456390000064
作为第二层激活函数层
Figure BDA0002855456390000065
的输入;
第二层ReLU激活函数层
Figure BDA0002855456390000066
用于对上一层
Figure BDA0002855456390000067
层的输出进行非线性的映射,非线性映射公式如下:
ReLU(x)=max(0,x)
式中x为输入,ReLU(x)为输出,该层的输入和输出的维度一致。
最后一个卷积块ReLU激活函数层
Figure BDA0002855456390000068
输出即为VGG基础层提取的共享特征F。
2.2)RPN模块:
该层依次由共享卷积层C1、激活函数层C2、两个并列的分类支路C3和回归卷积层C4组成,各层参数设置及关系如下:
共享卷积层C1,其卷积核K6的窗口大小为3×3,滑动步长S6为1,填充方式为SAME,用于对输入进行卷积,输出512个特征图Y6,作为第二层激活函数层C2的输入;
第二层ReLU激活函数层C2,用于对上一层C1层的输出进行非线性的映射,非线性映射公式如下:
ReLU(x)=max(0,x)
式中x为输入,ReLU(x)为输出,该层的输入和输出的维度一致。
分类支路依次由分类卷积层C31、Softmax分类器层C32组成,各层参数设置及关系如下:
分类卷积层C31,其卷积核K7的窗口大小为1×1,滑动步长S7为1,填充方式为SAME,用于对输入进行卷积,输出18个特征图Y7
Softmax分类器层C32,用于将分类卷积层C31得到的18个特征图Y7输入到两类Softmax分类器中,得到分类概率向量p。
回归卷积层C4,其卷积核K8的窗口大小为1×1,滑动步长S8为1,填充方式为SAME,用于对输入进行卷积,输出36个特征图b,表示RPN模块为9个预设框分别预测的4个偏移量tx,ty,tw,th
根据回归卷积层C4的输出b确定初步检测框的位置,并通过分类概率向量p筛选检测框,将得分满足阈值的判为候选框,作为下一步精修模块Fast-RCNN模块的输入。
2.3)Fast-RCNN模块:
该层依次由ROIpooling层,第一全连接层F1,第二全连接层F2,两个并列的分类支路F3和回归全连接层F4组成,各层参数设置及关系如下:
ROIpooling层R,用于将不同大小的输入特征图下采样成相同大小,其将输入特征图分成7×7块,每块选择最大值作为当前特征块的输出,输出512个特征图Y8,Y8大小为512×7×7,作为第一全连接层F1的输入。
第一全连接层F1,其设有4096个神经元,用于对上一层ROIpooling层输出的特征进行非线性映射,输出一个4096维的列向量;
第二全连接层F2,其设有4096个神经元,用于对上一全连接层F1输出的列向量进行非线性映射,输出一个4096维的列向量;
分类支路依次由分类全连接层F31、Softmax分类器层F32组成,各层参数设置及关系如下:
分类全连接层F31,其设有2个神经元,用于对上一全连接层F2的输出的列向量进行非线性映射,输出一个2维的列向量,作为Softmax分类器层F32的输入;
Softmax分类器层F32,用于将分类全连接层F31得到的2维列向量输入到两类Softmax分类器中,得到分类概率向量Τ,根据概率值将候选框进行分类;
回归全连接层F4组成,其设有4个神经元,用于对上一全连接层F2的输出的列向量进行非线性映射,输出一个4维的回归列向量C,表示候选框的回归偏移量ex,ey,ew,eh
步骤3,构建改进后的损失函数。
训练网络模型Ω的原始损失函数中的回归损失使用的是smoothL1函数,此函数在训练网络时存在回归损失难易样本不平衡的问题,影响网络检测性能,因此需要对回归损失函数进行改进,构建新的总损失函数。
新的总损失函数由RPN模块的损失函数与Fast-RCNN模块的损失函数之和构成,其构建如下:
3.1)构建RPN模块损失函数:
3.1.1)预设框信息和目标框信息:RPN模块为VGG基础层提取的共享特征F的每个特征点配备九个预设框,九个框以三种宽高比和三种尺寸得到,其中宽:高∈{1:1,1:2,2:1},三种尺度分别为128*128,256*256,512*512,设(xa,ya)为预设框的中心坐标,wa为框的宽度,ha为框的高度,(x*,y*)为目标框的中心坐标,w*为目标框的宽度,h*为目标框的高度;
3.1.2)根据预设框信息和目标框信息计算每一预设框与所有目标框的交并比IOU值:
Figure BDA0002855456390000081
其中,A为预设框,B为目标框,A∩B为预设框和目标框相交的面积,A∪B为预设框和目标框相并的面积;
3.1.3)设定IOU阈值,划分预设框的样本类别:
设定IOU下限阈值v1为0.3,上限阈值v2为0.7。
若预设框与某一目标框的IOU大于等于上限阈值v2,或预设框与某一目标框的IOU是所有预设框与该目标框IOU中最大的,则该预设框为正样本,并将该目标框分配给预设框;
若预设框与所有目标框的IOU均小于等于下限阈值v1,并且预设框与某一目标框的IOU不是所有预设框与该目标框IOU中最大的,则该预设框为负样本;
若预设框与所有目标框的IOU均大于下限阈值v1且均小于上限阈值v2,同时预设框与某一目标框的IOU不是所有预设框与该目标框IOU中最大的,则该预设框为无用样本,不参与训练;
3.1.4)根据预设框信息和其对应的目标框信息计算出目标偏移量
Figure BDA0002855456390000082
Figure BDA0002855456390000091
Figure BDA0002855456390000092
Figure BDA0002855456390000093
Figure BDA0002855456390000094
3.1.5)RPN模块的原始损失函数:
利用RPN模块得到的分类概率向量p和回归特征图b,其中,分类概率向量p为预设框判为目标和背景的概率,回归特征图b为网络为每个预设框预测的偏移信息tx,ty,tw,th,得到RPN模块的原损失函数J'rpn
J'rpn=Js1rpnJs2
Figure BDA0002855456390000095
Figure BDA0002855456390000096
其中,Js1为交叉熵损失函数,Ns1为RPN模块训练样本的总数量,使用批次梯度下降算法训练时,Ns1取一个批次的样本数量256,
Figure BDA0002855456390000097
为第j个样本对应第k类的标签,
Figure BDA0002855456390000098
为RPN网络将第j个样本预测为第k类的概率;Js2为回归损失函数,
Figure BDA0002855456390000099
为第j个样本是否为正样本的标签,标签为1时,该预设框为正样本,计算回归损失;标签为0时,该预设框为负样本,回归损失为0;tn为预设框的位置信息,
Figure BDA00028554563900000910
为目标框的位置信息,n∈{x,y,w,h},λrpn为平衡常数。
Figure BDA00028554563900000911
函数为:
Figure BDA00028554563900000912
3.1.6)对原损失函数进行改进:
参照图3,统计RPN模块回归部分的损失发现简单样本产生的损失梯度值明显大于难样本产生的损失梯度值,为解决舰船检测中难易样本非平衡问题,对
Figure BDA00028554563900000913
函数进行改进,增大难样本损失的梯度,对
Figure BDA00028554563900000914
函数进行改进后的
Figure BDA00028554563900000915
为:
Figure BDA0002855456390000101
其中,a为超参数,a=2,得到改进后的RPN模块损失Jrpn为:
Figure BDA0002855456390000102
3.2)构建Fast-RCNN模块损失函数。
3.2.1)根据RPN预测的回归特征图b,其表示候选框的偏移量tx,ty,tw,th,计算出候选框的位置信息x,y,w,h:
tx=(x-xa)/wa,
ty=(y-ya)/ha,
tw=log(w/wa),
th=log(h/ha);
其中,(x,y)为候选框的中心坐标,w为候选框的宽度,h为框的高度;
3.2.2)设定IOU阈值,划分候选框的样本类别:
设定IOU阈值v3为0.5。
根据候选框位置坐标计算候选框与目标框的IOU,若候选框与所有目标框的IOU均小于阈值v3,该候选框为负样本;
若候选框与某一目标框的交并比大于阈值v3,该候选框为正样本,并将该目标框分配给候选框;
3.2.3)根据候选框信息和目标框信息计算目标偏移量
Figure BDA0002855456390000103
Figure BDA0002855456390000104
Figure BDA0002855456390000105
Figure BDA0002855456390000106
Figure BDA0002855456390000107
3.2.4)Fast-RCNN模块的原始损失函数:
根据RPN模块得到的分类概率向量p对判为目标概率较高的前2000候选框使用Fast-RCNN模块进一步位置回归和分类,得到分类概率向量T和回归列向量C,分类概率向量为候选框判为目标和背景的概率,回归列向量C为候选框的预测偏移量ex,ey,ew,eh,得到Fast-RCNN模块的损失函数J'fast
J'fast=Js3fastJs4
Figure BDA0002855456390000111
Figure BDA0002855456390000112
其中,Js3为交叉熵损失函数,Ns2为Fast-RCNN模块训练样本的总数量,使用批次梯度下降算法训练时,Ns2取一个批次的样本数量128,
Figure BDA0002855456390000113
为第p个样本对应第k类的标签,
Figure BDA0002855456390000114
为Fast RCNN网络将第p个样本预测为第k类的概率;Js4为回归损失,
Figure BDA0002855456390000115
为第p个样本是否为正样本的标签,标签为1时,该候选框为正样本,计算回归损失,标签为0时,该候选框为负样本,回归损失为0,λfast为平衡常数。
Figure BDA0002855456390000116
函数为:
Figure BDA0002855456390000117
3.2.5)对原损失函数进行改进:
同理,为解决舰船检测中难易样本非平衡问题,对
Figure BDA0002855456390000118
函数进行改进后的
Figure BDA0002855456390000119
函数为:
Figure BDA00028554563900001110
其中,a为超参数,a=2,改进后的Fast-RCNN模块损失Jfast为:
Figure BDA00028554563900001111
3.3)根据3.1)改进的回归损失函数Jrpn和3.2)改进的回归损失函数Jfast,得到训练网络改进后的总损失函数Js
Figure BDA0002855456390000121
步骤4,使用步骤3构建的损失函数Js对该网络模型Ω进行训练,得到训练好的网络模型Ω'。
4.1)将训练数据Φx输入到训练网络模型Ω中进行训练,一次训练一张图片,根据送入图片的标签计算网络的损失函数Js的值;
4.2)根据步骤4.1)损失函数Js的值计算网络损失函数的梯度,通过改进后的损失函数,使难易样本在回归损失上产生的梯度平衡;
4.3)根据4.2)算出的损失函数对网络产生的梯度,利用随机梯度下降算法向损失函数减小的方向不断更新权值,并通过反向传播算法将输出层的误差向前传播,更新网络模型Ω的各层参数;
4.4)循环执行步骤4.1)-步骤4.3),直到损失函数收敛,得到训练好的网络模型Ω'。
步骤5,将舰船测试数据Φc输入到最终训练好的网络模型Ω'中,得到舰船的检测结果。
本发明的效果可通过以下实验数据进一步说明:
一.实验条件
1)实验数据
本实验使用中国人民解放军海军航空大学整理发布的SSDD数据集,该数据包含了多尺寸舰船目标以及多种成像条件,如不同分辨率、海况和传感器类型,数据集样本的多样性使训练出来的检测器具有更好的鲁棒性。数据集多种成像条件如表1。
表1舰船数据成像条件
Figure BDA0002855456390000122
Figure BDA0002855456390000131
表1中,RADARSAT-2为加拿大发射的RADARSAT-2卫星,TERRASAR-X为德国发射的TERRASAR-X卫星,SENTINEL-1为欧盟发射的SENTINEL-1卫星;HH为卫星水平发射水平接收的极化方式,VV为卫星垂直发射垂直接收的极化方式,HV为卫星水平发射垂直接收的极化方式,VH为卫星垂直发射水平接收的极化方式。
2)评价准则
实验重复五次,取五次实验检测结果的平均准确率的平均值和检测率的平均值对实验结果进行评价。
二.实验内容
用本发明方法与现有两种方法对上述实验数据进行对比实验,性能参数对比结果如表2所示。
表2本发明方法与现有方法性能参数对比结果
对比方法 平均准确率 检测率
SmoothL1 93.59% 94.38%
BalanceL1 93.83% 93.99%
本发明 94.88% 95.68%
表2中:Smooth L1为Faster-RCNN网络回归损失函数使用smoothL1对舰船数据检测的方法;
Balance L1为Faster-RCNN网络回归损失函数使用文章《Libra R-CNN:TowardsBalanced Learning for ObjectDetection》提出的balanceL1回归损失函数对舰船数据检测的方法;
从表2中可见,相比于现有方法,本发明取得了更好的检测效果,这是由于本发明设计的损失函数能更好的解决难易样本不平衡问题,网络能够更准确的学习各类样本中的特征,因此本发明比现有方法获得了更好的检测结果。
以上描述仅是本发明的一个具体实例,并未构成对本发明的任何限制,显然对于本领域的专业人员来说,在了解了本发明内容和原理后,都可能在不背离本发明原理、结构的情况下,进行形式和细节上的各种修改和改变,但是这些基于本发明思想的修正和改变仍在本发明的权利要求保护范围之内。

Claims (7)

1.一种基于平衡样本回归损失的SAR舰船目标检测方法,其特征在于,包括如下:
(1)获取SSDD舰船数据集,并将其按照8:2的比例分为训练数据Φx和测试数据Φc
(2)选取由共享基础模块VGG、区域选取模块RPN和区域精修模块Fast-RCNN依次连接组成的训练网络模型Ω;
(3)构建改进后的损失函数;
(3a)将网络RPN模块回归损失中的
Figure FDA0002855456380000019
函数改进为
Figure FDA00028554563800000110
函数,其形式为:
Figure FDA0002855456380000011
Figure FDA0002855456380000012
其中,j为RPN模块第j个训练样本,tn为RPN模块为训练样本预测的位置信息,
Figure FDA0002855456380000013
为训练样本对应的目标框的位置信息,n∈{x,y,w,h},a为超参数,a=2;
(3b)将网络Fast-RCNN模块回归损失中的
Figure FDA0002855456380000014
函数改进为
Figure FDA0002855456380000015
函数,其形式为:
Figure FDA0002855456380000016
Figure FDA0002855456380000017
其中,p为Fast-RCNN模块第p个训练样本,em为Fast-RCNN模块为训练样本预测的位置信息,
Figure FDA0002855456380000018
为训练样本对应的目标框的位置信息,m∈{x,y,w,h};
(3c)根据(3a)和(3b)改进的回归损失函数,得到训练网络改进后的总损失函数Js,其表示如下:
Figure FDA0002855456380000021
其中,Js1、λrpn和Ns1分别为RPN模块的分类损失函数、损失平衡常数和训练样本数量,Js3、λfast和Ns2为Fast-RCNN模块的分类损失函数、损失平衡常数和训练样本数量,
Figure FDA0002855456380000022
为RPN模块第j个样本是否为正样本的标签,
Figure FDA0002855456380000023
为Fast-RCNN模块第p个样本是否为正样本的标签;
(4)将训练数据Φx输入到训练网络模型Ω中,使用网络总的损失函数Js对该网络模型Ω进行训练,直到损失函数收敛,得到训练好的网络模型Ω';
(5)将舰船测试数据Φc输入到最终训练好的网络模型Ω'中,得到舰船的检测结果。
2.根据权利要求1所述的方法,其中(2)中网络模型的共享基础模块VGG,包括5个卷积块和4个平均池化层,依次为第一卷积块V1→第一平均池化层P1→第二卷积块V2→第二平均池化层P2→第三卷积块V3→第三平均池化层P3→第四卷积块V4→第四平均池化层P4→第五卷积块V5,各层参数设置及关系如下:
所述4个池化层的结构相同,其用于对输入下采样,下采样核的窗口大小为2×2,滑动步长为2,输出特征图的数量和输入一致,并作为下一卷积块的输入;
所述第一卷积块V1和第二卷积块V2结构相同,其均由两个完全相同的卷积块级联而成,每个卷积块由卷积层Li1和ReLU激活函数层Li2两层结构组成,i表示第i个卷积块,i=1,2;
所述第三卷积块V3、第四卷积块V4和第五卷积块V5结构相同,其均由三个完全相同的卷积块级联而成,每个卷积块由两层结构组成,即第一层为卷积层Tj1、第二层为ReLU激活函数层Tj2,j表示第j个卷积块,j=1,2,3。
3.根据权利要求1所述的方法,其中(2)中网络模型的区域选取模块RPN依次由共享卷积层C1、激活函数层C2、两个并列的分类支路C3和回归卷积层C4组成,该分类支路C3依次由分类卷积层C31和Softmax分类器层C32组成,用于得到分类概率向量p;该回归卷积层C4用于对输入进行卷积,得到36个位置预测特征图b。
4.根据权利要求1所述的方法,(2)中网络模型的区域精修模块Fast-RCNN依次由ROIpooling层、全连接层F1、全连接层F2、两个并列的分类支路F3和回归全连接层F4组成,该分类支路F3依次由全连接层F31和Softmax分类器层F32组成,用于得到分类概率向量Τ,该回归全连接层F4输出一个4维的回归列向量C,表示候选框的回归偏移量ex,ey,ew,eh
5.根据权利要求1所述的方法,所述(3c)中RPN模块的分类损失函数Js1,表示如下:
Figure FDA0002855456380000031
其中,Ns1为RPN模块训练样本的总数量,使用批次梯度下降算法训练时,Ns1取一个批次的样本数量256,
Figure FDA0002855456380000032
为第j个样本对应第k类的标签,
Figure FDA0002855456380000033
为RPN网络将第j个样本预测为第k类的概率。
6.根据权利要求1所述的方法,所述(3c)中Fast-RCNN模块的分类损函数Js3,表示如下:
Figure FDA0002855456380000034
其中,Ns2为Fast-RCNN模块训练样本的总数量,使用批次梯度下降算法训练时,Ns2取一个批次的样本数量128,
Figure FDA0002855456380000035
为第p个样本对应第k类的标签,
Figure FDA0002855456380000036
为Fast-RCNN模块将第p个样本预测为第k类的概率。
7.根据权利要求1所述的方法,其中(4)对训练网络模型Ω进行训练,其实现如下:
4a)将训练数据送入网络模型Ω中进行训练,一次训练一张图片,根据送入图片的标签计算网络损失函数Js的值;
4b)计算网络的损失函数梯度,通过改进后的损失函数,使难易样本在回归上产生的梯度平衡;
4c)根据4b)算出的损失函数对网络产生的梯度,利用随机梯度下降算法向损失函数减小的方向不断更新权值,并通过反向传播算法将输出层的误差向前传播,更新网络模型Ω的各层参数;
4d)循环执行4a)-4c),直到损失函数Js收敛,得到训练好的网络模型Ω'。
CN202011544100.2A 2020-12-24 2020-12-24 基于平衡样本回归损失的sar舰船目标检测方法 Active CN112668440B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011544100.2A CN112668440B (zh) 2020-12-24 2020-12-24 基于平衡样本回归损失的sar舰船目标检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011544100.2A CN112668440B (zh) 2020-12-24 2020-12-24 基于平衡样本回归损失的sar舰船目标检测方法

Publications (2)

Publication Number Publication Date
CN112668440A CN112668440A (zh) 2021-04-16
CN112668440B true CN112668440B (zh) 2023-02-10

Family

ID=75409594

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011544100.2A Active CN112668440B (zh) 2020-12-24 2020-12-24 基于平衡样本回归损失的sar舰船目标检测方法

Country Status (1)

Country Link
CN (1) CN112668440B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113536936B (zh) * 2021-06-17 2022-10-11 中国人民解放军海军航空大学航空作战勤务学院 一种舰船目标检测方法及***
CN113469088B (zh) * 2021-07-08 2023-05-12 西安电子科技大学 一种无源干扰场景下的sar图像舰船目标检测方法及***
CN113537170A (zh) * 2021-09-16 2021-10-22 北京理工大学深圳汽车研究院(电动车辆国家工程实验室深圳研究院) 一种交通路况智能监测方法和计算机可读存储介质
CN115049884B (zh) * 2022-08-15 2022-10-25 菲特(天津)检测技术有限公司 基于Faster RCNN网络的广义少样本目标检测方法及***
CN115346125B (zh) * 2022-10-18 2023-03-24 南京金瀚途科技有限公司 一种基于深度学习的目标检测方法
CN115641510B (zh) * 2022-11-18 2023-08-08 中国人民解放军战略支援部队航天工程大学士官学校 一种遥感影像舰船检测识别方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110674714A (zh) * 2019-09-13 2020-01-10 东南大学 基于迁移学习的人脸和人脸关键点联合检测方法
CN111027454A (zh) * 2019-12-06 2020-04-17 西安电子科技大学 基于深度密集连接和度量学习的sar舰船目标分类方法
CN111460984A (zh) * 2020-03-30 2020-07-28 华南理工大学 一种基于关键点与梯度均衡损失的全局车道线检测方法
CN111626200A (zh) * 2020-05-26 2020-09-04 北京联合大学 一种基于Libra R-CNN的多尺度目标检测网络和交通标识检测方法
CN111860264A (zh) * 2020-07-10 2020-10-30 武汉理工大学 一种基于梯度均衡策略的多任务实例级道路场景理解算法
CN112016467A (zh) * 2020-08-28 2020-12-01 展讯通信(上海)有限公司 交通标志识别模型训练方法、识别方法、***、设备及介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018165753A1 (en) * 2017-03-14 2018-09-20 University Of Manitoba Structure defect detection using machine learning algorithms

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110674714A (zh) * 2019-09-13 2020-01-10 东南大学 基于迁移学习的人脸和人脸关键点联合检测方法
CN111027454A (zh) * 2019-12-06 2020-04-17 西安电子科技大学 基于深度密集连接和度量学习的sar舰船目标分类方法
CN111460984A (zh) * 2020-03-30 2020-07-28 华南理工大学 一种基于关键点与梯度均衡损失的全局车道线检测方法
CN111626200A (zh) * 2020-05-26 2020-09-04 北京联合大学 一种基于Libra R-CNN的多尺度目标检测网络和交通标识检测方法
CN111860264A (zh) * 2020-07-10 2020-10-30 武汉理工大学 一种基于梯度均衡策略的多任务实例级道路场景理解算法
CN112016467A (zh) * 2020-08-28 2020-12-01 展讯通信(上海)有限公司 交通标志识别模型训练方法、识别方法、***、设备及介质

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Automatic Ship Detection Based on RetinaNet UsingMulti-Resolution Gaofen-3 Imagery;Yuanyuan Wang等;《Remote Sensing》;20190331;全文 *
Gradient Harmonized Single-Stage Detector;Buyu Li等;《Computer Vision and Pattern Recognition 》;20181113;全文 *
Ship detection in SAR images based on an improved faster R-CNN;Jianwei Li等;《 2017 SAR in Big Data Era: Models, Methods and Applications》;20171130;全文 *
一种基于改进Faster RCNN的校园车辆检测方法;李航等;《沈阳师范大学学报(自然科学版)》;20200215(第01期);全文 *

Also Published As

Publication number Publication date
CN112668440A (zh) 2021-04-16

Similar Documents

Publication Publication Date Title
CN112668440B (zh) 基于平衡样本回归损失的sar舰船目标检测方法
CN109086700B (zh) 基于深度卷积神经网络的雷达一维距离像目标识别方法
CN110472627B (zh) 一种端到端的sar图像识别方法、装置及存储介质
CN111027454B (zh) 基于深度密集连接和度量学习的sar舰船目标分类方法
CN110533631A (zh) 基于金字塔池化孪生网络的sar图像变化检测方法
CN112395987B (zh) 基于无监督域适应cnn的sar图像目标检测方法
CN110084159A (zh) 基于联合多级空谱信息cnn的高光谱图像分类方法
CN107256396A (zh) 基于卷积神经网络的船目标isar图像特征学习方法
CN107798345B (zh) 基于块对角与低秩表示的高光谱伪装目标检测方法
CN107274387A (zh) 基于进化多目标优化的高光谱遥感影像的端元提取方法
CN112699717A (zh) 基于gan网络的sar图像生成方法及生成装置
Bragilevsky et al. Deep learning for Amazon satellite image analysis
CN113486819A (zh) 一种基于YOLOv4算法的船舶目标检测方法
CN111832580A (zh) 结合少样本学习与目标属性特征的sar目标识别方法
CN110069987B (zh) 基于改进vgg网络的单阶段船舶检测算法及装置
CN110414494A (zh) 带有aspp反卷积网络的sar图像分类方法
CN117710783A (zh) 基于双驱动均衡损失及隐性特征增强的sar长尾目标检测方法
Gui et al. A scale transfer convolution network for small ship detection in SAR images
CN113409381A (zh) 基于cnn的双极化通道融合舰船尺寸估计方法
Zhang et al. Ship detection and recognition in optical remote sensing images based on scale enhancement rotating cascade R-CNN networks
Li et al. SAR image object detection based on improved cross-entropy loss function with the attention of hard samples
CN114049551B (zh) 一种基于ResNet18的SAR原始数据目标识别方法
CN115797663A (zh) 一种复杂光照条件下的空间目标材质识别方法
CN113361439B (zh) 一种sar图像舰船目标识别方法和***
CN112686139B (zh) 基于跨阶段局部多尺度密集连接的遥感图像目标检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant