CN117351352A - 基于轻量化YOLOv5网络模型的SAR船舶图像目标识别方法 - Google Patents

基于轻量化YOLOv5网络模型的SAR船舶图像目标识别方法 Download PDF

Info

Publication number
CN117351352A
CN117351352A CN202311329290.XA CN202311329290A CN117351352A CN 117351352 A CN117351352 A CN 117351352A CN 202311329290 A CN202311329290 A CN 202311329290A CN 117351352 A CN117351352 A CN 117351352A
Authority
CN
China
Prior art keywords
network model
lightweight
yolov5
loss
sar
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311329290.XA
Other languages
English (en)
Inventor
王琳霖
张鑫
王传云
李中一
邵景
张彤
高骞
刘宝明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenyang Aerospace University
Original Assignee
Shenyang Aerospace University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenyang Aerospace University filed Critical Shenyang Aerospace University
Priority to CN202311329290.XA priority Critical patent/CN117351352A/zh
Publication of CN117351352A publication Critical patent/CN117351352A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于轻量化YOLOv5网络模型的SAR船舶图像目标识别方法,包括如下步骤:选取SAR‑Ship‑Dataset数据集中的图片并划分为训练集和验证集;搭建轻量化YOLOv5网络模型,其中,所述轻量化YOLOv5网络模型引入MobileNet模块和Ghost Bottleneck模块,并采用SIOU作为损失函数;利用训练集和验证集对所述轻量化YOLOv5网络模型进行训练,得到训练好的轻量化YOLOv5网络模型;将待测试的SAR船舶图像输入到训练好的轻量化YOLOv5网络模型中,识别船舶目标。该船舶图像目标识别方法,参数和运算量少,可确保SAR图像检测的精度,缩短训练时间。

Description

基于轻量化YOLOv5网络模型的SAR船舶图像目标识别方法
技术领域
本发明涉及船舶或其他水上船只检测识别领域,具体是一种基于轻量化的YOLOv5网络模型的SAR船舶图像目标识别方法。
背景技术
合成孔径雷达(SAR)是一种使用雷达技术获取地面或目标信息的无源遥感技术,因其高分辨率、无遥感源及不受天气影响等优势,已成为海洋监测的重要技术手段之一。同时,在SAR图像分辨率的逐步提高与深度学***衡等问题,这使得YOLOv5训练时间长、训练精度难以保证。
因此,如何对YOLOv5进行改进,并将其应用到SAR船舶图像目标识别方法中,成为亟待解决的问题。
发明内容
鉴于此,本发明的目的在于将应用于光学图像识别的深度学习方法迁移至SAR图像识别中,并将该模型轻量化来减少模型的参数和运算量,提高SAR图像检测的精度,缩短训练时间。
本发明公开了一种基于轻量化的YOLOv5网络模型的SAR船舶图像目标识别方法。包含以下步骤:
S1:选取SAR-Ship-Dataset数据集中的图片并划分为训练集和验证集;
S2:搭建轻量化YOLOv5网络模型,其中,所述轻量化YOLOv5网络模型在传统YOLOv5网络模型的基础上引入MobileNet模块和Ghost Bottleneck模块,并采用SIOU作为轻量化YOLOv5网络模型的损失函数,所述MobileNet模块替换传统YOLOv5网络模型中的骨干网络中的所有模块,所述Ghost Bottleneck模块替换传统YOLOv5网络模型中的颈部网络中的CSP模块,同时,采用GhostConv模块替换传统YOLOv5网络模型中颈部网络中的Conv模块;
S3:利用S1中的训练集和验证集对所述轻量化YOLOv5网络模型进行训练,得到训练好的轻量化YOLOv5网络模型;
S4:将待测试的SAR船舶图像输入到训练好的轻量化YOLOv5网络模型中,识别船舶目标。
优选,S1中,训练集和验证集按照7:3的比例随机划分。
进一步优选,S1还包括如下步骤:使用图片标注工具LabelImg为选择的每个训练样本标注标签,并将标注锚框的位置信息和类别信息保存为文本文件。
进一步优选,S2中,SIOU损失的计算公式如下:
式中,IoU表示IoU损失,Δ表示距离损失,Ω表示形状损失;
其中,距离损失的计算公式如下:
式中,γ=2-Λ,(c'w,c'h)为真实框和预测框最小外接矩形的宽和高,/>为真实框的中心坐标,/>为预测框的中心坐标,Λ表示角度损失,计算公式如下:
式中,ch为真实框和预测框中心点的高度差,σ为真实框和预测框中心点的距离;
形状损失的计算公式如下:
式中,(w,h)和(wgt,hgt)分别为预测框和真实框的宽和高,θ表示对形状损失的关注程度,θ的取值范围为[2,6];
IoU损失的计算公式如下:
本发明提供的基于轻量化的YOLOv5网络模型的SAR船舶图像目标识别方法,与传统的YOLOv5方法相比,有三个主要不同点,骨干网络采用MobileNet轻量化模块,颈部网络采用Bottleneck模块,同时采用损失函数SIOU替换损失函数DIOU。本发明提供的基于轻量化的YOLOv5网络模型的SAR船舶图像目标识别方法的参数量相比YOLOv5降低了很多,但是检测精度、MAP等模型评价指标并未有明显的下降,在一定程度上保证了模型的精度和实用性。
附图说明
图1是本发明提供的基于轻量化的YOLOv5网络模型的SAR船舶图像目标识别方法的流程图;
图2是本发明采用的轻量化的YOLOv5网络的结构示意图;
图3是可视化目标检测结果对比图;
图4为角度损失计算过程中的相关参数示意图。
具体实施方式
下面将结合具体的实施方案对本发明进行进一步的解释,但并不局限本发明。
如图1所示,本发明公开了一种基于轻量化的YOLOv5网络模型的SAR船舶图像目标识别方法,包含以下步骤:
S1:选取SAR-Ship-Dataset数据集中的图片并划分为训练集和验证集;
优选,训练集和验证集按照7:3的比例随机划分,使用图片标注工具LabelImg为选择的每个训练样本标注标签,并将标注锚框的位置信息和类别信息保存为文本文件;
S2:搭建轻量化YOLOv5网络模型,其中,如图2所示,所述轻量化YOLOv5网络模型在传统YOLOv5网络模型的基础上引入MobileNet(MNE)模块和Ghost Bottleneck模块,并采用Scylla Intersection over Union(SIOU)作为轻量化YOLOv5网络模型的损失函数,所述MobileNet(MNE)模块替换传统YOLOv5网络模型中的骨干网络中的所有模块,所述GhostBottleneck模块替换传统YOLOv5网络模型中的颈部网络中的CSP模块,同时,采用GhostConv模块替换传统YOLOv5网络模型中颈部网络中的Conv模块;
其中,传统YOLOv5的骨干网络共有十层,其中包含了卷积层、Cross StagePartial(CSP)模块、Spatial Pyramid Pooling Fast(SPPF)模块,本发明用轻量化模块MobileNet(MNE)代替原骨干网络中的所有模块,并将原来的十层扩展为十一层;
本发明采用Ghost Bottleneck模块替换传统YOLOv5网络模型中的颈部网络中的CSP模块,同时,采用GhostConv模块替换传统YOLOv5网络模型中颈部网络中的Conv模块,可以在不影响网络训练检测精度的同时,极大的优化网络的参数规模和计算资源消耗;GhostBottleneck模块类似于ResNet中的基本残差块,主要由两个堆叠的Ghost模块组成,第一个模块当作扩展层增加通道数,而第二个模块减少通道数,最后使用ShortCut连接这两个Ghost模块的输入和输出;
其中,SIOU损失在IOU基础上进一步考虑了真实框和预测框之间的向量角度,具体计算公式如下:
式中,IoU表示IoU损失,Δ表示距离损失,Ω表示形状损失;
其中,距离损失的计算公式如下:
式中,γ=2-Λ,(c'w,c'h)为真实框和预测框最小外接矩形的宽和高,/>为真实框的中心坐标,/>为预测框的中心坐标,Λ表示角度损失,计算公式如下:
式中,ch为真实框和预测框中心点的高度差,σ为真实框和预测框中心点的距离,事实上,如图4所示,等于角度α,/>
为真实框的中心坐标,/>为预测框的中心坐标,可以注意到,当α为/>或0时,角度损失为0,在训练过程中若/>则最小化α,否则最小化β;
形状损失的计算公式如下:
式中,(w,h)和(wgt,hgt)分别为预测框和真实框的宽和高,θ表示对形状损失的关注程度,θ的取值范围为[2,6]。IoU损失的计算公式如下:
S3:利用S1中的训练集和验证集对所述轻量化YOLOv5网络模型进行训练,得到训练好的轻量化YOLOv5网络模型;
S4:将待测试的SAR船舶图像输入到训练好的轻量化YOLOv5网络模型中,识别船舶目标,如:船舶目标的边界框位置、类别标签和置信度分数等信息。
本发明提供的基于轻量化的YOLOv5网络模型的SAR船舶图像目标识别方法,与传统的YOLOv5方法相比,有三个主要不同点,骨干网络采用MobileNet轻量化模块,颈部网络采用Bottleneck模块,同时采用损失函数SIOU替换损失函数DIOU。本发明提供的基于轻量化的YOLOv5网络模型的SAR船舶图像目标识别方法的参数量相比YOLOv5降低了很多,但是检测精度、MAP等模型评价指标并未有明显的下降(如图3所示),在一定程度上保证了模型的精度和实用性。
上面对本发明的实施方式做了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各种变化。

Claims (4)

1.基于轻量化YOLOv5网络模型的SAR船舶图像目标识别方法,其特征在于,包含如下步骤:
S1:选取SAR-Ship-Dataset数据集中的图片并划分为训练集和验证集;
S2:搭建轻量化YOLOv5网络模型,其中,所述轻量化YOLOv5网络模型在传统YOLOv5网络模型的基础上引入MobileNet模块和Ghost Bottleneck模块,并采用SIOU作为轻量化YOLOv5网络模型的损失函数,所述MobileNet模块替换传统YOLOv5网络模型中的骨干网络中的所有模块,所述Ghost Bottleneck模块替换传统YOLOv5网络模型中的颈部网络中的CSP模块,同时,采用GhostConv模块替换传统YOLOv5网络模型中颈部网络中的Conv模块;
S3:利用S1中的训练集和验证集对所述轻量化YOLOv5网络模型进行训练,得到训练好的轻量化YOLOv5网络模型;
S4:将待测试的SAR船舶图像输入到训练好的轻量化YOLOv5网络模型中,识别船舶目标。
2.根据权利要求1所述的基于轻量化YOLOv5网络模型的SAR船舶图像目标识别方法,其特征在于:S1中,训练集和验证集按照7:3的比例随机划分。
3.根据权利要求1所述的基于轻量化YOLOv5网络模型的SAR船舶图像目标识别方法,其特征在于:S1还包括如下步骤:使用图片标注工具LabelImg为选择的每个训练样本标注标签,并将标注锚框的位置信息和类别信息保存为文本文件。
4.根据权利要求1所述的基于轻量化YOLOv5网络模型的SAR船舶图像目标识别方法,其特征在于:S2中,SIOU损失的计算公式如下:
式中,IoU表示IoU损失,Δ表示距离损失,Ω表示形状损失;
其中,距离损失的计算公式如下:
式中,(c'w,c'h)为真实框和预测框最小外接矩形的宽和高,/>为真实框的中心坐标,/>为预测框的中心坐标,Λ表示角度损失,计算公式如下:
式中,ch为真实框和预测框中心点的高度差,σ为真实框和预测框中心点的距离;
形状损失的计算公式如下:
式中,(w,h)和(wgt,hgt)分别为预测框和真实框的宽和高,θ表示对形状损失的关注程度,θ的取值范围为[2,6];
IoU损失的计算公式如下:
CN202311329290.XA 2023-10-13 2023-10-13 基于轻量化YOLOv5网络模型的SAR船舶图像目标识别方法 Pending CN117351352A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311329290.XA CN117351352A (zh) 2023-10-13 2023-10-13 基于轻量化YOLOv5网络模型的SAR船舶图像目标识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311329290.XA CN117351352A (zh) 2023-10-13 2023-10-13 基于轻量化YOLOv5网络模型的SAR船舶图像目标识别方法

Publications (1)

Publication Number Publication Date
CN117351352A true CN117351352A (zh) 2024-01-05

Family

ID=89355436

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311329290.XA Pending CN117351352A (zh) 2023-10-13 2023-10-13 基于轻量化YOLOv5网络模型的SAR船舶图像目标识别方法

Country Status (1)

Country Link
CN (1) CN117351352A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117576553A (zh) * 2024-01-15 2024-02-20 中国海洋大学 双极化sar图像海洋冰涡识别方法、装置和电子设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117576553A (zh) * 2024-01-15 2024-02-20 中国海洋大学 双极化sar图像海洋冰涡识别方法、装置和电子设备
CN117576553B (zh) * 2024-01-15 2024-04-02 中国海洋大学 双极化sar图像海洋冰涡识别方法、装置和电子设备

Similar Documents

Publication Publication Date Title
Spencer Jr et al. Advances in computer vision-based civil infrastructure inspection and monitoring
CN108647585B (zh) 一种基于多尺度循环注意力网络的交通标识符检测方法
CN110929607B (zh) 一种城市建筑物施工进度的遥感识别方法和***
CN111985376A (zh) 一种基于深度学习的遥感影像舰船轮廓提取方法
CN111507222B (zh) 一种基于多源数据知识迁移的三维物体检测框架
CN114495029B (zh) 一种基于改进YOLOv4的交通目标检测方法及***
CN111738113A (zh) 基于双注意力机制与语义约束的高分辨遥感图像的道路提取方法
CN113177560A (zh) 一种普适性轻量级深度学习车辆检测方法
CN113076804B (zh) 基于YOLOv4改进算法的目标检测方法、装置及***
CN117351352A (zh) 基于轻量化YOLOv5网络模型的SAR船舶图像目标识别方法
CN110610165A (zh) 一种基于yolo模型的船舶行为分析方法
CN111652273A (zh) 一种基于深度学习的rgb-d图像分类方法
CN113255555A (zh) 中国交通标志牌识别方法、***、处理设备及存储介质
CN109325407B (zh) 基于f-ssd网络滤波的光学遥感视频目标检测方法
CN116740344A (zh) 一种基于知识蒸馏的轻量化遥感影像语义分割方法及装置
CN113177503A (zh) 基于yolov5的任意朝向目标十二参数检测方法
CN113159215A (zh) 一种基于Faster Rcnn的小目标检测识别方法
CN115424237A (zh) 一种基于深度学习的前向车辆识别与距离检测方法
CN112364709A (zh) 基于编码识别的机柜智能资产盘点方法
CN114358133B (zh) 一种基于语义辅助双目视觉slam检测回环帧的方法
CN117456480B (zh) 一种基于多源信息融合的轻量化车辆再辨识方法
CN113284185B (zh) 用于遥感目标检测的旋转目标检测方法
CN114943870A (zh) 线特征提取模型的训练方法及装置、点云匹配方法及装置
CN116612382A (zh) 一种城市遥感图像目标检测方法和装置
CN115019174B (zh) 基于像素重组和注意力的上采样遥感图像目标识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination