CN113435269A - 一种基于YOLOv3改进的水面漂浮物检测与识别方法及*** - Google Patents

一种基于YOLOv3改进的水面漂浮物检测与识别方法及*** Download PDF

Info

Publication number
CN113435269A
CN113435269A CN202110647573.3A CN202110647573A CN113435269A CN 113435269 A CN113435269 A CN 113435269A CN 202110647573 A CN202110647573 A CN 202110647573A CN 113435269 A CN113435269 A CN 113435269A
Authority
CN
China
Prior art keywords
water surface
training
drifter
yolov3
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110647573.3A
Other languages
English (en)
Inventor
刘献忠
徐浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
East China Normal University
Original Assignee
East China Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by East China Normal University filed Critical East China Normal University
Priority to CN202110647573.3A priority Critical patent/CN113435269A/zh
Publication of CN113435269A publication Critical patent/CN113435269A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Human Computer Interaction (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于改进YOLOv3识别模型的水面漂浮物检测与识别方法,涉及计算机视觉技术领域,包括以下步骤:预先采集水面漂流物数据,采用几何变换和色彩变换对图像数据进行增强扩增,并对数据中的漂流物进行标注,得到水面漂流物数据集,并拆分成训练集和测试集;构建改进的YOLOv3网络模型,并采用水面漂流物训练集对改进的YOLOv3网络模型进行训练;根据水面漂流物数据图像构建水面漂流物测试集,并用训练好的改进的YOLOv3网络模型对水面漂流物测试集进行检测与识别。本发明改进的YOLOv3有较强的泛化能力,占用存储空间和显存空间小,提高了检测识别准确率,而且还能保证实时性,能够在算力以及内存有限的客户端设备中实现精确和快速的水面漂流物的监测与识别。

Description

一种基于YOLOv3改进的水面漂浮物检测与识别方法及***
技术领域
本发明属于计算机视觉技术领域,涉及一种基于YOLOv3改进的水面漂流物检测与识别方法及***。
背景技术
近年来,我国城镇化、工业化的速度越来越快,经济迅猛发展的同时水环境污染问题也不容乐观。江河湖泊均存在大量漂浮物,不仅破坏了自然生态景观,也严重威胁着人类的生命健康和经济的可持续发展,因此,如何有效地监测河湖漂浮物的研究具有重要的现实意义。
现有的基于视频图像的水面漂浮物检测技术主要针对遥感影像,通过提取遥感影像的光谱特征、空间特征、纹理特征,分析检测是否存在漂浮物。由于遥感影像视野通常较远,所以难以检测城市河道中较小面积的漂浮物,同时由于生成遥感影像对成像设备有要求,采集大量存在漂浮物的遥感图像数据集具有一定难度,不利于在现实应用中推广。而传统的图像分割技术由于水面存在倒影,光照变化等因素分割效果很不理想,大量的水面倒影无法正确分割。
深度学***衡的问题。YOLOv3牺牲了一定的检测速度来提高检测精度,但是对于小目标的水面漂浮物的检测来说,依旧有一定的难度。
发明内容
为了解决现有技术存在的不足,本发明的目的是提出一种基于改进YOLOv3识别模型的水面漂浮物检测与识别方法,在保持并提高YOLOv3算法在水面漂浮物检测识别上的性能,同时对检测算法模型的体积进行了精简。
本发明的技术方案是这样实现的:
步骤一、预先获取用于水面漂流物训练的数据集,采用几何变换和色彩变换对图像数据进行了增强与扩增,并对数据集的漂流物进行标注,得到水面漂流物数据集,并拆分成训练集和测试集;
步骤二、构建改进的YOLOv3网络模型;
步骤三、使用步骤一中获得的水面漂流物训练集对步骤二构建得到的改进的YOLOv3网络模型进行训练;
步骤四、使用步骤一中获得的根据水面漂流物的数据图像拆分出的水面漂流物测试集,并用步骤三训练好的改进的YOLOv3网络模型对水面漂流物测试集进行检测与识别。
本发明数据集为人工现场收集,需要处理为YOLOv3使用的PASCAL VOC数据集格式。
进一步地,步骤一分为以下两个步骤:
1.1、人工现场获取水面漂流物训练数据集,通过调节色相、对比度、饱和度和亮度来进行色彩变换,并对图像进行几何变换以及随机裁剪,然后通过随机选择图片进行拼接从而生成新的图像;所述几何变换指的是缩放、平移、旋转;
1.2、采用Labelme对数据进行人工标注,并将数据集标签格式转换为PASCAL VOC数据集格式,采用8:2~9:1的比例划分训练数据集和测试数据集。
进一步地,步骤二中,构建改进的YOLOv3网络模型具体包括以下步骤:
2.1、将YOLOv3网络模型原有的DarkNet53网络替换为GhostNet网络;GhostNet 的GhostNet bottleneck中加入注意力机制层SELayer,增强对主要通道特征的关注程度;
2.2、依次从GhostNet网络结构中通过平均池化提取下采样倍数分别为4、8、16和32的特征图,并依次对特征图进行上采样与原有特征进行融合,获得四个新的特征图。
GhostNet主干网络除了最后输出的尺寸为13×13的特征图,还包括三个GhostNet的分支输出的特征图,尺寸分别为26×26,52×52以及104×104。
整个主干网络都是在进行特征提取,不同尺寸的特征图包含着不同层次的特征信息。层次越浅,特征含义越局限,层次越深,特征含义越丰富,104的特征图是通过GhostNet中前三个Ghost Block提取出的;接着又通过两个Ghost Block特征提取得到52的特征图;接着又通过六个Ghost Block得到了26的特征图;最后通过五个GhostBlock得到了13 的特征图,此时主干网络特征提取的过程结束。
2.3、采用GIOU损失替换YOLOv3网络模型原有的定位损失函数;
其中,IOU表示对于任意A、B框,分别求交集和并集,最后求两者的比值;所述 IOU表达式为:
Figure BDA0003109737320000021
GIOU表示对于任意的A、B框,首先找到一个能够包住它们的最小封闭形状C,然后计算C\(A∪B)的面积与C的面积的比值,所述C\(A∪B)的面积为C的面积减去A∪B 的面积,再用A、B的IOU值减去这个比值得到GIOU;所述GIOU表达式为:
Figure 1
其中:A、B为两个任意的凸形区域,C是指包含A和B的最小封闭形状;
最终定位损失的表达式为:
最终定位损失LGIOU=1-GIOU。
2.4、采用Focal Loss损失替换YOLOv3原有模型的类别损失函数;
所述Focal Loss计算公式如下:
FL(pt)=-α(1-pt)γlog(pt)
式中α取值为2,γ取值为0.25,pt代表的是正负样本的概率方程,pt如下式所示:
其中:
Figure BDA0003109737320000032
p代表正样本概率,y代表标签值;
步骤2.2中,通过四尺度特征融合来获取更深层的特征,选择13×13、26×26、52×52和104×104作为四个输出特征图;网络迭代次数设置为1000;通过改进的上采样模块dw_res2net_block对四层特征图进一步提取特征,然后进行上采样与原有特征进行融合,作为新的候选特征。
所述dw_res2net_block是在原有Inverted_res_block结构的基础上,参考GhostNet与 Res2Net的基础结构进行构建。增加更小的残差连接模块,缓解了梯度消失的同时,增加了各段特征图之间的交流,同时用3×1、1×3替换了原有的3×3卷积层,使模块特征提取能力变得更加细腻的同时,使参数量下降了1/3。为了进一步减少模型参数,使用DWConv 来取代卷积的部分操作,从而消耗更少的算力就可以获取到与原卷积层相差不多的卷积效果。
步骤2.3中,对YOLOv3主干网络的改进包括通过自注意力机制SE获取更有效的通道信息,在GhostBottleneck中加入了SE自注意力机制来使网络更加注重重要通道特征的训练。
进一步地,对YOLOv3主干网络的改进还包括:对水面漂浮物数据集采用k-means++对anchor box的尺寸进行聚类,共生成12个不同的尺寸。采用该技术可以提高模型的检测性能,并加快收敛的速度。
步骤三中,所述改进的YOLOv3网络模型的训练包括以下步骤:
3.1、初始化改进的YOLOv3网络模型的权重以及各项参数,所述参数包括卷积层参数值、学习率、迭代次数epoch以及每个批次包含的数据量个数batch_size;
3.2、将训练集以及测试集放置于约定好的目录下,运行程序进行训练;
3.3、训练前程序会从训练集中选取1/10的数据作为验证集,每个迭代都会通过验证集进行验证,并对表现不好的困难样本进行记录。达到迭代次数后输出模型的各项指标;所述指标包括平均精度mAP、单类别平均精度AP、精确率和召回率。
3.4、训练结束后对记录的困难进行分析,并对困难样本进行增强,步骤3.3-3.4这个过程重复设置了三次。
3.5、达到迭代次数,训练结束,保存模型的各项参数以及权重。
步骤四中,采用平均类别准确率、模型参数以及FLOPs作为性能指标来检测所述改进的YOLOv3网络模型对水面漂浮物的检测能力。
本发明还提供了一种实现上述检测方法的***,所述***包括:数据输入模块、数据处理模块、YOLOv3网络模块、结果输出模块。
所述数据输入模块用于将获取的图像数据传输到数据处理模块中;
所述数据处理模块用于将图像数据经几何变换、色彩变换,对目标物进行标注后获得数据集,并拆分为训练集和测试集;
所述YOLOv3网络模块用于模型的训练和目标物的检测识别;
所述结果输出模块用于对输入的图像数据输出相应的结果。
基于前述方法,本发明还提出了一种检测与识别方法的***,包括:
用户登录界面、水面漂流物检测页面、图片上传、视频上传、检测功能以及摄像头识别;其中,
所述用户登录界面:展示应用的名称、作者以及应用版本信息,同时在该界面需要提供检测界面的入口;
所述水面漂流物检测页面:该界面是该应用主要功能按钮以及上传图片以及预测图片的展示区域;展示的功能主要有:图片上传,视频上传,开始检测以及摄像头检测;
所述图片上传:对需要检测的图片进行上传;
所述视频上传:对需要检测的视频进行上传;
所述检测功能:点击按钮进行识别,并将识别的结果进行展示;
摄像头识别:打开摄像头,对检测物体进行实时监测。
本发明的有益效果包括:
本发明中的YOLOv3改进网络模型采用GhostNet网络结构极大的减少了模型的参数以及FLOPs;同时采用四尺度特征图融合可以提升网络对小目标水面漂流物的检测效果;采用了GIOU损失函数;采用了Focal Loss损失函数,使得模型在训练的过程中更加注重困难样本的训练,解决了样本类别不均衡的问题;以及通过数据增强以及多尺度训练的方式,提高了模型的检测效果。通过上述方法,本发明实现了相较于YOLOv3原版算法更高的检测效果,模型的体积得到了大幅度的降低,且参数量也大幅度减少,能够在算力有限的移动客户端中实现准确快速的检测识别。
附图说明
图1为本发明实施例对困难样本数据集增强前频数图。
图2为本发明实施例对困难样本数据集增强后频数图。
图3为本发明YOLOv3改进网络的总体框架图。
图4为本发明网络中dw_res2net_block模块细节图。
图5为本发明模型训练流程图。
图6为本发明改进YOLOv3网络mAP收敛图。
图7为原始YOLOv3网络mAP收敛图。
具体实施方式
结合以下具体实施例和附图,对发明作进一步的详细说明。实施本发明的过程、条件、实验方法等,除以下专门提及的内容之外,均为本领域的普遍知识和公知常识,本发明没有特别限制内容。
本发明提供了一种基于YOLOv3改进的水面漂浮物检测与识别方法,所述方法包括如下步骤:
步骤一、预先获取用于水面漂流物训练的数据集,采用几何变换和色彩变换对图像数据进行了增强与扩增,并对数据集的漂流物进行标注,得到水面漂流物数据集,并拆分成训练集和测试集;
步骤二、构建改进的YOLOv3网络模型;
步骤三、使用步骤一中获得的水面漂流物训练集对步骤二构建得到的改进的YOLOv3网络模型进行训练;
步骤四、使用步骤一中获得的根据水面漂流物的数据图像拆分出的水面漂流物测试集,并用步骤三训练好的改进的YOLOv3网络模型对水面漂流物测试集进行检测与识别。
本发明还提供了一种实现上述检测方法的***,所述***包括:数据输入模块、数据处理模块、YOLOv3网络模块、结果输出模块。
所述数据输入模块用于将获取的图像数据传输到数据处理模块中;
所述数据处理模块用于将图像数据经几何变换、色彩变换,对目标物进行标注后获得数据集,并拆分为训练集和测试集;
所述YOLOv3网络模块用于模型的训练和目标物的检测识别;
所述结果输出模块用于对输入的图像数据输出相应的结果。
实施例
本实施例提供了一种基于YOLOv3改进的水面漂流物检测与识别方法,包括以下步骤:
步骤1、准备水面漂流物数据集,并对数据进行数据增强,其中具体包括如下步骤:
(1)本数据集收集于实地场景,共包括3443张图片,为了学习到更多的特征,采用了8:2的比例将数据集分为了训练集和测试集。其中训练集中包括2755张图片,测试集包括688张图片,并将其统一处理成了大小为416*416的图片,并用Labelme对图片进行了标记。由于本数据所含各个类别的数量以及训练难度有所差异,导致出现频率较低的困难样本在模型中无法得到充分的学习,所以在训练过程中会对精度小于50%的样本进行标记,训练结束后,重新对这类样本进行训练。图片标记文件的格式为json,为了方便网络训练,通过编码将其转化为VOC格式。
(2)为了让网络可以学***移、旋转等几何变换以及随机裁剪,然后通过随机选择图片进行拼接从而生成新的图像。然后在训练结束后,对精度小于50%的样本再次采用上面提到的增强方式进行增强,并与原始数据集合并一同作为训练数据。数据增强可以缓解数据样本不均衡的问题,如图1为实施例中对困难样本增强前的频数图,图2所示为实施例中对困难样本增强后的频数图。
步骤2、搭建YOLOv3改进网络模型。
(1)本发明中,如图3为YOLOv3改进网络的整体框架图。首先对YOLOv3主干网络进行了改进,将Darknet53中的ResNet block替换为了Ghost block,通过首先对图像进行部分卷积,然后将通过DWConv对图像进行线性运算,最后将两者的结果拼接在一起,从而得到新的特征图。GhostNet的连接方式在减少模型参数的同时,可以大大加深网路的深度,通过更少的算力获得更良好的特征提取能力。
(2)增强多尺度特征融合能力。依次从GhostNet结构中提取下采样倍数分别为13、26、52、104的特征图:Route-1,Route-2,Route-3,Route-4。如图4所示的dw_res2net_block进一步对特征进行融合提取,然后对提取的特征图进行上采样操作,获取融合特征m1、 m2、m3和m4,提升了对小目标的水面漂流物的检测能力。
(3)dw_res2net_block是在原有Inverted_res_block结构的基础上,参考GhostNet 与Res2Net的基础结构进行构建。增加更小的残差连接模块,缓解了梯度消失的同时,增加了各段特征图之间的交流,同时用3×1、1×3替换了原有的3×3卷积层,使模块特征提取能力变得更加细腻的同时,使参数量下降了1/3。为了进一步减少模型参数,使用DWConv来取代卷积的部分操作,从而消耗更少的算力就可以获取到与原卷积层相差不多的卷积效果。此外,加入了SE block对特征通道的权重进行分配,提升模型特征提取能力。
(4)采用GIOU损失替换YOLOv3网络模型原有的定位损失函数;
IOU表示对于任意A、B框,分别求交集和并集,最后求两者的比值;所述IOU表达式为:
Figure BDA0003109737320000071
GIOU表示对于任意的A、B框,首先找到一个能够包住它们的最小封闭形状C,然后计算C\(A∪B)的面积与C的面积的比值,所述C\(A∪B)的面积为C的面积减去A∪B 的面积,再用A、B的IOU值减去这个比值得到GIOU;所述GIOU表达式为:
Figure BDA0003109737320000072
其中:A、B为两个任意的凸形区域,C是指包含A和B的最小封闭形状;
最终定位损失表达式为:
最终定位损失LGIOU=1-GIOU
(5)采用Focal Loss损失替换YOLOv3原有模型的类别损失函数;
Focal Loss计算公式如下:
FL(pt)=-α(1-pt)γlog(pt)
式中α取值为2,γ取值为0.25,pt代表的是正负样本的概率方程,pt如下式所示:
其中:
Figure BDA0003109737320000073
p代表正样本的概率,y代表标签值;
(6)YOLOv3的原网络模型中使用k-means算法来对anchor进行聚类,本发明中使用k-means++对其进行替换。k-means++相对于k-means一次性随机挑选k个聚类中心更加合理,k-mean++每次挑选都会在距离上一次更远聚类中心,从而挑选出12个anchor。 k-means++可以在一定程度上降低最终的位置误差。
步骤3、对改进模型进行训练
模型的图片输入尺寸为416×416,初始学习率设置为1e-3,将处理好的训练数据集根据设定好的batch_size(根据硬件条件进行设定)输入模型中进行前向传播并计算损失,然后对根据损失函数进行反向传播更新网络中的参数,经过多次迭代后,当网络损失趋于稳定时,停止模型的训练,并将网络模型的参数进行保存。
步骤4、使用训练好的改进模型进行检测测试
使用训练好的模型对测试数据进行检测,对检测结果取平均值,结果表明改进后的模型对水面漂流物的检测精度有较大的提升,尤其对小目标水面漂流物检测有着显著提升。
如表1所示为YOLOv3与改进的YOLOv3的各个类比的平均AP对比,可以看到各个类别的AP都有较大的提升,但是对于水草、树枝以及荷叶这些数量较少的类别识别能力并不高,当为改进的YOLOv3加入Focal loss后,水草、荷叶数量较少的困难样本会识别能力有所提升,仅仅是以消耗少量易训练样本的精度为代价。如表2所示,在模型的整体平均精度表现上改进的YOLOv3比YOLOv3的检测精度高13%,加入Focal Loss 可以为模型带来1%左右的性能提升。
表1各模型平均AP
Figure BDA0003109737320000081
表2模型的整体平均精度
Figure BDA0003109737320000082
如表3所示为模型的参数量与所需算力对比,改进的YOLOv3在体积上相对于YOLOv3有了大幅度的降低,且模型所需的算力也得到了大幅度的降低。改进后的 YOLOv3相比于YOLOv3更适合部署于算力有限、对实时性要求较高的设备中。
表3模型的参数量与所需算力对比
Figure BDA0003109737320000083
当网络迭代次数为1000时,在GPU2080ti上进行训练,改进后的YOLOv3网络大约训练了3天半收敛并结束,原始网络大约训练了一周收敛并结束。收敛的视图如图6和图7 所示(图6为改进后网络;图7为原始网络),由图6和图7中可以看出改进后网络的训练过程更加平滑,收敛的更快,而原始网络的训练过程波动比较大,且训练速度慢。同时通过表3可以看出,改进模型的参数远远小于原始模型,所以在训练过程中需要计算更新的参数则更少,因此改进模型的训练速度以及收敛速度都更快。
本发明的保护内容不局限于以上实施例。在不背离发明构思的精神和范围下,本领域技术人员能够想到的变化和优点都被包括在本发明中,并且以所附的权利要求书为保护范围。

Claims (10)

1.一种基于改进YOLOv3识别模型的水面漂浮物检测与识别方法,其特征在于,所述方法包括以下步骤:
步骤一、预先获取用于水面漂流物训练的数据集,采用几何变换和色彩变换对图像数据进行增强与扩增,并对数据集的漂流物进行标注,得到水面漂流物数据集,并拆分成训练集和测试集;
步骤二、构建改进的YOLOv3网络模型;
步骤三、使用步骤一中获得的水面漂流物训练集对步骤二构建得到的改进的YOLOv3网络模型进行训练;
步骤四、使用步骤一中获得的根据水面漂流物的数据图像拆分出的水面漂流物测试集,并用步骤三训练好的改进的YOLOv3网络模型对水面漂流物测试集进行检测与识别。
2.根据权利要求1所述的基于改进YOLOv3识别模型的水面漂浮物检测与识别方法,其特征在于,步骤一具体包括如下两个子步骤;
1.1、人工现场获取水面漂流物训练数据集,通过调节色相、对比度、饱和度和亮度进行色彩变换,通过缩放、平移、旋转对图像进行几何变换以及随机裁剪,然后通过随机选择图片进行拼接从而生成新的图像;
1.2、采用Labelme对数据进行人工标注,并将数据集标签格式转换为PASCAL VOC数据集格式,采用8:2~9:1的比例划分训练数据集和测试数据集。
3.根据权利要求1所述的基于改进YOLOv3识别模型的水面漂流物检测与识别方法,其特征在于,步骤二中,所述构建改进的YOLOv3网络模型具体包括如下步骤:
2.1、将YOLOv3网络模型原有的DarkNet53网络替换为GhostNet网络;所述GhostNet的GhostNet bottleneck中加入注意力机制层SELayer,增强对主要通道特征的关注程度;
2.2、依次从GhostNet网络结构中通过平均池化提取下采样倍数分别为4、8、16和32的特征图,并依次对特征图进行上采样与原有特征进行融合,获得四个新的特征图;
2.3、采用GIOU损失替换YOLOv3网络模型原有的定位损失函数;
IOU表示对于任意A、B框,分别求交集和并集,最后求两者的比值;所述IOU表达式为:
Figure FDA0003109737310000011
GIOU表示对于任意的A、B框,首先找到一个能够包住它们的最小封闭形状C,然后计算C\(A∪B)的面积与C的面积的比值,所述C\(A∪B)的面积为C的面积减去A∪B的面积,再用A、B的IOU值减去这个比值得到GIOU;所述GIOU表达式为:
Figure FDA0003109737310000021
其中,A、B为两个任意的凸形区域,C是指包含A和B的最小封闭形状;
最终定位损失的表达式为:
最终定位损失LGIOU=1-GIOU;
2.4、采用Focal Loss损失替换YOLOv3原有模型的类别损失函数;
所述Focal Loss计算公式如下:
FL(pt)=-α(1-pt)γlog(pt),
式中α取值为2,γ取值为0.25,pt代表的是正负样本的概率方程,pt如下式所示:
其中:
Figure FDA0003109737310000022
p代表正样本概率,y代表标签值。
4.根据权利要求3所述基于改进YOLOv3识别模型的水面漂流物检测与识别方法,其特征在于,步骤2.2中,通过四尺度特征融合来获取更深层的特征,选择13×13、26×26、52×52和104×104作为四个输出特征图;网络迭代次数设置为1000;通过改进的上采样模块dw_res2net_block对四层特征图进一步提取特征,然后进行上采样与原有特征进行融合,作为新的候选特征;
所述dw_res2net_block增加更小的残差连接模块,缓解了梯度消失的同时,增加了各段特征图之间的交流,使模块特征提取能力变得更加细腻并降低了1/3的参数量;同时使用DWConv取代卷积的部分操作。
5.根据权利要求3所述的基于改进YOLOv3识别模型的水面漂流物检测与识别方法,其特征在于,步骤二中,对YOLOv3主干网络进行的改进还包括在GhostBottleneck中加入了SE自注意力机制使网络更加注重重要通道特征的训练。
6.根据权利要求3所述的基于改进YOLOv3识别模型的水面漂流物检测与识别方法,其特征在于,步骤二中,对YOLOv3主干网络的改进还包括对水面漂浮物数据集采用k-means++对anchor box的尺寸进行聚类,共生成12个不同的尺寸,提高模型的检测性能,并加快收敛的速度。
7.根据权利要求1所述的基于改进YOLOv3识别模型的水面漂浮物检测与识别方法,其特征在于,步骤三中,所述改进的YOLOv3网络模型的训练包括以下步骤:
3.1、初始化改进的YOLOv3网络模型的权重以及各项参数,所述参数包括卷积层参数值、学习率、迭代次数epoch以及每个批次包含的数据量个数batch_size;
3.2、将训练集以及测试集放置于约定好的目录下,运行程序进行训练;
3.3、训练前程序会从训练集中选取1/10的数据作为验证集,每个迭代都会通过验证集进行验证,并对表现不好的困难样本进行记录;达到迭代次数后输出模型的各项指标;所述指标包括所述指标包括平均精度mAP、单类别平均精度AP、精确率和召回率;
3.4、训练结束后对记录的困难进行分析,并对困难样本进行增强,步骤3.3-3.4重复设置三次;
3.5、达到迭代次数,训练结束,保存模型的各项参数以及权重。
8.根据权利要求1所述的基于改进YOLOv3识别模型的水面漂浮物检测与识别方法,其特征在于,步骤四中,采用平均类别准确率、模型参数以及FLOPs作为性能指标来检测所述改进的YOLOv3网络模型对水面漂浮物的检测能力。
9.一种实现如权利要求1-8之任一项所述检测与识别方法的***,所述***包括:数据输入模块、数据处理模块、YOLOv3网络模块、结果输出模块;
所述数据输入模块用于将获取的图像数据传输到数据处理模块中;
所述数据处理模块用于将图像数据经几何变换、色彩变换,对目标物进行标注后获得数据集,并拆分为训练集和测试集;
所述YOLOv3网络模块用于模型的训练和目标物的检测识别;
所述结果输出模块用于对输入的图像数据输出相应的结果。
10.一种实现如权利要求1-8之任一项所述检测与识别方法的***,所述***包括:
用户登录界面、水面漂流物检测页面、图片上传、视频上传、检测功能以及摄像头识别;其中,
所述用户登录界面:展示应用的名称、作者以及应用版本信息,同时在该界面需要提供检测界面的入口;
所述水面漂流物检测页面:该界面是该应用主要功能按钮以及上传图片以及预测图片的展示区域;展示的功能主要有:图片上传,视频上传,开始检测以及摄像头检测;
所述图片上传:对需要检测的图片进行上传;
所述视频上传:对需要检测的视频进行上传;
所述检测功能:点击按钮进行识别,并将识别的结果进行展示;
摄像头识别:打开摄像头,对检测物体进行实时监测。
CN202110647573.3A 2021-06-10 2021-06-10 一种基于YOLOv3改进的水面漂浮物检测与识别方法及*** Pending CN113435269A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110647573.3A CN113435269A (zh) 2021-06-10 2021-06-10 一种基于YOLOv3改进的水面漂浮物检测与识别方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110647573.3A CN113435269A (zh) 2021-06-10 2021-06-10 一种基于YOLOv3改进的水面漂浮物检测与识别方法及***

Publications (1)

Publication Number Publication Date
CN113435269A true CN113435269A (zh) 2021-09-24

Family

ID=77755681

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110647573.3A Pending CN113435269A (zh) 2021-06-10 2021-06-10 一种基于YOLOv3改进的水面漂浮物检测与识别方法及***

Country Status (1)

Country Link
CN (1) CN113435269A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112926501A (zh) * 2021-03-23 2021-06-08 哈尔滨理工大学 一种基于YOLOv5网络结构的交通标志检测算法
CN114170483A (zh) * 2022-02-11 2022-03-11 南京甄视智能科技有限公司 漂浮物识别模型的训练和使用方法、装置、介质及设备
CN114332584A (zh) * 2021-12-16 2022-04-12 淮阴工学院 一种基于图像处理的湖泊水面漂浮物识别方法和介质
CN114758206A (zh) * 2022-06-13 2022-07-15 武汉珈鹰智能科技有限公司 一种钢网架结构异常检测方法及装置
CN114937195A (zh) * 2022-03-29 2022-08-23 江苏海洋大学 基于无人机航拍和改进的YOLO v3的水面漂浮物目标检测***
CN115019243A (zh) * 2022-04-21 2022-09-06 山东大学 基于改进YOLOv3的监控漂浮物轻量化目标检测方法及***
CN115035354A (zh) * 2022-08-12 2022-09-09 江西省水利科学院 基于改进yolox的水库水面漂浮物目标检测方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112257794A (zh) * 2020-10-27 2021-01-22 东南大学 一种基于yolo的轻量级的目标检测方法
CN112434672A (zh) * 2020-12-18 2021-03-02 天津大学 一种基于改进YOLOv3的海上人体目标检测方法
CN112465057A (zh) * 2020-12-08 2021-03-09 中国人民解放军空军工程大学 一种基于深度卷积神经网络的目标检测识别方法
CN112528934A (zh) * 2020-12-22 2021-03-19 燕山大学 一种基于多尺度特征层的改进型YOLOv3的交通标志检测方法
CN112784748A (zh) * 2021-01-22 2021-05-11 大连海事大学 一种基于改进的YOLOv3的微藻识别方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112257794A (zh) * 2020-10-27 2021-01-22 东南大学 一种基于yolo的轻量级的目标检测方法
CN112465057A (zh) * 2020-12-08 2021-03-09 中国人民解放军空军工程大学 一种基于深度卷积神经网络的目标检测识别方法
CN112434672A (zh) * 2020-12-18 2021-03-02 天津大学 一种基于改进YOLOv3的海上人体目标检测方法
CN112528934A (zh) * 2020-12-22 2021-03-19 燕山大学 一种基于多尺度特征层的改进型YOLOv3的交通标志检测方法
CN112784748A (zh) * 2021-01-22 2021-05-11 大连海事大学 一种基于改进的YOLOv3的微藻识别方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
周飞: "水面清污机器人垃圾检测算法的研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 *
李汉冰: "基于Yolov3改进的实时车辆检测方法", 《激光与光电子学进展》 *
郭飞: "基于交通夜视场景的改进 YOLOv3 轻量化网络模型", 《电子技术与软件工程》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112926501A (zh) * 2021-03-23 2021-06-08 哈尔滨理工大学 一种基于YOLOv5网络结构的交通标志检测算法
CN114332584A (zh) * 2021-12-16 2022-04-12 淮阴工学院 一种基于图像处理的湖泊水面漂浮物识别方法和介质
CN114170483A (zh) * 2022-02-11 2022-03-11 南京甄视智能科技有限公司 漂浮物识别模型的训练和使用方法、装置、介质及设备
CN114170483B (zh) * 2022-02-11 2022-05-20 南京甄视智能科技有限公司 漂浮物识别模型的训练和使用方法、装置、介质及设备
CN114937195A (zh) * 2022-03-29 2022-08-23 江苏海洋大学 基于无人机航拍和改进的YOLO v3的水面漂浮物目标检测***
CN115019243A (zh) * 2022-04-21 2022-09-06 山东大学 基于改进YOLOv3的监控漂浮物轻量化目标检测方法及***
CN114758206A (zh) * 2022-06-13 2022-07-15 武汉珈鹰智能科技有限公司 一种钢网架结构异常检测方法及装置
CN114758206B (zh) * 2022-06-13 2022-10-28 武汉珈鹰智能科技有限公司 一种钢网架结构异常检测方法及装置
CN115035354A (zh) * 2022-08-12 2022-09-09 江西省水利科学院 基于改进yolox的水库水面漂浮物目标检测方法
CN115035354B (zh) * 2022-08-12 2022-11-08 江西省水利科学院 基于改进yolox的水库水面漂浮物目标检测方法

Similar Documents

Publication Publication Date Title
CN113435269A (zh) 一种基于YOLOv3改进的水面漂浮物检测与识别方法及***
CN111104898B (zh) 基于目标语义和注意力机制的图像场景分类方法及装置
CN114445670B (zh) 图像处理模型的训练方法、装置、设备及存储介质
CN114943876A (zh) 一种多级语义融合的云和云影检测方法、设备及存储介质
CN113160246A (zh) 一种基于深度监督的图像语义分割方法
CN110287806A (zh) 一种基于改进ssd网络的交通标志识别方法
CN112784756B (zh) 人体识别跟踪方法
CN114511710A (zh) 一种基于卷积神经网络的图像目标检测方法
CN115620010A (zh) 一种rgb-t双模态特征融合的语义分割方法
CN110738132A (zh) 一种具备判别性感知能力的目标检测质量盲评价方法
CN114283315A (zh) 一种基于交互式引导注意力和梯形金字塔融合的rgb-d显著性目标检测方法
CN115909280A (zh) 基于多头注意力机制的交通标志识别算法
CN113988147A (zh) 基于图网络的遥感图像场景多标签分类方法及装置、多标签检索方法及装置
CN114694185A (zh) 一种跨模态目标重识别方法、装置、设备及介质
CN115908789A (zh) 跨模态特征融合及渐近解码的显著性目标检测方法及装置
CN114693952A (zh) 一种基于多模态差异性融合网络的rgb-d显著性目标检测方法
CN116524189A (zh) 一种基于编解码索引化边缘表征的高分辨率遥感图像语义分割方法
CN115661932A (zh) 一种垂钓行为检测方法
CN114842180A (zh) 一种点云补全方法、装置、设备及介质
CN113361496B (zh) 一种基于U-Net的城市建成区统计方法
CN114926826A (zh) 场景文本检测***
CN114549959A (zh) 基于目标检测模型的红外弱小目标实时检测方法和***
CN115471901B (zh) 基于生成对抗网络的多姿态人脸正面化方法及***
CN116957921A (zh) 图像渲染方法、装置、设备及存储介质
CN116071649A (zh) 一种遥感图像识别的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20210924

WD01 Invention patent application deemed withdrawn after publication