CN110276247A - 一种基于YOLOv3-Tiny的行车检测方法 - Google Patents

一种基于YOLOv3-Tiny的行车检测方法 Download PDF

Info

Publication number
CN110276247A
CN110276247A CN201910387559.7A CN201910387559A CN110276247A CN 110276247 A CN110276247 A CN 110276247A CN 201910387559 A CN201910387559 A CN 201910387559A CN 110276247 A CN110276247 A CN 110276247A
Authority
CN
China
Prior art keywords
yolov3
tiny
algorithm
driving
detection method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910387559.7A
Other languages
English (en)
Inventor
刘力冉
曹杰
杨磊
仇男豪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Aeronautics and Astronautics
Original Assignee
Nanjing University of Aeronautics and Astronautics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Aeronautics and Astronautics filed Critical Nanjing University of Aeronautics and Astronautics
Priority to CN201910387559.7A priority Critical patent/CN110276247A/zh
Publication of CN110276247A publication Critical patent/CN110276247A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/08Detecting or categorising vehicles
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于YOLOv3‑Tiny的行车检测方法,包括如下步骤:S1、训练样本获取;S2、改进YOLOv3‑Tiny算法;S3、模型训练及输出:利用步骤S1中的训练样本对步骤S2中改进的算法网络进行训练,迭代学习输出新的深度学习模型;S4、行车图像获取:利用无人机机载摄像头拍摄行车图像;S5、行车图像检测:利用S3中改进算法模型对S4中的图像进行检测得出结果图。与改进之前的算法相比较,能够在保证实时性和占用显存空间较小的情况下,提高原算法目标检测的精确性,提高了行车检测精确度。

Description

一种基于YOLOv3-Tiny的行车检测方法
技术领域
本发明涉及行车检测方法,特别涉及一种基于YOLOv3-Tiny的行车检测方法。
背景技术
目标检测(object detection),即在给定的图像、视频或场景中找到目标的具***置、长宽信息,同时对目标所属的类别进行判断,目标检测一般要解决两个问题:目标物体在哪里、目标物体的分类(即目标物体是什么)。目标检测在实际问题中应用广泛,特别是随着深度学习的快速发展,同时目标检测技术也在迅速发展,特别是相比于通过传统方法的目标检测,基于深度学习的目标检测,会提高检测的效率和精确度,并已在各个领域应用。并且也是目标识别、目标跟踪等任务的基石,目标检测性能的好坏影响目标跟踪、目标识别等任务的性能。但是基于深度学习的目标检测对硬件设备要求较高,运用实际生活中难度较大,技术研究上尚不够成熟,因此迫切需要更为有效、实用的目标检测方法。
发明内容
发明目的:本发明目的是提供一种能够在保证目标检测实时性以及占用显存较小的情况下具有较高检测精度的基于YOLOv3-Tiny的行车检测方法。
技术方案:本发明提供一种基于YOLOv3-Tiny的行车检测方法,包括如下步骤:
S1、训练样本获取;
S2、改进YOLOv3-Tiny算法;
S3、模型训练及输出:利用步骤S1中的训练样本对步骤S2中改进的算法网络进行训练,迭代学习输出新的深度学习模型;
S4、行车图像获取:利用无人机机载摄像头拍摄行车图像;
S5、行车图像检测:利用S3中改进算法模型对S4中的图像进行检测得出结果图。
进一步地,所述步骤S1中,选取KITTI数据集作为训练样本。
进一步地,所述步骤S3中模型训练采用均匀分布策略。
进一步地,所述步骤S2中包括如下步骤:
S2.1、改变网络输入图像像素大小;
S2.2、预设候选框聚类分析;
S2.3、改进YOLOv3-Tiny算法网络结构。
进一步地,所述步骤S2.1中图像像素由416×416改为672×224。所述步骤S2.2中利用kmeans算法对预设候选框进行聚类分析。所述步骤S2.3中,网络增加3个大小为的卷积层和3个大小为的卷积层。
有益效果:本发明对比R-CNN系列以及YOLO系列算法,本发明对硬件设备要求不高,显存空间占用较小,具体来说约为1GB,能够广泛的应用于简单的目标检测***中;对比YOLO系列算法,本发明改进的算法复杂度较低;本发明改进的YOLOv3-Tiny算法,与改进之前的算法相比较,能够在保证实时性和占用显存空间较小的情况下,提高原算法目标检测的精确性,提高了行车检测精确度。
附图说明
图1为本发明的算法网络结构图;
图2为本发明的算法与原算法精确度的检测对比图,其中Our Network是本发明改进后的算法检测结果,YOLOv3-Tiny是现有的算法检测结果;
图3为本发明KITTI数据集测试图;
图4为无遮挡情况检测效果图;
图5为小目标物体检测效果图;
图6为有遮挡情况检测效果图。
具体实施方式
如图1-6所示,本实施例的基于YOLOv3-Tiny的行车检测方法,包括以下步骤:
S1:选取训练样本:选取网络模型训练所需行车数据集,选取的数据集是KITTI数据集,该数据集中训练样本5984张、测试样本748张。KITTI行车数据集背景也较为复杂,存在车辆遮挡等情况。为了使KITTI数据集适用于YOLOv3-Tiny算法,对数据集进行格式转化,首先将KITTI的行车数据集转化为VOC格式的数据集,在此基础上转化为适用于改进网络的数据集格式。
S2:基于YOLOv3-Tiny算法的改进:改变输入图像像素大小、预设候选框聚类分析、网络模型改进,具体包括以下步骤:
S2.1:改变输入图像像素大小,具体将输入尺寸从416×416改为672×224;
S2.2:预设候选框聚类分析,在处理S2.1中输入图像时采用网格对其进行分割,在每个网格中设置k个参考anchor,训练以GroundTruth(真实框)作为基准计算分类与回归损失。k个anchor boxes对应k个不同尺度,都具有独立分类结果,优化了网络的准确率,找到最优anchor宽高维度和最优k值。聚类的目标函数为:
式(1)中,i表示聚类的类别数,j表示数据集的数量,Box[i]为每个聚类中心的预设框的尺寸,Truth[j]表示数据集中每个行人框尺寸,目标函数使得预测框与真实框尽可能重合。
S2.3:改进网络结构,常用的卷积核大小有三种类型:3×3、5×5、7×7,两个大小为3×3的卷积核堆叠可以替代5×5的卷积核,三个大小为3×3的卷积核堆叠可以替代7×7的卷积核。网络的层数过深存在梯度***或者梯度消失的问题,网络层数过浅则不能充分学习目标的特征,改进的网络结构是在原来的主干网络基础上增加3个3×3的卷积层,达到加深网络的效果。由于网络层数的增加会导致网络的运算量以及模型参数的增加,改进的网络中引入3个大小为1×1的卷积层,目的是减少模型参数并提高网络的学习能力。
S3:模型训练及模型输出:用改进的YOLOv3-Tiny算法对数据集进行迭代训练,样本图片通过训练迭代学习输出深度学习模型。本实施例的模型训练采用均匀分布策略,设定模型初始学习率为0.001,在经过20000次和25000次迭代后,学习率值乘以0.1,动量系数设为0.9,权值衰减系数为0.001。
S4:行车图像获取:利用无人机机载摄像头获取行车图像数据。用到的无人机是四旋翼无人机,型号采用掠食者680,机载单目摄像头型号是飞莹8s,像素大小为是1280×720。无人机设备包括飞行控制器、遥控、GPS、云台等等,本实施例利用无线图传技术将无人机机载摄像头实时拍摄的图像传输至电脑中。
S5:行车图像检测:利用S3中的训练模型对S4中的行车图像进行检测,得出检测结果图。
本实施例改进的算法与原算法性能检测对比结果如表1:
表1本实施例改进的算法与原算法性能检测对比结果
检测方法 mAP/% Recall/% 平均交并比IOU/% 检测速度/(帧/秒)
YOLOv3-Tiny 84.78 83 70.88 29.7
改进的YOLOv3-Tiny 87.97 85 74.88 27.5
对比改进前后两种算法的性能,可以发现改进后的YOLOv3-Tiny算法在均值平均精度mAP上提高了3.19%,召回率Recall提高了2.00%,平均交并比IOU提高了4.00%,在检测速度方面有略微的下降,通常情况下检测速度在25帧/秒以上即可达到目标识别实时性要求,实验结果表明改进后的算法能够在满足实时性的情况下,提高目标识别的精度。
本实施例改进前后的mAP性能对比图如图2,虚线表示改进前的结果,实线表示改进后的结果,对比虚线和实线下的面积(面积代表算法的精确度mAP),可以明显看出实线下的面积大于虚线下的面积,故改进后的算法识别精度较高。
本实施例改进后的算法针对KITTI数据集检测结果图如图3,可以看出检测框贴合车体,在行车目标较远时也能得到较为准确的检测结果,由此改进后的YOLOv3-Tiny算法在识别精度上有较好的性能。
本实施例改进后的算法针对无人机拍摄的图像检测结果如图4、图5、图6,分别代表无遮挡情况检测效果图、小目标物体检测效果图、有遮挡情况检测效果图,依据三种结果图可以发现本实例改进后的算法有较好的检测性能。

Claims (7)

1.一种基于YOLOv3-Tiny的行车检测方法,其特征在于:包括如下步骤:
S1、训练样本获取;
S2、改进YOLOv3-Tiny算法;
S3、模型训练及输出:利用步骤S1中的训练样本对步骤S2中改进的算法网络进行训练,迭代学习输出新的深度学习模型;
S4、行车图像获取:利用无人机机载摄像头拍摄行车图像;
S5、行车图像检测:利用S3中改进算法模型对S4中的图像进行检测得出结果图。
2.根据权利要求1所述的基于YOLOv3-Tiny的行车检测方法,其特征在于:所述步骤S1中,选取KITTI数据集作为训练样本。
3.根据权利要求1所述的基于YOLOv3-Tiny的行车检测方法,其特征在于:所述步骤S3中模型训练采用均匀分布策略。
4.根据权利要求1所述的基于YOLOv3-Tiny的行车检测方法,其特征在于:所述步骤S2中包括如下步骤:
S2.1、改变网络输入图像像素大小;
S2.2、预设候选框聚类分析;
S2.3、改进YOLOv3-Tiny算法网络结构。
5.根据权利要求4所述的基于YOLOv3-Tiny的行车检测方法,其特征在于:所述步骤S2.1中图像像素由416×416改为672×224。
6.根据权利要求4所述的基于YOLOv3-Tiny的行车检测方法,其特征在于:所述步骤S2.2中利用kmeans算法对预设候选框进行聚类分析。
7.根据权利要求4所述的基于YOLOv3-Tiny的行车检测方法,其特征在于:所述步骤S2.3中,网络增加3个大小为的卷积层和3个大小为的卷积层。
CN201910387559.7A 2019-05-09 2019-05-09 一种基于YOLOv3-Tiny的行车检测方法 Pending CN110276247A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910387559.7A CN110276247A (zh) 2019-05-09 2019-05-09 一种基于YOLOv3-Tiny的行车检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910387559.7A CN110276247A (zh) 2019-05-09 2019-05-09 一种基于YOLOv3-Tiny的行车检测方法

Publications (1)

Publication Number Publication Date
CN110276247A true CN110276247A (zh) 2019-09-24

Family

ID=67959197

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910387559.7A Pending CN110276247A (zh) 2019-05-09 2019-05-09 一种基于YOLOv3-Tiny的行车检测方法

Country Status (1)

Country Link
CN (1) CN110276247A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110826520A (zh) * 2019-11-14 2020-02-21 燕山大学 一种基于改进YOLOv3-tiny算法的港口抓斗检测方法
CN110852358A (zh) * 2019-10-29 2020-02-28 中国科学院上海微***与信息技术研究所 一种基于深度学习的车辆类型判别方法
CN110942005A (zh) * 2019-11-21 2020-03-31 网易(杭州)网络有限公司 物体识别方法及装置
CN111046787A (zh) * 2019-12-10 2020-04-21 华侨大学 一种基于改进YOLO v3模型的行人检测方法
CN111444916A (zh) * 2020-03-26 2020-07-24 中科海微(北京)科技有限公司 面向无约束条件下的车牌定位及识别方法、***
CN111563525A (zh) * 2020-03-25 2020-08-21 北京航空航天大学 一种基于YOLOv3-Tiny的运动目标检测方法
CN112734794A (zh) * 2021-01-14 2021-04-30 北京航空航天大学 一种基于深度学习的运动目标跟踪与定位方法
CN113536963A (zh) * 2021-06-25 2021-10-22 西安电子科技大学 基于轻量化yolo网络的sar图像飞机目标检测方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108647742A (zh) * 2018-05-19 2018-10-12 南京理工大学 基于轻量级神经网络的快速目标检测方法
CN108921875A (zh) * 2018-07-09 2018-11-30 哈尔滨工业大学(深圳) 一种基于航拍数据的实时车流检测与追踪方法
CN109685152A (zh) * 2018-12-29 2019-04-26 北京化工大学 一种基于dc-spp-yolo的图像目标检测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108647742A (zh) * 2018-05-19 2018-10-12 南京理工大学 基于轻量级神经网络的快速目标检测方法
CN108921875A (zh) * 2018-07-09 2018-11-30 哈尔滨工业大学(深圳) 一种基于航拍数据的实时车流检测与追踪方法
CN109685152A (zh) * 2018-12-29 2019-04-26 北京化工大学 一种基于dc-spp-yolo的图像目标检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘军等: "基于增强Tiny YOLOV3算法的车辆实时检测与跟踪", 《农业工程学报》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110852358A (zh) * 2019-10-29 2020-02-28 中国科学院上海微***与信息技术研究所 一种基于深度学习的车辆类型判别方法
CN110826520A (zh) * 2019-11-14 2020-02-21 燕山大学 一种基于改进YOLOv3-tiny算法的港口抓斗检测方法
CN110942005A (zh) * 2019-11-21 2020-03-31 网易(杭州)网络有限公司 物体识别方法及装置
CN111046787A (zh) * 2019-12-10 2020-04-21 华侨大学 一种基于改进YOLO v3模型的行人检测方法
CN111563525A (zh) * 2020-03-25 2020-08-21 北京航空航天大学 一种基于YOLOv3-Tiny的运动目标检测方法
CN111444916A (zh) * 2020-03-26 2020-07-24 中科海微(北京)科技有限公司 面向无约束条件下的车牌定位及识别方法、***
CN112734794A (zh) * 2021-01-14 2021-04-30 北京航空航天大学 一种基于深度学习的运动目标跟踪与定位方法
CN112734794B (zh) * 2021-01-14 2022-12-23 北京航空航天大学 一种基于深度学习的运动目标跟踪与定位方法
CN113536963A (zh) * 2021-06-25 2021-10-22 西安电子科技大学 基于轻量化yolo网络的sar图像飞机目标检测方法
CN113536963B (zh) * 2021-06-25 2023-08-15 西安电子科技大学 基于轻量化yolo网络的sar图像飞机目标检测方法

Similar Documents

Publication Publication Date Title
CN110276247A (zh) 一种基于YOLOv3-Tiny的行车检测方法
CN111274970B (zh) 一种基于改进YOLO v3算法的交通标志检测方法
CN114240878A (zh) 面向巡检场景的绝缘子缺陷检测神经网络构建与优化方法
CN107133943A (zh) 一种防震锤缺陷检测的视觉检测方法
CN113807464B (zh) 基于改进yolo v5的无人机航拍图像目标检测方法
CN113378890B (zh) 一种基于改进YOLO v4的轻量级行人车辆检测方法
CN110837870A (zh) 基于主动学习的声呐图像目标识别方法
CN110175615B (zh) 模型训练方法、域自适应的视觉位置识别方法及装置
CN108549866B (zh) 基于密集卷积神经网络的遥感飞机识别方法
CN113420643B (zh) 基于深度可分离空洞卷积的轻量级水下目标检测方法
CN114092793B (zh) 适用于复杂水下环境的端到端生物目标检测方法
CN109376580A (zh) 一种基于深度学习的电力塔架部件识别方法
CN109241814A (zh) 基于yolo神经网络的行人检测方法
CN111540203B (zh) 基于Faster-RCNN调节绿灯通行时间的方法
CN111340019A (zh) 基于Faster R-CNN的粮仓害虫检测方法
CN116385958A (zh) 一种用于电网巡检和监控的边缘智能检测方法
CN113743505A (zh) 基于自注意力和特征融合的改进ssd目标检测方法
CN112084897A (zh) 一种gs-ssd的交通大场景车辆目标快速检测方法
CN113989487A (zh) 一种面向实景调度的故障缺陷检测方法及***
Li et al. Method research on ship detection in remote sensing image based on Yolo algorithm
CN111429419B (zh) 一种基于混合蚁群算法的绝缘子轮廓检测方法
CN116820131A (zh) 一种基于目标感知ViT的无人机跟踪方法
CN117593623A (zh) 基于改进YOLOv8n模型的轻量化车辆检测方法
CN112132207A (zh) 基于多分支特征映射目标检测神经网络构建方法
CN109815999B (zh) 一种简便高效的自动化煤矸识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination