CN110400305A - 一种基于深度学习的目标检测方法 - Google Patents
一种基于深度学习的目标检测方法 Download PDFInfo
- Publication number
- CN110400305A CN110400305A CN201910681200.0A CN201910681200A CN110400305A CN 110400305 A CN110400305 A CN 110400305A CN 201910681200 A CN201910681200 A CN 201910681200A CN 110400305 A CN110400305 A CN 110400305A
- Authority
- CN
- China
- Prior art keywords
- target
- detection
- different
- big
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Quality & Reliability (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明提出了一种基于深度学习的目标检测方法,属于机器视觉与自动化技术领域。其中该目标检测方法的核心是以深度网络为基础,通过提取不同深度的特征层数据,分别用来检测不同目标,实现对图像中不同大小目标检测。主要步骤为:1,建立深度网络,以较为成熟的网络为基础;2,提取每一个特征层,叫浅层的特征主要用来检测小目标,较深层特征多用于检测大目标;3,建立大目标和小目标同步检测;4,概率比较,确定最后的输出。本发明可以通过调整提取不同深度的特征层,实现对大小目标的偏好检测。
Description
技术领域
本发明属于机器视觉与自动化技术领域,特别涉及一种基于深度学习的图像目标检测方法。
背景技术
目标检测在国防,工业等领域有着广泛的应用,如可见光跟踪,飞行器辅助导航,汽车无人驾驶,机器人位置估计等,但是用红外,超声波等传感器实现目标检测,由于检测特征单一,容易出现误检测。
图像传感器则与之不同,通过调整不同角度和位置,以及光照强度改变,可以获得加多较为丰富的现场信息,用合理的方法处理图像信息是实现精确目标检测的关键。
目前基于机器视觉的目标检测方法较多,主要分为两大类:一类是基于传统图像处理的目标检测方法,另一种是基于深度学习的目标检测方法。
基于深度学习的目标检测方法有取代基于传统目标检测方法的趋势。
基于机器视觉的目标检测方法,因为图像信息复杂多变,很难有一种检测方法可以适用于每个适用场合,而且在不同的场景有着不同的需求,如在工厂流水线上,要检测体积较小的零件,需要对小物体敏感;在自动驾驶场合需要对较大的物体检测。
发明内容
发明目的:针对目前一般目标检测方法,对于检测图像中大目标和小目标的侧重侧重不同,提供一种可以同时检测不同大小目标的方法,为不同的使用场合,提供可选方法。
技术方案:为了解决上述技术问题,本发明提供了一种基于深度学习的图像目标检测方法,包括如下主要主要步骤:
(1)建立基于深度学习的基本网络结构,可以采用一些比较成熟的CNN网络结构,如VGG等。
(2)特征层抽取,为了应对图像中不同大小的目标,抽取不同深度的特征层,在浅层的CNN特征层,具有较大范围,可以检测到较小的目标;而在深层的特征层上由于范围较小,只能检测到较大目标。
(3)分别用浅层和深层特征去检测图像中目标位置,最后确定目标检测网络的最终输出。
不同的特征层只能确定图像中不同尺度的目标的具***置,而图像中不同目标所属类别,还需要用网络的最后后输出来确定。
对于目标在图像中的位置确定,并没有采取直接输出,而是通过在图像特征层上选取不同大小的先验框,用图像上目标的具***置与不同的先验框做比较,确定具体哪一个先验框与目标实际位置相符,确定哪一个先验框应该被输出。
目标检测网络的运行包含结构为:待检测图像,网络架构,预测输出,先验框生成,测试图像坐标解码,先验框筛选,以及检测结果输出。
本发明具有以下有益效果:首先可以根据需要检测目标在图像中大小的不同,适当调整特征层提出的深浅程度,使其能满足需求,且不会造成资源浪费,其次是一次训练可以适应多种场合,因为训练时把所有特征层都提取出来,并加以矫正参数,使用时可根据需求提取。
附图说明
图1是先验框提取方式。
图2是检测框架训练结构。
图3是检测框架运行结构。
具体实施方式
以下将结合附图对本发明进行详细说明。
样本图像经过标注后,分为两个部分,一个部分是图像原始数据,另外一部分是图像中目标类别,以及每个目标在图像中的位置坐标。
参照图1所示,先验框是基于图像经过卷积网络,在每一层特征图像中提取到的,并且从浅到深,特征图面积越来越小,厚度越来越厚。
先验框的中心坐标是以特征图上每一个点为中心,如在一个38*38的特征图上可以取到1444个中心点。
在同一层特征图上,每个中心点选取的先验框是相同的,如若每个中心点取4个先验框,则上述38*38特征图上共可以取到5776个先验框。
每个先验框有不同的尺寸,但是基本有两种形状的先验框,正方形和长方形,正方形先验框边长计算方式如下:
上式ws为小正方形的变长。
上式w为大正方形的边长,ImageSize为输入图像大小AnchorSizesmall与AnchorSizebig为先验框参数,每一层先验框参数有两个,且计算方式如下:
式中Smin与Smax为上一层的先验框参数,且初始参数为给定值15与90,且m为要提取的特征层数,但是初始层不算,k为当前计算的层数。
第一层特征图先验框计算方式为AnchorSize=S1*0.5*Imagesize。
h与w分别为长方形的高和宽,且长方形高宽可以和互换,但是一定要标尺面积不变。
参照图2所示,坐标编码是有先验框与目标类别以及目标在图像中的坐标共同生成,通过判断目标在图像中的坐标框与所有先验框的重合度,确定目标框与先验框的相识度既得分。
选取满足阈值的先验框,并与目标框相比较,确定偏移量。
偏移量的计算方式如下式
式中xt为目标框中心点的横坐标,xp为目标框中心点的横坐标,xo中心偏移量的横坐标,其余类似。
在参照图3所示,坐标解码是坐标编码的逆过程,通过偏移量和先验框的坐标计算图像可能的实际坐标,计算方式如下:
xt=xohpSr+xp
yt=yowpSr+yp
上式中xt为目标框中心点的横坐标,xp为目标框中心点的横坐标,xo中心偏移量的横坐标,其余类似。
参照图2所示,训练目标是网络结构的训练主题,不仅要考虑类别匹配,还需要考虑大目标和小目标检测的不同。本发明采取同一个训练目标,分别同步训练。
损失函数定义如下:
式中Lloc(x,l,g)为位置损失误差,Lconf(x,c)为类别损失误差。
式中为第i个先验框与第j个真实框关于第p个类别的匹配程度,若匹配为0 否则为0,为坐标的真实偏移量,预测输出偏移量。
式中N为先验框与真实框匹配的个数,为与第i个先验框与第p个类别为正样本,否则为负样本。
参考图2所示,在训练时,同时用大目标检测和小目标检测矫正网络主体参数,给予大目标和小目标检测相同的权重。
参考图3所示,在运行时分别输出大目标检测与小目标检测结果,并根据对相同目标的检测结果,优先输出概率较大的检测结果。
Claims (2)
1.一种基于深度学习的目标检测方法,其特征在于包括如下内容:在同一个网络主体当中,针对不同大小的检测目标,从不同深度的特征层上抽取,使一个网络能同时根据大小不同的目标作出不同的检测结果;对大目标检测与小目标检测,同时针对同一目标输出结果,以可能性较大的作为最终输出结果;可以根据不同的检测需求,对大目标检测与小目标检测的特征图提取,灵活提取。
2.一种基于深度学习的目标检测方法,其特征在于,包括以下步骤:
第一步,同时分别提取网络主体的不同层数,不同的坐标检测模型;
第二步,对于同一样本检测,一次通过网络主体,获取大小目标检测的不同坐标输出;
第三步,对于同一样本的结果输出,采取大小目标检测的结果做对比输出。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910681200.0A CN110400305A (zh) | 2019-07-26 | 2019-07-26 | 一种基于深度学习的目标检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910681200.0A CN110400305A (zh) | 2019-07-26 | 2019-07-26 | 一种基于深度学习的目标检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110400305A true CN110400305A (zh) | 2019-11-01 |
Family
ID=68325156
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910681200.0A Pending CN110400305A (zh) | 2019-07-26 | 2019-07-26 | 一种基于深度学习的目标检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110400305A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112418200A (zh) * | 2021-01-25 | 2021-02-26 | 成都点泽智能科技有限公司 | 基于热成像的对象检测方法、装置及服务器 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108596101A (zh) * | 2018-04-25 | 2018-09-28 | 上海交通大学 | 一种基于卷积神经网络的遥感图像多目标检测方法 |
CN108734086A (zh) * | 2018-03-27 | 2018-11-02 | 西安科技大学 | 基于眼部区域生成网络的眨眼频率和视线估计方法 |
CN109344821A (zh) * | 2018-08-30 | 2019-02-15 | 西安电子科技大学 | 基于特征融合和深度学习的小目标检测方法 |
US20190205630A1 (en) * | 2017-12-29 | 2019-07-04 | Cerner Innovation, Inc. | Methods and systems for identifying the crossing of a virtual barrier |
CN109993096A (zh) * | 2019-03-26 | 2019-07-09 | 东北大学 | 一种面向视频目标检测的光流多层帧特征传播及聚合方法 |
-
2019
- 2019-07-26 CN CN201910681200.0A patent/CN110400305A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190205630A1 (en) * | 2017-12-29 | 2019-07-04 | Cerner Innovation, Inc. | Methods and systems for identifying the crossing of a virtual barrier |
CN108734086A (zh) * | 2018-03-27 | 2018-11-02 | 西安科技大学 | 基于眼部区域生成网络的眨眼频率和视线估计方法 |
CN108596101A (zh) * | 2018-04-25 | 2018-09-28 | 上海交通大学 | 一种基于卷积神经网络的遥感图像多目标检测方法 |
CN109344821A (zh) * | 2018-08-30 | 2019-02-15 | 西安电子科技大学 | 基于特征融合和深度学习的小目标检测方法 |
CN109993096A (zh) * | 2019-03-26 | 2019-07-09 | 东北大学 | 一种面向视频目标检测的光流多层帧特征传播及聚合方法 |
Non-Patent Citations (2)
Title |
---|
李林 等: "基于改进梯度方向直方图的多尺度的行人检测", 《计算机应用》 * |
陈冰曲 等: "基于改进型SSD 算法的目标车辆检测研究", 《重庆理工大学学报(自然科学)》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112418200A (zh) * | 2021-01-25 | 2021-02-26 | 成都点泽智能科技有限公司 | 基于热成像的对象检测方法、装置及服务器 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111723748B (zh) | 一种红外遥感图像舰船检测方法 | |
CN106875373B (zh) | 基于卷积神经网络剪枝算法的手机屏幕mura缺陷检测方法 | |
CN110033473B (zh) | 基于模板匹配和深度分类网络的运动目标跟踪方法 | |
CN106023257B (zh) | 一种基于旋翼无人机平台的目标跟踪方法 | |
CN105740910A (zh) | 一种车辆物件检测方法及装置 | |
CN111898406B (zh) | 基于焦点损失和多任务级联的人脸检测方法 | |
CN103072718B (zh) | 用于食品包装生产线的机器视觉检测***及方法 | |
CN112200045B (zh) | 基于上下文增强的遥感图像目标检测模型建立方法及应用 | |
CN103729649B (zh) | 一种图像旋转角度检测方法和装置 | |
CN108960404B (zh) | 一种基于图像的人群计数方法及设备 | |
CN110490842A (zh) | 一种基于深度学习的带钢表面缺陷检测方法 | |
CN106355579A (zh) | 烟条表面褶皱的缺陷检测方法 | |
CN114897816A (zh) | 基于改进掩膜的Mask R-CNN矿物颗粒识别以及粒度检测方法 | |
CN114693661A (zh) | 一种基于深度学习的快速分拣方法 | |
CN110633727A (zh) | 基于选择性搜索的深度神经网络舰船目标细粒度识别方法 | |
Zhang et al. | An automatic recognition method for PCB visual defects | |
CN110516527B (zh) | 一种基于实例分割的视觉slam回环检测改进方法 | |
CN117788402A (zh) | 一种基于LIDD-Net高实时轻量化网络的工业产品缺陷检测方法 | |
CN110400305A (zh) | 一种基于深度学习的目标检测方法 | |
CN116843615B (zh) | 一种基于柔性光路的引线框架智能全检方法 | |
CN109815957A (zh) | 一种基于彩色图像在复杂背景下的文字识别方法 | |
CN110136098B (zh) | 一种基于深度学习的线缆顺序检测方法 | |
CN116051808A (zh) | 一种基于YOLOv5的轻量化零件识别定位方法 | |
CN110084777A (zh) | 一种基于深度学习的微小零件定位跟踪方法 | |
CN115661094A (zh) | 基于改进yolox模型的工业瑕疵检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20191101 |