CN107818302A - 基于卷积神经网络的非刚性多尺度物体检测方法 - Google Patents

基于卷积神经网络的非刚性多尺度物体检测方法 Download PDF

Info

Publication number
CN107818302A
CN107818302A CN201710989778.3A CN201710989778A CN107818302A CN 107818302 A CN107818302 A CN 107818302A CN 201710989778 A CN201710989778 A CN 201710989778A CN 107818302 A CN107818302 A CN 107818302A
Authority
CN
China
Prior art keywords
target
detection
network
rigid
multiple dimensioned
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710989778.3A
Other languages
English (en)
Inventor
饶江浩
徐智勇
张建林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Optics and Electronics of CAS
Original Assignee
Institute of Optics and Electronics of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Optics and Electronics of CAS filed Critical Institute of Optics and Electronics of CAS
Priority to CN201710989778.3A priority Critical patent/CN107818302A/zh
Publication of CN107818302A publication Critical patent/CN107818302A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种基于卷积神经网络的非刚性多尺度物体检测方法,首先设计深度网络,并以具有一定代表性的红外行人数据集cvc‑09,cvc‑14(有约20x30像素的小目标,也有较近距离的大目标行人),以及自己标注的小目标行人数据进行目标检测的深度网络学***台设计不同的检测模型,并加以评估。所设计网络,运用7x7网格划分并针对每个格子运用6个侯选框,完成目标区域提名,通过分类识别和位置回归分析实现行人目标检测。该设计中运用神经网络,增加了检测模型的特征提取能力。鉴于网格划分的思想,实现了检测的实时性,运用不同目标尺度的数据集和多尺度训练,增多侯选框数量,最终增强小目标的检测能力。

Description

基于卷积神经网络的非刚性多尺度物体检测方法
技术领域
本发明涉及物体实时检测的技术领域,具体涉及一种基于卷积神经网络的非刚性多尺度物体的检测方法。
背景技术
如图3所示,神经元是模仿生物神经构造的数学模型,不同的输入(如不同的像素点)通过加权(如卷积神经网络中的卷积运算)求和,在节点处同过非线性函数(激活函数)的变换得到该神经节点的输出。如图4所示,众多神经节点可形成神经层,众多神经层可搭建神经网络。神经网络由于输入通过多层非线性变换(非线性函数的嵌套),表现出对训练数据强大的拟合能力(学习能力),从而表现出良好的预测能力。
对于神经网络模型,有训练和测试两个阶段。训练是通过输入训练图片,得到的输出与标准输出(标注)对比,其误差是通过损失函数体现,通过优化参数来减小损失函数。测试则是对训练好的模型性能的评估,通过测试结果可以评估出模型的泛化能力。
在检测任务中,网络模型和三个主要板块:区域提名(选取目标可能区域,往往通过滑窗和选择性搜索),但常规方法中滑窗其实是一种穷举法,过程存在很多冗余,选择性搜索则需要耗费大量时间。在端到端的检测(定位、识别一体化)中采取了网格划分,每个区域各自判定是否为目标,然后综合得出最后结果。
发明内容
本发明要解决技术问题为:在移动设备和小体积设备的目标实时检测中,由于不同场景中非刚性多尺度目标形态、角度多变,传统检测方法普适性和鲁棒性不高。在采用神经网络和划分网格区域搜索的方案中,一定程度上解决了普适性和鲁棒性的问题,同时又保证了检测的实时性。
本发明解决上述技术问题采用的技术方案为:一种基于卷积神经网络的非刚性多尺度物体(如红外行人图像)检测方法,构造具有强大特征提取和学***台,通过硬件设备输入图像并进行目标的实时检测。
进一步地,具有合适且准确标定的数据集(监督学习),由于神经网络训练数据集中缺乏针对较小红外目标的训练数据集,且现阶段神经网络在检测较小目标方面存在瓶颈,通过在网络上寻找、筛选非标配的数据集,编写脚本把数据集标注转换为网络可用的数据,在此基础上,通过拍摄和标注,扩充了数据,形成了可训练的数据集。
进一步地,具有强大特征提取能力和学习能力的模型,由于非刚性目标(如:人)在不同角度姿态上差异比较大,且目标存在不同尺度,非单一场景下传统方法性能受到限制,该方法采用了具有强大特征提取能力的分类模型——深度网络,该模型将不同的网络层之间密集连接,使得各层特征利用充分。
进一步地,在硬件平台上能够实现实时检测。通过提取出非刚性目标的特征,再由神经网络中的回归层和分类层对侯选框进行目标识别和位置估计,这一端到端的过程同时完成目标的识别和定位,通过区域网格划分并对每个区域实施上述操作,简化了搜过可能目标的过程,一次性完成了目标与非目标的判定,从而保证了检测的实时性,最后的非极大值抑制去处了冗余的检测输出。
本发明与现有技术相比的优点在于:
(1)本发明特点是端到端的网络结构保证了检测的实时性。与一般模型相比,采用了较多的均值池化缩减运算数据,运用稠密连接的思想,在不增加网络深度的情况下来提高网络网络的性能,同时该神经网络的框架简洁,具有高的可移植性,使得训练好的网络能直接运用到成像***目标检测上,实现检测技术的落地,实现了小体积设备具有智能性的检测。
(2)本发明在训练数据上采用了增广的方法,同时把数据库中的正样本(目标充满整张图片)当做目标检测的训练数据,进一步针对性地学习目标本身的特征。
附图说明
图1为本发明方法网络训练过程实现的流程图;
图2为本发明方法网络检测过程实现的流程图;
图3为神经网络中神经元节点的数学模型;
图4神经网络的基本模型;
图5为稠密连接模型;
图6为网格划分输入图像示意图;
图7示意经过特征提取后网络分类识别出目标所在的网格区域;
图8表示对目标所在的区域运用侯选框进行回归;
图9为经过非极大值抑制冗余检测框后的最终输出;
图10为训练过程中损失函数变化图表。
具体实施方式
下面结合附图以及具体实施方式进一步说明本发明。
如图1所示,本发明一种基于卷积神经网络的非刚性多尺度物体检测方法,该方法具体步骤如下:
步骤1、带标注的图像;
图1表示整个训练过程。将带有标注的训练数据(待标注的图像)输入神经网络,通过前向传播得到输出结果。将输出结果和标注进行比较得到误差(用损失函数衡量,训练的目标是减小损失函数),通过神经网络的误差梯度反向传播更新参数,如此循环,使损失函数减小和收敛。
在训练的过程中,除了运用传统的平移、多尺度、调整图像对比度方法之外,还用了其他数据增广的方式来增加的用于训练的图像数据,如:
(1)将标注的数据集中的目标裁剪出来,成为标注框为整幅图大小的新目标。
(2)将裁剪出来的目标图像随机组合放置在新的背景图像上,成为新的训练样本。
步骤2、用7×7网格划分成不同区域;
除了对输入图像进行7×7的网格划分,可以根据具体任务,选择划分大小。比如在红外行人检测中针对小较小目标,采用上述方法。如果是检测水下大体积的鱼,可以对神经网络中靠后的特征层进行网格划分(因为在网络中,前面的卷积层提取出的更多是边沿和轮廓特征,后面的则是相对抽象的语义特征),把特征层的信息导入到网络末端的检测部分。
划分尺度和特征层的选取可以根据具体任务而机动选取,以特征参数少和尽量不增加网络的计算量为前提。
步骤3、对整幅图像进行特征提取;
特征提取由神经网络中的卷积层完成。神经网络卷积层的卷积核参数现被初始化,在训练的过程中,通过不断调节参数,减小损失函数,最后得到训练好的网络模型(此时的参数通过训练和改变,能够使得卷积操作提取图像特征,然后前向传播,检测出目标)。数据增广的作用就是增加训练样本,使得网络在训练过程中能够学习到目标更抽象、更普遍的特征。
步骤4、对每个区域运用候选框进行检测;
候选框的作用是对检测目标有个先验判定。在具体检测任务中,采用选取的几个固定尺寸的框对每个局部区域进行定位,然后在后续的步骤中合并和去除冗余,来得到最终检测结果。K均值聚类则是在训练数据中,根据标注信息来得出候选框的大小。候选框的个数可根据要求而定,数量越多会导致速度下降,精度提升。可以利用K-means选取候选框大小。
步骤5、候选框的分类和回归;
分类和回归由神经网络模型中常用的softmax(分类层)和bbox regressor(边框回归层)完成。
步骤6、非极大值抑制;
非极大值抑制根据设定阈值,选取阈值以上置信度的边框和概率的类别,去掉其他边框和类别,得到最后的位置信息和类别信息。
步骤7、识别定位出目标,根据标签求出检测误差;
检测过程便运用已经训练好参数的神经网络模型,得到最后输出,如图2所示。在训练过程中,则通过输出和标注对比,误差逐层反向传播,运用梯度下降法更新参数,使得模型的输出逼近标注(减小损失函数值),完成训练学习的过程,如图1所示。
本发明是基于卷积神经网络特征提取的方法进行中小目标的非刚性物体(如行人)检测,即通过搭建卷积神经网络检测模型,导入图像数据库进行训练优化模型参数,达到良好的检测效果。首先设计深度网络,并以具有一定代表性的红外行人数据集cvc-09,cvc-14(有约20x30像素的小目标,也有较近距离的大目标行人),以及自己标注的小目标行人数据进行目标检测的深度网络学***台设计不同的检测模型,并加以评估。所设计网络,运用7x7网格划分并针对每个格子运用多个候选框,完成目标区域提名,通过分类识别和位置回归分析实现行人目标检测。该设计中运用神经网络,增加了检测模型的特征提取能力。鉴于网格划分的思想,实现了检测的实时性,运用不同目标尺度的数据集和多尺度训练,增多侯选框数量,最终增强小目标的检测能力。
通过神经网络不同层特征图的级联,增强网络的学***台下运用。
网络层与层之间的稠密连接与端到端技术的结合,同时用均值聚类的方法选取了多个(如行人检测中6个侯选框)侯选框,将检测器连接在该网络末尾或者过渡层出,根据使用一个或者多个检测器。稠密连接如图5所示。
图5中,每层以之前层的输出为输入,对于有L层的传统网络,一共有L个连接,对于多层网络,则有L(L+1)/2。上图中,H4层可以直接用到原始输入信息X0,同时还用到了之前层对X0处理后的信息,这样能够最大化信息的流动。反向传播过程中,X0的梯度信息包含了损失函数直接对X0的导数,有利于梯度传播,由于稠密连接和权值共享,使得在非刚性物体(如行人)检测中,有足够深的网络(超过300层),而足够少的参数(存储大小仅60MB左右)。
将网格划分的提名技术、数据集与之结合,则可以在检测上面得到很好的效果,并且根据具体的任务不同,可在多层网络不同的过渡层上连接检测器,在多尺度的基础下综合检测结果。也可用在单一出连接检测器(如在末尾连接用于红外行人检测,)则可取得较好的结果,流程如图6-9所示,对图像进行网格划分,在通过提取特征后,对每个区域的图像运用候选框分类和定位,最后融合并去除冗余,得到检测目标的位置和类别信息。
本发明采用的神经网络框架为darknet,硬件开发平台采用了GTX1080加速网络训练,硬件使用平台为Nvidia jetson TX1。
首先安装配置cuda和cudnn加速库和darknet。在此基础上,使用python编写脚本将CVCX系列的标注数据转换,用lablImg标注扩充训练样本。
通过修改网络结果,评估网络侯选框,在网络结构配置中使用Route层引出detector,采用平移、旋转等方式增广训练数据,选择合适的批数据量和数据导入次数来控制训练过程中数据的吞吐,选择合适的学习率和权值衰减率等来保证优化过程的收敛,并防止收敛到局部最优解,GPU上迭代训练使损失函数降低,部分过程如图10所示。
最后,评估选择出最合适的训练权值,移植到使用平台即可。

Claims (4)

1.一种基于卷积神经网络的非刚性多尺度物体检测方法,其特征是:构造具有强大特征提取和学***台,通过硬件设备输入图像并进行目标的实时检测。
2.根据权利要求1所述的一种基于卷积神经网络的非刚性多尺度物体检测方法,其特征是:具有合适且准确标定的数据集,由于神经网络训练数据集中缺乏针对较小红外目标的训练数据集,且现阶段神经网络在检测较小目标方面存在瓶颈,通过在网络上寻找、筛选非标配的数据集,编写脚本把数据集标注转换为网络可用的数据,在此基础上,通过拍摄和标注,扩充了数据,形成了可训练的数据集。
3.根据权利要求1所述的一种基于卷积神经网络的非刚性多尺度物体检测方法,其特征是:具有强大特征提取能力和学习能力的模型,由于非刚性目标在不同角度姿态上差异比较大,且目标存在不同尺度,非单一场景下传统方法性能受到限制,该方法采用了具有强大特征提取能力的分类模型——深度网络,该模型将不同的网络层之间密集连接,使得各层特征利用充分。
4.根据权利要求1所述的一种基于卷积神经网络的非刚性多尺度物体检测方法,其特征是:在硬件平台上能够实现实时检测;通过提取出非刚性目标的特征,再由神经网络中的回归层和分类层对侯选框进行目标识别和位置估计,这一端到端的过程同时完成目标的识别和定位,通过区域网格划分并对每个区域实施上述操作,简化了搜过可能目标的过程,一次性完成了目标与非目标的判定,从而保证了检测的实时性,最后的非极大值抑制去处了冗余的检测输出。
CN201710989778.3A 2017-10-20 2017-10-20 基于卷积神经网络的非刚性多尺度物体检测方法 Pending CN107818302A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710989778.3A CN107818302A (zh) 2017-10-20 2017-10-20 基于卷积神经网络的非刚性多尺度物体检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710989778.3A CN107818302A (zh) 2017-10-20 2017-10-20 基于卷积神经网络的非刚性多尺度物体检测方法

Publications (1)

Publication Number Publication Date
CN107818302A true CN107818302A (zh) 2018-03-20

Family

ID=61608634

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710989778.3A Pending CN107818302A (zh) 2017-10-20 2017-10-20 基于卷积神经网络的非刚性多尺度物体检测方法

Country Status (1)

Country Link
CN (1) CN107818302A (zh)

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108520286A (zh) * 2018-04-24 2018-09-11 青岛科技大学 基于卷积神经和候选区域的红外暗弱光小目标检测***
CN108537329A (zh) * 2018-04-18 2018-09-14 中国科学院计算技术研究所 一种利用Volume R-CNN神经网络进行运算的方法和装置
CN108549866A (zh) * 2018-04-12 2018-09-18 上海海事大学 基于密集卷积神经网络的遥感飞机识别方法
CN108614996A (zh) * 2018-04-04 2018-10-02 杭州电子科技大学 一种基于深度学习的军船、民船自动识别方法
CN108647573A (zh) * 2018-04-04 2018-10-12 杭州电子科技大学 一种基于深度学习的军事目标识别方法
CN108764203A (zh) * 2018-06-06 2018-11-06 四川大学 一种面向城市规划的行人量化分析及展示***
CN108985222A (zh) * 2018-07-12 2018-12-11 天津艾思科尔科技有限公司 一种用于接打电话识别的深度学习网络模型及***
CN109145713A (zh) * 2018-07-02 2019-01-04 南京师范大学 一种结合目标检测的小目标语义分割方法
CN109272050A (zh) * 2018-09-30 2019-01-25 北京字节跳动网络技术有限公司 图像处理方法和装置
CN109377508A (zh) * 2018-09-26 2019-02-22 北京字节跳动网络技术有限公司 图像处理方法和装置
CN109376693A (zh) * 2018-11-22 2019-02-22 四川长虹电器股份有限公司 人脸检测方法及***
CN109493320A (zh) * 2018-10-11 2019-03-19 苏州中科天启遥感科技有限公司 基于深度学习的遥感影像道路提取方法及***、存储介质、电子设备
CN109543683A (zh) * 2018-11-30 2019-03-29 百度在线网络技术(北京)有限公司 图像标注修正方法、装置、设备和介质
CN109583456A (zh) * 2018-11-20 2019-04-05 西安电子科技大学 基于特征融合和稠密连接的红外面目标检测方法
CN109598197A (zh) * 2018-10-31 2019-04-09 大连大学 基于密集连接模块的沙漏模型的设计方法
CN109614957A (zh) * 2019-01-04 2019-04-12 王卫星 一种铁路调车信号安全预警***
CN109919934A (zh) * 2019-03-11 2019-06-21 重庆邮电大学 一种基于多源域深度迁移学习的液晶面板缺陷检测方法
CN109948605A (zh) * 2019-02-15 2019-06-28 北京中电普华信息技术有限公司 一种针对小目标的图片增强方法及装置
CN110633594A (zh) * 2018-06-21 2019-12-31 北京京东尚科信息技术有限公司 一种目标检测方法和装置
CN111310831A (zh) * 2020-02-19 2020-06-19 中国科学院光电技术研究所 一种基于深度学习的小目标检测网络逐层训练方法
CN112153483A (zh) * 2019-06-28 2020-12-29 腾讯科技(深圳)有限公司 信息植入区域的检测方法、装置及电子设备
CN112686152A (zh) * 2020-12-30 2021-04-20 广西慧云信息技术有限公司 一种多尺寸输入和多尺寸目标的农作物病虫害识别方法
CN113033504A (zh) * 2021-05-19 2021-06-25 广东众聚人工智能科技有限公司 一种基于多尺度视频异常检测方法
CN113076966A (zh) * 2020-01-06 2021-07-06 字节跳动有限公司 图像处理方法及装置、神经网络的训练方法、存储介质
WO2021244079A1 (zh) * 2020-06-02 2021-12-09 苏州科技大学 智能家居环境中图像目标检测方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105844238A (zh) * 2016-03-23 2016-08-10 乐视云计算有限公司 视频鉴别方法及***
CN106815596A (zh) * 2016-12-08 2017-06-09 ***股份有限公司 一种图像分类器建立方法及装置
CN106991646A (zh) * 2017-03-28 2017-07-28 福建帝视信息科技有限公司 一种基于密集连接网络的图像超分辨率方法
CN107038448A (zh) * 2017-03-01 2017-08-11 中国科学院自动化研究所 目标检测模型构建方法
CN107145845A (zh) * 2017-04-26 2017-09-08 中山大学 基于深度学习及多特征点融合的行人检测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105844238A (zh) * 2016-03-23 2016-08-10 乐视云计算有限公司 视频鉴别方法及***
CN106815596A (zh) * 2016-12-08 2017-06-09 ***股份有限公司 一种图像分类器建立方法及装置
CN107038448A (zh) * 2017-03-01 2017-08-11 中国科学院自动化研究所 目标检测模型构建方法
CN106991646A (zh) * 2017-03-28 2017-07-28 福建帝视信息科技有限公司 一种基于密集连接网络的图像超分辨率方法
CN107145845A (zh) * 2017-04-26 2017-09-08 中山大学 基于深度学习及多特征点融合的行人检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JOSEPH REDMON等: ""YOLO9000: Better, Faster, Stronger"", 《ARXIV》 *
ZHIQIANG SHEN等: ""DSOD: Learning Deeply Supervised Object Detectors from Scratch"", 《ARXIV》 *

Cited By (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108614996A (zh) * 2018-04-04 2018-10-02 杭州电子科技大学 一种基于深度学习的军船、民船自动识别方法
CN108647573A (zh) * 2018-04-04 2018-10-12 杭州电子科技大学 一种基于深度学习的军事目标识别方法
CN108549866A (zh) * 2018-04-12 2018-09-18 上海海事大学 基于密集卷积神经网络的遥感飞机识别方法
CN108537329A (zh) * 2018-04-18 2018-09-14 中国科学院计算技术研究所 一种利用Volume R-CNN神经网络进行运算的方法和装置
CN108520286A (zh) * 2018-04-24 2018-09-11 青岛科技大学 基于卷积神经和候选区域的红外暗弱光小目标检测***
CN108764203A (zh) * 2018-06-06 2018-11-06 四川大学 一种面向城市规划的行人量化分析及展示***
CN110633594A (zh) * 2018-06-21 2019-12-31 北京京东尚科信息技术有限公司 一种目标检测方法和装置
CN109145713A (zh) * 2018-07-02 2019-01-04 南京师范大学 一种结合目标检测的小目标语义分割方法
CN108985222B (zh) * 2018-07-12 2024-02-20 天津艾思科尔科技有限公司 一种用于接打电话识别的深度学习网络模型及***
CN108985222A (zh) * 2018-07-12 2018-12-11 天津艾思科尔科技有限公司 一种用于接打电话识别的深度学习网络模型及***
CN109377508A (zh) * 2018-09-26 2019-02-22 北京字节跳动网络技术有限公司 图像处理方法和装置
CN109272050A (zh) * 2018-09-30 2019-01-25 北京字节跳动网络技术有限公司 图像处理方法和装置
CN109272050B (zh) * 2018-09-30 2019-11-22 北京字节跳动网络技术有限公司 图像处理方法和装置
CN109493320A (zh) * 2018-10-11 2019-03-19 苏州中科天启遥感科技有限公司 基于深度学习的遥感影像道路提取方法及***、存储介质、电子设备
CN109493320B (zh) * 2018-10-11 2022-06-17 苏州中科天启遥感科技有限公司 基于深度学习的遥感影像道路提取方法及***、存储介质、电子设备
CN109598197A (zh) * 2018-10-31 2019-04-09 大连大学 基于密集连接模块的沙漏模型的设计方法
CN109583456B (zh) * 2018-11-20 2023-04-28 西安电子科技大学 基于特征融合和稠密连接的红外面目标检测方法
CN109583456A (zh) * 2018-11-20 2019-04-05 西安电子科技大学 基于特征融合和稠密连接的红外面目标检测方法
CN109376693A (zh) * 2018-11-22 2019-02-22 四川长虹电器股份有限公司 人脸检测方法及***
CN109543683A (zh) * 2018-11-30 2019-03-29 百度在线网络技术(北京)有限公司 图像标注修正方法、装置、设备和介质
CN109614957A (zh) * 2019-01-04 2019-04-12 王卫星 一种铁路调车信号安全预警***
CN109948605A (zh) * 2019-02-15 2019-06-28 北京中电普华信息技术有限公司 一种针对小目标的图片增强方法及装置
CN109948605B (zh) * 2019-02-15 2021-05-28 北京中电普华信息技术有限公司 一种针对小目标的图片增强方法及装置
CN109919934A (zh) * 2019-03-11 2019-06-21 重庆邮电大学 一种基于多源域深度迁移学习的液晶面板缺陷检测方法
CN112153483A (zh) * 2019-06-28 2020-12-29 腾讯科技(深圳)有限公司 信息植入区域的检测方法、装置及电子设备
CN113076966A (zh) * 2020-01-06 2021-07-06 字节跳动有限公司 图像处理方法及装置、神经网络的训练方法、存储介质
CN113076966B (zh) * 2020-01-06 2023-06-13 字节跳动有限公司 图像处理方法及装置、神经网络的训练方法、存储介质
CN111310831A (zh) * 2020-02-19 2020-06-19 中国科学院光电技术研究所 一种基于深度学习的小目标检测网络逐层训练方法
WO2021244079A1 (zh) * 2020-06-02 2021-12-09 苏州科技大学 智能家居环境中图像目标检测方法
CN112686152A (zh) * 2020-12-30 2021-04-20 广西慧云信息技术有限公司 一种多尺寸输入和多尺寸目标的农作物病虫害识别方法
CN112686152B (zh) * 2020-12-30 2023-06-09 广西慧云信息技术有限公司 一种多尺寸输入和多尺寸目标的农作物病虫害识别方法
CN113033504A (zh) * 2021-05-19 2021-06-25 广东众聚人工智能科技有限公司 一种基于多尺度视频异常检测方法

Similar Documents

Publication Publication Date Title
CN107818302A (zh) 基于卷积神经网络的非刚性多尺度物体检测方法
WO2021139069A1 (zh) 自适应注意力指导机制的一般性目标检测方法
CN106970615B (zh) 一种深度强化学习的实时在线路径规划方法
CN111368896B (zh) 基于密集残差三维卷积神经网络的高光谱遥感图像分类方法
CN107092870B (zh) 一种高分辨率影像语义信息提取方法
CN107451602A (zh) 一种基于深度学习的果蔬检测方法
CN104217214B (zh) 基于可配置卷积神经网络的rgb‑d人物行为识别方法
CN104281853B (zh) 一种基于3d卷积神经网络的行为识别方法
CN106845499A (zh) 一种基于自然语言语义的图像目标检测方法
CN108021947B (zh) 一种基于视觉的分层极限学习机目标识别方法
CN109584248A (zh) 基于特征融合和稠密连接网络的红外面目标实例分割方法
CN109977918A (zh) 一种基于无监督域适应的目标检测定位优化方法
CN108805070A (zh) 一种基于嵌入式终端的深度学习行人检测方法
CN110516539A (zh) 基于对抗网络的遥感影像建筑物提取方法、***、存储介质及设备
CN108830188A (zh) 基于深度学习的车辆检测方法
CN108875624A (zh) 基于多尺度的级联稠密连接神经网络的人脸检测方法
CN107609525A (zh) 基于剪枝策略构建卷积神经网络的遥感图像目标检测方法
CN107392901A (zh) 一种用于输电线路部件智能自动识别的方法
CN107316058A (zh) 通过提高目标分类和定位准确度改善目标检测性能的方法
CN106845430A (zh) 基于加速区域卷积神经网络的行人检测与跟踪方法
CN109241982A (zh) 基于深浅层卷积神经网络的目标检测方法
CN106980858A (zh) 一种语言文本检测与定位***及应用该***的语言文本检测与定位方法
CN109508360A (zh) 一种基于元胞自动机的地理多元流数据时空自相关分析方法
CN108921879A (zh) 基于区域选择的CNN和Kalman滤波的运动目标跟踪方法及***
CN107529650A (zh) 网络模型的构建和闭环检测方法、相应装置及计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination