CN109376576A - 基于交替更新密集连通从零训练网络的目标检测方法 - Google Patents

基于交替更新密集连通从零训练网络的目标检测方法 Download PDF

Info

Publication number
CN109376576A
CN109376576A CN201810951609.5A CN201810951609A CN109376576A CN 109376576 A CN109376576 A CN 109376576A CN 201810951609 A CN201810951609 A CN 201810951609A CN 109376576 A CN109376576 A CN 109376576A
Authority
CN
China
Prior art keywords
attention
training
module
longitudinal
object detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810951609.5A
Other languages
English (en)
Inventor
年睿
徐晓
张世昌
郝宝趁
孔双
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ocean University of China
Original Assignee
Ocean University of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ocean University of China filed Critical Ocean University of China
Priority to CN201810951609.5A priority Critical patent/CN109376576A/zh
Publication of CN109376576A publication Critical patent/CN109376576A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供了一种基于交替更新密集连通从零训练网络的目标检测方法,首先收集目标图像制作数据集,并进行标注;再进行密集连通交替更新模块、有界可形变卷积模块、基于自注意力和通道注意力的横纵结合的注意力模块、尺度转换特征金字塔模块和可变分段解耦卷积模块的训练,得到训练模型;获取训练图像,得到数据集,最后使用数据集以及训练模型对目标图像进行检测识别。本发明从深度学习角度辅助水下形变运动目标检测与追踪研究,也将促进高效从零训练学习机制的发展,实现形变、姿态、尺度变化大及有遮挡水下运动目标的高精度识别。

Description

基于交替更新密集连通从零训练网络的目标检测方法
技术领域
本发明涉及基于注意力导向的交替更新密集连通从零训练网络的水下形变运动目标检测方法,属于智能信息处理和目标检测与识别技术领域。
背景技术
目标检测与识别是视觉***中重要的环节,目标检测技术在视频监控、智能机器人导航、自动驾驶、姿态识别、形状检索等领域具有广阔的应用前景。目标检测与识别为合理利用和保护海洋资源、长期有效的多角度监控海洋,也为养殖渔业、海洋捕捞和鱼类行为分析等提供基本的数据和信息支撑。然而对水下形变运动目标而言,由于海洋光学成像条件制约,且易受光照、视角、遮挡、形态及尺度变化等因素影响,使得目标的外观特征发生极大变化,从而给图像检测与识别带来极大的挑战。
近年来,目标检测取得了巨大突破,得益于深度学习——主要是卷积神经网络(Convolution Neural Network,CNN)和候选区域(Region Proposal)算法。目标检测与识别的主流方法包括:传统目标检测,基于Region Proposal的深度学习目标检测和基于回归方法的深度学习目标检测。目前最先进的目标检测识别网络十分依赖于在Imagenet这类大型分类数据集上预先训练分类任务得到特征提取网络进而训练目标检测识别,但由于分类和检测识别在损失函数和类别上的差异会导致学习偏差,模型微调可以缓解这种偏差但不会从根本上解决这种偏差,而且将预训练模型从分类任务迁移到差异域更大的检测识别领域更加困难。2017年提出的DSOD方法给出了一个很好的解决思路,利用DenseNet优秀的梯度传输机制可以不依赖预训练分类模型从零开始训练检测识别网络。
目标检测是计算机视觉领域中极其重要的一部分,物体之间的遮挡形变、背景的复杂性,光照变化,尺度变化等是检测过程中亟待解决的问题。即现有技术中存在的主要问题:(1)由于海洋光学成像条件制约,且易受光照、视角、遮挡、形态及尺度变化等因素影响,使得目标的外观特征发生极大变化的问题;(2)由于图像目标缺乏上下文信息,在图像目标发生部分遮挡或形变的情况下,会导致目标检测差错的问题。
发明内容
针对上述问题,本发明的目的是提供一种基于注意力导向的交替更新密集连通从零训练网络的水下形变运动目标检测与识别方法,以实现对于形变运动目标特征提取、特征精炼、注意力的统一,试图从海量、高速、价值密度低的水下观测数据中快速挖掘和检测形变运动目标,以弥补现有技术的不足。
为达到上述目的,本发明采用如下技术方案:
一种基于注意力导向的交替更新密集连通从零训练网络的水下形变运动目标检测与识别方法,包括以下步骤:
(1)收集目标图像制作数据集,并进行标注;
(2)密集连通交替更新模块:为了不依赖分类预训练模型从零训练,避免分类和检测识别在损失函数和类别上的差异导致的学习偏差和数据集跨领域问题,尤其针对从水上数据集过渡到水下数据集的问题,使用密集连通交替更新模块,依赖其优秀的梯度传输机制、高效的特征提取和特征精炼作用、自带的注意力效果,实现了特征提取、特征精炼、注意力的统一;
(3)有界可形变卷积模块:为了克服形变目标的检测识别困难问题,在密集连通交替更新模块之后使用有界可形变卷积模块,可形变卷积不存在感受野的限制,具有学习感受野偏移的作用,随着输入图像的变化具有变化的感受野,可以有效的关注目标区域,并且可形变卷积对于目标形变具有很强的适应力,网络的检测效果将不受目标形变制约;
(4)基于自注意力和通道注意力的横纵结合的注意力模块:为了更好的优化传递密集连通交替更新模块提取的特征,使用基于自注意力和通道注意力的横纵结合的注意力模块,横向旨在关注感兴趣区域和明确目标间的关系,纵向旨在关注不同通道特征的重要性,加强重要特征,弱化不重要特征,为特征提取模块输送精良的特征,使用注意力特性引导特征传输,显性的进行特征优化;
(5)尺度转换特征金字塔模块:为提高检测识别精度,在网络头部特征金字塔模块中使用尺度转换代替上采样,在不破坏特征的前提下进行不同分辨率特征之间的融合,同时极大减少了网络头部的计算量;
(6)可变分段解耦卷积:为解决从零训练的检测识别网络收敛慢的问题以及普通卷积难以分清类内差异和类间差异的问题,使用解耦卷积的幅度和角度,使用幅度度量类内差异,角度度量类间差异,采取直接学习幅度和角度代替进行拟合;
(7)获取训练图像,并对其进行尺度扩增和随机隐藏获得{In,n=1,2,...,N};
(8)模型训练的目标检测识别:使用{In,n=1,2,...,N}以及训练好的模型对目标图像进行检测识别。
进一步的,所述步骤(2)中的密集连通交替更新模块:
x表示特征图,k代表交替更新的次数,i代表某次交替更新中的第i层,W代表待训练的权重,*代表卷积操作,g代表非线性函数,m,l均为累加符号的索引。
进一步的,所述步骤(3)中的有界可形变卷积模块:
x表示特征图,p表示特征图X的p0位置感受野偏移之后的位置,及p=p0+Δp,其中Δp为可学习的变量,q表示位于p周围的四个整数点的位置,G(q,p)为求p和q的插值,通过插值的方式求出偏移后的特征图。
进一步的,所述步骤(4)中的基于自注意力和通道注意力的横纵结合的注意力模块,其中横向注意力:
f(x)=Wfx
g(x)=Wgx
yi=γoi
其中,x为输入的特征图,W为待训练的权重,f,g,h分别为横向注意力模块的三种特征提取方式,γ为横向注意力的重要程度,是一个可训练的变量,yi为横向注意力模块的输出;
纵向注意力为:
s=σ(W2δ(W1Z))
其中,Z为全局平均池化的特征,H,W为特征图的行列尺寸,U为输入纵向注意力的特征图,σ,δ为非线性函数,W为待训练的权重,s为纵向注意力模块的输出;
最终,横向注意力和纵向注意力进行融合:
Y=(X+yi)*(1+s)
其中,X为横纵向注意力模块的输入,Y为横纵向注意力模块的输出。
进一步的,所述步骤(5)中的尺度转换特征金字塔模块:
其中I为特征图,LR为尺度转换之前,SR为尺度转换之后,r为转换的步长,x,y,c分别为列坐标,行坐标,深度坐标。
进一步的,所述步骤(6)中的可变分段解耦卷积:
其中,x为输入的特征图,w为待训练权重,β,ρ为可训练变量,E为求期望值。
进一步的,所述步骤(7)中的多尺度训练方法采用网络最终获得的特征图的尺寸7~10倍作为网络输入,这有利于网络对于不同尺度的目标检测精度,同时对图像的像素进行随机遮挡,这在训练过程中可以提高网络的检测识别精度,促使网络关注目标的整体而不是某一部位。
本发明的有益效果:
本发明从深度学习角度辅助水下形变运动目标检测与追踪研究,也将促进高效从零训练学习机制的发展,实现形变、姿态、尺度变化大及有遮挡水下运动目标的高精度识别。从零训练学习机制可以避免分类和检测识别在损失函数和类别上的差异导致的学习偏差和数据集跨领域问题,并且提出的密集连通交替更新模块还实现了特征提取、特征精炼、注意力的统一。可形变卷积和横纵向注意力模块的结合有效地克服了形变目标的检测识别,同时使用注意力引导特征的传输,有进一步精炼特征的作用。尺度转换特征金字塔模块可以在不破坏特征的前提下进行不同分辨率特征的融合,提高检测识别的精度。可变分段解耦卷积可以解决从零训练的检测识别网络收敛慢以及普通卷积难以分清类内差异和类间差异的问题。最后,多尺度和随机隐藏的训练方法可以提高网络对于目标尺度和遮挡的鲁棒性。
附图说明
图1是本发明的整体流程图。
图2是实施例1中海洋环境待检测与识别图像。
图3是本发明的密集连通交替更新模块图。
图4是本发明的有界可形变卷积模块图。
图5是本发明的自注意力和通道注意力的横纵结合的注意力模块图。
图6是本发明的尺度转换特征金字塔模块图。
图7是本发明的多尺度和随机隐藏训练方法示意图。
图8是实例1中的检测识别结果图。
具体实施方式
为使本发明的目的、实施方案和优点更为清晰,下面结合附图并通过具体实施例来进一步详细说明本发明。
实施例1:以海洋水下环境中鱼类的动态为检测识别对象。
本实施例的具体流程图如图1所示。
本实施例中具体采用一段如图2所示,从山东省海洋牧场拍摄得到的海洋环境下日间鱼类活动视频(1920*1080像素,每秒25帧)作为待检测和识别视频。
以下步骤应当结合附图,以及具体结果进行详细描述,并应当只是发明内容里概况的步骤。
步骤一、将在海洋牧场拍摄到的大量鱼类图像制作数据集,标注图像中所有鱼的位置、种类;
步骤二、如图3所示,通过密集连通交替更新模块实现特征提取、特征精炼、注意力的统一:
x表示特征图,k代表交替更新的次数,i代表某次次交替更新中的第i层,W代表待训练的权重,*代表卷积操作,g代表非线性函数。
步骤三、为了克服形变目标的检测识别困难问题,在步骤二之后使用有界可形变卷积模块,如图4所示,可形变卷积不存在感受野的限制,具有学习感受野偏移的作用,随着输入图像的变化具有变化的感受野,可以有效的关注目标区域,并且可形变卷积对于目标形变具有很强的适应力,网络的检测效果将不受目标形变制约,其公式如下:
x表示特征图,p表示特征图X的p0位置感受野偏移之后的位置,及p=p0+Δp,其中Δp为可学习的变量,q表示位于p周围的四个整数点的位置,G(q,p)为求p和q的插值,通过插值的方式求出偏移后的特征图。
步骤四、在步骤三后使用基于自注意力和通道注意力的横纵结合的注意力模块,如图5所示,来更好的优化传递密集连通交替更新模块提取的特征,其中横向注意力:
f(x)=Wfx
g(x)=Wgx
yi=γoi
其中x为输入的特征图,W为待训练的权重,f,g,h分别为横向注意力模块的三种特征提取方式,γ为横向注意力的重要程度,是一个可训练的变量,yi为横向注意力模块的输出。
纵向注意力为:
s=σ(W2δ(W1Z))
其中,Z为全局平均池化的特征,H,W为特征图的行列尺寸,U为输入纵向注意力的特征图,σ,δ为非线性函数,W为待训练的权重,s为纵向注意力模块的输出。
最终,横向注意力和纵向注意力进行融合:
Y=X+s*X+yi
其中,X为横纵向注意力模块的输入,Y为横纵向注意力模块的输出。
步骤五、将步骤二至步骤四中的模块循环三次,然后使用尺度转换特征金字塔模块来提高检测识别精度,在网络头部特征金字塔模块中使用尺度转换代替上采样,在不破坏特征的前提下进行不同分辨率特征之间的融合,同时大大减少了网络头部的计算量。
尺度转换特征金字塔模块,如图6所示:
其中I为特征图,LR为尺度转换之前,SR为尺度转换之后,r为转换的步长,x,y,c分别为列坐标,行坐标,深度坐标。
注:本发明中所有卷积都是采用的可变分段解耦卷积,能够解决从零训练的检测识别网络收敛慢的问题以及普通卷积难以分清类内差异和类间差异的问题,使用解耦卷积的幅度和角度,使用幅度度量类内差异,角度度量类间差异,直接学习幅度和角度从而代替进行拟合。
步骤六、获取训练图像,并对其进行尺度扩增和随机隐藏获得{In,n=1,2,...,N},如图7所示;
步骤七、模型训练的目标检测识别:使用{In,n=1,2,...,N}对基于注意力导向的交替更新密集连通从零训练网络进行训练以获得训练模型,使用训练好的模型对目标图像进行检测识别。
检测,识别和统计结果见图8,矩形框内为所识别的鱼类,并在矩形框上方进行了目标类别和置信度结果的显示,经验证检测识别结果与真实结果基本相同,即说明了本发明提供检测方法的可行性和高准确度。

Claims (7)

1.一种基于交替更新密集连通从零训练网络的目标检测方法,其特征在于,包括以下步骤:
(1)收集目标图像制作数据集,并进行标注;
(2)密集连通交替更新模块;
(3)有界可形变卷积模块;
(4)基于自注意力和通道注意力的横纵结合的注意力模块;
(5)尺度转换特征金字塔模块;
(6)可变分段解耦卷积;
(7)获取训练图像,得到数据集{In,n=1,2,...,N},得到训练模型;
(8)模型训练的目标检测识别:使用{In,n=1,2,...,N}以及训练模型对目标图像进行检测识别。
2.如权利要求1所述的目标检测方法,其特征在于,所述步骤(2)中的密集连通交替更新模块:
x表示特征图,k代表交替更新的次数,i代表某次交替更新中的第i层,W代表待训练的权重,*代表卷积操作,g代表非线性函数,m,l均为累加符号的索引。
3.如权利要求1所述的目标检测方法,其特征在于,所述步骤(3)中的有界可形变卷积模块:
x表示特征图,p表示特征图X的p0位置感受野偏移之后的位置,及p=p0+Δp,其中Δp为可学习的变量,q表示位于p周围的四个整数点的位置,G(q,p)为求p和q的插值,通过插值的方式求出偏移后的特征图。
4.如权利要求1所述的目标检测方法,其特征在于,所述步骤(4)中的基于自注意力和通道注意力的横纵结合的注意力模块,其中横向注意力:
f(x)=Wfx
g(x)=Wgx
yi=γoi
其中,x为输入的特征图,W为待训练的权重,f,g,h分别为横向注意力模块的三种特征提取方式,γ为横向注意力的重要程度,是一个可训练的变量,yi为横向注意力模块的输出;
纵向注意力为:
s=σ(W2δ(W1Z))
其中,Z为全局平均池化的特征,H,W为特征图的行列尺寸,U为输入纵向注意力的特征图,σ,δ为非线性函数,W为待训练的权重,s为纵向注意力模块的输出;
最终,横向注意力和纵向注意力进行融合:
Y=(X+yi)*(1+s)
其中,X为横纵向注意力模块的输入,Y为横纵向注意力模块的输出。
5.如权利要求1所述的目标检测方法,其特征在于,所述步骤(5)中的尺度转换特征金字塔模块:
其中I为特征图,LR为尺度转换之前,SR为尺度转换之后,r为转换的步长,x,y,c分别为列坐标,行坐标,深度坐标。
6.如权利要求1所述的目标检测方法,其特征在于,所述步骤(6)中的可变分段解耦卷积:
其中,x为输入的特征图,w为待训练权重,β,ρ为可训练变量,E为求期望值。
7.如权利要求1所述的目标检测方法,其特征在于,所述步骤(7)中的多尺度训练方法采用网络最终获得的特征图的尺寸7~10倍作为网络输入。
CN201810951609.5A 2018-08-21 2018-08-21 基于交替更新密集连通从零训练网络的目标检测方法 Pending CN109376576A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810951609.5A CN109376576A (zh) 2018-08-21 2018-08-21 基于交替更新密集连通从零训练网络的目标检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810951609.5A CN109376576A (zh) 2018-08-21 2018-08-21 基于交替更新密集连通从零训练网络的目标检测方法

Publications (1)

Publication Number Publication Date
CN109376576A true CN109376576A (zh) 2019-02-22

Family

ID=65403775

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810951609.5A Pending CN109376576A (zh) 2018-08-21 2018-08-21 基于交替更新密集连通从零训练网络的目标检测方法

Country Status (1)

Country Link
CN (1) CN109376576A (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110020658A (zh) * 2019-03-28 2019-07-16 大连理工大学 一种基于多任务深度学习的显著目标检测方法
CN110210571A (zh) * 2019-06-10 2019-09-06 腾讯科技(深圳)有限公司 图像识别方法、装置、计算机设备及计算机可读存储介质
CN110232316A (zh) * 2019-05-05 2019-09-13 杭州电子科技大学 一种基于改进的dsod模型的车辆检测与识别方法
CN110516670A (zh) * 2019-08-26 2019-11-29 广西师范大学 基于场景级与区域建议自注意模块的目标检测方法
CN110619369A (zh) * 2019-09-23 2019-12-27 常熟理工学院 基于特征金字塔与全局平均池化的细粒度图像分类方法
CN111027512A (zh) * 2019-12-24 2020-04-17 北方工业大学 一种遥感图像近岸船检测与定位方法及装置
CN111079604A (zh) * 2019-12-06 2020-04-28 重庆市地理信息和遥感应用中心(重庆市测绘产品质量检验测试中心) 面向大尺度遥感图像的微小目标快速检测方法
CN111144364A (zh) * 2019-12-31 2020-05-12 北京理工大学重庆创新中心 一种基于通道注意更新机制的孪生网络目标跟踪方法
CN111210443A (zh) * 2020-01-03 2020-05-29 吉林大学 基于嵌入平衡的可变形卷积混合任务级联语义分割方法
CN111582225A (zh) * 2020-05-19 2020-08-25 长沙理工大学 一种遥感图像场景分类方法及装置
CN111723829A (zh) * 2019-03-18 2020-09-29 四川大学 一种基于注意力掩模融合的全卷积目标检测方法
CN111738045A (zh) * 2020-01-19 2020-10-02 中国科学院上海微***与信息技术研究所 一种图像检测方法、装置、电子设备及存储介质
CN111860619A (zh) * 2020-07-02 2020-10-30 苏州富鑫林光电科技有限公司 一种工业检测用深度学习的ai智能模型
CN113239784A (zh) * 2021-05-11 2021-08-10 广西科学院 一种基于空间序列特征学习的行人重识别***及方法
CN113449756A (zh) * 2020-03-26 2021-09-28 太原理工大学 一种基于改进的DenseNet的多尺度图像识别方法和装置
CN117636078A (zh) * 2024-01-25 2024-03-01 华南理工大学 一种目标检测方法、***、计算机设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101241593A (zh) * 2007-02-06 2008-08-13 英特维数位科技股份有限公司 图层影像的影像处理装置及其方法
CN105447864A (zh) * 2015-11-20 2016-03-30 小米科技有限责任公司 图像的处理方法、装置及终端
US20160310043A1 (en) * 2015-04-26 2016-10-27 Endochoice, Inc. Endoscopic Polyp Measurement Tool and Method for Using the Same
CN108038872A (zh) * 2017-12-22 2018-05-15 中国海洋大学 一种基于动静态目标检测与实时压缩感知追踪研究方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101241593A (zh) * 2007-02-06 2008-08-13 英特维数位科技股份有限公司 图层影像的影像处理装置及其方法
US20160310043A1 (en) * 2015-04-26 2016-10-27 Endochoice, Inc. Endoscopic Polyp Measurement Tool and Method for Using the Same
CN105447864A (zh) * 2015-11-20 2016-03-30 小米科技有限责任公司 图像的处理方法、装置及终端
CN108038872A (zh) * 2017-12-22 2018-05-15 中国海洋大学 一种基于动静态目标检测与实时压缩感知追踪研究方法

Non-Patent Citations (8)

* Cited by examiner, † Cited by third party
Title
HAN ZHANG ET AL: ""Self-Attention Generative Adversarial Networks"", 《ARXIV》 *
JIE HU ET AL: ""Squeeze-and-Excitation Networks"", 《ARXIV》 *
JIFENG DAI ET AL: ""Deformable Convolutional Networks"", 《ARXIV》 *
PENG ZHOU ET AL: ""Scale-Transferrable Object Detection"", 《CVPR》 *
WEIYANG LIU ET AL: ""Decoupled Networks"", 《ARXIV》 *
YIBO YANG ET AL: ""Convolutional Neural Networks with Alternately Updated Clique"", 《ARXIV》 *
ZHIQIANG SHEN ET AL: "DSOD: Learning Deeply Supervised Object Detectors from Scratch", 《ARXIV》 *
赵欣欣等: ""基于卷积神经网络的铁路桥梁高强螺栓缺失图像识别方法"", 《中国铁道科学》 *

Cited By (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111723829B (zh) * 2019-03-18 2022-05-06 四川大学 一种基于注意力掩模融合的全卷积目标检测方法
CN111723829A (zh) * 2019-03-18 2020-09-29 四川大学 一种基于注意力掩模融合的全卷积目标检测方法
CN110020658A (zh) * 2019-03-28 2019-07-16 大连理工大学 一种基于多任务深度学习的显著目标检测方法
CN110232316A (zh) * 2019-05-05 2019-09-13 杭州电子科技大学 一种基于改进的dsod模型的车辆检测与识别方法
CN110210571A (zh) * 2019-06-10 2019-09-06 腾讯科技(深圳)有限公司 图像识别方法、装置、计算机设备及计算机可读存储介质
CN110348543A (zh) * 2019-06-10 2019-10-18 腾讯医疗健康(深圳)有限公司 眼底图像识别方法、装置、计算机设备及存储介质
CN110210571B (zh) * 2019-06-10 2023-01-06 腾讯医疗健康(深圳)有限公司 图像识别方法、装置、计算机设备及计算机可读存储介质
CN110348543B (zh) * 2019-06-10 2023-01-06 腾讯医疗健康(深圳)有限公司 眼底图像识别方法、装置、计算机设备及存储介质
CN110516670A (zh) * 2019-08-26 2019-11-29 广西师范大学 基于场景级与区域建议自注意模块的目标检测方法
CN110516670B (zh) * 2019-08-26 2022-04-22 广西师范大学 基于场景级与区域建议自注意模块的目标检测方法
CN110619369B (zh) * 2019-09-23 2020-12-11 常熟理工学院 基于特征金字塔与全局平均池化的细粒度图像分类方法
CN110619369A (zh) * 2019-09-23 2019-12-27 常熟理工学院 基于特征金字塔与全局平均池化的细粒度图像分类方法
CN111079604A (zh) * 2019-12-06 2020-04-28 重庆市地理信息和遥感应用中心(重庆市测绘产品质量检验测试中心) 面向大尺度遥感图像的微小目标快速检测方法
CN111027512A (zh) * 2019-12-24 2020-04-17 北方工业大学 一种遥感图像近岸船检测与定位方法及装置
CN111027512B (zh) * 2019-12-24 2023-04-18 北方工业大学 一种遥感图像近岸船检测与定位方法及装置
CN111144364B (zh) * 2019-12-31 2022-07-26 北京理工大学重庆创新中心 一种基于通道注意更新机制的孪生网络目标跟踪方法
CN111144364A (zh) * 2019-12-31 2020-05-12 北京理工大学重庆创新中心 一种基于通道注意更新机制的孪生网络目标跟踪方法
CN111210443A (zh) * 2020-01-03 2020-05-29 吉林大学 基于嵌入平衡的可变形卷积混合任务级联语义分割方法
CN111210443B (zh) * 2020-01-03 2022-09-13 吉林大学 基于嵌入平衡的可变形卷积混合任务级联语义分割方法
CN111738045A (zh) * 2020-01-19 2020-10-02 中国科学院上海微***与信息技术研究所 一种图像检测方法、装置、电子设备及存储介质
CN111738045B (zh) * 2020-01-19 2024-04-19 中国科学院上海微***与信息技术研究所 一种图像检测方法、装置、电子设备及存储介质
CN113449756A (zh) * 2020-03-26 2021-09-28 太原理工大学 一种基于改进的DenseNet的多尺度图像识别方法和装置
CN113449756B (zh) * 2020-03-26 2022-08-16 太原理工大学 一种基于改进的DenseNet的多尺度图像识别方法和装置
CN111582225A (zh) * 2020-05-19 2020-08-25 长沙理工大学 一种遥感图像场景分类方法及装置
CN111582225B (zh) * 2020-05-19 2023-06-20 长沙理工大学 一种遥感图像场景分类方法及装置
CN111860619A (zh) * 2020-07-02 2020-10-30 苏州富鑫林光电科技有限公司 一种工业检测用深度学习的ai智能模型
CN113239784A (zh) * 2021-05-11 2021-08-10 广西科学院 一种基于空间序列特征学习的行人重识别***及方法
CN117636078A (zh) * 2024-01-25 2024-03-01 华南理工大学 一种目标检测方法、***、计算机设备及存储介质
CN117636078B (zh) * 2024-01-25 2024-04-19 华南理工大学 一种目标检测方法、***、计算机设备及存储介质

Similar Documents

Publication Publication Date Title
CN109376576A (zh) 基于交替更新密集连通从零训练网络的目标检测方法
Jia et al. Detection and segmentation of overlapped fruits based on optimized mask R-CNN application in apple harvesting robot
CN109299274A (zh) 一种基于全卷积神经网络的自然场景文本检测方法
CN108805070A (zh) 一种基于嵌入式终端的深度学习行人检测方法
Huang et al. Development and validation of a deep learning algorithm for the recognition of plant disease
CN108509976A (zh) 动物的识别装置和方法
CN109117877A (zh) 一种基于深度卷积生成对抗网络的黄颡鱼及其套养种识别方法
Li et al. Semisupervised semantic segmentation of remote sensing images with consistency self-training
CN110334656A (zh) 基于信源概率加权的多源遥感图像水体提取方法及装置
CN109840483A (zh) 一种滑坡裂缝检测与识别的方法及装置
Liu et al. Two-stage underwater object detection network using swin transformer
Zhang et al. Adaptive anchor networks for multi-scale object detection in remote sensing images
Liu et al. Density-aware and background-aware network for crowd counting via multi-task learning
Wang et al. Accurate real-time ship target detection using Yolov4
CN114882344A (zh) 基于半监督和注意力机制的少样本水下鱼体跟踪方法
Peng et al. An adaptive coarse-fine semantic segmentation method for the attachment recognition on marine current turbines
Wang et al. TBC-YOLOv7: a refined YOLOv7-based algorithm for tea bud grading detection
Sun et al. Prediction model for the number of crucian carp hypoxia based on the fusion of fish behavior and water environment factors
Jia et al. Polar-Net: Green fruit instance segmentation in complex orchard environment
CN117372854A (zh) 一种大坝深水结构隐患病害实时检测方法
CN108230322A (zh) 一种基于弱样本标记的眼底特征检测装置
Zhao et al. Ocean ship detection and recognition algorithm based on aerial image
CN116758421A (zh) 一种基于弱监督学习的遥感图像有向目标检测方法
Liu et al. Jellyfish recognition and density calculation based on image processing and deep learning
Zhang et al. An underwater fish individual recognition method based on improved YoloV4 and FaceNet

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190222