CN110188635B - 一种基于注意力机制和多层次卷积特征的植物病虫害识别方法 - Google Patents

一种基于注意力机制和多层次卷积特征的植物病虫害识别方法 Download PDF

Info

Publication number
CN110188635B
CN110188635B CN201910404278.8A CN201910404278A CN110188635B CN 110188635 B CN110188635 B CN 110188635B CN 201910404278 A CN201910404278 A CN 201910404278A CN 110188635 B CN110188635 B CN 110188635B
Authority
CN
China
Prior art keywords
plant
insect
plant disease
network model
insect pest
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910404278.8A
Other languages
English (en)
Other versions
CN110188635A (zh
Inventor
程明明
杨巨峰
伍小平
展翅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nankai University
Original Assignee
Nankai University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nankai University filed Critical Nankai University
Priority to CN201910404278.8A priority Critical patent/CN110188635B/zh
Publication of CN110188635A publication Critical patent/CN110188635A/zh
Application granted granted Critical
Publication of CN110188635B publication Critical patent/CN110188635B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • G06F18/24137Distances to cluster centroïds
    • G06F18/2414Smoothing the distance, e.g. radial basis function networks [RBFN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Catching Or Destruction (AREA)

Abstract

一种基于注意力机制和多层次卷积特征的植物病虫害识别方法。该方法的目的是结合注意力机制和多层次卷积特征进行自然场景下的植物病虫害图像分类,其关键是解决了自然场景图像中大面积的复杂背景对植物病虫害识别的干扰问题,并充分地利用了网络模型中所有的卷积层特征。该方法设计了一种包含注意力机制的深度卷积神经网络,利用注意力机制生成图像中覆盖了目标空间位置的局部位置区域掩码,用于减弱自然场景图像下的复杂背景干扰信息,并结合多层次卷积特征,充分利用语义信息和细节信息,对植物病虫害进行更具有区分性的特征表示。最终将得到的模型用于自然场景下的植物病虫害图像分类,得到的局部区域掩码用于获取植物病虫害的位置信息。

Description

一种基于注意力机制和多层次卷积特征的植物病虫害识别 方法
技术领域
本发明属于图像处理技术领域,涉及到一种自然场景植物病虫害图像识别方法,更具体地,涉及一种基于注意力机制和多层次卷积特征的植物病虫害识别方法。
背景技术
植物病虫害是危害商业农产品的主要原因之一。植物病虫害识别对农业植物病虫害预测、粮食安全和农业经济的稳定起着至关重要的作用。由于植物病虫害种类繁多,种类之间存在细微差别,因此植物病虫害的识别很大程度上依赖于农业专家的专业知识,这意味着成本高昂,耗时耗力。随着机器学习和计算机视觉技术的发展,植物病虫害的自动识别越来越受到研究人员的关注。
以往的植物病虫害识别工作大多采用传统的机器学习分类框架来描述,该分类框架由两个模块组成:1)植物病虫害图像的特征表示:采用颜色直方图和尺度空间不变性等一系列手工制作的特征来表示整个图像。2)机器学习分类器包括支持向量机和k近邻分类器。Samanta等2012年在International Journal of Computer Engineering Science(2(6):336)发表的论文“Tea insect pests classification based on artificial neuralnetworks”利用基于相关性的特征选择和人工神经网络,基于609个样本的数据集,对8种茶叶害虫进行诊断。Manoja等2014年在International Journal of Electrical andElectronics Research(2(4):187:194)发表的论文“Early detection of pest onleaves using support vector machine”利用支持向量机分类器对叶片图像中的白蝇、蚜虫和蓟马进行了分类。然而,现实生活中害虫种类繁多,设计识别多种害虫的特征提取器不仅效率低,而且费时。此外,手工制作的特性缺乏高级语义信息的表示能力,并且依赖于对特性的仔细选择,如果从害虫图像中提取不完整或错误的特征,后续的分类器将很难区分处于自然场景复杂背景下的害虫种类。
近年来,深度学习使得特征学习变得更加鲁棒,在各种图像分类任务中都取得了最先进的性能。也有几项工作成功地应用了神经网络来解决害虫识别问题。如Liu等2016年在Scientific Reports(6:20410)发表的论文“Localization and classification ofpaddy field pests using a saliency map and deep convolutional neural network”中通过训练深度卷积神经网络对稻田害虫进行分类。但这些方法所验证的数据集中现有的害虫图像大多是在受控的实验室环境下采集的,而实际应用中植物病虫害大多都是出现在自然场景下,通常有着复杂的背景信息,这对植物病虫害识别方法能否减弱自然场景图像中复杂背景信息干扰的能力提出了要求,也是深度学习技术应用到植物病虫害识别任务上的一大难点。
注意机制已应用于各种计算机视觉问题中,早期的研究利用循环神经网络架构进行注意力建模,这些基于循环神经网络的注意模型通过从图像中顺序选择注意区域,然后学***均池化和一个全连接神经网络,在卷积特征上生成一个权重分布。Mnih等2014年在Advances in neural information processing systems(2204-2212)发表的“Recurrent models of visual attention”中提出了一种基于循环注意力模型来学习杂乱数字分类任务的注视策略,该模型可以将高分辨率的注意力集中到最具识别能力的区域,而不需要边界框或部件位置。
上述领域的一些最新成果激发了我们的灵感,也为我们开发基于注意力机制和多层次卷积特征的植物病虫害识别方法提供了坚实的技术基础。
发明内容
本发明需要解决的技术问题是用户输入一张任意尺寸的植物病虫害图像,网络模型可以预测植物病虫害所属的类别,以及输出植物病虫害在图像中的位置掩码信息。
本发明的技术方案:
一种基于注意力机制和多层次卷积特征的植物病虫害识别方法,包括以下步骤:
a.用户输入一张任意尺寸的植物病虫害图像到深度卷积神经网络中,网络模型进行计算并提取每一层的卷积特征;
所述网络模型在卷积层之后包含两个分支,第一个分支为注意力机制分支,包含一个全连接层,用于学习一个权重分布,通过设定权重的阈值获得植物病虫害的局部位置区域掩码;第二个分支为用于植物病虫害分类的分支;
b.在所述网络模型的最后一层卷积特征图后加上注意力机制分支,通过一个全连接层并计算分类损失和梯度,在特征图上生成权重分布,代表网络模型对植物病虫害目标所在局部区域的关注度,通过预先设置的权重阈值,获得图像中植物病虫害的局部位置区域掩码,并作为屏蔽自然场景图像中的复杂背景信息的依据;
c.将步骤a网络模型提取出的每一层卷积特征分别通过平均池化操作,得到尺寸相同的卷积特征,以串联的方式在通道上将所述卷积特征进行连接,充分利用网络模型高层的语义信息和中底层的细节信息,实现多层次卷积特征的结合;
d.所述网络模型在多层次卷积特征的通道上与步骤b得到的植物病虫害的局部位置区域掩码逐元素相乘,使得网络注意到含有植物病虫害的局部区域,从而减弱了自然场景下图像中的复杂背景对植物病虫害识别的干扰;然后对局部特征进行抽取并进行全局平均池化操作获得植物病虫害的特征表示,通过网络模型的植物病虫害分类分支进行植物病虫害类别的预测,结合语义信息和细节信息对植物病虫害进行更充分的特征表示,同时植物病虫害的局部区域掩码可以反映其所在图像中的空间位置信息;
e.结合网络模型注意力分支的预测结果来辅助植物病虫害分类分支,以真实的植物病虫害类别作为监督信息分别计算模型的注意力机制分支和植物病虫害分类分支的损失,然后取平均作为模型的总损失,通过小批次随机梯度下降方法优化整个网络模型直到收敛。
在实际应用中使用训练达到收敛的网络模型对植物病虫害图像进行预测,模型输出最终的分类识别结果。
本发明的优点和有益效果为:本发明能够简单地迁移到类似的物体识别应用中,并且在网络模型的训练过程中只需要提供图像中物体的类别标签。注意力机制分支在不需要物体坐标的监督信息的情况下就可以实现对图像中物***置的检测,在实际应用中有效地减少了自然场景图像中大量背景信息的干扰。另外本方法使用了网络模型中所有的卷积层特征,充分利用了模型高层的语义信息和中底层的细节信息,能够对植物病虫害进行更有区分性的特征表示。总的来说,本发明为快速且准确地识别植物病虫害提供了一个全新的解决方案,相信可以很好地应用在其他的很多计算机视觉相关任务中。
附图说明
图1为基于注意力机制和多层次卷积特征的植物病虫害识别方法的架构图。
图2为基于注意力机制和多层次卷积特征的植物病虫害识别方法的流程图。
图3为基于注意力机制和多层次卷积特征的植物病虫害识别方法的效果图。
具体实施方式
本发明设计了一种新的深度卷积神经网络架构,即在深度卷积神经网络模型的卷积层之后包含两个分支,第一个分支为注意力机制分支,第二个分支为用于植物病虫害分类的分支。通过注意力机制分支生成植物病虫害局部位置区域的掩码,并与多层次卷积特征相结合,实现了自然场景复杂背景下的植物病虫害识别。下面结合附图,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
参照图1所示的本发明的深度卷积神经网络架构,下面对其实施过程详细叙述:
首先本发明所设计的神经网络模型需要一个训练样本集进行模型参数的学***均损失趋近1E-2级别时达到收敛即停止训练,最终得到可用于植物病虫害分类的深度卷积神经网络模型。
本发明的主体架构可以是任何深度神经网络模型,例如常见的AlexNet、VGGNet等,如图1所示,本发明使用的是He Kaiming等2016在CVPR(770-778)发表的“Deepresidual learning for image recognition”文章中提到的ResNet-50模型,并在这个基础架构上进一步改进,即设计了两个分支模块:注意力机制分支和植物病虫害分类分支模块,通过感知植物病虫害的物理空间位置以及应用到了网络模型所有层的卷积特征并进行多层次特征的抽取和融合,使得对植物病虫害的识别更加高效和精准。
第一个分支模块为注意力机制,其结构本质上是一个分类过程,在主体网络架构的最后一个尺寸为7x7的卷积层后加上一个全局平均池化层,将最后一个卷积层的卷积特征图池化成一个2048维的特征向量,具体维数视主体网络的选择可以有所变动(例如VGGNet网络为4096维),然后将该特征向量通过一个全连接层映射到植物病虫害的具体类别,将此全连接层的参数作为权重对来自主体网络最后一个卷积层的卷积特征图进行加权平均,将得到的取值范围为[0,1]的权重分布通过阈值(0.4)得到植物病虫害的局部位置区域掩码,即大于阈值的区域为包含植物病虫害前景,否则为背景,最终该掩码能反映植物病虫害在图中的位置信息,掩码的尺寸为7x7;
第二个分支首先进行多层次卷积特征的融合,ResNet-50网络包含4个残差块逐步进行卷积特征的提取,其中越靠后的残差块提取出的卷积特征包含的细节信息越丰富,反之包含更多的语义信息。但这4个残差块所提取的卷积特征的尺寸不同,分别为:56x56、28x28、14x14、7x7,因此使这4个卷积特征分别通过步长为:8、4、2、1的平均池化层,从而得到4个尺寸均为7x7的卷积特征,然后在通道上对这4个卷积特征进行串联,并与局部位置区域掩码逐元素相乘,获得局部多层次卷积特征,再通过一个全局平均池化层得到用于描述植物病虫害特征的2048维特征向量,该特征向量通过一个全连接层预测植物病虫害的类别。
参照图2本发明的方法流程图和图3具体效果图:
在用户实际使用本发明进行植物病虫害图像的识别时,首先如图3第一行(a)所示,输入一张含有青蛾蜡蝉的植物病虫害图像到ResNet-50网络中,图像通过ResNet-50网络的4个残差块逐步进行卷积特征的提取。
将网络的最后一个卷积层所提取出的尺寸为7x7的卷积特征送入到注意力机制分支,生成特征图上的权重分布,如图3(b)所示,注意力机制分支在原图(a)上感知到存在目标的局部区域,越亮的区域表示存在植物病虫害的可能性越大。通过以0.1为间隔尝试[0,1]区间不同的权重阈值,最终在权重阈值为0.4时生成图3(c)植物病虫害局部位置区域的掩码,此时掩码对植物病虫害的覆盖区域大小最合适,掩码的尺寸为7x7。
同时将图像依次通过4个残差块所提取的多层次卷积特征进行融合,经过不同步长的平均池化层,得到4个尺寸均为7x7的卷积特征,在通道上对这4个相同尺寸的卷积特征进行串联,从而得到同时包含了丰富的细节信息和语义信息的多层次卷积特征。将上述注意力机制生成的局部区域位置掩码与多层次卷积特征进行逐元素相乘,生成局部多层次卷积特征,此时多层次卷积特征所覆盖的图像区域如图3(d)所示,仅包含了植物病虫害的局部位置,从而有效地屏蔽了复杂的背景信息。
局部多层次卷积特征通过全局平均池化得到2048维的特征向量并通过一个softmax分类器,如图3(e)所示,最终分类器识别出输入的植物病虫害图像为青蛾蜡蝉。
附图3中的第二行和第三行同样为基于注意力机制和多层次卷积特征的植物病虫害识别方法的识别实例。分别表示不同的植物病虫害图像输入,与第一行相同,注意力机制在原图(a)上感知存在目标的局部区域(b),通过提前设定的阈值获得虫害的局部位置区域掩码(c),其中颜色越浅代表该区域存在目标的可能性越大,模型通过局部位置区域掩码屏蔽掉复杂的背景信息,从而只关注局部前景区域(d),产生更精确的识别结果(e),证明了本发明应用到不同的实例时都能保持有效性。

Claims (3)

1.一种基于注意力机制和多层次卷积特征的植物病虫害识别方法,其特征在于,该方法包含如下步骤:
a.用户输入一张任意尺寸的植物病虫害图像到深度卷积神经网络模型中,网络模型进行计算并提取每一层的卷积特征;
b.在所述网络模型的最后一层卷积特征图后加上注意力机制分支,通过一个全连接层并计算分类损失和梯度,在特征图上生成权重分布,代表网络模型对植物病虫害目标所在局部区域的关注度,通过预先设置的权重阈值,获得图像中植物病虫害的局部位置区域掩码,并作为屏蔽自然场景图像中的复杂背景信息的依据;
c.将步骤a网络模型提取出的每一层卷积特征分别通过平均池化操作,得到尺寸相同的卷积特征,以串联的方式在通道上将所述卷积特征进行连接,充分利用网络模型高层的语义信息和中底层的细节信息,实现多层次卷积特征的结合;
d.所述网络模型在多层次卷积特征的通道上与步骤b得到的植物病虫害的局部位置区域掩码逐元素相乘,使得网络注意到含有植物病虫害的局部区域,从而减弱了自然场景下图像中的复杂背景对植物病虫害识别的干扰;然后对局部特征进行抽取并进行全局平均池化操作获得植物病虫害的特征表示,通过网络模型的植物病虫害分类分支进行植物病虫害类别的预测,结合语义信息和细节信息对植物病虫害进行更充分的特征表示,同时植物病虫害的局部区域掩码能够反映其所在图像中的空间位置信息;
e.结合网络模型注意力分支的预测结果来辅助植物病虫害分类分支,以真实的植物病虫害类别作为监督信息分别计算模型的注意力机制分支和植物病虫害分类分支的损失,然后取平均作为模型的总损失,通过小批次随机梯度下降方法优化整个网络模型直到收敛;
在实际应用中使用训练达到收敛的网络模型对植物病虫害图像进行预测,模型输出最终的分类识别结果。
2.根据权利要求1所述的基于注意力机制和多层次卷积特征的植物病虫害识别方法,其特征在于:步骤a中所述的网络模型在卷积层之后包含两个分支,第一个分支为注意力机制分支,包含一个全连接层,用于学***均池化获得特征向量,最后使用一个新的全连接层映射为各个植物病虫害类别。
3.根据权利要求1所述的基于注意力机制和多层次卷积特征的植物病虫害识别方法,其特征在于:步骤d中,所述网络模型在多层次卷积特征的各个通道上与步骤b得到的植物病虫害的局部位置区域掩码逐元素相乘,获得屏蔽了背景信息的局部多层次卷积特征,将局部特征抽取出来并进行平均池化操作获得植物病虫害的特征表示,通过全连接层将特征映射为植物病虫害每一类的预测结果,并经过softmax层获得预测概率。
CN201910404278.8A 2019-05-16 2019-05-16 一种基于注意力机制和多层次卷积特征的植物病虫害识别方法 Active CN110188635B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910404278.8A CN110188635B (zh) 2019-05-16 2019-05-16 一种基于注意力机制和多层次卷积特征的植物病虫害识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910404278.8A CN110188635B (zh) 2019-05-16 2019-05-16 一种基于注意力机制和多层次卷积特征的植物病虫害识别方法

Publications (2)

Publication Number Publication Date
CN110188635A CN110188635A (zh) 2019-08-30
CN110188635B true CN110188635B (zh) 2021-04-30

Family

ID=67716262

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910404278.8A Active CN110188635B (zh) 2019-05-16 2019-05-16 一种基于注意力机制和多层次卷积特征的植物病虫害识别方法

Country Status (1)

Country Link
CN (1) CN110188635B (zh)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110515130B (zh) * 2019-09-03 2021-08-06 河南工业大学 一种基于信道状态信息的储粮害虫检测方法及装置
CN110648311B (zh) * 2019-09-03 2023-04-18 南开大学 一种基于多任务学习的痤疮图像病灶分割与计数网络模型
CN111881705B (zh) * 2019-09-29 2023-12-12 深圳数字生命研究院 数据处理、训练、识别方法、装置和存储介质
CN114829882B (zh) * 2019-11-05 2023-02-28 阿比尔技术公司 植物产品中感染的预测
CN111027597B (zh) * 2019-11-22 2023-07-21 江苏农林职业技术学院 一种草莓病虫害快速分类方法及装置
CN110689093B (zh) * 2019-12-10 2020-04-21 北京同方软件有限公司 一种复杂场景下的图像目标精细分类方法
CN111046793B (zh) * 2019-12-11 2023-05-02 北京工业大学 基于深度卷积神经网络的番茄病害识别方法
CN111104898B (zh) * 2019-12-18 2022-03-25 武汉大学 基于目标语义和注意力机制的图像场景分类方法及装置
CN113096023B (zh) * 2020-01-08 2023-10-27 字节跳动有限公司 神经网络的训练方法、图像处理方法及装置、存储介质
CN111429447A (zh) * 2020-04-03 2020-07-17 深圳前海微众银行股份有限公司 病灶区域检测方法、装置、设备及存储介质
CN112464971A (zh) * 2020-04-09 2021-03-09 丰疆智能软件科技(南京)有限公司 害虫检测模型构建方法
CN111626969B (zh) * 2020-05-22 2023-05-30 张卫东 一种基于注意力机制的玉米病害图像处理方法
CN111985552B (zh) * 2020-08-17 2022-07-29 中国民航大学 复杂背景下机场道面细带状结构病害检测方法
CN111914951A (zh) * 2020-08-21 2020-11-10 安徽省农业科学院农业经济与信息研究所 一种基于图像实时识别的农作物害虫智能诊断***及方法
CN112232343B (zh) * 2020-09-03 2023-11-21 国家粮食和物资储备局科学研究院 一种粮食霉变粒识别神经网络和识别方法
CN112101265B (zh) * 2020-09-22 2023-04-25 四川大学 一种鲁棒的作物病害诊断***
CN112001365A (zh) * 2020-09-22 2020-11-27 四川大学 一种高精度的农作物病虫害识别方法
CN112149682B (zh) * 2020-09-29 2023-08-15 青海大学 基于深度学习的悬钩子植物自动识别方法、存储介质和装置
CN112241762B (zh) * 2020-10-19 2022-07-01 吉林大学 一种用于病虫害图像分类的细粒度识别方法
CN112465038A (zh) * 2020-11-30 2021-03-09 深圳市识农智能科技有限公司 一种识别果树病虫害种类的方法及***
CN112668404B (zh) * 2020-12-10 2022-08-30 哈尔滨师范大学 一种大豆病虫害的有效鉴定方法
CN112841154A (zh) * 2020-12-29 2021-05-28 长沙湘丰智能装备股份有限公司 一种基于人工智能的病虫害防治***
CN116738296B (zh) * 2023-08-14 2024-04-02 大有期货有限公司 机房状况综合智能监控***

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108647684A (zh) * 2018-05-02 2018-10-12 深圳市唯特视科技有限公司 一种基于引导注意力推理网络的弱监督语义分割方法
CN108961350A (zh) * 2018-07-17 2018-12-07 北京工业大学 一种基于显著度匹配的画风迁移方法
CN109271878A (zh) * 2018-08-24 2019-01-25 北京地平线机器人技术研发有限公司 图像识别方法、图像识别装置和电子设备
CN109447115A (zh) * 2018-09-25 2019-03-08 天津大学 基于多层语义监督式注意力模型的细粒度零样本分类方法
CN109446923A (zh) * 2018-10-10 2019-03-08 北京理工大学 基于训练特征融合的深度监督卷积神经网络行为识别方法
CN109508663A (zh) * 2018-10-31 2019-03-22 上海交通大学 一种基于多层次监督网络的行人重识别方法
CN109753959A (zh) * 2018-12-21 2019-05-14 西北工业大学 基于自适应多尺度特征融合的路面交通标志检测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10679085B2 (en) * 2017-10-31 2020-06-09 University Of Florida Research Foundation, Incorporated Apparatus and method for detecting scene text in an image

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108647684A (zh) * 2018-05-02 2018-10-12 深圳市唯特视科技有限公司 一种基于引导注意力推理网络的弱监督语义分割方法
CN108961350A (zh) * 2018-07-17 2018-12-07 北京工业大学 一种基于显著度匹配的画风迁移方法
CN109271878A (zh) * 2018-08-24 2019-01-25 北京地平线机器人技术研发有限公司 图像识别方法、图像识别装置和电子设备
CN109447115A (zh) * 2018-09-25 2019-03-08 天津大学 基于多层语义监督式注意力模型的细粒度零样本分类方法
CN109446923A (zh) * 2018-10-10 2019-03-08 北京理工大学 基于训练特征融合的深度监督卷积神经网络行为识别方法
CN109508663A (zh) * 2018-10-31 2019-03-22 上海交通大学 一种基于多层次监督网络的行人重识别方法
CN109753959A (zh) * 2018-12-21 2019-05-14 西北工业大学 基于自适应多尺度特征融合的路面交通标志检测方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
Fine-Grained Recognition of Vegetable Images Based on Multi-scale Convolution Neural Network;Xiu-Hong Yang et al.;《International Conference on Intelligent Computing》;20180706;第67-76页 *
HashGAN:Attention-aware Deep Adversarial Hashing for Cross Modal Retrieval;Xi Zhang et al.;《arXiv》;20171126;第1-10页 *
Recurrent Models of Visual Attention;Volodymyr Mnih et al.;《arXiv》;20140624;第1-12页 *
Residual Attention Network for Image Classfication;Fei Wang et al.;《2017 IEEE Conference on Computer Vision and Pattern Recognition》;20171109;第6450-6456页 *
基于多注意力多尺度特征融合的图像描述生成算法;陈龙杰 等;《计算机应用》;20180928;第1-8页 *

Also Published As

Publication number Publication date
CN110188635A (zh) 2019-08-30

Similar Documents

Publication Publication Date Title
CN110188635B (zh) 一种基于注意力机制和多层次卷积特征的植物病虫害识别方法
WO2021043193A1 (zh) 神经网络结构的搜索方法、图像处理方法和装置
Chiang et al. Deep learning-based automated forest health diagnosis from aerial images
US8379994B2 (en) Digital image analysis utilizing multiple human labels
CN112541508A (zh) 果实分割识别方法及***、果实采摘机器人
CN114821014B (zh) 基于多模态与对抗学习的多任务目标检测识别方法及装置
CN109117879A (zh) 图像分类方法、装置及***
CN109002755B (zh) 基于人脸图像的年龄估计模型构建方法及估计方法
Bueno et al. Hierarchical object detection with deep reinforcement learning
CN110633708A (zh) 一种基于全局模型和局部优化的深度网络显著性检测方法
CN110619059B (zh) 一种基于迁移学习的建筑物标定方法
CN111291809A (zh) 一种处理装置、方法及存储介质
CN113159067A (zh) 一种基于多粒度局部特征软关联聚合的细粒度图像辨识方法及装置
CN114387499A (zh) 一种海岛滨海湿地水鸟识别方法、分布查询***及介质
Yasir et al. Two-handed hand gesture recognition for Bangla sign language using LDA and ANN
Su et al. LodgeNet: Improved rice lodging recognition using semantic segmentation of UAV high-resolution remote sensing images
CN114998220A (zh) 一种基于改进的Tiny-YOLO v4自然环境下舌像检测定位方法
CN111709468B (zh) 一种定向人工智能的训练方法、装置及存储介质
Wei et al. Traffic sign detection and recognition using novel center-point estimation and local features
CN111352926B (zh) 数据处理的方法、装置、设备及可读存储介质
Pratiwi et al. Early detection of deforestation through satellite land geospatial images based on CNN architecture
CN113128308A (zh) 一种港口场景下的行人检测方法、装置、设备及介质
Ouadiay et al. Simultaneous object detection and localization using convolutional neural networks
Singhi et al. Integrated YOLOv4 deep learning pretrained model for accurate estimation of wheat rust disease severity
CN116612386A (zh) 基于分级检测双任务模型的辣椒病虫害识别方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant