CN113269182A - 一种基于变体transformer对小区域敏感的目标果实检测方法及*** - Google Patents
一种基于变体transformer对小区域敏感的目标果实检测方法及*** Download PDFInfo
- Publication number
- CN113269182A CN113269182A CN202110431533.5A CN202110431533A CN113269182A CN 113269182 A CN113269182 A CN 113269182A CN 202110431533 A CN202110431533 A CN 202110431533A CN 113269182 A CN113269182 A CN 113269182A
- Authority
- CN
- China
- Prior art keywords
- image
- target fruit
- target
- network model
- loss function
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 235000013399 edible fruits Nutrition 0.000 title claims abstract description 93
- 238000001514 detection method Methods 0.000 title claims abstract description 46
- 230000035945 sensitivity Effects 0.000 title abstract description 7
- 238000000034 method Methods 0.000 claims abstract description 45
- 238000012549 training Methods 0.000 claims abstract description 30
- 238000013528 artificial neural network Methods 0.000 claims abstract description 18
- 230000008569 process Effects 0.000 claims abstract description 18
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 15
- 238000007781 pre-processing Methods 0.000 claims abstract description 14
- 238000012795 verification Methods 0.000 claims abstract description 14
- 230000006870 function Effects 0.000 claims description 49
- 238000004590 computer program Methods 0.000 claims description 14
- 238000003860 storage Methods 0.000 claims description 11
- 238000010276 construction Methods 0.000 claims description 5
- 238000013507 mapping Methods 0.000 claims description 5
- 230000004913 activation Effects 0.000 claims description 4
- 238000005286 illumination Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 11
- 238000012545 processing Methods 0.000 description 11
- 238000013135 deep learning Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000000873 masking effect Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 230000011514 reflex Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000003337 fertilizer Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 239000002420 orchard Substances 0.000 description 1
- 239000000575 pesticide Substances 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种基于变体transformer对小区域敏感的目标果实检测方法及***。该方法,包括:获取待测的目标果实图像;利用训练后的网络模型,依据待测的目标果实图像,得到目标果实检测结果;其中,网络模型包括:深度卷积神经网络、transformer编码器‑解码器以及前馈神经网络;所述网络模型训练的过程包括:采集目标果实图像,并对目标果实图像进行预处理,获得图像训练集和图像验证集;构建网络模型,利用图像训练集、图像验证集以及目标损失函数,对网络模型进行训练,基于检测结果修改模型参数,直至损失函数的数值小于设定的阈值,获得最优的网络模型。
Description
技术领域
本发明属于果实采摘机器人视觉***、产量预估等智能化农业应用领域,尤其涉及一种基于变体transformer对小区域敏感的目标果实检测方法及***。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
在实际生产生活之中,对果实进行产量预测是十分的必要的,对于接下来果实生长过程中,农药与化肥等农产品的使用量规划有必要的参考作用,可优化使用结构,较少成本。正因为如此,对较小果实检测就显得十分的重要。在进行果实检测时,对于目标物检测的准确程度十分关键,在这个领域之中有着众多的学者时刻关注着,并且出现了越来越多的研究成果。
近年来,该领域已积累了一定的研究基础,大多沿用机器学习与深度学习两个方向。其中,基于机器学习的识别方法通常伴随预处理、特征选择等操作,不能实现端到端的检测流程,且识别效果容易受到自然环境下各种干扰的影响。基于深度学习的识别方法,虽然在精度上有了显著提升,且能够实现端到端的检测流程,但由于卷积等操作以及模型对锚框的依赖,导致其需要耗费大量的计算与存储资源,识别速度尚达不到实时性要求。因此,本发明在保证精度的前提之下,利用变体transformer的并行计算特性,提升速度,减少训练时间,优化精度与速度,很好的适应果实产量预测等农业需求。
发明内容
为了解决上述背景技术中存在的技术问题,本发明提供一种基于变体transformer对小区域敏感的目标果实检测方法及***,其能够在产量预测时,对小区域的果实进行准确的检测,具有精度高、速度快,较好的满足果实产量预测等农业需求的效果。
为了实现上述目的,本发明采用如下技术方案:
本发明的第一个方面提供一种基于变体transformer对小区域敏感的目标果实检测方法。
一种基于变体transformer对小区域敏感的目标果实检测方法,包括:
获取待测的目标果实图像;
利用训练后的网络模型,依据待测的目标果实图像,得到目标果实检测结果;其中,网络模型包括:深度卷积神经网络、transformer编码器-解码器以及前馈神经网络;
所述网络模型训练的过程包括:
采集目标果实图像,并对目标果实图像进行预处理,获得图像训练集和图像验证集;
构建网络模型,利用图像训练集、图像验证集以及目标损失函数,对网络模型进行训练,基于检测结果修改模型参数,直至损失函数的数值小于设定的阈值,获得最优的网络模型。
进一步的,采集目标果实图像包括:采集不同光照、不同时间段、不同角度下的目标果实图像,并对目标果实图像进行分类。
进一步的,预处理的过程包括:对原始目标果实图像的旋转、折叠、形变,或者在原始图像中加入噪声,达到扩充样本的目的。
进一步的,预处理的过程包括:标注目标果实图像中的果实。
进一步的,检测过程包括:待测的目标果实图像经深度卷积神经网络提取第一特征后,将第一特征输入transformer编码器,第一特征经多尺度变形注意力网络和尺度级嵌入,得到第一特征对应的编码形式,然后经transformer解码器解码后,最后在前馈神经网络中经过两次线性映射,得到目标果实检测结果。
进一步的,前馈神经网络包括:ReLU激活函数和隐藏维数为d的三层感知器和一个线性投影层。
进一步的,所述目标损失函数为边界框损失函数,所述的边界框损失函数构建包括:基于L1损失函数和GLOU损失函数构建边界框损失函数。
本发明的第二个方面提供一种基于变体transformer对小区域敏感的目标果实检测***。
一种基于变体transformer对小区域敏感的目标果实检测***,包括:
采集和预处理模块,其被配置为:采集目标果实图像,并对目标果实图像进行预处理,获得图像训练集和图像验证集;
网络构建模块,其被配置为:构建网络模型,利用图像训练集、图像验证集以及目标损失函数,对网络模型进行训练,基于检测结果修改模型参数,直至损失函数的数值小于设定的阈值,获得最优的网络模型;
检测模块,其被配置为:利用训练后的网络模型,依据待测的目标果实图像,得到目标果实检测结果;其中,网络模型包括:深度卷积神经网络、transformer编码器-解码器以及前馈神经网络。
本发明的第三个方面提供一种计算机可读存储介质。
一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述第一个方面所述的基于变体transformer对小区域敏感的目标果实检测方法中的步骤。
本发明的第四个方面提供一种计算机设备。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述第一个方面所述的基于变体transformer对小区域敏感的目标果实检测方法中的步骤。
与现有技术相比,本发明的有益效果是:
(1)本发明使用变体transformer编码器-解码器模型,可并行处理,提高目标检测速度,对小区域目标敏感。且方法稳定,速度快,精度较高,可以很好的满足果实产量预测等农业需求。
(2)本发明使用处理数据集扩充样本空间,很好的适应小样本数据集,泛化能力强,可以应用到各种果实采摘或预产的机器人视觉***中。
本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1是本发明基于变体transformer对小区域敏感的目标果实检测方法流程图;
图2本发明变体transformer编码器-解码器的网络结构图;
图3本发明前馈神经网络结构图。
具体实施方式
下面结合附图与实施例对本发明作进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
实施例一
如图1所示,本实施例提供了一种基于变体transformer对小区域敏感的目标果实检测方法,本实施例以该方法应用于服务器进行举例说明,可以理解的是,该方法也可以应用于终端,还可以应用于包括终端和服务器和***,并通过终端和服务器的交互实现。服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式***,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务器、云通信、中间件服务、域名服务、安全服务CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。本实施例中,该方法包括以下步骤:
获取待测的目标果实图像;
利用训练后的网络模型,依据待测的目标果实图像,得到目标果实检测结果;其中,网络模型包括:深度卷积神经网络、transformer编码器-解码器以及前馈神经网络;
所述网络模型训练的过程包括:
S101:采集目标果实图像,并对目标果实图像进行预处理,获得图像训练集和图像验证集;
其中,图像采集与分类。在果园环境下使用佳能EOS 80D单反相机采集丰富的绿色果实图像,对采集的图像进行分类,方便处理数据集。
具体的,使用佳能EOS 80D单反相机采集不同光照、不同时间段、不同角度下的绿色目标果实图像;对采集的图像进行分类,方便处理数据集。其中,对图像的分类包括对于不同品种果实的分类。
数据预处理包括:将原始图像旋转、折叠、形变,或者在原始图像中加入噪声,生成新的数据,以此来扩充样本,提高模型精度。使用LabelMe软件对图像进行标注,标注时,将每个目标果实标注为一个独立的连通域,制作成COCO格式数据集。然后将扩充完成的数据集分为训练集、验证集和测试集。
S102:构建网络模型,利用图像训练集、图像验证集以及目标损失函数,对网络模型进行训练,基于检测结果修改模型参数,直至损失函数的数值小于设定的阈值,获得最优的网络模型。
具体的,上述过程可以具体为:
使用卷积神经网络作为头部,下一步可以并行处理特征,加快检测速度,提高精度。
经过头部卷积神经网络提出特征,之后将特征输入到变体transfomer编码器-解码器中处理。
(2)构建变体transformer编码器-解码器与前馈神经网络。将制作好的数据集经过深度卷积神经网络处理,提取特征,构建变体transformer编码器-解码器处理特征,最后构建前馈神经网络,处理特征并输出最终结果。
对于变体transformer编码器,使用多尺度变形注意力模块代替DETR中处理特征映射的transformer注意力模块。对于编码器的输入和输出,使其最终都是具有相同分辨率的多尺度特征图。使用1×1的卷积神经网络,从ResNet提起特征的步骤C3到步骤C5之间提取特征多尺度特征图其中Cl表示比像素为2l还要低的输入图像。使用C6表示最后的像素特征图{xL},其通过一个3×3的两步卷积神经网络获得。关键元素和查询元素都是来自多尺度特征地图的像素。对于每个查询像素,参考点就是其本身。为了识别每个查询像素所在的特征级别,除了位置嵌入外,在特征表示中添加了一个尺度级嵌入,表示为el。与固定编码的位置嵌入不同,尺度级嵌入随机初始化并与网络结合并随网络训练。
其中,步骤C1-C6的具体过程包括:
C1:原始图像经过一个7×7×64的卷积提取特征;
C2:再经过一次池化以及6次3×3×64的卷积以及残差模块提取特征;
C3:再经过8次3×3×128的卷积以及残差模块提取特征;
C4:再经过12次3×3×256的卷积以及残差模块提取特征;
C5:再经过6次3×3×512的卷积以及残差模块提取特征;
C6:最后经过一次平均池化提取特征。
对于变体transformer解码器,在解码器中有交叉注意力和自我注意力模块。这两种注意力模块的查询元素都是对象查询。在交叉注意力模块中,对象查询从特征映射中提取特征,其中关键元素是从编码器输出的特征映射中提取的。在自我注意模块中,对象查询相互作用,其中关键元素是对象查询。由于我们提出的变形注意力模块是为处理卷积特征映射作为关键元素而设计的,所以只将每个交叉注意模块替换为多尺度变形注意力模块,而自我注意模块保持不变。对于每个对象查询,这6个对象的二维归一化坐标通过一个可学习的线性投影和一个sigmoid函数嵌入到其对象查询中。由于多尺度变形注意模块提取参考点周围的图像特征,让检测头预测边界盒作为参考点的相对偏移量,进一步降低优化难度。
多尺度注意力模块:
掩饰多头自注意力机制:
通过掩饰多头自注意力机制进一步处理特征,优化输出结果。
残差模块和正则化层:
通过残差模块考虑上下文信息,优化输出结果。
通过正则化层,防止神经网络过度拟合。
对于前馈神经网络。前馈神经网络通过一个带有ReLU激活函数和隐藏维数为d的3层感知器和一个线性投影层来计算出结果。通过前馈神经网络预测最终结果。
(3)构建损失函数。使用匈牙利损失函数以及SoftMax损失函数构建最终损失函数,优化网络模型,进行训练模型。
步骤5.2:Softmax函数是深度学习中使用非常频繁的一个函数,它可以把输入的几个数映射为0-1之间的实数,并且归一化后仍能够保证几个数的和为1。它的公式化表示为:
其中T表示元素数量,计算该元素的指数与所有元素指数和的比值。
即损失函数为:
l1损失函数:基于逐像素比较差异,然后取绝对值,x(p)表示原图片像素,y(p)表示计算之后图像的像素,公式如下。
评估模型并优化网络模型。输入测试样本,使用评估指标评价获得的绿色果实检测模型的检测结果,根据评估结果调整模型的参数,重复训练改进模型,直至损失函数的数值小于设定的阈值,获得最优网络模型。
实施例二
本实施例提供了一种基于变体transformer对小区域敏感的目标果实检测***。
一种基于变体transformer对小区域敏感的目标果实检测***,包括:
采集和预处理模块,其被配置为:采集目标果实图像,并对目标果实图像进行预处理,获得图像训练集和图像验证集;
网络构建模块,其被配置为:构建网络模型,利用图像训练集、图像验证集以及目标损失函数,对网络模型进行训练,基于检测结果修改模型参数,直至损失函数的数值小于设定的阈值,获得最优的网络模型;
检测模块,其被配置为:利用训练后的网络模型,依据待测的目标果实图像,得到目标果实检测结果;其中,网络模型包括:深度卷积神经网络、transformer编码器-解码器以及前馈神经网络。
实施例三
本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述实施例一所述的基于变体transformer对小区域敏感的目标果实检测方法中的步骤。
实施例四
本实施例提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述实施例一所述的基于变体transformer对小区域敏感的目标果实检测方法中的步骤。
本领域内的技术人员应明白,本发明的实施例可提供为方法、***、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(RandomAccessMemory,RAM)等。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于变体transformer对小区域敏感的目标果实检测方法,其特征在于,包括:
获取待测的目标果实图像;
利用训练后的网络模型,依据待测的目标果实图像,得到目标果实检测结果;其中,网络模型包括:深度卷积神经网络、transformer编码器-解码器以及前馈神经网络;
所述网络模型训练的过程包括:
采集目标果实图像,并对目标果实图像进行预处理,获得图像训练集和图像验证集;
构建网络模型,利用图像训练集、图像验证集以及目标损失函数,对网络模型进行训练,基于检测结果修改模型参数,直至损失函数的数值小于设定的阈值,获得最优的网络模型。
2.根据权利要求1所述的基于变体transformer对小区域敏感的目标果实检测方法,其特征在于,所述采集目标果实图像包括:采集不同光照、不同时间段、不同角度下的目标果实图像,并对目标果实图像进行分类。
3.根据权利要求1所述的基于变体transformer对小区域敏感的目标果实检测方法,其特征在于,所述预处理的过程包括:对原始目标果实图像的旋转、折叠、形变,或者在原始图像中加入噪声,达到扩充样本的目的。
4.根据权利要求1所述的基于变体transformer对小区域敏感的目标果实检测方法,其特征在于,所述预处理的过程包括:标注目标果实图像中的果实。
5.根据权利要求1所述的基于变体transformer对小区域敏感的目标果实检测方法,其特征在于,检测过程包括:待测的目标果实图像经深度卷积神经网络提取第一特征后,将第一特征输入transformer编码器,第一特征经多尺度变形注意力网络和尺度级嵌入,得到第一特征对应的编码形式,然后经transformer解码器解码后,最后在前馈神经网络中经过两次线性映射,得到目标果实检测结果。
6.根据权利要求1所述的基于变体transformer对小区域敏感的目标果实检测方法,其特征在于,所述前馈神经网络包括:ReLU激活函数和隐藏维数为d的三层感知器和一个线性投影层。
7.根据权利要求1所述的基于变体transformer对小区域敏感的目标果实检测方法,其特征在于,所述目标损失函数为边界框损失函数,所述的边界框损失函数构建包括:基于L1损失函数和GLOU损失函数构建边界框损失函数。
8.一种基于变体transformer对小区域敏感的目标果实检测***,其特征在于,包括:
采集和预处理模块,其被配置为:采集目标果实图像,并对目标果实图像进行预处理,获得图像训练集和图像验证集;
网络构建模块,其被配置为:构建网络模型,利用图像训练集、图像验证集以及目标损失函数,对网络模型进行训练,基于检测结果修改模型参数,直至损失函数的数值小于设定的阈值,获得最优的网络模型;
检测模块,其被配置为:利用训练后的网络模型,依据待测的目标果实图像,得到目标果实检测结果;其中,网络模型包括:深度卷积神经网络、transformer编码器-解码器以及前馈神经网络。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一项所述的基于变体transformer对小区域敏感的目标果实检测方法中的步骤。
10.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7中任一项所述的基于变体transformer对小区域敏感的目标果实检测方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110431533.5A CN113269182A (zh) | 2021-04-21 | 2021-04-21 | 一种基于变体transformer对小区域敏感的目标果实检测方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110431533.5A CN113269182A (zh) | 2021-04-21 | 2021-04-21 | 一种基于变体transformer对小区域敏感的目标果实检测方法及*** |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113269182A true CN113269182A (zh) | 2021-08-17 |
Family
ID=77229146
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110431533.5A Pending CN113269182A (zh) | 2021-04-21 | 2021-04-21 | 一种基于变体transformer对小区域敏感的目标果实检测方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113269182A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113869138A (zh) * | 2021-09-06 | 2021-12-31 | 深延科技(北京)有限公司 | 多尺度目标检测方法、装置及计算机可读存储介质 |
CN113935534A (zh) * | 2021-10-20 | 2022-01-14 | 华能大理风力发电有限公司洱源分公司 | 一种基于卷积transformer架构的光伏日前预测方法、***及设备 |
CN115222955B (zh) * | 2022-06-13 | 2023-02-28 | 北京医准智能科技有限公司 | 图像匹配模型的训练方法、装置、电子设备及存储介质 |
CN116311104A (zh) * | 2023-05-15 | 2023-06-23 | 合肥市正茂科技有限公司 | 一种车辆改装识别模型的训练方法、装置、设备及介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108564097A (zh) * | 2017-12-05 | 2018-09-21 | 华南理工大学 | 一种基于深度卷积神经网络的多尺度目标检测方法 |
CN110188720A (zh) * | 2019-06-05 | 2019-08-30 | 上海云绅智能科技有限公司 | 一种基于卷积神经网络的目标检测方法及*** |
CN110309839A (zh) * | 2019-08-27 | 2019-10-08 | 北京金山数字娱乐科技有限公司 | 一种图像描述的方法及装置 |
CN111259940A (zh) * | 2020-01-10 | 2020-06-09 | 杭州电子科技大学 | 一种基于空间注意力地图的目标检测方法 |
CN112036555A (zh) * | 2020-11-05 | 2020-12-04 | 北京亮亮视野科技有限公司 | 目标检测框架的优化方法及装置、存储介质、电子设备 |
CN112132031A (zh) * | 2020-09-23 | 2020-12-25 | 平安国际智慧城市科技股份有限公司 | 车款识别方法、装置、电子设备及存储介质 |
-
2021
- 2021-04-21 CN CN202110431533.5A patent/CN113269182A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108564097A (zh) * | 2017-12-05 | 2018-09-21 | 华南理工大学 | 一种基于深度卷积神经网络的多尺度目标检测方法 |
CN110188720A (zh) * | 2019-06-05 | 2019-08-30 | 上海云绅智能科技有限公司 | 一种基于卷积神经网络的目标检测方法及*** |
CN110309839A (zh) * | 2019-08-27 | 2019-10-08 | 北京金山数字娱乐科技有限公司 | 一种图像描述的方法及装置 |
CN111259940A (zh) * | 2020-01-10 | 2020-06-09 | 杭州电子科技大学 | 一种基于空间注意力地图的目标检测方法 |
CN112132031A (zh) * | 2020-09-23 | 2020-12-25 | 平安国际智慧城市科技股份有限公司 | 车款识别方法、装置、电子设备及存储介质 |
CN112036555A (zh) * | 2020-11-05 | 2020-12-04 | 北京亮亮视野科技有限公司 | 目标检测框架的优化方法及装置、存储介质、电子设备 |
Non-Patent Citations (2)
Title |
---|
NICOLAS CARION ET AL.: "End-to-End Object Detection with Transformers", 《ARXIV:2005.12872V3 [CS.CV] 28 MAY 2020》 * |
XIZHOU ZHU ET AL.: "Deformable DETR: deformable transformers for end-to-end object detection", 《ARXIV:2010.04159V4 [CS.CV] 18 MAR 2021》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113869138A (zh) * | 2021-09-06 | 2021-12-31 | 深延科技(北京)有限公司 | 多尺度目标检测方法、装置及计算机可读存储介质 |
CN113935534A (zh) * | 2021-10-20 | 2022-01-14 | 华能大理风力发电有限公司洱源分公司 | 一种基于卷积transformer架构的光伏日前预测方法、***及设备 |
CN115222955B (zh) * | 2022-06-13 | 2023-02-28 | 北京医准智能科技有限公司 | 图像匹配模型的训练方法、装置、电子设备及存储介质 |
CN116311104A (zh) * | 2023-05-15 | 2023-06-23 | 合肥市正茂科技有限公司 | 一种车辆改装识别模型的训练方法、装置、设备及介质 |
CN116311104B (zh) * | 2023-05-15 | 2023-08-22 | 合肥市正茂科技有限公司 | 一种车辆改装识别模型的训练方法、装置、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7317717B2 (ja) | ネットワーク計算エッジにわたってアプリケーションを連続して操作する、人工知能および深層学習においてメモリで境界された継続学習を可能にするシステムおよび方法 | |
CN110532900B (zh) | 基于U-Net和LS-CNN的人脸表情识别方法 | |
CN113269182A (zh) | 一种基于变体transformer对小区域敏感的目标果实检测方法及*** | |
CN113449594B (zh) | 一种多层网络组合的遥感影像地类语义分割与面积计算方法 | |
CN109657582A (zh) | 人脸情绪的识别方法、装置、计算机设备及存储介质 | |
CN105184298A (zh) | 一种快速局部约束低秩编码的图像分类方法 | |
CN106874862B (zh) | 基于子模技术和半监督学习的人群计数方法 | |
CN114187450A (zh) | 一种基于深度学习的遥感图像语义分割方法 | |
CN112950780B (zh) | 一种基于遥感影像的网络地图智能生成方法及*** | |
CN112464766A (zh) | 一种农田地头自动识别方法及*** | |
CN113761259A (zh) | 一种图像处理方法、装置以及计算机设备 | |
CN113095370A (zh) | 图像识别方法、装置、电子设备及存储介质 | |
CN118154867A (zh) | 一种半监督遥感图像语义分割方法与*** | |
CN116649191A (zh) | 基于plc的远程施肥灌溉控制***及其方法 | |
CN116486408A (zh) | 遥感图像跨域语义分割方法及装置 | |
Chen-McCaig et al. | Convolutional neural networks for texture recognition using transfer learning | |
Defriani et al. | Recognition of regional traditional house in Indonesia using Convolutional Neural Network (CNN) method | |
CN114187590A (zh) | 同色系背景下目标果实识别方法及*** | |
CN117789037A (zh) | 作物生长期预测方法及装置 | |
CN109271833A (zh) | 基于栈式稀疏自编码器的目标识别方法、装置及电子设备 | |
CN117132884A (zh) | 一种基于地块尺度的农作物遥感智能提取方法 | |
CN116665039A (zh) | 基于两阶段因果干预的小样本目标识别方法 | |
CN113627480B (zh) | 一种基于强化学习的极化sar影像分类方法 | |
Yu | Research progress of crop disease image recognition based on wireless network communication and deep learning | |
Hu et al. | Research on pest and disease recognition algorithms based on convolutional neural network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210817 |
|
RJ01 | Rejection of invention patent application after publication |