CN112215241A - 一种基于小样本学习的图像特征提取装置 - Google Patents

一种基于小样本学习的图像特征提取装置 Download PDF

Info

Publication number
CN112215241A
CN112215241A CN202011123494.4A CN202011123494A CN112215241A CN 112215241 A CN112215241 A CN 112215241A CN 202011123494 A CN202011123494 A CN 202011123494A CN 112215241 A CN112215241 A CN 112215241A
Authority
CN
China
Prior art keywords
feature
module
channel
scale
weighting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011123494.4A
Other languages
English (en)
Other versions
CN112215241B (zh
Inventor
庞善民
刘飒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Jiaotong University
Original Assignee
Xian Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Jiaotong University filed Critical Xian Jiaotong University
Priority to CN202011123494.4A priority Critical patent/CN112215241B/zh
Publication of CN112215241A publication Critical patent/CN112215241A/zh
Application granted granted Critical
Publication of CN112215241B publication Critical patent/CN112215241B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • G06V10/464Salient features, e.g. scale invariant feature transforms [SIFT] using a plurality of salient features, e.g. bag-of-words [BoW] representations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种基于小样本学习的图像特征提取装置,包括第一多通道特征加权模块、第二多通道特征加权模块、卷积模块、第一多尺度特征融合模块和第二多尺度特征融合模块;所述第一多通道特征加权模块、所述第二多通道特征加权模块及所述卷积模块依次连接;所述第一多尺度特征融合模块与所述第二多尺度特征融合模相连;所述第一多尺度特征融合模块分别与所述第二多通道特征加权模块及所述卷积模块相连;所述第二多尺度特征融合模块与所述第一多通道特征加权模块相连。本发明通过多通道特征加权模块和多尺度特征融合模块对小样本图像数据集进行特征提取,能够有效提高小样本分类的准确率。

Description

一种基于小样本学习的图像特征提取装置
技术领域
本发明涉及图像处理技术领域,特别涉及一种基于小样本学习的图像特征提取装置。
背景技术
近几年来大数据技术、卷积神经网络和计算及性能都在飞速发展,大规模数据的图像任务,例如图像分类、目标检测、图像分割等都已经发展的非常成熟。然而目前主流的深度学习网络模型都针对样本数量较大的任务提出,而忽略了现实生活中大多数任务场景下数据量稀缺的问题。而相比较于机器,人类只需少量样本就可以达到相当准确的学习效果,这主要是因为,在人类在漫长的进化过程中获得了快速捕捉样本区分性特征的能力。同样,在图像样本十分稀缺的情况下,如何在仅有的样本中提取最能代表该类的特征成为了提高任务正确率的关键。
发明内容
本发明的目的在于提供一种基于小样本学习的图像特征提取装置,多通道特征加权模块和多尺度特征融合模块对小样本图像数据集进行特征提取,能够有效提高小样本分类的准确率。
为实现上述目的,本发明提供了如下方案:本发明提供一种基于小样本学习的图像特征提取装置,其特征在于,包括第一多通道特征加权模块、第二多通道特征加权模块、卷积模块、第一多尺度特征融合模块和第二多尺度特征融合模块;
所述第一多通道特征加权模块、所述第二多通道特征加权模块及所述卷积模块依次连接;
所述第一多尺度特征融合模块与所述第二多尺度特征融合模相连;
所述第一多尺度特征融合模块分别与所述第二多通道特征加权模块及所述卷积模块相连;
所述第二多尺度特征融合模块与所述第一多通道特征加权模块相连。
优选地,所述第一多通道特征加权模块用于对图像数据集进行第一次特征提取及特征加权,得到具有权重的第一多通道特征。
优选地,所述第二多通道特征加权模块用于对所述具有权重的第一多通道特征进行第二次特征提取及特征加权,得到具有权重的第二多通道特征。
优选地,所述卷积模块用于对所述具有权重的第二多通道特征进行特征提取及加权,得到具有权重的第三多通道特征,并根据第三多通道特征输出多通道加权特征图。
优选地,所述第一多尺度特征融合模块用于接收所述具有权重的第二多通道特征及所述具有权重的第三多通道特征并进行特征融合;
所述第二多尺度特征融合模块用于接收所述具有权重的第一多通道特征及所述第一多尺度特征融合模块的输出结果并进行特征融合,输出多尺度融合特征图。
优选地,所述第一多通道特征加权模块包括依次连接的第一卷积块、第一池化层、第一全连接层、第二全连接层及第二卷积块;
所述第一卷积块用于对图像数据集进行特征提取,得到图像特征;
所述第一池化层用于对提取后的图像特征进行全局特征提取,得到全局特征标量;
所述第一全连接层用于接收所述全局特征标量并减小所述全局特征标量的网络尺寸,并得到带有权重的参数;
所述第二全连接层用于将减小后的网络尺寸增大到所述全局特征标量的原始尺寸,并得到带有权重的参数;
所述第二卷积块用于对第一全连接层和第二全连接层中得到的带有权重参数进行加权操作,得到所述具有权重的第一多通道特征。
优选地,所述第二多通道加权模块包括依次连接的第二卷积块、第二池化层、第三全连接层和第四全连接层及第三卷积块;
所述第二池化层用于将具有权重的第一多通道特征进行全局特征提取,得到全局特征标量;
所述第三全连接层用于接收所述第二池化层的全局特征标量并减小全局特征标量的网络尺寸,并得到带有权重的参数;
所述第四全连接层用于将减小后的网络尺寸增大到原始尺寸,并得到带有权重的参数;
所述第三卷积块用于对第三全连接层和第四全连接层中得到的带有权重的参数进行加权操作,得到所述具有权重的第二多通道特征。
优选地,所述第一多尺度特征融合模块及所述第二多尺度特征融合模块分别包括依次连接的上采样模块及降维模块;
所述上采样模块用于对具有权重的第一多通道特征、具有权重的第二多通道特征及具有权重的第三多通道特征进行上采样;
所述降维模块用于对上采样后的多通道特征进行维数降低,并输出多尺度融合特征图。
本发明公开了以下技术效果:面对目前主流卷积神经特征提取网络模型大都针对大规模数据集提出的问题,本发明提出的针对小样本数据集的特征提取方法能通过通道和多尺度两个方面来提升网络模型的特征提取性能。由于这两个模块都只是对样本的特征提取模块进行改进,因此可以轻松的移植入主流的小样本特征提取网络中,为后续图像分类、目标检测、图像分割等任务都能提升学习精度,并且只需增加少量参数就可以给模型性能带来较大提升。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明基于小样本学习的图像特征提取装置结构示意图;
图2为本发明基于小样本学习的图像特征提取装置具体结构示意图;
图3为本发明实施例多通道特征加权过程示意图;
图4为本发明实施例第二、第三、第四卷积块结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
如图1及图2所示,本发明提供一种基于小样本学习的图像特征提取装置,包括第一多通道特征加权模块、第二多通道特征加权模块、卷积模块、第一多尺度特征融合模块及第二多尺度特征融合模块。
第一多通道特征加权模块、第二多通道特征加权模块及卷积模块依次连接;
第一多尺度特征融合模块与第二多尺度特征融合模相连;
第一多尺度特征融合模块分别与第二多通道特征加权模块及卷积模块相连;
第二多尺度特征融合模块与第一多通道特征加权模块相连。
第一多通道特征加权模块用于对图像数据集进行第一次特征提取及特征加权,得到具有权重的第一多通道特征;
第二多通道特征加权模块用于对具有权重的多通道特征进行第二次特征提取及特征加权,得到具有权重的第二多通道特征;
卷积模块用于对具有权重的第二多通道特征进行特征提取及加权,得到具有权重的第三多通道特征,并输出多通道加权特征图;
第一多尺度特征融合模块用于接收具有权重的第二多通道特征及具有权重的第三多通道特征并进行特征融合;
第二多尺度特征融合模块用于接收具有权重的第一多通道特征及第一多尺度特征融合模块的输出结果并进行特征融合,输出多尺度融合特征图。
第一多通道加权模块包括依次连接的第一卷积块、第一池化层、第一全连接层、第二全连接层及第二卷积块。
第一卷积块用于对图像数据集进行特征提取,得到特征图;
第一池化层用于对提取后的图像特征进行全局特征提取,得到全局特征标量;由于卷积核运算只在局部空间中运行,很难提取出足够多的通道之间的关系,因此需要引入一个压缩操作来提取每个特征图的全局特征。因此本实施例将每个不同通道的二维特征映射压缩为一个标量,该标量一定程度上可以表示该通道的全局感受野,通过池化操作将通道的整个特征图编码为全局特征标量。
图像经过卷积核运算后特征图尺寸变为W*H*C,全局特征标量由全局平均池化操作得到,即将C维度上每个尺寸为W*H的特征图通过全局平均池化操作编码为1个标量,最终得到C维全局特征标量。
全局平均池化的具体实现方式是对通道维度上每个特征图所有像素值相加求平均值,得到一个数值标量,用该数值表示对应特征图的全局特征标量。具体公式如下:
Figure BDA0002732818070000071
其中:W和H分别表示每个特征图的宽度和高度,xi,j表示特征图上位置(i,j)的数值。
第一全连接层用于接收全局特征标量并减小全局特征标量的网络尺寸,并得到带有权重的参数;
第二全连接层用于将减小后的网络尺寸增大到原始尺寸,以减小网络学习参数,并得到带有权重的参数;对于第二全连接层,本实施例采用Sigmoid激活函数将所有数值控制在0.5到1之间。Sigmoid函数的取值范围为(0,1),其中x>0时取值范围为(0.5,1),通过Sigmoid函数获得的激活值可以看做不同通道特征图的权重。
通过第一全连接层和第二全连接层,本实施例不仅可以减少网络参数的数量,而且可以通过非线性激活函数来增加模型的非线性。通过一个全连接层直接相连,参数量为n*n,通过先减小或增大的两个全连接层,其中减小后的尺寸为m(m<<n),参数量为2mn。
如图3所示,第二卷积块用于对第一全连接层和第二全连接层中得到的参数进行加权操作,将每个通道学习到的参数与所述第一卷积块的特征相乘得到具有权重的第一多通道特征。进而可以区分不同通道的重要性,并实现对通道维度中原始特征的重新校准,从而从不同通道特征图中快速获得样本中最具代表性的特征。
第二多通道加权模块包括依次连接的第二卷积块、第二池化层、第三全连接层和第四全连接层及第三卷积块;
第二池化层用于将具有权重的第一多通道特征进行全局特征提取,得到全局特征标量;
第三全连接层用于第接收二池化层的全局特征标量并减小全局特征标量的网络尺寸,并得到带有权重的参数;
第四全连接层用于将减小后的网络尺寸增大到原始尺寸,并得到带有权重的参数;
第三卷积块用于对第三全连接层和第四全连接层中得到的参数进行加权操作,得到具有权重的第二多通道特征。
本实施例的第二、第三、第四卷积块各包含64个3×3的卷积核,批标准化以及ReLU激活函数,具体结构如图4所示。
由于图像数据集样本数据的尺度、位置并不完全相同,且随着特征提取过程的进行,每一层都会丢失一些信息,特别是在样本数量少的情况下,目标的关键信息很可能已经在层数加深的时候丢失,因此本实施例采用尺度特征融合模块对小样本是数据的特征进行加强,本发明的第一多尺度特征融合模块及第二多尺度特征融合模块分别包括依次连接的上采样模块及降维模块;
上采样模块用于对具有权重的第一多通道特征、具有权重的第二多通道特征及具有权重的第三多通道特征进行上采样操作,通过双线性差值的方法将深层特征的空间尺度缩放到浅层同样大小;
由于不同卷积块学习到的特征图尺寸不同,所以必须通过上采样操作将深层特征图还原到浅层同样大小。本实施例选用双线性内插方法对上采样操作来确定需要补充的特征值。具体为:
未知函数f在点P=(x,y)的值的计算为例,假设已知函数f在Q11=(x1,y1)、Q12=(x1,y2)、Q21=(x2,y1)以及Q22=(x2,y2)四个点的值,首先在x方向进行线性插值,得到:
Figure BDA0002732818070000091
然后在y方向进行线性插值,得到f(x,y):
Figure BDA0002732818070000092
降维模块用于对上采样后的多通道特征进行维数降低操作,通过1×1卷积核将特征通道数降维到浅层特征同样维度。
本装置中的降维操作通过1*1卷积核来实现。例如一张84*84且通道数为64的图片在16个filters上做1*1的卷积,则结果的大小为84*84*16,这样可以通过1*1卷积核来实现对不同卷积块之间特征图通道数的统一。
将降低维数后的不同尺度的特征图按照通道方向相加,输出多尺度特征融合图。
对于小目标而言,多尺度特征融合增加了特征映射的分辨率,卷积算子在更大的特征图上进行操作,可以获得更多关于小目标的有用信息。为了权衡模型的计算效率和参数数量,本实施例只将特征融合到第二层,最后通过融合了多尺度的特征图来进行后续的图像分类。利用特征融合,可以快速提取到样本中有用的特征,而对图片背景等无关信息进行剔除。
在获得多通道加权和多尺度融合的特征后,本实施例基于度量学习的方法,引入了两个卷积层和两个全连接层来计算两张图片样本之间的距离从而分析匹配程度。在数据集设计方面,本实施例选用100类数据,每类样本100张图片,每张图片的规格为84×84,共60000张样本对模型进行训练,其中的64类用于训练,16类用于验证,20类用于测试。在超参数设置方面,利用Adam优化器来对网络参数进行更新,初始学习率设置为0.001,每训练100000次后学习率减半。
同时,本实施例对本发明的装置与记忆增强神经网络(MANN)、孪生网络(SiameseNets)、匹配网络(Matching nets)、原型网络(Prototypical nets)及关系网络(relationnets)五种分类方在两个数据集(Omniglot与MiniImageNet数据集)中进行准确率的比较,且不对具体的数据集数量大小设限,其中Omniglot数据集包含来自50个字母的1623个字符,每个字符由20个不同的手写图片组成;miniimagenet包含100类共60000张图片,即每类包含600张样本图片。
结果表明,本发明的装置相比于其他五种分类方法相比,在引入多通道加权模块和多尺度特征融合模块后,小样本分类的准确率获得了显著提升。本实施例的Omniglot数据集的分类结果及MiniImageNet数据集的分类结果具体如表1及表2所示。
表1
Figure BDA0002732818070000111
表2
Figure BDA0002732818070000112
以上所述的实施例仅是对本发明的优选方式进行描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通技术人员对本发明的技术方案做出的各种变形和改进,均应落入本发明权利要求书确定的保护范围内。

Claims (8)

1.一种基于小样本学习的图像特征提取装置,其特征在于,包括第一多通道特征加权模块、第二多通道特征加权模块、卷积模块、第一多尺度特征融合模块和第二多尺度特征融合模块;
所述第一多通道特征加权模块、所述第二多通道特征加权模块及所述卷积模块依次连接;
所述第一多尺度特征融合模块与所述第二多尺度特征融合模相连;
所述第一多尺度特征融合模块分别与所述第二多通道特征加权模块及所述卷积模块相连;
所述第二多尺度特征融合模块与所述第一多通道特征加权模块相连。
2.根据权利要求1所述的基于小样本学习的图像特征提取装置,其特征在于,所述第一多通道特征加权模块用于对图像数据集进行第一次特征提取及特征加权,得到具有权重的第一多通道特征。
3.根据权利要求2所述的基于小样本学习的图像特征提取装置,其特征在于,所述第二多通道特征加权模块用于对所述具有权重的第一多通道特征进行第二次特征提取及特征加权,得到具有权重的第二多通道特征。
4.根据权利要求3所述的基于小样本学习的图像特征提取装置,其特征在于,所述卷积模块用于对所述具有权重的第二多通道特征进行特征提取及加权,得到具有权重的第三多通道特征,并根据第三多通道特征输出多通道加权特征图。
5.根据权利要求2-4任一项所述的基于小样本学习的图像特征提取装置,其特征在于,所述第一多尺度特征融合模块用于接收所述具有权重的第二多通道特征及所述具有权重的第三多通道特征并进行特征融合;
所述第二多尺度特征融合模块用于接收所述具有权重的第一多通道特征及所述第一多尺度特征融合模块的输出结果并进行特征融合,输出多尺度融合特征图。
6.根据权利要求2所述的基于小样本学习的图像特征提取装置,其特征在于,所述第一多通道特征加权模块包括依次连接的第一卷积块、第一池化层、第一全连接层、第二全连接层及第二卷积块;
所述第一卷积块用于对图像数据集进行特征提取,得到图像特征;
所述第一池化层用于对提取后的图像特征进行全局特征提取,得到全局特征标量;
所述第一全连接层用于接收所述全局特征标量并减小所述全局特征标量的网络尺寸,并得到带有权重的参数;
所述第二全连接层用于将减小后的网络尺寸增大到所述全局特征标量的原始尺寸,并得到带有权重的参数;
所述第二卷积块用于对第一全连接层和第二全连接层中得到的带有权重参数进行加权操作,得到所述具有权重的第一多通道特征。
7.根据权利要求3所述的基于小样本学习的图像特征提取装置,其特征在于,所述第二多通道加权模块包括依次连接的第二卷积块、第二池化层、第三全连接层和第四全连接层及第三卷积块;
所述第二池化层用于将具有权重的第一多通道特征进行全局特征提取,得到全局特征标量;
所述第三全连接层用于接收所述第二池化层的全局特征标量并减小全局特征标量的网络尺寸,并得到带有权重的参数;
所述第四全连接层用于将减小后的网络尺寸增大到原始尺寸,并得到带有权重的参数;
所述第三卷积块用于对第三全连接层和第四全连接层中得到的带有权重的参数进行加权操作,得到所述具有权重的第二多通道特征。
8.根据权利要求5所述的基于小样本学习的图像特征提取装置,其特征在于,所述第一多尺度特征融合模块及所述第二多尺度特征融合模块分别包括依次连接的上采样模块及降维模块;
所述上采样模块用于对具有权重的第一多通道特征、具有权重的第二多通道特征及具有权重的第三多通道特征进行上采样;
所述降维模块用于对上采样后的多通道特征进行维数降低,并输出多尺度融合特征图。
CN202011123494.4A 2020-10-20 2020-10-20 一种基于小样本学习的图像特征提取装置 Active CN112215241B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011123494.4A CN112215241B (zh) 2020-10-20 2020-10-20 一种基于小样本学习的图像特征提取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011123494.4A CN112215241B (zh) 2020-10-20 2020-10-20 一种基于小样本学习的图像特征提取装置

Publications (2)

Publication Number Publication Date
CN112215241A true CN112215241A (zh) 2021-01-12
CN112215241B CN112215241B (zh) 2022-04-01

Family

ID=74056045

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011123494.4A Active CN112215241B (zh) 2020-10-20 2020-10-20 一种基于小样本学习的图像特征提取装置

Country Status (1)

Country Link
CN (1) CN112215241B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112949520A (zh) * 2021-03-10 2021-06-11 华东师范大学 一种基于多尺度小样本的航拍车辆检测方法及检测***
CN117853491A (zh) * 2024-03-08 2024-04-09 山东省计算中心(国家超级计算济南中心) 基于多场景任务下的少样本工业产品异常检测方法及***

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109101914A (zh) * 2018-08-01 2018-12-28 北京飞搜科技有限公司 一种基于多尺度的行人检测方法和装置
CN109165660A (zh) * 2018-06-20 2019-01-08 扬州大学 一种基于卷积神经网络的显著物体检测方法
CN110059582A (zh) * 2019-03-28 2019-07-26 东南大学 基于多尺度注意力卷积神经网络的驾驶员行为识别方法
CN110163878A (zh) * 2019-05-28 2019-08-23 四川智盈科技有限公司 一种基于双重多尺度注意力机制的图像语义分割方法
CN110555446A (zh) * 2019-08-19 2019-12-10 北京工业大学 基于多尺度深度特征融合和迁移学习的遥感影像场景分类方法
CN110648334A (zh) * 2019-09-18 2020-01-03 中国人民解放***箭军工程大学 一种基于注意力机制的多特征循环卷积显著性目标检测方法
CN110991362A (zh) * 2019-12-06 2020-04-10 西安电子科技大学 一种基于注意力机制的行人检测模型
CN111199516A (zh) * 2019-12-30 2020-05-26 深圳大学 基于图像生成网络模型的图像处理方法、***及存储介质
CN111275643A (zh) * 2020-01-20 2020-06-12 西南科技大学 基于通道和空间注意力的真实噪声盲去噪网络模型及方法
EP3719745A1 (en) * 2019-04-01 2020-10-07 Siemens Healthcare GmbH Processing a medical image

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109165660A (zh) * 2018-06-20 2019-01-08 扬州大学 一种基于卷积神经网络的显著物体检测方法
CN109101914A (zh) * 2018-08-01 2018-12-28 北京飞搜科技有限公司 一种基于多尺度的行人检测方法和装置
CN110059582A (zh) * 2019-03-28 2019-07-26 东南大学 基于多尺度注意力卷积神经网络的驾驶员行为识别方法
EP3719745A1 (en) * 2019-04-01 2020-10-07 Siemens Healthcare GmbH Processing a medical image
CN110163878A (zh) * 2019-05-28 2019-08-23 四川智盈科技有限公司 一种基于双重多尺度注意力机制的图像语义分割方法
CN110555446A (zh) * 2019-08-19 2019-12-10 北京工业大学 基于多尺度深度特征融合和迁移学习的遥感影像场景分类方法
CN110648334A (zh) * 2019-09-18 2020-01-03 中国人民解放***箭军工程大学 一种基于注意力机制的多特征循环卷积显著性目标检测方法
CN110991362A (zh) * 2019-12-06 2020-04-10 西安电子科技大学 一种基于注意力机制的行人检测模型
CN111199516A (zh) * 2019-12-30 2020-05-26 深圳大学 基于图像生成网络模型的图像处理方法、***及存储介质
CN111275643A (zh) * 2020-01-20 2020-06-12 西南科技大学 基于通道和空间注意力的真实噪声盲去噪网络模型及方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
HUANGGUOQUAN等: "Ship detection based on squeeze excitation skip-connection path networks for optical remote sensing images", 《NEUROCOMPUTING》 *
陈立潮 等: "基于Dense-YOLOv3的车型检测模型", 《计算机***应用》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112949520A (zh) * 2021-03-10 2021-06-11 华东师范大学 一种基于多尺度小样本的航拍车辆检测方法及检测***
CN112949520B (zh) * 2021-03-10 2022-07-26 华东师范大学 一种基于多尺度小样本的航拍车辆检测方法及检测***
CN117853491A (zh) * 2024-03-08 2024-04-09 山东省计算中心(国家超级计算济南中心) 基于多场景任务下的少样本工业产品异常检测方法及***
CN117853491B (zh) * 2024-03-08 2024-05-24 山东省计算中心(国家超级计算济南中心) 基于多场景任务下的少样本工业产品异常检测方法及***

Also Published As

Publication number Publication date
CN112215241B (zh) 2022-04-01

Similar Documents

Publication Publication Date Title
CN109376804B (zh) 基于注意力机制和卷积神经网络高光谱遥感图像分类方法
CN113221639B (zh) 一种基于多任务学习的代表性au区域提取的微表情识别方法
CN110084249A (zh) 基于金字塔特征注意的图像显著性检测方法
CN111340123A (zh) 一种基于深度卷积神经网络的图像分数标签预测方法
CN111860233B (zh) 基于选择注意力网络的sar图像复杂建筑物提取方法及***
CN112215241B (zh) 一种基于小样本学习的图像特征提取装置
CN109858575A (zh) 基于卷积神经网络的数据分类方法
CN111339924B (zh) 一种基于超像素和全卷积网络的极化sar图像分类方法
CN110533591B (zh) 基于编解码器结构的超分辨图像重建方法
CN112818849B (zh) 基于对抗学习的上下文注意力卷积神经网络的人群密度检测算法
CN115082675A (zh) 一种透明物体图像分割方法及***
CN114998756A (zh) 一种基于yolov5的遥感图像检测方法、装置及存储介质
CN113888501A (zh) 一种基于注意力定位网络的无参考型图像质量评价方法
CN114663769B (zh) 一种基于YOLO v5的水果识别方法
CN115937693A (zh) 一种基于遥感图像的道路识别方法及***
CN112926533A (zh) 基于双向特征融合的光学遥感图像地物分类方法及***
CN113435254A (zh) 一种基于哨兵二号影像的耕地深度学习提取方法
CN114463727A (zh) 一种地铁驾驶员行为识别方法
CN113011506B (zh) 一种基于深度重分形频谱网络的纹理图像分类方法
CN112990213B (zh) 一种基于深度学习的数字万用表字符识别***和方法
CN117576402A (zh) 一种基于深度学习的多尺度聚合Transformer遥感图像语义分割方法
CN113538402A (zh) 一种基于密度估计的人群计数方法及***
CN111539434B (zh) 基于相似度的红外弱小目标检测方法
CN111428809A (zh) 基于空间信息融合与卷积神经网络的人群计数方法
CN116580174A (zh) 一种虚拟场景实时构建方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant