CN110490813A - 卷积神经网络的特征图增强方法、装置、设备及介质 - Google Patents

卷积神经网络的特征图增强方法、装置、设备及介质 Download PDF

Info

Publication number
CN110490813A
CN110490813A CN201910605387.6A CN201910605387A CN110490813A CN 110490813 A CN110490813 A CN 110490813A CN 201910605387 A CN201910605387 A CN 201910605387A CN 110490813 A CN110490813 A CN 110490813A
Authority
CN
China
Prior art keywords
subcharacter
channel
characteristic pattern
enhancement factor
attention
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910605387.6A
Other languages
English (en)
Other versions
CN110490813B (zh
Inventor
贾琳
赵磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Terminus Beijing Technology Co Ltd
Original Assignee
Terminus Beijing Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Terminus Beijing Technology Co Ltd filed Critical Terminus Beijing Technology Co Ltd
Priority to CN201910605387.6A priority Critical patent/CN110490813B/zh
Publication of CN110490813A publication Critical patent/CN110490813A/zh
Application granted granted Critical
Publication of CN110490813B publication Critical patent/CN110490813B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开了一种卷积神经网络的特征图增强方法、装置、设备及介质,对输入的原始图像进行卷积操作,得到对应的多层特征图,针对某层特征图,将其按照通道维度进行分组,得到多个子特征图,针对每个子特征图,利用内嵌的空域分组增强SGE模块进行全局平均池化和全局最大池化并行处理,得到对应的两个通道维度向量,根据所述对应的两个通道维度向量,得到对应子特征图中每个通道的注意力增强因子,根据所述注意力增强因子和对应子特征图,得到对应的增强子特征图,根据全部增强子特征图,得到所述某层特征图对应的增强特征图,从而可以更好地表达子特征图通道间重要程度的语义信息,提高了卷积神经网络的图像分类、分割、检测等任务性能。

Description

卷积神经网络的特征图增强方法、装置、设备及介质
技术领域
本申请涉及计算机视觉技术领域,特别涉及一种卷积神经网络的特征图增强方法、装置、设备及介质。
背景技术
随着深度学习的兴起,作为深度学习技术之一,CNN(Convolutional NeuralNetwork,卷积神经网络)在计算机视觉领域得到越来越多的发展和应用,研究人员提出了许多卷积操作,比如转置卷积、膨胀卷积、分组卷积、深度分离卷积、逐点卷积、可变形卷积等。其中,分组卷积在减少计算量和参数量、防止过拟合等方面有很大优势,并且与早期计算机视觉领域人工设计特征采用分组思想一致,比如HOG(Histogram of OrientedGradient,方向梯度直方图)、SIFT(Scale-invariant feature transform,尺度不变特征变换)、LBP(Local Binary Pattern,局部二值模式)等,因此许多经典网络AlexNet、ResNeXt、MobileNet、ShuffleNet、CapsuleNet等均使用了分组思想,都是沿着通道维对特征图分组,然后对每组子特征图进行卷积或正则化处理,可以更好地表达特定区域的语义特征信息,在计算机视觉领域取得了优异的性能提升。
目前,大部分CNN网络结构通过引入注意力机制来提升模型的特征表达能力,在计算机视觉等领域变得非常流行,多种神经网络结构都引入了通道维度或空域维度注意力机制来增强有用通道信息、压缩无用通道信息,也可以融合多尺度特征或全局上下文信息来进一步提高对特征图特定区域的增强能力,让神经网络具有更加可解释性的机制。可见,将分组后的子特征图加入注意力机制,可以进一步增强对特定区域的语义特征信息学习和表达能力,并且进一步压缩噪声和干扰。
然而,现有的嵌入到CNN网络结构中的SGE(Spatial Group-wise Enhance,空域分组增强)模块提取的语义特征信息表达并不充分,从而导致CNN网络的图像分类、分割、检测等任务性能下降。
发明内容
本申请的目的在于提供一种卷积神经网络的特征图增强方法、装置、设备及介质,以提高卷积神经网络的图像分类、分割、检测等任务性能。
第一方面,本申请实施例提供了一种卷积神经网络的特征图增强方法,包括:
对输入的原始图像进行卷积操作,得到对应的多层特征图;
针对某层特征图,将其按照通道维度进行分组,得到多个子特征图;
针对每个子特征图,利用内嵌的空域分组增强SGE模块进行全局平均池化和全局最大池化并行处理,得到对应的两个通道维度向量;
根据所述对应的两个通道维度向量,得到对应子特征图中每个通道的注意力增强因子;
根据所述注意力增强因子和对应子特征图,得到对应的增强子特征图;
根据全部增强子特征图,得到所述某层特征图对应的增强特征图。
在一种可能的实现方式中,在本申请实施例提供的上述方法中,所述根据所述对应的两个通道维度向量,得到对应子特征图中每个通道的注意力增强因子,包括:
利用1×1卷积对所述对应的两个通道维度向量降维;
利用ReLU激活函数将降维后的两个通道维度向量进行激活后相加,得到对应子特征图中每个通道的注意力增强因子。
在一种可能的实现方式中,在本申请实施例提供的上述方法中,所述根据所述注意力增强因子和对应子特征图,得到对应的增强子特征图,包括:
利用1×1卷积将所述注意力增强因子升维到对应子特征图的通道数;
利用SoftMax函数归一化所述注意力增强因子;
将归一化后的注意力增强因子与对应子特征图相乘,得到增强的第一子特征图;
对所述第一子特征图进行正则化,得到第二子特征图;
利用Sigmoid激活函数激活所述第二子特征图,得到增强的第三子特征图;
将所述第三子特征图作为增强子特征图。
在一种可能的实现方式中,在本申请实施例提供的上述方法中,所述利用Sigmoid激活函数激活所述第二子特征图,得到增强的第三子特征图,包括:
利用Sigmoid激活函数获得所述第二子特征图通道的重要性系数;
利用所述重要性系数尺度化所述第二子特征图,以重新标定所述第二子特征图通道上的空域特征重要性,得到增强的第三子特征图。
第二方面,本申请实施例提供了一种卷积神经网络的特征图增强装置,包括:
卷积模块,用于对输入的原始图像进行卷积操作,得到对应的多层特征图;
分组模块,用于针对某层特征图,将其按照通道维度进行分组,得到多个子特征图;
增强模块,用于针对每个子特征图,利用内嵌的空域分组增强SGE模块进行全局平均池化和全局最大池化并行处理,得到对应的两个通道维度向量;根据所述对应的两个通道维度向量,得到对应子特征图中每个通道的注意力增强因子;根据所述注意力增强因子和对应子特征图,得到对应的增强子特征图;
输出模块,用于根据全部增强子特征图,得到所述某层特征图对应的增强特征图。
在一种可能的实现方式中,在本申请实施例提供的上述装置中,所述增强模块,具体用于:
利用1×1卷积对所述对应的两个通道维度向量降维;
利用ReLU激活函数将降维后的两个通道维度向量进行激活后相加,得到对应子特征图中每个通道的注意力增强因子。
在一种可能的实现方式中,在本申请实施例提供的上述装置中,所述增强模块,具体用于:
利用1×1卷积将所述注意力增强因子升维到对应子特征图的通道数;
利用SoftMax函数归一化所述注意力增强因子;
将归一化后的注意力增强因子与对应子特征图相乘,得到增强的第一子特征图;
对所述第一子特征图进行正则化,得到第二子特征图;
利用Sigmoid激活函数激活所述第二子特征图,得到增强的第三子特征图;
将所述第三子特征图作为增强子特征图。
在一种可能的实现方式中,在本申请实施例提供的上述装置中,所述增强模块,具体用于:
利用Sigmoid激活函数获得所述第二子特征图通道的重要性系数;
利用所述重要性系数尺度化所述第二子特征图,以重新标定所述第二子特征图通道上的空域特征重要性,得到增强的第三子特征图。
第三方面,本申请实施例提供了一种电子设备,包括:存储器和处理器;
所述存储器,用于存储计算机程序;
其中,所述处理器执行所述存储器中的计算机程序,以实现上述第一方面以及第一方面的各个实施方式中所述的方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时用于实现上述第一方面以及第一方面的各个实施方式中所述的方法。
与现有技术相比,本申请提供的卷积神经网络的特征图增强方法、装置、设备及介质,对输入的原始图像进行卷积操作,得到对应的多层特征图,将其中某层特征图按照通道维度进行分组,得到多个子特征图,针对每个子特征图,利用内嵌的空域分组增强SGE模块进行全局平均池化和全局最大池化并行处理,得到对应的两个通道维度向量,根据所述对应的两个通道维度向量,得到对应子特征图中每个通道的注意力增强因子,根据所述注意力增强因子和对应子特征图,得到对应的增强子特征图,根据全部增强子特征图,得到某层特征图对应的增强特征图,从而通过用全局平均池化和全局最大池化操作来提取通道维度的注意力增强因子,可以更好地表达子特征图通道间重要程度的语义信息,同时重新设计空域分组增强模块结构,使得子特征图通道维度的注意力增强因子的计算更加有效,进一步提高了卷积神经网络的图像分类、分割、检测等任务性能。
附图说明
图1为本申请实施例一提供的卷积神经网络的特征图增强方法的流程示意图;
图2为本申请实施例提供的对子特征图进行增强的算法流程示意图;
图3为本申请实施例二提供的卷积神经网络的特征图增强装置的结构示意图;
图4为本申请实施例三提供的电子设备的结构示意图。
具体实施方式
下面结合附图,对本申请的具体实施方式进行详细描述,但应当理解本申请的保护范围并不受具体实施方式的限制。
除非另有其它明确表示,否则在整个说明书和权利要求书中,术语“包括”或其变换如“包含”或“包括有”等等将被理解为包括所陈述的元件或组成部分,而并未排除其它元件或其它组成部分。
图1为本申请实施例一提供的卷积神经网络的特征图增强方法的流程示意图。实际应用中,本实施例的执行主体可以为卷积神经网络的特征图增强装置,该卷积神经网络的特征图增强装置可以通过虚拟装置实现,例如软件代码,也可以通过写入有相关执行代码的实体装置实现,例如U盘,再或者,也可以通过集成有相关执行代码的实体装置实现,例如,芯片、电脑等。
如图1所示,该方法包括以下步骤S101~S106:
S101、对输入的原始图像进行卷积操作,得到对应的多层特征图。
本实施例中,预先构建的卷积神经网络对输入的原始图像进行多层卷积操作,可以得到对应的多层特征图。可以理解,其中一层特征图包括一定数量的通道。
S102、针对某层特征图,将其按照通道维度进行分组,得到多个子特征图。
本实施例中,由于卷积神经网络学习过程中,分组卷积可以逐渐捕获特殊的语义响应,使得关注位置的响应更大,而其它的位置则没有被激活或者没有响应,同时利用分组卷积也可以减少计算量和参数量,因此,可以先对上述特征图进行分组,以便更好地增强对特定区域的语义特征信息学习,具体是将特征图中一定数量的通道进行分组,得到与分组数量相同的多个子特征图。
假设多层卷积后的输出特征图为其中,C为特征图的通道数,H和W分别表示特征图的长和宽,首先将特征图沿着通道维度分为G组,那么得到的子特征图每个空域位置的向量记为X={x1,...,H×W},其中每个元素为
S103、针对每个子特征图,利用内嵌的空域分组增强SGE模块进行全局平均池化和全局最大池化并行处理,得到对应的两个通道维度向量。
S104、根据所述对应的两个通道维度向量,得到对应子特征图中每个通道的注意力增强因子。
本实施例中,步骤S104可具体实现为:利用1×1卷积对所述对应的两个通道维度向量降维;利用ReLU激活函数将降维后的两个通道维度向量进行激活后相加,得到对应子特征图中每个通道的注意力增强因子。
实际应用中,有的CNN网络结构通过引入注意力机制来提升模型的特征表达能力,这种注意力机制不仅告诉网络模型关注哪些重要特征,而且可以增强特定区域的表达能力。但是通道维度和空域维度级联注意力增强模块的方式也增加了网络模型的计算量和参数量。
图2为本申请实施例提供的对子特征图进行增强的算法流程示意图。如图2所示,图左侧X列代表将特征图分组为3个子特征图,对每个子特征图经过图下方的算法流程进行增强,得到图右侧V列中对应的增强子特征图。
下面对上述算法流程进行详细介绍。考虑到计算量和模型大小问题,本申请只使用了通道维度注意力机制,利用全局平均池化对子特征图的每一空域位置产生响应,结合全局最大池化在反向传播时只对特征响应最大的位置有梯度反馈。同时重新设计空域分组增强模块结构,通过使用全局统计特征信息对子特征图并行处理,分别用全局平均池化和全局最大池化操作来提取通道维度的注意力增强因子,用于表达子特征图通道间重要程度的语义信息。
全局统计特征信息的提取过程如下:
其中,a和b分别表示全局平均池化和全局最大池化并行处理后的通道维向量,max(·)表示对通道维向量所有位置取响应最大操作,可以得到每个通道的最大激活信息。这样操作后意味着把分组子特征图的通道维数从C×H×W压缩到同时通道维向量中的每个值用全局统计特征信息来表示每个分组子特征图通道间重要性。
可以理解,本实施例中将全局最大池化信息有效地融入到注意力增强因子计算中,增强了空域分组增强模块的语义特征信息表达能力。
为了建模子特征图通道间的相互依赖性,本申请使用带有ReLU激活函数的1×1卷积对通道维向量进行降维,增加通道间信息的非线***互能力的同时也减少了计算量,表达式为:
e=ReLU(W1a) (3)
f=ReLU(W2b) (4)
其中,W1和W2分别表示1×1卷积降维操作的权重矩阵,记为并且通道维数满足关系:
将两个通道维向量相加,即可以得到子特征图每个通道对应的注意力增强因子,表达式如下:
S105、根据所述注意力增强因子和对应子特征图,得到对应的增强子特征图。
本实施例中,该步骤S105可具体实现为:利用1×1卷积将所述注意力增强因子升维到对应子特征图的通道数;利用SoftMax函数归一化所述注意力增强因子;将归一化后的注意力增强因子与对应子特征图相乘,得到增强的第一子特征图;对所述第一子特征图进行正则化,得到第二子特征图;利用Sigmoid激活函数激活所述第二子特征图,得到增强的第三子特征图;将所述第三子特征图作为增强子特征图。
为了增加更多非线性来更好地拟合通道间复杂关系,首先使用1×1卷积升维操作,让注意力增强因子的维数达到子特征图的通道数,以便后续加权平均处理时与子特征图通道数相匹配。升维并归一化后的注意力增强因子的表达式为:
其中,W3表示1×1卷积升维操作的权重矩阵,记为
对于子特征图中的每一个空域位置,用上述归一化后的注意力增强因子u对xi加权平均,可以得到用注意力机制通道增强的子特征图,表达式为:
yi=u·xi (7)
进一步的,利用Sigmoid激活函数激活所述第二子特征图,得到增强的第三子特征图,具体可实现为:利用Sigmoid激活函数获得所述第二子特征图通道的重要性系数;利用所述重要性系数尺度化所述第二子特征图,以重新标定所述第二子特征图通道上的空域特征重要性,得到增强的第三子特征图。
本实施例中,为消除样本间幅度差异对结果的干扰,将使用正则化处理上述用注意力机制通道增强后的子特征图。对于子特征图的每一个空域位置,正则化操作的表达式如下:
其中,zi表示对通道维正则化后的子特征图,μc表示子特征图的均值,表示子特征图的方差。
然后使用Sigmoid激活函数来获得正则化后的子特征图通道维的重要性系数,用这个重要性系数来尺度化上述正则化处理后的子特征图,重新标定子特征图通道维上的空域特征重要性。描述这一处理过程的表达式如下:
vi=xi·Sigmoid(αzi+β) (11)
其中,α和β分别表示对正则化后子特征图的尺度操作和平移操作的参数,对于每一个分组而言,这两个参数都有相同的固定值。
可以理解,本实施例中重新设计了空域分组增强模块结构,采用了1×1卷积融合前降维融合后升维操作,不仅减少了计算量,又增强了子特征图通道维的信息交互能力,而且使用SoftMax激活函数获得通道维空域特征重要程度的概率来表示注意力增强因子。
S106、根据全部增强子特征图,得到所述某层特征层对应的增强特征图。
本实施例提供的卷积神经网络的特征图增强方法,通过用全局平均池化和全局最大池化操作来提取通道维度的注意力增强因子,可以更好地表达子特征图通道间重要程度的语义信息,同时重新设计空域分组增强模块结构,使得子特征图通道维度的注意力增强因子的计算更加有效,进一步提高了卷积神经网络的图像分类、分割、检测等任务性能。
下述为本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。
图3为本申请实施例二提供的卷积神经网络的特征图增强装置的结构示意图,如图3所示,该装置可以包括:
卷积模块310,用于对输入的原始图像进行卷积操作,得到对应的多层特征图;
分组模块320,用于针对某层特征图,将其按照通道维度进行分组,得到多个子特征图;
增强模块330,用于针对每个子特征图,利用内嵌的空域分组增强SGE模块进行全局平均池化和全局最大池化并行处理,得到对应的两个通道维度向量;根据所述对应的两个通道维度向量,得到对应子特征图中每个通道的注意力增强因子;根据所述注意力增强因子和对应子特征图,得到对应的增强子特征图;
输出模块340,用于根据全部增强子特征图,得到所述某层特征图对应的增强特征图。
本实施例提供的卷积神经网络的特征图增强装置,通过用全局平均池化和全局最大池化操作来提取通道维度的注意力增强因子,可以更好地表达子特征图通道间重要程度的语义信息,同时重新设计空域分组增强模块结构,使得子特征图通道维度的注意力增强因子的计算更加有效,进一步提高了卷积神经网络的图像分类、分割、检测等任务性能。
在一些实施方式中,所述增强模块330,具体用于:
利用1×1卷积对所述对应的两个通道维度向量降维;
利用ReLU激活函数将降维后的两个通道维度向量进行激活后相加,得到对应子特征图中每个通道的注意力增强因子。
在一些实施方式中,所述增强模块330,具体用于:
利用1×1卷积将所述注意力增强因子升维到对应子特征图的通道数;
利用SoftMax函数归一化所述注意力增强因子;
将归一化后的注意力增强因子与对应子特征图相乘,得到增强的第一子特征图;
对所述第一子特征图进行正则化,得到第二子特征图;
利用Sigmoid激活函数激活所述第二子特征图,得到增强的第三子特征图;
将所述第三子特征图作为增强子特征图。
在一些实施方式中,所述增强模块330,具体用于:
利用Sigmoid激活函数获得所述第二子特征图通道的重要性系数;
利用所述重要性系数尺度化所述第二子特征图,以重新标定所述第二子特征图通道上的空域特征重要性,得到增强的第三子特征图。
图4为本申请实施例三提供的电子设备的结构示意图,如图4所示,该设备包括:存储器401和处理器402;
存储器401,用于存储计算机程序;
其中,处理器402执行存储器401中的计算机程序,以实现如上所述各方法实施例所提供的方法。
在实施例中,以一电子设备对本申请提供的卷积神经网络的特征图增强装置进行示例。处理器可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备中的其他组件以执行期望的功能。
存储器可以包括一个或多个计算机程序产品,计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器可以运行程序指令,以实现上文的本申请的各个实施例中的方法以及/或者其他期望的功能。在计算机可读存储介质中还可以存储诸如输入信号、信号分量、噪声分量等各种内容。
本申请实施例四提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,该计算机程序被处理器执行时用于实现如上所述各方法实施例所提供的方法。
实际应用中,本实施例中的计算机程序可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码,程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
实际应用中,计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
前述对本申请的具体示例性实施方案的描述是为了说明和例证的目的。这些描述并非想将本申请限定为所公开的精确形式,并且很显然,根据上述教导,可以进行很多改变和变化。对示例性实施例进行选择和描述的目的在于解释本申请的特定原理及其实际应用,从而使得本领域的技术人员能够实现并利用本申请的各种不同的示例性实施方案以及各种不同的选择和改变。本申请的范围意在由权利要求书及其等同形式所限定。

Claims (10)

1.一种卷积神经网络的特征图增强方法,其特征在于,包括:
对输入的原始图像进行卷积操作,得到对应的多层特征图;
针对某层特征图,将其按照通道维度进行分组,得到多个子特征图;
针对每个子特征图,利用内嵌的空域分组增强SGE模块进行全局平均池化和全局最大池化并行处理,得到对应的两个通道维度向量;
根据所述对应的两个通道维度向量,得到对应子特征图中每个通道的注意力增强因子;
根据所述注意力增强因子和对应子特征图,得到对应的增强子特征图;
根据全部增强子特征图,得到所述某层特征图对应的增强特征图。
2.根据权利要求1所述的方法,其特征在于,所述根据所述对应的两个通道维度向量,得到对应子特征图中每个通道的注意力增强因子,包括:
利用1×1卷积对所述对应的两个通道维度向量降维;
利用ReLU激活函数将降维后的两个通道维度向量进行激活后相加,得到对应子特征图中每个通道的注意力增强因子。
3.根据权利要求2所述的方法,其特征在于,所述根据所述注意力增强因子和对应子特征图,得到对应的增强子特征图,包括:
利用1×1卷积将所述注意力增强因子升维到对应子特征图的通道数;
利用SoftMax函数归一化所述注意力增强因子;
将归一化后的注意力增强因子与对应子特征图相乘,得到增强的第一子特征图;
对所述第一子特征图进行正则化,得到第二子特征图;
利用Sigmoid激活函数激活所述第二子特征图,得到增强的第三子特征图;
将所述第三子特征图作为增强子特征图。
4.根据权利要求3所述的方法,其特征在于,所述利用Sigmoid激活函数激活所述第二子特征图,得到增强的第三子特征图,包括:
利用Sigmoid激活函数获得所述第二子特征图通道的重要性系数;
利用所述重要性系数尺度化所述第二子特征图,以重新标定所述第二子特征图通道上的空域特征重要性,得到增强的第三子特征图。
5.一种卷积神经网络的特征图增强装置,其特征在于,包括:
卷积模块,用于对输入的原始图像进行卷积操作,得到对应的多层特征图;
分组模块,用于针对某层特征图,将其按照通道维度进行分组,得到多个子特征图;
增强模块,用于针对每个子特征图,利用内嵌的空域分组增强SGE模块进行全局平均池化和全局最大池化并行处理,得到对应的两个通道维度向量;根据所述对应的两个通道维度向量,得到对应子特征图中每个通道的注意力增强因子;根据所述注意力增强因子和对应子特征图,得到对应的增强子特征图;
输出模块,用于根据全部增强子特征图,得到所述某层特征图对应的增强特征图。
6.根据权利要求5所述的装置,其特征在于,所述增强模块,具体用于:
利用1×1卷积对所述对应的两个通道维度向量降维;
利用ReLU激活函数将降维后的两个通道维度向量进行激活后相加,得到对应子特征图中每个通道的注意力增强因子。
7.根据权利要求6所述的装置,其特征在于,所述增强模块,具体用于:
利用1×1卷积将所述注意力增强因子升维到对应子特征图的通道数;
利用SoftMax函数归一化所述注意力增强因子;
将归一化后的注意力增强因子与对应子特征图相乘,得到增强的第一子特征图;
对所述第一子特征图进行正则化,得到第二子特征图;
利用Sigmoid激活函数激活所述第二子特征图,得到增强的第三子特征图;
将所述第三子特征图作为增强子特征图。
8.根据权利要求7所述的装置,其特征在于,所述增强模块,具体用于:
利用Sigmoid激活函数获得所述第二子特征图通道的重要性系数;
利用所述重要性系数尺度化所述第二子特征图,以重新标定所述第二子特征图通道上的空域特征重要性,得到增强的第三子特征图。
9.一种电子设备,包括:存储器和处理器;
所述存储器,用于存储计算机程序;
其中,所述处理器执行所述存储器中的计算机程序,以实现如权利要求1-4中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时用于实现如权利要求1-4中任一项所述的方法。
CN201910605387.6A 2019-07-05 2019-07-05 卷积神经网络的特征图增强方法、装置、设备及介质 Active CN110490813B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910605387.6A CN110490813B (zh) 2019-07-05 2019-07-05 卷积神经网络的特征图增强方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910605387.6A CN110490813B (zh) 2019-07-05 2019-07-05 卷积神经网络的特征图增强方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN110490813A true CN110490813A (zh) 2019-11-22
CN110490813B CN110490813B (zh) 2021-12-17

Family

ID=68546677

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910605387.6A Active CN110490813B (zh) 2019-07-05 2019-07-05 卷积神经网络的特征图增强方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN110490813B (zh)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111027670A (zh) * 2019-11-04 2020-04-17 重庆特斯联智慧科技股份有限公司 特征图处理方法、装置、电子设备及存储介质
CN111161195A (zh) * 2020-01-02 2020-05-15 重庆特斯联智慧科技股份有限公司 一种特征图处理方法、装置、存储介质及终端
CN111274999A (zh) * 2020-02-17 2020-06-12 北京迈格威科技有限公司 数据处理、图像处理方法、装置及电子设备
CN111325751A (zh) * 2020-03-18 2020-06-23 重庆理工大学 基于注意力卷积神经网络的ct图像分割***
CN111444957A (zh) * 2020-03-25 2020-07-24 腾讯科技(深圳)有限公司 图像数据处理方法、装置、计算机设备和存储介质
CN111539325A (zh) * 2020-04-23 2020-08-14 四川旅游学院 基于深度学习的森林火灾探测方法
CN111967478A (zh) * 2020-07-08 2020-11-20 特斯联科技集团有限公司 一种基于权重翻转的特征图重构方法、***、存储介质及终端
CN112001248A (zh) * 2020-07-20 2020-11-27 北京百度网讯科技有限公司 主动交互的方法、装置、电子设备和可读存储介质
CN112149694A (zh) * 2020-08-28 2020-12-29 特斯联科技集团有限公司 一种基于卷积神经网络池化模块的图像处理方法、***、存储介质及终端
CN112183645A (zh) * 2020-09-30 2021-01-05 深圳龙岗智能视听研究院 基于上下文感知的注意力机制的图像美学质量评价方法
CN112465828A (zh) * 2020-12-15 2021-03-09 首都师范大学 一种图像语义分割方法、装置、电子设备及存储介质
CN112668656A (zh) * 2020-12-30 2021-04-16 深圳市优必选科技股份有限公司 一种图像分类方法、装置、计算机设备和存储介质
CN112767406A (zh) * 2021-02-02 2021-05-07 苏州大学 一种适用于荧光染色裂隙灯图像角膜溃疡分割的深度卷积神经网络
CN113011465A (zh) * 2021-02-25 2021-06-22 浙江净禾智慧科技有限公司 一种基于分组多级融合的生活垃圾投放智能化监管方法
CN113052760A (zh) * 2021-01-29 2021-06-29 成都商汤科技有限公司 一种池化方法、芯片、设备和存储介质
CN113052173A (zh) * 2021-03-25 2021-06-29 北京百度网讯科技有限公司 样本数据的特征增强方法和装置
CN113222827A (zh) * 2020-01-21 2021-08-06 北京三星通信技术研究有限公司 图像处理方法、装置、电子设备及计算机可读存储介质
CN113361529A (zh) * 2020-03-03 2021-09-07 北京四维图新科技股份有限公司 图像语义分割方法、装置、电子设备及存储介质
CN113486898A (zh) * 2021-07-08 2021-10-08 西安电子科技大学 一种基于改进ShuffleNet的雷达信号RD图像干扰辨识方法及***
CN113920099A (zh) * 2021-10-15 2022-01-11 深圳大学 一种息肉分割方法、装置、计算机设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109299268A (zh) * 2018-10-24 2019-02-01 河南理工大学 一种基于双通道模型的文本情感分析方法
CN109376804A (zh) * 2018-12-19 2019-02-22 中国地质大学(武汉) 基于注意力机制和卷积神经网络高光谱遥感图像分类方法
CN109685199A (zh) * 2017-10-18 2019-04-26 斯特拉德视觉公司 创建包含关于池化类型的信息的表的方法和装置及使用其的测试方法和测试装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109685199A (zh) * 2017-10-18 2019-04-26 斯特拉德视觉公司 创建包含关于池化类型的信息的表的方法和装置及使用其的测试方法和测试装置
CN109299268A (zh) * 2018-10-24 2019-02-01 河南理工大学 一种基于双通道模型的文本情感分析方法
CN109376804A (zh) * 2018-12-19 2019-02-22 中国地质大学(武汉) 基于注意力机制和卷积神经网络高光谱遥感图像分类方法

Cited By (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111027670B (zh) * 2019-11-04 2022-07-22 重庆特斯联智慧科技股份有限公司 特征图处理方法、装置、电子设备及存储介质
CN111027670A (zh) * 2019-11-04 2020-04-17 重庆特斯联智慧科技股份有限公司 特征图处理方法、装置、电子设备及存储介质
CN111161195A (zh) * 2020-01-02 2020-05-15 重庆特斯联智慧科技股份有限公司 一种特征图处理方法、装置、存储介质及终端
CN111161195B (zh) * 2020-01-02 2023-10-13 重庆特斯联智慧科技股份有限公司 一种特征图处理方法、装置、存储介质及终端
CN113222827A (zh) * 2020-01-21 2021-08-06 北京三星通信技术研究有限公司 图像处理方法、装置、电子设备及计算机可读存储介质
CN111274999B (zh) * 2020-02-17 2024-04-19 北京迈格威科技有限公司 数据处理、图像处理方法、装置及电子设备
CN111274999A (zh) * 2020-02-17 2020-06-12 北京迈格威科技有限公司 数据处理、图像处理方法、装置及电子设备
CN113361529A (zh) * 2020-03-03 2021-09-07 北京四维图新科技股份有限公司 图像语义分割方法、装置、电子设备及存储介质
CN113361529B (zh) * 2020-03-03 2024-05-10 北京四维图新科技股份有限公司 图像语义分割方法、装置、电子设备及存储介质
CN111325751A (zh) * 2020-03-18 2020-06-23 重庆理工大学 基于注意力卷积神经网络的ct图像分割***
CN111444957A (zh) * 2020-03-25 2020-07-24 腾讯科技(深圳)有限公司 图像数据处理方法、装置、计算机设备和存储介质
CN111444957B (zh) * 2020-03-25 2023-11-07 腾讯科技(深圳)有限公司 图像数据处理方法、装置、计算机设备和存储介质
CN111539325A (zh) * 2020-04-23 2020-08-14 四川旅游学院 基于深度学习的森林火灾探测方法
CN111967478B (zh) * 2020-07-08 2023-09-05 特斯联科技集团有限公司 一种基于权重翻转的特征图重构方法、***、存储介质及终端
CN111967478A (zh) * 2020-07-08 2020-11-20 特斯联科技集团有限公司 一种基于权重翻转的特征图重构方法、***、存储介质及终端
CN112001248B (zh) * 2020-07-20 2024-03-01 北京百度网讯科技有限公司 主动交互的方法、装置、电子设备和可读存储介质
CN112001248A (zh) * 2020-07-20 2020-11-27 北京百度网讯科技有限公司 主动交互的方法、装置、电子设备和可读存储介质
CN112149694A (zh) * 2020-08-28 2020-12-29 特斯联科技集团有限公司 一种基于卷积神经网络池化模块的图像处理方法、***、存储介质及终端
CN112149694B (zh) * 2020-08-28 2024-04-05 特斯联科技集团有限公司 一种基于卷积神经网络池化模块的图像处理方法、***、存储介质及终端
CN112183645A (zh) * 2020-09-30 2021-01-05 深圳龙岗智能视听研究院 基于上下文感知的注意力机制的图像美学质量评价方法
CN112465828B (zh) * 2020-12-15 2024-05-31 益升益恒(北京)医学技术股份公司 一种图像语义分割方法、装置、电子设备及存储介质
CN112465828A (zh) * 2020-12-15 2021-03-09 首都师范大学 一种图像语义分割方法、装置、电子设备及存储介质
CN112668656A (zh) * 2020-12-30 2021-04-16 深圳市优必选科技股份有限公司 一种图像分类方法、装置、计算机设备和存储介质
CN112668656B (zh) * 2020-12-30 2023-10-13 深圳市优必选科技股份有限公司 一种图像分类方法、装置、计算机设备和存储介质
CN113052760A (zh) * 2021-01-29 2021-06-29 成都商汤科技有限公司 一种池化方法、芯片、设备和存储介质
CN112767406A (zh) * 2021-02-02 2021-05-07 苏州大学 一种适用于荧光染色裂隙灯图像角膜溃疡分割的深度卷积神经网络
CN112767406B (zh) * 2021-02-02 2023-12-12 苏州大学 角膜溃疡分割的深度卷积神经网络训练方法及分割方法
CN113011465B (zh) * 2021-02-25 2021-09-03 浙江净禾智慧科技有限公司 一种基于分组多级融合的生活垃圾投放智能化监管方法
CN113011465A (zh) * 2021-02-25 2021-06-22 浙江净禾智慧科技有限公司 一种基于分组多级融合的生活垃圾投放智能化监管方法
CN113052173A (zh) * 2021-03-25 2021-06-29 北京百度网讯科技有限公司 样本数据的特征增强方法和装置
CN113486898B (zh) * 2021-07-08 2024-05-31 西安电子科技大学 一种基于改进ShuffleNet的雷达信号RD图像干扰辨识方法及***
CN113486898A (zh) * 2021-07-08 2021-10-08 西安电子科技大学 一种基于改进ShuffleNet的雷达信号RD图像干扰辨识方法及***
CN113920099B (zh) * 2021-10-15 2022-08-30 深圳大学 一种基于非局部信息提取的息肉分割方法及相关组件
CN113920099A (zh) * 2021-10-15 2022-01-11 深圳大学 一种息肉分割方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
CN110490813B (zh) 2021-12-17

Similar Documents

Publication Publication Date Title
CN110490813A (zh) 卷积神经网络的特征图增强方法、装置、设备及介质
Ma et al. Pconv: The missing but desirable sparsity in dnn weight pruning for real-time execution on mobile devices
Liu et al. Squeezedtext: A real-time scene text recognition by binary convolutional encoder-decoder network
Sze et al. Efficient processing of deep neural networks: A tutorial and survey
CN113222041B (zh) 图结构表征的高阶关联发现细粒度图像识别方法及装置
Liu et al. Flower classification via convolutional neural network
Liu et al. Deep learning based single sample face recognition: a survey
Bi et al. A survey on evolutionary computation for computer vision and image analysis: Past, present, and future trends
CN110008853B (zh) 行人检测网络及模型训练方法、检测方法、介质、设备
CN113822209B (zh) 高光谱图像识别方法、装置、电子设备及可读存储介质
Zeng et al. Deep learning for scene classification: A survey
CN106650781A (zh) 一种卷积神经网络图像识别方法及装置
Yu et al. A lightweight and efficient model for surface tiny defect detection
Al-Sabaawi et al. Amended convolutional neural network with global average pooling for image classification
Wang et al. Rapid detection of incomplete coal and gangue based on improved PSPNet
CN107967461A (zh) Svm 差分模型训练及人脸验证方法、装置、终端及存储介质
Kishorjit Singh et al. Image classification using SLIC superpixel and FAAGKFCM image segmentation
Hussain et al. Additive deep feature optimization for semantic image retrieval
Liu et al. Single sample face recognition via BoF using multistage KNN collaborative coding
Xu et al. Multi‐pyramid image spatial structure based on coarse‐to‐fine pyramid and scale space
Ma et al. Facial expression recognition method based on PSA—YOLO network
Jin et al. Research on image sentiment analysis technology based on sparse representation
Zang et al. A pooled Object Bank descriptor for image scene classification
Liu et al. Lightweight target detection algorithm based on YOLOv4
Wu et al. A lightweight network for vehicle detection based on embedded system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant