WO2019153908A1

WO2019153908A1 - 基于注意力模型的图像识别方法和***

Info

Publication number: WO2019153908A1
Application number: PCT/CN2018/122684
Authority: WO
Inventors: 张志伟; 杨帆
Original assignee: 北京达佳互联信息技术有限公司
Priority date: 2018-02-11
Filing date: 2018-12-21
Publication date: 2019-08-15
Also published as: CN108364023A

Abstract

一种基于注意力模型的图像识别方法和***，首先获取图像矩阵形状为[W，H，C]的输入特征图，其中，W为宽度，H为高度，C为通道数；然后使用预设的空间映射权重矩阵对输入特征图进行空间映射，并经过激活函数激活后得到空间权重矩阵，将所述空间权重矩阵与输入特征图的图像矩阵按位相乘得到输出特征图，其中，当所述预设的空间映射权重矩阵为注意力在于图像宽度和高度的空间注意力矩阵[C，1]时，空间权重矩阵的形状为[W，H，1]，或者当所述预设的空间映射权重矩阵为注意力在于图像通道数的通道注意力矩阵[C，C]时，空间权重矩阵的形状为[1，1，C]，可有效提高特征提取的针对性，从而强化对于图像局部特征的提取能力。

Description

基于注意力模型的图像识别方法和***

本申请要求于2018年2月11日提交中国专利局、申请号为201810139775.5、申请名称为“基于注意力模型的图像识别方法和***”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及图像处理技术领域，具体而言，本申请涉及一种基于注意力模型的图像识别方法和***。

背景技术

近年来，深度学习模型在视频图像处理、语音识别、自然语言处理等相关领域得到了广泛应用。但是在处理具体的图像分类任务或者语音识别任务时，会由于输入数据的多样性，使得深度学习模型只能捕捉到数据的全局信息，而忽视了数据的局部信息。

为了解决此问题，相关技术中提供了一些解决办法。以图像分类为例，一些传统的解决办法是将图像人为划定成多个分割区域，采用空间金字塔的形式捕捉数据的局部信息，虽然该解决方法可以一定程度上解决上述问题，但是由于是人为预先划定分割区域，所以其对不同数据的泛化能力较差。

发明内容

本申请的目的旨在至少能解决上述的技术缺陷之一，特别是容易忽略数据局部信息的技术缺陷。

本申请提供一种基于注意力模型的图像识别方法，包括如下步骤：

步骤S10：获取图像矩阵形状为[W，H，C]的输入特征图，其中，W为宽度，H为高度，C为通道数；

步骤S20：使用预设的空间映射权重矩阵对输入特征图进行空间映射，并经过激活函数激活后得到空间权重矩阵，将所述空间权重矩阵与输入特征图的图像矩阵按位相乘得到输出特征图，其中，当所述预设的空间映射权重矩阵为注意力在于图像宽度和高度的空间注意力矩阵[C，1]时，空间权重矩阵的形状为[W，H，1]，或者当所述预设的空间映射权重矩阵为注意力在于图像通道数的通道注意力矩阵[C，C]时，空间权重矩阵的形状为[1，1，C]。

在其中一个实施例中，当所述预设的空间映射权重矩阵为空间注意力矩阵[C，1]时，在步骤S20中使用以下公式：

o _:,:,c＝i _:,:,c⊙sigmoid(i _:,:,c·w _s+b _s)

其中，⊙为按位乘，·为矩阵乘法，o _:,:,c为输出特征图，i _:,:,c为输入特征图，sigmoid为激活函数，w _s为空间映射权重，b _s为偏差。

在其中一个实施例中，所述预设的空间映射权重矩阵为通道注意力矩阵[C，C]时，在步骤S20中使用以下公式：

o _w,h,:＝i _w,h,:⊙sigmoid(mean(i _w,h,:)·w _c+b _c)

其中，⊙为按位乘，·为矩阵乘法，o _w,h,:为输出特征图，i _w,h,:为输入特征图，sigmoid为激活函数，mean为求平均值函数，w _c为空间映射权重，b _c为偏差。

在其中一个实施例中，步骤S20包括：

在卷积神经网络的浅层网络使用所述空间注意力矩阵[C，1]对输入特征图进行空间映射，并经过激活函数激活后得到第一空间权重矩阵，将所述第一空间权重矩阵与输入特征图的图像矩阵按位相乘得到第一输出特征图；

在卷积神经网络的深层网络使用所述通道注意力矩阵[C，1]对所述第一输出特征图进行空间映射，并经过激活函数激活后得到第二空间权重矩阵，将所述第二空间权重矩阵与所述第一输出特征图的图像矩阵按位相乘得到第二输出特征图。

在其中一个实施例中，还包括步骤S30：

根据所述输出特征图应用分类器进行图像分类。

本申请还提供一种基于注意力模型的图像识别***，包括：

图像获取模块，用于获取图像矩阵形状为[W，H，C]的输入特征图，其中，W为宽度，H为高度，C为通道数；

图像处理模块，用于使用预设的空间映射权重矩阵对输入特征图进行空间映射，并经过激活函数激活后得到空间权重矩阵，将所述空间权重矩阵与输入特征图的图像矩阵按位相乘得到输出特征图，其中，所述预设的空间映射权重矩阵为注意力在于图像宽度和高度的空间注意力矩阵[C，1]，此时空间权重矩阵的形状为[W，H，1]，或者所述预设的空间映射权重矩阵为注意力在于图像通道数的通道注意力矩阵[C，C]，此时空间权重矩阵的形状为[1，1，C]。

在其中一个实施例中，所述预设的空间映射权重矩阵为空间注意力矩阵[C，1]时，所述图像处理模块使用以下公式得到输出特征图：

o _:,:,c＝ _:,:,c⊙sigmoid(i _:,:,c·w _s+b _s)

在其中一个实施例中，所述预设的空间映射权重矩阵为通道注意力矩阵[C，C]时，所述图像处理模块使用以下公式得到输出特征图：

o _w,h,:＝i _w,h,:⊙sigmoid(mean(i _w,h,:)·w _c+b _c)

在其中一个实施例中，所述图像处理模块包括低级语义特征提取模块和高级语义特征提取模块；

所述低级语义特征提取模块用于：在卷积神经网络的浅层网络使用所述空间注意力矩阵[C，1]对输入特征图进行空间映射，并经过激活函数激活后得到第一空间权重矩阵，将所述第一空间权重矩阵与输入特征图的图像矩阵按位相乘得到第一输出特征图；

所述高级语义特征提取模块用于：在卷积神经网络的深层网络使用所述通道注意力矩阵[C，1]对所述第一输出特征图进行空间映射，并经过激活函数激活后得到第二空间权重矩阵，将所述第二空间权重矩阵与所述第一输出特征图的图像矩阵按位相乘得到第二输出特征图。

在其中一个实施例中，还包括分类模块，用于根据所述输出特征图应用分类器进行图像分类。

本申请实施例还提供了一种电子设备，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

存储器，用于存放计算机程序；

处理器，用于执行存储器上所存放的程序时，实现本申请实施例所提供的基于注意力模型的图像识别方法。

本申请实施例还提供了一种存储介质，所述存储介质内存储有处理程序，所述处理程序被处理器执行时实现本申请实施例所提供的基于注意力模型的图像识别方法。

本申请实施例还提供了一种应用程序，所述应用程序用于在运行时执行本申请实施例所提供的基于注意力模型的图像识别方法。

上述的基于注意力模型的图像识别方法和***，首先获取图像矩阵形状为[W，H，C]的输入特征图，其中，W为宽度，H为高度，C为通道数；然后使用预设的空间映射权重矩阵对输入特征图进行空间映射，并经过激活函数激活后得到空间权重矩阵，将所述空间权重矩阵与输入特征图的图像矩阵按位相乘得到输出特征图，其中，所述预设的空间映射权重矩阵为注意力在于图像宽度和高度的空间注意力矩阵[C，1]，此时空间权重矩阵的形状为[W，H，1]，或者所述预设的空间映射权重矩阵为注意力在于图像通道数的通道注意力矩阵[C，C]，此时空间权重矩阵的形状为[1，1，C]。通过上述的的空间注意力矩阵[C，1]或通道注意力矩阵[C，C]，可以使得在特征提取过程中注意力在于空间或通道，有效提高特征提取的针对性，从而强化对于图像局部特征的提取能力。

本申请附加的方面和优点将在下面的描述中部分给出，这些将从下面的描述中变得明显，或通过本申请的实践了解到。

附图说明

本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中：

图1为一个实施例的基于注意力模型的图像识别方法流程示意图；

图2为一个实施例的基于空间注意力模型的特征提取过程示意图；

图3为一个实施例的基于通道注意力模型的特征提取过程示意图；

图4为另一个实施例的基于注意力模型的图像识别方法流程示意图；

图5为一个实施例的电子设备的结构示意图。

具体实施方式

下面详细描述本申请的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本申请，而不能解释为对本申请的限制。

本技术领域技术人员可以理解，除非特意声明，这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是，本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件，但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。

本技术领域技术人员可以理解，除非另外定义，这里使用的所有术语(包括技术术语和科学术语)，具有与本申请所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是，诸如通用字典中定义的那些术语，应该被理解为具有与现有技术的上下文中的意义一致的意义，并且除非像这里一样被特定定义，否则不会用理想化或过于正式的含义来解释。

实施例一

图1为一个实施例的基于注意力模型的图像识别方法的流程示意图，一种基于注意力模型的图像识别方法，可以包括如下步骤：

步骤S10：获取图像矩阵形状为[W，H，C]的输入特征图，其中，W为宽度(图像的宽度，单位为像素)，H为高度(图像的高度，单位为像素)，C为通道数(图像的颜色通道数量)。这里的图像矩阵为三维矩阵，[W，H，C]的格式还可以写成W*H*C的格式，即宽度*高度*通道数。其中，输入特征图为作为输入内容的特征图，特征图可以包括：图像的颜色特征、图像的纹理特征、图像的形状特征、图像的空间关系特征等。本发明实施例对特征图所包含的图像的特征不做具体限定。

步骤S20：使用预设的空间映射权重矩阵对输入特征图进行空间映射，并经过激活函数激活后得到空间权重矩阵，将空间权重矩阵与输入特征图的图像矩阵按位相乘得到输出特征图，其中，当预设的空间映射权重矩阵为注意力在于图像宽度和高度的空间注意力矩阵[C，1]，此时空间权重矩阵的形状为[W，H，1]；或者当预设的空间映射权重矩阵为注意力在于图像通道数的通道注意力矩阵[C，C]，此时空间权重矩阵的形状为[1，1，C]。

其中，输出特征图为作为输出结果的特征图。

需要说明的是，在实际应用中，可以根据实际情况设置激活函数，其中，激活函数可以有多种，例如，Sigmoid函数、Tanh函数或者ReLU函数。

在一种实现方式中，在本实施例中，预设的空间映射权重矩阵为空间注意力矩阵[C，1]时，在步骤S20中使用以下公式得到输出特征图：

o _:,:,c＝i _:,:,c⊙sigmoid(i _:,:,c·w _s+b _s)

其中，⊙为按位乘，·为矩阵乘法，o _:,:,c为输出特征图(图像矩阵)，i _:,:,c为输入特征图(图像矩阵)，sigmoid为激活函数，w _s为空间映射权重，b _s为偏差。⊙是表示两个相同尺寸矩阵中相同位置的数据相乘以生成一个同一尺寸的矩阵。例如，A和B为两个2*2的二维矩阵，A⊙B生成2*2的二维矩阵K。其中，A矩阵中的数据为Amn(A11，A12，A21，A22)，m为行数，n为列数；B矩阵中的数据为Bmn(B11，B12，B21，B22)，m为行数，n为列数；K矩阵中的数据为Kmn(K11，K12，K21，K22)，m为行数，n为列数；则Amn×Bmn＝Kmn，即A11×B11＝K11，A12×B12＝K12，A21×B21＝K21，A22×B22＝K22。

图2为一个实施例的基于空间注意力模型的特征提取过程示意图，i为输入特征图，w为空间权重矩阵，o为输出特征图。

在本实施例中，预设的空间映射权重矩阵为通道注意力矩阵[C，C]时，在步骤S20中使用以下公式得到输出特征图：

o _w,h,:＝i _w,h,:⊙sigmoid(mean(i _w,h,:)·w _c+b _c)

其中，⊙为按位乘，·为矩阵乘法，o _w,h,:为输出特征图(图像矩阵)，i _w,h,:为输入特征图(图像矩阵)，sigmoid为激活函数，mean为求平均值函数，w _c为空间映射权重，b _c为偏差。

图3为一个实施例的基于通道注意力模型的特征提取过程示意图，左侧的“特征图1、特征图2、……特征图m”表示m个通道的输入特征图，右侧的“特征图1、特征图2、……特征图m”表示m个通道的输出特征图。

在上述本实施例中，还可以包括步骤S30：根据输出特征图应用分类器进行图像分类。

在该步骤中，输出特征图应用分类器可以根据图像的颜色特征、图像的纹理特征、图像的形状特征或图像的空间关系特征实现对图像的分类。

实施例二

图4为另一个实施例的基于注意力模型的图像识别方法流程示意图，一种基于注意力模型的图像识别方法，包括如下步骤：

步骤S21：获取图像矩阵形状为[W，H，C]的输入特征图，其中，W为宽度(图像的宽度，单位为像素)，H为高度(图像的高度，单位为像素)，C为通道数(图像的颜色通道数量)。这里的图像矩阵为三维矩阵，[W，H，C]的格式还可以写成W*H*C的格式，即宽度*高度*通道数。

步骤S22：在卷积神经网络的浅层网络使用空间注意力矩阵[C，1]对输入特征图进行空间映射，并经过激活函数激活后得到第一空间权重矩阵，将第一空间权重矩阵与输入特征图的图像矩阵按位相乘得到第一输出特征图。浅层网络用于提取图像的底层特征，所以在空间上较为敏感，使用空间注意力矩阵[C，1]提取特征的注意力模式比较合适。

卷积神经网络可以包括输入层、中间层和输出层，其中，卷积神经网络的浅层网络可以指卷积神经网络的输入层，通过该浅层网络可以获取到图像的底层特征，该底层特征可以包括：图像的颜色特征、图像的纹理特征及图像的形状特征。

在本实施例中，可以使用以下公式得到第一输出特征图：

o _:,:,c＝i _:,:,c⊙sigmoid(i _:,:,c·w _s+b _s)

其中，⊙为按位乘，·为矩阵乘法，o _:,:,c为输出特征图(即第一输出特征图)，i _:,:,c为输入特征图(即输入特征图)，sigmoid为激活函数，w _s为空间映射权重(即空间注意力矩阵[C，1])，b _s为偏差，sigmoid(i _:,:,c·w _s+b _s)为第一空间权重矩阵。

步骤S23：在卷积神经网络的深层网络使用通道注意力矩阵[C，1]对第一输出特征图进行空间映射，并经过激活函数激活后得到第二空间权重矩阵，将第二空间权重矩阵与第一输出特征图的图像矩阵按位相乘得到第二输出特征图。深层网络用于提取高级语义层级的特征，所以对通道的信息较为敏感。

卷积神经网络可以包括输入层、中间层和输出层，其中，卷积神经网络的深层网络可以指卷积神经网络的输出层，通过该深层网络可以获取到图像的深层特征，该深层特征可以是图像的空间关系特征。

在本实施例中，使用以下公式得到第二输出特征图：

o _w,h,:＝i _w,h,:⊙sigmoid(mean(i _w,h,:)·w _c+b _c)

其中，⊙为按位乘，·为矩阵乘法，o _w,h,:为输出特征图(即第二输出特征图)，i _w,h,:为输入特征图(即第一输出特征图)，sigmoid为激活函数，mean为求平均值函数，w _c为空间映射权重，b _c为偏差，为第二空间权重矩阵。

在上述本实施例中，还可以包括步骤S24：根据第二输出特征图应用分类器进行图像分类。

实施例三

本申请还提供一种基于注意力模型的图像识别***，包括：

图像获取模块，用于获取图像矩阵形状为[W，H，C]的输入特征图，其中，W为宽度，H为高度，C为通道数。

图像处理模块，用于使用预设的空间映射权重矩阵对输入特征图进行空间映射，并经过激活函数激活后得到空间权重矩阵，将空间权重矩阵与输入特征图的图像矩阵按位相乘得到输出特征图，其中，当预设的空间映射权重矩阵为注意力在于图像宽度和高度的空间注意力矩阵[C，1]，此时空间权重矩阵的形状为[W，H，1]，或者当预设的空间映射权重矩阵为注意力在于图像通道数的通道注意力矩阵[C，C]，此时空间权重矩阵的形状为[1，1，C]。

在本实施例中，当预设的空间映射权重矩阵为空间注意力矩阵[C，1]时，图像处理模块使用以下公式得到输出特征图：

o _:,:,c＝i _:,:,c⊙sigmoid(i _:,:,c·w _s+b _s)

在本实施例中，当预设的空间映射权重矩阵为通道注意力矩阵[C，C]时，图像处理模块使用以下公式得到输出特征图：

o _w,h,:＝i _w,h,:⊙sigmoid(mean(i _w,h,:)·w _c+b _c)

在上述本实施例中，还可以包括分类模块，用于根据输出特征图应用分类器进行图像分类。

实施例四

本申请还提供一种基于注意力模型的图像识别***，包括：图像获取模块和图像处理模块。

图像获取模块用于获取图像矩阵形状为[W，H，C]的输入特征图，其中，W为宽度，H为高度，C为通道数。

图像处理模块包括低级语义特征提取模块和高级语义特征提取模块。

低级语义特征提取模块用于：在卷积神经网络的浅层网络使用空间注意力矩阵[C，1]对输入特征图进行空间映射，并经过激活函数激活后得到第一空间权重矩阵，将第一空间权重矩阵与输入特征图的图像矩阵按位相乘得到第一输出特征图。浅层网络用于提取图像的底层特征，所以在空间上较为敏感，使用空间注意力矩阵[C，1]提取特征的注意力模式比较合适。

在本实施例中，可以使用以下公式得到第一输出特征图：

o _:,:,c＝i _:,:,c⊙sigmoid(i _:,:,c·w _s+b _s)

高级语义特征提取模块用于：在卷积神经网络的深层网络使用通道注意力矩阵[C，1]对第一输出特征图进行空间映射，并经过激活函数激活后得到第二空间权重矩阵，将第二空间权重矩阵与第一输出特征图的图像矩阵按位相乘得到第二输出特征图。深层网络用于提取高级语义层级的特征，所以对通道的信息较为敏感。

在本实施例中，可以使用以下公式得到第二输出特征图：

o _w,h,:＝i _w,h,:⊙sigmoid(mean(i _w,h,:)·w _c+b _c)

其中，⊙为按位乘，·为矩阵乘法，o _w,h,:为输出特征图(即第二输出特征图)，i _w,h,:为输入特征图(即第一输出特征图)，sigmoid为激活函数，mean为求平均值函数，w _c为空间映射权重，b _c为偏差，sigmoid(mean(i _w,h,:)·w _c+b _c)为第二空间权重矩阵。

在本实施例中，还包括分类模块，用于根据第二输出特征图应用分类器进行图像分类。

上述的基于注意力模型的图像识别方法和***，首先获取图像矩阵形状为[W，H，C]的输入特征图，其中，W为宽度，H为高度，C为通道数；然后使用预设的空间映射权重矩阵对输入特征图进行空间映射，并经过激活函数激活后得到空间权重矩阵，将空间权重矩阵与输入特征图的图像矩阵按位相乘得到输出特征图，其中，当预设的空间映射权重矩阵为注意力在于图像宽度和高度的空间注意力矩阵[C，1]时，空间权重矩阵的形状为[W，H，1]，或者当预设的空间映射权重矩阵为注意力在于图像通道数的通道注意力矩阵[C，C]时，空间权重矩阵的形状为[1，1，C]。通过上述的的空间注意力矩阵[C，1]或通道注意力矩阵[C，C]，可以使得在特征提取过程中注意力在于空间或通道，有效提高特征提取的针对性，从而强化对于图像局部特征的提取能力。

本申请实施例还提供了一种电子设备，如图5所示，包括处理器501、通信接口502、存储器503和通信总线504，其中，处理器501，通信接口502，存储器503通过通信总线504完成相互间的通信；

存储器503，用于存放计算机程序；

处理器501，用于执行存储器503上所存放的程序时，实现本申请实施例所提供的基于注意力模型的图像识别方法。

应该理解的是，虽然附图的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，其可以以其他的顺序执行。而且，附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，其执行顺序也不必然是依次进行，而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

以上所述仅是本申请的部分实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本申请的保护范围。

Claims

一种基于注意力模型的图像识别方法，其特征在于，包括如下步骤：

步骤S10：获取图像矩阵形状为[W，H，C]的输入特征图，其中，W为宽度，H为高度，C为通道数；

步骤S20：使用预设的空间映射权重矩阵对输入特征图进行空间映射，并经过激活函数激活后得到空间权重矩阵，将所述空间权重矩阵与输入特征图的图像矩阵按位相乘得到输出特征图，其中，当所述预设的空间映射权重矩阵为注意力在于图像宽度和高度的空间注意力矩阵[C，1]时，空间权重矩阵的形状为[W，H，1]，或者当所述预设的空间映射权重矩阵为注意力在于图像通道数的通道注意力矩阵[C，C]时，空间权重矩阵的形状为[1，1，C]。
根据权利要求1所述的基于注意力模型的图像识别方法，其特征在于，当所述预设的空间映射权重矩阵为空间注意力矩阵[C，1]时，在步骤S20中使用以下公式得到输出特征图：

o _:,:,c＝i _:,:,c⊙sigmoid(i _:,:,c·w _s+b _s)

其中，⊙为按位乘，·为矩阵乘法，o _:,:,c为输出特征图，i _:,:,c为输入特征图，sigmoid为激活函数，w _s为空间映射权重，b _s为偏差。
根据权利要求1所述的基于注意力模型的图像识别方法，其特征在于，当所述预设的空间映射权重矩阵为通道注意力矩阵[C，C]时，在步骤S20中使用以下公式得到输出特征图：

o _w,h,:＝i _w,h,:⊙sigmoid(mean(i _w,h,:)·w _c+b _c)

其中，⊙为按位乘，·为矩阵乘法，o _w,h,:为输出特征图，i _w,h,:为输入特征图，sigmoid为激活函数，mean为求平均值函数，w _c为空间映射权重，b _c为偏差。
根据权利要求1所述的基于注意力模型的图像识别方法，其特征在于，步骤S20包括：

在卷积神经网络的浅层网络使用所述空间注意力矩阵[C，1]对输入特征图进行空间映射，并经过激活函数激活后得到第一空间权重矩阵，将所述第一空间权重矩阵与输入特征图的图像矩阵按位相乘得到第一输出特征图；

在卷积神经网络的深层网络使用所述通道注意力矩阵[C，1]对所述第一输出特征图进行空间映射，并经过激活函数激活后得到第二空间权重矩阵，将所述第二空间权重矩阵与所述第一输出特征图的图像矩阵按位相乘得到第二输出特征图。
根据权利要求1所述的基于注意力模型的图像识别方法，其特征在于，还包括步骤S30：

根据所述输出特征图应用分类器进行图像分类。
一种基于注意力模型的图像识别***，其特征在于，包括：

图像获取模块，用于获取图像矩阵形状为[W，H，C]的输入特征图，其中，W为宽度，H为高度，C为通道数；

图像处理模块，用于使用预设的空间映射权重矩阵对输入特征图进行空间映射，并经过激活函数激活后得到空间权重矩阵，将所述空间权重矩阵与输入特征图的图像矩阵按位相乘得到输出特征图，其中，当所述预设的空间映射权重矩阵为注意力在于图像宽度和高度的空间注意力矩阵[C，1]时，空间权重矩阵的形状为[W，H，1]，或者当所述预设的空间映射权重矩阵为注意力在于图像通道数的通道注意力矩阵[C，C]时，空间权重矩阵的形状为[1，1，C]。
根据权利要求6所述的基于注意力模型的图像识别***，其特征在于，当所述预设的空间映射权重矩阵为空间注意力矩阵[C，1]时，所述图像处理模块使用以下公式得到输出特征图：

o _:,:,c＝i _:,:,c⊙sigmoid(i _:,:,c·w _s+b _s)

其中，⊙为按位乘，·为矩阵乘法，o _:,:,c为输出特征图，i _:,:,c为输入特征图，sigmoid为激活函数，w _s为空间映射权重，b _s为偏差。
根据权利要求6所述的基于注意力模型的图像识别***，其特征在于，当所述预设的空间映射权重矩阵为通道注意力矩阵[C，C]时，所述图像处理模块使用以下公式得到输出特征图：

o _w,h,:＝i _w,h,:⊙sigmoid(mean(i _w,h,:)·w _c+b _c)

其中，⊙为按位乘，·为矩阵乘法，o _w,h,:为输出特征图，i _w,h,:为输入特征图，sigmoid为激活函数，mean为求平均值函数，w _c为空间映射权重，b _c为偏差。
根据权利要求6所述的基于注意力模型的图像识别***，其特征在于，所述图像处理模块包括低级语义特征提取模块和高级语义特征提取模块；

所述低级语义特征提取模块用于：在卷积神经网络的浅层网络使用所述空间注意力矩阵[C，1]对输入特征图进行空间映射，并经过激活函数激活后得到第一空间权重矩阵，将所述第一空间权重矩阵与输入特征图的图像矩阵按位相乘得到第一输出特征图；

所述高级语义特征提取模块用于：在卷积神经网络的深层网络使用所述通道注意力矩阵[C，1]对所述第一输出特征图进行空间映射，并经过激活函数激活后得到第二空间权重矩阵，将所述第二空间权重矩阵与所述第一输出特征图的图像矩阵按位相乘得到第二输出特征图。
根据权利要求6所述的基于注意力模型的图像识别***，其特征在于，还包括分类模块，用于根据所述输出特征图应用分类器进行图像分类。
一种电子设备，其特征在于，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

存储器，用于存放计算机程序；

处理器，用于执行存储器上所存放的程序时，实现权利要求1-5任一所述的方法步骤。
一种存储介质，其特征在于，所述存储介质内存储有处理程序，所述处理程序被处理器执行时实现权利要求1-5任一所述的方法步骤。
一种应用程序，其特征在于，所述应用程序用于在运行时执行权利要求1-5任一项所述的方法步骤。