CN110807752B

CN110807752B - 一种基于卷积神经网络的图像注意力机制处理方法

Info

Publication number: CN110807752B
Application number: CN201910896954.8A
Authority: CN
Inventors: 陈旋; 吕成云; 张玉立
Original assignee: Jiangsu Aijia Household Products Co Ltd
Current assignee: Jiangsu Aijia Household Products Co Ltd
Priority date: 2019-09-23
Filing date: 2019-09-23
Publication date: 2022-07-08
Anticipated expiration: 2039-09-23
Also published as: CN110807752A

Abstract

本发明涉及一种基于卷积神经网络的图像注意力机制处理方法，采用全新控制逻辑，结合卷积神经网络，在残差模块的基础上引入注意力机制，其中，为了更好的处理冗余信息，首先对目标图像进行空间位置注意力和通道注意力处理，这样可以先把由于叠加图像所产生的冗余信息去除，然后再对接预设卷积层对目标图像进行融合处理，最后采用跳连方法连接该模块的输入与输出，获得针对目标图像的处理结果，由此能够更准确的实现空间位置注意力和通道注意力添加。

Description

一种基于卷积神经网络的图像注意力机制处理方法

技术领域

本发明涉及一种基于卷积神经网络的图像注意力机制处理方法，属于图像处理技术领域。

背景技术

随着大数据时代的到来，深度神经网络即深度学习得到了飞跃发展，已经在很多工业领域进行了成功应用。作为深度神经网络的一种，卷积神经网络在图像处理领域得到了广泛的应用。传统机器视觉方法在进行图像处理时，需要手工设计特征，这些手工设计的特征无法应付复杂多变的光线、颜色、纹理等条件，处理效果不太好。

卷积神经网络方法是采用卷积神经网络建立图像处理模型，相比于传统的机器视觉方法，不需要手工设计图像特征，而是由网络自己学习得到，这样就使得模型能够应付复杂多变的光线、颜色、纹理等条件。目前卷积神经网络在图像识别、语义分割、目标检测、人体姿态估计等图像处理领域的许多方向都取得了很大成功，有些表现已经超越了人类。如人类一样，在卷积神经网络处理图像时增加注意力机制，能够获得更好的效果。

目前图像处理中的注意力机制主要包括两个方面，一种是关于空间位置信息的，另一种是关于特征图通道的。空间位置信息方面的注意力机制可以让网络更好的处理与空间位置有关的信息，对感兴趣的区域给一个大的比重，对不感兴趣的区域给一个小的比重。但目前的方法都是分开使用它们，或者先进行卷积运算，再依次进行空间位置和通道的注意力运算，这样对于叠加后的特征图存在的冗余信息不能进行很好的处理。

发明内容

本发明所要解决的技术问题是提供一种基于卷积神经网络的图像注意力机制处理方法，采用全新控制逻辑，结合卷积神经网络，能够更准确的实现空间位置注意力和通道注意力添加。

本发明为了解决上述技术问题采用以下技术方案：本发明设计了一种基于卷积神经网络的图像注意力机制处理方法，用于实现针对目标图像的注意力处理，包括如下步骤：

步骤A. 复制一份目标图像，作为原始目标图像，然后进入步骤B；

步骤B. 针对目标图像添加空间注意力信息进行更新，获得更新后的目标图像，然后进入步骤C；

步骤C. 针对目标图像添加通道注意力信息进行更新，获得更新后的目标图像，然后进入步骤D；

步骤D. 采用预设层数的预设类型卷积层，针对目标图像进行融合处理，更新目标图像，然后进入步骤E；

步骤E. 将原始目标图像上各像素点的像素值、分别与目标图像上相同位置像素点的像素值进行相加，获得最终目标图像，作为针对目标图像进行注意力处理的结果。

作为本发明的一种优选技术方案：所述步骤B包括如下步骤B1至步骤B2；

步骤B1. 根据目标图像上各预设划分区域的预设权重，获得与目标图像尺寸相同的图像，作为权重图像，且权重图像中各像素点的像素值、为目标图像上相同位置像素点所在预设划分区域的预设权重，然后进入步骤B2；

步骤B2. 分别针对目标图像对应预设类型各通道下的通道图像，将通道图像中各像素点的相应属性值、分别乘以权重图像中相同位置像素点的像素值，更新该通道图像，进而更新目标图像对应预设类型各通道下的通道图像，由此更新目标图像，然后进入步骤C。

作为本发明的一种优选技术方案：步骤B1中，采用一个1×1卷积层输出与目标图像尺寸相同的图像，作为权重图像，且权重图像中各像素点的像素值、为目标图像上相同位置像素点所在预设划分区域的预设权重。

作为本发明的一种优选技术方案，所述步骤C包括如下步骤C1至步骤C3；

步骤C1. 根据目标图像所对应预设类型各通道下、通道图像上各像素点的像素值，获得目标图像所对应的N维数组，N表示目标图像所对应预设类型通道的通道数目，N维数组的各维度分别与目标图像所对应预设类型各通道一一对应，然后进入步骤C2；

步骤C2. 根据N维数组，获得目标图像所对应预设类型各通道的权重，然后进入步骤C3；

步骤C3. 分别针对目标图像对应预设类型各通道下的通道图像，将通道图像中各像素点的相应属性值、分别乘以相应通道的权重，更新该通道图像，进而更新目标图像对应预设类型各通道下的通道图像，由此更新目标图像，然后进入步骤D。

作为本发明的一种优选技术方案：所述步骤C1中，根据目标图像所对应预设类型各通道下、通道图像上各像素点的像素值，采用全局池化方式对目标图像进行处理，获得目标图像所对应的N维数组。

作为本发明的一种优选技术方案：所述步骤D中，采用三层预设类型卷积层，针对目标图像进行融合处理，更新目标图像。

作为本发明的一种优选技术方案，所述步骤D中的三层预设类型卷积层依次包括如下：

第一层采用1×1的卷积核，后面接一个批归一化层，激活函数采用ReLu；第二层采用3×3的卷积核，后面接一个批归一化层，激活函数采用ReLu；最后一层采用1×1的卷积核，后面接一个批归一化层，不采用激活函数。

作为本发明的一种优选技术方案：所述步骤E中，采用跳连方法，将原始目标图像上各像素点的像素值、分别与目标图像上相同位置像素点的像素值进行相加，获得最终目标图像，作为针对目标图像进行注意力处理的结果。

有益效果

本发明所述一种基于卷积神经网络的图像注意力机制处理方法，采用以上技术方案与现有技术相比，具有以下技术效果：

本发明所设计基于卷积神经网络的图像注意力机制处理方法，采用全新控制逻辑，结合卷积神经网络，在残差模块的基础上引入注意力机制，其中，为了更好的处理冗余信息，首先对目标图像进行空间位置注意力和通道注意力处理，这样可以先把由于叠加图像所产生的冗余信息去除，然后再对接预设卷积层对目标图像进行融合处理，最后采用跳连方法连接该模块的输入与输出，获得针对目标图像的处理结果，由此能够更准确的实现空间位置注意力和通道注意力添加。

附图说明

图1是本发明设计基于卷积神经网络的图像注意力机制处理方法的流程示意图。

具体实施方式

下面结合说明书附图对本发明的具体实施方式作进一步详细的说明。

本发明设计了一种基于卷积神经网络的图像注意力机制处理方法，用于实现针对目标图像的注意力处理，如图1所示，实际应用当中，具体执行如下步骤A至步骤E。

空间注意力用来处理图像的空间信息，它是模仿人类的视觉***中的注意力机制，对想要关注的点给与更多的关注，模糊掉不太重要的信息，从而能够专注于重要的信息。在图像处理中，空间注意力机制会依据重要程度，针对图像中的各个位置分别设定相应的权重。

步骤A. 复制一份目标图像，作为原始目标图像，然后进入步骤B。

步骤B. 针对目标图像添加空间注意力信息进行更新，获得更新后的目标图像，然后进入步骤C。

上述步骤B在实际应用当中，具体包括如下步骤B1至步骤B2。

步骤B1. 根据目标图像上各预设划分区域的预设权重，采用一个1×1卷积层输出与目标图像尺寸相同的图像，作为权重图像，且权重图像中各像素点的像素值、为目标图像上相同位置像素点所在预设划分区域的预设权重，然后进入步骤B2。

步骤C. 针对目标图像添加通道注意力信息进行更新，获得更新后的目标图像，然后进入步骤D。

上述步骤C在实际应用当中，具体执行如下步骤C1至步骤C3。

步骤C1. 根据目标图像所对应预设类型各通道下、通道图像上各像素点的像素值，采用全局池化方式对目标图像进行处理，获得目标图像所对应的N维数组，N表示目标图像所对应预设类型通道的通道数目，N维数组的各维度分别与目标图像所对应预设类型各通道一一对应，然后进入步骤C2。

步骤C2. 根据N维数组，获得目标图像所对应预设类型各通道的权重，然后进入步骤C3。

如此基于上述步骤C的操作，通过对每个通道添加权重，去除特征图各个通道之间的冗余信息。

步骤D. 采用预设层数的预设类型卷积层，针对目标图像进行融合处理，更新目标图像，然后进入步骤E。

具体来讲，步骤D中，采用三层预设类型卷积层，针对目标图像进行融合处理，更新目标图像，其中，三层预设类型卷积层依次包括如下：

步骤E. 采用跳连方法，将原始目标图像上各像素点的像素值、分别与目标图像上相同位置像素点的像素值进行相加，获得最终目标图像，作为针对目标图像进行注意力处理的结果。

上述技术方案所设计基于卷积神经网络的图像注意力机制处理方法，采用全新控制逻辑，结合卷积神经网络，在残差模块的基础上引入注意力机制，其中，为了更好的处理冗余信息，首先对目标图像进行空间位置注意力和通道注意力处理，这样可以先把由于叠加图像所产生的冗余信息去除，然后再对接预设卷积层对目标图像进行融合处理，最后采用跳连方法连接该模块的输入与输出，获得针对目标图像的处理结果，由此能够更准确的实现空间位置注意力和通道注意力添加。

上面结合附图对本发明的实施方式作了详细说明，但是本发明并不限于上述实施方式，在本领域普通技术人员所具备的知识范围内，还可以在不脱离本发明宗旨的前提下做出各种变化。

Claims

1.一种基于卷积神经网络的图像注意力机制处理方法，用于实现针对目标图像的注意力处理，其特征在于，包括如下步骤：

步骤C. 针对步骤B更新后的目标图像添加通道注意力信息进行更新，获得更新后的目标图像，然后进入步骤D；

步骤D. 采用预设层数的预设类型卷积层，针对步骤C更新后的目标图像进行融合处理，更新目标图像，然后进入步骤E；

步骤E. 将原始目标图像上各像素点的像素值分别与步骤D更新后的目标图像上相同位置像素点的像素值进行相加，获得最终目标图像，作为针对目标图像进行注意力处理的结果；

所述步骤B包括如下步骤B1至步骤B2；

步骤B1. 根据目标图像上各预设划分区域的预设权重，获得与目标图像尺寸相同的图像，作为权重图像，且权重图像中各像素点的像素值为目标图像上相同位置像素点所在预设划分区域的预设权重，然后进入步骤B2；

2.根据权利要求1所述一种基于卷积神经网络的图像注意力机制处理方法，其特征在于：步骤B1中，采用一个1×1卷积层输出与目标图像尺寸相同的图像，作为权重图像，且权重图像中各像素点的像素值、为目标图像上相同位置像素点所在预设划分区域的预设权重。

3.根据权利要求1至2中任意一项所述一种基于卷积神经网络的图像注意力机制处理方法，其特征在于，所述步骤C包括如下步骤C1至步骤C3；

4.根据权利要求3所述一种基于卷积神经网络的图像注意力机制处理方法，其特征在于：所述步骤C1中，根据目标图像所对应预设类型各通道下、通道图像上各像素点的像素值，采用全局池化方式对目标图像进行处理，获得目标图像所对应的N维数组。

5.根据权利要求1所述一种基于卷积神经网络的图像注意力机制处理方法，其特征在于：所述步骤D中，采用三层预设类型卷积层，针对目标图像进行融合处理，更新目标图像。

6.根据权利要求5所述一种基于卷积神经网络的图像注意力机制处理方法，其特征在于，所述步骤D中的三层预设类型卷积层依次包括如下：

7.根据权利要求1所述一种基于卷积神经网络的图像注意力机制处理方法，其特征在于：所述步骤E中，采用跳连方法，将原始目标图像上各像素点的像素值、分别与目标图像上相同位置像素点的像素值进行相加，获得最终目标图像，作为针对目标图像进行注意力处理的结果。