CN114842029A

CN114842029A - 一种融合通道和空间注意力的卷积神经网络息肉分割方法

Info

Publication number: CN114842029A
Application number: CN202210496738.6A
Authority: CN
Inventors: 束鑫; 王佳树; 顾迎燕; 徐丹; 史金龙; 高尚
Original assignee: Jiangsu University of Science and Technology
Current assignee: Jiangsu University of Science and Technology
Priority date: 2022-05-09
Filing date: 2022-05-09
Publication date: 2022-08-02
Anticipated expiration: 2042-05-09
Also published as: CN114842029B

Abstract

本发明公开了一种融合通道和空间注意力的卷积神经网络息肉分割方法，包括：数据预处理，用于对息肉图像的分辨率进行调整以及数据增强；编码器阶段，使用残差模块对息肉图像进行多尺度特征提取；瓶颈层阶段，利用改进的挤压激励模块，增强对息肉图像高级特征的提取；解码器阶段，使用通道和空间组合注意力模块，提高分割精度；同时对于瓶颈层和解码器的输出使用跨层融合；并在上采样过程中使用深监督技术，减轻在训练时的梯度消失或***现象，加速模型的收敛。本发明解决了息肉与周围组织边界模糊不清以及小的息肉区域难以分割的问题，同时深监督机制的引入优化了网络模型的梯度，加快了网络模型的收敛，缩短了网络模型的训练时间。

Description

一种融合通道和空间注意力的卷积神经网络息肉分割方法

技术领域

本发明涉及医学图像分割和人工智能技术领域，具体涉及一种融合通道和空间注意力的卷积神经网络息肉分割方法。

背景技术

结直肠癌(CRC)是临床医学中最常见的诊断癌症之一，而结肠息肉往往是病变的最初表现形式。早期的息肉大多为良性，但如果不能够得到及时的治疗，随着时间的推移，部分结肠息肉会发展为结肠癌。息肉分割是对结肠镜采集的视频或者图像进行分割，辅助医生进行诊断和病理分析，以达到提高诊断效率和减少误诊率的作用，在结直肠癌的筛查和诊疗过程中扮演者不可或缺的角色。但由于息肉的形态差异大、边界模糊，使得息肉很难被精确的分割，导致漏检、误检的情况时有发生。由此可见，精确的息肉分割是一项具有挑战性的医学图像分析任务，对临床预防结直肠癌有着重要的意义。

传统的息肉分割方法主要基于颜色，纹理，形状等浅层特征或者通过组合这些特征来进行处理。这类方法不仅费时费力，分割效果往往较差，难以真正应用于临床实践。自全卷积网络(FCN)被Long提出以来，神经网络在图像分割领域取得了巨大的成功。FCN是首个用于语义分割的网络模型，将卷积神经网络开创性地引入到了语义分割领域，并且在图像分割中取得了不错的结果。Akbari等将改进的FCN应用到息肉分割中，相较于FCN提高了分割的准确性。进一步地，U-Net在FCN的基础上，使用对称的编码器-解码器结构，在医学分割领域取得了不错的成绩。在U-Net的基础上，发展了很多改进算法，并且都在医学图像分割领域取得了良好的效果。UNet++通过将不同深度的U-Net嵌入到同一个网络中，增强了编码器特征与解码器的特征之间的语义匹配程度，并且使用深监督策略对网络进行剪枝，提高了推理的速度。Double U-Net使用两个U-Net网络进行图像分割，利用迁移学习从第一个U-Net中学习特征然后逐级传递到第二个U-Net中，并利用第二个U-Net捕获更多的语义信息。ResUNet++在U-Net的基础上将残差单元、空间金字塔和SE引入到网络之中，提高了对语义的准确预测。这些U-Net变体尽管取得了不错的分割效果，但都十分依赖内存，需要较高的内存才能使用。

发明内容

发明目的：本发明的目的在于解决U-Net网络层数不够深，训练时容易出现过拟合，而且对前景像素的敏感度不足，难以获得足够的全局信息和局部语义信息的问题，提出一种融合通道和空间注意力的卷积神经网络息肉分割方法，即CSCA U-Net。

技术方案：一种融合通道和空间注意力的卷积神经网络息肉分割方法，包括以下步骤：

(1)准备数据集，分为训练和测试数据集；

(2)利用残差模块(Residual Block,RB)作为编码器提取图像的特征；

(3)利用双重挤压激励模块(Double Squeeze and Excited,DSE)增强瓶颈层对高级特征的提取能力；

(4)在解码器使用通道和空间组合的注意力模块(Channel and Space Compound,CSCA)，从通道和空间两个层面上关注关键区域，从提取到的特征选择最相关的特征，抑制不相关的特征，提高分割精度；此外使用跨层融合(Cross-Layer Fusion)的方式，捕获上下文信息，细化分割的边界，通过解码器，最终生成全局预测图Sg；

所述通道和空间组合的注意力模块，通过并联和嵌套两种方式将通道注意力和空间注意力融合使用；整个模块分为a,b,c三路，在通路a中，首先将输入的特征通过一个双重挤压激励模块模块进行特征增强，生成特征图M_c，然后将M_c进行两次3×3的卷积实现非线性变换，再次使用双重挤压激励模块模块进行特征增强，得到权重矩阵M_v；在通路b中，特征图进行一次1×1的卷积操作，其通道数降为原来的一半，然后再进行批归一化和一个1×1的卷积操作，通道数降为1，最后由Sigmoid函数得到空间权重M_q；在通路c中，特征图经过两次3×3的卷积操作后，通道数减半，然后再经过一个双重挤压激励模块模块处理，生成特征图M_k，通过点乘的方式，将通路b中得到的特征权重M_q与通路c中得到的特征图M_k相乘，为M_k的每个通道中各个像素分配权重，生成特征图M_s，再利用矩阵乘法，将M_s与通路a中得到的特征图M_v结合起来，生成新的特征M_att，然后，选用M_att作为权重矩阵，通过点乘的方式与M_c相乘，得到M_r，最后通过特征融合的方式，将M_c与M_r结合起来，形成该层的分割结果M_final，用公式可以表示为：

M_final＝concat(M_r,M_c) (1)

其中，M_c和M_r分别表示为：

M_c＝d(x) (2)

M_r＝M_c·M_att (3)

M_att又可以表示为：

M_att＝(M_q·M_k)×M_v (4)

其中M表示特征图，concat(·,·)表示连接操作，d(·)表示DSE操作，·表示矩阵内积，×表示矩阵外积；

(5)在瓶颈层和解码器部分，通过深监督对网络输出进行监督，在每层生成预测结果S₂～S₆；

(6)进行网络模型训练。

所述步骤(1)具体为，准备数据集Kvasir-SEG和CVC-ClinicDB，并且按照9:1的比例将Kvasir-SEG和CVC-ClinicDB随机分为训练和测试数据集；准备数据集CVC-ColonDB,ETIS-LARIBPOLYPDB和CVC-T，作为测试数据集。

所述步骤(2)中残差模块，首先使用一个1×1的卷积对输入特征进行通道变换，得到特征图M₁，然后对M₁进行两次3×3的卷积操作，得到特征图M₂，每一次卷积操作之后均经过批归一化和ReLU激活函数，最后将M₁与M₂相加，得到最终的特征图M_RB。

所述步骤(3)中双重挤压激励模块，分为两个阶段：在第一个阶段中，使用全局平均池化，生成权重向量

再使用一个1×1的卷积对

进行非线性变换，其中每一个卷积之后都进行了批归一化和ReLU激活函数处理，用sigmoid函数对权重进行归一化处理，以点乘的方式对输入特征进行加权，得到特征图M_avg；在第二个阶段，对上一个阶段产生的M_avg进行全局最大池化，生成权重向量

然后通过一个1×1的卷积和Sigmoid函数，进行再次加权，得到新的特征M_max，抑制无效信息的提取。

所述步骤(6)中网络模型的训练过程如下：

(6.1)首先准备数据集Kvasir-SEG和CVC-ClinicDB，并且按9:1划分为训练集和测试集；准备数据集CVC-ColonDB,ETIS-LARIBPOLYPDB,CVC-T，作为测试数据集；

(6.2)对数据集中的数据进行增强，并设置输入的图像尺寸为352×352；

(6.3)使用Adam方法作为优化器，并设置初始学习率为1e-4，在60个epoch后，将学习率降为1e-5；

(6.4)使用结合了加权交并比(Intersection Over Union,IoU)损失和二进制交叉熵损失作为损失函数，表示为：

在训练过程中，对于步骤(4)中生成的全局预测图S_g和步骤(5)中的局部预测图S₂～S₆，计算总体损失：

然后将其反向传播来更新网络参数。

有益效果：本发明在编码器部分，采用残差模块的形式，避免梯度消散和减少网络的退化，能够将提高编码器特征提取的能力；瓶颈层部分，采用双重挤压激励模块，聚焦包含更多信息的通道；解码器部分使用通道和空间注意力组合(CSCA)聚焦更关键的部分，细化息肉区域的边界，提高分割精度；再使用跨层融合，将相邻的解码器的输出进行相加，捕获更多的上下文信息；利用深监督策略对网络进行监督，提高收敛的速度。

附图说明

图1为本发明的流程图；

图2为CSCA U-Net的结构图；

图3为残差模块RB的结构图；

图4为通道和空间组合注意力模块CSCA的结构图；

图5为双重挤压激励模块DSE的结构图；

图6为本发明与不同网络的分割结果对比图。

具体实施方式

下面结合附图对本发明的技术方案作进一步说明。

如图1所示，本发明提供一种技术方案：一种融合通道和空间注意力的卷积神经网络息肉分割方法，包括以下步骤：

(1)准备数据集，分为训练和测试数据集；

(2)利用残差模块(Residual Block,RB)作为编码器提取图像的特征，图3为残差模块RB的结构图；

(3)利用双重挤压激励模块(Double Squeeze and Excited,DSE)增强瓶颈层对高级特征的提取能力，图5为双重挤压激励模块DSE的结构图；

(4)在解码器使用通道和空间组合的注意力模块(Channel and Space Compound,CSCA)，从通道和空间两个层面上关注关键区域，从提取到的特征选择最相关的特征，抑制不相关的特征，提高分割精度；此外使用跨层融合(Cross-Layer Fusion)的方式，捕获上下文信息，细化分割的边界，通过解码器，最终生成全局预测图Sg，图4为通道和空间组合注意力模块CSCA的结构图；

M_final＝concat(M_r,M_c) (1)

其中，M_c和M_r分别表示为：

M_c＝d(x) (2)

M_r＝M_c·M_att (3)

M_att又可以表示为：

M_att＝(M_q·M_k)×M_v (4)

(6)进行网络模型训练。

再使用一个1×1的卷积对

所述步骤(6)中网络模型的训练过程如下：

然后将其反向传播来更新网络参数。图2为CSCA U-Net的结构图。

本发明下的效果可通过以下实验进一步说明。

1)实验条件

本发明在pytorch框架下实现，实验所用处理器为AMD 5900x处理器，内存64GB，显卡NVIDIA GeForce RTX 3090。

在息肉分割中，我们将输入图像的尺寸统一设置为352×352，batch size设置为16，并通过随机垂直翻转(p＝0.5)、随机水平翻转(p＝0.5)、随机旋转(90°)三种方式来进行数据增强以及采用多尺度策略{0.75，1，1.25}，训练周期设置为120，在实验中，使用Adam优化器，初始学习率设置为1e-4，在epoch>60后，学习率调至1e-5。

2)实验结果

在对模型的评估上，我们使用了平均Dice、平均IoU、MAE、

S_α六个指标。Dice表示预测图像与真值图之间的相似度，IoU指预测目标区域与真实目标区域的交集和并集的比值，MAE度量用于评估精度，增强对齐度量

用于评估相似度。加权Dice度量

针对Dice中的“同等重要的缺陷”问题。S_α可以弥补上述方法在目标结构相似性方面不足的问题，用来评估预测与真值图之间的相似性。

本发明算法与U-Net，U-Net++，ResUNet-mod，ResUNet++，SFA以及PraNet进行比较。综合表1，本发明的模型在两个“看过”的数据集Kvasir-SEG和CVC-ClinicDB上有着更好的息肉分割效果。综合表2，本发明的模型在三个“未看过”的数据集CVC-ColonDB,ETIS-LARIBPOLYPDB和CVC-T上展现出有竞争力的结果。

表1

表2

图6显示了各个模型在五个数据集上的分割结果，从上到下依次从测试集Kvasir-SEG、CVC-ClinicDB、CVC-ColonDB、ETIS-LARIBPOLYPDB和CVC-T中选取一张有代表性的图片。可以看到，本发明有着更加精细的分割结果，也进一步说明了本发明相对其他基准模型的优越性。

Claims

1.一种融合通道和空间注意力的卷积神经网络息肉分割方法，其特征在于，包括以下步骤：

(1)准备数据集，分为训练和测试数据集；

(2)利用残差模块作为编码器提取图像的特征；

(3)利用双重挤压激励模块增强瓶颈层对高级特征的提取能力；

(4)在解码器使用通道和空间组合的注意力模块，从通道和空间两个层面上关注关键区域，从提取到的特征选择最相关的特征，抑制不相关的特征，提高分割精度；此外使用跨层融合的方式，捕获上下文信息，细化分割的边界，通过解码器，最终生成全局预测图Sg；

M_final＝concat(M_r,M_c) (1)

其中，M_c和M_r分别表示为：

M_c＝d(x) (2)

M_r＝M_c·M_att (3)

M_att又可以表示为：

M_att＝(M_q·M_k)×M_v (4)

(6)进行网络模型训练。

2.根据权利要求1所述的一种融合通道和空间注意力的卷积神经网络息肉分割方法，其特征在于，所述步骤(1)具体为，准备数据集Kvasir-SEG和CVC-ClinicDB，并且按照9:1的比例将Kvasir-SEG和CVC-ClinicDB随机分为训练和测试数据集；准备数据集CVC-ColonDB,ETIS-LARIBPOLYPDB和CVC-T，作为测试数据集。

3.根据权利要求1所述的一种融合通道和空间注意力的卷积神经网络息肉分割方法，其特征在于，所述步骤(2)中残差模块，首先使用一个1×1的卷积对输入特征进行通道变换，得到特征图M₁，然后对M₁进行两次3×3的卷积操作，得到特征图M₂，每一次卷积操作之后均经过批归一化和ReLU激活函数，最后将M₁与M₂相加，得到最终的特征图M_RB。

4.根据权利要求1所述的一种融合通道和空间注意力的卷积神经网络息肉分割方法，其特征在于，所述步骤(3)中双重挤压激励模块，分为两个阶段：在第一个阶段中，使用全局平均池化，生成权重向量

再使用一个1×1的卷积对

5.根据权利要求1所述的一种融合通道和空间注意力的卷积神经网络息肉分割方法，其特征在于，所述步骤(6)中网络模型的训练过程如下：

(6.4)使用结合了加权交并比损失和二进制交叉熵损失作为损失函数，表示为：

然后将其反向传播来更新网络参数。