CN113298826B

CN113298826B - 一种基于LA-Net网络的图像分割方法

Info

Publication number: CN113298826B
Application number: CN202110642528.9A
Authority: CN
Inventors: 栗伟; 曹仰勇; 于鲲; 冯朝路
Original assignee: 东北大学
Priority date: 2021-06-09
Filing date: 2021-06-09
Publication date: 2023-11-14
Anticipated expiration: 2041-06-09
Also published as: CN113298826A

Abstract

本发明公开了一种基于LA‑Net网络的图像分割方法，涉及图像分割技术领域。该方法包括：输入待分割图像X；图像X经过编码阶段得到特征图M₁～M₅，同时将SE注意力模块加入U‑Net网络的编码阶段，并将M₅经过SE注意力模块得到M_S；在解码阶段加入LA注意力模块并结合特征图M₁～M₅，将M_S经过解码阶段进行特征还原得到Y，根据Y得到图像分割结果。SE注意力模块对特征图各通道间的依赖关系进行建模，可使特征图自适应地调整各通道之间的关系；LA模块给予非病灶区域中的点大于1的系数值，而非病灶区域中的点的标签值为0，非病灶区域中的点可以获得更大损失值，从而抑制非病灶区域预测值，给病灶区域更多关注，提升了网络对于CT图像中病灶分割的准确率。

Description

一种基于LA-Net网络的图像分割方法

技术领域

本发明涉及图像分割技术领域，特别是涉及一种基于LA-Net网络的图像分割方法。

背景技术

肺炎患者的CT图像包含丰富的图像语义，其中的病灶区域更是蕴含着纹理学、形态学、统计学等不同形式的重要特征。所以一些研究指出，了解CT图像的演变过程可为COVID-19的早期防控、早期诊断及治疗提供重要依据。但是研究人员研究和使用CT图像的前提条件之一是：CT图像中的病灶区域已经具有显著性标注。而如今这项工作多为医生或者专业人员进行的人工标注，重复且大量的CT图像标注工作给工作人员带来了巨大的工作量。而且人工操作一般带有标注者个人的主观思想，并且常常伴有标注者的失误操作现象，所以标注者难以保证精准地在CT图像中标注病灶区域。

2012年提出的AlexNet网络首次将卷积神经网络(CNN)应用在图像识别上。之后陆续出现了很多优秀的图像分割的网络和方法，如：FCN、SegNet、Deeplab v1&v2&v3、V-net、U-Net等。它们的出现，在进一步提高图像分割精度的同时，也大大地解放了标注者的工作。这些网络中，在医学图像中应用比较广泛，效果比较好的是U-Net网络。U-Net网络的实现思路是：首先将输入的图像不断地进行卷积、池化、激活操作，提取输入图像的特征信息，产生多个特征图，在这个过程中，特征图的大小不断缩小，通道数量不断增大，这个过程被称为“编码阶段”；然后再将编码阶段提取到的最后一个特征图作为输入，重复使用上采样、卷积、激活操作，产生多个特征图，在这个过程中，特征图的大小不断增大，通道数量不断缩小，最后一个特征图被还原至与输入图像的大小一致，这个过程被称为“解码阶段”。其中最后一个特征图中的每个点的值代表对输入图像中的每个像素点的预测值，然后设置一定大小的阈值，根据特征图中每个像素点的值与阈值之间的大小关系来确定分割的区域，以此达到了对输入图像进行分割的效果。然而因为U-Net网络在解码阶段使用了上采样技术，所以无法避免地会造成特征图信息的丢失。针对这个问题，U-Net网络认为编码阶段产生的特征图更加接近于输入图像，具有更丰富的特征信息，因此将编码阶段产生的特征图与解码阶段产生的特征图直接进行拼接操作，以此来弥补解码阶段上采样操作中的信息丢失，这个操作被称为“跳跃连接”。

在经过相关专业医生的指导之后，容易发现COVID-19病灶体现在CT图像上具有与周围区域对比度低、分布不均衡的特点：1、病灶与人体的器官在CT图像中的像素值几乎相等，位置相近，对比度较低，边界模糊；2、病灶的面积大小不一致，例如较小的病灶面积小于1cm²，而最大病灶的面积却接近于半个肺叶；病灶的形状不统一，例如磨玻璃型的病灶形态接近于一团海绵，而索条型的病灶却像一道细长的绳索；病灶的分布不均衡。但是在U-Net网络中1)缺少注意力模块去注重CT图像中的重要的信息(病灶区域)，抑制不重要的信息(非病灶信息)；2)没有很好地利用到COVID-19病灶区域分布这一先验知识。所以对于CT图像中的COVID-19病灶，U-Net网络并不能具有很好的分割效果。

发明内容

针对上述现有技术存在的不足，本发明提供一种基于LA-Net网络的图像分割方法，旨在对U-Net网络进行改进，在传统的U-Net网络中加入SE注意力模块和LA注意力模块构成LA-Net网络，通过基于LA-Net网络的图像分割方法解决基于U-Net网络的图像分割方法缺少注意力模块和没有利用COVID-19病灶区域分布先验知识的缺陷，从而提高基于U-Net网络的图像分割方法的精度。

本发明的技术方案为：

一种基于LA-Net网络的图像分割方法，包括下述步骤：

步骤1：输入待分割图像，并根据该图像的大小将其定义为大小为T×H×W的3维特征数组，表示为：X(T×H×W)；

步骤2：图像X经过编码阶段得到特征图M₁～M₅，同时将SE注意力模块加入U-Net网络的编码阶段，并将M₅经过SE注意力模块得到M_S；

步骤3：在解码阶段加入LA注意力模块并结合特征图M₁～M₅，将M_S经过解码阶段进行特征还原得到Y，根据Y得到图像分割结果。

进一步地，根据所述的基于DP-Net网络的图像分割方法，所述图像X经过编码阶段得到特征图M₁～M₅的方法为：首先将X经过提取特征操作改变特征图通道数量，得到特征图M₁(C×W×H)；然后将M_i经过最大值池化操作改变M_i的特征图大小，得到再将/>经过提取特征操作，得到特征图M_i+1，其中i为特征图索引，i＝1，2，3，4，所述M_i+1分别为

进一步地，根据所述的基于MSF-Net网络的图像分割方法，所述提取特征操作由串行的两组串行的卷积操作、数据归一化操作和激活操作构成。

进一步地，根据所述的基于DP-Net网络的图像分割方法，所述将M₅经过SE注意力模块得到M_S的具体过程为：

首先定义C₅，H₅，W₅分别为特征图M₅的通道数量和特征图的大小；且定义所述SE注意力模块中的可变参数为S_R，S_R代表SE注意力模块中的第一个全连接操作中输入特征图通道数量与输出特征图通道数量的比例；然后将M₅经过池化窗口大小为H₅×W₅的平均值池化操作改变特征图大小，得到向量R(C₅×1×1)，所述向量为特征图的一种特殊形式，代表原特征图大小为1×1，向量的长度为特征图的通道数量；再然后将R经过输入特征图通道数量为C₅，输出特征图通道数量为的全连接操作改变特征图通道数量，得到向量其中/>代表向上取整运算；又然后将Z经过输入特征图通道数量为/>输出特征图通道数量为C5的全连接操作改变特征图通道数量，得到向量Q(C5×1×1)；最后将M₅与Q按照式(1)进行矩阵与向量相乘操作，得到M_s(C₅×H₅×W₅)；

M_s(j，k，l)＝M₅(j，k，l)×Q(j，1，1) (1)

上式中，j、k、l为位置索引，且1≤j≤C₅，1≤k≤H₅，1≤l≤W₅。

进一步地，根据所述的基于DP-Net网络的图像分割方法，所述将M_S经过解码阶段进行特征还原得到Y的方法为：首先定义B₅＝M_S，将B_i+1经过上采样操作改变特征图大小，得到特征图然后将/>与M_i经过拼接操作，得到特征图U_i；将U_i经过还原特征操作得到特征图B_i，其中i为特征图索引，i＝4，3，2，1，所述B_i分别为/> 最后将B₁通过卷积操作得到B₀(T×H×W)，将B₀通过LA注意力模块，得到Y。

进一步地，根据所述的基于LA-Net网络的图像分割方法，所述上采样操作采用双线性插值算法。

进一步地，根据所述的基于LA-Net网络的图像分割方法，所述LA注意力模块包括损失注意力函数G(·)，所述损失注意力函数G(·)的公式如下：

其中，s、l、W、H均为可变参数，s，l为训练集中所有病灶图像中病灶分布区域的始末位置，通过统计训练集中所有的病灶图像的像素点分布得到；W，H为输入图像的尺寸大小；G(i，j)是一个分段函数，代表输入特征图B₀中(1，i，j)位置的损失注意力权重，如果s＜dist(i，j)＜l，则坐标(i，j)属于病灶分布的区域，则G(i，j)＝1；如果dist(i，j)＞l或dist(i，j)＜s，则坐标(i，j)属于非病灶分布的区域，G(i，j)的值和(i，j)位置与病灶区域分布中心的距离呈正相关，若dist(i，j)＞l，则若dist(i，j)＜s，则

进一步地，根据所述的基于LA-Net网络的图像分割方法，所述B₀通过LA注意力模块得到Y的方法为：将B₀中每个点的坐标值代入LA注意力模块中的损失注意力函数G(·)所得到的结果再与该点的坐标值相乘，相乘的结果即为Y中对应点的坐标值。

与现有技术相比，本发明具有如下有益效果：

1、一方面在U-Net网络中引入了SE(Squeeze-and-Excitation)注意力模块，SE注意力模块对特征图各通道间的依赖关系进行建模，可以使特征图自适应地调整各通道之间的关系，提升了网络对于CT图像中的COVID-19病灶分割的准确率。2、另一方面基于病灶图像中像素点的分布特征，设计了一种基于病灶图像中像素点分布的LA(Loss Attention)注意力模块。LA模块可以给予非病灶区域中的点大于1的系数值，而非病灶区域中的点的标签值为0，所以在训练过程中非病灶区域中的点可以获得更大损失值，从而抑制非病灶区域的预测值，以此来给病灶区域更多的关注，实现更加精准的分割。

附图说明

图1为本实施方式基于LA-Net网络的图像分割方法的流程图；

图2为本实施方式中提取特征操作与还原特征操作的结构示意图；

图3为本实施方式的SE注意力模块的结构示意图；

图4(A)为P在第一个维度上统计的柱状图，其横坐标表示为位置索引，纵坐标表示为对应横坐标下P中病灶像素点的个数；(B)为P在第二个维度上统计的柱状图，其纵坐标表示为位置索引，横坐标表示为对应纵坐标下P中病灶像素点的个数；(C)为P的热力图，各位置颜色的深浅与P在该对应位置处的值呈正相关；(D)为在256×256大小的区域内，LA模块中损失注意力函数G(·)中每个位置的权重热图，各位置颜色的深浅与G(·)中该位置的值呈正相关。

图5(A)为从测试集中选取的一张原始CT图像；(B)为(A)图中病灶区域对应的图像；(C)为通过传统的U-Net网络对(A)图中COVID-19病灶分割的结果显示图；(D)为通过LA-Net网络对(A)图中COVID-19病灶分割的结果显示图。

具体实施方式

下面将结合附图和具体实施方式，对本发明的具体实施方式作进一步详细描述。以下实施例仅用于说明本发明，但限制本发明的范围。

图1是本实施方式的基于LA-Net网络的图像分割方法的流程图，所述基于LA-Net网络的图像分割方法包括如下步骤：

步骤1：读取训练集中的一幅待分割CT图像，并根据该图像的大小将其定义为大小为T×H×W的3维特征数组，表示为：X(T×H×W)；

在优选实施例中，根据读取的待分割CT图像的大小，将读取到的CT图像定义为大小为1×256×256的3维特征数组，表示为：X(1×256×256)，其中第一个维度为1，代表X的通道数量，第二个维度和第三个维度均为256，代表X的特征图大小。数组中的元素表示为X_i，j，k，代表3维数组X中坐标为(i，j，k)的位置的像素值。

在本实施方式中，图像X经过编码阶段得到特征图M₁～M₅的方法为：首先将X经过提取特征操作改变特征图通道数量，得到特征图M₁(C×W×H)；然后将M_i经过最大值池化操作改变M_i的特征图大小，得到再将/>经过提取特征操作，得到特征图M_i+1，其中i为特征图索引，i＝1，2，3，4，所述M_i+1分别为/>

图2是所述提取特征操作的结构示意图，所述提取特征操作，由串行的两组操作构成，其中每组所述操作由串行的卷积操作、数据归一化操作和激活操作构成。

在优选实施例中，图像X经过编码阶段得到特征图M₁～M₅的具体过程包括如下的步骤2.1～2.5：

步骤2.1：对X进行特征提取，将X经过提取特征操作改变特征图通道数量，得到特征图M₁(C×W×H)；

在优选实施例中，对X进行特征提取的详细过程为：先将输入X经过提取特征操作中的一组操作即串行的卷积操作(在优选实施例中所有的卷积操作中卷积核为3×3大小，步长为1，不同点在于卷积核的数量，即输出结果中特征图的通道数)、数据归一化操作和激活操作，得到特征图然后再将/>经过提取特征操作中的另一组操作即串行的卷积操作、数据归一化操作和激活操作得到特征图M₁(64×256×256)。

步骤2.2：对M₁进行特征提取，将M₁经过最大值池化操作改变M₁的特征图大小，得到再将/>经过提取特征操作，改变/>的特征图通道数量，得到特征图M₂；

在优选实施例中，将M₁经过池化窗口大小为2×2的最大值池化操作(在优选实施例中，最大值池化操作中池化窗口大小均为2×2)，改变M₁的特征图大小，得到将/>经过提取特征操作，改变/>的特征图通道数量，得到特征图M₂(128×128×128)。

步骤2.3：按照步骤2.2的方法，对M₂进行特征提取，将M₂经过最大值池化操作改变M₂的特征图大小，得到再将/>经过提取特征操作，改变/>的特征图通道数量，得到特征图M₃。

在优选实施例中，将M₂经过最大值池化操作改变特征图大小，得到再将/>进行提取特征操作改变通道数量，得到特征图M₃(256×64×64)。

步骤2.4：对M₃进行特征提取，将M₃经过最大值池化操作改变M₃的特征图大小，得到再将/>经过提取特征操作，改变/>的特征图通道数量，得到特征图M₄。

在优选实施例中，将M₃经过最大值池化操作改变特征图大小，得到再将/>进行提取特征操作改变通道数量，得到特征图M₄(512×32×32)。

步骤2.5：对M₄进行特征提取，将M₄经过最大值池化操作改变M₄的特征图大小，得到再将/>经过提取特征操作，但不改变/>的特征图通道数量，得到特征图M₅。

在优选实施例中，将M₄经过最大值池化操作改变特征图大小，得到将/>进行提取特征操作，不改变通道数量，得到特征图M₅(512×16×16)。

在本实施方式中，M₅经过SE模块得到M_s的具体过程为：

SE模块中的可变参数为S_R，S_R代表SE模块中的第一个全连接操作中输入特征图通道数量与输出特征图通道数量的比例。在优选实施例中设置S_R＝1.5，如图3所示，M₅经过SE模块得到M_s的具体过程为：

将M₅经过池化窗口大小为16×16的平均值池化操作改变特征图大小，得到向量R(512×1×1)。所述向量为特征图的一种特殊形式，代表原特征图大小为1×1，向量的长度为特征图的通道数量。将R经过输入特征图通道数量为512，输出特征图通道数量为342的全连接操作改变特征图通道数量，得到向量Z(342×1×1)。将Z经过输入特征图通道数量为342，输出特征图通道数量为512的全连接操作改变特征图通道数量，得到向量Q(512×1×1)。

将M₅与Q进行矩阵与向量相乘操作，得到M_S(512×16×16)。其中矩阵与向量相乘操作的定义为：

M_S(j，k，l)＝M₅(j，k，l)×Q(j，1，1) (1)

其中，j，k，l为位置索引，并满足1≤j≤512、1≤k≤16、1≤l≤16。

步骤3：结合步骤2得到的特征图M₁～M₅，同时将LA模块加入网络解码阶段，将M_S经过解码阶段进行特征还原得到Y，根据Y得到图像的分割结果。

图2也是还原特征操作的结构示意图，所述还原特征操作与提取特征操作采用相同的架构，也是由串行的两组操作构成，其中每组所述操作由串行的卷积操作、数据归一化操作和激活操作构成；不同点在于二者在进行各自的卷积操作时设置的卷积核数量。

在优选实施例中，定义B₅＝M_S，将B₅经过解码阶段得到Y，Y与X相同大小，根据Y结合预设的阈值，得到图像的分割结果，包括如下步骤：

步骤3.1：对B₅进行特征还原，得到特征图B₄。

在优选实施例中，对B₅进行特征还原得到特征图B₄的详细过程为：先将B₅经过上采样操作改变特征图大小，得到特征图再将/>与M₄进行拼接操作，得到特征图U₄(1024×32×32)；然后将U₄经过还原特征操作中的一组操作即串行的卷积操作、数据归一化操作和激活操作改变通道数量得到特征图/>再将/>经过还原特征操作中的另一组操作即串行的卷积操作、数据归一化操作和激活操作改变通道数量得到特征图B₄(256×32×32)。

步骤3.2：对B₄进行还原特征，得到特征图B₃。

将B₄经过上采样操作，改变特征图大小，得到特征图将/>与M₃进行拼接操作，得到特征图U₃(512×64×64)。将U₃进行还原特征操作，即经过两次串行的卷积操作、数据归一化操作和激活操作，改变特征图通道数，得到B₃(128×64×64)。

步骤3.3：对B₃进行还原特征，得到特征图B₂。

将B₃经过上采样操作，改变特征图大小，得到特征图将/>与M₂进行拼接操作，得到特征图U₂(256×128×128)。将U₂进行还原特征操作，改变特征图通道数，得到B₂(64×128×128)。

步骤3.4：对B₂进行还原特征，得到特征图B₁。

将B₂经过上采样操作，改变特征图大小，得到特征图将/>与M₁进行拼接操作，得到特征图U₁(128×256×256)。将U₁进行还原特征操作，只在还原特征操作中的第一个卷积操作时改变U₁的特征图通道数为64，第二个卷积操作不改变特征图通道数，得到B₁(64×256×256)。

步骤3.5：将B₁通过卷积操作得到B₀，然后将B₀通过LA注意力模块，得到输出Y，结合预设的阈值得到图像的分割结果。

将B₁经过卷积操作改变特征图通道数，得到B₀(1×256×256)。将B₀通过LA模块得到Y(1×256×256)。所述LA注意力模块包括损失注意力函数G(·)，所述损失注意力函数G(·)，的可变参数为s，l，W，H；s，l为训练集中所有病灶图像中病灶分布区域的始(s)末(l)位置，在优选实施例中经过统计训练集中所有的病灶图像的像素点之后得出s＝10、l＝107；W，H为输入CT图像的尺寸大小，优选实施例中W＝256，H＝256。LA模块的具体过程为：将B₀中每个点的坐标代入损失注意力函数G(·)得到的结果与该点的值相乘，得到Y中对应坐标的值。公式为：

Y(1，k，e)＝G(k，e)×B₀(1，k，e) (2)

其中，k，e为位置索引，1≤k≤256，1≤e≤256；Y(1，k，e)代表Y在坐标为(1，k，e)位置的值。

在专业医生的指导下，经过观察、统计病例的CT影像和病灶图像后，容易发现ROI(region of interest)病灶区域集中在左右两个肺叶中，除肺叶之外的区域并不包含病灶。根据这一观察到的现象，本申请发明人首先将所有训练集的病灶图像缩放至(256×256)大小，然后将所有病灶图像的对应位置的像素相加，统计训练集中病灶影像中病灶像素点的分布特点，得到了在(256×256)区域内所有病灶的像素点统计P(256×256)。如图4所示，(A)为P在第一个维度上统计的柱状图，其横坐标表示为位置索引，纵坐标表示为对应横坐标下P中病灶像素点的个数；(B)为P在第二个维度上上统计的柱状图，其纵坐标表示为位置索引，横坐标表示为对应纵坐标下P中病灶像素点的个数；(C)为P的热力图，各位置颜色的深浅与P在该对应位置处的值呈正相关。根据图4中(A)、(B)、(C)三图可以得到一个结论：训练集中的病灶区域集中在左右两个肺叶中，其余部分基本不含病灶，这印证了上述的观察现象。因此，根据对上述观察现象的印证，在假设测试集中病灶区域分布与训练集中相同的情况下，本发明针对训练集中病灶图像中像素点分布特点，设计了一个损失注意力函数G(·)，公式如下：

其中l＝107，s＝10，W＝256，H＝256。G(i，j)是一个分段函数，代表输入特征图B₀中(1，i，j)位置的损失注意力权重，如果s＜dist(i，j)＜l，则坐标(i，j)属于病灶分布的区域，则G(i，j)＝1；如果dist(i，j)＞l或dist(i，j)＜s，则坐标(i，j)属于非病灶分布的区域，G(i，j)的值和(i，j)位置与病灶区域分布中心的距离呈正相关，若dist(i，j)＞l，则若dist(i，j)＜s，则/>通过这种方式，可以给予B₀中非病灶区域中的点大于1的系数值，而非病灶区域中的点的标签值为0，所以在训练过程中非病灶区域中的点可以获得更大损失值，从而抑制非病灶区域的预测值，以此来给病灶区域更多的关注，实现更加精准的分割。图4中(D)为G(i，j)在256×256大小的区域内，损失注意力函数G(·)中每个位置(i，j)的权重热力图，各位置(i，j)颜色的深浅与G(i，j)的值呈正相关。

在本实施方式中，本发明方法在实验过程中所使用的数据集是在某医院经过保密采集。数据集使用了338例来自同一个医院的不同新冠病人的病例。其中每个病例被隐藏了个人信息，并且均做过PCR核酸检测且结果呈阳性。每个病例含有300张以上的CT图像，并且每张CT图像都经过了两位相关的医生进行手工标注病灶区域得到了每张CT对应的病灶图像。从中挑选出相似度较小并且图像较为清晰的4472组图像，其中一组图像代表一张CT图像和一张对应的病灶图像。首先将所有的CT图像和病灶图像大小都缩放至256×256。然后通过将所有CT图像设置窗宽WW、窗位WL为：1500HU，-450HU的方法将CT图像中的像素点的值归一化至0-255。最后将病灶图像中像素点值大于1的点的值改为1，像素点值小于0的点的值改为0，其余点的像素值不变。

将4472组图像按照14∶3∶3的比例分割为：训练集，验证集，测试集，并且对训练集中的每张图片进行顺时针旋转180度后作为一张新的图片加入训练集，以此进行数据增强。

然后将训练集中的CT图像输入LA-Net网络，设置每次训练时输入的图片数量为6，设置学习率为1e^-4，设置优化算法为Adam，并将其中参数β₁设置为0.9，β₂设置为0.999，eps设置为1e-8，weight_decay设置为1e-8，设置损失函数为Loss_BCE，设置迭代次数为1000次。其中Loss_BCE的定义如下：

因为本发明进行的实验为图像分割实验，所以为了定量分析实验结果的精准度，使用Sensitivity，Specificity，Precision，Dice，E_measure(E_φ)，MAE这几个指标衡量实验结果，以此来评价网络的性能。各项指标的公式如下：

其中TP代表X_1，i，j＝1且Y_1，i，j＝1的像素点的个数，TN代表X_1，i，j＝0且Y_1，i，j＝0的像素点的个数，FP代表X_1，i，j＝0且Y_1，i，j＝1的像素点的个数，FN代表X_1，i，j＝0且Y_1，i，j＝1的像素点的个数，其中0＜i，j＜256且i，j为整数。

将LA-Net网络与传统的U-Net网络分别在训练集的CT图像上进行训练，保存最后一次迭代训练的网络参数。将训练好的LA-Net网络与U-Net网络分别在测试集的CT图像上进行测试，得到分割结果，将分割结果与测试集中的病灶图像数据作为各项指标的输入进行计算，得到结果如表1所示。

表1

网络	Sensitivity	Specificity	Precision	Dice	MAE	E_measure
							U-Net	0.75099	0.98073	0.5432	0.63041	0.0261	0.89163033
LA-Net	0.62323	0.99443	0.77337	0.69023	0.0166	0.95822533

根据表中的数据定量分析，可以分析得到：LA-Net网络在衡量图片间的相似度指标Dice上可以达到0.69023，大幅度超越U-Net网络；在衡量分割结果错误率的指标MAE上，也取得了0.0166，小于U-Net网络，表示与U-Net网络相比，LA-Net网络对CT图像分割出的病灶图像与真实的病灶图像的差距更小。其余各项指标中，Specificity，Precision，E_measure也均达到了比U-Net网络更好的效果。

接下来再根据图5进行定性分析，图5中的(A)图为测试集中的一张原始CT图像；(B)图为与(A)图对应的病灶图像；(C)图为基于传统的U-Net网络对(A)图中COVID-19病灶的分割结果，可以看出U-Net网络将更多的非病灶区域分割为病灶区域，而且在病灶区域的分割结果上与真实的病灶图像也有很大的偏差，分割图像中含有更多的噪音和杂质；(D)图为基于LA-Net网络对(A)图中COVID-19病灶的分割结果，可以看出基于LA-Net网络的图像分割结果含有更少的杂质，几乎精准的分割出完整的病灶区域。

综合上述，可以说明与传统的U-Net网络相比，基于LA-Net网络的图像分割方法在对于CT中COVID-19病灶的分割上达到了更加精准的效果。

显然，上述实施例仅仅是本发明的一部分实施例，而不是全部的实施例。上述实施例仅用于解释本发明，并不构成对本发明保护范围的限定。基于上述实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，也即凡在本申请的精神和原理之内所作的所有修改、等同替换和改进等，均落在本发明要求的保护范围内。

Claims

1.一种基于LA-Net网络的图像分割方法，其特征在于，包括下述步骤：

步骤3：在解码阶段加入LA注意力模块并结合特征图M₁～M₅，将M_S经过解码阶段进行特征还原得到Y，根据Y得到图像分割结果；

所述图像X经过编码阶段得到特征图M₁～M₅的方法为：首先将X经过提取特征操作改变特征图通道数量，得到特征图M₁(C×W×H)；然后将M_i经过最大值池化操作改变M_i的特征图大小，得到再将/>经过提取特征操作，得到特征图M_i+1，其中i为特征图索引，i＝1，2，3，4，所述M_i+1分别为/>

所述提取特征操作由串行的两组串行的卷积操作、数据归一化操作和激活操作构成；

所述将M₅经过SE注意力模块得到M_S的具体过程为：

首先定义C₅，H₅，W₅分别为特征图M₅的通道数量和特征图的大小；且定义所述SE注意力模块中的可变参数为S_R，S_R代表SE注意力模块中的第一个全连接操作中输入特征图通道数量与输出特征图通道数量的比例；然后将M₅经过池化窗口大小为H₅×W₅的平均值池化操作改变特征图大小，得到向量R(C₅×1×1)，所述向量为特征图的一种特殊形式，代表原特征图大小为1×1，向量的长度为特征图的通道数量；再然后将R经过输入特征图通道数量为C₅，输出特征图通道数量为的全连接操作改变特征图通道数量，得到向量/>其中/>代表向上取整运算；又然后将Z经过输入特征图通道数量为/>输出特征图通道数量为C₅的全连接操作改变特征图通道数量，得到向量Q(C₅×1×1)；最后将M₅与Q按照式(1)进行矩阵与向量相乘操作，得到M_s(C₅×H₅×W₅)；

M_s(j，k，l)＝M₅(j，k，l)×Q(j，1，1) (1)

上式中，j、k、l为位置索引，且1≤j≤C₅，1≤k≤H₅，1≤l≤W₅；

所述将M_S经过解码阶段进行特征还原得到Y的方法为：首先定义B₅＝M_S，将B_i+1经过上采样操作改变特征图大小，得到特征图然后将/>与M_i经过拼接操作，得到特征图U_i；将U_i经过还原特征操作得到特征图B_i，其中i为特征图索引，i＝4，3，2，1，所述B_i分别为B₁(C×H×W)；最后将B₁通过卷积操作得到B₀(T×H×W)，将B₀通过LA注意力模块，得到Y。

2.根据权利要求1所述的基于LA-Net网络的图像分割方法，其特征在于，所述上采样操作采用双线性插值算法。

3.根据权利要求1所述的基于LA-Net网络的图像分割方法，其特征在于，所述LA注意力模块包括损失注意力函数G(·)，所述损失注意力函数G(·)的公式如下：

4.根据权利要求3所述的基于LA-Net网络的图像分割方法，其特征在于，所述B₀通过LA注意力模块得到Y的方法为：将B₀中每个点的坐标值代入LA注意力模块中的损失注意力函数G(•)所得到的结果再与该点的坐标值相乘，相乘的结果即为Y中对应点的坐标值。