CN114066883A

CN114066883A - 一种基于特征选择与残差融合的肝肿瘤分割方法

Info

Publication number: CN114066883A
Application number: CN202111557668.2A
Authority: CN
Inventors: 张云峰; 乔伟晨; 刘利军
Original assignee: Kunming University of Science and Technology
Current assignee: Kunming University of Science and Technology
Priority date: 2021-12-20
Filing date: 2021-12-20
Publication date: 2022-02-18

Abstract

本发明涉及基于特征选择与残差融合的肝肿瘤分割方法。本发明首先通过注意力机制对UNet瓶颈特征及跳跃链接进行优化，提出以全局特征压缩操作为基础的瓶颈特征选择模块，即全局特征选择模块和邻近特征选择模块。再使用跳跃链接对空间注意力模块进行特征重标定，最后通过空间特征残差融合模块解决前后空间特征的语义不匹配问题，在保持低复杂度的同时使特征高效表达。本发明使2D肝肿瘤分割的结果更加准确，在LiTS公开数据集上进行了组件消融测试并与当前方法进行对比测试，在肝脏及肝肿瘤分割任务中分别取得了96.2％和68.4％的平均Dice得分，比当前最佳的2D肝肿瘤分割模型平均Dice得分高0.8％。

Description

一种基于特征选择与残差融合的肝肿瘤分割方法

技术领域

本发明涉及一种基于特征选择与残差融合的肝肿瘤分割方法，属于计算机视觉技术领域。

背景技术

肝癌是目前全球死亡率最高且最常见的癌症之一。计算机断层扫描(ComputedTomography，CT)是临床上常用的肿瘤诊断方法，通过测定肿瘤的形状、位置等信息可帮助医生制定相应的治疗计划。CT图像的手动分割存在效率低下、医生主观经验影响等问题，因此临床实践中迫切需要一种高效的自动分割方法，肝脏治疗可以通过准确而快速的自动分割方法中获益。然而，由于CT图像中软组织的对比度较低，并且肝肿瘤的形状与位置具有高可变性，同时肝肿瘤区域边界不清楚，大部分肿瘤相对较小，所以肝肿瘤自动分割在实践中是一项艰巨的任务。

为解决肝肿瘤自动分割问题，在过去的几年中基于深度学习提出了许多解决方法，这些方法一般可以分为三类：(1)2D模型，如Multiple U-Nets(Chlebus等，2018)在每层收缩路径和扩展路径中采用残差链接用于增加训练效率并在扩展路径的卷积之前加入概率为0.5的dropout防止网络过拟合，模型在2D输入的情况下取得了领先的效果；FED-Net(Chen等，2019)基于注意力机制设计了一种新颖的特征融合方法，可以将语义信息嵌入到低级特征中，并且替换掉传统UNet的收缩路径和扩展路径，分别改为残差卷积块和密集上采样卷积，在跳跃链接部分引入卷积改善前后语义不匹配问题，但未能解决特征冗余问题。(2)2.5D模型，例如Res-UNet(Han，2017)使用了两个U型结构长跳和短跳连接模型，第一个网络用于粗略的肝脏分割，第二个网络专注于肝脏细致分割，第二个网络经过训练可以进一步分割肝脏和肝肿瘤，模型通过接收五个相邻切片为模型提供上下文信息，用多段级联处理逐步细化，导致模型冗余，不易部署；LW-HCN(Zhang等，2019)为降低模型复杂度替换3D编码器底部卷积为2D卷积，设计了深度和时空分离(DSTS)操作处理3D卷积降低模型复杂度；非线性增强和图割方法(Liao等，2019)通过组织对比增强图像和边界信息融入图割能量函数，最后使用三维形态学进行后处理实现高精度分割，着重于预处理及后处理过程；结合影像组学方法(Liu等，2020)先经过级联的2D分割模型，然后结果分别经过影像组学分类模型和3D模型减少假阳性并细化分割结果，该方法依赖于后处理消除假阳性以提升分割结果，中间过程效果不佳。(3)3D模型，例如H-DenseUNet(Li等，2018)使用2D-DenseUNet模型提取切片内特征，并根据自动上下文算法进行层次聚合，即切片内和切片间混合特征学习体系，分割效果优秀，但3D模型参数量达到千万级，模型庞大且不易训练；CDNN(Yuan，2017)提出一个分层的深度完全卷积-反卷积神经网络模型，第一层用整个CT体素粗分割肝脏区域，第二层进行精细的肝脏分割，第三层进行肝肿瘤分割的补充输入。

发明内容

本发明涉及一种基于特征选择与残差融合的肝肿瘤分割方法，使得肝肿瘤分割的结果更加准确。

本发明的技术方案是：一种基于特征选择与残差融合的肝肿瘤分割方法，所述方法的具体包括如下：

Step1、瓶颈特征部分采用全局特征选择模块(Feature Selection Module，FS)处理肝脏CT图像，邻近特征选择模块(Neighbor Feature Selection Module，NFS)处理肝肿瘤CT图像，两种模块均采用全局特征压缩操作(GFS)压缩特征图；

Step2、跳跃链接部分采用空间注意力模块(Spatial Attention Module，SAM)和空间特征残差融合模块(Spatial Feature Residual Fusion Module，SFRF)提取空间维度的有效信息并解决语义鸿沟问题；

Step3、输出分割图采用扩展路径增加特征图维度并减少特征通道数，扩展层均采用2倍上采样双线性插值法生成扩展特征图，扩展特征图通过一个卷积单元后与收缩路径同层的高分辨率特征图拼接。

进一步地，所述Step1中的全局特征选择模块具体包括如下：

使用全局特征压缩(GFS)操作，该操作通过矩阵运算在压缩特征图的同时融入空间特征，提高网络的表达能力及泛化性，如计算公式所示：

式中f_GFS表示全局特征压缩操作，输入X∈R^C×HW，输出f_GFS(X)∈R^C×1，C是特征图的通道数，H和W分别表示特征图的高和宽。

表示1*1卷积矩阵的转置，其目的是将特征图通道数由C压缩至1，全局特征选择模块(FS)，如计算公式所示f_FS(X)＝σ(W_E(ReLU(W_Sf_GFS(X))))；Y_FS(X)＝F_S(f_FS(X))·X。式中f_FS是全局特征选择操作，f_FS(X)∈R^C×1。W_S∈R^M×C表示1*1卷积矩阵，用于压缩通道数，M为压缩后的通道数。W_E∈R^C×M表示1*1卷积矩阵，用于恢复通道数为原始维度C。σ为Sigmoid函数，其目的为输出各个通道的激活值，范围为[0，1]。F_S为空间维度扩展函数，功能为扩展f_FS(X)空间维度与输入X一致，Y_FS∈R^C×HW为全局特征选择模块(FS)的输出；

进一步地，所述Step1中的邻近特征选择模块具体包括如下：

邻近特征选择模块(NFS)在特征图压缩时采用上述提出的GFS操作，NFS与全局特征选择模块(FS)的区别在于NFS模块关联n个相邻的特征通道，有利于更加细微的特征表达，同时可以捕获跨通道交互，适用于处理肝肿瘤CT图像，而FS模块通过压缩全部通道融合全局特征，适合肝脏CT图像这类具有全局位置特点表达需求的数据。NFS的n邻近关联可以通过一维卷积操作实现，如计算公式所示：

其中，卷积核的大小为n，式中内核n的大小代表本组通道交互的覆盖范围，|t|_odd表示与t最接近的奇数，C表示特征通道数，γ和β数值分别为2和1。邻近特征选择模块(NFS)计算公式：f_NFS(X，n)＝σ(C1D_n(f_GFS(X)))；Y_NFS(X，n)＝F_S(f_NFS(X，n))·X。式中f_NFS表示邻近特征选择操作，输入为特征图X∈R^C×HW和一维卷积核大小n，输出f_NFS(X，n)∈R^C×1与输入保持一致。C1D_n表示卷积核大小为n的一维卷积，σ为sigmoid函数，其输出激活值对特征图X的通道维度进行特征选择。邻近特征选择模块(NFS)输出Y_NFS∈R^C×HW。

进一步地，所述Step2中的空间注意力模块具体包括如下：

空间注意力模型采用1*1卷积压缩通道维度至1，不改变特征图的大小，保证空间维度特征一致性，如计算公式所示：f_SA(X)＝σ(W_KX)；Y_SA(X)＝F_C(f_SA(X))·X。式中f_SA表示空间注意力操作，输出f_SA(X)∈R^1×HW，W_K∈R^1×C为1*1卷积矩阵，用于压缩通道维度至1，σ为Sigmoid函数，输出空间维度特征的激活值。空间注意力模块的输出Y_SA∈R^C×HW，F_C为通道维度扩展函数，可通过该函数将函数输入的通道维度扩展至C。

进一步地，所述Step2中的空间特征残差融合模块SFRF具体包括：

空间特征残差融合模块(SFRF)用于解决跳跃链接带来的语义鸿沟问题。空间特征残差融合模块(SFRF)接收模型相对浅层特征(k层)及相对深层特征(k+1层)为输入，k为[1，4]中的整数。如计算公式所示：Y_SFRF(X_k，X_k+1)＝X_k+F_up(W_FX_k+1)。式中X_k∈R^C×HW来自k层收缩路径的输出特征，

来自k+1层SFRF的输出特征，仅当k＝4时，X_k+1为瓶颈特征选择模块的输出，

表示H与W大小分别减半。W_F∈R^C×2C为1*1卷积操作，目的为压缩通道数由2C至C，F_up为2倍上采样双线性插值操作，可通过双线性插值的方式对特征图进行扩充，使输出Y_SFRF(X_k，X_k+1)∈R^C×HW与X_k在特征维度上保持一致。

进一步地，所述Step3还包括如下：

针对数据集存在的正负样本不均衡这一情况，采用二元交叉熵(Binary crossentropy，BCE)与骰子损失(Dice Loss，DL)加权结合的方式，由于骰子损失(DL)可能会导致梯度剧烈变化从而影响反向传播导致训练困难，所以我们适当降低DL的权重，损失函数如计算公式所示：

式中y表示真实的分割图，

为模型预测的分割图，ω为两种损失的权重，本发明设置为0.3，∈为避免分母为0而设置的平滑项，本发明设置∈为1.0。

本发明的有益效果是：本发明使2D肝肿瘤分割的结果更加准确，在LiTS公开数据集上进行了组件消融测试并与当前方法进行对比测试，在肝脏及肝肿瘤分割任务中分别取得了96.2％和68.4％的平均Dice得分，该结果与部分2.5D和3D模型的效果相当，比当前最佳的2D肝肿瘤分割模型平均Dice得分高0.8％。

附图说明

图1为传统UNet结构图；

图2为总体模型及关键组件结构示意图；(A.Overall Architecture；B.FeatureSelection Module；C.Global Feature Squeeze Module；D.Neighbor Feature SelectionModule；E.Spatial Attention Module；F.Spatial Feature Residual Fusion Module)；

图3为本发明分割结果对比。

具体实施方式

实施例1，一种基于特征选择与残差融合的肝肿瘤分割方法，所述方法的具体步骤如下：

进一步地，所述Step1中的全局特征选择模块具体包括如下：

进一步地，所述Step1中的邻近特征选择模块具体包括如下：

进一步地，所述Step2中的空间注意力模块具体包括如下：

进一步地，所述Step3还包括如下：

式中y表示真实的分割图，

进一步地，为了验证本发明的效果，由上述步骤训练好的模型输入MICCAI 2017LiTS Challenge的训练数据集对模型进行测验，该数据集包含来自7个临床机构的131个对比增强的腹部CT扫描。该试验的环境配置为CPU：Intel(R)Silver；GPU：NVIDIA TITAN XP(12G)；内存：128G；操作***：Ubuntu16.04。

本模型由UNet作为基础网络(Baseline)，模型组件包含全局特征选择模块(FS)或邻近特征选择模块(NFS)；空间注意力模块(SAM)；空间特征残差融合模块(SFRF)。预测结果均采用国际上常用的平均Dice得分进行衡量，该标准反映了预测结果与真实结果的相似程度。平均Dice得分的计算公式如下式所示。

式中y_ij与

分别表示第i例CT的第j张切片的真实分割图与模型预测分割图，N表示所有CT切片的总数。

模型组件测试结果如表1所示。在分别加入瓶颈特征选择(FS/NFS)操作后，模型相较于基础网络效果明显提升，其中肝脏分割预测结果的平均Dice得分均达到0.95以上，比基础网络的错误预测改善约37％，肝肿瘤分割预测得分均达到0.65以上。基础网络在跳跃链接处分别加入空间注意力模块(SAM)和空间特征残差融合模块(SFRF)后效果均得到提升，其中单独加入SFRF模块后效果提升有限，分析原因为SFRF模块接收了未经k层空间注意力机制(SAM)与k+1层瓶颈特征选择(FS/NFS)的原始UNet特征，导致冗余特性重复干扰模型导致训练困难。添加全部组件后，FS模块和NFS模块分别在肝脏分割和肝肿瘤分割任务中达到最高的平均Dice得分。实验结果表明了模型组件的有效性，如表2所示，在肝脏及肝肿瘤分割任务中取得了68.4％的平均Dice得分，该结果比当前最佳的2D肝肿瘤分割模型平均Dice得分67.6％高0.8％。

表1模型关键组件消融实验结果

Model	Liver	Tumor
			Baseline	0.921	0.633
Baseline+FS	0.952	0.650
			Baseline+NFS(5)	0.951	0.655
Baseline+SAM	0.945	0.646
			Baseline+SFRF	0.931	0.639
Baseline+SAM+SFRF	0.952	0.653
			Baseline+FS+SAM	0.957	0.661
Baseline+FS+SFRF	0.959	0.674
			Baseline+NFS(5)+SAM	0.955	0.667
Baseline+NFS(5)+SFRF	0.956	0.676
			Baseline+FS+SAM+SFRF	0.962	0.682
Baseline+NFS(5)+SAM+SFRF	0.959	0.684

表2本发明与其他主流分割方法对比

Methods	Liver	Tumor
			Attention Unet(Oktay等，2018)	0.956	0.676
MS-DG(Ashish等，2021)	0.960	0.657
			MsAUNet(Soham等，2020)	0.962	0.673
本发明	0.962	0.684

如图3所示是分割结果对比，a列是三张CT原图，b列是真实标签，c列是基准模型UNet的结果标签，d列是本发明加入FS模块之后的改进结果，e列是本发明加入NFS模块之后的改进结果；从图中可以看出，d列、e列的图可以很直接的看到与原始标签非常接近，比c列的基准模型效果要好。

上面结合附图对本发明的具体实施方式作了详细说明，但是本发明并不限于上述实施方式，在本领域普通技术人员所具备的知识范围内，还可以在不脱离本发明宗旨的前提下作出各种变化。

Claims

1.一种基于特征选择与残差融合的肝肿瘤分割方法，其特征在于：所述方法具体包括如下：

Step1、瓶颈特征部分采用全局特征选择模块处理肝脏CT图像，邻近特征选择模块处理肝肿瘤CT图像，两种模块均采用全局特征压缩操作压缩特征图；

Step2、跳跃链接部分采用空间注意力模块和空间特征残差融合模块提取空间维度的有效信息并解决语义鸿沟问题；

2.根据权利要求1所述基于特征选择与残差融合的肝肿瘤分割方法，其特征在于：所述Step1中的全局特征选择模块具体包括如下：

使用全局特征压缩GFS操作，该操作通过矩阵运算在压缩特征图的同时融入空间特征，提高网络的表达能力及泛化性，如计算公式所示：

式中f_GFS表示全局特征压缩操作，输入X∈R^C×HW，输出f_GFS(X)∈R^C×1，C是特征图的通道数，H和W分别表示特征图的高和宽；

表示1*1卷积矩阵的转置，其目的是将特征图通道数由C压缩至1，全局特征选择模块FS，如计算公式所示f_FS(X)＝σ(W_E(ReLU(W_Sf_GFS(X))))；Y_FS(X)＝F_S(f_FS(X))·X；式中f_FS是全局特征选择操作，f_FS(X)∈R^C×1，W_S∈R^M×C表示1*1卷积矩阵，用于压缩通道数，M为压缩后的通道数，W_E∈R^C×M表示1*1卷积矩阵，用于恢复通道数为原始维度C，σ为Sigmoid函数，其目的为输出各个通道的激活值，范围为[0,1]，F_S为空间维度扩展函数，功能为扩展f_FS(X)空间维度与输入X一致，Y_FS∈R^C×HW为全局特征选择模块FS的输出。

3.根据权利要求1所述基于特征选择与残差融合的肝肿瘤分割方法，其特征在于：所述Step1中的邻近特征选择模块具体包括如下：

邻近特征选择模块NFS在特征图压缩时采用GFS操作，NFS与全局特征选择模块FS的区别在于NFS模块关联n个相邻的特征通道，有利于更加细微的特征表达，同时可以捕获跨通道交互，适用于处理肝肿瘤CT图像，而全局特征选择模块FS通过压缩全部通道融合全局特征，适合肝脏CT图像这类具有全局位置特点表达需求的数据；邻近特征选择模块NFS的n邻近关联能通过一维卷积操作实现，如计算公式所示：

其中，卷积核的大小为n，式中内核n的大小代表本组通道交互的覆盖范围，|t|_odd表示与t最接近的奇数，C表示特征通道数，γ和β数值分别为2和1；邻近特征选择模块NFS计算公式：f_NFS(X,n)＝σ(C1D_n(f_GFS(X)))；Y_NFs(X,n)＝F_s(f_NFS(X,n))·X；式中f_NFS表示邻近特征选择操作，输入为特征图X∈R^C×HW和一维卷积核大小n，输出f_NFS(X,n)∈R^C×1与输入保持一致；C1D_n表示卷积核大小为n的一维卷积，σ为sigmoid函数，其输出激活值对特征图X的通道维度进行特征选择；邻近特征选择模块NFS输出Y_NFS∈R^C×HW。

4.根据权利要求1所述的基于特征选择与残差融合的肝肿瘤分割模型方法，其特征在于：所述Step2中的空间注意力模块具体包括如下：

空间注意力模型采用1*1卷积压缩通道维度至1，不改变特征图的大小，保证空间维度特征一致性，如计算公式所示：f_SA(X)＝σ(W_KX)；Y_SA(X)＝F_C(f_SA(X))·X；式中f_SA表示空间注意力操作，输出f_SA(X)∈R^1×HW，W_K∈R^1×C为1*1卷积矩阵，用于压缩通道维度至1，σ为Sigmoid函数，输出空间维度特征的激活值；空间注意力模块的输出Y_SA∈R^C×HW，F_C为通道维度扩展函数，可通过该函数将函数输入的通道维度扩展至C。

5.根据权利要求1所述的基于特征选择与残差融合的肝肿瘤分割模型方法，其特征在于：所述Step2中的空间特征残差融合模块SFRF具体包括：

空间特征残差融合模块SFRF用于解决跳跃链接带来的语义鸿沟问题；空间特征残差融合模块SFRF接收模型相对浅层特征(k层)及相对深层特征(k+1层)为输入，k为[1,4]中的整数；如计算公式所示：Y_SFRF(X_k,X_k+1)＝X_k+F_up(W_FX_k+1)；式中X_k∈R^C×HW来自k层收缩路径的输出特征，

表示H与W大小分别减半；W_F∈R^C×2C为1*1卷积操作，目的为压缩通道数由2C至C，F_up为2倍上采样双线性插值操作，可通过双线性插值的方式对特征图进行扩充，使输出Y_SFRF(X_k,X_k+1)∈R^C×HW与X_k在特征维度上保持一致。

6.根据权利要求1所述基于特征选择与残差融合的肝肿瘤分割方法：所述Step3还包括如下：

针对数据集存在的正负样本不均衡这一情况，采用二元交叉熵与骰子损失加权结合的方式，由于骰子损失可能会导致梯度剧烈变化从而影响反向传播导致训练困难，所以降低DL的权重，损失函数如计算公式所示：

式中y表示真实的分割图，

为模型预测的分割图，ω为两种损失的权重，设置为0.3，∈为避免分母为0而设置的平滑项，设置∈为1.0。