CN116664605B

CN116664605B - 基于扩散模型和多模态融合的医学图像肿瘤分割方法

Info

Publication number: CN116664605B
Application number: CN202310954604.9A
Authority: CN
Inventors: 张亚飞; 李志远; 李华锋; 柴毅; 陈伟庆
Original assignee: Chongqing University; Kunming University of Science and Technology
Current assignee: Chongqing University; Kunming University of Science and Technology
Priority date: 2023-08-01
Filing date: 2023-08-01
Publication date: 2023-10-10
Anticipated expiration: 2043-08-01
Also published as: CN116664605A

Abstract

本发明涉及基于扩散模型和多模态融合的医学图像肿瘤分割方法，属于医学图像处理技术领域。本发明包括步骤：获取多模态MRI医学图像，并对图像进行预处理；构建去噪网络，将预处理好的多模态图像分别送入不同的去噪网络，该网络通过正向扩散过程对输入图像进行破坏，然后预测噪声并修复出正常区域；将每个模态的原始输入图片和噪声图像的预测值被级联输入到不同的分割网络编码器中；构建自适应融合模块，预测每个模态的重要性，自适应融合不同模态的编码特征；构建分割网络解码器，将编码器的输出特征通过跳越连接送入到解码器并输出分割结果图。本发明通过网络自适应学习不同模态的贡献程度，提升了融合效率和分割精度。

Description

基于扩散模型和多模态融合的医学图像肿瘤分割方法

技术领域

本发明涉及基于扩散模型和多模态融合的医学图像肿瘤分割方法，属于医学图像处理技术领域。

背景技术

肿瘤具有很高的致死率。因此，尽早发现和诊断肿瘤并制定高效的治疗计划是提高患者存活率的关键。由于核磁共振成像中的特殊性质，图像中常常存在各种伪影和噪声。这些伪影和噪声不仅影响视觉感受，也会干扰图像分割的结果。为了提高诊断的一致性、准确性和高效性，基于深度神经网络的肿瘤分割算法得到越来越多的关注。然而，目前基于深度神经网络的肿瘤分割方法仍存在一些问题，如计算量大，模型对图像处理质量不高，由于且未采取有针对性的措施来凸显对应肿瘤特征作用，限制了分割性能的进一步提升。针对该图像分割问题，提出了基于扩散模型和多模态融合的医学图像肿瘤分割方法。

发明内容

为了解决现有方法的不足，本发明针对肿瘤图像存在伪影、噪声、对比度低和不同模态的MRI图像对肿瘤区域的敏感性不同等问题，提出了基于扩散模型和多模态融合的医学图像肿瘤分割方法。

本发明的技术方案是：基于扩散模型和多模态融合的医学图像肿瘤分割方法，所述方法的具体步骤如下：

Step1：获取多模态MRI医学图像，并对图像进行预处理；

Step2：构建去噪网络，将预处理好的多模态图像分别送入不同的去噪网络，该网络通过正向扩散过程对输入图像进行破坏，然后预测噪声并修复出正常区域；

Step3：将每个模态的原始输入图片和噪声图像的预测值被级联输入到不同的分割网络编码器中；

Step4：构建自适应融合模块，预测每个模态的重要性，自适应融合不同模态的编码特征；

Step5：构建分割网络解码器，将编码器的输出特征通过跳越连接送入到解码器并输出分割结果图；

Step6：训练去噪网络和分割网络，所述Step6具体包括为：

Step61、利用Adam优化器对去噪网络和分割网络中的参数进行优化；

Step62、训练去噪网络和分割网络时定义一个损失函数，该函数将预测的掩码与真实标签进行比较，从图像中准确地提取肿瘤区域；

去噪网络的损失函数定义为：

其中，代表输入的噪声预测网络；为t时刻具有噪声的图像，为高斯噪声；

Step63、采用加权交叉熵损失函数和Dice损失函数对分割网络进行优化，所述损失函数包括两部分，第一部分为真实标签和预测结果的加权交叉熵损失，第二部分采用Dice损失，所述损失函数为：

其中为加权交叉熵损失，为Dice损失，为真实标签，为预测结果；总的损失函数为：

。

进一步地，所述Step1中，将不同模态的肿瘤图像随机裁剪到大小，在输入去噪网络之前对其进行归一化操作，并采用镜像翻转、强度变化、随机旋转进行数据增强。

进一步地，所述Step2中去噪网络由扩散正向过程、扩散模型和一步去噪组成，该网络对输入肿瘤图像进行去噪处理，修复出正常区域。

进一步地，所述Step2中去噪网络具体操作过程如下：

预处理好的肿瘤图像通过不断地将高斯噪声添加到当前的图像，高斯噪声尺度通过调节，定义为：

其中为输入肿瘤图像，为t时刻具有噪声的图像，为单位矩阵，，，表示正态分布。

进一步地，所述Step2中，去噪网络中的一步去噪过程如下：

其中，为去噪网络输出的正常肿瘤图像，表示噪声方差调度，表示经过训练的去噪网络，为t时刻具有噪声的图像。

进一步地，所述Step3中，分割网络编码器采用四个参数不共享的编码器，其结构为UNet编码器部分。

进一步地，所述Step3中分割网络编码器具体操作步骤如下：

分割网络的输入是原始输入图像和从去噪网络获得的相应去噪图像沿通道维度合并后的图像；编码器采用UNet结构对输入的不同模态的MRI图像进行特征提取，得到的特征为，其中，表示肿瘤数据的四种模态，H、W为输入图像的高和宽，D是切片数，C是通道数，为编码器第个特征提取块。

进一步地，所述Step4中自适应融合模块包括全局平均池化，全连接层，ReLU激活函数和softmax操作。

进一步地，所述Step4中自适应融合模块具体操作步骤如下：

将Step3获得不同模态特征沿通道维度进行拼接，先进行全局平均池化，然后经过第一个全连接层和ReLU激活函数进行降维，再经过第二个全连接层和softmax操作得到四个输出值，分别代表每个模态的权重，然后将权重值乘到对应的模态特征上进行自适应融合，整个过程定义为：

其中，为拼接操作，，均表示肿瘤数据的四种模态特征。

进一步地，所述Step5中分割网络的解码器为UNet网络解码结构，将编码器最后一层的输出特征通过Step4自适应融合后，进行上采样操作，得到采样后的特征图，然后解码网络将Step4中获得的具有相同分辨率大小的特征图通过跳越连接拼接，并继续上采样操作，重构到原始图像分辨率大小。

本发明的有益效果是：

1、因为在肿瘤分割中，图像会受到噪声或伪影等多种因素的影响，从而干扰肿瘤的定位和分割，本发明加入的去噪网络，使用扩散模型将噪声和伪影减少到最小，同时每个去噪子网络分别使用损失函数进行约束，去噪过程可以将原始图像中的噪声和干扰去除并修复出正常区域；

2、现有技术中在分割过程中，仅仅通过去噪得到的图像可能并不能很好地区分正常区域和异常区域，因为它们仅仅是像素值的变化，而不一定能很好地反映出结构和形态的差异；因此，本发明将去噪后的图像与原始图像进行拼接，得到了一个包含更多结构信息的图像。这个图像能够更好地反映出正常区域和异常区域的差异，从而有利于分割网络准确地对异常区域进行标记；

3、由于不同模态对不同的肿瘤区域敏感性不同，直接将编码网络输出的特征进行融合将会引入大量无关信息，因此，本发明提出一种基于扩散模型和多模态融合的医学图像肿瘤分割方法，通过网络自适应学习不同模态的贡献程度，提升了模型的融合效率和分割精度。

4、本发明一步去噪的结合使扩散模型速度加快；分割网络采用类似于U-Net的架构，由编码器、解码器和跳跃连接组成；分割网络的输入是原始输入图像和从去噪网络获得的相应去噪图像沿通道合并后的图像，通过自适应融合模块有效抑制肿瘤无关信息，提升不同模态特征的融合质量，分割网络被训练来预测肿瘤区域，该网络使肿瘤的定位和分割更加准确和稳健。

附图说明

图1为本发明方法的流程结构示意图；

图2为本发明方法的自适应特征融合模块结构图；

图3为本发明为不同方法的分割效果对比图。

具体实施方式

实施例1：如图1-图3所示，基于扩散模型和多模态融合的医学图像肿瘤分割方法，所述方法的具体步骤如下：

Step1：获取多模态MRI医学图像，并对图像进行预处理：将不同模态的肿瘤图像随机裁剪到大小，在输入去噪网络之前对其进行归一化操作，并采用镜像翻转、强度变化、随机旋转进行数据增强。归一化的计算方式如下：

其中为归一化后的值，为归一化前的值，为输入的序列。表示输入序列的均值，表示输入序列的标准差。

所述Step2中去噪网络由扩散正向过程、扩散模型和一步去噪组成，该网络对输入肿瘤图像进行去噪处理，修复出正常区域。

所述Step2中去噪网络具体操作过程如下：

所述Step2中，去噪网络中的一步去噪过程如下：

所述Step3中，分割网络编码器采用四个参数不共享的编码器，其结构为UNet编码器部分。

所述Step3中分割网络编码器具体操作步骤如下：

所述Step4中自适应融合模块包括全局平均池化，全连接层，ReLU激活函数和softmax操作。所述Step4中自适应融合模块具体操作步骤如下：

其中，为拼接操作，，均表示肿瘤数据的四种模态特征。

所述Step5中分割网络的解码器为UNet网络解码结构，将编码器最后一层的输出特征通过Step4自适应融合后，进行上采样操作，得到采样后的特征图，然后解码网络将Step4中获得的具有相同分辨率大小的特征图通过跳越连接拼接，并继续上采样操作，重构到原始图像分辨率大小。

Step6：训练去噪网络和分割网络，所述Step6具体包括为：

去噪网络的损失函数定义为：

。

进一步地，为验证本发明方法的有效性，我们在Multimodal Brain TumorSegmentation Challenge 2020(BraTS2020)数据集上评估了提出方法的性能。每个数据集的所有病例都由Flair、T1、T1c和T2四种模态的图像组成。每个模态图像中都包含背景区域, 坏疽和非强化肿瘤区域, 瘤周水肿和增强肿瘤区域。BraTS2020中的训练集包含369个标签已知的MRI序列，验证集由125个标签未知的MRI序列构成。在此过程中，本发明将训练集以7:1:2的比例随机划分。本发明算法是在Pytorch框架下开发的，并在一张NVIDIAGTX3090显卡上进行了训练。在训练中，我们使用AdamW优化器来对模型进行参数优化。在此过程中，Batch size设置为1， weight decay为0.00001。学习率采用余弦退火算法进行调整，warmup设置为总训练轮数的1/10，总共训练了300轮。

进一步地，本发明采用Hausdorff距离和Dice分数评估模型的分割精度。HD95距离通过度量预测结果和真实标签的边界之间的相似度，来衡量分割的性能，其数值越小，表示边界分割越精确，Dice分数通过计算预测结果和真实标签边界的重叠率来度量分割性能。Dice系数值越大，表示分割结果越接近真实标签。

进一步地，在BraTS2020数据集上，本发明方法和3D U-Net，V-Net，Attention U-Net，TransBTS和SegResNet等脑肿瘤分割方法进行了性能比较，实验结果如表1所示。从此可以看出，本发明方法在ET、WT和TC区域，Dice系数分别达到了75.3%，89.3%和87.2%，Hausdorff距离分别为2.82，4.92，4.23。这证明了本发明方法在分割肿瘤区域和边界的有效性。

表1为不同方法在BraTS2018验证集上的客观评价比较

进一步地，本发明将TransBTS、SegResNet和Attention-Unet分割结果进行了视觉效果对比，如图3所示。由此可以看出，提出的方法可以更加精确的识别和定位肿瘤区域和肿瘤边界，而其他方法的分割结果较粗略。

上面结合附图对本发明的具体实施方式作了详细说明，但是本发明并不限于上述实施方式，在本领域普通技术人员所具备的知识范围内，还可以在不脱离本发明宗旨的前提下作出各种变化。

Claims

1.基于扩散模型和多模态融合的医学图像肿瘤分割方法，其特征在于：所述方法的具体步骤如下：

Step1：获取多模态MRI医学图像，并对图像进行预处理；

Step6：训练去噪网络和分割网络；

所述Step3中，分割网络编码器采用四个参数不共享的编码器，其结构为UNet编码器部分；

所述Step3中分割网络编码器具体操作步骤如下：

分割网络的输入是原始输入图像和从去噪网络获得的相应去噪图像沿通道维度合并后的图像；编码器采用UNet结构对输入的不同模态的MRI图像进行特征提取，得到的特征为，其中/>，表示肿瘤数据的四种模态，H、W为输入图像的高和宽，D是切片数，C是通道数，/>为编码器第/>个特征提取块；

所述Step4中自适应融合模块包括全局平均池化，全连接层，ReLU激活函数和softmax操作；

所述Step4中自适应融合模块具体操作步骤如下：

；

其中，为拼接操作，/>，/>均表示肿瘤数据的四种模态特征；

2.根据权利要求1所述的基于扩散模型和多模态融合的医学图像肿瘤分割方法，其特征在于：所述Step1中，将不同模态的肿瘤图像随机裁剪到大小，在输入去噪网络之前对其进行归一化操作，并采用镜像翻转、强度变化、随机旋转进行数据增强。

3.根据权利要求1所述的基于扩散模型和多模态融合的医学图像肿瘤分割方法，其特征在于，所述Step2中去噪网络由扩散正向过程、扩散模型和一步去噪组成，该网络对输入肿瘤图像进行去噪处理，修复出正常区域。

4.根据权利要求1所述的基于扩散模型和多模态融合的医学图像肿瘤分割方法，其特征在于，所述Step2中去噪网络具体操作过程如下：

；

其中为输入肿瘤图像，/>为t时刻具有噪声的图像，/>为单位矩阵，/>，/>，/>表示噪声方差调度，/>表示正态分布。

5.根据权利要求3所述的基于扩散模型和多模态融合的医学图像肿瘤分割方法，其特征在于，所述Step2中，去噪网络中的一步去噪过程如下：

；

其中，为去噪网络输出的正常肿瘤图像，/>表示噪声方差调度，/>表示经过训练的去噪网络，/>为t时刻具有噪声的图像。

6.根据权利要求1所述的基于扩散模型和多模态融合的医学图像肿瘤分割方法，其特征在于，所述Step6具体包括为：

去噪网络的损失函数定义为：

；

其中，代表输入/>的噪声预测网络；/>为t时刻具有噪声的图像，/>为高斯噪声；

；

其中为加权交叉熵损失，/>为Dice损失，/>为真实标签，/>为预测结果；总的损失函数为：

。