CN115170582A - 基于多尺度特征融合和网格注意力机制的肝脏影像分割方法 - Google Patents
基于多尺度特征融合和网格注意力机制的肝脏影像分割方法 Download PDFInfo
- Publication number
- CN115170582A CN115170582A CN202210666323.9A CN202210666323A CN115170582A CN 115170582 A CN115170582 A CN 115170582A CN 202210666323 A CN202210666323 A CN 202210666323A CN 115170582 A CN115170582 A CN 115170582A
- Authority
- CN
- China
- Prior art keywords
- liver
- attention
- convolution
- grid
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/7715—Feature extraction, e.g. by transforming the feature space, e.g. multi-dimensional scaling [MDS]; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30056—Liver; Hepatic
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Multimedia (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种基于多尺度特征融合和网格注意力机制的肝脏影像分割方法,包括如下步骤:选取需要进行肝脏分割的肝脏影像数据集,将其划分为训练集和测试集;对训练集中的肝脏影像进行预处理;在编码器阶段,利用多尺度特征融合模块、卷积网络得到肝脏的特征图;在解码器阶段,利用多尺度特征融合模块、网格注意力机制、注意力引导连接模块、转置卷积和深度监督机制得到肝脏的分割图像;对分割后得到的肝脏图像进行形态学后处理。该方法具有提高三维肝脏影像分割效果的特点,实现了对三维肝脏影像的较为精确的分割,为医生的医疗诊断提供了极大的辅助作用。
Description
技术领域
本发明涉及三维医学影像分割方法,特别是涉及一种基于多尺度特征融合 和网格注意力机制的三维肝脏影像分割方法。
背景技术
近些年来,计算机断层扫描(Computed Tomography,CT)和磁共振成像 (MagneticResonance Imaging,MRI)是医生诊断和评估肝癌的主要成像方法。在 医学图像中,对肝脏精确地分割在肝癌的定性分析和治疗计划中具有重要的意 义。在临床诊断中,肝脏的分割通常是由有经验的专家按照解剖结构将肝脏的 边缘手工勾勒出来,十分枯燥且耗时耗力,而且对专家的要求非常高。分割的 结果会受到专家的主观经验、认知能力等因素的影响,这就使得肝脏的分割成 为一项具有挑战性的任务。
一般来说,医学图像的分割方法可以分为三类:手动分割、半自动分割和 自动分割。手动分割是一种极为依靠主观经验、可重复性差且耗时的方法。它 在很大程度上依赖于人类可识别的特征,并且需要具有高级技术技能的人来执 行此类任务。这些因素使其在实际应用中变得不切实际。半自动分割是一种由 人工和计算机结合的方式,人工操作提供一些有用的信息,然后计算机在这些 信息的基础上进行分割处理,人工的干预可能会导致分割的偏差。自动分割方 式就是完全依靠计算机进行分割。通过近些年的发展,医学影像分割领域的研 究主要是自动分割,即设计计算机可执行的算法进行自动分割。目前肝脏的分 割算法主要为传统方法和深度学习的方法。传统的方法主要有基于阈值的方法、 区域生长法、主动轮廓模型、基于边缘检测的方法。这些方法主要基于灰度、 纹理、边缘等信息,但是由于肝脏结构的变异、肝脏与其邻近脏器的相似性、 三维空间特征的复杂性和噪声的影响,使得自动化分割变得十分困难。
近年来,深度神经网络(Deep Neural Networks,DNN)方法在计算机视觉和 图像处理领域取得的快速发展。深度学习的方法尤其是卷积神经网络 (Convolution NeuralNetworks,CNN)在医学图像分割的领域取得了巨大的成就。 该方法通过对大量标注的样本进行学习,其突出的特征学习能力实现了图像精 确的自动分割。后来的全卷积神经网络(Fully Convolutional Networks,FCN)可以 对图像进行像素级的分类,从而解决了语义级别图像分割问题。以及最经典的 Unet和Vnet网络模型。两者都是一种类似U型的网络结构,使用skip- connection连接低层特征和高层特征。两者的不同点在于Unet是用于处理二维 数据,Vnet用于处理三维数据,Vnet中还加入了残差块。上述方法在肝脏分割 领域取得了一定的进展,但肝脏三维影像切片间的空间信息没有被充分利用, 高层特征和低层特征只是简单连接,融合不够充分。
发明内容
本发明为了克服现有技术的不足,提供了一种基于多尺度特征融合和网格 注意力机制的肝脏影像分割方法,采用如下技术方案实现:
一种基于多尺度特征融合和网格注意力机制的肝脏影像分割方法,包括如 下步骤:
S1、选取需要进行肝脏分割的医疗影像数据集,将其划分为训练集和测试 集;
S2、对选取的训练集中的三维肝脏影像进行预处理,初始化网络模型参数, 并将预处理后的图像输入网络模型中,所述网络模型包括编码器网络和解码器 网络;
S3、在编码器阶段,利用多尺度特征融合模块、卷积网络得到肝脏的特征 图;
S4、在解码器阶段,利用多尺度特征融合模块、网格注意力机制、注意力 引导连接模块、转置卷积和深度监督机制得到肝脏的分割图像。
进一步的,步骤S2中,对选取的训练集中的三维肝脏影像进行预处理具 体包括:
S21、对训练集中的CT图像窗口选择合适的窗口,将窗口的CT值设置为 预设区间;
S22、对训练集进行降采样和重采样,将图像数据的层间间距调整到1mm;
S23、找到肝脏区域的开始和结束切片,并在两个方向上各扩张20个切片;
S24、对获取的切片图像进行直方图均衡化;
S25、随机选择32个连续的切片作为网络模型的输入,输入图像尺寸为 1×32×256×256。
进一步的,步骤S2中,初始化网络模型参数具体包括:
S26、初始化网络模型参数,包括批处理大小、学习率、迭代次数、学习 率衰减策略、深度监督衰减系数;
S27、使用kaiming权重初始化方法初始化网络模型权重。
进一步的,步骤S3具体包括:
S31、在编码器网络的每一层中加入多尺度特征融合模块,
S32、通过最大池化操作下采样进行特征提取,得到肝脏的特征图;
其中,所述编码器网络包括四个下采样层,每个下采样层由一个多尺度特 征融合模块、两个卷积核大小为3×3×3的卷积、一个批量归一化以及一个 ReLU激活函数构成,每个卷积的过滤器数量为[32,64,128,256,512];每一层最 后接上一个步长为2的最大池化操作,最终得到肝脏的特征图。
进一步的,在多尺度特征融合模块中,输入的特征图经过一个卷积核大小 为1×1×1的三维卷积来调整通道数,将特征图按通道数均分为四个不同的特征 图,记为xi,i=1,2,3,4,每组特征通道数为输入特征图通道数的四分之一,特 征图的大小不变;除x1外,每个xi都进行一个卷积核大小为3×3×3的卷积操作, 接着进行批量归一化和ReLU激活得到四个不同尺度的特征xi';将四个不同尺 度的特征进行逐元素相加再经过卷积核大小为1×1×1的卷积操作得到h,然后 采用类似残差的思想将h与xi'各自进行逐元素相加得到四个特征xi”(x=1,2,3,4); 将四个不同尺度特征xi”进行concat操作,得到的特征图通道数与输入特征图通 道数一致;通过卷积核大小为1×1×1的卷积层得到最终输出的特征图。
进一步的,所述多尺度特征融合模块公式如下:
x″i=x′i+h,i=1,2,3,4
O=Conv1(Concat(x″1,x″2,x″3,x″4))
其中,Conv3表示卷积核大小为3×3×3的卷积操作,xi”(x=1,2,3,4)代表了 四个不同尺度的特征信息,Conv1表示卷积核大小为1×1×1的卷积操作,O为 多尺度特征融合模块的输出特征图。
进一步的,步骤S4中,所述解码器网络包括四个上采样层,每一层包含 一个步长为2的反卷积再接上两个卷积核大小为3×3×3的卷积、一个批量归 一化、一个ReLU激活函数和一个多尺度特征融合模块。
进一步的,步骤S4具体包括:
S41、基于在解码器网络每层最后通过多尺度特征融合模块得到的特征与 对应的编码器网络上一层卷积最后得到的特征,分别作为高层特征和低层特征 通过注意力引导连接模块得到注意力图;
S42、将每一层通过注意力引导连接模块得到的注意力图进行一系列的卷 积操作提取特征;其中,解码器网络中除了最底层,其他的每一层的结果都通 过不同尺度的上采样恢复图像尺寸得到一个输出,最终得到四个输出,前三个 输出会作为深度监督机制中的辅助损失,最后的输出作为输出的最终的掩码图;
S43、在网络模型迭代训练中的反向传播过程中,通过计算网络模型预测 的分割结果与标签值之间的差异来计算损失值,进而在损失值的基础上不断更 新迭代参数值,使网络模型预测的分割结果接近标签值,进而得到肝脏的分割 图像。
进一步的,在注意力引导连接模块中,分别有高层特征和低层特征输入, 首先将高层特征用转置卷积操作进行上采样,将两个特征分别输入到网格注意 力模块中得到注意力特征图,然后将生成的注意力特征图与低层特征进行逐元 素相乘,将得到的结果与高层特征转置卷积得到的特征图进行concat操作, 输出特征图;
在网格注意力机制中,分别输入高层特征和低层特征;首先,高层特征和 低层特征通过卷积核大小为1×1×1的三维卷积调整通道数,通过步长为2的三 维卷积操作来进行一次下采样,然后将其进行简单的相加操作;对相加融合得 到的特征进行ReLU激活非线性变换,通过Sigmoid激活函数生成注意力系数, 运用转置卷积对其进行上采样以匹配上层输入低层特征的维度,最后将其与低 层特征逐元素相乘得到最后的注意力图。
进一步的,所述网格注意力机制的公式如下:
所述注意力引导连接模块的公式如下:
本发明的有益技术效果如下:
本发明的方法首先利用多尺度特征融合模块和卷积块对三维肝脏影像进行 训练,扩大了神经网络的感受野和增强特征的表示能力,充分利用三维肝脏影 像中切片间和切片内的信息,得到更具有代表性特征信息的肝脏特征图;再利 用跳跃结构中的注意力引导连接模块和网格注意力机制,突出分割区域的特征, 抑制其他的噪音部分;利用深度监督机制降低训练和验证误差,减轻梯度消失、 梯度***和收敛速度过慢等问题,最终得到肝脏的分割图像。其中在编码器和 解码器的连接处多次使用多尺度特征融合模块、注意力引导连接模块、网格注 意力机制,获取了多尺度语义信息和重要的上下文信息。最后,利用形态学后 处理的方法对模型分割结果进行优化。
因此,本发明利用多尺度特征融合模块、注意力引导连接模块、网格注意 力机制和三维卷积神经网络训练及其融合,提取三维肝脏影像的语义信息并进 行分割,该方法具有提高三维肝脏影像分割效果的特点,实现了对三维肝脏影 像的较为精确的分割,为医生的医疗诊断提供了极大的辅助作用。
附图说明
图1是本发明实施例方法的流程示意图。
图2是本发明实施例中肝脏预处理前后对比图。
图3是本发明实施例中网络整体架构图。
图4是本发明实施例中多尺度特征融合模块的结构设计图。
图5是本发明实施例中注意力引导连接模块的结构设计图。
图6是本发明实施例中注意力机制的结构设计图。
图7是本发明的方法在测试集3Dircadb上分割结果可视化图。
具体实施方式
为了便于本领域人员更好的理解本发明,下面结合附图和具体实施例对本 发明做进一步详细说明,下述仅是示例性的不限定本发明的保护范围。
术语解释:
1、kaiming:表示神经网络的一种初始化方法。
2、ReLU:表示神经网络一种激活函数,将拟合曲线最后的结果转换到 [0,+∞)的区间上。
3、skip-connection:表示U型网络中间的跳跃连接部分。
4、concat:表示沿着通道维度连接两个张量。
5、Sigmoid:表示神经网络的一种激活函数,将拟合曲线最后的结果转换 到(0,1)区间。
本实施例公开了一种基于多尺度特征融合和网格注意力机制的三维肝脏影 像分割方法(简称MAGNet方法),以在LiTS(来自于 https://competitions.codalab.org/competitions/17094发布的医学肝脏公共数据集), 3Dircadb(来自于https://www.ircad.fr/research/3dircadb/发布的医学肝脏公共数 据集),Sliver07(来自于https://sliver07.grand-challenge.org/Download/发布的医 学肝脏公共数据集)为例子,其中LITS为三维肝脏影像,带有标签的有131 个序列,其中28-47序列为3Dircadb数据集,Sliver07数据集为三维肝脏影像 全为20个序列,像素都为512×512,本实施例以去除了3Dircadb数据集的 LITS数据集为训练集,以3Dircadb,Sliver07数据集为测试集。
如图1所示,本实施例所述的基于多尺度特征融合和网格注意力机制的三 维肝脏影像分割方法具体包括如下步骤:
步骤1)数据集划分;
选取需要进行肝脏分割的医疗影像数据集,将其划分为训练集和测试集;
步骤2)数据预处理,预处理前后肝脏的对比如图2(a)(处理前)和图2 (b)(处理后)所示;
2.1)对训练集中CT图像窗口选择合适的窗口,将窗口的CT值设置在[- 200,200]之间;
2.2)对训练集进行降采样和重采样,将图像数据的层间间距调整到1mm;
2.3)找到肝脏区域的开始和结束切片,并在两个方向上向外扩张20个切 片;
2.4)对训练集中的图像进行直方图均衡化;
2.5)随机选择32个连续的切片作为网络模型的输入,此时网络的输入尺 寸为1×32×256×256。
步骤3)在编码器阶段,利用多尺度特征融合模块、卷积网络得到肝脏的 特征图,整体网络结构如图3所示;
3.1)初始化网络参数,包括批处理大小、学习率、迭代次数、学习率衰减 策略、深度监督衰减系数;
3.2)使用kaiming权重初始化方法初始化网络权重;
3.3)将预处理后的三维图像输入到网络模型的卷积神经网络中。
3.4)在编码器阶段和解码器阶段的每一层中加入了多尺度特征融合模块, 在编码器阶段,通过最大池化操作下采样进行特征提取。在编码器路径中包含 四个下采样层,每个下采样层由一个多尺度特征融合模块、两个卷积核大小为 3×3×3的卷积、一个批量归一化以及一个ReLU激活函数构成。每一层最后接 上一个步长为2的最大池化操作,最终得到肝脏的特征图,整体网络结构如图 3所示。
其中每个卷积的过滤器数量为[32,64,128,256,512]。在多尺度特征融合模块中,输入的特征图经过一个卷积核大小为1×1×1的三维卷积来调整通道数,将 特征图按通道数均分为四个不同的特征图,记为xi,i=1,2,3,4。每组特征通道 数为输入特征图通道数的四分之一,特征图的大小不变。除x1外,每个xi都进 行一个卷积核大小为3×3×3的卷积操作,接着进行批量归一化和ReLU激活得 到四个不同尺度的特征xi'。将四个不同尺度的特征进行逐元素相加再经过卷积 核大小为1×1×1的卷积操作得到h,然后采用类似残差的思想将h与xi'各自进 行逐元素相加得到四个特征xi”(x=1,2,3,4)。将四个不同尺度特征xi”进行concat操 作,得到的特征图通道数与输入特征图通道数一致。通过卷积核大小为1×1×1 的卷积层得到最终输出的特征图,如图4所示。
步骤3.4)中,多尺度特征融合模块公式如下:
x″i=x′i+h,i=1,2,3,4 (3)
O=Conv1(Concat(x″1,x″2,x″3,x″4)) (4)
其中,Conv3表示卷积核大小为3×3×3的卷积操作。xi”(x=1,2,3,4)代表了 四个不同尺度的特征信息。Conv1表示卷积核大小为1×1×1的卷积操作。O为 多尺度特征融合模块的输出特征图。
步骤4)利用多尺度特征融合模块、网格注意力机制、注意力引导连接模块、 转置卷积和深度监督机制得到肝脏的分割图像;
4.1)在解码器阶段,有四个上采样层,每一层包含一个步长为2的反卷积 再接上两个卷积核大小为3×3×3的卷积块、一个批量归一化、一个ReLU激 活函数和一个多尺度特征融合模块。
4.2)利用在解码器阶段每层最后通过多尺度特征融合模块得到的特征与对 应的编码器上一层卷积最后得到的特征,分别作为高层信息和低层信息来通过 注意力引导连接模块得到注意力图,如图5所示。
4.3)在注意力引导连接模块中,分别有高层特征和低层特征输入,首先将 高层特征用转置卷积操作进行上采样,将两个特征分别输入到网格注意力模块 中得到注意力特征图,然后将生成的注意力特征图与低层特征进行逐元素相乘, 将得到的结果与高层特征转置卷积得到的特征图进行concat操作,输出特征图。 在网格注意力模块中,分别输入高层特征和低层特征。首先,高层特征和低层 特征通过卷积核大小为1×1×1的三维卷积调整通道数,通过步长为2的三维 卷积操作来进行一次下采样,然后将其进行简单的相加操作。对相加融合得到 的特征进行ReLU激活非线性变换,通过Sigmoid激活函数生成注意力系数, 运用转置卷积对其进行上采样以匹配上层输入低层特征的维度,最后将其与低 层特征逐元素相乘得到最后的特征图,如图6所示。
步骤4.3)网格注意力公式如下:
注意力引导连接模块公式如下:
4.4)将每一层通过注意力引导连接模块得到的特征图进行一系列的卷积操 作提取特征;其中,解码器中除了最底层,其他的每一层的结果都会经过不同 尺度的上采样恢复图像尺寸得到一个输出,最终会得到四个输出,前三个输出 会作为深度监督机制中的辅助损失,最后的输出作为最终的分割图;
4.5)在神经网络迭代训练中的反向传播过程中,通过计算网络预测的分割 结果与标签值之间的差异来计算损失值,进而在损失值的基础上不断更新迭代 参数值,使网络预测的分割结果接近标签值。
步骤4.4)、4.5)中计算损失采用TverskyLoss具体公式如下:
其中A和B分别表示预测值和标签值,α和β为超参数。通过调整α和β我 们可以控制假阳性和假阴性之间的平衡;
深度监督网络联合损失函数如下:
loss=(loss1+loss2+loss3)*ε+loss4 (8)
其中loss1-loss4为解码器每层输出结果上采样结果的损失函数,ε为深度 监督系数。
步骤5)对经过模型分割后得到的肝脏图像进行形态学后处理。
5.1)对肝脏分割区域进行最大连通域提取;
5.2)移除分割的细小区域,并进行内部的空洞填充。
采用本发明所述的基于多尺度特征融合和网格注意力机制的三维肝脏影像 分割方法(MAGNet)在3Dircadb测试集上分割可视化结果如图7所示,可以看 出本发明所述的MAGNet方法得到的分割结果已经十分接近标签结果。另外, 采用本发明所述的基于多尺度特征融合和网格注意力机制的三维肝脏影像分割 方法(MAGNet)在3Dircadb测试集分割结果与其他先进方法分割结果对比如下 表1(本发明方法(MAGNet)在3Dircadb数据集的分割结果与其他先进方法的分 割结果对比(mean±std))所示,采用本发明所述的基于多尺度特征融合和网格注 意力机制的三维肝脏影像分割方法(MAGNet)在Sliver07分割结果与其他先进方 法分割结果对比如下表2(本发明方法(MAGNet)在Sliver07的分割结果与其他先进方法分割结果对比(mean±std))所示。
表1
如表1所示,我们将本实施例所述方法MAGNet在3DIRCADb数据集上 预测的结果与其他先进的模型进行对比。MAGNet在DSC指标上的表现与 UNet、ResNet相比有了显著的提升,与其他先进的模型相比也有一定的提升。 例如,与在DSC指标上表现最好的模型U3-Net+DC相比提升了0.1个百分点。 在ASD和RMSD指标上,MAGNet与其他先进模型对比有了大幅的降低。在 RVD指标上也有一定的降低,在VOE指标上略高于U3-Net+DC模型。
表2
从表2中可以看出,本文提出的方法预测结果在DSC指标上达到了97.3%, 本文提出的方法与其他先进方法相比在DSC、VOE和RVD指标上效果都有一 定的提升,证明本实施例方法具有较好的优越性和泛化能力。
以上仅描述了本发明的基本原理和优选实施方式,本领域人员可以根据上 述描述做出许多变化和改进,这些变化和改进应该属于本发明的保护范围。
Claims (10)
1.一种基于多尺度特征融合和网格注意力机制的肝脏影像分割方法,其特征在于,包括如下步骤:
S1、选取需要进行肝脏分割的医疗影像数据集,将其划分为训练集和测试集;
S2、对选取的训练集中的三维肝脏影像进行预处理,初始化网络模型参数,并将预处理后的图像输入网络模型中,所述网络模型包括编码器网络和解码器网络;
S3、在编码器阶段,利用多尺度特征融合模块、卷积网络得到肝脏的特征图;
S4、在解码器阶段,利用多尺度特征融合模块、网格注意力机制、注意力引导连接模块、转置卷积和深度监督机制得到肝脏的分割图像。
2.根据权利要求1所述的基于多尺度特征融合和网格注意力机制的肝脏影像分割方法,其特征在于,步骤S2中,对选取的训练集中的三维肝脏影像进行预处理具体包括:
S21、对训练集中的CT图像窗口选择合适的窗口,将窗口的CT值设置为预设区间;
S22、对训练集进行降采样和重采样,将图像数据的层间间距调整到1mm;
S23、找到肝脏区域的开始和结束切片,并在两个方向上各扩张20个切片;
S24、对获取的切片图像进行直方图均衡化;
S25、随机选择32个连续的切片作为网络模型的输入,输入图像尺寸为1×32×256×256。
3.根据权利要求2所述的基于多尺度特征融合和网格注意力机制的肝脏影像分割方法,其特征在于,步骤S2中,初始化网络模型参数具体包括:
S26、初始化网络模型参数,包括批处理大小、学习率、迭代次数、学习率衰减策略、深度监督衰减系数;
S27、使用kaiming权重初始化方法初始化网络模型权重。
4.根据权利要求3所述的基于多尺度特征融合和网格注意力机制的肝脏影像分割方法,其特征在于,步骤S3具体包括:
S31、在编码器网络的每一层中加入多尺度特征融合模块,
S32、通过最大池化操作下采样进行特征提取,得到肝脏的特征图;
其中,所述编码器网络包括四个下采样层,每个下采样层由一个多尺度特征融合模块、两个卷积核大小为3×3×3的卷积、一个批量归一化以及一个ReLU激活函数构成,每个卷积的过滤器数量为[32,64,128,256,512];每一层最后接上一个步长为2的最大池化操作,最终得到肝脏的特征图。
5.根据权利要求4所述的基于多尺度特征融合和网格注意力机制的肝脏影像分割方法,其特征在于:在多尺度特征融合模块中,输入的特征图经过一个卷积核大小为1×1×1的三维卷积来调整通道数,将特征图按通道数均分为四个不同的特征图,记为xi,i=1,2,3,4,每组特征通道数为输入特征图通道数的四分之一,特征图的大小不变;除x1外,每个xi都进行一个卷积核大小为3×3×3的卷积操作,接着进行批量归一化和ReLU激活得到四个不同尺度的特征xi';将四个不同尺度的特征进行逐元素相加再经过卷积核大小为1×1×1的卷积操作得到h,然后采用类似残差的思想将h与xi'各自进行逐元素相加得到四个特征xi”(x=1,2,3,4);将四个不同尺度特征xi”进行concat操作,得到的特征图通道数与输入特征图通道数一致;通过卷积核大小为1×1×1的卷积层得到最终输出的特征图。
7.根据权利要求6所述的基于多尺度特征融合和网格注意力机制的三维肝脏影像分割方法,其特征在于,步骤S4中,所述解码器网络包括四个上采样层,每一层包含一个步长为2的反卷积再接上两个卷积核大小为3×3×3的卷积、一个批量归一化、一个ReLU激活函数和一个多尺度特征融合模块。
8.根据权利要求7所述的基于多尺度特征融合和网格注意力机制的肝脏影像分割方法,其特征在于,步骤S4具体包括:
S41、基于在解码器网络每层最后通过多尺度特征融合模块得到的特征与对应的编码器网络上一层卷积最后得到的特征,分别作为高层特征和低层特征通过注意力引导连接模块得到注意力图;
S42、将每一层通过注意力引导连接模块得到的注意力图进行一系列的卷积操作提取特征;其中,解码器网络中除了最底层,其他的每一层的结果都通过不同尺度的上采样恢复图像尺寸得到一个输出,最终得到四个输出,前三个输出会作为深度监督机制中的辅助损失,最后的输出作为输出的最终的掩码图;
S43、在网络模型迭代训练中的反向传播过程中,通过计算网络模型预测的分割结果与标签值之间的差异来计算损失值,进而在损失值的基础上不断更新迭代参数值,使网络模型预测的分割结果接近标签值,进而得到肝脏的分割图像。
9.根据权利要求8所述的基于多尺度特征融合和网格注意力机制的肝脏影像分割方法,其特征在于:
在注意力引导连接模块中,分别有高层特征和低层特征输入,首先将高层特征用转置卷积操作进行上采样,将两个特征分别输入到网格注意力模块中得到注意力特征图,然后将生成的注意力特征图与低层特征进行逐元素相乘,将得到的结果与高层特征转置卷积得到的特征图进行concat操作,输出特征图;
在网格注意力机制中,分别输入高层特征和低层特征;首先,高层特征和低层特征通过卷积核大小为1×1×1的三维卷积调整通道数,通过步长为2的三维卷积操作来进行一次下采样,然后将其进行简单的相加操作;对相加融合得到的特征进行ReLU激活非线性变换,通过Sigmoid激活函数生成注意力系数,运用转置卷积对其进行上采样以匹配上层输入低层特征的维度,最后将其与低层特征逐元素相乘得到最后的注意力图。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210666323.9A CN115170582A (zh) | 2022-06-13 | 2022-06-13 | 基于多尺度特征融合和网格注意力机制的肝脏影像分割方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210666323.9A CN115170582A (zh) | 2022-06-13 | 2022-06-13 | 基于多尺度特征融合和网格注意力机制的肝脏影像分割方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115170582A true CN115170582A (zh) | 2022-10-11 |
Family
ID=83485205
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210666323.9A Pending CN115170582A (zh) | 2022-06-13 | 2022-06-13 | 基于多尺度特征融合和网格注意力机制的肝脏影像分割方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115170582A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115345889A (zh) * | 2022-10-13 | 2022-11-15 | 西南科技大学 | 一种肝脏及其肿瘤图像的分割方法 |
CN116229065A (zh) * | 2023-02-14 | 2023-06-06 | 湖南大学 | 一种基于多分支融合的机器人手术器械分割方法 |
CN116258672A (zh) * | 2022-12-26 | 2023-06-13 | 浙江大学 | 医学图像分割方法、***、存储介质及电子设备 |
CN116563265A (zh) * | 2023-05-23 | 2023-08-08 | 山东省人工智能研究院 | 基于多尺度注意力和自适应特征融合的心脏mri分割方法 |
CN116843696A (zh) * | 2023-04-27 | 2023-10-03 | 山东省人工智能研究院 | 基于特征相似性和超参数卷积注意力的心脏mri分割方法 |
CN117422880A (zh) * | 2023-12-18 | 2024-01-19 | 齐鲁工业大学(山东省科学院) | 改进的注意力机制与cv模型相结合的分割方法及其*** |
CN117635942A (zh) * | 2023-12-05 | 2024-03-01 | 齐鲁工业大学(山东省科学院) | 一种基于边缘特征增强的心脏mri图像分割方法 |
CN117745745A (zh) * | 2024-02-18 | 2024-03-22 | 湖南大学 | 一种基于上下文融合感知的ct图像分割方法 |
-
2022
- 2022-06-13 CN CN202210666323.9A patent/CN115170582A/zh active Pending
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115345889B (zh) * | 2022-10-13 | 2023-01-03 | 西南科技大学 | 一种肝脏及其肿瘤图像的分割方法 |
CN115345889A (zh) * | 2022-10-13 | 2022-11-15 | 西南科技大学 | 一种肝脏及其肿瘤图像的分割方法 |
CN116258672A (zh) * | 2022-12-26 | 2023-06-13 | 浙江大学 | 医学图像分割方法、***、存储介质及电子设备 |
CN116258672B (zh) * | 2022-12-26 | 2023-11-17 | 浙江大学 | 医学图像分割方法、***、存储介质及电子设备 |
CN116229065A (zh) * | 2023-02-14 | 2023-06-06 | 湖南大学 | 一种基于多分支融合的机器人手术器械分割方法 |
CN116229065B (zh) * | 2023-02-14 | 2023-12-01 | 湖南大学 | 一种基于多分支融合的机器人手术器械分割方法 |
CN116843696B (zh) * | 2023-04-27 | 2024-04-09 | 山东省人工智能研究院 | 基于特征相似性和超参数卷积注意力的心脏mri分割方法 |
CN116843696A (zh) * | 2023-04-27 | 2023-10-03 | 山东省人工智能研究院 | 基于特征相似性和超参数卷积注意力的心脏mri分割方法 |
CN116563265A (zh) * | 2023-05-23 | 2023-08-08 | 山东省人工智能研究院 | 基于多尺度注意力和自适应特征融合的心脏mri分割方法 |
CN116563265B (zh) * | 2023-05-23 | 2024-03-01 | 山东省人工智能研究院 | 基于多尺度注意力和自适应特征融合的心脏mri分割方法 |
CN117635942A (zh) * | 2023-12-05 | 2024-03-01 | 齐鲁工业大学(山东省科学院) | 一种基于边缘特征增强的心脏mri图像分割方法 |
CN117635942B (zh) * | 2023-12-05 | 2024-05-07 | 齐鲁工业大学(山东省科学院) | 一种基于边缘特征增强的心脏mri图像分割方法 |
CN117422880A (zh) * | 2023-12-18 | 2024-01-19 | 齐鲁工业大学(山东省科学院) | 改进的注意力机制与cv模型相结合的分割方法及其*** |
CN117422880B (zh) * | 2023-12-18 | 2024-03-22 | 齐鲁工业大学(山东省科学院) | 改进的注意力机制与cv模型相结合的分割方法及其*** |
CN117745745A (zh) * | 2024-02-18 | 2024-03-22 | 湖南大学 | 一种基于上下文融合感知的ct图像分割方法 |
CN117745745B (zh) * | 2024-02-18 | 2024-05-10 | 湖南大学 | 一种基于上下文融合感知的ct图像分割方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115170582A (zh) | 基于多尺度特征融合和网格注意力机制的肝脏影像分割方法 | |
CN110889853B (zh) | 基于残差-注意力深度神经网络的肿瘤分割方法 | |
CN110889852B (zh) | 基于残差-注意力深度神经网络的肝脏分割方法 | |
CN109191476B (zh) | 基于U-net网络结构的生物医学图像自动分割新方法 | |
Kumar et al. | Breast cancer classification of image using convolutional neural network | |
CN111784671B (zh) | 基于多尺度深度学习的病理图像病灶区域检测方法 | |
CN112927255B (zh) | 一种基于上下文注意力策略的三维肝脏影像语义分割方法 | |
CN107016681B (zh) | 基于全卷积网络的脑部mri肿瘤分割方法 | |
CN111798462B (zh) | 一种基于ct图像的鼻咽癌放疗靶区自动勾画方法 | |
CN114581662B (zh) | 一种脑肿瘤图像的分割方法、***、装置及存储介质 | |
CN113808146B (zh) | 一种医学图像多器官分割方法及*** | |
CN110706214B (zh) | 融合条件随机与残差的三维U-Net大脑肿瘤分割方法 | |
CN111583285B (zh) | 一种基于边缘关注策略的肝脏影像语义分割方法 | |
CN111640120A (zh) | 一种基于显著性密集连接扩张卷积网络的胰腺ct自动分割方法 | |
Lameski et al. | Skin lesion segmentation with deep learning | |
CN114972362A (zh) | 一种基于RMAU-Net网络的医学图像自动分割方法与*** | |
Shan et al. | SCA-Net: A spatial and channel attention network for medical image segmentation | |
CN112750137A (zh) | 基于深度学习的肝脏肿瘤分割方法及*** | |
Tan et al. | Automatic prostate segmentation based on fusion between deep network and variational methods | |
Khattar et al. | Computer assisted diagnosis of skin cancer: a survey and future recommendations | |
Dong et al. | Supervised learning-based retinal vascular segmentation by m-unet full convolutional neural network | |
CN112990359B (zh) | 一种影像数据处理方法、装置、计算机及存储介质 | |
CN113436127A (zh) | 基于深度学习的自动化肝脏分段模型的构建方法、装置、计算机设备和存储介质 | |
CN112489062B (zh) | 基于边界及邻域引导的医学图像分割方法及*** | |
CN115661029A (zh) | 基于YOLOv5的肺结节检测与识别*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |