CN114119637B - 基于多尺度融合和拆分注意力的脑白质高信号分割方法 - Google Patents
基于多尺度融合和拆分注意力的脑白质高信号分割方法 Download PDFInfo
- Publication number
- CN114119637B CN114119637B CN202111429055.0A CN202111429055A CN114119637B CN 114119637 B CN114119637 B CN 114119637B CN 202111429055 A CN202111429055 A CN 202111429055A CN 114119637 B CN114119637 B CN 114119637B
- Authority
- CN
- China
- Prior art keywords
- attention
- white matter
- high signal
- matter high
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000011218 segmentation Effects 0.000 title claims abstract description 80
- 210000004885 white matter Anatomy 0.000 title claims abstract description 52
- 238000000034 method Methods 0.000 title claims abstract description 45
- 230000004927 fusion Effects 0.000 title claims abstract description 37
- 238000012549 training Methods 0.000 claims abstract description 59
- 238000012360 testing method Methods 0.000 claims abstract description 26
- JXSJBGJIGXNWCI-UHFFFAOYSA-N diethyl 2-[(dimethoxyphosphorothioyl)thio]succinate Chemical compound CCOC(=O)CC(SP(=S)(OC)OC)C(=O)OCC JXSJBGJIGXNWCI-UHFFFAOYSA-N 0.000 claims abstract description 16
- 238000007781 pre-processing Methods 0.000 claims abstract description 6
- 230000003902 lesion Effects 0.000 claims abstract description 5
- 230000006870 function Effects 0.000 claims description 29
- 238000011176 pooling Methods 0.000 claims description 27
- 238000000605 extraction Methods 0.000 claims description 18
- 238000012795 verification Methods 0.000 claims description 13
- 230000008569 process Effects 0.000 claims description 12
- 230000004913 activation Effects 0.000 claims description 7
- 239000013598 vector Substances 0.000 claims description 6
- 230000007246 mechanism Effects 0.000 claims description 5
- 239000011159 matrix material Substances 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 3
- 210000004556 brain Anatomy 0.000 abstract description 7
- 208000014644 Brain disease Diseases 0.000 abstract description 3
- 238000012545 processing Methods 0.000 abstract description 3
- 230000009286 beneficial effect Effects 0.000 abstract description 2
- 238000004195 computer-aided diagnosis Methods 0.000 abstract description 2
- 206010072731 White matter lesion Diseases 0.000 description 12
- 230000006872 improvement Effects 0.000 description 10
- 230000000694 effects Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000002595 magnetic resonance imaging Methods 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 230000003321 amplification Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 230000008030 elimination Effects 0.000 description 3
- 238000003379 elimination reaction Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- 238000011282 treatment Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 1
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 208000024827 Alzheimer disease Diseases 0.000 description 1
- 208000029812 Cerebral Small Vessel disease Diseases 0.000 description 1
- 206010012289 Dementia Diseases 0.000 description 1
- 208000034800 Leukoencephalopathies Diseases 0.000 description 1
- 238000005481 NMR spectroscopy Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000003759 clinical diagnosis Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000004770 neurodegeneration Effects 0.000 description 1
- 208000015122 neurodegenerative disease Diseases 0.000 description 1
- 208000023516 stroke disease Diseases 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/05—Detecting, measuring or recording for diagnosis by means of electric currents or magnetic fields; Measuring using microwaves or radio waves
- A61B5/055—Detecting, measuring or recording for diagnosis by means of electric currents or magnetic fields; Measuring using microwaves or radio waves involving electronic [EMR] or nuclear [NMR] magnetic resonance, e.g. magnetic resonance imaging
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/72—Signal processing specially adapted for physiological signals or for diagnostic purposes
- A61B5/7235—Details of waveform analysis
- A61B5/7264—Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
- A61B5/7267—Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems involving training the classification device
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30016—Brain
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Data Mining & Analysis (AREA)
- Medical Informatics (AREA)
- Pathology (AREA)
- Heart & Thoracic Surgery (AREA)
- Veterinary Medicine (AREA)
- General Engineering & Computer Science (AREA)
- Public Health (AREA)
- Animal Behavior & Ethology (AREA)
- Radiology & Medical Imaging (AREA)
- Surgery (AREA)
- Mathematical Physics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Quality & Reliability (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Evolutionary Biology (AREA)
- High Energy & Nuclear Physics (AREA)
- Fuzzy Systems (AREA)
- Physiology (AREA)
- Psychiatry (AREA)
- Signal Processing (AREA)
- Magnetic Resonance Imaging Apparatus (AREA)
- Image Processing (AREA)
Abstract
一种基于多尺度融合和拆分注意力的脑白质高信号分割方法,属于脑部磁共振图像处理技术领域。技术要点如下:获取脑白质高信号FLAIR图像数据集,并对数据集进行划分和预处理;对所述基于多尺度融合和拆分注意力的脑白质高信号分割模型进行构建和训练,当训练满足终止条件时得到脑白质高信号分割模型;将测试集中的每个图像输入到已经训练完成的基于多尺度融合和拆分注意力的脑白质高信号分割模型中进行测试。有益效果:所述的基于多尺度融合和拆分注意力的脑白质高信号分割方法能有效提高WMH分割准确率,特别是对细小病灶有很好的识别能力。本发明对其他医学影像的分割同样具有参考意义,对推进脑部疾病的计算机辅助诊断也具有积极意义。
Description
技术领域
本发明涉及脑部磁共振图像处理技术领域,尤其涉及一种采用了多尺度卷积和分散注意力的3D U-Net全卷积模型,用于解决脑白质高信号(White MatterHyperintensities,WMH)的自动分割问题。
背景技术
脑白质高信号(White Matter Hyperintensity,WMH)是指出现在核磁共振的T2加权图像和FLAIR图像上出现的高亮的局部区域,也称脑白质病变。WMH常见于患有神经退行性疾病(例如痴呆、阿尔茨海默氏症)、中风和脑小血管疾病患者的脑部磁共振图像(MRI)中,以及70岁以上的健康老年人的脑结构中。已有研究表明,WMH的大小、位置、数量和形状可以为探索脑部疾病的病因和发展以及评估治疗效果提供有价值的信息,因此,准确分割出MRI上的WMH区域并对其进行定量和定性分析在临床诊断上具有重要意义。
然而,依靠医生手动分割出WMH区域是十分耗时的,因为手动方式要在MRI影像上逐帧处理(每个大脑MRI影像通常包含数十甚至上百帧切片),如果每一帧都由医生手动分割会耗费医生大量的时间和精力。同时,由于手动分割依靠医生的主观判断,因此,难免会有人为疏漏,还会产生不同医生由于经验不同所致的诊断结果差异。如果能由机器取代医生对脑白质病变部位进行自动分割,则可以把医生从繁重的分割操作中解脱出来,并确保分割与诊断结果的客观性和准确性。因此,近年来研究者们提出了许多WMH自动分割方法,主要包括早期的基于传统机器学习的分割方法和当前基于深度学习的分割方法。由于深度学习方法能自主地学习出隐含于图像中的复杂的特征,因此在分割效果上优于传统方法。但现有的深度学习方法在解决WMH分割问题时多数是直接采用图像分割领域中的经典全卷积神经网络U-Net模型或对其进行简单改进,比如单纯增加跳跃连接,或在瓶颈层或所有层不加区分的使用注意力等,这些看似改进的方法由于缺少针对性,对分割效果的提升并不明显,因此分割的准确度不高,存在小病灶漏识,病灶边界分割不精准的问题。究其原因,是模型在设计时没有充分考虑WMH的特点,使得模型的特征提取能力不足,进而影响分割效果。
WMH具有形状多变、位置随机、信号不均的特点,如有的呈片状,有的呈点状;有的出现在脑室周围,有的出现在脑深部;有的具有明显的高亮度信号,有的在亮度上与周边组织相似,这些都给WMH的自动识别带来难度和挑战。因此,亟待研究一种能够针对WMH特点的、准确、有效的自动分割脑白质高信号(WMH)的技术,以解决目前WMH分割中小病灶漏识、边界分割不精准、分割准确度不高的问题。
发明内容
针对现有技术的不足,本发明提出一种基于多尺度融合和分散注意力的脑白质高信号全卷积分割方法,该方法通过增强模型的多尺度特征提取能力和对分割目标的关注能力提升WMH自动分割的准确率,能很好地分割出脑白质高信号区域,特别是能分割出许多细小的病灶。
技术方案如下:
一种基于多尺度融合和拆分注意力的脑白质高信号分割方法,步骤如下:
步骤一、获取脑白质高信号FLAIR图像数据集;
步骤二、对获取的脑白质高信号FLAIR图像数据集进行划分,分成训练集、验证集和测试集;
步骤三、对获取的脑白质高信号FLAIR图像数据集进行预处理;
步骤四、对所述基于多尺度融合和拆分注意力的脑白质高信号分割模型进行构建和训练;
S4.1、构建所述基于多尺度融合和拆分注意力的脑白质高信号分割模型;
所述基于多尺度融合和拆分注意力的脑白质高信号分割模型基于3D U-Net架构,包括编码部分和解码部分。其中,编码部分由三个具有同样结构的特征提取子模块及一个瓶颈层组成;每个特征提取子模块包括2个多尺度卷积模块、1个注意力模块和1个混合下采样模块;瓶颈层顺次包含1个多尺度卷积模块、1个注意力模块、1个多尺度卷积模块;解码部分由三个具有同样结构的解码子模块和1个像素分类层组成,每个解码子模块包括1个反卷积和2个带有残差连接的卷积。此外,模型中还包括三次跳跃连接,该连接将每个特征提取子模块中的注意力模块送与对等的解码子模块中的反卷积结果进行拼接。其中,拆分注意力体现在,在第1和第2编码层中的注意力模块使用空间注意力模块;在第2编码层和瓶颈层中的注意力模块使用通道注意力模块。
S4.2、将预处理后的训练集、验证集图像数据输入到构建好的模型中进行训练。训练基于损失函数计算误差。在训练过程中,将训练集图像输入模型进行多轮次的训练,并基于验证集对每一轮次的训练结果进行验证,当训练满足终止条件时,得到模型在该训练集下的最优权值参数,此时停止训练,得到训练好的分割模型。
步骤五、将测试集中的每个图像输入到已经训练完成的基于多尺度融合和拆分注意力的脑白质高信号分割模型中进行测试;
S5.1、将训练好的模型在测试集上进行测试与显示
S5.2、对测试结果进行评估
进一步的,在步骤三中,所述预处理包括:数据增强、统一图像大小和数据归一化。
进一步的,在步骤4.2中,所述训练过程的终止条件是:当验证集上的损失函数值在n个迭代周期内不再减小时停止训练;或达到迭代次数的上限。模型训练过程中还需要设置学习率、优化模式、迭代次数。
进一步的,在步骤4.1中,所述多尺度卷积模块包含3条卷积支路和1条残差支路。3条卷积支路分别采用16×n个1×1×1卷积、16×n个3×3×3卷积、连续两次16×n个3×3×3卷积,其中n为编码层(包含瓶颈层在内)的层次数,n∈{1,2,3,4}。3条卷积支路的输出结果经过逐体素叠加后与残差支路的输出再叠加,最后经过ReLU激活函数输出。
进一步的,在步骤4.1中,所述混合下采样模块中:
对输入的特征矩阵进行最大池化,同时进行卷积核大小为3×3×3,步长为2的卷积操作,然后将获得的两个特征矩阵拼接,再执行一个卷积核大小为1×1×1,步长为1的卷积操作来融合特征实现信息补偿;
用以下公式表示:
其中,Xin表示输入特征,Yout表示混合下采样模块的输出,C1×1×1表示卷积核大小为1×1×1,步长为1的卷积,C3×3×3表示卷积核大小为3×3×3,步长为2的卷积,Maxpool表示最大池化,表示拼接操作。
进一步的,在步骤4.1中,所述通道注意力模块中:
首先在空间维度上分别使用全局平均池化操作和全局最大池化操作对输入的特征图进行压缩,得到两个一维特征向量。然后将这两个一维特征向量分别输入到含有隐藏层的多层感知机网络中进行编码,并将编码后的结果使用体素级加和操作后经过Sigmoid激活操作输出,输出结果为一个通道权重的表示向量;
通道注意力的计算如下:
Mc(F)=σ{xMLP[(xAvgPool(F)]+xMLP[xMaxPool(F)]},
Mc(F)=σ{W1[W0(Fc,avg)]+W1[W0(Fc,max)]},
式中:F表示输入的特征图,σ表示Sigmoid函数;xAvgPool(·)表示平均池化函数;xMaxPool(·)表示最大池化函数;
Fc,avg和Fc,max分别表示经过平均池化和最大池化后的特征图;W1和W0表示MLP中的两层参数;
进一步的,在步骤4.1中,所述空间注意力模块中:
将输入的特征矩阵首先在通道维度上进行全局平均池化和全局最大池化后得到两个空间特征矩阵;将这两个空间特征矩阵拼接,拼接后的特征矩阵经过一个卷积核大小为7×7×7,步长为1的卷积操作后再经过sigmoid激活函数输出,生成空间注意力特征图;
空间注意力的计算如下:
Ms(F')=σ{f7×7×7[xAvgPool(F');xMaxPool(F')]},
Ms(F')=σ[f7×7×7(Fs,avg;Fs,max)],
式中:σ表示Sigmoid函数,F'表示输入的特征图,Fs,avg和Fs,max分别表示经过平均池化和最大池化后的特征图;f7×7×7表示7×7×7的卷积运算。
进一步的,在步骤4.2中,所述损失函数:
采用Tversky损失函数,可以表示为:
Lc=∑(1-Ic),
其中,
式中:c表示病灶类;gic∈{0,1}和pic∈{0,1}分别表示真实标签和预测结果;和分别表示真实标签和预测结果中的背景体素;/>gic表示分割结果中的假阴性;pic/>表示分割结果中的假阳性;N表示图像中的总体素数;ε表示一个可以自由选择的常数;α和β分别表示控制假阴性和假阳性的惩罚力权重,其中一个权重的增长就会增加与权重相关的错误类型的惩罚;将α设为0.7,β设为0.3。
作为本发明的一种改进,在步骤4.1中,所述多尺度融合包含多尺度卷积模块和混合下采样模块,使模型具有更多尺度的特征提取和融合能力。
作为本发明的一种改进,所述多尺度卷积模块包含的3条卷积支路分别具有1×1×1、3×3×3和5×5×5的感受野,这3条支路卷积后再叠加使得多尺度卷积模块具有三个不同尺度的特征提取和融合能力,以及计算量小的优点。
作为本发明的一种改进,在步骤4.1中,所述混合下采样模块包含两条下采样支路,一条采用采样步长为2的最大池化进行下采样,另一条采用步长为2,卷积核大小为3×3×3卷积操作对图像进行过滤,其效果等同采样步长为2的下采样,但可以保留采样步长范围内的细节特征,而最大池化保留的是采样步长范围内的最大特征;两条支路的输出通过步长为1,卷积核大小为1×1×1卷积操作融合后,使网络在下采样时保留粗、细两种不同尺度的信息,实现信息的相互补偿,避免下采样过程中的信息丢失。
作为本发明的一种改进,在步骤4.1中,所述拆分注意力是将原有注意力机制中的空间注意力和通道注意力拆分使用。原有注意力机制由于将空间注意力和通道注意力联合使用,其计算代价较高,且没有针对性地发挥两种注意力的优势。我们根据浅层特征偏向于空间信息、深层特征偏向于语义信息的特点,以及空间注意力偏向于空间关注、通道注意力偏向于语义关注,将两种注意力拆分使用,分别用于模型编码部分的不同阶段,使注意力更具有针对性,从而提高网络对目标的关注能力,且计算代价较低。
作为本发明的一种改进,在步骤4.1中,所述基于多尺度融合和拆分注意力的脑白质高信号分割模型的解码子模块中采用连续2个带有残差连接的卷积操作,以避免训练过程中的梯度消失和模型过拟合。
作为本发明的一种优选改进,在步骤4.2中,所述损失函数采用与以往多数方法不同的损失函数——Tversky损失函数,来优化模型训练,解决样本不平衡所致的假阴性过多问题以提升模型对病灶的敏感性。
相对于现有技术,本发明具有如下有益效果:
(1)本发明所述的基于多尺度融合和拆分注意力的脑白质高信号分割方法能有效提高WMH分割准确率,特别是对细小病灶有很好的识别和分割能力。本发明对其他医学影像的分割同样具有参考意义,对推进脑部疾病的计算机辅助诊断也具有积极意义。
(2)模型在编码阶段加入多尺度卷积模块以增加网络宽度,使模型具有多尺度特征提取能力,同时,在编码阶段加入混合下采样模块,使网络在下采样时保留粗、细两种不同尺度的信息,防止下采样带来的细节信息丢失,两个模块的同时使用使模型具有较强的多尺度特征提取能力,可显著提升细小病灶的识别。
(3)模型在编码阶段采用拆分注意力机制,不仅降低了计算代价,而且提高了网络对目标的关注能力,有助于提高WMH分割准确率。
(4)模型在解码阶段采用带有残差连接的卷积操作,可以避免训练过程中的梯度消失和模型过拟合。
(5)模型在训练过程中使用Tversky损失函数,有效解决了由于样本不平衡所致的分割结果假阴性过多的问题,提升了模型对病灶识别的敏感性。
附图说明
图1为本发明融合多尺度特征提取和分散注意力的脑白质高信号分割模型整体结构示意图;
图2为本发明多尺度卷积模块结构示意图;
图3为本发明空间注意力模块示意图;
图4为本发明通道注意力模块示意图;
图5为本发明混合下采样模块示意图;
图6为本发明脑白质高信号FLAIR图像;
图7为本发明图6对应的人工标注的分割标签(金标准);
图8为本发明图6对应的模型自动分割的结果。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图1-6和具体实施方式对本发明作进一步详细的说明。
本发明提供了一种基于多尺度卷积和分散注意力的脑白质高信号分割方法,该方法具体包括如下步骤:
步骤1、获取脑白质高信号FLAIR图像数据集;
具体的,所述脑白质高信号FLAIR图像数据集来自于MICCAI2017WMH分割挑战赛公开的数据集,该数据集包括60例脑白质高信号患者的脑部FLAIR图像数据和由专家标定的WMH区域的标签数据。该FLAIR图像数据是从三家医院不同扫描仪下采集得到,每家医院提供20例数据,共60例。获取到的脑白质高信号FLAIR图像数据已由提供方做过偏移场校正的预处理。FLARI图像的格式为nifti,标签图像的格式均为nifti。三家医院的数据大小分别为132×256×83、240×240×48、256×232×48。
步骤2、对获取到的数据集进行划分,分成训练集、验证集和测试集;
具体的,将60个样本按照8:1:1的比例分成训练集(包含48个样本)、验证集(包含6个样本)和测试集(包含6个样本)。
步骤3、对获取到的样本数据集进行预处理;
首先,将获取的FLAIR图像数据及标签数据的尺寸调整为统一的192×192×16;其次,取训练集中的48例样本进行数据扩增处理,扩增方式包括对每例样本分别进行水平翻转、4次不同角度旋转和3次仿射等变换处理,扩增后生成新样本336例;然后,对扩增后的384例训练样本集、测试集、验证集数据做归一化处理。
步骤4、对所述基于多尺度融合和拆分注意力的脑白质高信号分割模型进行构建和训练;
S4.1、构建如图1所示的基于多尺度融合和拆分注意力的脑白质高信号分割模型;
模型包括编码部分和解码部分。
编码部分由三个具有同样结构的特征提取子模块及一个瓶颈层组成。
第1编码层的特征提取子模块包含2个多尺度卷积模块如图2所示,其卷积通道数为16,1个空间注意力模块,如图3所示,其卷积通道数为16和1个混合下采样模块,其卷积通道数为16;
第2编码层的特征提取子模块包含2个多尺度卷积模块,如图2所示,其卷积通道数为32,1个空间注意力模块,如图3所示,其卷积通道数为32和1个混合下采样模块,其卷积通道数为32;
第3编码层的特征提取子模块包含2个多尺度卷积模块,如图2所示,其卷积通道数为64,1个通道注意力模块,如图4所示,其卷积通道数为64和1个混合下采样模块,其卷积通道数为64;
瓶颈层包含2个多尺度卷积模块,如图2所示,其卷积通道数为128,1个通道注意力模块,如图4所示,其卷积通道数为128;
解码部分由三个具有同样结构的解码子模块和1个像素分类层组成。
第1解码层包含1个通道数为64、卷积核大小为3×3×3的反卷积和2个带有残差连接的64通道的3×3×3卷积。其中,反卷积结果与第3编码层的通道注意力模块的输出进行拼接;
第2解码层包含1个通道数为32、卷积核大小为3×3×3的反卷积和2个带有残差连接的32通道的3×3×3卷积。其中,反卷积结果与第2编码层的通道注意力模块的输出进行拼接;
第3解码层包含1个通道数为16、卷积核大小为3×3×3的反卷积和2个带有残差连接的16通道的3×3×3卷积。其中,反卷积结果与第1编码层的通道注意力模块的输出进行拼接;2个带有残差连接的卷积的输出结果被传递给1个通道数为1的3×3×3卷积后经过softmax激活函数进行像素级分类,其输出即为最终的分割结果。
S4.2、将预处理后的训练集、验证集图像数据输入到构建好的模型中进行训练。
具体的,首先,进行训练前的模型超参数设置,包括定义损失函数为Tversky损失函数;设置学习率为0.0001;优化模式采用用Adam随机梯度下降优化器;设置迭代次数(训练轮次)epoch=400次。终止条件采用当验证集上的损失函数值在10个迭代周期内不再减小时停止训练。
其次,将预处理后的训练集、验证集图像数据输入到构建好的基于多尺度融合和拆分注意力的脑白质高信号分割模型中进行训练。在该训练过程中,将训练集图像输入模型进行多轮次的训练,并基于验证集对每一轮次的训练结果进行验证,当训练满足终止条件时,得到模型在该训练集下的最优权值参数,此时停止训练,得到训练好的分割模型,并保存模型参数。
步骤5、将测试集中的每个图像输入到已经训练完成的基于多尺度融合和拆分注意力的脑白质高信号分割模型中进行测试;
S5.1、将训练好的模型在测试集上进行测试与显示
得到测试集中每例样本的分割结果的二值图。图6是测试集中某一例FLAIR图像的轴向位切片图像;图7是其对应的人工标注的分割标签(金标准);图8是本发明所提模型的分割结果。从图7与图8的对比可以看出,本发明所述基于多尺度融合和拆分注意力的脑白质高信号分割方法能很好地将细小病灶分割出来,且整体分割效果与金标准接近。
S5.2、对测试结果进行评估
本实施例使用三项常用的评价指标对测试结果进行评估,分别是:DSC(DiceSimilarity Coefficient)、召回率(Recall)、精度(Precision)。召回率反映实际为脑白质病变的体素中被正确分割出的比例,用来衡量脑白质病灶分割的完整性。精度反映分割的体素中实际为脑白质病变的比例,用来衡量脑白质病灶分割的精确度。DSC是对病灶图像的整体分割性能的一种评估,其值反映分割结果与真实标签之间的相似度,DSC值越大,分割结果越接近于真实标签。具体公式可表示为:
式中:xTP表示真实标签为脑白质病变类且被分割为脑白质病变类的体素个数;xFP表示真实标签为非脑白质病变类但被分割为脑白质病变类的体素个数;xFN表示真实标签为脑白质病变类被分割为非脑白质病变类的体素个数。
按照上述公式,对本发明模型在测试集上得到的分割结果进行评估,计算得到recall=0.84;precision=0.77;DSC=0.79。
S5.3、与现有技术方法的对比
将本发明所提供的基于多尺度融合和拆分注意力的脑白质高信号3D U-Net分割方法与现有几种主流用于WMH分割的方法进行了对比,对比结果如表1所示。
表1
表1中所有方法使用的数据集均源自MICCAI2017 WMH分割竞赛的公开数据集。从表中可以看出,本发明所提供WMH分割方法相比其他方法各项评估指标最优。相比现有方法中各项指标的最优值,本发明提出的模型的精度提高3%,DSC提高1%,召回率提高1%。从表中可以明显看出,本发明提出的网络取得了优异的结果。
本发明针对提升小病灶区域的分割及WMH分割的精准率,在3DU-Net的模型基础上做了以下改进:
(1)利用多尺度卷积模块扩展3D U-Net模型的宽度,使模型具有多尺度的特征提取感受野,增强特征提取能力;
(2)使用混合下采样替代原有的最大池化,使网络在下采样时保留粗、细两种不同尺度的信息,防止下采样带来的细节信息丢失;
(3)在编码阶段采用拆分注意力机制,有针对性地发挥空间注意力和通道注意力各自的优势,提高网络对目标的关注能力;
(4)在解码阶段采用带有残差连接的卷积操作,避免训练过程中的梯度消失和模型过拟合。
(5)使用Tversky损失函数优化训练,控制假阴性和假阳性之间的平衡,提升模型对病灶区域的敏感性。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
Claims (9)
1.一种基于多尺度融合和拆分注意力的脑白质高信号分割方法,其特征在于,包括如下步骤:
步骤1、获取脑白质高信号FLAIR图像数据集;
步骤2、对获取的脑白质高信号FLAIR图像数据集进行划分,分成训练集、验证集和测试集;
步骤3、对获取的脑白质高信号FLAIR图像数据集进行预处理;
步骤4、对所述基于多尺度融合和拆分注意力的脑白质高信号分割模型进行构建和训练;
S4.1、构建所述基于多尺度融合和拆分注意力的脑白质高信号分割模型;
所述基于多尺度融合和拆分注意力的脑白质高信号分割模型基于3D U-Net架构,包括编码部分和解码部分;其中,编码部分由三个具有同样结构的特征提取子模块及一个瓶颈层组成;每个特征提取子模块包括2个多尺度卷积模块、1个注意力模块和1个混合下采样模块;瓶颈层顺次包含1个多尺度卷积模块、1个注意力模块、1个多尺度卷积模块;解码部分由三个具有同样结构的解码子模块和1个像素分类层组成,每个解码子模块包括1个反卷积和2个带有残差连接的卷积;所述模型中还包括三次跳跃连接,该连接将每个特征提取子模块中的注意力模块送与对等的解码子模块中的反卷积结果进行拼接;其中,拆分注意力体现在,在第1和第2编码层中的注意力模块使用空间注意力模块;在第2编码层和瓶颈层中的注意力模块使用通道注意力模块;
S4.2、将预处理后的训练集、验证集图像数据输入到构建好的模型中进行训练;训练基于损失函数计算误差;在训练过程中,将训练集图像输入模型进行多轮次的训练,并基于验证集对每一轮次的训练结果进行验证,当训练满足终止条件时,得到模型在该训练集下的最优权值参数,此时停止训练,得到训练分割模型;
步骤5、将测试集中的每个图像输入到已经训练完成的基于多尺度融合和拆分注意力的脑白质高信号分割模型中进行测试;
S5.1、将训练好的模型在测试集上进行测试与显示;
S5.2、对测试结果进行评估。
2.如权利要求1所述的基于多尺度融合和拆分注意力的脑白质高信号分割方法,其特征在于,在步骤3中,所述预处理包括:数据增强、统一图像大小和数据归一化。
3.如权利要求1所述的基于多尺度融合和拆分注意力的脑白质高信号分割方法,其特征在于,在步骤4.2中,所述训练过程的终止条件是:当验证集上的损失函数值在n个迭代周期内不再减小时停止训练;或当达到迭代次数的上限时停止训练;模型训练过程中设置学习率、优化模式、迭代次数。
4.如权利要求1所述的基于多尺度融合和拆分注意力的脑白质高信号分割方法,其特征在于,在步骤4.1中,所述多尺度卷积模块包含3条卷积支路和1条残差支路;3条卷积支路分别采用16×n个1×1×1卷积、16×n个3×3×3卷积、连续两次16×n个3×3×3卷积,其中n为编码层的层次数,n∈{1,2,3,4};3条卷积支路的输出结果经过逐体素叠加后与残差支路的输出再叠加,最后经过ReLU激活函数输出。
5.如权利要求1所述的基于多尺度融合和拆分注意力的脑白质高信号分割方法,其特征在于,在步骤4.1中,所述混合下采样模块中:
对输入的特征矩阵进行最大池化,同时进行卷积核大小为3×3×3,步长为2的卷积操作,然后将获得的两个特征矩阵拼接,再执行一个卷积核大小为1×1×1,步长为1的卷积操作来融合特征实现信息补偿;
用以下公式表示:
其中,Xin表示输入特征,Yout表示混合下采样模块的输出,C1×1×1表示卷积核大小为1×1×1,步长为1的卷积,C3×3×3表示卷积核大小为3×3×3,步长为2的卷积,Maxpool表示最大池化,表示拼接操作。
6.如权利要求1所述的基于多尺度融合和拆分注意力的脑白质高信号分割方法,其特征在于,在步骤4.1中,所述通道注意力模块中:
首先在空间维度上分别使用全局平均池化操作和全局最大池化操作对输入的特征图进行压缩,得到两个一维特征向量;然后将这两个一维特征向量分别输入到含有隐藏层的多层感知机网络中进行编码,并将编码后的结果使用体素级加和操作后经过Sigmoid激活操作输出,输出结果为一个通道权重的表示向量;
通道注意力的计算如下:
Mc(F)=σ{xMLP[(xAvgPool(F)]+xMLP[xMaxPool(F)]},
Mc(F)=σ{W1[W0(Fc,avg)]+W1[W0(Fc,max)]},
式中:F表示输入的特征图,σ表示Sigmoid函数;xAvgPool(·)表示平均池化函数;xMaxPool(·)表示最大池化函数;
Fc,avg和Fc,max分别表示经过平均池化和最大池化后的特征图;W1和W0表示MLP中的两层参数。
7.如权利要求1所述的基于多尺度融合和拆分注意力的脑白质高信号分割方法,其特征在于,在步骤4.1中,所述空间注意力模块中:
将输入的特征矩阵首先在通道维度上进行全局平均池化和全局最大池化后得到两个空间特征矩阵;将这两个空间特征矩阵拼接,拼接后的特征矩阵经过一个卷积核大小为7×7×7,步长为1的卷积操作后再经过sigmoid激活函数输出,生成空间注意力特征图;
空间注意力的计算如下:
Ms(F')=σ{f7×7×7[xAvgPool(F');xMaxPool(F')]},
Ms(F')=σ[f7×7×7(Fs,avg;Fs,max)],
式中:σ表示Sigmoid函数,F'表示输入的特征图,Fs,avg和Fs,max分别表示经过平均池化和最大池化后的特征图;f7×7×7表示7×7×7的卷积运算。
8.如权利要求1所述的基于多尺度融合和拆分注意力的脑白质高信号分割方法,其特征在于,在步骤4.2中,所述损失函数:
采用Tversky损失函数,可以表示为:
Lc=∑(1-Ic),
其中,
式中:c表示病灶类;gic∈{0,1}和pic∈{0,1}分别表示真实标签和预测结果;和/>分别表示真实标签和预测结果中的背景体素;/>表示分割结果中的假阴性;/>表示分割结果中的假阳性;N表示图像中的总体素数;ε表示一个可以自由选择的常数;α和β分别表示控制假阴性和假阳性的惩罚力权重,其中一个权重的增长就会增加与权重相关的错误类型的惩罚;将α设为0.7,β设为0.3。
9.如权利要求1所述的基于多尺度融合和拆分注意力的脑白质高信号分割方法,其特征在于,在步骤4.1中,所述多尺度融合包含多尺度卷积模块和混合下采样模块;所述拆分注意力是将原有注意力机制中的空间注意力和通道注意力拆分使用。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111429055.0A CN114119637B (zh) | 2021-11-29 | 2021-11-29 | 基于多尺度融合和拆分注意力的脑白质高信号分割方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111429055.0A CN114119637B (zh) | 2021-11-29 | 2021-11-29 | 基于多尺度融合和拆分注意力的脑白质高信号分割方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114119637A CN114119637A (zh) | 2022-03-01 |
CN114119637B true CN114119637B (zh) | 2024-05-31 |
Family
ID=80370826
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111429055.0A Active CN114119637B (zh) | 2021-11-29 | 2021-11-29 | 基于多尺度融合和拆分注意力的脑白质高信号分割方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114119637B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114898110B (zh) * | 2022-04-25 | 2023-05-09 | 四川大学 | 一种基于全分辨率表示网络的医学图像分割方法 |
CN115310486B (zh) * | 2022-08-09 | 2023-09-26 | 重庆大学 | 焊接质量智能检测方法 |
CN115115628B (zh) * | 2022-08-29 | 2022-11-22 | 山东第一医科大学附属省立医院(山东省立医院) | 一种基于三维精细化残差网络的腔隙性脑梗死识别*** |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111091130A (zh) * | 2019-12-13 | 2020-05-01 | 南京邮电大学 | 基于轻量级卷积神经网络的实时图像语义分割方法及*** |
CN112163449A (zh) * | 2020-08-21 | 2021-01-01 | 同济大学 | 一种轻量化的多分支特征跨层融合图像语义分割方法 |
CN112446890A (zh) * | 2020-10-14 | 2021-03-05 | 浙江工业大学 | 基于空洞卷积和多尺度融合的黑色素瘤分割方法 |
DE102019123756A1 (de) * | 2019-09-05 | 2021-03-11 | Connaught Electronics Ltd. | Neuronales Netzwerk zur Durchführung einer semantischen Segmentierung eines Eingabebildes |
CN113052856A (zh) * | 2021-03-12 | 2021-06-29 | 北京工业大学 | 一种基于多尺度特征多路注意力融合机制的海马体三维语义网络分割方法 |
-
2021
- 2021-11-29 CN CN202111429055.0A patent/CN114119637B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102019123756A1 (de) * | 2019-09-05 | 2021-03-11 | Connaught Electronics Ltd. | Neuronales Netzwerk zur Durchführung einer semantischen Segmentierung eines Eingabebildes |
CN111091130A (zh) * | 2019-12-13 | 2020-05-01 | 南京邮电大学 | 基于轻量级卷积神经网络的实时图像语义分割方法及*** |
CN112163449A (zh) * | 2020-08-21 | 2021-01-01 | 同济大学 | 一种轻量化的多分支特征跨层融合图像语义分割方法 |
CN112446890A (zh) * | 2020-10-14 | 2021-03-05 | 浙江工业大学 | 基于空洞卷积和多尺度融合的黑色素瘤分割方法 |
CN113052856A (zh) * | 2021-03-12 | 2021-06-29 | 北京工业大学 | 一种基于多尺度特征多路注意力融合机制的海马体三维语义网络分割方法 |
Non-Patent Citations (2)
Title |
---|
张展 ; 张宪琦 ; 左德承 ; 付国栋 ; .面向边缘计算的目标追踪应用部署策略研究.软件学报.(09),全文. * |
王吉军 ; 郝子宇 ; 李宏亮 ; .卷积神经网络训练访存优化.西安电子科技大学学报.(02),全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN114119637A (zh) | 2022-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109584254B (zh) | 一种基于深层全卷积神经网络的心脏左心室分割方法 | |
CN114119637B (zh) | 基于多尺度融合和拆分注意力的脑白质高信号分割方法 | |
CN109035263B (zh) | 基于卷积神经网络的脑肿瘤图像自动分割方法 | |
CN111784671B (zh) | 基于多尺度深度学习的病理图像病灶区域检测方法 | |
CN111488914B (zh) | 一种基于多任务学习的阿尔茨海默症分类及预测*** | |
CN112529839B (zh) | 一种核磁共振图像中颈动脉血管中心线的提取方法及*** | |
CN113393469A (zh) | 基于循环残差卷积神经网络的医学图像分割方法和装置 | |
CN103249358A (zh) | 医用图像处理装置 | |
CN112348785B (zh) | 一种癫痫病灶定位方法及*** | |
CN112884788B (zh) | 基于丰富上下文网络的视杯视盘分割方法及成像方法 | |
CN110619635B (zh) | 基于深度学习的肝细胞癌磁共振图像分割***和方法 | |
CN115205300A (zh) | 基于空洞卷积和语义融合的眼底血管图像分割方法与*** | |
CN113205524B (zh) | 基于U-Net的血管图像分割方法、装置和设备 | |
CN112465905A (zh) | 基于深度学习的磁共振成像数据的特征脑区定位方法 | |
CN112508884A (zh) | 一种癌变区域综合检测装置及方法 | |
CN113034507A (zh) | 基于ccta影像的冠状动脉三维分割方法 | |
CN113724203B (zh) | 应用于oct图像中目标特征分割的模型训练方法及装置 | |
CN112863650A (zh) | 一种基于卷积与长短期记忆神经网络的心肌病识别*** | |
CN116051545B (zh) | 一种双模态影像的脑龄预测方法 | |
CN112837276A (zh) | 一种基于级联深度神经网络模型的脑胶质瘤分割方法 | |
CN116309615A (zh) | 一种多模态mri脑肿瘤图像分割方法 | |
CN113160256B (zh) | 一种多任务生成对抗模型的mr影像胎盘分割方法 | |
CN113902738A (zh) | 一种心脏mri分割方法及*** | |
CN114581459A (zh) | 一种基于改进性3D U-Net模型的学前儿童肺部影像感兴趣区域分割方法 | |
CN114419309A (zh) | 一种基于大脑T1-w磁共振影像的高维特征自动提取方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |