CN115619706A - 一种基于深度学习的肺结节检测方法 - Google Patents
一种基于深度学习的肺结节检测方法 Download PDFInfo
- Publication number
- CN115619706A CN115619706A CN202210742157.6A CN202210742157A CN115619706A CN 115619706 A CN115619706 A CN 115619706A CN 202210742157 A CN202210742157 A CN 202210742157A CN 115619706 A CN115619706 A CN 115619706A
- Authority
- CN
- China
- Prior art keywords
- image
- lung
- dimensional
- layer
- deep learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 48
- 230000002685 pulmonary effect Effects 0.000 title claims abstract description 18
- 238000013135 deep learning Methods 0.000 title claims abstract description 16
- 210000004072 lung Anatomy 0.000 claims abstract description 80
- 238000000034 method Methods 0.000 claims abstract description 29
- 238000012549 training Methods 0.000 claims abstract description 15
- 239000011159 matrix material Substances 0.000 claims abstract description 14
- 230000011218 segmentation Effects 0.000 claims abstract description 14
- 238000012216 screening Methods 0.000 claims abstract description 13
- 206010056342 Pulmonary mass Diseases 0.000 claims description 31
- 230000008569 process Effects 0.000 claims description 17
- 238000012545 processing Methods 0.000 claims description 15
- 239000013598 vector Substances 0.000 claims description 13
- 230000008859 change Effects 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 7
- 238000010606 normalization Methods 0.000 claims description 6
- 230000009466 transformation Effects 0.000 claims description 3
- 230000006870 function Effects 0.000 abstract description 10
- 238000004364 calculation method Methods 0.000 description 10
- 238000009826 distribution Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 4
- 230000004927 fusion Effects 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 210000004204 blood vessel Anatomy 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 2
- 238000002591 computed tomography Methods 0.000 description 2
- 238000011478 gradient descent method Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 201000005202 lung cancer Diseases 0.000 description 2
- 208000020816 lung neoplasm Diseases 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- WURBVZBTWMNKQT-UHFFFAOYSA-N 1-(4-chlorophenoxy)-3,3-dimethyl-1-(1,2,4-triazol-1-yl)butan-2-one Chemical compound C1=NC=NN1C(C(=O)C(C)(C)C)OC1=CC=C(Cl)C=C1 WURBVZBTWMNKQT-UHFFFAOYSA-N 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000013170 computed tomography imaging Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000012905 input function Methods 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 210000003437 trachea Anatomy 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/13—Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/187—Segmentation; Edge detection involving region growing; involving region merging; involving connected component labelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10072—Tomographic images
- G06T2207/10081—Computed x-ray tomography [CT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20021—Dividing image into blocks, subimages or windows
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20112—Image segmentation details
- G06T2207/20132—Image cropping
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30061—Lung
- G06T2207/30064—Lung nodule
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- Quality & Reliability (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Radiology & Medical Imaging (AREA)
- Apparatus For Radiation Diagnosis (AREA)
- Image Analysis (AREA)
Abstract
本发明提出一种基于深度学习的肺结节检测方法,包括:A、对三维肺部CT图像进行实质分割;B、将肺实质图像分块之后序列化,最终得到稀疏化矩阵;C、提取稀疏矩阵的三视角信息用于假阳性筛除;D、搭建网络模型;E、使用训练好的网络模型进行肺结节的检测并输出检测结果。本发明结合三视图去假阳辅助模块,直接嵌入到端对端的框架中,利用稀疏化后的三维图像三视图自注意力信息帮助假阳性区域的筛除。一方面,解决了复杂的3D场景中学习注意力困难的问题。另一方面,将检测和假阳性区域筛除设计成一个可以端对端训练的模型,提高了检测速度和检测精度,降低了模型整体的复杂度,在训练模型时可以统一损失函数训练,提高了模型训练收敛的速度。
Description
技术领域
本发明属于医学图像处理技术领域,具体地涉及一种肺部结节检测方法。
背景技术
肺癌是世界死亡率较高的疾病之一。肺结节的检测对肺癌的预测有重大意义,但由于肺结节形态各异,和正常组织之间的差别并不明显,即便对于医生来说也需要详细地分辨才能得出具体的结论。随着人工智能技术的广泛应用,利用深度学习的方法检测肺部结节成为了一种快速检测手段,通过在数据集上对网络模型的训练,对肺结节实现自动检测识别,可以提高效率,帮助医生减轻负担。
肺结节检测是一个比较困难的三维物体检测问题,并且,有限的GPU内存也是三维物体检测面临的技术难题之一。同时,3D数据的标注通常比二维数据的标注困难的多,这会导致深度学习模型产生过拟合的问题。另外,肺部CT图像通常包含较多的外部无关组织,比如患者的躯干,以及肺部器官内部包含血管、气管等组织,这些都很容易被误识别为肺结节,造成假阳性较多的现象。因此在使用深度学习检测方法得出的预测结果中存在较多的假阳性结果,导致检测的准确率降低。
发明内容
本发明为解决现有肺部结节检测方法存在较多的假阳性结果,导致检测的准确率降低的问题,提出一种基于深度学习的肺结节检测方法,其采用如下技术方案予以实现:
一种基于深度学习的肺结节检测方法,包括:
步骤A、对三维肺部CT图像进行实质分割,去掉无关组织得到肺实质图像;
步骤B、将肺实质图像分块之后序列化,输入到快速3D ViT网络中进行提取特征,输出多尺度特征图;同时去掉三维肺部实质分块图像中梯度为0及灰度变化不大的像素区域(灰度值变化范围在0~255,本发明将灰度值变化在0~50的范围定义为灰度变化不大的像素区域),得到稀疏化矩阵;
步骤C、提取稀疏矩阵的三视角信息用于假阳性筛除;
步骤D、搭建网络模型并训练网络参数;
步骤E、使用训练好的网络模型进行肺结节的检测并输出检测结果。
进一步地,所述步骤B中,多尺度特征图的构建过程如下:利用快速3D ViT作为骨干网络输出的最后一层特征信息分别构建4种尺度的特征图,这4种尺度的特征图之间并没有连接路径,每一层都由骨干网络的最后一层输出直接构建,尺寸逐渐扩大为上一层的两倍,第二层的尺寸与骨干网络最后一层的输出一致。
进一步地,所述步骤B中序列化过程如下:将分割后的图像向量做线性变换,将三维图像投影到二维空间再展平到一维,并嵌入一维位置信息。
进一步地,所述步骤B中,稀疏化矩阵生成过程如下:
步骤B1、对三维肺部CT图像经行处理;
步骤B2、初始化水平集方程;
步骤B3、根据初始化的水平集方程计算前景和背景灰度均值,用前面计算的前景和背景均值对水平集每一个点进行调整;
步骤B4、更新水平集方程,并根据水平集方程画出初始轮廓。
进一步地,所述步骤A中分割方法如下:
步骤A1、将三维肺部CT图像中的无关区域进行裁剪,仅保留肺实质图像所在区域;
步骤A2、对裁剪后的图像进行二值化处理;
步骤A3、消除肺部的空孔洞,提取肺实质的最大连通区域,并对图像进行二值化反转处理获得肺实质的掩膜图像;
步骤A4、将掩膜图像与步骤A1获得的图象相乘,得到完整的肺实质图像。
进一步地,,所述步骤B中,3D ViT网络的编码层由归一化层、多头注意力层,再次归一化层,多层感知机层组成。
进一步地,所述步骤C中三视角为正视、俯视及侧视。
与现有技术相比,本发明的优点和积极效果在于:
1、考虑到三维图像的数据量比较庞大,本发明通过快速3D ViT网络结构提取特征图像信息生成多尺度特征图,只采用骨干网络最后一层的输出来分别构建四层不同尺度的特征图,如此,在计算过程中不改变每一层特征输出的尺寸,将语义特征集成到最后一层输出上,仅利用最后一层输出特征来构建多尺度特征图,输出速度大幅提高。
2、结合三视图去假阳辅助模块,直接嵌入到端对端的框架中,利用稀疏化后的三维图像三视图自注意力信息帮助假阳性区域的筛除。一方面,解决了复杂的3D场景中学习注意力困难的问题。另一方面,本发明采用的是在检测框架中嵌入包含可以用于假阳性筛除信息的模块,将检测和假阳性区域筛除设计成一个可以端对端训练的模型,提高了检测速度和检测精度,降低了模型整体的复杂度,在训练模型时可以统一损失函数训练,提高了模型训练收敛的速度。
附图说明
图1是本发明采用深度学习检测肺结节的方法示意性流程图;
图2是本发明肺实质分割步骤图;
图3是本发明采用深度学习检测肺结节的网络结构图;
图4是本发明水平集图像稀疏化处理过程
图5是本发明三视角自注意力算法过程
图6是本发明肺结节检测结果示例
图7是假阳性区域筛除前后对比,其中(a)图为没有嵌入假阳性模块的结果,灰色框内的为假阳性结节,(b)图为嵌入假阳性模块的结果。
具体实施方式
本发明提出了一种基于深度学习的肺结节检测方法。首先,将肺部CT图像进行肺部实质分割处理,去掉无关组织仅保留肺实质区域;然后将肺实质图像分块之后序列化,嵌入可学习的一维位置信息后输入到快速3D ViT中提取特征,输出多尺度特征图;同时去掉3D肺部实质分块图像中大部分梯度为0即灰度变化不大的地方,因为这些位置通常没有病变;去掉大部分背景后的三维图像变为稀疏化的矩阵。提取稀疏矩阵的三视角信息用于假阳性筛除;接着,训练网络参数并使用训练好的网络模型进行肺结节的检测;最终,输出预测结果,即候选区域所在位置坐标、半径以及是否为肺结节的概率。
为了便于理解本发明,下文结合附图图1实施例对本发明做进一步的描述,但本发明的保护范围不限于以下具体实施例。
一、参考图1,本发明的主要实施步骤如下:
第一步、基于统计的肺部CT图像实质分割。
肺部CT图像通常包含躯干、肺实质、肺气管、肺血管。肺实质在图像上是面积较大的低灰度连通区域,而其他无关结构区域的灰度值较高。肺部的无关组织也可能呈球形,造成对肺结节检测的干扰,本实施例对CT图像先进行肺实质分割处理。
肺部CT图像原始的数据集定义为:
CTSet={Si∈RH×W×C,i=1...N} (1)
其中,Si表示第i个CT图像样本(Sample),数据集中的每一个样本都是三维图像,H×W 为空间分辨率,C为通道数,即:CT切片数。R表示三维向量空间。每个样本Si都由多张切片组成,即:
S={slicej∈RH×W,j=1...C} (2)
CT扫描设备(Computed Tomography)的一致性,以及成像过程中医生对于每位患者检查姿势调整的统一指示,因此肺部CT成像的布局是规律的,肺部整***于图像中心位置,四周为其余无关组织。如图2所示,肺实质区域位于当前样本切片的中心位置,肺实质区域中心坐标变量(xc,yc)服从以下分布:
(xc,yc)服从的是二维高斯分布或者二维正态分布,五个参数,从左到右依次为xc的期望,yc的期望,xc的方差,yc的方差,xc和yc的相关系数)每张切片的中心坐标变量都服从同一分布,并且互相独立,即它们是独立同分布(Independently identicaldistribution)。同时,宽高变量W、H分别服从:
H~N(μ3,σ3)
W~N(μ4,σ4) (4)
它们之间同样是独立同分布。
基于以上,结合图2,肺实质分割的步骤如下:
(a)到(b):基于宽高变量W,H服从的分布,确定估计值w、h,将原始CT图像中的无关区域进行裁剪,仅保留肺实质所在区域。
(b)到(c):裁剪后的图像进行二值化处理。通过适当的阈值选取,使得整个图像呈现出明显的黑白效果,凸显出肺实质区域的轮廓。
(c)到(d):消除肺部的空孔洞,提取肺实质的最大连通区域,并对图像进行二值化反转处理获得肺实质的掩膜图像。
(d)到(e):将掩膜图像与图像(b)相乘,得到完整的肺实质图像。
预处理算法如下:
<1>输入完整的原始肺部CT图像a,a=image(original)
original指的是原始的肺部CT图像,image()为输入函数,a是检测模型的输入
<2>根据肺实质区域与其他无关区域灰度值的差异对图像a进行裁剪,仅保留肺实质所在区域,得到图像b,b=crop(a,(h,w))
crop()是裁剪函数,a是输入的图像,h,w分别是裁剪之后图像的高,宽尺寸,b是裁剪之后得到的图像
<3>选取合适的阈值T,对图像b进行二值化处理。b中灰度值大于等于T的像素划分为前景,标记为黑色;灰度值小于T的像素为背景,标记为白色。得到图像c,c=binarize(b,T)。
binarize()是二值化函数,T为二值化的灰度阈值,c是b二值化之后得到的图像
<4>在图像(c)中,依旧包含很多孔洞。通过连通计算将像素点个数最大的连通区域标记,提取最大连通区域,消除孔洞。然后对二值化图像取反,得到肺实质的掩膜(d),d=maxfill(c)。
maxfill()代表提取最大连通区域的过程,抽象为函数,d是消除孔洞之后的图像
<5>肺实质掩膜(d)与图像(b)相乘输出分割后的肺实质图像(e),e=multiply(d,b)。
<6>算法结束。
第二步、肺实质图像分块处理。
考虑到Transformer结构不能直接处理三维图像,在训练过程中对内存的要求很高。本实施例对输入的图像进行分块处理,具体如下:
经过实质分割得到的肺实质图像数据集定义为:
SCTSet={Segi∈Rh×w×C,i=1...N} (5)
图像分块的尺寸大小为p×p×c,即分割后得到的patches的尺寸为p×p×c。
肺实质图像的尺寸为Seg∈Rh×w×C,将其分成p×p×c的patches,所以实际上会有N个 patches,其中:
分割后得到的全部patches的维度为N×p×p×c。然后将三维的patches展平,即:
接下来需要将得到的patches进行一个线性嵌入:即高维转换为低维的过程。对每一个 patch向量做一个线性变换,即全连接层,降维后的维度为D。
XP=linear-embedding(P,(p2×c,D)) (8)
其中XP∈RN×D。
为了保证输入图像patches之间的空间位置信息,还需要对图像块嵌入中添加一个位置编码向量,
得到的Z∈RN×D就是要下一步要输入到网络模型中的向量序列。
第三步、搭建网络模型。
网络模型主要由特征提取,稀疏化算法,自注意力模块,卷积网络部分组成。
特征提取的骨干网络为快速3D ViT网络。将预处理的特征Z∈RN×D输入到编码层中进行处理,每一个编码层主要由归一化(Norm)、多头注意力(Multi-Head Attention),再次归一化(Norm),多层感知机(MLP)四个计算工序组成。在特征提取过程中,依次叠加L层这样的编码结构。特征提取的过程表示为:
Zl=Encoder(Zl-1),l=1,2,3...L (10)
最后ZL输出的特征将其定义为F1且F1∈RN×D,由特征F1来创建特征金字塔。
如图3中,为了更加全面的检测所有疑似结节区域,通过卷积或者反卷积的方式对特征 F1进行解码,获得多尺度信息,生成四种不同尺度的特征输出,用于候选检测,确保能检测到各种尺寸不一的结节。
F1分别生成L1,L2,L3,L4四层特征图,每一层都由F1生成,层与层之间没有连接的路径,减少了生成特征图时的计算量。从L1到L4的尺寸依次减少为上一层的一半且这四个尺度的特征输出是平行的,且彼此之间不存在自上而下或者自下而上的相连的路径。
对上一步得到的P(肺实质图像分块后得到的patches)同时进行水平集算法处理得到包含肺结节或者其他孔洞组织的稀疏矩阵。对于肺结节检测而言,肺实质图像包含的背景区域较多,给肺结节的检测带来较大干扰,本发明通过水平集算法将图像稀疏化处理。在整个三维切片内部将所有疑似肺结节区域划分出来,原先的P就变为一个稀疏矩阵。
为了得到更多的特征信息对假阳性区域进行筛除,将P的三种视图(正视图、侧视图、俯视图)分别输入网络,从多个视角进行联合学习肺结节的特征。
本发明利用三视图进行自注意力计算构建了用以假阳性区域筛除的模块,可对假阳性区域进行充分的判别。如图5所示,A,S,C分别代表三维图像的俯视图,侧视图,正视图,分别通过3×3的卷积,得到Q,K,V。为了得到Q,K之间的相关性联系,将二者展平之后做乘积并进行softmax函数的计算,得到注意力分数,然后将注意力分数乘到展平之后的输出上,得到输出特征F2。
如图5所示,三个视角的信息分别输入到自注意力机制模块中,以正视角的特征信息为主,俯视图和侧视图的特征信息为辅计算注意力分数,输出特征F2,然后融合到多尺度特征图中。
特征F2和F1输出的多尺度特征L1~L4进行concat融合。
根据L1~L4输出特征的尺寸,需要将特征F2的尺寸进行调整,使得F2的尺寸能够分别于L1~L4融合。这里使用卷积运算来调整F2的尺寸:
融合之后得到新的特征,这里的特征既包含了经过编码层提取的特征,又利用了三个视角之间的特征对下一步的检测进一步的选择。
本发明采用的是在检测框架中嵌入包含可以用于假阳性筛除信息的模块,将检测和假阳性区域筛除设计成一个可以端对端训练的模型,极大提高了检测速度和检测精度,降低了模型整体的复杂度,在训练模型时可以统一损失函数训练,提高了模型训练收敛的速度。)
随后经过两层卷积网络运算之后,输出四维的tensor,为预测的proposals,最后两个维度分别对应于锚框和回归量,五个回归值分别为(x,y,z,r,p)。(x,y,z)分别代表坐标位置, r为该结节的半径,p为该区域是结节的概率。
将L1~L4分别输入到两层卷积组成的网络,然后连接全连接层,最终用softmax函数输出结果:
fi=ConvNet(Li) (13)
Vi=FC(fi),i=1,2,3,4 (14)
Vi是全连接层后的输出。
网络训练算法如下:
<1>首先获取肺部CT图像公开数据集,选择其中的训练集作为训练模型的样本数据。
<2>将所有样本进行肺实质分割,获取要输入到模型中的样本。
<3>图像分割,得到的图像patches序列化输入到模型,并在初始化位置嵌入一个可学习的向量PE。
<4>图像序列化向量以及位置向量的结合输入到模型中,通过特征提取以及解码过程,输出肺结节的候选结果,即疑似肺结节区域的坐标、肺结节半径以及是否为肺结节的概率。
#循环,1~若干次
根据<3>中的样本序列向量和位置向量PE,输入到网络中,使用随机梯度下降法计算判别网络参数:
X是预测结果,对应预测出的mask,Y是Ground truth
使用随机梯度下降法计算生成网络参数:
#循环结束
<5>算法结束。
第四步、构建多尺度特征图。
由于三维图像的计算量较为庞大,因此在构建特征图时,尽可能采取简单的策略。针对不同尺寸的肺结节,建立多种尺度的特征图。
生成过程的具体算法如下:
L1=conv1(F1,C1) (15)
L2=conv2(F1,C2) (16)
L3=deconv3(F1,C3) (17)
L4=deconv4(F1,C4) (18)
这四个尺度的特征输出是平行的,且彼此之间不存在自上而下或者自下而上的相连的路径。本发明特征图彼此之间没有连接或者融合计算,所以速度较快。在多尺度特征图上进行肺结节的检测,能够更多地检测出各种尺寸的肺结节,提高检测精度。
第五步、肺实质图像稀疏化。
由于三维图像包含内容较多,模型在计算时会受到很多背景信息或者无关信息的干扰,而且在肺部CT图像中,肺部的血管,孔洞容易给结节的检测带来干扰。本发明在上一步得到的P(肺实质图像分块后得到的patches)同时进行水平集算法处理得到包含肺结节或者其他孔洞组织的稀疏矩阵。肺结节或者其他内部组织,通过二值化图像确定它们在每一张肺实质切片图像内的轮廓如图4(b)、(c)所示,也就是一条二维平面内的闭合曲线。多个切片组合之后的曲线轮廓就构成了肺结节或者其他内部组织的表面曲线。这样可以在整个三维切片内部将所有疑似肺结节区域划分出来,原先的P就变成了一个稀疏矩阵。
具体算法如下:
<1>读入任意一张肺部CT图像原图切片,图像灰度化,归一化,将它转化为可处理的数组类型;
<2>初始化水平集方程IniLSF;
<3>根据水平集方程,画出初始轮廓,即利用contour函数绘制等高线LSF=0的轮廓线;
<4>定义CV(Chan-Vese)函数:CV(LSF,img,mu,nu,epison,step)
其中的参数有惩罚项系数mu,长度约束系数nu,规则化参数epison,步长step,LSF是水平集等高线,img是待处理的图像
<5>#循环,迭代次数:iterNum
①根据初始化的水平集计算(估算)前景和背景灰度均值;
②利用前面估算的前景和背景均值对水平集每一个点进行调整(演化),根据定义前景>0, 背景<0,如果当前点的灰度值接近前景估值,那么该点水平集的值相应的就要增加,反之则减小;
③更新水平集方程
#循环结束;
<7>算法结束。
本发明通过肺实质图像排除肺实质图像多余的干扰,方便接下来三视图自注意力机制的运算,同时简化卷积并节省乘积计算时的计算量。
第六步、三视图自注意力机制计算
将P的三种视图(正视图、侧视图、俯视图)分别输入网络,从多个视角进行联合学习。如图5所示,C(coronal)、A(axial)、S(sagittal)分别代表P的三个视角:正视图、俯视图、侧视图,它们的维度都为p×p×c。运用3x3的卷积操作,将三个视角的特征投影到Query,Key以及Value的维度:
Query=conv(A)
Key=conv(S)
Value=conv(C) (19)
下一步,将Q,K,V分别展平到二维空间,即:
根据self-attention公式,计算注意力权重W:
其中,W∈[0,1]n×m。
最终输出的特征为自注意力的权重W与V的乘积,即:
Fsa=W×V (22)
然后将输出的Fsa输入到前馈神经网络中来得到最后的特征输出F2∈Rn×D。
第七步、使用训练好的网络模型进行肺结节的检测,输出预测结果
图7为肺部CT图像的单张切片的去假阳前后的检测结果对比,a图为没有去假阳的检测结果,白色框内是准确的检测结果,灰色框内是误判的假阳性区域,b图为加入去假阳模块之后的结果,可以看出假阳性区域被筛除掉。
本发明采用快速3D ViT网络结构提取特征图像信息,使用单尺度的输出依次构造多尺度特征图,解决了三维图像的数据量庞大的问题;3D肺实质图像包含大量背景点,只有小部分是有助于检测结果的重要信息。在结合多视角注意力的训练过程中,大量的背景点会给注意力模块带来意想不到的噪音。将分块后的图像稀疏化处理,即去掉大部分背景区域,可以凸显出肺结节所在的区域。使用自注意力机制提取肺实质图像的三视角信息用于假阳性区域的筛除。
以上所述,仅是本发明的较佳实施例而已,并非是对本发明作其它形式的限制,任何熟悉本专业的技术人员可能利用上述揭示的技术内容加以变更或改型为等同变化的等效实施例应用于其它领域,但是凡是未脱离本发明技术方案内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与改型,仍属于本发明技术方案的保护范围。
Claims (7)
1.一种基于深度学习的肺结节检测方法,其特征在于包括:
步骤A、对三维肺部CT图像进行实质分割,去掉无关组织得到肺实质图像;
步骤B、将肺实质图像分块之后序列化,输入到快速3D ViT网络中进行提取特征,输出多尺度特征图;同时去掉三维肺部实质分块图像中梯度为0及灰度变化不大的像素区域,得到稀疏化矩阵;
步骤C、提取稀疏矩阵的三视角信息用于假阳性筛除;
步骤D、搭建网络模型并训练网络参数;
步骤E、使用训练好的网络模型进行肺结节的检测并输出检测结果。
2.根据权利要求1所述的基于深度学习的肺结节检测方法,其特征在于,所述步骤B中,多尺度特征图的构建过程如下:利用快速3D ViT作为骨干网络输出的最后一层特征信息分别构建4种尺度的特征图,这4种尺度的特征图之间并没有连接路径,每一层都由骨干网络的最后一层输出直接构建,尺寸逐渐扩大为上一层的两倍,第二层的尺寸与骨干网络最后一层的输出一致。
3.根据权利要求1所述的基于深度学***到一维,并嵌入一维位置信息。
4.根据权利要求1所述的基于深度的图像向量做线性变换,将三维图像投影到二维空间再展平到一维,并嵌入一维位置信息。学习的肺结节检测方法,其特征在于,所述步骤B中,稀疏化矩阵生成过程如下:
步骤B1、对三维肺部CT图像经行处理;
步骤B2、初始化水平集方程;
步骤B3、根据初始化的水平集方程计算前景和背景灰度均值,用前面计算的前景和背景均值对水平集每一个点进行调整;
步骤B4、更新水平集方程,并根据水平集方程画出初始轮廓。
5.根据权利要求1所述的基于深度学习的肺结节检测方法,其特征在于,所述步骤A中分割方法如下:
步骤A1、将三维肺部CT图像中的无关区域进行裁剪,仅保留肺实质图像所在区域;
步骤A2、对裁剪后的图像进行二值化处理;
步骤A3、消除肺部的空孔洞,提取肺实质的最大连通区域,并对图像进行二值化反转处理获得肺实质的掩膜图像;
步骤A4、将掩膜图像与步骤A1获得的图象相乘,得到完整的肺实质图像。
6.根据权利要求1所述的基于深度学习的肺结节检测方法,其特征在于,所述步骤B中,3D ViT网络的编码层由归一化层、多头注意力层,再次归一化层,多层感知机层组成。
7.根据权利要求1所述的基于深度学习的肺结节检测方法,其特征在于,所述步骤C中三视角为正视、俯视及侧视。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210742157.6A CN115619706A (zh) | 2022-06-27 | 2022-06-27 | 一种基于深度学习的肺结节检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210742157.6A CN115619706A (zh) | 2022-06-27 | 2022-06-27 | 一种基于深度学习的肺结节检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115619706A true CN115619706A (zh) | 2023-01-17 |
Family
ID=84856529
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210742157.6A Pending CN115619706A (zh) | 2022-06-27 | 2022-06-27 | 一种基于深度学习的肺结节检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115619706A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116012388A (zh) * | 2023-03-28 | 2023-04-25 | 中南大学 | 急性缺血性脑卒中三维医学影像分割方法及成像方法 |
-
2022
- 2022-06-27 CN CN202210742157.6A patent/CN115619706A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116012388A (zh) * | 2023-03-28 | 2023-04-25 | 中南大学 | 急性缺血性脑卒中三维医学影像分割方法及成像方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Maulik | Medical image segmentation using genetic algorithms | |
CN112150428A (zh) | 一种基于深度学习的医学图像分割方法 | |
US20230005140A1 (en) | Automated detection of tumors based on image processing | |
CN109492547B (zh) | 一种结节识别方法、装置和存储介质 | |
JP2017016593A (ja) | 画像処理装置、画像処理方法、及びプログラム | |
WO2005101314A2 (en) | Method and apparatus for processing images in a bowel subtraction system | |
CN110648331B (zh) | 用于医学图像分割的检测方法、医学图像分割方法及装置 | |
CN113012173A (zh) | 基于心脏mri的心脏分割模型和病理分类模型训练、心脏分割、病理分类方法及装置 | |
CN112085714A (zh) | 一种肺结节检测方法、模型训练方法、装置、设备及介质 | |
CN110992377A (zh) | 图像分割方法、装置、计算机可读存储介质和设备 | |
CN112598613A (zh) | 一种用于肺癌智能诊断的基于深度图像分割和识别的测定方法 | |
Zhang et al. | Joint vessel segmentation and deformable registration on multi-modal retinal images based on style transfer | |
CN114266786A (zh) | 基于生成对抗网络的胃病变分割方法及*** | |
CN115731178A (zh) | 一种跨模态的无监督域自适应医学图像分割方法 | |
CN111260639A (zh) | 多视角信息协作的乳腺良恶性肿瘤分类方法 | |
CN112700461A (zh) | 一种肺结节检测和表征类别识别的*** | |
CN114882051A (zh) | 一种基于多模态影像的盆腔骨肿瘤的自动分割及三维重建方法 | |
Sammouda | Segmentation and analysis of CT chest images for early lung cancer detection | |
Liu et al. | Accurate and robust pulmonary nodule detection by 3D feature pyramid network with self-supervised feature learning | |
CN115619706A (zh) | 一种基于深度学习的肺结节检测方法 | |
CN114445328A (zh) | 基于改进Faster R-CNN的医学影像脑肿瘤检测方法与*** | |
Zhao et al. | Accurate segmentation of heart volume in CTA with landmark-based registration and fully convolutional network | |
CN115115662A (zh) | 一种基于知识与数据融合驱动的多模态医学影像目标分割方法 | |
Karmakar et al. | Review of fuzzy image segmentation techniques | |
Kobayashi et al. | Learning global and local features of normal brain anatomy for unsupervised abnormality detection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |