CN114972266A - 基于自注意机制和稳定学习的淋巴瘤超声图像语义分割方法 - Google Patents
基于自注意机制和稳定学习的淋巴瘤超声图像语义分割方法 Download PDFInfo
- Publication number
- CN114972266A CN114972266A CN202210604099.0A CN202210604099A CN114972266A CN 114972266 A CN114972266 A CN 114972266A CN 202210604099 A CN202210604099 A CN 202210604099A CN 114972266 A CN114972266 A CN 114972266A
- Authority
- CN
- China
- Prior art keywords
- image
- module
- lymphoma
- self
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 206010025323 Lymphomas Diseases 0.000 title claims abstract description 49
- 230000011218 segmentation Effects 0.000 title claims abstract description 38
- 230000007246 mechanism Effects 0.000 title claims abstract description 29
- 238000000034 method Methods 0.000 title claims abstract description 27
- 238000007781 pre-processing Methods 0.000 claims abstract description 15
- 238000012549 training Methods 0.000 claims abstract description 13
- 238000005070 sampling Methods 0.000 claims abstract description 7
- 230000007613 environmental effect Effects 0.000 claims abstract description 4
- 230000003993 interaction Effects 0.000 claims abstract description 4
- 238000002604 ultrasonography Methods 0.000 claims description 15
- 238000003709 image segmentation Methods 0.000 claims description 12
- 238000000605 extraction Methods 0.000 claims description 10
- 239000013598 vector Substances 0.000 claims description 9
- 238000013507 mapping Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 8
- 238000013135 deep learning Methods 0.000 claims description 4
- 238000012545 processing Methods 0.000 claims description 4
- 238000012937 correction Methods 0.000 claims description 3
- 230000007423 decrease Effects 0.000 claims description 3
- 238000009826 distribution Methods 0.000 claims description 3
- 238000002372 labelling Methods 0.000 claims description 3
- 230000000873 masking effect Effects 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 3
- 238000009827 uniform distribution Methods 0.000 claims description 3
- 239000012634 fragment Substances 0.000 claims 1
- 230000015556 catabolic process Effects 0.000 abstract 1
- 238000006731 degradation reaction Methods 0.000 abstract 1
- 239000000523 sample Substances 0.000 description 29
- 238000010586 diagram Methods 0.000 description 12
- 238000013528 artificial neural network Methods 0.000 description 8
- 238000003384 imaging method Methods 0.000 description 8
- 238000003745 diagnosis Methods 0.000 description 5
- 238000002591 computed tomography Methods 0.000 description 4
- 238000007689 inspection Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000003902 lesion Effects 0.000 description 2
- 210000001165 lymph node Anatomy 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 208000017604 Hodgkin disease Diseases 0.000 description 1
- 208000021519 Hodgkin lymphoma Diseases 0.000 description 1
- 208000010747 Hodgkins lymphoma Diseases 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 208000015914 Non-Hodgkin lymphomas Diseases 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000010009 beating Methods 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- 230000017531 blood circulation Effects 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000013399 early diagnosis Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001839 endoscopy Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000000004 hemodynamic effect Effects 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 238000002595 magnetic resonance imaging Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 238000013421 nuclear magnetic resonance imaging Methods 0.000 description 1
- 230000036285 pathological change Effects 0.000 description 1
- 231100000915 pathological change Toxicity 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 238000002600 positron emission tomography Methods 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/60—Editing figures and text; Combining figures or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4053—Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/10—Image enhancement or restoration using non-spatial domain filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/42—Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/52—Scale-space analysis, e.g. wavelet analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10132—Ultrasound image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20092—Interactive image processing based on input by user
- G06T2207/20104—Interactive definition of region of interest [ROI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20112—Image segmentation details
- G06T2207/20132—Image cropping
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30096—Tumor; Lesion
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Biophysics (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Molecular Biology (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Radiology & Medical Imaging (AREA)
- Quality & Reliability (AREA)
- Image Processing (AREA)
- Ultra Sonic Daignosis Equipment (AREA)
Abstract
本发明涉及一种基于自注意机制和稳定学习的淋巴瘤超声图像语义分割方法,针对淋巴瘤超声图像构建分割网络,对该网络进行训练得到淋巴瘤图像分割模型,利用该模型对淋巴瘤超声图像进行分割。通过数据预处理模块,对标注之后的仪器扫描图像裁剪感兴趣区域、调整像素间距得到新的数据集,用于模型的训练。采用自注意力机制实现编码器编码特征之间的非局部交互,缓解多次采样造成的信息衰退问题,得到更精确的分割目标对象的结构边界;采用稳定学习方法通过随机傅里叶特征和对样本加权的方式消除环境特征和本质特征之间的依赖关系,减少虚假相关问题,提高分割精度;采用反事实解释方法,对模型结果进行实例级别的解释,提高模型的可信度。
Description
技术领域
本发明涉及医疗图像处理领域,特别是涉及一种基于自注意机制和稳定学习的淋巴瘤超声图像语义分割方法。
背景技术
淋巴瘤是由免疫***细胞异常突变而形成的一种致命的癌症。存在许多不同的组织学亚型,其诊断通常基于取样(活检)。淋巴瘤起源于***和淋巴组织,可以发生于身体的任何部位,临床表现多样。该疾病通常以无痛性进行***肿大为特征,亦可侵犯结外器官引起相应器官的受损。主要分为霍奇金和非霍奇金淋巴瘤两类。
淋巴瘤的诊断需结合患者的临床表现、体格检查、实验室检查、影像学检查和病理学检查结果等。这些不同的方法对于诊断淋巴瘤的分期和分型起着不同的作用。影像学技术对于淋巴瘤的分期和分型起着重要作用。常用的影像检查方法包括CT、核磁共振成像(Nuclear Magnetic Resonance Imaging,MRI)、正电子发射计算机断层显像(PositionEmission Tomography-computed Tomography,PET-CT)、超声和内镜等。
由于成像技术不同,不同类型的成像方式得到的图像对淋巴瘤的诊断有着不同的效果。与其它的成像技术相比,超声检查是一种无放射性损伤的安全的检查,属于完全无损、无创性的、无辐射的检查技术。由于超声的探头能随意的放置,因此对人体检查时可以采取多种方位、多角度的断面进行检查,非常的灵活,能够对病灶进行定位测量,明确病变的位置和周围组织的关系,实时动态显示,尤其对于心脏在不同时期心脏跳动的位置,跳动的多普勒血流的改变,可以观察血流动力学的情况超声检查能够立即得到检查结果,还可以反复多次重复检查。超声波方法具有广泛的可用性(包括床边)和相对较低的成本。因此超声检查在前期诊断淋巴瘤起着重要的作用。
但是由于超声成像固有的声学特征,得到的图像噪声大、对比度低、成像质量差。需要对图像进行分割,分割是超声图像分析的关键。一般来说,这种分割是由临床医生手动执行的,这降低了诊断的客观性,耗费大量人力。即使是专家,根据他们的经验和技能进行的描述也略有不同。因此对于许多的医学图像应用程序来说,模型正确分割病灶区域是应用成功的关键。能够准确的从图像中获取感兴趣区域(ROI)的自动分割模型可以为临床医生诊断或进行病理学研究提供依据。但是现有的淋巴瘤图像分割多集中于三维正电子发射断层扫描(PET)和计算机断层扫描(CT)图像,没有对淋巴瘤图像进行分割。
发明内容
本发明所要解决的技术问题是提供一种基于自注意机制和稳定学习的淋巴瘤超声图像语义分割方法,能够在少量数据的情况下有效的对淋巴瘤超声图像进行分割。
一种基于自注意机制和稳定学习的淋巴瘤超声图像语义分割方法,包括:
获取淋巴瘤超声图像,并将图像处理作为训练样本;
构建淋巴瘤超声图像分割网络:所述淋巴瘤超声图像分割网络包括数据预处理模块、特征提取网络模块、自注意力机制模块、稳定学习模块、反事实解释模块;
数据预处理模块,用于对所有淋巴瘤超声图像样本进行裁剪与标注,将预处理后的样本作为分割网络的输入数据;
特征提取网络模块,用于提取图像的空间信息和全局信息,融合提取到的特征捕获更清晰的对象边界;
自注意力机制模块,用于实现特征之间的非局部交互,缓解多次采样造成的信息衰退问题;
稳定学习模块,用于通过随机傅里叶特征和对样本加权的方式消除环境特征和本质特征之间的依赖关系,实现泛化;
反事实解释模块,用于对模型结果进行实例级别的解释,提高模型的可信度。
优选的是,本发明数据预处理模块的运行步骤包括:
步骤S11对超声仪器扫描的超声图像进行裁剪,去除超声扫描仪器添加的额外内容;
步骤S12将裁剪后的图像上传到PLabel标注***进行自由标注,标注完成之后将在***中标注的图像交由经验丰富的医学专家进行审查和修正,将最终的标注结果导出;
步骤S13将导出的json文件读取生成真实的掩码图像;
步骤S14调整标注图像和原始图像像素间距得到分辨率为256×256的图像,并裁剪感兴趣区域图像,并调整分辨率为512×512。
优选的是,本发明特征提取网络模块运行步骤包括:
步骤S21使用编码器结构进行下采样提取低级特征,从而利用提取到的空间信息和全局信息精确分割;
步骤S22解码器通过上采样逐步恢复空间信息,融合编码器编码过程中提取到的特征来捕获更加清晰的对象边界。
优选的是,本发明自注意力机制模块的运行步骤包括:
步骤S32将编码器编码的最后一层特征输入到TSA模块,TSA模块将输入的特征图和生成的位置嵌入向量进行不同的线性变化生成query(Q)、key(K)、value(V)三个向量,用于attention的计算;
步骤S32将Q与K的转置相乘得到Q与K元素之间的相似程度,除以向量Q的维度dk的开方保证softmax的梯度并通过softmax进行归一化,得到一个上下文注意力图A,将A与V相乘得到注意力加权的值,公式如下所示:
步骤S33将注意力机制模块得到的返回值与最后一层特征进行逐元素相加得到一个融合的特征图F用于解码器的输入。
优选的是,本发明稳定学习模块的运行步骤包括:
步骤S41将特征图输入稳定学习模块,通过随机傅里叶特征将输入的特征从低维度映射到高维度空间,消除特征之间的相关性,随机傅里叶特征公式如下所示:
步骤S42通过计算两个随机变量之间的协方差的最小值得到样本加权权重的最优值w*,公式如下所示:
w*=argminw∈Δn∑1≤i<j≤ncov(wiXi,wjXj),
步骤S43深度学习使用全部样本全局地学习样本权重和特征需要巨大开销,所以需要存储和重加载样本权重,通过一个可学习的参数αi来进行全局权重和特征的更新,权重更新公式如下所示:
X′Gi=αiXGi+(1-αi)XL,
W′Gi=αiWGi+(1-αi)WL,
XGi和XL分别为全局样本特征和当前样本特征,WGi和WL分别为全局样本权重和当前样本权重;
步骤S44将计算出的最优权重与样本的loss值相乘得到新的loss用于模型的训练,loss更新公式如下所示:
loss=SoftDiceLoss(SR,GT).view(1,-1).mm(w*).view(1),
SR和GT分别为模型给出的预测值和真实值。
优选的是,本发明反事实解释模块的运行步骤包括:
步骤S51通过快速位移图像分割算法生成图像的分割片段
步骤S52通过对分割片段进行遮掩,寻找一组不可约片段使得模型的IoU评分减少最多,公式如下所示:
T(I\S)<T(I)(IoU reduce),
其中I表示生成图像的分割片段,S表示过度分割片段,T表示分割模型;
步骤S53将这组片段映射到原图,生成对模型结果的实例级别的解释。
本发明针对淋巴瘤超声扫描图像数据,对数据进行预处理,得到两种数据集用于模型的训练,使模型获得更高的性能;本发明基于深度学习框架对淋巴瘤超声图像进行自动的语义分割,通过自注意力模块和稳定学习模块解决超声图像边界模糊以及泛化的问题,同时通过反事实解释模块对模型进行实例级别的解释,提高了模型的分割精度和可信度;自动分割无需人为因素的介入,排出了主观因素的干扰,节约大量的时间成本和人力成本,提高诊断的效率和精度。
附图说明
图1为本发明的流程框架示意图;
图2为本发明中数据预处理模块的流程示意图;数据预处理模块、、自注意力机制模块、稳定学习模块、反事实解释模块;
图3为本发明的标准数据集的样本结构示意图;
图4为本发明神经网络架构示意图;
图5为本发明中特征提取网络模块架构示意图;
图6为本发明中自注意力机制模块架构示意图;
图7为本发明中稳定学习模块架构示意图;
图8为本发明中反事实解释模块架构示意图;
图9为IOU为0.89105映射为0.84559的过程示意图;
图10为IOU为0.95403映射为0.91483的过程示意图。
具体实施方式
一种基于自注意机制和稳定学习的淋巴瘤超声图像语义分割方法,包括:
获取淋巴瘤超声图像,并将图像处理作为训练样本;
构建淋巴瘤超声图像分割网络:所述淋巴瘤超声图像分割网络包括数据预处理模块、特征提取网络模块、自注意力机制模块、稳定学习模块、反事实解释模块;
数据预处理模块,用于对所有淋巴瘤超声图像样本进行裁剪与标注,将预处理后的样本作为分割网络的输入数据;
特征提取网络模块,用于提取图像的空间信息和全局信息,融合提取到的特征捕获更清晰的对象边界;
自注意力机制模块,用于实现特征之间的非局部交互,缓解多次采样造成的信息衰退问题;
稳定学习模块,用于通过随机傅里叶特征和对样本加权的方式消除环境特征和本质特征之间的依赖关系,实现泛化;
反事实解释模块,用于对模型结果进行实例级别的解释,提高模型的可信度。
如图1所示,本发明的流程框架主要由数据预处理、深度神经网络以及反事实组成。首先,将患者的淋巴瘤超声图像作为原始数据集,对原始数据集进行预处理之后,得到用于神经网络训练的数据集;训练后的神经网络能够对输入的图片给出分割结果;反事实解释方法结合深度神经网络给出实例级的解释。
如图2所示,实现了基于患者淋巴瘤超声图像的预处理模块,运行步骤包括:
步骤S11对超声仪器扫描的超声图像进行裁剪,去除超声扫描仪器添加的额外内容;
步骤S12将裁剪后的图像上传到PLabel标注***进行自由标注,标注完成之后将在***中标注的图像交由经验丰富的医学专家进行审查和修正,将最终的标注结果导出;
步骤S13将导出的json文件读取生成真实的掩码图像;
步骤S14调整标注图像和原始图像像素间距得到分辨率为256×256的图像,并裁剪感兴趣区域图像,并调整分辨率为512×512。
针对预处理之后的数据集,进行训练集与测试集的划分,测试集用于神经网络的训练,测试集用于评估模型的精度。结合图3,可以看到预处理后的图像,stage1的图像用于深度神经网络第一阶段的训练,用于对病灶区域进行一个粗略的定位;stage2的图像为感兴趣区域图像,用于深度神经网络第二阶段的训练,用于优化分割对象的目标边界。
如图4、图5所示,实现了基于患者淋巴瘤超声图像的特征提取网络模块,该模块通过编码器空洞卷积提取信息,通过解码器采样恢复空间信息,得到图像分割结果,运行步骤包括:
步骤S21使用编码器结构进行下采样提取低级特征,从而利用提取到的空间信息和全局信息精确分割;
步骤S22解码器通过上采样逐步恢复空间信息,融合编码器编码过程中提取到的特征来捕获更加清晰的对象边界。
如图6所示,实现了基于患者淋巴瘤超声图像的自注意力机制模块,该模块对患者淋巴瘤图像特征添加位置嵌入,通过自注意力机制得到注意力加权的特征图,运行步骤包括:
步骤S32将编码器编码的最后一层特征输入到TSA模块,TSA模块将输入的特征图和生成的位置嵌入向量进行不同的线性变化生成query(Q)、key(K)、value(V)三个向量,用于attention的计算;
步骤S32将Q与K的转置相乘得到Q与K元素之间的相似程度,除以向量Q的维度dk的开方保证softmax的梯度并通过softmax进行归一化,得到一个上下文注意力图A,将A与V相乘得到注意力加权的值,公式如下所示:
步骤S33将注意力机制模块得到的返回值与最后一层特征进行逐元素相加得到一个融合的特征图F用于解码器的输入。
如图7所示,实现了基于患者淋巴瘤超声图像的稳定学习模块,该模块通过对患者淋巴瘤超声图像样本特征进行随机傅里叶变换RFF和学习样本的加权去相关LSWD得到样本权重用于损失函数的更新,运行步骤包括:
步骤S41将特征图输入稳定学习模块,通过随机傅里叶特征将输入的特征从低维度映射到高维度空间,消除特征之间的相关性,随机傅里叶特征公式如下所示:
步骤S42通过计算两个随机变量之间的协方差的最小值得到样本加权权重的最优值w*,公式如下所示:
w*=argminw∈Δn∑1≤i<j≤ncov(wiXi,wjXj),
步骤S43深度学习使用全部样本全局地学习样本权重和特征需要巨大开销,所以需要存储和重加载样本权重,通过一个可学习的参数αi来进行全局权重和特征的更新,权重更新公式如下所示:
X′Gi=αiXGi+(1-αi)XL,
W′Gi=αiWGi+(1-αi)WL,
XGi和XL分别为全局样本特征和当前样本特征,WGi和WL分别为全局样本权重和当前样本权重;
步骤S44将计算出的最优权重与样本的loss值相乘得到新的loss用于模型的训练,loss更新公式如下所示:
loss=SoftDiceLoss(SR,GT).view(1,-1).mm(w*).view(1),
SR和GT分别为模型给出的预测值和真实值。
如图8所示,实现了基于患者淋巴瘤超声图像的反事实解释模块,该模块通过快速位移图像分割算法SETC和Counterfactual反事实模块对患者淋巴瘤超声图像进行处理,生成实例级别的反事实解释,运行步骤包括:
步骤S51通过快速位移图像分割算法生成图像的分割片段
步骤S52通过对分割片段进行遮掩,寻找一组不可约片段使得模型的IoU评分减少最多,公式如下所示:
T(I\S)<T(I)(IoU reduce),
其中I表示生成图像的分割片段,S表示过度分割片段,T表示分割模型;
步骤S53将这组片段映射到原图,生成对模型结果的实例级别的解释。
如图9、图10所示,图9为IOU为0.89105映射为0.84559的过程示意图,图9为IOU为0.95403映射为0.91483的过程示意图,可以看到反事实模块生成的反事实解释结果,在图9和图10中,其中a为输入的原始图像;b为通过SETC算法生成的分割片段可视化图;c为反事实模块生成的反事实解释;d为反事实解释在原始图像上的映射。
通过实验结果表明,本发明可以高效利用患者的淋巴瘤超声图像,有效地提高了淋巴瘤患者分割精度,模型能够解决超声图像的边界模糊和泛化问题,同时通过反事实解释对模型进行实例级别的解释,所得到的分割结果对于医生的辅助诊断更具信服力。
Claims (6)
1.一种基于自注意机制和稳定学习的淋巴瘤超声图像语义分割方法,其特征在于包括:
获取淋巴瘤超声图像,并将图像处理作为训练样本;
构建淋巴瘤超声图像分割网络:所述淋巴瘤超声图像分割网络包括数据预处理模块、特征提取网络模块、自注意力机制模块、稳定学习模块、反事实解释模块;
数据预处理模块,用于对所有淋巴瘤超声图像样本进行裁剪与标注,将预处理后的样本作为分割网络的输入数据;
特征提取网络模块,用于提取图像的空间信息和全局信息,融合提取到的特征捕获更清晰的对象边界;
自注意力机制模块,用于实现特征之间的非局部交互,缓解多次采样造成的信息衰退问题;
稳定学习模块,用于通过随机傅里叶特征和对样本加权的方式消除环境特征和本质特征之间的依赖关系,实现泛化;
反事实解释模块,用于对模型结果进行实例级别的解释,提高模型的可信度。
2.根据权利要求1所述的基于自注意机制和稳定学习的淋巴瘤超声图像语义分割方法,其特征在于上述数据预处理模块的运行步骤包括:
步骤S11对超声仪器扫描的超声图像进行裁剪,去除超声扫描仪器添加的额外内容;
步骤S12将裁剪后的图像上传到PLabel标注***进行自由标注,标注完成之后将在***中标注的图像交由经验丰富的医学专家进行审查和修正,将最终的标注结果导出;
步骤S13将导出的json文件读取生成真实的掩码图像;
步骤S14调整标注图像和原始图像像素间距得到分辨率为256×256的图像,并裁剪感兴趣区域图像,并调整分辨率为512×512。
3.根据权利要求2所述的基于自注意机制和稳定学习的淋巴瘤超声图像语义分割方法,其特征在于上述特征提取网络模块运行步骤包括:
步骤S21使用编码器结构进行下采样提取低级特征,从而利用提取到的空间信息和全局信息精确分割;
步骤S22解码器通过上采样逐步恢复空间信息,融合编码器编码过程中提取到的特征来捕获更加清晰的对象边界。
4.根据权利要求3所述的基于自注意机制和稳定学习的淋巴瘤超声图像语义分割方法,其特征在于上述自注意力机制模块的运行步骤包括:
步骤S32将编码器编码的最后一层特征输入到TSA模块,TSA模块将输入的特征图和生成的位置嵌入向量进行不同的线性变化生成query(Q)、key(K)、value(V)三个向量,用于attention的计算;
步骤S32将Q与K的转置相乘得到Q与K元素之间的相似程度,除以向量Q的维度dk的开方保证softmax的梯度并通过softmax进行归一化,得到一个上下文注意力图A,将A与V相乘得到注意力加权的值,公式如下所示:
步骤S33将注意力机制模块得到的返回值与最后一层特征进行逐元素相加得到一个融合的特征图F用于解码器的输入。
5.根据权利要求4所述的基于自注意机制和稳定学习的淋巴瘤超声图像语义分割方法,其特征在于上述稳定学习模块的运行步骤包括:
步骤S41将特征图输入稳定学习模块,通过随机傅里叶特征将输入的特征从低维度映射到高维度空间,消除特征之间的相关性,随机傅里叶特征公式如下所示:
步骤S42通过计算两个随机变量之间的协方差的最小值得到样本加权权重的最优值w*,公式如下所示:
w*=argminw∈Δn∑1≤i<j≤ncov(wiXi,wjXj),
步骤S43深度学习使用全部样本全局地学习样本权重和特征需要巨大开销,所以需要存储和重加载样本权重,通过一个可学习的参数αi来进行全局权重和特征的更新,权重更新公式如下所示:
X′Gi=αiXGi+(1-αi)XL,
W′Gi=αiWGi+(1-αi)WL,
XGi和XL分别为全局样本特征和当前样本特征,WGi和WL分别为全局样本权重和当前样本权重;
步骤S44将计算出的最优权重与样本的loss值相乘得到新的loss用于模型的训练,loss更新公式如下所示:
loss=SoftDiceLoss(SR,GT).view(1,-1).mm(w*).view(1),
SR和GT分别为模型给出的预测值和真实值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210604099.0A CN114972266A (zh) | 2022-05-31 | 2022-05-31 | 基于自注意机制和稳定学习的淋巴瘤超声图像语义分割方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210604099.0A CN114972266A (zh) | 2022-05-31 | 2022-05-31 | 基于自注意机制和稳定学习的淋巴瘤超声图像语义分割方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114972266A true CN114972266A (zh) | 2022-08-30 |
Family
ID=82957378
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210604099.0A Pending CN114972266A (zh) | 2022-05-31 | 2022-05-31 | 基于自注意机制和稳定学习的淋巴瘤超声图像语义分割方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114972266A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116012586A (zh) * | 2023-01-06 | 2023-04-25 | 阿里巴巴(中国)有限公司 | 图像处理方法、存储介质及计算机终端 |
CN117351183A (zh) * | 2023-10-09 | 2024-01-05 | 广州医科大学附属第一医院(广州呼吸中心) | 子宫内膜癌***转移智能识别方法及*** |
-
2022
- 2022-05-31 CN CN202210604099.0A patent/CN114972266A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116012586A (zh) * | 2023-01-06 | 2023-04-25 | 阿里巴巴(中国)有限公司 | 图像处理方法、存储介质及计算机终端 |
CN117351183A (zh) * | 2023-10-09 | 2024-01-05 | 广州医科大学附属第一医院(广州呼吸中心) | 子宫内膜癌***转移智能识别方法及*** |
CN117351183B (zh) * | 2023-10-09 | 2024-06-04 | 广州医科大学附属第一医院(广州呼吸中心) | 子宫内膜癌***转移智能识别方法及*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111539930B (zh) | 基于深度学习的动态超声乳腺结节实时分割与识别的方法 | |
CN113870258B (zh) | 一种基于对抗学习的无标签胰腺影像自动分割*** | |
KR102125127B1 (ko) | 딥러닝 기반 뇌 질환 진단 방법 | |
US20200367853A1 (en) | Apparatus for ai-based automatic ultrasound diagnosis of liver steatosis and remote medical diagnosis method using the same | |
JP4652023B2 (ja) | 病気の発見に役立つ画像データの処理方法及び装置 | |
CN110490851B (zh) | 基于人工智能的乳腺图像分割方法、装置及*** | |
CN111784671A (zh) | 基于多尺度深度学习的病理图像病灶区域检测方法 | |
JP2016531709A (ja) | 疾患を診断するための画像解析技術 | |
CN114972266A (zh) | 基于自注意机制和稳定学习的淋巴瘤超声图像语义分割方法 | |
CN111340827A (zh) | 一种肺部ct影像数据处理分析方法及*** | |
CN113420826B (zh) | 一种肝脏病灶图像处理***及图像处理方法 | |
CN113393469A (zh) | 基于循环残差卷积神经网络的医学图像分割方法和装置 | |
CN113298830B (zh) | 一种基于自监督的急性颅内ich区域图像分割方法 | |
CN112508884A (zh) | 一种癌变区域综合检测装置及方法 | |
JP2024035070A (ja) | マルチビューサブ空間クラスタリングに基づくマルチモード医学データ融合システム | |
CN114332132A (zh) | 图像分割方法、装置和计算机设备 | |
CN111640127B (zh) | 一种用于骨科的精准临床诊断导航方法 | |
CN112200810A (zh) | 多模态的自动化脑室分割***及其使用方法 | |
CN116597950A (zh) | 一种医学图像分层方法 | |
CN116168029A (zh) | 一种用于评估肋骨骨折的方法、设备和介质 | |
CN115409812A (zh) | 一种基于融合时间注意机制的ct图像自动分类方法 | |
CN112967295B (zh) | 一种基于残差网络和注意力机制的图像处理方法及*** | |
CN111640126B (zh) | 基于医学影像的人工智能诊断辅助方法 | |
CN114332278A (zh) | 一种基于深度学习的octa图像运动矫正方法 | |
CN114494952A (zh) | 一种基于感知损失的乳腺mri影像时间序列生成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |