CN114972266A - 基于自注意机制和稳定学习的淋巴瘤超声图像语义分割方法 - Google Patents

基于自注意机制和稳定学习的淋巴瘤超声图像语义分割方法 Download PDF

Info

Publication number
CN114972266A
CN114972266A CN202210604099.0A CN202210604099A CN114972266A CN 114972266 A CN114972266 A CN 114972266A CN 202210604099 A CN202210604099 A CN 202210604099A CN 114972266 A CN114972266 A CN 114972266A
Authority
CN
China
Prior art keywords
image
module
lymphoma
self
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210604099.0A
Other languages
English (en)
Inventor
韩迎康
陈德华
潘乔
王梅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Donghua University
Original Assignee
Donghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Donghua University filed Critical Donghua University
Priority to CN202210604099.0A priority Critical patent/CN114972266A/zh
Publication of CN114972266A publication Critical patent/CN114972266A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4053Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/10Image enhancement or restoration using non-spatial domain filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/42Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/52Scale-space analysis, e.g. wavelet analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • G06V10/806Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10132Ultrasound image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20092Interactive image processing based on input by user
    • G06T2207/20104Interactive definition of region of interest [ROI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20112Image segmentation details
    • G06T2207/20132Image cropping
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30096Tumor; Lesion

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Molecular Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Radiology & Medical Imaging (AREA)
  • Quality & Reliability (AREA)
  • Image Processing (AREA)
  • Ultra Sonic Daignosis Equipment (AREA)

Abstract

本发明涉及一种基于自注意机制和稳定学习的淋巴瘤超声图像语义分割方法,针对淋巴瘤超声图像构建分割网络,对该网络进行训练得到淋巴瘤图像分割模型,利用该模型对淋巴瘤超声图像进行分割。通过数据预处理模块,对标注之后的仪器扫描图像裁剪感兴趣区域、调整像素间距得到新的数据集,用于模型的训练。采用自注意力机制实现编码器编码特征之间的非局部交互,缓解多次采样造成的信息衰退问题,得到更精确的分割目标对象的结构边界;采用稳定学习方法通过随机傅里叶特征和对样本加权的方式消除环境特征和本质特征之间的依赖关系,减少虚假相关问题,提高分割精度;采用反事实解释方法,对模型结果进行实例级别的解释,提高模型的可信度。

Description

基于自注意机制和稳定学习的淋巴瘤超声图像语义分割方法
技术领域
本发明涉及医疗图像处理领域,特别是涉及一种基于自注意机制和稳定学习的淋巴瘤超声图像语义分割方法。
背景技术
淋巴瘤是由免疫***细胞异常突变而形成的一种致命的癌症。存在许多不同的组织学亚型,其诊断通常基于取样(活检)。淋巴瘤起源于***和淋巴组织,可以发生于身体的任何部位,临床表现多样。该疾病通常以无痛性进行***肿大为特征,亦可侵犯结外器官引起相应器官的受损。主要分为霍奇金和非霍奇金淋巴瘤两类。
淋巴瘤的诊断需结合患者的临床表现、体格检查、实验室检查、影像学检查和病理学检查结果等。这些不同的方法对于诊断淋巴瘤的分期和分型起着不同的作用。影像学技术对于淋巴瘤的分期和分型起着重要作用。常用的影像检查方法包括CT、核磁共振成像(Nuclear Magnetic Resonance Imaging,MRI)、正电子发射计算机断层显像(PositionEmission Tomography-computed Tomography,PET-CT)、超声和内镜等。
由于成像技术不同,不同类型的成像方式得到的图像对淋巴瘤的诊断有着不同的效果。与其它的成像技术相比,超声检查是一种无放射性损伤的安全的检查,属于完全无损、无创性的、无辐射的检查技术。由于超声的探头能随意的放置,因此对人体检查时可以采取多种方位、多角度的断面进行检查,非常的灵活,能够对病灶进行定位测量,明确病变的位置和周围组织的关系,实时动态显示,尤其对于心脏在不同时期心脏跳动的位置,跳动的多普勒血流的改变,可以观察血流动力学的情况超声检查能够立即得到检查结果,还可以反复多次重复检查。超声波方法具有广泛的可用性(包括床边)和相对较低的成本。因此超声检查在前期诊断淋巴瘤起着重要的作用。
但是由于超声成像固有的声学特征,得到的图像噪声大、对比度低、成像质量差。需要对图像进行分割,分割是超声图像分析的关键。一般来说,这种分割是由临床医生手动执行的,这降低了诊断的客观性,耗费大量人力。即使是专家,根据他们的经验和技能进行的描述也略有不同。因此对于许多的医学图像应用程序来说,模型正确分割病灶区域是应用成功的关键。能够准确的从图像中获取感兴趣区域(ROI)的自动分割模型可以为临床医生诊断或进行病理学研究提供依据。但是现有的淋巴瘤图像分割多集中于三维正电子发射断层扫描(PET)和计算机断层扫描(CT)图像,没有对淋巴瘤图像进行分割。
发明内容
本发明所要解决的技术问题是提供一种基于自注意机制和稳定学习的淋巴瘤超声图像语义分割方法,能够在少量数据的情况下有效的对淋巴瘤超声图像进行分割。
一种基于自注意机制和稳定学习的淋巴瘤超声图像语义分割方法,包括:
获取淋巴瘤超声图像,并将图像处理作为训练样本;
构建淋巴瘤超声图像分割网络:所述淋巴瘤超声图像分割网络包括数据预处理模块、特征提取网络模块、自注意力机制模块、稳定学习模块、反事实解释模块;
数据预处理模块,用于对所有淋巴瘤超声图像样本进行裁剪与标注,将预处理后的样本作为分割网络的输入数据;
特征提取网络模块,用于提取图像的空间信息和全局信息,融合提取到的特征捕获更清晰的对象边界;
自注意力机制模块,用于实现特征之间的非局部交互,缓解多次采样造成的信息衰退问题;
稳定学习模块,用于通过随机傅里叶特征和对样本加权的方式消除环境特征和本质特征之间的依赖关系,实现泛化;
反事实解释模块,用于对模型结果进行实例级别的解释,提高模型的可信度。
优选的是,本发明数据预处理模块的运行步骤包括:
步骤S11对超声仪器扫描的超声图像进行裁剪,去除超声扫描仪器添加的额外内容;
步骤S12将裁剪后的图像上传到PLabel标注***进行自由标注,标注完成之后将在***中标注的图像交由经验丰富的医学专家进行审查和修正,将最终的标注结果导出;
步骤S13将导出的json文件读取生成真实的掩码图像;
步骤S14调整标注图像和原始图像像素间距得到分辨率为256×256的图像,并裁剪感兴趣区域图像,并调整分辨率为512×512。
优选的是,本发明特征提取网络模块运行步骤包括:
步骤S21使用编码器结构进行下采样提取低级特征,从而利用提取到的空间信息和全局信息精确分割;
步骤S22解码器通过上采样逐步恢复空间信息,融合编码器编码过程中提取到的特征来捕获更加清晰的对象边界。
优选的是,本发明自注意力机制模块的运行步骤包括:
步骤S32将编码器编码的最后一层特征输入到TSA模块,TSA模块将输入的特征图和生成的位置嵌入向量进行不同的线性变化生成query(Q)、key(K)、value(V)三个向量,用于attention的计算;
步骤S32将Q与K的转置相乘得到Q与K元素之间的相似程度,除以向量Q的维度dk的开方保证softmax的梯度并通过softmax进行归一化,得到一个上下文注意力图A,将A与V相乘得到注意力加权的值,公式如下所示:
Figure BDA0003670648610000031
步骤S33将注意力机制模块得到的返回值与最后一层特征进行逐元素相加得到一个融合的特征图F用于解码器的输入。
优选的是,本发明稳定学习模块的运行步骤包括:
步骤S41将特征图输入稳定学习模块,通过随机傅里叶特征将输入的特征从低维度映射到高维度空间,消除特征之间的相关性,随机傅里叶特征公式如下所示:
Figure BDA0003670648610000032
h是对输入的低维度特征x进行随机傅里叶变换后得到的高维空间特征,ω是从标准正态分布中采样的随机变量,ωx表示随机变量ω与x相乘进行变换,
Figure BDA0003670648610000033
是从均匀分布中采样的随机变量;
步骤S42通过计算两个随机变量之间的协方差的最小值得到样本加权权重的最优值w*,公式如下所示:
w*=argminw∈Δn1≤i<j≤ncov(wiXi,wjXj),
式子中的
Figure BDA0003670648610000034
n为输入的批次数,即传入的样本特征图的数目,Xi和Xj分别为样本空间中的不同样本的特征图,wi和wj分别为样本Xi和Xj对应的加权权重;
步骤S43深度学习使用全部样本全局地学习样本权重和特征需要巨大开销,所以需要存储和重加载样本权重,通过一个可学习的参数αi来进行全局权重和特征的更新,权重更新公式如下所示:
X′Gi=αiXGi+(1-αi)XL
W′Gi=αiWGi+(1-αi)WL
XGi和XL分别为全局样本特征和当前样本特征,WGi和WL分别为全局样本权重和当前样本权重;
步骤S44将计算出的最优权重与样本的loss值相乘得到新的loss用于模型的训练,loss更新公式如下所示:
loss=SoftDiceLoss(SR,GT).view(1,-1).mm(w*).view(1),
Figure BDA0003670648610000041
SR和GT分别为模型给出的预测值和真实值。
优选的是,本发明反事实解释模块的运行步骤包括:
步骤S51通过快速位移图像分割算法生成图像的分割片段
步骤S52通过对分割片段进行遮掩,寻找一组不可约片段使得模型的IoU评分减少最多,公式如下所示:
Figure BDA0003670648610000042
T(I\S)<T(I)(IoU reduce),
其中I表示生成图像的分割片段,S表示过度分割片段,T表示分割模型;
步骤S53将这组片段映射到原图,生成对模型结果的实例级别的解释。
本发明针对淋巴瘤超声扫描图像数据,对数据进行预处理,得到两种数据集用于模型的训练,使模型获得更高的性能;本发明基于深度学习框架对淋巴瘤超声图像进行自动的语义分割,通过自注意力模块和稳定学习模块解决超声图像边界模糊以及泛化的问题,同时通过反事实解释模块对模型进行实例级别的解释,提高了模型的分割精度和可信度;自动分割无需人为因素的介入,排出了主观因素的干扰,节约大量的时间成本和人力成本,提高诊断的效率和精度。
附图说明
图1为本发明的流程框架示意图;
图2为本发明中数据预处理模块的流程示意图;数据预处理模块、、自注意力机制模块、稳定学习模块、反事实解释模块;
图3为本发明的标准数据集的样本结构示意图;
图4为本发明神经网络架构示意图;
图5为本发明中特征提取网络模块架构示意图;
图6为本发明中自注意力机制模块架构示意图;
图7为本发明中稳定学习模块架构示意图;
图8为本发明中反事实解释模块架构示意图;
图9为IOU为0.89105映射为0.84559的过程示意图;
图10为IOU为0.95403映射为0.91483的过程示意图。
具体实施方式
一种基于自注意机制和稳定学习的淋巴瘤超声图像语义分割方法,包括:
获取淋巴瘤超声图像,并将图像处理作为训练样本;
构建淋巴瘤超声图像分割网络:所述淋巴瘤超声图像分割网络包括数据预处理模块、特征提取网络模块、自注意力机制模块、稳定学习模块、反事实解释模块;
数据预处理模块,用于对所有淋巴瘤超声图像样本进行裁剪与标注,将预处理后的样本作为分割网络的输入数据;
特征提取网络模块,用于提取图像的空间信息和全局信息,融合提取到的特征捕获更清晰的对象边界;
自注意力机制模块,用于实现特征之间的非局部交互,缓解多次采样造成的信息衰退问题;
稳定学习模块,用于通过随机傅里叶特征和对样本加权的方式消除环境特征和本质特征之间的依赖关系,实现泛化;
反事实解释模块,用于对模型结果进行实例级别的解释,提高模型的可信度。
如图1所示,本发明的流程框架主要由数据预处理、深度神经网络以及反事实组成。首先,将患者的淋巴瘤超声图像作为原始数据集,对原始数据集进行预处理之后,得到用于神经网络训练的数据集;训练后的神经网络能够对输入的图片给出分割结果;反事实解释方法结合深度神经网络给出实例级的解释。
如图2所示,实现了基于患者淋巴瘤超声图像的预处理模块,运行步骤包括:
步骤S11对超声仪器扫描的超声图像进行裁剪,去除超声扫描仪器添加的额外内容;
步骤S12将裁剪后的图像上传到PLabel标注***进行自由标注,标注完成之后将在***中标注的图像交由经验丰富的医学专家进行审查和修正,将最终的标注结果导出;
步骤S13将导出的json文件读取生成真实的掩码图像;
步骤S14调整标注图像和原始图像像素间距得到分辨率为256×256的图像,并裁剪感兴趣区域图像,并调整分辨率为512×512。
针对预处理之后的数据集,进行训练集与测试集的划分,测试集用于神经网络的训练,测试集用于评估模型的精度。结合图3,可以看到预处理后的图像,stage1的图像用于深度神经网络第一阶段的训练,用于对病灶区域进行一个粗略的定位;stage2的图像为感兴趣区域图像,用于深度神经网络第二阶段的训练,用于优化分割对象的目标边界。
如图4、图5所示,实现了基于患者淋巴瘤超声图像的特征提取网络模块,该模块通过编码器空洞卷积提取信息,通过解码器采样恢复空间信息,得到图像分割结果,运行步骤包括:
步骤S21使用编码器结构进行下采样提取低级特征,从而利用提取到的空间信息和全局信息精确分割;
步骤S22解码器通过上采样逐步恢复空间信息,融合编码器编码过程中提取到的特征来捕获更加清晰的对象边界。
如图6所示,实现了基于患者淋巴瘤超声图像的自注意力机制模块,该模块对患者淋巴瘤图像特征添加位置嵌入,通过自注意力机制得到注意力加权的特征图,运行步骤包括:
步骤S32将编码器编码的最后一层特征输入到TSA模块,TSA模块将输入的特征图和生成的位置嵌入向量进行不同的线性变化生成query(Q)、key(K)、value(V)三个向量,用于attention的计算;
步骤S32将Q与K的转置相乘得到Q与K元素之间的相似程度,除以向量Q的维度dk的开方保证softmax的梯度并通过softmax进行归一化,得到一个上下文注意力图A,将A与V相乘得到注意力加权的值,公式如下所示:
Figure BDA0003670648610000061
步骤S33将注意力机制模块得到的返回值与最后一层特征进行逐元素相加得到一个融合的特征图F用于解码器的输入。
如图7所示,实现了基于患者淋巴瘤超声图像的稳定学习模块,该模块通过对患者淋巴瘤超声图像样本特征进行随机傅里叶变换RFF和学习样本的加权去相关LSWD得到样本权重用于损失函数的更新,运行步骤包括:
步骤S41将特征图输入稳定学习模块,通过随机傅里叶特征将输入的特征从低维度映射到高维度空间,消除特征之间的相关性,随机傅里叶特征公式如下所示:
Figure BDA0003670648610000071
h是对输入的低维度特征x进行随机傅里叶变换后得到的高维空间特征,ω是从标准正态分布中采样的随机变量,ωx表示随机变量ω与x相乘进行变换,
Figure BDA0003670648610000072
是从均匀分布中采样的随机变量;
步骤S42通过计算两个随机变量之间的协方差的最小值得到样本加权权重的最优值w*,公式如下所示:
w*=argminw∈Δn1≤i<j≤ncov(wiXi,wjXj),
式子中的
Figure BDA0003670648610000073
n为输入的批次数,即传入的样本特征图的数目,Xi和Xj分别为样本空间中的不同样本的特征图,wi和wj分别为样本Xi和Xj对应的加权权重;
步骤S43深度学习使用全部样本全局地学习样本权重和特征需要巨大开销,所以需要存储和重加载样本权重,通过一个可学习的参数αi来进行全局权重和特征的更新,权重更新公式如下所示:
X′Gi=αiXGi+(1-αi)XL
W′Gi=αiWGi+(1-αi)WL
XGi和XL分别为全局样本特征和当前样本特征,WGi和WL分别为全局样本权重和当前样本权重;
步骤S44将计算出的最优权重与样本的loss值相乘得到新的loss用于模型的训练,loss更新公式如下所示:
loss=SoftDiceLoss(SR,GT).view(1,-1).mm(w*).view(1),
Figure BDA0003670648610000074
SR和GT分别为模型给出的预测值和真实值。
如图8所示,实现了基于患者淋巴瘤超声图像的反事实解释模块,该模块通过快速位移图像分割算法SETC和Counterfactual反事实模块对患者淋巴瘤超声图像进行处理,生成实例级别的反事实解释,运行步骤包括:
步骤S51通过快速位移图像分割算法生成图像的分割片段
步骤S52通过对分割片段进行遮掩,寻找一组不可约片段使得模型的IoU评分减少最多,公式如下所示:
Figure BDA0003670648610000075
T(I\S)<T(I)(IoU reduce),
其中I表示生成图像的分割片段,S表示过度分割片段,T表示分割模型;
步骤S53将这组片段映射到原图,生成对模型结果的实例级别的解释。
如图9、图10所示,图9为IOU为0.89105映射为0.84559的过程示意图,图9为IOU为0.95403映射为0.91483的过程示意图,可以看到反事实模块生成的反事实解释结果,在图9和图10中,其中a为输入的原始图像;b为通过SETC算法生成的分割片段可视化图;c为反事实模块生成的反事实解释;d为反事实解释在原始图像上的映射。
通过实验结果表明,本发明可以高效利用患者的淋巴瘤超声图像,有效地提高了淋巴瘤患者分割精度,模型能够解决超声图像的边界模糊和泛化问题,同时通过反事实解释对模型进行实例级别的解释,所得到的分割结果对于医生的辅助诊断更具信服力。

Claims (6)

1.一种基于自注意机制和稳定学习的淋巴瘤超声图像语义分割方法,其特征在于包括:
获取淋巴瘤超声图像,并将图像处理作为训练样本;
构建淋巴瘤超声图像分割网络:所述淋巴瘤超声图像分割网络包括数据预处理模块、特征提取网络模块、自注意力机制模块、稳定学习模块、反事实解释模块;
数据预处理模块,用于对所有淋巴瘤超声图像样本进行裁剪与标注,将预处理后的样本作为分割网络的输入数据;
特征提取网络模块,用于提取图像的空间信息和全局信息,融合提取到的特征捕获更清晰的对象边界;
自注意力机制模块,用于实现特征之间的非局部交互,缓解多次采样造成的信息衰退问题;
稳定学习模块,用于通过随机傅里叶特征和对样本加权的方式消除环境特征和本质特征之间的依赖关系,实现泛化;
反事实解释模块,用于对模型结果进行实例级别的解释,提高模型的可信度。
2.根据权利要求1所述的基于自注意机制和稳定学习的淋巴瘤超声图像语义分割方法,其特征在于上述数据预处理模块的运行步骤包括:
步骤S11对超声仪器扫描的超声图像进行裁剪,去除超声扫描仪器添加的额外内容;
步骤S12将裁剪后的图像上传到PLabel标注***进行自由标注,标注完成之后将在***中标注的图像交由经验丰富的医学专家进行审查和修正,将最终的标注结果导出;
步骤S13将导出的json文件读取生成真实的掩码图像;
步骤S14调整标注图像和原始图像像素间距得到分辨率为256×256的图像,并裁剪感兴趣区域图像,并调整分辨率为512×512。
3.根据权利要求2所述的基于自注意机制和稳定学习的淋巴瘤超声图像语义分割方法,其特征在于上述特征提取网络模块运行步骤包括:
步骤S21使用编码器结构进行下采样提取低级特征,从而利用提取到的空间信息和全局信息精确分割;
步骤S22解码器通过上采样逐步恢复空间信息,融合编码器编码过程中提取到的特征来捕获更加清晰的对象边界。
4.根据权利要求3所述的基于自注意机制和稳定学习的淋巴瘤超声图像语义分割方法,其特征在于上述自注意力机制模块的运行步骤包括:
步骤S32将编码器编码的最后一层特征输入到TSA模块,TSA模块将输入的特征图和生成的位置嵌入向量进行不同的线性变化生成query(Q)、key(K)、value(V)三个向量,用于attention的计算;
步骤S32将Q与K的转置相乘得到Q与K元素之间的相似程度,除以向量Q的维度dk的开方保证softmax的梯度并通过softmax进行归一化,得到一个上下文注意力图A,将A与V相乘得到注意力加权的值,公式如下所示:
Figure FDA0003670648600000021
步骤S33将注意力机制模块得到的返回值与最后一层特征进行逐元素相加得到一个融合的特征图F用于解码器的输入。
5.根据权利要求4所述的基于自注意机制和稳定学习的淋巴瘤超声图像语义分割方法,其特征在于上述稳定学习模块的运行步骤包括:
步骤S41将特征图输入稳定学习模块,通过随机傅里叶特征将输入的特征从低维度映射到高维度空间,消除特征之间的相关性,随机傅里叶特征公式如下所示:
Figure FDA0003670648600000022
h是对输入的低维度特征x进行随机傅里叶变换后得到的高维空间特征,ω是从标准正态分布中采样的随机变量,ωx表示随机变量ω与x相乘进行变换,
Figure FDA0003670648600000023
是从均匀分布中采样的随机变量;
步骤S42通过计算两个随机变量之间的协方差的最小值得到样本加权权重的最优值w*,公式如下所示:
w*=argminw∈Δn1≤i<j≤ncov(wiXi,wjXj),
式子中的
Figure FDA0003670648600000024
n为输入的批次数,即传入的样本特征图的数目,Xi和Xj分别为样本空间中的不同样本的特征图,wi和wj分别为样本Xi和Xj对应的加权权重;
步骤S43深度学习使用全部样本全局地学习样本权重和特征需要巨大开销,所以需要存储和重加载样本权重,通过一个可学习的参数αi来进行全局权重和特征的更新,权重更新公式如下所示:
X′Gi=αiXGi+(1-αi)XL
W′Gi=αiWGi+(1-αi)WL
XGi和XL分别为全局样本特征和当前样本特征,WGi和WL分别为全局样本权重和当前样本权重;
步骤S44将计算出的最优权重与样本的loss值相乘得到新的loss用于模型的训练,loss更新公式如下所示:
loss=SoftDiceLoss(SR,GT).view(1,-1).mm(w*).view(1),
Figure FDA0003670648600000031
SR和GT分别为模型给出的预测值和真实值。
6.根据权利要求5所述的基于自注意机制和稳定学习的淋巴瘤超声图像语义分割方法,其特征在于上述反事实解释模块的运行步骤包括:
步骤S51通过快速位移图像分割算法生成图像的分割片段
步骤S52通过对分割片段进行遮掩,寻找一组不可约片段使得模型的IoU评分减少最多,公式如下所示:
Figure FDA0003670648600000032
T(I\S)<T(I)(IoU reduce),
I表示生成图像的分割片段,S表示过度分割片段,T表示分割模型;
步骤S53将这组片段映射到原图,生成对模型结果的实例级别的解释。
CN202210604099.0A 2022-05-31 2022-05-31 基于自注意机制和稳定学习的淋巴瘤超声图像语义分割方法 Pending CN114972266A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210604099.0A CN114972266A (zh) 2022-05-31 2022-05-31 基于自注意机制和稳定学习的淋巴瘤超声图像语义分割方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210604099.0A CN114972266A (zh) 2022-05-31 2022-05-31 基于自注意机制和稳定学习的淋巴瘤超声图像语义分割方法

Publications (1)

Publication Number Publication Date
CN114972266A true CN114972266A (zh) 2022-08-30

Family

ID=82957378

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210604099.0A Pending CN114972266A (zh) 2022-05-31 2022-05-31 基于自注意机制和稳定学习的淋巴瘤超声图像语义分割方法

Country Status (1)

Country Link
CN (1) CN114972266A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116012586A (zh) * 2023-01-06 2023-04-25 阿里巴巴(中国)有限公司 图像处理方法、存储介质及计算机终端
CN117351183A (zh) * 2023-10-09 2024-01-05 广州医科大学附属第一医院(广州呼吸中心) 子宫内膜癌***转移智能识别方法及***

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116012586A (zh) * 2023-01-06 2023-04-25 阿里巴巴(中国)有限公司 图像处理方法、存储介质及计算机终端
CN117351183A (zh) * 2023-10-09 2024-01-05 广州医科大学附属第一医院(广州呼吸中心) 子宫内膜癌***转移智能识别方法及***
CN117351183B (zh) * 2023-10-09 2024-06-04 广州医科大学附属第一医院(广州呼吸中心) 子宫内膜癌***转移智能识别方法及***

Similar Documents

Publication Publication Date Title
CN111539930B (zh) 基于深度学习的动态超声乳腺结节实时分割与识别的方法
CN113870258B (zh) 一种基于对抗学习的无标签胰腺影像自动分割***
KR102125127B1 (ko) 딥러닝 기반 뇌 질환 진단 방법
US20200367853A1 (en) Apparatus for ai-based automatic ultrasound diagnosis of liver steatosis and remote medical diagnosis method using the same
JP4652023B2 (ja) 病気の発見に役立つ画像データの処理方法及び装置
CN110490851B (zh) 基于人工智能的乳腺图像分割方法、装置及***
CN111784671A (zh) 基于多尺度深度学习的病理图像病灶区域检测方法
JP2016531709A (ja) 疾患を診断するための画像解析技術
CN114972266A (zh) 基于自注意机制和稳定学习的淋巴瘤超声图像语义分割方法
CN111340827A (zh) 一种肺部ct影像数据处理分析方法及***
CN113420826B (zh) 一种肝脏病灶图像处理***及图像处理方法
CN113393469A (zh) 基于循环残差卷积神经网络的医学图像分割方法和装置
CN113298830B (zh) 一种基于自监督的急性颅内ich区域图像分割方法
CN112508884A (zh) 一种癌变区域综合检测装置及方法
JP2024035070A (ja) マルチビューサブ空間クラスタリングに基づくマルチモード医学データ融合システム
CN114332132A (zh) 图像分割方法、装置和计算机设备
CN111640127B (zh) 一种用于骨科的精准临床诊断导航方法
CN112200810A (zh) 多模态的自动化脑室分割***及其使用方法
CN116597950A (zh) 一种医学图像分层方法
CN116168029A (zh) 一种用于评估肋骨骨折的方法、设备和介质
CN115409812A (zh) 一种基于融合时间注意机制的ct图像自动分类方法
CN112967295B (zh) 一种基于残差网络和注意力机制的图像处理方法及***
CN111640126B (zh) 基于医学影像的人工智能诊断辅助方法
CN114332278A (zh) 一种基于深度学习的octa图像运动矫正方法
CN114494952A (zh) 一种基于感知损失的乳腺mri影像时间序列生成方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination