CN114972266A

CN114972266A - 基于自注意机制和稳定学习的淋巴瘤超声图像语义分割方法

Info

Publication number: CN114972266A
Application number: CN202210604099.0A
Authority: CN
Inventors: 韩迎康; 陈德华; 潘乔; 王梅
Original assignee: Donghua University
Current assignee: Donghua University
Priority date: 2022-05-31
Filing date: 2022-05-31
Publication date: 2022-08-30

Abstract

本发明涉及一种基于自注意机制和稳定学习的淋巴瘤超声图像语义分割方法，针对淋巴瘤超声图像构建分割网络，对该网络进行训练得到淋巴瘤图像分割模型，利用该模型对淋巴瘤超声图像进行分割。通过数据预处理模块，对标注之后的仪器扫描图像裁剪感兴趣区域、调整像素间距得到新的数据集，用于模型的训练。采用自注意力机制实现编码器编码特征之间的非局部交互，缓解多次采样造成的信息衰退问题，得到更精确的分割目标对象的结构边界；采用稳定学习方法通过随机傅里叶特征和对样本加权的方式消除环境特征和本质特征之间的依赖关系，减少虚假相关问题，提高分割精度；采用反事实解释方法，对模型结果进行实例级别的解释，提高模型的可信度。

Description

基于自注意机制和稳定学习的淋巴瘤超声图像语义分割方法

技术领域

本发明涉及医疗图像处理领域，特别是涉及一种基于自注意机制和稳定学习的淋巴瘤超声图像语义分割方法。

背景技术

淋巴瘤是由免疫***细胞异常突变而形成的一种致命的癌症。存在许多不同的组织学亚型，其诊断通常基于取样(活检)。淋巴瘤起源于***和淋巴组织，可以发生于身体的任何部位，临床表现多样。该疾病通常以无痛性进行***肿大为特征，亦可侵犯结外器官引起相应器官的受损。主要分为霍奇金和非霍奇金淋巴瘤两类。

淋巴瘤的诊断需结合患者的临床表现、体格检查、实验室检查、影像学检查和病理学检查结果等。这些不同的方法对于诊断淋巴瘤的分期和分型起着不同的作用。影像学技术对于淋巴瘤的分期和分型起着重要作用。常用的影像检查方法包括CT、核磁共振成像(Nuclear Magnetic Resonance Imaging,MRI)、正电子发射计算机断层显像(PositionEmission Tomography-computed Tomography,PET-CT)、超声和内镜等。

由于成像技术不同，不同类型的成像方式得到的图像对淋巴瘤的诊断有着不同的效果。与其它的成像技术相比，超声检查是一种无放射性损伤的安全的检查，属于完全无损、无创性的、无辐射的检查技术。由于超声的探头能随意的放置，因此对人体检查时可以采取多种方位、多角度的断面进行检查，非常的灵活，能够对病灶进行定位测量，明确病变的位置和周围组织的关系，实时动态显示，尤其对于心脏在不同时期心脏跳动的位置，跳动的多普勒血流的改变，可以观察血流动力学的情况超声检查能够立即得到检查结果，还可以反复多次重复检查。超声波方法具有广泛的可用性(包括床边)和相对较低的成本。因此超声检查在前期诊断淋巴瘤起着重要的作用。

但是由于超声成像固有的声学特征，得到的图像噪声大、对比度低、成像质量差。需要对图像进行分割，分割是超声图像分析的关键。一般来说，这种分割是由临床医生手动执行的，这降低了诊断的客观性，耗费大量人力。即使是专家，根据他们的经验和技能进行的描述也略有不同。因此对于许多的医学图像应用程序来说，模型正确分割病灶区域是应用成功的关键。能够准确的从图像中获取感兴趣区域(ROI)的自动分割模型可以为临床医生诊断或进行病理学研究提供依据。但是现有的淋巴瘤图像分割多集中于三维正电子发射断层扫描(PET)和计算机断层扫描(CT)图像，没有对淋巴瘤图像进行分割。

发明内容

本发明所要解决的技术问题是提供一种基于自注意机制和稳定学习的淋巴瘤超声图像语义分割方法，能够在少量数据的情况下有效的对淋巴瘤超声图像进行分割。

一种基于自注意机制和稳定学习的淋巴瘤超声图像语义分割方法，包括：

获取淋巴瘤超声图像，并将图像处理作为训练样本；

构建淋巴瘤超声图像分割网络：所述淋巴瘤超声图像分割网络包括数据预处理模块、特征提取网络模块、自注意力机制模块、稳定学习模块、反事实解释模块；

数据预处理模块，用于对所有淋巴瘤超声图像样本进行裁剪与标注，将预处理后的样本作为分割网络的输入数据；

特征提取网络模块，用于提取图像的空间信息和全局信息，融合提取到的特征捕获更清晰的对象边界；

自注意力机制模块，用于实现特征之间的非局部交互，缓解多次采样造成的信息衰退问题；

稳定学习模块，用于通过随机傅里叶特征和对样本加权的方式消除环境特征和本质特征之间的依赖关系，实现泛化；

反事实解释模块，用于对模型结果进行实例级别的解释，提高模型的可信度。

优选的是，本发明数据预处理模块的运行步骤包括：

步骤S11对超声仪器扫描的超声图像进行裁剪，去除超声扫描仪器添加的额外内容；

步骤S12将裁剪后的图像上传到PLabel标注***进行自由标注，标注完成之后将在***中标注的图像交由经验丰富的医学专家进行审查和修正，将最终的标注结果导出；

步骤S13将导出的json文件读取生成真实的掩码图像；

步骤S14调整标注图像和原始图像像素间距得到分辨率为256×256的图像，并裁剪感兴趣区域图像，并调整分辨率为512×512。

优选的是，本发明特征提取网络模块运行步骤包括：

步骤S21使用编码器结构进行下采样提取低级特征，从而利用提取到的空间信息和全局信息精确分割；

步骤S22解码器通过上采样逐步恢复空间信息，融合编码器编码过程中提取到的特征来捕获更加清晰的对象边界。

优选的是，本发明自注意力机制模块的运行步骤包括：

步骤S32将编码器编码的最后一层特征输入到TSA模块，TSA模块将输入的特征图和生成的位置嵌入向量进行不同的线性变化生成query(Q)、key(K)、value(V)三个向量，用于attention的计算；

步骤S32将Q与K的转置相乘得到Q与K元素之间的相似程度，除以向量Q的维度d_k的开方保证softmax的梯度并通过softmax进行归一化，得到一个上下文注意力图A，将A与V相乘得到注意力加权的值，公式如下所示：

步骤S33将注意力机制模块得到的返回值与最后一层特征进行逐元素相加得到一个融合的特征图F用于解码器的输入。

优选的是，本发明稳定学习模块的运行步骤包括：

步骤S41将特征图输入稳定学习模块，通过随机傅里叶特征将输入的特征从低维度映射到高维度空间，消除特征之间的相关性，随机傅里叶特征公式如下所示：

h是对输入的低维度特征x进行随机傅里叶变换后得到的高维空间特征，ω是从标准正态分布中采样的随机变量，ωx表示随机变量ω与x相乘进行变换，

是从均匀分布中采样的随机变量；

步骤S42通过计算两个随机变量之间的协方差的最小值得到样本加权权重的最优值w^*，公式如下所示：

w^*＝argmin_w∈Δn∑_1≤i<j≤ncov(w_iX_i,w_jX_j)，

式子中的

n为输入的批次数，即传入的样本特征图的数目，X_i和X_j分别为样本空间中的不同样本的特征图，w_i和w_j分别为样本X_i和X_j对应的加权权重；

步骤S43深度学习使用全部样本全局地学习样本权重和特征需要巨大开销，所以需要存储和重加载样本权重，通过一个可学习的参数α_i来进行全局权重和特征的更新，权重更新公式如下所示：

X′_Gi＝α_iX_Gi+(1-α_i)X_L，

W′_Gi＝α_iW_Gi+(1-α_i)W_L，

X_Gi和X_L分别为全局样本特征和当前样本特征，W_Gi和W_L分别为全局样本权重和当前样本权重；

步骤S44将计算出的最优权重与样本的loss值相乘得到新的loss用于模型的训练，loss更新公式如下所示：

loss＝SoftDiceLoss(SR,GT).view(1,-1).mm(w^*).view(1)，

SR和GT分别为模型给出的预测值和真实值。

优选的是，本发明反事实解释模块的运行步骤包括：

步骤S51通过快速位移图像分割算法生成图像的分割片段

步骤S52通过对分割片段进行遮掩，寻找一组不可约片段使得模型的IoU评分减少最多，公式如下所示：

T(I\S)<T(I)(IoU reduce)，

其中I表示生成图像的分割片段，S表示过度分割片段，T表示分割模型；

步骤S53将这组片段映射到原图，生成对模型结果的实例级别的解释。

本发明针对淋巴瘤超声扫描图像数据，对数据进行预处理，得到两种数据集用于模型的训练，使模型获得更高的性能；本发明基于深度学习框架对淋巴瘤超声图像进行自动的语义分割，通过自注意力模块和稳定学习模块解决超声图像边界模糊以及泛化的问题，同时通过反事实解释模块对模型进行实例级别的解释，提高了模型的分割精度和可信度；自动分割无需人为因素的介入，排出了主观因素的干扰，节约大量的时间成本和人力成本，提高诊断的效率和精度。

附图说明

图1为本发明的流程框架示意图；

图2为本发明中数据预处理模块的流程示意图；数据预处理模块、、自注意力机制模块、稳定学习模块、反事实解释模块；

图3为本发明的标准数据集的样本结构示意图；

图4为本发明神经网络架构示意图；

图5为本发明中特征提取网络模块架构示意图；

图6为本发明中自注意力机制模块架构示意图；

图7为本发明中稳定学习模块架构示意图；

图8为本发明中反事实解释模块架构示意图；

图9为IOU为0.89105映射为0.84559的过程示意图；

图10为IOU为0.95403映射为0.91483的过程示意图。

具体实施方式

获取淋巴瘤超声图像，并将图像处理作为训练样本；

如图1所示，本发明的流程框架主要由数据预处理、深度神经网络以及反事实组成。首先，将患者的淋巴瘤超声图像作为原始数据集，对原始数据集进行预处理之后，得到用于神经网络训练的数据集；训练后的神经网络能够对输入的图片给出分割结果；反事实解释方法结合深度神经网络给出实例级的解释。

如图2所示，实现了基于患者淋巴瘤超声图像的预处理模块，运行步骤包括：

步骤S13将导出的json文件读取生成真实的掩码图像；

针对预处理之后的数据集，进行训练集与测试集的划分，测试集用于神经网络的训练，测试集用于评估模型的精度。结合图3，可以看到预处理后的图像，stage1的图像用于深度神经网络第一阶段的训练，用于对病灶区域进行一个粗略的定位；stage2的图像为感兴趣区域图像，用于深度神经网络第二阶段的训练，用于优化分割对象的目标边界。

如图4、图5所示，实现了基于患者淋巴瘤超声图像的特征提取网络模块，该模块通过编码器空洞卷积提取信息，通过解码器采样恢复空间信息，得到图像分割结果，运行步骤包括：

如图6所示，实现了基于患者淋巴瘤超声图像的自注意力机制模块，该模块对患者淋巴瘤图像特征添加位置嵌入，通过自注意力机制得到注意力加权的特征图，运行步骤包括：

如图7所示，实现了基于患者淋巴瘤超声图像的稳定学习模块，该模块通过对患者淋巴瘤超声图像样本特征进行随机傅里叶变换RFF和学习样本的加权去相关LSWD得到样本权重用于损失函数的更新，运行步骤包括：