CN112906796B

CN112906796B - 一种针对不确定性标记数据的医学图像分类方法

Info

Publication number: CN112906796B
Application number: CN202110203910.XA
Authority: CN
Inventors: 夏勇; 廖泽慧; 谢雨彤
Original assignee: Northwestern Polytechnical University; Shenzhen Institute of Northwestern Polytechnical University
Current assignee: Northwestern Polytechnical University; Shenzhen Institute of Northwestern Polytechnical University
Priority date: 2021-02-23
Filing date: 2021-02-23
Publication date: 2022-11-29
Anticipated expiration: 2041-02-23
Also published as: CN112906796A

Abstract

本发明公开了一种针对不确定性标记数据的医学图像分类方法，展示了一种针对不确定标记数据训练的深度学习模型；对于多个医生标注且标注结果一致的确定标记数据直接用分类网络来提取类别特征信息；对于有多个医生标注且标注不完全相同的不一致标记数据，利用不一致标记数据及其互补标签训练反事实网络，然后构建反注意力机制模块辅助确定分类网络的学习；对于仅有一个医生标注的单标记数据，首先利用单标记数据来训练弱分类网络，然后构建一致性注意力机制模块辅助确定分类网络的学习。本发明中能从不一致标记数据中学习到确定的类别反事实信息，并且能将从单标记数据中学得的信息中有效部分增强、噪声部分减弱，达到较好的分类效果。

Description

一种针对不确定性标记数据的医学图像分类方法

技术领域

本发明属于医学图像处理技术领域，具体涉及一种医学图像分类方法。

背景技术

近年来，基于深度卷积神经网络(deep convolutional neural networks,DCNNs)的方法在计算机视觉，尤其是图像分类任务上取得了巨大的成功。发表于会议《2019IEEE/CVF International Conference on Computer Vision(ICCV)》中的论文《Learning WithUnsure Data for Medical Image Diagnosis》提出了一种有序回归模型完成医学影像的分类，并在两个医学影像分类任务上验证了模型的有效性。由于给不同图像标注的医生个数不同且医生的经验理解不同，得到的医学图像数据分为三类：由多个医生标注且标注一致的确定标记数据；由多个医生标注且标注不完全相同的不一致标记数据；仅由一个医生标注的可信度不如确定标记数据的单标记数据。该方法将不一致标记数据候选标签的平均值作为真实标签，并同等对待单标记数据和确定标记数据。然而不一致标记数据标签的均值并不一定代表真实类别，单标记数据的标签只有一个医生的标注也不能保证完全准确，这样使用不确定标记数据会给分类器的学习带来偏差，并不能使网络有效地学习到不确定标记数据中的特征信息。

在医学图像分类任务中，确定标记数据很难收集，而不确定标记数据相对容易获取，且数量更多。深度学习技术依赖于准确的数据标签，所以使用不确定标记数据有效地训练深度神经网络仍然是一个具有挑战性的问题。

虽然深度学习模型能有效地从确定标记数据中学习到正确的分类信息，然而不确定标记数据中也含有大量的特征信息，用传统的深度学习模型很难正确地利用这些信息。

发明内容

为了克服现有技术的不足，本发明提供了一种针对不确定性标记数据的医学图像分类方法。该方法展示了一种针对不确定标记数据训练的深度学习模型。其中确定标记数据是由多个医生标注且标注结果一致，这部分数据具有唯一确定的正向类别标签，因此本发明直接用分类网络来提取确定标记数据中的类别特征信息，简称确定分类网络。而对于具有多个医生标注且标注不完全相同的不一致标记数据，它的正向类别标签的不确定性很大，所以无法给出确定的正向类别标签来训练分类网络，但是多个医生都未标注的类别标签，也就是代表其一定不属于的类别的互补标签，是确定的信息。为此本发明利用不一致标记数据及其互补标签训练反事实网络，然后构建反注意力机制模块将学习到的确定的反事实信息辅助确定分类网络的学习。最后，对于仅有一个医生标注的单标记数据，该类数据标签的置信度虽然低于确定标记数据，但也包含了一部分有效的类别特征，为了挖掘该部分数据中的有效类别特征信息，本发明首先利用单标记数据来训练弱分类网络，然后构建一致性注意力机制模块增强有用信息减弱噪声信息，进而辅助确定分类网络的学习，达到较好的分类效果。

本发明解决其技术问题所采用的技术方案包括以下步骤：

步骤1：基于确定标记数据、不一致标记数据以及单标记数据训练的医学图像分类模型包括三个子网络模块和两个注意力网络；

三个子网络模块均为能够实现分类功能的卷积神经网络且三个网络结构完全相同；三个子网络模块的名称分别为确定分类网络、反事实网络和弱分类网络；

两个注意力网络的名称分别为反注意力机制网络和一致性注意力机制网络；反注意力机制网络包括Q个反注意力机制模块；一致性注意力机制网络包括Q个一致性注意力机制模块；

步骤2：训练确定分类网络；

使用确定标记数据及其类别标签训练确定分类网络，确定分类网络输出确定标记数据样本所属类别；训练确定分类网络使用的损失函数为多分类交叉熵损失函数：

其中，Loss_C代表确定分类网络的损失，m₁是确定标记数据类别数目，y′_i是输入数据的真实标签，y_i是输入数据属于类别i的预测结果；

步骤3：训练反事实网络；

使用不一致标记数据及其互补标签训练反事实网络，从确定的互补标签中学习到不一致标记数据确定不属于类别的信息；训练反事实网络使用的损失函数为预测结果与互补标签中每个类别的交叉熵损失的均值：

其中，Loss_CF代表反事实网络的损失，m₂是互补标签类别数目，

是输入不一致标记数据的互补标签；若

则i是该不一致标记数据可能属于的类别之一，若

则i是该不一致标记数据一定不属于的类别；

是反事实网络的预测值；

步骤4：训练弱分类网络；

使用单标记数据及其类别标签训练弱分类网络；弱分类网络训练使用的损失函数为弱分类网络预测结果与类别标签的多分类交叉熵损失：

其中，Loss_W代表弱分类网络的损失，m₃是单标记数据类别数目，

是输入单标记数据真实的标签，

是弱分类网络的输入单标记数据属于类别i的预测结果；

步骤5：构建反注意力机制模块；

反注意力机制网络的每一个反注意力机制模块分别与确定分类网络和反事实网络的倒数第1个学习块到倒数第Q个学习块对应；第n个反注意力机制模块的输入是确定分类网络第n个学习块的特征

和反事实网络第n个学习块的特征

第n个反注意力机制模块的输出

如下定义：

其中sigmoid将特征

的值规范到(0,1)，n∈[1,2,…,Q]；

步骤6：构建一致性注意力机制模块

一致性注意力机制网络的每一个一致性注意力机制模块分别与确定分类网络和弱分类网络的倒数第1个学习块到倒数第Q个学习块对应；第n个一致性注意力机制模块输入是确定分类网络第n个学习块的特征

和弱分类网络第n个学习块的特征

第n个一致性注意力机制模块的输出

如下定义：

其中abs代表取绝对值，sigmoid将特征

的值规范到(0,1)；

步骤7：

和

进行向量求和作为确定分类网络第n+1个学习块的输入；

步骤8：联合微调医学图像分类模型；

使用确定标记数据及其类别标签和互补标签联合微调医学图像分类模型，输入一个样本进入模型的三个子网络模块共得到三个输出，分别为确定分类网络输出的正向类别预测结果、反事实网络输出的互补类别预测结果以及弱分类网络输出的低置信度正向类别预测结果；医学图像分类模型的损失函数由三部分构成，定义如下：

Loss＝Loss_C+μ*Loss_CF+δ*Loss_W (6)

训练医学图像分类模型通过使损失函数Loss最小化，并且优化权重μ和δ，得到最优的分类模型。

本发明的有益效果如下：

现有的图像分类方法并没有把不一致标记数据、单标记数据和确定标记数据区分开来，所以不可避免地会给分类器的训练带来偏差。本发明中提出的根据不一致标记数据和单标记数据的特性设计的深度神经网络模型，能从不一致标记数据中学习到确定的类别反事实信息，并且能将从单标记数据中学得的信息中有效部分增强、噪声部分减弱，达到较好的分类效果，从而使得分类网络的训练和优化朝着正确的方向进行。

附图说明

图1是本发明的模型结构示意图。

图2是本发明模型中反注意力机制模块的结构图。

图3是本发明模型中一致性注意力机制模块的结构图。

具体实施方式

下面结合附图和实施例对本发明进一步说明。

为了更好地挖掘不确定标记数据中的有效信息，本发明提出了一种针对不确定性标记数据的医学图像分类方法，如图1所示，包括以下步骤：

三个子网络模块均为能够实现分类功能的卷积神经网络且三个网络结构完全相同；三个子网络模块的名称分别为确定分类网络、反事实网络和弱分类网络；图1中左边的子网络为弱分类网络，中间的子网络为确定分类网络，右边的子网络为反事实网络；

步骤2：训练确定分类网络；

步骤3：训练反事实网络；

使用不一致标记数据及其互补标签训练反事实网络，从确定的互补标签中学习到不一致标记数据确定不属于类别的信息，该信息在联合训练中可以用来辅助确定分类网络的学习；训练反事实网络使用的损失函数为预测结果与互补标签中每个类别的交叉熵损失的均值：

是输入不一致标记数据的互补标签；若

则i是该不一致标记数据可能属于的类别之一，若

则i是该不一致标记数据一定不属于的类别；

是反事实网络的预测值；

步骤4：训练弱分类网络；

是输入单标记数据真实的标签，

是弱分类网络的输入单标记数据属于类别i的预测结果；

步骤5：构建反注意力机制模块；

由于反事实网络学得的信息是不一致标记数据类别信息的反事实，所以使用反注意力机制模块将反事实信息取反，用来辅助确定分类网络的学习；如图2所示，反注意力机制网络的每一个反注意力机制模块分别与确定分类网络和反事实网络的倒数第1个学习块到倒数第Q个学习块对应；第n个反注意力机制模块的输入是确定分类网络第n个学习块的特征

和反事实网络第n个学习块的特征

第n个反注意力机制模块的输出

如下定义：

其中sigmoid将特征

的值规范到(0,1)，n∈[1,2,…,Q]；通过对特征

进行取反的操作，将反事实网络学到的确定不属于信息转化为属于，然后作用于特征

增加了有用信息的传递同时弱化了干扰信息；生成的新特征

实现反事实网络对确定分类网络的辅助；

步骤6：构建一致性注意力机制模块；

弱分类网络学得的信息中不仅包含有用的信息还有噪声，所以使用一致性注意力机制模块放大弱分类网络中与确定分类网络特征信息较为一致的有用部分，减弱相差较大的噪声部分；如图3所示，一致性注意力机制网络的每一个一致性注意力机制模块分别与确定分类网络和弱分类网络的倒数第1个学习块到倒数第Q个学习块对应；第n个一致性注意力机制模块输入是确定分类网络第n个学习块的特征

和弱分类网络第n个学习块的特征

第n个一致性注意力机制模块的输出

如下定义：

其中abs代表取绝对值，sigmoid将特征

的值规范到(0,1)；先对特征

和特征

进行规范化，后取两者差值的绝对值；弱分类网络生成的特征可信度不如确定分类网络高，但并非一无是处，弱分类网络生成的特征与确定分类网络生成的特征接近的部分更为可信，相差较大的地方可信度较低，所以取两者差值的绝对值可以突出两者之间差异较大的部分，用1减去插值的绝对值则就突出了较为一致的部分，以此作为注意力来辅助确定分类网络的特征计算；生成的新特征

实现弱分类网络对确定分类网络的辅助；

步骤7：

和

进行向量求和作为确定分类网络第n+1个学习块的输入；

步骤8：联合微调医学图像分类模型；

loss＝Loss_C+μ*Loss_CF+δ*Loss_W (6)