CN113298065B

CN113298065B - 基于自监督学习的眼部黑色素肿瘤识别方法

Info

Publication number: CN113298065B
Application number: CN202110520891.3A
Authority: CN
Inventors: 姜子敬; 王亚奇; 王琳艳; 贾刚勇; 叶娟
Original assignee: Hangzhou Dianzi University
Current assignee: Hangzhou Dianzi University
Priority date: 2021-05-13
Filing date: 2021-05-13
Publication date: 2024-06-11
Anticipated expiration: 2041-05-13
Also published as: CN113298065A

Abstract

本发明公开了一种基于自监督学习的眼部黑色素肿瘤识别方法。包括：医疗影像数据划分，将数据划分为标注数据和未标注数据两类；将所有未标注数据输入到自监督算法网络中，通过多次迭代不断训练网络参数；提取训练得到残差网络，在该网络的基础上叠加一个特征提取网络，形成复合网络结构，通过训练，得到可用于块级眼部黑色素肿瘤识别的复合网络模型；生成每张标注数据对应的热力图,并由此整合成图像级热力图；最后，提取每张热力图的特征，将特征数据输入到随机森林中进行训练，得到可用于图像级眼部黑色素肿瘤识别的随机森林模型。本发明通过设计肿瘤特征和区域判别的网络特征映射层，使得眼部黑色素肿瘤的识别准确率有了进一步的提升。

Description

基于自监督学习的眼部黑色素肿瘤识别方法

技术领域

本发明涉及眼部医疗影像识别技术领域，具体涉及一种基于自监督学习(Self-Supervised Learning)的眼部医疗影像的黑色素肿瘤识别方法。

背景技术

医疗影像中的肿瘤识别是医疗智能化领域的主要研究内容之一。医疗影像的肿瘤识别技术将医疗影像与人工智能技术相结合，通过借助计算机来识别肿瘤区域，而非传统的依赖医学专家对医疗影像中的肿瘤区域进行标定。在本发明中，进行医疗影像肿瘤识别的执行个体是计算机。

深度学习是机器学习中一种基于对数据进行表征学习的算法，是当下人工智能领域的研究热点之一。深度学习技术的使用，提升了算法性能与工作效率，也使得人脸识别，自动驾驶以及智能翻译等技术的落地成为可能，被广泛应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域。

自监督学习算法(SSL)是一种新型的无监督学习算法，算法直接从无标签数据中自行学习数据特征，并将训练得到的模型运用于下游任务的训练当中。在图像识别领域，自监督学习算法已经取得超越传统监督学习算法的性能和效果。

基于深度学习的智能化技术需要大量标签数据用于模型的训练工作，然而，由于医学领域的特殊性，有标注的医疗影像数据仅能通过相关医学专家的手动标注实现，受制于高昂的数据标注成本以及参差不齐的数据标注质量，有效且能够用于模型训练的有标注的医疗影像数据量很小，从而使得传统深度学习方法在该领域训练效果差，鲁棒性也不好，最终导致对医疗影像中的肿瘤识别能力较弱。

发明内容

本发明主要针对传统眼部医疗影像黑色素肿瘤识别方法缺陷，提出一种基于自监督学习的眼部黑色素肿瘤识别方法。自监督学习算法充分利用大量存在的无标注数据，有效提升了数据利用率，然而，在其传统应用中，一个图像中仅有一个主体，而在医疗影像的图像识别中，一张图像中的对象个数能够达几十甚至上百个，为适应医疗影像的图像识别的特殊性，通过额外增加神经网络特征映射层，提升了整体算法在多目标下的综合判断能力，从而能够更好地对影像中的肿瘤特征和区域进行判断。无论是与传统仅使用有标注数据和残差网络的传统方法，还是跟基本自监督学习方法相比，本发明在眼部医疗影像中黑色素肿瘤的识别上都有显著的性能提升。

为实现上述目的，本发明包括以下步骤：

1)医疗影像数据划分，根据眼部医疗影像上的黑色素肿瘤区域是否经过相关医学专家标注，将数据划分为标注数据和未标注数据两类,并以滑动窗口的方法将标注数据和未标注数据切分成块级图像，对所有块级图像进行图像预处理和数据增强。

2)将步骤1)中的所有未标注数据进行输入到以残差网络为基础的自监督算法网络中，通过多次的迭代不断训练网络参数。

3)提取步骤2)中训练得到的残差网络，在该残差网络的基础上叠加一个特征提取网络，形成复合网络，并将步骤1)中的所有标注数据经预处理后输入到复合网络中，通过训练，得到可用于块级眼部黑色素肿瘤识别的复合网络。

4)使用步骤3)中训练得到的复合网络，计算每张块级标注数据中含有肿瘤的概率，生成每张标注数据对应的热力图，并由此整合成图像级热力图。

5)提取步骤4)中获得的每张热力图的特征，将特征数据输入到随机森林中进行训练，得到可用于图像级眼部黑色素肿瘤识别的随机森林模型。

6)通过使用步骤5)中训练得到的随机森林模型，实现针对眼部医疗影像上是否含有黑色素肿瘤的图像级识别。

本发明相对于现有技术所具有的效果：

本发明使用了自监督学习算法，在充分利用大量存在的未经相关医学专家标注的医疗影像数据的基础上，为适应医疗影像识别与传统图像识别的差异性，通过额外设计能够更好进行肿瘤特征和区域判别的网络特征映射层，使得计算机对眼部医疗影像数据中眼部黑色素肿瘤的识别准确率在传统仅使用标注数据的基础上有了进一步的提升，更加符合当下医学影像数据多但有标注数据稀少的实际。

本发明结合了无监督学习方法和传统深度学习方法，提出了一种新的可以用于块级以及图像级眼部黑色素肿瘤识别的整体算法流程架构。在提升眼部黑色素肿瘤识别性能的基础上，通过肿瘤区域发生概率可视化的方式，为医学专家提供了辅助诊断手段，有较大的实际意义。

附图说明

图1为本发明架构图；

图2为颜色一致性技术处理流程图；

图3为热力图生成流程图；

图4为本发明方法流程图。

具体实施方式

本发明包括以下步骤：

1)根据眼部医疗影像是否经过医学专家进行黑色素肿瘤区域标注，将数据划分为有标注数据和无标注数据，对有标注数据进行进一步的训练、验证、测试集划分，见图1。设定256×256像素的滑动窗口大小，以滑动的方式从原始医疗影像中切分出块级图像。对于每张块级图像x，首先经过包括伽马变换gamma和灰度变换g的颜色一致性处理

x′＝g(gamma(x))

，如图2所示。其次，预处理后的图像x′经过旋转、对比度变换、归一化等数据增强方式Aug

x″＝Aug(x′)

进行数据增强，得到增强后图像x″。

2)将无标注数据中的增强后图像x″输入到以残差网络为基础的自监督网络中，图像x″首先经过两个不同数据增强方法

v＝t(x″)

v′＝t′(x″)

得到两个不同的增强图像v，v′，再被输入到由主网络和副网络两个分支构成的孪生网络中，主网络和副网络分别基于增强图像v，v′进行计算，得到

再根据损失函数

计算损失值随后在反向传播过程计算梯度/>并根据梯度更新主网络权重参数θ，并以此更新副网络权重参数ξ，具体过程如下所示：

ξ←τξ+(1-τ)θ

3)在残差网络f_θ的基础上增加一个特征映射网络h_θ，以此复合网络F_θ

F_θ＝h_θ(f_θ(x))

作为训练过程的使用模型。并用步骤2)中孪生网络中主网络的残差网络参数θ作为复合网络F中残差网络f的参数初始值，其他部分网络则正常初始化。

4)将有标注数据中的增强后图像x″用于复合网络训练，根据验证结果选择出最好的模型，并在测试数据上对模型性能进行验证。在进行图像级眼部黑色素肿瘤识别时，使用训练好的复合网络对增强后图像x″进行肿瘤概率预测(0-1)，并将来自同一眼部医疗影像的数据结果进行拼接，得到图像级热力图，热力图生成流程如图3所示。

5)针对热力图设置0.9和0.5两个不同阈值，从每张图像级热力图中提取包括肿瘤区域数量特征、肿瘤区域所占比例特征在内的多种特征。基于图像级特征数据训练随机森林模型，得到可用于眼部医疗影像整体评估的机器学习模型。

6)最后，眼部医疗影像数据在通过该算法流程(如图4)后，会由训练得到的机器学习模型判断出其影像上是否含有黑色素肿瘤。

以上所述的本发明的实施方式，并不构成对本发明保护范围的限定。任何在本发明的精神原则之内所作出的修改、等同替换和改进等，均应包含在本发明的权利要求保护范围之内。

Claims

1.基于自监督学习的眼部黑色素肿瘤识别方法，其特征在于，该方法包括如下步骤：

1)医疗影像数据划分，根据眼部医疗影像上的黑色素肿瘤区域是否经过相关医学专家标注，将数据划分为标注数据和未标注数据两类,并以滑动窗口的方法将标注数据和未标注数据切分成块级图像，对所有块级图像进行图像预处理和数据增强；

2)将步骤1)中的所有未标注数据输入到以残差网络为基础的自监督算法网络中，通过多次的迭代不断训练网络参数；

3)提取步骤2)中训练得到的残差网络，在该残差网络的基础上叠加一个特征提取网络，形成复合网络，并将步骤1)中的所有标注数据输入到复合网络中，通过训练，得到用于块级眼部黑色素肿瘤识别的复合网络；

4)使用步骤3)中训练得到的复合网络，计算每张块级标注数据中含有肿瘤的概率，生成每张标注数据对应的热力图，并由此整合成图像级热力图；

5)提取步骤4)中获得的每张热力图的特征，将特征数据输入到随机森林中进行训练，得到用于图像级眼部黑色素肿瘤识别的随机森林模型；

2.根据权利要求1所述的方法，其特征在于，在步骤1)中，块级图像x，首先经过包括伽马变换gamma和灰度变换g的颜色一致性处理

x′＝g(gamma(x))

其次，预处理后的图像x′经过旋转、对比度变换、归一化的增强方式Aug进行数据增强，得到增强后图像x″

x″＝Aug(x′)。

3.根据权利要求1所述的方法，其特征在于，在步骤2)中，所使用的自监督学习算法以孪生网络框架为基础，以增强后图像x″作为网络输入，经过两种不同的图像增强方法后，得到两个不同的增强图像v，v′，

v＝t(x″)

v′＝t′(x″)

并将其分别输入到由主网络和副网络两个分支构成的孪生网络中；其中，主网络由一个残差网络f_θ和两个多层感知机g_θ,q_θ组成，分别作为主网络的表征模块y_θ＝f_θ(v)、投影模块z_θ＝g_θ(y)以及预测模块q_θ(z)，θ代表主网络参数；副网络则以一个相同结构的残差网络f_ξ和一个多层感知机g_ξ组成，分别作为副网络的表征模块y′_ξ＝f_ξ(v′)和投影模块z′_ξ＝g_ξ(y′)，ξ代表副网络参数；再分别对主网络的预测结果q_θ以及副网络的投影结果z′_ξ进行L2正则化

并由此得到孪生网络的损失函数

最后，在不断迭代中，通过计算得到的孪生网络的损失值和梯度/>来更新主网络参数θ，副网络参数ξ则基于当前主网络参数得到

ξ←τξ+(1-τ)θ

其中，η是孪生网络的学习率，τ是副网络的参数复制衰竭率。

4.根据权利要求1所述的方法，其特征在于，在步骤3)中，所构成的复合网络F_θ由残差网络f_θ和特征映射网络h_θ组成

F_θ＝h_θ(f_θ(x))

并用孪生网络中主网络的残差网络参数θ作为复合网络F中残差网络f的参数初始值。

5.根据权利要求1所述的方法，其特征在于，在步骤5)中，通过设置两个不同的阈值a₁,a₂，从图像级热力图中提取包括肿瘤区域数量特征、肿瘤区域所占比例特征在内的多种特征，用于后续基于随机森林模型的训练。