CN115206495A

CN115206495A - 基于CoAtNet深度学习的肾癌病理图像分析方法、***及智能显微装置

Info

Publication number: CN115206495A
Application number: CN202210671552.XA
Authority: CN
Inventors: 许迎科; 于佳辉
Original assignee: Binjiang Research Institute Of Zhejiang University; Zhejiang University ZJU
Current assignee: Binjiang Research Institute Of Zhejiang University; Zhejiang University ZJU
Priority date: 2022-06-15
Filing date: 2022-06-15
Publication date: 2022-10-18

Abstract

本发明公开了一基于CoAtNet深度学习的肾癌病理图像分析方法、***及智能显微装置，包括肾癌病理数据采集、图像切片、背景过滤、数据增强、肾癌区域检测、肾癌亚型分类、肾癌分级和肾癌预后分析。本发明通过人工智能技术与显微镜的结合，可用于辅助病理科医生完成端到端的肾癌诊断，对肾癌病理图像的分析模型能同时满足识别率高、实时性强、功能齐全的目的，有助于缓解我国病理科人才紧缺、培养周期长的问题；有利于减少病理医生的误判机率、疲劳程度。

Description

基于CoAtNet深度学习的肾癌病理图像分析方法、***及智能显微装置

技术领域

本发明属于数字化病理图像处理与辅助诊断技术领域，具体为一基于CoAtNet深度学习的肾癌病理图像分析方法、***及智能显微装置。

背景技术

据统计，在人体肾脏恶性肿瘤疾病中，肾细胞癌占据了85％左右，也是多年来最常见的癌症之一。按照病理类型分，肾细胞癌可分为透明肾细胞癌(KIRC)、***状肾细胞癌(KIRP)、嫌色细胞性肾细胞癌(KICH)以及其他特殊类型。其中KIRC、KIRP和KICH三种亚型约占肾癌分型的90％。目前，对肾癌的诊断及分析大多是依靠经验丰富的病理科医生通过观察病理图像进行的。病理图像是指从患者身上取下来的，经过染色、显微成像后形成的标本图，是医学领域中诊断及分析的重要依据之一。病理报告被称为疾病诊断的“金标准”。根据病理图像，医生可以判断疾病的类型、预后的状况，并采取针对性治疗手段。

近年来，人工智能在病理图像的分析和应用中取得了许多令人满意的成果。中国专利CN113420793A公开了一种基于改进的卷积神经网络ResNet50的胃印戒细胞癌分类方法，包括数据预处理：用于胃细胞癌图像的选择、标注、切片和训练数据的划分；训练和比较模型：用于根据实际数据改进ResNet50并训练网络参数，并与最新研究成果比较；特征图制作和分类器训练：用于将图像生成特征明显的热力图，选择重要特征图来训练分类器；图像分类：用于验证模型的性能，输出分类的指标。

中国专利CN110007455B公开了一种病理显微镜、显示模组、控制方法、装置及存储介质，属于显微镜拍摄成像领域。病理显微镜包括：显微镜本体、图像采集组件、控制组件和增强现实AR投影组件。本申请通过病理显微镜得到AI分析信息，再通过AR投影组件将AI分析信息投影至显微镜本体的显微镜视野中，达到了医生能够在显微镜视野中同时观察到病理切片图像和AI分析信息，不需要来回切换视野，使观察过程更为直接，从而实现病理显微镜在使用过程中的高实时性。但是该显微镜对肾癌病理分析的针对性不强，不能完成肾癌病理的全方位分析。

中国专利CN113222933A公开了一种应用于肾细胞癌的全链条诊断的图像识别***，包括图像切分模块，图像切分模块将经过癌症区域、癌症亚型以及癌症等级的标注后，对包含癌症基因组图谱TCGA和当地医院所提供的LH数据集的原病理图像进行切分，然后输入图像癌症区域检测模块对图像进行训练及预测，图像癌症区域检测模块处理后的图像由准确性提升模块进行准确度提升后，得到更为准确的癌症区域预测热力图，将预测为癌症的区域进行标记送至癌症区域分型模块进一步分型，得到癌症的细分亚型，分型后由报告输出模块输出图像识别结果报告。但是该识别***不能达到方便性和快速性的需求，没有预后分析的功能。分级的训练集使用的是医生标注数据，而不同医生对分级的判断标准不一致，会导致模型误差较大。

中国专利CN112992336A公开了一种病理智能诊断***，集成深度学习和实时AI功能，以弥合AI算法与传统显微镜工作流程之间的差距，达到对病理切片的智能诊断；同时，针对两种应用开发并评估深度学习算法，以评估在实际临床工作流程中以及与其他显微镜模型一起使用的影响。本***将使AI无缝集成到显微镜工作流程中，并使得病理学进行癌症诊断以及对其他疾病的生物样本进行显微镜检查更加高效，准确且智能化；提供在智能诊断过程中的图像标注诊断结果并且输出文字性诊断报告，不仅提高处理病理诊断的速度，同时有效减少病理专家的工作量。但是该发明不能将人工智能算法的结论实时显示在病理医生观察的目镜视野中；不包含检测、分型、分级、预后等功能。

发明内容

针对目前还没有一套可以辅助病理科医生完成端到端的肾癌组织分析的***，本发明是一种基于深度学习的肾癌病理图像分析的智能显微***。该***通过人工智能技术与显微镜的结合，可用于辅助病理科医生完成端到端的肾癌诊断。

为实现上述目的，本发明提供的技术方案是：

一种基于CoAtNet深度学习的肾癌病理图像分析方法，其特征在于，其包括以下步骤：

S1、采集临床确诊的病变组织的肾癌病理图像，肾癌病理图像按比例随机划分为训练集和测试集；

S2、将所有肾癌病理图像处理成固定分辨率的若干切片图；

S3、通过像素阈值法过滤图像背景，保留前景；

S4、对切片图进行数据增强处理；

S5、将训练集数据通过S2和S3处理后的切片图，随机裁剪后通过S4处理，输入基于CoAtNet深度学习算法的检测模型中训练，检测模型在训练时学习癌症与非癌症特征，生成用于检测肾癌区域的预训练模型，将测试集通过S2和S3处理后，输入预训练模型中测试得到带肾癌区域检测标记的切片图，将带肾癌区域检测标记的切片图拼接形成完整的带肾癌区域检测标记的肾癌病理图像，记录带有癌症区域标记的测试数据，作为分类模型的待输入数据；

S6、将训练集数据通过S2、S3和S4处理后,输入基于CoAtNet的分类模型中进行训练和优化，分类模型以亚型的名称为标签学习三种不同亚型的特征，选取和保存最佳的分类模型，将S5中的待输入数据输入到保存的分类模型，输出肾癌的具体亚型信息；

S7、将S5中检测得到的肾癌区域作为训练数据，输入到基于CoAtNet的聚类模型中，聚类模型根据学习到的特征将图像聚为4个类别，分别对应Ⅰ到Ⅳ级细胞癌，生成的最终模型用来判断患者癌症所属的级数。

S8、根据检测的肾癌病理图像数据分析肾癌患者生存概率与时间关系。

优选地，S1中，所述的肾癌病理图像按照7：3的比例随机划分为训练集和测试集，肾癌病理图像中的癌症区域数据由经验丰富的病理科医生进行精准标注，训练集用于训练和优化模型，测试集用于测试模型性能。

优选地，S2中，通过滑动窗口的方法对肾癌病理图像进行切片，其具体步骤为：

S21、将肾癌病理图像放大20倍；

S22、以从左到右、从上到下的顺序，用512*512像素大小的窗口在图像上滑动切片；

S23、滑动切片时，每个窗口与上一个窗口重叠50％的区域。

优选地，S3中过滤图像背景的具体步骤为：

S31、像素映射：将图像切片处理后的子图按照R、G、B三通道进行像素映射，每个通道中像素值大于像素阈值230的点被映射为1，小于230的点被映射为0；

S32、背景判断：若图像切片的三个通道中，每个通道映射后的总像素值均大于所有像素点映射为1时的60％，则视为背景过滤，反之视为细胞保存到指定的位置。

优选地，S4中切片图数据增强的具体步骤包括：

S41、水平翻转，

S42、随机旋转45度，

S43、添加高斯噪声。

优选地，S5中通过使用Openslide库函数，根据命名及切片规则将所有切片图重新拼接，形成标记好的完整的肾癌病理图像。

优选地，S6中分类模型使用的CoAtNet，先使用ImageNet数据集训练网络的参数直至收敛，并保存参数，再将CoAtNet最后的全连接层改为3，以实现肾癌的三种亚型分类，其余网络层使用在ImaeNet上预训练的参数来初始化；训练模型时，初始学习率＝0.00001，并随着训练的次数以5倍的速度减小，批量大小＝64，使用Adam优化器，用交叉熵作为损失函数；7、测试时，批量大小＝1。

优选地，S8中具体步骤包括

S81、训练集数据通过S2、S3和S4处理后作为输入数据输入基于CoAtNet和COX的预后分析模型训练和优化，预后分析模型以患者的生存时间为标签；

S82、使用CoAtNet全局池化层前的7x7的特征图作为患者的病理特征，取每张特征图通道上的平均值作为特征向量，作为COX模型的输入；

S83、将特征向量输入到COX模型，预测患者的预后风险中值，形成生存曲线。

一种基于CoAtNet深度学习的肾癌病理图像分析***，其包括：

数据读取模块：通过嵌入在智能显微镜物镜附件的装置读取肾癌病理图像信息；

图像切片模块：用于对读取的肾癌病理图像进行切片处理得到切片图；

背景过滤模块：用于对切片图进行背景过滤保留细胞前景图；

数据增强模块：用于对切片图进行数据增强；

肾癌区域检测模块：用于检测和分割肾癌病理图像的癌症及非癌症区域；

肾癌亚型分类模块：用于识别输入肾癌病理图像的亚型信息；

肾癌分级模块：用于预测肾癌亚型细胞的所述危害等级阶段；

肾癌预后分析模块：用于预测患者的生存概率随时间的变化关系。

一种基于CoAtNet深度学习的肾癌病理图像分析的智能显微装置，其特征在于，包括智能显微镜，所述的智能显微镜包含所述的基于CoAtNet深度学习的肾癌病理图像分析***。

本发明的有益效果：

(1)本发明是一种端到端的智能显微***，通过人工智能算法与显微镜的结合，病理医生可以在智能显微镜的目镜视野中实时看到细胞的诊断结果，简洁快速地完成从观察到输出病理报告的全过程，而不需要在不同的设备间循环操作；

(2)本发明中人工智能算法使用先进的基于CoAtNet的深度学习模型，泛化能力强，能够适应不同医院采集的肾癌病理图像；且模型结构简洁，能够达到实时诊断的目的；

(3)本发明功能全面，基本涵盖了对肾癌患者诊断时所需的所有项目：肾癌区域检测分割、亚型识别、肿瘤细胞分级、肾癌预后分析、输出诊断病理报告；

(4)本发明缓解病理医生人才紧缺、培养周期长的问题，也有利于减少病理医生的误判机率和疲劳程度。

附图说明

图1为本发明的整体流程图；

图2为标注好癌症区域的病理示例图；

图3为图像切片处理示意图；

图4为背景过滤处理示意图；

图5为某肾癌患者的预后分析示意曲线图

图6为本发明的智能显微***观察某位肾癌患者的病理图像时的画面示例图；

图7为本发明***结构图。

具体实施方式

为进一步了解本发明的内容，结合实施例对本发明作详细描述，以下实施例用于说明本发明，但不用来限制本发明的范围。

实施例1

如图1所示，本实施例涉及一种基于CoAtNet深度学习的肾癌病理图像分析方法，其特征在于，其包括以下步骤：

数据读取100：通过嵌入在智能显微镜物镜附件的装置读取载玻片中的肾癌病理图像信息，作为模型训练和测试的输入。

肾癌病理数据集101由本地医院采集而来，使用苏木精—伊红染色法染色102后形成用于训练和测试的数字病理图像。数据共330张，其中透明型肾细胞(KIRC)260张、***状肾细胞(KIRP)和嫌色细胞性肾细胞癌(KICH)各35张，按照7:3的比例随机划分为训练集和测试集。其中训练集用于训练和优化模型，测试集用于测试模型。所有数据由经验丰富的病理科医生进行精准标注，图2是某张标注好癌症区域的病理图示例。

图像切片107：使用滑动窗口的方法进行肾癌病理图像的切片，肾癌病理图像被处理成固定分辨率的若干切片图。如图3的流程图所示，其步骤为：a1、将每张肾癌病理图像放大20倍；b1、以从左到右、从上到下的顺序，用512×512像素大小的窗口在图像上滑动切片；c1、为了增加切片的数量和丰富图像的视图，滑动切片时，每个窗口与上一个窗口重叠50％的区域。

背景过滤108：使用像素阈值法过滤图像背景和保留前景。如图4所示。其步骤为：a2、像素映射：将图像切片107处理后的子图按照R(纯红色)、G(纯绿色)、B(纯蓝色)三通道进行像素映射，每个通道中像素值大于像素阈值230的点被映射为1(纯色)，小于230的点被映射为0(黑色)；b2、背景判断：若切片的三个通道中，每个通道映射后的总像素值均大于所有像素点映射为1时的60％(称为“过滤阈值”)，则视为背景过滤，反之视为细胞保存到指定的位置。对数据进行处理后，每张肾癌病理图像大约形成2000张最终切片图。完成切片的数据作为后续模型训练和测试的输入。

数据增强109：为了增加模型的泛化性能，切片图使用以下方法做数据增强，其步骤为：a3、水平翻转；b3、随机旋转45度；c3、添加高斯噪声。

肾癌区域检测110：用于检测分割肾癌病理图像的癌症及非癌症区域，以便显示在显微镜的目镜视野中供病理医生参考。其步骤为：a4、使用107和108所述的方法对训练数据进行切片，生成的切片作为输入来训练和优化检测模型。检测模型使用基于CoAtNet的深度学习算法。模型在训练时会学习癌症与非癌症特征，之后生成可以检测肾癌区域的预训练模型；b4、测试数据经过100读取，使用107和108所述的方法进行切片，送入步骤a4生成的检测模型，输出带有检测标记的切片图，最后使用Openslide库函数，根据命名及切片规则将所有切片图重新拼接，形成标记好的完整的肾癌病理图像。基于该步骤，病理医生可以在智能显微镜的目镜视野中104观察到分割好癌症区域的完整肾癌病理图像；c4、带有癌症区域标记的测试数据被记录，作为分类模型的待输入数据。

CoAtNet的检测模型采用一种新型的CoAtNet+UNet的网络结构，具体是：用CoAtNet全局池化层前的模块替换Unet网络的下采样部分，用于对输入的切片图像进行特征提取，生成7x7大小的特征图；然后，将下采样提取的特征按照Unet的连接方式融合到上采样部分，输出图片和输入有相同尺寸的带有检测标记的切片图。模型的输入是原始切片图，标签的标注好的癌组织区域轮廓的切片图。模型通过学习正常组织和癌症组织的特征来最终确定轮廓的位置。

肾癌亚型分类111：用于自动识别输入图像的亚型信息，以便显示在显微镜的目镜视野中供病理医生参考。其步骤为：a5、训练数据经过107、108的步骤，生成训练用的切片图；b5、将所有切片图随机裁剪为224*224的大小，送入109中做数据增强处理。数据增强步骤扩充了数据量，并使得模型的泛化性能和迁移能力更好；c5、步骤b5的数据输入到基于CoAtNet的分类器进行模型的训练和优化。模型以亚型的名称为标签学习三种不同亚型的特征，选取和保存效果最佳的分类模型；d5、测试图像经过肾癌区域检测模型得到的癌症切片，输入到保存的分类模型，输出肾癌的具体亚型信息，并显示在显微镜目镜中104。

需要描述的是：分类模型使用的CoAtNet，先使用ImageNet数据集训练网络的参数直至收敛，并保存参数。根据本发明的分类任务，将CoAtNet最后的全连接层改为3，以实现肾癌的三种亚型分类，其余网络层使用在ImaeNet上预训练的参数来初始化。训练模型时，初始学习率＝0.00001，并随着训练的次数以5倍的速度减小，批量大小＝64，使用Adam优化器，用交叉熵作为损失函数。这种设置避免了模型过拟合和欠拟合，并能够以最快的速度学习到每种亚型的特征。测试时，批量大小＝1，不使用数据增强。

肾癌分级112：用于预测肾癌亚型细胞属于Ⅰ至Ⅳ级的哪一阶段。级数越高，预后越差，即Ⅰ级的危害最小，Ⅳ级的危险性最高。将经过检测模型110筛选的癌症区域作为训练数据，输入到聚类类别为4的基于CoAtNet的聚类模型中，模型根据学习到的特征将图像聚为4个类别，分别对应Ⅰ到Ⅳ级细胞癌。生成的最终模型用来判断患者癌症所属的级数。

肾癌预后分析113：用于预测患者的生存概率随时间的变化关系。预后分析模型使用基于CoAtNet和COX模型的形式。其中CoAtNet用于提取细胞特征，COX用于预测风险中值。其步骤为：a6、病理图像经过107、108和109的步骤，生成训练数据，作为模型的输入数据，模型以患者的生存时间为标签；b6、使用CoAtNet全局池化层前的7x7的特征图作为患者的病理特征，取每张特征图通道上的平均值作为特征向量，作为COX模型的输入；c6、将特征向量输入到COX模型，预测患者的预后风险中值，形成生存曲线；d6、在病理报告中打印患者在将来某个时间t的生存概率曲线，图5是某肾癌患者的预后分析示意曲线。两条曲线分别是训练好的模型根据患者的病理特征，预测出患者在预后情况较好时(上)和较差时(下)的生存概率与时间的关系。

分析报告打印105：采用CellProfiler的医学分析开源平台对上述模型输出的数据进行可视化，在目镜中实时显示人工智能算法106的分析结果，通过语音输入诊断建议，打印为肾癌病理报告。图6是病理医生利用本发明的智能显微***观察某位肾癌患者的病理图像时，在目镜中看到的画面示例。

实施例2

如图7所示，本实施例涉及一种基于CoAtNet深度学习的肾癌病理图像分析***，其包括：

数据增强模块：用于对切片图进行数据增强；

上述虽然对本发明的具体实施例作了详细说明，但是本发明并不限于上述实施例，在本领域普通技术人员所具备的知识范围内，还可以在不脱离本发明宗旨的前提下做出各种变化，而不具备创造性劳动的修改或变形仍在本发明的保护范围以内。

Claims

1.一种基于CoAtNet深度学习的肾癌病理图像分析方法，其特征在于，其包括以下步骤：

S2、将所有肾癌病理图像处理成固定分辨率的若干切片图；

S3、通过像素阈值法过滤图像背景，保留前景；

S4、对切片图进行数据增强处理；

2.根据权利要求1所述的基于CoAtNet深度学习的肾癌病理图像分析方法，其特征在于，S1中，所述的肾癌病理图像按照7：3的比例随机划分为训练集和测试集，肾癌病理图像中的癌症区域数据由经验丰富的病理科医生进行精准标注，训练集用于训练和优化模型，测试集用于测试模型性能。

3.根据权利要求1所述的基于CoAtNet深度学习的肾癌病理图像分析方法，其特征在于，S2中，通过滑动窗口的方法对肾癌病理图像进行切片，其具体步骤为：

S21、将肾癌病理图像放大20倍；

S23、滑动切片时，每个窗口与上一个窗口重叠50％的区域。

4.根据权利要求1所述的基于CoAtNet深度学习的肾癌病理图像分析方法，其特征在于，S3中过滤图像背景的具体步骤为：

5.根据权利要求1所述的基于CoAtNet深度学习的肾癌病理图像分析方法，其特征在于，S4中切片图数据增强的具体步骤包括：

S41、水平翻转，

S42、随机旋转45度，

S43、添加高斯噪声。

6.根据权利要求1所述的基于CoAtNet深度学习的肾癌病理图像分析方法，其特征在于，S5中通过使用Openslide库函数，根据命名及切片规则将所有切片图重新拼接，形成标记好的完整的肾癌病理图像。

7.根据权利要求1所述的基于CoAtNet深度学习的肾癌病理图像分析方法，其特征在于，S6中分类模型使用的CoAtNet，先使用ImageNet数据集训练网络的参数直至收敛，并保存参数，再将CoAtNet最后的全连接层改为3，以实现肾癌的三种亚型分类，其余网络层使用在ImaeNet上预训练的参数来初始化；训练模型时，初始学习率＝0.00001，并随着训练的次数以5倍的速度减小，批量大小＝64，使用Adam优化器，用交叉熵作为损失函数；7、测试时，批量大小＝1。

8.根据权利要求1所述的基于CoAtNet深度学习的肾癌病理图像分析方法，其特征在于，S8中具体步骤包括

9.一种基于CoAtNet深度学习的肾癌病理图像分析***，用于权利要求1-9中任一所述的方法，其特征在于，其包括：

数据增强模块：用于对切片图进行数据增强；

10.一种基于CoAtNet深度学习的肾癌病理图像分析的智能显微装置，其特征在于，包括智能显微镜，所述的智能显微镜包含权利要求9所述的基于CoAtNet深度学习的肾癌病理图像分析***。