CN111951221B - 一种基于深度神经网络的肾小球细胞图像识别方法 - Google Patents

一种基于深度神经网络的肾小球细胞图像识别方法 Download PDF

Info

Publication number
CN111951221B
CN111951221B CN202010670136.9A CN202010670136A CN111951221B CN 111951221 B CN111951221 B CN 111951221B CN 202010670136 A CN202010670136 A CN 202010670136A CN 111951221 B CN111951221 B CN 111951221B
Authority
CN
China
Prior art keywords
image
neural network
layer
slice
segmentation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010670136.9A
Other languages
English (en)
Other versions
CN111951221A (zh
Inventor
邹昊
丁小强
钱琨
郭玉成
刘红
金是
王治勋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsimage Medical Technology Shenzhen Co ltd
Zhongshan Hospital Fudan University
Original Assignee
Tsimage Medical Technology Shenzhen Co ltd
Zhongshan Hospital Fudan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsimage Medical Technology Shenzhen Co ltd, Zhongshan Hospital Fudan University filed Critical Tsimage Medical Technology Shenzhen Co ltd
Priority to CN202010670136.9A priority Critical patent/CN111951221B/zh
Publication of CN111951221A publication Critical patent/CN111951221A/zh
Application granted granted Critical
Publication of CN111951221B publication Critical patent/CN111951221B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30024Cell structures in vitro; Tissue sections in vitro
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30084Kidney; Renal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30242Counting objects in image
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Quality & Reliability (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Radiology & Medical Imaging (AREA)
  • Image Analysis (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明公开了一种基于深度神经网络的肾小球细胞图像识别方法,基于人工智能与深度学习技术,获取待检测的病理图像;对病理图像进行预处理得到多个切片图像;将各个切片图像输入到预设神经网络模型中进行识别分割得到肾小球区域图;对肾小球区域图进行细胞计数;可快速精确地分割出病理图像中肾内部的肾小球的子图像,以及使用传统方法和深度学习融合模型对肾小球内部的细胞计数,解决了人工识别病理图像中肾小球工作量大效率低、高误诊率的问题;优化了病理图像中肾小球子图像分割和肾小球细胞计数算法,使用更多数据训练算法,提高了分割和计数的准确率,本发明涉及生物医学图像处理领域。

Description

一种基于深度神经网络的肾小球细胞图像识别方法
技术领域
本发明涉及生物医学图像处理、深度学习技术领域,具体涉及一种基于深度神经网络的肾小球细胞图像识别方法。
背景技术
现代医学的飞速发展促使探测方法和显示手段日趋更精确、更直观、更完善。人体医学图像含有极其丰富的人体信息,当借助于医学成像技术获得图像后,需对其进行分析、识别、分割、校准、分类和解释,针对医学图像的临床应用和需要解决的医学问题,确定哪些部分应增强或哪些特征应被提取,从而提供更为直观数据。它可以作为合理安排病人检查程序的依据,从而做到以最快的速度和最经济的手段达到最客观的诊断目的,进而帮助最优治疗方案的选择、确定和实施。因此,利用高技术手段对所取得的医学图像进行处理,是医学图像学中一项迫切需要完成的研究工作。对于降低由于人主管因素导致的误诊概率,提高医务工作者的工作效率,以及提供更为客观的诊断依据都具有重要的意义。临床上,肾脏疾病检查一般采用活检,其得出的诊断结果最为准确。活检,全称活体组织检查,是用局部切除、钳取、穿刺针吸以及骚刮、摘除等手术方法,由患者活体采取病变组织进行病理检查,以确定诊断。该方法的优点在于组织新鲜,能基本保持病变的原貌。对于临床工作而言,该检查方法有助于及时准确对疾病做出诊断和进行疗效判断。肾组织活检测,一般情况下,是由有经验的医师通过观察由肾活检得到的组织切片图像,得到肾小球的病理形态学改变及球内细胞核增生及分布情况,配合医师的临床经验进行分析后得出一系列结论,从而给出病理诊断报告。为了确保能够发现已存在的问题,医生需要对取得的肾活检组织切片做尽可能多的观察,临床上每个被检者大约有800幅图片需要被观察,从这个数字可以看出,通过肉眼观察识别目标物的工作量很大,效率低下,并且随着观察者疲劳程度的增加,误诊率也会随之上升。随着计算机技术、成像技术及图像处理技术的迅猛发展,使得对肾脏组织切片的自动分析成为可能,通过对图形进行计算机智能化处理后,可使图像诊断摒弃传统的肉眼观察和主管判断。本文提出了一种基于病理图像的肾小球分割和肾小球内细胞计数的深度学***,需要进行进一步的优化,提高肾小球分割的准确率和实现球内细胞计数。其主要有3个缺陷:1、传统的靠医师通过肉眼观察识别病理图像中的肾小球工作量很大,效率低下,并且随着观察者疲劳程度的增加,误诊率也会随之上升。2.目前已有的肾小球分割和肾小球细胞计数算法的准确率不高,需要继续优化,提高分割和计数的准确率。3.由于病理图像很大,肾小球内细胞密集,用传统单一的神经网络方法识别率低,需要在深度学习分割后通过特定后处理方法才能更好的识别。
发明内容
本发明的目的在于提出一种基于深度神经网络的肾小球细胞图像识别方法,以解决现有技术中所存在的一个或多个技术问题,至少提供一种有益的选择或创造条件。
本发明提供一种基于深度神经网络的肾小球细胞图像识别方法,利用相应的ROI提取算法提取病理图像的感兴趣区域,过滤掉病理图像的空白区域,减少了后续切图的工作量;采用多层切割或逐层聚焦的图片切割方法,模拟了医者使用显微镜观察切片的过程;在生成切片时生成多层次不同大小的切片为后续的特性提取做准备,增强学习的泛化性能;使用基于阈值的图像分割方法,如直方图双峰法图像分割、固定阈值图像分割、半阈值分割图像分割、迭代阈值图像分割、自适应阈值图像分割、最佳阈值图像分割等和FastFCN、SegNet、Unet及各种变体、RefineNet等深度神经网络细胞检测算法相结合,实现对肾小球细胞更加精确的计数。
本发明的目的是针对上述问题,提供一种基于深度神经网络的肾小球细胞图像识别方法,具体包括以下步骤:
获取待检测的病理图像;
对病理图像进行预处理得到多个切片图像;
将各个切片图像输入到识别分割神经网络模型中进行识别分割得到肾小球区域切片图;
将肾小球区域切片图输入到预设神经网络模型中进行识别肾小球内细胞及计数。
进一步地,对病理图像进行预处理得到多个切片图像的方法为:
标注并提取病理图像中的感兴趣区域:
人工以方框、圆、椭圆、不规则多边形等方式标记出病理图像需要处理的区域,称为感兴趣区域,即Region of Interest(ROI)。对于病理全视野切片(Whole Slide Image,WSI)来说,在图像内部会存在制片时产生的边缘空白区域,以及各组织之间的缝隙,利用相应的ROI提取算法可以有效减少后续处理的工作量以及工作难度。
对病理图像中的感兴趣领域内进行多层切割得到多个切片图像:
WSI病理图像的一大特点为图像像素数量极多,一般均在10^6*10^6的尺度范围。由于现今计算机的物理内存以及计算速度的限制,直接将整张WSI输入进入计算机内存中进行运算是不切实际的。因此,要针对WSI图像的该特点进行图像分割,即切图处理,将病理图像进行切图处理成多个切片图像后再进行相应的训练与预测。多层切割或逐层聚焦的图片切割方法,模拟了医者使用显微镜观察切片的过程。通常,在镜头视野不变的情况下,随着放大倍数的增大,物理视野按比例缩小,像素分辨率按比例增大。这里使用逐层聚焦的理念,在生成切片时生成多层次不同大小的切片为后续的特性提取做准备。该方法可保证深度卷积神经网络中可以良好的观察到不同尺度的纹理、颜色等图片特征,对于整块的大型病灶与细微的小病灶均可有效捕捉,以增强学习的泛化性能。
进一步地,提取病理图像中的感兴趣区域的方法包括直方图双峰法图像分割、固定阈值图像分割、半阈值分割图像分割、迭代阈值图像分割、自适应阈值图像分割、最佳阈值图像分割中任意一种。
进一步地,将各个切片图像输入到识别分割神经网络模型中进行识别分割得到肾小球区域切片图的方法为:
构建FastFCN、SegNet、U-net及各种变体、RefineNet中任意一种神经网络;
通过留出法、交叉验证法、留一法、自助法中任意一种方法将各个切片图像划分为训练集和测试集;
其中,训练集中的切片图像的预定数量可以根据神经网络的学习训练需要,调整切图大小进行选择;预定数量越多训练得到的识别分割神经网络模型的精度越高。
将训练集中的切片图像输入神经网络中进行训练得到将训练集中的切片图像输入神经网络中进行训练得到识别分割神经网络模型,将各个切片图像输入到预设神经网络模型中进行识别分割得到包含肾小球区域切片图。
优选地,所述神经网络为U-Net,所述U-Net为全卷积神经网络,是端到端的网络,即输入输出均为图像;将病理图像输入U-Net中,在收缩路径中通过卷积层后采用激活函数对病理图像进行下采样,提取该病理图像的特征图,再在扩展路径中进行上采样,并在每次上采样时添加收缩路径中得到的对应特征图,最终实现对病理图像中每个像素点的第一异常概率矩阵的提取;该模型的输入为256*256*3(256,256,3)大小的三通道图片,输出为256*256*1(256,256,1)大小的单通道图片,可根据实际情况调整图片的输入大小。
优选地,所述U-Net由编码器和解码器组成,编码器的输入为切片图像,编码器将第四层输出的963*32*32大小的特征图输出给解码器第四层,将其第一、第二以及第三层输出的特征图分别输出给解码器的第一、第二以及第三层;编码器用于提取细胞特征信息:颜色、形态、大小、位置、纹理等,由5个层级组成,每个层级包含若干个改进ResBlock,并使用下采样操作产生下一层的输入,所述神经网络中编码器输入图像为256*256*3的RGB彩色图,编码器第一层级通过1个改进的ResBlock生成256*256*67大小的第一层特征图,经1次下采样得128*128*67大小的第2层级输入,第2层级通过1个改进的ResBlock生成128*128*195大小的第二层特征图,经1次下采样得64*64*195大小的第3层输入,第三层级通过1个改进的ResBlock生成64*64*451大小的第三层特征图,经1次下采样得32*32*451大小的第4层输入,第四层级通过1个改进的ResBlock生成32*32*963大小的第四层特征图,经1次下采样得16*16*963大小的第5层输入,第五层级通过1个改进的ResBlock生成16*16*1987大小的特征图作为解码器最终的特征图,从而编码器经过逐层级的卷积、下采样操作提取出低分辨率的整幅图像的全局信息;从而能够提供细胞在整幅图像中的上下文信息,可理解为细胞与周围环境之间依赖关系的特征,这些特征有助于对细胞进行类别判断。
解码器由4个层级组成,其第二、第三以及第四层分别将特征图经上采样输出到上一层;
第四层级首先将编码器第5层级的16*16*963大小特征图通过上采样生成32*32*512大小的特征图,然后通过跳跃连接与编码器第四层级相同大小的特征图进行拼接,最后经过1个改进的ResBlock生成解码器第四层大小为32*32*1987的特征图。同理,解码器第三层、第二层级、第一层级进行同样过程,对应生产的特征图大小为64*64*963、128*128*451、256*256*195。编码器与解码器相同层级上的跳跃连接能够将编码器的精细位置信息和解码器的丰富表达的语义信息融合起来,从而为分割任务提取出表达能力更强的特征。
进一步地,本发明使用改进的U-Net深度神经网络对小图片中的肾小球及球内细胞进行分割,在传统的U-Net的基础上,通过借鉴ResNet模型的shorcut连接方式和DenseNet中以concat方式来合并特征图,即将原ResBlock最后的求和运算使用concat运算来代替,即为改进的ResBlock,从而得到本发明所使用的基本结构,这样可以很好的实现特征图的复用,提高模型的效果。该网络能够识别出肾小球的病理学特征,可精确地分割出肾小球,分割的准确率可达98.1%。
通过训练集对神经网络进行训练得到将训练集中的切片图像输入神经网络中进行训练得到预设神经网络模型;
将训练集中的切片图像输入神经网络中进行训练;
由于训练集中的切片图像还是偏大,直接将训练集中的切片图像输入神经网络中进行训练,由于计算机硬件的限制,计算机会报内存溢出错误,导致训练失败;因此在将图片输入神经网络中训练之前,将训练集中的切片图像切割成256*256*3(256,256,3)的大小,然后每8个256*256*3的图片作为一个批次输入神经网络中训练,切片图像对应的二值标注图像也会做同样的处理,切割成小图的大小和输入的批次大小,可根据计算机对应的硬件水平做调整。
进一步地,预设神经网络模型的训练过程包括以下步骤:
对病理图像中的肾小球进行标注,并将病理图像中感兴趣区域(ROI)以一定大小(例如2048*2048*3大小)进行子图重叠切割得到子图数据;
在将子图数据输入到神经网络进行训练前进行图像增强操作,图像增强操作包括沿图像矩阵的x或y轴随机翻转、按随机角度旋转、随机对比度调整,从而提高神经网络的泛化能力;
在肾小球预测模型训练完成后,通过对模型输出结果使用特定的后处理方法来进一步提高模型的预测效果,即对预测结果进行优化,得到最终预测的肾小球标注,所述后处理方法包括对预测结果的腐蚀、膨胀和筛选预测结果;根据最终预测的肾小球标,用openslide将肾小球从病理图像中分割得到包含肾小球图像的分割子图并生成分割子图对应的二值标注图像,将二值标注图像中不包含肾小球的部分作为背景标记为0,包含肾小球部分作为异常值标记为1,在细胞计数的过程中会用肾小球的二值图像去除肾小球以外区域的细胞;
进一步地,将肾小球区域切片图输入到预设神经网络模型中进行识别肾小球内细胞及计数为:
对肾小球区域切片进行细胞核标记,将标记后的二值图像将作为肾小球细胞核对应的标签;标注好肾小球中的细胞核并生成对应的二值图像后,就将分割子图作为训练数据,对应的二值图像作为标签输入改进的神经网络中进行训练。
细胞预测模型训练完成后,用训练好的神经网络对分割子图中的细胞核进行预测,预测出来的细胞核是整个分割子图中的细胞核,还包含肾小球以外区域的细胞核,此时就将对应的分割子图中肾小球的二值图像与预测出来的细胞核二值图像相乘,就将肾小球以外区域变为0,肾小球内部区域数值不变。
根据肾小球的标注将肾小球从病理图像中分割得到包含肾小球图像的分割子图并生成分割子图对应的二值图像,将二值图像中不包含肾小球的部分作为背景标记为0,包含肾小球部分标记为1;将切片图像输入到神经网络中进行训练,得预设神经网络模型。
随后通过使用形态学等后处理方法来对细胞核预测结果进行优化,解决细胞核预测结果中存在的一些噪声及粘连等问题,提高最终的预测结果。
然后就对预测得到的二值图像中的细胞核数量统计从而进行细胞计数。
本发明的有益效果为:本发明公开了一种基于深度神经网络的肾小球细胞图像识别方法,将人工智能方法与传统的后处理方法有效的结合在一起:识别肾小球及其细胞是一个较为复杂的过程,传统的图像处理方法实现上较为困难,同时深度学习模型也存在没法很好的对某个细节进行具体的修正,而传统图像处理方法可以比较好的针对具体的细节进行调整。所以本算法使用人工智能方法进行总体预测,使用传统图像处理方法进行细节调整,从而达到更好的细胞识别效果。解决了传统医师靠肉眼识别病理图像中肾小球工作量大效率低,长时间观察会出现越来越高误诊率的问题;优化了病理图像中肾小球子图像分割和肾小球细胞计数算法,使用更多数据训练算法,提高了分割和计数的准确率。
附图说明
通过对结合附图所示出的实施方式进行详细说明,本发明的上述以及其他特征将更加明显,本发明附图中相同的参考标号表示相同或相似的元素,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,在附图中:
图1所示为本发明的一种基于深度神经网络的肾小球细胞图像识别方法的流程图;
图2所示为阈值分割法前后图像对比图;
图3所示为本发明所使用的神经网络模型结构图。
具体实施方式
以下将结合实施例和附图对本发明的构思、具体结构及产生的技术效果进行清楚、完整的描述,以充分地理解本发明的目的、方案和效果。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
如图1所示为根据本发明的一种基于深度神经网络的肾小球细胞图像识别方法的流程图,下面结合图1来阐述根据本发明的实施方式的方法。
本发明提出一种基于深度神经网络的肾小球细胞图像识别方法,具体包括以下步骤:
获取待检测的病理图像;
对病理图像进行预处理得到多个切片图像;
将各个切片图像输入到识别分割神经网络模型中进行识别分割得到肾小球区域切片图;
将肾小球区域切片图输入到预设神经网络模型中进行识别肾小球内细胞及计数。
进一步地,对病理图像进行预处理得到多个切片图像的方法为:
标注并提取病理图像中的感兴趣区域:
在机器视觉、图像处理问题中,从被处理的图像以方框、圆、椭圆、不规则多边形等方式勾勒出需要处理的区域,称为感兴趣区域,即Region of Interest(ROI)。对于病理全视野切片/病理图像(Whole Slide Image,WSI)来说,在图像内部会存在制片时产生的边缘空白区域,以及各组织之间的缝隙,利用相应的ROI提取算法可以有效减少后续处理的工作量以及工作难度。
对病理图像中的感兴趣领域内进行多层切割得到多个切片图像:
病理图像(WSI)的一大特点为图像像素数量极多,一般均在10^6*10^6的尺度范围。由于现今计算机的物理内存以及计算速度的限制,直接将整张WSI输入进入计算机内存中进行运算是不切实际的。因此,要针对WSI图像的该特点进行图像分割,即切图处理,将病理图像进行切图处理成多个切片图像后再进行相应的训练与预测。多层切割或逐层聚焦的图片切割方法,模拟了医者使用显微镜观察切片的过程。通常,在镜头视野不变的情况下,随着放大倍数的增大,物理视野按比例缩小,像素分辨率按比例增大。这里使用逐层聚焦的理念,在生成切片时生成多层次不同大小的切片为后续的特性提取做准备。该方法可保证深度卷积神经网络中可以良好的观察到不同尺度的纹理、颜色等图片特征,对于整块的大型病灶与细微的小病灶均可有效捕捉,以增强学习的泛化性能。
进一步地,提取病理图像中的感兴趣区域的方法包括直方图双峰法图像分割、固定阈值图像分割、半阈值分割图像分割、迭代阈值图像分割、自适应阈值图像分割、最佳阈值图像分割中任意一种。
如图2所示为阈值分割法前后图像对比图,使用基于阈值的图像分割方法,如直方图双峰法图像分割、固定阈值图像分割、半阈值分割图像分割、迭代阈值图像分割、自适应阈值图像分割、最佳阈值图像分割等。该方法使用到了聚类的思想,把图像的灰度数按灰度级分成2个部分,使得两个部分之间的灰度值差异最大。本发明将该处理方法应用在WSI图中ROI的提取当中,以便于减少后续的计算量。
进一步地,将各个切片图像输入到识别分割神经网络模型中进行识别分割得到肾小球区域切片图的方法为:
构建FastFCN、SegNet、U-net及各种变体、RefineNet中任意一种神经网络;
通过留出法、交叉验证法、留一法、自助法中任意一种方法将各个切片图像划分为训练集和测试集;
通过训练集对神经网络进行训练得到将训练集中的切片图像输入神经网络中进行训练得到预设神经网络模型的方法为:将训练集中的切片图像输入神经网络中进行训练得到将训练集中的切片图像输入神经网络中进行训练得到预设神经网络模型。
其中,训练集中的切片图像的预定数量可以根据神经网络的学习训练需要,通过改变切片大小进行选择;预定数量越多训练得到的预设神经网络模型的精度越高。
优选地,所述神经网络为U-Net,所述U-Net为全卷积神经网络,是端到端的网络,即输入输出均为图像;将病理图像输入U-Net中,在收缩路径中通过卷积层后采用激活函数对病理图像进行下采样,提取该病理图像的特征图,再在扩展路径中进行上采样,并在每次上采样时添加收缩路径中得到的对应特征图,最终实现对病理图像中每个像素点的第一异常概率矩阵的提取;该模型的输入为256*256*3(256,256,3)大小的三通道图片,输出为256*256*1(256,256,1)大小的单通道图片,可根据实际情况调整图片的输入大小。
如图3所示为本发明所使用的神经网络模型结构图,神经网络模型结构U-Net由编码器和解码器组成,编码器的输入为切片图像,编码器将第四层输出的963*32*32大小的特征图输出给解码器第四层,将其第一、第二以及第三层输出的特征图分别输出给解码器的第一、第二以及第三层;编码器用于提取细胞特征信息:颜色、形态、大小、位置、纹理等,由5个层级组成,每个层级包含若干个改进ResBlock,并使用下采样操作产生下一层的输入,所述神经网络中编码器输入图像为256*256*3的RGB彩色图,编码器第一层级通过1个改进的ResBlock生成256*256*67大小的第一层特征图,经1次下采样得128*128*67大小的第2层级输入,第2层级通过1个改进的ResBlock生成128*128*195大小的第二层特征图,经1次下采样得64*64*195大小的第3层输入,第三层级通过1个改进的ResBlock生成64*64*451大小的第三层特征图,经1次下采样得32*32*451大小的第4层输入,第四层级通过1个改进的ResBlock生成32*32*963大小的第四层特征图,经1次下采样得16*16*963大小的第5层输入,第五层级通过1个改进的ResBlock生成16*16*1987大小的特征图作为解码器最终的特征图,从而编码器经过逐层级的卷积、下采样操作提取出低分辨率的整幅图像的全局信息;从而能够提供细胞在整幅图像中的上下文信息,可理解为细胞与周围环境之间依赖关系的特征,这些特征有助于对细胞进行类别判断。
解码器由4个层级组成,其第二、第三以及第四层分别将特征图经上采样输出到上一层;
第四层级首先将编码器第5层级的16*16*963大小特征图通过上采样生成32*32*512大小的特征图,然后通过跳跃连接与编码器第四层级相同大小的特征图进行拼接,最后经过1个改进的ResBlock生成解码器第四层大小为32*32*1987的特征图。同理,解码器第三层、第二层级、第一层级进行同样过程,对应生产的特征图大小为64*64*963、128*128*451、256*256*195。编码器与解码器相同层级上的跳跃连接能够将编码器的精细位置信息和解码器的丰富表达的语义信息融合起来,从而为分割任务提取出表达能力更强的特征。
进一步地,本发明使用改进的U-net神经网络对小图片中的细胞进行分割,该网络能够识别出肾小球的病理学特征,可精确地分割出肾小球细胞。
通过训练集对神经网络进行训练得到将训练集中的切片图像输入神经网络中进行训练得到预设神经网络模型;
将训练集中的切片图像输入神经网络中进行训练;
由于训练集中的切片图像还是偏大,直接将训练集中的切片图像输入神经网络中进行训练,由于计算机硬件的限制,计算机会报内存溢出错误,导致训练失败;因此在将图片输入神经网络中训练之前,将训练集中的切片图像切割成256*256*3的大小,然后每8个256*256*3的图片作为一个批次输入神经网络中训练,切片图像对应的二值图像也会做同样的处理,切割成小图的大小和输入的批次大小,可根据计算机对应的硬件水平做调整。
在肾小球预测模型训练完成后,通过对模型输出结果使用特定的后处理方法(包括但不限于对预测结果的腐蚀、膨胀以及预测结果的筛选)来进一步提高模型的预测效果,即对预测结果进行优化,得到最终预测的肾小球标注。
进一步地,将肾小球区域切片图输入到预设神经网络模型中进行识别肾小球内细胞及计数过程为:
根据肾小球的标注用openslide将肾小球从WSI中切出来,保存为jpg格式,并生成肾小球对应的肾小球二值标注图片,二值标注图片中不包含肾小球的部分即背景设为0,包含肾小球部分即异常值设为1,在细胞计数的过程中会用肾小球的二值标注图像来去除肾小球以外区域的细胞核。
训练肾小球内细胞预测模型:
对肾小球切片中的细胞核进行标注,标注好肾小球中的细胞核并生成对应的细胞核二值标注图后,就将肾小球切片作为训练数据,对应的细胞核二值标注数据作为标签输入改进的U-Net模型中进行训练,模型的结果合肾小球预测模型相同,不同之处在于此处将输入改为128*128*3,输出改为128*128*1。
在将图片输入到模型训练时,考虑到分割算法在图片边缘预测效果不佳,则在将图片输入模型训练之前,将肾小球切片图片再切割成更小的大小,以便后续预测时可进行重叠切割和预测。
训练好神经网络后,通过预设神经网络模型对切片图像中的细胞核进行预测,预测得到的是肾小球切片图像中的细胞核,还包含肾小球以外区域的细胞核,此时就将与肾小球切片图对应的二值标注图像与预测得到的细胞核二值标注图像相乘,从而将肾小球以外区域变为0,肾小球内部区域数值不变。
随后通过使用形态学等后处理方法来对细胞核预测结果进行优化,解决细胞核预测结果中存在的一些噪声及粘连等问题,提高最终的预测结果。然后对预测得到的二值图像中的细胞核数量统计从而进行细胞计数。
本发明的方法将人工智能方法与传统的后处理方法有效的结合在一起:识别肾小球及其细胞是一个较为复杂的过程,传统的图像处理方法实现上较为困难,同时深度学习模型也存在没法很好的对某个细节进行具体的修正,而传统图像处理方法可以比较好的针对具体的细节进行调整。所以本算法使用人工智能方法进行总体预测,使用传统图像处理方法进行细节调整,从而达到更好的细胞识别效果。
进一步地,在对一张肾病理WSI图进行预测诊断时,算法流程可以概括为:WSI感兴趣区域切图;通过肾小球预测模型来预测肾小球区域;传统方法修正预测结果,并将肾小球区域切出;通过细胞预测模型来预测肾小球区域内的细胞;传统方法修正预测结果,并统计出当前肾小球区域内的细胞个数。
U-Net为一种全卷积神经网络,是一个端到端的网络,即输入输出均为图像。将病理图像输入U-Net分割模型,在收缩路径中通过卷积层后采用激活函数对病理图像进行下采样,提取该病理图像的特征图,再在扩展路径中进行上采样,并在每次上采样时添加收缩路径中得到的对应特征图,最终实现对病理图像中每个像素点的第一异常概率矩阵的提取。
该模型的输入为(256,256,3)的三通道图片,输出为(256,256,1)的单通道图片,可根据实际情况调整图片的输入大小。
为了保证细胞计数的准确性,还使用深度神经网络细胞检测算法,该算法经过大量的训练,可快速地检测出肾小球内部所有细胞。最后将两种方法所得到的结果综合,得到精确的细胞个数。
尽管本公开的描述已经相当详尽且特别对几个所述实施例进行了描述,但其并非旨在局限于任何这些细节或实施例或任何特殊实施例,从而有效地涵盖本公开的预定范围。此外,上文以发明人可预见的实施例对本公开进行描述,其目的是为了提供有用的描述,而那些目前尚未预见的对本公开的非实质性改动仍可代表本公开的等效改动。

Claims (3)

1.一种基于深度神经网络的肾小球细胞图像识别方法,其特征在于,所述方法包括以下步骤:
获取待检测的病理图像;
对病理图像进行预处理得到多个切片图像;
将各个切片图像输入到识别分割神经网络模型中进行识别分割得到肾小球区域切片图;
将肾小球区域切片图输入到预设神经网络模型中进行识别肾小球内细胞及计数;
将肾小球区域切片图输入到预设神经网络模型中进行识别肾小球内细胞及计数的方法为:
对肾小球区域切片图内的细胞核区域进行标记,将细胞核区域标记后的二值图像将作为肾小球细胞核对应的标签;
标注好肾小球区域切片图中的细胞核区域并生成对应的二值图像后,将分割子图作为训练数据,将对应的二值图像作为标签输入神经网络中进行训练;
神经网络训练完成后,用训练好的神经网络对分割子图中的细胞核进行预测,预测得到的细胞核区域是整个分割子图中的细胞核,还包含肾小球以外区域的细胞核,此时将对应的分割子图中肾小球的二值图像与预测出来的细胞核二值图像相乘,使肾小球以外区域变为0,肾小球内部区域数值不变;
通过后处理方法对预测结果进行优化,得到最终预测的细胞核标注,所述后处理方法包括对预测结果的腐蚀、阈值筛选预测结果;最后对预测得到的二值图像中的细胞核数量统计从而进行细胞计数;
所述神经网络为U-Net,所述U-Net为全卷积神经网络,是端到端的网络,即输入输出均为图像;
所述U-Net由编码器和解码器组成,编码器的输入为切片图像,编码器将第四层输出的特征图输出给解码器,并将其第一、第二以及第三层输出的特征图分别输出给解码器的第一、第二以及第三层;编码器用于提取细胞特征信息:颜色、形态、大小、位置、纹理,由5个层级组成,每个层级包含若干个改进的ResBlock及下采样操作,所述神经网络中编码器第1层级通过1个改进的ResBlock生成第一层的特征图,经1次下采样得第2层级输入,第2层级通过1个改进的ResBlock生成第二层的特征图,经1次下采样得第3层输入,第三层级通过1个改进的ResBlock生成第三层的特征图,经1次下采样得第4层输入,第四层级通过1个改进的ResBlock生成第四层的特征图,经1次下采样得第5层的输入,第五层级通过1个改进的ResBlock生成解码器最终的特征图,从而编码器经过逐层级的卷积、下采样操作提取出低分辨率的整幅图像的全局信息;所述解码器由4个层级组成,第四层级首先将编码器第5层级的特征图通过上采样生成特征图,然后通过跳跃连接与编码器第四层级相同大小的特征图进行拼接,最后经过1个改进的ResBlock生成解码器第四层特征图;同理,解码器第3层、第2层级、第1层级进行同样过程;
所述改进的ResBlock为将原ResBlock中最后的求和运算使用concat运算来代替得到。
2.根据权利要求1所述的一种基于深度神经网络的肾小球细胞图像识别方法,其特征在于,将各个切片图像输入到识别分割神经网络模型中进行识别分割得到肾小球区域切片图的方法为:
其中,识别分割神经网络模型的获得过程为:
构建FastFCN、SegNet、U-net及各种变体、RefineNet中任意一种神经网络;
通过留出法、交叉验证法、留一法、自助法中任意一种方法将各个切片图像划分为训练集和测试集;
将训练集中的切片图像输入神经网络中进行训练得到将训练集中的切片图像输入神经网络中进行训练得到识别分割神经网络模型,将各个切片图像输入到识别分割神经网络模型中进行识别分割得到包含肾小球区域切片图。
3.根据权利要求1所述的一种基于深度神经网络的肾小球细胞图像识别方法,其特征在于,所述预设神经网络模型的训练过程包括以下步骤:
对病理图像中的肾小球进行标注,并将病理图像中感兴趣区域以进行子图重叠切割得到子图数据;
在将子图数据输入到神经网络进行训练前进行图像增强操作,图像增强操作包括沿图像矩阵的x或y轴随机翻转、按随机角度旋转、随机对比度调整;
根据肾小球的标注将肾小球从病理图像中分割得到包含肾小球图像的分割子图并生成分割子图对应的二值图像,将二值图像中不包含肾小球的部分作为背景标记为0,包含肾小球部分标记为1;将切片图像输入到神经网络中进行训练,得预设神经网络模型。
CN202010670136.9A 2020-07-13 2020-07-13 一种基于深度神经网络的肾小球细胞图像识别方法 Active CN111951221B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010670136.9A CN111951221B (zh) 2020-07-13 2020-07-13 一种基于深度神经网络的肾小球细胞图像识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010670136.9A CN111951221B (zh) 2020-07-13 2020-07-13 一种基于深度神经网络的肾小球细胞图像识别方法

Publications (2)

Publication Number Publication Date
CN111951221A CN111951221A (zh) 2020-11-17
CN111951221B true CN111951221B (zh) 2023-10-31

Family

ID=73341298

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010670136.9A Active CN111951221B (zh) 2020-07-13 2020-07-13 一种基于深度神经网络的肾小球细胞图像识别方法

Country Status (1)

Country Link
CN (1) CN111951221B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112233112B (zh) * 2020-12-07 2021-06-01 深圳大学 一种基于深度学习分析的肝细胞癌的ck19的预测方法
CN112562855B (zh) * 2020-12-18 2021-11-02 深圳大学 一种肝细胞癌术后早期复发风险预测方法、介质及终端设备
CN114387201B (zh) * 2021-04-08 2023-01-17 透彻影像科技(南京)有限公司 一种基于深度学习和强化学习细胞病理图像辅助诊断***
CN113192077B (zh) * 2021-04-15 2022-08-02 华中科技大学 一种细胞及区域层次的病理图自动分类方法及***
CN113222944B (zh) * 2021-05-18 2022-10-14 湖南医药学院 细胞核分割方法及基于病理图像的癌症辅助分析***、装置
CN113256577B (zh) * 2021-05-18 2022-06-28 湖南医药学院 基于he染色病理图像的癌症辅助分析***、装置
CN113362294B (zh) * 2021-05-27 2022-09-02 同济大学 含穿刺针超声血管图像的穿刺针识别方法、***和设备
CN113591919B (zh) * 2021-06-29 2023-07-21 复旦大学附属中山医院 基于ai对早期肝细胞癌术后复发预后的分析方法及***
CN113409293A (zh) * 2021-06-30 2021-09-17 上海市第一人民医院 一种基于深度学习的病理学图像自动分割***
CN114219807B (zh) * 2022-02-22 2022-07-12 成都爱迦飞诗特科技有限公司 乳腺超声检查图像分级方法、装置、设备和存储介质
CN114943723B (zh) * 2022-06-08 2024-05-28 北京大学口腔医学院 一种对不规则细胞进行分割计数的方法及相关设备

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019135939A (ja) * 2018-02-07 2019-08-22 澁谷工業株式会社 細胞カウント方法および細胞カウント装置ならびに細胞培養方法
CN110151181A (zh) * 2019-04-16 2019-08-23 杭州电子科技大学 基于递归残差u型网络的快速磁共振成像方法
CN110427970A (zh) * 2019-07-05 2019-11-08 平安科技(深圳)有限公司 图像分类方法、装置、计算机设备和存储介质
CN110490840A (zh) * 2019-07-11 2019-11-22 平安科技(深圳)有限公司 一种肾小球病理切片图像的细胞检测方法、装置及设备
CN111080575A (zh) * 2019-11-22 2020-04-28 东南大学 一种基于残差密集u形网络模型的丘脑分割方法
WO2020093042A1 (en) * 2018-11-02 2020-05-07 Deep Lens, Inc. Neural networks for biomedical image analysis
CN111275191A (zh) * 2020-02-26 2020-06-12 上海商汤智能科技有限公司 检测细胞的方法及装置、电子设备和存储介质
CN111340711A (zh) * 2020-05-21 2020-06-26 腾讯科技(深圳)有限公司 一种超分辨率重建方法、装置、设备和存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11132529B2 (en) * 2016-11-16 2021-09-28 Ventana Medical Systems, Inc. Convolutional neural networks for locating objects of interest in images of biological samples
US10789451B2 (en) * 2017-11-16 2020-09-29 Global Life Sciences Solutions Usa Llc System and method for single channel whole cell segmentation
CN108734211B (zh) * 2018-05-17 2019-12-24 腾讯科技(深圳)有限公司 图像处理的方法和装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019135939A (ja) * 2018-02-07 2019-08-22 澁谷工業株式会社 細胞カウント方法および細胞カウント装置ならびに細胞培養方法
WO2020093042A1 (en) * 2018-11-02 2020-05-07 Deep Lens, Inc. Neural networks for biomedical image analysis
CN110151181A (zh) * 2019-04-16 2019-08-23 杭州电子科技大学 基于递归残差u型网络的快速磁共振成像方法
CN110427970A (zh) * 2019-07-05 2019-11-08 平安科技(深圳)有限公司 图像分类方法、装置、计算机设备和存储介质
CN110490840A (zh) * 2019-07-11 2019-11-22 平安科技(深圳)有限公司 一种肾小球病理切片图像的细胞检测方法、装置及设备
CN111080575A (zh) * 2019-11-22 2020-04-28 东南大学 一种基于残差密集u形网络模型的丘脑分割方法
CN111275191A (zh) * 2020-02-26 2020-06-12 上海商汤智能科技有限公司 检测细胞的方法及装置、电子设备和存储介质
CN111340711A (zh) * 2020-05-21 2020-06-26 腾讯科技(深圳)有限公司 一种超分辨率重建方法、装置、设备和存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Glomerulosclerosis identification in whole slide images using semantic segmentation;Gloria Bueno 等;《Computer Methods and Programs in Biomedicine》;第184卷(第105273期);1-10 *
应用化肝脏病灶分割的预测方案;裘静韬 等;《计算机工程与应用》;第56卷(第20期);173-178 *

Also Published As

Publication number Publication date
CN111951221A (zh) 2020-11-17

Similar Documents

Publication Publication Date Title
CN111951221B (zh) 一种基于深度神经网络的肾小球细胞图像识别方法
CN109272492B (zh) 一种细胞病理涂片的处理方法及***
CN110599448B (zh) 基于MaskScoring R-CNN网络的迁移学习肺部病变组织检测***
CN111985536B (zh) 一种基于弱监督学习的胃镜病理图像分类方法
CN106056595B (zh) 基于深度卷积神经网络自动识别甲状腺结节良恶性的辅助诊断***
Pogorelov et al. Deep learning and hand-crafted feature based approaches for polyp detection in medical videos
CN109636808B (zh) 一种基于全卷积神经网络的肺叶分割方法
CN110974306B (zh) 一种超声内镜下识别和定位胰腺神经内分泌肿瘤的***
CN112132166B (zh) 一种数字细胞病理图像智能分析方法、***及装置
Pan et al. Mitosis detection techniques in H&E stained breast cancer pathological images: A comprehensive review
CN110736747B (zh) 一种细胞液基涂片镜下定位的方法及***
CN111340827A (zh) 一种肺部ct影像数据处理分析方法及***
CN112085113B (zh) 一种重症肿瘤影像识别***及方法
CN111415728A (zh) 基于cnn和gan的ct图像数据自动分类方法及设备
CN111476794B (zh) 一种基于unet的宫颈病理组织分割方法
EP4118617A1 (en) Automated detection of tumors based on image processing
CN112215217B (zh) 模拟医师阅片的数字图像识别方法及装置
CN104318565B (zh) 基于等梯度距离的双向区域增长的视网膜血管分割交互式方法
CN115546605A (zh) 一种基于图像标注和分割模型的训练方法及装置
CN112102332A (zh) 基于局部分类神经网络的癌症wsi的分割方法
CN112837325A (zh) 医学影像图像处理方法、装置、电子设备及介质
Kromp et al. Deep Learning architectures for generalized immunofluorescence based nuclear image segmentation
CN116883341A (zh) 一种基于深度学习的肝脏肿瘤ct图像自动分割方法
CN115206495A (zh) 基于CoAtNet深度学习的肾癌病理图像分析方法、***及智能显微装置
CN112990367A (zh) 一种图像处理方法、装置、设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant