CN110378313B - 细胞团识别方法、装置及电子设备 - Google Patents

细胞团识别方法、装置及电子设备 Download PDF

Info

Publication number
CN110378313B
CN110378313B CN201910683872.5A CN201910683872A CN110378313B CN 110378313 B CN110378313 B CN 110378313B CN 201910683872 A CN201910683872 A CN 201910683872A CN 110378313 B CN110378313 B CN 110378313B
Authority
CN
China
Prior art keywords
image
cell
gray
scanning
cell mass
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910683872.5A
Other languages
English (en)
Other versions
CN110378313A (zh
Inventor
孙明建
常江龙
郎彬
周超
马威
吴云松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiuyisanluling Medical Technology Nanjing Co ltd
Original Assignee
Jiuyisanluling Medical Technology Nanjing Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiuyisanluling Medical Technology Nanjing Co ltd filed Critical Jiuyisanluling Medical Technology Nanjing Co ltd
Priority to CN201910683872.5A priority Critical patent/CN110378313B/zh
Publication of CN110378313A publication Critical patent/CN110378313A/zh
Application granted granted Critical
Publication of CN110378313B publication Critical patent/CN110378313B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/69Microscopic objects, e.g. biological cells or cellular parts
    • G06V20/698Matching; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10056Microscopic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20024Filtering details
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30024Cell structures in vitro; Tissue sections in vitro

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Quality & Reliability (AREA)
  • Evolutionary Biology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Medical Informatics (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Radiology & Medical Imaging (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本申请提供一种细胞团识别方法、装置及电子设备,该细胞团识别方法包括:获取待测宫颈液基细胞在不同扫描倍率下得到的扫描图像;基于扫描图像得到第一灰度图像、第二灰度图像,第一灰度图像所对应的扫描倍率为第一倍率,第二灰度图像所对应的扫描倍率为第二倍率;基于第一灰度图像得到目标二值化阈值;根据目标二值化阈值对第二灰度图像进行处理,得到目标二值图像;根据目标二值图像以及第一灰度图像确定候选区域;根据候选区域对扫描图像中最高扫描倍率的图像进行识别,得到细胞团识别结果。以此能够改善现有技术中难以对细胞团进行快速识别的问题。

Description

细胞团识别方法、装置及电子设备
技术领域
本申请涉及医学细胞图像处理领域,具体而言,涉及一种细胞团识别方法、装置及电子设备。
背景技术
随着医疗事业的快速发展,越来越多的人投身到宫颈细胞学研究中。但是,实际上大多数的研究都是针对单个细胞的,而对细胞团的分析较少。
对于宫颈液基细胞图像中的细胞团,各种细胞团的成因复杂,有部分细胞团是真实细胞团,还有部分是由于对原始数据的不当处理导致的虚假细胞团。由于细胞团的成因复杂,现有技术难以对细胞团进行快速识别。
发明内容
本申请实施例的目的在于提供一种细胞团识别方法、装置及电子设备,以此改善现有技术中难以对宫颈液基细胞中各类细胞团进行快速识别的缺陷。
第一方面,本申请实施例提供一种细胞团识别方法,该方法包括:
获取待测宫颈液基细胞在不同扫描倍率下得到的扫描图像;
基于所述扫描图像得到第一灰度图像、第二灰度图像,所述第一灰度图像所对应的扫描倍率为第一倍率,所述第二灰度图像所对应的扫描倍率为第二倍率;
基于所述第一灰度图像得到目标二值化阈值;
根据所述目标二值化阈值对所述第二灰度图像进行处理,得到目标二值图像;
根据所述目标二值图像以及所述第一灰度图像确定候选区域;
根据所述候选区域对所述扫描图像中最高扫描倍率的图像进行识别,得到细胞团识别结果。
通过上述方法能够基于第一扫描倍率下得到的目标二值化阈值对第二扫描倍率下的图像进行处理,得到以0、1进行区域划分的目标二值图像。然后结合两种扫描倍率下的图像进一步得到关于待测宫颈液基细胞的候选区域,最后基于候选区域进行细胞团的识别。在进入识别阶段之前,仅需根据图像的颜色以及细胞分布情况就可以确定出可靠性较高的候选区域,降低了识别难度,提高了整个识别流程的处理效率。
结合第一方面,在一种可能的设计中,所述基于扫描图像得到第一灰度图像,包括:
识别所述扫描图像中在第一倍率下的图像的杂质区域;对识别出的每个杂质区域的图像进行直方图统计,得到每个杂质区域对应的灰度值;根据多个杂质区域的所有灰度值中的中位数,对多个杂质区域的灰度值进行处理,得到第一灰度图像。
通过上述实现方式,能够对删除杂质区域,降低杂质区域对后续目标二值化阈值的计算过程造成影响,提升目标二值化阈值的数据准确性。
结合第一方面,在一种可能的设计中,所述识别所述扫描图像中在第一倍率下的图像的杂质区域的步骤,包括:
对所述扫描图像中在第一倍率下的图像进行灰度化,得到第一灰度化数据;根据设定的第一阈值对所述第一灰度化数据进行二值化处理,得到第一二值化图像;利用设定的像素阈值对所述第一二值化图像进行筛选,得到杂质区域。
通过上述实现方式,能够对从第一倍率的图像中筛选出杂质区域。
结合第一方面,在一种可能的设计中,所述基于所述第一灰度图像得到目标二值化阈值的步骤,包括:
根据所述扫描图像中第三倍率下的图像计算所述待测宫颈液基细胞的细胞占比,以及根据所述扫描图像中第三倍率下的图像计算所述待测宫颈液基细胞的细胞密度;根据所述细胞密度、所述细胞占比以及所述第一灰度图像,计算目标二值化阈值。
通过上述实现方式,充分考虑到细胞核颜色与周围素质的颜色差异,并以此基于细胞密度、细胞占比、第一灰度图像计算出的目标二值化阈值较为准确,有利于提升候选区域的可靠性。
结合第一方面,在一种可能的设计中,所述根据所述扫描图像中第三倍率下的图像计算所述待测宫颈液基细胞的细胞密度的步骤,包括:
根据扫描图像中第三倍率下的图像得到第三灰度图像,所述第三倍率低于所述第一倍率和所述第二倍率;根据所述第三灰度图像得到第二二值化图像;通过当前的检测规则检测所述第二二值化图像的包络边界;当检测到所述第二二值化图像的包络边界,则更新得到当前的细胞密度,跳转至通过当前的检测规则检测所述第二二值化图像的包络边界的步骤继续执行;当未检测到所述第二二值化图像的包络边界,则将当前的细胞密度作为所述第二二值化图像对应的细胞密度。
通过上述实现方式,能够基于扫描倍率较低的图像反映出细胞的整体分布特性,进而确定出用于参与目标二值化阈值的计算过程的细胞密度。
结合第一方面,在一种可能的设计中,所述根据所述目标二值化阈值对所述第二灰度图像进行处理,得到目标二值图像的步骤,包括:
基于所述待测宫颈液基细胞的细胞密度对所述第二灰度图像进行一级过滤处理,得到初步过滤图像;根据所述目标二值化阈值对所述初步过滤图像进行二值化处理,得到目标二值图像。
通过上述实现方式,能够在尽可能保留较多可疑细胞团区域的情况下通过一级过滤处理降低噪声带来的干扰,还能够得到去除了非成团区域的二值图像,以此能够降低识别难度,从而提升识别效率。
结合第一方面,在一种可能的设计中,所述细胞团识别结果包括多个细胞团类别;
所述多个细胞团类别包括:背景、腺细胞团、鳞状上皮细胞团、中性粒聚集、鳞状上皮细胞重叠、模糊非细胞团、模糊细胞团。
以此能够对同一切片中的真、假细胞团进行区分,还能够确定出多种具体的细胞团类型。
结合第一方面,在一种可能的设计中,所述根据所述候选区域对所述扫描图像中最高扫描倍率的图像进行识别,得到细胞团识别结果的步骤,包括:
将与所述候选区域对应的扫描图像中最高扫描倍率的图像数据集,输入神经网络中的多级卷积层,得到部分卷积层对应的第一卷积结果;将所述第一卷积结果送入神经网络中的多级反卷积层,得到第二卷积结果;根据所述第一卷积结果、所述第二卷积结果确定置信值组;根据所述置信值组中的各个置信值确定细胞团识别结果。
通过上述实现方式,能够利用神经网络进行快速识别,通过第一卷积结果、第二卷积结果确定出的置信值组充分融合了多级卷积层的浅层特征以及多级反卷积层的深层特征,可以更加准确地对被测对象进行识别。
第二方面,本申请实施例提供了一种细胞团识别装置,所述装置包括:
扫描图像获取模块,用于获取待测宫颈液基细胞在不同扫描倍率下得到的扫描图像;
预处理模块,用于基于所述扫描图像得到第一灰度图像、第二灰度图像,所述第一灰度图像所对应的扫描倍率为第一倍率,所述第二灰度图像所对应的扫描倍率为第二倍率;
阈值计算模块,用于基于所述第一灰度图像得到目标二值化阈值;
过滤模块,用于根据所述目标二值化阈值对所述第二灰度图像进行处理,得到目标二值图像;
候选区域确定模块,用于根据所述目标二值图像以及所述第一灰度图像确定候选区域;
识别模块,用于根据所述候选区域对所述扫描图像中最高扫描倍率的图像进行识别,得到细胞团识别结果。
通过上述细胞团识别装置,能够执行前述第一方面提供的细胞团识别方法,可以根据确定出的候选区域降低识别难度,提升识别效率。
第三方面,本申请实施例提供一种电子设备,所述电子设备包括:处理器、存储器,所述存储器存储有所述处理器可执行的机器可读指令,当所述电子设备运行时,所述机器可读指令被所述处理器执行时执行前述第一方面所述方法的步骤。
第四方面,本申请实施例提供一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如前述第一方面所述的方法中的步骤。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的一种电子设备的结构框图。
图2为本申请实施例提供的一种细胞团识别方法的流程图。
图3为本申请实施例提供的一种细胞团识别方法中步骤S2的部分流程图。
图4为本申请实施例提供的三种扫描图像的示意图。
图5为本申请实施例提供的一种细胞团识别方法中步骤S3的流程图。
图6为本申请实施例提供的一种神经网络的示意图。
图7为本申请实施例提供的一种细胞团识别装置的功能模块示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。
发明人经过研究发现,在宫颈液基细胞学领域,鉴于各种细胞团的成因复杂,难以快速地从掺杂了虚假细胞团或掺杂了其他杂质的宫颈液基细胞图像中识别出真实的细胞团及其类型。
而若是先分割出宫颈腺细胞集群,再对分割出的细胞集群进行传统的特征提取、特征映射、特征提炼融合,操作难度大,且在分割、提取过程中容易将一部分真实细胞团遗漏。
发明人通过对大量宫颈液基细胞学图像进行统计观察,发现真实细胞团中的细胞核颜色通常比周围素质的颜色深,素质表示细胞核以外的区域。因此,基于这一理论提出了以下实施例以改善现有技术中难以对宫颈液基细胞中的细胞团进行快速识别的问题。
如图1所示,是本申请实施例提供的一种电子设备100的结构框图。该电子设备100可用于执行本申请实施例中的细胞团识别方法,该电子设备100包括处理器101、存储器102、通信接口103、显示单元104、总线105等。处理器101、存储器102、通信接口103、显示单元104相互之间直接或间接地通过总线105电性连接,以实现数据的传输或交互。处理器101用于执行存储器102中存储的可执行模块,例如计算机程序。
其中,上述的处理器101可能是一种集成电路芯片,具有信号处理能力。处理器101可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器、专用集成电路、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。处理器101可以实现或执行本申请实施例中公开的各方法、步骤及逻辑框图。本申请实施例揭示的过程定义的电子设备100所执行的方法可应用于处理器101中,或由处理器101实现。
存储器102可以是但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-Only Memory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。存储器102用于存储程序,例如可用于存储细胞团识别装置200。细胞团识别装置200包括至少一个可以软件或固件(firmware)的形式存储与存储器102中或固化在电子设备100的操作***(operating system,OS)中的软件功能模块。处理器101在接收到执行指令后执行存储器102中存储的程序,以实现细胞团识别方法。处理器101及其他可能的组件对存储器102的访问在存储控制器的控制下进行。
总线105可以是ISA(Industry Standard Architecture)总线、PCI(PeripheralComponent Interconnect)总线或EISA(Extended Industry Standard Architecture)总线等。图1中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
电子设备100通过至少一个通信接口103实现与外部的其它设备之间的有线或无线通信连接。例如,电子设备100可通过通信接口103接收扫描设备的扫描数据或者接收其他外部设备发送的图像数据,例如接收扫描仪发送的扫描数据以得到扫描图像。
显示单元104用于显示图像数据给用户参考,显示的内容可以是处理器101的一些处理结果。显示单元104可以是液晶显示器或触控显示器。
本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对电子设备100的结构造成限定。电子设备100还可以比图1中所示更多或更少的组件,或具有与图1所示不同的配置。图1中所示的各组件可采用硬件、软件或其组合实现。
与本申请实施例中,电子设备100可以是服务器、个人计算机、移动设备等具有运算处理能力的设备。
请参阅图2,图2为本申请实施例提供的应用于图1所示的电子设备100的细胞团识别方法的流程图。下面将对图2所示的具体流程进行详细阐述。
该细胞团识别方法包括候选区域提取阶段、识别阶段。在候选区域提取阶段确定候选区域后,可以进入识别阶段以对根据候选区域映射得到的图像数据进行识别,得到细胞团识别结果。
如图2所示,该细胞团识别方法包括步骤:S1-S6。
S1:获取待测宫颈液基细胞在不同扫描倍率下得到的扫描图像。
S2:基于扫描图像得到第一灰度图像、第二灰度图像,第一灰度图像所对应的扫描倍率为第一倍率,第二灰度图像所对应的扫描倍率为第二倍率。
S3:基于第一灰度图像得到目标二值化阈值。
S4:根据目标二值化阈值对第二灰度图像进行处理,得到目标二值图像。
S5:根据目标二值图像以及第一灰度图像确定候选区域。
S6:根据候选区域对扫描图像中最高扫描倍率的图像进行识别,得到细胞团识别结果。
其中,S1-S5为候选区域提取阶段,S6为识别阶段。
对于S1,待测宫颈液基细胞中可能包括真实细胞团,也可能包括虚假细胞团,还有可能包括杂质,杂质有可能是由于在制备待测宫颈液基细胞的制片过程中形成的。为便于描述,下面将待测宫颈液基细胞简称为待测目标。
对于同一待测目标,可以通过不同扫描倍率的显微镜或同一显微镜的不同目镜、物镜之间的组合,从而得到不同扫描倍率下的扫描图像。例如,扫描倍率可以包括第一倍率、第二倍率、第三倍率、第四倍率。其中,第三倍率低于第一倍率、第二倍率、第四倍率。第一倍率可以低于第二倍率。
在一个实例中,第一倍率可以是2.5倍,第二倍率可以是5倍,第三倍率可以是0.15625倍,第四倍率可以是20倍。在其他实例中,扫描倍率可以更多或更少,具体的扫描倍率的数值不应理解为对本申请的限制。
对于S2,可以包括:基于扫描图像中对应第一倍率的图像得到第一灰度图像,以及基于扫描图像中对应第二倍率的图像得到第二灰度图像。
对于S3-S4,可根据第一灰度图像的尺寸以及待测目标中的细胞分布情况确定目标二值化阈值。通过确定出的目标二值化阈值可以对第二灰度图像进行二值化处理,以得到目标二值图像。在本申请实施例的细胞团识别方法中,确定出的目标二值化阈值对于候选区域的确定有重要影响。
目标二值图像可以视为去除非成团区域的图像,在目标二值图像中保留了大量的真实细胞团以及许多可疑细胞团。其中,非成团区域可以表示无效区域,在无效区域内存在细胞团的概率极低。可疑细胞团可能是真实细胞团,通过S6的识别步骤可以对可疑细胞团进行识别。
对于S5,可以通过目标二值图像以及第一灰度图像之间的位置映射关系,在第一灰度图像中确定出与目标二值图像对应的关联区域,从关联区域中筛选出部分区域作为候选区域。
对于S6,可以根据各个扫描倍率的图像之间的位置映射关系以及确定出的候选区域,得到候选区域的坐标在各个扫描倍率的图像中的位置,即得到各个扫描倍率的图像中的候选区域。为了提高识别精度,可以将最高扫描倍率的图像中的候选区域的图像数据作为用于识别阶段的原始数据集。
原始数据集可以输入到神经网络模型中进行识别,以得到关于上述待测目标的细胞团识别结果。
需要说明的是,在最终的细胞团识别结果中可以包括真实的细胞团类型,即实现对真、假细胞团的区分。
在一种实施方式中,细胞团识别结果可以包括多个细胞团类型,还可以包括细胞团位置。
通过上述S1-S6可以对同一待测目标中的多种细胞团进行区分。
通过上述细胞团识别方法,对同一待测宫颈液基细胞对象在不同扫描倍率的扫描图像进行了处理,基于第一倍率下的扫描图像得到第一灰度图像、目标二值化阈值。再通过目标二值化阈值对基于第二倍率下的扫描倍率得到的第二灰度图像进行处理,得到目标二值图像。然后通过第二倍率下的目标二值图像以及第一倍率下的第一灰度图像之间的关联关系,从第一灰度图像中确定出候选区域,又通过候选区域与其他扫描倍率下的图像之间的映射关系对选定扫描倍率的图像进行识别,得到细胞团识别结果。在上述细胞团识别方法中,每一次灰度处理、二值化处理都考虑到了细胞核的颜色比周围素质颜色深这一点,以得到各个灰度图像、二值图像的,以此能够在尽可能保留可疑细胞团的情况下实现对于细胞团的快速识别。
由于是基于颜色进行的灰度处理、二值化处理的,能够将颜色较深的区域尽可能保留,保留可疑细胞团区域,避免漏掉真实细胞团区域。相对于直接对原始宫颈液基细胞扫描图像进行识别的方式,降低了识别难度,提升了识别效率。相对于通过复杂的特征提取、融合手段后再基于各类细胞团的具象特征进行识别的方式,本申请实施例提供的细胞团识别方法无需在识别阶段之前进行复杂的特征提取,能够对细胞团进行快速识别。
可选地,为了提高目标二值化阈值的计算准确性,避免颜色较深的杂质区域对目标二值化阈值的计算过程造成影响。可以先对第一倍率下的扫描图像中的杂质区域进行处理,以得到第一灰度图像。如图3所示,在上述S2中得到第一灰度图像的过程可以包括步骤:S21-S23。
S21:识别扫描图像中在第一倍率下的图像的杂质区域。
S22:对识别出的每个杂质区域的图像进行直方图统计,得到每个杂质区域对应的灰度值。
S23:根据多个杂质区域的所有灰度值中的中位数,对多个杂质区域的灰度值进行处理,得到第一灰度图像。
其中,杂质可能是在制作切片的过程中形成的。如图4所示中示出的“①”、“②”、“③”三个子图分别为无杂质区域、存在较多杂质区域、存在少量杂质区域的示意图,在子图②、子图③对应的切片周边的几个黑色弧形粗线条表示杂质。需要说明的是,图4中的三个子图仅作示意,该三个子图对应的是不同的待测宫颈细胞的图像。
由于黑色杂质区域较为明显,因此可以采用扫描倍率不高的第一倍率下的图像进行杂质处理。
通过对识别出的杂质区域进行直方图统计,基于所有灰度值统计情况中的灰度值中值对多个杂质区域进行处理,能够实现对杂质区域的删除,得到去除了杂质区域的第一灰度图像,以此能够避免杂质的颜色过深而对后续的目标二值化阈值的计算过程造成影响。
作为一种实施方式,上述S21具体可以包括子步骤:S211-S233。
S211:对扫描图像中在第一倍率下的图像进行灰度化,得到第一灰度化数据。
S212:根据设定的第一阈值对第一灰度化数据进行二值化处理,得到第一二值化图像。
其中,本领域技术人员可以根据实际需要对第一阈值进行设置,例如,第一阈值可以是65、70、75,本申请实施例中以第一阈值为70进行阐述。
S213:利用设定的像素阈值对第一二值化图像进行筛选,得到杂质区域。
其中,设定的像素阈值可以包括第一像素阈值、第二像素阈值。第一像素阈值可大于第二像素阈值。第一像素阈值可以通过下列的第一表达式进行计算得到,第一表达式为:
Figure BDA0002145597250000121
S表示第一像素阈值,w0、h0分别表示第一倍率下的图像的宽度、高度。第二像素阈值可以根据实际需要进行设定,例如第二像素阈值可以为2000、2500、3000等。
作为一种实现方式,可以将第一二值化图像中像素值大于2500像素且小于第一像素阈值S的区域作为杂质区域,以此得到的杂质区域可以矩形框形式呈现。
在得到杂质区域后,对于上述S22,可对矩形框形式呈现的杂质区域内的图像进行直方图统计,统计范围为0-255这256个灰度等级,得到同一杂质区域内的图像中每个灰度等级下的像素量。根据直方图统计结果,按照灰度等级从低到高的顺序对各个灰度等级对应的像素量进行累加,直至累加和的像素量与总像素量之间的比值达到第一百分比,将累加和的像素量满足第一百分比时对应的最大灰度等级的值作为该矩形框的灰度值。按照前述实现方式能够得到每个杂质区域分别对应的灰度值。本例中以第一百分比为90%进行阐述。在其他实施例中,第一百分比可以是85%、88%、92%、95%等设定值。
在得到多个杂质区域的灰度值后,对于上述S23,可以对多个杂质区域的所有灰度值进行统计,得到所有灰度值中的中位数,将参与统计的所有杂质区域的灰度值都重置为该中位数,得到第一灰度图像。
可选地,如图5所示,对于上述细胞团识别方法中的S3,具体可以包括子步骤:S31-S33。
S31:根据扫描图像中第三倍率下的图像计算待测宫颈液基细胞的细胞占比。
S32:根据扫描图像中第三倍率下的图像计算待测宫颈液基细胞的细胞密度。
S33:根据细胞密度、细胞占比以及第一灰度图像,计算目标二值化阈值。
其中,S31、S32可以同时执行。例如,可以在确定细胞密度的过程中确定细胞占比。
对于S33,作为一种实施方式,可以对步骤S2得到的第一灰度图像进行直方图统计。统计范围包括0-255这256个灰度等级,灰度等级0对应像素值A0,灰度等级1对应像素值A1,以此类推,灰度等级255对应像素值A255。按照灰度等级的大小从低灰度等级对应的像素值至高灰度等级对应的像素值进行累加,直至像素值的累加和大于细胞核像素量,记录累加和大于细胞核像素量时对应的最大灰度等级,作为当前的灰度等级GR,否则继续进行累加,直至累加和大于细胞核像素量,以恰好大于细胞核像素量时对应的灰度等级作为当前的灰度等级GR,实现当前灰度等级GR的更新。其中,该当前的灰度等级GR即为所求的目标二值化阈值。
其中,前述的细胞核像素量是根据子步骤S31、S32中的细胞密度、细胞占比计算得到的。细胞核像素量可以按照下列第二表达式进行计算得到,第二表达式为:
Figure BDA0002145597250000131
在第二表达式中,N表示所求的细胞核像素量,w0、h0分别表示在第一倍率下的图像的宽度、高度,例如w0、h0可以分别表示第一灰度图像的宽度、高度,P表示细胞占比,X表示与细胞密度等级相关的参数。当密度等级为0、1、2、3、4、5时,对应的X分别可以为100、70、45、30、25、12。
由于在S31-S33的过程中,基于细胞占比、细胞密度、第一灰度图像计算得到目标二值化阈值的过程中,细胞占比、细胞密度参与计算可以充分考虑到细胞核像素量对应的颜色。基于细胞核像素量以及去除了杂质区域的第一灰度图像而确定出的目标二值化阈值可以用于后续的数据过滤过程中,有利于确定出更为合理的候选区域。
可选地,细胞密度的值可以是多个密度等级中的其中一个密度等级。在一个实例中,密度等级可以有6个,若以细胞密度等级0-5分别表示6个密度依次增大的密度等级,密度等级0可以表示细胞分布极其稀疏,密度等级1可以表示比较稀疏,以此类推,密度等级4可以表示非常密,密度等级5可以表示极其密,细胞分布极其密集。
为了计算得到细胞密度,上述S32具体可以包括子步骤:S321-S325。
S321:根据扫描图像中第三倍率下的图像得到第三灰度图像,第三倍率低于第一倍率和第二倍率。
S322:根据第三灰度图像得到第二二值化图像。
以第三倍率为0.15625倍为例,可对0.15625倍下的扫描图像进行灰度化,得到第三灰度图像。第三灰度图像的宽度、高度有可能在250-500个像素的像素范围内。
为了准确计算出细胞密度,可以对第三灰度图像的宽度、高度进行归一化处理,得到尺寸归一化后的第三灰度图像,尺寸包括宽度和高度。例如,可以归一化至300-400个像素的像素范围内。若第三灰度图像的尺寸是设定的统一尺寸,可以省略归一化的步骤。
在得到尺寸统一的第三灰度图像后,可以采用高斯滤波方式以降低噪声,并采用大津算法计算出用于计算细胞密度的二值化阈值。需要说明的是,该用于计算细胞密度的二值化阈值不是前述的目标二值化阈值。根据该用于计算细胞密度的二值化阈值对第三灰度图像进行二值化处理后,得到第二二值化图像。得到第二二值化图像后,执行S323,以确定细胞密度的值。
S323:通过当前的检测规则检测第二二值化图像的包络边界,执行步骤S324或S325。
S324:当检测到第二二值化图像的包络边界,则更新得到当前的细胞密度,跳转至步骤S323继续执行。
S325:当未检测到第二二值化图像的包络边界,则将当前的细胞密度作为第二二值化图像对应的细胞密度。
其中,关于S323中的检测规则,每一次的当前检测规则包括:对当前的第二二值化图像进行处理,得到新的第二二值化图像,采用Canny检测算法对该新的第二二值化图像进行边缘检测,并采用霍夫变换检测该新的第二二值化图像的包络边界。
作为一种实施方式,当前检测规则中通过当前的迭代系数对当前的第二二值化图像进行膨胀-腐蚀-膨胀的操作,以得到新的第二二值化图像。
在一个实例中,采用四组迭代系数确定密度等级较低的细胞密度。该四组迭代系数分别是:[11,14,3],[7,10,3],[3,6,3],[0,3,3],所用核的大小为3×3,每一组迭代系数用于对第二二值化图像进行膨胀-腐蚀-膨胀的操作。迭代系数中的0表示不进行相应操作,例如[0,3,3]这一迭代系数表示仅进行腐蚀-膨胀操作。
下面将结合前述四组迭代系数对一个完整的迭代检测流程进行介绍。
初始情况下默认细胞密度为0,采用[11,14,3]进行膨胀-腐蚀-膨胀操作,然后采用Canny检测算法进行边缘检测,并采用霍夫变换检测第二二值化图像的包络边界。若是通过霍夫变换未检测到包络边界,那么保持当前密度等级不变,等于0,若是检测到包络边界,则密度等级加1以对当前密度等级进行更新,并采用下一组迭代系数[7,10,3]进行膨胀-腐蚀-膨胀的操作,再进行边缘检测,然后通过霍夫变换检测包络边界,在检测到包络边界时对当前密度等级进行更新,以此类推,直至不再检测到包络边界则停止迭代。其中,包络边界可以是如图4中三个子图所示的圆形轮廓。
通过前述实例能够对标号为0-4的5个细胞密度等级进行确定,由于标号为5对应的密度极大,为了确认出细胞密度为5的图像,可以通过以下两个条件判断第二二值化图像对应的密度等级是否为5:(1)通过前述检测规则更新得到的当前密度等级为4;(2)在密度等级为4的情况下计算出的目标二值化阈值GR处于预设的区间范围内。
作为一种实施方式,可以在通过前述检测规则确定出密度等级为4的情况下,根据与该密度等级为4关联的参数X计算得到细胞核像素量N,并基于N得到一个临时的GR值,然后对该临时的GR值进行判断,在该临时的GR值处于大于等于30且小于70的区间范围时,将当前密度等级更新为5,即得到细胞密度的值为5。
在确定出细胞密度的值为5后,可以根据与密度等级为5关联的参数X计算得到新的细胞核像素量N,基于该新的细胞核像素量N得到新的GR值作为新的目标二值化阈值。
其中,可以在每一次采用霍夫变换检测包络边界时,计算细胞占比P。若细胞密度的值为0,则细胞占比可以为默认值,例如0.9、0.8等。在细胞密度的值非0时,可以通过下列第三表达式计算得到细胞占比P。
第三表达式为:
Figure BDA0002145597250000161
在第三表达式中,r表示检测出的包络边界的半径,例如检测到的圆形轮廓的半径,w1、h1分别表示在第三倍率下的图像的宽度、高度,例如分别表示第二二值化图像的宽度、高度。
通过上述方法确定出的细胞密度准确度较高,细胞占比可靠性高,根据上述方法确定出的细胞密度、细胞占比计算出的细胞核像素量更为合理,有利于得到可靠性高的目标二值化阈值。
可选地,为了避免部分细胞团区域被漏取,可以对上述方法中得到的目标二值化阈值GR进行微调。
作为一种进行对目标二值化阈值进行微调的实现方式,可以通过以下微调策略对目标二值化阈值GR进行微调,微调策略包括:
当GR小于等于35、密度等级为0、1、2时,将密度等级上调两个等级后,重新执行S33以计算出新的目标二值化阈值;当GR小于等于35、密度等级为3时,上调一个等级,重新执行S33。
当GR大于35且小于70、密度等级为0时,将密度等级上调两个等级,重新执行S33;当GR大于35且小于70、密度等级为1、2、3、4时,上调一个等级,重新执行S33。
在确定出最终的目标二值化阈值后,执行S4。
可选地,对于上述S4,可以包括子步骤:S41-S42。
S41:基于待测宫颈液基细胞的细胞密度对第二灰度图像进行一级过滤处理,得到初步过滤图像。
其中,一级过滤处理可以包括:膨胀操作、腐蚀操作、高斯滤波、双边滤波。针对不同的细胞密度,一级过滤处理的具体实现过程中采用的参数可能不同。
S42:根据目标二值化阈值对初步过滤图像进行二值化处理,得到目标二值图像。
其中,可以将初步过滤图像内的像素值与目标二值化阈值GR进行比较,基于比较结果对初步过滤图像进行二值化,得到包含0、1的目标二值图像。S42可以视为对初步过滤图像的再过滤过程,能够将去噪后的图像中的非成团区域进行去除。
通过上述方法,经过一级过滤处理方式能够分别针对不同细胞密度的图像进行去噪处理,通过对初步过滤图像进行二值化处理能够对非细胞团、单个细胞、细小杂质等非成团区域进行去除,可以在尽可能保留较多可疑细胞团区域的情况下删除非成团区域,避免非成团区域带来的识别干扰。
可选地,对于上述S41,在一个实例中,针对三类细胞密度等级设置了不同的一级过滤处理方式。在三种一级过滤处理处理方式中,所采用的滤波领域直径、空间高斯函数标准差、灰度值相似性标准差等参数不同。
第一类,对于密度等级偏高的图像,例如,在密度等级为2、3、4时,对第二灰度图像进行两次膨胀-腐蚀操作的迭代处理,每一次执行膨胀-腐蚀操作过程中的采用的核大小为3×3。执行完一次膨胀-腐蚀操作后再进行下一次膨胀-腐蚀操作。然后通过高斯滤波方式进行平滑去噪,滤波过程中采用的核大小为5×5,再用双边滤波方式以过滤多余的细小杂质。
第二类,对于密度非常稀疏的图像,例如,在密度等级为1时,对第二灰度图像进行三次膨胀-腐蚀操作的迭代处理,膨胀-腐蚀的三次迭代处理过程结束后进行高斯滤波、双边滤波。
第三类,对于密度极其稀疏的图像,例如,在密度等级为0时,对第二灰度图像进行三次膨胀的迭代处理,然后进行高斯滤波、双边滤波。其中,对于该第三类的图像,在经一级过滤处理、二值化处理后得到的目标二值图像B可以表示临时二值图像Bt,对临时二值图像Bt进行三次腐蚀操作的迭代处理后,得到新的目标二值图像B。
通过对不同的细胞密度等级设置不同的一级过滤方式,能够针对不同的密度等级进行高效处理,以快速去除非成团区域。相对于统一处理方式,上述方法能够避免对于部分密度等级的图像浪费过多处理时间,有利于提升识别效率。
可选地,在得到目标二值图像B后,可以对目标二值图像中满足下列任意一个条件的区域进行剔除:(1)区域的宽度、高度都低于14像素;(2)宽度低于8像素或高度低于8像素;(3)宽度与高度二者之间的比值或比值的倒数超过15。以此能够对像素个数过于小的细微区域、宽高比严重失衡区域等无效区域进行剔除,保留成团区域。
为便于描述,将经过上述剔除操作后的图像仍称作目标二值图像B。
在得到最终的目标二值图像后,执行S5。在最终的目标二值图像B中可能存在多个不规则的区域。这些不规则区域是目标二值图像B中被置1的区域。
可选地,作为S5的一种实现方式,可以先对目标二值图像进行三次腐蚀操作的迭代处理,即进行腐蚀-腐蚀-腐蚀操作。对于腐蚀结束后的目标二值图像,根据图像中每个区域的位置,按照各个扫描倍率下的图像之间的位置映射关系,从第一灰度图像中找出与目标二值图像中各个区域关联的各个关联图像Mi。然后计算关联图像Mi的平均灰度值,每个关联图像Mi都可以计算得到一个平均灰度值,将同一第一灰度图像中所有关联图像Mi的所有平均灰度值进行排序后,从排序结果中选取指定个数的关联图像Mi的位置作为候选区域。指定个数可以根据实际需要进行设定,例如指定个数可以是800、1000、1500、2000等,本例以指定个数为1000进行阐述。
其中,对于实际关联图像Mi个数小于指定个数的情况,将所有关联图像Mi都作为候选区域。
在确定出候选区域后,执行S6。
对于S6,由于在S5中的候选区域对应的图像扫描倍率较低,因此可以通过各个扫描倍率下的图像之间的坐标映射关系,从扫描图像中选定扫描倍率下的图像中映射得到与候选区域匹配的图像数据,作为用于识别阶段的原始数据集。选定扫描倍率可以是扫描图像的最高扫描倍率,在一个实例中,选定扫描倍率为20倍。
为了提高识别准确率和速度,可以将原始数据集输入预先建立的神经网络模型进行识别,以得到细胞团识别结果。
细胞团识别结果可以包括多个细胞团类别,细胞团类别包括:背景、正常腺细胞团、正常鳞状上皮细胞团、异常腺细胞团、异常鳞状上皮细胞团、中性粒聚集、杂质、鳞状上皮细胞重叠、粘液丝、模糊非细胞团、模糊细胞团。
细胞团识别结果还可以包括细胞团位置,用于标识识别出的细胞团的坐标。
为了让原始数据集中各个图像的尺寸统一以便输入神经网络模型,可以在对原始数据集中的各图进行尺寸处理后再输入神经网络模型。例如,以512×512作为固定的输入尺寸,对原始数据集中每张图的任意一边小于512像素的区域进行扩充,对任意一边大于512像素的区域进行滑动取块,滑动步长可以是128个像素。
通过将原始数据集输入到卷积神经网络模型中,可以得到预测的检测框坐标、细胞团类别。由于实际应用中对于同一图像内的要素可能会被不同尺寸的框进行识别,为了避免对同一要素的重复识别,可以采用非极大值抑制法去除对同一区域的重复检测框,得到最终的检测结果。
在一个实例中,卷积神经网络占3G的显存,一张显卡可同时运行三个进程,一秒内可以测试55个图像,在识别阶段测试完一张切片的多个候选区域对应的原始数据集所需时间低于20秒。从步骤S1开始至执行完步骤S6的全流程,总运行时间大约为40秒,运行时间短,识别效率高、可靠性强。
在本申请实施例中,卷积神经网络架构如图6所示。在图6中的各箭头走向可以表示在神经网络中的数据流向。
在准备好原始数据集后,首先将原始数据集送入基础网络中的多级卷积层进行一系列卷积操作。
基础网络中的多级卷积层包括Conv1_1,Conv1_2,Conv2_1,Conv2_2,Conv3_1,Conv3_2,Conv3_3,Conv4_1,Conv4_2,Conv4_3,Conv5_1,Conv5_2,Conv5_3。基础网络中的各卷积层的卷积核大小为3×3,步长为1,填补为1,只是各卷积层的通道数不同。Conv1_1和Conv1_2的通道数为32,Conv2_1和Conv2_2的通道数为64,Conv3_1,Conv3_2和Conv3_3的通道数为128,Conv4_1,Conv4_2和Conv4_3的通道数为256,Conv5_1,Conv5_2和Conv5_3的通道数为256。
经过基础网络进行卷积操作的数据被送入测试网络。测试网络中存在特殊池化层、多级卷积层、多级反卷积层。
测试网络中的多级卷积层包括Conv5_4,Conv5_5,Conv6_1,Conv6_2,Conv7_1,Conv7_2,Conv8_1,Conv8_2,Conv9_1,Conv9_2,Conv10_1,Conv10_2。特殊池化层可以设置在测试网络的多级卷积层中任意两级卷积层之间。
测试网络中的多级反卷积层包括Deconv9_1,Deconv9_2,Deconv8_1,Deconv8_2,Deconv7_1,Deconv7_2,Deconv6_1,Deconv6_2,Deconv5_4,Deconv5_5,Deconv4_3_1,Deconv4_3_2。
其中,在将与候选区域对应的扫描图像中最高扫描倍率的图像数据集,输入神经网络中的多级卷积层后,得到部分卷积层对应的第一卷积结果。部分卷积层是指conv4_3-Conv10_2这一部分与后续反卷积层对应的卷积层。
将第一卷积结果送入神经网络中的多级反卷积层,可以得到第二卷积结果,第二卷积结果是指经过反卷积层进行反卷积操作后得到的结果。
在根据第一卷积结果得到第二卷积结果后,可以根据第一卷积结果、第二卷积结果确定置信值组。例如将部分卷积层与反卷积层的输出结果进行级联,实现特征图谱级联,对多层进行级联后综合多层的输出可以得到置信值组。
根据置信值组中的各个置信值确定细胞团识别结果。
若是存在11种分类,可以得到包含至少11个元素的置信值数组。对于同一置信值组内的多个置信值元素,置信值最大的元素对应的类别可能是待测目标中的一种细胞团类别。任一置信值组可以对应一个用于标识被测对象的检测框,该检测框用于标识被测细胞团的位置。
下面对测试网络中的特殊池化层、各卷积层、各反卷积层进行介绍。
特殊池化层使用最大池化,核大小为3×3,步长为1,填补为1。可以将经过基础网络、特殊池化层后得到的特征图可以送入Conv5_4,Conv5_4是扩张卷积层,卷积核为3×3,填补为6,扩张系数为6,通道数为512。然后将Conv5_4输出的数据送入Conv5_5,Conv5_5使用的卷积核为大小为1×1,通道数为512。
卷积层Conv6_1,Conv6_2与以及后续的Conv7_1,Conv7_2,Conv8_1,Conv8_2,Conv9_1,Conv9_2的卷积操作相同,以Conv6_1,Conv6_2为例进行介绍。Conv6_1的卷积核大小为1×1,通道数为64,Conv6_2的卷积核大小为3×3,步长为2,填补为1,通道数为128。
卷积层Conv10_1使用的卷积核大小为1×1,通道数为128。Conv10_2的卷积核大小为4×4,步长为1,填补为1,通道数为256。
在经过Conv10_2的卷积操作后,特征图的大小为1×1,此时将其送入Deconv9_1进行反卷积操作,卷积核大小为3×3,步长为2,通道数为128,特征图大小变为2×2。然后级联Deconv9_1和Conv9_2的特征图,再进行Deconv9_2的卷积操作,卷积核大小为3×3,步长为1,填补为1,通道数为128。Deconv9_1和Deconv9_2的处理过程与后续的Deconv8_1,Deconv8_2,Deconv7_1,Deconv7_2,Deconv6_1,Deconv6_2的处理过程相同,与Deconv5_4,Deconv5_5,Deconv4_3_1,Deconv4_3_2仅仅是输出的通道数不同,其中Deconv5_4和Deconv5_5对应的通道数为512,Deconv4_3_1和Deconv4_3_2对应的通道数为256。
Conv10_2、Deconv9_2、Deconv8_2、Deconv7_2、Deconv6_2、Deconv5_5和Deconv4_3_2对应的特征图都会输出检测框的坐标和该检测框类别的置信值,将置信值高于0.3的检测框整合到一起,然后使用非极大值抑制法去除高度重叠的检测框,将剩余的检测框及类别作为识别结果。
通过上述卷积神经网络的结构设计,能够充分融合浅层和深层的特征,能够更加准确的预测被测对象的位置和类别。其中Conv4_3、Conv5_3至Conv10_1的特征视为浅层特征,Conv10_2、Deconv9_1至Deconv4_3_2的特征视为深层特征。由于通过上述卷积神经网络在多个尺度的特征图中都能够输出检测框坐标和该检测框类别的置信值,这些检测框能更好的涵盖各个尺寸下的被测对象,对于小目标的检测效果显著。
请参阅图7,为本申请实施例提供的一种细胞团识别装置200的功能结构框图。该细胞团识别装置200可被存储于电子设备100的存储器102中,细胞团识别装置200用于执行前述细胞团识别方法中的各个步骤及任意实现方式。
如图7所示,细胞团识别装置200包括扫描图像获取模块201、预处理模块202、阈值计算模块203、过滤模块204、候选区域确定模块205、识别模块206。
扫描图像获取模块201,用于获取待测宫颈液基细胞在不同扫描倍率下得到的扫描图像。
预处理模块202,用于基于扫描图像得到第一灰度图像、第二灰度图像,第一灰度图像所对应的扫描倍率为第一倍率,第二灰度图像所对应的扫描倍率为第二倍率。
阈值计算模块203,用于基于第一灰度图像得到目标二值化阈值。
过滤模块204,用于根据目标二值化阈值对第二灰度图像进行处理,得到目标二值图像。
候选区域确定模块205,用于根据目标二值图像以及第一灰度图像确定候选区域。
识别模块206,用于根据候选区域对扫描图像中最高扫描倍率的图像进行识别,得到细胞团识别结果。
通过上述细胞团识别装置200能够执行前述细胞团识别方法,实现对细胞团的快速识别。
可选地,预处理模块202具体还可以用于执行上述细胞团识别方法中的步骤S21-S23。
可选地,预处理模块202还可以用于执行上述细胞团识别方法中的子步骤S211-S213。
可选地,阈值计算模块203还可以用于执行上述细胞团识别方法中的步骤S31-S33。
可选地,阈值计算模块203还可以用于执行上述细胞团识别方法中的子步骤S321-S325。
可选地,过滤模块204具体可用于执行上述细胞团识别方法中的步骤S41-S42。
关于本申请实施例提供的细胞团识别装置200的其他细节,请进一步参考前述细胞团识别方法中的相关描述,在此不再赘述。
除了上述实施例,本申请实施例还提供一种可读存储介质,该可读存储介质上存储有计算机程序,计算机程序被处理器101运行时执行如前述细胞团识别方法中的步骤。
综上所述,通过本申请实施例提供的细胞团识别方法、装置及电子设备100,在利用神经网络进行识别之前,根据对不同倍率下的扫描图像进行处理,计算得到用于进行识别的目标二值化阈值,在目标二值化阈值的计算过程中,考虑到了细胞核颜色比周围素质深,从而根据细胞密度、细胞占比参数以及灰度图像确定出了可靠性高的目标二值化阈值。基于目标二值化阈值得到的目标二值图像,是在尽可能保留可疑细胞团区域的情况下去除了噪声和非成团区域的。根据目标二值图像确定出的候选区域具有较高的可靠性,且在进入识别阶段之前无需经历复杂的特征提取、融合过程,不仅降低了识别难道,还提高了候选区域的提取效率,加快了整个识别流程。结合到本申请实施例提出的卷积神经网络对候选区域提取阶段的输出结果进行识别,能够缩短整个识别流程的处理时间,识别结果的准确性、可靠性高。
在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
需要说明的是,功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、存储器、磁碟或者光盘等各种可以存储程序代码的介质。
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
以上仅为本申请的实施例而已,并不用于限制本申请的保护范围,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (9)

1.一种细胞团识别方法,其特征在于,所述方法包括:
获取待测宫颈液基细胞在不同扫描倍率下得到的扫描图像;
基于所述扫描图像得到第一灰度图像、第二灰度图像,所述第一灰度图像所对应的扫描倍率为第一倍率,所述第二灰度图像所对应的扫描倍率为第二倍率;
根据所述扫描图像中第三倍率下的图像计算所述待测宫颈液基细胞的细胞占比,以及根据所述扫描图像中第三倍率下的图像计算所述待测宫颈液基细胞的细胞密度;根据所述细胞密度、所述细胞占比以及所述第一灰度图像,计算目标二值化阈值;所述第三倍率低于所述第一倍率和所述第二倍率;
根据所述目标二值化阈值对所述第二灰度图像进行处理,得到目标二值图像;
根据所述目标二值图像以及所述第一灰度图像确定候选区域;
根据所述候选区域对所述扫描图像中最高扫描倍率的图像进行识别,得到细胞团识别结果。
2.根据权利要求1所述的方法,其特征在于,所述基于所述扫描图像得到第一灰度图像,包括:
识别所述扫描图像中在第一倍率下的图像的杂质区域;
对识别出的每个杂质区域的图像进行直方图统计,得到每个杂质区域对应的灰度值;
根据多个杂质区域的所有灰度值中的中位数,对多个杂质区域的灰度值进行处理,得到第一灰度图像。
3.根据权利要求2所述的方法,其特征在于,所述识别所述扫描图像中在第一倍率下的图像的杂质区域的步骤,包括:
对所述扫描图像中在第一倍率下的图像进行灰度化,得到第一灰度化数据;
根据设定的第一阈值对所述第一灰度化数据进行二值化处理,得到第一二值化图像;
利用设定的像素阈值对所述第一二值化图像进行筛选,得到杂质区域。
4.根据权利要求1所述的方法,其特征在于,所述根据所述扫描图像中第三倍率下的图像计算所述待测宫颈液基细胞的细胞密度的步骤,包括:
根据扫描图像中第三倍率下的图像得到第三灰度图像;
根据所述第三灰度图像得到第二二值化图像;
通过当前的检测规则检测所述第二二值化图像的包络边界;
当检测到所述第二二值化图像的包络边界,则更新得到当前的细胞密度,跳转至通过当前的检测规则检测所述第二二值化图像的包络边界的步骤继续执行;
当未检测到所述第二二值化图像的包络边界,则将当前的细胞密度作为所述第二二值化图像对应的细胞密度。
5.根据权利要求1所述的方法,其特征在于,所述根据所述目标二值化阈值对所述第二灰度图像进行处理,得到目标二值图像的步骤,包括:
基于所述待测宫颈液基细胞的细胞密度对所述第二灰度图像进行一级过滤处理,得到初步过滤图像;
根据所述目标二值化阈值对所述初步过滤图像进行二值化处理,得到目标二值图像。
6.根据权利要求1所述的方法,其特征在于,所述细胞团识别结果包括多个细胞团类别;
所述多个细胞团类别包括:背景、腺细胞团、鳞状上皮细胞团、中性粒聚集、鳞状上皮细胞重叠、模糊非细胞团、模糊细胞团。
7.根据权利要求1所述的方法,其特征在于,所述根据所述候选区域对所述扫描图像中最高扫描倍率的图像进行识别,得到细胞团识别结果的步骤,包括:
将与所述候选区域对应的扫描图像中最高扫描倍率的图像数据集,输入神经网络中的多级卷积层,得到部分卷积层对应的第一卷积结果;
将所述第一卷积结果送入神经网络中的多级反卷积层,得到第二卷积结果;
根据所述第一卷积结果、所述第二卷积结果确定置信值组;
根据所述置信值组中的各个置信值确定细胞团识别结果。
8.一种细胞团识别装置,其特征在于,所述装置包括:
扫描图像获取模块,用于获取待测宫颈液基细胞在不同扫描倍率下得到的扫描图像;
预处理模块,用于基于所述扫描图像得到第一灰度图像、第二灰度图像,所述第一灰度图像所对应的扫描倍率为第一倍率,所述第二灰度图像所对应的扫描倍率为第二倍率;
阈值计算模块,用于根据所述扫描图像中第三倍率下的图像计算所述待测宫颈液基细胞的细胞占比,以及根据所述扫描图像中第三倍率下的图像计算所述待测宫颈液基细胞的细胞密度;根据所述细胞密度、所述细胞占比以及所述第一灰度图像,计算目标二值化阈值;所述第三倍率低于所述第一倍率和所述第二倍率;
过滤模块,用于根据所述目标二值化阈值对所述第二灰度图像进行处理,得到目标二值图像;
候选区域确定模块,用于根据所述目标二值图像以及所述第一灰度图像确定候选区域;
识别模块,用于根据所述候选区域对所述扫描图像中最高扫描倍率的图像进行识别,得到细胞团识别结果。
9.一种电子设备,其特征在于,所述电子设备包括:处理器、存储器,所述存储器存储有所述处理器可执行的机器可读指令,当所述电子设备运行时,所述机器可读指令被所述处理器执行时执行权利要求1-7任一项所述方法的步骤。
CN201910683872.5A 2019-07-26 2019-07-26 细胞团识别方法、装置及电子设备 Active CN110378313B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910683872.5A CN110378313B (zh) 2019-07-26 2019-07-26 细胞团识别方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910683872.5A CN110378313B (zh) 2019-07-26 2019-07-26 细胞团识别方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN110378313A CN110378313A (zh) 2019-10-25
CN110378313B true CN110378313B (zh) 2021-05-18

Family

ID=68256501

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910683872.5A Active CN110378313B (zh) 2019-07-26 2019-07-26 细胞团识别方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN110378313B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111462099B (zh) * 2020-04-05 2024-01-23 中国人民解放军总医院 一种基于快速积分图监测的图像细胞区域定位方法
CN112102277A (zh) * 2020-09-10 2020-12-18 深圳市森盈生物科技有限公司 在胸水荧光图像中检测肿瘤细胞的装置及方法
CN112378837B (zh) * 2020-09-15 2021-12-28 深圳市华中生物药械有限公司 一种宫颈脱落细胞检测方法及相关装置
CN112149561B (zh) * 2020-09-23 2024-04-16 杭州睿琪软件有限公司 图像处理方法和装置、电子设备和存储介质
CN113936021B (zh) * 2021-09-18 2022-07-05 广东石油化工学院 一种基于sem图像的软团聚分子识别方法及***
CN117705786A (zh) * 2022-09-07 2024-03-15 上海睿钰生物科技有限公司 一种细胞单克隆源性自动分析的方法和***
CN115165710B (zh) * 2022-09-08 2022-11-29 珠海圣美生物诊断技术有限公司 细胞的快速扫描方法和装置
CN116580041B (zh) * 2023-05-30 2024-06-18 山东第一医科大学附属眼科研究所(山东省眼科研究所、山东第一医科大学附属青岛眼科医院) 基于voronoi图的角膜内皮细胞边界分割方法和装置
CN117218139B (zh) * 2023-09-12 2024-05-24 珠海横琴圣澳云智科技有限公司 样本细胞密度的确定方法和装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106033540A (zh) * 2016-05-27 2016-10-19 北京大学第医院 一种***微生态形态学自动分析方法和***
CN106709914A (zh) * 2017-01-05 2017-05-24 北方工业大学 一种基于双级dem海陆库的sar图像船舶检测虚警剔除方法
CN108564567A (zh) * 2018-03-15 2018-09-21 中山大学 一种超高分辨率病理图像癌变区域可视化方法
CN108846829A (zh) * 2018-05-23 2018-11-20 平安科技(深圳)有限公司 病变部位识别方法及装置、计算机装置及可读存储介质
CN109190567A (zh) * 2018-09-10 2019-01-11 哈尔滨理工大学 基于深度卷积神经网络的异常宫颈细胞自动检测方法
EP3427183A1 (en) * 2016-03-10 2019-01-16 Genomic Vision Method of curvilinear signal detection and analysis and associated platform
CN109461495A (zh) * 2018-11-01 2019-03-12 腾讯科技(深圳)有限公司 一种医学图像的识别方法、模型训练的方法及服务器

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2002322033A1 (en) * 2001-06-04 2002-12-16 Ikonisys Inc. Method for detecting infectious agents using computer controlled automated image analysis

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3427183A1 (en) * 2016-03-10 2019-01-16 Genomic Vision Method of curvilinear signal detection and analysis and associated platform
CN106033540A (zh) * 2016-05-27 2016-10-19 北京大学第医院 一种***微生态形态学自动分析方法和***
CN106709914A (zh) * 2017-01-05 2017-05-24 北方工业大学 一种基于双级dem海陆库的sar图像船舶检测虚警剔除方法
CN108564567A (zh) * 2018-03-15 2018-09-21 中山大学 一种超高分辨率病理图像癌变区域可视化方法
CN108846829A (zh) * 2018-05-23 2018-11-20 平安科技(深圳)有限公司 病变部位识别方法及装置、计算机装置及可读存储介质
CN109190567A (zh) * 2018-09-10 2019-01-11 哈尔滨理工大学 基于深度卷积神经网络的异常宫颈细胞自动检测方法
CN109461495A (zh) * 2018-11-01 2019-03-12 腾讯科技(深圳)有限公司 一种医学图像的识别方法、模型训练的方法及服务器

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于深度卷积神经网络的肾透明细胞癌细胞核分割;鲁浩达等;《生物医学工程研究》;20171215;340-345 *

Also Published As

Publication number Publication date
CN110378313A (zh) 2019-10-25

Similar Documents

Publication Publication Date Title
CN110378313B (zh) 细胞团识别方法、装置及电子设备
CN110060237B (zh) 一种故障检测方法、装置、设备及***
CN115861135B (zh) 一种应用于箱体全景探测的图像增强及识别方法
CN109978839B (zh) 晶圆低纹理缺陷的检测方法
CN110619618A (zh) 一种表面缺陷检测方法、装置及电子设备
WO2021139258A1 (zh) 基于图像识别的细胞识别计数方法、装置和计算机设备
CN116664559B (zh) 基于机器视觉的内存条损伤快速检测方法
CN111986183B (zh) 一种染色体散型图像自动分割识别***及装置
CN113962976B (zh) 用于病理玻片数字图像的质量评估方法
CN111369523B (zh) 显微图像中细胞堆叠的检测方法、***、设备及介质
CN110648330B (zh) 摄像头玻璃的缺陷检测方法
CN112991259B (zh) 一种半导体制程缺陷的检测方法及***
CN114240978B (zh) 基于自适应形态学的细胞边缘分割方法和装置
CN114495098B (zh) 一种基于显微镜图像的盘星藻类细胞统计方法及***
CN116740728B (zh) 一种用于晶圆读码器动态获取方法和***
CN117635615B (zh) 基于深度学习实现冲孔模具的缺陷检测方法及***
CN115375629A (zh) 一种lcd屏幕中线缺陷检测及缺陷信息提取方法
CN109949245B (zh) 十字激光检测定位方法、装置、存储介质及计算机设备
WO2021139447A1 (zh) 一种宫颈异常细胞检测装置及方法
CN115082819A (zh) 食品异物检测方法、装置、计算机设备及存储介质
CN113963004A (zh) 一种采样方法、装置及电子设备
CN114155399A (zh) 基于多特征融合递进式判别的乳腺病理全切片分类方法
CN112069885A (zh) 人脸属性识别方法、装置及移动终端
CN117974601B (zh) 基于模板匹配的硅片表面缺陷检测方法及***
CN117911792B (zh) 一种电压基准源芯片生产用引脚检测***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP02 Change in the address of a patent holder
CP02 Change in the address of a patent holder

Address after: Room 601-605, 6th Floor, Building J, Building 5, Yunmi City, No. 19, Ningshuang Road, Yuhuatai District, Nanjing, Jiangsu Province, 210000

Patentee after: Jiuyisanluling medical technology Nanjing Co.,Ltd.

Address before: Room 305, building A3, Nanhai Science Park, 180 software Avenue, Yuhuatai District, Nanjing City, Jiangsu Province, 210000

Patentee before: Jiuyisanluling medical technology Nanjing Co.,Ltd.