CN112183237A - 基于颜色空间自适应阈值分割的白细胞自动分类方法 - Google Patents

基于颜色空间自适应阈值分割的白细胞自动分类方法 Download PDF

Info

Publication number
CN112183237A
CN112183237A CN202010946847.4A CN202010946847A CN112183237A CN 112183237 A CN112183237 A CN 112183237A CN 202010946847 A CN202010946847 A CN 202010946847A CN 112183237 A CN112183237 A CN 112183237A
Authority
CN
China
Prior art keywords
classification
cell
svm
pso
white blood
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010946847.4A
Other languages
English (en)
Inventor
董娜
翟梦蝶
常建芳
陈杨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin University
Original Assignee
Tianjin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University filed Critical Tianjin University
Priority to CN202010946847.4A priority Critical patent/CN112183237A/zh
Publication of CN112183237A publication Critical patent/CN112183237A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/69Microscopic objects, e.g. biological cells or cellular parts
    • G06V20/695Preprocessing, e.g. image segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/69Microscopic objects, e.g. biological cells or cellular parts
    • G06V20/693Acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/69Microscopic objects, e.g. biological cells or cellular parts
    • G06V20/698Matching; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10056Microscopic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于颜色空间自适应阈值分割的白细胞自动分类方法,首先,结合颜色空间信息的自适应阈值分割方法,用于处理颜色不均,难以分割的白细胞图片,解决了细胞分割中通常无法兼顾低计算量与高准确度的问题。在完成细胞分割后,从得到的细胞核和细胞的灰度图像提取了包括几何,颜色和纹理特征在内的大量细胞特征,并设计了基于CART的特征选择算法来剔除初始特征集中的冗余特征,从而选择出最有利于分类的特征子集,大大降低了无用特征对分类效率的干扰。最后,本发明中通过引入PSO对SVM的两个超参数进行优化,提高了SVM的分类性能。本发明通过优化白细胞分类过程中的各个阶段,成功提高了白细胞的分类效果。

Description

基于颜色空间自适应阈值分割的白细胞自动分类方法
技术领域
本发明涉及一种图像处理方法,具体涉及一种使用图像处理技术实现对白细胞的自动 分类检测。
背景技术
免疫***是人体抵抗病原体入侵的疾病防御屏障,而白细胞则是免疫***的重要组成 部分,通过吞噬和产生抗体来清除病原体。白细胞主要分为嗜中性粒细胞、嗜酸性粒细胞、 嗜碱性粒细胞、淋巴细胞和单核细胞5大类[1]。由于白细胞各有其生理功能,机体发生炎 症或其他疾病时会引起白细胞数量的变化以及各种类型白细胞所占百分比的变化,因而对 血液中白细胞总数及分类个数的统计,对医学诊断、判断是否患病、分析出患有何种疾病 以及严重程度等具有非常重要的意义,医院中对白细胞的检验一直是血检中的重要内容之 一。传统的白细胞检测主要通过人工镜检和血检仪器两种方法。但人工镜检检测方法对医 务人员的自身经验要求高、劳动强度要求大,医务人员容易产生视觉疲劳,使主观因素对 结果的影响更大而缺乏客观的衡量标准。而血检仪器虽然解决了人工镜检效率低下的问题, 但是仪器对测试样本有很高的要求,并且分析仪价格较为昂贵,需要专业人士进行操作及 保养,不利于在乡镇医院和社区医院进行普及应用,因此急需更加高效准确的白细胞检测 分类方法。
而近年来,在医学图像处理领域,随着成像技术的极大进步与人工智能领域数字图像 处理技术的广泛应用,使用计算机图形学辅助医学诊断成为一大趋势,在***细胞识别, 乳腺癌检测,肺癌检测,白细胞分类等多个医疗领域取得了一系列进展[2]。白细胞图片中 通常包括白细胞,红细胞,血小板等,应用数字图像处理技术对其中的白细胞进行识别与 分类,主要包括以下三个步骤:首先进行图像分割,在白细胞图片中分割出目标白细胞; 然后从中提取出有效特征;最后将特征数据输入到分类器中进行分类计数。
图像分割的目的就是从白细胞图片中成功地切割出白细胞部分,为后续的特征提取步 骤提供必要的信息,而细胞图像复杂的背景信息以及染色光照等不确定因素会给分割带来 很大困难。Safuan[3]使用Otsu算法执行分割过程,Osowski[4]开发了一种基于形态学操作 (例如侵蚀,膨胀,平滑和分水岭变换)的细胞分割方法。虽然他们在细胞核的分割上都 达到了不错的效果,但是当图片模糊或背景信息过多时,这些基础的分割算法无法分割出 完整的白细胞,容易导致细胞质特征的丢失。Zheng[5]根据凹度分析将K-means聚类与接 触细胞***相结合,以生成一个粗糙的WBC区域。然后,将粗略的分割结果用作自动标签 来训练支持向量机(SVM)分类器,进一步对图像的每个像素进行分类,以获得更准确的 分割结果。然而虽然这类复杂的分割方法可以提供更准确的分割结果,但是它们要么实施 成本高昂,要么需要大量的计算资源,给整个的分类***造成了很大的负担。
细胞分割完成后,如何进行有效的细胞特征提取也一直是研究工作的重点。一般来说, 对于白细胞的特征提取主要是依据检验科医生的经验来设计特征,比如白细胞的几何形态、 颜色和纹理信息,Osowski等人[6]便从这三个方面提取了164维的特征向量对白细胞进行分 类,取得了一定的效果。理论上来讲,提取的特征越多越有可能找到最有利于细胞分类的 有效特征,但是实际上特征数据过多并不能保证更好的分类效果。因为在提取出的的初始 特征中通常存在许多无效甚至有害的冗余特征,这不仅增加了硬件开销影响了分类效率, 严重的还会降低分类的准确率。为了解决这些问题并以最少的特征数获得最高的识别精度, 有必要对初始特征进行特征选择。
分类器训练是白细胞分类过程中的最后一步。在人工智能领域,常用的分类器有贝叶 斯,卷积神经网络(CNN),随机森林和SVM等。尽管分类器的类型很多,但由于SVM操 作简单且在非线性问题上具有良好的性能,被广泛应用于各种医学图像分类问题。虽然传 统的SVM模型已经表现良好,但是在求解最优化问题时仍然存在一些问题,如惩罚因子c 和径向基函数参数σ的大小对SVM的分类性能至关重要,但是由于参数调整过程费时又难 以操作,所以常常被忽略[7]。
[参考文献]
[1]M.Saraswat,K.V.Arya.Automated microscopic image analysis forLeukocytes identification:a survey.Micron,Volume 65,2014,pp.20-33.
[2]Suzuki K,Zhou L P,Wang Q.Machine learning in medicalimaging.Pattern Recognition, 2017,63:465-467.
[3]Alreza,ZKK.Karimian,A.Design a new algorithm to count white bloodcells for classification leukemic blood image using machine visionsystem.2016 6th International Conference on Computer and KnowledgeEngineering,2016.DOI: 10.1109/ICCKE.2016.7802148.
[4]Safuan,SNM.Tomari,MRM.Zakaria,WNW.White blood cell(WBC)countinganalysis in blood smear images using various color segmentationmethods.Measurement,Volume 116, 2018,pp.543–555.
[5]X Zheng,Y Wang,GY Wang,JG Liu.Fast and robust segmentation ofwhite blood cell images by self-supervised learning.Micron,Volume 107,2018,pp.55–71.
[6]Osowski S,Siroic R,Markiewicz T,Siwek K.Application of supportvector machine and genetic algorithm for improved blood cell recognition[J].IEEE Transactions on Instrumentation and Measurement,2009,58(7):2159-2168.
[7]Huang Hh,Wang Zj,Chung Wy(2019)Efficient parameter selection forsupport vector machines.Enterprise Information Systems 13:916-932.
发明内容
针对上述现有技术,本发明提出一种基于颜色空间自适应阈值分割的白细胞自动分类 方法,可以改善当前在细胞分割,特征选择以及分类器训练中存在的一些问题,以期能够 快速有效地进行白细胞的自动分类计数。采用本发明的方法能够准确地计算出每张图片中 白细胞的分割阈值,解决了细胞分割中通常无法兼顾低计算量与高准确度的问题。本发明 中,针对冗余特征问题设计了一种基于分类和回归树(CART)的特征选择方法,用于从大 量的白细胞特征中进行冗余特征的剔除,从而选择出最有利于分类的特征子集,大大降低 了无用特征对分类效率的干扰。本发明中通过引入粒子群优化算法(PSO)对SVM的两个 超参数进行优化,提高了SVM的分类性能。
为了解决上述技术问题,本发明提出的一种基于颜色空间自适应阈值分割的白细胞自 动分类方法,包括以下步骤:
步骤一、白细胞的自适应阈值分割:将要分割的白细胞图像从RGB颜色空间分别转换 为灰度空间和HSV空间,得到该白细胞的灰度图像和HSV图像,从该灰度图像的灰度直方图中所有波谷处对应的灰度值中选择最小的灰度值作为分割阈值分割得到细胞核的灰度 图像;从该HSV图像色调(H)分量的色调直方图中所有波谷处对应的色调值中,根据最后一个波峰和波谷的位置关系确定1至2个色调值作为分割阈值分割得到细胞的灰度图像;
步骤二、白细胞的特征提取与特征选择:首先,从步骤一分割得到的细胞核灰度图像 和细胞灰度图像中分别提取如下特征构成白细胞特征,包括:基于图像灰度直方图的颜色 特征,基于灰度共生矩阵的纹理特征和基于八链码的形态特征;然后,基于CART的特征选择算法得到上述白细胞特征的基尼(Gini)增益指数,最后,根据基尼(Gini)增益指数 选择排名前十的白细胞特征组成最优特征子集;
步骤三、引入PSO优化SVM,构建PSO-SVM分类器,将上述步骤二得到的最优特征 子集输入至所述PSO-SVM分类器,所述PSO-SVM分类器的输出即为白细胞的分类结果。
进一步讲,本发明所述的白细胞自动分类方法,步骤三中,构建PSO-SVM分类器的过 程如下:
步骤3-1、PSO初始化;
步骤3-2、将步骤二形成的所述最优特征子集分为训练集和测试集,以所述训练集训练 SVM,根据所述SVM得到的分类准确率计算PSO中粒子的适应度值,记录当前粒子的局部最优值和所有粒子的全局最优值;
步骤3-3、迭代更新粒子的速度与位置,并计算更新后粒子的适应度值;
步骤3-4、比较更新前后的粒子的适应度值,如果更新后的粒子的的适应度值更优,则 更新当前粒子的局部最优值和所有粒子的全局最优值;
步骤3-5、重复步骤3-2至步骤3-4,直到满足结束条件,得到适应度最优的粒子信息, 至此完成PSO-SVM分类器的构建。
PSO-SVM分类器构建完成后,将所述测试集输入至所述PSO-SVM分类器进行分类,得到测试集的分类结果,用以验证构建所得的PSO-SVM分类器的分类效果。
与现有技术相比,本发明的有益效果是:
(1)阈值分割是图像分割中应用最广操作最简单的分割方法,需要极小的计算代价, 而本发明提出的基于颜色直方图信息的计算分析可以自动选取出最适合细胞分割的阈值。 这样既保证了分割方法的低运算成本,同时又实现了高分割准确率。观察图3与图4,以人 工分割结果作为参考,本发明最终在细胞核与细胞的分割上分别达到了95.98%和97.57% 的准确率。
(2)特征越多越有可能包括最有利于分类的特征,但是同时也会存在很多无效的冗余 特征,CART特征选择方法可以从原始特征集中选择出对分类最有用的特征。本发明中分别 使用33种初始特征以及10种选择出的特征进行了分类试验对比,在准确率只降低了不到 0.1%的同时,运行时间减少了大约32%,这证明本发明中的特征选择算法在保证准确率的 前提下,确实大大较低了运算成本,提高了分类效率。
(3)通过引入PSO算法对SVM的超参数进行全局寻优,有效地提高了白细胞分类过程的准确率和效率,最终白细胞五分类达到了99.76%的高准确率。
附图说明
图1是本发明中白细胞分类的总体流程图;
图2是本发明中白细胞的特征数据二叉树***示意图;
图3是本发明仿真实验中的细胞核的分割结果示意图;
图4是本发明仿真实验中的细胞分割结果示意图。
具体实施方式
下面结合附图及具体实施例对本发明做进一步的说明,但下述实施例绝非对本发明有 任何限制。
本发明的设计思路是:本发明提出了一种基于颜色空间自适应阈值分割的白细胞自动 分类方法。首先,本发明对阈值分割算法进行了改进,设计了一种结合颜色空间信息的自 适应阈值分割方法,用于处理颜色不均,难以分割的白细胞图片。随后,在完成细胞分割 后,提取了包括几何,颜色和纹理特征在内的大量细胞特征,并设计了基于CART的特征选择算法来剔除初始特征集中的冗余特征。最后,本发明中引入PSO对SVM的两个超参 数的调参过程进行优化,构建PSO-SVM分类器模型。相对于现有技术,本发明通过优化白 细胞分类过程中的各个阶段,成功提高了白细胞的分类效果。如图1所示,本发明所述的 白细胞自动分类方法,包括以下步骤:
步骤一、白细胞的自适应阈值分割:
阈值分割是图像分割中的经典方法,它利用图像中要提取的目标与背景在颜色上的差 异,通过设置阈值来把像素级分成若干类,从而实现目标与背景的分离。本发明结合不同 颜色空间中细胞质和细胞核的差异表现,提出了一种基于颜色直方图的自适应阈值分割方 法。如在细胞图片的灰度直方图中,其横坐标为灰度级,数值越小表示对应像素颜色越深, 纵坐标为具有相应灰度的像素的数量,该直方图可以近似地视为三峰结构,不同的峰面积 对应于图像的不同部分。例如,第一个波峰面积应该对应于图像中最暗的部分,即白细胞 的细胞核。显然,图像的分割阈值应取在波谷对应的灰度值处。
下面以一张图片为例,描述本发明中提出的自适应阈值计算过程:
在白细胞图片对应的灰度直方图中,j点为横坐标上的一点,即像素所属的灰度值,使 用两点中心差法计算j点的一阶导数,其中yj是灰度值j的像素数,而dj是j点的导数;
dj=(yj+1-yj-1)/2
dj=(dj+1+dj+dj-1)/3
sign(x)是符号函数,其表达式为:
Figure BDA0002675578150000051
通过查找一阶导数中的向上零交叉来检测波谷点:
sing(dj)<sing(dj+1)
通过查找一阶导数中的向下零交叉来检测波峰点:
sing(dj)>sing(dj+1)
对初始目标点附近的点进行高斯拟合,以确定最终的波谷点和波峰点。
使用提出的自适应阈值分割算法来确定每张图片中的分割阈值,本发明中,将要分割 的白细胞图像从RGB颜色空间分别转换为灰度空间和HSV空间,得到该白细胞的灰度图 像和HSV图像,从该灰度图像的灰度直方图中所有波谷处对应的灰度值中选择最小的灰度 值作为分割阈值分割得到细胞核的灰度图像;从该HSV图像H分量的色调直方图中所有波 谷处对应的色调值中,根据最后一个波峰和波谷的位置关系确定1至2个色调值作为分割 阈值分割得到细胞的灰度图像。
细胞核在灰度图像中通常表现为颜色最深的地方,与其他部分差异明显,因此在灰度 图像中实现白细胞的细胞核部分的分割。
细胞核分割过程如下:
(1)计算灰度直方图中的所有波谷点相对应的横坐标,即对应的灰度值,然后选择最 小的灰度值作为分割阈值;
(2)利用阈值分割获得细胞核的初步二值图像,然后采用形态学运算,包括腐蚀,膨 胀,填充和删除来完善细胞核形状。
(3)由于随后的特征提取都是基于灰度图像,因此将二值图像用作掩模以最终获得细 胞核的灰度图像。
而针对整个细胞的分割要更为复杂一点,白细胞的细胞质部分通常容易与背景中红细 胞混淆,在RGB与灰度颜色空间中都较难被分割,但是由于白细胞整体与其他背景部分相 比更偏蓝紫色,它在HSV颜色模型的H分量中有突出表现,所以在色调分量下进行细胞的 分割。然而,在观察所有白细胞图像之后,发现此时图像中的红细胞表现出两种不同的状 态。
第一种红细胞的色调偏向具有较大色相值的紫色,而第二种的色调偏向具有较小色相 值的橙色。因此,针对这两种不同情况,采用了不同的分割策略。
对于第一种,需要确定两个阈值,当色调值位于两个阈值之间时,被认为属于白细胞。
对于第二种,只需要一个阈值即可进行分割。问题的关键是确定图像阈值的数量和值, 利用直方图的峰值进行判断。
细胞分割的步骤如下:
(1)计算直方图的所有波峰和波谷及其相应的色调值;
(2)如果最后一个波峰出现在最后一个波谷之后的话,则判断为第一种情况,需要确 定两个阈值;
(3)如果最后一个波峰出现在最后一个波谷之前的话,则判断为第二种情况,需要确 定一个阈值;
(4)使用阈值分割获得初步的二值图像,然后进行形态学运算以完善细胞形状。
(5)使用此二值图像用作掩模,以获得完整的白细胞灰度图像。
二、白细胞的特征提取与特征选择
细胞分割完成后,基于前人的工作基础,从形态、颜色和纹理方面进行了多组特征的 提取。然而初始特征集中存在许多冗余特征,这些冗余特征将增加计算成本,从而降低分 类效率。在本发明中,设计了一种基于CART的特征选择算法应用于白细胞特征选择。
在前人的工作基础上,从颜色,纹理和形态三个方面进行特征提取,本发明中,从步 骤一分割得到的细胞核灰度图像和细胞灰度图像中分别提取如下特征构成白细胞特征,包 括:基于图像灰度直方图的颜色特征:均值,方差,偏度,峰度,能量和熵;基于灰度共生矩阵的纹理特征:能量,熵,对比度,相关性和逆差矩;基于八链码的形态特征:面积, 周长,圆形度,长宽比,矩形度和核质比。最后分别从分割出的细胞核与细胞中提取了上 述特征,共获得了33个白细胞特征。之后,使用CART特征选择算法从提取的上述的33 个白细胞特征中选择最优特征,得到了所有特征的Gini增益指数,最后,根据Gini增益指 数选择排名前十的白细胞特征组成最优特征子集。
该算法可以根据特定的测量标准自动选择分类特征并确定节点阈值。
执行过程如下:CART算法构造的决策树为二叉树,在每个节点上,根据最优特征从现 节点***为两个子节点,如果拆分后的数据集达到分类精度要求,便停止***。否则,在子节点处继续***。
CART使用Gini指数作为拆分标准,它反映了样本数据的“纯度”。Gini指数值越小,样品的“纯度”越高,分离样品就越容易。假设样本集D包含k个类别,pk表示D中第k个 样本的比例,则D的Gini指数Gini(D)计算如下:
Gini(D)=∑kpk(1-pk)=1-∑kpk 2
如图2所示,如果D根据特征A的某个可能值a被***为DL和DR两个样本集,|·|表示样本集中样本的数量,那么此时,集合D的Gini指数Gini(D,A)定义为:
Figure BDA0002675578150000071
Gini(D)表示集合D的不确定性,而Gini(D,A)表示根据特征A分割后的集合D的不确 定性。因此,Gini(D)和Gini(D,A)之间的差可以用于衡量特征A对于集合D的分类效果。由特征A引起的集合D的Gini系数增益Gain(A)定义为:
Gain(A)=Gini(D)-Gini(D,A)
由此可以得出结论,具有较大Gini增益值的特征对集合D的分类更有利,因为特征选 择的本质是减少集合D的不确定性。可以通过其Gain(A)值判断特征的重要性。
三、引入PSO优化SVM超参数选择,构建PSO-SVM分类器,将上述步骤二得到的 最优特征子集输入至所述PSO-SVM分类器,所述PSO-SVM分类器的输出即为白细胞的分 类结果。
PSO的基本概念源自对鸟类觅食行为的研究,通过群体中个体之间的协作和信息共享 找到最佳解决方案。其数学描述如下:假设搜索空间为M维,共有N个粒子,则第i个粒子的位置xi和速度vi定义为:
xi=(xi1,xi2,...,xiM),i=1,2,...,N
vi=(vi1,vi2,...,viM),i=1,2,...,N
在每次迭代搜索的过程中,k是迭代次数,粒子根据以下公式不断更新自己在第k次迭 代中的速度
Figure BDA0002675578150000072
和位置
Figure BDA0002675578150000073
从而达到寻找全局最优解的目的。其中ω是惯性因子,c1和c2是 加速度因子,r1,r2∈[0,1]是随机数,r3是速度约束因子,
Figure BDA0002675578150000074
是第i个粒子经历过的历史最优 位置,
Figure BDA0002675578150000075
是所有粒子经历过的历史最优位置。每个粒子的位置都是潜在的解决方案,其适 应度值由分类准确率确定。
Figure BDA0002675578150000076
Figure BDA0002675578150000077
本发明中,PSO被用于SVM超参数c和σ的全局寻优。首先初始化PSO,将搜索空间 设置为2维,将粒子数设置为30。惩罚因子c的初始搜索范围设置为[2^cmin,2^cmax], 并且内核参数σ的范围也为[2^σmin,2^σmax],其中cmin=-8,cmax=8,σmin=-8和 σmax=8。在此范围内迭代更新粒子以搜索最佳参数,根据SVM的分类结果来评估粒子的 适应度,直到达到要求的分类精度或最大迭代次数时结束PSO寻优过程。通过PSO算法, 可以获得参数c和σ的最优值。
本发明中,构建PSO-SVM分类器(即PSO-SVM分类器训练)的过程如下:
步骤3-1、PSO初始化;
步骤3-2、将步骤二形成的所述最优特征子集分为训练集和测试集,以所述训练集训练 SVM,根据所述SVM得到的分类准确率计算PSO中粒子的适应度值,记录当前粒子的局部最优值和所有粒子的全局最优值;
步骤3-3、迭代更新粒子的速度与位置,并计算更新后粒子的适应度值;
步骤3-4、比较更新前后的粒子的适应度值,如果更新后的粒子的适应度值更优,则更 新当前粒子的局部最优值和所有粒子的全局最优值;
步骤3-5重复步骤3-2至步骤3-4,直到满足结束条件,得到适应度最优的粒子信息, 至此完成PSO-SVM分类器的构建。
在白细胞分类的过程中,首先输入训练集来训练分类器,通过重复试验,发现当c= 0.0037和σ=0.0063时,训练效果最佳。因此,基于该参数组合构建了PSO-SVM分类器模型。最后,将测试集输入到训练好的PSO-SVM分类器以获得测试集的分类结果。
仿真实验
本发明建立了仿真实验来验证提出算法的准确性和有效性,所有仿真实验均在MATLAB上完成。从互联网上收集并制作了自己的白细胞图像数据集。在经过了初步筛选 和处理后,将图片统一标准化为分辨率201×201的JPG文件。最终得到了包含500张白细 胞图片的数据集,其中每种细胞100张。基于此细胞数据集进行了仿真实验。
为了验证本发明提出的自适应阈值分割方法的有效性,将本发明实验的分割结果与人 工分割结果进行了对比,细胞核的分割结果如图3,细胞的分割结果如图4,从图中可以看 出,本发明的方法分割效果良好,与人工分割结果具有很高的一致性。另外,本发明引入 了最常用的分割相似性度衡量标准Dice系数,在对细胞核与细胞的分割上分别得到了95.98% 以及97.57%的分割准确率,进一步证明了本发明的分割方法的有效性。
将提取出的特征数据集输入到PSO-SVM分类器进行白细胞的分类实验。为了充分利用 样本数据,通过十字交叉验证法将数据集随机分为训练集和测试集,先输入训练集训练分 类器模型,然后输入测试集进行分类测试,最终在500张图片的数据集上使用10种细胞特 征实现了99.76%的分类准确率。另一方面,为了验证CART特征选择方法对分类效率的作 用,使用包含33种特征的数据集进行了分类对比实验,得到了99.84%的准确率。对比发现 在特征降维的过程中,细胞分类准确率仅减少了不到0.1%,但与此同时,实验的运行时间 减少了将近32%。这证明本发明提出的CART特征选择方法在保证高分类准确度的前提下, 确实降低了分类***的计算成本,提高了实验效率。
尽管上面结合附图对本发明进行了描述,但是本发明并不局限于上述的具体实施方式, 上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明 的启示下,在不脱离本发明宗旨的情况下,还可以做出很多变形,这些均属于本发明的保 护之内。

Claims (3)

1.一种基于颜色空间自适应阈值分割的白细胞自动分类方法,其特征在于,包括以下步骤:
步骤一、白细胞的自适应阈值分割:将要分割的白细胞图像从RGB颜色空间分别转换为灰度空间和HSV空间,得到该白细胞的灰度图像和HSV图像,从该灰度图像的灰度直方图中所有波谷处对应的灰度值中选择最小的灰度值作为分割阈值分割得到细胞核的灰度图像;从该HSV图像色调(H)分量的色调直方图中所有波谷处对应的色调值中,根据最后一个波峰和波谷的位置关系确定1至2个色调值作为分割阈值分割得到细胞的灰度图像;
步骤二、白细胞的特征提取与特征选择:首先,从步骤一分割得到的细胞核灰度图像和细胞灰度图像中分别提取如下特征构成白细胞特征,包括:基于图像灰度直方图的颜色特征,基于灰度共生矩阵的纹理特征和基于八链码的形态特征;然后,基于分类和回归树(CART)的特征选择算法得到上述白细胞特征的基尼(Gini)增益指数,最后,根据基尼(Gini)增益指数选择排名前十的白细胞特征组成最优特征子集;
步骤三、引入粒子群优化算法(PSO)优化支持向量机(SVM),构建粒子群优化算法-支持向量机(PSO-SVM)分类器,将上述步骤二得到的最优特征子集输入至所述粒子群优化算法-支持向量机(PSO-SVM)分类器,所述粒子群优化算法-支持向量机(PSO-SVM)分类器的输出即为白细胞的分类结果。
2.根据权利要求1所述的白细胞自动分类方法,其特征在于,步骤三中,构建粒子群优化算法-支持向量机(PSO-SVM)分类器的过程如下:
步骤3-1、粒子群优化算法初始化;
步骤3-2、将步骤二形成的所述最优特征子集分为训练集和测试集,以所述训练集训练支持向量机,根据所述支持向量机得到的分类准确率计算粒子群优化算法中粒子的适应度值,记录当前粒子的局部最优值和所有粒子的全局最优值;
步骤3-3、迭代更新粒子的速度与位置,并计算更新后粒子的适应度值;
步骤3-4、比较更新前后的粒子的适应度值,如果更新后的粒子的适应度值更优,则更新当前粒子的局部最优值和所有粒子的全局最优值;
步骤3-5重复步骤3-2至步骤3-4,直到满足结束条件,得到适应度最优的粒子信息,至此完成粒子群优化算法-支持向量机(PSO-SVM)分类器的构建。
3.根据权利要求2所述的白细胞自动分类方法,其特征在于,粒子群优化算法-支持向量机(PSO-SVM)分类器构建完成后,将所述测试集输入至所述粒子群优化算法-支持向量机(PSO-SVM)分类器进行分类,得到测试集的分类结果,用以验证构建所得的粒子群优化算法-支持向量机(PSO-SVM)分类器的分类效果。
CN202010946847.4A 2020-09-10 2020-09-10 基于颜色空间自适应阈值分割的白细胞自动分类方法 Pending CN112183237A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010946847.4A CN112183237A (zh) 2020-09-10 2020-09-10 基于颜色空间自适应阈值分割的白细胞自动分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010946847.4A CN112183237A (zh) 2020-09-10 2020-09-10 基于颜色空间自适应阈值分割的白细胞自动分类方法

Publications (1)

Publication Number Publication Date
CN112183237A true CN112183237A (zh) 2021-01-05

Family

ID=73921690

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010946847.4A Pending CN112183237A (zh) 2020-09-10 2020-09-10 基于颜色空间自适应阈值分割的白细胞自动分类方法

Country Status (1)

Country Link
CN (1) CN112183237A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113065430A (zh) * 2021-03-22 2021-07-02 天津大学 基于深度学习特征与人工提取特征融合的白细胞分类方法
CN115409834A (zh) * 2022-10-30 2022-11-29 四川大学华西医院 一种用于跟腱病诊断的特征提取方法、***和存储介质
CN116152562A (zh) * 2023-02-23 2023-05-23 北京朗视仪器股份有限公司 一种彩色结构光图像快速颜色分类方法及***

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105894490A (zh) * 2015-11-05 2016-08-24 广西师范大学 基于模糊积分多分类器融合的宫颈细胞图像识别方法及装置
CN106248559A (zh) * 2016-07-14 2016-12-21 中国计量大学 一种基于深度学习的白细胞五分类方法
CN106407983A (zh) * 2016-09-12 2017-02-15 南京理工大学 图像主体的识别、矫正与配准方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105894490A (zh) * 2015-11-05 2016-08-24 广西师范大学 基于模糊积分多分类器融合的宫颈细胞图像识别方法及装置
CN106248559A (zh) * 2016-07-14 2016-12-21 中国计量大学 一种基于深度学习的白细胞五分类方法
CN106407983A (zh) * 2016-09-12 2017-02-15 南京理工大学 图像主体的识别、矫正与配准方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
NA DONG ET AL.: "White blood cell classification", 《ARXIV》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113065430A (zh) * 2021-03-22 2021-07-02 天津大学 基于深度学习特征与人工提取特征融合的白细胞分类方法
CN115409834A (zh) * 2022-10-30 2022-11-29 四川大学华西医院 一种用于跟腱病诊断的特征提取方法、***和存储介质
CN116152562A (zh) * 2023-02-23 2023-05-23 北京朗视仪器股份有限公司 一种彩色结构光图像快速颜色分类方法及***

Similar Documents

Publication Publication Date Title
Sari et al. Unsupervised feature extraction via deep learning for histopathological classification of colon tissue images
CN112418117B (zh) 一种基于无人机图像的小目标检测方法
Yin et al. Cell segmentation in microscopy imagery using a bag of local Bayesian classifiers
CN111652317B (zh) 基于贝叶斯深度学习的超参数图像分割方法
CN108537751B (zh) 一种基于径向基神经网络的甲状腺超声图像自动分割方法
CN112183237A (zh) 基于颜色空间自适应阈值分割的白细胞自动分类方法
Pan et al. Mitosis detection techniques in H&E stained breast cancer pathological images: A comprehensive review
CN109801305B (zh) 基于深度胶囊网络的sar图像变化检测方法
CN113159066B (zh) 基于类间相似度的分布式标签的细粒度图像识别算法
Nateghi et al. Automatic detection of mitosis cell in breast cancer histopathology images using genetic algorithm
Mustafa et al. Comparison of detection method on malaria cell images
Mithra et al. FHDT: fuzzy and Hyco-entropy-based decision tree classifier for tuberculosis diagnosis from sputum images
Jia et al. A parametric optimization oriented, AFSA based random forest algorithm: application to the detection of cervical epithelial cells
Yang et al. An improved algorithm for the detection of fastening targets based on machine vision
Taur Neuro-fuzzy approach to the segmentation of psoriasis images
Wisaeng et al. Brain tumor segmentation using fuzzy otsu threshold morphological algorithm
Tikkanen et al. Training based cell detection from bright-field microscope images
CN105844299B (zh) 一种基于词袋模型的图像分类方法
Rathore et al. CBISC: a novel approach for colon biopsy image segmentation and classification
Gamarra et al. A study of image analysis algorithms for segmentation, feature extraction and classification of cells
CN114140830A (zh) 一种基于循环肿瘤细胞图像的重复识别抑制方法
Yancey Deep Feature Fusion for Mitosis Counting
Aiswariya et al. Global and local entropy based segmentation model for detecting leukemia in blood images
Li et al. Automatic detecting and recognition of casts in urine sediment images
Phadikar et al. Region identification of infected rice images using the concept of fermi energy

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20210105

WD01 Invention patent application deemed withdrawn after publication