CN110263804B - 一种基于安全半监督聚类的医学影像分割方法 - Google Patents

一种基于安全半监督聚类的医学影像分割方法 Download PDF

Info

Publication number
CN110263804B
CN110263804B CN201910371366.2A CN201910371366A CN110263804B CN 110263804 B CN110263804 B CN 110263804B CN 201910371366 A CN201910371366 A CN 201910371366A CN 110263804 B CN110263804 B CN 110263804B
Authority
CN
China
Prior art keywords
sample
clustering
labeled
unlabeled
density
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910371366.2A
Other languages
English (en)
Other versions
CN110263804A (zh
Inventor
郭丽
甘海涛
夏思雨
厉振华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dianzi University
Original Assignee
Hangzhou Dianzi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dianzi University filed Critical Hangzhou Dianzi University
Priority to CN201910371366.2A priority Critical patent/CN110263804B/zh
Publication of CN110263804A publication Critical patent/CN110263804A/zh
Application granted granted Critical
Publication of CN110263804B publication Critical patent/CN110263804B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明公开一种基于安全半监督聚类的医学影像分割方法,涉及半监督FCM聚类和密度峰值聚类方法。首先,采用k‑近邻方法构造局部图,得到图正则项。其次,利用FCM聚类和密度聚类方法估计标记和未标记样本的置信度。然后,在原半监督FCM聚类方法的目标函数中引入样本的置信度加权和基于局部图的正则项,得到安全半监督聚类方法的目标函数。最后,通过迭代优化隶属度矩阵和聚类中心得到聚类结果。本发明解决了标记样本的安全使用问题,同时解决了未标记样本的安全使用问题,提高了对医学影像分割的准确性和鲁棒性。

Description

一种基于安全半监督聚类的医学影像分割方法
技术领域
本发明涉及一种基于半监督聚类的医学影像分割方法,尤其是指一种基于安全半监督聚类的医学影像分割方法,属于基于医学图像的数据挖掘领域。
背景技术
随着可视化技术的不断发展,现代医学已越来越离不开医学影像的信息处理,医学影像在临床诊断、教学科研等方面正发挥着重要的作用。基于半监督聚类的医学影像分割方法集成有限的人工监督信息,即在图像上点击有限的几个点以标识对应区域之间的关系,将这些点作为基于半监督聚类的医学影像分割方法中的带有标签信息的样本数据,利用这些样本数据来指导聚类,从而提高算法性能,使图像分割更加准确。医学影像中的标记一般是由专家完成的,但是在标记过程中可能因为各种情况出现错误标记,并且医学影像往往携带有噪音点和离群点,传统的基于半监督聚类的医学影像分割方法在聚类过程中并没有考虑到以上两个方面。
在该情况下,传统的半监督聚类方法的性能可能比相应的无监督学习方法差,这在一定程度上限制了半监督聚类在医学影像分割中的应用。换句话说,标记数据可能对性能有害,与此同时未标记数据中的噪音点和离群点对性能也有很大的影响。传统的半监督聚类一般认为先验知识有利于学习效果,然而收集到的先验知识(如错误标记样本和噪音),有可能导致学习性能的退化。Xuesong Yin指出了错误的先验知识会导致学习性能的下降。基于上述两个方面,设计安全的半监督学习方法是有意义的。因此,本发明专利试图研发一种不同样本具有不同安全度的机制,以实现聚类性能不低于原无监督聚类和半监督聚类方法。
发明内容
本发明针对传统的基于半监督聚类的医学影像分割方法未同时考虑标记样本和未标记样本的风险性,可能导致最后的分割效果下降的缺点,提出了一种基于安全半监督聚类的医学影像分割方法。
首先,本发明采用k-近邻方法构造局部图,得到图正则项。其次,利用FCM聚类和密度聚类方法估计标记和未标记样本的置信度。然后,在原半监督FCM聚类方法的目标函数中引入样本的置信度加权和基于局部图的正则项,得到安全半监督聚类方法的目标函数。最后,通过迭代优化隶属度矩阵和聚类中心得到聚类结果。技术方案:一种基于安全半监督聚类的医学影像分割方法,该方法包含以下步骤:
步骤一:输入标记和未标记医学影像数据集;
步骤二:对数据集进行FCM聚类,得到数据集的预测标签;
步骤三:运用密度峰值聚类方法,通过未标记样本的局部密度以及与具有较高密度点的最小距离得到未标记样本的置信度,通过标记样本在相同标记样本簇中局部密度以及在与具有较高密度点的最小距离得到标记样本的置信度,并将置信度归一化;
步骤四:构造局部图,目的是将置信度低的标记样本输出限制为邻近样本的输出;
步骤五:将信息整合,构建目标函数;
步骤六:采用迭代优化方法求解优化问题;
步骤七:判定未标记样本的类别,实现医学影像分割。
与传统的半监督聚类方法相比,本发明利用样本之间的密度和距离来衡量样本的置信度,通过构造局部图将置信度低的标记样本限制为近邻样本的输出,使得每个样本都能被安全合理地使用,聚类更加准确和鲁棒。本发明解决了标记样本的安全使用问题,同时解决了未标记样本的安全使用问题,提高了对医学影像分割的准确性和鲁棒性。
附图说明
图1为本发明具体实施流程图。
具体实施方式
结合说明书附图进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权力要求所限定的范围。
为了更好地说明本发明的目的和优点,下面结合附图1和实施例对本发明方法的实施方式做进一步详细说明。
步骤一:输入标记和未标记医学影像数据集;
输入医学影像数据集的标记样本子集:Xl=[x1,...,xl],对应的标签为yk∈{1,...,c},未标记样本子集:Xu=[xl+1,...,xn]。
步骤二:对数据集进行FCM聚类,得到数据集的预测标签;
通过FCM聚类得到数据集的预测标签:
Figure GDA0003109484700000021
使用Kuhn-Munkres算法将预测标签
Figure GDA0003109484700000031
映射到等效标签
Figure GDA0003109484700000032
与给定标签
Figure GDA0003109484700000033
是一致的。
步骤三:运用密度峰值聚类方法,通过未标记样本的局部密度以及与具有较高密度点的最小距离得到未标记样本的置信度,通过标记样本在相同标记样本簇中局部密度以及在与具有较高密度点的最小距离得到标记样本的置信度,并将置信度归一化;
未标记样本的局部密度:
Figure GDA0003109484700000034
其中,j=[1,2,...,n],k=[l+1,...,n],dist(k,j)是点xk与xj的欧式距离,dc为截断距离。
未标记样本与具有较高密度点的最小距离:
Figure GDA0003109484700000035
而对于具有最大密度的数据点:
Figure GDA0003109484700000036
未标记样本置信度:γk=ρkk (4)
未标记样本置信度归一化:
Figure GDA0003109484700000037
标记样本在相同标记样本簇中的局部密度:
Figure GDA0003109484700000038
其中,jy=[1,2,...q],k′=[1,2,...,l],jy表示样本集中与标记样本点xk′标签相同的样本的集合。
标记样本在相同标记样本簇中与具有较高密度点的最小距离:
Figure GDA0003109484700000039
而对于具有最大密度的数据点:
Figure GDA00031094847000000310
标记样本置信度:
Figure GDA00031094847000000311
标记样本置信度归一化:
Figure GDA00031094847000000312
步骤四:构造k-近邻局部图,目的是将置信度低的标记样本输出限制为邻近样本的输出;
构建标记样本的局部邻域图,则局部图边权W=[wk′r]n×n计算为:
Figure GDA0003109484700000041
其中,Np(xk′)指xk′最近邻的p个数据,xk′为标记样本点,xr为近邻样本点,σ表示高斯核函数的宽度参数。
步骤五:将信息整合,构建目标函数。
目标函数如下所示:
Figure GDA0003109484700000042
限制条件如下:
Figure GDA0003109484700000043
步骤六:采用迭代优化方法求解优化问题;
通过最小化上述优化问题,可得到最优解。为了简化计算,将m值设定为2。本发明采用拉格朗日乘子法求解样本隶属度和聚类中心。
未标记样本的隶属度uik
Figure GDA0003109484700000044
其中,
Figure GDA0003109484700000045
Figure GDA0003109484700000046
标记样本的隶属度uik′
Figure GDA0003109484700000051
其中,
Figure GDA0003109484700000052
Figure GDA0003109484700000053
聚类中心vi
Figure GDA0003109484700000054
通过迭代计算得到最终的隶属度矩阵U和聚类中心V。当
Figure GDA0003109484700000055
或达到最大迭代次数时,迭代终止,其中t为当前迭代次数,η是设定的阈值。
步骤七:判定未标记样本的类别,实现医学影像的分割。
得到隶属度矩阵U后,依据隶属度最大原则去模糊化,得到未标记样本的类别,最后进行图像分割,取得结果。

Claims (1)

1.一种基于安全半监督聚类的医学影像分割方法,其特征在于,该方法具体包括以下步骤:
步骤一:输入标记和未标记医学影像数据集;
输入医学影像数据集的标记样本子集:Xl=[x1,...,xl],对应的标签为yk∈{1,...,c},未标记样本子集:Xu=[xl+1,...,xn];
步骤二:对数据集进行FCM聚类,得到数据集的预测标签;
通过FCM聚类得到数据集的预测标签:
Figure FDA0003109484690000011
使用Kuhn-Munkres算法将预测标签
Figure FDA0003109484690000012
映射为
Figure FDA0003109484690000013
使映射标签
Figure FDA0003109484690000014
与给定标签yk类别上保持一致;
步骤三:运用密度峰值聚类方法,通过未标记样本的局部密度和未标记样本与具有较高密度点的最小距离,得到未标记样本的置信度,通过标记样本在相同标记样本簇中局部密度和标记样本与具有较高密度点的最小距离,得到标记样本的置信度,并将置信度归一化;
未标记样本的局部密度:
Figure FDA0003109484690000015
其中,j=[1,2,...,n],k=[l+1,...,n],dist(k,j)是点xk与xj的欧式距离,dc为截断距离;
未标记样本与具有较高密度点的最小距离:
Figure FDA0003109484690000016
而对于具有最大密度的数据点:
Figure FDA0003109484690000017
未标记样本置信度:γk=ρkk (4)
未标记样本置信度归一化:
Figure FDA0003109484690000018
标记样本在相同标记样本簇中的局部密度:
Figure FDA0003109484690000021
其中,jy=[1,2,...q],k′=[1,2,...,l],jy表示样本集中与标记样本点xk′标签相同的样本的集合;
标记样本在相同标记样本簇中与具有较高密度点的最小距离:
Figure FDA0003109484690000022
而对于具有最大密度的数据点:
Figure FDA0003109484690000023
标记样本置信度:
Figure FDA0003109484690000024
标记样本置信度归一化:
Figure FDA0003109484690000025
步骤四:构造k-近邻局部图,目的是将置信度低的标记样本输出限制为邻近样本的输出;
构建标记样本的局部邻域图,则局部图边权W=[wk′r]n×n计算为:
Figure FDA0003109484690000026
其中,Np(xk′)指xk′最近邻的p个数据,xk′为标记样本点,xr为近邻样本点,σ表示高斯核函数的宽度参数;
步骤五:将信息整合,构建目标函数;
目标函数如下所示:
Figure FDA0003109484690000031
限制条件如下:
Figure FDA0003109484690000032
步骤六:采用迭代优化方法求解优化问题;
通过最小化上述优化问题,可得到最优解;为了简化计算,将m值设定为2;本发明采用拉格朗日乘子法求解样本隶属度和聚类中心;
未标记样本的隶属度uik
Figure FDA0003109484690000033
其中,
Figure FDA0003109484690000034
Figure FDA0003109484690000035
标记样本的隶属度uik′
Figure FDA0003109484690000036
其中,
Figure FDA0003109484690000037
Figure FDA0003109484690000041
聚类中心vi
Figure FDA0003109484690000042
通过迭代计算得到最终的隶属度矩阵U和聚类中心V;当
Figure FDA0003109484690000043
或达到最大迭代次数时,迭代终止,其中t为当前迭代次数,η是设定的阈值;
步骤七:判定未标记样本的类别,实现医学影像的分割;
得到隶属度矩阵U后,依据隶属度最大原则去模糊化,得到未标记样本的类别,最后进行图像分割,取得结果。
CN201910371366.2A 2019-05-06 2019-05-06 一种基于安全半监督聚类的医学影像分割方法 Active CN110263804B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910371366.2A CN110263804B (zh) 2019-05-06 2019-05-06 一种基于安全半监督聚类的医学影像分割方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910371366.2A CN110263804B (zh) 2019-05-06 2019-05-06 一种基于安全半监督聚类的医学影像分割方法

Publications (2)

Publication Number Publication Date
CN110263804A CN110263804A (zh) 2019-09-20
CN110263804B true CN110263804B (zh) 2021-08-03

Family

ID=67914306

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910371366.2A Active CN110263804B (zh) 2019-05-06 2019-05-06 一种基于安全半监督聚类的医学影像分割方法

Country Status (1)

Country Link
CN (1) CN110263804B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111612735A (zh) * 2020-04-08 2020-09-01 杭州电子科技大学 基于信息融合安全半监督聚类的肺结节图像分类方法
CN111898704B (zh) * 2020-08-17 2024-05-10 腾讯科技(深圳)有限公司 对内容样本进行聚类的方法和装置
CN113780750B (zh) * 2021-08-18 2024-03-01 同济大学 一种基于医学图像分割的医疗风险评估方法和装置
CN115131610B (zh) * 2022-06-13 2024-02-27 西北工业大学 一种基于数据挖掘的鲁棒半监督图像分类方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106447676A (zh) * 2016-10-12 2017-02-22 浙江工业大学 一种基于快速密度聚类算法的图像分割方法
CN107341812A (zh) * 2017-07-04 2017-11-10 太原理工大学 一种基于超像素和密度聚类的序列肺结节图像分割方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8170306B2 (en) * 2007-04-25 2012-05-01 Siemens Aktiengesellschaft Automatic partitioning and recognition of human body regions from an arbitrary scan coverage image
CN104156438A (zh) * 2014-08-12 2014-11-19 德州学院 一种基于置信度和聚类的未标记样本选择的方法
CN104881687A (zh) * 2015-06-02 2015-09-02 四川理工学院 基于半监督高斯混合模型的磁共振图像分类方法
CN105825226A (zh) * 2016-03-11 2016-08-03 江苏畅远信息科技有限公司 一种基于关联规则的分布式多标签图像识别方法
CN106611418A (zh) * 2016-03-29 2017-05-03 四川用联信息技术有限公司 一种图像分割算法
CN108629783B (zh) * 2018-05-02 2021-05-04 山东师范大学 基于图像特征密度峰值搜索的图像分割方法、***及介质
CN109409400A (zh) * 2018-08-28 2019-03-01 西安电子科技大学 基于k近邻和多类合并密度峰值聚类方法、图像分割***

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106447676A (zh) * 2016-10-12 2017-02-22 浙江工业大学 一种基于快速密度聚类算法的图像分割方法
CN107341812A (zh) * 2017-07-04 2017-11-10 太原理工大学 一种基于超像素和密度聚类的序列肺结节图像分割方法

Also Published As

Publication number Publication date
CN110263804A (zh) 2019-09-20

Similar Documents

Publication Publication Date Title
CN110263804B (zh) 一种基于安全半监督聚类的医学影像分割方法
Wu et al. Handwritten mathematical expression recognition via paired adversarial learning
CN112115995B (zh) 一种基于半监督学习的图像多标签分类方法
Azadi et al. Auxiliary image regularization for deep cnns with noisy labels
Cao et al. A multi-kernel based framework for heterogeneous feature selection and over-sampling for computer-aided detection of pulmonary nodules
CN110188827B (zh) 一种基于卷积神经网络和递归自动编码器模型的场景识别方法
CN113408605A (zh) 基于小样本学习的高光谱图像半监督分类方法
CN113326731A (zh) 一种基于动量网络指导的跨域行人重识别算法
CN112614131A (zh) 基于形变表示学习的病理图像分析方法
CN111581466B (zh) 特征信息存在噪声的偏多标记学习方法
CN110458022B (zh) 一种基于域适应的可自主学习目标检测方法
CN110555459A (zh) 基于模糊聚类和支持向量回归的成绩预测方法
CN113674288B (zh) 一种非小细胞肺癌数字病理图像组织自动分割方法
Khanykov et al. Image segmentation improvement by reversible segment merging
Cho et al. Effective pseudo-labeling based on heatmap for unsupervised domain adaptation in cell detection
CN113222072A (zh) 基于K-means聚类和GAN的肺部X光图像分类方法
CN113535947A (zh) 一种带有缺失标记的不完备数据的多标记分类方法及装置
CN117393098A (zh) 基于视觉先验和跨模态对齐网络的医疗影像报告生成方法
CN116258978A (zh) 一种自然保护区遥感影像弱标注的目标检测方法
Bai et al. A unified deep learning model for protein structure prediction
CN116363460A (zh) 基于主题模型的高分辨率遥感样本标注方法
CN113469270B (zh) 基于分解多目标差分进化超像素的半监督直觉聚类方法
CN113592045B (zh) 从印刷体到手写体的模型自适应文本识别方法和***
CN114692746A (zh) 一种基于信息熵的模糊半监督支持向量机的分类方法
CN114399687A (zh) 基于空间校正的半监督自训练的高光谱遥感图像分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant