CN110263804B - 一种基于安全半监督聚类的医学影像分割方法 - Google Patents
一种基于安全半监督聚类的医学影像分割方法 Download PDFInfo
- Publication number
- CN110263804B CN110263804B CN201910371366.2A CN201910371366A CN110263804B CN 110263804 B CN110263804 B CN 110263804B CN 201910371366 A CN201910371366 A CN 201910371366A CN 110263804 B CN110263804 B CN 110263804B
- Authority
- CN
- China
- Prior art keywords
- sample
- clustering
- labeled
- unlabeled
- density
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000003709 image segmentation Methods 0.000 title claims abstract description 19
- 239000011159 matrix material Substances 0.000 claims abstract description 6
- 238000005457 optimization Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 4
- 230000011218 segmentation Effects 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 2
- 230000006870 function Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000007786 learning performance Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000003759 clinical diagnosis Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/136—Segmentation; Edge detection involving thresholding
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Image Analysis (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明公开一种基于安全半监督聚类的医学影像分割方法,涉及半监督FCM聚类和密度峰值聚类方法。首先,采用k‑近邻方法构造局部图,得到图正则项。其次,利用FCM聚类和密度聚类方法估计标记和未标记样本的置信度。然后,在原半监督FCM聚类方法的目标函数中引入样本的置信度加权和基于局部图的正则项,得到安全半监督聚类方法的目标函数。最后,通过迭代优化隶属度矩阵和聚类中心得到聚类结果。本发明解决了标记样本的安全使用问题,同时解决了未标记样本的安全使用问题,提高了对医学影像分割的准确性和鲁棒性。
Description
技术领域
本发明涉及一种基于半监督聚类的医学影像分割方法,尤其是指一种基于安全半监督聚类的医学影像分割方法,属于基于医学图像的数据挖掘领域。
背景技术
随着可视化技术的不断发展,现代医学已越来越离不开医学影像的信息处理,医学影像在临床诊断、教学科研等方面正发挥着重要的作用。基于半监督聚类的医学影像分割方法集成有限的人工监督信息,即在图像上点击有限的几个点以标识对应区域之间的关系,将这些点作为基于半监督聚类的医学影像分割方法中的带有标签信息的样本数据,利用这些样本数据来指导聚类,从而提高算法性能,使图像分割更加准确。医学影像中的标记一般是由专家完成的,但是在标记过程中可能因为各种情况出现错误标记,并且医学影像往往携带有噪音点和离群点,传统的基于半监督聚类的医学影像分割方法在聚类过程中并没有考虑到以上两个方面。
在该情况下,传统的半监督聚类方法的性能可能比相应的无监督学习方法差,这在一定程度上限制了半监督聚类在医学影像分割中的应用。换句话说,标记数据可能对性能有害,与此同时未标记数据中的噪音点和离群点对性能也有很大的影响。传统的半监督聚类一般认为先验知识有利于学习效果,然而收集到的先验知识(如错误标记样本和噪音),有可能导致学习性能的退化。Xuesong Yin指出了错误的先验知识会导致学习性能的下降。基于上述两个方面,设计安全的半监督学习方法是有意义的。因此,本发明专利试图研发一种不同样本具有不同安全度的机制,以实现聚类性能不低于原无监督聚类和半监督聚类方法。
发明内容
本发明针对传统的基于半监督聚类的医学影像分割方法未同时考虑标记样本和未标记样本的风险性,可能导致最后的分割效果下降的缺点,提出了一种基于安全半监督聚类的医学影像分割方法。
首先,本发明采用k-近邻方法构造局部图,得到图正则项。其次,利用FCM聚类和密度聚类方法估计标记和未标记样本的置信度。然后,在原半监督FCM聚类方法的目标函数中引入样本的置信度加权和基于局部图的正则项,得到安全半监督聚类方法的目标函数。最后,通过迭代优化隶属度矩阵和聚类中心得到聚类结果。技术方案:一种基于安全半监督聚类的医学影像分割方法,该方法包含以下步骤:
步骤一:输入标记和未标记医学影像数据集;
步骤二:对数据集进行FCM聚类,得到数据集的预测标签;
步骤三:运用密度峰值聚类方法,通过未标记样本的局部密度以及与具有较高密度点的最小距离得到未标记样本的置信度,通过标记样本在相同标记样本簇中局部密度以及在与具有较高密度点的最小距离得到标记样本的置信度,并将置信度归一化;
步骤四:构造局部图,目的是将置信度低的标记样本输出限制为邻近样本的输出;
步骤五:将信息整合,构建目标函数;
步骤六:采用迭代优化方法求解优化问题;
步骤七:判定未标记样本的类别,实现医学影像分割。
与传统的半监督聚类方法相比,本发明利用样本之间的密度和距离来衡量样本的置信度,通过构造局部图将置信度低的标记样本限制为近邻样本的输出,使得每个样本都能被安全合理地使用,聚类更加准确和鲁棒。本发明解决了标记样本的安全使用问题,同时解决了未标记样本的安全使用问题,提高了对医学影像分割的准确性和鲁棒性。
附图说明
图1为本发明具体实施流程图。
具体实施方式
结合说明书附图进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权力要求所限定的范围。
为了更好地说明本发明的目的和优点,下面结合附图1和实施例对本发明方法的实施方式做进一步详细说明。
步骤一:输入标记和未标记医学影像数据集;
输入医学影像数据集的标记样本子集:Xl=[x1,...,xl],对应的标签为yk∈{1,...,c},未标记样本子集:Xu=[xl+1,...,xn]。
步骤二:对数据集进行FCM聚类,得到数据集的预测标签;
步骤三:运用密度峰值聚类方法,通过未标记样本的局部密度以及与具有较高密度点的最小距离得到未标记样本的置信度,通过标记样本在相同标记样本簇中局部密度以及在与具有较高密度点的最小距离得到标记样本的置信度,并将置信度归一化;
其中,j=[1,2,...,n],k=[l+1,...,n],dist(k,j)是点xk与xj的欧式距离,dc为截断距离。
未标记样本置信度:γk=ρk/δk (4)
标记样本在相同标记样本簇中的局部密度:
其中,jy=[1,2,...q],k′=[1,2,...,l],jy表示样本集中与标记样本点xk′标签相同的样本的集合。
标记样本在相同标记样本簇中与具有较高密度点的最小距离:
步骤四:构造k-近邻局部图,目的是将置信度低的标记样本输出限制为邻近样本的输出;
构建标记样本的局部邻域图,则局部图边权W=[wk′r]n×n计算为:
其中,Np(xk′)指xk′最近邻的p个数据,xk′为标记样本点,xr为近邻样本点,σ表示高斯核函数的宽度参数。
步骤五:将信息整合,构建目标函数。
目标函数如下所示:
限制条件如下:
步骤六:采用迭代优化方法求解优化问题;
通过最小化上述优化问题,可得到最优解。为了简化计算,将m值设定为2。本发明采用拉格朗日乘子法求解样本隶属度和聚类中心。
未标记样本的隶属度uik:
标记样本的隶属度uik′:
聚类中心vi:
步骤七:判定未标记样本的类别,实现医学影像的分割。
得到隶属度矩阵U后,依据隶属度最大原则去模糊化,得到未标记样本的类别,最后进行图像分割,取得结果。
Claims (1)
1.一种基于安全半监督聚类的医学影像分割方法,其特征在于,该方法具体包括以下步骤:
步骤一:输入标记和未标记医学影像数据集;
输入医学影像数据集的标记样本子集:Xl=[x1,...,xl],对应的标签为yk∈{1,...,c},未标记样本子集:Xu=[xl+1,...,xn];
步骤二:对数据集进行FCM聚类,得到数据集的预测标签;
步骤三:运用密度峰值聚类方法,通过未标记样本的局部密度和未标记样本与具有较高密度点的最小距离,得到未标记样本的置信度,通过标记样本在相同标记样本簇中局部密度和标记样本与具有较高密度点的最小距离,得到标记样本的置信度,并将置信度归一化;
其中,j=[1,2,...,n],k=[l+1,...,n],dist(k,j)是点xk与xj的欧式距离,dc为截断距离;
未标记样本置信度:γk=ρk/δk (4)
标记样本在相同标记样本簇中的局部密度:
其中,jy=[1,2,...q],k′=[1,2,...,l],jy表示样本集中与标记样本点xk′标签相同的样本的集合;
标记样本在相同标记样本簇中与具有较高密度点的最小距离:
而对于具有最大密度的数据点:
标记样本置信度:
步骤四:构造k-近邻局部图,目的是将置信度低的标记样本输出限制为邻近样本的输出;
构建标记样本的局部邻域图,则局部图边权W=[wk′r]n×n计算为:
其中,Np(xk′)指xk′最近邻的p个数据,xk′为标记样本点,xr为近邻样本点,σ表示高斯核函数的宽度参数;
步骤五:将信息整合,构建目标函数;
目标函数如下所示:
限制条件如下:
步骤六:采用迭代优化方法求解优化问题;
通过最小化上述优化问题,可得到最优解;为了简化计算,将m值设定为2;本发明采用拉格朗日乘子法求解样本隶属度和聚类中心;
未标记样本的隶属度uik:
标记样本的隶属度uik′:
聚类中心vi:
步骤七:判定未标记样本的类别,实现医学影像的分割;
得到隶属度矩阵U后,依据隶属度最大原则去模糊化,得到未标记样本的类别,最后进行图像分割,取得结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910371366.2A CN110263804B (zh) | 2019-05-06 | 2019-05-06 | 一种基于安全半监督聚类的医学影像分割方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910371366.2A CN110263804B (zh) | 2019-05-06 | 2019-05-06 | 一种基于安全半监督聚类的医学影像分割方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110263804A CN110263804A (zh) | 2019-09-20 |
CN110263804B true CN110263804B (zh) | 2021-08-03 |
Family
ID=67914306
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910371366.2A Active CN110263804B (zh) | 2019-05-06 | 2019-05-06 | 一种基于安全半监督聚类的医学影像分割方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110263804B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111612735A (zh) * | 2020-04-08 | 2020-09-01 | 杭州电子科技大学 | 基于信息融合安全半监督聚类的肺结节图像分类方法 |
CN111898704B (zh) * | 2020-08-17 | 2024-05-10 | 腾讯科技(深圳)有限公司 | 对内容样本进行聚类的方法和装置 |
CN113780750B (zh) * | 2021-08-18 | 2024-03-01 | 同济大学 | 一种基于医学图像分割的医疗风险评估方法和装置 |
CN115131610B (zh) * | 2022-06-13 | 2024-02-27 | 西北工业大学 | 一种基于数据挖掘的鲁棒半监督图像分类方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106447676A (zh) * | 2016-10-12 | 2017-02-22 | 浙江工业大学 | 一种基于快速密度聚类算法的图像分割方法 |
CN107341812A (zh) * | 2017-07-04 | 2017-11-10 | 太原理工大学 | 一种基于超像素和密度聚类的序列肺结节图像分割方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8170306B2 (en) * | 2007-04-25 | 2012-05-01 | Siemens Aktiengesellschaft | Automatic partitioning and recognition of human body regions from an arbitrary scan coverage image |
CN104156438A (zh) * | 2014-08-12 | 2014-11-19 | 德州学院 | 一种基于置信度和聚类的未标记样本选择的方法 |
CN104881687A (zh) * | 2015-06-02 | 2015-09-02 | 四川理工学院 | 基于半监督高斯混合模型的磁共振图像分类方法 |
CN105825226A (zh) * | 2016-03-11 | 2016-08-03 | 江苏畅远信息科技有限公司 | 一种基于关联规则的分布式多标签图像识别方法 |
CN106611418A (zh) * | 2016-03-29 | 2017-05-03 | 四川用联信息技术有限公司 | 一种图像分割算法 |
CN108629783B (zh) * | 2018-05-02 | 2021-05-04 | 山东师范大学 | 基于图像特征密度峰值搜索的图像分割方法、***及介质 |
CN109409400A (zh) * | 2018-08-28 | 2019-03-01 | 西安电子科技大学 | 基于k近邻和多类合并密度峰值聚类方法、图像分割*** |
-
2019
- 2019-05-06 CN CN201910371366.2A patent/CN110263804B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106447676A (zh) * | 2016-10-12 | 2017-02-22 | 浙江工业大学 | 一种基于快速密度聚类算法的图像分割方法 |
CN107341812A (zh) * | 2017-07-04 | 2017-11-10 | 太原理工大学 | 一种基于超像素和密度聚类的序列肺结节图像分割方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110263804A (zh) | 2019-09-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110263804B (zh) | 一种基于安全半监督聚类的医学影像分割方法 | |
Wu et al. | Handwritten mathematical expression recognition via paired adversarial learning | |
CN112115995B (zh) | 一种基于半监督学习的图像多标签分类方法 | |
Azadi et al. | Auxiliary image regularization for deep cnns with noisy labels | |
Cao et al. | A multi-kernel based framework for heterogeneous feature selection and over-sampling for computer-aided detection of pulmonary nodules | |
CN110188827B (zh) | 一种基于卷积神经网络和递归自动编码器模型的场景识别方法 | |
CN113408605A (zh) | 基于小样本学习的高光谱图像半监督分类方法 | |
CN113326731A (zh) | 一种基于动量网络指导的跨域行人重识别算法 | |
CN112614131A (zh) | 基于形变表示学习的病理图像分析方法 | |
CN111581466B (zh) | 特征信息存在噪声的偏多标记学习方法 | |
CN110458022B (zh) | 一种基于域适应的可自主学习目标检测方法 | |
CN110555459A (zh) | 基于模糊聚类和支持向量回归的成绩预测方法 | |
CN113674288B (zh) | 一种非小细胞肺癌数字病理图像组织自动分割方法 | |
Khanykov et al. | Image segmentation improvement by reversible segment merging | |
Cho et al. | Effective pseudo-labeling based on heatmap for unsupervised domain adaptation in cell detection | |
CN113222072A (zh) | 基于K-means聚类和GAN的肺部X光图像分类方法 | |
CN113535947A (zh) | 一种带有缺失标记的不完备数据的多标记分类方法及装置 | |
CN117393098A (zh) | 基于视觉先验和跨模态对齐网络的医疗影像报告生成方法 | |
CN116258978A (zh) | 一种自然保护区遥感影像弱标注的目标检测方法 | |
Bai et al. | A unified deep learning model for protein structure prediction | |
CN116363460A (zh) | 基于主题模型的高分辨率遥感样本标注方法 | |
CN113469270B (zh) | 基于分解多目标差分进化超像素的半监督直觉聚类方法 | |
CN113592045B (zh) | 从印刷体到手写体的模型自适应文本识别方法和*** | |
CN114692746A (zh) | 一种基于信息熵的模糊半监督支持向量机的分类方法 | |
CN114399687A (zh) | 基于空间校正的半监督自训练的高光谱遥感图像分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |