CN105718950B - 一种基于结构约束的半监督多视角聚类方法 - Google Patents

一种基于结构约束的半监督多视角聚类方法 Download PDF

Info

Publication number
CN105718950B
CN105718950B CN201610041391.0A CN201610041391A CN105718950B CN 105718950 B CN105718950 B CN 105718950B CN 201610041391 A CN201610041391 A CN 201610041391A CN 105718950 B CN105718950 B CN 105718950B
Authority
CN
China
Prior art keywords
matrix
view
view data
semi
prior information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610041391.0A
Other languages
English (en)
Other versions
CN105718950A (zh
Inventor
王亮
吴书
尹奇跃
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin Zhongke Intelligent Identification Co ltd
Original Assignee
Tianjin Zhongke Intelligent Identification Industry Technology Research Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin Zhongke Intelligent Identification Industry Technology Research Institute Co Ltd filed Critical Tianjin Zhongke Intelligent Identification Industry Technology Research Institute Co Ltd
Priority to CN201610041391.0A priority Critical patent/CN105718950B/zh
Publication of CN105718950A publication Critical patent/CN105718950A/zh
Application granted granted Critical
Publication of CN105718950B publication Critical patent/CN105718950B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于结构约束的半监督多视角聚类方法,该方法通过回归的方式优化多视角数据的结构信息,即归一化类别矩阵,同时利用先验信息直接指导多视角数据结构信息的学习,以进一步对归一化类别矩阵进行结构约束,从而在给定先验信息时可以有效提升多视角聚类性能。考虑到不同视角在学习时所起作用不同,本发明将特征学习嵌入到多视角数据结构信息的学习中以进一步提升聚类性。

Description

一种基于结构约束的半监督多视角聚类方法
技术领域
本发明涉及模式识别技术领域,尤其是一种基于半监督情况下的多视角的数据聚类方法。
背景技术
随着计算机视觉技术与多媒体技术的迅猛发展,数据往往表现出不同的特征描述方法,比如单个网页可以由图片,文本以及超级链接等信息进行描述;图片可有由不同的视觉描述算子(如SIFT和GIST特征)进行编码。以上数据称为多视角数据,每一个视角对应一种特征集。多视角数据的***式增长,促进着多视角学习的发展,并产生广泛的应用。多视角聚类,作为多视角学习的基本任务,旨在挖掘不同视角之间的信息互补特性以提升数据聚类性能。
近些年来,如何利用先验信息,如用户标注的部分样本间的相似性关系,来提升多视角聚类受到了广泛的关注,也称为半监督多视角聚类。这类先验信息具有较强的语义特性,可以有效对多视角聚类进行指导。传统的半监督多视角聚类方法一般采用软正则化(soft regularization)或者硬约束(hard constraints)的方法来使用半监督信息,但是它们不能显式地利用先验信息所表现出来的结构信息对多视角聚类进行指导,同时也不能较好地处理多视角数据特征的选择问题。因此,传统的半监督多视角聚类方法不能有效地提升聚类性能,不能有效的满足半监督多视角聚类的需求。
发明内容
鉴于此,本发明提出了一种基于结构约束的半监督多视角聚类方法。
本发明是这样实现的,一种基于结构约束的半监督多视角聚类方法,包括步骤:
S1,收集多视角数据并提取所述多视角数据的特征;
S2,人工标注部分样本点并以样本点构造样本间相似性关系作为先验信息;
S3,将多视角数据特征进行串联并以回归的方式采用线性投影矩阵的方式学习多视角数据的归一化类别矩阵,该归一化类别矩阵具有非负且列正交的特性;
S4,设计所述线性投影矩阵的正则化方式以进行不同视角的特征权重学习,并构造优化目标;
S5,将先验信息作为正则项加入到所述优化目标中使先验信息直接约束多视角数据的归一化类别矩阵,形成最终的优化目标函数;
S6,采用交替优化方式求解所述优化目标,直至模型收敛,得到多视角数据的归一化类别矩阵;
S7,对所述归一化类别矩阵进行处理,得到最终的多视角数据聚类结果。
本发明以回归的方式通过线性投影矩阵直接优化多视角数据的结构信息,即归一化类别矩阵,同时在回归过程中加入对投影矩阵的结构约束以对不同视角特征权重学习,构造优化目标,利用先验信息直接约束多视角数据的归一化类别矩阵,指导归一化类别矩阵的学习,对不符合先验信息的归一化类别矩阵的部分进行惩罚,形成最终的优化目标函数,通过交替优化方式优化目标得到多视角数据的归一化类别矩阵,通过处理最终的归一化类别矩阵,得到最终的多视角数据聚类结果,从而起到了有效的聚类。
附图说明
图1是本发明基于结构约束的半监督多视角聚类方法的流程图;
图2是本发明利用先验信息设计正则项的示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
参见图1所示,一种基于结构约束的半监督多视角聚类方法,包括步骤:
步骤S1,收集多视角数据并提取不同视角数据的特征;
步骤S2,人工标注部分样本间相似性关系作为先验信息;
步骤S3,将多视角数据特征进行串联,并以回归的方式采用线性投影矩阵学习多视角数据的归一化类别矩阵;
步骤S4,设计所述线性投影矩阵的正则化方式以进行不同视角的特征权重学习,并构造优化目标;
步骤S5,将先验信息作为正则项加入到所述优化目标中使其直接约束多视角数据的归一化类别矩阵,并形成最终的优化目标函数;
步骤S6,采用交替优化方式求解所述优化目标,直至模型收敛,得到多视角数据的归一化类别矩阵;
步骤S7,对所述归一化类别矩阵进行处理,得到最终的多视角数据聚类结果。
本发明可直接得到多视角数据的聚类结构,即归一化类别矩阵,同时以线性投影的方法对投影矩阵约束实现不同视角特征权重学习,以先验信息作为正则项加入优化目标直接对数据的聚类结构进行约束,达到指导多视角聚类的目的。
本发明以回归的方式通过线性投影矩阵直接优化多视角数据的结构信息,即归一化类别矩阵,同时在回归过程中加入对投影矩阵的结构约束以对不同视角特征权重学习,构造优化目标,利用先验信息直接约束多视角数据的归一化类别矩阵,指导归一化类别矩阵的学习,对不符合先验信息的归一化类别矩阵的部分进行惩罚,形成最终的优化目标函数,通过交替优化方式优化目标得到多视角数据的归一化类别矩阵,通过处理最终的归一化类别矩阵,得到最终的多视角数据聚类结果,从而起到了有效的聚类。
需要说明的是,本发明中,所述的多视角的特征可以由同质或者异质特征组成,比如图片的颜色和纹理特征,网页的图片和文本特征,具体不限。
本发明中,步骤S2,所述人工标注部分样本间相似性关系作为先验信息,具体是指随机标注一定比例的样本点,并以此样本点构造相似性关系,即属于同一类别的样本相似,不属于同一类的样本不相似。
参见图2所示,具体的,本发明中,所述先验信息由矩阵表示,其元素值为1,-1和?,分别表示两个样本属于同一类别,属于不同类别,未观测到两样本之间的关系。
其中,所述的相似性关系表示两个样本是否属于同一类别。所述先验信息在多视角聚类之前作为已知信息加入到模型中,可以提升多视角聚类性能。
本发明中,所述的归一化类别矩阵作为多视角数据的结构信息,满足矩阵列正交,且矩阵所有元素非负。
具体实现上,所述线性投影矩阵通过增加或设计结构稀疏约束以正则化方式对各个视角特征的权重进行自动学习。
进一步的,所述结构稀疏约束采用G范数约束
具体的,本发明中,所述线性投影矩阵的结构稀疏约束---G范数约束定义为:
其中,c为多视角数据的聚类数目,m为视角数目,对应第q个视角的针对第p个聚类的投影向量;
最后得到优化目标为:
其中,X为多视角数据特征串接组成的矩阵,每一列表示为一个样本点;W为线性投影矩阵;F为所优化归一化类别矩阵,其满足列正交和非负约束;||W||G是对W的约束,以起到不同视角特征的权重学习;γ1为预设的比例系数。
具体实现上,本发明中,步骤S5中,将先验信息作为正则项加入到优化目标中使先验信息直接约束多视角数据的归一化类别矩阵中的正则项表示为:
Σij(Ip)ij(FFT)ij
其中,Ip为指示矩阵,FFT为由归一化类别矩阵F构造的样本间相似性关系,通过最小化此正则项可以对不满足先验信息的归一化类别矩阵的部分进行惩罚,进而起到指导归一化类别矩阵学习的作用。
参见图2所示,该图显示了利用先验信息设计正则项的方法,所述正则项可以通过图示方法进行设计,展示了先验信息结构,先验信息约束下的归一化类别矩阵结构以及正则项设计时所使用的指示矩阵。
最终的优化目标为:
其中,γ2为预设的比例系数。
本发明的步骤S6中,采用交替优化方式求解所述优化目标,直到算法收敛,得到多视角数据的归一化类别矩阵,具体为采用交替优化方式求解F和W,直至算法收敛,步骤如下:
固定W,则目标函数改写为
采用拉格朗日乘子法进行求解,针对归一化类别矩阵的非负约束,采用KKT条件,F计算方式为:
其中为拉格朗日乘子法求解所述优化目标的拉格朗日乘子,其计算方式为
对于任意一矩阵C,
固定F,则目标函数改写为:
则W可以依据梯度进行求解,满足:
wk=(XXT1Q)-1(Xfk)
其中,wk为W的第k列,fk为F的第k列,Q为对角矩阵,且满足第i个元素为其中,为对应第i个视角的针对第k个聚类的投影向量。
具体的,本发明在步骤S7中,对所述归一化类别矩阵进行处理,得到最终的多视角数据聚类结果,具体采用以下方法进行:
1)由于所述归一化类别矩阵的每一行对应一个样本,可将每一行最大值所在的位置作为其对应样本点的聚类类别,得到最终的多视角数据聚类结果。
2)也可以是将所述归一化类别矩阵作为多视角数据的低维表达进行kmeans聚类,得到最终的多视角数据聚类结果。
本发明以回归的方式通过投影矩阵直接优化多视角数据的结构信息,即归一化类别矩阵,同时在回归过程中加入对投影矩阵的结构约束以对不同视角特征进行选择,针对先验信息设计指示矩阵,以对不符合先验信息的归一化类别矩阵的部分进行惩罚,进而利用先验信息指导归一化类别矩阵的学习,从而起到了有效的聚类。
为了验证本发明实施效果,下面以USPS Digits 0-9数字数据库为例进行说明。该数据库包含2000幅图像,共计10个类别,每类包含200幅图像。具体步骤如下:
步骤S1,提取USPS Digits图片库的fourier coefficients,profilecorrelations和zernike moments三种特征,作为所述数据库的三个视角。
步骤S2,人工标注部分样本间相似性关系作为先验信息,这里,随机标注一定比例的样本点,并以此样本点构造相似性关系,即属于同一类别的样本相似,不属于同一类的样本不相似。
步骤S3,将多视角数据特征进行串联得到X,并以回归的方式采用线性投影矩阵学习多视角数据的归一化类别矩阵F和投影矩阵W。
步骤S4,设计所述线性投影矩阵W的正则化方式,即||W||G
步骤S5,将先验信息作为正则项加入到所述优化目标中使其直接约束多视角数据的归一化类别矩阵,并形成最终的优化目标函数。
步骤S6,令γ1和γ2取值为0.001和0.01,并采用交替优化方式求解所述优化目标得到多视角数据的归一化类别矩阵F。
步骤S7,对所述所得归一化类别矩阵,找到每一行中最大元素所在的位置作为其对应样本点的聚类。
以下的表1和表2分别是本发明以归一化互信息NMI和准确率ACC为观测指标在不同给定先验信息下与其它聚类方法的性能比较;
Method 0% 10% 20% 30%
SULF 44.09 61.89 66.33 66.11
PSLF 44.89 73.56 75.39 77.63
PairwiseSC 73.73 76.35 77.04 74.89
CentroidSC 74.38 77.46 79.07 80.58
My 71.87 78.06 78.50 91.71
表1
Method 0% 10% 20% 30%
SULF 52.46 62.89 69.76 66.67
PSLF 57.27 79.51 81.23 84.03
PairwiseSC 78.88 76.36 74.15 69.39
CentroidSC 83.20 84.85 80.37 83.59
My 78.09 87.03 87.98 92.18
表2
以上表1-2中,可以看出,本发明在不同给定先验信息下,在归一化互信息和准确率为观测指标上与其它聚类方法相比,具有明显的优越性。其中,0%--30%表示样本点的不同的标注比例,My指本发明方法,SULF、PSLF、PairwiseSC、CentroidSX分别表示两种基于非负矩阵分解和两种基于谱分解的半监督多视角聚类方法。
以上所述的具体实施例,对本发明的目的、技术方案和效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种基于结构约束的半监督多视角聚类方法,其特征在于,包括步骤:
S1,收集多视角数据并提取所述多视角数据的特征;
S2,人工标注部分样本点并以样本点构造样本间相似性关系作为先验信息;
S3,将多视角数据特征进行串联并以回归的方式采用线性投影矩阵的方式学习多视角数据的归一化类别矩阵,该归一化类别矩阵具有非负且列正交的特性;
S4,设计所述线性投影矩阵的正则化方式以进行不同视角的特征权重学习,并构造优化目标;
S5,将先验信息作为正则项加入到所述优化目标中使先验信息直接约束多视角数据的归一化类别矩阵,形成最终的优化目标函数;
S6,采用交替优化方式求解所述优化目标,直至模型收敛,得到多视角数据的归一化类别矩阵;
S7,对所述归一化类别矩阵进行处理,得到最终的多视角数据聚类结果。
2.根据权利要求1所述基于结构约束的半监督多视角聚类方法,其特征在于,所述先验信息由矩阵表示,其元素值为1,-1和?,分别表示两个样本属于同一类别,属于不同类别,未观测到两样本之间的关系。
3.根据权利要求1所述基于结构约束的半监督多视角聚类方法,其特征在于,所述线性投影矩阵通过增加结构稀疏约束对各个视角特征的权重进行自动学习。
4.根据权利要求3所述基于结构约束的半监督多视角聚类方法,其特征在于,所述结构稀疏约束采用G范数约束。
5.根据权利要求1所述基于结构约束的半监督多视角聚类方法,其特征在于,所述S5中,将先验信息作为正则项加入到所述优化目标中使所述先验信息直接约束多视角数据的归一化类别矩阵,形成最终的优化目标函数是在所述正则项中引入指示矩阵,通过最小化该正则项对不符合先验信息的归一化类别矩阵的部分进行惩罚,以使得归一化类别矩阵满足先验信息的约束。
6.根据权利要求1-5任一项所述基于结构约束的半监督多视角聚类方法,其特征在于,所述S5中的最终优化目标函数为:
其中,X为多视角数据特征串接组成的矩阵,每一列表示为一个样本点;W为线性投影矩阵;F为所优化归一化类别矩阵,满足列正交和非负约束;Ip为指示矩阵,以实现对不满足先验信息所对应的归一化类别矩阵的部分进行惩罚;FFT为由归一化类别矩阵F构造的样本间相似性关系,||W||G是对W的G范数约束,以起到不同视角特征的权重学习;γ1和γ2为预设的比例系数,
所述G范数约束定义为:
其中,c为多视角数据的聚类数目,m为视角数目,对应第q个视角的针对第p个聚类的投影向量。
7.根据权利要求1所述基于结构约束的半监督多视角聚类方法,其特征在于,所述S7中,对所述归一化类别矩阵进行处理,得到最终的多视角数据聚类结果,是将所求归一化类别矩阵每一行最大元素所在位置作为此行所对应的样本点的聚类类别实现的。
8.根据权利要求1所述基于结构约束的半监督多视角聚类方法,其特征在于,所述S1中,所述多视角数据包括同质和\或异质数据。
CN201610041391.0A 2016-01-22 2016-01-22 一种基于结构约束的半监督多视角聚类方法 Active CN105718950B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610041391.0A CN105718950B (zh) 2016-01-22 2016-01-22 一种基于结构约束的半监督多视角聚类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610041391.0A CN105718950B (zh) 2016-01-22 2016-01-22 一种基于结构约束的半监督多视角聚类方法

Publications (2)

Publication Number Publication Date
CN105718950A CN105718950A (zh) 2016-06-29
CN105718950B true CN105718950B (zh) 2018-11-27

Family

ID=56154804

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610041391.0A Active CN105718950B (zh) 2016-01-22 2016-01-22 一种基于结构约束的半监督多视角聚类方法

Country Status (1)

Country Link
CN (1) CN105718950B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108268488B (zh) * 2016-12-30 2022-04-19 百度在线网络技术(北京)有限公司 网页主图识别方法和装置
CN109886825B (zh) * 2018-12-25 2021-06-29 北京农业信息技术研究中心 一种农业物联网数据多视角投影聚类重构方法及***

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103400143A (zh) * 2013-07-12 2013-11-20 中国科学院自动化研究所 一种基于多视角的数据子空间聚类方法
CN103617292A (zh) * 2013-12-16 2014-03-05 中国科学院自动化研究所 一种基于互正则化约束子空间表达的多视角数据聚类方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103400143A (zh) * 2013-07-12 2013-11-20 中国科学院自动化研究所 一种基于多视角的数据子空间聚类方法
CN103617292A (zh) * 2013-12-16 2014-03-05 中国科学院自动化研究所 一种基于互正则化约束子空间表达的多视角数据聚类方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Incomplete Multi-view Clustering via Subspace Learning;Qiyue Yin等;《CIKM "15: Proceedings of the 24th ACM International on Conference on Information and Knowledge Management》;20151030;全文 *
基于成对约束的动态加权半监督模糊核聚类;王亮等;《计算机工程》;20120131;全文 *

Also Published As

Publication number Publication date
CN105718950A (zh) 2016-06-29

Similar Documents

Publication Publication Date Title
Zhang et al. Vector of locally and adaptively aggregated descriptors for image feature representation
US20190325342A1 (en) Embedding multimodal content in a common non-euclidean geometric space
CN108334574B (zh) 一种基于协同矩阵分解的跨模态检索方法
Sussman et al. A consistent adjacency spectral embedding for stochastic blockmodel graphs
CN103400143B (zh) 一种基于多视角的数据子空间聚类方法
Zhang et al. Detecting densely distributed graph patterns for fine-grained image categorization
Ali et al. A hybrid geometric spatial image representation for scene classification
CN112819023B (zh) 样本集的获取方法、装置、计算机设备和存储介质
CN109871454B (zh) 一种鲁棒离散监督跨媒体哈希检索方法
CN104616029B (zh) 数据分类方法及装置
CN107329954B (zh) 一种基于文档内容和相互关系的主题检测方法
CN110399895A (zh) 图像识别的方法和装置
CN110032650B (zh) 一种训练样本数据的生成方法、装置及电子设备
CN105718532A (zh) 一种基于多深度网络结构的跨媒体排序方法
CN106250918B (zh) 一种基于改进的推土距离的混合高斯模型匹配方法
CN110751027A (zh) 一种基于深度多示例学习的行人重识别方法
CN107220656A (zh) 一种基于自适应特征降维的多标记数据分类方法
CN108764351A (zh) 一种基于测地距离的黎曼流形保持核学习方法及装置
CN105718950B (zh) 一种基于结构约束的半监督多视角聚类方法
Qin et al. Depth estimation by parameter transfer with a lightweight model for single still images
Guimaraes Pedronette et al. Efficient rank-based diffusion process with assured convergence
CN103605653B (zh) 基于稀疏哈希的大数据检索方法
CN105844299B (zh) 一种基于词袋模型的图像分类方法
CN106529601A (zh) 基于稀疏子空间多任务学习的图像分类预测方法
Scrucca et al. Projection pursuit based on Gaussian mixtures and evolutionary algorithms

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: 300457 unit 1001, block 1, msd-g1, TEDA, No.57, 2nd Street, Binhai New Area Economic and Technological Development Zone, Tianjin

Patentee after: Tianjin Zhongke intelligent identification Co.,Ltd.

Address before: Unit 300465 TEDA MSD-G1-1001, 57 Second Avenue, Tianjin Economic and Technological Development Zone, Binhai New Area, Tianjin

Patentee before: TIANJIN ZHONGKE INTELLIGENT IDENTIFICATION INDUSTRY TECHNOLOGY RESEARCH INSTITUTE Co.,Ltd.