CN105718950B

CN105718950B - 一种基于结构约束的半监督多视角聚类方法

Info

Publication number: CN105718950B
Application number: CN201610041391.0A
Authority: CN
Inventors: 王亮; 吴书; 尹奇跃
Original assignee: Tianjin Zhongke Intelligent Identification Industry Technology Research Institute Co Ltd
Current assignee: Tianjin Zhongke Intelligent Identification Co ltd
Priority date: 2016-01-22
Filing date: 2016-01-22
Publication date: 2018-11-27
Anticipated expiration: 2036-01-22
Also published as: CN105718950A

Abstract

本发明公开了一种基于结构约束的半监督多视角聚类方法，该方法通过回归的方式优化多视角数据的结构信息，即归一化类别矩阵，同时利用先验信息直接指导多视角数据结构信息的学习，以进一步对归一化类别矩阵进行结构约束，从而在给定先验信息时可以有效提升多视角聚类性能。考虑到不同视角在学习时所起作用不同，本发明将特征学习嵌入到多视角数据结构信息的学习中以进一步提升聚类性。

Description

一种基于结构约束的半监督多视角聚类方法

技术领域

本发明涉及模式识别技术领域，尤其是一种基于半监督情况下的多视角的数据聚类方法。

背景技术

随着计算机视觉技术与多媒体技术的迅猛发展，数据往往表现出不同的特征描述方法，比如单个网页可以由图片，文本以及超级链接等信息进行描述；图片可有由不同的视觉描述算子(如SIFT和GIST特征)进行编码。以上数据称为多视角数据，每一个视角对应一种特征集。多视角数据的***式增长，促进着多视角学习的发展，并产生广泛的应用。多视角聚类，作为多视角学习的基本任务，旨在挖掘不同视角之间的信息互补特性以提升数据聚类性能。

近些年来，如何利用先验信息，如用户标注的部分样本间的相似性关系，来提升多视角聚类受到了广泛的关注，也称为半监督多视角聚类。这类先验信息具有较强的语义特性，可以有效对多视角聚类进行指导。传统的半监督多视角聚类方法一般采用软正则化(soft regularization)或者硬约束(hard constraints)的方法来使用半监督信息，但是它们不能显式地利用先验信息所表现出来的结构信息对多视角聚类进行指导，同时也不能较好地处理多视角数据特征的选择问题。因此，传统的半监督多视角聚类方法不能有效地提升聚类性能，不能有效的满足半监督多视角聚类的需求。

发明内容

鉴于此，本发明提出了一种基于结构约束的半监督多视角聚类方法。

本发明是这样实现的，一种基于结构约束的半监督多视角聚类方法，包括步骤：

S1，收集多视角数据并提取所述多视角数据的特征；

S2，人工标注部分样本点并以样本点构造样本间相似性关系作为先验信息；

S3，将多视角数据特征进行串联并以回归的方式采用线性投影矩阵的方式学习多视角数据的归一化类别矩阵，该归一化类别矩阵具有非负且列正交的特性；

S4，设计所述线性投影矩阵的正则化方式以进行不同视角的特征权重学习，并构造优化目标；

S5，将先验信息作为正则项加入到所述优化目标中使先验信息直接约束多视角数据的归一化类别矩阵，形成最终的优化目标函数；

S6，采用交替优化方式求解所述优化目标，直至模型收敛，得到多视角数据的归一化类别矩阵；

S7，对所述归一化类别矩阵进行处理，得到最终的多视角数据聚类结果。

本发明以回归的方式通过线性投影矩阵直接优化多视角数据的结构信息，即归一化类别矩阵，同时在回归过程中加入对投影矩阵的结构约束以对不同视角特征权重学习，构造优化目标，利用先验信息直接约束多视角数据的归一化类别矩阵，指导归一化类别矩阵的学习，对不符合先验信息的归一化类别矩阵的部分进行惩罚，形成最终的优化目标函数，通过交替优化方式优化目标得到多视角数据的归一化类别矩阵，通过处理最终的归一化类别矩阵，得到最终的多视角数据聚类结果，从而起到了有效的聚类。

附图说明

图1是本发明基于结构约束的半监督多视角聚类方法的流程图；

图2是本发明利用先验信息设计正则项的示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白，以下结合具体实施例，并参照附图，对本发明进一步详细说明。

参见图1所示，一种基于结构约束的半监督多视角聚类方法，包括步骤：

步骤S1，收集多视角数据并提取不同视角数据的特征；

步骤S2，人工标注部分样本间相似性关系作为先验信息；

步骤S3，将多视角数据特征进行串联，并以回归的方式采用线性投影矩阵学习多视角数据的归一化类别矩阵；

步骤S4，设计所述线性投影矩阵的正则化方式以进行不同视角的特征权重学习，并构造优化目标；

步骤S5，将先验信息作为正则项加入到所述优化目标中使其直接约束多视角数据的归一化类别矩阵，并形成最终的优化目标函数；

步骤S6，采用交替优化方式求解所述优化目标，直至模型收敛，得到多视角数据的归一化类别矩阵；

步骤S7，对所述归一化类别矩阵进行处理，得到最终的多视角数据聚类结果。

本发明可直接得到多视角数据的聚类结构，即归一化类别矩阵，同时以线性投影的方法对投影矩阵约束实现不同视角特征权重学习，以先验信息作为正则项加入优化目标直接对数据的聚类结构进行约束，达到指导多视角聚类的目的。

需要说明的是，本发明中，所述的多视角的特征可以由同质或者异质特征组成，比如图片的颜色和纹理特征，网页的图片和文本特征，具体不限。

本发明中，步骤S2，所述人工标注部分样本间相似性关系作为先验信息，具体是指随机标注一定比例的样本点，并以此样本点构造相似性关系，即属于同一类别的样本相似，不属于同一类的样本不相似。

参见图2所示，具体的，本发明中，所述先验信息由矩阵表示，其元素值为1，-1和？，分别表示两个样本属于同一类别，属于不同类别，未观测到两样本之间的关系。

其中，所述的相似性关系表示两个样本是否属于同一类别。所述先验信息在多视角聚类之前作为已知信息加入到模型中，可以提升多视角聚类性能。

本发明中，所述的归一化类别矩阵作为多视角数据的结构信息，满足矩阵列正交，且矩阵所有元素非负。

具体实现上，所述线性投影矩阵通过增加或设计结构稀疏约束以正则化方式对各个视角特征的权重进行自动学习。

进一步的，所述结构稀疏约束采用G范数约束

具体的，本发明中，所述线性投影矩阵的结构稀疏约束---G范数约束定义为：

其中，c为多视角数据的聚类数目，m为视角数目，对应第q个视角的针对第p个聚类的投影向量；

最后得到优化目标为：

其中，X为多视角数据特征串接组成的矩阵，每一列表示为一个样本点；W为线性投影矩阵；F为所优化归一化类别矩阵，其满足列正交和非负约束；||W||_G是对W的约束，以起到不同视角特征的权重学习；γ₁为预设的比例系数。

具体实现上，本发明中，步骤S5中，将先验信息作为正则项加入到优化目标中使先验信息直接约束多视角数据的归一化类别矩阵中的正则项表示为：

Σ_ij(I_p)_ij(FF^T)_ij

其中，I_p为指示矩阵，FF^T为由归一化类别矩阵F构造的样本间相似性关系，通过最小化此正则项可以对不满足先验信息的归一化类别矩阵的部分进行惩罚，进而起到指导归一化类别矩阵学习的作用。

参见图2所示，该图显示了利用先验信息设计正则项的方法，所述正则项可以通过图示方法进行设计，展示了先验信息结构，先验信息约束下的归一化类别矩阵结构以及正则项设计时所使用的指示矩阵。

最终的优化目标为：

其中，γ₂为预设的比例系数。

本发明的步骤S6中，采用交替优化方式求解所述优化目标，直到算法收敛，得到多视角数据的归一化类别矩阵，具体为采用交替优化方式求解F和W，直至算法收敛，步骤如下：

固定W，则目标函数改写为

采用拉格朗日乘子法进行求解，针对归一化类别矩阵的非负约束，采用KKT条件，F计算方式为：

其中为拉格朗日乘子法求解所述优化目标的拉格朗日乘子，其计算方式为

对于任意一矩阵C，

固定F，则目标函数改写为：

则W可以依据梯度进行求解，满足：

w_k＝(XX^T+γ₁Q)^-1(Xf_k)

其中，w_k为W的第k列，f_k为F的第k列，Q为对角矩阵，且满足第i个元素为其中，为对应第i个视角的针对第k个聚类的投影向量。

具体的，本发明在步骤S7中，对所述归一化类别矩阵进行处理，得到最终的多视角数据聚类结果，具体采用以下方法进行：

1)由于所述归一化类别矩阵的每一行对应一个样本，可将每一行最大值所在的位置作为其对应样本点的聚类类别，得到最终的多视角数据聚类结果。

2)也可以是将所述归一化类别矩阵作为多视角数据的低维表达进行kmeans聚类，得到最终的多视角数据聚类结果。

本发明以回归的方式通过投影矩阵直接优化多视角数据的结构信息，即归一化类别矩阵，同时在回归过程中加入对投影矩阵的结构约束以对不同视角特征进行选择，针对先验信息设计指示矩阵，以对不符合先验信息的归一化类别矩阵的部分进行惩罚，进而利用先验信息指导归一化类别矩阵的学习，从而起到了有效的聚类。

为了验证本发明实施效果，下面以USPS Digits 0-9数字数据库为例进行说明。该数据库包含2000幅图像，共计10个类别，每类包含200幅图像。具体步骤如下：

步骤S1，提取USPS Digits图片库的fourier coefficients,profilecorrelations和zernike moments三种特征，作为所述数据库的三个视角。

步骤S2，人工标注部分样本间相似性关系作为先验信息，这里，随机标注一定比例的样本点，并以此样本点构造相似性关系，即属于同一类别的样本相似，不属于同一类的样本不相似。

步骤S3，将多视角数据特征进行串联得到X，并以回归的方式采用线性投影矩阵学习多视角数据的归一化类别矩阵F和投影矩阵W。

步骤S4，设计所述线性投影矩阵W的正则化方式，即||W||_G。

步骤S5，将先验信息作为正则项加入到所述优化目标中使其直接约束多视角数据的归一化类别矩阵，并形成最终的优化目标函数。

步骤S6，令γ₁和γ₂取值为0.001和0.01，并采用交替优化方式求解所述优化目标得到多视角数据的归一化类别矩阵F。

步骤S7，对所述所得归一化类别矩阵，找到每一行中最大元素所在的位置作为其对应样本点的聚类。

以下的表1和表2分别是本发明以归一化互信息NMI和准确率ACC为观测指标在不同给定先验信息下与其它聚类方法的性能比较；

Method	0％	10％	20％	30％
					SULF	44.09	61.89	66.33	66.11
PSLF	44.89	73.56	75.39	77.63
					PairwiseSC	73.73	76.35	77.04	74.89
CentroidSC	74.38	77.46	79.07	80.58
					My	71.87	78.06	78.50	91.71

表1

Method	0％	10％	20％	30％
					SULF	52.46	62.89	69.76	66.67
PSLF	57.27	79.51	81.23	84.03
					PairwiseSC	78.88	76.36	74.15	69.39
CentroidSC	83.20	84.85	80.37	83.59
					My	78.09	87.03	87.98	92.18

表2

以上表1-2中，可以看出，本发明在不同给定先验信息下，在归一化互信息和准确率为观测指标上与其它聚类方法相比，具有明显的优越性。其中，0％--30％表示样本点的不同的标注比例，My指本发明方法，SULF、PSLF、PairwiseSC、CentroidSX分别表示两种基于非负矩阵分解和两种基于谱分解的半监督多视角聚类方法。

以上所述的具体实施例，对本发明的目的、技术方案和效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施例而已，并不用于限制本发明，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于结构约束的半监督多视角聚类方法，其特征在于，包括步骤：

S1，收集多视角数据并提取所述多视角数据的特征；

2.根据权利要求1所述基于结构约束的半监督多视角聚类方法，其特征在于，所述先验信息由矩阵表示，其元素值为1，-1和？，分别表示两个样本属于同一类别，属于不同类别，未观测到两样本之间的关系。

3.根据权利要求1所述基于结构约束的半监督多视角聚类方法，其特征在于，所述线性投影矩阵通过增加结构稀疏约束对各个视角特征的权重进行自动学习。

4.根据权利要求3所述基于结构约束的半监督多视角聚类方法，其特征在于，所述结构稀疏约束采用G范数约束。

5.根据权利要求1所述基于结构约束的半监督多视角聚类方法，其特征在于，所述S5中，将先验信息作为正则项加入到所述优化目标中使所述先验信息直接约束多视角数据的归一化类别矩阵，形成最终的优化目标函数是在所述正则项中引入指示矩阵，通过最小化该正则项对不符合先验信息的归一化类别矩阵的部分进行惩罚，以使得归一化类别矩阵满足先验信息的约束。

6.根据权利要求1-5任一项所述基于结构约束的半监督多视角聚类方法，其特征在于，所述S5中的最终优化目标函数为：

其中，X为多视角数据特征串接组成的矩阵，每一列表示为一个样本点；W为线性投影矩阵；F为所优化归一化类别矩阵，满足列正交和非负约束；I_p为指示矩阵，以实现对不满足先验信息所对应的归一化类别矩阵的部分进行惩罚；FF^T为由归一化类别矩阵F构造的样本间相似性关系，||W||_G是对W的G范数约束，以起到不同视角特征的权重学习；γ₁和γ₂为预设的比例系数,

所述G范数约束定义为：

其中，c为多视角数据的聚类数目，m为视角数目，对应第q个视角的针对第p个聚类的投影向量。

7.根据权利要求1所述基于结构约束的半监督多视角聚类方法，其特征在于，所述S7中，对所述归一化类别矩阵进行处理，得到最终的多视角数据聚类结果，是将所求归一化类别矩阵每一行最大元素所在位置作为此行所对应的样本点的聚类类别实现的。

8.根据权利要求1所述基于结构约束的半监督多视角聚类方法，其特征在于，所述S1中，所述多视角数据包括同质和\或异质数据。