CN114399653A - 一种基于锚点图的快速多视图离散聚类方法及*** - Google Patents

一种基于锚点图的快速多视图离散聚类方法及*** Download PDF

Info

Publication number
CN114399653A
CN114399653A CN202111452689.8A CN202111452689A CN114399653A CN 114399653 A CN114399653 A CN 114399653A CN 202111452689 A CN202111452689 A CN 202111452689A CN 114399653 A CN114399653 A CN 114399653A
Authority
CN
China
Prior art keywords
anchor point
image
clustering
view
representing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111452689.8A
Other languages
English (en)
Inventor
张斌
强倩瑶
王飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Jiaotong University
Original Assignee
Xian Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Jiaotong University filed Critical Xian Jiaotong University
Priority to CN202111452689.8A priority Critical patent/CN114399653A/zh
Publication of CN114399653A publication Critical patent/CN114399653A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Mathematics (AREA)
  • Evolutionary Biology (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)
  • Computing Systems (AREA)

Abstract

本发明公开了一种基于锚点图的快速多视图离散聚类方法及***,属于多视图图像领域。本发明的基于锚点图的快速多视图离散聚类方法,从所有原始多视图图像中选择一小部分具有代表性的图像作为锚点图像,通过在各图像特征上构建所有原始图像与锚点图像之间的锚点图,计算相似度图;在多视图图像聚类过程中为在不同特征上构建的锚点图分配权重,以衡量不同特征对多视图聚类任务的贡献;提出求解谱聚类的原始问题,直接计算离散的多视图图像聚类指示矩阵。本发明解决了相似度图构建和图拉普拉斯矩阵特征分解操作计算复杂度高的问题。

Description

一种基于锚点图的快速多视图离散聚类方法及***
技术领域
本发明属于多视图图像领域,尤其是一种基于锚点图的快速多视图离散聚类方法及***。
背景技术
多视图聚类是多视图图像分析中的一项重要技术。多视图图像指使用多种不同特征表示的图像数据。作为解决多视图图像聚类问题的一种高效方法,基于图的多视图聚类方法在计算机视觉领域得到了广泛的研究和应用。
现有的大多数基于图的多视图聚类方法包括两个步骤:(1)基于各视图的特征构建相似度图;(2)在图拉普拉斯矩阵上进行特征分解操作,计算一个连续的聚类分配矩阵,然后通过k-means或谱旋转等后处理算法得到离散的聚类分配矩阵。尽管这些方法表现突出,但用于解决多视图图像聚类问题时仍然存在两个缺点。第一个缺点是昂贵的时间成本。通常,在实际多视图图像聚类任务中,样本规模非常大。传统相似度图的构建和特征分解操作的时间复杂度分别为O(n2d)和O(n3),其中,n代表数据规模,d表示特征维数。这样的计算开销对于大规模多视图图像聚类任务是难以接受的。另一个缺点是通过两阶段过程获得可解释的离散图像聚类分配矩阵,可能会引起多视图图像特征信息丢失。在进行多视图图像聚类时,导致聚类过程偏离直接解决原始多视图图像聚类问题。
许多基于图的多视图聚类方法研究致力于加速相似度图构建或特征分解。例如,构造锚点图或稀疏图、近似特征分解操作等加速相似度图构建过程。通常,锚点可以通过随机抽样或轻量级聚类方法(如k-means)生成。应用于多视图图像聚类时,随机抽样方法随机地从所有原始图像中选择少部分图像作为锚点图像;k-means方法将所有原始图像聚类,选择聚类中心的图像作为锚点图像。显然,由k-means聚类方法生成的锚点图像比随机抽样方法选择的锚点图像更具代表性。但是,相比于随机抽样方法,k-means方法非常耗时,并且可能会生成数量不均衡的图像聚类簇。基于平衡k-means的层次k-means方法(Balanced k-means-based Hierarchical k-means,BKHK)使用k-means时,首先将所有图像分成两个数量平衡的图像子聚类簇,然后对子聚类簇继续分层执行平衡k-means,直到最终得到与所需锚点图像数量相同的叶子图像聚类簇,最后将所有叶子聚类的类中心图像作为锚点。BKHK已经成功地用于加速基于图的方法,包括哈希、聚类、降维、分类等。但k-means算法仍然存在缺陷,即:随机选择样本作为初始聚类中心的做法使聚类结果具有不稳定性,并且收敛速度比较慢。在减小特征分解操作时间消耗的方法,近似特征分解最为常用。近似特征分解一般使用随机投影和有限阶多项式展开方法计算伪特征向量,或通过使用截断幂迭代来避免直接的特征分解操作,但这种技巧对于处理大量多视图图像数据集无效。此外,在已有的用于多视图图像聚类的基于图的多视图聚类方法中,不借助任何后处理步骤直接求解离散的图像聚类标签矩阵还有待探索。
发明内容
本发明的目的在于克服上述现有技术的缺点,提供一种基于锚点图的快速多视图离散聚类方法及***。
为达到上述目的,本发明采用以下技术方案予以实现:
一种基于锚点图的快速多视图离散聚类方法,包括以下步骤:
步骤1:基于平衡k-means++的层次的k-means++方法为n幅原始图像生成m幅锚点图像,m<<n;
步骤2:在各视图特征上构建原始图像与锚点图像之间的锚点图;
步骤3:基于所述锚点图计算原始图像之间的相似度矩阵;
步骤4:为各特征上的相似度图分配权重系数,得到聚合图;
步骤5:将最小化聚合图与使用图像聚类标签矩阵重构的相似度图之间的差异作为优化目标,构建FMDC的目标函数;
步骤6:利用解决谱聚类的原始问题来求解FMDC的目标函数,输出离散的多视图图像聚类指示矩阵,完成多视图图像聚类任务。
进一步的,步骤1中的锚点图像生成过程为:
使用k-means++将所有原始图像分成数量平衡的两个图像子聚类,之后对图像子聚类继续分层执行平衡k-means++,直到最终得到m个叶子聚类,将m个叶子聚类的类中心图像作为锚点图像。
进一步的,步骤1中获取用CENTRIST、wavelet moments、Gabor和LBP四种特征表示的多视图图像数据集{X1,X2,X3,X4};
使用四种特征数据的拼接数据[X1;X2;X3;X4]生成锚点拼接特征数据[U1;U2;U3;U4];然后根据四个视图中图像特征的维度d1、d2、d3、d4切割[U1;U2;U3;U4],得到多视图锚点图像集{U1,U2,U3,U4};
其中,
Figure BDA0003385611030000031
表示CENTRIST特征的锚点,
Figure BDA0003385611030000032
表示第j幅锚点图像的CENTRIST特征;
Figure BDA0003385611030000033
表示wavelet mom ents特征的锚点,
Figure BDA0003385611030000034
表示的第j幅锚点图像的wavelet moments特征;
Figure BDA0003385611030000035
表示Gabor特征的锚点,
Figure BDA0003385611030000036
表示的第j幅锚点图像的Gabor特征;
Figure BDA0003385611030000037
表示LBP特征的锚点,
Figure BDA0003385611030000038
表示的第j幅锚点图像的LBP特征;
Figure BDA0003385611030000041
表示CENTRIST特征,n为数据集包含的所有图像的数量,
Figure BDA0003385611030000042
表示第i幅图像的CENTRIST特征,i∈1,…,n,d1表示CENTRIST特征的维度;
Figure BDA0003385611030000043
表示wavelet moments特征,
Figure BDA0003385611030000044
表示第i幅图像的waveletmoments特征,d2表示wavelet moments特征的维度;
Figure BDA0003385611030000045
表示Gabor特征,
Figure BDA0003385611030000046
表示第i幅图像的Gabor特征,d3表示Gabor特征的维度;
Figure BDA0003385611030000047
表示LBP特征,
Figure BDA0003385611030000048
表示第i幅图像的LBP特征,d4表示LBP特征的维度。
进一步的,步骤2具体为:
通过最小化式(1)分别在第v个特征上构建锚点图,
Figure BDA0003385611030000049
Figure BDA00033856110300000410
Figure BDA00033856110300000411
式中,
Figure BDA00033856110300000412
||·||2代表l-2范数,
Figure BDA00033856110300000413
表示第v个特征中第i幅原始图像和第j幅锚点图像之间的相似度,
Figure BDA00033856110300000414
表示第v个特征中的第i幅图像与所有m幅锚点图像的相似度向量;γ表示正则参数,
Figure BDA00033856110300000415
式(1)中问题的解为:
Figure BDA00033856110300000416
锚点图Zv是k近邻的,即
Figure BDA00033856110300000417
含有k个非零元素。
进一步的,步骤3具体为:
计算得到锚点图Zv之后,计算第v个特征上的相似度图
Figure BDA00033856110300000418
Sv=Zvv)-1(Zv)T=Bv(Bv)T (18)
式中,
Figure BDA0003385611030000051
是一个对角矩阵,第j个对角元素为
Figure BDA0003385611030000052
通过式(3)计算得到的相似度图Sv是对称双随机的。
进一步的,步骤4具体为:
为各特征上的相似度图Sv分配权重系数αv
Figure BDA0003385611030000053
式中,
Figure BDA0003385611030000054
是权重向量;
Figure BDA0003385611030000055
为聚合图,是对称双随机的。
进一步的,步骤5具体为:
以最小化聚合图
Figure BDA0003385611030000056
与使用图像聚类标签矩阵重构的相似度图Y(YTY)-1YT之间的差异为优化目标,构建FMDC的目标函数:
Figure BDA0003385611030000057
式中,||·||F代表l-F范数,Y=[y1,…,yc]∈{0,1}n×c是离散的图像聚类指示矩阵,c代表类别数,yl(l∈1,…,c)是第l个图像类的聚类指示矩阵;Ind是离散图像聚类指示矩阵的缩写。
进一步的,步骤6中FMDC的目标函数的求解过程为:
(601)固定α,更新Y;
当α固定时,求解Y的子问题为:
Figure BDA0003385611030000058
式中,
Figure BDA0003385611030000059
求解此问题等价于求解下式中的问题:
Figure BDA00033856110300000510
式(7)写成另一种形式:
Figure BDA0003385611030000061
Figure BDA0003385611030000062
包含了Y的所有行,采用坐标下降方法按行更新Y;
(602)固定Y,更新α;
当Y固定时,求解α的子问题为:
Figure BDA0003385611030000063
式中,
Figure BDA0003385611030000064
Figure BDA0003385611030000065
和Sv写成大向量的形式,令
Figure BDA0003385611030000066
则有:
Figure BDA0003385611030000067
式(15)利用增广拉格朗日乘子法求解;
(603)循环(601)和(602)交替优化α和Y,直到目标函数收敛到最小值。
进一步的,(601)中采用坐标下降方法按行更新Y,具体为:
当更新到了Y的第i行yi,为了确定yi,对比yi分别为[1,0,…,0]—[0,0,…,1]共c中不同取值时式(8)的目标函数值,并在其中选取令目标函数最大的取值作为yi的最优解;
将yi取c中不同值时的Y记为{Y(1),…,Y(c)},第h种取值的目标函数值为:
Figure BDA0003385611030000068
因此,求解的问题为:
Figure BDA0003385611030000069
定义Y(0)的第i行为[0,0,…,0],即全为0,则:
Figure BDA00033856110300000610
定义Δ(h)=obj(Y(h))-obj(Y(0)),求解式(10)中的问题等价于求解下式问题:
Figure BDA0003385611030000071
此时,得到最优解:
Figure BDA0003385611030000072
式中,若<·>为真,则yip=1,否则yip=0。
一种基于锚点图的快速多视图离散聚类***,包括锚点图像生成模块、锚点图构建模块、相似度矩阵生成模块、分配权重模块、构建FMDC的目标函数模块和求解FMDC的目标函数模块;
所述锚点图像生成模块,用于基于平衡k-means++的层次k-means++方法为n幅原始图像生成m幅具有代表性的锚点图像;
所述锚点图构建模块,用于在各视图特征上构建原始图像与锚点图像之间的锚点图;
所述相似度矩阵生成模块,用于基于所述锚点图计算原始图像之间的相似度矩阵;
所述分配权重模块,用于为各特征上的相似度图分配权重系数,得到聚合图;
所述构建FMDC的目标函数模块,用于将最小化聚合图与使用图像聚类标签矩阵重构的相似度图之间的差异作为优化目标,构建FMDC的目标函数;
所述求解FMDC的目标函数模块,用于求解FMDC的目标函数,输出离散的多视图图像聚类指示矩阵,完成多视图图像聚类任务。
与现有技术相比,本发明具有以下有益效果:
本发明的基于锚点图的快速多视图离散聚类方法及***,从所有原始多视图图像中选择一小部分具有代表性的图像作为锚点图像,通过在各图像特征上构建所有原始图像与锚点图像之间的锚点图,计算相似度图;在多视图图像聚类过程中为在不同特征上构建的锚点图分配权重,以衡量不同特征对多视图聚类任务的贡献;提出求解谱聚类的原始问题,直接计算离散的多视图图像聚类指示矩阵。本发明解决了用当前基于图的多视图聚类方法解决多视图图像聚类问题时存在的两个主要问题:(1)相似度图构建和图拉普拉斯矩阵特征分解操作计算复杂度高;(2)先计算一个连续的图像聚类分配矩阵,然后通过后处理步骤得到最终离散的图像聚类分配矩阵的两阶段求解方法,会引起多视图图像特征信息丢失,导致多视图图像聚类过程偏离直接解决原始多视图图像聚类问题。本发明在降低了基于图的聚类方法的计算复杂度的前提下,可以高质量地完成多视图图像聚类任务。
进一步的,采用无参策略构建锚点图,为所有视图上的图像生成少量有代表性的锚点图像,进而计算相似度图。
进一步的,保证了锚点图像在多个视图不同特征之间的一致性。
进一步的,本发明设计了高效的求解方法,直接为多视图图像聚类计算得到离散的聚类指示矩阵。
进一步的,本发明的FMDC的目标函数非常简洁,没有引入任何额外的项,不用调节任何均衡参数。
附图说明
图1为本发明的锚点选择结构图;
图2为实施例1的基于锚点图的快速多视图离散聚类方法的流程图;
图3为实施例2的基于锚点图的快速多视图离散聚类***的原理框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明的目的在于提供一种基于锚点图的快速多视图离散聚类方法及***(FastMulti-view Discrete Clustering with Anchor Graphs,FMDC),以解决用当前基于图的多视图聚类方法去解决多视图图像聚类问题时存在的两个主要问题:(1)相似度图构建和图拉普拉斯矩阵特征分解操作计算复杂度高;(2)先计算一个连续的图像聚类分配矩阵,然后通过后处理步骤得到最终离散的图像聚类分配矩阵的两阶段求解方法,会引起多视图图像特征信息丢失,导致多视图图像聚类过程偏离直接解决原始多视图图像聚类问题。本发明的基于锚点图的快速多视图离散聚类方法,从所有原始多视图图像中选择一小部分具有代表性的图像作为锚点图像,通过在各图像特征上构建所有原始图像与锚点图像之间的锚点图计算相似度图;在多视图图像聚类过程中自动为在不同特征上构建的锚点图分配权重,衡量不同特征对多视图聚类任务的贡献;提出求解谱聚类的原始问题,直接计算离散的多视图图像聚类指示矩阵。
下面结合附图对本发明做进一步详细描述:
本发明的基于锚点图的快速多视图离散聚类方法,将使用CENTRIST、waveletmoments、Gabor和LBP四种特征表示的四视图图像数据{X1,X2,X3,X4}作为输入,高效地选则锚点图像数据集{U1,U2,U3,U4},并构建锚点图{Z1,Z2,Z3,Z4},自动加权所有特征上的相似度矩阵{S1,S2,S3,S4},构建基于图的多视图聚类模型,直接解决多视图图像聚类问题。通过构造锚点图计算对称双随机的相似度图,进而求解谱聚类的原始问题,直接计算离散的多视图图像聚类指示矩阵。能够在降低时间复杂度和空间复杂度的同时保证多视图图像聚类的性能,实现快速多视图图像分析中的离散聚类。
实施例1
首先定义表示多视图图像的数学符号。定义一个使用CENTRIST、waveletmoments、Gabor和LBP四种特征表示的四视图图像数据集{X1,X2,X3,X4}。其中,
Figure BDA0003385611030000101
(n为数据集包含的所有图像的数量)表示CENTRIST特征,
Figure BDA0003385611030000102
表示第i幅图像的CENTRIST特征,d1表示CENTRIST特征的维度;
Figure BDA0003385611030000103
表示wavelet moments特征,
Figure BDA0003385611030000104
表示第i幅图像的waveletmoments特征,d2表示wavelet moments特征的维度;
Figure BDA0003385611030000105
表示Gabor特征,
Figure BDA0003385611030000106
表示第i幅图像的Gabor特征,d3表示Gabor特征的维度;
Figure BDA0003385611030000107
表示LBP特征,
Figure BDA0003385611030000108
表示第i幅图像的LBP特征,d4表示LBP特征的维度。
参见图2,图2为实施例1的流程图:
步骤1:为n幅原始原始图像生成m(m<<n)幅具有代表性的锚点图像。FMDC使用基于平衡k-means++的层次k-means++方法为所有视图中的图像生成锚点图像。参见图1,图1为本发明的锚点选择结构图,层次地将样本用k-means++聚类成样本数量均衡的子类,最终得到的叶子聚类的中心作为锚点。基于平衡k-means++的层次k-means++方法使用k-means++首先将所有原始图像分成数量平衡的两个图像子聚类,然后对图像子聚类继续分层执行平衡k-means++,直到最终得到m个叶子聚类,选择m个叶子聚类的类中心图像作为锚点图像。为保证锚点图像在多个视图不同特征之间的一致性,FMDC首先使用四种特征数据的拼接数据[X1;X2;X3;X4]生成锚点拼接特征数据[U1;U2;U3;U4];然后根据四个视图中图像特征的维度d1、d2、d3、d4切割[U1;U2;U3;U4],得到多视图锚点图像集{U1,U2,U3,U4}。其中,
Figure BDA0003385611030000111
表示CENTRIST特征的锚点,
Figure BDA0003385611030000112
表示第j幅锚点图像的CENTRIST特征;
Figure BDA0003385611030000113
表示wavelet moments特征的锚点,
Figure BDA0003385611030000114
表示的第j幅锚点图像的wavelet moments特征;
Figure BDA0003385611030000115
表示Gabor特征的锚点,
Figure BDA0003385611030000116
表示的第j幅锚点图像的Gabor特征;
Figure BDA0003385611030000117
表示LBP特征的锚点,
Figure BDA0003385611030000118
表示的第j幅锚点图像的LBP特征。
步骤2:构建原始图像与锚点图像之间的锚点图。通过最小化以下问题分别在第v(v∈1,2,3,4)个特征上构建锚点图
Figure BDA0003385611030000119
Figure BDA00033856110300001110
式中,
Figure BDA00033856110300001111
||·||2代表l-2范数,
Figure BDA00033856110300001112
表示第v个特征中第i幅原始图像和第j幅锚点图像之间的相似度,
Figure BDA00033856110300001113
表示第v个特征中的第i幅图像与所有m幅锚点图像的相似度向量。γ表示正则参数,可以被设置为
Figure BDA0003385611030000121
式(1)中问题的解为:
Figure BDA0003385611030000122
锚点图Zv是k近邻的,即
Figure BDA0003385611030000123
含有k个非零元素。
步骤3:计算原始图像之间的相似度矩阵。计算得到锚点图Zv之后,计算第v个特征上的相似度图
Figure BDA0003385611030000124
Sv=Zvv)-1(Zv)T=Bv(Bv)T (33)
式中,
Figure BDA0003385611030000125
是一个对角矩阵,第j个对角元素为
Figure BDA0003385611030000126
通过式(3)计算得到的相似度图Sv是对称双随机的。
步骤4:融合多个特征上的相似度图。考虑到不同图像特征的多样性贡献,本发明自动为各特征上的相似度图Sv分配权重系数αv
Figure BDA0003385611030000127
式中,
Figure BDA0003385611030000128
是权重向量。可以将
Figure BDA0003385611030000129
看作是一个聚合图。
Figure BDA00033856110300001210
也是对称双随机的。
步骤5:以最小化聚合图
Figure BDA00033856110300001211
与使用图像聚类标签矩阵重构的相似度图Y(YTY)-1YT之间的差异为优化目标,构建FMDC的目标函数:
Figure BDA00033856110300001212
式中,||·||F代表l-F范数,Y=[y1,…,yc]∈{0,1}n×c是离散的图像聚类指示矩阵,c代表类别数,yl(l∈1,…,c)是第l个图像类的聚类指示矩阵。Ind是离散图像聚类指示矩阵的缩写。式(5)中的目标函数平滑了权重分布,避免了α出现平凡解,即只有一个相似度图权重为1而其他视图权重为0的情况。
步骤6:设计优化方法求解FMDC的目标函数:
本发明设计了一个迭代交替优化方法求解式(5)中的目标函数,具体内容如下:
(601)固定α,更新Y。
当α固定时,求解Y的子问题为:
Figure BDA0003385611030000131
式中,
Figure BDA0003385611030000132
求解此问题等价于求解下式中的问题:
Figure BDA0003385611030000133
式(7)可以写成另一种形式:
Figure BDA0003385611030000134
由于
Figure BDA0003385611030000135
包含了Y的所有行,本发明采用坐标下降方法按行更新Y。
具体地,假设更新到了Y的第i行yi。为了确定yi,需要对比yi分别为[1,0,…,0]—[0,0,…,1]共c中不同取值时式(8)的目标函数值,并在其中选取令目标函数最大的取值作为yi的最优解。为方便起见,将yi取c中不同值时的Y记为{Y(1),…,Y(c)},第h(h∈1,…,c)种取值的目标函数值为:
Figure BDA0003385611030000136
因此,需要求解的问题为:
Figure BDA0003385611030000137
定义Y(0)的第i行为[0,0,…,0],即全为0,则:
Figure BDA0003385611030000138
定义Δ(h)=obj(Y(h))-obj(Y(0)),求解式(10)中的问题等价于求解下式问题:
Figure BDA0003385611030000141
此时,得到最优解:
Figure BDA0003385611030000142
式中,若<·>为真,则yip=1,否则yip=0。
(602)固定Y,更新α。
当Y固定时,求解α的子问题为:
Figure BDA0003385611030000143
式中,
Figure BDA0003385611030000144
Figure BDA0003385611030000145
和Sv写成大向量的形式,令
Figure BDA0003385611030000146
则有:
Figure BDA0003385611030000147
式(15)中的问题是一个标准二次规划问题,可直接用增广拉格朗日乘子法求解。
(603)循环(601)、(602)交替优化α和Y,直到目标函数收敛到最小值。
步骤7:输出离散的多视图图像聚类指示矩阵Y,计算聚类ACC(准确率)、NMI(标准化互信息)、Purity(纯度)。
利用本发明的基于锚点图的快速多视图离散聚类方法进行仿真实验。
本实施例中使用NUS-WIDE数据集,对来自10类的15883幅图像进行分类。每幅图像都是用五种低级特征表示:64维的颜色直方图(color histograms)、144维的颜色相关图(color correlograms)、73维的边缘方向直方图(edge direction histograms)和128维的小波纹理(wavelet textures)。
本实例对上述图像分别采用MLHR(Multi-feature learning via hierarchicalregression),SMGI(Sparse Multiple Graph Integration),AMGL(Auto-weightedMultiple Graph Learning),MLAN(Multi-view Learning with Adaptive Neighbors)以及FMSSL-K(使用k-means方法选则锚点的FMSSL),FMSSL-R(使用随机策略选则锚点的FMSSL)和FMSSL进行聚类,并采用ACC(准确率)、NMI(标准化互信息)、Purity(纯度),其对比结果如下表1所示、运行时间对比结果如下表2所示。
表1对比结果
评估指标 Cotrain CoregSC SwMC MVGL MLAN OMSC LMVSC GMC FMDC
ACC 0.5845 0.5926 0.5760 0.7335 0.5886 0.5005 0.4669 0.7437 0.7389
NMI 0.5112 0.5057 0.5817 0.6152 0.6168 0.3927 0.4391 0.6339 0.6387
Purity 0.5761 0.5925 0.5782 0.7335 0.6302 0.5011 0.5987 0.7437 0.7392
表2运行时间对比结果(单位:秒)
方法 MNIST
Cotrain 6756.06
CoregSC 2599.33
SwMC 96021.83
MVGL 34901.54
MLAN 1249.61
LMVSC 3926.07
GMC 1268.18
FMDC 263.82
从表1和表2可见,本发明的聚类性能和运行时间优于其他对比方法。通过以上仿真实验可以验证本发明的有效性。
实施例2
一种基于锚点图的快速多视图离散聚类***,应用于基于锚点图的快速多视图离散聚类方法,参见图3,图3为基于锚点图的快速多视图离散聚类***的原理框图,本发明的基于锚点图的快速多视图离散聚类***包括锚点图像生成模块、锚点图构建模块、相似度矩阵生成模块、分配权重模块、构建FMDC的目标函数模块和求解FMDC的目标函数模块;
所述锚点图像生成模块,用于基于平衡k-means++的层次k-means++方法为n幅原始图像生成m幅具有代表性的锚点图像;
所述锚点图构建模块,用于在各视图特征上构建原始图像与锚点图像之间的锚点图;
所述相似度矩阵生成模块,用于基于所述锚点图计算原始图像之间的相似度矩阵;
所述分配权重模块,用于为各特征上的相似度图分配权重系数,得到聚合图;
所述构建FMDC的目标函数模块,用于将最小化聚合图与使用图像聚类标签矩阵重构的相似度图之间的差异作为优化目标,构建FMDC的目标函数;
所述求解FMDC的目标函数模块,用于求解FMDC的目标函数,输出离散的多视图图像聚类指示矩阵,完成多视图图像聚类任务。以上内容仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明权利要求书的保护范围之内。

Claims (10)

1.一种基于锚点图的快速多视图离散聚类方法,其特征在于,包括以下步骤:
步骤1:基于平衡k-means++的层次的k-means++方法为n幅原始图像生成m幅锚点图像,m<<n;
步骤2:在各视图特征上构建原始图像与锚点图像之间的锚点图;
步骤3:基于所述锚点图计算原始图像之间的相似度矩阵;
步骤4:为各特征上的相似度图分配权重系数,得到聚合图;
步骤5:将最小化聚合图与使用图像聚类标签矩阵重构的相似度图之间的差异作为优化目标,构建FMDC的目标函数;
步骤6:利用解决谱聚类的原始问题来求解FMDC的目标函数,输出离散的多视图图像聚类指示矩阵,完成多视图图像聚类任务。
2.根据权利要求1所述的基于锚点图的快速多视图离散聚类方法,其特征在于,步骤1中的锚点图像生成过程为:
使用k-means++将所有原始图像分成数量平衡的两个图像子聚类,之后对图像子聚类继续分层执行平衡k-means++,直到最终得到m个叶子聚类,将m个叶子聚类的类中心图像作为锚点图像。
3.根据权利要求2所述的基于锚点图的快速多视图离散聚类方法,其特征在于,步骤1中获取用CENTRIST、wavelet moments、Gabor和LBP四种特征表示的多视图图像数据集{X1,X2,X3,X4};
使用四种特征数据的拼接数据[X1;X2;X3;X4]生成锚点拼接特征数据[U1;U2;U3;U4];然后根据四个视图中图像特征的维度d1、d2、d3、d4切割[U1;U2;U3;U4],得到多视图锚点图像集{U1,U2,U3,U4};
其中,
Figure FDA0003385611020000021
表示CENTRIST特征的锚点,
Figure FDA0003385611020000022
表示第j幅锚点图像的CENTRIST特征;
Figure FDA0003385611020000023
表示wavelet mom ents特征的锚点,
Figure FDA0003385611020000024
表示的第j幅锚点图像的wavelet moments特征;
Figure FDA0003385611020000025
表示Gabor特征的锚点,
Figure FDA0003385611020000026
表示的第j幅锚点图像的Gabor特征;
Figure FDA0003385611020000027
表示LBP特征的锚点,
Figure FDA0003385611020000028
表示的第j幅锚点图像的LBP特征;
Figure FDA0003385611020000029
表示CENTRIST特征,n为数据集包含的所有图像的数量,
Figure FDA00033856110200000210
表示第i幅图像的CENTRIST特征,i∈1,…,n,d1表示CENTRIST特征的维度;
Figure FDA00033856110200000211
表示wavelet moments特征,
Figure FDA00033856110200000212
表示第i幅图像的waveletmoments特征,d2表示wavelet moments特征的维度;
Figure FDA00033856110200000213
表示Gabor特征,
Figure FDA00033856110200000214
表示第i幅图像的Gabor特征,d3表示Gabor特征的维度;
Figure FDA00033856110200000215
表示LBP特征,
Figure FDA00033856110200000216
表示第i幅图像的LBP特征,d4表示LBP特征的维度。
4.根据权利要求3所述的基于锚点图的快速多视图离散聚类方法,其特征在于,步骤2具体为:
通过最小化式(1)分别在第v个特征上构建锚点图,
Figure FDA00033856110200000217
Figure FDA00033856110200000218
Figure FDA00033856110200000219
式中,
Figure FDA00033856110200000220
||·||2代表l-2范数,
Figure FDA00033856110200000221
表示第v个特征中第i幅原始图像和第j幅锚点图像之间的相似度,
Figure FDA00033856110200000222
表示第v个特征中的第i幅图像与所有m幅锚点图像的相似度向量;γ表示正则参数,
Figure FDA00033856110200000223
式(1)中问题的解为:
Figure FDA0003385611020000031
锚点图Zv是k近邻的,即
Figure FDA0003385611020000032
含有k个非零元素。
5.根据权利要求4所述的基于锚点图的快速多视图离散聚类方法,其特征在于,步骤3具体为:
计算得到锚点图Zv之后,计算第v个特征上的相似度图
Figure FDA0003385611020000033
Sv=Zvv)-1(Zv)T=Bv(Bv)T (3)
式中,
Figure FDA0003385611020000034
Figure FDA0003385611020000035
是一个对角矩阵,第j个对角元素为
Figure FDA0003385611020000036
通过式(3)计算得到的相似度图Sv是对称双随机的。
6.根据权利要求5所述的基于锚点图的快速多视图离散聚类方法,其特征在于,步骤4具体为:
为各特征上的相似度图Sv分配权重系数αv
Figure FDA0003385611020000037
式中,
Figure FDA0003385611020000038
是权重向量;
Figure FDA0003385611020000039
为聚合图,是对称双随机的。
7.根据权利要求6所述的基于锚点图的快速多视图离散聚类方法,其特征在于,步骤5具体为:
以最小化聚合图
Figure FDA00033856110200000310
与使用图像聚类标签矩阵重构的相似度图Y(YTY)-1YT之间的差异为优化目标,构建FMDC的目标函数:
Figure FDA00033856110200000311
式中,||·||F代表l-F范数,Y=[y1,…,yc]∈{0,1}n×c是离散的图像聚类指示矩阵,c代表类别数,yl(l∈1,…,c)是第l个图像类的聚类指示矩阵;Ind是离散图像聚类指示矩阵的缩写。
8.根据权利要求7所述的基于锚点图的快速多视图离散聚类方法,其特征在于,步骤6中FMDC的目标函数的求解过程为:
(601)固定α,更新Y;
当α固定时,求解Y的子问题为:
Figure FDA0003385611020000041
式中,
Figure FDA0003385611020000042
求解此问题等价于求解下式中的问题:
Figure FDA0003385611020000043
式(7)写成另一种形式:
Figure FDA0003385611020000044
Figure FDA0003385611020000045
包含了Y的所有行,采用坐标下降方法按行更新Y;
(602)固定Y,更新α;
当Y固定时,求解α的子问题为:
Figure FDA0003385611020000046
式中,
Figure FDA0003385611020000047
Figure FDA0003385611020000048
和Sv写成大向量的形式,令
Figure FDA0003385611020000049
则有:
Figure FDA00033856110200000410
式(15)利用增广拉格朗日乘子法求解;
(603)循环(601)和(602)交替优化α和Y,直到目标函数收敛到最小值。
9.根据权利要求8所述的基于锚点图的快速多视图离散聚类方法,其特征在于,(601)中采用坐标下降方法按行更新Y,具体为:
当更新到了Y的第i行yi,为了确定yi,对比yi分别为[1,0,…,0]—[0,0,…,1]共c中不同取值时式(8)的目标函数值,并在其中选取令目标函数最大的取值作为yi的最优解;
将yi取c中不同值时的Y记为{Y(1),…,Y(c)},第h种取值的目标函数值为:
Figure FDA0003385611020000051
因此,求解的问题为:
Figure FDA0003385611020000052
定义Y(0)的第i行为[0,0,…,0],即全为0,则:
Figure FDA0003385611020000053
定义Δ(h)=obj(Y(h))-obj(Y(0)),求解式(10)中的问题等价于求解下式问题:
Figure FDA0003385611020000054
此时,得到最优解:
Figure FDA0003385611020000055
式中,若<·>为真,则yip=1,否则yip=0。
10.一种基于锚点图的快速多视图离散聚类***,其特征在于,包括锚点图像生成模块、锚点图构建模块、相似度矩阵生成模块、分配权重模块、构建FMDC的目标函数模块和求解FMDC的目标函数模块;
所述锚点图像生成模块,用于基于平衡k-means++的层次k-means++方法为n幅原始图像生成m幅具有代表性的锚点图像;
所述锚点图构建模块,用于在各视图特征上构建原始图像与锚点图像之间的锚点图;
所述相似度矩阵生成模块,用于基于所述锚点图计算原始图像之间的相似度矩阵;
所述分配权重模块,用于为各特征上的相似度图分配权重系数,得到聚合图;
所述构建FMDC的目标函数模块,用于将最小化聚合图与使用图像聚类标签矩阵重构的相似度图之间的差异作为优化目标,构建FMDC的目标函数;
所述求解FMDC的目标函数模块,用于求解FMDC的目标函数,输出离散的多视图图像聚类指示矩阵,完成多视图图像聚类任务。
CN202111452689.8A 2021-11-30 2021-11-30 一种基于锚点图的快速多视图离散聚类方法及*** Pending CN114399653A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111452689.8A CN114399653A (zh) 2021-11-30 2021-11-30 一种基于锚点图的快速多视图离散聚类方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111452689.8A CN114399653A (zh) 2021-11-30 2021-11-30 一种基于锚点图的快速多视图离散聚类方法及***

Publications (1)

Publication Number Publication Date
CN114399653A true CN114399653A (zh) 2022-04-26

Family

ID=81225985

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111452689.8A Pending CN114399653A (zh) 2021-11-30 2021-11-30 一种基于锚点图的快速多视图离散聚类方法及***

Country Status (1)

Country Link
CN (1) CN114399653A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116310452A (zh) * 2023-02-16 2023-06-23 广东能哥知识科技有限公司 一种多视图聚类方法及***

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200074220A1 (en) * 2018-09-04 2020-03-05 Inception Institute of Artificial Intelligence, Ltd. Multi-view image clustering techniques using binary compression
CN111753904A (zh) * 2020-06-24 2020-10-09 广东工业大学 一种快速高光谱图像聚类方法、装置、设备及介质
AU2020103322A4 (en) * 2020-11-09 2021-01-14 Southwest University Supervised Discrete Hashing Algorithm With Relaxation Over Distributed Network
CN112418286A (zh) * 2020-11-16 2021-02-26 武汉大学 基于约束非负矩阵分解的多视图聚类方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200074220A1 (en) * 2018-09-04 2020-03-05 Inception Institute of Artificial Intelligence, Ltd. Multi-view image clustering techniques using binary compression
CN111753904A (zh) * 2020-06-24 2020-10-09 广东工业大学 一种快速高光谱图像聚类方法、装置、设备及介质
AU2020103322A4 (en) * 2020-11-09 2021-01-14 Southwest University Supervised Discrete Hashing Algorithm With Relaxation Over Distributed Network
CN112418286A (zh) * 2020-11-16 2021-02-26 武汉大学 基于约束非负矩阵分解的多视图聚类方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
QIANYAO QIANG: "《Fast Multi-view Discrete Clustering with Anchor Graphs》", 《THE THIRTY-FIFTH AAAI CONFERENCE ON ARTIFICIAL INTELLIGENCE (AAAI-21)》, pages 1 - 4 *
夏冬雪;杨燕;王浩;阳树洪;: "基于邻域多核学习的后融合多视图聚类算法", 计算机研究与发展, no. 08 *
孔颉;孙权森;徐晖;***;纪则轩;: "基于仿射不变离散哈希的遥感图像多目标分类", 软件学报, no. 04 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116310452A (zh) * 2023-02-16 2023-06-23 广东能哥知识科技有限公司 一种多视图聚类方法及***
CN116310452B (zh) * 2023-02-16 2024-03-19 广东能哥知识科技有限公司 一种多视图聚类方法及***

Similar Documents

Publication Publication Date Title
Jia et al. Bagging-based spectral clustering ensemble selection
Mur et al. Determination of the optimal number of clusters using a spectral clustering optimization
Bagirov et al. Nonsmooth DC programming approach to the minimum sum-of-squares clustering problems
CN107292341A (zh) 基于成对协同正则化和nmf的自适应多视图聚类方法
CN103985112B (zh) 基于改进多目标粒子群优化聚类的图像分割方法
CN109063743B (zh) 基于半监督多任务学习的医疗数据分类模型的构建方法
Yin Nonlinear dimensionality reduction and data visualization: a review
CN111724867A (zh) 分子属性测定方法、装置、电子设备及存储介质
Chen et al. Uncorrelated lasso
Chen et al. LABIN: Balanced min cut for large-scale data
Zhang et al. Enabling in-situ data analysis for large protein-folding trajectory datasets
CN114399649B (zh) 一种基于学习图的快速多视图半监督学习方法及***
CN113255873A (zh) 一种聚类天牛群优化方法、***、计算机设备和存储介质
CN114299362A (zh) 一种基于k-means聚类的小样本图像分类方法
CN112766400A (zh) 高维数据基于多个数据变换空间的半监督分类集成方法
CN111401413A (zh) 一种基于优化理论的带规模约束的并行聚类方法
CN114399653A (zh) 一种基于锚点图的快速多视图离散聚类方法及***
CN110175631A (zh) 一种基于共同学习子空间结构和聚类指示矩阵的多视图聚类方法
Chu et al. On regularized square-root regression problems: distributionally robust interpretation and fast computations
Zhu et al. Incremental classifier learning based on PEDCC-loss and cosine distance
JP2012093976A (ja) クラスタリング・システム、方法及びプログラム
CN111738298B (zh) 一种基于深宽可变多核学习的mnist手写数字数据的分类方法
Lv et al. Incremental semi-supervised graph learning NMF with block-diagonal
CN114037931A (zh) 一种自适应权重的多视图判别方法
Chen et al. FINC: An efficient and effective optimization method for normalized cut

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination