CN111027582B - 基于低秩图学习的半监督特征子空间学习方法及装置 - Google Patents

基于低秩图学习的半监督特征子空间学习方法及装置 Download PDF

Info

Publication number
CN111027582B
CN111027582B CN201910891913.XA CN201910891913A CN111027582B CN 111027582 B CN111027582 B CN 111027582B CN 201910891913 A CN201910891913 A CN 201910891913A CN 111027582 B CN111027582 B CN 111027582B
Authority
CN
China
Prior art keywords
objective function
samples
matrix
function
variables
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910891913.XA
Other languages
English (en)
Other versions
CN111027582A (zh
Inventor
李骜
安若琦
陈德云
孙广路
林克正
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin University of Science and Technology
Original Assignee
Harbin University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin University of Science and Technology filed Critical Harbin University of Science and Technology
Priority to CN201910891913.XA priority Critical patent/CN111027582B/zh
Publication of CN111027582A publication Critical patent/CN111027582A/zh
Application granted granted Critical
Publication of CN111027582B publication Critical patent/CN111027582B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2155Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the incorporation of unlabelled data, e.g. multiple instance learning [MIL], semi-supervised techniques using expectation-maximisation [EM] or naïve labelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24147Distances to closest patterns, e.g. nearest neighbour classification
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明的实施方式提供了一种基于低秩图学习的半监督特征子空间学习方法及装置。该方法包括:将图像数据集分成测试集和训练集,训练集中包括有标签及无标签的样本;定义关于特征子空间学习模型的目标函数;用标签传播的方式,构建有关标签的不同约束项,进而预测出无标签样本的标签信息,重新拟定目标函数;将重新拟定的目标函数中的特征子空间施加正交约束;利用训练集,求解出目标函数值最小化时各个变量的值,以通过目标函数求解后得到一个特征子空间;以及通过所述特征子空间投影测试集,得到所述数据集里所有类别图像的所有特征,通过预定分类器获得所述数据集的识别率。本发明的上述技术克服了现有技术的不足。

Description

基于低秩图学习的半监督特征子空间学习方法及装置
技术领域
本发明的实施方式涉及图像分类领域,更具体地,本发明的实施方式涉及一种基于低秩图学习的半监督特征子空间学习方法及装置。
背景技术
特征子空间学习在模式识别中起着重要作用,并且已经做出许多努力来产生更具判别性的学习模型。近年来,提出了许多基于表示模型的判别特征学习方法,不仅引起了人们的广泛关注,而且在实际工作中也取得了成功的应用。然而,这些方法大多数是在有监督条件下完成,忽略了现实生活中包含大量无标签样本的情况。
发明内容
在本上下文中,本发明的实施方式期望提供一种基于低秩图学习的半监督特征子空间学习方法及装置,以使用低秩约束来构造用于特征学习和标签预测的约束项,将非负低秩表示系数作为衡量子空间结构相似性和样本标签相似性的约束引入到用于分类的学习模型中,用于学习预测训练样本完整的标签信息和特征投影空间,促进模型自适应性和鲁棒性;此外,通过将特征子空间学习、低秩表示和标签传播学习放入统一的框架中,可以在迭代期间彼此促进以获得整体最优;还包含基于学习到的类别标签信息的线性回归项以增强投影的特征,并且使相同类别的样本靠近同一聚类中心,不同类别的聚类中心相互远离,采用迭代数值方案来解决目标函数并保证收敛。
在本发明实施方式的第一方面中,提供了一种基于低秩图学习的半监督特征子空间学习方法,包括:将图像数据集分成测试集和训练集,训练集中的样本包括有标签的样本以及无标签的样本;定义关于特征子空间学习模型的目标函数,其中,目标函数中的第一项为矩阵的低秩约束,第二项为正则化约束项,将低秩表示系数作为正则化参数来约束两个样本投影后的距离,矩阵中的元素被视为对两个样本的低维结构相似性的测量,对矩阵中的每个元素引入非负约束;用标签传播的方式,构建有关标签的不同约束项,进而预测出无标签样本的的标签信息,重新拟定目标函数;将重新拟定的目标函数中的特征子空间施加正交约束;利用训练集,求解出目标函数值最小化时各个变量的值,以通过目标函数求解后得到一个特征子空间;以及通过所述特征子空间投影测试集,得到所述数据集里所有类别图像的所有特征,通过预定分类器获得所述数据集的识别率。
进一步地,在所述定义关于特征子空间学习模型的目标函数的步骤中所定义的目标函数如下:
Figure GDA0002406717870000021
s.t.X=XZ+E,Zij≥0
其中,X=[X1,X2,...,Xm]表示训练集,Xi(i=1,2,...,m)表示X的每一列,m表示训练样本的总数,Z表示系数矩阵,P表示特征子空间,E表示误差矩阵,λ和η是平衡三项的参数。
进一步地,重新拟定的目标函数如下:
Figure GDA0002406717870000022
s.t.X=XZ+E,Zij≥0
其中,U=[U1,U2,...,Um]是由类别标签决定的矩阵,Ui=[-1,...,-1,1,-1,...,-1,0,...,0]T∈RC表示U的第i列。
进一步地,根据下式将目标函数中的特征子空间施加正交约束:
Figure GDA0002406717870000023
s.t.X=XZ+E,Zij≥0,PTP=I
进一步地,将目标函数引入三个辅助变量J,H和R求解最小化问题,所述目标函数表示为:
Figure GDA0002406717870000024
s.t.X=XZ+E,Zij≥0,PTP=I,Z=R,Z=H,Z=J
进一步地,所述利用训练集求解出目标函数值最小化时各个变量的值的步骤包括:通过增广拉格朗日乘子法,确定目标函数问题中的拉格朗日函数;将拉格朗日函数进行化简和最小化转换;利用交替方向乘子算法,在其他变量不变的条件下针对每个变量迭代地求解最小化;固定其他变量,删除与F无关的函数项,将目标函数式重写为基于图的化简公式;利用目标函数的导数,进行求解;固定其他变量,删除与P无关的函数项,得到变量P的目标函数式,将特征投影空间的目标函数式重写为基于图的化简公式,利用目标函数的导数进行求解;固定其他变量,删除与J无关的函数项,得到变量J的目标函数式,通过奇异值收缩算子求解;固定其他变量,删除与R无关的函数项,得到变量R的目标函数式,并重写;固定其他变量,删除与Z无关的函数项,得到变量Z的目标函数式,并重写;固定其他变量,删除与H无关的函数项,得到变量H的目标函数式,进行强制目标函数式导数为零的求解,得到封闭形式;固定其他变量,删除与E无关的函数项,得到变量E的目标函数式,将矩阵E进行更新;逐项更新拉格朗日乘子和参数。
进一步地,在训练集中:有标签的样本的数量与无标签的样本的数量相同;或有标签的样本的数量与无标签的样本的数量不同。
根据本发明的另一个方面,还提供了一种基于低秩图学习的半监督特征子空间学习装置,包括:存储单元,用于存储图像数据集,其中存储单元中的图像数据集分为测试集和训练集,训练集中的样本包括有标签的样本以及无标签的样本;定义单元,用于定义关于特征子空间学习模型的目标函数,其中,目标函数中的第一项为矩阵的低秩约束,第二项为正则化约束项,将低秩表示系数作为正则化参数来约束两个样本投影后的距离,矩阵中的元素被视为对两个样本的低维结构相似性的测量,对矩阵中的每个元素引入非负约束;目标函数重拟单元,用于采用标签传播的方式,构建有关标签的不同约束项,进而预测出无标签样本的的标签信息,重新拟定目标函数;正交约束单元,用于将目标函数重拟单元重新拟定的目标函数中的特征子空间施加正交约束;求解单元,用于利用训练集,求解出目标函数值最小化时各个变量的值;通过目标函数求解后得到所有变量的值,求解后得到特征子空间;以及获得单元用于通过所述特征子空间投影测试集,得到数据集里所有类别图像的所有特征,最终通过分类器得到所述数据集的识别率。
根据本发明实施方式的基于低秩图学习的半监督特征子空间学习方法及装置,用于图像分类,使用低秩约束来构造用于特征学习和标签预测的约束性项,将非负低秩表示系数作为衡量子空间结构相似性和样本标签信息相似性的约束引入到用于分类的学习模型中,用于学习预测训练样本完整的标签信息和特征投影空间,促进模型自适应性和鲁棒性;此外,通过将特征子空间学习、低秩表示和标签传播学习放入统一的框架中,可以在迭代期间彼此促进以获得整体最优;还包含基于学习到的类别标签信息的线性回归项以增强投影的特征,并且使相同类别的样本靠近同一聚类中心,不同类别的聚类中心相互远离,采用迭代数值方案来解决目标函数并保证收敛;本发明与其他方法相比,识别率更高,性能更加稳健。
具体优势如下:
1.本发明的实施例采用了一个新的半监督特征子空间学习模型,将标签传播学习、低秩表示和特征学习结合到一个统一的框架中;新模型中,低秩表示系数被分别用作子空间和类别标签信息的相似性度量来指导特征学习和标签学习;此外,基于学习到的标签的线性回归被结合到所提出的模型中作为另一种监督信息以扩大类内边界,这可以使提取的特征更适用于分类任务。
2.本发明的实施例提出的目标函数对低秩表示系数引入了非负约束,使系数用作判别正则化的惩罚参数。
3.本发明的实施例利用增广拉格朗日乘数(ALM)方法和乘法器的替代方向法(ADMM)提供了一种迭代方案,通过该方案有效地解决了目标函数,并保证了收敛性。
附图说明
通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,其中:
图1是示意性地示出了根据本发明实施方式的基于低秩图学习的半监督特征子空间学习方法的一个示例性处理的流程图;
图2是示意性地示出了根据本发明实施方式的基于低秩图学习的半监督特征子空间学习装置的一个示例的结构框图;
图3是示出图2中的求解单元的一种可能结构的示意图;
图4A-4D是四个公开数据集中部分样本的示例对比图;
图5是示出四个公开数据集中部分样本的示例对比图;
图6是示出在COIL20测试集上不同脉冲噪声干扰水平下的分类结果图。
在附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
下面将参考若干示例性实施方式来描述本发明的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本发明,而并非以任何方式限制本发明的范围。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
本领域技术人员知道,本发明的实施方式可以实现为一种***、装置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
示例性方法
图1示意性地示出了根据本公开实施例的基于低秩图学习的半监督特征子空间学习方法的一种示例性的处理流程100。
如图1所示,处理流程100开始后,首先执行步骤S110。
在步骤S110中,将图像数据集分成测试集和训练集,训练集中的样本包括有标签的样本以及无标签的样本。
其中,上述图像数据集可以预先获得,也可以从外部接收。
在一个示例中,在训练集中,有标签的样本与无标签的样本的数量可以相同。
在另一个示例中,在训练集中,有标签的样本与无标签的样本的数量也可以不同。
接着,在步骤S120中,定义关于特征子空间学习模型的目标函数,其中,目标函数中的第一项为矩阵(即自表示系数矩阵)的低秩约束,第二项为正则化约束项,将低秩表示系数作为正则化参数来约束两个样本投影后的距离,矩阵中的元素被视为对两个样本的低维结构相似性的测量,对矩阵中的每个元素引入非负约束。
作为示例,步骤S120中定义的目标函数可以采用如下表达形式:
Figure GDA0002406717870000061
其中,X=[X1,X2,...,Xm]表示训练集,Xi(i=1,2,...,m)表示X的第i列,m表示训练样本的总数,Z表示自表示系数矩阵,P表示特征子空间,E表示误差矩阵,λ是平衡三项的一个参数,Xj(j=1,2,...,m,且j不等于i)表示X的第j列,Zij表示矩阵Z中的每个元素(即第i行、第j列元素),PT表示矩阵P的转置。
目标函数中第一项对矩阵进行低秩约束,第二项为局部结构保持约束项,将低秩表示系数作为正则化参数来约束两个样本投影后的距离,矩阵中的元素被视为对两个样本的低维结构相似性的测量同时,为了使该系数能够用做正则化约束参数,对矩阵Z中的每个元素还引入非负约束;通过判别的正则化约束,样本的结构相似性信息不仅可以保留在特征子空间中,还可以用于指导特征子空间学习。对于第二项,P和Z将联合学习,这将在迭代期间促进性能更加稳健。此外,目标函数中的第三项表示对对误差矩阵E的2,1范数约束。
然后,在步骤S130中,采用标签传播的方式,构建有关标签的不同约束项,进而预测出无标签样本的的标签信息,重新拟定目标函数。
作为示例,步骤S130中重新拟定的目标函数例如可以采用如下表达形式:
Figure GDA0002406717870000071
其中,U=[U1,U2,...,Um]是由类别标签决定的矩阵,Ui=[-1,...,-1,1,-1,...,-1]T∈RC表示U的第i列,如果第i个示例属于第c类,则Ui中第c个元素为1,其余为-1。B表示学习到的所有训练样本的标签信息,其中Bi、Bj表示第i个、第j个训练样本的标签信息。其中,c为大于0、且小于样本总类别数的整数。
公式(2)前三项可以看作是基于图的标签传播学习的判别性约束项。如步骤S120中可以得知,低秩表示系数可以衡量样本之间的相似性,样本的标签信息同时也反应样本之间的相似性,因此将低秩表示系数作为标签学习过程中的测量标准。进而利用学习到的标签信息作为聚类中心,扩大不同类别样本的距离,这有助于本发明方法在分类问题上实现更好的判别和适应性。
接着,在步骤S140中,将步骤S130中重新拟定的目标函数中的特征子空间施加正交约束,如下:
Figure GDA0002406717870000072
其中,I是单位阵,P表示特征子空间,实施正交约束后可以有效减少学习到的特征子空间中冗余的信息;
作为示例,将步骤S140所得到的施加正交约束的目标函数引入三个辅助变量R,H和J,求解引入上述三个辅助变量后的目标函数的最小化问题,如下:
Figure GDA0002406717870000073
其中,Rij表示矩阵R的第i行且第j列上的元素,Hij表示矩阵H的第i行且第j列上的元素。
然后,在步骤S150中,利用训练集,求解出目标函数值最小化时各个变量的值。
作为示例,步骤S150例如可以包括如下将要描述的子流程,该子流程包括步骤S1501~S1512。
在步骤S1501中,通过增广拉格朗日乘子法ALM(Augmented Lagrange Method),确定目标函数问题中的拉格朗日函数,如下:
Figure GDA0002406717870000081
其中<·>表示内部项的运算,Yg(g=1,2,3,4)是拉格朗日乘子,
Figure GDA0002406717870000082
表示公式(5)的拉格朗日函数;μ为ALM引入的参数;PT为矩阵P的转置,Hij表示矩阵H中每个元素。
接着,在步骤S1502中,将拉格朗日函数进行化简和最小化转换,如下:
Figure GDA0002406717870000083
Figure GDA0002406717870000084
然后,在步骤S1503中,利用交替方向乘子算法ADMM(Alternating DirectionMethod of Multipliers),针对每个变量迭代地求解最小化,固定其他变量(此处“其他变量”是指B以外的所有变量),删除与B无关的函数项,得到如下公式:
Figure GDA0002406717870000091
将目标函数式重写为基于图的化简公式,如下:
Figure GDA0002406717870000092
其中L=D-R表示图拉普拉斯矩阵,D通过
Figure GDA0002406717870000093
呈现对角矩阵;L为一个矩阵,Tr表示矩阵的迹。其中,∑R*i表示矩阵R的第i列中所有元素相加,∑Ri*表示矩阵R中第i行中所有元素相加。
然后,在步骤S1504中,令目标函数导数为0,得到如下结果:
B=(U+PTX)(2I+L)-1 (10)
在步骤S1505中,同样利用交替方向乘子算法ADMM,针对每个变量迭代地求解最小化,固定其他变量(此处“其他变量”是指P以外的所有变量),删除与P无关的函数项,如下:
Figure GDA0002406717870000094
将投影子空间的目标函数式重写为基于图的化简公式,如下:
Figure GDA0002406717870000095
其中L=D-H表示图拉普拉斯矩阵,D通过
Figure GDA0002406717870000096
呈现对角矩阵;L为一个矩阵,Tr表示矩阵的迹。
在步骤S1506中,由于含有正交约束,最小化问题不能被视为简单的二次问题。先求出目标函数导数,再进行求解,如下:
Figure GDA0002406717870000097
其中,
Figure GDA0002406717870000098
表示为删除与P无关函数项后,只含P的目标函数式。/>
Figure GDA0002406717870000099
表示对目标函数式中的P进行求导。XT表示矩阵X的转置,BT表示矩阵B的转置;设P(k)表示第k次迭代后投影子空间矩阵P的表达式,令/>
Figure GDA00024067178700000910
则P(k+1)可用下式计算:
Figure GDA0002406717870000101
式中τ(k+1)为迭代步进量,满足τ(k+1)=τ(k)+0.05,M(k)表示第k次迭代后矩阵M的表达式;
在步骤S1507中,固定其他变量(此处“其他变量”是指J以外的所有变量),删除与J无关的函数项,得到变量J的目标函数式,如下:
Figure GDA0002406717870000102
该问题是经典的秩最小化问题,通过奇异值收缩算子求解;Zk
Figure GDA0002406717870000103
表示第k次迭代后的矩阵Z和Y2
在步骤S1508中,固定其他变量(此处“其他变量”是指R以外的所有变量),删除与R无关的函数项,得到变量R的目标函数式,如下:
Figure GDA0002406717870000104
Figure GDA0002406717870000105
s.t.Rij≥0 (16)
其中S通过
Figure GDA0002406717870000106
表示为一个矩阵,而且,由于S和R这两者是非负的,最小化可以转换为
Figure GDA0002406717870000107
Sk+1表示第k+1次迭代后的矩阵S;
上式中问题可以看作是非负加权范数最小化问题,其解决方案如下:
Figure GDA0002406717870000108
Qij为矩阵的第i行且第j列的元素,则式(17)可转化为对矩阵中的各元素进行如下的逐元素求解模型:
Figure GDA0002406717870000109
式中|·|表示绝对值运算,
Figure GDA0002406717870000111
表示矩阵S中的每一项在第k+1次迭代后的值,式中目标函数的导数为0可得Rij的闭式解,
Figure GDA0002406717870000112
接着,在步骤S1509中,固定其他变量(此处“其他变量”是指H以外的所有变量),删除与H无关的函数项,得到变量H的目标函数式,并重写,如下:
Figure GDA0002406717870000113
Figure GDA0002406717870000114
其中G通过
Figure GDA0002406717870000115
表示成一个矩阵的形式,而且,由于G和H这两者都是非负的,最小化可以转换为
Figure GDA0002406717870000116
Gk+1表示第k+1次迭代后的矩阵G;
上式中问题可以看作是非负加权范数最小化问题,其解决方案如下:
Figure GDA0002406717870000117
Vij为矩阵的第i行且第j列的元素,则式(21)可转化为对矩阵中的各元素进行如下的逐元素求解模型:
Figure GDA0002406717870000118
式中|·|表示绝对值运算,
Figure GDA0002406717870000119
表示矩阵S中的每一项在第k+1次迭代后的值,由于Hij≥0,上式中目标函数的导数为0可得Hij的闭式解,
Figure GDA00024067178700001110
然后,在步骤S1510中,固定其他变量(此处“其他变量”是指Z以外的所有变量),删除与Z无关的函数项,得到变量Z的目标函数式,如下:
Figure GDA0002406717870000121
其中,Ek
Figure GDA00024067178700001210
,/>
Figure GDA0002406717870000122
Hk表示第k次迭代后的矩阵E,Y1,Y2,Y3,Y4,H式;Jk+1表示第k+1次迭代后的矩阵J;
进行强制目标函数式导数为零的求解,得到封闭形式,如下:
Figure GDA0002406717870000123
其中,Zk+1表示第k+1次迭代后的矩阵Z;XT表示矩阵X的转置;
在步骤S1511中,固定其他变量(此处“其他变量”是指E以外的所有变量),删除与E无关的函数项,得到变量E的目标函数式,将矩阵E进行更新,如下:
Figure GDA0002406717870000124
上式中的最小化通过公式(19)解决,通过设置
Figure GDA0002406717870000125
更新Ek+1的第i列计算为
Figure GDA0002406717870000126
在步骤S1512中,逐项更新拉格朗日乘子和参数,公式如下:
Figure GDA00024067178700001211
Figure GDA0002406717870000127
Figure GDA0002406717870000128
Figure GDA0002406717870000129
μ=min(μmax,ρμ)(28)
Y1、Y2、Y3、Y4为拉格朗日乘子,ρ和μ为ALM引入的参数,μmax表示为参数μ允许范围内的最大值。
这样,通过执行完步骤S150,目标函数求解后得到所有变量的值,其中P为求解后得到的特征子空间。
然后,在步骤S160中,通过所述特征子空间投影测试集,得到数据集里所有类别图像的所有特征,最终通过预定分类器(如下文提到的KNN或SRC分类器)得到所述数据集的识别率。
通过本实施方式学习到特征子空间,之后将每个训练样本投影到特征子空间上得到该训练样本的特征来提取该训练样本所属类别的特征,随后根据投影特征进行图片识别和分类。
示例性装置
参见图2,示意性地示出了根据本发明一实施例的基于低秩图学***板电脑等智能电子设备中;当然,本发明实施方式的装置也可以设置于服务器中。本发明实施方式的装置300可以包括下述组成单元:存储单元310、定义单元320、目标函数重拟单元330、正交约束单元340、求解单元350以及获得单元360。
存储单元310,用于存储图像数据集,其中存储单元310中的图像数据集分为测试集和训练集,训练集中的样本包括有标签的样本以及无标签的样本。
在一个示例中,在训练集中,有标签的样本与无标签的样本的数量可以相同。
在另一个示例中,在训练集中,有标签的样本与无标签的样本的数量也可以不同。
定义单元320,用于定义关于特征子空间学习模型的目标函数,其中,目标函数中的第一项为矩阵的低秩约束,第二项为正则化约束项,将低秩表示系数作为正则化参数来约束两个样本投影后的距离,矩阵中的元素被视为对两个样本的低维结构相似性的测量,对矩阵中的每个元素引入非负约束。
作为示例,定义单元320定义的目标函数可以采用上文所述的公式(1)的表达形式,这里不再赘述。
目标函数重拟单元330,用于采用标签传播的方式,构建有关标签的不同约束项,进而预测出无标签样本的的标签信息,重新拟定目标函数。
作为示例,目标函数重拟单元330重新拟定的目标函数可以采用上文所述的公式(2)的表达形式,这里不再赘述。
正交约束单元340,用于将目标函数重拟单元330重新拟定的目标函数中的特征子空间施加正交约束,如上文所述的公式(3)以及(4)所示。
其中,I是单位阵,P表示特征子空间,实施正交约束后可以有效减少学习到的特征子空间中冗余的信息;
求解单元350,用于利用训练集,求解出目标函数值最小化时各个变量的值。
这样,通过求解单元350的处理,目标函数求解后得到所有变量的值,其中P为求解后得到的特征子空间。
获得单元360用于通过所述特征子空间投影测试集,得到数据集里所有类别图像的所有特征,最终通过分类器得到所述数据集的识别率。
作为示例,求解单元350例如可以包括如图3所示的结构。
如图3所示,求解单元350可以包括拉格朗日函数确定模块350-1、化简和最小化转换模块350-2、第一计算模块350-3、求导模块350-4、第二计算模块350-5、第三计算模块350-6、第四计算模块350-7、第五计算模块350-8、第六计算模块350-9、第七计算模块350-10、第八计算模块350-11和更新模块350-12。
拉格朗日函数确定模块350-1可用于执行上文中所描述的步骤S1501中的处理,并能够达到相类似的功能和效果,这里不再赘述。
化简和最小化转换模块350-2可以用于执行上文中所描述的步骤S1502中的处理,并能够达到相类似的功能和效果,这里不再赘述。
第一计算模块350-3可以用于执行上文中所描述的步骤S1503中的处理,并能够达到相类似的功能和效果,这里不再赘述。
求导模块350-4可以用于执行上文中所描述的步骤S1504中的处理,并能够达到相类似的功能和效果,这里不再赘述。
第二计算模块350-5可以用于执行上文中所描述的步骤S1505中的处理,并能够达到相类似的功能和效果,这里不再赘述。
第三计算模块350-6可以用于执行上文中所描述的步骤S1506中的处理,并能够达到相类似的功能和效果,这里不再赘述。
第四计算模块350-7可以用于执行上文中所描述的步骤S1507中的处理,并能够达到相类似的功能和效果,这里不再赘述。
第五计算模块350-8可以用于执行上文中所描述的步骤S1508中的处理,并能够达到相类似的功能和效果,这里不再赘述。
第六计算模块350-9可以用于执行上文中所描述的步骤S1509中的处理,并能够达到相类似的功能和效果,这里不再赘述。
第七计算模块350-10可以用于执行上文中所描述的步骤S1510中的处理,并能够达到相类似的功能和效果,这里不再赘述。
第八计算模块350-11可以用于执行上文中所描述的步骤S1511中的处理,并能够达到相类似的功能和效果,这里不再赘述。
更新模块350-12可以用于执行上文中所描述的步骤S1512中的处理,并能够达到相类似的功能和效果,这里不再赘述。
优选实施例
在该优选实施例中,采用四个已公开的数据集,数据集包括两个人脸数据集(即下文所提到的第一面部数据集和第二面部数据集),一个物体数据集(即下文所提到的对象数据集)和一个手写数字数据集。
其中,第一面部数据集例如采用ExtendedYaleB,包括3814个2414正面图像,每个人具有约64个具有不同光照条件的图像。部分实例图像如图4A所示。第一面部数据集使用测试图像的大小被裁剪为32×32。随机选择每个人的32个图像作为训练集,其中一半为有标签样本、一半为无标签样本,而其余的图像用作测试集。
此外,第二面部数据集为AR数据集(该数据集为公知的面部数据集),该数据集包括120个人的3120个灰度图像。对于第二面部数据集中的每个人,均包括正面视图的26个图像,其中各个图像可采用不同的表达方式,例如光照条件和遮挡。部分实例图像如图4B所示。所述面部数据集中的面部图像均被裁剪,调整为55×40,每个人的一半用作训练,训练样本中一半为有标签样本、一半为无标签样本,其余的用作测试。
另外,对象数据集例如采用COIL20,包括20个对象的1440个图像,每个对象具有从连续角度以5度的间隔获得的72个图像,部分图像如图4C所示。本实施例中,对象数据集中的所有图像均被调整为32×32,并进行了规范化。每个对象的10个图像用于训练,其中一半为有标签样本、一半为无标签样本,其余用于测试。
手写数字数据集采用Hand written dataset USPS,包括9298个手写数字图像,其中10个类从0到9,部分实例图像如图4D所示。所述手写数字数据集中所有图像大小均为16×16,对于每个数字,随机选择10个图像对训练集进行分组,训练样本中一半为有标签样本、一半为无标签样本,其余图像用于测试。
将本实施例(Ours)与几种现有的特征子空间学***均识别结果作为各对比方法的识别率,如表一所示。
表一
Methods ExtendedYaleB+SRC AR+SRC COIL20+KNN USPS+KNN
PCA 80.29% 81.24% 89.51% 76.47%
LDA 82.58% 93.93% 89.38% 72.49%
NPE 76.85% 81.47% 85.51% 62.10%
LSDA 87.53% 81.54% 84.23% 56.18%
Ours 95.74% 96.33% 91.58% 78.70%
通过上表中数据对比,本优选实施例在所有测试数据集上均显示出比其他对比方法更高的识别率。而且,使用KNN和SRC分类器都可以得到良好的实施结果,这表明模型在分类任务上具有稳定的性能。原因是使用低秩模型很好地挖掘了样本在低维子空间中的结构,并且其系数被有效地用作不同样本相似性测量和标签相似性测量以约束所学习到的投影子空间和未知样本的标签预测。而且,通过将标签全波、低秩表示和特征学习放入统一框架中,这两个变量可以在迭代求解过程中相互促进,从而得到更好的解决方案。
为了测试本实施例的稳健性,在两个选定的数据集上添加了不同级别的随机脉冲噪声,测试数据集选用COIL20,原始测试图像中加入了不同百分比的脉冲噪声,在图5中给出了加入噪声后的图像示例,并在图6中分别显示它们的分类结果。含噪样本分类实施中,参数的设置与无噪声干扰数据集实验中的设置相同。从分类结果可以看出,与传统的特征学习方法相比,本实施例(Ours)在噪声条件下显示出优势。这是因为虽然本实施例为半监督特征学习方法,但是低秩模型可以帮助消除噪声成分并探索原始无噪声干扰时数据中存在的更重要的结构信息指导道样本相似性和标签传播当训练样本受到噪声干扰时,本实施例的识别和分类结果相比其他方法性能得到了明显的提升,体现了一定的鲁棒性。
本实施例提出了一种基于低秩图学习的半监督特征子空间学习方法,用于图像特征提取以及识别和分类任务。建立了一个基于标签传播、低秩表示和类别标签三种约束方式的半监督特征子空间学习模型,并对该模型设计了一种基于交替方向乘子法的数值求解方法来保证算法的收敛性。在四个不同的公开测试数据集上的实验结果表明了本实施方式的优越性。此外,当训练样本受噪声干扰时,本实施方式的实验结果比其他对比方法具有明显提升,性能更稳健。
虽然已经参考若干具体实施方式描述了本发明的精神和原理,但是应该理解,本发明并不限于所公开的具体实施方式,对各方面的划分也不意味着这些方面中的特征不能组合以进行受益,这种划分仅是为了表述的方便。本发明旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。

Claims (6)

1.基于低秩图学习的半监督特征子空间学习方法,其特征在于,包括:
将图像数据集分成测试集和训练集,训练集中的样本包括有标签的样本以及无标签的样本;
定义关于特征子空间学习模型的目标函数,其中,目标函数中的第一项为矩阵的低秩约束,第二项为正则化约束项,将低秩表示系数作为正则化参数来约束两个样本投影后的距离,矩阵中的元素被视为对两个样本的低维结构相似性的测量,对矩阵中的每个元素引入非负约束;
采用标签传播的方式,构建有关标签的不同约束项,进而预测出无标签样本的的标签信息,重新拟定目标函数;
将重新拟定的目标函数中的特征子空间施加正交约束;
利用训练集,求解出目标函数值最小化时各个变量的值,以通过目标函数求解后得到一个特征子空间;以及通过所述特征子空间投影测试集,得到所述数据集里所有类别图像的所有特征,通过预定分类器获得所述数据集的识别率;
在所述定义关于特征子空间学习模型的目标函数的步骤中所定义的目标函数如下:
Figure FDA0004158692490000011
其中,X=[X1,X2,...,Xm]表示训练集,Xi表示X的每一列,i=1,2,...,m,m表示训练样本的总数,Z表示系数矩阵,P表示特征子空间,E表示误差矩阵,λ和η是平衡三项的参数,Xj表示X的第j列,j=1,2,...,m,且j不等于i,Zij表示矩阵Z中的第i行、第j列元素,PT表示矩阵P的转置;
重新拟定的目标函数如下:
Figure FDA0004158692490000012
其中,U=[U1,U2,...,Um]是由类别标签决定的矩阵,Ui=[-1,...,-1,1,-1,...,-1]T∈RC表示U的第i列,F表示学习到的所有训练样本的标签信息,Fi、Fj分别表示第i个、第j个训练样本的标签信息。
2.根据权利要求1所述的半监督特征子空间学习方法,其特征在于,根据下式将目标函数中的特征子空间施加正交约束:
Figure FDA0004158692490000021
3.根据权利要求2所述的半监督特征子空间学习方法,其特征在于,将目标函数引入三个辅助变量J,H和R求解最小化问题,所述目标函数表示为:
Figure FDA0004158692490000022
4.根据权利要求3所述的半监督特征子空间学习方法,其特征在于,所述利用训练集求解出目标函数值最小化时各个变量的值的步骤包括:
通过增广拉格朗日乘子法,确定目标函数问题中的拉格朗日函数;
将拉格朗日函数进行化简和最小化转换;
利用交替方向乘子算法,在其他变量不变的条件下针对每个变量迭代地求解最小化;固定其他变量,删除与F无关的函数项,将目标函数式重写为基于图的化简公式;
利用目标函数的导数,进行求解;
固定其他变量,删除与P无关的函数项,得到变量P的目标函数式,将特征投影空间的目标函数式重写为基于图的化简公式,利用目标函数的导数进行求解;
固定其他变量,删除与J无关的函数项,得到变量J的目标函数式,通过奇异值收缩算子求解;
固定其他变量,删除与R无关的函数项,得到变量R的目标函数式,并重写;
固定其他变量,删除与Z无关的函数项,得到变量Z的目标函数式,并重写;
固定其他变量,删除与H无关的函数项,得到变量H的目标函数式,进行强制目标函数式导数为零的求解,得到封闭形式;
固定其他变量,删除与E无关的函数项,得到变量E的目标函数式,将矩阵E进行更新;
逐项更新拉格朗日乘子和参数。
5.根据权利要求4所述的半监督特征子空间学习方法,其特征在于,在训练集中有标签的样本的数量与无标签的样本的数量相同;或有标签的样本的数量与无标签的样本的数量不同。
6.基于低秩图学习的半监督特征子空间学习装置,其特征在于,包括:
存储单元,用于存储图像数据集,其中存储单元中的图像数据集分为测试集和训练集,训练集中的样本包括有标签的样本以及无标签的样本;
定义单元,用于定义关于特征子空间学习模型的目标函数,其中,目标函数中的第一项为矩阵的低秩约束,第二项为正则化约束项,将低秩表示系数作为正则化参数来约束两个样本投影后的距离,矩阵中的元素被视为对两个样本的低维结构相似性的测量,对矩阵中的每个元素引入非负约束;
目标函数重拟单元,用于采用标签传播的方式,构建有关标签的不同约束项,进而预测出无标签样本的的标签信息,重新拟定目标函数;
正交约束单元,用于将目标函数重拟单元重新拟定的目标函数中的特征子空间施加正交约束;
求解单元,用于利用训练集,求解出目标函数值最小化时各个变量的值;通过目标函数求解后得到所有变量的值,求解后得到特征子空间;以及获得单元用于通过所述特征子空间投影测试集,得到数据集里所有类别图像的所有特征,最终通过分类器得到所述数据集的识别率;
定义单元中在所述定义关于特征子空间学习模型的目标函数的步骤中所定义的目标函数如下:
Figure FDA0004158692490000031
其中,X=[X1,X2,...,Xm]表示训练集,Xi表示X的每一列,i=1,2,...,m,m表示训练样本的总数,Z表示系数矩阵,P表示特征子空间,E表示误差矩阵,λ和η是平衡三项的参数,Xj表示X的第j列,j=1,2,...,m,且j不等于i,Zij表示矩阵Z中的第i行、第j列元素,PT表示矩阵P的转置;
目标函数重拟单元中重新拟定的目标函数如下:
Figure FDA0004158692490000032
其中,U=[U1,U2,...,Um]是由类别标签决定的矩阵,Ui=[-1,...,-1,1,-1,...,-1]T∈RC表示U的第i列,F表示学习到的所有训练样本的标签信息,Fi、Fj分别表示第i个、第j个训练样本的标签信息。
CN201910891913.XA 2019-09-20 2019-09-20 基于低秩图学习的半监督特征子空间学习方法及装置 Active CN111027582B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910891913.XA CN111027582B (zh) 2019-09-20 2019-09-20 基于低秩图学习的半监督特征子空间学习方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910891913.XA CN111027582B (zh) 2019-09-20 2019-09-20 基于低秩图学习的半监督特征子空间学习方法及装置

Publications (2)

Publication Number Publication Date
CN111027582A CN111027582A (zh) 2020-04-17
CN111027582B true CN111027582B (zh) 2023-06-27

Family

ID=70203795

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910891913.XA Active CN111027582B (zh) 2019-09-20 2019-09-20 基于低秩图学习的半监督特征子空间学习方法及装置

Country Status (1)

Country Link
CN (1) CN111027582B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112162560A (zh) * 2020-10-10 2021-01-01 金陵科技学院 基于非线性字典的回归误差抗干扰导航控制***
CN113033641B (zh) * 2021-03-17 2022-12-16 华南理工大学 一种高维数据半监督分类方法
CN113902950B (zh) * 2021-10-16 2024-03-19 江苏大学 一种基于几何保持双投影的图像多标签分类方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106021170A (zh) * 2016-05-19 2016-10-12 中国科学技术大学 采用半监督低秩表示模型的图构建方法
CN108009571A (zh) * 2017-11-16 2018-05-08 苏州大学 一种新的直推式半监督数据分类方法及***

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8935308B2 (en) * 2012-01-20 2015-01-13 Mitsubishi Electric Research Laboratories, Inc. Method for recovering low-rank matrices and subspaces from data in high-dimensional matrices
CN102880875B (zh) * 2012-10-12 2016-03-02 西安电子科技大学 基于lrr图的半监督学习人脸识别方法
US9544550B1 (en) * 2013-03-14 2017-01-10 Hrl Laboratories, Llc Low power surveillance camera system for intruder detection
CN107689053B (zh) * 2017-07-31 2021-06-04 温州大学 一种基于标签传播和排序约束的目标跟踪方法
CN109840530A (zh) * 2017-11-24 2019-06-04 华为技术有限公司 训练多标签分类模型的方法和装置
CN109308486A (zh) * 2018-08-03 2019-02-05 天津大学 基于深度学习的多源图像融合和特征提取算法
CN109522956B (zh) * 2018-11-16 2022-09-30 哈尔滨理工大学 一种低秩判别特征子空间学习方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106021170A (zh) * 2016-05-19 2016-10-12 中国科学技术大学 采用半监督低秩表示模型的图构建方法
CN108009571A (zh) * 2017-11-16 2018-05-08 苏州大学 一种新的直推式半监督数据分类方法及***

Also Published As

Publication number Publication date
CN111027582A (zh) 2020-04-17

Similar Documents

Publication Publication Date Title
CN108229296B (zh) 人脸皮肤属性识别方法和装置、电子设备、存储介质
CN109522956B (zh) 一种低秩判别特征子空间学习方法
Yan et al. Ranking with uncertain labels
CN111027582B (zh) 基于低秩图学习的半监督特征子空间学习方法及装置
CN112819686B (zh) 基于人工智能的图像风格处理方法、装置及电子设备
CN108509833B (zh) 一种基于结构化分析字典的人脸识别方法、装置及设备
WO2022105117A1 (zh) 一种图像质量评价的方法、装置、计算机设备及存储介质
CN110929802A (zh) 基于信息熵的细分类识别模型训练、图像识别方法及装置
CN105528620B (zh) 一种联合鲁棒主成分特征学习与视觉分类方法及***
CN110781970A (zh) 分类器的生成方法、装置、设备及存储介质
CN109740135A (zh) 图表生成方法及装置、电子设备和存储介质
CN111444802B (zh) 一种人脸识别方法、装置及智能终端
CN109711441A (zh) 图像分类方法、装置、存储介质及电子设备
CN110443169B (zh) 一种边缘保留判别分析的人脸识别方法
Zhou et al. Adaptive weighted locality-constrained sparse coding for glaucoma diagnosis
CN110097499B (zh) 基于谱混合核高斯过程回归的单帧图像超分辨率重建方法
Li et al. Unsupervised active learning via subspace learning
CN109657693B (zh) 一种基于相关熵和迁移学习的分类方法
Sun et al. Discrete aggregation hashing for image set classification
CN110135363B (zh) 基于判别词典嵌入行人图像检索方法、***、设备及介质
CN105389560B (zh) 基于局部约束的图优化维数约简方法
CN116740421A (zh) 基于无监督公共子空间学习模型的遥感图像分类方法和装置
Lv et al. A robust mixed error coding method based on nonconvex sparse representation
CN114882273A (zh) 应用于狭小空间的视觉识别方法、装置、设备和存储介质
CN110443255B (zh) 用于图像特征提取的图像识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant