CN113902950B - 一种基于几何保持双投影的图像多标签分类方法 - Google Patents

一种基于几何保持双投影的图像多标签分类方法 Download PDF

Info

Publication number
CN113902950B
CN113902950B CN202111206294.XA CN202111206294A CN113902950B CN 113902950 B CN113902950 B CN 113902950B CN 202111206294 A CN202111206294 A CN 202111206294A CN 113902950 B CN113902950 B CN 113902950B
Authority
CN
China
Prior art keywords
matrix
label
double projection
projection
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111206294.XA
Other languages
English (en)
Other versions
CN113902950A (zh
Inventor
刘志锋
蔡瑞行
沈项军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu University
Original Assignee
Jiangsu University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu University filed Critical Jiangsu University
Priority to CN202111206294.XA priority Critical patent/CN113902950B/zh
Publication of CN113902950A publication Critical patent/CN113902950A/zh
Application granted granted Critical
Publication of CN113902950B publication Critical patent/CN113902950B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Mathematical Optimization (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Mathematical Analysis (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Algebra (AREA)
  • Medical Informatics (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于几何保持双投影的图像多标签分类方法,本方法与传统的多标签分类算法直接从特征空间学习合适的特征维数不同,本发明所提出的方法是同时从输入特征空间和输出特征空间学习双标签和特征空间投影,从而实现标签和特征空间的降维,考虑到标签流形和特征流形中不仅有标签还有特征数据,同时通过构造标签图和特征图来学习标签流形和特征流形的几何结构。本方法通过从标签和特征空间进行几何保持的双重投影学习,最终以同样的方式在标签和特征空间中学习更好的低秩结构。

Description

一种基于几何保持双投影的图像多标签分类方法
技术领域
本发明属于计算机图像处理技术领域,尤其是一种基于几何保持双投影的图像多标签分类方法。
背景技术
目前,多标签分类有两种方法:算法适应方法和问题转换。算法适应方法调整了流行的学习算法,以执行多标签分类,如ML-KNN,ML-DT。问题转换方法采用多标签问题转换为已知学习方法,这些方法包括二进制相关性,分类链等算法。这些传统的方法在一些小数据集上效果显著。然而,随着现今数据集的扩大,传统的多标签分类方法无法应对高维、复杂的数据结构。
为了解决标签和特征空间中冗余和无关的数据,许多降维算法被提出如MLQPFS,MIFS等。这些算法选取了重要的数据或者将数据映射到低维的空间从而获取低秩的结构。然而,现有的算法只关注特征空间或者标签空间而忽略它们之间的联系。因此,现有的多标签分类方法的多标签分类的效果不好。
发明内容
为了解决现有技术中存在的不足,本申请提出了一种基于几何保持双投影的图像多标签分类方法。不仅可以从特征空间中学习特征投影,还可以从标签空间中学习标记投影。因此,本方法可以分别在标签输出空间和功能空间中学习双低级空间结构,从而提高分类的准确性。除此之外,通过构建标签图和特征图来探索标签流形和特征流形的几何结构,从而进一步学习低秩投影。
本发明所采用的技术方案如下:
一种基于几何保持双投影的图像多标签分类方法,
步骤1、准备待分类的图像样本及图像样本对应的标签,由图像样本构成特征空间表示为X=[x1,x2,......,xn],由标签构成标签空间表示为Y∈{0,1}q×n,其中,xn为训练实例即图像样本,n是训练实例的数量,q是标签的维度;
步骤2,基于标签空间和特征空间进行几何保持双投影学习,包括如下步骤:
步骤2.1,分别在标签空间和特征空间上对应学习双投影矩阵V和P,将标签空间映射到嵌入空间从而实现降维;
步骤2.2,构造标签图和特征图来学习标签流形和特征流形的几何结构;
步骤2.3,基于标签流形、特征流形和双投影矩阵V和P,构建了一个几何保持双投影模型;该模型待优化的目标函数表示如下:
s.t.VTYYTV=I,P=Q
其中,P和V是双投影矩阵,Q是等价矩阵,是F范数运算;tr(*)是迹运算;α和β表示正则化参数来权衡第二项和第三项;I为单位矩阵;
步骤3,基于所构建的几何保持双投影模型,预测多标签分类结果。
进一步,求解几何保持双投影模型的目标函数中双投影矩阵P、V以及等价矩阵Q的方法为:
求解等价矩阵Q:
对目标函数使用增广拉格朗日函数法,优化问题转化为求解以下增广拉格朗日乘子问题:
其中,Y1为拉格朗日乘子,μ为参数;
对上式中的Q进行求偏导得到:
求解投影矩阵P:
对转换为增广拉格朗日乘子问题的目标函数中的P进行求偏导得到:
P=(2βXLXT+μI)-1(μQ+2XYTVVT-XXTQVVT-Y1);
求解投影矩阵V:
考虑到上述约束条件VTYYTV=I,对目标函数使用拉格朗日乘数法,得到下式:
对上式中参数V求偏导得:(YYT)-1(PTXXTQ-2PTXYT+αYLYT)V=λV
解上式的特征方程,特征向量即所求投影矩阵V,λ为特征值;
求解参数Y1,μ:
Y1=Y1+μ(P-Q)
μ=min(ρμ,maxμ)
通过不断更新参数直到目标函数收敛以求得最优投影矩阵P和V;其中,ρ为μ的系数,maxμ为最大参数。
进一步,步骤3的预测过程为:
S1、在VVT上进行奇异值分解以获得奇异值,由奇异值构成矩阵S,该矩阵除了主对角线上的元素以外全为0,主对角线上的每个元素都称为奇异值,选取最大的奇异值来描述矩阵从而实现降维;
S2、将学习到的双投影矩阵P和V输入到解码矩阵VTPTXtrain,其中,Xtrain=[X1,X2,......,Xn2]∈Rp×n2为训练集,n2为训练集样本数;
S3、将特征空间X分为测试集Xtest和训练集Xtrain;其中,测试集表示为Xtest=[x1,x2,......,xn1]∈Rp×n1,将测试集中的测试实例xi输入到解码矩阵VTPTXtest,n1为测试集样本数;
S4、基于奇异值学习xi和训练集Xtrain之间的距离,得到该xi基于训练集的K近邻训练样本,获取该训练样本的标签值;
S5、针对xi所对应的K近邻序列输出该xi的标签值得到预测值Ytest,完成多标签分类预测。
进一步,构造特征图的方法为:特征图节点对应于{x1,x2,...xn};对于每个训练实例xi,如果存在K近邻的第j个训练实例xj,则在节点之间构建一条边;为了使得连接点尽可能靠近,优化下述模型:
其中,Wij是系数对称矩阵通过热内核法表示连接点的权重;矩阵D是图的度矩阵,L=D-W是特征图的拉普拉斯图。
进一步,构造标签图,如果xi和xj越近,则VTyi和VTyi之间的距离也越近,具体表述如下:
其中,Wij是系数对称矩阵通过热内核法表示连接点的权重。矩阵D是图的度矩阵,L=D-W是标签图的拉普拉斯图。
本发明的有益效果:
本申请所提出的基于几何保持双投影的图像多标签分类方法针对高维、复杂数据集的分类效果显著,这是由于本方法同时学习特征空间和标签空间上的双投影,实现了标签和特征空间的降维。
附图说明
图1是基于几何保持双投影的图像多标签分类方法的流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用于解释本发明,并不用于限定本发明。
本申请所提出的一种基于几何保持双投影的图像多标签分类方法如图1所示,该方法主要包括两个部分,分别是:1、图像多标签分类的几何保持双投影学习。通过增广拉格朗同日函数法将学习到的模型进行优化得到双投影。2、图像多标签分类的结果预测。本申请的具体过程如下:
1.图像多标签分类的几何保持双投影学习
1)数据集准备
输入的特征空间由X=[x1,x2,......,xn]∈Rpxn表示,其中,p是特征空间的维度,xn为训练实例,n是训练实例的数量。Y∈{0,1}q×n是输出的标签空间,其中,q是标签的维度。
2)几何保持双投影学习
S2.1、分别在标签空间和特征空间上对应学习双投影矩阵V和P,将标签空间映射到嵌入空间Cd*n从而实现降维,d为嵌入空间的维度,n为训练实例的数量;将标签空间映射到嵌入空间Cd*n表示为:C=VTY,C为嵌入空间。
S2.2、此外,构造标签图和特征图来学习标签流形和特征流形的几何结构。构造标签图和特征图具体过程为:
S2.2.1、构造特征图,特征图节点对应于{x1,x2,...xn}。对于每个训练实例xi,如果存在K近邻的第j个训练实例xj,则在节点之间构建一条边。为了使得连接点尽可能靠近,优化下述模型:
其中,Wij是系数对称矩阵通过热内核法表示连接点的权重。矩阵D是图的度矩阵,L=D-W是特征图的拉普拉斯图。
S2.2.2、构造标签图,如果xi和xj越近,则VTyi和VTyi之间的距离也越近,具体表述如下:
其中,Wij是系数对称矩阵通过热内核法表示连接点的权重。矩阵D是图的度矩阵,L=D-W是标签图的拉普拉斯图。
S2.2.3、学习标签流形和特征流形的几何结构的方法如下:由于标签和特征数据是流形的,即分布在高维空间的低维流形结构,而流形学习可以从高维采样数据中恢复低维流形结构。基于此,由上文引出的特征和标签空间双投影P,V构成低维嵌入PTX和VTY。通过优化公式(1)和(2)来学习低维嵌入即学习标签和特征流形的几何结构
S2.3、基于标签流形、特征流形和双投影矩阵V和P,构建了一个几何保持双投影模型;该模型待优化的目标函数表示如下:
s.t.VTYYTV=I,P=Q
其中,P和V是双投影矩阵,Q是等价矩阵,是F范数运算;tr(*)是迹运算;α和β表示正则化参数来权衡第二项和第三项;I为单位矩阵。
对于多标签分类需要求解式(3)中的P,Q和V参数;求解过程如下:
A.求解等价矩阵Q
对式(3)使用增广拉格朗日函数法,优化问题转化为求解以下增广拉格朗日乘子(ALM)问题:
其中,Y1为拉格朗日乘子,μ为参数;
对上式中的Q进行求偏导得到:
B.求解投影矩阵P
对式(4)中的P进行求偏导得到:
P=(2βXLXT+μI)-1(μQ+2XYTVVT-XXTQVVT-Y1) (6)
C.求解投影矩阵V
考虑到上述约束条件VTYYTV=I,对式(3)使用拉格朗日乘数法:
对式(7)中参数V求偏导得:
(YYT)-1(PTXXTQ-2PTXYT+αYLYT)V=λV (8)
解式(8)特征方程,特征向量即所求投影矩阵V,λ为特征值。
D.求解参数Y1,μ
Y1=Y1+μ(P-Q) (9)
μ=min(ρμ,maxμ) (10)
通过不断更新参数直到目标函数收敛以求得最优投影矩阵P和V;其中,ρ为μ的系数,maxμ为最大参数。
2.图像多标签分类的结果预测
S1、在VVT上进行奇异值分解(SVD)以获得奇异值,由奇异值构成矩阵S,该矩阵除了主对角线上的元素以外全为0,主对角线上的每个元素都称为奇异值,选取最大的奇异值来描述矩阵从而实现降维。
S2、将学习到的双投影矩阵P和V输入到解码矩阵VTPTXtrain,其中,Xtrain=[x1,x2,......,xn2]∈Rp×n2为训练集,n2为训练集样本数。
S3、将特征空间X分为测试集Xtest和训练集Xtrain;其中,测试集表示为Xtest=[x1,x2,......,xn1]∈Rp×n1,将测试集中的测试实例xi输入到解码矩阵VTPTXtest,n1为测试集样本数。
S4、基于奇异值学习xi和训练集Xtrain之间的距离,得到该xi基于训练集的K近邻训练样本,获取该训练样本的标签值。
S5、针对xi所对应的K近邻序列输出该xi的标签值得到预测值Ytest
以上实施例仅用于说明本发明的设计思想和特点,其目的在于使本领域内的技术人员能够了解本发明的内容并据以实施,本发明的保护范围不限于上述实施例。所以,凡依据本发明所揭示的原理、设计思路所作的等同变化或修饰,均在本发明的保护范围之内。

Claims (5)

1.一种基于几何保持双投影的图像多标签分类方法,其特征在于,包括如下步骤:
步骤1、准备待分类的图像样本及图像样本对应的标签,由图像样本构成特征空间表示为X=[x1,x2,......,xn],由标签构成标签空间表示为Y∈{0,1}q×n,其中,xn为训练实例即图像样本,n是训练实例的数量,q是标签的维度;
步骤2,基于标签空间和特征空间进行几何保持双投影学习,包括如下步骤:
步骤2.1,分别在标签空间和特征空间上对应学习双投影矩阵V和P,将标签空间映射到嵌入空间从而实现降维;
步骤2.2,构造标签图和特征图来学习标签流形和特征流形的几何结构;
步骤2.3,基于标签流形、特征流形和双投影矩阵V和P,构建了一个几何保持双投影模型;该模型待优化的目标函数表示如下:
s.t.VTYYTV=I,P=Q
其中,P和V是双投影矩阵,Q是等价矩阵,是F范数运算;tr(*)是迹运算;α和β表示正则化参数来权衡第二项和第三项;I为单位矩阵;
步骤3,基于所构建的几何保持双投影模型,预测多标签分类结果。
2.根据权利要求1所述的一种基于几何保持双投影的图像多标签分类方法,其特征在于,求解几何保持双投影模型的目标函数中双投影矩阵P、V以及等价矩阵Q的方法为:
求解等价矩阵Q:
对目标函数使用增广拉格朗日函数法,优化问题转化为求解以下增广拉格朗日乘子问题:
其中,Y1为拉格朗日乘子,μ为参数;
对上式中的Q进行求偏导得到:
求解投影矩阵P:
对转换为增广拉格朗日乘子问题的目标函数中的P进行求偏导得到:
P=(2βXLXT+μI)-1(μQ+2XYTVVT-XXTQVVT-Y1);
求解投影矩阵V:
考虑到上述约束条件VTYYTV=I,对目标函数使用拉格朗日乘数法,得到下式:
对上式中参数V求偏导得:(YYT)-1(PTXXTQ-2PTXYT+αYLYT)V=λV
解上式的特征方程,特征向量即所求投影矩阵V,λ为特征值;
求解参数Y1,μ:
Y1=Y1+μ(P-Q)
μ=min(ρμ,maxμ)
通过不断更新参数直到目标函数收敛以求得最优投影矩阵P和V;其中,ρ为μ的系数,maxμ为最大参数。
3.根据权利要求1所述的一种基于几何保持双投影的图像多标签分类方法,其特征在于,步骤3的预测过程为:
S1、在VVT上进行奇异值分解以获得奇异值,由奇异值构成矩阵S,该矩阵除了主对角线上的元素以外全为0,主对角线上的每个元素都称为奇异值,选取最大的奇异值来描述矩阵从而实现降维;
S2、将学习到的双投影矩阵P和V输入到解码矩阵VTPTXtrain,其中,Xtrain=[x1,x2,......,xn2]∈Rp×n1为训练集,n2为训练集样本数;
S3、将特征空间X分为测试集Xtest和训练集Xtrain;其中,测试集表示为Xtest=[x1,x2,......,xn1]∈Rp×n1,将测试集中的测试实例xi输入到解码矩阵VTPTXtest,n1为测试集样本数;
S4、基于奇异值学习xi和训练集Xtrain之间的距离,得到该xi基于训练集的K近邻训练样本,获取该训练样本的标签值;
S5、针对xi所对应的K近邻序列输出该xi的标签值得到预测值Ytest,完成多标签分类预测。
4.根据权利要求1所述的一种基于几何保持双投影的图像多标签分类方法,其特征在于,构造特征图的方法为:特征图节点对应于{x1,x2,...xn};对于每个训练实例xi,如果存在K近邻的第j个训练实例xj,则在节点之间构建一条边;为了使得连接点尽可能靠近,优化下述模型:
其中,Wij是系数对称矩阵通过热内核法表示连接点的权重;矩阵D是图的度矩阵,L=D-W是特征图的拉普拉斯图。
5.根据权利要求4所述的一种基于几何保持双投影的图像多标签分类方法,其特征在于,构造标签图,如果xi和xj越近,则VTyi和VTyi之间的距离也越近,具体表述如下:
其中,Wij是系数对称矩阵通过热内核法表示连接点的权重;矩阵D是图的度矩阵,L=D-W是标签图的拉普拉斯图。
CN202111206294.XA 2021-10-16 2021-10-16 一种基于几何保持双投影的图像多标签分类方法 Active CN113902950B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111206294.XA CN113902950B (zh) 2021-10-16 2021-10-16 一种基于几何保持双投影的图像多标签分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111206294.XA CN113902950B (zh) 2021-10-16 2021-10-16 一种基于几何保持双投影的图像多标签分类方法

Publications (2)

Publication Number Publication Date
CN113902950A CN113902950A (zh) 2022-01-07
CN113902950B true CN113902950B (zh) 2024-03-19

Family

ID=79192573

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111206294.XA Active CN113902950B (zh) 2021-10-16 2021-10-16 一种基于几何保持双投影的图像多标签分类方法

Country Status (1)

Country Link
CN (1) CN113902950B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107563445A (zh) * 2017-09-06 2018-01-09 苏州大学 一种基于半监督学习的提取图像特征的方法与装置
CN109522956A (zh) * 2018-11-16 2019-03-26 哈尔滨理工大学 一种低秩判别特征子空间学习方法
CN111027582A (zh) * 2019-09-20 2020-04-17 哈尔滨理工大学 基于低秩图学习的半监督特征子空间学习方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107563445A (zh) * 2017-09-06 2018-01-09 苏州大学 一种基于半监督学习的提取图像特征的方法与装置
CN109522956A (zh) * 2018-11-16 2019-03-26 哈尔滨理工大学 一种低秩判别特征子空间学习方法
CN111027582A (zh) * 2019-09-20 2020-04-17 哈尔滨理工大学 基于低秩图学习的半监督特征子空间学习方法及装置

Also Published As

Publication number Publication date
CN113902950A (zh) 2022-01-07

Similar Documents

Publication Publication Date Title
CN111583263B (zh) 一种基于联合动态图卷积的点云分割方法
CN111783831B (zh) 基于多源多标签共享子空间学习的复杂图像精确分类方法
CN110717526B (zh) 一种基于图卷积网络的无监督迁移学习方法
CN108629367B (zh) 一种基于深度网络增强服装属性识别精度的方法
CN107273927B (zh) 基于类间匹配的无监督领域适应分类方法
Gu et al. Clustering-driven unsupervised deep hashing for image retrieval
CN111931814B (zh) 一种基于类内结构紧致约束的无监督对抗域适应方法
CN110647907B (zh) 利用多层分类和字典学习的多标签图像分类算法
CN110705591A (zh) 一种基于最优子空间学习的异构迁移学习方法
CN110516533B (zh) 一种基于深度度量的行人再辨识方法
CN110598022B (zh) 一种基于鲁棒深度哈希网络的图像检索***与方法
Chen et al. Application of improved convolutional neural network in image classification
CN112990340B (zh) 一种基于特征共享的自学习迁移方法
CN109063725B (zh) 面向多视图聚类的多图正则化深度矩阵分解方法
You et al. Robust structure low-rank representation in latent space
CN113902950B (zh) 一种基于几何保持双投影的图像多标签分类方法
CN111488923B (zh) 增强的锚点图半监督分类方法
CN113297964A (zh) 基于深度迁移学习的视频目标识别模型及方法
CN111310807B (zh) 一种基于异质特征联合自表示的特征子空间与亲和矩阵联合学习方法
CN117409456A (zh) 基于图匹配机制的非对齐多视图多标记学习方法
CN110717402B (zh) 一种基于层级优化度量学习的行人再识别方法
CN117173702A (zh) 基于深度特征图融合的多视图多标记学习方法
CN113989528B (zh) 基于深度联合稀疏-协同表示的高光谱图像特征表示方法
CN110781972A (zh) 一种增量无监督多模态相关特征学习模型
CN115797642A (zh) 基于一致性正则化与半监督领域自适应图像语义分割算法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant