CN111931562A - 一种基于软标签回归的无监督特征选择方法和*** - Google Patents

一种基于软标签回归的无监督特征选择方法和*** Download PDF

Info

Publication number
CN111931562A
CN111931562A CN202010597293.1A CN202010597293A CN111931562A CN 111931562 A CN111931562 A CN 111931562A CN 202010597293 A CN202010597293 A CN 202010597293A CN 111931562 A CN111931562 A CN 111931562A
Authority
CN
China
Prior art keywords
feature selection
feature
matrix
soft label
soft
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010597293.1A
Other languages
English (en)
Inventor
朱磊
王菲
石丹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Normal University
Original Assignee
Shandong Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Normal University filed Critical Shandong Normal University
Priority to CN202010597293.1A priority Critical patent/CN111931562A/zh
Publication of CN111931562A publication Critical patent/CN111931562A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/13Satellite images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Astronomy & Astrophysics (AREA)
  • Remote Sensing (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本公开公开的一种基于软标签回归的无监督特征选择方法和***,包括:获取遥感图像作为数据样本,对获取的数据样本进行特征提取,得到特征数据集;基于模糊聚类学习数据样本的软标签,通过稀疏回归模型学习特征选择矩阵,基于软标签和特征选择矩阵学习,构建基于软标签回归的无监督特征选择的目标函数;求解基于软标签回归的无监督特征选择的目标函数,得到特征选择矩阵;基于特征选择矩阵计算各个特征的重要性指标,将特征按照重要性指标从大到小排序,选择前k个特征构成特征子集,通过获取的特征子集对遥感图像进行分类。将软标签学习和特征选择矩阵学习建立了关联,求解了遥感图像更具判别性的特征子集,提高了遥感图像识别的准确性。

Description

一种基于软标签回归的无监督特征选择方法和***
技术领域
本公开涉及一种基于软标签回归的无监督特征选择方法和***。
背景技术
本部分的陈述仅仅是提供了与本公开相关的背景技术信息,不必然构成在先技术。
遥感图像分类是遥感图像处理和分析领域的一个研究热点,随着观测技术的发展,遥感数据日益丰富,遥感图像的特征维数也越来越高,一方面,高维数据提供了愈加丰富的特征信息,另一方面,高维特征数据中存在的冗余和噪声特征增加了分类算法的计算量,并且严重影响分类效果。
特征选择作为处理高维特征数据的有效方法,在各领域中发挥着越来越重要的作用,受到越来越多的关注,特征选择是基于一定准则,通过去除高维特征数据中的冗余和噪声特征,选择出具有判别性的特征子集,在保留数据语义信息的同时,降低问题的复杂度,提高后续算法的性能,根据是否依赖数据标签,现有的特征选择方法可以分为两大类,有监督特征选择和无监督特征选择,有监督特征选择通过计算特征与数据标签的相关程度来判断特征的重要性,但随着高维特征数据的数量急剧增加,标记数据费时费力,这导致有监督特征选择的扩展性受限。无监督特征选择方法自动选择具有判别性的特征子集来降低特征维度,更具现实意义。
目前已经有多种无监督特征选择方法被提出,由于原始数据没有标签信息,大多数的现有方法需首先在原始数据空间中学习一组硬标签,然后用学习到的硬标签指导特征选择过程,但这种策略存在以下问题:(1)由于高维数据包含大量的冗余和噪声特征,所以从原始数据空间中学习到的数据标签是不准确的;(2)模糊性是数据普遍存在的一种特性,大部分情况下,一个样本不是严格属于某个类或者严格不属于某个类,而是以一定的隶属度从属于所有类,所以硬标签不符合数据本身的模糊性,无法对后续特征选择提供有效指导;(3)标签学习和特征选择被分成两个相互独立的过程,学习到的数据标签与后续特征选择过程不能最佳兼容,使算法产生次优的结果,现有的遥感图像分类的过程中,存在无法提取遥感图像最具判别型的特征,从而影响遥感图像的分类效果的技术问题。
发明内容
本公开为了解决上述问题,提出了一种基于软标签回归的无监督特征选择方法和***,通过构建软标签和特征选择矩阵的联合学习框架,获取了遥感图像中最具判别性的特征。
本公开的第一目的是,提出一种基于软标签回归的无监督特征选择方法,包括:
获取遥感图像作为数据样本;
对数据样本进行特征提取,得到特征数据集;
基于模糊聚类学习数据样本的软标签,通过稀疏回归模型学习特征选择矩阵,基于软标签学习和特征选择矩阵学习,构建基于软标签回归的无监督特征选择的目标函数;
求解基于软标签回归的无监督特征选择的目标函数,得到特征选择矩阵;
基于特征选择矩阵,计算各个特征的重要性指标,将特征按照重要性指标从大到小排序,选择前k个特征构成特征子集;
特征子集用于对遥感图像进行分类。
进一步,基于模糊聚类学习数据样本的软标签时,引入投影矩阵,将数据样本投影到低维空间,在低维空间中,基于模糊聚类学习数据样本的软标签,软标签的学习目标函数为:
Figure BDA0002557819690000031
Figure BDA0002557819690000032
其中,n是数据样本数,c是聚类数,W∈Rd×m是投影矩阵,d是特征数据集中特征维度,m是投影后的特征维度,WT表示矩阵W的转置,xi是第i个样本点,mj是第j个聚类中心,yij是隶属度矩阵Y∈Rn×c中的第i行第j列的元素,表示第i个样本点属于第j个类的概率,I表示元素全为1的向量,设u=WTxi-mj∈Rm×1,||u||2表示向量u的L2范数,||Y||F为矩阵Y的F范数。
进一步的,特征选择矩阵学习的目标函数为:
Figure BDA0002557819690000033
其中,X∈Rn×d是特征数据集,P∈Rd×c是特征选择矩阵,||P||2,1表示矩阵P的L2,1范数。
进一步的,基于软标签回归的无监督特征选择的目标函数为:
Figure BDA0002557819690000041
其中,第一项表示在低维空间中,基于模糊聚类学习数据样本的软标签,第二项表示通过回归模型学习特征选择矩阵,第三项是利用F范数对软标签施加稀疏约束,第四项是利用L2,1范数最小化将特征选择矩阵约束为行稀疏,α,β和γ是各项的权重参数。
进一步的,采用迭代优化方法求解基于软标签回归的无监督特征选择的目标函数,得到特征选择矩阵,具体为:
对目标函数中投影矩阵W、聚类中心mj、软标签矩阵Y和特征选择矩阵P的四个变量,固定任意三个变量,求解第四个变量。
进一步的,特征选择矩阵中第j个行向量的L2范数表示第j个特征的重要性指标。
本公开的第二目的是,提出一种基于软标签回归的无监督特征选择***,包括:
数据集获取模块,其被配置为获取遥感图像构建数据样本,并对数据样本进行特征提取,得到特征数据集;
目标函数构造模块,其被配置为引入投影矩阵,将原始数据投影到低维空间,在低维空间中,基于模糊聚类学习数据的软标签,通过稀疏回归模型学习特征选择矩阵,基于软标签学习和特征选择矩阵学习,构造基于软标签回归的无监督特征选择的目标函数;
目标函数求解模块,其被配置为求解基于软标签回归的无监督特征选择的目标函数,得到特征选择矩阵;
特征选择模块,其被配置为根据特征选择矩阵计算各个特征的重要性指标,将特征按照所述重要性指标从大到小排序,选择前k个特征构成特征子集;
图像识别模块,其被配置为根据获取的特征子集对遥感图像进行分类。
进一步的,基于软标签回归的无监督特征选择的目标函数为:
Figure BDA0002557819690000051
其中,第一项表示在低维空间中,基于模糊聚类学习数据样本的软标签,第二项表示通过回归模型学习特征选择矩阵,第三项是利用F范数对软标签施加稀疏约束,第四项是利用L2,1范数最小化将特征选择矩阵约束为行稀疏,α,β和γ是各项的权重参数,n是数据样本数,c是聚类数,W∈Rd×m是投影矩阵,d是特征数据集中特征维度,m是投影后的特征维度,WT表示矩阵W的转置,xi是第i个样本点,mj是第j个聚类中心,yij是隶属度矩阵Y∈Rn×c中的第i行第j列的元素,表示第i个样本点属于第j个类的概率,I表示元素全为1的向量,X∈Rn×d是特征数据集,P∈Rd×c是特征选择矩阵,||P||2,1表示矩阵P的L2,1范数。
进一步的,采用迭代优化方法求解基于软标签回归的无监督特征选择的目标函数。
进一步的,特征选择矩阵中第j个行向量的L2范数表示第j个特征的重要性指标。
与现有技术相比,本公开的有益效果为:
1、本公开在对遥感图像获取特征子集时,构建了软标签和特征选择矩阵的联合学习框架,计算了特征选择矩阵,基于特征选择矩阵,计算了各特征的重要性指标,将特征依重要性指标进行了排序,提取了重要性指标靠前的特征,获得了更具判别性的特征子集。
2、本公开利用投影矩阵,将遥感图像转化到低维空间;在低维空间中,基于模糊聚类,学习数据的稀疏隶属度矩阵,将学习到的稀疏隶属度矩阵作为数据软标签,对后续特征选择过程提供语义监督;在软标签的指导下,通过回归模型学习特征选择矩阵,并利用L2,1范数对特征选择矩阵施加行稀疏约束;在联合学习框架中,软标签可以指导特征选择矩阵的学习,更新后的特征选择矩阵有助于获取更准确的软标签,两者相互促进,获得最具判别性的特征子集,用该特征子集用于遥感图像的分类识别,提高了识别的准确率。
附图说明
构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。
图1为本公开的基于软标签回归的无监督特征选择方法流程图。
具体实施方式:
下面结合附图与实施例对本公开作进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
实施例1
遥感图像分类是遥感图像处理和分析领域的一个研究热点,随着观测技术的发展,遥感数据日益丰富,遥感图像的特征维数也越来越高,一方面高维特征提供了愈加丰富的特征信息,另一方面,高维特征中存在的冗余和噪声特征增加了分类算法的计算量,并且严重影响分类效果。
在该实施例中,公开了一种基于软标签回归的无监督特征选择方法,包括:
S1:选取遥感图像作为数据样本,对获取的每个数据样本进行特征提取,得到特征数据集X∈Rn×d,其中,n表示样本点的个数,d表示特征的维度。
S2:引入投影矩阵,将数据样本投影到低维空间,在低维空间中,基于模糊聚类学习数据的软标签,通过稀疏回归模型学习特征选择矩阵,基于软标签学习和特征选择矩阵学习,构造基于软标签回归的无监督特征选择的目标函数。
S21:学习数据的软标签。
数据的模糊性是数据普遍存在的一种特性,大部分情况下,一个样本不是严格属于某个类或者严格不属于某个类,而是以一定的概率,即隶属度从属于所有类。
在低维空间中,基于模糊聚类学习数据的稀疏隶属度矩阵,将学习到的稀疏隶属度矩阵作为软标签,指导后续特征选择矩阵的学习。软标签学习目标函数如下:
Figure BDA0002557819690000081
其中,n是样本数,c是聚类数,W∈Rd×m是投影矩阵,d是特征数据集中的特征维度,m是投影后的特征维度,WT表示矩阵W的转置,xi是第i个样本点,mj是第j个聚类中心,yij是隶属度矩阵Y∈Rn×c中的一个元素,表示第i个样本点属于第j个类的概率,I表示元素全为1的向量,设u=WTxi-mj∈Rm×1
Figure BDA0002557819690000082
表示向量u的L2范数,
Figure BDA0002557819690000083
为矩阵Y的Frobenius范数,简称F范数。第一项表示低维空间中的模糊聚类,投影矩阵W的引入能够降低数据样本空间中冗余和噪声特征的影响,将最重要的信息保留在软标签Y中,保证了性能,降低了计算复杂度;第二项表示隶属度矩阵Y的稀疏约束,稀疏约束考虑到了每个数据样本被分配到不同类的成员稀疏性,最小化
Figure BDA0002557819690000084
就是尽可能将每个数据样本分配给多个类,而不是单个类。
S22:学习特征选择矩阵。在软标签的指导下,通过回归模型学习特征选择矩阵,并利用L2,1范数对特征选择矩阵施加行稀疏约束,特征选择矩阵学习的目标函数为:
Figure BDA0002557819690000091
其中,X∈Rn×d是特征数据集,P∈Rd×c是特征选择矩阵,
Figure BDA0002557819690000092
表示矩阵P的L2,1范数。第一项表示软标签回归,第二项是正则化项,L2,1范数可以使特征选择矩阵能更好地处理冗余和噪声特征。最小化回归模型和正则化项使特征选择矩阵能够评估原始特征和软标签之间的相关性,从而可以通过矩阵P选择重要的特征构成待选特征子集。
S23:联合学习框架。传统方法将标签学习和特征选择分成两个独立的过程,使得学习到的标签与后续特征选择不能最佳兼容,这会导致次优的特征选择效果,为了解决这一问题,将软标签学习和特征选择矩阵学习整合到一个联合学习框架中,得到基于软标签回归的无监督特征选择的整体目标函数如下:
Figure BDA0002557819690000093
其中,第一项表示在低维空间中,基于模糊聚类学习数据的软标签,第二项表示通过回归模型学习特征选择矩阵,第三项是利用F范数对软标签施加稀疏约束,第四项是利用L2,1范数最小化将特征选择矩阵约束为行稀疏,α,β和γ是各项的权重参数,用于调节各项在联合学习框架中的重要性。
在联合学习框架中,软标签可以指导特征选择矩阵的学习,更新后的特征选择矩阵有助于获取更准确的软标签,两者相互促进。
S3:采用迭代优化方法求解基于软标签回归的无监督特征选择的目标函数,得到特征选择矩阵。
S31:固定其他变量求解聚类中心mj。目标函数变为:
Figure BDA0002557819690000101
因为每一个聚类中心都是独立的,所以公式(4)可以分成如下的c个子问题:
Figure BDA0002557819690000102
公式(5)是凸函数,可以采用拉格朗日乘子法求解,对公式(5)求导,并将导数设置为0,可以得到:
Figure BDA0002557819690000103
S32:固定其他变量求解投影矩阵W。目标函数变为:
Figure BDA0002557819690000104
将公式(6)代入公式(7),简化之后可以得到:
Figure BDA0002557819690000105
其中,
Figure BDA0002557819690000106
其中,
Figure BDA0002557819690000107
定义的是第j个类的均值向量,Sw是类内散射矩阵,表示的是每类数据的离散化的程度,Sw越小,离散程度就越高,W∈Rd×m的最优解就是Sw的前m个最小特征值对应的特征向量。
S33:固定其他变量求解特征选择矩阵P。目标函数变为:
Figure BDA0002557819690000111
公式(10)是不可微的,因此转化公式(10)为以下等价形式:
Figure BDA0002557819690000112
其中,Γ∈Rd×d是对角矩阵,第i个对角元素是
Figure BDA0002557819690000113
ε是一个足够小的常数,用来避免||Pi'||2为0的情况,通过对上式求导,并将导数设为0,可以得到:
Figure BDA0002557819690000114
S34:固定其他变量求解隶属度矩阵Y。目标函数变为:
Figure BDA0002557819690000115
即:
Figure BDA0002557819690000116
因为每一个样本xi对应的隶属度向量yi都是独立的,所以将公式(14)分成如下的n个子问题:
Figure BDA0002557819690000117
其中,
Figure BDA0002557819690000121
是距离矩阵D中第i行第j列的元素。经过简化,公式(15)可以写成如下形式:
Figure BDA0002557819690000122
公式(16)的拉格朗日函数如下:
Figure BDA0002557819690000123
η和θ是拉格朗日乘子,根据拉格朗日乘子法和KKT条件可以得到:
Figure BDA0002557819690000124
因为
Figure BDA0002557819690000125
所以:
Figure BDA0002557819690000126
所以:
Figure BDA0002557819690000127
S4:根据特征选择矩阵计算各个特征的重要性指标,将特征按照所述重要性指标从大到小排序,选择前k个特征构成特征子集,其中,k是需要选择的特征数。
特征数据集中的第j个特征与特征选择矩阵P∈Rd×c中第j个行向量pj是一一对应的,pj的L2范数||pj||2表示第j个特征的重要性指标,在最小化稀疏回归模型的过程中,如果原始特征集中的第j个特征与软标签的相关性较低,那么特征选择矩阵中对应的行向量Pj中的数值的将会接近于0,因此,将特征按照重要性指标从大到小排序,选择前k个特征构成特征子集,其中,k是需要选择的特征数。
S5:通过获取的特征子集构建分类器,利用分类器对遥感图像进行分类。
实施例2
在该实施例中,公开了一种基于软标签回归的无监督特征选择***,包括:
数据集获取模块,其被配置为获取遥感图像作为数据样本,对获取的每个数据样本进行特征提取,得到特征数据集;
目标函数构造模块,其被配置为引入投影矩阵,将原始数据投影到低维空间,在低维空间中,基于模糊聚类学习数据的软标签,通过稀疏回归模型学习特征选择矩阵,建立软标签和特征选择矩阵的联合学习框架,获得基于软标签回归的无监督特征选择的目标函数,基于软标签回归的无监督特征选择的目标函数为:
Figure BDA0002557819690000131
其中,第一项表示在低维空间中,基于模糊聚类学习数据样本的软标签,第二项表示通过回归模型学习特征选择矩阵,第三项是利用F范数对软标签施加稀疏约束,第四项是利用L2,1范数最小化将特征选择矩阵约束为行稀疏,α,β和γ是各项的权重参数,n是数据样本数,c是聚类数,W∈Rd×m是投影矩阵,d是特征数据集中特征维度,m是投影后的特征维度,WT表示矩阵W的转置,xi是第i个样本点,mj是第j个聚类中心,yij是隶属度矩阵Y∈Rn×c中的第i行第j列的元素,表示第i个样本点属于第j个类的概率,I表示元素全为1的向量,X∈Rn×d是特征数据集,P∈Rd×c是特征选择矩阵,||P||2,1表示矩阵P的L2,1范数;
目标函数求解模块,其被配置为采用迭代优化方法求解基于软标签回归的无监督特征选择的目标函数,得到特征选择矩阵;
特征选择模块,其被配置为根据特征选择矩阵计算各个特征的重要性指标,将特征按照所述重要性指标从大到小排序,选择前k个特征构成特征子集,其中,k是需要选择的特征数,其中,特征选择矩阵中第j个行向量的L2范数表示第j个特征的重要性指标;
图像识别模块,其被配置为根据获取的特征子集构建分类器,通过分类器对遥感图像进行分类。
以上仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
上述虽然结合附图对本公开的具体实施方式进行了描述,但并非对本公开保护范围的限制,所属领域技术人员应该明白,在本公开的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本公开的保护范围以内。

Claims (10)

1.一种基于软标签回归的无监督特征选择方法,其特征在于,包括:
获取遥感图像作为数据样本,对获取的数据样本进行特征提取,得到特征数据集;
基于模糊聚类学习数据样本的软标签,通过稀疏回归模型学习特征选择矩阵,基于软标签学习和特征选择矩阵学习,构建基于软标签回归的无监督特征选择的目标函数;
求解基于软标签回归的无监督特征选择的目标函数,得到特征选择矩阵;
基于特征选择矩阵,计算各个特征的重要性指标,将特征按照所述重要性指标从大到小排序,选择前k个特征构成特征子集;
根据获取的特征子集对遥感图像进行识别。
2.如权利要求1所述的一种基于软标签回归的无监督特征选择方法,其特征在于,基于模糊聚类学习数据样本的软标签时,引入投影矩阵,将数据样本投影到低维空间,在低维空间中,基于模糊聚类学习数据样本的软标签,软标签的学习目标函数为:
Figure FDA0002557819680000011
Figure FDA0002557819680000012
其中,n是数据样本数,c是聚类数,W∈Rd×m是投影矩阵,d是特征数据集中特征维度,m是投影后的特征维度,WT表示矩阵W的转置,xi是第i个样本点,mj是第j个聚类中心,yij是隶属度矩阵Y∈Rn×c中的第i行第j列的元素,表示第i个样本点属于第j个类的概率,I表示元素全为1的向量,设u=WTxi-mj∈Rm×1,||u||2表示向量u的L2范数,||Y||F为矩阵Y的F范数。
3.如权利要求2所述的一种基于软标签回归的无监督特征选择方法,其特征在于,特征选择矩阵学习的目标函数为:
Figure FDA0002557819680000021
其中,X∈Rn×d是特征数据集,P∈Rd×c是特征选择矩阵,||P||2,1表示矩阵P的L2,1范数。
4.如权利要求3所述的一种基于软标签回归的无监督特征选择方法,其特征在于,基于软标签回归的无监督特征选择的目标函数为:
Figure FDA0002557819680000022
Figure FDA0002557819680000023
其中,第一项表示在低维空间中,基于模糊聚类学习数据样本的软标签,第二项表示通过回归模型学习特征选择矩阵,第三项是利用F范数对软标签施加稀疏约束,第四项是利用L2,1范数最小化将特征选择矩阵约束为行稀疏,α,β和γ是各项的权重参数。
5.如权利要求4所述的一种基于软标签回归的无监督特征选择方法,其特征在于,采用迭代优化方法求解基于软标签回归的无监督特征选择的目标函数,得到特征选择矩阵,具体为:
对目标函数中投影矩阵W、聚类中心mj、软标签矩阵Y和特征选择矩阵P的四个变量,固定任意三个变量,求解第四个变量。
6.如权利要求1所述的一种基于软标签回归的无监督特征选择方法,其特征在于,特征选择矩阵中第j个行向量的L2范数表示第j个特征的重要性指标。
7.一种基于软标签回归的无监督特征选择***,其特征在于,包括:
数据集获取模块,其被配置为,获取遥感图像作为数据样本,并对获取的数据样本进行特征提取,得到特征数据集;
目标函数构造模块,其被配置为引入投影矩阵,将原始数据投影到低维空间,在低维空间中,基于模糊聚类学习数据的软标签,通过稀疏回归模型学习特征选择矩阵,基于软标签学习和特征选择矩阵学习,构造基于软标签回归的无监督特征选择的目标函数;
目标函数求解模块,其被配置为求解基于软标签回归的无监督特征选择的目标函数,得到特征选择矩阵;
特征选择模块,其被配置为根据特征选择矩阵计算各个特征的重要性指标,将特征按照所述重要性指标从大到小排序,选择前k个特征构成特征子集,其中,k是需要选择的特征数;
图像识别模块,其被配置为根据获取的特征子集对遥感图像进行分类。
8.如权利要求7所述的一种基于软标签回归的无监督特征选择***,其特征在于,基于软标签回归的无监督特征选择的目标函数为:
Figure FDA0002557819680000031
Figure FDA0002557819680000032
其中,第一项表示在低维空间中,基于模糊聚类学习数据样本的软标签,第二项表示通过回归模型学习特征选择矩阵,第三项是利用F范数对软标签施加稀疏约束,第四项是利用L2,1范数最小化将特征选择矩阵约束为行稀疏,α,β和γ是各项的权重参数,n是数据样本数,c是聚类数,W∈Rd×m是投影矩阵,d是特征数据集中特征维度,m是投影后的特征维度,WT表示矩阵W的转置,xi是第i个样本点,mj是第j个聚类中心,yij是隶属度矩阵Y∈Rn×c中的第i行第j列的元素,表示第i个样本点属于第j个类的概率,I表示元素全为1的向量,X∈Rn×d是特征数据集,P∈Rd×c是特征选择矩阵,||P||2,1表示矩阵P的L2,1范数。
9.如权利要求7所述的一种基于软标签回归的无监督特征选择***,其特征在于,采用迭代优化方法求解基于软标签回归的无监督特征选择的目标函数。
10.如权利要求7所述的一种基于软标签回归的无监督特征选择***,其特征在于,特征选择矩阵中第j个行向量的L2范数表示第j个特征的重要性指标。
CN202010597293.1A 2020-06-28 2020-06-28 一种基于软标签回归的无监督特征选择方法和*** Pending CN111931562A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010597293.1A CN111931562A (zh) 2020-06-28 2020-06-28 一种基于软标签回归的无监督特征选择方法和***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010597293.1A CN111931562A (zh) 2020-06-28 2020-06-28 一种基于软标签回归的无监督特征选择方法和***

Publications (1)

Publication Number Publication Date
CN111931562A true CN111931562A (zh) 2020-11-13

Family

ID=73316673

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010597293.1A Pending CN111931562A (zh) 2020-06-28 2020-06-28 一种基于软标签回归的无监督特征选择方法和***

Country Status (1)

Country Link
CN (1) CN111931562A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112348115A (zh) * 2020-11-30 2021-02-09 福州大学 一种用于解决生物学数据分类的特征选择方法
CN112784691A (zh) * 2020-12-31 2021-05-11 杭州海康威视数字技术股份有限公司 一种目标检测模型训练方法、目标检测方法和装置
CN112801162A (zh) * 2021-01-22 2021-05-14 之江实验室 基于图像属性先验的自适应软标签正则化方法
CN113408665A (zh) * 2021-02-04 2021-09-17 北京沃东天骏信息技术有限公司 对象识别方法、装置、设备及介质
CN114299001A (zh) * 2021-12-24 2022-04-08 中国人民解放军国防科技大学 基于结构循环一致性的异源图像变化检测方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102254192A (zh) * 2011-07-13 2011-11-23 北京交通大学 基于模糊k近邻的三维模型半自动标注方法及***
CN106096627A (zh) * 2016-05-31 2016-11-09 河海大学 顾及特征优化的极化sar图像半监督分类方法
CN111027636A (zh) * 2019-12-18 2020-04-17 山东师范大学 基于多标签学习的无监督特征选择方法及***

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102254192A (zh) * 2011-07-13 2011-11-23 北京交通大学 基于模糊k近邻的三维模型半自动标注方法及***
CN106096627A (zh) * 2016-05-31 2016-11-09 河海大学 顾及特征优化的极化sar图像半监督分类方法
CN111027636A (zh) * 2019-12-18 2020-04-17 山东师范大学 基于多标签学习的无监督特征选择方法及***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
RONG WANG ET AL.: "Unsupervised Discriminative Projection for Feature Selection", 《IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112348115A (zh) * 2020-11-30 2021-02-09 福州大学 一种用于解决生物学数据分类的特征选择方法
CN112784691A (zh) * 2020-12-31 2021-05-11 杭州海康威视数字技术股份有限公司 一种目标检测模型训练方法、目标检测方法和装置
CN112784691B (zh) * 2020-12-31 2023-06-02 杭州海康威视数字技术股份有限公司 一种目标检测模型训练方法、目标检测方法和装置
CN112801162A (zh) * 2021-01-22 2021-05-14 之江实验室 基于图像属性先验的自适应软标签正则化方法
CN113408665A (zh) * 2021-02-04 2021-09-17 北京沃东天骏信息技术有限公司 对象识别方法、装置、设备及介质
CN114299001A (zh) * 2021-12-24 2022-04-08 中国人民解放军国防科技大学 基于结构循环一致性的异源图像变化检测方法及装置

Similar Documents

Publication Publication Date Title
CN110909820B (zh) 基于自监督学习的图像分类方法及***
CN111931562A (zh) 一种基于软标签回归的无监督特征选择方法和***
CN103150580B (zh) 一种高光谱图像半监督分类方法及装置
CN108376267B (zh) 一种基于类别转移的零样本分类方法
US9147129B2 (en) Score fusion and training data recycling for video classification
Azadi et al. Auxiliary image regularization for deep cnns with noisy labels
Quelhas et al. Modeling scenes with local descriptors and latent aspects
Doersch et al. Mid-level visual element discovery as discriminative mode seeking
Tarawneh et al. Invoice classification using deep features and machine learning techniques
CN113657425B (zh) 基于多尺度与跨模态注意力机制的多标签图像分类方法
CN110647907B (zh) 利用多层分类和字典学习的多标签图像分类算法
CN106845510A (zh) 基于深度层级特征融合的中国传统视觉文化符号识别方法
CN109784405B (zh) 基于伪标签学习和语义一致性的跨模态检索方法及***
CN111898736A (zh) 基于属性感知的高效行人重识别方法
CN110766042B (zh) 一种基于最大相关最小冗余的多标记特征选择方法及装置
CN112633071B (zh) 基于数据风格解耦内容迁移的行人重识别数据域适应方法
CN105894050A (zh) 一种基于多任务学习的人脸图像种族和性别识别方法
CN111027636B (zh) 基于多标签学习的无监督特征选择方法及***
WO2010062268A1 (en) A method for updating a 2 dimensional linear discriminant analysis (2dlda) classifier engine
CN109635708A (zh) 一种基于三数据集交叉迁移学习的无监督行人再识别方法
CN110008365B (zh) 一种图像处理方法、装置、设备及可读存储介质
Zhang et al. Large-scale aerial image categorization using a multitask topological codebook
CN114863151B (zh) 一种基于模糊理论的图像降维聚类方法
Tavakoli Seq2image: Sequence analysis using visualization and deep convolutional neural network
Amores et al. Fast spatial pattern discovery integrating boosting with constellations of contextual descriptors

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20201113

RJ01 Rejection of invention patent application after publication