CN105069471B - 基于模糊标签的高光谱数据子空间投影和分类方法 - Google Patents

基于模糊标签的高光谱数据子空间投影和分类方法 Download PDF

Info

Publication number
CN105069471B
CN105069471B CN201510464620.5A CN201510464620A CN105069471B CN 105069471 B CN105069471 B CN 105069471B CN 201510464620 A CN201510464620 A CN 201510464620A CN 105069471 B CN105069471 B CN 105069471B
Authority
CN
China
Prior art keywords
fuzzy label
marker samples
sample
projection
training sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510464620.5A
Other languages
English (en)
Other versions
CN105069471A (zh
Inventor
杨淑媛
焦李成
周红静
刘红英
马晶晶
马文萍
侯彪
屈嵘
冯志玺
李素婧
刘志
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
Original Assignee
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University filed Critical Xidian University
Priority to CN201510464620.5A priority Critical patent/CN105069471B/zh
Publication of CN105069471A publication Critical patent/CN105069471A/zh
Application granted granted Critical
Publication of CN105069471B publication Critical patent/CN105069471B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于模糊标签的高光谱数据子空间投影和分类方法,主要解决高光谱图像中由于混合像元和噪声引起地物错分和数据判别性差的问题。其步骤为:1.将遥感数据库样本集划分为训练样本和标记样本集;2.计算由子空间投影后的标记样本集生成的判别项;3.构造由训练样本的模糊标签确定的拉普拉斯正则项;4.通过最大化判别项和正则项之差获取最优投影矩阵和模糊标签,以实现有效降维的同时,实现高精度的分类。本发明采用判别子空间投影的方法来构造判别项,将数据投影到低维空间,增强数据的判别性能,进而引入模糊标签来构造拉普拉斯正则,解决了混合像元带来的错分问题,在实现降维的同时,实现高精度的分类。

Description

基于模糊标签的高光谱数据子空间投影和分类方法
技术领域
本发明属于图像处理技术领域,更进一步涉及一种数据降维和分类方法,可用于遥感影像数据的降维与分类。
背景技术
经上世纪的快速发展,高光谱遥感技术在理论技术和应用上发生了翻天覆地的变化,广泛应用于农业、林业、国防侦察识别伪装等领域。但是,高光谱数据处理的技术相对落后,制约了高光谱遥感技术的进一步推广。分类作为高光谱数据处理的一个重要内容,成为高光谱数据研究领域的一大热点。
高光谱图像可以提供丰富的信息,获得确定物质或地物性质的光谱的同时,揭示地物之间的空间位置关系,实现了“图谱合一”,进而能显著地提高数据分析的可靠性和细节性。
虽然,高光谱图像包含丰富的光谱和空间信息,但是,同时也给图像分类算法带来一系列挑战。一方面,由于空间分辨率的限制及其它因素影响,一个像元常常由多种地物构成,这种像元被称为混合像元,而混合像元导致了高光谱图像中“同物异谱(即相同种类地物具有不同的光谱信息)”和“同谱异物(即不同种类地物具有相同的光谱信息)”现象的存在[10],不可避免地在图像分类过程中引起地物的错分。另一方面,由于高光谱图像中数据维数很高,量化精度随之增高,所以,在图像分类中,如果有监督信息的训练样本很少,分类精度会有明显的下降,而且高维数据会带来大量复杂的计算。所以,在高光谱数据处理中,有效对数据进行降维,并改进混合像元的分解方法,可以提取数据的有效信息,同时获得更准确的分类结果。
现有的经典的分类方法主要有以下三类:
(一)无监督分类方法:如K均值聚类,是通过最小化聚类中各个点到该类聚类中心的距离平方和的原则,实现各个点的分类。这种分类方法缺点是不能自动调节聚类的个数。
(二)监督分类方法:如支撑向量机,是基于结构最小化的分类方法。这种方法比K均值聚类方法具有更好的泛化能力,但支撑向量机需要有监督信息的样本参与分类,而获得有监督信息的样本需要耗费大量的人力物力,在有监督信息样本少的情况下,分类效果变差。
(三)半监督分类方法:这种方法融合了未标记样本和标记样本中所含信息来改善分类器性能,提高分类精度。但是目前的半监督分类方法往往基于“严格的聚类假设”,也就是,相似的物质拥有相同的标签的假设,这样的假设不能有效解决混合像元被错分的问题。
发明内容
本发明的目的在于针对上述已有技术的不足,提出一种基于模糊标签的高光谱数据子空间投影和分类方法,利用少量的监督信息,同时实现对高光谱遥感数据的有效降维和分类。
实现本发明目的的技术方案是:通过判别子空间投影的方法将数据投影到低维空间,增强数据的判别性能,进而通过引入模糊标签来构造拉普拉斯矩阵,解决混合像元带来的错分问题,在实现降维的同时,实现高精度的分类。具体步骤如下:
(1)将高光谱遥感影像数据库样本集分为训练样本集X和标记样本集Xl
(2)计算由标记样本集Xl在子空间投影后生成的判别项:
其中,Ldis表示判别项,Nl是标记样本的数目,,表示第i个标记样本,的第k个异类的标记样本,的第j个同类的标记样本,ki2是与异类的标记样本的数目,ki1是与同类的标记样本的数目,W∈RD×d是将D维空间的数据投影到d维空间的投影矩阵,D由高光谱遥感影像自身的性质决定,d为降维后数据的维数,且d<<D,Rn是n维实数空间,||·||2表示两个向量间的距离的平方;
(3)构造由训练样本集X的模糊标签确定的拉普拉斯正则项:
其中,Rp表示由模糊标签确定的拉普拉斯正则项,xs和xt分别是训练样本集X第s和第t个样本,N为高光谱遥感影像数据中样本的个数,wst表示样本xs和xt的相似度,由热核函数wst=exp(-||p(xs)-p(xt)||2/2σ2)确定,其中,p(xs)∈Rc×1和p(xt)∈Rc×1分别是xs和xt的模糊标签,p(xs)和p(xt)是分别由xs和xt依次属于1到c类的概率组成的c×1的向量,c是高光谱遥感影像的类别数,σ是热核函数的宽度;
(4)求解投影矩阵W和模糊标签p(xi),i=1,...,N
根据判别项和模糊标签构造的拉普拉斯正则项,得到目标函数L=Ldis-λRp,其中,λ是正则项参数,用来平衡判别项和正则项之间的权重;通过交替迭代求解的方法,求解投影矩阵W和模糊标签p(xi),i=1,...,N:
4a)固定模糊标签p(xi),i=1,...,N,求解投影矩阵W
此时目标函数表达式可写成:
4b)固定投影矩阵W,求解模糊标签p(xi),i=1,...,N
此时,目标函数表达式可写成:
通过对L2关于p(xs)求导,可得到p的表达式为:
其中,pk(xj)表示第j个样本属于第k类的概率,k的取值范围为1到c,pk(xt)表示第t个样本属于第k类的概率,N为训练样本的数目;
4c)通过L计算目标函数值,并计算ΔL=Ln+1-Ln
Ln+1是第n+1次迭代得到的结果,Ln是第n次迭代得到的结果,当ΔL小于设定的阈值或者迭代次数达到设定的最大迭代次数,则停止迭代转向下一步,否则转向4a);
(5)通过对p按列取最大值,找到每列的最大值所在的行数,该行数就是各训练样本所属的类别数。
与现有技术相比,本发明有以下优点:
本发明采用判别子空间投影的方法来构造判别项,通过将数据投影到低维空间,增强了数据的判别性能,并且引入模糊标签来构造拉普拉斯正则,解决了混合像元带来的错分问题,在实现降维的同时,实现了高精度的分类。
附图说明
图1是本发明的流程图;
图2是本发明仿真使用的实验高光谱数据IndianPines及其真实标记图;
具体实施方式
参照图1,对本发明做进一步的详细描述。
步骤1:将遥感影像数据库样本集划分为训练数据集X和标记样本集Xl
1a)在待处理的遥感数据集中,全部数据构成训练样本数据集X∈RD×N,其中,D表示训练集样本的维数,Rn表示n维实数空间,N表示训练集样本的总数;在本发明的实施实例IndianPines数据集中,样本维数D为200,训练集样本的总数N为10366;
1b)每类随机从训练样本集中选取k个样本作为有监督信息的标记样本集,其中,Nl=c×k,c为高光谱图像类别数,在本发明的实施实例IndianPines数据集中,c为16,k取8;
1c)在标记样本集Xl中,对每个标记样本通过欧氏距离寻找其ki1个同类近邻和ki2个异类近邻,在本发明的实施实例IndianPines数据集中,同类近邻数ki1为3,异类近邻数ki2为6。
步骤2:计算由子空间投影后的标记样本集生成的判别项。
通过对每个标记样本进行判别子空间投影后,使得同类的标记样本间的距离更近,异类的标记样本的距离更远,因此标记样本集生成的判别项为:
其中,Ldis表示判别项,Nl是标记样本的数目,,表示第i个标记样本,的第k个异类的标记样本,的第j个同类的标记样本,ki2是与异类的标记样本的数目,ki1是与同类的标记样本的数目,W∈RD×d是将D维空间的数据投影到d维空间的投影矩阵,D由高光谱遥感影像自身的性质决定,d为降维后数据的维数,且d<<D,Rn是n维实数空间,||·||2表示两个向量间的距离的平方,在本发明的实施实例IndianPines数据集中,ki1=3,ki2=6,d=40。
步骤3:构造由训练样本的模糊标签确定的拉普拉斯正则项。
其中,Rp表示由模糊标签确定的拉普拉斯正则项,xs和xt分别是训练样本集X第s和第t个样本,N为高光谱遥感影像数据中样本的个数,wst表示样本xs和xt的相似度,由热核函数wst=exp(-||p(xs)-p(xt)||2/2σ2)确定,其中,p(xs)∈Rc×1和p(xt)∈Rc×1分别是xs和xt的模糊标签,p(xs)和p(xt)是分别由xs和xt依次属于1到c类的概率组成的c×1的向量,c是高光谱遥感影像的类别数,σ是热核函数的宽度;
步骤4:求解投影矩阵W和模糊标签p(xi),i=1,...,N
根据判别项和模糊标签构造的拉普拉斯正则项,得到目标函数L=Ldis-λRp,其中,λ是正则项参数,用来平衡判别项和正则项之间的权重;通过交替迭代求解的方法,求解投影矩阵W和模糊标签p(xi),i=1,...,N:
4a)固定模糊标签p(xi),i=1,...,N,求解投影矩阵W
此时目标函数表达式可写成:
4b)固定投影矩阵W,求解模糊标签p(xi),i=1,...,N
此时,目标函数表达式可写成:
通过对L2关于p(xs)求导,可得到p的表达式为:
其中,pk(xj)表示第j个样本属于第k类的概率,k的取值范围为1到c,pk(xt)表示第t个样本属于第k类的概率,N为训练样本的数目;
4c)通过L计算目标函数值,并计算ΔL=Ln+1-Ln
Ln+1是第n+1次迭代得到的结果,Ln是第n次迭代得到的结果,当ΔL小于设定的阈值或者迭代次数达到设定的最大迭代次数,则停止迭代转向下一步,否则转向4a);在本发明的实施实例IndianPines数据集中,设定的阈值为10-4,最大迭代次数为40。
步骤5:通过对p按列取最大值,找到每列的最大值所在的行数,该行数就是各训练样本所属的类别数。
本发明的效果可以通过以下仿真实验进一步说明。
1,仿真实验条件。
本实验采用IndianPines数据集作为实验数据,采用软件MATLAB 7.10.0作为仿真工具,计算机配置为Intel Core i5/2.27G/2G。
IndianPines高光谱数据92AV3C:该场景为AVIRIS传感器于1992年6月获得的印第安纳州西北部的IndianPines测试地,该数据大小为145×145,每个像元有220个波段,去掉含有噪声的20个波段,仅保留剩下的200个波段,该数据共包含16类地物,图2(a)给出了IndianPines高光谱数据,图2(b)给出了IndianPines高光谱数据的真实标记图。
2.仿真实验内容。
仿真1,在图2(a)所给的IndianPines高光谱数据上进行每类8个标记样本情况下的仿真实验,并将本发明方法与现有的以下四种降维方法进行对比:1)主成分分析PCA;2)局部fisher判别分析LFDA;3)最大化边际原则MMC;4)基于成对约束的半监督降维SSDR。
实验中,本发明同类近邻数ki1=3,异类近邻数ki2=6,降维后的维数d=40,正则项参数λ=0.8,表中OA代表总体分类精度。
表1给出了每类标记样本个数为8,对比方法采用最近邻分类器,每种方法进行30次仿真时的实验对比结果。
表1:本发明与现有方法在每类8个标记样本个数下的对比结果
方法 本发明 PCA FLDA MMC SSDR
OA 83.64% 65.31% 78.37% 65.9% 62.64%
从表1可见,本发明在每类标记样本个数为8时,精度在表中所列的五种方法中是最高的,因此具有最好的分类效果。

Claims (4)

1.一种基于模糊标签的高光谱遥感影像数据子空间投影和分类方法,包括以下步骤:
(1)将高光谱遥感影像数据库样本集分为训练样本集X和标记样本集Xl
(2)计算由标记样本集Xl在子空间投影后生成的判别项:
其中,Ldis表示判别项,Nl是标记样本的数目,表示第i个标记样本,的第k个异类的标记样本,的第j个同类的标记样本,ki2是与异类的标记样本的数目,ki1是与同类的标记样本的数目,W∈RD×d是将D维空间的数据投影到d维空间的投影矩阵,D由高光谱遥感影像自身的性质决定,d为降维后数据的维数,且d<<D,Rn是n维实数空间,||·||2表示两个向量间的距离的平方;
(3)构造由训练样本集X的模糊标签确定的拉普拉斯正则项:
其中,Rp表示由模糊标签确定的拉普拉斯正则项,xs和xt分别是训练样本集X第s和第t个样本,N为高光谱遥感影像数据中样本的个数,wst表示样本xs和xt的相似度,由热核函数wst=exp(-||p(xs)-p(xt)||2/2σ2)确定,其中,p(xs)∈Rc×1和p(xt)∈Rc×1分别是xs和xt的模糊标签,p(xs)和p(xt)是分别由xs和xt依次属于1到c类的概率组成的c×1的向量,c是高光谱遥感影像的类别数,σ是热核函数的宽度;
(4)求解投影矩阵W和模糊标签p(xi),i=1,...,N
根据判别项和模糊标签构造的拉普拉斯正则项,得到目标函数L=Ldis-λRp,其中,λ是正则项参数,用来平衡判别项和正则项之间的权重;通过交替迭代求解的方法,求解投影矩阵W和模糊标签p(xi),i=1,...,N:
4a)固定模糊标签p(xi),i=1,...,N,求解投影矩阵W
此时目标函数表达式可写成:
投影矩阵W可以通过对上式进行特征分解得到;
4b)固定投影矩阵W,求解模糊标签p(xi),i=1,...,N
此时,目标函数表达式可写成:
通过对L2关于p(xs)求导,可得到p的表达式为:
其中,pk(xj)表示第j个样本属于第k类的概率,k的取值范围为1到c,pk(xt)表示第t个样本属于第k类的概率,N为训练样本的数目;
4c)通过L计算目标函数值,并计算△L=Ln+1-Ln
Ln+1是第n+1次迭代得到的结果,Ln是第n次迭代得到的结果,当△L小于设定的阈值或者迭代次数达到设定的最大迭代次数,则停止迭代转向下一步,否则转向4a);
(5)通过对p按列取最大值,找到每列的最大值所在的行数,该行数就是各训练样本所属的类别数。
2.根据权利要求1所述的基于模糊标签的高光谱遥感影像数据子空间投影和分类方法,其中,步骤(1)所述的将高光谱遥感影像数据库样本集分为训练样本集X和标记样本集Xl按如下步骤进行:
1a)将待处理的高光谱遥感影像数据库样本集全部构成训练样本集X,X∈RD×N,其中,D表示训练集样本的维数,Rn表示n维实数空间,N表示训练集样本的总数;
1b)每类随机从训练样本集中选取k个数据作为有监督信息的标记样本集Xl其中,Nl=c×k,c为高光谱图像类别数,D为训练样本X的维数;
1c)在标记样本集Xl中,对每个标记样本通过欧氏距离寻找其ki1个同类近邻和ki2个异类近邻。
3.根据权利要求1所述的基于模糊标签的高光谱遥感影像数据子空间投影和分类方法,其中,D=200。
4.根据权利要求1所述的基于模糊标签的高光谱遥感影像数据子空间投影和分类方法,其中,d=40。
CN201510464620.5A 2015-07-31 2015-07-31 基于模糊标签的高光谱数据子空间投影和分类方法 Active CN105069471B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510464620.5A CN105069471B (zh) 2015-07-31 2015-07-31 基于模糊标签的高光谱数据子空间投影和分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510464620.5A CN105069471B (zh) 2015-07-31 2015-07-31 基于模糊标签的高光谱数据子空间投影和分类方法

Publications (2)

Publication Number Publication Date
CN105069471A CN105069471A (zh) 2015-11-18
CN105069471B true CN105069471B (zh) 2018-08-28

Family

ID=54498832

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510464620.5A Active CN105069471B (zh) 2015-07-31 2015-07-31 基于模糊标签的高光谱数据子空间投影和分类方法

Country Status (1)

Country Link
CN (1) CN105069471B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108629373B (zh) * 2018-05-07 2022-04-12 苏州大学 一种图像分类方法、***、设备及计算机可读存储介质
CN110096997B (zh) * 2019-04-29 2020-04-14 宁波大学 一种集成多源遥感数据的海岸带精细分类方法
CN110222767B (zh) * 2019-06-08 2021-04-06 西安电子科技大学 基于嵌套神经网络和栅格地图的三维点云分类方法
CN111444937B (zh) * 2020-01-15 2023-05-12 湖州师范学院 一种基于集成tsk模糊分类器的众包质量提升的方法
CN114841214B (zh) * 2022-05-18 2023-06-02 杭州电子科技大学 基于半监督判别投影的脉搏数据分类方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102208037A (zh) * 2011-06-10 2011-10-05 西安电子科技大学 基于高斯过程分类器协同训练算法的高光谱图像分类方法
CN103077508A (zh) * 2013-01-25 2013-05-01 西安电子科技大学 基于变换域非局部和最小均方误差的sar图像去噪方法
KR101414045B1 (ko) * 2013-06-24 2014-07-02 인하대학교 산학협력단 분광라이브러리 데이터와 입력된 초분광영상을 이용한 표적탐지방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102208037A (zh) * 2011-06-10 2011-10-05 西安电子科技大学 基于高斯过程分类器协同训练算法的高光谱图像分类方法
CN103077508A (zh) * 2013-01-25 2013-05-01 西安电子科技大学 基于变换域非局部和最小均方误差的sar图像去噪方法
KR101414045B1 (ko) * 2013-06-24 2014-07-02 인하대학교 산학협력단 분광라이브러리 데이터와 입력된 초분광영상을 이용한 표적탐지방법

Also Published As

Publication number Publication date
CN105069471A (zh) 2015-11-18

Similar Documents

Publication Publication Date Title
Jia et al. A novel ranking-based clustering approach for hyperspectral band selection
CN105069471B (zh) 基于模糊标签的高光谱数据子空间投影和分类方法
WO2021003951A1 (zh) 一种基于标签约束弹性网图模型的高光谱图像分类方法
CN105427296B (zh) 一种基于超声图像低秩分析的甲状腺病灶图像识别方法
CN107451614B (zh) 基于空间坐标与空谱特征融合的高光谱分类方法
CN107563442B (zh) 基于稀疏低秩正则图张量化嵌入的高光谱图像分类方法
CN107368807B (zh) 一种基于视觉词袋模型的监控视频车型分类方法
CN103942562B (zh) 基于多分类器组合的高光谱图像分类方法
CN106503727B (zh) 一种高光谱图像分类的方法及装置
CN103413151B (zh) 基于图正则低秩表示维数约简的高光谱图像分类方法
CN106503739A (zh) 联合光谱和纹理特征的高光谱遥感影像svm分类方法及***
CN107633226B (zh) 一种人体动作跟踪特征处理方法
CN105718942B (zh) 基于均值漂移和过采样的高光谱图像不平衡分类方法
CN107203785A (zh) 多路径高斯核模糊c均值聚类算法
CN108229551B (zh) 一种基于紧凑字典稀疏表示的高光谱遥感图像分类方法
CN103955709B (zh) 基于加权合成核与tmf的极化sar图像分类方法
Jia et al. Spatial-spectral-combined sparse representation-based classification for hyperspectral imagery
CN110516754B (zh) 一种基于多尺度超像元分割的高光谱图像分类方法
CN112149758B (zh) 一种基于欧式距离和深度学习的高光谱开放集分类方法
CN107895139A (zh) 一种基于多特征融合的sar图像目标识别方法
CN104008394B (zh) 基于近邻边界最大的半监督高光谱数据降维方法
CN110163294B (zh) 基于降维操作和卷积网络的遥感图像变化区域检测方法
CN106650811B (zh) 一种基于近邻协同增强的高光谱混合像元分类方法
CN110276746B (zh) 一种鲁棒性遥感图像变化检测方法
CN103177265A (zh) 基于核函数与稀疏编码的高清图像分类方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant