CN108491849B - 基于三维稠密连接卷积神经网络的高光谱图像分类方法 - Google Patents

基于三维稠密连接卷积神经网络的高光谱图像分类方法 Download PDF

Info

Publication number
CN108491849B
CN108491849B CN201810243423.4A CN201810243423A CN108491849B CN 108491849 B CN108491849 B CN 108491849B CN 201810243423 A CN201810243423 A CN 201810243423A CN 108491849 B CN108491849 B CN 108491849B
Authority
CN
China
Prior art keywords
dimensional
layer
hyperspectral image
dense
convolution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810243423.4A
Other languages
English (en)
Other versions
CN108491849A (zh
Inventor
窦曙光
王文举
姜中敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Shanghai for Science and Technology
Original Assignee
University of Shanghai for Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Shanghai for Science and Technology filed Critical University of Shanghai for Science and Technology
Priority to CN201810243423.4A priority Critical patent/CN108491849B/zh
Publication of CN108491849A publication Critical patent/CN108491849A/zh
Application granted granted Critical
Publication of CN108491849B publication Critical patent/CN108491849B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/13Satellite images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/58Extraction of image or video features relating to hyperspectral data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/194Terrestrial scenes using hyperspectral data, i.e. more or other wavelengths than RGB

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Astronomy & Astrophysics (AREA)
  • Remote Sensing (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供了一种基于三维稠密连接卷积神经网络的高光谱图像分类方法,具有这样的特征,包括以下步骤:步骤一,输入高光谱图像的三维立方数据块;步骤二,用三维稠密光谱块处理三维立方数据块得到谱间特征图;步骤三,用三维过渡层处理谱间特征图得到压缩特征图;步骤四,用三维稠密空间谱块处理压缩特征图得到空间特征图;步骤五,空间特征图经过池化层、压缩层、dropout层、全连接层得到预测标签向量;步骤六,确定目标函数;步骤七,将预测标签向量代入目标函数得到迭代训练的损失;步骤八,根据损失,优化待优化参数;步骤九,多次重复步骤一至五、七、八,多次优化待优化参数得到损失最小时的预测标签向量,即高光谱图像的分类结果。

Description

基于三维稠密连接卷积神经网络的高光谱图像分类方法
技术领域
本发明涉及一种高光谱图像分类的方法,具体涉及一种基于三维稠密连接卷积神经网络的高光谱图像分类方法。
背景技术
传统的仅有的少量信息的普通图像只有很窄的可见光波段。高光谱传感器一般有上百个波段,每个波段独立的吸收该波段范围内的信号,根据不同的物质对每一个波段的光谱的不同反馈信号生成相应的二维图像,所有的波段的数据最终在一起形成一个多通道的三维数据。因此,高光谱图像包含大量的信息,有很多典型应用,如被用于民事和军事领域中高光谱图像目标检测。其中,高光谱图像分类在遥感领域中有着非常重要的作用。
对于高光谱图像分类,机器学习相关算法及不同的特征提取方法已被许多学者应用于高光谱图像分类。2015年,Li提出了一种采用局部二进制模式(LBPs)提取图像特征加上结构简单的高效极限学习机(ELM)作为分类器的框架。该实验结果表明LBP在空间特征提取上十分有效,并且与基于支持向量学习机(SVM)的方法相比,ELM 分类器更加高效。然而,相比LBP特征提取方法,HSI的复杂的光谱与空间信息需要更复杂巧妙的特征选择方法(LiW,Chen C,Su H,et al.Local Binary Patterns and Extreme Learning Machine forHyperspectral Imagery Classification[J].IEEE Transactions on Geoscience andRemote Sensing,2015,53(7):3681-3693.)。Deng等人提出一种基于HSI的微纹理(microtexture)的HSI分类框架。该框架将局部响应模式(LRP)推广到纹理增强(TE)中来表示HSI,利用判别局部保持投影(Discriminated Locality Preserving Projection,DLPP) 降低HSI的数据维度。但该框架没有利用HSI的光谱信息,性能可以进一步的提高(Deng S,Xu Y,He Y,et al.A hyperspectral image classification framework and its application[J].Information Sciences, 2015,299(Supplement C):379-393.)。Jimenez等人将一种区域-增长的多分辨率分割算法应用于HSI分类的后处理中,以提高分类技术的性能。该方法将分类与分割相结合,显著提升了分类结果,但其主要缺点是多分辨率算法优化的成本(Jimenez L I,PlazaA,Ayma V A,et al. Segmentation as postprocessing forhyperspectral image classification[C]. International Conference on Computeras a Tool,IEEE EUROCON 2015, September 8,2015-September 11,2015,2015.)。2016年,Huang等人结合光谱与空间信息融合可有效提高HSI的分类精度,提出了一种基于KNN的高光谱图像分类方法。该方法利用KNN滤波算法来改进由SVM得到的高光谱像素分类概率图,结合不同像素的值和空间坐标来进行图像的联合滤波,从而同时利用了HSI的光谱和空间信息 (Huang K,Li S,Kang X,et al.SpectralSpatial Hyperspectral ImageClassification Based on KNN[J].Sensing and Imaging,2016,17(1): 1-13.)。
近年来,相比与以上传统的机器学习相关算法如SVM,ELM等,深度卷积神经网络(DCNN)在计算机视觉中更具有统治地位,传统机器学习算法在大数据的视觉识别上(如ILSVRC)难以与深度卷积网络相比,以至被有些人称为浅层学习(Shallow Learning)。2016年, Chen等人提出了一种基于卷积神经网络的正则化深度特征(feature extraction,FE)提取方法,并建立一个3D基于CNN的FE模型用于提取HSI的光谱空间特征。为了进一步地提高性能,提出一种虚拟样本增强方法。该论文展示了深度学习的潜能,为进一步研究,树立了方向(]Chen Y,Jiang H,Li C,et al.Deep Feature Extraction and Classificationof Hyperspectral Images Based on Convolutional Neural Networks[J].IEEETransactions on Geoscience and Remote Sensing, 2016,54(10):6232-6251.)。2017年,与上述等人需主动提取HSI中的光谱和空间信息不同,Li等人没有主动提取HSI的特征,而是直接将原始的三维高层数据作为输入,提出了一种用于HSI分类的3D卷积神经网络框架。该框架不依赖任何预处理或后处理,却能提取出有效的光谱空间组合特征。此外,该框架与其它深度学习相比,所需参数更少,模型更轻,更容易训练(Li Y,Zhang H,ShenQ.Spectral-spatial classification of hyperspectral imagery with 3Dconvolutional neural network[J].Remote Sensing,2017,9(1).)。Shi基于提取HSI的三维特征对于HSI分类问题是十分有效性,提出了一种三维多分辨率小波卷积网络(3D-MWCNNs)用于HSI分类。3D-MWCNNs在CNNs框架的基础上与多分辨率分析理论相结合,自适应地从不同尺度和不同深度提取三维特征。该模型提取的光谱和空间特征更有判别力,从而可以提高HSI分类精度。但该模型所需训练时间远多于其它分类方法(Shi C,Pun C-M.3Dmulti-resolution wavelet convolutional neural networks forhyperspectral imageclassification[J].Information Sciences,2017,420: 49-65.)。Zhong等人提出了一种端到端的光谱空间残余网络 (spectral-spatial residual network,SSRN)。该网络利用光谱和空间残差块(residual blocks)从HSI中的丰富的光谱特征和空间背景中学习有判别力的特征,并且残差块通过恒等映射(identity mapping)连接其他卷积层。并且加强每层卷积层上的BN归一化(Batch normalization)。因此,与其他方法相比,有极高的分类精度。但与其他方法相比,模型训练时间过长(Zhong Z,Li J,Luo Z,et al.Spectral-Spatial Residual Network for Hyperspectral Image Classification:A 3-D DeepLearning Framework[J],2017.)。
综上,已有高光谱图像分类方法中,传统机器学***。而深度卷积网络及其扩展网络大多有着很长的模型训练时间。
发明内容
本发明是为了解决上述问题而进行的,目的在于提供一种基于三维稠密连接卷积神经网络的高光谱图像分类方法
本发明提供了一种基于三维稠密连接卷积神经网络的高光谱图像分类方法,具有这样的特征,包括以下步骤:步骤一,输入高光谱图像的多通道的三维立方数据块;步骤二,通过三维稠密光谱块对三维立方数据块进行处理,学习提取高光谱图像的多通道之间的谱间特征得到谱间特征图;步骤三,通过三维过渡层对谱间特征图进行处理得到压缩特征图;步骤四,通过三维稠密空间谱块对压缩特征图进行处理,学习提取高光谱图像的空间特征得到空间特征图;步骤五,将空间特征图依次经过池化层、压缩层、dropout层以及全连接层得到一个预测标签向量;步骤六,确定待优化的目标函数;步骤七,将预测标签向量代入目标函数中,得到迭代训练的损失;步骤八,根据迭代训练的损失,对三维稠密连接卷积神经网络模型的待优化参数进行优化;步骤九,多次重复步骤一至五以及步骤七、八,对待优化参数进行多次优化得到迭代训练的损失最小时的预测标签向量,即为高光谱图像的分类结果。
在本发明提供的基于三维稠密连接卷积神经网络的高光谱图像分类方法中,还可以具有这样的特征:其中,三维立方数据块的选取方法为:对具有L个通道大小为H×W的高光谱图像,从其原始像素中以一个像素为中心选取r×r×L大小的三维立方数据块,记作x(r ×r×L), r×r表示三维立方数据块的空间图像大小。
在本发明提供的基于三维稠密连接卷积神经网络的高光谱图像分类方法中,还可以具有这样的特征:其中,预测标签向量y~的维度为C,
Figure RE-GDA0001623612530000051
Dense(·)表示三维稠密连接卷积神经网络模型;C为高光谱图像待分类的类别数;δ为待优化参数;高光谱图像的交叉熵损失函数Ls为,
Figure RE-GDA0001623612530000052
m表示规范层所包含的样本大小;xi表示全连接层的第i层的输入特征,它属于第yi类;Wj表示在最后的全连接层中的权重W的第j列;b表示偏置项;高光谱图像的中心损失函数Lc为,
Figure RE-GDA0001623612530000061
Cyi表示第yi类的深度特征中心,目标函数F为交叉熵损失函数Ls与中心损失函数 Lc之和的最小值,即
Figure RE-GDA0001623612530000062
在本发明提供的基于三维稠密连接卷积神经网络的高光谱图像分类方法中,还可以具有这样的特征:其中,步骤二之前还包括:从三维立方数据块中选取目标像元立方数据,得到大小为r×r×b的n个特征图,这些特征图作为三维稠密光谱块的输入,记为
Figure RE-GDA0001623612530000063
中的下标1表示该数据位于三维稠密光谱块中,上标0表示该数据位于三维稠密光谱块中的起始位置。
在本发明提供的基于三维稠密连接卷积神经网络的高光谱图像分类方法中,还可以具有这样的特征:其中,三维稠密光谱块和三维稠密空间块均包括以稠密连接方式连接的多层三维复合卷积层,每层复合卷积层包括依次连接的规范层、激活层以及三维卷积层,三维稠密光谱块的三维卷积层的卷积核的大小为1×1×d,卷积核的数量为k,三维稠密空间块的三维卷积层的卷积核的大小为a×a×g,卷积核的数量为k,a×a为空间图像的大小,d、g为通道的数量。
在本发明提供的基于三维稠密连接卷积神经网络的高光谱图像分类方法中,还可以具有这样的特征:其中,三维稠密光谱块的多层三维复合卷积层记作D1(·),三维稠密光谱块中第1层三维复合卷积层的输出为
Figure RE-GDA0001623612530000064
三维稠密光谱块中第l层三维复合卷积层的输出为
Figure RE-GDA0001623612530000071
三维稠密光谱块的第l层三维复合卷积层的输出的特征图即为谱间特征图,谱间特征图的数量
Figure RE-GDA0001623612530000072
Figure RE-GDA0001623612530000073
在本发明提供的基于三维稠密连接卷积神经网络的高光谱图像分类方法中,还可以具有这样的特征:其中,步骤三之前还包括对谱间特征图的通道进行合并得到km个谱间特征图。
在本发明提供的基于三维稠密连接卷积神经网络的高光谱图像分类方法中,还可以具有这样的特征:其中,三维过渡层包括依次连接的规范层以及三层三维卷积层,三维过渡层的第一个三维卷积层的卷积核的大小为1×1×1,卷积核的数量为θ×km个,该第一个三维卷积层用于改变谱间特征图的通道数量,三维过渡层的第二、三个三维卷积层的结构相同,用于重塑谱间特征图的形状,减小谱间特征图的数据块的空间大小。
在本发明提供的基于三维稠密连接卷积神经网络的高光谱图像分类方法中,还可以具有这样的特征:其中,三维稠密空间块的多层三维复合卷积层记作D2(·),三维稠密空间块中第l层三维复合卷积层的输出为
Figure RE-GDA0001623612530000074
三维稠密空间块的第l层三维复合卷积层的输出的特征图即为空间特征图。
发明的作用与效果
根据本发明所涉及的基于三维稠密连接卷积神经网络的高光谱图像分类方法,因为直接将高光谱图像的三维立方数据块作为输入,采用三维稠密光谱块来自动提取高光谱图像中丰富的谱间特征得到谱间特征图,通过三维过渡层对谱间特征图进行处理得到压缩特征图,采用三维稠密空间块来自动提取高光谱图像中丰富的空间特征得到空间特征图,所以本方法所涉及的三维稠密连接卷积神经网络的网络更深却不会出现梯度消失的问题,能够更加有效的利用特征,并且加强了特征的传递,进而提高了分类的精度,同时缩短了训练时间。
此外,本方法的通过迭代训练的损失来对待优化参数进行多次优化,即采用了动态的学习率,还使用了dropout,这些使得三维稠密连接卷积神经网络的收敛速度加快,只需经过较少次数的迭代就能达到最好的分类精度。
附图说明
图1是本发明的实施例中基于三维稠密连接卷积神经网络的高光谱图像分类方法的流程图;
图2是本发明的实施例中具有三层三维复合卷积层的三维稠密光谱块的结构示意图;
图3是本发明的实施例中三维过渡层的结构示意图;
图4是本发明的实施例中具有三层三维复合卷积层的三维稠密空间块的结构示意图;
图5是本发明的实施例中目标函数与迭代次数的关系图;
图6是本发明的实施例中采用基于三维稠密连接卷积神经网络的高光谱图像分类方法(3D-DenseNet)对PaviaUniversity(UP)数据进行分类的可视化结果;以及
图7是本发明的实施例中采用基于三维稠密连接卷积神经网络的高光谱图像分类方法(3D-DenseNet)对Indiana Pines(IN)数据进行分类的可视化结果。
具体实施方式
为了使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,以下实施例结合附图对本发明基于三维稠密连接卷积神经网络的高光谱图像分类方法作具体阐述。
图1是本发明的实施例中基于三维稠密连接卷积神经网络的高光谱图像分类方法的流程图。
如图1所示,基于三维稠密连接卷积神经网络的高光谱图像分类方法包括以下步骤:
步骤S1:
输入高光谱图像的原始像素的数据集和对应的真实标签。
{(x(r×r×L),gth),y}
x(r×r×L)表示三维立方数据块,对具有L个通道大小为H×W的高光谱图像,从其原始像素中以一个像素为中心选取r×r×L大小的三维立方数据块,记作x(r×r×L),其中,r×r表示三维立方数据块的空间图像大小。高光谱图像的真实标签(ground truth)记为输入gth,gth∈R2。对于输入对(x(r×r×L),gth),所对应的输出为y,y∈R2
步骤S2:
对三维立方数据块进行预处理标准化得到标准化数据。得到的结果是,对于每行/每列来说所有数据都聚集在0附近,方差为1。
步骤S3:
将标准化数据用零在三个维度上填充扩大得到填充数据。
步骤S4:
对填充数据进行数据分配,过程如下:以高光谱图像在空间域上的像素数量按一定的比例分配为训练数据集,验证数据集和测试数据集。高光谱的单通道图像共有TN个像素点即TN个索引,其中, TN=r×r,r为空间域的大小。将真实标签中有标记的像素点的索引提取出来,做成像元索引列表,记为LN。为了方便之后的模型训练,验证和测试,将像元索引列表LN按一定的比例随机分为训练索引集LNtrain,验证索引集LNval和测试索引集LNtest
步骤S5:
选取目标像元立方数据,过程如下:以目标像元在空间域上的位置为中心从填充数据中选取一定大小的小立方块。根据训练索引集 LNtrain,验证索引集LNval和测试索引集LNtest,将填充数据块分配为训练数据块集Xtrain,验证数据块集Xval和测试数据块集Xtest
步骤S6:
图2是本发明的实施例中具有三层三维复合卷积层的三维稠密光谱块的结构示意图。
如图2所示,三维稠密光谱块包括以稠密连接方式连接的多层三维复合卷积层。在本实施例中三维稠密光谱块具有三层三维复合卷积层。每层三维复合卷积层包括依次连接的规范层、激活层以及三维卷积层。其中,激活层的激活函数为参数化修正单元;三维卷积层的卷积核的大小为1×1×d,d为通道的数量,卷积核的数量为k。一层三维的复合卷积层能够产生k个特征图,将其称为神经网络的生长率。
通过三维稠密光谱块对训练数据块集Xtrain进行处理,学习提取高光谱图像的多通道之间的谱间特征,过程如下:
训练数据块集Xtrain首先经过三维卷积生成大小为r×r×b的n个特征图,这些特征图作为三维稠密光谱块的输入,记作
Figure RE-GDA0001623612530000111
中的下标 1表示该数据位于三维稠密光谱块中,上标0表示该数据位于三维稠密光谱块中的起始位置;三维复合卷积层记作D1(·),第1层三维复合卷积层的输出为
Figure RE-GDA0001623612530000112
Figure RE-GDA0001623612530000113
第l层三维复合卷积层的输出为
Figure RE-GDA0001623612530000114
Figure RE-GDA0001623612530000115
三维稠密光谱块的第l层三维复合卷积层的输出的特征图为学习提取光谱图像的谱间特征后得到的谱间特征图。在三维稠密光谱块中,每层三维复合卷积层的输入特征图的大小均为r×r×b、输出特征图的大小也均为r×r×b、输出特征图的数量均为k,但输出特征图的数量随着三维复合卷积层的层数加深而线性的增加,因此,谱间特征图的数量
Figure RE-GDA0001623612530000116
Figure RE-GDA0001623612530000117
步骤S7:
将谱间特征图的通道进行合并得到km个大小为r×r×b的谱间特征图。
步骤S8:
图3是本发明的实施例中三维过渡层的结构示意图。
如图3所示,三维过渡层包括依次连接的规范层以及三层三维卷积层。其中,第一层三维卷积层的卷积核的大小为1×1×1,卷积核的数量为θ×km个,0<θ≤1;第二、三层三维卷积层的结构相同,用于重塑谱间特征图的形状。
通过三维过渡层对km个大小为r×r×b的谱间特征图进行处理,过程如下:
km个大小为r×r×b的谱间特征图首先经过规范层进行批标准化,再通过第一层三维卷积层来减小谱间特征图的通道数量,最后通过第二、三层三维卷积层来重塑谱间特征图的形状,减小数据块的空间大小得到压缩特征图。压缩特征图的数目为θ×km个。
步骤S9:
图3是本发明的实施例中具有三层三维复合卷积层的三维稠密空间块的结构示意图。
如图3所示,三维稠密空间块包括以稠密连接方式连接的多层三维复合卷积层。在本实施例中三维稠密空间块具有三层三维复合卷积层。每层三维复合卷积层包括依次连接的规范层、激活层以及三维卷积层。其中,激活层的激活函数为参数化修正单元;三维卷积层的卷积核的大小为a×a×g,a×a为空间图像的大小,g为通道的数量,卷积核的数量为k。一层三维的复合卷积层能够产生k个特征图。
通过三维稠密空间块对压缩特征图进行处理,学习提取高光谱图像的多通道之间的谱间特征,过程如下:
以压缩特征图作为三维稠密空间块的输入,记作
Figure RE-GDA0001623612530000131
中的下标 2表示该数据位于三维稠密空间块中,上标0表示该数据位于三维稠密空间块中的起始位置;三维稠密空间块的多层三维复合卷积层记作 D2(·),三维稠密空间块中第l层三维复合卷积层的输出为
Figure RE-GDA0001623612530000132
Figure RE-GDA0001623612530000133
三维稠密空间块的第l层三维复合卷积层的输出的特征图为保存网络轻窄的同时学习提取高光谱图像的空间特征后得到的空间特征图。在三维稠密空间块中,每层三维复合卷积层的输入特征图的大小均为r×r×b、输出特征图的大小也均为r×r×b、输出特征图的数量均为k,输出特征图的数量随着三维复合卷积层的层数加深而线性的增加,因此,空间特征图的数量
Figure RE-GDA0001623612530000134
Figure RE-GDA0001623612530000135
步骤S10:
空间特征图依次经过池化层、压缩层、dropout层以及全连接层得到一个预测标签向量。
预测标签向量
Figure RE-GDA0001623612530000136
的维度为C,
Figure RE-GDA0001623612530000137
Dense(·)表示三维稠密连接卷积神经网络模型;C为高光谱图像待分类的类别数;δ为待优化参数。
步骤S11:
高光谱图像的分类属于分类问题,对于这类问题通常采用交叉熵 (cross-entropy)损失函数来度量预测值与真实值之间的差异,并以此来对待优化的目标函数函数进行优化。又因为高光谱图像分类是多分类判别,故采用softmax回归,得到高光谱图像的交叉熵损失函数Ls为,
Figure RE-GDA0001623612530000141
其中,m表示规范层所包含的样本大小;xi表示全连接层的第i层的输入特征,它属于第yi类;Wj表示在最后的全连接层中的权重W的第j列;b表示偏置项。
但用交叉熵损失函数Ls来优化目标函数,会产生一个问题,即类内间距较大。每一个类都维护一个类的中心,在特征层上如果该样本的特征与类中心过远就惩罚,这就是中心损失。高光谱图像的中心损失函数Lc为,
Figure RE-GDA0001623612530000142
其中,Cyi表示第yi类的深度特征中心。
综上,待优化的目标函数F为交叉熵损失函数Ls与中心损失函数 Lc之和的最小值,即
Figure RE-GDA0001623612530000143
步骤S12:
将预测标签向量代入目标函数F中,得到迭代训练的损失。
步骤S13:
根据迭代训练的损失,对三维稠密连接卷积神经网络模型的待优化参数δ进行优化。
步骤S14:
多次重复步骤S1至S10以及步骤S12、S13,对待优化参数δ进行多次优化得到迭代训练的损失最小时的预测标签向量,即为高光谱图像的分类结果。
基于三维稠密连接卷积神经网络的高光谱图像分类方法中三维稠密连接卷积神经网络模型的收敛性验证过程如下:
实验设置每个三维稠密光谱块中的三维复合卷积层为3层,每个三维稠密空间块中的三维复合卷积层为3层,神经网络的生长率k设为12,优化器为RMSprop,迭代训练的次数为200。采用动态学习率,初始学习率为0.0003,在10次迭代训练中模型不收敛,则学习率减半。目标是从训练数据块集Xtrain中学习对三维立方数据进行分类标记。
图5是本发明的实施例中目标函数与迭代次数的关系图。
如图5所示,随着迭代次数有从0~200依次增加,目标函数的函数值由1.94169逐渐减小至0.01976并逐渐趋近于0,表明本发明所涉及的三维稠密连接卷积神经网络模型具有收敛性。
使用基于三维稠密连接卷积神经网络的高光谱图像分类方法对高光谱图像进行分类的结果如下:
基于三维稠密连接卷积神经网络的高光谱图像分类方法采用 PaviaUniversity数据和Indiana Pines数据。
PaviaUniversity数据由ROSIS传感器于2003年在意大利帕维亚地亚获得。原始数据大小为,空间分辨率达到1.3m。PaviaUniversity 数据中共有9类地物及其详细信息,如表1所示。
表1为本发明的实施例中PaviaUniversity数据的类别信息
Figure RE-GDA0001623612530000161
Indiana Pines数据由AVIRIS光谱仪于1996年在北印第安纳州西部获得。IndianP数据中共有16种地物及其详细的类别信息,如表2 所示。
表2为本发明的实施例中PIndiana Pines数据的类别信息
Figure RE-GDA0001623612530000162
基于三维稠密连接卷积神经网络的高光谱图像分类方法在Pavia University数据和IndianaPines数据上随机选取10组训练数据进行测试,实验结果以‘平均数±方差’的形式给出。计算机配置为32GB内存,1080TiGPU。本实验采用总体精度(overall accuracy,OA),平均精度(average accuracy,AA)和Kappa系数(k)及每一类的具体精度作为分类结果精度的相关指标。在数据集上采用相同的9×9(r=9)空间输入大小,PaviaUniversity数据和Indiana Pines数据的训练样本比例分别为10%和20%。
从表3中的精度来看,本方法(3D-DenseNet)在对Pavia University (UP)数据和Indiana Pines(IN)数据进行分类时,总体精度(overall accuracy,OA),平均精度(average accuracy,AA)和Kappa系数(k)上均达到99%以上的精度。
表3为本发明的实施例中采用基于三维稠密连接卷积神经网络的高光谱图像分类方法(3D-DenseNet)分别对Pavia University(UP)
数据和IndianaPines(IN)数据进行分类的结果
Figure RE-GDA0001623612530000171
Figure RE-GDA0001623612530000181
图6是本发明的实施例中采用基于三维稠密连接卷积神经网络的高光谱图像分类方法(3D-DenseNet)对Pavia University(UP)数据进行分类的可视化结果。
图7是本发明的实施例中采用基于三维稠密连接卷积神经网络的高光谱图像分类方法(3D-DenseNet)对IndianaPines(IN)数据进行分类的可视化结果。
如图6所示,Pavia University数据的某一波段上的实际图像为图 6-a部分,真实标记图为图6-b部分和采用基于三维稠密连接卷积神经网络的高光谱图像分类方法的结果图为图6-c部分。Indiana Pines 数据的某一波段上的实际图像为图7-a部分,真实标记图为图7-b部分和采用基于三维稠密连接卷积神经网络的高光谱图像分类方法的结果图为图7-c部分。从图6、7可以看出本方法的分类结果图与真实标记图基本一致。
实施例的作用与效果
根据本实施例所涉及的基于三维稠密连接卷积神经网络的高光谱图像分类方法,因为直接将高光谱图像的三维立方数据块作为输入,采用三维稠密光谱块来自动提取高光谱图像中丰富的谱间特征得到谱间特征图,通过三维过渡层对谱间特征图进行处理得到压缩特征图,采用三维稠密空间块来自动提取高光谱图像中丰富的空间特征得到空间特征图,所以本方法所涉及的三维稠密连接卷积神经网络的网络更深却不会出现梯度消失的问题,能够更加有效的利用特征,并且加强了特征的传递,进而提高了分类的精度,同时缩短了训练时间。
此外,本方法的通过迭代训练的损失来对待优化参数进行多次优化,即采用了动态的学习率,还使用了dropout,这些使得三维稠密连接卷积神经网络的收敛速度加快,只需经过较少次数的迭代就能达到最好的分类精度。
进一步地,三维过渡层的第一层三维卷积层的卷积核的大小为 1×1×1,图像在空间域内具有局部相关性,卷积的过程是对局部相关性的一种抽取,而大小为1×1×1的卷积不提取任何特征,因为它完全不考虑像素与周边其他像素关系。但实际上,大小为1×1×1的卷积对每个像素点在不同的通道上进行线性组合或者信息整合,在保存谱间特征图r×r×b的大小不变的同时,可以自由地改变谱间特征图的通道的数量。
进一步地,三维稠密光谱块和三维稠密空间块均包括以稠密连接方式连接的多层三维复合卷积层,这种稠密卷积连接方式使得三维稠密连接卷积神经网络的网络更深却不会出现的梯度消失问题,使得网络更窄并加强了卷积层之间的特征传递,进而提高分类精度。
上述实施方式为本发明的优选案例,并不用来限制本发明的保护范围。

Claims (9)

1.一种基于三维稠密连接卷积神经网络的高光谱图像分类方法,采用三维的稠密连接的卷积神经网络模型对高光谱图像进行分类,其特征在于,包括以下步骤:
步骤一,输入高光谱图像的多通道的三维立方数据块;
步骤二,通过三维稠密光谱块对所述三维立方数据块进行处理,学习提取所述高光谱图像的多通道之间的谱间特征得到谱间特征图;
步骤三,通过三维过渡层对所述谱间特征图进行处理得到压缩特征图;
步骤四,通过三维稠密空间谱块对所述压缩特征图进行处理,学习提取所述高光谱图像的空间特征得到空间特征图;
步骤五,将所述空间特征图依次经过池化层、压缩层、dropout层以及全连接层得到一个预测标签向量;
步骤六,确定待优化的目标函数;
步骤七,将所述预测标签向量代入所述目标函数中,得到迭代训练的损失;
步骤八,根据所述迭代训练的损失,对三维稠密连接卷积神经网络模型的待优化参数进行优化;
步骤九,多次重复步骤一至五以及步骤七、八,对所述待优化参数进行多次优化得到所述迭代训练的损失最小时的预测标签向量,即为所述高光谱图像的分类结果。
2.根据权利要求1所述的基于三维稠密连接卷积神经网络的高光谱图像分类方法,其特征在于:
其中,所述三维立方数据块的选取方法为:对具有L个通道大小为H×W的高光谱图像,从其原始像素中以一个像素为中心选取r×r×L大小的所述三维立方数据块,记作x(r×r×L)
r×r表示所述三维立方数据块的空间图像大小。
3.根据权利要求2所述的基于三维稠密连接卷积神经网络的高光谱图像分类方法,其特征在于:
其中,所述预测标签向量
Figure FDA0003188845540000021
的维度为C,
Figure FDA0003188845540000022
Dense(·)表示三维稠密连接卷积神经网络模型;C为所述高光谱图像待分类的类别数;δ为待优化参数;
所述高光谱图像的交叉熵损失函数Ls为,
Figure FDA0003188845540000023
m表示规范层所包含的样本大小;xi表示所述全连接层的第i层的输入特征,它属于第yi类;Wj表示在最后的所述全连接层中的权重W的第j列;b表示偏置项;
所述高光谱图像的中心损失函数Lc为,
Figure FDA0003188845540000024
Cyi表示第yi类的深度特征中心,
所述目标函数F为交叉熵损失函数Ls与中心损失函数Lc之和的最小值,即
Figure FDA0003188845540000031
4.根据权利要求1所述的基于三维稠密连接卷积神经网络的高光谱图像分类方法,其特征在于:
其中,步骤二之前还包括:从所述三维立方数据块中选取目标像元立方数据,得到大小为r×r×b的n个特征图,这些特征图作为所述三维稠密光谱块的输入,记为
Figure FDA0003188845540000032
中的下标1表示该数据位于三维稠密光谱块中,上标0表示该数据位于三维稠密光谱块中的起始位置。
5.根据权利要求4所述的基于三维稠密连接卷积神经网络的高光谱图像分类方法,其特征在于:
其中,所述三维稠密光谱块和所述三维稠密空间块均包括以稠密连接方式连接的多层三维复合卷积层,
每层所述复合卷积层包括依次连接的规范层、激活层以及三维卷积层,
所述三维稠密光谱块的三维卷积层的卷积核的大小为1×1×d,卷积核的数量为k,
所述三维稠密空间块的三维卷积层的卷积核的大小为a×a×g,卷积核的数量为k,
a×a为空间图像的大小,d、g为通道的数量。
6.根据权利要求5所述的基于三维稠密连接卷积神经网络的高光谱图像分类方法,其特征在于:
其中,所述三维稠密光谱块的多层所述三维复合卷积层记作D1(·),
所述三维稠密光谱块中第1层所述三维复合卷积层的输出为
Figure FDA0003188845540000041
Figure FDA0003188845540000042
所述三维稠密光谱块中第l层所述三维复合卷积层的输出为
Figure FDA0003188845540000043
Figure FDA0003188845540000044
所述三维稠密光谱块的第l层所述三维复合卷积层的输出的特征图即为所述谱间特征图,所述谱间特征图的数量
Figure FDA0003188845540000045
Figure FDA0003188845540000046
7.根据权利要求1所述的基于三维稠密连接卷积神经网络的高光谱图像分类方法,其特征在于:
其中,步骤三之前还包括对所述谱间特征图的通道进行合并得到km个所述谱间特征图。
8.根据权利要求1所述的基于三维稠密连接卷积神经网络的高光谱图像分类方法,其特征在于:
其中,所述三维过渡层包括依次连接的规范层以及三层三维卷积层,
所述三维过渡层的第一层三维卷积层的卷积核的大小为1×1×1,卷积核的数量为θ×km个,该第一层三维卷积层用于改变所述谱间特征图的通道数量,
所述三维过渡层的第二、三层三维卷积层的结构相同,用于重塑所述谱间特征图的形状,减小所述谱间特征图的数据块的空间大小。
9.根据权利要求5所述的基于三维稠密连接卷积神经网络的高光谱图像分类方法,其特征在于:
其中,所述三维稠密空间块的多层所述三维复合卷积层记作D2(·),
所述三维稠密空间块中第l层所述三维复合卷积层的输出为
Figure FDA0003188845540000051
Figure FDA0003188845540000052
所述三维稠密空间块的第l层所述三维复合卷积层的输出的特征图即为所述空间特征图。
CN201810243423.4A 2018-03-23 2018-03-23 基于三维稠密连接卷积神经网络的高光谱图像分类方法 Active CN108491849B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810243423.4A CN108491849B (zh) 2018-03-23 2018-03-23 基于三维稠密连接卷积神经网络的高光谱图像分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810243423.4A CN108491849B (zh) 2018-03-23 2018-03-23 基于三维稠密连接卷积神经网络的高光谱图像分类方法

Publications (2)

Publication Number Publication Date
CN108491849A CN108491849A (zh) 2018-09-04
CN108491849B true CN108491849B (zh) 2021-09-28

Family

ID=63319511

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810243423.4A Active CN108491849B (zh) 2018-03-23 2018-03-23 基于三维稠密连接卷积神经网络的高光谱图像分类方法

Country Status (1)

Country Link
CN (1) CN108491849B (zh)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109784347B (zh) * 2018-12-17 2022-04-26 西北工业大学 基于多尺度稠密卷积神经网络和谱注意力机制的图像分类方法
CN109903255A (zh) * 2019-03-04 2019-06-18 北京工业大学 一种基于3d卷积神经网络的高光谱图像超分辨率复原方法
CN109978041B (zh) * 2019-03-19 2022-11-29 上海理工大学 一种基于交替更新卷积神经网络的高光谱图像分类方法
CN110009015A (zh) * 2019-03-25 2019-07-12 西北工业大学 基于轻量化网络和半监督聚类的高光谱小样本分类方法
CN110263914A (zh) * 2019-05-29 2019-09-20 朗坤智慧科技股份有限公司 基于稠密连接的深度神经网络结构改进方法和***
CN110852227A (zh) * 2019-11-04 2020-02-28 中国科学院遥感与数字地球研究所 高光谱图像深度学习分类方法、装置、设备及存储介质
CN110852369B (zh) * 2019-11-06 2022-09-27 西北工业大学 联合3d/2d卷积网络和自适应光谱解混的高光谱图像分类方法
CN111222453B (zh) * 2020-01-03 2022-06-14 武汉大学 基于密集连接和几何结构约束的遥感影像变化检测方法
CN111077093A (zh) * 2020-01-10 2020-04-28 安徽理工大学 一种基于多光谱技术的煤矸石快速检测的方法与装置
CN111797941A (zh) * 2020-07-20 2020-10-20 中国科学院长春光学精密机械与物理研究所 携带光谱信息和空间信息的图像分类方法及***
CN112052755B (zh) * 2020-08-24 2023-06-02 西安电子科技大学 基于多路注意力机制的语义卷积高光谱图像分类方法
CN111950714B (zh) * 2020-08-24 2024-06-18 重庆市云迈科技有限公司 一种基于3d全卷积神经网络的能谱ct图像域材料识别方法
CN112116563A (zh) * 2020-08-28 2020-12-22 南京理工大学 一种基于谱维与空间协作邻域注意力的高光谱图像目标检测方法与***
CN112183399A (zh) * 2020-09-30 2021-01-05 珠海欧比特宇航科技股份有限公司 基于可分离卷积和密集连接的高光谱图像分类方法及介质
CN112633401B (zh) * 2020-12-29 2022-11-08 中国科学院长春光学精密机械与物理研究所 一种高光谱遥感图像分类方法、装置、设备及存储介质
CN112966598B (zh) * 2021-03-04 2022-08-30 河南大学 一种双路径小卷积网络的高光谱图像分类方法
CN112950632B (zh) * 2021-04-18 2022-10-14 吉林大学 一种基于高光谱成像技术和卷积神经网络的煤炭质量检测方法
CN113361485B (zh) * 2021-07-08 2022-05-20 齐齐哈尔大学 基于光谱空间注意力融合和可变形卷积残差网络的高光谱图像分类方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8121494B2 (en) * 2008-08-19 2012-02-21 Alcatel Lucent System and method for receiving high spectral efficiency optical DPSK signals
CN102819839B (zh) * 2012-07-19 2015-06-03 北京市遥感信息研究所 多特征多级别的红外与高光谱图像的高精度配准方法
CN104063897B (zh) * 2014-06-28 2017-09-22 南京理工大学 基于图稀疏正则化的卫星高光谱图像压缩感知重建方法
CN104281855B (zh) * 2014-09-30 2017-05-10 西安电子科技大学 基于多任务低秩的高光谱图像分类方法
CN107316013B (zh) * 2017-06-14 2020-04-07 西安电子科技大学 基于nsct变换和dcnn的高光谱图像分类方法
CN107292343B (zh) * 2017-06-23 2020-05-22 中南大学 一种基于六层卷积神经网络和光谱-空间信息联合的高光谱遥感图像分类方法

Also Published As

Publication number Publication date
CN108491849A (zh) 2018-09-04

Similar Documents

Publication Publication Date Title
CN108491849B (zh) 基于三维稠密连接卷积神经网络的高光谱图像分类方法
CN108182441B (zh) 平行多通道卷积神经网络、构建方法及图像特征提取方法
CN110363215B (zh) 基于生成式对抗网络的sar图像转化为光学图像的方法
CN110348399B (zh) 基于原型学习机制和多维残差网络的高光谱智能分类方法
CN109978041B (zh) 一种基于交替更新卷积神经网络的高光谱图像分类方法
CN107145830B (zh) 基于空间信息增强和深度信念网络的高光谱图像分类方法
Mughees et al. Multiple deep-belief-network-based spectral-spatial classification of hyperspectral images
Fu et al. A novel band selection and spatial noise reduction method for hyperspectral image classification
CN107590515B (zh) 基于熵率超像素分割的自编码器的高光谱图像分类方法
CN110533077B (zh) 用于高光谱图像分类的形状自适应卷积深度神经网络方法
CN107145836B (zh) 基于栈式边界辨别自编码器的高光谱图像分类方法
CN108734199B (zh) 基于分段深度特征及低秩表示的高光谱图像鲁棒分类方法
CN111310598B (zh) 一种基于3维和2维混合卷积的高光谱遥感图像分类方法
CN111680579B (zh) 一种自适应权重多视角度量学习的遥感图像分类方法
CN113139512B (zh) 基于残差和注意力的深度网络高光谱影像分类方法
CN108229551B (zh) 一种基于紧凑字典稀疏表示的高光谱遥感图像分类方法
CN108133186A (zh) 一种基于深度学习的植物叶片识别方法
CN112580480B (zh) 一种高光谱遥感影像分类方法及装置
CN106778885A (zh) 基于局部流形嵌入的高光谱图像分类方法
CN109886281A (zh) 一种基于四元数超限学习机彩色图像识别方法
Yuan et al. ROBUST PCANet for hyperspectral image change detection
CN112949738A (zh) 基于eecnn算法的多类不平衡高光谱图像分类方法
Fırat et al. Spatial-spectral classification of hyperspectral remote sensing images using 3D CNN based LeNet-5 architecture
CN115564996A (zh) 一种基于注意力联合网络的高光谱遥感图像分类方法
Li et al. Using improved ICA method for hyperspectral data classification

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant