CN112801204B - 基于自动神经网络的具有终身学习能力的高光谱分类方法 - Google Patents
基于自动神经网络的具有终身学习能力的高光谱分类方法 Download PDFInfo
- Publication number
- CN112801204B CN112801204B CN202110187864.9A CN202110187864A CN112801204B CN 112801204 B CN112801204 B CN 112801204B CN 202110187864 A CN202110187864 A CN 202110187864A CN 112801204 B CN112801204 B CN 112801204B
- Authority
- CN
- China
- Prior art keywords
- neural network
- classification
- data
- model
- layer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于自动神经网络的具有终身学习能力的高光谱分类方法。本发明步骤为,S1:对原始数据进行传统的主成分分析;S2:将数据随机划分为训练集、验证集和测试集;S3:将训练集样本输入到卷积神经网络中进行处理,当运行于第一个任务时,基于数据样本和给定的自动神经网络设定参数空间,分析不同网络结构性能,完成搜索后,记录模型验证集准确率,根据验证集准确率采用最高性能模型;S4:根据结果计算损失,再通过反向传播修改网络参数,不断重复上述训练过程;S5:将测试集样本放入分类模型中,对提取的特征进行处理,进行分类预测。通过Softmax作为输出层,实现分类计算。本发明能够明显提升在多种高光谱图像连续进行分类的效果。
Description
技术领域
本发明属于高光谱智能感知领域,涉及一种基于自动神经网络的具有终身学习能力的高光谱分类方法,可用于对高光谱图像进行目标分类。
背景技术
高光谱图像是成像光谱仪获取的图像。通常,在高光谱图像中,图像波段从数百到数千不等,覆盖了很宽的光谱频率范围。其中,每个像素提供一个光谱特征,由于光谱频率覆盖范围大,包含信息多。这使得图像中包含的不同材料之间有了更好的区分,从而使高光谱图像在许多应用中成为分析地球表面的工具。高光谱图像分析技术种类较多,包括分类、光谱分解、目标和异常检测。
近年来,高光谱图像分类已成为遥感领域的一个热门研究课题。高光谱图像分类的目标是为图像中的每个像素分类到与之对应的类标签。为了开发有效的高光谱图像分类方法,人们做了很多努力。传统上,将每个高光谱图像像素看作互不相关的光谱信息实体,依据其对应材料的不同划分成不同种类。这类方法被称为基于光谱的方法。
但由于该方法本身无法利用像素点的空间特征,因此基于光谱的分类方法分类效果并不好。而深度神经网络由于能够从原始数据中分层提取更抽象的数据表示,在高光谱图像分类中受到广泛关注。换言之,深度神经网络能够在浅层网络中学习简单的特征,然后通过合并较简单的特征在更深层次网络中构建更复杂的特征。尤其是卷积神经网络,其强大的特征检测能力使其成为一种具有广泛代表性的深度模型,极大地提高了对目标的分类和检测能力。因此,卷积神经网络能够在高光谱图像分类中得到很好的推广。特别是,其基本架构能够自然地集成高光谱图像中包含的光谱和空间信息,不仅考虑到每个像素的光谱特征,而且还考虑到围绕它的邻域像素的光谱信息。专利CN108596213A公开了一种基于卷积神经网络的高光谱遥感图像分类方法,其首先对高光谱图像数据进行归一化预处理,将数据集分为训练集和测试集,利用归一化预处理后的训练集对三维卷积神经网络进行训练,最后将预处理后的测试集通过训练好的三维卷积神经网络进行贝叶斯分类,得到分类结果图像数据。该方法基于卷积神经网络模型具有的局部特征检测能力,能够自主地提取光谱特征,拥有比传统方式更高的分类性能;但由于该方法使用的神经网络在学习新任务的过程中会遗忘关于旧任务的知识,不具有终身学习的能力,因而无法运用于持续学习的场景中。
总体而言,当前的高光谱图像分类技术要么无法充分利用空谱联合信息,使得分类精度有所下降;要么在学习新任务的过程中会遗忘关于旧任务的知识,不具有终身学习的能力。本发明对传统卷积神经网络结构进行改良,提出了一种具有终身学习能力的高光谱图像分类自动神经网络结构,该方法能有效克服经典神经网络具有的遗忘性,在学习新任务的过程中不会遗忘关于旧任务的知识,可以运用于持续学习的场景。
发明内容
本发明针对传统的神经网络分类方法具有遗忘性,在学习新任务的过程中会遗忘关于旧任务的知识,不能运用于持续学习场景等缺点,在传统神经网络中使用可塑权重巩固方法,通过有选择地减缓对那些任务重要的权重的学习来记住与旧任务有关的知识,解决了神经网络中的遗忘性难题。本发明主要解决的技术问题在于:使用可塑权重巩固方法,利用具有终身学习能力的自动卷积神经网络,避免对原有知识的灾难性遗忘。
为解决上述技术问题,本发明的技术方案是:
基于自动神经网络的具有终身学习能力的高光谱分类方法,其步骤为:
S1:对原始数据进行主成分分析,以减少谱带的数目,并保持相同的空间维度,即宽度和高度;
S2:将经过主成分分析处理后的数据随机划分为训练集、验证集和测试集;
S3:将训练集样本输入到卷积神经网络中,处理过程如下:
S3-1:利用两个3D-CNN层同时从数据中提取光谱和空间特征表示;
S3-2:将经过3D-CNN层处理过的数据由三维数据形式转化为二维矩阵形式;
S3-3:利用一个2D-CNN层处理数据;
S3-4:将数据输入到全连接层中,对提取的特征进行处理,最后通过输出层计算得出分类结果;
其中,每个3D-CNN或2D-CNN层后均使用激励函数Mish做激励操作,Mish函数计算方式如下:
x·tanh(ln(1+ex)) (1)
其中x为函数的输入,通过卷积神经网络模型连续处理多个高光谱数据分类任务:当运行于第一个任务时,基于数据样本和给定的自动神经网络设定模型参数空间,分析不同网络结构性能,完成搜索后,记录模型验证集准确率,根据验证集准确率采用最高性能模型;
S4:根据结果计算损失,损失函数如下:
其中,yi是对应正确分类结果,OL(xi)是输出的最终结果,i表示第i个样本,N是训练样本数,L表示本模型第L层即最后一层;
终身学习正则化误差计算函数如下:
其中,D是数据集,J1(d,θ)为参数为θ的模型和一个数据样本d上的损失,J1是任务的标准分类误差;
权重衰减误差计算函数如下:
其中,Wl和Bl是各层神经网络的权重和偏置;
S5:将测试集样本放入分类模型中,对提取的特征进行处理,进行分类预测,通过Softmax函数作为输出层,对提取的特征进行处理,实现分类计算;
其中,Softmax函数如下:
其中,yi代表输入网络第i个的样本的结果,M是神经网络最后一层节点数,代表样本一共有多少类别,O(xi)是网络最后一层第i个神经元的值。
与现有技术相比,本发明的优点在于:
1、在传统神经网络中使用可塑权重巩固方法,通过有选择地减缓对那些任务重要的权重的学习来记住与旧任务有关的知识。弥补了专利CN108596213A中采用的传统神经网络分类方法具有遗忘性的缺点;
2、在初次运行时,运用自动神经网络,在模型参数空间中搜索选出高性能模型,弥补了专利CN108596213A逐层分析网络层计算复杂,且设计出的神经网络与本专利相比分类精度并不高的缺点;
3、使用Mish新型激活函数,分类精度高。与传统的relu激活函数相比,对负值进行了轻微允许而不是硬零边界,可以产生更好的梯度流,同时由于是平滑的激活函数,允许更好的信息深入神经网络,从而得到更好的准确性和泛化。
附图说明
图1是本发明提出的具有终身学习能力的高光谱图像分类自动神经网络结构图像处理流程;
图2是本发明提出的三维卷积层示意图;
图3是本发明提出的终身学习自动神经网络层示意图。
具体实施方式
以下将结合说明书附图和具体实施实例对本发明做进一步详细说明。
如图1、图2、图3所示,基于终身学习神经网络的高光谱图像分类方法,包括以下步骤:
S1:对原始数据进行主成分分析,以减少谱带的数目,并保持相同的空间维度,即宽度和高度;
本实施例中输入一幅维度为144*144*200的高光谱图像数据后,通过主成分分析将谱带数目减少到30。
S2:将经过主成分分析处理后的数据随机划分为训练集、验证集和测试集;
本实施例中训练集占5%的样本,验证集占5%的样本,测试集占90%的样本;
S3:将训练集样本输入到卷积神经网络中,处理过程如下:
S3-1:利用两个3D-CNN层同时从数据中提取光谱和空间特征表示;
S3-2:将经过3D-CNN层处理过的数据由三维数据形式转化为二维矩阵形式;
S3-3:利用一个2D-CNN层处理数据;
S3-4:将数据输入到全连接层中,对提取的特征进行处理,最后通过输出层计算得出分类结果;
其中,每个3D-CNN或2D-CNN层后均使用激励函数Mish做激励操作,Mish函数计算方式如下:
x·tanh(ln(1+ex)) (1)
其中x为函数的输入,通过卷积神经网络模型连续处理多个高光谱数据分类任务:当运行于第一个任务时,基于数据样本和给定的自动神经网络设定模型参数空间,分析不同网络结构性能,完成搜索后,记录模型验证集准确率,根据验证集准确率采用最高性能模型;
S4:根据结果计算损失,损失函数如下:
其中,yi是对应正确分类结果,OL(xi)是输出的最终结果,i表示第i个样本,N是训练样本数,L表示本模型第L层即最后一层;
终身学习正则化误差计算函数如下:
其中,D是数据集,J1(d,θ)为参数为θ的模型和一个数据样本d上的损失,J1是任务的标准分类误差;
权重衰减误差计算函数如下:
其中,Wl和Bl是各层神经网络的权重和偏置;
S5:将测试集样本放入分类模型中,对提取的特征进行处理,进行分类预测,通过Softmax函数作为输出层,对提取的特征进行处理,实现分类计算;
其中,Softmax函数如下:
其中,yi代表输入网络第i个的样本的结果,M是神经网络最后一层节点数,代表样本一共有多少类别,O(xi)是网络最后一层第i个神经元的值。
以上所述仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (2)
1.基于自动神经网络的具有终身学习能力的高光谱分类方法,其特征在于,包含以下步骤:
S1:对原始数据进行主成分分析,以减少谱带的数目,并保持相同的空间维度,即宽度和高度;
S2:将经过主成分分析处理后的数据随机划分为训练集、验证集和测试集;
S3:将训练集样本输入到卷积神经网络中,处理过程如下:
S3-1:利用两个3D-CNN层同时从数据中提取光谱和空间特征表示;
S3-2:将经过3D-CNN层处理过的数据由三维数据形式转化为二维矩阵形式;
S3-3:利用一个2D-CNN层处理数据;
S3-4:将数据输入到全连接层中,对提取的特征进行处理,最后通过输出层计算得出分类结果;
其中,每个3D-CNN或2D-CNN层后均使用激励函数Mish做激励操作,Mish函数计算方式如下:
x·tanh(ln(1+ex)) (1)
其中x为函数的输入,通过卷积神经网络模型连续处理多个高光谱数据分类任务:当运行于第一个任务时,基于数据样本和给定的自动神经网络设定模型参数空间,分析不同网络结构性能,完成搜索后,记录模型验证集准确率,根据验证集准确率采用最高性能模型;
S4:根据结果计算损失,损失函数如下:
其中,yi是对应正确分类结果,OL(xi)是输出的最终结果,i表示第i个样本,N是训练样本数,L表示本模型第L层即最后一层;
终身学习正则化误差计算函数如下:
其中,D是数据集,J1(d,θ)为参数为θ的模型和一个数据样本d上的损失,J1是任务的标准分类误差;
权重衰减误差计算函数如下:
其中,Wl和Bl是各层神经网络的权重和偏置;
S5:将测试集样本放入分类模型中,对提取的特征进行处理,进行分类预测,通过Softmax函数作为输出层,对提取的特征进行处理,实现分类计算;
其中,Softmax函数如下:
其中,yi代表输入网络第i个的样本的结果,M是神经网络最后一层节点数,代表样本一共有多少类别,O(xi)是网络最后一层第i个神经元的值。
2.如权利要求1所述的基于自动神经网络的具有终身学习能力的高光谱分类方法,其特征在于,所述步骤S2中训练集占5%的样本,验证集占5%的样本,测试集占90%的样本。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110187864.9A CN112801204B (zh) | 2021-02-09 | 2021-02-09 | 基于自动神经网络的具有终身学习能力的高光谱分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110187864.9A CN112801204B (zh) | 2021-02-09 | 2021-02-09 | 基于自动神经网络的具有终身学习能力的高光谱分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112801204A CN112801204A (zh) | 2021-05-14 |
CN112801204B true CN112801204B (zh) | 2022-03-15 |
Family
ID=75815189
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110187864.9A Active CN112801204B (zh) | 2021-02-09 | 2021-02-09 | 基于自动神经网络的具有终身学习能力的高光谱分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112801204B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113240025B (zh) * | 2021-05-19 | 2022-08-12 | 电子科技大学 | 一种基于贝叶斯神经网络权重约束的图像分类方法 |
CN116168311B (zh) * | 2023-04-18 | 2023-07-18 | 中国人民解放军战略支援部队航天工程大学 | 一种用于森林病虫害的无人机遥感监测***及方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10902577B2 (en) * | 2017-06-19 | 2021-01-26 | Apeel Technology, Inc. | System and method for hyperspectral image processing to identify object |
CN107657285A (zh) * | 2017-10-13 | 2018-02-02 | 哈尔滨工业大学 | 基于三维卷积神经网络的高光谱图像分类方法 |
CN108596213A (zh) * | 2018-04-03 | 2018-09-28 | 中国地质大学(武汉) | 一种基于卷积神经网络的高光谱遥感图像分类方法及*** |
CN109145950B (zh) * | 2018-07-20 | 2021-09-21 | 华南理工大学 | 一种基于图信号采样的高光谱图像主动学习方法 |
CN109871830A (zh) * | 2019-03-15 | 2019-06-11 | 中国人民解放军国防科技大学 | 基于三维深度残差网络的空谱融合高光谱图像分类方法 |
CN112116563A (zh) * | 2020-08-28 | 2020-12-22 | 南京理工大学 | 一种基于谱维与空间协作邻域注意力的高光谱图像目标检测方法与*** |
-
2021
- 2021-02-09 CN CN202110187864.9A patent/CN112801204B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN112801204A (zh) | 2021-05-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111368896B (zh) | 基于密集残差三维卷积神经网络的高光谱遥感图像分类方法 | |
CN110135267B (zh) | 一种大场景sar图像细微目标检测方法 | |
CN110287849B (zh) | 一种适用于树莓派的轻量化深度网络图像目标检测方法 | |
CN112347970B (zh) | 一种基于图卷积神经网络的遥感影像地物识别方法 | |
CN112801204B (zh) | 基于自动神经网络的具有终身学习能力的高光谱分类方法 | |
CN110751209B (zh) | 一种融合深度图像分类和检索的智能台风定强方法 | |
CN109191418B (zh) | 一种基于收缩自编码器特征学习的遥感图像变化检测方法 | |
CN111783884B (zh) | 基于深度学习的无监督高光谱图像分类方法 | |
CN111738363A (zh) | 基于改进的3d cnn网络的阿尔茨海默病分类方法 | |
CN110751644B (zh) | 道路表面裂纹检测方法 | |
CN112766280A (zh) | 一种基于图卷积的遥感图像道路提取方法 | |
Yang et al. | Hyperspectral image classification with spectral and spatial graph using inductive representation learning network | |
CN112560966B (zh) | 基于散射图卷积网络的极化sar图像分类方法、介质及设备 | |
CN111640087B (zh) | 一种基于sar深度全卷积神经网络的影像变化检测方法 | |
CN115661652A (zh) | 一种面向对象的图神经网络非监督遥感影像变化检测方法 | |
CN115457311A (zh) | 一种基于自表达迁移学习的高光谱遥感影像波段选择方法 | |
CN117789038B (zh) | 一种基于机器学习的数据处理与识别模型的训练方法 | |
CN111325259A (zh) | 一种基于深度学习和二进制编码的遥感图像分类方法 | |
CN111242028A (zh) | 基于U-Net的遥感图像地物分割方法 | |
CN109558803B (zh) | 基于卷积神经网络与np准则的sar目标鉴别方法 | |
CN114332075A (zh) | 基于轻量化深度学习模型的结构缺陷快速识别与分类方法 | |
CN113591608A (zh) | 一种基于深度学习的高分辨率遥感影像不透水面提取方法 | |
CN116129280B (zh) | 一种遥感影像雪检测的方法 | |
CN116012709B (zh) | 一种高分辨率遥感影像建筑物提取方法及*** | |
CN109741313B (zh) | 独立成分分析和卷积神经网络的无参考图像质量评价方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |