CN112801204B

CN112801204B - 基于自动神经网络的具有终身学习能力的高光谱分类方法

Info

Publication number: CN112801204B
Application number: CN202110187864.9A
Authority: CN
Inventors: 彭元喜; 胡祥; 杨文婧; 周侗; 刘煜; 杨绍武; 黄达; 蓝龙; 徐利洋; 李雪琼; 任静; 徐炜遐
Original assignee: National University of Defense Technology
Current assignee: National University of Defense Technology
Priority date: 2021-02-09
Filing date: 2021-02-09
Publication date: 2022-03-15
Anticipated expiration: 2041-02-09
Also published as: CN112801204A

Abstract

本发明公开了一种基于自动神经网络的具有终身学习能力的高光谱分类方法。本发明步骤为，S1：对原始数据进行传统的主成分分析；S2：将数据随机划分为训练集、验证集和测试集；S3：将训练集样本输入到卷积神经网络中进行处理，当运行于第一个任务时，基于数据样本和给定的自动神经网络设定参数空间，分析不同网络结构性能，完成搜索后，记录模型验证集准确率，根据验证集准确率采用最高性能模型；S4：根据结果计算损失，再通过反向传播修改网络参数，不断重复上述训练过程；S5：将测试集样本放入分类模型中，对提取的特征进行处理，进行分类预测。通过Softmax作为输出层，实现分类计算。本发明能够明显提升在多种高光谱图像连续进行分类的效果。

Description

基于自动神经网络的具有终身学习能力的高光谱分类方法

技术领域

本发明属于高光谱智能感知领域，涉及一种基于自动神经网络的具有终身学习能力的高光谱分类方法，可用于对高光谱图像进行目标分类。

背景技术

高光谱图像是成像光谱仪获取的图像。通常，在高光谱图像中，图像波段从数百到数千不等，覆盖了很宽的光谱频率范围。其中，每个像素提供一个光谱特征，由于光谱频率覆盖范围大，包含信息多。这使得图像中包含的不同材料之间有了更好的区分，从而使高光谱图像在许多应用中成为分析地球表面的工具。高光谱图像分析技术种类较多，包括分类、光谱分解、目标和异常检测。

近年来，高光谱图像分类已成为遥感领域的一个热门研究课题。高光谱图像分类的目标是为图像中的每个像素分类到与之对应的类标签。为了开发有效的高光谱图像分类方法，人们做了很多努力。传统上，将每个高光谱图像像素看作互不相关的光谱信息实体，依据其对应材料的不同划分成不同种类。这类方法被称为基于光谱的方法。

但由于该方法本身无法利用像素点的空间特征，因此基于光谱的分类方法分类效果并不好。而深度神经网络由于能够从原始数据中分层提取更抽象的数据表示，在高光谱图像分类中受到广泛关注。换言之，深度神经网络能够在浅层网络中学习简单的特征，然后通过合并较简单的特征在更深层次网络中构建更复杂的特征。尤其是卷积神经网络，其强大的特征检测能力使其成为一种具有广泛代表性的深度模型，极大地提高了对目标的分类和检测能力。因此，卷积神经网络能够在高光谱图像分类中得到很好的推广。特别是，其基本架构能够自然地集成高光谱图像中包含的光谱和空间信息，不仅考虑到每个像素的光谱特征，而且还考虑到围绕它的邻域像素的光谱信息。专利CN108596213A公开了一种基于卷积神经网络的高光谱遥感图像分类方法，其首先对高光谱图像数据进行归一化预处理，将数据集分为训练集和测试集，利用归一化预处理后的训练集对三维卷积神经网络进行训练，最后将预处理后的测试集通过训练好的三维卷积神经网络进行贝叶斯分类，得到分类结果图像数据。该方法基于卷积神经网络模型具有的局部特征检测能力，能够自主地提取光谱特征，拥有比传统方式更高的分类性能；但由于该方法使用的神经网络在学习新任务的过程中会遗忘关于旧任务的知识，不具有终身学习的能力，因而无法运用于持续学习的场景中。

总体而言，当前的高光谱图像分类技术要么无法充分利用空谱联合信息，使得分类精度有所下降；要么在学习新任务的过程中会遗忘关于旧任务的知识，不具有终身学习的能力。本发明对传统卷积神经网络结构进行改良，提出了一种具有终身学习能力的高光谱图像分类自动神经网络结构，该方法能有效克服经典神经网络具有的遗忘性，在学习新任务的过程中不会遗忘关于旧任务的知识，可以运用于持续学习的场景。

发明内容

本发明针对传统的神经网络分类方法具有遗忘性，在学习新任务的过程中会遗忘关于旧任务的知识，不能运用于持续学习场景等缺点，在传统神经网络中使用可塑权重巩固方法，通过有选择地减缓对那些任务重要的权重的学习来记住与旧任务有关的知识，解决了神经网络中的遗忘性难题。本发明主要解决的技术问题在于：使用可塑权重巩固方法，利用具有终身学习能力的自动卷积神经网络，避免对原有知识的灾难性遗忘。

为解决上述技术问题，本发明的技术方案是：

基于自动神经网络的具有终身学习能力的高光谱分类方法，其步骤为：

S1：对原始数据进行主成分分析，以减少谱带的数目，并保持相同的空间维度，即宽度和高度；

S2：将经过主成分分析处理后的数据随机划分为训练集、验证集和测试集；

S3：将训练集样本输入到卷积神经网络中，处理过程如下：

S3-1：利用两个3D-CNN层同时从数据中提取光谱和空间特征表示；

S3-2：将经过3D-CNN层处理过的数据由三维数据形式转化为二维矩阵形式；

S3-3：利用一个2D-CNN层处理数据；

S3-4：将数据输入到全连接层中，对提取的特征进行处理，最后通过输出层计算得出分类结果；

其中，每个3D-CNN或2D-CNN层后均使用激励函数Mish做激励操作，Mish函数计算方式如下：

x·tanh(ln(1+e^x)) (1)

其中x为函数的输入，通过卷积神经网络模型连续处理多个高光谱数据分类任务：当运行于第一个任务时，基于数据样本和给定的自动神经网络设定模型参数空间，分析不同网络结构性能，完成搜索后，记录模型验证集准确率，根据验证集准确率采用最高性能模型；

S4：根据结果计算损失，损失函数如下：

其中J₁(X,W,B)是标准分类误差，

是终身学习正则化误差，λ₁是权重系数，

是权重衰减误差，λ₂是权重系数，X是输入数据，W是模型中各节点权重，B是模型中各节点偏置，标准分类误差计算函数如下：

其中，y_i是对应正确分类结果，O_L(x_i)是输出的最终结果，i表示第i个样本，N是训练样本数，L表示本模型第L层即最后一层；

终身学习正则化误差计算函数如下：

其中，Ω_i代表了参数θ_i在旧任务上的重要性，θ_i和

是神经网络所有参数组成的一维向量，即将神经网络的所有参数矩阵都拿出来，然后平铺在一起，Ω_i的计算函数如下：

其中，D是数据集，J₁(d,θ)为参数为θ的模型和一个数据样本d上的损失，J₁是任务的标准分类误差；

权重衰减误差计算函数如下：

其中，W_l和B_l是各层神经网络的权重和偏置；

S5：将测试集样本放入分类模型中，对提取的特征进行处理，进行分类预测，通过Softmax函数作为输出层，对提取的特征进行处理，实现分类计算；

其中，Softmax函数如下：

其中，y_i代表输入网络第i个的样本的结果，M是神经网络最后一层节点数，代表样本一共有多少类别，O(x_i)是网络最后一层第i个神经元的值。

与现有技术相比，本发明的优点在于：

1、在传统神经网络中使用可塑权重巩固方法，通过有选择地减缓对那些任务重要的权重的学习来记住与旧任务有关的知识。弥补了专利CN108596213A中采用的传统神经网络分类方法具有遗忘性的缺点；

2、在初次运行时，运用自动神经网络，在模型参数空间中搜索选出高性能模型，弥补了专利CN108596213A逐层分析网络层计算复杂，且设计出的神经网络与本专利相比分类精度并不高的缺点；

3、使用Mish新型激活函数，分类精度高。与传统的relu激活函数相比，对负值进行了轻微允许而不是硬零边界，可以产生更好的梯度流，同时由于是平滑的激活函数，允许更好的信息深入神经网络，从而得到更好的准确性和泛化。

附图说明

图1是本发明提出的具有终身学习能力的高光谱图像分类自动神经网络结构图像处理流程；

图2是本发明提出的三维卷积层示意图；

图3是本发明提出的终身学习自动神经网络层示意图。

具体实施方式

以下将结合说明书附图和具体实施实例对本发明做进一步详细说明。

如图1、图2、图3所示，基于终身学习神经网络的高光谱图像分类方法，包括以下步骤：

本实施例中输入一幅维度为144*144*200的高光谱图像数据后，通过主成分分析将谱带数目减少到30。

本实施例中训练集占5％的样本，验证集占5％的样本，测试集占90％的样本；

S3：将训练集样本输入到卷积神经网络中，处理过程如下：

S3-3：利用一个2D-CNN层处理数据；

x·tanh(ln(1+e^x)) (1)

S4：根据结果计算损失，损失函数如下：

其中J₁(X,W,B)是标准分类误差，

是终身学习正则化误差，λ₁是权重系数，

终身学习正则化误差计算函数如下：

其中，Ω_i代表了参数θ_i在旧任务上的重要性，θ_i和

权重衰减误差计算函数如下：

其中，W_l和B_l是各层神经网络的权重和偏置；

其中，Softmax函数如下：

以上所述仅是本发明的优选实施方式，本发明的保护范围并不仅局限于上述实施例，凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理前提下的若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.基于自动神经网络的具有终身学习能力的高光谱分类方法，其特征在于，包含以下步骤：

S3：将训练集样本输入到卷积神经网络中，处理过程如下：

S3-3：利用一个2D-CNN层处理数据；

x·tanh(ln(1+e^x)) (1)

S4：根据结果计算损失，损失函数如下：

其中J₁(X,W,B)是标准分类误差，

是终身学习正则化误差，λ₁是权重系数，

终身学习正则化误差计算函数如下：

其中，Ω_i代表了参数θ_i在旧任务上的重要性，θ_i和

权重衰减误差计算函数如下：

其中，W_l和B_l是各层神经网络的权重和偏置；

其中，Softmax函数如下：

2.如权利要求1所述的基于自动神经网络的具有终身学习能力的高光谱分类方法，其特征在于，所述步骤S2中训练集占5％的样本，验证集占5％的样本，测试集占90％的样本。