CN111191618A

CN111191618A - 一种基于矩阵群的knn的场景分类方法和***

Info

Publication number: CN111191618A
Application number: CN202010002529.2A
Authority: CN
Inventors: 徐承俊; 朱国宾; 舒静倩
Original assignee: Wuhan University WHU
Current assignee: Wuhan University WHU
Priority date: 2020-01-02
Filing date: 2020-01-02
Publication date: 2020-05-22

Abstract

本发明公开了一种基于矩阵群的KNN的场景分类方法和***，获取待处理的遥感数据集，按比例划分为训练数据文件和测试数据文件；将训练样本投影到李群流形空间；计算各个类别的李群样本的内均值；随机从测试数据中取样本，进行投影计算其李群样本内均值；计算其与所有已知类别内均值之间距离；按距离升序排列，取前K个最小距离对应的所属类别样本；取其中所属类别样本个数最多的类别，赋予测试样本。本发明具有如下优点：(1)本发明既能满足向量样本的计算又能满足矩阵样本的计算，具有很好的拓展性。(2)本发明使用范式距离代替Euclid距离，具有很好的抗噪性。样本的维度低，具有很好的计算性能。

Description

一种基于矩阵群的KNN的场景分类方法和***

技术领域

本发明涉及遥感影像处理、场景分类领域，尤其是涉及一种基于矩阵群的KNN的场景分类方法和***。

背景技术

由于各种光学遥感成像技术的提升和各类传感器的快速发展，使得我们能够比以往更快更容易的获得高分辨率遥感影像，更有助于我们了解生活的环境。高空间分辨率(HSR)遥感影像可以提供关于事务的结构、纹理、形状、轮廓等大量有参考意义的信息，从而有助于提高遥感影像的识别准确度。与此同时，各类遥感影像数据集数量也在增多。但是，现有的遥感影像分类方法很难做到高准确率的同时保持良好的存储、计算性能。因此，遥感影像的分类仍然是当前研究的一项重要任务。

遥感影像在城市土地覆盖检测、城市绿地检测、目标检测、环境监测和气体污染等领域都起着非常突出的作用。常用的分类方法有：(1)KNN分类方法：该方法无需训练，通过计算测试样本与已知类别的K个样本的欧氏距离，来判断测试样本所属的类别。(2)深度学习方法，卷积神经网络(CNN)由不同类型的层组成，例如卷积层，池化层和全连接层(FC)，并使用共享权重的方式。每一层将输入量转换为神经元激活的输出量。

上述分类方法存在以下不足：(1)传统KNN只适用于向量空间的样本计算，无法完成矩阵样本空间的计算。此外，传统KNN使用Euclid(欧氏)空间计算测试样本与已知样本的距离，Euclid空间距离将每个样本同等看待，对个噪声样本敏感，会造成错误分类。(2)深度学习方法需要大量的数据集进行复杂的计算，且计算非常耗时，具有大量参数并且训练学习的过程我们无法进行干预，特征的提取、学习过程主要是由框架完成，解释性和理解性都不强，影像的特征维度高，通常需要使用GPU辅助计算，对硬件的要求高。

发明内容

本发明提供了一种基于矩阵群的KNN的场景分类方法，用以解决上述背景技术中存在的影像向量空间表示和Euclid(欧氏)距离计算的局限性、特征维度高、理解性解释性差、计算复杂等问题。

为了实现上述目标，本发明一种基于矩阵群的KNN的场景分类方法的技术方法的具体步骤如下：

Step1、获取待处理的遥感影像数据集，将所需处理的遥感数据集分为训练集和测试集。

Step2、将上述训练集和测试集分别转化为训练数据文件和测试数据文件。

Step3、将所述训练数据文件中影像集投影到李群流形空间，得到李群样本集。

Step4、计算各个类别的李群样本的内均值

Step5、随机从测试数据文件中取一个样本T_test，将T_test投影到李群流形空间并计算其李群样本的内均值

Step6、计算

与所有已知类别李群样本的内均值

之间的距离

Step7、根据上述的距离进行升序排列，取前K个最小的距离对应的所属类别样本。

Step8、取所属类别样本中所属类别样本个数最多的类别，赋予测试样本。

进一步的，在本发明的基于矩阵群的KNN的场景分类方法中，所述步骤Step3具体包括：

Step31、对每个样本做李群映射：x_ij＝exp(M_ij)，其中，M_ij表示训练数据文件中第i类别的第j个李群样本，x_ij表示李群训练样本集中第i个分类中第j个样本。

进一步的，在本发明的基于矩阵群的KNN的场景分类方法中，所述步骤Step4具体包括：

Step41、每个类别李群样本的内均值

其中x_ij表示李群训练样本集第i个分类中第j个样本，n_i表示第i个分类中训练样本的个数，c代表总的类别数，得到的内均值

为矩阵，即

其中，其中t_kl表示第k行第l列的值，k和l的取值为分别为1-m和1-n，

为m×n矩阵。

进一步的，在本发明的基于矩阵群的KNN的场景分类方法中，所述步骤Step6具体包括：

计算

与所有已知类别李群样本的内均值

之间的距离

其中

本发明还提供一种基于矩阵群的KNN的场景分类***，包括如下模块：

遥感影像数据集读取及处理模块，用于获取待处理的遥感影像数据集，将所需处理的遥感数据集分为训练集和测试集；

数据转化模块，用于将上述训练集和测试集分别转化为训练数据文件和测试数据文件；

数据集投影模块，用于将所述训练数据文件中样本投影到李群流形空间，得到李群样本集；

样本李群内均值模块，用于计算各个类别的李群样本的内均值

测试样本内均值计算模块，用于随机从测试数据文件中取一个样本T_test，将T_test投影到李群流形空间并计算其李群样本的内均值

距离计算模块，用于计算

与所有已知类别李群样本的内均值

之间的距离

排序查找模块，根据上述的距离进行升序排列，取前K个最小的距离对应的所属类别样本；

判断模块，取所属类别样本中所属类别样本个数最多的类别，赋予测试样本。

进一步的，所述数据集投影模块具体包括：

对每个样本做李群映射：x_ij＝exp(M_ij)，其中，M_ij表示训练数据文件中第i类别的第j个李群样本，x_ij表示李群训练样本集中第i个分类中第j个样本。

进一步的，所述样本李群内均值模块具体包括：

每个类别李群样本的内均值

为矩阵，即

为m×n矩阵。

进一步的，所述距离计算模块具体包括：

计算

与所有已知类别李群样本的内均值

之间的距离

其中

本发明与现有技术相比，具有的有益效果是：本发明方法通过样本内均值表示数据集样本特征，具有很好的自解释能力，增强了理解性，解决了深度学习解释性差和理解性差的问题。该方法可适应不同的应用场景、实验设备环境，具有很好的鲁棒性。特征维度使用矩阵表示，该矩阵为实对称矩阵，具有维度低和计算快的特点，解决了深度学习高维度、特征多以及计算效率低等问题。特征矩阵空间表示除了能表示自身特征外(通过主对角线表示)，还表示了该特征与相邻特征的空间关系(非主对角线表示)，解决了空间信息缺失的问题。此外，本发明既能实现向量样本空间特征计算，又能完成矩阵样本空间特征计算，使用空间范数距离求解代替Euclid距离，可以很好的解决含噪数据对分类的影响。本发明方法既能保持较高的分辨率又能保持很好的计算性能，可以作为类似研究的参考。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面结合附图和实施例对本发明进一步说明。

图1为本发明遥感影像场景分类方法流程简图；

图2为本发明在SIRI-WHU数据集的混淆矩阵示意图；

图3为本发明在UC Merced Data数据集的混淆矩阵示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本发明的实施例的详细描述并非旨在限制要求包含的本发明的范围，而是仅仅表示本发明的选定实施例。

应注意到：相似的符号在下面附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。

请参照图1，图1为本发明所提供的遥感影像场景分类方法流程简图。本实施例尤其适用于高分辨率遥感影像场景的分类，且本发明实施例在李群机器学习流形空间的开发环境中执行。

Step1，本实施案例通过在Google Earth下载UC Merced数据集，该数据集包含21个类别，每个类别包含100张图片，每张图片为256*256(单位：像素)大小的高分辨率遥感影像。通过在武汉大学国家重点实验室官网下载SIRI-WHU数据集，该数据集包含12个类别，每个类别包含200张图片，每张图片为200*200(单位：像素)大小的高分辨率遥感影像。进一步的，本发明将在这两个数据集下进行分类测试，使用matlab语言进行编程分别将两个数据集分成互斥的两个集合，其中取两个遥感数据集中任意70％的影像用于训练模型，剩下30％的影像作为测试集用来验证模型的准确率。

需要说明的是，本实施例中的图片数据具有以下优点：(1)数据量大、类别多，这对于李群机器学习而言是十分必要的。(2)样本影像的多样性，本实施例中采用的为标准数据集，涵盖多个国家和地区的不同场景，样本影像具有多样性，数据集中影像对于不同的气候、季节、角度、光照和清晰度都做了严格的筛选，从而使得每个类别影像的观测角度等有较大的差异。

此外，UC Merced数据集和SIRI-WHU数据集与现有的高分辨率遥感影像数据集的对比如下表所示，从表中可以发现，本实施例所选择的数据集综合考虑了影像的类别和类别的数量。这两个数据集对于相关模型和算法进行评估更加的客观，从而使得本发明在遥感影像场景分类领域得到更好的发展，具体如表1所示。

表1数据集详细信息表

Step2、将上述训练集和测试集分别转化为训练数据文件和测试数据文件；

Step3、本发明实施例构建数据样本到李群样本映射。

Step4、本发明实施例每个类别李代数样本的内均值

每个类别李群样本的内均值

其中x_ij表示李群训练样本集第i个分类中第j个样本，c代表总的类别数，n_i表示第i个分类中训练样本的个数，得到的内均值

为矩阵，即

其中其中，其中t_kl表示第k行第l列的值，k和l的取值为分别为1-m和1-n，

为m×n矩阵。

Step5、随机从测试数据文件中取一个样本T_test，进行投影并计算其李群样本的内均值

Step6、计算

与所有已知类别李群样本的内均值

之间的距离

计算

与所有已知类别李群样本的内均值

之间的距离

其中

Step7、根据上述的距离进行升序排列，取前K个最小的距离对应的所属类别样本，本发明中取K＝5。

表2传统KNN与本发明方法分类准确率对比表

表2为本发明方法与传统KNN算法的对比，从表中可以看出，本发明方法具有明显的优势。请结合图2～图3，图2为本发明实施例在SIRI-WHU数据集的混淆矩阵图，图3为本发明实施例在UC Merced数据集的混淆矩阵图。混淆矩阵是分析不同类别之间所有错误和混淆的信息表，它是通过计算每种类型正确和错误的测试样本分类并将结果累积到表中而创建的。在这里，我们选择SIRI-WHU数据集和UC Merced数据集，每个类具有相同数量的影像，因此总体精度的值等于平均精度的值。横坐标为实际类别，纵坐标为预测的类别，主对角线的值(颜色深度越大)越大准确率就越大。从图2、图3可以很明显看出，每一个类别的准确率，以及被分错的类别所占比例，该发明方法具有较高的准确率，平均准确率达97％。

距离计算模块，用于计算

与所有已知类别李群样本的内均值

之间的距离

进一步的，所述数据集投影模块具体包括：

进一步的，所述样本李群内均值模块具体包括：

每个类别李群样本的内均值

为矩阵，即

为m×n矩阵。

进一步的，所述距离计算模块具体包括：

计算

与所有已知类别李群样本的内均值

之间的距离

其中

各模块的具体实现方式各步骤相应，本发明不予撰述。

以上所述仅为本发明的部分实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种改变。凡在本发明的精神和原则之内，所做的任何改变、等价替换或改进等，均应包含在本发明的包含范围之内。