WO2023241188A1

WO2023241188A1 - 一种无人机定量遥感应用的数据压缩方法

Info

Publication number: WO2023241188A1
Application number: PCT/CN2023/087731
Authority: WO
Inventors: 张文豪; 金永涛; 李国洪; 顾行发; 田晓敏; 朱霞; 朱孟栩
Original assignee: 北华航天工业学院; 中国科学院空天信息创新研究院
Priority date: 2022-06-13
Filing date: 2023-04-12
Publication date: 2023-12-21
Also published as: CN115086715A

Abstract

本申请公开了一种无人机定量遥感应用的数据压缩方法，涉及压缩方法技术领域，该方法包括对无人机采集的多光谱图像进行预处理；通过编码器，依次对多光谱图像进行三维卷积和二维卷积，得到深层特征信息；对深层特征信息进行量化和熵编码；通过端到端联合训练，对图像的损失和码率进行最优分配，得到最优压缩图像；通过解码器对最优压缩图像进行重建。通过对多光谱图形进行多次卷积，提高图像重建质量和压缩比；通过将卷积后的深层特征信息进行量化和熵编码，去除特征图像中的冗余，提高图像重建质量和压缩比；通过端对端联合训练，将图像的损失与码率调节成最优比例，可实现高压缩比的同时，提高压缩质量，防止块效应、模糊、伪影等问题的出现。

Description

一种无人机定量遥感应用的数据压缩方法

本申请要求于2022年6月13日提交中国专利局、申请号为202210673676.1、发明名称为“一种无人机定量遥感应用的数据压缩方法”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本发明涉及压缩方法技术领域，具体涉及一种无人机定量遥感应用的数据压缩方法。

背景技术

目前，无人机遥感图像的压缩方法有传统的图像压缩方法和基于深度学习的图像压缩方法。传统的图像压缩方法主要有三类：基于预测的图像压缩方法、基于矢量量化的图像压缩方法和基于变换的图像压缩方法。基于预测的图像压缩方法是利用图像相邻元素和波段之间的相关性，通过临近元素的上下文信息预测当前像素值，实现图像的压缩。基于预测的图像压缩方法常用的为差分脉冲调制，此方法通过选择预测系数，使图像的残差值达到最小。基于矢量量化的图像压缩方法是将图像的若干标量转化为一个矢量，将矢量空间整体化，从而压缩数据，此方法充分利用图像的相关性，编码性能较高，但是编码难度较大，计算资源耗费极大。基于变换的图像压缩方法是将图像从空间域变换为变换域，在变换域范围内实行压缩编码，常用的变换方法有主成分分析、离散余弦变换、离散小波变换、Karhunen-Loeve变换等。

基于预测的图像压缩方法、基于矢量量化的图像压缩方法和基于变换的图像压缩方法，这些方法都是对无人机遥感图像的像素值进行压缩，压缩率较低并且会出现不同程度的失真，甚至在高压缩比时，由于数据量大，导致计算机内存溢出，从而导致压缩图像出现块效应、模糊、伪影等问题，严重影响无人机遥感图像的定量遥感应用。

发明内容

鉴于现有技术中的上述缺陷或不足，本发明提供一种无人机定量遥感应用的数据压缩方法。

为实现上述目的，本发明提供了如下方案：

一种无人机定量遥感应用的数据压缩方法，包括：

S100.对无人机采集的多光谱图像进行预处理；

S200.通过编码器，依次对多光谱图像中进行三维卷积和二维卷积，得到深层特征信息；

S300.对深层特征信息进行量化和熵编码；

S400.通过端到端联合训练，对图像的损失和码率进行最优分配，得到最优压缩图像；

S500.通过解码器对最优压缩图像进行重建。

根据本申请实施例提供的技术方案，所述对无人机采集的多光谱图像进行预处理，具体包括：

S100.1采集目标地区的多光谱图像；

S100.2利用SIFT算子提取多光谱图像中的特征点，根据特征点信息，拼接成多光谱遥感图像；

S100.3对多光谱遥感图像进行辐射定标，将多光谱遥感图像的DN值转换为地表反射率；

S100.4剪裁多光谱遥感图像，得到256×256像素的多光谱图像。

根据本申请实施例提供的技术方案，所述编码器包括自编码器和超参编码器，所述自编码器用于将N×256×256多光谱图像三维卷积成320×16×16的特征图像；

所述超参编码器用于将320×16×16的特征图像二维卷积成320×4×4的特征图像。

根据本申请实施例提供的技术方案，所述自编码器包括三维卷积层和GDN激活函数；所述三维卷积层采用步长为2的5×5的三维卷积核，所述GDN激活函数用于增加各三维卷积层之间的非线性关系。

根据本申请实施例提供的技术方案，所述超参编码器包括二维卷积层和LeakyReLU激活函数；所述二维卷积层采用步长为2的5×5二维卷积核，所述LeakyReLU激活函数用于增加各二维卷积层之间的非线性关系。

根据本申请实施例提供的技术方案，所述解码器包括自解码器和超参解码器，所述自解码器与所述自编码器互为对称结构，所述超参解码器和所述超参编码器互为对称结构。

根据本申请实施例提供的技术方案，所述对深层特征信息进行量化和熵编码包括以下步骤：

S300.1将深层特征信息的浮点数据转化为整型；

S300.2通过双高斯模型，对熵编码进行熵估计。

根据本发明提供的具体实施例，本发明公开了以下技术效果：

本发明公开一种无人机定量遥感应用的数据压缩方法，首先对无人机采集的图像进行预处理，得到可供使用的多光谱图像，通过编码器将多光谱进行三维卷积和二维卷积，得到深层特征信息，实现压缩，再通过对深层特征信息进行量化和熵编码，进一步去除特征图像中的冗余，通过端到端联合训练，将图像的损失和码率调节成最优分配，得到最优压缩图像，最后通过解码器对最优压缩图像进行重建，以便后续应用。

通过对多光谱图形进行多次卷积，其包括三维卷积和二维卷积，有利于提高图像重建质量和压缩比；通过将卷积后的深层特征信息进行量化和熵编码，可以进一步去除特征图像中的冗余，进一步提高图像重建质量和压缩比；通过端对端联合训练，将图像的损失与码率调节成最优比例，可实现高压缩比的同时，提高压缩质量，防止块效应、模糊、伪影等问题的出现。

说明书附图

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种无人机定量遥感应用的数据压缩方法的流程示意图；

图2为本发明实施例提供的一种无人机定量遥感应用的数据压缩方法的数据压缩模型图；

图3为本发明实施例提供的一种无人机定量遥感应用的数据压缩方法的数据压缩模型图；

图4为本发明实施例提供的一种无人机定量遥感应用的数据压缩方法的水体提取结果图；图4的(a)为压缩后无人机遥感影像细长水体提取结果图，图4的(b)为压缩后无人机遥感影像块状水体提取结果图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。

实施例1

目前，无人机遥感图像的压缩方法有传统的图像压缩方法和基于深度学习的图像压缩算法。传统的图像压缩方法主要有三类：基于预测的图像压缩方法、基于矢量量化的图像压缩方法和基于变换的图像压缩方法，这些方法都是对无人机遥感图像的像素值进行压缩，压缩率较低并且会出现不同程度的失真，甚至在高压缩比时，由于数据量大，导致计算机内存溢出，从而导致压缩图像出现块效应、模糊、伪影等问题，严重影响无人机遥感图像的定量遥感应用。

基于深度学习的图像压缩方法，虽然在一定程度上提升了图像压缩比和重建质量，但是基于深度学习的图像压缩方法并未考虑到无人机定量遥感应用场景，且数据源较为单一，多为RGB类型的假彩色数据，没有针对无人机遥感图像定量遥感应用设计的压缩算法。

为解决上述问题，本发明提供了一种无人机定量遥感应用的数据压缩方法，如图1所示，包括以下步骤。

S100.对无人机采集的多光谱图像进行预处理，具体为：

S100.1采集目标地区的多光谱图像；其中，利用无人机搭载多光谱相机采集目标地区的多光谱图像。

S100.2利用SIFT算子提取多光谱图像中的特征点信息，并根据特征点信息，拼接成多光谱遥感图像，进而实现无人机遥感图像的配准。

S100.3对多光谱遥感图像进行辐射定标，将多光谱遥感图像的DN值转换为地表反射率；其中，利用不变目标法，采用ASD光谱仪测得固定目标的反射率数据，根据不变目标在不同时相下的反射率和无人机遥感图像之间的关系，对多光谱遥感图像进行辐射定标，将无人机图像DN值转换为地表反射率，此方法能够将不同传感器采集到的多光谱数据以及具有不同量化标准的数据转换为同一衡量标准，此过程消除了压缩过程中不同传感器造成的仪器误差。

S100.4剪裁辐射定标后的多光谱遥感图像，得到256×256像素的多光谱图像。

进一步地，设计面向无人机定量遥感应用的数据压缩模型，其中，压缩模型包括以下S200-S400。

S200.通过编码器，依次对多光谱图像进行三维卷积和二维卷积，得到深层特征信息。

进一步地，所述编码器包括自编码器和超参编码器，所述自编码器用于将N×256×256多光谱图像三维卷积成320×16×16的特征图像；所述超参编码器用于将320×16×16的特征图像二维卷积成320×4×4的特征图像。

其中，所述自编码器包括三维卷积层和GDN激活函数；所述三维卷积层采用步长为2的5×5的三维卷积核，所述GDN激活函数用于增加各三维卷积层之间的非线性关系。其中，GDN激活函数为公式(1)。

其中，θ＝{α,β,γ,ε}为该变换的相应参数。

工作原理：预处理后的无人机遥感图像裁剪为n×256×256大小的图像，首先利用三维卷积结构提取多光谱图像波段之间的光谱信息。三维卷积层的卷积核大小为n×1×1，使用小卷积核提取多光谱图像的光谱特征，利用卷积核尺寸为5、步长为2、零填充为2的卷积层对输入图像进行卷积操作，得到192个大小为128×128的特征图，然后利用GDN激活函数连接两个卷积层，GDN激活函数用于增加卷积神经网络各层之间的非线性关系。三维卷积层的卷积核大小为n×1×1，使用小卷积核提取多光谱图像的光谱特征，避免了数据量过大导致计算机内存溢出的问题。

其中，所述超参编码器包括二维卷积层和LeakyReLU激活函数；所述二维卷积层采用步长为2的5×5二维卷积核，所述LeakyReLU激活函数用于增加各二维卷积层之间的非线性关系。其中，LeakyReLU激活函数为公式(2)。

其中，a_i是在区间(1,+∞)的固定参数，x_i代表第i层输入的特征图，y_i代表第i层输出的特征图。

工作原理：如图2所示，前四个卷积层和连接卷积层之间GDN激活函数构成了一个基本的自编码器，自编码器对图像数据的压缩还存在进一步提升的空间，设计了超参编码器，放置在自编码器之后，超参编码器将自编码器输出的320×16×16的特征图像作为输入图像，采用卷积核尺寸为3、步长为1、零填充为1的卷积层对特征图像进行处理，得到一个新的320×16×16的特征图像，然后利用卷积核尺寸为5、步长为2、零填充为2的卷积层对新的特征图像进行下采样，采用LeakyReLU激活函数增加网络各卷积层之间的非线性关系，最后得到一组320×4×4的特征向量，超参编码器进一步降低了数据维度，提取到图像的深层特征信息。其中，图2中，Input表示输入，Output表示输出，Feature表示特征，Conv表示卷积，ReLU表示ReLU激活函数，GDN表示GDN激活函数，LeakyReLU表示LeakyReLU激活函数。

S300.对深层特征信息进行量化和熵编码，具体为：

S300.1将深层特征信息的浮点数据转化为整型数据；

其中，自编码器提取得到的图像特征数据为浮点型数据，浮点型数据存储时会占用大量的存储空间，需要对特征数据进行量化处理。量化处理会将浮点型数据量化成整型，量化过程存在一部分的信息损失，会对重建图像的质量造成一定的影响。量化结构的原理是将特征图像的浮点型数据转换为整型数据，其公式如公式(3)所示：

其中，y_i为自编码器输出的特征图，为量化结果。

图像经过自编码器提取特征和量化之后，还存在冗余去除不彻底的情况，需要依赖高效的熵编码环节去除量化后特征图像中的冗余，进一步提高编码性能。本部分熵编码采用的为算术编码，能够无损的去除特征图像中的冗余。

S300.2通过双高斯模型，对熵编码进行熵估计。

其中，在端到端的图像压缩***中，熵编码的结果需要精确的码率估计，熵编码过程中利用潜在特征的先验概率模型进行符号概率估计。引入信息来对的分布进行估计。高斯混合模型具有更加强大的数据分布近似能力。通过增加高斯混合模型中高斯模型的数量，可以逼近任何连续的数据概率分布，本文使用双高斯模型进行熵估计，双高斯模型的分布函数如公式(4)所示：

其中，w_i代表不同高斯模型的权重，N(u_i,σ_i)代表高斯模型的分布参数，代表熵编码结果。

在本步骤中，首先对整型数据进行熵编码处理，得到熵编码结果，然后通过双高斯模型对熵编码结果进行熵估计，得到图像的损失值和码率。

S400.通过端到端联合训练，对图像的损失和码率，利用损失函数对其进行最优分配，得到最优压缩图像。

其中，对于端到端的编码，率-失真优化是对图像失真和压缩码率的联合调优，码率估计和图像失真的调优结果将直接影响整个端到端卷积神经网络图像压缩算法的优化效果。为了更好地优化图像的压缩性能，端到端卷积神经网络图像压缩算法的率-失真优化采用的损失函数如公式(5)所示：

其中，D表示失真，原始图像与重建图像的均方误差代表图像的失真程度；R表示码率；λ表示失真与码率的平衡系数；代表失真度；和代表与的码率；损失函数是由端到端卷积神经网络图像压缩算法的码率和原始图像与重建图像之间的损失值组成。端到端卷积神经网络图像压缩算法的码率估计如公式(6)和公式(7)所示。

进一步地，和代表与的分布。端到端卷积神经网络图像压缩算法训练过程中，不断调节图像的损失和码率的分配，使得图像损失和码率之间达到均衡，既保证图像的重建质量，又保证图像的压缩效率。

S500.通过解码器对最优压缩图像进行重建。

重建图像采用的是自解码器和超参解码器，自解码器采用和自编码器完全对称的结构，自解码器包含反卷积层、IGDN激活函数和LeakyReLU激活函数。IGDN激活函数的公式如(8)所示。

其中，θ＝{α,β,γ,ε}为该变换的相应参数

工作原理：如图3所示，自编码器得到的尺寸为320×4×4的特征向量输入自解码器，利用卷积核尺寸为5、步长为2、零填充为2的卷积层对输入图像进行反卷积操作，得到320个大小为8×8的特征图，IGDN激活函数和LeakyReLU激活函数连接两个卷积层，用于增加压缩网络各层之间的非线性关系。前三个卷积层和连接卷积层之间LeakyReLU激活函数构成了超参解码器，超参解码器之后为解码器。解码器采用和编码器对应的结构，将特征图像还原为尺寸为n×256×256的特征向量。利用GDAL库(Geospatial Data Abstraction Library)将n×256×256的特征向量还原成带有坐标信息的重建图像。图3中，Feature表示特征，Input表示输入，Output表示输出，ConvT表示反卷积，LeakyReLU表示LeakyReLU激活函数，IGDN表示IGDN激活函数。

将尺寸为256×256带有坐标信息的重建图像进行拼接与融合处理，将若干个256×256大小的图像拼接成一整张图像。

实施例2

如图4所示，无人机遥感图像的定量遥感应用，采用不同地物类型的识别，具体为：叶面积指数NDVI、水体指数NDWI。

叶面积指数NDVI是反映农作物长势和营养信息的重要参数之一，计算原理是近红外波段的反射值与红光波段的反射值之差比上两者之和，计算如公式(9)所示。

其中，NIR为近红外波段的反射值，R为红光波段的反射值。

水体指数NDWI是反映水体信息的重要参数之一，计算原理是绿波段的反射值与近红外波段的反射值之差比上两者之和，计算如公式 (10)所示。

其中，NIR为近红外波段的反射值，G为绿波段的反射值。

通过计算无人机遥感图像的叶面积指数NDVI、水体指数NDWI，对无人机遥感图进行定量遥感应用，完成不同地物类型的识别与分类。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。

本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处。综上所述，本说明书内容不应理解为对本发明的限制。

Claims

一种无人机定量遥感应用的数据压缩方法，其特征在于，包括：

S100.对无人机采集的多光谱图像进行预处理；

S200.通过编码器，依次对多光谱图像进行三维卷积和二维卷积，得到深层特征信息；

S300.对深层特征信息进行量化和熵编码；

S400.通过端到端联合训练，对图像的损失和码率进行最优分配，得到最优压缩图像；

S500.通过解码器对最优压缩图像进行重建。
根据权利要求1所述的一种无人机定量遥感应用的数据压缩方法，其特征在于，所述对无人机采集的多光谱图像进行预处理，具体包括：

S100.1采集目标地区的多光谱图像；

S100.2利用SIFT算子提取多光谱图像中的特征点，根据特征点信息，拼接成多光谱遥感图像；

S100.3对多光谱遥感图像进行辐射定标，将多光谱遥感图像的DN值转换为地表反射率；

S100.4剪裁多光谱遥感图像，得到256×256像素的多光谱图像。
根据权利要求1所述的一种无人机定量遥感应用的数据压缩方法，其特征在于，所述编码器包括自编码器和超参编码器，所述自编码器用于将N×256×256多光谱图像三维卷积成320×16×16的特征图像；所述超参编码器用于将320×16×16的特征图像二维卷积成320×4×4的特征图像。
根据权利要求3所述的一种无人机定量遥感应用的数据压缩方法，其特征在于，所述自编码器包括三维卷积层和GDN激活函数；所述三维卷积层采用步长为2的5×5的三维卷积核，所述GDN激活函数用于增加各三维卷积层之间的非线性关系。
根据权利要求4所述的一种无人机定量遥感应用的数据压缩方法，其特征在于，所述超参编码器包括二维卷积层和LeakyReLU激活函数；所述二维卷积层采用步长为2的5×5二维卷积核，所述LeakyReLU激活函数用于增加各二维卷积层之间的非线性关系。
根据权利要求5所述的一种无人机定量遥感应用的数据压缩方法，其特征在于，所述解码器包括自解码器和超参解码器，所述自解码器与所述自编码器互为对称结构，所述超参解码器和所述超参编码器互为对称结构。
根据权利要求1所述的一种无人机定量遥感应用的数据压缩方法，其特征在于，所述对深层特征信息进行量化和熵编码包括以下步骤：

S300.1将深层特征信息的浮点数据转化为整型；

S300.2通过双高斯模型，对熵编码进行熵估计。