CN115457101A

CN115457101A - 面向无人机平台的边缘保持多视图深度估计及测距方法

Info

Publication number: CN115457101A
Application number: CN202211408484.4A
Authority: CN
Inventors: 陶文兵; 苏婉娟; 刘李漫
Original assignee: Wuhan Tuke Intelligent Technology Co ltd
Current assignee: Hangzhou Tuke Intelligent Information Technology Co ltd
Priority date: 2022-11-10
Filing date: 2022-11-10
Publication date: 2022-12-09
Anticipated expiration: 2042-11-10
Also published as: CN115457101B

Abstract

本发明提供一种面向无人机平台的高效的边缘保持多视图深度估计及测距方法，以一幅参考图像和多幅邻域图像及其相机姿态作为输入，以“由粗到细”的方式准确地估计出参考图像的深度图。该方法包括：提出了一个层级边缘保持残差学习模块来校正双线性上采样中产生的误差和对多尺度深度估计网络估计的深度图进行优化，使网络能够得到边缘细节保持的深度图；提出一种交叉视图光度一致性损失来增强训练时细节区域的梯度流，可进一步提高深度估计的准确性；设计了一个轻量级的多视图深度估计级联网络框架，通过在相同分辨率下堆叠阶段可以在不增加很多额外显存和时间消耗的情况下尽可能多地进行深度假设采样，从而能够在高效地进行深度估计。

Description

面向无人机平台的边缘保持多视图深度估计及测距方法

技术领域

本发明涉及计算机视觉技术领域，尤其涉及一种面向无人机平台的边缘保持多视图深度估计及测距方法。

背景技术

面向无人机平台的多视图深度估计旨在从无人机获取的多视角图像中建立密集对应关系，从而恢复参考视角下图像的深度。无人机自主导航需要具备感知周围环境和定位能力，面向无人机平台的多视图深度估计能够为无人机提供三维场景感知与理解能力，为无人机实现自主避障和基于无人机的测距与三维地图重建提供技术支撑。近年来，深度学***滑特性，导致估计的深度图中在对象边缘处存在过度平滑的问题。

此外，得益于由粗到细（Coarse-to-Fine）架构能够较为高效地进行深度图估计，其被广泛地应用于基于学***衡，受限于无人机有限的机载硬件资源，现有的多视图深度估计算法难以在无人机平台上进行实际应用。因此，如何准确地恢复细节区域的深度来为无人机进行精准地测距提供支撑，以及如何在性能和效率间实现很好的平衡仍然是有待解决的关键问题。

发明内容

本发明针对现有技术中存在的技术问题，提供一种面向无人机平台的边缘保持多视图深度估计及测距方法，以解决现有的方法难以恢复薄结构和物体边缘区域的深度和难以在性能和效率间实现很好平衡的技术问题。

根据本发明的第一方面，提供了一种面向无人机平台的边缘保持多视图深度估计方法，包括：步骤1，给定一幅参考图像

及其N-1幅邻域图像

，利用权值共享的多尺度深度特征提取网络提取各幅图像的多尺度深度特征

，其中，

表示第s 个尺度，第s个尺度特征的大小为

，

为第s个尺度特征的通道数，

为原始输入图像的大小；

步骤2，确定所述多尺度深度特征提取网络第1个阶段估计的深度图

；

步骤3，基于所述深度图

确定所述多尺度深度特征提取网络第2个阶段估计的深度图

；

步骤4，采用层级边缘保持残差学习模块来对所述深度图

进行优化和上采样，得到优化后的深度图

；

步骤5，基于所述深度图

和第2个尺度下的图像深度特征

，依次进行第3 个阶段和第4个阶段的深度估计，得到第4个阶段估计的深度图

；

步骤6，采用层级边缘保持残差学习模块对所述深度图

进行优化和上采样，得到优化后的深度图

；

步骤7，基于优化后的深度图

和第3个尺度下的图像深度特征

，进行第5 个阶段的深度估计，得到深度图

。

在上述技术方案的基础上，本发明还可以作出如下改进。

可选的，所述多尺度特征提取网络为由具有跳跃式连接的一个编码器和一个解码器组成的二维U型网络；所述编码器和所述解码器由多个残差块组成。

可选的，所述步骤2中包括：

步骤201，在整个场景深度范围

内均匀采样

个深度假设值；

步骤202，通过可微单应变换，在每个深度假设下，将第i幅邻域视图的深度特征

投影变换至参考视图下，再利用组相关度量来构建两视图代价体

；

步骤203，对于第i个两视图代价体

，采用浅层3D CNN来估计可见性图

，并基于每幅领域视图的可见性图

，对所有的两视图代价体进行加权求和，得到最终聚合的代价体

；

步骤204，利用三维卷积神经网络对所述代价体

进行正则化，通过Softmax操作得到深度概率体，并基于该深度概率体，采用soft-argmax得到所述深度图

。

可选的，所述步骤3包括：

步骤301，根据所述深度图

确定第二阶段的深度假设采样范围

，并在该深度范围内进行均匀采样

个深度假设值；

步骤302，按照所述步骤201-步骤203的方法进行两视图代价体构造与聚合，在第1 个尺度下的图像深度特征

与

个深度假设值的基础上得到聚合的代价体

；

步骤303，按照所述步骤204的方法进行代价体正则化和深度图预测，基于代价体

得到所述深度图

。

可选的，所述步骤4包括：

步骤401，利用上下文编码网络提取参考图像的多尺度上下文特征

，其中，

表示第s个尺度，第s个尺度特征的大小为

；

步骤402，对所述深度图

进行归一化，利用一个浅层的2D CNN网络对归一化后的所述深度图

进行特征提取；

步骤403，将提取的深度图特征与图像的上下文特征

进行连接，并输入至边缘保持残差学习网络进行残差学习，得到残差图

；

步骤404，将经过归一化和上采样的所述深度图与所述残差图

进行相加，并将相加后的结果进行解归一化，得到优化后的所述深度图

。

可选的，所述步骤401中的所述上下文编码网络为一个二维U型网络，所述上下文编码网络包括：具有跳跃式连接的一个编码器和一个解码器；

所述步骤402中对所述深度图

归一化的公式为：

（1）

其中，

和

分别表示均值和方差计算；

所述步骤403中的所述边缘保持残差学习网络为由具有跳跃式连接的一个编码器和一个解码器组成的二维U型网络；所述编码器和所述解码器由多个残差块组成；

所述步骤404中，对所述归一化的深度图

采用双线性插值进行上采样并与所述残差图

进行相加，得到优化后的归一化深度图

，即

（2）

其中，

表示采用双线性插值将上

采样至原来的两倍；利用深度图

的均值和方差进行解归一化，得到优化后的深度图

：

（3）。

可选的，所述步骤5和步骤7中进行第3个阶段、第4个阶段和第5个阶段的深度估计的过程中：按照所述步骤301的方法确定深度范围；

按照所述步骤201-步骤203的方法进行两视图代价体构造与聚合；按照所述步骤204的方法进行代价体正则化和深度图预测。

可选的，所述步骤6包括：

步骤601，利用上下文编码网络提取参考图像的多尺度上下文特征

；

步骤602，对所述深度图

进行特征提取；

步骤603，将提取的深度图特征与图像的上下文特征

；

步骤604，将经过归一化和上采样的深度图与残差图进行相加，并将相加后的结果进行解归一化，得到优化后的所述深度图

。

可选的，所述多尺度深度特征提取网络网络的训练过程包括：

步骤801，采用交叉视图光度一致性损失与L1损失一起对多尺度深度估计网络进行监督，对于所述参考图像

中深度值为d的像素

，其在源视图中对应的像素

为

（4）

其中，

和

分别为参考视图和第i个邻域视图的相机内参，

、

为参考视图和第i个邻域视图之间的相对旋转和平移；通过可微分双线性插值得到第i个邻域视图在参考视图上基于深度图D合成的图像

，即

（5）

将变换过程中生成的二进制掩码

，用于标识合成图像

中的无效像素；

交叉视图光度一致性损失的计算公示为：

（6）

其中，分别表示根据真实深度和估计深度在第i个邻域视图的基础上合成的视图， N表示视图数，

表示合成图像和生成的GT深度图中的有效像素，其由

得到，

表示GT 深度映射中的有效像素；

步骤802，结合交叉视图光度一致性损失和L1损失得到多尺度深度估计分支部分的损失：

（7）

其中

为第s个阶段下损失函数的权重系数；

步骤803，层级边缘保持残差学习分支采用L1损失来进行监督，整个网络的总体损失为：

（8）

其中

为第s个阶段下损失函数的权重系数。

根据本发明的第二方面，提供一种面向无人机平台的测距方法，包括：基于本发明实施例提供的面向无人机平台的边缘保持多视图深度估计方法得到的所述深度图进行测距。

本发明提供的一种面向无人机平台的边缘保持多视图深度估计及测距方法，为了实现细节区域的精准估计，提出了一种层级边缘保持残差学***衡，设计了一个轻量级的多视图深度估计级联网络框架，并将其与上述提出的两种策略进行结合，从而能够在高效的情况下实现精准的深度估计，有利于在无人机平台上进行实际应用。

附图说明

图1为本发明提供的一种面向无人机平台的高效的边缘保持多视图深度估计及测距方法整体架构示意图。

具体实施方式

以下结合附图对本发明的原理和特征进行描述，所举实例只用于解释本发明，并非用于限定本发明的范围。

为了克服背景技术中的缺陷和问题，提出了层级边缘保持残差学习模块来对多尺度深度估计网络估计的深度图进行优化，使得网络能够进行边缘感知地深度图上采样。此外，提出一种交叉视图光度一致性损失，以加强细节区域在训练时的梯度流，从而实现更加精细地深度估计。同时，在此基础上，设计了一个轻量级的多视图深度估计级联网络框架，能够高效地进行深度估计。

为此，本发明提供了一种面向无人机平台的高效的边缘保持多视图深度估计及测距方法，图1为本发明提供的一种面向无人机平台的边缘保持多视图深度估计及测距方法的整体架构示意图，如图1所示，该边缘保持多视图深度估计方法包括：

步骤1，给定一幅参考图像

及其N-1幅邻域图像

，其中，

表示第s个尺度，第s个尺度特征的大小为

，

为第s个尺度特征的通道数，

为原始输入图像的大小。

步骤2，确定多尺度深度特征提取网络第1个阶段估计的深度图

。

步骤3，基于深度图

确定多尺度深度特征提取网络第2个阶段估计的深度图

。

步骤4，为了进行边缘保持的上采样，采用层级边缘保持残差学习模块来对深度图

进行优化和上采样，得到优化后的深度图

。

步骤5，基于深度图

和第2个尺度下的图像深度特征

，依次进行第3个阶段和第4个阶段的深度估计，得到第4个阶段估计的深度图

。

步骤6，采用层级边缘保持残差学习模块对深度图

进行优化和上采样，得到优化后的深度图

。

步骤7，基于优化后的深度图

和第3个尺度下的图像深度特征

，进行第5 个阶段的深度估计，得到最终的深度图

。

综上，整个多尺度深度估计网络分支总共有五个阶段，每个阶段的深度假设采样数分别为32、16、8、8和8，第2个阶段对应的深度采样范围衰减为前一阶段的一半，其余阶段衰减为前一阶段的四分之一。

本发明提供的一种面向无人机平台的高效的边缘保持多视图深度估计方法，以解决现有的方法难以恢复薄结构和物体边缘区域的深度和难以在性能和效率间实现很好平衡的技术问题。

实施例1

本发明提供的实施例1为本发明提供的一种面向无人机平台的边缘保持多视图深度估计方法的实施例，结合图1可知，该边缘保持多视图深度估计方法的实施例包括：

步骤1，给定一幅参考图像

及其N-1幅邻域图像

，其中，

表示第s个尺度，第s个尺度特征的大小为

，

为第s个尺度特征的通道数，

为原始输入图像的大小。

在一种可能的实施例方式中，多尺度特征提取网络是一个二维U型网络，其主要由具有跳跃式连接的一个编码器和一个解码器组成。此外，为了增强特征表示能力，编码器和解码器由多个残差块组成。

。

在一种可能的实施例方式中，对于第1个阶段，步骤2中包括：

步骤201，在整个场景深度范围

内均匀采样

个深度假设值。

可以理解的是，对于深度假设d，通过可微单应变换将所有邻域视图的深度特征

投影变换至参考视图下，得到变换后的特征

，可微单应变换计算过程如公式（1）所示。

（1）

其中，

和

分别表示参考视图的相机内参和外参，

和

分别表示第i幅邻域视图的相机内参和外参。

。

可以理解的是，基于组相关度量计算每幅邻域视角的投影变换深度特征与参考视角的深度特征的相似性。具体而言，对于参考图像的深度特征

和在深度值d下的第i幅邻域视图的投影变换特征

，沿着特征通道维度，将它们的特征均匀地分成G组。然后，

和

间第g组特征相似性计算为：

（2）

其中，

，

和

分别是

和

的第g组特征，

是内积操作。当计算完

和

间所有G组的特征相似性后，这些特征相似性将会成一个G通道的特征相似性图

。由于有

个深度假设值，参考图像和第i幅邻域视图之间的

个特征相似性图进一步构成大小为

的两视图代价体

。

步骤203，对于第i个两视图代价体

，采用浅层3D CNN来估计可见性图

，并基于每幅领域视图的可见性图

。

可以理解的是，为了得到第i幅邻域视图在参考视图下的可见性图

，对于每个两视图代价体，采用一层3D卷积-批正则化-ReLU激活函数-一层3D卷积-Sigmoid激活函数构成的浅层3D CNN进行可见性估计。在此基础上，利用每幅领域视图的可见性图

，对两视图代价体进行加权求和，得到最终聚合的代价体

，即

（3）

步骤204，利用三维卷积神经网络对代价体

进行正则化，通过Softmax操作得到深度概率体，并基于该深度概率体，采用soft-argmax得到深度图

。

可以理解的是，对于代价体

，利用三维卷积神经网络对代价体

进行正则化，该三维卷积神经网络由三维U型神经网络构成。之后，采用Softmax操作得到深度概率体，并基于soft-argmax回归出深度图，即通过对深度概率体和深度假设求期望得到最终的深度图

。

步骤3，基于深度图

确定所述多尺度深度特征提取网络第2个阶段估计的深度图

。

在一种可能的实施例方式中，对于第2个阶段，步骤3包括：

步骤301，根据深度图

确定第二阶段的深度假设采样范围

，并在该深度范围内进行均匀采样

个深度假设值。

可以理解的是，根据上一阶段估计的

确定该阶段的深度假设采样范围

，并在该深度范围内进行均匀采样

个深度假设值，其中

确定的采样范围为

。

步骤302，按照步骤201-步骤203的方法进行两视图代价体构造与聚合，在第1个尺度下的图像深度特征

与

个深度假设值的基础上得到聚合的代价体

。

可以理解的是，按照步骤2中的两视图代价体构造与聚合方法，在第1个尺度下的图像深度特征

与

个深度假设值的基础上得到聚合的代价体

。

步骤303，按照步骤204的方法进行代价体正则化和深度图预测，基于代价体

得到所述深度图

。

可以理解的是，按照步骤2中的代价体正则化和深度图预测方法，基于代价体

得到深度图

。

步骤4，采用层级边缘保持残差学习模块来对深度图

进行优化和上采样，得到优化后的深度图

。

在一种可能的实施例方式中，步骤4包括：

，其中，

表示第s个尺度，第s个尺度特征的大小为

。

可以理解的是，步骤401中的上下文编码网络结构与步骤1中多尺度特征提取网络结构类似，同样是由具有跳跃式连接的一个编码器和一个解码器组成的二维U型网络。

步骤402，对深度图

进行归一化，利用一个浅层的2D CNN网络对归一化后的深度图

进行特征提取。

可以理解的是，步骤402中对深度图

归一化的公式为：

（4）

其中，

和

分别表示均值和方差计算。

步骤403，将提取的深度图特征与图像的上下文特征

。

可以理解的是，步骤403中的边缘保持残差学习网络为由具有跳跃式连接的一个编码器和一个解码器组成的二维U型网络；编码器和解码器由多个残差块组成，以增强特征表示能力。

步骤404，将经过归一化和上采样的深度图与残差图

进行相加，并将相加后的结果进行解归一化，得到优化后的深度图

。

可以理解的是，步骤404中，对归一化的深度图

采用双线性插值进行上采样并与所述残差图

进行相加，得到优化后的归一化深度图

，即

（5）

其中，

表示采用双线性插值将上

采样至原来的两倍；在此基础上，利用深度图

的均值和方差进行解归一化，得到优化后的深度图

：

（6）

步骤5，基于深度图

和第2个尺度下的图像深度特征

。

步骤6，采用层级边缘保持残差学习模块对深度图

进行优化和上采样，得到优化后的深度图

。

在一种可能的实施例方式中，步骤6的方法与步骤4类似，具体可以包括：

。

步骤602，对深度图

进行归一化，利用一个浅层的2D CNN网络对归一化后的深度图

进行特征提取。

步骤603，将提取的深度图特征与图像的上下文特征

。

步骤604，将经过归一化和上采样的深度图与残差图进行相加，并将相加后的结果进行解归一化，得到优化后的深度图

。

步骤7，基于优化后的深度图

和第3个尺度下的图像深度特征

，进行第5 个阶段的深度估计，得到深度图

。

在一种可能的实施例方式中，步骤5和步骤7中进行第3个阶段、第4个阶段和第5个阶段的深度估计的过程中：按照步骤301的方法确定深度范围。

按照步骤201-步骤203的方法进行两视图代价体构造与聚合；按照步骤204的方法进行代价体正则化和深度图预测。

在一种可能的实施例方式中，

多尺度深度特征提取网络网络的训练过程包括：

步骤801，采用交叉视图光度一致性损失与L1损失一起对多尺度深度估计网络进行监督，交叉视图光度一致性的核心思想是通过基于深度的视图合成来将真实深度值与预测的深度值的差异转换为基于真实深度值合成的图像与基于预测的深度值合成的深度值的差异，以此来放大细节区域的梯度流。对于参考图像

中深度值为d的像素

，其在源视图中对应的像素

为：

（7）

其中，

和

分别为参考视图和第i个邻域视图的相机内参，

、

为参考视图和第i个邻域视图之间的相对旋转和平移；经过以上变换，可通过可微分双线性插值得到第 i个邻域视图在参考视图上基于深度图D合成的图像

，即

（8）

在此变换过程中会生成一个二进制掩码

，用于标识合成图像

中的无效像素，即投影到图像外部区域的像素。

交叉视图光度一致性损失的计算公示为：

（9）

表示合成图像和生成的GT深度图中的有效像素，其由

得到，

表示GT 深度映射中的有效像素。

（10）

其中

为第s个阶段下损失函数的权重系数，第1至第5个阶段的损失函数的权重系数可以分别设置为0.5、0.5、1、1和2。

步骤803，层级边缘保持残差学习分支则采用L1损失来进行监督，则整个网络的总体损失为：

（11）

其中

为第s个阶段下损失函数的权重系数，第2和第4个阶段的损失函数的权重系数可以分别设置为1和2。

实施例2

本发明提供的实施例2为本发明提供的一种面向无人机平台的测距方法的实施例，结合图1可知，该测距方法的实施例包括：基于本发明实施例提供的一种面向无人机平台的边缘保持多视图深度估计方法得到的深度图进行测距。

可以理解的是，本发明提供的一种面向无人机平台的测距方法与前述各实施例提供的面向无人机平台的边缘保持多视图深度估计方法相对应，面向无人机平台的测距方法的相关技术特征可参考面向无人机平台的边缘保持多视图深度估计方法的相关技术特征，在此不再赘述。

本发明实施例提供的一种面向无人机平台的边缘保持多视图深度估计及测距方法，对深度估计结果和效率有显著增益，增益主要来自以下三个方面：首先通过层级边缘保持残差学***台上进行实际应用。

需要说明的是，在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详细描述的部分，可以参见其它实施例的相关描述。

本领域内的技术人员应明白，本发明的实施例可提供为方法、***、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质（包括但不限于磁盘存储器、CD-ROM、光学存储器等）上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备（***）、和计算机程序产品的流程图和/或方框图来描述。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式计算机或者其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明的优选实施例，但本领域内的技术人员一旦得知了基本创造概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包括这些改动和变型在内。

Claims

1.一种面向无人机平台的边缘保持多视图深度估计方法，其特征在于，所述边缘保持多视图深度估计方法包括：

步骤1，给定一幅参考图像

及其N-1幅邻域图像

，其中，

表示第s个尺度，第 s个尺度特征的大小为

，

为第s个尺度特征的通道数，

为原始输入图像的大小；

；

步骤3，基于所述深度图

确定所述多尺度深度特征提取网络第2个阶段估计的深度图

；

步骤4，采用层级边缘保持残差学习模块来对所述深度图

进行优化和上采样，得到优化后的深度图

；

步骤5，基于所述深度图

和第2个尺度下的图像深度特征

；

步骤6，采用层级边缘保持残差学习模块对所述深度图

进行优化和上采样，得到优化后的深度图

；

步骤7，基于优化后的深度图

和第3个尺度下的图像深度特征

，进行第5个阶段的深度估计，得到深度图

。

2.根据权利要求1所述的边缘保持多视图深度估计方法，其特征在于，所述多尺度特征提取网络为由具有跳跃式连接的一个编码器和一个解码器组成的二维U型网络；所述编码器和所述解码器由多个残差块组成。

3.根据权利要求1所述的边缘保持多视图深度估计方法，其特征在于，所述步骤2中包括：

步骤201，在整个场景深度范围

内均匀采样

个深度假设值；

；

步骤203，对于第i个两视图代价体

，采用浅层3D CNN来估计可见性图

，并基于每幅领域视图的可见性图

；

步骤204，利用三维卷积神经网络对所述代价体

。

4.根据权利要求3所述的边缘保持多视图深度估计方法，其特征在于，所述步骤3包括：

步骤301，根据所述深度图

确定第二阶段的深度假设采样范围

，并在该深度范围内进行均匀采样

个深度假设值；

步骤302，按照所述步骤201-步骤203的方法进行两视图代价体构造与聚合，在第1个尺度下的图像深度特征

与

个深度假设值的基础上得到聚合的代价体

；

得到所述深度图

。

5.根据权利要求1所述的边缘保持多视图深度估计方法，其特征在于，所述步骤4包括：

，其中，

表示第s个尺度，第s个尺度特征的大小为

；

步骤402，对所述深度图

进行特征提取；

步骤403，将提取的深度图特征与图像的上下文特征

；

步骤404，将经过归一化和上采样的所述深度图与所述残差图

。

6.根据权利要求5所述的边缘保持多视图深度估计方法，其特征在于，

所述步骤401中的所述上下文编码网络为一个二维U型网络，所述上下文编码网络包括：具有跳跃式连接的一个编码器和一个解码器；

所述步骤402中对所述深度图

归一化的公式为：

（1）

其中，

和

分别表示均值和方差计算；

所述步骤404中，对所述归一化的深度图

采用双线性插值进行上采样并与所述残差图

进行相加，得到优化后的归一化深度图

，即

（2）

其中，

表示采用双线性插值将上

采样至原来的两倍；

利用深度图

的均值和方差进行解归一化，得到优化后的深度图

：

（3）。

7.根据权利要求5所述的边缘保持多视图深度估计方法，其特征在于，所述步骤5和步骤7中进行第3个阶段、第4个阶段和第5个阶段的深度估计的过程中：按照所述步骤301的方法确定深度范围；

8.根据权利要求5所述的边缘保持多视图深度估计方法，其特征在于，所述步骤6包括：

；

步骤602，对所述深度图

进行特征提取；

步骤603，将提取的深度图特征与图像的上下文特征

；

。

9.根据权利要求1所述的边缘保持多视图深度估计方法，其特征在于，所述多尺度深度特征提取网络网络的训练过程包括：

中深度值为d的像素

，其在源视图中对应的像素

为

（4）

其中，

和

分别为参考视图和第i个邻域视图的相机内参，

、

为参考视图和第i 个邻域视图之间的相对旋转和平移；通过可微分双线性插值得到第i个邻域视图在参考视图上基于深度图D合成的图像

，即

（5）

将变换过程中生成的二进制掩码

，用于标识合成图像

中的无效像素；

交叉视图光度一致性损失的计算公示为：

（6）

其中，分别表示根据真实深度和估计深度在第i个邻域视图的基础上合成的视图，N表示视图数，

表示合成图像和生成的GT深度图中的有效像素，其由

得到，

表示GT深度映射中的有效像素；

（7）

其中

为第s个阶段下损失函数的权重系数；

（8）

其中

为第s个阶段下损失函数的权重系数。

10.一种面向无人机平台的测距方法，其特征在于，所述测距方法包括：基于权利要求1-9任一项所述的面向无人机平台的边缘保持多视图深度估计方法得到的所述深度图进行测距。