CN112862959A

CN112862959A - 基于语义先验的实时概率单目稠密重建方法及***

Info

Publication number: CN112862959A
Application number: CN202110309748.XA
Authority: CN
Inventors: 季向阳; 娄志强; 邸研
Original assignee: Tsinghua University
Current assignee: Tsinghua University
Priority date: 2021-03-23
Filing date: 2021-03-23
Publication date: 2021-05-28
Anticipated expiration: 2041-03-23
Also published as: CN112862959B

Abstract

本发明公开了一种基于语义先验的实时概率单目稠密重建方法及***，所述方法包括以下步骤：S1，定义一帧图像I_t，根据关键帧I_k对应的概率加权深度图D_k以及两帧之间的相对位姿

计算I_t对应的深度图D_t；S2，得到I_t对应的深度图D_t后，采用SGM法得到关键帧I_k的本地深度观测参数；S3，对本地深度观测参数进行本地初始化处理；S4，利用更新的本地初始化结果时序更新I_k的概率模型，然后再利用空间上概率加权更新深度图D_k；S5，当I_t转化为关键帧时，根据关键帧I_k的概率模型传播到I_t上以持续利用时序信息。根据本发明的基于语义先验的实时概率单目稠密重建方法，能够更好地提高稠密重建质量。

Description

基于语义先验的实时概率单目稠密重建方法及***

技术领域

本发明涉及三维视觉技术领域，尤其是涉及一种基于语义先验的实时概率单目稠密重建方法及***。

背景技术

如今，智能交通与自动驾驶发展迅速，车辆在行驶过程中需要有感知周围环境三维结构的能力，雷达虽然可以完成这一任务，但是它成本高昂且难以利用场景的语义信息，相机成本低廉且能捕捉到丰富的颜色以及结构等信息，因此在动态场景中如何利用图像完成稠密重建已经成为目前的研究热点。视觉稠密重建技术能输出图像中绝大部像素的深度，恢复图像损失的三维场景信息，可以广泛运用于机器人导航、路径规划以及三维物体检测等任务中。

但是在稠密重建中，目前还存在许多棘手的问题，如有限的计算资源、多变的场景深度范围以语义信息的合理引入等。在现有技术中，通常采用传统的SFM(Structure fromMotion运动恢复结构)方法、基于滤波的方法和基于CNN(Convolutional Neural Network卷积神经网络)的方法。

传统的SFM方法基于优化来重建稠密深度，有巨大的计算成本，难以达到实时稠密重建的要求；基于滤波的方法虽然能高效求解深度，但是它们难以引入多样的语义信息，并且绝大多数基于滤波的方法对单个像素的深度建模，建模时没有考虑像素间的深度关系，未考虑空间结构信息，这进一步降低稠密重建结果的准确度；基于CNN的方法需要数据集来训练，有监督方法的则还需要真实深度图，这一条件更加苛刻，而现实场景又是复杂多样的，因而目前这类方法都有很强的数据依赖性，在完全不同的场景下有时甚至难以输出合理的结果。因此，上述技术存在改进的空间。

发明内容

本发明旨在至少解决现有技术中存在的技术问题之一。为此，本发明的一个目的在于提出一种基于语义先验的实时概率单目稠密重建方法，所述基于语义先验的实时概率单目稠密重建方法，能够更好地提高稠密重建质量。

本发明还提出了一种采用了上述基于语义先验的实时概率单目稠密重建方法的***。

根据本发明实施例的基于语义先验的实时概率单目稠密重建方法，包括以下步骤：

S1，定义一帧图像I_t，根据关键帧I_k对应的概率加权深度图D_k以及两帧之间的相对位姿

计算I_t对应的深度图D_t；

S2，得到I_t对应的深度图D_t后，采用SGM法得到关键帧I_k的本地深度观测参数；

S3，对本地深度观测参数进行本地初始化处理；

S4，利用更新的本地初始化结果时序更新k_k的概率模型，然后再利用空间上概率加权更新深度图D_k；

S5，当I_t转化为关键帧时，根据关键帧I_k的概率模型传播到I_t上以持续利用时序信息。

根据本发明的基于语义先验的实时概率单目稠密重建方法，能够更好地提高稠密重建质量。

根据本发明一个实施例的基于语义先验的实时概率单目稠密重建方法，关键帧I_k对应有像素u_k，即：

其中，K为相机内参矩阵，u_t为I_t上对应的u_k像素坐标，D(u)表示像素u的深度。

根据本发明一个实施例的基于语义先验的实时概率单目稠密重建方法，在SGM法中的损失函数L_c引入语义稀疏函数，即：

L_M＝α(S(p₁)，S(p₂))L_c

其中，p₁与p₂为两帧上的对应匹配点，S(p)表示像素p的语义，β为预设参数，且β＞1。

根据本发明一个实施例的基于语义先验的实时概率单目稠密重建方法，对本地深度观测参数进行本地初始化处理包括：像素深度概率模型初始化处理和区域平面概率模型初始化处理。

根据本发明一个实施例的基于语义先验的实时概率单目稠密重建方法，像素深度概率模型的本地深度

的概率密度函数为：

其中，π表示u为内点的概率，

分别是高斯分布

的均值与方差，z_l，z_r分别是均匀分布

的左右边界。

根据本发明一个实施例的基于语义先验的实时概率单目稠密重建方法，在选取合适的先验概率分布后，关于π_u，z_u的后验概率分布为高斯分布和贝塔分布的乘积，即：

其中a_u，b_u为贝塔分布

的参数，μ_u，σ_u为高斯分布

的参数。

根据本发明一个实施例的基于语义先验的实时概率单目稠密重建方法，区域平面概率模型采用vMF分布进行建模，即：

其中x_n是一个随机的三维单位向量，μ为该分布的平均单位向量，k_n为集中参数。

根据本发明一个实施例的基于语义先验的实时概率单目稠密重建方法，像素深度概率模型和区域平面概率模型通过软关联方式关联，即像素p属于区域R_k的概率为：

P_k(p)＝P_color(I(p)，I(p_k))P_distance(p，p_c)

其中P_color，P_distance，P_semantic和P_depth分别表示颜色、像素距离、语义以及深度概率，p_k表示区域R_k的中心点，S(p)和I(p)分别表示像素p的语义和颜色，d_p表示像素p的后验深度估计值，

表示利用区域R_k的后验平面参数估计值计算得到的像素p深度。

根据本发明一个实施例的基于语义先验的实时概率单目稠密重建方法，当I_t为转化为关键帧时，根据z个关键帧与I_t之间的相对位姿，通过语义SGM得到关键帧I_t的初始本地深度观测参数；当I_t未为转化为关键帧时，根据I_t与关键帧k_k之间的相对位姿，通过语义SGM输出关键帧I_k的本地深度观测参数。

根据本发明的第二方面的基于语义先验的实时概率单目稠密重建***，采用了如第一方面任一种所述的基于语义先验的实时概率单目稠密重建方法。所述***与上述的基于语义先验的实时概率单目稠密重建方法相对于现有技术所具有的优势相同，在此不再赘述。

本发明的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解，其中：

图1是根据本发明实施例的基于语义先验的实时概率单目稠密重建方法的流程图一图；

图2是根据本发明实施例的基于语义先验的实时概率单目稠密重建方法的流程图二图。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能理解为对本发明的限制。

在本发明的描述中，需要理解的是，术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”、“顺时针”、“逆时针”、“轴向”、“径向”、“周向”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。

下面参考图1和图2描述根据本发明实施例的基于语义先验的实时概率单目稠密重建方法。如图1所示，根据本发明实施例的根据本发明实施例的基于语义先验的实时概率单目稠密重建方法，包括以下步骤：

计算I_t对应的深度图D_t；

S2，得到I_t对应的深度图D_t后，采用SGM法(Semi Global Matching半全局匹配)得到关键帧k_k的本地深度观测参数；

S3，对本地深度观测参数进行本地初始化处理；

S4，利用更新的本地初始化结果时序更新I_k的概率模型，然后再利用空间上概率加权更新深度图D_k，这样有利于不断优化关键帧深度，提升关键帧的准确性；

根据本发明一个实施例的基于语义先验的实时概率单目稠密重建方法，关键帧k_k对应有像素u_k，即：

需要说明的是，得到I_t大部分像素的深度，然后使用导向滤波作为后处理去填补空洞并平滑深度图，最后输出I_t的深度图D_t。

L_M＝α(S(p₁)，S(p₂))L_c

进一步地，针对像素深度概率模型，直接用深度图D_k上每个像素的深度作为本地观测，当D_k上某个像素深度不存在或者不在合理深度范围内时，认为本次观测为外点，用均匀分布拟合，反之使用高斯分布和均匀分布拟合。

进一步地，针对区域平面概率模型，无法从D_k直接得到区域平面参数的本地观测，可以对I_k上的某个区域

其中心为

为

一定半径范围的邻域。进一步地，通过计算

内每个像素属于该区域的概率P_i(p)，当P_i(p)大于预设阈值T₂且像素p存在本地深度观测时，将p纳入区域

的可信点集

进一步地，随机在

中选取三个不同的点，依据这三个点可以算出

的平面法向量以及中心点深度，进一步地，重复这一过程，就能得到一组中心点深度观测

以及对应的一组平面法向量观测

进一步地，得到C_d与C_v后，若C_d与C_v包含观测数量过少，则认定本区域的本次观测时外点，这样可以直接使用均匀分布建模。进一步地，当数量足够时，可以采用EM算法初始化本地观测的概率模型，例如，在一个具体的实施例中，以计算法向量概率模型参数的EM算法来做具体说明，在期望计算步骤，我们计算每个观测的内点概率，即

进一步地，在最大化步骤，可以更新参数，即

μ←μ/||μ||₂

这样迭代数次直至最大迭代次数或收敛，若最后内点概率π小于阈值T_π，则认为是外点，依然使用均匀分布去拟合。

的概率密度函数为：

其中，π表示u为内点的概率，

分别是高斯分布

的均值与方差，z_l，z_r分别是均匀分布

的左右边界。

其中a_u，b_u为贝塔分布

的参数，μ_u，σ_u为高斯分布

的参数。

进一步地，当得到一个关于μ的更新的深度观测后，更新的后验概率形式为：

具体地，使用矩匹配方法可以将这一形式转换为q(π_u，d_u|a′_u，b′_u，μ′_u，σ′_u)，即完成了更新的观测信息的融合与后验概率的参数更新，同时依然保持了高斯分布和贝塔分布的形式。

进一步地，vMF分布的均值为：

其中I_j(·)表示第一类修正贝塞尔曲线，D表示x_n维数。

P_k(p)＝P_color(I(p)，I(p_k))P_distance(p，p_c)

进一步地，P_k(p)中的每个概率分量都具有统一的形式，即

P_*(a，b)＝k₁ exp(-k₂ L(a，b))

其中k₁和k₂为每个概率分量对应的权重参数。

进一步地，对于语义概率分量P_semantic，分量公式为：

进一步地，对于其他概率分量，分量公式为：

L(a，b)＝||a-b||₂。

进一步地，对于单个像素p，可以属于多个区域{R_i|i∈{1，2，…，m}}，进一步地，对每个区域可以分布计算概率P_i(p)，这样根据每个区域的后验平面参数可以得到一个像素p的深度d_i(p)，则像素p最终的深度计算公式为：

其中，

为示性函数，公式为：

根据本发明一个实施例的基于语义先验的实时概率单目稠密重建方法，当I_t为转化为关键帧时，根据z个关键帧与I_t之间的相对位姿，通过语义SGM得到关键帧I_t的初始本地深度观测参数；当I_t未为转化为关键帧时，根据I_t与关键帧I_x之间的相对位姿，通过语义SGM输出关键帧k_k的本地深度观测参数。

综上所述，根据本发明的基于语义先验的实时概率单目稠密重建方法，能够更好地提高稠密重建质量。

本发明还提供了一种基于语义先验的实时概率单目稠密重建***，该***包括上述的基于语义先验的实时概率单目稠密重建方法，从而具有稠密重建质量更高等优点。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示意性实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管已经示出和描述了本发明的实施例，本领域的普通技术人员可以理解：在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由权利要求及其等同物限定。

Claims

1.一种基于语义先验的实时概率单目稠密重建方法，其特征在于，包括以下步骤：

计算I_t对应的深度图D_t；

S3，对本地深度观测参数进行本地初始化处理；

S4，利用更新的本地初始化结果时序更新I_k的概率模型，然后再利用空间上概率加权更新深度图D_k；

2.根据权利要求1所述的基于语义先验的实时概率单目稠密重建方法，其特征在于，关键帧I_k对应有像素u_k，即：

3.根据权利要求2所述的基于语义先验的实时概率单目稠密重建方法，其特征在于，在SGM法中的损失函数L_c引入语义稀疏函数，即：

L_M＝α(S(p₁)，S(p₂))L_c

4.根据权利要求3所述的基于语义先验的实时概率单目稠密重建方法，其特征在于，对本地深度观测参数进行本地初始化处理包括：像素深度概率模型初始化处理和区域平面概率模型初始化处理。

5.根据权利要求4所述的基于语义先验的实时概率单目稠密重建方法，其特征在于，像素深度概率模型的本地深度

的概率密度函数为：

其中，π表示u为内点的概率，

分别是高斯分布

的均值与方差，z_l，z_r分别是均匀分布

的左右边界。

6.根据权利要求5所述的基于语义先验的实时概率单目稠密重建方法，其特征在于，在选取合适的先验概率分布后，关于π_u，z_u的后验概率分布为高斯分布和贝塔分布的乘积，即：

其中a_u，b_u为贝塔分布

的参数，μ_u，σ_u为高斯分布

的参数。

7.根据权利要求4所述的基于语义先验的实时概率单目稠密重建方法，其特征在于，区域平面概率模型采用vMF分布进行建模，即：

8.根据权利要求4所述的基于语义先验的实时概率单目稠密重建方法，其特征在于，像素深度概率模型和区域平面概率模型通过软关联方式关联，即像素p属于区域R_k的概率为：

P_k(p)＝P_color(I(p)，I(p_k))P_distance(p，p_c)

9.根据权利要求1所述的基于语义先验的实时概率单目稠密重建方法，其特征在于，当I_t为转化为关键帧时，根据z个关键帧与I_t之间的相对位姿，通过语义SGM得到关键帧I_t的初始本地深度观测参数；当I_t未为转化为关键帧时，根据I_t与关键帧I_k之间的相对位姿，通过语义SGM输出关键帧I_k的本地深度观测参数。

10.一种基于语义先验的实时概率单目稠密重建***，其特征在于，采用了根据权利要求1-9中任一项所述的基于语义先验的实时概率单目稠密重建方法。