WO2019076304A1

WO2019076304A1 - 基于双目相机的无人机视觉slam方法、无人机及存储介质

Info

Publication number: WO2019076304A1
Application number: PCT/CN2018/110495
Authority: WO
Inventors: 胡华智; 刘剑; 孙海洋
Original assignee: 亿航智能设备（广州）有限公司
Priority date: 2017-10-16
Filing date: 2018-10-16
Publication date: 2019-04-25
Also published as: CN107808407B; CN107808407A

Abstract

本发明公开了一种基于双目相机的无人机视觉SLAM方法、无人机及计算机可读存储介质，所述方法包括步骤：通过双目摄像头获取至少两个不同位置的深度图像；根据获取的至少两个不同位置的深度图像，通过视觉里程计得到相机位姿信息；对所述相机位姿信息进行非线性优化、基于外观的回环检测以及回环验证，得到优化后的相机位姿信息；根据优化后的相机位姿信息进行双目稠密建图得到全局地图。本发明通过双目摄像头获取不同位置的深度图像，在经过视觉里程计、非线性优化、回环检测以及回环验证之后，进行双目稠密建图得到全局地图；一方面可解决采用RGB-D相机存在的干扰问题，另一方面可以获得更精准的定位和建立了更精确的地图。

Description

基于双目相机的无人机视觉SLAM方法、无人机及存储介质

技术领域

本发明涉及无人机技术领域，尤其涉及一种基于双目相机的无人机视觉SLAM方法、无人机及计算机可读存储介质。

背景技术

无人机是一种能够通过无线遥控或程序来操纵的无人驾驶飞行器。近年来，无人机在军事及民用等诸多领域的应用引起了人们的广泛关注。比如，在军事上能够进行侦查、监测及小范围内的攻击等；在民用上，可用于航拍、测绘、遥感、农药喷洒、高压输电线路的巡线及地震抢险等。四旋翼无人机作为小型无人机的一种，具有机动性强、结构设计简单、安全性高等突出优点，且其能够近距离靠近目标，更加适合室内等复杂环境中的飞行作业。

基于视觉SLAM(Simultaneous Localization and Mapping，同步定位与建图)的方法仅使用机载摄像头作为外部传感器，具有体积小、重量轻、价格低、精度高、应用范围广等优势。现有技术通常采用RGB-D相机实现，RGB-D相机由于使用的是发射光波、接收返回的方式测量深度，在室外场景使用的时候很容易受到日光的干扰，而且多个相机同时使用也会互相干扰。

技术问题

发明的主要目的在于提出一种基于双目相机的无人机视觉SLAM方法、无人机及计算机可读存储介质，旨在解决现有技术存在的问题。

技术解决方案

为实现上述目的，本发明实施例第一方面提供一种基于双目相机的无人机视觉SLAM方法，所述方法包括步骤：

通过双目摄像头获取至少两个不同位置的深度图像；

根据获取的至少两个不同位置的深度图像，通过视觉里程计得到相机位姿信息；

对所述相机位姿信息进行非线性优化、基于外观的回环检测以及回环验证，得到优化后的相机位姿信息；

根据优化后的相机位姿信息进行双目稠密建图得到全局地图。

可选的，所述根据所述不同位置的深度图像，通过视觉里程计得到相机位姿信息包括步骤：

对所述不同位置的深度图像进行图像特征匹配，得到相匹配的特征点；

根据相匹配的特征点，采用透视三点P3P算法计算得到所述相机位姿信息。

可选的，所述图像特征匹配采用尺度不变特征转换SIFT算法或者ORB算法。

可选的，所述非线性优化采用光束平差法BA算法和或图优化算法实现。

可选的，所述基于外观的回环检测通过构建的词袋模型或者训练的神经网络实现。

可选的，所述回环验证包括时间一致性检测和空间一致性检测。

可选的，所述根据优化后的相机位姿信息进行双目稠密建图得到全局地图包括步骤：

对优化后的相机位姿信息进行极线搜索和块匹配，得到像素点的位置信息；

根据得到的像素点的位置信息，采用双目立体视觉方法得到像素点的深度信息，并对得到的像素点的深度信息进行滤波；

根据滤波后的像素点的深度信息构建全局地图。

可选的，采用八叉树地图octomap方法构建全局地图。

此外，为实现上述目的，本发明实施例第二方面提供一种无人机，所述无人机包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于双目相机的无人机视觉SLAM程序，所述基于双目相机的无人机视觉SLAM程序被所述处理器执行时实现第一方面所述的基于双目相机的无人机视觉SLAM方法的步骤。

再者，为实现上述目的，本发明实施例第三方面提供一种计算机可读存储介质，所述计算机可读存储介质上存储有基于双目相机的无人机视觉SLAM程序，所述基于双目相机的无人机视觉SLAM程序被处理器执行时实现第一方面所述的基于双目相机的无人机视觉SLAM方法的步骤。

有益效果

本发明实施例提供的基于双目相机的无人机视觉SLAM方法、无人机及计算机可读存储介质，通过双目摄像头获取不同位置的深度图像，在经过视觉里程计、非线性优化、回环检测以及回环验证之后，进行双目稠密建图得到全局地图；一方面可解决采用RGB-D相机存在的干扰问题，另一方面可以获得更精准的定位和建立了更精确的地图。

附图说明

图1为本发明实施例的基于双目相机的无人机视觉SLAM方法流程示意图；

图2为本发明实施例的基于双目相机的无人机视觉SLAM方法中相机位姿计算流程示意图；

图3为本发明实施例的基于双目相机的无人机视觉SLAM方法中全局地图构建流程示意图；

图4为本发明实施例的无人机结构示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

本发明的实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

现在将参考附图描述实现本发明各个实施例的。在后续的描述中，使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明，其本身并没有特定的意义。

还应当进一步理解，在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

第一实施例

如图1所示，本发明第一实施例提供一种基于双目相机的无人机视觉SLAM方法，所述方法包括步骤：

S11、通过双目摄像头获取至少两个不同位置的深度图像。

在本实施例中，通过双目摄像头可分别得到左右目图像，使用立体视觉技术，通过左右目视差计算像素的距离得到深度图像，该深度图像包含所有像素点的三维世界坐标信息。

S12、根据获取的至少两个不同位置的深度图像，通过视觉里程计得到相机位姿信息。

请参考图2所示，在本实施例中，所述根据所述不同位置的深度图像，通过视觉里程计得到相机位姿信息包括步骤：

S121、对所述不同位置的深度图像进行图像特征匹配，得到相匹配的特征点；

在本实施例中，所述图像特征匹配采用SIFT（Scale Invariant Feature Transform，尺度不变特征转换）算法或者ORB（Oriented FAST and Rotated BRIEF）算法。

Sift是一个很好的图像匹配算法，可同时能处理亮度、平移、旋转、尺度的变化，利用特征点来提取特征描述符，最后在特征描述符之间寻找匹配。

在一种实施方式中，该算法可通过以下步骤进行匹配：构建尺度空间，检测极值点，获得尺度不变性；特征点过滤并进行精确定位，剔除不稳定的特征点；在特征点处提取特征描述符，为特征点分配方向值；生成特征描述子，利用特征描述符寻找匹配点；计算变换参数。

ORB是一种快速特征点提取和描述的算法。ORB算法分为两部分，分别是特征点提取和特征点描述。特征提取是由FAST（Features from Accelerated Segment Test）算法发展来的，特征点描述是根据BRIEF（Binary Robust Independent Elementary Features）特征描述算法改进的。ORB特征是将FAST特征点的检测方法与BRIEF特征描述子结合起来，并在它们原来的基础上做了改进与优化。

S122、根据相匹配的特征点，采用P3P（Perspective Three Point，透视三点）算法计算得到所述相机位姿信息。

在本实施例中，P3P问题是计算机视觉与摄影测量学领域的经典问题，在目标定位、视觉测量、虚拟现实及目标姿态计算等方面有重要的应用。P3P算法可参考现有技术，在此不作赘述。

S13、对所述相机位姿信息进行非线性优化、基于外观的回环检测以及回环验证，得到优化后的相机位姿信息。

在本实施例中，所述非线性优化采用BA（Bundle Adjustment，光束平差法）算法和或图优化算法实现。

作为示例地，对于特征点数量不多的小型场景例如房间、室内，可采用Bundle Adjustment算法进行精确的相机位姿非线性优化。而对于特征点数量较多的大型场景，例如室外、复杂的环境，为了提高计算的效率、保证实时性，可采用图优化算法来进行精确的相机位姿非线性优化。

BA算法可分为全局BA算法和局部BA算法。BA是一种优化问题算法，通过最小化观测图像和预测图像的对应点之间的位置投影误差而同时得到摄像机相关参数（摄像机参数矩阵、标定参数等）和空间结构的最优解。它的名字来源于将空间三维点投影到成像平面过程中，所有三维点与成像面二维点的连线都聚焦于一点，即光心。

BA算法有几个要素：目标函数，数值优化方法（如牛顿法），迭代与更新的方法，质量检验。总的来说，目标函数通常是一系列平方和，然后采用最小二乘法进行优化。

图优化算法可参考现有技术，在此不作赘述。

在本实施例中，所述基于外观的回环检测通过构建的词袋模型或者训练的神经网络实现。

现有技术中，存在以下两种不同的回环检测方法，一种是在获取的关键帧中随机选取n个关键帧与当前新的关键帧进行特征匹配比较；另一种是在获取的关键帧中选取前n个帧与当前帧做特征匹配比较。这两种方法其实效率会比较低，第一种方法虽然运算量是恒定的，但由于基于盲目试探的方法，随着帧数增加，检测到正确的回环的概率会越来越低；第二种方法则基于“任意两幅图都可能有回环”的假定，运算量随着n增加会平方倍增加。

基于上述问题，本实施例采用基于外观的回环检测，通过构建词袋模型，直接计算两幅图像之间的相似性，用这种方法能够略过特征匹配的大运算量，同时随着帧数增加，检测到回环的概率不会下降。另一种方法是通过训练的神经网络实现。

在本实施例中，所述回环验证包括时间一致性检测和空间一致性检测。时间一致性检测，即在一段时间中一直检测到的回环，才认为是正确的回环；空间一致性检测，即对回环检测到的两个帧进行特征匹配，估计摄像头的运动，检查与之前的估计是否有很大差别。

S14、根据优化后的相机位姿信息进行双目稠密建图得到全局地图。

请参考图3所示，在本实施例中，所述根据优化后的相机位姿信息进行双目稠密建图得到全局地图包括步骤：

S141、对优化后的相机位姿信息进行极线搜索和块匹配，得到像素点的位置信息；

S142、根据得到的像素点的位置信息，采用双目立体视觉方法得到像素点的深度信息，并对得到的像素点的深度信息进行滤波；

S143、根据滤波后的像素点的深度信息构建全局地图。

在本实施例中，采用八叉树地图octomap方法构建全局地图。octomap方法可参考现有技术，在此不作赘述。

本发明实施例提供的基于双目相机的无人机视觉SLAM方法，通过双目摄像头获取不同位置的深度图像，在经过视觉里程计、非线性优化、回环检测以及回环验证之后，进行双目稠密建图得到全局地图；一方面可解决采用RGB-D相机存在的干扰问题，另一方面可以获得更精准的定位和建立了更精确的地图。

第二实施例

参照图4，图4为本发明第二实施例提供的一种无人机，所述无人机20包括：存储器21、处理器22及存储在所述存储器21上并可在所述处理器22上运行的基于双目相机的无人机视觉SLAM程序，所述基于双目相机的无人机视觉SLAM程序被所述处理器22执行时，用于实现以下所述的基于双目相机的无人机视觉SLAM方法的步骤：

S11、通过双目摄像头获取至少两个不同位置的深度图像；

S12、根据获取的至少两个不同位置的深度图像，通过视觉里程计得到相机位姿信息；

S13、对所述相机位姿信息进行非线性优化、基于外观的回环检测以及回环验证，得到优化后的相机位姿信息；

所述基于双目相机的无人机视觉SLAM程序被所述处理器22执行时，还用于实现以下所述的基于双目相机的无人机视觉SLAM方法的步骤：

S122、根据相匹配的特征点，采用透视三点P3P算法计算得到所述相机位姿信息。

所述图像特征匹配采用尺度不变特征转换SIFT算法或者ORB算法。

所述非线性优化采用Bundle Adjustment算法和或图优化算法实现。

所述基于外观的回环检测通过构建的词袋模型或者训练的神经网络实现。

所述回环验证包括时间一致性检测和空间一致性检测。

S143、根据滤波后的像素点的深度信息构建全局地图。

采用八叉树地图octomap方法构建全局地图。

本发明实施例提供的无人机，通过双目摄像头获取不同位置的深度图像，在经过视觉里程计、非线性优化、回环检测以及回环验证之后，进行双目稠密建图得到全局地图；一方面可解决采用RGB-D相机存在的干扰问题，另一方面可以获得更精准的定位和建立了更精确的地图。

第三实施例

本发明第三实施例提供一种计算机可读存储介质，所述计算机可读存储介质上存储有基于双目相机的无人机视觉SLAM程序，所述基于双目相机的无人机视觉SLAM程序被处理器执行时实现第一实施例所述的基于双目相机的无人机视觉SLAM方法的步骤。

本发明实施例提供的计算机可读存储介质，通过双目摄像头获取不同位置的深度图像，在经过视觉里程计、非线性优化、回环检测以及回环验证之后，进行双目稠密建图得到全局地图；一方面可解决采用RGB-D相机存在的干扰问题，另一方面可以获得更精准的定位和建立了更精确的地图。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

工业实用性

本发明实施例提供的基于双目相机的无人机视觉SLAM方法、无人机及计算机可读存储介质，通过双目摄像头获取不同位置的深度图像，在经过视觉里程计、非线性优化、回环检测以及回环验证之后，进行双目稠密建图得到全局地图；一方面可解决采用RGB-D相机存在的干扰问题，另一方面可以获得更精准的定位和建立了更精确的地图，因此具有工业实用性。

Claims

一种基于双目相机的无人机视觉SLAM方法，其特征在于，所述方法包括步骤：

通过双目摄像头获取至少两个不同位置的深度图像；

根据获取的至少两个不同位置的深度图像，通过视觉里程计得到相机位姿信息；

对所述相机位姿信息进行非线性优化、基于外观的回环检测以及回环验证，得到优化后的相机位姿信息；

根据优化后的相机位姿信息进行双目稠密建图得到全局地图。
根据权利要求1所述的一种基于双目相机的无人机视觉SLAM方法，其特征在于，所述根据所述不同位置的深度图像，通过视觉里程计得到相机位姿信息包括步骤：

对所述不同位置的深度图像进行图像特征匹配，得到相匹配的特征点；

根据相匹配的特征点，采用透视三点P3P算法计算得到所述相机位姿信息。
根据权利要求2所述的一种基于双目相机的无人机视觉SLAM方法，其特征在于，所述图像特征匹配采用尺度不变特征转换SIFT算法或者ORB算法。
根据权利要求1所述的一种基于双目相机的无人机视觉SLAM方法，其特征在于，所述非线性优化采用光束平差法BA算法和或图优化算法实现。
根据权利要求1所述的一种基于双目相机的无人机视觉SLAM方法，其特征在于，所述基于外观的回环检测通过构建的词袋模型或者训练的神经网络实现。
根据权利要求1所述的一种基于双目相机的无人机视觉SLAM方法，其特征在于，所述回环验证包括时间一致性检测和空间一致性检测。
根据权利要求1所述的一种基于双目相机的无人机视觉SLAM方法，其特征在于，所述根据优化后的相机位姿信息进行双目稠密建图得到全局地图包括步骤：

对优化后的相机位姿信息进行极线搜索和块匹配，得到像素点的位置信息；

根据得到的像素点的位置信息，采用双目立体视觉方法得到像素点的深度信息，并对得到的像素点的深度信息进行滤波；

根据滤波后的像素点的深度信息构建全局地图。
根据权利要求7所述的一种基于双目相机的无人机视觉SLAM方法，其特征在于，采用八叉树地图octomap方法构建全局地图。
一种无人机，其特征在于，所述无人机包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于双目相机的无人机视觉SLAM程序，所述基于双目相机的无人机视觉SLAM程序被所述处理器执行时实现如权利要求1至8中任一项所述的基于双目相机的无人机视觉SLAM方法的步骤。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有基于双目相机的无人机视觉SLAM程序，所述基于双目相机的无人机视觉SLAM程序被处理器执行时实现如权利要求1至8中任一项所述的基于双目相机的无人机视觉SLAM方法的步骤。