CN112052862A

CN112052862A - 基于k-svd字典学习的移动机器人视觉slam回环检测方法

Info

Publication number: CN112052862A
Application number: CN202010955241.7A
Authority: CN
Inventors: 李帅永; 杨雪梅
Original assignee: Chongqing University of Post and Telecommunications
Current assignee: Chongqing University of Post and Telecommunications
Priority date: 2020-09-11
Filing date: 2020-09-11
Publication date: 2020-12-08

Abstract

本发明涉及一种基于K‑SVD字典学习的移动机器人视觉SLAM回环检测方法，属于机器人技术领域。该方法具体包括：S1：对数据集进行采用K‑SVD自学习算法获得K‑SVD字典；S2：对于再次检测到的图像，基于K‑SVD字典，通过匹配追踪算法求得测量信号的稀疏表示；S3：利用基于复杂度的图像表示方法进行计算，进而与设定阈值进行比较，来检测回环。本发明大大减少了保存的信息量和计算量，从而加速回环检测的过程，使得位置漂移问题更快速地得到解决。

Description

基于K-SVD字典学习的移动机器人视觉SLAM回环检测方法

技术领域

本发明属于机器人技术领域，涉及移动机器人定位领域，具体涉及一种基于K-SVD字典学习的移动机器人视觉SLAM回环检测方法。

背景技术

在同步定位与建图(simultaneous localization and mapping，SLAM)问题中，需要检测之前访问过的位置，从而减少估计误差，通过相似度度量来比较传感器的观测结果来检测回环，经常用到的词袋模型(Bag-of-Words,BoW)是把特征视为一个个单词，并比较两张图片单词的一致性，来判断两张图片是否属于同一场景，为了能够把特征归类为单词，需要训练一个字典，词袋模型的文档长度等于已知的单词的数量，所以在使用词袋模型的时候，需要减小词汇量压力。

M.Cummins和P.Newman提出了一种基于概率推理的词袋模型方法，名为FAB-MAP2.0。通过使用标准字典，该方法可以检测大轨迹上的循环，(M.Cummins and P.Newman,“Appearance-only SLAM at large scale with FAB-MAP 2.0,”Int.J.Robot.Res.,vol.30,no.9,pp.1100–1123,2011)，Alireza Norouzzadeh Ravari和Hamid D.Taghirad提出在基本压缩感知的基础上扩展多测量向量技术，通过对少量传感器观测值的比较来实现闭环检测(Ravari A N,Taghirad H D.Loop closure detection by compressed sensingfor exploration of mobile robots in outdoor environments[C]//RsiInternational Conference on Robotics&Mechatronics.IEEE,2015.)。公开号为CN111444853A的专利申请公开了一种视觉SLAM的回环检测方法，通过视觉SLAM***技术目标载体的位姿以及环境地图，再通过回环检测模块对传入的图像与视觉SLAM***中保存的关键帧序列进行相似度计算，判别相似度后进行替换保存。公开号为CN110070578A的专利申请公开了一种回环检测方法，获取相机图像与数据库图像，根据相机图像得到关键帧图像特征向量与当前帧图像特征向量；根据关键帧与当前帧图像特征向量与离线词典得到第一，二词汇映射向量；根据第一词汇映射向量和第二词映射向量得到重投影误差并将投影误差与预设误差阈值作比较判断是否检测到回环。

上述方法都可以检测到回环，但是仍存在词袋模型数据压力大，相似度比较时计算量大，回环检测速度无法提高的问题。

发明内容

有鉴于此，本发明的目的在于提供一种基于K-SVD字典学习的移动机器人视觉SLAM回环检测方法，该方法采用字典学习的算法构造参数字典，大大加速了字典的生成且减少了数据的保存量，重构的图像与原始的图像差别很小，但是保存的信息却大大减少了，有效减小了计算量，从而加速回环检测的过程，使得位置漂移问题更快速地得到解决。

为达到上述目的，本发明提供如下技术方案：

一种基于K-SVD字典学习的移动机器人视觉SLAM回环检测方法，具体包括以下步骤：

S1：对数据集进行采用K-SVD自学习算法获得K-SVD字典；

S2：对于再次检测到的图像，基于K-SVD字典，通过匹配追踪算法求得测量信号的稀疏表示；

S3：利用算法信息理论所提出的基于复杂度的图像表示方法进行计算，进而与设定阈值进行比较，来检测回环。

进一步，步骤S1中，K-SVD字典的学习步骤具体包括：

首先，设迭代次数k＝0，初始化字典A_k∈R^n×m，求解出样本的稀疏系数为：

其中，w_i表示初始矩阵，T₀表示所使用的原子数，x表示稀疏系数，m、n分别表示矩阵为n×m；

计算残差矩阵为：

其中，i、j分别表示矩阵的第i列，第j行，j＝1,…,N，N表示原子个数，F表示一种数学运算，t表示迭代次数。

选取E_j中与原子a_j表示的集合对应的列

并对

作SVD分解：

更新a_j＝u₁，

其中，v₁、u₁、S(1,1)分别表示U,V的第一列和S的第一个元素，将U的第一列作为更新后的原子，矩阵S的S(1,1)乘以V的第一列作为更新后的稀疏行向量，直至达到公式(5)的条件停止迭代；

||W-A_kX_k||₂＜β (5)

其中，W表示原始矩阵，X_k表示稀疏系数矩阵，β表示阈值。

这样将数据集经过K-SVD算法后生成的字典，具有减小数据保存量的特点，使得后期匹配进行的更加快速。

进一步，步骤S2中，通过匹配追踪算法求得测量信号的稀疏表示，具体包括：首先从获得的K-SVD字典A中选取与待分析的图片最匹配的原子，该原子满足如下条件：

其中，y表示待表示原子、

分别表示最匹配的原子；

这样就被分解为最匹配的原子的分量和残差为：

其中，R₁表示残差；更新残差，直至迭代次数满足条件后，停止迭代。

进一步，步骤S3具体包括：基于复杂度的图像表示方法，利用NCD来衡量图像的相似性；当两个观测值之间的NCD低于给定的阈值时，检测到一个回环；

NCD的计算公式为：

其中，C(XY)是包含X和Y连接的压缩图像的长度，X和Y分别表示两个不同的图像的压缩值。

本发明的有益效果在于：本发明利用K-SVD算法对数据集进行处理获得过完备字典，大大加速了字典的生成且减少了数据的保存量，重构的图像与原始的图像差别很小，但是保存的信息却大大减少了。在图像进行相似度度量时，本发明提出了一种基于复杂度的图像表示方法，这种基于复杂度的表示是由每个原始图像观测的稀疏模型构建的，加速了回环检测的过程，使得位置漂移问题更快速地得到解决，从而提高了SLAM的速度。

本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述，并且在某种程度上，基于对下文的考察研究对本领域技术人员而言将是显而易见的，或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。

附图说明

为了使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明作优选的详细描述，其中：

图1为K-SVD字典学习在SLAM回环检测中的应用方法流程图。

具体实施方式

以下通过特定的具体实例说明本发明的实施方式，本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用，本说明书中的各项细节也可以基于不同观点与应用，在没有背离本发明的精神下进行各种修饰或改变。需要说明的是，以下实施例中所提供的图示仅以示意方式说明本发明的基本构想，在不冲突的情况下，以下实施例及实施例中的特征可以相互组合。

请参阅图1，图1所示为本发明所述的基于K-SVD字典学习的移动机器人视觉SLAM回环检测方法。压缩感知的前提条件是图像信号在字典上具有稀疏性，其直接影响着压缩测量数，图像在所选择的稀疏字典上越稀疏，所需要的压缩测量数就越少，后期根据信号本身训练的过完备字典，可以更快地将基于复杂度表示的图像进行比对，从而检测回环，所以用字典学习对图像进行稀疏表示有很大的优势，这样可以解决以往所遇到的词袋存储压力过大的问题。

该回环检测的具体步骤如下：

1、字典学习

本发明将字典学习应用在SLAM的回环检测中，用K-SVD算法对数据集进行处理获得过完备字典，K-SVD字典学习步骤如下：

计算残差矩阵为：

选取E_j中与原子a_j表示的集合对应的列

并对

作SVD分解：

更新a_j＝u₁，

||W-A_kX_k||₂＜β (5)

其中，W表示原始矩阵，X_k表示稀疏系数矩阵，β表示阈值。这样将数据集经过K-SVD算法后生成的字典，具有减小数据保存量的特点，使得后期匹配进行的更加快速。

2、匹配追踪算法：

匹配追踪算法是一种典型的贪婪算法，它的核心思想是在每一次迭代过程中根据当前残差与原子之间的内积最大值来选择与当前残差最匹配的原子，并更新残差，直到迭代次数达到某阈值或残差小于某阈值时终止迭代。

对于再次检测到的图像，基于K-SVD字典，通过匹配追踪算法求得待测量信号的稀疏表示，具体如下：

首先从已经获得的字典A中选取与待分析的图片最匹配的原子满足：

其中，y表示待表示原子、

分别表示最匹配的原子，

这样就被分解为最匹配的原子的分量和残差为：

3、基于复杂度的图形表示：

利用算法信息理论，给出了一种通用的归一化距离测度，在此基础上，提出了一种基于复杂度的图像表示方法，这种基于复杂度的表示是由每个原始图像观测的稀疏模型构建的。再次检测到的图像经过通过匹配追踪算法求得测量信号的稀疏表示，从而构建基于复杂度的表示。

为了使用NCD对图像进行相似度度量，需要为每个图像提供一个字符串描述符，从图像的模型生成字符描述符非常简单，由模型表示的图像可以描述为参数原子及其增益值的组合，为了构造基于复杂度的图像表示，考虑N个原子的图像模型，这个表示法可以分成两部分，第一个原子的描述用R₀表示，而坐标系中的其余原子与第一个原子有关：

R₀＝ξ₀g_γ0 (9)

这种表示是基于稀疏模型可以用图像坐标系中的第一个原子表示，而坐标系中的其余原子与第一个原子有关的思想而发展起来的。

图像模型变换前后的复杂度变换如下：

K(I_S)＝K(R₀,R_i)＝K(R₀)+K(R_i)+O(log(min{K(R₀),K(R_i)})) (11)

因为对于每个稀疏模型，R0的复杂度都是固定的。因此，在图像变换下，K(R0)保持不变。

K(I_s)＝K(R_i)+k₁ (12)

K(I_S(ψ))＝K(R₀(ψ),R_i(ψ))＝K(R₀(ψ)+K(R_i(ψ)+O(log(min{K(R₀(ψ)),K(R_i(ψ))})） (13))

K(I_s(ψ))＝K(R_i)+k₁ (14)

有了基于Kolmogorov复杂度的图像表示，NCD可以用来衡量图像的相似性。当两个观测值之间的NCD低于给定的阈值时，就说明检测到一个回环，NCD计算公式如下：

其中，C(XY)是包含X和Y连接的压缩图像的长度。

最后说明的是，以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或者等同替换，而不脱离本技术方案的宗旨和范围，其均应涵盖在本发明的权利要求范围当中。