CN113920322B

CN113920322B - 一种模块化机器人运动链构型识别方法及***

Info

Publication number: CN113920322B
Application number: CN202111228925.8A
Authority: CN
Inventors: 李伟昌; 黄尚樱; 梁梓熙
Original assignee: Guangdong University of Technology
Current assignee: Guangdong University of Technology
Priority date: 2021-10-21
Filing date: 2021-10-21
Publication date: 2024-06-14
Anticipated expiration: 2041-10-21
Also published as: CN113920322A

Abstract

本发明公开了一种模块化机器人运动链构型识别方法及***，该方法包括获取模块化机器人图像，得到输入图像；将输入图像输入到预设的目标检测模型进行多模块识别，得到模块中心点位置、模块种类和模块包围框尺寸，所述预设的目标检测模型包括初步特征提取单元、特征融合单元和输出单元；基于最邻近点搜索方法对模块中心点位置、模块种类和模块包围框尺寸进行处理，确定模块连接关系，完成运动链构型识别。该***包括：输入模块、检测模块和构型识别模块。通过使用本发明，能够在无需给机器人安装额外检测组件的情况下实现机器人的运动链构型识别，且对于噪声环境具有较高的鲁棒性。本发明可广泛应用于视觉识别领域。

Description

一种模块化机器人运动链构型识别方法及***

技术领域

本发明涉及视觉识别领域，尤其涉及一种模块化机器人运动链构型识别方法及***。

背景技术

机器人由于其高效性、精确性和低成本性而广泛受到现代规模化工业生产的重视，模块化机器人***具有较高的可拓展性和重构性，能够以多种构型应用在不同的领域之中。然而，模块化机器人***的构型识别是一个耗费大量时间精力且准确率不高的任务，尤其对于缺少传感装置的模块化机器人***而言。

发明内容

为了解决上述技术问题，本发明的目的是提供一种模块化机器人运动链构型识别方法及***，此算法为半监督学习方法，能够在无需给机器人安装额外检测组件的情况下实现机器人的运动链构型识别，且对于噪声环境具有较高的鲁棒性。

本发明所采用的第一技术方案是：一种模块化机器人运动链构型识别方法，包括以下步骤：

获取模块化机器人图像，得到输入图像；

将输入图像输入到预设的目标检测模型进行多模块识别，得到模块中心点位置、模块种类和模块包围框尺寸；

所述预设的目标检测模型包括初步特征提取单元、特征融合单元和输出单元；

基于最邻近点搜索方法对模块中心点位置、模块种类和模块包围框尺寸进行处理，确定模块连接关系，完成运动链构型识别。

进一步，所述输出单元包括：

中心点预测部分，用于预测输入图像中模块中心点位置和模块种类；

偏移量预测部分，用于预测输入图像中模块中心点位置的偏移量；

包围框预测部分，用于预测输入图像中模块包围框尺寸。

进一步，所述将输入图像输入到预设的目标检测模型进行多模块识别，得到模块中心点位置、模块种类和模块包围框这一步骤，其具体包括：

将输入图像输入到预设的目标检测模型；

基于初步特征提取单元对输入图像进行初步特征提取处理，得到中间特征张量；

基于特征融合单元将中间特征张量进行深度特征融合，得到高级特征张量；

对高级特征张量进行采样处理并调整尺寸，得到特征图；

将特征图分别输入到中心点预测部分、偏移量预测部分和包围框预测部分，得到模块中心点输出、模块中心点偏移修正量输出和模块包围框输出；

基于模块中心点输出和模块中心点偏移修正量输出，得到模块中心点位置和模块种类；

基于模块包围框输出得到模块包围框尺寸。

进一步，所述模块中心点输出表示如下：

上式中，R表示特征图与输入图像大小之比，C表示模块种类数目，w₁为图像的宽度，h₁为图像的高度。

进一步，还包括中心点预测部分的构建步骤，其具体包括：

构建模块中心点的置信度标签；

c种类模块中心点在(x,y)位置上置信度

获取训练图像；

将训练图像中真实的中心点p＝(x,y)分解为低分辨率中心点与中心点偏移量/>

基于低分辨率中心点和置信度/>训练中心点预测部分。

进一步，以均方误差为训练中心点预测部分的损失函数，公式表示如下：

上式中，所述E_x表示数学期望算子，所述Y_h；x,y,c表示置信度标签，L_h表示中心点预测损失函数，x,y表示训练真实的中心点的位置，c表示种类。

进一步，还包括偏移量预测部分的构建步骤，其具体包括：

基于中心点偏移量和L1损失函数训练包围框预测部分；

所述L1损失函数为所述L_o表示中心点偏移量算子，所述N表示模块总数，|*|表示L1距离算子，/>表示在(x,y)位置的中心点预测值。

进一步，还包括包围框预测部分的构建步骤，其具体包括：

以来表示种类为c_k的模块在图像中的检测方框左上角坐标与右下角坐标，得到其中心点坐标/>与包围框的尺寸/>

将训练图像中所有类别所有模块的包围框s的高h与宽w分别作为两个特征图的值，以特征图中给定位置(x,y)对应了中心点在该位置上模块的低分辨率包围框尺寸w与h；

基于L1损失函数训练包围框预测部分。

进一步，所述基于最邻近点搜索方法对模块中心点位置、模块种类和模块包围框尺寸进行处理，确定模块连接关系，完成运动链构型识别这一步骤，其具体包括：

将输入图像中所有类别所有模块的中心点作为节点构建得到强连通图；

以主控模块作为起点并尝试将所有模块依次连接得到一个具有最小权重的链表，所述权重为两个中心点之间的距离；

根据中心点位置以及包围框之间的交并比确定所有模块的连接关系；

完成运动链型构型识别。

本发明所采用的第二技术方案是：一种模块化机器人运动链构型识别***，包括：

输入模块，用于获取模块化机器人图像，得到输入图像；

检测模块，用于将输入图像输入到预设的目标检测模型进行多模块识别，得到模块中心点位置、模块种类和模块包围框尺寸，所述预设的目标检测模型包括初步特征提取单元、特征融合单元和输出单元；

构型识别模块，用于基于最邻近点搜索方法对模块中心点位置、模块种类和模块包围框尺寸进行处理，确定模块连接关系，完成运动链构型识别。

本发明方法及***的有益效果是：本发明采用了目标检测的思想，使用了深度学习的方法来获取给定图像中的机器人模块信息，并基于最邻近搜索的方式进行构型匹配，以找出当前的配置。能够在无需给机器人安装额外检测组件的情况下实现机器人的运动链构型识别，且对于噪声环境具有较高的鲁棒性。

附图说明

图1是本发明一种模块化机器人运动链构型识别方法的步骤流程图；

图2是本发明一种模块化机器人运动链构型识别***的结构框图；

图3是本发明具体实施例完成构型识别后的示意图；

图4是本发明具体实施例识别过程的示意图；

图5是本发明实验验证过程的示意图。

具体实施方式

下面结合附图和具体实施例对本发明做进一步的详细说明。对于以下实施例中的步骤编号，其仅为了便于阐述说明而设置，对步骤之间的顺序不做任何限定，实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。

本发明提出了一种基于视觉识别的链式模块化机器人运动学构型识别方法，使用了目标检测神经网络来完成对图像里模块化机器人中不同模块种类及其包围框进行模块识别，随后，算法将通过查找最邻近模块中心点及其包围框交并比的方式来实现运动链识别。

参照图1和图4，本发明提供了一种模块化机器人运动链构型识别方法，该方法包括以下步骤：

S1、获取模块化机器人图像，得到输入图像；

S2、将输入图像输入到预设的目标检测模型进行多模块识别，得到模块中心点位置、模块种类和模块包围框尺寸；

具体地，所述特征融合单元采用树状结构(HDA)进行串联，有效地结合浅层和深层之间的特征信息，以鼓励模型学习更丰富的组合，进而拓展更多的特征层次结构，并在每个HDA输出中引入了残差连接，来防止模型产生深度退化问题，并且能够有效地防止模型在训练中出现梯度消失或梯度***的情况。

S3、基于最邻近点搜索方法对模块中心点位置、模块种类和模块包围框尺寸进行处理，确定模块连接关系，完成运动链构型识别。

具体地，RRMS是一种具有高度集成和集中控制***的模块化机器人***，根据控制***的定义，RRMS的模块可以分为控制模块和功能模块。对于给定的一张RGB照片其中w₁为图像的宽度，h₁为图像的高度，数字3表征了该图像张量的特征通道数。我们通过特征提取器h(·)来从给定图像张量中提取出高级语义信息/>在一般情况下，由于特征提取器具有降采样功能，因此存在着不等式w₁≥w₂，h₁≥h₂。随后，我们将使用输出模块以映射高级语义信息z得到输出/>

图4(a)表示给定输入图像，图4(b)表示得到模块中心点位置、模块种类和模块包围框尺寸，图4(c)表示基于最邻近点搜索方法对模块中心点位置、模块种类和模块包围框尺寸进行处理，确定模块连接关系，图4(d)表示运动链构型识别结果。

进一步作为本方法的优选实施例，所述输出单元包括：

包围框预测部分，用于预测输入图像中模块包围框尺寸。

具体地，我们依次将这三个输出命名为中心点输出包围框尺寸输出/>以及中心点偏移修正量输出/>

进一步作为本方法的优选实施例，所述将输入图像输入到预设的目标检测模型进行多模块识别，得到模块中心点位置、模块种类和模块包围框这一步骤，其具体包括。

S21、将输入图像输入到预设的目标检测模型；

S22、基于初步特征提取单元对输入图像进行初步特征提取处理，得到中间特征张量；

S23、基于特征融合单元将中间特征张量进行深度特征融合，得到高级特征张量；

S24、对高级特征张量进行采样处理并调整尺寸，得到特征图；

S25、将特征图分别输入到中心点预测部分、偏移量预测部分和包围框预测部分，得到模块中心点输出、模块中心点偏移修正量输出和模块包围框输出；

具体地，对于一张含有RRMS模块的图像X，首先会通过初步的特征提取模块转换为具有四倍降采样的中间特征张量H₁，随后该特征张量依次通过三个特征融合单元来进行特征的深度融合，以提取出具有高级语义信息的特征张量H。随后我们对H进行连续的2倍上采样处理将16倍降采样的特征图恢复为4倍降采样的尺寸，以防止输出特征图的尺寸过小而造成精度下降。最后，我们将该4倍降采样的特征图分别作为三个输出模块的输入，并得到最终含有检测结果的输出

S26、基于模块中心点输出和模块中心点偏移修正量输出，得到模块中心点位置和模块种类；

具体地，由于预测结果的最小尺度是4个像素点，因此需要单独构造偏移量预测部分来进行修正，即模块中心点位置是以中心点位置的偏移量修正后的位置为基准。

S27、基于模块包围框输出得到模块包围框尺寸。

进一步作为本方法优选实施例，为了使得模型具有预测多个模块的中心点位置以及模块的种类，我们令中心点输出表示如下：

上式中，R表示特征图与输入图像大小之比，C表示模块种类数目，即中心点输出每个通道的特征图分别预测一个类别的模块中心点位置，w₁为图像的宽度，h₁为图像的高度。

在理想状态下，模型的中心点输出将在正确类别的小模块中心点位置有而其他位置则为/>

进一步作为本方法优选实施例，还包括中心点预测部分的构建步骤，其具体包括：

基于高斯核构建模块中心点的置信度标签，令标准差σ为一个常数；

c种类模块中心点在(x,y)位置上置信度

获取训练图像；

基于低分辨率中心点和置信度/>训练中心点预测部分。

进一步作为本方法优选实施例，以均方误差为训练中心点预测部分的损失函数，公式表示如下：

进一步作为本方法优选实施例，还包括偏移量预测部分的构建步骤，其具体包括：

基于中心点偏移量和L1损失函数训练包围框预测部分；

仅统计真实标签中存在小模块位置的预测值，所述L1损失函数为所述L_o表示中心点偏移量算子，所述N表示模块总数，|*|表示L1距离算子，/>表示在(x,y)位置的中心点预测值。

具体地，对于目标真实的中心点p＝(x,y)，我们将其分解为两个部分：低分辨率中心点与中心点偏移量/>这两个部分分别对应了中心点输出/>及中心点偏移修正量输出/>且有p＝p'+δp。对于中心点输出/>而言，我们将以热图的形式来表达c种类模块的中心点在(x,y)位置上置信度/>而将所有类别所有模块的中心点偏移量δp的横坐标x与纵坐标y作为中心点偏移修正量输出/>而分割到两个通道的特征图中，即两个特征图的坐标(x,y)分别对应了中心点在该位置上的模块中心点偏移量δx与δy。

进一步作为本方法的优选实施例，还包括包围框预测部分的构建步骤，其具体包括：

基于L1损失函数训练包围框预测部分，即

为了统一不同环节损失值的相对大小，我们加入了两个超参数λ_s和λ_o，即

L＝L_p+λ_o·L_o+λ_s·L_s

通过上文的模块识别方法，我们得到了图中所有小模块的类别c，中心点p及包围框

进一步作为本方法的优选实施例，所述基于最邻近点搜索方法对模块中心点位置、模块种类和模块包围框尺寸进行处理，确定模块连接关系，完成运动链构型识别这一步骤，其具体包括：

S31、将输入图像中所有类别所有模块的中心点作为节点构建得到强连通图；

S32、根据中心点位置以及包围框之间的交并比确定所有模块的连接关系；

S33、确定起点并尝试将所有模块依次连接得到一个具有最小权重的链表，所述权重为两个中心点之间的距离；

S34、完成运动链型构型识别，识别结果参照图3。

具体地，由于拍摄角度问题，多个模块之间的距离差异较小，此时若直接根据两个中心点之间距离进行搜索，可能会得到不如人意的结果。我们启发式地使用了两个模块之间的交并比IoU的大小来进行辅助判断，其中IoU为两个包围框的交集与两个包围框的并集之比。当两个模块的包围框重叠部分越多时，IoU接近1；反之则接近0。我们取IoU较大的模块作为机器人构型中的下一个关节，这样能够在最大程度上保证了预测结果的准确性；

在具体的实现中，我们使用了广度优先搜索来完成这个过程：以控制模块(F)作为根节点，依次遍历其他不在链表内的模块进行筛选。筛选的准则为：该模块与链表尾模块的中心点距离最短，且交并比IoU最大的模块将作为新的链表尾模块。当多个模块之间的距离与交并比都差异较小时，或是发现中心点距离远大于链表尾模块包围框尺寸等异常行为时(对应于不在运动链且被识别的RRMS模块)，算法将会拒绝进行识别，并尝试提示用户进行手动构型识别。

以一个具体的例子进行实验验证：

我们随机地选取一张照片并进行可视化处理，其结果如图5所示。在实际的搜索中，我们直接基于所有模块构造了两个邻接矩阵，分别为两两模块之间的交并比IoU矩阵H_IoU和中心点间距H_d，其中下标(i,j)表示该结果由序号i和j所得，因此这两个邻接矩阵为对称矩阵。对于图5所示的结果，有：

由于我们人为地选定主控模块(F)作为链表的起点，根据图5(c)可得，主控模块的序号为0。而从H_d与H_IoU中能够发现，序号0模块与序号2模块最接近，且两者拥有最大的交并比IoU，因此我们将序号2模块加入到链表之中。重复上述过程，最终我们得到的链表为：[0214]。不难发现，这个链表的序号与真实模块构型相符，哪怕在有着较大背景噪声(如倒影)的情况下。

实验结果表明，我们的方法能够在无需给机器人安装额外检测组件的情况下实现机器人的运动链构型识别，且对于噪声环境具有较高的鲁棒性。

如图2所示，一种模块化机器人运动链构型识别***，包括：

输入模块，用于获取模块化机器人图像，得到输入图像；

上述方法实施例中的内容均适用于本***实施例中，本***实施例所具体实现的功能与上述方法实施例相同，并且达到的有益效果与上述方法实施例所达到的有益效果也相同。

以上是对本发明的较佳实施进行了具体说明，但本发明创造并不限于所述实施例，熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换，这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

Claims

1.一种模块化机器人运动链构型识别方法，其特征在于，包括以下步骤：

获取模块化机器人图像，得到输入图像；

基于最邻近点搜索方法对模块中心点位置、模块种类和模块包围框尺寸进行处理，确定模块连接关系，完成运动链构型识别；

所述将输入图像输入到预设的目标检测模型进行多模块识别，得到模块中心点位置、模块种类和模块包围框这一步骤，其具体包括：

将输入图像输入到预设的目标检测模型；

对高级特征张量进行采样处理并调整尺寸，得到特征图；

基于模块包围框输出得到模块包围框尺寸；

所述模块中心点输出表示如下：

2.根据权利要求1所述一种模块化机器人运动链构型识别方法，其特征在于，所述输出单元包括：

包围框预测部分，用于预测输入图像中模块包围框尺寸。

3.根据权利要求2所述一种模块化机器人运动链构型识别方法，其特征在于，还包括中心点预测部分的构建步骤，其具体包括：

构建模块中心点的置信度标签；

c种类模块中心点在(x,y)位置上置信度

获取训练图像；

将训练图像中真实的中心点p＝(x,y)分解为低分辨率中心点与中心点偏移量

基于低分辨率中心点和置信度/>训练中心点预测部分。

4.根据权利要求3所述一种模块化机器人运动链构型识别方法，其特征在于，以均方误差为训练中心点预测部分的损失函数，公式表示如下：

5.根据权利要求4所述一种模块化机器人运动链构型识别方法，其特征在于，还包括偏移量预测部分的构建步骤，其具体包括：

基于中心点偏移量和L1损失函数训练包围框预测部分；

6.根据权利要求5所述一种模块化机器人运动链构型识别方法，其特征在于，还包括包围框预测部分的构建步骤，其具体包括：

基于L1损失函数训练包围框预测部分。

7.根据权利要求6所述一种模块化机器人运动链构型识别方法，其特征在于，所述基于最邻近点搜索方法对模块中心点位置、模块种类和模块包围框尺寸进行处理，确定模块连接关系，完成运动链构型识别这一步骤，其具体包括：

确定起点并尝试将所有模块依次连接得到一个具有最小权重的链表，所述权重为两个中心点之间的距离；

完成运动链型构型识别。

8.一种模块化机器人运动链构型识别***，其特征在于，包括：

输入模块，用于获取模块化机器人图像，得到输入图像；

构型识别模块，用于基于最邻近点搜索方法对模块中心点位置、模块种类和模块包围框尺寸进行处理，确定模块连接关系，完成运动链构型识别；

所述将输入图像输入到预设的目标检测模型进行多模块识别，得到模块中心点位置、模块种类和模块包围框，其具体包括：将输入图像输入到预设的目标检测模型；基于初步特征提取单元对输入图像进行初步特征提取处理，得到中间特征张量；基于特征融合单元将中间特征张量进行深度特征融合，得到高级特征张量；对高级特征张量进行采样处理并调整尺寸，得到特征图；将特征图分别输入到中心点预测部分、偏移量预测部分和包围框预测部分，得到模块中心点输出、模块中心点偏移修正量输出和模块包围框输出；基于模块中心点输出和模块中心点偏移修正量输出，得到模块中心点位置和模块种类；基于模块包围框输出得到模块包围框尺寸；

所述模块中心点输出表示如下：