CN113515131B - 基于条件变分自动编码器的移动机器人避障方法及*** - Google Patents

基于条件变分自动编码器的移动机器人避障方法及*** Download PDF

Info

Publication number
CN113515131B
CN113515131B CN202110997644.2A CN202110997644A CN113515131B CN 113515131 B CN113515131 B CN 113515131B CN 202110997644 A CN202110997644 A CN 202110997644A CN 113515131 B CN113515131 B CN 113515131B
Authority
CN
China
Prior art keywords
pedestrian
obstacle avoidance
robot
point
temporary obstacle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110997644.2A
Other languages
English (en)
Other versions
CN113515131A (zh
Inventor
迟文政
洪阳
袁媛
陈国栋
孙立宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou University
Original Assignee
Suzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou University filed Critical Suzhou University
Priority to CN202110997644.2A priority Critical patent/CN113515131B/zh
Publication of CN113515131A publication Critical patent/CN113515131A/zh
Application granted granted Critical
Publication of CN113515131B publication Critical patent/CN113515131B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0212Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
    • G05D1/0217Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory in accordance with energy consumption, time reduction or distance reduction criteria
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0212Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
    • G05D1/0221Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory involving a learning process

Landscapes

  • Engineering & Computer Science (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
  • Manipulator (AREA)

Abstract

本发明涉及基于条件变分自动编码器的移动机器人避障方法及***。本发明包括初始化机器人的行人避障区域;机器人根据栅格矩阵接收原始目标点并根据导航信息进行导航;通过机器人进行行人检测并获取行人位置信息和行人属性信息;根据行人的位置判断行人是否在避障范围内;训练条件变分自动编码器;根据临时避障点筛选代价最低的最优临时避障点;机器人接收最优临时避障点并向最优临时避障点进行导航;判断机器人是否到达最优临时避障点。本发明将深度学习与导航动态避障相结合,生成临时避障点,引导机器人规划出满足行人舒适度的路径,减少了由于环境的不确定性引起的机器人迷失、碰撞等问题。

Description

基于条件变分自动编码器的移动机器人避障方法及***
技术领域
本发明涉及智能机器人技术领域,尤其是指基于条件变分自动编码器的移动机器人避障方法及***。
背景技术
人工智能技术的突破与计算机软硬件技术的飞速升级推动了移动型服务机器人的研究与进步。目前,智能服务机器人产业规模不断扩大,应用场景也在更加丰富,相关成熟的产品已经应用到家庭、酒店、医院、机场等多种环境。移动机器人动态避障技术是指机器人在无人干预的条件下,自动根据地图信息和所在环境中运动的行人信息采取相应运动规划防止机器人发生碰撞的过程,该运动规划可以是机器人选择绕行或者原地等待行人通过。相对于工业机器人来说,服务型移动机器人所在的人机共融环境复杂度更高,不确定性更大,对避障策略的实时性要求更高。目前导航框架中的动态避障模块通常将行人视为动态障碍物,如动态窗口法,或者根据特定的交互规则专注于对象的下一时刻运动,如相对速度障碍物算法和最优相对碰撞避免算法。这些方法使得机器人通过被动反应来躲避行人,生成的路径不安全且不自然,无法满足行人的要求。因此希望机器人在导航过程中提前检测到行人,并使用深度学习的方法生成自然连续且让行人感到舒适的路径。
以动态窗口算法(Dynamic Window Approach,DWA)为例,简要说明基于机器人速度采样的动态避障算法的一般步骤:
步骤一:初始化,配置好机器人移动的最大最小速度、加速度,评价函数权重等;
步骤二:判断是否到达目的地。首先判断机器人现在所处的位置是不是目标点,如果不是就执行步骤三,如果是就终止;
步骤三:速度采样,基于移动机器人的运动模型计算当前采样的速度范围(动态窗口),如图1所示。其中移动机器人的运动模型大致分为两种:
模型一:机器人底盘不是全向移动的,只能前进(x轴线速度v)和旋转(z轴角速度w),如差速底盘,相邻时刻内(毫秒级)运动距离短,可将相邻两点之间的运动轨迹看成直线。机器人下一状态的位置可表示为
x=x+vΔt cos(θt)
y=y+vΔt sin(θt)
θt=θt+ωΔt
模型二:全向移动的,有x轴速度Vx,y轴速度Vy和角速度w,如麦轮车,这种模型中的下一状态位置可表示为
x=x+vxΔt cos(θt)-vyΔt sin(θt)
y=y+vxΔt sin(θt)+vyΔt cos(θt)
θt=θt+wΔt
在有了底盘运动模型之后,当前底盘的速度(线速度v和角速度w)信息就可以表示出来,在当前速度的基础上设置一个速度范围;
步骤四:遍历,遍历所有范围内的线速度和角速度,根据模型模拟一段时间的路径,如图2所示;
步骤五:筛选路径,根据评价函数对④中的路径进行打分,其中评价函数G(v,w)由三部分组成,方位角评价函数heading(v,w),即小车与目标之间的角度差,底盘与最近障碍物距离dist(v,w),和轨迹速度大小velocity(v,w)。
G(v,ω)=σ(α·heading(v,ω)+β·dist(v,ω)+γ·velocity(v,ω))
这个评价函数的物理意义是使机器人避开障碍物、朝着目标、以较快的速度行驶;
步骤六:机器人运动,选取最优解(线速度和角速度),下发给运动底盘,驱动机器人继续移动;重复步骤二~六,直至机器人到达终点。
基于机器人速度采样的动态避障算法保证了在行人数量较少和行人运动速度较慢的环境中的可行性,然而,在拥挤的环境中,当前方法会导致机器人采取不自然、短视和不安全的运动。例如,在一个狭窄的走廊里,当机器人遇到迎面走来的行人时,它可能因为行人占据了一大半的通道而无法通行,但是由于导航目的地的吸引力,机器人无法停止路径规划,因此输出非常不连续的轨迹,导致机器人停滞,旋转或摇晃,从而影响行人的正常通行。
如图3所示,人机共融工作环境受导航目标点的引导,当前动态避障策略会根据速度采样形成路径1所示的路径规划结果,然而路径1需要通过正在行走的人群,在真实的导航环境中行人的移动速度可能会很快,采取该路径大概率会与行人运动产生冲突,甚至导致导航任务的失败。而路径2虽然距离长,但是远离环境中的行人,机器人的运动更加安全且更容易被行人接受,由于当前动态避障算法无法将行人与普通障碍物进行区分,所以无法生成满足行人需求的路径。
如前所述,当前动态避障算法仅仅将行人当成动态障碍物,生成的路径不自然,忽略导航的安全性和行人的心理感受。
发明内容
为此,本发明所要解决的技术问题在于克服现有技术中动态避障算法仅仅将行人当成动态障碍物,生成的路径不自然,忽略导航的安全性和行人的心理感受的问题。
为解决上述技术问题,本发明提供了基于条件变分自动编码器的移动机器人避障方法,包括如下步骤:
步骤S1:初始化机器人的行人避障区域,以机器人为中心构建栅格矩阵并获取障碍点位置;
步骤S2:机器人根据栅格矩阵从起点向目标点进行导航并移动;
步骤S3:机器人对行人进行检测并获取行人位置信息和行人属性信息;
步骤S4:根据行人的位置判断行人是否在避障范围内,若否,则返回步骤S2,若是,则执行步骤S5;
步骤S5:根据行人位置信息,将行人的位置用坐标表示并存入行人位置数组中,根据行人的属性,将行人的属性用变量表示并存入行人属性数组,将障碍点位置、机器人的起点位置和目标点位置、行人位置数组、行人属性数组作为输入来训练条件变分自动编码器,生成坐标形式的临时避障点;
步骤S6:根据临时避障点筛选代价最低的最优临时避障点;
步骤S7:机器人根据最优临时避障点再次进行导航;
步骤S8:判断机器人是否到达最优临时避障点,若未到达,则机器人继续移动直至到达最优临时避障点,若到达,继续判断机器人是否到达目标点,若否则返回步骤S3,若是,则认为机器人到达目标点。
在本发明的一个实施例中,步骤S3中,所述进行行人检测并获取行人位置信息和行人属性信息的方法包括:
步骤S31:通过机器人搭载的深度相机实时捕获周围图像;
步骤S32:应用行人检测算法对周围图像内的行人进行检测,获取行人在像素坐标系下的位置,应用行人属性识别算法对周围图像内的行人进行识别,获取行人属性信息;
步骤S33:将行人在像素坐标系下的位置通过坐标变换,输出行人在全局坐标系下的位置;
步骤S34:根据行人在全局坐标系下的位置,通过行人移动的距离与经过的时间,计算出行人的移动速度和移动方向并根据恒速模型来预测出行人下一时刻的位置。
在本发明的一个实施例中,步骤S4中,所述根据行人的位置判断行人是否在避障范围内的方法包括:
步骤S41:根据行人在全局坐标系下的位置,计算其在横坐标和纵坐标下分别到机器人所在位置的距离dx和dy
步骤S42:判断dx和dy是否都小于行人避障区域边长的一半,所述行人避障区域是在栅格地图中以机器人为中心的正方形区域,若是,则表示行人在避障区域内,若否,则表示行人不在避障区域内。
在本发明的一个实施例中,步骤S5中,所述根据行人位置信息,将行人的位置用坐标表示并存入行人位置数组中的方法为:将行人当前位置坐标以及接下来两个时刻的位置坐标分别通过全局到局部的坐标转换表示出来,并存入一个数组中,前两个数分别表示当时行人的x坐标和y坐标,后面四个数表示行人下两个时刻的坐标。
在本发明的一个实施例中,步骤S5中,所述根据行人的属性,将行人的属性用变量表示并存入行人属性数组的方法为:将行人的属性用四个0/1变量表示并存入数组,所述四个0/1变量中,第一个数值表示行人的性别,0表示男性,1表示女性;第二个数值表示体宽,0表示窄,1表示宽;第三个数值表示年纪,0表示中段年龄,1表示老人或小孩;第四个数值表示情绪,0表示开心或正常,1表示负面情绪。
在本发明的一个实施例中,步骤S6中,所述根据临时避障点筛选代价最低的最优临时避障点的方法包括:根据临时避障点到行人、最近障碍物以及原始目标点的距离设计代价函数,根据代价函数计算每个临时避障点的代价值并选取代价最低的临时避障点作为最优临时避障点。
在本发明的一个实施例中,所述代价函数为:
Figure BDA0003234386780000061
其中xtemp表示临时避障点,xpi表示第i个行人的坐标,xobs表示最近障碍物的坐标,xgoal表示原始目标点的坐标;ω1、ω2、ω3为权重。
在本发明的一个实施例中,步骤S7中,所述机器人接收最优临时避障点进行导航的方法包括:最优临时避障点以ROS中话题的形式发布给机器人,由机器人打断原来的导航,机器人优先向最优临时避障点的导航。
在本发明的一个实施例中,步骤S8中,所述判断机器人是否到达最优临时避障点的方法包括:通过ROS获取机器人的实时位置坐标,计算机器人的实时位置坐标与最优临时避障点的坐标的距离,若距离小于等于预设阈值,则表示已经到达,若大于预设阈值,则表示未到达。
本发明还提供基于条件变分自动编码器的移动机器人避障***,包括:
初始化模块,用于初始化机器人的行人避障区域;
导航模块,用于机器人接收原始目标点并进行导航;
行人检测模块,用于进行行人检测并输出行人的位置和行人的属性;
避障范围判断模块,用于根据行人的位置判断行人是否在避障范围内;
条件变分自动编码器训练模块,用于生成坐标形式的临时避障点;
临时避障点筛选模块,用于根据临时避障点筛选代价最低的最优临时避障点;
接收最优临时避障点模块,用于机器人接收最优临时避障点进行导航;
最优临时避障点到达判断模块,用于判断机器人是否到达最优临时避障点。
本发明的上述技术方案相比现有技术具有以下优点:
本发明全面考虑行人信息,将行人位置信息(位置、速度、方向)、行人属性信息(性别、体宽、年龄、情绪)、静态环境信息(障碍物位置)和机器人导航信息(起点、终点)编码到深度学习模型(条件变分自动编码器)中训练,在保证可以根据新的导航环境生成临时避障点,引导路径规划器生成满足行人舒适度路径的同时,当机器人面对不同性别、体宽、年龄、情绪的行人时会采取不同的避障策略;
本发明将深度学习与导航动态避障相结合,训练出了有行人注意力的模型,在机器人识别到将会引起导航冲突的行人后,综合考虑行人的位置和属性,生成临时避障点,引导机器人规划出满足行人舒适度的路径,减少了由于环境的不确定性引起的机器人迷失、碰撞等问题,增强了移动机器人导航过程中的社会意识。
附图说明
为了使本发明的内容更容易被清楚的理解,下面根据本发明的具体实施例并结合附图,对本发明作进一步详细的说明,其中
图1是底盘运动模型图。
图2是模拟路径图。
图3是环境不确定性对于路径规划的影响图。
图4为本发明的方法流程图。
图5为模型生成临时避障点的示意图。
图6为筛选临时避障点的示意图。
图7为场景一由临时避障点引导的路径和原始路径的示意图。
图8为本发明完成一次任务全部过程的示意图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步说明,以使本领域的技术人员可以更好地理解本发明并能予以实施,但所举实施例不作为对本发明的限定。
实施例一
参照图1所示,在本发明的其中一种实施方式中提供一种基于条件变分自动编码器的移动机器人避障方法,包括如下步骤:
步骤S1:初始化机器人的行人避障区域,以机器人为中心构建栅格矩阵并获取障碍点位置;
步骤S2:机器人根据栅格矩阵从起点向目标点进行导航并移动;
步骤S3:机器人对行人进行检测并获取行人位置信息和行人属性信息;
步骤S4:根据行人的位置判断行人是否在避障范围内,若否,则返回步骤S2,若是,则执行步骤S5;
步骤S5:输入步骤S3中行人外部信息(位置、速度、方向)、行人内部信息(性别、体宽、年龄、情绪)、二维栅格地图形式的静态环境信息(障碍物位置)和步骤S2中机器人导航任务信息(起点、终点)到深度学习模型中,输出一组临时避障点;如图2所示,本实施例中输出的临时避障点个数为5;
步骤S6:根据临时避障点筛选代价最低的最优临时避障点;如图3所示,通过设计的代价函数计算每个临时避障点的代价值,选取代价最低的作为最终的临时避障点。
步骤S7:机器人根据最优临时避障点再次进行导航;图4中的路径1为我们通过临时避障点引导机器人产生的路径,路径2为用原来的方法生成的路径;
步骤S8:判断机器人是否到达最优临时避障点,若未到达,则机器人继续移动直至最优临时避障点,若到达,则返回步骤S3,直至机器人到达目标点。
图5是整个方法完成一次任务的全部过程,其中路径1为我们通过临时避障点引导机器人产生的路径,路径2为用原来的方法生成的路径;
具体的,所述步骤S1中的行人避障区域是在栅格地图中以机器人为中心的正方形区域,大小可能根据地图分辨率以及用户希望机器人对行人的敏感程度来调节。行人避障区域主要是为了防止行人在离机器人较远时模型运行,导致避障不实时、效果不好的情况。
具体的,所述步骤S2中导航所使用的算法可以是大部分路径规划算法,如A*算法和快速搜索随机树算法(RRT),本实施例采用的路径规划算法是快速搜索随机树算法。
具体的,所述步骤S3中的行人信息捕获包括以下步骤:
步骤S31:通过机器人搭载的深度相机实时捕获周围图像;
步骤S32:应用行人检测算法对周围图像内的行人进行检测,输出行人在像素坐标系下的位置;
步骤S33:根据摄像机标定结果,将输出行人在像素坐标系下的位置通过坐标变换,输出行人在全局坐标系下的位置;
步骤S34:将步骤S33中t时刻内行人在全局坐标系下的位置变化进行计算,通过行人移动的距离与经过的时间,计算出行人的移动速度和移动方向,并根据恒速模型来预测出行人下一时刻的位置,本实施例中t的大小设置为1s;
步骤S35:通过摄像机捕获行人图像,并应用行人属性识别算法,输出行人的属性。
具体的,所述步骤S4中的行人位置判断包括以下步骤:
步骤S41:根据步骤S3中输出的行人全局坐标系下的位置,计算它在横坐标和纵坐标下分别到机器人所在位置的距离dx和dy
步骤S42:判断dx和dy是否都小于行人避障区域边长L的一半,如果都小于则表示行人出现在避障区域内否则没有出现,本实施例中L的大小设置为11;
具体的,所述步骤S5中的条件变分自动编码器是一种新的生成模型,主要分为编码和解码两个部分,我们把导航任务以及机器人、行人信息作为条件y,临时避障点作为标签x,编码部分将具有条件y的标签x压缩成低维空间的潜变量z;解码部分根据条件y将潜变量z重构成新的标签z’。条件变分自动编码器的功能就是形成一个条件y到标签x的映射关系。
具体的,所述步骤S5中的条件变分自动编码器的编码部分的网络结构,其中编码部分由两个全连接层网络和一个dropout层网络组成,本实施例中第一个全连接层的神经元的数量为512个,dropout层连接在第一个全连接层之后,它保留了50%的节点。第二个全连接层也有512个神经元。编码器的输入为样本x和条件变量y,输出为潜在变量z,编码网络的参数为
Figure BDA0003234386780000101
编码的过程可表示为
Figure BDA0003234386780000102
其中解码网络具有与编码网络相同的网络结构,两个全连接层和一个dropout层。dropout层的设置是为了防止模型的过度拟合,解码器的输入为编码器中的潜在变量z和条件y,输出是新的重构样本z’,解码网络的参数为θ,解码过程可表示为pθ(x|z,y);整个网络的训练目标是最大化似然函数的下界EvidenceLower Bound(ELBO)
Figure BDA0003234386780000103
其中第一项KL表示相对熵Kullback-Leibler divergence,第二项是重建损失,θ和
Figure BDA0003234386780000104
为参数向量。
具体的,所述步骤S5中运行训练好的条件变分自动编码器包括以下步骤:
步骤S51:初始化以机器人为中心的行人避障区域,以机器人为中心构建一个栅格矩阵,其中0表示没有障碍物,1表示有障碍物;本实施例中栅格矩阵的大小为11*11;
步骤S52:将行人当前位置坐标以及接下来两个时刻t1和t2的位置坐标分别通过全局到局部的坐标转换(将行人在整个地图中的位置转换到行人避障区域内的位置。)表示出来,并存入行人位置数组中;本实施例中数组的前两个数分别表示当时行人的x坐标和y坐标,后面四个数表示行人下两个时刻的坐标,本实施例中t1取1s,t2取2s;
步骤S53:将行人的属性用四个0/1变量表示并存入行人属性数组,其中第一个数值表示行人的性别,0表示男性,1表示女性;第二个数值表示体宽,0表示窄,1表示宽;第三个数值表示年纪,0表示中段年龄,1表示老人或小孩;第四个数值表示情绪,0表示开心或正常,1表示负面情绪;
根据行人心理学研究,女性会比男性对行人空间要求更高,体宽较宽的会比窄的行人对空间的要求更高,老人和小孩会比中段年龄的用户对空间要求更高,有负面情绪的行人会比正常开心的行人对空间的要求高;所以模型会在面对空间要求高的行人时,生成距离行人更远的临时避障点;
步骤S54:将上述表示环境信息的栅格矩阵、行人位置数组和行人属性数组以及导航任务的起点和终点输入到训练好的模型中;生成坐标形式的临时避障点xtemp
具体的,所述步骤S6中的代价函数时由临时避障点到行人、最近障碍物以及原始目标点的距离分别赋予权值ω1、ω2、ω3计算的,代价函数函数为:
Figure BDA0003234386780000111
其中xpi表示第i个行人的坐标,xobs表示最近障碍物的坐标,xgoal表示原始目标点的坐标;通过比较所有临时避障点的代价,将代价最小的点作为最优临时避障点xk;ω1、ω2、ω3为权重,本实施例中ω1设置为4,ω2设置为-2,ω3设置为2.5。
具体的,所述步骤S7中的最优临时避障点以ROS中话题的形式发布给机器人,由机器人打断原来的导航,机器人优先向最优临时避障点的导航;
具体的,所述步骤S8中判断机器人是否到达临时避障点,通过ROS订阅机器人的实时位置坐标并与最优临时避障点坐标相比较,如果两坐标距离小于等于一个阈值则表示已经到达;本实施例中设置的坐标差阈值为0.3。
实施例二
基于同一发明构思,本实施例提供了基于条件变分自动编码器的移动机器人避障***,其解决问题的原理与所述基于条件变分自动编码器的移动机器人避障方法类似,重复之处不再赘述。
本实施例提供基于条件变分自动编码器的移动机器人避障***,包括:
初始化模块,用于初始化机器人的行人避障区域;
导航模块,用于机器人接收原始目标点并进行导航;
行人检测模块,用于进行行人检测并输出行人的位置和行人的属性;
避障范围判断模块,用于根据行人的位置判断行人是否在避障范围内;
条件变分自动编码器训练模块,用于生成坐标形式的临时避障点;
临时避障点筛选模块,用于根据临时避障点筛选代价最低的最优临时避障点;
接收最优临时避障点模块,用于机器人接收最优临时避障点进行导航;
最优临时避障点到达判断模块,用于判断机器人是否到达最优临时避障点。
本领域内的技术人员应明白,本申请的实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,上述实施例仅仅是为清楚地说明所作的举例,并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引申出的显而易见的变化或变动仍处于本发明创造的保护范围之中。

Claims (8)

1.基于条件变分自动编码器的移动机器人避障方法,其特征在于,包括如下步骤:
步骤S1:初始化机器人的行人避障区域,以机器人为中心构建栅格矩阵并获取障碍点位置;
步骤S2:机器人根据栅格矩阵从起点向目标点进行导航并移动;
步骤S3:机器人对行人进行检测并获取行人位置信息和行人属性信息;
步骤S4:根据行人的位置判断行人是否在避障范围内,若否,则返回步骤S2,若是,则执行步骤S5;
步骤S5:根据行人位置信息,将行人的位置用坐标表示并存入行人位置数组中,根据行人的属性,将行人的属性用变量表示并存入行人属性数组,将障碍点位置、机器人的起点位置和目标点位置、行人位置数组、行人属性数组作为输入来训练条件变分自动编码器,生成坐标形式的临时避障点;
步骤S6:根据临时避障点筛选代价最低的最优临时避障点;
步骤S7:机器人根据最优临时避障点再次进行导航;
步骤S8:判断机器人是否到达最优临时避障点,若未到达,则机器人继续移动直至到达最优临时避障点,若到达,继续判断机器人是否到达目标点,若否则返回步骤S3,若是,则认为机器人到达目标点;
步骤S6中,所述根据临时避障点筛选代价最低的最优临时避障点的方法包括:根据临时避障点到行人、最近障碍物以及原始目标点的距离设计代价函数,根据代价函数计算每个临时避障点的代价值并选取代价最低的临时避障点作为最优临时避障点;
所述代价函数为:
Figure FDA0003916702210000021
其中xtemp表示临时避障点,xpi表示第i个行人的坐标,xobs表示最近障碍物的坐标,xgoal表示原始目标点的坐标;ω1、ω2、ω3为权重。
2.根据权利要求1所述的基于条件变分自动编码器的移动机器人避障方法,其特征在于,步骤S3中,所述机器人对行人进行检测并获取行人位置信息和行人属性信息的方法包括:
步骤S31:通过机器人搭载的深度相机实时捕获周围图像;
步骤S32:应用行人检测算法对周围图像内的行人进行检测,获取行人在像素坐标系下的位置,应用行人属性识别算法对周围图像内的行人进行识别,获取行人属性信息;
步骤S33:将行人在像素坐标系下的位置通过坐标变换,输出行人在全局坐标系下的位置;
步骤S34:根据行人在全局坐标系下的位置,通过行人移动的距离与经过的时间,计算出行人的移动速度和移动方向并根据恒速模型来预测出行人下一时刻的位置。
3.根据权利要求1所述的基于条件变分自动编码器的移动机器人避障方法,其特征在于,步骤S4中,所述根据行人的位置判断行人是否在避障范围内的方法包括:
步骤S41:根据行人在全局坐标系下的位置,计算其在横坐标和纵坐标下分别到机器人所在位置的距离dx和dy
步骤S42:判断dx和dy是否都小于行人避障区域边长的一半,所述行人避障区域是在栅格地图中以机器人为中心的正方形区域,若是,则表示行人在避障区域内,若否,则表示行人不在避障区域内。
4.根据权利要求2所述的基于条件变分自动编码器的移动机器人避障方法,其特征在于,步骤S5中,所述根据行人位置信息,将行人的位置用坐标表示并存入行人位置数组中的方法为:将行人当前位置坐标以及接下来两个时刻的位置坐标分别通过全局到局部的坐标转换表示出来,并行人位置数组中,前两个数分别表示当时行人的x坐标和y坐标,后面四个数表示行人下两个时刻的坐标。
5.根据权利要求1所述的基于条件变分自动编码器的移动机器人避障方法,其特征在于,步骤S5中,所述根据行人的属性,将行人的属性用变量表示并存入行人属性数组的方法为:将行人的属性用四个0/1变量表示并存入行人属性数组中,所述四个0/1变量中,第一个数值表示行人的性别,0表示男性,1表示女性;第二个数值表示体宽,0表示窄,1表示宽;第三个数值表示年纪,0表示中段年龄,1表示老人或小孩;第四个数值表示情绪,0表示开心或正常,1表示负面情绪。
6.根据权利要求1所述的基于条件变分自动编码器的移动机器人避障方法,其特征在于,步骤S7中,所述机器人根据最优临时避障点再次进行导航的方法包括:所述最优临时避障点以ROS中话题的形式发布给机器人,由机器人打断原来的导航,机器人优先向最优临时避障点的导航。
7.根据权利要求1所述的基于条件变分自动编码器的移动机器人避障方法,其特征在于,步骤S8中,所述判断机器人是否到达最优临时避障点的方法包括:通过ROS获取机器人的实时位置坐标,计算机器人的实时位置坐标与最优临时避障点的坐标的距离,若距离小于等于预设阈值,则表示已经到达,若大于预设阈值,则表示未到达。
8.基于条件变分自动编码器的移动机器人避障***,其特征在于,包括:
初始化模块,用于初始化机器人的行人避障区域,以机器人为中心构建栅格矩阵并获取障碍点位置;
导航模块,用于机器人根据栅格矩阵从起点向目标点进行导航并移动;
行人检测模块,用于进行行人检测并输出行人的位置和行人的属性;
避障范围判断模块,用于根据行人的位置判断行人是否在避障范围内;
条件变分自动编码器训练模块,用于根据行人位置信息,将行人的位置用坐标表示并存入行人位置数组中,根据行人的属性,将行人的属性用变量表示并存入行人属性数组,将障碍点位置、机器人的起点位置和目标点位置、行人位置数组、行人属性数组作为输入来训练条件变分自动编码器,生成坐标形式的临时避障点;
临时避障点筛选模块,用于根据临时避障点筛选代价最低的最优临时避障点;
接收最优临时避障点模块,用于机器人根据最优临时避障点再次进行导航;
最优临时避障点到达判断模块,用于判断机器人是否到达最优临时避障点,直至机器人到达目标点;
在临时避障点筛选模块中,所述根据临时避障点筛选代价最低的最优临时避障点的方法包括:根据临时避障点到行人、最近障碍物以及原始目标点的距离设计代价函数,根据代价函数计算每个临时避障点的代价值并选取代价最低的临时避障点作为最优临时避障点;
所述代价函数为:
Figure FDA0003916702210000041
其中xtemp表示临时避障点,xpi表示第i个行人的坐标,xobs表示最近障碍物的坐标,xgoal表示原始目标点的坐标;ω1、ω2、ω3为权重。
CN202110997644.2A 2021-08-27 2021-08-27 基于条件变分自动编码器的移动机器人避障方法及*** Active CN113515131B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110997644.2A CN113515131B (zh) 2021-08-27 2021-08-27 基于条件变分自动编码器的移动机器人避障方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110997644.2A CN113515131B (zh) 2021-08-27 2021-08-27 基于条件变分自动编码器的移动机器人避障方法及***

Publications (2)

Publication Number Publication Date
CN113515131A CN113515131A (zh) 2021-10-19
CN113515131B true CN113515131B (zh) 2022-12-27

Family

ID=78062951

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110997644.2A Active CN113515131B (zh) 2021-08-27 2021-08-27 基于条件变分自动编码器的移动机器人避障方法及***

Country Status (1)

Country Link
CN (1) CN113515131B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114199266A (zh) * 2021-11-25 2022-03-18 江苏集萃智能制造技术研究所有限公司 一种基于导诊服务机器人的目标被占用的路径规划方法
CN114625139A (zh) * 2022-03-11 2022-06-14 深圳市普渡科技有限公司 机器人以及机器人自动行驶方法、装置和介质
CN115309164B (zh) * 2022-08-26 2023-06-27 苏州大学 基于生成对抗网络的人机共融移动机器人路径规划方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4464912B2 (ja) * 2004-12-03 2010-05-19 パナソニック株式会社 ロボット制御装置及び自律移動ロボット
JP4576445B2 (ja) * 2007-04-12 2010-11-10 パナソニック株式会社 自律移動型装置および自律移動型装置用プログラム
CN103558856A (zh) * 2013-11-21 2014-02-05 东南大学 动态环境下服务动机器人导航方法
CN106708054B (zh) * 2017-01-24 2019-12-13 贵州电网有限责任公司电力科学研究院 结合地图栅格与势场法避障的巡检机器人路径规划方法
CN108255182B (zh) * 2018-01-30 2021-05-11 上海交通大学 一种基于深度强化学习的服务机器人行人感知避障方法
CN108762264B (zh) * 2018-05-22 2021-05-04 重庆邮电大学 基于人工势场与滚动窗口的机器人的动态避障方法
CN110561432B (zh) * 2019-08-30 2021-04-23 广东省智能制造研究所 一种基于人机共融的安全协作方法及装置
CN111612078A (zh) * 2020-05-25 2020-09-01 中国人民解放军军事科学院国防工程研究院 一种基于条件变分自动编码器的变压器故障样本增强方法
CN112015186B (zh) * 2020-09-09 2024-07-19 上海有个机器人有限公司 一种具有社会属性的机器人路径规划方法、装置和机器人
CN112378408B (zh) * 2020-11-26 2023-07-25 重庆大学 一种实现轮式移动机器人实时避障的路径规划方法
CN112631294B (zh) * 2020-12-16 2022-06-28 上海应用技术大学 一种移动机器人智能路径规划方法
CN112904842B (zh) * 2021-01-13 2022-07-15 中南大学 一种基于代价势场的移动机器人路径规划与优化方法
CN112882469B (zh) * 2021-01-14 2022-04-08 浙江大学 一种融合全局训练的深度强化学习避障导航方法

Also Published As

Publication number Publication date
CN113515131A (zh) 2021-10-19

Similar Documents

Publication Publication Date Title
CN113515131B (zh) 基于条件变分自动编码器的移动机器人避障方法及***
Song et al. Pedestrian trajectory prediction based on deep convolutional LSTM network
JP7471397B2 (ja) 道路シーンにおける多様な長期将来軌道のシミュレーション
CN110285813B (zh) 一种室内移动机器人人机共融导航装置及方法
KR101986002B1 (ko) 행동-인식 연결 학습 기반 의도 이해 장치, 방법 및 그 방법을 수행하기 위한 기록 매체
JP7339029B2 (ja) モーション認識モデルを用いた自体運動推定装置及び方法並びにモーション認識モデルトレーニング装置及び方法
CN107272680A (zh) 一种基于ros机器人操作***的机器人自动跟随方法
Yang et al. A novel graph-based trajectory predictor with pseudo-oracle
Mirsky et al. Prevention and resolution of conflicts in social navigation–a survey
CN110737968A (zh) 基于深层次卷积长短记忆网络的人群轨迹预测方法及***
Cheng et al. Mixed traffic trajectory prediction using lstm–based models in shared space
Lu et al. Socially aware robot navigation in crowds via deep reinforcement learning with resilient reward functions
Wang et al. Deep reinforcement learning-aided autonomous navigation with landmark generators
KR102331803B1 (ko) 시각 및 언어 기반 공간 탐색 시스템
Xu et al. Avoidance of manual labeling in robotic autonomous navigation through multi-sensory semi-supervised learning
CN115309164B (zh) 基于生成对抗网络的人机共融移动机器人路径规划方法
Singh et al. Understanding socially aware robot navigation
Wang et al. NavFormer: A Transformer Architecture for Robot Target-Driven Navigation in Unknown and Dynamic Environments
Katuwandeniya et al. Multi-modal scene-compliant user intention estimation in navigation
Luo et al. Recursive neural network based semantic navigation of an autonomous mobile robot through understanding human verbal instructions
Wang et al. The group interaction field for learning and explaining pedestrian anticipation
Katyal et al. Prediction-based uncertainty estimation for adaptive crowd navigation
Xu et al. SoLo T-DIRL: Socially-Aware Dynamic Local Planner based on Trajectory-Ranked Deep Inverse Reinforcement Learning
Chung et al. Slammot-sp: simultaneous slammot and scene prediction
Truong et al. An integrative approach of social dynamic long short-term memory and deep reinforcement learning for socially aware robot navigation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant