CN104298239A - 一种室内移动机器人增强地图学习路径规划方法 - Google Patents

一种室内移动机器人增强地图学习路径规划方法 Download PDF

Info

Publication number
CN104298239A
CN104298239A CN201410512492.2A CN201410512492A CN104298239A CN 104298239 A CN104298239 A CN 104298239A CN 201410512492 A CN201410512492 A CN 201410512492A CN 104298239 A CN104298239 A CN 104298239A
Authority
CN
China
Prior art keywords
mobile robot
indoor mobile
path
map
barrier
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410512492.2A
Other languages
English (en)
Other versions
CN104298239B (zh
Inventor
王耀南
陈彦杰
钟杭
潘琪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan University
Original Assignee
Hunan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan University filed Critical Hunan University
Priority to CN201410512492.2A priority Critical patent/CN104298239B/zh
Publication of CN104298239A publication Critical patent/CN104298239A/zh
Application granted granted Critical
Publication of CN104298239B publication Critical patent/CN104298239B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)

Abstract

本发明公开了一种室内移动机器人增强地图学习路径规划方法,其步骤为:(1)获取周围环境信息,建立障碍概率密度模型;(2)利用贪心算法和增强地图学习方法进行路径规划;(3)室内移动机器人路径选择及自适应速度调整策略。采用的增强地图学习路径规划能够根据室内移动机器人的当前状况和机器人固有的非完整约束,实时规划当前最佳路径,同时自适应的速度调整策略可以兼顾室内移动机器人的越障能力,目标点收敛能力和规划效率,使室内移动机器人能够安全有效的到达指定位置。

Description

一种室内移动机器人增强地图学习路径规划方法
技术领域
本发明涉及地面轮式机器人的自主导航领域,特别涉及一种室内移动机器人增强地图学习路径规划方法。
背景技术
随着机器人技术的发展和人工智能研究的不断深入,智能机器人在人类生活中扮演越来越重要的角色。作为常见生活机器人的一种,室内移动机器人作为服务人员的代替者多用于室内移动展会,家庭服务,酒店大厅引导等复杂动态环境。在这类环境中,环境信息非结构化,静态动态障碍物交错存在,环境信息变化明显,这些因素对室内移动机器人的工作能力提出了极大的挑战和要求。为较好地完成服务任务,室内移动机器人需要具有探测障碍物,区分识别障碍物,实时规划可行路径,稳定控制行动的能力。随着传感器技术、计算机技术和网络通信技术的不断发展,实时路径规划作为智能机器人的大脑成为室内移动机器人研究的重中之重。
室内移动机器人在环境中的任务可以理解为从哪儿来?到哪儿去?怎么去?去做什么?而路径规划能够统筹传感器获得的环境信息做出最符合机器人当前状况的路径决策,即怎么去。常规的路径规划可以分别静态规划和动态规划,静态规划是指机器人已具备全局环境信息,机器人通过离线计算得到全局环境下最优的规划路径,而动态路径规划多针对动态未知环境中的路径选择,机器人对环境信息理解有限且环境可能发生改变,与真实情况具有高度的相似性。对于室内移动机器人,我们期望其能够实现在室内移动动态环境中的实时最佳路径选择和动态障碍物躲避。
作为控制和规划的对象,室内移动机器人是一类具有时变、强耦合和非完整性的多输入多输出非线性***。由于环境多变复杂且需要考虑较多因素,其规划决策变的十分复杂。在现有的技术中,常规的路径规划,如模糊规划,遗传算法,蚁群算法,神经网络等,往往不能同时满足动态环境和实时性的要求。另外,轮式移动机器人存在的非完整性也制约着室内移动机器人的路径选择。因此,研究具有学习能力的路径规划算法成为现阶段实时动态路径规划研究的一个主流趋势。而设计一种简单可靠、实时性好、便于实现、能够应付多类动态未知环境的室内移动机器人规划方法是保证服务工作正常有效进行的关键技术和现实难题。
发明内容
本发明针对上述现有技术中现在路径规划方法中难以同时满足动态未知环境规划和实时规划的要求,采用增强地图学习的路径规划方法,随着室内移动机器人的移动,不断加深理解新获得的周围环境信息,迭代计算随机选取路径的代价函数,学习计算得出当前时刻最优的路径,保证了室内移动机器人的静态障碍下的良好避障性能,而且满足了动态障碍出现时的实时规划功能,达到具有较高智能化的室内移动机器人的自主导航和路径规划方法。
一种室内移动机器人增强地图学习路径规划方法,包括以下几个步骤:
步骤1:建立已探测区域受障碍物影响的概率模型;
首先,通过室内移动机器人自身携带的声呐传感器,获得室内移动机器人的周围环境信息;其次,将室内移动机器人所经过的区域作为已探测区域,依据所述的周围环境信息建立已探测区域受障碍物影响的概率模型,并依据声呐传感器实时采集的周围环境信息实时更新已探测区域受障碍物影响的概率模型;
所述已探测区域受障碍物影响的概率模型如下:
F ( X , Y ) = 1 - Π i = 1 M [ 1 - f i ( X , Y ) ]
其中,室内移动室内移动机器人工作空间信息集合为所述空间信息包括所有目标位置及所有障碍物位置;当前探测范围内工作空间信息集合为已探测出的工作空间信息集合为
室内移动机器人通过声呐雷达探测到的障碍物与机器人当前位置之间的相对距离信息,利用室内移动机器人自身携带的里程仪和惯性导航***,将相对距离信息转换为以初始位置为原点的基础坐标系上的位置信息和距离信息。
{(X,Y)}为已探测区域,的地图上探测到有M个障碍物,fi(X,Y)为第i个障碍物的对室内移动机器人路径选择的影响函数,采用正态分布表示如下:
f i ( X , Y ) = 1 2 π σ i e ( - D i 2 2 σ i )
其中,σi为第i个障碍物的影响范围系数,取值范围为[0,1];Di为第i个障碍物到已探测区域内所有位置的距离矩阵,矩阵大小与地图大小一致为N*N,距离矩阵中的每个元素为障碍物到地图上各位置的物理距离;
步骤2:基于贪心算法和增强学习迭代策略,在设定的最大迭代次数kmax内,迭代更新当前位置pnow(t)与目标位置pgoal之间的路径代价函数,以达到收敛的路径代价函数对应的路径作为当前时刻的最佳路径,具体过程如下:
步骤2.1:令k=1,k表示迭代次数;
步骤2.2:判断当前迭代次数是否已超过设定的最大迭代次数,若超过,则返回步骤2.1;否则,进入步骤2.3;
返回步骤2.1是指从第一次迭代开始,重新构建初始路径后,再次进入迭代搜寻最佳路径;
步骤2.3:从获得的周围环境信息对应的已知地图中,随机选择一个位置pk***室内移动机器人所在当前位置pnow(t)与目标位置pgoal,其中,pk满足条件{pr}为之前迭代最佳路径代价函数下的路径点集合,为室内移动机器人工作空间信息集合;按以下公式计算第k次迭代得到的路径代价函数 G p now ( t ) k + 1 = min { G p now ( t ) k , R p now ( t ) , p k + G p k } ;
上述公式为利用增强学习机制得到的路径代价函数计算公式;
其中,第k-1次迭代得到的路径代价函数,且 为已知地图上当前位置pnow(t)与所选位置pk之间的连接权值,为采用贪心算法获得的在第k次迭代完成后获得的从位置pk-1到目标位置pgoal的最佳路径代价函数:
G p k = R p k , p goal + G p goal k = 1 min { R p k , p goal + G p goal , R p k , p k - 1 + G p k - 1 } k ≠ 1
其中,为目标位置pgoal的代价函数,且为已知地图上在第k次所选位置点pk和第k-1次所选位置pk-1之间的连接权值;
在已知地图中任意两位置pa和pb之间的连接权值由两位置之间的直线距离和该直线上穿过的障碍物影响概率构成: R p a , p b = d p a , p b + max ( ∫ C p a , p b F ( X , Y ) ds )
其中,为位置pa到位置pb两点之间的物理位置距离;为位置pa到位置pb的路径点集合,ds为路径积分单元;max()为最大值求函数,即求得位置pa到位置pb的路径集合中某一路径受障碍物影响的最大概率;
步骤2.4:判断迭代后得到的路径代价函数是否已经达到收敛,如果收敛,则退出迭代过程,将已收敛的路径代价函数对应的路径作为最佳路径进入步骤3;否则,将迭代次数k加1,返回步骤2.2;
步骤3:以步骤2得到的最佳路径作为室内移动机器人当前的预选择路径,依据预选择路径和室内移动机器人的位置和速度矢量判断室内移动机器人的偏转角φt是否满足轮式机器人不能侧向滑动的非完整约束,确定室内移动机器人是否按照预选择路径方向移动:
若不满足,则返回步骤2,重新构建当前时刻的所有路径;由于在步骤2.3中,***室内移动机器人所在当前位置pnow(t)与目标位置pgoal之间的位置pk为随机选择,其中,pk满足条件{pr}为之前迭代最佳路径代价函数下的路径点集合,为室内移动机器人工作空间信息集合。因此,在返回步骤2后,随机选择得到的***位置,会与之前的已选过的***位置不同,可以得到新的路径;
若满足则以设定的室内移动机器人移动速度沿当前时刻规划出的最佳路径方向移动,进入下一时刻的路径规划,t=t+1,返回步骤1,直到室内移动机器人移动到目标位置,完成路径规划;
所述室内移动机器人的偏转角φt是否满足轮式机器人不能侧向滑动的非完整约束是指:φt∈[0,60°]∪[120°,180°];
其中,pt和pt-1分别为室内移动机器人当前位置和上一时刻所在位置,为在t时刻,室内移动机器人由规划得到的最佳路径中第一个路径点,即室内移动机器人在t+1时刻的预抵达位置。
pt-1由pt-1=pt-vt得到,v为设定的室内移动机器人移动速度。
所述步骤2中***室内移动机器人所在当前位置pnow(t)与目标位置pgoal之间的位置pk的选取依据如下:
1)当目标位置出现在室内移动机器人当前已探测范围内则将目标位置作为第1次迭代时选取的位置:p1=pgoal;从第2次迭代即k=2开始,pk为在地图范围内随机选取的位置,且需满足条件其中,{pr}为之前迭代最佳路径代价函数下的路径点集合,为室内移动机器人工作空间信息集合;
2)当目标位置未出现在室内移动机器人当前已探测范围内时,则每次迭代过程中位置pk为从已知地图中随机选取的位置。
所述步骤1中室内移动机器人自身所携带声呐传感器是指所采用底盘Pioneer-2DX自身携带的声呐探测雷达。
所述已知地图中任意两位置pa和pb之间的连接权值按以下公式计算:
R p a , p b = d p a , p b + k m × max ( ∫ C p a , p b F ( X , Y ) ds ) ,
其中,km为障碍物影响放大系数有利于提高机器人的避障效果,取值范围为[50,1000]。
所述步骤4中设定的室内移动机器人v按以下公式进行自适应调整:
其中,pbarrier为障碍物位置,v0为室内移动机器人移动的基础速度设定值,为当前探测范围内工作空间信息集合,包括当前探测范围内的障碍物位置,目标点位置,和可移动区域地图位置信息。
有益效果
与现有技术相比,本发明的优点在于:
1、本发明采用地图障碍物的概率建模,将室内移动机器人探测到的障碍物通过概率的方式构建影响模型,使障碍物对周围环境构成连续的影响,并且这种影响只针对室内移动机器人已探测过的区域;
2、本发明与以往传统的移动机器人路径规划相比,通过对室内服务加入地图学习能力,使机器人能够对不断增加的地图信息进行分析学习,通过贪婪算法学习得到当前位置下最好的规划路径。
3、本发明规定了室内移动机器人规划时的非完整约束和自适应速度移动策略,不仅解决了路径规划算法的实际***应用问题,而且兼顾了室内移动机器人的规划效率和移动安全性。
附图说明
图1是本发明所述方法的流程图;
图2是室内移动机器人硬件***结构示意图;
图3是室内移动机器人非完整约束示意图;
图4是采用本发明所述方法在动态和静态环境下的路径规划效果图,其中,图(a)增强地图学习路径规划躲避动态障碍时的效果图;图(b)增强地图学习路径规划躲避静态障碍时的效果图;图(c)增强地图学习路径规划最终完成时的效果图。
具体实施方式
以下将结合附图和具体实施案例对本发明做进一步说明。
如图1所示,本发明为一种室内移动机器人增强地图学习路径规划方法,包括以下几个步骤:
步骤1:建立已探测区域受障碍物影响的概率模型;
首先,通过室内移动机器人自身携带的声呐传感器,获得室内移动机器人的周围环境信息;其次,将室内移动机器人所经过的区域作为已探测区域,依据所述的周围环境信息建立已探测区域受障碍物影响的概率模型,并依据声呐传感器实时采集的周围环境信息实时更新已探测区域受障碍物影响的概率模型;
所述步骤1中室内移动机器人自身所携带声呐传感器是指所采用底盘Pioneer-2DX自身携带的前方八个方向的声呐探测雷达,如图2所示。根据声呐传感器探测到的障碍物信息,构建已探测过区域的障碍物概率影响模型如下:
F ( X , Y ) = 1 - Π i = 1 M [ 1 - f i ( X , Y ) ] - - - ( 1 )
其中,室内移动机器人工作空间信息集合为所述空间信息包括所有目标位置及所有障碍物位置;当前探测范围内工作空间信息集合为已探测出的工作空间信息集合为
【室内移动机器人通过声呐雷达探测到的障碍物与机器人当前位置之间的相对距离信息,利用室内移动机器人自身携带的里程仪和惯性导航***,将相对距离信息转换为以初始位置为原点的基础坐标系上的位置信息和距离信息。】
{(X,Y)}为已探测区域,的地图上探测到有M个障碍物,fi(X,Y)为第i个障碍物的对室内移动机器人路径选择的影响函数,采用正态分布表示如下:
f i ( X , Y ) = 1 2 π σ i e ( - D i 2 2 σ i ) - - - ( 2 )
其中,σi为第i个障碍物的影响范围系数,取值范围为[0,1];Di为第i个障碍物到已探测区域内所有位置的距离矩阵,矩阵大小与地图大小一致为N*N;
步骤2:基于贪心算法和增强学习迭代策略,在设定的最大迭代次数kmax内,迭代更新当前位置pnow(t)与目标位置pgoal之间的路径代价函数,以达到收敛的路径代价函数对应的路径作为当前时刻的最佳路径,具体过程如下:
步骤2.1:令k=1,k表示迭代次数;
步骤2.2:判断当前迭代次数是否已超过设定的最大迭代次数,若超过,则返回步骤2.1,;否则,进入步骤2.3;
返回步骤2.1是指从第一次迭代开始,重新构建初始路径后,再次进入迭代搜寻最佳路径;
步骤2.3:从获得的周围环境信息对应的已知地图中,随机选择一个位置pk***室内移动机器人所在当前位置pnow(t)与目标位置pgoal,按以下公式计算第k次迭代得到的路径代价函数
G p now ( t ) k + 1 = min { G p now ( t ) k , R p now ( t ) , p k + G p k } - - - ( 3 )
其中,第k-1次迭代得到的路径代价函数,且 为已知地图上当前位置pnow(t)与所选位置pk之间的连接权值,为采用贪心算法获得的在第k次迭代完成后获得的从位置pk-1到目标位置pgoal的最佳路径代价函数:
G p k = R p k , p goal + G p goal k = 1 min { R p k , p goal + G p goal , R p k , p k - 1 + G p k - 1 } k ≠ 1 - - - ( 4 )
其中,为目标位置pgoal的代价函数,且为已知地图上在第k次所选位置点pk和第k-1次所选位置pk-1之间的连接权值;
在已知地图中任意两位置pa和pb之间的连接权值由两位置之间的直线距离和该直线上穿过的障碍物影响概率构成:
R p a , p b = d p a , p b + k m × max ( ∫ C p a , p b F ( X , Y ) ds ) - - - ( 5 )
其中,为位置pa到位置pb两点之间的物理位置距离;为位置pa到位置pb的路径点集合,ds为路径积分单元;max()为最大值求函数;
步骤2.4:判断迭代后得到的路径代价函数是否已经达到收敛,如果收敛,则退出迭代过程,将已收敛的路径代价函数对应的路径作为最佳路径进入步骤3;否则,将迭代次数k加1,返回步骤2.2;
步骤3:以步骤2得到的最佳路径作为室内移动机器人当前的预选择路径,依据预选择路径和室内移动机器人的位置和速度矢量判断室内移动机器人的偏转角φt是否满足轮式机器人不能侧向滑动的非完整约束,确定室内移动机器人是否按照预选择路径方向移动:
若不满足,则返回步骤2,重新构建当前时刻的所有路径;由于在步骤2.3中,***室内移动机器人所在当前位置pnow(t)与目标位置pgoal之间的位置pk为随机选择,其中,pk满足条件{pr}为之前迭代最佳路径代价函数下的路径点集合,为室内移动机器人工作空间信息集合。因此,在返回步骤2后,随机选择得到的***位置,会与之前的已选过的***位置不同,可以得到新的路径;
若满足则以自适应速度沿当前时刻规划出的最佳路径方向移动,进入下一时刻的路径规划,t=t+1,返回步骤1,直到室内移动机器人移动到目标位置,完成路径规划;
一般而言,由于轮式移动机器人无法发生侧向移动,可假定轮式移动机器人在运动过程中无打滑,仅作纯滚动。即认为机器人在其横轴上没有运动分量,该非完整约束可表述为:
x · sin θ - y · cos θ = 0
所述室内移动机器人的偏转角φt是否满足轮式机器人不能侧向滑动的非完整约束是指:φt∈[0,60°]∪[120°,180°],如图3所示;
其中,pt和pt-1分别为室内移动机器人当前位置和上一时刻所在位置,为在t时刻,室内移动机器人由规划得到的最佳路径中第一个路径点,即室内移动机器人在t+1时刻的预抵达位置。
室内移动机器人以自适应速度v移动:
算法性能分析
1、收敛性分析
在学习迭代策略中,由式(3),(4)可知若迭代次数足够大,将最终收敛到一个稳定的点.
引理1对于地图中任意一点pi,i∈N2与目标点pgoal之间路径的代价函数是一个随迭代次数k增加而单调递减的序列。
由式(4)可知,步骤2中第一次选取的地图位置p1将在第一次迭代时作为当前位置与目标位置之间的***位置,形成初始路径。从第二次迭代开始,新的随机选取位置***后,路径代价函数将在下面两个选择中选取最小的一个:
(1)起点——新***位置pk——目标点的路径连线。
(2)起点——新***位置pk——之前迭代最佳代价函数路径{pr|r∈k}的路径连线。
定理1假设任意两个位置的连接权值R恒为正,且第一次迭代的会产生当前位置与目标位置的初始路径代价函数利用式(3)和式(4)更新路径代价函数具有下面几个性质。
1、任意位置与目标位置的路径代价函数序列会最终收敛。
2、目标位置的代价函数对于地图上任意位置的与目标位置之间的路径代价函数将在一定迭代次数后保持稳定。
3、从目标点pgoal开始,一定能在有限步内找到起始点。
证明:
性质1:由公式(5)可知,任意两不同位置之间的距离i,j∈N2为正,路径上的累计概率影响∫CF(X,Y)ds也为正数,因此,任意两不同位置的连接权值R为正数,代价函数G也为正数。根据引理1,对于任意一个pnow(t)与目标位置之间路径的代价函数序列随着迭代次数的增加将会收敛到最小边界上。
性质2:由代价函数初始化可知目标点的代价函数恒为0,由性质1可知,将最终收敛,若迭代次数大于地图上位置的个数,则当前位置与目标点的位置之间的路径选取遍历全地图,即取到最优解,继续迭代则代价函数保持最小不变。
性质3:根据学习策略,选取当前点的与目标点之间的路径后,该路径中包含的已选取随机位置序列{pr|r∈k}在下次迭代中不可取。因此,在一定的迭代次数后,地图中的所有位置都会被选取,包括起点。
2、复杂性分分析
为了表示算法的复杂程度,定义变量T表示路径寻找的时间(步数),具体的复杂度分析如下所示:
(1)若定义二维地图大小为N×N,则计算全地图所有位置之间的连接权值的复杂度为N4,其中,i,j∈N2,i≠j。
(2)在学***均时间。
(3)当机器人完成t时刻的路径选取,进入t+1时刻后,更新地图的连接权值复杂度为N4
因此,室内移动机器人从起点到终点的路径复杂度可表示为:
以下用一个具体的应用实例对本发明的操作进行详细描述,本发明的增强地图学习路径规划算法主要应用于室内移动机器人的自主导航和避障规划中,这里主要针对静态和动态两类障碍物环境中的目标点抵达来体现其性能。具体设置如下:
实验环境设置为栅格地图,地图大小N=50m,地图中兼具动态和静态两类障碍,动态障碍初始位于(5,10),以速度1m/s在(5,10)与(15,10)之间往返运动,静态障碍物为L形障碍,其中静态障碍物1的三个顶点分别为(18,20),(25,20),(25,10),静态障碍物2的三个顶点分别为(30,40),(30,35),(38,35)。室内移动机器人只能通过其底盘携带的八个声呐传感器获得移动前方八个方向的地图障碍物信息。障碍物影响放大系数km=500,障碍物影响范围σi=1,i=1,2,..,M,室内移动机器人的探测范围Rdetect=10m,基础移动速度v0=1m/s,室内移动机器人起始点为(0,0),目标点为(48,48)。
如图4所示,给出了室内移动室内移动机器人在兼具动态和静态环境中的实时动态路径规划轨迹。其中,图(a)增强地图学习路径规划躲避动态障碍时的效果;图(b)增强地图学习路径规划躲避静态障碍时的效果;图(c)增强地图学习路径规划最终完成时的效果;“*”代表机器人移动路径,“○”代表障碍物,障碍物周围的封闭线圈代表障碍物概率密度,越靠近障碍物,概率密度越大,即封闭线圈数越多,“□”代表目标位置。从图中可以看出,在给出目标位置后,尽管室内移动室内移动机器人对环境中的障碍物信息获取不全,且存在动态障碍,其依靠增强地图学习算法能够实现良好的目标抵达和避障功能,具有较好的规划效率和避障功能。

Claims (5)

1.一种室内移动机器人增强地图学习路径规划方法,其特征在于,包括以下几个步骤:
步骤1:建立已探测区域受障碍物影响的概率模型;
首先,通过室内移动机器人自身携带的声呐传感器,获得室内移动机器人的周围环境信息;其次,将室内移动机器人所经过的区域作为已探测区域,依据所述的周围环境信息建立已探测区域受障碍物影响的概率模型,并依据声呐传感器实时采集的周围环境信息实时更新已探测区域受障碍物影响的概率模型;
所述已探测区域受障碍物影响的概率模型如下:
F ( X , Y ) = 1 - Π i = 1 M [ 1 - f i ( X , Y ) ]
其中,室内移动机器人工作空间信息集合为所述空间信息包括所有目标位置及所有障碍物位置;当前探测范围内工作空间信息集合为已探测出的工作空间信息集合为
{(X,Y)}为已探测区域,的地图上探测到有M个障碍物,fi(X,Y)为第i个障碍物的对室内移动机器人路径选择的影响函数,采用正态分布表示如下:
f i ( X , Y ) = 1 2 π σ i e ( - D i 2 2 σ i )
其中,σi为第i个障碍物的影响范围系数,取值范围为[0,1];Di为第i个障碍物到已探测区域内所有位置的距离矩阵,矩阵大小与地图大小一致为N*N;
步骤2:基于贪心算法和增强学习迭代策略,在设定的最大迭代次数kmax内,迭代更新当前位置pnow(t)与目标位置pgoal之间的路径代价函数,以达到收敛的路径代价函数对应的路径作为当前时刻的最佳路径,具体过程如下:
步骤2.1:令k=1,k表示迭代次数;
步骤2.2:判断当前迭代次数是否已超过设定的最大迭代次数,若超过,则返回步骤2.1,;否则,进入步骤2.3;
步骤2.3:从获得的周围环境信息对应的已知地图中,随机选择一个位置pk***室内移动机器人所在当前位置pnow(t)与目标位置pgoal,其中,pk满足条件{pr}为之前迭代最佳路径代价函数下的路径点集合,为室内移动机器人工作空间信息集合;按以下公式计算第k次迭代得到的路径代价函数
其中,第k-1次迭代得到的路径代价函数,且 为已知地图上当前位置pnow(t)与所选位置pk之间的连接权值,为采用贪心算法获得的在第k次迭代完成后获得的从位置pk到目标位置pgoal的最佳路径代价函数:
G p k = R p k , p goal + G p goal k = 1 min { R p k , p goal + G p goal , R p k , p k - 1 + G p k - 1 } k ≠ 1
其中,为目标位置pgoal的代价函数,且 为已知地图上在第k次所选位置点pk和第k-1次所选位置pk-1之间的连接权值;
在已知地图中任意两位置pa和pb之间的连接权值由两位置之间的直线距离和该直线上穿过的障碍物影响概率构成: R p a , p b = d p a , p b + max ( ∫ C p a , p b F ( X , Y ) ds )
其中,为位置pa到位置pb两点之间的物理位置距离;为位置pa到位置pb的路径点集合,ds为路径积分单元;max()为最大值求函数;
步骤2.4:判断迭代后得到的路径代价函数是否已经达到收敛,如果收敛,则退出迭代过程,将已收敛的路径代价函数对应的路径作为最佳路径进入步骤3;否则,将迭代次数k加1,返回步骤2.2;
步骤3:以步骤2得到的最佳路径作为室内移动机器人当前的预选择路径,依据预选择路径和室内移动机器人的位置和速度矢量判断室内移动机器人的偏转角φt是否满足轮式机器人不能侧向滑动的非完整约束,确定室内移动机器人是否按照预选择路径方向移动:
若不满足,则返回步骤2;若满足则以设定的室内移动机器人移动速度沿当前时刻规划出的最佳路径方向移动,进入下一时刻的路径规划,t=t+1,返回步骤1,直到室内移动机器人移动到目标位置,完成路径规划;
所述室内移动机器人的偏转角φt是否满足轮式机器人不能侧向滑动的非完整约束是指:φt∈[0,60°]∪[120°,180°];
其中,pt和pt-1分别为室内移动机器人当前位置和上一时刻所在位置,为在t时刻,室内移动机器人由规划得到的最佳路径中第一个路径点,即室内移动机器人在t+1时刻的预抵达位置;
pt-1由pt-1=pt-vt得到,v为设定的室内移动机器人移动速度。
2.根据权利要求1所述的室内移动机器人增强地图学习路径规划方法,其特征在于,所述步骤2中***室内移动机器人所在当前位置pnow(t)与目标位置pgoal之间的位置pk的选取依据如下:
1)当目标位置出现在室内移动机器人当前已探测范围内则将目标位置作为第1次迭代时选取的位置:p1=pgoal;从第2次迭代即k=2开始,pk为在地图范围内随机选取的位置,且需满足条件其中,{pr}为之前迭代最佳路径代价函数下的路径点集合,为室内移动机器人工作空间信息集合;
2)当目标位置未出现在室内移动机器人当前已探测范围内时,则每次迭代过程中位置pk为从已知地图中随机选取的位置。
3.根据权利要求2所述的室内移动机器人增强地图学习路径规划方法,其特征在于,所述步骤1中室内移动机器人自身所携带声呐传感器是指所采用底盘Pioneer-2DX自身携带的声呐探测雷达。
4.根据权利要求3所述的室内移动机器人增强地图学习路径规划方法,其特征在于,所述已知地图中任意两位置pa和pb之间的连接权值按以下公式计算:
R p a , p b = d p a , p b + k m × max ( ∫ C p a , p b F ( X , Y ) ds ) ;
其中,km为障碍物影响放大系数有利于提高机器人的避障效果,取值范围为[50,1000]。
5.根据权利要求1-4任一项所述的室内移动机器人增强地图学习路径规划方法,其特征在于,所述步骤4中设定的室内移动机器人v按以下公式进行自适应调整:
其中,pbarrier为障碍物位置,v0为室内移动机器人移动的基础速度设定值,为当前探测范围内工作空间信息集合,包括当前探测范围内的障碍物位置,目标点位置,和可移动区域地图位置信息。
CN201410512492.2A 2014-09-29 2014-09-29 一种室内移动机器人增强地图学习路径规划方法 Active CN104298239B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410512492.2A CN104298239B (zh) 2014-09-29 2014-09-29 一种室内移动机器人增强地图学习路径规划方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410512492.2A CN104298239B (zh) 2014-09-29 2014-09-29 一种室内移动机器人增强地图学习路径规划方法

Publications (2)

Publication Number Publication Date
CN104298239A true CN104298239A (zh) 2015-01-21
CN104298239B CN104298239B (zh) 2016-08-24

Family

ID=52318014

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410512492.2A Active CN104298239B (zh) 2014-09-29 2014-09-29 一种室内移动机器人增强地图学习路径规划方法

Country Status (1)

Country Link
CN (1) CN104298239B (zh)

Cited By (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105095681A (zh) * 2015-09-21 2015-11-25 武汉理工大学 基于积分测度随机相遇不确定性的搜救方法及***
CN105571596A (zh) * 2016-01-18 2016-05-11 福州华鹰重工机械有限公司 多车辆环境探索方法及装置
CN106444769A (zh) * 2016-10-31 2017-02-22 湖南大学 一种室内移动机器人增量式环境信息采样的最优路径规划方法
CN107132846A (zh) * 2017-06-21 2017-09-05 南华大学 陌生室内场景下的γ辐射探测方法
CN107329445A (zh) * 2017-06-28 2017-11-07 重庆柚瓣家科技有限公司 机器人行为准则智能监管的方法
CN107608392A (zh) * 2017-09-19 2018-01-19 浙江大华技术股份有限公司 一种目标跟随的方法及设备
CN107692661A (zh) * 2017-11-06 2018-02-16 广东工业大学 一种自动行走婴儿床
CN107860389A (zh) * 2017-11-07 2018-03-30 金陵科技学院 机器人室内行走强化学习路径导航算法
CN107943072A (zh) * 2017-11-13 2018-04-20 深圳大学 无人机飞行路径生成方法、装置、存储介质及设备
CN108151742A (zh) * 2017-11-20 2018-06-12 北京理工华汇智能科技有限公司 机器人导航的数据处理方法及其智能装置
CN108827336A (zh) * 2018-09-26 2018-11-16 广东工业大学 一种基于无人驾驶的路径规划方法、装置及设备
CN109282813A (zh) * 2018-11-26 2019-01-29 深圳市海斯比船艇科技股份有限公司 一种无人艇全局障碍物识别的方法
WO2019019147A1 (en) * 2017-07-28 2019-01-31 Qualcomm Incorporated SELF-EXPLORATION CONTROL OF A ROBOTIC VEHICLE
CN109459052A (zh) * 2018-12-28 2019-03-12 上海大学 一种扫地机全覆盖路径规划方法
CN109947101A (zh) * 2019-03-18 2019-06-28 北京智行者科技有限公司 路径平滑处理方法及装置
CN110262543A (zh) * 2019-05-23 2019-09-20 北京航空航天大学 多目标点同时到达约束下的集群四维轨迹规划设计方法
CN110554687A (zh) * 2018-05-30 2019-12-10 中国北方车辆研究所 一种面向未知环境的多机器人自适应探测方法
CN110955239A (zh) * 2019-11-12 2020-04-03 中国地质大学(武汉) 一种基于逆强化学习的无人船多目标轨迹规划方法及***
CN111356939A (zh) * 2017-11-28 2020-06-30 松下知识产权经营株式会社 自走式病原体检测装置、病原体检测***以及控制方法
CN111413971A (zh) * 2020-03-19 2020-07-14 云南电网有限责任公司电力科学研究院 一种对象识别装置及识别方法
CN112333798A (zh) * 2020-11-05 2021-02-05 珠海格力电器股份有限公司 一种智能设备的控制方法及装置
CN112445222A (zh) * 2019-09-05 2021-03-05 阿里巴巴集团控股有限公司 导航方法、装置、存储介质以及终端
CN112631269A (zh) * 2019-10-08 2021-04-09 国立大学法人静冈大学 自主移动机器人及自主移动机器人的控制程序
CN112731919A (zh) * 2020-12-01 2021-04-30 汕头大学 一种基于人群密度估计的指引机器人方法及***
CN113065499A (zh) * 2021-04-14 2021-07-02 湖南大学 基于视觉学习驱动的空中机器人集群控制方法及***
CN113156933A (zh) * 2020-12-30 2021-07-23 徐宁 一种机器人行进控制***和方法
CN113324761A (zh) * 2020-02-28 2021-08-31 苏州宝时得电动工具有限公司 电动工具、车轮打滑确定***及方法
CN114237252A (zh) * 2021-12-17 2022-03-25 河南工业大学 一种融合卡尔曼滤波预测思想的适用于移动机器人导航的改进蚁群算法
CN114779792A (zh) * 2022-06-20 2022-07-22 湖南大学 基于模仿与强化学习的医药机器人自主避障方法及***
CN115494732A (zh) * 2022-09-29 2022-12-20 湖南大学 一种基于近端策略优化的无人机轨迹设计和功率分配方法

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02311909A (ja) * 1989-05-29 1990-12-27 Shinko Electric Co Ltd 移動ロボット
CN101650568A (zh) * 2009-09-04 2010-02-17 湖南大学 未知环境下移动机器人导航安全的方法
CN101769754A (zh) * 2010-01-19 2010-07-07 湖南大学 一种基于类三维地图的移动机器人全局路径规划方法
CN102819264A (zh) * 2012-07-30 2012-12-12 山东大学 移动机器人路径规划q学习初始化方法
DE102012109004A1 (de) * 2012-09-24 2014-03-27 RobArt GmbH Roboter und Verfahren zur autonomen Inspektion oder Bearbeitung von Bodenflächen
JP2014123306A (ja) * 2012-12-21 2014-07-03 Secom Co Ltd 自律飛行ロボット
CN103914068A (zh) * 2013-01-07 2014-07-09 中国人民解放军第二炮兵工程大学 一种基于栅格地图的服务机器人自主导航方法
CN103970135A (zh) * 2014-04-22 2014-08-06 重庆邮电大学 一种基于mapso优化粒子滤波的多移动机器人协作定位方法
CN103995984A (zh) * 2014-06-09 2014-08-20 武汉科技大学 一种基于椭圆约束的机器人路径规划方法和装置
JP2014168824A (ja) * 2013-03-01 2014-09-18 Advanced Telecommunication Research Institute International ロボット制御システムおよびロボット制御方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02311909A (ja) * 1989-05-29 1990-12-27 Shinko Electric Co Ltd 移動ロボット
CN101650568A (zh) * 2009-09-04 2010-02-17 湖南大学 未知环境下移动机器人导航安全的方法
CN101769754A (zh) * 2010-01-19 2010-07-07 湖南大学 一种基于类三维地图的移动机器人全局路径规划方法
CN102819264A (zh) * 2012-07-30 2012-12-12 山东大学 移动机器人路径规划q学习初始化方法
DE102012109004A1 (de) * 2012-09-24 2014-03-27 RobArt GmbH Roboter und Verfahren zur autonomen Inspektion oder Bearbeitung von Bodenflächen
JP2014123306A (ja) * 2012-12-21 2014-07-03 Secom Co Ltd 自律飛行ロボット
CN103914068A (zh) * 2013-01-07 2014-07-09 中国人民解放军第二炮兵工程大学 一种基于栅格地图的服务机器人自主导航方法
JP2014168824A (ja) * 2013-03-01 2014-09-18 Advanced Telecommunication Research Institute International ロボット制御システムおよびロボット制御方法
CN103970135A (zh) * 2014-04-22 2014-08-06 重庆邮电大学 一种基于mapso优化粒子滤波的多移动机器人协作定位方法
CN103995984A (zh) * 2014-06-09 2014-08-20 武汉科技大学 一种基于椭圆约束的机器人路径规划方法和装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
BAOCHANG ZHANGA 等: "Cooperative and Geometric Learning Algorithm (CGLA) for path planning of UAVs with limited information", 《AUTOMATICA》 *
WANG YAONAN 等: "Autonomous mobile robot navigation system designed in dynamic environment based on transferable belief model", 《MEASUREMENT》 *
沈晶 等: "未知动态环境中基于分层强化学习的移动机器人路径规划", 《机器人》 *
王耀南 等: "未知环境下移动机器人同步地图创建与定位研究进展", 《控制理论与应用》 *

Cited By (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105095681B (zh) * 2015-09-21 2018-04-20 武汉理工大学 基于积分测度随机相遇不确定性的搜救方法及***
CN105095681A (zh) * 2015-09-21 2015-11-25 武汉理工大学 基于积分测度随机相遇不确定性的搜救方法及***
CN105571596A (zh) * 2016-01-18 2016-05-11 福州华鹰重工机械有限公司 多车辆环境探索方法及装置
CN105571596B (zh) * 2016-01-18 2018-09-18 福州华鹰重工机械有限公司 多车辆环境探索方法及装置
CN106444769A (zh) * 2016-10-31 2017-02-22 湖南大学 一种室内移动机器人增量式环境信息采样的最优路径规划方法
CN107132846A (zh) * 2017-06-21 2017-09-05 南华大学 陌生室内场景下的γ辐射探测方法
CN107329445A (zh) * 2017-06-28 2017-11-07 重庆柚瓣家科技有限公司 机器人行为准则智能监管的方法
CN107329445B (zh) * 2017-06-28 2020-09-08 重庆柚瓣家科技有限公司 机器人行为准则智能监管的方法
WO2019019147A1 (en) * 2017-07-28 2019-01-31 Qualcomm Incorporated SELF-EXPLORATION CONTROL OF A ROBOTIC VEHICLE
CN107608392A (zh) * 2017-09-19 2018-01-19 浙江大华技术股份有限公司 一种目标跟随的方法及设备
CN107692661A (zh) * 2017-11-06 2018-02-16 广东工业大学 一种自动行走婴儿床
CN107860389A (zh) * 2017-11-07 2018-03-30 金陵科技学院 机器人室内行走强化学习路径导航算法
CN107943072A (zh) * 2017-11-13 2018-04-20 深圳大学 无人机飞行路径生成方法、装置、存储介质及设备
CN107943072B (zh) * 2017-11-13 2021-04-09 深圳大学 无人机飞行路径生成方法、装置、存储介质及设备
CN108151742A (zh) * 2017-11-20 2018-06-12 北京理工华汇智能科技有限公司 机器人导航的数据处理方法及其智能装置
CN111356939A (zh) * 2017-11-28 2020-06-30 松下知识产权经营株式会社 自走式病原体检测装置、病原体检测***以及控制方法
CN110554687B (zh) * 2018-05-30 2023-08-22 中国北方车辆研究所 一种面向未知环境的多机器人自适应探测方法
CN110554687A (zh) * 2018-05-30 2019-12-10 中国北方车辆研究所 一种面向未知环境的多机器人自适应探测方法
CN108827336A (zh) * 2018-09-26 2018-11-16 广东工业大学 一种基于无人驾驶的路径规划方法、装置及设备
CN109282813B (zh) * 2018-11-26 2022-05-10 深圳市海斯比海洋科技股份有限公司 一种无人艇全局障碍物识别的方法
CN109282813A (zh) * 2018-11-26 2019-01-29 深圳市海斯比船艇科技股份有限公司 一种无人艇全局障碍物识别的方法
CN109459052A (zh) * 2018-12-28 2019-03-12 上海大学 一种扫地机全覆盖路径规划方法
CN109947101A (zh) * 2019-03-18 2019-06-28 北京智行者科技有限公司 路径平滑处理方法及装置
CN109947101B (zh) * 2019-03-18 2022-11-29 北京智行者科技股份有限公司 路径平滑处理方法及装置
CN110262543A (zh) * 2019-05-23 2019-09-20 北京航空航天大学 多目标点同时到达约束下的集群四维轨迹规划设计方法
CN110262543B (zh) * 2019-05-23 2020-07-21 北京航空航天大学 多目标点同时到达约束下的集群四维轨迹规划设计方法
CN112445222A (zh) * 2019-09-05 2021-03-05 阿里巴巴集团控股有限公司 导航方法、装置、存储介质以及终端
CN112631269A (zh) * 2019-10-08 2021-04-09 国立大学法人静冈大学 自主移动机器人及自主移动机器人的控制程序
CN112631269B (zh) * 2019-10-08 2024-06-11 国立大学法人静冈大学 自主移动机器人及自主移动机器人的控制程序
CN110955239A (zh) * 2019-11-12 2020-04-03 中国地质大学(武汉) 一种基于逆强化学习的无人船多目标轨迹规划方法及***
CN113324761B (zh) * 2020-02-28 2023-03-28 苏州宝时得电动工具有限公司 电动工具、车轮打滑确定***及方法
CN113324761A (zh) * 2020-02-28 2021-08-31 苏州宝时得电动工具有限公司 电动工具、车轮打滑确定***及方法
CN111413971A (zh) * 2020-03-19 2020-07-14 云南电网有限责任公司电力科学研究院 一种对象识别装置及识别方法
CN112333798A (zh) * 2020-11-05 2021-02-05 珠海格力电器股份有限公司 一种智能设备的控制方法及装置
CN112731919B (zh) * 2020-12-01 2023-09-01 汕头大学 一种基于人群密度估计的指引机器人方法及***
CN112731919A (zh) * 2020-12-01 2021-04-30 汕头大学 一种基于人群密度估计的指引机器人方法及***
CN113156933A (zh) * 2020-12-30 2021-07-23 徐宁 一种机器人行进控制***和方法
CN113065499B (zh) * 2021-04-14 2022-07-01 湖南大学 基于视觉学习驱动的空中机器人集群控制方法及***
CN113065499A (zh) * 2021-04-14 2021-07-02 湖南大学 基于视觉学习驱动的空中机器人集群控制方法及***
CN114237252A (zh) * 2021-12-17 2022-03-25 河南工业大学 一种融合卡尔曼滤波预测思想的适用于移动机器人导航的改进蚁群算法
CN114237252B (zh) * 2021-12-17 2023-05-26 河南工业大学 一种融合卡尔曼滤波预测思想的适用于移动机器人导航的改进蚁群算法
CN114779792B (zh) * 2022-06-20 2022-09-09 湖南大学 基于模仿与强化学习的医药机器人自主避障方法及***
CN114779792A (zh) * 2022-06-20 2022-07-22 湖南大学 基于模仿与强化学习的医药机器人自主避障方法及***
CN115494732A (zh) * 2022-09-29 2022-12-20 湖南大学 一种基于近端策略优化的无人机轨迹设计和功率分配方法
CN115494732B (zh) * 2022-09-29 2024-04-12 湖南大学 一种基于近端策略优化的无人机轨迹设计和功率分配方法

Also Published As

Publication number Publication date
CN104298239B (zh) 2016-08-24

Similar Documents

Publication Publication Date Title
CN104298239A (zh) 一种室内移动机器人增强地图学习路径规划方法
CN106444769B (zh) 一种室内移动机器人增量式环境信息采样的最优路径规划方法
CN102915465B (zh) 一种基于移动生物刺激神经网络的多机器人联合编队方法
Kuderer et al. Feature-based prediction of trajectories for socially compliant navigation
Bhagat et al. UAV target tracking in urban environments using deep reinforcement learning
Aoude et al. Mobile agent trajectory prediction using Bayesian nonparametric reachability trees
Lei et al. A graph-based ant-like approach to optimal path planning
Chatterjee et al. A Geese PSO tuned fuzzy supervisor for EKF based solutions of simultaneous localization and mapping (SLAM) problems in mobile robots
CN106705970A (zh) 一种基于蚁群算法的多无人机协同路径规划方法
Gan et al. Real-time decentralized search with inter-agent collision avoidance
Stachniss et al. On actively closing loops in grid-based FastSLAM
Luo et al. Sensor-based autonomous robot navigation under unknown environments with grid map representation
CN103697895A (zh) 基于自适应a星算法的飞行器最优路径确定方法
CN104121903A (zh) 一种基于边界值问题的滚动航路规划方法
Kala et al. Planning of multiple autonomous vehicles using rrt
Luo et al. A computationally efficient neural dynamics approach to trajectory planning of an intelligent vehicle
Chen et al. Kinodynamic motion planning with space-time exploration guided heuristic search for car-like robots in dynamic environments
Lee et al. Sector-based maximal online coverage of unknown environments for cleaning robots with limited sensing
CN112857370A (zh) 一种基于时序信息建模的机器人无地图导航方法
CN103792846A (zh) 基于Skinner操作条件反射原理的机器人避障导航方法
CN114564008A (zh) 基于改进A-Star算法的移动机器人路径规划方法
Buckman et al. Generating visibility-aware trajectories for cooperative and proactive motion planning
Ferrari et al. Cooperative navigation for heterogeneous autonomous vehicles via approximate dynamic programming
Yang et al. An online interactive approach for crowd navigation of quadrupedal robots
Zou et al. Particle swarm optimization for source localization in environment with obstacles

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant