CN107168309A - 一种基于行为的多水下机器人路径规划方法 - Google Patents

一种基于行为的多水下机器人路径规划方法 Download PDF

Info

Publication number
CN107168309A
CN107168309A CN201710301455.0A CN201710301455A CN107168309A CN 107168309 A CN107168309 A CN 107168309A CN 201710301455 A CN201710301455 A CN 201710301455A CN 107168309 A CN107168309 A CN 107168309A
Authority
CN
China
Prior art keywords
mrow
msub
auv
msup
particle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710301455.0A
Other languages
English (en)
Other versions
CN107168309B (zh
Inventor
王卓
冯晓宁
蒋龙杰
林希元
隋炎橙
胡磊
徐沈方
姚淑香
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Engineering University
Original Assignee
Harbin Engineering University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Engineering University filed Critical Harbin Engineering University
Priority to CN201710301455.0A priority Critical patent/CN107168309B/zh
Publication of CN107168309A publication Critical patent/CN107168309A/zh
Application granted granted Critical
Publication of CN107168309B publication Critical patent/CN107168309B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0212Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
    • G05D1/0217Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory in accordance with energy consumption, time reduction or distance reduction criteria

Landscapes

  • Engineering & Computer Science (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明提供一种基于行为的多水下机器人路径规划方法,属于路径规划技术领域。本发明提出了一种适用于动态未知环境下的多水下机器人路径规划策略,具体包括:首先,定义基本行为来对AUV的航行路径添加约束,基本行为分别为节能行为、协同行为和安全行为;然后,建立与基本行为对应的行为目标函数,将与AUV有关的时间变量和空间变量结合起来;最后,建立全局目标函数来实现3种基本行为的行为融合,并采用一种带有惯性权重的粒子群优化算法来求解全局目标函数,通过输出的最优解可以生成一条免于碰撞并且是最短的路径。

Description

一种基于行为的多水下机器人路径规划方法
技术领域
本发明涉及一种基于行为的多水下机器人路径规划方法,是一种基于行为的多水下机器人协同信息采集的路径规划方法。
背景技术
多水下机器人(Multiple Autonomous underwater Vehicles,简称MAUV)是指由多个相对比较简单的同构或异构的AUV通过某种形式的协同合作,最终可以共同完成特定的比较复杂的作业任务的***。多水下机器人的并行性可以显著提高AUV工作性能,缩短任务时间,并且通过***中不同个体的协调来增加成功完成任务的可能性。此外,多水下机器人***相比于单水下机器人具有效率更高、成本更低、灵活性高、鲁棒性强等优点。
发挥多水下机器人协作优势的关键是在***中每个AUV都被分配明确任务的前提下,通过既定的规划和控制策略,组成一个使不同AUV自身进行作业任务的同时还能够兼顾与其他AUV合作和协调的团队,通过发挥团队意识和协作精神最终完成复杂的任务。对于数据收集任务,AUV需要安全地靠近分布在海洋中的节点进而通讯获得数据。在水下海洋环境中,为了自主完成数据收集任务,对于多水下机器人***来说,有效的路径规划策略是非常有必要的。传统的多水下机器人路径规划方法大多只考虑AUV执行任务时,不与其它AUV发生碰撞,并未考虑AUV与其他成员可能失去联系,从而不能完成协同任务。
本发明提出了一种适用于动态未知环境下基于行为的多水下机器人路径规划策略,通过定义基本行为来对AUV的航行路径添加约束,之后建立行为目标函数和全局目标函数来解决协同信息采集过程中的安全和协作问题。本发明采用一种带有惯性权重的粒子群优化算法来求解全局目标函数,通过输出的最优解可以生成一条免于碰撞并且是最短的路径。
发明内容
本发明的目的是为了提供一种在保证多个水下机器人协同完成数据收集任务的同时,使用最少的能耗的安全的路径规划算法。
本发明的目的是这样实现的:(1)定义3个基本行为用来约束AUV的运动,保证在安全的前提下,AUV的航行距离最短,并且实现与其它AUV的协同;
(2)行为目标函数与基本行为对应,是基本行为的具体数学化,定义在AUV的决策空间中,并要保证函数的收敛性;
(3)全局目标函数考虑到了3个基本行为的综合影响,利用带有惯性权重的粒子群优化算法来求解不同时刻全局目标函数的最优解,不同时刻全局目标函数的最优解组成AUV的路径轨迹。
本发明还包括这样一些结构特征:
1.所述3个基本行为的目标函数具体为:
路径规划的环境设置为二维平面,u为t时刻AUV的速度大小,θ为当前的艏向角,(xt,yt)为该时刻的位置坐标,Δt为时间间隔,AUV的决策输出包括速度和艏向角,假设(fx,fy)为下一时刻AUV的位置坐标,得到:
fx=xt+u·Δt·cosθ
fy=yt+u·Δt·sinθ
A、节能目标函数f1(θ,u,t)为:
其中:(xs,ys)为目标点的位置坐标,d1为下一时刻AUV与目标点间的欧氏距离,s1和s2是放缩系数;
B、协同目标函数f2(θ,u,t)为:
fbx=xb+ub·Δt·cosθb,fby=yb+ub·Δt·cosθb
其中:(fbx,fby)为与该AUV距离最近的AUV下一时刻的位置,d2为下一时刻的两个AUV的欧氏距离,[dmin,dmax]为d2的期望取值范围,s1和s2是放缩系数,M2为设定的常值;
C、安全行为目标函数f3(θ,u,t)为:
其中:(xo,yo)为障碍物点的位置坐标,d3为AUV与障碍物下一时刻的欧氏距离,ds为距离d3的安全阈值,M3为设定的常值。
2.所述建立并求解全局目标函数的过程如下:
全局目标函数具体的形式为:
F=F(θ,u,t)=ω1f12f23f3
式中:ω123是可变化的权重系数,将3种行为按照相对重要程度排序为安全行为、协同行为和节能行为,并设置3个权重系数,全局目标函数中具有2个空间变量θ和u、1个时间变量t;
在t时刻,利用带有惯性权重的粒子群优化算法,得到全局目标函数的最优解的具体步骤如下:
步骤1:利用带有惯性权重的粒子群优化算法求解生成的全局目标函数,算法开始;
步骤2:初始化带有惯性权重的粒子群优化算法参数,包括设置搜索空间为二维空间,其中姿态角空间取值范围为[θ0max0max],速度空间取值范围为[0,umax],其中:θ0为AUV当前时刻姿态角,θmax为AUV最大转角能力,umax为AUV的最大航行速度;群体规模为N,设置各个粒子的初始位置和速度;
步骤3:利用全局目标函数作为适应度函数,计算每个粒子的适应度;
步骤4:更新粒子的个体最优解和全局最优解:
每个粒子所处的位置都表示二维解空间中的一个解,解的质量由适应值决定,某一粒子I在二维空间的位置表示为矢量Xi=(θi,ui),粒子通过不断调整自己的位置来搜索新解,每个粒子都能记住自己搜索到的最优解,记作pid;以及整个粒子群经历过的最好的位置,即目前搜索到的最优解,记作pgd
步骤5:更新粒子的位置和速度:
粒子具有飞行速度,飞行速度可以表示为矢量当上述两个最优解pid和pgd都找到后,每个粒子根据下式来更新自己的位置和速度;
其中,Vi k+1表示第i个粒子在k+1次迭代中的速度,c0为惯性权重,c1和c2为加速常数,rand()为0到1之间的随机数;
对于惯性权重c0,利用先增后减惯性权重的惯性权重确定方法为:
式中,Max Number为算法的最大迭代次数。
步骤6:判断是否已经达到最大迭代次数,如果达到最大迭代次数,输出最优解,算法结束;否则,算法的迭代次数加1,返回步骤3。
3.所述计算每个粒子的适应度是指得到每个粒子的适应值,每个粒子都有一个由目标函数决定的适应值,适应值直接设置为全局目标函数F(θ,u,t)。
与现有技术相比,本发明的有益效果是:本发明定义了AUV的3种基本行为,包括节能行为、安全行为和协同行为,并建立了基本行为相对应的局部目标函数,从而来约束AUV的航行,并可以实现与其它AUV协同航行的目的。最后建立全局目标函数,并利用带有惯性权重的粒子群优化算法进行求解,通过利用先增后减惯性权重的惯性权重确定方法,比一般的粒子群优化算法具有更快的收敛能力和更好的局部收敛速度。
附图说明
图1是本发明提出的多水下机器人路径规划方法示意图;
图2是本发明中的粒子群优化算法的流程示意图;
图3是本发明中AUV在时间和空间运动示意图;
图4是本发明中粒子位置改变的示意图。
具体实施方式
下面结合附图与具体实施方式对本发明作进一步详细描述。
一种基于行为的多水下机器人路径规划方法,包括:
1、定义3个基本行为用来约束AUV的运动,保证在安全的前提下,AUV的航行距离最短,并且实现与其它AUV的协同。
2、行为目标函数与基本行为对应,是基本行为的具体数学化,定义在AUV的决策空间中,并要保证函数的收敛性。
3、全局目标函数考虑到了3个基本行为的综合影响,利用带有惯性权重的粒子群优化算法来求解不同时刻全局目标函数的最优解,不同时刻全局目标函数的最优解组成AUV的路径轨迹,
所述3个行为目标函数具体为:
路径规划的环境设置为二维平面,u为t时刻AUV的速度大小,θ为当前的艏向角,(xt,yt)为该时刻的位置坐标,Δt为时间间隔,AUV的决策输出包括速度和艏向角。假设(fx,fy)为下一时刻AUV的位置坐标,可以得到下式:
fx=xt+u·Δt·cosθ
fy=yt+u·Δt·sinθ
1)节能目标函数可以表示为:
(xs,ys)为目标点的位置坐标为,d1为下一时刻AUV与目标点间的欧氏距离。其中s1和s2是放缩系数。
2)协同目标函数可以表示为:
fbx=xb+ub·Δt·cosθb,fby=yb+ub·Δt·cosθb
(fbx,fby)为与该AUV距离最近的AUV下一时刻的位置,d2为下一时刻的两个AUV的欧氏距离,[dmin,dmax]为d2的期望取值范围,s1和s2是放缩系数,M2为设定的常值。
3)安全行为目标函数可以表示如下:
(xo,yo)为障碍物点的位置坐标,d3为AUV与障碍物下一时刻的欧氏距离,ds为距离d3的安全阈值,M3为设定的常值。
所述建立并求解全局目标函数的过程如下:
全局目标函数具体的形式如下式所示:
F=F(θ,u,t)=ω1f12f23f3
式中,ω123是可变化的权重系数。将3种行为按照相对重要程度排序为安全行为、协同行为和节能行为,按照这个原则来设置3个权重系数。全局目标函数中具有2个空间变量θ和u,1个时间变量t。
在t时刻,下面利用带有惯性权重的粒子群优化算法,来求全局目标函数的最优解,具体步骤如下:
步骤1:利用带有惯性权重的粒子群优化算法求解生成的全局目标函数,算法开始;
步骤2:初始化带有惯性权重的粒子群优化算法参数,包括设置搜索空间为二维空间,其中姿态角空间取值范围为[θ0max0max],速度空间取值范围为[0,umax],这里θ0为AUV当前时刻姿态角,θmax为AUV最大转角能力,umax为AUV的最大航行速度;群体规模为N,设置各个粒子的初始位置和速度;
步骤3:利用全局目标函数作为适应度函数,计算每个粒子的适应度。每个粒子都有一个由目标函数决定的适应值(fitness value),这里适应值可以直接设置为全局目标函数F(θ,u,t);
步骤4:更新粒子的个体最优解和全局最优解。每个粒子所处的位置都表示二维解空间中的一个解,解的质量由适应值决定,适应度越大,解的质量越好。某一粒子I在二维空间的位置表示为矢量Xi=(θi,ui),粒子通过不断调整自己的位置来搜索新解,每个粒子都能记住自己搜索到的最优解,记作pid;以及整个粒子群经历过的最好的位置,即目前搜索到的最优解,记作pgd
步骤5:更新粒子的位置和速度。粒子具有飞行速度,从而可以调整自己的位置。飞行速度可以表示为矢量当上述两个最优解pid和pgd都找到后,每个粒子根据下式来更新自己的位置和速度;
其中,Vi k+1表示第i个粒子在k+1次迭代中的速度,c0为惯性权重,c1和c2为加速常数,rand()为0到1之间的随机数;
对于惯性权重c0,利用先增后减惯性权重的惯性权重确定方法,该方法在迭代的初期,具有较快的收敛速度;在迭代的后期,具有较好的局部搜索能力,具体方法如下式所示:
式中,MaxNumber为算法的最大迭代次数。
步骤6:判断是否已经达到最大迭代次数,如果达到最大迭代次数,输出最优解,算法结束。否则,算法的迭代次数加1,返回步骤3。
下面结合附图对本发明进行详细描述:
如图1所示,本发明提出的一种基于行为的多水下机器人路径规划方法,主要包含以下部分:3个基本行为,分别是节能行为、协同行为和安全行为;与3个基本行为对应的行为目标函数;通过3个行为目标函数生成的全局目标函数,并对全局目标函数进行求解。3个基本行为用来约束AUV的运动,保证在安全的前提下,AUV的航行距离最短,并且实现与其它AUV的协同。行为目标函数分别是对应3个基本行为的具体数学化,行为目标函数需要定义在AUV的决策空间中,并要保证函数的收敛性。全局目标函数考虑到了3个基本行为的综合影响,不同时刻全局目标函数的最优解组成AUV的路径轨迹,本发明利用带有惯性权重的粒子群优化算法来求解不同时刻全局目标函数的最优解。
(1)所述的基本行为通过以下方式定义:
路径规划的环境设置为二维平面,建立环境地图的全局坐标系O-XY。如图1所示,当AUV获取需要的周围环境信息后,这些信息包括目标点的位置,其它AUV的位置速度大小和艏向角,以及障碍物位置信息。在这里,u为t时刻AUV的速度大小,θ为当前的艏向角,(xt,yt)为该时刻的位置坐标,Δt为时间间隔,AUV的决策输出包括速度和艏向角,如图3所示为AUV在时间和空间上的运动示意图。
假设(fx,fy)为下一时刻AUV的位置坐标,可以表示为下式:
fx=xt+u·Δt·cosθ
fy=yt+u·Δt·sinθ
1.1)节能行为
考虑到AUV工作时的能源有限,为了简化问题,本发明只考虑航行距离的影响,并且认为,航行距离越短,节能性越好。为了定义节能行为,可以对AUV的航行条件添加一些约束,并把约束条件定为AUV与目标点的距离。
d1为下一时刻AUV与目标点间的欧氏距离,节能行为在整个任务过程中一直处于激活状态。将AUV与目标点的距离对应到具体的决策空间,利用AUV的姿态角、速度以及时间变量可以将d1表示如下:
d1=d1(θ,u,t)
1.2)协同行为
考虑到实际水下传感器以及通讯手段的限制,在保证安全的前提下,协同行为要求的数学形式可以表示如下:
dmin<d2<dmax
d2为下一时刻的两个AUV的欧氏距离,[dmin,dmax]为d2的期望取值范围。以上述公式为协同行为处于激活状态的条件,利用AUV的姿态角、速度以及时间变量可以将d2表示如下:
d2=d2(θ,u,t)
1.3)安全行为
安全行为的数学形式可以表示如下式:
d3>dmin
d3为AUV与障碍物下一时刻的欧氏距离,ds为距离d3的安全阈值。利用AUV的姿态角、速度以及时间变量可以将d3表示如下式:
d3=d3(θ,u,t)
(2)建立局部目标函数:
2.1)节能目标函数
与节能行为相对应,节能目标函数的变量是AUV与目标点的距离d1。对于节能目标函数来说,d1的值越小,说明AUV越接近目标点。在时间间隔Δt确定时,距离d1与AUV速度和艏向角有关。对d1进行度量处理,得到节能性的目标函数具体形式如下式:
式中s1和s2是放缩系数。
2.2)协同目标函数
与协同行为对应,协同目标函数的变量值是AUV与其他成员的距离,在执行任务的过程中,各个AUV之间应该保持协同作业,这里表现为AUV与***中最近的成员距离要处于一个阈值[dmin,dmax]范围内。最终的协同目标函数如下式所示:
fbx=xb+ub·Δt·cosθb,fby=yb+ub·Δt·cosθb
(fbx,fby)为与该AUV距离最近的AUV下一时刻的位置,d2为下一时刻的两个AUV的欧氏距离,[dmin,dmax]为d2的期望取值范围,s1和s2是放缩系数,M2为设定的常值。
2.3)安全目标函数
安全行为的激活需要满足一定的限制条件,具体体现为AUV与障碍物的距离阈值ds。最终的安全行为目标函数如下式所示:
(xo,yo)为障碍物点的位置坐标,d3为AUV与障碍物下一时刻的欧氏距离,ds为距离d3的安全阈值,M3为设定的常值。
(3)所述的全局目标函数建立方法和求解过程如下:
全局目标函数的作用是实现之前一系列基本行为的协调,全局目标函数具体的形式如下式所示:
F=F(θ,u,t)=ω1f12f23f3
式中,ω123是可变化的权重系数。将3种行为按照相对重要程度排序为安全行为、协同行为和节能行为,按照这个原则来设置3个权重系数。全局目标函数中具有2个空间变量θ和u,1个时间变量t。
在t时刻,利用带有惯性权重的粒子群优化算法,来求全局目标函数的最优解,函数输出为空间变量θ和u。如图2所示,具体步骤如下:
步骤1:利用带有惯性权重的粒子群优化算法求解生成的全局目标函数,算法开始;
步骤2:初始化带有惯性权重的粒子群优化算法参数,包括设置搜索空间为二维空间,其中姿态角空间取值范围为[θ0max0max],速度空间取值范围为[0,umax],这里θ0为AUV当前时刻姿态角,θmax为AUV最大转角能力,umax为AUV的最大航行速度;群体规模为N,设置各个粒子的初始位置和速度。
步骤3:利用全局目标函数作为适应度函数,计算每个粒子的适应度。每个粒子都有一个由目标函数决定的适应值(fitness value),这里适应值设置为全局目标函数F(θ,u,t)。
步骤4:更新粒子的个体最优解和全局最优解。每个粒子所处的位置都表示二维解空间中的一个解,解的质量由适应值决定,适应度越大,解的质量越好。某一粒子I在二维空间的位置表示为矢量Xi=(θi,ui),粒子通过不断调整自己的位置来搜索新解,每个粒子都能记住自己搜索到的最优解,记作pid;以及整个粒子群经历过的最好的位置,即目前搜索到的最优解,记作pgd
步骤5:更新粒子的位置和速度。粒子具有飞行速度,从而可以调整自己的位置。飞行速度可以表示为矢量当上述两个最优解pid和pgd都找到后,每个粒子根据下式来更新自己的位置和速度,粒子的位置和速度更新过程具体如图4所示。
式中,Vi k+1表示第i个粒子在k+1次迭代中的速度,c0为惯性权重,c1和c2为加速常数,rand()为0到1之间的随机数。
对于惯性权重c0,利用先增后减惯性权重的惯性权重确定方法,该方法在迭代的初期,具有较快的收敛速度;在迭代的后期,具有较好的局部搜索能力,具体方法如下式所示:
式中,MaxNumber为算法的最大迭代次数。
步骤6:判断是否已经达到最大迭代次数,如果达到最大迭代次数,输出最优解,算法结束。否则,算法的迭代次数加1,返回步骤3。
当算法达到最大迭代次数时便会终止;此时输出最优解,即整个粒子群经历过的最好的位置pgd,该位置对应的矢量Xi=(θi,ui)代表AUV在时刻t应该输出的姿态角和速度。最后,利用不同时刻粒子群优化算法输出的最优解对应的姿态角和速度,可以生成AUV最后的路径。
(1)定义基本行为:
路径规划的环境设置为二维平面,建立环境地图的全局坐标系O-XY。当AUV获取需要的周围环境信息后,这些信息包括目标点的位置,其它AUV的位置速度大小和艏向角,以及障碍物位置信息。在这里,u为AUV的速度大小,θ为艏向角,(xt,yt)为t时刻的位置坐标,Δt为时间间隔,AUV的决策输出包括速度和艏向角。
假设(fx,fy)为下一时刻AUV的位置坐标,可以表示为下式:
fx=xt+u·Δt·cosθ
fy=yt+u·Δt·sinθ
1.1)节能行为
考虑到AUV工作时的能源有限,为了简化问题,本发明只考虑航行距离的影响,并且认为,航行距离越短,节能性越好。为了定义节能行为,可以对AUV的航行条件添加一些约束,并把约束条件定为AUV与目标点的距离。d1为下一时刻AUV与目标点间的欧氏距离,节能行为在整个任务过程中一直处于激活状态。将AUV与目标点的距离对应到具体的决策空间,利用AUV的姿态角、速度以及时间变量可以将d1表示如下:
d1=d1(θ,u,t)
1.2)考虑到实际水下传感器以及通讯手段的限制,在保证安全的前提下,协同行为要求的数学形式可以表示如下:
dmin<d2<dmax
d2为下一时刻的两个AUV的欧氏距离,[dmin,dmax]为d2的期望取值范围。以上述公式为协同行为处于激活状态的条件,利用AUV的姿态角、速度以及时间变量可以将d2表示如下:
d2=d2(θ,u,t)
1.3)安全行为数学形式可以表示如下:
d3>dmin
d3为AUV与障碍物下一时刻的欧氏距离,ds为距离d3的安全阈值。利用AUV的姿态角、速度以及时间变量可以将d3表示如下:
d3=d3(θ,u,t)
(2)建立局部目标函数:
2.1)节能目标函数
与节能行为相对应,节能目标函数的变量是AUV与目标点的距离。假设目标点的位置坐标为(xs,ys),d1可以表示为式:
对于节能目标函数来说,d1的值越小,说明AUV越接近目标点。在时间间隔Δt确定时,这个距离与AUV速度和艏向角有关。对d1进行度量处理,得到节能性的目标函数具体形式如下式:
其中s1和s2是放缩系数。
2.2)协同目标函数
与协同行为对应,协同目标函数的变量值是AUV与其他成员的距离,在执行任务的过程中,各个AUV之间应该保持协同作业,这里体现为AUV与***中最近的成员距离要处于一个阈值[dmin,dmax]范围内。最终的协同目标函数如下式所示:
fbx=xb+ub·Δt·cosθb,fby=yb+ub·Δt·cosθb
(fbx,fby)为与该AUV距离最近的AUV下一时刻的位置,d2为下一时刻的两个AUV的欧氏距离,[dmin,dmax]为d2的期望取值范围,s1和s2是放缩系数,M2为设定的常值。
2.3)安全目标函数
安全行为的激活需要满足一定的限制条件,具体体现为AUV与障碍物的距离阈值ds。最终的安全行为目标函数如下式所示:
(xo,yo)为障碍物点的位置坐标,d3为AUV与障碍物下一时刻的欧氏距离,ds为距离d3的安全阈值,s1和s2是放缩系数,M3为设定的常值。
(3)建立并求解全局目标函数:
全局目标函数的作用是实现之前一系列基本行为的协调,具体的形式如下式所示:
F=F(θ,u,t)=ω1f12f23f3
式中,ω123是可变化的权重系数。将3种行为按照相对重要程度排序为安全行为、协同行为和节能行为,按照这个原则来设置3个权重系数。全局目标函数中具有2个空间变量θ和u,1个时间变量t。
下面利用带有惯性权重的粒子群优化算法,在t时刻,来求全局目标函数的最优解。
3.1)路径规划参数、带有惯性权重的粒子群优化算法参数初始化
设置搜索空间为二维空间,其中姿态角空间取值范围为[θ0max0max],速度空间取值范围为[0,umax],这里θ0为AUV当前时刻姿态角,θmax为AUV最大转角能力,umax为AUV的最大航行速度。群体规模为N,设置各个粒子的初始位置和速度;
3.2)利用粒子对路径进行优化:
算法初始化之后,进入算法的主体迭代优化过程;粒子群算法是通过个体间的协作和竞争,实现复杂空间中最优解的搜索。某一粒子I在二维空间的位置表示为矢量Xi=(θi,ui),每个粒子所处的位置都表示二维解空间中的一个解。粒子通过不断调整自己的位置来搜索新解,每个粒子都能记住自己搜索到的最优解,记作pid;以及整个粒子群经历过的最好的位置,即目前搜索到的最优解,记作pgd
粒子具有飞行速度,从而可以调整自己的位置。飞行速度可以表示为矢量每个粒子都有一个由目标函数决定的适应值(fitness value),这里适应值可以直接设置为全局目标函数F(θ,u,t);当上述两个最优解pid和pgd都找到后,每个粒子根据下式来更新自己的位置和速度。
式中,Vi k+1表示第i个粒子在k+1次迭代中的速度,c0为惯性权重,c1和c2为加速常数,rand()为0到1之间的随机数。
之后判断是否已经达到最大迭代次数,如果达到最大迭代次数则进入下一步;否则,算法的迭代次数加1,继续进行下一步优化过程。
3.3)输出最优解
当算法达到最大迭代次数时便会终止;此时输出最优解,即整个粒子群经历过的最好的位置pgd,该位置对应的矢量Xi=(θi,ui)代表AUV在时刻t应该输出的姿态角和速度。
最后,利用不同时刻粒子群优化算法输出的最优解对应的姿态角和速度,可以形成AUV最后的路径。
综上,本发明提出一种基于行为的多水下机器人路径规划方法,属于路径规划技术领域。
本发明提出了一种适用于动态未知环境下的多水下机器人路径规划策略,具体包括:首先,定义基本行为来对AUV的航行路径添加约束,基本行为分别为节能行为、协同行为和安全行为;然后,建立与基本行为对应的行为目标函数,将与AUV有关的时间变量和空间变量结合起来;最后,建立全局目标函数来实现3种基本行为的行为融合,并采用一种带有惯性权重的粒子群优化算法来求解全局目标函数,通过输出的最优解可以生成一条免于碰撞并且是最短的路径。

Claims (4)

1.一种基于行为的多水下机器人路径规划方法,其特征在于:
(1)定义3个基本行为用来约束AUV的运动,保证在安全的前提下,AUV的航行距离最短,并且实现与其它AUV的协同;
(2)行为目标函数与基本行为对应,是基本行为的具体数学化,定义在AUV的决策空间中,并要保证函数的收敛性;
(3)全局目标函数考虑到了3个基本行为的综合影响,利用带有惯性权重的粒子群优化算法来求解不同时刻全局目标函数的最优解,不同时刻全局目标函数的最优解组成AUV的路径轨迹。
2.根据权利要求1所述的一种基于行为的多水下机器人路径规划方法,其特征在于,所述3个基本行为的目标函数具体为:
路径规划的环境设置为二维平面,u为t时刻AUV的速度大小,θ为当前的艏向角,(xt,yt)为该时刻的位置坐标,Δt为时间间隔,AUV的决策输出包括速度和艏向角,假设(fx,fy)为下一时刻AUV的位置坐标,得到:
fx=xt+u·Δt·cosθ
fy=yt+u·Δt·sinθ
A、节能目标函数f1(θ,u,t)为:
<mrow> <msub> <mi>f</mi> <mn>1</mn> </msub> <mrow> <mo>(</mo> <mi>&amp;theta;</mi> <mo>,</mo> <mi>u</mi> <mo>,</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>=</mo> <mrow> <mo>(</mo> <mfrac> <mn>100</mn> <mrow> <mn>1</mn> <mo>+</mo> <msup> <mn>1.2</mn> <mrow> <mo>(</mo> <mi>q</mi> <mo>-</mo> <mn>1000</mn> <mo>)</mo> <mo>/</mo> <mn>20</mn> </mrow> </msup> </mrow> </mfrac> <mo>-</mo> <msub> <mi>s</mi> <mn>1</mn> </msub> <mo>)</mo> </mrow> <mo>/</mo> <mrow> <mo>(</mo> <msub> <mi>s</mi> <mn>2</mn> </msub> <mo>-</mo> <msub> <mi>s</mi> <mn>1</mn> </msub> <mo>)</mo> </mrow> </mrow>
<mrow> <mi>q</mi> <mo>=</mo> <msub> <mi>d</mi> <mn>1</mn> </msub> <mo>=</mo> <msqrt> <mrow> <msup> <mrow> <mo>(</mo> <msub> <mi>f</mi> <mi>x</mi> </msub> <mo>-</mo> <msub> <mi>x</mi> <mi>s</mi> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <mrow> <mo>(</mo> <msub> <mi>f</mi> <mi>y</mi> </msub> <mo>-</mo> <msub> <mi>y</mi> <mi>s</mi> </msub> <mo>)</mo> </mrow> </mrow> </msqrt> <mo>,</mo> <msub> <mi>s</mi> <mn>1</mn> </msub> <mo>=</mo> <mi>min</mi> <mrow> <mo>(</mo> <mfrac> <mn>100</mn> <mrow> <mn>1</mn> <mo>+</mo> <msup> <mn>1.2</mn> <mrow> <mo>(</mo> <mi>q</mi> <mo>-</mo> <mn>1000</mn> <mo>)</mo> <mo>/</mo> <mn>20</mn> </mrow> </msup> </mrow> </mfrac> <mo>)</mo> </mrow> <mo>,</mo> <msub> <mi>s</mi> <mn>2</mn> </msub> <mo>=</mo> <mi>m</mi> <mi>a</mi> <mi>x</mi> <mrow> <mo>(</mo> <mfrac> <mn>100</mn> <mrow> <mn>1</mn> <mo>+</mo> <msup> <mn>1.2</mn> <mrow> <mo>(</mo> <mi>q</mi> <mo>-</mo> <mn>1000</mn> <mo>)</mo> <mo>/</mo> <mn>20</mn> </mrow> </msup> </mrow> </mfrac> <mo>)</mo> </mrow> </mrow>
其中:(xs,ys)为目标点的位置坐标,d1为下一时刻AUV与目标点间的欧氏距离,s1和s2是放缩系数;
B、协同目标函数f2(θ,u,t)为:
<mrow> <mi>q</mi> <mo>=</mo> <msub> <mi>d</mi> <mn>2</mn> </msub> <mo>=</mo> <msqrt> <mrow> <msup> <mrow> <mo>(</mo> <msub> <mi>f</mi> <mi>x</mi> </msub> <mo>-</mo> <msub> <mi>f</mi> <mrow> <mi>b</mi> <mi>x</mi> </mrow> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <msup> <mrow> <mo>(</mo> <msub> <mi>f</mi> <mi>y</mi> </msub> <mo>-</mo> <msub> <mi>f</mi> <mrow> <mi>b</mi> <mi>y</mi> </mrow> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> </mrow> </msqrt> <mo>,</mo> <msub> <mi>s</mi> <mn>1</mn> </msub> <mo>=</mo> <mi>min</mi> <mrow> <mo>(</mo> <mfrac> <mn>100</mn> <mrow> <mn>1</mn> <mo>+</mo> <msup> <mn>1.2</mn> <mrow> <mo>(</mo> <mi>q</mi> <mo>-</mo> <mn>1000</mn> <mo>)</mo> <mo>/</mo> <mn>20</mn> </mrow> </msup> </mrow> </mfrac> <mo>)</mo> </mrow> <mo>,</mo> <msub> <mi>s</mi> <mn>2</mn> </msub> <mo>=</mo> <mi>max</mi> <mrow> <mo>(</mo> <mfrac> <mn>100</mn> <mrow> <mn>1</mn> <mo>+</mo> <msup> <mn>1.2</mn> <mrow> <mo>(</mo> <mi>q</mi> <mo>-</mo> <mn>1000</mn> <mo>)</mo> <mo>/</mo> <mn>20</mn> </mrow> </msup> </mrow> </mfrac> <mo>)</mo> </mrow> </mrow>
fbx=xb+ub·Δt·cosθb,fby=yb+ub·Δt·cosθb
其中:(fbx,fby)为与该AUV距离最近的AUV下一时刻的位置,d2为下一时刻的两个AUV的欧氏距离,[dmin,dmax]为d2的期望取值范围,s1和s2是放缩系数,M2为设定的常值;
C、安全行为目标函数f3(θ,u,t)为:
<mrow> <mi>q</mi> <mo>=</mo> <msub> <mi>d</mi> <mn>3</mn> </msub> <mo>=</mo> <msqrt> <mrow> <msup> <mrow> <mo>(</mo> <msub> <mi>f</mi> <mi>x</mi> </msub> <mo>-</mo> <msub> <mi>x</mi> <mi>o</mi> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <msup> <mrow> <mo>(</mo> <msub> <mi>f</mi> <mi>y</mi> </msub> <mo>-</mo> <msub> <mi>y</mi> <mi>o</mi> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> </mrow> </msqrt> <mo>,</mo> <msub> <mi>s</mi> <mn>1</mn> </msub> <mo>=</mo> <mi>m</mi> <mi>i</mi> <mi>n</mi> <mrow> <mo>(</mo> <mfrac> <mn>100</mn> <mrow> <mn>1</mn> <mo>+</mo> <msup> <mn>1.2</mn> <mrow> <mo>(</mo> <mi>q</mi> <mo>-</mo> <mn>1000</mn> <mo>)</mo> <mo>/</mo> <mn>20</mn> </mrow> </msup> </mrow> </mfrac> <mo>)</mo> </mrow> <mo>,</mo> <msub> <mi>s</mi> <mn>2</mn> </msub> <mo>=</mo> <mi>m</mi> <mi>a</mi> <mi>x</mi> <mrow> <mo>(</mo> <mfrac> <mn>100</mn> <mrow> <mn>1</mn> <mo>+</mo> <msup> <mn>1.2</mn> <mrow> <mo>(</mo> <mi>q</mi> <mo>-</mo> <mn>1000</mn> <mo>)</mo> <mo>/</mo> <mn>20</mn> </mrow> </msup> </mrow> </mfrac> <mo>)</mo> </mrow> </mrow>
其中:(xo,yo)为障碍物点的位置坐标,d3为AUV与障碍物下一时刻的欧氏距离,ds为距离d3的安全阈值,M3为设定的常值。
3.根据权利要求1所述的一种基于行为的多水下机器人路径规划方法,其特征在于,所述建立并求解全局目标函数的过程如下:
全局目标函数具体的形式为:
F=F(θ,u,t)=ω1f12f23f3
式中:ω123是可变化的权重系数,将3种行为按照相对重要程度排序为安全行为、协同行为和节能行为,并设置3个权重系数,全局目标函数中具有2个空间变量θ和u、1个时间变量t;
在t时刻,利用带有惯性权重的粒子群优化算法,得到全局目标函数的最优解的具体步骤如下:
步骤1:利用带有惯性权重的粒子群优化算法求解生成的全局目标函数,算法开始;
步骤2:初始化带有惯性权重的粒子群优化算法参数,包括设置搜索空间为二维空间,其中姿态角空间取值范围为[θ0max0max],速度空间取值范围为[0,umax],其中:θ0为AUV当前时刻姿态角,θmax为AUV最大转角能力,umax为AUV的最大航行速度;群体规模为N,设置各个粒子的初始位置和速度;
步骤3:利用全局目标函数作为适应度函数,计算每个粒子的适应度;
步骤4:更新粒子的个体最优解和全局最优解:
每个粒子所处的位置都表示二维解空间中的一个解,解的质量由适应值决定,某一粒子I在二维空间的位置表示为矢量Xi=(θi,ui),粒子通过不断调整自己的位置来搜索新解,每个粒子都能记住自己搜索到的最优解,记作pid;以及整个粒子群经历过的最好的位置,即目前搜索到的最优解,记作pgd
步骤5:更新粒子的位置和速度:
粒子具有飞行速度,飞行速度可以表示为矢量当上述两个最优解pid和pgd都找到后,每个粒子根据下式来更新自己的位置和速度;
<mrow> <msubsup> <mi>V</mi> <mi>i</mi> <mrow> <mi>k</mi> <mo>+</mo> <mn>1</mn> </mrow> </msubsup> <mo>=</mo> <msub> <mi>c</mi> <mn>0</mn> </msub> <msubsup> <mi>V</mi> <mi>i</mi> <mi>k</mi> </msubsup> <mo>+</mo> <msub> <mi>c</mi> <mn>1</mn> </msub> <mo>&amp;times;</mo> <mi>r</mi> <mi>a</mi> <mi>n</mi> <mi>d</mi> <mrow> <mo>(</mo> <mo>)</mo> </mrow> <mo>&amp;times;</mo> <mrow> <mo>(</mo> <mi>p</mi> <mi>b</mi> <mi>e</mi> <mi>s</mi> <mi>t</mi> <mo>-</mo> <msubsup> <mi>X</mi> <mi>i</mi> <mi>k</mi> </msubsup> <mo>)</mo> </mrow> <mo>+</mo> <msub> <mi>c</mi> <mn>2</mn> </msub> <mo>&amp;times;</mo> <mi>r</mi> <mi>a</mi> <mi>n</mi> <mi>d</mi> <mrow> <mo>(</mo> <mo>)</mo> </mrow> <mo>&amp;times;</mo> <mrow> <mo>(</mo> <mi>g</mi> <mi>b</mi> <mi>e</mi> <mi>s</mi> <mi>t</mi> <mo>-</mo> <msubsup> <mi>X</mi> <mi>i</mi> <mi>k</mi> </msubsup> <mo>)</mo> </mrow> </mrow>
<mrow> <msubsup> <mi>X</mi> <mi>i</mi> <mrow> <mi>k</mi> <mo>+</mo> <mn>1</mn> </mrow> </msubsup> <mo>=</mo> <msubsup> <mi>X</mi> <mi>i</mi> <mi>k</mi> </msubsup> <mo>+</mo> <msubsup> <mi>V</mi> <mi>i</mi> <mrow> <mi>k</mi> <mo>+</mo> <mn>1</mn> </mrow> </msubsup> </mrow>
其中,Vi k+1表示第i个粒子在k+1次迭代中的速度,c0为惯性权重,c1和c2为加速常数,rand()为0到1之间的随机数;
对于惯性权重c0,利用先增后减惯性权重的惯性权重确定方法为:
<mrow> <msub> <mi>c</mi> <mn>0</mn> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <mn>1</mn> <mo>&amp;times;</mo> <mfrac> <mi>k</mi> <mrow> <mi>M</mi> <mi>a</mi> <mi>x</mi> <mi>N</mi> <mi>u</mi> <mi>m</mi> <mi>b</mi> <mi>e</mi> <mi>r</mi> </mrow> </mfrac> <mo>+</mo> <mn>0.4</mn> </mrow> </mtd> <mtd> <mrow> <mn>0</mn> <mo>&amp;le;</mo> <mfrac> <mi>k</mi> <mrow> <mi>M</mi> <mi>a</mi> <mi>x</mi> <mi>N</mi> <mi>u</mi> <mi>m</mi> <mi>b</mi> <mi>e</mi> <mi>r</mi> </mrow> </mfrac> <mo>&amp;le;</mo> <mn>0.5</mn> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>-</mo> <mn>1</mn> <mo>&amp;times;</mo> <mfrac> <mi>k</mi> <mrow> <mi>M</mi> <mi>a</mi> <mi>x</mi> <mi>N</mi> <mi>u</mi> <mi>m</mi> <mi>b</mi> <mi>e</mi> <mi>r</mi> </mrow> </mfrac> <mo>+</mo> <mn>1.4</mn> </mrow> </mtd> <mtd> <mrow> <mn>0.5</mn> <mo>&amp;le;</mo> <mfrac> <mi>k</mi> <mrow> <mi>M</mi> <mi>a</mi> <mi>x</mi> <mi>N</mi> <mi>u</mi> <mi>m</mi> <mi>b</mi> <mi>e</mi> <mi>r</mi> </mrow> </mfrac> <mo>&amp;le;</mo> <mn>1</mn> </mrow> </mtd> </mtr> </mtable> </mfenced> </mrow>
式中,Max Number为算法的最大迭代次数。
步骤6:判断是否已经达到最大迭代次数,如果达到最大迭代次数,输出最优解,算法结束;否则,算法的迭代次数加1,返回步骤3。
4.根据权利要求3所述的一种基于行为的多水下机器人路径规划方法,其特征在于,所述计算每个粒子的适应度是指得到每个粒子的适应值,每个粒子都有一个由目标函数决定的适应值,适应值直接设置为全局目标函数F(θ,u,t)。
CN201710301455.0A 2017-05-02 2017-05-02 一种基于行为的多水下机器人路径规划方法 Active CN107168309B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710301455.0A CN107168309B (zh) 2017-05-02 2017-05-02 一种基于行为的多水下机器人路径规划方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710301455.0A CN107168309B (zh) 2017-05-02 2017-05-02 一种基于行为的多水下机器人路径规划方法

Publications (2)

Publication Number Publication Date
CN107168309A true CN107168309A (zh) 2017-09-15
CN107168309B CN107168309B (zh) 2020-02-14

Family

ID=59812784

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710301455.0A Active CN107168309B (zh) 2017-05-02 2017-05-02 一种基于行为的多水下机器人路径规划方法

Country Status (1)

Country Link
CN (1) CN107168309B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108768712A (zh) * 2018-05-21 2018-11-06 中南大学 面向连通性的非全向通信运动体集群姿态规划方法
CN108958028A (zh) * 2018-05-24 2018-12-07 大连理工大学 基于改进粒子群算法的群机器人协同搜索方法
CN109241552A (zh) * 2018-07-12 2019-01-18 哈尔滨工程大学 一种基于多约束目标的水下机器人运动规划方法
CN109752015A (zh) * 2018-12-29 2019-05-14 青岛海洋科学与技术国家实验室发展中心 路线规划方法、计算机可读介质以及控制装置
CN109976158A (zh) * 2019-03-28 2019-07-05 沈阳航空航天大学 基于距离进化n-pso的auv能源优化路径搜寻方法
CN110181508A (zh) * 2019-05-09 2019-08-30 中国农业大学 水下机器人三维航路规划方法及***
CN110764518A (zh) * 2019-10-31 2020-02-07 五邑大学 水下清淤机器人路径规划方法、装置、机器人和存储介质
CN111307158A (zh) * 2020-03-19 2020-06-19 哈尔滨工程大学 一种auv三维航路规划方法
CN112124299A (zh) * 2020-09-14 2020-12-25 东南大学 一种智能网联新能源汽车分层式能耗优化方法
CN117369507A (zh) * 2023-10-31 2024-01-09 河海大学 一种自适应粒子群算法的无人机动态路径规划方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101436073A (zh) * 2008-12-03 2009-05-20 江南大学 基于量子行为粒子群算法的轮式移动机器人轨迹跟踪方法
CN102129249A (zh) * 2011-01-10 2011-07-20 中国矿业大学 一种危险源环境下的机器人全局路径规划方法
US20130289870A1 (en) * 2012-04-26 2013-10-31 The Government Of The United States Of America, As Represented By The Secretary Of The Navy Collaborative Robot Manifold Tracker
CN105138000A (zh) * 2015-08-06 2015-12-09 大连大学 最优化基座位姿扰动的七自由度空间机械臂轨迹规划方法
CN106503837A (zh) * 2016-10-11 2017-03-15 哈尔滨工程大学 一种基于改进水平集算法的时间最优航路规划方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101436073A (zh) * 2008-12-03 2009-05-20 江南大学 基于量子行为粒子群算法的轮式移动机器人轨迹跟踪方法
CN102129249A (zh) * 2011-01-10 2011-07-20 中国矿业大学 一种危险源环境下的机器人全局路径规划方法
US20130289870A1 (en) * 2012-04-26 2013-10-31 The Government Of The United States Of America, As Represented By The Secretary Of The Navy Collaborative Robot Manifold Tracker
CN105138000A (zh) * 2015-08-06 2015-12-09 大连大学 最优化基座位姿扰动的七自由度空间机械臂轨迹规划方法
CN106503837A (zh) * 2016-10-11 2017-03-15 哈尔滨工程大学 一种基于改进水平集算法的时间最优航路规划方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
QIULING JIA,等: "Formation Control and Obstacle Avoidance Algorithm of Multiple Autonomous Underwater Vehicles(AUVs) Based on Potential Function and Behavior Rules", 《PROCEEDINGS OF THE IEEE INTERNATIONAL CONFERENCE ON AUTOMATION AND LOGISTICS》 *
马家辰,等: "基于多行为融合的移动机器人路径规划方法", 《北京理工大学学报》 *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108768712B (zh) * 2018-05-21 2021-04-02 中南大学 面向连通性的非全向通信运动体集群姿态规划方法
CN108768712A (zh) * 2018-05-21 2018-11-06 中南大学 面向连通性的非全向通信运动体集群姿态规划方法
CN108958028A (zh) * 2018-05-24 2018-12-07 大连理工大学 基于改进粒子群算法的群机器人协同搜索方法
CN109241552A (zh) * 2018-07-12 2019-01-18 哈尔滨工程大学 一种基于多约束目标的水下机器人运动规划方法
CN109241552B (zh) * 2018-07-12 2022-04-05 哈尔滨工程大学 一种基于多约束目标的水下机器人运动规划方法
CN109752015A (zh) * 2018-12-29 2019-05-14 青岛海洋科学与技术国家实验室发展中心 路线规划方法、计算机可读介质以及控制装置
CN109976158B (zh) * 2019-03-28 2021-10-15 沈阳航空航天大学 基于距离进化n-pso的auv能源优化路径搜寻方法
CN109976158A (zh) * 2019-03-28 2019-07-05 沈阳航空航天大学 基于距离进化n-pso的auv能源优化路径搜寻方法
CN110181508B (zh) * 2019-05-09 2021-01-12 中国农业大学 水下机器人三维航路规划方法及***
CN110181508A (zh) * 2019-05-09 2019-08-30 中国农业大学 水下机器人三维航路规划方法及***
CN110764518A (zh) * 2019-10-31 2020-02-07 五邑大学 水下清淤机器人路径规划方法、装置、机器人和存储介质
CN110764518B (zh) * 2019-10-31 2021-05-11 五邑大学 水下清淤机器人路径规划方法、装置、机器人和存储介质
CN111307158A (zh) * 2020-03-19 2020-06-19 哈尔滨工程大学 一种auv三维航路规划方法
CN112124299A (zh) * 2020-09-14 2020-12-25 东南大学 一种智能网联新能源汽车分层式能耗优化方法
CN112124299B (zh) * 2020-09-14 2021-11-02 东南大学 一种智能网联新能源汽车分层式能耗优化方法
CN117369507A (zh) * 2023-10-31 2024-01-09 河海大学 一种自适应粒子群算法的无人机动态路径规划方法

Also Published As

Publication number Publication date
CN107168309B (zh) 2020-02-14

Similar Documents

Publication Publication Date Title
CN107168309A (zh) 一种基于行为的多水下机器人路径规划方法
CN109241552B (zh) 一种基于多约束目标的水下机器人运动规划方法
CN109343341B (zh) 一种基于深度强化学习的运载火箭垂直回收智能控制方法
Shi et al. Multi pseudo Q-learning-based deterministic policy gradient for tracking control of autonomous underwater vehicles
Li et al. Robust time-varying formation control for underactuated autonomous underwater vehicles with disturbances under input saturation
CN108873687B (zh) 一种基于深度q学习的智能水下机器人行为体系结规划方法
WO2020056875A1 (zh) 一种基于深度强化学习的停车策略
CN109240091B (zh) 一种基于强化学习的水下机器人控制方法及其进行跟踪的控制方法
Zhu et al. Task assignment and path planning of a multi-AUV system based on a Glasius bio-inspired self-organising map algorithm
Wang et al. Target tracking control of a biomimetic underwater vehicle through deep reinforcement learning
CN106055522A (zh) 冗余空间机械臂最小基座姿态扰动的轨迹规划方法
CN105139072A (zh) 应用于非循迹智能小车避障***的强化学习算法
CN104501816A (zh) 一种多无人飞行器协调避碰导引规划方法
CN111045453A (zh) 一种基于无人艇与多水下机器人的协同控制***及方法
CN108363393B (zh) 一种智能运动设备及其导航方法和存储介质
kumar Panigrahi et al. Navigation of autonomous mobile robot using different activation functions of wavelet neural network
Tian et al. Learning to drive like human beings: A method based on deep reinforcement learning
Sun et al. A novel fuzzy control algorithm for three-dimensional AUV path planning based on sonar model
CN109739094A (zh) 一种基于自适应滑模控制的移动机器人轨迹跟踪新方法
Panigrahi et al. A novel intelligent mobile robot navigation technique for avoiding obstacles using RBF neural network
Lan et al. Path planning for underwater gliders in time-varying ocean current using deep reinforcement learning
CN113093804A (zh) 基于反演滑模控制的无人艇编队控制方法和控制***
Gao et al. Constrained path-planning control of unmanned surface vessels via ant-colony optimization
Lv et al. A collision-free planning and control framework for a biomimetic underwater vehicle in dynamic environments
Sundarraj et al. Route planning for an autonomous robotic vehicle employing a weight-controlled particle swarm-optimized Dijkstra algorithm

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant