CN112506194A - 一种移动机器人集群分布式安全学习控制方法 - Google Patents

一种移动机器人集群分布式安全学习控制方法 Download PDF

Info

Publication number
CN112506194A
CN112506194A CN202011401269.2A CN202011401269A CN112506194A CN 112506194 A CN112506194 A CN 112506194A CN 202011401269 A CN202011401269 A CN 202011401269A CN 112506194 A CN112506194 A CN 112506194A
Authority
CN
China
Prior art keywords
mobile robot
speed
control
cluster
control method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011401269.2A
Other languages
English (en)
Other versions
CN112506194B (zh
Inventor
杨睿
郑磊
成慧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sun Yat Sen University
Original Assignee
Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sun Yat Sen University filed Critical Sun Yat Sen University
Priority to CN202011401269.2A priority Critical patent/CN112506194B/zh
Publication of CN112506194A publication Critical patent/CN112506194A/zh
Application granted granted Critical
Publication of CN112506194B publication Critical patent/CN112506194B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0212Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
    • G05D1/0221Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory involving a learning process

Landscapes

  • Engineering & Computer Science (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)
  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)

Abstract

本发明属于移动机器人分布式控制技术领域,更具体地,涉及一种移动机器人集群分布式安全学习控制方法。本发明通过贝叶斯学习对环境扰动进行建模,将学习到的模型结合到先验***模型作为动力学约束;通过传感器获得邻域移动机器人和障碍物的位置和速度信息,基于速度障碍方法获得当前移动机器人的速度可行域;根据速度可行域设计控制屏障函数,构建并求解二次规划问题以最小校正上层控制器的参考控制量,以满足安全无碰约束。本发明能够在不确定外部扰动的情况下,考虑动力学约束,实现移动机器人集群自适应分布式安全控制的技术目标。

Description

一种移动机器人集群分布式安全学习控制方法
技术领域
本发明属于移动机器人分布式控制技术领域,更具体地,涉及一种移动机器人集群分布式安全学习控制方法。
背景技术
得益于传感器、微处理器等技术的飞速发展,移动机器人技术在军用和民用领域发挥着日益重要的作用。相比于单移动机器人***,移动机器人集群***能以彼此协作的方式高效、可靠地完成大面积复杂动态区域的作业任务,在灾害、战场等恶劣环境中具有不可替代的优势,越来越广泛地应用在智慧农业、空中巡查、电力巡检、物流快递等民用领域。实际应用场景中存时变风场、不同地面摩擦等不确定的环境扰动,具备像生物群体一般适应环境变化、能够安全避免集群机间碰撞以及与外部物体的碰撞的群体自主导航能力,是移动机器人集群自主完成作业任务的重要前提。
在集群的分布式控制方式中,利用邻近无人机的信息交互,各无人机自主决策规划并计算其控制指令,采用分布式组织结构的集群无人***具有更好的可扩展性、适应动态环境以及抗风险和故障的能力。由于机载感知与通信能力有限,无人机仅能获得局部环境信息以及通信范围内邻近个体的信息,如何利用各无人机的局部有限信息,如何通过邻近无人机之间的相互作用,根据场景信息动态重构集群的队形变化,并快速形成新的目标队形,是分布式编队导航中的技术难点问题。另一方面,在实际环境中应用时,要求无人机能在环境不确定情况下自适应于环境扰动,快速、准确、稳定地控制,在此过程中需考虑自适应效果保证机间和与障碍物的无碰安全。目前的研究针对障碍物场景的移动机器人集群控制提出了各有特色的方法,然而考虑自适应于环境不确定扰动,并利用邻域信息考虑动力学模型设计安全分布式控制器,仍面临诸多新的挑战,解决这一问题是提升移动机器人集群提升安全可靠导航能力的关键。
发明内容
本发明为克服上述现有技术中的至少一个缺陷,提供一种移动机器人集群分布式安全学习控制方法,实现了对移动机器人集群自适应、安全的分布式控制。
为解决上述技术问题,本发明采用的技术方案是:一种移动机器人集群分布式安全学习控制方法,包括以下步骤:
S1.构造移动机器人集群中单机的动力学仿射控制模型;
S2.对各移动机器人,基于高斯过程回归对环境不确定扰动进行建模,模型可对扰动进行预测并给出预测的置信度;
S3.对各移动机器人,通过传感器获得邻域移动机器人和障碍物的位置和速度信息,基于速度障碍方法获得当前移动机器人的速度可行域;
S4.根据速度可行域设计控制屏障函数,对各移动机器人,通过联合动力学模型与控制屏障函数构建带不等式约束的二次规划问题,对上层控制器输出的参考控制量进行最小校正,将***的状态和控制约束在可行安全域内,得到优化控制量;
S5.对各移动机器人,执行优化后得到的控制量,应用于机器人与环境的交互中;
S6.在线收集***与环境交互的状态和控制序列,更新高斯过程回归模型;
S7.重复步骤S2至步骤S6直至交互结束。
本发明通过贝叶斯学习对环境扰动进行建模,先验***模型作为动力学约束;通过传感器获得邻域移动机器人和障碍物的位置和速度信息,基于速度障碍方法获得当前移动机器人的速度可行域;根据速度可行域设计控制屏障函数,并构建二次规划问题对上层控制器计算得到的参考控制量进行最小校正,以满足安全无碰约束,实现能够自适应于环境扰动的、并能够保证安全无碰的移动机器人集群分布式控制。同时,方法对上层控制器不做约束,可兼容现有集群控制算法,为其提供安全性保证。
进一步的,所述的步骤S1中,构造的移动机器人集群中单机的动力学仿射控制模型为:
Figure BDA0002817026710000021
式中,
Figure BDA0002817026710000022
为***状态量,
Figure BDA0002817026710000023
为***控制量,p,v分别是移动机器人的位置和速度;f(x)+g(x)u代表对***平动动力学建模所得的先验模型,d(x)表示未建模的不确定环境扰动。
进一步的,所述的S2中,对各移动机器人,通过在线收集的数据集
Figure BDA0002817026710000031
作为训练集,高斯过程回归通过贝叶斯推理得到状态x*的下偏差d(x*)的均值μ(x*)和方差σ(x*);得到关于d(x*)的高置信区间:D(x*)={d|μ(x*)-cδσ(x*)≤d≤μ(x*)+cδσ(x*)},cδ>0是高斯分布中(1-δ)置信度对应的常数。
进一步的,所述的S3步骤中,借鉴最优互惠速度障碍法的速度可行域构造法,为各移动机器人构造速度可行域,将安全避障问题转化到速度域上来分析。
进一步的,所述的S3步骤具体包括:
假设当前移动机器人A和邻域内其他任一机器人O的位置为pA和pO,速度分别为vA和vO,分别视作半径为rA和rO的圆形;
考虑需要避免碰撞的时间窗口τ,在τ内当前移动机器人A若与机器人O发生碰撞,则相对速度(vA-vO)应当落在速度障碍区域
Figure BDA0002817026710000032
Figure BDA0002817026710000033
其中D(p,r)表示以p为圆心,r为半径的球域;
将相对速度(vA-vO)校正到
Figure BDA0002817026710000034
外,可避免在r时间内发生碰撞,最小校正量
Figure BDA0002817026710000035
Figure BDA0002817026710000036
表示
Figure BDA0002817026710000037
的边界;由此,可获得速度可行域
Figure BDA0002817026710000038
其中n为u的单位向量,j为当前机器人在避碰中应当承担的责任系数;
对非合作式障碍物,当前移动机器人需要承担全部避碰责任,即j=1;对其余移动机器人,则互相应当承担一半责任,即
Figure BDA0002817026710000039
对该机器人考虑邻域内所有机器人和障碍物,设共计N个,则构造的速度可行域为
Figure BDA00028170267100000310
进一步的,在所述的步骤S4中,对各移动机器人,记为A,基于可行速度域
Figure BDA00028170267100000311
构造控制屏障函数h(x),函数刻画速度vA与速度可行域
Figure BDA00028170267100000312
边界的距离;结合基于高斯过程学习的动力学模型和控制屏障函数,给定上层控制器计算得到的参考控制量u0,不等式约束的二次规划问题的具体公式为:
Figure BDA00028170267100000313
st.-Lgh(x)u-Lfh(x)-Lμh(x)+cσ|Lσh(x)|-κ(h(x))≤ε
umin≤u≤umax
式中,umin和umax分别是控制量上界与下界,正定矩阵R为控制量权重,ε为代表松弛变量,Kε是对应的系数,cσ是方差对应的系数,符号L代表李导数,κ是一个k-class类函数。
进一步的,所述的上层控制器可以兼容现成的多种控制算法,如比例-微分-积分控制器或模型预测控制器。
进一步的,所述的步骤S5中,对各移动机器人,执行优化后得到的控制量u*,移动机器人集群与环境进行交互。
进一步的,所述的步骤S6中,在线收集集群***与环境交互的位置和速度以及对应的控制量,更新高斯过程回归模型。
与现有技术相比,有益效果是:本发明提供的一种移动机器人集群分布式安全学习控制方法,解决了不确定环境扰动下移动机器人集群分布式控制过程中,无法适应外部扰动、可能发生机间与障碍物之间碰撞的问题。本发明基于高斯过程通过在线收集交互数据及贝叶斯推理在高置信度下实现对环境的扰动进行在线估计和补偿,以建模***与环境交互环节存在的不确定性,并保证模型局部李普希兹连续;通过邻域移动机器人与障碍物位置和速度信息构造当前移动机器人的速度可行域,通过联合动力学模型与控制屏障函数构建带不等式约束的二次规划问题对参考控制量进行最小校正,在高置信度下保证满足安全无碰约束,从而实现对移动机器人集群自适应、安全的分布式控制。
附图说明
图1是本发明方法的计算过程流程示意图。
图2是本发明机器人集群中对移动机器人A的速度可行域计算示意图,图a为集群中移动机器人A与移动机器人O的位置示意子图,图b为速度障碍与速度可行域
Figure BDA0002817026710000044
计算示意图,
Figure BDA0002817026710000045
用于设计控制屏障函数。
具体实施方式
如图1所示,一种移动机器人集群分布式安全学习控制方法,包括以下步骤:
步骤1.本实例根据对移动机器人的先验知识和实际的任务场景,对各移动机器人的非线性仿射***建模为:
Figure BDA0002817026710000041
式中,
Figure BDA0002817026710000042
为***状态量,
Figure BDA0002817026710000043
为***控制量,p,v分别是移动机器人的位置和速度;f(x)+g(x)u代表对***平动动力学建模所得的先验模型,d(x)表示未建模的不确定环境扰动。
步骤2.对各移动机器人,基于高斯过程回归对环境不确定扰动进行建模,模型可对扰动进行预测并给出预测的置信度。
对各移动机器人,通过在线收集的数据集
Figure BDA0002817026710000051
作为训练集,高斯过程回归通过贝叶斯推理得到状态x*的下偏差d(x*)的均值μ(x*)和方差σ(x*);得到关于d(x*)的高置信区间:D(x*)={d|μ(x*)-cδσ(x*)≤d≤μ(x*)+cδσ(x*)},cδ>0是高斯分布中(1-δ)置信度对应的常数。
步骤3.对各移动机器人,通过传感器获得邻域移动机器人和障碍物的位置和速度信息,基于速度障碍方法获得当前移动机器人的速度可行域。
借鉴最优互惠速度障碍法的速度可行域构造法,为各移动机器人构造速度可行域,如图2所示。
假设当前移动机器人A和邻域内其他任一机器人O的位置为pA和pO,速度分别为vA和vO,分别视作半径为rA和rO的圆形;
考虑需要避免碰撞的时间窗口τ,在τ内当前移动机器人A若与机器人O发生碰撞,则相对速度(vA-vO)应当落在速度障碍区域
Figure BDA0002817026710000052
Figure BDA0002817026710000053
其中D(p,r)表示以p为圆心,r为半径的球域;
若将相对速度(vA-vO)校正到
Figure BDA0002817026710000054
外,可避免在r时间内发生碰撞,最小校正量
Figure BDA0002817026710000055
表示
Figure BDA0002817026710000056
的边界;由此,可获得速度可行域
Figure BDA0002817026710000057
其中n为u的单位向量,j为当前机器人在避碰中应当承担的责任系数;
对非合作式障碍物,当前移动机器人需要承担全部避碰责任,即j=1;对其余移动机器人,则互相应当承担一半责任,即
Figure BDA0002817026710000058
对该机器人考虑邻域内所有机器人和障碍物,设共计N个,则构造的速度可行域为
Figure BDA0002817026710000059
步骤4.根据速度可行域设计控制屏障函数,对各移动机器人,通过联合动力学模型与控制屏障函数构建带不等式约束的二次规划问题,对上层控制器输出的参考控制量通过安全控制器进行最小校正,将***的状态和控制约束在可行安全域内,得到优化控制量。
对各移动机器人,记为A,基于可行速度域
Figure BDA00028170267100000510
构造控制屏障函数h(x),函数刻画速度vA与速度可行域
Figure BDA00028170267100000511
边界的距离;如图2(b)所示结合基于高斯过程学习的动力学模型和控制屏障函数,给定上层控制器计算得到的参考控制量u0,不等式约束的二次规划问题的具体公式为:
Figure BDA00028170267100000512
st.-Lgh(x)u-Lfh(x)-Lμh(x)+cσ|Lσh(x)|-κ(h(x))≤ε
umin≤u≤umax
式中,umin和umax分别是控制量上界与下界,正定矩阵R为控制量权重,ε为代表松弛变量,Kε是对应的系数,cσ是方差对应的系数,符号L代表李导数,κ是一个k-class类函数。
步骤5.对各移动机器人,执行优化后得到的控制量u*,移动机器人集群与环境进行交互。
步骤6.在线收集***与环境交互的状态和控制序列,更新高斯过程回归模型;
步骤7.重复步骤2至步骤6,直至完成集群控制任务或最大实验设定时长。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

Claims (9)

1.一种移动机器人集群分布式安全学习控制方法,其特征在于,包括以下步骤:
S1.构造移动机器人集群中单机的动力学仿射控制模型;
S2.对各移动机器人,基于高斯过程回归对环境不确定扰动进行建模,模型可对扰动进行预测并给出预测的置信度;
S3.对各移动机器人,通过传感器获得邻域移动机器人和障碍物的位置和速度信息,基于速度障碍方法获得当前移动机器人的速度可行域;
S4.根据速度可行域设计控制屏障函数,对各移动机器人,通过联合动力学模型与控制屏障函数构建带不等式约束的二次规划问题,对上层控制器输出的参考控制量进行最小校正,将***的状态和控制约束在可行安全域内,得到优化控制量;
S5.对各移动机器人,执行优化后得到的控制量,应用于机器人与环境的交互中;
S6.在线收集***与环境交互的状态和控制序列,更新高斯过程回归模型;
S7.重复步骤S2至步骤S6直至交互结束。
2.根据权利要求1所述的移动机器人集群分布式安全学习控制方法,其特征在于,所述的步骤S1中,构造的移动机器人集群中单机的动力学仿射控制模型为:
Figure FDA0002817026700000011
式中,
Figure FDA0002817026700000012
为***状态量,
Figure FDA0002817026700000013
为***控制量,p,v分别是移动机器人的位置和速度;f(x)+g(x)u代表对***平动动力学建模所得的先验模型,d(x)表示未建模的不确定环境扰动。
3.根据权利要求2所述的移动机器人集群分布式安全学习控制方法,其特征在于,所述的S2中,对各移动机器人,通过在线收集的数据集
Figure FDA0002817026700000014
作为训练集,高斯过程回归通过贝叶斯推理得到状态x*的下偏差d(x*)的均值μ(x*)和方差σ(x*);得到关于d(x*)的高置信区间:D(x*)={d|μ(x*)-cδσ(x*)≤d≤μ(x*)+cδσ(x*)},cδ>0是高斯分布中(1-δ)置信度对应的常数。
4.根据权利要求3所述的移动机器人集群分布式安全学习控制方法,其特征在于,所述的S3步骤中,借鉴最优互惠速度障碍法的速度可行域构造法,为各移动机器人构造速度可行域,将安全避障问题转化到速度域上来分析。
5.根据权利要求4所述的移动机器人集群分布式安全学习控制方法,其特征在于,所述的S3步骤具体包括:
假设当前移动机器人A和邻域内其他任一机器人O的位置为pA和po,速度分别为vA和vo,分别视作半径为rA和rO的圆形;
考虑需要避免碰撞的时间窗口τ,在τ内当前移动机器人A若与机器人O发生碰撞,则相对速度(vA-vO)应当落在速度障碍区域
Figure FDA0002817026700000021
Figure FDA0002817026700000022
其中D(p,r)表示以p为圆心,r为半径的球域;
将相对速度(vA-vO)校正到
Figure FDA0002817026700000023
外,可避免在r时间内发生碰撞,最小校正量
Figure FDA0002817026700000024
Figure FDA0002817026700000025
表示
Figure FDA0002817026700000026
的边界;由此,可获得速度可行域
Figure FDA0002817026700000027
其中n为u的单位向量,j为当前机器人在避碰中应当承担的责任系数;
对非合作式障碍物,当前移动机器人需要承担全部避碰责任,即j=1;对其余移动机器人,则互相应当承担一半责任,即
Figure FDA0002817026700000028
对该机器人考虑邻域内所有机器人和障碍物,设共计N个,则构造的速度可行域为
Figure FDA0002817026700000029
6.根据权利要求5所述的移动机器人集群分布式安全学习控制方法,其特征在于,在所述的步骤S4中,对各移动机器人,记为A,基于可行速度域
Figure FDA00028170267000000210
构造控制屏障函数h(x),函数刻画速度vA与速度可行域
Figure FDA00028170267000000211
边界的距离;结合基于高斯过程学习的动力学模型和控制屏障函数,给定上层控制器计算得到的参考控制量u0,不等式约束的二次规划问题的具体公式为:
Figure FDA00028170267000000212
st.-Lgh(x)u-Lfh(x)-Lμh(x)+cσ|Lσh(x)|-κ(h(x))≤ε
umin≤u≤umax
式中,umin和umax分别是控制量上界与下界,正定矩阵R为控制量权重,ε为代表松弛变量,Kε是对应的系数,cσ是方差对应的系数,符号L代表李导数,κ是一个k-class类函数。
7.根据权利要求6所述的移动机器人集群分布式安全学习控制方法,其特征在于,所述的上层控制器为比例-微分-积分控制器、模型预测控制器。
8.根据权利要求6所述的移动机器人集群分布式安全学习控制方法,其特征在于,所述的步骤S5中,对各移动机器人,执行优化后得到的控制量u*,移动机器人集群与环境进行交互。
9.根据权利要求6所述的移动机器人集群分布式安全学习控制方法,其特征在于,所述的步骤S6中,在线收集集群***与环境交互的位置和速度以及对应的控制量,更新高斯过程回归模型。
CN202011401269.2A 2020-12-03 2020-12-03 一种移动机器人集群分布式安全学习控制方法 Active CN112506194B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011401269.2A CN112506194B (zh) 2020-12-03 2020-12-03 一种移动机器人集群分布式安全学习控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011401269.2A CN112506194B (zh) 2020-12-03 2020-12-03 一种移动机器人集群分布式安全学习控制方法

Publications (2)

Publication Number Publication Date
CN112506194A true CN112506194A (zh) 2021-03-16
CN112506194B CN112506194B (zh) 2022-03-29

Family

ID=74969800

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011401269.2A Active CN112506194B (zh) 2020-12-03 2020-12-03 一种移动机器人集群分布式安全学习控制方法

Country Status (1)

Country Link
CN (1) CN112506194B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116048120A (zh) * 2023-01-10 2023-05-02 中国建筑一局(集团)有限公司 一种未知动态环境下小型四旋翼无人机自主导航***及方法
CN116540553A (zh) * 2023-07-05 2023-08-04 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) 一种基于强化学习的移动机器人安全运动方法
WO2024034579A1 (ja) * 2022-08-08 2024-02-15 川崎重工業株式会社 制御装置
CN117687342A (zh) * 2024-01-31 2024-03-12 中国科学技术大学 基于高斯过程非保守概率误差界的机器人安全控制方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2595135A1 (en) * 2011-11-16 2013-05-22 Volvo Car Corporation Method and arrangement for collision avoidance
CN105223956A (zh) * 2015-11-09 2016-01-06 中山大学 一种全向移动机器人的动态避障方法
CN110825108A (zh) * 2019-11-11 2020-02-21 浙江理工大学 一种在同一空域内多架跟踪无人机的协同防碰撞方法
CN110928189A (zh) * 2019-12-10 2020-03-27 中山大学 一种基于强化学习和李雅普诺夫函数的鲁棒控制方法
CN111830959A (zh) * 2019-03-26 2020-10-27 百度(美国)有限责任公司 用于操作自动驾驶车辆的方法、***和机器可读介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2595135A1 (en) * 2011-11-16 2013-05-22 Volvo Car Corporation Method and arrangement for collision avoidance
CN105223956A (zh) * 2015-11-09 2016-01-06 中山大学 一种全向移动机器人的动态避障方法
CN111830959A (zh) * 2019-03-26 2020-10-27 百度(美国)有限责任公司 用于操作自动驾驶车辆的方法、***和机器可读介质
CN110825108A (zh) * 2019-11-11 2020-02-21 浙江理工大学 一种在同一空域内多架跟踪无人机的协同防碰撞方法
CN110928189A (zh) * 2019-12-10 2020-03-27 中山大学 一种基于强化学习和李雅普诺夫函数的鲁棒控制方法

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
VU PHI TRAN: "Distributed Formation Control Using Fuzzy Self-Tuning of Strictly Negative Imaginary Consensus Controllers in Aerial Robotics", 《TRANSACTIONS ON MECHATRONICS》 *
YUANZHE WANG: "A Practical Leader–Follower Tracking Control Scheme for Multiple Nonholonomic Mobile Robots in Unknown Obstacle Environments", 《IEEE TRANSACTIONS ON CONTROL SYSTEMS TECHNOLOGY》 *
刘中常: "基于预测窗的轮式移动机器人最优避障避碰算法", 《控制理论与应用》 *
张宏宏: "基于速度障碍法的无人机避障与航迹恢复策略", 《***工程与电子技术》 *
成慧: "Decentralized Navigation of Multiple Agents Based on ORCA and Model Predictive Control", 《2017 IEEE/RSJ INTERNATIONAL CONFERENCE ON INTELLIGENT ROBOTS AND SYSTEMS》 *
成慧: "Learning-Based Safety-Stability-Driven Control for Safety-Critical Systems under Model Uncertainties", 《THE 12TH INTERNATIONAL CONFERENCE ON WIRELESS COMMUNICATIONS AND SIGNAL PROCESSING》 *
成慧: "基于视觉的无人机地面目标自主跟踪***", 《人工智能》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024034579A1 (ja) * 2022-08-08 2024-02-15 川崎重工業株式会社 制御装置
CN116048120A (zh) * 2023-01-10 2023-05-02 中国建筑一局(集团)有限公司 一种未知动态环境下小型四旋翼无人机自主导航***及方法
CN116048120B (zh) * 2023-01-10 2024-04-16 中国建筑一局(集团)有限公司 一种未知动态环境下小型四旋翼无人机自主导航***及方法
CN116540553A (zh) * 2023-07-05 2023-08-04 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) 一种基于强化学习的移动机器人安全运动方法
CN116540553B (zh) * 2023-07-05 2023-08-25 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) 一种基于强化学习的移动机器人安全运动方法
CN117687342A (zh) * 2024-01-31 2024-03-12 中国科学技术大学 基于高斯过程非保守概率误差界的机器人安全控制方法
CN117687342B (zh) * 2024-01-31 2024-05-17 中国科学技术大学 基于高斯过程非保守概率误差界的机器人安全控制方法

Also Published As

Publication number Publication date
CN112506194B (zh) 2022-03-29

Similar Documents

Publication Publication Date Title
CN112506194B (zh) 一种移动机器人集群分布式安全学习控制方法
Wang et al. Autonomous navigation of UAVs in large-scale complex environments: A deep reinforcement learning approach
CN110928189B (zh) 一种基于强化学习和李雅普诺夫函数的鲁棒控制方法
Orozco-Rosas et al. Mobile robot path planning using a QAPF learning algorithm for known and unknown environments
CN112835333B (zh) 一种基于深度强化学习多agv避障与路径规划方法及***
Ruelens et al. Direct load control of thermostatically controlled loads based on sparse observations using deep reinforcement learning
McKinnon et al. Learn fast, forget slow: Safe predictive learning control for systems with unknown and changing dynamics performing repetitive tasks
CN107479547A (zh) 基于示教学习的决策树行为决策算法
Pini et al. Safe real-world autonomous driving by learning to predict and plan with a mixture of experts
Li et al. A deep reinforcement learning based approach for autonomous overtaking
Bajcsy et al. Analyzing human models that adapt online
Guo et al. Research on multi-sensor information fusion and intelligent optimization algorithm and related topics of mobile robots
Lin et al. Research on UUV obstacle avoiding method based on recurrent neural networks
Louati Cloud-assisted collaborative estimation for next-generation automobile sensing
CN111221318B (zh) 一种基于模型预测控制算法的多机器人状态估计方法
CN110926470B (zh) 一种agv导航控制方法及***
CN116258242A (zh) 一种自动驾驶车辆反应式轨迹预测方法及***
Kalweit et al. Q-learning with long-term action-space shaping to model complex behavior for autonomous lane changes
Jin et al. End-to-end GPS tracker based on switchable fuzzy normalization codec for assistive drone application
CN115981155A (zh) 一种面向空地异构多机器人的安全轨迹协同规划方法
CN114912693A (zh) 一种基于多模态预测的自动驾驶汽车运动规划方法
Wei et al. Multi-sensor environmental perception and adaptive cruise control of intelligent vehicles using kalman filter
Paudel Learning for robot decision making under distribution shift: A survey
Puthumanaillam et al. Weathering ongoing uncertainty: learning and planning in a time-varying partially observable environment
Piperigkos et al. Cooperative five degrees of freedom motion estimation for a swarm of autonomous vehicles

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant