CN113515044A - 一种轮式移动机器人的基于学习预测跟踪控制方法及装置 - Google Patents

一种轮式移动机器人的基于学习预测跟踪控制方法及装置 Download PDF

Info

Publication number
CN113515044A
CN113515044A CN202110750225.9A CN202110750225A CN113515044A CN 113515044 A CN113515044 A CN 113515044A CN 202110750225 A CN202110750225 A CN 202110750225A CN 113515044 A CN113515044 A CN 113515044A
Authority
CN
China
Prior art keywords
mobile robot
wheeled mobile
robot
model
learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110750225.9A
Other languages
English (en)
Other versions
CN113515044B (zh
Inventor
戴荔
陆雨琛
黄腾
杨欢
孙中奇
夏元清
翟弟华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Technology BIT
Original Assignee
Beijing Institute of Technology BIT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Technology BIT filed Critical Beijing Institute of Technology BIT
Priority to CN202110750225.9A priority Critical patent/CN113515044B/zh
Publication of CN113515044A publication Critical patent/CN113515044A/zh
Application granted granted Critical
Publication of CN113515044B publication Critical patent/CN113515044B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)
  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)

Abstract

本发明提供一种轮式移动机器人的基于学习预测跟踪控制方法及装置,所述方法包括获取所述轮式移动机器人的实际状态与当前时刻所述轮式移动机器人的理论状态值的差值,作为所述学习模型的输入,输出模型偏差预测值,计算学习误差率;若所述学习误差率大于所述学习误差率上限;基于所述模型偏差预测值更新所述轮式移动机器人自身的第一学习模型;基于所述轮式移动机器人的预测跟踪控制目标及约束条件,确定所述轮式移动机器人的预测跟踪控制优化问题模型;使用控制策略控制所述轮式移动机器人自身的第一学习模型。根据本发明的方案,保证轮式移动机器人在实际使用中控制的准确性,使用的安全性和舒适性。

Description

一种轮式移动机器人的基于学习预测跟踪控制方法及装置
技术领域
本发明涉及机器人轨迹跟踪控制领域,尤其涉及一种轮式移动机器人的基于学习预测跟踪控制方法及装置。
背景技术
轮式移动机器人作为机器人领域的重要组成部分,一直受到研究学者们的广泛关注。一个完整的轮式移动机器人***,一般由环境感知***、控制***以及行为动作执行***构成。它集中了传感器、电子电气、信息处理、自动控制以及人工智能等多个学科技术。同时,轮式移动机器人凭借着其高集成性与机动性,相较于其它类型机器人,能够在各种复杂环境下展开灵活作业。尤其随着机器人智能化程度不断提高,轮式移动机器逐渐渗透进入现代社会的各行各业。不仅在工业、农业、医疗等传统领域应用广泛,而且在城市交通、智能物流和家用娱乐等新兴行业都扮演着重要角色。
随着轮式移动机器人不断融入生活,用户期望机器人执行任务的难度不断提高,使用场景也变得越来越复杂。人们对机器人的评价不仅以能否完成任务为指标,还包括在执行过程中的用户感受评价。例如,使用舒适性、低风险性等。尤其是在一些与人类生活密切先关的领域,使用过程的愉悦程度将极大地影响人们的评价。因此,近年来许多轮式移动机器人领域的相关研究,都逐渐引入使用体验评价。其次,随着轮式移动机器人运行环境越来越复杂,机器人面临的考验也逐渐增强。例如,***扰动组成更加复杂,环境对机器人的约束限制更加多样。这对轮式移动机器人的控制方法提出了极大挑战,因此,带来如何提高轮式移动机器人控制***的鲁棒性并增强其处理多约束的能力的挑战。
基于控制策略的理论保障大都依赖于***模型的精确度。由于轮式移动机器人受到扰动等因素的影响,因此,在一些复杂场景下,这些控制策略无法满足控制性能的需要。特别是在轮式移动机器人***受到参数不确定性、观测误差以及环境噪声等多种因素的影响,以及轮式移动机器人具有位置、输入和增量输入的约束,如何准确对轮式移动机器人的运动趋势进行预测,预测轮式移动机器人的运动轨迹,成为现有技术中无法解决的问题。
轮式移动机器人在实际使用过程中往往会受到各种物理约束限制的影响,例如速度约束、加速度约束、车道限制等。同时,由于实际应用场景中,轮式移动机器人***会受到诸如参数不确定性、测量误差以及环境噪声等因素的影响。因此,设计一种能够有效处理有约束的鲁棒控制策略以解决轮式移动机器人的控制问题是极具研究价值的。传统模型预测控制策略较为依赖***模型的精确性,因此,在一些具有复杂干扰的情况下,传统方法不能很好地完成控制任务。
发明内容
为解决上述技术问题,本发明提出了一种轮式移动机器人的基于学习预测跟踪控制方法及装置,所述方法及装置,用以解决现有技术中无法对有扰、有约束条件下的轮式移动机器人运动进行良好控制,并且控制效果较为依赖轮式移动机器人准确模型的技术问题。
根据本发明的第一方面,提供一种轮式移动机器人的基于学习预测跟踪控制方法,所述方法包括以下步骤:
步骤S01:进行离线设计,所述离线设计包括确定采样间隔δ、控制执行时间Te、学习误差率上限
Figure BDA0003145891250000021
确定终端控制器的终端域Ωε;构建轮式移动机器人的基础模型,所述基础模型为包括领航机器人及所述轮式移动机器人的***,用于获取所述轮式移动机器人的理论状态值;构建学习模型,所述学习模型输入所述轮式移动机器人实际状态值相对于所述理论状态值的差值,用于获取模型偏差预测值,所述模型偏差预测值用于表征所述轮式移动机器人自身的第一学习模型;
步骤S02:判断当前时刻tk是否小于所述控制执行时间Te,若是,进入步骤S03;若否,方法结束;
步骤S03:采集所述轮式移动机器人的实际状态
Figure BDA0003145891250000031
计算当前时刻所述轮式移动机器人的理论状态值;若两机器人的位置偏差轨迹位于所述终端控制器的终端域Ωε,进入步骤S04;否则,进入步骤S05;
步骤S04:在当前时刻到下一采样时间的时间间隔内,使用所述终端控制器控制所述轮式移动机器人自身的第一学习模型;到达下一采样时间时,将下一采样时间记为当前时刻,进入步骤S02;
步骤S05:获取所述轮式移动机器人的实际状态
Figure BDA0003145891250000032
与当前时刻所述轮式移动机器人的理论状态值的差值,作为所述学习模型的输入,输出模型偏差预测值,计算学习误差率;
步骤S06:若所述学习误差率大于所述学习误差率上限,进入步骤S07;否则,进入步骤S08;
步骤S07:基于所述模型偏差预测值更新所述轮式移动机器人自身的第一学习模型;进入步骤S09;
步骤S08:所述轮式移动机器人自身的第一学习模型保持不变;
步骤S09:基于所述轮式移动机器人的预测跟踪控制目标及约束条件,确定所述轮式移动机器人的预测跟踪控制优化问题模型;
步骤S10:在当前时刻到下一采样时间的时间间隔内,使用控制策略控制所述轮式移动机器人自身的第一学习模型;到达下一采样时间时,将下一采样时间记为当前时刻,进入步骤S02;
所述控制策略为:求解所述预测跟踪控制优化问题模型,获取当前采样时刻对应的最优控制输入,基于所述学习模型,获取当前采样时刻的模型偏差预测值,基于所述当前采样时刻的模型偏差预测值获取当前采样时刻对应的输入补偿,结合所述当前采样时刻对应的最优控制输入及所述当前采样时刻对应的输入补偿,作为所述轮式移动机器人的输入。
根据本发明第二方面,提供一种轮式移动机器人的基于学习预测跟踪控制装置,所述装置包括:
初始化模块:配置为进行离线设计,所述离线设计包括确定采样间隔δ、控制执行时间Te、学习误差率上限
Figure BDA0003145891250000041
确定终端控制器的终端域Ωε;构建轮式移动机器人的基础模型,所述基础模型为包括领航机器人及所述轮式移动机器人的***,用于获取所述轮式移动机器人的理论状态值;构建学习模型,所述学习模型输入所述轮式移动机器人实际状态值相对于所述理论状态值的差值,用于获取模型偏差预测值,所述模型偏差预测值用于表征所述轮式移动机器人自身的第一学习模型;
第一判断模块:配置为判断当前时刻tk是否小于所述控制执行时间Te
第二判断模块:配置为采集所述轮式移动机器人的实际状态ξf(tk),计算当前时刻所述轮式移动机器人的理论状态值;若两机器人的位置偏差轨迹位于所述终端控制器的终端域Ωε
第一控制模块:配置为在当前时刻到下一采样时间的时间间隔内,使用所述终端控制器控制所述轮式移动机器人自身的第一学习模型;到达下一采样时间时,将下一采样时间记为当前时刻;
学习误差率模块:配置为获取所述轮式移动机器人的实际状态ξf(tk)与当前时刻所述轮式移动机器人的理论状态值的差值,作为所述学习模型的输入,输出模型偏差预测值,计算学习误差率;
第三判断模块:配置为判断所述学习误差率是否大于所述学习误差率上限;
第一更新模块:配置为基于所述模型偏差预测值更新所述轮式移动机器人自身的第一学习模型;
第一学习模型控制模块:配置为所述轮式移动机器人自身的第一学习模型保持不变;
优化问题模型构建模块:配置为基于所述轮式移动机器人的预测跟踪控制目标及约束条件,确定所述轮式移动机器人的预测跟踪控制优化问题模型;
控制模块:配置为在当前时刻到下一采样时间的时间间隔内,使用控制策略控制所述轮式移动机器人自身的第一学习模型;到达下一采样时间时,将下一采样时间记为当前时刻;
所述控制策略为:求解所述预测跟踪控制优化问题模型,获取当前采样时刻对应的最优控制输入,基于所述学习模型,获取当前采样时刻的模型偏差预测值,基于所述当前采样时刻的模型偏差预测值获取当前采样时刻对应的输入补偿,结合所述当前采样时刻对应的最优控制输入及所述当前采样时刻对应的输入补偿,作为所述轮式移动机器人的输入。
根据本发明第三方面,提供一种轮式移动机器人的基于学习预测跟踪控制***,包括:
处理器,用于执行多条指令;
存储器,用于存储多条指令;
其中,所述多条指令,用于由所述存储器存储,并由所述处理器加载并执行如前所述的轮式移动机器人的基于学习预测跟踪控制方法。
根据本发明第四方面,提供一种计算机可读存储介质,所述存储介质中存储有多条指令;所述多条指令,用于由处理器加载并执行如前所述的轮式移动机器人的基于学习预测跟踪控制方法。
根据本发明的上述方案,本发明的方法,考虑轮式移动机器人领航-跟随***,在***受到复杂扰动以及存在位置、输入和增量型输入约束的条件下,提出一种基于学***衡控制性能和优化问题初始可行域的大小。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,并可依照说明书的内容予以实施,以下以本发明的较佳实施例并配合附图详细说明如后。
附图说明
构成本发明的一部分的附图用来提供对本发明的进一步理解,本发明提供如下附图进行说明。在附图中:
图1为本发明一个实施方式的轮式移动机器人的基于学习预测跟踪控制方法流程示意图;
图2为轮式移动机器人结构示意图;
图3为本发明一个实施方式的轮式移动机器人领航-跟随模型坐标图;
图4为本发明一个实施方式的轮式移动机器人模型偏差学习误差图;
图5为轮式移动机器人在LMPTC算法作用下的轨迹跟踪图;
图6为在不同算法作用下轮式移动机器人的轨迹跟踪曲线图;
图7为在不同算法作用下轮式移动机器人的位置跟踪误差曲线图;
图8为本发明一个实施方式的轮式移动机器人的基于学习预测跟踪控制装置结构框图。
具体实施方式
首先结合图1说明本发明一个实施方式的轮式移动机器人的基于学习预测跟踪控制方法流程。如图1所示,所述方法包括以下步骤:
步骤S01:进行离线设计,所述离线设计包括确定采样间隔δ、控制执行时间Te、学习误差率上限
Figure BDA0003145891250000061
确定终端控制器的终端域Ωε;构建轮式移动机器人的基础模型,所述基础模型为包括领航机器人及所述轮式移动机器人的***,用于获取所述轮式移动机器人的理论状态值;构建学习模型,所述学习模型输入所述轮式移动机器人实际状态值相对于所述理论状态值的差值,用于获取模型偏差预测值,所述模型偏差预测值用于表征所述轮式移动机器人自身的第一学习模型;
步骤S02:判断当前时刻tk是否小于所述控制执行时间Te,若是,进入步骤S03;若否,方法结束;
步骤S03:采集所述轮式移动机器人的实际状态
Figure BDA0003145891250000071
计算当前时刻所述轮式移动机器人的理论状态值;若两机器人的位置偏差轨迹位于所述终端控制器的终端域Ωε,进入步骤S04;否则,进入步骤S05;
步骤S04:在当前时刻到下一采样时间的时间间隔内,使用所述终端控制器控制所述轮式移动机器人自身的第一学习模型;到达下一采样时间时,将下一采样时间记为当前时刻,进入步骤S02;
步骤S05:获取所述轮式移动机器人的实际状态
Figure BDA0003145891250000072
与当前时刻所述轮式移动机器人的理论状态值的差值,作为所述学习模型的输入,输出模型偏差预测值,计算学习误差率;
步骤S06:若所述学习误差率大于所述学习误差率上限,进入步骤S07;否则,进入步骤S08;
步骤S07:基于所述模型偏差预测值更新所述轮式移动机器人自身的第一学习模型;进入步骤S09;
步骤S08:所述轮式移动机器人自身的第一学习模型保持不变;
步骤S09:基于所述轮式移动机器人的预测跟踪控制目标及约束条件,确定所述轮式移动机器人的预测跟踪控制优化问题模型;
步骤S10:在当前时刻到下一采样时间的时间间隔内,使用控制策略控制所述轮式移动机器人自身的第一学习模型;到达下一采样时间时,将下一采样时间记为当前时刻,进入步骤S02;
所述控制策略为:求解所述预测跟踪控制优化问题模型,获取当前采样时刻对应的最优控制输入,基于所述学习模型,获取当前采样时刻的模型偏差预测值,基于所述当前采样时刻的模型偏差预测值获取当前采样时刻对应的输入补偿,结合所述当前采样时刻对应的最优控制输入及所述当前采样时刻对应的输入补偿,作为所述轮式移动机器人的输入。
本实施例中,***模型指的是轮式移动机器人的实际***;第一学习模型是通过学习得到的用于近似模拟实际***的模型,由于实际***的扰动未知,因此,所述第一学习模型是用于接收实际控制的模型。
所述步骤S01,其中,所述构建轮式移动机器人的基础模型,所述基础模型为包括领航机器人及所述轮式移动机器人的***,用于获取所述轮式移动机器人的理论状态值,包括:
如图2所示,轮式移动机器人的主体包括中心车体及左、右两个车轮。
建立领航-跟随者***,包括领航机器人及所述轮式移动机器人,所述轮式移动机器人作为跟随机器人,所述领航机器人具有与所述轮式移动机器人相同的机械结构,所述领航机器人以恒定输入控制量进行运动,所述轮式移动机器人中设有预测跟踪控制器以控制所述轮式移动机器人跟随所述领航机器人进行运动。
进一步地,如图2所示,所述领航机器人以头部节点的中心作为中心节点建模,得到如下的领航机器人***模型:
Figure BDA0003145891250000081
其中,t为时间,
Figure BDA0003145891250000082
为领航机器人状态轨迹,ul为领航机器人控制输入,fll,ul)为领航机器人***模型,θ为轮式移动机器人方向角,ul(t)为领航机器人控制输入轨迹;
领航机器人状态变量ξl=[xl,yl,θl]T,包含所述领航机器人的位置变量pl=[xl,yl]T和角度变量θl;xl为领航者位置横坐标值,yl为领航者位置纵坐标值;
所述领航机器人的控制输入ul=[vl,ωl]T,由线速度vl和角速度ωl组成;
所述领航机器人满足输入约束集合
Figure BDA0003145891250000083
所述约束集合
Figure BDA0003145891250000084
表示为:
Figure BDA0003145891250000091
其中b=a/l,l表示轮式移动机器人半轮距值,v为轮式移动机器人线速度,ω为轮式移动机器人角速度;a是一个正实数。
所述轮式移动机器人以头部节点为中心建立动力学方程并考虑运动过程中扰动的影响,所述轮式移动机器人即为所述跟随机器人,得到跟随机器人***模型:
Figure BDA0003145891250000092
其中,所述轮式移动机器人状态变量ξf=[xf,yf,θf]T,控制输入uf=[vf,ωf]T
Figure BDA0003145891250000093
为跟随机器人状态轨迹,ξf为跟随机器人状态,uf为跟随机器人控制输入,fhf,uf)为跟随机器人***模型,θf为跟随机器人方向角,l为轮式移动机器人半轮距值,uf(t)为跟随机器人控制输入轨迹。
根据两机器人运动过程中的相对位置关系,可得所述轮式移动机器人跟踪***的表达式为
Figure BDA0003145891250000094
其中,
Figure BDA0003145891250000095
为两机器人相对位置轨迹,
Figure BDA0003145891250000096
为两机器人相对方向角轨迹,fd(t)为学习模型误差,ωf为跟随机器人角速度,vf为跟随机器人线速度,θf为跟随机器人方向角,l为轮式移动机器人半轮距值;vf(t)为跟随机器人的线速度,ωf(t)为跟随机器人的角速度,
Figure BDA0003145891250000097
为两机器人的方向偏差角;
在轮式移动机器人实际运行中,轮式移动机器人会受到自身的***模型不确定性、测量误差和扰动的影响。
所述步骤S01,其中,构建学习模型,所述学习模型输入所述轮式移动机器人实际状态值相对于所述理论状态值的差值,用于获取模型偏差预测值,所述模型偏差预测值用于表征所述轮式移动机器人自身的***模型的偏差,包括:
本实施例中,所述学习模型为长短期记忆神经网络,输入为所述轮式移动机器人实时状态值与由基础模型得到的理论状态值的差值,输出为所述轮式移动机器人的模型偏差预测值。
所述步骤S05:获取所述轮式移动机器人的实际状态
Figure BDA0003145891250000101
与当前时刻所述轮式移动机器人的理论状态值的差值,作为所述学习模型的输入,输出模型偏差预测值,计算学习误差率;
步骤S06:若所述学习误差率大于所述学习误差率上限,进入步骤S07;否则,进入步骤S08;
步骤S07:基于所述模型偏差预测值更新所述轮式移动机器人自身的第一学习模型;进入步骤S09;
步骤S08:所述轮式移动机器人自身的第一学习模型保持不变,其中:
将所述轮式移动机器人在运动过程中产生的实时状态值与由基础模型得到的理论状态值做对比,将差值作为输入数据输入所述长短期记忆神经网络进行训练,直到所述长短期记忆神经网络的学习误差率小于或等于用户需要的上界,更新所述轮式移机器人自身的***模型。
本实施例通过长短期记忆神经网络,将基础模型状态数据与所述轮式移动机器人实际运行中采集的状态数据的偏差值作为训练数据,在线学习轮式移动机器人实际模型和基础模型之间的偏差值并更新所述轮式移动机器人自身的***模型以实现良好的控制效果。
记采样时间序列
Figure BDA0003145891250000102
采样间隔为δ。在每个采样时刻,所述学习模型的训练数据xd(tk)是通过获取所述轮式移动机器人实际状态测量值和基础模型理论值之间的差值得到的,即所述轮式移动机器人实际状态值相对于所述理论状态值的差值
xd(tk)=ξf(tk+1)-fbf(tk),uf(tk))
然后,将训练数据
Figure BDA0003145891250000103
传入长短期记忆神经网络训练学习得到每个时刻的模型偏差预测值,记作yd(tk)。该模型偏差预测值包含了所述轮式移动机器人在实际运行过程中各种不确定性和环境噪声的综合影响。
为补偿这些影响,将模型偏差预测值引入所述轮式移动机器人自身的***模型,可以得到所述轮式移动机器人自身的***模型:
Figure BDA0003145891250000104
其中,学习模型误差fd(t)=dL(t)-yd(t)表示所述轮式移动机器人实际模型偏差和学习到的模型偏差预测值之间的差值,其中,dL(t)为轮式移动机器人模型偏差,yd(t)为轮式移动机器人模型偏差预测值。进一步,为衡量模型偏差的学习效果,定义学习误差率
Figure BDA0003145891250000111
学习误差率μ(t)∈(0,1)是随时间变化的函数。通过轮式移动机器人在实际场景中不断运动采集训练数据,神经网络训练模型最终可以以任意精度逼近原***方程。因此,通过训练长短期记忆神经网络,轮式移动机器人的学习误差率会随时间下降以达到期望的控制效果。
本实施例中,实际模型偏差和模型偏差预测值达到稳定状态,后续可以使用学习得到模型偏差来补偿所述移动机器人受到的实际扰动,使其更符合实际运行的需要,进而,在后续的预测跟踪控制阶段,能够更好地完成跟踪任务。
所述步骤S09:基于所述轮式移动机器人的预测跟踪控制目标及约束条件,确定所述轮式移动机器人的预测跟踪控制优化问题模型,其中:
轮式移动机器人优化控制问题中,所述轮式移动机器人和领航机器人之间的位置偏差需要满足输入约束、位置约束和增量型输入约束条件。
基于轮式移动机器人的自身第一学习模型,同时,考虑所述轮式移动机器人满足跟踪位置约束
Figure BDA0003145891250000112
表示两机器人需要满足的相对位置关系。控制输入约束
Figure BDA0003145891250000113
和增量型输入约束
Figure BDA0003145891250000114
表示机器人需要满足的加速度约束,
Figure BDA0003145891250000118
为正实数。然后,定义学习模型预测控制优化问题。
所述预测跟踪控制优化问题模型为:
Figure BDA0003145891250000115
Figure BDA0003145891250000116
Figure BDA0003145891250000117
Figure BDA0003145891250000121
Figure BDA0003145891250000122
Figure BDA0003145891250000123
Figure BDA0003145891250000124
Figure BDA0003145891250000125
其中,
Figure BDA0003145891250000126
为两机器人相对位置变量,
Figure BDA0003145891250000127
为两机器人相对输入变量,
Figure BDA0003145891250000128
为所述轮式移动机器人***模型,
Figure BDA0003145891250000129
为tk时刻预测的s时刻的所述轮式移动机器人状态轨迹,ξf(tk;tk)为tk时刻的实际状态轨迹,
Figure BDA00031458912500001210
为tk时刻预测的s时刻的所述轮式移动机器人控制输入轨迹,
Figure BDA00031458912500001211
为阶段代函数,
Figure BDA00031458912500001212
为终端代价函数,Q,R,P表示权重矩阵,T为预测时域,收缩控制输入约束
Figure BDA00031458912500001213
其中β表示所述轮式移动机器人模型偏差dL(t)的上界,
Figure BDA00031458912500001214
表示学习误差率μ(t)的上界;收缩增量型输入约束
Figure BDA00031458912500001215
其中
Figure BDA00031458912500001218
表示实际场景中所述轮式移动机器人需要满足的加速度上界,τ表示所述轮式移动机器人模型偏差dL(t)的导数上界;位置偏移量满足二次型约束上界,与时间相关并包含三个参数
Figure BDA00031458912500001216
分别为调节参数,用户可自行定义,用于保证优化问题的迭代可行性、跟踪闭环***的稳定性以及实际位置偏差约束的满足。终端域
Figure BDA00031458912500001217
其中ε为设计参数。
所述控制策略为:求解所述预测跟踪控制优化问题模型,获取当前采样时刻对应的最优控制输入,基于所述学习模型,获取当前采样时刻的模型偏差预测值,基于所述当前采样时刻的模型偏差预测值获取当前采样时刻对应的输入补偿,结合所述当前采样时刻对应的最优控制输入及所述当前采样时刻对应的输入补偿,作为所述轮式移动机器人的输入,其中:
在当前采样时刻求解所述预测跟踪控制优化问题模型,同时,将所述轮式移动机器人的实际状态与基础模型得到的理论状态差值作为训练数据通过长短期记忆循环神经网络得到模型偏差值yd(t)以及相应的学习输入量ud(t)并和求解得到的最优控制输入
Figure BDA0003145891250000131
相结合得到实际***的最终控制输入uf(t)。
通过求解优化问题得到轮式移动机器人***最优控制当前采样时刻对应的输入
Figure BDA0003145891250000132
然后,通过长短期记忆神经网络学习得到模型偏差dL(t)的预测值yd(t),并通过调节输入对其进行补偿,得到控制输入uf的完整表达式
Figure BDA0003145891250000133
其中,
Figure BDA0003145891250000134
为所述预测跟踪控制优化问题模型得到的当前采样时刻对应的最优控制输入,学习输入量
Figure BDA0003145891250000135
矩阵
Figure BDA0003145891250000136
为输入矩阵Bf的左伪逆矩阵。
进一步地,将领航机器人当前的状态数据传递给跟随机器人的模型预测控制器,得到当前时刻最优控制输入量和预测的下一时刻的状态;其中,模型预测控制器通过模型预测控制算法为领航机器人构建优化问题,所述优化问题是最终目标状态已知情况下,使下一时刻目标状态下对应的当前时刻的控制输入量最小,获得当前时刻最优控制输入量。
进一步地,本实施例中,为减少预测跟踪控制优化问题模型和学习模型的计算量,采用双模控制策略,即在终端域内、域外切换使用控制器。所述终端控制器如下:
Figure BDA0003145891250000137
其中,
Figure BDA0003145891250000141
为终端控制器线速度变量,
Figure BDA0003145891250000142
为终端控制器角速度变量,vl为领航机器人线速度变量,
Figure BDA0003145891250000143
为两机器人相对方向角变量,l为轮式移动机器人半轮距值,c1和c2为常数,tk+1为下一采样时刻,且满足
Figure BDA0003145891250000144
ri,qi分别表示权重矩阵Q,R对角线上的元素,l表示轮式移动机器人半轮距长,
Figure BDA0003145891250000145
表示领航机器人与跟随机器人位置偏差轨迹的横坐标值,
Figure BDA0003145891250000146
表示领航机器人与跟随机器人位置偏差轨迹的纵坐标值。本实施例涉及的预测控制跟踪控制算法如表1:
Figure BDA0003145891250000147
表1
本实施例通过把轮式移动机器人***在运动过程中的实际状态信息与基础模型得到的理论状态信息差值作为训练数据并将训练得到的模型偏差预测值补偿到原***中,不断更新得到更符合实际场景的***模型。通过学习训练得到的学习模型更符合场景需要从而可以更好地实现对轮式移动机器人的控制,提升了算法的抗扰能力。同时,通过定义学习模型误差率,学习精度可以被自行设定从而降低了算法处理扰动的保守性并保证了在算法作用下优化问题的迭代可行性和闭环***的稳定性。
本实施例采用经典双模模型预测控制方案,当位置偏差
Figure BDA0003145891250000151
在终端区域外时,***采用模型预测控制律;当位置偏差
Figure BDA0003145891250000152
在终端区域内时,***采用终端控制器。
以下结合具体例子说明本发明的基于学习预测跟踪控制方法。本实施例的轮式移动机器人基于学习预测跟踪控制方法(以下简称LMPTC算法)的在轮式移动机器人***进行仿真并与其它两种控制方法比较。
基于学习模型的预测跟踪控制算法仿真实验。
首先,考虑轮式移动机器人领航-跟随***,领航者与跟随者具有相同的机械结构。其中,轮式移动机器人最大线速度a=0.05m/s,半轮距轴长l=0.0267m,最大角速度b=a/l=4.8598rad/s。领航机器人以恒定输入控制量ur=[0.01,0.045]T,初始位置ξr=[0,0,π/3]T进行运动。执行时间300s,采样周期0.05s,控制和预测时域Tc=T=4s。跟随机器人初始状态ξf=[0.1,-0.05,π/2]T,二次型鲁棒约束参数
Figure BDA0003145891250000153
增量型输入约束上界ζ=0.2,代价函数权重矩阵Q=diag(0.1,0.1),R=diag(0.008,0.008)和P=diag(0.5,0.5),终端控制器增益c1=c2=1.5,终端域参数ε=0.0128。
由于轮式移动机器人在实际***存在模型不确定性、测量误差以及各种复杂噪声的影响。因此,设计如下所示的扰动信号
Figure BDA0003145891250000154
扰动上界β=0.0049以及导数上界τ=0.0090。模型偏差学习误差率上界
Figure BDA0003145891250000155
在仿真中领航机器人以固定速度做圆周运动,跟随机器人根据生成的既定轨迹做跟踪运动,为充分采集机器人的实际状态值作为训练数据,本次实验让跟随机器人沿固定轨迹持续运行三个循环。结果表明,采用LMPTC算法,跟随机器人在运行过程中不断学习模型偏差并更新***模型使学习误差不断降低。如图4所示,三条曲线分别表示三次循环后学习模型误差||dL(t)-yd(t)||的大小,其中,绿色曲线值最小,代表最后一次循环中的学习模型误差值。定义模型偏差学习误差和为
Figure BDA0003145891250000161
依次求出在每次循环中模型偏差的学习误差和如下表所示:
Figure BDA0003145891250000162
表2轮式移动机器人跟踪循环轨迹中模型偏差的学习误差和
使用最后一次更新的***模型作为被控对象,检验轮式机器人最终的跟踪控制效果,如图5所示,其中,红线表示领航机器人生成的参考轨迹,蓝线表示跟随机器人的实际运行轨迹,绿线表示跟随机器人无扰状态的下的运行轨迹。可以发现,基于学习模型的预测跟踪控制算法具有良好的抗扰效果,并使得跟随机器人实现良好的跟踪效果。
轮式移动机器人模型预测跟踪控制方比较仿真。
将本发明方法与基于扰动观测器的模型预测跟踪控制算法(DisturbanceObserver Based Model Predictive Tracking Control,简称DOBMPTC)与复合模型预测跟踪控制算法(Compound Model Predictive Tracking Control,简称CMPTC)在同样参数条件以及干扰条件下进行比较。
下面将设计统一的场景并在同一组参数条件下,对轮式移动机器人进行仿真实验。首先,模拟实际***中存在的不确定性以及环境噪声如下所示
Figure BDA0003145891250000171
且上界β=2.0×10-4,导数上界τ=2.2174×10-4
轮式移动机器人***参数设计如下:最大线速度a=0.028m/s,半轮距轴长l=0.0267m,b=a/l=4.8598rad/s。领航机器人输入控制量ur=[0.01,0.045]T,初始位置ξr=[0,0,π/3]T。机器人采样周期0.05s,控制和预测时域Tc=T=4s,执行时间100s。跟随机器人初始状态ξf=[0.06,-0.08,π/2]T,二次型鲁棒约束参数
Figure BDA0003145891250000172
增量型输入约束上界
Figure BDA0003145891250000176
代价函数权重矩阵Q=diag(0.8,0.8),R=diag(0.001,0.001)和P=diag(0.5,0.5),终端控制器增益C1=c2=1.5,终端域参数ε=0.0085。三种算法作用下跟随机器人的运动轨迹如图8所示,可以发现其中LMPTC的抗性能最为显著,CMPTC次之,DOBMPTC相对较差。为进一步定量说明,图7展示了三种算法下跟随机器人和领航机器人的跟踪误差轨迹
Figure BDA0003145891250000173
变化曲线。定义总体跟踪误差值
Figure BDA0003145891250000174
结果表明DOBMPTC算法总体跟踪误差值为80.5299,CMPTC算法总体跟踪误差值为80.1973,LMPTC算法总体跟踪误差值为70.1516。在本算例中,LMPTC算法的总体跟踪误差相对DOBMPTC算法和CMPTC算法分别下降了12.89%和12.53%,算法跟踪误差表总结如下:
Figure BDA0003145891250000175
表3不同算法总体跟踪误差值
本发明实施例进一步给出一种轮式移动机器人的基于学习预测跟踪控制装置,如图8所示,所述装置包括:
初始化模块:配置为进行离线设计,所述离线设计包括确定采样间隔δ、控制执行时间Te、学习误差率上限
Figure BDA0003145891250000181
确定终端控制器的终端域Ωε;构建轮式移动机器人的基础模型,所述基础模型为包括领航机器人及所述轮式移动机器人的***,用于获取所述轮式移动机器人的理论状态值;构建学习模型,所述学习模型输入所述轮式移动机器人实际状态值相对于所述理论状态值的差值,用于获取模型偏差预测值,所述模型偏差预测值用于表征所述轮式移动机器人自身的第一学习模型;
第一判断模块:配置为判断当前时刻tk是否小于所述控制执行时间Te
第二判断模块:配置为采集所述轮式移动机器人的实际状态
Figure BDA0003145891250000182
计算当前时刻所述轮式移动机器人的理论状态值;若两机器人的位置偏差轨迹位于所述终端控制器的终端域Ωε
第一控制模块:配置为在当前时刻到下一采样时间的时间间隔内,使用所述终端控制器控制所述轮式移动机器人自身的第一学习模型;到达下一采样时间时,将下一采样时间记为当前时刻;
学习误差率模块:配置为获取所述轮式移动机器人的实际状态
Figure BDA0003145891250000183
与当前时刻所述轮式移动机器人的理论状态值的差值,作为所述学习模型的输入,输出模型偏差预测值,计算学习误差率;
第三判断模块:配置为判断所述学习误差率是否大于所述学习误差率上限;
第一更新模块:配置为基于所述模型偏差预测值更新所述轮式移动机器人自身的第一学习模型;
第一学习模型控制模块:配置为所述轮式移动机器人自身的第一学习模型保持不变;
优化问题模型构建模块:配置为基于所述轮式移动机器人的预测跟踪控制目标及约束条件,确定所述轮式移动机器人的预测跟踪控制优化问题模型;
控制模块:配置为在当前时刻到下一采样时间的时间间隔内,使用控制策略控制所述轮式移动机器人自身的第一学习模型;到达下一采样时间时,将下一采样时间记为当前时刻;
所述控制策略为:求解所述预测跟踪控制优化问题模型,获取当前采样时刻对应的最优控制输入,基于所述学习模型,获取当前采样时刻的模型偏差预测值,基于所述当前采样时刻的模型偏差预测值获取当前采样时刻对应的输入补偿,结合所述当前采样时刻对应的最优控制输入及所述当前采样时刻对应的输入补偿,作为所述轮式移动机器人的输入。
本发明实施例进一步给出一种轮式移动机器人的基于学习预测跟踪控制***,包括:
处理器,用于执行多条指令;
存储器,用于存储多条指令;
其中,所述多条指令,用于由所述存储器存储,并由所述处理器加载并执行如前所述的轮式移动机器人的基于学习预测跟踪控制方法。
本发明实施例进一步给出一种计算机可读存储介质,所述存储介质中存储有多条指令;所述多条指令,用于由处理器加载并执行如前所述的轮式移动机器人的基于学习预测跟踪控制方法。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
在本发明所提供的几个实施例中,应该理解到,所揭露的***,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机,实体机服务器,或者网络云服务器等,需安装Ubuntu操作***)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。

Claims (9)

1.一种轮式移动机器人的基于学习预测跟踪控制方法,其特征在于,所述方法包括以下步骤:
步骤S01:进行离线设计,所述离线设计包括确定采样间隔δ、控制执行时间Te、学习误差率上限
Figure FDA0003145891240000011
确定终端控制器的终端域Ωε;构建轮式移动机器人的基础模型,所述基础模型为包括领航机器人及所述轮式移动机器人的***,用于获取所述轮式移动机器人的理论状态值;构建学习模型,所述学习模型输入所述轮式移动机器人实际状态值相对于所述理论状态值的差值,用于获取模型偏差预测值,所述模型偏差预测值用于表征所述轮式移动机器人自身的第一学习模型;
步骤S02:判断当前时刻tk是否小于所述控制执行时间Te,若是,进入步骤S03;若否,方法结束;
步骤S03:采集所述轮式移动机器人的实际状态
Figure FDA0003145891240000013
计算当前时刻所述轮式移动机器人的理论状态值;若两机器人的位置偏差轨迹位于所述终端控制器的终端域Ωε,进入步骤S04;否则,进入步骤S05;
步骤S04:在当前时刻到下一采样时间的时间间隔内,使用所述终端控制器控制所述轮式移动机器人自身的第一学习模型;到达下一采样时间时,将下一采样时间记为当前时刻,进入步骤S02;
步骤S05:获取所述轮式移动机器人的实际状态
Figure FDA0003145891240000012
与当前时刻所述轮式移动机器人的理论状态值的差值,作为所述学习模型的输入,输出模型偏差预测值,计算学习误差率;
步骤S06:若所述学习误差率大于所述学习误差率上限,进入步骤S07;否则,进入步骤S08;
步骤S07:基于所述模型偏差预测值更新所述轮式移动机器人自身的第一学习模型;进入步骤S09;
步骤S08:所述轮式移动机器人自身的第一学习模型保持不变;
步骤S09:基于所述轮式移动机器人的预测跟踪控制目标及约束条件,确定所述轮式移动机器人的预测跟踪控制优化问题模型;
步骤S10:在当前时刻到下一采样时间的时间间隔内,使用控制策略控制所述轮式移动机器人自身的第一学习模型;到达下一采样时间时,将下一采样时间记为当前时刻,进入步骤S02;
所述控制策略为:求解所述预测跟踪控制优化问题模型,获取当前采样时刻对应的最优控制输入,基于所述学习模型,获取当前采样时刻的模型偏差预测值,基于所述当前采样时刻的模型偏差预测值获取当前采样时刻对应的输入补偿,结合所述当前采样时刻对应的最优控制输入及所述当前采样时刻对应的输入补偿,作为所述轮式移动机器人的输入。
2.如权利要求1所述的轮式移动机器人的基于学习预测跟踪控制方法,其特征在于,所述步骤S01,其中,所述构建轮式移动机器人的基础模型,所述基础模型为包括领航机器人及所述轮式移动机器人的***,用于获取所述轮式移动机器人的理论状态值,包括:
轮式移动机器人的主体包括中心车体及左、右两个车轮;
建立领航-跟随者***,所述领航-跟随者***包括领航机器人及所述轮式移动机器人,所述轮式移动机器人作为跟随机器人,所述领航机器人具有与所述轮式移动机器人相同的机械结构,所述领航机器人以恒定输入控制量进行运动,所述轮式移动机器人中设有预测跟踪控制器以控制所述轮式移动机器人跟随所述领航机器人进行运动;
所述领航机器人以头部节点的中心作为中心节点建模,得到如下的领航机器人***模型:
Figure FDA0003145891240000021
其中,t为时间,
Figure FDA0003145891240000022
为领航机器人状态轨迹,ul为领航机器人控制输入,fll,ul)为领航机器人***模型,θ为轮式移动机器人方向角,ul(t)为领航机器人控制输入轨迹;
领航机器人状态变量
Figure FDA0003145891240000023
包含所述领航机器人的位置变量
Figure FDA0003145891240000024
和角度变量θl;xl为领航者位置横坐标值,yl为领航者位置纵坐标值;
所述领航机器人的控制输入
Figure FDA0003145891240000031
由线速度vl和角速度ωl组成;
所述领航机器人满足输入约束集合
Figure FDA0003145891240000032
所述约束集合
Figure FDA0003145891240000033
表示为:
Figure FDA0003145891240000034
其中b=a/l,l表示轮式移动机器人半轮距值,v为轮式移动机器人线速度,ω为轮式移动机器人角速度;a是一个正实数;
所述轮式移动机器人以头部节点为中心建立动力学方程并考虑运动过程中扰动的影响,所述轮式移动机器人即为所述跟随机器人,得到跟随机器人***模型:
Figure FDA0003145891240000035
其中,所述轮式移动机器人状态变量
Figure FDA0003145891240000036
控制输入
Figure FDA0003145891240000037
Figure FDA0003145891240000038
为跟随机器人状态轨迹,ξf为跟随机器人状态,uf为跟随机器人控制输入,fhf,uf)为跟随机器人***模型,θf为跟随机器人方向角,l为轮式移动机器人半轮距值,uf(t)为跟随机器人控制输入轨迹;
根据两机器人运动过程中的相对位置关系,构造所述轮式移动机器人跟踪***的表达式为
Figure FDA0003145891240000039
其中,
Figure FDA00031458912400000310
为两机器人相对位置轨迹,
Figure FDA00031458912400000311
为两机器人相对方向角轨迹,fd(t)为学习模型误差,ωf为跟随机器人角速度,vf为跟随机器人线速度,θf为跟随机器人方向角,l为轮式移动机器人半轮距值;vf(t)为跟随机器人的线速度,ωf(t)为跟随机器人的角速度,
Figure FDA00031458912400000312
为两机器人的方向偏差角。
3.如权利要求2所述的轮式移动机器人的基于学习预测跟踪控制方法,其特征在于,所述学习模型为长短期记忆神经网络。
4.如权利要求3所述的轮式移动机器人的基于学习预测跟踪控制方法,其特征在于,将模型偏差预测值引入所述轮式移动机器人自身的***模型,得到所述轮式移动机器人自身的***模型,为衡量模型偏差的学习效果,定义学习误差率
Figure FDA0003145891240000041
学习误差率μ(t)∈(0,1)是随时间变化的函数,dL(t)为轮式移动机器人模型偏差,yd(t)为轮式移动机器人模型偏差预测值。
5.如权利要求4所述的轮式移动机器人的基于学习预测跟踪控制方法,其特征在于,所述预测跟踪控制优化问题模型为:
Figure FDA0003145891240000042
Figure FDA0003145891240000043
Figure FDA0003145891240000044
Figure FDA0003145891240000045
Figure FDA0003145891240000046
Figure FDA0003145891240000047
Figure FDA0003145891240000048
Figure FDA0003145891240000049
其中,
Figure FDA00031458912400000410
为两机器人相对位置变量,
Figure FDA00031458912400000411
为两机器人相对输入变量,
Figure FDA00031458912400000412
为所述轮式移动机器人***模型,
Figure FDA00031458912400000413
为tk时刻预测的s时刻的所述轮式移动机器人状态轨迹,ξf(tk;tk)为tk时刻的实际状态轨迹,
Figure FDA00031458912400000414
为tk时刻预测的s时刻的所述轮式移动机器人控制输入轨迹,
Figure FDA00031458912400000415
为阶段代价函数,
Figure FDA0003145891240000051
为终端代价函数,Q,R,P表示权重矩阵,T为预测时域,收缩控制输入约束
Figure FDA0003145891240000052
其中β表示所述轮式移动机器人模型偏差dL(t)的上界,
Figure FDA0003145891240000053
表示学习误差率μ(t)的上界;收缩增量型输入约束
Figure FDA0003145891240000054
其中
Figure FDA0003145891240000055
表示实际场景中所述轮式移动机器人需要满足的加速度上界,τ表示所述轮式移动机器人模型偏差dL(t)的导数上界;位置偏移量满足二次型约束上界,与时间相关并包含三个参数
Figure FDA0003145891240000056
Figure FDA0003145891240000057
分别为调节参数,终端域
Figure FDA0003145891240000058
其中ε为设计参数。
6.如权利要求5所述的轮式移动机器人的基于学习预测跟踪控制方法,其特征在于,所述终端控制器如下:
Figure FDA0003145891240000059
其中,
Figure FDA00031458912400000510
为终端控制器线速度变量,
Figure FDA00031458912400000511
为终端控制器角速度变量,vl为领航机器人线速度变量,
Figure FDA00031458912400000512
为两机器人相对方向角变量,l为轮式移动机器人半轮距值,c1和c2为常数,tk+1为下一采样时刻,且满足
Figure FDA00031458912400000513
ri,qi分别表示权重矩阵Q,R对角线上的元素,l表示轮式移动机器人半轮距长,
Figure FDA00031458912400000514
表示领航机器人与跟随机器人位置偏差轨迹的横坐标值,
Figure FDA00031458912400000515
表示领航机器人与跟随机器人位置偏差轨迹的纵坐标值。
7.一种轮式移动机器人的基于学习预测跟踪控制装置,其特征在于,所述装置包括:
初始化模块:配置为进行离线设计,所述离线设计包括确定采样间隔δ、控制执行时间Te、学习误差率上限
Figure FDA0003145891240000061
确定终端控制器的终端域Ωε;构建轮式移动机器人的基础模型,所述基础模型为包括领航机器人及所述轮式移动机器人的***,用于获取所述轮式移动机器人的理论状态值;构建学习模型,所述学习模型输入所述轮式移动机器人实际状态值相对于所述理论状态值的差值,用于获取模型偏差预测值,所述模型偏差预测值用于表征所述轮式移动机器人自身的第一学习模型;
第一判断模块:配置为判断当前时刻tk是否小于所述控制执行时间Te
第二判断模块:配置为采集所述轮式移动机器人的实际状态
Figure FDA0003145891240000062
计算当前时刻所述轮式移动机器人的理论状态值;若两机器人的位置偏差轨迹位于所述终端控制器的终端域Ωε
第一控制模块:配置为在当前时刻到下一采样时间的时间间隔内,使用所述终端控制器控制所述轮式移动机器人自身的第一学习模型;到达下一采样时间时,将下一采样时间记为当前时刻;
学习误差率模块:配置为获取所述轮式移动机器人的实际状态
Figure FDA0003145891240000063
与当前时刻所述轮式移动机器人的理论状态值的差值,作为所述学习模型的输入,输出模型偏差预测值,计算学习误差率;
第三判断模块:配置为判断所述学习误差率是否大于所述学习误差率上限;
第一更新模块:配置为基于所述模型偏差预测值更新所述轮式移动机器人自身的第一学习模型;
第一学习模型控制模块:配置为所述轮式移动机器人自身的第一学习模型保持不变;
优化问题模型构建模块:配置为基于所述轮式移动机器人的预测跟踪控制目标及约束条件,确定所述轮式移动机器人的预测跟踪控制优化问题模型;
控制模块:配置为在当前时刻到下一采样时间的时间间隔内,使用控制策略控制所述轮式移动机器人自身的第一学习模型;到达下一采样时间时,将下一采样时间记为当前时刻;
所述控制策略为:求解所述预测跟踪控制优化问题模型,获取当前采样时刻对应的最优控制输入,基于所述学习模型,获取当前采样时刻的模型偏差预测值,基于所述当前采样时刻的模型偏差预测值获取当前采样时刻对应的输入补偿,结合所述当前采样时刻对应的最优控制输入及所述当前采样时刻对应的输入补偿,作为所述轮式移动机器人的输入。
8.一种轮式移动机器人的基于学习预测跟踪控制***,包括:
处理器,用于执行多条指令;
存储器,用于存储多条指令;
其中,所述多条指令,用于由所述存储器存储,并由所述处理器加载并执行如权利要求1-6中任一项所述的轮式移动机器人的基于学习预测跟踪控制。
9.一种计算机可读存储介质,所述存储介质中存储有多条指令;所述多条指令,用于由处理器加载并执行如权利要求1-6中任一项所述的轮式移动机器人的基于学习预测跟踪控制方法。
CN202110750225.9A 2021-07-02 2021-07-02 一种轮式移动机器人的基于学习预测跟踪控制方法及装置 Active CN113515044B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110750225.9A CN113515044B (zh) 2021-07-02 2021-07-02 一种轮式移动机器人的基于学习预测跟踪控制方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110750225.9A CN113515044B (zh) 2021-07-02 2021-07-02 一种轮式移动机器人的基于学习预测跟踪控制方法及装置

Publications (2)

Publication Number Publication Date
CN113515044A true CN113515044A (zh) 2021-10-19
CN113515044B CN113515044B (zh) 2022-08-26

Family

ID=78066350

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110750225.9A Active CN113515044B (zh) 2021-07-02 2021-07-02 一种轮式移动机器人的基于学习预测跟踪控制方法及装置

Country Status (1)

Country Link
CN (1) CN113515044B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115718427A (zh) * 2022-11-16 2023-02-28 哈尔滨理工大学 一种保安全的非脆弱网络化预测控制方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103926839A (zh) * 2014-04-23 2014-07-16 浙江师范大学 一种轮式移动机器人的运动分段控制方法
JP2016078149A (ja) * 2014-10-15 2016-05-16 キヤノン株式会社 ロボット装置の制御方法及びロボット装置、プログラム及び記録媒体
JP2016120549A (ja) * 2014-12-24 2016-07-07 キヤノン株式会社 ロボット制御方法及びロボット制御装置
CN106933105A (zh) * 2017-04-24 2017-07-07 清华大学 受限条件下的轨迹更新综合预测迭代学习控制算法
CN107561942A (zh) * 2017-09-12 2018-01-09 重庆邮电大学 基于模型补偿的智能车辆轨迹跟踪模型预测控制方法
CN109739094A (zh) * 2019-02-28 2019-05-10 哈尔滨理工大学 一种基于自适应滑模控制的移动机器人轨迹跟踪新方法
CN110083064A (zh) * 2019-04-29 2019-08-02 辽宁石油化工大学 一种基于非策略q-学习的网络最优跟踪控制方法
CN110095983A (zh) * 2019-04-22 2019-08-06 浙江工业大学 一种基于路径参数化的移动机器人预测跟踪控制方法
CN110244735A (zh) * 2019-06-24 2019-09-17 安徽农业大学 移动机器人跟踪预定轨迹的启发式动态规划控制方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103926839A (zh) * 2014-04-23 2014-07-16 浙江师范大学 一种轮式移动机器人的运动分段控制方法
JP2016078149A (ja) * 2014-10-15 2016-05-16 キヤノン株式会社 ロボット装置の制御方法及びロボット装置、プログラム及び記録媒体
JP2016120549A (ja) * 2014-12-24 2016-07-07 キヤノン株式会社 ロボット制御方法及びロボット制御装置
CN106933105A (zh) * 2017-04-24 2017-07-07 清华大学 受限条件下的轨迹更新综合预测迭代学习控制算法
CN107561942A (zh) * 2017-09-12 2018-01-09 重庆邮电大学 基于模型补偿的智能车辆轨迹跟踪模型预测控制方法
CN109739094A (zh) * 2019-02-28 2019-05-10 哈尔滨理工大学 一种基于自适应滑模控制的移动机器人轨迹跟踪新方法
CN110095983A (zh) * 2019-04-22 2019-08-06 浙江工业大学 一种基于路径参数化的移动机器人预测跟踪控制方法
CN110083064A (zh) * 2019-04-29 2019-08-02 辽宁石油化工大学 一种基于非策略q-学习的网络最优跟踪控制方法
CN110244735A (zh) * 2019-06-24 2019-09-17 安徽农业大学 移动机器人跟踪预定轨迹的启发式动态规划控制方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陈薇: "关于轮式器人路径规划控制仿真", 《计算机仿真》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115718427A (zh) * 2022-11-16 2023-02-28 哈尔滨理工大学 一种保安全的非脆弱网络化预测控制方法

Also Published As

Publication number Publication date
CN113515044B (zh) 2022-08-26

Similar Documents

Publication Publication Date Title
CN112077839B (zh) 一种机械臂的运动控制方法及装置
CN115157238A (zh) 一种多自由度机器人动力学建模和轨迹跟踪方法
CN111106772B (zh) 一种包含参数跟踪的感应电机状态强跟踪滤波估计方法
CN111752151A (zh) 一种工业叶片磨抛加工自适应力跟踪与补偿方法及***
CN113805610B (zh) 一种轨迹跟踪控制方法、装置及存储介质
Liu et al. Path tracking control of a self‐driving wheel excavator via an enhanced data‐driven model‐free adaptive control approach
CN109062040B (zh) 基于***嵌套优化的预测pid方法
CN111897224A (zh) 基于演员-评论家强化学习和模糊逻辑的多智能体编队控制方法
CN113515044B (zh) 一种轮式移动机器人的基于学习预测跟踪控制方法及装置
Duan et al. Sim-to-real learning of footstep-constrained bipedal dynamic walking
CN105867138A (zh) 一种基于pid控制器的稳定平台控制方法及装置
CN113485120B (zh) 一种基于操控行为检测的机器人遥操作轨迹规划方法
CN111531543B (zh) 基于生物启发式神经网络的机器人自适应阻抗控制方法
Shi et al. Deep reinforcement learning-based attitude motion control for humanoid robots with stability constraints
CN113910218A (zh) 基于运动学与深度神经网络融合的机器人标定方法和装置
CN117270398A (zh) 基于神经网络和强化学习的机器人步态规划算法
CN113977583B (zh) 基于近端策略优化算法的机器人快速装配方法及***
Ma et al. Application of sensor data information cognitive computing algorithm in adaptive control of wheeled robot
CN116239022A (zh) 桥式吊车定位防摆无模型自适应控制方法
CN114967472A (zh) 一种无人机轨迹跟踪状态补偿深度确定性策略梯度控制方法
Liu et al. Data learning‐based model‐free adaptive control and application to an NAO robot
CN110788859B (zh) 一种控制器参数全域自适应调节***
CN116736748A (zh) 构建机器人的控制器的方法和机器人
CN113296515A (zh) 一种双独立电驱动车辆显式模型预测路径跟踪方法
CN116149262B (zh) 一种伺服***的跟踪控制方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant