CN113341943B - 基于总扰动即时观测与迭代学习的重复作业式无人驾驶车辆轨迹跟踪控制算法 - Google Patents

基于总扰动即时观测与迭代学习的重复作业式无人驾驶车辆轨迹跟踪控制算法 Download PDF

Info

Publication number
CN113341943B
CN113341943B CN202010140701.0A CN202010140701A CN113341943B CN 113341943 B CN113341943 B CN 113341943B CN 202010140701 A CN202010140701 A CN 202010140701A CN 113341943 B CN113341943 B CN 113341943B
Authority
CN
China
Prior art keywords
disturbance
course angle
angle
distance error
control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010140701.0A
Other languages
English (en)
Other versions
CN113341943A (zh
Inventor
宋康
谢辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin University
Original Assignee
Tianjin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University filed Critical Tianjin University
Priority to CN202010140701.0A priority Critical patent/CN113341943B/zh
Publication of CN113341943A publication Critical patent/CN113341943A/zh
Application granted granted Critical
Publication of CN113341943B publication Critical patent/CN113341943B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0212Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
    • G05D1/0223Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory involving speed control of the vehicle
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0212Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
    • G05D1/0221Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory involving a learning process
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0212Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
    • G05D1/0225Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory involving docking at a fixed facility, e.g. base station or loading bay
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0276Control of position or course in two dimensions specially adapted to land vehicles using signals provided by a source external to the vehicle

Landscapes

  • Engineering & Computer Science (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)

Abstract

本发明公开了一种基于总扰动即时观测与迭代学习的重复作业式无人驾驶车辆轨迹跟踪控制算法,步骤如下:步骤1,跟据无人驾驶车辆的目标轨迹,计算无人驾驶车辆的实际距离误差;步骤2,距离误差的抗扰控制器计算所述无人驾驶车辆的目标航向角,使得无人驾驶车辆的轨迹跟踪距离误差趋于零;步骤3,航向角的抗扰控制器计算所述无人驾驶车辆的目标方向盘转角或液压***转角,使得无人驾驶车辆的实际航向角趋近于步骤2得到的所述目标航向角;步骤4,将步骤3得到的目标方向盘转角或液压***转角发送给方向盘转角或液压***转角控制器,进行闭环控制。本发明可以显著提升算法对车辆状态变化和道路条件变化等不确定性的适应能力。

Description

基于总扰动即时观测与迭代学习的重复作业式无人驾驶车辆 轨迹跟踪控制算法
技术领域
本发明涉及无人驾驶技术领域,特别是涉及一种基于总扰动即时观测与迭代学习的重复作业式无人驾驶车辆轨迹跟踪控制算法。
背景技术
无人驾驶车辆对目标行驶轨迹的准确跟踪(以下简称寻迹)是其最重要的功能之一。比例-积分-微分(PID)控制是应用最为广泛的寻迹控制算法,文献(
Figure RE-GDA0002559510410000011
Viktor,andViktor Stenberg."PID Controllers for Autonomous Vehicle Path Following."(2017).)***介绍了采用PID解决车辆寻迹控制。由于车辆的状态随时间变化,并且道路条件具有不确定性, PID控制器难以在不同条件下保持最佳的控制品质。虽然参数分段的PID控制可以在一定程度上提升性能,但参数的分段调节较为复杂,影响了开发效率。
基于车辆和道路几何的控制算法也是一类应用较为广泛解决方案。文献(R.Wallace,A. Stentz,C.E.Thorpe,H.Maravec,W.Whittaker,and T.Kanade,“Firstresults in robot road- following.,”in IJCAI,pp.1089–1095,1985.)首次介绍了纯跟踪(pure pursuit)算法。该方法在车辆与目标轨迹距离过远时无法给出解,更重要的是在高车速运行时,该方法容易诱发车辆运行轨迹的震荡。另一种基于几何的控制算法是基于后轮的反馈控制(rear wheel position based feedback),文献(C.Samson,“Pathfollowing and time-varying feedback stabilization of a wheeled mobile robot,”in 2nd Int.Conf.on Automation,Robotics and Computer Vision,1992.) 介绍了该算法的详细原理和实现。类似的,基于前轮的反馈控制也在(front wheel position basedfeedback)在(M.D.Ventures,“Stanley:The robot that won the DARPA GrandChallenge,” Journal of field Robotics,vol.23,pp.661–692,2006.)一文中有详细介绍。上述三种方法在 2004年左右美国举办的DARPAR比赛中都有实际应用。不过,由于需要较为准确的车辆和道路几何信息,基于几何和控制算法在寻迹精度上性能是有限的,并且主要适用于低车速工况。在不同的道路条件和车辆状态下,因为缺少学习机制,难免会出现性能的下降。
基于运动学模型的寻迹控制算法也是无人驾驶领域广泛采用的算法。文章(Y.Kanayama,Y.Kimura,F.Miyazaki,and T.Noguchi,“A stable tracking control methodfor an autonomous mobile robot,”in International Conference on Robotics andAutomation,pp.384–389, IEEE,1990.)介绍了基于Lyapunov函数的车辆寻迹控制算法。但是,Lyapunov函数的设计只能保证稳定性,实际轨迹跟踪效果需要进行参数的详细整定。为了适应较高车速的运行,输出反馈线性化的方法在文献(B.d’Andréa Novel,G.Campion,and G.Bastin,“Control of nonholonomic wheeled mobile robots by state feedbacklinearization,”The International journal of robotics research,vol.14,pp.543–559,1995.)被学者提出。但是,该方法一般也需要比较准确的车辆运动学模型。
以上方法一般适用于常规驾驶情况。对于有漂移或者紧急情况下的寻迹控制,模型预测控制(MPC)被认为是一种比较有效的解决方案。文献(P.Falcone,F.Borrelli,J.Asgari,H. E.Tseng,and D.Hrovat,“Predictive active steering control forautonomous vehicle systems,” Transactions on Control Systems Technology,vol.15,pp.566–580,2007.)比较早的将MPC算法应用于车辆寻迹控制。一系列衍生算法被相继提出,比如(G.V.Raffo,G.K.Gomes,J.E. Normey-Rico,C.R.Kelber,and L.B.Becker,“A predictive controller for autonomous vehicle path tracking,”Transactionson Intelligent Transportation Systems,vol.10,pp.92–102,2009.)和(Y. Yoon,J.Shin,H.J.Kim,Y.Park,and S.Sastry,“Model-predictive active steering andobstacle avoidance for autonomous ground vehicles,”Control EngineeringPractice,vol.17,pp.741–750, 2009.),以及(E.Kim,J.Kim,and M.Sunwoo,“Modelpredictive control strategy for smooth path tracking of autonomous vehicleswith steering actuator dynamics,”International Journal of AutomotiveTechnology,vol.15,pp.1155–1164,2014.)。然而,MPC方法对模型精度的要求也比较高,模型失准带来的不确定性往往造成寻迹效果的恶化。此外,MPC还需要较高的计算量,在嵌入式***这种算力较弱的平台上应用受到了一定的限制。
除上述算法以外,线性变参数(Linear Parameters Varying,LPV)模型是最近应用比较广泛的一种控制算法。该算法采用线性模型的表达形式,通过模型参数随工况的变化来逼近非线性模型的精度。文献(P.Gáspár,Z.Szabó,and J.Bokor,“LPV design offault-tolerant control for road vehicles,”International Journal of AppliedMathematics and Computer Science,vol. 22,pp.173–182,2012.)即采用了该算法。从本质上来说,LPV是用模型参数分段的方法提升线性模型的准确性,降低不确定性因素的影响。但这也造成了算法的复杂性较高,影响了其实用性。
发明内容
本发明的目的是针对现有技术中存在的技术缺陷,而提供一种基于总扰动即时观测与迭代学习的重复作业式无人驾驶车辆轨迹跟踪控制算法。
为实现本发明的目的所采用的技术方案是:
一种基于总扰动即时观测与迭代学习的重复作业式无人驾驶车辆轨迹跟踪控制算法,包括如下步骤:
步骤1,跟据无人驾驶车辆的目标轨迹,计算无人驾驶车辆的实际距离误差;
步骤2,距离误差的抗扰控制器通过步骤1得到的实际距离误差、扩张状态观测器得到的距离误差的即时扰动,以及距离误差即时总扰动的迭代学习器得到的距离误差的累积扰动,计算所述无人驾驶车辆的目标航向角,使得无人驾驶车辆的轨迹跟踪距离误差趋于零;
步骤3,航向角的抗扰控制器通过步骤2得到的目标航向角、扩张状态观测器得到的航向的即时扰动,以及航向角即时总扰动的迭代学习器得到的航向角的累积扰动,计算所述无人驾驶车辆的目标方向盘转角或液压***转角,使得无人驾驶车辆的实际航向角趋近于步骤 2得到的所述目标航向角;
步骤4,将步骤3得到的目标方向盘转角或液压***转角发送给方向盘转角或液压***转角控制器,对实际方向盘转角或液压***转角进行闭环控制,实现无人驾驶车辆的轨迹跟踪。
在上述技术方案中,所述重复作业式无人驾驶车辆包括但不限于无人驾驶的往复碾压作业的压路机、往复搬运货物的叉车、往复作业的推土机或装载机。
在上述技术方案中,所述步骤2中的距离误差的抗扰控制器包括距离误差反馈控制器和距离误差扰动抑制器,其中,在距离误差扰动抑制器中:
所述扩张状态观测器利用实际航向角和实际距离误差信息,对距离误差的即时扰动进行实时估计;
所述距离误差即时总扰动的迭代学习器根据扩张状态观测器观测的距离误差的即时扰动和上一个控制循环中距离误差即时总扰动的迭代学习器得到的距离误差的累积扰动,对本控制循环中距离误差的累积扰动进行迭代估计,得到距离误差的累积扰动估计值;
用于控制的模型计算可建模的扰动形成基于模型的扰动前馈;
如此,距离误差的即时扰动、距离误差的累积扰动和可建模的扰动均在距离误差扰动抑制器中进行实时补偿,并与所述距离误差反馈控制器一起,计算所需的无人驾驶车辆的目标航向角,使得轨迹跟踪距离误差趋于零。
在上述技术方案中,所述步骤3中的航向角的抗扰控制器包括航向角反馈控制器和航向角扰动抑制器,其中,在航向角扰动抑制器中:
所述扩张状态观测器利用实际方向盘转角和实际航向角信息,对航向角的即时扰动进行实时估计;
航向角即时总扰动的迭代学习器根据扩张状态观测器观测航向角的即时扰动和上一个控制循环中航向角即时总扰动的迭代学习器得到的航向角的累积扰动,对本控制循环中航向角的累积扰动进行迭代估计,得到航向角的累积扰动估计值;
用于控制的模型计算可建模的扰动形成基于模型的扰动前馈;
由此,航向角的即时扰动、航向角的累积扰动和可建模的扰动均在航向角扰动抑制器中进行实时补偿,并与所述航向角反馈控制器一起,计算所需的无人驾驶车辆的目标航向角,使得轨迹跟踪航向角跟踪误差趋于零。
在上述技术方案中,所述步骤2中距离误差的抗扰控制器为
Figure RE-GDA0002559510410000041
其中uoutlp的结果赋值给目标航向角
Figure RE-GDA0002559510410000042
距离误差反馈控制器为
Figure RE-GDA0002559510410000043
u0,outlp是距离误差控制中的虚拟控制量,b0,outlp是控制输入的增益
Figure RE-GDA0002559510410000044
为车速的测量值;其中u0,outlp=kp,outlp(0-ed),kp,outlp是比例控制系数,根据控制过程响应的快慢需求来调节,ed为实际距离误差;所述步骤2中的距离误差扰动抑制器为
Figure RE-GDA0002559510410000045
其中
Figure RE-GDA0002559510410000046
为距离误差的即时扰动估计值,通过扩张状态观测器获得;
Figure RE-GDA0002559510410000047
为距离误差的累积扰动估计值,通过距离误差即时总扰动的迭代学习器获得;
Figure RE-GDA0002559510410000048
为用于控制的模型计算的可建模的扰动。
在上述技术方案中,所述步骤2中的
Figure RE-GDA0002559510410000049
通过扩张状态观测器中的距离误差的即时扰动抑制器计算得到,所述距离误差的即时扰动抑制器为:
Figure RE-GDA00025595104100000410
其中,
Figure RE-GDA00025595104100000411
Y1=ed,meas为距离误差的测量值,
Figure RE-GDA00025595104100000412
为X1的预估值
Figure RE-GDA00025595104100000413
对时间的导数,U1为距离误差控制回路中的控制输入,即实际航向角
Figure RE-GDA0002559510410000051
Figure RE-GDA0002559510410000052
Figure RE-GDA0002559510410000053
均可以通过公式
Figure RE-GDA0002559510410000054
迭代得到;
Figure RE-GDA0002559510410000055
β1,outlp和β2,outlp为扩张状态观测器增益;
Figure RE-GDA0002559510410000056
为距离误差的累积扰动估计值,从距离误差即时总扰动的迭代学习器中获得;
Figure RE-GDA0002559510410000057
为用于控制的模型计算的可建模的扰动。
在上述技术方案中,
Figure RE-GDA0002559510410000058
通过距离误差即时总扰动的迭代学习器获得,该学习器为:
Figure RE-GDA0002559510410000059
其中k为重复工作循环的编号,每一个完整的工作过程为一个循环,α1为遗忘因子,γ1为学习因子。
在上述技术方案中,所述步骤3中航向角的抗扰控制器为
Figure RE-GDA00025595104100000510
其中,uinlp的计算结果赋值给目标方向盘转角
Figure RE-GDA00025595104100000511
航向角反馈控制器为
Figure RE-GDA00025595104100000512
u0,inlp是航向角控制中的虚拟控制量,b0,inlp是控制输入的增益;其中
Figure RE-GDA00025595104100000513
kp,inlp是比例控制系数,根据控制过程响应的快慢需求来调节,
Figure RE-GDA00025595104100000514
为目标航向角,
Figure RE-GDA00025595104100000515
为实际航向角,b0,inlp为航向控制回路中输入的增益;所述步骤3中的航向角扰动抑制器为
Figure RE-GDA00025595104100000516
其中
Figure RE-GDA00025595104100000517
为航向角的即时扰动估计值,通过扩张状态观测器获得;
Figure RE-GDA00025595104100000518
为航向角的累积扰动估计值,通过航向角即时总扰动的迭代学习器获得;
Figure RE-GDA00025595104100000519
为用于控制的模型计算的可建模的扰动。
在上述技术方案中,所述的
Figure RE-GDA00025595104100000520
由扩张状态观测器中的航向角的即时扰动抑制器计算得到,所述航向角的即时扰动抑制器为:
Figure RE-GDA00025595104100000521
其中,
Figure RE-GDA00025595104100000522
为航向角的测量值,
Figure RE-GDA00025595104100000523
为X1的预估值
Figure RE-GDA00025595104100000524
对时间的导数,U2为航向角控制回路中的控制输入,即实际方向盘转角
Figure RE-GDA00025595104100000525
可以由定位测量***反馈得到,
Figure RE-GDA00025595104100000526
Figure RE-GDA00025595104100000527
均可以通过公式
Figure RE-GDA0002559510410000061
迭代得到;
Figure RE-GDA0002559510410000062
β1,inlp和β2,inlp为扩张状态观测器增益;
Figure RE-GDA0002559510410000063
为航向角的累积扰动估计值,从航向角即时总扰动的迭代学习器中获得;
Figure RE-GDA0002559510410000064
为用于控制的模型计算的可建模的扰动。
在上述技术方案中,所述的
Figure RE-GDA0002559510410000065
通过航向角即时总扰动的迭代学习器获得,该学习器为:
Figure RE-GDA0002559510410000066
其中k为重复工作循环的编号,每一个完整的工作过程为一个循环,α2为遗忘因子,γ2为学习因子。
与现有技术相比,本发明的有益效果是:
1)通过基于模型的扰动抑制、基于扩张状态观测器的扰动抑制,以及基于强化学习的扰动抑制相结合,可以显著提升算法对车辆状态变化和道路条件变化等不确定性的适应能力。
2)本发明针对重复性作业的无人驾驶车辆这一特殊场景,利用迭代学习的方法,从重复出现的不确定性中逐步归纳出确定性的、周期性的干扰,进而在控制器中即时补偿。这种控制思路有望逐步提升控制器的抗干扰能力,不断改善控制效果。
3)利用基于模型的抗扰实现对非常明确的扰动的快速抑制,利用扩张状态观测器补偿模型的不准确性,利用迭代学习逐步缓解扩张状态观测器的观测负担。三种抗扰方式相互配合,即避免算法了对高精度模型的依赖,又解决了迭代学习对突发的、随机的干扰抑制速度慢的的问题,还补偿了扩张状态观测器在低采样频率下观测速度有限的问题,形成有机配合的整体。
4)本发明用迭代学习的算法针对的是扩张状态观测器估计的扰动,而不是常规迭代学习中针对的跟踪误差。这种思路使迭代学习和扩张状态观测器无缝对接,避免了两类闭环控制器在动态控制过程中出现冲突。
附图说明
图1所示为本发明的框架结构示意图。
具体实施方式
以下结合具体实施例对本发明作进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
实施例1
一种基于总扰动即时观测与迭代学习的重复作业式无人驾驶车辆轨迹跟踪控制算法,包括如下步骤:
步骤1,跟据无人驾驶车辆的目标轨迹,计算无人驾驶车辆的实际距离误差。
步骤2,距离误差的抗扰控制器通过步骤1得到的实际距离误差、扩张状态观测器得到的距离误差的即时扰动,以及距离误差即时总扰动的迭代学习器得到的距离误差的累积扰动,计算所述无人驾驶车辆的目标航向角,使得无人驾驶车辆的轨迹跟踪距离误差趋于零;
步骤3,航向角的抗扰控制器通过步骤2得到的目标航向角、扩张状态观测器得到的航向的即时扰动,以及航向角即时总扰动的迭代学习器得到的航向角的累积扰动,计算所述无人驾驶车辆的目标方向盘转角或液压***转角,使得无人驾驶车辆的实际航向角趋近于步骤 2得到的所述目标航向角。
步骤4,将步骤3得到的目标方向盘转角或液压***转角发送给方向盘转角或液压***转角控制器,对实际方向盘转角或液压***转角进行闭环控制,实现无人驾驶车辆的轨迹跟踪。
本实施例中,所述重复作业式无人驾驶车辆包括但不限于无人驾驶的往复碾压作业的压路机、往复搬运货物的叉车、往复作业的推土机或装载机。
步骤1中的实际距离误差(ed)的计算方法为:
Figure RE-GDA0002559510410000071
其中,(xa,ya)为目标轨迹起点的坐标,(xb,yb)为目标轨迹终点的坐标,(x,y)为车辆定位点的实际坐标。
实施例2
本实施例对步骤2中的距离误差的抗扰控制器进行进一步说明。
所述步骤2中的距离误差的抗扰控制器包括距离误差反馈控制器和距离误差扰动抑制器,其中,在距离误差扰动抑制器中:
所述扩张状态观测器利用实际航向角和实际距离误差信息,对距离误差的即时扰动进行实时估计;
所述距离误差即时总扰动的迭代学习器根据扩张状态观测器观测的距离误差的即时扰动和上一个控制循环中距离误差即时总扰动的迭代学习器得到的距离误差的累积扰动,对本控制循环中距离误差的累积扰动进行迭代估计,得到距离误差的累积扰动估计值;
用于控制的模型计算可建模的扰动形成基于模型的扰动前馈;
如此,距离误差的即时扰动、距离误差的累积扰动和可建模的扰动均在距离误差扰动抑制器中进行实时补偿,并与所述距离误差反馈控制器一起,计算所需的无人驾驶车辆的目标航向角,使得轨迹跟踪距离误差趋于零。
作为优选方式,所述步骤2中距离误差的抗扰控制器为
Figure RE-GDA0002559510410000081
其中其中uoutlp的结果赋值给目标航向角
Figure RE-GDA0002559510410000082
距离误差反馈控制器为
Figure RE-GDA0002559510410000083
u0,outlp是距离误差控制中的虚拟控制量(单位是rad),b0,outlp是控制输入的增益
Figure RE-GDA0002559510410000084
Figure RE-GDA0002559510410000085
为车速的测量值(单位是m/s);其中u0,outlp=kp,outlp(0-ed),kp,outlp是比例控制系数,可以根据控制过程响应的快慢需求来调节,推荐使用但不限于基于带宽的参数整定方法(Gao Z.Scalingand bandwidth-parameterization based controller tuning.Proceedings of theAmerican control conference.2006,6:4989-4996)ed为实际距离误差(单位是m);所述步骤2中的距离误差扰动抑制器为
Figure RE-GDA0002559510410000086
其中
Figure RE-GDA0002559510410000087
为距离误差的即时扰动估计值(单位是m/s),通过扩张状态观测器获得;
Figure RE-GDA0002559510410000088
为距离误差的累积扰动估计值(单位是 m/s),通过距离误差即时总扰动的迭代学习器获得;
Figure RE-GDA0002559510410000089
为用于控制的模型计算的可建模的扰动(单位是m/s)。为业内技术人员所熟知,取决于具体的无人车辆模型的选择。对于乘用车,可以选用运动学或者动力学模型,推荐但不限于书籍(龚建伟,姜岩,徐威.无人驾驶车辆模型预测控制[M].2014.),对于铰接式车辆的模型,推荐但不限于文章(Altafini C.Why to use an articulated vehicle in underground mining operations[C]//Proceedings 1999IEEE International Conference on Robotics and Automation(Cat.No.99CH36288C).IEEE,1999,4: 3020-3025.)。这两类模型均为业内技术人员所熟知,具体过程不再赘述。
所述步骤2中的
Figure RE-GDA00025595104100000810
通过扩张状态观测器中的距离误差的即时扰动抑制器计算得到,所述距离误差的即时扰动抑制器为:
Figure RE-GDA0002559510410000091
其中,
Figure RE-GDA0002559510410000092
Y1=ed,meas为距离误差的测量值,
Figure RE-GDA0002559510410000093
为X1的预估值
Figure RE-GDA0002559510410000094
对时间的导数,U1为距离误差控制回路中的控制输入,即实际航向角
Figure RE-GDA0002559510410000095
可以由定位测量***反馈得到通过扩张状态观测器间接给航向角的抗扰控制器和距离误差的抗扰控制器,
Figure RE-GDA0002559510410000096
Figure RE-GDA0002559510410000097
均可以通过公式
Figure RE-GDA0002559510410000098
迭代得到;
Figure RE-GDA0002559510410000099
β1,outlp和β2,outlp为扩张状态观测器增益,可以采用业内熟知的极点配置法整定;
Figure RE-GDA00025595104100000910
为距离误差的累积扰动估计值,从距离误差即时总扰动的迭代学习器中获得;
Figure RE-GDA00025595104100000911
为用于控制的模型计算的可建模的扰动,为业内技术人员所熟知,取决于具体的无人车辆模型的选择。
所述
Figure RE-GDA00025595104100000912
通过距离误差即时总扰动的迭代学习器获得,该学习器为:
Figure RE-GDA00025595104100000913
其中k为重复工作循环的编号,每一个完整的工作过程为一个循环,α1为遗忘因子,该变量取值越大则对过去数据的遗忘速度越快,γ1为学习因子,该变量取值越小则学习的速度越慢。
区别于传统的闭环控制器,本发明算法因采用了迭代学习算法,故需要将上一个工作循环的“由扩张状态观测器中的距离误差的即时扰动抑制器计算得到
Figure RE-GDA00025595104100000914
”和“距离误差即时总扰动的迭代学习器获得的航向角的累积扰动估计值
Figure RE-GDA00025595104100000915
”存储到数据库中。
实施例3
本实施例对实施例1中的航向角的抗扰控制器进行进一步说明。
所述步骤3中的航向角的抗扰控制器包括航向角反馈控制器和航向角扰动抑制器,其中,在航向角扰动抑制器中:
所述扩张状态观测器利用实际方向盘转角和实际航向角信息,对航向角的即时扰动进行实时估计;
航向角即时总扰动的迭代学习器根据扩张状态观测器观测航向角的即时扰动和上一个控制循环中航向角即时总扰动的迭代学习器得到的航向角的累积扰动,对本控制循环中航向角的累积扰动进行迭代估计,得到航向角的累积扰动估计值;
用于控制的模型计算可建模的扰动形成基于模型的扰动前馈;
如此,航向角的即时扰动、航向角的累积扰动和可建模的扰动均在航向角扰动抑制器中进行实时补偿,并与所述航向角反馈控制器一起,计算所需的无人驾驶车辆的目标航向角,使得轨迹跟踪航向角跟踪误差趋于零。
所述步骤3中航向角的抗扰控制器为
Figure RE-GDA0002559510410000101
其中,uinlp的计算结果赋值给目标方向盘转角
Figure RE-GDA0002559510410000102
航向角反馈控制器为
Figure RE-GDA0002559510410000103
u0,inlp是航向角控制中的虚拟控制量,b0,inlp是控制输入的增益;其中
Figure RE-GDA0002559510410000104
kp,inlp是比例控制系数,可以根据控制过程响应的快慢需求来调节,
Figure RE-GDA0002559510410000105
为目标航向角(单位是rad),
Figure RE-GDA0002559510410000106
为实际航向角(单位是rad),b0,inlp为航向控制回路中输入的增益,需要整定,即根据对控制效果的需求调节b0,inlp;所述步骤3中的航向角扰动抑制器为
Figure RE-GDA0002559510410000107
其中
Figure RE-GDA0002559510410000108
为航向角的即时扰动估计值(单位是rad/s),通过扩张状态观测器获得;
Figure RE-GDA0002559510410000109
为航向角的累积扰动估计值,通过航向角即时总扰动的迭代学习器获得(单位是rad/s);
Figure RE-GDA00025595104100001010
为用于控制的模型计算的可建模的扰动(单位是rad/s)。为业内技术人员所熟知,取决于具体的无人车辆模型的选择。
所述步骤2中的
Figure RE-GDA00025595104100001011
由扩张状态观测器中的航向角的即时扰动抑制器计算得到,所述航向角的即时扰动抑制器为:
Figure RE-GDA00025595104100001012
其中,
Figure RE-GDA00025595104100001013
为航向角的测量值,
Figure RE-GDA00025595104100001014
为X1的预估值
Figure RE-GDA00025595104100001015
对时间的导数,U2为航向角控制回路中的控制输入,即实际方向盘转角
Figure RE-GDA00025595104100001016
(单位是rad),可以由定位测量***反馈得到,
Figure RE-GDA00025595104100001017
Figure RE-GDA00025595104100001018
均可以通过公式
Figure RE-GDA0002559510410000111
迭代得到;
Figure RE-GDA0002559510410000112
β1,inlp和β2,inlp为扩张状态观测器增益,可以采用业内熟知的极点配置法整定;
Figure RE-GDA0002559510410000113
为航向角的累积扰动估计值 (单位是rad/s),从航向角即时总扰动的迭代学习器中获得;
Figure RE-GDA0002559510410000114
为用于控制的模型计算的可建模的扰动(单位是rad/s),为业内技术人员所熟知,取决于具体的无人车辆模型的选择。对于乘用车,可以选用运动学或者动力学模型,推荐但不限于书籍(龚建伟,姜岩,徐威.无人驾驶车辆模型预测控制[M].2014.),对于铰接式车辆的模型,推荐但不限于文章(Altafini C.Why to use an articulated vehicle in underground miningoperations[C]//Proceedings 1999IEEE International Conference on Robotics andAutomation(Cat.No.99CH36288C).IEEE,1999,4: 3020-3025.)。这两类模型均为业内技术人员所熟知,具体过程不再赘述。
所述的
Figure RE-GDA0002559510410000115
通过航向角即时总扰动的迭代学习器获得,该学习器为:
Figure RE-GDA0002559510410000116
其中k为重复工作循环的编号,每一个完整的工作过程(比如压路机从在起点和终点之间行驶一次或一个来回)为一个循环,α2为遗忘因子,该变量取值越大则对过去数据的遗忘速度越快,γ2为学习因子,该变量取值越小则学习的速度越慢。注意:区别于传统的闭环控制器,本发明算法因采用了迭代学习算法,故需要将上一个工作循环的“由扩张状态观测器中的航向角的即时扰动抑制器计算得到
Figure RE-GDA0002559510410000117
”和“航向角即时总扰动的迭代学习器获得的航向角的累积扰动估计值
Figure RE-GDA0002559510410000118
”存储到数据库中。
以上所述仅是本发明的优选实施方式,应当指出的是,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (4)

1.基于总扰动即时观测与迭代学习的重复作业式无人驾驶车辆轨迹跟踪控制算法,其特征在于,包括如下步骤:
步骤1,跟据无人驾驶车辆的目标轨迹,计算无人驾驶车辆的实际距离误差;
步骤2,距离误差的抗扰控制器通过步骤1得到的实际距离误差、扩张状态观测器得到的距离误差的即时扰动,以及距离误差即时总扰动的迭代学习器得到的距离误差的累积扰动,计算所述无人驾驶车辆的目标航向角,使得无人驾驶车辆的轨迹跟踪距离误差趋于零;
所述步骤2中距离误差的抗扰控制器为
Figure FDA0003677183790000011
其中uoutlp的结果赋值给目标航向角
Figure FDA0003677183790000012
距离误差反馈控制器为
Figure FDA0003677183790000013
u0,outlp是距离误差控制中的虚拟控制量,b0,outlp是控制输入的增益
Figure FDA0003677183790000014
Figure FDA0003677183790000015
为车速的测量值;其中u0,outlp=kp,outlp(0-ed),kp,outlp是比例控制系数,根据控制过程响应的快慢需求来调节,ed为实际距离误差;所述步骤2中的距离误差扰动抑制器为
Figure FDA0003677183790000016
其中
Figure FDA0003677183790000017
为距离误差的即时扰动估计值,通过扩张状态观测器获得;
Figure FDA0003677183790000018
为距离误差的累积扰动估计值,通过距离误差即时总扰动的迭代学习器获得;
Figure FDA0003677183790000019
为用于控制的模型计算的可建模的扰动;所述步骤2中的
Figure FDA00036771837900000110
通过扩张状态观测器中的距离误差的即时扰动抑制器计算得到,所述距离误差的即时扰动抑制器为:
Figure FDA00036771837900000111
其中,
Figure FDA00036771837900000112
Y1=ed,meas为距离误差的测量值,
Figure FDA00036771837900000114
为X1的预估值
Figure FDA00036771837900000115
对时间的导数,U1为距离误差控制回路中的控制输入,即实际航向角
Figure FDA00036771837900000116
Figure FDA00036771837900000117
Figure FDA00036771837900000118
均可以通过公式
Figure FDA00036771837900000119
迭代得到;
Figure FDA00036771837900000120
β1,outlp和β2,outlp为扩张状态观测器增益;
Figure FDA00036771837900000121
为距离误差的累积扰动估计值,从距离误差即时总扰动的迭代学习器中获得;
Figure FDA00036771837900000122
为用于控制的模型计算的可建模的扰动;
Figure FDA0003677183790000021
通过距离误差即时总扰动的迭代学习器获得,该学习器为:
Figure FDA0003677183790000022
其中k为重复工作循环的编号,每一个完整的工作过程为一个循环,α1为遗忘因子,γ1为学习因子;
步骤3,航向角的抗扰控制器通过步骤2得到的目标航向角、扩张状态观测器得到的航向的即时扰动,以及航向角即时总扰动的迭代学习器得到的航向角的累积扰动,计算所述无人驾驶车辆的目标方向盘转角或液压***转角,使得无人驾驶车辆的实际航向角趋近于步骤2得到的所述目标航向角;
所述步骤3中航向角的抗扰控制器为
Figure FDA0003677183790000023
其中,uinlp的计算结果赋值给目标方向盘转角
Figure FDA0003677183790000024
航向角反馈控制器为
Figure FDA0003677183790000025
u0,inlp是航向角控制中的虚拟控制量,b0,inlp是控制输入的增益;其中
Figure FDA0003677183790000026
kp,inlp是比例控制系数,根据控制过程响应的快慢需求来调节,
Figure FDA0003677183790000027
为目标航向角,
Figure FDA0003677183790000028
为实际航向角,b0,inlp为航向控制回路中输入的增益;所述步骤3中的航向角扰动抑制器为
Figure FDA0003677183790000029
其中
Figure FDA00036771837900000210
为航向角的即时扰动估计值,通过扩张状态观测器获得;
Figure FDA00036771837900000211
为航向角的累积扰动估计值,通过航向角即时总扰动的迭代学习器获得;
Figure FDA00036771837900000212
为用于控制的模型计算的可建模的扰动;
所述的
Figure FDA00036771837900000213
由扩张状态观测器中的航向角的即时扰动抑制器计算得到,所述航向角的即时扰动抑制器为:
Figure FDA00036771837900000214
其中,
Figure FDA00036771837900000215
Figure FDA00036771837900000216
为航向角的测量值,
Figure FDA00036771837900000217
为X1的预估值
Figure FDA00036771837900000218
对时间的导数,U2为航向角控制回路中的控制输入,即实际方向盘转角
Figure FDA00036771837900000219
可以由定位测量***反馈得到,
Figure FDA00036771837900000220
Figure FDA00036771837900000221
均可以通过公式
Figure FDA00036771837900000222
迭代得到;
Figure FDA00036771837900000223
β1,inlp和β2,inlp为扩张状态观测器增益;
Figure FDA0003677183790000031
为航向角的累积扰动估计值,从航向角即时总扰动的迭代学习器中获得;
Figure FDA0003677183790000032
为用于控制的模型计算的可建模的扰动;
所述的
Figure FDA0003677183790000033
通过航向角即时总扰动的迭代学习器获得,该学习器为:
Figure FDA0003677183790000034
其中k为重复工作循环的编号,每一个完整的工作过程为一个循环,α2为遗忘因子,γ2为学习因子;
步骤4,将步骤3得到的目标方向盘转角或液压***转角发送给方向盘转角或液压***转角控制器,对实际方向盘转角或液压***转角进行闭环控制,实现无人驾驶车辆的轨迹跟踪。
2.如权利要求1所述的基于总扰动即时观测与迭代学习的重复作业式无人驾驶车辆轨迹跟踪控制算法,其特征在于,所述重复作业式无人驾驶车辆包括但不限于无人驾驶的往复碾压作业的压路机、往复搬运货物的叉车、往复作业的推土机或装载机。
3.如权利要求1所述的基于总扰动即时观测与迭代学习的重复作业式无人驾驶车辆轨迹跟踪控制算法,其特征在于,所述步骤2中的距离误差的抗扰控制器包括距离误差反馈控制器和距离误差扰动抑制器,其中,在距离误差扰动抑制器中:
所述扩张状态观测器利用实际航向角和实际距离误差信息,对距离误差的即时扰动进行实时估计;
所述距离误差即时总扰动的迭代学习器根据扩张状态观测器观测的距离误差的即时扰动和上一个控制循环中距离误差即时总扰动的迭代学习器得到的距离误差的累积扰动,对本控制循环中距离误差的累积扰动进行迭代估计,得到距离误差的累积扰动估计值;
用于控制的模型计算可建模的扰动形成基于模型的扰动前馈;
如此,距离误差的即时扰动、距离误差的累积扰动和可建模的扰动均在距离误差扰动抑制器中进行实时补偿,并与所述距离误差反馈控制器一起,计算所需的无人驾驶车辆的目标航向角,使得轨迹跟踪距离误差趋于零。
4.如权利要求1所述的基于总扰动即时观测与迭代学习的重复作业式无人驾驶车辆轨迹跟踪控制算法,其特征在于,所述步骤3中的航向角的抗扰控制器包括航向角反馈控制器和航向角扰动抑制器,其中,在航向角扰动抑制器中:
所述扩张状态观测器利用实际方向盘转角和实际航向角信息,对航向角的即时扰动进行实时估计;
航向角即时总扰动的迭代学习器根据扩张状态观测器观测航向角的即时扰动和上一个控制循环中航向角即时总扰动的迭代学习器得到的航向角的累积扰动,对本控制循环中航向角的累积扰动进行迭代估计,得到航向角的累积扰动估计值;
用于控制的模型计算可建模的扰动形成基于模型的扰动前馈;
如此,航向角的即时扰动、航向角的累积扰动和可建模的扰动均在航向角扰动抑制器中进行实时补偿,并与所述航向角反馈控制器一起,计算所需的无人驾驶车辆的目标航向角,使得轨迹跟踪航向角跟踪误差趋于零。
CN202010140701.0A 2020-03-03 2020-03-03 基于总扰动即时观测与迭代学习的重复作业式无人驾驶车辆轨迹跟踪控制算法 Active CN113341943B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010140701.0A CN113341943B (zh) 2020-03-03 2020-03-03 基于总扰动即时观测与迭代学习的重复作业式无人驾驶车辆轨迹跟踪控制算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010140701.0A CN113341943B (zh) 2020-03-03 2020-03-03 基于总扰动即时观测与迭代学习的重复作业式无人驾驶车辆轨迹跟踪控制算法

Publications (2)

Publication Number Publication Date
CN113341943A CN113341943A (zh) 2021-09-03
CN113341943B true CN113341943B (zh) 2022-10-11

Family

ID=77467402

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010140701.0A Active CN113341943B (zh) 2020-03-03 2020-03-03 基于总扰动即时观测与迭代学习的重复作业式无人驾驶车辆轨迹跟踪控制算法

Country Status (1)

Country Link
CN (1) CN113341943B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106208824A (zh) * 2016-07-22 2016-12-07 浙江工业大学 一种基于自抗扰迭代学习的多电机同步控制方法
CN110209177A (zh) * 2019-07-02 2019-09-06 天津大学 基于模型预测和自抗扰的无人驾驶汽车控制***及方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6786407B2 (ja) * 2017-01-23 2020-11-18 株式会社クボタ 作業車無線管理システム
CN107991867A (zh) * 2017-11-28 2018-05-04 浙江工业大学 一种基于自抗扰控制器的网络化多轴运动控制***的迭代学习轮廓误差控制方法
CN108303877B (zh) * 2018-01-10 2020-05-05 浙江工业大学 一种基于eso的网络化运动控制***迭代学习高精度轮廓跟踪控制方法
CN108873906A (zh) * 2018-07-10 2018-11-23 北京踏歌艾尔机器人科技有限公司 碾压工程车无人驾驶控制方法和装置及可读存储介质
CN109542105A (zh) * 2018-12-28 2019-03-29 北京龙马智行科技有限公司 一种路基路面智能无人碾压***
CN110531777B (zh) * 2019-08-13 2020-11-10 北京理工大学 基于自抗扰控制技术的四旋翼飞行器姿态控制方法和***
CN110764499A (zh) * 2019-09-27 2020-02-07 南京航空航天大学 一种确保割草机直线行走的装置及其方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106208824A (zh) * 2016-07-22 2016-12-07 浙江工业大学 一种基于自抗扰迭代学习的多电机同步控制方法
CN110209177A (zh) * 2019-07-02 2019-09-06 天津大学 基于模型预测和自抗扰的无人驾驶汽车控制***及方法

Also Published As

Publication number Publication date
CN113341943A (zh) 2021-09-03

Similar Documents

Publication Publication Date Title
Fang et al. Trajectory tracking control of farm vehicles in presence of sliding
Peng et al. Leader–follower formation control of nonholonomic mobile robots based on a bioinspired neurodynamic based approach
CN110780594B (zh) 一种智能车的路径跟踪方法及***
De Simone et al. Identification and control of a unmanned ground vehicle by using Arduino
CN109017984B (zh) 一种无人车的轨迹跟随控制方法、控制***及相关装置
CN109857100B (zh) 一种基于反演法和快速终端滑模的复合轨迹跟踪控制算法
Keymasi Khalaji Modeling and control of uncertain multibody wheeled robots
Wang et al. Research on logistics autonomous mobile robot system
Ribeiro et al. Nonlinear model predictive visual path following control to autonomous mobile robots
Zhang et al. Robotic curved surface tracking with a neural network for angle identification and constant force control based on reinforcement learning
Low et al. Maneuverability and path following control of wheeled mobile robot in the presence of wheel skidding and slipping
Ding et al. Composite SOSM controller for path tracking control of agricultural tractors subject to wheel slip
Velasco-Villa et al. Trajectory tracking for awheeled mobile robot using a vision based positioning system and an attitude observer
Rigatos et al. A nonlinear H-infinity control approach for autonomous truck and trailer systems
Zhao et al. Nonlinear model predictive control-based guidance algorithm for quadrotor trajectory tracking with obstacle avoidance
Rigatos A nonlinear optimal control approach for tracked mobile robots
CN114442491A (zh) 室内机器人的局部路径规划和跟踪控制方法、装置及介质
Spitzer et al. Feedback linearization for quadrotors with a learned acceleration error model
Yuan et al. Differential flatness-based adaptive robust tracking control for wheeled mobile robots with slippage disturbances
CN113341943B (zh) 基于总扰动即时观测与迭代学习的重复作业式无人驾驶车辆轨迹跟踪控制算法
Zou et al. An adaptive control strategy for indoor leader-following of wheeled mobile robot
Kim et al. Study on vehicle lateral control for backward driving
Li et al. Modeling and controller design for multiple mobile robots formation control
Chen et al. 2.5 D visual servoing with a fixed camera
CN114690754B (zh) 重复作业式无人车迭代学习自趋优的循迹控制算法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant