CN111496792A - 一种机械臂输入饱和固定时间轨迹跟踪控制方法及*** - Google Patents

一种机械臂输入饱和固定时间轨迹跟踪控制方法及*** Download PDF

Info

Publication number
CN111496792A
CN111496792A CN202010345703.3A CN202010345703A CN111496792A CN 111496792 A CN111496792 A CN 111496792A CN 202010345703 A CN202010345703 A CN 202010345703A CN 111496792 A CN111496792 A CN 111496792A
Authority
CN
China
Prior art keywords
mechanical arm
formula
saturation
neural network
fixed time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010345703.3A
Other languages
English (en)
Other versions
CN111496792B (zh
Inventor
孙亮
曹胜杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Science and Technology Beijing USTB
Original Assignee
University of Science and Technology Beijing USTB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Science and Technology Beijing USTB filed Critical University of Science and Technology Beijing USTB
Priority to CN202010345703.3A priority Critical patent/CN111496792B/zh
Publication of CN111496792A publication Critical patent/CN111496792A/zh
Application granted granted Critical
Publication of CN111496792B publication Critical patent/CN111496792B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1656Programme controls characterised by programming, planning systems for manipulators
    • B25J9/1664Programme controls characterised by programming, planning systems for manipulators characterised by motion, path, trajectory planning
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1602Programme controls characterised by the control system, structure, architecture
    • B25J9/1605Simulation of manipulator lay-out, design, modelling of manipulator
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1628Programme controls characterised by the control loop
    • B25J9/163Programme controls characterised by the control loop learning, adaptive, model based, rule based expert control

Landscapes

  • Engineering & Computer Science (AREA)
  • Robotics (AREA)
  • Mechanical Engineering (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明提供一种机械臂输入饱和固定时间轨迹跟踪控制方法及***,该方法包括:获取机械臂的期望轨迹,并通过机械臂传感器获取机械臂的状态数据;根据获取的状态数据,采用强化学习控制算法抑制机械臂的模型不确定性;设计非线性抗饱和补偿器实时补偿关节力矩执行机构的饱和溢出效应;设计非奇异快速终端滑模控制器,使得机械臂关节轨迹跟踪误差在固定时间内收敛到原点小邻域,实现对机械臂输入饱和固定时间期望轨迹跟踪控制。本发明方法具有对模型不确定性的在线学习能力,使得机械臂可以准确且快速地跟踪轨迹。

Description

一种机械臂输入饱和固定时间轨迹跟踪控制方法及***
技术领域
本发明涉及机械臂轨迹跟踪技术领域,特别是指一种基于强化学习的机械臂输入饱和固定时间轨迹跟踪控制方法及***。
背景技术
机械臂在军事、制造业、医疗环境等危险环境领域有着广泛的应用,机械臂的轨迹跟踪控制技术一直是研究的热门方向之一,机械臂按照提前设定的关节轨迹进行运动是实现这些复杂任务的关键;然而,由于动力学模型不确定性,耦合效应以及外部未知干扰问题,使得机械臂准确且快速地跟踪轨迹十分困难。
近年来出现了许多轨迹跟踪控制方法,包括PID控制、自适应控制、非线性控制等。但是,现有的这些轨迹跟踪控制方法并不能克服动力学模型不确定性,耦合效应以及外部未知干扰因素所导致的机械臂轨迹跟踪控制不够准确、快速的问题;因此,迫切需要探索一种有效的机械臂轨迹跟踪控制技术。
发明内容
本发明要解决的技术问题是提供一种机械臂输入饱和固定时间轨迹跟踪控制方法及***,以至少部分解决现有的轨迹跟踪控制方法所存在的上述问题。
为解决上述技术问题,本发明提供如下技术方案:
一种机械臂输入饱和固定时间轨迹跟踪控制方法,所述方法包括:
获取机械臂的期望轨迹,并通过机械臂传感器获取机械臂的状态数据;
根据获取的状态数据,采用强化学习控制算法抑制机械臂的模型不确定性;
设计非线性抗饱和补偿器实时补偿关节力矩执行机构的饱和溢出效应;
设计非奇异快速终端滑模控制器,使得机械臂关节轨迹跟踪误差在固定时间内收敛到原点小邻域,实现对机械臂输入饱和固定时间期望轨迹跟踪控制。
进一步地,所述状态数据包括机械臂关节的位置和机械臂关节的速度。
进一步地,所述采用强化学习控制算法抑制机械臂的模型不确定性,包括:
基于机械臂的动力学模型,采用径向基函数神经网络进行最优权值的估计,设计Actor神经网络生成强化学习控制策略;设计Critic神经网络用于评估执行成本,并通过一个评估指标以确定在线学习情况是好于预期还是差于预期。
进一步地,所述机械臂的动力学模型建立如下:
Figure BDA0002470107140000021
式中,
Figure BDA0002470107140000022
以及
Figure BDA0002470107140000023
表示广义机械臂关节位置坐标、速度以及加速度;
Figure BDA0002470107140000024
是惯性矩阵,式中名义惯性矩阵M0(q)是对称正定的,MΔ(q)表示未知部分,
Figure BDA0002470107140000025
表示离心科氏力项,
Figure BDA0002470107140000026
表示重力项,
Figure BDA0002470107140000027
表示未知且有界的外部干扰,
Figure BDA0002470107140000028
Figure BDA0002470107140000029
表示关节控制输入力矩;
动力学模型公式(1)表示为:
Figure BDA00024701071400000210
式中,
Figure BDA00024701071400000211
是由外部扰动和参数不确定性组成的机械***的复合扰动;
分别定义x1(t)=q(t)、
Figure BDA00024701071400000212
将式(2)改写为:
Figure BDA00024701071400000213
考虑到关节力矩饱和问题,控制输入力矩τ(t)表示为:
Figure BDA00024701071400000214
式中,τHL是已知的控制输入受限值,则控制输入重新表示为:
τ(t)=τ0(t)+τΔ(t) (5)
式中,τ0(t)表示名义上设计的部分,未知部分τΔ(t)表示如下:
Figure BDA00024701071400000215
且假设
Figure BDA00024701071400000216
Figure BDA00024701071400000217
是一个未知常量。
进一步地,所述设计非奇异快速终端滑模控制器,包括:
定义***的跟踪误差:
Figure BDA0002470107140000031
将式(2)代入到式(7)中得到误差***如下:
Figure BDA0002470107140000032
式中,τ0表示待设计的控制输入指令,τΔ表示执行器饱和溢出效应;
采用一种新的非奇异固定时间快速滑动模态变量:
Figure BDA0002470107140000033
式中
Figure BDA0002470107140000034
为对角矩阵,
Figure BDA0002470107140000035
i=1,2,…,n表示为:
Figure BDA0002470107140000036
式中,α>0,β>0,k>1,v1>1,p,g是正的标量,且满足gk>1,1/v1<pk<1,控制器设计为:
Figure BDA0002470107140000037
式中
Figure BDA0002470107140000038
是对角矩阵,
Figure BDA0002470107140000039
i=1,2,…,n表示为:
Figure BDA00024701071400000310
Figure BDA00024701071400000311
v4>1,v2v4<1,v3v4>1,σ1,σ2为两个正常数,Ks=diag{ks1,ks2,…,ksn}是对角正定矩阵,其中,ksi>0,i=1,2,…,n,ζ是抗饱和补偿器的状态,l是复合干扰。
进一步地,所述非线性抗饱和补偿器设计为:
Figure BDA00024701071400000312
式中,ζ是抗饱和补偿器的***状态,
Figure BDA00024701071400000313
进一步地,所述Actor神经网络的设计如下:
采用执行神经网络来估计未知信息,因此,控制器设计为:
Figure BDA0002470107140000041
式中,fNN是RBFNN的输出向量,用于近似复合干扰l,表示为:
Figure BDA0002470107140000042
式中,wai=[wai1,wai2,…,waim]T为权值向量,
Figure BDA0002470107140000043
为RBFNN的输入向量,σai(zai)为高斯函数;
瞬时近似误差表示为:
Figure BDA0002470107140000044
式中,
Figure BDA0002470107140000045
然后将该误差设计为:
Figure BDA0002470107140000046
式中,Id(t)=0,表示期望的理想成本,kI表示正常数;
将人工神经网络的权值更新律设计为;
Figure BDA0002470107140000047
式中,Ea=ln(cosh ea),δa>0为执行神经网络的学习率;
应用参数投影算法,设计一个常数向量
Figure BDA0002470107140000048
Figure BDA0002470107140000049
使其满足
Figure BDA00024701071400000410
将基于投影的神经网络权值更新律设计为:
Figure BDA00024701071400000411
式中,
Figure BDA00024701071400000412
进一步地,所述Critic神经网络设计如下:
定义Critic神经网络为
Figure BDA00024701071400000413
且估计值为
Figure BDA00024701071400000414
其中,
Figure BDA0002470107140000051
为最优权重向量,
Figure BDA0002470107140000052
为估计权重向量,o为隐含层神经元个数,σc(e1)为高斯径向基函数,εc为逼近偏差;
代价函数表示为:
Figure BDA0002470107140000053
式中,
Figure BDA0002470107140000054
ψ是可调常数,常数ψ→∞时,代价函数为:
Figure BDA0002470107140000055
式中,
Figure BDA0002470107140000056
表示e1的梯度;
根据梯度下降法,Critic神经网络的权值更新律设计为:
Figure BDA0002470107140000057
式中,
Figure BDA0002470107140000058
将(19)代入到(21)中得到:
Figure BDA0002470107140000059
式中,
Figure BDA00024701071400000510
常数δc>0代表评价神经网络的学习率;
采用参数投影算法保证了评价神经网络权向量的有界性;设计一个常数向量
Figure BDA00024701071400000511
使其满足
Figure BDA00024701071400000512
(i=1,2,…,l),基于投影的评价神经网络权值更新律设计为:
Figure BDA00024701071400000513
式中,
Figure BDA00024701071400000514
相应地,为解决上述技术问题,本发明还提供如下技术方案:
一种机械臂输入饱和固定时间轨迹跟踪控制***,所述***包括:
机械臂期望轨迹及状态数据获取模块,用于获取机械臂的期望轨迹,并通过机械臂传感器获取机械臂的状态数据;
强化学习控制模块,用于根据获取的状态数据,采用强化学习控制算法抑制机械臂的模型不确定性;
非线性抗饱和补偿器设计模块,用于设计非线性抗饱和补偿器实时补偿关节力矩执行机构的饱和溢出效应;
非奇异快速终端滑模控制器,用于设计非奇异快速终端滑模控制器,使得机械臂关节轨迹跟踪误差在固定时间内收敛到原点小邻域,实现对机械臂输入饱和固定时间期望轨迹跟踪控制。
进一步地,所述强化学习控制模块具体用:
基于机械臂的动力学模型,采用径向基函数神经网络进行最优权值的估计,设计Actor神经网络生成强化学习控制策略;设计Critic神经网络用于评估执行成本,并通过一个评估指标以确定在线学习情况是好于预期还是差于预期。
本发明的上述技术方案的有益效果如下:
本发明的机械臂输入饱和固定时间轨迹跟踪控制方法考虑到机械臂动力学模型的不确定性,设计了一种计算简单的强化学习方法,可赋予控制器对模型不确定性的在线学习能力。设计的强化学习控制算法采用径向基函数神经网络来实现,其中Actor神经网络用于生成控制策略,Critic神经网络用于评估执行成本。考虑到控制力矩的输入饱和现象,设计了一种非线性抗饱和补偿器实时补偿关节力矩执行机构的饱和溢出效应,并且为了使轨迹跟踪误差在固定时间内收敛到原点小邻域内,设计了一种新的非奇异快速终端滑模控制器,保证跟踪误差的收敛时间不依赖于初始误差大小,并给出了收敛时间上界的估计。
附图说明
图1为本发明提供的机械臂输入饱和固定时间轨迹跟踪控制方法流程图;
图2为本发明提供的机械臂输入饱和固定时间轨迹跟踪控制方法对机器人关节位置的跟踪性能示意图;
图3为本发明提供的机械臂输入饱和固定时间轨迹跟踪控制方法对机器人关节位置的跟踪误差示意图;
图4为本发明提供的机械臂输入饱和固定时间轨迹跟踪控制方法对机器人关节速度的跟踪性能示意图;
图5为本发明提供的机械臂输入饱和固定时间轨迹跟踪控制方法对机器人关节速度的跟踪误差示意图;
图6为本发明提供的控制器输入力矩示意图。
具体实施方式
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
第一实施例
首先,需要说明的是,人工神经网络具有仅利用先验的输入-输出信息来映射输入输出关系的能力,由于神经网络具有良好的函数逼近能力,因此被广泛用于不确定非线性***的控制设计。
基于径向基函数神经网络(RBFNN)的方法在一定条件下对非线性函数进行任意精度的逼近是可行的。如果没有或只有相对有限的***动力学知识,它能够有效地构建一个控制器实现任务控制。工程中有结合滑模控制、动态表面控制、阻抗控制、模糊逻辑控制等智能控制方法的大量实例。
强化学习与监督学习不同,它是一种从环境中获取训练信息的学习方法,是一种评价信号而不是误差信号。Actor-Critic提供了一个经典的强化学习框架,Actor神经网络生成策略用于产生执行器的输入,Critic神经网络用于评估执行成本,以确定情况是好于预期还是差于预期,并定义一个值用来衡量。然后,Actor神经网络根据Critic神经网络的评价修改其控制策略。通过这些步骤,代价函数将收敛到全局最优。
基于上述,请参阅图1至图6,本实施例提供一种机械臂输入饱和固定时间轨迹跟踪控制方法,所述机械臂输入饱和固定时间轨迹跟踪控制方法包括:
S101,获取机械臂的期望轨迹,并通过机械臂传感器获取机械臂的状态数据;其中,状态数据包括机械臂关节的位置和机械臂关节的速度;
S102,根据获取的状态数据,基于机械臂的动力学模型,采用强化学习控制算法抑制机械臂的模型不确定性;
需要说明的是,本实施例基于机械臂的动力学模型,采用径向基函数神经网络进行最优权值的估计,设计Actor神经网络生成强化学习控制策略;设计Critic神经网络用于评估执行成本,并通过一个评估指标以确定在线学习情况是好于预期还是差于预期。由于强化学习神经网络具有很好的学习***不确定性的能力,因此可对***不确定性保持良好的逼近能力。
S103,设计非线性抗饱和补偿器实时补偿关节力矩执行机构的饱和溢出效应;以克服控制输入饱和问题;
S104,设计非奇异快速终端滑模控制器,使得机械臂关节轨迹跟踪误差在固定时间内收敛到原点小邻域,实现对机械臂输入饱和固定时间轨迹跟踪控制。
本实施例定义跟踪误差并建立机械臂轨迹跟踪误差动力学模型,接着定义滑模变量并建立滑模变量的动力学,然后采用滑模变量设计固定时间控制器。
其中,机械臂的动力学模型建立如下:
Figure BDA0002470107140000081
式中,
Figure BDA0002470107140000082
以及
Figure BDA0002470107140000083
表示广义机械臂关节位置坐标、速度以及加速度;
Figure BDA0002470107140000084
是惯性矩阵,式中名义惯性矩阵M0(q)是对称正定的,MΔ(q)表示未知部分,
Figure BDA0002470107140000085
表示离心科氏力项,
Figure BDA0002470107140000086
表示重力项,
Figure BDA0002470107140000087
表示未知且有界的外部干扰,
Figure BDA0002470107140000088
Figure BDA0002470107140000089
表示关节控制输入力矩;
动力学模型公式(1)可以写成:
Figure BDA00024701071400000810
式中,
Figure BDA00024701071400000811
是由外部扰动和参数不确定性组成的机械***的复合扰动;
分别定义x1(t)=q(t)、
Figure BDA00024701071400000812
将式(2)可以改写为:
Figure BDA00024701071400000813
考虑到关节力矩饱和问题,控制输入力矩τ(t)可以表示为:
Figure BDA00024701071400000814
式中,τHL是已知的控制输入受限值,则控制输入可以重新表示为:
τ(t)=τ0(t)+τΔ(t) (5)
式中,τ0(t)表示名义上设计的部分,未知部分τΔ(t)可以表示如下:
Figure BDA0002470107140000091
且假设
Figure BDA0002470107140000092
Figure BDA0002470107140000093
是一个未知常量。
定义***的跟踪误差:
Figure BDA0002470107140000094
将式(2)代入到式(7)中得到误差***如下:
Figure BDA0002470107140000095
式中,τ0表示待设计的控制输入指令,τΔ表示执行器饱和溢出效应;
A、非奇异快速终端滑模控制器和非线性抗饱和补偿器设计如下:
为了保证e1和e2在与初始状态无关的固定时间Ts内收敛到原点小邻域,采用了一种新的非奇异固定时间快速滑动模态变量:
Figure BDA0002470107140000096
式中
Figure BDA0002470107140000097
为对角矩阵,
Figure BDA0002470107140000098
i=1,2,…,n表示为:
Figure BDA0002470107140000099
式中,α>0,β>0,k>1,v1>1,p,g是正的标量,且满足gk>1,1/v1<pk<1;
s的时间导数是:
Figure BDA00024701071400000910
式中,
Figure BDA00024701071400000911
是对角矩阵,
Figure BDA00024701071400000912
i=1,2,…,n表示如下:
Figure BDA00024701071400000913
如果所有的动力学已知,那么τeq可以设计为:
Figure BDA00024701071400000914
式中,v4>1,v2v4<1,v3v4>1,σ1,σ2为两个正常数,Ks=diag{ks1,ks2,…,ksn}是对角正定矩阵,其中,ksi>0,i=1,2,…,n,ζ是抗饱和补偿器的状态,l是复合干扰。
非线性抗饱和补偿器的更新率可以设计为:
Figure BDA0002470107140000101
式中,ζ是抗饱和补偿器的***状态,
Figure BDA0002470107140000102
为处理模型中的复合干扰,在Lyapunov稳定性理论框架下,基于径向基神经网络分别设计一个用于评估成本的评价网络(Critic)和一个用于生成强化学习控制输入的执行网络(Actor)。具体如下:
B、执行网络(Actor)的设计如下:
在实际应用中,复合扰动l是未知的,这里采用了执行神经网络来估计未知信息。因此,控制器设计为:
Figure BDA0002470107140000103
式中,fNN是RBFNN的输出向量,用于近似复合干扰l,表示为:
Figure BDA0002470107140000104
式中,wai=[wai1,wai2,…,waim]T为权值向量,
Figure BDA0002470107140000105
为RBFNN的输入向量,σai(zai)为高斯函数;
瞬时近似误差可以表示为:
Figure BDA0002470107140000106
式中,
Figure BDA0002470107140000107
然后将该误差设计为:
Figure BDA0002470107140000108
式中,Id(t)=0,表示期望的理想成本,kI表示正常数;
将人工神经网络的权值更新律设计为;
Figure BDA0002470107140000111
式中,Ea=ln(cosh ea),δa>0为执行神经网络的学习率;
应用参数投影算法,设计一个常数向量
Figure BDA0002470107140000112
Figure BDA0002470107140000113
使其满足
Figure BDA0002470107140000114
(i=1,2,…,m);
将基于投影的神经网络权值更新律设计为:
Figure BDA0002470107140000115
式中,
Figure BDA0002470107140000116
C、评价(Critic)神经网络的设计如下:
定义Critic神经网络为
Figure BDA0002470107140000117
且估计值为
Figure BDA0002470107140000118
其中,
Figure BDA0002470107140000119
为最优权重向量,
Figure BDA00024701071400001110
为估计权重向量,o为隐含层神经元个数,σc(e1)为高斯径向基函数,εc为逼近偏差;
代价函数表示为:
Figure BDA00024701071400001111
式中,
Figure BDA00024701071400001112
ψ是可调常数,常数ψ→∞时,代价函数可以近似为:
Figure BDA00024701071400001113
式中,
Figure BDA00024701071400001114
表示e1的梯度;
根据梯度下降法,评价(Critic)神经网络的权值更新律可以设计为:
Figure BDA00024701071400001115
式中,
Figure BDA00024701071400001116
将(21)代入到(23)中得到:
Figure BDA00024701071400001117
式中,
Figure BDA00024701071400001118
常数δc>0代表评价神经网络的学习率;
采用参数投影算法保证了评价神经网络权向量的有界性;设计一个常数向量
Figure BDA0002470107140000121
使其满足
Figure BDA0002470107140000122
(i=1,2,…,l),基于投影的评价神经网络权值更新律设计为:
Figure BDA0002470107140000123
式中,
Figure BDA0002470107140000124
D、稳定性分析
为了证明参数
Figure BDA0002470107140000125
的有界性,候选李雅普诺夫参数如下:
Figure BDA0002470107140000126
根据基于投影算法的权值更新律,有两种情况需要考虑:
情况一:若
Figure BDA0002470107140000127
则:
Figure BDA0002470107140000128
情况二:若
Figure BDA0002470107140000129
则:
Figure BDA00024701071400001210
只要
Figure BDA00024701071400001211
是满足的,那么权值更新律总可以保证
Figure BDA00024701071400001212
与评价神经网络相似,执行神经网络的候选李雅普诺夫函数如下:
Figure BDA00024701071400001213
使用相同的分析方法,权值更新律总可以保证
Figure BDA00024701071400001214
i=1,2,…,n。
选择一个候选的李雅普诺夫函数如下:
Figure BDA00024701071400001215
将(8)和(15)代入(11),则闭环***可以表示为:
Figure BDA00024701071400001216
式中,
Figure BDA00024701071400001217
是RBFNN的估计值与最优值之间的估计误差,即
Figure BDA0002470107140000131
式中,εi,(i=1,2,…,n)表示近似误差。
将(31)和(14)代入,则V(t)的导数为:
Figure BDA0002470107140000132
根据杨氏不等式,有:
Figure BDA0002470107140000133
式中,
Figure BDA0002470107140000134
类似地有
Figure BDA0002470107140000135
将(34)和(35)代入到(33)中得:
Figure BDA0002470107140000136
选择合适的参数确保
Figure BDA0002470107140000137
且(Ks-KM-Kε)≥0,则可以得到:
Figure BDA0002470107140000138
将(19)和(24)代入(37)可得:
Figure BDA0002470107140000141
式中,
Figure BDA0002470107140000142
Figure BDA0002470107140000143
引理1存在yi∈R,i=1,2,…,n,0<r1≤1,r2>1,满足以下条件:
Figure BDA0002470107140000151
根据引理1,式(39)可以化简为:
Figure BDA0002470107140000152
Figure BDA0002470107140000153
式中,
Figure BDA0002470107140000154
Figure BDA0002470107140000161
σ5=min{σ1,σ3,1},σ6=min{σ24,1}
引理2考虑以下非线性***:
Figure BDA0002470107140000162
x(0)=x0,f(0)=0,
假设存在一个正定的标量函数V(x):
Figure BDA0002470107140000163
满足:
Figure BDA0002470107140000164
式中,α,β,p,q,k是正的参数,且pk<1,qk>1。则***可以在固定时间T内收敛到原点邻域Ω内,其中:
Figure BDA0002470107140000165
且收敛时间T为T≤1/(αkθk(1-pk))+1/(βkθk(qk-1)),0<θ<1 (45)
根据引理2可知,本实施例设计的控制器可以使***误差在固定时间收敛到原点小邻域内。
计算机数值仿真中采用了双连杆刚性机械臂验证所提出控制器的有效性,***结构框图如图1所示。定义x1=[x11,x12]T作为机械臂的关节角度,然后给出两连杆机器人数学模型中的相关矩阵:
Figure BDA0002470107140000166
Figure BDA0002470107140000167
Figure BDA0002470107140000168
式中
Figure BDA0002470107140000169
p3=m2l1lc2,p4=m1lc2+m2l1,p5=m2lc2;mi和li分别是连杆i的质量和长度,m1=2.00(kg),m2=0.85(kg),l1=0.35(m),l2=0.31(m);Ii是连杆i的转动惯量,
Figure BDA00024701071400001610
Figure BDA0002470107140000171
lci是第i个连杆的质心;g=9.8(m/s2)。
机器人的初始位置和速度为:
x11(0)=x12(0)=1.5(rad),x21(0)=x22(0)=0(rad/s)
设置的期望轨迹为:
xd=[0.1sin(0.5t)+cos(0.5t),0.1cos(t)+cos(t)]T
式中,t∈[0,tm],tm=10(s)
扰动转矩为:
d(t)=[0.1sin(0.5t)+0.25cos(0.5t),0.25sin(0.5t)+0.1sin(0.5t)]T
饱和受限参数设置为:
τH=5,τL=-5。
控制器参数设置为:α=0.7,β=1,p=0.5,
Figure BDA0002470107140000172
v1=2,
Figure BDA0002470107140000173
Figure BDA0002470107140000174
v4=2,Ks=1000,Kζ=1,kI=1,δa=0.0005,δc=0.001。
本实施例的机械臂输入饱和固定时间轨迹跟踪控制方法的仿真结果如图2-6所示,其中图2和图3表明两连杆刚性机械臂关节角位置可以高精度快速稳定地跟踪上期望关节角轨迹;图4和图5表明关节角速度也可以高精度快速稳定地跟踪上期望关节角速度;图6表明所提出的控制信号保持有界且始终满足执行器饱和受限要求。仿真结果表明所提出的控制方法是可行有效的。
综上,本实施例提供了一种轨迹跟踪控制方法,考虑到机械臂动力学模型的不确定性,设计了一种计算简单的强化学习方法,能够赋予控制器对模型不确定性的在线学习能力。设计的强化学习控制算法采用径向基函数神经网络来实现,其中Actor神经网络用于生成控制策略,Critic神经网络用于评估执行成本。考虑到控制力矩的输入饱和现象,设计了一种非线性抗饱和补偿器实时补偿关节力矩执行机构的饱和溢出效应,并且为了使轨迹跟踪误差在固定时间内收敛到原点小邻域内,设计了一种新的非奇异快速终端滑模控制器,保证跟踪误差的收敛时间不依赖于初始误差大小,并给出了收敛时间上界的估计。
第二实施例
本实施例提供一种机械臂输入饱和固定时间轨迹跟踪控制***,其包括:
机械臂期望轨迹及状态数据获取模块,用于获取机械臂的期望轨迹,并通过机械臂传感器获取机械臂的状态数据;
强化学习控制模块,用于根据获取的状态数据,采用强化学习控制算法抑制机械臂的模型不确定性;
非线性抗饱和补偿器设计模块,用于设计非线性抗饱和补偿器实时补偿关节力矩执行机构的饱和溢出效应;
非奇异快速终端滑模控制器,用于设计非奇异快速终端滑模控制器,使得机械臂关节轨迹跟踪误差在固定时间内收敛到原点小邻域,实现对机械臂输入饱和固定时间期望轨迹跟踪控制。
本实施例的机械臂输入饱和固定时间轨迹跟踪控制***与第一实施例的机械臂输入饱和固定时间轨迹跟踪控制方法相对应;其中,该机械臂输入饱和固定时间轨迹跟踪控制***中的各功能模块所实现的功能与上述机械臂输入饱和固定时间轨迹跟踪控制方法中的各流程步骤相对应;故,在此,不再赘述。
此外,需要说明的是,本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
还需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
最后需说明的是,以上所述是本发明的优选实施方式,应当指出,尽管已描述了本发明的优选实施例,但对于本领域普通技术人员来说,一旦得知了本发明的基本创造性概念,在不脱离本发明所述原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。

Claims (10)

1.一种机械臂输入饱和固定时间轨迹跟踪控制方法,其特征在于,包括:
获取机械臂的期望轨迹,并通过机械臂传感器获取机械臂的状态数据;
根据获取的状态数据,采用强化学习控制算法抑制机械臂的模型不确定性;
设计非线性抗饱和补偿器实时补偿关节力矩执行机构的饱和溢出效应;
设计非奇异快速终端滑模控制器,使得机械臂关节轨迹跟踪误差在固定时间内收敛到原点小邻域,实现对机械臂输入饱和固定时间期望轨迹跟踪控制。
2.如权利要求1所述的机械臂输入饱和固定时间轨迹跟踪控制方法,其特征在于,所述状态数据包括机械臂关节的位置和机械臂关节的速度。
3.如权利要求1所述的机械臂输入饱和固定时间轨迹跟踪控制方法,其特征在于,所述采用强化学习控制算法抑制机械臂的模型不确定性,包括:
基于机械臂的动力学模型,采用径向基函数神经网络进行最优权值的估计,设计Actor神经网络生成强化学习控制策略;设计Critic神经网络用于评估执行成本,并通过一个评估指标以确定在线学习情况是好于预期还是差于预期。
4.如权利要求3所述的机械臂输入饱和固定时间轨迹跟踪控制方法,其特征在于,所述机械臂的动力学模型建立如下:
Figure FDA0002470107130000011
式中,
Figure FDA0002470107130000012
以及
Figure FDA0002470107130000013
表示广义机械臂关节位置坐标、速度以及加速度;
Figure FDA0002470107130000014
是惯性矩阵,式中名义惯性矩阵M0(q)是对称正定的,MΔ(q)表示未知部分,
Figure FDA0002470107130000015
表示离心科氏力项,
Figure FDA0002470107130000016
表示重力项,
Figure FDA0002470107130000017
表示未知且有界的外部干扰,
Figure FDA0002470107130000018
Figure FDA0002470107130000019
表示关节控制输入力矩;
动力学模型公式(1)表示为:
Figure FDA00024701071300000110
式中,
Figure FDA00024701071300000111
是由外部扰动和参数不确定性组成的机械***的复合扰动;
分别定义x1(t)=q(t)、
Figure FDA00024701071300000112
将式(2)改写为:
Figure FDA0002470107130000021
考虑到关节力矩饱和问题,控制输入力矩τ(t)表示为:
Figure FDA0002470107130000022
式中,τH>τL是已知的控制输入受限值,则控制输入重新表示为:
τ(t)=τ0(t)+τΔ(t) (5)
式中,τ0(t)表示名义上设计的部分,未知部分τΔ(t)表示如下:
Figure FDA0002470107130000023
且假设
Figure FDA0002470107130000024
Figure FDA0002470107130000025
是一个未知常量。
5.如权利要求4所述的机械臂输入饱和固定时间轨迹跟踪控制方法,其特征在于,所述设计非奇异快速终端滑模控制器,包括:
定义***的跟踪误差:
Figure FDA0002470107130000026
将式(2)代入到式(7)中得到误差***如下:
Figure FDA0002470107130000027
式中,τ0表示待设计的控制输入指令,τΔ表示执行器饱和溢出效应;
采用一种新的非奇异固定时间快速滑动模态变量:
Figure FDA0002470107130000028
式中
Figure FDA0002470107130000029
为对角矩阵,
Figure FDA00024701071300000210
表示为:
Figure FDA00024701071300000211
式中,α>0,β>0,k>1,v1>1,p,g是正的标量,且满足gk>1,1/v1<pk<1,控制器设计为:
Figure FDA0002470107130000031
式中
Figure FDA0002470107130000032
是对角矩阵,
Figure FDA0002470107130000033
表示为:
Figure FDA0002470107130000034
σ2为两个正常数,Ks=diag{ks1,ks2,…,ksm}是对角正定矩阵,其中,ksi>0,i=1,2,…,n,ζ是抗饱和补偿器的状态,l是复合干扰。
6.如权利要求4所述的机械臂输入饱和固定时间轨迹跟踪控制方法,其特征在于,所述非线性抗饱和补偿器设计为:
Figure FDA0002470107130000035
式中,ζ是抗饱和补偿器的***状态,
Figure FDA0002470107130000036
7.如权利要求5所述的机械臂输入饱和固定时间轨迹跟踪控制方法,其特征在于,所述Actor神经网络的设计如下:
采用执行神经网络来估计未知信息,因此,控制器设计为:
Figure FDA0002470107130000037
式中,fNN是RBFNN的输出向量,用于近似复合干扰l,表示为:
Figure FDA0002470107130000038
式中,wai=[wai1,wai2,…,waim]T为权值向量,
Figure FDA0002470107130000039
为RBFNN的输入向量,σai(zai)为高斯函数;
瞬时近似误差表示为:
Figure FDA00024701071300000310
式中,
Figure FDA0002470107130000041
然后将该误差设计为:
Figure FDA0002470107130000042
式中,Id(t)=0,表示期望的理想成本,kI表示正常数;
将人工神经网络的权值更新律设计为;
Figure FDA0002470107130000043
式中,Ea=ln(coshea),δa>0为执行神经网络的学习率;
应用参数投影算法,设计一个常数向量
Figure FDA0002470107130000044
Figure FDA0002470107130000045
使其满足
Figure FDA0002470107130000046
将基于投影的神经网络权值更新律设计为:
Figure FDA0002470107130000047
式中,
Figure FDA0002470107130000048
8.如权利要求7所述的机械臂输入饱和固定时间轨迹跟踪控制方法,其特征在于,所述Critic神经网络设计如下:
定义Critic神经网络为
Figure FDA0002470107130000049
且估计值为
Figure FDA00024701071300000410
其中,
Figure FDA00024701071300000411
为最优权重向量,
Figure FDA00024701071300000412
为估计权重向量,o为隐含层神经元个数,σc(e1)为高斯径向基函数,εc为逼近偏差;
代价函数表示为:
Figure FDA00024701071300000413
式中,
Figure FDA00024701071300000414
ψ是可调常数,常数ψ→∞时,代价函数为:
Figure FDA00024701071300000415
式中,
Figure FDA00024701071300000416
表示e1的梯度;
根据梯度下降法,Critic神经网络的权值更新律设计为:
Figure FDA0002470107130000051
式中,
Figure FDA0002470107130000052
将(19)代入到(21)中得到:
Figure FDA0002470107130000053
式中,
Figure FDA0002470107130000054
常数δc>0代表评价神经网络的学习率;
采用参数投影算法保证了评价神经网络权向量的有界性;设计一个常数向量
Figure FDA0002470107130000055
使其满足
Figure FDA0002470107130000056
基于投影的评价神经网络权值更新律设计为:
Figure FDA0002470107130000057
式中,
Figure FDA0002470107130000058
9.一种机械臂输入饱和固定时间轨迹跟踪控制***,其特征在于,包括:
机械臂期望轨迹及状态数据获取模块,用于获取机械臂的期望轨迹,并通过机械臂传感器获取机械臂的状态数据;
强化学习控制模块,用于根据获取的状态数据,采用强化学习控制算法抑制机械臂的模型不确定性;
非线性抗饱和补偿器设计模块,用于设计非线性抗饱和补偿器实时补偿关节力矩执行机构的饱和溢出效应;
非奇异快速终端滑模控制器,用于设计非奇异快速终端滑模控制器,使得机械臂关节轨迹跟踪误差在固定时间内收敛到原点小邻域,实现对机械臂输入饱和固定时间期望轨迹跟踪控制。
10.如权利要求9所述的机械臂输入饱和固定时间轨迹跟踪控制***,其特征在于,所述强化学习控制模块具体用:
基于机械臂的动力学模型,采用径向基函数神经网络进行最优权值的估计,设计Actor神经网络生成强化学习控制策略;设计Critic神经网络用于评估执行成本,并通过一个评估指标以确定在线学习情况是好于预期还是差于预期。
CN202010345703.3A 2020-04-27 2020-04-27 一种机械臂输入饱和固定时间轨迹跟踪控制方法及*** Active CN111496792B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010345703.3A CN111496792B (zh) 2020-04-27 2020-04-27 一种机械臂输入饱和固定时间轨迹跟踪控制方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010345703.3A CN111496792B (zh) 2020-04-27 2020-04-27 一种机械臂输入饱和固定时间轨迹跟踪控制方法及***

Publications (2)

Publication Number Publication Date
CN111496792A true CN111496792A (zh) 2020-08-07
CN111496792B CN111496792B (zh) 2021-06-01

Family

ID=71866434

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010345703.3A Active CN111496792B (zh) 2020-04-27 2020-04-27 一种机械臂输入饱和固定时间轨迹跟踪控制方法及***

Country Status (1)

Country Link
CN (1) CN111496792B (zh)

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111956452A (zh) * 2020-08-29 2020-11-20 上海电气集团股份有限公司 一种上肢康复机器人控制方法及装置
CN112223276A (zh) * 2020-09-01 2021-01-15 上海大学 基于自适应神经网络滑模控制的多关节机器人控制方法
CN112241124A (zh) * 2020-10-27 2021-01-19 南昌大学 一种自适应反演积分非奇异快速终端滑模控制器设计方法
CN112621759A (zh) * 2020-12-28 2021-04-09 燕山大学 基于事件触发机制的遥操作***分数阶滑模同步控制方法
CN112936286A (zh) * 2021-03-13 2021-06-11 齐鲁工业大学 一种多柔性机械臂***自适应一致性追踪控制方法及***
CN112975986A (zh) * 2021-03-25 2021-06-18 珞石(北京)科技有限公司 基于径向基函数的机械臂点对点轨迹规划方法及装置
CN113199477A (zh) * 2021-04-29 2021-08-03 浙江工业大学 一种基于强化学习的Baxter机械臂轨迹跟踪控制方法
CN113359419A (zh) * 2021-06-22 2021-09-07 天津理工大学 一种高速并联机器人的模糊耦合控制方法
CN113352320A (zh) * 2021-05-11 2021-09-07 浙江工业大学 一种基于Q学习的Baxter机械臂智能优化控制方法
CN113359767A (zh) * 2021-07-05 2021-09-07 沈阳工业大学 机器人结构慢变化的有界轨迹跟踪误差安全驱动控制方法
CN113370205A (zh) * 2021-05-08 2021-09-10 浙江工业大学 一种基于机器学习的Baxter机械臂轨迹跟踪控制方法
CN113589689A (zh) * 2021-07-09 2021-11-02 南昌大学 一种基于多参数自适应神经网络的滑模控制器设计方法
CN114516047A (zh) * 2022-02-14 2022-05-20 安徽大学 基于径向基神经网络终端滑模控制机械臂轨迹方法及***
CN114536338A (zh) * 2022-03-03 2022-05-27 深圳亿嘉和科技研发有限公司 一种液压机械臂的控制方法
CN114559429A (zh) * 2022-02-22 2022-05-31 华南理工大学 基于自适应迭代学习的柔性机械臂的神经网络控制方法
CN114571451A (zh) * 2022-02-25 2022-06-03 山东新一代信息产业技术研究院有限公司 一种可调漏斗边界的自适应滑模控制方法及设备
CN115122335A (zh) * 2022-07-29 2022-09-30 华南理工大学 基于外环速度补偿的封闭机器人任务空间学习控制方法、存储介质及机器人
CN115609592A (zh) * 2022-11-22 2023-01-17 季华实验室 一种机械臂自适应跟踪控制方法
CN115857342A (zh) * 2022-11-28 2023-03-28 北京理工大学 基于自适应神经网络的航天器观测载荷随动机构控制方法
CN115847404A (zh) * 2022-11-28 2023-03-28 燕山大学 一种基于复合学习的受限机械臂有限时间控制方法
CN116339141A (zh) * 2023-03-10 2023-06-27 山东科技大学 一种机械臂全局固定时间轨迹跟踪滑模控制方法
CN117283565A (zh) * 2023-11-03 2023-12-26 安徽大学 一种基于Actor-Critic网络全状态反馈的柔性关节机械臂控制方法
CN117681212A (zh) * 2024-02-01 2024-03-12 安徽大学 基于动力学参数辨识和快速终端滑模协作机器人控制方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005014169A (ja) * 2003-06-27 2005-01-20 Canon Inc フィードバック制御装置および加工装置
US20070260935A1 (en) * 2006-04-07 2007-11-08 International Business Machines Corporation Methods, systems, and computer program products for compensating for disruption caused by trace enablement
CN105425812A (zh) * 2016-01-14 2016-03-23 北京航空航天大学 一种基于双模型下的无人机自动着舰轨迹控制方法
CN108039706A (zh) * 2017-12-19 2018-05-15 电子科技大学 一种有源电力滤波器抗饱和频率自适应谐振控制方法
CN108227491A (zh) * 2017-12-28 2018-06-29 重庆邮电大学 一种基于滑模神经网络的智能车轨迹跟踪控制方法
CN108803632A (zh) * 2018-09-19 2018-11-13 哈尔滨工程大学 基于饱和补偿技术的水面无人艇全状态约束轨迹跟踪控制方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005014169A (ja) * 2003-06-27 2005-01-20 Canon Inc フィードバック制御装置および加工装置
US20070260935A1 (en) * 2006-04-07 2007-11-08 International Business Machines Corporation Methods, systems, and computer program products for compensating for disruption caused by trace enablement
CN105425812A (zh) * 2016-01-14 2016-03-23 北京航空航天大学 一种基于双模型下的无人机自动着舰轨迹控制方法
CN108039706A (zh) * 2017-12-19 2018-05-15 电子科技大学 一种有源电力滤波器抗饱和频率自适应谐振控制方法
CN108227491A (zh) * 2017-12-28 2018-06-29 重庆邮电大学 一种基于滑模神经网络的智能车轨迹跟踪控制方法
CN108803632A (zh) * 2018-09-19 2018-11-13 哈尔滨工程大学 基于饱和补偿技术的水面无人艇全状态约束轨迹跟踪控制方法

Cited By (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111956452A (zh) * 2020-08-29 2020-11-20 上海电气集团股份有限公司 一种上肢康复机器人控制方法及装置
CN112223276A (zh) * 2020-09-01 2021-01-15 上海大学 基于自适应神经网络滑模控制的多关节机器人控制方法
CN112223276B (zh) * 2020-09-01 2023-02-10 上海大学 基于自适应神经网络滑模控制的多关节机器人控制方法
CN112241124A (zh) * 2020-10-27 2021-01-19 南昌大学 一种自适应反演积分非奇异快速终端滑模控制器设计方法
CN112241124B (zh) * 2020-10-27 2022-02-11 南昌大学 一种自适应反演积分非奇异快速终端滑模控制器设计方法
CN112621759A (zh) * 2020-12-28 2021-04-09 燕山大学 基于事件触发机制的遥操作***分数阶滑模同步控制方法
CN112621759B (zh) * 2020-12-28 2021-12-24 燕山大学 基于事件触发机制的遥操作***分数阶滑模同步控制方法
CN112936286A (zh) * 2021-03-13 2021-06-11 齐鲁工业大学 一种多柔性机械臂***自适应一致性追踪控制方法及***
CN112975986A (zh) * 2021-03-25 2021-06-18 珞石(北京)科技有限公司 基于径向基函数的机械臂点对点轨迹规划方法及装置
CN113199477A (zh) * 2021-04-29 2021-08-03 浙江工业大学 一种基于强化学习的Baxter机械臂轨迹跟踪控制方法
CN113199477B (zh) * 2021-04-29 2022-06-17 浙江工业大学 一种基于强化学习的Baxter机械臂轨迹跟踪控制方法
CN113370205A (zh) * 2021-05-08 2021-09-10 浙江工业大学 一种基于机器学习的Baxter机械臂轨迹跟踪控制方法
CN113370205B (zh) * 2021-05-08 2022-06-17 浙江工业大学 一种基于机器学习的Baxter机械臂轨迹跟踪控制方法
CN113352320A (zh) * 2021-05-11 2021-09-07 浙江工业大学 一种基于Q学习的Baxter机械臂智能优化控制方法
CN113352320B (zh) * 2021-05-11 2022-06-17 浙江工业大学 一种基于Q学习的Baxter机械臂智能优化控制方法
CN113359419A (zh) * 2021-06-22 2021-09-07 天津理工大学 一种高速并联机器人的模糊耦合控制方法
CN113359767A (zh) * 2021-07-05 2021-09-07 沈阳工业大学 机器人结构慢变化的有界轨迹跟踪误差安全驱动控制方法
CN113359767B (zh) * 2021-07-05 2023-08-18 沈阳工业大学 机器人结构慢变化的有界轨迹跟踪误差安全驱动控制方法
CN113589689A (zh) * 2021-07-09 2021-11-02 南昌大学 一种基于多参数自适应神经网络的滑模控制器设计方法
CN113589689B (zh) * 2021-07-09 2024-01-02 南昌大学 一种基于多参数自适应神经网络的滑模控制器设计方法
CN114516047A (zh) * 2022-02-14 2022-05-20 安徽大学 基于径向基神经网络终端滑模控制机械臂轨迹方法及***
CN114559429A (zh) * 2022-02-22 2022-05-31 华南理工大学 基于自适应迭代学习的柔性机械臂的神经网络控制方法
CN114559429B (zh) * 2022-02-22 2023-09-29 华南理工大学 基于自适应迭代学习的柔性机械臂的神经网络控制方法
CN114571451B (zh) * 2022-02-25 2023-08-22 山东新一代信息产业技术研究院有限公司 一种可调漏斗边界的自适应滑模控制方法及设备
CN114571451A (zh) * 2022-02-25 2022-06-03 山东新一代信息产业技术研究院有限公司 一种可调漏斗边界的自适应滑模控制方法及设备
CN114536338A (zh) * 2022-03-03 2022-05-27 深圳亿嘉和科技研发有限公司 一种液压机械臂的控制方法
CN114536338B (zh) * 2022-03-03 2023-09-26 深圳亿嘉和科技研发有限公司 一种液压机械臂的控制方法
CN115122335A (zh) * 2022-07-29 2022-09-30 华南理工大学 基于外环速度补偿的封闭机器人任务空间学习控制方法、存储介质及机器人
CN115609592A (zh) * 2022-11-22 2023-01-17 季华实验室 一种机械臂自适应跟踪控制方法
CN115847404A (zh) * 2022-11-28 2023-03-28 燕山大学 一种基于复合学习的受限机械臂有限时间控制方法
CN115857342A (zh) * 2022-11-28 2023-03-28 北京理工大学 基于自适应神经网络的航天器观测载荷随动机构控制方法
CN115857342B (zh) * 2022-11-28 2024-05-24 北京理工大学 基于自适应神经网络的航天器观测载荷随动机构控制方法
CN115847404B (zh) * 2022-11-28 2024-07-05 燕山大学 一种基于复合学习的受限机械臂有限时间控制方法
CN116339141A (zh) * 2023-03-10 2023-06-27 山东科技大学 一种机械臂全局固定时间轨迹跟踪滑模控制方法
CN116339141B (zh) * 2023-03-10 2023-10-03 山东科技大学 一种机械臂全局固定时间轨迹跟踪滑模控制方法
CN117283565A (zh) * 2023-11-03 2023-12-26 安徽大学 一种基于Actor-Critic网络全状态反馈的柔性关节机械臂控制方法
CN117283565B (zh) * 2023-11-03 2024-03-22 安徽大学 一种基于Actor-Critic网络全状态反馈的柔性关节机械臂控制方法
CN117681212A (zh) * 2024-02-01 2024-03-12 安徽大学 基于动力学参数辨识和快速终端滑模协作机器人控制方法
CN117681212B (zh) * 2024-02-01 2024-05-14 安徽大学 基于动力学参数辨识和快速终端滑模协作机器人控制方法

Also Published As

Publication number Publication date
CN111496792B (zh) 2021-06-01

Similar Documents

Publication Publication Date Title
CN111496792B (zh) 一种机械臂输入饱和固定时间轨迹跟踪控制方法及***
Ling et al. Adaptive fuzzy dynamic surface control of flexible-joint robot systems with input saturation
Zhao et al. Neuroadaptive robotic control under time-varying asymmetric motion constraints: A feasibility-condition-free approach
CN108942924B (zh) 基于多层神经网络的模型不确定性机械臂运动控制方法
Peters et al. Reinforcement learning by reward-weighted regression for operational space control
Peng et al. Neural-learning-based force sensorless admittance control for robots with input deadzone
CN111596545B (zh) 一种多输入多输出机械***自适应容错预设性能控制方法
Qi et al. Stable indirect adaptive control based on discrete-time T–S fuzzy model
CN113589689B (zh) 一种基于多参数自适应神经网络的滑模控制器设计方法
CN109352656B (zh) 一种具有时变输出约束的多关节机械臂控制方法
CN108555914B (zh) 一种基于腱驱动灵巧手的dnn神经网络自适应控制方法
CN111702767A (zh) 一种基于反演模糊自适应的机械手阻抗控制方法
Zhang Integral barrier Lyapunov functions-based neural control for strict-feedback nonlinear systems with multi-constraint
Chen et al. Novel adaptive neural networks control with event-triggered for uncertain nonlinear system
CN113219825B (zh) 一种四足机器人单腿轨迹跟踪控制方法及***
Miao et al. DOPH∞-based path-following control for underactuated marine vehicles with multiple disturbances and constraints
CN109249393B (zh) 一种基于经验控制的多参数机器人实时行为校正方法
Yovchev et al. Constrained output iterative learning control
CN116175588A (zh) 一种机器人自适应神经滑模控制方法、设备及介质
An et al. Fast model-free learning for controlling a quadrotor UAV with designed error trajectory
CN114859725A (zh) 一种非线性***自适应事件触发控制方法及***
Roveda et al. Cartesian tasks oriented friction compensation through a reinforcement learning approach
Sun et al. Stable neuro-adaptive control for robots with the upper bound estimation on the neural approximation errors
Chen et al. Neural network compensator-based robust iterative learning control scheme for mobile robots nonlinear systems with disturbances and uncertain parameters
CN113238482B (zh) 一种单臂机器人***的渐近跟踪控制方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant