CN112148036B - 网络化机器人***的固定时间估计器的双边跟踪控制方法 - Google Patents

网络化机器人***的固定时间估计器的双边跟踪控制方法 Download PDF

Info

Publication number
CN112148036B
CN112148036B CN202010953886.7A CN202010953886A CN112148036B CN 112148036 B CN112148036 B CN 112148036B CN 202010953886 A CN202010953886 A CN 202010953886A CN 112148036 B CN112148036 B CN 112148036B
Authority
CN
China
Prior art keywords
robot
fixed time
time
control
estimator
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN202010953886.7A
Other languages
English (en)
Other versions
CN112148036A (zh
Inventor
梁昌铎
苏鹏
葛明峰
丁腾飞
葛子月
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Geosciences
Original Assignee
China University of Geosciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Geosciences filed Critical China University of Geosciences
Priority to CN202010953886.7A priority Critical patent/CN112148036B/zh
Publication of CN112148036A publication Critical patent/CN112148036A/zh
Application granted granted Critical
Publication of CN112148036B publication Critical patent/CN112148036B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D3/00Control of position or direction
    • G05D3/12Control of position or direction using feedback

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明公开了网络化机器人***的固定时间估计器的双边跟踪控制方法,实施本发明的有益效果在于实现了网络化机器人***固定时间内的双边跟踪控制。首先,本发明将双边跟踪控制方法推广到了网络化机器人***,主要应用于网络化机器人***分成两组执行相反任务等实际问题;其次,本发明提出了一种研究复杂机器人***的固定时间控制框架,使得完成控制目标所需的时间具有明确可知的范围,增加了控制的余量;最后,考虑了带有外部扰动和不确定控制参数机器人动力学模型,模拟网络化机器人***在工况下可能受到干扰的情况,使控制效果更具实用性。

Description

网络化机器人***的固定时间估计器的双边跟踪控制方法
技术领域
本发明涉及机器人智能控制领域,更具体地说,涉及一种网络化机器人***的固定时间估计器的双边跟踪控制方法。
背景技术
近年来,网络化机器人***的协同控制研究进展迅速。网络化机器人***是一组可控的自主机器人,能够通过局部通信完成单个或者多个复杂的任务。相比于单个机器人,网络化机器人***能够完成更加复杂的任务,并且使用更为有效和灵活的方式。因此,网络化机器人***的控制广泛应用在工业生产、医疗、航空航天、深海勘探和军事等各个领域。
此外,以网络化机器人***为载体的多智能体的分布式控制算法也得到了广泛的应用,其中受到学者广泛研究的控制方法有单目标和多目标的跟踪控制方法、编队和包含的控制方法、包含竞争和合作关系的双边跟踪控制方法等。由于在现实的网络化机器人***中,机器人之间联系既有合作也有竞争的关系。因此,本专利考虑的控制方法便有效地解决了此类的双边跟踪问题,具有较好地实际应用价值。
在现实的网络化***中,我们通常需要机器人在设定的时间范围之内完成任务以提高完成任务的效率和精确度。因此,控制所需的收敛时间也是一个很重要的控制性能。其中,以有限时间控制和固定时间控制发展最为迅速。两者的区别在于有限时间控制的收敛时间取决于初始值,而固定时间控制的收敛时间不受初值的影响。本专利使用了基于固定时间估计器的控制方法。在估计层中使用了一种时基信号发生器的方法。通过调节带有时基信号发生器的增益来实现固定时间内的收敛。该方法能够控制机器人在确定的时间范围内完成任务,增加了控制的余量。
因此,结合上述的工业实际应用上的需求,设计一种适用于网络化机器人***的基于固定时间估计器的双边跟踪控制方法具有重要意义。
发明内容
本发明要解决的技术问题在于,针对现有技术中较少考虑的机器人间合作与竞争关系的双边跟踪问题与固定时间内完成控制任务的问题,提供一种网络化机器人***的固定时间估计器的双边跟踪控制方法。
本发明解决其技术问题所采用的技术方案是:构造一种网络化机器人***的固定时间估计器的双边跟踪控制方法,包括以下步骤:
S1、对于包含N个机器人的网络化机器人***中的第i个机器人进行动力学建模,并构建动力学模型:
Figure GDA0003098622470000021
其中,Mi(qi)表示正定惯性矩阵,
Figure GDA0003098622470000022
表示科里奥利离心矩阵,gi(qi)表示引力矩阵,di(t)表示输入扰动,τi表示控制输入;qi
Figure GDA0003098622470000023
Figure GDA0003098622470000024
分别表示第i个机器人在关节空间中的位置、速度和加速度;t表示时间;i表示机器人的编号;
将第i+1个机器人设为跟踪目标,跟踪目标的状态信息包括位置q0、速度v0和加速度u0,满足
Figure GDA0003098622470000025
S2、建立有向符号拓扑图G={V,E,A}描述机器人之间的信息交互关系,其中V={1,...,N}表示由N个机器人构成的顶点集,顶点用来表示各个机器人;
Figure GDA0003098622470000031
表示连接任意两个机器人的边的集合,用来表示机器人间交互信息的方向;A=[aij]表示由邻接元素构成的权重矩阵,用来表示机器人间交互信息的数值;若第j个机器人与第i个机器人之间有交互且为合作关系,则aij>0;若第j个机器人与第i个机器人之间有交互且为竞争关系,则aij<0,否则,aij=0;且第i个机器人本身不存在自循环连接,即aii=0;
定义对角矩阵D=diag(d1,d2,...dN),di∈{±1},满足DAD为半正定矩阵,并将所有机器人分成两部分分别执行相反的任务;当机器人属于第一组时,di=1;当机器人属于第二组时,di=-1;在有向符号拓扑图G中加入跟踪目标机器人,并将该图定义为增广图
Figure GDA0003098622470000032
用矩阵B=[ai0]表示虚拟领导者与机器人间的信息交互的数值,若虚拟领导者与机器人间有交互,则ai0>0;若虚拟领导者与机器人间无交互,则ai0=0。
S3、根据步骤S1建立的机器人动力学模型和S2建立的有向符号拓扑图,设计基于固定时间估计器的分布式控制器;
所述分布式控制器包括固定时间的本地控制层和固定时间的估计层;
所述固定时间的估计层用于得到所述第i个机器人的关节位置和速度的估计值,通过第i个机器人与其相邻的机器人所处位置信息、运动速度的信息和信息交互的数值得出;
所述第i个机器人的关节位置和速度的估计值将进一步输入到固定时间的本地控制层,该控制层用于使得第i个机器人的实际关节位置和速度收敛到固定时间估计层所得的估计值。
S4、由固定时间的估计层和固定时间的本地控制层所组成的双层控制结构,控制所述第i个机器人的实际关节位置和速度达到预期的关节位置和速度,从而实现网络化机器人***的双边跟踪控制。
进一步地,对步骤S3中固定时间的估计层,设计相应的固定时间的控制增益η1(t)、η2(t),主要通过时基信号发生器TBG实现固定时间,具体分为两步:
设计TBG函数:
Figure GDA0003098622470000041
TBG函数是分段的时变函数,tf是人为设定的收敛时间点,通过设计该函数控制所需的收敛时间在tf之内;
设计包含TBG函数的控制增益函数:
Figure GDA0003098622470000042
Figure GDA0003098622470000043
其中,δ1,δ2为正常数,满足0<δ12≤1,MD=DAD+B,In为n维的单位矩阵,H为正定的对角矩阵,使得MDH为正定的矩阵,hmax表示H矩阵对角元素中的最大值,
Figure GDA0003098622470000044
表示矩阵
Figure GDA0003098622470000045
的最小特征值。
进一步地,对步骤S1中所需的第i个机器人在关节空间中的位置qi和速度
Figure GDA0003098622470000046
设计固定时间的状态估计器,其数学形式为:
Figure GDA0003098622470000047
其中,
Figure GDA0003098622470000048
为机器人i和j在关节空间中对位置的估计量;
Figure GDA0003098622470000049
为机器人i和j在关节空间中对速度的估计量,c1、c2为常数控制增益,固定时间的控制增益分别为η1(t)和η2(t);
再结合固定时间的状态估计器的位置误差
Figure GDA0003098622470000051
和速度误差
Figure GDA0003098622470000052
其中
Figure GDA0003098622470000053
所述固定时间的状态估计器的数学形式转化为:
Figure GDA0003098622470000054
进一步地,对步骤S1中所得的动力学模型设计固定时间的滑模面si来辅助设计关节空间的控制器τi,所述固定时间的滑模面si的数学表达式为:
Figure GDA0003098622470000055
其中,估计值和真实值之间的位置误差
Figure GDA0003098622470000056
和速度误差
Figure GDA0003098622470000057
分别为
Figure GDA0003098622470000058
Figure GDA0003098622470000059
K1i、K2i分别为正定的对角矩阵,
Figure GDA00030986224700000510
n为机器人的关节数目,
Figure GDA00030986224700000511
0<Δ≤1,0<p<1,
Figure GDA00030986224700000512
Figure GDA00030986224700000513
进一步地,对步骤S1中所得的动力学模型设计固定时间的关节空间的控制器τi的数学表达式为:
Figure GDA00030986224700000514
其中,τi由三个部分构成:τi0表示于机器人动力学模型相关的等效控制项,τi1表示固定时间控制效果的非线性项,τi2表示用来抵消外部扰动的控制项;
Figure GDA0003098622470000061
为固定时间控制器得到的关节速度的估计值;Mi0、Ci0、gi0分别为Mi、Ci、gi的预期值;k、b0、b1、b2为正常数;
Figure GDA0003098622470000062
Figure GDA0003098622470000063
函数对变量
Figure GDA0003098622470000064
的偏导并将列向量的形式转为对角矩阵的形式,
Figure GDA0003098622470000065
Figure GDA0003098622470000066
函数对变量
Figure GDA0003098622470000067
的偏导并将列向量的形式转化为对角矩阵的形式。
进一步地,步骤S3中具体为:
S31、将所述固定时间的关节空间的控制器τi代入S1中构建的动力学模型,再加上所述固定时间的状态估计器,得到如下的闭环***:
Figure GDA0003098622470000068
其中,K0i为正定的对角矩阵,r为常数满足r>1,ρ(t)为机器人动力学模型中的扰动项和不确定项,
Figure GDA0003098622470000069
ΔMi(qi)、
Figure GDA00030986224700000610
Δgi(qi)分别为Mi(qi)、
Figure GDA00030986224700000611
gi(qi)项的不确定性,di(t)为扰动项;
S32、分析S31中所述闭环***中固定时间的状态估计器的稳定性;
对于闭环***中机器人的位置和速度的误差构造李雅普诺夫函数:
Figure GDA00030986224700000612
Figure GDA00030986224700000613
其中,
Figure GDA0003098622470000071
Figure GDA0003098622470000072
N为网络化机器人***中机器人的个数;
对所述李雅普诺夫函数对时间进行求导得:
Figure GDA0003098622470000073
Figure GDA0003098622470000074
因此,由TBG函数的相关引理,得出位置和速度的误差在设定的时间范围内能够收敛至可调节的界内,满足:
Figure GDA0003098622470000075
Figure GDA0003098622470000076
Figure GDA0003098622470000077
Figure GDA0003098622470000078
其中,δ1、δ2为自主设定用来调节误差范围的常数,Tf1、Tf2分别为位置估计器和速度估计器中TBG函数中设定的时间,使得控制的时间在设定的时间范围内,即完成了固定时间状态估计器的稳定性分析;
S33、分析S31所述闭环***中机器人动力学状态控制器(固定时间的关节空间的控制器)的稳定性;
对固定时间的滑模面si构造李雅普诺夫函数
Figure GDA0003098622470000079
并沿着所述的闭环***的轨迹求导得
Figure GDA00030986224700000710
再令
Figure GDA00030986224700000711
得到
Figure GDA00030986224700000712
代入上式得
Figure GDA0003098622470000081
根据固定时间的引理,得出
Figure GDA0003098622470000082
之内,si=0;所以关节位置和速度的误差***的动力学转变为
Figure GDA0003098622470000083
进而,分两种情况讨论
Figure GDA0003098622470000084
收敛至设定的微小常数Δ所需的时间。
Figure GDA0003098622470000085
选择李雅普诺夫函数
Figure GDA0003098622470000086
对时间进行求导得
Figure GDA0003098622470000087
Figure GDA0003098622470000088
选择李雅普诺夫函数Vca2同上式,对时间进行求导得
Figure GDA0003098622470000089
因此,得出在
Figure GDA00030986224700000810
时间内,误差
Figure GDA00030986224700000811
进一步地,步骤S4中,根据所述固定时间的估计层和固定时间的本地控制层所组成的双层控制结构分别对所述闭环***进行固定时间状态估计器的分析和机器人动力学状态控制器(即固定时间的关节空间的控制器)的分析,得到在设定的时间Tf1+Tf2+Ts+Te之内,当机器人i属于第一组内:位置状态
Figure GDA00030986224700000812
即qi趋近于
Figure GDA00030986224700000813
趋近于q0,速度状态
Figure GDA00030986224700000814
即vi趋近于
Figure GDA00030986224700000815
趋近于v0;当机器人i属于第二组内:位置状态
Figure GDA00030986224700000816
即qi趋近于
Figure GDA00030986224700000817
趋近于-q0,速度状态
Figure GDA00030986224700000818
即vi趋近于
Figure GDA00030986224700000819
趋近于-v0,从而实现了网络化机器人***的双边跟踪控制。
综上,在本发明所述的网络化机器人***的固定时间估计器的双边跟踪控制方法,通过分层的控制结构得以实现,定义了一个固定时间的估计层和对于机器人的本地控制层,在考虑到机器人之间的既有合作也有竞争的关系,在固定时间的估计层中,所述估计层用于简化控制过程所需的复杂数据并且实现固定时间内的收敛,增加了控制的余量;设计了本地控制层,通过滑模面的辅助设计使得机器人能够在固定时间内跟踪到估计值,在估计层和控制层联合作用的情况下,对相应的机器人的动力学模型进行精准测量,并通过步骤S32和S33的稳定性分析,进一步提高了测准精度,减少了多机器人***的控制成本,提升了工作效率。
实施本发明的一种适用于网络化机器人***的基于固定时间估计器的双边跟踪控制方法具有以下有益效果:
1、考虑了机器人动力学模型中存在模型参数的变化和外部扰动等实际问题,研究成果的实用性更强;
2、在机器人之间的信息交互中考虑了合作与竞争并存的情况,使本发明的双边跟踪控制方法具有普遍的适用性;
3、所设计的控制算法包含两层控制,减少了多机器人***的控制成本,并提升了工作效率。
附图说明
下面将结合附图及实施例对本发明作进一步说明,附图中:
图1是本发明提出的控制方法的控制流程图;
图2是本发明所涉及的网络化机器人***的有向拓扑网络;
图3是本发明所考虑的机器人物理结构简易模型;
图4是本发明所涉及的网络化机器人***的实际位置和估计位置的轨迹跟踪图;
图5是本发明所涉及的网络化机器人***的实际速度和估计速度的轨迹跟踪图;
图6是本发明所涉及的网络化机器人***的实际的位置跟踪误差图;
图7是本发明所涉及的网络化机器人***的估计器的位置跟踪误差图;
图8是本发明所涉及的网络化机器人***的本地控制层的位置跟踪误差图;
图9是本发明所涉及的网络化机器人***的实际的速度跟踪误差图。
具体实施方式
为了对本发明的技术特征、目的和效果有更加清楚的理解,现对照附图详细说明本发明的具体实施方式。
请参考图1,其为本发明提出的控制方法的控制流程图,具体包括以下步骤:
S1、对于包含N个机器人的网络化机器人***中的第i个机器人(具体请参考图3)进行动力学建模,并构建动力学模型:
Figure GDA0003098622470000101
其中,Mi(qi)表示正定惯性矩阵,
Figure GDA0003098622470000102
表示科里奥利离心矩阵,gi(qi)表示引力矩阵,di(t)表示输入扰动,τi表示控制输入;qi
Figure GDA0003098622470000103
Figure GDA0003098622470000104
分别表示第i个机器人在关节空间中的位置、速度和加速度;t表示时间;i表示机器人的索引标记即指代的第i个机器人;
下表给出机械臂的各项物理参数,k∈{1,2}。
Figure GDA0003098622470000105
Figure GDA0003098622470000111
将这些物理参数代入动力学模型的中间变量中,如下给出中间变量的表达式:
Figure GDA0003098622470000112
p2=m2r1r2
Figure GDA0003098622470000113
p4=p3+I2,p5=(m1+m2)r1g,p6=m2r2g。
进一步求得动力学模型所需的矩阵,给出矩阵的表达式:
Figure GDA0003098622470000114
Figure GDA0003098622470000115
Figure GDA0003098622470000116
跟踪目标的状态信息包括位置q0、速度v0和加速度u0,满足
Figure GDA0003098622470000117
Figure GDA0003098622470000118
选取
Figure GDA0003098622470000119
S2、建立有向符号拓扑图G={V,E,A}来描述机器人之间的信息交互关系,其中V={1,...,N}表示由N个机器人构成的顶点集,顶点即机器人;
Figure GDA00030986224700001110
表示连接任意两个机器人的边的集合,用来表示机器人间交互信息的方向;A=[aij]表示由邻接元素构成的权重矩阵,用来表示机器人间交互信息的数值;若第j个机器人与第i个机器人之间有交互且为合作关系,则aij>0;若第j个机器人与第i个机器人之间有交互且为竞争关系,则aij<0,否则,aij=0;且第i个机器人本身不存在自循环连接,即aii=0。定义对角矩阵D=diag(d1,d2,...dN),di∈{±1},使得DAD为半正定矩阵,并将所有机器人分成两部分分别执行相反的任务。当机器人属于第一组时,di=1;当机器人属于第二组时,di=-1。定义为增广图
Figure GDA0003098622470000121
为有向符号拓扑图G中加入虚拟领导者,即跟踪目标。用矩阵B=[ai0]表示虚拟领导者与机器人间的信息交互的数值。若虚拟领导者与机器人间有交互,则ai0>0;若虚拟领导者与机器人间无交互,则ai0=0。请参考图2,将机器人1-8分为两组,并加入虚拟领导者机器人0,机器人1-4属于子网络A,机器人5-8属于子网络B,机器人在组内是合作关系,在组间是竞争关系。
S3、根据步骤S1建立的机器人动力学模型和S2建立的有向符号拓扑图,设计基于固定时间估计器的分布式控制器;
所述分布式控制器包括固定时间的本地控制层和固定时间的估计层;
所述固定时间的估计层用于得到所述第i个机器人的关节位置和速度的估计值,通过第i个机器人与其相邻的机器人所处位置信息、运动速度的信息和信息交互的数值得出;
所述第i个机器人的关节位置和速度的估计值将进一步输入到固定时间的本地控制层,该控制层用于使得第i个机器人的实际关节位置和速度收敛到固定时间估计层所得的估计值。
S4、由固定时间的估计层和固定时间的本地控制层所组成的双层控制结构,控制所述第i个机器人的实际关节位置和速度达到预期的关节位置和速度,从而实现网络化机器人***的双边跟踪控制。
对步骤S3中固定时间的估计层,设计相应的固定时间的控制增益η1(t)、η2(t),主要通过时基信号发生器TBG实现固定时间,具体分为两步:
设计TBG函数:
Figure GDA0003098622470000131
TBG函数是分段的时变函数,tf是人为设定的收敛时间点,通过设计该函数控制所需的收敛时间在tf之内;
设计包含TBG函数的控制增益函数:
Figure GDA0003098622470000132
Figure GDA0003098622470000133
其中,δ1,δ2为正常数,满足0<δ12≤1,MD=DAD+B,In为n维的单位矩阵,H为正定的对角矩阵,使得MDH为正定的矩阵,hmax表示H矩阵对角元素中的最大值,
Figure GDA0003098622470000134
表示矩阵
Figure GDA0003098622470000135
的最小特征值。
对步骤S1中所需的第i个机器人在关节空间中的位置qi和速度
Figure GDA00030986224700001312
设计固定时间的状态估计器,其数学形式为:
Figure GDA0003098622470000136
其中,
Figure GDA0003098622470000137
为机器人i和j在关节空间中对位置的估计量;
Figure GDA0003098622470000138
为机器人i和j在关节空间中对速度的估计量,c1、c2为常数控制增益,固定时间的控制增益分别为η1(t)和η2(t);
再结合固定时间的状态估计器的位置误差
Figure GDA0003098622470000139
和速度误差
Figure GDA00030986224700001310
其中
Figure GDA00030986224700001311
所述固定时间的状态估计器的数学形式转化为:
Figure GDA0003098622470000141
对步骤S1中所得的动力学模型设计固定时间的滑模面si来辅助设计关节空间的控制器τi,所述固定时间的滑模面si的数学表达式为:
Figure GDA0003098622470000142
其中,估计值和真实值之间的位置误差
Figure GDA0003098622470000143
和速度误差
Figure GDA0003098622470000144
分别为
Figure GDA0003098622470000145
Figure GDA0003098622470000146
K1i、K2i分别为正定的对角矩阵,
Figure GDA0003098622470000147
n为机器人的关节数目,
Figure GDA0003098622470000148
0<Δ≤1,0<p<1,
Figure GDA0003098622470000149
Figure GDA00030986224700001410
对步骤S1中所得的动力学模型设计固定时间的关节空间的控制器τi的数学表达式为:
Figure GDA00030986224700001411
其中,τi由三个部分构成:τi0表示于机器人动力学模型相关的等效控制项,τi1表示固定时间控制效果的非线性项,τi2表示用来抵消外部扰动的控制项;
Figure GDA00030986224700001412
为固定时间控制器得到的关节速度的估计值;Mi0、Ci0、gi0分别为Mi、Ci、gi的预期值;k、b0、b1、b2为正常数;
Figure GDA0003098622470000151
Figure GDA0003098622470000152
函数对变量
Figure GDA0003098622470000153
的偏导并将列向量的形式转为对角矩阵的形式,
Figure GDA0003098622470000154
Figure GDA0003098622470000155
函数对变量
Figure GDA0003098622470000156
的偏导并将列向量的形式转化为对角矩阵的形式。
步骤S3中具体为:
S31、将所述固定时间的关节空间的控制器τi代入S1中构建的动力学模型,再加上所述固定时间的状态估计器,得到如下的闭环***:
Figure GDA0003098622470000157
其中,K0i为正定的对角矩阵,r为常数满足r>1,ρ(t)为机器人动力学模型中的扰动项和不确定项,
Figure GDA0003098622470000158
ΔMi(qi)、
Figure GDA0003098622470000159
Δgi(qi)分别为Mi(qi)、
Figure GDA00030986224700001510
gi(qi)项的不确定性,di(t)为扰动项;
S32、分析S31中所述闭环***中固定时间的状态估计器的稳定性;
对于闭环***中机器人的位置和速度的误差构造李雅普诺夫函数:
Figure GDA00030986224700001511
Figure GDA00030986224700001512
其中,
Figure GDA00030986224700001513
Figure GDA00030986224700001514
N为网络化机器人***中机器人的个数;
对所述李雅普诺夫函数对时间进行求导得:
Figure GDA0003098622470000161
Figure GDA0003098622470000162
因此,由TBG函数的相关引理,得出位置和速度的误差在设定的时间范围内能够收敛至可调节的界内,满足:
Figure GDA0003098622470000163
Figure GDA0003098622470000164
Figure GDA0003098622470000165
Figure GDA0003098622470000166
其中,δ1、δ2为自主设定用来调节误差范围的常数,Tf1、Tf2分别为位置估计器和速度估计器中TBG函数中设定的时间,使得控制的时间在设定的时间范围内,即完成了固定时间状态估计器的稳定性分析;
S33、分析S31所述闭环***中机器人动力学状态控制器(固定时间的关节空间的控制器)的稳定性;
对固定时间的滑模面构造李雅普诺夫函数
Figure GDA0003098622470000167
并沿着所述的闭环***的轨迹求导得
Figure GDA0003098622470000168
再令
Figure GDA0003098622470000169
得到
Figure GDA00030986224700001610
代入上式得
Figure GDA00030986224700001611
根据固定时间的引理,得出
Figure GDA00030986224700001612
之内,si=0;所以位置和速度的误差***的动力学转变为
Figure GDA0003098622470000171
进而,分两种情况讨论
Figure GDA0003098622470000172
收敛至设定的微小常数Δ所需的时间。
Figure GDA0003098622470000173
选择关节位置的误差
Figure GDA00030986224700001720
李雅普诺夫函数
Figure GDA0003098622470000174
对时间进行求导得
Figure GDA0003098622470000175
Figure GDA0003098622470000176
选择关节位置的误差
Figure GDA0003098622470000177
李雅普诺夫函数Vca2同上式,对时间进行求导得
Figure GDA0003098622470000178
因此,得出在
Figure GDA0003098622470000179
时间内,误差
Figure GDA00030986224700001710
步骤S4中,根据所述固定时间的估计层和固定时间的本地控制层所组成的双层控制结构分别对所述闭环***进行固定时间状态估计器的分析和机器人动力学状态控制器(即固定时间的关节空间的控制器)的分析,得到在设定的时间Tf1+Tf2+Ts+Te之内,当机器人i属于第一组内:位置状态
Figure GDA00030986224700001711
即qi趋近于
Figure GDA00030986224700001712
趋近于q0,速度状态
Figure GDA00030986224700001713
即vi趋近于
Figure GDA00030986224700001714
趋近于v0;当机器人i属于第二组内:位置状态
Figure GDA00030986224700001715
即qi趋近于
Figure GDA00030986224700001716
趋近于-q0,速度状态
Figure GDA00030986224700001717
即vi趋近于
Figure GDA00030986224700001718
趋近于-v0,从而实现了网络化机器人***的双边跟踪控制。
其中,所需要的控制参数如下:p=0.5,q=1.2,r=1.5,k=1,b0=12,b1=2.8,b2=0.5,δ1=0.01,δ2=0.01,c1=0.01,c2=1,K0i=diag(4,3),K1i=diag(2,2),K2i=diag(2,2),
Figure GDA00030986224700001719
仿真结果请参考图4至图9。
其中,图4是本发明所涉及的网络化机器人***的实际位置和估计位置的轨迹跟踪图,该图分别表示所提出的控制方法能够使得机器人关节的位置能够在固定时间内达到预期的位置和所提出的固定时间的估计层能够使得所估计的机器人关节的位置在固定时间内达到预期的位置;
图5是本发明所涉及的网络化机器人***的实际速度和估计速度的轨迹跟踪图,该图分别表示所提出的控制方法能够使得机器人关节的速度能够在固定时间内达到预期的速度和所提出的固定时间的估计层能够使得所估计的机器人关节的速度在固定时间内达到预期的速度;
图6是本发明所涉及的网络化机器人***的实际的位置跟踪误差图,该图表示实际的位置跟踪误差能在固定时间内趋于0;
图7是本发明所涉及的网络化机器人***的估计器的位置跟踪误差图,该图表示固定时间估计层的位置跟踪误差能在固定时间内趋于0;
图8是本发明所涉及的网络化机器人***的本地控制层的位置跟踪误差图,该图表示本地控制层的位置跟踪误差能在固定时间内趋于0;
图9是本发明所涉及的网络化机器人***的实际的速度跟踪误差图,该图表示实际的速度跟踪误差能在固定时间内趋于0。
本发明提出了一种适用于网络化机器人***的基于固定时间估计器的双边跟踪控制算法,其中同时考虑了机器人间合作与竞争的关系、机器人模型中存在的外部扰动和模型参数变化的实际情况。运用本发明所设计的基于固定时间估计器的双边跟踪控制方法具备以下优点:
1、考虑了机器人动力学模型中存在模型参数的变化和外部扰动等实际问题,研究成果的实用性更强;
2、在机器人之间的信息交互中考虑了合作与竞争并存的情况,使本发明的双边跟踪控制方法具有普遍的适用性;
3、所设计的控制算法包含两层控制,减少了多机器人***的控制成本,并提升了工作效率。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。

Claims (6)

1.网络化机器人***的固定时间估计器的双边跟踪控制方法,其特征在于:具体包括以下步骤:
S1、对于包含N个机器人的网络化机器人***中的第i个机器人进行动力学建模,并构建动力学模型:
Figure FDA0003098622460000011
其中,Mi(qi)表示正定惯性矩阵,
Figure FDA0003098622460000012
表示科里奥利离心矩阵,gi(qi)表示引力矩阵,di(t)表示输入扰动,τi表示控制输入;qi
Figure FDA0003098622460000013
Figure FDA0003098622460000014
分别表示第i个机器人在关节空间中的位置、速度和加速度;t表示时间;i表示机器人的编号;
将第i+1个机器人设为跟踪目标,跟踪目标的状态信息包括位置q0、速度v0和加速度u0,满足
Figure FDA0003098622460000015
对所述动力学模型设计固定时间的滑模面si来辅助设计关节空间的控制器τi,所述固定时间的滑模面si的数学表达式为:
Figure FDA0003098622460000016
其中,估计值和真实值之间的位置误差
Figure FDA0003098622460000017
和速度误差
Figure FDA0003098622460000018
分别为
Figure FDA0003098622460000019
Figure FDA00030986224600000110
K1i、K2i分别为正定的对角矩阵,
Figure FDA00030986224600000111
n为机器人的关节数目,
Figure FDA00030986224600000112
Figure FDA00030986224600000113
Figure FDA00030986224600000114
S2、建立有向符号拓扑图G={V,E,A}描述机器人之间的信息交互关系,其中V={1,...,N}表示由N个机器人构成的顶点集,顶点用来表示各个机器人;
Figure FDA0003098622460000021
表示连接任意两个机器人的边的集合,用来表示机器人间交互信息的方向;A=[aij]表示由邻接元素构成的权重矩阵,用来表示机器人间交互信息的数值;若第j个机器人与第i个机器人之间有交互且为合作关系,则aij>0;若第j个机器人与第i个机器人之间有交互且为竞争关系,则aij<0,否则,aij=0;且第i个机器人本身不存在自循环连接,即aii=0;
定义对角矩阵D=diag(d1,d2,...dN),di∈{±1},满足DAD为半正定矩阵,并将所有机器人分成两部分分别执行相反的任务;当机器人属于第一组时,di=1;当机器人属于第二组时,di=-1;在有向符号拓扑图G中加入跟踪目标机器人,并将该图定义为增广图
Figure FDA0003098622460000022
用矩阵B=[ai0]表示虚拟领导者与机器人间的信息交互的数值,若虚拟领导者与机器人间有交互,则ai0>0;若虚拟领导者与机器人间无交互,则ai0=0;
S3、根据步骤S1建立的机器人动力学模型和S2建立的有向符号拓扑图,设计基于固定时间估计器的分布式控制器;
所述分布式控制器包括固定时间的本地控制层和固定时间的估计层;
所述固定时间的估计层用于得到所述第i个机器人的关节位置和速度的估计值,通过第i个机器人与其相邻的机器人所处位置信息、运动速度的信息和信息交互的数值得出;
所述第i个机器人的关节位置和速度的估计值将进一步输入到固定时间的本地控制层,该控制层用于使得第i个机器人的实际关节位置和速度收敛到固定时间估计层所得的估计值;
S4、由固定时间的估计层和固定时间的本地控制层所组成的双层控制结构,控制所述第i个机器人的实际关节位置和速度达到预期的关节位置和速度,从而实现网络化机器人***的双边跟踪控制。
2.根据权利要求1所述的网络化机器人***的固定时间估计器的双边跟踪控制方法,其特征在于:
对步骤S3中固定时间的估计层,设计相应的固定时间的控制增益η1(t)、η2(t),主要通过时基信号发生器TBG实现固定时间,具体分为两步:
设计TBG函数:
Figure FDA0003098622460000031
TBG函数是分段的时变函数,tf是人为设定的收敛时间点,通过设计该函数控制所需的收敛时间在tf之内;
设计包含TBG函数的控制增益函数:
Figure FDA0003098622460000032
Figure FDA0003098622460000033
其中,δ1,δ2为正常数,满足0<δ12≤1,MD=DAD+B,In为n维的单位矩阵,H为正定的对角矩阵,使得MDH为正定的矩阵,hmax表示H矩阵对角元素中的最大值,
Figure FDA0003098622460000034
表示矩阵
Figure FDA0003098622460000035
的最小特征值,
Figure FDA0003098622460000036
表示克罗内克积。
3.根据权利要求2所述的网络化机器人***的固定时间估计器的双边跟踪控制方法,其特征在于:
对步骤S1中所需的第i个机器人在关节空间中的位置qi和速度
Figure FDA0003098622460000037
设计固定时间的状态估计器,其数学形式为:
Figure FDA0003098622460000041
其中,
Figure FDA0003098622460000042
为机器人i和j在关节空间中对位置的估计量;
Figure FDA0003098622460000043
为机器人i和j在关节空间中对速度的估计量,c1、c2为常数控制增益,固定时间的控制增益分别为η1(t)和η2(t);
再结合固定时间的状态估计器的位置误差
Figure FDA0003098622460000044
和速度误差
Figure FDA0003098622460000045
其中
Figure FDA0003098622460000046
所述固定时间的状态估计器的数学形式转化为:
Figure FDA0003098622460000047
4.根据权利要求1所述的网络化机器人***的固定时间估计器的双边跟踪控制方法,其特征在于:
为步骤S1中所述的动力学模型设计固定时间的关节空间的控制器τi,其数学表达式为:
Figure FDA0003098622460000048
其中,τi由三个部分构成:τi0表示于机器人动力学模型相关的等效控制项,τi1表示固定时间控制效果的非线性项,τi2表示用来抵消外部扰动的控制项;
Figure FDA0003098622460000049
为固定时间控制器得到的关节速度的估计值;Mi0、Ci0、gi0分别为Mi、Ci、gi的预期值;k、b0、b1、b2为正常数;
Figure FDA0003098622460000051
Figure FDA0003098622460000052
函数对变量
Figure FDA0003098622460000053
的偏导并将列向量的形式转为对角矩阵的形式,
Figure FDA0003098622460000054
Figure FDA0003098622460000055
函数对变量
Figure FDA0003098622460000056
的偏导并将列向量的形式转化为对角矩阵的形式。
5.根据权利要求3所述的网络化机器人***的固定时间估计器的双边跟踪控制方法,其特征在于:
步骤S3具体包括:
S31、将所述固定时间的关节空间的控制器τi代入S1中构建的动力学模型,再加上所述固定时间的状态估计器,得到如下的闭环***:
Figure FDA0003098622460000057
其中,K0i为正定的对角矩阵,r为常数满足r>1,ρ(t)为机器人动力学模型中的扰动项和不确定项,
Figure FDA0003098622460000058
Figure FDA0003098622460000059
分别为
Figure FDA00030986224600000510
项的不确定性,di(t)为扰动项;
S32、分析S31中所述闭环***中固定时间的状态估计器的稳定性;
对于闭环***中机器人的位置和速度的误差构造李雅普诺夫函数:
Figure FDA00030986224600000511
Figure FDA00030986224600000512
其中,
Figure FDA0003098622460000061
Figure FDA0003098622460000062
N为网络化机器人***中机器人的个数;
将所述李雅普诺夫函数对时间进行求导得:
Figure FDA0003098622460000063
Figure FDA0003098622460000064
由TBG函数的相关引理,得出闭环***中机器人的位置和速度误差在设定的时间范围内能够收敛至可调节的界内,满足:
Figure FDA0003098622460000065
Figure FDA0003098622460000066
Figure FDA0003098622460000067
Figure FDA0003098622460000068
其中,δ1、δ2为自主设定用来调节误差范围的常数,Tf1、Tf2分别为位置估计器和速度估计器中TBG函数中设定的时间;
S33、分析S31中所述闭环***中固定时间的关节空间的控制器的稳定性;
对固定时间的滑模面si构造李雅普诺夫函数
Figure FDA0003098622460000069
并沿着si求导得
Figure FDA00030986224600000610
再令
Figure FDA00030986224600000611
得到
Figure FDA00030986224600000612
代入上式得
Figure FDA00030986224600000613
根据固定时间的引理,得出在
Figure FDA0003098622460000071
之内,si=0;所以关节位置和速度的误差***的动力学转变为
Figure FDA0003098622460000072
进而,分两种情况讨论
Figure FDA0003098622460000073
收敛至设定的趋近于零的常数Δ所需的时间;
Figure FDA0003098622460000074
对于关节位置的误差
Figure FDA0003098622460000075
选择李雅普诺夫函数
Figure FDA0003098622460000076
对时间进行求导得
Figure FDA0003098622460000077
Figure FDA0003098622460000078
对于关节位置的误差
Figure FDA0003098622460000079
选择李雅普诺夫函数Vca2同上式,对时间进行求导得
Figure FDA00030986224600000710
因此,得出在
Figure FDA00030986224600000711
时间内,误差
Figure FDA00030986224600000712
6.根据权利要求5所述的网络化机器人***的固定时间估计器的双边跟踪控制方法,其特征在于:
步骤S4中,根据所述固定时间的估计层和固定时间的本地控制层所组成的双层控制结构分别对所述闭环***进行固定时间状态估计器的分析和固定时间的关节空间的控制器的分析,得到在设定的时间Tf1+Tf2+Ts+Te之内,当机器人i属于第一组内:位置状态
Figure FDA00030986224600000713
即qi趋近于
Figure FDA00030986224600000714
Figure FDA00030986224600000715
趋近于q0,速度状态
Figure FDA00030986224600000716
即vi趋近于
Figure FDA00030986224600000717
Figure FDA00030986224600000718
趋近于v0;当机器人i属于第二组内:位置状态
Figure FDA00030986224600000719
即qi趋近于
Figure FDA00030986224600000720
Figure FDA00030986224600000721
趋近于-q0,速度状态
Figure FDA00030986224600000722
即vi趋近于
Figure FDA00030986224600000723
Figure FDA00030986224600000724
趋近于-v0,从而实现了网络化机器人***的双边跟踪控制。
CN202010953886.7A 2020-09-11 2020-09-11 网络化机器人***的固定时间估计器的双边跟踪控制方法 Expired - Fee Related CN112148036B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010953886.7A CN112148036B (zh) 2020-09-11 2020-09-11 网络化机器人***的固定时间估计器的双边跟踪控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010953886.7A CN112148036B (zh) 2020-09-11 2020-09-11 网络化机器人***的固定时间估计器的双边跟踪控制方法

Publications (2)

Publication Number Publication Date
CN112148036A CN112148036A (zh) 2020-12-29
CN112148036B true CN112148036B (zh) 2021-08-03

Family

ID=73890899

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010953886.7A Expired - Fee Related CN112148036B (zh) 2020-09-11 2020-09-11 网络化机器人***的固定时间估计器的双边跟踪控制方法

Country Status (1)

Country Link
CN (1) CN112148036B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113093554B (zh) * 2021-04-14 2022-07-05 西北工业大学 一种基于Time Base Generator的固定时间动态区域跟踪控制方法
CN113400299B (zh) * 2021-05-19 2022-05-03 中国地质大学(武汉) 网络化机器人协同控制方法、装置、设备及存储介质
CN113359781B (zh) * 2021-05-26 2022-07-19 中国地质大学(武汉) 网络化水面舰艇跟踪控制方法、装置、设备及存储介质
CN113625559A (zh) * 2021-07-28 2021-11-09 杭州电子科技大学 一种基于指定时间收敛的多智能体***协同控制方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108845493A (zh) * 2018-08-21 2018-11-20 曲阜师范大学 带有输出约束的机械臂***的固定时间跟踪控制方法
CN109471361A (zh) * 2018-12-17 2019-03-15 中国地质大学(武汉) 一种异构多机器人***的多目标跟踪控制方法
CN110083179A (zh) * 2019-05-07 2019-08-02 西北工业大学 一种预定时间多智能体***一致性跟踪控制方法
CN110221542A (zh) * 2019-06-04 2019-09-10 西北工业大学 一种二阶非线性多智能体***固定时间协同跟踪控制方法
CN111258214A (zh) * 2020-02-25 2020-06-09 西北工业大学 基于有向拓扑的高阶多智能体***固定时一致性跟踪方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150134386A1 (en) * 2013-11-08 2015-05-14 Prachi Prasad Jogalekar Collectively optimizing group schedules to minimize project completion time and cost
CN107888412A (zh) * 2016-11-08 2018-04-06 清华大学 多智能体网络有限时间包容控制方法及装置
US10353399B2 (en) * 2017-07-21 2019-07-16 AI Incorporated Polymorphic path planning for robotic devices
CN109407520B (zh) * 2018-12-26 2021-04-06 南京航空航天大学 基于滑模控制的二阶多智能体***的容错一致性控制算法
CN110119087B (zh) * 2019-05-05 2021-12-21 西北工业大学 一种有向通信下二阶多智能体***固定时一致性跟踪方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108845493A (zh) * 2018-08-21 2018-11-20 曲阜师范大学 带有输出约束的机械臂***的固定时间跟踪控制方法
CN109471361A (zh) * 2018-12-17 2019-03-15 中国地质大学(武汉) 一种异构多机器人***的多目标跟踪控制方法
CN110083179A (zh) * 2019-05-07 2019-08-02 西北工业大学 一种预定时间多智能体***一致性跟踪控制方法
CN110221542A (zh) * 2019-06-04 2019-09-10 西北工业大学 一种二阶非线性多智能体***固定时间协同跟踪控制方法
CN111258214A (zh) * 2020-02-25 2020-06-09 西北工业大学 基于有向拓扑的高阶多智能体***固定时一致性跟踪方法

Non-Patent Citations (8)

* Cited by examiner, † Cited by third party
Title
Adaptive finite-time cluster synchronization of neutral-type coupled neural networks with mixed delays;Juan-Juan He 等;《Neurocomputing》;Elsevier;20191204;第1-24页 *
Discrete-Communication-Based Bipartite Tracking of Networked Robotic Systems via Hierarchical Hybrid Control;Teng-Fei Ding 等;《IEEE Transactions on Circuits and Systems I: Regular Papers》;IEEE;20200110;第67卷(第4期);第1402-1412页 *
Multiple time-varying formation of networked heterogeneous robotic systems via estimator-based hierarchical cooperative algorithms;Ming-Feng Ge 等;《Complexity》;20200128;第1-26页 *
Multi-target tracking of networked heterogeneous collaborative robots in task space;Chang-Duo Liang 等;《Nonlinear Dynamics》;Springer;20190617;第97卷;第1159–1173页 *
Neural-Adaptive Finite-Time Formation Tracking Control of Multiple Nonholonomic Agents With a Time-Varying Target;Kai-Bo Zhou 等;《IEEE Access》;IEEE;20200415;第8卷;第62943-62953页 *
Output Multiformation Tracking of Networked Heterogeneous Robotic Systems via Finite-Time Hierarchical Control;Chang-Duo Liang 等;《IEEE Transactions on Cybernetics (Early Access)》;IEEE;20200210;第1-12页 *
基于切换拓扑的多智能体协作控制研究综述;谢光强 等;《计算机应用研究》;20180427;第36卷(第04期);第967-971页 *
非线性***有限时间控制研究综述;刘洋 等;《控制理论与应用》;20191023;第37卷(第01期);第1-12页 *

Also Published As

Publication number Publication date
CN112148036A (zh) 2020-12-29

Similar Documents

Publication Publication Date Title
CN112148036B (zh) 网络化机器人***的固定时间估计器的双边跟踪控制方法
CN110597061B (zh) 一种多智能体完全分布式自抗扰时变编队控制方法
CN109465825A (zh) 机械臂柔性关节的rbf神经网络自适应动态面控制方法
Wang et al. Neural network based adaptive dynamic surface control for cooperative path following of marine surface vehicles via state and output feedback
Mueller et al. Iterative learning of feed-forward corrections for high-performance tracking
CN110928310A (zh) 一种无人船领航跟随固定时间编队控制方法
CN105607473B (zh) 小型无人直升机的姿态误差快速收敛自适应控制方法
CN110989626B (zh) 一种基于控制参数化的无人机路径规划方法
CN110658821B (zh) 一种多机器人抗干扰分组时变编队控制方法及***
CN111752280A (zh) 一种基于有限时间不确定观测器的多无人船编队固定时间控制方法
CN113433955B (zh) 有向切换拓扑下多auv编队队形一致性控制方法
CN110471438B (zh) 一种刚性飞行器的固定时间自适应姿态跟踪控制方法
CN113268064B (zh) 一种考虑通信时延的多移动机器人协同编队控制方法
CN109976161A (zh) 一种不确定非线性***的有限时间优化跟踪控制方法
CN115793453A (zh) 融合ai深度学习的旋翼飞行器轨迹跟踪自适应控制方法
CN107703953B (zh) 一种无人机的姿态控制方法、装置、无人机及存储介质
Cisneros et al. Linear parameter-varying controller design for a nonlinear quad-rotor helicopter model for high speed trajectory tracking
CN114047773A (zh) 一种基于扩张状态观测器的水下集矿机器人反步滑模自适应姿态控制方法
CN114527795B (zh) 一种基于增量在线学习的飞行器智能控制方法
CN110488854B (zh) 一种基于神经网络估计的刚性飞行器固定时间姿态跟踪控制方法
CN117369495A (zh) 一种基于模型预测控制的无人机编队轨迹规划方法
Enjiao et al. Finite-time control of formation system for multiple flight vehicles subject to actuator saturation
CN110968961A (zh) 一种连续回转电液伺服马达参数辨识方法
CN113359439B (zh) 多智能体***有限时间多目标协同追踪方法和存储介质
CN115857501A (zh) 一种网络化多移动机器人分布式保性能包含控制方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20210803