CN110928185B - 一种多智能体***的量化控制方法 - Google Patents

一种多智能体***的量化控制方法 Download PDF

Info

Publication number
CN110928185B
CN110928185B CN201911159148.9A CN201911159148A CN110928185B CN 110928185 B CN110928185 B CN 110928185B CN 201911159148 A CN201911159148 A CN 201911159148A CN 110928185 B CN110928185 B CN 110928185B
Authority
CN
China
Prior art keywords
follower
order
ith
leader
error
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201911159148.9A
Other languages
English (en)
Other versions
CN110928185A (zh
Inventor
刘治
林壮壁
章云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong University of Technology
Original Assignee
Guangdong University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong University of Technology filed Critical Guangdong University of Technology
Priority to CN201911159148.9A priority Critical patent/CN110928185B/zh
Publication of CN110928185A publication Critical patent/CN110928185A/zh
Application granted granted Critical
Publication of CN110928185B publication Critical patent/CN110928185B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0265Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
    • G05B13/027Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion using neural networks only

Landscapes

  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明公开了一种多智能体***的量化控制方法,所述多智能体***包括一个领导者和N个跟随者;所述控制方法包括以下步骤:建立多智能体***的***模型,包括跟随者的***模型以及领导者的***模型;建立多智能体***的误差***,包括第i个跟随者与领导者输出之间的误差,以及第i个跟随者***的q阶状态与虚拟控制器之间的误差;设计多智能体***的控制器,包括为第i个跟随者设计第一个虚拟控制器至第q个虚拟控制器,然后为第i个跟随者设计控制输入。本发明解决了现有技术中不能保证在控制器与智能体之间带宽受限情况下的***稳定性的问题。

Description

一种多智能体***的量化控制方法
技术领域
本申请涉及多智能体一致性控制领域,具体涉及一种对不确定***结构的单领导者多智能体的量化控制方法。
背景技术
人们从自然界中生物的群集行为受到启发,提出了分布式的思想。分布式比起集中式有更高的鲁棒性,能以更少的资源代价完成更复杂的任务。为此,人们提出了多智能体***。多智能体***是指由多个智能体组合而成的***,其中每一个智能体都能独立作用于自身和环境,但却不需要全局的信息资源。
多智能体***的多智能体技术被广泛应用于智能机器人、智能交通、无人机编队控制、分布式预测、智能电网等方面,其中最受到关注的是多智能体的一致性控制问题。一致性是指随着时间的增大,多智能***中的所有个体的状态都趋于一个相同的值;一致性问题是多智能体***的根本性问题。
国内外已经有很多文献对多智能体的一致性控制进行了研究,实现了理想条件下各个跟随者对领导者的跟随。但是在很多实际应用中,智能体与控制器之间的通讯带宽是有限的,这导致智能体收到的控制信号并不是连续的和实时的,如果没有合适的调整与设计,***的稳定性就得不到保证。
发明内容
本申请的目的是提供一种多智能体***的量化控制方法,用以解决现有技术中不能保证在控制器与智能体之间带宽受限情况下的***稳定性的问题。
为了实现上述任务,本申请采用以下技术方案:
一种多智能体***的量化控制方法,所述多智能体***包括一个领导者和N个跟随者;所述控制方法包括以下步骤:
建立多智能体***的***模型,包括跟随者的***模型以及领导者的***模型;
建立多智能体***的误差***,包括第i个跟随者与领导者输出之间的误差,以及第i个跟随者的q阶状态与虚拟控制器之间的误差;
设计多智能体***的控制器,包括为第i个跟随者设计第一个虚拟控制器至第q个虚拟控制器,然后为第i个跟随者设计控制输入。
进一步地,所述跟随者的***模型表示为:
对于第i个跟随者,建立如下的***模型:
Figure BDA0002285592920000021
Figure BDA0002285592920000022
yi=xi,1,i=1,2,...N 式3
其中
Figure BDA0002285592920000023
xi,q
Figure BDA0002285592920000024
代表***的状态变量,其中,q为***状态变量的阶数,ni为第i个跟随者的总***阶数,参数上方加圆点表示该参数的导数,fi,q()和
Figure BDA0002285592920000025
代表未知但光滑的函数,Δi,q(t)和
Figure BDA0002285592920000026
代表未知时变干扰,Qi(ui)代表控制输入ui经过量化器后的输出,ui=ui(t)代表真实控制输入,yi代表每个跟随者的输出,N代表跟随者的个数。
进一步地,所述量化器的模型为:
Figure BDA0002285592920000031
其中量化器的量化等级为:
Figure BDA0002285592920000032
Figure BDA0002285592920000033
δi+,δi-∈(0,1)为可以选择的量化密度,
Figure BDA0002285592920000034
Figure BDA0002285592920000035
为死区参数,ui(t-)代表ui(t)上一时刻的状态,p=1,2,...为从1到正无穷的整数。
进一步地,所述领导者的***模型表示为:
Figure BDA0002285592920000036
y0=x0 式8
y0表示领导者的输出,
Figure BDA0002285592920000037
表示领导者的输出的导数,f0(x0,t)为一个已知的有界函数,即想要跟踪的领导者的输出的导数函数。
进一步地,所述第i个跟随者与领导者输出之间的误差,表示为:
Figure BDA0002285592920000038
其中i和j分别表示第i个和第j个跟随者,aij≥0为第i个跟随者收到的第j个跟随者的信息权重,bi≥0为第i个跟随者收到领导者的信息权重,aij和bi都是非负常数。
进一步地,所述i个跟随者的q阶状态与虚拟控制器之间的误差表示为:
si,q=xi,qi,q-1,q=2,...,ni 式10
其中αi,q-1为第i个跟随者的第q-1个虚拟控制器。
进一步地,所述第i个跟随者的第一个虚拟控制器表示为:
Figure BDA0002285592920000041
其中si,1为第i个跟随者***的1阶状态与虚拟控制器之间的误差,Si,1为径向基函数向量,Si,1=Si,1(Xi,1),Xi,1=[xi,1,xj,1]T,xi,1表示第i个跟随者的第1阶状态,xj,1、xj,2分别表示第j个跟随者的第1阶状态,
Figure BDA0002285592920000042
为自适应率,ci,1和ai,1为正的可调参数,
Figure BDA0002285592920000043
进一步地,所述第i个跟随者的第二个虚拟控制器表示为:
Figure BDA0002285592920000044
其中ci,2和ai,2为正的可调参数,si,2为第i个跟随者***的2阶状态与虚拟控制器之间的误差,Si,2为径向基函数向量,Si,2=Si,2(Xi,2)且
Figure BDA0002285592920000045
Figure BDA0002285592920000046
Figure BDA0002285592920000047
为自适应率;
第i个跟随者的第q个虚拟控制器表示为:
Figure BDA0002285592920000048
其中ci,q和ai,q为正的可调参数,其中Si,q为径向基函数向量,Si,q=Si,q(Xi,q)且
Figure BDA0002285592920000049
Figure BDA00022855929200000410
为自适应率,
Figure BDA00022855929200000411
Figure BDA00022855929200000412
xi,q、xj,q分别表示第i个跟随者、第j个跟随者***的q阶状态。
进一步地,所述第i个跟随者设计控制输入,表示为:
Figure BDA00022855929200000413
其中:
Figure BDA0002285592920000051
Figure BDA0002285592920000052
Figure BDA0002285592920000053
其中
Figure BDA0002285592920000054
ai,k,
Figure BDA0002285592920000055
ki,0,ki,1,gi,ri为正的可调参数,
Figure BDA0002285592920000056
si,k为第i个跟随者***的ni阶、k阶状态,
Figure BDA0002285592920000057
为径向基函数向量且
Figure BDA0002285592920000058
Figure BDA0002285592920000059
Figure BDA00022855929200000510
分别表示第i个跟随者、第j个跟随者***的ni阶状态,
Figure BDA00022855929200000511
Figure BDA00022855929200000512
的导数,
Figure BDA00022855929200000513
为自适应率
Figure BDA00022855929200000514
的导数。
进一步地,所述第i个跟随者通过获取领导者以及它所能获取的其他跟随者的信息,将输出之间的误差进行计算,计算出的一阶误差建立第一个虚拟控制器,然后通过第一个控制器与自身的第二阶状态进行对比,计算二阶误差,并建立第二个虚拟控制器,然后与第三阶状态进行对比,计算出三阶误差,计算第三个虚拟控制器;以此类推,直到最终得到ni阶误差,之后计算真正的输入ui;ui经过量化器模型,产生真正的量化控制信号Qi(ui),使用自适应率来对量化信号进行自适应,可以使得第i个跟随者跟随到领导者的输出,实现量化控制。
本申请与现有技术相比,具有以下技术特点:
1.本申请使用了神经网络对***里含有的不确定项和干扰信号进行估算,从而提供了一种含有不确定项和干扰信号的多智能体***控制方法,相比普通的多智能体***,有更广泛的应用和更好的实践效果,可以保证在不同通讯速率要求下的含有不确定项的多智能体***的稳定性。
2.本申请针对量化器的量化效果,对***的控制输入进行了调整,从而提供了一种量化控制方案,可以自行调节量化器的量化等级,来满足不同的通讯速率要求,并且不管量化器多么粗糙,始终能保证***的稳定性。
附图说明
图1为本申请的流程示意图;
图2为量化器的示意图。
具体实施方式
本申请公开了一种多智能体***的量化控制方法,用以实现在不同通讯速率要求限制下多智能体***的一致性控制。该方法为每一个具有严格反馈结构的跟随者多智能体设计对应的控制器;所述方法包括以下步骤:
步骤1,建立多智能体***的***模型,其中,所述多智能体***包括一个领导者和N个跟随者。
步骤1.1,建立跟随者的***模型
对于第i个跟随者,建立如下的***模型:
Figure BDA0002285592920000061
Figure BDA0002285592920000062
yi=xi,1,i=1,2,...N 式3
其中
Figure BDA0002285592920000063
xi,q
Figure BDA0002285592920000064
代表***的状态变量,其中,q为***状态变量的阶数,ni为第i个跟随者的总***阶数。参数上方加圆点表示该参数的导数,下同;fi,q()和
Figure BDA0002285592920000065
代表未知但光滑的函数,Δi,q(t)和
Figure BDA0002285592920000066
代表未知时变干扰,Qi(ui)代表控制输入ui经过量化器后的输出,ui=ui(t)代表真实控制输入,yi代表每个跟随者的输出,N代表跟随者的个数。
通过引入量化器,将输入进行量化,从而使多智能体***里的跟随者收到的控制信号不再是连续的,降低了通讯速率,可以通过调整量化器里面的量化等级参数,来满足不同的通讯速率要求。
量化器的模型为:
Figure BDA0002285592920000071
其中量化器的量化等级为:
Figure BDA0002285592920000072
Figure BDA0002285592920000073
如图2所示,δi+,δi-∈(0,1)为可以选择的量化密度,
Figure BDA0002285592920000074
Figure BDA0002285592920000075
为死区参数。
Figure BDA0002285592920000076
代表ui的导数。ui(t-)代表ui(t)上一时刻的状态,p=1,2,...为从1到正无穷的整数。
步骤1.2,建立领导者的***模型
领导者的***模型表示为:
Figure BDA0002285592920000077
y0=x0 式8
y0表示领导者的输出,下标0表示领导者,即领导者在多智能体***中的编号是0。
Figure BDA0002285592920000078
表示输出的导数,f0(x0,t)为一个已知的有界函数,即想要跟踪的领导者的输出的导数函数。在实际操作中,可以根据任意想要的输出轨迹给出,比如想要让所有的跟随者输出是一个正弦曲线,那他的导数就是余弦曲线。
通过步骤1建立了多智能体***的***模型,为后续的控制器设计提供基础。
步骤2,建立多智能体***的误差***。
本方案中,为实现跟随者的输出与领导者的输出同步,将该问题转化为降低跟随者与领导者输出之间的误差。
步骤2.1,首先定义第i个跟随者与领导者输出之间的误差:
Figure BDA0002285592920000081
其中i和j分别表示第i个和第j个跟随者,aij≥0为第i个跟随者收到的第j个跟随者的信息权重,bi≥0为第i个跟随者收到领导者的信息权重,aij和bi都是非负常数。
降低上述的误差,将误差收敛到0,即可实现跟随者的输出最终追随到领导者。在实践中,跟随者可能不能收到领导者的信息,而只收到其他跟随者的信息,因此在定义的误差中,引进了其他跟随者信息的权重,让其他跟随者的输出也可以为当前的跟随者提供信息。
步骤2.2,定义第i个跟随者的q阶状态与虚拟控制器之间的误差:
si,q=xi,qi,q-1,q=2,...,ni 式10
其中αi,q-1为第i个跟随者的第q-1个虚拟控制器,通过步骤3设计。
因为不能直接控制跟随者的输出,只能通过设计输入来间接控制跟随者的输出,因此需要将跟随者的每一阶状态都进行控制,让这些状态跟随到需要的状态,最终实现对真正输出的控制。
步骤3,设计多智能体***的控制器
步骤3.1,为第i个跟随者设计第一个虚拟控制器,表示为
Figure BDA0002285592920000082
其中Si,1为径向基函数向量,它的定义为:
S(X)被定义为径向基函数向量,即S(X)=[S1(X),S2(X),...,Sl(X)]T,其中l为径向基函数向量的维数,可以任意选取为一个大于等于2的整数。X表示函数的变量,
Figure BDA0002285592920000091
其中vk表示径向基函数的半径,
Figure BDA0002285592920000092
表示径向基函数的宽度,都可以任意选取。
si,1为第i个跟随者***的1阶状态与虚拟控制器之间的误差,Si,1=Si,1(Xi,1),Xi,1=[xi,1,xj,1]T,xi,1表示第i个跟随者的第1阶状态,xj,1、xj,2分别表示第j个跟随者的第1阶状态,其中,
Figure BDA0002285592920000093
为自适应率,将在步骤3.3给出。ci,1和ai,1为正的可调参数,
Figure BDA0002285592920000094
第一个控制器的设计使用了在步骤2中所定义的误差,以及所能获得的其他智能体(包括领导者和其他跟随者)的信息。
如果xi,2是能直接设计的输入,那令xi,2=αi,1,就可以达到设计目的。但是没有办法直接设计xi,2,因此希望xi,2可以去接近设计的第一个控制器αi,1。在步骤2.2中定义了si,2的误差,如果这个误差也能收敛到0,那xi,2=αi,1,就可以实现控制目的,追随者的输出与领导者的输出同步。
第i个跟随者的第一个虚拟控制器用来控制第i个跟随者的输出,然而在实际***中并没有出现这个虚拟控制器,因此需要控制第i个跟随者的第2阶的状态去逼近第一个虚拟控制器,来达到控制目的。
步骤3.2,为第i个跟随者设计剩余的虚拟控制器
先为第i个跟随者设计第二个虚拟控制器:
Figure BDA0002285592920000095
其中ci,2和ai,2为正的可调参数,si,2为第i个跟随者***的2阶状态与虚拟控制器之间的误差,Si,2为径向基函数向量,Si,2=Si,2(Xi,2)且
Figure BDA0002285592920000096
Figure BDA0002285592920000097
Figure BDA0002285592920000098
Figure BDA0002285592920000099
为自适应率。
接下来为第i个跟随者设计第q个虚拟控制器(3≤q≤ni-1)
Figure BDA00022855929200000910
其中ci,q和ai,q为正的可调参数。其中Si,q为径向基函数向量,Si,q=Si,q(Xi,q)且
Figure BDA00022855929200000911
Figure BDA00022855929200000912
为自适应率,
Figure BDA00022855929200000913
Figure BDA00022855929200000914
xi,q、xj,q分别表示第i个跟随者、第j个跟随者***的q阶状态。
步骤3.3,为第i个跟随者设计真正的控制输入:
Figure BDA0002285592920000101
其中:
Figure BDA0002285592920000102
Figure BDA0002285592920000103
Figure BDA0002285592920000104
其中
Figure BDA0002285592920000105
ai,k,
Figure BDA0002285592920000106
ki,0,ki,1,gi,ri为正的可调参数,
Figure BDA0002285592920000107
si,k为第i个跟随者***的ni阶、k阶状态,
Figure BDA0002285592920000108
为径向基函数向量且
Figure BDA0002285592920000109
Figure BDA00022855929200001010
Figure BDA00022855929200001011
分别表示第i个跟随者、第j个跟随者***的ni阶状态。
Figure BDA00022855929200001012
Figure BDA00022855929200001013
的导数,
Figure BDA00022855929200001014
为自适应率
Figure BDA00022855929200001015
的导数,给定
Figure BDA00022855929200001016
Figure BDA00022855929200001017
一个正的初值,就可以通过他们的导数计算出他们随时间变化的值。
在其他参数不变的情况下,通过增大ci,k,ki,0,ki,1,ri,gi,中一个或者全部,可以降低最终跟随者的输出与领导者输出之间的误差;在其他参数不变的情况下,通过减小ai,k,也可以降低最终跟随者的输出与领导者输出之前的误差。其中i=1,2,...N,k=1,2...ni
步骤3中虚拟控制器和控制输入的设计使用了神经网络对未知函数进行估计,从而使控制器能够适应多智能体***中含有的不确定项。步骤3中控制器的设计使用了李雅普诺夫稳定性方法进行设计,可以保证误差***随着时间的推移而趋于稳定。
考虑到输入到第i个跟随者的并不是控制信号,而是控制信号经过量化器后的信号,这个信号是离散的和失真的,因此设计了一个自适应参数
Figure BDA00022855929200001018
来补偿控制信号经过量化器所产生的误差。
具体操作:
先为第i个跟随者设计控制输入信号ui
第i个跟随者通过获取领导者以及它所能获取的其他跟随者的信息,将输出之间的误差进行计算,使用式9计算出的一阶误差si,1通过式11建立第一个虚拟控制器,然后利用式10通过第一个控制器与自身的第二阶状态进行对比,计算二阶误差si,2,使用已经得到的si,2通过式12建立第二个虚拟控制器αi,2,得到αi,2后可以与第i个跟随者的第3阶状态进行对比,通过式10计算出三阶误差si,3,得到si,3就可以通过式13计算第三个虚拟控制器αi,3,然后用式10计算出四阶误差si,4,通过式13用si,4计算第四个虚拟控制器αi,4。从式13到式10到式13,这样反复进行,直到最终根据式10得到ni阶误差
Figure BDA0002285592920000111
之后通过式14计算真正的输入ui。本方案中没有直接设计输入ui,而是通过一步步设计虚拟控制率的方式,来完成设计。
然后将设计完成的ui产生方式应用到第i个跟随者:
通过式14为第i个跟随者设计控制输入ui,ui经过量化器式4,产生真正的量化控制信号Qi(ui),在输入ui的设计里已经考虑了量化器的量化效应,使用自适应率
Figure BDA0002285592920000112
式16来对量化信号进行自适应,因此ui经过量化产生的控制信号Qi(ui),可以使得第i个跟随者跟随到领导者的输出,实现量化控制。
根据式2可以看出,Qi(ui)直接控制了第i个智能体的第ni阶状态的导数,从而控制第i个智能体的第ni阶状态,根据式1,第i个跟随者的第ni阶状态可以控制第ni-1阶状态的导数,且ni-1阶状态的导数可以控制ni-1阶状态,ni-1阶状态可以控制ni-2阶状态的导数依次类推,最终可以控制到第i个跟随者的第一阶状态,也就是第i个跟随者的输出,使它的输出跟随到领导者的输出。
这样就完成了设计,使用发明的控制器,可以使所有的跟随者的输出最终趋近到领导者的输出。

Claims (4)

1.一种多智能体***的量化控制方法,所述多智能体***包括一个领导者和N个跟随者;其特征在于,所述控制方法包括以下步骤:
建立多智能体***的***模型,包括跟随者的***模型以及领导者的***模型;
建立多智能体***的误差***,包括第i个跟随者与领导者输出之间的误差,以及第i个跟随者的q阶状态与虚拟控制器之间的误差;
设计多智能体***的控制器,包括为第i个跟随者设计第一个虚拟控制器至第q个虚拟控制器,然后为第i个跟随者设计控制输入;
量化器的模型为:
Figure FDA0003592945770000011
其中量化器的量化等级为:
Figure FDA0003592945770000012
Figure FDA0003592945770000013
δi+i-∈(0,1)为可以选择的量化密度,
Figure FDA0003592945770000021
Figure FDA0003592945770000022
为死区参数,ui(t-)代表ui(t)上一时刻的状态,p=1,2,…为从1到正无穷的整数;参数上方加圆点表示该参数的导数,Qi(ui)代表控制输入ui经过量化器后的输出;
所述第i个跟随者与领导者输出之间的误差,表示为:
Figure FDA0003592945770000023
其中i和j分别表示第i个和第j个跟随者,aij≥0为第i个跟随者收到的第j个跟随者的信息权重,bi≥0为第i个跟随者收到领导者的信息权重,aij和bi都是非负常数;
所述i个跟随者的q阶状态与虚拟控制器之间的误差表示为:
si,q=xi,qi,q-1,q=2,…,ni 式10
其中αi,q-1为第i个跟随者的第q-1个虚拟控制器;
所述第i个跟随者的第一个虚拟控制器表示为:
Figure FDA0003592945770000024
其中si,1为第i个跟随者***的1阶状态与虚拟控制器之间的误差,Si,1为径向基函数向量,Si,1=Si,1(Xi,1),Xi,1=[xi,1,xj,1]T,xi,1表示第i个跟随者的第1阶状态,xj,1、xj,2分别表示第j个跟随者的第1阶状态,
Figure FDA0003592945770000025
为自适应率,ci,1和ai,1为正的可调参数,
Figure FDA0003592945770000026
f0(x0,t)为一个已知的有界函数,即想要跟踪的领导者的输出的导数函数,x0表示领导者的输出;
所述第i个跟随者的第二个虚拟控制器表示为:
Figure FDA0003592945770000027
其中ci,2和ai,2为正的可调参数,si,2为第i个跟随者***的2阶状态与虚拟控制器之间的误差,Si,2为径向基函数向量,Si,2=Si,2(Xi,2)且
Figure FDA00035929457700000214
Figure FDA0003592945770000028
Figure FDA0003592945770000029
为自适应率;
第i个跟随者的第q个虚拟控制器表示为:
Figure FDA00035929457700000210
其中ci,q和ai,q为正的可调参数,其中Si,q为径向基函数向量,Si,q=Si,q(Xi,q)且
Figure FDA00035929457700000211
Figure FDA00035929457700000212
为自适应率,
Figure FDA00035929457700000213
Figure FDA0003592945770000031
xi,q、xj,q分别表示第i个跟随者、第j个跟随者***的q阶状态;
所述第i个跟随者设计控制输入,表示为:
Figure FDA0003592945770000032
其中:
Figure FDA0003592945770000033
Figure FDA0003592945770000034
Figure FDA0003592945770000035
其中
Figure FDA0003592945770000036
ai,k,
Figure FDA0003592945770000037
ki,0,ki,1,gi,ri为正的可调参数,
Figure FDA0003592945770000038
si,k为第i个跟随者***的ni阶、k阶状态,
Figure FDA0003592945770000039
为径向基函数向量且
Figure FDA00035929457700000310
Figure FDA00035929457700000311
Figure FDA00035929457700000312
分别表示第i个跟随者、第j个跟随者***的ni阶状态,
Figure FDA00035929457700000313
Figure FDA00035929457700000314
的导数,
Figure FDA00035929457700000315
为自适应率
Figure FDA00035929457700000316
的导数。
2.根据权利要求1所述的多智能体***的量化控制方法,其特征在于,所述跟随者的***模型表示为:
对于第i个跟随者,建立如下的***模型:
Figure FDA00035929457700000317
Figure FDA00035929457700000318
yi=xi,1,i=1,2,…N 式3
其中
Figure FDA00035929457700000319
xi,q
Figure FDA00035929457700000320
代表***的状态变量,其中,q为***状态变量的阶数,ni为第i个跟随者的总***阶数,参数上方加圆点表示该参数的导数,fi,q()和
Figure FDA00035929457700000321
代表未知但光滑的函数,Δi,q(t)和
Figure FDA00035929457700000322
代表未知时变干扰,Qi(ui)代表控制输入ui经过量化器后的输出,ui=ui(t)代表真实控制输入,yi代表每个跟随者的输出,N代表跟随者的个数。
3.根据权利要求1所述的多智能体***的量化控制方法,其特征在于,所述领导者的***模型表示为:
Figure FDA0003592945770000041
y0=x0 式8
y0表示领导者的输出,
Figure FDA0003592945770000042
表示领导者的输出的导数,f0(x0,t)为一个已知的有界函数,即想要跟踪的领导者的输出的导数函数。
4.根据权利要求1所述的多智能体***的量化控制方法,其特征在于,所述第i个跟随者通过获取领导者以及它所能获取的其他跟随者的信息,将输出之间的误差进行计算,计算出的一阶误差建立第一个虚拟控制器,然后通过第一个控制器与自身的第二阶状态进行对比,计算二阶误差,并建立第二个虚拟控制器,然后与第三阶状态进行对比,计算出三阶误差,计算第三个虚拟控制器;以此类推,直到最终得到ni阶误差,之后计算真正的输入ui;ui经过量化器模型,产生真正的量化控制信号Qi(ui),使用自适应率来对量化信号进行自适应,可以使得第i个跟随者跟随到领导者的输出,实现量化控制。
CN201911159148.9A 2019-11-22 2019-11-22 一种多智能体***的量化控制方法 Expired - Fee Related CN110928185B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911159148.9A CN110928185B (zh) 2019-11-22 2019-11-22 一种多智能体***的量化控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911159148.9A CN110928185B (zh) 2019-11-22 2019-11-22 一种多智能体***的量化控制方法

Publications (2)

Publication Number Publication Date
CN110928185A CN110928185A (zh) 2020-03-27
CN110928185B true CN110928185B (zh) 2022-07-05

Family

ID=69850848

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911159148.9A Expired - Fee Related CN110928185B (zh) 2019-11-22 2019-11-22 一种多智能体***的量化控制方法

Country Status (1)

Country Link
CN (1) CN110928185B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114167728B (zh) * 2021-12-08 2023-01-31 广东工业大学 带有死区约束的多智能体***的自适应控制方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106712085A (zh) * 2017-01-13 2017-05-24 东北电力大学 基于多智能体***的孤岛微网电压/频率分布式二级控制方法
CN107092991A (zh) * 2017-05-05 2017-08-25 东南大学 一种智能电网自适应经济调度分配方法
CN108646758A (zh) * 2018-03-20 2018-10-12 南京邮电大学 一种多移动机器人预设性能编队控制器结构及设计方法
CN109445447A (zh) * 2019-01-14 2019-03-08 北京航空航天大学 一种多智能体编队跟踪控制方法及***
CN109725532A (zh) * 2018-12-24 2019-05-07 杭州电子科技大学 一种应用于多智能体间相对距离控制及自适应矫正方法
CN110109351A (zh) * 2019-04-08 2019-08-09 广东工业大学 一种基于指定性能的多智能体一致性控制方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9812018B2 (en) * 2014-04-08 2017-11-07 University Of New Hampshire Optical based pose detection for multiple unmanned underwater vehicles

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106712085A (zh) * 2017-01-13 2017-05-24 东北电力大学 基于多智能体***的孤岛微网电压/频率分布式二级控制方法
CN107092991A (zh) * 2017-05-05 2017-08-25 东南大学 一种智能电网自适应经济调度分配方法
CN108646758A (zh) * 2018-03-20 2018-10-12 南京邮电大学 一种多移动机器人预设性能编队控制器结构及设计方法
CN109725532A (zh) * 2018-12-24 2019-05-07 杭州电子科技大学 一种应用于多智能体间相对距离控制及自适应矫正方法
CN109445447A (zh) * 2019-01-14 2019-03-08 北京航空航天大学 一种多智能体编队跟踪控制方法及***
CN110109351A (zh) * 2019-04-08 2019-08-09 广东工业大学 一种基于指定性能的多智能体一致性控制方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Jing-lin HU.etc.Adaptive output feedback formation tracking for a class of multiagent systems with quantized input signals.《Front Inform Technol Electron Eng》.2018,第19卷(第9期),第1086-1097页. *
叶倩等.多智能体网络的混杂建模与量化一致性.《北京工业大学学报》.2013,第38卷(第12期),第1792-1797页. *
李晓波等.基于采样时间的二阶多智能体***的量化一致性.《渭南师范学院学报》.2015,第30卷(第2期),第24-29页. *

Also Published As

Publication number Publication date
CN110928185A (zh) 2020-03-27

Similar Documents

Publication Publication Date Title
Gao et al. Data-driven adaptive optimal control of connected vehicles
US11975751B2 (en) Iterative learning control method for multi-particle vehicle platoon driving system
Seuret et al. Wirtinger-based integral inequality: Application to time-delay systems
Zhu et al. V2V-based cooperative control of uncertain, disturbed and constrained nonlinear CAVs platoon
CN108717264B (zh) 一种设计基于事件触发的磁悬浮***模糊控制器的方法
CN104049536B (zh) 底盘非线性***模糊神经网络广义逆控制器的构造方法
CN108733955A (zh) 一种智能电动汽车纵向运动控制***及方法
CN109848990B (zh) 基于pso的膝关节外骨骼增益可变无模型角度控制方法
CN110687918A (zh) 一种基于回归型神经网络在线逼近的水下机器人轨迹跟踪控制方法
Huang et al. Decentralized adaptive fuzzy control for a class of large-scale MIMO nonlinear systems with strong interconnection and its application to automated highway systems
CN113359445A (zh) 一种多智能体磁滞***分布式输出反馈渐近一致控制方法
CN111142386A (zh) 一种基于非均匀量化的不确定多智能体***一致性控制方法
CN110928185B (zh) 一种多智能体***的量化控制方法
CN111146778A (zh) 基于自适应事件触发动态输出反馈控制的多区域电网***设计方法
CN103279810A (zh) 基于预测误差收敛性检验和轨迹修正的短期负荷预测方法
Wang et al. An On-Line Robust and Adaptive TS Fuzzy-Neural Controller for More General Unknown Systems.
Gao et al. Composite adaptive fuzzy output feedback dynamic surface control design for uncertain nonlinear stochastic systems with input quantization
CN115987086A (zh) 基于神经网络的单开关直流-直流变换器在线控制方法
CN112731801B (zh) 一种对称死区非线性的自适应动态面输出反馈控制方法
Prakash et al. Neuro-PI controller based model reference adaptive control for nonlinear systems
CN113848954A (zh) 一种改进型多神经元神经网络pid算法的无人车伺服控制***
Zambou et al. Longitudinal control of following vehicles within platoon: A model-based predictive approach
Han et al. Research on vehicle cruise control based on online asynchronous supervised reinforcement learning
Wang et al. A tracking control method based on event-triggered adaptive dynamic programming
CN115891947B (zh) 一种中低速磁悬浮列车电液混合制动协同控制方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20220705