CN114509948B - 一种高阶多智能体***状态约束量化控制器的构建方法 - Google Patents
一种高阶多智能体***状态约束量化控制器的构建方法 Download PDFInfo
- Publication number
- CN114509948B CN114509948B CN202210154910.XA CN202210154910A CN114509948B CN 114509948 B CN114509948 B CN 114509948B CN 202210154910 A CN202210154910 A CN 202210154910A CN 114509948 B CN114509948 B CN 114509948B
- Authority
- CN
- China
- Prior art keywords
- agent
- agent system
- hysteresis
- order
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000013139 quantization Methods 0.000 title claims abstract description 32
- 239000011159 matrix material Substances 0.000 claims description 26
- 230000006978 adaptation Effects 0.000 claims description 5
- 238000012886 linear function Methods 0.000 claims description 3
- 241000408483 Signeta Species 0.000 claims description 2
- 238000012545 processing Methods 0.000 claims description 2
- 238000010276 construction Methods 0.000 abstract description 2
- 239000003795 chemical substances by application Substances 0.000 description 129
- 238000010586 diagram Methods 0.000 description 18
- 230000003044 adaptive effect Effects 0.000 description 12
- 238000004891 communication Methods 0.000 description 7
- 238000013461 design Methods 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000004088 simulation Methods 0.000 description 3
- 241000282414 Homo sapiens Species 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 229910052731 fluorine Inorganic materials 0.000 description 2
- 125000001153 fluoro group Chemical group F* 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 241000251468 Actinopterygii Species 0.000 description 1
- 102000002274 Matrix Metalloproteinases Human genes 0.000 description 1
- 108010000684 Matrix Metalloproteinases Proteins 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- HOWHQWFXSLOJEF-MGZLOUMQSA-N systemin Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H]2N(CCC2)C(=O)[C@H]2N(CCC2)C(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)C(C)C)CCC1 HOWHQWFXSLOJEF-MGZLOUMQSA-N 0.000 description 1
- 108010050014 systemin Proteins 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/042—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Feedback Control In General (AREA)
Abstract
本发明公开高阶多智能体***状态约束量化控制器的构建方法,包括以下步骤:构建构建高阶非线性多智能体***模型,其中,所述高阶非线性多智能体***含有输入迟滞和全状态约束;根据所述输入迟滞,构建迟滞非线性模型,基于所述迟滞非线性模型,构建相应的逆迟滞模型;基于所述高阶非线性多智能体***模型,对高阶非线性多智能体***的全部状态进行约束;将自适应控制方法和反步法相结合,基于所述逆迟滞模型,构建高阶多智能体***状态约束量化控制器。本发明在高阶多智能体***存在参数不确定和外部扰动的基础上,采用自适应一致控制方法,具有更好的跟踪性能,提高了控制器的鲁棒性,保证闭环***内的所有信号半全局一致最终有界。
Description
技术领域
本发明涉及多智能体***控制领域,特别是涉及一种高阶多智能体***状态约束量化控制器的构建方法。
背景技术
智能体概念的产生来源于早期人们对人工智能领域的研究,由“智能体”来代替人类完成复杂危险的工作是其被提出的重要原因。很多物理实体如传感器、执行器、机器人、无人机等都可以看作是一个智能体,其中的每个个体都具有一定的自主能力,包括一定程度的自我运动控制、局部范围内的信息传感、处理和通信能力等。但是随着智能体理论的发展,人们发现单个智能体能完成的任务实在有限,便开始寻找能够解决单智能体***缺点的方法,很快人们便从“群体行为”这一自然界中常见的现象中获得了灵感,典型的例子如编队迁徙的鸟群、结队巡游的鱼群、协同工作的蚁群、聚集而生的细菌群落等,其共同特征是一定数量的自主个体通过相互合作和自组织,在集体层面上呈现出有序的协同运动和行为。多智能体据此应运而生,通过将多个单智能体相结合使其协同工作的方式进而弥补单智能体在某些场景下的能力不足问题。
实际情况下,多智能体***会更加复杂,其控制方法现如今大多关注于一、二阶***,对于模型具有不确定项和外部干扰的高阶多智能体***研究较少;多智能体***的研究考虑迟滞非线性和状态受限的情况较少,而在现实环境内经常会遇到这类问题;智能体之间的大量数据交换可能会增加***的通信负担。
因此,需要对多智能体***迟滞非线性和状态受限进行约束量化,并且降低智能体之间的大量数据交换的通信负担。
发明内容
本发明的目的是提供一种高阶多智能体***状态约束量化控制器的构建方法,以解决上述现有技术存在的问题,在高阶多智能体***存在参数不确定和外部扰动的基础上,采用自适应一致控制方法,具有更好的跟踪性能,提高了控制器的鲁棒性,保证闭环***内的所有信号半全局一致最终有界。
为实现上述目的,本发明提供了如下方案:本发明提供一种高阶多智能体***状态约束量化控制器的构建方法,包括以下步骤:
构建高阶非线性多智能体***模型,其中,所述高阶非线性多智能体***含有输入迟滞和全状态约束;
根据所述输入迟滞,构建迟滞非线性模型,基于所述迟滞非线性模型,构建相应的逆迟滞模型;
基于所述高阶非线性多智能体***模型,对高阶非线性多智能体***的全部状态进行约束;
将自适应控制方法和反步法相结合,基于所述逆迟滞模型,构建高阶多智能体***状态约束量化控制器。
可选地,所述高阶非线性多智能体***模型表示为:
其中,i表示多智能体的个数;xi为第i个智能体的状态;为对应状态的导数;yi为第i个智能体的输出;ui为第i个智能体的迟滞输入,B(·)为迟滞特性函数,vi为***的实际输入;I为状态系数矩阵;Di为增益矩阵;为未知非线性函数。
可选地,所述迟滞非线性模型为:
ui=B(vi)=Φi1vi+Φi2χi1,i=1,…,N,
其中,ui为第i个智能体的迟滞输入,Φj1与Φi2是具有相同符号的常数;χi1为第i个智能体的迟滞特性辅助变量,vi为输入信号。
可选地,所述逆迟滞模型为:
可选地,对高阶非线性多智能体***的全部状态进行约束时,采用BLF约束函数限制***模型中的受限状态。
可选地,将自适应控制方法和反步法相结合,基于相应的逆迟滞模型,构建高阶多智能体***状态约束量化控制器包括:
基于所述逆迟滞模型和量化器对所述高阶非线性多智能体***模型进行改写;
对每个智能体的状态变量进行状态估计;
定义所述高阶非线性多智能体***的第一个误差面;
定义所述高阶非线性多智能体***的第二个误差面;
定义所述高阶非线性多智能体***的第w个误差面;
可选地,对每个所述智能体的状态变量进行状态估计时,采用高增益K滤波器,其中,所述高增益K滤波器为: 其中,φi,Φi,均为滤波器估计函数;En,q为坐标参数;Ψi为滤波器系数矩阵,Hi为滤波器参数矩阵,为期望控制信号,j为第j个智能体。
可选地,所述第一个误差面为:
可选地,所述第w个误差面ei,w为:
ei,w=ωi,m,w-αi,w-1,w=2,…,k,
其中,ωi,m,w为滤波器估计函数;αi,w-1为待设计的虚拟控制率。
本发明公开了以下技术效果:
本发明提供的一种高阶多智能体***状态约束量化控制器的构建方法,在模型参数不确定、存在未知外部扰动的基础上,考虑多智能体***的输出反馈控制,充分考虑了多智能体***的实际控制场景,使得发明所求控制率更加具有通用性;通过引入逆迟滞补偿模型,克服实际环境下***可能存在的输入迟滞问题,并允许每个智能体具有各不相同的迟滞非线性,提高了***的鲁棒性;采用BLF约束函数,用以限制多智能体***具有的全状态约束,使得整个***满足预设的性能指标;采用自适应量化控制方法,引入的量化器使得***的通信负担大大降低,并保证状态跟踪误差满足预设要求,提高了误差***的收敛速度和跟踪精度,最终保证了闭环***所有信号半全局一致最终有界。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中的高阶多智能体***状态约束量化控制器的结构示意图;
图2为本发明实施例中多智能体***的通信拓扑结构图,其中yr表示***需要跟踪的参考信号,其中,“1”、“2”、“3”、“4”分别表示第1、2、3、4个智能体;
图3为本发明实施例中的跟踪轨迹示意图;
图4为本发明实施例中与使用纯自适应量化控制方法(PAQC)的跟踪轨迹对比示意图,其中,图(a)-(d)分别为第1-4个智能体的跟踪轨迹与使用PAQC的第1-4个智能体的跟踪轨迹对比示意图;
图5为本发明实施例中的跟踪误差示意图;
图6为本发明实施例中与使用纯自适应量化控制方法(PAQC)的跟踪误差对比示意图,其中,图(a)-(d)分别为第1-4个智能体的跟踪误差与使用PAQC的第1-4个智能体的跟踪误差对比示意图;
图7为本发明实施例中的邻居一致性误差示意图;
图8为本发明实施例中与使用纯自适应量化控制方法(PAQC)的邻居一致性误差对比示意图,其中,图(a)-(d)分别为第1-4个智能体的邻居一致性误差与使用PAQC的第1-4个智能体的邻居一致性误差对比示意图;
图9为本发明实施例中第二误差面的跟踪误差示意图;
图10为本发明实施例中与使用纯自适应量化控制方法(PAQC)的第二误差面的跟踪误差对比示意图,其中,图(a)-(d)分别为第1-4个智能体的第二误差面与使用PAQC的第1-4个智能体的第二误差面对比示意图;
图11为本发明实施例中的第一个智能体在经过逆迟滞补偿前后的输入信号示意图;
图12为本发明实施例中的第二个智能体在经过逆迟滞补偿前后的输入信号示意图;
图13为本发明实施例中的第三个智能体在经过逆迟滞补偿前后的输入信号示意图;
图14为本发明实施例中的第四个智能体在经过逆迟滞补偿前后的输入信号示意图;
图15为本发明实施例中的量化控制输入信号示意图;
图16为本发明实施例中高阶多智能体***状态约束量化控制器的构建方法流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
本发明提供一种高阶多智能体***状态约束量化控制器的构建方法,如图1-16所示,包括以下步骤:
步骤1)针对带有输入迟滞和全状态约束的多智能体***建模
本发明中带有输入迟滞和全状态约束的高阶非线性多智能体***中,第i个智能体的数学模型如公式(1)所示:
其中,i=1,…,N表示多智能体的个数;t表示时间常数;xi=[xi,1,…,xi,n]T∈Rn为第i个智能体的状态,为对应状态的导数,n表示***阶数,R表示数域,假设对于每个智能体的状态,都有|xi|<ki,c,ki,c是一个已知正常数;yi∈R为第i个智能体的输出;ui∈R为第i个智能体的迟滞输入,是迟滞特性函数B(vi)的迟滞输出,vi为***的实际输入;状态系数矩阵且In-1为(n-1)×(n-1)的单位矩阵;增益矩阵Di=[0,…,0,di]T∈Rn,di=[di,m,…,di,0]T∈Rm+1为控制信号的未知增益,且有参数k=n-m>1,di,m≠0为未知常数;为未知非线性函数,包含几种类型的不确定性,如未知时变参数、建模误差和外部扰动。
本发明考虑一组N个n阶非线性多智能体***,假设N个智能体的拓扑结构可以用无向图表示,每一个智能体都能看作是一个节点,则由一组节点集和一组边集组成。(i,j)∈ε表示第i个智能体与第j个智能体可以获得相互的信息。第i个智能体的邻居集合可以表示为Ni={j|(j,i)∈ε},将能够表示第i个智能体邻居状态的邻接矩阵A定义为为如式(2)所示:
其中,aij为代表第i个智能体和第j个智能体之间关系的关系参数,若aij=1则表示第i个智能体与第j个智能体相邻并能获得其信息;此外AT=A,且第i个智能体的自身关系参数aii≠1。
将Laplacian矩阵L=[Lij]∈RN×N定义为如式(3)所示:
其中,lii是表示与第i个智能体相邻的所有智能体个数的邻居数量参数,lij为第i个智能体关系参数aij的负值。
假设1.将第i个智能体的邻居集合Ni定义为Ni={j|(j,i)∈ε},若j∈Ni,则表示第j个智能体的输出yj和输入uj可以被第i个智能体获得。
步骤2)根据多智能体***的迟滞非线性,构造与之对应的逆迟滞模型
所用Bouc-Wen迟滞非线性模型如式(4)所示:
ui=B(vi)=Φi1vi+Φi2χi1,i=1,…,N, (4)
并且迟滞形状描述函数f(·,·)有如下形式
其中,sign(·)为符号函数;υi>|oi|,m≥1,并且υi和Oi分别是描述第i个智能体中迟滞的形状和振幅的参数;光滑度参数m的取值影响从初始斜率到渐近线斜率的过渡的光滑性。
根据公式(4)-(6)中所描述的迟滞非线性构造其相应的逆迟滞模型,使用逆迟滞补偿函数BI(·)以抵消输入迟滞对***所造成的影响,具体构建步骤如下:
并且
步骤3)采用BLF约束函数限制***模型中的受限状态
在本实施例中,屏障李雅普诺夫函数(BLF)是一个标量函数V(x),定义的***在一个开放的区域(包含原点)是连续且正定的,并且对于上的每一点都有连续的一阶偏导数;在x靠近的边界时,V(x)→∞,并且沿着的解和一些正常数b满足对于任意正常数ki,b,i=1,…,N,令代表数域,开放区域包含原点,并且ki,b>0是区域ki,b>0的边界,且有
基于以上理论,在本实施例中使用如式(9)所示的BLF函数
其中,log(·)表示自然对数;ei为多智能体***的误差变量;可以看出BLF函数是正定的,ki,b代表ei的限制,即为|ei|<ki,b。对于任意存在的正常数ki,b,有如式(10)所示的不等式形式:
任何时候|ei|<ki,b均成立。
步骤4)采用自适应量化控制,设计带有输入迟滞的多智能体***状态约束量化控制器
控制器的设计主要包括如下步骤:
第一步:在每个智能体前加入量化器,并对使用了逆迟滞补偿和量化器后的***模型进行转换,假定将具有如下扇形限制属性的量化器加入***中
其中,0<λi<1,δi>0为已知常数。此类扇形限制属性存在于许多典型的量化器之中,现给出一种典型的对数量化器,如式(12)所示:
则根据公式(7)和公式(11),可将***模型(1)改写为
假设2.假设下列定义成立
第二步:使用高增益K滤波器对每个智能体的状态进行估计,如式(15)-(20)所示:
根据公式(13),定义如下形式的等式
根据公式(24),公式(17)可以改写成
将滤波误差设计成如式(36)所示的李雅普诺夫函数
第三步:引入符号ηi代表各智能体和参考信号之间的关系,着ηi=1,说明该智能体可以直接获得参考信号yr,否则ηi=0。令符号矩阵η=diag{η1,…,ηN},定义***的跟踪误差zi和误差ei=[ei,1,ei,2,…,ei,k+1]T为
zi=yi-yr, (39)
ei,w=ωi,m,w-αi,w-1,w=2,…,k, (41)
假设3.符号矩阵η=diag{η1,…,ηN}中至少有一个非零元素。
假设4.所有跟踪误差Zi,l=yi-yr,i=1,…,N都被预先定界。
第四步:求得第一个误差面ei,l的导数为
考虑以下李雅普诺夫函数:
其中,Vi,0为高增益K滤波器的滤波误差;ki,bw为正常数;在集合中,Vi,1是连续的;自适应参数分别是t,di,dj的估计值,且有估计误差ci,w(w=1,…,k),βti,βρi,θti,θρi,θdi,θσij,ζi,1,ζi,2为正标量设计参数,为需要设计的正定对称阵。
由杨氏不等式可知
根据ηi=0或1可知,因此可以得到如式(52)所示的不等式
虚拟控制率αi,1被设计为
其中余项函数fi,1,fi,2分别为
第五步:根据公式(42)第二个误差面ei,2的导数为
考虑以下李雅普诺夫函数
由杨氏不等式可知:
根据公式(63),(65)-(67),Vi,2的导数为
将公式(69)-(71)代入到(68)中,可以得到
第六步:第w(3≤w≤k)误差面ei,w为:
ei,w=ωi,m,w-αi,w-1,w=2,…,k,
其导数如式(73)所示:
考虑以下李雅普诺夫函数
将(75)-(77)代入到Vi,w的导数中,可将其化简为:
选取适当的设计参数ζi,2,使其满足不等式
根据杨氏不等式,有
此外,根据公式(81)和(83),公式(82)的后两项满足:
下面进行状态约束量化控制器的稳定性分析
***的滤波误差在公式(36)中已经给出,根据公式(40)和(41),可以将***误差合并成如式(87)所示形式:
考虑以下李雅普诺夫函数
定理1.考虑具有输入迟滞的多智能体***模型(1),逆迟滞模型(7)-(8),满足公式(11)的N个量化器,BLF约束函数(9),高增益K滤波器(15)-(18),自适应率(56),(59),(79),和实际控制率(81)。并且满足假设1-4,则通过选取适当的设计参数ci,w(w=1,…,k),βti,βρi,θti,θρi,θdi,θσij,ζi,1,ζi,2,确保所提出的自适应一致量化控制满足:(1)闭环***中的所有信号都半全局一致最终有界;(2)跟踪误差zi将收敛到一个集合ε;(3)不会违反***中的全状态约束。
证明:
其中,f为包含***中未知非线性的残余项,其具体形式如式(90)所示
且正项集合Δi为
与公式(14)和(44)结合可以得到
因为p为正整数,因此有
根据公式(87),(94)可以表示为
通过合并公式(46)和(95),不等式(93)的右半部分有如下关系
根据公式(44),(90),(93),(96),有
根据公式(97),且知yr有界,有如下不等式成立
因此根据公式(10),公式(89)可以被缩写为
其中集合ε可以表示为
明显地,可以证明其中,e1=[e1,1,…,eN,1]T。根据公式(41),可以得到其中z=[z1,…,zN]T。根据公式(40),可以得到令可得|xi,1|≤ki,c。同理可得***剩余状态证明了整个***的状态约束没有被违反。
下面以带有输入迟滞和状态约束的二阶机械臂***为例进行仿真分析,考虑一组由四个单杆机械臂组成的多智能体***,其动态模型表达式为
根据公式(13)所给出的一般形式的多智能体模型,将公式(103)转化成与相同的形式
其中
且Di=[0,di]T,需注意该模型中参数N=4,n=2,m=2,k=n-m=0。假设Ii,bi,mi,g,li,均为未知项,sign(di,0)己知。多智能体的通信拓扑结构如图2所示,其参数矩阵η=[0,1,0,0]T。此外,该***的邻接矩阵A和Laplacian矩阵L被表示为
控制器结构如图1所示,每个智能体的具体物理参数如表1所示。
表1
迟滞非线性的参数分别设置为Φi,1=[1,1,3,1],Φi,2=[1,1,5,1]T,κi=[1,0.02,1,1]T以及Oi=[0.5,0.01,0.5,1]T;高增益K滤波器的参数设置为hi,1=[2,2,2,2]T,hi,2=[1,1,1,1]T。将量化器的参数设置为λi=[0.2,0.2,0.2,0.2]T,δi=[0.1,0.1,0.1,0.1]T;BLF函数的限制设置为|ki,b1|=[0.30.3,0.3,0.3]T,|ki,b2|=[0.5,0.5.0.5,0.5]T。
为了验证本发明设计的控制器有效性,引入一种使用纯自适应量化方法的控制(PAQC)与本发明所提出的方法进行跟踪性能的比较。
图3-图15为实验仿真结果图。图3展示了本发明提出控制方案的跟踪轨迹,图4展示了本发明的跟踪轨迹与使用PAQC方法的跟踪轨迹对比,可以清楚地看到相比使用PAQC方法,本发明使用的方法能够更好地跟踪参考信号yr。图5展示了所提方法的跟踪误差Zi,图6与PAQC的对比实验说明本发明提供的方法跟踪误差更小。图7为本发明阐述方法的邻居一致性误差ei,1,可以看到该误差范围一直处于给定约束[-ki,b1,ki,b1]内,即多智能体***的全状态约束通过使用BLF函数没有被违反,并且本发明所提方法具有更好的收敛性和更小的误差。图8为本发明所提方法的第二误差面ei,2,与上图类似,每个智能体的误差都被限制在确定范围[-ki,b2,ki,b2]。图9-图12展示了四个智能体的控制输入信号在经过逆迟滞补偿前后的信号对比,其中为期望控制信号,vi为经过逆迟滞补偿后的输入信号,ui表示实际控制输入,可以看出经过逆迟滞补偿之后的控制信号能够较好地抵消迟滞非线性对***的影响。图13显示了多智能体***的量化输入信号,可以发现经过量化器之后的控制输入能够较好地降低***的通行负担。
为了更直观显示本发明的优点,选取稳定状态(5~30s)获得两种控制方法的最大跟踪误差(MVTE)和均方根值(RMSVTE)对比,如表2所示。
表2
本发明通过考虑参数不确定性、外部扰动、输入迟滞非线性、全状态约束,提出了一种自适应一致性量化控制器以解决多智能体的协同控制问题;应用BLF约束函数限制***中的全状态约束,并通过建立相应的逆迟滞模型抵消多智能体***的迟滞非线性,不仅克服了模型的不确定性,同时在每个智能体前引入量化器减轻了***的通信负担;自适应与一致性控制方法相结合,提高了误差***的收敛速度和跟踪精度。仿真结果验证了所提方法的有效性。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围。都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (8)
1.一种高阶多智能体***状态约束量化控制器的构建方法,其特征在于,包括以下步骤:
构建高阶非线性多智能体***模型,其中,所述高阶非线性多智能体***含有输入迟滞和全状态约束;
根据所述输入迟滞,构建迟滞非线性模型,基于所述迟滞非线性模型,构建相应的逆迟滞模型;
基于所述高阶非线性多智能体***模型,对高阶非线性多智能体***的全部状态进行约束;
将自适应控制方法和反步法相结合,基于所述逆迟滞模型,构建高阶多智能体***状态约束量化控制器;
构建高阶多智能体***状态约束量化控制器包括:
将量化器加入高阶非线性多智能体***中,基于所述逆迟滞模型和所述量化器对所述高阶非线性多智能体***模型进行改写;
使用高增益K滤波器对每个智能体的状态进行估计;
引入符号ηi代表各所述智能体和参考信号之间的关系,着ηi=1,说明该所述智能体可以直接获得所述参考信号yr,否则ηi=0;
定义所述高阶非线性多智能体***的第一个误差面;
定义所述高阶非线性多智能体***的第二个误差面;
定义所述高阶非线性多智能体***的第w个误差面;
所述第w个误差面ei,w为:
ei,w=ωi,m,w-αi,w-1,w=2,…,k,
其中,ωi,m,w为滤波器估计函数;αi,w-1为待设计的虚拟控制率。
3.根据权利要求1所述的高阶多智能体***状态约束量化控制器的构建方法,其特征在于,所述迟滞非线性模型为:
ui=B(vi)=Φi1vi+Φi2χi1,i=1,…,N,
其中,ui为第i个智能体的迟滞输入,Φi1与Φi2是具有相同符号的常数;χi1为第i个智能体的迟滞特性辅助变量,vi为输入信号。
5.根据权利要求1所述的高阶多智能体***状态约束量化控制器的构建方法,其特征在于,对高阶非线性多智能体***的全部状态进行约束时,采用BLF约束函数限制***模型中的受限状态。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210154910.XA CN114509948B (zh) | 2022-02-21 | 2022-02-21 | 一种高阶多智能体***状态约束量化控制器的构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210154910.XA CN114509948B (zh) | 2022-02-21 | 2022-02-21 | 一种高阶多智能体***状态约束量化控制器的构建方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114509948A CN114509948A (zh) | 2022-05-17 |
CN114509948B true CN114509948B (zh) | 2023-01-17 |
Family
ID=81551964
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210154910.XA Active CN114509948B (zh) | 2022-02-21 | 2022-02-21 | 一种高阶多智能体***状态约束量化控制器的构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114509948B (zh) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113031434A (zh) * | 2021-02-03 | 2021-06-25 | 中国地质大学(武汉) | 时滞多柔性摆臂***分数阶自适应控制方法及装置 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110109351B (zh) * | 2019-04-08 | 2021-05-18 | 广东工业大学 | 一种基于指定性能的多智能体一致性控制方法 |
CN110275435B (zh) * | 2019-05-24 | 2022-07-05 | 广东工业大学 | 基于观测器的多单臂机械手输出一致自适应命令滤波控制方法 |
CN110543097B (zh) * | 2019-08-06 | 2023-01-20 | 广东工业大学 | 一种基于模型参考自适应的压电陶瓷驱动器控制方法 |
CN110989347B (zh) * | 2019-12-07 | 2022-04-08 | 天津大学 | 一种基于事件触发机制的网络化控制***和控制方法 |
CN111103833B (zh) * | 2019-12-20 | 2023-03-07 | 南京邮电大学 | 一种多化学反应罐反应液体积一致性控制器***及设计方法 |
CN112558476B (zh) * | 2020-12-04 | 2022-06-14 | 广东工业大学 | 基于攻击补偿的非线性多智体***无领导者一致控制方法 |
CN113359445B (zh) * | 2021-06-01 | 2022-11-11 | 上海工程技术大学 | 一种多智能体磁滞***分布式输出反馈渐近一致控制方法 |
CN113671831B (zh) * | 2021-08-12 | 2024-04-09 | 南京邮电大学 | 一种非线性互联***的自适应跟踪控制方法 |
-
2022
- 2022-02-21 CN CN202210154910.XA patent/CN114509948B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113031434A (zh) * | 2021-02-03 | 2021-06-25 | 中国地质大学(武汉) | 时滞多柔性摆臂***分数阶自适应控制方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN114509948A (zh) | 2022-05-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108646758B (zh) | 一种多移动机器人预设性能编队控制器结构及设计方法 | |
CN109465825B (zh) | 机械臂柔性关节的rbf神经网络自适应动态面控制方法 | |
Sun et al. | Adaptive decentralized neural network tracking control for uncertain interconnected nonlinear systems with input quantization and time delay | |
CN109445447B (zh) | 一种多智能体编队跟踪控制方法及*** | |
CN107544256B (zh) | 基于自适应反步法的水下机器人滑模控制方法 | |
CN113900380B (zh) | 一种异构集群***鲁棒输出编队跟踪控制方法及*** | |
CN113183154B (zh) | 一种柔性关节机械臂的自适应反演控制方法 | |
CN110262247B (zh) | 多机器人***的分布式命令滤波模糊控制方法 | |
CN113359445B (zh) | 一种多智能体磁滞***分布式输出反馈渐近一致控制方法 | |
CN114895564B (zh) | 一种电驱动柔性关节机械臂自适应神经网络控制器设计方法 | |
CN111496796B (zh) | 基于指令滤波器的机械臂轨迹跟踪控制方法及装置 | |
CN112305918A (zh) | 超螺旋观测器下的多智能体***滑模容错一致性控制算法 | |
CN112987567A (zh) | 非线性***的固定时间自适应神经网络滑模控制方法 | |
CN106773684B (zh) | 基于智能学习评价的柔性机械臂复合控制方法 | |
CN110362103B (zh) | 分布式自主水下航行器姿态协同优化控制方法 | |
CN114851198A (zh) | 一种多单连杆式机械臂的一致跟踪固定时间稳定控制方法 | |
CN113325717B (zh) | 基于互联大规模***的最优容错控制方法、***、处理设备、存储介质 | |
CN109108964B (zh) | 一种基于自适应动态规划Nash博弈的空间机械臂协调控制方法 | |
Yang et al. | Predictor‐based bipartite time‐varying formation control of nonlinear multi‐agents systems via disturbance observer | |
CN114509948B (zh) | 一种高阶多智能体***状态约束量化控制器的构建方法 | |
Li et al. | Adaptive resilient containment control for nonlower triangular multiagent systems with time-varying delay and sensor faults | |
CN116755481A (zh) | 一种基于神经网络的pid振动主动控制与可靠性分析方法 | |
CN114200830B (zh) | 一种多智能体一致性强化学习控制方法 | |
CN114280930B (zh) | 一种随机高阶线性多智能体***控制协议的设计方法及*** | |
CN114063438B (zh) | 一种数据驱动的多智能体***pid控制协议自学习方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |