CN114114904B - 一种有限时间和固定时间分布式事件触发一致性方法 - Google Patents

一种有限时间和固定时间分布式事件触发一致性方法 Download PDF

Info

Publication number
CN114114904B
CN114114904B CN202111233574.XA CN202111233574A CN114114904B CN 114114904 B CN114114904 B CN 114114904B CN 202111233574 A CN202111233574 A CN 202111233574A CN 114114904 B CN114114904 B CN 114114904B
Authority
CN
China
Prior art keywords
event triggering
function
agent
time
agent system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111233574.XA
Other languages
English (en)
Other versions
CN114114904A (zh
Inventor
刘丹复
赵振帆
黄娜
张帆
孔亚广
陈张平
何中杰
张尧
郑小青
赵晓东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangdian Haining Information Technology Research Institute Co ltd
Hangzhou Dianzi University
Original Assignee
Hangdian Haining Information Technology Research Institute Co ltd
Hangzhou Dianzi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangdian Haining Information Technology Research Institute Co ltd, Hangzhou Dianzi University filed Critical Hangdian Haining Information Technology Research Institute Co ltd
Priority to CN202111233574.XA priority Critical patent/CN114114904B/zh
Publication of CN114114904A publication Critical patent/CN114114904A/zh
Application granted granted Critical
Publication of CN114114904B publication Critical patent/CN114114904B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Multi Processors (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明公开了一种有限时间和固定时间分布式事件触发一致性方法。本发明首先确定多智能体***的通信拓扑图,并用拉普拉斯矩阵来表征智能体之间的信息交互。其次设计多智能体***事件触发一致性协议,并定义多智能体***的事件触发误差,并基于事件触发误差设计事件触发条件。然后选取一致性协议中适合的方向函数,选取使多智能体***不仅实现有限时间收敛性能而且可实现固定时间收敛性能的激活函数。最后将设计的多智能体***控制协议与事件触发机制写入每一个智能体,并通过建立的通信拓扑图实现智能体之间的分布式信息交互。本发明通过灵活设计控制器协议中的两个函数,实现不同的控制性能要求,同时有效减少控制器的更新频率,降低资源使用率。

Description

一种有限时间和固定时间分布式事件触发一致性方法
技术领域
本发明属于计算机科学与控制领域,涉及一种有限时间和固定时间分布式事件触发一致性方法。
背景技术
在过去的几十年中,关于多智能体协作控制的研究已取得显著的进展。越来越多的大型工程任务如果只依赖于单个设备或机器是无法实现复杂任务的。在许多行业中,协作控制已逐渐反映了其独特的优势。
多智能体***是指由多个同时具有感知、通信、计算和执行能力的智能体组成的***。每个智能体通过网络通信拓扑与其他智能体进行交互,从而协作完成复杂的任务。目前,多智能体***已广泛用于交通控制、智能电网、制造、无人机编队控制、传感器网络、数据融合、多机械手协作设备和许多其他领域。
协同一致性是多智能体***研究中的关键问题之一,指的是能使一组智能体通过与各自邻居的信息交互以及协同控制来达到状态一致的算法。另外,在实际工程应用中,例如姿态同步、环境监测等,往往要求多智能体***在实现协同控制目标的同时满足多种性能(如快速性、鲁棒性、抗干扰性等)要求,其中,收敛时间是表征***控制性能的重要指标。
值得注意的是,大多数多智能体一致性的研究都需要控制器连续更新。然而在实际应用中,每个智能体的计算资源是有限的,控制器有时无法实时更新。为了解决这个问题并提高在线资源的利用,现有的事件触发一致性方法有效减少了控制器更新频率。但目前的事件触发一致性策略大多是渐进稳定的,并没有考虑收敛性能。有限时间和固定时间的一致性由于其更快的收敛速度和对干扰以及参数不确定性的更好鲁棒性而被越来越多的学者研究。近年来,有限时间及固定时间事件触发一致性的成果颇为***,但这些研究中的控制协议形式结构单一,控制器设计缺乏扩展性,无法根据具体的性能要求灵活设计。对此,如何设计可满足不同收敛性能要求的可扩展事件触发协同一致性协议是迫切需要解决的问题。
发明内容
为了解决现有技术的不足,本发明提出了一种有限时间和固定时间分布式事件触发一致性方法。
本发明所采用的技术方案,包括以下步骤:
步骤A、确定多智能体***的通信拓扑图G,用拉普拉斯矩阵L来表征智能体之间的信息交互。
步骤B、基于梯度神经网络思想,设计多智能体***事件触发一致性协议。
步骤C、定义多智能体***的事件触发误差,并基于事件触发误差设计事件触发条件。
步骤D、选取一致性协议中适合的方向函数。
步骤E、选取使多智能体***不仅实现有限时间收敛性能而且可实现固定时间收敛性能的激活函数。
步骤F、将设计的多智能体***控制协议与事件触发机制通过编程写入每一个智能体,并通过建立的通信拓扑图实现智能体之间的分布式信息交互,实现所有智能体的有限时间和固定时间一致性稳定。
本发明的有益效果:本发明基于梯度神经网络思想,提出了一种可扩展分布式事件触发控制框架,主要包含方向函数和激活函数,可以通过灵活设计控制器协议中的两个函数,实现不同的控制性能要求,同时有效减少控制器的更新频率,降低资源使用率。
附图说明
图1为本发明流程图。
具体实施方式
当前大多基于事件触发的多智能体一致性协议虽然也能同时满足相应的性能要求,但这些研究中的控制器都是针对具体问题设计的,很难根据具体的收敛目标进行更改,即控制器设计缺乏兼容性和扩展性。
针对上述问题,本发明给出了以下思路,见图1:
步骤A、假设有n个结构相同的智能体,这里可选取代表所有智能体中感兴趣的状态所组合而成的向量。再建立多智能体***的通信网络拓扑图G,智能体之间的联系可用拉普拉斯矩阵L表示。
本发明采用的是无向拓扑图,n个智能体组成一个可由G=(θ,ε,A)表示的通信网络,其中θ={1,2,…,n}代表这n个智能体的序列,ε={(i,j)|i,j∈θ}代表存在通信交互的边的集合,A=[aij]n×n代表具有权重的邻接矩阵,如果(i,j)∈ε,则aij>0,否则,aij=0。再构建G的入度矩阵D=diag{d1,d2,…,dn},di为每个智能体i的邻居数,由此可以得到G的拉普拉斯矩阵L=D-A。
步骤B、根据梯度神经网络思想,设计基于事件触发的多智能体***控制协议。
步骤B-1、本发明中所采用的***模型为:
其中,xi(t)代表第i个智能体在t时刻的状态,ui(t)代表第i个智能体在t时刻的控制输入。
步骤B-2、为了实现***的一致性,定义每个智能体与其邻居智能体的协同误差:
其中,Ni代表与第i个智能体有通信的邻居个数。需要指出的是,有限时间、固定时间一致性是指存在一个时间T使得limt→T(xi(t)-xj(t))=0。一般地,有限时间的收敛时间估计值与所有智能体的初始状态相关。
步骤B-3、梯度神经网络是神经网络的典型框架,已广泛用于各种微分方程的在线求解方案。梯度神经网络的在线求解方案框架设计如下:
(1)考虑微分方程令y*(t)代表此微分方程的理论解;
(2)构建关于状态y(t)的优化函数J(y(t)),使得J(y*(t))=miny(t)J(y(t)),并获得J(y(t))的梯度表示式为此时,基于梯度神经网络的线性控制模型可表示为它可用于高效地求出最优解;
(3)对于线性控制模型通常引入非线性单调递增激活函数以提高控制性能。本发明中使用σ(·)来表示非线性激活函数,于是基于梯度神经网络的控制模型可进一步表示为/>
步骤B-4、针对B-1中的多智能体***,根据步骤B-3中的梯度神经网络思想,并结合拉普拉斯矩阵的性质,分别构建优化函数J和其梯度因子:
其中,
步骤B-5、根据非线性梯度神经网络设计方法,提出以下基于梯度神经网络和事件触发的分布式一致性控制协议:
其中,γi代表需要设计的参数;gi代表可调整的参数;s(·)代表方向函数,决定了控制方向和稳定性;φ(·)是激活函数,可以根据具体的控制要求和目的灵活设计。代表第i个智能体的第k个触发时刻。
步骤C、定义多智能体***的事件触发误差,并基于事件触发误差设计事件触发条件。
步骤C-1、多智能体***的事件触发误差定义为:
步骤C-2、基于步骤C-1定义的事件触发误差设计事件触发条件:
其中,δi>0代表一个常数;0<βi<1;
步骤D、步骤B-5中的方向函数可选取为:
其中,ηi是一个可设计的正值,z代表此函数的自变量。此方向函数的另一种表达形式如下:
其中,z可替换成相关变量,如
步骤E、选取使多智能体***不仅实现有限时间收敛性能而且可实现固定时间收敛性能的激活函数。
步骤E-1、激活函数φ(·)按如下方式选取:
(1)φ(|z|)≥0。
(2)φ(|z|)是关于|z|的单调递增函数。
(3)ψ(|z|)=|z|φ(|z|)为关于|z|的单调增函数且为凹函数。
步骤E-2、选取李雅普诺夫函数为:
其中,令λ2(L)代表拉普拉斯矩阵L除0特征根之外最小的特征根。
步骤E-3、根据触发条件对选取的李雅普诺夫函数进行求导并利用步骤D-1中激活函数的性质可得:
其中,m代表有m个智能体的qi(t)≠0,i∈{1,…,m},则有n-m个智能体的qi(t)=0,i∈{m+1,…,n},ηmax=maxi=1,…,mi},∈min=mini=1,…,m{∈i},
步骤E-4、进一步对李雅普诺夫函数的导数进行放缩可得:
其中
步骤E-5、为了实现对有限时间和固定时间收敛的灵活设计,现取激活函数p∈(0,1),α>0,可验证此函数满足步骤D-1中的激活函数特性。
此激活函数关于|z|的泰勒展开形式为:
在此形式中,可知总存在一个正整数l*≥2,使得l*p>1。由此可得到该激活函数满足:
φ(|z|)≥α|z|p以及
其中,p1=p,p2=l*p>1。
对于φ(|z|)≥α|z|p,步骤D-4可进一步放缩为:
由此,可推导出有限稳定时间为:
其中,x(0)代表智能体的初始状态。
对于步骤D-4可进一步放缩为:
由此可推导出固定收敛时间为:
步骤F、将设计的多智能体***控制协议与事件触发机制通过编程写入每一个智能体,并通过建立的通信拓扑图实现智能体之间的分布式信息交互,实现所有智能体的有限时间和固定时间一致性稳定。
综上,本发明给出了基于梯度神经网络的可扩展分布式控制框架,具有以下优点:1)有效节省计算资源和通信资源;2)控制协议具有普适性,基于本发明所提出的框架通过选取不同的控制器函数可涵盖大部分已有的有限时间和固定时间设计方案;3)控制协议具有可扩展性,区别于已有的大部分有限时间和固定时间控制策略,本发明设计了新的控制器函数,具有更好的收敛性能。

Claims (1)

1.一种有限时间和固定时间分布式事件触发一致性方法,其特征在于该方法包括以下步骤:
步骤A、确定多智能体***的通信拓扑图,用拉普拉斯矩阵来表征智能体之间的信息交互;
步骤B、基于梯度神经网络思想,设计多智能体***事件触发一致性协议;
步骤C、定义多智能体***的事件触发误差,并基于事件触发误差设计事件触发条件;
步骤D、选取一致性协议中适合的方向函数;
步骤E、选取使多智能体***不仅实现有限时间收敛性能而且可实现固定时间收敛性能的激活函数;
步骤F、将设计的多智能体***控制协议与事件触发机制通过编程写入每一个智能体,并通过建立的通信拓扑图实现智能体之间的分布式信息交互,实现所有智能体的有限时间和固定时间一致性稳定;
所述步骤B中所设计的一致性协议如下:
其中,ui(t)代表第i个智能体在t时刻的控制输入,代表第i个智能体的第k个触发时刻,βi、γi、gi代表需要设计的参数,0<βi<1,/>s(·)代表方向函数,φ(·)是激活函数,aij代表通信拓扑图G中邻接矩阵的元素,/>代表第i个智能体在/>时刻的状态,/>代表第j个智能体在/>时刻的状态,Ni代表与第i个智能体有通信的邻居个数,ei(t)代表第i个智能体在t时刻的事件触发误差,fi(t)代表第i个智能体在t时刻的事件触发函数值;
所述的步骤C具体是:
步骤C-1、多智能体***的事件触发误差定义为:
步骤C-2、基于步骤C-1定义的事件触发误差设计事件触发条件:
其中,δi>0代表一个常数;0<βi<1;
所述的步骤D具体是:
将方向函数选取为:
其中,ηi是一个可设计的正值,z代表此函数的自变量;此方向函数的另一种表达形式如下:
其中,z可替换成相关变量;
所述的步骤E具体是:
步骤E-1、激活函数φ(·)按如下方式选取:
(1)φ(|z|)≥0;
(2)φ(|z|)是关于|z|的单调递增函数;
(3)ψ(|z|)=|z|φ(|z|)为关于|z|的单调增函数且为凹函数;
步骤E-2、选取李雅普诺夫函数为:
其中,令λ2(L)代表拉普拉斯矩阵L除0特征根之外最小的特征根;
步骤E-3、根据触发条件对选取的李雅普诺夫函数进行求导并利用激活函数的性质得:
其中,m代表有m个智能体的qi(t)≠0,i∈{1,…,m},则有n-m个智能体的qi(t)=0,i∈{m+1,…,n},ηmax=maxi=1,…,mi},∈min=mini31,…,m{∈i},
步骤E-4、对李雅普诺夫函数的导数进行放缩得:
其中
步骤E-5、取激活函数
此激活函数关于|z|的泰勒展开形式为:
在此形式中,可知总存在一个正整数l*≥2,使得l*p>1;由此得到该激活函数满足:
φ(|z|)≥α|z|p以及
其中,α1=α,p1=p,p2=l*p>1;
对于φ(|z|)≥α|z|p,进一步放缩为:
由此,推导出有限稳定时间为:
其中,x(0)代表智能体的初始状态;
对于进一步放缩为:
由此推导出固定收敛时间为:
CN202111233574.XA 2021-10-22 2021-10-22 一种有限时间和固定时间分布式事件触发一致性方法 Active CN114114904B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111233574.XA CN114114904B (zh) 2021-10-22 2021-10-22 一种有限时间和固定时间分布式事件触发一致性方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111233574.XA CN114114904B (zh) 2021-10-22 2021-10-22 一种有限时间和固定时间分布式事件触发一致性方法

Publications (2)

Publication Number Publication Date
CN114114904A CN114114904A (zh) 2022-03-01
CN114114904B true CN114114904B (zh) 2024-04-12

Family

ID=80376750

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111233574.XA Active CN114114904B (zh) 2021-10-22 2021-10-22 一种有限时间和固定时间分布式事件触发一致性方法

Country Status (1)

Country Link
CN (1) CN114114904B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115167217A (zh) * 2022-07-20 2022-10-11 上海交通大学 一种基于混杂触发机制的多智能体协同控制方法及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019024303A1 (zh) * 2017-08-02 2019-02-07 华南理工大学 一种基于有限时间神经动力学的多旋翼无人飞行器的稳定飞行控制方法
CN112180734A (zh) * 2020-10-15 2021-01-05 杭州电子科技大学 一种基于分布式自适应事件触发的多智能体一致性方法
CN112698634A (zh) * 2020-12-28 2021-04-23 南京邮电大学 基于事件触发的交通智能体***固定时间二分一致性方法
CN113359474A (zh) * 2021-07-06 2021-09-07 杭州电子科技大学 基于梯度反馈的可扩展分布式多智能体一致性控制方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11281232B2 (en) * 2020-03-13 2022-03-22 King Fahd University Of Petroleum And Minerals Systems and methods for multi-agent system control using consensus and saturation constraints

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019024303A1 (zh) * 2017-08-02 2019-02-07 华南理工大学 一种基于有限时间神经动力学的多旋翼无人飞行器的稳定飞行控制方法
CN112180734A (zh) * 2020-10-15 2021-01-05 杭州电子科技大学 一种基于分布式自适应事件触发的多智能体一致性方法
CN112698634A (zh) * 2020-12-28 2021-04-23 南京邮电大学 基于事件触发的交通智能体***固定时间二分一致性方法
CN113359474A (zh) * 2021-07-06 2021-09-07 杭州电子科技大学 基于梯度反馈的可扩展分布式多智能体一致性控制方法

Also Published As

Publication number Publication date
CN114114904A (zh) 2022-03-01

Similar Documents

Publication Publication Date Title
CN110456807B (zh) 一种多航天器一致性动态增益控制方法
CN108646758B (zh) 一种多移动机器人预设性能编队控制器结构及设计方法
CN112180734B (zh) 一种基于分布式自适应事件触发的多智能体一致性方法
CN113268083B (zh) 基于动态事件触发的多无人机***编队跟踪控制方法
CN112631335B (zh) 一种基于事件触发的多四旋翼无人机固定时间编队方法
CN112936286B (zh) 一种多柔性机械臂***自适应一致性追踪控制方法及***
CN109818792B (zh) 一种基于二阶线性***时变耦合复杂动态网络模型的控制器
CN114114904B (zh) 一种有限时间和固定时间分布式事件触发一致性方法
CN113625559A (zh) 一种基于指定时间收敛的多智能体***协同控制方法
CN112936266A (zh) 网络化机械臂***自适应一致性切换控制方法及***
Yang et al. Event-triggered adaptive neural control for multiagent systems with deferred state constraints
CN113359439B (zh) 多智能体***有限时间多目标协同追踪方法和存储介质
CN112198796B (zh) 一种分布式前置时间状态观测器的设计方法
CN116794987A (zh) 基于事件触发控制的异构多智能体***一致性控制方法
Zhang et al. Dynamic event-triggered consensus control for multi-agent systems using adaptive dynamic programming
Li et al. Output-constrained control of non-affine multi-agent systems with actuator faults and unknown dead zones
CN115981375A (zh) 基于事件触发机制的多无人机时变编队控制器设计方法
Yan et al. Event-triggered time-varying formation control for discrete-time multi-agent systems with communication delays
Yang et al. Stability of a class of uncertain fuzzy systems based on fuzzy control switching
CN114879492A (zh) 一种完全数据驱动的多智能体***事件触发控制方法
CN113934143A (zh) 多旋翼飞行器有限时间自适应事件触发容错跟踪控制方法
CN114609915B (zh) 一种未知控制方向的时变多智能体协同控制方法
CN117506907B (zh) 一类分数阶多机械臂***协调跟踪控制方法
Dong et al. Centralized dynamic event-triggered control for multi-agent systems
CN117075635B (zh) 基于触发策略的多航天器控制方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant