CN116627042B - 执行器非对称饱和多自主体***的分布式协同跟踪方法 - Google Patents
执行器非对称饱和多自主体***的分布式协同跟踪方法 Download PDFInfo
- Publication number
- CN116627042B CN116627042B CN202310893839.1A CN202310893839A CN116627042B CN 116627042 B CN116627042 B CN 116627042B CN 202310893839 A CN202310893839 A CN 202310893839A CN 116627042 B CN116627042 B CN 116627042B
- Authority
- CN
- China
- Prior art keywords
- agent
- matrix
- state
- following
- self
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 229920006395 saturated elastomer Polymers 0.000 title claims abstract description 15
- 238000013528 artificial neural network Methods 0.000 claims abstract description 29
- 230000003044 adaptive effect Effects 0.000 claims abstract description 20
- 230000009467 reduction Effects 0.000 claims abstract description 9
- 239000003795 chemical substances by application Substances 0.000 claims description 116
- 239000011159 matrix material Substances 0.000 claims description 62
- 238000006243 chemical reaction Methods 0.000 claims description 18
- 238000000354 decomposition reaction Methods 0.000 claims description 8
- 230000008878 coupling Effects 0.000 claims description 7
- 238000010168 coupling process Methods 0.000 claims description 7
- 238000005859 coupling reaction Methods 0.000 claims description 7
- 230000002441 reversible effect Effects 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 4
- 238000005516 engineering process Methods 0.000 claims description 3
- 230000003993 interaction Effects 0.000 claims description 3
- 230000007704 transition Effects 0.000 claims description 3
- 238000013461 design Methods 0.000 abstract description 8
- 238000011160 research Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/042—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Feedback Control In General (AREA)
Abstract
本发明属于自适应控制器领域,公开了一种执行器非对称饱和多自主体***的分布式协同跟踪方法,包括:运用径向基函数神经网络估计***过饱和和外部扰动的部分,对原来的多自主体***模型进行转换,根据转换后的***模型,设计出降维观测器来估计多自主体***中各智能体不可测的状态轨迹,根据输出信息和降维观测器信息,构建该多自主体***的基于降阶观测器的自适应协议,再根据设计出的自适应控制算法给出驱动这类执行器非对称饱和多自主体***实现半全局鲁棒协同跟踪的充分条件。该方法将自适应神经网络控制器从单个***扩展到多自主体***,解决了具有非对称饱和执行器的网络多自主体***的降维观测器设计和鲁棒分布式协同跟踪问题。
Description
技术领域
本发明属于自适应控制器领域,具体的说是涉及一种执行器非对称饱和多自主体***的分布式协同跟踪方法。
背景技术
近年来,随着分布式网络及多自主体***的迅速发展,分布式协同控制成为控制领域研究的一个热点。研究多自主体***的主要目的就是期望通过大规模的智能体之间的合作协同来代替昂贵的单个***,完成复杂的任务,而一致性问题作为智能体之间合作协同的基础,受到来自各个领域研究者的关注,成为***与控制方向的一个重要研究课题。
在实际应用中,由于执行机构的物理条件限制及***运行安全的考量,多自主体***不可避免地会出现执行器饱和的现象,如控制器输出电流和电压的幅值和频率都是有限的,阀门的开度受到一定的范围限制,水箱的水位有固定的最大值等。寻求饱和补偿策略,使执行器在进入饱和后能够快速退出饱和或者避免执行器进入饱和,成为饱和***实现高精度控制的关键,这方面也取得了非常可观的研究成果。需要指出的是这些研究都致力于执行器对称饱和的控制方法,然而在实际应用中经常发生执行器非对称饱和的情况,比如当执行器发生部分损坏时,极易产生非对称饱和的现象。对非对称饱和执行器的多自主体***的鲁棒一致性的研究具有很大的挑战。
发明内容
为了解决现有技术中存在的问题,本发明提供了一种执行器非对称饱和多自主体***的分布式协同跟踪方法,该方法将自适应神经网络控制器从单个***扩展到多自主体***,解决了具有非对称饱和执行器的网络多自主体***的降维观测器设计和鲁棒分布式协同跟踪一致性问题。
为了达到上述目的,本发明是通过以下技术方案实现的:
本发明是一种执行器非对称饱和多自主体***的分布式协同跟踪方法,该方法包括如下步骤:
步骤1、构建受执行器非对称饱和与外部扰动影响的多自主体***;
步骤2、对多自主体***状态作特殊坐标基分解,得到相应子状态的对应动力学方程;
步骤3、设计降维观测器估计不可测状态的值;
步骤4、利用径向基函数神经网络对过饱和与外部扰动的部分进行估计;
步骤5、设计基于降维观测器的自适应控制算法,并给出非对称饱和***实现鲁棒一致性跟踪的条件。
本发明的进一步改进在于:所述步骤1的实现过程如下:
对于具有非对称输入饱和以及外部扰动的个跟随智能体的连续时间***和1个领导智能体的自治***,具体为:
,
,
其中:表示为第/>个跟随智能体状态变量的导数,/>表示为第/>个跟随智能体的可测量输出变量,/>表示为第几个跟随智能体,/>表示为第/>个跟随智能体的状态变量,/>表示为领导智能体的状态变量,/>表示为多自主体***的输入和非对称饱和执行器的输出值,/>表示为第/>个跟随智能体的外部扰动,/>表达为领导智能体的可测量输出变量,
跟随者被标记为,领导者的下标为0,/>为智能体的状态变量,为可测量输出变量,/>为状态变量的导数,/>,n表示每个智能体状态变量的维数,p表示每个智能体可测量输出变量的维数,表示第/>个智能体的外部扰动,并且存在有界扰动函数/>使得关系式成立,为***的输入和非对称饱和执行器的输出值,具体为:
其中,/>和/>分别为/>未知的上界值和下界值,/>是不考虑输入饱和的控制输入变量,/>为维数匹配的矩阵,用/>表示欧几里得空间中维数为/>的矩阵,/>表示/>维的单位矩阵,/>表示相应维数的零矩阵或者常数零;
为了方便控制器的设计,定义新的函数为和,因此/>个跟随智能体的转换动力学模型为:
,
其中为超过饱和的部分,/>表示过饱和与外部扰动之和,/>表示不考虑输入饱和的控制输入变量。
本发明的进一步改进在于:步骤2具体包括以下步骤:
步骤21、执行器非对称饱和多自主体***中的矩阵对满足可镇定,可检测,左可逆和最小相位条件,并且***中左可逆和无限零点结构中的所有元素都为1,即阶次均为1的前提条件下,利用特殊坐标基分解技术对跟随智能体的转换动力学模型进行分解,通过非奇异状态转换矩阵/>和输出转换矩阵/>,其中状态转换矩阵的逆矩阵为/>,并且为具有相应维数的矩阵,对每个跟随智能体和领导智能体的状态和输出进行分解为/>和,其中/>,/>和/>分别为转换后的状态向量和输出向量,三个子状态/>,/>和/>,其中/>表示没有直接输入和输出的子***,显示给定***的有限零点结构;/>表示没有直接输入的子***,显示给定***的左可逆性结构;/>表示有直接输入和输出的子***,显示给定***的无限零点结构,且/>,/>,/>,,/>为具体的分解向量,具体表示形式为:
,
其中均表示实数;
步骤22、给出相应子状态的对应动力学方程,对于子状态,有
,
由于执行器非对称饱和多自主体***中的矩阵对是最小相位的假设,因此/>是Hurwitz的,/>和/>为具有相应维数的矩阵;
对于子状态中的每个元素,有
,
对于子状态中的每个元素,有
,
其中,为通过MATLAB中的线性***工具包求解得到的具有对应匹配维数的子***参数矩阵,/>表示不考虑输入饱和的控制输入变量,/>表示过饱和与外部扰动之和,
由上式可知子状态和/>通过测量输出为可测部分,子状态/>为不可测部分且不受未知输入信号的影响。
本发明的进一步改进在于:所述步骤3设计降维观测器估计不可测状态的值具体为:
根据步骤21可知,特殊坐标基方法将状态划分为三个子状态,/>和,对步骤22子状态/>设计一个不受未知输入信号影响的观测器观测不可测部分的状态,其中,/>,并对执行器非对称饱和多自主体***设计观测器来估计智能体的状态轨迹,具体为:
,
其中,和/>分别为/>和/>的观测器,/>为***跟随智能体状态的降维观测器,/>为输出转换矩阵/>的逆矩阵,/>表示经过转换后的输出向量,/>表示第/>个跟随智能体的可测量输出变量。
本发明的进一步改进在于:所述步骤4对过饱和与外部扰动之和进行估计具体为:
为过饱和和外部扰动的未知函数,需要对该部分进行估计。径向基函数神经网络可以逼近紧集/>上的任意连续函数,因此采用径向基函数神经网络来估计第/>个智能体的连续函数/>,具体形式为:
,
其中:其中神经网络的节点数为,节点数越多,近似值越精确,/>为理想权值向量,/>为理想权值向量的转置,/>为在/>上有界的近似误差,/>为径向基函数向量,/>表示输入向量,/>采用一般高斯函数的表达式为:/>,神经网络的节点数为/>,节点数越多,近似值越精确,/>为欧式范数,/>和/>分别为高斯函数的中心和方差,理想权值向量为理论分析所需的人为值:,其中/>和/> 为理想权值向量的估计值及其转置,因此/>需要通过函数逼近来估计。
本发明的进一步改进在于:所述步骤5包括以下步骤:
步骤51、用一个包含个跟随智能体和1个领导智能体的连通的有向图/>来刻画智能体之间的信息交互拓扑关系,其中领导智能体为有向生成树的根节点,并且所有跟随智能体都能获取到领导智能体的有向信息,定义其邻接矩阵和拉普拉斯矩阵分别为和/>,其中,/>表示邻接矩阵中的具体元素值,其值为0或1,/>表示拉普拉斯矩阵中的具体元素值,/>表示领导智能体和跟随智能体之间的拓扑关系,/>满足非奇异/>矩阵的定义,它的特征值为均具有正实部,且存在正定对角矩阵,使得/>成立,其中,定义/>的最小特征值为/>;
步骤52、求解代数黎卡提方程进而获取:
;
步骤53、根据所得的和/>,定义/>和,有/>,其中/>,结合/>,/>和/>,定义/>为和/>,/>,/>相关的变量,设计自适应控制算法:
,
其中:为和第/>个跟随智能体相关的时变耦合权值,并且其初值满足,/>为时变函数,/>且每个值为正数,/>为/>的估计值,/>表示很小的正常数,定义/>,,,,/>,,/>,每个跟随智能体基于降阶观测器的自适应控制算法写成紧凑形式为:
,
其中,神经网络自适应律为
,
和/>为自适应增益矩阵,/>和/>为正常数;
在半全局协同一致性结果中,所有智能体的初始状态值选自于一个任意大的有界集,因此根据拉萨尔不变集原理,耦合状态/>,动力学参数/>和都是有界的,根据有界输入有界输出的神经网络自适应***得出/>和/>是有界的,又因为高斯函数/>和/>函数/>是有界的,进而/>中的每一项都是有界的,所以控制输入/>是有界的,结合步骤2知/>是有界的,又因为/>和/>均有界,分别用/>,/>和/>表示,因此定义/>的具体形式为;
则,对于给定紧集上的任意初始值,都能构造出一个比/>大的紧集/>,从而径向基函数神经网络近似估计/>是有效的,当选择合适的/>,/>,/>,/>和/>,以及参数满足/>,/>时,***实现半全局鲁棒一致跟踪,并且/>收敛到残差集
,
其中:的表达式为/>,/>,/>为通过MATLAB中的线性***工具包求解得到的具有对应匹配维数的子***参数矩阵的转置,/>表示/>的转置,
,,且/>是方程的解。
本发明的有益效果是:本发明的分布式协同跟踪方法,主要针对***受非对称饱和执行器和外部扰动影响的多自主体***。该方法在***输入和外部扰动都是有界且状态不可测的前提条件下,运用径向基函数神经网络估计过饱和和外部扰动的部分,对原来的多自主体***模型进行转换;根据转换后的***模型,设计出降维观测器来估计多自主体***中各智能体不可测的状态轨迹;根据输出信息和降维观测器信息,构建该多自主体***的基于降阶观测器的自适应协议;再根据设计出的自适应控制算法给出驱动这类执行器非对称饱和多自主体***实现半全局鲁棒协同跟踪的充分条件。
该方法将自适应神经网络控制器从单个***扩展到多自主体***,从无向拓扑扩展到有向拓扑,达到了算法设计、参数选取和充分条件全部呈分布式特性的目的,改进了集中式特性的可变性和灵活性,可以运用于大型复杂网络当中,对***智能体的容错力较大。
该方案同时突破了由执行器非对称饱和和干扰引起的非线性,与智能体之间的信息交换引起的耦合之间的复杂挑战。
同时该方法解决了具有非对称饱和执行器的网络多自主体***的降维观测器设计和鲁棒分布式协同跟踪问题。
本发明提出的执行器非对称饱和多自主体***的鲁棒分布式协同跟踪方法,在多自主体***的协同跟踪控制研究中基于输出反馈考虑了非对称饱和和外部扰动因素,并且不必知道外部扰动函数和非对称饱和执行器的上下界的先验知识,摆脱了对***状态信息的依赖,给出了***实现鲁棒协同跟踪的充分条件。
附图说明
图1为本发明方法的流程示意图。
图2为本发明多自主体***的领导智能体和跟随智能体的状态轨迹。
图3为基于降维观测器的自适应控制算法的轨迹。
图4为控制算法中自适应增益的整体变化轨迹。
图5为外部扰动和过饱和的估计轨迹过程。
具体实施方式
以下将以图式揭露本发明的实施方式,为明确说明起见,许多实务上的细节将在以下叙述中一并说明。然而,应了解到,这些实务上的细节不应用以限制本发明。也就是说,在本发明的部分实施方式中,这些实务上的细节是非必要的。
如图1所示,本发明是一种执行器非对称饱和多自主体***的分布式协同跟踪方法,利用该方法,将自适应神经网络控制器从单个***扩展到多自主体***,同时解决了具有非对称饱和执行器的网络多自主体***的降维观测器设计和鲁棒分布式协同跟踪问题。该方法包括如下步骤:
步骤1、构建受执行器非对称饱和与外部扰动影响的多自主体***,具体的实现过程如下:
对于具有非对称输入饱和以及外部扰动的个跟随智能体的连续时间***和1个领导智能体的自治***,具体为:
,
,
其中:表示为第/>个跟随智能体状态变量的导数,/>表示为第/>个跟随智能体的可测量输出变量,/>表示为第几个跟随智能体,/>表示为第/>个跟随智能体的状态变量,/>表示为领导智能体的状态变量,/>表示为多自主体***的输入和非对称饱和执行器的输出值,/>表示为第/>个跟随智能体的外部扰动,/>表达为领导智能体的可测量输出变量,
跟随者被标记为,领导者的下标为0,/>为智能体的状态变量,为可测量输出变量,/>为状态变量的导数,/>,n表示每个智能体状态变量的维数,p表示每个智能体可测量输出变量的维数,表示第/>个智能体的外部扰动,并且存在有界扰动函数/>使得/>关系式成立,为***的输入和非对称饱和执行器的输出值,具体为:
其中,/>和/>分别为/>未知的上界值和下界值,/>是不考虑输入饱和的控制输入变量,/>为维数匹配的矩阵,用/>表示欧几里得空间中维数为/>的矩阵,/>表示/>维的单位矩阵,/>表示相应维数的零矩阵或者常数零;
为了方便控制器的设计,定义新的函数为和,因此/>个跟随智能体的转换动力学模型为:
,
其中为超过饱和的部分,/>表示过饱和与外部扰动之和,/>表示不考虑输入饱和的控制输入变量。
步骤2、对多自主体***状态作特殊坐标基分解,得到相应子状态的对应动力学方程。
具体包括以下步骤:
步骤21、执行器非对称饱和多自主体***中的矩阵对满足可镇定,可检测,左可逆和最小相位条件,并且***中左可逆和无限零点结构中的所有元素都为1,即阶次均为1的前提条件下,利用特殊坐标基分解技术对跟随智能体的转换动力学模型进行分解,通过非奇异状态转换矩阵/>和输出转换矩阵/>,其中状态转换矩阵的逆矩阵为/>,并且为具有相应维数的矩阵,对每个跟随智能体和领导智能体的状态和输出进行分解为/>和,其中/>,/>和分别为转换后的状态向量和输出向量,三个子状态/>,/>和/>,其中表示没有直接输入和输出的子***,显示给定***的有限零点结构;/>表示没有直接输入的子***,显示给定***的左可逆性结构;/>表示有直接输入和输出的子***,显示给定***的无限零点结构,且/>,/>,/>,,/>为具体的分解向量,具体表示形式为:
,
其中均表示实数;
步骤22、给出相应子状态的对应动力学方程,对于子状态,有/>
,
由于执行器非对称饱和多自主体***中的矩阵对是最小相位的假设,因此/>是Hurwitz的,/>和/>为具有相应维数的矩阵;
对于子状态中的每个元素,有
,
对于子状态中的每个元素/>,有
,
其中,为通过MATLAB中的线性***工具包求解得到的具有对应匹配维数的子***参数矩阵,/>表示不考虑输入饱和的控制输入变量,/>表示过饱和与外部扰动之和,
由上式可知子状态和/>通过测量输出为可测部分,子状态/>为不可测部分且不受未知输入信号的影响。
步骤3、设计降维观测器估计不可测状态的值。
根据步骤21可知,特殊坐标基方法将状态划分为三个子状态,/>和/>,对步骤22子状态/>设计一个不受未知输入信号影响的观测器观测不可测部分的状态,其中,/>,并对执行器非对称饱和多自主体***设计观测器来估计智能体的状态轨迹,具体为:
,
其中,和/>分别为/>和/>的观测器,/>为***跟随智能体状态的降维观测器,/>为输出转换矩阵/>的逆矩阵,/>表示经过转换后的输出向量,/>表示第/>个跟随智能体的可测量输出变量。
步骤4、利用径向基函数神经网络对过饱和与外部扰动的部分进行估计,具体为:
根据步骤2可知,为过饱和和外部扰动的未知函数,需要对该部分进行估计。径向基函数神经网络可以逼近紧集/>上的任意连续函数,因此采用径向基函数神经网络来估计第/>个智能体的连续函数/>,具体形式为:
,
其中:其中神经网络的节点数为,节点数越多,近似值越精确,为理想权值向量,/>为理想权值向量的转置,/>为在上有界的近似误差,/>为径向基函数向量,/>表示输入向量,/>采用一般高斯函数的表达式为:,神经网络的节点数为/>,节点数越多,近似值越精确,/>为欧式范数,/>和/>分别为高斯函数的中心和方差,理想权值向量为理论分析所需的人为值:,其中/>和/>为理想权值向量的估计值及其转置,因此/>需要通过函数逼近来估计。
步骤5、设计基于降维观测器的自适应控制算法,并给出非对称饱和***实现鲁棒一致性跟踪的条件,包括以下步骤:
步骤51、用一个包含个跟随智能体和1个领导智能体的连通的有向图/>来刻画智能体之间的信息交互拓扑关系,其中领导智能体为有向生成树的根节点,并且所有跟随智能体都能获取到领导智能体的有向信息,定义其邻接矩阵和拉普拉斯矩阵分别为和/>,其中,/>表示邻接矩阵中的具体元素值,其值为0或1,/>表示拉普拉斯矩阵中的具体元素值,/>表示领导智能体和跟随智能体之间的拓扑关系,/>满足非奇异/>矩阵的定义,它的特征值为/>均具有正实部,且存在正定对角矩阵/>,使得成立,其中/>,定义的最小特征值为/>;
步骤52、求解代数黎卡提方程进而获取:/>
;
步骤53、根据所得的和/>,定义/>和,有/>,其中,结合/>,/>和/>,定义/>为和/>,/>,/>相关的变量,设计自适应控制算法:
,
其中:为和第/>个跟随智能体相关的时变耦合权值,并且其初值满足,/>为时变函数,/>且每个值为正数,/>为/>的估计值,/>表示很小的正常数,定义/>,,/>,/>,/>,,/>,每个跟随智能体基于降阶观测器的自适应控制算法写成紧凑形式为:
,
其中,神经网络自适应律为
,
和/>为自适应增益矩阵,/>和/>为正常数;
在半全局协同一致性结果中,所有智能体的初始状态值选自于一个任意大的有界集,因此根据拉萨尔不变集原理,耦合状态/>,动力学参数/>和都是有界的,根据有界输入有界输出的神经网络自适应***得出/>和/>是有界的,又因为高斯函数/>和/>函数/>是有界的,进而/>中的每一项都是有界的,所以控制输入/>是有界的,结合步骤2知/>是有界的,又因为/>和/>均有界,分别用/>,/>和/>表示,因此定义/>的具体形式为/>;
则,对于给定紧集上的任意初始值,都能构造出一个比/>大的紧集/>,从而径向基函数神经网络近似估计/>是有效的,当选择合适的/>,/>,/>,/>和/>,以及参数满足/>,/>时,***实现半全局鲁棒一致跟踪,并且/>收敛到残差集
,
其中:的表达式为/>,/>,/>为通过MATLAB中的线性***工具包求解得到的具有对应匹配维数的子***参数矩阵的转置,/>表示/>的转置,
,/>,且/>是方程/>的解。
下面结合具体实例进行详细阐述。
考虑一个由6个跟随智能体和1个领导智能体组成的多自主体***,其中6个跟随智能体的有向通信拓扑结构用邻接矩阵表示为并且只有第一个跟随智能体能够直接获得领导智能体的有向信息。
在该实例中,将利用特殊坐标基分解给出降维观测器的具体形式,并结合径向基函数神经网络,设计出相应的基于降维观测器的自适应控制算法来驱动各智能体的状态轨迹达到一致性。
给出满足条件的***矩阵为,显然执行器非对称饱和多自主体***中的矩阵对/>已经满足特殊坐标基分解的形式,其中,对不可测子状态/>进行观测器设计为,所以***状态的降维观测器设计为。领导智能体的初始状态/>随机选自/>,跟随智能体的初始状态/>随机选自/>。非对称饱和执行器的下界限和上界限分别为/>,为了简便每个跟随智能体的外部扰动函数均选取为/>。
在该实例中,解代数黎卡提方程得到,并选择。选择合适的/>,/>,/>,/>,,/>。
图2描述了领导智能体和跟随智能体的运动轨迹。
图3表达了控制输入的运动轨迹,表明设计的基于降维观测器的自适应控制算法能够使具有非对称饱和执行器的多自主体***实现鲁棒一致性跟踪,并且控制输入维持在非对称饱和执行器的上下界内,保证了多自主体***的性能。
图4描述了自适应增益的整体变化过程,从而说明它是有界且逐渐趋向于0的。
图5描述了估计函数的轨迹,表明径向基函数神经网络可以较好估计出未知的外部扰动和控制输入中过饱和部分。
该方法将自适应神经网络控制器从单个***扩展到多自主体***,同时解决了具有非对称饱和执行器的网络多自主体***的降维观测器设计和鲁棒分布式协同跟踪问题。
以上所述仅为本发明的实施方式而已,并不用于限制本发明。对于本领域技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原理的内所作的任何修改、等同替换、改进等,均应包括在本发明的权利要求范围之内。
Claims (5)
1.一种执行器非对称饱和多自主体***的分布式协同跟踪方法,其特征在于:所述方法包括如下步骤:
步骤1、构建受执行器非对称饱和与外部扰动影响的多自主体***;
步骤2、对多自主体***状态xi作特殊坐标基分解,得到相应子状态的对应动力学方程;
步骤3、设计降维观测器估计不可测状态的值;
步骤4、利用径向基函数神经网络对过饱和与外部扰动的部分进行估计;
步骤5、设计基于降维观测器的自适应控制算法,并给出非对称饱和***实现鲁棒一致性跟踪的条件,
所述步骤1的实现过程如下:
对于具有非对称输入饱和以及外部扰动的N个跟随智能体的连续时间***和1个领导智能体的自治***,具体为:
其中:表示为第i个跟随智能体状态变量的导数,yi表示为第i个跟随智能体的可测量输出变量,i表示为第几个跟随智能体,xi表示为第i个跟随智能体的状态变量,x0表示为领导智能体的状态变量,ui(vi)表示为多自主体***的输入和非对称饱和执行器的输出值,表示为第i个跟随智能体的外部扰动,y0表达为领导智能体的可测量输出变量,跟随者被标记为1-N,领导者的下标为0,/>为智能体的状态变量,/>为可测量输出变量,/>为状态变量的导数,s=0,1,…,N,n表示每个智能体状态变量的维数,p表示每个智能体可测量输出变量的维数,/>表示第i个智能体的外部扰动,并且存在有界扰动函数wi使得/>关系式成立,为***的输入和非对称饱和执行器的输出值,具体为:
其中k=1,2,…,m,和/>分别为uik未知的上界值和下界值,vik是不考虑输入饱和的控制输入变量,A,B,C为维数匹配的矩阵,用/>表示欧几里得空间中维数为m×n的矩阵,In表示n维的单位矩阵,0表示相应维数的零矩阵或者常数零;
定义新的函数为σi(vi)=ui(vi)-vi和σi(vi)+wi=δi,因此N个跟随智能体的转换动力学模型为:
其中σi(vi)为超过饱和的部分,δi表示过饱和与外部扰动之和,vi表示表示不考虑输入饱和的控制输入变量。
2.根据权利要求1所述的执行器非对称饱和多自主体***的分布式协同跟踪方法,其特征在于:所述步骤2具体包括以下步骤:
步骤21、执行器非对称饱和多自主体***中的矩阵对(A,B,C)满足可镇定,可检测,左可逆和最小相位条件,并且***中左可逆和无限零点结构中的所有元素都为1,即阶次均为1的前提条件下,利用特殊坐标基分解技术对跟随智能体的转换动力学模型进行分解,通过非奇异状态转换矩阵Γs=[Γsa Γsb Γsd]和输出转换矩阵Γo,其中状态转换矩阵的逆矩阵为并且/>为具有相应维数的矩阵,对每个跟随智能体和领导智能体的状态和输出进行分解为和/>其中i=0,1,…,N,/>和/>分别为转换后的状态向量和输出向量,三个子状态和/>其中/>表示没有直接输入和输出的子***,显示给定***的有限零点结构;/>表示没有直接输入的子***,显示给定***的左可逆性结构;/>表示有直接输入和输出的子***,显示给定***的无限零点结构,且 为具体的分解向量,具体表示形式为:
其中
均表示实数;
步骤22、给出相应子状态的对应动力学方程,对于子状态有
由于执行器非对称饱和多自主体***中的矩阵对(A,B,C)是最小相位的假设,因此是Hurwitz的,Lab和Lad为具有相应维数的矩阵;
对于子状态中的每个元素/>有
对于子状态中的每个元素/>有
其中,Lbbk,,Ldbk,Lddk,Eka,Ekb,Ekd为通过MATLAB中的线性***工具包求解得到的具有对应匹配维数的子***参数矩阵,vik表示不考虑输入饱和的控制输入变量,δik表示过饱和与外部扰动之和,
由上式可知子状态和/>通过测量输出为可测部分,子状态为不可测部分且不受未知输入信号的影响。
3.根据权利要求2所述的执行器非对称饱和多自主体***的分布式协同跟踪方法,其特征在于:所述步骤3设计降维观测器估计不可测状态的值具体为:
对步骤22子状态设计一个不受未知输入信号影响的观测器观测不可测部分的状态,其中,i=0,1,…,N,并对执行器非对称饱和多自主体***设计观测器来估计智能体的状态轨迹,具体为:
其中,和/>分别为/>和xia的观测器,/>为***跟随智能体状态的降维观测器,/>为输出转换矩阵Γo的逆矩阵,/>表示经过转换后的输出向量,yi表示表示第i个跟随智能体的可测量输出变量。
4.根据权利要求3所述的执行器非对称饱和多自主体***的分布式协同跟踪方法,其特征在于:所述步骤4对过饱和与外部扰动之和δi进行估计具体为:
采用径向基函数神经网络来估计第i个智能体的连续函数δi,i=1,…,N,具体形式为:
其中:为理想权值向量,/>为理想权值向量的转置,∈i为在Π上有界的近似误差,为径向基函数向量,表示输入向量,/>采用一般高斯函数的表达式为:/>神经网络的节点数为l≥1,节点数越多,近似值越精确,/>为欧式范数,μit和kit分别为高斯函数的中心和方差,理想权值向量为理论分析所需的人为值:其中/>和/>为理想权值向量的估计值及其转置,因此/>需要通过函数逼近来估计。
5.根据权利要求4所述的执行器非对称饱和多自主体***的分布式协同跟踪方法,其特征在于:所述步骤5包括以下步骤:
步骤51、用一个包含N个跟随智能体和1个领导智能体的连通的有向图g来刻画智能体之间的信息交互拓扑关系,其中领导智能体为有向生成树的根节点,并且所有跟随智能体都能获取到领导智能体的有向信息,定义其邻接矩阵和拉普拉斯矩阵分别为和/>其中,aij表示邻接矩阵中的具体元素值,其值为0或1,lijlij表示拉普拉斯矩阵中的具体元素值,L0表示L0表示领导智能体和跟随智能体之间的拓扑关系,L1满足非奇异M矩阵的定义,它的特征值为0=λ1≤λ2≤...≤λN均具有正实部,且存在正定对角矩阵G=diag{g1,...,gN}∈RN×N,使得/>成立,其中定义/>的最小特征值为λ0;
步骤52、求解代数黎卡提方程进而获取Q>0:
ATQ+QA-2QBBTQ+Ⅰ=0;
步骤53、根据所得的和/>定义/>和有/>其中结合σi(vi),wi和∈i,定义ηi为和σi(vi),wi,∈i相关的变量,设计自适应控制算法:
其中:di为和第i个跟随智能体相关的时变耦合权值,并且其初值满足di(0)>1,ρi为时变函数,且每个值为正数,/>为ηi的估计值,/>表示很小的正常数,定义
每个跟随智能体基于降阶观测器的自适应控制算法写成紧凑形式为:
其中,神经网络自适应律为
Γ=ΓT>0和Ξ=ΞT>0为自适应增益矩阵,kw和kη为正常数;
在半全局协同一致性结果中,所有智能体的初始状态值选自于一个任意大的有界集因此根据拉萨尔不变集原理,耦合状态ξi(t),动力学参数di(t)和ρi(t)都是有界的,根据有界输入有界输出的神经网络自适应***得出/>和/>是有界的,又因为高斯函数/>和tanh函数/>是有界的,进而vi中的每一项都是有界的,所以控制输入vi是有界的,σi(vi)是有界的,又因为wi和∈i均有界,分别用 和/>表示,因此定义ηi的具体形式为/>
则,对于给定紧集∏v上的任意初始值,都能构造出一个比∏v大的紧集∏,从而径向基函数神经网络近似估计δi是有效的,当选择合适的Γ,Ξ,kw,kη和以及参数满足 时,***实现半全局鲁棒一致跟踪,并且ξ收敛到残差集
其中:Ea的表达式为 为通过MATLAB中的线性***工具包求解得到的具有对应匹配维数的子***参数矩阵的转置,/>表示Ea的转置, 且Paa>0是方程/>的解。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310893839.1A CN116627042B (zh) | 2023-07-20 | 2023-07-20 | 执行器非对称饱和多自主体***的分布式协同跟踪方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310893839.1A CN116627042B (zh) | 2023-07-20 | 2023-07-20 | 执行器非对称饱和多自主体***的分布式协同跟踪方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116627042A CN116627042A (zh) | 2023-08-22 |
CN116627042B true CN116627042B (zh) | 2023-09-29 |
Family
ID=87597582
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310893839.1A Active CN116627042B (zh) | 2023-07-20 | 2023-07-20 | 执行器非对称饱和多自主体***的分布式协同跟踪方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116627042B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107065847A (zh) * | 2016-03-31 | 2017-08-18 | 北京航空航天大学 | 一种执行器非对称饱和的水面舰船轨迹跟踪控制方法 |
CN108388123A (zh) * | 2018-03-09 | 2018-08-10 | 迪比(重庆)智能科技研究院有限公司 | 多个仿人机器人在速度不可测下的自适应控制方法 |
CN108710303A (zh) * | 2018-07-25 | 2018-10-26 | 西北工业大学 | 含有多源扰动及执行器饱和的航天器相对姿态控制方法 |
CN113359445A (zh) * | 2021-06-01 | 2021-09-07 | 上海工程技术大学 | 一种多智能体磁滞***分布式输出反馈渐近一致控制方法 |
CN114841074A (zh) * | 2022-05-17 | 2022-08-02 | 重庆大学 | 基于状态观测与经验池的非线性多智能体一致性方法 |
CN115179295A (zh) * | 2022-08-04 | 2022-10-14 | 电子科技大学 | 一种多欧拉-拉格朗日***鲁棒二分一致性跟踪控制方法 |
CN115356929A (zh) * | 2022-08-23 | 2022-11-18 | 西安电子科技大学 | 执行器攻击奇异多智能体***比例容许跟踪控制方法 |
CN115840426A (zh) * | 2022-11-15 | 2023-03-24 | 华东交通大学 | 一种基于事件的多智能体***主动抗扰一致性控制方法 |
-
2023
- 2023-07-20 CN CN202310893839.1A patent/CN116627042B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107065847A (zh) * | 2016-03-31 | 2017-08-18 | 北京航空航天大学 | 一种执行器非对称饱和的水面舰船轨迹跟踪控制方法 |
CN108388123A (zh) * | 2018-03-09 | 2018-08-10 | 迪比(重庆)智能科技研究院有限公司 | 多个仿人机器人在速度不可测下的自适应控制方法 |
CN108710303A (zh) * | 2018-07-25 | 2018-10-26 | 西北工业大学 | 含有多源扰动及执行器饱和的航天器相对姿态控制方法 |
CN113359445A (zh) * | 2021-06-01 | 2021-09-07 | 上海工程技术大学 | 一种多智能体磁滞***分布式输出反馈渐近一致控制方法 |
CN114841074A (zh) * | 2022-05-17 | 2022-08-02 | 重庆大学 | 基于状态观测与经验池的非线性多智能体一致性方法 |
CN115179295A (zh) * | 2022-08-04 | 2022-10-14 | 电子科技大学 | 一种多欧拉-拉格朗日***鲁棒二分一致性跟踪控制方法 |
CN115356929A (zh) * | 2022-08-23 | 2022-11-18 | 西安电子科技大学 | 执行器攻击奇异多智能体***比例容许跟踪控制方法 |
CN115840426A (zh) * | 2022-11-15 | 2023-03-24 | 华东交通大学 | 一种基于事件的多智能体***主动抗扰一致性控制方法 |
Non-Patent Citations (5)
Title |
---|
Observer-Based Robust Containment Control of Multi-agent Systems With Input Saturation;Juan Qian等;《2020 39th Chinese Control Conference (CCC)》;771-776 * |
Observer-based semi-global containment of saturated multi-agent systems with uncertainties;Juan Qian等;《Journal of the Franklin Institute》;第358卷(第15期);7740-7760 * |
一类含执行器故障的线性多智能体***的自适应分组一致控制;王爱玲;《中国优秀硕士学位论文全文数据库 信息科技辑》(第02(2023)期);I140-102 * |
基于观测器的多智能体***自适应跟踪控制;赵蕊;朱美玲;徐勇;;计算机工程;第43卷(第04期);317-321 * |
高阶非线性不确定多智能体***自适应RBF神经网络协同控制;黄小龙;陈阳舟;;北京工业大学学报;第46卷(第09期);1008-1017 * |
Also Published As
Publication number | Publication date |
---|---|
CN116627042A (zh) | 2023-08-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhang et al. | Cooperative adaptive event-triggered control for multiagent systems with actuator failures | |
CN112527016B (zh) | 一种智能集群一体化容错时变编队控制方法及*** | |
CN113110039B (zh) | 一种多智能体***的有限时间分布式聚合优化方法 | |
CN109986562B (zh) | 一种平面机械臂***及其分散式容错控制方法 | |
CN109491244B (zh) | 一种基于滑模观测器的无人机编队***故障诊断方法 | |
Chen et al. | H/sub/spl infin//output feedback control of discrete-time fuzzy systems with application to chaos control | |
CN113359445B (zh) | 一种多智能体磁滞***分布式输出反馈渐近一致控制方法 | |
CN112305918A (zh) | 超螺旋观测器下的多智能体***滑模容错一致性控制算法 | |
WO2022088857A1 (zh) | 金属棒温度分布***的鲁棒启发式迭代学习控制方法 | |
Kchaou | Robust observer-based sliding mode control for nonlinear uncertain singular systems with time-varying delay and input non-linearity | |
CN109088406A (zh) | 一种基于lstm神经网络的微电网等效建模方法 | |
Meng et al. | NN-based asymptotic tracking control for a class of strict-feedback uncertain nonlinear systems with output constraints | |
CN100483276C (zh) | 一种基于噪声估计的自适应状态反馈预测控制方法 | |
Hua et al. | Memoryless state feedback controller design for time delay systems with matched uncertain nonlinearities | |
CN114326664B (zh) | 一种非线性多智能体的容错控制器设计方法及存储介质 | |
Chen et al. | Input–output finite-time reliable static output control of time-varying system with input delay | |
Mirlekar et al. | A biologically-inspired approach for adaptive control of advanced energy systems | |
Jiang et al. | Composite learning adaptive tracking control for full-state constrained multiagent systems without using the feasibility condition | |
Rana et al. | Efficient maximum power point tracking in fuel cell using the fractional-order PID controller | |
CN116627042B (zh) | 执行器非对称饱和多自主体***的分布式协同跟踪方法 | |
Kocaarslan et al. | Experimental modelling and simulation with adaptive control of power plant | |
Peng et al. | Neuro-adaptive cooperative control for high-order nonlinear multi-agent systems with uncertainties | |
Wang et al. | Hierarchical decomposition based distributed adaptive control for output consensus tracking of uncertain nonlinear systems | |
CN116449704A (zh) | 非线性高阶全驱多智能体***分布式包容控制方法 | |
Zhu et al. | Observer-Based Output Consensus Control Scheme for Strict-Feedback Nonlinear Multi-Agent Systems With Disturbances |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |