CN110928185B

CN110928185B - 一种多智能体***的量化控制方法

Info

Publication number: CN110928185B
Application number: CN201911159148.9A
Authority: CN
Inventors: 刘治; 林壮壁; 章云
Original assignee: Guangdong University of Technology
Current assignee: Guangdong University of Technology
Priority date: 2019-11-22
Filing date: 2019-11-22
Publication date: 2022-07-05
Anticipated expiration: 2039-11-22
Also published as: CN110928185A

Abstract

本发明公开了一种多智能体***的量化控制方法，所述多智能体***包括一个领导者和N个跟随者；所述控制方法包括以下步骤：建立多智能体***的***模型，包括跟随者的***模型以及领导者的***模型；建立多智能体***的误差***，包括第i个跟随者与领导者输出之间的误差，以及第i个跟随者***的q阶状态与虚拟控制器之间的误差；设计多智能体***的控制器，包括为第i个跟随者设计第一个虚拟控制器至第q个虚拟控制器，然后为第i个跟随者设计控制输入。本发明解决了现有技术中不能保证在控制器与智能体之间带宽受限情况下的***稳定性的问题。

Description

一种多智能体***的量化控制方法

技术领域

本申请涉及多智能体一致性控制领域，具体涉及一种对不确定***结构的单领导者多智能体的量化控制方法。

背景技术

人们从自然界中生物的群集行为受到启发，提出了分布式的思想。分布式比起集中式有更高的鲁棒性，能以更少的资源代价完成更复杂的任务。为此，人们提出了多智能体***。多智能体***是指由多个智能体组合而成的***，其中每一个智能体都能独立作用于自身和环境，但却不需要全局的信息资源。

多智能体***的多智能体技术被广泛应用于智能机器人、智能交通、无人机编队控制、分布式预测、智能电网等方面，其中最受到关注的是多智能体的一致性控制问题。一致性是指随着时间的增大，多智能***中的所有个体的状态都趋于一个相同的值；一致性问题是多智能体***的根本性问题。

国内外已经有很多文献对多智能体的一致性控制进行了研究，实现了理想条件下各个跟随者对领导者的跟随。但是在很多实际应用中，智能体与控制器之间的通讯带宽是有限的，这导致智能体收到的控制信号并不是连续的和实时的，如果没有合适的调整与设计，***的稳定性就得不到保证。

发明内容

本申请的目的是提供一种多智能体***的量化控制方法，用以解决现有技术中不能保证在控制器与智能体之间带宽受限情况下的***稳定性的问题。

为了实现上述任务，本申请采用以下技术方案：

一种多智能体***的量化控制方法，所述多智能体***包括一个领导者和N个跟随者；所述控制方法包括以下步骤：

建立多智能体***的***模型，包括跟随者的***模型以及领导者的***模型；

建立多智能体***的误差***，包括第i个跟随者与领导者输出之间的误差，以及第i个跟随者的q阶状态与虚拟控制器之间的误差；

设计多智能体***的控制器，包括为第i个跟随者设计第一个虚拟控制器至第q个虚拟控制器，然后为第i个跟随者设计控制输入。

进一步地，所述跟随者的***模型表示为：

对于第i个跟随者，建立如下的***模型：

y_i＝x_i，1，i＝1，2，...N 式3

其中

x_i，q和

代表***的状态变量，其中，q为***状态变量的阶数，n_i为第i个跟随者的总***阶数，参数上方加圆点表示该参数的导数，f_i，q()和

代表未知但光滑的函数，Δ_i，q(t)和

代表未知时变干扰，Q_i(u_i)代表控制输入u_i经过量化器后的输出，u_i＝u_i(t)代表真实控制输入，y_i代表每个跟随者的输出，N代表跟随者的个数。

进一步地，所述量化器的模型为：

其中量化器的量化等级为：

δ_i+，δ_i-∈(0，1)为可以选择的量化密度，

和

为死区参数，u_i(t^-)代表u_i(t)上一时刻的状态，p＝1，2，...为从1到正无穷的整数。

进一步地，所述领导者的***模型表示为：

y₀＝x₀ 式8

y₀表示领导者的输出，

表示领导者的输出的导数，f₀(x₀，t)为一个已知的有界函数，即想要跟踪的领导者的输出的导数函数。

进一步地，所述第i个跟随者与领导者输出之间的误差，表示为：

其中i和j分别表示第i个和第j个跟随者，a_ij≥0为第i个跟随者收到的第j个跟随者的信息权重，b_i≥0为第i个跟随者收到领导者的信息权重，a_ij和b_i都是非负常数。

进一步地，所述i个跟随者的q阶状态与虚拟控制器之间的误差表示为：

s_i，q＝x_i，q-α_i，q-1，q＝2，...，n_i 式10

其中α_i，q-1为第i个跟随者的第q-1个虚拟控制器。

进一步地，所述第i个跟随者的第一个虚拟控制器表示为：

其中s_i，1为第i个跟随者***的1阶状态与虚拟控制器之间的误差，S_i，1为径向基函数向量，S_i，1＝S_i，1(X_i，1),X_i，1＝[x_i，1，x_j，1]^T，x_i，1表示第i个跟随者的第1阶状态，x_j，1、x_j，2分别表示第j个跟随者的第1阶状态，

为自适应率，c_i，1和a_i，1为正的可调参数，

进一步地，所述第i个跟随者的第二个虚拟控制器表示为：

其中c_i，2和a_i，2为正的可调参数，s_i，2为第i个跟随者***的2阶状态与虚拟控制器之间的误差，S_i，2为径向基函数向量，S_i，2＝S_i，2(X_i，2)且

为自适应率；

第i个跟随者的第q个虚拟控制器表示为：

其中c_i，q和a_i，q为正的可调参数，其中S_i，q为径向基函数向量，S_i，q＝S_i，q(X_i，q)且

为自适应率，

x_i，q、x_j，q分别表示第i个跟随者、第j个跟随者***的q阶状态。

进一步地，所述第i个跟随者设计控制输入，表示为：

其中：

其中

a_i，k,

k_i，0，k_i，1，g_i，r_i为正的可调参数，

s_i，k为第i个跟随者***的n_i阶、k阶状态，

为径向基函数向量且

分别表示第i个跟随者、第j个跟随者***的n_i阶状态，

为

的导数，

为自适应率

的导数。

进一步地，所述第i个跟随者通过获取领导者以及它所能获取的其他跟随者的信息，将输出之间的误差进行计算，计算出的一阶误差建立第一个虚拟控制器，然后通过第一个控制器与自身的第二阶状态进行对比，计算二阶误差，并建立第二个虚拟控制器，然后与第三阶状态进行对比，计算出三阶误差，计算第三个虚拟控制器；以此类推，直到最终得到n_i阶误差，之后计算真正的输入u_i；u_i经过量化器模型，产生真正的量化控制信号Q_i(u_i)，使用自适应率来对量化信号进行自适应，可以使得第i个跟随者跟随到领导者的输出，实现量化控制。

本申请与现有技术相比，具有以下技术特点：

1.本申请使用了神经网络对***里含有的不确定项和干扰信号进行估算，从而提供了一种含有不确定项和干扰信号的多智能体***控制方法，相比普通的多智能体***，有更广泛的应用和更好的实践效果，可以保证在不同通讯速率要求下的含有不确定项的多智能体***的稳定性。

2.本申请针对量化器的量化效果，对***的控制输入进行了调整，从而提供了一种量化控制方案，可以自行调节量化器的量化等级，来满足不同的通讯速率要求，并且不管量化器多么粗糙，始终能保证***的稳定性。

附图说明

图1为本申请的流程示意图；

图2为量化器的示意图。

具体实施方式

本申请公开了一种多智能体***的量化控制方法，用以实现在不同通讯速率要求限制下多智能体***的一致性控制。该方法为每一个具有严格反馈结构的跟随者多智能体设计对应的控制器；所述方法包括以下步骤：

步骤1，建立多智能体***的***模型，其中，所述多智能体***包括一个领导者和N个跟随者。

步骤1.1，建立跟随者的***模型

对于第i个跟随者，建立如下的***模型：

y_i＝x_i，1，i＝1，2，...N 式3

其中

x_i，q和

代表***的状态变量，其中，q为***状态变量的阶数，n_i为第i个跟随者的总***阶数。参数上方加圆点表示该参数的导数，下同；f_i，q()和

代表未知但光滑的函数，Δ_i，q(t)和

通过引入量化器，将输入进行量化，从而使多智能体***里的跟随者收到的控制信号不再是连续的，降低了通讯速率，可以通过调整量化器里面的量化等级参数，来满足不同的通讯速率要求。

量化器的模型为：

其中量化器的量化等级为：

如图2所示，δ_i+，δ_i-∈(0，1)为可以选择的量化密度，

和

为死区参数。

代表u_i的导数。u_i(t^-)代表u_i(t)上一时刻的状态，p＝1，2，...为从1到正无穷的整数。

步骤1.2，建立领导者的***模型

领导者的***模型表示为：

y₀＝x₀ 式8

y₀表示领导者的输出，下标0表示领导者，即领导者在多智能体***中的编号是0。

表示输出的导数，f₀(x₀，t)为一个已知的有界函数，即想要跟踪的领导者的输出的导数函数。在实际操作中，可以根据任意想要的输出轨迹给出，比如想要让所有的跟随者输出是一个正弦曲线，那他的导数就是余弦曲线。

通过步骤1建立了多智能体***的***模型，为后续的控制器设计提供基础。

步骤2，建立多智能体***的误差***。

本方案中，为实现跟随者的输出与领导者的输出同步，将该问题转化为降低跟随者与领导者输出之间的误差。

步骤2.1，首先定义第i个跟随者与领导者输出之间的误差：

降低上述的误差，将误差收敛到0，即可实现跟随者的输出最终追随到领导者。在实践中，跟随者可能不能收到领导者的信息，而只收到其他跟随者的信息，因此在定义的误差中，引进了其他跟随者信息的权重，让其他跟随者的输出也可以为当前的跟随者提供信息。

步骤2.2，定义第i个跟随者的q阶状态与虚拟控制器之间的误差：

s_i，q＝x_i，q-α_i，q-1，q＝2，...，n_i 式10

其中α_i，q-1为第i个跟随者的第q-1个虚拟控制器，通过步骤3设计。

因为不能直接控制跟随者的输出，只能通过设计输入来间接控制跟随者的输出，因此需要将跟随者的每一阶状态都进行控制，让这些状态跟随到需要的状态，最终实现对真正输出的控制。

步骤3，设计多智能体***的控制器

步骤3.1，为第i个跟随者设计第一个虚拟控制器，表示为

其中S_i，1为径向基函数向量，它的定义为:

S(X)被定义为径向基函数向量，即S(X)＝[S₁(X)，S₂(X)，...，S_l(X)]^T,其中l为径向基函数向量的维数，可以任意选取为一个大于等于2的整数。X表示函数的变量，

其中v_k表示径向基函数的半径，

表示径向基函数的宽度，都可以任意选取。

s_i，1为第i个跟随者***的1阶状态与虚拟控制器之间的误差，S_i，1＝S_i，1(X_i，1),X_i，1＝[x_i，1，x_j，1]^T，x_i，1表示第i个跟随者的第1阶状态，x_j，1、x_j，2分别表示第j个跟随者的第1阶状态，其中，

为自适应率，将在步骤3.3给出。c_i，1和a_i，1为正的可调参数，

第一个控制器的设计使用了在步骤2中所定义的误差，以及所能获得的其他智能体(包括领导者和其他跟随者)的信息。

如果x_i，2是能直接设计的输入，那令x_i，2＝α_i，1，就可以达到设计目的。但是没有办法直接设计x_i，2，因此希望x_i，2可以去接近设计的第一个控制器α_i，1。在步骤2.2中定义了s_i，2的误差，如果这个误差也能收敛到0，那x_i，2＝α_i，1，就可以实现控制目的，追随者的输出与领导者的输出同步。

第i个跟随者的第一个虚拟控制器用来控制第i个跟随者的输出，然而在实际***中并没有出现这个虚拟控制器，因此需要控制第i个跟随者的第2阶的状态去逼近第一个虚拟控制器，来达到控制目的。

步骤3.2，为第i个跟随者设计剩余的虚拟控制器

先为第i个跟随者设计第二个虚拟控制器：

为自适应率。

接下来为第i个跟随者设计第q个虚拟控制器(3≤q≤n_i-1)

其中c_i，q和a_i，q为正的可调参数。其中S_i，q为径向基函数向量，S_i，q＝S_i，q(X_i，q)且

为自适应率，

步骤3.3，为第i个跟随者设计真正的控制输入：

其中：

其中

a_i，k,

k_i，0，k_i，1，g_i，r_i为正的可调参数，

s_i，k为第i个跟随者***的n_i阶、k阶状态，

为径向基函数向量且

分别表示第i个跟随者、第j个跟随者***的n_i阶状态。

为

的导数，

为自适应率

的导数，给定

和

一个正的初值，就可以通过他们的导数计算出他们随时间变化的值。

在其他参数不变的情况下，通过增大c_i，k，k_i，0，k_i，1，r_i，g_i,中一个或者全部，可以降低最终跟随者的输出与领导者输出之间的误差；在其他参数不变的情况下，通过减小a_i，k，也可以降低最终跟随者的输出与领导者输出之前的误差。其中i＝1，2，...N,k＝1，2...n_i。

步骤3中虚拟控制器和控制输入的设计使用了神经网络对未知函数进行估计，从而使控制器能够适应多智能体***中含有的不确定项。步骤3中控制器的设计使用了李雅普诺夫稳定性方法进行设计，可以保证误差***随着时间的推移而趋于稳定。

考虑到输入到第i个跟随者的并不是控制信号，而是控制信号经过量化器后的信号，这个信号是离散的和失真的，因此设计了一个自适应参数

来补偿控制信号经过量化器所产生的误差。

具体操作：

先为第i个跟随者设计控制输入信号u_i

第i个跟随者通过获取领导者以及它所能获取的其他跟随者的信息，将输出之间的误差进行计算，使用式9计算出的一阶误差s_i，1通过式11建立第一个虚拟控制器，然后利用式10通过第一个控制器与自身的第二阶状态进行对比，计算二阶误差s_i，2，使用已经得到的s_i，2通过式12建立第二个虚拟控制器α_i，2，得到α_i，2后可以与第i个跟随者的第3阶状态进行对比，通过式10计算出三阶误差s_i，3，得到s_i，3就可以通过式13计算第三个虚拟控制器α_i，3，然后用式10计算出四阶误差s_i，4，通过式13用s_i，4计算第四个虚拟控制器α_i，4。从式13到式10到式13，这样反复进行，直到最终根据式10得到n_i阶误差

之后通过式14计算真正的输入u_i。本方案中没有直接设计输入u_i，而是通过一步步设计虚拟控制率的方式，来完成设计。

然后将设计完成的u_i产生方式应用到第i个跟随者：

通过式14为第i个跟随者设计控制输入u_i，u_i经过量化器式4，产生真正的量化控制信号Q_i(u_i)，在输入u_i的设计里已经考虑了量化器的量化效应，使用自适应率

式16来对量化信号进行自适应，因此u_i经过量化产生的控制信号Q_i(u_i)，可以使得第i个跟随者跟随到领导者的输出，实现量化控制。

根据式2可以看出，Q_i(u_i)直接控制了第i个智能体的第n_i阶状态的导数，从而控制第i个智能体的第n_i阶状态，根据式1，第i个跟随者的第n_i阶状态可以控制第n_i-1阶状态的导数，且n_i-1阶状态的导数可以控制n_i-1阶状态，n_i-1阶状态可以控制n_i-2阶状态的导数依次类推，最终可以控制到第i个跟随者的第一阶状态，也就是第i个跟随者的输出，使它的输出跟随到领导者的输出。

这样就完成了设计，使用发明的控制器，可以使所有的跟随者的输出最终趋近到领导者的输出。

Claims

1.一种多智能体***的量化控制方法，所述多智能体***包括一个领导者和N个跟随者；其特征在于，所述控制方法包括以下步骤：

设计多智能体***的控制器，包括为第i个跟随者设计第一个虚拟控制器至第q个虚拟控制器，然后为第i个跟随者设计控制输入；

量化器的模型为：

其中量化器的量化等级为：

δ_i+,δ_i-∈(0,1)为可以选择的量化密度，

和

为死区参数，u_i(t^-)代表u_i(t)上一时刻的状态，p＝1,2,…为从1到正无穷的整数；参数上方加圆点表示该参数的导数，Q_i(u_i)代表控制输入u_i经过量化器后的输出；

所述第i个跟随者与领导者输出之间的误差，表示为：

其中i和j分别表示第i个和第j个跟随者，a_ij≥0为第i个跟随者收到的第j个跟随者的信息权重，b_i≥0为第i个跟随者收到领导者的信息权重，a_ij和b_i都是非负常数；

所述i个跟随者的q阶状态与虚拟控制器之间的误差表示为：

s_i,q＝x_i,q-α_i,q-1,q＝2,…,n_i 式10

其中α_i,q-1为第i个跟随者的第q-1个虚拟控制器；

所述第i个跟随者的第一个虚拟控制器表示为：

其中s_i,1为第i个跟随者***的1阶状态与虚拟控制器之间的误差，S_i,1为径向基函数向量，S_i,1＝S_i,1(X_i,1),X_i,1＝[x_i,1,x_j,1]^T，x_i,1表示第i个跟随者的第1阶状态，x_j,1、x_j,2分别表示第j个跟随者的第1阶状态，

为自适应率，c_i,1和a_i,1为正的可调参数，

f₀(x₀,t)为一个已知的有界函数，即想要跟踪的领导者的输出的导数函数，x₀表示领导者的输出；

所述第i个跟随者的第二个虚拟控制器表示为：

其中c_i,2和a_i,2为正的可调参数，s_i,2为第i个跟随者***的2阶状态与虚拟控制器之间的误差，S_i,2为径向基函数向量，S_i,2＝S_i,2(X_i,2)且

为自适应率；

第i个跟随者的第q个虚拟控制器表示为：

其中c_i,q和a_i,q为正的可调参数，其中S_i,q为径向基函数向量，S_i,q＝S_i,q(X_i,q)且

为自适应率，

x_i,q、x_j,q分别表示第i个跟随者、第j个跟随者***的q阶状态；

所述第i个跟随者设计控制输入，表示为：

其中：

其中

a_i,k,

k_i,0，k_i,1，g_i，r_i为正的可调参数，

s_i,k为第i个跟随者***的n_i阶、k阶状态，

为径向基函数向量且

分别表示第i个跟随者、第j个跟随者***的n_i阶状态，

为

的导数，

为自适应率

的导数。

2.根据权利要求1所述的多智能体***的量化控制方法，其特征在于，所述跟随者的***模型表示为：

对于第i个跟随者，建立如下的***模型：

y_i＝x_i,1,i＝1,2,…N 式3

其中

x_i,q和

代表***的状态变量，其中，q为***状态变量的阶数，n_i为第i个跟随者的总***阶数，参数上方加圆点表示该参数的导数，f_i,q()和

代表未知但光滑的函数，Δ_i,q(t)和

3.根据权利要求1所述的多智能体***的量化控制方法，其特征在于，所述领导者的***模型表示为：

y₀＝x₀ 式8

y₀表示领导者的输出，

表示领导者的输出的导数，f₀(x₀,t)为一个已知的有界函数，即想要跟踪的领导者的输出的导数函数。

4.根据权利要求1所述的多智能体***的量化控制方法，其特征在于，所述第i个跟随者通过获取领导者以及它所能获取的其他跟随者的信息，将输出之间的误差进行计算，计算出的一阶误差建立第一个虚拟控制器，然后通过第一个控制器与自身的第二阶状态进行对比，计算二阶误差，并建立第二个虚拟控制器，然后与第三阶状态进行对比，计算出三阶误差，计算第三个虚拟控制器；以此类推，直到最终得到n_i阶误差，之后计算真正的输入u_i；u_i经过量化器模型，产生真正的量化控制信号Q_i(u_i)，使用自适应率来对量化信号进行自适应，可以使得第i个跟随者跟随到领导者的输出，实现量化控制。