CN112947329A

CN112947329A - 分布参数的事件触发控制方法及

Info

Publication number: CN112947329A
Application number: CN202110120442.XA
Authority: CN
Inventors: 陈宁; 李彬艳; 阳春华; 桂卫华; 彭文杰; 李旭; 谭欣欣; 罗彪; 陈嘉瑶
Original assignee: Central South University; Hunan Shanshan Energy Technology Co Ltd
Current assignee: Central South University; BASF Shanshan Battery Materials Co Ltd
Priority date: 2021-01-28
Filing date: 2021-01-28
Publication date: 2021-06-11
Anticipated expiration: 2041-01-28
Also published as: CN112947329B

Abstract

本发明涉及自动控制技术领域，公开一种分布参数***的事件触发控制方法及***，以有效减少控制器的更新频率，从而降低控制过程中计算资源和通信成本等的消耗。本发明方法包括：构建分布参数***的最优控制问题；基于时空分离方法推导低阶集总参数***模型，建立基于集总参数***模型的分布参数***最优控制问题；从事件触发的角度出发，建立并分析分布参数***的事件触发最优控制问题；采用自适应动态规划技术来实现分布参数***的事件触发自适应最优控制方法。

Description

分布参数***的事件触发控制方法及***

技术领域

本发明涉及自动控制技术领域，尤其涉及一种分布参数***的事件触发控制方法及***。

背景技术

大部分实际工业过程的***状态通常同时具备时间和空间的分布特征，属于典型的由偏微分方程描述的分布参数***。然而，传统的最优控制方法与理论往往以集总参数***为研究对象，它一般由常微分方程描述。针对集总参数***的控制理论已非常成熟，但却难以直接应用于分布参数***，使得分布参数***的优化控制理论与方法的研究仍然无法取得较大的突破。

大多数控制理论与方法的研究都依赖于对所研究对象进行精确的数学建模。然而，实际工业过程常常由于存在流程长、过程变量多、变量之间耦合严重、过程高度非线性等难点而无法建立精确的模型，或所建立的模型高度复杂而无法直接用于工业过程的实时控制。

近年来，以自适应动态规划为代表的强化学习方法在工业过程控制器的设计中得到广泛应用。但传统的自适应动态规划方法需要进行大量的周期性数据传输与计算，因而控制器的传输负载、计算负担均较高；并且，大部分实际工业过程的计算带宽或传感器电源等往往受到限制。因此，研究者们陆续将事件触发与自适应动态规划相结合来进行控制器的设计。区别于传统的控制器设计过程，在事件触发控制器的设计中，需要构建事件触发条件来确定***控制器的更新时刻(即触发时刻)。这通常由所研究***的状态、控制和性能指标等信息来进行合理地设计。然后，在特定的触发时刻传输***当前时刻的信息和更新控制器。事件触发控制是一种非周期控制方法，能极大地减少控制过程的数据传输量和控制器的更新频率。基于上述特点，自动控制、计算机和通信等领域的研究学者对这类事件触发控制方法开始广泛关注。尤其是在自动控制领域，研究者将自适应动态规划与事件触发相结合有效地解决了许多工业***的最优控制问题，如非线性连续时间***，非线性离散时间***，非线性互联***，***存在未知非线性扰动的情况等。然而，上述事件触发最优控制器的设计均集中于集总参数***，对于分布参数***的事件触发控制尚未开发相应的方法。如何设计一种分布参数***的事件触发最优控制方法，来显著降低过程控制中对计算资源、通信资源等的消耗，是分布参数***最优控制发展过程中亟待解决的问题。

发明内容

本发明主要目的在于公开一种分布参数***的事件触发控制方法及***，以有效减少控制器的更新频率，从而降低控制过程中计算资源和通信成本等的消耗。

为达到上述目的，本发明公开一种分布参数***的事件触发控制方法，包括：

步骤S1、构建分布参数***基于空间位置变量和时间变量的偏微分方程模型及对应的性能指标，将所述分布参数***的最优控制问题与性能指标关联；

步骤S2、基于时空分离方法推导对应所述偏微分方程模型的低阶集总参数***模型，基于所述集总参数***模型，将所述分布参数***最优控制问题转化为求解相应的HJB方程和最优控制律；

步骤S3、从事件触发的角度出发，定义触发条件，建立并分析分布参数***的事件触发最优控制问题；

步骤S4、采用自适应动态规划技术来实现分布参数***的事件触发自适应最优控制；所述自适应动态规划技术由评价网络和执行网络组成，所述评价网络用于逼近所述HJB方程的最优值函数，所述执行网络用于逼近所述最优控制律。

优选地，所述步骤S1的偏微分方程模型具体为：

其中，

为分布参数***的状态，n为该状态的维数，

为空间位置变量，t∈[0,∞)为时间变量；

是高耗散型空间微分算子，n₀为该微分算子的最高阶次；控制变量为

m为该控制变量的维数，并且用

描述控制量的空间分布；b和X₀(z)均为光滑向量函数，分别用于描述***的边界条件和初始状态。

所述步骤S1所构建的分布参数***的性能指标具体为：

其中，<·>为内积，并且

为半正定矩阵，R＞0为正定矩阵；

所述步骤S3将分布参数***的最优控制问题与性能指标关联包括：

将分布参数***的最优控制问题可转换成：为所研究的***设计最优控制律u^*(t)，使得性能指标J(X₀(·))达到最小，即：

优选地，所述步骤S2包括：

步骤S21、采用KL分解建立低阶集总参数***模型；

根据傅里叶级数理论，高耗散型分布参数***的状态X(z,t)能由一组正交空间基函数及相应的时间模态构成；当X(z,t)的阶数为1时，假设

和

分别为一组完备的正交空间基函数和时间模态，如下：

通过采用KL分解方法获得空间基函数

将X(z,t)(公式二)代入分布参数***模型(公式一)，并将分布参数***模型两边同时与

进行内积运算，得到如下无穷维的集总参数***模型：

其中，各参数定义如下：

从***模态快慢分离的角度出发，存在一个小常数μ使得

因此，可推导出如下***模型：

然后，定义τ＝t/μ为快***常数，且让μ＝0，则有y_f(t)＝0；再推导出如下集总参数***模型：

式三中的***模态y(t)的维数n₂，可通过

确定，其中λ_i为采用KL分解方法所得的特征值，p为所选取的n₂维的低阶模态占总模态的比例；n₃为***状态数据集的维数；

步骤S22、基于所推导的集总参数***模型构建最优控制问题，将原始分布参数***的最优控制问题转化为基于集总参数***的最优控制问题；

将分布参数***的性能指标转换成：

其中，下标Q和R分别代表对应y(t)和u(t)的正定矩阵，Q≥0；且基于集总参数***的最优控制问题转化为求解如下HJB方程：

其中，f(y)为f(y(t))的简写，

为连续函数空间，V^*(y)≥0，当y＝0时，V^*(y)＝0；V^*(y)为最优值函数，即在最优控制u^*下使得HJB方程成立的V(y)；R^-1为矩阵R的逆矩阵，f(y)为集总参数***中

变化特征的非线性函数；分布参数***的最优控制律为：

优选地，所述步骤S3包括：

步骤S31、建立分布参数***的事件触发条件，并确定事件触发时刻；

首先，定义事件触发控制器的模态误差为e₁(t)，如下：

其中，

为控制器可得的***模态，y(t)为***的真实模态；事件触发下的时间模态

如下：

其中，t_j为事件触发时刻，j为正整数；

然后，定义触发条件来确定事件触发非周期控制的时刻，如下：

其中，q＞0为待设计的参数；当上述条件不成立时，***真实模态将会传输到控制器中用以更新控制律；

为事件触发时刻序列；

步骤S32、根据最优控制理论和求解得到HJB方程的最优解

推导出分布参数***的事件触发最优控制策略，如下：

优选地，所述步骤S4包括：

步骤S41、假设神经网络逼近误差极小到忽略不计，评价NN的输出为：

其中，

为所构建的神经网络激活函数集合，n₄为隐含层神经元的个数，

为真实权值向量θ^*的估计值；由此得到执行网络的输出为：

其中，权值

满足：

步骤S42、确定评价神经网络中权值θ的更新律；包括：

由常规的周期控制下的最优值函数V^*(y)和最优控制u^*(y)所构成，满足

由事件触发下的最优值函数的估计

和事件触发最优控制

构成，神经网络估计误差的存在使得

定义误差e₂(y,θ)如下：

基于误差e₂(y,θ)来设计评价神经网络权值θ的更新策略，如下：

其中，

为θ的导数，

用于稳定***，参数γ定义为：

其中，

P为一个径向无界的Lyapunov函数；

步骤S43、基于自适应动态规划技术的分布参数***事件触发非周期最优控制算法，具体包含如下步骤：

首先，采集实际***的状态信息，根据KL分解获得相应的时间模态信息y；然后，根据所设计的权值更新策略(公式八)来更新评价网络的权值θ；同时，利用所获得的模态数据对事件触发条件(公式六)进行判断，以确定事件触发控制的时刻；若触发条件满足，则保持当前时刻的控制u不变；反之，则将***状态信息传输到控制器中，根据(公式七)计算新的控制律并进行更新。

为达上述目的，本发明还公开一种分布参数***的事件触发控制***，包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述方法的步骤。

本发明具有以下有益效果：

将事件触发首创性地引入到分布参数***中，不仅能实现分布参数***的最优控制，还能有效减少控制器的更新频率，从而使得本发明基于事件触发的最优控制方法能显著降低控制过程中计算资源与通信资源等的消耗。

下面将参照附图，对本发明作进一步详细的说明。

附图说明

构成本申请的一部分的附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是本发明实施例中选取的空间基函数。

图2是本发明实施例中评价NN权值向量范数||θ||的变化轨迹。

图3是本发明实施例中事件触发条件下以非周期方式更新的分布参数***控制律

图4是本发明实施例中闭环集总参数***时间模态的轨迹。

图5是本发明实施例中事件触发控制下闭环分布参数***的状态曲面。

具体实施方式

以下结合附图对本发明的实施例进行详细说明，但是本发明可以由权利要求限定和覆盖的多种不同方式实施。

实施例1

本实施例公开一种事件触发下，以非周期方式更新控制策略的分布参数***最优控制方法。所提供的方法不仅能实现分布参数***的最优控制，还能有效减少控制器的更新频率，从而降低控制过程中计算资源和通信成本等的消耗。

为了达到上述目的，本实施例首先构建分布参数***的最优控制问题，并通过时空分离方法给出描述***主要动力学的集总参数模型(公式三)，进而分析集总参数***的最优控制问题。然后，构建事件触发条件(公式六)，分析基于集总参数模型的分布参数***事件触发最优控制问题。在此基础上，采用自适应动态规划技术设计事件触发下分布参数***的最优控制律，其中评价网络通过采用神经网络(Neural Network，NN)技术来逼近HJB(Hamilton–Jacobi–Bellman)方程的最优解。

如图1所示，本实施例技术方案包括如下步骤：

步骤S1、构建分布参数***基于空间位置变量和时间变量的偏微分方程模型及对应的性能指标，将所述分布参数***的最优控制问题与性能指标关联。

步骤S2、基于时空分离方法推导对应所述偏微分方程模型的低阶集总参数***模型，基于所述集总参数***模型，将所述分布参数***最优控制问题转化为求解相应的HJB方程和最优控制律。

步骤S3、从事件触发的角度出发，定义触发条件，建立并分析分布参数***的事件触发最优控制问题。

进一步地，对分布参数***的最优控制问题进行构建，则步骤S1包括：

步骤S11：给出描述分布参数***的高耗散型偏微分方程模型，如下：

其中，

为分布参数***的状态，n为该状态的维数，

为空间位置变量，t∈[0,∞)为时间变量；

m为该控制变量的维数，并且用

步骤S12：构建分布参数***的性能指标，如下：

其中，<·>为内积，

R＞0。

步骤S13：分布参数***的最优控制问题可转换成为***(公式一)设计最优控制律u^*(t)，使得性能指标J(X₀(·))达到最小，即：

进一步地，采用一类最具代表性的时空分离方法——Karhunen-Loève分解，以分布参数***为基础，推导表征***主要变化机制的低阶集总参数***模型，如下：

根据傅里叶级数理论，高耗散型分布参数***的状态X(z,t)可以由一组正交空间基函数及相应的时间模态构成。为不失一般性，以X(z,t)的阶数为1进行讨论。假设

和

分别为一组完备的正交空间基底和时间模态，如下：

其中，选取以KL分解为代表的时空分离方法可以获得空间基函数

通过将上式代入分布参数***模型，并将模型两边同时与

进行内积运算，可以得到如下无穷维集总参数***模型：

其中，各参数的定义如下：

从高耗散型***的模态具有快慢分离特性的角度出发，存在一个小常数μ使得

因此，可推导出如下***模型：

式中，A_fμ表示指数稳定的阵；然后，定义τ＝t/μ为快***常数，且让μ＝0，则有y_f(t)＝0。因此，推导出如下集总参数***模型：

式中，n₂为有限维低阶集总参数***的维数，由

确定。其中，λ_i为采用KL分解方法所得的特征值；p为所选取的n₂维的低阶模态占总模态的比例，通常p越接近1，则表示越能获取***的主要动态，一般可设置成p≥90％；n₃为所采集的***状态数据集的维数。

进一步地，基于所推导的集总参数***模型，将原始分布参数***的最优控制问题转化为集总参数***的最优控制问题，如下：

分布参数***的性能指标可改写为：

基于快慢分离特征有

则集总参数***的性能指标为：

那么，集总参数***的最优控制问题可以转化为求解HJB方程，如下：

其中，

V^*(y)≥0，V^*(y)＝0当y＝0。V^*(y)为最优值函数，即可认为是在最优控制u^*下使得上式成立的V(y)；R^-1为矩阵R的逆矩阵，f(y)为集总参数***中

变化特征的非线性函数。为描述简便，将f(y(t))简写为f(y)。

值得说明的是：在V^*(y)和

等近似表述中，y为在常规的周期控制下，按周期来获得的时间模态，

为事件触发控制下(即非周期控制)获得的时间模态；由于二者不同，则对应的V^*(y)和

也不同，后续不做赘述。

综上，***的最优控制律如下：

进一步地，从集总参数***的角度出发，建立分布参数***事件触发最优控制问题，步骤S3包括；

步骤S31：建立分布参数***的事件触发条件，并确定事件触发时刻。

由前述步骤可知，分布参数***的最优控制问题已转换成基于集总参数***的最优控制，因此下述事件触发最优控制方法将根据集总参数***的时间模态来进行设计。首先，定义事件触发控制器的模态误差为e₁(t)，如下：

其中，

为控制器可得的***模态，y(t)为***的真实模态。前述控制器可得的***模态和***的真实模态都可以通过分布参数***的状态与空间基函数作内积而得。事件触发下的时间模态

如下：

其中，t_j为事件触发时刻，j为正整数。

然后，定义触发条件来确定事件触发下非周期控制的时刻。已有的事件触发条件，往往根据***的状态和控制等信息进行设计。而本实施例以此为基础，在将触发条件的设计中加入***的动力学，使得触发条件能够进一步包含当前***演化特征，以达到更好的控制效果。具体结构如下：

其中，q＞0为一个待设计的常数。当上述条件不成立时发生事件触发，***真实模态将会传输到控制器中用以更新控制律。并且，

为事件触发时刻序列。

步骤S32：给出事件触发下分布参数***的控制策略。

根据最优控制理论，若能求解得到HJB方程的最优解

则可推导出事件触发下分布参数***的最优控制策略，如下：

进一步地，给出采用自适应动态规划技术实现分布参数***事件触发最优控制的设计步骤，步骤S4包括：

步骤S41：采用神经网络技术对自适应动态规划中的评价网络进行设计，以逼近集总参数***HJB方程的最优值函数，同时给出基于评价NN的事件触发最优控制律。在实际应用中，通常假设NN逼近误差极小，可以忽略不计。因此，评价NN的输出为：

其中，

为真实权值向量θ^*的估计值。由此可得执行网络的输出(即分布参数***的事件触发最优控制律)为：

其中，权值

满足：

步骤S42：确定评价NN中权值θ的更新律。

由事件触发下的最优值函数的估计

和事件触发最优控制

构成，神经网络估计误差的存在使得

由此定义误差e₂(y,θ)，如下：

基于误差e₂(y,θ)来设计评价NN的权值更新策略，如下：

其中，

参数γ定义为：

其中，

P为一个径向无界的Lyapunov函数。

步骤S43：基于自适应动态规划技术的分布参数***事件触发非周期最优控制算法，包含如下步骤：

首先，采集实际***的状态信息，并根据KL分解等时空分离方法获得相应的时间模态y；然后由所设计的权值更新策略(公式八)来更新评价网络的权值θ；同时，利用所获得的模态数据对事件触发条件(公式六)进行判断，以确定事件触发控制的时刻；若触发条件满足，则保持当前时刻的控制u不变；反之，则将***状态信息传输到控制器中，根据(公式七)计算新的控制律并进行更新。

实施例2

与上述实施例相对应的，本实施例提供一具体的计算例。

选取非线性扩散-反应过程的***模型对所提的事件触发下基于自适应动态规划的分布参数***非周期最优控制策略的有效性进行仿真验证与分析，如下：

其中，z∈[0,π]，g(z)＝H(z-0.4π)-H(z-0.5π)，k＝1，α₁＝12，α₂＝1，ρ＝1。

所提的基于自适应动态规划的事件触发非周期最优控制方法在实施的过程中，包含以下步骤：

步骤1：对仿真验证中的相关参数进行合适的选取。

在分布参数***的事件触发最优控制中，设置R为单位矩阵，其维度由相应的时间模态来确定；设置触发条件中的参数q为0.5。

步骤2：从实际的分布参数***中采集状态数据，结合时空分离方法获得表征分布参数***主要空间分布特性的空间基函数。本实施例通过相应的计算，确定后续最优控制律设计过程中所用的空间基函数个数为2，空间基函数的分布见附图1。

步骤3：构建分布参数***的事件触发条件，采用自适应动态规划技术获得评价NN中的最优权值，进而获得事件触发控制策略。基于所设计的权值更新策略(公式八)，更新评价网络的权值θ；同时，利用所获得的模态数据对事件触发条件(公式六)进行判断，以确定事件触发的控制时刻；若满足，则采用零阶保持器保持控制u不变；反之，则将***状态信息传输到控制器中，根据

计算新的控制律并进行更新。

附图2为评价网络中权值向量范数||θ||的变化轨迹，由此可知评价NN的权值最终会收敛到一固定值。附图3为分布参数***的事件触发控制律

由图3可知，控制律存在一段时间内保持不变的情况，这与事件触发下控制律的变化趋势相符，证明了所设计的事件触发下的最优控制方法的有效性。附图4为闭环集总参数***时间模态y(t)和

的轨迹，最终会收敛到0；附图5为事件触发控制下闭环分布参数***的状态曲面；同样地，***状态会收敛到0。由此可得，事件触发控制下闭环***的稳定性得以保证。综上，仿真验证结果表明了所提基于自适应动态规划的事件触发分布参数***最优控制方法的有效性和收敛性。

实施例3

与上述实施例相对应的，本实施例公开一种分布参数***的事件触发控制***，包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述方法的步骤。

综上，本发明上述各实施例所分别公开的分布参数***事件触发控制方法及***，具有以下有益效果：

将事件触发首创性的引入到分布参数***中，不仅能实现分布参数***的最优控制，还能有效减少控制器的更新频率，从而使得本发明基于事件触发的最优控制方法能显著降低控制过程中计算资源与通信资源等的消耗。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种分布参数***的事件触发控制方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述步骤S1的分布参数***的偏微分方程模型具体为：

其中，

为分布参数***的状态，n为该状态的维数，

为空间位置变量，t∈[0,∞)为时间变量；

m为该控制变量的维数，并且用

所述步骤S1所构建的分布参数***的性能指标具体为：

其中，<·>为内积，并且

为半正定矩阵，R＞0为正定矩阵；

将分布参数***的最优控制问题描述为：为所研究的公式一中的***设计最优控制律u^*(t)，使得性能指标J(X₀(·))达到最小，即：

3.根据权利要求2所述的方法，其特征在于，所述步骤S2包括：

步骤S21、采用KL分解建立低阶集总参数***模型；

根据傅里叶级数理论，高耗散型分布参数***的状态X(z，t)能由一组正交空间基函数及相应的时间模态构成；当X(z，t)的阶数为1时，假设

和

分别为一组完备的正交空间基函数和时间模态，如下：

通过采用KL分解方法获得空间基函数

将公式二的X(z，t)代入公式一中的分布参数***模型，并将分布参数***模型两边同时与

进行内积运算，得到如下无穷维的集总参数***模型：

其中，各参数定义如下：

从***模态快慢分离的角度出发，存在一个小常数μ使得

因此，可推导出如下***模型：

公式三中的***模态y(t)的维数n₂，由

将分布参数***的性能指标转换成：

其中，f(y)为f(y(t))的简写，

变化特征的非线性函数；分布参数***的最优控制律为：

4.根据权利要求3所述的方法，其特征在于，所述步骤S3包括：

首先，定义事件触发控制器的模态误差为e₁(t)，如下：

其中，

如下：

其中，t_j为事件触发时刻，j为正整数；

为事件触发时刻序列；

步骤S32、根据最优控制理论和求解得到HJB方程的最优解

推导出分布参数***的事件触发最优控制策略，如下：

5.根据权利要求4所述的方法，其特征在于，所述步骤S4包括：

其中，

为真实权值向量θ^*的估计值；由此得到执行网络的输出为：

其中，权值

满足：

步骤S42、确定评价神经网络中权值θ的更新律；包括：

由事件触发下的最优值函数的估计

和事件触发最优控制

构成，神经网络估计误差的存在使得

定义误差e₂(y,θ)如下：

其中，

为θ的导数，

用于稳定***，参数γ定义为：

其中，

P为一个径向无界的Lyapunov函数；

首先，采集实际***的状态信息，根据KL分解获得相应的时间模态信息y；然后，根据所设计公式八的权值更新策略来更新评价网络的权值θ；同时，利用所获得的模态数据对公式六中的事件触发条件进行判断，以确定事件触发控制的时刻；若触发条件满足，则保持当前时刻的控制u不变；反之，则将***状态信息传输到控制器中，根据公式七计算新的控制律并进行更新。

6.一种分布参数***的事件触发控制***，包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现上述权利要求1至5任一所述方法的步骤。