CN112947329A - 分布参数***的事件触发控制方法及*** - Google Patents

分布参数***的事件触发控制方法及*** Download PDF

Info

Publication number
CN112947329A
CN112947329A CN202110120442.XA CN202110120442A CN112947329A CN 112947329 A CN112947329 A CN 112947329A CN 202110120442 A CN202110120442 A CN 202110120442A CN 112947329 A CN112947329 A CN 112947329A
Authority
CN
China
Prior art keywords
parameter system
distributed parameter
event
optimal control
control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110120442.XA
Other languages
English (en)
Other versions
CN112947329B (zh
Inventor
陈宁
李彬艳
阳春华
桂卫华
彭文杰
李旭
谭欣欣
罗彪
陈嘉瑶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Central South University
BASF Shanshan Battery Materials Co Ltd
Original Assignee
Central South University
Hunan Shanshan Energy Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central South University, Hunan Shanshan Energy Technology Co Ltd filed Critical Central South University
Priority to CN202110120442.XA priority Critical patent/CN112947329B/zh
Publication of CN112947329A publication Critical patent/CN112947329A/zh
Application granted granted Critical
Publication of CN112947329B publication Critical patent/CN112947329B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/418Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM]
    • G05B19/41885Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM] characterised by modeling, simulation of the manufacturing system
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/32Operator till task planning
    • G05B2219/32339Object oriented modeling, design, analysis, implementation, simulation language
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Manufacturing & Machinery (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明涉及自动控制技术领域,公开一种分布参数***的事件触发控制方法及***,以有效减少控制器的更新频率,从而降低控制过程中计算资源和通信成本等的消耗。本发明方法包括:构建分布参数***的最优控制问题;基于时空分离方法推导低阶集总参数***模型,建立基于集总参数***模型的分布参数***最优控制问题;从事件触发的角度出发,建立并分析分布参数***的事件触发最优控制问题;采用自适应动态规划技术来实现分布参数***的事件触发自适应最优控制方法。

Description

分布参数***的事件触发控制方法及***
技术领域
本发明涉及自动控制技术领域,尤其涉及一种分布参数***的事件触发控制方法及***。
背景技术
大部分实际工业过程的***状态通常同时具备时间和空间的分布特征,属于典型的由偏微分方程描述的分布参数***。然而,传统的最优控制方法与理论往往以集总参数***为研究对象,它一般由常微分方程描述。针对集总参数***的控制理论已非常成熟,但却难以直接应用于分布参数***,使得分布参数***的优化控制理论与方法的研究仍然无法取得较大的突破。
大多数控制理论与方法的研究都依赖于对所研究对象进行精确的数学建模。然而,实际工业过程常常由于存在流程长、过程变量多、变量之间耦合严重、过程高度非线性等难点而无法建立精确的模型,或所建立的模型高度复杂而无法直接用于工业过程的实时控制。
近年来,以自适应动态规划为代表的强化学习方法在工业过程控制器的设计中得到广泛应用。但传统的自适应动态规划方法需要进行大量的周期性数据传输与计算,因而控制器的传输负载、计算负担均较高;并且,大部分实际工业过程的计算带宽或传感器电源等往往受到限制。因此,研究者们陆续将事件触发与自适应动态规划相结合来进行控制器的设计。区别于传统的控制器设计过程,在事件触发控制器的设计中,需要构建事件触发条件来确定***控制器的更新时刻(即触发时刻)。这通常由所研究***的状态、控制和性能指标等信息来进行合理地设计。然后,在特定的触发时刻传输***当前时刻的信息和更新控制器。事件触发控制是一种非周期控制方法,能极大地减少控制过程的数据传输量和控制器的更新频率。基于上述特点,自动控制、计算机和通信等领域的研究学者对这类事件触发控制方法开始广泛关注。尤其是在自动控制领域,研究者将自适应动态规划与事件触发相结合有效地解决了许多工业***的最优控制问题,如非线性连续时间***,非线性离散时间***,非线性互联***,***存在未知非线性扰动的情况等。然而,上述事件触发最优控制器的设计均集中于集总参数***,对于分布参数***的事件触发控制尚未开发相应的方法。如何设计一种分布参数***的事件触发最优控制方法,来显著降低过程控制中对计算资源、通信资源等的消耗,是分布参数***最优控制发展过程中亟待解决的问题。
发明内容
本发明主要目的在于公开一种分布参数***的事件触发控制方法及***,以有效减少控制器的更新频率,从而降低控制过程中计算资源和通信成本等的消耗。
为达到上述目的,本发明公开一种分布参数***的事件触发控制方法,包括:
步骤S1、构建分布参数***基于空间位置变量和时间变量的偏微分方程模型及对应的性能指标,将所述分布参数***的最优控制问题与性能指标关联;
步骤S2、基于时空分离方法推导对应所述偏微分方程模型的低阶集总参数***模型,基于所述集总参数***模型,将所述分布参数***最优控制问题转化为求解相应的HJB方程和最优控制律;
步骤S3、从事件触发的角度出发,定义触发条件,建立并分析分布参数***的事件触发最优控制问题;
步骤S4、采用自适应动态规划技术来实现分布参数***的事件触发自适应最优控制;所述自适应动态规划技术由评价网络和执行网络组成,所述评价网络用于逼近所述HJB方程的最优值函数,所述执行网络用于逼近所述最优控制律。
优选地,所述步骤S1的偏微分方程模型具体为:
Figure BDA0002922153400000021
其中,
Figure BDA0002922153400000022
为分布参数***的状态,n为该状态的维数,
Figure BDA0002922153400000023
为空间位置变量,t∈[0,∞)为时间变量;
Figure BDA0002922153400000024
是高耗散型空间微分算子,n0为该微分算子的最高阶次;控制变量为
Figure BDA0002922153400000025
m为该控制变量的维数,并且用
Figure BDA0002922153400000026
描述控制量的空间分布;b和X0(z)均为光滑向量函数,分别用于描述***的边界条件和初始状态。
所述步骤S1所构建的分布参数***的性能指标具体为:
Figure BDA0002922153400000027
其中,<·>为内积,并且
Figure BDA0002922153400000028
为半正定矩阵,R>0为正定矩阵;
所述步骤S3将分布参数***的最优控制问题与性能指标关联包括:
将分布参数***的最优控制问题可转换成:为所研究的***设计最优控制律u*(t),使得性能指标J(X0(·))达到最小,即:
Figure BDA0002922153400000031
优选地,所述步骤S2包括:
步骤S21、采用KL分解建立低阶集总参数***模型;
根据傅里叶级数理论,高耗散型分布参数***的状态X(z,t)能由一组正交空间基函数及相应的时间模态构成;当X(z,t)的阶数为1时,假设
Figure BDA0002922153400000032
Figure BDA0002922153400000033
分别为一组完备的正交空间基函数和时间模态,如下:
Figure BDA0002922153400000034
通过采用KL分解方法获得空间基函数
Figure BDA0002922153400000035
将X(z,t)(公式二)代入分布参数***模型(公式一),并将分布参数***模型两边同时与
Figure BDA0002922153400000036
进行内积运算,得到如下无穷维的集总参数***模型:
Figure BDA0002922153400000037
其中,各参数定义如下:
Figure BDA0002922153400000038
从***模态快慢分离的角度出发,存在一个小常数μ使得
Figure BDA0002922153400000039
因此,可推导出如下***模型:
Figure BDA00029221534000000310
然后,定义τ=t/μ为快***常数,且让μ=0,则有yf(t)=0;再推导出如下集总参数***模型:
Figure BDA0002922153400000041
式三中的***模态y(t)的维数n2,可通过
Figure BDA0002922153400000042
确定,其中λi为采用KL分解方法所得的特征值,p为所选取的n2维的低阶模态占总模态的比例;n3为***状态数据集的维数;
步骤S22、基于所推导的集总参数***模型构建最优控制问题,将原始分布参数***的最优控制问题转化为基于集总参数***的最优控制问题;
将分布参数***的性能指标转换成:
Figure BDA0002922153400000043
其中,下标Q和R分别代表对应y(t)和u(t)的正定矩阵,Q≥0;且基于集总参数***的最优控制问题转化为求解如下HJB方程:
Figure BDA0002922153400000044
其中,f(y)为f(y(t))的简写,
Figure BDA0002922153400000045
为连续函数空间,V*(y)≥0,当y=0时,V*(y)=0;V*(y)为最优值函数,即在最优控制u*下使得HJB方程成立的V(y);R-1为矩阵R的逆矩阵,f(y)为集总参数***中
Figure BDA0002922153400000046
变化特征的非线性函数;分布参数***的最优控制律为:
Figure BDA0002922153400000047
优选地,所述步骤S3包括:
步骤S31、建立分布参数***的事件触发条件,并确定事件触发时刻;
首先,定义事件触发控制器的模态误差为e1(t),如下:
Figure BDA0002922153400000048
其中,
Figure BDA0002922153400000049
为控制器可得的***模态,y(t)为***的真实模态;事件触发下的时间模态
Figure BDA00029221534000000410
如下:
Figure BDA0002922153400000051
其中,tj为事件触发时刻,j为正整数;
然后,定义触发条件来确定事件触发非周期控制的时刻,如下:
Figure BDA0002922153400000052
其中,q>0为待设计的参数;当上述条件不成立时,***真实模态将会传输到控制器中用以更新控制律;
Figure BDA0002922153400000053
为事件触发时刻序列;
步骤S32、根据最优控制理论和求解得到HJB方程的最优解
Figure BDA0002922153400000054
推导出分布参数***的事件触发最优控制策略,如下:
Figure BDA0002922153400000055
优选地,所述步骤S4包括:
步骤S41、假设神经网络逼近误差极小到忽略不计,评价NN的输出为:
Figure BDA0002922153400000056
其中,
Figure BDA0002922153400000057
为所构建的神经网络激活函数集合,n4为隐含层神经元的个数,
Figure BDA0002922153400000058
为真实权值向量θ*的估计值;由此得到执行网络的输出为:
Figure BDA0002922153400000059
其中,权值
Figure BDA00029221534000000510
满足:
Figure BDA00029221534000000511
步骤S42、确定评价神经网络中权值θ的更新律;包括:
Figure BDA00029221534000000512
由常规的周期控制下的最优值函数V*(y)和最优控制u*(y)所构成,满足
Figure BDA00029221534000000513
由事件触发下的最优值函数的估计
Figure BDA00029221534000000514
和事件触发最优控制
Figure BDA00029221534000000515
构成,神经网络估计误差的存在使得
Figure BDA00029221534000000516
定义误差e2(y,θ)如下:
Figure BDA0002922153400000061
基于误差e2(y,θ)来设计评价神经网络权值θ的更新策略,如下:
Figure BDA0002922153400000062
其中,
Figure BDA0002922153400000063
为θ的导数,
Figure BDA0002922153400000064
用于稳定***,参数γ定义为:
Figure BDA0002922153400000065
其中,
Figure BDA0002922153400000066
P为一个径向无界的Lyapunov函数;
步骤S43、基于自适应动态规划技术的分布参数***事件触发非周期最优控制算法,具体包含如下步骤:
首先,采集实际***的状态信息,根据KL分解获得相应的时间模态信息y;然后,根据所设计的权值更新策略(公式八)来更新评价网络的权值θ;同时,利用所获得的模态数据对事件触发条件(公式六)进行判断,以确定事件触发控制的时刻;若触发条件满足,则保持当前时刻的控制u不变;反之,则将***状态信息传输到控制器中,根据(公式七)计算新的控制律并进行更新。
为达上述目的,本发明还公开一种分布参数***的事件触发控制***,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
本发明具有以下有益效果:
将事件触发首创性地引入到分布参数***中,不仅能实现分布参数***的最优控制,还能有效减少控制器的更新频率,从而使得本发明基于事件触发的最优控制方法能显著降低控制过程中计算资源与通信资源等的消耗。
下面将参照附图,对本发明作进一步详细的说明。
附图说明
构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明实施例中选取的空间基函数。
图2是本发明实施例中评价NN权值向量范数||θ||的变化轨迹。
图3是本发明实施例中事件触发条件下以非周期方式更新的分布参数***控制律
Figure BDA0002922153400000071
图4是本发明实施例中闭环集总参数***时间模态的轨迹。
图5是本发明实施例中事件触发控制下闭环分布参数***的状态曲面。
具体实施方式
以下结合附图对本发明的实施例进行详细说明,但是本发明可以由权利要求限定和覆盖的多种不同方式实施。
实施例1
本实施例公开一种事件触发下,以非周期方式更新控制策略的分布参数***最优控制方法。所提供的方法不仅能实现分布参数***的最优控制,还能有效减少控制器的更新频率,从而降低控制过程中计算资源和通信成本等的消耗。
为了达到上述目的,本实施例首先构建分布参数***的最优控制问题,并通过时空分离方法给出描述***主要动力学的集总参数模型(公式三),进而分析集总参数***的最优控制问题。然后,构建事件触发条件(公式六),分析基于集总参数模型的分布参数***事件触发最优控制问题。在此基础上,采用自适应动态规划技术设计事件触发下分布参数***的最优控制律,其中评价网络通过采用神经网络(Neural Network,NN)技术来逼近HJB(Hamilton–Jacobi–Bellman)方程的最优解。
如图1所示,本实施例技术方案包括如下步骤:
步骤S1、构建分布参数***基于空间位置变量和时间变量的偏微分方程模型及对应的性能指标,将所述分布参数***的最优控制问题与性能指标关联。
步骤S2、基于时空分离方法推导对应所述偏微分方程模型的低阶集总参数***模型,基于所述集总参数***模型,将所述分布参数***最优控制问题转化为求解相应的HJB方程和最优控制律。
步骤S3、从事件触发的角度出发,定义触发条件,建立并分析分布参数***的事件触发最优控制问题。
步骤S4、采用自适应动态规划技术来实现分布参数***的事件触发自适应最优控制;所述自适应动态规划技术由评价网络和执行网络组成,所述评价网络用于逼近所述HJB方程的最优值函数,所述执行网络用于逼近所述最优控制律。
进一步地,对分布参数***的最优控制问题进行构建,则步骤S1包括:
步骤S11:给出描述分布参数***的高耗散型偏微分方程模型,如下:
Figure BDA0002922153400000081
其中,
Figure BDA0002922153400000082
为分布参数***的状态,n为该状态的维数,
Figure BDA0002922153400000083
为空间位置变量,t∈[0,∞)为时间变量;
Figure BDA0002922153400000084
是高耗散型空间微分算子,n0为该微分算子的最高阶次;控制变量为
Figure BDA0002922153400000085
m为该控制变量的维数,并且用
Figure BDA0002922153400000086
描述控制量的空间分布;b和X0(z)均为光滑向量函数,分别用于描述***的边界条件和初始状态。
步骤S12:构建分布参数***的性能指标,如下:
Figure BDA0002922153400000087
其中,<·>为内积,
Figure BDA0002922153400000088
R>0。
步骤S13:分布参数***的最优控制问题可转换成为***(公式一)设计最优控制律u*(t),使得性能指标J(X0(·))达到最小,即:
Figure BDA0002922153400000089
进一步地,采用一类最具代表性的时空分离方法——Karhunen-Loève分解,以分布参数***为基础,推导表征***主要变化机制的低阶集总参数***模型,如下:
根据傅里叶级数理论,高耗散型分布参数***的状态X(z,t)可以由一组正交空间基函数及相应的时间模态构成。为不失一般性,以X(z,t)的阶数为1进行讨论。假设
Figure BDA00029221534000000810
Figure BDA00029221534000000811
分别为一组完备的正交空间基底和时间模态,如下:
Figure BDA00029221534000000812
其中,选取以KL分解为代表的时空分离方法可以获得空间基函数
Figure BDA00029221534000000813
通过将上式代入分布参数***模型,并将模型两边同时与
Figure BDA00029221534000000814
进行内积运算,可以得到如下无穷维集总参数***模型:
Figure BDA0002922153400000091
其中,各参数的定义如下:
Figure BDA0002922153400000092
从高耗散型***的模态具有快慢分离特性的角度出发,存在一个小常数μ使得
Figure BDA0002922153400000093
因此,可推导出如下***模型:
Figure BDA0002922153400000094
式中,A表示指数稳定的阵;然后,定义τ=t/μ为快***常数,且让μ=0,则有yf(t)=0。因此,推导出如下集总参数***模型:
Figure BDA0002922153400000095
式中,n2为有限维低阶集总参数***的维数,由
Figure BDA0002922153400000096
确定。其中,λi为采用KL分解方法所得的特征值;p为所选取的n2维的低阶模态占总模态的比例,通常p越接近1,则表示越能获取***的主要动态,一般可设置成p≥90%;n3为所采集的***状态数据集的维数。
进一步地,基于所推导的集总参数***模型,将原始分布参数***的最优控制问题转化为集总参数***的最优控制问题,如下:
分布参数***的性能指标可改写为:
Figure BDA0002922153400000097
基于快慢分离特征有
Figure BDA0002922153400000098
则集总参数***的性能指标为:
Figure BDA0002922153400000101
那么,集总参数***的最优控制问题可以转化为求解HJB方程,如下:
Figure BDA0002922153400000102
其中,
Figure BDA0002922153400000103
V*(y)≥0,V*(y)=0当y=0。V*(y)为最优值函数,即可认为是在最优控制u*下使得上式成立的V(y);R-1为矩阵R的逆矩阵,f(y)为集总参数***中
Figure BDA0002922153400000104
变化特征的非线性函数。为描述简便,将f(y(t))简写为f(y)。
值得说明的是:在V*(y)和
Figure BDA0002922153400000105
等近似表述中,y为在常规的周期控制下,按周期来获得的时间模态,
Figure BDA0002922153400000106
为事件触发控制下(即非周期控制)获得的时间模态;由于二者不同,则对应的V*(y)和
Figure BDA0002922153400000107
也不同,后续不做赘述。
综上,***的最优控制律如下:
Figure BDA0002922153400000108
进一步地,从集总参数***的角度出发,建立分布参数***事件触发最优控制问题,步骤S3包括;
步骤S31:建立分布参数***的事件触发条件,并确定事件触发时刻。
由前述步骤可知,分布参数***的最优控制问题已转换成基于集总参数***的最优控制,因此下述事件触发最优控制方法将根据集总参数***的时间模态来进行设计。首先,定义事件触发控制器的模态误差为e1(t),如下:
Figure BDA0002922153400000109
其中,
Figure BDA00029221534000001010
为控制器可得的***模态,y(t)为***的真实模态。前述控制器可得的***模态和***的真实模态都可以通过分布参数***的状态与空间基函数作内积而得。事件触发下的时间模态
Figure BDA00029221534000001011
如下:
Figure BDA00029221534000001012
其中,tj为事件触发时刻,j为正整数。
然后,定义触发条件来确定事件触发下非周期控制的时刻。已有的事件触发条件,往往根据***的状态和控制等信息进行设计。而本实施例以此为基础,在将触发条件的设计中加入***的动力学,使得触发条件能够进一步包含当前***演化特征,以达到更好的控制效果。具体结构如下:
Figure BDA0002922153400000111
其中,q>0为一个待设计的常数。当上述条件不成立时发生事件触发,***真实模态将会传输到控制器中用以更新控制律。并且,
Figure BDA0002922153400000112
为事件触发时刻序列。
步骤S32:给出事件触发下分布参数***的控制策略。
根据最优控制理论,若能求解得到HJB方程的最优解
Figure BDA0002922153400000113
则可推导出事件触发下分布参数***的最优控制策略,如下:
Figure BDA0002922153400000114
进一步地,给出采用自适应动态规划技术实现分布参数***事件触发最优控制的设计步骤,步骤S4包括:
步骤S41:采用神经网络技术对自适应动态规划中的评价网络进行设计,以逼近集总参数***HJB方程的最优值函数,同时给出基于评价NN的事件触发最优控制律。在实际应用中,通常假设NN逼近误差极小,可以忽略不计。因此,评价NN的输出为:
Figure BDA0002922153400000115
其中,
Figure BDA0002922153400000116
为所构建的神经网络激活函数集合,n4为隐含层神经元的个数,
Figure BDA0002922153400000117
为真实权值向量θ*的估计值。由此可得执行网络的输出(即分布参数***的事件触发最优控制律)为:
Figure BDA0002922153400000118
其中,权值
Figure BDA0002922153400000119
满足:
Figure BDA00029221534000001110
步骤S42:确定评价NN中权值θ的更新律。
Figure BDA00029221534000001111
由常规的周期控制下的最优值函数V*(y)和最优控制u*(y)所构成,满足
Figure BDA00029221534000001112
由事件触发下的最优值函数的估计
Figure BDA00029221534000001113
和事件触发最优控制
Figure BDA0002922153400000121
构成,神经网络估计误差的存在使得
Figure BDA0002922153400000122
由此定义误差e2(y,θ),如下:
Figure BDA0002922153400000123
基于误差e2(y,θ)来设计评价NN的权值更新策略,如下:
Figure BDA0002922153400000124
其中,
Figure BDA0002922153400000125
参数γ定义为:
Figure BDA0002922153400000126
其中,
Figure BDA0002922153400000127
P为一个径向无界的Lyapunov函数。
步骤S43:基于自适应动态规划技术的分布参数***事件触发非周期最优控制算法,包含如下步骤:
首先,采集实际***的状态信息,并根据KL分解等时空分离方法获得相应的时间模态y;然后由所设计的权值更新策略(公式八)来更新评价网络的权值θ;同时,利用所获得的模态数据对事件触发条件(公式六)进行判断,以确定事件触发控制的时刻;若触发条件满足,则保持当前时刻的控制u不变;反之,则将***状态信息传输到控制器中,根据(公式七)计算新的控制律并进行更新。
实施例2
与上述实施例相对应的,本实施例提供一具体的计算例。
选取非线性扩散-反应过程的***模型对所提的事件触发下基于自适应动态规划的分布参数***非周期最优控制策略的有效性进行仿真验证与分析,如下:
Figure BDA0002922153400000128
其中,z∈[0,π],g(z)=H(z-0.4π)-H(z-0.5π),k=1,α1=12,α2=1,ρ=1。
所提的基于自适应动态规划的事件触发非周期最优控制方法在实施的过程中,包含以下步骤:
步骤1:对仿真验证中的相关参数进行合适的选取。
在分布参数***的事件触发最优控制中,设置R为单位矩阵,其维度由相应的时间模态来确定;设置触发条件中的参数q为0.5。
步骤2:从实际的分布参数***中采集状态数据,结合时空分离方法获得表征分布参数***主要空间分布特性的空间基函数。本实施例通过相应的计算,确定后续最优控制律设计过程中所用的空间基函数个数为2,空间基函数的分布见附图1。
步骤3:构建分布参数***的事件触发条件,采用自适应动态规划技术获得评价NN中的最优权值,进而获得事件触发控制策略。基于所设计的权值更新策略(公式八),更新评价网络的权值θ;同时,利用所获得的模态数据对事件触发条件(公式六)进行判断,以确定事件触发的控制时刻;若满足,则采用零阶保持器保持控制u不变;反之,则将***状态信息传输到控制器中,根据
Figure BDA0002922153400000131
计算新的控制律并进行更新。
附图2为评价网络中权值向量范数||θ||的变化轨迹,由此可知评价NN的权值最终会收敛到一固定值。附图3为分布参数***的事件触发控制律
Figure BDA0002922153400000132
由图3可知,控制律存在一段时间内保持不变的情况,这与事件触发下控制律的变化趋势相符,证明了所设计的事件触发下的最优控制方法的有效性。附图4为闭环集总参数***时间模态y(t)和
Figure BDA0002922153400000133
的轨迹,最终会收敛到0;附图5为事件触发控制下闭环分布参数***的状态曲面;同样地,***状态会收敛到0。由此可得,事件触发控制下闭环***的稳定性得以保证。综上,仿真验证结果表明了所提基于自适应动态规划的事件触发分布参数***最优控制方法的有效性和收敛性。
实施例3
与上述实施例相对应的,本实施例公开一种分布参数***的事件触发控制***,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
综上,本发明上述各实施例所分别公开的分布参数***事件触发控制方法及***,具有以下有益效果:
将事件触发首创性的引入到分布参数***中,不仅能实现分布参数***的最优控制,还能有效减少控制器的更新频率,从而使得本发明基于事件触发的最优控制方法能显著降低控制过程中计算资源与通信资源等的消耗。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种分布参数***的事件触发控制方法,其特征在于,包括:
步骤S1、构建分布参数***基于空间位置变量和时间变量的偏微分方程模型及对应的性能指标,将所述分布参数***的最优控制问题与性能指标关联;
步骤S2、基于时空分离方法推导对应所述偏微分方程模型的低阶集总参数***模型,基于所述集总参数***模型,将所述分布参数***最优控制问题转化为求解相应的HJB方程和最优控制律;
步骤S3、从事件触发的角度出发,定义触发条件,建立并分析分布参数***的事件触发最优控制问题;
步骤S4、采用自适应动态规划技术来实现分布参数***的事件触发自适应最优控制;所述自适应动态规划技术由评价网络和执行网络组成,所述评价网络用于逼近所述HJB方程的最优值函数,所述执行网络用于逼近所述最优控制律。
2.根据权利要求1所述的方法,其特征在于,所述步骤S1的分布参数***的偏微分方程模型具体为:
Figure FDA0002922153390000011
其中,
Figure FDA0002922153390000012
为分布参数***的状态,n为该状态的维数,
Figure FDA0002922153390000013
为空间位置变量,t∈[0,∞)为时间变量;
Figure FDA0002922153390000014
是高耗散型空间微分算子,n0为该微分算子的最高阶次;控制变量为
Figure FDA0002922153390000015
m为该控制变量的维数,并且用
Figure FDA0002922153390000016
描述控制量的空间分布;b和X0(z)均为光滑向量函数,分别用于描述***的边界条件和初始状态。
所述步骤S1所构建的分布参数***的性能指标具体为:
Figure FDA0002922153390000017
其中,<·>为内积,并且
Figure FDA0002922153390000018
Figure FDA0002922153390000019
为半正定矩阵,R>0为正定矩阵;
所述步骤S3将分布参数***的最优控制问题与性能指标关联包括:
将分布参数***的最优控制问题描述为:为所研究的公式一中的***设计最优控制律u*(t),使得性能指标J(X0(·))达到最小,即:
Figure FDA0002922153390000021
3.根据权利要求2所述的方法,其特征在于,所述步骤S2包括:
步骤S21、采用KL分解建立低阶集总参数***模型;
根据傅里叶级数理论,高耗散型分布参数***的状态X(z,t)能由一组正交空间基函数及相应的时间模态构成;当X(z,t)的阶数为1时,假设
Figure FDA0002922153390000022
Figure FDA0002922153390000023
分别为一组完备的正交空间基函数和时间模态,如下:
Figure FDA0002922153390000024
通过采用KL分解方法获得空间基函数
Figure FDA0002922153390000025
将公式二的X(z,t)代入公式一中的分布参数***模型,并将分布参数***模型两边同时与
Figure FDA0002922153390000026
进行内积运算,得到如下无穷维的集总参数***模型:
Figure FDA0002922153390000027
其中,各参数定义如下:
Figure FDA0002922153390000028
从***模态快慢分离的角度出发,存在一个小常数μ使得
Figure FDA0002922153390000029
因此,可推导出如下***模型:
Figure FDA00029221533900000210
然后,定义τ=t/μ为快***常数,且让μ=0,则有yf(t)=0;再推导出如下集总参数***模型:
Figure FDA0002922153390000031
公式三中的***模态y(t)的维数n2,由
Figure FDA0002922153390000032
确定,其中λi为采用KL分解方法所得的特征值,p为所选取的n2维的低阶模态占总模态的比例;n3为***状态数据集的维数;
步骤S22、基于所推导的集总参数***模型构建最优控制问题,将原始分布参数***的最优控制问题转化为基于集总参数***的最优控制问题;
将分布参数***的性能指标转换成:
Figure FDA0002922153390000033
其中,下标Q和R分别代表对应y(t)和u(t)的正定矩阵,Q≥0;且基于集总参数***的最优控制问题转化为求解如下HJB方程:
Figure FDA0002922153390000034
其中,f(y)为f(y(t))的简写,
Figure FDA0002922153390000035
Figure FDA0002922153390000036
为连续函数空间,V*(y)≥0,当y=0时,V*(y)=0;V*(y)为最优值函数,即在最优控制u*下使得HJB方程成立的V(y);R-1为矩阵R的逆矩阵,f(y)为集总参数***中
Figure FDA00029221533900000312
变化特征的非线性函数;分布参数***的最优控制律为:
Figure FDA0002922153390000037
4.根据权利要求3所述的方法,其特征在于,所述步骤S3包括:
步骤S31、建立分布参数***的事件触发条件,并确定事件触发时刻;
首先,定义事件触发控制器的模态误差为e1(t),如下:
Figure FDA0002922153390000038
其中,
Figure FDA0002922153390000039
为控制器可得的***模态,y(t)为***的真实模态;事件触发下的时间模态
Figure FDA00029221533900000310
如下:
Figure FDA00029221533900000311
其中,tj为事件触发时刻,j为正整数;
然后,定义触发条件来确定事件触发非周期控制的时刻,如下:
Figure FDA0002922153390000041
其中,q>0为待设计的参数;当上述条件不成立时,***真实模态将会传输到控制器中用以更新控制律;
Figure FDA0002922153390000042
为事件触发时刻序列;
步骤S32、根据最优控制理论和求解得到HJB方程的最优解
Figure FDA0002922153390000043
推导出分布参数***的事件触发最优控制策略,如下:
Figure FDA0002922153390000044
5.根据权利要求4所述的方法,其特征在于,所述步骤S4包括:
步骤S41、假设神经网络逼近误差极小到忽略不计,评价NN的输出为:
Figure FDA0002922153390000045
其中,
Figure FDA0002922153390000046
为所构建的神经网络激活函数集合,n4为隐含层神经元的个数,
Figure FDA0002922153390000047
为真实权值向量θ*的估计值;由此得到执行网络的输出为:
Figure FDA0002922153390000048
其中,权值
Figure FDA0002922153390000049
满足:
Figure FDA00029221533900000410
步骤S42、确定评价神经网络中权值θ的更新律;包括:
Figure FDA00029221533900000411
由常规的周期控制下的最优值函数V*(y)和最优控制u*(y)所构成,满足
Figure FDA00029221533900000412
Figure FDA00029221533900000413
由事件触发下的最优值函数的估计
Figure FDA00029221533900000414
和事件触发最优控制
Figure FDA00029221533900000415
构成,神经网络估计误差的存在使得
Figure FDA00029221533900000416
定义误差e2(y,θ)如下:
Figure FDA00029221533900000417
基于误差e2(y,θ)来设计评价神经网络权值θ的更新策略,如下:
Figure FDA0002922153390000051
其中,
Figure FDA0002922153390000052
为θ的导数,
Figure FDA0002922153390000053
Figure FDA0002922153390000054
用于稳定***,参数γ定义为:
Figure FDA0002922153390000055
其中,
Figure FDA0002922153390000056
P为一个径向无界的Lyapunov函数;
步骤S43、基于自适应动态规划技术的分布参数***事件触发非周期最优控制算法,具体包含如下步骤:
首先,采集实际***的状态信息,根据KL分解获得相应的时间模态信息y;然后,根据所设计公式八的权值更新策略来更新评价网络的权值θ;同时,利用所获得的模态数据对公式六中的事件触发条件进行判断,以确定事件触发控制的时刻;若触发条件满足,则保持当前时刻的控制u不变;反之,则将***状态信息传输到控制器中,根据公式七计算新的控制律并进行更新。
6.一种分布参数***的事件触发控制***,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1至5任一所述方法的步骤。
CN202110120442.XA 2021-01-28 2021-01-28 分布参数***的事件触发控制方法及*** Active CN112947329B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110120442.XA CN112947329B (zh) 2021-01-28 2021-01-28 分布参数***的事件触发控制方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110120442.XA CN112947329B (zh) 2021-01-28 2021-01-28 分布参数***的事件触发控制方法及***

Publications (2)

Publication Number Publication Date
CN112947329A true CN112947329A (zh) 2021-06-11
CN112947329B CN112947329B (zh) 2022-08-12

Family

ID=76238893

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110120442.XA Active CN112947329B (zh) 2021-01-28 2021-01-28 分布参数***的事件触发控制方法及***

Country Status (1)

Country Link
CN (1) CN112947329B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114362375A (zh) * 2022-03-16 2022-04-15 宜科(天津)电子有限公司 一种远程通信数据处理***

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050028037A1 (en) * 2003-07-31 2005-02-03 Junk Kenneth W. Triggered field device data collection in a process control system
CN101963809A (zh) * 2005-10-25 2011-02-02 费舍-柔斯芒特***股份有限公司 在无线和其他过程控制***中的非周期控制通信
KR20110133448A (ko) * 2010-06-04 2011-12-12 엘지전자 주식회사 단말의 비주기적 사운딩 참조신호 트리거링 기반 srs 전송 방법 및 비주기적 srs를 전송하기 위한 상향링크 전송 전력을 제어 방법
CN108829065A (zh) * 2018-07-16 2018-11-16 东北大学 基于事件触发的分布式发电***时滞输出协同控制方法
CN109062273A (zh) * 2018-08-15 2018-12-21 北京交通大学 基于事件触发pid控制的列车速度曲线跟踪控制方法和***
CN110456821A (zh) * 2019-08-22 2019-11-15 安徽大学 基于动态触发机制的飞行器轨迹最优控制方法和***
FR3085977A1 (fr) * 2018-09-19 2020-03-20 Delabie Systeme de commande a declenchement par detection de presence

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050028037A1 (en) * 2003-07-31 2005-02-03 Junk Kenneth W. Triggered field device data collection in a process control system
CN101963809A (zh) * 2005-10-25 2011-02-02 费舍-柔斯芒特***股份有限公司 在无线和其他过程控制***中的非周期控制通信
KR20110133448A (ko) * 2010-06-04 2011-12-12 엘지전자 주식회사 단말의 비주기적 사운딩 참조신호 트리거링 기반 srs 전송 방법 및 비주기적 srs를 전송하기 위한 상향링크 전송 전력을 제어 방법
CN108829065A (zh) * 2018-07-16 2018-11-16 东北大学 基于事件触发的分布式发电***时滞输出协同控制方法
CN109062273A (zh) * 2018-08-15 2018-12-21 北京交通大学 基于事件触发pid控制的列车速度曲线跟踪控制方法和***
FR3085977A1 (fr) * 2018-09-19 2020-03-20 Delabie Systeme de commande a declenchement par detection de presence
CN110456821A (zh) * 2019-08-22 2019-11-15 安徽大学 基于动态触发机制的飞行器轨迹最优控制方法和***

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
SHI WANG: "Centralized event-triggered control of multi-agent systems with dynamic triggering mechanisms", 《THE 27TH CHINESE CONTROL AND DECISION CONFERENCE 》 *
王闯: "基于事件触发的全信息粒子群优化器及其应用", 《自动化学报》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114362375A (zh) * 2022-03-16 2022-04-15 宜科(天津)电子有限公司 一种远程通信数据处理***

Also Published As

Publication number Publication date
CN112947329B (zh) 2022-08-12

Similar Documents

Publication Publication Date Title
Huang et al. Event-triggered adaptive finite-time tracking control for full state constraints nonlinear systems with parameter uncertainties and given transient performance
CN110782011A (zh) 一种基于强化学习的网络化多智能体***分布式优化控制方法
US20030158709A1 (en) Method and apparatus for parameter estimation, parameter estimation control and learning control
CN110262245A (zh) 基于事件触发机制的多智能体***的控制器设计方法
CN114547980B (zh) 具有时变状态约束的多智能体有限时间事件触发控制方法
CN110427006A (zh) 一种用于流程工业的多智能体协同控制***及方法
CN112698572A (zh) 一种基于强化学习的结构振动控制方法、介质及设备
CN112180730B (zh) 一种多智能体***分层最优一致性控制方法和装置
CN115168027A (zh) 一种基于深度强化学习的算力资源度量方法
CN112947329B (zh) 分布参数***的事件触发控制方法及***
CN111367181A (zh) 一种用于污水处理***的混合驱动智能评判控制方法
CN113821983A (zh) 基于代理模型的工程设计优化方法、装置及电子设备
CN108803601A (zh) 一种具有通信约束的移动机器人鲁棒预测跟踪控制方法
Kosmatopoulos Control of unknown nonlinear systems with efficient transient performance using concurrent exploitation and exploration
CN115167102A (zh) 一种基于并行优势动作评价的强化学习自适应pid控制方法
Chen et al. Optimal control models in finance
JP7497516B2 (ja) 等式制約を代数モデルに課すための射影方法
CN112149361B (zh) 一种线性***自适应最优控制方法和装置
Lian et al. Inverse $ Q $-Learning Using Input–Output Data
Hua et al. $ H_ {\infty} $ Filtering for Discrete-Time Periodic Markov Jump Systems With Quantized Measurements: A New Packet Loss Compensation Strategy
CN112000004A (zh) 一种利用迭代二次启发式规划的污水处理浓度控制方法
CN111624872A (zh) 一种基于自适应动态规划的pid控制器参数整定方法及***
Lee et al. An approximate optimization strategy using refined hybrid metamodel
CN115941802A (zh) 远程状态估计传感器调度方法、调度器及信息物理***
Chanfreut et al. Distributed model predictive control based on dual decomposition with neural-network-based warm start

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant