CN116009594B - 一种基于零和博弈的高超声速飞行器状态约束容错控制方法 - Google Patents

一种基于零和博弈的高超声速飞行器状态约束容错控制方法 Download PDF

Info

Publication number
CN116009594B
CN116009594B CN202310302104.7A CN202310302104A CN116009594B CN 116009594 B CN116009594 B CN 116009594B CN 202310302104 A CN202310302104 A CN 202310302104A CN 116009594 B CN116009594 B CN 116009594B
Authority
CN
China
Prior art keywords
hypersonic aircraft
attitude
fault
zero
control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310302104.7A
Other languages
English (en)
Other versions
CN116009594A (zh
Inventor
任文静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei University of Technology
Original Assignee
Hefei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei University of Technology filed Critical Hefei University of Technology
Priority to CN202310302104.7A priority Critical patent/CN116009594B/zh
Publication of CN116009594A publication Critical patent/CN116009594A/zh
Application granted granted Critical
Publication of CN116009594B publication Critical patent/CN116009594B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T90/00Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation

Landscapes

  • Feedback Control In General (AREA)

Abstract

本发明公开了一种基于零和博弈的高超声速飞行器状态约束容错控制方法,包括:建立含有质心偏移量的高超声速飞行器姿态动力学模型,引入时变高超声速飞行器状态安全约束函数,将高超声速飞行器受到的偏心力矩与执行器部分失效故障输入到容错控制框架中,设计带有状态约束的高超声速飞行器姿态角控制策略和姿态角速率控制策略,得到容错安全控制器;引入零和博弈性能指标,将高超声速飞行器在状态安全约束下的性能与高超声速飞行器姿态动力学模型对不确定性的补偿能力形成零和博弈,优化补偿容错安全控制器,保障高超声速飞行器的安全。本发明高超声速飞行器状态约束容错控制方法在发生异常质心偏移时,仍能够安全完成飞行任务。

Description

一种基于零和博弈的高超声速飞行器状态约束容错控制方法
技术领域
本发明属于自动控制技术领域,具体地,涉及一种基于零和博弈的高超声速飞行器状态约束容错控制方法。
背景技术
随着航空航天技术的发展与进步,新型的航空航天技术相继出现。高超声速飞行器指的是一种集航空器、航天器和运载器于一体的新型飞行器,它集航空、航天的功能于一身,既能在大气层内作高超声速飞行,速度在马赫数5以上,又能穿过大气层进入轨道,具有较高的应用价值。因其超高速的飞行特性,使得高超声速飞行器的***动力学模型具有多变量、强耦合、快时变、强非线性等特点,使得***的容错性显得尤为重要。否则,因故障,尤其是结构的损伤故障,不仅仅会降低飞行器的***性能,甚至直接导致飞行器的损毁,引发事故。故需要对故障进行分析,通过有效的容错控制方法,使得在极端情况下依然能够保持相当的操控性,最终安全返航。因此,如何增强飞行器控制***有效处理***故障的能力来提高***的安全性能成为研究热点。
目前,关于高超声速飞行器容错控制方法主要集中以下几个方面:(1) 基于自适应神经网络估计技术来处理因执行器部分失效故障带来的控制性能下降,(2) 基于数据驱动的方法根据***的实时状态来动态调节***参数,完成容错控制;(3) 基于反步法技术的执行器故障补偿设计等。在以往的故障补偿设计过程中,通常情况下高超声速飞行器的***转动能惯量矩阵是可逆的,不会造成***控制特性的改变,但是上述算法无法支撑转动惯量矩阵参数的大幅度变化,以及质心偏移造成的转动惯量矩阵奇异现象,导致控制失败,同时,保障***安全的状态约束控制,也需要***状态预先位于状态约束边界之内,有较大的局限性,无法及时做出对***状态的安全约束,难以形成有效的容错控制策略。因而,上述问题亟需设计新的策略来解决。
发明内容
为了克服现有技术中存在的不足,本发明针对含有未知质心偏移情况下的高超声速飞行器状态安全约束控制问题,提供了一种基于零和博弈的高超声速飞行器状态约束容错控制方法,该方法基于状态约束控制技术与零和博弈优化控制技术,保证飞行器在出现未知质心偏移故障时,仍能够具有相应的控制能力,保障高超声速飞行器安全飞行的状态约束能力,提高飞行器控制***的容错性能。
为实现上述目的,本发明采用如下技术方案:一种基于零和博弈的高超声速飞行器状态约束容错控制方法,具体包括如下步骤:
步骤1:根据高超声速飞行器的未知质心偏移量及飞行环境,建立含有质心偏移量的高超声速飞行器姿态动力学模型;
步骤2:根据步骤1建立的高超声速飞行器姿态动力学模型,引入时变高超声速飞行器状态安全约束函数;
步骤3:基于步骤2建立的时变高超声速飞行器状态安全约束函数,采用范数界的方法,将高超声速飞行器受到的偏心力矩与执行器部分失效故障通过自适应控制的方法输入到容错控制框架中,建立基于反步法的容错安全控制框架,设计带有状态约束的高超声速飞行器姿态角控制策略和姿态角速率控制策略,得到容错安全控制器,实现高超声速飞行器在故障下的有界稳定;
步骤4:引入零和博弈性能指标,将高超声速飞行器在状态安全约束下的性能与高超声速飞行器姿态动力学模型对不确定性的补偿能力形成零和博弈,通过自适应动态规划优化补偿容错安全控制器,优化容错安全控制框架,保障高超声速飞行器的安全。
进一步地,所述含有质心偏移量的高超声速飞行器姿态动力学模型的建立过程为:
Figure SMS_1
其中,
Figure SMS_4
为高超声速飞行器的飞行姿态角,/>
Figure SMS_14
,/>
Figure SMS_20
为高超声速飞行器飞行姿态角中的滚转角,/>
Figure SMS_7
为高超声速飞行器飞行姿态角中的攻角,/>
Figure SMS_11
为高超声速飞行器飞行姿态角中的侧滑角,/>
Figure SMS_17
为姿态角速率,/>
Figure SMS_23
,/>
Figure SMS_5
为高超声速飞行器的滚转角速度,/>
Figure SMS_12
为高超声速飞行器的俯仰角速度,/>
Figure SMS_18
为高超声速飞行器的偏航角速度,/>
Figure SMS_24
为姿态旋转矩阵,/>
Figure SMS_8
,/>
Figure SMS_13
为角速度旋转矩阵,
Figure SMS_19
,/>
Figure SMS_25
为未发生质心偏移时的高超声速飞行器姿态动力学模型的转动惯量,/>
Figure SMS_6
为高超声速飞行器姿态动力学模型发生质心偏移引起的转动惯量的变化量,
Figure SMS_15
为未知的质心偏移量,/>
Figure SMS_21
为高超声速飞行器质心的在机体坐标系上未知偏离量的三个分量,/>
Figure SMS_26
为高超声速飞行器***控制输入量,/>
Figure SMS_2
为质心偏移对高超声速飞行器带来的偏心力矩,/>
Figure SMS_9
为控制输入旋转矩阵,/>
Figure SMS_16
Figure SMS_22
分别为高超声速飞行器***控制输入量/>
Figure SMS_3
在机体坐标系上的三个分量,/>
Figure SMS_10
为高超声速飞行器姿态动力学模型受到的外部有界干扰。
进一步地,所述高超声速飞行器姿态动力学模型发生质心偏移引起的转动惯量的变化量
Figure SMS_27
表示为:/>
Figure SMS_28
其中,
Figure SMS_33
为高超声速飞行器姿态动力学模型发生质心偏移引起的转动惯量在高超声速飞行器对称平面内并平行与高超声速飞行器的设计轴线方向偏移量,
Figure SMS_34
,/>
Figure SMS_47
为高超声速飞行器的质量;/>
Figure SMS_36
为高超声速飞行器姿态动力学模型发生质心偏移引起的转动惯量在垂直于高超声速飞行器对称平面指向高超声速飞行器右方的偏移量,/>
Figure SMS_44
;/>
Figure SMS_38
为高超声速飞行器姿态动力学模型发生质心偏移引起的转动惯量在高超声速飞行器对称平面内与/>
Figure SMS_43
轴垂直并指向高超声速飞行器下方的偏移量,/>
Figure SMS_31
;/>
Figure SMS_41
为高超声速飞行器姿态动力学模型发生质心偏移引起的在/>
Figure SMS_29
轴与/>
Figure SMS_40
轴耦合的惯量积,/>
Figure SMS_37
;/>
Figure SMS_46
为高超声速飞行器姿态动力学模型发生质心偏移引起的在/>
Figure SMS_35
轴与/>
Figure SMS_48
轴耦合的惯量积,/>
Figure SMS_32
;/>
Figure SMS_42
为高超声速飞行器姿态动力学模型发生质心偏移引起的在/>
Figure SMS_39
轴与/>
Figure SMS_45
轴耦合的惯量积,/>
Figure SMS_30
进一步地,所述时变高超声速飞行器状态安全约束函数
Figure SMS_49
的建立过程为:
Figure SMS_50
其中,
Figure SMS_51
为时变高超声速飞行器的姿态状态约束边界。
进一步地,根据时变高超声速飞行器状态安全约束函数形成的高超声速飞行器的飞行姿态角的安全约束区域
Figure SMS_52
为/>
Figure SMS_53
,当高超声速飞行器未发生质心偏移时,扩大所述高超声速飞行器的飞行姿态角的安全约束区域至所述高超声速飞行器的整个飞行包线;当高超声速飞行器发生未知质心变动时,缩小所述高超声速飞行器的姿态状态约束边界,将所述高超声速飞行器的飞行姿态角约束在安全约束区域/>
Figure SMS_54
内。
进一步地,步骤3包括如下子步骤:
步骤31:根据步骤2建立的时变高超声速飞行器状态安全约束函数,引入高超声速飞行器的姿态跟踪误差,包括:飞行姿态角
Figure SMS_55
的跟踪误差/>
Figure SMS_56
和姿态角速率/>
Figure SMS_57
的跟踪误差
Figure SMS_58
Figure SMS_59
其中,
Figure SMS_60
为引入时变高超声速飞行器状态安全约束函数,/>
Figure SMS_61
为满足状态安全约束函数的期望姿态角指令,/>
Figure SMS_62
,/>
Figure SMS_63
为由飞行任务目标制定的期望姿态角度,/>
Figure SMS_64
为由飞行任务目标制定的期望姿态角速率;
步骤32:将步骤31中的飞行姿态角跟踪误差
Figure SMS_65
关于时间/>
Figure SMS_66
求导,得:
Figure SMS_67
其中,
Figure SMS_69
为与高速飞行器姿态相关的时变参数,/>
Figure SMS_72
Figure SMS_74
为与高超声速飞行器姿态状态约束函数相关的时变参数,/>
Figure SMS_70
Figure SMS_73
为含有质心偏移量的高超声速飞行器姿态动力学模型的不确定分配矩阵,/>
Figure SMS_75
为与高超声速飞行器期望姿态相关的时变函数,/>
Figure SMS_76
,/>
Figure SMS_68
为与高超声速飞行器姿态状态约束函数相关的时变函数,/>
Figure SMS_71
步骤33:引入一阶滤波器
Figure SMS_77
,将姿态角速率/>
Figure SMS_78
转换成:
Figure SMS_79
其中,
Figure SMS_84
为一阶滤波器的输出,/>
Figure SMS_83
为待设计的虚拟控制量,/>
Figure SMS_92
,/>
Figure SMS_81
为设计的状态反馈控制量,/>
Figure SMS_89
为基于零和博弈设计的优化辅助控制量,/>
Figure SMS_85
为关于/>
Figure SMS_93
、/>
Figure SMS_82
Figure SMS_91
以及一阶滤波器输出/>
Figure SMS_80
与虚待设计的虚拟控制量/>
Figure SMS_90
之间的误差/>
Figure SMS_88
的动态函数,
Figure SMS_96
,/>
Figure SMS_87
为与高超声速飞行器姿态动力学模型状态无关的时变动态函数,/>
Figure SMS_94
,基于杨氏不等式,将/>
Figure SMS_86
简化:
Figure SMS_95
其中,
Figure SMS_98
,/>
Figure SMS_100
为姿态旋转矩阵/>
Figure SMS_102
的下范数界,/>
Figure SMS_99
为姿态旋转矩阵/>
Figure SMS_101
的上范数界,/>
Figure SMS_103
为第一未知的自适应参量,/>
Figure SMS_104
Figure SMS_97
为已知的动态函数;
步骤34:结合第一Lyapunov函数
Figure SMS_105
和Backatepping法,进行带有状态约束的高超声速飞行器姿态角控制策略设计:/>
Figure SMS_106
其中,
Figure SMS_108
为设计的虚拟控制器增益,/>
Figure SMS_111
为第一正数控制参数,/>
Figure SMS_114
为第二正数控制参数,/>
Figure SMS_109
为对/>
Figure SMS_112
的估计误差,/>
Figure SMS_115
为/>
Figure SMS_116
的估计值,对/>
Figure SMS_107
求导并结合步骤33中关于/>
Figure SMS_110
简化的不等式,对第一Lyapunov函数/>
Figure SMS_113
求导,实现高超声速飞行器在故障下的有界稳定:
Figure SMS_117
其中,
Figure SMS_118
为正定的参数;
步骤35:根据步骤31的高超声速飞行器的姿态跟踪误差,得出姿态角速率的跟踪误差的动态方程:
Figure SMS_119
,其中,/>
Figure SMS_120
为3×3的转动惯量矩阵,/>
Figure SMS_121
,/>
Figure SMS_122
为高超声速飞行器受到的偏心力矩部分失效故障,/>
Figure SMS_123
为执行器的卡死故障;引入变换/>
Figure SMS_124
,并结合自适应控制方法对动态方程中的不确定性进行参数化:/>
Figure SMS_125
其中,
Figure SMS_127
为三维列向量,/>
Figure SMS_130
为3行6列的矩阵,/>
Figure SMS_133
,对于任意给定的三维列向量/>
Figure SMS_128
,变换/>
Figure SMS_131
表示为:/>
Figure SMS_134
,得出:/>
Figure SMS_135
和/>
Figure SMS_126
,将/>
Figure SMS_129
结合自适应算法的少参数化方法,则映射/>
Figure SMS_132
为:
Figure SMS_136
其中,
Figure SMS_137
为第二未知的自适应参量,/>
Figure SMS_138
,/>
Figure SMS_139
为未知常数,
Figure SMS_140
为已知的基函数,/>
Figure SMS_141
步骤36:根据带有状态约束的高超声速飞行器姿态角控制策略和姿态角速率控制策略,结合Lyaounov稳定性理论,建立第二Lyapunov函数
Figure SMS_142
,针对动态方程/>
Figure SMS_143
设计如下容错安全控制器/>
Figure SMS_144
Figure SMS_145
其中,
Figure SMS_147
为复合干扰量,/>
Figure SMS_149
,/>
Figure SMS_151
为容错安全控制器的增益,/>
Figure SMS_148
均为正定控制参量,/>
Figure SMS_150
为自适应量/>
Figure SMS_152
的估计误差,
Figure SMS_153
为自适应量/>
Figure SMS_146
的估计值;
步骤37:结合设计的容错安全控制器
Figure SMS_154
与第二Lyapunov函数,对/>
Figure SMS_155
进行求导,实现高超声速飞行器在故障下的有界稳定:
Figure SMS_156
其中,
Figure SMS_157
为第一待定正常数,/>
Figure SMS_158
,/>
Figure SMS_159
为第二待定正常数,/>
Figure SMS_160
,/>
Figure SMS_161
为已知且有界的正函数,
Figure SMS_162
,/>
Figure SMS_163
为第三待定正常数。
进一步地,步骤4包括如下子步骤:
步骤41:将飞行姿态角
Figure SMS_164
的跟踪误差/>
Figure SMS_165
和姿态角速率/>
Figure SMS_166
的跟踪误差/>
Figure SMS_167
整合为优化仿射非线性形式,形成控制变量与***扰动量的零和博弈;所述优化仿射非线性形式为:
Figure SMS_168
其中,
Figure SMS_171
为高超声速飞行器的飞行姿态的跟踪误差,/>
Figure SMS_175
,/>
Figure SMS_180
为高超声速飞行器姿态动力学模型矩阵,/>
Figure SMS_172
, />
Figure SMS_176
为常系数矩阵,/>
Figure SMS_179
,/>
Figure SMS_182
为基于零和博弈的优化控制补偿器,/>
Figure SMS_169
,/>
Figure SMS_173
为控制变量,/>
Figure SMS_177
为容错安全控制器,/>
Figure SMS_181
为高超声速飞行器姿态动力学模型的扰动量,/>
Figure SMS_170
,/>
Figure SMS_174
为待定的正常数,/>
Figure SMS_178
为近似函数;
步骤42:设计零和博弈目标函数,并通过哈密顿函数优化零和博弈目标函数,并基于达到纳什均衡时的最优容许控制得到最优控制对
Figure SMS_183
所述零和博弈目标函数
Figure SMS_184
为:
Figure SMS_185
其中,
Figure SMS_186
为正定惩罚项,/>
Figure SMS_187
为第一正定矩阵,/>
Figure SMS_188
为第二正定矩阵,调节
Figure SMS_189
与/>
Figure SMS_190
形成零和博弈权重;
所述哈密顿函数
Figure SMS_191
,且哈密顿函数满足:/>
Figure SMS_192
,其中,/>
Figure SMS_193
为零和博弈目标函数/>
Figure SMS_194
关于/>
Figure SMS_195
的梯度;
所述
Figure SMS_196
,/>
Figure SMS_197
进一步地,步骤42中所述最优控制对
Figure SMS_198
的求取过程为:
步骤421:通过基于自适应动态规划的零和博弈值迭代求解方法,设计基于神经网络的估计器:
Figure SMS_199
其中,
Figure SMS_200
为理想的神经网络权重,/>
Figure SMS_201
,/>
Figure SMS_202
为/>
Figure SMS_203
的范数边界,/>
Figure SMS_204
为神经网络的激活函数,/>
Figure SMS_205
为神经网络的估计误差;
步骤422:将神经网络的估计器进行梯度信息化:
Figure SMS_206
,并将最优控制对/>
Figure SMS_207
转化为:
Figure SMS_208
其中,
Figure SMS_209
、/>
Figure SMS_210
通过与梯度信息有关的HJB方程求得:
Figure SMS_211
其中,
Figure SMS_213
为神经网络激活函数的梯度,/>
Figure SMS_216
为神经网络估计误差的梯度,/>
Figure SMS_220
为正定矩阵,/>
Figure SMS_214
,/>
Figure SMS_217
为已知的正定矩阵,/>
Figure SMS_219
,/>
Figure SMS_222
,/>
Figure SMS_212
为未知且待定的负定矩阵,/>
Figure SMS_215
,/>
Figure SMS_218
Figure SMS_221
均为有界的正常数。
进一步地,步骤422中的
Figure SMS_223
求取过程为:定义/>
Figure SMS_224
为/>
Figure SMS_225
的估计量,得/>
Figure SMS_226
,其中,/>
Figure SMS_227
为/>
Figure SMS_228
的估计,得最优控制对/>
Figure SMS_229
的估计:
Figure SMS_230
结合最优控制对
Figure SMS_231
的估计,构成如下的哈密顿函数误差:
Figure SMS_232
并将哈密顿函数误差最小化:
Figure SMS_233
得到
Figure SMS_234
的更新率为:
Figure SMS_235
其中,
Figure SMS_239
为神经网络权重的学习率,/>
Figure SMS_240
为第一待定且时变的增益,
Figure SMS_244
,/>
Figure SMS_238
为第三待定且时变的增益,/>
Figure SMS_243
,/>
Figure SMS_246
为第二待定且时变的增益,/>
Figure SMS_248
,/>
Figure SMS_236
和/>
Figure SMS_242
分别为权重调节矩阵,/>
Figure SMS_245
为设计的二次型矩阵,
Figure SMS_247
为已知的分段函数,/>
Figure SMS_237
Figure SMS_241
与现有技术相比,本发明具有如下有益效果:本发明基于零和博弈的高超声速飞行器状态约束容错控制方法中,将高超声速飞行器在状态安全约束下的性能与高超声速飞行器姿态动力学模型对不确定性的补偿能力形成零和博弈,一方面能够在无故障时,减小对高超声速飞行器姿态动力学模型状态的约束,释放高超声速飞行器的性能,另一方面,在出现故障时,能够约束住高超声速飞行器的状态,使其为主安全约束边界内,同时借助于零和博弈,优化高超声速飞行器姿态动力学模型的容错控制能力,通过将高超声速飞行器状态约束在安全范围内,实现高超声速飞行器故障情况下的容错、安全控制,从而提高了高超声速飞行器模型运行的安全性与可靠性,控制算法结构稳定,由Backstepping融合零和博弈机制,通过神经网络寻优,结构清晰,易于实现。
附图说明
图1为本发明基于零和博弈的高超声速飞行器状态约束容错控制方法的框架图;
图2为含有未知质心偏移故障下的高超声速飞行器姿态跟踪响应曲线,其中,图2中的(a)为高超声速飞行器随时间变化的攻角跟踪曲线,图2中的(b)为高超声速飞行器随时间变化的俯仰角跟踪曲线,图2中的(c)为高超声速飞行器随时间变化的滚转角跟踪曲线。
实施方式
下面结合附图和实施例对本发明的技术方案作进一步地解释说明。
如图1为本发明基于零和博弈的高超声速飞行器状态约束容错控制方法的框架图,该基于零和博弈的高超声速飞行器状态约束容错控制方法,具体包括如下步骤:
步骤1:根据飞行器的未知质心偏移量及飞行环境,建立含有质心偏移量的高超声速飞行器姿态动力学模型,刻画未知质心偏移量对高超声速飞行器姿态运动特性的影响,有别于常规的高超声速飞行器运动学模型,未知的质心偏移在高超声速飞行器的姿态运动方面的影响主要体现在以下三个方面:1)高超声速飞行器姿态动力学模型状态惯量矩阵的改变;2)高超声速飞行器姿态动力学模型的强耦合不确定性;3)偏心力矩,三者同时出现。因此,基于高超声速飞行器的运动学及动力学知识,基于质心变动量对于飞行器姿态的影响,建立了涵盖上述三者影响的高超声速飞行器含质心变动的姿态运动学及动力学模型,揭示质心变动的对飞行器姿态运动的影响规律,具体地,含有质心偏移量的高超声速飞行器姿态动力学模型的建立过程为:
Figure SMS_249
其中,
Figure SMS_251
为高超声速飞行器的飞行姿态角,/>
Figure SMS_258
,/>
Figure SMS_264
为高超声速飞行器飞行姿态角中的滚转角,/>
Figure SMS_252
为高超声速飞行器飞行姿态角中的攻角,/>
Figure SMS_261
为高超声速飞行器飞行姿态角中的侧滑角,/>
Figure SMS_268
为姿态角速率,/>
Figure SMS_274
,/>
Figure SMS_254
为高超声速飞行器的滚转角速度,/>
Figure SMS_259
为高超声速飞行器的俯仰角速度,/>
Figure SMS_266
为高超声速飞行器的偏航角速度,/>
Figure SMS_272
为姿态旋转矩阵,/>
Figure SMS_253
,/>
Figure SMS_262
为角速度旋转矩阵,
Figure SMS_269
,/>
Figure SMS_275
为未发生质心偏移时的高超声速飞行器姿态动力学模型的转动惯量,/>
Figure SMS_256
为未知的质心偏移量,/>
Figure SMS_260
为高超声速飞行器质心的在机体坐标系上未知偏离量的三个分量,/>
Figure SMS_267
为高超声速飞行器***控制输入量,/>
Figure SMS_273
为质心偏移对高超声速飞行器带来的偏心力矩,/>
Figure SMS_250
为控制输入旋转矩阵,/>
Figure SMS_257
Figure SMS_265
分别为高超声速飞行器***控制输入量/>
Figure SMS_271
在机体坐标系上的三个分量,/>
Figure SMS_255
为高超声速飞行器姿态动力学模型受到的外部有界干扰,/>
Figure SMS_263
为高超声速飞行器姿态动力学模型发生质心偏移引起的转动惯量的变化量,/>
Figure SMS_270
其中,
Figure SMS_278
为高超声速飞行器姿态动力学模型发生质心偏移引起的转动惯量在高超声速飞行器对称平面内并平行与高超声速飞行器的设计轴线方向偏移量,
Figure SMS_284
,/>
Figure SMS_290
为高超声速飞行器的质量;/>
Figure SMS_283
为高超声速飞行器姿态动力学模型发生质心偏移引起的转动惯量在垂直于高超声速飞行器对称平面指向高超声速飞行器右方的偏移量,/>
Figure SMS_291
;/>
Figure SMS_285
为高超声速飞行器姿态动力学模型发生质心偏移引起的转动惯量在高超声速飞行器对称平面内与/>
Figure SMS_295
轴垂直并指向高超声速飞行器下方的偏移量,/>
Figure SMS_279
;/>
Figure SMS_287
为高超声速飞行器姿态动力学模型发生质心偏移引起的在/>
Figure SMS_276
轴与/>
Figure SMS_288
轴耦合的惯量积,/>
Figure SMS_281
;/>
Figure SMS_294
为高超声速飞行器姿态动力学模型发生质心偏移引起的在/>
Figure SMS_280
轴与/>
Figure SMS_293
轴耦合的惯量积,/>
Figure SMS_286
;/>
Figure SMS_289
为高超声速飞行器姿态动力学模型发生质心偏移引起的在/>
Figure SMS_277
轴与/>
Figure SMS_292
轴耦合的惯量积,/>
Figure SMS_282
步骤2:根据步骤1建立的高超声速飞行器姿态动力学模型,对其影响特性的分析,引入时变高超声速飞行器状态安全约束函数,使得能够兼顾有无故障时高超声速飞行器的状态约束问题,保障高超声速飞行器的安全,在有故障时,约束***状态至安全状态域中,无故障时,放宽对***状态的约束,发挥高超声速飞行器的性能;具体地,时变高超声速飞行器状态安全约束函数
Figure SMS_296
的建立过程为:
Figure SMS_297
其中,
Figure SMS_298
为时变高超声速飞行器的姿态状态约束边界。
上述时变高超声速飞行器状态安全约束函数
Figure SMS_299
满足以下特性:
(1)
Figure SMS_300
,/>
(2)
Figure SMS_301
根据时变高超声速飞行器状态安全约束函数形成的高超声速飞行器的飞行姿态角的安全约束区域
Figure SMS_302
为/>
Figure SMS_303
,当面对高超声速飞行器的容错控制需求时,借助于上述特性:当高超声速飞行器未发生质心偏移时,扩大所述高超声速飞行器的飞行姿态角的安全约束区域至所述高超声速飞行器的整个飞行包线,释放飞行器的性能;当高超声速飞行器发生未知质心变动时,为保障飞行器的安全,缩小所述高超声速飞行器的姿态状态约束边界,将高超声速飞行器的飞行姿态角约束在安全约束区域/>
Figure SMS_304
内。
步骤3:基于步骤2建立的时变高超声速飞行器状态安全约束函数,采用范数界的方法,将高超声速飞行器受到的偏心力矩与执行器部分失效故障通过自适应控制的方法输入到容错控制框架中,建立基于反步法的容错安全控制框架,设计带有状态约束的高超声速飞行器姿态角控制策略和姿态角速率控制策略,得到容错安全控制器,实现高超声速飞行器在故障下的有界稳定;具体包括如下子步骤:
步骤31:根据步骤2建立的时变高超声速飞行器状态安全约束函数,引入高超声速飞行器的姿态跟踪误差,包括:飞行姿态角
Figure SMS_305
的跟踪误差/>
Figure SMS_306
和姿态角速率/>
Figure SMS_307
的跟踪误差
Figure SMS_308
Figure SMS_309
其中,
Figure SMS_310
为引入时变高超声速飞行器状态安全约束函数,/>
Figure SMS_311
为满足状态安全约束函数的期望姿态角指令,/>
Figure SMS_312
,/>
Figure SMS_313
为由飞行任务目标制定的期望姿态角度,/>
Figure SMS_314
为由飞行任务目标制定的期望姿态角速率;
步骤32:将步骤31中的飞行姿态角跟踪误差
Figure SMS_315
关于时间/>
Figure SMS_316
求导,得:
Figure SMS_317
其中,
Figure SMS_319
为与高速飞行器姿态相关的时变参数,/>
Figure SMS_322
Figure SMS_324
为与高超声速飞行器姿态状态约束函数相关的时变参数,/>
Figure SMS_320
Figure SMS_323
为含有质心偏移量的高超声速飞行器姿态动力学模型的不确定分配矩阵,/>
Figure SMS_325
为与高超声速飞行器期望姿态相关的时变函数,/>
Figure SMS_326
,/>
Figure SMS_318
为与高超声速飞行器姿态状态约束函数相关的时变函数,/>
Figure SMS_321
;/>
步骤33:为解决Backstepping方法中的导数灾难问题,引入一阶滤波器
Figure SMS_327
,将姿态角速率/>
Figure SMS_328
转换成:/>
Figure SMS_329
其中,
Figure SMS_334
为一阶滤波器的输出,/>
Figure SMS_331
为待设计的虚拟控制量,/>
Figure SMS_340
,/>
Figure SMS_336
为设计的状态反馈控制量,/>
Figure SMS_346
为基于零和博弈设计的优化辅助控制量,/>
Figure SMS_335
为关于/>
Figure SMS_343
、/>
Figure SMS_338
Figure SMS_344
以及一阶滤波器输出/>
Figure SMS_330
与虚待设计的虚拟控制量/>
Figure SMS_339
之间的误差/>
Figure SMS_332
的动态函数,
Figure SMS_342
,/>
Figure SMS_337
为与高超声速飞行器姿态动力学模型状态无关的时变动态函数,/>
Figure SMS_345
,基于杨氏不等式,将/>
Figure SMS_333
简化:
Figure SMS_341
其中,
Figure SMS_348
,/>
Figure SMS_351
为姿态旋转矩阵/>
Figure SMS_353
的下范数界,/>
Figure SMS_349
为姿态旋转矩阵/>
Figure SMS_352
的上范数界,/>
Figure SMS_354
为第一未知的自适应参量,通过/>
Figure SMS_355
克服杨氏不等式放缩带来的控制量不连续问题,提高***控制量的平滑性,/>
Figure SMS_347
,/>
Figure SMS_350
为已知的动态函数;
步骤34:结合第一Lyapunov函数
Figure SMS_356
和Backatepping法,进行带有状态约束的高超声速飞行器姿态角控制策略设计:
Figure SMS_357
其中,
Figure SMS_359
为设计的虚拟控制器增益,/>
Figure SMS_362
为第一正数控制参数,/>
Figure SMS_365
为第二正数控制参数,/>
Figure SMS_360
为对/>
Figure SMS_363
的估计误差,/>
Figure SMS_366
为/>
Figure SMS_367
的估计值,对/>
Figure SMS_358
求导并结合步骤33中关于/>
Figure SMS_361
简化的不等式,对第一Lyapunov函数/>
Figure SMS_364
求导,实现高超声速飞行器在故障下的有界稳定:
Figure SMS_368
其中,
Figure SMS_369
为正定的参数;
步骤35:根据步骤31的高超声速飞行器的姿态跟踪误差,得出姿态角速率的跟踪误差的动态方程:
Figure SMS_370
,其中,/>
Figure SMS_371
为3×3的转动惯量矩阵,/>
Figure SMS_372
,/>
Figure SMS_373
为高超声速飞行器受到的偏心力矩部分失效故障,/>
Figure SMS_374
为执行器的卡死故障;为了采用反步法实现对姿态角速率的容错安全控制设计,引入变换/>
Figure SMS_375
,由于异常质心变动造成的***转动惯量矩阵存在不确定性,结合自适应控制方法对动态方程中的不确定性进行参数化:/>
Figure SMS_376
其中,
Figure SMS_378
为三维列向量,/>
Figure SMS_381
为3行6列的矩阵,/>
Figure SMS_384
,对于任意给定的三维列向量/>
Figure SMS_379
,变换/>
Figure SMS_382
表示为:/>
Figure SMS_385
,得出:/>
Figure SMS_386
和/>
Figure SMS_377
,将/>
Figure SMS_380
结合自适应算法的少参数化方法,则映射/>
Figure SMS_383
为:
Figure SMS_387
其中,
Figure SMS_388
为第二未知的自适应参量,/>
Figure SMS_389
,/>
Figure SMS_390
为未知常数,
Figure SMS_391
为已知的基函数,/>
Figure SMS_392
步骤36:根据带有状态约束的高超声速飞行器姿态角控制策略和姿态角速率控制策略,结合Lyaounov稳定性理论,建立第二Lyapunov函数
Figure SMS_393
,针对动态方程/>
Figure SMS_394
设计如下容错安全控制器/>
Figure SMS_395
Figure SMS_396
其中,
Figure SMS_398
为复合干扰量,由未知质心偏移量、执行器部分失效故障以及***输入饱和约束构成,/>
Figure SMS_401
,/>
Figure SMS_404
为容错安全控制器的增益,
Figure SMS_399
均为正定控制参量,控制量为/>
Figure SMS_402
,/>
Figure SMS_405
为设计的基于Backstepping 的状态反馈控制量,/>
Figure SMS_407
为下一步设计的基于零和博弈的优化辅助补偿量,/>
Figure SMS_397
为自适应量/>
Figure SMS_400
的估计误差,/>
Figure SMS_403
为自适应量/>
Figure SMS_406
的估计值;
步骤37:结合设计的容错安全控制器
Figure SMS_408
与第二Lyapunov函数,对/>
Figure SMS_409
进行求导,实现高超声速飞行器在故障下的有界稳定:
Figure SMS_410
其中,
Figure SMS_411
为第一待定正常数,/>
Figure SMS_412
,/>
Figure SMS_413
为第二待定正常数,/>
Figure SMS_414
,/>
Figure SMS_415
为已知且有界的正函数,
Figure SMS_416
,/>
Figure SMS_417
为第三待定正常数。
步骤4:引入零和博弈性能指标,将高超声速飞行器在状态安全约束下的性能与高超声速飞行器姿态动力学模型对不确定性的补偿能力形成零和博弈,通过自适应动态规划优化补偿容错安全控制器,优化容错安全控制框架,实现飞行器在面对未知质心偏移量及执行器部分失效故障下的优化状态约束容错安全控制,保障飞行器的安全;具体包括如下子步骤:
步骤41:为了采用零和博弈理论使高超声速飞行器具有最优的控制性能,将飞行姿态角
Figure SMS_418
的跟踪误差/>
Figure SMS_419
和姿态角速率/>
Figure SMS_420
的跟踪误差/>
Figure SMS_421
整合为优化仿射非线性形式,形成控制变量与***扰动量的零和博弈;所述优化仿射非线性形式为:
Figure SMS_422
其中,
Figure SMS_425
为高超声速飞行器的飞行姿态的跟踪误差,/>
Figure SMS_428
,/>
Figure SMS_431
为高超声速飞行器姿态动力学模型矩阵,/>
Figure SMS_424
, />
Figure SMS_430
为常系数矩阵,/>
Figure SMS_434
,/>
Figure SMS_437
为基于零和博弈的优化控制补偿器,/>
Figure SMS_423
,/>
Figure SMS_427
为控制变量,/>
Figure SMS_432
为容错安全控制器,/>
Figure SMS_435
为高超声速飞行器姿态动力学模型的扰动量,
Figure SMS_426
,/>
Figure SMS_429
为待定的正常数,/>
Figure SMS_433
为近似函数,为了反应高超声速飞行器姿态动力学模型在满足状态约束中的优化控制目的,将高超声速飞行器的状态与约束边界的距离作为优化量,使其越大越好,即高超声速飞行器姿态动力学模型状态能够聚拢到约束域的中心区域,提高质心变动情况下的飞行器容错控制性能,故将该功能以零和博弈的方式展现出来,/>
Figure SMS_436
具体为:/>
Figure SMS_438
其中,当高超声速飞行器的姿态角距离安全边界满足阈值约束
Figure SMS_439
时,
Figure SMS_440
,表明此时的控制效果较好,无需进行优化补偿控制;当/>
Figure SMS_441
时,表明高超声速飞行器的状态位于约束的安全区域内,但***状态距离边界的距离太近了,需要进行优化补偿控制;当/>
Figure SMS_442
时,表明此时高超声速飞行器的状态越过了约束边界,需要给予控制压制,使其重新返回到约束域中。
步骤42:设计零和博弈目标函数,并通过哈密顿函数优化零和博弈目标函数,并基于达到纳什均衡时的最优容许控制得到最优控制对
Figure SMS_443
本发明中零和博弈目标函数
Figure SMS_444
为:
Figure SMS_445
其中,
Figure SMS_446
为正定惩罚项,优化控制效果,/>
Figure SMS_447
为第一正定矩阵,/>
Figure SMS_448
为第二正定矩阵,调节/>
Figure SMS_449
与/>
Figure SMS_450
形成零和博弈权重,达到更好的控制效果;
所述哈密顿函数
Figure SMS_451
,且哈密顿函数满足:/>
Figure SMS_452
,其中,/>
Figure SMS_453
为零和博弈目标函数/>
Figure SMS_454
关于/>
Figure SMS_455
的梯度;基于达到纳什均衡时的最优容许控制对/>
Figure SMS_456
存在且唯一的假设,得:
Figure SMS_457
,/>
Figure SMS_458
具体地,最优控制对
Figure SMS_459
的求取过程为:
步骤421:由于最优的控制对
Figure SMS_460
无法直接获取,通过基于自适应动态规划的零和博弈值迭代求解方法,设计基于神经网络的估计器:
Figure SMS_461
其中,
Figure SMS_462
为理想的神经网络权重,/>
Figure SMS_463
,/>
Figure SMS_464
为/>
Figure SMS_465
的范数边界,/>
Figure SMS_466
为神经网络的激活函数,/>
Figure SMS_467
为神经网络的估计误差;
步骤422:将神经网络的估计器进行梯度信息化:
Figure SMS_468
,并将最优控制对/>
Figure SMS_469
转化为:/>
Figure SMS_470
首先,
Figure SMS_471
、/>
Figure SMS_472
通过与梯度信息有关的HJB方程求得:
Figure SMS_473
其中,
Figure SMS_475
为神经网络激活函数的梯度,/>
Figure SMS_478
为神经网络估计误差的梯度,/>
Figure SMS_481
为正定矩阵,/>
Figure SMS_476
,/>
Figure SMS_479
为已知的正定矩阵,/>
Figure SMS_482
,/>
Figure SMS_484
Figure SMS_474
为未知且待定的负定矩阵,/>
Figure SMS_477
,/>
Figure SMS_480
Figure SMS_483
均为有界的正常数。
其次,
Figure SMS_485
求取过程为:定义/>
Figure SMS_486
为/>
Figure SMS_487
的估计量,得/>
Figure SMS_488
,其中,/>
Figure SMS_489
为/>
Figure SMS_490
的估计,得最优控制对/>
Figure SMS_491
的估计:
Figure SMS_492
结合最优控制对
Figure SMS_493
的估计,构成如下的哈密顿函数误差:
Figure SMS_494
并将哈密顿函数误差最小化:
Figure SMS_495
得到
Figure SMS_496
的更新率为:
Figure SMS_497
其中,
Figure SMS_499
为神经网络权重的学习率,/>
Figure SMS_503
为第一待定且时变的增益,
Figure SMS_507
,/>
Figure SMS_500
为第三待定且时变的增益,/>
Figure SMS_504
,/>
Figure SMS_508
为第二待定且时变的增益,/>
Figure SMS_512
,/>
Figure SMS_498
和/>
Figure SMS_502
分别为权重调节矩阵,/>
Figure SMS_506
为设计的二次型矩阵,/>
Figure SMS_510
为已知的分段函数,/>
Figure SMS_501
Figure SMS_505
。在/>
Figure SMS_509
的更新律中,第一项起到梯度下降的作用,减小哈密顿误差/>
Figure SMS_511
;第二项为在学习过程中保证***状态有界的附加项;第三项的设计用于整个***的稳定性分析;此外,基于Lyapunov稳定性定理的设计过程保障了整个***的稳定性。
本发明基于零和博弈的高超声速飞行器状态约束容错控制方法既能保证闭环***中所有信号都有界,又能保证***输出
Figure SMS_513
以最优的方式跟踪参考信号/>
Figure SMS_514
而不发生越界行为,及时出现了未知的质心偏移量,保障飞行器的安全。
实施例
本实施例将本发明基于零和博弈的高超声速飞行器状态约束容错控制方法进行仿真实验:
考虑带有质心偏移的高超声速飞行器姿态刚体模型为:
Figure SMS_515
其中,
Figure SMS_517
,高超声速飞行器姿态动力学模型受到外部干扰为/>
Figure SMS_520
,高超声速飞行器的初始姿态角与姿态角速率为/>
Figure SMS_523
,控制的参考指令为:当/>
Figure SMS_518
Figure SMS_521
;当/>
Figure SMS_524
,/>
Figure SMS_526
,/>
Figure SMS_516
,/>
Figure SMS_519
。当/>
Figure SMS_522
时,高超声速飞行器的质心偏移量为/>
Figure SMS_525
采用Matlab/Simulink仿真,在Matlab/Simulink中搭建飞行器***模型及相应的质心变动模型,基于此,设计相应的自适应容错安全控制器,进而进行仿真验证。
按照上述设计的仿真条件对本发明基于零和博弈的高超声速飞行器状态约束容错控制方法进行仿真,可得受到质心未知量影响与安全状态约束的高超声速飞行器刚体姿态跟踪控制效果如图2所示,其中,图2中的(a)为高超声速飞行器随时间变化的攻角跟踪曲线,
Figure SMS_529
表示攻角指令,/>
Figure SMS_532
表示本发明状态约束容错控制的攻角跟踪曲线,/>
Figure SMS_536
表示对照组攻角跟踪曲线;图2中的(b)为高超声速飞行器随时间变化的俯仰角跟踪曲线,/>
Figure SMS_530
表示俯仰角指令,/>
Figure SMS_534
表示本发明状态约束容错控制的俯仰角跟踪曲线,/>
Figure SMS_538
表示对照组俯仰角跟踪曲线;图2中的(c)为高超声速飞行器随时间变化的滚转角跟踪曲线,/>
Figure SMS_541
表示滚转角,/>
Figure SMS_527
表示本发明状态约束容错控制的滚转角跟踪曲线,/>
Figure SMS_531
表示对照组滚转角跟踪曲线。由相应的参考姿态指令/>
Figure SMS_535
与实际的/>
Figure SMS_539
跟踪效果可知,/>
Figure SMS_528
分别与对应的/>
Figure SMS_533
重合,即使在时间/>
Figure SMS_537
时,出现了未知的质心偏移量,本发明所设计的约束容错控制方法仍然可以保持较好的姿态跟踪与保持效果;但从对照组/>
Figure SMS_540
来看,当发生未知质心偏移后,产生了异常的偏心力矩,当***状态不受约束时,使得偏心力矩的影响呈叠加态势,直至在22s时,对照组中容错控制失效。综上,在本发明基于零和博弈的高超声速飞行器状态约束容错控制方法下,飞行器实现了面对未知质心偏移量时,***的容错安全优化控制。
以上仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,应视为本发明的保护范围。

Claims (9)

1.一种基于零和博弈的高超声速飞行器状态约束容错控制方法,其特征在于,具体包括如下步骤:
步骤1:根据高超声速飞行器的未知质心偏移量及飞行环境,建立含有质心偏移量的高超声速飞行器姿态动力学模型;
步骤2:根据步骤1建立的高超声速飞行器姿态动力学模型,引入时变高超声速飞行器状态安全约束函数;
步骤3:基于步骤2建立的时变高超声速飞行器状态安全约束函数,采用范数界的方法,将高超声速飞行器受到的偏心力矩与执行器部分失效故障通过自适应控制的方法输入到容错控制框架中,建立基于反步法的容错安全控制框架,设计带有状态约束的高超声速飞行器姿态角控制策略和姿态角速率控制策略,得到容错安全控制器,实现高超声速飞行器在故障下的有界稳定;
步骤4:引入零和博弈性能指标,将高超声速飞行器在状态安全约束下的性能与高超声速飞行器姿态动力学模型对不确定性的补偿能力形成零和博弈,通过自适应动态规划优化补偿容错安全控制器,优化容错安全控制框架,保障高超声速飞行器的安全。
2.根据权利要求1所述的一种基于零和博弈的高超声速飞行器状态约束容错控制方法,其特征在于,所述含有质心偏移量的高超声速飞行器姿态动力学模型的建立过程为:
Figure QLYQS_1
其中,
Figure QLYQS_6
为高超声速飞行器的飞行姿态角,/>
Figure QLYQS_13
,/>
Figure QLYQS_19
为高超声速飞行器飞行姿态角中的滚转角,/>
Figure QLYQS_4
为高超声速飞行器飞行姿态角中的攻角,/>
Figure QLYQS_11
为高超声速飞行器飞行姿态角中的侧滑角,/>
Figure QLYQS_17
为姿态角速率,/>
Figure QLYQS_23
,/>
Figure QLYQS_7
为高超声速飞行器的滚转角速度,/>
Figure QLYQS_12
为高超声速飞行器的俯仰角速度,/>
Figure QLYQS_18
为高超声速飞行器的偏航角速度,
Figure QLYQS_24
为姿态旋转矩阵,/>
Figure QLYQS_8
,/>
Figure QLYQS_14
为角速度旋转矩阵,
Figure QLYQS_20
,/>
Figure QLYQS_25
为未发生质心偏移时的高超声速飞行器姿态动力学模型的转动惯量,/>
Figure QLYQS_5
为高超声速飞行器姿态动力学模型发生质心偏移引起的转动惯量的变化量,
Figure QLYQS_15
为未知的质心偏移量,/>
Figure QLYQS_21
为高超声速飞行器质心的在机体坐标系上未知偏离量的三个分量,/>
Figure QLYQS_26
为高超声速飞行器***控制输入量,/>
Figure QLYQS_2
为质心偏移对高超声速飞行器带来的偏心力矩,/>
Figure QLYQS_9
为控制输入旋转矩阵,/>
Figure QLYQS_16
,/>
Figure QLYQS_22
分别为高超声速飞行器***控制输入量/>
Figure QLYQS_3
在机体坐标系上的三个分量,/>
Figure QLYQS_10
为高超声速飞行器姿态动力学模型受到的外部有界干扰。
3.根据权利要求2所述的一种基于零和博弈的高超声速飞行器状态约束容错控制方法,其特征在于,所述高超声速飞行器姿态动力学模型发生质心偏移引起的转动惯量的变化量
Figure QLYQS_27
表示为:
Figure QLYQS_28
其中,
Figure QLYQS_38
为高超声速飞行器姿态动力学模型发生质心偏移引起的转动惯量在高超声速飞行器对称平面内并平行与高超声速飞行器的设计轴线方向偏移量,
Figure QLYQS_30
,/>
Figure QLYQS_40
为高超声速飞行器的质量;/>
Figure QLYQS_33
为高超声速飞行器姿态动力学模型发生质心偏移引起的转动惯量在垂直于高超声速飞行器对称平面指向高超声速飞行器右方的偏移量,/>
Figure QLYQS_46
;/>
Figure QLYQS_34
为高超声速飞行器姿态动力学模型发生质心偏移引起的转动惯量在高超声速飞行器对称平面内与/>
Figure QLYQS_43
轴垂直并指向高超声速飞行器下方的偏移量,/>
Figure QLYQS_35
;/>
Figure QLYQS_45
为高超声速飞行器姿态动力学模型发生质心偏移引起的在/>
Figure QLYQS_29
轴与/>
Figure QLYQS_41
轴耦合的惯量积,/>
Figure QLYQS_32
;/>
Figure QLYQS_42
为高超声速飞行器姿态动力学模型发生质心偏移引起的在/>
Figure QLYQS_36
轴与/>
Figure QLYQS_44
轴耦合的惯量积,/>
Figure QLYQS_37
;/>
Figure QLYQS_47
为高超声速飞行器姿态动力学模型发生质心偏移引起的在/>
Figure QLYQS_39
轴与/>
Figure QLYQS_48
轴耦合的惯量积,/>
Figure QLYQS_31
4.根据权利要求2所述的一种基于零和博弈的高超声速飞行器状态约束容错控制方法,其特征在于,所述时变高超声速飞行器状态安全约束函数
Figure QLYQS_49
的建立过程为:
Figure QLYQS_50
其中,
Figure QLYQS_51
为时变高超声速飞行器的姿态状态约束边界。
5.根据权利要求4所述的一种基于零和博弈的高超声速飞行器状态约束容错控制方法,其特征在于,根据时变高超声速飞行器状态安全约束函数形成的高超声速飞行器的飞行姿态角的安全约束区域
Figure QLYQS_52
为/>
Figure QLYQS_53
,当高超声速飞行器未发生质心偏移时,扩大所述高超声速飞行器的飞行姿态角的安全约束区域至所述高超声速飞行器的整个飞行包线;当高超声速飞行器发生未知质心变动时,缩小所述高超声速飞行器的姿态状态约束边界,将所述高超声速飞行器的飞行姿态角约束在安全约束区域/>
Figure QLYQS_54
内。
6.根据权利要求4所述的一种基于零和博弈的高超声速飞行器状态约束容错控制方法,其特征在于,步骤3包括如下子步骤:
步骤31:根据步骤2建立的时变高超声速飞行器状态安全约束函数,引入高超声速飞行器的姿态跟踪误差,包括:飞行姿态角
Figure QLYQS_55
的跟踪误差/>
Figure QLYQS_56
和姿态角速率/>
Figure QLYQS_57
的跟踪误差/>
Figure QLYQS_58
Figure QLYQS_59
其中,
Figure QLYQS_60
为引入时变高超声速飞行器状态安全约束函数,/>
Figure QLYQS_61
为满足状态安全约束函数的期望姿态角指令,/>
Figure QLYQS_62
,/>
Figure QLYQS_63
为由飞行任务目标制定的期望姿态角度,/>
Figure QLYQS_64
为由飞行任务目标制定的期望姿态角速率;
步骤32:将步骤31中的飞行姿态角跟踪误差
Figure QLYQS_65
关于时间/>
Figure QLYQS_66
求导,得:
Figure QLYQS_67
其中,
Figure QLYQS_70
为与高速飞行器姿态相关的时变参数,/>
Figure QLYQS_72
,/>
Figure QLYQS_74
为与高超声速飞行器姿态状态约束函数相关的时变参数,
Figure QLYQS_69
,/>
Figure QLYQS_73
为含有质心偏移量的高超声速飞行器姿态动力学模型的不确定分配矩阵,/>
Figure QLYQS_75
为与高超声速飞行器期望姿态相关的时变函数,
Figure QLYQS_76
,/>
Figure QLYQS_68
为与高超声速飞行器姿态状态约束函数相关的时变函数,/>
Figure QLYQS_71
步骤33:引入一阶滤波器
Figure QLYQS_77
,将姿态角速率/>
Figure QLYQS_78
转换成:
Figure QLYQS_79
其中,
Figure QLYQS_88
为一阶滤波器的输出,/>
Figure QLYQS_87
为待设计的虚拟控制量,/>
Figure QLYQS_92
,/>
Figure QLYQS_82
为设计的状态反馈控制量,/>
Figure QLYQS_96
为基于零和博弈设计的优化辅助控制量,/>
Figure QLYQS_83
为关于/>
Figure QLYQS_94
、/>
Figure QLYQS_85
、/>
Figure QLYQS_93
以及一阶滤波器输出/>
Figure QLYQS_80
与虚待设计的虚拟控制量/>
Figure QLYQS_89
之间的误差/>
Figure QLYQS_84
的动态函数,
Figure QLYQS_91
,/>
Figure QLYQS_86
为与高超声速飞行器姿态动力学模型状态无关的时变动态函数,/>
Figure QLYQS_95
,基于杨氏不等式,将/>
Figure QLYQS_81
简化:
Figure QLYQS_90
,/>
其中,
Figure QLYQS_98
,/>
Figure QLYQS_101
为姿态旋转矩阵/>
Figure QLYQS_102
的下范数界,/>
Figure QLYQS_99
为姿态旋转矩阵/>
Figure QLYQS_100
的上范数界,/>
Figure QLYQS_103
为第一未知的自适应参量,/>
Figure QLYQS_104
Figure QLYQS_97
为已知的动态函数;
步骤34:结合第一Lyapunov函数
Figure QLYQS_105
和Backatepping法,进行带有状态约束的高超声速飞行器姿态角控制策略设计:
Figure QLYQS_106
其中,
Figure QLYQS_108
为设计的虚拟控制器增益,/>
Figure QLYQS_110
为第一正数控制参数,
Figure QLYQS_113
为第二正数控制参数,/>
Figure QLYQS_109
为对/>
Figure QLYQS_112
的估计误差,/>
Figure QLYQS_115
为/>
Figure QLYQS_116
的估计值,对/>
Figure QLYQS_107
求导并结合步骤33中关于/>
Figure QLYQS_111
简化的不等式,对第一Lyapunov函数/>
Figure QLYQS_114
求导,实现高超声速飞行器在故障下的有界稳定:
Figure QLYQS_117
其中,
Figure QLYQS_118
为正定的参数;
步骤35:根据步骤31的高超声速飞行器的姿态跟踪误差,得出姿态角速率的跟踪误差的动态方程:
Figure QLYQS_119
,其中,/>
Figure QLYQS_120
为3×3的转动惯量矩阵,/>
Figure QLYQS_121
,/>
Figure QLYQS_122
为高超声速飞行器受到的偏心力矩部分失效故障,/>
Figure QLYQS_123
为执行器的卡死故障;引入变换/>
Figure QLYQS_124
,并结合自适应控制方法对动态方程中的不确定性进行参数化:/>
Figure QLYQS_125
其中,
Figure QLYQS_128
为三维列向量,/>
Figure QLYQS_131
为3行6列的矩阵,/>
Figure QLYQS_134
,对于任意给定的三维列向量/>
Figure QLYQS_127
,变换/>
Figure QLYQS_130
表示为:/>
Figure QLYQS_133
,得出:/>
Figure QLYQS_135
和/>
Figure QLYQS_126
,将
Figure QLYQS_129
结合自适应算法的少参数化方法,则映射/>
Figure QLYQS_132
为:
Figure QLYQS_136
其中,
Figure QLYQS_137
为第二未知的自适应参量,/>
Figure QLYQS_138
,/>
Figure QLYQS_139
为未知常数,/>
Figure QLYQS_140
为已知的基函数,/>
Figure QLYQS_141
步骤36:根据带有状态约束的高超声速飞行器姿态角控制策略和姿态角速率控制策略,结合Lyaounov稳定性理论,建立第二Lyapunov函数
Figure QLYQS_142
,针对动态方程/>
Figure QLYQS_143
设计如下容错安全控制器/>
Figure QLYQS_144
Figure QLYQS_145
其中,
Figure QLYQS_148
为复合干扰量,/>
Figure QLYQS_150
,/>
Figure QLYQS_152
为容错安全控制器的增益,/>
Figure QLYQS_147
均为正定控制参量,/>
Figure QLYQS_149
为自适应量/>
Figure QLYQS_151
的估计误差,
Figure QLYQS_153
为自适应量/>
Figure QLYQS_146
的估计值;
步骤37:结合设计的容错安全控制器
Figure QLYQS_154
与第二Lyapunov函数,对/>
Figure QLYQS_155
进行求导,实现高超声速飞行器在故障下的有界稳定:
Figure QLYQS_156
其中,
Figure QLYQS_157
为第一待定正常数,/>
Figure QLYQS_158
,/>
Figure QLYQS_159
为第二待定正常数,
Figure QLYQS_160
,/>
Figure QLYQS_161
为已知且有界的正函数,
Figure QLYQS_162
,/>
Figure QLYQS_163
为第三待定正常数。
7.根据权利要求6所述的一种基于零和博弈的高超声速飞行器状态约束容错控制方法,其特征在于,步骤4包括如下子步骤:
步骤41:将飞行姿态角
Figure QLYQS_164
的跟踪误差/>
Figure QLYQS_165
和姿态角速率/>
Figure QLYQS_166
的跟踪误差/>
Figure QLYQS_167
整合为优化仿射非线性形式,形成控制变量与***扰动量的零和博弈;所述优化仿射非线性形式为:
Figure QLYQS_168
其中,
Figure QLYQS_171
为高超声速飞行器的飞行姿态的跟踪误差,/>
Figure QLYQS_175
,/>
Figure QLYQS_179
为高超声速飞行器姿态动力学模型矩阵,/>
Figure QLYQS_172
, />
Figure QLYQS_176
为常系数矩阵,/>
Figure QLYQS_180
,/>
Figure QLYQS_182
为基于零和博弈的优化控制补偿器,/>
Figure QLYQS_169
,/>
Figure QLYQS_173
为控制变量,/>
Figure QLYQS_178
为容错安全控制器,/>
Figure QLYQS_181
为高超声速飞行器姿态动力学模型的扰动量,
Figure QLYQS_170
,/>
Figure QLYQS_174
为待定的正常数,/>
Figure QLYQS_177
为近似函数;
步骤42:设计零和博弈目标函数,并通过哈密顿函数优化零和博弈目标函数,并基于达到纳什均衡时的最优容许控制得到最优控制对
Figure QLYQS_183
所述零和博弈目标函数
Figure QLYQS_184
为:
Figure QLYQS_185
其中,
Figure QLYQS_186
为正定惩罚项,/>
Figure QLYQS_187
为第一正定矩阵,/>
Figure QLYQS_188
为第二正定矩阵,调节
Figure QLYQS_189
与/>
Figure QLYQS_190
形成零和博弈权重;
所述哈密顿函数
Figure QLYQS_191
,且哈密顿函数满足:/>
Figure QLYQS_192
,其中,/>
Figure QLYQS_193
为零和博弈目标函数/>
Figure QLYQS_194
关于/>
Figure QLYQS_195
的梯度;
所述
Figure QLYQS_196
,/>
Figure QLYQS_197
8.根据权利要求7所述的一种基于零和博弈的高超声速飞行器状态约束容错控制方法,其特征在于,步骤42中所述最优控制对
Figure QLYQS_198
的求取过程为:
步骤421:通过基于自适应动态规划的零和博弈值迭代求解方法,设计基于神经网络的估计器:
Figure QLYQS_199
其中,
Figure QLYQS_200
为理想的神经网络权重,/>
Figure QLYQS_201
,/>
Figure QLYQS_202
为/>
Figure QLYQS_203
的范数边界,/>
Figure QLYQS_204
为神经网络的激活函数,/>
Figure QLYQS_205
为神经网络的估计误差;
步骤422:将神经网络的估计器进行梯度信息化:
Figure QLYQS_206
,并将最优控制对/>
Figure QLYQS_207
转化为:
Figure QLYQS_208
其中,
Figure QLYQS_209
、/>
Figure QLYQS_210
通过与梯度信息有关的HJB方程求得:
Figure QLYQS_211
其中,
Figure QLYQS_213
为神经网络激活函数的梯度,/>
Figure QLYQS_216
为神经网络估计误差的梯度,/>
Figure QLYQS_220
为正定矩阵,/>
Figure QLYQS_214
,/>
Figure QLYQS_217
为已知的正定矩阵,/>
Figure QLYQS_219
,/>
Figure QLYQS_222
,/>
Figure QLYQS_212
为未知且待定的负定矩阵,/>
Figure QLYQS_215
,/>
Figure QLYQS_218
Figure QLYQS_221
均为有界的正常数。
9.根据权利要求8所述的一种基于零和博弈的高超声速飞行器状态约束容错控制方法,其特征在于,步骤422中的
Figure QLYQS_223
求取过程为:定义/>
Figure QLYQS_224
为/>
Figure QLYQS_225
的估计量,得/>
Figure QLYQS_226
,其中,/>
Figure QLYQS_227
为/>
Figure QLYQS_228
的估计,得最优控制对/>
Figure QLYQS_229
的估计:
Figure QLYQS_230
结合最优控制对
Figure QLYQS_231
的估计,构成如下的哈密顿函数误差:
Figure QLYQS_232
并将哈密顿函数误差最小化:
Figure QLYQS_233
得到
Figure QLYQS_234
的更新率为:
Figure QLYQS_235
其中,
Figure QLYQS_237
为神经网络权重的学习率,/>
Figure QLYQS_241
为第一待定且时变的增益,/>
Figure QLYQS_245
,/>
Figure QLYQS_239
为第三待定且时变的增益,/>
Figure QLYQS_242
,/>
Figure QLYQS_246
为第二待定且时变的增益,/>
Figure QLYQS_248
,/>
Figure QLYQS_236
和/>
Figure QLYQS_240
分别为权重调节矩阵,/>
Figure QLYQS_244
为设计的二次型矩阵,
Figure QLYQS_247
为已知的分段函数,/>
Figure QLYQS_238
Figure QLYQS_243
。/>
CN202310302104.7A 2023-03-27 2023-03-27 一种基于零和博弈的高超声速飞行器状态约束容错控制方法 Active CN116009594B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310302104.7A CN116009594B (zh) 2023-03-27 2023-03-27 一种基于零和博弈的高超声速飞行器状态约束容错控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310302104.7A CN116009594B (zh) 2023-03-27 2023-03-27 一种基于零和博弈的高超声速飞行器状态约束容错控制方法

Publications (2)

Publication Number Publication Date
CN116009594A CN116009594A (zh) 2023-04-25
CN116009594B true CN116009594B (zh) 2023-06-02

Family

ID=86027077

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310302104.7A Active CN116009594B (zh) 2023-03-27 2023-03-27 一种基于零和博弈的高超声速飞行器状态约束容错控制方法

Country Status (1)

Country Link
CN (1) CN116009594B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117130277B (zh) * 2023-09-13 2024-05-10 中国矿业大学 基于安全强化学习的高超声速飞行器零和博弈方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107450324A (zh) * 2017-09-05 2017-12-08 西北工业大学 考虑攻角约束的高超声速飞行器自适应容错控制方法
CN110376902A (zh) * 2019-08-19 2019-10-25 合肥工业大学 一种欠驱动机械***伺服约束跟踪控制器的设计方法
CN113341727A (zh) * 2021-06-22 2021-09-03 北京理工大学 一种事件触发分布式自学习协同博弈拦截制导方法
CN113885548A (zh) * 2021-10-28 2022-01-04 南京邮电大学 一种多四旋翼无人机输出约束状态一致博弈控制器
CN114608583A (zh) * 2022-03-18 2022-06-10 北京航空航天大学 一种高超声速飞行器动态杆臂效应智能补偿方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8606375B2 (en) * 2010-06-04 2013-12-10 The Mathworks, Inc. Interactive control of multiple input multiple output control structures
AT519165A3 (de) * 2016-08-16 2018-10-15 Fts Computertechnik Gmbh Fehlertolerantes Verfahren und Vorrichtung zur Steuerung einer autonomen technischen Anlage mittels diversitärer Trajektorenplanung
US11635734B2 (en) * 2019-01-10 2023-04-25 Dalian University Of Technology Interval error observer-based aircraft engine active fault tolerant control method

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107450324A (zh) * 2017-09-05 2017-12-08 西北工业大学 考虑攻角约束的高超声速飞行器自适应容错控制方法
CN110376902A (zh) * 2019-08-19 2019-10-25 合肥工业大学 一种欠驱动机械***伺服约束跟踪控制器的设计方法
CN113341727A (zh) * 2021-06-22 2021-09-03 北京理工大学 一种事件触发分布式自学习协同博弈拦截制导方法
CN113885548A (zh) * 2021-10-28 2022-01-04 南京邮电大学 一种多四旋翼无人机输出约束状态一致博弈控制器
CN114608583A (zh) * 2022-03-18 2022-06-10 北京航空航天大学 一种高超声速飞行器动态杆臂效应智能补偿方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
Adaptive fault-tolerant attitude tracking control of hypersonic vehicle subject to unexpected centroid-shift and state constraints;YizhenMeng等;《AerospaceScienceandTechnology》;第1-13页 *
Fault-tolerant Control of Linear Singularly Perturbed Systems with Applications to Hypersonic Vehicles;Wenjing Ren等;《International Federation of Automatic Control》;第268-273页 *
无虚拟控制律的高超声速飞行器新型模糊控制;李广剑;何广军;吴亚晖;李兴格;;航天控制(第04期);第41-49页 *
盲目反卷积算法在高超流场星图复原中的应用;杨博等;;红外与激光工程(第08期);第2231-2237页 *
考虑作动器故障分级的汽车SASS与LKAS集成容错控制策略;高振刚;陈无畏;任春;曹宇;;机械设计(第04期);第116-124页 *

Also Published As

Publication number Publication date
CN116009594A (zh) 2023-04-25

Similar Documents

Publication Publication Date Title
CN110347170B (zh) 可重复使用运载器再入段鲁棒容错制导控制***及工作方法
Tang et al. An integral TSMC-based adaptive fault-tolerant control for quadrotor with external disturbances and parametric uncertainties
CN109062042B (zh) 一种旋翼飞行器的有限时间航迹跟踪控制方法
Lai et al. Adaptive position/attitude tracking control of aerial robot with unknown inertial matrix based on a new robust neural identifier
CN116009594B (zh) 一种基于零和博弈的高超声速飞行器状态约束容错控制方法
CN109507890A (zh) 一种基于eso的无人机动态逆广义预测控制器
Abdelmaksoud et al. Robust intelligent self-tuning active force control of a quadrotor with improved body jerk performance
CN109164819B (zh) 刚体航天器的反步自适应滑模大角度姿态机动控制方法
Lee et al. Improved nonlinear trajectory tracking using RBFNN for a robotic helicopter
CN113128035A (zh) 民用飞机飞控传感器信号重构容错控制方法
Nair et al. Longitudinal dynamics control of UAV
CN103455035B (zh) 基于反步设计和非线性反馈的pd+姿态控制律设计方法
CN117250867B (zh) 一种多模式垂直起降飞行器自愈控制方法
Chen et al. Decentralized h PID team formation tracking control of large-scale quadrotor UAVs under external disturbance and vortex coupling
CN112130584B (zh) 基于命令滤波的四旋翼飞行器有限时间自适应控制方法
CN113777932A (zh) 一种基于Delta算子的四旋翼自适应滑模容错控制方法
CN104460678B (zh) 一种基于Sigmoid型非线性滑模函数的航天器姿态控制方法
CN116382332B (zh) 一种基于ude的战斗机大机动鲁棒飞行控制方法
CN116795126A (zh) 一种输入饱和与输出受限的变形飞行器控制方法
CN112305917A (zh) 充液航天器的固定时间终端滑模鲁棒容错控制方法及装置
Ma et al. Finite-time trajectory tracking control of quadrotor UAV via adaptive RBF neural network with lumped uncertainties
Kumar et al. Exponential reaching law based robust trajectory tracking for unmanned aerial vehicles
Gili et al. Adaptive neurocontroller for a nonlinear combat aircraft model
Dong et al. Dynamic Sliding Mode Attitude Tracking Control for Flexible Spacecraft
CN117891281B (zh) 一种基于嵌套双模态的二阶非奇异终端滑模飞行控制方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant