CN116360497A - 一种基于强化学***流层飞艇轨迹跟踪方法 - Google Patents

一种基于强化学***流层飞艇轨迹跟踪方法 Download PDF

Info

Publication number
CN116360497A
CN116360497A CN202310411334.7A CN202310411334A CN116360497A CN 116360497 A CN116360497 A CN 116360497A CN 202310411334 A CN202310411334 A CN 202310411334A CN 116360497 A CN116360497 A CN 116360497A
Authority
CN
China
Prior art keywords
airship
optimal control
stratospheric
model
error
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310411334.7A
Other languages
English (en)
Other versions
CN116360497B (zh
Inventor
黄琰婷
张雅滨
韩红桂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN202310411334.7A priority Critical patent/CN116360497B/zh
Publication of CN116360497A publication Critical patent/CN116360497A/zh
Application granted granted Critical
Publication of CN116360497B publication Critical patent/CN116360497B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/10Simultaneous control of position or course in three dimensions
    • G05D1/101Simultaneous control of position or course in three dimensions specially adapted for aircraft
    • G05D1/106Change initiated in response to external conditions, e.g. avoidance of elevated terrain or of no-fly zones
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T90/00Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation

Landscapes

  • Engineering & Computer Science (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明公开了一种基于强化学***流层飞艇轨迹跟踪方法,其具体步骤如下:建立平流层飞艇六自由度运动学和动力学模型,并将其表示为状态空间方程形式。给定期望轨迹计算期望位置和当前位置之间的误差,获得无约束的位置跟踪误差动力学模型。利用critic网络估计最优性能函数与最优控制量,以最小化估计误差为目标,获得基于最优控制输入量。获得对模型中的不确定项的估计补偿量,结合最优控制输入量与估计补偿量,获得鲁棒最优控制律。结合动力***布局对合力和合力矩进行控制解算,得到螺旋桨转速,实现平流层飞艇自主跟踪期望轨迹。通过基于级联滤波的估计器有效抑制了未知的建模误差和外界干扰对***的影响,控制器具有较高鲁棒性。

Description

一种基于强化学***流层飞艇轨迹跟踪方法
技术领域
本发明提供一种基于强化学***流层飞艇轨迹跟踪方法,它提供一种考虑外界干扰、位置受限、控制能量消耗的平流层飞艇轨迹跟踪新控制方法,属于自动控制技术领域。
背景技术
平流层飞艇是一种飞行在海拔高度为20-30km的平流层空间的无人浮空飞行器,对于深空探测、对地观测和通信服务领域具有独特的应用价值。在深空探测方面,平流层飞艇可以在广泛的波长范围内提供类似卫星平台的观测条件。在对地观测方面,相比于飞机和卫星平台,平流层飞艇可提供更高的分辨率和更持久的观测。在通信服务方面,平流层飞艇可以作为小型通讯基站提供高速通信服务。
近年来,随着平流层飞艇科技制造技术不断发展,平流层飞艇已由研制试飞阶段逐渐走向落地应用阶段。长时稳定的驻空飞行能力是平流层飞艇实现大规模应用的前提。在驻空飞行过程中,需要充分考虑并处理飞行期间受到的多种约束问题,以增强其“驻空生存”、“广域覆盖”能力。平流层飞艇飞行控制约束主要来自于两个方面:与其他分***耦合特性导致的控制能力约束、飞行环境与任务需求所带来位置约束。一方面,为了提高飞艇有效载荷,其自身结构与能源分***需进行轻量化设计,在储能电池容量与动力***能力约束下,平流层飞艇飞行时应尽可能减少能源消耗与执行机构损耗;另一方面,作为高空任务平台,在驻空飞行任务过程中,其位置需要保持在一定范围内。因此需要提出一个能够降低动力***损耗、保证位置满足约束的平流层飞艇轨迹跟踪控制方法。
本发明“一种基于强化学***流层飞艇轨迹跟踪方法”把以上问题作为切入点,而提出的有针对性的,解决位置受限、动力***能源消耗限制、外界干扰下的平流层飞艇轨迹跟踪的控制理论。首先,建立具有位置约束的平流层飞艇动力学模型,设计罚函数进行状态转换,将具有约束的动力学模型转换为无约束动力学模型;然后,基于强化学习求解最优控制律,使跟踪全过程轨迹跟踪累计误差和控制能量消耗均最小;同时,设计了一种级联滤波干扰估计器,用于估计未知动力学与外界干扰。最后,通过李雅普诺夫稳定性分析以及模拟仿真验证,证明所设计的控制方法能够在满足位置约束的条件下,以低控制能耗实现对期望轨迹的高精度跟踪。
发明内容
(1)目的:本发明的目的在于提供一种基于强化学***流层飞艇轨迹跟踪方法,控制工程师可以在结合实际参数整定,按照该方法实现平流层飞艇位置受限轨迹跟踪最优控制,同时对建模不确定性和外界干扰具有一定的鲁棒性。
(2)技术方案:本发明“一种基于强化学***流层飞艇轨迹跟踪方法”,其主要内容及步骤是:首先,建立平流层飞艇在考虑位置约束和外界干扰时的六自由度全驱动运动模型,利用罚函数状态转换,将具有约束的动力学模型转换为无约束模型;然后针对无约束模型进行鲁棒最优控制律设计,通过强化学***流层飞艇的当前位置、姿态、速度等状态量输入控制器中,获得到平流层飞艇轨迹跟踪任务中所需的合力和合力矩,再通过控制解算得到动力***的螺旋桨转速,从而使平流层飞艇具有自主轨迹跟踪能力。
本发明“一种基于强化学***流层飞艇轨迹跟踪方法”,其具体步骤如下:
步骤一 运动学和动力学模型构建:根据平流层飞艇总体布局与气动外形,采用Newton-Euler法,对平流层飞艇飞行过程进行受力分析,建立平流层飞艇六自由度运动学和动力学模型,并将其表示为状态空间方程形式。
步骤二 位置约束状态转换:考虑实际飞行中的位置约束要求,建立位置约束数学模型。给定期望轨迹,计算期望位置和当前位置之间的误差,结合位置约束设计罚函数对位置跟踪误差进行状态转换,获得无约束的位置跟踪误差动力学模型。
步骤三 位置跟踪最优控制设计:根据步骤二获得的跟踪误差动力学模型,不考虑外界干扰设计最优控制律。利用critic网络估计最优性能函数与最优控制量,以最小化估计误差为目标,设计critic网络的权重自适应更新率,获得基于最优控制输入量。
步骤四 位置跟踪鲁棒最优控制设计:根据步骤二获得的跟踪误差动力学模型,基于级联滤波设计干扰观测器,获得对模型中的不确定项的估计补偿量,结合步骤三设计的最优控制输入量与估计补偿量,获得鲁棒最优控制律,从而得到平流层飞艇动力***所需提供的合力。
步骤五 姿态跟踪鲁棒最优控制设计:将步骤四设计的鲁棒最优控制方法应用于姿态跟踪环,获得平流层飞艇动力***所需提供的合力矩。在实际应用中,可结合动力***布局对合力和合力矩进行控制解算,得到螺旋桨转速,实现平流层飞艇自主跟踪期望轨迹。
其中,在步骤一中所述的运动学和动力学模型构建过程如下:
平流层飞艇由椭球形氦气囊体、尾翼、推进***和吊舱组成,如图1所示。该构型下的平流层飞艇为全驱动动力***,即平流层飞艇的六自由度状态量可由六个独立控制量分别控制。具体而言,囊体前部的四组主推螺旋桨可在垂直方向转动,用于提供飞艇飞行所需主推力及姿态调节所需力矩,囊体头部的调姿装置可在水平方向摆动,提供飞艇航向调节所需力矩。
为建立平流层飞艇运动模型,首先定义如下坐标系:Fe={Oe,xe,ye,ze}为惯性坐标系,原点Oe为地面观测点,Oexe沿正北方向,Oexe沿正东方向,Oeze垂直地面向下;Fc={Oc,xc,yc,zc}为艇体坐标系,原点Oc为飞艇囊体的浮心,Ocxc沿飞艇的对称面向前,Ocyc垂直于飞艇对称面向右,Oczc垂直于Ocxcyc平面向下。
平流层飞艇的运动学模型为
Figure BDA0004183284370000031
其中,p=(x,y,z)T为表示在惯性坐标系Fe下的飞艇位置矢量,Θ=(φ,θ,ψ)T为飞艇姿态角矢量,V=(u,v,w)T为表示在艇体坐标系Fc下的飞艇地速矢量,Ω=(p,q,r)T为表示在艇体坐标系Fc下的飞艇姿态角速度矢量,R为艇体坐标系到惯性坐标系的旋转矩阵,表示为:
Figure BDA0004183284370000032
K为姿态转换矩阵,表示为:
Figure BDA0004183284370000033
平流层飞艇的动力学模型为
Figure BDA0004183284370000034
其中,m为飞艇重量,rc=[xc,yc,zc]T为飞艇质心到体心的矢径,Ic=diag{Ix,Iy,Iz}为飞艇惯性张量矩阵。G=RT[0,0,mg]T为体坐标系下的重力,g为重力加速度;MG为因飞艇质心和浮心分离产生的重力矩,表示为
Figure BDA0004183284370000035
Figure BDA0004183284370000041
为体坐标系下的浮力,ρ为飞艇所在高度的大气密度,/>
Figure BDA00041832843700000417
为飞艇总体积;由于飞艇所受浮力作用于浮心,则飞艇所受浮力矩为/>
Figure BDA0004183284370000042
和/>
Figure BDA0004183284370000043
Figure BDA0004183284370000044
分别为飞艇所受的附加惯性力和其对于浮心产生的力矩,ma=diag{α123}和Ia=diag{α456}分别为附加质量矩阵和附加惯量矩阵,αi,i=1,2,…,6为附加惯性系数,可通过分析椭球在势流场中的力学特性得到;FA和MA分别为飞艇所受气动力和气动力矩,表示为
Figure BDA0004183284370000045
Figure BDA0004183284370000046
Va为飞艇空速,
Figure BDA0004183284370000047
为参考面积,L为囊体直径,ρVa 2/2为动压,α为迎角,β为侧滑角,Cx(α,β,q,r)为飞艇阻力系数,Cy(β,p,r)为飞艇侧力系数,Cz(α,p,q)为飞艇升力系数,/>
Figure BDA00041832843700000418
为飞艇滚转力矩系数,/>
Figure BDA0004183284370000048
为飞艇俯仰力矩系数,/>
Figure BDA0004183284370000049
为飞艇偏航力矩系数;FT=[FTx,FTy,FTz]T和MT=[MTx,MTy,MTz]T分别为飞艇所受主动控制力和主动控制力矩;FD和MD分别为由外界风扰、***参数不确定项与囊体形变等造成的动力学效应组成的未知等效力和力矩。
整合平流层飞艇的运动学模型和动力学模型,可将平流层飞艇运动模型分为位置环运动模型和姿态环运动模型。位置环运动模型可表示为
Figure BDA00041832843700000410
姿态环运动模型可表示为
Figure BDA00041832843700000411
其中,
Figure BDA00041832843700000412
B0=χ11 -1,/>
Figure BDA00041832843700000413
Figure BDA00041832843700000414
B2=χ22 -1,χ11=diag{m+α1,m+α2,m+α3},χ22=diag{Ix4,Iy5,Iz6},
Figure BDA00041832843700000415
Figure BDA00041832843700000416
Figure BDA0004183284370000051
Figure BDA0004183284370000052
Figure BDA0004183284370000053
在步骤二中所述的位置约束状态转换过程如下:
定义飞艇飞行期望轨迹为pd=[xd,yd,zd]T,位置跟踪误差为
Figure BDA0004183284370000054
根据飞艇飞行过程中的任务要求,位置跟踪误差需满足限制要求为/>
Figure BDA0004183284370000055
Figure BDA0004183284370000056
其中h为约束上限,将其设定为一个可以根据任务要求调整的正常数。
为满足位置跟踪误差约束,引入状态转换方法,定义如下新的状态量:
Figure BDA0004183284370000057
其中,kp为一个正常数。由该公式可以看出,若位置跟踪误差的初始值满足限制要求,即
Figure BDA0004183284370000058
只要ξ为有界的,则可以保证/>
Figure BDA0004183284370000059
并且当ξ=0时,/>
Figure BDA00041832843700000510
因此,可以将具有约束限制的位置误差动力学方程转换为新的状态误差动力学方程:
Figure BDA00041832843700000511
其中,
Figure BDA00041832843700000512
为单位矩阵,/>
Figure BDA00041832843700000513
Figure BDA00041832843700000514
B1=RB0
定义
Figure BDA00041832843700000515
则状态误差动力学方程可写为:
Figure BDA00041832843700000516
其中,
Figure BDA00041832843700000517
B=[03×3,B1],U=FT+FD
在步骤三中所述的位置跟踪最优控制设计过程如下:
定义性能指标函数为
Figure BDA00041832843700000518
其中,
Figure BDA00041832843700000519
rx和ru均为正常数,/>
Figure BDA00041832843700000520
为控制输入上限。
接下来需设计最优控制律U*(t),使得性能函数指标值最小,即优化目标为
Figure BDA0004183284370000061
对J*求导,可获得Hamilton-Jacobi-Bellman(HJB)方程为
Figure BDA0004183284370000062
两边都对U*求导,可得到最优控制律为
Figure BDA0004183284370000063
由于最优性能指标值难以以解析形式表示,利用自适应critic神经网络学习的方式逼近数值解。构建具有lp个神经元的critic网络,估计最优性能指标值,表示为
J1 *=wc Tχ(X)+εc
Figure BDA0004183284370000064
其中,
Figure BDA0004183284370000065
为critic网络权重,χ(X)为激活函数,/>
Figure BDA0004183284370000066
为激活函数相对于X的导数,εc为神经网络估计误差,/>
Figure BDA0004183284370000067
为估计误差相对于X的导数。则最优性能指标和最优控制量可写为
Figure BDA0004183284370000068
Figure BDA0004183284370000069
对应的HJB方程为
Figure BDA00041832843700000610
则HJB误差为
Figure BDA00041832843700000611
Figure BDA00041832843700000612
求导,可得
Figure BDA00041832843700000613
定义
Figure BDA00041832843700000614
设计如下辅助***
Figure BDA00041832843700000615
其中,
Figure BDA00041832843700000616
为辅助***状态量;/>
Figure BDA00041832843700000617
Figure BDA00041832843700000618
为正常数,满足kp1<kp2
为最大程度利用历史信息,选择tp时刻对应的辅助***状态量
Figure BDA00041832843700000619
和/>
Figure BDA00041832843700000620
用于critic网络权重更新。其中,/>
Figure BDA00041832843700000621
表示x的最小特征值。
设计critic网络权重更新公式为
Figure BDA0004183284370000071
其中,rp>0,δp>0为学习率,
Figure BDA0004183284370000072
为单位矩阵,ρp为切换函数,定义为
Figure BDA0004183284370000073
该切换函数的设计是为了避免控制量初始值不可行。
因此,位置跟踪最优控制律设计为
Figure BDA0004183284370000074
Figure BDA0004183284370000075
在步骤四中所述的位置跟踪鲁棒最优控制设计过程如下:
根据U=FT+FD,步骤三中已得到最优U的表达式,为获得飞艇动力***所需提供的主动控制力FT,需对未知项FD进行估计。设计基于级联滤波的估计器为
Figure BDA0004183284370000076
其中,
Figure BDA0004183284370000077
为FD的估计值,/>
Figure BDA0004183284370000078
为以下滤波器的输出状态
Figure BDA0004183284370000079
其中,
Figure BDA00041832843700000710
Figure BDA00041832843700000711
为另一滤波器的输出
Figure BDA00041832843700000712
因此,位置跟踪鲁棒最优控制律设计为
Figure BDA00041832843700000713
在步骤五中所述的姿态跟踪鲁棒最优控制设计过程如下:
定义飞艇飞行期望姿态为
Figure BDA00041832843700000714
姿态跟踪误差为/>
Figure BDA00041832843700000715
因此,姿态误差动力学模型可写为
Figure BDA00041832843700000716
其中,
Figure BDA00041832843700000717
定义
Figure BDA00041832843700000718
则上述姿态误差动力学模型可改写为:
Figure BDA00041832843700000719
其中,
Figure BDA00041832843700000720
Ba=[03×3,B2],M=MT+MD
定义性能指标函数为
Figure BDA0004183284370000081
其中,
Figure BDA0004183284370000082
ra和rm均为正常数,/>
Figure BDA0004183284370000083
为控制输入的限制值。
接下来需设计最优控制律M*(t),使得性能函数指标值最小,即优化目标为
Figure BDA0004183284370000084
由于最优性能指标值难以以解析形式表示,利用自适应critic神经网络学习的方式逼近数值解。构建具有la个神经元的critic网络,估计最优性能指标值,表示为
Figure BDA0004183284370000085
其中,
Figure BDA0004183284370000086
为critic网络权重估计值,χ(Xa)为激活函数。最优控制律可表示为
Figure BDA0004183284370000087
其中,
Figure BDA0004183284370000088
为激活函数相对于Xa的导数。critic网络估计权重更新公式为
Figure BDA0004183284370000089
其中,rw>0,δa>0为学习率,ρa为切换函数,定义为
Figure BDA00041832843700000810
Figure BDA00041832843700000823
和/>
Figure BDA00041832843700000811
为ta时刻对应的辅助***状态量Ma和Pa,即/>
Figure BDA00041832843700000812
ta=argmaxs∈[0,t] λ(Ma(s))。辅助***如下所示:
Figure BDA00041832843700000813
其中,
Figure BDA00041832843700000814
为辅助***状态量;/>
Figure BDA00041832843700000815
Figure BDA00041832843700000816
为正常数,满足/>
Figure BDA00041832843700000817
Figure BDA00041832843700000818
为估计未知项MD,设计基于级联滤波的估计器为
Figure BDA00041832843700000819
其中,
Figure BDA00041832843700000820
为MD的估计值,/>
Figure BDA00041832843700000821
为以下滤波器的输出状态
Figure BDA00041832843700000822
其中,
Figure BDA0004183284370000091
Figure BDA0004183284370000092
为另一滤波器的输出
Figure BDA0004183284370000093
因此,姿态跟踪鲁棒最优控制律设计为
Figure BDA0004183284370000094
(3)优点及效果:
本发明“一种基于强化学***流层飞艇轨迹跟踪方法”,与现有技术比,其优点是:
1)本方法能够有效解决平流层飞艇位置受限控制问题,通过基于罚函数的状态转换方法,将受限控制问题转换为非受限控制问题,保证在跟踪控制过程中平流层飞艇位置始终在预定约束下,从而满足飞行任务要求;
2)本方法设计了一种基于强化学习的最优控制方法,避免了传统最优控制中HJB方程的复杂求解过程,可使累计控制输入和跟踪误差最小,能够有效减少动力***能源消耗;
3)本方法中设计了一种新的基于历史信息的critic网络权重更新策略,该更新策略无需满足一般强化学习控制中所需的持续激励条件,实用性更高;
4)本方法通过基于级联滤波的估计器有效抑制了未知的建模误差和外界干扰对***的影响,控制器具有较高鲁棒性。
附图说明
图1为本发明平流层飞艇构型及坐标系示意图;
符号说明如下:
p,p=(x,y,z)T为飞艇在惯性坐标系下的当前位置;
Θ,Θ=(φ,θ,ψ)T为飞艇的当前姿态角;
V,V=(u,v,w)T为飞艇在艇体坐标系下的当前地速;
Ω,Ω=(p,q,r)T为飞艇在艇体坐标系下的姿态角速度;
R,艇体坐标系到惯性坐标系的旋转矩阵;
K,姿态转换矩阵;
m,飞艇质量;
ma,ma=diag{α123}飞艇附加质量矩阵;
Ia,Ia=diag{α456}飞艇附加惯量矩阵;
αi,(i=1,2,…,6)飞艇附加惯性系数;
rc,rc=[xc,yc,zc]T飞艇质心到体心的矢径;
Ic,Ic=diag{Ix,Iy,Iz}飞艇惯性张量矩阵;
g,重力加速度;
rc,rc=[xc,yc,zc]T飞艇质心到体心的矢径;
ρ,飞艇所在高度的大气密度;
Figure BDA0004183284370000101
飞艇总体积;
S,参考面积;
L,飞艇囊体直径;
α,飞艇飞行迎角;
α,飞艇飞行侧滑角;
Va,飞艇飞行空速;
Cx,飞艇阻力系数;
Cy,飞艇侧力系数;
Cz,飞艇升力系数;
Cl,飞艇滚转力矩系数;
Cm,飞艇俯仰力矩系数;
Cn,飞艇偏航力矩系数;
G,G=RT[0,0,mg]T飞艇所受重力在艇体坐标系下的表示;
B,
Figure BDA0004183284370000116
飞艇所受浮力在艇体坐标系下的表示;
MG,飞艇所受重力矩;
MB,飞艇所受浮力矩;
Fa,飞艇所受附加惯性力;
Ma,飞艇所受附加惯性力对于浮心产生的力矩;
FT,FT=[FTx,FTy,FTz]T飞艇所受主动控制力;
MT,MT=[MTx,MTy,MTz]T飞艇所受主动控制力矩;
FD,飞艇所受未知等效力;
MD,飞艇所受未知等效力矩;
pd,pd=[xd,yd,zd]T为飞艇在惯性坐标系下的期望位置;
Figure BDA0004183284370000111
为飞艇位置跟踪误差;
h,为飞艇位置跟踪约束上限;
Figure BDA0004183284370000112
位置环控制系数;
rx,ru,rpp,位置环神经网络学习系数;
lp,la,神经元个数;
wc,wa,神经网络权重系数;
Figure BDA0004183284370000113
神经网络权重系数估计值;
χ(·),神经网络激活函数;
Figure BDA0004183284370000114
神经网络激活函数的导数;
εca,神经网络估计误差;
Figure BDA0004183284370000115
神经网络估计误差的导数;
Mp,Pp,辅助***状态量;
ρp,切换函数;
Figure BDA00041832843700001211
位置环控制输入上限;
Figure BDA0004183284370000121
为飞艇期望姿态;
Figure BDA0004183284370000122
为飞艇姿态跟踪误差;
Figure BDA0004183284370000123
姿态环控制系数;
ra,rm,rwa,姿态环神经网络学习系数;
Figure BDA0004183284370000124
姿态环控制输入上限;
I3,三维单位矩阵;
具体实施方式
下面对本发明中的各部分设计方法作进一步的说明:
本发明“一种基于强化学***流层飞艇轨迹跟踪方法”,其具体步骤如下:
步骤一:运动学和动力学模型构建
定义平流层飞艇运动状态量:p=(x,y,z)T为表示在惯性坐标系Fe下的飞艇位置矢量,Θ=(φ,θ,ψ)T为飞艇姿态角矢量,V=(u,v,w)T为表示在艇体坐标系Fc下的飞艇地速矢量,Ω=(p,q,r)T为表示在艇体坐标系Fc下的飞艇姿态角速度矢量。
根据坐标系变换和牛顿-欧拉方程,建立平流层飞艇的运动学模型和动力学模型,并将其整合为位置环运动模型和姿态环运动模型。位置环运动模型可表示为
Figure BDA0004183284370000125
姿态环运动模型可表示为
Figure BDA0004183284370000126
其中,R为艇体坐标系到惯性坐标系的旋转矩阵,K为姿态转换矩阵,FD和MD分别为由外界风扰、***参数不确定项与囊体形变等造成的动力学效应组成的未知等效力和力矩,
Figure BDA0004183284370000127
Figure BDA0004183284370000128
B0=χ11 -1,/>
Figure BDA0004183284370000129
Figure BDA00041832843700001210
B2=χ22 -1,χ11=diag{m+α1,m+α2,m+α3},χ22=diag{Ix4,Iy5,Iz6},
Figure BDA0004183284370000131
Figure BDA0004183284370000132
Figure BDA0004183284370000133
Figure BDA0004183284370000134
/>
Figure BDA0004183284370000135
步骤二:位置约束状态转换
给定飞艇飞行期望轨迹为pd=[xd,yd,zd]T,求得位置跟踪误差为
Figure BDA0004183284370000136
根据飞艇飞行过程中的任务要求,位置跟踪误差需满足限制要求为/>
Figure BDA0004183284370000137
Figure BDA0004183284370000138
其中h为约束上限,将其设定为一个可以根据任务要求调整的正常数。为满足位置跟踪误差约束,引入状态转换方法,定义如下新的状态量:
Figure BDA0004183284370000139
其中,kp为一个正常数。由该公式可以看出,若位置跟踪误差的初始值满足限制要求,即
Figure BDA00041832843700001310
只要ξ为有界的,则可以保证/>
Figure BDA00041832843700001311
并且当ξ=0时,/>
Figure BDA00041832843700001312
因此,可以将具有约束限制的位置误差动力学方程转换为新的状态误差动力学方程:
Figure BDA00041832843700001313
其中,
Figure BDA00041832843700001314
Figure BDA00041832843700001315
Figure BDA00041832843700001316
为单位矩阵,/>
Figure BDA00041832843700001317
Figure BDA00041832843700001318
B1=RB0
定义
Figure BDA00041832843700001319
则状态误差动力学方程可写为:
Figure BDA00041832843700001320
其中,
Figure BDA00041832843700001321
B=[03×3,B1],U=FT+FD
步骤三:位置跟踪最优控制设计
针对步骤二所获得的状态误差动力学方程,设计如下最优控制律
Figure BDA0004183284370000141
其中,
Figure BDA0004183284370000142
为激活函数的导数,/>
Figure BDA0004183284370000143
为critic网络权重估计值,该值通过如下自适应更新律获得
Figure BDA0004183284370000144
其中,rp>0,δp>0为学习率,
Figure BDA0004183284370000145
为单位矩阵,/>
Figure BDA0004183284370000146
为控制输入上限,ρp为切换函数,定义为
Figure BDA0004183284370000147
Figure BDA0004183284370000148
和/>
Figure BDA0004183284370000149
为tp时刻对应的辅助***状态量Mp和Pp,即/>
Figure BDA00041832843700001410
tp=argmaxs∈[0,t] λ(Mp(s))。辅助***如下所示:/>
Figure BDA00041832843700001411
其中,
Figure BDA00041832843700001412
Figure BDA00041832843700001413
为正常数,满足kp1<kp2;/>
Figure BDA00041832843700001414
Figure BDA00041832843700001415
rx和ru均为正常数。
步骤四:位置跟踪鲁棒最优控制设计
根据U=FT+FD,步骤三中已得到最优U的表达式,为获得飞艇动力***所需提供的主动控制力FT,需对未知项FD进行估计。设计基于级联滤波的估计器为
Figure BDA00041832843700001416
其中,
Figure BDA00041832843700001417
为FD的估计值,/>
Figure BDA00041832843700001418
为以下滤波器的输出状态
Figure BDA00041832843700001419
其中,
Figure BDA00041832843700001420
Figure BDA00041832843700001421
为另一滤波器的输出
Figure BDA00041832843700001422
因此,位置跟踪鲁棒最优控制律设计为
Figure BDA00041832843700001423
步骤五:姿态跟踪鲁棒最优控制设计
定义飞艇飞行期望姿态为
Figure BDA00041832843700001424
姿态跟踪误差为/>
Figure BDA00041832843700001425
因此,姿态误差动力学模型可写为
Figure BDA0004183284370000151
其中,
Figure BDA0004183284370000152
定义
Figure BDA0004183284370000153
则上述姿态误差动力学模型可改写为:
Figure BDA0004183284370000154
其中,
Figure BDA0004183284370000155
Ba=[03×3,B2],M=MT+MD
针对以上姿态误差动力学方程,设计如下最优控制律
Figure BDA0004183284370000156
其中,
Figure BDA0004183284370000157
为激活函数相对于Xa的导数,/>
Figure BDA0004183284370000158
为控制输入的限制值,/>
Figure BDA0004183284370000159
为critic网络权重估计值,该值通过如下自适应更新律获得
Figure BDA00041832843700001510
/>
其中,rw>0,δa>0为学习率,ρa为切换函数,定义为
Figure BDA00041832843700001511
Figure BDA00041832843700001512
和/>
Figure BDA00041832843700001513
为ta时刻对应的辅助***状态量Ma和Pa,即/>
Figure BDA00041832843700001514
ta=argmaxs∈[0,t] λ(Ma(s))。辅助***如下所示:
Figure BDA00041832843700001515
其中,
Figure BDA00041832843700001516
为辅助***状态量;/>
Figure BDA00041832843700001517
Figure BDA00041832843700001518
为正常数,满足/>
Figure BDA00041832843700001519
Figure BDA00041832843700001520
ra和rm均为正常数。
为估计未知项MD,设计基于级联滤波的估计器为
Figure BDA00041832843700001521
其中,
Figure BDA00041832843700001522
为MD的估计值,/>
Figure BDA00041832843700001523
为以下滤波器的输出状态
Figure BDA00041832843700001524
其中,
Figure BDA00041832843700001525
Figure BDA00041832843700001526
为另一滤波器的输出
Figure BDA00041832843700001527
因此,姿态跟踪鲁棒最优控制律设计为
Figure BDA0004183284370000161
/>

Claims (6)

1.一种基于强化学***流层飞艇轨迹跟踪方法,其特征在于,该方法的具体步骤如下:
步骤一,运动学和动力学模型构建:根据平流层飞艇总体布局与气动外形,采用Newton-Euler法,对平流层飞艇飞行过程进行受力分析,建立平流层飞艇六自由度运动学和动力学模型,并将其表示为状态空间方程形式;
步骤二,位置约束状态转换:考虑实际飞行中的位置约束要求,建立位置约束数学模型;给定期望轨迹,计算期望位置和当前位置之间的误差,结合位置约束设计罚函数对位置跟踪误差进行状态转换,获得无约束的位置跟踪误差动力学模型;
步骤三,位置跟踪最优控制设计:根据步骤二获得的跟踪误差动力学模型,不考虑外界干扰设计最优控制律;利用critic网络估计最优性能函数与最优控制量,以最小化估计误差为目标,设计critic网络的权重自适应更新率,获得基于最优控制输入量;
步骤四,位置跟踪鲁棒最优控制设计:根据步骤二获得的跟踪误差动力学模型,基于级联滤波设计干扰观测器,获得对模型中的不确定项的估计补偿量,结合步骤三设计的最优控制输入量与估计补偿量,获得鲁棒最优控制律,从而得到平流层飞艇动力***所需提供的合力;
步骤五,姿态跟踪鲁棒最优控制设计:将步骤四设计的鲁棒最优控制方法应用于姿态跟踪环,获得平流层飞艇动力***所需提供的合力矩;在实际应用中,可结合动力***布局对合力和合力矩进行控制解算,得到螺旋桨转速,实现平流层飞艇自主跟踪期望轨迹。
2.根据权利要求1所述的一种基于强化学***流层飞艇轨迹跟踪方法,其特征在于:在步骤一中所述的运动学和动力学模型构建,其步骤如下:
建立平流层飞艇运动模型,首先定义如下坐标系:Fe={Oe,xe,ye,ze}为惯性坐标系,原点Oe为地面观测点,Oexe为沿正北方向的坐标轴,Oeye为沿正东方向的坐标轴,Oeze为垂直地面向下的坐标轴;Fc={Oc,xc,yc,zc}为艇体坐标系,原点Oc为飞艇囊体的浮心,Ocxc为沿飞艇的对称面向前的坐标轴,Ocyc为垂直于飞艇对称面向右的坐标轴,Oczc为垂直于Ocxcyc平面向下的坐标轴;
平流层飞艇的运动学模型为
Figure FDA0004183284360000021
其中,p=(x,y,z)T为表示在惯性坐标系Fe下的飞艇位置矢量,x,y,z分别为飞艇位置投影在Oexe,Oeye,Oeze的轴向分量,Θ=(φ,θ,ψ)T为飞艇姿态角矢量,φ,θ,ψ分别为飞艇滚转角、俯仰角和偏航角,V=(u,v,w)T为表示在艇体坐标系Fc下的飞艇地速矢量,u,v,w分别为飞艇地速投影在Oexe,Oeye,Oeze的轴向分量,Ω=(p,q,r)T为表示在艇体坐标系Fc下的飞艇姿态角速度矢量,p,q,r分别为飞艇滚转角速度、俯仰角速度和偏航角速度,R为艇体坐标系到惯性坐标系的旋转矩阵,表示为:
Figure FDA0004183284360000022
K为姿态转换矩阵,表示为:
Figure FDA0004183284360000023
T为矩阵的转置符号;
平流层飞艇的动力学模型为
Figure FDA0004183284360000024
其中,m为飞艇重量,rc=[xc,yc,zc]T为飞艇质心到体心的矢径,xc,yc,zc分别为飞艇质心到体心的距离投影在Ocxc,Ocyc,Oczc轴向的分量,Ic=diag{Ix,Iy,Iz}为飞艇惯性张量矩阵,diag表示对角矩阵,Ix,Iy,Iz为飞艇惯性张量分量;G=RT[0,0,mg]T为体坐标系下的重力,g为重力加速度;MG为因飞艇质心和浮心分离产生的重力矩,表示为
Figure FDA0004183284360000025
Figure FDA0004183284360000026
为体坐标系下的浮力,ρ为飞艇所在高度的大气密度,/>
Figure FDA0004183284360000027
为飞艇总体积;由于飞艇所受浮力作用于浮心,则飞艇所受浮力矩为MB=0;/>
Figure FDA0004183284360000028
Figure FDA0004183284360000029
Figure FDA00041832843600000210
分别为飞艇所受的附加惯性力和其对于浮心产生的力矩,ma=diag{α123}和Ia=diag{α456}分别为附加质量矩阵和附加惯量矩阵,αi,i=1,2,…,6为附加惯性系数,通过分析椭球在势流场中的力学特性得到;FA和MA分别为飞艇所受气动力和气动力矩,表示为
Figure FDA0004183284360000031
Figure FDA0004183284360000032
Va为飞艇空速合速,
Figure FDA0004183284360000033
为参考面积,L为囊体直径,α为迎角,β为侧滑角,Cx(α,β,q,r)为飞艇阻力系数,Cy(β,p,r)为飞艇侧力系数,CZ(α,p,q)为飞艇升力系数,/>
Figure FDA0004183284360000034
为飞艇滚转力矩系数,/>
Figure FDA0004183284360000035
为飞艇俯仰力矩系数,/>
Figure FDA0004183284360000036
为飞艇偏航力矩系数;FT=[FTx,FTy,FTz]T和MT=[MTx,MTy,MTz]T分别为飞艇所受主动控制力和主动控制力矩,FTx,FTy,FTz为主动控制力三维分量,MTx,MTy,MTz为主动控制力矩三维分量;FD和MD分别为由外界风扰、***参数不确定项与囊体形变造成的动力学效应组成的未知等效力和力矩;
整合平流层飞艇的运动学模型和动力学模型,将平流层飞艇运动模型分为位置环运动模型和姿态环运动模型;位置环运动模型表示为
Figure FDA0004183284360000037
姿态环运动模型表示为
Figure FDA0004183284360000038
其中,
Figure FDA0004183284360000039
B0=χ11 -1,/>
Figure FDA00041832843600000310
Figure FDA00041832843600000311
B2=x22 -1,χ11=diag{m+α1,m+α2,m+α3},χ22=diag{Ix4,Iy5,Iz6},
Figure FDA00041832843600000312
χ21=-χ12
Figure FDA00041832843600000313
Figure FDA0004183284360000041
Figure FDA0004183284360000042
Figure FDA0004183284360000043
3.根据权利要求1所述的一种基于强化学***流层飞艇轨迹跟踪方法,其特征在于:在步骤二中所述的位置约束状态转换,其设计步骤如下:
定义飞艇飞行期望轨迹为pd=[xd,yd,zd]T,xd,yd,zd为期望轨迹投影在Oexe,Oeye,Oeze的轴向分量,位置跟踪误差为
Figure FDA0004183284360000044
Figure FDA0004183284360000045
为位置跟踪误差投影在Oexe,Oeye,Oeze的轴向分量;根据飞艇飞行过程中的任务要求,位置跟踪误差满足限制要求为
Figure FDA0004183284360000046
其中h为约束上限,将其设定为一个根据任务要求调整的正常数,/>
Figure FDA0004183284360000047
表示实数域;
为满足位置跟踪误差约束,引入状态转换方法,定义如下新的状态量:
Figure FDA0004183284360000048
其中,kp为一个正常数;若位置跟踪误差的初始值满足限制要求,即
Figure FDA0004183284360000049
只要ξ为有界的,则保证/>
Figure FDA00041832843600000410
并且当ξ(t)→0时,/>
Figure FDA00041832843600000411
t0为初始时刻,t为当前时刻;
根据位置环运动模型(3)和状态转换公式(5),将具有约束限制的位置误差动力学方程表示为:
Figure FDA00041832843600000412
其中,
Figure FDA00041832843600000413
Figure FDA00041832843600000414
为单位矩阵,/>
Figure FDA00041832843600000415
Figure FDA00041832843600000416
B1=RB0
定义
Figure FDA00041832843600000417
则状态误差动力学方程写为:
Figure FDA00041832843600000418
其中,
Figure FDA00041832843600000419
B=[03×3,B1],U=FT+FD
4.根据权利要求1所述的一种基于强化学***流层飞艇轨迹跟踪方法,其特征在于:在步骤三中所述的位置跟踪最优控制设计,其设计步骤如下:
定义性能指标函数为
Figure FDA0004183284360000051
其中,
Figure FDA0004183284360000052
rx和ru均为正常数,/>
Figure FDA0004183284360000053
为控制输入上限;
接下来需设计最优控制律U*(t),使得性能函数指标值最小,即优化目标为
Figure FDA0004183284360000054
对J*求导,获得Hamilton-Jacobi-Bellman(HJB)方程为
Figure FDA0004183284360000055
两边都对U*求导,得到最优控制律为
Figure FDA0004183284360000056
利用自适应critic神经网络学习的方式逼近数值解;构建具有lp个神经元的critic网络,估计最优性能指标值,表示为J1 *=wc Tχ(X)+εc
Figure FDA0004183284360000057
Figure FDA0004183284360000058
其中,
Figure FDA0004183284360000059
为critic网络权重向量,/>
Figure FDA00041832843600000510
为激活函数向量,/>
Figure FDA00041832843600000511
为激活函数相对于X的导数,εc为神经网络估计误差,/>
Figure FDA00041832843600000512
为估计误差相对于X的导数;则最优性能指标和最优控制量为
Figure FDA00041832843600000513
Figure FDA00041832843600000514
对应的HJB方程为
Figure FDA00041832843600000515
则HJB误差为
Figure FDA0004183284360000061
Figure FDA0004183284360000062
求导,得
Figure FDA0004183284360000063
其中,⊙表示向量中对应元素相乘;定义
Figure FDA0004183284360000064
Figure FDA0004183284360000065
设计如下辅助***
Figure FDA0004183284360000066
其中,
Figure FDA0004183284360000067
为辅助***状态量;/>
Figure FDA0004183284360000068
Figure FDA0004183284360000069
kp1,kp2,/>
Figure FDA00041832843600000610
为正常数,满足kp1<kp2
选择tp时刻对应的辅助***状态量
Figure FDA00041832843600000611
和/>
Figure FDA00041832843600000612
用于critic网络权重更新;其中,
Figure FDA00041832843600000613
tp=argmaxs∈[0,t] λ(Mp(s)),λ()表示求矩阵的最小特征值;
设计critic网络权重更新公式为
Figure FDA00041832843600000614
其中,rp>0,δp>0为学习率,
Figure FDA00041832843600000615
为单位矩阵,ρp为切换函数,定义为/>
Figure FDA00041832843600000616
位置跟踪最优控制律设计为
Figure FDA00041832843600000617
Figure FDA00041832843600000618
5.根据权利要求1所述的一种基于强化学***流层飞艇轨迹跟踪方法,其特征在于:在步骤四中所述的位置跟踪鲁棒最优控制设计,其设计步骤如下:
根据U=FT+FD,步骤三中已得到最优U的表达式,为获得飞艇动力***所需提供的主动控制力FT,需对未知项FD进行估计;设计基于级联滤波的估计器为
Figure FDA0004183284360000071
其中,
Figure FDA0004183284360000072
为FD的估计值,/>
Figure FDA0004183284360000073
为以下滤波器的输出状态
Figure FDA0004183284360000074
其中,
Figure FDA0004183284360000075
ζ1,ζ2为另一滤波器的输出
Figure FDA0004183284360000076
位置跟踪鲁棒最优控制律设计为
Figure FDA0004183284360000077
6.根据权利要求1所述的一种基于强化学***流层飞艇轨迹跟踪方法,其特征在于:在步骤五中所述的姿态跟踪鲁棒最优控制设计,其设计步骤如下:
定义飞艇飞行期望姿态为
Figure FDA0004183284360000078
Figure FDA0004183284360000079
θdd分别为期望滚转角、期望俯仰角和期望偏航角,姿态跟踪误差为/>
Figure FDA00041832843600000710
Figure FDA00041832843600000711
分别为姿态跟踪误差的三维分量;根据姿态环运动模型(4),姿态误差动力学模型为
Figure FDA00041832843600000712
其中,
Figure FDA00041832843600000713
定义
Figure FDA00041832843600000714
则上述姿态误差动力学模型(23)为:
Figure FDA00041832843600000715
其中,
Figure FDA00041832843600000716
Ba=[03×3,B2],M=MT+MD
定义性能指标函数为
Figure FDA0004183284360000081
其中,
Figure FDA0004183284360000082
ra和rm均为正常数,/>
Figure FDA0004183284360000083
为控制输入的限制值;
接下来需设计最优控制律M*(t),使得性能函数指标值最小,即优化目标为
Figure FDA0004183284360000084
构建具有la个神经元的critic网络,估计最优性能指标值,表示为
Figure FDA0004183284360000085
Figure FDA0004183284360000086
其中,/>
Figure FDA0004183284360000087
为critic网络权重估计值,/>
Figure FDA0004183284360000088
为激活函数;最优控制律表示为
Figure FDA0004183284360000089
其中,
Figure FDA00041832843600000810
为激活函数相对于Xa的导数;critic网络估计权重更新公式为
Figure FDA00041832843600000811
其中,rw>0,δa>0为学习率,ρa为切换函数,定义为
Figure FDA00041832843600000812
Figure FDA00041832843600000813
和/>
Figure FDA00041832843600000814
为ta时刻对应的辅助***状态量Ma和Pa,即/>
Figure FDA00041832843600000815
ta=argmaxs∈[0,t] λ(Ma(s));辅助***如下所示:
Figure FDA00041832843600000816
其中,
Figure FDA00041832843600000817
为辅助***状态量;/>
Figure FDA00041832843600000818
Figure FDA00041832843600000819
ka1,ka2,/>
Figure FDA00041832843600000820
为正常数,满足ka1<ka2;/>
Figure FDA00041832843600000821
Figure FDA00041832843600000822
为估计未知项MD,设计基于级联滤波的估计器为
Figure FDA00041832843600000823
其中,
Figure FDA00041832843600000824
为MD的估计值,/>
Figure FDA00041832843600000825
为以下滤波器的输出状态
Figure FDA0004183284360000091
其中,
Figure FDA0004183284360000092
ζ3,ζ4为另一滤波器的输出
Figure FDA0004183284360000093
姿态跟踪鲁棒最优控制律设计为
Figure FDA0004183284360000094
CN202310411334.7A 2023-04-18 2023-04-18 一种基于强化学***流层飞艇轨迹跟踪方法 Active CN116360497B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310411334.7A CN116360497B (zh) 2023-04-18 2023-04-18 一种基于强化学***流层飞艇轨迹跟踪方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310411334.7A CN116360497B (zh) 2023-04-18 2023-04-18 一种基于强化学***流层飞艇轨迹跟踪方法

Publications (2)

Publication Number Publication Date
CN116360497A true CN116360497A (zh) 2023-06-30
CN116360497B CN116360497B (zh) 2024-02-09

Family

ID=86911134

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310411334.7A Active CN116360497B (zh) 2023-04-18 2023-04-18 一种基于强化学***流层飞艇轨迹跟踪方法

Country Status (1)

Country Link
CN (1) CN116360497B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118151678A (zh) * 2024-05-13 2024-06-07 山东科技大学 一种平流层飞艇固定时间轨迹跟踪控制方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105700542A (zh) * 2016-03-30 2016-06-22 北京航空航天大学 一种基于矢量场制导和最小二乘法的平流层飞艇控制分配方法
CN110018687A (zh) * 2019-04-09 2019-07-16 大连海事大学 基于强化学习方法的无人水面船最优轨迹跟踪控制方法
CN111596692A (zh) * 2020-06-09 2020-08-28 北京航空航天大学 一种平流层飞艇的环绕跟踪移动目标控制方法及***

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105700542A (zh) * 2016-03-30 2016-06-22 北京航空航天大学 一种基于矢量场制导和最小二乘法的平流层飞艇控制分配方法
CN110018687A (zh) * 2019-04-09 2019-07-16 大连海事大学 基于强化学习方法的无人水面船最优轨迹跟踪控制方法
CN111596692A (zh) * 2020-06-09 2020-08-28 北京航空航天大学 一种平流层飞艇的环绕跟踪移动目标控制方法及***

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
姚舒雨: "平流层飞艇的建模与控制研究", 《《中国优秀硕士学位论文全文数据库》》 *
洪成文;富月;: "基于自适应动态规划的非线性鲁棒近似最优跟踪控制", 控制理论与应用, no. 09 *
郑泽伟;霍伟;: "平流层飞艇轨迹跟踪控制设计", 控制与决策, no. 10 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118151678A (zh) * 2024-05-13 2024-06-07 山东科技大学 一种平流层飞艇固定时间轨迹跟踪控制方法

Also Published As

Publication number Publication date
CN116360497B (zh) 2024-02-09

Similar Documents

Publication Publication Date Title
Zheng et al. Adaptive fixed-time trajectory tracking control of a stratospheric airship
Geng et al. Cooperative transport of a slung load using load-leading control
Mueller et al. Development of an aerodynamic model and control law design for a high altitude airship
Moutinho et al. Airship robust path-tracking: A tutorial on airship modelling and gain-scheduling control design
CN112241125B (zh) 一种基于微分平坦特性的无人机轨迹跟踪方法
Zheng et al. Planar path following control for stratospheric airship
Sebbane Lighter than air robots: guidance and control of autonomous airships
Zuo et al. Three-dimensional path-following backstepping control for an underactuated stratospheric airship
Zhou et al. A unified control method for quadrotor tail-sitter uavs in all flight modes: Hover, transition, and level flight
CN103488814A (zh) 一种适用于再入飞行器姿态控制的闭环仿真***
CN107491083B (zh) 一种基于饱和自适应滑模控制的四旋翼自主着船方法
Salazar-Cruz et al. Real-time stabilization of a small three-rotor aircraft
CN110471456A (zh) 高超声速飞行器俯冲段制导、姿控、变形一体化控制方法
Pshikhopov et al. Mathematical model of robot on base of airship
CN116360497B (zh) 一种基于强化学***流层飞艇轨迹跟踪方法
Zheng et al. Hovering control for a stratospheric airship in unknown wind
Moutinho Modeling and nonlinear control for airship autonomous flight
Hervas et al. Sliding mode control of fixed-wing uavs in windy environments
CN108733858B (zh) 应用于高空飞行器***的建模方法和装置
Zheng et al. Modeling and path-following control of a vector-driven stratospheric satellite
CN116088549B (zh) 一种尾座式垂直起降无人机姿态控制方法
Osborne Transitions between hover and level flight for a tailsitter UAV
Lee et al. Matching trajectory optimization and nonlinear tracking control for HALE
Nemes Synopsis of soft computing techniques used in quadrotor UAV modelling and control
CN113885549B (zh) 基于维度裁剪的ppo算法的四旋翼姿态轨迹控制方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant