CN117311390B - 一种空天往返飞行器闭环跟踪智能组合制导方法 - Google Patents

一种空天往返飞行器闭环跟踪智能组合制导方法 Download PDF

Info

Publication number
CN117311390B
CN117311390B CN202311463606.4A CN202311463606A CN117311390B CN 117311390 B CN117311390 B CN 117311390B CN 202311463606 A CN202311463606 A CN 202311463606A CN 117311390 B CN117311390 B CN 117311390B
Authority
CN
China
Prior art keywords
information
state
aircraft
prediction
track
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311463606.4A
Other languages
English (en)
Other versions
CN117311390A (zh
Inventor
张秀云
于卉
宗群
李智禹
张睿隆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin University
Original Assignee
Tianjin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University filed Critical Tianjin University
Priority to CN202311463606.4A priority Critical patent/CN117311390B/zh
Publication of CN117311390A publication Critical patent/CN117311390A/zh
Application granted granted Critical
Publication of CN117311390B publication Critical patent/CN117311390B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T90/00Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明属于空天往返飞行器闭环跟踪智能组合制导技术领域,具体涉及一种空天往返飞行器闭环跟踪智能组合制导方法,包括以下步骤:S1:设计一个LSTM的飞行器轨迹预测算法;S2:建立RLV再入段误差模型并转化约束控制问题;S3:设计基于自适应动态规划的飞行器跟踪控制器。本发明采用预测矫正框架,基于LSTM方法进行预测和自适应动态规划结合设计控制器,能够在有限时域内确保选定的性能指标函数达到最优,得到最优反馈制导律,提高了控制器的自主性。

Description

一种空天往返飞行器闭环跟踪智能组合制导方法
技术领域
本发明属于空天往返飞行器闭环跟踪智能组合制导技术领域,具体涉及一种空天往返飞行器闭环跟踪智能组合制导方法。
背景技术
可重复使用运载器(RLV)是指能够自由往返于地球表面与空间轨道之间、具备多用途且可重复使用的飞行器,未来实现快速、可靠及廉价进出空间的必然趋势,也是当前航空航天领域的研究热点,由于RLV的再入段具有变速快,耦合性强,模型不确定性以及外部环境等因素,使得再入段控制***设计面临更大挑战,为了保证所控飞行器安全稳定地进行再入飞行,对于RLV再入段轨迹的优化与制导律的设计尤为关键,RLV再入轨迹优化的目标是在满足状态约束和控制量约束等条件的情况下,实现到达某个最优目标的飞行轨迹控制,与标准轨迹制导不同,预测校正制导方法不依赖于参考轨迹,而是在飞行过程中首先对飞行终点进行预测,并根据预测落点与期望终点的偏差来设计控制器,具有更高的灵活性和落点精度,且不依赖于再入初始状态,对初始再入扰动的抗干扰能力更强,日益成为各国研究的发展方向;
飞行器轨迹预测是智能飞行***中不可或缺的功能部件之一,在复杂的博弈环境中,***飞行器的轨迹将为后续机动决策提供参考方向,轨迹预测是指在已有信息的基础上,按照一定的规律或方法对未来时刻的轨迹进行估计;
从目前的研究来看,可以将现有的技术分为两类:运动学模型方法和基于数据的方法,其中前者的应用较为广泛,例如,2017年,哈尔滨工业大学的魏喜庆等针对高超声速飞行器的周期跳跃运动问题,提出了一种与Singer模型相结合的扩展卡尔曼滤波器进行状态估计,进一步递推目标运动轨迹,2018年,空军预警学院的张凯等学者通过对目标运动和飞行意图特征的构建,利用贝叶斯理论进行迭代推导飞行模型,随后,他们利用蒙特卡洛采样方法实现了轨迹预测,虽然,上述方法具有良好的可解释性,然而,有限的预测精度和较长的预测时间使得他们只能应用于某些特定场景。
综上,现有技术中的制导方不能够在有限时域内确保选定的性能指标函数达到最优,无法有效的得到最优反馈制导律,导致控制器的自主性较低。
发明内容
本发明的目的是提供一种空天往返飞行器闭环跟踪智能组合制导方法,采用预测矫正框架,基于LSTM方法进行预测和自适应动态规划结合设计控制器,能够在有限时域内确保选定的性能指标函数达到最优,得到最优反馈制导律,提高了控制器的自主性。
本发明采取的技术方案具体如下:
一种空天往返飞行器闭环跟踪智能组合制导方法,包括以下步骤:
S1:设计一个LSTM的飞行器轨迹预测算法;
S2:建立RLV再入段误差模型并转化约束控制问题;
S3:设计基于自适应动态规划的飞行器跟踪控制器。
进一步地,所述S1包括以下步骤:
S101:通过每一时间步***状态数据和距离终点的误差数据组合进行数据预处理操作搭建RLV轨迹预测问题的信息数据集和数据库;
S102:通过输入数据获得环境和***间的耦合信息,搭建LSTM网络进行状态预测,使用反向传播算法更新预测网络权值,得到***的预测状态模型,实现每一时间步的***状态轨迹的实时预测;
S103:在飞行过程中,利用得到的预测模型不断对飞行终点进行预测,并根据预测落点与期望终点的偏差作为控制误差,输入给控制器来调整控制量。
进一步地,所述S101中的数据预处理包括信息融合和特征提取。
进一步地,所述S101中信息数据集的建立方法包括以下步骤:
S10101:获取信息,依靠传感器,雷达等,获取随时间变化的飞行器的各个状态信息;
S10102:数据预处理,采用零均值标准化的预处理方法对数据进行预处理;
S10103:构建训练样本,将轨迹数据分解为训练样本和标签。
进一步地,所述构建训练样本包括以下步骤:
从数据集中第一个轨迹点开始,按时间顺序向下,选择前20个轨迹点的时间对应的飞行器状态信息来预测下一个轨迹点的状态信息,其中每一时间步的状态信息作为神经网络对应细胞的输入,选择分离间隔为1,从第二个轨迹点开始,用同样的方法选择训练样本。
进一步地,所述S102包括以下步骤:
S10201:将飞行器的状态误差信息作为输入,通过嵌入函数将输入数据映射到新的空间;
S10202:将飞行器的历史状态信息作为输入,将误差信息与飞行器历史的状态信息融合;
S10203:利用LSTM网络根据观测的历史状态信息和融合信息预测飞行器的未来轨迹;
S10204:通过样本数据构造预测模型,对训练样本和预测样本进行归一化处理,训练样本输入到网络模型中训练网络,根据损失大小调整网络结构,利用测试样本测试网络性能,得出预测结果。
进一步地,所述信息数据集为14维,包括飞行器当前状态和终点状态的状态差信息包括地心距信息差、经度信息差、纬度信息差、速度信息差、航迹角信息差、航向角信息差和倾侧角信。
进一步地,所述S2包括以下步骤:
建立RLV再入段误差模型,设计出一种同时反应编队误差,控制量和避碰作用的性能指标函数,通过安全障碍函数将场景下的避碰问题转换为约束问题,将避碰控制问题转换为误差***的稳定控制问题。
进一步地,所述S3包括以下步骤:
设计基于自适应动态规划的控制算法,构建评判网络去近似最优性能指标函数并求解最优控制策略,采用策略梯度法,对神经网络所有权值的范数进行更新,利用网络输出迭代,最终获得最优控制策略
进一步地,所述RLV的状态需要严格满足以下约束条件:
1).定义控制算法中飞行器状态量x,满足起点状态条件x0和终点状态条件xf
2).受飞行器性能影响,在再入过程中,定义控制量u满足约束umin≤u≤umax,状态量x满足约束xmin≤x≤xmax,其中umin表示控制量上界,umax表示控制量下界;其中xmin表示状态量上界,xmax表示状态量下界。
本发明取得的技术效果为:
本发明的一种空天往返飞行器闭环跟踪智能组合制导方法采用预测矫正框架,基于LSTM方法进行预测和自适应动态规划结合设计控制器,解决了传统动态规划控制算法的“维数灾”问题,通过学习对制导律不断迭代更新,最终在有限时域内确保选定的性能指标函数达到最优,得到最优反馈制导律,提高了控制器的自主性。
附图说明
图1是本发明的基于LSTM和自适应动态规划的空天往返飞行器闭环跟踪智能组合制导框图;
图2是本发明的LSTM的飞行器预测模型图;
图3是本发明的LSTM原理图;
图4是本发明的飞行器状态预测结果图;
图5是本发明的飞行器状态预测绝对百分比误差变化曲线图;
图6是本发明基于自适应动态规划的跟踪控制的状态变化曲线图;
图7是本发明基于自适应动态规划的跟踪控制的误差变化曲线图;
图8是本发明的飞行器评判神经网络权值变换曲线图;
图9是本发明的LSTM模型参数图;
图10是本发明的飞行器初始条件和终点约束图。
具体实施方式
为了使本发明的目的及优点更加清楚明白,以下结合实施例对本发明进行具体说明。应当理解,以下文字仅仅用以描述本发明的一种或几种具体的实施方式,并不对本发明具体请求的保护范围进行严格限定。
实施例1:
如图1所示,一种空天往返飞行器闭环跟踪智能组合制导方法,包括以下步骤:
S1:设计一个LSTM的飞行器轨迹预测算法;
如图2和图3所示,S1包括以下步骤:
S101:通过每一时间步***状态数据和距离终点的误差数据组合进行信息融合、特征提取等数据预处理操作搭建RLV轨迹预测问题的信息数据集和数据库;
为了给飞行器的控制器提供控制方向,首先需要预测在未来时间步的飞行器的状态,在开展飞行器的状态预测时,未来状态和飞行器历史状态信息以及飞行器当前状态和终点状态的状态差有关,所以预测要根据大量经验数据分析这些特征与未来行为的相关性来建立预测模型。
定义观测的时间步长为Tobs,预测的时间步长为Tpred,定义飞行器的历史状态轨迹为O={pt|t=1,2,…,Tobs},其中pt表示其在时间t处的飞行器的状态信息,包括:(1)地心距信息r,(2)经度信息θ,(3)纬度信息(4)速度信息θ,(5)航迹角信息γ,(6)航向角信息χ,(7)倾侧角信息σ;定义飞行器当前状态和终点状态的状态差集合为/>,飞行器真实的未来状态信息用Y={pt|t=Tobs+1,Tobs+2,…,Tobs+Tpred}表示。因此,轨迹预测问题可以描述为:
Y=fo(O,Oe) (1)
轨迹预测的目标是找到从集合O,Oe到集合Y的映射函数fo,使得该函数可以基于飞行器的历史轨迹预测其未来轨迹。
由于基于深度学习的预测方法需依据大量数据训练网络,首先,需要建立一个飞行器状态特征的信息数据集,可以分为以下3步:
S10101:获取信息部分:依靠传感器,雷达等,获取随时间变化的飞行器的各个状态信息,由上述方法仿真获得的数据集为14维,其中包含飞行器的状态特征信息(地心距信息、经度信息、纬度信息、速度信息、航迹角信息、航向角信息、倾侧角信息),以及飞行器当前状态和终点状态的状态差信息(地心距信息差、经度信息差、纬度信息差、速度信息差、航迹角信息差、航向角信息差、倾侧角信息差)。
S10102:数据预处理:由于飞行器不同状态特征信息的数据样本之间存在数量级差异,在训练网络时会导致量级较大的数据样本占据主导地位,导致收敛速度较慢和准确度较低,所以需要数据预处理。本发明采用零均值标准化的预处理方法,其计算公式如下:
式中,di是每一特征信息的原始样本数据,d′i是每一特征信息处理之后的样本数据,是每一特征信息的全部样本数据的均值,τi是每一特征信息的全部样本数据的标准差,其中i={1,2,...,14},代表数据集14个维度中的各个维度。即根据数据集14维中各维状态信息的均值和标准差,将所有数据样本这一维的原始数据变换为归一化的数据。处理将数据统一到特定区间,使得学习过程中不会因为不同数据样本信息差异太大导致学习速度慢和网络准确度低。
S10103:构建训练样本构建方法:轨迹预测是一个有监督的学习问题,需要将轨迹数据分解为训练样本和标签。从数据集中第一个轨迹点开始,按时间顺序向下,选择前20个轨迹点的时间对应的飞行器状态信息来预测下一个轨迹点的状态信息,其中每一时间步的状态信息作为神经网络对应细胞的输入。然后,为了保证样本在时间上的连续性,选择分离间隔为1,即从第二个轨迹点开始,用同样的方法选择训练样本。
S102:通过输入数据获得环境和***间的耦合信息,搭建LSTM网络进行状态预测,使用反向传播算法更新预测网络权值,得到***的预测状态模型,实现每一时间步的***状态轨迹的实时预测。
在得到数据集之后,本发明依据LSTM算法利用深度学习的机理学习映射关系,考虑飞行器状态信息的时序性,设计基于时间的反向传播算法,根据经验及离线实验确定网络训练过程中样本迭代次数、学习率等超参数,更新网络权值;最后,在实际在线预测过程中,采用训练好的飞行器状态预测网络,实现飞行器状态的实时在线预测,预测过程如图2-3所示。
首先,将包含飞行器状态和误差信息的数据输入到嵌入层提取误差信息,得到然后将飞行器的历史状态信息数据经数据处理层提取特征后与误差信息/>合并,合并后的数据作为LSTM层的输入,其输出即为飞行器的预测轨迹。
在此,S102包括以下步骤:
S10201:嵌入层:将飞行器的状态误差信息作为输入,通过嵌入函数φ(·)将输入数据映射到新的空间。它的数学表达式为:
式中,是飞行器在时间步t的预测状态误差信息。/>是在时间步t处飞行器的状态误差信息的空间表示,W1是嵌入函数的权重。其中,嵌入函数φ(·)的定义如下:
S10202:数据处理层:飞行器的历史状态信息pt作为输入,将误差信息与飞行器历史的状态信息融合,如下式:
式中,⊙表示矩阵的哈德曼积,W2是嵌入函数的权重。是飞行器在时间步t的预测状态信息。因此,融合信息qt既取决于飞行器的历史状态信息,也取决于飞行器状态距离终点的误差信息。
S10203:LSTM层:利用LSTM网络根据观测的历史状态信息和融合信息qt预测飞行器的未来轨迹,如下式所示:
式中,dpt表示在时刻t生成的飞行器状态的导数;W3是LSTM的网络权值;W4是嵌入函数的权重。ot和ht-1分别是LSTM的输出和隐藏状态,LSTM的输入为[qt,dpt-1]。这里dpt-1体现了数据信息的微分量,说明网络在预测过程中考虑了数据变化动态。LSTM网络结构如图3所示:
可以看出,LSTM网络在t时刻的输入不仅包含输入数据xt,还包含来自前一时刻的隐藏状态ht-1,xt和ht-1在遗忘门通过激活函数获得丢弃前一层隐藏细胞状态Ct-1的概率,与Ct-1的乘积成为组成t时刻细胞状态Ct的一部分;xt和ht-1在输入门通过激活函数确定t时刻细胞状态Ct需要更新的信息,此信息成为组成Ct的另一部分。因此,t时刻细胞状态Ct包含过去时刻的有用信息和当前时刻的新信息。最后,基于xt和ht-1以及细胞状态在输出门确定输出结果。因此,t时刻LSTM的输出考虑了过去时刻的有用信息和当前时刻的状态,这样的网络结构有利于学习时间序列数据之间的关系,提升了对时间序列预测问题的处理能力。
S10204:训练网络:预测模型首先在样本数据构造完成后,对训练样本和预测样本进行归一化处理。再把训练样本输入到网络模型中训练网络,根据损失大小调整网络结构。最后利用测试样本测试网络性能,得出预测结果。
网络训练过程采用均方差函数作为损失函数,即:
式中,n表示每一次训练过程批量样本的个数,是LSTM模型预测的飞行器的未来状态,Yk是其真实的未来状态。深度神经网络的优化目标是让MSE趋近于0。深度神经网络训练的过程即为网络权值更新的过程。根据上述损失函数,使用反向传播算法对网络的权值进行更新,最终通过权值更新获得预测结果。
最终各个状态的预测结果信息表示为(1)地心距信息rref,(2)经度信息θref,(3)纬度信息(4)速度信息θref,(5)航迹角信息γref,(6)航向角信息χref,(7)倾侧角信息σref
S103:在飞行过程中,利用得到的预测模型不断对飞行终点进行预测,并根据预测落点与期望终点的偏差作为控制误差,输入给控制器来调整控制量。
S2:建立RLV再入段误差模型并转化约束控制问题;
S2中建立RLV再入段误差模型并转化约束控制问题包括以下步骤:
建立RLV再入段误差模型,设计出一种同时反应编队误差,控制量和避碰作用的性能指标函数,通过安全障碍函数将场景下的避碰问题转换为约束问题,从而实现将避碰控制问题转换为误差***的最优稳定控制问题,保证***的安全性。
在RLV再入段,假设飞行器为无动力飞行的质点,考虑地球为旋转椭球时,忽略再入过程中侧力以及地球自转的影响,并取侧滑角为零。则RLV再入段动力学***为:
式中,r,θ,v,γ,χ分别代表地心距、经度、纬度、飞行速度、航迹角和航向角;σ为倾侧角;m为飞行器质量;g为重力加速度,有g=μg/r2,其中μg为引力参数;L为升力,有L=qdSCL;D为阻力,D=qdSCD,其中S为RLV气动参考面积,qd为动压,qd=0.5ρv2;ρ为大气密度,有/>其中ρ0为海平面处的大气密度,Re为地球半径,β为常值系数;升力系数CL和阻力系数CD表示为攻角α的函数,将在后续仿真中给出。
若仅针对现有控制量进行处理,会引入高频抖振并对问题的收敛性产生影响,因此需要引入新的控制变量。引入新的辅助控制变量从而实现控制量从状态量中解耦,令新的控制量为:
则RLV再入段动力学模型可改写为:
式中,为新的状态量。状态矩阵f(x')和控制矩阵B分别为:
B=[0,0,0,0,0,0,1]T
定义S1最后LSTM预测模型给出的下一步轨迹预测状态量为则飞行器状态和参考输入的误差***如下:
式中,e代表飞行器当前状态和目标的误差。
综合式,式和式,可得RLV再入段误差***:
为了保证飞行器的安全稳定飞行,需要保证飞行器的状态和控制量满足约束条件,保证***的安全性。基于此,本步将设计一个基于安全障碍函数的约束项,为后续性能指标函数中的约束需求提供基础。
为了保证飞行器的安全稳定飞行,RLV的状态需要严格满足一些约束条件:
1).定义控制算法中飞行器状态量x,满足起点状态条件x0和终点状态条件xf
2).受飞行器性能影响,在再入过程中,定义控制量u满足约束umin≤u≤umax,状态量x满足约束xmin≤x≤xmax,其中umin表示控制量上界,umax表示控制量下界;其中xmin表示状态量上界,xmax表示状态量下界。
针对飞行器的状态约束条件,飞行器状态安全域和状态障碍函数可以设计为:
安全域Dx
Dx={x∈Rn∣xmin≤x≤xmax} (14)
障碍函数μx
式中,当某一时刻飞行器的状态量在安全域Dx之外时,判断不满足约束条件,η为一个正实常数,满足η>1。
可以看出,μx是一个安全障碍函数,通过函数μx设计相关的性能指标函数,当某一时刻飞行器的状态量靠近安全域Dx的边界时,性能指标函数将会接近无穷大,则下一时刻控制器会朝着最小化性能指标函数的方向改变,所以的μx存在保证了***状态的安全性。
同理,针对飞行器的控制量约束条件,也开可以设计飞行器控制量的安全域和控制量障碍函数可以设计为:
安全域Du
Du={u∈Rn∣umin≤u≤umax} (16)
障碍函数μu
接下来,定义***的性能指标函数J为:
J=∫t U(e,u)dt (18)
式中,瞬时性能指标U(e,u)定义为:
U(e,u)=eTQe+uTRu+μxeTe+μuuTu (19)
式中,Q,R是正定的斜对称矩阵。
可以看出,性能指标函数由四部分组成:第一项eTQe代表飞行器状态误差代价,第二项uTRu代表飞行器控制量代价,第三项μxeTe代表飞行器的状态约束,第三项μuuTu代表飞行器的控制量约束。
则最优性能指标函数J*可以表示为:
为了实现RLV再入段误差***的平稳飞行和约束条件,控制的目标是找到一组能够最小化性能指标函数并且使***状态限制在安全域Dx,控制量限制在安全域Du的控制策略u,则以上控制问题可以写为:
S3:设计基于自适应动态规划的飞行器跟踪控制器;
S3中设计基于自适应动态规划的飞行器跟踪控制器包括以下步骤:
设计基于自适应动态规划的控制算法,构建评判网络去近似最优性能指标函数并求解最优控制策略,采用策略梯度法,对神经网络所有权值的范数进行更新,利用网络输出迭代,最终获得最优控制策略。
因为设计的性能指标函数连续可微时,可以得到如下的Lyapunov方程为:
式中表示性能指标函数J关于误差***e的偏导,且有J(0)=0。可定义问题的哈密顿方程为:
当性能指标函数为最优时,哈密顿方程将变成哈密顿-雅可比-贝尔曼方程,即
最优的性能指标函数J*通过求解上式的哈密顿-雅可比-贝尔曼方程获得,并且其有唯一解,当解J*存在且连续可微时,最优控制策略可通过求解得到,即令性能指标函数最小的飞行器控制策略为
为了处理哈密顿-雅可比-贝尔曼方程在实际应用过程中难以求解的问题,本发明利用单层评判神经网络逼近的原理来近似最优性能指标函数J*的值:
J*=Wc Tσc(e)+εc (26)
式中,Wc∈Rn是理想的评判神经网络权值向量,σc(e)∈Rn表示评判神经网络的激活函数,εc∈R代表评判神经网络的近似误差。对其求偏导可得:
式中,和/>分别表示激活函数和近似误差的偏导。将上式代入中,可得哈密顿方程为:
式中,ecH是评判神经网络近似产生的残余误差,在自适应动态规划的框架中,考虑到理想权重未知的事实,通常根据估计的权重向量建立评判神经网络来逼近最优性能指标函数,即有:
因此,近似哈密顿量可以如下所示:
定义权值估计误差/>此时有:
为了调整临界评判神经网络权重向量定义误差函数/>利用策略梯度法使得误差函数最小,因此评判神经网络权值调整规则设置为:
式中,αc>0是评判神经网络的学习速率。因此,理想的控制策略可以描述为:
其近似值表示为:
基于以上三步,就完成了整个基于LSTM和自适应动态规划的空天往返飞行器闭环跟踪智能组合制导的过程。
本技术方案采用预测矫正框架,基于LSTM方法进行预测和自适应动态规划结合设计控制器,解决了传统动态规划控制算法的“维数灾”问题,通过学习对制导律不断迭代更新,最终在有限时域内确保选定的性能指标函数达到最优,得到最优反馈制导律,提高了控制器的自主性。
实施例2:
本实施例中为了验证本发明提出的算法有效性,将算法在MATLAB/Simulink中进行集成设计,并进行了仿真实验,主要仿真过程如下:
LSTM预测模型和网络训练参数设置:
轨迹预测模型的配置如图9所示。其中,嵌入层网络的输入是飞行器的地心距信息r,经度信息θ,纬度信息速度信息θ,航迹角信息γ,航向角信息χ,倾侧角信息σ,以及和终态对应误差形成的14维信息,预测网络的输出是飞行器的未来的位置信息。
实验先离线用大量轨迹数据对预测网络进行训练,再在实际在线预测过程中,用训练好的模型预测轨迹,这样,所提出的预测模型需要更短的预测时间,保障了预测的实时性。实验使用历史的20个时间步长信息来预测未来信息,即Tobs=20,每次使用飞行器的整体状态信息的20*14向量作为输入,飞行器未来状态信息的Tpred*2*3维向量是输出。通过这种方式,利用飞行器轨迹数据形成42970*20*14个训练样本量n。LSTM模型随机选择80%的数据集进行训练,保留剩余20%的数据集用于测试,然后使用15%的训练集作为验证集,在训练期间验证和微调网络。算法采用单步轨迹预测进行了仿真实验,即Tpred=1,反向传播过程中学***滑插值处理。
自适应动态规划跟踪控制器参数设置:
RLV基础参数设置如下所示:飞行器质量m=104.305kg;引力参数μg=3.986×1014m3/s2;飞行器面积S=391.22m2;地球半径Re=6.37×103m,海平面大气密度ρ0=0.00238kg/m3;升力系数CL=-0.207+2.04α,阻力系数CD=0.0785-0.3529α。***常值系数β=1.3875×10-4,kQ=9.44×10-5。飞行器,制量约束飞行器初始条件和终点约束如图10所示,飞行器状态量约束:/>
神经网络激活函数为评判神经网络权值初值为Wc=[90,80,30,20,40,75,60,15]T,Q=R=I,η=1.5,神经,络的学习率为αc=0.5。
其中,图4展示,飞行器各个状态的预测结果随时间步变化曲线,从图4可以看出,预测模型针对飞行器的高度,速度,维度,经度,航迹角,航向角和倾侧角均实现了精确的状态预测,因此所设计的基于LSTM状态预测模型可以实现飞行器状态的准确观测。
其中,图5显示了飞行器状态预测和真实状态之间的绝对百分比误差变化曲线,从图5可以看出,在不同状态下预测的模型误差均在6%以下,验证了预测模型的准确性。
其中,如图6所示,显示的是飞行器在高度,速度,维度,经度,航迹角,航向角和倾侧角的状态变化曲线,由图可知,状态跟踪基本在500s左右形成,然后保持稳定的给跟踪飞行,验证了设计的基于自适应动态规划的跟踪控制算法的有效性和稳定性。
其中,图7显示了飞行器在高度,速度,维度,经度,航迹角,航向角和倾侧角的状态误差的变化曲线,由图可知,在500s左右之后,飞行器的状态误差逐渐收敛到0,进一步验证了设计的基于自适应动态规划的跟踪控制算法的有效性。
其中,图8表示飞行器评判神经网络权值参数的变化过程,由图8可知,随着时间变化,在有限时间内,评价神经网络权值参数是稳定收敛的,逼近于相应的最优值。
以上仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。本发明中未具体描述和解释说明的结构、装置以及操作方法,如无特别说明和限定,均按照本领域的常规手段进行实施。

Claims (7)

1.一种空天往返飞行器闭环跟踪智能组合制导方法,其特征在于:包括以下步骤:S1:设计一个LSTM的飞行器轨迹预测算法;
所述S1包括以下步骤:
S101:通过每一时间步***状态数据和距离终点的误差数据组合进行数据信息融合和特征提取,搭建RLV轨迹预测问题的信息数据集和数据库;
S102:通过输入数据获得环境和***间的耦合信息,搭建LSTM网络进行状态预测,使用反向传播算法更新预测网络权值,得到***的预测状态模型,实现每一时间步的***状态轨迹的实时预测;
S103:在飞行过程中,利用得到的预测模型不断对飞行终点进行预测,并根据预测落点与期望终点的偏差作为控制误差,输入给控制器来调整控制量;
S2:建立RLV再入段误差模型并转化约束控制问题;
S3:设计基于自适应动态规划的飞行器跟踪控制器;
所述S3包括以下步骤:
设计基于自适应动态规划的控制算法,构建评判网络去近似最优性能指标函数并求解最优控制策略,采用策略梯度法,对神经网络所有权值的范数进行更新,利用网络输出迭代,最终获得最优控制策略。
2.根据权利要求1所述的一种空天往返飞行器闭环跟踪智能组合制导方法,其特征在于:所述S101中信息数据集的建立方法包括以下步骤:
S10101:获取信息,依靠传感器和雷达获取随时间变化的飞行器的各个状态信息;
S10102:数据预处理,采用零均值标准化的预处理方法对数据进行预处理;
S10103:构建训练样本,将轨迹数据分解为训练样本和标签。
3.根据权利要求2所述的一种空天往返飞行器闭环跟踪智能组合制导方法,其特征在于:所述构建训练样本包括以下步骤:
从数据集中第一个轨迹点开始,按时间顺序向下,选择前20个轨迹点的时间对应的飞行器状态信息来预测下一个轨迹点的状态信息,其中每一时间步的状态信息作为神经网络对应细胞的输入,选择分离间隔为1,从第二个轨迹点开始,用同样的方法选择训练样本。
4.根据权利要求1所述的一种空天往返飞行器闭环跟踪智能组合制导方法,其特征在于:所述S102包括以下步骤:
S10201:将飞行器的状态误差信息作为输入,通过嵌入函数将输入数据映射到新的空间;
S10202:将飞行器的历史状态信息作为输入,将误差信息与飞行器的历史状态信息融合;
S10203:利用LSTM网络根据观测的历史状态信息和融合信息预测飞行器的未来轨迹;
S10204:通过样本数据构造预测模型,对训练样本和预测样本进行归一化处理,训练样本输入到网络模型中训练网络,根据损失大小调整网络结构,利用测试样本测试网络性能,得出预测结果。
5.根据权利要求1所述的一种空天往返飞行器闭环跟踪智能组合制导方法,其特征在于:所述信息数据集为14维,所述信息数据集包括飞行器的状态特征信息以及飞行器当前状态和终点状态的状态差信息,所述飞行器的状态特征信息包括地心距信息、经度信息、纬度信息、速度信息、航迹角信息、航向角信息和倾侧角信息,所述飞行器当前状态和终点状态的状态差信息包括地心距信息差、经度信息差、纬度信息差、速度信息差、航迹角信息差、航向角信息差和倾侧角信息差。
6.根据权利要求1所述的一种空天往返飞行器闭环跟踪智能组合制导方法,其特征在于:所述S2包括以下步骤:
建立RLV再入段误差模型,设计出一种同时反应编队误差,控制量和避碰作用的性能指标函数,通过安全障碍函数将场景下的避碰问题转换为约束问题,将避碰控制问题转换为误差***的稳定控制问题。
7.根据权利要求1所述的一种空天往返飞行器闭环跟踪智能组合制导方法,其特征在于:所述RLV的状态需要严格满足以下约束条件:1).定义控制算法中飞行器状态量满足起点状态条件/>和终点状态条件/>2).受飞行器性能影响,在再入过程中,定义控制量/>满足约束/>状态量/>满足约束/>其中/>表示控制量上界,/>表示控制量下界;其中/>表示状态量上界,/>表示状态量下界。
CN202311463606.4A 2023-11-06 2023-11-06 一种空天往返飞行器闭环跟踪智能组合制导方法 Active CN117311390B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311463606.4A CN117311390B (zh) 2023-11-06 2023-11-06 一种空天往返飞行器闭环跟踪智能组合制导方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311463606.4A CN117311390B (zh) 2023-11-06 2023-11-06 一种空天往返飞行器闭环跟踪智能组合制导方法

Publications (2)

Publication Number Publication Date
CN117311390A CN117311390A (zh) 2023-12-29
CN117311390B true CN117311390B (zh) 2024-03-19

Family

ID=89297413

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311463606.4A Active CN117311390B (zh) 2023-11-06 2023-11-06 一种空天往返飞行器闭环跟踪智能组合制导方法

Country Status (1)

Country Link
CN (1) CN117311390B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110908396A (zh) * 2019-11-28 2020-03-24 天津大学 可重复使用运载器全阶段再入返回制导方法
CN111351488A (zh) * 2020-03-03 2020-06-30 南京航空航天大学 飞行器智能轨迹重构再入制导方法
CN112114521A (zh) * 2020-07-30 2020-12-22 南京航空航天大学 航天器智能预测控制进入制导方法
CN114510067A (zh) * 2022-01-28 2022-05-17 北京航空航天大学 一种可重复使用飞行器近似最优制导方法
EP4261492A1 (de) * 2022-04-13 2023-10-18 Diehl Defence GmbH & Co. KG Verfahren zur midcourse-lenkung eines im schub steuerbaren flugkörpers

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190184561A1 (en) * 2017-12-15 2019-06-20 The Regents Of The University Of California Machine Learning based Fixed-Time Optimal Path Generation

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110908396A (zh) * 2019-11-28 2020-03-24 天津大学 可重复使用运载器全阶段再入返回制导方法
CN111351488A (zh) * 2020-03-03 2020-06-30 南京航空航天大学 飞行器智能轨迹重构再入制导方法
CN112114521A (zh) * 2020-07-30 2020-12-22 南京航空航天大学 航天器智能预测控制进入制导方法
CN114510067A (zh) * 2022-01-28 2022-05-17 北京航空航天大学 一种可重复使用飞行器近似最优制导方法
EP4261492A1 (de) * 2022-04-13 2023-10-18 Diehl Defence GmbH & Co. KG Verfahren zur midcourse-lenkung eines im schub steuerbaren flugkörpers

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
空天飞行器再入制导的预测控制;方炜等;宇航学报;20061130;第27卷(第6期);第1216-1222页 *

Also Published As

Publication number Publication date
CN117311390A (zh) 2023-12-29

Similar Documents

Publication Publication Date Title
Williams et al. Information-theoretic model predictive control: Theory and applications to autonomous driving
Wang et al. Multivariate regression-based fault detection and recovery of UAV flight data
Tang et al. An improved kinematic model predictive control for high-speed path tracking of autonomous vehicles
Cesari et al. Scenario model predictive control for lane change assistance and autonomous driving on highways
CN107563044B (zh) 基于在线安全学习的四旋翼无人机路径跟踪控制方法
Zhang et al. Trajectory generation by chance-constrained nonlinear MPC with probabilistic prediction
CN109885883A (zh) 一种基于gk聚类算法模型预测的无人车横向运动的控制方法
Horn et al. Neural network-based trajectory optimization for unmanned aerial vehicles
Lin et al. A gated recurrent unit-based particle filter for unmanned underwater vehicle state estimation
Wu et al. Learning-based fixed-wing UAV reactive maneuver control for obstacle avoidance
Jiang et al. Implementation of human-like driver model based on recurrent neural networks
Amirkhani et al. Interval type-2 fuzzy cognitive map-based flight control system for quadcopters
Nakamura-Zimmerer et al. Neural network optimal feedback control with guaranteed local stability
Hou et al. A small UAV tracking algorithm based on AIMM-UKF
Jardine et al. Adaptive MPC using a dual fast orthogonal Kalman filter: Application to quadcopter altitude control
CN117311390B (zh) 一种空天往返飞行器闭环跟踪智能组合制导方法
Guan et al. A new integrated navigation system for the indoor unmanned aerial vehicles (UAVs) based on the neural network predictive compensation
CN112161626B (zh) 一种基于航路跟踪映射网络的高可飞性航路规划方法
Wei et al. Multi-sensor environmental perception and adaptive cruise control of intelligent vehicles using kalman filter
Gao et al. Adaptive air-data estimation in wind disturbance based on flight data
Yuqi et al. Time-varying parameters estimation with adaptive neural network EKF for missile-dual control system
Hu et al. Neural network-based robust control for hypersonic flight vehicle with uncertainty modelling
Cho et al. Adaptive dynamic surface control based on neural network for missile autopilot
Ghosh Roy et al. Longitudinal aircraft parameter estimation using neuro-fuzzy and genetic algorithm based method
Li et al. Re-entry guidance method based on decoupling control variables and waypoint

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant