CN111596677B - 一种基于在线学习的航天器临近操作自主控制方法及*** - Google Patents

一种基于在线学习的航天器临近操作自主控制方法及*** Download PDF

Info

Publication number
CN111596677B
CN111596677B CN202010375578.0A CN202010375578A CN111596677B CN 111596677 B CN111596677 B CN 111596677B CN 202010375578 A CN202010375578 A CN 202010375578A CN 111596677 B CN111596677 B CN 111596677B
Authority
CN
China
Prior art keywords
spacecraft
dual
constraint
pose
online
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010375578.0A
Other languages
English (en)
Other versions
CN111596677A (zh
Inventor
胡庆雷
杨昊旸
郑建英
郭雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN202010375578.0A priority Critical patent/CN111596677B/zh
Publication of CN111596677A publication Critical patent/CN111596677A/zh
Application granted granted Critical
Publication of CN111596677B publication Critical patent/CN111596677B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0265Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/0088Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots characterized by the autonomous decision making process, e.g. artificial intelligence, predefined behaviours
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/10Simultaneous control of position or course in three dimensions

Landscapes

  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Automation & Control Theory (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Remote Sensing (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)

Abstract

本发明涉及一种基于在线学习的航天器临近操作自主控制方法及***,针对航天器在近临近操作任务中所存在的视线场约束、接近走廊约束以及控制性能实时在线优化等实际工程问题,提出一种基于在线学习的临近操作自主控制技术的方法;本发明包括以下步骤:首先,基于对偶四元数建立航天器的位姿一体化动力学模型,并利用对偶四元数将位姿运动约束刻画为不等式形式;其次,面向航天器临近操作自主控制的任务需求,基于对偶四元数的性质设计在线学习控制的回报函数。最后,在对偶四元数的框架下,设计在线学习方法,使得控制器能从一个简单的控制策略,利用在线数据逐步提升为一个次优控制器,以提升航天器的任务执行能力。

Description

一种基于在线学习的航天器临近操作自主控制方法及***
技术领域
本发明涉及一种基于在线学习的航天器临近操作自主控制方法及***,主要应用于航天器交会对接、在轨补给维护、协同配合等任务,属于航天器控制技术领域。
背景技术
随着航天技术的高速发展,航天器在轨任务的多样性和复杂性日益提高,任务载体逐渐由单集成大航天器***向多航天器***扩展,任务类型也由传统的观测、通讯等基本任务,衍生出了以航天器临近操作问题为代表的新兴在轨任务。航天器临近操作控制技术衍生于交会对接、在轨维护补给等在内的重要任务场景。由于飞行安全、载荷特性和任务需求等因素,在轨航天器经常需要满足各类运动约束。一方面,由于任务中的目标航天器有的具有一些外张型载荷,出于安全考虑,追踪星的运动轨迹一般会被限制在一个以对接口为轴心的锥形区域内,这一运动约束常被称为接近走廊约束。另一方面,为完成交会对接任务,追踪星需要具备实时测量其与目标星间的相对运动状态的能力。但是,由于这类光学载荷通常只具有有限的视场范围,追踪航天器的姿态需要被有效控制以使得目标星一直处于这个有限视场内,称之为视场约束。另外,考虑到航天器携带燃料有限,任务的时效性等因素,航天器的运动控制具有时效和经济的综合最优效应也是未来航天器控制***设计中的一个非常关键因素。所以研究在位姿约束条件下的航天器的控制性能优化问题就显得尤为重要。
在国内外的相关研究中,解决此类任务相关的问题主要立足于两个方面,一方面是基于人工势能函数的运动控制,另一方面是基于求解最优问题的进行路径的运动轨迹设计。前者虽然能很好的解决在运动过程中的轨迹规避问题,但是其缺乏优化性能指标的功能。后者虽然能兼顾约束规避和控制性能的优化,然而求解优化问题需要的时效都不能满足航天任务的需求。因此,现有的航天器临近操作自主控制方法存在难以保证同时保证运动约束性能优化以及计算时效的情况。
发明内容
本发明的目的在于解决航天器临近操作自主控制任务中由于光学载荷以及航天器本体结构造成的六自由度运动约束问题,本发明提供一种基于在线学习的航天器临近操作自主控制方法及设备,通过设计与任务功能相关的回报函数,并利用在线数据设计控制器的实时学习律,解决了航天器临近操作任务中的六自由度运动约束问题,在保证满足运动约束的条件下,通过实时学习自主改进优化控制器的性能,提升了控制***的航天器控制***的任务执行能力。
本发明提供一种基于在线学习的航天器临近操作自主控制方法,(1)根据航天器临近操作任务的位姿动力学特性基于对偶四元数建立动力学模型,并在对偶四元数的框架下刻画临近操作任务中的位姿运动学约束;
(2)根据航天器临近操作任务的需求设计相应的在线学习中的回报函数;
(3)根据(1)的动力学模型和(2)中的回报函数基于对偶四元数框架设计利用在线数据设计学习控制方法。
具体实现步骤如下:
第一步建立航天器临近操作任务的位姿动力学模型如下:
Figure BDA0002479890380000021
Figure BDA0002479890380000022
其中,
Figure BDA0002479890380000023
表示被控航天器与目标航天器的相对位姿,
Figure BDA0002479890380000024
为其相对时间的导数,
Figure BDA0002479890380000025
为对偶四元数的集合,
Figure BDA0002479890380000026
为对偶四元数乘法,被控航天器与目标航天器的相对对偶角速度、被控航天器相对于惯性参考系的对偶角速度以及目标航天器相对于惯性参考系的对偶角速度分别表述为
Figure BDA0002479890380000027
Figure BDA0002479890380000028
Figure BDA0002479890380000029
相对时间的导数,
Figure BDA00024798903800000210
表示由力fb和力矩τb组成的对偶控制输入,
Figure BDA00024798903800000211
表示对偶惯量矩阵由转动惯量Jb和质量组成mb,I3为三阶单位矩阵,ε为对偶单元其满足性质ε≠0,ε2=0。上式中
Figure BDA00024798903800000212
基于对偶四元数的性质刻画接近走廊约束和视线场约束。由于任务中的目标航天器有时具有较大的空间规模和一些外张型载荷,故出于安全考虑,追踪星的运动轨迹通常被限制在一个以对接口为轴心的圆锥包络内。可以通过对偶四元数的形式刻画为:
Figure BDA00024798903800000213
式中,
Figure BDA00024798903800000214
cpath表示目标航天器对接口方向的单位方向向量,
Figure BDA00024798903800000215
表示关于cpath的叉乘矩阵,θ表示约束轴心包络圆锥的半锥角,o表示对偶数的内积运算。另外,由于任务中的被控航天器上搭载由测量相对位姿的导航载荷,其姿态需要被有效控制以使得目标航天器一直处于这个圆锥视场内,这类约束可被称为视线场约束,具体可以通过对偶数四元数的形式刻画为:
Figure BDA0002479890380000031
式中,
Figure BDA0002479890380000032
csight表示被控航天器载荷方向的单位方向向量,
Figure BDA0002479890380000033
表示关于csight的叉乘矩阵,α表示约束载荷视线场约束圆锥的半锥角。
第二步,设计航天器临近操作任务的回报函数。在航天器临近操作任务中,控制的最终目标是使得被控航天器到达期望的位置和姿态,所以期望状态回报函数可以设计为:
Figure BDA0002479890380000034
其中,
Figure BDA0002479890380000035
表示单位对偶四元数,
Figure BDA0002479890380000036
Qq和Qω分别表示位姿和速度的权重矩阵。在航天器临近操作任务中的约束即为被控航天器不期望达到的位置和姿态。在此,位置约束回报函数设计为:
Figure BDA0002479890380000037
式中,c1为第一步中的接近走廊约束不等式左侧部分,β1为位置约束权重因子。类似的,姿态约束回报函数设计为:
Figure BDA0002479890380000038
式中,c2为第一步中的视线场约束不等式左侧部分,β2为姿态约束权重因子。综上所述,总的回报函数设计为:
γ=γstatepathsight
基于上式所设计的回报函数,可以对航天器的自主控制的结果给与相应的回报,以满足航天器临近操作任务的需求。
第三步,设计基于在线学习的航天器临近操作自主控制方法,在线学习控制策略设计如下:
(1)所设计的控制器为:
Figure BDA0002479890380000041
其中,
Figure BDA0002479890380000042
航天器的运动状态可以集成表示为
Figure BDA0002479890380000043
Figure BDA0002479890380000044
表示基底函数,west表示对应的估计权重向量,
Figure BDA0002479890380000045
表示关于对偶向量
Figure BDA0002479890380000046
的偏导数运算。
(2)控制器中权重向量的学习律为:
Figure BDA0002479890380000047
其中,μ1和μ2为大于零系数,tk1和tk2为采样时间节点,
Figure BDA0002479890380000048
为贝尔曼误差,
Figure BDA0002479890380000049
为最佳权重向量w与估计权重向量之差,
Figure BDA00024798903800000410
Figure BDA00024798903800000411
辅助变量用于在线数据的采集,具体设计为:
Ψ(t,tk2,tk1)=ψ1(tk2,tk1)west2(tk2tk1)
其中,学习辅助变量ψ1(t,tk1),ψ2(t,tk1)分别设计为,
Figure BDA00024798903800000412
Figure BDA00024798903800000413
式中,k>0为调节参数,tk1和tk2为学习时间节点,其关系应满足
Figure BDA00024798903800000414
利用以上步骤可以实现约束条件下在实时学习的控制器设计,可以保证航天器在临近操作任务中运动轨迹安全的前提下根据在线数据实时提升航天器的控制性能。
本发明还提供一种基于在线学习的航天器临近操作自主控制***,包括评判网络、回报网络、学习器、控制器以及航天器相对位姿动力学模型,使用基于在线学习的航天器临近操作自主控制方法,航天器由控制器执行控制任务,并由评判网络和回报网络采集数据对控制性能进行评估,同时学习器通过评估结果进行网络权重的实时学习,将控制参数更新到控制器中,实现在线性能提升。
本发明是一种基于在线学习的航天器临近操作自主控制方法,与现有技术相比的优点在于:
(1)基于对偶四元数的汇报函数设计,实现了航天器临近操作过程中位置和姿态的运动规避,保证了任务的安全执行。
(2)与基于人工势能函数的方法相比,本方案使用基于在线学习控制的方法不仅能够实现约束区域的规避,还能有效地提升了控制性能,提升了控制***的经济性以及任务执行力。
(3)与基于求解优化问题的方法相比,本方法的实现是在线实时的,通过实时采集数据并更新控制器的权重参数,实现控制器的在线学***台的需求,具有很强的可实现性。
附图说明
图1为基于在线学习的航天器临近操作自主控制***原理框图;
图2为本发明的一种基于在线学习的航天器临近操作自主控制方法流程框图;
具体实施方式
图1为本发明所述的基于在线学习的航天器临近操作自主控制***原理框图,上述***由评判网络、回报网络、学习器、控制器以及航天器相对位姿动力学模型几部分组成。首先,航天器由初始控制器执行控制任务,并由评判网络和回报网络采集数据对控制性能进行评估,同时学习器通过评估结果进行网络权重的实时学习,将控制参数更新到控制器中,以实现在线性能提升。
如图2所示,本发明的一种基于在线学习的航天器临近操作自主控制方法步骤为:首先建立考虑位姿运动约束的航天器临近操作任务的位姿动力学模型;然后针对任务需求,进行回报函数的设计;最后进行控制器的设计以及在线学习律的设计;具体实施步骤如下:
第一步建立航天器临近操作任务的位姿动力学模型如下:
Figure BDA0002479890380000051
Figure BDA0002479890380000052
其中,
Figure BDA0002479890380000053
表示被控航天器与目标航天器的相对位姿,
Figure BDA0002479890380000054
为其相对时间的导数,
Figure BDA0002479890380000055
为对偶四元数的集合,
Figure BDA0002479890380000056
为对偶四元数乘法,对偶惯量矩阵设为
Figure BDA0002479890380000057
被控航天器与目标航天器的相对对偶角速度、被控航天器相对于惯性参考系的对偶角速度以及目标航天器相对于惯性参考系的对偶角速度分别表述为
Figure BDA0002479890380000058
Figure BDA0002479890380000059
Figure BDA00024798903800000510
相对时间的导数,
Figure BDA00024798903800000511
表示由力fb和力矩τb组成的对偶控制输入mb,I3为三阶单位矩阵,ε为对偶单元其满足性质ε≠0,ε2=0,上式中
Figure BDA0002479890380000061
被控航天器和目标航天器的对偶角速度的初值分别为
Figure BDA0002479890380000062
相对位姿的初值选为
Figure BDA0002479890380000063
基于对偶四元数的性质刻画接近走廊约束和视线场约束。由于任务中的目标航天器有时具有较大的空间规模和一些外张型载荷,故出于安全考虑,追踪星的运动轨迹通常被限制在一个以对接口为轴心的圆锥包络内。可以通过对偶四元数的形式刻画为:
Figure BDA0002479890380000064
式中,
Figure BDA0002479890380000065
cpath表示目标航天器对接口方向的单位方向向量,设置值为[1 0 0]T
Figure BDA0002479890380000066
表示关于cpath的叉乘矩阵,θ表示约束轴心包络圆锥的半锥角,设置值为30deg,o表示对偶数的内积运算。另外,由于任务中的被控航天器上搭载由测量相对位姿的导航载荷,其姿态需要被有效控制以使得目标航天器一直处于这个圆锥视场内,这类约束可被称为视线场约束,具体可以通过对偶数四元数的形式刻画为:
Figure BDA0002479890380000067
式中,
Figure BDA0002479890380000068
csight表示被控航天器载荷方向的单位方向向量,设置值为[-1 0 0]T
Figure BDA0002479890380000069
表示关于csight的叉乘矩阵,α表示约束载荷视线场约束圆锥的半锥角,设置值为30deg。
第二步,设计航天器临近操作任务的回报函数。在航天器临近操作任务中,控制的最终目标是使得被控航天器到达期望的位置和姿态,所以期望状态回报函数可以设计为:
Figure BDA00024798903800000610
其中,
Figure BDA00024798903800000611
表示单位对偶四元数,
Figure BDA00024798903800000612
Qq和Qω分别表示位姿和速度的权重矩阵,设置值分别为Qq=0.1I4和Qω=2I4。在航天器临近操作任务中的约束即为被控航天器不期望达到的位置和姿态。在此,位置约束回报函数设计为:
Figure BDA0002479890380000071
式中,c1为第一步中的接近走廊约束不等式左侧部分,β1为位置约束权重因子,设置值为10。类似的,姿态约束回报函数设计为:
Figure BDA0002479890380000072
式中,c2为第一步中的视线场约束不等式左侧部分,β2为姿态约束权重因子,设置值为10。综上所述,总的回报函数可以设计为:
γ=γstatepathsight
基于上式所设计的回报函数,可以对航天器的自主控制的结果给与相应的回报,以满足航天器临近操作任务的需求。
第三步,设计基于在线学习的航天器临近操作自主控制方法,在线学习控制策略设计如下:
(1)所设计的控制器为:
Figure BDA0002479890380000073
其中,
Figure BDA0002479890380000074
航天器的运动状态可以集成表示为
Figure BDA0002479890380000075
Figure BDA0002479890380000076
表示基底函数,设计为
Figure BDA0002479890380000077
west表示对应的估计权重向量初始值选为west(0)=[0.2,0.2,0.2,5,5,5]T
Figure BDA0002479890380000078
表示关于对偶向量
Figure BDA0002479890380000079
的偏导数运算。
(2)控制器中权重向量的学习律为:
Figure BDA00024798903800000710
其中,μ1和μ2为大于零系数,tk1=0和tk2=2为采样时间节点,
Figure BDA00024798903800000711
为贝尔曼误差,
Figure BDA00024798903800000712
为最佳权重向量w与估计权重向量之差,
Figure BDA00024798903800000713
Figure BDA00024798903800000714
辅助变量用于在线数据的采集,具体设计为:
Ψ(t,tk2,tk1)=ψ1(tk2,tk1)west2(tk2tk1)
其中,学习辅助变量ψ1(t,tk1),ψ2(t,tk1)分别设计为,
Figure BDA0002479890380000081
Figure BDA0002479890380000082
式中,k>0为调节参数,tk1和tk2为学习时间节点,其关系应满足
Figure BDA0002479890380000083
利用以上步骤可以实现约束条件下在实时学习的控制器设计,可以保证航天器在临近操作任务中运动轨迹安全的前提下根据在线数据实时提升航天器的控制性能。
本发明说明书中未作详细描述的内容属于本领域专业技术人员公知的现有技术。

Claims (2)

1.一种基于在线学习的航天器临近操作自主控制方法,其特征在于,包括以下步骤:
(1)根据航天器临近操作任务的位姿动力学特性基于对偶四元数建立动力学模型,并在对偶四元数的框架下刻画临近操作任务中的位姿运动学约束;
(2)根据航天器临近操作任务的需求设计相应的在线学习中的回报函数;
(3)根据步骤(1)的动力学模型和步骤(2)中的回报函数基于对偶四元数框架设计利用在线数据设计学习控制方法;
建立步骤(1)中航天器临近操作任务的位姿动力学模型为:
Figure FDA0003309592940000011
Figure FDA0003309592940000012
其中,
Figure FDA0003309592940000013
表示被控航天器与目标航天器的相对位姿,
Figure FDA0003309592940000014
Figure FDA0003309592940000015
相对时间的导数,
Figure FDA0003309592940000016
为对偶四元数的集合,
Figure FDA0003309592940000017
为对偶四元数乘法,被控航天器与目标航天器的相对对偶角速度、被控航天器相对于惯性参考系的对偶角速度以及目标航天器相对于惯性参考系的对偶角速度分别表述为
Figure FDA0003309592940000018
Figure FDA0003309592940000019
Figure FDA00033095929400000110
Figure FDA00033095929400000111
Figure FDA00033095929400000112
相对时间的导数,
Figure FDA00033095929400000113
表示由力fb和力矩τb组成的对偶控制输入,
Figure FDA00033095929400000114
表示对偶惯量矩阵由转动惯量Jb和质量mb组成,I3为三阶单位矩阵,ε为对偶单元其满足性质ε≠0,ε2=0,上式中
Figure FDA00033095929400000115
步骤(1)中所述的临近操作任务中的位姿运动学约束具体包括接近走廊约束和视线场约束;
所述接近走廊约束是指由于任务中的目标航天器有时具有较大的空间规模和一些外张型载荷,出于安全考虑,被控航天器的运动轨迹通常被限制在一个以对接口为轴心的圆锥包络内,通过对偶四元数的形式刻画为:
Figure FDA00033095929400000116
式中,
Figure FDA00033095929400000117
cpath表示目标航天器对接口方向的单位方向向量,
Figure FDA00033095929400000118
表示关于cpath的叉乘矩阵,θ表示约束轴心包络圆锥的半锥角,
Figure FDA00033095929400000119
表示对偶数的内积运算;
所述视线场约束是指任务中的被控航天器上搭载有测量相对位姿的导航载荷,被控航天器姿态需要被有效控制以使得目标航天器一直处于这个圆锥视场内,其姿态通过对偶数四元数的形式刻画为:
Figure FDA0003309592940000021
式中,
Figure FDA0003309592940000022
csight表示被控航天器载荷方向的单位方向向量,
Figure FDA0003309592940000023
表示关于csight的叉乘矩阵,α表示约束载荷视线场约束圆锥的半锥角;
所述步骤(2)中,航天器临近操作任务的回报函数具体设计为期望状态回报函数、姿态约束回报函数以及位置约束回报函数三个部分;回报函数设计的基本思想是:对期望运动状态给予高回报,对不期望的运动状态给予低回报,在航天器临近操作任务中,控制的最终目标是使得被控航天器到达期望的位置和姿态;所述期望状态回报函数为:
Figure FDA0003309592940000024
其中,
Figure FDA0003309592940000025
表示单位对偶四元数,
Figure FDA0003309592940000026
Qq和Qω分别表示位姿和速度的权重矩阵;
所述位置约束回报函数为:
Figure FDA0003309592940000027
式中,c1为接近走廊约束不等式左侧部分,β1为位置约束权重因子;
所述姿态约束回报函数为:
Figure FDA0003309592940000028
式中,c2为视线场约束不等式左侧部分,β2为姿态约束权重因子;
总的回报函数为:
γ=γstatepathsight
基于上式的回报函数,可以对航天器的自主控制的结果给与相应的回报,以满足航天器临近操作任务的需求;
所述步骤(3)中,在线学习控制策略如下:
(1)所设计的控制器为:
Figure FDA0003309592940000029
其中,
Figure FDA0003309592940000031
航天器的运动状态可以集成表示为
Figure FDA0003309592940000032
Figure FDA0003309592940000033
表示基底函数,west表示对应的估计权重向量,
Figure FDA0003309592940000034
表示关于对偶向量
Figure FDA0003309592940000035
的偏导数运算;
(2)控制器中权重向量的学习律为:
Figure FDA0003309592940000036
其中,μ1和μ2为大于零系数,tk1和tk2为采样时间节点,
Figure FDA0003309592940000037
为贝尔曼误差,
Figure FDA0003309592940000038
为最佳权重向量w与估计权重向量之差,
Figure FDA0003309592940000039
Figure FDA00033095929400000310
辅助变量用于在线数据的采集,设计为:
Ψ(t,tk2,tk1)=ψ1(t,tk1)west2(t,tk1)
其中,学习辅助变量ψ1(t,tk1),ψ2(t,tk1)分别设计为,
Figure FDA00033095929400000311
Figure FDA00033095929400000312
式中,k>0为调节参数,tk1和tk2为学习时间节点,其关系应满足
Figure FDA00033095929400000313
2.一种基于在线学习的航天器临近操作自主控制***,其特征在于:包括评判网络、回报网络、学习器、控制器以及航天器相对位姿动力学模型,使用权利要求1所述的方法,航天器由控制器执行控制任务,并由评判网络和回报网络采集数据对控制性能进行评估,同时学习器通过评估结果进行网络权重的实时学习,将控制参数更新到控制器中,实现在线性能提升。
CN202010375578.0A 2020-05-07 2020-05-07 一种基于在线学习的航天器临近操作自主控制方法及*** Active CN111596677B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010375578.0A CN111596677B (zh) 2020-05-07 2020-05-07 一种基于在线学习的航天器临近操作自主控制方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010375578.0A CN111596677B (zh) 2020-05-07 2020-05-07 一种基于在线学习的航天器临近操作自主控制方法及***

Publications (2)

Publication Number Publication Date
CN111596677A CN111596677A (zh) 2020-08-28
CN111596677B true CN111596677B (zh) 2021-11-30

Family

ID=72185223

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010375578.0A Active CN111596677B (zh) 2020-05-07 2020-05-07 一种基于在线学习的航天器临近操作自主控制方法及***

Country Status (1)

Country Link
CN (1) CN111596677B (zh)

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105512391A (zh) * 2015-12-04 2016-04-20 上海新跃仪表厂 基于对偶四元数的多星姿轨动力学建模方法及其验证***
CN106814746A (zh) * 2017-03-24 2017-06-09 哈尔滨工业大学 一种航天器姿轨一体化反步跟踪控制方法
CN108674695A (zh) * 2018-07-19 2018-10-19 北京空间技术研制试验中心 航天器再入返回轨道规划方法
CN109164821A (zh) * 2018-09-26 2019-01-08 中科物栖(北京)科技有限责任公司 一种无人机姿态训练方法及装置
CN109284530A (zh) * 2018-08-02 2019-01-29 西北工业大学 基于深度学习的空间非合作目标姿轨一体化参数估计方法
WO2019030949A1 (en) * 2017-08-10 2019-02-14 Mitsubishi Electric Corporation SPACE VEHICLE AND CONTROL SYSTEM FOR CONTROLLING THE OPERATION OF A SPATIAL VEHICLE
CN109343341A (zh) * 2018-11-21 2019-02-15 北京航天自动控制研究所 一种基于深度强化学习的运载火箭垂直回收智能控制方法
CN109760046A (zh) * 2018-12-27 2019-05-17 西北工业大学 基于强化学习的空间机器人捕获翻滚目标运动规划方法
CN110850719A (zh) * 2019-11-26 2020-02-28 北京航空航天大学 一种基于强化学习的空间非合作目标参数自整定追踪方法
CN110874578A (zh) * 2019-11-15 2020-03-10 北京航空航天大学青岛研究院 一种基于强化学习的无人机视角车辆识别追踪方法
CN111027143A (zh) * 2019-12-18 2020-04-17 四川大学 一种基于深度强化学习的舰载机进近引导方法
CN111026157A (zh) * 2019-12-18 2020-04-17 四川大学 一种基于奖励重塑强化学习的飞行器智能引导方法

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105512391A (zh) * 2015-12-04 2016-04-20 上海新跃仪表厂 基于对偶四元数的多星姿轨动力学建模方法及其验证***
CN106814746A (zh) * 2017-03-24 2017-06-09 哈尔滨工业大学 一种航天器姿轨一体化反步跟踪控制方法
WO2019030949A1 (en) * 2017-08-10 2019-02-14 Mitsubishi Electric Corporation SPACE VEHICLE AND CONTROL SYSTEM FOR CONTROLLING THE OPERATION OF A SPATIAL VEHICLE
CN108674695A (zh) * 2018-07-19 2018-10-19 北京空间技术研制试验中心 航天器再入返回轨道规划方法
CN109284530A (zh) * 2018-08-02 2019-01-29 西北工业大学 基于深度学习的空间非合作目标姿轨一体化参数估计方法
CN109164821A (zh) * 2018-09-26 2019-01-08 中科物栖(北京)科技有限责任公司 一种无人机姿态训练方法及装置
CN109343341A (zh) * 2018-11-21 2019-02-15 北京航天自动控制研究所 一种基于深度强化学习的运载火箭垂直回收智能控制方法
CN109760046A (zh) * 2018-12-27 2019-05-17 西北工业大学 基于强化学习的空间机器人捕获翻滚目标运动规划方法
CN110874578A (zh) * 2019-11-15 2020-03-10 北京航空航天大学青岛研究院 一种基于强化学习的无人机视角车辆识别追踪方法
CN110850719A (zh) * 2019-11-26 2020-02-28 北京航空航天大学 一种基于强化学习的空间非合作目标参数自整定追踪方法
CN111027143A (zh) * 2019-12-18 2020-04-17 四川大学 一种基于深度强化学习的舰载机进近引导方法
CN111026157A (zh) * 2019-12-18 2020-04-17 四川大学 一种基于奖励重塑强化学习的飞行器智能引导方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
Adaptive Finite-Time 6-DOF Tracking Control for Spacecraft Fly Around With Input Saturation and State Constraints;Yi Huang,等;《IEEE transactions on aerospace and electronic systems》;20191231;第55卷(第6期);3259-3272 *
Partial lyapunov strictification:Dual-Quaternion-Based observer for 6-DOF tracking control;Hongyang Gong,等;《IEEE TRANSACTIONS ON CONTROL SYSTEMS TECHNOLOGY》;20191130;第27卷(第6期);2453-2469 *
Vision-based attitude estimation for spacecraft docking operation through deep learning algorithm;Thaweerath Phisannupawong,等;《International conference on advanced communications technology(ICACT)》;20200219;280-284 *
基于二维模型的航天器近程交会对接控制及地面实验;徐兴念;《中国优秀硕士学位论文全文数据库 工程科技II辑》;20200215(第2期);C031-1529 *
基于学习的空间机器人在轨服务操作技术;解永春,等;《空间控制技术与应用》;20190831;第45卷(第4期);25-37 *
考虑运动约束的航天器六自由度跟踪控制研究;何新;《中国优秀硕士学位论文全文数据库 工程科技II辑》;20200215(第2期);C031-1748 *

Also Published As

Publication number Publication date
CN111596677A (zh) 2020-08-28

Similar Documents

Publication Publication Date Title
Fang et al. Adaptive integral backstepping control of a micro-quadrotor
Sun et al. Robust nonlinear adaptive relative pose control for cooperative spacecraft during rendezvous and proximity operations
CN112550770B (zh) 一种基于凸优化的火箭软着陆轨迹规划方法
CN110376882A (zh) 基于有限时间扩张状态观测器的预定性能控制方法
CN112346470A (zh) 一种基于改进自抗扰控制的四旋翼姿态控制方法
CN111948942B (zh) 一种多架旋翼飞行器协作搬运的能量优化方法
CN113619814B (zh) 一种交会对接最后逼近段相对姿轨耦合控制方法
CN109597426A (zh) 基于l1自适应控制的四旋翼直升机轨迹跟踪控制方法
CN113361013B (zh) 一种基于时间同步稳定的航天器姿态鲁棒控制方法
Sun et al. Trajectory tracking control of powered parafoil system based on sliding mode control in a complex environment
CN116142490A (zh) 复杂约束下基于势函数的航天器姿态重定向控制方法
CN113485395B (zh) 一种误差约束下固定时间相对姿轨跟踪控制方法
Yu et al. Geometric control and experimental validation for a quadrotor UAV transporting a payload
Yang et al. A decentralised control strategy for formation flight of unmanned aerial vehicles
Yang et al. Nonlinear H/sup/spl infin//decoupling hover control of helicopter with parameter uncertainties
CN111596677B (zh) 一种基于在线学习的航天器临近操作自主控制方法及***
Song et al. Research on attitude control of quadrotor uav based on active disturbance rejection control
Gao et al. Disturbance observer based finite-time trajectory tracking control of unmanned surface vehicles with unknown dead-zones
CN116360258A (zh) 基于固定时间收敛的高超声速变形飞行器抗干扰控制方法
Ning et al. BLS-based adaptive fault tolerant control for a class of space unmanned systems with time-varying state constraints and input nonlinearities
CN112357120B (zh) 一种考虑执行机构安装偏差的强化学习姿态约束控制方法
CN113618743B (zh) 一种针对多源干扰的无人机机械臂末端位姿控制方法
Zhou et al. IBLF-based fixed-time fault-tolerant control for fixed-wing UAV with guaranteed time-varying state constraints
CN115079715B (zh) 角速度及输入约束下分布式航天器编队姿态同步控制方法
Xu et al. Compensation control of uav based on deep deterministic policy gradient

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant