CN111596677B - 一种基于在线学习的航天器临近操作自主控制方法及*** - Google Patents
一种基于在线学习的航天器临近操作自主控制方法及*** Download PDFInfo
- Publication number
- CN111596677B CN111596677B CN202010375578.0A CN202010375578A CN111596677B CN 111596677 B CN111596677 B CN 111596677B CN 202010375578 A CN202010375578 A CN 202010375578A CN 111596677 B CN111596677 B CN 111596677B
- Authority
- CN
- China
- Prior art keywords
- spacecraft
- dual
- constraint
- pose
- online
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013459 approach Methods 0.000 title claims abstract description 38
- 238000000034 method Methods 0.000 title claims abstract description 28
- 230000009977 dual effect Effects 0.000 claims abstract description 44
- 230000006870 function Effects 0.000 claims abstract description 35
- 238000011217 control strategy Methods 0.000 claims abstract description 4
- 239000013598 vector Substances 0.000 claims description 21
- 238000003032 molecular docking Methods 0.000 claims description 9
- 238000013461 design Methods 0.000 claims description 8
- 239000011159 matrix material Substances 0.000 claims description 7
- 238000011156 evaluation Methods 0.000 claims description 2
- 230000000007 visual effect Effects 0.000 claims description 2
- 230000001105 regulatory effect Effects 0.000 claims 1
- 238000005457 optimization Methods 0.000 abstract description 5
- 238000005516 engineering process Methods 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000005381 potential energy Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000032683 aging Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/0265—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/042—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/0088—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots characterized by the autonomous decision making process, e.g. artificial intelligence, predefined behaviours
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/10—Simultaneous control of position or course in three dimensions
Landscapes
- Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Automation & Control Theory (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Remote Sensing (AREA)
- Radar, Positioning & Navigation (AREA)
- Aviation & Aerospace Engineering (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
Abstract
本发明涉及一种基于在线学习的航天器临近操作自主控制方法及***,针对航天器在近临近操作任务中所存在的视线场约束、接近走廊约束以及控制性能实时在线优化等实际工程问题,提出一种基于在线学习的临近操作自主控制技术的方法;本发明包括以下步骤:首先,基于对偶四元数建立航天器的位姿一体化动力学模型,并利用对偶四元数将位姿运动约束刻画为不等式形式;其次,面向航天器临近操作自主控制的任务需求,基于对偶四元数的性质设计在线学习控制的回报函数。最后,在对偶四元数的框架下,设计在线学习方法,使得控制器能从一个简单的控制策略,利用在线数据逐步提升为一个次优控制器,以提升航天器的任务执行能力。
Description
技术领域
本发明涉及一种基于在线学习的航天器临近操作自主控制方法及***,主要应用于航天器交会对接、在轨补给维护、协同配合等任务,属于航天器控制技术领域。
背景技术
随着航天技术的高速发展,航天器在轨任务的多样性和复杂性日益提高,任务载体逐渐由单集成大航天器***向多航天器***扩展,任务类型也由传统的观测、通讯等基本任务,衍生出了以航天器临近操作问题为代表的新兴在轨任务。航天器临近操作控制技术衍生于交会对接、在轨维护补给等在内的重要任务场景。由于飞行安全、载荷特性和任务需求等因素,在轨航天器经常需要满足各类运动约束。一方面,由于任务中的目标航天器有的具有一些外张型载荷,出于安全考虑,追踪星的运动轨迹一般会被限制在一个以对接口为轴心的锥形区域内,这一运动约束常被称为接近走廊约束。另一方面,为完成交会对接任务,追踪星需要具备实时测量其与目标星间的相对运动状态的能力。但是,由于这类光学载荷通常只具有有限的视场范围,追踪航天器的姿态需要被有效控制以使得目标星一直处于这个有限视场内,称之为视场约束。另外,考虑到航天器携带燃料有限,任务的时效性等因素,航天器的运动控制具有时效和经济的综合最优效应也是未来航天器控制***设计中的一个非常关键因素。所以研究在位姿约束条件下的航天器的控制性能优化问题就显得尤为重要。
在国内外的相关研究中,解决此类任务相关的问题主要立足于两个方面,一方面是基于人工势能函数的运动控制,另一方面是基于求解最优问题的进行路径的运动轨迹设计。前者虽然能很好的解决在运动过程中的轨迹规避问题,但是其缺乏优化性能指标的功能。后者虽然能兼顾约束规避和控制性能的优化,然而求解优化问题需要的时效都不能满足航天任务的需求。因此,现有的航天器临近操作自主控制方法存在难以保证同时保证运动约束性能优化以及计算时效的情况。
发明内容
本发明的目的在于解决航天器临近操作自主控制任务中由于光学载荷以及航天器本体结构造成的六自由度运动约束问题,本发明提供一种基于在线学习的航天器临近操作自主控制方法及设备,通过设计与任务功能相关的回报函数,并利用在线数据设计控制器的实时学习律,解决了航天器临近操作任务中的六自由度运动约束问题,在保证满足运动约束的条件下,通过实时学习自主改进优化控制器的性能,提升了控制***的航天器控制***的任务执行能力。
本发明提供一种基于在线学习的航天器临近操作自主控制方法,(1)根据航天器临近操作任务的位姿动力学特性基于对偶四元数建立动力学模型,并在对偶四元数的框架下刻画临近操作任务中的位姿运动学约束;
(2)根据航天器临近操作任务的需求设计相应的在线学习中的回报函数;
(3)根据(1)的动力学模型和(2)中的回报函数基于对偶四元数框架设计利用在线数据设计学习控制方法。
具体实现步骤如下:
第一步建立航天器临近操作任务的位姿动力学模型如下:
其中,表示被控航天器与目标航天器的相对位姿,为其相对时间的导数,为对偶四元数的集合,为对偶四元数乘法,被控航天器与目标航天器的相对对偶角速度、被控航天器相对于惯性参考系的对偶角速度以及目标航天器相对于惯性参考系的对偶角速度分别表述为和为相对时间的导数,表示由力fb和力矩τb组成的对偶控制输入,表示对偶惯量矩阵由转动惯量Jb和质量组成mb,I3为三阶单位矩阵,ε为对偶单元其满足性质ε≠0,ε2=0。上式中
基于对偶四元数的性质刻画接近走廊约束和视线场约束。由于任务中的目标航天器有时具有较大的空间规模和一些外张型载荷,故出于安全考虑,追踪星的运动轨迹通常被限制在一个以对接口为轴心的圆锥包络内。可以通过对偶四元数的形式刻画为:
式中,cpath表示目标航天器对接口方向的单位方向向量,表示关于cpath的叉乘矩阵,θ表示约束轴心包络圆锥的半锥角,o表示对偶数的内积运算。另外,由于任务中的被控航天器上搭载由测量相对位姿的导航载荷,其姿态需要被有效控制以使得目标航天器一直处于这个圆锥视场内,这类约束可被称为视线场约束,具体可以通过对偶数四元数的形式刻画为:
第二步,设计航天器临近操作任务的回报函数。在航天器临近操作任务中,控制的最终目标是使得被控航天器到达期望的位置和姿态,所以期望状态回报函数可以设计为:
式中,c1为第一步中的接近走廊约束不等式左侧部分,β1为位置约束权重因子。类似的,姿态约束回报函数设计为:
式中,c2为第一步中的视线场约束不等式左侧部分,β2为姿态约束权重因子。综上所述,总的回报函数设计为:
γ=γstate+γpath+γsight
基于上式所设计的回报函数,可以对航天器的自主控制的结果给与相应的回报,以满足航天器临近操作任务的需求。
第三步,设计基于在线学习的航天器临近操作自主控制方法,在线学习控制策略设计如下:
(1)所设计的控制器为:
(2)控制器中权重向量的学习律为:
Ψ(t,tk2,tk1)=ψ1(tk2,tk1)west+ψ2(tk2tk1)
利用以上步骤可以实现约束条件下在实时学习的控制器设计,可以保证航天器在临近操作任务中运动轨迹安全的前提下根据在线数据实时提升航天器的控制性能。
本发明还提供一种基于在线学习的航天器临近操作自主控制***,包括评判网络、回报网络、学习器、控制器以及航天器相对位姿动力学模型,使用基于在线学习的航天器临近操作自主控制方法,航天器由控制器执行控制任务,并由评判网络和回报网络采集数据对控制性能进行评估,同时学习器通过评估结果进行网络权重的实时学习,将控制参数更新到控制器中,实现在线性能提升。
本发明是一种基于在线学习的航天器临近操作自主控制方法,与现有技术相比的优点在于:
(1)基于对偶四元数的汇报函数设计,实现了航天器临近操作过程中位置和姿态的运动规避,保证了任务的安全执行。
(2)与基于人工势能函数的方法相比,本方案使用基于在线学习控制的方法不仅能够实现约束区域的规避,还能有效地提升了控制性能,提升了控制***的经济性以及任务执行力。
(3)与基于求解优化问题的方法相比,本方法的实现是在线实时的,通过实时采集数据并更新控制器的权重参数,实现控制器的在线学***台的需求,具有很强的可实现性。
附图说明
图1为基于在线学习的航天器临近操作自主控制***原理框图;
图2为本发明的一种基于在线学习的航天器临近操作自主控制方法流程框图;
具体实施方式
图1为本发明所述的基于在线学习的航天器临近操作自主控制***原理框图,上述***由评判网络、回报网络、学习器、控制器以及航天器相对位姿动力学模型几部分组成。首先,航天器由初始控制器执行控制任务,并由评判网络和回报网络采集数据对控制性能进行评估,同时学习器通过评估结果进行网络权重的实时学习,将控制参数更新到控制器中,以实现在线性能提升。
如图2所示,本发明的一种基于在线学习的航天器临近操作自主控制方法步骤为:首先建立考虑位姿运动约束的航天器临近操作任务的位姿动力学模型;然后针对任务需求,进行回报函数的设计;最后进行控制器的设计以及在线学习律的设计;具体实施步骤如下:
第一步建立航天器临近操作任务的位姿动力学模型如下:
其中,表示被控航天器与目标航天器的相对位姿,为其相对时间的导数,为对偶四元数的集合,为对偶四元数乘法,对偶惯量矩阵设为被控航天器与目标航天器的相对对偶角速度、被控航天器相对于惯性参考系的对偶角速度以及目标航天器相对于惯性参考系的对偶角速度分别表述为和为相对时间的导数,表示由力fb和力矩τb组成的对偶控制输入mb,I3为三阶单位矩阵,ε为对偶单元其满足性质ε≠0,ε2=0,上式中被控航天器和目标航天器的对偶角速度的初值分别为相对位姿的初值选为
基于对偶四元数的性质刻画接近走廊约束和视线场约束。由于任务中的目标航天器有时具有较大的空间规模和一些外张型载荷,故出于安全考虑,追踪星的运动轨迹通常被限制在一个以对接口为轴心的圆锥包络内。可以通过对偶四元数的形式刻画为:
式中,cpath表示目标航天器对接口方向的单位方向向量,设置值为[1 0 0]T,表示关于cpath的叉乘矩阵,θ表示约束轴心包络圆锥的半锥角,设置值为30deg,o表示对偶数的内积运算。另外,由于任务中的被控航天器上搭载由测量相对位姿的导航载荷,其姿态需要被有效控制以使得目标航天器一直处于这个圆锥视场内,这类约束可被称为视线场约束,具体可以通过对偶数四元数的形式刻画为:
第二步,设计航天器临近操作任务的回报函数。在航天器临近操作任务中,控制的最终目标是使得被控航天器到达期望的位置和姿态,所以期望状态回报函数可以设计为:
其中,表示单位对偶四元数,Qq和Qω分别表示位姿和速度的权重矩阵,设置值分别为Qq=0.1I4和Qω=2I4。在航天器临近操作任务中的约束即为被控航天器不期望达到的位置和姿态。在此,位置约束回报函数设计为:
式中,c1为第一步中的接近走廊约束不等式左侧部分,β1为位置约束权重因子,设置值为10。类似的,姿态约束回报函数设计为:
式中,c2为第一步中的视线场约束不等式左侧部分,β2为姿态约束权重因子,设置值为10。综上所述,总的回报函数可以设计为:
γ=γstate+γpath+γsight
基于上式所设计的回报函数,可以对航天器的自主控制的结果给与相应的回报,以满足航天器临近操作任务的需求。
第三步,设计基于在线学习的航天器临近操作自主控制方法,在线学习控制策略设计如下:
(1)所设计的控制器为:
(2)控制器中权重向量的学习律为:
Ψ(t,tk2,tk1)=ψ1(tk2,tk1)west+ψ2(tk2tk1)
利用以上步骤可以实现约束条件下在实时学习的控制器设计,可以保证航天器在临近操作任务中运动轨迹安全的前提下根据在线数据实时提升航天器的控制性能。
本发明说明书中未作详细描述的内容属于本领域专业技术人员公知的现有技术。
Claims (2)
1.一种基于在线学习的航天器临近操作自主控制方法,其特征在于,包括以下步骤:
(1)根据航天器临近操作任务的位姿动力学特性基于对偶四元数建立动力学模型,并在对偶四元数的框架下刻画临近操作任务中的位姿运动学约束;
(2)根据航天器临近操作任务的需求设计相应的在线学习中的回报函数;
(3)根据步骤(1)的动力学模型和步骤(2)中的回报函数基于对偶四元数框架设计利用在线数据设计学习控制方法;
建立步骤(1)中航天器临近操作任务的位姿动力学模型为:
其中,表示被控航天器与目标航天器的相对位姿,为相对时间的导数,为对偶四元数的集合,为对偶四元数乘法,被控航天器与目标航天器的相对对偶角速度、被控航天器相对于惯性参考系的对偶角速度以及目标航天器相对于惯性参考系的对偶角速度分别表述为 和 为相对时间的导数,表示由力fb和力矩τb组成的对偶控制输入,表示对偶惯量矩阵由转动惯量Jb和质量mb组成,I3为三阶单位矩阵,ε为对偶单元其满足性质ε≠0,ε2=0,上式中步骤(1)中所述的临近操作任务中的位姿运动学约束具体包括接近走廊约束和视线场约束;
所述接近走廊约束是指由于任务中的目标航天器有时具有较大的空间规模和一些外张型载荷,出于安全考虑,被控航天器的运动轨迹通常被限制在一个以对接口为轴心的圆锥包络内,通过对偶四元数的形式刻画为:
所述视线场约束是指任务中的被控航天器上搭载有测量相对位姿的导航载荷,被控航天器姿态需要被有效控制以使得目标航天器一直处于这个圆锥视场内,其姿态通过对偶数四元数的形式刻画为:
所述步骤(2)中,航天器临近操作任务的回报函数具体设计为期望状态回报函数、姿态约束回报函数以及位置约束回报函数三个部分;回报函数设计的基本思想是:对期望运动状态给予高回报,对不期望的运动状态给予低回报,在航天器临近操作任务中,控制的最终目标是使得被控航天器到达期望的位置和姿态;所述期望状态回报函数为:
所述位置约束回报函数为:
式中,c1为接近走廊约束不等式左侧部分,β1为位置约束权重因子;
所述姿态约束回报函数为:
式中,c2为视线场约束不等式左侧部分,β2为姿态约束权重因子;
总的回报函数为:
γ=γstate+γpath+γsight
基于上式的回报函数,可以对航天器的自主控制的结果给与相应的回报,以满足航天器临近操作任务的需求;
所述步骤(3)中,在线学习控制策略如下:
(1)所设计的控制器为:
(2)控制器中权重向量的学习律为:
Ψ(t,tk2,tk1)=ψ1(t,tk1)west+ψ2(t,tk1)
2.一种基于在线学习的航天器临近操作自主控制***,其特征在于:包括评判网络、回报网络、学习器、控制器以及航天器相对位姿动力学模型,使用权利要求1所述的方法,航天器由控制器执行控制任务,并由评判网络和回报网络采集数据对控制性能进行评估,同时学习器通过评估结果进行网络权重的实时学习,将控制参数更新到控制器中,实现在线性能提升。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010375578.0A CN111596677B (zh) | 2020-05-07 | 2020-05-07 | 一种基于在线学习的航天器临近操作自主控制方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010375578.0A CN111596677B (zh) | 2020-05-07 | 2020-05-07 | 一种基于在线学习的航天器临近操作自主控制方法及*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111596677A CN111596677A (zh) | 2020-08-28 |
CN111596677B true CN111596677B (zh) | 2021-11-30 |
Family
ID=72185223
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010375578.0A Active CN111596677B (zh) | 2020-05-07 | 2020-05-07 | 一种基于在线学习的航天器临近操作自主控制方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111596677B (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105512391A (zh) * | 2015-12-04 | 2016-04-20 | 上海新跃仪表厂 | 基于对偶四元数的多星姿轨动力学建模方法及其验证*** |
CN106814746A (zh) * | 2017-03-24 | 2017-06-09 | 哈尔滨工业大学 | 一种航天器姿轨一体化反步跟踪控制方法 |
CN108674695A (zh) * | 2018-07-19 | 2018-10-19 | 北京空间技术研制试验中心 | 航天器再入返回轨道规划方法 |
CN109164821A (zh) * | 2018-09-26 | 2019-01-08 | 中科物栖(北京)科技有限责任公司 | 一种无人机姿态训练方法及装置 |
CN109284530A (zh) * | 2018-08-02 | 2019-01-29 | 西北工业大学 | 基于深度学习的空间非合作目标姿轨一体化参数估计方法 |
WO2019030949A1 (en) * | 2017-08-10 | 2019-02-14 | Mitsubishi Electric Corporation | SPACE VEHICLE AND CONTROL SYSTEM FOR CONTROLLING THE OPERATION OF A SPATIAL VEHICLE |
CN109343341A (zh) * | 2018-11-21 | 2019-02-15 | 北京航天自动控制研究所 | 一种基于深度强化学习的运载火箭垂直回收智能控制方法 |
CN109760046A (zh) * | 2018-12-27 | 2019-05-17 | 西北工业大学 | 基于强化学习的空间机器人捕获翻滚目标运动规划方法 |
CN110850719A (zh) * | 2019-11-26 | 2020-02-28 | 北京航空航天大学 | 一种基于强化学习的空间非合作目标参数自整定追踪方法 |
CN110874578A (zh) * | 2019-11-15 | 2020-03-10 | 北京航空航天大学青岛研究院 | 一种基于强化学习的无人机视角车辆识别追踪方法 |
CN111027143A (zh) * | 2019-12-18 | 2020-04-17 | 四川大学 | 一种基于深度强化学习的舰载机进近引导方法 |
CN111026157A (zh) * | 2019-12-18 | 2020-04-17 | 四川大学 | 一种基于奖励重塑强化学习的飞行器智能引导方法 |
-
2020
- 2020-05-07 CN CN202010375578.0A patent/CN111596677B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105512391A (zh) * | 2015-12-04 | 2016-04-20 | 上海新跃仪表厂 | 基于对偶四元数的多星姿轨动力学建模方法及其验证*** |
CN106814746A (zh) * | 2017-03-24 | 2017-06-09 | 哈尔滨工业大学 | 一种航天器姿轨一体化反步跟踪控制方法 |
WO2019030949A1 (en) * | 2017-08-10 | 2019-02-14 | Mitsubishi Electric Corporation | SPACE VEHICLE AND CONTROL SYSTEM FOR CONTROLLING THE OPERATION OF A SPATIAL VEHICLE |
CN108674695A (zh) * | 2018-07-19 | 2018-10-19 | 北京空间技术研制试验中心 | 航天器再入返回轨道规划方法 |
CN109284530A (zh) * | 2018-08-02 | 2019-01-29 | 西北工业大学 | 基于深度学习的空间非合作目标姿轨一体化参数估计方法 |
CN109164821A (zh) * | 2018-09-26 | 2019-01-08 | 中科物栖(北京)科技有限责任公司 | 一种无人机姿态训练方法及装置 |
CN109343341A (zh) * | 2018-11-21 | 2019-02-15 | 北京航天自动控制研究所 | 一种基于深度强化学习的运载火箭垂直回收智能控制方法 |
CN109760046A (zh) * | 2018-12-27 | 2019-05-17 | 西北工业大学 | 基于强化学习的空间机器人捕获翻滚目标运动规划方法 |
CN110874578A (zh) * | 2019-11-15 | 2020-03-10 | 北京航空航天大学青岛研究院 | 一种基于强化学习的无人机视角车辆识别追踪方法 |
CN110850719A (zh) * | 2019-11-26 | 2020-02-28 | 北京航空航天大学 | 一种基于强化学习的空间非合作目标参数自整定追踪方法 |
CN111027143A (zh) * | 2019-12-18 | 2020-04-17 | 四川大学 | 一种基于深度强化学习的舰载机进近引导方法 |
CN111026157A (zh) * | 2019-12-18 | 2020-04-17 | 四川大学 | 一种基于奖励重塑强化学习的飞行器智能引导方法 |
Non-Patent Citations (6)
Title |
---|
Adaptive Finite-Time 6-DOF Tracking Control for Spacecraft Fly Around With Input Saturation and State Constraints;Yi Huang,等;《IEEE transactions on aerospace and electronic systems》;20191231;第55卷(第6期);3259-3272 * |
Partial lyapunov strictification:Dual-Quaternion-Based observer for 6-DOF tracking control;Hongyang Gong,等;《IEEE TRANSACTIONS ON CONTROL SYSTEMS TECHNOLOGY》;20191130;第27卷(第6期);2453-2469 * |
Vision-based attitude estimation for spacecraft docking operation through deep learning algorithm;Thaweerath Phisannupawong,等;《International conference on advanced communications technology(ICACT)》;20200219;280-284 * |
基于二维模型的航天器近程交会对接控制及地面实验;徐兴念;《中国优秀硕士学位论文全文数据库 工程科技II辑》;20200215(第2期);C031-1529 * |
基于学习的空间机器人在轨服务操作技术;解永春,等;《空间控制技术与应用》;20190831;第45卷(第4期);25-37 * |
考虑运动约束的航天器六自由度跟踪控制研究;何新;《中国优秀硕士学位论文全文数据库 工程科技II辑》;20200215(第2期);C031-1748 * |
Also Published As
Publication number | Publication date |
---|---|
CN111596677A (zh) | 2020-08-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Fang et al. | Adaptive integral backstepping control of a micro-quadrotor | |
Sun et al. | Robust nonlinear adaptive relative pose control for cooperative spacecraft during rendezvous and proximity operations | |
CN112550770B (zh) | 一种基于凸优化的火箭软着陆轨迹规划方法 | |
CN110376882A (zh) | 基于有限时间扩张状态观测器的预定性能控制方法 | |
CN112346470A (zh) | 一种基于改进自抗扰控制的四旋翼姿态控制方法 | |
CN111948942B (zh) | 一种多架旋翼飞行器协作搬运的能量优化方法 | |
CN113619814B (zh) | 一种交会对接最后逼近段相对姿轨耦合控制方法 | |
CN109597426A (zh) | 基于l1自适应控制的四旋翼直升机轨迹跟踪控制方法 | |
CN113361013B (zh) | 一种基于时间同步稳定的航天器姿态鲁棒控制方法 | |
Sun et al. | Trajectory tracking control of powered parafoil system based on sliding mode control in a complex environment | |
CN116142490A (zh) | 复杂约束下基于势函数的航天器姿态重定向控制方法 | |
CN113485395B (zh) | 一种误差约束下固定时间相对姿轨跟踪控制方法 | |
Yu et al. | Geometric control and experimental validation for a quadrotor UAV transporting a payload | |
Yang et al. | A decentralised control strategy for formation flight of unmanned aerial vehicles | |
Yang et al. | Nonlinear H/sup/spl infin//decoupling hover control of helicopter with parameter uncertainties | |
CN111596677B (zh) | 一种基于在线学习的航天器临近操作自主控制方法及*** | |
Song et al. | Research on attitude control of quadrotor uav based on active disturbance rejection control | |
Gao et al. | Disturbance observer based finite-time trajectory tracking control of unmanned surface vehicles with unknown dead-zones | |
CN116360258A (zh) | 基于固定时间收敛的高超声速变形飞行器抗干扰控制方法 | |
Ning et al. | BLS-based adaptive fault tolerant control for a class of space unmanned systems with time-varying state constraints and input nonlinearities | |
CN112357120B (zh) | 一种考虑执行机构安装偏差的强化学习姿态约束控制方法 | |
CN113618743B (zh) | 一种针对多源干扰的无人机机械臂末端位姿控制方法 | |
Zhou et al. | IBLF-based fixed-time fault-tolerant control for fixed-wing UAV with guaranteed time-varying state constraints | |
CN115079715B (zh) | 角速度及输入约束下分布式航天器编队姿态同步控制方法 | |
Xu et al. | Compensation control of uav based on deep deterministic policy gradient |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |