CN110673486A - 一种基于动态博弈理论的多航天器追逃控制方法 - Google Patents

一种基于动态博弈理论的多航天器追逃控制方法 Download PDF

Info

Publication number
CN110673486A
CN110673486A CN201911003658.7A CN201911003658A CN110673486A CN 110673486 A CN110673486 A CN 110673486A CN 201911003658 A CN201911003658 A CN 201911003658A CN 110673486 A CN110673486 A CN 110673486A
Authority
CN
China
Prior art keywords
spacecraft
equation
game
model
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911003658.7A
Other languages
English (en)
Other versions
CN110673486B (zh
Inventor
师鹏
徐添
邓忠民
张冉
赵育善
王逍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Beijing University of Aeronautics and Astronautics
Original Assignee
Beijing University of Aeronautics and Astronautics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Aeronautics and Astronautics filed Critical Beijing University of Aeronautics and Astronautics
Priority to CN201911003658.7A priority Critical patent/CN110673486B/zh
Publication of CN110673486A publication Critical patent/CN110673486A/zh
Application granted granted Critical
Publication of CN110673486B publication Critical patent/CN110673486B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明涉及一种基于动态博弈理论的多航天器追逃控制方法,根据航天器所处空间环境,忽略一切摄动力,在地球中心引力场中建立多航天器的动力学模型,也称动力学方程,此模型包括目标航天器、防御航天器和攻击航天器三个角色;根据动力学模型中各个航天器的角色关系,确定航天器的支付函数和追逃博弈的终止目标集合,从而建立多航天器博弈模型;利用动态博弈理论进行处理,得到两点边值方程,两点边值方程包括协态向量的微分方程和由协态向量表示的新的动力学方程、时间的横截方程;针对建立的两点边值问题中得到的两点边值方程,利用粒子群算法和非线性规划方法结合的方法求解得到该方程的解,从而得到航天器追逃的最优控制策略和最优轨迹。

Description

一种基于动态博弈理论的多航天器追逃控制方法
技术领域
本发明涉及一种基于动态博弈理论的多航天器追逃控制方法,属于航天器控制技术领域。
背景技术
与地面追逃类似,以追捕或者反追捕为目的,在控制力作用下的至少两个航天器参与的相对运动场景称为航天器的空间追逃。空间追逃技术在航天器空间安全、在轨服务等方面有着重要的作用。由于航天器之间任务目标的不一致性,所以可以采用非合作动态博弈的思想分析航天器的控制策略。所谓动态博弈(ISAACS R.Differential Games[M].New York:John Wiley and Sons,1965:1-5.),即在参与者的对抗过程中,至少一个参与者能够利用先前过程中的状态信息来决定当前时刻的具体动作,如果参与者之间的目标不完全一致,那么就是非合作的。由于博弈论的思想可以同时考虑多个航天器的控制量,所以研究其在追逃问题中的应用受到了众多学者的关注。
Hayoun(HAYOUN S Y,SHIMA T.A two-on-one l inear pursuit–evasion gamewith bounded controls[J].Journal of Optimization Theory and Applications,2017,174(3):837-857.)基于线性模型研究了两个追踪方,一个逃逸方的多追单形式的问题,给出了控制有界情形下的闭环控制策略;
Rusnak(RUSNAK I.The lady,the bandits and the body guards–a two teamdynamic game[J].IFAC Proceedings Volumes,2005,38(1):441-446.)在研究多人参与的博弈问题时,将参与者分为两个阵营,防御阵营包括保护者和被保护者,攻击阵营为攻击者,他认为可以在两个时间历程下进行讨论,以保护者对攻击者的可能拦截为节点来分析问题,提出了利用多目标优化的方法进行求解。Yifang Liu(LIU Y F,Li R F,WANG SQ.Orbital three-player differential game using semi-direct collocation withnonlinear programming[C]//Proceedings of 2016 2nd International Conference onControl Science and Systems Engineering,Engineering,Piscataway,NJ:IEEE Press,2016:217-222.)等人提出了一种研究包含三个航天器的追逃博弈模型,定义了适用于该模型的终止目标集合和航天器指标函数,利用Pontani(CONWAY B A,PONTANI M.NumericalSolution of the Three-dimens ional orbital pursuit-evasion game[J].Journal ofGuidance,Control,and Dynamics,2009,32(2):474-487.)提出的方法求解了该模型下的航天器控制矢量和最优轨迹。Hayoun采用的线性模型职能处理相对距离较近的情形,且虽然是多航天器博弈,但是不包含防御航天器,角色受限;Rusnak的模型虽然包括追逃防三方,但是提出的在两个时间历程下进行分析的方法会导致指标函数形势复杂,在使用过程中显得繁琐;Yifang Liu等人模型是一种简化版多航天器博弈模型,因为该模型中被保护者,即目标航天器不带有机动能力,同时采用三个航天器的终端相对位置关系作为指标函数以简化求解过程,但是该指标函数和终端目标集的形式重复。
总之,现有的研究多航天器追逃的模型还不完善,都是把多航天器博弈拆分为多个双航天器博弈,在多个时间历程下进行建模求解,模型复杂,求解策略大多需要初值猜测,难以保证收敛性。
发明内容
本发明的技术解决问题是:克服现有航天器追逃模型的不足,建立在同一时间历程下的多航天器博弈模型,提供一种基于动态博弈理论的多航天器追逃控制方法,相较于传统模型,形式更为简单,提出求解方法无需初值猜测,得到的控制律能有效实现拦截或追踪。
本发明技术解决方案:一种基于动态博弈理论的多航天器追逃控制方法,包括以下步骤:
第一步,根据航天器轨道高度所处空间环境,忽略一切摄动力,在地球中心引力场中建立多航天器的动力学模型,也称动力学方程,此模型包括目标航天器、防御航天器和攻击航天器三个角色;根据动力学模型中各个航天器的角色关系,确定航天器的支付函数和追逃博弈的终止目标集合,从而建立多航天器博弈模型;
第二步,针对第一步建立的多航天器博弈模型,利用动态博弈理论进行处理,得到两点边值方程,两点边值方程包括协态向量的微分方程和由协态向量表示的新的动力学方程、时间的横截方程;
第三步,针对第二步中建立的两点边值问题第二步中得到的两点边值方程,利用粒子群算法和非线性规划方法结合的方法求解得到该方程的解,得到航天器追逃的最优控制策略和最优轨迹。
所述第一步中,多航天器的博弈模型如下:
(1)航天器的动力学方程为:
Figure BDA0002242080510000033
其中,i=D,E,A分别代表防御航天器,逃逸航天器和攻击航天器,μ=3.986005×1014m3/s2为地球引力常数,r代表航天器矢径的模,x,y,z为航天器的三轴位置分量,T代表航天器单位质量控制量的大小,θ和α代表航天器的控制方向角,其具体方向定义为:θ为控制量与惯性系下z轴方向的夹角,α为控制量在x-y平面上的投影与y轴的夹角。
(2)根据航天器的角色关系,确认支付函数如下:
Figure BDA0002242080510000034
其中,t0,tf代表了博弈的起止时间,rAE和rDA分别代表攻击航天器和目标航天器的相对距离以及防御航天器和攻击航天器之间的距离,k1和k3代表支付的权重,k2和k4代表了支付随距离的变化速度。
(3)航天器的目标集合如下:
ψ(rE(tf),rD(tf),rA(tf),tf)=F11)F22)=0
Figure BDA0002242080510000035
I1={(rA(tf),rE(tf))|||rA(tf)-rE(tf)||<ε1}
I2={(rD(tf),rA(tf))|||rD(tf)-rA(tf)||<ε2}
其中,ri(tf)表示航天器i的终端位置向量,ξ12分别代表了攻击-目标航天器的终端位置组合和攻击-防御航天器的终端位置组合,I1,I2为满足捕获关系的容许攻击-目标航天器的终端位置集合和容许攻击-防御航天器的终端位置集合,ε1≥0,ε2≥0分别代表了攻击航天器和防御航天器的捕获范围。
所述第二步的两点边值方程如下:
Figure BDA0002242080510000041
Figure BDA0002242080510000042
x(tf)应满足终端目标集合
其中,x表示航天器的位置和速度向量,λ为协态向量,t为时间,f(·)为有协态向量表示的新的航天器动力学方程,表示协态方程,由博弈理论推导得出,ψ′是终端目标集合的边界形式,x(tf)代表状态的终端值。
所述第三步的具体实现如下:
(1)利用粒子群算法获取两点边值方程的粗解,算法的适应度函数为:
Figure BDA0002242080510000045
其中,ci表示第二步中两点边值方程的边值约束和时间横截条件,ki>0表示各约束的权重系数。
粒子更新如下:
Figure BDA0002242080510000046
Figure BDA0002242080510000047
Figure BDA0002242080510000048
其中,w代表惯性权重,wmax,wmin代表惯性权重的上下界限,n代表当前进化代数,M代表总进化代数,c1,c2代表加速常数,r1,r2是0到1的随机数,
Figure BDA0002242080510000049
是第i个例子在第d维度上的个体极值,gd是第d维度上的全局极值。
(2)利用非线性规划工具箱对两点边值方程的粗解进行细优化,目标函数于粒子群函数的适应度函数相同,从而得到该方程的数值解。
(3)将解带回初值问题方程,解算出航天器追逃的最优控制策略和最优轨迹。
本发明与现有技术相比的优点在于:
(1)本发明把三维空间多航天器博弈模型建立在了一个统一的时间历程下,相较于多时间历程的模型,能获得更加简洁明了的支付函数形式,省去了不同时间历程下的公式推导,模型更易理解。
(2)本发明采用的支付函数基于航天器瞬时相对位置关系,能够使目标方和防御方形成有效配合,模型建立更贴近实际。
(3)本发明省去了对求解结果的初始猜测,提高了求解的收敛性。
附图说明
图1为本发明方法实现流程图;
图2为本发明的什么坐标系示意图;
图3为本发明中航天器运动轨迹图;
图4为本发明中防御航天器和目标航天器相对距离;
图5为本发明中的攻击航天器和防御航天器的相对距离;
图6为本发明中的航天器控制方向角。
具体实施方式
下面结合附图及实施例对本发明进行详细说明。
如图1所示,本发明一种基于动态博弈理论的多航天器追逃控制方法,针对包含三个航天器的博弈***,在一个统一的时间历程下,建立目标航天器也带有机动能力的博弈模型,模型中采用新的指标函数和求解方法来得到航天器的控制策略和最优轨迹,包括以下步骤:
本发明在地球中心引力场中建立了多航天器的动力学模型,给出各个航天器的支付函数形式和追逃博弈的终止目标集合,利用鞍点解存在的必要条件得到了各个航天器控制策略的一阶条件和二阶条件,并且将此博弈问题转化成为了一个两点边值方程,利用粒子群算法和非线性规划方法结合的方法求解得到的该方程的解,从而得到了航天器追逃的最优控制策略和最优轨迹。
1.航天器攻防模型
该模型包括一个目标航天器,一个攻击航天器和一个防御航天器,目标航天器是攻击航天器的捕获目标,防御航天器是为了保护目标航天器而尝试对攻击航天器进行拦截。当攻击航天器成功捕获目标航天器或者防御航天器拦截攻击航天器时博弈终止。
1.1动力学模型
在春分点地心惯性坐标系中建立航天器的动力学模型:如图2所示,坐标原点位于地球中心,X轴指向春分点方向,Z轴垂直于赤道平面,指向北极。
只考虑地球中心引力,忽略一切摄动和航天器的质量消耗,得到航天器的动力学方程形式如下:
Figure BDA0002242080510000051
式中,i=E,D,A代表着目标航天器、防御航天器和攻击航天器。μ=3.986005×1014m3/s2为地球引力常数,u为单位质量的控制量,定义控制量的参数为T,θ和α,其中T代表控制量的大小,θ和α代表航天器的控制方向角,其具体方向定义为:θ为控制量与惯性系下z轴方向的夹角,α为控制量在x-y平面上的投影与y轴的夹角。假设航天器控制量大小T在整个博弈时间内是常值,所以博弈的控制参数为推力的方向角。
如果目标航天器的控制量大小始终大于攻击航天器,那么只要控制方向合适,目标航天器不可能被捕获,终端目标集也将失去意义,所以做出如下假设:
TD>TA>TE (2)
动力学方程可以展开为:
Figure BDA0002242080510000061
其中,x,y,z为航天器的三轴位置分量。将三个航天器的状态量以一个统一的状态进行表示有:
Figure BDA0002242080510000062
其中,任意一个分量
Figure BDA0002242080510000063
则上述动力学方程可以描述为:
Figure BDA0002242080510000064
1.2终止目标集合
考虑博弈的持续时长tf未知,所以需要确定一个终端目标集合,当航天器之间的相对位置满足集合要求的时候博弈终止,以终端相对位置关系建立目标集:
ψ(rE(tf),rD(tf),rA(tf),tf)=F1(ξ)F2(ξ)=0 (5)
其中所用函数定义为:
Figure BDA0002242080510000065
式中,ri(tf)表示航天器i的终端位置向量,ξ12分别代表了攻击-目标航天器的终端位置组合和攻击-防御航天器的终端位置组合,I1,I2为满足捕获关系的容许攻击-目标航天器的终端位置集合和容许攻击-防御航天器的终端位置集合,ε1≥0,ε2≥0表示攻击航天器和防御航天器的捕获半径。根据上述公式,可以得到对策的终端时间定义:
Figure BDA0002242080510000071
2.航天器追逃策略求解
2.1局中人的支付函数
支付函数即各个航天器期望达到的目标,常用的支付函数包括终端距离约束、对策时间、燃料消耗等。但是因为本发明研究多航天器博弈,对策时间并不是航天器之间的矛盾点,且因为假设在博弈过程中航天器单位质量的推力大小恒定,所以燃料消耗和对策时间在本质上是一致的,而终端距离约束和终端目标集在作用和形式上重复,所以常规的支付函数无法满足多航天器的博弈模型。
在本发明中采用了包含航天器之间瞬时位置关系的指标作为支付函数,首先定义如下瞬时支付形式:
Figure BDA0002242080510000072
式中,rAE和rDA分别代表攻击航天器和目标航天器的相对距离以及防御航天器和攻击航天器之间的距离,k1和k3代表支付的权重,权重表现了攻击航天器在当下远离防御航天器或是继续追踪目标航天器之间的衡量,k2和k4代表了支付随距离的变化速度。
在博弈过程中,攻击航天器衡量与目标航天器和防御航天器之间的相对位置关系,从而选择是优先捕获目标航天器还是优先躲避被拦截。相反的,目标航天器和防御航天器则希望通过合作完成对攻击航天器的捕获,至少是延缓目标航天器被捕获,则博弈的支付函数表述为:
Figure BDA0002242080510000073
由此,已经定义了整个三航天器的追逃防模型,为了应用动态博弈理论处理该问题,需要引入纳什均衡解及其存在的必要条件将该博弈问题转换为一个两点边值方程。
2.2纳什均衡解与约束处理
在一个n人参与的单目标博弈中,以si表示各自的收益,c=(c1,c2,···,ci,···,cn)表示一组控制策略组合,其中ci表示第i个参与者选择的控制策略,C表示可选择的控制策略组合的集合,那么一组策略组合
Figure BDA0002242080510000074
为一个纳什均衡,当且仅当
Figure BDA0002242080510000075
有:
式中,c-i表示除第i个局中人的其他参与者的控制策略,
Figure BDA0002242080510000081
表示第i个局中人的最优策略选择。
为了获得航天器的控制策略,引入哈密顿函数:
H=L+λTf(x,u,t)=L+λA TfA(xA,uA,t)+λD TfD(xD,uD,t)+λE TfE(xE,uE,t) (11)
其中,λ表示协态向量,根据鞍点存在的必要条件,协态向量的微分方程为:
Figure BDA0002242080510000082
通过方程可以分析得出,三个航天器协态向量微分方程的结果在形式上相似,每个航天器协态向量在三轴的分量也类似,下面只对防御航天器协态向量的微分方程进行求解,令H1=L,H2=λTf(x,u,t),
Figure BDA0002242080510000083
Figure BDA0002242080510000084
那么有:
Figure BDA0002242080510000085
Figure BDA0002242080510000086
可以看出,协态向量是状态量的函数,将其记为:
Figure BDA0002242080510000087
协态向量的终值和终端目标集相关,将式(5)表示的终端约束做如下转换:
ψ′=(||rA(tf)-rE(tf)||-ε1)·(||rD(tf)-rA(tf)||-ε2)=0 (16)
上述形式是终端目标的边界形式,该形式表示当攻击航天器和目标航天器之间的距离刚好为ε1或者攻击航天器和防御航天器之间的距离刚好为ε2。根据博弈理论,协态向量的末值沿着终端目标集边界的外法线方向,大小由目标集边界的偏导数表示:
Figure BDA0002242080510000091
同样的,航天器的协态终值也具有相似性,其中攻击航天器的协态终值为:
Figure BDA0002242080510000092
同理可以得到另外两个航天器的协态终值,观察发现有如下规律:
λP,x(tf)+λE,x(tf)+λD,x(tf)=0
λP,y(tf)+λE,y(tf)+λD,y(tf)=0 (19)
λP,z(tf)+λE,z(tf)+λD,z(tf)=0
对于鞍点策略解,必须满足:
Figure BDA0002242080510000093
如果控制没有约束要求,则可以通过上式获得航天器最优控制的一阶条件:
Figure BDA0002242080510000094
假设sinθi≠0,则有
Figure BDA0002242080510000095
将任意α代入式(21),可以得到两个θ,由此得到控制方向角的四个组合,所以需要得到控制方程的二阶条件:
Figure BDA0002242080510000101
Figure BDA0002242080510000102
Figure BDA0002242080510000103
Figure BDA0002242080510000104
对于攻击航天器,其海森矩阵h应该满足:h≥0;防御航天器和目标航天器需要满足:h≤0。在任意瞬时,只有一对控制方向角的组合同时满足一、二阶条件。将得到的控制量方程记为:
Figure BDA0002242080510000105
将式(22)代入式(4),有:
Figure BDA0002242080510000106
初始时刻的状态给定,记为:
ψ0(xA,0,xD,0,xE,0,t0)=0 (24)
对策时间自由,则有时间横截条件:
Figure BDA0002242080510000107
则通过式(15)、(17)、(23)-(25)将包括三个航天器的动态博弈问题转化成为了一个两点边值方程。在该方程中,未知的变量包括三个航天器的状态向量xA,xD,xE,以及他们的控制量uA,uD,uE,协态向量λADE和一个博弈时间tf
3.基于粒子群和下山单纯形法的求解策略
对于多航天器的博弈模型,结果是否收敛以及结果的精度对于协态向量λ的初值十分敏感,所以本发明采用了粒子群算法这一不需要给出初始猜测值的优化算法。但是粒子群的计算精度受限于群体数目和进化次数,综合时间和精度的考虑,不能采用过多的粒子和代数,所以在某些情形下,该算法不能保证收敛精度,所以在粒子群算法的基础上进一步采用下山单纯形法进一步优化,该方法是一类处理无约束情况下的非线性规划方法。在求解上述建立的模型中,下山单纯形法可以直接采用粒子群算法的指标函数,节省了处理约束的时间和难度。
1)适应度函数
在建立的两点边值方程中,把相关的约束求和作为粒子群算法的适应度函数:
Figure BDA0002242080510000111
其中,ci代表了约束,由方程(16)、(17)和(25)构成。ki>0代表各项系数的权重,nc代表了约束的个数。
2)粒子的设置
粒子的维度包括三个航天器的协态初值(6×3)和一个博弈时间tf,共计19维。粒子各维度的界限值无法确定,有通过将协态向量单位化的方式进行处理,本发明在粒子群算法中采用动态区间的形式进行处理:给定粒子的初始猜测区间(ai,bi),其中i=1,2,···,19表示粒子维度,在此区间下随机产生N个粒子,在粒子更新过程中,若当前全局最优粒子的某一元素j超出了(aj,bj),取膨胀因子γ>1,将该区间膨胀得到元素新的界限(γ*aj,γ*bj),在此界限下重新产生M个粒子,从新的N+M个粒子中选取适应度靠前的N个粒子继续迭代,从而对边界范围进行修正。
对于元素tf,设定一个小量δ作为时间下限,迭代过程中界限不改变,则有:
4.仿真设置
为了验证上述建立的博弈模型以及采用的求解策略的有效性,对包含三个航天器的追逃模型进行了仿真计算。首先为了避免因方程各参数的量级差异太大产生病态矩阵,对方程进行了单位化,取地球赤道半径RE为一个距离单位(DU),一个时间单位(TU)定义为使得地球引力常数μ=1的值,则有:
Figure BDA0002242080510000113
其中,g为地球重力加速度。航天器的推力矢量大小为TA=0.04g,TD=0.1g,TE=0.01g,将航天器的捕获范围都设为0。航天器的初始状态用轨道要素进行表示,式中各要素分别代表轨道半长轴、偏心率、轨道倾角、升交点赤经、近地点幅角和平近点角。如果是圆轨道,采用平纬度幅角u=ω+M表示。航天器的初始轨道要素为:
表1航天器初始轨道要素
Figure BDA0002242080510000115
在航天器的支付中,瞬时支付的各系数取值为:k1=k2=k3=k4=1,粒子群大小为150,迭代次数为200代,单纯形法迭代3000次,精度要求取为10-8
本发明建立了一种包含多个航天器的三维空间博弈模型,该模型把多航天器博弈过程分在了一个统一的时间历程下,避免了指标函数的分段表示。基于动态博弈的分析方法可以同时考虑多个航天器的控制策略,更加贴近场景中的对抗性要求。
模型采用了包含航天器瞬时相对位置信息的指标,该指标促进了目标航天器和防御航天器之间的联系,使之形成一定的配合;也促使攻击方去评估确定两组博弈的重要程度。
在求解该模型的过程中,本发明认为可以采用粒子群算法和下山单纯形结合的方式进行计算,在处理粒子界限的方法中,修改了传统的粒子群算法,使用了动态区间的形式,避免了对粒子区间的严格猜测。
仿真结果如图3、图4所示:从图3可以看出,由于初始状态及控制条件的设定,防御航天器成功拦截攻击航天器,其拦截时间为856.9s,终端相对距离为1.16m。图4展示了在目标航天器做最优机动和自然运动下与防御航天器之间的距离变化,可见最优机动下与防御航天器之间的距离较近,这是因为目标航天器在保证自身安全的情况下,通过靠近防御航天器能够给予攻击航天器更大的支付函数压力,从而形成了与攻击航天器之间的有效配合。
图5展示的是攻击航天器和防御航天器之间的相对距离变化,可见三轴分量都几乎收敛于0。图6是三个航天器控制方向角的时间历程,变化曲线总体平滑,在接近博弈终止时刻有一个突变,这是因为在此时关于速度的协态向量接近于零,根据式(21)所求解出来的方向角在此时存在奇点,应该使用洛必达法则进行求解。
总之,本发明通过对航天器“追逃防”问题的分析,构建了在同一时间历程下的博弈模型,利用动态博弈理论分析求解了一个多边最优控制问题,为模型中全部航天器提供了符合自身利益的最优控制策略及最优运动轨迹,模型简洁,贴合实际,求解方法无需初值猜测,适应性广。
以上虽然描述了本发明的具体实施方法,但是本领域的技术人员应当理解,这些仅是举例说明,在不背离本发明原理和实现的前提下,可以对这些实施方案做出多种变更或修改,因此,本发明的保护范围由所附权利要求书限定。

Claims (4)

1.一种基于动态博弈理论的多航天器追逃控制方法,其特征在于,包括以下步骤:
第一步,在地球中心引力场中建立多航天器的动力学模型,也称动力学方程,此模型包括目标航天器、防御航天器和攻击航天器三个角色;根据动力学模型中各个航天器的角色关系,确定航天器的支付函数和追逃博弈的终止目标集合,从而建立多航天器博弈模型;
第二步,针对第一步建立的多航天器博弈模型,利用动态博弈理论进行处理,得到两点边值方程,两点边值方程包括协态向量的微分方程和由协态向量表示的新的动力学方程、时间的横截方程;
第三步,针对第二步中建立的两点边值问题第二步中得到的两点边值方程,利用粒子群算法和非线性规划方法结合的方法求解得到该方程的解,得到航天器追逃的最优控制策略和最优轨迹。
2.根据权利要求1所述的基于动态博弈理论的多航天器追逃控制方法,其特征在于:所述第一步中,多航天器博弈模型如下:
(1)航天器的动力学方程为:
Figure FDA0002242080500000011
Figure FDA0002242080500000012
Figure FDA0002242080500000013
其中,i=D,E,A分别代表防御航天器,目标航天器和攻击航天器,μ=3.986005×1014m3/s2为地球引力常数,r代表航天器矢径的模,x,y,z为航天器的三轴位置分量,T代表航天器单位质量控制量的大小,θ和α代表航天器的控制方向角,具体方向定义为:θ为控制量与惯性系下z轴方向的夹角,α为控制量在x-y平面上的投影与y轴的夹角;
(2)根据动力学模型中各个航天器的角色关系,支付函数如下:
其中,t0,tf代表了博弈的起止时间,rAE和rDA分别代表攻击航天器和目标航天器的相对距离以及防御航天器和攻击航天器之间的距离,k1和k3代表支付的权重,k2和k4代表了支付随距离的变化速度;
(3)航天器的终止目标集合如下:
ψ(rE(tf),rD(tf),rA(tf),tf)=F11)F22)=0
Figure FDA0002242080500000021
Figure FDA0002242080500000022
I1={(rA(tf),rE(tf))|||rA(tf)-rE(tf)||<ε1}
I2={(rD(tf),rA(tf))|||rD(tf)-rA(tf)||<ε2}
其中,ri(tf)表示航天器i的终端位置向量,ξ12分别代表了攻击-目标航天器的终端位置组合和攻击-防御航天器的终端位置组合,I1,I2为满足捕获关系的容许攻击-目标航天器的终端位置集合和容许攻击-防御航天器的终端位置集合,ε1≥0,ε2≥0分别代表攻击航天器和防御航天器的捕获范围;
由动力学方程、支付函数和终止目标集合共同构成了多航天器博弈模型。
3.根据权利要求1所述的基于动态博弈理论的多航天器追逃控制方法,其特征在于:所述第二步中,两点边值问题得到的两点边值方程包含如下:
协态向量的微分方程:
Figure FDA0002242080500000023
其中,x表示航天器的位置和速度向量,终值需要满足第一步中的终止目标集合,λ为协态向量,t为时间;
由协态向量表示的新的动力学方程:
Figure FDA0002242080500000024
该方程由第一步中的动力学方程和博弈理论共同推导得出;
时间的横截方程:
Figure FDA0002242080500000025
其中,x(tf)代表状态的终端值,ψ′是终止目标集合的边界形式,表达如下:
ψ′=(||rA(tf)-rE(tf)||-ε1)·(||rD(tf)-rA(tf)||-ε2)=0
其中,ri(tf)表示航天器i的终端位置向量,ε1≥0,ε2≥0分别代表攻击航天器和防御航天器的捕获范围;
上述方程共同构成两点边值方程。
4.根据权利要求1所述的基于动态博弈理论的多航天器追逃控制方法,其特征在于:所述第三步具体实现如下:
(1)利用粒子群算法获取两点边值方程的粗解,算法的适应度函数为:
Figure FDA0002242080500000031
其中,ci表示第二步中两点边值方程的边值约束和时间横截条件,ki>0表示各约束的权重系数;
粒子更新如下:
Figure FDA0002242080500000032
Figure FDA0002242080500000033
Figure FDA0002242080500000034
其中,w代表惯性权重,wmax,wmin代表惯性权重的上下界限,n代表当前进化代数,M代表总进化代数,c1,c2代表加速常数,r1,r2是0到1的随机数,
Figure FDA0002242080500000035
是第i个粒子在第d维度上的个体极值,gd是第d维度上的全局极值;
(2)利用非线性规划工具箱对两点边值方程的粗解进行细优化,目标函数与粒子群函数的适应度函数相同,从而得到该方程的数值解,此解即协态向量λ的初始值λ0
(3)将解带初值方程,方程形式如下:
Figure FDA0002242080500000037
x(0)=x0,λ(0)=λ0
其中,x表示航天器的位置和速度向量,λ为协态向量,t为时间,x0为航天器的初始位置和速度,λ0即两点边值方程的数值解,f(·)即新形式的动力学方程,
Figure FDA0002242080500000038
即协态方程;
从而数值地解算出航天器追逃的最优控制策略θi、αi和最优轨迹xi
其中,θ、α为航天器的控制方向角,i表示防御航天器,目标航天器和攻击航天器。
CN201911003658.7A 2019-10-22 2019-10-22 一种基于动态博弈理论的多航天器追逃控制方法 Active CN110673486B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911003658.7A CN110673486B (zh) 2019-10-22 2019-10-22 一种基于动态博弈理论的多航天器追逃控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911003658.7A CN110673486B (zh) 2019-10-22 2019-10-22 一种基于动态博弈理论的多航天器追逃控制方法

Publications (2)

Publication Number Publication Date
CN110673486A true CN110673486A (zh) 2020-01-10
CN110673486B CN110673486B (zh) 2021-03-09

Family

ID=69083467

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911003658.7A Active CN110673486B (zh) 2019-10-22 2019-10-22 一种基于动态博弈理论的多航天器追逃控制方法

Country Status (1)

Country Link
CN (1) CN110673486B (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111679592A (zh) * 2020-06-22 2020-09-18 中国人民解放军国防科技大学 一种航天器追逃博弈闭环半实物仿真***及方法
CN113190033A (zh) * 2021-05-20 2021-07-30 北京理工大学 一种航天器飞行博弈中可交会的快速判别方法
CN113221365A (zh) * 2021-05-20 2021-08-06 北京理工大学 一种面向航天器飞行博弈中燃耗约束的处理方法
CN113282097A (zh) * 2021-06-04 2021-08-20 中国人民解放军战略支援部队航天工程大学 一种geo博弈航天器相对位置非球形摄动误差的控制方法
CN113353289A (zh) * 2021-04-25 2021-09-07 北京控制工程研究所 面向空间博弈的自主驱离方法、装置和存储介质
CN113552872A (zh) * 2021-01-28 2021-10-26 北京理工大学 追捕者不同速度下的追逃博弈决策方法
CN114415730A (zh) * 2022-03-21 2022-04-29 南京航空航天大学 航天器逃逸轨迹智能规划方法
CN116258317A (zh) * 2022-12-09 2023-06-13 哈尔滨工业大学 一种基于博弈论的卫星编队反监视最优控制方法、装置及介质
CN116449714A (zh) * 2023-04-20 2023-07-18 四川大学 一种多航天器追捕博弈轨道控制方法
CN117332684A (zh) * 2023-09-25 2024-01-02 同济大学 一种基于强化学习的多航天器追逃博弈下的最优捕获方法
CN118052150A (zh) * 2024-04-11 2024-05-17 中国科学院空天信息创新研究院 航天器追逃博弈策略求解方法、装置及存储介质
CN118052150B (zh) * 2024-04-11 2024-07-30 中国科学院空天信息创新研究院 航天器追逃博弈策略求解方法、装置及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006060214A2 (en) * 2004-11-18 2006-06-08 The Regents Of The University Of California Apparatus and methods for manipulation and optimization of biological systems
US20060241824A1 (en) * 2005-01-06 2006-10-26 Junichiro Kawaguchi Method of injecting plurality of spacecrafts into different orbits individually
CN107613561A (zh) * 2017-10-21 2018-01-19 桂林理工大学 一种基于交流sce‑pso算法的无线传感器网络节点三维定位方法
CN108519958A (zh) * 2018-02-05 2018-09-11 中国人民解放军国防科技大学 一种解析构造航天器追逃界栅和判断捕获逃逸区域的方法
CN109085754A (zh) * 2018-07-25 2018-12-25 西北工业大学 一种基于神经网络的空间飞行器追逃博弈方法
CN109238287A (zh) * 2018-09-06 2019-01-18 中国人民解放军国防科技大学 一种航天器逃逸路径规划方法及***

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006060214A2 (en) * 2004-11-18 2006-06-08 The Regents Of The University Of California Apparatus and methods for manipulation and optimization of biological systems
US20060241824A1 (en) * 2005-01-06 2006-10-26 Junichiro Kawaguchi Method of injecting plurality of spacecrafts into different orbits individually
CN107613561A (zh) * 2017-10-21 2018-01-19 桂林理工大学 一种基于交流sce‑pso算法的无线传感器网络节点三维定位方法
CN108519958A (zh) * 2018-02-05 2018-09-11 中国人民解放军国防科技大学 一种解析构造航天器追逃界栅和判断捕获逃逸区域的方法
CN109085754A (zh) * 2018-07-25 2018-12-25 西北工业大学 一种基于神经网络的空间飞行器追逃博弈方法
CN109238287A (zh) * 2018-09-06 2019-01-18 中国人民解放军国防科技大学 一种航天器逃逸路径规划方法及***

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
YE, D 等: "Satellite proximate interception vector guidance based on differential games", 《CHINESE JOURNAL OF AERONAUTICS》 *
刘胜男: "多对多卫星拦截的任务规划与轨道优化", 《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》 *
吴其昌 等: "基于生存型微分对策的航天器追逃策略及数值求解", 《控制与信息技术》 *

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111679592B (zh) * 2020-06-22 2023-04-07 中国人民解放军国防科技大学 一种航天器追逃博弈闭环半实物仿真***及方法
CN111679592A (zh) * 2020-06-22 2020-09-18 中国人民解放军国防科技大学 一种航天器追逃博弈闭环半实物仿真***及方法
CN113552872A (zh) * 2021-01-28 2021-10-26 北京理工大学 追捕者不同速度下的追逃博弈决策方法
CN113552872B (zh) * 2021-01-28 2024-05-14 北京理工大学 追捕机器人不同速度下的追逃控制方法
CN113353289B (zh) * 2021-04-25 2022-12-13 北京控制工程研究所 面向空间博弈的自主驱离方法、装置和存储介质
CN113353289A (zh) * 2021-04-25 2021-09-07 北京控制工程研究所 面向空间博弈的自主驱离方法、装置和存储介质
CN113190033A (zh) * 2021-05-20 2021-07-30 北京理工大学 一种航天器飞行博弈中可交会的快速判别方法
CN113190033B (zh) * 2021-05-20 2022-05-10 北京理工大学 一种航天器飞行博弈中可交会的快速判别方法
CN113221365A (zh) * 2021-05-20 2021-08-06 北京理工大学 一种面向航天器飞行博弈中燃耗约束的处理方法
CN113282097B (zh) * 2021-06-04 2022-07-29 中国人民解放军战略支援部队航天工程大学 一种geo博弈航天器相对位置非球形摄动误差的控制方法
CN113282097A (zh) * 2021-06-04 2021-08-20 中国人民解放军战略支援部队航天工程大学 一种geo博弈航天器相对位置非球形摄动误差的控制方法
CN114415730A (zh) * 2022-03-21 2022-04-29 南京航空航天大学 航天器逃逸轨迹智能规划方法
CN114415730B (zh) * 2022-03-21 2022-10-11 南京航空航天大学 航天器逃逸轨迹智能规划方法
CN116258317A (zh) * 2022-12-09 2023-06-13 哈尔滨工业大学 一种基于博弈论的卫星编队反监视最优控制方法、装置及介质
CN116258317B (zh) * 2022-12-09 2023-10-31 哈尔滨工业大学 一种基于博弈论的卫星编队反监视最优控制方法、装置及介质
CN116449714A (zh) * 2023-04-20 2023-07-18 四川大学 一种多航天器追捕博弈轨道控制方法
CN116449714B (zh) * 2023-04-20 2024-01-23 四川大学 一种多航天器追捕博弈轨道控制方法
CN117332684B (zh) * 2023-09-25 2024-04-26 同济大学 一种基于强化学习的多航天器追逃博弈下的最优捕获方法
CN117332684A (zh) * 2023-09-25 2024-01-02 同济大学 一种基于强化学习的多航天器追逃博弈下的最优捕获方法
CN118052150A (zh) * 2024-04-11 2024-05-17 中国科学院空天信息创新研究院 航天器追逃博弈策略求解方法、装置及存储介质
CN118052150B (zh) * 2024-04-11 2024-07-30 中国科学院空天信息创新研究院 航天器追逃博弈策略求解方法、装置及存储介质

Also Published As

Publication number Publication date
CN110673486B (zh) 2021-03-09

Similar Documents

Publication Publication Date Title
CN110673486B (zh) 一种基于动态博弈理论的多航天器追逃控制方法
CN108549233B (zh) 一种带有直觉模糊信息的无人机空战机动博弈方法
CN108827312B (zh) 一种基于神经网络和人工势场的协同博弈路径规划方法
Kim et al. Look-angle-shaping guidance law for impact angle and time control with field-of-view constraint
CN113093802B (zh) 一种基于深度强化学习的无人机机动决策方法
CN114003050B (zh) 一种基于微分博弈的三体对抗策略的主动防御制导方法
CN115329594B (zh) 一种大规模导弹集群攻防对抗仿真加速方法及***
CN111367314A (zh) 一种基于多航天器编队的空间非合作目标协同抓捕方法
Kung et al. Missile guidance algorithm design using particle swarm optimization
Nikusokhan et al. Closed-form optimal cooperative guidance law against random step maneuver
CN116680509A (zh) 一种用于多航天器追逃博弈任务的动态匹配方法
CN116858039A (zh) 一种高超声速飞行器博弈制导方法、***、设备及介质
CN116225049A (zh) 一种多无人机狼群协同作战攻防决策算法
CN113552872A (zh) 追捕者不同速度下的追逃博弈决策方法
Moosapour et al. A novel nonlinear robust guidance law design based on SDRE technique
CN117034745A (zh) 一种基于自适应动态规划的航天器追逃博弈控制求解方法
Menon et al. Guidance laws for spacecraft pursuit-evasion and rendezvous
CN116560403A (zh) 多高超声速飞行器智能化时间协同制导方法、***及设备
Golestani et al. Fractional order sliding mode guidance law: Improving performance and robustness
CN115098939A (zh) 一种航天器脉冲机动鲁棒追击方法
Bahari et al. Intelligent fading memory for high maneuvering target tracking
Yang et al. Adaptive super-twisting sliding mode back-stepping control for hypersonic flight vehicle with impact angle constraint and autopilot dynamics
Qiu et al. Nash pursuit strategy for nonzero-sum MPC game via inverse optimal control
CN116222310B (zh) 三维空间中基于rbf_g的二对一同步区域覆盖拦截方法
Mao et al. Neural Learning-Based Integrated Guidance and Control Algorithm of Multiple Underactuated AUVs

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant