CN114330115B

CN114330115B - 一种基于粒子群搜索的神经网络空战机动决策方法

Info

Publication number: CN114330115B
Application number: CN202111566561.4A
Authority: CN
Inventors: 刘滔; 敖厚军; 雍恩米; 赵暾; 王笑; 郑凤麒
Original assignee: Computational Aerodynamics Institute of China Aerodynamics Research and Development Center
Current assignee: Computational Aerodynamics Institute of China Aerodynamics Research and Development Center
Priority date: 2021-10-27
Filing date: 2021-12-20
Publication date: 2023-06-09
Anticipated expiration: 2041-12-20
Also published as: CN114330115A

Abstract

本发明涉及空战机动决策技术领域，涉及一种基于粒子群搜索的神经网络空战机动决策方法，其包括以下步骤：一、建立红蓝双方空战战斗机运动学与动力学模型；二、建立空战态势优势函数，包括角度优势函数、速度优势函数、距离优势函数、高度优势函数；三、粒子群算法优化空战机动决策；四、生成空战双方轨迹与机动决策数据库；五、构建神经网络并训练；六、基于神经网络的机动决策。本发明的空战机动决策具有较佳地优越性和快速性。

Description

一种基于粒子群搜索的神经网络空战机动决策方法

技术领域

本发明涉及空战机动决策技术领域，具体地说，涉及一种基于粒子群搜索的神经网络空战机动决策方法。

背景技术

空战在现代战争中越来越处于主导战争走向的关键因素，制空权决定着战场优势。随着人工智能等科学技术的发展，智能空战决策引起了世界范围内的广泛关注。比较典型的代表有专家***法、神经网络法、人工免疫法、遗传算法以及强化学习算法等，然而空战过程具有复杂高动态极强不确定性的特征，使得专家***、神经网络和遗传算法等方法所设计的决策***缺乏足够的完备性和灵活性，而强化学习算法存在回报函数难以适当设置、网络迭代收敛速度慢难以达到收敛条件。

发明内容

本发明的内容是提供一种基于粒子群搜索的神经网络空战机动决策方法，其能够克服现有技术的某种或某些缺陷。

根据本发明的一种基于粒子群搜索的神经网络空战机动决策方法，其包括以下步骤：

一、建立红蓝双方空战战斗机运动学与动力学模型；

二、建立空战态势优势函数，包括角度优势函数、速度优势函数、距离优势函数、高度优势函数；

三、粒子群算法优化空战机动决策；

四、生成空战双方轨迹与机动决策数据库；

五、构建神经网络并训练；

六、基于神经网络的机动决策。

作为优选，步骤一中，在地面坐标系中，ox轴取正东方向，oy轴取正北方向，oz轴取竖直方向，向上为正；在地面坐标系中红蓝双战机运动模型为：

在地面坐标系中，红蓝双方战机动力学模型

其中，(x,y,z)为红蓝战机在地面坐标系中的位置，

表示速度v在地面坐标系中的三轴分量，θ表示航迹倾角，ψ表示航迹偏角，g表示重力加速度，n_x表示轴向过载，n_z表示战机俯仰方向的过载，即法向过载，γ_v表示速度矢量的滚转角；通过n_x控制速度的大小，n_z和γ_v控制速度的方向。

作为优选，步骤二中，建立空战态势优势函数包括以下步骤：

2.1)建立角度优势函数，包括目标方位角优势函数和目标进入角优势函数；

目标方位角优势函数定义为：

式中，λ_{M max}是导弹的最大离轴发射角；q_r为红方战机的进入角，即蓝方战机的方位角；

目标进入角优势函数定义为：

式中，q_b为蓝方战机的进入角；

目标进入角和目标方位角对优势态势函数耦合影响，定义角度优势函数为：

式中，r₁和r₂分别目标方位角和目标进入角优势函数的权重因子，r₁+r₂＝1；

2.2)建立速度优势函数，速度优势函数为：

/>

式中，

V_r为红方战机速度，V_b为蓝方战机速度，V_o为最优空速，V_ro为红方战机速度与最优空速的比，V_or为最优空速与红方战机速度的比，V_bo为蓝方战机速度与最优空速的比，V_rb为红蓝战机速度比；

2.3)建立高度优势函数，高度优势函数为：

式中，Δh表示我方飞机与敌方飞机的高度差，单位为km，Δh＝h_R-h_B；h_K为理想高度差，范围为100～1000m；

h₀为空空导弹最大发射攻击区的高度；h_R红方战机高度，h_B蓝方战机高度，h_△k为红蓝双方高度差指数；

2.4)建立距离优势函数，距离优势函数为：

式中，T_d为距离优势函数指数，d_Mmax为导弹最大可攻击距离，d_Rmax为机载火控雷达最大可探测距离，d_Mkmin与d_Mkmax分别表示中距导弹不可逃逸的最近和最远距离；

2.5)态势优势函数由角度优势函数T_a、高度优势函数T_h、速度优势函数T_v和距离优势函数T_d组成，所述空战态势评估函数为：

T＝k₁T_d+k₂T_v+k₃T_h+k₄T_a；

式中，权重因子

作为优选，步骤三中，粒子群算法优化空战机动决策包括以下步骤：

3.1)初始化粒子种群并设定粒子种群规模和最大迭代数；

将空战决策变量[n_x,n_z,γ_v]作为粒子群算法的求解变量，并设定粒子种群规模和最大迭代数目；所述粒子群的种群规模即为粒子的数目，表示初始决策方案的个数，所述迭代次数时对决策变量不断进行修改的次数；

3.2)获取适应度函数值；

从指控中心获取红蓝双方的状态，通过态势函数获取当前态势值，并将其作为粒子群算法的适应度函数；

3.3)依据粒子群算法更新粒子位置和速度并计算对应的适应度值；

3.4)判断每个新粒子适应度值是否优于粒子个体的历史最优位置，若是则将此粒子替换为个体最优粒子，粒子迭代次数加1；

3.5)判断粒子适应度值是否满足要求或迭代次数是否达到最大迭代数，若满足则停止，不满足则转步骤3.3)。

作为优选，所述粒子群算法为：

设有m个未知参数，设v_i＝(v_i1,v_i2,...,v_im)和x_i＝(x_1i,x_2i,...,x_mi)是粒子i的目前飞行速度和飞行位置；p_i＝(p_i1,p_i2,...,p_im)是粒子所经历的最好位置，称为个体最优；P_g＝(P_g1,...,P_gm)为所有粒子所经历的最好位置，称为全局最优；基本PSO算法的进化方程为：

v_id(t+1)＝w×v_id(t)+c₁×r₁×(p_id(t)-x_id(t))+c₂×r₂×(P_gd-x_id(t))；

x_id(t+1)＝x_id(t)+v_id(t+1)；

其中：i＝1，2，…，n；d＝1，2，…，m；t表示第t代；w为惯性权重；r₁、r₂是[0,1]上的随机数；c₁、c₂为设置的常数，用于权衡单个粒子历史最优位置和群体粒子历史最优位置对速度的影响。

作为优选，步骤四中，生成空战双方轨迹与机动决策数据库包括以下步骤：

4.1)设定典型空战初始态势，设定蓝方战机按照典型机动或已训练好的进行机动决策；

4.2)通过粒子群算法对红方战机机动决策优化，生成满足要求的机动决策集和轨迹；

4.3)改变空战初始态势，设定蓝方机动动作序列或机动决策方法；

4.4)将每次满足适应度值的红蓝双方轨迹及红蓝双方决策序列存入空战双方轨迹与机动决策数据库；

4.5)重复步骤4.2)、步骤4.3)和步骤4.4)，直至所有典型初始态势和蓝方机动决策组合都搜索完为止。

作为优选，步骤五中，构建神经网络并训练包括以下步骤：

5.1)设置神经网络训练数据结构和构建训练样本集并归一化；

5.2)构建神经网络并训练，初始化网络权值，利用步骤5.1)中样本对网络进行训练，然后用测试样本对训练后的网络进行性能测试并更新网络参数再次训练。

作为优选，步骤5.1)中，将机动轨迹数据库，按照时间间隔进行采样，并构建训练输入输出样本对，其中样本输入为红蓝双方空战态势及状态信息，样本输出为红方战机机动决策变量[n_x,n_z,γ_v]；

在进行轨迹预测时，需考虑无人机本身的三维位置、姿态和速度信息，以及敌机的三维位置、姿态和速度信息，还需要考虑两机的相对距离、相对高度、速度矢量夹角、敌机进入角、敌机方位角；另外，还需考虑状态信息随时间变化的历史信息；用t₁至t_n时刻的红蓝双方的历史状态信息{S₁,S₂,...,S_n}预测t_n+1时刻空战机动a_n+1，其中，

x，y，z为战机位置，v为战机速度，θ_r，ψ_r分别为速度倾角和速度方向角，q表示战机进入角，r、b分别代表红方与蓝方，β表示红蓝双方战机的速度夹角；

历史状态信息和空战机动的映射关系可以表示为：

a_n+1＝f(S₁,S₂,...,S_n)；

对于给定的空战实测轨迹数据，首先利用目标机轨迹数据按照一定比例构建训练样本和测试样本；构建训练样本时，选取{S₁,S₂,...,S_n}组成第1个样本的输入，a_n+1为第一个样本的输出，然后再选取{S₂,S₂,...,S_n+1}为第2个样本的输入，a_n+2为样本期望输出，依次类推，最终可以形成以下训练样本矩阵：

其中，L_in为输入样本矩阵，L_in每一行为样本的输入矩阵，A_out为输出样本矩阵，A_out每一行为输入样本种对应的输出矩阵；测试样本矩阵也按照同样的方式进行构建；接着，对所有训练样本和测试样本进行数据归一化处理。

作为优选，步骤六中，基于神经网络的机动决策包括以下步骤：

6.1)设定红蓝双方空战初始态势，蓝方战机机动决策采用已训练的BP神经网络；

6.2)重复步骤二、步骤三和步骤四。

通过设计粒子群算法寻优空战决策过程中的最优解，并将优化结果作为神经网络的学习样本，避免了强化学习算法回报函数设置的难点和网络不收敛的缺陷，同时，将神经网络训练的结果用于蓝方机动决策，将其反过来作用于红方的决策寻优，避免了迭代策略无法应对前期蓝方机动策略的问题，通过交替冻结训练的方法，不断提高空战决策的适应范围。

附图说明

图1为实施例1中一种基于粒子群搜索的神经网络空战机动决策方法的流程图；

图2为实施例1中红蓝双方战斗机空战态势示意图；

图3(a)为实施例1中仿真算例1中粒子群优化红方战机轨迹示意图；

图3(b)为实施例1中仿真算例1中红方态势角曲线示意图；

图3(c)为实施例1中仿真算例1中红蓝双方态势示意图；

图4(a)为实施例1中仿真算例2中粒子群优化红方战机轨迹示意图；

图4(b)为实施例1中仿真算例2中红方态势角曲线示意图；

图4(c)为实施例1中仿真算例2中红蓝双方态势示意图。

具体实施方式

为进一步了解本发明的内容，结合附图和实施例对本发明作详细描述。应当理解的是，实施例仅仅是对本发明进行解释而并非限定。

实施例1

如图1所示，本实施例提供了一种基于粒子群搜索的神经网络空战机动决策方法，其包括以下步骤：

一、建立红蓝双方空战战斗机运动学与动力学模型；

在地面坐标系中，ox轴取正东方向，oy轴取正北方向，oz轴取竖直方向，向上为正；在地面坐标系中红蓝双战机运动模型为：

在地面坐标系中，红蓝双方战机动力学模型

其中，(x,y,z)为红蓝战机在地面坐标系中的位置，

建立空战态势优势函数包括以下步骤：

红蓝双方战斗机态势如图2所示，q_r为红方战机的进入角，即蓝方战机的方位角；q_b为蓝方战机的进入角；HCA为红蓝双方的交汇角；

从空空导弹发展至第4代以来，具备较强的离轴发射能力，在侧滑角和迎角一定时，目标方位角q_r越小，越容易满足格斗导弹发射条件，发射时态势值也越大，目标方位角优势函数定义为：

式中，λ_{M max}是导弹的最大离轴发射角；

目标进入角优势函数定义为：

2.2)建立速度优势函数，红蓝双方空战，战机速度越大导弹发射初速度也就越大，导弹的攻击范围也就越大，但速度过大会导致战机转弯半径大、飞行员反应时间变短、油耗增多，战机速度不能过大，其理想速度是保持在一定范围内高于敌机速度，速度过小或者过大都将导致速度分类指标下降，速度优势函数为：

式中，

2.3)建立高度优势函数，高度优势函数为：

式中，Δh表示我方飞机与敌方飞机的高度差，单位为km，Δh＝h_R-h_B；h_K为理想高度差，范围为100～1000m，在等于理想高度差时空空导弹的作战效能最佳；

h₀为空空导弹最大发射攻击区的高度；h_R红方战机高度，h_B蓝方战机高度，h_△k为红蓝双方高度差指数；/>

2.4)建立距离优势函数，导弹杀伤区具有近界和远界和不可逃逸区，导弹与目标距离不可逃逸区的杀伤概率最大，而在最近和最远发射区附近，杀伤概率较小且变化较快，因此，距离优势函数为：

T＝k₁T_d+k₂T_v+k₃T_h+k₄T_a；

式中，权重因子

三、粒子群算法优化空战机动决策；

粒子群算法优化空战机动决策包括以下步骤：

3.1)初始化粒子种群并设定粒子种群规模和最大迭代数；

3.2)获取适应度函数值；

所述粒子群算法为：

x_id(t+1)＝x_id(t)+v_id(t+1)；

仿真算例1

设定空战双方的战术决策周期为1s，红方在蓝方后，蓝方采取左急转机动躲避红方攻击，红方采用PSO算法优化机动决策。红蓝双方对抗初始态如下表1所示。

表1红蓝双方对抗初始状态

由上表分析可知，初始态势时，红方在蓝方尾后追击态势，优势明显，而蓝方为摆脱劣势态势，采取向左急转机动，红方速度大于蓝方，且红蓝双方距离较小，红方飞机若继续直飞，将有过冲处于劣势的危险，为此，采用PSO算法对红方机动策略进行优化，红蓝双方对抗仿真结果如图3(a)、图3(b)和图3(c)所示。

从图中可以看出，蓝方采取左急转弯以摆脱被尾追的劣势态势，红方为防止“过冲”，采取先左拉升后俯冲的机动决策，拉升动作将动能转换为势能，降低速度，继续保持尾追态势，同时保持能量不损。而后在一定高度俯冲加速攻击，继续保持尾追态势，整个机动过程呈“高呦呦”机动，优化结果符合预期。红蓝双方终止对抗状态如下表2给出。

表2红蓝双方对抗初始状态

仿真算例2

红方在蓝方后，蓝方采取左急转机动躲避红方攻击，红方采用PSO算法优化机动决策。红蓝双方对抗初始态如下表3所示。

表3红蓝双方对抗初始状态

由上表分析可知，初始态势时，红方在蓝方尾后追击态势，优势明显，而蓝方为摆脱劣势态势，采取向左急转机动，红方速度大于蓝方，且红蓝双方距离较小，红方飞机若继续直飞，将有过冲处于劣势的危险，为此，采用PSO算法对红方机动策略进行优化，红蓝双方对抗仿真结果如图4(a)、图4(b)和图4(c)所示。

四、生成空战双方轨迹与机动决策数据库；

生成空战双方轨迹与机动决策数据库包括以下步骤：

五、构建神经网络并训练；

构建神经网络并训练包括以下步骤：

5.1)设置神经网络训练数据结构和构建训练样本集并归一化；

步骤5.1)中，将机动轨迹数据库，按照时间间隔进行采样，并构建训练输入输出样本对，其中样本输入为红蓝双方空战态势及状态信息，样本输出为红方战机机动决策变量[n_x,n_z,γ_v]；

根据专家经验，无人机轨迹是连续变化不间断，且红蓝双方对抗时，属于高动态交互变化，蓝方机动轨迹对红方机动具有重要影响，且当前时刻以及历史时刻的状态对当前机动有影响，但历史轨迹所处的时刻与当前时刻越远则其对未来时刻的轨迹影响越小，轨迹预测时输入网络的历史数据越多并不一定能保证更高的预测准确率。

在进行轨迹预测时，需考虑无人机本身的三维位置、姿态和速度信息，以及敌机的三维位置、姿态和速度信息，由于敌我双方的高动态交互性，还需要考虑两机的相对距离、相对高度、速度矢量夹角、敌机进入角、敌机方位角；另外，还需考虑状态信息随时间变化的历史信息；用t₁至t_n时刻的红蓝双方的历史状态信息{S₁,S₂,...,S_n}预测t_n+1时刻空战机动a_n+1，其中，

历史状态信息和空战机动的映射关系可以表示为：

a_n+1＝f(S₁,S₂,...,S_n)；

/>

六、基于神经网络的机动决策。

6.2)重复步骤二、步骤三和步骤四。

本实施例基于粒子群优化神经网络空战机动决策方法，包括：基于角度、距离、高度、速度等因素构成空战优势态势函数，将其综合优势态势函数作为粒子优化算法适应度函数，以粒子群算法对红方战机机动决策进行优化；将优化结果用于训练空战决策神经网络，最后将网络应用于蓝方战机空战决策。

以上示意性的对本发明及其实施方式进行了描述，该描述没有限制性，附图中所示的也只是本发明的实施方式之一，实际的结构并不局限于此。所以，如果本领域的普通技术人员受其启示，在不脱离本发明创造宗旨的情况下，不经创造性的设计出与该技术方案相似的结构方式及实施例，均应属于本发明的保护范围。