CN114330115B - 一种基于粒子群搜索的神经网络空战机动决策方法 - Google Patents

一种基于粒子群搜索的神经网络空战机动决策方法 Download PDF

Info

Publication number
CN114330115B
CN114330115B CN202111566561.4A CN202111566561A CN114330115B CN 114330115 B CN114330115 B CN 114330115B CN 202111566561 A CN202111566561 A CN 202111566561A CN 114330115 B CN114330115 B CN 114330115B
Authority
CN
China
Prior art keywords
blue
red
air combat
speed
decision
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111566561.4A
Other languages
English (en)
Other versions
CN114330115A (zh
Inventor
刘滔
敖厚军
雍恩米
赵暾
王笑
郑凤麒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Computational Aerodynamics Institute of China Aerodynamics Research and Development Center
Original Assignee
Computational Aerodynamics Institute of China Aerodynamics Research and Development Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Computational Aerodynamics Institute of China Aerodynamics Research and Development Center filed Critical Computational Aerodynamics Institute of China Aerodynamics Research and Development Center
Publication of CN114330115A publication Critical patent/CN114330115A/zh
Application granted granted Critical
Publication of CN114330115B publication Critical patent/CN114330115B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)

Abstract

本发明涉及空战机动决策技术领域,涉及一种基于粒子群搜索的神经网络空战机动决策方法,其包括以下步骤:一、建立红蓝双方空战战斗机运动学与动力学模型;二、建立空战态势优势函数,包括角度优势函数、速度优势函数、距离优势函数、高度优势函数;三、粒子群算法优化空战机动决策;四、生成空战双方轨迹与机动决策数据库;五、构建神经网络并训练;六、基于神经网络的机动决策。本发明的空战机动决策具有较佳地优越性和快速性。

Description

一种基于粒子群搜索的神经网络空战机动决策方法
技术领域
本发明涉及空战机动决策技术领域,具体地说,涉及一种基于粒子群搜索的神经网络空战机动决策方法。
背景技术
空战在现代战争中越来越处于主导战争走向的关键因素,制空权决定着战场优势。随着人工智能等科学技术的发展,智能空战决策引起了世界范围内的广泛关注。比较典型的代表有专家***法、神经网络法、人工免疫法、遗传算法以及强化学习算法等,然而空战过程具有复杂高动态极强不确定性的特征,使得专家***、神经网络和遗传算法等方法所设计的决策***缺乏足够的完备性和灵活性,而强化学习算法存在回报函数难以适当设置、网络迭代收敛速度慢难以达到收敛条件。
发明内容
本发明的内容是提供一种基于粒子群搜索的神经网络空战机动决策方法,其能够克服现有技术的某种或某些缺陷。
根据本发明的一种基于粒子群搜索的神经网络空战机动决策方法,其包括以下步骤:
一、建立红蓝双方空战战斗机运动学与动力学模型;
二、建立空战态势优势函数,包括角度优势函数、速度优势函数、距离优势函数、高度优势函数;
三、粒子群算法优化空战机动决策;
四、生成空战双方轨迹与机动决策数据库;
五、构建神经网络并训练;
六、基于神经网络的机动决策。
作为优选,步骤一中,在地面坐标系中,ox轴取正东方向,oy轴取正北方向,oz轴取竖直方向,向上为正;在地面坐标系中红蓝双战机运动模型为:
Figure BDA0003422136710000021
在地面坐标系中,红蓝双方战机动力学模型
Figure BDA0003422136710000022
其中,(x,y,z)为红蓝战机在地面坐标系中的位置,
Figure BDA0003422136710000023
表示速度v在地面坐标系中的三轴分量,θ表示航迹倾角,ψ表示航迹偏角,g表示重力加速度,nx表示轴向过载,nz表示战机俯仰方向的过载,即法向过载,γv表示速度矢量的滚转角;通过nx控制速度的大小,nz和γv控制速度的方向。
作为优选,步骤二中,建立空战态势优势函数包括以下步骤:
2.1)建立角度优势函数,包括目标方位角优势函数和目标进入角优势函数;
目标方位角优势函数定义为:
Figure BDA0003422136710000024
式中,λM max是导弹的最大离轴发射角;qr为红方战机的进入角,即蓝方战机的方位角;
目标进入角优势函数定义为:
Figure BDA0003422136710000025
式中,qb为蓝方战机的进入角;
目标进入角和目标方位角对优势态势函数耦合影响,定义角度优势函数为:
Figure BDA0003422136710000031
式中,r1和r2分别目标方位角和目标进入角优势函数的权重因子,r1+r2=1;
2.2)建立速度优势函数,速度优势函数为:
Figure BDA0003422136710000032
/>
式中,
Figure BDA0003422136710000033
Vr为红方战机速度,Vb为蓝方战机速度,Vo为最优空速,Vro为红方战机速度与最优空速的比,Vor为最优空速与红方战机速度的比,Vbo为蓝方战机速度与最优空速的比,Vrb为红蓝战机速度比;
2.3)建立高度优势函数,高度优势函数为:
Figure BDA0003422136710000034
式中,Δh表示我方飞机与敌方飞机的高度差,单位为km,Δh=hR-hB;hK为理想高度差,范围为100~1000m;
Figure BDA0003422136710000035
h0为空空导弹最大发射攻击区的高度;hR红方战机高度,hB蓝方战机高度,h△k为红蓝双方高度差指数;
2.4)建立距离优势函数,距离优势函数为:
Figure BDA0003422136710000041
式中,Td为距离优势函数指数,dMmax为导弹最大可攻击距离,dRmax为机载火控雷达最大可探测距离,dMkmin与dMkmax分别表示中距导弹不可逃逸的最近和最远距离;
2.5)态势优势函数由角度优势函数Ta、高度优势函数Th、速度优势函数Tv和距离优势函数Td组成,所述空战态势评估函数为:
T=k1Td+k2Tv+k3Th+k4Ta
式中,权重因子
Figure BDA0003422136710000042
作为优选,步骤三中,粒子群算法优化空战机动决策包括以下步骤:
3.1)初始化粒子种群并设定粒子种群规模和最大迭代数;
将空战决策变量[nx,nzv]作为粒子群算法的求解变量,并设定粒子种群规模和最大迭代数目;所述粒子群的种群规模即为粒子的数目,表示初始决策方案的个数,所述迭代次数时对决策变量不断进行修改的次数;
3.2)获取适应度函数值;
从指控中心获取红蓝双方的状态,通过态势函数获取当前态势值,并将其作为粒子群算法的适应度函数;
3.3)依据粒子群算法更新粒子位置和速度并计算对应的适应度值;
3.4)判断每个新粒子适应度值是否优于粒子个体的历史最优位置,若是则将此粒子替换为个体最优粒子,粒子迭代次数加1;
3.5)判断粒子适应度值是否满足要求或迭代次数是否达到最大迭代数,若满足则停止,不满足则转步骤3.3)。
作为优选,所述粒子群算法为:
设有m个未知参数,设vi=(vi1,vi2,...,vim)和xi=(x1i,x2i,...,xmi)是粒子i的目前飞行速度和飞行位置;pi=(pi1,pi2,...,pim)是粒子所经历的最好位置,称为个体最优;Pg=(Pg1,...,Pgm)为所有粒子所经历的最好位置,称为全局最优;基本PSO算法的进化方程为:
vid(t+1)=w×vid(t)+c1×r1×(pid(t)-xid(t))+c2×r2×(Pgd-xid(t));
xid(t+1)=xid(t)+vid(t+1);
其中:i=1,2,…,n;d=1,2,…,m;t表示第t代;w为惯性权重;r1、r2是[0,1]上的随机数;c1、c2为设置的常数,用于权衡单个粒子历史最优位置和群体粒子历史最优位置对速度的影响。
作为优选,步骤四中,生成空战双方轨迹与机动决策数据库包括以下步骤:
4.1)设定典型空战初始态势,设定蓝方战机按照典型机动或已训练好的进行机动决策;
4.2)通过粒子群算法对红方战机机动决策优化,生成满足要求的机动决策集和轨迹;
4.3)改变空战初始态势,设定蓝方机动动作序列或机动决策方法;
4.4)将每次满足适应度值的红蓝双方轨迹及红蓝双方决策序列存入空战双方轨迹与机动决策数据库;
4.5)重复步骤4.2)、步骤4.3)和步骤4.4),直至所有典型初始态势和蓝方机动决策组合都搜索完为止。
作为优选,步骤五中,构建神经网络并训练包括以下步骤:
5.1)设置神经网络训练数据结构和构建训练样本集并归一化;
5.2)构建神经网络并训练,初始化网络权值,利用步骤5.1)中样本对网络进行训练,然后用测试样本对训练后的网络进行性能测试并更新网络参数再次训练。
作为优选,步骤5.1)中,将机动轨迹数据库,按照时间间隔进行采样,并构建训练输入输出样本对,其中样本输入为红蓝双方空战态势及状态信息,样本输出为红方战机机动决策变量[nx,nzv];
在进行轨迹预测时,需考虑无人机本身的三维位置、姿态和速度信息,以及敌机的三维位置、姿态和速度信息,还需要考虑两机的相对距离、相对高度、速度矢量夹角、敌机进入角、敌机方位角;另外,还需考虑状态信息随时间变化的历史信息;用t1至tn时刻的红蓝双方的历史状态信息{S1,S2,...,Sn}预测tn+1时刻空战机动an+1,其中,
Figure BDA0003422136710000061
Figure BDA0003422136710000062
x,y,z为战机位置,v为战机速度,θr,ψr分别为速度倾角和速度方向角,q表示战机进入角,r、b分别代表红方与蓝方,β表示红蓝双方战机的速度夹角;
历史状态信息和空战机动的映射关系可以表示为:
an+1=f(S1,S2,...,Sn);
对于给定的空战实测轨迹数据,首先利用目标机轨迹数据按照一定比例构建训练样本和测试样本;构建训练样本时,选取{S1,S2,...,Sn}组成第1个样本的输入,an+1为第一个样本的输出,然后再选取{S2,S2,...,Sn+1}为第2个样本的输入,an+2为样本期望输出,依次类推,最终可以形成以下训练样本矩阵:
Figure BDA0003422136710000063
其中,Lin为输入样本矩阵,Lin每一行为样本的输入矩阵,Aout为输出样本矩阵,Aout每一行为输入样本种对应的输出矩阵;测试样本矩阵也按照同样的方式进行构建;接着,对所有训练样本和测试样本进行数据归一化处理。
作为优选,步骤六中,基于神经网络的机动决策包括以下步骤:
6.1)设定红蓝双方空战初始态势,蓝方战机机动决策采用已训练的BP神经网络;
6.2)重复步骤二、步骤三和步骤四。
通过设计粒子群算法寻优空战决策过程中的最优解,并将优化结果作为神经网络的学习样本,避免了强化学习算法回报函数设置的难点和网络不收敛的缺陷,同时,将神经网络训练的结果用于蓝方机动决策,将其反过来作用于红方的决策寻优,避免了迭代策略无法应对前期蓝方机动策略的问题,通过交替冻结训练的方法,不断提高空战决策的适应范围。
附图说明
图1为实施例1中一种基于粒子群搜索的神经网络空战机动决策方法的流程图;
图2为实施例1中红蓝双方战斗机空战态势示意图;
图3(a)为实施例1中仿真算例1中粒子群优化红方战机轨迹示意图;
图3(b)为实施例1中仿真算例1中红方态势角曲线示意图;
图3(c)为实施例1中仿真算例1中红蓝双方态势示意图;
图4(a)为实施例1中仿真算例2中粒子群优化红方战机轨迹示意图;
图4(b)为实施例1中仿真算例2中红方态势角曲线示意图;
图4(c)为实施例1中仿真算例2中红蓝双方态势示意图。
具体实施方式
为进一步了解本发明的内容,结合附图和实施例对本发明作详细描述。应当理解的是,实施例仅仅是对本发明进行解释而并非限定。
实施例1
如图1所示,本实施例提供了一种基于粒子群搜索的神经网络空战机动决策方法,其包括以下步骤:
一、建立红蓝双方空战战斗机运动学与动力学模型;
在地面坐标系中,ox轴取正东方向,oy轴取正北方向,oz轴取竖直方向,向上为正;在地面坐标系中红蓝双战机运动模型为:
Figure BDA0003422136710000081
在地面坐标系中,红蓝双方战机动力学模型
Figure BDA0003422136710000082
其中,(x,y,z)为红蓝战机在地面坐标系中的位置,
Figure BDA0003422136710000083
表示速度v在地面坐标系中的三轴分量,θ表示航迹倾角,ψ表示航迹偏角,g表示重力加速度,nx表示轴向过载,nz表示战机俯仰方向的过载,即法向过载,γv表示速度矢量的滚转角;通过nx控制速度的大小,nz和γv控制速度的方向。
二、建立空战态势优势函数,包括角度优势函数、速度优势函数、距离优势函数、高度优势函数;
建立空战态势优势函数包括以下步骤:
2.1)建立角度优势函数,包括目标方位角优势函数和目标进入角优势函数;
红蓝双方战斗机态势如图2所示,qr为红方战机的进入角,即蓝方战机的方位角;qb为蓝方战机的进入角;HCA为红蓝双方的交汇角;
从空空导弹发展至第4代以来,具备较强的离轴发射能力,在侧滑角和迎角一定时,目标方位角qr越小,越容易满足格斗导弹发射条件,发射时态势值也越大,目标方位角优势函数定义为:
Figure BDA0003422136710000091
式中,λM max是导弹的最大离轴发射角;
目标进入角优势函数定义为:
Figure BDA0003422136710000092
目标进入角和目标方位角对优势态势函数耦合影响,定义角度优势函数为:
Figure BDA0003422136710000093
式中,r1和r2分别目标方位角和目标进入角优势函数的权重因子,r1+r2=1;
2.2)建立速度优势函数,红蓝双方空战,战机速度越大导弹发射初速度也就越大,导弹的攻击范围也就越大,但速度过大会导致战机转弯半径大、飞行员反应时间变短、油耗增多,战机速度不能过大,其理想速度是保持在一定范围内高于敌机速度,速度过小或者过大都将导致速度分类指标下降,速度优势函数为:
Figure BDA0003422136710000094
式中,
Figure BDA0003422136710000095
Vr为红方战机速度,Vb为蓝方战机速度,Vo为最优空速,Vro为红方战机速度与最优空速的比,Vor为最优空速与红方战机速度的比,Vbo为蓝方战机速度与最优空速的比,Vrb为红蓝战机速度比;
2.3)建立高度优势函数,高度优势函数为:
Figure BDA0003422136710000101
式中,Δh表示我方飞机与敌方飞机的高度差,单位为km,Δh=hR-hB;hK为理想高度差,范围为100~1000m,在等于理想高度差时空空导弹的作战效能最佳;
Figure BDA0003422136710000102
h0为空空导弹最大发射攻击区的高度;hR红方战机高度,hB蓝方战机高度,h△k为红蓝双方高度差指数;/>
2.4)建立距离优势函数,导弹杀伤区具有近界和远界和不可逃逸区,导弹与目标距离不可逃逸区的杀伤概率最大,而在最近和最远发射区附近,杀伤概率较小且变化较快,因此,距离优势函数为:
Figure BDA0003422136710000103
式中,Td为距离优势函数指数,dMmax为导弹最大可攻击距离,dRmax为机载火控雷达最大可探测距离,dMkmin与dMkmax分别表示中距导弹不可逃逸的最近和最远距离;
2.5)态势优势函数由角度优势函数Ta、高度优势函数Th、速度优势函数Tv和距离优势函数Td组成,所述空战态势评估函数为:
T=k1Td+k2Tv+k3Th+k4Ta
式中,权重因子
Figure BDA0003422136710000111
三、粒子群算法优化空战机动决策;
粒子群算法优化空战机动决策包括以下步骤:
3.1)初始化粒子种群并设定粒子种群规模和最大迭代数;
将空战决策变量[nx,nzv]作为粒子群算法的求解变量,并设定粒子种群规模和最大迭代数目;所述粒子群的种群规模即为粒子的数目,表示初始决策方案的个数,所述迭代次数时对决策变量不断进行修改的次数;
3.2)获取适应度函数值;
从指控中心获取红蓝双方的状态,通过态势函数获取当前态势值,并将其作为粒子群算法的适应度函数;
3.3)依据粒子群算法更新粒子位置和速度并计算对应的适应度值;
所述粒子群算法为:
设有m个未知参数,设vi=(vi1,vi2,...,vim)和xi=(x1i,x2i,...,xmi)是粒子i的目前飞行速度和飞行位置;pi=(pi1,pi2,...,pim)是粒子所经历的最好位置,称为个体最优;Pg=(Pg1,...,Pgm)为所有粒子所经历的最好位置,称为全局最优;基本PSO算法的进化方程为:
vid(t+1)=w×vid(t)+c1×r1×(pid(t)-xid(t))+c2×r2×(Pgd-xid(t));
xid(t+1)=xid(t)+vid(t+1);
其中:i=1,2,…,n;d=1,2,…,m;t表示第t代;w为惯性权重;r1、r2是[0,1]上的随机数;c1、c2为设置的常数,用于权衡单个粒子历史最优位置和群体粒子历史最优位置对速度的影响。
3.4)判断每个新粒子适应度值是否优于粒子个体的历史最优位置,若是则将此粒子替换为个体最优粒子,粒子迭代次数加1;
3.5)判断粒子适应度值是否满足要求或迭代次数是否达到最大迭代数,若满足则停止,不满足则转步骤3.3)。
仿真算例1
设定空战双方的战术决策周期为1s,红方在蓝方后,蓝方采取左急转机动躲避红方攻击,红方采用PSO算法优化机动决策。红蓝双方对抗初始态如下表1所示。
表1红蓝双方对抗初始状态
Figure BDA0003422136710000121
由上表分析可知,初始态势时,红方在蓝方尾后追击态势,优势明显,而蓝方为摆脱劣势态势,采取向左急转机动,红方速度大于蓝方,且红蓝双方距离较小,红方飞机若继续直飞,将有过冲处于劣势的危险,为此,采用PSO算法对红方机动策略进行优化,红蓝双方对抗仿真结果如图3(a)、图3(b)和图3(c)所示。
从图中可以看出,蓝方采取左急转弯以摆脱被尾追的劣势态势,红方为防止“过冲”,采取先左拉升后俯冲的机动决策,拉升动作将动能转换为势能,降低速度,继续保持尾追态势,同时保持能量不损。而后在一定高度俯冲加速攻击,继续保持尾追态势,整个机动过程呈“高呦呦”机动,优化结果符合预期。红蓝双方终止对抗状态如下表2给出。
表2红蓝双方对抗初始状态
Figure BDA0003422136710000122
仿真算例2
红方在蓝方后,蓝方采取左急转机动躲避红方攻击,红方采用PSO算法优化机动决策。红蓝双方对抗初始态如下表3所示。
表3红蓝双方对抗初始状态
Figure BDA0003422136710000131
由上表分析可知,初始态势时,红方在蓝方尾后追击态势,优势明显,而蓝方为摆脱劣势态势,采取向左急转机动,红方速度大于蓝方,且红蓝双方距离较小,红方飞机若继续直飞,将有过冲处于劣势的危险,为此,采用PSO算法对红方机动策略进行优化,红蓝双方对抗仿真结果如图4(a)、图4(b)和图4(c)所示。
四、生成空战双方轨迹与机动决策数据库;
生成空战双方轨迹与机动决策数据库包括以下步骤:
4.1)设定典型空战初始态势,设定蓝方战机按照典型机动或已训练好的进行机动决策;
4.2)通过粒子群算法对红方战机机动决策优化,生成满足要求的机动决策集和轨迹;
4.3)改变空战初始态势,设定蓝方机动动作序列或机动决策方法;
4.4)将每次满足适应度值的红蓝双方轨迹及红蓝双方决策序列存入空战双方轨迹与机动决策数据库;
4.5)重复步骤4.2)、步骤4.3)和步骤4.4),直至所有典型初始态势和蓝方机动决策组合都搜索完为止。
五、构建神经网络并训练;
构建神经网络并训练包括以下步骤:
5.1)设置神经网络训练数据结构和构建训练样本集并归一化;
步骤5.1)中,将机动轨迹数据库,按照时间间隔进行采样,并构建训练输入输出样本对,其中样本输入为红蓝双方空战态势及状态信息,样本输出为红方战机机动决策变量[nx,nzv];
根据专家经验,无人机轨迹是连续变化不间断,且红蓝双方对抗时,属于高动态交互变化,蓝方机动轨迹对红方机动具有重要影响,且当前时刻以及历史时刻的状态对当前机动有影响,但历史轨迹所处的时刻与当前时刻越远则其对未来时刻的轨迹影响越小,轨迹预测时输入网络的历史数据越多并不一定能保证更高的预测准确率。
在进行轨迹预测时,需考虑无人机本身的三维位置、姿态和速度信息,以及敌机的三维位置、姿态和速度信息,由于敌我双方的高动态交互性,还需要考虑两机的相对距离、相对高度、速度矢量夹角、敌机进入角、敌机方位角;另外,还需考虑状态信息随时间变化的历史信息;用t1至tn时刻的红蓝双方的历史状态信息{S1,S2,...,Sn}预测tn+1时刻空战机动an+1,其中,
Figure BDA0003422136710000141
x,y,z为战机位置,v为战机速度,θr,ψr分别为速度倾角和速度方向角,q表示战机进入角,r、b分别代表红方与蓝方,β表示红蓝双方战机的速度夹角;
历史状态信息和空战机动的映射关系可以表示为:
an+1=f(S1,S2,...,Sn);
对于给定的空战实测轨迹数据,首先利用目标机轨迹数据按照一定比例构建训练样本和测试样本;构建训练样本时,选取{S1,S2,...,Sn}组成第1个样本的输入,an+1为第一个样本的输出,然后再选取{S2,S2,...,Sn+1}为第2个样本的输入,an+2为样本期望输出,依次类推,最终可以形成以下训练样本矩阵:
Figure BDA0003422136710000151
/>
其中,Lin为输入样本矩阵,Lin每一行为样本的输入矩阵,Aout为输出样本矩阵,Aout每一行为输入样本种对应的输出矩阵;测试样本矩阵也按照同样的方式进行构建;接着,对所有训练样本和测试样本进行数据归一化处理。
5.2)构建神经网络并训练,初始化网络权值,利用步骤5.1)中样本对网络进行训练,然后用测试样本对训练后的网络进行性能测试并更新网络参数再次训练。
六、基于神经网络的机动决策。
6.1)设定红蓝双方空战初始态势,蓝方战机机动决策采用已训练的BP神经网络;
6.2)重复步骤二、步骤三和步骤四。
本实施例基于粒子群优化神经网络空战机动决策方法,包括:基于角度、距离、高度、速度等因素构成空战优势态势函数,将其综合优势态势函数作为粒子优化算法适应度函数,以粒子群算法对红方战机机动决策进行优化;将优化结果用于训练空战决策神经网络,最后将网络应用于蓝方战机空战决策。
以上示意性的对本发明及其实施方式进行了描述,该描述没有限制性,附图中所示的也只是本发明的实施方式之一,实际的结构并不局限于此。所以,如果本领域的普通技术人员受其启示,在不脱离本发明创造宗旨的情况下,不经创造性的设计出与该技术方案相似的结构方式及实施例,均应属于本发明的保护范围。

Claims (7)

1.一种基于粒子群搜索的神经网络空战机动决策方法,其特征在于:包括以下步骤:
一、建立红蓝双方空战战斗机运动学与动力学模型;
二、建立空战态势优势函数,包括角度优势函数、速度优势函数、距离优势函数、高度优势函数;
三、粒子群算法优化空战机动决策;
四、生成空战双方轨迹与机动决策数据库;
五、构建神经网络并训练;
步骤五中,构建神经网络并训练包括以下步骤:
5.1)设置神经网络训练数据结构和构建训练样本集并归一化;
5.2)构建神经网络并训练,初始化网络权值,利用步骤5.1)中样本对网络进行训练,然后用测试样本对训练后的网络进行性能测试并更新网络参数再次训练;
步骤5.1)中,将机动轨迹数据库,按照时间间隔进行采样,并构建训练输入输出样本对,其中样本输入为红蓝双方空战态势及状态信息,样本输出为红方战机机动决策变量[nx,nzv];
在进行轨迹预测时,需考虑无人机本身的三维位置、姿态和速度信息,以及敌机的三维位置、姿态和速度信息,还需要考虑两机的相对距离、相对高度、速度矢量夹角、敌机进入角、敌机方位角;另外,还需考虑状态信息随时间变化的历史信息;用t1至tn时刻的红蓝双方的历史状态信息{S1,S2,...,Sn}预测tn+1时刻空战机动an+1,其中,
Figure QLYQS_1
Figure QLYQS_2
x,y,z为战机位置,v为战机速度,θr,ψr分别为速度倾角和速度方向角,q表示战机进入角,r、b分别代表红方与蓝方,β表示红蓝双方战机的速度夹角;
历史状态信息和空战机动的映射关系可以表示为:
an+1=f(S1,S2,...,Sn);
对于给定的空战实测轨迹数据,首先利用目标机轨迹数据按照一定比例构建训练样本和测试样本;构建训练样本时,选取{S1,S2,...,Sn}组成第1个样本的输入,an+1为第一个样本的输出,然后再选取{S2,S2,...,Sn+1}为第2个样本的输入,an+2为样本期望输出,依次类推,最终可以形成以下训练样本矩阵:
Figure QLYQS_3
其中,Lin为输入样本矩阵,Lin每一行为样本的输入矩阵,Aout为输出样本矩阵,Aout每一行为输入样本种对应的输出矩阵;测试样本矩阵也按照同样的方式进行构建;接着,对所有训练样本和测试样本进行数据归一化处理;
六、基于神经网络的机动决策。
2.根据权利要求1所述的一种基于粒子群搜索的神经网络空战机动决策方法,其特征在于:步骤一中,在地面坐标系中,ox轴取正东方向,oy轴取正北方向,oz轴取竖直方向,向上为正;在地面坐标系中红蓝双战机运动模型为:
Figure QLYQS_4
在地面坐标系中,红蓝双方战机动力学模型
Figure QLYQS_5
其中,(x,y,z)为红蓝战机在地面坐标系中的位置,
Figure QLYQS_6
表示速度v在地面坐标系中的三轴分量,θ表示航迹倾角,ψ表示航迹偏角,g表示重力加速度,nx表示轴向过载,nz表示战机俯仰方向的过载,即法向过载,γv表示速度矢量的滚转角;通过nx控制速度的大小,nz和γv控制速度的方向。
3.根据权利要求2所述的一种基于粒子群搜索的神经网络空战机动决策方法,其特征在于:步骤二中,建立空战态势优势函数包括以下步骤:
2.1)建立角度优势函数,包括目标方位角优势函数和目标进入角优势函数;
目标方位角优势函数定义为:
Figure QLYQS_7
式中,λMmax是导弹的最大离轴发射角;qr为红方战机的进入角,即蓝方战机的方位角;
目标进入角优势函数定义为:
Figure QLYQS_8
式中,qb为蓝方战机的进入角;
目标进入角和目标方位角对优势态势函数耦合影响,定义角度优势函数为:
Figure QLYQS_9
式中,r1和r2分别目标方位角和目标进入角优势函数的权重因子,r1+r2=1;
2.2)建立速度优势函数,速度优势函数为:
Figure QLYQS_10
式中,
Figure QLYQS_11
Vr为红方战机速度,Vb为蓝方战机速度,Vo为最优空速,Vro为红方战机速度与最优空速的比,Vor为最优空速与红方战机速度的比,Vbo为蓝方战机速度与最优空速的比,Vrb为红蓝战机速度比;
2.3)建立高度优势函数,高度优势函数为:
Figure QLYQS_12
式中,Δh表示我方飞机与敌方飞机的高度差,单位为km,Δh=hR-hB;hK为理想高度差,范围为100~1000m;
Figure QLYQS_13
h0为空空导弹最大发射攻击区的高度;hR红方战机高度,hB蓝方战机高度,h△k为红蓝双方高度差指数;
2.4)建立距离优势函数,距离优势函数为:
Figure QLYQS_14
式中,Td为距离优势函数指数,dMmax为导弹最大可攻击距离,dRmax为机载火控雷达最大可探测距离,dMkmin与dMkmax分别表示中距导弹不可逃逸的最近和最远距离;
2.5)态势优势函数由角度优势函数Ta、高度优势函数Th、速度优势函数Tv和距离优势函数Td组成,所述空战态势评估函数为:
T=k1Td+k2Tv+k3Th+k4Ta
式中,权重因子
Figure QLYQS_15
4.根据权利要求3所述的一种基于粒子群搜索的神经网络空战机动决策方法,其特征在于:步骤三中,粒子群算法优化空战机动决策包括以下步骤:
3.1)初始化粒子种群并设定粒子种群规模和最大迭代数;
将空战决策变量[nx,nzv]作为粒子群算法的求解变量,并设定粒子种群规模和最大迭代数目;所述粒子群的种群规模即为粒子的数目,表示初始决策方案的个数,所述迭代次数时对决策变量不断进行修改的次数;
3.2)获取适应度函数值;
从指控中心获取红蓝双方的状态,通过态势函数获取当前态势值,并将其作为粒子群算法的适应度函数;
3.3)依据粒子群算法更新粒子位置和速度并计算对应的适应度值;
3.4)判断每个新粒子适应度值是否优于粒子个体的历史最优位置,若是则将此粒子替换为个体最优粒子,粒子迭代次数加1;
3.5)判断粒子适应度值是否满足要求或迭代次数是否达到最大迭代数,若满足则停止,不满足则转步骤3.3)。
5.根据权利要求4所述的一种基于粒子群搜索的神经网络空战机动决策方法,其特征在于:所述粒子群算法为:
设有m个未知参数,设vi=(vi1,vi2,...,vim)和xi=(x1i,x2i,...,xmi)是粒子i的目前飞行速度和飞行位置;pi=(pi1,pi2,...,pim)是粒子所经历的最好位置,称为个体最优;Pg=(Pg1,...,Pgm)为所有粒子所经历的最好位置,称为全局最优;基本PSO算法的进化方程为:
vid(t+1)=w×vid(t)+c1×r1×(pid(t)-xid(t))+c2×r2×(Pgd-xid(t));
xid(t+1)=xid(t)+vid(t+1);
其中:i=1,2,…,n;d=1,2,…,m;t表示第t代;w为惯性权重;r1、r2是[0,1]上的随机数;c1、c2为设置的常数,用于权衡单个粒子历史最优位置和群体粒子历史最优位置对速度的影响。
6.根据权利要求5所述的一种基于粒子群搜索的神经网络空战机动决策方法,其特征在于:步骤四中,生成空战双方轨迹与机动决策数据库包括以下步骤:
4.1)设定典型空战初始态势,设定蓝方战机按照典型机动或已训练好的进行机动决策;
4.2)通过粒子群算法对红方战机机动决策优化,生成满足要求的机动决策集和轨迹;
4.3)改变空战初始态势,设定蓝方机动动作序列或机动决策方法;
4.4)将每次满足适应度值的红蓝双方轨迹及红蓝双方决策序列存入空战双方轨迹与机动决策数据库;
4.5)重复步骤4.2)、步骤4.3)和步骤4.4),直至所有典型初始态势和蓝方机动决策组合都搜索完为止。
7.根据权利要求6所述的一种基于粒子群搜索的神经网络空战机动决策方法,其特征在于:步骤六中,基于神经网络的机动决策包括以下步骤:
6.1)设定红蓝双方空战初始态势,蓝方战机机动决策采用已训练的BP神经网络;
6.2)重复步骤二、步骤三和步骤四。
CN202111566561.4A 2021-10-27 2021-12-20 一种基于粒子群搜索的神经网络空战机动决策方法 Active CN114330115B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202111257925 2021-10-27
CN2021112579250 2021-10-27

Publications (2)

Publication Number Publication Date
CN114330115A CN114330115A (zh) 2022-04-12
CN114330115B true CN114330115B (zh) 2023-06-09

Family

ID=81054800

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111566561.4A Active CN114330115B (zh) 2021-10-27 2021-12-20 一种基于粒子群搜索的神经网络空战机动决策方法

Country Status (1)

Country Link
CN (1) CN114330115B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115268496B (zh) * 2022-08-03 2023-08-18 中国航空工业集团公司沈阳飞机设计研究所 一种无人机空中对抗机动控制器及其设计方法
CN116679742B (zh) * 2023-04-11 2024-04-02 中国人民解放军海军航空大学 一种多六自由度飞行器协同作战决策方法
CN116880186B (zh) * 2023-07-13 2024-04-16 四川大学 一种数据驱动的自适应动态规划空战决策方法
CN116991074A (zh) * 2023-08-28 2023-11-03 四川大学 一种智能权重下的近距空战机动决策优化方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101908097B (zh) * 2010-07-13 2012-03-21 北京航空航天大学 一种空战决策的粒子群优化方法
CN108319286B (zh) * 2018-03-12 2020-09-22 西北工业大学 一种基于强化学习的无人机空战机动决策方法
BR112021007431A2 (pt) * 2018-10-29 2021-08-03 Valentin Luca método de alta eficiência usando veículos aéreos não tripulados para combate a incêndios
CN112327631B (zh) * 2020-11-20 2022-06-10 成都精航伟泰科技有限公司 一种粒子群优化rbf神经网络的pid控制方法
CN112947581B (zh) * 2021-03-25 2022-07-05 西北工业大学 基于多智能体强化学习的多无人机协同空战机动决策方法

Also Published As

Publication number Publication date
CN114330115A (zh) 2022-04-12

Similar Documents

Publication Publication Date Title
CN114330115B (zh) 一种基于粒子群搜索的神经网络空战机动决策方法
Yang et al. UAV air combat autonomous maneuver decision based on DDPG algorithm
CN111880563B (zh) 一种基于maddpg的多无人机任务决策方法
CN113467508B (zh) 面向围捕任务的多无人机智能协同决策方法
CN113095481A (zh) 一种基于并行自我博弈的空战机动方法
CN113093802A (zh) 一种基于深度强化学习的无人机机动决策方法
CN111859541B (zh) 一种基于迁移学习改进的pmaddpg多无人机任务决策方法
CN113282061A (zh) 一种基于课程学习的无人机空中博弈对抗的解决方法
Zhang et al. Maneuver decision-making of deep learning for UCAV thorough azimuth angles
Li et al. Collaborative decision-making method for multi-UAV based on multiagent reinforcement learning
Li et al. Autonomous maneuver decision-making for a UCAV in short-range aerial combat based on an MS-DDQN algorithm
CN114063644B (zh) 基于鸽群反向对抗学习的无人作战飞机空战自主决策方法
CN113625569B (zh) 一种基于混合决策模型的小型无人机防控决策方法及***
Fu et al. The overview for UAV air-combat decision method
CN116501086B (zh) 一种基于强化学习的飞行器自主规避决策方法
CN115903865A (zh) 一种飞行器近距空战机动决策实现方法
CN113741186B (zh) 一种基于近端策略优化的双机空战决策方法
Xianyong et al. Research on maneuvering decision algorithm based on improved deep deterministic policy gradient
Duan et al. Autonomous maneuver decision for unmanned aerial vehicle via improved pigeon-inspired optimization
Guo et al. Maneuver decision of UAV in air combat based on deterministic policy gradient
Meng et al. One-to-one close air combat maneuver decision method based on target maneuver intention prediction
CN115097861A (zh) 一种基于cel-maddpg的多无人机围捕策略方法
Wang et al. Research on naval air defense intelligent operations on deep reinforcement learning
Guopeng et al. Research on Path planning of Three-Dimensional UAV Based on Levy Flight Strategy and Improved Particle Swarm Optimization Algorithm
Meng et al. UAV Attack and Defense Optimization Guidance Method Based on Target Trajectory Prediction

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant