CN114485676A - 一种分布式飞行雷达平台的航迹规划方法 - Google Patents
一种分布式飞行雷达平台的航迹规划方法 Download PDFInfo
- Publication number
- CN114485676A CN114485676A CN202210153345.5A CN202210153345A CN114485676A CN 114485676 A CN114485676 A CN 114485676A CN 202210153345 A CN202210153345 A CN 202210153345A CN 114485676 A CN114485676 A CN 114485676A
- Authority
- CN
- China
- Prior art keywords
- radar
- target
- radar platform
- platform
- performance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 238000001514 detection method Methods 0.000 claims abstract description 84
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 46
- 238000004364 calculation method Methods 0.000 claims description 21
- 238000012549 training Methods 0.000 claims description 16
- 230000001133 acceleration Effects 0.000 claims description 13
- 239000013598 vector Substances 0.000 claims description 13
- 230000009471 action Effects 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 11
- 238000012360 testing method Methods 0.000 claims description 5
- 238000013459 approach Methods 0.000 claims description 4
- 230000003247 decreasing effect Effects 0.000 claims description 3
- 238000004590 computer program Methods 0.000 claims description 2
- 238000005457 optimization Methods 0.000 abstract description 13
- 230000008859 change Effects 0.000 abstract description 8
- 238000002592 echocardiography Methods 0.000 abstract description 2
- 239000003795 chemical substances by application Substances 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 8
- 230000002787 reinforcement Effects 0.000 description 5
- 230000007613 environmental effect Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 241001505100 Succisa pratensis Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C21/00—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
- G01C21/20—Instruments for performing navigational calculations
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S7/00—Details of systems according to groups G01S13/00, G01S15/00, G01S17/00
- G01S7/02—Details of systems according to groups G01S13/00, G01S15/00, G01S17/00 of systems according to group G01S13/00
- G01S7/40—Means for monitoring or calibrating
Landscapes
- Engineering & Computer Science (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Computer Networks & Wireless Communication (AREA)
- Radar Systems Or Details Thereof (AREA)
Abstract
发明属于分布式雷达的航迹规划领域,特别涉及一种分布式飞行雷达平台的航迹规划方法。本发明通过选择几何精度因子作为定位性能,并通过接收信号回波计算检测性能,以及将检测性能与定位性能分别加权后作为MADDPG算法的奖励,并基于优化目标建立MADDPG算法;可以在航迹规划时兼顾检测性能以及定位性能;同时因为在航迹规划时考虑了航迹对雷达检测性能以及定位性能的影响,因此使用本发明规划的航迹可以在目标及雷达平台位置实时变化的场景中达到预期的高性能。
Description
技术领域
本发明属于分布式雷达的航迹规划领域,特别涉及一种分布式飞行雷达平台的航迹规划方法。
背景技术
目前,分布式飞行雷达平台大多用于对地海目标进行检测及定位,其主要任务为:以广域复杂地图为背景依靠多平台协同检测及定位,通过离线训练形成智能空间构型,经在线训练得到最优策略(航迹),分布式飞行雷达平台按照策略飞行,实现在地图杂波信息的干扰下对指定任务目标的检测及定位,并飞行至目标位置。
现有的针对分布式雷达的航迹规划多为静态或瞬时动态环境下的,即目标的位置较为固定且回波信息不影响雷达的检测位置;其仅通过对接收回波进行滤波提高检测及定位性能,不会考虑航迹对检测及定位性能的影响;目前基于深度强化学***台的空间位置关系进行优化,通过训练达到避障及飞行到指定目标位置的效果;两种技术在高动态的复杂地海环境中实现目标的高性能检测及定位都面临很大挑战。现有的基于深度强化学***台与目标的距离远近及位置关系等因素都会影响其检测及定位性能,从而影响构型优化结果,因此构型优化结果无法适用于真实的地图环境。
现有的针对分布式飞行雷达平台的航迹规划技术并没有考虑平台与目标之间,因为相对位置时变对检测性能及定位性能的影响;即当平台在不断接近目标的动态过程中,发射及接收到的信号也会随之变化,导致检测及定位性能的变化;因此现有的航迹规划方法在目标及雷达平台位置实时变化的场景中表现不好。
发明内容
本发明的目的在于克服现有的航迹规划技术,在目标及雷达平台位置实时变化的场景中很难达到预期的高性能的问题,提供一种分布式飞行雷达平台的航迹规划方法。
本发明的第一方面提供一种分布式飞行雷达平台的航迹规划方法,包括如下步骤:
S1.获取环境信息以及目标信息,使用目标回波信号模型得到目标回波信号幅度,并将所有环境回波信号叠加得到杂波信号幅度;
S2.将目标回波与环境回波叠加得到接收信号回波,计算雷达平台的检测性能;以及,计算雷达平台的几何精度因子并作为雷达平台的定位性能;
S3.将所述检测性能与所述定位性能作为MADDPG算法的奖励,根据雷达平台的物理特性建立雷达平台飞行轨迹的约束条件;
S4.基于所述奖励以及所述约束条件建立MADDPG算法,并对所述MADDPG算法进行离线训练;
S5.将雷达平台的初始位置、目标位置范围输入至训练好的MADDPG算法中;训练好的MADDPG算法在雷达平台的飞行过程中与环境交互,得到分布式雷达平台的航迹。
可以理解的是,雷达平台的物理特性可以包括:雷达平台的加速度、速度、转弯速率、飞行高度等。
进一步的是,所述S3中,将所述检测性能与所述定位性能作为MADDPG算法的奖励,包括:
计算检测权重,将所述检测权重与所述检测性能作为检测奖励r2,r2=w1f1;其中,w1为检测权重,f1为检测性能;
计算定位权重,将所述定位权重与所述定位性能作为定位奖励r3,r3=w2f2;其中,w2为定位权重,f2为定位性能。
进一步的是,使用指数递减惯性权重算法得到定位权重以及检测权重。
进一步的是,所述定位权重w2的计算方法如下:
其中,f1为检测性能,f1max为训练中检测性能能达到的最大值;
检测权重w1的计算方法为:
w1=1-w2。
进一步的是,在所述S3中,将所述检测性能与所述定位性能作为MADDPG算法的奖励,
还包括:设置行动奖励、目标奖励与碰撞奖励;
一种分布式飞行雷达平台的航迹规划方法
本发明属于分布式雷达的航迹规划领域,特别涉及一种分布式飞行雷达平台的航迹规划方法。
目前,分布式飞行雷达平台大多用于对地海目标进行检测及定位,其主要任务为:以广域复杂地图为背景依靠多平台协同检测及定位,通过离线训练形成智能空间构型,经在线训练得到最优策略(航迹),分布式飞行雷达平台按照策略飞行,实现在地图杂波信息的干扰下对指定任务目标的检测及定位,并飞行至目标位置。
现有的针对分布式雷达的航迹规划多为静态或瞬时动态环境下的,即目标的位置较为固定且回波信息不影响雷达的检测位置;其仅通过对接收回波进行滤波提高检测及定位性能,不会考虑航迹对检测及定位性能的影响;目前基于深度强化学***台的空间位置关系进行优化,通过训练达到避障及飞行到指定目标位置的效果;两种技术在高动态的复杂地海环境中实现目标的高性能检测及定位都面临很大挑战。现有的基于深度强化学***台与目标的距离远近及位置关系等因素都会影响其检测及定位性能,从而影响构型优化结果,因此构型优化结果无法适用于真实的地图环境。
现有的针对分布式飞行雷达平台的航迹规划技术并没有考虑平台与目标之间,因为相对位置时变对检测性能及定位性能的影响;即当平台在不断接近目标的动态过程中,发射及接收到的信号也会随之变化,导致检测及定位性能的变化;因此现有的航迹规划方法在目标及雷达平台位置实时变化的场景中表现不好。
本发明的目的在于克服现有的航迹规划技术,在目标及雷达平台位置实时变化的场景中很难达到预期的高性能的问题,提供一种分布式飞行雷达平台的航迹规划方法。
本发明的第一方面提供一种分布式飞行雷达平台的航迹规划方法,包括如下步骤:
S1.获取环境信息以及目标信息,使用目标回波信号模型得到目标回波信号幅度,并将所有环境回波信号叠加得到杂波信号幅度;
S2.将目标回波与环境回波叠加得到接收信号回波,计算雷达平台的检测性能;以及,计算雷达平台的几何精度因子并作为雷达平台的定位性能;
S3.将所述检测性能与所述定位性能作为MADDPG算法的奖励,根据雷达平台的物理特性建立雷达平台飞行轨迹的约束条件;
S4.基于所述奖励以及所述约束条件建立MADDPG算法,并对所述MADDPG算法进行离线训练;
S5.将雷达平台的初始位置、目标位置范围输入至训练好的MADDPG算法中;训练好的MADDPG算法在雷达平台的飞行过程中与环境交互,得到分布式雷达平台的航迹。
可以理解的是,雷达平台的物理特性可以包括:雷达平台的加速度、速度、转弯速率、飞行高度等。
进一步的是,所述S3中,将所述检测性能与所述定位性能作为MADDPG算法的奖励,包括:
计算检测权重,将所述检测权重与所述检测性能作为检测奖励r2,r2=w1f1;其中,w1为检测权重,f1为检测性能;
计算定位权重,将所述定位权重与所述定位性能作为定位奖励r3,r3=w2f2;其中,w2为定位权重,f2为定位性能。
进一步的是,使用指数递减惯性权重算法得到定位权重以及检测权重。
进一步的是,所述定位权重w2的计算方法如下:
其中,f1为检测性能,f1max为训练中检测性能能达到的最大值;
检测权重w1的计算方法为:
w1=1-w2。
进一步的是,在所述S3中,将所述检测性能与所述定位性能作为MADDPG算法的奖励,
还包括:设置行动奖励、目标奖励与碰撞奖励;
行动奖励r1,用于通过减少每轮的飞行步数使雷达平台在尽可能少的步数下完成飞行,完成对雷达平台的能量约束;
目标奖励r4,为使雷达平台在接近目标后能准确打击目标,在平台与目标距离小于某一具体值时给出一个较大值的正奖励,引导平台快速接近目标;
碰撞奖励r5,为避免平台间距离过近发生碰撞,设定一个碰撞奖励r5,当平台间的距离小于安全距离时,就会给予其负奖励。
进一步的是,在所述S3中,根据雷达平台的物理特性建立雷达平台飞行轨迹的约束条件,包括:根据雷达平台的速度特性建立转弯速率约束以及根据雷达平台的加速度特性建立过载约束;
所述转弯速率约束为:
所述过载约束为:
进一步的是,在所述步骤S1中,所述目标回波信号幅度的计算公式为:
其中,Pt是雷达发射信号的峰值功率,λ为雷达的工作波长,σ为目标的雷达散
行动奖励r1,用于通过减少每轮的飞行步数使雷达平台在尽可能少的步数下完成飞行,完成对雷达平台的能量约束;
目标奖励r4,为使雷达平台在接近目标后能准确打击目标,在平台与目标距离小于某一具体值时给出一个较大值的正奖励,引导平台快速接近目标;
碰撞奖励r5,为避免平台间距离过近发生碰撞,设定一个碰撞奖励r5,当平台间的距离小于安全距离时,就会给予其负奖励。
进一步的是,在所述S3中,根据雷达平台的物理特性建立雷达平台飞行轨迹的约束条件,包括:根据雷达平台的速度特性建立转弯速率约束以及根据雷达平台的加速度特性建立过载约束;
所述转弯速率约束为:
所述过载约束为:
进一步的是,在所述步骤S1中,所述目标回波信号幅度的计算公式为:
其中,Pt是雷达发射信号的峰值功率,λ为雷达的工作波长,σ为目标的雷达散射截面积,电压增益: 分别为雷达的发射电压增益和接收电压增益,L是雷达发射接收双程天线损耗,rt和rr分别为发射雷达平台与接收雷达平台到目标散射单元的中心距离,θ为目标单元的方位角,为杂波目标单元的俯仰角;
所述杂波信号幅度的计算公式为:
式中σ1为地海杂波散射系数。
进一步的是,所述检测性能f1的计算公式为:
f1=|sX1|-|sX0|,
其中:X1=Ats+Acs+N,X0=Acs+N;Ac为杂波信号幅度,At为目标回波信号幅度;X1为目标回波,X0为环境回波,N为噪声,s为雷达发射信号。
进一步的是,所述定位性能f2的计算公式为:
其中,H=[E1,E2,...,En]T是由目标到第i个雷达平台视线的方向余弦向量,GDOP为几何精度因子。
本发明中使用的MADDPG算法的环境被设置为二维空间,共有n个雷达平台分别为agent1,agent2,…,agentn,其中n为自然数;在MADDPG算法中,每个雷达平台的状态不仅包括自身状态、还有其它雷达平台状态与环境状态;算法中每一个雷达平台的状态Sagei包括:雷达平台在环境中的坐标位置(pagei,x,pagei,y)、速度矢量(vagei,x,vagei,y)及雷达检测角度;环境状态Senv包括目标位置;针对雷达平台agenti在t时刻的状态定义为:St,agei=(Sage1,Sage2,...Sagen,Senv)
MADDPG算法的动作设计包括:雷达平台的动作空间被设置为一个二维的连续空间,动作策略被设置为为每一时刻给予雷达平台一个瞬时速度大小和偏角其中vm为雷达速度矢量,||vm||为速度矢量的大小,为速度水平偏角;因此其速度矢量可以表示为同时采用确定性动作策略,即根据当前时刻的状态输入,输出一个经过选择的确定速度,则雷达平台经过△t时刻后的位置更新为如下式:
本发明的第二方面提供一种可读存储介质,其上存储有计算机程序,所述程序被至少一个处理器执行以实现上述的一种分布式飞行雷达平台的航迹规划方法。
与现有技术相比,本发明的有益效果:
1.本发明通过选择几何精度因子作为定位性能,并通过接收信号回波计算检测性能,以及将检测性能与定位性能作为针对分布式雷达平台飞行轨迹的优化目标,并基于优化目标建立MADDPG算法;可以在航迹规划时兼顾检测性能以及定位性能;同时因为在航迹规划时考虑了航迹对雷达检测性能以及定位性能的影响,因此使用本发明规划的航迹可以在目标及雷达平台位置实时变化的场景中达到预期的高性能;
2.在本发明的示例性实施例中通过在全飞行过程按指数惯性权重分配方式分别对检测性能和定位性能作加权处理,使得在距目标较远的飞行初期以检测性能为主要优化目标,接近目标后的飞行后期以定位性能为主要优化目标,平衡了飞行过程的检测性能与定位性能占比;使用本发明得到的航迹可以更加的贴合分布式飞行雷达平台在实际使用中对检测性能以及定位性能的需求;
3.在本发明的示例性实施例中的航迹规划方法可应用于多个雷达平台在复杂环境中对目标的检测及定位;通过训练好的MADDPG算法得到的航迹,可以使得多个雷达平台在杂波密集、目标RCS信息时变及目标位置具有一定随机性等高动态环境中以最优路线快速飞行至目标,同时实现对目标的高性能检测及定位。
附图说明
图1为本发明示例性实施例中提出的一种分布式飞行雷达平台的航迹规划方法的简略流程图;
图2为本发明的示例性实施例中提出的一种分布式飞行雷达平台的航迹规划方法的要素构成图;
图3为本发明示例性实施例中提出的一种分布式飞行雷达平台的航迹规划方法的流程图。
具体实施方式
下面结合试验例及具体实施方式对本发明作进一步的详细描述。但不应将此理解为本发明上述主题的范围仅限于以下的实施例,凡基于本发明内容所实现的技术均属于本发明的范围。
实施例1
如图1、图2以及图3所示,一种分布式飞行雷达平台的航迹规划方法,包括如下步骤:
S1.使用雷达平台搭载的双基地雷达获取环境信息以及目标信息,使用目标回波信号模型得到目标回波信号幅度,根据雷达平台接收的所有环境回波信号叠加得到杂波信号幅度;
述目标回波信号幅度的计算公式为:
其中,Pt是雷达发射信号的峰值功率,λ为雷达的工作波长,σ为目标的RCS,电压增益 分别为雷达的发射电压增益(幅度增益)和接收电压增益,L是雷达发射接收双程天线损耗,rt和rr分别为发射雷达平台与接收雷达平台到目标散射单元的中心距离,θ为目标单元的方位角,为杂波目标单元的俯仰角;
所述杂波信号幅度的计算公式为:
式中σ1为地海杂波散射系数。
S2.将目标回波与环境回波叠加得到接收信号回波,计算雷达平台的检测性能;
所述检测性能f1的计算公式为:
f1=|sX1|-|sX0|,
其中:X1=Ats+Acs+N,X0=Acs+N,X1为目标回波,X2为杂波(环境)回波,N为噪声,s为雷达发射信号。
本实例的雷达发射信号表示为:
其中bw为带宽,Pw为脉宽,N为划分通道个数,fs为采样频率,fγ为频率间隔,这一信号计算方法可根据雷达的不同类型做出相应调整。
S3.计算几何精度因子并作为雷达平台的定位性能;
本发明利用几何精度因子(Geometric Dilution Precision,GDOP)计算雷达平台的定位性能,要获得最好的定位精度,参与定位的雷达平台应具有最小的GDOP值,GDOP值的具体计算过程如下:
S4.建立针对分布式雷达平台的飞行轨迹的转弯速率约束和过载约束;
所述转弯速率约束为:
所述过载约束为:
通过转弯速率约束与过载约束可以使MADDPG算法规划出的雷达平台的飞行轨迹满实际雷达平台飞行的动力学特性、能量特性以及波束指向特性。b1、a1与b2、a2值的设定可以根据实际使用的雷达飞行平台进行调整。
S5.使用指数递减惯性权重提高雷达平台飞行初期的检测性能占比和飞行后期的定位性能占比,得到检测权重以及定位权重;雷达平台的飞行初期即为雷达平台由距离目标较远(起始位置)时逐渐接近目标的飞行过程,雷达平台的飞行后期即为雷达平台距离由目标比较近时直至达到飞行目标时的飞行过程所述定位权重w2的计算方法为:
其中,f1为检测性能,f1max为训练中检测性能能达到的最大值,为一个经验值,可以在实际使用场景下进行测试得到;
检测权重w1的计算方法为:
w1=1-w2。
wmax与wmin的取值可根据实际需求选取,用于根据实际情况以及飞行任务调整本发明在实际使用中雷达平台的飞行阶段,本实施例中分别赋值0.9和0.4,该权重分配方式可以进一步的提升飞行前期的检测性能,以及飞行后期的定位性能。
S6.基于所述检测权重、所述定位权重、所述检测性能、所述定位性能以及所述转弯速率约束和过载约束建立MADDPG算法,并对所述MADDPG算法进行离线训练;
本实施例中所使用的MADDPG算法的整体结构,可以从论文:何明,张斌,柳强,陈希亮,杨铖.MADDPG算法经验优先抽取机制[J].控制与决策,2021,36(01):68-74.DOI:10.13195/j.kzyjc.2019.0834.中得到。
其中,所述MADDPG算法的奖励包括:
行动奖励r1,用于通过减少每轮的飞行步数使雷达平台在尽可能少的步数下完成飞行,完成对雷达平台的能量约束;
检测奖励r2,即加权后的检测性能,用于提高雷达的检测性能使雷达平台顺利检测并打击目标,控制雷达平台以合理的航线飞行至目标;
定位奖励r3,即加权后的定位性能,用于提高雷达的定位性能使雷达平台快速精确定位目标;
目标奖励r4,为使雷达平台在接近目标后能准确打击目标,在平台与目标距离小于某一具体值时给出一个较大值的正奖励,引导平台快速接近目标;
碰撞奖励r5,为避免平台间距离过近发生碰撞,设定一个碰撞奖励r5,当平台间的距离小于安全距离时,就会给予其负奖励。
在本实施例中,以多个导弹打击同一目标为应用场景,导弹从不同位置发射,在导弹发射时,仅能得到目标的位置范围,导弹的飞行目标为击中该目标;各奖励的数值,以及用途如表1所示:
表1
所述MADDPG算法的环境被设置为二维空间,共有n个雷达平台分别为agent1,agent2,…,agentn,其中n为自然数;在MADDPG算法中,每个雷达平台的状态不仅包括自身状态、还有其它雷达平台状态与环境状态;算法中每一个雷达平台的状态Sagei包括:雷达平台在环境中的坐标位置(pagei,x,pagei,y)、速度矢量(vagei,x,vagei,y)及雷达检测角度;环境状态Senv包括目标位置;针对雷达平台agenti在t时刻的状态定义为:St,agei=(Sage1,Sage2,...Sagen,Senv)
述MADDPG算法的动作设计包括:
雷达平台的动作空间被设置为一个二维的连续空间,动作策略被设置为为每一时刻给予雷达平台一个瞬时速度大小和偏角其中vm为雷达速度矢量,||vm||为速度矢量的大小;为速度水平偏角;因此其速度矢量可以表示为同时采用确定性动作策略,即根据当前时刻的状态输入,输出一个经过选择的确定速度,则雷达平台经过△t时刻后的位置更新为如下式:
S7.将雷达平台的初始位置、目标位置范围输入至训练好的MADDPG算法中,训练好的MADDPG算法输出航迹控制雷达平台飞行,同时训练好的MADDPG算法在雷达平台的飞行过程中与环境交互,不断的对雷达平台的航迹进行更新,直至雷达平台达到目标位置。
分布式雷达平台可以依据所述检测检测及定位性能的计算结果与已有的先验知识,通过MADDPG算法进行离线训练;其中已有先验知识包括地图杂波的散射系数与目标位置的大致范围,是飞行前已有的检测结果;对雷达平台中包含的连续状态采用梯度下降的方式对Q值表进行更新,构建完整的多平台检测及定位深度强化学习离线训练网络。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种分布式飞行雷达平台的航迹规划方法,其特征在于,包括如下步骤:
S1.获取环境信息以及目标信息,使用目标回波信号模型得到目标回波信号幅度,并将所有环境回波信号叠加得到杂波信号幅度;
S2.将目标回波与环境回波叠加得到接收信号回波,计算雷达平台的检测性能;以及,计算雷达平台的几何精度因子并作为雷达平台的定位性能;
S3.将所述检测性能与所述定位性能作为MADDPG算法的奖励,根据雷达平台的物理特性建立雷达平台飞行轨迹的约束条件;
S4.基于所述奖励以及所述约束条件建立MADDPG算法,并对所述MADDPG算法进行离线训练;
S5.将雷达平台的初始位置、目标位置范围输入至训练好的MADDPG算法中;训练好的MADDPG算法在雷达平台的飞行过程中与环境交互,得到分布式雷达平台的航迹。
2.据权利要求1所述的种分布式飞行雷达平台的航迹规划方法,其特征在于,所述S3中,将所述检测性能与所述定位性能作为MADDPG算法的奖励,包括:计算检测权重,将所述检测权重与所述检测性能作为检测奖励r2,r2=w1f1;其中,w1为检测权重,f1为检测性能;
计算定位权重,将所述定位权重与所述定位性能作为定位奖励r3,r3=w2f2;其中,w2为定位权重,f2为定位性能。
3.根据权利要求2所述的一种分布式飞行雷达平台的航迹规划方法,其特征在于,使用指数递减惯性权重算法得到定位权重以及检测权重。
5.根据权利要求4所述的一种分布式飞行雷达平台的航迹规划方法,其特征在于,在所述S3中,将所述检测性能与所述定位性能作为MADDPG算法的奖励,还包括:设置行动奖励、目标奖励与碰撞奖励;
行动奖励r1,用于减少每轮的飞行步数使雷达平台在尽可能少的步数下完成飞行;
目标奖励r4,用于引导平台快速接近目标;
碰撞奖励r5,用于避免平台间距离过近发生碰撞。
8.根据权利要求6所述的一种分布式飞行雷达平台的航迹规划方法,其特征在于,所述检测性能f1的计算公式为:
f1=|sX1|-|sX0|,
其中:X1=Ats+Acs+N,X0=Acs+N;Ac为杂波信号幅度,At为目标回波信号幅度;X1为目标回波,X0为环境回波,N为噪声,s为雷达发射信号。
10.一种可读存储介质,其上存储有计算机程序,其特征在于,所述程序被至少一个处理器执行以实现权利要求1至9所述的一种分布式飞行雷达平台的航迹规划方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210153345.5A CN114485676B (zh) | 2022-02-18 | 2022-02-18 | 一种分布式飞行雷达平台的航迹规划方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210153345.5A CN114485676B (zh) | 2022-02-18 | 2022-02-18 | 一种分布式飞行雷达平台的航迹规划方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114485676A true CN114485676A (zh) | 2022-05-13 |
CN114485676B CN114485676B (zh) | 2023-07-21 |
Family
ID=81483326
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210153345.5A Active CN114485676B (zh) | 2022-02-18 | 2022-02-18 | 一种分布式飞行雷达平台的航迹规划方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114485676B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116430900A (zh) * | 2023-05-04 | 2023-07-14 | 四川大学 | 基于深度强化学习的高超声速弹头的博弈轨迹规划方法 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104730505A (zh) * | 2014-12-08 | 2015-06-24 | 广西大学 | 一种多通道sar地面目标检测定位方法和装置 |
US20170102458A1 (en) * | 2014-06-09 | 2017-04-13 | Src, Inc. | Multiplatform GMTI Radar With Adaptive Clutter Suppression |
CN109633585A (zh) * | 2018-12-04 | 2019-04-16 | 南京航空航天大学 | 分布式机会阵雷达非合作目标动态回波的高精度计算方法 |
CN111208482A (zh) * | 2020-02-28 | 2020-05-29 | 成都汇蓉国科微***技术有限公司 | 基于距离对齐的雷达精度分析方法 |
CN111474528A (zh) * | 2020-05-14 | 2020-07-31 | 中国电子科技集团公司第二十八研究所 | 一种用于终端区的目标复合跟踪***精确栅格锁定方法 |
CN111965613A (zh) * | 2020-07-27 | 2020-11-20 | 北京理工大学 | 一种基于动态规划与分数阶傅里叶变换的弱目标检测方法 |
CN112486036A (zh) * | 2020-11-23 | 2021-03-12 | 南京理工大学 | 基于Unity3D、RTX和VMIC技术的实时可视化协同抗干扰仿真平台 |
CN113093182A (zh) * | 2021-04-01 | 2021-07-09 | 深圳电目科技有限公司 | 基于雷达的消防救援方法、装置、及*** |
CN113204015A (zh) * | 2021-03-31 | 2021-08-03 | 扬州瑞亿达电子科技有限公司 | 用于分布式雷达目标模拟的多无人机航迹规划方法及*** |
CN113508308A (zh) * | 2019-03-07 | 2021-10-15 | 三菱电机株式会社 | 通过融合天线集合的测量的雷达成像 |
-
2022
- 2022-02-18 CN CN202210153345.5A patent/CN114485676B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170102458A1 (en) * | 2014-06-09 | 2017-04-13 | Src, Inc. | Multiplatform GMTI Radar With Adaptive Clutter Suppression |
CN104730505A (zh) * | 2014-12-08 | 2015-06-24 | 广西大学 | 一种多通道sar地面目标检测定位方法和装置 |
CN109633585A (zh) * | 2018-12-04 | 2019-04-16 | 南京航空航天大学 | 分布式机会阵雷达非合作目标动态回波的高精度计算方法 |
CN113508308A (zh) * | 2019-03-07 | 2021-10-15 | 三菱电机株式会社 | 通过融合天线集合的测量的雷达成像 |
CN111208482A (zh) * | 2020-02-28 | 2020-05-29 | 成都汇蓉国科微***技术有限公司 | 基于距离对齐的雷达精度分析方法 |
CN111474528A (zh) * | 2020-05-14 | 2020-07-31 | 中国电子科技集团公司第二十八研究所 | 一种用于终端区的目标复合跟踪***精确栅格锁定方法 |
CN111965613A (zh) * | 2020-07-27 | 2020-11-20 | 北京理工大学 | 一种基于动态规划与分数阶傅里叶变换的弱目标检测方法 |
CN112486036A (zh) * | 2020-11-23 | 2021-03-12 | 南京理工大学 | 基于Unity3D、RTX和VMIC技术的实时可视化协同抗干扰仿真平台 |
CN113204015A (zh) * | 2021-03-31 | 2021-08-03 | 扬州瑞亿达电子科技有限公司 | 用于分布式雷达目标模拟的多无人机航迹规划方法及*** |
CN113093182A (zh) * | 2021-04-01 | 2021-07-09 | 深圳电目科技有限公司 | 基于雷达的消防救援方法、装置、及*** |
Non-Patent Citations (2)
Title |
---|
姚瑞琦: "面向雷达目标检测性能的多弹协同航迹规划" * |
韩清华: "分布式机会阵雷达***重构基础理论和关键技术研究" * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116430900A (zh) * | 2023-05-04 | 2023-07-14 | 四川大学 | 基于深度强化学习的高超声速弹头的博弈轨迹规划方法 |
CN116430900B (zh) * | 2023-05-04 | 2023-12-05 | 四川大学 | 基于深度强化学习的高超声速弹头的博弈轨迹规划方法 |
Also Published As
Publication number | Publication date |
---|---|
CN114485676B (zh) | 2023-07-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114625151B (zh) | 一种基于强化学习的水下机器人避障路径规划方法 | |
CN111797478B (zh) | 一种基于变结构多模型的强机动目标跟踪方法 | |
CN111381604B (zh) | 用于拦截自主飞行低慢小目标的欺骗轨迹生成方法及*** | |
CN105785359B (zh) | 一种多约束机动目标跟踪方法 | |
CN111598232B (zh) | 利用深度学习卷积神经网络估计复杂微动空间锥体目标参数的方法 | |
CN108710124A (zh) | 一种飞机类强机动目标跟踪敏感性评估方法 | |
CN105372653B (zh) | 面向岸基空管雷达***中一种高效转弯机动目标跟踪方法 | |
Li et al. | Autonomous maneuver decision-making for a UCAV in short-range aerial combat based on an MS-DDQN algorithm | |
Gong et al. | UAV cooperative air combat maneuvering confrontation based on multi-agent reinforcement learning | |
CN114485676B (zh) | 一种分布式飞行雷达平台的航迹规划方法 | |
CN111121770B (zh) | 一种交互式多弹多模型航迹融合方法 | |
CN114675673A (zh) | 一种空中动目标追踪方法及*** | |
CN112731312B (zh) | 一种实时交互式相控阵雷达仿真***及方法 | |
Fuchs et al. | Model order estimation using a multi-layer perceptron for direction-of-arrival estimation in automotive radar sensors | |
Zhu et al. | Mastering air combat game with deep reinforcement learning | |
Bruno et al. | Improved particle filters for ballistic target tracking | |
CN115561722A (zh) | 一种基于无人机的机载火控雷达信号模拟方法 | |
Smith et al. | Coupled echoic flow for cognitive radar sensing | |
CN109948304A (zh) | 临近空间高超声速飞行器ahw的弹道预测方法 | |
CN114662285A (zh) | 一种高速飞行器火力控制模型的智能解算方法 | |
CN114200439A (zh) | 一种基于多普勒盲区的多模式空域目标跟踪方法 | |
CN114565020A (zh) | 一种基于深度置信网络和扩展卡尔曼滤波的飞行器传感器信号融合方法 | |
JP3199623B2 (ja) | 目標追尾方法およびその方法を用いたレーダ装置 | |
CN112379366A (zh) | 一种基于粒子群滤波的雷达目标跟踪算法 | |
CN116992553B (zh) | 助推滑翔飞行器全程弹道估计方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |