CN114237297A - 一种基于神经网络训练学习的无人机群飞行控制方法 - Google Patents

一种基于神经网络训练学习的无人机群飞行控制方法 Download PDF

Info

Publication number
CN114237297A
CN114237297A CN202111568149.6A CN202111568149A CN114237297A CN 114237297 A CN114237297 A CN 114237297A CN 202111568149 A CN202111568149 A CN 202111568149A CN 114237297 A CN114237297 A CN 114237297A
Authority
CN
China
Prior art keywords
unmanned aerial
aerial vehicle
neural network
cluster
ith
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111568149.6A
Other languages
English (en)
Other versions
CN114237297B (zh
Inventor
王磊
何陶
陈明燕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN202111568149.6A priority Critical patent/CN114237297B/zh
Publication of CN114237297A publication Critical patent/CN114237297A/zh
Application granted granted Critical
Publication of CN114237297B publication Critical patent/CN114237297B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/10Simultaneous control of position or course in three dimensions
    • G05D1/101Simultaneous control of position or course in three dimensions specially adapted for aircraft
    • G05D1/104Simultaneous control of position or course in three dimensions specially adapted for aircraft involving a plurality of aircrafts, e.g. formation flying
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)

Abstract

本发明公开一种基于神经网络训练学习的无人机群飞行控制方法,应用于无人机技术领域,针对现有技术很难根据复杂环境变化进行适应性调整的问题,本发明采用神经网络学习无人机集群控制模型,将集群中无人机的状态以及期望集群飞行速度作为神经网络的训练样本输入,并采用智能优化算法的解作为神经网络的标签样本;本发明采用局部集群飞行实现全局集群飞行的方法,集群中的每架无人机筛选距离自己最近且在可观察范围内的k‑1架无人机,根据其状态计算出自己的下一个局部最优状态;采用本发明的方法实现了速度、航向的更快收敛,特别是仿真时间得到了大幅度的降低;可见采用本发明方法的避障反应速度更快,能更有效的避障,保证集群飞行的安全。

Description

一种基于神经网络训练学习的无人机群飞行控制方法
技术领域
本发明属于无人机技术领域,特别涉及一种无人机群飞行控制技术。
背景技术
近年来,随着低成本的无人机被大批量的制造出来,分布式无人机集群控制技术得以在无人机上进行大规模研究和部署。相较于单架无人机固有的载荷单一、执行任务能力有限等问题,无人机集群可以通过相互配合、优势互补,有效提升***性能,高效完成更加复杂、更加庞大的任务。因此,无人机集群在军事和民用领域均得到了广泛的应用。
无人机集群控制器传统设计方法可以有两类:第一类由人工根据设计准则完成集群控制器的设计,再对集群控制器相关参数进行优化,以改善***的安全性和算法的性能;第二类是采用最优化方法直接求解得到集群控制器相关参数。这两类设计方法得到的无人机集群控制器模型很难根据复杂环境变化进行适应性调整,特别是无人机集群避障问题。
发明内容
为解决以上问题,本发明提出一种基于神经网络训练学习的无人机群飞行控制方法,将无人机集群飞行问题建模为多目标优化问题,采用神经网络训练学习控制器模型,将无人机集群的状态以及期望集群飞行速度作为神经网络的训练样本输入,智能优化算法解作为神经网络的标签样本。本发明所提方法可用于无人机集群避障等复杂场景;训练后得到的神经网络控制器能够满足实时计算要求,既可以获得更优解,又可以实现解的重复;还支持采用分布式计算方式,每个无人机根据通信范围内近邻的几架无人机的信息完成自身状态的调整,有利于无人机集群规模扩展。
本发明采用的技术方案为:一种基于神经网络训练学习的无人机群飞行控制方法,包括:
S1、计算集群中每个无人机的期望水平航向;
S2、对于当前的第i架无人机,取出距离第i架无人机最近,且在其可观察范围内的K-1架无人机与其组成群组UAVGroup;
S3、将UAVGroup的位置信息整体搬迁到整个无人机集群对应的无人机在三维空间中的取值范围;
S4、将UAVGroup的状态以及期望集群飞行速度归一化后输入神经网络,计算最优权重向量
Figure BDA0003422462120000021
S5、计算第i架无人机的控制合力ui
S6、计算第i架无人机的下一状态。
步骤S4所述神经网络结构包括:四个隐藏层、一个输出层,四个隐藏层依次记为:第一隐藏层、第二隐藏层、第三隐藏层、第四隐藏层,第一隐藏层的输入作为整个神经网络的输入,第一隐藏层的输出作为第二隐藏层的输入,第二隐藏层的输出作为第三隐藏层的输入,第三隐藏层的输出作为第四隐藏层的输入,第四隐藏层的输出作为输出层的输入,输出层的输出作为整个神经网络的输出。
在神经网络训练时,将集群中无人机的状态以及期望集群飞行速度作为神经网络的训练样本输入,对神经网络进行训练,从而得到训练完成神经网络。
在神经网络训练时还包括将训练样本划分为训练集与验证集。
神经网络训练停止的条件为:当达到训练周期数或损失函数值为0或验证集的性能自上次降低以来增加超过6次时,停止训练,得到训练完成的神经网络。
还包括采用智能优化算法的解作为神经网络的标签样本,所述标签样本用于计算神经网络的损失函数。
所述智能优化算法采用多目标优化的目标函数,具体包括:
第一目标函数
Figure BDA0003422462120000022
用于表示实际飞行速度偏离期望集群飞行速度的程度,计算表达式如下:
Figure BDA0003422462120000023
其中,
Figure BDA0003422462120000024
表示第i架无人机x方向速度,
Figure BDA0003422462120000025
表示第i架无人机y方向速度,
Figure BDA0003422462120000026
表示第i架无人机x方向的期望集群飞行速度,
Figure BDA0003422462120000027
表示第i架无人机y方向的期望集群飞行速度,
Figure BDA0003422462120000028
So表示在期望飞行速度Ve的水平方向上无人机集群前方存在无人机感知距离内的障碍物集合,
Figure BDA0003422462120000029
表示k取x或y时对应的
Figure BDA00034224621200000210
Figure BDA00034224621200000211
Figure BDA00034224621200000212
第二目标函数
Figure BDA00034224621200000213
用于表示无人机集群形成几何结构的程度以及无人机之间水平速度的一致性程度,计算表达式如下:
Figure BDA0003422462120000031
其中,Dd是无人机之间期望保持的水平间距,dij是无人机i与j之间的距离,
Figure BDA0003422462120000032
第j架无人机水平方向速度(包括:x轴向、y轴向),
Figure BDA0003422462120000033
是第i架无人机水平方向速度(包括:x轴向、y轴向),Dc是无人机最大水平通信距离,j是满足与无人机i距离小于或等于Dc的无人机。
本发明的有益效果:本发明的方法将无人机集群飞行问题建模为多目标优化问题,采用神经网络训练学习控制器模型,将无人机集群的状态以及期望集群飞行速度作为神经网络的训练样本输入,智能优化算法解作为神经网络的标签样本,这是一种基于神经网络训练学习的无人机集群控制器的方法。同时,设计集群避障、无障碍飞行仿真实验,对训练后的神经网络模型应用进行验证。本发明的方法具备以下优点:
(1)本发明所提方法实现了集群飞行速度的可控,可用于集群避障、无障碍飞行等复杂场景;
(2)本发明所提方法训练后得到的神经网络能够满足实时计算要求,既可以获得更优解,又可以实现解的重复;
(3)本发明所提方法支持采用分布式计算方式,每个无人机根据通信范围内近邻的几架无人机的信息完成自身状态的调整,有利于无人机集群规模扩展。
附图说明
图1为本发明的方法流程图;
图2为本发明实施例的避障模型;
图3为本发明采用的神经网络结构;
图4为采用本发明的方法的无人机集群避障仿真结果;
其中,图(a)为无人机集群方向跟踪过程,图(b)为无人机集群水平速度曲线,图(c)为无人机之间相对距离曲线,图(d)为无人机集群水平航向曲线,图(e)为第一个目标函数的和,图(f)为第二个目标函数的和;
图5为基于MOPSO的无人机集群避障仿真结果;
图(a)为无人机集群方向跟踪过程,图(b)为无人机集群水平速度曲线,图(c)为无人机之间相对距离曲线,图(d)为无人机集群水平航向曲线,图(e)为第一个目标函数的和,图(f)为第二个目标函数的和;
图6为采用本发明的方法的无人机集群方向跟踪仿真结果;
其中,图(a)为无人机集群方向跟踪过程,图(b)为无人机集群水平速度曲线,图(c)为无人机之间相对距离曲线,图(d)为无人机集群水平航向曲线,图(e)为第一个目标函数的和,图(f)为第二个目标函数的和;
图7为基于MOPSO的无人机集群方向跟踪仿真结果;
其中,图(a)为无人机集群方向跟踪过程,图(b)为无人机集群水平速度曲线,图(c)为无人机之间相对距离曲线,图(d)为无人机集群水平航向曲线,图(e)为第一个目标函数的和,图(f)为第二个目标函数的和。
具体实施方式
为便于本领域技术人员理解本发明的技术内容,下面结合附图对本发明内容进一步阐释。
实施例1
本实施例中采用的神经网络具有固定尺寸的输入向量,优点是计算量较小,缺点是无法直接应用于更大规模的无人机集群飞行控制。因此,本发明提出采用局部集群飞行实现全局集群飞行的方法,即:集群中的每架无人机筛选距离自己最近且在可观察范围内的k-1架无人机,根据其状态计算出自己的下一个局部最优状态。在共同目标的作用下,k架无人机群组飞行可以实现所有无人机集群飞行。共同目标是指所有无人机共享集群飞行方向信息,通过控制队形参数,完成集群整体避障和飞行目标。基于神经网络的无人机集群飞行控制方法详见发明所述第三步。由于每架无人机只需根据邻近无人机的信息以及集群共享信息进行自身状态的计算,在分布式计算框架下时间复杂度并没有太大的增加。同时,形成的密集队形维持在水平平面上,当某一无人机故障时,可通过z轴方向退出集群,这样可以保证整个集群的飞行安全。
如图1所示,本发明的方法包括以下步骤:
S1、计算集群中每个无人机的期望水平航向;
S2、对于当前的第i架无人机,取出距离第i架无人机最近,且在其可观察范围内的K-1架无人机与其组成群组UAVGroup;K的取值与无人机群组大小相关,例如:无人机群有无人机100架,若k=5,则可以划分为100/5=20个群组。
S3、将UAVGroup的位置信息整体搬迁到最大最小值范围;这里的最大最小值范围即无人机集群的飞行空间范围,具体对应无人机集群中的无人机位置在X、Y、Z三个轴向的最大、最小空间范围;
S4、将UAVGroup的状态以及期望集群飞行速度归一化后输入神经网络,计算最优权重向量
Figure BDA00034224621200000511
S5、计算第i架无人机的控制合力ui
S6、计算第i架无人机的下一状态。
本发明的方法基于的无人机模型为:将无人机模型简化为一阶马赫数保持自动驾驶仪、一阶航向保持自动驾驶仪、二阶高度保持自动驾驶仪。其具体模型表示如下:
Figure BDA0003422462120000051
其中,
Figure BDA0003422462120000052
表示X方向位移变化率,
Figure BDA0003422462120000053
表示Y方向位移变化率,
Figure BDA0003422462120000054
表示Z方位移变化率,
Figure BDA0003422462120000055
表示xy平面方向加速度,
Figure BDA00034224621200000512
表示水平航向角,
Figure BDA0003422462120000056
表示Z方向速度变化率。
式(1)的模型假定,有N架无人机在3维欧拉空间中飞行,无人机是具有单位质量的质点,i表示无人机序号。
Figure BDA0003422462120000057
是第i架无人机的位置向量,
Figure BDA0003422462120000058
是第i架无人机的速度向量,
Figure BDA0003422462120000059
φi、ηi分别是第i架无人机的水平速度、水平航向、高度变化率,τv、τφ、(τzη)分别是三个自动驾驶仪的时间常数,对应取值为1s、0.75s、(1s,0.3s)。
Figure BDA00034224621200000510
分别是三个自动驾驶仪的控制输入,其表达式如下:
Figure BDA0003422462120000061
其中,
Figure BDA0003422462120000062
是第i架无人机的控制合力向量。无人机飞行控制对水平向速度、水平航向角、垂直向速度的限制条件主要有以下三个:
(1)水平向速度误差限制:如果
Figure BDA0003422462120000063
Figure BDA0003422462120000064
Figure BDA0003422462120000065
是水平速度允许控制误差,
Figure BDA0003422462120000066
是期望飞行速度。
(2)水平航向误差限制:如果
Figure BDA0003422462120000067
Figure BDA0003422462120000068
是水平航向允许控制误差,
Figure BDA0003422462120000069
(3)水平向速度范围、水平航向角加速度、垂直向速度范围限制:
Figure BDA00034224621200000610
其中,Vxymin=5和Vxymax=15分别是水平速度的下限、上限,ηmin=-5和ηmax=5分别是高度变化率的下限、上限,nmax=10是最大横向过载,g是重力加速度。
步骤S1的无人机集群模型为:
由多个无人机构成的无人机集群飞行应遵循以下5个设计准则:
(1)无人机之间应保持稳定集群晶格几何结构;
(2)所有无人机应保持相同的速度;
(3)无人机之间应保持安全距离;
(4)无人机集群飞行速度应可控;
(5)所有无人机应保持在期望高度。
为满足以上无人机群飞行控制的5个准则,每架无人机的控制合力ui具体设计如下:
Figure BDA0003422462120000071
其中,
Figure BDA0003422462120000072
第i架无人机水平方向速度(包括:x轴向、y轴向),
Figure BDA0003422462120000073
表示第i架无人机的集群晶格几何控制组件,
Figure BDA0003422462120000074
表示第i架无人机与其他无人机之间的水平速度对齐控制组件,
Figure BDA0003422462120000075
表示第i架无人机与其他无人机之间的避碰控制组件,
Figure BDA0003422462120000076
表示第i架无人机的高度控制组件,
Figure BDA0003422462120000077
表示第i架无人机的高度变化率控制组件,这5个控制组件保障准则(1)、(2)、(3)、(5)。
Figure BDA0003422462120000078
是第i架无人机的集群飞行速度控制组件,这个组件保障准则(4)。
无人机集群飞行控制模型的每个控制组件的具体描述如下:
1.无人机集群晶格几何控制组件
Figure BDA0003422462120000079
Figure BDA00034224621200000710
其中,Cf=0.1是无人机集群晶格几何控制强度系数,
Figure BDA00034224621200000711
是第i架和第j架无人机之间的水平距离,Dc=20是最大水平通信距离,
Figure BDA00034224621200000712
是第j架相对第i架无人机的影响权重,取值范围为[0,1],Dd=10是无人机之间期望保持的水平间距。
2.水平速度对齐控制组件
Figure BDA00034224621200000713
Figure BDA00034224621200000714
其中,Cav=0.1是水平速度对齐控制强度系数,
Figure BDA00034224621200000715
是无人机j、无人机i水平方向速度。
3.避碰控制组件
Figure BDA00034224621200000716
Figure BDA00034224621200000717
其中,Cc=105是避碰控制强度系数,Dlim1=2是无人机之间避免碰撞的最小距离,dij是无人机i与j之间的距离,
Figure BDA00034224621200000718
表示无人机i,无人机j的水平位置。
4.集群飞行速度控制组件
Figure BDA0003422462120000081
Figure BDA0003422462120000082
其中,Cvf=1是无人机集群飞行速度控制强度系数,
Figure BDA0003422462120000083
是第i架无人机对集群飞行速度控制组件的影响权重,取值范围为[1,1.1];
Figure BDA0003422462120000084
是第i架无人机的期望集群飞行速度,δi是第i架无人机的期望水平航向。
5.高度控制组件
Figure BDA0003422462120000085
Figure BDA0003422462120000086
其中,Ch=30是高度控制强度系数,Ze=50是期望高度。
6.高度变化率控制组件
Figure BDA0003422462120000087
Figure BDA0003422462120000088
其中,Cη=10是高度变化率控制强度系数。
步骤S1的实现过程具体为:
S11、计算无人机集群核心(几何中心)的期望水平航向δcore
集群核心水平向位置
Figure BDA0003422462120000089
通过各无人机水平向位置求平均得到,计算公式为:
Figure BDA00034224621200000810
集群核心水平航向角δcore计算公式为:
Figure BDA00034224621200000811
其中,So代表在期望飞行速度Ve的水平方向上无人机集群前方存在无人机感知距离内的障碍物集合。当So为空集时(满足
Figure BDA00034224621200000812
),δcore等于Ve的水平方向;当So不等于空集时,如图2所示,三角形表示无人机,●表示障碍物,Dlim2=10表示无人机与障碍物之间最小距离限制,Rformation是无人机集群在垂直于Ve的水平方向上的距离,点A是So中离集群核心最近的障碍物的外包洛在垂直于Ve的水平方向上投影的两个边缘点中距离Pcore最近的那个边缘点,δcore是集群几何中心指向A点的方向。这里,无人机障碍物感知距离设置为105米。
S12、计算第i架无人机的期望水平航向δi
Figure BDA0003422462120000091
其中,Cδ是控制集群形状的参数。
步骤S4包括对神经网络进行训练的过程,具体的:
A1、基于MOPSO的无人机集群方向跟踪算法,运算100次,将100次的运算结果作为标签样本;
首先对MOPSO算法进行说明:
本发明中采用多目标优化的目标函数;第i架无人机的影响权重向量
Figure BDA0003422462120000092
直接决定第i架无人机的下一个状态。对上述模型进行优化,也就是对影响权重向量进行优化。本发明设计以下两个目标函数用于评价第i架无人机的下一个状态对整个无人机集群飞行的影响,进而在影响权重向量空间中寻找最优影响权重向量
Figure BDA0003422462120000093
最终实现集群飞行速度可控的同时得到稳定的集群。设计两个目标函数,建立多目标优化问题,具体描述如下:
Figure BDA0003422462120000094
第一个目标函数
Figure BDA0003422462120000095
代表实际飞行速度偏离期望集群飞行速度的程度,计算表达式如下:
Figure BDA0003422462120000096
第二个目标函数
Figure BDA0003422462120000101
代表无人机集群形成几何结构的程度以及无人机之间水平速度的一致性程度,计算表达式如下:
Figure BDA0003422462120000102
MOPSO算法中,粒子的位置就是具体的影响权重向量。用影响权重向量每个分量的取值范围初始化MOPSO中粒子位置和速度的上下限,搜索空间的维数D等于集群中无人机的数目,目标函数见计算式(15)-(16)。在已知每个无人机的期望水平航向δi以及当前状态的情况下,将影响权重向量代入计算式(4)-(10),可以计算第i架无人机的控制合力ui,进一步通过计算式(1)-(3),可以求得影响权重向量对应的第i架无人机的下一个状态,进而求解得到粒子的位置对应的目标函数值。
因此,采用MOPSO对影响权重向量空间进行搜索,可以最终找到当前无人机状态和障碍物环境下的最优影响权重向量
Figure BDA0003422462120000103
Figure BDA0003422462120000104
表示MOPSO返回的帕累托前沿中
Figure BDA0003422462120000105
值最小的粒子的位置。
已知:目标函数为:计算式(14),搜索空间维数D,位置上界向量
Figure BDA0003422462120000106
位置下界向量
Figure BDA0003422462120000107
速度上界向量
Figure BDA0003422462120000108
速度下界向量
Figure BDA0003422462120000109
粒子数目NP=20,进化代数g,最大代数MG=58,历史帕累托最优集合
Figure BDA00034224621200001010
根据上下界随机初始化NP个粒子的位置和速度。
MOPSO算法过程如下:
Figure BDA00034224621200001011
Figure BDA0003422462120000116
本实施例中在制作样本训练集时,初始障碍物环境为空,无人机的初始水平航向φ=0,初始速度V=Ve,初始位置Pz在[0,100]中随机取值,Px在[0,30]中随机取值,Py在[75,150]中随机取值,要求任意两架无人机之间水平距离应满足小于最大水平通信距离Dc。δcore计算式见(17),得到训练样本集合
Figure BDA0003422462120000111
inputi是第i个训练样本,计算式见(18),labeli是第i个标签样本,计算式见(19)
Figure BDA0003422462120000112
Figure BDA0003422462120000113
Figure BDA0003422462120000114
A2、构建神经网络,神经网络的结构如图3所示,输入向量input的维数为6N,N是无人机的数量。一共4个隐藏层,每个隐藏层均有6N个神经元,隐藏层的激活函数Tansig(o)见等式(20)。输出层的神经元个数等于标签向量label的维数Nd=N×N,输出层的激活函数Purelin(o)见等式(21)。
Figure BDA0003422462120000115
Purelin(o)=o (21)
将无人机集群的状态以及期望集群飞行速度作为神经网络的训练样本输入,并采用智能优化算法的解作为神经网络的标签样本,完成对步骤A2构建的神经网络的训练。
训练之前将输入数据的每一个维度分别进行归一化处理,归一化后的数据将分布在[-1,1]。损失函数为平均平方误差函数MSE(见计算式(22))。训练函数为trainscg(量化共轭梯度法),训练周期数epochs=1000。随机选择70%的样本数据作为训练集,随机选择15%的样本数据作为验证集,随机选择15%的样本数据作为测试集。当完成训练周期数、或损失函数的值为0、或验证集的性能自上次降低以来增加超过6次这三类条件时,终止训练。
根据标签样本与神经网络的输出结果计算损失函数,计算式如下:
Figure BDA0003422462120000121
步骤S4还包括采用训练完成的神经网络求解最优权重向量:具体的神经网络根据当前无人机状态和障碍物环境,输出最优权重向量。
实施例2
本实施例以无人机群避障仿真效果来对本发明的内容做进一步的说明:
5架无人机组成一个集群,分别进行避障飞行、无障碍飞行仿真实验,仿真时长Tmax=50s,采样时间ts=0.5s。飞行空间有15个障碍物。仿真参数如表1所示:
表1仿真参数
Figure BDA0003422462120000131
基于本发明的神经网络的无人机集群避障仿真结果如图4所示,从图4(a)可以看出,5架无人机飞出了平滑的曲线轨迹,并在安全通过密集障碍物的过程中,逐渐形成并始终保持稳定密集队形。
从图4(b)可以看出,在每次集群变向时,5架无人机之间的水平速度差异逐渐变大再逐渐趋近于0,同时每架无人机水平速度的大小与期望水平速度的大小差异也是逐渐变大再逐渐趋近于0,水平速度收敛较快,无人机之间的速度差异较小。
从图4(c)可以看出,无人机之间相对距离随着飞行在快速收敛,而且其始终大于无人机之间避免碰撞的最小距离。
从图4(d)中可以看出,无人机集群的方向跟踪效果良好,水平航向在波动后快速收敛到期望水平航向,无人机之间的水平航向相差较小。
基于现有的MOPSO的无人机集群避障仿真结果如图5所示,从图4(a)与图5(a)的比较可以看出,本发明的基于神经网络的方法飞出了更好的凹型避障轨迹。
图4(b)与图5(b)比较可以看出,本发明的基于神经网络的方法水平速度偏离期望水平速度的时间更短,幅度更小,更有规律,更早的实现了收敛。
图4(c)与图5(c)比较可以看出,采用本发明的神经网络方法,无人机之间相对距离收敛速度更快更好。
图4(d)与图5(d)比较可以看出,采用本发明的神经网络方法,无人机水平航向收敛速度更快,方向跟踪效果更好,飞行过程中无人机之间的水平航向差更小。
图4(e)、4(f)与图5(e)、图5(f)比较可以看出,采用本发明的神经网络方法,无人机集群的几何结构和飞行速度收敛得都更快更好。
同时,本发明与基于MOPSO的无人机集群避障方法进行对比,两种算法的统计结果见表2,很显然本发明的基于神经网络的方法实现了速度、航向的更快收敛,特别是仿真时间得到了大幅度的降低;可见采用本发明方法的避障反应速度更快,能更有效的避障。
表2两种算法的集群避障仿真实验统计结果
Figure BDA0003422462120000141
实施例3
本实施例以无人机群无障碍飞行仿真效果来对本发明的内容做进一步的说明:
基于神经网络的无人机集群方向跟踪仿真结果如图6所示。
从图6(a)可以看出,5架无人机以集群方式跟踪参考方向飞出了一个较好的Ω形状,飞行曲线较平滑。
从图6(b)可以看出,无人机集群的水平速度围绕期望水平速度在波动,波动幅度较小,而且水平速度快速收敛,且无人机之间速度差异较小。
从图6(c)可以看出,无人机间距随时间快速收敛,且始终保持在无人机避免碰撞的最小距离边界之上。
从图6(d)可以看出,无人机集群的方向跟踪效果良好,水平航向在波动后快速收敛到期望水平航向,无人机之间的水平航向相差较小。
基于MOPSO的无人机集群方向跟踪仿真结果如图7所示
比较图6(a)和图7(a)可以看出,在飞行曲线的300-400m段,基于神经网络的方法飞出了更好的轨迹,无人机之间的排布更加合理。
比较图6(b)和图7(b)可以看出,采用神经网络方法,无人机集群水平速度偏离期望水平速度的时间更短,收敛速度更快。
比较图6(c)和图7(c)可以看出,采用神经网络方法,无人机相对距离收敛速度更快。
比较图6(d)和图7(d)可以看出,采用神经网络方法,水平航向收敛速度更快,方向跟踪效果更好,飞行中无人机之间水平航向差更小。
比较图6(e)和图7(e)、图6(f)与图7(f)可以看出,采用神经网络方法,无人机集群几何结构和飞行速度收敛得都更快更好。
此外,在方向跟踪实验中,两种算法仿真时间统计结果见表3,显然采用本发明的神经网络方法具有速度、航向更快收敛的优点,仿真计算实际用时更短,算法执行效率更高。
表3两种算法的方向跟踪仿真实验统计结果
Figure BDA0003422462120000151
本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。

Claims (7)

1.一种基于神经网络训练学习的无人机群飞行控制方法,其特征在于,包括:
S1、计算集群中每个无人机的期望水平航向;
S2、对于当前的第i架无人机,取出距离第i架无人机最近,且在其可观察范围内的K-1架无人机与其组成群组UAVGroup;
S3、将UAVGroup的位置信息整体搬迁到整个无人机集群对应的无人机在三维空间中的取值范围;
S4、将UAVGroup的状态以及期望集群飞行速度归一化后输入神经网络,计算最优权重向量
Figure FDA0003422462110000011
S5、计算第i架无人机的控制合力ui
S6、计算第i架无人机的下一状态。
2.根据权利要求1所述的一种基于神经网络训练学习的无人机群飞行控制方法,其特征在于,步骤S4所述神经网络结构包括:四个隐藏层、一个输出层,四个隐藏层依次记为:第一隐藏层、第二隐藏层、第三隐藏层、第四隐藏层,第一隐藏层的输入作为整个神经网络的输入,第一隐藏层的输出作为第二隐藏层的输入,第二隐藏层的输出作为第三隐藏层的输入,第三隐藏层的输出作为第四隐藏层的输入,第四隐藏层的输出作为输出层的输入,输出层的输出作为整个神经网络的输出。
3.根据权利要求2所述的一种基于神经网络训练学习的无人机群飞行控制方法,其特征在于,在神经网络训练时,将集群中无人机的状态以及期望集群飞行速度作为神经网络的训练样本输入,对神经网络进行训练,从而得到训练完成神经网络。
4.根据权利要求3所述的一种基于神经网络训练学习的无人机群飞行控制方法,其特征在于,在神经网络训练时还包括将训练样本划分为训练集与验证集。
5.根据权利要求4所述的一种基于神经网络训练学习的无人机群飞行控制方法,其特征在于,神经网络训练停止的条件为:当达到训练周期数或损失函数值为0或验证集的性能自上次降低以来增加超过6次时,停止训练,得到训练完成的神经网络。
6.根据权利要求5所述的一种基于神经网络训练学习的无人机群飞行控制方法,其特征在于,还包括采用智能优化算法的解作为神经网络的标签样本,所述标签样本用于计算神经网络的损失函数。
7.根据权利要求6所述的一种基于神经网络训练学习的无人机群飞行控制方法,其特征在于,所述智能优化算法采用多目标优化的目标函数,具体包括:
第一目标函数
Figure FDA0003422462110000021
用于表示实际飞行速度偏离期望集群飞行速度的程度,计算表达式如下:
Figure FDA0003422462110000022
其中,
Figure FDA0003422462110000023
表示第i架无人机x方向速度,
Figure FDA0003422462110000024
表示第i架无人机y方向速度,
Figure FDA0003422462110000025
表示第i架无人机x方向的期望集群飞行速度,
Figure FDA0003422462110000026
表示第i架无人机y方向的期望集群飞行速度,
Figure FDA0003422462110000027
So表示在期望飞行速度Ve的水平方向上无人机集群前方存在无人机感知距离内的障碍物集合,
Figure FDA0003422462110000028
表示k取x或y时对应的
Figure FDA0003422462110000029
Figure FDA00034224621100000210
Figure FDA00034224621100000211
第二目标函数
Figure FDA00034224621100000212
用于表示无人机集群形成几何结构的程度以及无人机之间水平速度的一致性程度,计算表达式如下:
Figure FDA00034224621100000213
其中,Dd是无人机之间期望保持的水平间距,dij是无人机i与j之间的距离,
Figure FDA00034224621100000214
第j架无人机水平方向速度,
Figure FDA00034224621100000215
是第i架无人机水平方向速度,Dc是无人机最大水平通信距离,j是满足与无人机i距离小于或等于Dc的无人机。
CN202111568149.6A 2021-12-21 2021-12-21 一种基于神经网络训练学习的无人机群飞行控制方法 Active CN114237297B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111568149.6A CN114237297B (zh) 2021-12-21 2021-12-21 一种基于神经网络训练学习的无人机群飞行控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111568149.6A CN114237297B (zh) 2021-12-21 2021-12-21 一种基于神经网络训练学习的无人机群飞行控制方法

Publications (2)

Publication Number Publication Date
CN114237297A true CN114237297A (zh) 2022-03-25
CN114237297B CN114237297B (zh) 2023-04-14

Family

ID=80760052

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111568149.6A Active CN114237297B (zh) 2021-12-21 2021-12-21 一种基于神经网络训练学习的无人机群飞行控制方法

Country Status (1)

Country Link
CN (1) CN114237297B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107368091A (zh) * 2017-08-02 2017-11-21 华南理工大学 一种基于有限时间神经动力学的多旋翼无人飞行器的稳定飞行控制方法
CN108549407A (zh) * 2018-05-23 2018-09-18 哈尔滨工业大学(威海) 一种多无人机协同编队避障的控制算法
CN109032168A (zh) * 2018-05-07 2018-12-18 西安电子科技大学 一种基于dqn的多无人机协同区域监视的航路规划方法
CN109683626A (zh) * 2018-11-08 2019-04-26 浙江工业大学 一种基于自适应rbf神经网络的四旋翼无人机编队控制方法
US20200019765A1 (en) * 2018-07-10 2020-01-16 University Of Florida Research Foundation, Inc. Automated systems and methods for monitoring and mapping insects in orchards
CN110717260A (zh) * 2019-09-26 2020-01-21 杭州电子科技大学 一种无人机机动能力模型建立方法
CN111487995A (zh) * 2020-04-30 2020-08-04 湖南科技大学 基于三维简化虚拟模型的群无人机多目标搜索协作方法
US20210300554A1 (en) * 2020-03-27 2021-09-30 Sony Corporation Controlling a group of unmanned aerial vehicles for delivery of goods
CN113805609A (zh) * 2021-10-13 2021-12-17 河海大学 一种混沌迷失鸽群优化机制的无人机群目标搜索方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107368091A (zh) * 2017-08-02 2017-11-21 华南理工大学 一种基于有限时间神经动力学的多旋翼无人飞行器的稳定飞行控制方法
US20210141395A1 (en) * 2017-08-02 2021-05-13 South China University Of Technology Stable flight control method for multi-rotor unmanned aerial vehicle based on finite-time neurodynamics
CN109032168A (zh) * 2018-05-07 2018-12-18 西安电子科技大学 一种基于dqn的多无人机协同区域监视的航路规划方法
CN108549407A (zh) * 2018-05-23 2018-09-18 哈尔滨工业大学(威海) 一种多无人机协同编队避障的控制算法
US20200019765A1 (en) * 2018-07-10 2020-01-16 University Of Florida Research Foundation, Inc. Automated systems and methods for monitoring and mapping insects in orchards
CN109683626A (zh) * 2018-11-08 2019-04-26 浙江工业大学 一种基于自适应rbf神经网络的四旋翼无人机编队控制方法
CN110717260A (zh) * 2019-09-26 2020-01-21 杭州电子科技大学 一种无人机机动能力模型建立方法
US20210300554A1 (en) * 2020-03-27 2021-09-30 Sony Corporation Controlling a group of unmanned aerial vehicles for delivery of goods
CN111487995A (zh) * 2020-04-30 2020-08-04 湖南科技大学 基于三维简化虚拟模型的群无人机多目标搜索协作方法
CN113805609A (zh) * 2021-10-13 2021-12-17 河海大学 一种混沌迷失鸽群优化机制的无人机群目标搜索方法

Also Published As

Publication number Publication date
CN114237297B (zh) 2023-04-14

Similar Documents

Publication Publication Date Title
Wu et al. A new consensus theory-based method for formation control and obstacle avoidance of UAVs
Zhang et al. Collision avoidance in fixed-wing UAV formation flight based on a consensus control algorithm
Choi et al. Inverse reinforcement learning control for trajectory tracking of a multirotor UAV
CN111880567B (zh) 基于深度强化学习的固定翼无人机编队协调控制方法及装置
CN110825113A (zh) 一种适用于四旋翼无人机集群飞行的队形保持方法
CN102880182A (zh) 一种存在网络随机延迟的微小型无人飞行器控制方法
CN112631335A (zh) 一种基于事件触发的多四旋翼无人机固定事件编队方法
Kim et al. Control of multi-agent collaborative fixed-wing UASs in unstructured environment
Wu et al. Learning-based fixed-wing UAV reactive maneuver control for obstacle avoidance
Bao et al. Design of a fixed-wing UAV controller based on adaptive backstepping sliding mode control method
CN114138002A (zh) 分布式多无人机编队群集行为动态障碍物避障控制方法
CN112666976A (zh) 一种基于一致性的多无人机集群防撞方法
CN115033016A (zh) 一种异构无人集群编队避障方法及***
Zhao et al. Four-dimensional trajectory generation for UAVs based on multi-agent Q learning
Santoso et al. A self-learning TS-fuzzy system based on the C-means clustering technique for controlling the altitude of a hexacopter unmanned aerial vehicle
Wang et al. Robust trajectory planning for spatial-temporal multi-drone coordination in large scenes
Fernando Online flocking control of UAVs with mean-field approximation
CN116820134A (zh) 基于深度强化学习的无人机编队保持控制方法
CN113759935B (zh) 基于模糊逻辑的智能群体编队移动控制方法
De Marco et al. A deep reinforcement learning control approach for high-performance aircraft
CN114967732A (zh) 有人无人机编队集结方法、装置、计算机设备和存储介质
Zhao et al. Automatic co-design of aerial robots using a graph grammar
CN114237297B (zh) 一种基于神经网络训练学习的无人机群飞行控制方法
Montella et al. Reinforcement learning for autonomous dynamic soaring in shear winds
CN116301007A (zh) 基于强化学习的多四旋翼无人机集结型任务路径规划方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant