CN117289725A - 无人机分布式通算一体资源调度方法和装置 - Google Patents

无人机分布式通算一体资源调度方法和装置 Download PDF

Info

Publication number
CN117289725A
CN117289725A CN202311590741.5A CN202311590741A CN117289725A CN 117289725 A CN117289725 A CN 117289725A CN 202311590741 A CN202311590741 A CN 202311590741A CN 117289725 A CN117289725 A CN 117289725A
Authority
CN
China
Prior art keywords
unmanned aerial
aerial vehicle
follower
scheduling
global model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202311590741.5A
Other languages
English (en)
Other versions
CN117289725B (zh
Inventor
杜军
江炳青
侯向往
张华蕾
王劲涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN202311590741.5A priority Critical patent/CN117289725B/zh
Publication of CN117289725A publication Critical patent/CN117289725A/zh
Application granted granted Critical
Publication of CN117289725B publication Critical patent/CN117289725B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及一种无人机分布式通算一体资源调度方法、装置、计算机设备和存储介质。所述方法包括:向各跟随者无人机发送全局模型参数,并接收各跟随者无人机反馈的局部模型参数的欧几里得范数、总能耗和能量虚拟队列;针对每一跟随者无人机,基于跟随者无人机对应的局部模型参数的欧几里得范数、总能耗和能量虚拟队列,确定跟随者无人机的调度概率;根据各跟随者无人机的调度概率在各跟随者无人机中确定目标跟随者无人机,并基于各目标跟随者无人机训练预设的全局模型,得到训练后的全局模型;在训练后的全局模型满足预设的训练停止条件的情况下,将训练后的全局模型确定为无人机调度模型。采用本方法能够提高无人机调度效率。

Description

无人机分布式通算一体资源调度方法和装置
技术领域
本申请涉及无人机技术领域,特别是涉及一种无人机分布式通算一体资源调度方法、装置、计算机设备和存储介质。
背景技术
无人机受益于编队性、动态性、机动性等特点,具有部署快速、行动可控、网络灵活等优势,在各领域均有重要的作用。尤其,无人机或者无人机集群基于无人机分布式通算一体资源调度方法,执行联邦学习任务。其中,无人机集群包含一个领航者无人机和多个跟随者无人机。
目前的无人机分布式通算一体资源调度方法中,被调度的跟随者无人机会将局部更新参数传输给领航者无人机。领航者无人机根据被调度的跟随者无人机的局部更新参数训练全局模型。在全局模型满足预设训练停止条件的情况下,领航者无人机将全局模型确定为无人机调度模型。领航者无人机基于无人机调度模型调度各跟随者无人机执行联邦学习任务。
然而,目前的无人机分布式通算一体资源调度方法,由于每个跟随者无人机的属性不同,按照相同的概率调度跟随者无人机会导致汇总的聚合模型参数出现偏差,进而使得无人机调度效率较差。
发明内容
基于此,有必要针对上述技术问题,提供一种无人机分布式通算一体资源调度方法、装置、计算机设备、和计算机可读存储介质。
第一方面,本申请提供了一种无人机分布式通算一体资源调度方法,所述方法应用于领航者无人机,所述方法包括:
向各跟随者无人机发送全局模型参数,并接收各所述跟随者无人机反馈的局部模型参数的欧几里得范数、总能耗和能量虚拟队列;
针对每一所述跟随者无人机,基于所述跟随者无人机对应的所述局部模型参数的欧几里得范数、总能耗和所述能量虚拟队列,确定所述跟随者无人机的调度概率;
根据各所述跟随者无人机的调度概率在各跟随者无人机中确定目标跟随者无人机,并基于各所述目标跟随者无人机训练预设的全局模型,得到训练后的全局模型;
在所述训练后的全局模型满足预设的训练停止条件的情况下,将所述训练后的全局模型确定为无人机调度模型;所述无人机调度模型用于调度跟随者无人机执行任务。
在其中一个实施例中,所述针对每一所述跟随者无人机,基于所述跟随者无人机对应的所述局部模型参数的欧几里得范数、总能耗和所述能量虚拟队列,确定所述跟随者无人机的调度概率,包括:
针对每一所述跟随者无人机,确定所述跟随者无人机的数据集占比;所述数据集占比为所述跟随者无人机的本地数据集和全部所述跟随者无人机的全部数据集的比例;
根据预设的概率算法对所述局部模型参数的欧几里得范数、所述总能耗、所述能量虚拟队列和所述数据集占比进行数据处理,得到所述跟随者无人机的调度概率。
在其中一个实施例中,所述根据各所述跟随者无人机的调度概率在各跟随者无人机中确定目标跟随者无人机,包括:
根据预设的无放回采样算法和各所述跟随者无人机的调度概率在各跟随者无人机中确定目标跟随者无人机;
将各所述目标跟随者无人机的调度概率更新为零。
在其中一个实施例中,所述基于各所述目标跟随者无人机训练预设的全局模型,得到训练后的全局模型,包括:
通过视线信道接收各所述目标跟随者无人机的局部模型参数;各所述目标跟随者无人机的局部模型参数在所述视线信道中聚合,得到聚合模型参数;
基于所述聚合模型参数、传输噪声、功率缩放因子更新预设的全局模型的参数,得到训练后的全局模型。
在其中一个实施例中,所述基于各所述目标跟随者无人机训练预设的全局模型,得到训练后的全局模型之后,所述方法还包括:
判断所述训练后的全局模型是否满足预设的训练停止条件;
在所述训练后的全局模型不满足所述训练停止条件的情况下,执行所述向各跟随者无人机发送全局模型参数的步骤,直到所述训练后的全局模型满足所述训练停止条件。
第二方面,本申请提供了一种无人机分布式通算一体资源调度方法,所述方法应用于跟随者无人机,所述方法包括:
接收领航者无人机发送的全局模型参数,并根据所述全局模型参数执行预设的随机梯度下降算法,得到局部模型参数的欧几里得范数;
根据所述跟随者无人机的传输属性和中央处理器的性质,确定所述跟随者无人机的总能耗;
基于所述跟随者无人机的总量能约束条件,确定能量虚拟队列;
将所述局部模型参数的欧几里得范数、所述总能耗和所述能量虚拟队列传输给所述领航者无人机。
在其中一个实施例中,所述根据所述跟随者无人机的传输属性和中央处理器的性质,确定所述跟随者无人机的总能耗,包括:
根据所述跟随者无人机的中央处理器的性质,确定所述跟随者无人机对应的计算能耗;
根据所述跟随者无人机的传输功率和功率缩放因子,确定所述跟随者无人机对应的通信能耗;
根据所述计算能耗和所述通信能耗确定所述跟随者无人机对应的总能耗。
第三方面,本申请还提供了一种无人机分布式通算一体资源调度装置,所述装置应用于领航者无人机,所述装置包括:
接收模块,用于向各跟随者无人机发送全局模型参数,并接收各所述跟随者无人机反馈的局部模型参数的欧几里得范数、总能耗和能量虚拟队列;
第一确定模块,用于针对每一所述跟随者无人机,基于所述跟随者无人机对应的所述局部模型参数的欧几里得范数、总能耗和所述能量虚拟队列,确定所述跟随者无人机的调度概率;
训练模块,用于根据各所述跟随者无人机的调度概率在各跟随者无人机中确定目标跟随者无人机,并基于各所述目标跟随者无人机训练预设的全局模型,得到训练后的全局模型;
第二确定模块,用于在所述训练后的全局模型满足预设的训练停止条件的情况下,将所述训练后的全局模型确定为无人机调度模型;所述无人机调度模型用于调度跟随者无人机执行任务。
第四方面,本申请还提供了一种无人机分布式通算一体资源调度装置,所述装置应用于跟随者无人机,所述装置包括:
执行模块,用于接收领航者无人机发送的全局模型参数,并根据所述全局模型参数执行预设的随机梯度下降算法,得到局部模型参数的欧几里得范数;
第三确定模块,用于根据所述跟随者无人机的传输属性和中央处理器的性质,确定所述跟随者无人机的总能耗;
第四确定模块,用于基于所述跟随者无人机的总量能约束条件,确定能量虚拟队列;
传输模块,用于将所述局部模型参数、所述总能耗和所述能量虚拟队列传输给所述领航者无人机。
第五方面,本申请还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
向各跟随者无人机发送全局模型参数,并接收各所述跟随者无人机反馈的局部模型参数的欧几里得范数、总能耗和能量虚拟队列;
针对每一所述跟随者无人机,基于所述跟随者无人机对应的所述局部模型参数的欧几里得范数、总能耗和所述能量虚拟队列,确定所述跟随者无人机的调度概率;
根据各所述跟随者无人机的调度概率在各跟随者无人机中确定目标跟随者无人机,并基于各所述目标跟随者无人机训练预设的全局模型,得到训练后的全局模型;
在所述训练后的全局模型满足预设的训练停止条件的情况下,将所述训练后的全局模型确定为无人机调度模型;所述无人机调度模型用于调度跟随者无人机执行任务。
第六方面,本申请还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
接收领航者无人机发送的全局模型参数,并根据所述全局模型参数执行预设的随机梯度下降算法,得到局部模型参数的欧几里得范数;
根据所述跟随者无人机的传输属性和中央处理器的性质,确定所述跟随者无人机的总能耗;
基于所述跟随者无人机的总量能约束条件,确定能量虚拟队列;
将所述局部模型参数的欧几里得范数、所述总能耗和所述能量虚拟队列传输给所述领航者无人机。
第七方面,本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
向各跟随者无人机发送全局模型参数,并接收各所述跟随者无人机反馈的局部模型参数的欧几里得范数、总能耗和能量虚拟队列;
针对每一所述跟随者无人机,基于所述跟随者无人机对应的所述局部模型参数的欧几里得范数、总能耗和所述能量虚拟队列,确定所述跟随者无人机的调度概率;
根据各所述跟随者无人机的调度概率在各跟随者无人机中确定目标跟随者无人机,并基于各所述目标跟随者无人机训练预设的全局模型,得到训练后的全局模型;
在所述训练后的全局模型满足预设的训练停止条件的情况下,将所述训练后的全局模型确定为无人机调度模型;所述无人机调度模型用于调度跟随者无人机执行任务。
第八方面,本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
接收领航者无人机发送的全局模型参数,并根据所述全局模型参数执行预设的随机梯度下降算法,得到局部模型参数的欧几里得范数;
根据所述跟随者无人机的传输属性和中央处理器的性质,确定所述跟随者无人机的总能耗;
基于所述跟随者无人机的总量能约束条件,确定能量虚拟队列;
将所述局部模型参数的欧几里得范数、所述总能耗和所述能量虚拟队列传输给所述领航者无人机。
上述无人机分布式通算一体资源调度方法、装置、计算机设备和存储介质,向各跟随者无人机发送全局模型参数,并接收各所述跟随者无人机反馈的局部模型参数的欧几里得范数、总能耗和能量虚拟队列;针对每一所述跟随者无人机,基于所述跟随者无人机对应的所述局部模型参数的欧几里得范数、总能耗和所述能量虚拟队列,确定所述跟随者无人机的调度概率;根据各所述跟随者无人机的调度概率在各跟随者无人机中确定目标跟随者无人机,并基于各所述目标跟随者无人机训练预设的全局模型,得到训练后的全局模型;在所述训练后的全局模型满足预设的训练停止条件的情况下,将所述训练后的全局模型确定为无人机调度模型;所述无人机调度模型用于调度跟随者无人机执行任务。采用本方法,通过跟随者无人机对应的局部模型参数的欧几里得范数、总能耗和能量虚拟队列确定跟随者无人机的调度概率,进而基于调度概率对各跟随者无人机进行筛选,得到性能更好的目标跟随者无人机。根据性能更好的目标跟随者人机训练全局模型,得到无人机调度模型,提高了无人机调度效率。
附图说明
为了更清楚地说明本申请实施例或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为一个实施例中无人机分布式通算一体资源调度方法的应用环境图;
图2为一个实施例中领航者无人机执行无人机分布式通算一体资源调度方法的流程示意图;
图3为一个实施例中确定调度概率步骤的流程示意图;
图4为一个实施例中确定目标跟随者无人机步骤的流程示意图;
图5为一个实施例中训练全局模型步骤的流程示意图;
图6为一个实施例中判断全局模型是否满足训练停止条件步骤流程示意图;
图7为一个实施例中跟随者无人机执行无人机分布式通算一体资源调度方法的流程示意图;
图8为一个实施例中确定总能耗步骤的流程示意图;
图9为另一个实施例中无人机分布式通算一体资源调度方法的流程示意图;
图10为一个实施例中无人机分布式通算一体资源调度装置的结构框图;
图11为另一个实施例中无人机分布式通算一体资源调度装置的结构框图;
图12为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例提供的无人机分布式通算一体资源调度方法,可以应用于如图1所示的无人机调度集群100中。其中,无人机调度集群100包括一个领航者无人机110和多个跟随者无人机120。领航者无人机110和每一跟随者无人机120进行通信,传输数据。
在一个示例性的实施例中,如图2所示,提供了一种无人机分布式通算一体资源调度方法,以该方法应用于图1中的领航者无人机110(以下省略称号为领航者无人机)为例进行说明,包括以下步骤202至步骤208。其中:
步骤202,向各跟随者无人机发送全局模型参数,并接收各跟随者无人机反馈的局部模型参数的欧几里得范数、总能耗和能量虚拟队列。
其中,总能耗包括计算能耗和通信能耗,表征跟随者无人机在执行联邦学习任务中的能量消耗。虚拟能量队列表征到当前训练轮次的累积总能耗和能量约束之间的差距。
在实施中,领航者无人机向所有的跟随者无人机广播全局模型参数,使得各跟随者无人机基于全局模型参数进行局部模型训练,得到局部模型参数的欧几里得范数。每一跟随者无人机基于该跟随者无人机的属性信息,确定该跟随者无人机对应的总能耗和能量虚拟队列。每一跟随者无人机通过控制信道将该跟随者无人机的局部模型参数的欧几里得范数、总能耗和能量虚拟队列传输给领航者无人机。领航者无人机通过控制信道接收各跟随者无人机反馈的局部模型参数的欧几里得范数、总能耗和能量虚拟队列。
可选的,全局模型参数根据任务的需求确定,本申请实施例对于全局模型参数不做限定。
步骤204,针对每一跟随者无人机,基于跟随者无人机对应的局部模型参数的欧几里得范数、总能耗和能量虚拟队列,确定跟随者无人机的调度概率。
在实施中,领航者无人机中预先设置有概率算法。领航者无人机针对每一跟随者无人机,根据预设的概率算法对该跟随者无人机对应的局部模型参数的欧几里得范数、总能耗和能量虚拟队列进行数据处理,得到该跟随者无人机的调度概率。
步骤206,根据各跟随者无人机的调度概率在各跟随者无人机中确定目标跟随者无人机,并基于各目标跟随者无人机训练预设的全局模型,得到训练后的全局模型。
在实施中,领航者无人机中预先设置有调度数量。领航者无人机根据各跟随者无人机的调度概率在各跟随者无人机中确定符合调度数量的目标跟随者无人机。然后,领航者无人机基于各目标跟随者无人机的局部模型参数训练预设的全局模型,得到训练后的全局模型。然后,领航者无人机判断训练后的全局模型是否满足预设的训练停止条件。
可选的,调度数量根据全局模型的训练需求和跟随者无人机的数量确定,本申请实施例对于调度数量不做限定。
可选的,训练停止条件可以为训练轮次达到预设的训练轮次阈值,或者全局模型收敛,本申请实施例对于训练停止条件不做限定。
步骤208,在训练后的全局模型满足预设的训练停止条件的情况下,将训练后的全局模型确定为无人机调度模型。
其中,无人机调度模型用于调度跟随者无人机执行任务。
在实施中,在训练后的全局模型满足预设的训练停止条件的情况下,领航者无人机将训练后的全局模型确定为无人机调度模型。领航者无人机根据无人机调度模型调度跟随者无人机执行任务。跟随者无人机可以为训练过程中的目标跟随者无人机,也可以为其它跟随者无人机。调度的跟随者无人机的数量不做限定。
上述无人机分布式通算一体资源调度方法中,通过跟随者无人机对应的局部模型参数的欧几里得范数、总能耗和能量虚拟队列确定跟随者无人机的调度概率,进而基于调度概率对各跟随者无人机进行筛选,得到性能更好的目标跟随者无人机。根据性能更好的目标跟随者人机训练全局模型,得到无人机调度模型,提高了无人机调度效率。
在一个示例性的实施例中,如图3所示,步骤204的具体处理过程包括步骤302至步骤304。其中:
步骤302,针对每一跟随者无人机,确定跟随者无人机的数据集占比。
其中,数据集占比为跟随者无人机的本地数据集和全部跟随者无人机的全部数据集的比例。数据集占比表征跟随者无人机之间数据分布的不均衡性,具有数据规模比例较大的跟随者无人机训练得到的局部模型参数对全局模型训练的贡献较大。
在实施中,领航者无人机将各跟随者无人机的本地数据集的数据量进行加法处理,得到全部跟随者无人机的全部数据集的数据量。然后,领航者无人机针对每一跟随者无人机,对该跟随者无人机的本地数据集的数据量和全部数据集的数据量进行比例运算,得到该跟随者无人机的数据集占比。
在一示例性实施例中,用表示第/>个跟随者无人机,/>表示第/>个跟随者无人机的本地数据集。领航者无人机根据预设的数据集聚合算法对各跟随者无人机的本地数据集的数据量进行加法运算,得到全部跟随者无人机的全部数据集的数据量。数据集聚合算法如下公式(1):
(1)
其中,在上述公式(1)中,为大于0的自然数,/>表示第n个跟随者无人机,/>表示第n个跟随者无人机的本地数据集,D表示全部数据集的数据量,/>表示对第/>个至第/>个跟随者无人机的本地数据集的数据量的模进行相加。
步骤304,根据预设的概率算法对局部模型参数的欧几里得范数、总能耗、能量虚拟队列和数据集占比进行数据处理,得到跟随者无人机的调度概率。
在实施中,领航者无人机中预先设置有概率算法。领航者无人机根据概率算法对跟随者无人机的局部模型参数的欧几里得范数、总能耗、能量虚拟队列和数据集占比进行计算,得到该跟随者无人机的调度概率。
其中,概率算法如下公式(2)所示:
(2)
在上述公式(2)中,n表示第n个跟随者无人机,训练轮次使用t∈{1,2,…,T}进行索引,T为通信总轮次,T也是训练总轮次。为跟随者无人机的局部模型参数的欧几里得范数,/>为数据集占比,/>为能量虚拟队列,/>表示保证/>的拉格朗日乘子的最优值,可以通过一维搜索算法得到。/>表示总能耗,/>为权重系数。/>为跟随者无人机在第t轮的调度概率。
在一示例性实施例中,本申请探索了一个全新的度量指标以评估本地更新对全局模型训练的贡献。为了便于进一步分析,假设损失函数为L-光滑,即/>,满足如下公式(3):
(3)
其中,在上述公式(3)中,和/>分别为函数/>在/>点和/>点的值,/>为函数的梯度的转置,/>为/>点和/>点之间的距离,/>为函数/>在点/>处关于向量的二阶泰勒展开的前两项。
在公式(3)的基础上,确定了基于空中计算的联邦学习***在概率调度机制下的收敛性能。具体地:设备调度集为目标跟随者无人机集合。给定最优全局学习模型和设备调度集/>则第t轮的收敛速度如下公式(4)所示:
(4)
其中,,/>为第t轮训练中全局模型的学***方。/>表示L-光滑常数。为第n个跟随者无人机在第t轮训练的调度概率,N为跟随者无人机的总数,/>为第n个跟随者无人机的数据集占比,/>为第n个跟随者无人机在第t轮训练中的局部模型参数的欧几里得范数的平方。/>为默认功率缩放因子的平方,/>为第t轮训练中功率缩放因子的平方。/>为t+1轮全局损失值与最优值的期望差距,该最优值以四项因子为界。第一项/>表示 t轮全局损失值与最优值的期望差距,而第二项/>和第三项/>与聚合模型参数(真实全局梯度)的二范数相关,第四项与聚合模型参数的方差/>有关。进一步观察公式(4),前三项与调度策略无关,可以作为常数;而全局聚合梯度的方差取决于调度设计,需要进行优化。值得注意的是,真实全局梯度表明了全局损失函数下降最快的方向。因此,全局聚合梯度的方差越小,全局损失函数的减少速度越快。综上,公式(4)建立了梯度方差和模型收敛速度之间的联系,因此引入了梯度差异的概念,即/>,它衡量了局部模型参数(本地梯度)和聚合模型参数(真实全局梯度)之间的差异,为本地更新重要性提供了一个有效的度量方法,较小的梯度差异对全局模型收敛的贡献更大。
在本申请中,联邦学***衡梯度差距和能量消耗这两个因素。具体来说,/>的值是通过考虑两个分量的相对大小关系来确定的,使得二者达到相似的尺度。此外,由于真实全局梯度在训练过程中是不可访问的,且与设备调度策略无关,因此忽略了梯度差距中的/>项。设备调度问题可以表示为公式组(5)。
(5)
其中,在上述公式组(5)中,表征第1个跟随者无人机至第N个跟随者无人机的调度概率,N为跟随者无人机的数量。/>表示最小。/>为第n个跟随者无人机在第t轮训练中的能量虚拟队列。/>为第n个跟随者无人机在第t轮训练中的局部模型参数的欧几里得范数,/>为第n个跟随者无人机的数据集占比。/>为权重系数。/>为第n个跟随者无人机在第t轮训练中的调度概率,/>表示第n个跟随者无人机在第t轮训练中的总能耗。T为训练总轮次。/>表示跟随者无人机n (n∈N)是否参与本轮次的梯度上传,/>表示第n个无人机的能耗。由于公式组(5)是凸函数,通过KKT(Kuhn-Tucker conditions,库恩塔克)条件求解得到跟随者无人机的调度概率的算法,即上述公式(2)。
上述公式(2)表明,最优调度概率主要依赖于三个因素,即本地数据占比、局部梯度(局部模型参数)/>的欧几里得范数和总能耗/>。具体来说,数据集占比(本地数据占比)反映了跟随者无人机之间数据分布的不均衡性,具有数据规模比例较大的跟随者无人机训练得到的局部模型参数(局部梯度)对全局模型训练的贡献较大。为了加速模型收敛,需要尽可能调度具有更大梯度范数的跟随者无人机。由于跟随者无人机之间信道条件和计算能力具有差异性,为能耗较大的无人机分配了较低的概率是合理的。因此,领航者无人机可以通过综合考虑更新重要性、信道条件和计算能力得到合理的调度概率分布。
本实施例中,通过局部模型参数的欧几里得范数、总能耗、能量虚拟队列和数据集占比确定跟随者无人机的调度概率,明确了跟随者无人机异质性和能量消耗对调度概率之间的关系,提高了训练全局模型的效率,并提高了无人机调度的能量效率。
在一个示例性的实施例中,如图4所示,步骤206 中的根据各跟随者无人机的调度概率在各跟随者无人机中确定目标跟随者无人机的具体处理过程包括步骤402至步骤404。其中:
步骤402,根据预设的无放回采样算法和各跟随者无人机的调度概率在各跟随者无人机中确定目标跟随者无人机。
在实施中,领航者无人机中预先设置有无放回采样算法。领航者无人机基于预先设置的无放回采样算法和各跟随者无人机的调度概率,在各跟随者无人机中确定目标跟随者无人机。
步骤404,将各目标跟随者无人机的调度概率更新为零。
在实施中,为了使得全局模型训练的数据集更加丰富,在确定完成目标跟随者人机之后,将目标跟随者无人机的调度概率更新为零。
在一示例性实施例中,由于空中计算引入的信道失真问题,需要调度多个跟随者无人机来减轻相应的影响。具体来说,通过调度多个跟随者无人机,信道噪声的方差将降低至,从而在一定程度上减轻了信道失真的影响。其中,/>为默认功率缩放因子的平方,为第t轮训练中功率缩放因子的平方。/>表示第t轮训练中目标跟随者无人机集合。为了实现低复杂度调度算法,领航者无人机根据公式(2)表征的最优调度概率分布,基于预设的无放回采样策略,依次选择多个跟随者无人机。具体来说,当选择了s-1个跟随者无人机,所选跟随者无人机(所选跟随者无人机为目标跟随者无人机)的调度概率将置为0。因此,用于选择下一个跟随者无人机的条件调度分布如下公式(6)所示:
(6)
其中,在上述公式(6)中,表征下一跟随者无人机的调度概率。/>为已经选择了的目标跟随者无人机。t为当前训练轮数。/>为公式(2)中的跟随者人机的调度概率。/>为1至s-1的自然数。/>为没有被选择的跟随者无人机。/>为第j个没有被选择的跟随者无人机的调度概率。因此,所选跟随者无人机(目标跟随者无人机)的放缩本地梯度可以表示为公式(7),公式(7)如下所示:
(7)
其中,在上述公式(7)中,为第n个目标跟随者无人机的局部模型参数,/>表示全部数据集的数据量,/>表征下一跟随者无人机的调度概率,/>为第n个目标跟随者无人机的放缩本地梯度。/>第n个目标跟随者无人机的本地数据集的数据量。值得注意的是,此时所选局部模型参数(本地梯度)的平均值依然满足聚合过程中对真实全局梯度的无偏估计。
本实施例中,通过无放回采样方法和各跟随者无人机的调度概率确定目标跟随者无人机,确定了性能更好的目标跟随者无人机,提高了无人机调度的效率。
在一个示例性的实施例中,如图5所示,步骤206中的基于各目标跟随者无人机训练预设的全局模型,得到训练后的全局模型的具体处理过程包括步骤502至步骤504。其中:
步骤502,通过视线信道接收各目标跟随者无人机的局部模型参数。
其中,各目标跟随者无人机的局部模型参数在视线信道中聚合,得到聚合模型参数。
在实施中,各目标跟随者无人机将该目标跟随者无人机的局部模型参数通过视线(LoS,Line-of-Sight)信道传输给领航者无人机。各跟随者无人机的局部模型参数在视线信道中聚合,得到聚合模型参数。然后,领航者无人机通过视线信道接收聚合模型参数。
步骤504,基于聚合模型参数、传输噪声、功率缩放因子更新预设的全局模型的参数,得到训练后的全局模型。
在实施中,领航者无人机中预先设置有模型更新算法。领航者无人机模型更新算法对聚合模型参数、传输噪声、功率缩放因子进行数据处理,更新预设的全局模型的参数,得到训练后的全局模型。
其中,模型更新算法如下公式(8)所示:
(8)
其中,在上述公式(8)中,为当前训练轮次(第t轮)的全局模型参数,/>为上一训练轮次(第 t-1)轮的全局模型参数。/>为当前训练轮次中全局模型的学习速率,/>为当前训练轮次中的功率缩放因子。/>为表示第t轮训练中目标跟随者无人机集合。/>为聚合模型参数。/>为传输噪声,即均值和方差均为零的加性高斯噪声。/>为领航者无人机将接收到掺杂信道衰落和噪声的传输信号加权和。
在一示例性实施例中,本申请的无人机调度算法应用于无人机调度集群100中。无人机调度集群100包括1个领航者无人机和个跟随者无人机UAV(Unmanned AerialVehicle,无人驾驶飞机)/>。在每一轮的协作训练过程中,被选中的跟随者无人机(目标跟随者无人机)与领航者无人机训练共享全局模型,训练轮次使用t∈{1,2,…,T}进行索引,其中T为通信总轮次,也是训练总轮次。由于所有的无人机在任务执行过程中都作为一个集群,因此,采用基于三维笛卡尔坐标系进行建模。具体来说,第t轮训练中领航者无人机和跟随者无人机的三维坐标可以分别表示为/>。然而,由于动态环境的影响,无人机群缺乏保持固定拓扑结构的能力,导致跟随者无人机与领航者无人机之间的相对位置不断变化,即环境的动态特征导致了集群内布空间结构的不断变化。由于无人机通常在高海拔飞行,无人机集群所遇到的障碍物很少。因此,假设每个跟随者无人机和领航者无人机之间的通信链路主要由视线信道主导以实现可靠的通信。根据自由空间路径损耗模型,在第t轮更新中,跟随者无人机n与领航者无人机之间的信道增益如下公式(9)所示:
(9)
其中,在上述公式(9)中。为参考距离/>处的信道增益,/>表示领航者无人机与跟随者无人机之间的距离,即/>。/>表示跟随者无人机n与领航者无人机之间的信道增益,/>为距离衰减指数。在建立联邦学习***的过程中,基于跟随者无人机n的本地数据集/>的局部损失函数如下公式(10)所示:
(10)
其中,在上述公式(10)中,为数据样本/>的损失函数,用来量化训练样本/>上的模型参数/>与地面真实标签/>之间的预测误差。数据样本/>是/>中数据样本,/>为跟随者无人机n的本地数据集。无人机集群的任务是通过最小化联邦学习的全局损失函数,得到一个最优的全局模型参数/>,下述公式(11)表示最优化全局模型参数的过程:
(11)
其中,在上述公式(11)中,。/>为最优的全局模型参数。/>为全部数据集的数据量,/>为第n个跟随者无人机的本地数据集。/>为全局模型参数。
在传统的联邦平均策略中,每个节点参与训练的概率是相等的。然而在异质性的环境下,这种策略通常会导致全局梯度产生偏差。为了克服这一问题,本申请采用了概率调度框架进行调度设计,其中每个跟随者无人机被分配一个特定的概率,记为,/>,表示参与该轮次训练的概率。因此,领航者无人机的全局模型参数更新可以通过公式(12)进行:
(12)
其中,为第t轮训练中的学习速率,系数/>用来保证第t轮训练中领航者无人机的无偏梯度聚集。/>为全部数据集的数据量,/>为第n个跟随者无人机的本地数据集。/>为第n个跟随者无人机在第t轮训练过程中的调度概率。/>为第n个跟随者无人机在第t轮训练过程中的局部模型参数。/>为表示第t轮训练中目标跟随者无人机集合。/>为第t轮训练中的全局模型参数,/>为第t-1轮训练中的全局模型参数。
为了进一步提高通信效率,目标跟随者无人机在联邦学习***中采用了空中计算的传输方式来进行上行信道接入。假设所有目标跟随者无人机的传输是严格同步的。为了减轻空中计算在波形叠加过程中引入的信道衰落和噪声影响,每个目标跟随者无人机n以传输功率传输其本地梯度信息(局部模型参数)。因此,领航者无人机将接收到掺杂信道衰落和噪声的传输信号加权和如下公式(13)所示:
(13)
其中,在上述公式(13)中,,/>表示均值和方差均为零的的加性高斯噪声。/>为跟随者无人机n与领航者无人机之间的信道增益。/>为第n个跟随者无人机在第t轮训练过程中的调度概率。/>第n个跟随者无人机在第t轮训练过程中的局部模型参数。/>为表示第t轮训练中目标跟随者无人机集合。为了抵抗信道衰落和噪声的影响,利用信道反演策略进行梯度聚合。具体来说,在t轮中跟随者无人机n的传输功率/>如下公式(14)所示:/>
(14)
其中,在公式(14)中,为对应的功率缩放因子。/>为跟随者无人机n与领航者无人机之间的信道增益。因此,全局模型的模型更新算法如上公式(8)所示。
本实施例中,基于视线信道接收聚合模型参数,利用视线信道的叠加特性实现低时延参数上传,并基于聚合模型参数更新全局模型的参数,提高了训练全局模型的效率。
在一个示例性的实施例中,在训练后的全局模型不满足训练停止条件的情况下,需要继续训练全局模型,直到训练后的全局模型满足训练停止条件。如图6所示,在步骤206执行之后,该无人机分布式通算一体资源调度方法的具体处理过程还包括步骤602至步骤604。其中:
步骤602,判断训练后的全局模型是否满足预设的训练停止条件。
其中,训练停止条件为训练轮轮次达到预设的训练轮次阈值或者全局模型收敛。
在实施中,领航者无人机中预先设置有训练轮次阈值。领航者无人机判断训练轮轮次是否达到预设的训练轮次阈值并判断训练后的全局模型是否收敛。在训练后的全局模型收敛或者训练轮次达到预设的训练轮次阈值的情况下,领航者无人机确定训练后的全局模型满足预设的训练停止条件。在训练后的全局模型不收敛且训练轮次未达到预设的训练轮次阈值的情况下,领航者无人机确定训练后的全局模型不满足预设的训练停止条件。
可选的,训练轮次阈值根据全局模型的训练需求确定,本申请实施例对训练轮次阈值不做限定。
步骤604,在训练后的全局模型不满足训练停止条件的情况下,执行向各跟随者无人机发送全局模型参数的步骤,直到训练后的全局模型满足训练停止条件。
在实施中,在训练后的全局模型不满足训练停止条件的情况下,领航者无人机执行上述步骤202,直到训练后的全局模型满足训练停止条件。其中,步骤202的具体实施过程已经在上述实施例中进行详细阐述,本申请实施例在此不再赘述。
本实施例中,训练后的全局模型不满足训练停止条件的情况下,再次训练全局模型,通过多次训练全局模型,提高了全局模型的准确性,进而提高了无人机调度的效率。
在一个示例性的实施例中,如图7所示,提供了一种无人机分布式通算一体资源调度方法,以该方法应用于图1中的跟随者无人机120(以下省略称号为跟随者无人机)为例进行说明,包括以下步骤702至步骤708。其中:
步骤702,接收领航者无人机发送的全局模型参数,并根据全局模型参数执行预设的随机梯度下降算法,得到局部模型参数的欧几里得范数。
在实施中,跟随者无人机接收无人机发送的全局模型参数。然后,跟随者无人机根据全局模型参数,执行预先设置的随机梯度下降算法,计算该跟随者无人机对应的局部模型参数。跟随者无人机对局部模型参数进行向量长度计算,得到局部模型参数的欧几里得范数。
在一示例性实施例中,跟随者无人机接收到全局模型参数后,基于跟随者无人机的本地数据集中的局部小批量本地数据,即/>执行随机梯度下降算法,计算局部模型梯度(局部模型参数)/>。其中,/>为局部小批量本地数据。局部模型梯度计算如下公式(15)所示:/>
(15)
其中,在上述公式(15)中,是第t轮从数据集/>中随机选择的带有标签的数据样本子集。/>是/>中数据样本。/>为数据样本/>在t-1轮的损失函数的梯度。受通信资源和存储能力的限制,每一轮只能选择一部分有能力的跟随者无人机进行梯度上传,这里使用/>表示第t轮所选择的跟随者无人机集合。
步骤704,根据跟随者无人机的传输属性和中央处理器的性质,确定跟随者无人机的总能耗。
在实施中,跟随者无人机中包含CPU(Central Processing Unit,中央处理器)。跟随者无人机根据数据样本训练需要的CPU频率和CPU的风扇转数,确定跟随者无人机的计算能耗。然后,跟随者无人机基于传输属性确定通信能耗。跟随者无人机对计算能耗和通信能耗进行加法运算,得到跟随者无人机的总能耗。
步骤706,基于跟随者无人机的总量能约束条件,确定能量虚拟队列。
在实施中,跟随者无人机根据累积能耗和总能量约束条件之间的差距,确定能量虚拟队列。
在一示例性实施例中,为了满足设备的总能量约束,本申请为跟随者无人机n∈N构造了一个虚拟队列来表示到t轮训练中的累积能耗与能量约束之间的差距,虚拟队列的更新方式如下公式(16)所示:
(16)
其中,在上述公式(16)中,初始值,/>表示UAV n (n∈N)是否参与本轮次的梯度上传,其中/>说明参与本轮次梯度上传,否则不参与本轮次梯度上传。/>表示跟随者无人机n的总能量约束,/>表示每一轮的平均能量约束。
步骤708,将局部模型参数的欧几里得范数、总能耗和能量虚拟队列传输给领航者无人机。
在实施中,跟随者无人机将局部模型参数的欧几里得范数、总能耗和能量虚拟队列通过控制信道传输给领航者无人机。
本实施例中,各跟随者无人机该跟随者无人机对应的局部模型参数的欧几里得范数、总能耗和能量虚拟队列,并传输给领航者无人机,便于跟随者人机确定各跟随者无人机的调度概率,进而使得聚合模型参数的变得准确。
在一个示例性的实施例中,如图8所示,步骤704的具体处理过程包括步骤802至步骤806。其中:
步骤802,根据跟随者无人机的中央处理器的性质,确定跟随者无人机对应的计算能耗。
其中,中央处理器的性质包括CPU频率和CPU的风扇转速。
在实施中,跟随者无人机根据预设的计算能耗算法,对跟随者无人机的CPU频率和CPU的风扇转速进行数据处理,得到该跟随者无人机对应的计算能耗。
在一示例性实施例中,鉴于无人机的能量供应有限,如何最小化整体训练的能耗是至关重要的,包括通信能耗和计算能耗。本申请采用CPU频率来描述计算能力。假设在t轮中跟随者无人机n的CPU频率为,一个数据样本训练所需的CP转数为/>。因此,在第t轮训练中,跟随者无人机n的计算能耗算法如下公式(17)所示:
(17)
其中,在上述公式(17)中,是依赖于芯片架构的有效交换电容值。具体来说,/>在训练过程中是时变的,因为不同无人机的计算负荷一直在变化。/>为跟随者无人机n的CPU频率。/>为一个数据样本训练所需的CP转数。/>为跟随者无人机n的计算能耗。
步骤804,根据跟随者无人机的传输功率和功率缩放因子,确定跟随者无人机对应的通信能耗。
在实施中,跟随者无人机预设的通信能耗算法,对跟随者无人机的传输功率和功率缩放因子进行数据计算,得到跟随者无人机对应的通信能耗。其中,通信能耗算法如下公式(18)所示:
(18)
其中,在上述公式(18)中,为跟随者无人机n在第t轮中传输梯度产生的通信能耗。/>表示跟随者无人机n在第t轮中的传输功率。/>为对应的功率缩放因子。/>为跟随者无人机n与领航者无人机之间的信道增益。
步骤806,根据计算能耗和通信能耗确定跟随者无人机对应的总能耗。
在实施中,跟随者无人机对计算能耗和通信能耗进行加法运算,得到跟随者无人机的总能耗。其中,总能耗的计算过程如下公式(19)所示:
(19)
其中,在上述公式(19),为跟随者无人机的总能耗。/>为跟随者无人机n在第t轮中传输梯度产生的通信能耗。/>为跟随者无人机n的计算能耗。
本实施例中,通过跟随者无人机的CPU性质和传输属性,确定跟随者无人机的总能耗,明确了跟随者无人机在训练过程中的能量消耗,便于后续确定跟随者无人机的调度概率。
在一示例性实施例中,图9另一个实施例中无人机分布式通算一体资源调度方法的流程示意图,包括:
步骤901,领航者无人机广播全局模型参数。
在实施中,领航者无人机向各跟随者无人机广播全局模型参数。
步骤902,所有跟随者无人机进行本地模型训练,并确定各跟随者无人机的总能耗和能量虚拟队列。
在实施中,各跟随者人机接收全局模型参数,并根据全局模型参数执行随机梯度下降算法,得到本地模型梯度(局部模型参数)。然后,各跟随者无人机对本地模型梯度进行向量长度计算,得到本地模型梯度的欧几里得范数。每一跟随者无人机根据该跟随者无人机的传输属性和中央处理器的性质,确定该跟随者无人机的总能耗。然后,每一跟随者无人机基于该跟随者无人机的总量能约束条件,确定能量虚拟队列。
步骤903,所有跟随者无人机上传本地模型梯度的欧几里得范数、总能耗和能量虚拟队列。
在实施中,各跟随者无人机通过控制信道向领航者无人机上传本地模型梯度的欧几里得范数、总能耗和能量虚拟队列。
步骤904,领航者无人机根据公式计算调度概率。
在实施中,领航者无人机接收各跟随者无人机的本地模型梯度的欧几里得范数、总能耗和能量虚拟队列。然后,领航者无人机针对每一跟随者无人机,根据预设的概率算法(公式)对跟随者无人机的本地模型梯度的欧几里得范数、总能耗和能量虚拟队列进行处理,得到该跟随者无人机的调度概率。
步骤905,领航者无人机根据调度概率采样选择指定数量跟随者无人机。
在实施中,领航者无人机根据各跟随者无人机的调度概率在各跟随者无人机中确定目标跟随者无人机。
步骤906,聚合指定数量跟随者无人机的梯度信息,以此为基础进行全局模型参数更新。
在实施中,各目标跟随者无人机将本地模型梯度通过视线信道传输给领航者无人机。各目标跟随者无人机的本地模型梯度在视线信道中聚合,得到聚合模型参数。领航者无人机基于聚合模型参数更新预设的全局模型的参数,得到训练后的全局模型。
步骤907,判断是否收敛或者达到最大更新轮数。
在实施中,领航者无人机判断训练后的全局模型是否收敛或者训练轮数是否达到最大更新轮数。若训练后的全局模型收敛或者训练轮数达到最大更新轮数,领航者无人机确定训练后的全局模型为无人机模型,训练结束。若训练后的全局模型未收敛且训练轮数未达到最大更新轮数,领航者无人机执行步骤901,直到训练后的全局模型收敛或者训练轮数达到最大更新轮数。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的无人机分布式通算一体资源调度方法的无人机分布式通算一体资源调度装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个无人机分布式通算一体资源调度装置实施例中的具体限定可以参见上文中对于无人机分布式通算一体资源调度方法的限定,在此不再赘述。
在一个示例性的实施例中,如图10所示,提供了一种无人机分布式通算一体资源调度装置1000,包括:接收模块1001、第一确定模块1002、训练模块1003和第二确定模块1004,其中:
接收模块1001,用于向各跟随者无人机发送全局模型参数,并接收各跟随者无人机反馈的局部模型参数的欧几里得范数、总能耗和能量虚拟队列。
第一确定模块1002,用于针对每一跟随者无人机,基于跟随者无人机对应的局部模型参数的欧几里得范数、总能耗和能量虚拟队列,确定跟随者无人机的调度概率。
训练模块1003,用于根据各跟随者无人机的调度概率在各跟随者无人机中确定目标跟随者无人机,并基于各目标跟随者无人机训练预设的全局模型,得到训练后的全局模型。
第二确定模块1004,用于在训练后的全局模型满足预设的训练停止条件的情况下,将训练后的全局模型确定为无人机调度模型;无人机调度模型用于调度跟随者无人机执行任务。
在一示例性实施例中,第一确定模块1002包括:
第一确定子模块,用于针对每一跟随者无人机,确定跟随者无人机的数据集占比;数据集占比为跟随者无人机的本地数据集和全部跟随者无人机的全部数据集的比例。
第一处理子模块,用于根据预设的概率算法对局部模型参数的欧几里得范数、总能耗、能量虚拟队列和数据集占比进行数据处理,得到跟随者无人机的调度概率。
在一示例性实施例中,训练模块1003包括第二确定子模块和第一训练子模块。其中,第二确定子模块包括:
第三确定子模块,用于根据预设的无放回采样算法和各跟随者无人机的调度概率在各跟随者无人机中确定目标跟随者无人机。
第一更新子模块,用于将各目标跟随者无人机的调度概率更新为零。
在一示例性实施例中,训练模块1003包括第二确定子模块和第一训练子模块。其中,第一训练子模块包括:
第一接收子模块,用于通过视线信道接收各目标跟随者无人机的局部模型参数;各目标跟随者无人机的局部模型参数在视线信道中聚合,得到聚合模型参数。
第二更新子模块,用于基于聚合模型参数、传输噪声、功率缩放因子更新预设的全局模型的参数,得到训练后的全局模型。
在一示例性实施例中,无人机分布式通算一体资源调度装置1000还包括:
判断模块,用于判断训练后的全局模型是否满足预设的训练停止条件。
第二执行模块,用于在训练后的全局模型不满足训练停止条件的情况下,执行向各跟随者无人机发送全局模型参数的步骤,直到训练后的全局模型满足训练停止条件。
在一个示例性的实施例中,如图11所示,提供了一种无人机分布式通算一体资源调度装置1100,包括:执行模块1101、第三确定模块1102、第四确定模块1103和传输模块1104,其中:
执行模块1101,用于接收领航者无人机发送的全局模型参数,并根据全局模型参数执行预设的随机梯度下降算法,得到局部模型参数的欧几里得范数。
第三确定模块1102,用于根据跟随者无人机的传输属性和中央处理器的性质,确定跟随者无人机的总能耗。
第四确定模块1103,用于基于跟随者无人机的总量能约束条件,确定能量虚拟队列。
传输模块1104,用于将局部模型参数的欧几里得范数、总能耗和能量虚拟队列传输给领航者无人机。
在一示例性实施例中,第三确定模块1102用于根据跟随者无人机的中央处理器的性质,确定跟随者无人机对应的计算能耗;根据跟随者无人机的传输功率和功率缩放因子,确定跟随者无人机对应的通信能耗;根据计算能耗和通信能耗确定跟随者无人机对应的总能耗。
上述无人机分布式通算一体资源调度装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个示例性的实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图12所示。该计算机设备包括处理器、存储器、输入/输出接口、通信接口、显示单元和输入装置。其中,处理器、存储器和输入/输出接口通过***总线连接,通信接口、显示单元和输入装置通过输入/输出接口连接到***总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作***和计算机程序。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种无人机分布式通算一体资源调度方法。该计算机设备的显示单元用于形成视觉可见的画面,可以是显示屏、投影装置或虚拟现实成像装置。显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图12中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random AccessMemory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

Claims (10)

1.一种无人机分布式通算一体资源调度方法,其特征在于,所述方法应用于领航者无人机,所述方法包括:
向各跟随者无人机发送全局模型参数,并接收各所述跟随者无人机反馈的局部模型参数的欧几里得范数、总能耗和能量虚拟队列;
针对每一所述跟随者无人机,基于所述跟随者无人机对应的所述局部模型参数的欧几里得范数、总能耗和所述能量虚拟队列,确定所述跟随者无人机的调度概率;
根据各所述跟随者无人机的调度概率在各跟随者无人机中确定目标跟随者无人机,并基于各所述目标跟随者无人机训练预设的全局模型,得到训练后的全局模型;
在所述训练后的全局模型满足预设的训练停止条件的情况下,将所述训练后的全局模型确定为无人机调度模型;所述无人机调度模型用于调度跟随者无人机执行任务。
2.根据权利要求1所述的方法,其特征在于,所述针对每一所述跟随者无人机,基于所述跟随者无人机对应的所述局部模型参数的欧几里得范数、总能耗和所述能量虚拟队列,确定所述跟随者无人机的调度概率,包括:
针对每一所述跟随者无人机,确定所述跟随者无人机的数据集占比;所述数据集占比为所述跟随者无人机的本地数据集和全部所述跟随者无人机的全部数据集的比例;
根据预设的概率算法对所述局部模型参数的欧几里得范数、所述总能耗、所述能量虚拟队列和所述数据集占比进行数据处理,得到所述跟随者无人机的调度概率。
3.根据权利要求1所述的方法,其特征在于,所述根据各所述跟随者无人机的调度概率在各跟随者无人机中确定目标跟随者无人机,包括:
根据预设的无放回采样算法和各所述跟随者无人机的调度概率在各跟随者无人机中确定目标跟随者无人机;
将各所述目标跟随者无人机的调度概率更新为零。
4.根据权利要求1所述的方法,其特征在于,所述基于各所述目标跟随者无人机训练预设的全局模型,得到训练后的全局模型,包括:
通过视线信道接收各所述目标跟随者无人机的局部模型参数;各所述目标跟随者无人机的局部模型参数在所述视线信道中聚合,得到聚合模型参数;
基于所述聚合模型参数、传输噪声、功率缩放因子更新预设的全局模型的参数,得到训练后的全局模型。
5.根据权利要求1所述的方法,其特征在于,所述基于各所述目标跟随者无人机训练预设的全局模型,得到训练后的全局模型之后,所述方法还包括:
判断所述训练后的全局模型是否满足预设的训练停止条件;
在所述训练后的全局模型不满足所述训练停止条件的情况下,执行所述向各跟随者无人机发送全局模型参数的步骤,直到所述训练后的全局模型满足所述训练停止条件。
6.一种无人机分布式通算一体资源调度方法,其特征在于,所述方法应用于跟随者无人机,所述方法包括:
接收领航者无人机发送的全局模型参数,并根据所述全局模型参数执行预设的随机梯度下降算法,得到局部模型参数的欧几里得范数;
根据所述跟随者无人机的传输属性和中央处理器的性质,确定所述跟随者无人机的总能耗;
基于所述跟随者无人机的总量能约束条件,确定能量虚拟队列;
将所述局部模型参数的欧几里得范数、所述总能耗和所述能量虚拟队列传输给所述领航者无人机。
7.根据权利要求6所述的方法,其特征在于,所述根据所述跟随者无人机的传输属性和中央处理器的性质,确定所述跟随者无人机的总能耗,包括:
根据所述跟随者无人机的中央处理器的性质,确定所述跟随者无人机对应的计算能耗;
根据所述跟随者无人机的传输功率和功率缩放因子,确定所述跟随者无人机对应的通信能耗;
根据所述计算能耗和所述通信能耗确定所述跟随者无人机对应的总能耗。
8.一种无人机分布式通算一体资源调度装置,其特征在于,所述装置应用于领航者无人机,所述装置包括:
接收模块,用于向各跟随者无人机发送全局模型参数,并接收各所述跟随者无人机反馈的局部模型参数的欧几里得范数、总能耗和能量虚拟队列;
第一确定模块,用于针对每一所述跟随者无人机,基于所述跟随者无人机对应的所述局部模型参数的欧几里得范数、总能耗和所述能量虚拟队列,确定所述跟随者无人机的调度概率;
训练模块,用于根据各所述跟随者无人机的调度概率在各跟随者无人机中确定目标跟随者无人机,并基于各所述目标跟随者无人机训练预设的全局模型,得到训练后的全局模型;
第二确定模块,用于在所述训练后的全局模型满足预设的训练停止条件的情况下,将所述训练后的全局模型确定为无人机调度模型;所述无人机调度模型用于调度跟随者无人机执行任务。
9.一种无人机分布式通算一体资源调度装置,其特征在于,所述装置应用于跟随者无人机,所述装置包括:
执行模块,用于接收领航者无人机发送的全局模型参数,并根据所述全局模型参数执行预设的随机梯度下降算法,得到局部模型参数的欧几里得范数;
第三确定模块,用于根据所述跟随者无人机的传输属性和中央处理器的性质,确定所述跟随者无人机的总能耗;
第四确定模块,用于基于所述跟随者无人机的总量能约束条件,确定能量虚拟队列;
传输模块,用于将所述局部模型参数、所述总能耗和所述能量虚拟队列传输给所述领航者无人机。
10.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5或6至7中任一项所述的方法的步骤。
CN202311590741.5A 2023-11-27 2023-11-27 无人机分布式通算一体资源调度方法和装置 Active CN117289725B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311590741.5A CN117289725B (zh) 2023-11-27 2023-11-27 无人机分布式通算一体资源调度方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311590741.5A CN117289725B (zh) 2023-11-27 2023-11-27 无人机分布式通算一体资源调度方法和装置

Publications (2)

Publication Number Publication Date
CN117289725A true CN117289725A (zh) 2023-12-26
CN117289725B CN117289725B (zh) 2024-02-27

Family

ID=89244899

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311590741.5A Active CN117289725B (zh) 2023-11-27 2023-11-27 无人机分布式通算一体资源调度方法和装置

Country Status (1)

Country Link
CN (1) CN117289725B (zh)

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108549394A (zh) * 2018-04-12 2018-09-18 哈尔滨工程大学 一种基于领航者和虚拟领航者的多auv直线编队控制方法
CN108848465A (zh) * 2018-08-15 2018-11-20 中国人民解放军陆军工程大学 一种面向数据分发的无人机飞行轨迹与资源调度联合优化方法
CN109067490A (zh) * 2018-09-29 2018-12-21 郑州航空工业管理学院 蜂窝网联下多无人机协同移动边缘计算***资源分配方法
KR20200013436A (ko) * 2018-07-30 2020-02-07 광주과학기술원 다중 드론 시스템 및 그것의 동작 방법
CN113034981A (zh) * 2021-04-14 2021-06-25 北京航空航天大学 一种不确定信道环境中多中继无人机航迹规划方法、***及存储介质
CN113312172A (zh) * 2021-02-23 2021-08-27 中国人民解放军国防科技大学 基于适变网络的多无人机集群动态任务调度模型
CN113487221A (zh) * 2021-07-23 2021-10-08 中南大学 面向动态目标观测的空天异构对地观测资源协同调度方法
CN114007231A (zh) * 2021-11-26 2022-02-01 中国人民解放军国防科技大学 异构无人机数据卸载方法、装置、电子设备及存储介质
CN116451934A (zh) * 2023-03-16 2023-07-18 中国人民解放军国防科技大学 多无人机边缘计算路径优化与依赖任务调度优化方法及***
CN116560828A (zh) * 2023-02-02 2023-08-08 清华大学 任务处理方法、装置、计算机设备、存储介质和程序产品
CN116582871A (zh) * 2023-07-07 2023-08-11 南京邮电大学 一种基于拓扑优化的无人机集群联邦学习模型优化方法
CN117041993A (zh) * 2023-08-03 2023-11-10 中国电子科技集团公司第三十六研究所 一种多无人机编队感知资源联合调度方法、装置和***

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108549394A (zh) * 2018-04-12 2018-09-18 哈尔滨工程大学 一种基于领航者和虚拟领航者的多auv直线编队控制方法
KR20200013436A (ko) * 2018-07-30 2020-02-07 광주과학기술원 다중 드론 시스템 및 그것의 동작 방법
CN108848465A (zh) * 2018-08-15 2018-11-20 中国人民解放军陆军工程大学 一种面向数据分发的无人机飞行轨迹与资源调度联合优化方法
CN109067490A (zh) * 2018-09-29 2018-12-21 郑州航空工业管理学院 蜂窝网联下多无人机协同移动边缘计算***资源分配方法
CN113312172A (zh) * 2021-02-23 2021-08-27 中国人民解放军国防科技大学 基于适变网络的多无人机集群动态任务调度模型
CN113034981A (zh) * 2021-04-14 2021-06-25 北京航空航天大学 一种不确定信道环境中多中继无人机航迹规划方法、***及存储介质
CN113487221A (zh) * 2021-07-23 2021-10-08 中南大学 面向动态目标观测的空天异构对地观测资源协同调度方法
CN114007231A (zh) * 2021-11-26 2022-02-01 中国人民解放军国防科技大学 异构无人机数据卸载方法、装置、电子设备及存储介质
CN116560828A (zh) * 2023-02-02 2023-08-08 清华大学 任务处理方法、装置、计算机设备、存储介质和程序产品
CN116451934A (zh) * 2023-03-16 2023-07-18 中国人民解放军国防科技大学 多无人机边缘计算路径优化与依赖任务调度优化方法及***
CN116582871A (zh) * 2023-07-07 2023-08-11 南京邮电大学 一种基于拓扑优化的无人机集群联邦学习模型优化方法
CN117041993A (zh) * 2023-08-03 2023-11-10 中国电子科技集团公司第三十六研究所 一种多无人机编队感知资源联合调度方法、装置和***

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
YING WANG 等: "Joint Resource Allocation and UAV Trajectory Optimization for Space–Air–Ground Internet of Remote Things Networks", IEEE SYSTEMS JOURNA, vol. 15, no. 4, XP011892449, DOI: 10.1109/JSYST.2020.3019463 *
宋伟中 等: "一种面向无人机区域协同覆盖的感知任务分配方法", 计算机应用与软件, vol. 38, no. 5 *

Also Published As

Publication number Publication date
CN117289725B (zh) 2024-02-27

Similar Documents

Publication Publication Date Title
Wei et al. Dynamic edge computation offloading for Internet of Things with energy harvesting: A learning method
CN110955463B (zh) 支持边缘计算的物联网多用户计算卸载方法
Cai et al. Cooperative data sensing and computation offloading in UAV-assisted crowdsensing with multi-agent deep reinforcement learning
CN111585637A (zh) 一种基于边缘计算***的无人机任务卸载和资源分配方法
Liu et al. Context-aware and adaptive QoS prediction for mobile edge computing services
Nguyen et al. DRL‐based intelligent resource allocation for diverse QoS in 5G and toward 6G vehicular networks: a comprehensive survey
CN116187483A (zh) 模型训练方法、装置、设备、介质和程序产品
CN104580447A (zh) 一种基于访问热度的时空数据服务调度方法
Yan et al. Efficient selection of a set of good enough designs with complexity preference
Zhang et al. Deploying SDN control in Internet of UAVs: Q-learning-based edge scheduling
CN113778691B (zh) 一种任务迁移决策的方法、装置及***
CN114007231B (zh) 异构无人机数据卸载方法、装置、电子设备及存储介质
Du et al. A cross-layer routing protocol based on quasi-cooperative multi-agent learning for multi-hop cognitive radio networks
CN114936708A (zh) 基于边云协同任务卸载的故障诊断优化方法及电子设备
CN114745392A (zh) 流量调度方法
Atan et al. Ai-empowered fast task execution decision for delay-sensitive iot applications in edge computing networks
Liu et al. FedAGL: A communication-efficient federated vehicular network
CN117289725B (zh) 无人机分布式通算一体资源调度方法和装置
Liang et al. Multiple service model refreshments in digital twin-empowered edge computing
CN116560828A (zh) 任务处理方法、装置、计算机设备、存储介质和程序产品
Zhang et al. AoI-minimal power and trajectory optimization for UAV-assisted wireless networks
Jiang et al. Learning on the fly: An RNN-based online throughput prediction framework for UAV communications
Zhang et al. Effective 3C Resource Utilization and Fair Allocation Strategy for Multi-Task Federated Learning
Gao et al. MO-AVC: Deep Reinforcement Learning Based Trajectory Control and Task Offloading in Multi-UAV Enabled MEC Systems
CN115226130B (zh) 基于公平性感知的多无人机数据卸载方法及相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant