CN113268920A - 一种基于联邦学习的无人机群感知数据安全共享方法 - Google Patents

一种基于联邦学习的无人机群感知数据安全共享方法 Download PDF

Info

Publication number
CN113268920A
CN113268920A CN202110512015.6A CN202110512015A CN113268920A CN 113268920 A CN113268920 A CN 113268920A CN 202110512015 A CN202110512015 A CN 202110512015A CN 113268920 A CN113268920 A CN 113268920A
Authority
CN
China
Prior art keywords
model
unmanned aerial
aerial vehicle
contract
optimal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110512015.6A
Other languages
English (en)
Other versions
CN113268920B (zh
Inventor
苏洲
王云涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Jiaotong University
Original Assignee
Xian Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Jiaotong University filed Critical Xian Jiaotong University
Priority to CN202110512015.6A priority Critical patent/CN113268920B/zh
Publication of CN113268920A publication Critical patent/CN113268920A/zh
Application granted granted Critical
Publication of CN113268920B publication Critical patent/CN113268920B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2111/00Details relating to CAD techniques
    • G06F2111/04Constraint-based CAD

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于联邦学***分配规则,根据模型鲁棒聚合规则进行模型聚合,根据模型效益公平分配规则进行效益分配;联邦学习服务器根据本地模型质量评估对无人机进行动态声誉管理。本发明能提高无人机在联邦学习中的通信效率,激励无人机用户的参与,抵御搭便车现象和拜占庭攻击,实现高效的和隐私保护的无人机感知数据共享。

Description

一种基于联邦学习的无人机群感知数据安全共享方法
技术领域
本发明属于物联网安全领域,具体涉及一种基于联邦学习的无人机群感知数据安全共享方法。
背景技术
随着小型无人机的不断普及,无人机即服务(UAV-as-a-Service)作为新型智慧城市的使能技术,可实现全天候、按需提供的各类感知服务与应用,已广泛用于空气质量检测、城市安保、灾难救援等场景。然而无人机的感知数据会不可避免地记录用户的隐私和敏感数据,传统机器学习模型需要将大量的感知数据迁移到一个中心化存储设备进行数据挖掘与知识提取,因此可能导致严重的隐私泄露和数据滥用。
联邦学习作为一种新型的隐私保护的机器学习范式,获得了学术界和产业界的广泛关注,是实现分散的无人机感知数据的安全高效共享和知识抽取的关键技术。在联邦学习中,无人机只需根据分享由本地数据训练得到的模型参数更新而非原始感知数据从而保护数据隐私。然而,1)当前的联邦学习需要频繁的进行周期性的本地训练和全局更新。由于小型无人机通常具有有限的电池、计算和通信能力,同时传统云计算难以满足大量物联网设备在数据训练中的高带宽与低时延需求,因此当前联邦学习存在节点参与意愿低和模型训练效率低等问题。2)由于无人机数据的异质性、搭便车现象和拜占庭攻击的存在,当前联邦学习缺乏高效精准的激励机制以及鲁棒的模型聚合机制。
发明内容
针对现有技术中存在的问题,本发明提供了一种基于联邦学习的无人机群感知数据安全共享方法,其目的在于提高无人机在联邦学习中的通信效率,激励无人机用户的参与和高质量模型训练,同时抵御搭便车现象和拜占庭攻击,实现高效的和隐私保护的无人机感知数据共享。
为了解决上述技术问题,本发明通过以下技术方案予以实现:
一种基于联邦学习的无人机群感知数据安全共享方法,包括:
基于契约理论设计针对不同类型无人机的最优契约,以激励无人机参与联邦学习;
无人机根据自身类型选择最优契约进行本地模型训练得到本地模型参数更新,并将所述本地模型参数更新传输至联邦学习服务器;
联邦学***分配规则,根据所述模型鲁棒聚合规则进行模型聚合,根据所述模型效益公平分配规则进行效益分配;
联邦学习服务器根据本地模型质量评估对无人机进行动态声誉管理。
进一步地,所述基于契约理论设计针对不同类型无人机的最优契约,具体为:
根据无人机的不同类型建立契约模型;
根据所述契约模型界定用户效用函数;
根据所述用户效用函数,利用契约理论设计所述最优契约。
进一步地,所述契约模型具体为:
Figure BDA0003060653640000021
式中,
Figure BDA0003060653640000022
是每个全局训练轮的最大等待时间;ζk是分配给参与的无人机的模型收益的比例;
Figure BDA0003060653640000023
为一系列数据-价格契约菜单,Ωj,k=(sj,k,pj,k)是对类型j的无人机契约项,sj,k为训练数据大小,pj,k为价格奖励;
所述根据所述契约模型界定用户效用函数,具体为:
类型j的无人机选择契约项Ωj,k的效用函数为收益与成本之差:
Figure BDA0003060653640000031
式中,
Figure BDA0003060653640000032
是类型j的无人机在任务k的第n次全局训练轮中的模型训练和传输时间;
Figure BDA0003060653640000033
是类型j的无人机的声誉值;
Figure BDA0003060653640000034
为参与任务的无人机的声誉阈值;cj为无人机j的边际数据使用成本;
联邦学习任务k的发布者的效用函数如下:
Figure BDA0003060653640000035
式中,λs是满意度系数;Ij是类型j的无人机数量;
Figure BDA0003060653640000036
是无人机j的声誉值;qj,k是无人机j的数据质量;求和式内第一项是与训练样本数量成对数函数关系的用户满意度,第二项是支付给所有参与训练的无人机的总费用;二进制变量
Figure BDA0003060653640000037
Figure BDA0003060653640000038
分别表示:
Figure BDA0003060653640000039
所述根据所述用户效用函数,利用契约理论设计所述最优契约,具体为:
最优契约设计问题为最大化联邦学习任务发布者的效用函数,同时对不同类型的无人机满足个人理性约束和激励相容约束;
将所述最优契约设计问题简化得到松弛的最优契约设计问题,求解所述松弛的最优契约设计问题得到数据-价格契约的最优松弛解;
对所述数据-价格契约的最优松弛解进行动态指派,得到最优契约设计问题的最优解,完成所述最优契约的设计。
进一步地,所述数据-价格契约的最优松弛解为:
Figure BDA00030606536400000310
所述松弛的最优契约设计问题的最优契约数据大小和最优契约价格分别为:
Figure BDA00030606536400000311
Figure BDA00030606536400000312
Figure BDA00030606536400000313
所述松弛的最优契约设计问题的最优契约数据大小和最优契约价格分别为:
Figure BDA0003060653640000041
式中,
Figure BDA0003060653640000042
进一步地,所述动态指派,具体为:
找出
Figure BDA0003060653640000043
中任意递增子序列
Figure BDA0003060653640000044
调整该递增子序列中每一项为
Figure BDA0003060653640000045
直到
Figure BDA0003060653640000046
中不存在任意递增子序列,停止动态指派,得到最优契约数据大小
Figure BDA0003060653640000047
为指派后的
Figure BDA0003060653640000048
计算最优契约价格
Figure BDA0003060653640000049
进一步地,所述将所述本地模型参数更新传输至联邦学习服务器,具体为:
在5G异构网络下,无人机i计算与基站的信道信噪比状态,智能选择U2C或U2U通信模式,本地模型参数更新的无线传输时间为:
Figure BDA00030606536400000410
式中,zi={0,1}表示无人机i的U2C或U2U通信模式选择变量,zi=1表示无人机i处于U2C传输模式,zi=0表示无人机i选择U2U传输模式;
Figure BDA00030606536400000411
是无人机i本地模型参数更新的大小;i′是无人机i附近的运行在U2C模式的协作无人机的索引。
进一步地,所述联邦学习服务器对接收的所述本地模型参数更新进行本地模型质量评估,具体为:
计算无人机的本地模型参数更新之间的欧几里得距离
Figure BDA00030606536400000412
根据欧几里得距离得到每个无人机i的评分为
Figure BDA00030606536400000413
完成本地模型质量评估;
式中,
Figure BDA0003060653640000051
Figure BDA0003060653640000052
分别为无人机i和无人机l的本地模型参数更新。
进一步地,所述根据评估结果设计模型鲁棒聚合规则和模型效益公平分配规则,具体如下:
基于本地模型质量评估结果计算轮贡献指数,根据所述轮贡献指数设计模型鲁棒聚合规则;
根据所述轮贡献指数,计算得到综合贡献指数,根据所述综合贡献指数设计模型效益公平分配规则;
所述根据所述轮贡献指数设计模型鲁棒聚合规则,具体为:
选择前V个评分最小的无人机,设置其轮贡献指数为
Figure BDA0003060653640000053
按照模型贡献进行全局模型聚合,即全局模型
Figure BDA0003060653640000054
所述根据所述综合贡献指数设计模型效益公平分配规则,具体为:
计算任务k中无人机在模型训练中的综合贡献指数为
Figure BDA0003060653640000055
按照综合贡献指数为集合
Figure BDA0003060653640000056
中每个无人机i分发模型收益ωi,kζkΛk
进一步地,所述联邦学习服务器根据本地模型质量评估对无人机进行动态声誉管理,具体为:
根据无人机在联邦学习任务中的轮贡献指数,基于逻辑斯谛函数模型建立得到无人机声誉模型;
基于迭代方法,在每个时隙动态更新所述无人机声誉模型中的声誉参数。
进一步地,所述基于迭代方法,在每个时隙动态更新所述无人机声誉模型中的声誉参数,具体为:
对于参与模型训练的无人机,当其模型贡献高于或等于平均值时,其声誉参数更新为:
Figure BDA0003060653640000057
对于参与模型训练的无人机,当其模型贡献低于平均值时,其声誉参数更新为:
Figure BDA0003060653640000061
对于不参与模型训练的无人机,其声誉参数更新为:
Figure BDA0003060653640000062
式中,μ1和μ2为衰减系数;ΔR0是对自私无人机的非参与行为的声誉惩罚;ΔR1是对模型贡献高于或等于平均值的无人机的声誉奖励;ΔR2是对模型贡献低于平均值的无人机的声誉惩罚。
与现有技术相比,本发明至少具有以下有益效果:
(1)与现有主流的中心化机器学习方式相比,本发明基于联邦学习架构,无人机感知数据保留在本地设备,无人机只需要周期性地发送从本地数据训练得到本地模型参数更新至联邦学习服务器进行全局模型聚合,实现了无人机的分布式感知数据共享与协作式模型训练,解决了现有无人机群感知数据共享方式存在的隐私数据泄露的技术问题。
(2)本发明提出了基于契约理论的无人机最优契约设计方法,针对无人机差异化的数据成本、传输时间和数据质量,提供精准的用户参与激励,在最大化联邦学习任务发布者效用的同时满足个人理性和激励相容性,以激励无人机用户的参与和高质量模型训练。
(3)本发明提出了5G异构网络中基于信道信噪比状态的本地模型参数更新传输模式选择方法,无人机通过在5G异构网络中智能选择U2C或U2U通信模式传输本地模型参数更新,从而降低数据传输延迟和保证网络服务质量,提高了联邦学习中的通信效率。
(4)本发明提出了基于质量评估的全局模型聚合与模型效益分配方法,在存在拜占庭攻击和搭便车攻击的情况下,通过本地模型质量评估结果计算用户贡献,实现模型鲁棒聚合和模型效益公平分配,提高了联邦学习的鲁棒性。
(5)本发明提出了基于迭代的无人机动态声誉参数更新方法,通过历史训练数据动态评估无人机的声誉值,从而激励无人机的诚实行为并抑制其恶意行为,增强了联邦学习中参与者的可靠性。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式中的技术方案,下面将对具体实施方式描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为5G异构网络中基于联邦学习的无人机群感知数据安全共享方法流程图;
图2为5G异构网络中网络通信模型图;
图3为最优数据-价格契约设计图;
图4为5G异构网络中联邦学习流程图;
图5为无人机通信模式选择流程图;
图6为无人机动态声誉管理流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
作为本发明的某一具体实施方式,如图1所示,本发明一种基于联邦学习的无人机群感知数据安全共享方法,具体包括以下步骤:
步骤1、基于契约理论设计针对不同类型无人机的最优契约,以激励无人机参与联邦学习。
作为优选的实施方式,基于契约理论设计针对不同类型无人机的最优契约,具体包括:
步骤1.1、根据无人机的不同类型建立契约模型;
具体地说,契约模型具体为:
Figure BDA0003060653640000081
式中,
Figure BDA0003060653640000082
是每个全局训练轮的最大等待时间;ζk是分配给参与的无人机的模型收益的比例;
Figure BDA0003060653640000083
为一系列数据-价格契约菜单,Ωj,k=(sj,k,pj,k)是对类型j的无人机契约项,sj,k为类型j的无人机用于联邦学习任务k的训练数据大小(即感知数据样本的数量),pj,k为价格奖励;另外,对无法按规定时间完成本地模型参数更新传输的无人机实行零支付机制,任务k的全局训练轮数为
Figure BDA0003060653640000084
更为具体地,基于5G异构网络和边缘计算的无人机群感知网络如图2所示,包括一个大基站,M个小基站,I个无人机。小基站和无人机均在大基站的覆盖范围内,其集合分别为
Figure BDA0003060653640000085
Figure BDA0003060653640000086
小基站通过高速有线链路与大基站相连接。每个无人机
Figure BDA0003060653640000087
都安装有先进的传感器(如相机、温度计和GPS等)用于环境感知与空中数据采集。在联邦学习中,无人机只需根据下载的全局模型发送从本地数据训练得到本地模型参数更新,联邦学习服务器将所有无人机的本地模型参数更新进行聚合得到全局模型,然后再发送给无人机进行下一轮训练直到模型达到理想的精确度。每个联邦学习任务k可表述为一个五元组
Figure BDA0003060653640000088
其中
Figure BDA0003060653640000089
是初始化的机器学习模型,Tk是任务k的存活时间,
Figure BDA00030606536400000810
为参与任务的无人机的声誉阈值,εk∈(0,1]为所需的模型精确度,(Xk,Yk)为任务k的感知区域。无人机差异化的感知能力和计算能力导致无人机在收集和训练合格的感知数据的成本不一,采用边际数据使用成本ci来刻画无人机在联邦学习中的异质性;基于无人机的边际数据使用成本将无人机分为J个类型,即当无人机
Figure BDA00030606536400000811
的成本cj落入第j个成本类型时,指代其为类型j的无人机;令cmin和cmax分别为成本类型的上下界,因此有0<cmin<c1<…<cJ<cmax
步骤1.2、根据契约模型界定用户效用函数;
具体地说,本发明中根据契约模型界定用户效用函数,具体为:
类型j的无人机选择契约项Ωj,k的效用函数为收益与成本之差:
Figure BDA0003060653640000091
式中,
Figure BDA0003060653640000092
是类型j的无人机在任务k的第n次全局训练轮中的模型训练和传输时间;
Figure BDA0003060653640000093
是类型j的无人机的声誉值;cjsj,k为无人机提供感知数据并进行本地模型训练的成本;
联邦学习任务k的发布者的效用函数如下:
Figure BDA0003060653640000094
式中,λs是满意度系数,Ij是类型j的无人机数量,
Figure BDA0003060653640000095
是无人机j的声誉值,qj,k是无人机j的数据质量;求和式内第一项是与训练样本数量成对数函数关系的用户满意度,第二项是支付给所有参与训练的无人机的总费用;二进制变量
Figure BDA0003060653640000096
和βj,k分别表示:
Figure BDA0003060653640000097
步骤1.3、根据用户效用函数,利用契约理论设计最优契约;
具体地说,如图3所示,本发明中根据用户效用函数,利用契约理论设计最优契约,具体包括:
步骤1.3.1、最优契约设计问题为最大化联邦学习任务发布者的效用函数,同时对不同类型的无人机满足个人理性约束和激励相容约束;
个人理性约束和激励相容约束定义为:
定义1:个人理性约束,当且仅当每个类型j的无人机真实地选择为其类型制定的契约项Ωj,k=(sj,k,pj,k)时的效用不为负,则满足个人理性约束,即:
Figure BDA0003060653640000101
定义2:激励相容约束,当且仅当每个类型j的无人机真实地选择为其类型制定的契约项Ωj,k=(sj,k,pj,k)时的效用最大,则满足激励相容约束,即:
Figure BDA0003060653640000102
最优契约设计问题为如下问题1:
Figure BDA0003060653640000103
Figure BDA0003060653640000104
Figure BDA0003060653640000105
Figure BDA0003060653640000106
其中C1为训练数据样本量的上下界约束,C2为J个个人理性约束,C3为J(J-1)个激励相容约束。定义
Figure BDA0003060653640000107
为任务k的第n次全局训练轮中参与模型训练的无人机类型的集合,其中
Figure BDA0003060653640000108
另外,集合
Figure BDA0003060653640000109
中无人机类型可重新排列为:
Figure BDA00030606536400001010
步骤1.3.2、将最优契约设计问题简化得到松弛的最优契约设计问题,求解松弛的最优契约设计问题得到数据-价格契约的最优松弛解;
通过对个人理性约束和激励相容约束进行简化,问题1可以转化为如下问题2:
Figure BDA00030606536400001011
Figure BDA00030606536400001012
Figure BDA00030606536400001013
Figure BDA00030606536400001014
为求解问题2中的最优契约,首先考虑没有单调性约束C4的问题2的松弛问题,然后再验证所得的松弛的最优解是否满足单调性约束C4;
问题2的松弛问题可转换为如下问题3:
Figure BDA00030606536400001015
求解问题3,可得数据-价格契约的最优松弛解。
优选的,数据-价格契约的最优松弛解为:
Figure BDA0003060653640000111
松弛的最优契约设计问题的最优契约数据大小和最优契约价格分别为:
Figure BDA0003060653640000112
Figure BDA0003060653640000113
Figure BDA0003060653640000114
所述松弛的最优契约设计问题的最优契约数据大小和最优契约价格分别为:
Figure BDA0003060653640000115
式中,
Figure BDA0003060653640000116
步骤1.3.3、对数据-价格契约的最优松弛解进行动态指派,得到最优契约设计问题的最优解,完成最优契约的设计;
本实施方式中,动态指派具体如下:
首先,找出
Figure BDA0003060653640000117
中任意递增子序列
Figure BDA0003060653640000118
其次,调整该递增子序列中每一项为
Figure BDA0003060653640000119
直到
Figure BDA00030606536400001110
中不存在任意递增子序列,停止动态指派,得到最优契约数据大小
Figure BDA00030606536400001111
为指派后的
Figure BDA00030606536400001112
计算最优契约价格
Figure BDA00030606536400001113
为所有无人机类型设计的最优契约表示为
Figure BDA00030606536400001114
步骤2、无人机根据自身类型选择最优契约进行本地模型训练得到本地模型参数更新,并将本地模型参数更新传输至联邦学习服务器。
如图4所示,在每个全局训练轮中
Figure BDA00030606536400001115
每个参与训练的无人机i利用本地感知数据对全局模型
Figure BDA00030606536400001116
进行训练,得到本地模型参数更新
Figure BDA00030606536400001117
令Θk为本地训练次数,具体地,本地模型参数更新如下:
首先,每个无人机i将其本地训练数据分为大小为B的数据批,每个无人机i通过随机梯度下降方法对每个数据批
Figure BDA0003060653640000121
进行训练:
Figure BDA0003060653640000122
其中,
Figure BDA0003060653640000128
为学习速率;
其次,令l←l+1;
重复上述步骤,直到达到最大本地训练次数,即l=Θk
作为优选的实施方式,将本地模型参数更新传输至联邦学习服务器,具体为:
如图5所示,在5G异构网络下,在每个时隙t,无人机i计算与基站的信道信噪比状态,智能选择U2C(UAV-to-Cellular)或U2U(UAV-to-UAV)通信模式来与基站传输数据,具体为:
当无人机i的U2C信道的信噪比大于或等于阈值γth时,直接通过U2C通信链路将本地模型参数更新上传到大基站上的联邦学习服务器;
当U2C直连链路的信噪比较低时,很难提供高数据速率来支持U2C链路的及时数据传输。因此,当无人机i的U2C信道的信噪比低于阈值γth时,使用U2U通信方式,将数据传输到运行在U2C通信模型的相邻无人机。然后,通过该中继无人机将数据传送到联邦学习服务器。
本地模型参数更新的无线传输时间为:
Figure BDA0003060653640000123
式中,zi=(0,1}表示无人机i的U2C或U2U通信模式选择变量,zi=1表示无人机i处于U2C传输模式,zi=0表示无人机i选择U2U传输模式;
Figure BDA0003060653640000124
是无人机i本地模型参数更新的大小;i′是无人机i附近的运行在U2C模式的协作无人机的索引。
更加具体的,令基站
Figure BDA0003060653640000125
表示小基站
Figure BDA0003060653640000126
或大基站。U2C信道的统计模型被定义为结合视距传输与非视距传输的衰落信道,无人机i与基站
Figure BDA0003060653640000127
在时隙t的上行链路数据传输速率为:
Figure BDA0003060653640000131
其中BU2C是U2C链路的子信道带宽,
Figure BDA0003060653640000132
是无人机i在时隙t的传输功率,
Figure BDA0003060653640000133
是平均视距传输/非视距传输的信道损失,
Figure BDA0003060653640000134
是高斯白噪声的功率谱密度。
U2U信道的统计模型被定义为视距传输主导的衰落信道,无人机i与无人机j在时隙t的数据传输速率为:
Figure BDA0003060653640000135
其中BU2U是U2U链路的通信带宽,
Figure BDA0003060653640000136
是视距传输下的信道损失,di,j(t)是无人机i与无人机j的三维欧几里得距离,
Figure BDA00030606536400001314
是路径衰减系数。
步骤3、联邦学***分配规则,根据模型鲁棒聚合规则进行模型聚合,根据模型效益公平分配规则进行效益分配。
作为优选的实施方式,联邦学习服务器对接收的本地模型参数更新进行本地模型质量评估,具体为:
计算无人机的本地模型参数更新之间的欧几里得距离
Figure BDA0003060653640000137
根据欧几里得距离得到每个无人机i的评分为
Figure BDA0003060653640000138
完成本地模型质量评估;
式中,
Figure BDA0003060653640000139
Figure BDA00030606536400001310
分别为无人机i和无人机l的本地模型参数更新;i→l表示
Figure BDA00030606536400001311
属于距离
Figure BDA00030606536400001312
的N个最近的模型参数更新,
Figure BDA00030606536400001313
是参与训练的拜占庭无人机的数量。
作为优选的实施方式,根据评估结果设计模型鲁棒聚合规则和模型效益公平分配规则,具体如下:
基于本地模型质量评估结果计算轮贡献指数,根据轮贡献指数设计模型鲁棒聚合规则;
具体地说,根据轮贡献指数设计模型鲁棒聚合规则,具体为:
选择前V个评分最小的无人机,设置其轮贡献指数为
Figure BDA0003060653640000141
按照模型贡献进行全局模型聚合,即全局模型
Figure BDA0003060653640000142
根据轮贡献指数,计算得到综合贡献指数,根据综合贡献指数设计模型效益公平分配规则;
具体地说,根据综合贡献指数设计模型效益公平分配规则,具体为:
计算任务k中无人机在模型训练中的综合贡献指数为
Figure BDA0003060653640000143
按照综合贡献指数为集合
Figure BDA0003060653640000144
中每个无人机i分发模型收益ωi,kζkΛk
步骤4、联邦学习服务器根据本地模型质量评估对无人机进行动态声誉管理。
作为优选的实施方式,联邦学习服务器根据本地模型质量评估对无人机进行动态声誉管理,具体为:
根据无人机在联邦学习任务中的轮贡献指数,基于逻辑斯谛函数模型建立得到无人机声誉模型;
基于迭代方法,在每个时隙动态更新无人机声誉模型中的声誉参数。
优选的,根据无人机在联邦学习任务中的轮贡献指数,基于逻辑斯谛函数模型建立得到无人机声誉模型,具体为:
在联邦学习任务中,当观察到无人机做出一系列较高的模型贡献后,它的声誉会缓慢增长。同时,如果无人机提供了如无意义的、冗余的或者错误的模型参数更新,它的声誉将下降相当大的量。基于逻辑斯谛函数模型来描述无人机行为与声誉值的变化关系:
Figure BDA0003060653640000145
其中τ为当前时隙,
Figure BDA0003060653640000146
为逻辑斯谛函数的输入参数,v1和v2为较低的渐近线,ψ1为增长率,ψ2决定最大增长率,λ0依赖于初始声誉值,v3影响最大渐进增长出现的点。因此
Figure BDA0003060653640000151
一方面,由于最近的学习记录比过去的记录更为重要,因此在声誉更新中最新的学习记录需要赋以更高的权重。另一方面,由于无人机可以执行不同的行为,因此不同行为模式下无人机声誉增长率与下降率应当不同。根据无人机的参与行为和训练行为可对其进行分类,同时整合历史模型训练记录中的行为效应和时间衰减效应,从而估计无人机的声誉更新:
Figure BDA0003060653640000152
式中,μ1和μ2为衰减系数;ΔR0是对自私无人机的非参与行为的声誉惩罚;ΔR1是对模型贡献高于或等于平均值的无人机的声誉奖励;ΔR2是对模型贡献低于平均值的无人机的声誉惩罚。
优选的,如图6所示,基于迭代方法,在每个时隙动态更新无人机声誉模型中的声誉参数,具体为:
对于参与模型训练的无人机,当其模型贡献高于或等于平均值时,其声誉参数更新为:
Figure BDA0003060653640000153
对于参与模型训练的无人机,当其模型贡献低于平均值时,其声誉参数更新为:
Figure BDA0003060653640000154
对于不参与模型训练的无人机,其声誉参数更新为:
Figure BDA0003060653640000155
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种基于联邦学习的无人机群感知数据安全共享方法,其特征在于,包括:
基于契约理论设计针对不同类型无人机的最优契约,以激励无人机参与联邦学习;
无人机根据自身类型选择最优契约进行本地模型训练得到本地模型参数更新,并将所述本地模型参数更新传输至联邦学习服务器;
联邦学***分配规则,根据所述模型鲁棒聚合规则进行模型聚合,根据所述模型效益公平分配规则进行效益分配;
联邦学习服务器根据本地模型质量评估对无人机进行动态声誉管理。
2.根据权利要求1所述的一种基于联邦学习的无人机群感知数据安全共享方法,其特征在于,所述基于契约理论设计针对不同类型无人机的最优契约,具体为:
根据无人机的不同类型建立契约模型;
根据所述契约模型界定用户效用函数;
根据所述用户效用函数,利用契约理论设计所述最优契约。
3.根据权利要求2所述的一种基于联邦学习的无人机群感知数据安全共享方法,其特征在于,所述契约模型具体为:
Figure FDA0003060653630000011
式中,
Figure FDA0003060653630000012
是每个全局训练轮的最大等待时间;ζk是分配给参与的无人机的模型收益的比例;
Figure FDA0003060653630000013
为一系列数据-价格契约菜单,Ωj,k=(sj,k,pj,k)是对类型j的无人机契约项,sj,k为训练数据大小,pj,k为价格奖励;
所述根据所述契约模型界定用户效用函数,具体为:
类型j的无人机选择契约项Ωj,k的效用函数为收益与成本之差:
Figure FDA0003060653630000021
式中,
Figure FDA0003060653630000022
是类型j的无人机在任务k的第n次全局训练轮中的模型训练和传输时间;
Figure FDA0003060653630000023
是类型j的无人机的声誉值;
Figure FDA0003060653630000024
为参与任务的无人机的声誉阈值;cj为无人机j的边际数据使用成本;
联邦学习任务k的发布者的效用函数如下:
Figure FDA0003060653630000025
式中,λs是满意度系数;Ij是类型j的无人机数量;
Figure FDA0003060653630000026
是无人机j的声誉值;qj,k是无人机j的数据质量;求和式内第一项是与训练样本数量成对数函数关系的用户满意度,第二项是支付给所有参与训练的无人机的总费用;二进制变量
Figure FDA0003060653630000027
和βj,k分别表示:
Figure FDA0003060653630000028
所述根据所述用户效用函数,利用契约理论设计所述最优契约,具体为:
最优契约设计问题为最大化联邦学习任务发布者的效用函数,同时对不同类型的无人机满足个人理性约束和激励相容约束;
将所述最优契约设计问题简化得到松弛的最优契约设计问题,求解所述松弛的最优契约设计问题得到数据-价格契约的最优松弛解;
对所述数据-价格契约的最优松弛解进行动态指派,得到最优契约设计问题的最优解,完成所述最优契约的设计。
4.根据权利要求3所述的一种基于联邦学习的无人机群感知数据安全共享方法,其特征在于,所述数据-价格契约的最优松弛解为:
Figure FDA0003060653630000029
所述松弛的最优契约设计问题的最优契约数据大小和最优契约价格分别为:
Figure FDA00030606536300000210
Figure FDA00030606536300000211
Figure FDA0003060653630000031
所述松弛的最优契约设计问题的最优契约数据大小和最优契约价格分别为:
Figure FDA0003060653630000032
Figure FDA0003060653630000033
式中,
Figure FDA0003060653630000034
5.根据权利要求4所述的一种基于联邦学习的无人机群感知数据安全共享方法,其特征在于,所述动态指派,具体为:
找出
Figure FDA0003060653630000035
中任意递增子序列
Figure FDA0003060653630000036
调整该递增子序列中每一项为
Figure FDA0003060653630000037
直到
Figure FDA0003060653630000038
中不存在任意递增子序列,停止动态指派,得到最优契约数据大小
Figure FDA0003060653630000039
为指派后的
Figure FDA00030606536300000310
计算最优契约价格
Figure FDA00030606536300000311
6.根据权利要求5所述的一种基于联邦学习的无人机群感知数据安全共享方法,其特征在于,所述将所述本地模型参数更新传输至联邦学习服务器,具体为:
在5G异构网络下,无人机i计算与基站的信道信噪比状态,智能选择U2C或U2U通信模式,本地模型参数更新的无线传输时间为:
Figure FDA00030606536300000312
式中,zi={0,1}表示无人机i的U2C或U2U通信模式选择变量,zi=1表示无人机i处于U2C传输模式,zi=0表示无人机i选择U2U传输模式;
Figure FDA00030606536300000313
是无人机i本地模型参数更新的大小;i′是无人机i附近的运行在U2C模式的协作无人机的索引。
7.根据权利要求6所述的一种基于联邦学习的无人机群感知数据安全共享方法,其特征在于,所述联邦学习服务器对接收的所述本地模型参数更新进行本地模型质量评估,具体为:
计算无人机的本地模型参数更新之间的欧几里得距离
Figure FDA0003060653630000041
根据欧几里得距离得到每个无人机i的评分为
Figure FDA0003060653630000042
完成本地模型质量评估;
式中,
Figure FDA0003060653630000043
Figure FDA0003060653630000044
分别为无人机i和无人机l的本地模型参数更新。
8.根据权利要求7所述的一种基于联邦学***分配规则,具体如下:
基于本地模型质量评估结果计算轮贡献指数,根据所述轮贡献指数设计模型鲁棒聚合规则;
根据所述轮贡献指数,计算得到综合贡献指数,根据所述综合贡献指数设计模型效益公平分配规则;
所述根据所述轮贡献指数设计模型鲁棒聚合规则,具体为:
选择前V个评分最小的无人机,设置其轮贡献指数为
Figure FDA0003060653630000045
按照模型贡献进行全局模型聚合,即全局模型
Figure FDA0003060653630000046
所述根据所述综合贡献指数设计模型效益公平分配规则,具体为:
计算任务k中无人机在模型训练中的综合贡献指数为
Figure FDA0003060653630000047
按照综合贡献指数为集合
Figure FDA0003060653630000048
中每个无人机i分发模型收益ωi,kζkAk
9.根据权利要求8所述的一种基于联邦学习的无人机群感知数据安全共享方法,其特征在于,所述联邦学习服务器根据本地模型质量评估对无人机进行动态声誉管理,具体为:
根据无人机在联邦学习任务中的轮贡献指数,基于逻辑斯谛函数模型建立得到无人机声誉模型;
基于迭代方法,在每个时隙动态更新所述无人机声誉模型中的声誉参数。
10.根据权利要求9所述的一种基于联邦学习的无人机群感知数据安全共享方法,其特征在于,所述基于迭代方法,在每个时隙动态更新所述无人机声誉模型中的声誉参数,具体为:
对于参与模型训练的无人机,当其模型贡献高于或等于平均值时,其声誉参数更新为:
Figure FDA0003060653630000051
对于参与模型训练的无人机,当其模型贡献低于平均值时,其声誉参数更新为:
Figure FDA0003060653630000052
对于不参与模型训练的无人机,其声誉参数更新为:
Figure FDA0003060653630000053
式中,μ1和μ2为衰减系数;ΔR0是对自私无人机的非参与行为的声誉惩罚;ΔR1是对模型贡献高于或等于平均值的无人机的声誉奖励;ΔR2是对模型贡献低于平均值的无人机的声誉惩罚。
CN202110512015.6A 2021-05-11 2021-05-11 一种基于联邦学习的无人机群感知数据安全共享方法 Active CN113268920B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110512015.6A CN113268920B (zh) 2021-05-11 2021-05-11 一种基于联邦学习的无人机群感知数据安全共享方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110512015.6A CN113268920B (zh) 2021-05-11 2021-05-11 一种基于联邦学习的无人机群感知数据安全共享方法

Publications (2)

Publication Number Publication Date
CN113268920A true CN113268920A (zh) 2021-08-17
CN113268920B CN113268920B (zh) 2022-12-09

Family

ID=77230401

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110512015.6A Active CN113268920B (zh) 2021-05-11 2021-05-11 一种基于联邦学习的无人机群感知数据安全共享方法

Country Status (1)

Country Link
CN (1) CN113268920B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113992692A (zh) * 2021-10-27 2022-01-28 天津大学 端边云架构和不完全信息下分层联邦学习的方法及***
CN114219094A (zh) * 2021-11-10 2022-03-22 华南理工大学 基于多任务联邦学习的通信成本和模型鲁棒性优化方法
WO2023093238A1 (zh) * 2021-11-29 2023-06-01 北京邮电大学 利用学习模型进行业务处理的方法以及装置
WO2023221059A1 (zh) * 2022-05-19 2023-11-23 Oppo广东移动通信有限公司 无线通信方法、装置、设备、存储介质及程序产品

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107450577A (zh) * 2017-07-25 2017-12-08 天津大学 基于多传感器的无人机智能感知***和方法
CN112132293A (zh) * 2020-09-30 2020-12-25 腾讯科技(深圳)有限公司 纵向联邦学习中的计算方法、装置、设备及介质
WO2021008017A1 (zh) * 2019-07-17 2021-01-21 深圳前海微众银行股份有限公司 联邦学习方法、***、终端设备及存储介质
CN112367109A (zh) * 2020-09-28 2021-02-12 西北工业大学 空地网络中由数字孪生驱动的联邦学习的激励方法
CN112668726A (zh) * 2020-12-25 2021-04-16 中山大学 一种高效通信且保护隐私的个性化联邦学习方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107450577A (zh) * 2017-07-25 2017-12-08 天津大学 基于多传感器的无人机智能感知***和方法
WO2021008017A1 (zh) * 2019-07-17 2021-01-21 深圳前海微众银行股份有限公司 联邦学习方法、***、终端设备及存储介质
CN112367109A (zh) * 2020-09-28 2021-02-12 西北工业大学 空地网络中由数字孪生驱动的联邦学习的激励方法
CN112132293A (zh) * 2020-09-30 2020-12-25 腾讯科技(深圳)有限公司 纵向联邦学习中的计算方法、装置、设备及介质
CN112668726A (zh) * 2020-12-25 2021-04-16 中山大学 一种高效通信且保护隐私的个性化联邦学习方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
YUE YANG ET AL: "Wide area surveillance of urban environments using multiple mini-VTOL UAVs", 《IEEE》 *
张勇等: "声誉效应与经理报酬契约的关系研究", 《数学的实践与认识》 *
笪可宁等: "基于关系契约视角的建设项目激励问题动态博弈分析", 《沈阳建筑大学学报(社会科学版)》 *
董超等: "基于无人机的边缘智能计算研究综述", 《智能科学与技术学报》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113992692A (zh) * 2021-10-27 2022-01-28 天津大学 端边云架构和不完全信息下分层联邦学习的方法及***
CN113992692B (zh) * 2021-10-27 2022-09-06 天津大学 端边云架构和不完全信息下分层联邦学习的方法及***
CN114219094A (zh) * 2021-11-10 2022-03-22 华南理工大学 基于多任务联邦学习的通信成本和模型鲁棒性优化方法
CN114219094B (zh) * 2021-11-10 2024-03-19 华南理工大学 基于多任务联邦学习的通信成本和模型鲁棒性优化方法
WO2023093238A1 (zh) * 2021-11-29 2023-06-01 北京邮电大学 利用学习模型进行业务处理的方法以及装置
WO2023221059A1 (zh) * 2022-05-19 2023-11-23 Oppo广东移动通信有限公司 无线通信方法、装置、设备、存储介质及程序产品

Also Published As

Publication number Publication date
CN113268920B (zh) 2022-12-09

Similar Documents

Publication Publication Date Title
CN113268920B (zh) 一种基于联邦学习的无人机群感知数据安全共享方法
Zhan et al. A learning-based incentive mechanism for federated learning
Han et al. Game theory for next generation wireless and communication networks: Modeling, analysis, and design
Qiong et al. Towards V2I age-aware fairness access: A DQN based intelligent vehicular node training and test method
CN108055119B (zh) 一种群智感知应用中基于区块链的安全激励方法和***
Xiao et al. Mobile crowdsensing games in vehicular networks
Xiao et al. A secure mobile crowdsensing game with deep reinforcement learning
Xu et al. Edge computing resource allocation for unmanned aerial vehicle assisted mobile network with blockchain applications
Xu et al. Incentive mechanism for multiple cooperative tasks with compatible users in mobile crowd sensing via online communities
Liu et al. DeePGA: A privacy-preserving data aggregation game in crowdsensing via deep reinforcement learning
Wang et al. Mobile crowdsourcing task allocation with differential-and-distortion geo-obfuscation
Asheralieva et al. Learning-based mobile edge computing resource management to support public blockchain networks
Di et al. Collaborative smartphone sensing using overlapping coalition formation games
Su et al. Computation offloading in hierarchical multi-access edge computing based on contract theory and Bayesian matching game
Jin et al. Data-driven pricing for sensing effort elicitation in mobile crowd sensing systems
Qi et al. Energy-efficient resource allocation for UAV-assisted vehicular networks with spectrum sharing
Sun et al. Heterogeneous-belief based incentive schemes for crowd sensing in mobile social networks
Su et al. A stackelberg differential game based bandwidth allocation in satellite communication network
Chiaraviglio et al. Joint optimization of area throughput and grid-connected microgeneration in UAV-based mobile networks
CN112668877A (zh) 结合联邦学习和强化学习的事物资源信息分配方法及***
CN116582568A (zh) 工业物联网中时效性感知的联邦学习参与设备激励方法
CN114301935A (zh) 一种基于声誉的物联网边云协同联邦学习节点选择方法
CN116306910A (zh) 一种基于联邦节点贡献的公平性隐私计算方法
Gao et al. Mean-field-game-based dynamic task pricing in mobile crowdsensing
Zeng et al. How mobile contributors will interact with each other in mobile crowdsourcing with word of mouth mode

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant