CN116362329A

CN116362329A - 一种融合参数优化的集群联邦学习方法及设备

Info

Publication number: CN116362329A
Application number: CN202310437585.2A
Authority: CN
Inventors: 张凯; 曾剑秋; 赵健; 温蜜; 王亮亮
Original assignee: Shanghai University of Electric Power
Current assignee: Shanghai University of Electric Power
Priority date: 2023-04-21
Filing date: 2023-04-21
Publication date: 2023-06-30

Abstract

本发明涉及一种融合参数优化的集群联邦学习方法及设备，方法包括：S1：各客户端基于中央服务器发布的全局模型和各自私有数据进行本地模型训练，得到代表本地数据特征的局部模型，将局部模型参数上传至中央服务器；S2：中央服务器根据所有客户端的局部模型参数，对客户端进行聚类，将所有客户端划分为不同的集群；S3：中央服务器确认此次训练需要优化的超参数和适应度函数，发送给所有客户端；S4：各集群分别进行联邦学习训练，训练过程中引入改进的粒子群算法，根据中央服务器确认的超参数和适应度函数进行训练，并在每一轮训练中动态调整超参数，以获得最优的联邦学习模型。与现有技术相比，本发明具备训练效率高、训练模型精度高的优点。

Description

一种融合参数优化的集群联邦学习方法及设备

技术领域

本发明涉及人工智能技术领域，尤其是涉及一种融合参数优化的集群联邦学习方法及设备。

背景技术

对日趋严格的隐私保护规范与集中式学习方式对大量数据需求之间的矛盾，提出了联邦学习(Federated Learning,FL)的概念，利用多个设备协作地训练全局模型，并且无需上传本地数据，有效地保护了用户隐私。联邦学习的独特之处在于，它不是处理集中的数据，而是处理分离的数据，并且只需要更新客户端的模型参数信息。由于这个特性，联邦学习在人脸识别、智能交通和医疗服务等领域引起了极大的关注，这些领域高度重视隐私。

现有技术关于联邦学习的研究主要集中在以下四个方面，包括1)数据的非独立同分布问题；2)通信资源受限的问题；3)用户数据的隐私问题；4)联邦学习的安全问题。其中，数据的非独立同分布问题是联邦学习面临的一项基本挑战。相关研究表明，当参与联邦学习的客户端的数据分布差异较大时，训练出的模型精度会大大降低。在现实场景中，各个边缘设备独立产生和存储数据，每个客户端本地数据的分布与全局的数据分布存在较大差异。传统的FedAvg算法随机抽取一定比例的客户端作为参与节点进行联邦学习，每个节点的数据分布是随机的，造成各客户端的局部优化目标与联邦学习的整体优化目标不一致。

超参数的调整对于深度学***均得到全局模型，而局部模型的训练效果很大程度上取决于其本地模型的参数设置。例如，深度神经网络(DNN)的性能取决于隐藏层的数量、神经元数量和训练周期。相对于集中式学习，联邦学习的超参数更多，且不同的边缘设备训练偏好存在差异，采用试错法手动选择超参数需要反复训练效率低下，难以为模型寻找到合适的参数配置。

综上所述，现有技术存在以下问题：

(1)当参与联邦学习的客户端的数据分布差异较大时，训练出的模型精度会大大降低；

(2)训练效率低下，难以为模型寻找到合适的参数配置。

发明内容

本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种融合参数优化的集群联邦学习方法及设备，本发明具备训练效率高、训练模型精度高的优点。

本发明的目的可以通过以下技术方案来实现：

根据本发明的第一个方面，本发明提供一种融合参数优化的集群联邦学习方法，包括如下步骤：

S1：各客户端基于中央服务器发布的全局模型和各自私有数据进行本地模型训练，得到代表本地数据特征的局部模型，将局部模型参数上传至中央服务器；

S2：中央服务器根据所有客户端的局部模型参数，对客户端进行聚类，将所有客户端划分为不同的集群；

S3：中央服务器确认此次训练需要优化的超参数和适应度函数，发送给所有客户端；

S4：各集群分别进行联邦学习训练，训练过程中引入改进的粒子群算法，根据中央服务器确认的超参数和适应度函数进行训练，并在每一轮训练中动态调整超参数，以获得最优的联邦学习模型。

优选地，所述S2具体包括以下步骤：

S201：将所有的客户端模型W_DS作为一组对象点，并标记为未访问，从中任意选取一个作为对象P₁，标记为已访问；

S202：将对象P₁作为核心点，判断P₁的ε邻域内是否至少存在MinPts个对象，是则生成一个簇Q，并把P₁添加到簇Q中，将P₁的ε邻域中的对象集合记为X；

S203：遍历X中的每个点P₂，判断P₂的ε邻域中是否至少存在MinPts个对象；是则再判断P₂是否属于其他簇，属于则将P₂的ε邻域中的对象添加到对象集合X，不属于其他簇，则将它添加至簇Q中，遍历结束后形成聚类Q；

S204：选择任意一个标记为未访问的对象作为P₁，重复步骤S202～S203，直到不存在未访问的对象为止；完成客户端聚类，得到k个集群，每个集群包含数量不等的客户端。

优选地，所述S3中，中央服务器确认待优化的超参数包括隐藏层数L、每层神经元数N、学习率η和本地迭代次数E。

优选地，所述S3中，采用FedAvg算法对粒子进行测试，将测试的精度作为粒子的适应度；FedAvg算法表达式如下：

其中，n为总数据集{D₁,D₂,...,D_M}的大小，

为参与节点m在第s轮联邦学习的模型参数。

优选地，所述S4具体包括如下步骤：

S401：初始化所有粒子的速度

和位置/>

设置种群规模X、最大迭代次数T、惯性权重ω、初始温度U、降温系数μ以及粒子转换概率p；

S402：计算所有初始粒子的适应度，获得个体最优位置pBest和种群最优位置gBest；

S403：更新退火温度U、惯性权重ω和学习因子c₁、c₂；

S404：对所有粒子的适应度值排序，选择适应度值较差的粒子以概率p接受新粒子，将更新后的粒子添加到种群；

S405：更新所有粒子的速度

和位置/>

S406：通过比较每个粒子生成新的适应度值，更新pBest和gBest；

S407：当迭代次数达到T时，输出gBest，算法终止，否则跳转到步骤S403。

优选地，所述S403中，根据

更新惯性权重ω，式中，ω是惯性权重，ω_start为初始惯性权重，ω_end为迭代至最大次数的惯性权重，t为当前迭代次数，T为最大迭代次数，S为变化系数。

优选地，所述S403中，根据

更新学习因子c₁、c₂；式中，

和/>

分别是个体学习因子的初始值和终止值，

和/>

分别是社会学习因子的初始值和终止值，t为当前迭代次数，T为最大迭代次数。

优选地，所述S405中，根据

更新所有粒子的速度

和位置/>

式中，/>

和/>

分别表示粒子当前的位置和速度，

和/>

分别表示粒子与种群当前的最优位置，r₁和r₂为[0,1]区间内均匀分布的随机数，ω是惯性权重。

根据本发明的第二个方面，本发明提供一种电子设备，包括：

一个或多个处理器；存储器；和被存储在存储器中的一个或多个程序，所述一个或多个程序包括用于执行如上任一所述的融合参数优化的集群联邦学习方法的指令。

根据本发明的第三个方面，本发明提供一种计算机可读存储介质，包括供电子设备的一个或多个处理器执行的一个或多个程序，所述一个或多个程序包括用于执行如上任一所述的融合参数优化的集群联邦学习方法的指令。

与现有技术相比，本发明具有以如下有益效果：

(1)本发明通过客户端基于中央服务器发布的全局模型和各自的私有数据进行一次充分的本地模型训练，能够很好地代表本地数据的特征。

(2)本发明通过中央服务器根据客户端上传的模型参数，使用DBSCAN算法对客户端进行聚类，不仅有效降低了集群内部的数据异构程度，还能以较低的客户端参与率执行超参数优化，提高了学习效率，并且可以根据实际需要选择要优化的超参数及其相应的适应度函数，非常灵活。

(3)本发明通过采用改进粒子群算法调整每个集群的超参数，寻找多个参数的最佳组合，实现了更好的模型训练，寻找到合适的参数配置。

附图说明

图1为本实施例提供的一种融合参数优化的集群联邦学习方法的流程示意图。

图2为图1所示实施例中S4的流程示意图；

图3为采用图1所示实施例得到的惯性权重变化曲线。

具体实施方式

下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施，给出了详细的实施方式和具体的操作过程，但本发明的保护范围不限于下述的实施例。

参考图1所示，根据本发明的第一个方面，本实施例提供一种融合参数优化的集群联邦学习方法，包括如下步骤：

S1：客户端i基于中央服务器发布的全局模型w₀和各自的私有数据d_i进行一次充分的本地模型训练，获得代表本地数据特征的局部模型，并将模型参数上传给中央服务器；

S201：将所有的客户端模型W_DS作为一组对象点，并标记为“未访问”，然后从中任意选取一个作为对象P₁，并标记为“已访问”。

S204：选择任意一个标记为“未访问”的对象作为P₁，重复步骤S202～S203，直到不存在“未访问”的对象为止。

作为一种可选的实施方式，基于DBSCAN算法进行客户端聚类。

完成客户端聚类，得到k个集群C＝{C₁,C₂,…,C_k}，每个集群包含数量不等的客户端。

具体地，确定需要优化的超参数和寻优范围，超参数包括隐藏层数L、每层神经元数N、学习率η和本地迭代次数E；

在优化过程中，采用FedAvg算法对粒子进行测试，将测试的精度作为粒子的适应度。FedAvg算法表达式如下：

其中，n为总数据集{D₁,D₂,...,D_M}的大小，

为参与节点m在第s轮联邦学习的模型参数。

S4：每个集群分别进行联邦学习训练，引入改进的粒子群算法，根据S3确认的超参数和适应度函数进行训练，并在每一轮训练中动态调整超参数。

改进的粒子群算法基于非线性惯性权重递减策略、学习因子调整和模拟退火算法，具体迭代公式如下：

式中，ω是惯性权重，决定了算法的收敛特性，当ω较大时，全局搜索能力强，当ω较小时，局部搜索能力强。c₁和c₂是学习因子，c₁体现了粒子受自身历史信息影响的程度，c₂体现了粒子受种群历史信息影响的程度。r₁和r₂为[0,1]区间内均匀分布的随机数。

和/>

分别表示粒子当前的位置和速度，/>

和/>

分别表示粒子与种群当前的最优位置。ω_start为初始惯性权重，ω_end为迭代至最大次数的惯性权重，t为当前迭代次数，T为最大迭代次数，S为变化系数。/>

和/>

分别是个体学习因子的初始值和终止值，/>

和/>

分别是社会学习因子的初始值和终止值。

进一步地，ω_start为初始惯性权重，取值为0.9，ω_end为迭代至最大次数的惯性权重，取值为0.4，t为当前迭代次数，T为最大迭代次数，S为变化系数，取值范围为[1,15]。

根据上述迭代公式寻找超参数的最优解，S4具体包括如下步骤：

S401：初始化所有粒子的速度

和位置/>

设置种群规模X、最大迭代次数T、惯性权重ω、初始温度U、降温系数μ以及粒子转换概率p。

S402：计算所有初始粒子的适应度，获得个体最优位置pBest和种群最优位置gBest。

S403：根据公式(3)更新退火温度U，根据公式(4)～(6)更新惯性权重ω和学习因子c₁、c₂。

S404：对所有粒子的适应度值排序，选择适应度值较差的粒子以公式(7)计算出的概率p接受新粒子，将更新后的粒子添加到种群。

S405：根据公式(2)、(3)更新所有粒子的速度

和位置/>

。

S406：通过比较每个粒子生成新的适应度值，更新pBest和gBest。

将上述可选的实施方式进行排列组合，得到最优的实施方式，下面基于最优的实施方式进行详细阐述。

输入：N,T；其中，N为客户端的数量，T为联邦学习的训练轮数；

输出：

其中，H为每个集群的最佳超参数组合，W为每个集群结束联邦学习后的全局模型。

(1)初始化全局模型参数w₀；

(2)for each client S_i∈(S₁,S₂,…,S_N)do

式中，

为属于客户端S_i的本地数据；

(3)

采用DBSCAN算法进行客户端聚类，C为簇的集合；

(4)for each clusterC_j∈C do

式中，H为集群C_j的最佳超参数组合。

(5)return H,W to server。

其中，(3)为基于DBSCAN的客户端聚类阶段，所有的客户端先在本地反复进行训练，这样能够更好地代表本地的数据特征，从而获得最佳的聚类效果；训练结束后，中央服务器收集所有客户端的本地模型参数，应用DBSCAN算法对客户端聚类。

DBSCAN算法基于密度对客户端进行聚类，它有两个重要参数(ε,MinPts)，其中ε描述的是某个样本邻域的距离阈值，MinPts描述的是ε邻域所包含的样本个数阈值。表1展示了不同的ε和MinPts设置对集群数量的影响。

表1 DBSCAN参数和聚类结果

参考图2所示，当聚类完成后，所有的客户端都划入了对应的集群，这时候在每个集群内分别进行联邦学习，并引入粒子群算法优化客户端的超参数。PSO算法将4个关键超参数(学习率η,批量大小B,动量大小m,本地迭代次数E)作为寻优变量，通过更新粒子的速度和位置，让粒子的适应度达到最低，从而获得最优的超参数组合。

参考表2所示，为本实施例待优化的超参数及其值域。

表2待优化的超参数及其值域

超参数	参数下限	参数上限
			学习率η	1e-7	1e-3
批量大小B	8	128
			本地迭代次数E	3	9

但是标准粒子群算法存在容易陷入局部最优的问题，本发明针对这个问题，对标准粒子群算法进行了改进，加入非线性惯性权重递减策略和动态学习因子调整，并引入模拟退火算法，提升了粒子的全局搜索能力。在粒子进化初期，过小的惯性权重会减小搜索空间，而在粒子进化后期，过大的惯性权重不利于粒子群算法的收敛。因此，合理地改变惯性权重有利于得到更优的结果。由于粒子的移动是非线性的，因此本实施例采用非线性的惯性权重递减策略，算法表达式为：

式中，ω是惯性权重，取值为0.9，ω_end为迭代至最大次数的惯性权重，取值为0.4，t为当前迭代次数，T为最大迭代次数，S为变化系数，取值范围为[1,15]。

参考图3，变化系数S＝9时，惯性权重前期较大，后期较小，可以降低粒子群算法陷入局部最优的概率。

学***衡，本发明采用的学习因子的调整策略如下：

其中，

和/>

分别是个体学习因子的初始值和终止值，/>

和/>

分别是社会学习因子的初始值和终止值。通过大量的实验并分析，取/>

算法初期采用较大的c₁值和较小的c₂值，强调粒子的“个体意识”，增强粒子的全局搜索能力。随着迭代次数t的增加，c₁不断减小，c₂不断增大，此时越来越重视粒子的“社会意识”，局部搜索能力随之增强。

由于粒子群算法以贪心算法的思想接受新解，只接受比当前好的粒子，导致算法迭代到一定次数后很容易陷入局部最优。因此在粒子群算法的每一次迭代后，对适应度值较差的粒子使用模拟退火算法，以概率p产生新粒子，这样在粒子群算法的迭代过程中，就会不断有新的粒子进入下一次迭代，达到跳出局部最优达到全局最优的目的。概率p表达式如下：

其中，U_i表示当前的温度，E_i(t)表示第i个粒子在第t次迭代时的适应度值，E_g表示当前种群最优点的适应度值。温度以公式(3)进行线性衰减，算法的寻优就是不断寻找新解和退火降温的过程。

根据本发明的第二个方面，本实施例提供一种电子设备，包括：

根据本发明的第三个方面，本实施例提供一种计算机可读存储介质，包括供电子设备的一个或多个处理器执行的一个或多个程序，所述一个或多个程序包括用于执行如上任一所述的融合参数优化的集群联邦学习方法的指令。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上详细描述了本发明的较佳具体实施例。应当理解，本领域的普通技术人员无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此，凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案，皆应在由权利要求书所确定的保护范围内。