CN110442457A

CN110442457A - 基于联邦学习的模型训练方法、装置及服务器

Info

Publication number: CN110442457A
Application number: CN201910739086.2A
Authority: CN
Inventors: 雷凯; 黄济乐; 方俊杰
Original assignee: Peking University Shenzhen Graduate School
Current assignee: Peking University Shenzhen Graduate School
Priority date: 2019-08-12
Filing date: 2019-08-12
Publication date: 2019-11-12

Abstract

本发明实施例提供一种基于联邦学习的模型训练方法、装置及服务器。该方法包括：将待训练模型发送至多个工作节点；接收多个工作节点反馈的本地模型，本地模型是各工作节点根据各自所拥有的数据对待训练模型进行训练获得的；根据测试数据集确定各个本地模型的精度；根据各个本地模型的精度确定各个本地模型的权重系数，权重系数与精度正相关；根据多个本地模型以及对应的权重系数，对待训练模型进行更新。本发明实施例的方法，通过增大高精度本地模型的权重系数和减小低精度本地模型的权重系数，加速了待训练模型的收敛速度，提高了待训练模型的精度。

Description

基于联邦学习的模型训练方法、装置及服务器

技术领域

本发明实施例涉及计算机技术领域，具体涉及一种基于联邦学习的模型训练方法、装置及服务器。

背景技术

一方面随着法律法规的不断完善以及监控的不断加强，数据的集中式处理将面临巨大的法律风险；另一方面各个数据拥有方之间出于安全、经济利益等因素不愿意共享原始数据。这些因素都会导致数据以孤岛的形式存在。为了打破数据孤岛，联邦学习应运而生。

联邦学习无须各数据拥有方共享原始数据，可以在保证安全性的条件下，充分地利用各数据拥有方的原始数据进行模型训练，有效解决了人工智能时代的数据孤岛问题。目前基于联邦学习的模型训练过程为：通过服务器节点将待训练模型下发至多个工作节点，各工作节点基于各自所拥有的数据对接收到的待训练模型进行训练，并将训练好的模型参数回传至服务器节点，服务器节点根据接收到的各工作节点的模型参数对待训练模型进行更新，然后重复上述过程直至待训练模型满足预设的性能指标。

在现有基于联邦学习进行模型训练的过程中，服务器节点无法有效识别工作节点中的低质量节点，导致低质量模型参数的引入，从而降低了模型训练的收敛速度以及模型的精度。

发明内容

本发明实施例提供一种基于联邦学习的模型训练方法、装置及服务器，用以解决现有基于联邦学习的模型训练方法中存在的收敛速度慢以及模型精度低的问题。

第一方面，本发明实施例提供一种基于联邦学习的模型训练方法，包括：

将待训练模型发送至多个工作节点；

接收多个工作节点反馈的本地模型，本地模型是各工作节点根据各自所拥有的数据对待训练模型进行训练获得的；

根据测试数据集确定各个本地模型的精度；

根据各个本地模型的精度确定各个本地模型的权重系数，权重系数与精度正相关；

根据多个本地模型以及对应的权重系数，对待训练模型进行更新。

在一种可能的实现方式中，所述方法还包括：

根据各个本地模型的精度确定各个工作节点的奖励，以使各个工作节点根据奖励调整参与度，奖励与精度正相关。

在一种可能的实现方式中，将待训练模型发送至多个工作节点之前，所述方法还包括：

根据训练任务确定待训练模型，并对待训练模型进行初始化；

根据服务器节点与工作节点之间的网络连接状态，以及训练任务，确定多个工作节点。

在一种可能的实现方式中，对待训练模型进行更新之后，所述方法还包括：

判断更新后的待训练模型是否满足预设指标；

若满足，则终止模型训练过程，反之，则继续进行迭代训练。

在一种可能的实现方式中，接收多个工作节点反馈的本地模型包括：

接收多个工作节点在预设时间段内反馈的本地模型。

在一种可能的实现方式中，根据测试数据集确定各个本地模型的精度包括：

根据测试数据集对各个本地模型进行测试验证，确定各个本地模型在测试数据集上的准确率和/或召回率；

根据各个本地模型在测试数据集上的准确率和/或召回率，确定各个本地模型的精度。

在一种可能的实现方式中，根据多个本地模型以及对应的权重系数，对待训练模型进行更新，包括：

根据如下公式对待训练模型进行更新：

其中，M′表示更新后的待训练模型，M表示待训练模型，α为待训练模型的权重系数，L_i表示第i个本地模型，α_i为第i个本地模型的权重系数，N表示本地模型的数量。

第二方面，本发明实施例提供一种基于联邦学习的模型训练装置，包括：

发送模块，用于将待训练模型发送至多个工作节点；

接收模块，用于接收多个工作节点反馈的本地模型，本地模型是各工作节点根据各自所拥有的数据对待训练模型进行训练获得的；

测试模块，用于根据测试数据集确定各个本地模型的精度；

处理模块，用于根据各个本地模型的精度确定各个本地模型的权重系数，权重系数与精度正相关；

更新模块，用于根据多个本地模型以及对应的权重系数，对待训练模型进行更新。

第三方面，本发明实施例提供一种服务器，包括：

至少一个处理器和存储器；

存储器存储计算机执行指令；

至少一个处理器执行存储器存储的计算机执行指令，使得至少一个处理器执行如第一方面任一项所述的基于联邦学习的模型训练方法。

第四方面，本发明实施例提供一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机执行指令，计算机执行指令被处理器执行时用于实现如第一方面任一项所述的基于联邦学习的模型训练方法。

本发明实施例提供的基于联邦学习的模型训练方法、装置及服务器，通过将待训练模型发送至多个工作节点，并接收多个工作节点反馈的本地模型，然后根据测试数据集确定各个本地模型的精度，为各个本地模型设置与精度正相关的权重系数，最后根据多个本地模型以及对应的权重系数，对待训练模型进行更新，实现了多个工作节点对于待训练模型的协同训练。由于在模型训练过程中，各节点之间无需共享数据，有效保证了数据的安全性和数据隐私；通过增大高质量工作节点的权重系数，降低低质量工作节点的权重系数，不仅加速了待训练模型的收敛，而且能够提高待训练模型的精度；进一步的，模型训练过程的加速，也同步降低了各个工作节点的工作量，减少了节点间的通信开销。

附图说明

图1为本发明的***架构示意图；

图2为本发明提供的基于联邦学习的模型训练方法一实施例的流程图；

图3为本发明提供的基于联邦学习的模型训练方法又一实施例的流程图；

图4为本发明提供的基于联邦学习的模型训练装置一实施例的结构示意图；

图5为本发明提供的服务器一实施例的结构示意图。

具体实施方式

下面通过具体实施方式结合附图对本发明作进一步详细说明。其中不同实施方式中类似元件采用了相关联的类似的元件标号。在以下的实施方式中，很多细节描述是为了使得本申请能被更好的理解。然而，本领域技术人员可以毫不费力的认识到，其中部分特征在不同情况下是可以省略的，或者可以由其他元件、材料、方法所替代。在某些情况下，本申请相关的一些操作并没有在说明书中显示或者描述，这是为了避免本申请的核心部分被过多的描述所淹没，而对于本领域技术人员而言，详细描述这些相关操作并不是必要的，他们根据说明书中的描述以及本领域的一般技术知识即可完整了解相关操作。

另外，说明书中所描述的特点、操作或者特征可以以任意适当的方式结合形成各种实施方式。同时，方法描述中的各步骤或者动作也可以按照本领域技术人员所能显而易见的方式进行顺序调换或调整。因此，说明书和附图中的各种顺序只是为了清楚描述某一个实施例，并不意味着是必须的顺序，除非另有说明其中某个顺序是必须遵循的。

本文中为部件所编序号本身，例如“第一”、“第二”等，仅用于区分所描述的对象，不具有任何顺序或技术含义。而本申请所说“连接”、“联接”，如无特别说明，均包括直接和间接连接(联接)。

图1为本发明的***架构示意图。如图1所示，服务器节点101与工作节点102可以通过有线和/或无线的方式进行通信连接。其中，服务器节点101包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算的由大量计算机或网络服务器构成的云；工作节点102包括但不限于计算机、智能手机、平板电脑、个人数字助理消息收发装置等。

图1体现了一种全新的分布式人工智能网络架构体系。服务器节点101与工作节点102之间，以及各工作节点之间无需共享原始数据，保证了数据安全性和数据隐私。服务器节点101向工作节点102下发待训练模型，各个工作节点基于各自所拥有的本地数据进行训练，并回传训练好的本地模型，服务器节点101合并多个工作节点的本地模型并聚合为一个全局模型继续下发，进行迭代训练直到全局模型收敛。

下面将结合图1所示的***架构，对本发明实施例提供的基于联邦学习的模型训练方法的一些可能的应用场景进行说明。举例来说，有甲、乙、丙三家经营视频网站的公司，均想获得高质量的视频推荐模型，用于向用户推荐视频，以提高用户满意度。各公司所拥有的用户数据有限，无法基于各自所拥有的用户数据训练出高质量的视频推荐模型；为了保证用户数据的安全，保护用户隐私，各公司也不能对各自所拥有的用户数据进行共享。此时，各公司便可以通过构建各自的工作节点，并借助于服务器节点协同训练视频推荐模型。再比如说，为了获得高精度的人脸识别模型，可以通过服务器节点发布模型训练任务，拥有人脸图像数据的终端设备可以作为工作节点参与模型训练。服务器节点可以获得高质量的人脸识别模型，而终端设备也可以通过贡献算力和数据获得相应的报酬，实现双赢。

由于服务器节点101与工作节点102之间以及各工作节点之间的数据不共享，信息不对称，且回传的本地模型中的参数也不具有实际物理意义，因此服务器节点101无法保障工作节点102回传的本地模型的质量。难以避免引入低质量的本地模型，低质量本地模型的引入会影响全局模型的收敛速度和精度，同时，收敛速度的降低也会增大通信开销，对于整个***来说会产生很大的负面影响。

下面将通过具体的实施例来详细阐述本发明如何解决上述问题。

图2为本发明提供的基于联邦学习的模型训练方法一实施例的流程图。本实施例提供的基于联邦学习的模型训练方法可以应用于服务器节点。如图2所示，本实施例提供的基于联邦学习的模型训练方法可以包括：

S201、将待训练模型发送至多个工作节点。

本实施例中的待训练模型可以包括但不限于识别模型、分类模型、检测模型、预测模型等，具体实现上例如可以采用人工神经网络模型、支持向量机、卷积神经网络模型等，本实施例对此不作限制。工作节点为拥有训练数据并参与模型协同训练的节点，本实施例中参与模型协同训练的工作节点的数量大于等于两个。

可以理解的是，在将待训练模型发送至多个工作节点之前，服务器节点还可以根据训练任务确定待训练模型。举例来说，若训练任务为进行人脸识别，则可以确定待训练模型为识别模型；若训练任务为进行风险预测，则可以确定待训练模型为预测模型。可以预先建立训练任务与待训练模型之间的映射关系，根据训练任务以及映射关系确定待训练模型。服务器节点在确定待训练模型之后，便可以通过服务器节点与各工作节点之间预先建立的网络连接，将待训练模型发送至各个工作节点。

S202、接收多个工作节点反馈的本地模型，本地模型是各工作节点根据各自所拥有的数据对待训练模型进行训练获得的。

本实施例中当工作节点接收到服务器节点下发的待训练模型之后，便可以采用工作节点中存储的本地数据对接收到的待训练模型进行训练，生成本地模型。在本地模型收敛，或者，训练时间达到预设值时，将带有训练好的参数的本地模型通过预先建立的网络连接回传至服务器节点。本实施例中各工作节点中存储的本地数据无需在节点之间共享，保证了各工作节点中自有数据的安全性和隐私性。

可选的，为了进一步提高模型的训练速度，接收多个工作节点反馈的本地模型的一种可能的实现方式为：接收多个工作节点在预设时间段内反馈的本地模型。

本实施例中为了避免服务器节点长时间的等待工作节点反馈，降低模型的训练速度，服务器节点仅接收在预设时间段内反馈的本地模型。例如服务器节点可以在下发待训练模型之后开启定时器，在预设时间到达之后，可以关闭接收通道拒绝再继续接收本地模型，或者可以直接丢弃在预设时间到达之后接收到的本地模型。举例来说，假设有A、B和C三个本地模型，其中A和B在预设时间段内到达，而C超时到达，则服务器节点在进行待训练模型更新时，仅考虑本地模型A和B。本实施例中的预设时间段例如可以根据待训练模型的复杂度、各工作节点的平均算力、节点之间的通信速率等因素确定。

S203、根据测试数据集确定各个本地模型的精度。

本实施例中当服务器节点接收到工作节点反馈的本地模型之后，便可以根据服务器节点中的测试数据集，对接收到的本地模型进行测试验证，以确定各个本地模型的精度。本地模型的精度可以体现本地模型的质量，可以理解的是，高质量的本地模型对应高精度。本实施例中的测试数据集包括预先标记好的测试数据，各工作节点无法获知测试数据集。由服务器节点进行统一的测试验证，可以有效避免各工作节点弄虚作假，保证测试验证的准确性和公平性。具体来说，例如可以将测试数据集中的数据输入本地模型，确定本地模型的实际输出，将本地模型的实际输出与测试数据集中预先标记的期望输出进行比较，根据比较结果确定本地模型的精度。

可选的，根据测试数据集确定各个本地模型的精度的一种可能的实现方式为：根据测试数据集对各个本地模型进行测试验证，确定各个本地模型在测试数据集上的准确率和/或召回率；根据各个本地模型在测试数据集上的准确率和/或召回率，确定各个本地模型的精度。其中，准确率可以用于度量模型的正确性，准确率＝预测正确的样本数/总样本数；召回率可以用于度量模型的覆盖面，召回率＝将正类预测为正类的数量/总的正类数量。本地模型的精度可以根据准确率，或者召回率，或者准确率和召回率的加权平均值确定。

可选的，本实施例中的测试数据集可以根据待训练模型确定。例如可以预先建立待训练模型与测试数据集之间的映射关系，在确定了待训练模型之后，便可以根据该映射关系确定与之对应的测试数据集了。

S204、根据各个本地模型的精度确定各个本地模型的权重系数，权重系数与精度正相关。

本实施例中在确定各个本地模型的精度之后，便可以根据该精度确定各个本地模型的权重系数。其中，权重系数的大小体现了本地模型对于整个模型训练过程贡献的大小。可以理解的是，引入高质量的本地模型，能够加速待训练模型的收敛，提高待训练模型的精度，有益于整个模型训练过程；而引入低质量的本地模型，不仅对于整个模型训练过程毫无帮助，反而会增加其他工作节点的工作量，增大整个***的通信开销。因此，本实施例中各本地模型的权重系数与其精度正相关，即精度越高的本地模型获得的权重系数越大。可选的，对于精度低于预设精度阈值的本地模型，可以将其权重系数设为0，以避免其可能带来的不利影响。

本实施例中通过引入注意力机制，增大高质量工作节点的权重系数，降低低质量工作节点的权重系数，有利于加速模型收敛，提高训练速度。

S205、根据多个本地模型以及对应的权重系数，对待训练模型进行更新。

本实施例中服务器节点在确定各本地模型的权重系数之后，便可以据此对待训练模型进行更新。例如，可以采用多个本地模型的加权平均，对待训练模型进行更新。

本实施例提供的基于联邦学习的模型训练方法，通过将待训练模型发送至多个工作节点，并接收多个工作节点反馈的本地模型，然后根据测试数据集确定各个本地模型的精度，为各个本地模型设置与精度正相关的权重系数，最后根据多个本地模型以及对应的权重系数，对待训练模型进行更新，实现了多个工作节点对于待训练模型的协同训练。由于在模型训练过程中，各节点之间无需共享数据，有效保证了数据的安全性和数据隐私；通过增大高质量工作节点的权重系数，降低低质量工作节点的权重系数，不仅加速了待训练模型的收敛，而且能够提高待训练模型的精度；进一步的，模型训练过程的加速，也同步降低了各个工作节点的工作量，减少了节点间的通信开销。

为了调动各工作节点的积极性，以便其能够积极参与模型训练，通常会向各工作节点给予适当的激励。目前，对工作节点的激励机制主要分为两类：基于博弈论的激励机制和基于契约理论的激励机制。基于博弈论的激励机制均衡博弈工作节点的贡献来分配奖励，以刺激工作节点多为整体***做贡献。在该机制中，评估工作节点的工作质量或者工作节点为***所做的贡献有以下两种方式：根据一个工作节点参与模型训练后为整体模型所带来的收益提升，或者一个工作节点退出模型训练而导致的整体模型收益的下降，进行评估。具体来说，可以根据运算时间、通信开销和模型精度等指标来综合判断，进而确定工作节点的工作质量。基于契约理论的激励机制实质上是基于博弈论的激励机制的一种衍生和变化，会预先设定多种类型的契约签订奖励的规格，更加适应于信息不对称的分布式激励情况。服务器节点会设立一个收益函数，以在契约限定的付出下尽可能提升模型精度和收敛速度以减少开销，争取自己的最大收益；工作节点会设立效用函数，以在自身数据质量和计算能力的条件下尽可能争取高等级的契约以提高自己的收益。双方处于一个博弈的状态下，相互博弈以达到平衡。

上述激励机制难以避免恶意节点骗取奖励，无法有效防止作恶节点对模型训练过程的影响。以基于契约理论的激励机制为例，假设服务器节点与工作节点签订了高等级的契约，服务器节点无法保证工作节点的数据和算力均没有作假。作为工作节点来说，若有心作恶或者为了骗取激励，完全可以不进行模型训练而直接回传模型，或者在本地模型没有收敛的状态下回传模型，或者直接编造参数回传模型。这样的回传模型是低质量的模型，对模型收敛不仅没有什么帮助，反而会增加其他工作节点的工作量。

为了避免出现节点骗取奖励的现象，同时为了调动各节点的积极性，在上述实施例的基础上，本实施例提供的方法还可以包括：根据各个本地模型的精度确定各个工作节点的奖励，以使各个工作节点根据奖励调整参与度，奖励与精度正相关。

本实施例中的奖励例如可以是各工作节点使用训练好的模型的权限等级、计算资源、存储资源等。可以根据具体的应用场景确定，本实施例对于奖励的具体形式不作限制。

本实施例中服务器节点在确定各个本地模型的精度之后，可以根据该精度采用服务器节点的效用函数评估服务器节点的收益，根据服务器节点的收益向各个工作节点分配奖励。各工作节点在获得奖励之后，根据各自的效用函数评估各工作节点的收益，据此调整参与度，具体来说，可以调整参与模型训练过程所使用的数据量、计算资源、存储资源、通信资源等。

可以理解的是，高精度的本地模型能够使服务器节点获得更高的收益，因此为了吸引高质量的工作节点参与模型训练过程，本实施例中可以向提供高精度本地模型的工作节点分配更多的奖励，即精度越高，能够获得的奖励也越多。高额的奖励会促进工作节点积极的参与模型的训练，贡献更高的算力和更多的数据，提供高精度的本地。可选的，对于精度低于预设精度阈值的本地模型，服务器节点可以拒绝向提供该本地模型的工作节点分配奖励。因此，对于编造参数回传模型的工作节点来说，可能无法获得奖励，或者仅能获得很小的奖励，能够有效的降低工作节点骗取奖励的现象。

本实施例提供的基于联邦学习的模型训练方法，在上述实施例的基础上，通过向各工作节点分配与其提供的本地模型的精度正相关的奖励，促进了高质量的工作节点积极参与模型的训练过程，缓解了恶意节点骗取奖励的现象，进一步加速了待训练模型的收敛及提高了待训练模型的精度。

图3为本发明提供的基于联邦学习的模型训练方法又一实施例的流程图。如图3所示，本实施例提供的方法可以包括：

S301、根据训练任务确定待训练模型，并对待训练模型进行初始化。

根据训练任务确定待训练模型的具体实现过程可以参考上述实施例，此处不再赘述。在确定待训练模型之后，服务器节点可以对待训练模型进行初始化。例如可以对待训练模型进行随机初始化，将待训练模型的参数初始化为随机值；或者，可以将待训练模型初始化为服务器节点中预先存储的模型。

需要说明的是，在进行迭代训练的过程中，服务器节点仅对待训练模型进行一次初始化。

S302、根据服务器节点与工作节点之间的网络连接状态，以及训练任务，确定多个工作节点。

为了提高参与模型训练过程的工作节点的质量，可以根据服务器节点与工作节点之间的网络连接状态、训练任务、历史迭代过程中提供的本地模型的精度等对工作节点进行筛选。举例来说，若根据训练任务确定需要3个工作节点参与模型训练过程中，则可以从网络连接状态良好的4个工作节点中随机选取3个工作节点参与模型训练，或者可以根据各工作节点的历史表现，从网络连接状态良好的4个工作节点中选取质量较高的3个工作节点参与模型训练。

需要说明的是，在每轮迭代训练的过程中，均可以对工作节点进行选取。也就是说，迭代训练过程中参与模型训练的节点可以不相同。举例来说，在第一轮训练过程中，工作节点W与服务器节点之间的网络连接状态良好，工作节点W被选中参与模型训练，然而在第二轮训练过程中，工作节点W与服务器节点之间的网络连接状态恶化，无法进行高效通信，工作节点W将会被剔除。可以有效避免低质量工作节点的引入。

S303、将待训练模型发送至多个工作节点。

具体实现过程可以参考上述实施例中的步骤S201，此处不再赘述。

S304、接收多个工作节点在预设时间段内反馈的本地模型。

具体实现过程可以参考上述实施例，此处不再赘述。

S305、根据测试数据集确定各个本地模型的精度。

具体实现过程可以参考上述实施例中的步骤S203，此处不再赘述。

需要说明的是，为了避免出现过拟合现象，提高待训练模型的泛化能力，在进行迭代训练的过程中，测试数据集可以部分或者全部不相同。举例来说，若服务器节点中存储有10000个预先标记的测试数据，在每轮迭代训练过程中，可以从10000个测试数据中随机选取，或者根据预设规则选取100个形成测试数据集，用于对本地模型进行验证。

S306、根据各个本地模型的精度确定各个本地模型的权重系数，权重系数与精度正相关。

具体实现过程可以参考上述实施例中的步骤S204，此处不再赘述。

S307、根据多个本地模型以及对应的权重系数，对待训练模型进行更新。

可选的，根据多个本地模型以及对应的权重系数，对待训练模型进行更新的一种可能的实现方式为：

根据如下公式对待训练模型进行更新：

其中，M′表示更新后的待训练模型，M表示待训练模型，α为待训练模型的权重系数，α∈[0,1]，L_i表示第i个本地模型，α_i为第i个本地模型的权重系数，α_i∈[0,1]，N表示本地模型的数量，

需要说明的是，在迭代训练初期，由于待训练模型M不稳定，为了加速模型的训练过程，可以减小α，增大α_i，例如对于采用随机方式进行初始化的待训练模型，可以将α设为0；而在迭代训练后期，由于M已经趋于收敛状态，为了提高训练过程的稳定性，可以增大α，减小α_i。

S308、判断更新后的待训练模型是否满足预设指标，若满足，则终止模型训练过程，若不满足，则执行步骤S302，继续进行迭代训练。

本实施例中的预设指标可以为以下指标中的一种或者多种：是否收敛、是否达到最大迭代次数、是否达到最大训练时间等。可以将各种指标结合进行判断，例如可以首先判断更新后的待训练模型是否收敛，若收敛则终止模型训练过程，否则继续判断是否已经达到最大迭代次数，若达到则终止模型训练过程，否则继续判断是否已经达到最大训练时间，若达到则终止模型训练过程，否者执行步骤S302，继续进行迭代训练。

本实施例提供的基于联邦学习的模型训练方法，在上述实施例的基础上，进一步提高了训练速度和模型精度。

本发明实施例还提供一种基于联邦学习的模型训练装置，请参见图4所示，本发明实施例仅以图4为例进行说明，并不表示本发明仅限于此。图4为本发明提供的基于联邦学习的模型训练装置一实施例的结构示意图。如图4所示，本实施例提供的基于联邦学习的模型训练装置40可以包括：发送模块401、接收模块402、测试模块403、处理模块404和更新模块405。

发送模块401，用于将待训练模型发送至多个工作节点；

接收模块402，用于接收多个工作节点反馈的本地模型，本地模型是各工作节点根据各自所拥有的数据对待训练模型进行训练获得的；

测试模块403，用于根据测试数据集确定各个本地模型的精度；

处理模块404，用于根据各个本地模型的精度确定各个本地模型的权重系数，权重系数与精度正相关；

更新模块405，用于根据多个本地模型以及对应的权重系数，对待训练模型进行更新。

本实施例的装置，可以用于执行图2所示方法实施例的技术方案，其实现原理和技术效果类似，此处不再赘述。

可选的，基于联邦学习的模型训练装置40还可以包括分配模块(图中未示出)，具体用于根据各个本地模型的精度确定各个工作节点的奖励，以使各个工作节点根据奖励调整参与度，奖励与精度正相关。

可选的，基于联邦学习的模型训练装置40还可以包括初始化模块(图中未示出)，具体用于在将待训练模型发送至多个工作节点之前，根据训练任务确定待训练模型，并对待训练模型进行初始化；根据服务器节点与工作节点之间的网络连接状态，以及训练任务，确定多个工作节点。

可选的，基于联邦学习的模型训练装置40还可以包括判断模块(图中未示出)，具体用于在对待训练模型进行更新之后，判断更新后的待训练模型是否满足预设指标；若满足，则终止模型训练过程，反之，则继续进行迭代训练。

可选的，接收模块402具体可以用于，接收多个工作节点在预设时间段内反馈的本地模型。

可选的，测试模块403具体可以用于，根据测试数据集对各个本地模型进行测试验证，确定各个本地模型在测试数据集上的准确率和/或召回率；根据各个本地模型在测试数据集上的准确率和/或召回率，确定各个本地模型的精度。

可选的，更新模块405具体可以用于，根据如下公式对待训练模型进行更新：

本发明实施例还提供一种服务器，请参见图5所示，本发明实施例仅以图5为例进行说明，并不表示本发明仅限于此。图5为本发明提供的服务器一实施例的结构示意图。如图5所示，本实施例提供的服务器50可以包括：存储器501、处理器502和总线503。其中，总线503用于实现各元件之间的连接。

存储器501中存储有计算机程序，计算机程序被处理器502执行时可以实现上述任一方法实施例提供的技术方案。

其中，存储器501和处理器502之间直接或间接地电性连接，以实现数据的传输或交互。例如，这些元件相互之间可以通过一条或者多条通信总线或信号线实现电性连接，如可以通过总线503连接。存储器501中存储有实现基于联邦学习的模型训练方法的计算机程序，包括至少一个可以软件或固件的形式存储于存储器501中的软件功能模块，处理器502通过运行存储在存储器501内的软件程序以及模块，从而执行各种功能应用以及数据处理。

存储器501可以是，但不限于，随机存取存储器(Random Access Memory，简称：RAM)，只读存储器(Read Only Memory，简称：ROM)，可编程只读存储器(ProgrammableRead-Only Memory，简称：PROM)，可擦除只读存储器(Erasable Programmable Read-OnlyMemory，简称：EPROM)，电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory，简称：EEPROM)等。其中，存储器501用于存储程序，处理器502在接收到执行指令后，执行程序。进一步地，上述存储器501内的软件程序以及模块还可包括操作***，其可包括各种用于管理***任务(例如内存管理、存储设备控制、电源管理等)的软件组件和/或驱动，并可与各种硬件或软件组件相互通信，从而提供其他软件组件的运行环境。

处理器502可以是一种集成电路芯片，具有信号的处理能力。上述的处理器502可以是通用处理器，包括中央处理器(Central Processing Unit，简称：CPU)、网络处理器(Network Processor，简称：NP)等。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。可以理解，图5的结构仅为示意，还可以包括比图5中所示更多或者更少的组件，或者具有与图5所示不同的配置。图5中所示的各组件可以采用硬件和/或软件实现。

需要说明的是，本实施例提供的服务器包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算的由大量计算机或网络服务器构成的云，其中，云计算是分布式计算的一种，由一群松散耦合的计算机组成的一个超级虚拟计算机。

本发明实施例还提供一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时可以实现上述任一方法实施例提供的基于联邦学习的模型训练方法。本实施例中的计算机可读存储介质可以是计算机能够存取的任何可用介质，或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备，可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如SSD)等。

本领域技术人员可以理解，上述实施方式中各种方法的全部或部分功能可以通过硬件的方式实现，也可以通过计算机程序的方式实现。当上述实施方式中全部或部分功能通过计算机程序的方式实现时，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：只读存储器、随机存储器、磁盘、光盘、硬盘等，通过计算机执行该程序以实现上述功能。例如，将程序存储在设备的存储器中，当通过处理器执行存储器中程序，即可实现上述全部或部分功能。另外，当上述实施方式中全部或部分功能通过计算机程序的方式实现时，该程序也可以存储在服务器、另一计算机、磁盘、光盘、闪存盘或移动硬盘等存储介质中，通过下载或复制保存到本地设备的存储器中，或对本地设备的***进行版本更新，当通过处理器执行存储器中的程序时，即可实现上述实施方式中全部或部分功能。

以上应用了具体个例对本发明进行阐述，只是用于帮助理解本发明，并不用以限制本发明。对于本发明所属技术领域的技术人员，依据本发明的思想，还可以做出若干简单推演、变形或替换。

Claims

1.一种基于联邦学习的模型训练方法，应用于服务器节点，其特征在于，包括：

将待训练模型发送至多个工作节点；

接收多个所述工作节点反馈的本地模型，所述本地模型是各工作节点根据各自所拥有的数据对所述待训练模型进行训练获得的；

根据测试数据集确定各个所述本地模型的精度；

根据各个所述本地模型的精度确定各个所述本地模型的权重系数，所述权重系数与所述精度正相关；

根据多个所述本地模型以及对应的权重系数，对所述待训练模型进行更新。

2.如权利要求1所述的方法，其特征在于，所述方法还包括：

根据各个所述本地模型的精度确定各个所述工作节点的奖励，以使各个所述工作节点根据所述奖励调整参与度，所述奖励与所述精度正相关。

3.如权利要求1所述的方法，其特征在于，所述将待训练模型发送至多个工作节点之前，所述方法还包括：

根据训练任务确定所述待训练模型，并对所述待训练模型进行初始化；

根据所述服务器节点与工作节点之间的网络连接状态，以及所述训练任务，确定所述多个工作节点。

4.如权利要求1所述的方法，其特征在于，所述对所述待训练模型进行更新之后，所述方法还包括：

判断更新后的待训练模型是否满足预设指标；

5.如权利要求1所述的方法，其特征在于，所述接收多个所述工作节点反馈的本地模型包括：

接收多个所述工作节点在预设时间段内反馈的本地模型。

6.如权利要求1-5任一项所述的方法，其特征在于，所述根据测试数据集确定各个所述本地模型的精度包括：

根据测试数据集对各个所述本地模型进行测试验证，确定各个所述本地模型在所述测试数据集上的准确率和/或召回率；

根据各个所述本地模型在所述测试数据集上的准确率和/或召回率，确定各个所述本地模型的精度。

7.如权利要求1-5任一项所述的方法，其特征在于，所述根据多个所述本地模型以及对应的权重系数，对所述待训练模型进行更新，包括：

根据如下公式对所述待训练模型进行更新：

其中，M′表示更新后的待训练模型，M表示所述待训练模型，α为所述待训练模型的权重系数，L_i表示第i个本地模型，α_i为第i个本地模型的权重系数，N表示本地模型的数量。

8.一种基于联邦学习的模型训练装置，其特征在于，包括：

发送模块，用于将待训练模型发送至多个工作节点；

接收模块，用于接收多个所述工作节点反馈的本地模型，所述本地模型是各工作节点根据各自所拥有的数据对所述待训练模型进行训练获得的；

测试模块，用于根据测试数据集确定各个所述本地模型的精度；

处理模块，用于根据各个所述本地模型的精度确定各个所述本地模型的权重系数，所述权重系数与所述精度正相关；

更新模块，用于根据多个所述本地模型以及对应的权重系数，对所述待训练模型进行更新。

9.一种服务器，其特征在于，包括：至少一个处理器和存储器；

所述存储器存储计算机执行指令；

所述至少一个处理器执行所述存储器存储的计算机执行指令，使得所述至少一个处理器执行如权利要求1-7任一项所述的基于联邦学习的模型训练方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机执行指令，所述计算机执行指令被处理器执行时用于实现如权利要求1-7任一项所述的基于联邦学习的模型训练方法。