WO2021227069A1

WO2021227069A1 - 一种模型更新方法及装置、通信设备

Info

Publication number: WO2021227069A1
Application number: PCT/CN2020/090663
Authority: WO
Inventors: 田文强
Original assignee: Oppo广东移动通信有限公司
Priority date: 2020-05-15
Filing date: 2020-05-15
Publication date: 2021-11-18
Also published as: WO2021227069A9; CN115427969A

Abstract

本申请实施例提供一种模型更新方法及装置、通信设备，该方法包括：主节点接收子节点发送的第一模型更新信息，其中，所述第一模型更新信息为所述子节点所期望的全局模型相对于第一全局模型的模型更新信息；所述主节点根据所述第一模型更新信息和所述第一全局模型对第二全局模型进行更新，得到第三全局模型。

Description

一种模型更新方法及装置、通信设备

技术领域

本申请实施例涉及移动通信技术领域，具体涉及一种模型更新方法及装置、通信设备。

背景技术

联邦学习的过程中，不同子节点在时间上很难保证均能同步地向主节点反馈各自的模型更新信息。针对这种情况，一种简单的处理方法是主节点可按照模型更新信息最晚到达的时间做全局模型的更新。然而，如果参与联邦学习训练的节点数目众多时，主节点处的全局模型更新速率将受限于最慢传输模型更新信息的子节点，全局模型更新的效率将会非常低。

发明内容

本申请实施例提供一种模型更新方法及装置、通信设备。

本申请实施例提供的模型更新方法，包括：

主节点接收子节点发送的第一模型更新信息，其中，所述第一模型更新信息为所述子节点所期望的全局模型相对于第一全局模型的模型更新信息；

所述主节点根据所述第一模型更新信息和所述第一全局模型对第二全局模型进行更新，得到第三全局模型。

本申请实施例提供的模型更新装置，应用于主节点，所述装置包括：

接收单元，用于接收子节点发送的第一模型更新信息，其中，所述第一模型更新信息为所述子节点所期望的全局模型相对于第一全局模型的模型更新信息；

更新单元，用于根据所述第一模型更新信息和所述第一全局模型对第二全局模型进行更新，得到第三全局模型。

本申请实施例提供的通信设备，包括处理器和存储器。该存储器用于存储计算机程序，该处理器用于调用并运行该存储器中存储的计算机程序，执行上述的模型更新方法。

本申请实施例提供的芯片，用于实现上述的模型更新方法。

具体地，该芯片包括：处理器，用于从存储器中调用并运行计算机程序，使得安装有该芯片的设备执行上述的模型更新方法。

本申请实施例提供的计算机可读存储介质，用于存储计算机程序，该计算机程序使得计算机执行上述的模型更新方法。

本申请实施例提供的计算机程序产品，包括计算机程序指令，该计算机程序指令使得计算机执行上述的模型更新方法。

本申请实施例提供的计算机程序，当其在计算机上运行时，使得计算机执行上述的模型更新方法。

本申请实施例的技术方案中，对于提供模型更新信息的子节点，该子节点参与全局模型的更新，对于不提供模型更新信息的子节点，该子节点不参与全局模型的更新，基于此，主节点接收到子节点发送的第一模型更新信息后，基于该第一模型更新信息对当前的全局模型(即第二全局模型)进行更新，得到更新后的全局模型(即第三全局模型)，如此，能够一定程度上避免联邦学习过程中全局模型的更新受限于部分子节点的模型更新信息传输受限的影响。此外，主节点获取到的来自子节点的第一模型更新信息为该子节点所期望的全局模型相对于第一全局模型的模型更新信息，这里，第一全局模型为主节点的历史全局模型，基于此，主节点结合第一模型更新信息和历史全局模型对当前全局模型(即第二全局模型)进行更新，由于考虑了模型更新所涉及的历史全局模型的影响，从而避免了非同步更新全局模型时的性能降低问题。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1是本申请实施例提供的一种通信***架构的示意性图；

图2(a)是本申请实施例提供的神经网络训练阶段的示意图；

图2(b)是本申请实施例提供的神经网络推理阶段的示意图；

图3是本申请实施例提供的联邦学习的示意图；

图4是本申请实施例提供的基本方案的流程图；

图5为本申请实施例提供的模型更新方法的流程示意图一；

图6是本申请实施例提供的模型更新方法的流程示意图二；

图7是本申请实施例提供的模型参考版本信息传输示意图；

图8为本申请实施例提供的模型更新装置的结构组成示意图；

图9是本申请实施例提供的一种通信设备示意性结构图；

图10是本申请实施例的芯片的示意性结构图；

图11是本申请实施例提供的一种通信***的示意性框图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请实施例的技术方案可以应用于各种通信***，例如：长期演进(Long Term Evolution，LTE)***、LTE频分双工(Frequency Division Duplex，FDD)***、LTE时分双工(Time Division Duplex，TDD)、***、5G通信***或未来的通信***等。

示例性的，本申请实施例应用的通信***100如图1所示。该通信***100可以包括网络设备110，网络设备110可以是与终端120(或称为通信终端、终端)通信的设备。网络设备110可以为特定的地理区域提供通信覆盖，并且可以与位于该覆盖区域内的终端进行通信。可选地，该网络设备110可以是LTE***中的演进型基站(Evolutional Node B，eNB或eNodeB)，或者是云无线接入网络(Cloud Radio Access Network，CRAN)中的无线控制器，或者该网络设备可以为移动交换中心、中继站、接入点、车载设备、可穿戴设备、集线器、交换机、网桥、路由器、5G网络中的网络侧设备或者未来通信***中的网络设备等。

该通信***100还包括位于网络设备110覆盖范围内的至少一个终端120。作为在此使用的“终端”包括但不限于经由有线线路连接，如经由公共交换电话网络(Public Switched Telephone Networks，PSTN)、数字用户线路(Digital Subscriber Line，DSL)、数字电缆、直接电缆连接；和/或另一数据连接/网络；和/或经由无线接口，如，针对蜂窝网络、无线局域网(Wireless Local Area Network，WLAN)、诸如DVB-H网络的数字电视网络、卫星网络、AM-FM广播发送器；和/或另一终端的被设置成接收/发送通信信号的装置；和/或物联网(Internet of Things，IoT)设备。被设置成通过无线接口通信的终端可以被称为“无线通信终端”、“无线终端”或“移动终端”。移动终端的示例包括但不限于卫星或蜂窝电话；可以组合蜂窝无线电电话与数据处理、传真以及数据通信能力的个人通信***(Personal Communications System，PCS)终端；可以包括无线电电话、寻呼机、因特网/内联网接入、Web浏览器、记事簿、日历以及/或全球定位***(Global Positioning System，GPS)接收器的PDA；以及常规膝上型和/或掌上型接收器或包括无线电电话收发器的其它电子装置。终端可以指接入终端、用户设备(User Equipment，UE)、用户单元、用户站、移动站、移动台、远方站、远程终端、移动设备、用户终端、终端、无线通信设备、用户代理或用户装置。接入终端可以是蜂窝电话、无绳电话、会话启动协议(Session Initiation Protocol，SIP)电话、无线本地环路(Wireless Local Loop，WLL)站、个人数字处理(Personal Digital Assistant，PDA)、具有无线通信功能的手持设备、计算设备或连接到无线调制解调器的其它处理设备、车载设备、可穿戴设备、5G网络中的终端或者未来演进的PLMN中的终端等。

可选地，终端120之间可以进行终端直连(Device to Device，D2D)通信。

可选地，5G通信***或5G网络还可以称为新无线(New Radio，NR)***或NR网络。

图1示例性地示出了一个网络设备和两个终端，可选地，该通信***100可以包括多个网络设备并且每个网络设备的覆盖范围内可以包括其它数量的终端，本申请实施例对此不做限定。

可选地，该通信***100还可以包括网络控制器、移动管理实体等其他网络实体，本申请实施例对此不作限定。

应理解，本申请实施例中网络/***中具有通信功能的设备可称为通信设备。以图1示出的通信***100为例，通信设备可包括具有通信功能的网络设备110和终端120，网络设备110和终端120可以为上文所述的具体设备，此处不再赘述；通信设备还可包括通信***100中的其他设备，例如网络控制器、移动管理实体等其他网络实体，本申请实施例中对此不做限定。

应理解，本文中术语“***”和“网络”在本文中常被可互换使用。本文中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。

为便于理解本申请实施例的技术方案，以下对本申请实施例相关的技术方案进行说明。

●神经网络

对于一个特定的神经网络来说，在使用过程中包括训练阶段和推理阶段两个过程。在训练阶段，首先需要获得大量的数据作为训练集合(简称为训练集)，然后将训练集作为待训练神经网络(也可以称为待训练模型)的输入参数，并基于特定的训练算法，通过大量的训练和参数迭代，最终确定待训练神经网络的网络参数，这样也就完成了神经网络的训练过程，得到一个训练好的神经网络(即对神经网络的网络参数进行了优化)。例如可通过大量小狗的图片训练一个识别小狗的神经网络，如图2(a)所示。有别于训练阶段，对于一个神经网络来说，当神经网络训练完毕之后就可以使用该神经网络做识别、分类、信息恢复等推理操作，这一过程称之为神经网络的推理过程。例如可通过训练好的神经网络识别出图像中的小狗，如图2(b)。

关于神经网络的训练，需要说明的是，当用户利用训练集训练神经网络时可以(1)神经网络参数(即神经网络的网络参数)的每次更新需要利用所有的训练集数据，或者(2)神经网络参数的每次更新利用一个训练集数据，或者(3)神经网络参数的每次更新利用所有训练集数据中的一部分数据，既利用一批量(batch)数据。一般来讲，在神经网络训练中通常采用的是利用一批量数据更新一次神经网络参数的方法，其中一批量数据的大小可作为超参数配置。

●联邦学习

传统的神经网络训练是集中式的，例如在数据中心收到大量训练集数据后进行模型训练。但是考虑到用户隐私保护、算力分布等因素后，一种特殊的神经网络训练方式——“联邦学习”被提出，其特征是在神经网络的训练过程中，训练集分布在各个子节点(用户)上。首先，(1)各个子节点基于本地训练集生成本地局部神经网络后将该本地局部神经网络上传至主节点(网络)；其次，(2)主节点可根据获得的各个本地局部神经网络合成当前全局神经网络，并将全局神经网络传输至各个子节点；继而，(3)子节点继续使用新的全局神经网络做下一次训练迭代。最终在多个节点的协作下完成神经网络的训练，如图3所示。

需要说明的是，本申请实施例中的“本地局部神经网络”也可以称为“本地局部模型(简称为局部模型或者本地模型)”，本申请实施例中的“全局神经网络”也可以称为“全局模型”。

上述联邦学习的过程中，存在如下几个问题：

1.不同子节点在时间上很难保证均能同步地反馈各自的模型更新信息。

首先，各个子节点不一定是时钟同步的，所以很难保证不同子节点同步反馈各自的模型更新信息。

其次，不同子节点的数据来源不同，因为数据来源的问题也很难保证不同子节点同步反馈各自的模型更新信息。例如子节点1的本地数据1分钟得到一次，子节点2的本地数据1秒钟得到一次，当两个子节点都用100次本地数据更新一次局部模型时，那显然各自反馈模型更新信息的频次是不一样的。

2.从上述描述可以看出，不同子节点在时间上非同步地反馈各自的模型更新信息至主节点是实际存在的典型场景和需求。针对这种情况，一种简单的处理方法是主节点可按照模型更新信息最晚到达的时间做全局模型的更新。例如子节点1每分钟传输一次模型更新信息，子节点2每秒钟传输一次模型更新信息，那主节点也每分钟更新一次全局模型。再例如，子节点1因为传输信道太差或者本地数据输入出现问题等原因，导致了有一次传输比预计的每分钟传输一次所约定的时间还延迟了0.5分钟，那主节点也需要继续延迟0.5分钟才可以更新全局模型。

需要指出的是，如果参与联邦学习训练的节点数目众多时，主节点处的全局模型更新速率将受限于最慢传输模型更新信息的子节点，全局模型更新的效率将会非常低。

为此，提出了本申请实施例的以下技术方案。通过分析发现，一种处理上述问题的改进方法是：主节点按照预先约定的时间周期更新全局模型。例如约定每10秒钟更新一次全局模型，10秒钟内如果子节点1向主节点传输了模型更新信息，则子节点1提供的模型更新信息参与全局模型的更新，如果10秒钟内子节点1没有向主节点传输模型更新信息，则子节点1不参与此次全局模型的更新。这种处理方法能够一定程度上避免联邦学习全局模型训练受限于部分子节点模型更新信息传输受限的影响。为便于后续描述，上述改进方法可以称为基本方案。但是需要指出的是，这里的基本方案存在模型更新信息时效性的问题。例如：

在t0时刻，子节点1和子节点2根据t0时刻的全局模型N ₀同时更新了各自的本地局部模型为N ₀。这里，N _x表示tx时刻的全局模型。

在t1时刻，子节点2确定了本地局部模型相对于N ₀的模型更新信息为ΔN _1,0,2，并将该模型更新信息传输至主节点。这里，ΔN _1,0,2所对应信息可以是子节点2所期望的t1时刻的全局模型N ₁与t0时刻的全局模型N ₀之间的模型更新信息，例如该模型更新信息可以通过梯度信息等方式标识。存在上述模型更新信息需求的原因是子节点2所期望的t1时刻的全局模型N ₁与t0时刻的全局模型N ₀之间存在差别。

在t1时刻，主节点根据子节点2所提供的模型更新信息ΔN _1,0,2将t0时刻的全局模型N ₀更新为t1时刻的全局模型N ₁。

在t2时刻，子节点1确定了本地局部模型相对于N ₀的模型更新信息为ΔN _2,0,1，并将该模型更新信息传输至主节点。这里，ΔN _2,0,1所对应信息可以是子节点1所期望的t2时刻的全局模型N ₂与t0时刻的全局模型N ₀之间的模型更新信息，例如该模型更新信息可以通过梯度信息等方式标识。存在上述更新信息需求的原因是子节点1所期望的t2时刻的全局模型N ₂与t0时刻的全局模型N ₀之间存在差别。

在t2时刻，主节点根据子节点1所提供的模型更新信息ΔN _2,0,1将t1时刻的全局模型N ₁更新为t2时刻的全局模型N ₂’。

上述过程的流程如图4所示，但此时问题也就显现出来了，因为ΔN _2,0,1是子节点1根据N ₀和N ₂所确定的，也就是说此时子节点1期望的是将全局模型从N ₀通过ΔN _2,0,1更新至子节点1期望的N ₂。这里，N ₂也可以写作N _2,0,1，N _2,0,1所对应的是子节点1在根据t0时刻的全局模型所期望的t2时刻的全局模型。主节点接收到ΔN _2,0,1后，由于此时主节点已经将全局模型更新为了N ₁，此时再直接利用ΔN _2,0,1将N ₁更新成为N ₂’是有问题的，因为此时在主节点的全局模型已经由N ₀变成了N ₁。通过分析可发现主节点直接利用ΔN _2,0,1将N ₁更新成为N ₂’的问题主要是因为ΔN _2,0,1提供的并不是基于N ₁的模型更新信息，而是基于N ₀的模型更新信息，基于此，本申请实施例针对上述基本方案进行了改进，提出了一种更为优化的全局模型更新方案，以下具体对其进行说明。

图5为本申请实施例提供的模型更新方法的流程示意图，如图5所示，所述模型更新方法包括以下步骤：

步骤501：主节点接收子节点发送的第一模型更新信息，其中，所述第一模型更新信息为所述子节点所期望的全局模型相对于第一全局模型的模型更新信息。

在一可选实施方式中，主节点接收一个子节点发送的第一模型更新信息。例如主节点接收子节点1发送的模型更新信息1，该模型更新信息1为子节点1所期望的全局模型相对于第一全局模型的模型更新信息。

在另一可选实施方式中，主节点接收多个子节点(如两个或更多的子节点)发送的多个第一模型更新信息。例如主节点接收子节点1发送的模型更新信息1，以及接收子节点2发送的模型更新信息2。其中，模型更新信息1为子节点1所期望的全局模型相对于第一全局模型的模型更新信息，模型更新信息2为子节点2所期望的全局模型相对于第一全局模型的模型更新信息。

本申请实施例中，所述第一全局模型为历史全局模型。在一可选方式中，所述第一全局模型为所述子节点最近一次采用的全局模型，或者为所述第一节点最近一次更新的本地模型。

步骤502：所述主节点根据所述第一模型更新信息和所述第一全局模型对第二全局模型进行更新，得到第三全局模型。

本申请实施例中，所述第二全局模型为当前全局模型，主节点需要根据所述第一模型更新信息和所述第一全局模型对当前全局模型进行更新，得到更新后的全局模型(即第三全局模型)。具体实现时，所述主节点可以通过以下任意一种方式对第二全局模型进行更新。

●方式一

1-1)所述主节点根据所述第一全局模型和所述第一模型更新信息，确定第四全局模型，其中，所述第四全局模型为所述子节点所期望的全局模型；1-2)所述主节点根据所述第四全局模型对第二全局模型进行更新，得到第三全局模型。

进一步，在一可选方式中，对于上述1-2)可以采用以下方式来实现：a1)所述主节点根据所述第四全局模型和所述第二全局模型确定第二模型更新信息，其中，所述第二模型更新信息为所述第四全局模型相对于所述第二全局模型的模型更新信息；b1)所述主节点根据所述第二模型更新信息对所述第二全局模型进行更新，得到第三全局模型。

进一步，在一可选方式中，对于上述b1)可以采用以下方式来实现：所述主节点将所述第二模型更新信息乘以第一参数和/或乘以第二参数后加上所述第二全局模型，得到第三全局模型；其中，所述第一参数代表所述子节点的权重因子，所述第二参数代表更新步长。

在一个示例中，参照图6，第一全局模型为N ₀(即t0时刻的全局模型)，第二全局模型为N ₁(即t1时刻的全局模型)，第一模型更新信息为ΔN _2,0,1(即子节点1所期望的t2时刻的全局模型相对于t0时刻的全局模型的模型更新信息)。当主节点在t2时刻接收到子节点1所确定的ΔN _2,0,1后，主节点利用ΔN _2,0,1、N ₀以及N ₁，确定更新后的全局模型N ₂(即第三全局模型)。这里，主节点利用ΔN _2,0,1、N ₀以及N ₁更新全局模型的具体流程如下：

1、主节点通过N ₀和ΔN _2,0,1确定N _2,0,1(即子节点1依据t0时刻的全局模型所期望的t2时刻的全局模型)。

2、主节点确定N _2,0,1与N ₁的区别为ΔN _2,1,1(即子节点1所期望的t2时刻的全局模型相对于t1时刻的全局模型的模型更新信息)。

3、主节点更新全局模型N ₂为N ₁+λP ₁*ΔN _2,1,1。

这里，λ是更新步长，P ₁是子节点1的权重因子，例如P ₁等于1/K，K为参与联邦学习的子节点数目。

更一般地，对于参与联邦学习的子节点(用户)的数目为多个的情况，可通过如下公式表述本申请上述实施例的原理：N _i＝N _j+λ∑ _k(P _kΔN _i,j,k)。

其中，k是参与联邦学习的子节点。

其中，P _k是子节点k的权重因子，反映子节点k对联邦学习的贡献大小。在一可选方式中，各个子节点可采用相同的权重因子，例如P _k＝1/K，K为参与联邦学习的子节点数目。在另一可选方式中，各个子节点可采用不同的权重因子，例如当不同子节点对于联邦学习的重要程度不同时(比如训练所采用的样本数据重要性不同)，各个子节点的权重因子就不同。

其中，ΔN _i,j,k是子节点k所期望的ti时刻的全局模型相对于tj时刻的全局模型(即N _j)的模型更新信息，也可以说，ΔN _i,j,k是在ti时刻子节点k所期望的针对tj时刻的全局模型所做的更新。

其中，λ是全局模型的更新步长。在一可选方式中，该更新补偿为预设的参数，例如λ＝1。

需要说明的是，N _x是tx时刻的全局模型，例如N _i是ti时刻的全局模型，N _j是tj时刻的全局模型。

上述方案中，ΔN _i,j,k可以通过以下方式确定：

1)确定N _i,p,k＝N _p+λP _kΔN _i,p,k。

这里，N _p为tp时刻的全局模型，ΔN _i,p,k为子节点k所期望的ti时刻的全局模型相对于tp时刻的全局模型的模型更新信息，N _i,p,k为子节点k依据tp时刻的全局模型所期望的ti时刻的全局模型。

通过上述公式可以看出：子节点k基于N _p和ΔN _i,p,k去更新tp时刻的全局模型后的结果为N _i,p,k。

2)确定ΔN _i,j,k＝(N _i,p,k-N _j)/(λP _k)。

这里，N _i,p,k为子节点k依据tp时刻的全局模型所期望的ti时刻的全局模型，N _j为tj时刻的全局模型，ΔN _i,j,k为子节点k所期望的ti时刻的全局模型相对于tj时刻的全局模型的模型更新信息。

通过上述公式可以看出：子节点k基于N _i,p,k和N _j可以确定ΔN _i,j,k。

●方式二

2-1)所述主节点根据所述第二全局模型和所述第一全局模型，确定第三模型更新信息，其中，所述第三模型更新信息为所述第二全局模型相对于所述第一全局模型的模型更新信息；2-2)所述主节点根据所述第三模型更新信息和所述第一模型更新信息对第二全局模型进行更新，得到第三全局模型。

进一步，在一可选方式中，对于上述2-2)可以采用以下方式来实现：a2)所述主节点根据所述第一模型更新信息和所述第三模型更新信息确定第四模型更新信息，其中，所述第四模型更新信息为所述子节点所期望的全局模型相对于第二全局模型的模型更新信息；b2)所述主节点根据所述第四模型更新信息对所述第二全局模型进行更新，得到第三全局模型。

进一步，在一可选方式中，对于上述a2)可以采用以下方式来实现：所述主节点将所述第一模型更新信息减去所述第三模型更新信息，得到第四模型更新信息。

进一步，在一可选方式中，对于上述b2)可以采用以下方式来实现：所述主节点将所述第四模型更新信息乘以第一参数和/或乘以第二参数后加上所述第二全局模型，得到第三全局模型；其中，所述第一参数代表所述子节点的权重因子，所述第二参数代表更新步长。

1、主节点确定N ₀与N ₁的区别为ΔN _1,0(即t1时刻的全局模型相对于t0时刻的全局模型的模型更新信息)。

2、主节点通过ΔN _1,0和ΔN _2,0,1确定ΔN _2,1,1(即子节点1所期望的t2时刻的全局模型相对于t1时刻的全局模型的模型更新信息)。

3、主节点更新全局模型N ₂为N ₁+λP ₁*ΔN _2,1,1。

其中，k是参与联邦学习的子节点。

上述方案中，ΔN _i,j,k可以通过以下方式确定：

1)确定ΔN _j,p＝N _j-N _p。

这里，N _j为tj时刻的全局模型，N _p为tp时刻的全局模型，ΔN _j,p为tj时刻的全局模型相对于tp时刻的全局模型的模型更新信息。

2)确定ΔN _i,j,k＝ΔN _i,p,k-ΔN _j,p。

这里，ΔN _i,p,k为子节点k所期望的ti时刻的全局模型相对于tp时刻的全局模型的模型更新信息，ΔN _j,p为tj时刻的全局模型相对于tp时刻的全局模型的模型更新信息，ΔN _i,j,k为子节点k所期望的ti时刻的全局模型相对于tj时刻的全局模型的模型更新信息，

通过上述公式可以看出：子节点k基于ΔN _i,p,k和ΔN _j,p确定ΔN _i,j,k。例如：ΔN _2,1,1＝ΔN _2,0,1-ΔN _1,0。

本申请实施例的上述技术方案，主节点更新全局模型时，不仅仅需要子节点提供模型更新信息，而且还需要子节点提供上述模型更新信息所对应的待更新的全局模型(即第一全局模型)的信息，或者说需要子节点反馈该子节点生成模型更新信息所依据的本地模型(即第一全局模型)的信息，本申请实施例简称上述信息为模型参考版本信息。据此，本申请实施例的技术方案还包括：所述主节点接收所述子节点发送的所述第一模型更新信息对应的模型参考版本信息，所述模型参考版本信息用于确定所述第一全局模型。在一可选方式中，所述模型参考版本信息包括以下至少之一：全局模型的版本号、全局模型对应的时序号。这里，全局模型对应的时序号是指全局模型在主节点侧生成(或者更新)的时间或者主节点下发全局模型的时间。

上述模型参考版本信息由子节点传输至主节点。在一可选方式中，所述主节点为网络设备(如基站)，所述子节点为终端设备的情况下，所述模型参考版本信息由所述终端设备通过以下至少之一传输给所述网络设备：应用层消息、非接入层(Non Access Statum，NAS)信令、无线资源控制(Radio Resource Control，RRC)信令、媒体接入控制控制单元(Media Access Control Control Element，MAC CE)、上行控制信息(Uplink Control Information，UCI)、物理上行共享信道(Physical Uplink Shared Channel，PUSCH)、物理上行控制信道(Physical Uplink Control Channel，PUCCH)。在另一可选方式中，所述主节点为第一终端设备，所述子节点为第二终端设备的情况下，所述模型参考版本信息由所述第二终端设备通过PC5接口消息输给所述第一终端设备。进一步，可选地，所述PC5接口消息包括以下至少之一：物理侧行链路共享信道(Physical Sidelink Shared Channel，PSSCH)、物理侧行链路控制信道(Physical Sidelink Control Channel，PSCCH)、侧行链路控制信息(Sidelink Control Information，SCI)。

参照图7，在t0时刻，主节点将t0时刻的全局模型传输至子节点1和子节点2，供其使用。在t1时刻，子节点2反馈模型更新信息和模型参考版本信息给主节点，主节点利用模型更新信息和模型参考版本信息更新全局模型。在t2时刻，子节点1反馈模型更新信息和模型参考版本信息给主节点，主节点利用模型更新信息和模型参考版本信息更新全局模型。

本申请实施例的上述技术方案，主节点可以配置子节点是否需要传输上述模型参考版本信息。据此，本申请实施例的技术方案还包括：所述主节点向所述子节点发送第一配置信息，所述第一配置信息用于指示所述子节点是否传输模型参考版本信息给所述主节点。

上述第一配置信息由主节点传输至子节点。在一可选方式中，所述主节点为网络设备(如基站)，所述子节点为终端设备的情况下，所述第一配置信息由所述基站通过以下至少之一传输给所述终端设备：应用层消息、NAS信令、广播消息、RRC消息、MAC CE、下行控制信息(Downlink Control Information，DCI)、物理下行共享信道(Physical Downlink Shared Channel，PDSCH)、物理下行控制信道(hysical Downlink Control Channel，PDCCH)。在另一可选方式中，所述主节点为第一终端设备，所述子节点为第二终端设备的情况下，所述第一配置信息由所述第一终端设备通过PC5接口消息输给所述第二终端设备。进一步，可选地，所述PC5接口消息包括以下至少之一：PSSCH、PSCCH、SCI。

本申请实施例的技术方案，给出一种联邦学习中模型更新的方法，具体包括：参与联邦学习的多个子节点非同步地上报各自的模型更新信息，参与联邦学习的主节点根据接收到的模型更新信息，以及根据该模型更新信息所依据的全局模型的特征，以及根据当前主节点待更新的全局模型的特征，更新当前主节点待更新的全局模型。进一步，子节点上报主节点的信息除了模型更新信息外，还可包括子节点反馈模型更新信息所依据的全局模型的特征(例如全局模型的版本信息)。通过上述方案，给出一种联邦学习中处理非同步条件下联邦学习训练效率受限问题的方法，通过具体的模型更新算法，并考虑了模型更新所涉及的历史全局模型的影响，从而进一步避免非同步更新联邦学习全局模型时的性能降低问题。此外，考虑到联邦学习在不同网络节点直接应用时所需要的空口传输需求，以及上述联邦学习算法特征，在网络传输过程中也相应增加了上述模型更新所需的模型参考版本信息，用于分布式场景下能够顺利完成上述模型更新方案。

图8为本申请实施例提供的模型更新装置的结构组成示意图，应用于主节点，如图8所示，所述模型更新装置包括：

接收单元801，用于接收子节点发送的第一模型更新信息，其中，所述第一模型更新信息为所述子节点所期望的全局模型相对于第一全局模型的模型更新信息；

更新单元802，用于根据所述第一模型更新信息和所述第一全局模型对第二全局模型进行更新，得到第三全局模型。

在一可选方式中，所述更新单元802，用于根据所述第一全局模型和所述第一模型更新信息，确定第四全局模型，其中，所述第四全局模型为所述子节点所期望的全局模型；根据所述第四全局模型对第二全局模型进行更新，得到第三全局模型。

在一可选方式中，所述更新单元802，用于根据所述第四全局模型和所述第二全局模型确定第二模型更新信息，其中，所述第二模型更新信息为所述第四全局模型相对于所述第二全局模型的模型更新信息；根据所述第二模型更新信息对所述第二全局模型进行更新，得到第三全局模型。

在一可选方式中，所述更新单元802，用于将所述第二模型更新信息乘以第一参数和/或乘以第二参数后加上所述第二全局模型，得到第三全局模型；

其中，所述第一参数代表所述子节点的权重因子，所述第二参数代表更新步长。

在一可选方式中，所述更新单元802，用于根据所述第二全局模型和所述第一全局模型，确定第三模型更新信息，其中，所述第三模型更新信息为所述第二全局模型相对于所述第一全局模型的模型更新信息；根据所述第三模型更新信息和所述第一模型更新信息对第二全局模型进行更新，得到第三全局模型。

在一可选方式中，所述更新单元802，用于根据所述第一模型更新信息和所述第三模型更新信息确定第四模型更新信息，其中，所述第四模型更新信息为所述子节点所期望的全局模型相对于第二全局模型的模型更新信息；根据所述第四模型更新信息对所述第二全局模型进行更新，得到第三全局模型。

在一可选方式中，所述更新单元802，用于将所述第一模型更新信息减去所述第三模型更新信息，得到第四模型更新信息。

在一可选方式中，所述更新单元802，用于将所述第四模型更新信息乘以第一参数和/或乘以第二参数后加上所述第二全局模型，得到第三全局模型；

在一可选方式中，所述第一全局模型为所述子节点最近一次采用的全局模型，或者为所述第一节点最近一次更新的本地模型。

在一可选方式中，所述接收单元801，还用于接收所述子节点发送的所述第一模型更新信息对应的模型参考版本信息，所述模型参考版本信息用于确定所述第一全局模型。

在一可选方式中，所述模型参考版本信息包括以下至少之一：全局模型的版本号、全局模型对应的时序号。

在一可选方式中，所述主节点为网络设备，所述子节点为终端设备的情况下，

所述模型参考版本信息由所述终端设备通过以下至少之一传输给所述网络设备：应用层消息、NAS信令、RRC信令、MAC CE、UCI、PUSCH、PUCCH。

在一可选方式中，所述主节点为第一终端设备，所述子节点为第二终端设备的情况下，

所述模型参考版本信息由所述第二终端设备通过PC5接口消息输给所述第一终端设备。

在一可选方式中，所述装置还包括：

发送单元(图中未示出)，用于向所述子节点发送第一配置信息，所述第一配置信息用于指示所述子节点是否传输模型参考版本信息给所述主节点。

所述第一配置信息由所述基站通过以下至少之一传输给所述终端设备：应用层消息、NAS信令、广播消息、RRC消息、MAC CE、DCI、PDSCH、PDCCH。

所述第一配置信息由所述第一终端设备通过PC5接口消息输给所述第二终端设备。

在一可选方式中，所述PC5接口消息包括以下至少之一：PSSCH、PSCCH、SCI。

本领域技术人员应当理解，本申请实施例的上述MCS配置装置的相关描述可以参照本申请实施例的模型更新方法的相关描述进行理解。

图9是本申请实施例提供的一种通信设备900示意性结构图。该通信设备可以是主节点，该主节点可以是终端设备或者网络设备(如基站)，图9所示的通信设备900包括处理器910，处理器910可以从存储器中调用并运行计算机程序，以实现本申请实施例中的方法。

可选地，如图9所示，通信设备900还可以包括存储器920。其中，处理器910可以从存储器920中调用并运行计算机程序，以实现本申请实施例中的方法。

其中，存储器920可以是独立于处理器910的一个单独的器件，也可以集成在处理器910中。

可选地，如图9所示，通信设备900还可以包括收发器930，处理器910可以控制该收发器930与其他设备进行通信，具体地，可以向其他设备发送信息或数据，或接收其他设备发送的信息或数据。

其中，收发器930可以包括发射机和接收机。收发器930还可以进一步包括天线，天线的数量可以为一个或多个。

可选地，该通信设备900具体可为本申请实施例的网络设备，并且该通信设备900可以实现本申请实施例的各个方法中由网络设备实现的相应流程，为了简洁，在此不再赘述。

可选地，该通信设备900具体可为本申请实施例的移动终端/终端设备，并且该通信设备900可以实现本申请实施例的各个方法中由移动终端/终端设备实现的相应流程，为了简洁，在此不再赘述。

图10是本申请实施例的芯片的示意性结构图。图10所示的芯片1000包括处理器1010，处理器1010可以从存储器中调用并运行计算机程序，以实现本申请实施例中的方法。

可选地，如图10所示，芯片1000还可以包括存储器1020。其中，处理器1010可以从存储器1020中调用并运行计算机程序，以实现本申请实施例中的方法。

其中，存储器1020可以是独立于处理器1010的一个单独的器件，也可以集成在处理器1010中。

可选地，该芯片1000还可以包括输入接口1030。其中，处理器1010可以控制该输入接口1030与其他设备或芯片进行通信，具体地，可以获取其他设备或芯片发送的信息或数据。

可选地，该芯片1000还可以包括输出接口1040。其中，处理器1010可以控制该输出接口1040与其他设备或芯片进行通信，具体地，可以向其他设备或芯片输出信息或数据。

可选地，该芯片可应用于本申请实施例中的网络设备，并且该芯片可以实现本申请实施例的各个方法中由网络设备实现的相应流程，为了简洁，在此不再赘述。

可选地，该芯片可应用于本申请实施例中的移动终端/终端设备，并且该芯片可以实现本申请实施例的各个方法中由移动终端/终端设备实现的相应流程，为了简洁，在此不再赘述。

应理解，本申请实施例提到的芯片还可以称为***级芯片，***芯片，芯片***或片上***芯片等。

图11是本申请实施例提供的一种通信***1100的示意性框图。如图11所示，该通信***1100包括终端设备1110和网络设备1120。

其中，该终端设备1110可以用于实现上述方法中由终端设备实现的相应的功能，以及该网络设备1120可以用于实现上述方法中由网络设备实现的相应的功能为了简洁，在此不再赘述。

应理解，本申请实施例的处理器可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法实施例的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法的步骤。

可以理解，本申请实施例中的存储器可以是易失性存储器或非易失性存储器，或可包括易失性和非易失性存储器两者。其中，非易失性存储器可以是只读存储器(Read-Only Memory，ROM)、可编程只读存储器(Programmable ROM，PROM)、可擦除可编程只读存储器(Erasable PROM，EPROM)、电可擦除可编程只读存储器(Electrically EPROM，EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory，RAM)，其用作外部高速缓存。通过示例性但不是限制性说明，许多形式的RAM可用，例如静态随机存取存储器(Static RAM，SRAM)、动态随机存取存储器(Dynamic RAM，DRAM)、同步动态随机存取存储器(Synchronous DRAM，SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data Rate SDRAM，DDR SDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM，ESDRAM)、同步连接动态随机存取存储器(Synchlink DRAM，SLDRAM)和直接内存总线随机存取存储器(Direct Rambus RAM，DR RAM)。应注意，本文描述的***和方法的存储器旨在包括但不限于这些和任意其它适合类型的存储器。

应理解，上述存储器为示例性但不是限制性说明，例如，本申请实施例中的存储器还可以是静态随机存取存储器(static RAM，SRAM)、动态随机存取存储器(dynamic RAM，DRAM)、同步动态随机存取存储器(synchronous DRAM，SDRAM)、双倍数据速率同步动态随机存取存储器(double data rate SDRAM，DDR SDRAM)、增强型同步动态随机存取存储器(enhanced SDRAM，ESDRAM)、同步连接动态随机存取存储器(synch link DRAM，SLDRAM)以及直接内存总线随机存取存储器(Direct Rambus RAM，DR RAM)等等。也就是说，本申请实施例中的存储器旨在包括但不限于这些和任意其它适合类型的存储器。

本申请实施例还提供了一种计算机可读存储介质，用于存储计算机程序。

可选的，该计算机可读存储介质可应用于本申请实施例中的网络设备，并且该计算机程序使得计算机执行本申请实施例的各个方法中由网络设备实现的相应流程，为了简洁，在此不再赘述。

可选地，该计算机可读存储介质可应用于本申请实施例中的移动终端/终端设备，并且该计算机程序使得计算机执行本申请实施例的各个方法中由移动终端/终端设备实现的相应流程，为了简洁，在此不再赘述。

本申请实施例还提供了一种计算机程序产品，包括计算机程序指令。

可选的，该计算机程序产品可应用于本申请实施例中的网络设备，并且该计算机程序指令使得计算机执行本申请实施例的各个方法中由网络设备实现的相应流程，为了简洁，在此不再赘述。

可选地，该计算机程序产品可应用于本申请实施例中的移动终端/终端设备，并且该计算机程序指令使得计算机执行本申请实施例的各个方法中由移动终端/终端设备实现的相应流程，为了简洁，在此不再赘述。

本申请实施例还提供了一种计算机程序。

可选的，该计算机程序可应用于本申请实施例中的网络设备，当该计算机程序在计算机上运行时，使得计算机执行本申请实施例的各个方法中由网络设备实现的相应流程，为了简洁，在此不再赘述。

可选地，该计算机程序可应用于本申请实施例中的移动终端/终端设备，当该计算机程序在计算机上运行时，使得计算机执行本申请实施例的各个方法中由移动终端/终端设备实现的相应流程，为了简洁，在此不再赘述。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的***、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的***、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个***，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-Only Memory，)ROM、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应所述以权利要求的保护范围为准。

Claims

一种模型更新方法，所述方法包括：

主节点接收子节点发送的第一模型更新信息，其中，所述第一模型更新信息为所述子节点所期望的全局模型相对于第一全局模型的模型更新信息；

所述主节点根据所述第一模型更新信息和所述第一全局模型对第二全局模型进行更新，得到第三全局模型。
根据权利要求1所述的方法，其中，所述主节点根据所述第一模型更新信息和所述第一全局模型对第二全局模型进行更新，得到第三全局模型，包括：

所述主节点根据所述第一全局模型和所述第一模型更新信息，确定第四全局模型，其中，所述第四全局模型为所述子节点所期望的全局模型；

所述主节点根据所述第四全局模型对第二全局模型进行更新，得到第三全局模型。
根据权利要求2所述的方法，其中，所述主节点根据所述第四全局模型对第二全局模型进行更新，得到第三全局模型，包括：

所述主节点根据所述第四全局模型和所述第二全局模型确定第二模型更新信息，其中，所述第二模型更新信息为所述第四全局模型相对于所述第二全局模型的模型更新信息；

所述主节点根据所述第二模型更新信息对所述第二全局模型进行更新，得到第三全局模型。
根据权利要求3所述的方法，其中，所述主节点根据所述第二模型更新信息对所述第二全局模型进行更新，得到第三全局模型，包括：

所述主节点将所述第二模型更新信息乘以第一参数和/或乘以第二参数后加上所述第二全局模型，得到第三全局模型；

其中，所述第一参数代表所述子节点的权重因子，所述第二参数代表更新步长。
根据权利要求1所述的方法，其中，所述主节点根据所述第一模型更新信息和所述第一全局模型对第二全局模型进行更新，得到第三全局模型，包括：

所述主节点根据所述第二全局模型和所述第一全局模型，确定第三模型更新信息，其中，所述第三模型更新信息为所述第二全局模型相对于所述第一全局模型的模型更新信息；

所述主节点根据所述第三模型更新信息和所述第一模型更新信息对第二全局模型进行更新，得到第三全局模型。
根据权利要求5所述的方法，其中，所述主节点根据所述第三模型更新信息和所述第一模型更新信息对第二全局模型进行更新，得到第三全局模型，包括：

所述主节点根据所述第一模型更新信息和所述第三模型更新信息确定第四模型更新信息，其中，所述第四模型更新信息为所述子节点所期望的全局模型相对于第二全局模型的模型更新信息；

所述主节点根据所述第四模型更新信息对所述第二全局模型进行更新，得到第三全局模型。
根据权利要求6所述的方法，其中，所述主节点根据所述第一模型更新信息和所述第三模型更新信息确定第四模型更新信息，包括：

所述主节点将所述第一模型更新信息减去所述第三模型更新信息，得到第四模型更新信息。
根据权利要求6或7所述的方法，其中，所述主节点根据所述第四模型更新信息对所述第二全局模型进行更新，得到第三全局模型，包括：

所述主节点将所述第四模型更新信息乘以第一参数和/或乘以第二参数后加上所述第二全局模型，得到第三全局模型；

其中，所述第一参数代表所述子节点的权重因子，所述第二参数代表更新步长。
根据权利要求1至8中任一项所述的方法，其中，所述第一全局模型为所述子节点最近一次采用的全局模型，或者为所述第一节点最近一次更新的本地模型。
根据权利要求1至9中任一项所述的方法，其中，所述方法还包括：

所述主节点接收所述子节点发送的所述第一模型更新信息对应的模型参考版本信息，所述模型参考版本信息用于确定所述第一全局模型。
根据权利要求10所述的方法，其中，所述模型参考版本信息包括以下至少之一：全局模型的版本号、全局模型对应的时序号。
根据权利要求10或11所述的方法，其中，所述主节点为网络设备，所述子节点为终端设备的情况下，

所述模型参考版本信息由所述终端设备通过以下至少之一传输给所述网络设备：应用层消息、非接入层NAS信令、无线资源控制RRC信令、媒体接入控制控制单元MAC CE、上行控制信息UCI、物理上行共享信道PUSCH、物理上行控制信道PUCCH。
根据权利要求10或11所述的方法，其中，所述主节点为第一终端设备，所述子节点为第二终端设备的情况下，

所述模型参考版本信息由所述第二终端设备通过PC5接口消息输给所述第一终端设备。
根据权利要求10至13中任一项所述的方法，其中，所述方法还包括：

所述主节点向所述子节点发送第一配置信息，所述第一配置信息用于指示所述子节点是否传输模型参考版本信息给所述主节点。
根据权利要求14所述的方法，其中，所述主节点为网络设备，所述子节点为终端设备的情况下，

所述第一配置信息由所述基站通过以下至少之一传输给所述终端设备：应用层消息、NAS信令、广播消息、RRC消息、MAC CE、下行控制信息DCI、物理下行共享信道PDSCH、物理下行控制信道PDCCH。
根据权利要求14所述的方法，其中，所述主节点为第一终端设备，所述子节点为第二终端设备的情况下，

所述第一配置信息由所述第一终端设备通过PC5接口消息输给所述第二终端设备。
根据权利要求13或16所述的方法，其中，所述PC5接口消息包括以下至少之一：物理侧行链路共享信道PSSCH、物理侧行链路控制信道PSCCH、侧行链路控制信息SCI。
一种模型更新装置，应用于主节点，所述装置包括：

接收单元，用于接收子节点发送的第一模型更新信息，其中，所述第一模型更新信息为所述子节点所期望的全局模型相对于第一全局模型的模型更新信息；

更新单元，用于根据所述第一模型更新信息和所述第一全局模型对第二全局模型进行更新，得到第三全局模型。
根据权利要求18所述的装置，其中，所述更新单元，用于根据所述第一全局模型和所述第一模型更新信息，确定第四全局模型，其中，所述第四全局模型为所述子节点所期望的全局模型；根据所述第四全局模型对第二全局模型进行更新，得到第三全局模型。
根据权利要求19所述的装置，其中，所述更新单元，用于根据所述第四全局模型和所述第二全局模型确定第二模型更新信息，其中，所述第二模型更新信息为所述第四全局模型相对于所述第二全局模型的模型更新信息；根据所述第二模型更新信息对所述第二全局模型进行更新，得到第三全局模型。
根据权利要求20所述的装置，其中，所述更新单元，用于将所述第二模型更新信息乘以第一参数和/或乘以第二参数后加上所述第二全局模型，得到第三全局模型；

其中，所述第一参数代表所述子节点的权重因子，所述第二参数代表更新步长。
根据权利要求18所述的装置，其中，所述更新单元，用于根据所述第二全局模型和所述第一全局模型，确定第三模型更新信息，其中，所述第三模型更新信息为所述第二全局模型相对于所述第一全局模型的模型更新信息；根据所述第三模型更新信息和所述第一模型更新信息对第二全局模型进行更新，得到第三全局模型。
根据权利要求22所述的装置，其中，所述更新单元，用于根据所述第一模型更新信息和所述第三模型更新信息确定第四模型更新信息，其中，所述第四模型更新信息为所述子节点所期望的全局模型相对于第二全局模型的模型更新信息；根据所述第四模型更新信息对所述第二全局模型进行更新，得到第三全局模型。
根据权利要求23所述的装置，其中，所述更新单元，用于将所述第一模型更新信息减去所述第三模型更新信息，得到第四模型更新信息。
根据权利要求23所述的装置，其中，所述更新单元，用于将所述第四模型更新信息乘以第一参数和/或乘以第二参数后加上所述第二全局模型，得到第三全局模型；

其中，所述第一参数代表所述子节点的权重因子，所述第二参数代表更新步长。
根据权利要求18至25中任一项所述的装置，其中，所述第一全局模型为所述子节点最近一次采用的全局模型，或者为所述第一节点最近一次更新的本地模型。
根据权利要求18至26中任一项所述的装置，其中，所述接收单元，还用于接收所述子节点发送的所述第一模型更新信息对应的模型参考版本信息，所述模型参考版本信息用于确定所述第一全局模型。
根据权利要求27所述的装置，其中，所述模型参考版本信息包括以下至少之一：全局模型的版本号、全局模型对应的时序号。
根据权利要求27或28所述的装置，其中，所述主节点为网络设备，所述子节点为终端设备的情况下，

所述模型参考版本信息由所述终端设备通过以下至少之一传输给所述网络设备：应用层消息、NAS信令、RRC信令、MAC CE、UCI、PUSCH、PUCCH。
根据权利要求27或28所述的装置，其中，所述主节点为第一终端设备，所述子节点为第二终端设备的情况下，

所述模型参考版本信息由所述第二终端设备通过PC5接口消息输给所述第一终端设备。
根据权利要求27至30中任一项所述的装置，其中，所述装置还包括：

发送单元，用于向所述子节点发送第一配置信息，所述第一配置信息用于指示所述子节点是否传输模型参考版本信息给所述主节点。
根据权利要求31所述的装置，其中，所述主节点为网络设备，所述子节点为终端设备的情况下，

所述第一配置信息由所述基站通过以下至少之一传输给所述终端设备：应用层消息、NAS信令、广播消息、RRC消息、MAC CE、DCI、PDSCH、PDCCH。
根据权利要求31所述的装置，其中，所述主节点为第一终端设备，所述子节点为第二终端设备的情况下，

所述第一配置信息由所述第一终端设备通过PC5接口消息输给所述第二终端设备。
根据权利要求30或33所述的装置，其中，所述PC5接口消息包括以下至少之一：PSSCH、PSCCH、SCI。
一种通信设备，包括：处理器和存储器，该存储器用于存储计算机程序，所述处理器用于调用并运行所述存储器中存储的计算机程序，执行如权利要求1至17中任一项所述的方法。
一种芯片，包括：处理器，用于从存储器中调用并运行计算机程序，使得安装有所述芯片的设备执行如权利要求1至17中任一项所述的方法。
一种计算机可读存储介质，用于存储计算机程序，所述计算机程序使得计算机执行如权利要求1至17中任一项所述的方法。
一种计算机程序产品，包括计算机程序指令，该计算机程序指令使得计算机执行如权利要求1至17中任一项所述的方法。
一种计算机程序，所述计算机程序使得计算机执行如权利要求1至17中任一项所述的方法。