WO2023134065A1

WO2023134065A1 - 梯度压缩方法、装置、设备及存储介质

Info

Publication number: WO2023134065A1
Application number: PCT/CN2022/089866
Authority: WO
Inventors: 李泽远; 王健宗
Original assignee: 平安科技（深圳）有限公司
Priority date: 2022-01-14
Filing date: 2022-04-28
Publication date: 2023-07-20
Also published as: CN114386622A

Abstract

本申请涉及人工智能，提供一种基于联邦学习的梯度压缩方法、装置、设备及存储介质，即将待传输梯度数据中梯度值不小于预设梯度阈值的梯度数据作为第一梯度数据；将所述待传输梯度数据中除所述第一梯度数据之外的梯度数据作为第二梯度数据，并根据2比特位压缩策略或4比特位压缩策略将所述第二梯度数据中的每个梯度数据进行压缩；将所述第一梯度数据以及压缩后的第二梯度数据上传至服务器。本发明根据梯度值的大小，筛选出重要度高的第一梯度数据，将重要度高的梯度数据完整上传，并将重要度较低的第二梯度数据按照相应压缩策略进行压缩。在保证模型建模准确性的同时，降低了传输梯度的数据量，提高了梯度传输效率。

Description

梯度压缩方法、装置、设备及存储介质

本申请要求于2022年01月14日提交中国专利局、申请号为2022100442162，发明名称为“梯度压缩方法、装置、设备及存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本发明涉及数据处理技术领域，尤其涉及一种基于联邦学习的梯度压缩方法、装置、设备及计算机可读存储介质。

背景技术

联邦学***均处理后将得到的全局梯度后返回给各客户端实体，以使个客户端实体进行模型的训练。

联邦学习的出现为数据共享需求和隐私保护要求之间提供了一种新的解决方向，因此受到了越来越多的关注。但发明人意识到联邦学习的联合建模过程中，随着客户端的增加，联邦服务器与客户端之间的需要传输的梯度数据量也随之增大。因此，如何解决联邦学习建模过程中传输梯度数据量大导致的梯度传输效率低下的问题，成为了目前亟待解决的技术问题。

发明内容

本发明的主要目的在于提供一种基于联邦学习的梯度压缩方法、装置、设备及计算机可读存储介质，旨在解决联邦学习建模过程中传输梯度数据量大导致的梯度传输效率低下的技术问题。

为实现上述目的，本发明提供一种基于联邦学习的梯度压缩方法，所述方法包括：获取待传输梯度数据，并将所述待传输梯度数据中梯度值不小于预设梯度阈值的梯度数据作为第一梯度数据；将所述待传输梯度数据中除所述第一梯度数据之外的梯度数据作为第二梯度数据，并根据2比特位压缩策略或4比特位压缩策略将所述第二梯度数据中的每个梯度数据进行压缩；将所述第一梯度数据以及压缩后的第二梯度数据上传至服务器。

此外，为实现上述目的，本发明还提供一种基于联邦学习的梯度压缩装置，所述装置包括：梯度数据获取模块，用于获取待传输梯度数据，并将所述待传输梯度数据中梯度值不小于预设梯度阈值的梯度数据作为第一梯度数据；梯度数据压缩模块，用于将所述待传输梯度数据中除所述第一梯度数据之外的梯度数据作为第二梯度数据，并根据2比特位压缩策略或4比特位压缩策略将所述第二梯度数据中的每个梯度数据进行压缩；梯度数据上传模块，用于将所述第一梯度数据以及压缩后的第二梯度数据上传至服务器。

此外，为实现上述目的，本发明还提供一种基于联邦学习的梯度压缩设备，所述基于联邦学习的梯度压缩设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的基于联邦学习的梯度压缩程序，其中所述基于联邦学习的梯度压缩程序被所述处理器执行时，实现：

获取待传输梯度数据，并将所述待传输梯度数据中梯度值不小于预设梯度阈值的梯度数据作为第一梯度数据；

将所述待传输梯度数据中除所述第一梯度数据之外的梯度数据作为第二梯度数据，并根据2比特位压缩策略或4比特位压缩策略将所述第二梯度数据中的每个梯度数据进行压缩；

将所述第一梯度数据以及压缩后的第二梯度数据上传至服务器。

此外，为实现上述目的，本发明还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有基于联邦学习的梯度压缩程序，其中所述基于联邦学习的梯度压缩程序被处理器执行时，实现：

本发明提供一种基于联邦学习的梯度压缩方法，所述方法包括：获取待传输梯度数据，并将所述待传输梯度数据中梯度值不小于预设梯度阈值的梯度数据作为第一梯度数据；将所述待传输梯度数据中除所述第一梯度数据之外的梯度数据作为第二梯度数据，并根据2比特位压缩策略或4比特位压缩策略将所述第二梯度数据中的每个梯度数据进行压缩；将所述第一梯度数据以及压缩后的第二梯度数据上传至服务器。通过上述方式，本发明根据梯度值的大小，筛选出重要度高的第一梯度数据，然后将重要度高的梯度数据完整上传，并将重要度较低的第二梯度数据按照2比特位压缩策略或4比特位压缩策略进行压缩。由此，在保证模型建模准确性的同时，降低了传输梯度的数据量，提高了梯度传输效率，解决了现有联邦学习建模过程中传输梯度数据量大导致的梯度传输效率低下的技术问题。

附图说明

图1为本发明实施例方案中涉及的基于联邦学习的梯度压缩设备的硬件结构示意图；

图2为本发明基于联邦学习的梯度压缩方法第一实施例的流程示意图；

图3为本发明基于联邦学习的梯度压缩装置第一实施例的功能模块示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

本发明实施例涉及的基于联邦学习的梯度压缩方法主要应用于基于联邦学习的梯度压缩设备，该基于联邦学习的梯度压缩设备可以是PC、便携计算机、移动终端等具有显示和处理功能的设备。

参照图1，图1为本发明实施例方案中涉及的基于联邦学习的梯度压缩设备的硬件结构示意图。本发明实施例中，基于联邦学习的梯度压缩设备可以包括处理器1001(例如CPU)，通信总线1002，用户接口1003，网络接口1004，存储器1005。其中，通信总线1002用于实现这些组件之间的连接通信；用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard)；网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)；存储器1005可以是高速RAM存储器，也可以是稳定的存储器(non-volatile memory)，例如磁盘存储器，存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解，图1中示出的硬件结构并不构成对基于联邦学习的梯度压缩设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

继续参照图1，图1中作为一种计算机可读存储介质的存储器1005可以包括操作***、网络通信模块以及基于联邦学习的梯度压缩程序。

在图1中，网络通信模块主要用于连接服务器，与服务器进行数据通信；而处理器1001可以调用存储器1005中存储的基于联邦学习的梯度压缩程序，并执行本发明实施例提供的基于联邦学习的梯度压缩方法。

本发明实施例提供了一种基于联邦学习的梯度压缩方法。

参照图2，图2为本发明基于联邦学习的梯度压缩方法第一实施例的流程示意图。

本实施例中，所述基于联邦学习的梯度压缩方法包括以下步骤：

步骤S10,获取待传输梯度数据，并将所述待传输梯度数据中梯度值不小于预设梯度阈值的梯度数据作为第一梯度数据；

为了解决上传完整梯度导致的联邦学习建模过程中传输梯度数据量大导致的梯度传输效率低下的问题，本实施例基于梯度数据的梯度值筛选出重要梯度数据，即第一梯度数据，并将重要梯度数据完整上传，由此提高建模的准确性，将剩余非重要梯度数据，即第二梯度数据，按照压缩策略进行压缩，由此降低了传输梯度的数据量。

具体地，在不同模型对应的梯度数据，或同一模型中的不同网络层对应的梯度数据，获取一模型的一网络层对应的梯度数据，作为待传输梯度数据。计算所述待传输数据中各个梯度数据的梯度值，即梯度数据的绝对值，将各个梯度数据的梯度值与预先设置的梯度阈值进行比对。其中，梯度阈值可根据实际模型的重要梯度数据对应的梯度值确定。将所述待传输梯度数据中梯度值不小于预设梯度阈值的梯度数据，及重要梯度数据，作为第一梯度数据。由此，通过梯度数据的梯度值筛选出重要梯度数据以及非重要梯度数据。

示例性的，所述获取待传输梯度数据，并将所述待传输梯度数据中梯度值不小于预设梯度阈值的梯度数据作为第一梯度数据的步骤之后，还包括：

在所述第一梯度数据的数据量超过所述数据量阈值时，将所述待传输梯度数据中的各个梯度数据按照梯度值进行排序；

在排序后的各个梯度数据中获取目标数据量的梯度数据，作为更新后的第一梯度数据，其中，所述目标数据量不大于所述数据量阈值。

本实施例中，为了防止第一梯度数据的数据量过大，在确定第一梯度数据后，将所述待传输数据的数据量与预先设置的数据量阈值进行对比。其中，数据量阈值为根据实际传输资源进行设置，在传输资源较大时，可将数据量阈值设置较大，在传输资源较小时，可将数据量阈值设置较小。在第一梯度的数据量超过数据量阈值时，可根据Top-K方法，将第一梯度数据中的各个梯度数据按照梯度值的降序或升序进行排序。在将第一梯度数据中的各个梯度数据按照梯度值的降序(即按照梯度值的由大到小的顺序)进行排序时，或在将第一梯度数据中的各个梯度数据按照梯度值的升序(即按照梯度值的由小到大的顺序)进行排序时，根据目标数据量，在排序后的各个梯度数据中获取梯度值最大的k条梯度数据，其中，梯度值最大的k条梯度数据的数据量不大于所述目标数据量。由此，将需要完整上传的第一梯度数据进行更新，避免第一梯度数据的数据量过大导致建模开销增加。在所述第一梯度数据的数据量小于所述数据量阈值时，则无需进行梯度数据筛选，直接将所述第一梯度数据进行完整上传即可。

步骤S20，将所述待传输梯度数据中除所述第一梯度数据之外的梯度数据作为第二梯度数据，并根据2比特位压缩策略或4比特位压缩策略将所述第二梯度数据中的每个梯度数据进行压缩；

本实施例中，将所述待传输梯度数据中除所述第一梯度数据之外的梯度数据，作为第二梯度数据，即非重要梯度数据。根据压缩策略，将所述第一梯度数据中的各个梯度数据压缩为2bit(比特位)或4bit。其中，2比特位压缩策略包含3个阈值，3个阈值包括0、一个设定的正数阈值及其相反数，将小于该设定阈值的梯度数据压缩为0，将不小于该阈值的梯度数据压缩为该阈值。4比特位压缩策略包含15个阈值，15个阈值包括0、7个设定的正数阈值及其相反数(例如，-7，-6，-5，-4，-3，-2，-1，0，1，2，3，4，5，6，7)，并将各个梯度数据压缩为对应的压缩阈值。由此，牺牲非重要梯度数据的部分精度来降低通信开销。

示例性的，所述根据2比特位压缩策略或4比特位压缩策略将所述第二梯度数据中的每个梯度数据进行压缩的步骤具体包括：

在所述第二梯度数据的方差不小于预设方差阈值时，根据所述4比特位压缩策略将所述第二梯度数据中的每个梯度数据进行压缩；

在所述第二梯度数据的方差小于所述方差阈值时，根据所述2比特位压缩策略将所述第二梯度数据中的每个梯度数据进行压缩。

本实施例中，在所述第二梯度数据的方差小于所述方差阈值时，即表示第二梯度数据的波动性较小，可采用2比特位压缩策略对第二梯度数据中的各梯度数据进行压缩。将2比特位划分位符号位和数值位，首位为符号位，另外一位为数值位。符号位里0代表正数，1代表负数。在第二梯度数据的方差不小于预设方差阈值时，即表示第二梯度数据的波动性较大。而2比特位压缩策略仅包含3个阈值，将第二梯度数据压缩为0或设定阈值，极大降低了梯度数据的精度。因此，在第二梯度数据方差不小于所述方差阈值时，采用4比特位压缩策略(包含15个阈值)对第二梯度数据中的各梯度数据进行压缩。将4比特位划分位符号位和数值位，首位为符号位，其余为数值位。符号位里0代表正数，1代表负数，3位数值位存储压缩后的数值。此4位比特位即为梯度压缩后的压缩值。

示例性的，所述根据所述2比特位压缩策略将所述第二梯度数据中的每个梯度数据进行压缩的步骤包括：

将所述第二梯度数据的平均梯度值，作为第一压缩阈值，并将所述第二梯度数据中的各个梯度数据分别压缩为0、所述第一压缩阈值或所述第一压缩阈值的相反数，完成所述第二梯度数据中每个梯度数据的压缩。

本实施例中，第二梯度数据的方差小于方差阈值，即表示第二梯度数据中的各个梯度数据差距较小，可将第二梯度数据的平均梯度值作为2比特位压缩策略的压缩阈值，即第一压缩阈值。首先确定梯度数据为正数还是负数，若为正数，将该梯度数据与对应的设定正数阈值(第一压缩阈值)进行比对，若小于第一压缩阈值，则将该梯度数据压缩为0，若不小于第一压缩阈值，则将该梯度数据压缩为第一压缩阈值。若为负数，将该梯度数据与对应的设定正数阈值的相反数(第一压缩阈值的相反数)进行比对，若小于第一压缩阈值的相反数，则将该梯度数据压缩为第一压缩阈值的相反数，若不小于第一压缩阈值的相反数，则将该梯度数据压缩为0。

示例性的，所述根据所述4比特位压缩策略将所述第二梯度数据中的每个梯度数据进行压缩的步骤具体包括：

根据所述第二梯度数据的平均梯度值，确定所述第二梯度数据对应的压缩阈值组；

将所述第二梯度数据中的各个梯度数据分别压缩为所述压缩阈值组中的对应压缩阈值，完成所述第二梯度数据中每个梯度数据的压缩。

本实施例中，在第二梯度数据的平均梯度值的前后确定4比特位压缩策略对应的压缩阈值组，即15个压缩阈值，将第二梯度数据中的一个梯度数据，分别与15个压缩阈值进行比对，并在15个压缩阈值中确定与该梯度数据最接近的压缩阈值。其中，与该梯度数据最接近的压缩阈值可以是与该梯度数据的差值最小的压缩阈值，或者是大于该梯度数据的压缩阈值中的最小值，或者是小于该梯度数据的压缩阈值中的最大值。依次类推，由此完成第二梯度数据中每个梯度数据的压缩。

示例性的，所述根据所述第二梯度数据的平均梯度值，确定所述第二梯度数据对应的压缩阈值组的步骤具体包括：

根据预设差值以及所述平均梯度值，确定所述第二梯度数据对应的各个第二压缩阈值；

根据各个第二压缩阈值以及各个第二压缩阈值对应的相反数，生成所述压缩阈值组。

本实施例中，第二梯度数据的方差不小于方差阈值，即表示第二梯度数据中的各个梯度数据差距较大，可根据所述第二梯度数据的平均梯度值与第二梯度数据中的最小梯度值的差值、所述第二梯度数据的平均梯度值与第二梯度数据中的最大梯度值的差值，确定4比特位压缩策略对应的第二压缩阈值(即7个正数压缩阈值及其相反数，并将0、该7个正数压缩阈值及其相反数组成的15个压缩阈值)，作为所述第二梯度数据的压缩阈值组。

示例性的，所述将所述第二梯度数据中的各个梯度数据分别压缩为所述压缩阈值组中的对应压缩阈值，完成所述第二梯度数据中每个梯度数据的压缩的步骤包括：

将所述第二梯度数据中的一个梯度数据，作为目标梯度数据；

将所述目标梯度数据依次与所述压缩阈值组中按序排列的各个第二压缩阈值进行比对，并在各个所述第二压缩阈值中确定所述目标梯度数据对应的目标压缩阈值；

将所述目标梯度数据压缩为所述目标压缩阈值，并获取所述第二梯度数据中的下一个梯度数据，作为所述目标梯度数据，并执行：将所述目标梯度数据依次与所述压缩阈值组中按序排列的各个第二压缩阈值进行比对，并在各个所述第二压缩阈值中确定所述目标梯度数据对应的目标压缩阈值，直至完成所述第二梯度数据中每个梯度数据的压缩。

本实施例中，对第二梯度数据中的梯度数据进行遍历，首先判断一个梯度数据的正负值，再将该梯度数据分别和由小到大的第二压缩阈值进行比较，再将该梯度数据压缩至较小一端的数值，压缩后的4位数据是该梯度数据对应的压缩值。

其中，完成所述第二梯度数据中每个梯度数据的压缩过程为：

获取所述第二梯度数据中的一个梯度数据，作为目标梯度数据，并将目标梯度数据分别与压缩阈值组中按序排列(由大到小或由小到大)的各个第二压缩阈值进行比对，例如，目标梯度数据为A，各个第二压缩阈值分别为-X ₇、-X ₆、-X ₅、-X ₄、-X ₃、-X ₂、-X ₁、0、X ₁、X ₂、X ₃、X ₄、X ₅、X ₆、X ₇，其中，X ₁-X ₇依次增大。若A>X ₃且A<X ₄，则将A压缩为X ₃。

依次获取所述第二梯度数据中的各个梯度数据作为目标梯度数据，重复上述步骤，直至完成所述第二梯度数据中每个梯度数据的压缩。

可以理解的是，第一压缩阈值和第二压缩阈值可以是用户根据实际需要进行预先设定，还可以是***根据第二梯度数据的平均梯度值(还可以进一步结合第二梯度数据的最小梯度值及最大梯度值分别与平均梯度值的差值)计算确定。

步骤S30，将所述第一梯度数据以及压缩后的第二梯度数据上传至服务器。

本实施例中，将重要性较大的第一梯度数据完整上传至服务器，然后将第二梯度数据梯度压缩后上传至服务器，由此，将一个占用较大内存的梯度数据转换为占用较小内存的梯度数据，由此降低每个梯度数据传输时占用的通信开销。

此外，本发明实施例还提供一种基于联邦学习的梯度压缩装置。

参照图3，图3为本发明基于联邦学习的梯度压缩装置第一实施例的功能模块示意图。

本实施例中，所述基于联邦学习的梯度压缩装置包括：

梯度数据获取模块，用于获取待传输梯度数据，并将所述待传输梯度数据中梯度值不小于预设梯度阈值的梯度数据作为第一梯度数据；

梯度数据压缩模块，用于将所述待传输梯度数据中除所述第一梯度数据之外的梯度数据作为第二梯度数据，并根据2比特位压缩策略或4比特位压缩策略将所述第二梯度数据中的每个梯度数据进行压缩；

梯度数据上传模块，用于将所述第一梯度数据以及压缩后的第二梯度数据上传至服务器。

进一步地，所述梯度数据压缩模块具体包括：

4比特位压缩单元，用于在所述第二梯度数据的方差不小于预设方差阈值时，根据所述4比特位压缩策略将所述第二梯度数据中的每个梯度数据进行压缩；

2比特位压缩单元，用于在所述第二梯度数据的方差小于所述方差阈值时，根据所述2比特位压缩策略将所述第二梯度数据中的每个梯度数据进行压缩。

进一步地，所述2比特位压缩单元具体包括：

2比特位压缩子单元，用于将所述第二梯度数据的平均梯度值，作为第一压缩阈值，并将所述第二梯度数据中的各个梯度数据分别压缩为0、所述第一压缩阈值或所述第一压缩阈值的相反数，完成所述第二梯度数据中每个梯度数据的压缩。

进一步地，所述4比特位压缩单元具体包括：

阈值组确定子单元，用于根据所述第二梯度数据的平均梯度值，确定所述第二梯度数据对应的压缩阈值组；

梯度数据压缩子单元，用于将所述第二梯度数据中的各个梯度数据分别压缩为所述压缩阈值组中的对应压缩阈值，完成所述第二梯度数据中每个梯度数据的压缩。

进一步地，所述阈值组确定子单元具体还用于：

进一步地，所述梯度数据压缩子单元还用于：

进一步地，所述基于联邦学习的梯度压缩装置还包括：

梯度数据排序模块，用于在所述第一梯度数据的数据量超过所述数据量阈值时，将所述待传输梯度数据中的各个梯度数据按照梯度值进行排序；

梯度数据更新模块，用于在排序后的各个梯度数据中获取目标数据量的梯度数据，作为更新后的第一梯度数据，其中，所述目标数据量不大于所述数据量阈值。

其中，上述基于联邦学习的梯度压缩装置中各个模块与上述基于联邦学习的梯度压缩方法实施例中各步骤相对应，其功能和实现过程在此处不再一一赘述。

此外，本发明实施例还提供一种计算机可读存储介质，所述计算机可读存储介质可以是非易失性，也可以是易失性。

本发明计算机可读存储介质上存储有基于联邦学习的梯度压缩程序，其中所述基于联邦学习的梯度压缩程序被处理器执行时，实现如上述的基于联邦学习的梯度压缩方法的步骤。

其中，基于联邦学习的梯度压缩程序被执行时所实现的方法可参照本发明基于联邦学习的梯度压缩方法的各个实施例，此处不再赘述。

本发明提供一种基于联邦学习的梯度压缩方法、装置、设备及计算机可读存储介质，所述方法包括：获取待传输梯度数据，并将所述待传输梯度数据中梯度值不小于预设梯度阈值的梯度数据作为第一梯度数据；将所述待传输梯度数据中除所述第一梯度数据之外的梯度数据作为第二梯度数据，并根据2比特位压缩策略或4比特位压缩策略将所述第二梯度数据中的每个梯度数据进行压缩；将所述第一梯度数据以及压缩后的第二梯度数据上传至服务器。通过上述方式，本发明根据梯度值的大小，筛选出重要度高的第一梯度数据，然后将重要度高的梯度数据完整上传，并将重要度较低的第二梯度数据按照2比特位压缩策略或4比特位压缩策略进行压缩。由此，在保证模型建模准确性的同时，降低了传输梯度的数据量，提高了梯度传输效率，解决了现有联邦学习建模过程中传输梯度数据量大导致的梯度传输效率低下的技术问题。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者***不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者***所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者***中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

一种基于联邦学习的梯度压缩方法，其中，所述基于联邦学习的梯度压缩方法包括以下步骤：

获取待传输梯度数据，并将所述待传输梯度数据中梯度值不小于预设梯度阈值的梯度数据作为第一梯度数据；

将所述待传输梯度数据中除所述第一梯度数据之外的梯度数据作为第二梯度数据，并根据2比特位压缩策略或4比特位压缩策略将所述第二梯度数据中的每个梯度数据进行压缩；

将所述第一梯度数据以及压缩后的第二梯度数据上传至服务器。
如权利要求1所述的基于联邦学习的梯度压缩方法，其中，所述根据2比特位压缩策略或4比特位压缩策略将所述第二梯度数据中的每个梯度数据进行压缩的步骤具体包括：

在所述第二梯度数据的方差不小于预设方差阈值时，根据所述4比特位压缩策略将所述第二梯度数据中的每个梯度数据进行压缩；

在所述第二梯度数据的方差小于所述方差阈值时，根据所述2比特位压缩策略将所述第二梯度数据中的每个梯度数据进行压缩。
如权利要求2所述的基于联邦学习的梯度压缩方法，其中，所述根据所述2比特位压缩策略将所述第二梯度数据中的每个梯度数据进行压缩的步骤包括：

将所述第二梯度数据的平均梯度值，作为第一压缩阈值，并将所述第二梯度数据中的各个梯度数据分别压缩为0、所述第一压缩阈值或所述第一压缩阈值的相反数，完成所述第二梯度数据中每个梯度数据的压缩。
如权利要求2所述的基于联邦学习的梯度压缩方法，其中，所述根据所述4比特位压缩策略将所述第二梯度数据中的每个梯度数据进行压缩的步骤具体包括：

根据所述第二梯度数据的平均梯度值，确定所述第二梯度数据对应的压缩阈值组；

将所述第二梯度数据中的各个梯度数据分别压缩为所述压缩阈值组中的对应压缩阈值，完成所述第二梯度数据中每个梯度数据的压缩。
如权利要求4所述的基于联邦学***均梯度值，确定所述第二梯度数据对应的压缩阈值组的步骤具体包括：

根据预设差值以及所述平均梯度值，确定所述第二梯度数据对应的各个第二压缩阈值；

根据各个第二压缩阈值以及各个第二压缩阈值对应的相反数，生成所述压缩阈值组。
如权利要求5所述的基于联邦学习的梯度压缩方法，其中，所述将所述第二梯度数据中的各个梯度数据分别压缩为所述压缩阈值组中的对应压缩阈值，完成所述第二梯度数据中每个梯度数据的压缩的步骤包括：

将所述第二梯度数据中的一个梯度数据，作为目标梯度数据；

将所述目标梯度数据依次与所述压缩阈值组中按序排列的各个第二压缩阈值进行比对，并在各个所述第二压缩阈值中确定所述目标梯度数据对应的目标压缩阈值；

将所述目标梯度数据压缩为所述目标压缩阈值，并获取所述第二梯度数据中的下一个梯度数据，作为所述目标梯度数据，并执行：将所述目标梯度数据依次与所述压缩阈值组中按序排列的各个第二压缩阈值进行比对，并在各个所述第二压缩阈值中确定所述目标梯度数据对应的目标压缩阈值，直至完成所述第二梯度数据中每个梯度数据的压缩。
如权利要求1至6任意一项所述的基于联邦学习的梯度压缩方法，其中，所述获取待传输梯度数据，并将所述待传输梯度数据中梯度值不小于预设梯度阈值的梯度数据作为第一梯度数据的步骤之后，还包括：

在所述第一梯度数据的数据量超过所述数据量阈值时，将所述待传输梯度数据中的各个梯度数据按照梯度值进行排序；

在排序后的各个梯度数据中获取目标数据量的梯度数据，作为更新后的第一梯度数据，其中，所述目标数据量不大于所述数据量阈值。
一种基于联邦学习的梯度压缩装置，其中，所述基于联邦学习的梯度压缩装置包括：

梯度数据获取模块，用于获取待传输梯度数据，并将所述待传输梯度数据中梯度值不小于预设梯度阈值的梯度数据作为第一梯度数据；

梯度数据压缩模块，用于将所述待传输梯度数据中除所述第一梯度数据之外的梯度数据作为第二梯度数据，并根据2比特位压缩策略或4比特位压缩策略将所述第二梯度数据中的每个梯度数据进行压缩；

梯度数据上传模块，用于将所述第一梯度数据以及压缩后的第二梯度数据上传至服务器。
一种基于联邦学习的梯度压缩设备，其中，所述基于联邦学习的梯度压缩设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的基于联邦学习的梯度压缩程序，其中所述基于联邦学习的梯度压缩程序被所述处理器执行时，实现：

获取待传输梯度数据，并将所述待传输梯度数据中梯度值不小于预设梯度阈值的梯度数据作为第一梯度数据；

将所述待传输梯度数据中除所述第一梯度数据之外的梯度数据作为第二梯度数据，并根据2比特位压缩策略或4比特位压缩策略将所述第二梯度数据中的每个梯度数据进行压缩；

将所述第一梯度数据以及压缩后的第二梯度数据上传至服务器。
根据权利要求9所述的基于联邦学习的梯度压缩设备，其中，所述根据2比特位压缩策略或4比特位压缩策略将所述第二梯度数据中的每个梯度数据进行压缩，包括：

在所述第二梯度数据的方差不小于预设方差阈值时，根据所述4比特位压缩策略将所述第二梯度数据中的每个梯度数据进行压缩；

在所述第二梯度数据的方差小于所述方差阈值时，根据所述2比特位压缩策略将所述第二梯度数据中的每个梯度数据进行压缩。
根据权利要求10所述的基于联邦学习的梯度压缩设备，其中，所述根据所述2比特位压缩策略将所述第二梯度数据中的每个梯度数据进行压缩，包括：

将所述第二梯度数据的平均梯度值，作为第一压缩阈值，并将所述第二梯度数据中的各个梯度数据分别压缩为0、所述第一压缩阈值或所述第一压缩阈值的相反数，完成所述第二梯度数据中每个梯度数据的压缩。
根据权利要求10所述的基于联邦学习的梯度压缩设备，其中，所述根据所述4比特位压缩策略将所述第二梯度数据中的每个梯度数据进行压缩，包括：

根据所述第二梯度数据的平均梯度值，确定所述第二梯度数据对应的压缩阈值组；

将所述第二梯度数据中的各个梯度数据分别压缩为所述压缩阈值组中的对应压缩阈值，完成所述第二梯度数据中每个梯度数据的压缩。
根据权利要求12所述的基于联邦学***均梯度值，确定所述第二梯度数据对应的压缩阈值组，包括：

根据预设差值以及所述平均梯度值，确定所述第二梯度数据对应的各个第二压缩阈值；

根据各个第二压缩阈值以及各个第二压缩阈值对应的相反数，生成所述压缩阈值组。
根据权利要求13所述的基于联邦学习的梯度压缩设备，其中，所述将所述第二梯度数据中的各个梯度数据分别压缩为所述压缩阈值组中的对应压缩阈值，完成所述第二梯度数据中每个梯度数据的压缩，包括：

将所述第二梯度数据中的一个梯度数据，作为目标梯度数据；

将所述目标梯度数据依次与所述压缩阈值组中按序排列的各个第二压缩阈值进行比对，并在各个所述第二压缩阈值中确定所述目标梯度数据对应的目标压缩阈值；

将所述目标梯度数据压缩为所述目标压缩阈值，并获取所述第二梯度数据中的下一个梯度数据，作为所述目标梯度数据，并执行：将所述目标梯度数据依次与所述压缩阈值组中按序排列的各个第二压缩阈值进行比对，并在各个所述第二压缩阈值中确定所述目标梯度数据对应的目标压缩阈值，直至完成所述第二梯度数据中每个梯度数据的压缩。
根据权利要求9-14中任意一项所述的基于联邦学习的梯度压缩设备，其中，所述获取待传输梯度数据，并将所述待传输梯度数据中梯度值不小于预设梯度阈值的梯度数据作为第一梯度数据之后，还包括：

在所述第一梯度数据的数据量超过所述数据量阈值时，将所述待传输梯度数据中的各个梯度数据按照梯度值进行排序；

在排序后的各个梯度数据中获取目标数据量的梯度数据，作为更新后的第一梯度数据，其中，所述目标数据量不大于所述数据量阈值。
一种计算机可读存储介质，其中，所述计算机可读存储介质上存储有基于联邦学习的梯度压缩程序，其中所述基于联邦学习的梯度压缩程序被处理器执行时，实现：

获取待传输梯度数据，并将所述待传输梯度数据中梯度值不小于预设梯度阈值的梯度数据作为第一梯度数据；

将所述待传输梯度数据中除所述第一梯度数据之外的梯度数据作为第二梯度数据，并根据2比特位压缩策略或4比特位压缩策略将所述第二梯度数据中的每个梯度数据进行压缩；

将所述第一梯度数据以及压缩后的第二梯度数据上传至服务器。
根据权利要求16所述的计算机可读存储介质，其中，所述根据2比特位压缩策略或4比特位压缩策略将所述第二梯度数据中的每个梯度数据进行压缩，包括：

在所述第二梯度数据的方差不小于预设方差阈值时，根据所述4比特位压缩策略将所述第二梯度数据中的每个梯度数据进行压缩；

在所述第二梯度数据的方差小于所述方差阈值时，根据所述2比特位压缩策略将所述第二梯度数据中的每个梯度数据进行压缩。
根据权利要求17所述的计算机可读存储介质，其中，所述根据所述2比特位压缩策略将所述第二梯度数据中的每个梯度数据进行压缩，包括：

将所述第二梯度数据的平均梯度值，作为第一压缩阈值，并将所述第二梯度数据中的各个梯度数据分别压缩为0、所述第一压缩阈值或所述第一压缩阈值的相反数，完成所述第二梯度数据中每个梯度数据的压缩。
根据权利要求17所述的计算机可读存储介质，其中，所述根据所述4比特位压缩策略将所述第二梯度数据中的每个梯度数据进行压缩，包括：

根据所述第二梯度数据的平均梯度值，确定所述第二梯度数据对应的压缩阈值组；

将所述第二梯度数据中的各个梯度数据分别压缩为所述压缩阈值组中的对应压缩阈值，完成所述第二梯度数据中每个梯度数据的压缩。
根据权利要求19所述的计算机可读存储介质，其中，所述根据所述第二梯度数据的平均梯度值，确定所述第二梯度数据对应的压缩阈值组，包括：

根据预设差值以及所述平均梯度值，确定所述第二梯度数据对应的各个第二压缩阈值；

根据各个第二压缩阈值以及各个第二压缩阈值对应的相反数，生成所述压缩阈值组。