WO2023130705A1

WO2023130705A1 - 用户数据处理的***、方法以及装置

Info

Publication number: WO2023130705A1
Application number: PCT/CN2022/105396
Authority: WO
Inventors: 邵云峰; 李秉帅
Original assignee: 华为技术有限公司
Priority date: 2022-01-10
Filing date: 2022-07-13
Publication date: 2023-07-13
Also published as: CN116468132A; EP4386636A1

Abstract

一种用户数据处理的***、方法以及装置，应用于人工智能领域。其中，该***中的第一数据处理设备产生第一中间结果，并将第三中间结果发送给***中的第二数据处理设备。该第三中间结果是基于第一机器学习模型的参数、第一数据处理设备得到的目标历史用户数据从第一中间结果中获取的，目标历史用户数据的标识和第二数据处理设备的历史用户数据的标识相同。第一数据处理设备还接收第二数据处理设备发送的第二中间结果，并基于第一中间结果和第二中间结果更新第一机器学习模型的参数。第二数据处理设备还基于接收到的第三中间结果和第二中间结果更新第二机器学习模型的参数。通过本方案，可以提升***中存在的机器学习模型的预测准确率。

Description

用户数据处理的***、方法以及装置

本申请要求于2022年1月10日提交中国专利局、申请号为CN202210023462.X、申请名称为“用户数据处理的***、方法以及装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及人工智能技术领域，尤其涉及机器学习模型训练中的用户数据处理的***、方法以及装置。

背景技术

联邦学习(federated learning)是一种分布式机器学习技术。每个联邦学习客户端(federated learning client,FLC)，如联邦学习装置1、2、3……k，利用本地计算资源和本地网络业务数据进行模型训练，并将本地训练过程中产生的模型参数更新信息Δω，如Δω1、Δω2、Δω3……Δωk，发送给联邦学习服务端(federated learning server，FLS)。联邦学习服务端基于Δω采用汇聚算法进行模型汇聚，得到汇聚机器学习模型。汇聚机器学习模型作为联邦学习装置下一次执行模型训练的初始模型。联邦学习装置和联邦学习服务端多次执行上述模型训练过程，直到得到的汇聚机器学习模型满足预设条件时，停止训练。

联邦学习能够充分的利用客户端处的数据和计算能力，使多方可以协作构建通用、更健壮的机器学习模型而不需要共享数据。在数据监管越来越严格的大环境下，联邦学习能够解决数据所有权、数据隐私、数据访问权等关键问题，具有极大的商业价值。

如何拓宽联邦学习的应用场景，提升机器学习模型的性能成为需要解决的问题。

发明内容

鉴于此，有必要提供一种***、方法以及装置，以能够同时利用相同特征空间，不同样本空间的数据，以及不同特征空间，相同样本空间的数据作为训练样本来训练机器学习模型，拓宽联邦学习的应用场景，使训练后的机器学习模型的预测结果更加精准。

第一方面，本申请的实施例提供了一种用户数据处理的***，该***包括第一数据处理设备和第二数据处理设备，第一数据处理设备，用于：产生第一中间结果，第一中间结果是基于第一机器学习模型的参数和第一数据处理设备获取到的历史用户数据获取的。其中，第一数据处理设备可以通过多种渠道获取历史用户数据，比如该历史用户数据可能是第一数据处理设备产生的，或者该历史用户数据可能是第一数据处理设备保存的。该第一中间结果可以是根据第一机器学习模型的参数和第一数据处理设备对应的特征向量之间的乘积获取的。接收第二中间结果，第二中间结果是基于第二机器学习模型的参数和第二数据处理设备获取到的历史用户数据获取的。该第二中间结果可以是根据第二机器学习模型的参数和第二数据处理设备获取到的历史用户数据对应的特征向量之间的乘积获取的。第二数据处理设备可以通过多种渠道获取历史用户数据，比如该历史用户数据可能是第二数据处理设备产生的，或者该历史用户数据可能是第二数据处理设备保存的。根据第一中间结果和第二中间结果更新第一机器学习模型的参数。将第三中间结果向第二数据处理设备发送，第三中间结果是基于第一机器学习模型的参数、第一数据处理设备获取到的历史用户数据中的目标历史用户数据从所述第一中间结果中获取的。目标历史用户数据的标识和第二数据处理设备获取到的历史用户数据的标识相同。换句话说，***中可能有多个不同的第二数据处理设备，多个不同的第二数据处理设备获取的历史用户数据的标识的集合和第一数据处理设备获取的历史用户数据的标识的集合相同。第一数据处理设备根据数据的标识，向不同的第二数据处理设备发送不同的第一中间结果。比如，有两个第二数据处理设备分别是设备1和设备2，设备1针对获取到的历史用户数据1、历史用户数据2、历史用户数据3分别获取了中间结果1、中间结果2、中间结果3，即第二中间结果包括了中间结果1、中间结果2以及中间结果3。设备2针对维护的历史用户数据4、历史用户数据5、历史用户数据6分别获取了中间结果4、中间结果5、中间结果6，即另一个第二中间结果包括了中间结果4、中间结果5以及中间结果6。假设历史用户数据1、历史用户数据2、历史用户数据3的对齐样本分别是历史用户数据1’、历史用户数据2’、历史用户数据3’。两个历史用户数据是对齐样本代表二者的数据标识相同比，比如历史用户数据1和历史用户数据1’的数据标识相同，历史用户数据2和历史用户数据2’的数据标识相同，历史用户数据3和历史用户数据3’的数据标识相同。历史用户数据4、历史用户数据5、历史用户数据6的对齐样本分别是历史用户数据4’、历史用户数据5’、历史用户数据6’。第一数据处理设备的历史用户数据包括历史用户数据1’、历史用户数据2’、历史用户数据3’、历史用户数据4’、历史用户数据5’以及历史用户数据6’。假设第一数据处理设备针对历史用户数据1’、历史用户数据2’、历史用户数据3’、历史用户数据4’、历史用户数据5’以及历史用户数据6’获取的中间结果分别是中间结果1’、中间结果2’、中间结果3’、中间结果4’、中间结果5’以及中间结果6’。即中间结果1’、中间结果2’、中间结果3’、中间结果4’、中间结果5’以及中间结果6’中的每个中间结果均相当于第一中间结果。由于中间结果1’、中间结果2’、中间结果3’是基于历史用户数据1’、历史用户数据2’、历史用户数据3’获取的，而历史用户数据1’、历史用户数据2’、历史用户数据3’是历史用户数据1、历史用户数据2、历史用户数据3的对齐样本，而历史用户数据1、历史用户数据2、历史用户数据3是设备1获取到的历史用户数据，所以第一数据处理设备向设备1发送的第一中间结果包括中间结果1’、中间结果2’、中间结果3’。同理，第一数据处理设备向设备2发送的第一中间结果包括中间结果4’、中间结果5’以及中间结果6’。本申请实施例也将具有不同的特征空间，相同的样本空间的历史用户数据称为对齐样本。第二数据处理设备，用于：根据第三中间结果和第二中间结果，更新第二机器学习模型的参数。

第一方面提供的方案，第一数据处理设备和第二数据处理设备可以是纵向联邦训练的参与方，第一数据处理设备生成了多个中间结果后，向不同的第二数据处理设备发送不同的中间结果。通过这种设计方式，第一数据处理设备在模型的训练过程中，融合了自身获取的历史用户数据提供的信息，还可以融合多个第二数据处理设备获取到的历史用户数据提供的信息，相比于只能利用一个第二数据处理设备获取的历史用户数据提供的信息，本申请实施例提供的方案能够获取性能更优的模型，以便于更好的预测用户的决策，为用户提供更精准的推荐信息。此外，任意两个第二数据处理设备可以是横向联邦训练的参与方，由于第一数据处理设备是利用了多个第二数据处理设备各自获取的历史用户数据提供的信息来更新其维护的机器学习模型的参数，在不断利用更新后的机器学习模型获取第一中间结果，并将不同的第一中间结果传递给不同的第二数据处理设备，也可以使不同的第二数据处理设备间接利用了除自身之外的其他第二数据处理设备获取的历史用户数据提供的信息。通过这种方式，实现横向联邦训练和纵向联邦的结合，提供了一种切实可行的横向联邦和纵向联邦相结合的方式，以便于更好的预测用户的决策，为用户提供更精准的推荐信息。

在第一方面的一种可能的实施方式中，该***中包括多个第三数据处理设备，任意两个第三数据处理设备获取到的历史用户数据具有相同的特征空间、不同的数据标识，第二数据处理设备是多个第三数据处理设备中的任意一个第三数据处理设备，每个第三数据处理设备上均部署有初始的机器学习模型，第二数据处理设备，还用于：获取多个初始的机器学习模型的参数。对获取到的多个初始的机器学习模型的参数进行加权处理，以获取加权值。根据加权值更新第二数据处理设备上部署的初始的机器学习模型的参数，以获取第二机器学习模型的参数。在这种实施方式中，通过加权值更新多个第三数据处理设备各自维护的机器学习模型的参数，在每一次迭代训练的起始状态时，各个第三数据处理设备维护的机器学习模型的参数是相同的，所以对于整个***而言，需要优化的参数的数目大大降低，节约算力，有利于提升训练的效率。

第二方面，本申请的实施例提供了一种用户数据处理的方法，包括：第一数据处理设备获取第一中间结果，第一中间结果是基于第一机器学习模型的参数和第一数据处理设备获取到的历史用户数据获取的。第一数据处理设备接收第二中间结果，第二中间结果是基于第二机器学习模型的参数和第二数据处理设备获取到的历史用户数据获取的。第一数据处理设备根据第一中间结果和第二中间结果更新第一机器学习模型的参数。第一数据处理设备将第三中间结果向第二数据处理设备发送，第三中间结果是基于第一机器学习模型的参数、第一数据处理设备获取到的历史用户数据中的目标历史用户数据从所述第一中间结果中获取的，目标历史用户数据的标识和第二数据处理设备的历史用户数据的标识相同，第三中间结果和第二中间结果用于更新第二机器学习模型的参数。

在第二方面的一种可能的实施方式中，该方法还包括：第一数据处理设备根据获取到的第一公钥和第二公钥生成公共公钥，第一公钥是第一数据处理设备生成的，第二公钥是第二数据处理设备生成的。第一数据处理设备利用公共公钥对第三中间结果进行同态加密，大于目标数量的第一私钥或第二私钥用于对同态加密后的第三中间结果进行解密，第一私钥是第一数据处理设备生成的，第二私钥是第二数据处理设备生成的。

在第二方面的一种可能的实施方式中，该方法还包括：第一数据处理设备获取到***中在线的数据处理设备的数量小于阈值时，向在线的数据处理设备发送同态加密后的第一机器学习模型的参数，以使在线的数据处理设备利用各自的第一私钥或第二私钥解密同态加密后的第一机器学习模型的参数，阈值大于目标数量。

在第二方面的一种可能的实施方式中，该方法还包括：第一数据处理设备接收在线的数据处理设备利用各自的第一私钥或第二私钥解密后获取的第一机器学习模型的参数。

在第二方面的一种可能的实施方式中，第一中间结果具体是基于第一机器学习模型的参数、第一数据处理设备的历史用户数据以及目标向量获取的，方法还包括：第一数据处理设备基于同态加密后的第一向量和第二向量获取目标向量，一个第一向量具有N个维度，N个维度对应***中全部历史用户数据的标识，第一向量的第一维度的取值用于指示第二数据处理设备获取的历史用户数据的标识中是否存在第一历史用户数据的标识，第一维度对应第一历史用户数据的标识，第二向量和第一向量具有相同的维度，第二向量的第一维度的取值用于指示第一数据处理设备的历史用户数据的标识中是否存在第一历史用户数据的标识。

在第二方面的一种可能的实施方式中，第一数据处理设备获取的历史用户数据和第二数据处理设备获取的历史用户数据具有不同的特征空间。

第三方面，本申请的实施例提供了一种用户数据处理的方法，包括：第二数据处理设备接收第三中间结果，第一中间结果是基于第一机器学习模型的参数和第一数据处理设备获取到的历史用户数据获取的，第三中间结果是基于第一机器学习模型的参数、第一数据处理设备获取到的历史用户数据中的目标历史用户数据从所述第一中间结果中获取的，目标历史用户数据的标识和第二数据处理设备的历史用户数据的标识相同。第二数据处理设备获取第二中间结果，第二中间结果是基于第二机器学习模型的参数和第二数据处理设备获取到的历史用户数据获取的，第二中间结果和第一中间结果用于更新第一机器学习模型的参数。第二数据处理设备根据第三中间结果和第二中间结果，更新第二机器学习模型的参数。

在第三方面的一种可能的实施方式中，该方法还包括：第二数据处理设备获取多个初始的机器学习模型的参数，一个初始的机器学习模型部署在一个第三数据处理设备中，任意两个第三数据处理设备获取到的历史用户数据具有相同的特征空间、不同的数据标识，第二数据处理设备是多个第三数据处理设备中的任意一个第三数据处理设备。第二数据处理设备对获取到的多个初始的机器学习模型的参数进行加权处理，以获取加权值。根据加权值更新第二数据处理设备上部署的初始的机器学习模型的参数，以获取第二机器学习模型的参数。

在第三方面的一种可能的实施方式中，该方法还包括：第二数据处理设备根据获取到的第一公钥和第二公钥生成公共公钥，第一公钥是第一数据处理设备生成的，第二公钥是第二数据处理设备生成的。第二数据处理设备利用公共公钥对第二中间结果进行同态加密，大于目标数量的第一私钥或第二私钥用于对同态加密后的第二中间结果进行解密，第一私钥是第一数据处理设备生成的，第二私钥是第二数据处理设备生成的。

在第三方面的一种可能的实施方式中，该方法还包括：第二数据处理设备获取到***中在线的数据处理设备的数量小于阈值时，向在线的数据处理设备发送同态加密后的第二机器学习模型的参数，以使在线的数据处理设备利用各自的第一私钥或第二私钥解密同态加密后的第二机器学习模型的参数，阈值大于目标数量。

在第三方面的一种可能的实施方式中，该方法还包括：第二数据处理设备接收在线的数据处理设备利用各自的第一私钥或第二私钥解密后获取的第二机器学习模型的参数。

在第三方面的一种可能的实施方式中，第二中间结果具体是基于第二机器学习模型的参数、第二数据处理设备的历史用户数据以及目标向量获取的，方法还包括：第二数据处理设备获取第一向量，第一向量具有N个维度，N个维度对应***中全部历史用户数据的标识，第一向量的第一维度的取值用于指示第二数据处理设备获取的历史用户数据的标识中是否存在第一历史用户数据的标识，第一维度对应第一历史用户数据的标识。基于同态加密后的第二向量和第一向量获取目标向量，第二向量和第一向量具有相同的维度，第二向量的第一维度的取值用于指示第一数据处理设备的历史用户数据的标识中是否存在第一历史用户数据的标识。

在第三方面的一种可能的实施方式中，第一数据处理设备获取的历史用户数据和第二数据处理设备获取的历史用户数据具有不同的特征空间。

第四方面，本申请的实施例提供了一种掉线处理的方法，包括：目标数据处理设备生成公钥和私钥。目标数据处理设备接收目标数据处理设备所在***中其他数据处理设备发送的各自生成的公钥，以生成公共公钥。目标数据处理设备利用公共公钥对目标数据进行同态加密，目标数据包括目标数据处理设备上部署的目标机器学习模型的参数，其他数据处理设备生成的私钥中大于目标数量的私钥用于对同态加密后的目标数据进行解密。目标数据处理设备获取其他数据处理设备中在线的数据处理设备的数量小于阈值时，向在线的数据处理设备发送同态加密后的目标数据，以使在线的数据处理设备利用各自生成的私钥解密同态加密后的目标数据。

在第四方面的一种可能的实施方式中，该方法还包括：目标数据处理设备接收在线的数据处理设备利用各自生成的私钥解密后获取的目标数据。

在第四方面的一种可能的实施方式中，目标数据处理设备是第一数据处理设备时，方法还包括：目标数据处理设备获取第一中间结果，第一中间结果是基于第一机器学习模型的参数和第一数据处理设备获取到的历史用户数据获取的。目标数据处理设备接收第二中间结果，第二中间结果是基于第二机器学习模型的参数和第二数据处理设备获取到的历史用户数据获取的。目标数据处理设备根据第一中间结果和第二中间结果更新第一机器学习模型的参数。

目标数据处理设备将第三中间结果向第二数据处理设备发送，第三中间结果是基于第一机器学习模型的参数、目标数据处理设备获取到的历史用户数据中的目标历史用户数据获取的，目标历史用户数据的标识和第二数据处理设备的历史用户数据的标识相同，第三中间结果和第二中间结果用于更新第二机器学习模型的参数。

在第四方面的一种可能的实施方式中，第一中间结果具体是基于第一机器学习模型的参数、第一数据处理设备的历史用户数据以及目标向量获取的，方法还包括：目标数据处理设备基于同态加密后的第一向量和第二向量获取目标向量，一个第一向量具有N个维度，N个维度对应***中全部历史用户数据的标识，第一向量的第一维度的取值用于指示第二数据处理设备获取的历史用户数据的标识中是否存在第一历史用户数据的标识，第一维度对应第一历史用户数据的标识，第二向量和第一向量具有相同的维度，第二向量的第一维度的取值用于指示第一数据处理设备的历史用户数据的标识中是否存在第一历史用户数据的标识。

在第四方面的一种可能的实施方式中，目标数据处理设备是第二数据处理设备时，方法还包括：目标数据处理设备接收第三中间结果，第一中间结果是基于第一机器学习模型的参数和第一数据处理设备获取到的历史用户数据获取的，第三中间结果是基于第一机器学习模型的参数、第一数据处理设备获取到的历史用户数据中的目标历史用户数据从所述第一中间结果中获取的，目标历史用户数据的标识和第二数据处理设备的历史用户数据的标识相同。目标数据处理设备获取第二中间结果，第二中间结果是基于第二机器学习模型的参数和第二数据处理设备获取到的历史用户数据获取的，第二中间结果和第一中间结果用于更新第一机器学习模型的参数。目标数据处理设备根据第三中间结果和第二中间结果，更新第二机器学习模型的参数。

在第四方面的一种可能的实施方式中，该方法还包括：目标数据处理设备获取多个初始的机器学习模型的参数，一个初始的机器学习模型部署在一个第三数据处理设备中，任意两个第三数据处理设备获取到的历史用户数据具有相同的特征空间、不同的数据标识，第二数据处理设备是多个第三数据处理设备中的任意一个第三数据处理设备。目标数据处理设备对获取到的多个初始的机器学习模型的参数进行加权处理，以获取加权值。目标数据处理设备根据加权值更新目标数据处理设备上部署的初始的机器学习模型的参数，以获取第二机器学习模型的参数。

在第四方面的一种可能的实施方式中，第二中间结果具体是基于第二机器学习模型的参数、第二数据处理设备的历史用户数据以及目标向量获取的，方法还包括：目标数据处理设备获取第一向量，第一向量具有N个维度，N个维度对应***中全部历史用户数据的标识，第一向量的第一维度的取值用于指示第二数据处理设备获取的历史用户数据的标识中是否存在第一历史用户数据的标识，第一维度对应第一历史用户数据的标识。目标数据处理设备基于同态加密后的第二向量和第一向量获取目标向量，第二向量和第一向量具有相同的维度，第二向量的第一维度的取值用于指示第一数据处理设备的历史用户数据的标识中是否存在第一历史用户数据的标识。

第五方面，本申请的实施例提供了一种数据处理的***，***包括第一数据处理设备和第二数据处理设备，第一数据处理设备，用于：获取第一中间结果，第一中间结果是基于第一机器学习模型的参数和第一数据处理设备获取到的训练样本获取的。接收第二中间结果，第二中间结果是基于第二机器学习模型的参数和第二数据处理设备获取到的训练样本获取的。根据第一中间结果和第二中间结果更新第一机器学习模型的参数。将第三中间结果向第二数据处理设备发送，第三中间结果是基于第一机器学习模型的参数、第一数据处理设备获取到的训练样本中的目标训练样本获取的，目标训练样本的标识和第二数据处理设备获取到的训练样本的标识相同。第二数据处理设备，用于：根据第三中间结果和第二中间结果，更新第二机器学习模型的参数。

在第五方面的一种可能的实施方式中，***中包括多个第三数据处理设备，任意两个第三数据处理设备获取到的训练样本具有相同的特征空间、不同的样本标识，第二数据处理设备是多个第三数据处理设备中的任意一个第三数据处理设备，每个第三数据处理设备上均部署有初始的机器学习模型，第二数据处理设备，还用于：获取多个初始的机器学习模型的参数。对获取到的多个初始的机器学习模型的参数进行加权处理，以获取加权值。根据加权值更新第二数据处理设备上部署的初始的机器学习模型的参数，以获取第二机器学习模型的参数。

在第五方面的一种可能的实施方式中，第一数据处理设备，还用于：生成第一公钥和第一私钥。第二数据处理设备，还用于：生成第二公钥和第二私钥，第一公钥和第二公钥用于生成公共公钥，公共公钥用于对第一中间结果或第二中间结果进行同态加密，大于目标数量的第一私钥或第二私钥用于对同态加密后的第一中间结果或第二中间结果进行解密。

在第五方面的一种可能的实施方式中，第二数据处理设备，还用于：获取到***中在线的数据处理设备的数量小于阈值时，向在线的数据处理设备发送同态加密后的第二机器学习模型的参数，以使在线的数据处理设备利用各自的第一私钥或第二私钥解密同态加密后的第二机器学习模型的参数，阈值不小于目标数量。

在第五方面的一种可能的实施方式中，第二数据处理设备，还用于：接收在线的数据处理设备利用各自的第一私钥或第二私钥解密后获取的第二机器学习模型的参数。

在第五方面的一种可能的实施方式中，第一数据处理设备，还用于：获取到***中在线的数据处理设备的数量小于阈值时，向在线的数据处理设备发送同态加密后的第一机器学习模型的参数，以使在线的数据处理设备利用各自的第一私钥或第二私钥解密同态加密后的第一机器学习模型的参数，阈值大于目标数量。

在第五方面的一种可能的实施方式中，第一数据处理设备，还用于：接收在线的数据处理设备利用各自的第一私钥或第二私钥解密后获取的第一机器学习模型的参数。

在第五方面的一种可能的实施方式中，第二中间结果具体是基于第二机器学习模型的参数、第二数据处理设备获取到的训练样本以及目标向量获取的，第二数据处理设备，还用于：获取第一向量，第一向量具有N个维度，N个维度对应***中全部训练样本的标识，第一向量的第一维度的取值用于指示第二数据处理设备获取的训练样本的标识中是否存在第一训练样本的标识，第一维度对应第一训练样本的标识。基于同态加密后的第二向量和第一向量获取目标向量，第二向量和第一向量具有相同的维度，第二向量的第一维度的取值用于指示第一数据处理设备获取的训练样本的标识中是否存在第一训练样本的标识。

在第五方面的一种可能的实施方式中，第一中间结果具体是基于第一机器学习模型的参数、第一数据处理设备获取到的训练样本以及目标向量获取的，第一数据处理设备，还用于：

基于同态加密后的第一向量和第二向量获取目标向量。

在第五方面的一种可能的实施方式中，第一数据处理设备获取的训练样本和第二数据处理设备获取的训练样本具有不同的特征空间、相同的样本标识。

第六方面，本申请提供了一种用户数据处理的装置。该用户数据处理的装置用于执行上述第二方面至第四方面提供的任一种可能的实施方式中第一数据处理设备、第二数据处理设备或目标数据处理设备执行的步骤。

在一种可能的设计方式中，本申请可以根据上述第二方面至第四方面提供的任一种方法，对第一数据处理设备、第二数据处理设备、目标数据处理设备进行功能模块的划分。例如，可以对应各个功能划分各个功能模块，也可以将两个或两个以上的功能集成在一个处理模块中。

示例性的，本申请可以按照功能将数据处理设备划分为收发模块和处理模块等。上述划分的各个功能模块执行的可能的技术方案和有益效果的描述均可以参考上述第二方面或其相应的可能的实施方式提供的技术方案，第三方面或其相应的可能的实施方式提供的技术方案，或四方面或其相应的可能的实施方式提供的技术方案，此处不再赘述。

在另一种可能的设计中，该用户数据处理的装置包括：存储器和处理器，存储器和处理器耦合。存储器用于存储计算机指令，处理器用于调用该计算机指令，以执行如第二方面或其相应的可能的实施方式提供的方法，第三方面或其相应的可能的实施方式提供的方法，或第四方面或其相应的可能的实施方式提供的方法。

第七方面，本申请提供了一种计算机可读存储介质，如计算机非瞬态的可读存储介质。其上储存有计算机程序(或指令)，当该计算机程序(或指令)在计算机设备上运行时，使得该计算机设备执行如第二方面或其相应的可能的实施方式提供的方法，第三方面或其相应的可能的实施方式提供的方法，或第四方面或其相应的可能的实施方式提供的方法。

第八方面，本申请提供了一种计算机程序产品，当其在计算机设备上运行时，使得如第二方面或其相应的可能的实施方式提供的方法，第三方面或其相应的可能的实施方式提供的方法，或第四方面或其相应的可能的实施方式提供的方法被执行。

第九方面，本申请提供了一种芯片***，包括：处理器，处理器用于从存储器中调用并运行该存储器中存储的计算机程序，执行如第二方面或其相应的可能的实施方式提供的方法，第三方面或其相应的可能的实施方式提供的方法，或第四方面或其相应的可能的实施方式提供的方法。

可以理解的是，上述提供的任一种***、装置、计算机存储介质、计算机程序产品或芯片***等均可以应用于第二方面、第三方面或第四方面提供的对应的方法。

在本申请中，上述任一种装置的名字对设备或功能模块本身不构成限定，在实际实现中，这些设备或功能模块可以以其他名称出现。只要各个设备或功能模块的功能和本申请类似，属于本申请权利要求及其等同技术的范围之内。

附图说明

图1为一种横向联邦学习***的架构示意图；

图2为一种纵向联邦学习***的架构示意图；

图3为本申请实施例提供的一种机器学习模型的更新方法的流程示意图；

图4为本申请实施例提供的另一种机器学习模型的更新方法的流程示意图；

图5为本申请实施例提供的另一种机器学习模型的更新方法的流程示意图；

图6为本申请实施例提供的另一种机器学习模型的更新方法的流程示意图；

图7为本申请实施例提供的一种掉线处理的方法的流程示意图；

图8为本申请实施例提供的另一种掉线处理的方法的流程示意图；

图9为本申请实施例提供的获取对齐样本方法的流程示意图；

图10为本申请实施例提供的获取对齐样本方法的流程示意图；

图11为本申请实施例提供的机器学习模型的更新设备的结构示意图；

图12为本申请实施例提供的另一种机器学习模型的更新设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请实施例提供一种联邦学习***、基于联邦学习的数据处理方法以及装置，为了更好的理解本申请实施例提供的方案，下面首先对本申请实施例提供的方案的研究思路进行介绍：

联邦学习是一种在不汇聚多方数据的情况下，多方利用各自所有的数据协同训练人工智能(artificial intelligence，AI)模型的分布式机器学习范式。传统的机器学习范式需要汇聚大量的数据用于模型的训练，而用于训练的数据很有可能来自多个不同的组织或者用户或者参与方或者客户端。将多方数据汇聚在一起，极有可能造成数据泄露的风险，对组织来说会暴露信息资产，对个人用户来说可能泄露个人隐私。上述问题的存在对AI模型的训练提出了严峻的挑战，为解决上述问题，联邦学习技术应运而生。联邦学习允许多方数据保留在本地不进行多方数据汇聚，多方之间通过协同计算(安全的)交互中间计算结果的方式来共同训练AI模型。通过联邦学习技术，即保护了多方用户数据，又可以充分利用多方数据来协同训练模型，从而得到更强大的模型。

联邦学习按照场景可以分为横向联邦和纵向联邦。其中，横向联邦面向数据特征相同但数据分布不一致的多方协同建模问题，换句话说，横向联邦的参与方的训练数据特征空间相同，但样本空间不同。纵向联邦面向数据特征不同，但多方有相同的样本(用户)场景下的协同建模问题，换句话说，纵向联邦的参与方的训练数据特征空间不同，但样本空间相同。

参阅图1，为一种横向联邦学习***的架构示意图。横向联邦学习***结构上一般包括一个协作方和多个客户端作为参与方。并且该多个参与方维护的模型的训练数据具有数据特征空间相同，但样本空间不同的特点。工作流程主要包括模型下发和模型融合过程。在模型下发过程，参与方从协作方下载模型，通过本地存储的训练数据对从协作方上下载的模型进行训练，训练到一定程度后上传模型到协作方，其中训练到一定程度可以理解为训练固定轮数。在模型融合过程中，协作方会收集各个参与方上传的模型，并进行模型融合。模型下发过程和模型融合过程这两个过程会反复迭代直至模型收敛。

需要说明的是，本申请有时也将协作方称为中心服务器或者服务器，二者表示相同的意思，在一些可能的实施方式中，该服务器可以是云服务器或者云侧设备，本申请实施例对此并不进行限定。本申请有时也将客户端称为端侧设备、数据处理装置或者用户信息管理设备，他们表示相同的意思，比如端侧设备可以是终端，如手机终端，平板电脑，笔记本电脑，增强现实(augmented reality，AR)/虚拟现实(virtual reality，VR)，车载终端，用于安防的设备(比如监控摄像设备、烟雾报警设备、灭火设备)，智能音箱等，还可以是物理机、虚拟机、一体机等等。此外，需要说明的是，本申请中的模型包括神经网络模型，本申请对模型的具体类别并不进行限定，比如本申请中的模型可以是卷积神经网络模型，循环神经网络模型，深度残差网络模型等等。以下对本段内容不再重复说明。

参阅图2，为一种纵向联邦学习***的架构示意图。纵向联邦学习***结构上一般包括一个协作方和多个客户端作为参与方。并且该多个参与方维护的模型的训练数据具有数据特征空间不同，但样本空间相同的特点。由于在纵向联邦学习***中，多方参与方的用户群体不同，需要对多方维护的数据进行对齐处理，以保证多方维护的模型的训练样本的样本空间相同。此外，在纵向联邦学习***中，需要多方交换中间计算结果，以使多方各自计算损失和梯度值。为此，协作方创建密钥对，并将公共密钥发送给多方参与方。参与方利用公共密钥对各自获取的中间结果进行加密和交换。中间结果用来帮助计算梯度和损失值。参与方计算加密梯度并分别加入附加掩码(additional mask)。其中一个参与方还会计算加密损失。多方参与方分别将加密的结果发送给协作方。协作方对梯度和损失信息进行解密，并将结果发送回多方参与方。多方参与方解除梯度信息上的掩码，并根据这些梯度信息来更新本地模型参数。

由于横向联邦和纵向联邦针对不同的场景，提供了不同的训练方案，具体的，横向联邦只能利用相同特征空间，不同样本空间的数据作为训练样本来训练模型，纵向联邦只能利用不同特征空间，相同样本空间的数据作为训练样本来训练模型。这导致联邦学习的应用场景受限，比如，目前无法利用相同特征空间，不同样本空间的数据，又利用不同特征空间，相同样本空间的数据作为训练样本来训练模型。具体的场景可能包括需要利用不同的电信运营商的数据(相同特征空间，不同样本空间的数据)以及电商的数据(和电信运营商的数据具有不同特征空间，相同的样本空间)来共同训练模型。此外，由于利用的训练样本不能提供充分的信息，导致训练后的模型的性能不足够好，表现在训练后的模型的预测结果不够精准。

申请人发现了上述问题，并且提出一种切实可行的方案，能够同时利用相同特征空间，不同样本空间的数据，以及不同特征空间，相同样本空间的数据作为训练样本来训练模型。本申请实施例提供的方案，可以拓宽联邦学习的应用场景，提升模型的性能，使训练后的模型的预测结果更加精准。

基于上述研究思路，下面对本申请实施例提供的方案进行介绍：

参见图3，为本申请实施例提供的一种联邦学习***的架构示意图。本申请实施例提供的***包括至少3个参与方，本申请实施例有时也将参与方称为设备、装置、客户端，他们表示相同的意思。每个参与方维护各自的数据，并利用各自的数据训练模型。具体的，下面以3个参与方A1、A2以及B为例，对本申请实施例提供的方案进行介绍。

在一个可能的实施方式中，参与方A1维护的模型的训练样本和参与方A2维护的模型的训练样本具有相同的特征空间，不同的样本空间。参与方B维护的模型的训练样本与参与方A1(或者A2)维护的模型的训练样本具有不同的特征空间，相同的样本空间。本申请实施例也将具有不同的特征空间，相同的样本空间的训练样本称为对齐样本。为了方便说明，以下将参与方A1和参与方A2称为A类用户(或者A类型的参与方、A类参与方)，将参与方B称为B类用户(或者B类型的参与方、B类参与方)。假设F表示联邦学习***中数据的特征集合，则F＝{f ₁,f ₂,…,f _N,f _N+1,f _N+2,…,f _N+M}，其中前N个特征在A类用户，后M个特征在B类用户，即：

A类用户拥有特征子集合F _A＝{f ₁,f ₂,…,f _N}；

B类用户拥有特征子集合F _B＝{f _N+1,f _N+2,…,f _N+M}。

从特征维度描述参与本场景联邦的两类用户，其所拥有的数据特征是不同的，分别为FA，FB。在一个可能的实施方式中，可以理解为通过第一向量集合表示A类用户的各个数据，通过第二向量集合表示B类用户的各个数据，第一向量集合的分布和第二向量集合的分布不同。

下面再对样本空间相同进行解释：假设通过D表示联邦学习***中以一个对象相关的训练样本为单位，全部对象的集合，则D＝[d ₁,d ₂,d ₃,…,d _P] ^T，相同对象的相关数据即被A类用户维护，也被B类用户维护，可以理解为A类用户和B类用户具有相同的样本空间，可以理解为，逻辑上该联邦学习***存在P个对象，其中，d _p表示第p条数据，拥有N+M个特征，即：

每个对象根据特征子集合FA和特征子集合FB可以分为两部分：

其中：

为特征子集F ^A对应的特征值，即：

为特征子集F ^B对应的特征值，即

则D根据特征子集合F ^A和特征子集合F ^B可以分为两个数据子集D ^A,D ^B，即：

其中

A类用户数据所组成的数据子集

B类用户数据子集

B类用户数据标签Y＝{y ₁,y ₂,…,y _P}。

其中，B类用户数据标签Y用于区分不同的对象，B类用户数据Y是逻辑上存在的概念。

在物理上，A类用户与B类用户均可以存在多个，A类用户可以分为A1到AN共N个用户，B类用户也可以拆分为N个，定义为B1到BN共N个。则根据具体的物理上的数据切分，上述定义的数据DA，DB，Y可以根据真实数据物理分布拆分，拆分为真实的物理上的不同数据集。数据集D ^A可拆为D ^A1到D ^AN,数据集D ^B可拆分为D ^B1到D ^BN，标签Y可以拆分为Y ¹到Y ^N。

在这种实施方式中，***包括的各个参与方维护的模型的训练样本可以是相同特征空间，不同样本空间的数据，也可以是不同特征空间，相同样本空间的数据。

301、参与方A1根据A1模型(A1模型的参数)以及A1模型的训练样本获取第一中间结果1。

对联邦学习***中各个参与方维护的模型进行训练的过程中，需要结合各个参与方维护的模型的输出来共同确定。为了与该最终的预测结果进行区分，在本申请实施例中，将每个参与方各自获取的输出称为中间结果。

将A1模型的训练样本作为A1模型的输入，以获取第一中间结果1，具体的，可以根据A1模型对训练样本进行特征提取，以获取特征向量，再根据特征向量和A1模型的参数进行乘法运算，以获取该第一中间结果1。

其中，A1模型的训练样本是参与方A1能够获取到的数据，比如可以是参与方A1产生的数据，参与方A1保存的数据，或者参与方A1有权限获取的数据，本申请中参与方A1可以通过多种渠道获取训练样本。其中，训练样本的数据类型可以是用户数据、业务数据、产品数据等等，本申请实施例中的训练样本的数据类型可以是多种类型。在一个优选的实施方式，训练样本的数据类型是用户数据。

301'、参与方A2根据A2模型(A2模型的参数)以及A2模型的训练样本获取第一中间结果2。

步骤301'可以参照步骤301中参与方A1执行的步骤进行理解，这里不再重复赘述。

301”、参与方B根据参与方A1和参与方A2各自的训练样本的对齐样本获取第二中间结果。

关于对齐样本的理解参照上文，这里不再重复赘述。关于符合获取参与方B和参与方A1的训练样本的对齐样本，以及获取参与方B和参与方A2的训练样本的对齐样本将在下文展开介绍，这里暂不论述。

参与方B根据参与方B维护的B模型的参数以及根据参与方A1和参与方A2各自的训练样本的对齐样本获取第二中间结果。如何根据模型的训练样本获取中间结果的过程可以参照步骤301中参与方A1执行的步骤进行理解，这里不再重复赘述。

在一个可能的实施方式中，可以根据参与方A1的训练样本的数量和参与方A2的训练样本的数量为获取到的不同的第二中间结果设置不同的权重。比如，参与方A1的训练样本的数目比参与方A2的训练样本的数目更多，则通过参与方A1的训练样本的对齐样本获取的第二中间结果的权重，比通过参与方A2的训练样本的对齐样本获取的第二中间结果的权重更大，再比如，参与方A1的训练样本的数目比参与方A2的训练样本的数目更少，则通过参与方A1的训练样本的对齐样本获取的第二中间结果的权重，比通过参与方A2的训练样本的对齐样本获取的第二中间结果的权重更小。通过这样的方式，可以使第一加权值更好的反应参与方A1的训练样本中携带的信息以及参与方A2的训练样本中携带的信息。

302、参与方B根据对齐样本向参与方A1发送部分第二中间结果。

302'、参与方B根据对齐样本向参与方A2发送另一部分第二中间结果。

步骤302和步骤302'用于表示参与方B根据对齐样本向不同的A类型的参与方发送不同的第二中间结果。

比如，参与方A1针对维护的训练样本1、训练样本2、训练样本3分别获取了中间结果1、中间结果2、中间结果3，即第一中间结果1包括了中间结果1、中间结果2以及中间结果3。参与方A2针对维护的训练样本4、训练样本5、训练样本6分别获取了中间结果4、中间结果5、中间结果6，即另一个第一中间结果(第一中间结果2)包括了中间结果4、中间结果5以及中间结果6。假设训练样本1、训练样本2、训练样本3的对齐样本分别是训练样本1’、训练样本2’、训练样本3’；训练样本4、训练样本5、训练样本6的对齐样本分别是训练样本4’、训练样本5’、训练样本6’。参与方B的训练样本包括训练样本1’、训练样本2’、训练样本3’、训练样本4’、训练样本5’以及训练样本6’。假设参与方B针对训练样本1’、训练样本2’、训练样本3’、训练样本4’、训练样本5’以及训练样本6’获取的中间结果分别是中间结果1’、中间结果2’、中间结果3’、中间结果4’、中间结果5’以及中间结果6’。即中间结果1’、中间结果2’、中间结果3’、中间结果4’、中间结果5’以及中间结果6’中的每个中间结果均相当于第二中间结果。由于中间结果1’、中间结果2’、中间结果3’是基于训练样本1’、训练样本2’、训练样本3’获取的，而训练样本1’、训练样本2’、训练样本3’是训练样本1、训练样本2、训练样本3的对齐样本，而训练样本1、训练样本2、训练样本3是参与方A1维护的训练样本，所以参与方B向参与方A1发送的第二中间结果包括中间结果1’、中间结果2’、中间结果3’。同理，参与方B向参与方A2发送的第二中间结果包括中间结果4’、中间结果5’以及中间结果6’。

303、参与方A1利用接收到的第二中间结果和第一中间结果1更新A1模型的参数。

303'、参与方A2利用接收到的第二中间结果和第一中间结果2更新A2模型的参数。

303”、参与方B利用第二中间结果、第一中间结果1和第二中间结果2更新B模型的参数。

本申请实施例提供的方案，参与方B和参与方A1是纵向联邦训练的参与方，参与方B和参与方A2是纵向联邦训练的参与方。参与方B获取了多个第一中间结果后，向参与方A1和参与方A2发送不同的第二中间结果。通过这种设计方式，参与方B在模型的训练过程中，融合了自身维护的训练样本提供的信息，以及参与方A1和参与方A2各自维护的样本提供的信息，相比于只能利用参与方A1维护的样本提供的信息或者只能利用参与方A2维护的样本提供的信息，本申请实施例提供的方案能够获取性能更优的模型。此外，参与方A1和参与方A2是横向联邦训练的参与方，由于参与方B是利用了参与方A1和参与方A2各自维护的样本提供的信息来更新其维护的模型的参数，当不断利用更新后的模型获取第二中间结果，并将不同的第二中间结果传递给参与方A1和参与方A2，也可以使参与方A1和参与方A2间接利用了除自身之外的其他A类型设备维护的样本提供的信息。

为了更好的理解图3对应的实施例，下面结合图4对本申请实施例提供的方案进行进一步的介绍：

401、参与方A1获取初始化模型参数WA1。

在初始状态下，其中初始状态可以理解为还没有开始训练过程之前，参与方A1获取初始模型的参数。本申请中的模型包括神经网络模型，本申请对模型的具体类别并不进行限定，比如本申请中的模型可以是卷积神经网络模型，循环神经网络模型，深度残差网络模型等等。以下对于模型的定义和理解不再重复说明。

在一个可能的实施方式中，参与方A1可以从本地获取初始模型，对初始模型的参数进行随机的初始化。

在一个可能的实施方式中，参与方A1可以从其他设备中获取初始模型，比如从云侧设备获取初始模型。

401'、参与方A2获取初始化模型参数WA2。

在一个可能的实施方式中，参与方A2可以从本地获取初始模型，对初始模型的参数进行随机的初始化。

在一个可能的实施方式中，参与方A2可以从其他设备中获取初始模型，比如从云侧设备获取初始模型。

在一个可能的实施方式中，参与方A2获取的初始化模型和参与方A1获取的初始化模型是相同的，即WA2与WA1相同。在一个可能的实施方式中，参与方A2获取的初始化模型和参与方A1获取的初始化模型是不同的，即WA2与WA1不同。

401”、参与方B获取初始化模型参数WB。

在一个可能的实施方式中，参与方B可以从本地获取初始模型，对初始模型的参数进行随机的初始化。

在一个可能的实施方式中，参与方B可以从其他设备中获取初始模型，比如从云侧设备获取初始模型。

402、参与方A1基于WA1和A1本地的数据获取中间结果U1。

步骤402可以参照图3对应的实施例中的步骤301进行理解。可以根据参与方A1维护的模型可以对A1本地的数据进行特征提取，以获取特征向量，再根据特征向量和参与方A1维护的模型参数(这里即为WA1)进行乘法运算，以获取中间结果U1。

402'、参与方A2基于WA2和A2本地的数据获取中间结果U2。

步骤402'可以参照图3对应的实施例中的步骤301'进行理解。可以根据参与方A2维护的模型可以对A2本地的数据进行特征提取，以获取特征向量，再根据特征向量和参与方A2维护的模型参数(这里即为WA2)进行乘法运算，以获取中间结果U2。

402”、参与方B基于WB和B本地的数据获取中间结果U3。

步骤402”可以参照图3对应的实施例中的步骤301”进行理解，这里不再重复赘述。

404、参与方B向参与方A1发送部分U3。

404'、参与方B向参与方A2发送另一部分U3。

步骤404和步骤404'可以参照图3对应的实施例中的302和步骤302'进行理解，这里不再重复赘述。

405、参与方A1基于U1和接收到的U3以及A1本地数据获取梯度G1。

因为希望模型的输出尽可能的接近真正想要预测的值，所以可以通过比较当前模型的预测值和真正想要的目标值，再根据两者之间的差异情况来更新每一层神经网络的权重向量，比如，如果模型的预测值高了，就调整权重向量让它预测低一些，不断的调整，直到模型能够预测出真正想要的目标值。因此，就需要预先定义“如何比较预测值和目标值之间的差异”，这便是损失函数(loss function)或目标函数(objective function)，它们是用于衡量预测值和目标值的差异的重要方程。其中，以损失函数举例，损失函数的输出值(loss)越高表示差异越大，那么模型的训练就变成了尽可能缩小这个loss的过程。梯度为模型在训练过程中，模型参数的变化量，可以反映损失值的变化趋势。

其中可以根据UA和参与方A1接收到的U3之间的运算确定参与方A1维护的模型的预测值，根据A1本地数据确定真正想要预测的值，并根据二者的差异确定梯度G1。

405'、参与方A2基于U2和接收到的U3以及A2本地数据获取梯度G2。

可以根据UA和参与方A2接收到的U3之间的运算确定参与方A2维护的模型的预测值，根据A2本地数据确定真正想要预测的值，并根据二者的差异确定梯度G2。

405”、参与方B基于U1、U2和U3以及B本地数据获取梯度G3。

可以根据U1、U2和U3确定参与方B维护的模型的预测值，根据B本地数据确定真正想要预测的值，并根据二者的差异确定梯度G3。

406、参与方A1根据G1更新模型WA1。

406'、参与方A2根据G2更新模型WA2。

406”、参与方B根据G3更新模型WB。

407、参与方A1获取是否满足迭代训练条件。

本申请实施例的迭代训练条件可以有多种，本申请实施例对此并不进行限定。

在一个可能的实施方式中，当参与方A1获取当前维护的模型已经收敛，则确定已经满足停止迭代训练的条件，不再对参与方A1维护的模型继续进行迭代训练。在一个可能的实施方式中，当参与方A1获取迭代训练的轮次已经达到预设的次数，则确定已经满足停止迭代训练的条件，不再对参与方A1维护的模型继续进行迭代训练。

在一个可能的实施方式中，若参与方A1获取不满足迭代训练的条件，则参与方A1继续对维护的模型进行迭代训练，在本申请实施例提供的方案，参与方A1获取不满足迭代训练的条件时，重复执行步骤402至步骤407。需要说明的是，相应的，在迭代训练的过程中，初始化参数WA1已经被更新，步骤402至步骤407中与初始化参数WA1相关的步骤，应当将WA1替换为参与方A1当前维护的模型的参数，以下对此不再重复赘述。比如，步骤402对应变更为根据参与方A1当前维护的模型的参数和参与方A1本地的数据获取中间结果U1。步骤406对应变更为根据G1更新参与方A1当前维护的模型的参数。

407'、参与方A2获取是否满足迭代训练条件。

关于迭代训练的条件可以参照步骤407中关于A1获取是否满足迭代训练条件的介绍进行理解。

在一个可能的实施方式中，若参与方A2获取已经满足迭代训练条件，则停止对参与方A2维护的模型进行迭代训练。

在一个可能的实施方式中，若参与方A2获取未满足迭代训练条件，则重复执行步骤402'至步骤407'。需要说明的是，相应的，在迭代训练的过程中，初始化参数WA2已经被更新，步骤402'至步骤407'中与初始化参数WA2相关的步骤，应当将WA2替换为参与方A2当前维护的模型的参数，以下对此不再重复赘述。比如，步骤402'对应变更为根据参与方A2当前维护的模型的参数和参与方A2本地的数据获取中间结果U2。步骤406'对应变更为根据G2更新参与方A2当前维护的模型的参数。

407”、参与方B获取是否满足迭代训练条件。

关于迭代训练的条件可以参照步骤407中关于A1判断是否满足迭代训练条件进行理解。

在一个可能的实施方式中，若参与方B获取已经满足迭代训练条件，则停止对参与方A2维护的模型进行迭代训练。

在一个可能的实施方式中，若参与方B获取未满足迭代训练条件，则重复执行步骤402”至步骤407”。需要说明的是，相应的，在迭代训练的过程中，初始化参数WB已经被更新，参与方A1和参与方A2各自维护的模型的参数也已经更新，步骤402”至步骤407”中与初始化参数WB、WA1、WA2相关的步骤，应当相应替换为根据各个参与方维护的模型的当前参数来计算，以下对此不再重复赘述。比如，步骤402”对应变更为根据参与方B当前维护的模型的参数和参与方B本地的数据获取中间结果U3。步骤406”对应变更为根据G2更新参与方B当前维护的模型的参数。

需要说明的是，在一些实施方式中，本申请实施例描述的各个步骤的顺序可以调换或者可以同步执行，以下实施例对此不再重复赘述。

上图所描述的架构中，参与联邦训练的参与方可以分为两类，A类型的参与方与B类型的参与方。其中，A类型的参与方与B类型的参与方均支持有多个(为了便于说明，上图中参与模型训练的B类型的参与方只有一个)。属于同一类(如A类)参与方的不同参与方A1-AN其数据的特征空间相同，但样本空间不同。属于不同类的参与方(如A类型的参与方与B类型的参与方)的数据的特征空间不同但互相之间存在相同的数据标识ID(即同一条数据样本的不同特征分别在A方与B方，即样本空间相同)。本申请实施例有时也将数据ID称为样本ID，他们标识相同的意思。

为了提升模型训练的效率，还可以对A类型的参与方各自维护的模型的参数进行统一处理，下面参阅图5，结合具体的实施例对此进行介绍。

501、参与方A1获取初始化模型参数WA1。

501'、参与方A2获取初始化模型参数WA2。

501”、参与方B获取初始化模型参数WB。

步骤501至步骤501”可以参照图4对应的实施例中的步骤401至步骤401”进行理解，这里不再重复赘述。

502、参与方A1广播模型当前的参数，接收其他A类型的参与方发送的参数，进行参数加权得到WA。

如果参与方A1维护的模型的当前的参数是WA1，则参与方A1向其他A类型的参与方广播WA1。同时参与方A1也会接收其他A类型的参与方广播的各自维护的模型的当前参数，比如参与方A1也会接收参与方A2广播的参与方A2维护的模型的当前参数，比如参与方A2维护的模型的当前参数为W2，则参与方A1接收参与方A2广播的参数W2。

参与方A1对获取到的所有A类型的参与方各自维护的模型的当前的参数进行加权处理，以得到WA。

在一个可能的实施方式中，参与方A1对获取到的所有A类型的参与方各自维护的模型的当前的参数求平均值，该平均值即为WA。

在一个可能的实施方式中，参与方A1可以对获取到的所有A类型的参与方各自维护的模型的当前的参数进行加和处理，二者之和即为第一加权值。

在一个可能的实施方式中，可以根据所有A类型的参与方各自维护的模型的训练样本的数量获取所有A类型的参与方各自维护的模型的当前的参数的权重。其中，训练样本的数目和权重成正比。比如，参与方A1的训练样本的数目比参与方A2的训练样本的数目更多，则参与方A1维护的模型的当前的参数的权重比参与方A2维护的模型的当前的参数的权重大，参与方A1的训练样本的数目比参与方A2的训练样本的数目更少，则参与方A1维护的模型的当前的参数的权重比参与方A2维护的模型的当前的参数的权重小。

502'、参与方A2广播模型当前的参数，接收其他A类型的参与方发送的参数，进行参数加权得到WA。

步骤502'可以参照步骤501中参与方A1执行的过程进行理解，这里不再重复赘述。

503、参与方A1基于WA和A1本地的数据获取中间结果U1。

不同于图4对应的实施例中，参与方A1基于WA1和A1本地的数据获取中间结果U1，各个A类型的参与方均基于各自的参数来获取中间结果。在每一次迭代训练的起始状态时，各个A类型的参与方维护的模型的参数均是不相同的，所以对于整个联邦***而言，需要优化多个参数，消耗大量算力。在图5对应的实施例中，将参与方A1维护的模型的参数替换为WA，在每一次迭代训练的起始状态时，各个A类型的参数方维护的模型的参数是相同的，所以对于整个联邦***而言，需要优化的参数的数目大大降低，节约算力，有利于提升训练的效率。

关于如何基于参与方A1维护的模型的参数以及参与A1本地的数据获取中间结果U1的过程可以参照图4对应的实施例中的步骤402进行理解，这里不再重复赘述。

503'、参与方A2基于WA和A2本地的数据获取中间结果U2。

与步骤503执行的过程相似，在每一次迭代训练的起始状态时，参与方A2将参与方A2维护的模型的参数替换为WA，保证各个A类型的参数方维护的模型的参数是相同的，节约算力，有利于提升训练的效率。

关于如何基于参与方A2维护的模型的参数以及参与A2本地的数据获取中间结果U2的过程可以参照图4对应的实施例中的步骤402'进行理解，这里不再重复赘述。

503”、参与方B基于WB和B本地的数据获取中间结果U3。

504、参与方B向参与方A1发送部分U3。

504'、参与方B向参与方A2发送另一部分U3。

506、参与方A1基于U1和接收到的U3以及A1本地数据获取梯度G1。

506'、参与方A2基于U2和接收到的U3以及A2本地数据获取梯度G2。

506”、参与方B基于U1、U2和U3以及B本地数据获取梯度G3。

507、参与方A1根据G1更新模型当前的参数。

507'、参与方A2根据G2更新模型当前的参数。

507”、参与方B根据G3更新模型当前的参数。

508、参与方A1获取是否满足迭代训练条件。

508'、参与方A2获取是否满足迭代训练条件。

508”、参与方B获取是否满足迭代训练条件。

步骤503”至步骤508”可以参照图4对应的实施例中的步骤402”至步骤407”进行理解，这里不再重复赘述。

在图5对应的实施例中，各个A类型的参与方广播各自维护的模型的参数，使每个A类型的参与方都可以获取其他A类型的参与方维护的模型的参数，并获取WA。在一些可能的实施方式中，各个A类型的参与方也可以定向的将各自维护的模型的参数发送给某个设备(比如某一个A类型的参与方或者其他设备)，该设备获取了各个A类型的参与方各自维护的模型的参数后，进行加权处理获取WA，再将WA广播至各个A类型的参与方。

在一个可能的实施方式中，当A类型的参与方满足迭代训练条件时，还可以重复执行一次步骤502以及502'后，确定执行了步骤502以及502'后获取的模型为最终训练后的模型。比如，参与方A1获取满足迭代训练条件时，获知其他A类型的参与方也满足了迭代训练条件，则参与方A1广播模型当前的参数，并接收其他A类型的参与方发送的参数，进行参数加权处理得到WA，再利用WA更新参与方A1维护的模型的当前的参数，以获取最终的模型，进而训练结束后，各个A类型的参与方维护的模型的参数是相同的。

在一些可能的实施方式中，为了维护各个参与方的数据的隐私，还可以对各个参与方发送的数据进行加密处理，下面参阅图6，结合具体的实施方式进行说明。

601、参与方A1获取初始化模型参数WA1。

601'、参与方A2获取初始化模型参数WA2。

601”、参与方B获取初始化模型参数WB。

步骤601至步骤601”可以参照图4对应的实施例中的步骤401至步骤401”进行理解，这里不再重复赘述。

602-602”、***中各个参与方向其他参与方发送各自的公钥。

在图6对应的实施例中，***中各个参与方各自生成公钥和私钥，并将生成的公钥发送给***中其他参与方。

比如，在图6所展示的架构中，假设参与方A1生成第一公钥和第一私钥，并将第一公钥向参与方A2和参与方B发送。参与方A2生成第二公钥和第二私钥，并将第二公钥向参与方A1和参与方B发送。参与方B生成第三公钥和第三私钥，并将第三公钥向参与方A1和参与方A2发送。

本申请实施例中描述的公钥是指用于执行同态加密时加密的密钥，私钥是指用于执行同态加密时解密的密钥。同态加密(homomorphic encryption)是一种加密形式，它允许人们对密文进行特定形式的代数运算得到仍然是加密的结果。使用同态密钥对中的密钥对经同态加密后的数据进行运算后的结果进行解密，与对明文进行同样的运算结果一样。

603、参与方A1广播模型当前的参数，接收其他A类型的参与方发送的参数，进行参数加权得到WA。

在图6对应的实施例中，参与方A1利用参与方A1生成的公钥对参与方A1维护的模型的当前的参数进行同态加密。参与方A1广播的是经过同态加密后的模型当前的参数。

参与方A1接收其他A类型的参与方发送的经过同态加密后参数，由于使用同态密钥对中的密钥对经同态加密后的数据进行运算后的结果进行解密，与对明文进行同样的运算结果一样，所以不会影响参与方A1对接收到的经过同态加密后的参数进行加权处理，以得到WA。

通过参数WA更新参与方A1维护的模型的当前的参数，利用经过同态加密后的参数进行加权处理的过程，可以参照图5对应的实施例中的步骤502中描述的获取WA的过程进行理解，这里不再重复赘述。

603'、参与方A2广播模型当前的参数，接收其他A类型的参与方发送的参数，进行参数加权得到WA。

步骤603'可以参照步骤603中参与方A1执行的过程进行理解，这里不再重复赘述。

604、参与方A1基于WA和A1本地的数据获取中间结果U1。

由于WA是利用了基于同态加密后的数据获取的，所以将WA看做同态加密后的数据。具体的，可以参照图4对应的实施例中的步骤402进行理解，这里不再重复赘述。

参与方A1利用其生成的公钥对中间结果U1进行同态加密，并将经过同态加密后的U1向参与方发送。

604'、参与方A2基于WA和A2本地的数据获取中间结果U2。

由于WA是利用了基于同态加密后的数据获取的，所以将WA看做同态加密后的数据。具体的，可以参照图4对应的实施例中的步骤402'进行理解，这里不再重复赘述。

参与方A2利用其生成的公钥对中间结果U2进行同态加密，并将经过同态加密后的U2向参与方发送。

604”、参与方B基于WB和B本地的数据获取中间结果U3。

可以参照图4对应的实施例中的步骤402”进行理解，这里不再重复赘述。

605、参与方B向参与方A1发送同态加密后的部分U3。

参与方B利用其生成的公钥对UA进行同态加密，参与方B利用其生成的公钥对U3进行同态加密。

605'、参与方B向参与方A2发送同态加密后另一部分U3。

607、参与方A1基于U1和接收到的U3以及A1本地数据获取梯度G1。

607'、参与方A2基于U2和接收到的U3以及A2本地数据获取梯度G2。

607”、参与方B基于U1、U2和U3以及B本地数据获取梯度G3。

608、参与方A1根据G1更新模型当前的参数。

608'、参与方A2根据G2更新模型当前的参数。

608”、参与方B根据G3更新模型当前的参数。

609、参与方A1获取是否满足迭代训练条件。

610'、参与方A2获取是否满足迭代训练条件。

611”、参与方B获取是否满足迭代训练条件。

由于使用同态密钥对中的密钥对经同态加密后的数据进行运算后的结果进行解密，与对明文进行同样的运算结果一样，所以不会影响各个参与方获取梯度，并根据梯度更新各自模型的过程，所以步骤607至步骤611”可以参照图4对应的实施例中的步骤405至步骤407” 进行理解，这里不再重复赘述。

需要说明的是，本申请实施例可以包括更多或者更少的步骤，比如对于图6所描述的实施例，步骤603和步骤603'可以不执行，各个参与方在每一次迭代训练的起始状态时，各个A类型的参与方维护的模型的参数均是不相同的。

在上述图6描述的实施方式中，***中各个参与方各自生成公钥和私钥，不依赖第三方生成公钥和私钥，相比于由第三方生成公钥和私钥的方案更为简洁，隐私性更好。需要说明的是，在一些可能的实施方式中，也可以依赖第三方生成公钥和私钥，***中各个参与方利用第三方生成的公钥加密需要发送的数据。

此外，在上述图6描述的实施方式中，***中各个参与方各自生成公钥和私钥，利用各自生成的公钥对各自发送的数据进行同态加密。在一些可能的实施方式中，可以利用***中多个参与方生成的公钥生成公共公钥，通过公共公钥对各个参与方发送的数据进行同态加密。在一些可能的实施方式中，可以利用***中全部参与方生成的公钥生成公共公钥，利用该公共公钥对各个参与方发送的数据进行同态加密。在一些可能的实施方式中，还可以设定大于目标数量的私钥用于对同态加密后的数据进行解密。其中，目标数量可以基于***中当前在线设备的数目设定的，随着***中在线的设备的数据发生变化，可以重新设定目标数量。当设定了大于目标数量的私钥用于对同态加密后的数据进行解密后，如果***中的参与方掉线的数目过多，可能会存在***中不存在足够数量的私钥对同态加密后的数据进行解密，下面参阅图7，结合具体的实施方式对如何应对这种掉线场景进行介绍。

701、参与联邦训练的设备获取在线的设备的数量是否小于阈值。

参与联邦训练的设备可以是上述实施例中描述的***中的任意一个参与方，还可以是除上述实施例之外的其他类型的联邦学习***中的任意一个参与方，比如还可以是图1或图2中描述的架构中的参与方A或者参与方B。

可以根据***中实际包括的设备的总数，以及实际场景需求设置阈值。其中，阈值需要不小于目标数量。当***中掉线的设备的数目过多，***中即将无法提供足够数量(目标数量)的私钥对同态加密后的数据进行解密，在此之前，参与联邦训练的设备通过获取在线的设备的数量是否小于阈值，以提前获取***中是否能够提供足够数量的私钥对同态加密后的数据进行解密。

702、若小于阈值，则向该设备所在的联邦学习***中的其他在线设备发送经过同态加密的该设备维护的模型的当前参数。

若获取在线的设备的数量小于阈值，则说明***中大多数的设备掉线，***即将无法提供足够数量的私钥对同态加密后的数据进行解密。所以本申请提供的方案，参与联邦训练的设备需要提前获取解密后的数据，在线的设备可以利用各自的私钥对该同态加密后的参数进行解密。

703、利用***中在线设备的公钥重新生成公共公钥，并基于新生成的公共公钥对该设备维护的模型的当前参数进行同态加密。

由于在后续的训练过程中，***中各个参与方还会进行交互，各个在线的设备可以通过秘密分享的方式(也称之为同态加密转秘密分享方式)在本地保存利用各自的私钥解密后的数据。通过在后续的交互过程，使参与方A1获取解密后的参数。

参与方A1获取了解密后的参数后，利用重新生成的公共公钥对解密后的参数重新进行同态加密。其中，重新生成的公共公钥是利用当前***中在线的设备生成的公钥生成的。由于当前***中在线的设备的数目变少了，目标数量也设定的更低一些，阈值不小于目标数量，阈值也设定的更低一些。

在一个可能的的实施方式中，在线的设备可以利用各自的私钥对该同态加密后的参数进行解密后，还可以向参与联邦训练的设备发送利用各自的私钥解密后的数据。

需要说明的是，在一些实施方式中，本申请实施例描述的各个实施方式是可以结合的，比如图7所述描述的实施方式可以和图6描述的实施例相结合，具体的可以参照图8所展示的流程进行理解。

801、参与方A1获取初始化模型参数WA1。

802、参与方A1利用公共公钥同态加密模型当前的参数。

803、参与方A1广播同态加密后的模型当前的参数。

804、参与方A1接收其他A类型的参数方的同态加密后的模型的参数。

805、参与方A1对获取到的参数进行加权得到WA。

806、参与方A1基于WA和A1本地的数据获取中间结果U1。

807、参与方A1向参与方B发送同态加密后的U1。

808、参与方A1接收同态加密后的UA和同态加密后的U3。

809、参与方A1基于UA和U3以及A1本地数据获取梯度G1。

810、参与方A1根据梯度G1更新模型当前的参数。

811、参与方A1获取是否满足迭代训练条件。

步骤801至步骤811可以参照图6对应的实施例中参与方A1执行的步骤进行理解，这里不再重复赘述。

812、参与方A1获取在线的设备的数量是否小于阈值。

可以根据***中实际包括的设备的总数，以及实际场景需求设置阈值。其中，阈值需要不小于目标数量。当***中掉线的设备的数目过多，***中即将无法提供足够数量(目标数量)的私钥对同态加密后的数据进行解密，在此之前，参与方A1通过获取在线的设备的数量是否小于阈值，以提前获取***中是否能够提供足够数量的私钥对同态加密后的数据进行解密。

如果参与方A1获取在线的设备的数目不小于阈值，则执行步骤803，即正常执行迭代训练的过程。

若参与方A1获取在线的设备的数量不小于阈值，则说明***中大多数的设备是在线的，***可以提供足够数量的私钥对同态加密后的数据进行解密。则此时正常执行迭代训练的过程，具体的，执行步骤803至步骤811。在一个可能的实施方式中，当参与方A1获取已经满足迭代训练条件，则不再执行迭代训练的过程，参与方A1可以再次获取在线的设备的数量是否小于阈值，若不小于阈值，则认为完成了训练。

如果参与方A1获取在线的设备的数据小于阈值，则执行步骤813至815，下面分别对此进行说明。

若参与方A1获取在线的设备的数量小于阈值，则说明***中大多数的设备掉线，***即将无法提供足够数量的私钥对同态加密后的数据进行解密。所以本申请提供的方案，参与方A1需要提前获取解密后的数据，利用当前在线的设备生成的公钥重新生成新的公共公钥，并利用新生成的公共公钥重新对数据进行同态加密。

在一个可能的实施方式中，如果参与方A1获取在线的设备的数目小于阈值，则执行步骤813-813’。参与方A1向***中当前在线的设备发送经过同态加密后的参与方A1维护的模型的当前的参数，在线的设备可以利用各自的私钥对该同态加密后的参数进行解密。此时，同态加密后的数据是利用公共公钥进行同态加密的数据，需要大于目标数量的私钥对同态加密后的数据进行解密。由于，参与方A1获取在线的设备的数目小于阈值，不小于目标数量，所以***中存在足够数量的私钥对同态加密后的数据进行解密，以获取解密后的数据。

在一个可能的实施方式中，在线的设备可以将利用各自的私钥解密后的数据向参与方A1发送，以使参与方A1融合各个在线的设备发送的数据后，获取解密后的参数。

在一个可能的实施方式中，由于在后续的迭代训练过程中，***中各个参与方还会进行交互，在线的设备也可以不向参与方A1发送利用各自的私钥解密后的数据。各个在线的设备通过秘密分享的方式在本地保存利用各自的私钥解密后的数据。通过在后续的交互过程，使参与方A1获取解密后的参数。具体的，在一个可能的实施方式中，如果参与方A1获取在线的设备的数目小于阈值，参与方A1向***中当前在线的设备发送经过同态加密后的参与方A1维护的模型的当前的参数，在线的设备接收到A1发送来的经同态加密的模型的当前参数后，本地随机生成与模型参数结构相同的随机初始化模型，并使用A1方发送来的经同态加密的模型参数减去本地随机生成的随机初始化模型，本地保留自己随机初始化模型作为A1模型在本地的秘密分享模型，同时利用各自的私钥对该相减后得到的模型参数进行解密，在线的设备利用各自的私钥解密后的数据(密文模型减去随机生成的本地秘密分享模型后的仍然在同态加密状态的模型)向参与方A1发送，以使参与方A1融合各个在线的设备发送的数据后，获取自己原有模型的秘密分享模型。由于在后续的迭代训练过程中，***中各个参与方还会进行交互，后面使用新生成的公共秘钥同态加密各个在线设备的秘密分享模型，并进行汇聚(加和)，完成模型转换。

A类型的参与方获取到***中在线的设备的数量小于阈值，以及不小于阈值所执行的过程均可以参照参与方A1执行的过程进行理解，这里不再重复赘述。

B类型的参与方在执行了获取是否满足迭代训练条件之前，或者在执行了根据梯度更新模型当前的参数之后，可以获取在线的设备的数量是否小于阈值，当小于阈值时，执行正常的迭代训练过程，当不小于阈值时，向在线的设备发送经过同态加密后的参与方B维护的模型的当前的参数，在线的设备可以利用各自的私钥对该同态加密后的参数进行解密。具体的，可以参照参与方A1执行的步骤812至815进行理解，这里不再详细赘述。

上文实施例介绍到由于在纵向联邦学习***中，多方参与方的用户群体不同，需要对多方维护的数据进行对齐处理，以保证多方维护的模型的训练样本的样本空间相同。通常，参与纵向联邦的多方可以采用加密样本对齐的方式找到不同参与方之间用户的交集，从而利用有交集的用户数据进行协同建模(只在一方存在的用户，其数据在多方之间并不同时存在，因此多方无法利用此用户的数据进行协同建模)。如果不采用加密样本对齐的方式，多方之间如果明文发送其所拥有的用户标识ID(如用户手机号等)信息，一方面存在合规问题，另一方法会泄露自己所拥有的客户群信息，是部分参与联邦的组织所无法接受的。而现有的加密样本对齐方案，保证的是在多方用户数据求交集过程中***露参与方的用户集合，但在求交结束后多方交集用户会被其他参与方获取，在特定的场景下参与方技术交集用户信息也并不希望泄露，针对此种场景，本实施例提供了一种新的加密样本对齐的方案，保证在多方用户数据求交集过程后，参与联邦的各方均无法获取多方交集用户信息，但依然可以基于求交结果进行模型的训练。下面参阅图9，结合具体的实施方式进行介绍。

901、参与纵向联邦的设备获取第一向量。

本申请实施例提供的方案可以适用于任意一种参与纵向联邦的设备，比如可以是上述实施例中描述的参与方A1和参与方B，还可以是上述实施例中描述的参与方A2和参与方B。

第一向量具有N个维度，N个维度对应***中全部样本的标识ID，比如一个维度对应一个样本的ID。在一个可能的实施方式中，该参与纵向联邦的设备可以接收其所在***中其他设备发送的各自具有的样本中的最大ID和最小ID，并基于获取到的全部最大ID中的最大值，以及全部最小ID中的最小值确定N的取值。

第一向量的第一维度的取值用于指示该参与纵向联邦的设备维护的模型的样本中是否存在第一目标样本的ID，第一维度对应第一目标样本的ID。换句话说，第一向量的某个维度的取值用于指示该参与纵向联邦的设备维护的模型的样本中是否存在该维度对应的样本的ID。比如，在一个可能的实施方式中，第一维度的取值为0，代表该参与纵向联邦的设备维护的模型的样本中不存在第一目标样本的ID，第一维度的取值为1，代表该参与纵向联邦的设备维护的模型的样本中存在第一目标样本的ID。

902、参与纵向联邦的设备基于同态加密后的第二向量和第一向量获取目标向量。

第二向量和第一向量具有相同的维度，第二向量可能有多个。

每个第二向量的第一维度的取值用于指示该参与纵向联邦的设备所在的***中的其他设备中的一个设备维护的模型的样本中是否存在第一目标样本的ID。

该参与纵向联邦的设备基于获取到的全部同态加密后的第二向量和第一向量，可以获取到目标向量，比如，可以对获取到的全部同态加密后的第二向量和第一向量进行乘法运算，以获取目标向量。

903、参与纵向联邦的设备根据目标向量获取对齐样本。

目标向量具有N个维度，该N个维度中一个维度的取值用于该维度对应的样本的标识，是否存在于***中每个设备具有的样本的ID中。

该参与纵向联邦的设备可以根据该目标向量中每个维度的取值，获取对齐样本。

图9对应的实施例，通过引入第一向量，对应***中全部样本的标识ID，保证在获取对齐样本后，参与联邦的各方均无法获取对齐样本的信息，保护了参与联邦训练的参与方的数据隐私，还依然可以基于对齐样本进行模型的训练。

为了更好的理解这一方案，下面再结合一个具体的实施方式进行介绍。

首先，各个参与方基于自有数据集获取数据集中每个样本的最大ID与最小ID。其中，ID可能是电话号码等标识。各个参与方将各自的最大ID与最小ID广播给各个参与方，各个参与方接收后计算所有参与联邦的参与方的最大ID与最小ID。

以一个参与方User_X为例，其流程如下：

基于自有数据集的样本ID计算其最大ID与最小ID分别为User_X_ID_max，User_X_ID_min。

广播自有最大ID，最小ID给参与联邦的多方。在一个可能的实施方式中，也可以在最大ID基础之上加大数值，在最小ID基础之上减小数值，从而隐藏掉样本ID的精确值。

接收参与联邦的多方发送来的其最大ID与最小ID，计算获取到的所有ID中的最大ID与最小ID分别为ID_max，ID_min。

然后，各方基于ID_max，ID_min生成全量标识向量(比如图9对应的实施例中的第一向量、第二向量)，并基于自有样本ID填充全量用户标识向量中自己所有的样本所对应位置的标识(比如图9对应的实施例中的获取第一向量每个维度的取值，或者第二向量每个维度的取值)，同态加密赋值后的全量用户标识向量，然后广播给参与联邦的各个参与方。

在一个可能的实施方式中，全量标识向量的大小基于ID_max和ID_min确定，向量的第一个位置代表样本ID_min，最后一个位置代表ID_max。或者，向量的第一个位置代表样本ID_max,最后一个位置代表ID_min。第一个位置和最后一个位置之间的位置代表样本ID位于最大ID与最小ID之间的样本ID对应的位置。

以一个参与方User_X为例，其流程如下：

初始的全量标识向量各个维度的取值均为0。基于参与方User_X具有的所有的样本ID，对自有的全量标识向量赋值，将全量标识向量所有位置中与User_X具有的所有的样本ID的位置置为1。

User_X利用公共公钥同态加密赋值后的自有全量标识向量[[User_X]]，并广播[[User_X]]。

User_X接收其他参与方广播来的各自的加密全量标识向量，将自有的[[User_X]]与其他各方发送来的各自的加密全量标识向量相乘，得到公共的所有参与方共有的加密全量标识向量[[User_ID_Set]]。

利用[[User_ID_Set]]获取多方用户交集的样本ID，并利用交集的样本作为训练样本。在一个可能的实施方式中，也可以解密解密[[User_ID_Set]]，各方基于解密后的User_ID_Set提取自有数据中与其他各方交集的样本作为模型的训练数据。

图9对应的实施例，该参与纵向联邦的设备获取了目标向量后，根据目标向量从本地的全部样本中获取对齐样本，并将对齐样本作为训练样本。

下面结合一个具体的例子对方案进行介绍：

参阅图10，以两个参与方为例对方案进行举例说明。假设参与纵向联邦训练的参与方包括参与方A1以及参与方B。并假设参与方A1具有的样本(或者说参与方A1的自有数据集)包括候选训练样本1、候选训练样本2、候选训练样本3、候选训练样本4以及候选训练样本5。假设参与方B具有的样本(或者说参与B的自有数据集)包括候选训练样本1、候选训练样本2、候选训练样本3、候选训练样本6以及候选训练样本7。

假设如图10所示，参与方A1基于自有数据集包括的数据获取其最大样本ID为10，最小样本ID为2，参与方B基于自有数据集包括的数据获取其最大样本ID为10，最小样本ID为1。参与方A1和参与方B广播各自的最大样本ID和最小ID。

假设参与方A1、参与方B根据获取到的全部样本ID，获取全部样本ID中最大ID为10，最小ID为1。以参与方A1为例继续举例说明，则参与方A1根据获取到的最大ID(10)以及最小ID(10)生成全量标识向量，一共包括10个维度。参与方A1根据自有数据集中包括的样本的ID对参与方A1生成的全量标识向量进行赋值，具体的可以参照图10所展示的赋值结果进行理解。参与方A1对赋值后的自有生成的全量标识向量进行同态加密，并广播该加密的全量标识向量。参与方B执行的过程与参与方A1相似，具体的可以参照图10进行理解。参与方A1接收了参与方B发送的参与方B生成的加密的全量标识向量，并对获取到的全部加密的全量标识向量进行相乘运算，以获取公共的所有参与方共有的加密全量标识向量，本申请也称之为目标向量。参与方A1再根据目标向量获取对齐样本作为训练样本。

通过图9、图10所描述的实施方式获取的对齐样本(训练样本)的方式，可以适用于图3至图8中描述的实施方式中，获取参与方A1与参与方B的对齐样本(图3至图8中描述的实施方式中的A1本地的数据、B本地的数据)，或者获取参与方A2与参与方B的对齐样本(图3至图8中描述的实施方式中的A2本地的数据、B本地的数据)。

在一个可能的实施方式，该参与纵向联邦的设备获取了目标向量后，可以将本地的全部样本作为训练样本，在训练过程中，该参与纵向联邦的设备获取了中间结果后，将该中间结果和该目标向量进行乘法运算，对该乘法运算后的结果进行同态加密，并在***中传递该经过同态加密后的乘法运算后的结果。比如，对于图3至图8中描述的实施方式中，A1本地的数据、B本地的数据不再是对齐样本，而是A1的全部样本，即A1的自有数据集，B的全部样本，即B的自有数据集。A2本地的数据、B本地的数据不再是对齐样本，而是A2的全部样本，即A2的自有数据集，B的全部样本，即B的自有数据集。此外，对于图3至图8中描述的实施方式中，各个参与方获取了中间结果后，将该中间结果与各自获取的目标向量进行乘法运算，后续与中间结果相关的计算，可以是同态加密后的利用与各自获取的目标向量进行乘法运算的结果。

下面通过表1更清楚的展示本申请实施方式的优势。

表1：

本申请实施例提供的方案能够同时利用相同特征空间，不同样本空间的数据，以及不同特征空间，相同样本空间的数据作为训练样本来训练模型。本申请实施例提供的方案，可以拓宽联邦学习的应用场景，示例性的，下面给出两种可能的应用场景：

场景一：参与方B为电商，其拥有很多用户在其网站上的点击，收藏以及购买记录数据，A类用户为运营商类用户，不同的A类用户为不同的电信运营商，如移动，电信，联通等，其拥有很多用户的通信类信息，如套餐价格，通话频次等信息。同时B类用户与A类用户存在交叉用户(如利用相同手机号标识的用户)。此时B方可以与A类用户多方协同建立一个AI模型用于B方用户的商品推荐。

场景二：参与方B为电商(比如保存电商数据的设备等)，其拥有很多用户在其网站上的点击，收藏以及购买记录数据，A类用户为电商网站用户(用户的手机、其他终端设备等)，用户手机上拥有用户在手机上的行为信息，包括各类app的数目，每天使用手机的时间等行为信息，经过用户同意后可以利用这一类信息与B类电商用户协同建立模型，用于B方用户的商品推荐。

这里结合场景二，以及一种可能的实施方式，对方案进行举例介绍：

首先，各个电商网站用户和电商生成各自的公钥和私钥，并交换彼此的公钥，即每个电商网站用户将生成的公钥广播给其他电商网站用户以及电商，每个电商广播其生成的公钥给所有电商网站用户。各个电商网站用户和电商根据接收到的公钥和本地生成的公钥合成公共公钥，并利用该公共公钥给后续发送的数据(比如中间结果)进行同态加密。

各个电商网站用户使用公共公钥加密各自的模型参数，并广播加密后的模型参数，各个电商网站用户使用本地加密后的模型参数和接收到的加密后的模型参数获取公共模型的参数，以利用该公共模型获取各自的中间结果。

各个电商网站用户利用密文的公共模型和各自本地数据生成密文中间结果，并将该密文中间结果发送给电商。电商利用本地模型，本地数据获取其中间结果。

电商将其获取的中间结果发送给各个电商网站用户，各个电商网站用户接收到的电商发送的中间结果是不同的，各个用户和电商使用获取到的中间结果计算梯度，并更新各自的模型。

当电商网站用户存在大量掉线用户时，比如当电商网站用户数目达到阈值时，剩余在线的电商网站用户使用分布式阈值同态加密转秘密分享技术，将各自的模型在已有在线用户处转成秘密份额的行驶。当前在线的电商网站用户使用分布式阈值加密技术生成密钥，并基于该密钥使用秘密分享转分布式阈值同态加密技术将模型的秘密份额转化为同态加密。

上述场景一和场景二，***中包括的各个参与方维护的模型的训练样本的数据类型可以看做是用户数据，其中，用户数据可以理解为根据用户的行为产生的数据(比如，由于用户对各个参与方部署的设备的操作行为而产生的数据：具体的，比如上述场景一提到的因用户在网站上的点击行为、收藏行为产生的数据)，也可以理解为联邦学习***的参与方为用户提供服务时产生的与具体用户相关的数据(比如，上述场景一提到的套餐价格、通话频次)。示例性的，下面再给出两种训练样本的数据类型为用户数据时，可能的应用场景实例：

在一种可能的实施方式中，参与方B为运营商，运营商维护了多种类型的网元，其中每种类型的网元获取到的数据可以组成训练样本中数据运营商侧的特征数据。参与方B可以存在多个，比如移动，电信，联通等。参与方A为互联网公司，其拥有用户在使用互联网业务时(如看视频，网页等)产生的数据。可以利用参与方A与参与方B的各自维护的数据协同建立业务流业务体验模型，用于参与方B识别其用户的业务体验。

参照表2，为上述场景下***中的训练样本的数据集的示例。

表2：

其中，行号1-3的是互联网公司侧拥有的数据举例，行号4-12为运营商拥有的数据举例。行号1对应的数据可以做为模型训练的标签数据，即用户的业务体验作为标签数据。第1-12行的数据为同一用户在多个实体的数据。

应用功能(application function，AF)实体：用于提供业务，或者进行与应用有关的数据的路由。用户面功能(user plane function，UPF)网元：负责终端设备的用户数据的转发和接收。可以从数据网络(data network，DN)接收用户数据，通过接入网设备传输给终端设备；UPF网元还可以通过接入网设备从终端设备接收用户数据，转发到数据网络。接入网设备，可以是将终端设备接入到无线网络的无线接入网(radio accessnetwork，RAN)节点。目前，一些RAN节点的举例为：下一代基站(next generation NodeB，gNB)、传输接收点(transmission reception point，TRP)、演进型节点B(evolved Node B，eNB)、无线网络控制器(radio network controller，RNC)、节点B(Node B，NB)、基站控制器(base station controller，BSC)、基站收发台(base transceiver station,BTS)、家庭基站(例如，home evolved NodeB，或home Node B，HNB)、基带单元(base band unit，BBU)，或无线保真(wireless fidelity，WiFi)接入点(access point，AP)等。其中，基站可能有多种形式，比如宏基站、微基站、中继站和接入点等。本申请实施例涉及到的基站可以是5G***中的基站或LTE***中的基站，或未来的通信***中未来的第六代(6th generation，6G)基站。其中，5G***中的基站还可以称为发送接收点(transmission reception point，TRP)或下一代节点B(generation Node B，gNB或gNodeB)。为了便于说明，本申请实施例将接入网设备简称为RAN。

在一种可能的实施方式中，参与方B为运营商，其拥有很多用户的通信类信息，如套餐价格，通话频次等信息。参与方A为银行，其拥有用户的身份信息，业务流水等信息。此时B方可以与A类用户多方协同建立一个AI模型用于提供对参与方A的用户的贷款建议。

参照表3，为上述场景下***中的训练样本的数据集的示例。

表3：

行号为1的数据(即status)做为模型训练的标签数据。行号1-9对应的数据为银行业务***服务器获得的数据，行号为10-14对应的数据为运营商业务***获得的数据。行号1-14的数据为同一用户在不同参与方(实例中为参与方A和参与方B)的数据。

此外，在一些可能的实施方式中，***包括的各个参与方维护的模型的训练样本也可以都是相同特征空间，不同样本空间的数据。在一些可能的实施方式中，***包括的各个参与方维护的模型的训练样本也可以都是不同特征空间，相同样本空间的数据。具体的实施方式可以参照上述各个实施例进行理解，这里不再重复赘述。

以上对本申请提供的一种机器学习模型更新的***以及方法进行了介绍，通过本申请实施例提供的方案，可以拓宽联邦学习的应用场景，使各个参与方训练后的模型的预测结果更加精准。可以理解的是，上述参与方为了实现上述功能，其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到，结合本文中所公开的实施例描述的各示例的模块及算法步骤，本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

从硬件结构上来描述，图3至图10中的参与方或者设备可以由一个实体设备实现，也可以由多个实体设备共同实现，还可以是一个实体设备内的一个逻辑功能模块，本申请实施例对此不作具体限定。下面基于前述的机器学习模型更新的***以及方法，对本申请提供的装置进行阐述，该装置用于执行前述图3至图10对应的方法的步骤。

参阅图11，为本申请实施例提供的一种机器学习模型的更新设备的结构示意图。

该设备包括收发模块1101以及处理模块1102。

当该设备是上述图3至图10对应的实施例中描述的参与方A1时：

收发模块1101用于执行图3对应的实施例中的步骤301以及图3对应的实施例中其他与收发相关的步骤。处理模块1102用于执行图3对应的实施例中的步骤301、步骤303以及图3对应的实施例中其他与数据处理相关的步骤。

在一个可能的实施方式中，收发模块1101用于执行图4对应的实施例中的步骤402、405以及图4对应的实施例中其他与收发相关的步骤。处理模块1102用于执行图4对应的实施例中的步骤401、402、405、406、407以及图4对应的实施例中其他与数据处理相关的步骤。

在一个可能的实施方式中，收发模块1101用于执行图5对应的实施例中的步骤502、503以及图5对应的实施例中其他与收发相关的步骤。处理模块1102用于执行图5对应的实施例中的步骤501、502、503、506、507、508以及图5对应的实施例中其他与数据处理相关的步骤。

在一个可能的实施方式中，收发模块1101用于执行图6对应的实施例中的步骤602、602”、603、604、607以及图6对应的实施例中其他与收发相关的步骤。处理模块1102用于执行图6 对应的实施例中的步骤601、603、604、607、608、609以及图6对应的实施例中其他与数据处理相关的步骤。

在一个可能的实施方式中，收发模块1101用于执行图8对应的实施例中的步骤802、803、804、807、808、813、813’、814、814’以及图8对应的实施例中其他与收发相关的步骤。

处理模块1102用于执行图6对应的实施例中的步骤801、802、805、806、809、810、811、812、815以及图8对应的实施例中其他与数据处理相关的步骤。

当该设备是上述图3至图10对应的实施例中描述的参与方A2时：

收发模块1101用于执行图3对应的实施例中的步骤301’以及图3对应的实施例中其他与收发相关的步骤。处理模块1102用于执行图3对应的实施例中的步骤301’、303’以及图3对应的实施例中其他与数据处理相关的步骤。

在一个可能的实施方式中，收发模块1101用于执行图4对应的实施例中的步骤402’、405’以及图4对应的实施例中其他与收发相关的步骤。处理模块1102用于执行图4对应的实施例中的步骤401’、402’、405’、406’、407’以及图4对应的实施例中其他与数据处理相关的步骤。

在一个可能的实施方式中，收发模块1101用于执行图5对应的实施例中的步骤502’、503’以及图5对应的实施例中其他与收发相关的步骤。处理模块1102用于执行图5对应的实施例中的步骤501’、502’、503’、506’、507’、508’以及图5对应的实施例中其他与数据处理相关的步骤。

在一个可能的实施方式中，收发模块1101用于执行图6对应的实施例中的步骤602、602'、603'、604'、607'以及图6对应的实施例中其他与收发相关的步骤。处理模块1102用于执行图6对应的实施例中的步骤601'、603'、604'、607'、608'、609'以及图6对应的实施例中其他与数据处理相关的步骤。

当该设备是上述图3至图10对应的实施例中描述的参与方B时：

收发模块1101用于执行图3对应的实施例中的步骤302以及图3对应的实施例中其他与收发相关的步骤。处理模块1102用于执行图3对应的实施例中的步骤302、步骤303”以及图3对应的实施例中其他与数据处理相关的步骤。

在一个可能的实施方式中，收发模块1101用于执行图4对应的实施例中的步骤403”及图4对应的实施例中其他与收发相关的步骤。处理模块1102用于执行图4对应的实施例中的401”、402”、403”、405”、406”、407”以及图4对应的实施例中其他与数据处理相关的步骤。

在一个可能的实施方式中，收发模块1101用于执行图5对应的实施例中的步骤504、505、505”。处理模块1102用于执行图5对应的实施例中的步骤501”、506”、507”、508”以及图5对应的实施例中其他与数据处理相关的步骤。

在一个可能的实施方式中，收发模块1101用于执行图6对应的实施例中的步骤602'、602”、608、606”、606’以及图6对应的实施例中其他与收发相关的步骤。处理模块1102用于执行图6对应的实施例中的步骤601”、605、604”、607”、608”、609”以及图6对应的实施例中其他与数据处理相关的步骤。

当该设备是上述图3至图10对应的实施例中描述的参与联邦训练的设备时：

收发模块1101用于执行图7对应的实施例中的步骤701、702以及图7对应的实施例中其他与收发相关的步骤。处理模块1102用于执行图7对应的实施例中的步骤701、702、703以及图7对应的实施例中其他与数据处理相关的步骤。

在一个可能的实施方式中，收发模块1101用于执行图7对应的实施例中的步骤901以及图7对应的实施例中其他与收发相关的步骤。处理模块1102用于执行图7对应的实施例中的步骤901、902、903以及图7对应的实施例中其他与数据处理相关的步骤。

在一个可能的实施方式中，处理模块，用于获取第一中间结果，第一中间结果是基于第一机器学习模型的参数和第一数据处理设备获取到的历史用户数据获取的。

收发模块，用于接收第二中间结果，第二中间结果是基于第二机器学习模型的参数和第二数据处理设备获取到的历史用户数据获取的。

处理模块，还用于：根据第一中间结果和第二中间结果更新第一机器学习模型的参数。

收发模块，还用于将第三中间结果向第二数据处理设备发送，第三中间结果是基于第一机器学习模型的参数、第一数据处理设备获取到的历史用户数据中的目标历史用户数据从所述第一中间结果中获取的，目标历史用户数据的标识和第二数据处理设备的历史用户数据的标识相同，第三中间结果和第二中间结果用于更新第二机器学习模型的参数。

在一个可能的实施方式中，处理模块，还用于：

根据获取到的第一公钥和第二公钥生成公共公钥，第一公钥是第一数据处理设备生成的，第二公钥是第二数据处理设备生成的。

利用公共公钥对第三中间结果进行同态加密，大于目标数量的第一私钥或第二私钥用于对同态加密后的第三中间结果进行解密，第一私钥是第一数据处理设备生成的，第二私钥是第二数据处理设备生成的。

在一个可能的实施方式中，收发模块，还用于：

获取到***中在线的数据处理设备的数量小于阈值时，向在线的数据处理设备发送同态加密后的第一机器学习模型的参数，以使在线的数据处理设备利用各自的第一私钥或第二私钥解密同态加密后的第一机器学习模型的参数，阈值大于目标数量。

在一个可能的实施方式中，收发模块，还用于：

接收在线的数据处理设备利用各自的第一私钥或第二私钥解密后获取的第一机器学习模型的参数。

在一个可能的实施方式中，第一中间结果具体是基于第一机器学习模型的参数、第一数据处理设备的历史用户数据以及目标向量获取的，处理模块，还用于：

基于同态加密后的第一向量和第二向量获取目标向量，一个第一向量具有N个维度，N个维度对应***中全部历史用户数据的标识，第一向量的第一维度的取值用于指示第二数据处理设备获取的历史用户数据的标识中是否存在第一历史用户数据的标识，第一维度对应第一历史用户数据的标识，第二向量和第一向量具有相同的维度，第二向量的第一维度的取值用于指示第一数据处理设备的历史用户数据的标识中是否存在第一历史用户数据的标识。

在一个可能的实施方式中，第一数据处理设备获取的历史用户数据和第二数据处理设备获取的历史用户数据具有不同的特征空间。

在一个可能的实施方式中，收发模块，用于接收第三中间结果，第一中间结果是基于第一机器学习模型的参数和第一数据处理设备获取到的历史用户数据获取的，第三中间结果是基于第一机器学习模型的参数、第一数据处理设备获取到的历史用户数据中的目标历史用户数据从所述第一中间结果中获取的，目标历史用户数据的标识和第二数据处理设备的历史用户数据的标识相同。

处理模块，用于：

获取第二中间结果，第二中间结果是基于第二机器学习模型的参数和第二数据处理设备获取到的历史用户数据获取的，第二中间结果和第一中间结果用于更新第一机器学习模型的参数。

根据第三中间结果和第二中间结果，更新第二机器学习模型的参数。

在一个可能的实施方式中，收发模块，还用于获取多个初始的机器学习模型的参数，一个初始的机器学习模型部署在一个第三数据处理设备中，任意两个第三数据处理设备获取到的历史用户数据具有相同的特征空间、不同的数据标识，第二数据处理设备是多个第三数据处理设备中的任意一个第三数据处理设备。

处理模块，还用于：

对获取到的多个初始的机器学习模型的参数进行加权处理，以获取加权值。

根据加权值更新第二数据处理设备上部署的初始的机器学习模型的参数，以获取第二机器学习模型的参数。

在一个可能的实施方式中，处理模块，还用于：

利用公共公钥对第二中间结果进行同态加密，大于目标数量的第一私钥或第二私钥用于对同态加密后的第二中间结果进行解密，第一私钥是第一数据处理设备生成的，第二私钥是第二数据处理设备生成的。

在一个可能的实施方式中，收发模块，还用于：

获取到***中在线的数据处理设备的数量小于阈值时，向在线的数据处理设备发送同态加密后的第二机器学习模型的参数，以使在线的数据处理设备利用各自的第一私钥或第二私钥解密同态加密后的第二机器学习模型的参数，阈值大于目标数量。

在一个可能的实施方式中，收发模块，还用于：

接收在线的数据处理设备利用各自的第一私钥或第二私钥解密后获取的第二机器学习模型的参数。

在一个可能的实施方式中，第二中间结果具体是基于第二机器学习模型的参数、第二数据处理设备的历史用户数据以及目标向量获取的，处理模块，还用于：

获取第一向量，第一向量具有N个维度，N个维度对应***中全部历史用户数据的标识，第一向量的第一维度的取值用于指示第二数据处理设备获取的历史用户数据的标识中是否存在第一历史用户数据的标识，第一维度对应第一历史用户数据的标识。

基于同态加密后的第二向量和第一向量获取目标向量，第二向量和第一向量具有相同的维度，第二向量的第一维度的取值用于指示第一数据处理设备的历史用户数据的标识中是否存在第一历史用户数据的标识。

如图12所示，为本申请实施例提供的另一种机器学习模型的更新设备的结构示意图，该设备相当于图3至图10中描述的任意一种参与方或者设备。

图12所示的装置可以包括：处理器1201、存储器1202、通信接口1204以及总线1203。处理器1201、存储器1202以及通信接口1204之间可以通过总线1203连接。

处理器1201是计算机设备的控制中心，可以是一个通用中央处理单元(central processing unit，CPU)，也可以是其他通用处理器等。其中，通用处理器可以是微处理器或者是任何常规的处理器等。

作为一个示例，处理器1201可以包括一个或多个CPU。

存储器1202可以是只读存储器(read-only memory，ROM)或可存储静态信息和指令的其他类型的静态存储设备，随机存取存储器(random access memory，RAM)或者可存储信息和指令的其他类型的动态存储设备，也可以是电可擦可编程只读存储器(electrically erasable programmable read-only memory，EEPROM)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质，但不限于此。

一种可能的实现方式中，存储器1202可以独立于处理器1201存在。存储器1202可以通过总线1203与处理器1201相连接，用于存储数据、指令或者程序代码。处理器1201调用并执行存储器1202中存储的指令或程序代码时，能够实现本申请实施例提供的机器学习模型的更新方法，例如，图3-图10任一所示的机器学习模型的更新方法。

另一种可能的实现方式中，存储器1202也可以和处理器1201集成在一起。

通信接口1204，用于装置与其他设备通过通信网络连接，所述通信网络可以是以太网，无线接入网(radio access network，RAN)，无线局域网(wireless local area networks，WLAN)等。通信接口1204可以包括用于接收数据的接收单元，以及用于发送数据的发送单元。

总线1203，可以是工业标准体系结构(industry standard architecture，ISA)总线、外部设备互连(peripheral component interconnect，PCI)总线或扩展工业标准体系结构(extended industry standard architecture，EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示，图12中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

需要指出的是，除图12所示部件之外，机器学习模型的更新设备可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

本申请的说明书和权利要求书及上述附图中的术语“第一”，“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。本申请中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况，另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或模块的过程，方法，***，产品或设备不必限于清楚地列出的那些步骤或模块，而是可包括没有清楚地列出的或对于这些过程，方法，产品或设备固有的其它步骤或模块。在本申请中出现的对步骤进行的命名或者编号，并不意味着必须按照命名或者编号所指示的时间/逻辑先后顺序执行方法流程中的步骤，已经命名或者编号的流程步骤可以根据要实现的技术目的变更执行次序，只要能达到相同或者相类似的技术效果即可。本申请中所出现的模块的划分，是一种逻辑上的划分，实际应用中实现时可以有另外的划分方式，例如多个模块可以结合成或集成在另一个***中，或一些特征可以忽略，或不执行，另外，所显示的或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些端口，模块之间的间接耦合或通信连接可以是电性或其他类似的形式，本申请中均不作限定。并且，作为分离部件说明的模块或子模块可以是也可以不是物理上的分离，可以是也可以不是物理模块，或者可以分布到多个电路模块中，可以根据实际的需要选择其中的部分或全部模块来实现本申请方案的目的。

Claims

一种用户数据处理的***，其特征在于，所述***包括第一数据处理设备和第二数据处理设备，

所述第一数据处理设备，用于：

产生第一中间结果，所述第一中间结果是基于第一机器学习模型的参数和所述第一数据处理设备获取到的历史用户数据获取的；

接收第二中间结果，所述第二中间结果是基于第二机器学习模型的参数和所述第二数据处理设备获取到的历史用户数据获取的；

根据所述第一中间结果和所述第二中间结果更新所述第一机器学习模型的参数；

将第三中间结果发送给所述第二数据处理设备，所述第三中间结果是基于所述第一机器学习模型的参数、所述第一数据处理设备获取到的历史用户数据中的目标历史用户数据从所述第一中间结果中获取的，所述目标历史用户数据的标识和所述第二数据处理设备获取到的历史用户数据的标识相同；

所述第二数据处理设备，用于：

根据所述第三中间结果和所述第二中间结果，更新所述第二机器学习模型的参数。
根据权利要求1所述的***，其特征在于，所述***中包括多个第三数据处理设备，任意两个所述第三数据处理设备获取到的历史用户数据具有相同的特征空间、不同的数据标识，所述第二数据处理设备是所述多个第三数据处理设备中的任意一个第三数据处理设备，每个所述第三数据处理设备上均部署有初始的机器学习模型，所述第二数据处理设备，还用于：

获取多个所述初始的机器学习模型的参数；

对获取到的所述多个初始的机器学习模型的参数进行加权处理，以获取加权值；

根据所述加权值更新所述第二数据处理设备上部署的初始的机器学习模型的参数，以获取所述第二机器学习模型的参数。
根据权利要求1或2所述的***，其特征在于，所述第一数据处理设备，还用于：

生成第一公钥和第一私钥；

所述第二数据处理设备，还用于：

生成第二公钥和第二私钥，所述第一公钥和所述第二公钥用于生成公共公钥，所述公共公钥用于对所述第一中间结果或所述第二中间结果进行同态加密，大于目标数量的所述第一私钥或所述第二私钥用于对同态加密后的所述第一中间结果或所述第二中间结果进行解密。
根据权利要求3所述的***，其特征在于，所述第二数据处理设备，还用于：

获取到所述***中在线的数据处理设备的数量小于阈值时，向所述在线的数据处理设备发送同态加密后的所述第二机器学习模型的参数，以使所述在线的数据处理设备利用各自的第一私钥或所述第二私钥解密所述同态加密后的所述第二机器学习模型的参数，所述阈值不小于所述目标数量。
根据权利要求4所述的***，其特征在于，所述第二数据处理设备，还用于：

接收所述在线的数据处理设备利用各自的第一私钥或所述第二私钥解密后获取的所述第二机器学习模型的参数。
根据权利要求3至5任一项所述的***，其特征在于，所述第一数据处理设备，还用于：

获取到所述***中在线的数据处理设备的数量小于阈值时，向所述在线的数据处理设备发送同态加密后的所述第一机器学习模型的参数，以使所述在线的数据处理设备利用各自的第一私钥或所述第二私钥解密所述同态加密后的所述第一机器学习模型的参数，所述阈值大于所述目标数量。
根据权利要求6所述的***，其特征在于，所述第一数据处理设备，还用于：

接收所述在线的数据处理设备利用各自的第一私钥或所述第二私钥解密后获取的所述第一机器学习模型的参数。
根据权利要求1至7任一项所述的***，其特征在于，所述第二中间结果具体是基于所述第二机器学习模型的参数、所述第二数据处理设备获取到的历史用户数据以及目标向量获取的，所述第二数据处理设备，还用于：

获取第一向量，所述第一向量具有N个维度，所述N个维度对应所述***中全部历史用户数据的标识，所述第一向量的第一维度的取值用于指示所述第二数据处理设备获取到的历史用户数据的标识中是否存在第一历史用户数据的标识，所述第一维度对应所述第一历史用户数据的标识；

基于同态加密后的第二向量和所述第一向量获取所述目标向量，所述第二向量和所述第一向量具有相同的维度，所述第二向量的第一维度的取值用于指示所述第一数据处理设备获取到的历史用户数据的标识中是否存在所述第一历史用户数据的标识。
根据权利要求8所述的***，其特征在于，所述第一中间结果具体是基于所述第一机器学习模型的参数、所述第一数据处理设备获取到的历史用户数据以及所述目标向量获取的，所述第一数据处理设备，还用于：

基于同态加密后的所述第一向量和所述第二向量获取目标向量。
根据权利要求1至9任一项所述的***，其特征在于，所述第一数据处理设备获取的历史用户数据和所述第二数据处理设备获取的历史用户数据具有不同的特征空间、相同的数据标识。
一种用户数据处理的方法，其特征在于，包括：

第一数据处理设备产生第一中间结果，所述第一中间结果是基于第一机器学习模型的参数和所述第一数据处理设备获取到的历史用户数据获取的；

所述第一数据处理设备接收第二中间结果，所述第二中间结果是基于第二机器学习模型的参数和所述第二数据处理设备获取到的历史用户数据获取的；

所述第一数据处理设备根据所述第一中间结果和所述第二中间结果更新所述第一机器学习模型的参数；

所述第一数据处理设备将第三中间结果发送给所述第二数据处理设备，所述第三中间结果是基于所述第一机器学习模型的参数、所述第一数据处理设备获取到的历史用户数据中的目标历史用户数据从所述第一中间结果中获取的，所述目标历史用户数据的标识和所述第二数据处理设备的历史用户数据的标识相同，所述第三中间结果和所述第二中间结果用于更新所述第二机器学习模型的参数。
根据权利要求11所述的方法，其特征在于，所述方法还包括：

所述第一数据处理设备根据获取到的第一公钥和第二公钥生成公共公钥，所述第一公钥是所述第一数据处理设备生成的，所述第二公钥是第二数据处理设备生成的；

所述第一数据处理设备利用所述公共公钥对所述第三中间结果进行同态加密，大于目标数量的第一私钥或第二私钥用于对所述同态加密后的所述第三中间结果进行解密，所述第一私钥是所述第一数据处理设备生成的，所述第二私钥是所述第二数据处理设备生成的。
根据权利要求12所述的方法，其特征在于，所述方法还包括：

所述第一数据处理设备获取到所述***中在线的数据处理设备的数量小于阈值时，向所述在线的数据处理设备发送同态加密后的所述第一机器学习模型的参数，以使所述在线的数据处理设备利用各自的第一私钥或所述第二私钥解密所述同态加密后的所述第一机器学习模型的参数，所述阈值大于所述目标数量。
根据权利要求13所述的方法，其特征在于，所述方法还包括：

所述第一数据处理设备接收所述在线的数据处理设备利用各自的第一私钥或所述第二私钥解密后获取的所述第一机器学习模型的参数。
根据权利要求11至14任一项所述的方法，其特征在于，所述第一中间结果具体是基于所述第一机器学习模型的参数、所述第一数据处理设备的历史用户数据以及目标向量获取的，所述方法还包括：

所述第一数据处理设备基于同态加密后的第一向量和第二向量获取目标向量，一个所述第一向量具有N个维度，所述N个维度对应所述***中全部历史用户数据的标识，所述第一向量的第一维度的取值用于指示所述第二数据处理设备获取的历史用户数据的标识中是否存在第一历史用户数据的标识，所述第一维度对应所述第一历史用户数据的标识，所述第二向量和所述第一向量具有相同的维度，所述第二向量的第一维度的取值用于指示所述第一数据处理设备的历史用户数据的标识中是否存在所述第一历史用户数据的标识。
根据权利要求13至15任一项所述的方法，其特征在于，所述第一数据处理设备获取的历史用户数据和所述第二数据处理设备获取的历史用户数据具有不同的特征空间。
一种用户数据处理的方法，其特征在于，包括：

第二数据处理设备接收第三中间结果，所述第一中间结果是基于第一机器学习模型的参数和第一数据处理设备获取到的历史用户数据获取的，所述第三中间结果是基于所述第一机器学习模型的参数、所述第一数据处理设备获取到的历史用户数据中的目标历史用户数据从所述第一中间结果中获取的，所述目标历史用户数据的标识和所述第二数据处理设备的历史用户数据的标识相同；

所述第二数据处理设备获取第二中间结果，所述第二中间结果是基于第二机器学习模型的参数和所述第二数据处理设备获取到的历史用户数据获取的，所述第二中间结果和所述第一中间结果用于更新所述第一机器学习模型的参数；

所述第二数据处理设备根据所述第三中间结果和所述第二中间结果，更新所述第二机器学习模型的参数。
根据权利要求17所述的方法，其特征在于，所述方法还包括：

所述第二数据处理设备获取多个初始的机器学习模型的参数，一个所述初始的机器学习模型部署在一个第三数据处理设备中，任意两个所述第三数据处理设备获取到的历史用户数据具有相同的特征空间、不同的数据标识，所述第二数据处理设备是多个所述第三数据处理设备中的任意一个第三数据处理设备；

所述第二数据处理设备对获取到的所述多个初始的机器学习模型的参数进行加权处理，以获取加权值；

根据所述加权值更新所述第二数据处理设备上部署的初始的机器学习模型的参数，以获取所述第二机器学习模型的参数。
根据权利要求17或18所述的方法，其特征在于，所述方法还包括：

所述第二数据处理设备根据获取到的第一公钥和第二公钥生成公共公钥，所述第一公钥是所述第一数据处理设备生成的，所述第二公钥是第二数据处理设备生成的；

所述第二数据处理设备利用所述公共公钥对所述第二中间结果进行同态加密，大于目标数量的第一私钥或第二私钥用于对所述同态加密后的所述第二中间结果进行解密，所述第一私钥是所述第一数据处理设备生成的，所述第二私钥是所述第二数据处理设备生成的。
根据权利要求19所述的方法，其特征在于，所述方法还包括：

所述第二数据处理设备获取到所述***中在线的数据处理设备的数量小于阈值时，向所述在线的数据处理设备发送同态加密后的所述第二机器学习模型的参数，以使所述在线的数据处理设备利用各自的第一私钥或所述第二私钥解密所述同态加密后的所述第二机器学习模型的参数，所述阈值大于所述目标数量。
根据权利要求20所述的方法，其特征在于，所述方法还包括：

所述第二数据处理设备接收所述在线的数据处理设备利用各自的第一私钥或所述第二私钥解密后获取的所述第二机器学习模型的参数。
根据权利要求17至21任一项所述的方法，其特征在于，所述第二中间结果具体是基于所述第二机器学习模型的参数、所述第二数据处理设备的历史用户数据以及目标向量获取的，所述方法还包括：

所述第二数据处理设备获取第一向量，所述第一向量具有N个维度，所述N个维度对应所述***中全部历史用户数据的标识，所述第一向量的第一维度的取值用于指示所述第二数据处理设备获取的历史用户数据的标识中是否存在第一历史用户数据的标识，所述第一维度对应所述第一历史用户数据的标识；

基于同态加密后的第二向量和所述第一向量获取所述目标向量，所述第二向量和所述第一向量具有相同的维度，所述第二向量的第一维度的取值用于指示所述第一数据处理设备的历史用户数据的标识中是否存在所述第一历史用户数据的标识。
根据权利要求17至22任一项所述的方法，其特征在于，所述第一数据处理设备获取的历史用户数据和所述第二数据处理设备获取的历史用户数据具有不同的特征空间。
一种掉线处理的方法，其特征在于，包括：

目标数据处理设备生成公钥和私钥；

所述目标数据处理设备接收所述目标数据处理设备所在***中其他数据处理设备发送的各自生成的公钥，以生成公共公钥；

所述目标数据处理设备利用所述公共公钥对目标数据进行同态加密，所述目标数据包括所述目标数据处理设备上部署的目标机器学习模型的参数，所述其他数据处理设备生成的私钥中大于目标数量的私钥用于对同态加密后的所述目标数据进行解密；

所述目标数据处理设备获取所述其他数据处理设备中在线的数据处理设备的数量小于阈值时，向所述在线的数据处理设备发送所述同态加密后的目标数据，以使所述在线的数据处理设备利用各自生成的私钥解密所述同态加密后的目标数据。
根据权利要求24所述的方法，其特征在于，所述方法还包括：

所述目标数据处理设备接收所述在线的数据处理设备利用各自生成的私钥解密后获取的所述目标数据。
根据权利要求24或25所述的方法，其特征在于，所述目标数据处理设备是第一数据处理设备时，所述方法还包括：

所述目标数据处理设备产生第一中间结果，所述第一中间结果是基于第一机器学习模型的参数和所述第一数据处理设备获取到的历史用户数据获取的；

所述目标数据处理设备接收第二中间结果，所述第二中间结果是基于第二机器学习模型的参数和第二数据处理设备获取到的历史用户数据获取的；

所述目标数据处理设备根据所述第一中间结果和所述第二中间结果更新所述第一机器学习模型的参数；

所述目标数据处理设备将第三中间结果发送给所述第二数据处理设备，所述第三中间结果是基于所述第一机器学习模型的参数、所述目标数据处理设备获取到的历史用户数据中的目标历史用户数据从所述第一中间结果中获取的，所述目标历史用户数据的标识和所述第二数据处理设备的历史用户数据的标识相同，所述第三中间结果和所述第二中间结果用于更新所述第二机器学习模型的参数。
根据权利要求26所述的方法，其特征在于，所述第一中间结果具体是基于所述第一机器学习模型的参数、所述第一数据处理设备的历史用户数据以及目标向量获取的，所述方法还包括：

所述目标数据处理设备基于同态加密后的第一向量和第二向量获取目标向量，一个所述第一向量具有N个维度，所述N个维度对应所述***中全部历史用户数据的标识，所述第一向量的第一维度的取值用于指示所述第二数据处理设备获取的历史用户数据的标识中是否存在第一历史用户数据的标识，所述第一维度对应所述第一历史用户数据的标识，所述第二向量和所述第一向量具有相同的维度，所述第二向量的第一维度的取值用于指示所述第一数据处理设备的历史用户数据的标识中是否存在所述第一历史用户数据的标识。
根据权利要求24或25所述的方法，其特征在于，所述目标数据处理设备是第二数据处理设备时，所述方法还包括：

所述目标数据处理设备接收第三中间结果，所述第一中间结果是基于第一机器学习模型的参数和第一数据处理设备获取到的历史用户数据获取的，所述第三中间结果是基于所述第一机器学习模型的参数、所述第一数据处理设备获取到的历史用户数据中的目标历史用户数据从所述第一中间结果中获取的，所述目标历史用户数据的标识和所述第二数据处理设备的历史用户数据的标识相同；

所述目标数据处理设备产生第二中间结果，所述第二中间结果是基于第二机器学习模型的参数和所述第二数据处理设备获取到的历史用户数据获取的，所述第二中间结果和所述第一中间结果用于更新所述第一机器学习模型的参数；

所述目标数据处理设备根据所述第三中间结果和所述第二中间结果，更新所述第二机器学习模型的参数。
根据权利要求28所述的方法，其特征在于，所述方法还包括：

所述目标数据处理设备获取多个初始的机器学习模型的参数，一个所述初始的机器学习模型部署在一个第三数据处理设备中，任意两个所述第三数据处理设备获取到的历史用户数据具有相同的特征空间、不同的数据标识，所述第二数据处理设备是多个所述第三数据处理设备中的任意一个第三数据处理设备；

所述目标数据处理设备对获取到的所述多个初始的机器学习模型的参数进行加权处理，以获取加权值；

所述目标数据处理设备根据所述加权值更新所述目标数据处理设备上部署的初始的机器学习模型的参数，以获取所述第二机器学习模型的参数。
根据权利要求26所述的方法，其特征在于，所述第二中间结果具体是基于所述第二机器学习模型的参数、所述第二数据处理设备的历史用户数据以及目标向量获取的，所述方法还包括：

所述目标数据处理设备获取第一向量，所述第一向量具有N个维度，所述N个维度对应所述***中全部历史用户数据的标识，所述第一向量的第一维度的取值用于指示所述第二数据处理设备获取的历史用户数据的标识中是否存在第一历史用户数据的标识，所述第一维度对应所述第一历史用户数据的标识；

所述目标数据处理设备基于同态加密后的第二向量和所述第一向量获取所述目标向量，所述第二向量和所述第一向量具有相同的维度，所述第二向量的第一维度的取值用于指示所述第一数据处理设备的历史用户数据的标识中是否存在所述第一历史用户数据的标识。
一种数据处理的***，其特征在于，所述***包括第一数据处理设备和第二数据处理设备，

所述第一数据处理设备，用于：

产生第一中间结果，所述第一中间结果是基于第一机器学习模型的参数和所述第一数据处理设备获取到的训练样本获取的；

接收第二中间结果，所述第二中间结果是基于第二机器学习模型的参数和所述第二数据处理设备获取到的训练样本获取的；

根据所述第一中间结果和所述第二中间结果更新所述第一机器学习模型的参数；

将第三中间结果发送给所述第二数据处理设备，所述第三中间结果是基于所述第一机器学习模型的参数、所述第一数据处理设备获取到的训练样本中的目标训练样本获取的第一中间结果，所述目标训练样本的标识和所述第二数据处理设备获取到的训练样本的标识相同；

所述第二数据处理设备，用于：

根据所述第三中间结果和所述第二中间结果，更新所述第二机器学习模型的参数。
根据权利要求31所述的***，其特征在于，所述***中包括多个第三数据处理设备，任意两个所述第三数据处理设备获取到的训练样本具有相同的特征空间、不同的样本标识，所述第二数据处理设备是所述多个第三数据处理设备中的任意一个第三数据处理设备，每个所述第三数据处理设备上均部署有初始的机器学习模型，所述第二数据处理设备，还用于：

获取多个所述初始的机器学习模型的参数；

对获取到的所述多个初始的机器学习模型的参数进行加权处理，以获取加权值；

根据所述加权值更新所述第二数据处理设备上部署的初始的机器学习模型的参数，以获取所述第二机器学习模型的参数。
根据权利要求31或32所述的***，其特征在于，所述第一数据处理设备，还用于：

生成第一公钥和第一私钥；

所述第二数据处理设备，还用于：

生成第二公钥和第二私钥，所述第一公钥和所述第二公钥用于生成公共公钥，所述公共公钥用于对所述第一中间结果或所述第二中间结果进行同态加密，大于目标数量的所述第一私钥或所述第二私钥用于对同态加密后的所述第一中间结果或所述第二中间结果进行解密。
根据权利要求33所述的***，其特征在于，所述第二数据处理设备，还用于：

获取到所述***中在线的数据处理设备的数量小于阈值时，向所述在线的数据处理设备发送同态加密后的所述第二机器学习模型的参数，以使所述在线的数据处理设备利用各自的第一私钥或所述第二私钥解密所述同态加密后的所述第二机器学习模型的参数，所述阈值不小于所述目标数量。
根据权利要求34所述的***，其特征在于，所述第二数据处理设备，还用于：

接收所述在线的数据处理设备利用各自的第一私钥或所述第二私钥解密后获取的所述第二机器学习模型的参数。
根据权利要求33至35任一项所述的***，其特征在于，所述第一数据处理设备，还用于：

获取到所述***中在线的数据处理设备的数量小于阈值时，向所述在线的数据处理设备发送同态加密后的所述第一机器学习模型的参数，以使所述在线的数据处理设备利用各自的第一私钥或所述第二私钥解密所述同态加密后的所述第一机器学习模型的参数，所述阈值大于所述目标数量。
根据权利要求36所述的***，其特征在于，所述第一数据处理设备，还用于：

接收所述在线的数据处理设备利用各自的第一私钥或所述第二私钥解密后获取的所述第一机器学习模型的参数。
根据权利要求31至37任一项所述的***，其特征在于，所述第二中间结果具体是基于所述第二机器学习模型的参数、所述第二数据处理设备获取到的训练样本以及目标向量获取的，所述第二数据处理设备，还用于：

获取第一向量，所述第一向量具有N个维度，所述N个维度对应所述***中全部训练样本的标识，所述第一向量的第一维度的取值用于指示所述第二数据处理设备获取的训练样本的标识中是否存在第一训练样本的标识，所述第一维度对应所述第一训练样本的标识；

基于同态加密后的第二向量和所述第一向量获取所述目标向量，所述第二向量和所述第一向量具有相同的维度，所述第二向量的第一维度的取值用于指示所述第一数据处理设备获取的训练样本的标识中是否存在所述第一训练样本的标识。
根据权利要求38所述的***，其特征在于，所述第一中间结果具体是基于所述第一机器学习模型的参数、所述第一数据处理设备获取到的训练样本以及所述目标向量获取的，所述第一数据处理设备，还用于：

基于同态加密后的所述第一向量和所述第二向量获取目标向量。
根据权利要求31至39任一项所述的***，其特征在于，所述第一数据处理设备获取的训练样本和所述第二数据处理设备获取的训练样本具有不同的特征空间、相同的样本标识。
一种用户数据处理的装置，其特征在于，包括：

处理模块，用于产生第一中间结果，所述第一中间结果是基于第一机器学习模型的参数和所述第一数据处理设备获取到的历史用户数据获取的；

收发模块，用于接收第二中间结果，所述第二中间结果是基于第二机器学习模型的参数和所述第二数据处理设备获取到的历史用户数据获取的；

所述处理模块，还用于：根据所述第一中间结果和所述第二中间结果更新所述第一机器学习模型的参数；

所述收发模块，还用于将第三中间结果发送给所述第二数据处理设备，所述第三中间结果是基于所述第一机器学习模型的参数、所述第一数据处理设备获取到的历史用户数据中的目标历史用户数据从所述第一中间结果中获取的，所述目标历史用户数据的标识和所述第二数据处理设备的历史用户数据的标识相同，所述第三中间结果和所述第二中间结果用于更新所述第二机器学习模型的参数。
根据权利要求41所述的装置，其特征在于，所述处理模块，还用于：

根据获取到的第一公钥和第二公钥生成公共公钥，所述第一公钥是所述第一数据处理设备生成的，所述第二公钥是第二数据处理设备生成的；

利用所述公共公钥对所述第三中间结果进行同态加密，大于目标数量的第一私钥或第二私钥用于对所述同态加密后的所述第三中间结果进行解密，所述第一私钥是所述第一数据处理设备生成的，所述第二私钥是所述第二数据处理设备生成的。
根据权利要求42所述的装置，其特征在于，所述收发模块，还用于：

获取到所述***中在线的数据处理设备的数量小于阈值时，向所述在线的数据处理设备发送同态加密后的所述第一机器学习模型的参数，以使所述在线的数据处理设备利用各自的第一私钥或所述第二私钥解密所述同态加密后的所述第一机器学习模型的参数，所述阈值大于所述目标数量。
根据权利要求43所述的装置，其特征在于，所述收发模块，还用于：

接收所述在线的数据处理设备利用各自的第一私钥或所述第二私钥解密后获取的所述第一机器学习模型的参数。
根据权利要求41至44任一项所述的装置，其特征在于，所述第一中间结果具体是基于所述第一机器学习模型的参数、所述第一数据处理设备的历史用户数据以及目标向量获取的，所述处理模块，还用于：

基于同态加密后的第一向量和第二向量获取目标向量，一个所述第一向量具有N个维度，所述N个维度对应所述***中全部历史用户数据的标识，所述第一向量的第一维度的取值用于指示所述第二数据处理设备获取的历史用户数据的标识中是否存在第一历史用户数据的标识，所述第一维度对应所述第一历史用户数据的标识，所述第二向量和所述第一向量具有相同的维度，所述第二向量的第一维度的取值用于指示所述第一数据处理设备的历史用户数据的标识中是否存在所述第一历史用户数据的标识。
根据权利要求43至45任一项所述的装置，其特征在于，所述第一数据处理设备获取的历史用户数据和所述第二数据处理设备获取的历史用户数据具有不同的特征空间。
一种用户数据处理的装置，其特征在于，包括：

收发模块，用于接收第三中间结果，所述第一中间结果是基于第一机器学习模型的参数和第一数据处理设备获取到的历史用户数据获取的，所述第三中间结果是基于所述第一机器学习模型的参数、所述第一数据处理设备获取到的历史用户数据中的目标历史用户数据从所述第一中间结果中获取的，所述目标历史用户数据的标识和所述第二数据处理设备的历史用户数据的标识相同；

处理模块，用于：

获取第二中间结果，所述第二中间结果是基于第二机器学习模型的参数和所述第二数据处理设备获取到的历史用户数据获取的，所述第二中间结果和所述第一中间结果用于更新所述第一机器学习模型的参数；

根据所述第三中间结果和所述第二中间结果，更新所述第二机器学习模型的参数。
根据权利要求47所述的装置，其特征在于，

所述收发模块，还用于获取多个初始的机器学习模型的参数，一个所述初始的机器学习模型部署在一个第三数据处理设备中，任意两个所述第三数据处理设备获取到的历史用户数据具有相同的特征空间、不同的数据标识，所述第二数据处理设备是多个所述第三数据处理设备中的任意一个第三数据处理设备；

所述处理模块，还用于：

对获取到的所述多个初始的机器学习模型的参数进行加权处理，以获取加权值；

根据所述加权值更新所述第二数据处理设备上部署的初始的机器学习模型的参数，以获取所述第二机器学习模型的参数。
根据权利要求47或48所述的装置，其特征在于，所述处理模块，还用于：

根据获取到的第一公钥和第二公钥生成公共公钥，所述第一公钥是所述第一数据处理设备生成的，所述第二公钥是第二数据处理设备生成的；

利用所述公共公钥对所述第二中间结果进行同态加密，大于目标数量的第一私钥或第二私钥用于对所述同态加密后的所述第二中间结果进行解密，所述第一私钥是所述第一数据处理设备生成的，所述第二私钥是所述第二数据处理设备生成的。
根据权利要求49所述的装置，其特征在于，所述收发模块，还用于：

获取到所述***中在线的数据处理设备的数量小于阈值时，向所述在线的数据处理设备发送同态加密后的所述第二机器学习模型的参数，以使所述在线的数据处理设备利用各自的第一私钥或所述第二私钥解密所述同态加密后的所述第二机器学习模型的参数，所述阈值大于所述目标数量。
根据权利要求50所述的装置，其特征在于，所述收发模块，还用于：

接收所述在线的数据处理设备利用各自的第一私钥或所述第二私钥解密后获取的所述第二机器学习模型的参数。
根据权利要求47至51任一项所述的装置，其特征在于，所述第二中间结果具体是基于所述第二机器学习模型的参数、所述第二数据处理设备的历史用户数据以及目标向量获取的，所述处理模块，还用于：

获取第一向量，所述第一向量具有N个维度，所述N个维度对应所述***中全部历史用户数据的标识，所述第一向量的第一维度的取值用于指示所述第二数据处理设备获取的历史用户数据的标识中是否存在第一历史用户数据的标识，所述第一维度对应所述第一历史用户数据的标识；

基于同态加密后的第二向量和所述第一向量获取所述目标向量，所述第二向量和所述第一向量具有相同的维度，所述第二向量的第一维度的取值用于指示所述第一数据处理设备的历史用户数据的标识中是否存在所述第一历史用户数据的标识。
根据权利要求47至52任一项所述的装置，其特征在于，所述第一数据处理设备获取的历史用户数据和所述第二数据处理设备获取的历史用户数据具有不同的特征空间。
一种用户数据处理的装置，其特征在于，包括：

存储器，存储有可执行的程序指令；和

处理器，所述处理器用于与所述存储器耦合，读取并执行所述存储器中的指令，以使所述设备实现如权利要求11至16任一所述的方法，或者实现如权利要求17至23任一所述的方法，或者实现如权利要求24至30任一所述的方法。
如权利要求54所述的装置，其特征在于，所述装置为终端、终端中的芯片或者服务器。
一种计算机可读存储介质，包括指令，当其在计算机上运行时，使得计算机执行如权利要求11至16任一所述的方法，或者执行如权利要求17至23任一所述的方法，或者执行如权利要求24至30任一所述的方法。