CN111062493B

CN111062493B - 基于公共数据的纵向联邦方法、装置、设备及介质

Info

Publication number: CN111062493B
Application number: CN201911333204.6A
Authority: CN
Inventors: 梁新乐; 刘洋; 陈天健; 董苗波
Original assignee: WeBank Co Ltd
Current assignee: WeBank Co Ltd
Priority date: 2019-12-20
Filing date: 2019-12-20
Publication date: 2021-06-15
Anticipated expiration: 2039-12-20
Also published as: CN111062493A

Abstract

本申请公开了一种基于公共数据的纵向联邦方法、装置、设备和介质，所述基于公共数据的纵向联邦方法包括：接收强化学习设备发送的纵向联邦服务请求，并提取所述纵向联邦服务请求对应的目标公共数据，特征提取模型，并将所述目标公共数据输入所述特征提取模型，获得特征向量信息，将所述特征向量信息发送至所述强化学习设备，以进行所述纵向联邦，更新预设纵向联邦模型。本申请解决了机器学习模型构建效率低的技术问题。

Description

基于公共数据的纵向联邦方法、装置、设备及介质

技术领域

本申请涉及金融科技(Fintech)的人工智能技术领域，尤其涉及一种基于公共数据的纵向联邦方法、装置、设备及介质。

背景技术

随着金融科技，尤其是互联网科技金融的不断发展，越来越多的技术(如分布式、区块链Blockchain、人工智能等)应用在金融领域，但金融业也对技术提出了更高的要求，如对金融业对应待办事项的分发也有更高的要求。

随着计算机软件和人工智能的不断发展，深度学习的应用也越来越广泛，在现有技术中，深度学习中的纵向联邦学习通常在2个纵向联邦学习参与方之间进行的，且2个参与方之间的数据通常可以互补，以便联合共建机器学习模型，2个参与方拥有的数据量通常是较少的，但是深度学习的强大功能又是建立在海量数据之上的，所以，以较少的数据联合建立的机器学习模型的训练样本的特征丰富度较低，进而导致机器学习模型的计算性能和预测性能等均达不到预期效果，也即，机器学习模型的性能较差，进一步地，以特征丰富度低的训练样本对机器学习模型进行训练，将导致进行无效训练或者训练效果差的训练的次数增加，也即，增加了机器学习过程中的无效计算次数，进而降低了机器学习的计算效率，导致训练机器学习模型的时间更长，进而导致机器学习模型的构建效率极低，所以，现有技术中存在机器学习模型构建效率低的技术问题。

发明内容

本申请的主要目的在于提供一种基于公共数据的纵向联邦方法、装置、设备和介质，旨在解决现有技术中机器学习模型构建效率低的技术问题。

为实现上述目的，本申请实施例提供一种基于公共数据的纵向联邦方法，所述基于公共数据的纵向联邦方法应用于基于公共数据的纵向联邦设备，所述基于公共数据的纵向联邦方法包括：

接收强化学习设备发送的纵向联邦服务请求，并提取所述纵向联邦服务请求对应的目标公共数据；

获取特征提取模型，并将所述目标公共数据输入所述特征提取模型，获得特征向量信息；

将所述特征向量信息发送至所述强化学习设备，以进行所述纵向联邦，更新预设纵向联邦模型。

可选地，所述联邦服务请求包括模型识别信息，

所述获取特征提取模型，并将所述目标公共数据输入所述特征提取模型，获得特征向量信息的步骤包括：

基于所述模型识别信息，通过预设模型集成模块调用所述模型识别信息对应的特征提取模型；

将所述目标公共数据输入所述特征提取模型，以对所述目标公共信息进行特征提取，获得所述特征向量信息。

可选地，所述特征提取模型包括特征提取神经网络，所述目标公共数据包括目标图片数据，

所述将所述目标公共数据输入所述特征提取模型，以对所述目标公共信息进行特征提取，获得所述特征向量信息的步骤包括：

将所述目标图片数据输入所述特征提取神经网络，以对所述目标公共数据进行卷积处理，获得卷积处理结果；

对所述卷积处理结果进行池化处理，获得池化处理结果；

对所述池化处理结果重复交替进行预设次数的所述卷积处理和池化处理，获得所述特征向量信息。

可选地，所述接收强化学习设备发送的纵向联邦服务请求，并提取所述纵向联邦服务请求对应的目标公共数据的步骤包括：

接收强化学习设备发送的纵向联邦服务请求，并通过预设数据调度模块调用所述纵向联邦请求的初始公共信息；

通过预设数据预处理模块对所述初始公共信息进行预处理，获得所述目标公共信息。

可选地，所述将所述特征向量信息发送至所述强化学习设备，以进行所述纵向联邦，更新预设纵向联邦模型的步骤包括：

将所述特征向量信息发送至所述强化学习设备，以接收所述强化学习设备反馈的梯度信息；

基于所述梯度信息，对所述预设纵向联邦模型进行训练更新。

可选地，所述特征向量信息用于作为所述强化学习设备的模型输入数据，所述模型输入数据用于输入所述强化学习设备以通过对所述强化学习设备进行训练，计算所述强化学习设备对应的所述梯度信息。

可选地，所述将所述特征向量信息发送至所述强化学习设备，以接收所述强化学习设备反馈的梯度信息的步骤之后包括：

判断是否接收到更新命令，若接收到所述更新命令，则基于所述梯度信息，对所述预设纵向联邦模型进行训练更新；

若未接收到所述更新命令，则放弃更新所述预设纵向联邦模型。

本申请还提供一种基于公共数据的纵向联邦装置，所述基于公共数据的纵向联邦装置应用于基于公共数据的纵向联邦设备，所述基于公共数据的纵向联邦装置包括：

提取模块，用于所述接收强化学习设备发送的纵向联邦服务请求，并提取所述纵向联邦服务请求对应的目标公共数据；

特征提取模块，用于所述获取特征提取模型，并将所述目标公共数据输入所述特征提取模型，获得特征向量信息；

发送模块，用于所述将所述特征向量信息发送至所述强化学习设备，以进行所述纵向联邦，更新预设纵向联邦模型。

可选地，所述特征提取模块包括：

模型选择单元，用于所述基于所述模型识别信息，通过预设模型集成模块调用所述模型识别信息对应的特征提取模型；

特征提取单元，用于所述将所述目标公共数据输入所述特征提取模型，以对所述目标公共信息进行特征提取，获得所述特征向量信息。

可选地，所述特征提取单元包括：

卷积子单元，用于所述将所述目标图片数据输入所述特征提取神经网络，以对所述目标公共数据进行卷积处理，获得卷积处理结果；

池化子单元，用于所述对所述卷积处理结果进行池化处理，获得池化处理结果；

重复交易子单元，用于所述对所述池化处理结果重复交替进行预设次数的所述卷积处理和池化处理，获得所述特征向量信息。

可选地，所述提取模块包括：

调用单元，用于所述接收强化学习设备发送的纵向联邦服务请求，并通过预设数据调度模块调用所述纵向联邦请求的初始公共信息；

预处理单元，用于所述通过预设数据预处理模块对所述初始公共信息进行预处理，获得所述目标公共信息。

可选地，所述发送模块包括：

发送单元，用于所述将所述特征向量信息发送至所述强化学习设备，以接收所述强化学习设备反馈的梯度信息；

训练更新单元，用于所述基于所述梯度信息，对所述预设纵向联邦模型进行训练更新。

可选地，所述发送模块还包括：

第一判断单元，用于所述判断是否接收到更新命令，若接收到所述更新命令，则基于所述梯度信息，对所述预设纵向联邦模型进行训练更新；

第二判断单元，用于所述若未接收到所述更新命令，则放弃更新所述预设纵向联邦模型。

本申请还提供一种基于公共数据的纵向联邦设备，所述基于公共数据的纵向联邦设备包括：存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的所述基于公共数据的纵向联邦方法的程序，所述基于公共数据的纵向联邦方法的程序被处理器执行时可实现如上述的基于公共数据的纵向联邦方法的步骤。

本申请还提供一种介质，所述介质为可读存储介质，所述介质上存储有实现基于公共数据的纵向联邦方法的程序，所述基于公共数据的纵向联邦方法的程序被处理器执行时实现如上述的基于公共数据的纵向联邦方法的步骤。

本申请通过接收强化学习设备发送的纵向联邦服务请求，并提取所述纵向联邦服务请求对应的目标公共数据，进而获取特征提取模型，并将所述目标公共数据输入所述特征提取模型，获得特征向量信息，进而将所述特征向量信息发送至所述强化学习设备，以进行所述纵向联邦，更新预设纵向联邦模型。也即，本申请基于所述强化学习设备发送的纵向联邦服务请求，向所述强化学习设备反馈公共数据对应的特征向量信息，进而通过所述强化学习设备将基于所述特征向量信息进行纵向联邦学习，更新预设纵向联邦模型，其中，所述公共数据为海量的训练数据，进而可在极大程度上扩充训练样本的数量和特征丰富度，实现了基于海量训练数据训练机器学习模型的目的，提高了机器学习模型的健壮性和宽泛性，避免了由于训练样本过少而导致纵向联邦机器学习模型性能下降的情况发生，进一步地，通过特征丰富度高的海量训练数据对机器学习模型进行训练，减少了机器学习过程中的无效计算次数，提高了机器学习时的模型训练效率，也即，提高了机器学习时的计算效率，减少了机器学习模型的训练时长，进而提高了机器学习模型的构建效率，避免了由于训练样本的特征丰富度低而导致机器学习模型构建效率低的情况发生，所以，解决了现有技术中机器学习模型构建效率低的技术问题。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本申请的实施例，并与说明书一起用于解释本申请的原理。

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本申请基于公共数据的纵向联邦方法第一实施例的流程示意图；

图2为本申请基于公共数据的纵向联邦方法中基于纵向联邦的公共信息服务架构示意图；

图3为本申请基于公共数据的纵向联邦方法第二实施例的流程示意图；

图4为本申请实施例方案涉及的硬件运行环境的设备结构示意图。

本申请目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本申请实施例提供一种基于公共数据的纵向联邦方法，所述基于公共数据的纵向联邦方法应用于基于公共数据的纵向联邦设备，在本申请基于公共数据的纵向联邦方法的第一实施例中，参照图1，所述基于公共数据的纵向联邦方法包括：

步骤S10，接收强化学习设备发送的纵向联邦服务请求，并提取所述纵向联邦服务请求对应的目标公共数据；

在本实施例中，需要说明的是，所述基于公共数据的纵向联邦方法应用于公共联邦服务方，所述公共联邦服务方包括数据集成模块，所述数据集成模型中包括多个公共信息数据源，所述公共信息数据源包括图片数据、文字数据等。

接收强化学习设备发送的纵向联邦服务请求，并提取所述纵向联邦服务请求对应的目标公共数据，具体地，接收强化学习设备发送的纵向联邦服务请求，其中，所述纵向联邦服务请求包括数据源识别信息，所述数据源识别信息包括字符串、关键词等，进而在所述数据集成模块提取所述数据源识别信息对应的目标公共数据，其中，所述目标公共数据为与所述强化学习设备当前状态相关的数据，所述当前状态包括位置状态、运动状态等，例如，假设所述强化学习设备为无人车，而无人车发送的联邦服务请求为请求当前位置的车辆分布学习，则所述目标公共数据为以无人车为中心的车辆分布信息。

其中，所述接收强化学习设备发送的纵向联邦服务请求，并提取所述纵向联邦服务请求对应的目标公共数据的步骤包括：

步骤S11，接收强化学习设备发送的纵向联邦服务请求，并通过预设数据调度模块调用所述纵向联邦请求的初始公共信息；

在本实施例中，需要说明的是，所述数据集成模块包括所述预设数据调度模块，所述初始公共信息为初始公共信息数据源，也即，所述初始公共信息为未进行任何处理的原始公共信息数据源。

接收强化学习设备发送的纵向联邦服务请求，并通过预设数据调度模块调用所述纵向联邦请求的初始公共信息，具体地，接收强化学习设备发送的纵向联邦服务请求，并基于所述纵向联邦服务请求中的数据源识别信息通过预设数据调度模块调用所述纵向联邦请求对应的初始公共信息。

步骤S12，通过预设数据预处理模块对所述初始公共信息进行预处理，获得所述目标公共信息；

在本实施例中，所述预处理包括图片裁剪处理、文字删除处理等，所述数据集成模块包括预设数据预处理模块。

通过预设数据预处理模块对所述初始公共信息进行预处理，获得所述目标公共信息，具体地，通过预设数据预处理模块对所述初始公共信息进行预处理，将初始公共信息中与所述强化学习设备的当前状态不相关的信息进行去除，获得所述目标公共信息，例如，假设所述强化学习设备对应的训练设备为无人车，所述纵向联邦服务请求为请求无人车周围的车辆分布信息，所述初始公共信息为关于无人车图片，则对所述无人车图片进行车辆识别，进而对所述无人车图片进行裁剪，以将所述无人车裁剪至图片中央，也即，对所述无人车图片进行预处理。

步骤S20，获取特征提取模型，并将所述目标公共数据输入所述特征提取模型，获得特征向量信息；

在本实施例中，需要说明的是，所述特征向量信息包括所述目标公共数据的所有特征信息，例如，假设所述目标公共信息为无人车周围的车辆分布信息，所述特征向量信息为特征向量(a，b)，则a代表周围车辆的数量信息，b代表周围车辆的位置信息，其中，a和b可用字符、数字等进行表示，所述特征提取模型是已经训练好的神经网络模型。

获取特征提取模型，并将所述目标公共数据输入所述特征提取模型，获得特征向量信息，具体地，基于所述纵向联邦请求中的模型识别信息，通过预设模型集成模块调用所述特征提取模型，进而将所述目标公共数据输入所述特征提取模型，以对所述目标公共数据进行特征提取，以将所述目标公共数据转化为特征向量，获得所述特征向量信息。

步骤S30，将所述特征向量信息发送至所述强化学习设备，以进行所述纵向联邦，更新预设纵向联邦模型。

在本实施例中，所述预设纵向联邦模型属于所述公共联邦服务方，所述强化学习设备为强化学习模型对应的训练设备。

将所述特征向量信息发送至所述强化学习设备，以进行所述纵向联邦，更新预设纵向联邦模型，具体地，将所述特征向量信息发送至所述强化学习设备，其中，所述特征向量信息将作为所述强化学习设备的输入，所述强化学习设备将基于当前状态计算的奖励函数和所述特征向量信息进行训练，输出可执行动作以更新所述当前状态，其中，所述奖励函数用于指导所述强化学习设备进行训练，例如，假设所述强化学习设备包括多种可执行动作，且每种执行动作均对应存在被选择的概率，并非固定输出一种可执行动作，进一步地，例如，假设所述强行化学习模型对应的训练设备为无人车，则所述可执行动作包括转弯、停止和刹车等动作，进而基于所述当前状态计算所述奖励函数，若所述奖励函数值为正，则提高获取所述当前状态所对应的可执行动作的选择概率，若所述奖励函数值为负，则降低获取所述当前状态所对应的可执行动作的选择概率，进而指导所述强化学习设备进行训练，也即，指导所述强化学习模型进行训练，进一步地，通过所述强化学习设备进行本次强化学习模型的训练，获得模型训练结果，基于所述模型训练结果和强化学习模型的网络权重参数计算相对应的梯度信息，进而所述公共联邦服务方接收所述强化学习设备反馈的梯度信息，并基于所述梯度信息，更新所述预设纵向联邦模型，如图2所示为本申请实施例基于纵向联邦的公共信息服务架构示意图，其中，所述数据源1、数据源2和数据源3均为初始公共信息，所述数据集成模块包括预设数据调度模块和预设数据预处理模块所述公共信息联邦方属于所述公共联邦服务方，用于进行所述纵向联邦。

其中，所述将所述特征向量信息发送至所述强化学习设备，以进行所述纵向联邦，更新预设纵向联邦模型的步骤包括：

步骤S31，将所述特征向量信息发送至所述强化学习设备，以接收所述强化学习设备反馈的梯度信息；

在本实施例中，将所述特征向量信息发送至所述强化学习设备，以接收所述强化学习设备反馈的梯度信息，具体地，将所述特征向量信息发送至所述强化学习设备，其中，所述特征向量信息将作为所述强化学习设备的输入，所述强化学习设备将基于当前状态计算的奖励函数和所述特征向量信息进行训练，输出可执行动作以更新所述当前状态，获得下一步状态，并计算本次更新对应的梯度信息，其中，所述梯度信息为一梯度向量，且所述梯度信息与所述强化学习模型的网络权重参数相关联，进而接收所述强化学习设备反馈的梯度信息。

其中，述将所述特征向量信息发送至所述强化学习设备，以接收所述强化学习设备反馈的梯度信息的步骤之后包括：

步骤A10，判断是否接收到更新命令，若接收到所述更新命令，则基于所述梯度信息，对所述预设纵向联邦模型进行训练更新；

在本实施例，判断是否接收到更新命令，若接收到所述更新命令，则基于所述梯度信息，对所述预设纵向联邦模型进行训练更新，具体地，判断是否接收到更新命令，若接收到所述更新命令，则基于所述梯度信息调整所述预设纵向联邦模型的网络权重参数，以将所述预设强化学习设备的当前状态更新为所述强化学习设备的下一步状态，也即，基于所述梯度信息，对所述预设纵向联邦模型进行训练更新，其中，需要说明的是，所述强化学习设备的数量为一个或者多个，则在同一次纵向联邦学习中，所述公共服务联邦方将接收到一个或者多个强化学习设备发送一个或者多个梯度信息，当所述梯度信息为多个时，则基于用户命令选择或者随机选择一个梯度信息用于更新所述预设纵向联邦模型。

步骤A20，若未接收到所述更新命令，则放弃更新所述预设纵向联邦模型。

在本实施例中，若未接收到所述更新命令，则放弃更新所述预设纵向联邦模型，具体地，若未接收到所述更新命令，则舍弃本次纵向联邦学习接收的所有梯度信息，并放弃更新所述预设纵向联邦模型。

步骤S32，基于所述梯度信息，对所述预设纵向联邦模型进行训练更新。

在本实施例中，基于所述梯度信息，对所述预设纵向联邦模型的网络权重参数进行调整，以对所述预设纵向联邦模型进行训练更新，将所述预设强化学习设备的当前状态更新至所述强化学习设备的下一步状态，其中，所述强化学习设备的下一步状态为所述强化学习设备在当前环境下执行所述可执行动作而获得的结果，所述当前环境由所述模型输入数据决定，也即，所述当前环境由所述特征向量信息所决定。

本实施例通过接收强化学习设备发送的纵向联邦服务请求，并提取所述纵向联邦服务请求对应的目标公共数据，进而获取特征提取模型，并将所述目标公共数据输入所述特征提取模型，获得特征向量信息，进而将所述特征向量信息发送至所述强化学习设备，以进行所述纵向联邦，更新预设纵向联邦模型。也即，本实施例基于所述强化学习设备发送的纵向联邦服务请求，向所述强化学习设备反馈公共数据对应的特征向量信息，进而通过所述强化学习设备将基于所述特征向量信息进行纵向联邦学习，更新预设纵向联邦模型，其中，所述公共数据为海量的训练数据，进而可在极大程度上扩充训练样本的数量和特征丰富度，实现了基于海量训练数据训练机器学习模型的目的，提高了机器学习模型的健壮性和宽泛性，避免了由于训练样本过少而导致纵向联邦机器学习模型性能下降的情况发生，进一步地，通过特征丰富度高的海量训练数据对机器学习模型进行训练，减少了机器学习过程中的无效计算次数，提高了机器学习时的模型训练效率，也即，提高了机器学习时的计算效率，减少了机器学习模型的训练时长，进而提高了机器学习模型的构建效率，避免了由于训练样本的特征丰富度低而导致机器学习模型构建效率低的情况发生，所以，解决了现有技术中机器学习模型构建效率低的技术问题。

进一步地，参照图3，基于本申请中第一实施例，在基于公共数据的纵向联邦方法的另一实施例中，所述联邦服务请求包括模型识别信息，

步骤S21，基于所述模型识别信息，通过预设模型集成模块调用所述模型识别信息对应的特征提取模型；

在本实施例中，需要说明的是，所述模型识别信息包括字符串、代码。图片等信息，从不同的公共信息数据源中获取的目标公共数据需要使用不同的特征提取模型进行特征提取。

步骤S22，将所述目标公共数据输入所述特征提取模型，以对所述目标公共信息进行特征提取，获得所述特征向量信息。

在本实施例中，需要说明的是，所述特征向量信息为无特殊意义的向量，用户并不知道特征向量的代表意义，可通过机器进行识别。

将所述目标公共数据输入所述特征提取模型，以对所述目标公共信息进行特征提取，获得所述特征向量信息，具体地，将所述目标公共数据输入所述特征提取模型，以基于所述特征提取模型中的数据处理层对所述目标公共数据进行数据处理，其中，所述数据处理层包括卷积层、池化层和全连接层等，对应地所述数据处理包括卷积处理、池化处理和全连接处理等，进而输出所述特征向量，也即，获得所述特征向量信息。

其中，所述特征提取模型包括特征提取神经网络，所述目标公共数据包括目标图片数据，

步骤S321，将所述目标图片数据输入所述特征提取神经网络，以对所述目标公共数据进行卷积处理，获得卷积处理结果；

在本实施例中，需要说明的是，所述卷积处理指的是对图像对应的图像矩阵和卷积核进行逐个元素相乘再求和，获得图像特征值的过程，其中，所述卷积核指的是界面图像特征对应的权值矩阵。

将所述目标图片数据输入所述特征提取神经网络，以对所述目标公共数据进行卷积处理，获得卷积处理结果，具体地，将所述目标图片数据输入所述特征提取神经网络，以将所述目标图片数据对应的图像矩阵与所述卷积核进行点乘，获得新的图像矩阵，也即，获得所述卷积处理结果。

步骤S322，对所述卷积处理结果进行池化处理，获得池化处理结果；

在本实施例中，所述池化处理指的是对通过卷积而获得的图像特征值进行整合，从而获得新的特征值的过程，所述池化处理包括最大值池化处理、平均值池化处理、随机池化处理和求和区域池化处理等。

对所述卷积处理结果进行池化处理，获得池化处理结果，具体地，将所述卷积处理结果分割为多个预设大小的图像矩阵，若为最大值池化，则使用图像矩阵的最大像素值代替所述图像矩阵，进而获得新的图像矩阵，也即，获得池化处理结果。

步骤S323，对所述池化处理结果重复交替进行预设次数的所述卷积处理和池化处理，获得所述特征向量信息；

在本实施例中，对所述池化处理结果重复交替进行预设次数的所述卷积处理和池化处理，获得所述特征向量信息，具体地，重复进行预设次数的步骤S322至步骤S323，获得所述特征向量信息，其中，所述预设次数所述特征提取模型的数据处理层的数量相关联。

本实施例通过基于所述模型识别信息，通过预设模型集成模块调用所述模型识别信息对应的特征提取模型，进而将所述目标公共数据输入所述特征提取模型，以对所述目标公共信息进行特征提取，获得所述特征向量信息。也即，本实施例首先基于所述模型识别信息，通过预设模型集成模块进行所述模型识别信息对应的特征提取模型的调用，进而将所述目标公共数据输入所述特征提取模型，以进行对所述目标公共信息的特征提取，获得所述特征向量信息。也即，本实施例基于强化学习设备发送的模型识别信息，调用相对应的特征提取模块对所述目标公共数据进行精确的数据下采样，将所述目标公共信息转化为一段不具备独特意义的特征向量，减少了目标公共信息的数据大小，进而可将所述特征向量发送至强化学习设备以进行联邦学习，进而减少了强化学习设备的数据处理量，提高了计算效率，且该特征提取模型和目标公共数据均完全由公共联邦服务方控制，因此，保护了目标公共数据不被泄露，且由于数据传输的为特征向量，无需进行加密发送且不会泄露目标公共数据，进而减少了对目标公共数据加密的计算过程，提高了目标公共数据的数据传输效率，也即，本实施在保护训练样本数据的隐私的情况下，提高了训练样本数据的数据传输效率和数据计算效率，进而提高了联邦学习中的模型训练效率，为解决现有技术中机器学习模型构建效率低的技术问题奠定了基础。

参照图4，图4是本申请实施例方案涉及的硬件运行环境的设备结构示意图。

如图4所示，该基于公共数据的纵向联邦设备可以包括：处理器1001，例如CPU，存储器1005，通信总线1002。其中，通信总线1002用于实现处理器1001和存储器1005之间的连接通信。存储器1005可以是高速RAM存储器，也可以是稳定的存储器(non-volatilememory)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储设备。

可选地，该基于公共数据的纵向联邦设备还可以包括矩形用户接口、网络接口、摄像头、RF(Radio Frequency，射频)电路，传感器、音频电路、WiFi模块等等。矩形用户接口可以包括显示屏(Display)、输入子模块比如键盘(Keyboard)，可选矩形用户接口还可以包括标准的有线接口、无线接口。网络接口可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。

本领域技术人员可以理解，图4中示出的基于公共数据的纵向联邦设备结构并不构成对基于公共数据的纵向联邦设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图4所示，作为一种计算机存储介质的存储器1005中可以包括操作***、网络通信模块以及基于公共数据的纵向联邦程序。操作***是管理和控制基于公共数据的纵向联邦设备硬件和软件资源的程序，支持基于公共数据的纵向联邦程序以及其它软件和/或程序的运行。网络通信模块用于实现存储器1005内部各组件之间的通信，以及与基于公共数据的纵向联邦***中其它硬件和软件之间通信。

在图4所示的基于公共数据的纵向联邦设备中，处理器1001用于执行存储器1005中存储的基于公共数据的纵向联邦程序，实现上述任一项所述的基于公共数据的纵向联邦方法的步骤。

本申请基于公共数据的纵向联邦设备具体实施方式与上述基于公共数据的纵向联邦方法各实施例基本相同，在此不再赘述。

本申请实施例还提供一种基于公共数据的纵向联邦装置，所述基于公共数据的纵向联邦装置包括：

可选地，所述特征提取模块包括：

可选地，所述特征提取单元包括：

可选地，所述提取模块包括：

可选地，所述发送模块包括：

可选地，所述发送模块还包括：

本申请基于公共数据的纵向联邦装置的具体实施方式与上述基于公共数据的纵向联邦方法各实施例基本相同，在此不再赘述。

本申请实施例提供了一种介质，所述介质为可读存储介质，且所述介质存储有一个或者一个以上程序，所述一个或者一个以上程序还可被一个或者一个以上的处理器执行以用于实现上述任一项所述的基于公共数据的纵向联邦方法的步骤。

本申请介质具体实施方式与上述基于公共数据的纵向联邦方法各实施例基本相同，在此不再赘述。

以上仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利处理范围内。

Claims

1.一种基于公共数据的纵向联邦方法，其特征在于，所述基于公共数据的纵向联邦方法包括：

接收强化学习设备发送的纵向联邦服务请求，并在数据集成模块中提取所述纵向联邦服务请求对应的目标公共数据，其中，所述数据集成模块包括多个不同类型的公共信息数据源；

将所述特征向量信息发送至所述强化学习设备，以进行所述纵向联邦，更新预设纵向联邦模型；

其中，所述纵向联邦服务请求包括模型识别信息，

将所述目标公共数据输入所述特征提取模型，以对所述目标公共数据进行特征提取，获得所述特征向量信息。

2.如权利要求1所述基于公共数据的纵向联邦方法，其特征在于，所述特征提取模型包括特征提取神经网络，所述目标公共数据包括目标图片数据，

所述将所述目标公共数据输入所述特征提取模型，以对所述目标公共数据进行特征提取，获得所述特征向量信息的步骤包括：

对所述卷积处理结果进行池化处理，获得池化处理结果；

3.如权利要求1所述基于公共数据的纵向联邦方法，其特征在于，所述接收强化学习设备发送的纵向联邦服务请求，并提取所述纵向联邦服务请求对应的目标公共数据的步骤包括：

接收强化学习设备发送的纵向联邦服务请求，并通过预设数据调度模块调用所述纵向联邦服务请求的初始公共信息；

通过预设数据预处理模块对所述初始公共信息进行预处理，获得所述目标公共数据。

4.如权利要求1所述基于公共数据的纵向联邦方法，其特征在于，所述将所述特征向量信息发送至所述强化学习设备，以进行所述纵向联邦，更新预设纵向联邦模型的步骤包括：

5.如权利要求4所述基于公共数据的纵向联邦方法，其特征在于，所述特征向量信息用于作为所述强化学习设备的模型输入数据，所述模型输入数据用于输入所述强化学习设备以通过对所述强化学习设备进行训练，计算所述强化学习设备对应的所述梯度信息。

6.如权利要求4所述基于公共数据的纵向联邦方法，其特征在于，所述将所述特征向量信息发送至所述强化学习设备，以接收所述强化学习设备反馈的梯度信息的步骤之后包括：

7.一种基于公共数据的纵向联邦装置，其特征在于，所述基于公共数据的纵向联邦装置包括：

提取模块，用于接收强化学习设备发送的纵向联邦服务请求，并在数据集成模块中提取所述纵向联邦服务请求对应的目标公共数据，其中，所述数据集成模块包括多个不同类型的公共信息数据源；

特征提取模块，用于获取特征提取模型，并将所述目标公共数据输入所述特征提取模型，获得特征向量信息；

发送模块，用于将所述特征向量信息发送至所述强化学习设备，以进行所述纵向联邦，更新预设纵向联邦模型；

其中，所述联邦服务请求包括模型识别信息，

所述特征提取模块还用于：

8.一种基于公共数据的纵向联邦设备，其特征在于，所述基于公共数据的纵向联邦设备包括：存储器、处理器以及存储在存储器上的用于实现所述基于公共数据的纵向联邦方法的程序，

所述存储器用于存储实现基于公共数据的纵向联邦方法的程序；

所述处理器用于执行实现所述基于公共数据的纵向联邦方法的程序，以实现如权利要求1至6中任一项所述基于公共数据的纵向联邦方法的步骤。

9.一种介质，其特征在于，所述介质上存储有实现基于公共数据的纵向联邦方法的程序，所述实现基于公共数据的纵向联邦方法的程序被处理器执行以实现如权利要求1至6中任一项所述基于公共数据的纵向联邦方法的步骤。