WO2022142493A1

WO2022142493A1 - 业务数据处理方法、装置、电子设备和存储介质

Info

Publication number: WO2022142493A1
Application number: PCT/CN2021/119158
Authority: WO
Inventors: 王若兰; 刘洋; 张钧波; 郑宇�
Original assignee: 京东城市(北京)数字科技有限公司
Priority date: 2020-12-29
Filing date: 2021-09-17
Publication date: 2022-07-07
Also published as: CN113723652A

Abstract

一种业务数据处理方法、装置（700）、电子设备和存储介质，其中，方法包括：根据业务数据请求中的目标区域的标识，获取第一数据端上的目标区域在目标时刻的第一人群消费画像信息（102），并协同其他第一数据端上的目标区域在目标时刻的第二人群消费画像信息，通过第一目标联邦学习模型对第一人群消费画像信息进行修正，以得到目标区域在目标时刻的目标人群消费画像信息（103），结合目标人群消费画像信息以及目标区域在目标时刻的目标人流量数据，对业务数据请求所请求的业务进行处理。由此，基于人流量数据以及结合多个数据端所确定出的目标人群消费画像信息准确实现对业务数据请求所请求的业务进行准确处理。

Description

业务数据处理方法、装置、电子设备和存储介质

相关申请的交叉引用

本申请要求京东城市(北京)数字科技有限公司公司于2020年12月29日提交的、发明名称为“业务数据处理方法、装置、电子设备和存储介质”的、中国专利申请号“202011597920.8”的优先权。

技术领域

本申请涉及计算机技术领域，尤其涉及业务数据处理方法、装置、电子设备和存储介质。

背景技术

相关技术中，在需要结合区域人流量数据和人群消费画像进行业务处理的场景中，通常业务***从基于单个数据源所确定出的人群消费画像数据库中，获取对应区域中的人群消费画像，然后，从业务***中获取区域对应的人流量数据，并结合人流量数据和人群消费画像进行业务处理。然而，这种基于单方面数据源刻画出的区域人群画像并不精准，从而导致所提供的业务处理结果并不准确。

发明内容

本申请提出一种业务数据处理方法、装置、电子设备和存储介质。

本申请一方面实施例提出了一种业务数据处理方法，包括：接收业务数据请求，其中，所述业务数据请求包括目标区域的标识以及目标时刻；根据所述目标区域的标识，获取第一数据端上的目标区域在所述目标时刻的第一人群消费画像信息；协同其他第一数据端上的所述目标区域在所述目标时刻的第二人群消费画像信息，通过第一目标联邦学习模型对所述第一人群消费画像信息进行修正，以得到所述目标区域在所述目标时刻的目标人群消费画像信息；获取所述目标区域在目标时刻的目标人流量数据；根据所述目标人流量数据和所述目标人群消费画像信息，确定所述目标区域在所述目标时刻的消费人群特征分布信息；根据所述消费人群特征分布信息对所述业务数据请求所请求的业务进行处理。

在本申请的一个实施例中，所述获取所述目标区域在目标时刻的目标人流量数据，包括：获取第二数据端上的所述目标区域在目标时刻的第一人流量数据；协同其他第二数据端上的所述目标区域在所述目标时刻的第二人流量数据，通过第二目标联邦学习模型对所述第一人流量数据进行修正，以获取所述目标区域在所述目标时刻的目标人流量数据。

在本申请的一个实施例中，所述获取第二数据端上的所述目标区域在目标时刻的第一人流量数据，包括：获取在第一预设时长内所述目标区域在每个历史目标时刻的人流量数据；基于每个所述历史目标时刻的人流量数据，确定所述第二数据端上的所述目标区域在目标时刻的第一人流量数据。

在本申请的一个实施例中，所述根据所述目标区域的标识，获取第一数据端上的目标区域在所述目标时刻的第一人群消费画像信息，包括：根据所述目标区域的标识，获取在第二预设时长内所述目标区域在每个历史时刻的人群消费画像信息；根据每个所述历史时刻的人群消费画像信息，确定所述第一数据端上的所述目标区域在目标时刻的第一人群消费画像信息。

在本申请的一个实施例中，所述第一目标联邦学习模型的训练过程，包括：获取所述第一数据端上的样本区域在样本时刻的第一样本人群消费画像信息；协同其他第一数据端上的所述样本区域在所述样本时刻的第二样本人群消费画像信息进行联邦学习模型的训练，以生成所述第一目标联邦学习模型，其中，选取所述第一样本人群消费画像信息和所述第二样本人群消费画像信息中人群消费画像信息最大的样本人群消费画像信息作为模型的待修正数据，剩余的样本人群消费画像信息作为所述模型的特征数据，所述第一目标联邦学习模型用于建立所述特征数据和所述待修正数据之间的回归关系。

在本申请的一个实施例中，所述协同其他第一数据端上的所述样本区域在所述样本时刻的第二样本人群消费画像信息进行联邦学习模型的训练，以生成所述第一目标联邦学习模型，包括：基于所述第一人群消费画像信息，控制所述第一数据端上的本地学习模型进行训练，以得到中间结果；基于所述第二人群消费画像信息，控制所述其他第一数据端对其自身上的本地学习模型进行训练，以得到中间结果；获取各个所述第一数据端上的本地学习模型每次训练输出的中间结果，并将每次输出的所述中间结果发送给协调方进行汇总；接收所述协调方发送的每次汇总出的全局中间结果；基于所述全局中间结果调整所述本地学习模型的模型参数并继续下一轮训练，直至满足预设条件停止训练得到所述第一目标联邦学习模型。

在本申请的一个实施例中，所述第二目标联邦学习模型的训练过程，包括：获取所述第二数据端上的样本区域在样本时刻的第一样本人流量数据；协同其他第二数据端上的所述样本区域在所述样本时刻的第二样本人流量数据进行联邦学习模型的训练，以生成所述第二目标联邦学习模型，其中，选取所述第一样本人流量数据和所述第二样本人流量数据中人流量数据最大的样本人流量数据作为模型的待修正数据，剩余的样本人流量数据作为所述模型的特征数据，所述第二目标联邦学习模型用于建立所述特征数据和所述待修正数据之间的回归关系。

在本申请的一个实施例中，所述协同其他第二数据端上的所述样本区域在所述样本时刻的第二样本人流量数据进行联邦学习模型的训练，以生成所述第二目标联邦学习模型，包括：基于所述第一样本人流量数据，控制所述第二数据端上的本地学习模型进行训练，以得到中间结果；基于所述第二样本人流量数据，控制所述其他第二数据端对其自身上的本地学习模型进行训练，以得到中间结果；获取各个所述第二数据端上的本地学习模型每次训练输出的中间结果，并将每次输出的所述中间结果发送给协调方进行汇总；接收所述协调方发送的每次汇总出的全局中间结果；基于所述全局中间结果调整所述本地学习模型的模型参数并继续下一轮训练，直至满足预设条件停止训练得到所述第二目标联邦学习模型。

本申请实施例的业务数据处理方法，在接收到业务数据请求后，根据业务数据请求中的目标区域的标识，获取第一数据端上的目标区域在目标时刻的第一人群消费画像信息，并协同其他第一数据端上的目标区域在目标时刻的第二人群消费画像信息，通过第一目标联邦学习模型对第一人群消费画像信息进行修正，以得到目标区域在目标时刻的目标人群消费画像信息，然后，结合目标人群消费画像信息以及该目标区域在目标时刻的目标人流量数据，确定目标区域在目标时刻的消费人群特征分布信息，以及根据消费人群特征分布信息对业务数据请求所请求的业务进行处理。由此，基于人流量数据以及结合多个数据端所确定出的目标人群消费画像信息准确实现了对业务数据请求所请求的业务进行准确处理，提高了业务处理的准确率。

本申请另一方面实施例提出了一种业务数据处理装置，包括：接收模块，用于接收业务数据请求，其中，所述业务数据请求包括目标区域的标识以及目标时刻；第一获取模块，用于根据所述目标区域的标识，获取第一数据端上的目标区域在所述目标时刻的第一人群消费画像信息；修正模块，用于协同其他第一数据端上的所述目标区域在所述目标时刻的第二人群消费画像信息，通过第一目标联邦学习模型对所述第一人群消费画像信息进行修正，以得到所述目标区域在所述目标时刻的目标人群消费画像信息；第二获取模块，获取所述目标区域在目标时刻的目标人流量数据；确定模块，用于根据所述目标人流量数据和所述目标人群消费画像信息，确定所述目标区域在所述目标时刻的消费人群特征分布信息；业务处理模块，用于根据所述消费人群特征分布信息对所述业务数据请求所请求的业务进行处理。

在本申请的一个实施例中，所述第二获取模块，包括：第一获取单元，用于获取第二数据端上的所述目标区域在目标时刻的第一人流量数据；修正单元，用于协同其他第二数据端上的所述目标区域在所述目标时刻的第二人流量数据，通过第二目标联邦学习模型对所述第一人流量数据进行修正，以获取所述目标区域在所述目标时刻的目标人流量数据。

在本申请的一个实施例中，所述第一获取单元，具体用于：获取在第一预设时长内所述目标区域在每个历史目标时刻的人流量数据；基于每个所述历史目标时刻的人流量数据，确定所述第二数据端上的所述目标区域在目标时刻的第一人流量数据。

在本申请的一个实施例中，所述第一获取模块，包括：第二获取单元，用于根据所述目标区域的标识，获取在第二预设时长内所述目标区域在每个历史时刻的人群消费画像信息；确定单元，用于根据每个所述历史时刻的人群消费画像信息，确定所述第一数据端上的所述目标区域在目标时刻的第一人群消费画像信息。

在本申请的一个实施例中，所述装置还包括第一训练模块，所述第一训练模块，包括：第三获取单元，用于获取所述第一数据端上的样本区域在样本时刻的第一样本人群消费画像信息；第一训练单元，用于协同其他第一数据端上的所述样本区域在所述样本时刻的第二样本人群消费画像信息进行联邦学习模型的训练，以生成所述第一目标联邦学习模型，其中，选取所述第一样本人群消费画像信息和所述第二样本人群消费画像信息中人群消费画像信息最大的样本人群消费画像信息作为模型的待修正数据，剩余的样本人群消费画像信息作为所述模型的特征数据，所述第一目标联邦学习模型用于建立所述特征数据和所述待修正数据之间的回归关系。

在本申请的一个实施例中，所述第一训练单元，具体用于：基于所述第一人群消费画像信息，控制所述第一数据端上的本地学习模型进行训练，以得到中间结果；基于所述第二人群消费画像信息，控制所述其他第一数据端对其自身上的本地学习模型进行训练，以得到中间结果；获取各个所述第一数据端上的本地学习模型每次训练输出的中间结果，并将每次输出的所述中间结果发送给协调方进行汇总；接收所述协调方发送的每次汇总出的全局中间结果；基于所述全局中间结果调整所述本地学习模型的模型参数并继续下一轮训练，直至满足预设条件停止训练得到所述第一目标联邦学习模型。

在本申请的一个实施例中，所述装置还包括第二训练模块，所述第二训练模块，包括：第四获取单元，用于获取所述第二数据端上的样本区域在样本时刻的第一样本人流量数据；第二训练单元，用于协同其他第二数据端上的所述样本区域在所述样本时刻的第二样本人流量数据进行联邦学习模型的训练，以生成所述第二目标联邦学习模型，其中，选取所述第一样本人流量数据和所述第二样本人流量数据中人流量数据最大的样本人流量数据作为模型的待修正数据，剩余的样本人流量数据作为所述模型的特征数据，所述第二目标联邦学习模型用于建立所述特征数据和所述待修正数据之间的回归关系。

在本申请的一个实施例中，所述第二训练单元，具体用于：基于所述第一样本人流量数据，控制所述第二数据端上的本地学习模型进行训练，以得到中间结果；基于所述第二样本人流量数据，控制所述其他第二数据端对其自身上的本地学习模型进行训练，以得到中间结果；获取各个所述第二数据端上的本地学习模型每次训练输出的中间结果，并将每次输出的所述中间结果发送给协调方进行汇总；接收所述协调方发送的每次汇总出的全局中间结果；基于所述全局中间结果调整所述本地学习模型的模型参数并继续下一轮训练，直至满足预设条件停止训练得到所述第二目标联邦学习模型。

本申请实施例的业务数据处理装置，在接收到业务数据请求后，根据业务数据请求中的目标区域的标识，获取第一数据端上的目标区域在目标时刻的第一人群消费画像信息，并协同其他第一数据端上的目标区域在目标时刻的第二人群消费画像信息，通过第一目标联邦学习模型对第一人群消费画像信息进行修正，以得到目标区域在目标时刻的目标人群消费画像信息，然后，结合目标人群消费画像信息以及该目标区域在目标时刻的目标人流量数据，确定目标区域在目标时刻的消费人群特征分布信息，以及根据消费人群特征分布信息对业务数据请求所请求的业务进行处理。由此，基于人流量数据以及结合多个数据端所确定出的目标人群消费画像信息准确实现了对业务数据请求所请求的业务进行准确处理，提高了业务处理的准确率。

本申请另一方面实施例提出了一种电子设备，包括：一种电子设备，包括：存储器，处理器；所述存储器中存储有计算机指令，当所述计算机指令被所述处理器执行时，实现本申请实施例的业务数据处理方法。

本申请另一方面实施例提出了一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行本申请实施例公开的业务数据处理方法。

本申请另一方面实施例提出了一种计算机程序产品，当所述计算机程序产品中的指令处理器执行时实现本申请实施例中的业务数据处理方法。

上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。

附图说明

附图用于更好地理解本方案，不构成对本申请的限定。其中：

图1是根据本申请一个实施例的业务数据处理方法的流程示意图。

图2是训练第一目标联邦学习模型的流程示意图。

图3是步骤202的细化流程示意图。

图4是第二目标联邦学习模型的流程示意图。

图5是步骤402的细化流程示意图。

图6是业务装置中各层之间的关系示例图。

图7是根据本申请一个实施例的业务数据处理装置的结构示意图。

图8是根据本申请另一个实施例的业务数据处理装置的结构示意图。

图9是根据本申请一个实施例的电子设备的框图。

具体实施方式

下面详细描述本发明的实施例，实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，旨在用于解释本申请，而不能理解为对本申请的限制。

下面参考附图描述本申请实施例的业务数据处理方法、装置和电子设备。

图1是根据本申请一个实施例的业务数据处理方法的流程示意图。其中，需要说明的是，本实施例提供的业务数据处理方法的执行主体为业务数据处理装置，该业务数据处理装置可以由软件和/或硬件的方式实现，该实施例中的业务数据处理装置可以配置在电子设备中，本实施例中的电子设备可以包括终端设备和服务器等设备。

如图1所示，该业务数据处理方法可以包括：

步骤101，接收业务数据请求，其中，业务数据请求包括目标区域的标识以及目标时刻。

在本实施例中，在有业务需求时，可基于业务客户端或者业务网站向业务数据处理装置提出业务数据请求。

步骤102，根据目标区域的标识，获取第一数据端上的目标区域在目标时刻的第一人群消费画像信息。

其中，第一人群消费画像信息是指通过对第一数据端上所记录的对应用户消费行为数据进行分析，而抽象出的标签化画像。其中，上述对应用户消费行为数据为用户在目标区域在目标时刻上的消费行为数据。在本申请的一个实施例中，上述根据目标区域的标识，获取第一数据端上的目标区域在目标时刻的第一人群消费画像信息，可以通过多种方式实现，举例说明如下：

作为一种可能的实现方式，为了可以准确确定出目标区域在目标时刻上的第一人群消费画像信息，可根据目标区域的标识，获取在第二预设时长内目标区域在每个历史时刻的人群消费画像信息，根据每个历史时刻的人群消费画像信息，确定第一数据端上的目标区域在目标时刻的第一人群消费画像信息。也就是说，目标区域在目标时刻上的第一人群消费画像信息可通过历史一段时间内的平均画像得出。

具体而言，上述人群消费画像信息可以是基于第一数据端上记录的用户购买行为数据，可以根据用户的历史购买行为刻画用户的一些消费特征，例如：用户对商品的消费偏好，用户的消费水平等。并且，第一数据端自身也储存的有用户的个人画像，例如，用户的年龄、学历、有无车等。因此，通过聚合区域内各个用户的消费特征及个人画像，可以形成区域在不同时刻上的人群消费画像信息。

作为另一种可能的实现方式，可通过第一数据端上预先保存的各个区域在各个时刻上的人群消费画像信息数据库，基于目标区域的标识，获取第一数据端上在目标时刻的第一人群消费画像信息。

步骤103，协同其他第一数据端上的目标区域在目标时刻的第二人群消费画像信息，通过第一目标联邦学习模型对第一人群消费画像信息进行修正，以得到目标区域在目标时刻的目标人群消费画像信息。

在本实施例中，通过第一目标联邦学习模型结合第一数据端以及其他第一数据端上的人群消费画像信息进行修正，从而可通过多个不同数据端所得到的人群消费画像信息，准确刻画出目标区域在目标时刻上的人群消费画像。方便后续基于该目标区域在目标时刻上的人群消费画像准确提供业务处理。

其中，需要说明的是，本实施例中其他第一数据端上确定目标区域在目标时刻上的第二人群消费画像信息的方式，与上述第一数据端确定目标区域在目标时刻上的第一人群消费画像信息的方式类似，此处不再赘述。

其中，本实施例中的第一数据端和第二数据端是不同的数据端，其均可以对用户消费行为数据进行统计。在一些实施例中，上述第一数据端和第二数据端其所提供的业务服务可以是相同的。

其中，第二人群消费画像信息是指通过对第二数据端上所记录的对应用户消费行为数据进行分析，而抽象出的标签化画像。其中，上述对应用户消费行为数据为用户在目标区域在目标时刻上的消费行为数据。

其中，需要说明的是，上述第一目标联邦学习模型是基于第一数据端以及其他数据端的人群消费画像信息进行训练而得到的。关于第一目标联邦学习模型的训练过程将在后续实施例描述。

步骤104，获取目标区域在目标时刻的目标人流量数据。

其中，需要说明的是，在不同应用场景中，上述获取目标区域在目标时刻的目标人流量数据的方式不同，举例说明如下：

作为一种可能的实现方式，可获取目标区域在预设时长内各个历史时刻的人流量数据，然后，基于预先训练好的人流量预测模型，来确定目标区域在目标时刻上的目标人流量数据。

例如，在某一区域的某一时刻t，可获取该区域在各个历史时刻(t-n,…,t-1)上的人流量数据，然后，将所获取的各个历史时刻上的人流量数据，输入到预先训练好的人流量预测模型，以预测得到该目标区域在t时刻的人流量数据。

其中，上述各个区域在各个历史时刻上的人流量数据的一种可能实现方式为：可基于多个电信运营商平台所记录的用户的移动轨迹数据，并基于用户的移动轨迹数据聚合起来，以形成不同区域，不同时刻的人流量数据。

其中，上述人流量预测模型是预先训练得到的，其中，为了使得人流量预测模型可准确预测出目标区域在对应目标时刻上的人流量数据。在训练人流量预测模型时，可基于利用人流量信息准确的地块区域训练该人流量预测模型。并在训练完成后，可基于训练好的人流量预测模型重新预估可信度低的区域的人流量数据，以达到修正效果。

在本申请的一个实施例中，为了可以准确预测出目标区域在目标时刻的目标人流量数据，获取第二数据端上的目标区域在目标时刻的第一人流量数据；协同其他第二数据端上的目标区域在目标时刻的第二人流量数据，通过第二目标联邦学习模型对第一人流量数据进行修正，以获取目标区域在目标时刻的目标人流量数据。

在本申请的一个实施例中，为了可以准确获取第二数据端上的目标区域在目标时刻的第一人流量数据，获取第二数据端上的目标区域在目标时刻的第一人流量数据的一种可能实现方式为：可获取在第一预设时长内目标区域在每个历史目标时刻的人流量数据；基于每个历史目标时刻的人流量数据，确定第二数据端上的目标区域在目标时刻的第一人流量数据。

其中，第一预设时长是预先设置的时长，例如，第一预设时长可以为一个月，或者，一个星期，在实际应用中，可基于实际业务需求确定第一预设时长的取值，该实施例对此不作具体限定。

在本申请的一个实施例中，为了可以准确预测出目标区域在目标时刻上的第一人流量数据，可将每个历史目标时刻的人流量数据输入到与第二数据端所对应的人流量预测模型，以通过该人流量预测模型确定第二数据端上的目标区域在目标时刻的第一人流量数据。

步骤105，根据目标人流量数据和目标人群消费画像信息，确定目标区域在目标时刻的消费人群特征分布信息。

步骤106，根据消费人群特征分布信息对业务数据请求所请求的业务进行处理。

在本申请的一个示例性的实施方式，在上述业务数据请求为商铺选址业务时，可基于该目标区域在目标时刻的消费人群特征分布信息进行准确的商铺选址，并将商铺选址结果提供给业务数据请求方。

在本申请的另一个示例性的实施方式，在上述业务数据请求为广告投放业务时，可基于该目标区域在目标时刻的消费人群特征信息，确定该目标区域在目标时对广告所对应的商品的偏好占比，并结合商品的偏好占比进行广告投放。

在本申请的一个实施例中，为了使得第一目标联邦学习模型可准确对第一人群消费画像信息进行修正，可联合多个第一数据端上的数据，对第一目标联邦学习模型进行训练。

如图2所示，训练第一目标联邦学习模型的过程，可以包括：

步骤201，获取第一数据端上的样本区域在样本时刻的第一样本人群消费画像信息。

其中，样本区域在样本时刻的第一样本人群消费画像信息可以预先收集。

步骤202，协同其他第一数据端上的样本区域在样本时刻的第二样本人群消费画像信息进行联邦学习模型的训练，以生成第一目标联邦学习模型。

其中，选取第一样本人群消费画像信息和第二样本人群消费画像信息中人群消费画像信息最大的样本人群消费画像信息作为模型的待修正数据，剩余的样本人群消费画像信息作为模型的特征数据，第一目标联邦学习模型用于建立特征数据和待修正数据之间的回归关系。

为了可以对各个数据端上提供的数据进行保护的同时，又可以训练出第一目标联邦学习模型，在本申请的一个实施例中，上述步骤202的一种可能实现方式，如图3所示，可以包括：

步骤301，基于第一人群消费画像信息，控制第一数据端上的本地学习模型进行训练，以得到中间结果。

步骤302，基于第二人群消费画像信息，控制其他第一数据端对其自身上的本地学习模型进行训练，以得到中间结果。

步骤303，获取各个第一数据端上的本地学习模型每次训练输出的中间结果，并将每次输出的中间结果发送给协调方进行汇总。

步骤304，接收协调方发送的每次汇总出的全局中间结果。

步骤305，基于全局中间结果调整本地学习模型的模型参数并继续下一轮训练，直至满足预设条件停止训练得到第一目标联邦学习模型。

在本实施例中，通过联邦学习的方式使得各个数据端上的数据在不出库的情况下，可准确训练出第一目标联邦学习模型，方便了后续基于训练出的第一目标联邦学习模型进行人流量修正。

在本申请的一个实施例中，为了通过第二目标联邦学习模型可以准确确定出对于区域在目标时刻上的人流量数据，可结合多个第二数据端上的样本人流量数据对第二目标联邦学习模型进行训练。如图4所示，第二目标联邦学习模型的训练过程可以包括：

步骤401，获取第二数据端上的样本区域在样本时刻的第一样本人流量数据。

步骤402，协同其他第二数据端上的样本区域在样本时刻的第二样本人流量数据进行联邦学习模型的训练，以生成第二目标联邦学习模型。

其中，选取第一样本人流量数据和第二样本人流量数据中人流量数据最大的样本人流量数据作为模型的待修正数据，剩余的样本人流量数据作为模型的特征数据，第二目标联邦学习模型用于建立特征数据和待修正数据之间的回归关系。

为了可以对各个数据端上提供的数据进行保护的同时，又可以训练出第一目标联邦学习模型，在本申请的一个实施例中，如图5所示，上述步骤402的一种可能实现方式为：

步骤501，基于第一样本人流量数据，控制第二数据端上的本地学习模型进行训练，以得到中间结果。

步骤502，基于第二样本人流量数据，控制其他第二数据端对其自身上的本地学习模型进行训练，以得到中间结果。

步骤503，获取各个第二数据端上的本地学习模型每次训练输出的中间结果，并将每次输出的中间结果发送给协调方进行汇总。

步骤504，接收协调方发送的每次汇总出的全局中间结果。

步骤505，基于全局中间结果调整本地学习模型的模型参数并继续下一轮训练，直至满足预设条件停止训练得到第二目标联邦学习模型。

本实施例中，通过联合学习的方式，在多个数据端上的数据不出库的情况下，准确训练出了第二目标联邦学习模型，方便了后续基于训练出的第二目标联邦学习模型准确确定出对应区域在对应时刻上的目标人流量数据。

基于上述实施例的基础上，为了使得本领域的技术人员可以清楚了解本申请，下面结合图6对该实施例的业务数据处理方法进行示例性描述。如图6所示。

图中的数据端A，结合人流轨迹以及城市路网进行人流轨迹数据处理，以得到区域人口信息，并通过数据端B，对数据端B上的人口特征进行人群画像数据处理，以得到区域群像信息。

另外，图中的数据端C，结合人流轨迹以及兴趣点(POI，Point of Information)进行人流轨迹数据处理，以得到区域人口信息，并通过数据端B，对数据端D上的人口特征进行人群画像数据处理，以得到区域群像信息。

然后，在计算层，可结合其他端上的区域画像对本端上的区域画像进行修正。另外，可结合其他端上的区域人流量对本端上的人流量进行修正。

然后，可跨域人群多维度实时计算，以得到区域人流量画像、区域人群消费画像，区域能源画像，以及区域安全画像。

然后，在应用层，可基于知识层所得到区域画像信息进行应用。

知识层的信息可以服务于应用层，以指导商铺选址、广告精准投放、城市交通规划、消防站规划等应用。

具体地，结合知识层输出的区域人流量、人群消费、消费偏好等画像，可以协助商家进行商铺选址；根据区域人群消费画像及人流量数据，可以精准地获取某类商品的偏好人数，进而预估广告转化率及投放收益；基于实时的区域人流量画像，可以协助政府规划交通，推荐用户合理的出行方式；根据城市区域安全画像，可以协助规划城市消防站建设，以提升城市安全系数等。

与上述几种实施例提供的业务数据处理方法相对应，本申请的一种实施例还提供一种业务数据处理装置，由于本申请实施例提供的业务数据处理装置与上述几种实施例提供的业务数据处理方法相对应，因此在业务数据处理方法的实施方式也适用于本实施例提供的业务数据处理装置，在本实施例中不再详细描述。

如图7所示，该业务数据处理装置700包括：

接收模块701，用于接收业务数据请求，其中，业务数据请求包括目标区域的标识以及目标时刻。

第一获取模块702，用于根据目标区域的标识，获取第一数据端上的目标区域在目标时刻的第一人群消费画像信息。

修正模块703，用于协同其他第一数据端上的目标区域在目标时刻的第二人群消费画像信息，通过第一目标联邦学习模型对第一人群消费画像信息进行修正，以得到目标区域在目标时刻的目标人群消费画像信息。

第二获取模块704，获取目标区域在目标时刻的目标人流量数据。

确定模块705，用于根据目标人流量数据和目标人群消费画像信息，确定目标区域在目标时刻的消费人群特征分布信息。

业务处理模块706，用于根据消费人群特征分布信息对业务数据请求所请求的业务进行处理。

在本申请的一个实施例中，在图7所示的装置实施例的基础上，如图8所示，该第二获取模块704，可以包括：

第一获取单元7041，用于获取第二数据端上的目标区域在目标时刻的第一人流量数据；

修正单元7042，用于协同其他第二数据端上的目标区域在目标时刻的第二人流量数据，通过第二目标联邦学习模型对第一人流量数据进行修正，以获取目标区域在目标时刻的目标人流量数据。

在本申请的一个实施例中，第一获取单元7041，具体用于：获取在第一预设时长内目标区域在每个历史目标时刻的人流量数据；基于每个历史目标时刻的人流量数据，确定第二数据端上的目标区域在目标时刻的第一人流量数据。

在本申请的一个实施例中，上述第一获取模块702，可以包括：

第二获取单元7021，用于根据目标区域的标识，获取在第二预设时长内目标区域在每个历史时刻的人群消费画像信息；

确定单元7022，用于根据每个历史时刻的人群消费画像信息，确定第一数据端上的目标区域在目标时刻的第一人群消费画像信息。

在本申请的一个实施例中，如图8所示，该装置还包括第一训练模块707，第一训练模块707，可以包括：

第三获取单元7071，用于获取第一数据端上的样本区域在样本时刻的第一样本人群消费画像信息；

第一训练单元7072，用于协同其他第一数据端上的样本区域在样本时刻的第二样本人群消费画像信息进行联邦学习模型的训练，以生成第一目标联邦学习模型，其中，选取第一样本人群消费画像信息和第二样本人群消费画像信息中人群消费画像信息最大的样本人群消费画像信息作为模型的待修正数据，剩余的样本人群消费画像信息作为模型的特征数据，第一目标联邦学习模型用于建立特征数据和待修正数据之间的回归关系。

在本申请的一个实施例中，上述第一训练单元7072，具体用于：基于第一人群消费画像信息，控制第一数据端上的本地学习模型进行训练，以得到中间结果；基于第二人群消费画像信息，控制其他第一数据端对其自身上的本地学习模型进行训练，以得到中间结果；获取各个第一数据端上的本地学习模型每次训练输出的中间结果，并将每次输出的中间结果发送给协调方进行汇总；接收协调方发送的每次汇总出的全局中间结果；基于全局中间结果调整本地学习模型的模型参数并继续下一轮训练，直至满足预设条件停止训练得到第一目标联邦学习模型。

在本申请的一个实施例中，如图8所示，该装置还包括第二训练模块708，第二训练模块708，包括：

第四获取单元7081，用于获取第二数据端上的样本区域在样本时刻的第一样本人流量数据；

第二训练单元7082，用于协同其他第二数据端上的样本区域在样本时刻的第二样本人流量数据进行联邦学习模型的训练，以生成第二目标联邦学习模型，其中，选取第一样本人流量数据和第二样本人流量数据中人流量数据最大的样本人流量数据作为模型的待修正数据，剩余的样本人流量数据作为模型的特征数据，第二目标联邦学习模型用于建立特征数据和待修正数据之间的回归关系。

在本申请的一个实施例中，上述第二训练单元7082，具体用于：基于第一样本人流量数据，控制第二数据端上的本地学习模型进行训练，以得到中间结果；基于第二样本人流量数据，控制其他第二数据端对其自身上的本地学习模型进行训练，以得到中间结果；获取各个第二数据端上的本地学习模型每次训练输出的中间结果，并将每次输出的中间结果发送给协调方进行汇总；接收协调方发送的每次汇总出的全局中间结果；基于全局中间结果调整本地学习模型的模型参数并继续下一轮训练，直至满足预设条件停止训练得到第二目标联邦学习模型。

根据本申请的实施例，本申请还提供了一种电子设备和一种可读存储介质。

如图9所示，是根据本申请一个实施例的电子设备的框图。

如图9所示，该电子设备该电子设备包括：

存储器901、处理器902及存储在存储器901上并可在处理器902上运行的计算机指令。

处理器902执行指令时实现上述实施例中提供的业务数据处理方法。

进一步地，电子设备还包括：

通信接口903，用于存储器901和处理器902之间的通信。

存储器901，用于存放可在处理器902上运行的计算机指令。

存储器901可能包含高速RAM存储器，也可能还包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。

处理器902，用于执行程序时实现上述实施例的业务数据处理方法。

如果存储器901、处理器902和通信接口903独立实现，则通信接口903、存储器901和处理器902可以通过总线相互连接并完成相互间的通信。总线可以是工业标准体系结构(Industry Standard Architecture，简称为ISA)总线、外部设备互连(Peripheral Component，简称为PCI)总线或扩展工业标准体系结构(Extended Industry Standard Architecture，简称为EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示，图9中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

可选的，在具体实现上，如果存储器901、处理器902及通信接口903，集成在一块芯片上实现，则存储器901、处理器902及通信接口903可以通过内部接口完成相互间的通信。

处理器902可能是一个中央处理器(Central Processing Unit，简称为CPU)，或者是特定集成电路(Application Specific Integrated Circuit，简称为ASIC)，或者是被配置成实施本申请实施例的一个或多个集成电路。

本申请还提出一种计算机程序产品，当计算机程序产品中的指令处理器执行时实现本申请实施例的业务数据处理方法。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本申请的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本申请的实施例所属技术领域的技术人员所理解。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行***、装置或设备(如基于计算机的***、包括处理器的***或其他可以从指令执行***、装置或设备取指令并执行指令的***)使用，或结合这些指令执行***、装置或设备而使用。就本说明书而言，"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行***、装置或设备或结合这些指令执行***、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下：具有一个或多个布线的电连接部(电子装置)，便携式计算机盘盒(磁装置)，随机存取存储器(RAM)，只读存储器(ROM)，可擦除可编辑只读存储器(EPROM或闪速存储器)，光纤装置，以及便携式光盘只读存储器(CDROM)。另外，计算机可读介质甚至可以是可在其上打印程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得程序，然后将其存储在计算机存储器中。

应当理解，本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行***执行的软件或固件来实现。如，如果用硬件来实现和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(PGA)，现场可编程门阵列(FPGA)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。

此外，在本申请各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器，磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本申请的限制，本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims

一种业务数据处理方法，其特征在于，包括：

接收业务数据请求，其中，所述业务数据请求包括目标区域的标识以及目标时刻；

根据所述目标区域的标识，获取第一数据端上的目标区域在所述目标时刻的第一人群消费画像信息；

协同其他第一数据端上的所述目标区域在所述目标时刻的第二人群消费画像信息，通过第一目标联邦学习模型对所述第一人群消费画像信息进行修正，以得到所述目标区域在所述目标时刻的目标人群消费画像信息；

获取所述目标区域在目标时刻的目标人流量数据；

根据所述目标人流量数据和所述目标人群消费画像信息，确定所述目标区域在所述目标时刻的消费人群特征分布信息；

根据所述消费人群特征分布信息对所述业务数据请求所请求的业务进行处理。
如权利要求1所述的方法，其特征在于，所述获取所述目标区域在目标时刻的目标人流量数据，包括：

获取第二数据端上的所述目标区域在目标时刻的第一人流量数据；

协同其他第二数据端上的所述目标区域在所述目标时刻的第二人流量数据，通过第二目标联邦学习模型对所述第一人流量数据进行修正，以获取所述目标区域在所述目标时刻的目标人流量数据。
如权利要求2所述的方法，其特征在于，所述获取第二数据端上的所述目标区域在目标时刻的第一人流量数据，包括：

获取在第一预设时长内所述目标区域在每个历史目标时刻的人流量数据；

基于每个所述历史目标时刻的人流量数据，确定所述第二数据端上的所述目标区域在目标时刻的第一人流量数据。
根据权利要求1所述的方法，其特征在于，所述根据所述目标区域的标识，获取第一数据端上的目标区域在所述目标时刻的第一人群消费画像信息，包括：

根据所述目标区域的标识，获取在第二预设时长内所述目标区域在每个历史时刻的人群消费画像信息；

根据每个所述历史时刻的人群消费画像信息，确定所述第一数据端上的所述目标区域在目标时刻的第一人群消费画像信息。
根据权利要求1所述的方法，其特征在于，所述第一目标联邦学习模型的训练过程，包括：

获取所述第一数据端上的样本区域在样本时刻的第一样本人群消费画像信息；

协同其他第一数据端上的所述样本区域在所述样本时刻的第二样本人群消费画像信息进行联邦学习模型的训练，以生成所述第一目标联邦学习模型，其中，选取所述第一样本人群消费画像信息和所述第二样本人群消费画像信息中人群消费画像信息最大的样本人群消费画像信息作为模型的待修正数据，剩余的样本人群消费画像信息作为所述模型的特征数据，所述第一目标联邦学习模型用于建立所述特征数据和所述待修正数据之间的回归关系。
根据权利要求5所述的方法，其特征在于，所述协同其他第一数据端上的所述样本区域在所述样本时刻的第二样本人群消费画像信息进行联邦学习模型的训练，以生成所述第一目标联邦学习模型，包括：

基于所述第一人群消费画像信息，控制所述第一数据端上的本地学习模型进行训练，以得到中间结果；

基于所述第二人群消费画像信息，控制所述其他第一数据端对其自身上的本地学习模型进行训练，以得到中间结果；

获取各个所述第一数据端上的本地学习模型每次训练输出的中间结果，并将每次输出的所述中间结果发送给协调方进行汇总；

接收所述协调方发送的每次汇总出的全局中间结果；

基于所述全局中间结果调整所述本地学习模型的模型参数并继续下一轮训练，直至满足预设条件停止训练得到所述第一目标联邦学习模型。
根据权利要求2所述的方法，其特征在于，所述第二目标联邦学习模型的训练过程，包括：

获取所述第二数据端上的样本区域在样本时刻的第一样本人流量数据；

协同其他第二数据端上的所述样本区域在所述样本时刻的第二样本人流量数据进行联邦学习模型的训练，以生成所述第二目标联邦学习模型，其中，选取所述第一样本人流量数据和所述第二样本人流量数据中人流量数据最大的样本人流量数据作为模型的待修正数据，剩余的样本人流量数据作为所述模型的特征数据，所述第二目标联邦学习模型用于建立所述特征数据和所述待修正数据之间的回归关系。
根据权利要求7所述的方法，其特征在于，所述协同其他第二数据端上的所述样本区域在所述样本时刻的第二样本人流量数据进行联邦学习模型的训练，以生成所述第二目标联邦学习模型，包括：

基于所述第一样本人流量数据，控制所述第二数据端上的本地学习模型进行训练，以得到中间结果；

基于所述第二样本人流量数据，控制所述其他第二数据端对其自身上的本地学习模型进行训练，以得到中间结果；

获取各个所述第二数据端上的本地学习模型每次训练输出的中间结果，并将每次输出的所述中间结果发送给协调方进行汇总；

接收所述协调方发送的每次汇总出的全局中间结果；

基于所述全局中间结果调整所述本地学习模型的模型参数并继续下一轮训练，直至满足预设条件停止训练得到所述第二目标联邦学习模型。
一种业务数据处理装置，其特征在于，包括：

接收模块，用于接收业务数据请求，其中，所述业务数据请求包括目标区域的标识以及目标时刻；

第一获取模块，用于根据所述目标区域的标识，获取第一数据端上的目标区域在所述目标时刻的第一人群消费画像信息；

修正模块，用于协同其他第一数据端上的所述目标区域在所述目标时刻的第二人群消费画像信息，通过第一目标联邦学习模型对所述第一人群消费画像信息进行修正，以得到所述目标区域在所述目标时刻的目标人群消费画像信息；

第二获取模块，获取所述目标区域在目标时刻的目标人流量数据；

确定模块，用于根据所述目标人流量数据和所述目标人群消费画像信息，确定所述目标区域在所述目标时刻的消费人群特征分布信息；

业务处理模块，用于根据所述消费人群特征分布信息对所述业务数据请求所请求的业务进行处理。
如权利要求9所述的装置，其特征在于，所述第二获取模块，包括：

第一获取单元，用于获取第二数据端上的所述目标区域在目标时刻的第一人流量数据；

修正单元，用于协同其他第二数据端上的所述目标区域在所述目标时刻的第二人流量数据，通过第二目标联邦学习模型对所述第一人流量数据进行修正，以获取所述目标区域在所述目标时刻的目标人流量数据。
如权利要求10所述的装置，其特征在于，所述第一获取单元，具体用于：

获取在第一预设时长内所述目标区域在每个历史目标时刻的人流量数据；

基于每个所述历史目标时刻的人流量数据，确定所述第二数据端上的所述目标区域在目标时刻的第一人流量数据。
根据权利要求9所述的装置，其特征在于，所述第一获取模块，包括：

第二获取单元，用于根据所述目标区域的标识，获取在第二预设时长内所述目标区域在每个历史时刻的人群消费画像信息；

确定单元，用于根据每个所述历史时刻的人群消费画像信息，确定所述第一数据端上的所述目标区域在目标时刻的第一人群消费画像信息。
根据权利要求9所述的装置，其特征在于，所述装置还包括第一训练模块，所述第一训练模块，包括：

第三获取单元，用于获取所述第一数据端上的样本区域在样本时刻的第一样本人群消费画像信息；

第一训练单元，用于协同其他第一数据端上的所述样本区域在所述样本时刻的第二样本人群消费画像信息进行联邦学习模型的训练，以生成所述第一目标联邦学习模型，其中，选取所述第一样本人群消费画像信息和所述第二样本人群消费画像信息中人群消费画像信息最大的样本人群消费画像信息作为模型的待修正数据，剩余的样本人群消费画像信息作为所述模型的特征数据，所述第一目标联邦学习模型用于建立所述特征数据和所述待修正数据之间的回归关系。
根据权利要求13所述的装置，其特征在于，所述第一训练单元，具体用于：

基于所述第一人群消费画像信息，控制所述第一数据端上的本地学习模型进行训练，以得到中间结果；

基于所述第二人群消费画像信息，控制所述其他第一数据端对其自身上的本地学习模型进行训练，以得到中间结果；

获取各个所述第一数据端上的本地学习模型每次训练输出的中间结果，并将每次输出的所述中间结果发送给协调方进行汇总；

接收所述协调方发送的每次汇总出的全局中间结果；

基于所述全局中间结果调整所述本地学习模型的模型参数并继续下一轮训练，直至满足预设条件停止训练得到所述第一目标联邦学习模型。
根据权利要求10所述的装置，其特征在于，所述装置还包括第二训练模块，所述第二训练模块，包括：

第四获取单元，用于获取所述第二数据端上的样本区域在样本时刻的第一样本人流量数据；

第二训练单元，用于协同其他第二数据端上的所述样本区域在所述样本时刻的第二样本人流量数据进行联邦学习模型的训练，以生成所述第二目标联邦学习模型，其中，选取所述第一样本人流量数据和所述第二样本人流量数据中人流量数据最大的样本人流量数据作为模型的待修正数据，剩余的样本人流量数据作为所述模型的特征数据，所述第二目标联邦学习模型用于建立所述特征数据和所述待修正数据之间的回归关系。
根据权利要求15所述的装置，其特征在于，所述第二训练单元，具体用于：

基于所述第一样本人流量数据，控制所述第二数据端上的本地学习模型进行训练，以得到中间结果；

基于所述第二样本人流量数据，控制所述其他第二数据端对其自身上的本地学习模型进行训练，以得到中间结果；

获取各个所述第二数据端上的本地学习模型每次训练输出的中间结果，并将每次输出的所述中间结果发送给协调方进行汇总；

接收所述协调方发送的每次汇总出的全局中间结果；

基于所述全局中间结果调整所述本地学习模型的模型参数并继续下一轮训练，直至满足预设条件停止训练得到所述第二目标联邦学习模型。
一种电子设备，包括：存储器，处理器；所述存储器中存储有计算机指令，当所述计算机指令被所述处理器执行时，实现如权利要求1-8中任一项所述的业务数据处理方法。
一种存储有计算机指令的非瞬时计算机可读存储介质，其特征在于，所述计算机指令用于使所述计算机执行权利要求1-8中任一项所述的业务数据处理方法。