CN117992834B

CN117992834B - 一种数据分析方法以及相关装置

Info

Publication number: CN117992834B
Application number: CN202410397523.8A
Authority: CN
Inventors: 蔡毅; 沈忠濠; 靳涛
Original assignee: Guangdong Lichuang Information Technology Co ltd
Current assignee: Guangdong Lichuang Information Technology Co ltd
Priority date: 2024-04-03
Filing date: 2024-04-03
Publication date: 2024-06-25
Anticipated expiration: 2044-04-03
Also published as: CN117992834A

Abstract

本发明实施例提供一种数据分析方法以及相关装置，属于数据处理技术领域。包括获得训练参数，训练参数至少包括第一对象的第一梯度参数、第二对象的第二梯度参数；对第一梯度参数和第二梯度参数进行梯度聚合获得目标梯度参数；根据目标梯度参数获得第一对象的第一更新参数和根据目标梯度参数获得第二对象的第二更新参数；将第一更新参数发送至第一服务器以使得第一服务器确定第一目标数据分析模型和将第二更新参数发送至第二服务器以使得第二服务器根据第二更新参数确定第二目标数据分析模型；获得根据第一目标数据分析模型对第一当前数据进行分析得到的第一分析结果和获得根据第二目标数据分析模型对第二当前数据进行分析得到的第二分析结果。

Description

一种数据分析方法以及相关装置

技术领域

本发明涉及数据处理技术领域，尤其涉及一种数据分析方法以及相关装置。

背景技术

随着工业互联网技术的发展，可通过实时采集和分析油气管道和工业设备的运行数据，进而通过机器学习、时间序列分析等方法，可以实时监测油气管道或者工业设备的运行状态。但是，相关技术需要将运行数据在网络上进行传输从而可能导致运行数据发生泄露，若将运行数据在本地进行训练，又可能由于数据的局限性导致根据运行数据监测油气管道或者工业设备的运行状态不够准确，因此，亟需一种数据分析方法，在保证油气管道和工业设备的运行数据的隐私安全的情况下，也能保证油气管道或者工业设备的运行状态的精准判定。

发明内容

本发明实施例的主要目的在于提供一种数据分析方法以及相关装置，旨在解决相关技术中无法在保证油气管道和工业设备的运行数据的隐私安全的情况下，同时也可保证油气管道或者工业设备的运行状态的精准判定问题。

第一方面，本发明实施例提供一种数据分析方法，应用于目标服务器，包括：

获得同一目标类型的多个目标对象分别对应的训练参数，所述训练参数至少包括第一对象对应的第一梯度参数、第二对象对应的第二梯度参数；其中，目标对象包括工业设备或者油气管道；所述目标类型包括工业设备中任意一种设备的类型或者管道运输中任意一截管道进行数据监控的设备类型；

对所述第一梯度参数和所述第二梯度参数进行梯度聚合，获得所述目标类型对应的目标梯度参数；

根据所述目标梯度参数和所述第一梯度参数获得所述第一对象对应的第一更新参数和根据所述目标梯度参数和所述第二梯度参数获得所述第二对象对应的第二更新参数；

将所述第一更新参数发送至与所述目标服务器通信连接的第一服务器，以使得所述第一服务器根据所述第一更新参数确定所述第一对象对应的第一目标数据分析模型和将所述第二更新参数发送至与所述目标服务器通信连接的第二服务器，以使得所述第二服务器根据所述第二更新参数确定所述第二对象对应的第二目标数据分析模型；

获得所述第一服务器发送的根据所述第一目标数据分析模型对所述第一对象对应的第一当前数据进行分析得到的所述第一对象对应的第一分析结果和获得所述第二服务器发送的根据所述第二目标数据分析模型对所述第二对象对应的第二当前数据进行分析得到的所述第二对象对应的第二分析结果。

第二方面，本发明实施例提供一种数据分析装置，应用于目标服务器，包括：

数据获取模块，用于获得同一目标类型的多个目标对象分别对应的训练参数，所述训练参数至少包括第一对象对应的第一梯度参数、第二对象对应的第二梯度参数；

数据聚合模块，用于对所述第一梯度参数和所述第二梯度参数进行梯度聚合，获得所述目标类型对应的目标梯度参数；

参数确定模块，用于根据所述目标梯度参数和所述第一梯度参数获得所述第一对象对应的第一更新参数和根据所述目标梯度参数和所述第二梯度参数获得所述第二对象对应的第二更新参数；

数据发送模块，用于将所述第一更新参数发送至与所述目标服务器通信连接的第一服务器，以使得所述第一服务器根据所述第一更新参数确定所述第一对象对应的第一目标数据分析模型和将所述第二更新参数发送至与所述目标服务器通信连接的第二服务器，以使得所述第二服务器根据所述第二更新参数确定所述第二对象对应的第二目标数据分析模型；

结果获取模块，用于获得所述第一服务器发送的根据所述第一目标数据分析模型对所述第一对象对应的第一当前数据进行分析得到的所述第一对象对应的第一分析结果和获得所述第二服务器发送的根据所述第二目标数据分析模型对所述第二对象对应的第二当前数据进行分析得到的所述第二对象对应的第二分析结果。

第三方面，本发明实施例还提供一种目标服务器，所述目标服务器包括处理器、存储器、存储在所述存储器上并可被所述处理器执行的计算机程序以及用于实现所述处理器和所述存储器之间的连接通信的数据总线，其中所述计算机程序被所述处理器执行时，实现如本发明说明书提供的任一项数据分析方法的步骤。

第四方面，本发明实施例还提供一种存储介质，用于计算机可读存储，其特征在于，所述存储介质存储有一个或者多个程序，所述一个或者多个程序可被一个或者多个处理器执行，以实现如本发明说明书提供的任一项数据分析方法的步骤。

本发明实施例提供一种数据分析方法以及相关装置，该方法应用于目标服务器，包括：获得同一目标类型的多个目标对象分别对应的训练参数，训练参数至少包括第一对象对应的第一梯度参数、第二对象对应的第二梯度参数；对第一梯度参数和第二梯度参数进行梯度聚合，获得目标类型对应的目标梯度参数；根据目标梯度参数和第一梯度参数获得第一对象对应的第一更新参数和根据目标梯度参数和第二梯度参数获得第二对象对应的第二更新参数；将第一更新参数发送至与目标服务器通信连接的第一服务器，以使得第一服务器根据第一更新参数确定第一对象对应的第一目标数据分析模型和将第二更新参数发送至与目标服务器通信连接的第二服务器，以使得第二服务器根据第二更新参数确定第二对象对应的第二目标数据分析模型；获得第一服务器发送的根据第一目标数据分析模型对第一对象对应的第一当前数据进行分析得到的第一对象对应的第一分析结果和获得第二服务器发送的根据第二目标数据分析模型对第二对象对应的第二当前数据进行分析得到的第二对象对应的第二分析结果。本申请对同一目标类型的多个目标对象的训练参数利用梯度聚合的方式获得该目标类型对应的目标梯度参数，进而通过目标梯度参数分别对多个目标对象进行模型调整，从而在避免运行数据传输的导致数据泄漏问题的同时，也可以利用梯度聚合的方式调整不同目标对象的训练方向，达到较优目标对象对较差目标对象指正的目的。从而解决了相关技术中无法在保证油气管道和工业设备的运行数据的隐私安全的情况下，同时也可保证油气管道或者工业设备的运行状态的精准判定问题。

附图说明

为了更清楚地说明本申请实施例技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种数据分析方法的流程示意图；

图2为本发明实施例提供的一种数据分析装置的模块结构示意图；

图3为本发明实施例提供的一种目标服务器的结构示意框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

附图中所示的流程图仅是示例说明，不是必须包括所有的内容和操作/步骤，也不是必须按所描述的顺序执行。例如，有的操作/步骤还可以分解、组合或部分合并，因此实际执行的顺序有可能根据实际情况改变。

应当理解，在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样，除非上下文清楚地指明其它情况，否则单数形式的“一”、“一个”及“该”意在包括复数形式。

本发明实施例提供一种数据分析方法以及相关装置。其中，该数据分析方法可应用于目标服务器中，该目标服务器可以平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等电子设备。该目标服务器可以为云服务器，也可以为服务器集群。

下面结合附图，对本发明的一些实施例作详细说明。在不冲突的情况下，下述的实施例及实施例中的特征可以相互组合。

请参照图1，图1为本发明实施例提供的一种数据分析方法的流程示意图。

如图1所示，该数据分析方法应用于目标服务器，包括步骤S101至步骤S105。

步骤S101、获得同一目标类型的多个目标对象分别对应的训练参数，所述训练参数至少包括第一对象对应的第一梯度参数、第二对象对应的第二梯度参数。

示例性地，目标类型可以是工业设备中某一种设备的类型，也可以是管道运输中某一截管道进行数据监控的设备类型。例如，目标类型为工业设备中某一型号的发动机或者某一型号的空压机。目标类型也可以是管道运输中对管道进行数据监控的压力传感器、温度传感器等等。

示例性地，同一目标类型的多个目标对象可以是相同类型的工业设备分布在不同的位置，例如，同一型号的空压机分别在在位置1、位置2、位置3等等均有设置。

示例性地，对同一目标类型的多个目标对象分别进行运行数据采集，以根据采集的运行数据对目标对象进行监控。为保证采集目标对象对应的运行数据的安全性，将运行数据在本地服务器进行训练，从而获得同一目标类型的多个目标对象分别对应的训练参数。

示例性地，为了识别出目标对象的运行状态，便于用户进行后续的故障定位与检修，众多状态识别模型被提出。现有方法要求将分散在各个位置的目标对象的运行数据汇集起来，统一进行模型构建。然而，这种中心化的数据汇集操作可能会在数据传输时造成运行数据泄露。为保证运行数据的隐私性和安全性，将目标对象对应的运行数据在本地进行模型训练，从而获得对应的训练参数。

示例性地，训练参数至少包括第一对象对应的第一梯度参数、第二对象对应的第二梯度参数，训练参数中包含对象的数量与同一目标类型对应的多个目标对象的数量有关。例如，当同一目标类型对应的多个目标对象为3个，则训练参数包括第一对象对应的第一梯度参数、第二对象对应的第二梯度参数、第三对象对应的第三梯度参数；当同一目标类型对应的多个目标对象为4个，则训练参数包括第一对象对应的第一梯度参数、第二对象对应的第二梯度参数、第三对象对应的第三梯度参数、第四对象对应的第四梯度参数，以此类推。本申请不做具体限制，用户可根据实际需求自行设置。

在一些实施方式中，所述获得同一目标类型的多个目标对象分别对应的训练参数，包括：获取所述第一服务器发送的所述第一梯度参数，所述第一梯度参数为所述第一服务器获得所述第一对象对应的第一数据，并对所述第一数据利用初始数据分析模型进行数据训练之后，获得的所述第一数据对应的所述第一梯度参数；获取所述第二服务器发送的所述第二梯度参数，所述第二梯度参数为所述第二服务器获得所述第二对象对应的第二数据，并对所述第二数据利用所述初始数据分析模型进行数据训练之后，获得的所述第二数据对应的所述第二梯度参数。

示例性地，第一服务器为第一对象对应的本地服务器，第二服务器为第二对象对应的本地服务器，第一服务器与目标服务器通信连接，第二服务器与目标服务器通信连接，第一服务器与目标服务器之间不进行运行数据的传输，只进行梯度参数的传输，从而保证第一对象对应的运行数据的安全性。同理，第二服务器与目标服务器之间不进行运行数据的传输，只进行梯度参数的传输，从而保证第二对象对应的运行数据的安全性。

示例性地，目标服务器接收第一服务器发送的第一对象对应的第一梯度参数，以及接收第二服务器发送的第二对象对应的第二梯度参数。在目标服务器接收第一服务器发送的第一对象对应的第一梯度参数之前，第一服务器利用初始数据分析模型对第一对象对应的第一数据进行训练，从而得到相应的第一梯度参数。其中，初始数据分析模型可以是数据分类模型、异常识别模型也可以是数据聚类模型，本申请不做具体限制。

同理，在目标服务器接收第二服务器发送的第二对象对应的第二梯度参数之前，第二服务器利用与第一对象相同的初始数据分析模型对第二对象对应的第二数据进行训练，从而得到相应的第二梯度参数。

示例性地，将第一对象和第二对象采用相同的初始数据分析模型可以为后续进行参数更新和模型优化提供良好的支撑。

此外，目标服务器可以获得第一对象的第一梯度参数和第二对象的第二梯度参数，具体目标服务器获得的梯度参数的数量与目标对象的数量有关。

具体地，本申请对同一类型的多个目标对象利用相同的初始数据分析模型进行参数训练，进而后续利用多个目标对象对应的全部运行数据对各个目标对象的模型进行参数优化时，可以较好的保护数据隐私，也减少了单个服务器的负担，从而为后续获得具有更优参数的模型，提高各个目标对象的数据分析精度提供了良好的支撑。

步骤S102、对所述第一梯度参数和所述第二梯度参数进行梯度聚合，获得所述目标类型对应的目标梯度参数。

示例性地，目标服务器接收到第一梯度参数和第二梯度参数后，执行梯度聚合操作。梯度聚合可以采用各种方法，如简单的加权平均、FedAvg等联合学习方法，以综合考虑两个梯度参数的值。梯度聚合的过程旨在结合不同目标对象的梯度信息，以确保模型参数的整体更新方向更加准确和稳健。

在一些实施方式中，所述对所述第一梯度参数和所述第二梯度参数进行梯度聚合，获得所述目标类型对应的目标梯度参数，包括：估算得到所述第一梯度参数对应的第一信息熵和估算得到所述第二梯度参数对应的第二信息熵；根据所述第一信息熵和所述第二信息熵确定多个所述目标对象进行梯度聚合后对应的所述目标梯度参数；

示例性地，由于目标对象安装位置、使用频率等环境信息的不同，采集各个目标对象对应的第一数据或第二数据在数据质量以及数据数量上存在差异，从而导致各个本地服务器，如第一服务器和第二服务器训练出来的模型性能也有所差异，进而反应在训练参数之间也存在差异。

示例性地，通常情况下，各个本地服务器中对应的第一数据或第二数据等的样本分布情况往往反映出数据质量，样本分布规律性越强，数据质量越高，进而训练出的模型性能越好。从而本申请利用信息熵估算算法量化各个本地服务器中的数据分布情况，从而为后续地梯度聚合提供支撑。

示例性地，对于第一梯度参数和第二梯度参数，分别计算它们对应的信息熵，分别为第一信息熵和第二信息熵。信息熵是用来衡量数据的不确定性或混乱程度的指标，可以通过对梯度参数的值进行统计和计算得到。

示例性地，多个目标对象不局限于2个，当目标对象为多个时，如10个或者更多时，则根据获得的多个信息熵的大小，确定需要参与梯度聚合的目标对象。通常情况下，选择信息熵较高的对象进行聚合可能会更有利于提高模型的鲁棒性和泛化能力。进而针对所选的目标对象，进行梯度聚合操作。可以采用加权平均、联合学习等方法，综合考虑它们的梯度信息来得到目标梯度参数。

具体地，结合信息熵对梯度参数进行选择和聚合，从而提高模型的稳定性和性能。这种基于信息熵的方法可以有效地帮助选择合适的参与者，并获得更准确的目标梯度参数。

在一些实施方式中，所述估算得到所述第一梯度参数对应的第一信息熵和估算得到所述第二梯度参数对应的第二信息熵，包括：获得所述第一对象对应的所述第一数据的第一样本数量、所述第一数据对应的第一样本特征维度以及所述第一数据对应的第一向量均值；利用双伽马函数结合所述第一样本数量、所述第一样本特征维度、所述第一向量均值确定所述第一对象对应的第一拟合函数；根据所述第一拟合函数获得所述第一对象在所述第一样本数量下对应的第一向量集，进而根据所述第一向量集获得所述第一梯度参数对应的所述第一信息熵；获得所述第二对象对应的所述第二数据的第二样本数量、所述第二数据对应的第二样本特征维度以及所述第二数据对应的第二向量均值；利用双伽马函数结合所述第二样本数量、所述第二样本特征维度、所述第二向量均值确定所述第二对象对应的第二拟合函数；根据所述第二拟合函数获得所述第二对象在所述第二样本数量下对应的第二向量集，进而根据所述第二向量集获得所述第二梯度参数对应的所述第二信息熵。

示例性地，根据第一服务器获得第一对象对应的第一数据的第一样本数量，即进行模型训练时运行数据对应的数量。根据第一服务器获得第一数据对应的第一样本特征维度，即每个样本的特征维度，计算第一数据对应的第一数据的向量均值计算获得第一向量均值，用于后续拟合函数的计算。使用双伽马函数结合第一样本数量、第一样本特征维度和第一向量均值等信息来确定第一对象对应的第一拟合函数。双伽马函数可以根据数据特点来选择适当的拟合函数形式。

也即，本申请根据第一服务器中第一数据对应的数据向量对应的第一向量均值，以及第一数据的第一样本数量和第一样本特征维度利用用双伽马函数进行数据拟合，从而获得第一服务器对应的第一数据的第一拟合函数，从而根据第一拟合函数获得第一样本数量的多个向量，从而根据多个向量组成第一向量集，进而根据第一向量集进行信息熵计算获得第一梯度参数对应的第一信息熵。

示例性地，根据第二服务器获得第二对象对应的第二数据的第二样本数量，即进行模型训练时运行数据对应的数量。根据第二服务器获得第二数据对应的第二样本特征维度，即每个样本的特征维度，计算第二数据对应的第二数据的向量均值计算获得第二向量均值，用于后续拟合函数的计算。使用双伽马函数结合第二样本数量、第二样本特征维度和第二向量均值等信息来确定第二对象对应的第二拟合函数。

也即，本申请根据第二服务器中第二数据对应的数据向量对应的第二向量均值，以及第二数据的第二样本数量和第二样本特征维度利用用双伽马函数进行数据拟合，从而获得第二服务器对应的第二数据的第二拟合函数，从而根据第二拟合函数获得第二样本数量的多个向量，从而根据多个向量组成第二向量集，进而根据第二向量集进行信息熵计算获得第二梯度参数对应的第二信息熵。

具体地，信息熵越小的数据集，数据混乱程度越低，样本分布规律性越强，进而训练出来的模型性能越好，其梯度参数聚合时权重也越高。根据上述方法进行信息熵计算，在保证数据隐私性的同时，也可较好的获得各个目标对象对应的模型质量，从而为后续梯度聚合提供良好的支撑。

在一些实施方式中，所述根据所述第一信息熵和所述第二信息熵确定多个所述目标对象进行梯度聚合后对应的所述目标梯度参数，包括：对所述第一信息熵求取倒数获得第一倒数和对所述第二信息熵求取倒数获得第二倒数；获得所述第一倒数和所述第二倒数之和，获得倒数和；根据所述第一倒数、所述第二倒数、所述倒数和结合所述第一梯度参数和所述第二梯度参数确定多个所述目标对象进行梯度聚合后对应的所述目标梯度参数；其中，根据下列公式获得所述目标梯度参数：

；

t表示所述目标梯度参数，N表示所述目标对象对应的总数量，表示第i个所述目标对象对应的第i倒数，/>表示多个所述目标对象对应的全部倒数之和，/>表示第i个所述目标对象对应的第i梯度参数。

示例性地，信息熵越小的数据集，数据混乱程度越低，样本分布规律性越强，进而训练出来的模型性能越好，其梯度参数聚合时权重也越高。因此，本申请对第一信息熵求取倒数获得第一倒数和对第二信息熵求取倒数获得第二倒数，进而根据信息熵的倒数来表明该目标对象在进行梯度聚合时的权重信息。

示例性地，获得第一倒数和第二倒数之和，获得倒数和，进而根据第一倒数、第二倒数、倒数和结合第一梯度参数和第二梯度参数确定多个目标对象进行梯度聚合后对应的目标梯度参数；其中，根据下列公式获得目标梯度参数：

；

t表示目标梯度参数，N表示目标对象对应的总数量，表示第i个目标对象对应的第i倒数，/>表示多个目标对象对应的全部倒数之和，/>表示第i个目标对象对应的第i梯度参数。

例如，当目标对象为2个时，也即，训练参数包括第一对象对应的第一梯度参数、第二对象对应的第二梯度参数/>。则N等于2，第一对象对应的第一倒数为/>，第二对象对应的第二倒数为/>，/>等于第一倒数/>和第二倒数/>之和，进而将第一倒数为、第二倒数/>、第一梯度参数/>、第二梯度参数/>，代入到下列公式中，从而获得目标梯度参数：

；

具体地，信息熵越小的数据集，数据混乱程度越低，样本分布规律性越强，进而训练出来的模型性能越好，其梯度参数聚合时权重也越高。本申请根据信息熵的倒数来确定梯度聚合时的权重，从而可使得模型质量较高的在梯度聚合时发挥更大的作用，从而提高了梯度聚合的效果。

步骤S103、根据所述目标梯度参数和所述第一梯度参数获得所述第一对象对应的第一更新参数和根据所述目标梯度参数和所述第二梯度参数获得所述第二对象对应的第二更新参数。

示例性地，目标梯度参数为多个目标对象分别对应的运行数据进行模型融合后的参数，考虑到了多个目标对象中较优质量的模型训练结果，因此，计算目标梯度参数和第一梯度参数之间的差距，从而获得第一对象的第一更新参数，以及计算目标梯度参数和第二梯度参数之间的差距，从而获得第二对象的第二更新参数。

在一些实施方式中，所述根据所述目标梯度参数和所述第一梯度参数获得所述第一对象对应的第一更新参数和根据所述目标梯度参数和所述第二梯度参数获得所述第二对象对应的第二更新参数，包括：确定所述第一对象对应的第一学习率，根据所述目标梯度参数和所述第一学习率确定所述第一对象对应的第一学习步长；根据所述第一学习步长和所述第一梯度参数获得所述第一对象对应的第一更新参数；确定所述第二对象对应的第二学习率，根据所述目标梯度参数和所述第二学习率确定所述第二对象对应的第二学习步长；根据所述第二学习步长和所述第二梯度参数获得所述第二对象对应的第二更新参数。

示例性地，根据目标梯度参数和第一梯度参数，可以确定第一对象在本次更新中对应的更新参数。通常，可以使用梯度下降或其他优化算法来调整模型参数，以使损失函数最小化。计算第一对象对应的第一更新参数，可以通过以下公式进行计算：第一更新参数 =第一梯度参数 - 第一学习率 * 目标梯度参数。其中，第一学习率是一个超参数，用于控制参数更新的速度和稳定性。

类似地，根据目标梯度参数和第二梯度参数，可以确定第二对象在本次更新中对应的更新参数。计算第二对象对应的第二更新参数，也可以使用相同的公式：第二更新参数= 第二梯度参数 - 第二学习率 * 目标梯度参数。其中，第一学习率是一个超参数，用于控制参数更新的速度和稳定性。

通过以上步骤，可以根据目标梯度参数和各对象的梯度参数，计算出各对象在本次更新中对应的更新参数。这些更新参数将用于更新各对象的模型参数，从而逐步优化模型，提高模型性能和泛化能力。在实际应用中，可以根据具体情况调整学习率等超参数，以获得更好的训练效果。

步骤S104、将所述第一更新参数发送至与所述目标服务器通信连接的第一服务器，以使得所述第一服务器根据所述第一更新参数确定所述第一对象对应的第一目标数据分析模型和将所述第二更新参数发送至与所述目标服务器通信连接的第二服务器，以使得所述第二服务器根据所述第二更新参数确定所述第二对象对应的第二目标数据分析模型。

示例性地，将第一更新参数发送至与目标服务器通信连接的第一服务器，进而使得第一服务器在接收到第一更新参数后，根据第一更新参数继续训练初始数据分析模型，直至获得第一对象对应的第一目标数据分析模型和将第二更新参数发送至于目标服务器通信连接的第二服务器，进而使得第二服务器在接收到第二更新参数后，根据第二更新参数继续训练初始数据分析模型，直至获得第二对象对应的第二目标数据分析模型。

步骤S105、获得所述第一服务器发送的根据所述第一目标数据分析模型对所述第一对象对应的第一当前数据进行分析得到的所述第一对象对应的第一分析结果和获得所述第二服务器发送的根据所述第二目标数据分析模型对所述第二对象对应的第二当前数据进行分析得到的所述第二对象对应的第二分析结果。

示例性地，当第一服务器获得第一目标数据分析模型后，第一服务器利用第一目标数据分析模型对第一对象的第一当前数据也即当前运行数据进行数据分析，从而获得第一对象对应的第一分析结果，进而将第一分析结果发送至与第一服务器通信连接的目标服务器。其中，第一分析结果与第一目标数据分析模型的作用有关，当第一目标数据分析模型为异常分类模型时，第一分析结果为第一当前数据运行异常或者运行正常的分类结果；当第一目标数据分析模型为故障识别模型时，第一分析结果为第一对象对应的故障位置，等等。

示例性地，当第二服务器获得第二目标数据分析模型后，第二服务器利用第二目标数据分析模型对第二对象的第二当前数据也即当前运行数据进行数据分析，从而获得第二对象对应的第二分析结果，进而将第二分析结果发送至与第二服务器通信连接的目标服务器。其中，第二分析结果与第二目标数据分析模型的作用有关，当第二目标数据分析模型为异常分类模型时，第二分析结果为第二当前数据运行异常或者运行正常的分类结果；当第二目标分类分析模型为故障识别模型时，第二分析结果为第二对象对应的故障位置，等等。

示例性地，本申请在梯度聚合过程中，在保证各个目标对象运行数据的隐私性和安全性的同时，也考虑到各个目标对象对应的运行数据之间的质量差异性可能会给模型性能带来潜在影响。引入估计信息熵的方法获取目标数据对应的信息熵，以此表示各个目标对象对应的梯度参数在聚合过程中对模型最终参数的贡献，从而在能够在保证数据隐私的情况下，有效地提高各个目标对象的目标分析模型的分析质量。解决了相关技术中无法在保证油气管道和工业设备的运行数据的隐私安全的情况下，同时也可保证油气管道或者工业设备的运行状态的精准判定问题。

在一些实施方式中，所述目标服务器获得所述第一对象的所述第一分析结果和所述第二对象对应的所述第二分析结果之后，所述方法还包括：获得所述第一分析结果对应的第一准确率和所述第二分析结果对应的第二准确率；根据所述第一准确率和所述第二准确率确定所述目标类型对应的最优对象；根据所述最优对象对所述目标类型对应的除了最优对象以外的剩余对象进行模型调优。

示例性地，目标服务器在获得第一对象的第一分析结果和第二对象对应的第二分析结果之后，根据第一分析结果和第二分析结果派出相应的技术人员进行问题处理，并根据技术人员对现场真实勘查对第一分析结果和第二分析结果进行质量评估，从而获得第一分析结果对应的第一准确率和第二分析结果对应的第二准确率。

示例性地，根据第一准确率和第二准确率，确定最优对象。通常情况下，选择准确率较高的对象作为最优对象，因为它们对应的分析结果更可靠。进而针对最优对象以外的剩余对象，进行模型调优操作。这包括检查模型参数、调整超参数、优化模型架构等步骤，以进一步提高模型性能和泛化能力。从而通过模型调优，可以使剩余对象的分析结果更加准确和可靠，进而提高整体模型的表现。

具体地，针对准确率较低的对象进行模型调优，可以更有效地利用资源，使模型在各个目标对象上均能取得更好的效果。进一步解决了在保证目标对象对应的运行数据的安全性的同时，也可保证油气管道或者工业设备的运行状态的精准判定问题。

请参阅图2，图2为本申请实施例提供的一种数据分析装置200，该数据分析装置200包括数据获取模块201、数据聚合模块202、参数确定模块203、数据发送模块204、结果获取模块205，其中，数据获取模块201，用于获得同一目标类型的多个目标对象分别对应的训练参数，所述训练参数至少包括第一对象对应的第一梯度参数、第二对象对应的第二梯度参数；数据聚合模块202，用于对所述第一梯度参数和所述第二梯度参数进行梯度聚合，获得所述目标类型对应的目标梯度参数；参数确定模块203，用于根据所述目标梯度参数和所述第一梯度参数获得所述第一对象对应的第一更新参数和根据所述目标梯度参数和所述第二梯度参数获得所述第二对象对应的第二更新参数；数据发送模块204，用于将所述第一更新参数发送至与所述目标服务器通信连接的第一服务器，以使得所述第一服务器根据所述第一更新参数确定所述第一对象对应的第一目标数据分析模型和将所述第二更新参数发送至与所述目标服务器通信连接的第二服务器，以使得所述第二服务器根据所述第二更新参数确定所述第二对象对应的第二目标数据分析模型；结果获取模块205，用于获得所述第一服务器发送的根据所述第一目标数据分析模型对所述第一对象对应的第一当前数据进行分析得到的所述第一对象对应的第一分析结果和获得所述第二服务器发送的根据所述第二目标数据分析模型对所述第二对象对应的第二当前数据进行分析得到的所述第二对象对应的第二分析结果。

在一些实施方式中，数据获取模块201在所述获得同一目标类型的多个目标对象分别对应的训练参数过程中，执行：

获取所述第一服务器发送的所述第一梯度参数，所述第一梯度参数为所述第一服务器获得所述第一对象对应的第一数据，并对所述第一数据利用初始数据分析模型进行数据训练之后，获得的所述第一数据对应的所述第一梯度参数；

获取所述第二服务器发送的所述第二梯度参数，所述第二梯度参数为所述第二服务器获得所述第二对象对应的第二数据，并对所述第二数据利用所述初始数据分析模型进行数据训练之后，获得的所述第二数据对应的所述第二梯度参数。

在一些实施方式中，数据聚合模块202在所述对所述第一梯度参数和所述第二梯度参数进行梯度聚合，获得所述目标类型对应的目标梯度参数过程中，执行：

估算得到所述第一梯度参数对应的第一信息熵和估算得到所述第二梯度参数对应的第二信息熵；

根据所述第一信息熵和所述第二信息熵确定多个所述目标对象进行梯度聚合后对应的所述目标梯度参数；

在一些实施方式中，数据聚合模块202在所述估算得到所述第一梯度参数对应的第一信息熵和估算得到所述第二梯度参数对应的第二信息熵过程中，执行：

获得所述第一对象对应的所述第一数据的第一样本数量、所述第一数据对应的第一样本特征维度以及所述第一数据对应的第一向量均值；

利用双伽马函数结合所述第一样本数量、所述第一样本特征维度、所述第一向量均值确定所述第一对象对应的第一拟合函数；

根据所述第一拟合函数获得所述第一对象在所述第一样本数量下对应的第一向量集，进而根据所述第一向量集获得所述第一梯度参数对应的所述第一信息熵；

获得所述第二对象对应的所述第二数据的第二样本数量、所述第二数据对应的第二样本特征维度以及所述第二数据对应的第二向量均值；

利用双伽马函数结合所述第二样本数量、所述第二样本特征维度、所述第二向量均值确定所述第二对象对应的第二拟合函数；

根据所述第二拟合函数获得所述第二对象在所述第二样本数量下对应的第二向量集，进而根据所述第二向量集获得所述第二梯度参数对应的所述第二信息熵。

在一些实施方式中，数据聚合模块202在所述根据所述第一信息熵和所述第二信息熵确定多个所述目标对象进行梯度聚合后对应的所述目标梯度参数过程中，执行：

对所述第一信息熵求取倒数获得第一倒数和对所述第二信息熵求取倒数获得第二倒数；

获得所述第一倒数和所述第二倒数之和，获得倒数和；

根据所述第一倒数、所述第二倒数、所述倒数和结合所述第一梯度参数和所述第二梯度参数确定多个所述目标对象进行梯度聚合后对应的所述目标梯度参数；

其中，根据下列公式获得所述目标梯度参数：

；

在一些实施方式中，参数确定模块203在所述根据所述目标梯度参数和所述第一梯度参数获得所述第一对象对应的第一更新参数和根据所述目标梯度参数和所述第二梯度参数获得所述第二对象对应的第二更新参数过程中，执行：

确定所述第一对象对应的第一学习率，根据所述目标梯度参数和所述第一学习率确定所述第一对象对应的第一学习步长；

根据所述第一学习步长和所述第一梯度参数获得所述第一对象对应的第一更新参数；

确定所述第二对象对应的第二学习率，根据所述目标梯度参数和所述第二学习率确定所述第二对象对应的第二学习步长；

根据所述第二学习步长和所述第二梯度参数获得所述第二对象对应的第二更新参数。

在一些实施方式中，结果获取模块205在所述目标服务器获得所述第一对象的所述第一分析结果和所述第二对象对应的所述第二分析结果之后过程中，还执行：

获得所述第一分析结果对应的第一准确率和所述第二分析结果对应的第二准确率；

根据所述第一准确率和所述第二准确率确定所述目标类型对应的最优对象；

根据所述最优对象对所述目标类型对应的除了最优对象以外的剩余对象进行模型调优。

在一些实施方式中，数据分析装置200可应用于目标服务器。

需要说明的是，所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，上述描述的数据分析装置200的具体工作过程，可以参考前述数据分析方法实施例中的对应过程，在此不再赘述。

请参阅图3，图3为本发明实施例提供的一种目标服务器的结构示意性框图。

如图3所示，目标服务器300包括处理器301和存储器302，处理器301和存储器302通过总线303连接，该总线比如为I2C（Inter-integrated Circuit）总线。

具体地，处理器301用于提供计算和控制能力，支撑整个目标服务器的运行。处理器301可以是中央处理单元 (Central Processing Unit，CPU)，该处理器301还可以是其他通用处理器、数字信号处理器 (Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列 (Field-Programmable Gate Array，FPGA) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中，通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

具体地，存储器302可以是Flash芯片、只读存储器 (ROM，Read-Only Memory)磁盘、光盘、U盘或移动硬盘等。

本领域技术人员可以理解，图3中示出的结构，仅仅是与本发明实施例方案相关的部分结构的框图，并不构成对本发明实施例方案所应用于其上的目标服务器的限定，具体的服务器可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

其中，所述处理器用于运行存储在存储器中的计算机程序，并在执行所述计算机程序时实现本发明实施例提供的任意一种所述的数据分析方法。

在一实施例中，所述处理器用于运行存储在存储器中的计算机程序，并在执行所述计算机程序时实现如下步骤：

获得同一目标类型的多个目标对象分别对应的训练参数，所述训练参数至少包括第一对象对应的第一梯度参数、第二对象对应的第二梯度参数；

在一些实施方式中，处理器301在所述获得同一目标类型的多个目标对象分别对应的训练参数过程中，执行：

在一些实施方式中，处理器301在所述对所述第一梯度参数和所述第二梯度参数进行梯度聚合，获得所述目标类型对应的目标梯度参数过程中，执行：

在一些实施方式中，处理器301在所述估算得到所述第一梯度参数对应的第一信息熵和估算得到所述第二梯度参数对应的第二信息熵过程中，执行：

在一些实施方式中，处理器301在所述根据所述第一信息熵和所述第二信息熵确定多个所述目标对象进行梯度聚合后对应的所述目标梯度参数过程中，执行：

获得所述第一倒数和所述第二倒数之和，获得倒数和；

其中，根据下列公式获得所述目标梯度参数：

；

在一些实施方式中，处理器301在所述根据所述目标梯度参数和所述第一梯度参数获得所述第一对象对应的第一更新参数和根据所述目标梯度参数和所述第二梯度参数获得所述第二对象对应的第二更新参数过程中，执行：

在一些实施方式中，处理器301在所述目标服务器获得所述第一对象的所述第一分析结果和所述第二对象对应的所述第二分析结果之后过程中，还执行：

需要说明的是，所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，上述描述的目标服务器的具体工作过程，可以参考前述数据分析方法实施例中的对应过程，在此不再赘述。

本发明实施例还提供一种存储介质，用于计算机可读存储，所述存储介质存储有一个或者多个程序，所述一个或者多个程序可被一个或者多个处理器执行，以实现如本发明实施例说明书提供的任一项数据分析方法的步骤。

其中，所述存储介质可以是前述实施例所述的目标服务器的内部存储单元，例如所述目标服务器的硬盘或内存。所述存储介质也可以是所述目标服务器的外部存储设备，例如所述目标服务器上配备的插接式硬盘，智能存储卡(Smart Media Card，SMC)，安全数字(Secure Digital，SD)卡，闪存卡(Flash Card)等。

本领域普通技术人员可以理解，上文中所公开方法中的全部或某些步骤、***、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施例中，在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分；例如，一个物理组件可以具有多个功能，或者一个功能或步骤可以由若干物理组件合作执行。某些物理组件或所有物理组件可以被实施为由处理器，如中央处理器、数字信号处理器或微处理器执行的软件，或者被实施为硬件，或者被实施为集成电路，如专用集成电路。这样的软件可以分布在计算机可读介质上，计算机可读介质可以包括计算机存储介质（或非暂时性介质）和通信介质（或暂时性介质）。如本领域普通技术人员公知的，术语计算机存储介质包括在用于存储信息（诸如计算机可读指令、数据结构、程序模块或其他数据）的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘（DVD）或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外，本领域普通技术人员公知的是，通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据，并且可包括任何信息递送介质。

应当理解，在本发明说明书和所附权利要求书中使用的术语“和/ 或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者***不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者***所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者***中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。以上所述，仅为本发明的具体实施例，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

Claims

1.一种数据分析方法，其特征在于，应用于目标服务器，所述方法包括：

获得所述第一服务器发送的根据所述第一目标数据分析模型对所述第一对象对应的第一当前数据进行分析得到的所述第一对象对应的第一分析结果和获得所述第二服务器发送的根据所述第二目标数据分析模型对所述第二对象对应的第二当前数据进行分析得到的所述第二对象对应的第二分析结果；

对所述第一梯度参数和所述第二梯度参数进行梯度聚合，获得所述目标类型对应的目标梯度参数，包括：

所述根据所述第一信息熵和所述第二信息熵确定多个所述目标对象进行梯度聚合后对应的所述目标梯度参数，包括：

获得所述第一倒数和所述第二倒数之和，获得倒数和；

其中，根据下列公式获得所述目标梯度参数：

t表示所述目标梯度参数，N表示所述目标对象对应的总数量，d_i表示第i个所述目标对象对应的第i倒数，sum_N表示多个所述目标对象对应的全部倒数之和，g_i表示第i个所述目标对象对应的第i梯度参数。

2.根据权利要求1所述的方法，其特征在于，所述获得同一目标类型的多个目标对象分别对应的训练参数，包括：

3.根据权利要求2所述的方法，其特征在于，所述估算得到所述第一梯度参数对应的第一信息熵和估算得到所述第二梯度参数对应的第二信息熵，包括：

4.根据权利要求1所述的方法，其特征在于，所述根据所述目标梯度参数和所述第一梯度参数获得所述第一对象对应的第一更新参数和根据所述目标梯度参数和所述第二梯度参数获得所述第二对象对应的第二更新参数，包括：

5.根据权利要求1中所述的方法，其特征在于，所述目标服务器获得所述第一对象的所述第一分析结果和所述第二对象对应的所述第二分析结果之后，所述方法还包括：

6.一种数据分析装置，其特征在于，应用于目标服务器，包括：

数据获取模块，用于获得同一目标类型的多个目标对象分别对应的训练参数，所述训练参数至少包括第一对象对应的第一梯度参数、第二对象对应的第二梯度参数；其中，目标对象包括工业设备或者油气管道；所述目标类型包括工业设备中任意一种设备的类型或者管道运输中任意一截管道进行数据监控的设备类型；

结果获取模块，用于获得所述第一服务器发送的根据所述第一目标数据分析模型对所述第一对象对应的第一当前数据进行分析得到的所述第一对象对应的第一分析结果和获得所述第二服务器发送的根据所述第二目标数据分析模型对所述第二对象对应的第二当前数据进行分析得到的所述第二对象对应的第二分析结果；

获得所述第一倒数和所述第二倒数之和，获得倒数和；

其中，根据下列公式获得所述目标梯度参数：

7.一种目标服务器，其特征在于，所述目标服务器包括处理器、存储器；

所述存储器用于存储计算机程序；

所述处理器用于执行所述计算机程序并在执行所述计算机程序时实现如权利要求1至5中任一项所述的数据分析方法。

8.一种计算机存储介质，用于计算机存储，其特征在于，所述计算机存储介质存储有一个或者多个程序，所述一个或者多个程序可被一个或者多个处理器执行，以实现权利要求1至5中任一项所述的数据分析方法的步骤。