CN117473331B - 流数据处理方法、装置、设备及存储介质 - Google Patents

流数据处理方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN117473331B
CN117473331B CN202311825139.5A CN202311825139A CN117473331B CN 117473331 B CN117473331 B CN 117473331B CN 202311825139 A CN202311825139 A CN 202311825139A CN 117473331 B CN117473331 B CN 117473331B
Authority
CN
China
Prior art keywords
data
prediction
global
target
local
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311825139.5A
Other languages
English (en)
Other versions
CN117473331A (zh
Inventor
张旭
孙华锦
胡雷钧
王小伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Metabrain Intelligent Technology Co Ltd
Original Assignee
Suzhou Metabrain Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Metabrain Intelligent Technology Co Ltd filed Critical Suzhou Metabrain Intelligent Technology Co Ltd
Priority to CN202311825139.5A priority Critical patent/CN117473331B/zh
Publication of CN117473331A publication Critical patent/CN117473331A/zh
Application granted granted Critical
Publication of CN117473331B publication Critical patent/CN117473331B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及计算机技术领域,公开了一种流数据处理方法、装置、设备及存储介质,包括:接收所连接的多个计算节点上传的局部预测数据,并对多个局部预测数据进行聚合得到第一全局预测数据;获取云服务器网络的有向图以及参考输入均值;基于有向图,获取与目标管理节点连接的其他管理节点的第二全局预测数据;将第一全局预测数据与第二全局预测数据进行聚合,得到聚合数据;基于参考输入均值对聚合数据进行迭代更新,得到更新后的聚合数据;若更新后的聚合数据在参考输入均值对应的范围内,则确定更新后的聚合数据为目标管理节点的目标全局预测数据;本发明可以提高云服务器网络中各管理节点进行全局预测的一致性及可靠性。

Description

流数据处理方法、装置、设备及存储介质
技术领域
本发明涉及计算机技术领域,具体涉及一种流数据处理方法、装置、设备及存储介质。
背景技术
随着互联网和大数据时代的到来,各领域对人工智能性能需求的不断提升。人工智能性能的提升需要从庞大的数据集中学习复杂的规则和映射,而且大尺度规模物联网***会产生庞大的分布数据。为了提高数据处理、计算以及存储效率,云服务器网络分布式在线机器学习框架应运而生。但由于分布式在线机器学习框架中各服务器的噪声不同,从而使得到的预测结果并不满足预测的一致性。
发明内容
有鉴于此,本发明提供了一种流数据处理方法、装置、设备及存储介质,以解决现有分布式在线机器学习框架中由于各服务器的噪声不同,从而使得到的预测结果并不满足预测一致性的问题。
第一方面,本发明提供了一种流数据处理方法,应用于云服务器网络中的目标管理节点,该方法包括:接收所连接的多个计算节点上传的局部预测数据,并对多个局部预测数据进行聚合得到第一全局预测数据;获取云服务器网络的有向图以及参考输入均值,有向图用于表示云服务器网络中各个管理节点之间以及各个管理节点与对应的多个计算节点之间的连接关系;基于有向图,获取与目标管理节点连接的其他管理节点的第二全局预测数据,第二全局预测数据是其他管理节点基于所连接的多个计算节点上传的局部预测数据聚合得到的;将第一全局预测数据与第二全局预测数据进行聚合,得到聚合数据;基于参考输入均值对聚合数据进行迭代更新,得到更新后的聚合数据;若更新后的聚合数据在参考输入均值对应的范围内,则确定更新后的聚合数据为目标管理节点的目标全局预测数据。通过上述过程,可以提高云服务器网络中各管理节点进行全局预测的一致性及可靠性。
在一些可选的实施方式中,对多个局部预测数据进行聚合得到第一全局预测数据,包括:
基于多个计算节点所上传的局部预测数据及对应的第一计算权重,得到第一局部预测数据集及第一计算权重集;其中,第一局部预测数据集包括第一局部预测期望集和第一局部预测方差集,第一计算权重集包括与第一局部预测期望集对应的第一局部预测期望权重集以及与第一局部预测方差集对应的第一局部预测方差权重集;
基于第一局部预测数据集及第一计算权重集,确定第一全局预测数据。
在一些可选的实施方式中,基于第一局部预测数据集及第一计算权重集,确定第一全局预测数据,包括:
基于第一局部预测期望集中的局部预测期望与第一局部预测期望集中对应的局部预测期望权重,确定第一全局预测期望集;
基于第一局部预测方差集中的局部预测方差与第一局部预测方差权重集中对应的局部预测方差权重,确定第一全局预测方差集;
基于第一全局预测期望集及第一全局预测方差集,确定第一全局预测数据。
在一些可选的实施方式中,基于第一局部预测期望集中的局部预测期望与第一局部预测期望集中对应的局部预测期望权重,确定第一全局预测期望前,包括:
针对第一局部预测期望集中的任一局部预测期望,识别局部预测期望在第一局部预测期望集中的第一目标位置信息;
在局部预测期望权重集中确定与第一目标位置信息相匹配的局部预测期望权重。
在一些可选的实施方式中,基于第一局部预测方差集中的局部预测方差与第一局部预测方差权重集中对应的局部预测方差权重,确定第一全局预测方差前,包括:
针对第一局部预测方差集中的任一局部预测方差,识别局部预测方差在第一局部预测方差集中的第一目标位置信息;
在第一局部预测方差权重集中确定与第一目标位置信息相匹配的局部预测方差权重。
在一些可选的实施方式中,基于第一全局预测期望集及第一全局预测方差集,确定目标管理节点的第一全局预测数据,包括:
对第一全局预测期望集中的多个局部预测期望进行加权平均计算,得到第一全局预测期望;
对第一全局预测方差集中的多个局部预测方差进行加权平均计算,得到第一全局预测方差;
基于第一全局预测期望及第一全局预测方差,确定目标管理节点的第一全局预测数据。
在一些可选的实施方式中,第一全局预测数据的计算模型为:
其中,为局部预测期望;/>为局部预测方差;/>为第一全局预测期望;为第一全局预测方差;/>为权重,/>,且/>;/>为任一管理节点,包括目标管理节点及其他管理节点;/>为计算节点;/>为计算节点/>所归属的目标管理节点/>
在一些可选的实施方式中,局部预测数据及局部预测方差由计算节点基于目标训练集及核函数计算得到,目标训练集由计算节点接收到的流数据及存储的局部训练集确定。
在一些可选的实施方式中,基于流数据及局部训练集确定目标训练集,包括:
计算流数据与局部训练集中任意训练数据的数据距离,得到数据距离列表;
对数据距离列表中的各数据距离进行排序,并选取目标个数据距离最小的数据组成目标训练集。
在一些可选的实施方式中,将第一全局预测数据与第二全局预测数据进行聚合,得到聚合数据,包括:
获取第一全局预测数据的第一全局预测权重以及第二全局预测数据的第二全局预测权重;
基于第一全局预测数据及第一全局预测权重,得到第一全局预测输出数据;
基于第二全局预测数据及第二全局预测权重,得到第二全局预测输出数据;
将第一全局预测输出数据与第二全局预测输出数据进行聚合,得到聚合数据。
在一些可选的实施方式中,将第一全局预测输出数据与第二全局预测输出数据进行聚合,得到聚合数据,包括:
将第一全局预测输出数据与第二全局预测输出数据进行加权平均,得到聚合数据。
在一些可选的实施方式中,聚合数据的计算模型为:
其中,为全局聚合期望;/>为全局聚合方差;/>是由/>个管理节点组成的集合。
在一些可选的实施方式中,参考输入均值包括期望参考输入均值及方差参考输入均值,基于参考输入均值对聚合数据进行迭代更新,得到更新后的聚合数据,包括:
基于期望参考输入均值对全局聚合期望进行迭代更新,得到第一聚合更新数据;
基于方差参考输入均值对全局聚合方差进行迭代更新,得到第二聚合更新数据;
基于第一聚合更新数据及第二聚合更新数据,得到更新后的聚合数据。
在一些可选的实施方式中,若更新后的聚合数据在参考输入均值对应的范围内,则确定更新后的聚合数据为目标管理节点的目标全局预测数据,包括:
若全局聚合期望在期望参考输入均值的第一邻域内时,得到管理节点的目标全局预测期望;
若全局聚合方差在方差参考输入均值的第二邻域内时,得到管理节点的目标全局预测方差;
基于目标全局预测期望及目标全局预测方差得到管理节点的目标全局预测数据。
在一些可选的实施方式中,上述方法还包括:
基于目标全局预测期望在上一时刻的期望值及更新率相关参数,对目标全局预测期望进行更新;
基于目标全局预测方差在上一时刻的方差值及更新率相关参数,对目标全局预测方差进行更新。
在一些可选的实施方式中,目标全局预测期望的更新模型为:
目标全局预测方差的更新模型为:
其中,为k时刻的目标全局预测期望,/>为k时刻的目标全局预测方差,为期望辅助数据,/>为方差辅助数据,/>为期望参考输入均值变量,/>为期望参考输入均值,/>为方差参考输入均值变量,/>为方差参考输入均值,/>、/>及/>为更新系数,/>为有向图中与目标管理节点通信的其他管理节点在云服务器网络中的重要程度。
在一些可选的实施方式中,基于有向图,获取与目标管理节点连接的其他管理节点的第二全局预测数据,包括:
获取目标管理节点在有向图中的位置信息;
基于目标管理节点在有向图中的位置信息,确定向管理节点发送数据的其他管理节点;
基于向管理节点发送数据的其他管理节点,得到对象邻近集合;
将对象邻近集合中各其他管理节点所发送的全局预测数据,作为第二全局预测数据。
在一些可选的实施方式中,上述方法还包括:
将目标全局预测数据下发至管理节点下的各计算节点,以使各计算节点基于目标全局预测数据更新局部预测数据。
第二方面,本发明提供了一种流数据处理装置,应用于云服务器网络中的目标管理节点,该装置主要包括:数据接收模块、均值获取模块、数据获取模块、数据聚合模块、数据更新模块及数据处理模块;其中,数据接收模块,用于接收所连接的多个计算节点上传的局部预测数据,并对多个局部预测数据进行聚合得到第一全局预测数据;均值获取模块,用于获取云服务器网络的有向图以及参考输入均值,有向图用于表示云服务器网络中各个管理节点之间以及各个管理节点与对应的多个计算节点之间的连接关系;数据获取模块,用于基于有向图,获取与目标管理节点连接的其他管理节点的第二全局预测数据,第二全局预测数据是其他管理节点基于所连接的多个计算节点上传的局部预测数据聚合得到的;数据聚合模块,用于将第一全局预测数据与第二全局预测数据进行聚合,得到聚合数据;数据更新模块,用于基于参考输入均值对聚合数据进行迭代更新,得到更新后的聚合数据;数据处理模块,用于若更新后的聚合数据在参考输入均值对应的范围内,则确定更新后的聚合数据为目标管理节点的目标全局预测数据。通过上述过程,可以提高云服务器网络中各管理节点进行全局预测的一致性及可靠性。
第三方面,本发明提供了一种计算机设备,包括:存储器和处理器,存储器和处理器之间互相通信连接,存储器中存储有计算机指令,处理器通过执行计算机指令,从而执行上述第一方面或其对应的任一实施方式的流数据处理方法。
第四方面,本发明提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机指令,计算机指令用于使计算机执行上述第一方面或其对应的任一实施方式的流数据处理方法。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例的一种应用环境的示意图;
图2是本发明实施例的流数据处理方法的流程示意图;
图3是本发明实施例的流数据处理方法的第一场景示意图;
图4是本发明实施例的流数据处理方法的第二场景示意图;
图5是本发明实施例的另一流数据处理方法的流程示意图;
图6是本发明实施例的又一流数据处理方法的流程示意图;
图7是本发明实施例的再一流数据处理方法的流程示意图;
图8是本发明实施例的流数据处理装置的结构框图;
图9是本发明实施例的计算机设备的硬件结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”和“第二”是用于区别不同对象,而非用于描述特定顺序。此外,术语“包括”以及它们任何变形,意图在于覆盖不排他的保护。例如包含了一系列步骤或单元的过程、方法、***、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。本发明中的“多个”可以表示至少两个,例如可以是两个、三个或者更多个,本发明实施例不做限制。
请参阅图1,图1是本发明实施例提供的一种应用环境的示意图,该示意图的云服务器网络包括计算节点,计算节点中可以包含有处理器和存储器。多个计算节点可以通过网络与对应的管理节点进行通信连接,该管理节点可用于为客户端上安装的计算程序提供服务(如聚合服务等),可在管理节点上或独立于管理节点设置数据库,用于为管理节点提供数据存储服务。其中,管理节点的数量为多个,多个管理节点之间可相互通信,即将云服务器网络中的计算节点进行分组,每组计算节点配备一个管理节点进行局部预测的聚合;管理节点的布局是稀疏的,且管理节点组成了一个完全图;也就是说,管理节点聚合后得到的全局预测可以与其它管理节点进行通信。此外,管理节点中可以运行有处理引擎,该处理引擎可以用于执行由管理节点所执行的步骤。
具体的,假设云服务器网络中存在个计算节点,并且将/>个计算节点平均分为组。实际应用中也可以不用平均分配计算节点,这里为了叙述方便,假设平均分配云服务器网络中的用户,因此每一组含有/>个计算节点。为每一组/>个计算节点配备一个管理节点,因此一个管理节点和/>个计算节点组成了一个全局预测子***;而不同的管理节点构建了稀疏的云服务器网络,每个计算节点与其它不同的管理节点之间有信息的传输。将云服务器网络定义为/>,其中/>是由/>个管理节点组成的集合,/>是有方向的边缘集合,边缘连接各个管理节点。/>是权重矩阵且其中元素为/>。而对于任意管理节点/>,及其协调的所有计算节点/>,我们定义计算节点集合/>使得/>。我们用三个管理节点(如管理节点1、管理节点2及管理节点3)和300个计算节点(如计算节点1、计算节点2……计算节点300),即/>,/>
可选的,计算节点可以但不限于为可以计算数据的终端,如移动终端(例如平板电脑)、笔记本电脑、PC(Personal Computer,个人计算机)机等终端上,上述网络可以包括但不限于:广域网、城域网、局域网等。上述管理节点可以包括但不限于任何可以进行计算的硬件设备。
此外,在本实施例中,上述流数据处理方法还可以但不限于应用于处理能力较强大的独立的处理设备中,而无需进行数据交互。例如,该处理设备可以但不限于为处理能力较强大的终端设备,即,上述流数据处理方法中的各个操作可以集成在一个独立的处理设备中。上述仅是一种示例,本实施例中对此不作任何限定。
根据本发明实施例,提供了一种流数据处理方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
在本实施例中提供了一种流数据处理方法,可用于上述应用于云服务器网络中的目标管理节点,图2是根据本发明实施例的流数据处理方法的流程图,如图2所示,该流程包括如下步骤:
步骤S201,接收所连接的多个计算节点上传的局部预测数据,并对多个局部预测数据进行聚合得到第一全局预测数据。
如上,通过接收所连接的多个计算节点上传的局部预测数据,并对多个局部预测数据进行聚合得到第一全局预测数据,从而实现各管理节点对与其连接的多个计算节点所计算得到的局部预测数据的聚合。
在一些可选的实施方式中,请参阅图3,在对多个局部预测数据进行聚合得到第一全局预测数据时,可以基于多个计算节点所上传的局部预测数据及对应的第一计算权重,得到第一局部预测数据集及第一计算权重集;基于第一局部预测数据集及第一计算权重集,确定第一全局预测数据。其中,第一计算权重为各计算节点在对应的目标管理节点内所占的权重,与各计算节点在对应的目标管理节点中的重要程度确定。
其中,第一局部预测数据集包括第一局部预测期望集和第一局部预测方差集,第一计算权重集包括与第一局部预测期望集对应的第一局部预测期望权重集以及与第一局部预测方差集对应的第一局部预测方差权重集。基于第一局部预测数据集及第一计算权重集,确定第一全局预测数据时,可以基于第一局部预测期望集中的局部预测期望与第一局部预测期望集中对应的局部预测期望权重,确定第一全局预测期望集;基于第一局部预测方差集中的局部预测方差与第一局部预测方差权重集中对应的局部预测方差权重,确定第一全局预测方差集;基于第一全局预测期望集及第一全局预测方差集,确定第一全局预测数据。
在一些可选的实施方式中,基于第一局部预测期望集中的局部预测期望与第一局部预测期望集中对应的局部预测期望权重,确定第一全局预测期望前,可以针对第一局部预测期望集中的任一局部预测期望,识别局部预测期望在第一局部预测期望集中的第一目标位置信息;在局部预测期望权重集中确定与第一目标位置信息相匹配的局部预测期望权重。基于第一局部预测方差集中的局部预测方差与第一局部预测方差权重集中对应的局部预测方差权重,确定第一全局预测方差前,可以针对第一局部预测方差集中的任一局部预测方差,识别局部预测方差在第一局部预测方差集中的第一目标位置信息;在第一局部预测方差权重集中确定与第一目标位置信息相匹配的局部预测方差权重。
在一些可选的实施方式中,基于第一全局预测期望集及第一全局预测方差集,确定目标管理节点的第一全局预测数据时,可以对第一全局预测期望集中的多个局部预测期望进行加权平均计算,得到第一全局预测期望;对第一全局预测方差集中的多个局部预测方差进行加权平均计算,得到第一全局预测方差;基于第一全局预测期望及第一全局预测方差,确定目标管理节点的第一全局预测数据。
在一些可选的实施方式中,第一全局预测数据的计算模型为:
其中,为局部预测期望;/>为局部预测方差;/>为第一全局预测期望;为第一全局预测方差;/>为权重,/>,且/>;/>为任一管理节点,包括目标管理节点及其他管理节点;/>为计算节点;/>为计算节点/>所归属的目标管理节点/>
在一些可选的实施方式中,局部预测数据及局部预测方差由计算节点基于目标训练集及核函数计算得到,目标训练集由计算节点接收到的流数据及存储的局部训练集确定。
进一步地,基于流数据及局部训练集确定目标训练集时,可以先计算流数据与局部训练集中任意训练数据的数据距离,得到数据距离列表;然后对数据距离列表中的各数据距离进行排序,并选取目标个数据距离最小的数据组成目标训练集。
具体的,请参阅图4,局部训练集存储在各计算节点的数据库中,是由该计算节点接收到的历史流数据得到。针对任一计算节点,当该计算节点在当前时刻接收到对应的流数据时,遍历上述局部训练集,从而得到该流数据与局部训练集中各局部训练数据的数据距离;然后基于该流数据与局部训练集中各局部训练数据的数据距离如闵式距离及曼哈顿距离,生成数据距离列表,对数据距离列表中的各数据距离进行排序并选取目标个数据距离最小的数据组成目标训练集;接着通核函在目标训练集上计算高斯后验概率分布,从而得到当前计算节点的局部预测数据及局部预测方差。
步骤S202,获取云服务器网络的有向图以及参考输入均值,有向图用于表示云服务器网络中各个管理节点之间以及各个管理节点与对应的多个计算节点之间的连接关系。
如上,通过获取云服务器网络的有向图以及参考输入均值,以便于基于有向图获取云服务器网络中各个管理节点之间以及各个管理节点与对应的多个计算节点之间的连接关系,并基于参考输入均值为后续数据的聚合提供依据。
在一些可选的实施方式中,基于有向图,获取与目标管理节点连接的其他管理节点的第二全局预测数据时,可以获取目标管理节点在有向图中的位置信息;基于目标管理节点在有向图中的位置信息,确定向管理节点发送数据的其他管理节点;基于向管理节点发送数据的其他管理节点,得到对象邻近集合;将对象邻近集合中各其他管理节点所发送的全局预测数据,作为第二全局预测数据。
在一些可选的实施方式中,如果在时刻/>有方向的边缘集合,那么权重,否则/>权重。如果是无向图,那么/>。定义管理节点的邻居为/>,其中/>为给管理节点/>发送信息的邻居集合,而为管理节点/>发送信息的对象邻居集合。定义管理节点/>的出度为,k时刻再定义出度矩阵为/>,该出度矩阵/>是一个对角阵,且每个对角元素为出度/>。定义拉普拉斯矩阵为/>。首先,假设存在一个常数/>使得/>并且/>在/>满足/>。其次,构造权重使得针对所有的/>,/>和针对所有的/>,/>。最后,我们假设存在一个整数/>使得对于任意的初始时刻/>,有向图是强连接的。
在一些可选的实施方式中,参考输入均值是由上一时刻的更新后的聚合数据确定的,还可以是基于目标管理节点本身的聚合数据,以及与目标管理节点连接的其他管理节点的聚合数据的加权平均值确定的。
步骤S203,基于有向图,获取与目标管理节点连接的其他管理节点的第二全局预测数据,第二全局预测数据是其他管理节点基于所连接的多个计算节点上传的局部预测数据聚合得到的。
如上,通过基于有向图,获取与目标管理节点连接的其他管理节点,基于所连接的多个计算节点上传的局部预测数据聚合得到的第二全局预测数据,为目标管理节点与其他管理节点间聚合提供必要条件。
在一些可选的实施方式中,基于有向图,获取与目标管理节点连接的其他管理节点的第二全局预测数据时,可以获取目标管理节点在有向图中的位置信息;基于目标管理节点在有向图中的位置信息,确定向管理节点发送数据的其他管理节点;基于向管理节点发送数据的其他管理节点,得到对象邻近集合;将对象邻近集合中各其他管理节点所发送的全局预测数据,作为第二全局预测数据。
在一些可选的实施方式中,针对各其他管理节点中的任一其他管理节点,可以基于连接的多个计算节点所上传的局部预测数据及对应的第二计算权重,得到第二局部预测数据集及第二计算权重集;基于第二局部预测数据集及第二计算权重集,确定第二全局预测数据。其中,第二局部预测数据集包括第二局部预测期望集和第二局部预测方差集,第二计算权重集包括与第二局部预测期望集对应的第二局部预测期望权重集以及与第二局部预测方差集对应的第二局部预测方差权重集。基于第二局部预测数据集及第二计算权重集,确定第二全局预测数据时,可以基于第二局部预测期望集中的局部预测数据与第二局部预测期望集中对应的局部预测期望权重,确定第二全局预测期望集;基于第二局部预测方差集中的局部预测方差与第二局部预测方差权重集中对应的局部预测方差权重,确定第二全局预测方差集;基于第二全局预测期望集及第二全局预测方差集,确定第二全局预测数据。
进一步地,基于第二全局预测期望集及第二全局预测方差集,确定目标管理节点的第二全局预测数据时,可以对第二全局预测期望集中的多个局部预测期望进行加权平均计算,得到第二全局预测期望;对第二全局预测方差集中的多个局部预测方差进行加权平均计算,得到第二全局预测方差;基于第二全局预测期望及第二全局预测方差,确定目标管理节点的第二全局预测数据。
步骤S204,将第一全局预测数据与第二全局预测数据进行聚合,得到聚合数据。
如上,通过将第一全局预测数据与第二全局预测数据进行聚合,得到聚合数据,以便于基于参考输入均值对聚合数据进行迭代更新,为管理节点间的数据一致性提供必要条件。
在一些可选的实施方式中,将第一全局预测数据与第二全局预测数据进行聚合,得到聚合数据时,可以先获取第一全局预测数据的第一全局预测权重以及第二全局预测数据的第二全局预测权重;基于第一全局预测数据及第一全局预测权重,得到第一全局预测输出数据;基于第二全局预测数据及第二全局预测权重,得到第二全局预测输出数据;将第一全局预测输出数据与第二全局预测输出数据进行聚合,得到聚合数据。
在一些可选的实施方式中,将第一全局预测输出数据与第二全局预测输出数据进行聚合,得到聚合数据时,可以将第一全局预测输出数据与第二全局预测输出数据进行加权平均,得到聚合数据。
步骤S205,基于参考输入均值对聚合数据进行迭代更新,得到更新后的聚合数据。
如上,通过基于参考输入均值对聚合数据进行迭代更新,得到更新后的聚合数据,从而使得到的聚合数据更加趋近一致。
在一些可选的实施方式中,将参考输入均值包括期望参考输入均值及方差参考输入均值,基于参考输入均值对聚合数据进行迭代更新,得到更新后的聚合数据时,可以基于期望参考输入均值对全局聚合期望进行迭代更新,得到第一聚合更新数据;基于方差参考输入均值对全局聚合方差进行迭代更新,得到第二聚合更新数据;基于第一聚合更新数据及第二聚合更新数据,得到更新后的聚合数据。
步骤S206,若更新后的聚合数据在参考输入均值对应的范围内,则确定更新后的聚合数据为目标管理节点的目标全局预测数据。
如上,当更新后的聚合数据在参考输入均值对应的范围内,则确定更新后的聚合数据为目标管理节点的目标全局预测数据,即满足云服务器网络中各管理节点预测结果数据一致性的目标全局预测数据,为后续计算节点中局部预测数据的更新提供必要条件。
在一些可选的实施方式中,若更新后的聚合数据在参考输入均值对应的范围内,则确定更新后的聚合数据为目标管理节点的目标全局预测数据时,若全局聚合期望在期望参考输入均值的第一邻域内时,得到管理节点的目标全局预测期望;若全局聚合方差在方差参考输入均值的第二邻域内时,得到管理节点的目标全局预测方差;基于目标全局预测期望及目标全局预测方差得到管理节点的目标全局预测数据。其中,第一邻域及第二邻域内为-邻域。
本实施例提供的流数据处理方法,首先通过接收所连接的多个计算节点上传的局部预测数据,并对多个局部预测数据进行聚合得到第一全局预测数据,从而实现各管理节点对与其连接的多个计算节点所计算得到的局部预测数据的聚合;通过获取云服务器网络的有向图以及参考输入均值,以便于基于有向图获取云服务器网络中各个管理节点之间以及各个管理节点与对应的多个计算节点之间的连接关系,并基于参考输入均值为后续数据的聚合提供依据;通过基于有向图,获取与目标管理节点连接的其他管理节点,基于所连接的多个计算节点上传的局部预测数据聚合得到的第二全局预测数据,为目标管理节点与其他管理节点间聚合提供必要条件;通过将第一全局预测数据与第二全局预测数据进行聚合,得到聚合数据,以便于基于参考输入均值对聚合数据进行迭代更新,为管理节点间的数据一致性提供必要条件;通过基于参考输入均值对聚合数据进行迭代更新,得到更新后的聚合数据,从而使得到的聚合数据更加趋近一致;当更新后的聚合数据在参考输入均值对应的范围内,则确定更新后的聚合数据为目标管理节点的目标全局预测数据,即满足云服务器网络中各管理节点预测结果数据一致性的目标全局预测数据,为后续计算节点中局部预测数据的更新提供必要条件。因此,本发明可以提高云服务器网络中各管理节点进行全局预测的一致性及可靠性。
在本实施例中提供了一种流数据处理方法,可应用于云服务器网络中的目标管理节点,图5是根据本发明实施例的流数据处理方法的流程图,如图5所示,该流程包括如下步骤:
步骤S501,接收所连接的多个计算节点上传的局部预测数据,并对多个局部预测数据进行聚合得到第一全局预测数据。
详细请参见图2所示实施例的步骤S201,在此不再赘述。
步骤S502,获取云服务器网络的有向图以及参考输入均值,有向图用于表示云服务器网络中各个管理节点之间以及各个管理节点与对应的多个计算节点之间的连接关系。
详细请参见图2所示实施例的步骤S202,在此不再赘述。
步骤S503,基于有向图,获取与目标管理节点连接的其他管理节点的第二全局预测数据,第二全局预测数据是其他管理节点基于所连接的多个计算节点上传的局部预测数据聚合得到的。
详细请参见图2所示实施例的步骤S203,在此不再赘述。
步骤S504,将第一全局预测数据与第二全局预测数据进行聚合,得到聚合数据。
具体的,上述步骤S504包括:
步骤S5041,获取第一全局预测数据的第一全局预测权重以及第二全局预测数据的第二全局预测权重。
如上,通过获取第一全局预测数据的第一全局预测权重以及第二全局预测数据的第二全局预测权重,以便于基于第一全局预测数据得到第一全局预测数据,基于第二全局预测输出数据得到第二全局预测输出数据。
在一些可选的实施方式中,可以基于目标计算节点在云服务器网络中的重要程度确定第一全局预测数据的第一全局预测权重,基于其他计算节点在云服务器网络中的重要程度确定第二全局预测数据的第二全局预测数据权重,还可以基于第二全局预测数据所在的管理节点与目标管理节点之间的关联性确定第二全局预测数据的第二全局预测权重。
步骤S5042,基于第一全局预测数据及第一全局预测权重,得到第一全局预测输出数据。
如上,通过基于第一全局预测数据及第一全局预测权重,得到第一全局预测输出数据,以便于基于第一全局预测输出数据对目标管理节点与其他管理节点之间的全局预测输出数据进行聚合。
在一些可选的实施方式中,可以将目标管理节点的第一全局预测数据与对应的第一全局预测权重相乘,从而得到第一全局预测输出数据。
步骤S5043,基于第二全局预测数据及第二全局预测权重,得到第二全局预测输出数据。
如上,通过基于第二全局预测数据及第二全局预测权重,得到第为全局预测输出数据,以便于基于第二全局预测输出数据对目标管理节点与其他管理节点之间的全局预测输出数据进行聚合。
在一些可选的实施方式中,针对其他管理节点中的任一其他管理节点,可以将该其他管理节点的第二全局预测数据与对应的第二全局预测权重进行相乘,从而得到第二全局预测输出数据。
步骤S5044,将第一全局预测输出数据与第二全局预测输出数据进行聚合,得到聚合数据。
如上,通过将第一全局预测输出数据与第二全局预测输出数据进行聚合,得到聚合数据,以便于基于参考输入均值对聚合数据进行迭代更新,为管理节点间的数据一致性提供必要条件。
在一些可选的实施方式中,将第一全局预测输出数据与第二全局预测输出数据进行聚合,得到聚合数据时,可以将第一全局预测输出数据与第二全局预测输出数据进行加权平均,得到聚合数据。
在一些可选的实施方式中,聚合数据的计算模型为:
其中,为全局聚合期望;/>为全局聚合方差;/>是由/>个管理节点组成的集合。
步骤S505,基于参考输入均值对聚合数据进行迭代更新,得到更新后的聚合数据。
详细请参见图2所示实施例的步骤S205,在此不再赘述。
步骤S506,若更新后的聚合数据在参考输入均值对应的范围内,则确定更新后的聚合数据为目标管理节点的目标全局预测数据。
详细请参见图2所示实施例的步骤S206,在此不再赘述。
本实施例提供的流数据处理方法,首先通过接收所连接的多个计算节点上传的局部预测数据,并对多个局部预测数据进行聚合得到第一全局预测数据,从而实现各管理节点对与其连接的多个计算节点所计算得到的局部预测数据的聚合;通过获取云服务器网络的有向图以及参考输入均值,以便于基于有向图获取云服务器网络中各个管理节点之间以及各个管理节点与对应的多个计算节点之间的连接关系,并基于参考输入均值为后续数据的聚合提供依据;通过基于有向图,获取与目标管理节点连接的其他管理节点,基于所连接的多个计算节点上传的局部预测数据聚合得到的第二全局预测数据,为目标管理节点与其他管理节点间聚合提供必要条件;通过将第一全局预测数据与第二全局预测数据进行聚合,得到聚合数据,以便于基于参考输入均值对聚合数据进行迭代更新,为管理节点间的数据一致性提供必要条件;通过基于参考输入均值对聚合数据进行迭代更新,得到更新后的聚合数据,从而使得到的聚合数据更加趋近一致;当更新后的聚合数据在参考输入均值对应的范围内,则确定更新后的聚合数据为目标管理节点的目标全局预测数据,即满足云服务器网络中各管理节点预测结果数据一致性的目标全局预测数据,为后续计算节点中局部预测数据的更新提供必要条件。因此,本发明可以提高云服务器网络中各管理节点进行全局预测的一致性及可靠性。
在本实施例中提供了一种流数据处理方法,可应用于云服务器网络中的目标管理节点,图6是根据本发明实施例的流数据处理方法的流程图,如图6所示,该流程包括如下步骤:
步骤S601,接收所连接的多个计算节点上传的局部预测数据,并对多个局部预测数据进行聚合得到第一全局预测数据。
通过获取目标应用所发起的直接内存访问请求,以便于基于该直接内存访问请求进行传输层内存读请求的发起。
详细请参见图2所示实施例的步骤S201,在此不再赘述。
步骤S602,获取云服务器网络的有向图以及参考输入均值,有向图用于表示云服务器网络中各个管理节点之间以及各个管理节点与对应的多个计算节点之间的连接关系。
详细请参见图2所示实施例的步骤S202,在此不再赘述。
步骤S603,基于有向图,获取与目标管理节点连接的其他管理节点的第二全局预测数据,第二全局预测数据是其他管理节点基于所连接的多个计算节点上传的局部预测数据聚合得到的。
详细请参见图2所示实施例的步骤S203,在此不再赘述。
步骤S604,将第一全局预测数据与第二全局预测数据进行聚合,得到聚合数据。
详细请参见图5所示实施例的步骤S504,在此不再赘述。
步骤S605,基于参考输入均值对聚合数据进行迭代更新,得到更新后的聚合数据。
具体的,上述步骤S605包括:
步骤S6051,基于期望参考输入均值对全局聚合期望进行迭代更新,得到第一聚合更新数据。
如上,通过基于期望参考输入均值对全局聚合期望进行迭代更新,以便于得到第一聚合更新数据,为后续基于参考输入均值对聚合数据进行迭代更新提供必要条件。
步骤S6052,基于方差参考输入均值对全局聚合方差进行迭代更新,得到第二聚合更新数据。
如上,通过基于期望参考输入均值对全局聚合方差进行迭代更新,以便于得到第二聚合更新数据,为后续基于参考输入均值对聚合数据进行迭代更新提供必要条件。
步骤S6053,基于第一聚合更新数据及第二聚合更新数据,得到更新后的聚合数据。
如上,通过基于第一聚合更新数据及第二聚合更新数据,得到更新后的聚合数据,以便于基于参考输入均值对聚合数据进行迭代更新,为管理节点间的数据一致性提供必要条件。
在一些可选的实施方式中,基于期望参考输入均值对全局聚合期望进行迭代更新,得到第一聚合更新数据,以及基于方差参考输入均值对全局聚合方差进行迭代更新,得到第二聚合更新数据时,可以定义和/>为每一个管理节点/>的两个外部输入,即期望参考输入均值及方差参考输入均值。每一个管理节点/>计算得到全局预测期望/>和全局预测方差/>,此时需要使得每个管理节点的状态,即全局聚合期望/>和全局聚合方差/>分别收敛至外部输入的期望参考输入均值及方差参考输入均值的一个/>-邻域内,即:
而最终更新后的聚合数据表示为:
步骤S606,若更新后的聚合数据在参考输入均值对应的范围内,则确定更新后的聚合数据为目标管理节点的目标全局预测数据。
详细请参见图2所示实施例的步骤S206,在此不再赘述。
本实施例提供的流数据处理方法,首先通过接收所连接的多个计算节点上传的局部预测数据,并对多个局部预测数据进行聚合得到第一全局预测数据,从而实现各管理节点对与其连接的多个计算节点所计算得到的局部预测数据的聚合;通过获取云服务器网络的有向图以及参考输入均值,以便于基于有向图获取云服务器网络中各个管理节点之间以及各个管理节点与对应的多个计算节点之间的连接关系,并基于参考输入均值为后续数据的聚合提供依据;通过基于有向图,获取与目标管理节点连接的其他管理节点,基于所连接的多个计算节点上传的局部预测数据聚合得到的第二全局预测数据,为目标管理节点与其他管理节点间聚合提供必要条件;通过将第一全局预测数据与第二全局预测数据进行聚合,得到聚合数据,以便于基于参考输入均值对聚合数据进行迭代更新,为管理节点间的数据一致性提供必要条件;通过基于参考输入均值对聚合数据进行迭代更新,得到更新后的聚合数据,从而使得到的聚合数据更加趋近一致;当更新后的聚合数据在参考输入均值对应的范围内,则确定更新后的聚合数据为目标管理节点的目标全局预测数据,即满足云服务器网络中各管理节点预测结果数据一致性的目标全局预测数据,为后续计算节点中局部预测数据的更新提供必要条件。因此,本发明可以提高云服务器网络中各管理节点进行全局预测的一致性及可靠性。
在本实施例中提供了一种流数据处理方法,可应用于云服务器网络中的目标管理节点,图7是根据本发明实施例的流数据处理方法的流程图,如图7所示,该流程包括如下步骤:
步骤S701,接收所连接的多个计算节点上传的局部预测数据,并对多个局部预测数据进行聚合得到第一全局预测数据。
通过获取目标应用所发起的直接内存访问请求,以便于基于该直接内存访问请求进行传输层内存读请求的发起。
详细请参见图2所示实施例的步骤S201,在此不再赘述。
步骤S702,获取云服务器网络的有向图以及参考输入均值,有向图用于表示云服务器网络中各个管理节点之间以及各个管理节点与对应的多个计算节点之间的连接关系。
详细请参见图2所示实施例的步骤S202,在此不再赘述。
步骤S703,基于有向图,获取与目标管理节点连接的其他管理节点的第二全局预测数据,第二全局预测数据是其他管理节点基于所连接的多个计算节点上传的局部预测数据聚合得到的。
详细请参见图2所示实施例的步骤S203,在此不再赘述。
步骤S704,将第一全局预测数据与第二全局预测数据进行聚合,得到聚合数据。
详细请参见图5所示实施例的步骤S504,在此不再赘述。
步骤S705,基于参考输入均值对聚合数据进行迭代更新,得到更新后的聚合数据。
详细请参见图6所示实施例的步骤S605,在此不再赘述。
步骤S706,若更新后的聚合数据在参考输入均值对应的范围内,则确定更新后的聚合数据为目标管理节点的目标全局预测数据。
具体的,步骤S706包括:
步骤S7061,若全局聚合期望在期望参考输入均值的第一邻域内时,得到管理节点的目标全局预测期望。
如上,通过当全局聚合期望在期望参考输入均值的第一邻域内时,将该全局聚合期望作为管理节点的目标全局预测期望,即满足云服务器网络中各管理节点全局期望预测结果一致性的目标全局预测期望,为后续计算节点中局部预测数据中局部预测期望的更新提供必要条件。
步骤S7062,若全局聚合方差在方差参考输入均值的第二邻域内时,得到管理节点的目标全局预测方差。
如上,通过当全局聚合方差在方差参考输入均值的第二邻域内时,将该全局聚合方差作为管理节点的目标全局预测方差,即满足云服务器网络中各管理节点全局方差预测结果一致性的目标全局预测方差为后续计算节点中局部预测数据中局部预测方差的更新提供必要条件。
步骤S7063,基于目标全局预测期望及目标全局预测方差得到管理节点的目标全局预测数据。
如上,当更新后的聚合数据在参考输入均值对应的范围内,则确定更新后的聚合数据为目标管理节点的目标全局预测数据,即满足云服务器网络中各管理节点预测结果数据一致性的目标全局预测数据,为后续计算节点中局部预测数据的更新提供必要条件。
在一些可选的实施方式中,基于参考输入均值对聚合数据进行迭代更新时,可以:基于目标全局预测期望在上一时刻的期望值及更新率相关参数,对目标全局预测期望进行更新;基于目标全局预测方差在上一时刻的方差值及更新率相关参数,对目标全局预测方差进行更新。
在一些可选的实施方式中,目标全局预测期望的更新模型为:
目标全局预测方差的更新模型为:
其中,为k时刻的目标全局预测期望,/>为k时刻的目标全局预测方差,为期望辅助数据,/>为方差辅助数据,/>为期望参考输入均值变量,/>为方差参考输入均值变量,/>、/>为更新系数,/>为有向图中与目标管理节点通信的其他管理节点在云服务器网络中的重要程度。/>
如上,当时间尺度迭代无穷步后,每个管理节点的状态可以趋近于云服务器网络中所有个体的外部输入的参考输入均值的一个/>-邻域内。互享各个计算节点将各自的第一全局预测数据和与其连接的其他管理节点所传输的第二全局预测数据进行聚合得到聚合数据,并利用动态平均共识,分布式计算聚合后的全局聚合期望和全局聚合方差,使得这样的全局预测满足一致性,即克服了以往全局预测无法满足一致性的缺点。
在一些可选的实施方式中,若更新后的聚合数据在参考输入均值对应的范围内,则确定更新后的聚合数据为目标管理节点的目标全局预测数据后,该管理节点还可以将目标全局预测数据下发至管理节点下的各计算节点,以使各计算节点基于目标全局预测数据更新局部预测数据。
本实施例提供的流数据处理方法,首先通过接收所连接的多个计算节点上传的局部预测数据,并对多个局部预测数据进行聚合得到第一全局预测数据,从而实现各管理节点对与其连接的多个计算节点所计算得到的局部预测数据的聚合;通过获取云服务器网络的有向图以及参考输入均值,以便于基于有向图获取云服务器网络中各个管理节点之间以及各个管理节点与对应的多个计算节点之间的连接关系,并基于参考输入均值为后续数据的聚合提供依据;通过基于有向图,获取与目标管理节点连接的其他管理节点,基于所连接的多个计算节点上传的局部预测数据聚合得到的第二全局预测数据,为目标管理节点与其他管理节点间聚合提供必要条件;通过将第一全局预测数据与第二全局预测数据进行聚合,得到聚合数据,以便于基于参考输入均值对聚合数据进行迭代更新,为管理节点间的数据一致性提供必要条件;通过基于参考输入均值对聚合数据进行迭代更新,得到更新后的聚合数据,从而使得到的聚合数据更加趋近一致;当更新后的聚合数据在参考输入均值对应的范围内,则确定更新后的聚合数据为目标管理节点的目标全局预测数据,即满足云服务器网络中各管理节点预测结果数据一致性的目标全局预测数据,为后续计算节点中局部预测数据的更新提供必要条件。因此,本发明可以提高云服务器网络中各管理节点进行全局预测的一致性及可靠性。
在本实施例中还提供了一种流数据处理装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
本实施例提供一种流数据处理装置,应用于云服务器网络中的目标管理节点,如图8所示,包括:
数据接收模块801,用于接收所连接的多个计算节点上传的局部预测数据,并对多个局部预测数据进行聚合得到第一全局预测数据。
均值获取模块802,用于获取云服务器网络的有向图以及参考输入均值,有向图用于表示云服务器网络中各个管理节点之间以及各个管理节点与对应的多个计算节点之间的连接关系。
数据获取模块803,用于基于有向图,获取与目标管理节点连接的其他管理节点的第二全局预测数据,第二全局预测数据是其他管理节点基于所连接的多个计算节点上传的局部预测数据聚合得到的。
数据聚合模块804,用于将第一全局预测数据与第二全局预测数据进行聚合,得到聚合数据。
数据更新模块805,用于基于参考输入均值对聚合数据进行迭代更新,得到更新后的聚合数据。
数据处理模块806,用于若更新后的聚合数据在参考输入均值对应的范围内,则确定更新后的聚合数据为目标管理节点的目标全局预测数据。
在一些可选的实施方式中,数据接收模块801,包括:
数据集获取单元,用于基于多个计算节点所上传的局部预测数据及对应的第一计算权重,得到第一局部预测数据集及第一计算权重集;其中,第一局部预测数据集包括第一局部预测期望集和第一局部预测方差集,第一计算权重集包括与第一局部预测期望集对应的第一局部预测期望权重集以及与第一局部预测方差集对应的第一局部预测方差权重集。
第一数据获取单元,用于基于第一局部预测数据集及第一计算权重集,确定第一全局预测数据。
在一些可选的实施方式中,第一数据获取单元包括:
期望集获取子单元,用于基于第一局部预测期望集中的局部预测期望与第一局部预测期望集中对应的局部预测期望权重,确定第一全局预测期望集。
方差集获取子单元,用于针对第一局部预测期望集中的任一局部预测期望,识别局部预测期望在第一局部预测期望集中的第一目标位置信息;在局部预测期望权重集中确定与第一目标位置信息相匹配的局部预测期望权重;基于第一局部预测方差集中的局部预测方差与第一局部预测方差权重集中对应的局部预测方差权重,确定第一全局预测方差集。
第一数据获取子单元,用于针对第一局部预测方差集中的任一局部预测方差,识别局部预测方差在第一局部预测方差集中的第一目标位置信息;在第一局部预测方差权重集中确定与第一目标位置信息相匹配的局部预测方差权重;基于第一全局预测期望集及第一全局预测方差集,确定第一全局预测数据。
具体的,基于第一全局预测期望集及第一全局预测方差集,确定目标管理节点的第一全局预测数据时,可以对第一全局预测期望集中的多个局部预测期望进行加权平均计算,得到第一全局预测期望;对第一全局预测方差集中的多个局部预测方差进行加权平均计算,得到第一全局预测方差;基于第一全局预测期望及第一全局预测方差,确定目标管理节点的第一全局预测数据。
在一些可选的实施方式中,第一全局预测数据的计算模型为:
其中,为局部预测期望;/>为局部预测方差;/>为权重,/>,且;/>为任一管理节点,包括目标管理节点及其他管理节点;/>为计算节点;为计算节点/>所归属的目标管理节点/>。/>
在一些可选的实施方式中,局部预测数据及局部预测方差由计算节点基于目标训练集及核函数计算得到,目标训练集由计算节点接收到的流数据及存储的局部训练集确定。
进一步地,基于流数据及局部训练集确定目标训练集,包括:
计算流数据与局部训练集中任意训练数据的数据距离,得到数据距离列表;对数据距离列表中的各数据距离进行排序,并选取目标个数据距离最小的数据组成目标训练集。
在一些可选的实施方式中,数据获取模块803包括:
位置信息获取单元,用于获取目标管理节点在有向图中的位置信息。
其他节点确定单元,用于基于目标管理节点在有向图中的位置信息,确定向管理节点发送数据的其他管理节点。
邻近集合获取单元,用于基于向管理节点发送数据的其他管理节点,得到对象邻近集合。
第二数据获取单元,用于将对象邻近集合中各其他管理节点所发送的全局预测数据,作为第二全局预测数据。
在一些可选的实施方式中,数据聚合模块804包括:
权重获取单元,用于获取第一全局预测数据的第一全局预测权重以及第二全局预测数据的第二全局预测权重。
第一输出单元,用于基于第一全局预测数据及第一全局预测权重,得到第一全局预测输出数据。
第二输出单元,用于基于第二全局预测数据及第二全局预测权重,得到第二全局预测输出数据。
数据聚合单元,用于将第一全局预测输出数据与第二全局预测输出数据进行聚合,得到聚合数据。
在一些可选的实施方式中,可以将第一全局预测输出数据与第二全局预测输出数据进行加权平均,得到聚合数据。
在一些可选的实施方式中,聚合数据的计算模型为:
其中,为全局聚合期望;/>为全局聚合方差;/>是由/>个管理节点组成的集合。
在一些可选的实施方式中,数据更新模块805包括:
第一聚合更新单元,用于基于期望参考输入均值对全局聚合期望进行迭代更新,得到第一聚合更新数据。
第二聚合更新单元,用于基于方差参考输入均值对全局聚合方差进行迭代更新,得到第二聚合更新数据。
聚合数据更新单元,用于基于第一聚合更新数据及第二聚合更新数据,得到更新后的聚合数据。
在一些可选的实施方式中,数据处理模块806包括:
全局期望获取单元,用于若全局聚合期望在期望参考输入均值的第一邻域内时,得到管理节点的目标全局预测期望。
全局方差获取单元,用于若全局聚合方差在方差参考输入均值的第二邻域内时,得到管理节点的目标全局预测方差。
目标全局数据获取单元,用基于目标全局预测期望及目标全局预测方差得到管理节点的目标全局预测数据。
在一些可选的实施方式中,数据处理模块806还用于基于目标全局预测期望在上一时刻的期望值及更新率相关参数,对目标全局预测期望进行更新;基于目标全局预测方差在上一时刻的方差值及更新率相关参数,对目标全局预测方差进行更新。
在一些可选的实施方式中,目标全局预测期望的更新模型为:
目标全局预测方差的更新模型为:
其中,为k时刻的目标全局预测期望,/>为k时刻的目标全局预测方差,为期望辅助数据,/>为方差辅助数据,/>为期望参考输入均值变量,/>为方差参考输入均值变量,/>、/>为更新系数,/>为有向图中与目标管理节点通信的其他管理节点在云服务器网络中的重要程度。
在一些可选的实施方式中,数据处理模块806,还用于:
将目标全局预测数据下发至管理节点下的各计算节点,以使各计算节点基于目标全局预测数据更新局部预测数据。
上述各个模块和单元的更进一步的功能描述与上述对应实施例相同,在此不再赘述。
本实施例中的流数据处理装置是以功能单元的形式来呈现,这里的单元是指ASIC(ApplicationSpecificIntegratedCircuit,专用集成电路)电路,执行一个或多个软件或固定程序的处理器和存储器,和/或其他可以提供上述功能的器件。
本发明实施例还提供一种计算机设备,具有上述图8所示的流数据处理装置。
请参阅图9,图9是本发明可选实施例提供的一种计算机设备的结构示意图,如图9所示,该计算机设备包括:一个或多个处理器10、存储器20,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相通信连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在计算机设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在一些可选的实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个计算机设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器***)。图9中以一个处理器10为例。
处理器10可以是中央处理器,网络处理器或其组合。其中,处理器10还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路,可编程逻辑器件或其组合。上述可编程逻辑器件可以是复杂可编程逻辑器件,现场可编程逻辑门阵列,通用阵列逻辑或其任意组合。
其中,存储器20存储有可由至少一个处理器10执行的指令,以使至少一个处理器10执行实现上述实施例示出的方法。
存储器20可以包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需要的应用程序;存储数据区可存储根据一种小程序落地页的展现的计算机设备的使用所创建的数据等。此外,存储器20可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些可选的实施方式中,存储器20可选包括相对于处理器10远程设置的存储器,这些远程存储器可以通过网络连接至该计算机设备。上述网络的实例包括但不限于互联网、企业内部网、服务器集群、移动通信网及其组合。
存储器20可以包括易失性存储器,例如,随机存取存储器;存储器也可以包括非易失性存储器,例如,快闪存储器,硬盘或固态硬盘;存储器20还可以包括上述种类的存储器的组合。
该计算机设备还包括通信接口30,用于该计算机设备与其他设备或通信网络通信。
本发明实施例还提供了一种计算机可读存储介质,上述根据本发明实施例的方法可在硬件、固件中实现,或者被实现为可记录在存储介质,或者被实现通过网络下载的原始存储在远程存储介质或非暂时机器可读存储介质中并将被存储在本地存储介质中的计算机代码,从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件的存储介质上的这样的软件处理。其中,存储介质可为磁碟、光盘、只读存储记忆体、随机存储记忆体、快闪存储器、硬盘或固态硬盘等;进一步地,存储介质还可以包括上述种类的存储器的组合。可以理解,计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件,当软件或计算机代码被计算机、处理器或硬件访问且执行时,实现上述实施例示出的方法。
虽然结合附图描述了本发明的实施例,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。

Claims (21)

1.一种流数据处理方法,其特征在于,应用于云服务器网络中的目标管理节点,所述方法包括:
接收所连接的多个计算节点上传的局部预测数据,并对多个所述局部预测数据进行聚合得到第一全局预测数据;
获取所述云服务器网络的有向图以及参考输入均值,所述有向图用于表示所述云服务器网络中各个管理节点之间以及各个所述管理节点与对应的多个计算节点之间的连接关系;所述参考输入均值是基于上一时刻的更新后的聚合数据确定的,或者基于目标管理节点本身的聚合数据,以及与目标管理节点连接的其他管理节点的聚合数据的加权平均值确定的;
基于所述有向图,获取与所述目标管理节点连接的其他管理节点的第二全局预测数据,所述第二全局预测数据是所述其他管理节点基于所连接的多个计算节点上传的局部预测数据聚合得到的;
将所述第一全局预测数据与所述第二全局预测数据进行聚合,得到聚合数据;
基于所述参考输入均值对所述聚合数据进行迭代更新,得到更新后的聚合数据;
若更新后的聚合数据在所述参考输入均值对应的范围内,则确定更新后的聚合数据为所述目标管理节点的目标全局预测数据。
2.根据权利要求1所述的方法,其特征在于,所述对多个所述局部预测数据进行聚合得到第一全局预测数据,包括:
基于所述多个计算节点所上传的局部预测数据及对应的第一计算权重,得到第一局部预测数据集及第一计算权重集;其中,所述第一局部预测数据集包括第一局部预测期望集和第一局部预测方差集,所述第一计算权重集包括与所述第一局部预测期望集对应的第一局部预测期望权重集以及与所述第一局部预测方差集对应的第一局部预测方差权重集;
基于所述第一局部预测数据集及所述第一计算权重集,确定所述第一全局预测数据。
3.根据权利要求2所述的方法,其特征在于,所述基于所述第一局部预测数据集及所述第一计算权重集,确定所述第一全局预测数据,包括:
基于所述第一局部预测期望集中的局部预测期望与所述第一局部预测期望集中对应的局部预测期望权重,确定第一全局预测期望集;
基于所述第一局部预测方差集中的局部预测方差与所述第一局部预测方差权重集中对应的局部预测方差权重,确定第一全局预测方差集;
基于所述第一全局预测期望集及所述第一全局预测方差集,确定所述第一全局预测数据。
4.根据权利要求3所述的方法,其特征在于,所述基于所述第一局部预测期望集中的局部预测期望与所述第一局部预测期望集中对应的局部预测期望权重,确定第一全局预测期望前,包括:
针对所述第一局部预测期望集中的任一局部预测期望,识别所述局部预测期望在所述第一局部预测期望集中的第一目标位置信息;
在所述局部预测期望权重集中确定与所述第一目标位置信息相匹配的局部预测期望权重。
5.根据权利要求3所述的方法,其特征在于,所述基于所述第一局部预测方差集中的局部预测方差与所述第一局部预测方差权重集中对应的局部预测方差权重,确定第一全局预测方差前,包括:
针对所述第一局部预测方差集中的任一局部预测方差,识别所述局部预测方差在所述第一局部预测方差集中的第一目标位置信息;
在所述第一局部预测方差权重集中确定与所述第一目标位置信息相匹配的局部预测方差权重。
6.根据权利要求3所述的方法,其特征在于,所述基于所述第一全局预测期望集及所述第一全局预测方差集,确定所述目标管理节点的第一全局预测数据,包括:
对所述第一全局预测期望集中的多个局部预测期望进行加权平均计算,得到第一全局预测期望;
对所述第一全局预测方差集中的多个局部预测方差进行加权平均计算,得到第一全局预测方差;
基于所述第一全局预测期望及第一全局预测方差,确定所述目标管理节点的第一全局预测数据。
7.根据权利要求3所述的方法,其特征在于,所述第一全局预测数据的计算模型为:
其中,为局部预测期望;/>为局部预测方差;/>为第一全局预测期望;为第一全局预测方差;/>为权重,/>,且/>;/>为任一管理节点,包括目标管理节点及其他管理节点;/>为计算节点;/>为计算节点/>所归属的目标管理节点/>
8.根据权利要求2所述的方法,其特征在于,所述局部预测数据及所述局部预测方差由所述计算节点基于目标训练集及核函数计算得到,所述目标训练集由所述计算节点接收到的流数据及存储的局部训练集确定。
9.根据权利要求8所述的方法,其特征在于,基于所述流数据及所述局部训练集确定所述目标训练集,包括:
计算所述流数据与所述局部训练集中任意训练数据的数据距离,得到数据距离列表;
对所述数据距离列表中的各数据距离进行排序,并选取目标个数据距离最小的数据组成所述目标训练集。
10.根据权利要求7所述的方法,其特征在于,所述将所述第一全局预测数据与所述第二全局预测数据进行聚合,得到聚合数据,包括:
获取所述第一全局预测数据的第一全局预测权重以及所述第二全局预测数据的第二全局预测权重;
基于所述第一全局预测数据及所述第一全局预测权重,得到第一全局预测输出数据;
基于所述第二全局预测数据及所述第二全局预测权重,得到第二全局预测输出数据;
将所述第一全局预测输出数据与所述第二全局预测输出数据进行聚合,得到所述聚合数据。
11.根据权利要求10所述的方法,其特征在于,所述将所述第一全局预测输出数据与所述第二全局预测输出数据进行聚合,得到所述聚合数据,包括:
将所述第一全局预测输出数据与所述第二全局预测输出数据进行加权平均,得到所述聚合数据。
12.根据权利要求7所述的方法,其特征在于,所述聚合数据的计算模型为:
其中,为全局聚合期望;/>为全局聚合方差;/>是由/>个管理节点组成的集合。
13.根据权利要求12所述的方法,其特征在于,所述参考输入均值包括期望参考输入均值及方差参考输入均值,所述基于所述参考输入均值对所述聚合数据进行迭代更新,得到更新后的聚合数据,包括:
基于所述期望参考输入均值对所述全局聚合期望进行迭代更新,得到第一聚合更新数据;
基于所述方差参考输入均值对所述全局聚合方差进行迭代更新,得到第二聚合更新数据;
基于所述第一聚合更新数据及所述第二聚合更新数据,得到所述更新后的聚合数据。
14.根据权利要求13所述的方法,其特征在于,所述若更新后的聚合数据在所述参考输入均值对应的范围内,则确定更新后的聚合数据为所述目标管理节点的目标全局预测数据,包括:
若所述全局聚合期望在所述期望参考输入均值的第一邻域内时,得到所述管理节点的目标全局预测期望;
若所述全局聚合方差在所述方差参考输入均值的第二邻域内时,得到所述管理节点的目标全局预测方差;
基于所述目标全局预测期望及所述目标全局预测方差得到所述管理节点的目标全局预测数据。
15.根据权利要求14所述的方法,其特征在于,所述方法还包括:
基于所述目标全局预测期望在上一时刻的期望值及更新率相关参数,对所述目标全局预测期望进行更新;
基于所述目标全局预测方差在上一时刻的方差值及更新率相关参数,对所述目标全局预测方差进行更新。
16.根据权利要求14所述的方法,其特征在于,所述目标全局预测期望的更新模型为:
所述目标全局预测方差的更新模型为:
其中,为k时刻的目标全局预测期望,/>为k时刻的标全局预测方差,/>为期望辅助数据,/>为方差辅助数据,/>为期望参考输入均值变量,/>为期望参考输入均值,/>为方差参考输入均值变量,/>为方差参考输入均值,/>、/>及/>为更新系数,/>为有向图中与所述目标管理节点通信的其他管理节点在云服务器网络中的重要程度。
17.根据权利要求1所述的方法,其特征在于,所述基于所述有向图,获取与所述目标管理节点连接的其他管理节点的第二全局预测数据,包括:
获取所述目标管理节点在所述有向图中的位置信息;
基于所述目标管理节点在所述有向图中的位置信息,确定向所述管理节点发送数据的其他管理节点;
基于向所述管理节点发送数据的其他管理节点,得到对象邻近集合;
将所述对象邻近集合中各其他管理节点所发送的全局预测数据,作为所述第二全局预测数据。
18.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将所述目标全局预测数据下发至所述管理节点下的各计算节点,以使各所述计算节点基于所述目标全局预测数据更新所述局部预测数据。
19.一种流数据处理装置,其特征在于,应用于云服务器网络中的目标管理节点,所述装置包括:
数据接收模块,用于接收所连接的多个计算节点上传的局部预测数据,并对多个所述局部预测数据进行聚合得到第一全局预测数据;
均值获取模块,用于获取所述云服务器网络的有向图以及参考输入均值,所述有向图用于表示所述云服务器网络中各个管理节点之间以及各个所述管理节点与对应的多个计算节点之间的连接关系;所述参考输入均值是基于上一时刻的更新后的聚合数据确定的,或者基于目标管理节点本身的聚合数据,以及与目标管理节点连接的其他管理节点的聚合数据的加权平均值确定的;
数据获取模块,用于基于所述有向图,获取与所述目标管理节点连接的其他管理节点的第二全局预测数据,所述第二全局预测数据是所述其他管理节点基于所连接的多个计算节点上传的局部预测数据聚合得到的;
数据聚合模块,用于将所述第一全局预测数据与所述第二全局预测数据进行聚合,得到聚合数据;
数据更新模块,用于基于所述参考输入均值对所述聚合数据进行迭代更新,得到更新后的聚合数据;
数据处理模块,用于若更新后的聚合数据在所述参考输入均值对应的范围内,则确定更新后的聚合数据为所述目标管理节点的目标全局预测数据。
20.一种计算机设备,其特征在于,包括:
存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行权利要求1至18中任一项所述的方法。
21.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机指令,所述计算机指令用于使计算机执行权利要求1至18中任一项所述的方法。
CN202311825139.5A 2023-12-27 2023-12-27 流数据处理方法、装置、设备及存储介质 Active CN117473331B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311825139.5A CN117473331B (zh) 2023-12-27 2023-12-27 流数据处理方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311825139.5A CN117473331B (zh) 2023-12-27 2023-12-27 流数据处理方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN117473331A CN117473331A (zh) 2024-01-30
CN117473331B true CN117473331B (zh) 2024-03-08

Family

ID=89640102

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311825139.5A Active CN117473331B (zh) 2023-12-27 2023-12-27 流数据处理方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN117473331B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115456202A (zh) * 2022-11-08 2022-12-09 苏州浪潮智能科技有限公司 一种提高工作机学习性能的方法、装置、设备及介质
CN115471833A (zh) * 2022-08-23 2022-12-13 武汉大学 一种动态局部自注意力卷积网络点云分析***及方法
CN115563858A (zh) * 2022-09-23 2023-01-03 山东云海国创云计算装备产业创新中心有限公司 一种工作机稳态性能提升的方法、装置、设备及介质
CN117077811A (zh) * 2023-08-31 2023-11-17 深圳前海微众银行股份有限公司 联邦学习优化方法及相关装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115471833A (zh) * 2022-08-23 2022-12-13 武汉大学 一种动态局部自注意力卷积网络点云分析***及方法
CN115563858A (zh) * 2022-09-23 2023-01-03 山东云海国创云计算装备产业创新中心有限公司 一种工作机稳态性能提升的方法、装置、设备及介质
CN115456202A (zh) * 2022-11-08 2022-12-09 苏州浪潮智能科技有限公司 一种提高工作机学习性能的方法、装置、设备及介质
CN117077811A (zh) * 2023-08-31 2023-11-17 深圳前海微众银行股份有限公司 联邦学习优化方法及相关装置

Also Published As

Publication number Publication date
CN117473331A (zh) 2024-01-30

Similar Documents

Publication Publication Date Title
US10452702B2 (en) Data clustering
US10282636B2 (en) System, method, and recording medium for efficient cohesive subgraph identification in entity collections for inlier and outlier detection
WO2018059016A1 (zh) 针对机器学习的特征处理方法及特征处理***
US11380443B2 (en) Predicting non-communicable disease with infectious risk factors using artificial intelligence
US10541936B1 (en) Method and system for distributed analysis
CN111400555B (zh) 图数据查询任务处理方法、装置、计算机设备和存储介质
US10642912B2 (en) Control of document similarity determinations by respective nodes of a plurality of computing devices
US9754015B2 (en) Feature rich view of an entity subgraph
US11120073B2 (en) Generating metadata for image-based querying
CN111967467A (zh) 图像目标检测方法、装置、电子设备和计算机可读介质
US20220207410A1 (en) Incremental learning without forgetting for classification and detection models
US20190370599A1 (en) Bounded Error Matching for Large Scale Numeric Datasets
US12013840B2 (en) Dynamic discovery and correction of data quality issues
CN117473331B (zh) 流数据处理方法、装置、设备及存储介质
CN116703659A (zh) 一种应用于工程咨询的数据处理方法、装置及电子设备
US11481679B2 (en) Adaptive data ingestion rates
Chu et al. The design of a cloud-based tracker platform based on system-of-systems service architecture
CN111428741B (zh) 网络社区的发现方法、装置、电子设备及可读存储介质
US20210133930A1 (en) Device Manufacturing Cycle Time Reduction Using Machine Learning Techniques
CN110750555A (zh) 用于生成索引的方法、装置、计算设备以及介质
CN117473330B (zh) 一种数据处理方法、装置、设备及存储介质
CN117370471B (zh) 基于修剪平均的全局预测方法、装置、设备及存储介质
CN117370473B (zh) 基于完整性攻击的数据处理方法、装置、设备及存储介质
US20230045753A1 (en) Spectral clustering of high-dimensional data
CN117131197B (zh) 一种招标书的需求类别处理方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant