CN113449161A - 数据汇集方法、装置、***及存储介质 - Google Patents

数据汇集方法、装置、***及存储介质 Download PDF

Info

Publication number
CN113449161A
CN113449161A CN202010223825.5A CN202010223825A CN113449161A CN 113449161 A CN113449161 A CN 113449161A CN 202010223825 A CN202010223825 A CN 202010223825A CN 113449161 A CN113449161 A CN 113449161A
Authority
CN
China
Prior art keywords
data
node
collection node
terminal
collection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010223825.5A
Other languages
English (en)
Inventor
王文明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Wodong Tianjun Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Wodong Tianjun Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Wodong Tianjun Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN202010223825.5A priority Critical patent/CN113449161A/zh
Publication of CN113449161A publication Critical patent/CN113449161A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9035Filtering based on additional data, e.g. user or group profiles

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明提供一种数据汇集方法、装置、***及存储介质,该方法,应用在包含末端汇集节点、中间汇集节点、终端汇集节点的***中,该方法包括:通过所述末端汇集节点采集初始数据,并将所述初始数据上传至所述中间汇集节点;通过所述中间汇集节点根据业务需求对所述初始数据进行过滤处理,得到中间数据,并将所述中间数据上传至所述终端汇集节点;通过所述终端汇集节点对所述中间数据进行过滤处理,得到目标数据。从而能够对数据进行分层处理,减少高层级的数据处理量,使得数据具备可追溯性,便于进行数据管理,通用性强。

Description

数据汇集方法、装置、***及存储介质
技术领域
本发明涉及大数据技术领域,尤其涉及一种数据处理方法、装置、***及存储介质。
背景技术
随着工业化进程的发展,工业控制过程中产生的数据量也越来越大。为了对工业生产过程进行有效的管控,需要对大量数据进行汇集处理。
目前的数据汇集***,一般是针对特定的技术场景设计的,然后由管理人员对汇集的数据进行人工过滤处理。
但是,这种方式设计的***,耦合性强,通用性差。在进行数据汇集时,由于业务流程不规范,导致采集到的数据混杂,极大地增加了后期数据处理的运算量。
发明内容
本发明实施例提供一种数据汇集方法、装置、***及存储介质,能够对数据进行分层处理,减少高层级的数据处理量,使得数据具备可追溯性,便于进行数据管理,通用性强。
第一方面,本发明实施例提供一种数据汇集方法,应用在包含末端汇集节点、中间汇集节点、终端汇集节点的***中,所述方法包括:
通过所述末端汇集节点采集初始数据,并将所述初始数据上传至所述中间汇集节点;
通过所述中间汇集节点根据业务需求对所述初始数据进行过滤处理,得到中间数据,并将所述中间数据上传至所述终端汇集节点;
通过所述终端汇集节点对所述中间数据进行过滤处理,得到目标数据。
在一种可能的设计中,通过所述末端汇集节点采集初始数据,并将所述初始数据上传至所述中间汇集节点,包括:
根据预设的采集频率,采集所述初始数据;
向所述中间汇集节点发送授时请求;
接收所述中间汇集节点发送的时间信息;
通过所述时间信息,进行时间校对,以使得所述末端汇集节点的时间与所述中间汇集节点的时间保持一致;
对所述初始数据进行打包,得到第一数据包;
根据采集时间顺序对所述第一数据包进行序列化处理后,将所述第一数据包依次上传至所述中间汇集节点。
在一种可能的设计中,通过所述中间汇集节点根据业务需求对所述初始数据进行过滤处理,得到中间数据,并将所述中间数据上传至所述终端汇集节点,包括:
按照时间顺序,分别获取同一时间上传的所有所述第一数据包;
对所述第一数据包进行过滤处理,滤除与所述业务需求不相关的数据,得到所述中间数据;
将所述中间数据进行打包,得到第二数据包;
根据时间顺序对所述第二数据包进行序列化处理后,将所述第二数据包依次上传至所述终端汇集节点。
在一种可能的设计中,在对所述第一数据包进行过滤处理,滤除与所述业务需求不相关的数据,得到所述中间数据之后,还包括:
对所述中间数据进行汇总之后,存入关系型数据库中;
根据用户输入的第一查询请求,生成所述中间数据对应的数据报表。
在一种可能的设计中,通过所述终端汇集节点对所述中间数据进行过滤处理,得到目标数据,包括:
按照时间顺序,分别获取同一时间上传的所有所述第二数据包;
对所述第二数据包进行拆包和过滤处理,得到所述目标数据。
在一种可能的设计中,还包括:
对所述目标数据进行汇总之后,存入关系型数据库中;
根据用户输入的第二查询请求,生成所述目标数据对应的数据报表。
在一种可能的设计中,所述末端汇集节点的数量为多个,且所述中间汇集节点的数量大于1时;所述方法还包括:
任一所述中间汇集节点将所述中间数据传输给另一中间汇集节点,以使得所述另一中间汇集节点对所述中间数据进行过滤处理之后,上传至所述终端汇集节点。
第二方面,本发明实施例提供一种数据汇集装置,包括:
末端汇集节点,用于采集初始数据,并将所述初始数据上传至中间汇集节点;
中间汇集节点,用于根据业务需求对所述初始数据进行过滤处理,得到中间数据,并将所述中间数据上传至终端汇集节点;
终端汇集节点,用于对所述中间数据进行过滤处理,得到目标数据。
在一种可能的设计中,所述末端汇集节点,具体用于:
根据预设的采集频率,采集所述初始数据;
向所述中间汇集节点发送授时请求;
接收所述中间汇集节点发送的时间信息;
通过所述时间信息,进行时间校对,以使得所述末端汇集节点的时间与所述中间汇集节点的时间保持一致;
对所述初始数据进行打包,得到第一数据包;
根据采集时间顺序对所述第一数据包进行序列化处理后,将所述第一数据包依次上传至所述中间汇集节点。
在一种可能的设计中,所述中间汇集节点,具体用于:
按照时间顺序,分别获取同一时间上传的所有所述第一数据包;
对所述第一数据包进行过滤处理,滤除与所述业务需求不相关的数据,得到所述中间数据;
将所述中间数据进行打包,得到第二数据包;
根据时间顺序对所述第二数据包进行序列化处理后,将所述第二数据包依次上传至所述终端汇集节点。
在一种可能的设计中,所述中间汇集节点,具体用于:
对所述中间数据进行汇总之后,存入关系型数据库中;
根据用户输入的第一查询请求,生成所述中间数据对应的数据报表。
在一种可能的设计中,所述终端汇集节点,具体用于:
按照时间顺序,分别获取同一时间上传的所有所述第二数据包;
对所述第二数据包进行拆包和过滤处理,得到所述目标数据。
在一种可能的设计中,所述终端汇集节点,具体用于:
对所述目标数据进行汇总之后,存入关系型数据库中;
根据用户输入的第二查询请求,生成所述目标数据对应的数据报表。
在一种可能的设计中,所述末端汇集节点的数量为多个,且所述中间汇集节点的数量大于1时;任一所述中间汇集节点将所述中间数据传输给另一中间汇集节点,以使得所述另一中间汇集节点对所述中间数据进行过滤处理之后,上传至所述终端汇集节点。
第三方面,本发明实施例提供一种数据汇集***,包括:存储器和处理器,存储器中存储有所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行第一方面中任一项所述的数据汇集方法。
第四方面,本发明实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面中任一项所述的数据汇集方法。
第五方面,本发明实施例提供一种程序产品,所述程序产品包括:计算机程序,所述计算机程序存储在可读存储介质中,服务器的至少一个处理器可以从所述可读存储介质读取所述计算机程序,所述至少一个处理器执行所述计算机程序使得服务器执行第一方面中任一所述的数据汇集方法。
本发明实施例提供一种数据汇集方法、装置、***及存储介质,应用在包含末端汇集节点、中间汇集节点、终端汇集节点的***中,通过所述末端汇集节点采集初始数据,并将所述初始数据上传至所述中间汇集节点;通过所述中间汇集节点根据业务需求对所述初始数据进行过滤处理,得到中间数据,并将所述中间数据上传至所述终端汇集节点;通过所述终端汇集节点对所述中间数据进行过滤处理,得到目标数据。从而能够对数据进行分层处理,减少高层级的数据处理量,使得数据具备可追溯性,便于进行数据管理,通用性强。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一应用场景的数据汇集拓扑结构的示意图;
图2为本发明另一应用场景的数据汇集拓扑结构的示意图;
图3为本发明又一应用场景的数据汇集拓扑结构的示意图;
图4为本发明实施例一提供的数据汇集方法的流程图;
图5为本发明实施例提供的末端汇集节点的业务流程示意图;
图6为本发明实施例提供的中间汇集节点的业务流程示意图;
图7为本发明实施例提供的数据汇集的逻辑示意图;
图8为本发明实施例提供的终端汇集节点的业务流程示意图;
图9为本发明实施例二提供的数据汇集装置的结构示意图;
图10为本发明实施例三提供的数据汇集***的结构示意图。
通过上述附图,已示出本公开明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本公开的概念。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
下面以具体地实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
随着工业化进程的发展,工业控制过程中产生的数据量也越来越大。为了对工业生产过程进行有效的管控,需要对大量数据进行汇集处理。目前的数据汇集***,一般是针对特定的技术场景设计的,然后由管理人员对汇集的数据进行人工过滤处理。但是,这种方式设计的***,耦合性强,通用性差。在进行数据汇集时,由于业务流程不规范,导致采集到的数据混杂,极大地增加了后期数据处理的运算量。
针对上述技术问题,本发明提供一种数据汇集方法、装置、***及存储介质,应用在包含末端汇集节点、中间汇集节点、终端汇集节点的***中,能够对数据进行分层处理,减少高层级的数据处理量,使得数据具备可追溯性,便于进行数据管理,通用性强。本实施提供的方法还可以应用于分布式数据采集***中,由灵活的、易扩展的实时数据分析模块集成,各层级清晰的拓扑结构,能够高效的、实时的实现数据汇集,保证了业务实现的重用性和易用性,易于实现。图1为本发明一应用场景的数据汇集拓扑结构的示意图,如图1所示,这是一种标准的数据汇集拓扑结构,该数据汇集拓扑结构包含了三类数据汇集节点,分别为末端汇集节点、中间汇集节点和终端汇集节点。一个或者多个末端汇集节点将数据进行汇集之后,上传给中间汇集节点。中间汇集节点除了数据汇集功能之外,还包含了对汇集结果过滤的功能,并可以进行实时数据分析,并将分析结果作为普通数据项回写到秒包中,与数据汇集结果一同上传到上层节点。终端汇集节点可以汇集多个中间汇集节点上传的数据。在末端汇集节点中的数据汇集方法与其他两类节点稍有不同,这主要是由末端节点所处的环境决定的。末端汇集节点是和数据采进程同处于数据采集器计算机上,是数据采集***中距离数据最近的地方,在这里的数据汇集流程还起到了为数据授时所用,是数据时间的起源。终端汇集节点和中间汇集节点所包含的功能大体是一致的,唯独不同仅仅是在终端汇集节点中屏蔽了数据上传功能。在这三个数据汇集节点中只有末端汇集节点没有存储数据的权限,其他两个节点都有数据存储的权限,其中在终端和中间汇集节点中还包含了对汇集结果过滤的功能,通过过滤决定是否将上数据上传至上一级汇集节点。
图2为本发明另一应用场景的数据汇集拓扑结构的示意图,如图2所示,这是一种多级混合中间汇集节点的数据汇集拓扑结构,该数据汇集拓扑结构包含了三类数据汇集节点,分别为末端汇集节点、中间汇集节点和终端汇集节点。各汇集节点的作用如标准的数据汇集拓扑结构描述,此处不再赘述。与标准的数据汇集拓扑结构不同之处在于,中间汇集节点除了接收末端汇集节点的数据之外,还可以接收其他中间汇集节点的数据,以实现对末端汇集节点和中间汇集节点数据的汇集。该种数据汇集拓扑结构适用于工业控制领域,例如产线一生产的零件,与质检中间层之间存在数据关联,因此需要在平级的中间节点之间进行数据交互。
图3为本发明又一应用场景的数据汇集拓扑结构的示意图,如图3所示,这是一种多终端汇集节点的数据汇集拓扑结构,该数据汇集拓扑结构包含了三类数据汇集节点,分别为末端汇集节点、中间汇集节点和终端汇集节点。在实际应用中,不一定最终将数据汇集到一个节点上统一进行处理和存储。因此,可以根据数据处理业务需求的不同,还可以为中间汇集节点配置多个终端汇集节点,以便数据过滤模块过滤出不同业务的数据分别上传至不同的终端汇集节点。最终,将***部署成多个终端汇集节点拓扑结构,以实现压力分流或者业务相关性划分等目的。在上一段中描述了终端汇集节点和中间汇集节点,都存在数据过滤和存储功能,因此中间汇集节点也可以是某些数据的终端汇集节点。通过这一步的描述,可以看出这个框架总体上来讲类似一个通道过滤器模式的架构。通过多个中间节点对数据进行层层处理和过滤,并对数据不断筛选和存储,最终到达终端节点进行处理的数据基本上就剩下需要高层汇总的少量数据了。这样设计有效的提升了数据的分析效率,增强了异常情况报警的及时性,从根本上分摊了实时数据处理的压力,并将***异常问题控制在了局部。
应用上述方法能够对数据进行分层处理,减少高层级的数据处理量,使得数据具备可追溯性,便于进行数据管理,通用性强。
下面以具体地实施例对本发明的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本发明的实施例进行描述。
图4为本发明实施例一提供的数据汇集方法的流程图,如图4所示,本实施例中的方法应用在包含末端汇集节点、中间汇集节点、终端汇集节点的***中,可以包括:
S101、通过末端汇集节点采集初始数据,并将初始数据上传至中间汇集节点。
本实施例中,末端汇集节点根据预设的采集频率,采集初始数据;向中间汇集节点发送授时请求;接收中间汇集节点发送的时间信息;通过时间信息,进行时间校对,以使得末端汇集节点的时间与中间汇集节点的时间保持一致;对初始数据进行打包,得到第一数据包;根据采集时间顺序对第一数据包进行序列化处理后,将第一数据包依次上传至中间汇集节点。
具体地,末端汇集节点是在末端采集器上的数据汇集节点,是和数据采进程同处于数据采集器计算机上,是数据采集***中距离数据最近的地方。末端汇集节点一般有两种部署形式,一种是同一进程中的多线程数据汇集形式;另一种是不同进程间的基于网络协议或者进程间通信协议的数据汇集形式。这两种形式都有一个重要的共同特点,就是末端汇集节点是在同一台计算机上的数据汇集。因此,末端汇集节点还起到了为数据授时所用,是数据时间的起源。关于数据的授时,可以同步统一的进行。虽然具体的数据采集终端多数情况下都是通过某种协议采集到其他设备上的数据,但是数据采集终端都会及时的将数据汇集到末端节点上。图5为本发明实施例提供的末端汇集节点的业务流程示意图,如图5所示,末端汇集节点中主要包含四个方面的业务,分别为数据的收集与打包、时间校对、实时数据分析和数据上传。以最常见的日志采集业务为例,对末端汇集节点的业务逻辑进行介绍。一般日志都是以行为单位的,在一行日志中一般包含时间和内容等。末端汇集节点的数据收集进程以设定的频率对日志进行轮询式的访问,读取时间和内容分解后的关键数据。然后,对采集到的数据进行***标准化处理,例如标准化处理成:时间_数据ID_类型_值的格式。末端汇集节点的时间校对进程是指通过授时业务对数据项的时间部分进行校准,将本机时间校准为数据采集***的标准时间。然后,末端汇集节点依据校准后的时间将数据分别投递给实时数据分析进程分支(如果在该层次有配置的情况下)和数据上传分支。末端汇集节点的实时数据分析进程分支是通过配置的数据识别和数据运算脚本对数据进行分析,得到数据分析产生的结果。然后,可以根据配置,在超出阈值时产生预警事件。同时,也可以将数据分析结果在需要的时候作为普通数据项回写到秒包中,进行数据上传。端汇集节点的数据上传分支是指根据数据项中校准后的时间来创建或拿到秒包,之后将数据项压入秒包。当前秒的秒包创建后,上一秒的秒包同时会封闭并放入异步排队。最后,将秒包序列化后发往上一级节点(中间/终端数据汇集节点)。
S102、通过中间汇集节点根据业务需求对初始数据进行过滤处理,得到中间数据,并将中间数据上传至终端汇集节点。
本实施例中,中间汇集节点按照时间顺序,分别获取同一时间上传的所有第一数据包;对第一数据包进行过滤处理,滤除与业务需求不相关的数据,得到中间数据;将中间数据进行打包,得到第二数据包;根据时间顺序对第二数据包进行序列化处理后,将第二数据包依次上传至终端汇集节点。
可选地,在对第一数据包进行过滤处理,滤除与业务需求不相关的数据,得到中间数据之后,还包括:对中间数据进行汇总之后,存入关系型数据库中;根据用户输入的第一查询请求,生成中间数据对应的数据报表。
可选地,末端汇集节点的数量为多个,且中间汇集节点的数量大于1时;方法还包括:任一中间汇集节点将中间数据传输给另一中间汇集节点,以使得另一中间汇集节点对中间数据进行过滤处理之后,上传至终端汇集节点。
具体地,中间汇集节点还包含了对汇集结果过滤的功能,通过过滤决定是否将接收到的数据上传至上一级汇集节点。图6为本发明实施例提供的中间汇集节点的业务流程示意图,如图6所示,中间汇集节点中主要包含四个方面的业务,分别为数据汇集流程、实时数据分析流程、数据存储流程以及数据上传流程。中间汇集节点的数据汇集流程是指接收所有上游节点(末端汇集节点或中间汇集节点)发过来的秒包,排列出同一秒的所有秒包,并进行数据进行汇集处理。图7为本发明实施例提供的数据汇集的逻辑示意图,如图7所示,中间汇集节点接收到采集器A、采集器B、采集器C的数据秒包,此时汇集数据包为空,如图中初始数据所示。中间汇集节点按照时间顺序对已经排好序的多个数据包最前面的数据项进行判断,拿出他们之间最靠前的数据后进入下一个迭代。以此类推只到最终将多个包中的数据全部取完,过程中还需要注意的一点是,当所有包中最前面的数据项存在多项相同时间戳的情况下,可以将所有时间戳相同的数据项一次拿出,从而有效的减少迭代次数。因此,在第一轮循环时,采集器A的时间戳为10、采集器B的时间戳为10、采集器B的时间戳为11,时间戳为10的排序最前,且采集器A和采集器B的时间戳均为10。因此,在第一轮循环时将采集器A的数据AA和采集器B的数据BA放入汇集数据包中,并在采集器A和采集器B中删除对应数据。在第二轮循环时,采集器C的时间戳11排序最前,将采集器C的数据CA放入汇集数据包中,并在采集器C中删除对应数据。在第三轮循环时,采集器C的时间戳33排序最前,将采集器C的数据CB放入汇集数据包中,并在采集器C中删除对应数据。中间汇集节点的实时数据分析流程是通过配置的数据识别和数据运算脚本对数据进行分析,得到数据分析产生的结果。然后,可以根据配置,在超出阈值时产生预警事件。同时,也可以将数据分析结果在需要的时候作为普通数据项回写到秒包中,进行数据上传。中间汇集节点的数据上传流程是根据数据项中的时间来创建或拿到秒包,之后将数据项压入秒包。在当前秒的秒包创建后,上一秒的秒包同时会封闭并放入异步排队。中间汇集节点从队列中按顺序取出秒包,拆包并过滤,根据***配置信息对数据项进行路由标记。最后,根据路由标记对数据进行分别打包并序列化,根据路由标记将数据包分别存入时序数据库或者发往指定的上层节点。中间汇集节点的数据存储流程是筛选出需求处理的数据项,继续计算、统计并栅格数据后存入关系型数据库,以便于报表的展示。
S103、通过终端汇集节点对中间数据进行过滤处理,得到目标数据。
本实施例中,按照时间顺序,分别获取同一时间上传的所有第二数据包;对第二数据包进行拆包和过滤处理,得到目标数据。
可选地,对目标数据进行汇总之后,存入关系型数据库中;根据用户输入的第二查询请求,生成目标数据对应的数据报表。
具体地,图8为本发明实施例提供的终端汇集节点的业务流程示意图,如图8所示,终端汇集节点的业务流程与中间汇集节点的业务流程基本相同,唯一的区别是终端汇集节点中不存在数据上传流程,不需要将数据上传给其他节点。因此,终端汇集节点的业务流程详见中间汇集节点的相关介绍,此处不再赘述。
本实施例,应用在包含末端汇集节点、中间汇集节点、终端汇集节点的***中,通过末端汇集节点采集初始数据,并将初始数据上传至中间汇集节点;通过中间汇集节点根据业务需求对初始数据进行过滤处理,得到中间数据,并将中间数据上传至终端汇集节点;通过终端汇集节点对中间数据进行过滤处理,得到目标数据。从而能够对数据进行分层处理,减少高层级的数据处理量,使得数据具备可追溯性,便于进行数据管理,通用性强。
图9为本发明实施例二提供的数据汇集装置的结构示意图,如图9所示,本实施例的数据汇集装置可以包括:
末端汇集节点31,用于采集初始数据,并将初始数据上传至中间汇集节点;
中间汇集节点32,用于根据业务需求对初始数据进行过滤处理,得到中间数据,并将中间数据上传至终端汇集节点;
终端汇集节点33,用于对中间数据进行过滤处理,得到目标数据。
在一种可能的设计中,末端汇集节点31,具体用于:
根据预设的采集频率,采集初始数据;
向中间汇集节点发送授时请求;
接收中间汇集节点发送的时间信息;
通过时间信息,进行时间校对,以使得末端汇集节点的时间与中间汇集节点的时间保持一致;
对初始数据进行打包,得到第一数据包;
根据采集时间顺序对第一数据包进行序列化处理后,将第一数据包依次上传至中间汇集节点。
在一种可能的设计中,中间汇集节点32,具体用于:
按照时间顺序,分别获取同一时间上传的所有第一数据包;
对第一数据包进行过滤处理,滤除与业务需求不相关的数据,得到中间数据;
将中间数据进行打包,得到第二数据包;
根据时间顺序对第二数据包进行序列化处理后,将第二数据包依次上传至终端汇集节点。
在一种可能的设计中,中间汇集节点32,具体用于:
对中间数据进行汇总之后,存入关系型数据库中;
根据用户输入的第一查询请求,生成中间数据对应的数据报表。
在一种可能的设计中,终端汇集节点33,具体用于:
按照时间顺序,分别获取同一时间上传的所有第二数据包;
对第二数据包进行拆包和过滤处理,得到目标数据。
在一种可能的设计中,终端汇集节点33,具体用于:
对目标数据进行汇总之后,存入关系型数据库中;
根据用户输入的第二查询请求,生成目标数据对应的数据报表。
在一种可能的设计中,末端汇集节点的数量为多个,且中间汇集节点的数量大于1时;任一中间汇集节点将中间数据传输给另一中间汇集节点,以使得另一中间汇集节点对中间数据进行过滤处理之后,上传至终端汇集节点。
本实施例的数据汇集装置,可以执行图2所示方法中的技术方案,其具体实现过程和技术原理参见图2所示方法中的相关描述,此处不再赘述。
本实施例,应用在包含末端汇集节点、中间汇集节点、终端汇集节点的***中,通过末端汇集节点采集初始数据,并将初始数据上传至中间汇集节点;通过中间汇集节点根据业务需求对初始数据进行过滤处理,得到中间数据,并将中间数据上传至终端汇集节点;通过终端汇集节点对中间数据进行过滤处理,得到目标数据。从而能够对数据进行分层处理,减少高层级的数据处理量,使得数据具备可追溯性,便于进行数据管理,通用性强。
图10为本发明实施例三提供的数据汇集***的结构示意图,如图10所示,本实施例的数据汇集***40可以包括:处理器41和存储器42。
存储器42,用于存储程序;存储器42,可以包括易失性存储器(英文:volatilememory),例如随机存取存储器(英文:random-access memory,缩写:RAM),如静态随机存取存储器(英文:static random-access memory,缩写:SRAM),双倍数据率同步动态随机存取存储器(英文:Double Data Rate Synchronous Dynamic Random Access Memory,缩写:DDR SDRAM)等;存储器也可以包括非易失性存储器(英文:non-volatile memory),例如快闪存储器(英文:flash memory)。存储器42用于存储计算机程序(如实现上述方法的应用程序、功能模块等)、计算机指令等,上述的计算机程序、计算机指令等可以分区存储在一个或多个存储器42中。并且上述的计算机程序、计算机指令、数据等可以被处理器41调用。
上述的计算机程序、计算机指令等可以分区存储在一个或多个存储器42中。并且上述的计算机程序、计算机指令、数据等可以被处理器41调用。
处理器41,用于执行存储器42存储的计算机程序,以实现上述实施例涉及的方法中的各个步骤。
具体可以参见前面方法实施例中的相关描述。
处理器41和存储器42可以是独立结构,也可以是集成在一起的集成结构。当处理器41和存储器42是独立结构时,存储器42、处理器41可以通过总线43耦合连接。
本实施例的数据汇集***可以执行图2所示方法中的技术方案,其具体实现过程和技术原理参见图2所示方法中的相关描述,此处不再赘述。
此外,本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,当用户设备的至少一个处理器执行该计算机执行指令时,用户设备执行上述各种可能的方法。
其中,计算机可读介质包括计算机存储介质和通信介质,其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是通用或专用计算机能够存取的任何可用介质。一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于ASIC中。另外,该ASIC可以位于用户设备中。当然,处理器和存储介质也可以作为分立组件存在于通信设备中。
本申请还提供一种程序产品,程序产品包括计算机程序,计算机程序存储在可读存储介质中,服务器的至少一个处理器可以从可读存储介质读取计算机程序,至少一个处理器执行计算机程序使得服务器实施上述本发明实施例任一的方法。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或对其中部分或全部技术特征进行等同替换;而这些修改或替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.一种数据汇集方法,其特征在于,应用在包含末端汇集节点、中间汇集节点、终端汇集节点的***中,所述方法包括:
通过所述末端汇集节点采集初始数据,并将所述初始数据上传至所述中间汇集节点;
通过所述中间汇集节点根据业务需求对所述初始数据进行过滤处理,得到中间数据,并将所述中间数据上传至所述终端汇集节点;
通过所述终端汇集节点对所述中间数据进行过滤处理,得到目标数据。
2.根据权利要求1所述的方法,其特征在于,通过所述末端汇集节点采集初始数据,并将所述初始数据上传至所述中间汇集节点,包括:
根据预设的采集频率,采集所述初始数据;
向所述中间汇集节点发送授时请求;
接收所述中间汇集节点发送的时间信息;
通过所述时间信息,进行时间校对,以使得所述末端汇集节点的时间与所述中间汇集节点的时间保持一致;
对所述初始数据进行打包,得到第一数据包;
根据采集时间顺序对所述第一数据包进行序列化处理后,将所述第一数据包依次上传至所述中间汇集节点。
3.根据权利要求2所述的方法,其特征在于,通过所述中间汇集节点根据业务需求对所述初始数据进行过滤处理,得到中间数据,并将所述中间数据上传至所述终端汇集节点,包括:
按照时间顺序,分别获取同一时间上传的所有所述第一数据包;
对所述第一数据包进行过滤处理,滤除与所述业务需求不相关的数据,得到所述中间数据;
将所述中间数据进行打包,得到第二数据包;
根据时间顺序对所述第二数据包进行序列化处理后,将所述第二数据包依次上传至所述终端汇集节点。
4.根据权利要求3所述的方法,其特征在于,在对所述第一数据包进行过滤处理,滤除与所述业务需求不相关的数据,得到所述中间数据之后,还包括:
对所述中间数据进行汇总之后,存入关系型数据库中;
根据用户输入的第一查询请求,生成所述中间数据对应的数据报表。
5.根据权利要求3所述的方法,其特征在于,通过所述终端汇集节点对所述中间数据进行过滤处理,得到目标数据,包括:
按照时间顺序,分别获取同一时间上传的所有所述第二数据包;
对所述第二数据包进行拆包和过滤处理,得到所述目标数据。
6.根据权利要求5所述的方法,其特征在于,还包括:
对所述目标数据进行汇总之后,存入关系型数据库中;
根据用户输入的第二查询请求,生成所述目标数据对应的数据报表。
7.根据权利要求1-6中任一项所述的方法,其特征在于,所述末端汇集节点的数量为多个,且所述中间汇集节点的数量大于1时;所述方法还包括:
任一所述中间汇集节点将所述中间数据传输给另一中间汇集节点,以使得所述另一中间汇集节点对所述中间数据进行过滤处理之后,上传至所述终端汇集节点。
8.一种数据汇集装置,其特征在于,包括:
末端汇集节点,用于采集初始数据,并将所述初始数据上传至中间汇集节点;
中间汇集节点,用于根据业务需求对所述初始数据进行过滤处理,得到中间数据,并将所述中间数据上传至终端汇集节点;
终端汇集节点,用于对所述中间数据进行过滤处理,得到目标数据。
9.一种数据汇集***,其特征在于,包括:存储器、处理器,存储器中存储有所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1-7所述的数据汇集方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-7所述的数据汇集方法。
CN202010223825.5A 2020-03-26 2020-03-26 数据汇集方法、装置、***及存储介质 Pending CN113449161A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010223825.5A CN113449161A (zh) 2020-03-26 2020-03-26 数据汇集方法、装置、***及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010223825.5A CN113449161A (zh) 2020-03-26 2020-03-26 数据汇集方法、装置、***及存储介质

Publications (1)

Publication Number Publication Date
CN113449161A true CN113449161A (zh) 2021-09-28

Family

ID=77807119

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010223825.5A Pending CN113449161A (zh) 2020-03-26 2020-03-26 数据汇集方法、装置、***及存储介质

Country Status (1)

Country Link
CN (1) CN113449161A (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002024252A (ja) * 2000-07-03 2002-01-25 Nippon Telegr & Teleph Corp <Ntt> データ集約方法およびこの方法の実行プログラムを記録した記録媒体
AU2010219408A1 (en) * 2009-09-16 2011-03-31 Microsoft Technology Licensing, Llc Method of managing and summarising events in an event processing network
CN103685486A (zh) * 2013-12-02 2014-03-26 中国科学院计算技术研究所 跨数据中心集群的分布式***监控方法及***
CN105025020A (zh) * 2015-07-07 2015-11-04 成都英力拓信息技术有限公司 一种物联网的实现方法
CN108401241A (zh) * 2018-04-27 2018-08-14 江苏信息职业技术学院 一种无线数据传输***
CN110444000A (zh) * 2019-08-09 2019-11-12 贵安新区配售电有限公司 一种基于物联网技术的多表计量数据采集方法及***
CN110782644A (zh) * 2019-11-19 2020-02-11 云南省电子工业研究所 一种混合式可自组网无线读写表***

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002024252A (ja) * 2000-07-03 2002-01-25 Nippon Telegr & Teleph Corp <Ntt> データ集約方法およびこの方法の実行プログラムを記録した記録媒体
AU2010219408A1 (en) * 2009-09-16 2011-03-31 Microsoft Technology Licensing, Llc Method of managing and summarising events in an event processing network
CN103685486A (zh) * 2013-12-02 2014-03-26 中国科学院计算技术研究所 跨数据中心集群的分布式***监控方法及***
CN105025020A (zh) * 2015-07-07 2015-11-04 成都英力拓信息技术有限公司 一种物联网的实现方法
CN108401241A (zh) * 2018-04-27 2018-08-14 江苏信息职业技术学院 一种无线数据传输***
CN110444000A (zh) * 2019-08-09 2019-11-12 贵安新区配售电有限公司 一种基于物联网技术的多表计量数据采集方法及***
CN110782644A (zh) * 2019-11-19 2020-02-11 云南省电子工业研究所 一种混合式可自组网无线读写表***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
雷景生;郝珈玮;朱国康;: "基于"分层-汇集"模型的短期电力负荷预测", 电力建设, no. 01, 1 January 2017 (2017-01-01) *

Similar Documents

Publication Publication Date Title
CN109918349B (zh) 日志处理方法、装置、存储介质和电子装置
CN104778225B (zh) 一种非结构化数据多存储***中同步数据的方法
CN112714047B (zh) 基于工控协议流量的测试方法、装置、设备及存储介质
CN110287163B (zh) 安全日志采集解析方法、装置、设备及介质
CN105141441B (zh) 一种ip网络图形化配置的方法
DE102009043278A1 (de) Netzsynchronisation über IP-Netze
CN104639994A (zh) 基于运动目标生成视频摘要的方法、***及网络存储设备
CN103702053A (zh) 录像存储和检索方法及***、监控***
CN108205569A (zh) 用于更新配置管理数据库的方法和装置
JP5956049B2 (ja) ストリーミングネットフローデータ解析方法及び装置
CN113364624B (zh) 基于边缘计算的混合云流量采集方法和***
CN105338107A (zh) 一种据点运营同步管理***及方法
CN108132986B (zh) 一种飞行器海量传感器试验数据的快速处理方法
CN114095032A (zh) 基于Flink和RVR的数据流压缩方法、边缘计算***及存储介质
CN100413257C (zh) 网元告警数据获取方法
US8442947B2 (en) Management of performance data
CN112416557B (zh) 调用关系的确定方法和装置、存储介质及电子装置
CN113449161A (zh) 数据汇集方法、装置、***及存储介质
CN113204464A (zh) 基于业务场景的实时业务监控方法、***、终端及介质
CN106648722A (zh) 基于大数据的Flume接收端数据处理方法和装置
CN112448911B (zh) 一种基于K-Means的正常Server IP白名单的挖掘方法
CN116346650A (zh) 一种can信号处理方法、装置、***及电子设备
CN105704173B (zh) 一种集群***数据分布方法及服务器
CN111367686A (zh) 业务接口的调用方法及装置、计算机设备、存储介质
CN107181701B (zh) 公共网关接口数据的收集方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination