CN117493116A - 采集终端的监控处理方法、平台、装置 - Google Patents
采集终端的监控处理方法、平台、装置 Download PDFInfo
- Publication number
- CN117493116A CN117493116A CN202311517118.7A CN202311517118A CN117493116A CN 117493116 A CN117493116 A CN 117493116A CN 202311517118 A CN202311517118 A CN 202311517118A CN 117493116 A CN117493116 A CN 117493116A
- Authority
- CN
- China
- Prior art keywords
- acquisition terminal
- acquisition
- data
- terminal
- state data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012544 monitoring process Methods 0.000 title claims abstract description 125
- 238000003672 processing method Methods 0.000 title claims abstract description 22
- 230000002159 abnormal effect Effects 0.000 claims abstract description 50
- 238000000034 method Methods 0.000 claims abstract description 28
- 238000004590 computer program Methods 0.000 claims description 27
- 238000012545 processing Methods 0.000 claims description 24
- 230000036541 health Effects 0.000 claims description 8
- 238000013075 data extraction Methods 0.000 claims description 4
- 238000004458 analytical method Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000013515 script Methods 0.000 description 5
- 230000003068 static effect Effects 0.000 description 3
- 230000001960 triggered effect Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 238000005538 encapsulation Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000012805 post-processing Methods 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/3006—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3051—Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Telephonic Communication Services (AREA)
Abstract
本申请涉及一种采集终端的监控处理方法、平台、装置。涉及大数据技术领域。所述方法包括:向采集终端下发不同任务触发条件对应的不同数据采集任务;采集终端为用于监测数据中心的嵌入式智能采集终端设备;接收采集终端针对各数据采集任务发送的终端运行状态数据;终端运行状态数据为数据采集任务触发采集终端,通过采集终端自带的指令执行数据采集上送操作得到;从多个终端运行状态数据中,提取出各参数类型对应的运行状态数据;根据采集终端的历史运行状态数据和历史异常运行信息,分析各参数类型对应的运行状态数据,得到采集终端的设备状态预测信息。采用本方法能够完善DCIM***对采集终端的全面监控,提升了运行稳定性和可靠性。
Description
技术领域
本申请涉及大数据技术领域,特别是涉及一种采集终端的监控处理方法、平台、装置、计算机设备、存储介质和计算机程序产品。
背景技术
目前,通过在DCIM(Data Center Infrastructure management,数据中心基础设施管理)***中使用智能采集终端,可以获取UPS设备、温湿度、加湿器、发电机等设备的运行参数。基于智能采集终端的边缘计算能力,有助于降低DCIM服务器的压力,提升设备监控的及时性。
但针对智能采集终端的监控,相关技术中,仅是通过上层DCIM服务器对智能采集终端进行采集判断,如判断智能采集终端是否与上层服务器断开连接,导致对于智能采集终端问题的处理都是事后型,无法进行事前预判,影响运行效率。
发明内容
基于此,有必要针对上述技术问题,提供一种能够完善DCIM***对智能采集终端多维度监控的采集终端的监控处理方法、平台、装置、计算机设备、存储介质和计算机程序产品。
第一方面,本申请提供了一种采集终端的监控处理方法,包括:
向采集终端下发不同任务触发条件对应的不同数据采集任务;所述采集终端为用于监测数据中心的嵌入式智能采集终端设备;
接收所述采集终端针对各所述数据采集任务发送的终端运行状态数据;所述终端运行状态数据为所述数据采集任务触发所述采集终端,通过所述采集终端自带的指令执行数据采集上送操作得到;不同指令用于获取不同参数类型的运行状态数据;
从多个所述终端运行状态数据中,提取出各所述参数类型对应的运行状态数据;
根据所述采集终端的历史运行状态数据和历史异常运行信息,分析各所述参数类型对应的运行状态数据,得到所述采集终端的设备状态预测信息;所述设备状态预测信息用于指示出所述采集终端的异常运行情况。
在其中一个实施例中,所述向采集终端下发不同任务触发条件对应的不同数据采集任务,包括:
获取采集终端管理信息;所述采集终端管理信息用于表征所述数据中心在用的所述采集终端的设备关联信息,所述采集终端在所述数据中心的不同位置部署有多个采集设备,所述采集设备用于收集和监测所处位置的机房中设备运行参数和机房环境参数;
在检测到满足任一任务触发条件时,根据所述采集终端管理信息,向所述采集终端下发所述任一任务触发条件对应的数据采集任务;不同的任务触发条件对应有不同的数据采集任务。
在其中一个实施例中,所述从多个所述终端运行状态数据中,提取出各所述参数类型对应的运行状态数据,包括:
按照各所述采集设备的数据源信息,从多个所述终端运行状态数据中,确定各所述采集设备对应的采集上送数据;
对各所述采集设备对应的采集上送数据进行分类,得到各所述采集设备下不同参数类型对应的运行状态数据。
在其中一个实施例中,在所述从多个所述终端运行状态数据中,提取出各所述参数类型对应的运行状态数据的步骤之后,所述方法还包括:
通过数据中心监控***的服务端,按照监控数据接收格式对各所述参数类型对应的运行状态数据进行封装,并将封装后数据上送至所述数据中心监控***。
在其中一个实施例中,在所述根据所述采集终端的历史运行状态数据和历史异常运行信息,分析各所述参数类型对应的运行状态数据,得到所述采集终端的设备状态预测信息的步骤之后,所述方法还包括:
结合预设定时信息和所述采集终端的设备状态预测信息,生成采集终端监控反馈信息;所述采集终端监控反馈信息用于展示出所述采集终端在预设时间范围内的设备健康程度。
第二方面,本申请还提供了一种采集终端的监控处理平台,包括:
数据中心监控***的服务端,用于向采集终端下发不同任务触发条件对应的不同数据采集任务,接收所述采集终端针对各所述数据采集任务发送的终端运行状态数据,从多个所述终端运行状态数据中,提取出各所述参数类型对应的运行状态数据;不同指令用于获取不同参数类型的运行状态数据;
采集终端,用于通过所述采集终端自带的指令执行数据采集上送操作,发送各所述数据采集任务对应的终端运行状态数据;所述采集终端为用于监测数据中心的嵌入式智能采集终端设备;
数据中心监控***,用于根据所述采集终端的历史运行状态数据和历史异常运行信息,分析各所述参数类型对应的运行状态数据,得到所述采集终端的设备状态预测信息;所述设备状态预测信息用于指示出所述采集终端的异常运行情况。
第三方面,本申请还提供了一种采集终端的监控处理装置,包括:
数据采集任务下发模块,用于向采集终端下发不同任务触发条件对应的不同数据采集任务;所述采集终端为用于监测数据中心的嵌入式智能采集终端设备;
终端运行状态数据接收模块,用于接收所述采集终端针对各所述数据采集任务发送的终端运行状态数据;所述终端运行状态数据为所述数据采集任务触发所述采集终端,通过所述采集终端自带的指令执行数据采集上送操作得到;不同指令用于获取不同参数类型的运行状态数据;
数据提取模块,用于从多个所述终端运行状态数据中,提取出各所述参数类型对应的运行状态数据;
设备状态预测模块,用于根据所述采集终端的历史运行状态数据和历史异常运行信息,分析各所述参数类型对应的运行状态数据,得到所述采集终端的设备状态预测信息;所述设备状态预测信息用于指示出所述采集终端的异常运行情况。
第四方面,本申请还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
向采集终端下发不同任务触发条件对应的不同数据采集任务;所述采集终端为用于监测数据中心的嵌入式智能采集终端设备;
接收所述采集终端针对各所述数据采集任务发送的终端运行状态数据;所述终端运行状态数据为所述数据采集任务触发所述采集终端,通过所述采集终端自带的指令执行数据采集上送操作得到;不同指令用于获取不同参数类型的运行状态数据;
从多个所述终端运行状态数据中,提取出各所述参数类型对应的运行状态数据;
根据所述采集终端的历史运行状态数据和历史异常运行信息,分析各所述参数类型对应的运行状态数据,得到所述采集终端的设备状态预测信息;所述设备状态预测信息用于指示出所述采集终端的异常运行情况。
第五方面,本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
向采集终端下发不同任务触发条件对应的不同数据采集任务;所述采集终端为用于监测数据中心的嵌入式智能采集终端设备;
接收所述采集终端针对各所述数据采集任务发送的终端运行状态数据;所述终端运行状态数据为所述数据采集任务触发所述采集终端,通过所述采集终端自带的指令执行数据采集上送操作得到;不同指令用于获取不同参数类型的运行状态数据;
从多个所述终端运行状态数据中,提取出各所述参数类型对应的运行状态数据;
根据所述采集终端的历史运行状态数据和历史异常运行信息,分析各所述参数类型对应的运行状态数据,得到所述采集终端的设备状态预测信息;所述设备状态预测信息用于指示出所述采集终端的异常运行情况。
第六方面,本申请还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
向采集终端下发不同任务触发条件对应的不同数据采集任务;所述采集终端为用于监测数据中心的嵌入式智能采集终端设备;
接收所述采集终端针对各所述数据采集任务发送的终端运行状态数据;所述终端运行状态数据为所述数据采集任务触发所述采集终端,通过所述采集终端自带的指令执行数据采集上送操作得到;不同指令用于获取不同参数类型的运行状态数据;
从多个所述终端运行状态数据中,提取出各所述参数类型对应的运行状态数据;
根据所述采集终端的历史运行状态数据和历史异常运行信息,分析各所述参数类型对应的运行状态数据,得到所述采集终端的设备状态预测信息;所述设备状态预测信息用于指示出所述采集终端的异常运行情况。
上述一种采集终端的监控处理方法、平台、装置、计算机设备、存储介质和计算机程序产品,通过向采集终端下发不同任务触发条件对应的不同数据采集任务,该采集终端为用于监测数据中心的嵌入式智能采集终端设备,然后接收采集终端针对各数据采集任务发送的终端运行状态数据,该终端运行状态数据为数据采集任务触发采集终端,通过采集终端自带的指令执行数据采集上送操作得到,不同指令用于获取不同参数类型的运行状态数据,从多个终端运行状态数据中,提取出各参数类型对应的运行状态数据,进而根据采集终端的历史运行状态数据和历史异常运行信息,分析各参数类型对应的运行状态数据,得到采集终端的设备状态预测信息,该设备状态预测信息用于指示出采集终端的异常运行情况,实现了对采集终端的多维度全面监控,基于使用采集终端自带的有限命令进行数据上送,可以获取采集终端自身的运行情况等参数信息,完善了DCIM***对采集终端的监控处理,能够有效降低采集终端异常问题的影响,提升了运行稳定性和可靠性。
附图说明
为了更清楚地说明本申请实施例或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为一个实施例中采集终端的监控处理方法的流程示意图;
图2为一个实施例中监控处理流程的示意图;
图3为另一个实施例中采集终端的监控处理方法的流程示意图;
图4为一个实施例中一种采集终端的监控处理平台的架构示意图;
图5为一个实施例中采集终端的监控处理装置的结构框图;
图6为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在一个实施例中,如图1所示,提供了一种采集终端的监控处理方法,本实施例以该方法应用于终端进行举例说明,可以理解的是,该方法也可以应用于服务器,还可以应用于包括终端和服务器的***,并通过终端和服务器的交互实现。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。本实施例中,该方法包括以下步骤101至步骤104。其中:
步骤101,向采集终端下发不同任务触发条件对应的不同数据采集任务;所述采集终端为用于监测数据中心的嵌入式智能采集终端设备;
作为一示例,采集终端可以为DCIM***中采用的嵌入式智能采集终端;在数据中心运行过程中可以使用DCIM***对数据中心进行监控,通过在DCIM***中使用智能采集终端,其可以用于收集和监测数据中心内部的各种设备和环境参数,如获取UPS设备、温湿度、加湿器、发电机等设备的运行参数。
其中,受限于采集终端是已固化特定Linux***的嵌入式产品,其无法部署设备监控软件,例如,由于采集终端为配置减低版本的Linux***,其无法正常安装第三方监控软件,缺少必要的动态库,且***为烧录入硬件,机器重启后会还原,仅支持在特定目录保留文件。
在实际应用中,如图2所示,可以由DCIM***(即数据中心监控***)的服务端主动下发任务至采集终端,即向采集终端下发不同任务触发条件对应的不同数据采集任务;示例性地,可以通过由服务端触发telnet(指令)连接到采集终端以下发数据采集任务,任务触发的时机可以根据任务的不同有所区别。
步骤102,接收所述采集终端针对各所述数据采集任务发送的终端运行状态数据;
其中,终端运行状态数据可以为数据采集任务触发采集终端,通过采集终端自带的指令执行数据采集上送操作得到;不同指令用于获取不同参数类型的运行状态数据。
在具体实现中,如图2所示,可以通过数据中心监控***的服务端接收采集终端针对各数据采集任务上送的终端运行状态数据,以实时获取该采集终端的当前工况并进行进一步解析。
在一示例中,采集终端自带的指令可以包括但不限于telnet、nc、ping、vi、top、ps等指令;可选地,可以采用shell脚本,使用nc指令上送数据,使用top指令获取机器当前资源占用情况,使用ps-ef|grep指令获取在运行的程序清单。从而通过服务端,可以接收nc指令上送的有限报文,实现了实时获取解析采集终端当前工况。
步骤103,从多个所述终端运行状态数据中,提取出各所述参数类型对应的运行状态数据;
在接收到针对不同数据采集任务上送的终端运行状态数据后,通过数据中心监控***的服务端,可以从多个终端运行状态数据中,提取出用于监控分析的有效数据,即各参数类型对应的运行状态数据。
例如,可以根据数据源处理,以及根据数据类型进行分类、清洗、提取,得到用于监控分析的有效数据;不同参数类型可以包括但不限于CPU占用、内存占用、磁盘占用、日志异常数据等。
步骤104,根据所述采集终端的历史运行状态数据和历史异常运行信息,分析各所述参数类型对应的运行状态数据,得到所述采集终端的设备状态预测信息。
作为一示例,设备状态预测信息可以用于指示出采集终端的异常运行情况,如CPU占用超过阈值、日志文件中包含的底层设备采集失败或重连情况、磁盘占用大于阈值等。
在实际应用中,可以结合采集终端历史性能数据、日志异常内容(即历史运行状态数据和历史异常运行信息),依据CPU占用、内存占用、设备断线重连等异常场景进行分析判断,进而可以输出设备健康度预测,即采集终端的设备状态预测信息。
相较于传统方法仅可用于判断采集终端是否与上层服务器断开连接,无法获取采集终端自身的运行情况等参数信息,本实施例的技术方案,通过统一的集中管理后台,使用采集终端自带的有限命令,能够实现对采集终端的工况监控、日志监控等管理功能,有效解决了DCIM监控***对核心设备采集终端监控不完善的问题,从而基于对采集终端的多维度全面监控,为采集终端的事前预防奠定了基础,能够节约大量事后处理投入的时间和资源,有效降低了问题的影响范围,减少了潜在风险,也提升了数据中心DCIM的稳定性和可靠性。
上述采集终端的监控处理方法中,通过向采集终端下发不同任务触发条件对应的不同数据采集任务,然后接收采集终端针对各数据采集任务发送的终端运行状态数据,从多个终端运行状态数据中,提取出各参数类型对应的运行状态数据,进而根据采集终端的历史运行状态数据和历史异常运行信息,分析各参数类型对应的运行状态数据,得到采集终端的设备状态预测信息,实现了对采集终端的多维度全面监控,基于使用采集终端自带的有限命令进行数据上送,可以获取采集终端自身的运行情况等参数信息,完善了DCIM***对采集终端的监控处理,能够有效降低采集终端异常问题的影响,提升了运行稳定性和可靠性。
在一个示例性的实施例中,所述向采集终端下发不同任务触发条件对应的不同数据采集任务,可以包括如下步骤:
获取采集终端管理信息;所述采集终端管理信息用于表征所述数据中心在用的所述采集终端的设备关联信息,所述采集终端在所述数据中心的不同位置部署有多个采集设备,所述采集设备用于收集和监测所处位置的机房中设备运行参数和机房环境参数;在检测到满足任一任务触发条件时,根据所述采集终端管理信息,向所述采集终端下发所述任一任务触发条件对应的数据采集任务;不同的任务触发条件对应有不同的数据采集任务。
在一个可选实施例中,本申请中采集终端的监控处理方法可以由采集终端管理模块、任务分发模块、数据采集模块、数据接收模块、数据转发模块、智能分析模块、通知模块组成。
在一示例中,通过采集终端管理模块,可以使用Odoo(一站式企业数字化管理平台)实现对数据中心在用采集终端基本信息(即采集终端管理信息)的维护,其可以包括设备名称、IP、位置、登录采集终端账户等信息(即设备关联信息),例如,位置可以指结合CMDB(Configuration Management Database,配置管理数据库)对采集终端静态数据进行维护,如图2所示,如采集设备01(采集终端,位置1)可以表征采集设备01位于A房间,采集设备02(采集终端,位置2)位于B房间。
在又一示例中,通过任务分发模块,可以通过Odoo实现对采集终端任务的统一管理,如可以包括日志收集任务、终端工况任务、采集终端自身定时任务、弱密码管理任务等。
示例性地,可以由服务端触发telnet(指令)连接到采集终端,执行特定脚本,所触发的时机(即任务触发条件)可以根据任务的不同有所区别,即不同的任务触发条件对应有不同的数据采集任务。例如,长时间未获取采集终端上送的机器性能参数,则telnet到机器执行上送工况脚本;根据采集终端的采集异常情况,可以telnet到机器执行tail-f指令上送日志内容到服务器。
本实施例中,通过获取采集终端管理信息,进而在检测到满足任一任务触发条件时,根据采集终端管理信息,向采集终端下发任一任务触发条件对应的数据采集任务,能够通过统一的集中管理后台,实现对采集终端的工况监控、日志监控等管理功能。
在一个示例性的实施例中,所述从多个所述终端运行状态数据中,提取出各所述参数类型对应的运行状态数据,可以包括如下步骤:
按照各所述采集设备的数据源信息,从多个所述终端运行状态数据中,确定各所述采集设备对应的采集上送数据;对各所述采集设备对应的采集上送数据进行分类,得到各所述采集设备下不同参数类型对应的运行状态数据。
在实际应用中,通过数据接收模块,其可以部署在DCIM服务器,可以接收采集终端上送数据,进而可以根据数据类型进行分类、清洗、提取等处理,可选地,可以根据数据源进行处理,如可以基于tail指令获取日志的内容,捕获连接失败、采集失败等异常内容;不同指令上送数据可以具有不同的数据格式,如top指令上送数据的格式为格式一;磁盘占用格式为格式二。
在一示例中,所提取出用于监控分析的有效数据(即各采集设备下不同参数类型对应的运行状态数据)可以包括但不限于通过top指令获取到的采集终端CPU占用、内存占用,通过df指令获取到的磁盘占用,通过tail指令获取到的日志异常数据上送到DCIM监控***。
在一个可选实施例中,通过数据采集模块,可以部署在采集终端的脚本,进而可以由任务分发模块触发,通过nc指令执行实现采集终端的终端性能、日志文件、登录账户信息等数据的采集上送。示例性地,如图2所示,在接收到下发任务后,采集终端可以在内部执行任务循环,以使得来着不同数据源的采集设备循环上送任务结果。
本实施例中,通过按照各采集设备的数据源信息,从多个终端运行状态数据中,确定各采集设备对应的采集上送数据,进而对各采集设备对应的采集上送数据进行分类,得到各采集设备下不同参数类型对应的运行状态数据,可以基于数据采集后处理为进一步监控分析提供数据支持。
在一个示例性的实施例中,在所述从多个所述终端运行状态数据中,提取出各所述参数类型对应的运行状态数据的步骤之后,还可以包括如下步骤:
通过数据中心监控***的服务端,按照监控数据接收格式对各所述参数类型对应的运行状态数据进行封装,并将封装后数据上送至所述数据中心监控***。
在具体实现中,通过数据转发模块,其可以部署在DCIM服务器(即数据中心监控***的服务端),可以将提取到的有效数据,按照DCIM监控***数据接收格式进行进一步封装,并可以将数据上送至DCIM监控***;示例性地,由于不同指令上送数据可以具有不同的数据格式,为了进一步对采集终端进行监控分析判断,可以按照监控数据接收格式进行封装处理,以将符合DCIM监控***数据接收格式的数据上送至DCIM监控***。
本实施例中,通过数据中心监控***的服务端,按照监控数据接收格式对各参数类型对应的运行状态数据进行封装,并将封装后数据上送至数据中心监控***,能够使得上送分析数据符合DCIM监控***的数据接收格式。
在一个示例性的实施例中,在所述根据所述采集终端的历史运行状态数据和历史异常运行信息,分析各所述参数类型对应的运行状态数据,得到所述采集终端的设备状态预测信息的步骤之后,还可以包括如下步骤:
结合预设定时信息和所述采集终端的设备状态预测信息,生成采集终端监控反馈信息;所述采集终端监控反馈信息用于展示出所述采集终端在预设时间范围内的设备健康程度。
在一示例中,通过智能分析模块,可以结合采集终端历史性能数据、日志异常内容(即历史运行状态数据和历史异常运行信息),依据CPU占用、内存占用、设备断线重连等异常场景进行分析判断,进而可以输出设备健康度预测,即采集终端的设备状态预测信息。
例如,输出设备健康度预测结果可以包括但不限于当CPU占用超过90%,说明该机器下采集任务过重,需要考虑减少该采集终端下的采集设备;日志中包含可能底层设备采集失败、重连等关键字,其属于异常情况,需要通知相关责任人员确认;磁盘占用大于80%时,需要及时清理日志文件;在采集终端上线后,采集终端下负责的设备基本不会变化,如其资源占用情况,包括CPU、内存等,若出现长时间超过阈值的情况,则说明采集终端可能存在异常情况,需要人工确认处理。
在一示例中,通过通知模块,可以采用邮件反馈方式,也可以为其它通知方式,在本实施例中不作具体限制,根据预设定时信息(如定时每天)对数据中心在用采集终端进行健康度预测形成报告(即采集终端监控反馈信息),进而可以通知DCIM监控***进行反馈。例如,形成的报告可以展示出采集终端名称;当前CPU占用、内存占用、磁盘占用;7天CPU平均值、内存平均值;日志中异常数据列表等信息。
本实施例中,通过结合预设定时信息和采集终端的设备状态预测信息,生成采集终端监控反馈信息,能够及时反馈采集终端监控异常,有助于采集终端的事前预防,降低了问题的影响范围,减少了潜在风险,也提升了数据中心DCIM的稳定性和可靠性。
在一个实施例中,如图3所示,提供了另一种采集终端的监控处理方法的流程示意图。本实施例中,该方法包括以下步骤:
在步骤301中,获取采集终端管理信息;采集终端管理信息用于表征数据中心在用的采集终端的设备关联信息,采集终端在数据中心的不同位置部署有多个采集设备。在步骤302中,在检测到满足任一任务触发条件时,根据采集终端管理信息,向采集终端下发任一任务触发条件对应的数据采集任务;不同的任务触发条件对应有不同的数据采集任务。在步骤303中,接收采集终端针对各数据采集任务发送的终端运行状态数据。在步骤304中,按照各采集设备的数据源信息,从多个终端运行状态数据中,确定各采集设备对应的采集上送数据,对各采集设备对应的采集上送数据进行分类,得到各采集设备下不同参数类型对应的运行状态数据。在步骤305中,通过数据中心监控***的服务端,按照监控数据接收格式对各参数类型对应的运行状态数据进行封装,并将封装后数据上送至数据中心监控***。在步骤306中,根据采集终端的历史运行状态数据和历史异常运行信息,分析各参数类型对应的运行状态数据,得到采集终端的设备状态预测信息。在步骤307中,结合预设定时信息和采集终端的设备状态预测信息,生成采集终端监控反馈信息。需要说明的是,上述步骤的具体限定可以参见上文对一种采集终端的监控处理方法的具体限定,在此不再赘述。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的采集终端的监控处理方法的采集终端的监控处理平台。该平台所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个采集终端的监控处理平台实施例中的具体限定可以参见上文中对于采集终端的监控处理方法的限定,在此不再赘述。
在一个实施例中,如图4所示,提供了一种采集终端的监控处理平台,可以包括:
数据中心监控***的服务端,用于向采集终端下发不同任务触发条件对应的不同数据采集任务,接收所述采集终端针对各所述数据采集任务发送的终端运行状态数据,从多个所述终端运行状态数据中,提取出各所述参数类型对应的运行状态数据;不同指令用于获取不同参数类型的运行状态数据;
采集终端,用于通过所述采集终端自带的指令执行数据采集上送操作,发送各所述数据采集任务对应的终端运行状态数据;所述采集终端为用于监测数据中心的嵌入式智能采集终端设备;
数据中心监控***,用于根据所述采集终端的历史运行状态数据和历史异常运行信息,分析各所述参数类型对应的运行状态数据,得到所述采集终端的设备状态预测信息;所述设备状态预测信息用于指示出所述采集终端的异常运行情况。
需要说明的是,上述平台的具体限定可以参见上文对一种采集终端的监控处理方法的具体限定,在此不再赘述。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的采集终端的监控处理方法的采集终端的监控处理装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个采集终端的监控处理装置实施例中的具体限定可以参见上文中对于采集终端的监控处理方法的限定,在此不再赘述。
在一个示例性的实施例中,如图5所示,提供了一种采集终端的监控处理装置,包括:
数据采集任务下发模块501,用于向采集终端下发不同任务触发条件对应的不同数据采集任务;所述采集终端为用于监测数据中心的嵌入式智能采集终端设备;
终端运行状态数据接收模块502,用于接收所述采集终端针对各所述数据采集任务发送的终端运行状态数据;所述终端运行状态数据为所述数据采集任务触发所述采集终端,通过所述采集终端自带的指令执行数据采集上送操作得到;不同指令用于获取不同参数类型的运行状态数据;
数据提取模块503,用于从多个所述终端运行状态数据中,提取出各所述参数类型对应的运行状态数据;
设备状态预测模块504,用于根据所述采集终端的历史运行状态数据和历史异常运行信息,分析各所述参数类型对应的运行状态数据,得到所述采集终端的设备状态预测信息;所述设备状态预测信息用于指示出所述采集终端的异常运行情况。
在一个实施例中,所述数据采集任务下发模块501包括:
采集终端管理信息获取子模块,用于获取采集终端管理信息;所述采集终端管理信息用于表征所述数据中心在用的所述采集终端的设备关联信息,所述采集终端在所述数据中心的不同位置部署有多个采集设备,所述采集设备用于收集和监测所处位置的机房中设备运行参数和机房环境参数;
任务下发子模块,用于在检测到满足任一任务触发条件时,根据所述采集终端管理信息,向所述采集终端下发所述任一任务触发条件对应的数据采集任务;不同的任务触发条件对应有不同的数据采集任务。
在一个实施例中,所述数据提取模块503包括:
数据源处理子模块,用于按照各所述采集设备的数据源信息,从多个所述终端运行状态数据中,确定各所述采集设备对应的采集上送数据;
分类子模块,用于对各所述采集设备对应的采集上送数据进行分类,得到各所述采集设备下不同参数类型对应的运行状态数据。
在一个实施例中,所述装置还包括:
数据封装模块,用于通过数据中心监控***的服务端,按照监控数据接收格式对各所述参数类型对应的运行状态数据进行封装,并将封装后数据上送至所述数据中心监控***。
在一个实施例中,所述装置还包括:
反馈模块,用于结合预设定时信息和所述采集终端的设备状态预测信息,生成采集终端监控反馈信息;所述采集终端监控反馈信息用于展示出所述采集终端在预设时间范围内的设备健康程度。
上述采集终端的监控处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个示例性的实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图6所示。该计算机设备包括处理器、存储器、输入/输出接口、通信接口、显示单元和输入装置。其中,处理器、存储器和输入/输出接口通过***总线连接,通信接口、显示单元和输入装置通过输入/输出接口连接到***总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作***和计算机程序。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种采集终端的监控处理方法。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个示例性的实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
向采集终端下发不同任务触发条件对应的不同数据采集任务;所述采集终端为用于监测数据中心的嵌入式智能采集终端设备;
接收所述采集终端针对各所述数据采集任务发送的终端运行状态数据;所述终端运行状态数据为所述数据采集任务触发所述采集终端,通过所述采集终端自带的指令执行数据采集上送操作得到;不同指令用于获取不同参数类型的运行状态数据;
从多个所述终端运行状态数据中,提取出各所述参数类型对应的运行状态数据;
根据所述采集终端的历史运行状态数据和历史异常运行信息,分析各所述参数类型对应的运行状态数据,得到所述采集终端的设备状态预测信息;所述设备状态预测信息用于指示出所述采集终端的异常运行情况。
在一个实施例中,处理器执行计算机程序时还实现上述其他实施例中的采集终端的监控处理方法的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
向采集终端下发不同任务触发条件对应的不同数据采集任务;所述采集终端为用于监测数据中心的嵌入式智能采集终端设备;
接收所述采集终端针对各所述数据采集任务发送的终端运行状态数据;所述终端运行状态数据为所述数据采集任务触发所述采集终端,通过所述采集终端自带的指令执行数据采集上送操作得到;不同指令用于获取不同参数类型的运行状态数据;
从多个所述终端运行状态数据中,提取出各所述参数类型对应的运行状态数据;
根据所述采集终端的历史运行状态数据和历史异常运行信息,分析各所述参数类型对应的运行状态数据,得到所述采集终端的设备状态预测信息;所述设备状态预测信息用于指示出所述采集终端的异常运行情况。
在一个实施例中,计算机程序被处理器执行时还实现上述其他实施例中的采集终端的监控处理方法的步骤。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
向采集终端下发不同任务触发条件对应的不同数据采集任务;所述采集终端为用于监测数据中心的嵌入式智能采集终端设备;
接收所述采集终端针对各所述数据采集任务发送的终端运行状态数据;所述终端运行状态数据为所述数据采集任务触发所述采集终端,通过所述采集终端自带的指令执行数据采集上送操作得到;不同指令用于获取不同参数类型的运行状态数据;
从多个所述终端运行状态数据中,提取出各所述参数类型对应的运行状态数据;
根据所述采集终端的历史运行状态数据和历史异常运行信息,分析各所述参数类型对应的运行状态数据,得到所述采集终端的设备状态预测信息;所述设备状态预测信息用于指示出所述采集终端的异常运行情况。
在一个实施例中,计算机程序被处理器执行时还实现上述其他实施例中的采集终端的监控处理方法的步骤。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (10)
1.一种采集终端的监控处理方法,其特征在于,所述方法包括:
向采集终端下发不同任务触发条件对应的不同数据采集任务;所述采集终端为用于监测数据中心的嵌入式智能采集终端设备;
接收所述采集终端针对各所述数据采集任务发送的终端运行状态数据;所述终端运行状态数据为所述数据采集任务触发所述采集终端,通过所述采集终端自带的指令执行数据采集上送操作得到;不同指令用于获取不同参数类型的运行状态数据;
从多个所述终端运行状态数据中,提取出各所述参数类型对应的运行状态数据;
根据所述采集终端的历史运行状态数据和历史异常运行信息,分析各所述参数类型对应的运行状态数据,得到所述采集终端的设备状态预测信息;所述设备状态预测信息用于指示出所述采集终端的异常运行情况。
2.根据权利要求1所述的方法,其特征在于,所述向采集终端下发不同任务触发条件对应的不同数据采集任务,包括:
获取采集终端管理信息;所述采集终端管理信息用于表征所述数据中心在用的所述采集终端的设备关联信息,所述采集终端在所述数据中心的不同位置部署有多个采集设备,所述采集设备用于收集和监测所处位置的机房中设备运行参数和机房环境参数;
在检测到满足任一任务触发条件时,根据所述采集终端管理信息,向所述采集终端下发所述任一任务触发条件对应的数据采集任务;不同的任务触发条件对应有不同的数据采集任务。
3.根据权利要求2所述的方法,其特征在于,所述从多个所述终端运行状态数据中,提取出各所述参数类型对应的运行状态数据,包括:
按照各所述采集设备的数据源信息,从多个所述终端运行状态数据中,确定各所述采集设备对应的采集上送数据;
对各所述采集设备对应的采集上送数据进行分类,得到各所述采集设备下不同参数类型对应的运行状态数据。
4.根据权利要求1所述的方法,其特征在于,在所述从多个所述终端运行状态数据中,提取出各所述参数类型对应的运行状态数据的步骤之后,所述方法还包括:
通过数据中心监控***的服务端,按照监控数据接收格式对各所述参数类型对应的运行状态数据进行封装,并将封装后数据上送至所述数据中心监控***。
5.根据权利要求1所述的方法,其特征在于,在所述根据所述采集终端的历史运行状态数据和历史异常运行信息,分析各所述参数类型对应的运行状态数据,得到所述采集终端的设备状态预测信息的步骤之后,所述方法还包括:
结合预设定时信息和所述采集终端的设备状态预测信息,生成采集终端监控反馈信息;所述采集终端监控反馈信息用于展示出所述采集终端在预设时间范围内的设备健康程度。
6.一种采集终端的监控处理平台,其特征在于,包括:
数据中心监控***的服务端,用于向采集终端下发不同任务触发条件对应的不同数据采集任务,接收所述采集终端针对各所述数据采集任务发送的终端运行状态数据,从多个所述终端运行状态数据中,提取出各所述参数类型对应的运行状态数据;不同指令用于获取不同参数类型的运行状态数据;
采集终端,用于通过所述采集终端自带的指令执行数据采集上送操作,发送各所述数据采集任务对应的终端运行状态数据;所述采集终端为用于监测数据中心的嵌入式智能采集终端设备;
数据中心监控***,用于根据所述采集终端的历史运行状态数据和历史异常运行信息,分析各所述参数类型对应的运行状态数据,得到所述采集终端的设备状态预测信息;所述设备状态预测信息用于指示出所述采集终端的异常运行情况。
7.一种采集终端的监控处理装置,其特征在于,所述装置包括:
数据采集任务下发模块,用于向采集终端下发不同任务触发条件对应的不同数据采集任务;所述采集终端为用于监测数据中心的嵌入式智能采集终端设备;
终端运行状态数据接收模块,用于接收所述采集终端针对各所述数据采集任务发送的终端运行状态数据;所述终端运行状态数据为所述数据采集任务触发所述采集终端,通过所述采集终端自带的指令执行数据采集上送操作得到;不同指令用于获取不同参数类型的运行状态数据;
数据提取模块,用于从多个所述终端运行状态数据中,提取出各所述参数类型对应的运行状态数据;
设备状态预测模块,用于根据所述采集终端的历史运行状态数据和历史异常运行信息,分析各所述参数类型对应的运行状态数据,得到所述采集终端的设备状态预测信息;所述设备状态预测信息用于指示出所述采集终端的异常运行情况。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5中任一项所述的方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311517118.7A CN117493116A (zh) | 2023-11-14 | 2023-11-14 | 采集终端的监控处理方法、平台、装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311517118.7A CN117493116A (zh) | 2023-11-14 | 2023-11-14 | 采集终端的监控处理方法、平台、装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117493116A true CN117493116A (zh) | 2024-02-02 |
Family
ID=89668751
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311517118.7A Pending CN117493116A (zh) | 2023-11-14 | 2023-11-14 | 采集终端的监控处理方法、平台、装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117493116A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117707743A (zh) * | 2024-02-05 | 2024-03-15 | 天津凯发电气股份有限公司 | 一种智慧车站能源管控***任务执行方法、装置及设备 |
-
2023
- 2023-11-14 CN CN202311517118.7A patent/CN117493116A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117707743A (zh) * | 2024-02-05 | 2024-03-15 | 天津凯发电气股份有限公司 | 一种智慧车站能源管控***任务执行方法、装置及设备 |
CN117707743B (zh) * | 2024-02-05 | 2024-05-14 | 天津凯发电气股份有限公司 | 一种智慧车站能源管控***任务执行方法、装置及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109714192B (zh) | 一种监控云平台的监控方法及*** | |
CN111131379B (zh) | 一种分布式流量采集***和边缘计算方法 | |
CN111752799A (zh) | 一种业务链路跟踪方法、装置、设备及储存介质 | |
CN111176879A (zh) | 设备的故障修复方法及装置 | |
CN117493116A (zh) | 采集终端的监控处理方法、平台、装置 | |
CN110224865A (zh) | 一种基于流式处理的日志告警*** | |
US20120109663A1 (en) | Advanced Metering Infrastructure Event Filtering | |
CN103501345B (zh) | 一种远程集中控制***的控制方法 | |
CN111177193A (zh) | 一种基于Flink的日志流式处理方法及*** | |
CN113592114A (zh) | 电网中用户报障研判方法、装置、计算机设备和存储介质 | |
CN111897843B (zh) | 物联网数据流转策略的配置方法、装置和计算机设备 | |
CN115883330B (zh) | 告警事件处理方法、***、设备及存储介质 | |
CN113872814A (zh) | 内容分发网络的信息处理方法、装置和*** | |
US11157381B2 (en) | Display control method and display control device | |
CN108984614B (zh) | 一种基于大数据环境下的视图像快速识别方法 | |
CN111681397A (zh) | 一种配网自动化短信发送方法、发送***和存储介质 | |
WO2018192569A1 (zh) | 设备监控方法、装置及*** | |
CN113157475A (zh) | 日志处理方法、装置、存储介质及电子设备 | |
CN111427930A (zh) | 一种低压光伏储能微网设备监测管理***、方法及设备 | |
CN116627681B (zh) | 业务请求处理方法、装置、计算机设备、介质和程序产品 | |
CN112988511B (zh) | 一种日志信息收集方法、***、存储介质及设备 | |
CN108449343B (zh) | Ssh协议文本数据采集方法、采集器及计算机设备 | |
WO2024125173A1 (zh) | 一种网元故障处理方法、装置、存储介质及电子装置 | |
CN110430093B (zh) | 一种数据处理方法、装置及计算机可读存储介质 | |
CN116708154A (zh) | 网元数据异常处理方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |