CN112532435B - 一种运维方法、运维管理平台、设备及介质 - Google Patents

一种运维方法、运维管理平台、设备及介质 Download PDF

Info

Publication number
CN112532435B
CN112532435B CN202011310314.3A CN202011310314A CN112532435B CN 112532435 B CN112532435 B CN 112532435B CN 202011310314 A CN202011310314 A CN 202011310314A CN 112532435 B CN112532435 B CN 112532435B
Authority
CN
China
Prior art keywords
operation data
data
management platform
equipment
maintenance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011310314.3A
Other languages
English (en)
Other versions
CN112532435A (zh
Inventor
简立明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sangfor Technologies Co Ltd
Original Assignee
Sangfor Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sangfor Technologies Co Ltd filed Critical Sangfor Technologies Co Ltd
Priority to CN202011310314.3A priority Critical patent/CN112532435B/zh
Publication of CN112532435A publication Critical patent/CN112532435A/zh
Application granted granted Critical
Publication of CN112532435B publication Critical patent/CN112532435B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0604Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0893Assignment of logical groups to network elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/06Generation of reports

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请公开了一种运维方法、运维管理平台、设备、介质,该方法包括:获取目标网络中EDR集中管理平台上报的第一运行数据,其中,第一运行数据为部署在目标网络中的待监测终端设备上的EDR终端代理采集并上报到EDR集中管理平台的数据;获取到目标网络中的出口网关上报的第二运行数据,其中,所述第二运行数据为所述出口网关采集到的所述目标网络中的第一待监测网络设备上的数据,所述第一待监测网络设备为所述目标网络中与所述运维管理平台间接通信的设备;根据所述第一运行数据、所述第二运行数据以及预设的告警规则对所述目标网络中的设备进行运维。这样能够对企业级数据中心中的设备进行集中运维管控,降低运维复杂度,并提高运维的效率。

Description

一种运维方法、运维管理平台、设备及介质
技术领域
本申请涉及计算机安全技术领域,特别涉及一种运维方法、运维管理平台、设备、介质。
背景技术
随着企业数据中心的规模越来越大,部署的终端设备等的种类与数量也不断增加,包括各种安全设备、数通产品以及服务器等,由此使得企业级数据中心的多终端设备运维管理比较困难,分别对不同的设备进行独立的运维会使得运维复杂度较高,而效率低。因此,如何对企业级数据中心的多设备进行集中运维管控是本领域技术人员要解决的问题。
发明内容
有鉴于此,本申请的目的在于提供一种运维方法、运维管理平台、设备、介质,能够对企业级数据中心中的设备进行集中运维管控,降低运维复杂度,并提高运维的效率。其具体方案如下:
第一方面,本申请公开了一种运维方法,应用于运维管理平台,包括:
获取目标网络中EDR集中管理平台上报的第一运行数据,其中,所述第一运行数据为部署在所述目标网络中的待监测终端设备上的EDR终端代理采集并上报到所述EDR集中管理平台的数据;
获取到所述目标网络中的出口网关上报的第二运行数据,其中,所述第二运行数据为所述出口网关采集到的所述目标网络中的第一待监测网络设备上的数据,所述第一待监测网络设备为所述目标网络中与所述运维管理平台间接通信的设备;
根据所述第一运行数据、所述第二运行数据以及预设的告警规则对所述目标网络中的设备进行运维。
可选地,还包括:
获取所述目标网络中第二待监测网络设备上报的第三运行数据,其中,所述第三运行数据为所述第二待监测网络设备采集到的其自身的运行数据,所述第二待监测网络设备为与所述运维管理平台直接通信的设备;
相应地,所述根据所述第一运行数据、所述第二运行数据以及预设的告警规则对所述目标网络中的设备进行运维,具体包括:
根据所述第一运行数据、所述第二运行数据、所述第三运行数据以及预设的告警规则对所述目标网络中的设备进行运维。
可选地,所述根据所述第一运行数据、所述第二运行数据、所述第三运行数据以及预设的告警规则对所述目标网络中的设备进行运维,包括:
根据所述第一运行数据、所述第二运行数据、所述第三运行数据以及预设的告警规则对所述目标网络中的设备进行告警;
对所述第一运行数据、所述第二运行数据和/或所述第三运行数据进行统计分析,并对统计分析结果进行可视化显示。
可选地,所述根据所述第一运行数据、所述第二运行数据、所述第三运行数据以及预设的告警规则对所述目标网络中的设备进行告警,包括:
对所述第一运行数据、所述第二运行数据以及所述第三运行数据进行解析,得到目标信息;
根据所述目标信息确定出用户信息以及从预设的告警规则中确定目标告警规则;
判断所述第一运行数据、所述第二运行数据以及所述第三运行数据是否满足所述目标告警规则中的告警条件;
如果是,则根据所述用户信息发起对应的告警。
可选地,所述根据所述用户信息发起对应的告警之前,还包括:
如果所述第一运行数据、所述第二运行数据和/或所述第三运行数据满足所述目标告警规则中的告警条件,则根据数据库中存储的历史告警数据确定所述第一运行数据、所述第二运行数据和/或所述第三运行数据是否满足所述目标告警规则中的告警抑制规则;
如果所述第一运行数据、所述第二运行数据和/或所述第三运行数据不满足所述目标告警规则中的告警抑制规则,则根据所述用户信息发起对应的告警。
可选地,在获取上报的第一运行数据以及上报的第二运行数据之前,还包括:
获取预先配置的监控策略和所述告警规则,其中,所述监控策略包括监控数据类型、数据采集间隔;
将所述监控策略下发至所述EDR集中管理平台和所述出口网关,以便所述EDR集中管理平台将所述监控策略下发到所述EDR集中管理平台对应的EDR终端代理。
可选地,所述将所述监控策略下发至所述EDR集中管理平台和所述出口网关,包括:
分别将所述监控策略下发至所述EDR集中管理平台的第一SDK数据采集插件和所述出口网关的第二SDK数据采集插件中,以便所述出口网关中的第二SDK数据采集插件根据所述监控策略和简单网络管理协议采集所述第一待监测网络设备上的数据。
第二方面,本申请公开了一种运维管理平台,包括:
第一数据采集模块,用于获取目标网络中EDR集中管理平台上报的第一运行数据,其中,所述第一运行数据为部署在所述目标网络中的待监测终端设备上的EDR终端代理采集并上报到所述EDR集中管理平台的数据;
第二数据采集模块,用于获取到所述目标网络中的出口网关上报的第二运行数据,其中,所述第二运行数据为所述出口网关采集到的所述目标网络中的第一待监测网络设备上的数据,所述第一待监测网络设备为所述目标网络中与所述运维管理平台间接通信的设备;
运维模块,用于根据所述第一运行数据、所述第二运行数据以及预设的告警规则对所述目标网络中的设备进行运维。
第三方面,本申请公开了一种电子设备,包括:
存储器和处理器;
其中,所述存储器,用于存储计算机程序;
所述处理器,用于执行所述计算机程序,以实现前述公开的运维方法。
第四方面,本申请公开了一种计算机可读存储介质,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现前述公开的运维方法。
可见,本申请先获取目标网络中EDR集中管理平台上报的第一运行数据,其中,所述第一运行数据为部署在所述目标网络中的待监测终端设备上的EDR终端代理采集并上报到所述EDR集中管理平台的数据,并获取到所述目标网络中的出口网关上报的第二运行数据,其中,所述第二运行数据为所述出口网关采集到的所述目标网络中的第一待监测网络设备上的数据,所述第一待监测网络设备为所述目标网络中与所述运维管理平台间接通信的设备,然后便可以根据所述第一运行数据、所述第二运行数据以及预设的告警规则对所述目标网络中的设备进行运维。由此可见,可以直接由运维管理平台获取EDR集中管理平台上传的待监测终端设备上的EDR终端代理采集到的运行数据,实现对目标网络中可以待监测终端设备的数据采集,并可以通过出口网关获取第一待监测网络设备上的运行数据,然后再由运维管理平台获取出口网关上传的运行数据,实现对目标网络中不能直接与运维管理平台通信的第一待监测网络设备的数据采集,然后运维管理平台便可以根据获取到的运行数据以及预设的告警规则对所述目标网络中的设备进行运维管控,这样运维管理平台便可以对目标网络中的各个设备进行集中运维管控,降低了运维复杂度,并提高了运维效率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请公开的一种运维方法流程图;
图2为本申请公开的一种具体的运维管理平台进行数据获取的部分示意图;
图3为本申请公开的一种具体的运维方法流程图;
图4为本申请公开的一种监控策略下发示意图;
图5为本申请公开的一种具体的运维管理平台进行数据获取的部分示意图;
图6为本申请公开的一种告警流程图;
图7为本申请公开的一种运维方法的整体框架图;
图8为本申请公开的一种运维管理平台结构示意图;
图9为本申请公开的一种电子设备结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
参见图1所示,本申请实施例公开了一种运维方法,应用于运维管理平台,该方法包括:
步骤S11:获取目标网络中EDR集中管理平台上报的第一运行数据,其中,所述第一运行数据为部署在所述目标网络中的待监测终端设备上的EDR终端代理采集并上报到所述EDR集中管理平台的数据。
在具体的实时过程中,所述运维管理平台用于对所述目标网络中的设备进行集中运维管控,所述目标网络可以为企业级内网。
待监测终端设备,可以通过EDR终端代理和EDR集中管理平台接入所述运维管理平台,所述待监测终端设备可以通常为安装Linux,WINDOWS的终端设备。
对于所述待监测终端设备,可以在所述待监测终端设备上部署EDR(EndpointDetection and Response,终端检测与响应平台)终端代理(Agent),并通过EDR集中管理平台(MGR)对各个所述待监测终端设备上的EDR终端代理进行管理,再将所述EDR集中管理平台接入到所述运维管理平台中,由此实现将所述待监测终端设备接入到所述运维管理平台。其中,所述待监测终端设备可以包括多个设备,所以,所述EDR集中管理平台可以对应多个EDR终端代理。
由此,所述EDR终端代理便可以采集到所述待监测终端设备上的第一运行数据,并将所述第一运行数据上报给所述EDR集中管理平台,再由所述EDR集中管理平台将所述第一运行数据上报给所述运维管理平台,所以所述运维管理平台便获取到所述EDR集中管理平台上报的所述第一运行数据。
参见图2所示,为所述运维管理平台进行数据获取的部分示意图。首先各个EDR终端代理(EDR1、EDR2、EDR3)采集自身对应的待监测终端设备上的运行数据,然后将采集到的运行数据上报到EDR集中管理平台,然后EDR集中管理平台再将运行数据上报到运维管理平台。
步骤S12:获取到所述目标网络中的出口网关上报的第二运行数据,其中,所述第二运行数据为所述出口网关采集到的所述目标网络中的第一待监测网络设备上的数据,所述第一待监测网络设备为所述目标网络中与所述运维管理平台间接通信的设备。
所述目标网络中还存在不能与所述运维管理平台直接通信的第一待监测网络设备,对于所述第一待监测网络设备,可以通过出口网关获取到所述第一待监测网络设备的第二运行数据。其中,所述出口网关通常为网络出口级防火墙,也即,连接所述目标网络和因特网的外部防火墙。所述第一待监测网络设备是部署于网络中的AC(AccessController,接入控制器)、AF(Application Firewall,应用防火墙)、AD等数通设备。
由此,可以先由所述出口网关采集所述目标网络中第一待监测网络设备上的第二运行数据,并将采集到的第二运行数据上报给所述运维管理平台,所以所述运维管理平台需要获取所述出口网关上报的第二运行数据。
步骤S13:根据所述第一运行数据、所述第二运行数据以及预设的告警规则对所述目标网络中的设备进行运维。
可以理解的是,在运维管理平台获取到所述第一运行数据、所述第二运行数据之后,便可以根据所述第一运行数据、所述第二运行数据以及预设的告警规则对所述目标网络中的设备进行运维。
具体的,可以根据所述第一运行数据、所述第二运行数据以及预设的告警规则对所述目标网络中的设备进行告警,也可以对所述第一运行数据、所述第二运行数据进行统计分析、可视化显示以及入库存储等。
也即,根据所述第一运行数据、所述第二运行数据确定出所述目标网络中的设备的运行情况,在所述目标网络中的设备运行存在异常时,发出相应的告警,并对所述获取到的运行数据进行统计分析、可视化显示以及入库存储,以便运维人员可以直观的看到所述目标网络中设备的运行情况,以及后期可以根据存储的运行数据进行设备性能分析等操作。
可见,本申请先获取目标网络中EDR集中管理平台上报的第一运行数据,其中,所述第一运行数据为部署在所述目标网络中的待监测终端设备上的EDR终端代理采集并上报到所述EDR集中管理平台的数据,并获取到所述目标网络中的出口网关上报的第二运行数据,其中,所述第二运行数据为所述出口网关采集到的所述目标网络中的第一待监测网络设备上的数据,所述第一待监测网络设备为所述目标网络中与所述运维管理平台间接通信的设备,然后便可以根据所述第一运行数据、所述第二运行数据以及预设的告警规则对所述目标网络中的设备进行运维。由此可见,可以直接由运维管理平台获取EDR集中管理平台上传的待监测终端设备上的EDR终端代理采集到的运行数据,实现对目标网络中可以待监测终端设备的数据采集,并可以通过出口网关获取第一待监测网络设备上的运行数据,然后再由运维管理平台获取出口网关上传的运行数据,实现对目标网络中不能直接与运维管理平台通信的第一待监测网络设备的数据采集,然后运维管理平台便可以根据获取到的运行数据以及预设的告警规则对所述目标网络中的设备进行运维管控,这样运维管理平台便可以对目标网络中的各个设备进行集中运维管控,降低了运维复杂度,并提高了运维效率。
参见图3所示,本申请实施例公开了一种具体的运维方法,应用于运维管理平台,该方法包括:
步骤S21:获取预先配置的监控策略和告警规则,其中,所述监控策略包括监控数据类型、数据采集间隔。
在实际应用中,需要获取预先配置的监控策略和所述告警规则,其中,所述监控策略包括监控数据类型、数据采集间隔,所述告警规则包括告警条件以及告警抑制规则,告警条件也即运行数据满足什么条件时需要告警,包括告警阈值等,告警抑制规则表示相同告警发送的最大告警次数,告警频率等。
具体的,所述运维管理平台提供策略配置接口,支持用户自定义终端设备的监控数据类型、告警阈值、数据采集间隔等。所以需要先获取预先配置的监控策略以及告警规则,以便可以根据所述监控策略进行数据采集,根据所述告警规则判断所述目标网络中设备的运行是否存在异常,以及对运行异常的设备进行相应的告警等。
步骤S22:将所述监控策略下发至EDR集中管理平台和出口网关,以便所述EDR集中管理平台将所述监控策略下发到所述EDR集中管理平台对应的EDR终端代理。
可以理解的是,在获取到所述监控策略和所述告警规则之后,还需要将所述监控策略下发到EDR集中管理平台和出口网关,以便所述EDR集中管理平台将所述监控策略下发到所述EDR集中管理平台对应的EDR终端代理,这样所述EDR终端代理和所述出口网关便可以根据接收到的监控策略进行数据采集。
具体的,分别将所述监控策略下发至所述EDR集中管理平台的第一SDK(SoftwareDevelopment Kit,软件开发工具包)数据采集插件和所述出口网关的第二SDK数据采集插件中,以便所述出口网关中的第二SDK数据采集插件根据所述监控策略和简单网络管理协议(Simple Network Management Protocol,SNMP)采集所述第一待监测网络设备上的数据。
也即,所述出口网关和所述EDR集中管理平台上均部署有SDK数据采集插件,所述运维管理平台可以直接将所述监控策略下发到所述EDR集中管理平台的第一SDK数据采集插件和所述出口网关的第二SDK数据采集插件中。所述出口网关中的第二SDK数据采集插件便可以根据所述监控策略和简单网络管理协议采集所述第一待监测网络设备上的数据。
参见图4所示,为监控策略下发示意图。图中的“云图”也即所述运维管理平台。运维管理平台将监控策略分别下发至出口网关(AF,Application Firewall)以及EDR集中管理平台中,EDR集中管理平台再将接收到的监控策略下发到对应的EDR终端代理中,所述EDR终端代理便可以根据所述监控策略进行数据采集。在接收到所述监控策略之后,所述出口网关中的SDK数据采集插件也便可以根据所述监控策略和简单网络管理协议采集所述第一待监测网络设备上的数据。
步骤S23:获取目标网络中EDR集中管理平台上报的第一运行数据,其中,所述第一运行数据为部署在所述目标网络中的待监测终端设备上的EDR终端代理采集并上报到所述EDR集中管理平台的数据。
在所述EDR终端代理获取到所述监控策略之后,便可以根据所述监控策略中的监控数据类型采集相应类型的第一运行数据,并根据所述监控策略中的数据采集间隔进行第一运行数据的采集,并将采集到的数据上传到所述EDR集中管理平台,所述EDR集中管理平台便可以将实时获取到的第一运行数据上报到所述运维管理平台,所以所述运维管理平台便需要获取所述EDR集中管理平台上报的第一运行数据。
具体的,所述运维管理平台通过本地的KafKa获取目标网络中EDR集中管理平台上报的第一运行数据,并将所述第一运行数据存储到本地的ES数据库中。其中,KafKa为一种高吞吐量的分布式发布订阅消息***,可以处理消费者在网站中的所有动作流数据。ES(ElasticSearch)为一个分布式文档数据库,其中每个字段均可被索引,而且每个字段的数据均可被搜索。
步骤S24:获取到所述目标网络中的出口网关上报的第二运行数据,其中,所述第二运行数据为所述出口网关采集到的所述目标网络中的第一待监测网络设备上的数据,所述第一待监测网络设备为所述目标网络中与所述运维管理平台间接通信的设备。
相应地,所述出口网关在接收到所述监控策略之后,便可以根据所述监控策略通过SNMP协议采集第一待监测网络设备上的第二运行数据,并将采集到的第二运行数据上报到所述运维管理平台,所以所述运维管理平台便需要获取所述出口网关上报的第二运行数据。
具体的,所述运维管理平台通过本地的KafKa获取目标网络中出口网关上报的第二运行数据,并将所述第二运行数据存储到本地的ES数据库中。也即,所述运维管理平台获取运行数据具体是通过KafKa来获取的,并将获取到的运行数据存储到ES数据库中,这样kafka是一个数据通道,可以缓存数据。
步骤S25:获取所述目标网络中第二待监测网络设备上报的第三运行数据,其中,所述第三运行数据为所述第二待监测网络设备采集到的其自身的运行数据,所述第二待监测网络设备为与所述运维管理平台直接通信的设备。
在所述目标网络中还包括能与所述运维管理平台直接进行通信的第二待监测网络设备,所述第二待监测网络设备可以采集自身的运行数据,并将采集到的运行数据作为第三运行数据上报给所述运维管理平台,所以所述运维管理平台需要获取所述目标网络中第二待监测网络设备上报的第三运行数据。其中,所述第二待监测网络设备也为AD、AC、AF等。且所述第二待监测网络设备可以为所述出口网关,也即,所述出口网关可以采集自身的运行数据并上报所述运维管理平台。
当所述出口网关为出口防火墙,所述第二待监测网络设备为防火墙时。参见图5所示,为所述运维管理平台进行数据获取的部分示意图。出口防火墙(防火墙1)可以采集多个数通设备(也即多个第一待监测网络设备)上的运行数据。出口防火墙(防火墙1)从对应的数通设备上采集到运行数据之后,将采集到的运行数据上报给所述运维管理平台,所以所述运维管理平台便可以获取到所述出口网关上报的运行数据。防火墙2和3为所述第二待监测网络设备,需要将自身的运行数据上报到所述运维管理平台。
步骤S26:根据所述第一运行数据、所述第二运行数据、所述第三运行数据以及预设的告警规则对所述目标网络中的设备进行运维。
在获取到所述第一运行数据、所述第二运行数据以及所述第三运行数据之后,还需要根据所述第一运行数据、所述第二运行数据、所述第三运行数据以及预设的告警规则对所述目标网络中的设备进行运维。
具体的,就是需要根据所述第一运行数据、所述第二运行数据、所述第三运行数据以及预设的告警规则对所述目标网络中的设备的运行情况进行判定,当设备的运行情况出现异常时,进行相依的告警。
在具体的实施过程中,可以先对所述第一运行数据、所述第二运行数据以及所述第三运行数据进行解析,得到目标信息;根据所述目标信息确定出用户信息以及从预设的告警规则中确定目标告警规则;判断所述第一运行数据、所述第二运行数据以及所述第三运行数据是否满足所述目标告警规则中的告警条件;如果是,则根据所述用户信息发起应的告警。其中,所述目标信息包括设备信息和数据类型。所述用户信息中包括告警时用户的联系方式,如用户微信等,所述目标信息为所述目标网络中被监控设备的信息。
也即,需要先对所述第一运行数据、第二运行数据以及所述第三运行数据进行解析,得到对应的设备信息以及数据类型,然后便可以根据所述设备信息和数据类型确定出用户信息以及从预设的告警规则中确定出目标告警规则。在实际应用中,不同的设备以及不同数据对应的告警规则一般不相同,所以需要先得到对应的设备信息和数据类型,再根据设备信息和数据类型确定出目标告警规则,这样根据目标告警规则进行告警时,可以减少误告警的次数,提高告警准确率。
在确定出所述目标告警规则之后,便可以通过判断所述第一运行数据、所述第二运行数据以及所述第三运行数据是否满足所述目标告警规则中的告警条件,确定出设备是否存在异常,当满足所述目标告警规则中的告警条件时,表明对应的设备存在异常,可以根据所述用户信息发起相应的告警。
在实际应用中,为了防止同一个设备相同的告警连续发起多次,或者过于频繁的发起同一个设备的相同告警,所述告警规则中可以包括告警抑制规则,对同一个设备的相同告警的告警次数以及告警时间间隔作为限制。
当所述告警规则中包括告警抑制规则时,在所述第一运行数据、所述第二运行数据以及所述第三运行数据满足所述目标告警规则中的告警条件之后,根据所述用户信息发起对应的告警之前,还包括:如果所述第一运行数据、所述第二运行数据和/或所述第三运行数据满足所述目标告警规则中的告警条件,则根据数据库中存储的历史告警数据确定所述第一运行数据、所述第二运行数据和/或所述第三运行数据是否满足所述目标告警规则中的告警抑制规则;如果所述第一运行数据、所述第二运行数据和/或所述第三运行数据不满足所述目标告警规则中的告警抑制规则,则根据所述用户信息发起的告警。
例如,当所述第一运行数据、所述第二运行数据和/或所述第三运行数据满足所述目标告警规则中的告警条件之后,判断本次告警在过去预设时间之内向用户发出过的告警次数是否大于或等于预设告警次数阈值,如果否,则根据所述用户信息发起对应的告警。或者,当所述第一运行数据、所述第二运行数据和/或所述第三运行数据满足所述目标告警规则中的告警条件之后,判断本次告警距离上次向用户发出相同告警的时间间隔是否小于预设时间间隔,如果否,则根据所述用户信息发起对应的告警。
参见图6所示,为告警流程图。当从KafKa中读取出一条运维数据时,对读取出的运维数据进行解析,得到设备信息和数据类型,根据所述设备信息和数据类型获取到用户信息和告警设置(也即前述的目标告警规则),读取历史数据中告警周期内满足告警条件的数据,以便确定当前运维数据是否满足告警条件,如果满足,则获取用户该类告警信息在某周期内推送次数,判断所述推送次数是否满足告警限制,如果否,则记录告警次数,进行告警信息推动,然后对告警相关的数据进行入库存储。
步骤S27:对所述第一运行数据、所述第二运行数据和/或所述第三运行数据进行统计分析,并对统计分析结果进行可视化显示。
在实际应用中,还可以对所述第一运行数据、所述第二运行数据和/或所述第三运行数据进行统计分析,并对统计分析结果进行可视化显示,有利于运维人员了解所述目标网络中设备的运行情况以及进行设备维护。
参见图7所示,为所述运维方法的整体框架图。运维管理平台提供预设接口供用户进行监控策略等的配置,然后运维管理平台中的策略管理部分将监控策略下发到对应的设备,包括出口网关以及安装有EDR终端代理的设备,相应设备可以根据所述监控策略进行运行数据采集,并将采集到的数据上报的运维管理平台的KafKa中,还可以将运行数据作为告警数据存储到ES数据库中,并将告警数据传输到运维管理平台中的告警模块进行告警分析,并发出相应的告警信息,以及将告警数据传输到运维管理平台中的数据展示部分进行数据统计分析和可视化显示。
参见图8所示,本申请实施例公开了一种运维管理平台,包括:
第一数据采集模块11,用于获取目标网络中EDR集中管理平台上报的第一运行数据,其中,所述第一运行数据为部署在所述目标网络中的待监测终端设备上的EDR终端代理采集并上报到所述EDR集中管理平台的数据;;
第二数据采集模块12,用于获获取到所述目标网络中的出口网关上报的第二运行数据,其中,所述第二运行数据为所述出口网关采集到的所述目标网络中的第一待监测网络设备上的数据,所述第一待监测网络设备为所述目标网络中与所述运维管理平台间接通信的设备;
运维模块13,用于根据所述第一运行数据、所述第二运行数据以及预设的告警规则对所述目标网络中的设备进行运维。
可见,本申请先获取目标网络中EDR集中管理平台上报的第一运行数据,其中,所述第一运行数据为部署在所述目标网络中的待监测终端设备上的EDR终端代理采集并上报到所述EDR集中管理平台的数据,并获取到所述目标网络中的出口网关上报的第二运行数据,其中,所述第二运行数据为所述出口网关采集到的所述目标网络中的第一待监测网络设备上的数据,所述第一待监测网络设备为所述目标网络中与所述运维管理平台间接通信的设备,然后便可以根据所述第一运行数据、所述第二运行数据以及预设的告警规则对所述目标网络中的设备进行运维。由此可见,可以直接由运维管理平台获取EDR集中管理平台上传的待监测终端设备上的EDR终端代理采集到的运行数据,实现对目标网络中可以待监测终端设备的数据采集,并可以通过出口网关获取第一待监测网络设备上的运行数据,然后再由运维管理平台获取出口网关上传的运行数据,实现对目标网络中不能直接与运维管理平台通信的第一待监测网络设备的数据采集,然后运维管理平台便可以根据获取到的运行数据以及预设的告警规则对所述目标网络中的设备进行运维管控,这样运维管理平台便可以对目标网络中的各个设备进行集中运维管控,降低了运维复杂度,并提高了运维效率。
进一步的,所述运维装置,还包括:
第三数据采集模块,用于获取所述目标网络中第二待监测网络设备上报的第三运行数据,其中,所述第三运行数据为所述第二待监测网络设备采集到的其自身的运行数据,所述第二待监测网络设备为与所述运维管理平台直接通信的设备;
相应地,所述运维模块13,用于:根据所述第一运行数据、所述第二运行数据、所述第三运行数据以及预设的告警规则对所述目标网络中的设备进行运维。
进一步的,所述运维模块13,用于:
根据所述第一运行数据、所述第二运行数据、所述第三运行数据以及预设的告警规则对所述目标网络中的设备进行告警;
对所述第一运行数据、所述第二运行数据和/或所述第三运行数据进行统计分析,并对统计分析结果进行可视化显示。
进一步的,所述运维模块13,用于:
对所述第一运行数据、所述第二运行数据以及所述第三运行数据进行解析,得到目标信息;
根据所述目标信息确定出用户信息以及从预设的告警规则中确定目标告警规则;
判断所述第一运行数据、所述第二运行数据以及所述第三运行数据是否满足所述目标告警规则中的告警条件;
如果是,则根据所述用户信息发起对应的告警。
进一步的,所述运维模块13,用于:
在所述第一运行数据、所述第二运行数据和/或所述第三运行数据满足所述目标告警规则中的告警条件时,则根据数据库中存储的历史告警数据确定所述第一运行数据、所述第二运行数据和/或所述第三运行数据是否满足所述目标告警规则中的告警抑制规则;
如果所述第一运行数据、所述第二运行数据和/或所述第三运行数据不满足所述目标告警规则中的告警抑制规则,则根据所述用户信息发起对应的告警。
具体的,所述运维管理平台,还包括:
策略获取模块,用于获取预先配置的监控策略和所述告警规则,其中,所述监控策略包括监控数据类型、数据采集间隔;
策略下发模块,用于将所述监控策略下发至所述EDR集中管理平台和所述出口网关,以便所述EDR集中管理平台将所述监控策略下发到所述EDR集中管理平台对应的EDR终端代理。
具体的,所述策略下发模块,用于:
分别将所述监控策略下发至所述EDR集中管理平台的第一SDK数据采集插件和所述出口网关的第二SDK数据采集插件中,以便所述出口网关中的第二SDK数据采集插件根据所述监控策略和简单网络管理协议采集所述第一待监测网络设备上的数据。
参见图9所示,为本申请实施例提供的一种电子设备20的结构示意图,该电子设备20能够实现前述实施例中公开的运维方法。
通常,本实施例中的电子设备20包括:处理器21和存储器22。
其中,处理器21可以包括一个或多个处理核心,比如四核心处理器、八核心处理器等。处理器21可以采用DSP(digital signal processing,数字信号处理)、FPGA(field-programmable gate array,现场可编程们阵列)、PLA(programmable logic array,可编程逻辑阵列)中的至少一种硬件来实现。处理器21也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(central processing unit,中应处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器21可以集成有GPU(graphics processing unit,图像处理器),GPU用于负责显示屏所需要显示的图像的渲染和绘制。一些实施例中,处理器21可以包括AI(artificialintelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器22可以包括一个或多个计算机可读存储介质,计算机可读存储介质可以是非暂态的。存储器22还可以包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。本实施例中,存储器22至少用于存储以下计算机程序221,其中,该计算机程序被处理器21加载并执行之后,能够实现前述任一实施例中公开的运维方法步骤。
在一些实施例中,电子设备20还可包括有显示屏23、输入输出接口24、通信接口25、传感器26、电源27以及通信总线28。
本技术领域人员可以理解,图9中示出的结构并不构成对电子设备20的限定,可以包括比图示更多或更少的组件。
进一步的,本申请实施例还公开了一种计算机可读存储介质,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现前述任一实施例中公开的运维方法。
其中,关于上述运维方法的具体过程可以参考前述实施例中公开的相应内容,在此不再进行赘述。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
最后,还需要说明的是,在本文中,诸如第一和第二之类的关系术语仅仅用来将一个实体或者操作与另一个实体或者操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得一系列包含其他要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本申请所提供的一种运维方法、运维管理平台、设备、介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (10)

1.一种运维方法,其特征在于,应用于运维管理平台,包括:
获取目标网络中EDR集中管理平台上报的第一运行数据,其中,所述第一运行数据为部署在所述目标网络中的待监测终端设备上的EDR终端代理采集并上报到所述EDR集中管理平台的数据;
获取到所述目标网络中的出口网关上报的第二运行数据,其中,所述第二运行数据为所述出口网关采集到的所述目标网络中的第一待监测网络设备上的数据,所述第一待监测网络设备为所述目标网络中与所述运维管理平台间接通信的设备;
根据所述第一运行数据、所述第二运行数据以及预设的告警规则对所述目标网络中的设备进行运维。
2.根据权利要求1所述的运维方法,其特征在于,还包括:
获取所述目标网络中第二待监测网络设备上报的第三运行数据,其中,所述第三运行数据为所述第二待监测网络设备采集到的其自身的运行数据,所述第二待监测网络设备为与所述运维管理平台直接通信的设备;
相应地,所述根据所述第一运行数据、所述第二运行数据以及预设的告警规则对所述目标网络中的设备进行运维,具体包括:
根据所述第一运行数据、所述第二运行数据、所述第三运行数据以及预设的告警规则对所述目标网络中的设备进行运维。
3.根据权利要求2所述的运维方法,其特征在于,所述根据所述第一运行数据、所述第二运行数据、所述第三运行数据以及预设的告警规则对所述目标网络中的设备进行运维,包括:
根据所述第一运行数据、所述第二运行数据、所述第三运行数据以及预设的告警规则对所述目标网络中的设备进行告警;
对所述第一运行数据、所述第二运行数据和/或所述第三运行数据进行统计分析,并对统计分析结果进行可视化显示。
4.根据权利要求3所述的运维方法,其特征在于,所述根据所述第一运行数据、所述第二运行数据、所述第三运行数据以及预设的告警规则对所述目标网络中的设备进行告警,包括:
对所述第一运行数据、所述第二运行数据以及所述第三运行数据进行解析,得到目标信息;
根据所述目标信息确定出用户信息以及从预设的告警规则中确定目标告警规则;
判断所述第一运行数据、所述第二运行数据以及所述第三运行数据是否满足所述目标告警规则中的告警条件;
如果是,则根据所述用户信息发起对应的告警。
5.根据权利要求4所述的运维方法,其特征在于,所述根据所述用户信息发起对应的告警之前,还包括:
如果所述第一运行数据、所述第二运行数据和/或所述第三运行数据满足所述目标告警规则中的告警条件,则根据数据库中存储的历史告警数据确定所述第一运行数据、所述第二运行数据和/或所述第三运行数据是否满足所述目标告警规则中的告警抑制规则;
如果所述第一运行数据、所述第二运行数据和/或所述第三运行数据不满足所述目标告警规则中的告警抑制规则,则根据所述用户信息发起对应的告警。
6.根据权利要求1至5中任一项所述的运维方法,其特征在于,在获取上报的第一运行数据以及上报的第二运行数据之前,还包括:
获取预先配置的监控策略和所述告警规则,其中,所述监控策略包括监控数据类型、数据采集间隔;
将所述监控策略下发至所述EDR集中管理平台和所述出口网关,以便所述EDR集中管理平台将所述监控策略下发到所述EDR集中管理平台对应的EDR终端代理。
7.根据权利要求6所述的运维方法,其特征在于,所述将所述监控策略下发至所述EDR集中管理平台和所述出口网关,包括:
分别将所述监控策略下发至所述EDR集中管理平台的第一SDK数据采集插件和所述出口网关的第二SDK数据采集插件中,以便所述出口网关中的第二SDK数据采集插件根据所述监控策略和简单网络管理协议采集所述第一待监测网络设备上的数据。
8.一种运维管理平台,其特征在于,包括:
第一数据采集模块,用于获取目标网络中EDR集中管理平台上报的第一运行数据,其中,所述第一运行数据为部署在所述目标网络中的待监测终端设备上的EDR终端代理采集并上报到所述EDR集中管理平台的数据;
第二数据采集模块,用于获取到所述目标网络中的出口网关上报的第二运行数据,其中,所述第二运行数据为所述出口网关采集到的所述目标网络中的第一待监测网络设备上的数据,所述第一待监测网络设备为所述目标网络中与所述运维管理平台间接通信的设备;
运维模块,用于根据所述第一运行数据、所述第二运行数据以及预设的告警规则对所述目标网络中的设备进行运维。
9.一种电子设备,其特征在于,包括:
存储器和处理器;
其中,所述存储器,用于存储计算机程序;
所述处理器,用于执行所述计算机程序,以实现权利要求1至7任一项所述的运维方法。
10.一种计算机可读存储介质,其特征在于,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的运维方法。
CN202011310314.3A 2020-11-20 2020-11-20 一种运维方法、运维管理平台、设备及介质 Active CN112532435B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011310314.3A CN112532435B (zh) 2020-11-20 2020-11-20 一种运维方法、运维管理平台、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011310314.3A CN112532435B (zh) 2020-11-20 2020-11-20 一种运维方法、运维管理平台、设备及介质

Publications (2)

Publication Number Publication Date
CN112532435A CN112532435A (zh) 2021-03-19
CN112532435B true CN112532435B (zh) 2023-09-08

Family

ID=74981968

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011310314.3A Active CN112532435B (zh) 2020-11-20 2020-11-20 一种运维方法、运维管理平台、设备及介质

Country Status (1)

Country Link
CN (1) CN112532435B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113905407B (zh) * 2021-06-29 2023-12-15 苏州亿尔奇信息科技有限公司 分布式无线组网中的终端设备监控信息采集方法及***
CN114143077B (zh) * 2021-11-29 2023-11-10 北京天融信网络安全技术有限公司 一种终端安全防护方法及装置
CN115834434B (zh) * 2023-02-07 2024-01-26 阿里巴巴(中国)有限公司 网络设备控制方法、控制服务器、代理设备和通信网络

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102185716A (zh) * 2011-05-05 2011-09-14 广东天波信息技术股份有限公司 一种通信设备通用管理方法及***
CN107612761A (zh) * 2017-11-06 2018-01-19 成都西加云杉科技有限公司 网络设备告警方法及告警管理装置
CN111026621A (zh) * 2019-12-23 2020-04-17 杭州安恒信息技术股份有限公司 面向Elasticsearch集群的监控报警方法、装置、设备、介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102185716A (zh) * 2011-05-05 2011-09-14 广东天波信息技术股份有限公司 一种通信设备通用管理方法及***
CN107612761A (zh) * 2017-11-06 2018-01-19 成都西加云杉科技有限公司 网络设备告警方法及告警管理装置
CN111026621A (zh) * 2019-12-23 2020-04-17 杭州安恒信息技术股份有限公司 面向Elasticsearch集群的监控报警方法、装置、设备、介质

Also Published As

Publication number Publication date
CN112532435A (zh) 2021-03-19

Similar Documents

Publication Publication Date Title
CN112532435B (zh) 一种运维方法、运维管理平台、设备及介质
US7467067B2 (en) Self-learning integrity management system and related methods
CN109088775B (zh) 异常监控方法、装置以及服务器
CN111694718A (zh) 内网用户异常行为识别方法、装置、计算机设备及可读存储介质
CN110347694B (zh) 一种基于物联网的设备监控方法、装置及***
CN108880845A (zh) 一种信息提示的方法以及相关装置
CN114358106A (zh) ***异常检测方法、装置、计算机程序产品及电子设备
CN108809720A (zh) 云数据***中告警任务的管理方法和装置
CN112948223A (zh) 一种监测运行情况的方法和装置
CN115622867A (zh) 一种工控***安全事件预警分类方法及***
CN110399405A (zh) 日志报警方法、装置、***及存储介质
CN110647086B (zh) 一种基于运行大数据分析的智能运维监控***
CN107612755A (zh) 一种云资源的管理方法及其装置
CN112904921A (zh) 基于物联网的实时监测监管***
CN107911229A (zh) 运行状态改变的提醒方法、装置、电子设备及存储介质
CN110677271A (zh) 基于elk的大数据告警方法、装置、设备及存储介质
CN115222181B (zh) 机器人运营状态监控***及方法
CN116112342A (zh) 告警信息处理方法、装置、电子设备以及存储介质
CN116205624A (zh) 基于数字孪生的设备运行管理方法及相关产品
CN114398222A (zh) 一种声明式可视化配置Prometheus监控告警的方法
CN115145902A (zh) 数据处理方法,装置,存储介质以及电子设备
CN114661562A (zh) 一种数据告警方法、装置、设备及介质
CN113342625A (zh) 一种数据监控方法及***
CN107566187B (zh) 一种sla违例监测方法、装置和***
CN118158134A (zh) 一种服务器***巡检方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant