CN111447109A - 监控管理设备及方法、计算机可读存储介质 - Google Patents

监控管理设备及方法、计算机可读存储介质 Download PDF

Info

Publication number
CN111447109A
CN111447109A CN202010206003.6A CN202010206003A CN111447109A CN 111447109 A CN111447109 A CN 111447109A CN 202010206003 A CN202010206003 A CN 202010206003A CN 111447109 A CN111447109 A CN 111447109A
Authority
CN
China
Prior art keywords
monitoring
alarm
monitored
protocol
monitored equipment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010206003.6A
Other languages
English (en)
Other versions
CN111447109B (zh
Inventor
齐航
李宏岩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BOE Technology Group Co Ltd
Original Assignee
BOE Technology Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BOE Technology Group Co Ltd filed Critical BOE Technology Group Co Ltd
Priority to CN202010206003.6A priority Critical patent/CN111447109B/zh
Publication of CN111447109A publication Critical patent/CN111447109A/zh
Application granted granted Critical
Publication of CN111447109B publication Critical patent/CN111447109B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/12Network monitoring probes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/02Standardisation; Integration
    • H04L41/022Multivendor or multi-standard integration
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0604Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0604Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time
    • H04L41/0609Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time based on severity or priority
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/22Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks comprising specially adapted graphical user interfaces [GUI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/04Processing captured monitoring data, e.g. for logfile generation
    • H04L43/045Processing captured monitoring data, e.g. for logfile generation for graphical visualisation of monitoring data

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Human Computer Interaction (AREA)
  • Computer And Data Communications (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种监控管理设备及方法、计算机可读存储介质。该监控管理设备的一具体实施方式包括:监控引擎、数据库、多个不同监控协议的采集器;所述监控引擎配置为:为被监控设备的监控协议接口添加被监控设备的唯一的标识;利用采集器通过被监控设备相应的监控协议接口采集监控数据;将通过监控协议接口标识确定所属被监控设备的监控数据存储于所述数据库中。该实施方式可实现对多个被监控设备的多种不同监控协议的监控数据的统一采集,采集的不同监控协议的监控数据可以逻辑映射到所属被监控设备的物理设备,且不受监控协议及其数量的限制,实现了低成本、高保障的统一监控,减小了管理员的工作量。

Description

监控管理设备及方法、计算机可读存储介质
技术领域
本发明涉及计算机技术领域。更具体地,涉及一种监控管理设备及方法、计算机可读存储介质。
背景技术
目前,随着技术不断进步,各企业和组织对云计算的需求逐年增加,所需云计算基础设施(即云计算设备)的数量也不断上涨。同时云计算基础设施面向的领域逐步细分、专业程度不断增强,并开始向软件定义阶段迈进。因此在企业和组织中使用不同品牌和架构的云计算基础设施成为常态,随之带来的就是管理难度和成本的增加。云计算基础设施管理员不得不花费更多的时间和精力来维护大量不同品牌不同型号的云计算设备,如HPE、H3C、Huawei、Dell、浪潮等品牌的服务器、交换机、存储设备、防火墙设备等。通常来说,管理员使用如下协议和方法对云计算基础设施进行监控:对于云计算设备上的BMC状态和传感器状态,使用IPMI协议进行监控;对于云计算设备上的BMC状态和操作***状态,使用SNMP协议进行监控;对于云计算设备上的BMC日志和操作***日志,使用Syslog协议对日志进行监控;对于云计算设备上的BMC状态,使用Redfish协议和RESTful API进行监控。
上述监控方案仅支持一种或有限的几种监控协议,若需要支持多种协议,管理员需搭建、配置并维护多套专用监控***,至少存在如下问题:第一、多种性能指标数据及日志数据在不同监控***中相分离且数据格式不统一,无法实时比对分析;第二、管理员需要额外维护多套监控***,没有真正降低***管理员的工作量;第三、管理员需对不同的监控***开放不同的网络权限,增加了安全风险且提高了管理成本;第四、多套监控***会在网络中传输过多的冗余数据,在业务高峰时期会对网络及设备本身带来压力。
因此,需要提供一种新的监控管理设备及方法、计算机可读存储介质。
发明内容
本发明的目的在于提供一种监控管理设备及方法、计算机可读存储介质,以解决现有技术存在的问题中的至少一个。
为达到上述目的,本发明采用下述技术方案:
本发明第一方面提供了一种监控管理设备,其特征在于,包括:监控引擎、数据库、多个不同监控协议的采集器;
所述监控引擎配置为:为被监控设备的监控协议接口添加被监控设备的唯一的标识;利用采集器通过被监控设备相应的监控协议接口采集监控数据;将通过监控协议接口标识确定所属被监控设备的监控数据存储于所述数据库中。
本发明第一方面提供的监控管理设备,可实现对多个被监控设备的多种不同监控协议的监控数据的统一采集,采集的不同监控协议的监控数据可以逻辑映射到所属被监控设备的物理设备,且不受监控协议及其数量的限制,实现了低成本、高保障的统一监控,减小了管理员的工作量。
可选地,所述监控引擎还配置为:通过查询CMDB,获取被监控设备支持的监控协议类型及被监控设备的监控协议接口。
可选地,所述监控引擎配置为为被监控设备的监控协议接口添加被监控设备的唯一的标识包括:根据被监控设备的监控协议接口调用对应的配置脚本和/或管理工具,以开启被监控设备的相应监控协议访问权限;通过相应的采集器向被监控设备的监控协议接口发送认证信息,并验证被监控设备的监控协议接口返回的确认信息,若验证通过,则解析确认信息,以建立被监控设备的逻辑设备与物理设备的映射关系,为被监控设备的监控协议接口添加被监控设备的唯一的标识。
采用上述可选方式,对IPMI、SNMP、Redfish、Syslog等通用监控协议或者说标准监控协议的监控数据,仅需一次性的配置就可由监控管理设备进行全量采集,监控管理设备对多个被监控设备的监控协议接口进行批量配置而管理员不必进行人工配置操作,可节省管理员的工作量。
可选地,所述监控引擎还配置为:响应于用户输入的IP地址范围,执行脚本以查找被监控设备及所述被监控设备开放的端口,并通过被监控设备开放的端口获取被监控设备的信息;根据被监控设备的信息将被监控设备归类。
采用此可选方式,监控管理设备可自动发现并归类网络中可被监控的设备,对需要监控管理的设备进行统一接入。
可选地,所述多个不同监控协议的采集器包括:IPMI协议采集器、SNMP协议采集器、Redfish协议采集器和Syslog协议采集器。
可选地,所述监控引擎配置为利用采集器通过被监控设备相应的监控协议接口采集监控数据包括:对于IPMI协议和SNMP协议,调用监控管理设备中预置的监控方案采集监控数据;对于Redfish协议,通过Redfish协议采集器向被监控设备的Redfish协议接口发送HTTP请求以采集监控数据;对于Syslog协议,通过Syslog协议被动接收由被监控设备的Syslog协议接口发送的监控数据。
此可选方式中,监控管理设备针对不同监控协议的监控数据,设置了不同的采集策略(主动采集、被动接收等)并可设置相应的采集周期。
可选地,所述监控引擎还配置为:对于未指明或私有类型的监控协议,通过调用由另设的计算机设备执行的脚本/工具,采集被监控设备的监控数据,将通过采集信息确定所属被监控设备的监控数据存储于所述数据库中。
可选地,该监控管理设备还包括数据解析模块,所述监控引擎配置为通过调用由另设的计算机设备执行的脚本/工具,采集被监控设备的监控数据,将通过采集信息确定所属被监控设备的监控数据存储于所述数据库中包括:确认并注册需要采用脚本/工具采集监控数据的被监控设备;定期地向用于执行脚本/工具的另设的计算机设备发送执行请求,以使得所述计算机设备执行脚本/工具以启动采集被监控设备的监控数据并在采集后生成包含采集信息和监控数据的JSON格式数据,所述数据解析模块对JSON格式数据进行解析;根据解析得到的采集信息确定解析得到的监控数据所属的被监控设备,并将解析得到的监控数据存储于所述数据库中。
采用上述可选方式,监控管理设备可对自定义的监控协议或非标准的监控协议进行数据适配并解析,使得管理员可通过编写脚本/工具监控自定义的监控数据。结合IPMI协议采集器、SNMP协议采集器、Redfish协议采集器和Syslog协议采集器等标准监控协议的采集器,可实现采集被监控设备的全部类型的监控数据。
可选地,所述数据库包括时序数据库和图数据库,所述监控引擎配置为将通过监控协议接口标识确定所属被监控设备的监控数据存储于所述数据库中包括:将结构化的监控数据存储于时序数据库中,将非结构化的监控数据存储于图数据库中。
可选地,该监控管理设备还包括API接口,所述监控引擎还配置为:响应于用户的监控数据查询请求,查找数据库中存储的监控数据并通过所述API接口输出。
采用上述可选方式,监控管理设备可通过图表等可视化界面展示全部监控协议类型在不同查询范围(例如不同时间范围)内的监控数据。
可选地,该监控管理设备还包括告警处理模块和至少一个发送类型的告警事件发送接口,所述监控引擎还配置为:判定监控数据中的指标信息是否超过预设阈值,若是,则生成告警消息并添加入告警消息队列;所述告警处理模块配置为:对具有相同键、值或键值或符合预设规则的告警消息进行压缩合并以生成作为告警事件的一条告警信息;根据告警事件包含的告警消息的类型和数量,加权计算告警事件的告警紧急程度,并根据告警紧急程度判断告警发送策略;根据告警发送策略,通过相应的告警事件发送接口发送告警信息。
采用此可选方式,监控管理设备在侦测到有大量异常监控数据时,能够对异常监控数据进行排重、抑制、汇总等,解决了现有监控方案在发生大规模网络故障时会产生告警风暴的问题,进而还可自动对引起异常的根本原因进行判断,以产生有效的告警信息通知管理员。
可选地,所述告警处理模块还配置为:根据是否发送成功,将已发送的告警信息标记为已发送未处理或发送失败;所述监控引擎还配置为:判断下一采集周期中采集得到的已生成告警消息的监控数据中的指标信息是否超过阈值,若否,则将所述已发送的告警信息的标记更改为已解决;所述告警处理模块还配置为:检查已标记的告警信息在预设时段内是否被更改为已解决,若否,则重新通过相应的告警事件发送接口发送告警信息。
采用此可选方式,监控管理设备可对长时间未处理的告警信息进行重复发送提醒。
可选地,所述被监控设备为云计算设备,包括服务器、存储设备、交换机和防火墙设备。
本发明第二方面提供了一种本发明第一方面提供的监控管理设备执行的监控管理方法,包括:
为被监控设备的监控协议接口添加被监控设备的唯一的标识;
利用不同监控协议的采集器,通过被监控设备相应的监控协议接口采集监控数据;
将通过监控协议接口标识确定所属被监控设备的监控数据存储于所述数据库中。
本发明第三方面提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明第二方面提供的方法。
本发明的有益效果如下:
本发明所述技术方案可实现对多个被监控设备的多种不同监控协议的监控数据的统一采集,采集的不同监控协议的监控数据可以逻辑映射到所属被监控设备的物理设备,且不受监控协议及其数量的限制,实现了低成本、高保障的统一监控,减小了管理员的工作量。
附图说明
下面结合附图对本发明的具体实施方式作进一步详细的说明:
图1示出本发明实施例提供的监控管理设备的示意图。
图2示出本发明实施例提供的监控管理方法的流程图。
图3示出实现本发明实施例提供的监控管理设备的计算机***的结构示意图。
具体实施方式
为了更清楚地说明本发明,下面结合优选实施例和附图对本发明做进一步的说明。附图中相似的部件以相同的附图标记进行表示。本领域技术人员应当理解,下面所具体描述的内容是说明性的而非限制性的,不应以此限制本发明的保护范围。
下面先对本发明涉及的技术用于进行简要说明。
带外管理:一种使用专用管理接口或串行端口来管理设备的一种方式。带外管理允许管理员通过远程控制方式对设备进行非物理接触式地监控和管理。
BMC(Baseboard Management Controller,基板管理控制器):嵌入在主板上的微控制器,BMC管理***软件和硬件平台间的接口。主板上不同类型的传感器将通过专用总线将数据报告至BMC,上报参数包括温度、风扇转速、功率消耗等。管理员可通过BMC与设备进行远程通信并在一定程度上控制设备运行状态,如开关机、重启、介入操作***等。
IPMI(Intelligent Platform Management Interface,智能平台管理界面):一组独立提供主机***管理和监控功能的自治***接口。IPMI定义了***管理员在带外管理的一组接口并监视主机的运行情况。IPMI可用于通过独立的硬件实现在主机操作***之外对主机进行开关机、挂载ISO镜像、安装操作***等功能。
SNMP(Simple Network Management Protocol,简单网络管理协议):专门设计用于在IP网络管理网络节点(服务器、工作站、路由器、交换机及HUBS等)的一种标准协议,它是一种应用层协议。网络管理***运行应用程序,以该应用程序监视并控制被管理的设备。被管理的设备是一个网络节点,它包含一个存在于被管理的网络中的SNMP代理。被管理的设备通过管理信息库(MIB)收集并存储管理信息,并且让网络管理***能够通过SNMP代理取得这信息。SNMP代理是一种存在于被管理的设备中的网络管理软件模块。代理者控制本地机器的管理信息,以和SNMP兼容的格式传送这项信息。
Redfish:一种管理标准,它使用超媒体RESTful接口的数据模型表示法。此模型以标准的机器可读模式表示,其消息负载以JSON来表示。协议本身利用了OData v4版本。Redfish API是超媒体API,可通过统一的接口来表示各种实现。Redfish API提供数据中心资源管理、事件处理、长时间任务以及发现等机制。
Syslog:常被称为***日志或***记录,是一种用来在互联网协议(TCP/IP)的网络中传递日志消息的标准,常用来指涉实际的syslog协议,或者那些提交syslog消息的应用程序或数据库。syslog协议属于一种主从式协议:syslog发送端会发送出一个小的文字消息(小于1024字节)到syslog接收端。接收端通常名为“syslogd”、“syslog daemon”或syslog服务器。***日志消息可以被以UDP协议及╱或TCP协议来发送。
CI(Configuration item,配置项):IT资产或可取决于具有与其它IT流程的关系IT资产的组合。配置项包括软件版本和型号,硬件和制造商规格以及其他技术细节,例如网络连接速度和数据存储大小等。
CMDB(Configuration Management Database,配置管理数据库):一个逻辑数据库,包含了配置项全生命周期的信息以及配置项之间的关系(包括物理关系、实时通信关系、非实时通信关系和依赖关系)。配置管理数据库对所有的IT组件、组件的不同版本和状态,以及组件之间的关系进行跟踪。
时序数据库:全称为时间序列数据库。时间序列数据库主要用于指处理带时间标签(按照时间的顺序变化,即时间序列化)的数据,带时间标签的数据也称为时间序列数据。时序数据库主要用于对实时监控数据的存储,其存储数据的典型特点是:产生频率快、对采集时间强依赖、采集点多、数据量大。
本发明一个实施例提供了一种监控管理设备,作为如图1所示的统一监控***,包括:监控引擎、数据库、多个不同监控协议的采集器;
所述监控引擎配置为:为被监控设备的监控协议接口添加被监控设备的唯一的标识;利用采集器通过被监控设备相应的监控协议接口采集监控数据;将通过监控协议接口标识确定所属被监控设备的监控数据存储于所述数据库中。
本实施例提供的监控管理设备,可实现对多个被监控设备的多种不同监控协议的监控数据的统一采集,采集的不同监控协议的监控数据可以逻辑映射到所属被监控设备的物理设备,且不受监控协议及其数量的限制,实现了低成本、高保障的统一监控,减小了管理员的工作量。
本实施例中,监控管理设备可以是服务器,也可以是性能可达到要求的计算机。
本实施例中,所述被监控设备为云计算设备,包括服务器、存储设备、交换机和防火墙设备。另外,除了对云计算基础设施的监控外,本实施例提供的监控管理设备还可用于对各种计算机设备的监控,例如在运营商机房中部署至少一个本实施例提供的监控管理设备,以对机房中的服务器、存储设备、交换机、防火墙设备等各种计算机设备进行监控。
在本实施例的一些可选的实现方式中,所述多个不同监控协议的采集器包括:IPMI协议采集器、SNMP协议采集器、Redfish协议采集器和Syslog协议采集器。
在本实施例的一些可选的实现方式中,所述监控引擎还配置为:响应于用户输入的IP地址范围,执行脚本以查找被监控设备及所述被监控设备开放的端口,并通过被监控设备开放的端口获取被监控设备的信息;根据被监控设备的信息将被监控设备归类。
采用此实现方式,监控管理设备可自动发现并归类网络中可被监控的设备,对需要监控管理的设备进行统一接入。
在一个具体示例中,监控引擎响应于用户指定需要监控的云计算设备的IP地址范围,在该IP地址范围内执行NMAP工具(NMAP是一个开源的扫描工具),以查找在线的被监控设备及所述被监控设备开放的端口(例如,扫描主机的65536个端口以检查开放且可用的端口),然后向这些开放的端口发送一系列网络包以检测被监控设备的操作***类型及版本等信息;之后,监控引擎收集被监控设备返回的信息,并根据被监控设备的信息是否相同或符合预设规则而将被监控设备归类。
在本实施例的一些可选的实现方式中,所述监控引擎还配置为:通过查询CMDB,获取被监控设备支持的监控协议类型及被监控设备的监控协议接口。
在本实施例的一些可选的实现方式中,所述监控引擎配置为为被监控设备的监控协议接口添加被监控设备的唯一的标识包括:根据被监控设备的监控协议接口调用对应的配置脚本和/或管理工具,以开启被监控设备的相应监控协议访问权限;通过相应的采集器向被监控设备的监控协议接口发送认证信息,并验证被监控设备的监控协议接口返回的确认信息,若验证通过,则解析确认信息,以建立被监控设备的逻辑设备与物理设备的映射关系,为被监控设备的监控协议接口添加被监控设备的唯一的标识。
采用上述实现方式,对IPMI、SNMP、Redfish、Syslog等通用监控协议或者说标准监控协议的监控数据,仅需一次性的配置就可由监控管理设备进行全量采集,监控管理设备对多个被监控设备的监控协议接口进行批量配置而管理员不必进行人工配置操作,可节省管理员的工作量。
在一个具体示例中,
监控引擎在CMDB中查询被监控设备支持的通用监控协议和私有监控协议,由CMDB返回一个支持协议的列表,监控引擎根据该列表获取被监控设备支持的监控协议类型及被监控设备的监控协议接口,之后,监控引擎创建被监控设备的物理设备对象并添加支持的协议属性;其中,若某被监控设备不提供任何类型的监控协议接口则列表中的返回值含义为“空”,监控引擎不会创建该被监控设备的物理设备对象,并将此信息记录在日志中;另外,监控引擎还可通过解析外部配置文件或直接由管理员录入的方式获取包含各云计算设备分别支持的协议的列表,其中,由管理员录入的方式的缺点时管理员工作量大,解析外部配置文件的方式虽可减小管理员工作量,但在环境变更后需要更新配置文件并重新读取,因此,这两种方式均不及令监控引擎在CMDB中自动查询的方式;
之后,监控引擎根据获取的被监控设备的监控协议接口,自动调用对应的配置脚本和/或专用管理工具,以开启被监控设备上的相应监控协议访问权限;其中,如果需要监控被监控设备的操作***,则需要根据操作***类型在被监控设备中安装专用Agent程序,此Agent程序采集操作***的信息后发送至监控管理设备;
开启访问权限后,监控引擎通过相应的采集器向需要监控的被监控设备的监控协议接口发送认证信息,并由采集器验证被监控设备的监控协议接口返回的确认信息,若确认消息为预期的正确结果,则判定协议访问权限开启成功且可用,若确认消息非预期结果会提示错误并继续尝试三次,尝试三次仍未成功连接则提示连接失败(例如在监控管理设备的Web页面上给出连接失败提示),此时需要管理员查看具体原因;其中,对于发送认证消息和验证确认消息的方式,各项监控协议在设计之初就已经定义了发出连接和确认连接的格式,所以标准协议的成功、失败的返回格式都是标准而且统一的,例如,当客户端向服务端发起一条HTTP请求时,如果成功,服务端会返回200;如果失败,则会返回4xx、5xx之类的数字代码,每一种监控协议的内容格式不尽相同,但认证原理基本类似;另外,对于特殊协议的认证需要由脚本程序配合完成;
之后,对于确认消息验证通过的监控协议接口,监控引擎根据主机自动解析确认消息并建立被监控设备的逻辑设备与物理设备的映射关系,具体过程为使用正则表达式提取确认信息中包括但不限于设备名称、IP地址、***版本等信息后进行比对,若设备名称、IP地址、***版本等信息一致或符合预设规则,则确认信息将被认为是由同一被监控设备产生。由此,监控引擎将对这些确认信息的来源端(即监控协议接口)打上相同的被监控设备的唯一的标签以实现多种数据来源的映射。其中,物理设备是存在于现实世界中的物理实体,例如一台具有金属外壳的服务器;逻辑设备则是运行于物理实体之中的软件***,例如服务器中运行的Linux操作***、BMC中运行的管理***等;一台服务器中会安装标准的操作***,可能是Linux、Windows或ESXi;而同时服务器中还有BMC控制器,用来控制整机的电源等状态,BMC是和操作***完全解耦的,也就是说,服务器运行的操作***和BMC是两个不同的逻辑设备,它们所使用的IP地址也是不同的,但它们被设计在同一台物理设备中,经过上述映射即可把操作***和BMC这两个不同的逻辑设备映射到同一个服务器中。另外,关于此处的预设规则,其与前述的根据被监控设备的信息是否相同或符合预设规则而将被监控设备归类中的预设规则遵从一套规则体系,例如,在服务器上架时,会预先定义好操作***和BMC的hostname(主机名),比如操作***的主机名是V001-1-2-3-4,代表它是一台虚拟化(Virtual)主机,IP地址是1.2.3.4;BMC的主机名是MV001-5-6-7-8,意思是001这台虚拟化主机的管理地址为5.6.7.8。在做匹配时,就会比较两者的用途和流水号是否一致。
在本实施例的一些可选的实现方式中,所述监控引擎配置为利用采集器通过被监控设备相应的监控协议接口采集监控数据包括:对于IPMI协议和SNMP协议,调用监控管理设备中预置的监控方案采集监控数据(例如指标数据);对于Redfish协议,通过Redfish协议采集器向被监控设备的Redfish协议接口发送HTTP请求以采集监控数据;对于Syslog协议,通过Syslog协议被动接收由被监控设备的Syslog协议接口发送的监控数据(日志数据)。
此实现方式中,监控管理设备针对不同监控协议的监控数据,设置了不同的采集策略(主动采集、被动接收等)并可设置相应的采集周期。
在本实施例的一些可选的实现方式中,所述监控引擎还配置为:对于未指明或私有类型的监控协议,通过调用由另设的计算机设备执行的脚本/工具,采集被监控设备的监控数据,将通过采集信息确定所属被监控设备的监控数据存储于所述数据库中。
在本实施例的一些可选的实现方式中,该监控管理设备还包括数据解析模块,所述监控引擎配置为通过调用由另设的计算机设备执行的脚本/工具,采集被监控设备的监控数据,将通过采集信息确定所属被监控设备的监控数据存储于所述数据库中包括:确认并注册需要采用脚本/工具采集监控数据的被监控设备;定期地向用于执行脚本/工具的另设的计算机设备发送执行请求,以使得所述计算机设备执行脚本/工具以启动采集被监控设备的监控数据并在采集后生成包含采集信息和监控数据的JSON格式数据,所述数据解析模块对JSON格式数据进行解析;根据解析得到的采集信息确定解析得到的监控数据所属的被监控设备,并将解析得到的监控数据存储于所述数据库中。
采用上述实现方式,监控管理设备可对自定义的监控协议或非标准的监控协议进行数据适配并解析,使得管理员可通过编写脚本/工具监控自定义的监控数据。结合IPMI协议采集器、SNMP协议采集器、Redfish协议采集器和Syslog协议采集器等标准监控协议的采集器,可实现采集被监控设备的全部类型的监控数据。
由于部分被监控设备不具备脚本或工具的执行调用能力,因此可使用除监控管理设备和被监控设备之外的另设的计算机设备来执行专用工具或Shell/Python脚本以采集监控数据。在一个具体示例中,监控数据为指标数据,采集信息包括设备名称、时间戳和指标名称,则格式化的JSON格式数据包括设备名称、时间戳、指标名称、指标数据和监控管理设备地址。
在本实施例的一些可选的实现方式中,所述数据库包括时序数据库和图数据库,所述监控引擎配置为将通过监控协议接口标识确定所属被监控设备的监控数据存储于所述数据库中包括:将结构化的监控数据存储于时序数据库中,将非结构化的监控数据存储于图数据库中。
在本实施例的一些可选的实现方式中,该监控管理设备还包括API接口,所述监控引擎还配置为:响应于用户的监控数据查询请求,查找数据库中存储的监控数据并通过所述API接口输出。
采用上述实现方式,监控管理设备可通过图表等可视化界面展示全部监控协议类型在不同查询范围(例如不同时间范围)内的监控数据。
在一个具体示例中,监控引擎将各结构化指标数据存放在时序数据库中,日志等非结构化指标数据存放在图数据库中,并向外开放RESTful API接口提供查询功能。管理员使用Grafana图表展示工具查询目标时间范围内的监控数据时,Grafana调用监控管理设备提供的RESTful API接口查询对应时间范围内的监控数据,监控引擎根据查询内容分别在时序数据库或图数据库中查询相应的监控数据,并返回给Grafana,由预定义的展示面板进行展示。
在本实施例的一些可选的实现方式中,该监控管理设备还包括告警处理模块和至少一个发送类型的告警事件发送接口(例如邮件接口、短信接口、微信接口等),所述监控引擎还配置为:判定监控数据中的指标信息是否超过预设阈值,若是,则生成告警消息并添加入告警消息队列;所述告警处理模块配置为:对具有相同键、值或键值或符合预设规则的告警消息进行压缩合并以生成作为告警事件的一条告警信息;根据告警事件包含的告警消息的类型和数量,加权计算告警事件的告警紧急程度,并根据告警紧急程度判断告警发送策略;根据告警发送策略,通过相应的告警事件发送接口发送告警信息。
采用此实现方式,监控管理设备在侦测到有大量异常监控数据时,能够对异常监控数据进行排重、抑制、汇总等,解决了现有监控方案在发生大规模网络故障时会产生告警风暴的问题,进而还可自动对引起异常的根本原因进行判断,以产生有效的告警信息通知管理员。
在本实施例的一些可选的实现方式中,所述告警处理模块还配置为:根据是否发送成功,将已发送的告警信息标记为已发送未处理或发送失败;所述监控引擎还配置为:判断下一采集周期中采集得到的已生成告警消息的监控数据中的指标信息是否超过阈值,若否,则将所述已发送的告警信息的标记更改为已解决;所述告警处理模块还配置为:检查已标记的告警信息在预设时段内是否被更改为已解决,若否,则重新通过相应的告警事件发送接口发送告警信息。
采用此实现方式,监控管理设备可对长时间未处理的告警信息进行重复发送提醒。
在一个具体示例中,
监控引擎根据模板内定义的阈值对收到的监控数据进行判断,其中,若被监控设备的物理设备对象被标记为“不采集”,则丢弃已收到的监控数据;若一项指标数据超过阈值或触发预设规则,则生成一个告警消息并添加至告警消息队列;
告警处理处理模块检查消息队列中的告警消息,对具有相同键、值或键值对符合特定规则的告警消息进行压缩合并,合并后的告警事件仅会产生一条告警信息以待发送至管理员;其中,可压缩来自同一物理设备对象有关的告警消息为一条告警信息;还可压缩不同物理设备但是相同类型的告警消息,比如V001到V010这10台服务器同时关机;还压缩来自同一数据中心的被监控设备的告警消息为一条告警信息,比如北京数据中心的全部设备监控连接全都断开了,那么根据这些告警消息就可以判断可能不是所有物理设备都出现故障而很可能是监控管理设备到北京数据中心的网络出现故障。
基于监控模板中定义的不同类型告警事件的紧急程度,根据告警消息的类型和数量加权计算得到告警事件的告警紧急程度,然后根据紧急程度判断告警发送策略,例如所需使用的告警媒介,例如:提示信息仅发送邮件,轻微故障信息发送邮件和微信,严重故障信息发送邮件、微信和短信;由此,对已经产生的告警,能够根据告警紧急程度自动选择不同的媒介通知到管理员及相关责任人;
根据物理设备对象在CMDB中查询其关联的管理员和责任人后,通过告警事件发送接口向管理员和责任人的终端设备发送告警信息,若发送成功则将告警标记为“已发送但未处理”的状态,若未发送成功则标记为“发送失败”;
监控引擎继续判断下一采集周期中采集得到的已生成告警消息的监控数据中的指标信息是否超过阈值,若否,则意味着管理员已解决告警信息中产生的问题,另外,管理员还可根据预先定义的告警规则对其进行关闭,相应的,监控引擎将所述已发送的告警信息的标记更改为“已解决”或“已关闭”;同时,告警处理模块检查类型为“已发送但未处理”和“发送失败”的告警信息是否在预定义的时间周期内是否改变状态,若否,则重新向管理员及责任人发送告警信息,还可同时向预先定义的管理员主管发送告警信息,重复此步骤直到告警信息被标记为“已解决”或“已关闭”;由此,对长时间未处理的异常告警,监控管理设备可以通过不同媒介对管理员及其主管进行重复告警提醒。
综合上述,在一个具体示例中,本实施例提供的监控管理设备实现各功能的工作流程如下:
(1)监控初始化配置:
监控引擎响应于用户指定需要监控的云计算设备的IP地址范围,在该IP地址范围内执行NMAP工具,以查找在线的被监控设备及所述被监控设备开放的端口,然后向这些开放的端口发送一系列网络包以检测被监控设备的操作***类型及版本等信息;
监控引擎收集被监控设备返回的信息,并根据被监控设备的信息是否相同或符合预设规则而将被监控设备归类;
监控引擎在CMDB中查询被监控设备支持的通用监控协议和私有监控协议,由CMDB返回一个支持协议的列表,监控引擎根据该列表获取被监控设备支持的监控协议类型及被监控设备的监控协议接口,之后,监控引擎创建被监控设备的物理设备对象并添加支持的协议属性;其中,若某被监控设备不提供任何类型的监控协议接口则列表中的返回值含义为“空”,监控引擎不会创建该被监控设备的物理设备对象,并将此信息记录在日志中;
监控引擎根据获取的被监控设备的监控协议接口,自动调用对应的配置脚本和/或专用管理工具,以开启被监控设备上的相应监控协议访问权限;其中,如果需要监控被监控设备的操作***,则需要根据操作***类型在被监控设备中安装专用Agent程序,此Agent程序采集操作***的信息后发送至监控管理设备;
开启访问权限后,监控引擎通过相应的采集器向需要监控的被监控设备的监控协议接口发送认证信息,并由采集器验证被监控设备的监控协议接口返回的确认信息,若确认消息为预期的正确结果,则判定协议访问权限开启成功且可用,若确认消息非预期结果会提示错误并继续尝试三次,尝试三次仍未成功连接则提示连接失败;
对于确认消息验证通过的监控协议接口,监控引擎根据主机自动解析确认消息并建立被监控设备的逻辑设备与物理设备的映射关系,具体过程为使用正则表达式提取确认信息中包括但不限于设备名称、IP地址、***版本等信息后进行比对,若设备名称、IP地址、***版本等信息一致或符合预设规则,则确认信息将被认为是由同一被监控设备产生。由此,监控引擎将对这些确认信息的来源端(即监控协议接口)打上相同的被监控设备的唯一的标签以实现多种数据来源的映射。
(2)监控数据采集:
对于IPMI协议和SNMP协议,调用监控管理设备中预置的监控方案采集监控数据(例如指标数据);
对于Redfish协议,通过Redfish协议采集器向被监控设备的Redfish协议接口发送HTTP请求以采集监控数据;
对于Syslog协议,通过Syslog协议被动接收由被监控设备的Syslog协议接口发送的监控数据(日志数据);
对于未指明或私有类型的监控协议,通过调用由另设的计算机设备执行的脚本/工具,采集被监控设备的监控数据,将通过采集信息确定所属被监控设备的监控数据存储于所述数据库中,具体包括:
监控引擎首先确认需要使用采用脚本/工具采集监控数据的被监控设备,并对这些被监控设备进行注册;
监控引擎定期地向用于执行脚本/工具的另设的计算机设备(执行主机)发送开始执行请求,使得:执行主机收到请求后执行脚本/工具以启动采集流程,执行主机执行动作完毕收集到监控数据后生成一条包含有设备名称、时间戳、指标名称、指标数据和监控管理设备地址的格式化的JSON格式数据,将此JSON格式数据发送至监控管理设备;
数据解析模块收到由执行主机发送的JSON格式数据并对其内容进行解析,监控引擎根据解析得到的数据中指向的被监控设备将指标数据存入到对应被监控设备的逻辑数据库表中。
(3)监控数据展示:
监控引擎将各结构化指标数据存放在时序数据库中,日志等非结构化指标数据存放在图数据库中,并向外开放RESTful API接口提供查询功能;
管理员使用Grafana图表展示工具查询目标时间范围内的监控数据时,Grafana调用监控管理设备提供的RESTful API接口查询对应时间范围内的监控数据,监控引擎根据查询内容分别在时序数据库或图数据库中查询相应的监控数据,并返回给Grafana,由预定义的展示面板进行展示。
(4)告警信息发送:
监控引擎判定监控数据中的指标信息是否超过预设阈值,若是,则生成告警消息并添加入告警消息队列;
告警处理模块对具有相同键、值或键值或符合预设规则的告警消息进行压缩合并以生成作为告警事件的一条告警信息;
告警处理模块根据告警事件包含的告警消息的类型和数量,加权计算告警事件的告警紧急程度,并根据告警紧急程度判断告警发送策略;
告警处理模块根据物理设备对象在CMDB中查询其关联的管理员和责任人后,根据告警发送策略,通过相应的告警事件发送接口发送告警信息,若发送成功则将告警标记为“已发送但未处理”的状态,若未发送成功则标记为“发送失败”;
监控引擎继续判断下一采集周期中采集得到的已生成告警消息的监控数据中的指标信息是否超过阈值,若否,则意味着管理员已解决告警信息中产生的问题,另外,管理员还可根据预先定义的告警规则对其进行关闭,相应的,监控引擎将所述已发送的告警信息的标记更改为“已解决”或“已关闭”;
告警处理模块检查类型为“已发送但未处理”和“发送失败”的告警信息是否在预定义的时间周期内是否改变状态,若否,则重新向管理员及责任人发送告警信息,还可同时向预先定义的管理员主管发送告警信息,重复此步骤直到告警信息被标记为“已解决”或“已关闭”。
如图2所示,本发明的另一个实施例提供了一种监控管理设备执行的监控管理方法,包括:
为被监控设备的监控协议接口添加被监控设备的唯一的标识;
利用不同监控协议的采集器,通过被监控设备相应的监控协议接口采集监控数据;
将通过监控协议接口标识确定所属被监控设备的监控数据存储于所述数据库中。
在本实施例的一些可选的实现方式中,所述多个不同监控协议的采集器包括:IPMI协议采集器、SNMP协议采集器、Redfish协议采集器和Syslog协议采集器。
在本实施例的一些可选的实现方式中,在所述为被监控设备的监控协议接口添加被监控设备的唯一的标识之前,该方法还包括:响应于用户输入的IP地址范围,执行脚本以查找被监控设备及所述被监控设备开放的端口,并通过被监控设备开放的端口获取被监控设备的信息;根据被监控设备的信息将被监控设备归类。
在本实施例的一些可选的实现方式中,在所述为被监控设备的监控协议接口添加被监控设备的唯一的标识之前,该方法还包括:通过查询CMDB,获取被监控设备支持的监控协议类型及被监控设备的监控协议接口。
在本实施例的一些可选的实现方式中,所述为被监控设备的监控协议接口添加被监控设备的唯一的标识包括:根据被监控设备的监控协议接口调用对应的配置脚本和/或管理工具,以开启被监控设备的相应监控协议访问权限;通过相应的采集器向被监控设备的监控协议接口发送认证信息,并验证被监控设备的监控协议接口返回的确认信息,若验证通过,则解析确认信息,以建立被监控设备的逻辑设备与物理设备的映射关系,为被监控设备的监控协议接口添加被监控设备的唯一的标识。
在本实施例的一些可选的实现方式中,所述利用采集器通过被监控设备相应的监控协议接口采集监控数据包括:对于IPMI协议和SNMP协议,调用监控管理设备中预置的监控方案采集监控数据;对于Redfish协议,通过Redfish协议采集器向被监控设备的Redfish协议接口发送HTTP请求以采集监控数据;对于Syslog协议,通过Syslog协议被动接收由被监控设备的Syslog协议接口发送的监控数据。
在本实施例的一些可选的实现方式中,该方法还包括:对于未指明或私有类型的监控协议,通过调用由另设的计算机设备执行的脚本/工具,采集被监控设备的监控数据,将通过采集信息确定所属被监控设备的监控数据存储于所述数据库中。
在本实施例的一些可选的实现方式中,所述通过调用由另设的计算机设备执行的脚本/工具,采集被监控设备的监控数据,将通过采集信息确定所属被监控设备的监控数据存储于所述数据库中包括:确认并注册需要采用脚本/工具采集监控数据的被监控设备;定期地向用于执行脚本/工具的另设的计算机设备发送执行请求,以使得所述计算机设备执行脚本/工具以启动采集被监控设备的监控数据并在采集后生成包含采集信息和监控数据的JSON格式数据,所述数据解析模块对JSON格式数据进行解析;根据解析得到的采集信息确定解析得到的监控数据所属的被监控设备,并将解析得到的监控数据存储于所述数据库中。
在本实施例的一些可选的实现方式中,所述数据库包括时序数据库和图数据库,所述将通过监控协议接口标识确定所属被监控设备的监控数据存储于所述数据库中包括:将结构化的监控数据存储于时序数据库中,将非结构化的监控数据存储于图数据库中。
在本实施例的一些可选的实现方式中,该方法还包括:响应于用户的监控数据查询请求,查找数据库中存储的监控数据并通过所述API接口输出。
在本实施例的一些可选的实现方式中,该方法还包括:判定监控数据中的指标信息是否超过预设阈值,若是,则生成告警消息并添加入告警消息队列;所述告警处理模块配置为:对具有相同键、值或键值或符合预设规则的告警消息进行压缩合并以生成作为告警事件的一条告警信息;根据告警事件包含的告警消息的类型和数量,加权计算告警事件的告警紧急程度,并根据告警紧急程度判断告警发送策略;根据告警发送策略,通过相应的告警事件发送接口发送告警信息。
在本实施例的一些可选的实现方式中,该方法还包括:根据是否发送成功,将已发送的告警信息标记为已发送未处理或发送失败;所述监控引擎还配置为:判断下一采集周期中采集得到的已生成告警消息的监控数据中的指标信息是否超过阈值,若否,则将所述已发送的告警信息的标记更改为已解决;所述告警处理模块还配置为:检查已标记的告警信息在预设时段内是否被更改为已解决,若否,则重新通过相应的告警事件发送接口发送告警信息。
需要说明的是,本实施例提供的监控管理方法与上述监控管理设备的原理及工作流程相似,相关之处可以参照上述说明,在此不再赘述。
如图3所示,适于用来实现上述实施例提供的监控管理设备的计算机***,包括中央处理模块(CPU),其可以根据存储在只读存储器(ROM)中的程序或者从存储部分加载到随机访问存储器(RAM)中的程序而执行各种适当的动作和处理。在RAM中,还存储有计算机***操作所需的各种程序和数据。CPU、ROM以及RAM通过总线被此相连。输入/输入(I/O)接口也连接至总线。
以下部件连接至I/O接口:包括键盘、鼠标等的输入部分;包括诸如液晶显示器(LCD)等以及扬声器等的输出部分;包括硬盘等的存储部分;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分。通信部分经由诸如因特网的网络执行通信处理。驱动器也根据需要连接至I/O接口。可拆卸介质,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器上,以便于从其上读出的计算机程序根据需要被安装入存储部分。
特别地,根据本实施例,上文流程图描述的过程可以被实现为计算机软件程序。例如,本实施例包括一种计算机程序产品,其包括有形地包含在计算机可读介质上的计算机程序,上述计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分从网络上被下载和安装,和/或从可拆卸介质被安装。
附图中的流程图和示意图,图示了本实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或示意图中的每个方框可以代表一个模块、程序段或代码的一部分,上述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,示意图和/或流程图中的每个方框、以及示意和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
作为另一方面,本实施例还提供了一种非易失性计算机存储介质,该非易失性计算机存储介质可以是上述实施例中上述装置中所包含的非易失性计算机存储介质,也可以是单独存在,未装配入终端中的非易失性计算机存储介质。上述非易失性计算机存储介质存储有一个或者多个程序,当上述一个或者多个程序被一个设备执行时,使得上述设备:为被监控设备的监控协议接口添加被监控设备的唯一的标识;利用不同监控协议的采集器,通过被监控设备相应的监控协议接口采集监控数据;将通过监控协议接口标识确定所属被监控设备的监控数据存储于所述数据库中。
需要说明的是,在本发明的描述中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定,对于本领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动,这里无法对所有的实施方式予以穷举,凡是属于本发明的技术方案所引伸出的显而易见的变化或变动仍处于本发明的保护范围之列。

Claims (15)

1.一种监控管理设备,其特征在于,包括:监控引擎、数据库、多个不同监控协议的采集器;
所述监控引擎配置为:为被监控设备的监控协议接口添加被监控设备的唯一的标识;利用采集器通过被监控设备相应的监控协议接口采集监控数据;将通过监控协议接口标识确定所属被监控设备的监控数据存储于所述数据库中。
2.根据权利要求1所述的监控管理设备,其特征在于,所述监控引擎还配置为:通过查询CMDB,获取被监控设备支持的监控协议类型及被监控设备的监控协议接口。
3.根据权利要求2所述的监控管理设备,其特征在于,所述监控引擎配置为为被监控设备的监控协议接口添加被监控设备的唯一的标识包括:根据被监控设备的监控协议接口调用对应的配置脚本和/或管理工具,以开启被监控设备的相应监控协议访问权限;通过相应的采集器向被监控设备的监控协议接口发送认证信息,并验证被监控设备的监控协议接口返回的确认信息,若验证通过,则解析确认信息,以建立被监控设备的逻辑设备与物理设备的映射关系,为被监控设备的监控协议接口添加被监控设备的唯一的标识。
4.根据权利要求3所述的监控管理设备,其特征在于,所述监控引擎还配置为:响应于用户输入的IP地址范围,执行脚本以查找被监控设备及所述被监控设备开放的端口,并通过被监控设备开放的端口获取被监控设备的信息;根据被监控设备的信息将被监控设备归类。
5.根据权利要求1所述的监控管理设备,其特征在于,所述多个不同监控协议的采集器包括:IPMI协议采集器、SNMP协议采集器、Redfish协议采集器和Syslog协议采集器。
6.根据权利要求5所述的监控管理设备,其特征在于,所述监控引擎配置为利用采集器通过被监控设备相应的监控协议接口采集监控数据包括:对于IPMI协议和SNMP协议,调用监控管理设备中预置的监控方案采集监控数据;对于Redfish协议,通过Redfish协议采集器向被监控设备的Redfish协议接口发送HTTP请求以采集监控数据;对于Syslog协议,通过Syslog协议被动接收由被监控设备的Syslog协议接口发送的监控数据。
7.根据权利要求6所述的监控管理设备,其特征在于,所述监控引擎还配置为:对于未指明或私有类型的监控协议,通过调用由另设的计算机设备执行的脚本/工具,采集被监控设备的监控数据,将通过采集信息确定所属被监控设备的监控数据存储于所述数据库中。
8.根据权利要求7所述的监控管理设备,其特征在于,该监控管理设备还包括数据解析模块,所述监控引擎配置为通过调用由另设的计算机设备执行的脚本/工具,采集被监控设备的监控数据,将通过采集信息确定所属被监控设备的监控数据存储于所述数据库中包括:确认并注册需要采用脚本/工具采集监控数据的被监控设备;定期地向用于执行脚本/工具的另设的计算机设备发送执行请求,以使得所述计算机设备执行脚本/工具以启动采集被监控设备的监控数据并在采集后生成包含采集信息和监控数据的JSON格式数据,所述数据解析模块对JSON格式数据进行解析;根据解析得到的采集信息确定解析得到的监控数据所属的被监控设备,并将解析得到的监控数据存储于所述数据库中。
9.根据权利要求1所述的监控管理设备,其特征在于,所述数据库包括时序数据库和图数据库,所述监控引擎配置为将通过监控协议接口标识确定所属被监控设备的监控数据存储于所述数据库中包括:将结构化的监控数据存储于时序数据库中,将非结构化的监控数据存储于图数据库中。
10.根据权利要求1所述的监控管理设备,其特征在于,该监控管理设备还包括API接口,所述监控引擎还配置为:响应于用户的监控数据查询请求,查找数据库中存储的监控数据并通过所述API接口输出。
11.根据权利要求1所述的监控管理设备,其特征在于,该监控管理设备还包括告警处理模块和至少一个发送类型的告警事件发送接口,所述监控引擎还配置为:判定监控数据中的指标信息是否超过预设阈值,若是,则生成告警消息并添加入告警消息队列;所述告警处理模块配置为:对具有相同键、值或键值或符合预设规则的告警消息进行压缩合并以生成作为告警事件的一条告警信息;根据告警事件包含的告警消息的类型和数量,加权计算告警事件的告警紧急程度,并根据告警紧急程度判断告警发送策略;根据告警发送策略,通过相应的告警事件发送接口发送告警信息。
12.根据权利要求11所述的监控管理设备,其特征在于,所述告警处理模块还配置为:根据是否发送成功,将已发送的告警信息标记为已发送未处理或发送失败;所述监控引擎还配置为:判断下一采集周期中采集得到的已生成告警消息的监控数据中的指标信息是否超过阈值,若否,则将所述已发送的告警信息的标记更改为已解决;所述告警处理模块还配置为:检查已标记的告警信息在预设时段内是否被更改为已解决,若否,则重新通过相应的告警事件发送接口发送告警信息。
13.根据权利要求1所述的监控管理设备,其特征在于,所述被监控设备为云计算设备,包括服务器、存储设备、交换机和防火墙设备。
14.一种如权利要求1-13中任一项所述的监控管理设备执行的监控管理方法,其特征在于,包括:
为被监控设备的监控协议接口添加被监控设备的唯一的标识;
利用不同监控协议的采集器,通过被监控设备相应的监控协议接口采集监控数据;
将通过监控协议接口标识确定所属被监控设备的监控数据存储于所述数据库中。
15.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求14所述的方法。
CN202010206003.6A 2020-03-23 2020-03-23 监控管理设备及方法、计算机可读存储介质 Active CN111447109B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010206003.6A CN111447109B (zh) 2020-03-23 2020-03-23 监控管理设备及方法、计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010206003.6A CN111447109B (zh) 2020-03-23 2020-03-23 监控管理设备及方法、计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN111447109A true CN111447109A (zh) 2020-07-24
CN111447109B CN111447109B (zh) 2022-03-22

Family

ID=71654260

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010206003.6A Active CN111447109B (zh) 2020-03-23 2020-03-23 监控管理设备及方法、计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN111447109B (zh)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111881139A (zh) * 2020-07-29 2020-11-03 北京浪潮数据技术有限公司 一种数据获取的方法、***、设备及可读存储介质
CN112019609A (zh) * 2020-08-18 2020-12-01 深圳市汇川技术股份有限公司 基于物联网的设备监控方法、装置、设备及计算机介质
CN112115119A (zh) * 2020-08-28 2020-12-22 苏宁金融科技(南京)有限公司 一种图数据库的服务性能监测方法、装置以及存储介质
CN112131073A (zh) * 2020-08-25 2020-12-25 新浪网技术(中国)有限公司 服务器的监控方法和***
CN112347170A (zh) * 2020-10-26 2021-02-09 深圳市汇川技术股份有限公司 数据采集方法、装置、设备及计算机可读存储介质
CN112684748A (zh) * 2020-11-16 2021-04-20 航天信息股份有限公司 一种兼容多种被监控设备的监控方法及***
CN112698820A (zh) * 2020-12-30 2021-04-23 平安证券股份有限公司 存储器和交换机统一监控管理方法、装置和计算机设备
CN112711574A (zh) * 2021-01-15 2021-04-27 光通天下网络科技股份有限公司 数据库安全性检测方法、装置、电子设备及介质
CN112732428A (zh) * 2021-01-14 2021-04-30 北京神州泰岳软件股份有限公司 数据采集方法、装置、电子设备和存储介质
CN112738231A (zh) * 2020-12-29 2021-04-30 成都商汤科技有限公司 布控方法及装置、电子设备和存储介质
CN113285841A (zh) * 2021-06-15 2021-08-20 无锡热能在线科技有限公司 一种工业网关数据传输协议的配置装置及方法
CN113722256A (zh) * 2021-09-02 2021-11-30 江苏斯菲尔电气股份有限公司 一种基于插件的通信管理机函数式控制***及方法
CN113849373A (zh) * 2021-09-27 2021-12-28 中国电信股份有限公司 服务器监管方法、装置以及存储介质
CN114143242A (zh) * 2021-11-29 2022-03-04 中能融合智慧科技有限公司 一种无代理监视的网络设备监测***、设备及存储介质
CN114205423A (zh) * 2022-02-17 2022-03-18 联信弘方(北京)科技股份有限公司 基于ipmi协议的适配私有协议方法、装置、设备及介质
CN114500305A (zh) * 2022-02-09 2022-05-13 杭州义益钛迪信息技术有限公司 设备监控方法、装置、设备、存储介质及程序产品
CN114785722A (zh) * 2022-06-14 2022-07-22 武汉四通信息服务有限公司 监控数据处理方法、装置及计算机可读存储介质
CN114827678A (zh) * 2022-04-29 2022-07-29 广东省广播电视网络股份有限公司中山分公司 一种数字电视前端平台运维监控分析***
CN116567038A (zh) * 2023-07-07 2023-08-08 长沙智医云科技有限公司 一种医疗设备运行监控***
CN117176613A (zh) * 2023-11-01 2023-12-05 建信金融科技有限责任公司 一种数据采集方法和装置

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101714930A (zh) * 2009-12-30 2010-05-26 北京世纪互联宽带数据中心有限公司 一种实现网络监控的方法及***
JP2011059804A (ja) * 2009-09-07 2011-03-24 Mitsubishi Electric Corp 通信装置管理システムおよびデータベースアクセス処理方法
US8817784B2 (en) * 2006-02-08 2014-08-26 Solarflare Communications, Inc. Method and apparatus for multicast packet reception
CN104052631A (zh) * 2014-05-22 2014-09-17 中兴通讯股份有限公司 一种设备信息的采集方法、装置以及***
CN104506393A (zh) * 2015-01-06 2015-04-08 北京海量数据技术股份有限公司 一种基于云平台的***监控方法
CN106487585A (zh) * 2016-10-09 2017-03-08 深圳市思博创科技有限公司 设备综合监控***架构
CN108259269A (zh) * 2017-12-30 2018-07-06 上海陆家嘴国际金融资产交易市场股份有限公司 网络设备的监控方法和***
CN108900359A (zh) * 2018-08-08 2018-11-27 四川长虹网络科技有限责任公司 网络设备参数批量采集***及方法
CN109274557A (zh) * 2018-11-14 2019-01-25 江苏鸿信***集成有限公司 一种云环境下的智能cmdb管理及云主机监控方法
US10278112B1 (en) * 2016-12-30 2019-04-30 Juniper Networks, Inc. Resolving out-of-band configuration changes to high-level service configuration for managed network devices

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8817784B2 (en) * 2006-02-08 2014-08-26 Solarflare Communications, Inc. Method and apparatus for multicast packet reception
JP2011059804A (ja) * 2009-09-07 2011-03-24 Mitsubishi Electric Corp 通信装置管理システムおよびデータベースアクセス処理方法
CN101714930A (zh) * 2009-12-30 2010-05-26 北京世纪互联宽带数据中心有限公司 一种实现网络监控的方法及***
CN104052631A (zh) * 2014-05-22 2014-09-17 中兴通讯股份有限公司 一种设备信息的采集方法、装置以及***
CN104506393A (zh) * 2015-01-06 2015-04-08 北京海量数据技术股份有限公司 一种基于云平台的***监控方法
CN106487585A (zh) * 2016-10-09 2017-03-08 深圳市思博创科技有限公司 设备综合监控***架构
US10278112B1 (en) * 2016-12-30 2019-04-30 Juniper Networks, Inc. Resolving out-of-band configuration changes to high-level service configuration for managed network devices
CN108259269A (zh) * 2017-12-30 2018-07-06 上海陆家嘴国际金融资产交易市场股份有限公司 网络设备的监控方法和***
CN108900359A (zh) * 2018-08-08 2018-11-27 四川长虹网络科技有限责任公司 网络设备参数批量采集***及方法
CN109274557A (zh) * 2018-11-14 2019-01-25 江苏鸿信***集成有限公司 一种云环境下的智能cmdb管理及云主机监控方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
金丹: "期货数据中心集中监控***的研究和应用", 《中国优秀硕士学位论文全文数据库》 *

Cited By (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111881139A (zh) * 2020-07-29 2020-11-03 北京浪潮数据技术有限公司 一种数据获取的方法、***、设备及可读存储介质
CN111881139B (zh) * 2020-07-29 2022-07-08 北京浪潮数据技术有限公司 一种数据获取的方法、***、设备及可读存储介质
CN112019609A (zh) * 2020-08-18 2020-12-01 深圳市汇川技术股份有限公司 基于物联网的设备监控方法、装置、设备及计算机介质
CN112019609B (zh) * 2020-08-18 2023-04-07 深圳市汇川技术股份有限公司 基于物联网的设备监控方法、装置、设备及计算机介质
CN112131073A (zh) * 2020-08-25 2020-12-25 新浪网技术(中国)有限公司 服务器的监控方法和***
CN112131073B (zh) * 2020-08-25 2024-06-11 新浪技术(中国)有限公司 服务器的监控方法和***
CN112115119A (zh) * 2020-08-28 2020-12-22 苏宁金融科技(南京)有限公司 一种图数据库的服务性能监测方法、装置以及存储介质
CN112115119B (zh) * 2020-08-28 2022-08-19 苏宁金融科技(南京)有限公司 一种图数据库的服务性能监测方法、装置以及存储介质
CN112347170A (zh) * 2020-10-26 2021-02-09 深圳市汇川技术股份有限公司 数据采集方法、装置、设备及计算机可读存储介质
CN112684748A (zh) * 2020-11-16 2021-04-20 航天信息股份有限公司 一种兼容多种被监控设备的监控方法及***
CN112738231A (zh) * 2020-12-29 2021-04-30 成都商汤科技有限公司 布控方法及装置、电子设备和存储介质
CN112698820B (zh) * 2020-12-30 2024-07-19 平安证券股份有限公司 存储器和交换机统一监控管理方法、装置和计算机设备
CN112698820A (zh) * 2020-12-30 2021-04-23 平安证券股份有限公司 存储器和交换机统一监控管理方法、装置和计算机设备
CN112732428A (zh) * 2021-01-14 2021-04-30 北京神州泰岳软件股份有限公司 数据采集方法、装置、电子设备和存储介质
CN112711574A (zh) * 2021-01-15 2021-04-27 光通天下网络科技股份有限公司 数据库安全性检测方法、装置、电子设备及介质
CN113285841A (zh) * 2021-06-15 2021-08-20 无锡热能在线科技有限公司 一种工业网关数据传输协议的配置装置及方法
CN113285841B (zh) * 2021-06-15 2023-08-08 无锡摩尔汇萃智能技术有限公司 一种工业网关数据传输协议的配置方法
CN113722256A (zh) * 2021-09-02 2021-11-30 江苏斯菲尔电气股份有限公司 一种基于插件的通信管理机函数式控制***及方法
CN113849373A (zh) * 2021-09-27 2021-12-28 中国电信股份有限公司 服务器监管方法、装置以及存储介质
CN114143242A (zh) * 2021-11-29 2022-03-04 中能融合智慧科技有限公司 一种无代理监视的网络设备监测***、设备及存储介质
CN114500305A (zh) * 2022-02-09 2022-05-13 杭州义益钛迪信息技术有限公司 设备监控方法、装置、设备、存储介质及程序产品
CN114500305B (zh) * 2022-02-09 2023-08-15 杭州义益钛迪信息技术有限公司 设备监控方法、装置、设备、存储介质及程序产品
CN114205423A (zh) * 2022-02-17 2022-03-18 联信弘方(北京)科技股份有限公司 基于ipmi协议的适配私有协议方法、装置、设备及介质
CN114205423B (zh) * 2022-02-17 2022-05-10 联信弘方(北京)科技股份有限公司 基于ipmi协议的适配私有协议方法、装置、设备及介质
CN114827678A (zh) * 2022-04-29 2022-07-29 广东省广播电视网络股份有限公司中山分公司 一种数字电视前端平台运维监控分析***
CN114785722B (zh) * 2022-06-14 2022-09-30 武汉四通信息服务有限公司 监控数据处理方法、装置及计算机可读存储介质
CN114785722A (zh) * 2022-06-14 2022-07-22 武汉四通信息服务有限公司 监控数据处理方法、装置及计算机可读存储介质
CN116567038A (zh) * 2023-07-07 2023-08-08 长沙智医云科技有限公司 一种医疗设备运行监控***
CN116567038B (zh) * 2023-07-07 2023-10-13 长沙智医云科技有限公司 一种医疗设备运行监控***
CN117176613A (zh) * 2023-11-01 2023-12-05 建信金融科技有限责任公司 一种数据采集方法和装置
CN117176613B (zh) * 2023-11-01 2024-01-26 建信金融科技有限责任公司 一种数据采集方法和装置

Also Published As

Publication number Publication date
CN111447109B (zh) 2022-03-22

Similar Documents

Publication Publication Date Title
CN111447109B (zh) 监控管理设备及方法、计算机可读存储介质
WO2021121370A1 (zh) 用于消息队列的消息丢失检测方法和装置
KR101080825B1 (ko) 관리 장치 및 정보 처리 장치, 관리 장치의 제어 방법 및 프로그램을 기록한 컴퓨터로 읽을 수 있는 매체
US7711803B2 (en) Method and system for management and configuration of remote agents
US6167448A (en) Management event notification system using event notification messages written using a markup language
CN112615743B (zh) 拓扑图绘制方法及装置
US8364805B2 (en) Method and apparatus of matching monitoring sets to network devices
US8549119B1 (en) Error handling for device management configuration and operational data retrieval commands
US20200327045A1 (en) Test System and Test Method
US20190379576A1 (en) Providing dynamic serviceability for software-defined data centers
US20170295068A1 (en) Logical network topology analyzer
WO2018010176A1 (zh) 获取故障信息的方法及设备
WO2016032442A1 (en) Computer device error instructions
CN116089205A (zh) 一种自动化运维管理方法、装置、服务器和存储介质
CN114143171B (zh) 一种基于tr069协议的告警根源定位方法及***
CN113852476A (zh) 确定异常事件关联对象的方法、装置及***
US20060053021A1 (en) Method for monitoring and managing an information system
CN112436969A (zh) 一种物联网设备管理方法、***、设备及介质
CN115987827B (zh) 一种设备监测方法、装置、电子设备及可读介质
CN116192607A (zh) 故障告警方法及装置
CN116069540A (zh) 一种***软硬件部位运行状态的采集分析处理方法及装置
CN116095120A (zh) 基于eip对象模型的数据采集的方法及网关
CN116089212A (zh) 数据库运行监控方法、***、装置及存储介质
US20180329792A1 (en) Network device monitoring
CN114513398B (zh) 网络设备告警处理方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant