CN107786392A - 一种设备监控方法及装置 - Google Patents

一种设备监控方法及装置 Download PDF

Info

Publication number
CN107786392A
CN107786392A CN201711117794.XA CN201711117794A CN107786392A CN 107786392 A CN107786392 A CN 107786392A CN 201711117794 A CN201711117794 A CN 201711117794A CN 107786392 A CN107786392 A CN 107786392A
Authority
CN
China
Prior art keywords
monitored device
fault message
managing apparatus
monitoring
equipment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711117794.XA
Other languages
English (en)
Inventor
谢芝茂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201711117794.XA priority Critical patent/CN107786392A/zh
Publication of CN107786392A publication Critical patent/CN107786392A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/12Network monitoring probes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/02Standardisation; Integration
    • H04L41/0213Standardised network management protocols, e.g. simple network management protocol [SNMP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提供一种设备监控方法及装置,上述方法包括以下步骤:被监控设备发生故障时,监控管理设备通过所述被监控设备上的管理代理模块获取所述被监控设备上的故障信息;所述监控管理设备对所述故障信息进行处理。上述技术方案中,通过所述被监控设备上的管理代理模块主动上报被监控设备故障信息,提高了监控时效性,并且有效减轻了监控管理设备的计算压力,大大提升了用户体验。

Description

一种设备监控方法及装置
技术领域
本发明属于智能监控领域,尤其涉及一种设备监控方法及装置。
背景技术
主流的网管监控***大多采用开源的网络设备监控平台,如shinken,利用其轮询机制,定时执行监控指令,抓取性能数据,来实现对服务器、操作***、网络设备的监控。
但是,上述方案存在以下不足:
1、当监控资源数量过多,监控项过多,shinken将不停的开启轮询线程,这将十分浪费计算机的资源,导致监控***的性能下降;
2、采用轮询方法,由于存在时间间隔,这将导致收集的被监控设备的信息严重滞后,尤其是故障信息的收集严重滞后,大大影响用户的体验。
因此,迫切需要提供一种设备监控方案来解决上述技术问题。
发明内容
本发明提供一种设备监控方法及装置,以解决上述问题。
本发明实施例提供一种设备监控方法,包括以下步骤:被监控设备发生故障时,监控管理设备通过所述被监控设备上的管理代理模块获取所述被监控设备上的故障信息;
所述监控管理设备对所述故障信息进行处理。
本发明实施例还提供一种设备监控装置,包括处理器,适于实现各指令;存储设备,适于存储多条指令,所述指令适于由所述处理器加载并执行;
被监控设备发生故障时,监控管理设备通过所述被监控设备上的管理代理模块获取所述被监控设备上的故障信息;
所述监控管理设备对所述故障信息进行处理。
本发明实施例提供以下技术方案:被监控设备发生故障时,监控管理设备通过所述被监控设备上的管理代理模块获取所述被监控设备上的故障信息;所述监控管理设备对所述故障信息进行处理。
上述技术方案中,通过所述被监控设备上的管理代理模块主动上报被监控设备故障信息,提高了监控时效性,并且有效减轻了监控管理设备的计算压力,大大提升了用户体验。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1所示为本发明实施例1的设备监控原理图;
图2所示为本发明实施例2的设备监控方法流程图;
图3所示为本发明实施例3的设备监控装置结构图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
本发明实施例将监控资源由主动轮询的方式,改为trap(陷阱)被动监听的方法,实现对被管资源的监控。
下面结合图1进行详细说明,图1所示为本发明实施例1的设备监控原理图,包括:监控管理设备;被监控设备1、被监控设备2、被监控设备3;其中,所述监控管理设备分别与所述被监控设备1、被监控设备2、被监控设备3相连;其中,所述被监控设备1包含管理代理模块1、所述被监控设备2包含管理代理模块2、所述被监控设备3包含管理代理模块3。
进一步地,所述对所述监控管理设备进行配置的方式包括以下至少之一:加载管理信息库即MIB库;配置与所述被监控设备一致的用户名、密码、安全等级、认证算法、认证密钥、鉴权算法、鉴权密钥。
进一步地,对所述监控管理设备进行配置之后,还包括:所述监控管理设备开启Trap监听进程,将监听到的Trap信息进行解析,并对解析后的监控数据进行展示。
本发明实施例的特点如下:
1、事件驱动,第一时间收到设备故障告警以事件为驱动,由被监控的主机、网络设备、应用在发生故障时向NMS(Network Management System;网络管理***)发送SNMP(Simple Network Management Protocol;简单网络管理协议)Trap故障信息,通过对接收到的SNMP Trap故障信息进行解析和展现,以最快速度向管理人员发送告警。SNMP Trap不同于SNMP的主动采集:SNMP的主动采集,服务器按照固定的时间间隔,由网络管理***以询问的方式,采集被监控设备性能指标,因此发现被监控设备性能问题的快慢取决于采集的频率间隔。而SNMP Trap是以事件为驱动,在被监控设备设置陷阱,一旦被监控设备出现相关问题,立刻发送SNMP Trap,因此能够在最短的时间内发现故障,避免因为设备故障带来的经济损失;
2、提供SNMP Trap的接收,并通过对Trap信息进行解析与展现,从被动变为主动,全面监控IT***。通过对SNMP Trap的解析和展现,一旦某个IT组件出现问题,可以在短时间之内,即可收到故障信息,满足企业的快速发现问题的需要;
3、通过SNMP Trap的接收规则定义,管理员可以过滤非重要设备的Trap信息,也可以过滤被监控设备的非重要故障信息,帮助管理员在第一时间收到真正需要的管理信息;
4、定制SNMP Trap告警规则触发告警,提供多种方式发送告警信息,用户通过管理端定制需要告警的SNMP Trap信息,针对特定SNMP Trap事件通过邮件、短信、语音、微信等方式向相关人员发送报警,帮助管理人员快速收到IT***故障信息;
5、支持事件导出汇总特定时间内特定SNMP Trap事件,同时可以以Excel格式导出事件数据,便于管理人员对故障信息进行统计和分析;
6、支持各类设备厂家MIB库的导入;
虽然国内各种监控管理设备都支持SNMP Trap,但是各个厂家的MIB库并不能很好的支持公共标准,因此,很多监控***都支持私有MIB库的导入,确保能够全面兼容各个厂家设备的SNMP Trap信息。
7、SNMPV3协议,主要增加SNMP在安全性和远端配置方面的强化;
SNMP第三版SNMPV3提供重要的安全性功能:
信息完整性:保证封包在传送中没有被篡改;
认证:检验信息来自正确的来源;
封包加密:避免被未授权的来源窥探。
SNMPv3定义了基于用户的安全模型,使用共享密钥进行报文认证。SNMPv3中引入了下列三个安全级别:noAuthNoPriv:不需要认证,不提供隐私性(加密);authNoPriv:基于HMAC-MD5或HMAC-SHA的认证,不提供加密;authPriv:除了认证之外,还将CBC-DES加密算法用作隐私性协议。
本发明实施例采用基于snmpv3协议的Trap被动监控方法,大大提高了网管***的监控时效性,并且有效减轻了运行网管***的宿主机的计算压力,同时采用snmpV3协议,大大提高了通信的安全性。
图2所示为本发明实施例2的设备监控方法流程图,包括以下步骤:
步骤201:被监控设备发生故障时,监控管理设备通过所述被监控设备上的管理代理模块获取所述被监控设备上的故障信息;
进一步地,所述被监控设备发生故障时,监控管理设备通过所述被监控设备上的管理代理模块获取所述被监控设备上的故障信息之前,还包括:
对所述监控管理设备进行配置。
进一步地,所述对所述监控管理设备进行配置的方式包括以下至少之一:
加载管理信息库即MIB库;配置与所述被监控设备一致的用户名、密码、安全等级、认证算法、认证密钥、鉴权算法、鉴权密钥。
进一步地,所述监控管理设备开启陷阱监听进程即Trap监听进程;
对所述Trap监听进程监听到的所述被监控设备上的故障信息进行解析并显示解析后的数据。
进一步地,所述被监控设备包括服务器、工作站、路由器、交换机。
进一步地,预先在所述被监控设备上配置所述管理代理模块。
进一步地,被监控设备发生故障时,所述被监控设备上的管理代理模块向所述监控管理设备上报所述被监控设备上的故障信息。
进一步地,所述被监控设备上的管理代理模块将预设故障类型的故障信息上报至所述监控管理设备,其中,所述故障类型包括操作***崩溃、设备接口宕掉。
步骤202:所述监控管理设备对所述故障信息进行处理。
进一步地,所述监控管理设备获取所述被监控设备上的故障信息后,判断发生故障的被监控设备对应的级别,对大于预设级别的被监控设备的故障信息进行处理,其中,所述级别包括高级、中级、低级。
进一步地,所述监控管理设备获取所述被监控设备上的故障信息后,获取故障信息的重要度,对大于预设重要度的故障信息进行处理,其中,所述重要度包括一般、重要、非常重要。
图3所示为本发明实施例3的设备监控装置结构图,包括处理器,适于实现各指令;存储设备,适于存储多条指令,所述指令适于由所述处理器加载并执行;
被监控设备发生故障时,监控管理设备通过所述被监控设备上的管理代理模块获取所述被监控设备上的故障信息;
所述监控管理设备对所述故障信息进行处理。
进一步地,所述监控管理设备获取所述被监控设备上的故障信息后,判断发生故障的被监控设备对应的级别,对大于预设级别的被监控设备的故障信息进行处理,其中,所述级别包括高级、中级、低级。
进一步地,所述监控管理设备获取所述被监控设备上的故障信息后,获取故障信息的重要度,对大于预设重要度的故障信息进行处理,其中,所述重要度包括一般、重要、非常重要。
进一步地,所述被监控设备发生故障时,监控管理设备通过所述被监控设备上的管理代理模块获取所述被监控设备上的故障信息之前,还包括:
对所述监控管理设备进行配置。
进一步地,所述对所述监控管理设备进行配置的方式包括以下至少之一:
加载管理信息库即MIB库;配置与所述被监控设备一致的用户名、密码、安全等级、认证算法、认证密钥、鉴权算法、鉴权密钥。
进一步地,所述监控管理设备开启陷阱监听进程即Trap监听进程;
对所述Trap监听进程监听到的所述被监控设备上的故障信息进行解析并显示解析后的数据。
进一步地,所述被监控设备包括服务器、工作站、路由器、交换机。
进一步地,预先在所述被监控设备上配置所述管理代理模块。
进一步地,被监控设备发生故障时,所述被监控设备上的管理代理模块向所述监控管理设备上报所述被监控设备上的故障信息。
进一步地,所述被监控设备上的管理代理模块将预设故障类型的故障信息上报至所述监控管理设备,其中,所述故障类型包括操作***崩溃、设备接口宕掉。
本发明实施例提供以下技术方案:被监控设备发生故障时,监控管理设备通过所述被监控设备上的管理代理模块获取所述被监控设备上的故障信息;所述监控管理设备对所述故障信息进行处理。
上述技术方案中,通过所述被监控设备上的管理代理模块主动上报被监控设备故障信息,提高了监控时效性,并且有效减轻了监控管理设备的计算压力,大大提升了用户体验。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (18)

1.一种设备监控方法,其特征在于,包括以下步骤:
被监控设备发生故障时,监控管理设备通过所述被监控设备上的管理代理模块获取所述被监控设备上的故障信息;
所述监控管理设备对所述故障信息进行处理。
2.根据权利要求1所述的设备监控方法,其特征在于,所述监控管理设备获取所述被监控设备上的故障信息后,判断发生故障的被监控设备对应的级别,对大于预设级别的被监控设备的故障信息进行处理,其中,所述级别包括高级、中级、低级。
3.根据权利要求1所述的设备监控方法,其特征在于,所述监控管理设备获取所述被监控设备上的故障信息后,获取故障信息的重要度,对大于预设重要度的故障信息进行处理,其中,所述重要度包括一般、重要、非常重要。
4.根据权利要求1所述的设备监控方法,其特征在于,所述被监控设备发生故障时,监控管理设备通过所述被监控设备上的管理代理模块获取所述被监控设备上的故障信息之前,还包括:
对所述监控管理设备进行配置。
5.根据权利要求4所述的设备监控方法,其特征在于,所述对所述监控管理设备进行配置的方式包括以下至少之一:
加载管理信息库即MIB库;配置与所述被监控设备一致的用户名、密码、安全等级、认证算法、认证密钥、鉴权算法、鉴权密钥。
6.根据权利要求1所述的设备监控方法,其特征在于,所述监控管理设备开启陷阱监听进程即Trap监听进程;
对所述Trap监听进程监听到的所述被监控设备上的故障信息进行解析并显示解析后的数据。
7.根据权利要求1所述的设备监控方法,其特征在于,所述被监控设备包括服务器、工作站、路由器、交换机。
8.根据权利要求1所述的设备监控方法,其特征在于,被监控设备发生故障时,所述被监控设备上的管理代理模块向所述监控管理设备上报所述被监控设备上的故障信息。
9.根据权利要求1所述的设备监控方法,其特征在于,所述被监控设备上的管理代理模块将预设故障类型的故障信息上报至所述监控管理设备,其中,所述故障类型包括操作***崩溃、设备接口宕掉。
10.一种设备监控装置,其特征在于,包括处理器,适于实现各指令;存储设备,适于存储多条指令,所述指令适于由所述处理器加载并执行;
被监控设备发生故障时,监控管理设备通过所述被监控设备上的管理代理模块获取所述被监控设备上的故障信息;
所述监控管理设备对所述故障信息进行处理。
11.根据权利要求10所述的设备监控装置,其特征在于,所述监控管理设备获取所述被监控设备上的故障信息后,判断发生故障的被监控设备对应的级别,对大于预设级别的被监控设备的故障信息进行处理,其中,所述级别包括高级、中级、低级。
12.根据权利要求10所述的设备监控装置,其特征在于,所述监控管理设备获取所述被监控设备上的故障信息后,获取故障信息的重要度,对大于预设重要度的故障信息进行处理,其中,所述重要度包括一般、重要、非常重要。
13.根据权利要求10所述的设备监控装置,其特征在于,所述被监控设备发生故障时,监控管理设备通过所述被监控设备上的管理代理模块获取所述被监控设备上的故障信息之前,还包括:
对所述监控管理设备进行配置。
14.根据权利要求13所述的设备监控装置,其特征在于,所述对所述监控管理设备进行配置的方式包括以下至少之一:
加载管理信息库即MIB库;配置与所述被监控设备一致的用户名、密码、安全等级、认证算法、认证密钥、鉴权算法、鉴权密钥。
15.根据权利要求10所述的设备监控装置,其特征在于,所述监控管理设备开启陷阱监听进程即Trap监听进程;
对所述Trap监听进程监听到的所述被监控设备上的故障信息进行解析并显示解析后的数据。
16.根据权利要求10所述的设备监控装置,其特征在于,所述被监控设备包括服务器、工作站、路由器、交换机。
17.根据权利要求10所述的设备监控装置,其特征在于,被监控设备发生故障时,所述被监控设备上的管理代理模块向所述监控管理设备上报所述被监控设备上的故障信息。
18.根据权利要求10所述的设备监控装置,其特征在于,所述被监控设备上的管理代理模块将预设故障类型的故障信息上报至所述监控管理设备,其中,所述故障类型包括操作***崩溃、设备接口宕掉。
CN201711117794.XA 2017-11-13 2017-11-13 一种设备监控方法及装置 Pending CN107786392A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711117794.XA CN107786392A (zh) 2017-11-13 2017-11-13 一种设备监控方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711117794.XA CN107786392A (zh) 2017-11-13 2017-11-13 一种设备监控方法及装置

Publications (1)

Publication Number Publication Date
CN107786392A true CN107786392A (zh) 2018-03-09

Family

ID=61432820

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711117794.XA Pending CN107786392A (zh) 2017-11-13 2017-11-13 一种设备监控方法及装置

Country Status (1)

Country Link
CN (1) CN107786392A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110475113A (zh) * 2018-05-09 2019-11-19 视联动力信息技术股份有限公司 基于视联网的监控设备故障处理方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102571436A (zh) * 2012-01-12 2012-07-11 国电南瑞科技股份有限公司 一种snmp的综合监控设备及其管理办法
CN102624570A (zh) * 2012-04-27 2012-08-01 杭州东信北邮信息技术有限公司 实现对web服务器可用性进行检测的监控***和方法
CN105282772A (zh) * 2015-09-10 2016-01-27 北京爱可生通信技术有限公司 无线网数通设备监控***及设备监控方法
CN106027328A (zh) * 2016-05-13 2016-10-12 深圳市中润四方信息技术有限公司 一种基于应用容器部署的集群监控的方法及***
CN106656537A (zh) * 2015-11-03 2017-05-10 ***通信集团公司 一种it集群***监控方法、装置、终端及***

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102571436A (zh) * 2012-01-12 2012-07-11 国电南瑞科技股份有限公司 一种snmp的综合监控设备及其管理办法
CN102624570A (zh) * 2012-04-27 2012-08-01 杭州东信北邮信息技术有限公司 实现对web服务器可用性进行检测的监控***和方法
CN105282772A (zh) * 2015-09-10 2016-01-27 北京爱可生通信技术有限公司 无线网数通设备监控***及设备监控方法
CN106656537A (zh) * 2015-11-03 2017-05-10 ***通信集团公司 一种it集群***监控方法、装置、终端及***
CN106027328A (zh) * 2016-05-13 2016-10-12 深圳市中润四方信息技术有限公司 一种基于应用容器部署的集群监控的方法及***

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110475113A (zh) * 2018-05-09 2019-11-19 视联动力信息技术股份有限公司 基于视联网的监控设备故障处理方法及装置
CN110475113B (zh) * 2018-05-09 2021-09-07 视联动力信息技术股份有限公司 基于视联网的监控设备故障处理方法及装置

Similar Documents

Publication Publication Date Title
CN111092869B (zh) 终端接入办公网络安全管控方法及认证服务器
CN105490839B (zh) 一种网站数据安全的告警方法及装置
CN111787073A (zh) 一种统一服务的限流熔断平台及其方法
CN111752795A (zh) 一种全流程监控报警平台及其方法
CN101296228B (zh) 基于流量分析的ssl vpn协议检测方法
CN101197715B (zh) 一种移动数据业务状态的安全集中采集方法
KR101273912B1 (ko) 고객 구내 장비와 원격 관리 서버 간의 알람 통보
CN104426697B (zh) 网络故障管理***
CN103560911A (zh) 一种金融自助设备主动预防维修维护的方法及***
US20040006619A1 (en) Structure for event reporting in SNMP systems
CN105049245B (zh) Epon的网元管理***
CN108390907A (zh) 一种基于Hadoop集群的管理监控***及方法
CN108345527A (zh) 一种接口入参的分析监控方法及***
CN105939353B (zh) 一种基于gdoi协议下安全管理及信息反馈***
CN107786392A (zh) 一种设备监控方法及装置
CN114006940A (zh) 建筑集成管理信息推送方法、***、计算机及存储介质
CN116302862B (zh) 一种微服务架构下监控告警方法和***
CN117221133A (zh) 一种基于带外技术的数据中心机房运行状态监控分析***
CN103957127B (zh) 异构厂家传输网络接口适配方法
CN106301826A (zh) 一种故障检测方法及装置
CN111343033B (zh) 一种面向多层差异的网络管理***
CN112243026B (zh) 铁路数据交互***和方法
Cisco The Configure Logging and Notifications Panel
CN113824592A (zh) 量子网络管理***
Cisco The Configure Logging and Notifications Panel

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180309