CN103716173B - 一种存储监控***及监控告警发布的方法 - Google Patents

一种存储监控***及监控告警发布的方法 Download PDF

Info

Publication number
CN103716173B
CN103716173B CN201210375758.4A CN201210375758A CN103716173B CN 103716173 B CN103716173 B CN 103716173B CN 201210375758 A CN201210375758 A CN 201210375758A CN 103716173 B CN103716173 B CN 103716173B
Authority
CN
China
Prior art keywords
monitoring
snmp
interchanger
storage
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210375758.4A
Other languages
English (en)
Other versions
CN103716173A (zh
Inventor
姜游
葛鑫
路曜宗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Petroleum and Chemical Corp
Sinopec Geophysical Research Institute
Original Assignee
China Petroleum and Chemical Corp
Sinopec Geophysical Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Petroleum and Chemical Corp, Sinopec Geophysical Research Institute filed Critical China Petroleum and Chemical Corp
Priority to CN201210375758.4A priority Critical patent/CN103716173B/zh
Publication of CN103716173A publication Critical patent/CN103716173A/zh
Application granted granted Critical
Publication of CN103716173B publication Critical patent/CN103716173B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)
  • Computer And Data Communications (AREA)

Abstract

本发明提供了一种存储监控***及监控告警发布的方法,属于信息技术领域。所述存储监控***包括监控服务器和监控交换机,各个存储设备分别与所述监控交换机连接,监控交换机再与监控服务器连接;在所述监控服务器上装有以下模块:SNMP收集存储模块:用于获取SNMP依赖的网络环境以及监控交换机和监控服务器的SNMP协议信息收集和存储;MIB分析模块:将SNMP收集存储模块收集到的SNMP协议信息对照MIB函数库进行分析,将异常情况汇总形成告警信息,并将所有告警信息录入报警数据库,同时根据告警信息的级别,将级别标识为严重的告警信息输入告警***。

Description

一种存储监控***及监控告警发布的方法
技术领域
本发明属于信息技术领域,具体涉及一种存储监控***及监控告警发布的方法。
背景技术
地球物理研究离不开高性能计算机和高性能存储设备,而高性能存储设备的正常运行是科研生产正常开展的前提。
现有技术中,SNMP、MIB等是比较成熟的技术,其中,SNMP(Simple NetworkManagement Protocol,简单网络管理协议)的前身是简单网关监控协议(SGMP),用来对通信线路进行管理,随后,人们对SGMP进行了很大的修改,特别是加入了符合Internet定义的SMI和MIB体系结构,改进后的协议就是著名的SNMP。SNMP的目标是管理互联网Internet上众多厂家生产的软硬件平台,因此SNMP受Internet标准网络管理框架的影响也很大。现在SNMP已经出到第三个版本的协议,其功能较以前已经大大地加强和改进了。
在典型的SNMP用法中,有许多***被管理,而且是有一或多个***在管理它们。每一个被管理的***上又运行一个叫做代理者(agent)的软件元件,且透过SNMP对管理***报告资讯。基本上,SNMP代理者以变量呈现管理资料。管理***透过GET,GETNEXT和GETBULK协定指令取回资讯,或是代理者在没有被询问的情况下,使用TRAP或INFORM传送资料。管理***也可以传送配置更新或控制的请求,透过SET协定指令达到主动管理***的目的。配置和控制指令只有当网络基本结构需要改变的时候使用,而监控指令则通常是常态性的工作。可透过SNMP存取的变量以阶层的方式结合。这些分层和其他元数据(例如变量的类型和描述)以管理信息库(MIBs)的方式描述。
MIB(Management Information Base):管理信息库,由网络管理协议访问的管理对象数据库,它包括SNMP可以通过网络设备的SNMP管理代理进行设置的变量。SMI,Structure of Management Information:管理信息结构,用于定义通过网络管理协议可访问的对象的规则。SMI定义在MIB中使用的数据类型及网络资源在MIB中的名称或表示。
使用SNMP进行网络管理需要下面几个重要部分:管理基站,管理代理,管理信息库和网络管理工具。管理基站通常是一个独立的设备,它用作网络管理者进行网络管理的用户接口。基站上必须装备有管理软件,管理员可以使用的用户接口和从MIB取得信息的数据库,同时为了进行网络管理它应该具备将管理命令发出基站的能力。
管理代理是一种网络设备,如主机,网桥,路由器和集线器等,这些设备都必须能够接收管理基站发来的信息,它们的状态也必须可以由管理基站监视。管理代理响应基站的请求进行相应的操作,也可以在没有请求的情况下向基站发送信息。
MIB是对象的集合,它代表网络中可以管理的资源和设备。每个对象基本上是一个数据变量,它代表被管理的对象的一方面的信息。最后一个方面是管理协议,也就是SNMP,SNMP的基本功能是:取得,设置和接收代理发送的意外信息。取得指的是基站发送请求,代理根据这个请求回送相应的数据,设置是基站设置管理对象(也就是代理)的值,接收代理发送的意外信息是指代理可以在基站未请求的状态下向基站报告发生的意外情况。
SNMP为应用层协议,是TCP/IP协议族的一部分。它通过用户数据报协议(UDP)来操作。在分立的管理站中,管理者进程对位于管理站中心的MIB的访问进行控制,并提供网络管理员接口。管理者进程通过SNMP完成网络管理。SNMP在UDP、IP及有关的特殊网络协议(如,Ethernet,FDDI,X.25)之上实现。
但是,现有的存储设备监控采用巡查检查硬件或者是对大批存储设备分别通过各自厂家自带的监控界面进行监控,因此无法满足大规模监控、实时响应的需要。
发明内容
本发明的目的在于解决上述现有技术中存在的难题,提供一种存储监控***及监控告警发布的方法,可方便地监控存储设备状态,发现潜在危险,最大限度保护数据安全,使存储***平稳运行。
本发明是通过以下技术方案实现的:
一种存储监控***,包括监控服务器和监控交换机,各个存储设备分别与所述监控交换机连接,监控交换机再与监控服务器连接;
在所述监控服务器上装有以下模块:
SNMP收集存储模块:用于获取SNMP依赖的网络环境以及监控交换机和监控服务器的SNMP协议信息收集和存储;
MIB分析模块:将SNMP收集存储模块收集到的SNMP协议信息对照MIB函数库进行分析,将异常情况汇总形成告警信息,并将所有告警信息录入报警数据库,同时根据告警信息的级别,将级别标识为严重的告警信息输入告警***;所述告警***是一个触发装置,用来推送报警短消息或者是电子邮件给运维人员;
展现模块:采用WEB平台,将报警数据库中的所有告警信息发布到该平台上。
一种监控告警发布的方法,所述方法通过获取存储设备的SNMP协议信息,并将其与MIB函数库进行比对,进而分析存储设备的运行状态。
所述方法包括以下步骤:
(1)搭建监控网络;
(2)所述SNMP收集存储模块通过每个存储设备的管理网口收集SNMP协议信息;
(3)所述SNMP收集存储模块将步骤(2)收集到的SNMP协议信息存入监控服务器上的数据库中;
(4)所述MIB分析模块将SNMP收集存储模块收集到的SNMP协议信息对照MIB函数库进行分析,将异常情况汇总形成告警信息,并将所有告警信息录入报警数据库,同时根据告警信息的级别,将级别标识为严重的告警信息输入告警***;搭建WEB平台,将报警数据库中的所有告警信息发布到该平台上。
所述步骤(1)包括以下步骤:
A.架设监控交换机并调试,使整个存储监控***处于一个虚拟局域网中;
B.将所有存储设备的管理网络IP地址重设并记录;
C.将所有存储设备的管理网口通过以太网线接入到监控交换机中;
D.将监控服务器的某一个闲置以太网口设置好IP地址并接入到监控交换机中;所述IP地址与存储设备的IP地址处于同一个网段中。
与现有技术相比,本发明的有益效果是:
(1)本发明实现了存储设备的实时监控,同时通过WEB页面发布实时监控信息。通过以太网收集到SNMP信息并录入数据库,通过与SNMP参数对比,获得存储设备实时监控信息,并通过LAMP技术通过WEB页面进行展示。
(2)本发明的应用领域广泛,可用于有存储设备特别是大规模存储设备集中的计算机机房,用于存储设备的监控。
附图说明
图1是本发明存储监控***的结构图。
图2是本发明监控告警发布的方法的步骤框图。
具体实施方式
下面结合附图对本发明作进一步详细描述:
图1所示的是本发明的存储监控***与存储设备连接的示意图,本发明的存储监控***可通过SNMP协议监控存储设备具体的运行状态,例如RAID组是否正常,CPU利用率等。同时将信息通过WEB平台发布,特别重要的报警信息,可通过短信息、电子邮件等方式直接推送给运维人员。
作为数据中心、超算中心、云计算中心的存储设备来说,平稳运行是最为重要的基本运维指标,是***运维人员最为关心的。本发明的存储监控***结构如下:
本发明的存储监控***包括监控服务器和监控交换机,而在所述监控服务器上装有以下模块:
1、SNMP收集存储模块,用于获取SNMP依赖的网络环境(网络环境是指监控交换机、监控服务器、被监控的存储设备所形成的一套监控网络。)以及监控服务器的SNMP协议信息的收集和存储(通过编制代码实现这些功能。),包括获取SNMP依赖的网络环境,监控交换机和监控服务器的SNMP信息收集及存储(指数据库建立及SNMP信息录入)。SNMP协议信息收集有两种方式(这两种方式是SNMP协议所定义的):SNMP信息推送和接收或按时间间隔进行遍历;
2、MIB分析模块,将SNMP收集存储模块收集到的SNMP信息对照MIB库进行分析,将异常情况汇总形成告警信息,并将所有告警信息录入报警数据库,同时根据告警信息的级别,将级别标识为严重的告警信息输入告警***;所述告警***是一个触发装置,用来推送报警短消息或者是电子邮件立即通知到运维人员,达到告知运维人员的目的。
异常情况包括:
(1)存储设备的CPU/控制器等关键部件温度过高;
(2)存储设备的风扇转速过高或过低;
(3)监控网络出现问题导致通信中断,设备无法到达;
(4)存储设备硬件故障,如电源损坏,电池失效,内存异常,硬盘损坏;
(5)存储设备***异常,如RAID组异常(包括损坏、重建等);
等等。
3、展现模块,即建立WEB平台,将报警数据库中的所有告警信息发布到该网站上,让***运维人员及时发现,或者根据需要,通过电子邮件、短消息告警的方式。
图1给出的是针对直连存储设备的,对于其他存储设备(例如并行存储设备),只需要图1中的监控服务器能够获取到其SNMP信息即可。
一种监控告警发布的方法,所述方法通过存储设备自身普适的SNMP协议及MIB函数库,建立服务器通过网络获取存储设备SNMP信息,通过比对MIB函数库,分析存储设备运行状态。
如图2所示,所述方法包括以下步骤:
(1)搭建监控网络;
A.架设监控交换机并调试,使整个存储监控***处于一个vlan (Virtual LocalArea Networ,虚拟局域网)中(是在同一个vlan中,不一定需要在同一个交换机上,在同一个vlan的目的在于保证交换机所有端口在同一个广播域,或者说连接到该交换机的所有设备的网络地址能够相互访问到的。例如,可以使交换机都置于192.168.30网段,各个连接到交换机的设备网络地址可以是192.168.30.2到192.168.30.254中的一个,此时的子网掩码为255.255.255.0。)。如达到一定规模,可能需要将多个监控交换机级联,同时可能需要扩大网络范围(如果设备总数超过了254个,而同一个网段不能容纳下,则需要扩大vlan范围。例如,可以设置子网掩码为255.255.254.0,则此时192.168.30网段和192.168.31网段处于一个vlan中,也即一个广播域中,这样,192.168.30网段的设备也可以和192.168.31网段的设备进行通信而不用通过网关)。
B.将所有存储设备的管理网络IP地址(即每个存储设备的IP地址)重设并记录。
C.将所有存储设备管理网的网络口(指每个存储设备的管理端口,通常是以太网口形式。将其接入监控网络后,可以通过该口的管理页面管理存储设备,可以通过该口收集SNMP信息)通过以太网线接入到监控交换机中。
D.将监控服务器的某一个闲置以太网口设置好IP地址(和存储设备位于同一个网段)并接入到监控交换机中,如图1所示,监控服务器连接万兆核心交换机和监控交换机,然后各个存储设备通过监控交换机与监控服务器连接。
(2)存储监控***中的SNMP收集存储模块通过每个存储设备的管理网口(即每个存储设备与监控交换机连接的网口)收集SNMP监控数据;
(3)存储监控***中的SNMP收集存储模块将步骤(2)收集到的SNMP监控数据存入监控服务器上的数据库中;
(4)存储监控***中的MIB分析模块将SNMP收集存储模块收集到的SNMP信息对照MIB库进行分析,将异常情况汇总形成告警信息,并将所有告警信息录入报警数据库,同时根据告警信息的级别,将级别标识为严重的告警信息输入告警***,标识为严重的告警信息是需要运维人员立即干预的告警信息;所述告警***是一个触发装置,用来推送报警短消息或者是电子邮件立即通知到运维人员,达到告知运维人员的目的。
搭建WEB平台,将报警数据库中的所有告警信息发布到该平台上。
本发明意在达到集中监控大量存储设备运行状态的功能。通过组建监控网络,收集到各个存储设备的运行状态信息,并存入数据库中待查。MIB分析模块抽取出数据并和MIB库进行对比和分析,并将分析结果(也即运行状态)展示在部署好的WEB平台,以便运维人员查看。特别重大的报警信息,直接通过短信息等通信方式推送给运维人员。
MIB函数库需要各个存储厂家提供,以进行参数对照,绝大多数情况下,各个厂家的SNMP是开放、可查询的。
上述技术方案只是本发明的一种实施方式,对于本领域内的技术人员而言,在本发明公开了应用方法和原理的基础上,很容易做出各种类型的改进或变形,而不仅限于本发明上述具体实施方式所描述的方法,因此前面描述的方式只是优选的,而并不具有限制性的意义。

Claims (4)

1.一种存储监控***,其特征在于:所述存储监控***包括监控服务器和监控交换机,各个存储设备与监控交换机连接,监控交换机再与监控服务器连接;
在所述监控服务器上装有下面的模块:
SNMP收集存储模块:用于获取SNMP依赖的网络环境以及监控交换机和监控服务器的SNMP协议信息收集和存储;
MIB分析模块:将SNMP收集存储模块收集到的SNMP协议信息对照MIB函数库进行分析,将异常情况汇总形成告警信息,并将所有告警信息录入报警数据库,同时根据告警信息的级别,将级别标识为严重的告警信息输入告警***;所述告警***是一个触发装置,用来推送报警短消息或者是电子邮件给运维人员;
展现模块:采用WEB平台,将报警数据库中的所有告警信息发布到该平台上,
所述存储监控***用于执行步骤(1)搭建监控网络,所述步骤(1)包括以下步骤:
A.架设监控交换机并调试,使整个存储监控***处于一个虚拟局域网中;
B.将所有存储设备的管理网络IP地址重设并记录;
C.将所有存储设备的管理网口通过以太网线接入到监控交换机中;
D.将监控服务器的某一个闲置以太网口设置好IP地址并接入到监控交换机中;所设置的IP地址与存储设备的管理网络IP地址处于同一个网段中。
2.一种利用权利要求1所述的存储监控***进行监控告警发布的方法,其特征在于:所述方法通过获取存储设备的SNMP协议信息,并将其与MIB函数库进行比对,进而分析存储设备的运行状态。
3.根据权利要求2所述的监控告警发布的方法,其特征在于:所述方法包括以下步骤:
(1)搭建监控网络;
(2)所述SNMP收集存储模块通过每个存储设备的管理网口收集SNMP协议信息;
(3)所述SNMP收集存储模块将步骤(2)收集到的SNMP协议信息存入监控服务器上的数据库中;
(4)所述MIB分析模块将SNMP收集存储模块收集到的SNMP协议信息对照MIB函数库进行分析,将异常情况汇总形成告警信息,并将所有告警信息录入报警数据库;同时根据告警信息的级别,将级别标识为严重的告警信息输入告警***;搭建WEB平台,将报警数据库中的所有告警信息发布到该平台上。
4.根据权利要求3所述的监控告警发布的方法,其特征在于:所述步骤(1)包括以下步骤:
A.架设监控交换机并调试,使整个存储监控***处于一个虚拟局域网中;
B.将所有存储设备的管理网络IP地址重设并记录;
C.将所有存储设备的管理网口通过以太网线接入到监控交换机中;
D.将监控服务器的某一个闲置以太网口设置好IP地址并接入到监控交换机中;所述IP地址与存储设备的IP地址处于同一个网段中。
CN201210375758.4A 2012-09-29 2012-09-29 一种存储监控***及监控告警发布的方法 Active CN103716173B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210375758.4A CN103716173B (zh) 2012-09-29 2012-09-29 一种存储监控***及监控告警发布的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210375758.4A CN103716173B (zh) 2012-09-29 2012-09-29 一种存储监控***及监控告警发布的方法

Publications (2)

Publication Number Publication Date
CN103716173A CN103716173A (zh) 2014-04-09
CN103716173B true CN103716173B (zh) 2017-12-01

Family

ID=50408781

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210375758.4A Active CN103716173B (zh) 2012-09-29 2012-09-29 一种存储监控***及监控告警发布的方法

Country Status (1)

Country Link
CN (1) CN103716173B (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104579836A (zh) * 2015-01-06 2015-04-29 浪潮电子信息产业股份有限公司 一种通过收发trap数据包监控存储服务器状态的方法
CN106205724A (zh) * 2015-05-05 2016-12-07 上海飞俞星信息科技有限公司 一种存储设备的报警***
CN104809246B (zh) * 2015-05-15 2019-03-26 国家电网公司 充电数据的处理方法及装置
CN105681082A (zh) * 2016-01-13 2016-06-15 浪潮集团有限公司 一种基于web的交换机监控和配置管理集成***及方法
CN106843125A (zh) * 2017-01-12 2017-06-13 佛山职业技术学院 一种生产线数据交换***
CN107360045A (zh) * 2017-08-31 2017-11-17 郑州云海信息技术有限公司 一种存储集群***的监控方法及装置
CN109391516B (zh) * 2017-12-29 2021-03-19 中国联合网络通信有限公司广东省分公司 实现多厂家utn设备集中维护管理的云化第三方网管***
CN109257232A (zh) * 2018-11-01 2019-01-22 郑州云海信息技术有限公司 网络存储设备的告警信息监控管理方法、装置及设备
CN109981362A (zh) * 2019-03-21 2019-07-05 浪潮商用机器有限公司 一种服务器硬件信息获取装置、方法、设备及介质
CN110535682A (zh) * 2019-07-19 2019-12-03 浪潮思科网络科技有限公司 一种sdn网络中设备告警信息的分析装置及方法
CN110430396A (zh) * 2019-07-29 2019-11-08 上海岚孜网络科技有限公司 一种硬件健康程度监管***
CN112866335A (zh) * 2020-12-30 2021-05-28 淮北矿业股份有限公司 一种用于矿区生产的监测***及其实时监测方法
CN115484185A (zh) * 2022-08-24 2022-12-16 国网山东省电力公司滨州供电公司 一种用于数据网络设备的在线监测报警***
CN117596175B (zh) * 2024-01-17 2024-04-16 苏州元脑智能科技有限公司 一种交换机分层监控方法、装置、设备、***及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1393801A (zh) * 2001-06-28 2003-01-29 华为技术有限公司 一种计算机网络远程网络监控方法
CN101388903A (zh) * 2008-10-16 2009-03-18 ***通信集团福建有限公司 移动企业it标准化管理平台
CN101472083A (zh) * 2007-12-25 2009-07-01 新奥特(北京)视频技术有限公司 一种电视台设备分级管理的方法
CN102298601A (zh) * 2011-05-23 2011-12-28 北京捷成世纪科技股份有限公司 面向广电行业的存储设备的监控数据转换方法及转换器

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0306237D0 (en) * 2003-03-19 2003-04-23 Marconi Comm Optical Networks Notifications in a telecommunications network

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1393801A (zh) * 2001-06-28 2003-01-29 华为技术有限公司 一种计算机网络远程网络监控方法
CN101472083A (zh) * 2007-12-25 2009-07-01 新奥特(北京)视频技术有限公司 一种电视台设备分级管理的方法
CN101388903A (zh) * 2008-10-16 2009-03-18 ***通信集团福建有限公司 移动企业it标准化管理平台
CN102298601A (zh) * 2011-05-23 2011-12-28 北京捷成世纪科技股份有限公司 面向广电行业的存储设备的监控数据转换方法及转换器

Also Published As

Publication number Publication date
CN103716173A (zh) 2014-04-09

Similar Documents

Publication Publication Date Title
CN103716173B (zh) 一种存储监控***及监控告警发布的方法
CN105282772B (zh) 无线网数通设备监控***及设备监控方法
CN110224894B (zh) 一种智能变电站过程层网络监测管理***
CN109783322A (zh) 一种企业信息***运行状态的监控分析***及其方法
CN102340415B (zh) 一种服务器集群***的监控方法和一种服务器集群***
CN107070692A (zh) 一种基于大数据分析的云平台监控服务***及方法
CN106371986A (zh) 一种日志处理运维监控***
CN102739802A (zh) 面向业务应用的it集中运维分析***
CN102523140A (zh) 一种用于电力客户服务***运维的实时监测装置
CN112688819A (zh) 一种用于网络运维综合管理***
CN111817911A (zh) 一种探测网络质量的方法、装置、计算设备及存储介质
WO2017080161A1 (zh) 云计算中报警信息的处理方法及装置
CN107124315A (zh) 基于snmp及ipmi协议的多服务器监测***及监测方法
CN102215132A (zh) 基于数据库嵌入式snmp管理端数据采集装置、***及方法
CN104394011A (zh) 一种通过告警信息支持服务器虚拟化运维的方法
CN109150869A (zh) 一种交换机信息采集分析***及方法
CN107947998A (zh) 一种基于应用***的实时监测***
CN107635003A (zh) ***日志的管理方法、装置及***
CN111488258A (zh) 一种用于软硬件运行状态分析与预警的***
CN112333020A (zh) 一种基于五元组的网络安全监测及数据报文解析***
CN109800133A (zh) 一种统一监控告警的方法、一站式监控告警平台及***
CN106789239A (zh) 面向电力业务的信息应用***故障趋势预测方法及装置
CN110061854A (zh) 一种无边界网络智能运维管理方法与***
CN205647545U (zh) 智能网络运维管理***
CN117370053A (zh) 一种面向信息***业务运行全景监测方法及***

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant