CN109840186A - 一种数据中心健康管理***及方法 - Google Patents

一种数据中心健康管理***及方法 Download PDF

Info

Publication number
CN109840186A
CN109840186A CN201910080736.7A CN201910080736A CN109840186A CN 109840186 A CN109840186 A CN 109840186A CN 201910080736 A CN201910080736 A CN 201910080736A CN 109840186 A CN109840186 A CN 109840186A
Authority
CN
China
Prior art keywords
data center
health
equipment
layer
management
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910080736.7A
Other languages
English (en)
Inventor
李娜
赵鑫
宋立伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Chaoyue CNC Electronics Co Ltd
Original Assignee
Shandong Chaoyue CNC Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Chaoyue CNC Electronics Co Ltd filed Critical Shandong Chaoyue CNC Electronics Co Ltd
Priority to CN201910080736.7A priority Critical patent/CN109840186A/zh
Publication of CN109840186A publication Critical patent/CN109840186A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明特别涉及一种数据中心健康管理***及方法。该数据中心健康管理***,***逻辑架构包括三层,第一层为健康管理模块,第二层为域管理模块,第三层为数据中心各设备;数据中心各设备分别与域管理模块相连,所述健康管理模块通过域管理模块实现与数据中心各设备的点对点连接。该数据中心健康管理***及方法,通过域管理软件实现对数据中心各个设备的健康状态信息的全面收集、综合处理、集中分发和统一展示,在显著提高数据中心***的可管理性的同时,还能提高信息***的监控性,便于信息***的管理和维护。

Description

一种数据中心健康管理***及方法
技术领域
本发明涉及数据中心监管技术领域,特别涉及一种数据中心健康管理***及方法。
背景技术
数据中心经历了四个功能阶段的发展和演进,从早期的“数据存储中心”阶段,经过“数据处理中心”和“数据应用中心”两个阶段,如今已经进入“数据运营服务中心”阶段。现阶段的数据中心已经成为绝大部分企业或组织满足基本业务运营和实现业务战略的不可或缺的一部分。无论传统制造业,还是新兴服务业,数据中心已经紧紧地和主业密不可分,牢牢捆绑在一起了。因此,数据中心的运行状况、规划发展直接影响着企业或组织的业务开发和业务运营。
依据各个设备在数据中心的逻辑位置,数据中心的设备的运行状态也是反映数据中心运行状况的关键面之一。国内外数据中心建设规范都要求对数据中心基础设施进行监控;目的是确保数据中心基础设施运行状态满足数据中心所支撑和服务的各种应用***正常运营和业务连续。由于数据中心基础设施故障造成的数据中心发生瘫痪,将会造成机构业务停顿。近几年,银行、保险、证券、民航等行业相继出现了一些数据中心故障,造成了很大的社会影响和经济损失。
数据中心基础设施的监控工作是数据中心运维管理工作的一个既基础又核心的内容,这是因为一方面基础设施为数据中心运维提供基本的和底层的物理环境资源保障,另一方面,对基础设施运行的监控数据和监控信息将成为数据中心服务管理(ITSM)的某些流程的输入(如:ITIL事件管理、容量管理等)。因此,站在IT服务的高度,对基础设施监控***进行设计是非常必要的。
基于此,本发明提出了一种数据中心健康管理***及方法。
发明内容
本发明为了弥补现有技术的缺陷,提供了一种简单高效的数据中心健康管理***及方法。
本发明是通过如下技术方案实现的:
一种数据中心健康管理***及方法,其特征在于:***逻辑架构包括三层,第一层为健康管理模块,第二层为域管理模块,第三层为数据中心各设备;数据中心各设备分别与域管理模块相连,所述健康管理模块通过域管理模块实现与数据中心各设备的点对点连接。
所述域管理模块包括核心业务单元,人机交互界面和激活管理单元,所述健康管理模块通过核心业务单元实现与数据中心各设备的点对点连接。
所述核心业务单元一方面通过以太网/IPMI协议和SNMP协议与第三层数据中心各设备的BMC软件进行通信,另一方面通过以太网/UDP协议与第一层的健康管理模块进行通信。
所述人机交互界面采用B/S架构设计,包括上层用户界面和服务端;所述上层用户界面采用WEB页面进行展示,所述服务端用于实现底层数据采集,筛选和写入数据库,并周期刷新数据库数据,最终通过数据库提供实时数据呈现给上层用户界面。
本发明数据中心健康管理***的管理方法,其特征在于:域管理模块利用核心业务单元完成对数据中心各设备的健康管理和资源监控;健康管理模块对于第三层数据中心各设备的查询为点对点形式,对每一个设备状态的查询,都有单独一条请求消息,域管理模块接收到请求信息后,将相应设备的健康管理和资源监控信息数据返回给健康管理模块;所述域管理模块利用人机交互界面呈现对数据中心域管理的实时数据。
所述域管理模块利用激活管理单元维护域管理软件版权,使之处于激活状态。
所述所述激活管理单元要求在域管理模块安装过程中,根据用户计算机的硬件信息生成注册信息和激活文件,并在域管理模块运行时通过监测进程实时监测域管理模块的激活状态。
所述数据中心各设备包括计算机,千兆交换机,万兆交换机,服务器和存储控制设备。
本发明的有益效果是:该数据中心健康管理***及方法,通过域管理软件实现对数据中心各个设备的健康状态信息的全面收集、综合处理、集中分发和统一展示,在显著提高数据中心***的可管理性的同时,还能提高信息***的监控性,便于信息***的管理和维护。
附图说明
附图1为本发明数据中心健康管理***示意图。
具体实施方式
为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚明白,以下结合附图和实施例,对本发明进行详细的说明。应当说明的是,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
该数据中心健康管理***,***逻辑架构包括三层,第一层为健康管理模块,第二层为域管理模块,第三层为数据中心各设备;数据中心各设备分别与域管理模块相连,所述健康管理模块通过域管理模块实现与数据中心各设备的点对点连接。
所述域管理模块包括核心业务单元,人机交互界面和激活管理单元,所述健康管理模块通过核心业务单元实现与数据中心各设备的点对点连接。
所述核心业务单元一方面通过以太网/IPMI协议和SNMP协议与第三层数据中心各设备的BMC(Baseboard Management Controller,基板管理控制器)软件进行通信,另一方面通过以太网/UDP协议与第一层的健康管理模块进行通信。
BMC支持行业标准的IPMI规范。该规范描述了已经内置到主板上的管理功能。这些功能包括:本地和远程诊断、控制台支持、配置管理、硬件管理和故障排除。
IPMI(Intelligent Platform Management Interface,智能平台管理接口)协议被广泛用于服务器监控中,包括采集CPU温度、风扇转速、主板温度,以及远程开关机等等。
作为一个智能平台管理接口,用户可以利用IPMI监视服务器等设备的物理特征,如各部件的温度、电压、风扇工作状态、电源供应以及机箱入侵等。
IPMB总线上连接着各个管理控制器,分别执行不同功能。
IPMB总线上还连接着一些I2C器件,用来作为传感器的接口,让***管理软件能够通过IPMI来读取传感器的数据。
此外,在IPMB总线上,还可以外接其他的用户板,用来扩展IPMI管理平台的功能。
而且IPMI独立于硬件和操作***,无论是CPU、BIOS,还是OS出现故障,都不会影响IPMI的工作。因为IPMI的硬件设备BMC(Baseboard Management Controller,基板管理控制器)是一个独立的板卡,独立供电。因此,IPMI可以监测和控制其他***组件以最大限度地降低对***的整体影响,同时能够发送消息派遣技术人员。IPMI的预告故障能力也有助于IT周期的管理。通过检查***事件日志(SEL),可以更轻松的预先判定故障组件。
SNMP(Simple Network Management Protocol,简单网络管理协议)协议由一组网络管理的标准组成,包含一个应用层协议(application layer protocol)、数据库模型(data base schema),和一组资料物件。该协议能够支持网络管理***,用以监测连接到网络上的设备是否有任何引起管理上关注的情况。该协议是互联网工程工作小组(IETF,Internet Engineering Task Force)定义的Internet协议簇的一部分。
SNMP协议为应用层协议,是TCP/IP协议族的一部分。它通过用户数据报协议(UDP)来操作。在分立的管理站中,管理者进程对位于管理站中心的MIB的访问进行控制,并提供网络管理员接口。管理者进程通过SNMP完成网络管理。SNMP协议在UDP、IP及有关的特殊网络协议(如Ethernet,FDDI,X.25)之上实现。
UDP(User Datagram Protocol,用户数据报协议)协议是OSI参考模型中一种无连接的传输层协议,它主要用于不要求分组顺序到达的传输中,分组传输顺序的检查与排序由应用层完成,提供面向事务的简单不可靠信息传送服务。UDP协议基本上是IP协议与上层协议的接口。UDP协议适用端口分别运行在同一台设备上的多个应用程序。
所述人机交互界面采用B/S架构设计,包括上层用户界面和服务端;所述上层用户界面采用WEB页面进行展示,所述服务端用于实现底层数据采集,筛选和写入数据库,并周期刷新数据库数据,最终通过数据库提供实时数据呈现给上层用户界面。
该数据中心健康管理***的管理方法,域管理模块利用核心业务单元完成对数据中心各设备的健康管理和资源监控;健康管理模块对于第三层数据中心各设备的查询为点对点形式,对每一个设备状态的查询,都有单独一条请求消息,域管理模块接收到请求信息后,将相应设备的健康管理和资源监控信息数据返回给健康管理模块;所述域管理模块利用人机交互界面呈现对数据中心域管理的实时数据。
所述域管理模块利用激活管理单元维护域管理软件版权,使之处于激活状态。
所述所述激活管理单元要求在域管理模块安装过程中,根据用户计算机的硬件信息生成注册信息和激活文件,并在域管理模块运行时通过监测进程实时监测域管理模块的激活状态。
所述数据中心各设备包括计算机,千兆交换机,万兆交换机,服务器和存储控制设备。
该数据中心健康管理***及方法,是一个以计算机软件技术为基础,利用网络技术、数据库技术、通信技术、嵌入式技术、工业自动控制技术、新型传感技术等构成的专业化、自动化、智能化的综合监控管理***。通过在***管理软件和各种大中小型服务器、计算机、交换机、存储设备间建立域管理,实现各个设备的健康状态信息的全面收集、综合处理、集中分发和统一展示,在显著提高数据中心***的可管理性的同时,还能提高信息***的监控性,便于信息***的管理和维护。

Claims (8)

1.一种数据中心健康管理***及方法,其特征在于:***逻辑架构包括三层,第一层为健康管理模块,第二层为域管理模块,第三层为数据中心各设备;数据中心各设备分别与域管理模块相连,所述健康管理模块通过域管理模块实现与数据中心各设备的点对点连接。
2.根据权利要求1所述的数据中心健康管理***及方法,其特征在于:所述域管理模块包括核心业务单元,人机交互界面和激活管理单元,所述健康管理模块通过核心业务单元实现与数据中心各设备的点对点连接。
3.根据权利要求2所述的数据中心健康管理***及方法,其特征在于:所述核心业务单元一方面通过以太网/IPMI协议和SNMP协议与第三层数据中心各设备的BMC软件进行通信,另一方面通过以太网/UDP协议与第一层的健康管理模块进行通信。
4.根据权利要求2或3所述的数据中心健康管理***及方法,其特征在于:所述人机交互界面采用B/S架构设计,包括上层用户界面和服务端;所述上层用户界面采用WEB页面进行展示,所述服务端用于实现底层数据采集,筛选和写入数据库,并周期刷新数据库数据,最终通过数据库提供实时数据呈现给上层用户界面。
5.根据权利要求1~4所述的数据中心健康管理***的管理方法,其特征在于:域管理模块利用核心业务单元完成对数据中心各设备的健康管理和资源监控;健康管理模块对于第三层数据中心各设备的查询为点对点形式,对每一个设备状态的查询,都有单独一条请求消息,域管理模块接收到请求信息后,将相应设备的健康管理和资源监控信息数据返回给健康管理模块;所述域管理模块利用人机交互界面呈现对数据中心域管理的实时数据。
6.根据权利要求5所述的数据中心健康管理***的管理方法,其特征在于:所述域管理模块利用激活管理单元维护域管理软件版权,使之处于激活状态。
7.根据权利要求6所述的数据中心健康管理***的管理方法,其特征在于:所述所述激活管理单元要求在域管理模块安装过程中,根据用户计算机的硬件信息生成注册信息和激活文件,并在域管理模块运行时通过监测进程实时监测域管理模块的激活状态。
8.根据权利要求6或7所述的数据中心健康管理***的管理方法,其特征在于:所述数据中心各设备包括计算机,千兆交换机,万兆交换机,服务器和存储控制设备。
CN201910080736.7A 2019-01-28 2019-01-28 一种数据中心健康管理***及方法 Pending CN109840186A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910080736.7A CN109840186A (zh) 2019-01-28 2019-01-28 一种数据中心健康管理***及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910080736.7A CN109840186A (zh) 2019-01-28 2019-01-28 一种数据中心健康管理***及方法

Publications (1)

Publication Number Publication Date
CN109840186A true CN109840186A (zh) 2019-06-04

Family

ID=66884264

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910080736.7A Pending CN109840186A (zh) 2019-01-28 2019-01-28 一种数据中心健康管理***及方法

Country Status (1)

Country Link
CN (1) CN109840186A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110691128A (zh) * 2019-09-25 2020-01-14 华东计算技术研究所(中国电子科技集团公司第三十二研究所) 基于ipmi***健康管理中间件的通信方法、***、介质及设备
CN111124838A (zh) * 2019-12-27 2020-05-08 山东超越数控电子股份有限公司 一种基于网络的机柜多节点管理方法
CN113900911A (zh) * 2021-12-09 2022-01-07 中国电子科技集团公司第十五研究所 健康管理***

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101699827A (zh) * 2009-10-28 2010-04-28 浪潮电子信息产业股份有限公司 一种采用smi-s规范的统一存储网络体系管理架构
CN103973815A (zh) * 2014-05-27 2014-08-06 浪潮电子信息产业股份有限公司 一种跨数据中心存储环境统一监控方法
US8990639B1 (en) * 2012-05-31 2015-03-24 Amazon Technologies, Inc. Automatic testing and remediation based on confidence indicators
CN109088785A (zh) * 2018-06-14 2018-12-25 苏州新研联信息科技有限公司 一种idc数据中心设备管理***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101699827A (zh) * 2009-10-28 2010-04-28 浪潮电子信息产业股份有限公司 一种采用smi-s规范的统一存储网络体系管理架构
US8990639B1 (en) * 2012-05-31 2015-03-24 Amazon Technologies, Inc. Automatic testing and remediation based on confidence indicators
CN103973815A (zh) * 2014-05-27 2014-08-06 浪潮电子信息产业股份有限公司 一种跨数据中心存储环境统一监控方法
CN109088785A (zh) * 2018-06-14 2018-12-25 苏州新研联信息科技有限公司 一种idc数据中心设备管理***

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110691128A (zh) * 2019-09-25 2020-01-14 华东计算技术研究所(中国电子科技集团公司第三十二研究所) 基于ipmi***健康管理中间件的通信方法、***、介质及设备
CN111124838A (zh) * 2019-12-27 2020-05-08 山东超越数控电子股份有限公司 一种基于网络的机柜多节点管理方法
CN113900911A (zh) * 2021-12-09 2022-01-07 中国电子科技集团公司第十五研究所 健康管理***

Similar Documents

Publication Publication Date Title
CN102347983B (zh) 面向服务的体系结构下的企业服务总线***
CN104104543B (zh) 一种基于snmp和ipmi协议的服务器管理***及方法
CN103339611B (zh) 具有mss功能的远程访问装置
US6711613B1 (en) Remote power control system
CN109840186A (zh) 一种数据中心健康管理***及方法
CN104463492A (zh) 一种电力***云仿真平台的运营管理方法
CN105138398B (zh) 同步通信模式下socket通信与进程管理通用平台及方法
CN104113596A (zh) 一种私有云的云监控***及方法
CN106774220A (zh) 一种火电厂分布式控制***在线运行状态监测平台
Bautista et al. Collecting, monitoring, and analyzing facility and systems data at the national energy research scientific computing center
CN108092813A (zh) 数据中心综合管理***服务器硬件管理框架及实现方法
CN103139248B (zh) 机架***
CN102132252A (zh) 用于虚拟基础设施的集中式控制平面器具
CN102523140A (zh) 一种用于电力客户服务***运维的实时监测装置
CN104683147B (zh) 一种对大规模数据中心硬件管理方法及***
CN105389244B (zh) 一种服务器监控方法及装置
CN105373462A (zh) 一种整机柜服务器管理的方法及***
CN109391516A (zh) 实现多厂家utn设备集中维护管理的云化第三方网管***
CN107910956A (zh) 一种主厂站一体化的电网调度自动化运行综合监管方法
CN108199860A (zh) 一种告警处理方法及网络设备
CN102891756A (zh) 主动式电源管理架构及其管理方法
WO2019095448A1 (zh) 一种远程教育***的服务器群的监测***
CN108616428A (zh) 一种远程管理rack机房的移动app实施方法
CN108234150A (zh) 用于数据中心监控***的数据采集和处理方法及***
CN105893211A (zh) 一种监控的方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190604