CN108259270A - 一种数据中心统一管理***设计方法 - Google Patents

一种数据中心统一管理***设计方法 Download PDF

Info

Publication number
CN108259270A
CN108259270A CN201810026547.7A CN201810026547A CN108259270A CN 108259270 A CN108259270 A CN 108259270A CN 201810026547 A CN201810026547 A CN 201810026547A CN 108259270 A CN108259270 A CN 108259270A
Authority
CN
China
Prior art keywords
monitoring
data
data center
unified management
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810026547.7A
Other languages
English (en)
Inventor
李俊山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201810026547.7A priority Critical patent/CN108259270A/zh
Publication of CN108259270A publication Critical patent/CN108259270A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/04Network management architectures or arrangements
    • H04L41/042Network management architectures or arrangements comprising distributed management centres cooperatively managing the network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Environmental & Geological Engineering (AREA)
  • Mathematical Physics (AREA)
  • Computer And Data Communications (AREA)

Abstract

本发明公开了一种数据中心的统一管理***设计方法,包括如下步骤:将数据中心的服务器节点划分为多个监控主机、服务器组件,与统一管理***服务器组成多线程监控***;为多线程监控***配置模块化的可扩展协议接口;为多线程监控***设置带有数据收敛层的数据处理方法;多线程监控***中的统一管理***主服务器与监控主机之间、监控主机与服务器节点之间采用主动轮训与被动轮询相融合的监控方法。本发明的设计方法有助于数据中心的统一管理,尤其是在涉及物理资源与虚拟资源同时需要监控的场景,实现数据中心对大规模基础资源统一高效的监控管理。

Description

一种数据中心统一管理***设计方法
技术领域
本发明涉及数据中心技术领域,尤其一种数据中心统一管理***设计方法。
背景技术
模块化数据中心Module Data Center缩写为MDC,是基于云计算的新一代数据中心部署形式,通过将数据中心模块化,最大程度的降低基础设施对机房环境的耦合,提高数据中心的整体运营效率。
数据中心基础设施是云计算架构的核心,它提供给用户对包括CPU、内存、存储、网络等计算资源的使用,有效减轻了IT运维的成本和复杂性。云计算架构相比于传统服务器集群架构,除了对Web服务器、应用服务器等物理资源的管理,还需要对CPU、内存、存储、网络、虚拟机等虚拟资源的统一管理。
数据中心的管理***是数据中心内部配置的重要组成部分,主要包括UPS、配电柜、空调、门禁、传感器等多种监控对象,简称数据中心综合管理***,核心设备硬件为动环监控主机,软件为数据中心综合管理***平台软件。
目前,数据中心统一管理***从结构上分为集中式和分层式两种体系模式。集中式体系由管理***服务器和监控代理两部分组成,管理***服务器设在特定的服务器上,同时负责对数据进行分析、处理、存储以及数据展示,负责对监控代理进行动态配置;监控代理被分布到每一个需要监控的节点上,采集被监控资源的监控数据并发送给管理***服务器,监控代理同时要接收管理***服务器发送的控制指令;分层式体系中监控代理被分成层结构的若干组,每个组中有若干台监控节点对本组事物进行处理,每一组相当于一个集中式数据中心统一管理***,局部监控节点充当数据中心统一管理***服务器的角色,全局监控节点负责监控每个局部监控节点。
集中式体系中由于管理***服务器单点接收监控数据存入,因此容易发生单点失效的问题,且大量监控数据传输会导致网络拥塞;分层式体系虽然解决了单点失效问题,但对指定节点的访问需要逐层传递数据,导致访问效率降低,部署较为复杂。
如中国专利(申请公布号CN106707951A)公开了“一种数据中心的智能化管理***及管理方法”该发明利用管理后台与多台网络控制服务器连接,通过网络控制服务器实现与数据中心柜中各个信息采集模块的信息连接,所述网络控制服务器还可通过多台动力环境综合监控主机连接,通过动力环境综合监控主机与数据中心柜实现数据传输,并通过IP地址访问,完成整个机房***的一站式监控,节省带宽资源,并且实现对该项目所有机房动力与环境***进行365*24小时全方位的统一集中监控管理并作出异常报警处理。虽然该方法改善了数据中心管理***的性能,但管理***的数据处理效率仍然有限。
发明内容
本发明提出一种数据中心统一管理***设计方法,用于解决现有的管理***效率较低的问题。
本发明通过以下技术方案予以实现:
一种数据中心的统一管理***设计方法,包括如下步骤:
将数据中心的服务器节点划分为多个监控主机、服务器组件,与统一管理***服务器组成多线程监控***;
为多线程监控***配置模块化的可扩展协议接口;
为多线程监控***设置带有数据收敛层的数据处理方法;
多线程监控***中的统一管理***主服务器与监控主机之间、监控主机与服务器节点之间采用主动轮训与被动轮询相融合的监控方法。
如上所述的一种数据中心统一管理***设计方法,所述多线程监控***为分布式并行工作方式,每个监控主机根据其管理的服务器节点数量弹性调节数据处理与数据收敛层的组件个数。
如上所述的一种数据中心统一管理***设计方法,所述协议接口包括智能平台管理接口IPMI、Redfish协议、网络管理SNMP协议、Modbus协议、Web Service协议,协议接口可以通过自定义协议进行扩展。
如上所述的一种数据中心统一管理***设计方法,所述监控方法包括正常状态时的主动轮训与异常状态时的被动轮询;主动轮训时被监控的服务器节点在设定周期内将状态报告给监控主机,同时,监控主机间隔多个设定周期主动向被监控服务器节点发送请求,检查被监控资源是否存活、可用;当监控主机在设定周期内无信息反馈,向被监控服务器节点进行被动轮询,以确认被监控服务器节点状态和异常进行报警。
如上所述的一种数据中心统一管理***设计方法,所述数据处理方法包括Portal界面层、平台管理层、数据收敛层、被管理对象层;所述Portal界面层用于提供数据中心资源监控的图形和报表展现、日志管理和报警处理功能;所述平台管理层用于对采集到的监控数据进行统计、分析和挖掘,对数据中心的状态做出准确的评估和预测,为所述Portal界面层的展现提供数据支撑;所述为监控***进行数据采集,并配置可扩展协议接口,实现对监控数据的采集,并存储到数据库中;所述被管理对象层为数据中心的被监控的硬件和软件资源,包括各种服务器、存储、网络设备、数据库和应用服务、UPS、配电柜、精密空调、门禁、温湿度传感器、烟雾探测器、温感探测器、漏水传感器、翻转天窗及网络摄像机等多种监控对象。
如上所述的一种数据中心统一管理***设计方法,所述数据收敛层包括监控核心引擎、监控调度进程、告警引擎、数据处理中心、主动式检测轮询器、被动式检测轮询器、模块化的可扩展协议接口、数据存储组件,对数据中心的被监控的硬件和软件资源的数据采集与监控,为数据中心稳定运行提供数字化支持。
与现有技术相比,本发明的优点是:
1、本发明的设计方法有助于数据中心的统一管理,尤其是在涉及物理资源与虚拟资源同时需要监控的场景,实现数据中心对大规模基础资源统一高效的监控管理。
2、本发明通过设置多线程监控架构、模块化的可柔性扩展协议接口、主动轮训与被动轮询相融合的监控方式以及监控数据收敛层的管理方法等措施,数据采集方式多样和数据中心统一管理,构建一个高效、稳定的数据中心统一管理***。具体而言,本发明可以实现的功能包括:
(1)可以实现对不同厂商、不同架构、不同形态的基础设施进行资源管理、状态监控和性能监控;涵盖计算、存储、网络三大类资源;提供丰富的监控项类型,包括可以查看当前计算机CPU、内存、硬盘等的利用率,可以查看网络流量、磁盘I/O、进程数等;可以随着数据中心的规模扩展,也可以横向扩展监控设备数量。
(2)实现了对异构的基础软件资源进行资产管理、状态监控和性能监控;支持对Linux/Unix以及Windows操作***的监控,查看当前的进程与服务信息;支持对Tomcat、IIS、Apache等应用服务器,以及SQL Server、MySQL、Oracle等数据库服务器的监控。
(3)实现了在***硬件、负载出现异常时触发报警,提醒用户及时维护问题设备;对基础软硬件资源的负载进行长期的统计分析,为资源调度提供决策依据。通过对监控数据的分析,对数据中心资源管理***的其他高级功能进行数据支持,有效保证应用的连续性及快速响应。
(4)可以对包括UPS、配电柜、精密空调、门禁、温湿度传感器、烟雾探测器、温感探测器、漏水传感器、翻转天窗及网络摄像机等多种监控对象进行有效监控和管理。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍。
图1是本发明的流程示意图;
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。
如图1所示,本实施例公开的一种数据中心的统一管理***设计方法,包括如下步骤:
将数据中心的服务器节点划分为多个监控主机、服务器组件,与统一管理***服务器组成多线程监控***;
为多线程监控***配置模块化的可扩展协议接口;
为多线程监控***设置带有数据收敛层的数据处理方法;
多线程监控***中的统一管理***主服务器与监控主机之间、监控主机与服务器节点之间采用主动轮训与被动轮询相融合的监控方法。
具体而言,本实施例公开的管理***设计方法,能够很好的解决数据中心动态增加的大量设备和应用的问题,提高管理***的数据处理效率,且随着监控规模的增大,获取的监控数据量也会急剧增加,此时单线程的调度和轮询会影响到监控数据的及时性、有效性,而本发明通过监控主机多线程并行工作方式能够活的较高的数据采集、处理等监控性能。
数据中心统一管理***配置了多线程监控架构,在每个监控主机中根据其管理的服务器节点规模,智能的增加数据处理与数据收敛层的组件个数,并使每个组件只服务于特定数量的服务器采集处理,该特定数量是根据单线程在不影响***性能,能够采集处理的最大服务器数。通过多线程并行处理的方式,提高监控主机的利用率和***吞吐量,提高采集数据的实时性。分布式并行多线程监控架。在大规模云计算的环境下,可使用分布式部署功能对监控主机根据监控负载进行扩展伸缩,动态增加监控服务器节点的数量,保证在数据中心扩张的时候,数据采集处理的性能不会下降。
本实施例为多线程监控***配置模块化的可扩展协议接口。由于在数据中心,监控的资源类型也会随着数据中心规模发展、技术进步而不断增加和演变,这对协议接口也提出了扩展性要求。
通过对监控的数据采集采用统一的接口可以解决协议接口扩展的难题。在监控平台中已经实现了多种不同的监控协议,如IPMI、SNMP、Modbus、Web Service协议等,同时允许增加自定义协议对统一接口进行扩展。包括IPMI协议的服务器硬件监控协议接口、Redfish协议的服务器硬件监控协议接口、SNMP协议的网络设备监控协议接口、SNMP协议的操作***资源信息监控协议接口、异构数据库的应用程序信息监控协议接口、异构Web应用服务器状态信息监控协议接口。
其中,IPMI协议是一个开放的免费监控标准,用户可以利用IPMI监视符合协议设备的物理状态信息,如CPU温度、电压、风扇工作状态、电源状态等。IPMI的优点是能够横跨不同的操作***、固件和硬件平台,可以智慧的监视、控制和主动发送大量服务器的运行状态。IPMI既可以独立于操作***外自行运作,也能在操作***启动后活动,与***管理功能一并使用时还能提供加强功能。IPMI的核心是一个专用芯片或控制器BMC,可以不用依赖服务器的处理器、BIOS或操作***来工作,具有很好的独立性能。只要有BMC与IPMI固件便可以作为一个单独***运行,其是无代理管理模式,BMC通常是一个安装在服务器主板上的独立的板卡,也有服务器主板直接提供对IPMI支持IPMI良好的自治特性克服了基于操作***监控方式的限制,只要接通电源,IPMI就可以进行开关机和监控信息采集等操作。
Redfish协议是一种新的服务器管理标准,它利用超媒体RESTful接口表达数据,易于使用和实现;它面向模型,能够表达现代***组件之间的关系以及服务和组件的语义,容易延伸。
SNMP协议是由一组网络管理的标准组成的,包含应用层协议、数据库模型和一组资源对象。SNMP支持网络管理***,用以监测连接到网络上的设备的状态,对于设备的异常情况进行关注和报警。
ModBus网络协议是一个工业通信***,适用于数据中心应用场景,由带智能终端的监控主机连接而成。其***结构既包括硬件、亦包括软件。它可应用于数据中心各种数据采集、监控。
Web service协议是一个平***立的,低耦合的,自包含的、基于可编程的web的应用程序,可使用开放的XML标准来描述、发布、发现、协调和配置这些应用程序,用于开发分布式的互操作的应用程序。
Web Service协议能使得运行在不同机器上的不同应用无须借助附加的、专门的第三方软件或硬件,就可相互交换数据或集成。依据Web Service规范实施的应用之间,无论它们所使用的语言、平台或内部协议是什么,都可以相互交换数据。Web Service也很容易部署,因为它们基于一些常规的产业标准以及已有的一些技术,诸如标准通用标记语言下的子集XML、HTTP。Web Service减少了应用接口的花费,为数据中心的业务流程的集成提供了一个通用机制。
多线程监控***对其他用于获取监控数据的协议,或者需要继承第三方的接口,都可以在该兼容多模式的模块化协议接口下做到无缝集成,而不必对现有的监控架构做出大的调整。通过协议扩展模式不仅可以对硬件资源进行监控,还支持对应用级别的资源进行模拟访问式监控。即针对Web应用采用模拟提交http请求提交的方式获取相关监控数据,针对数据库应用采用模拟客户端提交SQL请求的方式获取相关监控数据。
多线程监控***中的统一管理***主服务器与监控主机之间、监控主机与服务器节点之间采用主动轮训与被动轮询相融合的监控方法。一般情况下,被监控机高频地将状态报告给监控机,同时,监控机按照一个较长的间隔周期向被监控资源主动发送请求,检查被监控资源是否存活、可用。此外,一旦监控机在规定的时间内没收到被监控机的信息,就要向被监控机发请求去轮询,确认被监控机的状态,这样就可以及时确定数据中心资源的运行状态,并对各类异常进行报警。
多线程监控***可实现对大规模数据中心的资源监控,支持分布式部署和异构平台,提供丰富的监控项类型和监控对象,监控项类型包括CPU使用率、CPU负载率、内存使用率、网络流量、磁盘空间使用率、磁盘I/O、进程数、数据库可用性、应用服务器可用性等,并支持监控协议和监控项的动态扩展。支持对Linux/Unix服务器以及Windows服务器的监控。监控对象包括UPS、配电柜、精密空调、门禁、温湿度传感器、烟雾探测器、温感探测器、漏水传感器、翻转天窗及网络摄像机等多种。
通过对监控数据的分析,对数据中心资源调度管理或运维***,如负载均衡、故障恢复等进行数据支持,有效保证数据中心应用的连续性及故障的快速响应。根据之前某段时间的监测,基于监测数据进行提供预测值,提前对***进行维护,防止意外情况的发生。
进一步的,本实施例中采用的数据处理方法包括Portal界面层、平台管理层、数据收敛层、被管理对象层四层。
Portal界面层主要向数据中心管理人员提供数据中心资源监控的直观的图形和报表展现、日志管理和报警处理功能。
平台管理层主要是对采集到的监控数据进行统计、分析和挖掘,对数据中心的状态做出准确的评估和预测,为Portal界面层的展现提供数据支撑。
数据收敛层是监控平台最重要的部分,承担了监控平台最重要的数据采集功能,也是平台性能的关键,该层配置多模式可扩展的协议接口,实现对监控数据的采集,并存储到数据库中。
被管理对象层是数据中心的各种硬件和软件资源,包括各种服务器、存储、网络设备、数据库和应用服务、UPS、配电柜、精密空调、门禁、温湿度传感器、烟雾探测器、温感探测器、漏水传感器、翻转天窗及网络摄像机等多种监控对象等。
其中,配置的数据收敛层功能是监控平台的核心功能,承担着准确、及时地收集和处理各种资源状态数据的任务。
数据收敛层包括监控核心引擎、监控调度进程、告警引擎、数据处理中心、主动式检测轮询器、被动式检测轮询器、模块化的可扩展协议接口、数据存储等八个主要组件,组件之间相互协作,各司其职,最终实现针对数据中心中的服务器、存储、网络设备、数据库和应用服务、UPS、配电柜、精密空调、门禁、温湿度传感器、烟雾探测器、温感探测器、漏水传感器、翻转天窗及网络摄像机等多种监控对象等的数据采集与监控,为数据中心良好稳定的运行提供数字化支持。数据处理中心是把采集的数据进行处理分析,为数据中心的平台管理提供支持。
监控数据收敛层的主要模块的功能设计如下:
(1)监控核心引擎:承担监控管理功能,负责读取配置文件,分发监控配置到其他组件,保证其他组件对检测数据的处理一致性,检测其他引擎是否处于正常工作中,发命令驱动调度进程采集数据等。并提供在Web页面上的管理入口,允许管理员对监控功能进行配置,***支持根据监控对象数量和调度进程数量,扩展监控配置的数量。
(2)监控调度进程:根据分发的配置文件,主动轮询监控对象的状态,或接收轮询器反馈上来的监控数据,对监控数据进行判断,当有某项指标超出阈值时,生成某种事件并放入队列,同时把处理的数据传递到数据处理中心。
(3)告警引擎:负责定期的询问调度进程中的队列,针对队列中的事件进行特定的处理,例如对某些故障进行自动化诊断和处理,或者发送告警邮件、短信通知管理员。
(4)数据处理中心:对采集上来的监控数据,在经过调度进程处理后,持久化到数据库中,作为历史数据,生成监控趋势图、历史状态图等统计信息。
(5)主动监控轮询器:定期主动访问模块化的可扩展协议接口,获取配置文件中规定的检测数据,并将数据反馈给监控调度进程进行处理。
(6)被动监控轮询器:由模块化的可扩展协议接口定时进行驱动,被动的接收协议接口获取的配置文件中规定的检测数据,并将数据反馈给监控调度进程进行处理。
(7)模块化的可扩展协议接口:该协议接口实现了IPMI协议、SNMP协议、数据库和应用服务监控模块等,用各种命令和模拟访问的方式获取监控数据。而且该协议接口支持模块式的集成,允许自定义的协议、第三方模块或者未来出现的某种协议无缝的集成到该协议接口中。
(8)数据存储:支持对多种数据库的读取与写入。
本发明对数据中心的大规模基础资源实现统一高效的监控管理,主要实现的功能包括:
(1)实现了对不同厂商、不同架构、不同形态的基础设施进行资产管理、状态监控和性能监控,包括虚拟或物理类型;涵盖物理计算资源和虚拟计算资源、本地存储、共享存储、分布式存储等存储方式、网络三大类资源;提供丰富的监控项类型,包括可以查看当前计算机CPU、内存、硬盘等的利用率,可以查看网络流量、磁盘I/O、进程数等;可以随着数据中心的规模扩展,也可以横向扩展监控设备数量。
(2)实现了对异构的基础软件资源进行资产管理、状态监控和性能监控;支持对Linux/Unix以及Windows操作***的监控,查看当前的进程与服务信息;支持对Tomcat、IIS、Apache等应用服务器,以及SQL Server、MySQL、Oracle等数据库服务器的监控。
(3)实现了在***硬件、负载出现异常时触发报警,提醒用户及时维护问题设备;对基础软硬件资源的负载进行长期的统计分析,为资源调度提供决策依据。通过对监控数据的分析,对数据中心资源管理***的其他高级功能(如负载均衡、故障恢复等)进行数据支持,有效保证应用的连续性及快速响应。
(4)实现了包括UPS、配电柜、精密空调、门禁、温湿度传感器、烟雾探测器、温感探测器、漏水传感器、翻转天窗及网络摄像机等多种监控对象的管理。
本发明未详尽描述的技术内容均为公知技术。

Claims (6)

1.一种数据中心的统一管理***设计方法,其特征在于,包括如下步骤:
将数据中心的服务器节点划分为多个监控主机、服务器组件,与统一管理***服务器组成多线程监控***;
为多线程监控***配置模块化的可扩展协议接口;
为多线程监控***设置带有数据收敛层的数据处理方法;
多线程监控***中的统一管理***主服务器与监控主机之间、监控主机与服务器节点之间采用主动轮训与被动轮询相融合的监控方法。
2.根据权利要求1所述的一种数据中心统一管理***设计方法,其特征在于,所述多线程监控***为分布式并行工作方式,每个监控主机根据其管理的服务器节点数量弹性调节数据处理与数据收敛层的组件个数。
3.根据权利要求1所述的一种数据中心统一管理***设计方法,其特征在于,所述协议接口包括智能平台管理接口IPMI、Redfish协议、网络管理SNMP协议、Modbus协议、WebService协议,协议接口可以通过自定义协议进行扩展。
4.据权利要求1所述的一种数据中心统一管理***设计方法,其特征在于,所述监控方法包括正常状态时的主动轮训与异常状态时的被动轮询;主动轮训时被监控的服务器节点在设定周期内将状态报告给监控主机,同时,监控主机间隔多个设定周期主动向被监控服务器节点发送请求,检查被监控资源是否存活、可用;当监控主机在设定周期内无信息反馈,向被监控服务器节点进行被动轮询,以确认被监控服务器节点状态和异常进行报警。
5.据权利要求1所述的一种数据中心统一管理***设计方法,其特征在于,所述数据处理方法包括Portal界面层、平台管理层、数据收敛层、被管理对象层;所述Portal界面层用于提供数据中心资源监控的图形和报表展现、日志管理和报警处理功能;所述平台管理层用于对采集到的监控数据进行统计、分析和挖掘,对数据中心的状态做出准确的评估和预测,为所述Portal界面层的展现提供数据支撑;所述为监控***进行数据采集,并配置可扩展协议接口,实现对监控数据的采集,并存储到数据库中;所述被管理对象层为数据中心的被监控的硬件和软件资源,包括各种服务器、存储、网络设备、数据库和应用服务、UPS、配电柜、精密空调、门禁、温湿度传感器、烟雾探测器、温感探测器、漏水传感器、翻转天窗及网络摄像机等多种监控对象。
6.据权利要求1所述的一种数据中心统一管理***设计方法,其特征在于,所述数据收敛层包括监控核心引擎、监控调度进程、告警引擎、数据处理中心、主动式检测轮询器、被动式检测轮询器、模块化的可扩展协议接口、数据存储组件,对数据中心的被监控的硬件和软件资源的数据采集与监控,为数据中心稳定运行提供数字化支持。
CN201810026547.7A 2018-01-11 2018-01-11 一种数据中心统一管理***设计方法 Pending CN108259270A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810026547.7A CN108259270A (zh) 2018-01-11 2018-01-11 一种数据中心统一管理***设计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810026547.7A CN108259270A (zh) 2018-01-11 2018-01-11 一种数据中心统一管理***设计方法

Publications (1)

Publication Number Publication Date
CN108259270A true CN108259270A (zh) 2018-07-06

Family

ID=62726147

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810026547.7A Pending CN108259270A (zh) 2018-01-11 2018-01-11 一种数据中心统一管理***设计方法

Country Status (1)

Country Link
CN (1) CN108259270A (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108536555A (zh) * 2018-08-03 2018-09-14 中国人民解放军国防科技大学 一种基于BCube(n,b)数据中心的数据存取方法
CN109828868A (zh) * 2019-01-04 2019-05-31 新华三技术有限公司成都分公司 数据存储方法、装置、管理设备和双活数据存储***
CN109933497A (zh) * 2019-03-12 2019-06-25 国网江西省电力有限公司赣州供电分公司 一种数据中心运行监管***
WO2020015061A1 (zh) * 2018-07-18 2020-01-23 平安科技(深圳)有限公司 WebLogic服务器的监控告警方法、装置、***及计算机存储介质
CN110913662A (zh) * 2019-12-03 2020-03-24 中国工商银行股份有限公司 用于数据中心的管理方法、装置、电子设备及介质
CN111049881A (zh) * 2019-10-30 2020-04-21 烽火通信科技股份有限公司 一种云平台节点资源监控方法、***及计算机可读介质
CN111563018A (zh) * 2020-04-28 2020-08-21 北京航空航天大学 一种人机物融合云计算平台的资源管理和监控方法
CN111817883A (zh) * 2020-06-23 2020-10-23 赛特斯信息科技股份有限公司 一种多数据中心资源智能调度控制***
CN112199197A (zh) * 2020-10-23 2021-01-08 网易(杭州)网络有限公司 一种服务器管理方法及***
CN112882903A (zh) * 2020-12-23 2021-06-01 沈阳世纪高通科技有限公司 一种分布式监控方法
WO2021212748A1 (zh) * 2020-04-23 2021-10-28 苏州浪潮智能科技有限公司 一种服务器传感器的轮循方法、***及相关装置
CN114283520A (zh) * 2021-12-27 2022-04-05 苏州智康信息科技股份有限公司 自助机监控管理方法
WO2022067915A1 (zh) * 2020-09-30 2022-04-07 苏州艾隆科技股份有限公司 运维监控方法、装置、存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7599293B1 (en) * 2002-04-25 2009-10-06 Lawrence Michael Bain System and method for network traffic and I/O transaction monitoring of a high speed communications network
CN101931592A (zh) * 2010-08-26 2010-12-29 北京科技大学 一种基于wsn的矿下安全监控***网关设备
CN103389715A (zh) * 2013-07-26 2013-11-13 浪潮电子信息产业股份有限公司 一种高性能的分布式数据中心监控架构
CN105305624A (zh) * 2015-10-28 2016-02-03 成都振中电气有限公司 一种智能电力监控***
CN105635279A (zh) * 2015-12-29 2016-06-01 长城信息产业股份有限公司 一种分布式监控***及数据采集方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7599293B1 (en) * 2002-04-25 2009-10-06 Lawrence Michael Bain System and method for network traffic and I/O transaction monitoring of a high speed communications network
CN101931592A (zh) * 2010-08-26 2010-12-29 北京科技大学 一种基于wsn的矿下安全监控***网关设备
CN103389715A (zh) * 2013-07-26 2013-11-13 浪潮电子信息产业股份有限公司 一种高性能的分布式数据中心监控架构
CN105305624A (zh) * 2015-10-28 2016-02-03 成都振中电气有限公司 一种智能电力监控***
CN105635279A (zh) * 2015-12-29 2016-06-01 长城信息产业股份有限公司 一种分布式监控***及数据采集方法

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020015061A1 (zh) * 2018-07-18 2020-01-23 平安科技(深圳)有限公司 WebLogic服务器的监控告警方法、装置、***及计算机存储介质
CN108536555A (zh) * 2018-08-03 2018-09-14 中国人民解放军国防科技大学 一种基于BCube(n,b)数据中心的数据存取方法
CN109828868A (zh) * 2019-01-04 2019-05-31 新华三技术有限公司成都分公司 数据存储方法、装置、管理设备和双活数据存储***
CN109933497A (zh) * 2019-03-12 2019-06-25 国网江西省电力有限公司赣州供电分公司 一种数据中心运行监管***
CN111049881A (zh) * 2019-10-30 2020-04-21 烽火通信科技股份有限公司 一种云平台节点资源监控方法、***及计算机可读介质
CN111049881B (zh) * 2019-10-30 2022-07-22 烽火通信科技股份有限公司 一种云平台节点资源监控方法、***及计算机可读介质
CN110913662A (zh) * 2019-12-03 2020-03-24 中国工商银行股份有限公司 用于数据中心的管理方法、装置、电子设备及介质
CN110913662B (zh) * 2019-12-03 2021-09-10 中国工商银行股份有限公司 用于数据中心的管理方法、装置、电子设备及介质
US11706050B2 (en) 2020-04-23 2023-07-18 Inspur Suzhou Intelligent Technology Co., Ltd. Polling method and system for server sensors, and related apparatus
WO2021212748A1 (zh) * 2020-04-23 2021-10-28 苏州浪潮智能科技有限公司 一种服务器传感器的轮循方法、***及相关装置
CN111563018A (zh) * 2020-04-28 2020-08-21 北京航空航天大学 一种人机物融合云计算平台的资源管理和监控方法
CN111817883A (zh) * 2020-06-23 2020-10-23 赛特斯信息科技股份有限公司 一种多数据中心资源智能调度控制***
WO2022067915A1 (zh) * 2020-09-30 2022-04-07 苏州艾隆科技股份有限公司 运维监控方法、装置、存储介质
CN112199197A (zh) * 2020-10-23 2021-01-08 网易(杭州)网络有限公司 一种服务器管理方法及***
CN112199197B (zh) * 2020-10-23 2023-07-18 网易(杭州)网络有限公司 一种服务器管理方法及***
CN112882903A (zh) * 2020-12-23 2021-06-01 沈阳世纪高通科技有限公司 一种分布式监控方法
CN114283520A (zh) * 2021-12-27 2022-04-05 苏州智康信息科技股份有限公司 自助机监控管理方法

Similar Documents

Publication Publication Date Title
CN108259270A (zh) 一种数据中心统一管理***设计方法
US11005730B2 (en) System, method, and apparatus for high throughput ingestion for streaming telemetry data for network performance management
Castelli et al. Proactive management of software aging
CN104506393B (zh) 一种基于云平台的***监控方法
US8892719B2 (en) Method and apparatus for monitoring network servers
RU2636848C2 (ru) Способ оценки потребления мощности
Gill et al. RADAR: Self‐configuring and self‐healing in resource management for enhancing quality of cloud services
CN108092813A (zh) 数据中心综合管理***服务器硬件管理框架及实现方法
CN103595131B (zh) 一种变电站变电设备在线监测***
US20060074946A1 (en) Point of view distributed agent methodology for network management
CN106487574A (zh) 自动化运行维护监测***
CN104113585A (zh) 用于产生指示负载平衡状态的硬件级中断的方法和设备
CN103973815A (zh) 一种跨数据中心存储环境统一监控方法
CN103905553A (zh) 一种能效管理***的云架构及其运行方法
CN101095307A (zh) 网络管理设备
CN112751726B (zh) 一种数据处理方法、装置、电子设备和存储介质
Litvinova et al. A proactive fault tolerance framework for high-performance computing
CN114389937A (zh) 一种运维监控管理***
CN107678915A (zh) 一种输变电设备监测平台基础资源监控方法
CN112615737B (zh) 业务***自动监控的方法及***
CN106209444A (zh) 一种基于统一视图的it资产协同监测***
Lu et al. Iaso: an autonomous fault-tolerant management system for supercomputers
CN107704361A (zh) 一种输变电设备监测平台基础资源监控***
Leangsuksun et al. A failure predictive and policy-based high availability strategy for linux high performance computing cluster
CN103078764A (zh) 基于虚拟计算任务的运行监测***及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180706

RJ01 Rejection of invention patent application after publication