CN104079434A - 云计算***中物理设备管理的装置及方法 - Google Patents

云计算***中物理设备管理的装置及方法 Download PDF

Info

Publication number
CN104079434A
CN104079434A CN201410321156.XA CN201410321156A CN104079434A CN 104079434 A CN104079434 A CN 104079434A CN 201410321156 A CN201410321156 A CN 201410321156A CN 104079434 A CN104079434 A CN 104079434A
Authority
CN
China
Prior art keywords
physical machine
physical
alarm
information
client
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410321156.XA
Other languages
English (en)
Inventor
陈杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yonyou Software Co Ltd
Original Assignee
Yonyou Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yonyou Software Co Ltd filed Critical Yonyou Software Co Ltd
Priority to CN201410321156.XA priority Critical patent/CN104079434A/zh
Publication of CN104079434A publication Critical patent/CN104079434A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明提供了一种云计算***中物理设备管理的装置,包括:物理机远程自动部署单元,用于使用PXE,批量自动部署物理裸机的虚拟化操作***,快速完成虚拟化资源池的就绪或者扩容;物理机生命周期管理单元,用于管理每台物理机的生命周期,并对物理机的远程开关机操作;物理机监控与告警单元,用于对物理机所在资源进行实时监控,获取监控信息;并对物理机所在资源进行告警管理。本发明还提供了一种云计算***中物理设备管理的方法。通过本发明的技术方案,可以在现有虚拟化资源管理的基础上,完成多个物理机的物理设备管理,建立多个物理机参与的面向大批量物理机物理设备管理的通用、统一管理思路。

Description

云计算***中物理设备管理的装置及方法
技术领域
本发明涉及计算机技术领域,具体地,涉及一种云计算***中物理设备管理的装置和一种云计算***中物理设备管理的方法。
 
背景技术
云计算已经越来越被更多人关注,于企业来说,云计算的价值更多体现在:按需付费、按需扩展、快速部署、快速响应、节约开支、降低风险。云计算环境下管理的物理设备数量也是越来越庞大,维护的成本也是随着云环境的发展而増大。
云计算***中侧重对虚拟化资源的管理,我们能知道当前虚拟机的状态,能进行虚拟机的开关机操作等。在传统的云计算***中无法很好的管理监控物理机,我们无法知道物理机设备的状态,我们无法对物理机进行远程开关机的操作。
当有大批量的物理机采购回来之后,如何让操作***批量自动部署,快速完成虚拟化资源池的就绪或者扩容呢?如何在物理设备出现警报时,及时的通知管理员进行维护呢?
上面提到的问题在云计算***中普遍存在,如何解决上面提到的问题,从而有效地降低运维成本,这是目前的待解决问题。
因此,需要一种新的云计算***中物理设备管理技术,可以在现有虚拟化资源管理的基础上,完成多个物理机的物理设备管理,建立多个物理机参与的面向大批量物理机物理设备管理的通用、统一管理思路。
 
发明内容
本发明正是基于上述问题,提出了一种新的云计算***中物理设备管理技术,可以在现有虚拟化资源管理的基础上,完成多个物理机的物理设备管理,建立多个物理机参与的面向大批量物理机物理设备管理的通用、统一管理思路。
有鉴于此,本发明提出了一种云计算***中物理设备管理的装置,包括:物理机远程自动部署单元,用于使用PXE,批量自动部署物理裸机的虚拟化操作***,快速完成虚拟化资源池的就绪或者扩容;物理机生命周期管理单元,用于管理每台物理机的生命周期,并对物理机的远程开关机操作;物理机监控与告警单元,用于对物理机所在资源进行实时监控,获取监控信息;并对物理机所在资源进行告警管理。在该技术方案中,在云计算***中对物理机设备进行管理维护和监控,可以实现对物理机的管理、维护和监控,降低运维的成本。
在上述技术方案中,优选地,所述物理机远程自动部署单元,具体包括:客户端计算机启动模块,用于客户端计算机启动,网卡PXE ROM中的程序被调入内存执行;客户端获取IP地址模块,用于客户端在网络找到DHCP服务器后,请求获取IP地址;DHCP服务器为客户端提供相应的IP地址和网络参数;TFTP文件传送模块,用于DHCP服务器联系到TFTP服务器为该客户端发送引导程序;客户端收到引导程序后执行,引导程序请求TFTP传送引导程序的配置文件;引导程序读TFTP传送的配置文件,根据该配置文件内容和客户情况,客户端请求TFTP传送内核映像文件和根文件***文件;内核启动及文件配置模块,用于启动内核;内核根据bootstrap的配置文件,通过网络获取操作***自动安装脚本,并通过网络服务获得***所需安装文件,按照自动安装脚本的配置进行安装。在该技术方案中,使用PXE,通过网络启动允许在网络上的客户端从远程启动服务器上下载启动文件,对物理裸机的操作***进行批量自动部署,快速完成虚拟化资源池的就绪或者扩容,可以大大减少手工部署的复杂和重复工作。
在上述技术方案中,优选地,所述物理机生命周期管理单元,具体包括:物理机生命周期记录模块,用于记录每台物理机的设备信息到数据库中;物理机远程操作模块,用于通过IPMI的方式实现对物理机的远程开关机操作。在该技术方案中,通过对物理机生命周期的管理,可以使得每台物理机的使用情况得到合理规划;通过使用IPMI,可以保证远程操作的可靠性。
在上述技术方案中,优选地,所述物理机监控与告警单元,具体包括:服务器***实时监控模块,用于通过IPMI和OS层面实时获取服务器***的监控信息;服务器***告警模块,用于配置物理机的告警规则、配置告警发生时的联系方式、查询告警事件列表,设置物理机不同监控量的报警门限,当被监控量发生超越门限等异常事件时,通过多种形式的告警,同时将告警事件记录入日志。在该技术方案中,通过实时监控和及时告警,可以对大量分散服务器集中管理。
在上述技术方案中,优选地,所述物理机生命周期记录模块记录的每台物理机的设备信息,包括硬件购买信息、上架时间、报废时间、物理机器的物理位置、设备编号和网络地址;所述硬件购买信息包括设备名称、编号和型号;和/或,所述物理机远程操作模块通过IPMI的方式实现对物理机的远程开关机操作,包括主机上电操作、主机下电操作和重启操作;和/或,所述服务器***实时监控模块通过IPMI和OS层面实时获取的服务器***的监控信息,包括被监控服务器***的静态信息和被监控服务器***的动态信息;所述被监控服务器***的静态信息包括CPU、内存、硬盘、光驱、网卡、显卡、操作***、RAID卡、PCI附加卡的信息;所述被监控服务器***的动态信息包括主板、CPU、SCSI模组、风扇板的温度、电压、风扇转速信息以及***资源信息;所述***资源信息包括CPU利用率、内存利用率、硬盘I/O访问流量;和/或,所述服务器***告警模块进行告警的多种形式,包括消息框、邮件、告警音和短信。
根据本发明的又一个方面,还提出了一种云计算***中物理设备管理的方法,包括:步骤202:使用PXE,批量自动部署物理裸机的虚拟化操作***,快速完成虚拟化资源池的就绪或者扩容;步骤204:管理每台物理机的生命周期,并对物理机的远程开关机操作;步骤206:对物理机所在资源进行实时监控,获取监控信息;并对物理机所在资源进行告警管理。在该技术方案中,在云计算***中对物理机设备进行管理维护和监控,可以实现对物理机的管理、维护和监控,降低运维的成本。
在上述技术方案中,优选地,所述步骤202,具体包括:步骤302:客户端计算机启动,网卡PXE ROM中的程序被调入内存执行;步骤304:客户端在网络找到DHCP服务器后,请求获取IP地址;DHCP服务器为客户端提供相应的IP地址和网络参数;步骤306:DHCP服务器联系到TFTP服务器为该客户端发送引导程序;客户端收到引导程序后执行,引导程序请求TFTP传送引导程序的配置文件;引导程序读TFTP传送的配置文件,根据该配置文件内容和客户情况,客户端请求TFTP传送内核映像文件和根文件***文件;步骤308:启动内核;内核根据bootstrap的配置文件,通过网络获取操作***自动安装脚本,并通过网络服务获得***所需安装文件,按照自动安装脚本的配置进行安装。在该技术方案中,使用PXE,通过网络启动允许在网络上的客户端从远程启动服务器上下载启动文件,对物理裸机的操作***进行批量自动部署,快速完成虚拟化资源池的就绪或者扩容,可以大大减少手工部署的复杂和重复工作。
在上述技术方案中,优选地,所述步骤204,具体包括:步骤402:记录每台物理机的设备信息到数据库中;步骤404:通过IPMI的方式实现对物理机的远程开关机操作。在该技术方案中,通过对物理机生命周期的管理,可以使得每台物理机的使用情况得到合理规划;通过使用IPMI,可以保证远程操作的可靠性。
在上述技术方案中,优选地,所述步骤206,具体包括:步骤502:通过IPMI和OS层面实时获取服务器***的监控信息;步骤504:配置物理机的告警规则、配置告警发生时的联系方式、查询告警事件列表,设置物理机不同监控量的报警门限,当被监控量发生超越门限等异常事件时,通过多种形式的告警,同时将告警事件记录入日志。在该技术方案中,通过实时监控和及时告警,可以对大量分散服务器集中管理。
在上述技术方案中,优选地,所述步骤402记录的每台物理机的设备信息,包括硬件购买信息、上架时间、报废时间、物理机器的物理位置、设备编号和网络地址;所述硬件购买信息包括设备名称、编号和型号;和/或,所述步骤404通过IPMI的方式实现对物理机的远程开关机操作,包括主机上电操作、主机下电操作和重启操作;和/或,所述步骤502通过IPMI和OS层面实时获取的服务器***的监控信息,包括被监控服务器***的静态信息和被监控服务器***的动态信息;所述被监控服务器***的静态信息包括CPU、内存、硬盘、光驱、网卡、显卡、操作***、RAID卡、PCI附加卡的信息;所述被监控服务器***的动态信息包括主板、CPU、SCSI模组、风扇板的温度、电压、风扇转速信息以及***资源信息;所述***资源信息包括CPU利用率、内存利用率、硬盘I/O访问流量;和/或,所述步骤504进行告警的多种形式,包括消息框、邮件、告警音和短信。
通过以上技术方案,可以在现有虚拟化资源管理的基础上,完成多个物理机的物理设备管理,建立多个物理机参与的面向大批量物理机物理设备管理的通用、统一管理思路。
 
附图说明
图1示出了根据本发明的实施例的云计算***中物理设备管理的装置的框图;
图2示出了根据本发明的实施例的云计算***中物理设备管理的方法的流程图;
图3示出了根据本发明的实施例的物理机远程自动部署的流程图;
图4示出了根据本发明的实施例的物理机生命周期管理的流程图;
图5示出了根据本发明的实施例的物理机监控与告警的流程图;
图6示出了根据本发明的实施例的云计算***中物理设备管理的装置的模型图;
图7示出了根据本发明的实施例的IPMI的工作原理示意图。
 
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
图1示出了根据本发明的实施例的云计算***中物理设备管理的装置的框图。
如图1所示,根据本发明的实施例的云计算***中物理设备管理的装置100,包括:物理机远程自动部署单元102,用于使用PXE,批量自动部署物理裸机的虚拟化操作***,快速完成虚拟化资源池的就绪或者扩容;物理机生命周期管理单元104,用于管理每台物理机的生命周期,并对物理机的远程开关机操作;物理机监控与告警单元106,用于对物理机所在资源进行实时监控,获取监控信息;并对物理机所在资源进行告警管理。在该技术方案中,在云计算***中对物理机设备进行管理维护和监控,可以实现对物理机的管理、维护和监控,降低运维的成本。
在上述技术方案中,优选地,物理机远程自动部署单元102,具体包括:客户端计算机启动模块1022,用于客户端计算机启动,网卡PXE ROM中的程序被调入内存执行;客户端获取IP地址模块1024,用于客户端在网络找到DHCP服务器后,请求获取IP地址;DHCP服务器为客户端提供相应的IP地址和网络参数;TFTP文件传送模块1026,用于DHCP服务器联系到TFTP服务器为该客户端发送引导程序;客户端收到引导程序后执行,引导程序请求TFTP传送引导程序的配置文件;引导程序读TFTP传送的配置文件,根据该配置文件内容和客户情况,客户端请求TFTP传送内核映像文件和根文件***文件;内核启动及文件配置模块1028,用于启动内核;内核根据bootstrap的配置文件,通过网络获取操作***自动安装脚本,并通过网络服务获得***所需安装文件,按照自动安装脚本的配置进行安装。在该技术方案中,使用PXE,通过网络启动允许在网络上的客户端从远程启动服务器上下载启动文件,对物理裸机的操作***进行批量自动部署,快速完成虚拟化资源池的就绪或者扩容,可以大大减少手工部署的复杂和重复工作。
在上述技术方案中,优选地,物理机生命周期管理单元104,具体包括:物理机生命周期记录模块1042,用于记录每台物理机的设备信息到数据库中;物理机远程操作模块1044,用于通过IPMI的方式实现对物理机的远程开关机操作。在该技术方案中,通过对物理机生命周期的管理,可以使得每台物理机的使用情况得到合理规划;通过使用IPMI,可以保证远程操作的可靠性。
在上述技术方案中,优选地,物理机监控与告警单元106,具体包括:服务器***实时监控模块1062,用于通过IPMI和OS层面实时获取服务器***的监控信息;服务器***告警模块1064,用于配置物理机的告警规则、配置告警发生时的联系方式、查询告警事件列表,设置物理机不同监控量的报警门限,当被监控量发生超越门限等异常事件时,通过多种形式的告警,同时将告警事件记录入日志。在该技术方案中,通过实时监控和及时告警,可以对大量分散服务器集中管理。
在上述技术方案中,优选地,物理机生命周期记录模块1042记录的每台物理机的设备信息,包括硬件购买信息、上架时间、报废时间、物理机器的物理位置、设备编号和网络地址;硬件购买信息包括设备名称、编号和型号;和/或,物理机远程操作模块1044通过IPMI的方式实现对物理机的远程开关机操作,包括主机上电操作、主机下电操作和重启操作;和/或,服务器***实时监控模块1062通过IPMI和OS层面实时获取的服务器***的监控信息,包括被监控服务器***的静态信息和被监控服务器***的动态信息;被监控服务器***的静态信息包括CPU、内存、硬盘、光驱、网卡、显卡、操作***、RAID卡、PCI附加卡的信息;被监控服务器***的动态信息包括主板、CPU、SCSI模组、风扇板的温度、电压、风扇转速信息以及***资源信息;***资源信息包括CPU利用率、内存利用率、硬盘I/O访问流量;和/或,服务器***告警模块1064进行告警的多种形式,包括消息框、邮件、告警音和短信。
图2示出了根据本发明的实施例的云计算***中物理设备管理的方法的流程图。
如图2所示,根据本发明的实施例的云计算***中物理设备管理的方法,包括:步骤202:使用PXE,批量自动部署物理裸机的虚拟化操作***,快速完成虚拟化资源池的就绪或者扩容;步骤204:管理每台物理机的生命周期,并对物理机的远程开关机操作;步骤206:对物理机所在资源进行实时监控,获取监控信息;并对物理机所在资源进行告警管理。在该技术方案中,在云计算***中对物理机设备进行管理维护和监控,可以实现对物理机的管理、维护和监控,降低运维的成本。
在上述技术方案中,优选地,如图3所示,步骤202,具体包括:步骤302:客户端计算机启动,网卡PXE ROM中的程序被调入内存执行;步骤304:客户端在网络找到DHCP服务器后,请求获取IP地址;DHCP服务器为客户端提供相应的IP地址和网络参数;步骤306:DHCP服务器联系到TFTP服务器为该客户端发送引导程序;客户端收到引导程序后执行,引导程序请求TFTP传送引导程序的配置文件;引导程序读TFTP传送的配置文件,根据该配置文件内容和客户情况,客户端请求TFTP传送内核映像文件和根文件***文件;步骤308:启动内核;内核根据bootstrap的配置文件,通过网络获取操作***自动安装脚本,并通过网络服务获得***所需安装文件,按照自动安装脚本的配置进行安装。在该技术方案中,使用PXE,通过网络启动允许在网络上的客户端从远程启动服务器上下载启动文件,对物理裸机的操作***进行批量自动部署,快速完成虚拟化资源池的就绪或者扩容,可以大大减少手工部署的复杂和重复工作。
在上述技术方案中,优选地,如图4所示,步骤204,具体包括:步骤402:记录每台物理机的设备信息到数据库中;步骤404:通过IPMI的方式实现对物理机的远程开关机操作。在该技术方案中,通过对物理机生命周期的管理,可以使得每台物理机的使用情况得到合理规划;通过使用IPMI,可以保证远程操作的可靠性。
在上述技术方案中,优选地,如图5所示,步骤206,具体包括:步骤502:通过IPMI和OS层面实时获取服务器***的监控信息;步骤504:配置物理机的告警规则、配置告警发生时的联系方式、查询告警事件列表,设置物理机不同监控量的报警门限,当被监控量发生超越门限等异常事件时,通过多种形式的告警,同时将告警事件记录入日志。在该技术方案中,通过实时监控和及时告警,可以对大量分散服务器集中管理。
在上述技术方案中,优选地,步骤402记录的每台物理机的设备信息,包括硬件购买信息、上架时间、报废时间、物理机器的物理位置、设备编号和网络地址;硬件购买信息包括设备名称、编号和型号;和/或,步骤404通过IPMI的方式实现对物理机的远程开关机操作,包括主机上电操作、主机下电操作和重启操作;和/或,步骤502通过IPMI和OS层面实时获取的服务器***的监控信息,包括被监控服务器***的静态信息和被监控服务器***的动态信息;被监控服务器***的静态信息包括CPU、内存、硬盘、光驱、网卡、显卡、操作***、RAID卡、PCI附加卡的信息;被监控服务器***的动态信息包括主板、CPU、SCSI模组、风扇板的温度、电压、风扇转速信息以及***资源信息;***资源信息包括CPU利用率、内存利用率、硬盘I/O访问流量;和/或,步骤504进行告警的多种形式,包括消息框、邮件、告警音和短信。
本发明的技术方案,以解决现有技术中存在的问题、从而有效地降低运维成本为立足点,增加对物理机设备的管理维护和监控,减少云计算***的运维成本,适用于各个云计算***中对物理设备管理的要求。
为了解决现有技术中存在的问题、从而有效地降低运维成本,本发明的技术方案,在云计算***中对物理机设备进行管理维护和监控。本发明的技术方案,主要解决云计算***对物理设备管理功能薄弱,实现对物理机的管理、维护和监控,降低运维的成本。
 例如,本发明的技术方案,参见图6显示的本发明技术方案的模型,主要可以包括以下几个模块:
⑴物理机远程自动部署单元,该物理机远程自动部署单元进行物理裸机的操作***批量自动部署,快速完成虚拟化资源池的就绪或者扩容,大大减少了手工部署的复杂和重复工作。
⑵物理机生命周期管理单元,该物理机生命周期管理单元管理各类设备相关信息,如设备名称、编号、型号,所处的具体物理位置信息等,并且可以完成操纵远程的主机上、下电与重启等操作。
⑶物理机监控与告警单元,该物理机监控与告警单元实现对物理机资源进行监控,监控信息包括通过IPMI和通过OS层面获取的监控信息。告警管理,可配置物理机的告警规则、配置告警发生时的联系方式、查询告警事件列表。
又如,本发明技术方案的具体实现方式如下:
⑴物理机远程自动部署单元,我们将使用PXE,通过网络启动允许在网络上的客户端从远程启动服务器上下载启动文件。这样就提供了网络管理员管理用于客户端的启动文件和操作***的能力。PXE在操作***自动部署和无盘工作站环境中有大量应用。
PXE自动部署操作***启动过程如下:
a)客户端计算机启动,由于BIOS设置了网卡启动,所以网卡PXE ROM中的程序被调入内存执行。
b)客户端在网络中寻找DHCP服务器,然后请求一个IP地址;
c)DHCP服务器为客户端提供IP地址和其他网络参数。
d)DHCP服务器联系到TFTP服务器为此客户端发送一个引导程序。
e)客户端收到引导程序后执行,引导程序会请求TFTP传送引导程序的配置文件;收到后读配置文件,根据该配置文件内容和客户情况,客户端请求TFTP传送内核映像文件和根文件***文件。
f)启动内核。
g)内核根据bootstrap的配置文件,通过网络获取操作***自动安装脚本,并通过网络服务获得***所需安装文件,按照自动安装脚本的配置进行安装。
该物理机远程自动部署单元可以进行虚拟化***的批量自动部署,快速完成虚拟化资源池的就绪或者扩容,大大减少了手工部署的复杂和重复工作。
⑵物理机生命周期管理单元,我们将记录每一台物理机的生命周期,所有的信息将记录到数据库中,包含硬件购买信息、上架时间、报废时间、物理机器的物理位置、设备编号和网络地址等相关信息。
我们还将通过IPMI的方式实现对物理机的远程开关机操作。智能平台管理接口(IPMI)是一种开放标准的硬件管理接口规格,定义了嵌入式管理子***进行通信的特定方法。即使服务器本身的运作不正常,或是由于任何原因而无法提供服务,IPMI仍可正常运作。IPMI工作原理图如图7。
⑶物理机监控与告警单元,传统的***监控管理方法一般是***管理员定期到机房巡视或者采用监控类软件监控,上述方法存在时效性差、服务器宕机后无法追查原因、占用***资源较多的缺点;IPMI可实现对服务器***的实时监控,监控服务器***静态信息(CPU、内存、硬盘、光驱、网卡、显卡、操作***、RAID卡、PCI附加卡 等信息)和动态信息(主板、CPU、SCSI 模组、风扇板等设备的温度、电压、风扇转速信息以及CPU利用率、内存利用率、硬盘I/O访问流量等***资源信息)。
物理机监控与告警单元中我们将可以设置不同监控量的报警门限,当上述被监控量发生超越门限等异常事件时,会通过多种形式(消息框、邮件、告警音、短信)告警,同时将告警事件记录入日志。对大量分散服务器集中管理的环境应用优势尤为明显。
本发明的技术方案,在云计算***中引入物理机管理,实现了物理裸机的操作***批量自动部署,快速完成虚拟化资源池的就绪或者扩容,以减少管理员手工部署的复杂和重复工作,并且对整个物理机的生命周期进行管理,提高了资源管理的效率,并对物理主机实现了实时的监控,降低了运维的成本。
相比传统云计算***(即由于缺少对物理主机的有效管理、监控,导致的运维成本居高不下),经验证,引入本发明的技术方案后,可有效地降低运维成本。
以上结合附图详细说明了本发明的技术方案,考虑到相关技术中没有简便的、统一的针对大批量物理机管理的解决办法。现有的云计算***中物理设备管理无法完成有大批量物理机参与的云计算***中物理设备管理过程。因此,本发明提出了一种云计算***中物理设备管理的装置和一种云计算***中物理设备管理的方法,可以在现有虚拟化资源管理的基础上,完成多个物理机的物理设备管理,建立多个物理机参与的面向大批量物理机物理设备管理的通用、统一管理思路。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种云计算***中物理设备管理的装置,其特征在于,包括:
物理机远程自动部署单元,用于使用PXE,批量自动部署物理裸机的虚拟化操作***,快速完成虚拟化资源池的就绪或者扩容;
物理机生命周期管理单元,用于管理每台物理机的生命周期,并对物理机的远程开关机操作;
物理机监控与告警单元,用于对物理机所在资源进行实时监控,获取监控信息;并对物理机所在资源进行告警管理。
2.根据权利要求1所述的云计算***中物理设备管理的装置,其特征在于,所述物理机远程自动部署单元,具体包括:
客户端计算机启动模块,用于客户端计算机启动,网卡PXE ROM中的程序被调入内存执行;
客户端获取IP地址模块,用于客户端在网络找到DHCP服务器后,请求获取IP地址;DHCP服务器为客户端提供相应的IP地址和网络参数;
TFTP文件传送模块,用于DHCP服务器联系到TFTP服务器为该客户端发送引导程序;客户端收到引导程序后执行,引导程序请求TFTP传送引导程序的配置文件;引导程序读TFTP传送的配置文件,根据该配置文件内容和客户情况,客户端请求TFTP传送内核映像文件和根文件***文件;
内核启动及文件配置模块,用于启动内核;内核根据bootstrap的配置文件,通过网络获取操作***自动安装脚本,并通过网络服务获得***所需安装文件,按照自动安装脚本的配置进行安装。
3.根据权利要求1或2所述的云计算***中物理设备管理的装置,其特征在于,所述物理机生命周期管理单元,具体包括:
物理机生命周期记录模块,用于记录每台物理机的设备信息到数据库中;
物理机远程操作模块,用于通过IPMI的方式实现对物理机的远程开关机操作。
4.根据权利要求3所述的云计算***中物理设备管理的装置,其特征在于,所述物理机监控与告警单元,具体包括:
服务器***实时监控模块,用于通过IPMI和OS层面实时获取服务器***的监控信息;
服务器***告警模块,用于配置物理机的告警规则、配置告警发生时的联系方式、查询告警事件列表,设置物理机不同监控量的报警门限,当被监控量发生超越门限等异常事件时,通过多种形式的告警,同时将告警事件记录入日志。
5.根据权利要求4所述的云计算***中物理设备管理的装置,其特征在于,所述物理机生命周期记录模块记录的每台物理机的设备信息,包括硬件购买信息、上架时间、报废时间、物理机器的物理位置、设备编号和网络地址;所述硬件购买信息包括设备名称、编号和型号;
和/或,
所述物理机远程操作模块通过IPMI的方式实现对物理机的远程开关机操作,包括主机上电操作、主机下电操作和重启操作;
和/或,
所述服务器***实时监控模块通过IPMI和OS层面实时获取的服务器***的监控信息,包括被监控服务器***的静态信息和被监控服务器***的动态信息;所述被监控服务器***的静态信息包括CPU、内存、硬盘、光驱、网卡、显卡、操作***、RAID卡、PCI附加卡的信息;所述被监控服务器***的动态信息包括主板、CPU、SCSI模组、风扇板的温度、电压、风扇转速信息以及***资源信息;所述***资源信息包括CPU利用率、内存利用率、硬盘I/O访问流量;
和/或,
所述服务器***告警模块进行告警的多种形式,包括消息框、邮件、告警音和短信。
6.一种云计算***中物理设备管理的方法,其特征在于,包括:
步骤202:使用PXE,批量自动部署物理裸机的虚拟化操作***,快速完成虚拟化资源池的就绪或者扩容;
步骤204:管理每台物理机的生命周期,并对物理机的远程开关机操作;
步骤206:对物理机所在资源进行实时监控,获取监控信息;并对物理机所在资源进行告警管理。
7.根据权利要求6所述的云计算***中物理设备管理的方法,其特征在于,所述步骤202,具体包括:
步骤302:客户端计算机启动,网卡PXE ROM中的程序被调入内存执行;
步骤304:客户端在网络找到DHCP服务器后,请求获取IP地址;DHCP服务器为客户端提供相应的IP地址和网络参数;
步骤306:DHCP服务器联系到TFTP服务器为该客户端发送引导程序;客户端收到引导程序后执行,引导程序请求TFTP传送引导程序的配置文件;引导程序读TFTP传送的配置文件,根据该配置文件内容和客户情况,客户端请求TFTP传送内核映像文件和根文件***文件;
步骤308:启动内核;内核根据bootstrap的配置文件,通过网络获取操作***自动安装脚本,并通过网络服务获得***所需安装文件,按照自动安装脚本的配置进行安装。
8.根据权利要求6或7所述的云计算***中物理设备管理的方法,其特征在于,所述步骤204,具体包括:
步骤402:记录每台物理机的设备信息到数据库中;
步骤404:通过IPMI的方式实现对物理机的远程开关机操作。
9.根据权利要求8所述的云计算***中物理设备管理的方法,其特征在于,所述步骤206,具体包括:
步骤502:通过IPMI和OS层面实时获取服务器***的监控信息;
步骤504:配置物理机的告警规则、配置告警发生时的联系方式、查询告警事件列表,设置物理机不同监控量的报警门限,当被监控量发生超越门限等异常事件时,通过多种形式的告警,同时将告警事件记录入日志。
10.根据权利要求9所述的云计算***中物理设备管理的方法,其特征在于,所述步骤402记录的每台物理机的设备信息,包括硬件购买信息、上架时间、报废时间、物理机器的物理位置、设备编号和网络地址;所述硬件购买信息包括设备名称、编号和型号;
和/或,
所述步骤404通过IPMI的方式实现对物理机的远程开关机操作,包括主机上电操作、主机下电操作和重启操作;
和/或,
所述步骤502通过IPMI和OS层面实时获取的服务器***的监控信息,包括被监控服务器***的静态信息和被监控服务器***的动态信息;所述被监控服务器***的静态信息包括CPU、内存、硬盘、光驱、网卡、显卡、操作***、RAID卡、PCI附加卡的信息;所述被监控服务器***的动态信息包括主板、CPU、SCSI模组、风扇板的温度、电压、风扇转速信息以及***资源信息;所述***资源信息包括CPU利用率、内存利用率、硬盘I/O访问流量;
和/或,
所述步骤504进行告警的多种形式,包括消息框、邮件、告警音和短信。
CN201410321156.XA 2014-07-07 2014-07-07 云计算***中物理设备管理的装置及方法 Pending CN104079434A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410321156.XA CN104079434A (zh) 2014-07-07 2014-07-07 云计算***中物理设备管理的装置及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410321156.XA CN104079434A (zh) 2014-07-07 2014-07-07 云计算***中物理设备管理的装置及方法

Publications (1)

Publication Number Publication Date
CN104079434A true CN104079434A (zh) 2014-10-01

Family

ID=51600490

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410321156.XA Pending CN104079434A (zh) 2014-07-07 2014-07-07 云计算***中物理设备管理的装置及方法

Country Status (1)

Country Link
CN (1) CN104079434A (zh)

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104360894A (zh) * 2014-11-18 2015-02-18 浪潮(北京)电子信息产业有限公司 一种模拟物理设备的方法及装置
CN104486148A (zh) * 2014-12-04 2015-04-01 北京百度网讯科技有限公司 一种服务器回收控制方法及装置
CN104639378A (zh) * 2015-03-10 2015-05-20 浪潮集团有限公司 一种基于pxe的服务器自动化部署方法
CN105306225A (zh) * 2015-11-03 2016-02-03 国云科技股份有限公司 一种基于Openstack的物理机远程关机方法
CN105353713A (zh) * 2015-12-15 2016-02-24 国网北京市电力公司 机房监控***
CN105446657A (zh) * 2015-11-11 2016-03-30 浪潮电子信息产业股份有限公司 一种监控raid卡的方法
CN105681081A (zh) * 2016-01-12 2016-06-15 华为技术有限公司 物理机管理方法及装置
CN106682198A (zh) * 2016-12-29 2017-05-17 北京奇虎科技有限公司 一种实现自动化部署数据库的方法和装置
CN106775798A (zh) * 2016-01-28 2017-05-31 新华三技术有限公司 一种操作***安装方法及装置
CN107566174A (zh) * 2017-09-05 2018-01-09 郑州云海信息技术有限公司 一种网卡识别及批量灌装***的实现方法及***
CN107562518A (zh) * 2017-08-26 2018-01-09 杭州云哟科技有限责任公司 基于kvm虚拟化技术的显卡rom提取收集***及方法
CN107566165A (zh) * 2017-08-18 2018-01-09 国网山东省电力公司信息通信公司 一种发现及部署电力云数据中心可用资源的方法及***
CN107995287A (zh) * 2017-11-30 2018-05-04 郑州云海信息技术有限公司 一种通过ipmi远程监控数据中心节点健康状态的方法
CN108011880A (zh) * 2017-12-04 2018-05-08 郑州云海信息技术有限公司 云数据***中监控的管理方法和计算机可读存储介质
CN108900656A (zh) * 2018-08-23 2018-11-27 郑州云海信息技术有限公司 一种批量部署的方法及装置
CN109245917A (zh) * 2018-08-20 2019-01-18 郑州云海信息技术有限公司 一种基于云平台的裸机管理的方法及装置
CN109818768A (zh) * 2017-11-21 2019-05-28 ***通信有限公司研究院 一种物理设施管理***、pnf网络管理***及方法
CN109962941A (zh) * 2017-12-14 2019-07-02 华为技术有限公司 通信方法、装置以及服务器
CN110688130A (zh) * 2019-10-14 2020-01-14 天津卓朗科技发展有限公司 物理机部署方法、装置、可读存储介质及电子设备
CN110750464A (zh) * 2019-09-05 2020-02-04 北京浪潮数据技术有限公司 一种计算机节点存储池化方法、装置及***
CN111742317A (zh) * 2018-02-14 2020-10-02 微软技术许可有限责任公司 将裸机资源清除为在云计算中可使用的可信状态
CN112350855A (zh) * 2020-10-26 2021-02-09 浪潮云信息技术股份公司 一种基于配置的云中心管理方法
CN113381881A (zh) * 2021-05-25 2021-09-10 山东浪潮爱购云链信息科技有限公司 一种主机监控告警处理的方法、装置
CN114363295A (zh) * 2020-09-28 2022-04-15 华为云计算技术有限公司 一种租户服务器的管理方法及装置
CN115442264A (zh) * 2022-08-24 2022-12-06 浪潮云信息技术股份公司 一种云环境下物理主机生态的监控方法及***

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1929410A (zh) * 2006-09-04 2007-03-14 曙光信息产业(北京)有限公司 一种智能化机群监控***
CN101577698A (zh) * 2008-05-09 2009-11-11 中兴通讯股份有限公司 带外智能管理服务器***及监控服务器和处理命令方法
CN101719089A (zh) * 2009-10-30 2010-06-02 曙光信息产业(北京)有限公司 分布式集群的远程管理方法及***
WO2012054023A1 (en) * 2010-10-20 2012-04-26 Hewlett-Packard Development Company, L.P. Computer system with computers that perform network boots
CN102710788A (zh) * 2012-06-18 2012-10-03 苏州超集信息科技有限公司 一种快速、无人值守化操作的***
CN103297504A (zh) * 2013-05-09 2013-09-11 浙江大学 一种云数据中心中物理裸机快速部署操作***的方法
CN103401699A (zh) * 2013-07-18 2013-11-20 深圳先进技术研究院 一种云数据中心安全监控预警***及方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1929410A (zh) * 2006-09-04 2007-03-14 曙光信息产业(北京)有限公司 一种智能化机群监控***
CN101577698A (zh) * 2008-05-09 2009-11-11 中兴通讯股份有限公司 带外智能管理服务器***及监控服务器和处理命令方法
CN101719089A (zh) * 2009-10-30 2010-06-02 曙光信息产业(北京)有限公司 分布式集群的远程管理方法及***
WO2012054023A1 (en) * 2010-10-20 2012-04-26 Hewlett-Packard Development Company, L.P. Computer system with computers that perform network boots
CN102710788A (zh) * 2012-06-18 2012-10-03 苏州超集信息科技有限公司 一种快速、无人值守化操作的***
CN103297504A (zh) * 2013-05-09 2013-09-11 浙江大学 一种云数据中心中物理裸机快速部署操作***的方法
CN103401699A (zh) * 2013-07-18 2013-11-20 深圳先进技术研究院 一种云数据中心安全监控预警***及方法

Cited By (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104360894A (zh) * 2014-11-18 2015-02-18 浪潮(北京)电子信息产业有限公司 一种模拟物理设备的方法及装置
CN104486148A (zh) * 2014-12-04 2015-04-01 北京百度网讯科技有限公司 一种服务器回收控制方法及装置
CN104639378A (zh) * 2015-03-10 2015-05-20 浪潮集团有限公司 一种基于pxe的服务器自动化部署方法
CN105306225B (zh) * 2015-11-03 2018-09-07 国云科技股份有限公司 一种基于Openstack的物理机远程关机方法
CN105306225A (zh) * 2015-11-03 2016-02-03 国云科技股份有限公司 一种基于Openstack的物理机远程关机方法
CN105446657A (zh) * 2015-11-11 2016-03-30 浪潮电子信息产业股份有限公司 一种监控raid卡的方法
CN105446657B (zh) * 2015-11-11 2018-06-19 浪潮电子信息产业股份有限公司 一种监控raid卡的方法
CN105353713A (zh) * 2015-12-15 2016-02-24 国网北京市电力公司 机房监控***
CN105681081A (zh) * 2016-01-12 2016-06-15 华为技术有限公司 物理机管理方法及装置
CN105681081B (zh) * 2016-01-12 2019-06-21 华为技术有限公司 物理机管理方法及装置
CN106775798A (zh) * 2016-01-28 2017-05-31 新华三技术有限公司 一种操作***安装方法及装置
CN106682198A (zh) * 2016-12-29 2017-05-17 北京奇虎科技有限公司 一种实现自动化部署数据库的方法和装置
CN106682198B (zh) * 2016-12-29 2020-09-04 北京奇虎科技有限公司 一种实现自动化部署数据库的方法和装置
CN107566165A (zh) * 2017-08-18 2018-01-09 国网山东省电力公司信息通信公司 一种发现及部署电力云数据中心可用资源的方法及***
CN107562518A (zh) * 2017-08-26 2018-01-09 杭州云哟科技有限责任公司 基于kvm虚拟化技术的显卡rom提取收集***及方法
CN107562518B (zh) * 2017-08-26 2020-12-18 杭州云哟科技有限责任公司 基于kvm虚拟化技术的显卡rom提取收集***及方法
CN107566174A (zh) * 2017-09-05 2018-01-09 郑州云海信息技术有限公司 一种网卡识别及批量灌装***的实现方法及***
CN109818768B (zh) * 2017-11-21 2022-02-25 ***通信有限公司研究院 一种物理设施管理***、pnf网络管理***及方法
CN109818768A (zh) * 2017-11-21 2019-05-28 ***通信有限公司研究院 一种物理设施管理***、pnf网络管理***及方法
CN107995287A (zh) * 2017-11-30 2018-05-04 郑州云海信息技术有限公司 一种通过ipmi远程监控数据中心节点健康状态的方法
CN108011880A (zh) * 2017-12-04 2018-05-08 郑州云海信息技术有限公司 云数据***中监控的管理方法和计算机可读存储介质
CN109962941A (zh) * 2017-12-14 2019-07-02 华为技术有限公司 通信方法、装置以及服务器
CN111742317A (zh) * 2018-02-14 2020-10-02 微软技术许可有限责任公司 将裸机资源清除为在云计算中可使用的可信状态
CN109245917A (zh) * 2018-08-20 2019-01-18 郑州云海信息技术有限公司 一种基于云平台的裸机管理的方法及装置
CN108900656A (zh) * 2018-08-23 2018-11-27 郑州云海信息技术有限公司 一种批量部署的方法及装置
CN110750464A (zh) * 2019-09-05 2020-02-04 北京浪潮数据技术有限公司 一种计算机节点存储池化方法、装置及***
CN110688130A (zh) * 2019-10-14 2020-01-14 天津卓朗科技发展有限公司 物理机部署方法、装置、可读存储介质及电子设备
CN114363295A (zh) * 2020-09-28 2022-04-15 华为云计算技术有限公司 一种租户服务器的管理方法及装置
CN112350855A (zh) * 2020-10-26 2021-02-09 浪潮云信息技术股份公司 一种基于配置的云中心管理方法
CN113381881A (zh) * 2021-05-25 2021-09-10 山东浪潮爱购云链信息科技有限公司 一种主机监控告警处理的方法、装置
CN113381881B (zh) * 2021-05-25 2022-12-09 山东浪潮爱购云链信息科技有限公司 一种主机监控告警处理的方法、装置
CN115442264A (zh) * 2022-08-24 2022-12-06 浪潮云信息技术股份公司 一种云环境下物理主机生态的监控方法及***

Similar Documents

Publication Publication Date Title
CN104079434A (zh) 云计算***中物理设备管理的装置及方法
US10198284B2 (en) Ensuring operational integrity and performance of deployed converged infrastructure information handling systems
CN104360878B (zh) 一种应用软件部署的方法及装置
CN102141942B (zh) 一种设备的监控保护方法及装置
US8578337B2 (en) Method and system for quality assurance subscription service
CN109684038B (zh) Docker服务容器日志的处理方法、装置和电子设备
CN101986280A (zh) 虚拟计算***的自动化测试平台
CN109445801A (zh) 一种探测裸机网卡信息的方法和装置
CN102946433A (zh) 云公共服务平台下的大规模计算机资源的监控和调度方法
CN103810015A (zh) 虚拟机创建方法和设备
CN106919485A (zh) 一种基于服务器上配置硬件测试工具的***
WO2015062217A1 (zh) 虚拟桌面***中外设的接入处理方法及装置
CN102479142A (zh) 一种机架服务器***及其监控方法
CN104410699A (zh) 一种开放式云计算资源管理方法及***
CN103248696A (zh) 一种云计算环境下的虚拟资源动态配置方法
WO2012161974A1 (en) Monitoring service in a distributed platform
CN105141478A (zh) 一种linux服务器sas卡硬盘状态的监控方法
Cima et al. Adding energy efficiency to Openstack
CN105354127A (zh) 基于云管理平台的监控方法
CN108989123A (zh) 一种服务器配置方法及装置
CN103986790A (zh) 一种云数据中心基础设施监控告警的方法
CN115543746A (zh) 图形处理器监测方法、***、装置及电子设备
CN104021503A (zh) 一种基于虚拟化Hadoop集群建设继保云的方法
CN104104725A (zh) 一种应用于云计算的分层异构结构的服务器管理***
CN104516744A (zh) 软件更新方法及***

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 100094 Beijing city Haidian District North Road No. 68, UFIDA Software Park

Applicant after: Yonyou Network Technology Co., Ltd.

Address before: 100094 Beijing city Haidian District North Road No. 68, UFIDA Software Park

Applicant before: UFIDA Software Co., Ltd.

COR Change of bibliographic data
RJ01 Rejection of invention patent application after publication

Application publication date: 20141001

RJ01 Rejection of invention patent application after publication