CN102571413A - 一种集群环境下资源管理的方法 - Google Patents

一种集群环境下资源管理的方法 Download PDF

Info

Publication number
CN102571413A
CN102571413A CN2011103947512A CN201110394751A CN102571413A CN 102571413 A CN102571413 A CN 102571413A CN 2011103947512 A CN2011103947512 A CN 2011103947512A CN 201110394751 A CN201110394751 A CN 201110394751A CN 102571413 A CN102571413 A CN 102571413A
Authority
CN
China
Prior art keywords
resource
alarm
keeper
management
interface
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011103947512A
Other languages
English (en)
Other versions
CN102571413B (zh
Inventor
刘卫红
赵欢
李绍辉
温鑫
孙国忠
邵宗有
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
The dawn of the Dragon Information Technology Co. Ltd.
Original Assignee
Dawning Information Industry Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dawning Information Industry Beijing Co Ltd filed Critical Dawning Information Industry Beijing Co Ltd
Priority to CN201110394751.2A priority Critical patent/CN102571413B/zh
Publication of CN102571413A publication Critical patent/CN102571413A/zh
Application granted granted Critical
Publication of CN102571413B publication Critical patent/CN102571413B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明通过提供统一的基于web的资源管理软件,充分合理地分配和使用资源,并及时准确地反映资源状态和使用情况,一旦出现任何异常或损坏,能以最快的方式在不影响业务需求的情况下解决问题,而管理员只需通过浏览器就可以有效统一的管理集群下不同的资源,降低集群中资源管理的复杂性和管理成本,提高工作效率。

Description

一种集群环境下资源管理的方法
技术领域
本发明涉及集群资源管理,具体来说,涉及一种集群环境下资源管理的方法。
背景技术
集群环境下资源(设备和软件等)种类繁多,数量庞大,不同类型的资源配置、使用、维护方式不同,管理方式大相径庭,即使同类型的资源在性能、状态不同的情况下,管理方式也各异。如果让管理员直接管理集群环境下所有的资源,不仅费时费力,而且很容易产生各种各样的错误。
发明内容
发明的目标是通过提供统一的基于web的资源管理软件,动态发现和调度资源,充分合理地分配和使用资源,并及时准确地反映资源状态和使用情况,一旦出现任何异常或损坏,能以最快的方式在不影响业务需求的情况下解决问题,而管理员只需通过浏览器就可以有效统一的管理集群下不同的资源,降低集群中资源管理的复杂性和管理成本,提高工作效率。
一种集群环境下资源管理的方法,所述方法包括如下步骤:
管理员通过浏览器登录资源配置页面,所述资源配置页面用于展现***中所有资源的基本信息和配置参数以及资源之间的物理和逻辑关联关系;
管理服务器根据***中现有的资源定义情况,以及资源的类型和彼此之间的关联关系,读取每个资源对应的参数以及参数值,并汇总到管理节点,管理节点将所有的配置参数组织成合理的数据结构以供界面显示;
管理员在界面中对需要修改的配置参数值进行修改,界面对输入的参数值进行校验,如不符合要求,给出错误提示,如果符合要求,则将参数修改到指定资源;
***对资源进行监控,对于出现异常或损坏而不能使用的资源,***发出告警信息,管理员可通过修改其可用状态为“不可用”或删除***中的资源信息来停止资源的使用,以便维修人员对设备或资源进行维修。
优选的,所述资源由管理员通过设置资源的基本信息、关键配置参数以及关联关系来添加***中的资源。
优选的,所述设备或资源进行维修结束后,管理员可修改资源的可用状态为“可用”或在***中重新添加资源信息,资源便可恢复使用。
优选的,所述***对资源进行监控由采集插件完成,采集插件为每种类型的资源设定对应的采集指标、指标阈值及指标是否产生告警信息,然后采集资源的各项指标值。
优选的,所述指标值如果达到告警范围,根据告警级别***作不同处理,一般程度的告警通过界面的特定标志或弹出窗口来通知管理员;较高等级的告警通过邮件通知管理员;严重告警则邮件和短信通知管理员,并视情况动态分配新的可用资源给用户,以保证用户业务的正常运行。
优选的,所述告警产生后通过知识库对各个告警进行分类,为管理员提供类似问题的解决方案和相关人员列表,管理员根据告警的详细信息查找对应的负责人或相关专家。
优选的,所述告警在每次解决后***允许用户、管理员或相关工作人员对告警进行整理并保存到知识库中,供下次出现类似问题时更快的定位和解决问题。
优选的,所述知识库中存储不同设备的告警类型、告警时间和相关解决方法、解决时间和解决人员。
本发明具有以下优点:
1.实现了基于web的资源配置管理和动态发现,提供了统一的资源管理接口,避免了手工录入信息导致的错误,提高资源信息的准确性,同时降低了大型集群中各种类型资源管理的复杂度,简化了资源管理流程,达到降低管理成本,提高效率的目的;
2.实现了资源的自动监控维护和动态调度等功能,及时发现资源各类异常和问题,并提供快速和完善的解决方案,能更好地满足用户的资源使用需求,同时降低了大规模资源监控维护和分配调度的复杂度,提高了资源的使用效率和管理员的工作效率。
附图说明
具体实施方式
根据资源管理的需求,本发明提供了对集群环境下资源的配置管理和监控维护等功能:
1.资源配置管理:集群中不同类型的资源和复杂的配置如果靠管理员手工输入,经常会遗漏或出错,通过统一的配置管理功能,不仅能提高效率,还能提高精准性。
a)管理员通过浏览器登录资源配置页面,该页面展现了***中所有资源的基本信息(如资源类型等)和配置参数以及资源之间的物理和逻辑关联关系;管理员通过设置资源的基本信息、关键配置参数(如IP等)以及关联关系(如服务器所在机柜及机柜中的位置)来添加***中的资源;
b)管理服务器将根据***中现有的资源定义情况,根据资源的类型和彼此之间的关联关系,读取每个资源对应的参数以及参数值,并汇总到管理节点,管理节点将所有的配置参数组织成合理的数据结构以供界面显示;
c)管理员可在界面中对需要修改的配置参数值进行修改,界面对输入的参数值进行校验,如不符合要求,给出错误提示,如果符合要求,则将参数修改到指定资源;
d)对于出现异常或损坏而不能使用的资源,管理员可通过修改其可用状态为“不可用”或删除***中的资源信息来停止资源的使用,以便维修人员对设备或资源进行维修。维修结束后,管理员可修改资源的可用状态为“可用”或在***中重新添加资源信息,资源便可恢复使用。
2.资源监控维护:
a)***动态发现或管理员手工录入资源;
b)采集插件为每种类型的资源设定对应的采集指标、指标阈值及指标是否产生告警等信息,然后由采集插件采集资源的各项指标的值;
c)如果指标值达到告警范围,则会产生不同程度的告警。针对不同程度的告警,***处理方式不同。例如一般程度的告警则通过界面的特定标志或弹出窗口来通知管理员,较高等级的告警可通过邮件通知管理员,严重告警则邮件和短信通知管理员,并视情况动态分配新的可用资源给用户,以保证用户业务的正常运行。
d)***产生告警的同时,通过知识库对各个告警进行分类,为管理员提供类似问题的解决方案和相关人员列表,管理员根据告警的详细信息查找对应的负责人或相关专家,如果在规定的时间内仍解决不了,将通知相关领导进行问题的解决方案讨论会,影响到用户业务的,视情况启用其他设备取代告警设备,以保证用户业务的正常运行;
e)每次告警解决后,***允许用户、管理员或相关工作人员对告警进行整理并保存到知识库中,供下次出现类似问题时更快的定位和解决问题。知识库中存储不同设备的告警类型、告警时间和相关解决方法、解决时间和解决人员等。

Claims (8)

1.一种集群环境下资源管理的方法,其特征在于:所述方法包括如下步骤:
管理员通过浏览器登录资源配置页面,所述资源配置页面用于展现***中所有资源的基本信息和配置参数以及资源之间的物理和逻辑关联关系;
管理服务器根据***中现有的资源定义情况,以及资源的类型和彼此之间的关联关系,读取每个资源对应的参数以及参数值,并汇总到管理节点,管理节点将所有的配置参数组织成合理的数据结构以供界面显示;
管理员在界面中对需要修改的配置参数值进行修改,界面对输入的参数值进行校验,如不符合要求,给出错误提示,如果符合要求,则将参数修改到指定资源;
***对资源进行监控,对于出现异常或损坏而不能使用的资源,***发出告警信息,管理员可通过修改其可用状态为“不可用”或删除***中的资源信息来停止资源的使用,以便维修人员对设备或资源进行维修。
2.如权利要求1所述的方法,其特征在于:所述资源由管理员通过设置资源的基本信息、关键配置参数以及关联关系来添加***中的资源。
3.如权利要求1所述的方法,其特征在于:所述设备或资源进行维修结束后,管理员可修改资源的可用状态为“可用”或在***中重新添加资源信息,资源便可恢复使用。
4.如权利要求1所述的方法,其特征在于:所述***对资源进行监控由采集插件完成,采集插件为每种类型的资源设定对应的采集指标、指标阈值及指标是否产生告警信息,然后采集资源的各项指标值。
5.如权利要求4所述的方法,其特征在于:所述指标值如果达到告警范围,根据告警级别***作不同处理,一般程度的告警通过界面的特定标志或弹出窗口来通知管理员;较高等级的告警通过邮件通知管理员;严重告警则邮件和短信通知管理员,并视情况动态分配新的可用资源给用户,以保证用户业务的正常运行。
6.如权利要求4所述的方法,其特征在于:所述告警产生后通过知识库对各个告警进行分类,为管理员提供类似问题的解决方案和相关人员列表,管理员根据告警的详细信息查找对应的负责人或相关专家。
7.如权利要求4所述的方法,其特征在于:所述告警在每次解决后***允许用户、管理员或相关工作人员对告警进行整理并保存到知识库中,供下次出现类似问题时更快的定位和解决问题。
8.如权利要求7所述的方法,其特征在于:所述知识库中存储不同设备的告警类型、告警时间和相关解决方法、解决时间和解决人员。
CN201110394751.2A 2011-12-02 2011-12-02 一种集群环境下资源管理的方法 Active CN102571413B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110394751.2A CN102571413B (zh) 2011-12-02 2011-12-02 一种集群环境下资源管理的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110394751.2A CN102571413B (zh) 2011-12-02 2011-12-02 一种集群环境下资源管理的方法

Publications (2)

Publication Number Publication Date
CN102571413A true CN102571413A (zh) 2012-07-11
CN102571413B CN102571413B (zh) 2015-04-29

Family

ID=46415941

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110394751.2A Active CN102571413B (zh) 2011-12-02 2011-12-02 一种集群环境下资源管理的方法

Country Status (1)

Country Link
CN (1) CN102571413B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102932483A (zh) * 2012-11-19 2013-02-13 西北大学 一种轻量级的资源动态定义方法
CN103475544A (zh) * 2013-09-18 2013-12-25 浪潮电子信息产业股份有限公司 一种基于云资源监控平台的业务监控方法
CN103632215A (zh) * 2012-08-20 2014-03-12 曙光信息产业(北京)有限公司 一种集群环境下资产自动按需分配方法
CN103793349A (zh) * 2013-12-27 2014-05-14 远光软件股份有限公司 一种数据处理方法及装置
CN105243004A (zh) * 2015-09-15 2016-01-13 浪潮集团有限公司 一种故障资源检测方法及装置
CN106789366A (zh) * 2017-02-22 2017-05-31 郑州云海信息技术有限公司 一种业务层面的网络服务监控***
CN109062772A (zh) * 2018-07-16 2018-12-21 曙光信息产业(北京)有限公司 集群指标告警的实现方法及集群指标告警***

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1179914A2 (en) * 2000-08-11 2002-02-13 Nec Corporation System, method and record medium for packet transmission capable of reducing delay due to resource assignment
CN1441569A (zh) * 2002-02-27 2003-09-10 华为技术有限公司 一种网络设备的集群管理方法
CN101646135A (zh) * 2009-08-28 2010-02-10 曙光信息产业(北京)有限公司 用于集群监控的告警通知方法及***
CN101707632A (zh) * 2009-10-28 2010-05-12 浪潮电子信息产业股份有限公司 一种动态监控服务器集群性能并实时报警的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1179914A2 (en) * 2000-08-11 2002-02-13 Nec Corporation System, method and record medium for packet transmission capable of reducing delay due to resource assignment
CN1441569A (zh) * 2002-02-27 2003-09-10 华为技术有限公司 一种网络设备的集群管理方法
CN101646135A (zh) * 2009-08-28 2010-02-10 曙光信息产业(北京)有限公司 用于集群监控的告警通知方法及***
CN101707632A (zh) * 2009-10-28 2010-05-12 浪潮电子信息产业股份有限公司 一种动态监控服务器集群性能并实时报警的方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103632215A (zh) * 2012-08-20 2014-03-12 曙光信息产业(北京)有限公司 一种集群环境下资产自动按需分配方法
CN102932483A (zh) * 2012-11-19 2013-02-13 西北大学 一种轻量级的资源动态定义方法
CN102932483B (zh) * 2012-11-19 2014-08-13 西北大学 一种轻量级的资源动态定义方法
CN103475544A (zh) * 2013-09-18 2013-12-25 浪潮电子信息产业股份有限公司 一种基于云资源监控平台的业务监控方法
CN103793349A (zh) * 2013-12-27 2014-05-14 远光软件股份有限公司 一种数据处理方法及装置
CN105243004A (zh) * 2015-09-15 2016-01-13 浪潮集团有限公司 一种故障资源检测方法及装置
CN106789366A (zh) * 2017-02-22 2017-05-31 郑州云海信息技术有限公司 一种业务层面的网络服务监控***
CN109062772A (zh) * 2018-07-16 2018-12-21 曙光信息产业(北京)有限公司 集群指标告警的实现方法及集群指标告警***

Also Published As

Publication number Publication date
CN102571413B (zh) 2015-04-29

Similar Documents

Publication Publication Date Title
CN102571413A (zh) 一种集群环境下资源管理的方法
CN101901399A (zh) 运维管理平台
CN110868322B (zh) 分布式消息服务的网络管理方法、***、设备及存储介质
CN104881352A (zh) 基于移动端的***资源监控装置
US8161326B2 (en) Method and system for managing information technology (IT) infrastructural elements
CN104182846A (zh) 一种客户管理***
CN105913222A (zh) 一种基于互联网大数据的智能业务管理方法
CN105357251A (zh) 一种资源池的管理***及管理方法
CN109800133A (zh) 一种统一监控告警的方法、一站式监控告警平台及***
CN108377228B (zh) 一种权限管理方法及装置、服务器
CN114254870A (zh) 一种生产订单自动排产方法、装置、电子设备及存储介质
CN102567021A (zh) 信息运行维护管理方法
CN105139186A (zh) 社区管理报表生成方法和***
CN109858807A (zh) 一种企业运营监控的方法及***
US20130041796A1 (en) Application governance process and tool
CN201371834Y (zh) 轨道交通多功能告警显示器
CN104778545A (zh) 基于移动设备的工作任务管理***
CN111695879A (zh) 一种基于大数据oa***
CN107277143A (zh) 一种资源匹配管理方法及装置
US20130041712A1 (en) Emerging risk identification process and tool
CN110990371A (zh) 一种包含知识库的运维管理***
CN104021212A (zh) 一种数据库自动化巡检装置
CN109034401A (zh) 运维监控方法及终端设备
CN104166878A (zh) 一种智能房控订房***
CN112734359A (zh) 科技项目进度跟踪***

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20160608

Address after: 100193, room 2, building 36, building 8, 202 West Wang Road, Haidian District, Beijing

Patentee after: The dawn of the Dragon Information Technology Co. Ltd.

Address before: 100084 Beijing Haidian District City Mill Street No. 64

Patentee before: Dawning Information Industry (Beijing) Co., Ltd.

CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: Room 111-1, 1st floor, building 23, No.8 yard, Dongbei Wangxi Road, Haidian District, Beijing 100193

Patentee after: Zhongke Tenglong Information Technology Co.,Ltd.

Address before: Room 202, 2 / F, building 36, yard 8, Dongbei Wangxi Road, Haidian District, Beijing 100193

Patentee before: The dawn of the Dragon Information Technology Co.,Ltd.