CN102857371B - 一种面向集群***的动态配置管理方法 - Google Patents

一种面向集群***的动态配置管理方法 Download PDF

Info

Publication number
CN102857371B
CN102857371B CN201210299404.6A CN201210299404A CN102857371B CN 102857371 B CN102857371 B CN 102857371B CN 201210299404 A CN201210299404 A CN 201210299404A CN 102857371 B CN102857371 B CN 102857371B
Authority
CN
China
Prior art keywords
configuration
group system
maintenance
information
configuration information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210299404.6A
Other languages
English (en)
Other versions
CN102857371A (zh
Inventor
赵欢
刘瑞贤
李帅
杨晓君
邵宗有
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guochao Xi'an Computing Technology Co ltd
Original Assignee
Dawning Information Industry Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dawning Information Industry Beijing Co Ltd filed Critical Dawning Information Industry Beijing Co Ltd
Priority to CN201210299404.6A priority Critical patent/CN102857371B/zh
Publication of CN102857371A publication Critical patent/CN102857371A/zh
Application granted granted Critical
Publication of CN102857371B publication Critical patent/CN102857371B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Stored Programmes (AREA)

Abstract

本发明提供一种面向集群***的动态配置管理方法,包括以下步骤:设立配置管理中心和配置管理数据库;创建网络通道;定义集群***的配置维护策略;创建自动配置任务维护***;建立动态处理和反馈策略,进行管理配置中的错误和异常。本发明使集群的配置管理活动的难度大大降低,并有效提高集群配置稳定性和可靠性,保持配置动态性和可追溯性,且有效减少集群配置管理活动不到位而带来的***灾难和错误,并可将***管理和维护人员从繁杂的配置管理活动中解脱出来。

Description

一种面向集群***的动态配置管理方法
技术领域
本发明涉及一种配置管理方法,具体涉及一种面向集群***的动态配置管理方法。
背景技术
配置管理是集群***特别是大规模集群***管理的核心之一,当集群***构成复杂时,也对配置管理提出了更大的挑战。因为大规模集群***中管理对象众多,而这些对象的状态可能会随时发生改变,如不能有效的实施配置管理,大规模***的具体状态往往连管理员自身都不清楚,此时***便存在极大的不稳定性,隐患随时可能爆发。
一方面,配置管理不只是记录集群中有多少资源,什么资源,更为重要的是对于资源配置状态的变更。配置的变更,往往会影响应用***的可用性,如何记录每次配置状态变更,让其变更生命周期可预见、可管理、可控制;另一方面,自动化、按需配置是大规模***的应用特征之一,如何按需简约式的配置操作,缩短配置时间是配置管理的核心所在,也是难点所在。缺点有以下几个方面:
a)自动化程度低
目前大多数***配置维护无法做到自动化,特别在大规模***中,对配置的维护会变得异常复杂,导致繁复的工作和人为错误。
b)配置信息无备份
现有大多数***的配置信息没有备份,或者备份是留存在本地,而没有历史版本;这样会导致配置丢失时,无法自动恢复,也就无法恢复应用。
c)配置管理混乱
现有的配置信息管理,缺乏相应的配置策略,未对配置的维护过程进行有效计划和归类,导致配置信息维护混乱,配置发生改变时,无法对配置信息进行有效追溯。
发明内容
为了克服上述现有技术的不足,本发明提供一种面向集群***的动态配置管理方法,使集群的配置管理活动的难度大大降低,并有效提高集群配置稳定性和可靠性,保持配置动态性和可追溯性,且有效减少集群配置管理活动不到位而带来的***灾难和错误,并可将***管理和维护人员从繁杂的配置管理活动中解脱出来。
为了实现上述发明目的,本发明采取如下技术方案:
一种面向集群***的动态配置管理方法,所述方法包括以下步骤:
步骤1:设立配置管理中心和配置管理数据库;
步骤2:创建网络通道;
步骤3:定义集群***的配置维护策略;
步骤4:创建自动配置任务维护***;
步骤5:建立动态处理和反馈策略,进行管理配置中的错误和异常。
所述步骤1中,在集群***中设立用于对集群***集中统一管理的配置管理中心和配置管理数据库,所述配置管理中心为位于集群内部的一台或多台普通服务器或位于集群***外部的云配置中心。
所述配置管理中心维护所述配置管理数据库,所述配置管理数据库存放集群***备份和记录的配置信息,所述配置信息包括集群***配置信息、应用配置信息、业务配置信息和配置历史版本信息。
所述步骤2中,在集群***内创建用于配置信息的传输和维护网络通道。
所述步骤3中,定义集群***的配置维护策略;所述配置维护策略包括配置信息的更新、恢复、错误处理、状态监测和备份。
所述步骤4中,创建自动配置任务维护***,所述自动配置任务维护***根据定义的配置维护策略,进行配置的自动监测、配置变化的分析、配置信息的自动下发、配置信息上传和配置处理动作的执行。
所述自动配置任务维护***包括配置状态监测器、配置任务管理器和配置任务执行器;其自动监测配置信息变更,并将配置变化信息及时通知所述配置状态监测器,由所述配置状态监测器对配置变化信息进行分析和确认,并按照定义的配置维护策略,启动下个任务。
所述自动配置任务维护***按照定义的配置维护策略进行配置信息的更新维护,按照设置配置信息的更新时间、版本、范围和出现错误时的处理完成对集群***的配置更新和维护工作。
所述步骤5包括以下步骤:
步骤5-1:建立动态处理和反馈策略,对错误和异常进行分类和分级别管理;
步骤5-2:针对配置维护过程中发生过的错误和异常,进行记录、单一分析和关联分析;
步骤5-3:针对分析结果对错误和异常进行预防,以及风险的预警。
与现有技术相比,本发明的有益效果在于:使集群的配置管理活动的难度大大降低,并有效提高集群配置稳定性和可靠性,保持配置动态性和可追溯性,且有效减少集群配置管理活动不到位而带来的***灾难和错误,并可将***管理和维护人员从繁杂的配置管理活动中解脱出来。
附图说明
图1是配置信息物理部署结构图;
图2是自动配置逻辑结构图。
具体实施方式
下面结合附图对本发明作进一步详细说明。
如图1和图2,一种面向集群***的动态配置管理方法,所述方法包括以下步骤:
步骤1:设立配置管理中心和配置管理数据库;
步骤2:在集群***内创建用于配置信息的传输和维护网络通道;
步骤3:定义集群***的配置维护策略,精确到不同类型的业务的配置维护策略,这样在配置信息发生变化时,可按照预定义策略进行维护;
步骤4:创建自动配置任务维护***;
步骤5:建立动态处理和反馈策略,进行管理配置中的错误和异常。
所述步骤1中,在集群***中设立用于对集群***集中统一管理的配置管理中心和配置管理数据库,所述配置管理中心为位于集群内部的一台或多台普通服务器或位于集群***外部的云配置中心,即位于云端的配置中心。
所述配置管理中心维护所述配置管理数据库,所述配置管理数据库存放集群***备份和记录的配置信息,所述配置信息包括集群***配置信息、应用配置信息、业务配置信息和配置历史版本信息。基于此,配置信息则可集中管理,不再散布于该大规模***的各个设备和应用对象中,是配置管理模式的一大进步。
该配置管理中心还需要保留所有配置信息的历史版本,***中任意对象的配置一旦在某个版本出现了问题,则可以恢复到某一个历史稳定版本中,这样既可以便于保证配置信息的稳定和准确,也对于配置信息的历史版本变迁,有一条清晰的历史曲线,从该历史曲线可以分析整个***的动态升级过程。
配置管理中心既可以设立在集群***中,比如其中的一台或几台服务器,也可以设立在“云端”,既***外的云计算中心中,实现配置的真正“云备份”,如果这样,配置信息维护又向前跨了一步,从对象自己保持->***集中维护->云维护。
所述步骤2中,在集群***内创建用于配置信息的传输和维护网络通道,在网络资源充分的情况下,该网络通道尽量独立,以避免因为其它业务影响的网络资源争抢而可能带来的影响。
配置信息是比较重要且可能直接导致***失败和错误的。如果依赖于业务网络,则可能业务和配置之间互相影响,而且如果维护的配置信息是网络配置信息,此时如果业务网因为业务影响(很大一部分网络故障是由于业务异常引起,比如业务流量突然暴增,导致网络堵塞,业务瘫痪),则配置无法通过该网络进行更新和维护,也就无法解决这种场景下的需要配置恢复来解决的故障。
一般的***配置信息均保留在配置宿主本地,而关于配置的描述则可在集中的CMDB数据库中记录。本***提出通过集中的配置管理平台,即不只在CMDB中保留配置描述和状态,而且针对重要配置文件和信息,可选择将其保留在集中的配置环境中,即针对配置做了“云备份”,并可针对宿主机的配置做实时监测,通过该机制,则可真正对集群内配置的高可靠、高可用以及自动化配置管理等特性。
所述步骤3中,定义集群***的配置维护策略;所述配置维护策略包括配置信息的更新、恢复、错误处理、状态监测和备份。
所述步骤4中,创建自动配置任务维护***,所述自动配置任务维护***根据定义的配置维护策略,进行配置的自动监测、配置变化的分析、配置信息的自动下发、配置信息上传和配置处理动作的执行,自动任务***最大的特点是用户完全可以自定义任务和任务之间的执行顺序。
该自动配置任务维护***,可按照自定义时间策略或者触发事件策略,定时或者及时
向配置管理中心发送最新的配置信息,由中心进行远程备份。
所述自动配置任务维护***包括配置状态监测器、配置任务管理器和配置任务执行器;其自动监测配置信息变更,并将配置变化信息及时通知所述配置状态监测器,由所述配置状态监测器对配置变化信息进行分析和确认,并按照定义的配置维护策略,启动下个任务,可能是配置的强制下发恢复,也可能是触发配置的警告,也可能只是做一个日志记录。具体的任务,可预先定义在配置策略中。
所述自动配置任务维护***按照定义的配置维护策略进行配置信息的更新维护,按照设置配置信息的更新时间、版本、范围和出现错误时的处理完成对集群***的配置更新和维护工作。
一个自动触发场景举例如表1:
表1
所述步骤5包括以下步骤:
步骤5-1:建立动态处理和反馈策略,对错误和异常进行分类和分级别管理;当一般的错误和异常出现时,***可按照预定义策略执行后续处理任务,当重大错误和异常发生时,除了进行预定义处理任务外,还可以将错误和异常通过声光告警、邮件及短信告警及时通报给***管理人员。
步骤5-2:针对配置维护过程中发生过的错误和异常,进行记录、单一分析和关联分析;该***需要记录所有配置维护过程中发生的异常,并跟踪这些异常的处理方式,对每种类型的错误和异常进行单一分析和关联分析。
单一分析包括,一种错误或异常经常出现,分析其出现的时机、记录出现异常时的***日志和用户行为,这种分析通常会得出错误或异常出现的单一化原因,即由于***或人为的原因直接引起。
关联分析包括,多种错误和异常一起出现,且经常一起出现,此时不但要进行单一分析,还需要针对错误异常之间的潜在关系进行分析。这种分析通常会得出***或应用缺陷,可能有多种缺陷引起这一系列错误和异常。
关联分析通常采用关联模型法进行,举例如表2:
表2
步骤5-3:针对分析结果对错误和异常进行预防,以及风险的预警。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求范围当中。

Claims (1)

1.一种面向集群***的动态配置管理方法,其特征在于:所述方法包括以下步骤:
步骤1:设立配置管理中心和配置管理数据库;
步骤2:创建网络通道;
步骤3:定义集群***的配置维护策略;
步骤4:创建自动配置任务维护***;
步骤5:建立动态处理和反馈策略,进行管理配置中的错误和异常;
所述步骤1中,在集群***中设立用于对集群***集中统一管理的配置管理中心和配置管理数据库,所述配置管理中心为位于集群内部的一台或多台普通服务器或位于集群***外部的云配置中心;
所述配置管理中心维护所述配置管理数据库,所述配置管理数据库存放集群***备份和记录的配置信息,所述配置信息包括集群***配置信息、应用配置信息、业务配置信息和配置历史版本信息;
所述步骤2中,在集群***内创建用于配置信息的传输和维护网络通道;
所述步骤3中,定义集群***的配置维护策略;所述配置维护策略包括配置信息的更新、恢复、错误处理、状态监测和备份;
所述步骤4中,创建自动配置任务维护***,所述自动配置任务维护***根据定义的配置维护策略,进行配置的自动监测、配置变化的分析、配置信息的自动下发、配置信息上传和配置处理动作的执行;
所述自动配置任务维护***包括配置状态监测器、配置任务管理器和配置任务执行器;其自动监测配置信息变更,并将配置变化信息及时通知所述配置状态监测器,由所述配置状态监测器对配置变化信息进行分析和确认,并按照定义的配置维护策略,启动下个任务;
所述自动配置任务维护***按照定义的配置维护策略进行配置信息的更新维护,按照设置配置信息的更新时间、版本、范围和出现错误时的处理完成对集群***的配置更新和维护工作;
所述步骤5包括以下步骤:
步骤5‐1:建立动态处理和反馈策略,对错误和异常进行分类和分级别管理;
步骤5‐2:针对配置维护过程中发生过的错误和异常,进行记录、单一分析和关联分析;
步骤5‐3:针对分析结果对错误和异常进行预防,以及风险的预警。
CN201210299404.6A 2012-08-21 2012-08-21 一种面向集群***的动态配置管理方法 Active CN102857371B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210299404.6A CN102857371B (zh) 2012-08-21 2012-08-21 一种面向集群***的动态配置管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210299404.6A CN102857371B (zh) 2012-08-21 2012-08-21 一种面向集群***的动态配置管理方法

Publications (2)

Publication Number Publication Date
CN102857371A CN102857371A (zh) 2013-01-02
CN102857371B true CN102857371B (zh) 2016-04-20

Family

ID=47403579

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210299404.6A Active CN102857371B (zh) 2012-08-21 2012-08-21 一种面向集群***的动态配置管理方法

Country Status (1)

Country Link
CN (1) CN102857371B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103268271A (zh) * 2013-04-23 2013-08-28 深圳市京华科讯科技有限公司 一体机容灾实现方法
CN103532750B (zh) * 2013-10-08 2016-08-17 清华大学深圳研究生院 用于海底观测网仪器智能配置的云配置方法
CN105242936B (zh) * 2014-06-09 2018-06-26 宋菏生 一种实现服务器配置的方法、装置及服务器
CN104980517B (zh) * 2015-06-26 2018-04-06 深圳市腾讯计算机***有限公司 基于快照的集群感知***、方法和装置
CN105553738A (zh) * 2015-12-25 2016-05-04 北京奇虎科技有限公司 配置信息的热加载方法及装置、分布式集群***
CN107357555B (zh) * 2016-05-09 2020-11-17 阿里巴巴集团控股有限公司 配置推送方法及装置、***
CN106685713A (zh) * 2016-12-26 2017-05-17 努比亚技术有限公司 一种处理配置参数的方法和装置
CN110447018B (zh) * 2017-03-23 2023-02-10 日本电气株式会社 操作管理服务器、开发操作支持***及其方法以及存储其程序的非暂时性计算机可读介质
CN107769970A (zh) * 2017-10-20 2018-03-06 北京集奥聚合科技有限公司 一种分布式***中配置信息的处理方法及***
CN110034954A (zh) * 2019-03-15 2019-07-19 国网甘肃省电力公司 一种自动化变更配置***

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1874267A (zh) * 2006-03-21 2006-12-06 华为技术有限公司 保证集群***中配置信息一致的方法
EP2053780A1 (en) * 2006-07-28 2009-04-29 ZTE Corporation A distributed master and standby managing method and system based on the network element
CN102255752A (zh) * 2011-06-30 2011-11-23 北京新媒传信科技有限公司 一种服务器集群的配置管理***和方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1874267A (zh) * 2006-03-21 2006-12-06 华为技术有限公司 保证集群***中配置信息一致的方法
EP2053780A1 (en) * 2006-07-28 2009-04-29 ZTE Corporation A distributed master and standby managing method and system based on the network element
CN102255752A (zh) * 2011-06-30 2011-11-23 北京新媒传信科技有限公司 一种服务器集群的配置管理***和方法

Also Published As

Publication number Publication date
CN102857371A (zh) 2013-01-02

Similar Documents

Publication Publication Date Title
CN102857371B (zh) 一种面向集群***的动态配置管理方法
CN107291565B (zh) 运维可视化自动化作业平台及实现方法
US9049105B1 (en) Systems and methods for tracking and managing event records associated with network incidents
CN105099783B (zh) 一种实现业务***告警应急处置自动化的方法及***
CN112600891B (zh) 一种基于信息物理融合的边云协同***及工作方法
US10177984B2 (en) Isolation of problems in a virtual environment
CN107660289A (zh) 自动网络控制
CN103995868B (zh) 面向分布式***的全局事务管理器及事务处理方法
CN105095056A (zh) 一种数据仓库数据监控的方法
CN103729280A (zh) 一种虚拟机高可用机制
US20130132778A1 (en) Isolation of problems in a virtual environment
CN105653425A (zh) 基于复杂事件处理引擎的监控***
CN110851320A (zh) 一种服务器宕机监管方法、***、终端及存储介质
US11044144B2 (en) Self-monitoring
CN109901969B (zh) 一种集中监控管理平台的设计方法及装置
CN108337108A (zh) 一种基于关联分析的云平台故障自动化定位方法
Trivedi et al. System availability assessment using stochastic models
US10318911B1 (en) Persistenceless business process management system and method
CN104734895A (zh) 业务监控***及业务监控方法
CN110389892A (zh) 一种基于云平台历史故障数据的故障注入方法
CN108154343B (zh) 一种企业级信息***的应急处理方法及***
CN108156061A (zh) esb监控服务平台
CN104539449A (zh) 一种故障信息处理方法与相关装置
CN103414717A (zh) 一种关于c/s结构业务***的仿真监控方法和***
CN107682173B (zh) 基于交易模型的自动故障定位方法和***

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220726

Address after: 100193 No. 36 Building, No. 8 Hospital, Wangxi Road, Haidian District, Beijing

Patentee after: Dawning Information Industry (Beijing) Co.,Ltd.

Patentee after: DAWNING INFORMATION INDUSTRY Co.,Ltd.

Address before: 100193 No.36 Zhongguancun Software Park, No.8 Dongbeiwang West Road, Haidian District, Beijing

Patentee before: Dawning Information Industry (Beijing) Co.,Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20231101

Address after: Room 508, 5th Floor, Xinhai International Business Center, No. 389 East Chang'an Street, National Civil Aerospace Industry Base, Xi'an City, Shaanxi Province, 710309

Patentee after: Guochao (Xi'an) Computing Technology Co.,Ltd.

Address before: 100193 No. 36 Building, No. 8 Hospital, Wangxi Road, Haidian District, Beijing

Patentee before: Dawning Information Industry (Beijing) Co.,Ltd.

Patentee before: DAWNING INFORMATION INDUSTRY Co.,Ltd.