CN102394914A - 集群脑裂处理方法和装置 - Google Patents

集群脑裂处理方法和装置 Download PDF

Info

Publication number
CN102394914A
CN102394914A CN2011102825734A CN201110282573A CN102394914A CN 102394914 A CN102394914 A CN 102394914A CN 2011102825734 A CN2011102825734 A CN 2011102825734A CN 201110282573 A CN201110282573 A CN 201110282573A CN 102394914 A CN102394914 A CN 102394914A
Authority
CN
China
Prior art keywords
cluster
node
heartbeat
nodes
business
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011102825734A
Other languages
English (en)
Inventor
王婷
张书宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Beijing Electronic Information Industry Co Ltd
Original Assignee
Inspur Beijing Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Beijing Electronic Information Industry Co Ltd filed Critical Inspur Beijing Electronic Information Industry Co Ltd
Priority to CN2011102825734A priority Critical patent/CN102394914A/zh
Publication of CN102394914A publication Critical patent/CN102394914A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Hardware Redundancy (AREA)

Abstract

本发明提供了一种集群脑裂处理方法和装置。涉及计算机技术应用领域;解决了对脑裂处理方式单一,影响集群工作效率的问题。该方法包括:集群内各节点检测本节点与集群中其他节点之间的心跳线;在集群内节点检测不到任何心跳线时,该节点中止本节点上的业务。本发明提供的技术方案适用于高可用集群,实现了灵活高效的脑裂处理。

Description

集群脑裂处理方法和装置
技术领域
本发明涉及计算机技术应用领域,尤其涉及一种集群脑裂处理方法和装置。
背景技术
高可用集群技术被广泛的应用于存储技术领域。为了保证高可用集群的正常工作,需要集群内的每个节点在提供对外服务时有正常的活性,从而保证对外提供稳定的服务。在集群提供服务的过程中,由于环境的变化,节点可能会发生这样或者那样的故障,而造成节点从集群中断开,出现脑裂现象。由于在脑裂发生时,断开的节点原提供的服务现在可能不正常,造成集群不能正常工作,所以,快速准确的检测和响应脑裂,可以提高集群的性能。
现有响应脑裂和恢复节点的办法主要是直接对断开的节点进行关闭并重启计算机***,复原断开节点上计算机的初始环境,在复原完成后再将该节点加入集群中重新提供服务,保证该节点上之后提供的服务稳定。该方法能够保证节点计算机的提供服务的稳定性,然而在很多情况下,例如:网线的断开等,直接重启计算机***没有多大的必要性,而且在计算机***启动后要按照要求重新初始化信息,这将是一个比较耗时的过程,降低了效率。综上,现有技术中对脑裂的处理方式单一,影响了集群工作效率。
发明内容
本发明提供了一种集群脑裂处理方法和装置,解决了对脑裂处理方式单一,影响集群工作效率的问题。
一种集群脑裂处理方法,包括:
集群内各节点检测本节点与集群中其他节点之间的心跳线;
在集群内节点检测不到任何心跳线时,该节点中止本节点上的业务。
优选的,所述在集群内节点检测不到任何心跳线时,该节点中止本节点上的业务的步骤之后还包括:
在所述节点检测到与集群中各节点之间的心跳线心跳恢复后,将本节点上的业务重新开放。
优选的,所述在集群内节点检测不到任何心跳线时,该节点中止本节点上的业务具体为:
在集群内节点在预置的检测周期内无法检测到任何心跳线时,该节点中止本节点上的业务。
优选的,上述集群脑裂处理方法还包括:
在集群内节点能够检测到与部分集群中其他节点之间的心跳线时,判定检测不到的心跳线故障。
本发明还提供了一种集群脑裂处理装置,包括:
心跳管理模块,用于检测集群内节点与集群中其他节点之间的心跳线;
集群管理模块,用于在检测不到集群内节点与集群中其他节点之间的任何心跳线时,中止该集群内节点上的业务。
优选的,所述集群管理模块,还用于在检测到集群内节点与所述集群中其他节点之间的心跳线心跳恢复后,将该集群内节点上的业务重新开放。
优选的,所述心跳管理模块,还用于在能够检测到与部分集群中其他节点之间的心跳线时,判定检测不到的心跳线故障。
本发明提供了一种集群脑裂处理方法和装置,集群内各节点检测本节点与集群中其他节点之间的心跳线,在集群内节点检测不到任何心跳线时,该节点中止本节点上的业务,用中止业务代替了现有技术中的直接重启***,节省了恢复时间,提高了对脑裂现象处理的精确度,保证了***工作效率。
附图说明
图1为本发明的实施例一提供的集群脑裂方法对脑裂响应的流程图;
图2为本发明的实施例一提供的集群脑裂方法对脑裂恢复响应的流程图;
图3为本发明的实施例二提供的一种集群脑裂处理方法流程图;
图4为本发明的实施例二提供的一种集群脑裂处理装置结构示意图。
具体实施方式
在很多情况下,例如:网线的断开等,直接重启计算机***没有多大的必要性,而且在计算机***启动后要按照要求重新初始化信息,这将是一个比较耗时的过程,降低了效率。
为了解决上述问题,本发明的实施例提供了一种集群脑裂处理方法和装置,快速检测和响应脑裂,停止本节点上的共享资源、停止本节点提供的业务服务,保证共享资源的安全性;当该节点心跳恢复后,可以直接、快速、高效的恢复节点的服务。不仅保证了资源的安全,同时提高了集群恢复的速度以及高可用***的性能。
下文中将结合附图对本发明的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
首先结合附图,对本发明的实施例一进行说明。
本发明实施例提供了一种集群脑裂处理方法和装置,在高可用集群中,节点发现心跳断开后,不会直接停止操作***,而只是停止本节点上的共享资源、停止本节点提供的业务服务;当该节点心跳恢复后,可以直接、快速、高效的恢复节点的服务。此方法不仅保证了资源的安全,同时提高了集群恢复的速度,提高高可用***的性能。本发明实施例提供的集群脑裂处理装置包括:心跳管理模块、集群管理模块以及本地资源管理模块。
结合上述集群脑裂处理装置,使用本发明实施例提供的集群脑裂处理方法,对发生脑裂现象的节点进行处理的流程如下:
1)心跳管理模块中,心跳模块定期检测集群中所有节点的每条心跳线的信息。在***预先设置的时间内,如若持续没有检测到心跳线的信息,这判定该心跳线故障。在一个节点中,若所有的心跳线都故障,则判定该节点与集群中其他节点断开。
2)在集群管理模块中,当该模块收到心跳模块心跳断开命令时,会进行一系列节点信息判断,最后确定节点的处理方法。若本节点是从集群中断开的节点,本节点将不会直接停止操作***,而是启动本地资源管理模块(3)停止本节点上的共享资源、停止本节点提供的业务服务。集群中其他正常节点将接管该断开节点上的业务,对外提供服务。
3)心跳管理模块在心跳线故障后仍然检测每个节点每条心跳线的信息,当重新检测到故障心跳线的心跳信息后,发送心跳恢复的命令给集群管理模块。
4)在接受到心跳恢复的命令后,集群管理模块将根据集群的当前状态,做出不同的操作。如集群正常节点会直接、快速、高效的恢复节点的服务;如集群已是脑裂状态,将快速恢复整个集群的服务。
当节点从集群中断开后,不会直接停止操作***,而只是停止本节点上的共享资源、停止本节点提供的业务服务,保证了共享资源的安全性;同时本发明增加了心跳恢复检测机制,当该节点心跳恢复后,可以直接、快速、高效的恢复节点的服务,提高了集群恢复的速度,提高高可用***的性能。
下面将结合附图对本发明进行更加详细的描述:
集群管理的主服务器也是集群中的一个节点,该节点会主动分配集群的资源,把集群的各种服务分配到不同的服务器上,对外提供服务;同时,主服务器也直接和用户相关,用户对集群的操作直接由该节点指派到指定的节点上。
附图1为本发明实施例所述的脑裂响应流程图。当心跳管理模块检测到某个节点的心跳从集群中断开时发送节点死亡的命令给集群管理模块,集群管理模块首先删除和更新集群节点信息列表,并且计算节点是否为主节点,然后判断节点是否是本节点,假若是本节点从集群中断开,本地资源管理模块将停止本节点上的共享资源、停止本节点提供的业务服务,等待心跳的复活;在断开的节点不是本节点的情况下,计算集群的初始节点数,判断节点数是否为2节点的1+1高可用集群模式,在2节点的高可用集群中,本节点主动PING第三方IP地址,判断本节点是否也已经从网络中断开,倘若本节点已经从网络中断开,本地资源管理模块将停止本节点上的共享资源、停止本节点提供的业务服务,等待心跳的复活,不然则接管集群管理的主服务器;在多节点的集群情况下,对比集群现存节点数和初始节点数的一半的大小,假如现存节点数小于一半时,本地资源管理模块将停止本节点上的共享资源、停止本节点提供的业务服务,等待复活心跳的节点数大于1/2;当现存节点数等于1/2时,判断现存节点中是否存在主服务器;当现存节点大于1/2时,则判断断开的节点是否为主服务器,假如断开的节点是主服务器,本节点将计算本节点的信息,决策是否接管主服务器;若断开节点不是主服务器,则判断本节点是否为主服务器,若是主服务器,则转移断开节点上的业务到其他活动的节点上。
图2是心跳恢复响应流程图。当心跳管理模块检测到节点的心跳恢复时发送节点恢复的命令给集群管理模块,集群管理模块首先发送若干次请求加入的消息给集群中所有的节点。对于集群中的所有节点,在接收到请求加入命令后,将把节点信息加入到本节点上的节点列表信息中,集群中所有节点都认知了节点的存在,然后判断本节点是否为主服务器节点,假如节点为主服务器,该节点将回复恢复节点的消息,告知主服务器的存在;对于心跳恢复节点,发送请求加入消息后将等待若干时间等待主服务器的回复消息,假如接收到主服务器的回复消息,则节点加入集群中,可以启动集群中服务;假如没有收到主服务器的回复消息,说明主服务器不存在,该恢复节点将发送重新决策主服器命令给集群中的所有节点,各节点收到该命令后,都计算节点的信息,决策出集群中的新的主服务器,重新开始集群的服务。
本发明实施例所提供的集群脑裂处理方法和装置,可以快速的响应心跳断开的命令,停止本地的业务和共享资源,而主服务器将把断开节点上服务分配到其他正常的节点上,保证资源的安全性,同时保证了业务的连续性;同时,在节点心跳恢复时,可以直接、快速、高效的恢复节点的服务,提高了集群恢复的速度,提高高可用***的性能。
下面结合附图,对本发明的实施例二进行说明。
本发明实施例提供了一种集群脑裂处理方法,使用该方法完成对集群内脑裂节点进行处理的流程如图3所示,包括:
步骤301、集群内各节点检测本节点与集群中其他节点之间的心跳线;
步骤302、在集群内节点检测不到任何心跳线时,该节点中止本节点上的业务;
在集群内节点在预置的检测周期内无法检测到任何心跳线时,该节点中止本节点上的业务。
步骤303、在所述节点检测到与集群中各节点之间的心跳线心跳恢复后,将本节点上的业务重新开放。
步骤304、在集群内节点能够检测到与部分集群中其他节点之间的心跳线时,判定检测不到的心跳线故障;
在步骤301之后,如果集群内节点能够检测到一条或多条心跳线,但无法检测到全部心跳线时,说明该节点并未发生脑裂,此时,可判定检测不到的心跳线故障。
本发明实施例还提供了一种集群脑裂处理装置,其结构如图4所示,包括:
心跳管理模块401,用于检测集群内节点与集群中其他节点之间的心跳线;
集群管理模块402,用于在检测不到集群内节点与集群中其他节点之间的任何心跳线时,中止该集群内节点上的业务。
优选的,所述集群管理模块402,还用于在检测到集群内节点与所述集群中其他节点之间的心跳线心跳恢复后,将该集群内节点上的业务重新开放。
优选的,所述心跳管理模块401,还用于在能够检测到与部分集群中其他节点之间的心跳线时,判定检测不到的心跳线故障。
上述集群脑裂处理装置可集成于集群内各节点上,以完成对各节点的监控及脑裂处理。
本发明实施例提供的集群脑裂处理装置,能够与本发明的实施例所提供的一种集群脑裂处理方法相结合,集群内各节点检测本节点与集群中其他节点之间的心跳线,在集群内节点检测不到任何心跳线时,该节点中止本节点上的业务,用中止业务代替了现有技术中的直接重启***,节省了恢复时间,提高了对脑裂现象处理的精确度,保证了***工作效率。
本领域普通技术人员可以理解上述实施例的全部或部分步骤可以使用计算机程序流程来实现,所述计算机程序可以存储于一计算机可读存储介质中,所述计算机程序在相应的硬件平台上(如***、设备、装置、器件等)执行,在执行时,包括方法实施例的步骤之一或其组合。
可选地,上述实施例的全部或部分步骤也可以使用集成电路来实现,这些步骤可以被分别制作成一个个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
上述实施例中的各装置/功能模块/功能单元可以采用通用的计算装置来实现,它们可以集中在单个的计算装置上,也可以分布在多个计算装置所组成的网络上。
上述实施例中的各装置/功能模块/功能单元以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。上述提到的计算机可读取存储介质可以是只读存储器,磁盘或光盘等。
任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求所述的保护范围为准。

Claims (7)

1.一种集群脑裂处理方法,其特征在于,包括:
集群内各节点检测本节点与集群中其他节点之间的心跳线;
在集群内节点检测不到任何心跳线时,该节点中止本节点上的业务。
2.根据权利要求1人手一册的集群脑裂处理方法,其特征在于,所述在集群内节点检测不到任何心跳线时,该节点中止本节点上的业务的步骤之后还包括:
在所述节点检测到与集群中各节点之间的心跳线心跳恢复后,将本节点上的业务重新开放。
3.根据权利要求1所述的集群脑裂处理方法,其特征在于,所述在集群内节点检测不到任何心跳线时,该节点中止本节点上的业务具体为:
在集群内节点在预置的检测周期内无法检测到任何心跳线时,该节点中止本节点上的业务。
4.根据权利要求1所述的集群脑裂处理方法,其特征在于,该方法还包括:
在集群内节点能够检测到与部分集群中其他节点之间的心跳线时,判定检测不到的心跳线故障。
5.一种集群脑裂处理装置,其特征在于,包括:
心跳管理模块,用于检测集群内节点与集群中其他节点之间的心跳线;
集群管理模块,用于在检测不到集群内节点与集群中其他节点之间的任何心跳线时,中止该集群内节点上的业务。
6.根据权利要求5所述的集群脑裂处理装置,其特征在于,
所述集群管理模块,还用于在检测到集群内节点与所述集群中其他节点之间的心跳线心跳恢复后,将该集群内节点上的业务重新开放。
7.根据权利要求5所述的集群脑裂处理装置,其特征在于,
所述心跳管理模块,还用于在能够检测到与部分集群中其他节点之间的心跳线时,判定检测不到的心跳线故障。
CN2011102825734A 2011-09-22 2011-09-22 集群脑裂处理方法和装置 Pending CN102394914A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011102825734A CN102394914A (zh) 2011-09-22 2011-09-22 集群脑裂处理方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011102825734A CN102394914A (zh) 2011-09-22 2011-09-22 集群脑裂处理方法和装置

Publications (1)

Publication Number Publication Date
CN102394914A true CN102394914A (zh) 2012-03-28

Family

ID=45862118

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011102825734A Pending CN102394914A (zh) 2011-09-22 2011-09-22 集群脑裂处理方法和装置

Country Status (1)

Country Link
CN (1) CN102394914A (zh)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102769673A (zh) * 2012-07-25 2012-11-07 楚云汉智武汉网络存储***有限公司 一种适应于大规模存储集群的失效检测方法
CN102904946A (zh) * 2012-09-29 2013-01-30 浪潮(北京)电子信息产业有限公司 集群内节点管理方法和装置
CN103607310A (zh) * 2013-11-29 2014-02-26 华为技术有限公司 一种异地容灾的仲裁方法
CN103684941A (zh) * 2013-11-23 2014-03-26 广东新支点技术服务有限公司 基于仲裁服务器的集群裂脑预防方法和装置
CN104094577A (zh) * 2012-08-13 2014-10-08 统一有限责任两合公司 用于间接地评定活动实体的状态的方法和装置
CN104239182A (zh) * 2014-09-03 2014-12-24 北京鲸鲨软件科技有限公司 一种集群文件***脑裂处理方法和装置
CN104378232A (zh) * 2014-11-10 2015-02-25 东软集团股份有限公司 主备集群组网模式下的脑裂发现、恢复方法及装置
CN104579765A (zh) * 2014-12-27 2015-04-29 北京奇虎科技有限公司 一种集群***的容灾方法和装置
CN104994173A (zh) * 2015-07-16 2015-10-21 浪潮(北京)电子信息产业有限公司 一种消息处理方法和***
WO2016050074A1 (zh) * 2014-09-29 2016-04-07 中兴通讯股份有限公司 集群脑裂处理方法和装置
CN105515838A (zh) * 2015-11-26 2016-04-20 青岛海信传媒网络技术有限公司 一种服务配置方法及ha集群***
CN105704187A (zh) * 2014-11-27 2016-06-22 华为技术有限公司 一种集群脑裂的处理方法及装置
CN105849702A (zh) * 2013-12-25 2016-08-10 日本电气方案创新株式会社 集群***,服务器设备,集群***管理方法和计算机可读记录介质
CN105933407A (zh) * 2016-04-20 2016-09-07 ***股份有限公司 一种实现Redis集群高可用的方法及***
CN107528724A (zh) * 2017-07-20 2017-12-29 北京奇安信科技有限公司 一种节点集群的优化处理方法及装置
CN109088794A (zh) * 2018-08-20 2018-12-25 郑州云海信息技术有限公司 一种节点的故障监测方法和装置
CN110377487A (zh) * 2019-07-11 2019-10-25 无锡华云数据技术服务有限公司 一种处理高可用集群脑裂的方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101179432A (zh) * 2007-12-13 2008-05-14 浪潮电子信息产业股份有限公司 一种多机环境中实现***高可用的方法
CN101291243A (zh) * 2007-04-16 2008-10-22 广东省新支点技术服务有限公司 高可用集群***的裂脑预防方法
CN101651680A (zh) * 2009-09-14 2010-02-17 杭州华三通信技术有限公司 一种网络***署方法和一种网络安全设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101291243A (zh) * 2007-04-16 2008-10-22 广东省新支点技术服务有限公司 高可用集群***的裂脑预防方法
CN101179432A (zh) * 2007-12-13 2008-05-14 浪潮电子信息产业股份有限公司 一种多机环境中实现***高可用的方法
CN101651680A (zh) * 2009-09-14 2010-02-17 杭州华三通信技术有限公司 一种网络***署方法和一种网络安全设备

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102769673B (zh) * 2012-07-25 2015-03-25 深圳市中博科创信息技术有限公司 一种适应于大规模存储集群的失效检测方法
CN102769673A (zh) * 2012-07-25 2012-11-07 楚云汉智武汉网络存储***有限公司 一种适应于大规模存储集群的失效检测方法
CN104094577A (zh) * 2012-08-13 2014-10-08 统一有限责任两合公司 用于间接地评定活动实体的状态的方法和装置
CN104094577B (zh) * 2012-08-13 2017-07-04 统一有限责任两合公司 用于间接地评定活动实体的状态的方法和装置
CN102904946A (zh) * 2012-09-29 2013-01-30 浪潮(北京)电子信息产业有限公司 集群内节点管理方法和装置
CN102904946B (zh) * 2012-09-29 2015-06-10 浪潮(北京)电子信息产业有限公司 集群内节点管理方法和装置
CN103684941B (zh) * 2013-11-23 2018-01-16 广东中兴新支点技术有限公司 基于仲裁服务器的集群裂脑预防方法和装置
CN103684941A (zh) * 2013-11-23 2014-03-26 广东新支点技术服务有限公司 基于仲裁服务器的集群裂脑预防方法和装置
CN103607310A (zh) * 2013-11-29 2014-02-26 华为技术有限公司 一种异地容灾的仲裁方法
US10102088B2 (en) 2013-12-25 2018-10-16 Nec Solution Innovators, Ltd. Cluster system, server device, cluster system management method, and computer-readable recording medium
CN105849702A (zh) * 2013-12-25 2016-08-10 日本电气方案创新株式会社 集群***,服务器设备,集群***管理方法和计算机可读记录介质
CN104239182A (zh) * 2014-09-03 2014-12-24 北京鲸鲨软件科技有限公司 一种集群文件***脑裂处理方法和装置
CN104239182B (zh) * 2014-09-03 2017-05-03 北京鲸鲨软件科技有限公司 一种集群文件***脑裂处理方法和装置
WO2016050074A1 (zh) * 2014-09-29 2016-04-07 中兴通讯股份有限公司 集群脑裂处理方法和装置
CN104378232A (zh) * 2014-11-10 2015-02-25 东软集团股份有限公司 主备集群组网模式下的脑裂发现、恢复方法及装置
CN104378232B (zh) * 2014-11-10 2018-01-19 东软集团股份有限公司 主备集群组网模式下的脑裂发现、恢复方法及装置
CN105704187B (zh) * 2014-11-27 2019-03-05 华为技术有限公司 一种集群脑裂的处理方法及装置
CN105704187A (zh) * 2014-11-27 2016-06-22 华为技术有限公司 一种集群脑裂的处理方法及装置
CN104579765A (zh) * 2014-12-27 2015-04-29 北京奇虎科技有限公司 一种集群***的容灾方法和装置
CN104994173A (zh) * 2015-07-16 2015-10-21 浪潮(北京)电子信息产业有限公司 一种消息处理方法和***
CN105515838A (zh) * 2015-11-26 2016-04-20 青岛海信传媒网络技术有限公司 一种服务配置方法及ha集群***
CN105933407A (zh) * 2016-04-20 2016-09-07 ***股份有限公司 一种实现Redis集群高可用的方法及***
CN105933407B (zh) * 2016-04-20 2019-12-06 ***股份有限公司 一种实现Redis集群高可用的方法及***
CN107528724A (zh) * 2017-07-20 2017-12-29 北京奇安信科技有限公司 一种节点集群的优化处理方法及装置
CN107528724B (zh) * 2017-07-20 2020-09-29 奇安信科技集团股份有限公司 一种节点集群的优化处理方法及装置
CN109088794A (zh) * 2018-08-20 2018-12-25 郑州云海信息技术有限公司 一种节点的故障监测方法和装置
CN110377487A (zh) * 2019-07-11 2019-10-25 无锡华云数据技术服务有限公司 一种处理高可用集群脑裂的方法及装置

Similar Documents

Publication Publication Date Title
CN102394914A (zh) 集群脑裂处理方法和装置
CN108847982B (zh) 一种分布式存储集群及其节点故障切换方法和装置
US9348706B2 (en) Maintaining a cluster of virtual machines
CN102355369B (zh) 虚拟化集群***及其处理方法和设备
WO2017177941A1 (zh) 主备数据库切换方法和装置
KR20110044858A (ko) 데이터 센터들에 걸쳐 데이터 서버들내 데이터 무결정의 유지
CN103036719A (zh) 一种基于主备集群服务器的跨地区服务容灾方法及装置
CN110971662A (zh) 一种基于Ceph的两节点高可用实现方法及装置
CN114138732A (zh) 一种数据处理方法及装置
CN114116912A (zh) 一种基于Keepalived实现数据库高可用的方法
CN108512753B (zh) 一种集群文件***中消息传输的方法及装置
CN102457400B (zh) 一种防止磁盘镜像资源发生脑裂的方法
CN112887367B (zh) 实现分布式集群高可用的方法、***及计算机可读介质
CN111342986B (zh) 分布式节点管理方法及装置、分布式***、存储介质
CN113377702B (zh) 两节点集群启动的方法及装置、电子设备和存储介质
CN102487332B (zh) 故障处理方法、装置和***
CN108509296B (zh) 一种处理设备故障的方法和***
CN105323271B (zh) 一种云计算***以及云计算***的处理方法和装置
CN111309515B (zh) 一种容灾控制方法、装置及***
CN105490847A (zh) 一种私有云存储***中节点故障实时检测及处理方法
CN114124803B (zh) 设备管理方法、装置、电子设备及存储介质
CN115904773A (zh) 一种内存故障信息收集方法、装置及存储介质
CN112491633B (zh) 一种多节点集群的故障恢复方法、***及相关组件
CN116668269A (zh) 一种用于双活数据中心的仲裁方法、装置及***
CN114301763A (zh) 分布式集群故障的处理方法及***、电子设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20120328