CN101136728A - 群集***和用于备份群集***中的副本的方法 - Google Patents

群集***和用于备份群集***中的副本的方法 Download PDF

Info

Publication number
CN101136728A
CN101136728A CNA2007101465542A CN200710146554A CN101136728A CN 101136728 A CN101136728 A CN 101136728A CN A2007101465542 A CNA2007101465542 A CN A2007101465542A CN 200710146554 A CN200710146554 A CN 200710146554A CN 101136728 A CN101136728 A CN 101136728A
Authority
CN
China
Prior art keywords
copy
less important
backup
backup copies
main
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2007101465542A
Other languages
English (en)
Inventor
P·A·布阿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN101136728A publication Critical patent/CN101136728A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2041Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with more than one idle spare processing component
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1479Generic software techniques for error detection or fault masking
    • G06F11/1482Generic software techniques for error detection or fault masking by means of middleware or OS functionality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2097Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements maintaining the standby controller/processing unit updated

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Hardware Redundancy (AREA)

Abstract

一种用于备份群集***中的副本的方法、***和程序产品,所述群集***具有至少一个客户机、至少一个节点、以及每个都复制运行在该群集***上的过程的主要副本、次要副本和次要备份(S备份)副本。将所述主要、次要和S备份副本的每个分配层次。所述副本中的一个的故障被检测到,以及出现故障的副本被以较低层次的一个副本代替。具有最低受影响层次的副本被再生,以便重建所述主要副本、次要副本和S备份副本。

Description

群集***和用于备份群集***中的副本的方法
技术领域
本发明涉及群集化计算机***的部件的复制,并且特别涉及用于备份群集化计算机***的部件的次要(secondary)副本的备份复制。
背景技术
群集化***中的主要固有问题在于其对于故障的潜在脆弱性。当所述群集中的单一节点崩溃时,整个***的可用性可能被危害。用于增加***可靠性的冗余通常通过部件的复制引入到所述***中。复制分布式***中的服务或过程要求所述服务的每个副本保持一致状态。该一致性由特定复制协议来确保。存在用于组织过程副本的不同方式,并且一般区分为活跃(active)、非活跃(passive)和半活跃(semi-active)复制。
在还被称为状态机方案的所述活跃复制技术中,每个副本处理接收自客户机的请求并发送应答。所述副本独立地运转,以及该技术在于确保所有副本按相同顺序接收所述请求。该技术在崩溃的情况下具有低响应时间。然而,因为所有副本并行处理所有请求,所以引发大量的运行时开销,由此使得其是对于商业应用的高可用性解决方案的不切实际的选择。
通过还被称为主要(primary)备份的所述非活跃复制技术,被称为主要副本的所述副本中的一个接收来自客户机的请求并返回响应。所述备份仅与主要副本交互,并且从该主要副本接收状态更新消息。如果该主要副本出故障,则所述备份中的一个进行接管。与活跃复制不同,其要求比活跃复制更少的处理能力,并且不对处理请求的确定性作任何假设。然而,在故障情况下存在显著增长的响应时间,这使得其不适于高时效性应用的环境。
所述半活跃复制技术避开了高时效性应用环境中活跃复制的所述非确定性问题。该技术是基于活跃复制,并且扩展以领导者(leader)和追随者(follower)的概念。尽管请求的实际处理由所有副本实施,但实施所述处理的非确定性部分和通知追随者是领导者的职责。该技术接近活跃复制,其不同在于非确定性处理是可能的。然而,在主要副本故障的情况下会引发大量的恢复时间开销。
在2001年2月13日发布的Ronstrom等人的美国专利6,189,017B1,METHOD TO BE USED WITH A DISTRIBUTED DATA BASE,AND ASYSTEM ADAPTED TO WORK ACCORDING TO THE METHOD,公开了一种方法,所述方法用于确保具有几个计算机构成节点的***分布式数据库的可靠性。所述数据库的一部分包括主要副本和次要副本。所述次要副本用于万一第一节点崩溃则重建所述主要副本。
在2004年10月5日发布的Unice的美国专利6,802,024B2,DETERMINISTIC PREEMPTION POINTS IN OPERATING SYSTEMEXECUTION,公开了用于利用支持循环计数器功能的单一或多个处理器提供容错解决方案的方法和装置。所述装置包括主要***和次要***。只要第一中断已发生并且该第一中断由所述次要***导致,则输出设备仅从所述次要***提供***输出。
在2003年8月21日出版的Fukuhara等人的美国专利申请出版物2003/0159083 A1,SYSTEM,METHOD AND APPARATUSFOR DATAPROCESSING AND STORAGE TO PROVIDE CONTINUOUSOPERATIONS INDEPENDENT OF DEVICE FAILURE ORDISASTER,公开了一种用于在具有至少两个应用服务器的用户计算设备提供用户应用的连续运转的***、方法和装置。如果所述应用服务器的一个出现故障或变为不可用,则用户请求可以在没有任何延迟的情况下在至少另一应用服务器被连续处理。
在2005年9月22日出版的Shutt等人的美国专利申请出版物2005/0210082 A1,SYSTEMS AND METHODS FOR THEREPARTITIONING OF DATA,公开了扩展服务器联盟,并且通过将第二服务器上的第一备份数据结构移动到新的服务器、在该新服务器上创建第二数据结构、和在该第二服务器上创建该第二数据的第二备份数据结构来均衡所述联盟服务器的数据负载。
在2005年12月1日出版的Hufferd等人的美国专利申请出版物2005.0268145 A1,METHODS,APPARATUS AND COMPUTERPROGRAMS FOR RECOVERY FROM FAILURES IN A COMPUTINGENVIRONMENT,公开了用于从影响数据处理环境中的服务器的故障中恢复的方法、装置和计算机程序,其中在所述数据处理环境中,一组服务器控制客户机对一组资源实例的访问。故障之后,客户机连接到之前标识的次要服务器以访问同一资源实例。
在Computing Survey,Vol.16,No.1(1984年3月)中Kim的HighlyAvailable Systemsfor Database Applications提供了对用于以可用性为主要目的而设计的数据库应用***中的体系结构和可用性技术的调查和分析。
在IEEE/ACM Transactions of Networking,Vol.11,No.1(2003年2月)中Gummadi等人的An Efficient Primary-Segmented backup schemefor Dependable Real-Time Communication in Multihop Networks公开了一种分段化的备份方案。
发明内容
本发明的主要目的是一种称为“次要备份复制”的复制方案,该复制方案不对处理请求的确定性作任何假设,同时减少运行时和恢复时间开销,因此其适合于使命攸关和高时效性应用的高可用性和容错管理。例如可从纽约Armonk的国际商业机器公司得到的HACMP和可从加利福尼亚Cupertino的Symantic公司得到的Veritas Cluster Server的现有的高可用性群集解决方案可以受益于所述方案以支持例如电信环境的高时效性环境。
本发明的另一目的是一种称为“次要备份”复制的用于群集化计算机***的新的复制技术。在该技术中,群集中的过程或计算机节点被复制到三个副本或克隆的一组中。所述三个过程副本以经典的“主要”和“次要”角色(role)外加由该技术引入的称为“次要备份”或“S备份”的新角色参与所述次要备份协议。所述S备份是充当对次要副本的热备份的所述过程组中的过程或***副本中的一个。所述主要和次要副本参与半活跃复制协议,而类似于非活跃复制关系存在于所述次要和S备份之间。
本发明的另一目的是第三副本的引入和所述次要副本与该第三副本之间的低开销协议。同样,这里所采用的半活跃复制方案中总是涉及仅一个“追随者”。
这里在主要和次要副本之间采用的所述半活跃复制方案确保了低运行时开销和即时故障转移能力,而所述次要备份关系使能了群集***中的快速恢复或故障修复。对于具有这样复制的过程或***的群集,连续可用性可以被保证,同时在故障情况下响应和恢复时间被大大减小,这使其成为用于使命攸关和高时效性应用的改进环境。
对应于上面总结的方法的***和计算机程序产品在这里也被描述和要求保护。
通过本发明的技术实现了另外的特征和优点。本发明的其它实施例和方面在这里被详细描述,并且认为是所要求保护的发明的一部分。为更好理解本发明的优点和特征,请参考本说明书和附图。
附图说明
被认作本发明的主题在本说明书的结论处的权利要求中被特别指出和明确要求保护。从下面结合附图的详细描述中,本发明的前述和其它目的、特征和优点是显而易见的,在附图中:
图1示出了本发明的群集化计算机***的一个示例;
图2示出了图1的群集化计算机***的节点、客户机和通信信道,其中,该***具有主要副本、次要副本和S备份副本;
图3是在其中图2的主要副本的故障被检测到的过程的流程图;
图4是在其中图2的当前次要副本的故障被检测到的过程的流程图;以及
图5是在其中图2的S备份副本的故障被检测到的过程的流程图。
详细说明借助于参考附图的示例阐明了本发明的优选实施例以及优点和特征。
具体实施方式
图1示出了具有一个或更多客户机12a-12n、通信***13和14、节点16a-16n、磁盘总线18以及一个或更多共享磁盘20a-20n的群集化计算机***10的一个示例。应当理解,所述***10只是示例,以及,可用于本发明的其它群集取决于处理器的数量、所使用的网络和磁盘技术的选择等可以显得非常不同。应当理解,客户机12是这样的处理器,该处理器可以通过例如13处所示的公共LAN或14处所示的专用LAN的局域网访问节点16。每个客户机12运行询问运行在群集节点16上的服务器应用的“前端”或客户机应用。还应当理解,在图1的***中,每个节点16具有到一个或更多共享外部磁盘设备20的访问。每个磁盘设备20可以物理连接到多个节点。所述共享磁盘20存储典型为数据冗余而配置的使命攸关数据。节点16构成群集***10的核心。节点16是运行所述高可用性和容错管理软件和应用软件的处理器。
一种用于管理高可用性分布式***中的处理副本组的新的复制管理技术(次要备份复制)被公开。在所述次要备份过程中,一个副本充当次要副本的备份,而不是像通常的主要备份方案(其中所述次要副本备份所述主要副本)情况下充当主要副本的备份。图2示出了一种集成复制方案,该方案包括参与协同复制协议的具有指定角色(主要副本22、次要副本23和S备份副本24)的三个副本。所述主要副本22和次要副本23都处理请求,但主要副本22独自或次要副本23独自向客户机12发回应答。群集软件26或所述方案的任意其它开发者可以先验地设置是主要副本22还是次要副本23向客户机发回响应。所述情形还可以被动态设置,以均衡主要副本22和次要副本23之间的负载。应当理解,所述次要副本23和S备份副本24可以被保存在与主要副本22相同的节点16,或者可以如27处所示的那样被保存在***10中所希望的任何地方。周期性地,所述次要副本23将其状态与其备份副本S备份副本24同步。可选地,所述S备份副本24可以被设置为查询次要副本23的状态改变。
图2示出了包括客户机12以及三个副本22、23和24的一种群集化次要备份复制方案。每个副本可以认为是运行在单一计算机***上的单一过程或容器或者LPAR镜像。副本还可以代表例如AIX或Linux的单一操作***镜像。所有三个副本22、23和24还可以被看作运行在单一计算机***上的三个独立的过程。所述主要副本22和次要副本23都处理所有客户机请求,但仅主要副本22负责处理所有非确定性的操作。次要副本23因而被强制作出与由主要副本22所作的相同的判断。次要副本23周期性地更新S备份副本24的状态,其包括向S备份副本24设置指示其状态改变的检验点,由此最小化S备份副本24对所述群集的运行时开销的影响。
通常,组中的副本的故障改变该组的组成,其引发视图改变。在图2的***中,该***中的副本的故障或丢失取决于发生故障的副本已假设的角色而被不同地处理。因为S备份副本24不参与所述组之外的任意交互,所以其故障是与该副本组织完全透明的。图3是在其中主要副本22的故障被检测到的过程的流程图。在30处,所述主要副本的故障被检测到。在31处,一旦检测到主要副本22的故障,则次要副本23即时进行并继续计算,其承担了主要副本22的角色。在32处,次要副本23做的第一件事是重放其已从发生故障的主要副本22接收到的任意未决事件,以便将其自己更新为从主要副本22的最后已知状态开始。在33处,次要副本23在处理所有未决事件之后继续执行并将其自己与S备份副本24同步。在34处,S备份副本24因而被提升为作为次要副本24的新的次要角色。
图4是在其中当前次要副本23的故障被检测到的过程的流程图。如果当前次要副本23发生故障,则该故障在40被检测到。在41处,S备份副本24提升其自己以承担次要角色。当额外资源出现时,在42处,次要副本22通过开启将承担S备份副本24的角色的新副本而启动所述组的重新配置,以便恢复初始的复制等级。
图5是在其中S备份副本24的故障被检测到的过程的流程图。S备份副本24的故障不影响所述群集的状态,因为其不涉及请求和响应的处理。在50处,S备份副本24的故障被检测到。在51处,次要副本22如果可能则克隆其自己以创建新的S备份24。
本发明的功能可以用软件、固件、硬件或其某种组合来实现。
作为一个示例,本发明的一个或更多方面可以被包括在具有例如计算机可用媒介的制品(例如一个或更多计算机程序产品)中。所述媒介已在其中包含了例如用于提供和便利本发明的功能的计算机可读程序代码装置。所述制品可以作为计算机***的一部分被包括,或被独立地出售。
另外,有形地包含用于实施本发明的功能的至少一个机器可执行指令程序的至少一个机器可读程序存储设备可以被提供。
这里所示的流程图只是示例。在不脱离本发明的精神的情况下,可以存在对于这些图或其中描述的步骤(或操作)的许多变型。例如,所述步骤可以按不同的顺序被实施,或者步骤可以被添加、删除或修改。所有这些变型被认为是所要求保护的发明的一部分。
尽管本发明的优选实施例已被描述,但本领域的技术人员应当理解,现在和将来都可以作出落在权利要求的范围内的各种改进和增强。这些权利要求应当被理解为维持对首先描述的发明的正当保护。

Claims (10)

1.一种用于备份群集***中的副本的方法,所述群集***具有至少一个客户机、至少一个节点、以及每个都复制运行在所述群集***上的过程的主要副本、次要副本和次要备份(S备份)副本,所述方法包括:
将所述主要、次要和S备份副本的每个分配层次;
检测所述副本中的一个的故障;
用较低层次的一个副本代替出现故障的副本;以及
再生具有最低受影响层次的副本,由此重建所述主要副本、次要副本和S备份副本。
2.根据权利要求1所述的方法,其中,所述出现故障的副本是所述主要副本,以及所述方法进一步包括:
用所述次要副本接管所述过程的运行;
用所述次要副本重放未决事件,使得所述次要副本变成新的主要副本;
将所述次要副本与所述S备份副本同步;以及
将所述S备份副本提升为新的次要副本。
3.根据权利要求1所述的方法,其中,所述出现故障的副本是所述次要副本,以及所述方法进一步包括:
将所述S备份副本提升为新的次要副本;以及
重新配置和开启新的S备份副本。
4.根据权利要求1所述的方法,其中,所述出现故障的副本是所述S备份副本,以及所述方法进一步包括:
用所述次要副本自己的拷贝来克隆所述次要副本以构成新的S备份副本。
5.根据权利要求1所述的方法,其中,由所述副本复制的过程是例如AIX或Linux操作***的单一操作***镜像。
6.一种群集***,其包括:
至少一个客户机;
连接到所述客户机的至少一个节点;
运行从所述客户机接收请求并向所述客户机发回响应的过程的主要副本;
从所述客户机接收请求并复制所述主要副本的次要副本;以及
被与所述次要副本同步的次要备份(S备份)副本;
所述主要、次要和S备份副本的每个被分配层次;
检测所述副本中的一个的故障的检测功能;
用较低层次的一个副本代替出现故障的副本的代替功能;以及
再生具有最低受影响层次的副本由此重建所述主要副本、次要副本和S备份副本的再生功能。
7.根据权利要求6所述的***,其中,所述出现故障的副本是所述主要副本,以及其中
所述代替功能用所述次要副本接管所述过程的运行,并且用所述次要副本重放未决事件,使得所述次要副本变成新的主要副本;以及
所述再生功能将所述次要副本与所述S备份副本同步,并且将所述S备份副本提升为新的次要副本。
8.根据权利要求6所述的***,其中,所述出现故障的副本是所述次要副本,以及其中
所述代替功能将所述S备份副本提升为新的次要副本;以及
所述再生功能重新配置和开启新的S备份副本。
9.根据权利要求6所述的***,其中,所述出现故障的副本是所述S备份副本,以及其中
所述代替功能用所述次要副本自己的拷贝克隆所述次要副本;以及
所述再生功能使所述克隆的拷贝成为新的S备份副本。
10.根据权利要求6所述的***,其中,由所述副本复制的过程是例如AIX或Linux操作***的单一操作***镜像。
CNA2007101465542A 2006-08-28 2007-08-20 群集***和用于备份群集***中的副本的方法 Pending CN101136728A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/467,645 2006-08-28
US11/467,645 US20080052327A1 (en) 2006-08-28 2006-08-28 Secondary Backup Replication Technique for Clusters

Publications (1)

Publication Number Publication Date
CN101136728A true CN101136728A (zh) 2008-03-05

Family

ID=39160587

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2007101465542A Pending CN101136728A (zh) 2006-08-28 2007-08-20 群集***和用于备份群集***中的副本的方法

Country Status (3)

Country Link
US (1) US20080052327A1 (zh)
JP (1) JP2008059583A (zh)
CN (1) CN101136728A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101692227B (zh) * 2009-09-25 2011-08-10 中国人民解放军国防科学技术大学 大规模高可靠的归档存储***构建方法
CN102508742A (zh) * 2011-11-03 2012-06-20 中国人民解放军国防科学技术大学 面向硬件不可恢复内存故障的内核代码软容错方法

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7685179B2 (en) * 2007-03-13 2010-03-23 Microsoft Corporation Network flow for constrained replica placement
US9355117B1 (en) * 2008-03-31 2016-05-31 Veritas Us Ip Holdings Llc Techniques for backing up replicated data
US20090276654A1 (en) * 2008-05-02 2009-11-05 International Business Machines Corporation Systems and methods for implementing fault tolerant data processing services
JP5557840B2 (ja) * 2008-10-03 2014-07-23 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 分散データベースの監視メカニズム
JP5425448B2 (ja) * 2008-11-27 2014-02-26 インターナショナル・ビジネス・マシーンズ・コーポレーション データベース・システム、サーバ、更新方法およびプログラム
US8140791B1 (en) * 2009-02-24 2012-03-20 Symantec Corporation Techniques for backing up distributed data
US8713060B2 (en) 2009-03-31 2014-04-29 Amazon Technologies, Inc. Control service for relational data management
US9705888B2 (en) 2009-03-31 2017-07-11 Amazon Technologies, Inc. Managing security groups for data instances
US9207984B2 (en) 2009-03-31 2015-12-08 Amazon Technologies, Inc. Monitoring and automatic scaling of data volumes
US8682954B2 (en) * 2009-07-15 2014-03-25 International Business Machines Corporation Replication in a network environment
US9135283B2 (en) 2009-10-07 2015-09-15 Amazon Technologies, Inc. Self-service configuration for data environment
US8074107B2 (en) 2009-10-26 2011-12-06 Amazon Technologies, Inc. Failover and recovery for replicated data instances
US8743680B2 (en) * 2011-08-12 2014-06-03 International Business Machines Corporation Hierarchical network failure handling in a clustered node environment
WO2013136339A1 (en) 2012-03-15 2013-09-19 Hewlett-Packard Development Company, L.P. Regulating replication operation
WO2013137878A1 (en) * 2012-03-15 2013-09-19 Hewlett-Packard Development Company, L.P. Accessing and replicating backup data objects
GB2508659A (en) * 2012-12-10 2014-06-11 Ibm Backing up an in-memory database
CN105324765B (zh) 2013-05-16 2019-11-08 慧与发展有限责任合伙企业 选择用于去重复数据的存储区
WO2014185918A1 (en) 2013-05-16 2014-11-20 Hewlett-Packard Development Company, L.P. Selecting a store for deduplicated data
US9304815B1 (en) 2013-06-13 2016-04-05 Amazon Technologies, Inc. Dynamic replica failure detection and healing
CN103793296A (zh) * 2014-01-07 2014-05-14 浪潮电子信息产业股份有限公司 一种在集群中用于辅助备份复制计算机***的方法
US9280432B2 (en) 2014-03-21 2016-03-08 Netapp, Inc. Providing data integrity in a non-reliable storage behavior
US9606873B2 (en) 2014-05-13 2017-03-28 International Business Machines Corporation Apparatus, system and method for temporary copy policy
US10387262B1 (en) * 2014-06-27 2019-08-20 EMC IP Holding Company LLC Federated restore of single instance databases and availability group database replicas
CN104239182B (zh) * 2014-09-03 2017-05-03 北京鲸鲨软件科技有限公司 一种集群文件***脑裂处理方法和装置
US10872074B2 (en) 2016-09-30 2020-12-22 Microsoft Technology Licensing, Llc Distributed availability groups of databases for data centers
US10732867B1 (en) * 2017-07-21 2020-08-04 EMC IP Holding Company LLC Best practice system and method
US11416347B2 (en) 2020-03-09 2022-08-16 Hewlett Packard Enterprise Development Lp Making a backup copy of data before rebuilding data on a node

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5212784A (en) * 1990-10-22 1993-05-18 Delphi Data, A Division Of Sparks Industries, Inc. Automated concurrent data backup system
US5799323A (en) * 1995-01-24 1998-08-25 Tandem Computers, Inc. Remote duplicate databased facility with triple contingency protection
US5721914A (en) * 1995-09-14 1998-02-24 Mci Corporation System and method for hierarchical data distribution
US6052718A (en) * 1997-01-07 2000-04-18 Sightpath, Inc Replica routing
SE9702015L (sv) * 1997-05-28 1998-11-29 Ericsson Telefon Ab L M Metod vid distribuerad databas, samt ett system anpassat att verka enligt metoden
US6167427A (en) * 1997-11-28 2000-12-26 Lucent Technologies Inc. Replication service system and method for directing the replication of information servers based on selected plurality of servers load
US6430622B1 (en) * 1999-09-22 2002-08-06 International Business Machines Corporation Methods, systems and computer program products for automated movement of IP addresses within a cluster
US6760861B2 (en) * 2000-09-29 2004-07-06 Zeronines Technology, Inc. System, method and apparatus for data processing and storage to provide continuous operations independent of device failure or disaster
US6850982B1 (en) * 2000-12-19 2005-02-01 Cisco Technology, Inc. Methods and apparatus for directing a flow of data between a client and multiple servers
US7039692B2 (en) * 2001-03-01 2006-05-02 International Business Machines Corporation Method and apparatus for maintaining profiles for terminals in a configurable data processing system
US6802024B2 (en) * 2001-12-13 2004-10-05 Intel Corporation Deterministic preemption points in operating system execution
US6973654B1 (en) * 2003-05-27 2005-12-06 Microsoft Corporation Systems and methods for the repartitioning of data
US7523341B2 (en) * 2004-05-13 2009-04-21 International Business Machines Corporation Methods, apparatus and computer programs for recovery from failures in a computing environment

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101692227B (zh) * 2009-09-25 2011-08-10 中国人民解放军国防科学技术大学 大规模高可靠的归档存储***构建方法
CN102508742A (zh) * 2011-11-03 2012-06-20 中国人民解放军国防科学技术大学 面向硬件不可恢复内存故障的内核代码软容错方法

Also Published As

Publication number Publication date
JP2008059583A (ja) 2008-03-13
US20080052327A1 (en) 2008-02-28

Similar Documents

Publication Publication Date Title
CN101136728A (zh) 群集***和用于备份群集***中的副本的方法
US11360854B2 (en) Storage cluster configuration change method, storage cluster, and computer system
US10817478B2 (en) System and method for supporting persistent store versioning and integrity in a distributed data grid
US8595546B2 (en) Split brain resistant failover in high availability clusters
KR100326982B1 (ko) 높은 크기 조정 가능성을 갖는 고 가용성 클러스터 시스템 및 그 관리 방법
US8856091B2 (en) Method and apparatus for sequencing transactions globally in distributed database cluster
US20070061379A1 (en) Method and apparatus for sequencing transactions globally in a distributed database cluster
EP0481231A2 (en) A method and system for increasing the operational availability of a system of computer programs operating in a distributed system of computers
US20100023564A1 (en) Synchronous replication for fault tolerance
US20080288812A1 (en) Cluster system and an error recovery method thereof
US9396076B2 (en) Centralized version control system having high availability
CN110557413A (zh) 一种业务服务***及提供业务服务的方法
CN106325768B (zh) 一种双机存储***及方法
CA2241861C (en) A scheme to perform event rollup
CA2619778C (en) Method and apparatus for sequencing transactions globally in a distributed database cluster with collision monitoring
JP2008276281A (ja) データ同期システム、方法、及び、プログラム
US20120246423A1 (en) Method and System for Data Replication
US9747166B2 (en) Self healing cluster of a content management system
CN116684261A (zh) 集群架构的控制方法及装置、存储介质及电子设备
Garcia-Munoz et al. Recovery Protocols for Replicated Databases--A Survey

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20080305