CN101136728A - 群集***和用于备份群集***中的副本的方法 - Google Patents
群集***和用于备份群集***中的副本的方法 Download PDFInfo
- Publication number
- CN101136728A CN101136728A CNA2007101465542A CN200710146554A CN101136728A CN 101136728 A CN101136728 A CN 101136728A CN A2007101465542 A CNA2007101465542 A CN A2007101465542A CN 200710146554 A CN200710146554 A CN 200710146554A CN 101136728 A CN101136728 A CN 101136728A
- Authority
- CN
- China
- Prior art keywords
- copy
- less important
- backup
- backup copies
- main
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2041—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with more than one idle spare processing component
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1479—Generic software techniques for error detection or fault masking
- G06F11/1482—Generic software techniques for error detection or fault masking by means of middleware or OS functionality
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2023—Failover techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2097—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements maintaining the standby controller/processing unit updated
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Hardware Redundancy (AREA)
Abstract
一种用于备份群集***中的副本的方法、***和程序产品,所述群集***具有至少一个客户机、至少一个节点、以及每个都复制运行在该群集***上的过程的主要副本、次要副本和次要备份(S备份)副本。将所述主要、次要和S备份副本的每个分配层次。所述副本中的一个的故障被检测到,以及出现故障的副本被以较低层次的一个副本代替。具有最低受影响层次的副本被再生,以便重建所述主要副本、次要副本和S备份副本。
Description
技术领域
本发明涉及群集化计算机***的部件的复制,并且特别涉及用于备份群集化计算机***的部件的次要(secondary)副本的备份复制。
背景技术
群集化***中的主要固有问题在于其对于故障的潜在脆弱性。当所述群集中的单一节点崩溃时,整个***的可用性可能被危害。用于增加***可靠性的冗余通常通过部件的复制引入到所述***中。复制分布式***中的服务或过程要求所述服务的每个副本保持一致状态。该一致性由特定复制协议来确保。存在用于组织过程副本的不同方式,并且一般区分为活跃(active)、非活跃(passive)和半活跃(semi-active)复制。
在还被称为状态机方案的所述活跃复制技术中,每个副本处理接收自客户机的请求并发送应答。所述副本独立地运转,以及该技术在于确保所有副本按相同顺序接收所述请求。该技术在崩溃的情况下具有低响应时间。然而,因为所有副本并行处理所有请求,所以引发大量的运行时开销,由此使得其是对于商业应用的高可用性解决方案的不切实际的选择。
通过还被称为主要(primary)备份的所述非活跃复制技术,被称为主要副本的所述副本中的一个接收来自客户机的请求并返回响应。所述备份仅与主要副本交互,并且从该主要副本接收状态更新消息。如果该主要副本出故障,则所述备份中的一个进行接管。与活跃复制不同,其要求比活跃复制更少的处理能力,并且不对处理请求的确定性作任何假设。然而,在故障情况下存在显著增长的响应时间,这使得其不适于高时效性应用的环境。
所述半活跃复制技术避开了高时效性应用环境中活跃复制的所述非确定性问题。该技术是基于活跃复制,并且扩展以领导者(leader)和追随者(follower)的概念。尽管请求的实际处理由所有副本实施,但实施所述处理的非确定性部分和通知追随者是领导者的职责。该技术接近活跃复制,其不同在于非确定性处理是可能的。然而,在主要副本故障的情况下会引发大量的恢复时间开销。
在2001年2月13日发布的Ronstrom等人的美国专利6,189,017B1,METHOD TO BE USED WITH A DISTRIBUTED DATA BASE,AND ASYSTEM ADAPTED TO WORK ACCORDING TO THE METHOD,公开了一种方法,所述方法用于确保具有几个计算机构成节点的***分布式数据库的可靠性。所述数据库的一部分包括主要副本和次要副本。所述次要副本用于万一第一节点崩溃则重建所述主要副本。
在2004年10月5日发布的Unice的美国专利6,802,024B2,DETERMINISTIC PREEMPTION POINTS IN OPERATING SYSTEMEXECUTION,公开了用于利用支持循环计数器功能的单一或多个处理器提供容错解决方案的方法和装置。所述装置包括主要***和次要***。只要第一中断已发生并且该第一中断由所述次要***导致,则输出设备仅从所述次要***提供***输出。
在2003年8月21日出版的Fukuhara等人的美国专利申请出版物2003/0159083 A1,SYSTEM,METHOD AND APPARATUSFOR DATAPROCESSING AND STORAGE TO PROVIDE CONTINUOUSOPERATIONS INDEPENDENT OF DEVICE FAILURE ORDISASTER,公开了一种用于在具有至少两个应用服务器的用户计算设备提供用户应用的连续运转的***、方法和装置。如果所述应用服务器的一个出现故障或变为不可用,则用户请求可以在没有任何延迟的情况下在至少另一应用服务器被连续处理。
在2005年9月22日出版的Shutt等人的美国专利申请出版物2005/0210082 A1,SYSTEMS AND METHODS FOR THEREPARTITIONING OF DATA,公开了扩展服务器联盟,并且通过将第二服务器上的第一备份数据结构移动到新的服务器、在该新服务器上创建第二数据结构、和在该第二服务器上创建该第二数据的第二备份数据结构来均衡所述联盟服务器的数据负载。
在2005年12月1日出版的Hufferd等人的美国专利申请出版物2005.0268145 A1,METHODS,APPARATUS AND COMPUTERPROGRAMS FOR RECOVERY FROM FAILURES IN A COMPUTINGENVIRONMENT,公开了用于从影响数据处理环境中的服务器的故障中恢复的方法、装置和计算机程序,其中在所述数据处理环境中,一组服务器控制客户机对一组资源实例的访问。故障之后,客户机连接到之前标识的次要服务器以访问同一资源实例。
在Computing Survey,Vol.16,No.1(1984年3月)中Kim的HighlyAvailable Systemsfor Database Applications提供了对用于以可用性为主要目的而设计的数据库应用***中的体系结构和可用性技术的调查和分析。
在IEEE/ACM Transactions of Networking,Vol.11,No.1(2003年2月)中Gummadi等人的An Efficient Primary-Segmented backup schemefor Dependable Real-Time Communication in Multihop Networks公开了一种分段化的备份方案。
发明内容
本发明的主要目的是一种称为“次要备份复制”的复制方案,该复制方案不对处理请求的确定性作任何假设,同时减少运行时和恢复时间开销,因此其适合于使命攸关和高时效性应用的高可用性和容错管理。例如可从纽约Armonk的国际商业机器公司得到的HACMP和可从加利福尼亚Cupertino的Symantic公司得到的Veritas Cluster Server的现有的高可用性群集解决方案可以受益于所述方案以支持例如电信环境的高时效性环境。
本发明的另一目的是一种称为“次要备份”复制的用于群集化计算机***的新的复制技术。在该技术中,群集中的过程或计算机节点被复制到三个副本或克隆的一组中。所述三个过程副本以经典的“主要”和“次要”角色(role)外加由该技术引入的称为“次要备份”或“S备份”的新角色参与所述次要备份协议。所述S备份是充当对次要副本的热备份的所述过程组中的过程或***副本中的一个。所述主要和次要副本参与半活跃复制协议,而类似于非活跃复制关系存在于所述次要和S备份之间。
本发明的另一目的是第三副本的引入和所述次要副本与该第三副本之间的低开销协议。同样,这里所采用的半活跃复制方案中总是涉及仅一个“追随者”。
这里在主要和次要副本之间采用的所述半活跃复制方案确保了低运行时开销和即时故障转移能力,而所述次要备份关系使能了群集***中的快速恢复或故障修复。对于具有这样复制的过程或***的群集,连续可用性可以被保证,同时在故障情况下响应和恢复时间被大大减小,这使其成为用于使命攸关和高时效性应用的改进环境。
对应于上面总结的方法的***和计算机程序产品在这里也被描述和要求保护。
通过本发明的技术实现了另外的特征和优点。本发明的其它实施例和方面在这里被详细描述,并且认为是所要求保护的发明的一部分。为更好理解本发明的优点和特征,请参考本说明书和附图。
附图说明
被认作本发明的主题在本说明书的结论处的权利要求中被特别指出和明确要求保护。从下面结合附图的详细描述中,本发明的前述和其它目的、特征和优点是显而易见的,在附图中:
图1示出了本发明的群集化计算机***的一个示例;
图2示出了图1的群集化计算机***的节点、客户机和通信信道,其中,该***具有主要副本、次要副本和S备份副本;
图3是在其中图2的主要副本的故障被检测到的过程的流程图;
图4是在其中图2的当前次要副本的故障被检测到的过程的流程图;以及
图5是在其中图2的S备份副本的故障被检测到的过程的流程图。
详细说明借助于参考附图的示例阐明了本发明的优选实施例以及优点和特征。
具体实施方式
图1示出了具有一个或更多客户机12a-12n、通信***13和14、节点16a-16n、磁盘总线18以及一个或更多共享磁盘20a-20n的群集化计算机***10的一个示例。应当理解,所述***10只是示例,以及,可用于本发明的其它群集取决于处理器的数量、所使用的网络和磁盘技术的选择等可以显得非常不同。应当理解,客户机12是这样的处理器,该处理器可以通过例如13处所示的公共LAN或14处所示的专用LAN的局域网访问节点16。每个客户机12运行询问运行在群集节点16上的服务器应用的“前端”或客户机应用。还应当理解,在图1的***中,每个节点16具有到一个或更多共享外部磁盘设备20的访问。每个磁盘设备20可以物理连接到多个节点。所述共享磁盘20存储典型为数据冗余而配置的使命攸关数据。节点16构成群集***10的核心。节点16是运行所述高可用性和容错管理软件和应用软件的处理器。
一种用于管理高可用性分布式***中的处理副本组的新的复制管理技术(次要备份复制)被公开。在所述次要备份过程中,一个副本充当次要副本的备份,而不是像通常的主要备份方案(其中所述次要副本备份所述主要副本)情况下充当主要副本的备份。图2示出了一种集成复制方案,该方案包括参与协同复制协议的具有指定角色(主要副本22、次要副本23和S备份副本24)的三个副本。所述主要副本22和次要副本23都处理请求,但主要副本22独自或次要副本23独自向客户机12发回应答。群集软件26或所述方案的任意其它开发者可以先验地设置是主要副本22还是次要副本23向客户机发回响应。所述情形还可以被动态设置,以均衡主要副本22和次要副本23之间的负载。应当理解,所述次要副本23和S备份副本24可以被保存在与主要副本22相同的节点16,或者可以如27处所示的那样被保存在***10中所希望的任何地方。周期性地,所述次要副本23将其状态与其备份副本S备份副本24同步。可选地,所述S备份副本24可以被设置为查询次要副本23的状态改变。
图2示出了包括客户机12以及三个副本22、23和24的一种群集化次要备份复制方案。每个副本可以认为是运行在单一计算机***上的单一过程或容器或者LPAR镜像。副本还可以代表例如AIX或Linux的单一操作***镜像。所有三个副本22、23和24还可以被看作运行在单一计算机***上的三个独立的过程。所述主要副本22和次要副本23都处理所有客户机请求,但仅主要副本22负责处理所有非确定性的操作。次要副本23因而被强制作出与由主要副本22所作的相同的判断。次要副本23周期性地更新S备份副本24的状态,其包括向S备份副本24设置指示其状态改变的检验点,由此最小化S备份副本24对所述群集的运行时开销的影响。
通常,组中的副本的故障改变该组的组成,其引发视图改变。在图2的***中,该***中的副本的故障或丢失取决于发生故障的副本已假设的角色而被不同地处理。因为S备份副本24不参与所述组之外的任意交互,所以其故障是与该副本组织完全透明的。图3是在其中主要副本22的故障被检测到的过程的流程图。在30处,所述主要副本的故障被检测到。在31处,一旦检测到主要副本22的故障,则次要副本23即时进行并继续计算,其承担了主要副本22的角色。在32处,次要副本23做的第一件事是重放其已从发生故障的主要副本22接收到的任意未决事件,以便将其自己更新为从主要副本22的最后已知状态开始。在33处,次要副本23在处理所有未决事件之后继续执行并将其自己与S备份副本24同步。在34处,S备份副本24因而被提升为作为次要副本24的新的次要角色。
图4是在其中当前次要副本23的故障被检测到的过程的流程图。如果当前次要副本23发生故障,则该故障在40被检测到。在41处,S备份副本24提升其自己以承担次要角色。当额外资源出现时,在42处,次要副本22通过开启将承担S备份副本24的角色的新副本而启动所述组的重新配置,以便恢复初始的复制等级。
图5是在其中S备份副本24的故障被检测到的过程的流程图。S备份副本24的故障不影响所述群集的状态,因为其不涉及请求和响应的处理。在50处,S备份副本24的故障被检测到。在51处,次要副本22如果可能则克隆其自己以创建新的S备份24。
本发明的功能可以用软件、固件、硬件或其某种组合来实现。
作为一个示例,本发明的一个或更多方面可以被包括在具有例如计算机可用媒介的制品(例如一个或更多计算机程序产品)中。所述媒介已在其中包含了例如用于提供和便利本发明的功能的计算机可读程序代码装置。所述制品可以作为计算机***的一部分被包括,或被独立地出售。
另外,有形地包含用于实施本发明的功能的至少一个机器可执行指令程序的至少一个机器可读程序存储设备可以被提供。
这里所示的流程图只是示例。在不脱离本发明的精神的情况下,可以存在对于这些图或其中描述的步骤(或操作)的许多变型。例如,所述步骤可以按不同的顺序被实施,或者步骤可以被添加、删除或修改。所有这些变型被认为是所要求保护的发明的一部分。
尽管本发明的优选实施例已被描述,但本领域的技术人员应当理解,现在和将来都可以作出落在权利要求的范围内的各种改进和增强。这些权利要求应当被理解为维持对首先描述的发明的正当保护。
Claims (10)
1.一种用于备份群集***中的副本的方法,所述群集***具有至少一个客户机、至少一个节点、以及每个都复制运行在所述群集***上的过程的主要副本、次要副本和次要备份(S备份)副本,所述方法包括:
将所述主要、次要和S备份副本的每个分配层次;
检测所述副本中的一个的故障;
用较低层次的一个副本代替出现故障的副本;以及
再生具有最低受影响层次的副本,由此重建所述主要副本、次要副本和S备份副本。
2.根据权利要求1所述的方法,其中,所述出现故障的副本是所述主要副本,以及所述方法进一步包括:
用所述次要副本接管所述过程的运行;
用所述次要副本重放未决事件,使得所述次要副本变成新的主要副本;
将所述次要副本与所述S备份副本同步;以及
将所述S备份副本提升为新的次要副本。
3.根据权利要求1所述的方法,其中,所述出现故障的副本是所述次要副本,以及所述方法进一步包括:
将所述S备份副本提升为新的次要副本;以及
重新配置和开启新的S备份副本。
4.根据权利要求1所述的方法,其中,所述出现故障的副本是所述S备份副本,以及所述方法进一步包括:
用所述次要副本自己的拷贝来克隆所述次要副本以构成新的S备份副本。
5.根据权利要求1所述的方法,其中,由所述副本复制的过程是例如AIX或Linux操作***的单一操作***镜像。
6.一种群集***,其包括:
至少一个客户机;
连接到所述客户机的至少一个节点;
运行从所述客户机接收请求并向所述客户机发回响应的过程的主要副本;
从所述客户机接收请求并复制所述主要副本的次要副本;以及
被与所述次要副本同步的次要备份(S备份)副本;
所述主要、次要和S备份副本的每个被分配层次;
检测所述副本中的一个的故障的检测功能;
用较低层次的一个副本代替出现故障的副本的代替功能;以及
再生具有最低受影响层次的副本由此重建所述主要副本、次要副本和S备份副本的再生功能。
7.根据权利要求6所述的***,其中,所述出现故障的副本是所述主要副本,以及其中
所述代替功能用所述次要副本接管所述过程的运行,并且用所述次要副本重放未决事件,使得所述次要副本变成新的主要副本;以及
所述再生功能将所述次要副本与所述S备份副本同步,并且将所述S备份副本提升为新的次要副本。
8.根据权利要求6所述的***,其中,所述出现故障的副本是所述次要副本,以及其中
所述代替功能将所述S备份副本提升为新的次要副本;以及
所述再生功能重新配置和开启新的S备份副本。
9.根据权利要求6所述的***,其中,所述出现故障的副本是所述S备份副本,以及其中
所述代替功能用所述次要副本自己的拷贝克隆所述次要副本;以及
所述再生功能使所述克隆的拷贝成为新的S备份副本。
10.根据权利要求6所述的***,其中,由所述副本复制的过程是例如AIX或Linux操作***的单一操作***镜像。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/467,645 | 2006-08-28 | ||
US11/467,645 US20080052327A1 (en) | 2006-08-28 | 2006-08-28 | Secondary Backup Replication Technique for Clusters |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101136728A true CN101136728A (zh) | 2008-03-05 |
Family
ID=39160587
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2007101465542A Pending CN101136728A (zh) | 2006-08-28 | 2007-08-20 | 群集***和用于备份群集***中的副本的方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20080052327A1 (zh) |
JP (1) | JP2008059583A (zh) |
CN (1) | CN101136728A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101692227B (zh) * | 2009-09-25 | 2011-08-10 | 中国人民解放军国防科学技术大学 | 大规模高可靠的归档存储***构建方法 |
CN102508742A (zh) * | 2011-11-03 | 2012-06-20 | 中国人民解放军国防科学技术大学 | 面向硬件不可恢复内存故障的内核代码软容错方法 |
Families Citing this family (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7685179B2 (en) * | 2007-03-13 | 2010-03-23 | Microsoft Corporation | Network flow for constrained replica placement |
US9355117B1 (en) * | 2008-03-31 | 2016-05-31 | Veritas Us Ip Holdings Llc | Techniques for backing up replicated data |
US20090276654A1 (en) * | 2008-05-02 | 2009-11-05 | International Business Machines Corporation | Systems and methods for implementing fault tolerant data processing services |
JP5557840B2 (ja) * | 2008-10-03 | 2014-07-23 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | 分散データベースの監視メカニズム |
JP5425448B2 (ja) * | 2008-11-27 | 2014-02-26 | インターナショナル・ビジネス・マシーンズ・コーポレーション | データベース・システム、サーバ、更新方法およびプログラム |
US8140791B1 (en) * | 2009-02-24 | 2012-03-20 | Symantec Corporation | Techniques for backing up distributed data |
US8713060B2 (en) | 2009-03-31 | 2014-04-29 | Amazon Technologies, Inc. | Control service for relational data management |
US9705888B2 (en) | 2009-03-31 | 2017-07-11 | Amazon Technologies, Inc. | Managing security groups for data instances |
US9207984B2 (en) | 2009-03-31 | 2015-12-08 | Amazon Technologies, Inc. | Monitoring and automatic scaling of data volumes |
US8682954B2 (en) * | 2009-07-15 | 2014-03-25 | International Business Machines Corporation | Replication in a network environment |
US9135283B2 (en) | 2009-10-07 | 2015-09-15 | Amazon Technologies, Inc. | Self-service configuration for data environment |
US8074107B2 (en) | 2009-10-26 | 2011-12-06 | Amazon Technologies, Inc. | Failover and recovery for replicated data instances |
US8743680B2 (en) * | 2011-08-12 | 2014-06-03 | International Business Machines Corporation | Hierarchical network failure handling in a clustered node environment |
WO2013136339A1 (en) | 2012-03-15 | 2013-09-19 | Hewlett-Packard Development Company, L.P. | Regulating replication operation |
WO2013137878A1 (en) * | 2012-03-15 | 2013-09-19 | Hewlett-Packard Development Company, L.P. | Accessing and replicating backup data objects |
GB2508659A (en) * | 2012-12-10 | 2014-06-11 | Ibm | Backing up an in-memory database |
CN105324765B (zh) | 2013-05-16 | 2019-11-08 | 慧与发展有限责任合伙企业 | 选择用于去重复数据的存储区 |
WO2014185918A1 (en) | 2013-05-16 | 2014-11-20 | Hewlett-Packard Development Company, L.P. | Selecting a store for deduplicated data |
US9304815B1 (en) | 2013-06-13 | 2016-04-05 | Amazon Technologies, Inc. | Dynamic replica failure detection and healing |
CN103793296A (zh) * | 2014-01-07 | 2014-05-14 | 浪潮电子信息产业股份有限公司 | 一种在集群中用于辅助备份复制计算机***的方法 |
US9280432B2 (en) | 2014-03-21 | 2016-03-08 | Netapp, Inc. | Providing data integrity in a non-reliable storage behavior |
US9606873B2 (en) | 2014-05-13 | 2017-03-28 | International Business Machines Corporation | Apparatus, system and method for temporary copy policy |
US10387262B1 (en) * | 2014-06-27 | 2019-08-20 | EMC IP Holding Company LLC | Federated restore of single instance databases and availability group database replicas |
CN104239182B (zh) * | 2014-09-03 | 2017-05-03 | 北京鲸鲨软件科技有限公司 | 一种集群文件***脑裂处理方法和装置 |
US10872074B2 (en) | 2016-09-30 | 2020-12-22 | Microsoft Technology Licensing, Llc | Distributed availability groups of databases for data centers |
US10732867B1 (en) * | 2017-07-21 | 2020-08-04 | EMC IP Holding Company LLC | Best practice system and method |
US11416347B2 (en) | 2020-03-09 | 2022-08-16 | Hewlett Packard Enterprise Development Lp | Making a backup copy of data before rebuilding data on a node |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5212784A (en) * | 1990-10-22 | 1993-05-18 | Delphi Data, A Division Of Sparks Industries, Inc. | Automated concurrent data backup system |
US5799323A (en) * | 1995-01-24 | 1998-08-25 | Tandem Computers, Inc. | Remote duplicate databased facility with triple contingency protection |
US5721914A (en) * | 1995-09-14 | 1998-02-24 | Mci Corporation | System and method for hierarchical data distribution |
US6052718A (en) * | 1997-01-07 | 2000-04-18 | Sightpath, Inc | Replica routing |
SE9702015L (sv) * | 1997-05-28 | 1998-11-29 | Ericsson Telefon Ab L M | Metod vid distribuerad databas, samt ett system anpassat att verka enligt metoden |
US6167427A (en) * | 1997-11-28 | 2000-12-26 | Lucent Technologies Inc. | Replication service system and method for directing the replication of information servers based on selected plurality of servers load |
US6430622B1 (en) * | 1999-09-22 | 2002-08-06 | International Business Machines Corporation | Methods, systems and computer program products for automated movement of IP addresses within a cluster |
US6760861B2 (en) * | 2000-09-29 | 2004-07-06 | Zeronines Technology, Inc. | System, method and apparatus for data processing and storage to provide continuous operations independent of device failure or disaster |
US6850982B1 (en) * | 2000-12-19 | 2005-02-01 | Cisco Technology, Inc. | Methods and apparatus for directing a flow of data between a client and multiple servers |
US7039692B2 (en) * | 2001-03-01 | 2006-05-02 | International Business Machines Corporation | Method and apparatus for maintaining profiles for terminals in a configurable data processing system |
US6802024B2 (en) * | 2001-12-13 | 2004-10-05 | Intel Corporation | Deterministic preemption points in operating system execution |
US6973654B1 (en) * | 2003-05-27 | 2005-12-06 | Microsoft Corporation | Systems and methods for the repartitioning of data |
US7523341B2 (en) * | 2004-05-13 | 2009-04-21 | International Business Machines Corporation | Methods, apparatus and computer programs for recovery from failures in a computing environment |
-
2006
- 2006-08-28 US US11/467,645 patent/US20080052327A1/en not_active Abandoned
-
2007
- 2007-08-20 CN CNA2007101465542A patent/CN101136728A/zh active Pending
- 2007-08-24 JP JP2007217739A patent/JP2008059583A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101692227B (zh) * | 2009-09-25 | 2011-08-10 | 中国人民解放军国防科学技术大学 | 大规模高可靠的归档存储***构建方法 |
CN102508742A (zh) * | 2011-11-03 | 2012-06-20 | 中国人民解放军国防科学技术大学 | 面向硬件不可恢复内存故障的内核代码软容错方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2008059583A (ja) | 2008-03-13 |
US20080052327A1 (en) | 2008-02-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101136728A (zh) | 群集***和用于备份群集***中的副本的方法 | |
US11360854B2 (en) | Storage cluster configuration change method, storage cluster, and computer system | |
US10817478B2 (en) | System and method for supporting persistent store versioning and integrity in a distributed data grid | |
US8595546B2 (en) | Split brain resistant failover in high availability clusters | |
KR100326982B1 (ko) | 높은 크기 조정 가능성을 갖는 고 가용성 클러스터 시스템 및 그 관리 방법 | |
US8856091B2 (en) | Method and apparatus for sequencing transactions globally in distributed database cluster | |
US20070061379A1 (en) | Method and apparatus for sequencing transactions globally in a distributed database cluster | |
EP0481231A2 (en) | A method and system for increasing the operational availability of a system of computer programs operating in a distributed system of computers | |
US20100023564A1 (en) | Synchronous replication for fault tolerance | |
US20080288812A1 (en) | Cluster system and an error recovery method thereof | |
US9396076B2 (en) | Centralized version control system having high availability | |
CN110557413A (zh) | 一种业务服务***及提供业务服务的方法 | |
CN106325768B (zh) | 一种双机存储***及方法 | |
CA2241861C (en) | A scheme to perform event rollup | |
CA2619778C (en) | Method and apparatus for sequencing transactions globally in a distributed database cluster with collision monitoring | |
JP2008276281A (ja) | データ同期システム、方法、及び、プログラム | |
US20120246423A1 (en) | Method and System for Data Replication | |
US9747166B2 (en) | Self healing cluster of a content management system | |
CN116684261A (zh) | 集群架构的控制方法及装置、存储介质及电子设备 | |
Garcia-Munoz et al. | Recovery Protocols for Replicated Databases--A Survey |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Open date: 20080305 |