CN101231604A - 用于集群服务器数据的卷级恢复的设备、***及方法 - Google Patents

用于集群服务器数据的卷级恢复的设备、***及方法 Download PDF

Info

Publication number
CN101231604A
CN101231604A CNA200810002924XA CN200810002924A CN101231604A CN 101231604 A CN101231604 A CN 101231604A CN A200810002924X A CNA200810002924X A CN A200810002924XA CN 200810002924 A CN200810002924 A CN 200810002924A CN 101231604 A CN101231604 A CN 101231604A
Authority
CN
China
Prior art keywords
cluster
dish
source book
volume
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA200810002924XA
Other languages
English (en)
Other versions
CN101231604B (zh
Inventor
德尔伯特·B.·忽布勒
尼它·加里梅尔拉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN101231604A publication Critical patent/CN101231604A/zh
Application granted granted Critical
Publication of CN101231604B publication Critical patent/CN101231604B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1456Hardware arrangements for backup
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1469Backup restoration techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1464Management of the backup or restore process for networked environments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/84Using snapshots, i.e. a logical point-in-time copy of the data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Retry When Errors Occur (AREA)

Abstract

公开了用来在卷级下恢复集群服务器数据的设备、***及方法。设置模块打开用于卷级恢复的集群服务器的至少一个源卷,刷新用于所述至少一个源卷的每个缓冲区,关闭所述至少一个源卷,禁用用于集群盘的文件***校验,保存集群盘的盘标记,及禁用用于集群盘的装置级校验。拷贝模块把具有卷级恢复的数据从至少一个快照卷拷贝到所述至少一个源卷。复位模块把保存的盘标记重写到集群盘,重新启动用于集群盘的装置级校验,及复位关于所述至少一个源卷的至少一个卷属性。

Description

用于集群服务器数据的卷级恢复的设备、***及方法
技术领域
本发明涉及恢复数据,并且更具体地说,涉及在卷级(volume-level)恢复集群服务器数据。
背景技术
数据处理***对于关键数据处理任务可以采用集群服务器数据。两个或多个服务器可以配置为集群服务器。每个集群服务器可以监视其它集群服务器。如果第一集群服务器挂起或不能完成一项或多项任务,则第二集群服务器可以辨别问题并且恢复用于第一集群服务器的处理功能。
集群服务器常常采用一个或多个集群盘(cluster disk)。集群盘可以存储用于每一个集群服务器的数据。集群盘的存储容量可以在一个或多个逻辑卷中划分。集群盘逻辑卷这里称作源卷。
源卷和集群盘可以采用多个数据锁和其它安全保护,以保证由第一集群服务器使用的数据不由第二集群服务器改写。结果,多个集群服务器可以共享源卷和集群盘。
因为集群服务器典型地完成关键任务,所以在源卷上存储的数据的快照常常备份到一个或多个快照卷。多个快照实例可以存储在快照卷上。
有时,集群服务器可能要求来自快照实例的数据恢复到源卷。不幸地,因为必须恢复大量离散文件和大量数据,从快照实例恢复数据可能是冗长的过程。而因为由集群服务器所完成的任务的关键性质,冗长的恢复过程可能是不可接受的。
发明内容
由以上讨论,需要在卷级下恢复集群服务器数据的设备、***及方法。有益地,这样一种设备、***及方法允许集群服务器数据被快速恢复,使服务中断期最小。
响应于现有技术的状态,并且尤其是响应由当前可用的数据恢复方法尚未完全解决的现有技术问题和需要,已经开发了本发明。相应地,开发本发明以提供用来恢复集群服务器数据的设备、***及方法,该设备、***及方法克服在现有技术中的以上讨论的缺点的多个或全部。
在卷级下恢复集群服务器数据的设备设有多个模块,其配置为功能性地执行如下步骤:打开源卷、刷新每个缓冲区、关闭源卷、禁用文件***校验、保存盘标记、禁用装置级校验、拷贝数据、重写盘标记、重新启动装置级校验及复位卷属性。在描述实施例中的这些模块包括设置模块、拷贝模块及复位模块。
在一个实施例中,设置模块准备用于恢复的应用程序,并且引导应用程序以使集群服务器的源卷的数据集静默。设置模块打开用于卷级恢复的源卷。另外,设置模块刷新源卷的每个缓冲区,并且关闭源卷。设置模块还禁用与源卷相关的集群盘的文件***校验,保存集群盘的盘标记,及禁用用于集群盘的装置级校验。
拷贝模块把具有卷级恢复的数据从快照卷拷贝到源卷。复位模块把保存的盘标记重写到集群盘。另外,复位模块重新启动用于集群盘的装置级校验,并且复位至少一个源卷的至少一个卷属性。
在一个实施例中,复位模块卸载源卷,加载源卷,及重新启动用于集群盘的文件***校验。另外,复位模块可以引导应用程序运行恢复操作。设备允许数据被快速恢复到源卷,使在源卷上所需数据不可用的时间最小。
为恢复集群服务器数据也提出了本发明的一种***。***可以在集群服务器中实施。具体地说,在一个实施例中,***包括多个集群服务器、集群盘、快照盘及计算机。
多个集群服务器可以在集群环境中执行任务。集群盘包括存储用于集群服务器的数据的至少一个源卷。快照盘包括至少一个卷,其存储至少一个源卷的备份实例。
计算机可以是多个集群服务器中的一个集群服务器。计算机包括设置模块、拷贝模块及复位模块。设置模块打开用于卷级恢复的集群服务器的至少一个源卷,刷新用于所述至少一个源卷的每个缓冲区,关闭所述至少一个源卷,禁用用于集群盘的文件***校验,保存集群盘的盘标记,及禁用用于集群盘的装置级校验。
拷贝模块把具有卷级恢复的数据从至少一个快照卷拷贝到至少一个源卷。复位模块把保存的盘标记重写到集群盘,重新启动用于集群盘的装置级校验,及复位关于至少一个源卷的至少一个卷属性。***把数据从至少一个快照卷恢复到至少一个源卷。
为恢复集群服务器数据也提出了本发明的一种方法。在公开实施例中的方法大体包括执行以上关于描述设备和***的操作呈现的功能的步骤。在一个实施例中,方法包括打开源卷、刷新每个缓冲区、关闭源卷、禁用文件***校验、保存盘标记、禁用装置级校验、拷贝数据、重写盘标记、重新启动装置级校验及复位卷属性。
设置模块打开用于卷级恢复的集群服务器的至少一个源卷,刷新用于至少一个源卷的每个缓冲区,关闭至少一个源卷,禁用集群盘的文件***校验,保存集群盘的盘标记,及禁用集群盘的装置级校验。拷贝模块把具有卷级恢复的数据从至少一个快照卷拷贝到至少一个源卷。复位模块把保存的盘标记重写到集群盘,重新启动用于集群盘的装置级校验,及复位关于至少一个源卷的至少一个卷属性。所述方法迅速把数据从至少一个快照卷拷贝到至少一个源卷。
贯穿本说明书对于特征、优点或类似语言的指代并不意味着借助于本发明可以实现的所有特征和优点在本发明的任何单个实施例中。相反,涉及特征和优点的语言被理解成是指联系实施例描述的特定特征、优点或特性包括在本发明的至少一个实施例中。因而,贯穿本说明书的特征和优点及类似语言的讨论可以(但不必)参考同一实施例。
本发明的实施例恢复集群服务器数据。另外,本发明可以减小恢复数据需要的时间,缩短数据对于集群服务器不可用的时间。此外,本发明的描述特征、优点及特性可以以任何适当方式或在一个或多个实施例中组合。本领域的技术人员将认识到,本发明可以实践而没有具体实施例的特定特征或优点的一个或多个。在其它实例中,在本发明所有实施例中不能呈现的一定实施例中可以识别另外的特征和优点。
本发明的这些特征和优点由如下描述和附属权利要求书将变得更充分地明白,或者可以通过下文所叙述的本发明的实践得知。
附图说明
为了迅速理解本发明的优点,通过参考在附图中表明的特定实施例将呈现以上简短描述的本发明的更具体描述。要理解,这些附图只描绘本发明的典型实施例,并因此不要认为限制其范围,关于另外的特定性和细节通过附图的使用将描述和解释本发明,在附图中:
图1是示意方块图,表明按照本发明的集群服务器***的实施例;
图2是示意方块图,表明本发明的集群服务器设备的实施例;
图3和4是示意流程图,表明本发明的数据恢复方法的实施例;
图5是示意方块图,表明本发明的保存盘标记的实施例;
图6是示意方块图,表明本发明的恢复数据的实施例;及
图7是示意方块图,表明本发明的重写盘标记的实施例。
具体实施方式
在本说明书中描述的功能单元的多个已经标记为模块,以便更具体地强调它们的实施独立性。例如,模块可以作为硬件电路实施,该硬件电路包括定制VLSI电路或门阵列、诸如逻辑芯片、导体、晶体管之类的离架半或其它离散元件。模块也可以在诸如现场可编程门阵列、可编程阵列逻辑、可编程逻辑装置等之类的可编程硬件装置中实施。
模块也可以以软件实施,以便由各种类型的处理器执行。可执行代码的标识模块比如包括计算机指令的一个或多个物理或逻辑块,这些指令可以比如组织成对象、过程或功能。不过,标识模块的可执行部分不必实际上布置在一起,而是可以包括在不同位置中存储的不同指令,这些指令当逻辑上联接在一起时组成模块,并且实现用于模块的所述目的。
实际尚,可执行代码的模块可以是单条指令或多条指令,并且甚至可以分布在几个不同代码段上、在不同程序中及跨过几个存储器装置。类似地,操作数据这里可以在模块内标识和说明,并且可以以任何适当形式实施,并且在任何适当类型的数据结构中组织。操作数据可以集合成单个数据组,或者可以分布在包括不同存储装置的不同位置上。
贯穿本说明书对于“一个实施例”、“实施例”或类似语言的参考是指,联系实施例描述的具体特征、结构或特性被包括在本发明的至少一个实施例中。因而,贯穿本说明书的短语“在一个实施例中”、“在实施例中”及类似语言可以(但不必)都参考同一实施例。
此外,本发明的描述特征、结构或特性可以在一个或多个实施例中以任何适当方式组合。在如下描述中,提供多种特定细节,如编程、软件模块、用户选择、网络事务、数据库查询、数据库结构、硬件模块、硬件电路、硬件芯片等等的例子,以提供本发明实施例的彻底理解。然而,本领域的技术人员将认识到,本发明可以不借助于特定细节的一个或多个,或借助于其它方法、元件、材料、等等的一个或多个实践。在其它实例中,没有详细表示或描述熟知的结构、材料或操作,以避免使本发明的方面模糊。
图1是示意方块图,表明按照本发明的集群服务器***100的一个实施例。集群服务器***100包括一个或多个主机110、集群连接115、一个或多个集群服务器120、集群盘125及快照盘130。集群盘125和快照盘130代表配置为逻辑单元部件(LUNS)的一个或多个硬盘驱动器。本领域的技术人员将认识到,集群盘125和快照盘130也可以配置为一个或多个光学存储装置、全息存储装置、半导体存储装置等。尽管为了简单,表示了两个集群服务器120和一个集群连接115,但可以采用任何数量的集群服务器120和集群连接115。
在一个实施例中,集群服务器120执行MICROSOFT集群服务器。操作***可以包括Volume Shadow Copy Service应用程序接口,如对于本领域的技术人员熟知的那样。
集群服务器120可以提供用于主机110的计算服务。例如,集群服务器120可以执行包括应用程序、数据管理程序等的任务。集群服务器120紧密地一起工作。
主机110可以是计算机工作站、服务器、主计算机等。主机110可以通过集群连接115与集群服务器120通信。集群连接115可以是路由器、服务器等。集群服务器120也可以通过私有集群连接135通信。
集群服务器120可以提供高适用性计算服务。因而如果第一集群服务器120a不适用,则可以使用第二集群服务器120b代替第一集群服务器120a。集群服务器120也可以一起工作,以平衡在集群服务器120中的数据处理任务。因而如果第一集群服务器120a正在处理太多任务,则某些任务可以转移到第二集群服务器120b。集群服务器120可以彼此监视,从而如果第一集群服务器120a失效,则第二集群服务器120b可以恢复第一集群服务器120a的计算任务。
集群服务器120每个可以把数据存储到集群盘125,以有利于在集群服务器120中任务的共享。集群盘125可以识别为一个或多个源卷。集群服务器***100可以采用锁和其它逻辑限制,以防止第一集群服务器120a改写第二集群服务器120b的数据。
因为集群服务器***100典型地处理重要任务,所以集群盘125的数据可以备份到快照盘130。快照盘130也可以组织为一个或多个快照卷。如果一个或多个源卷的数据曾丢失和/或污染,则数据的备份实例可以从快照卷恢复。
在一个实施例中,集群盘125和/或快照盘130被组织成存储区域网络(SAN)。可选择地,集群盘125和快照盘130可以在单个SAN内组织。
不幸地,把大量数据和大量文件从快照盘130拷贝到集群盘125可能要求过多时间间隔。结果,集群服务器***100可能不能提供计算服务,或者以降低的水平提供计算服务。本发明高效地把数据从快照卷恢复到源卷。
图2是示意方块图,表明本发明的集群服务器设备200的一个实施例。集群服务器设备200可以实施为在图1的集群服务器120上执行的一个或多个计算机程序产品。设备200的描述引用图1的元件,类似附图标记指类似元件。
在一个实施例中,设置模块205准备用于恢复的应用程序。应用程序在集群服务器120上执行。设置模块205还引导应用程序,以使集群服务器120的源卷的数据集静默。源卷可以驻留在集群盘125上。
设置模块205打开源卷。另外,设置模块205刷新源卷的每个缓冲区,并且关闭源卷。缓冲区可以临时存储被写到源卷和/或从源卷读取的数据。设置模块205还禁用与源卷相关的集群盘125的文件***校验。另外,设置模块205保存集群盘125的盘标记,并且禁用集群盘125的装置级校验,如下文将描述的那样。
拷贝模块210把具有卷级恢复的数据从快照卷拷贝到源卷。复位模块215把保存的盘标记重写到集群盘125。另外,复位模块215重新启动用于集群盘125的装置级校验,并且复位关于至少一个源卷的至少一个卷属性。
在一个实施例中,复位模块215卸载源卷,加载源卷,及重新启动用于集群盘125的文件***校验。另外,复位模块可以引导应用程序运行恢复操作。集群服务器设备200允许数据被恢复到源卷。
随后的示意流程图一般叙述为逻辑流程图。这样,描绘顺序和标记步骤指示本方法的一个实施例。可以设想功能、逻辑或效果与所说明方法的一个或多个步骤或其部分等效的其它步骤和方法。另外,所采用的格式和符号被提供以解释本方法的逻辑步骤,并且理解成不限制方法的范围。尽管在流程图中可以采用各种箭头类型和线类型,但它们被理解成不限制对应方法的范围。实际上,某些箭头或其它连接可以用来仅指示方法的逻辑流程。比如,箭头可以指示所描绘方法的罗列步骤之间的未规定持续时间的等待或监视时段。另外,其中具体方法发生顺序可以严格遵守所显示的对应步骤的顺序,或者不遵守所显示的对应步骤的顺序。
图3和4是示意流程图,表明本发明的数据恢复方法300的一个实施例。数据恢复方法300大体包括完成相对于图1和2的描述设备和***的操作以上呈现功能的步骤。在一个实施例中,方法借助于计算机程序产品实现,该计算机程序产品包括具有计算机可读程序的计算机可读介质。诸如集群服务器120之类的计算机可以执行计算机可读程序。
数据恢复方法300开始,并且在一个实施例中,拷贝模块210把数据从至少一个源卷备份302到至少一个快照卷。在某一实施例中,有用于每个源卷的对应快照卷。拷贝模块210根据策略可以规则地备份302数据。例如,拷贝模块210可以每小时备份302数据。
设置模块205可以准备305用于恢复的应用程序。应用程序可以是数据库应用程序、网页服务应用程序等。在一个实施例中,应用程序是MICROSOFTExchange Server。
设置模块205还引导310应用程序,以使集群服务器120的至少一个源卷的数据集静默。另外,设置模块205可以卸载由应用程序使用的并且驻留在源卷上的数据集。
设置模块205打开315至少一个源卷。比如,源卷可以配置成从至少一个快照卷接收数据,其中来自快照卷的数据可以改写所述至少一个源卷的当前数据。
设置模块205刷新320至少一个源卷的每个缓冲区。缓冲区可以配置成半导体存储器、硬盘驱动器的保留部分等。至少一个源卷的打开315可以启动缓冲区的刷新320。另外,设置模块205关闭322至少一个源卷。
设置模块205还禁用325与源卷相关的集群盘125的文件***校验。文件***校验可以确定集群盘125是否正在起作用。在一个实施例中,设置模块205通过以正常集群维护模式放置集群盘125而禁用文件***校验325,从而不能使用诸如“看着存在(looks alive)”、“存在(is alive)”等的功能。设置模块205还保存330集群盘125的盘标记,如下文将描述的那样。
现在转到图4,设置模块205禁用335用于集群盘125的装置级校验。在一个实施例中,设置模块205通过以扩展维护模式放置集群盘125而禁用装置级校验335。由于集群盘125在扩展维护模式中,集群服务器120可能不能写入到集群盘125。
拷贝模块210把具有卷级恢复的数据从至少一个快照卷拷贝340到至少一个源卷。在一个实施例中,拷贝模块210借助于快照卷的数据改写每个源卷。拷贝模块210使用一种或多种方法可以快速拷贝340数据,如对于本领域的技术人员已知的那样。另外,在诸如国际商用机器公司(IBM)SAM卷控制器、IBM DS6000-系列及IBM DS8000-系列之类的某些实施例中,在数据拷贝完成之前就可使用源卷。
复位模块215把保存的盘标记重写345到集群盘125,如下文将描述的那样。另外,复位模块215可以重新启动350用于集群盘125的装置级校验。在一个实施例中,复位模块215通过把集群盘125从扩展维护模式解除而重新启动350装置级校验。
复位模块215还复位355关于至少一个源卷的至少一个卷属性。在一个实施例中,复位355至少一个卷属性使至少一个源卷可写入。复位模块215卸载360所述至少一个源卷。另外,复位模块215加载365所述至少一个源卷。卸载360和加载365至少一个源卷可以启动集群服务器120以写入到源卷。
复位模块215重新启动370用于集群盘125的文件***校验。在一个实施例中,复位模块215把集群盘125从正常集群维护模式中解除以重新启动370文件***校验。另外,复位模块215可以引导375应用程序运行恢复操作。例如,复位模块215可以引导375MICROSOFTExchange Server以加载应用程序数据库。
数据恢复方法300恢复集群服务器数据。通过准备源卷用来接收卷级恢复,数据恢复方法300改进数据的恢复。
图5是示意方块图,表明本发明的保存盘标记500的一个实施例。保存盘标记500的描绘表明图3的步骤330。另外,保存盘标记500的描述参照图1-3的元件,类似附图标记指类似元件。
集群盘125包括盘标记505。盘标记505辨别集群盘125。集群盘125的每个存储装置可以具有盘标记505。设置模块205把盘标记505保存330到存储器模块510上。存储器模块510可以是驻留在集群服务器120中的动态随机存取存储器(DRAM)。
借助于存储330到存储器模块510上的盘标记505,拷贝模块210可以把数据从快照盘130迅速拷贝340到集群盘125。尽管盘标记505在拷贝340操作期间可以改写,但盘标记505仍然可用于对于集群盘125的恢复,如下文将描述的那样。
图6是示意方块图,表明本发明的恢复数据600的一个实施例。显示图5的存储器模块510。图5的集群盘125也显示为用来自快照盘130的数据改写,这里称作具有恢复数据的集群盘605。恢复数据600的描述参考图1-5的元件,类似附图标记指类似元件。
具有恢复数据的集群盘605包括由集群服务器120需要的数据。然而,集群服务器120可以不访问数据,因为具有恢复数据的集群盘605具有快照盘130的盘标记。
图7是示意方块图,表明本发明的重写盘标记700的一个实施例。图6的存储器模块510和具有恢复数据的集群盘605。重写盘标记700的描述参考图1-6的元件,类似附图标记指类似元件。
复位模块215把保存盘标记505重写345到具有恢复数据的集群盘605。借助于盘标记505,具有恢复数据的集群盘605可由集群服务器120访问,完成集群服务器数据的恢复。
本发明高效地恢复集群服务器120的数据。
本发明可以以其它特定形式实施,而不脱离其精神或基本特性。描述实施例在所有方面仅当作说明性的而不是限制性的。本发明的范围因此由附属权利要求书而不是由以上描述指示。权利要求书的等效物的意义和范围内的所有变更要包容在权利要求书的范围内。

Claims (20)

1.一种在卷级恢复集群服务器数据的设备,该设备包括:
设置模块,配置成打开用于卷级恢复的集群服务器的至少一个源卷、刷新用于所述至少一个源卷的每个缓冲区、关闭所述至少一个源卷、禁用用于与至少一个源卷相关的集群盘的文件***校验、保存所述集群盘的盘标记,以及禁用用于集群盘的装置级校验;
拷贝模块,配置成把具有卷级恢复的数据从至少一个快照卷拷贝到所述至少一个源卷;及
复位模块,配置成把所述保存的盘标记重写到所述集群盘、重新启动用于集群盘的装置级校验、并且复位关于所述至少一个源卷的至少一个卷属性。
2.根据权利要求1所述的设备,所述设置模块还配置成准备用于恢复的应用程序。
3.根据权利要求2所述的设备,所述复位模块还配置成引导所述应用程序运行恢复操作。
4.根据权利要求3所述的设备,所述应用程序配置成MICROSOFTExchange Server。
5.根据权利要求1所述的设备,所述设置模块还配置成引导所述应用程序以使所述至少一个源卷的数据集静默。
6.根据权利要求1所述的设备,所述复位模块还配置成:
卸载所述至少一个源卷;
加载所述至少一个源卷;及
重新启动用于所述集群盘的文件***校验。
7.一种在卷级恢复集群服务器数据的方法,包括:
打开用于卷级恢复的集群服务器的至少一个源卷;
刷新用于所述至少一个源卷的每个缓冲区;
关闭所述至少一个源卷;
禁用与所述至少一个源卷相关的集群盘的文件***校验;
保存所述集群盘的盘标记;
禁用用于所述集群盘的装置级校验;
把具有卷级恢复的数据从至少一个快照卷拷贝到所述至少一个源卷;
把所述保存的盘标记重写到所述集群盘;
重新启动用于所述集群盘的装置级校验;及
复位关于所述至少一个源卷的至少一个卷属性。
8.根据权利要求7所述的方法,还包括准备用于恢复的应用程序的步骤。
9.根据权利要求8所述的方法,还包括引导所述应用程序以使所述至少一个源卷的数据集静默的步骤。
10.根据权利要求8所述的方法,还包括步骤:
卸载所述至少一个源卷;
加载所述至少一个源卷;及
重新启动用于所述集群盘的文件***校验。
11.根据权利要求10所述的方法,还包括引导所述应用程序运行恢复操作的步骤。
12.根据权利要求7所述的方法,还包括使用Volume ShadowCopy Service应用程序接口把所述数据备份到所述至少一个快照卷的步骤。
13.一种在卷级恢复集群服务器数据的***,该***包括:
多个集群服务器;
集群盘,包括配置成存储用于所述多个集群服务器的至少一个源卷;
快照盘,包括至少一个快照卷,其配置成存储所述至少一个源卷的备份实例;
计算机,包括:
设置模块,配置成打开用于卷级恢复的所述至少一个源卷、刷新用于所述至少一个源卷的每个缓冲区、关闭所述至少一个源卷、禁用用于所述集群盘的文件***校验、保存所述集群盘的盘标记、及禁用用于集群盘的装置级校验;
拷贝模块,配置成把具有卷级恢复的数据从所述至少一个快照卷拷贝到所述至少一个源卷;及
复位模块,配置成把所述保存的盘标记重写到所述集群盘、重新启动用于所述集群盘的装置级校验,并且复位关于所述至少一个源卷的至少一个卷属性。
14.根据权利要求13所述的***,所述计算机配置成所述多个集群服务器中的一个集群服务器。
15.根据权利要求13所述的***,所述设置模块还配置成准备用于恢复的应用程序。
16.根据权利要求13所述的***,所述复位模块还配置成引导所述应用程序运行恢复操作。
17.根据权利要求13所述的***,所述设置模块还配置成引导所述应用程序以使所述至少一个源卷的数据集静默。
18.根据权利要求13所述的***,所述复位模块还配置成:
卸载所述至少一个源卷;
加载所述至少一个源卷;及
重新启动用于所述集群盘的文件***校验。
19.一种用来部署计算机基础结构的方法,包括把计算机可读代码集成到计算***中,其中与计算***组合的所述代码能够进行如下:
准备用于恢复的应用程序;
引导所述应用程序以使至少一个源卷的数据集静默;
打开用于卷级恢复的集群服务器的所述至少一个源卷;
刷新用于所述至少一个源卷的每个缓冲区;
关闭所述至少一个源卷;
禁用与所述至少一个源卷相关的集群盘的文件***校验;
保存所述集群盘的盘标记;
禁用用于所述集群盘的装置级校验;
把具有卷级恢复的数据从至少一个快照卷拷贝到所述至少一个源卷;
把所述保存的盘标记重写到所述集群盘;
重新启动用于所述集群盘的装置级校验;及
复位关于所述至少一个源卷的至少一个卷属性;
卸载所述至少一个源卷;
加载所述至少一个源卷;
重新启动用于所述集群盘的文件***校验;及
引导所述应用程序运行恢复操作。
20.根据权利要求19所述的方法,其中该方法包括使用VolumeShadow Copy Service应用程序接口把所述数据备份到所述至少一个快照卷。
CN200810002924XA 2007-01-22 2008-01-11 用于集群服务器数据的卷级恢复的设备、***及方法 Expired - Fee Related CN101231604B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/625,428 2007-01-22
US11/625,428 US7992036B2 (en) 2007-01-22 2007-01-22 Apparatus, system, and method for volume-level restoration of cluster server data

Publications (2)

Publication Number Publication Date
CN101231604A true CN101231604A (zh) 2008-07-30
CN101231604B CN101231604B (zh) 2012-10-03

Family

ID=39642303

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200810002924XA Expired - Fee Related CN101231604B (zh) 2007-01-22 2008-01-11 用于集群服务器数据的卷级恢复的设备、***及方法

Country Status (2)

Country Link
US (2) US7992036B2 (zh)
CN (1) CN101231604B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102750195A (zh) * 2012-06-07 2012-10-24 浪潮电子信息产业股份有限公司 一种集群文件***数据容错的方法
CN103136073A (zh) * 2011-12-21 2013-06-05 微软公司 共享卷的应用一致的快照
CN104239444A (zh) * 2014-09-01 2014-12-24 上海爱数软件有限公司 Oracle数据库用的一致性数据保护与捕获一致性状态的方法

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8028136B2 (en) 2007-03-09 2011-09-27 International Business Machines Corporation Retaining disk identification in operating system environment after a hardware-driven snapshot restore from a snapshot-LUN created using software-driven snapshot architecture
US8239721B2 (en) 2008-04-25 2012-08-07 Interdigital Patent Holdings, Inc. HARQ process utilization in multiple carrier wireless communications
US8204863B2 (en) * 2009-12-21 2012-06-19 International Business Machines Corporation Multi-phase file system restore with selective on-demand data availability
US8639665B2 (en) 2012-04-04 2014-01-28 International Business Machines Corporation Hybrid backup and restore of very large file system using metadata image backup and traditional backup
US8914334B2 (en) 2012-09-12 2014-12-16 International Business Machines Corporation Using a metadata image of a file system and archive instance to restore data objects in the file system
US8805789B2 (en) 2012-09-12 2014-08-12 International Business Machines Corporation Using a metadata image of a file system and archive instance to backup data objects in the file system
US9354979B2 (en) 2014-02-07 2016-05-31 International Business Machines Corporation Server based disaster recovery by making use of dual write responses
CN111124754A (zh) * 2019-11-30 2020-05-08 浪潮电子信息产业股份有限公司 一种数据恢复方法、装置、设备及介质

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08263226A (ja) * 1995-03-23 1996-10-11 Toshiba Corp 情報記憶装置
US6216211B1 (en) * 1997-06-13 2001-04-10 International Business Machines Corporation Method and apparatus for accessing mirrored logical volumes
US6047294A (en) 1998-03-31 2000-04-04 Emc Corp Logical restore from a physical backup in a computer storage system
US6490598B1 (en) 1999-12-20 2002-12-03 Emc Corporation System and method for external backup and restore for a computer data storage system
JP2001184249A (ja) * 1999-12-27 2001-07-06 Fujitsu Ltd 分散処理システム,共有ファイルシステム操作装置,及び、コンピュータ可読媒体
US6718446B1 (en) * 2000-02-11 2004-04-06 Iomega Corporation Storage media with benchmark representative of data originally stored thereon
US6990606B2 (en) * 2000-07-28 2006-01-24 International Business Machines Corporation Cascading failover of a data management application for shared disk file systems in loosely coupled node clusters
US6799258B1 (en) * 2001-01-10 2004-09-28 Datacore Software Corporation Methods and apparatus for point-in-time volumes
US6915397B2 (en) * 2001-06-01 2005-07-05 Hewlett-Packard Development Company, L.P. System and method for generating point in time storage copy
JP2003316522A (ja) * 2002-04-26 2003-11-07 Hitachi Ltd 計算機システムおよび計算機システムの制御方法
US7844577B2 (en) * 2002-07-15 2010-11-30 Symantec Corporation System and method for maintaining a backup storage system for a computer system
US6865655B1 (en) * 2002-07-30 2005-03-08 Sun Microsystems, Inc. Methods and apparatus for backing up and restoring data portions stored in client computer systems
JP4292882B2 (ja) * 2003-03-18 2009-07-08 株式会社日立製作所 複数のスナップショット維持方法及びサーバ装置及びストレージ装置
US7165145B2 (en) * 2003-07-02 2007-01-16 Falconstor Software, Inc. System and method to protect data stored in a storage system
US7181646B2 (en) * 2003-09-16 2007-02-20 Hitachi, Ltd. Mapping apparatus for backup and restoration of multi-generation recovered snapshots
US7412583B2 (en) * 2003-11-14 2008-08-12 International Business Machines Corporation Virtual incremental storage method
JP4703959B2 (ja) * 2003-12-03 2011-06-15 株式会社日立製作所 記憶装置システムおよびそのレプリケーション作成方法
US7461100B2 (en) 2004-05-27 2008-12-02 International Business Machines Corporation Method for fast reverse restore
US7360030B1 (en) * 2004-06-01 2008-04-15 Sanbolic, Inc. Methods and apparatus facilitating volume management
US7313650B2 (en) * 2004-08-30 2007-12-25 Hitachi, Ltd. Server and method for managing volume storing digital archive
US7398354B2 (en) 2005-01-21 2008-07-08 International Business Machines Corporation Achieving data consistency with point-in-time copy operations in a parallel I/O environment
US20060242380A1 (en) * 2005-04-20 2006-10-26 Anuja Korgaonkar Virtually unlimited storage
US7672979B1 (en) * 2005-04-22 2010-03-02 Symantec Operating Corporation Backup and restore techniques using inconsistent state indicators
WO2007067918A2 (en) * 2005-12-06 2007-06-14 Computer Associates Think, Inc. System and method for automatically restoring hard drives on failure
JP2008009485A (ja) * 2006-06-27 2008-01-17 Fujitsu Ltd 仮想ストレージ制御装置及び仮想ストレージ制御プログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103136073A (zh) * 2011-12-21 2013-06-05 微软公司 共享卷的应用一致的快照
CN103136073B (zh) * 2011-12-21 2015-11-25 微软技术许可有限责任公司 共享卷的应用一致的快照
CN102750195A (zh) * 2012-06-07 2012-10-24 浪潮电子信息产业股份有限公司 一种集群文件***数据容错的方法
CN104239444A (zh) * 2014-09-01 2014-12-24 上海爱数软件有限公司 Oracle数据库用的一致性数据保护与捕获一致性状态的方法
CN104239444B (zh) * 2014-09-01 2017-11-03 上海爱数信息技术股份有限公司 Oracle数据库用的一致性数据保护与捕获一致性状态的方法

Also Published As

Publication number Publication date
CN101231604B (zh) 2012-10-03
US8386847B2 (en) 2013-02-26
US20110202507A1 (en) 2011-08-18
US7992036B2 (en) 2011-08-02
US20080177801A1 (en) 2008-07-24

Similar Documents

Publication Publication Date Title
CN101231604B (zh) 用于集群服务器数据的卷级恢复的设备、***及方法
EP0566966B1 (en) Method and system for incremental backup copying of data
US7055010B2 (en) Snapshot facility allowing preservation of chronological views on block drives
US7987158B2 (en) Method, system and article of manufacture for metadata replication and restoration
US7386695B2 (en) Storage system with multiple copy targeting
US20080140963A1 (en) Methods and systems for storage system generation and use of differential block lists using copy-on-write snapshots
US20070043975A1 (en) Methods and apparatus for recovering from fatal errors in a system
CN100359479C (zh) 存储服务与***
CN102150124A (zh) 信息备份/恢复处理装置、以及信息备份/恢复处理***
CN105612503A (zh) 持久性数据结构
JPH0715664B2 (ja) データ・セツト回復方法
CN109086425B (zh) 用于数据库的数据处理方法和装置
CN101344863A (zh) 备份***和方法
CN101566959A (zh) 利用卷快照防止在失败的恢复操作中的文件损坏
CN105144113A (zh) 从快照恢复应用
WO2007141375A1 (en) Method and arrangement for processing transactions in a flash type memory device
US20200142791A1 (en) Method for the implementation of a high performance, high resiliency and high availability dual controller storage system
CN106776147A (zh) 一种差异数据备份方法和差异数据备份装置
CN105320576A (zh) 数据库备份装置与方法
US7165160B2 (en) Computing system with memory mirroring and snapshot reliability
US9075809B1 (en) Methods and systems for application cluster virtual nodes
CN103309696B (zh) 一种Java卡扩展库更新方法、装置和Java卡
US9367457B1 (en) Systems and methods for enabling write-back caching and replication at different abstraction layers
EP3769225B1 (en) Free space pass-through
CN101916234A (zh) 一种存储设备的信息维护方法及***

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20121003

CF01 Termination of patent right due to non-payment of annual fee