CN104094236A

CN104094236A - 防止数据丢失的***和方法

Info

Publication number: CN104094236A
Application number: CN201380008069.2A
Authority: CN
Inventors: 高雪东; R·吉希; D·R·卡勒; K·G·莫里森; K·A·尼尔森; M·罗比森; J·L·罗亚尔
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 2012-04-02
Filing date: 2013-03-28
Publication date: 2014-10-08
Anticipated expiration: 2033-03-28
Also published as: GB2515709A; WO2013149558A1; DE112013000881T5; CN104094236B; GB2515709B; US8930750B2; GB201419385D0; US20130262919A1; US20130262921A1; US8930749B2

Abstract

提供了用于防止存储***中的数据丢失的方法和***。一种方法包括检测多个存储设备中的一个存储设备即将经历故障并确定故障类型。所述方法还包括根据所确定的故障类型选择SMART重建技术、正常重建技术、数据迁移技术或用户数据备份技术来保存该存储设备中的数据并针对该存储设备执行所选择的技术。一种***包括被配置为将数据存储在多个数据地址中的多个存储设备和被配置为执行上述方法的处理器。还提供了包括用于防止存储***中的数据丢失的计算机程序产品方法的物理计算机存储介质。一种物理计算机存储介质包括用于执行上述方法的计算机代码。

Description

防止数据丢失的***和方法

技术领域

本发明一般地涉及计算***，更具体地说，涉及防止存储子***中数据丢失的方法和***。

背景技术

RAID技术广泛用于高端存储子***中。每种RAID类型都可以容忍有限数目的盘驱动器故障。例如，RAID 5阵列在任意给定时间至多可以具有一个盘驱动器故障而不会造成数据丢失。如果在重建期间另一盘驱动器发生故障，则会发生数据丢失。

特定RAID体系结构实施优先化重建算法，以便在I/O活动寻址到RAID中不受冗余保护的数据时，该I/O被排队或阻止，直到适当的RAID算法重新建立该数据的冗余。例如，如果数据受RAID 5奇偶校验冗余方案的保护并且主机或客户机对RAID阵列执行读取操作，则可以首先应用RAID 5算法，然后再为主机或客户机读取请求服务。

在RAID级别中，存在若干组件并且还存在冗余组件。在RAID 5配置中，使用奇偶校验组件，使得可以从另一盘重建数据丢失错误，该数据丢失错误被称为可以使用阈值跟踪恢复的可恢复错误。当发生其他错误(即，不可恢复错误)时，应尽快移除发生故障的盘。

当前主动移除可疑阵列组件成员的方法依赖于从RAID阵列中除去成员盘驱动器(就好像其已发生故障)以便通过奇偶校验触发RAID重建。漫长的阵列重建使阵列冗余暴露于可导致数据丢失的二次故障。此外，阵列重建还增加了遇到可引起条带(strip)数据丢失的二次故障的概率。尽管RAID提供了冗余，但是该体系结构不会以预防阵列重建的方式，在故障发生之前预测***中易于发生故障的成员或从***中移除易于发生故障的成员。

发明内容

各实施例提供了用于防止存储***中数据丢失的***。一种***包括被配置为将数据存储在多个数据地址中的多个存储设备和耦合到所述多个存储设备的处理器。所述处理器被配置为检测所述多个存储设备中的一个存储设备即将经历故障并确定故障类型。所述处理器还被配置为根据所确定的故障类型选择SMART重建技术、正常重建技术、数据迁移技术或用户数据备份技术来保存该存储设备中的数据以及针对该存储设备执行所选择的SMART重建技术、正常重建技术、数据迁移技术或用户数据备份技术。

其他实施例提供了用于防止存储***中的数据丢失的方法，所述存储***包括多个存储设备，每个存储设备均将数据存储在多个数据地址中。一种方法包括检测所述多个存储设备中的一个存储设备即将经历故障并确定故障类型。所述方法还包括根据所确定的故障类型选择SMART重建技术、正常重建技术、数据迁移技术或用户数据备份技术来保存该存储设备中的数据以及针对该存储设备执行所选择的SMART重建技术、正常重建技术、数据迁移技术或用户数据备份技术。

各种其他实施例提供了包括用于防止存储***中的数据丢失的计算机程序产品方法的物理计算机存储介质(例如，具有一条或多条线的电连接、便携式计算机软盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦写可编程只读存储器(EPROM或闪存)、光纤、便携式光盘只读存储器(CD-ROM)、光存储设备、磁存储设备或它们的任何适当组合)，所述存储***包括多个存储设备，每个存储设备均将数据存储在多个数据地址中。一种物理计算机存储介质包括用于检测所述多个存储设备中的一个存储设备即将经历故障的计算机代码以及用于确定故障类型的计算机代码。所述物理计算机存储介质还包括用于根据所确定的故障类型选择SMART重建技术、正常重建技术、数据迁移技术或用户数据备份技术来保存该存储设备中的数据的计算机代码以及用于针对该存储设备执行所选择的SMART重建技术、正常重建技术、数据迁移技术或用户数据备份技术的计算机代码。

附图说明

为了更容易理解本发明的优点，将参考附图中示出的特定实施例提供上面简要描述的本发明的更具体的说明。应该理解，这些附图仅示出本发明的典型实施例，因此并不能被视为对本发明范围的限制，将通过使用附图以额外特殊性和细节来描述和阐述本发明，这些附图是：

图1是用于防止存储子***中数据丢失的***的一个实施例的方块图；以及

图2是用于防止存储***中数据丢失的方法的一个实施例的流程图。

具体实施方式

各实施例提供了防止存储子***中数据丢失的***和方法。还提供了包括防止存储***中数据丢失的计算机程序产品方法的物理计算机存储介质(例如，具有一条或多条线的电连接、便携式计算机软盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦写可编程只读存储器(EPROM或闪存)、光纤、便携式光盘只读存储器(CD-ROM)、光存储设备、磁存储设备或它们的任何适当组合)。

现在参考附图，图1是用于防止存储子***中数据丢失的***100的一个实施例的方块图。至少在所示实施例中，***100包括与管理节点120耦合的独立磁盘冗余阵列(RAID)存储子***110，管理节点120与网络130(例如，广域网(WAN)、局域网(LAN)、存储区域网络(SAN)、融合网络、企业内部网络、因特网和/或类似的网络)进行通信。

RAID存储子***110包括多个存储设备(例如，盘1110-111n)。盘1110-111n可以排列成任何RAID配置(例如，RAID 0、RAID 1、RAID 2、RAID 3、RAID 4、RAID 5、RAID 6、RAID 10等)。盘1110-111n中的每一个均被配置为将数据存储在盘1110-111n内的多个数据地址中。为了防止盘1110-111n内的数据丢失，***100包括管理节点120。

在一个实施例中，管理节点120包括被配置为防止盘1110-111n内的数据丢失的数据保留模块1210。管理节点120可以是任何能够执行形成数据保留模块1210的计算机代码的处理器、控制器和/或其他设备。

数据保留模块1210被配置为判定盘1110-111n中的一个或多个盘是否即将经历故障状况并确定故障状况类型。故障状况的实例包括但不限于简单错误或阈值错误(例如，介质错误、按键代码限定符(KCQ)错误以及类似的错误)、一个或多个故障盘、一个或多个故障RAID阵列以及类似的故障状况。

在一个实施例中，数据保留模块1210被配置为在数据保留模块1210确定盘1110-111n中的一个或多个盘即将经历简单错误或阈值错误时启动SMART重建技术。术语“SMART重建”适用于针对另一RAID体系结构的组件使用一个镜像RAID对。

例如，3+P RAID 5阵列包括组件D1、D2、D3和P。如果该阵列中的组件D2用作SMART重建的源，则建立基于D2的镜像(RAID 1)阵列并使用RAID镜像完成D2的一致镜像。在此，RAID 1镜像组件可被称为D2s和D2t，其中D2s是RAID 5阵列的组件2，而D2t是RAID 1镜像的目标。当重建时，可以从D1、D3、P重新构建或从D2s读取写入D2t的数据。

继续该实例，组件D2可以被选作SMART重建的源，建立短暂的RAID1镜像，并且当D2t变得与D2s一致时，可以在逻辑上从RAID 5阵列移除D2s。在此，D2t变为RAID 5阵列的组件2。

在一个实施例中，数据保留模块1210被配置为检测一个特定数据地址和/或一系列地址是否面临更大的丢失风险并按照优先顺序排列SMART重建。也就是说，数据保留模块1210被配置为首先针对该数据地址或一系列地址执行SMART重建，然后针对未被确定为面临数据丢失风险的其他地址执行SMART重建。

例如，可从外部恢复或不可从外部恢复的组件D3在与RAID 5阵列LBA范围Xa-Xb相关的LBA区域Ma-Mb中出现故障。另一可从外部恢复或不可从外部恢复的组件D2在与RAID 5阵列LBA范围Ya-Yb相关的LBA区域Na-Nb中出现故障。同时针对组件D2和D3启动SMART重建。RAID 5和RAID 1拓扑为D1、(D2s、D2t)、(D3s、D3t)以及P。

针对RAID LBA Xa-Xb以及针对与组件D2s Na-Nb相关的RAIDLBA触发或仿真客户机/主机“读取”。类似地，针对与组件D3s Ma-Mb相关的RAID LBA Ya-Yb触发或仿真“读取”。RAID算法通过从D2s读取或通过使用RAID 5从D1、D3s和P重新构建来对D2t执行操作以在D2t上重新构建LBA Xa-Xb。RAID算法通过从D3s读取或通过从D1、D2s和P重新构建来对D3t执行操作以在D3t上重新构建LBA Ma-Mb。读取操作的结果是为面临风险的阵列LBA范围Xa-Xb和Ya-Yb在重建周期中较早建立RAID***中的冗余。

在D2t和D3t上的SMART重建正常地继续，直到为该对建立RAID 1冗余。此外，D2t和D3t变为RAID 5阵列的主要组件，并且RAID 1短暂阵列关系终止。通过根据故障或错误阵列组件的先前历史按优先顺序排列对RAID阵列的读取，在重建周期中更早地实现了较高的数据冗余，并降低了逐步升级的故障导致条带数据丢失的风险。

当由于一个或多个组件出现故障以及RAID重建算法在RAID重建操作期间遇到阻止重新构建正确数据的不可恢复的读取错误而使阵列数据冗余遭受风险时，使用术语“条带数据丢失”。此情况可在各种RAID算法中发生：RAID 1(镜像)、RAID 5(奇偶校验)、RAID 6以及类似算法。

在另一实施例中，数据保留模块1210被配置为在数据保留模块1210确定盘1110-111n中的一个或多个盘即将或已经出现故障时执行“正常”重建技术。在一个实施例中，正常重建技术包括使用一个或多个新盘替换一个或多个即将或已经出现故障的盘并从其他未发生故障或正常运行的盘(多个)重建RAID阵列。

在又一实施例中，数据保留模块1210被配置为在数据保留模块1210确定RAID体系结构中的一个或多个阵列即将发生故障以及经过预定时间量之后一个或多个阵列会发生故障时，将数据从RAID体系结构中的一个阵列迁移到RAID体系结构中的另一阵列。所述预定时间量是允许将故障阵列(多个)中的数据迁移到RAID体系结构中的一个或多个其他阵列的时间量。预定时间量的实例包括但不限于一天、一周、一个月或任何其他允许将故障盘(多个)中的数据迁移到RAID体系结构中的一个或多个其他阵列的时间量。当所剩时间少于所述预定时间量时，数据保留模块1210被配置为执行其他数据保留技术。

在数据保留模块1210确定RAID体系结构中的一个或多个阵列即将发生故障并且在一个或多个阵列发生故障之前所剩的时间少于或等于所述预定时间量时，数据保留模块1210被配置为经由网络130将数据传输到远程位置进行备份。在一个实施例中，所述远程位置是与***100相关的其他存储子***。在另一实施例中，所述远程位置是例如包括客户和/或客户机的存储子***的其他存储子***。

现在参考图2，图2是用于防止存储***中的数据丢失的方法200的一个实施例的流程图，所述存储***包括多个存储设备(例如，盘1110-111n)，每个存储设备将数据存储在多个数据地址中。至少在所示实施例中，方法200始于确定和/或检测一个或多个存储设备即将经历故障状况(方块210)并确定故障状况类型(方块220)。

当所确定的故障状况为简单故障或阈值故障(例如，介质错误)时(方块225)，方法200包括针对所述存储设备(多个)启动SMART重建(方块230)。在启动SMART重建之后，方法200包括判定一个或多个数据地址或一系列地址是否面临更大的数据丢失风险(方块235)。

如果一个或多个数据地址或一系列地址比其他数据地址面临的数据丢失风险更大，则首先针对此/这些数据地址执行SMART重建(方块240)，然后针对所述数据地址顺序执行SMART重建(方块245)。如果一个或多个数据地址或一系列地址面临的数据丢失风险并不大于其他数据地址，则针对所述数据地址顺序执行SMART重建(方块245)。

当所确定的故障状况为一个或多个存储设备即将或已经发生故障时(方块250)，方法200包括针对所述存储设备(多个)执行正常重建(方块255)。在一个实施例中，执行正常重建包括使用一个或多个新的存储设备替换即将或已经发生故障的存储设备(多个)并从其他未发生故障或正常运行的存储设备(多个)重建RAID阵列。

当所确定的故障状况为一个或多个RAID阵列即将发生故障时(方块260)，方法200包括判定在RAID阵列发生故障之前所剩的时间是否多于预定时间量(方块270)。如果在RAID阵列发生故障之前所剩的时间多于预定时间量，方法200包括将数据从RAID体系结构中即将发生故障的阵列迁移到RAID体系结构中的另一阵列(方块280)。所述预定时间量是允许将故障阵列(多个)中的数据迁移到RAID体系结构中的一个或多个其他阵列的时间量。预定时间量的实例包括但不限于一天、一周、一个月或任何其他允许将故障阵列(多个)中的数据迁移到RAID体系结构中的一个或多个其他阵列的时间量。

当RAID阵列发生故障之前所剩的时间少于或等于所述预定时间量时，方法200包括将故障RAID阵列中的数据传输到远程位置进行备份(方块290)。在一个实施例中，所述远程位置是其他RAID***。在另一实施例中，所述远程位置是例如包括客户和/或客户机的存储子***的其他存储子***。

尽管前面对本发明的详细说明介绍了至少一个示例性实施例，但应理解，存在多种变型。还应理解，一个或多个示例性实施例只是实例，并非旨在以任何形式限制本发明的范围、应用领域或配置。而且，前面的详细说明将为本领域的技术人员提供方便实现本发明的示例性实施例的指南。将理解，可以在不偏离所附权利要求及其法律等同物中阐述的本发明范围的情况下，对示例性实施例中描述的元素的功能和布置做出各种更改。

本领域的技术人员知道，本发明的各方面可以体现为***、方法或计算机程序产品。因此，本发明的各方面可以具体实现为以下形式，即，可以是完全的硬件、完全的软件(包括固件、驻留软件、微代码等)、或者本文一般称为“电路”、“模块”或“***”的软件部分与硬件部分的组合。此外，本发明的各方面还可以采取体现在一个或多个计算机可读介质中的计算机程序产品的形式，该介质中包含计算机可读程序代码。

可以使用一个或多个计算机可读介质的任何组合。计算机可读介质可以是计算机可读信号介质或物理计算机可读存储介质，物理计算机可读存储介质例如可以是(但不限于)电的、磁的、光的、晶体的、聚合物的、电磁的、红外线的、或半导体的***、装置、器件、或前述各项的任何适当的组合。物理计算机可读存储介质的更具体的例子(非穷举的列表)包括以下：有一个或多个导线的电连接、便携式计算机磁盘、硬盘、RAM、ROM、EPROM、闪存、光纤、CD-ROM、光存储器件、磁存储器件、或前述各项的任何适当的组合。在本文语境中，计算机可读存储介质可以是任何含有或存储供指令执行***、装置或器件使用的或与指令执行***、装置或器件相联系的程序的有形介质。

可以使用任何适当的介质(包括但不限于无线、有线、光缆、射频(RF)等或它们的任何适当组合)来传输计算机可读介质中包含的计算机代码。用于执行本发明的各方面的操作的计算机代码可以使用诸如“C”编程语言或类似编程语言之类的任何静态语言进行编写。所述计算机代码可以完全地在用户的计算上执行、部分地在用户的计算机上执行、作为一个独立的软件包执行、部分在用户的计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在后一种情形中，远程计算机可以通过任何种类的网络或通信***—包括但不限于局域网(LAN)、广域网(WAN)或融合网络—连接到用户的计算机，或者，可以(例如利用因特网服务提供商来通过因特网)连接到外部计算机。

上面参照按照本发明实施例的方法、装置(***)和计算机程序产品的流程图和/或框图描述本发明的各方面。要明白的是，流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合，都可以由计算机程序指令实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器，从而生产出一种机器，使得通过计算机或其他可编程数据处理装置的处理器执行的这些指令，产生实现流程图和/或框图中的方框中规定的功能/操作的装置。

也可以把这些计算机程序指令存储在能指令计算机、其他可编程数据处理装置或其他设备以特定方式工作的计算机可读介质中，这样，存储在计算机可读介质中的指令产生一个包括实现流程图和/或框图中的方框中规定的功能/操作的指令装置的制品。也可以将计算机程序指令加载到计算机、其他可编程数据处理装置或其他设备上，使得在计算机、其他可编程装置或其他设备上执行一系列操作步骤，以产生计算机实现的过程，从而在计算机或其他可编程装置上执行的指令就提供实现流程图和/或框图中的方框中规定的功能/操作的过程。

附图中的流程图和框图，图示了按照本发明各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，所述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的***来实现，或者可以用专用硬件与计算机指令的组合来实现。

尽管已详细示出本发明的一个或多个实施例，但是本领域的技术人员将理解，可以在不偏离以下权利要求中阐述的本发明的范围的情况下，对这些实施例做出修改和改变。

Claims

1.一种用于防止存储***中的数据丢失的***，所述***包括：多个存储设备，其被配置为将数据存储在多个数据地址中；以及处理器，其耦合到所述多个存储设备，其中所述处理器被配置为：

检测所述多个存储设备中的一个存储设备即将经历故障，

确定故障类型，

选择SMART重建技术、正常重建技术、数据迁移技术以及用户数据备份技术中的一种技术来保存该存储设备中的数据，所述选择基于所确定的故障类型，以及

针对该存储设备执行在SMART重建技术、正常重建技术、数据迁移技术以及用户数据备份技术中所选择的一种技术。

2.如权利要求1中所述的***，其中所述存储***包括具有所述多个数据地址的RAID 5配置，并且其中所述处理器已确定所述故障类型为该存储设备即将经历介质错误，所述处理器配置为：

选择SMART重建技术；以及

执行所述SMART重建技术，所述SMART重建技术包括：

按照优先顺序排列该存储设备中的每个数据地址，以及

基于所述优先顺序重建该存储设备中的第一系列的数据地址。

3.如权利要求2中所述的***，其中在按照优先顺序排列每个数据地址时，所述处理器被配置为确定所述第一系列的数据地址比第二系列的数据地址更容易丢失。

4.如权利要求3中所述的***，其中在重建所述第一系列的数据地址时，所述处理器被配置为：

首先重建所述第一系列的数据地址；以及

在重建所述第一系列的数据地址之后，重建所述第二系列的数据地址以及该存储设备中的任何剩余数据地址。

5.如权利要求2中所述的***，其中所述处理器已确定所述故障类型为该存储设备已失效，所述处理器被配置为：

选择正常重建技术；以及

执行正常重建技术，所述正常重建技术包括使用新的存储设备替换该存储设备。

6.如权利要求5中所述的***，其中所述处理器已确定所述故障类型为所述多个存储设备将在预定时间量后失效，所述处理器被配置为：

选择数据迁移技术；以及

执行数据迁移技术，执行数据迁移技术包括将所述多个存储设备中的数据迁移到新的多个存储设备。

7.如权利要求6中所述的***，其中所述处理器已确定所述故障类型为所述多个存储设备将在所述预定时间量内失效，所述处理器被配置为：

选择用户数据备份技术；以及

执行用户数据备份技术，执行用户数据备份技术包括将所述多个存储设备中的数据迁移到远程存储***。

8.一种用于防止存储***中的数据丢失的方法，所述存储***包括多个存储设备，每个存储设备均将数据存储在多个数据地址中，所述方法包括：

检测所述多个存储设备中的一个存储设备即将经历故障；

确定故障类型；

选择SMART重建技术、正常重建技术、数据迁移技术以及用户数据备份技术中的一种技术来保存该存储设备中的数据，所述选择基于所确定的故障类型；以及

9.如权利要求8中所述的方法，其中：

所述存储***包括具有所述多个数据地址的RAID 5配置；

确定故障类型包括确定该存储设备即将经历介质错误；

所述选择包括选择SMART重建技术；以及

执行所述SMART重建技术包括：

按照优先顺序排列该存储设备中的每个数据地址，以及

10.如权利要求9中所述的方法，其中按照优先顺序排列每个数据地址包括确定所述第一系列的数据地址比第二系列的数据地址更容易丢失。

11.如权利要求10中所述的方法，其中重建所述第一系列的数据地址包括：

首先重建所述第一系列的数据地址；以及

12.如权利要求9中所述的方法，其中：

确定所述故障类型包括确定该存储设备已失效；

所述选择包括选择正常重建技术；以及

执行正常重建技术包括使用新的存储设备替换该存储设备。

13.如权利要求12中所述的方法，其中：

确定所述故障类型包括确定所述多个存储设备将在预定时间量后失效；

所述选择包括选择数据迁移技术；以及

执行数据迁移技术包括将所述多个存储设备中的数据迁移到新的多个存储设备。

14.如权利要求13中所述的方法，其中：

确定所述故障类型包括确定所述多个存储设备将在所述预定时间量内失效；

所述选择包括选择用户数据备份技术；以及

执行用户数据备份技术包括将所述多个存储设备中的数据迁移到远程存储***。

15.一种包括用于防止存储***中的数据丢失的计算机程序产品方法的物理计算机存储介质，所述存储***包括多个存储设备，每个存储设备均将数据存储在多个数据地址中，所述物理计算机存储介质包括：

用于检测所述多个存储设备中的一个存储设备即将经历故障的计算机代码；

用于确定故障类型的计算机代码；

用于选择SMART重建技术、正常重建技术、数据迁移技术以及用户数据备份技术中的一种技术来保存该存储设备中的数据的计算机代码，所述选择基于所确定的故障类型，以及

用于针对该存储设备执行在SMART重建技术、正常重建技术、数据迁移技术以及用户数据备份技术中所选择的一种技术的计算机代码。

16.如权利要求15中所述的物理计算机存储介质，其中所述存储***包括具有所述多个数据地址的RAID 5配置并且其中：

用于确定所述故障类型的计算机代码包括用于确定该存储设备即将经历介质错误的计算机代码；

用于选择的计算机代码包括用于选择SMART重建技术的计算机代码；以及

用于执行所述SMART重建技术的计算机代码包括：

用于按照优先顺序排列该存储设备中的每个数据地址的计算机代码，以及

用于基于所述优先顺序重建该存储设备中的第一系列的数据地址的计算机代码。

17.如权利要求16中所述的物理计算机存储介质，其中：

用于按照优先顺序排列每个数据地址的计算机代码包括用于确定所述第一系列的数据地址比第二系列的数据地址更容易丢失的计算机代码；以及

用于重建所述第一系列的数据地址的计算机代码包括：

用于首先重建所述第一系列的数据地址的计算机代码；以及

用于在重建所述第一系列的数据地址之后，重建所述第二系列的数据地址以及该存储设备中的任何剩余数据地址的计算机代码。

18.如权利要求16中所述的物理计算机存储介质，其中：

用于确定所述故障类型的计算机代码包括用于确定该存储设备已失效的计算机代码；

用于选择的计算机代码包括用于选择正常重建技术的计算机代码；以及

用于执行正常重建技术的计算机代码包括用于使用新的存储设备替换该存储设备的计算机代码。

19.如权利要求18中所述的物理计算机存储介质，其中：

用于确定所述故障类型的计算机代码包括用于确定所述多个存储设备将在预定时间量后失效的计算机代码；

用于选择的计算机代码包括用于选择数据迁移技术的计算机代码；以及

用于执行数据迁移技术的计算机代码包括用于将所述多个存储设备中的数据迁移到新的多个存储设备的计算机代码。

20.如权利要求19中所述的物理计算机存储介质，其中：

用于确定所述故障类型的计算机代码包括用于确定所述多个存储设备将在所述预定时间量内失效的计算机代码；

用于选择的计算机代码包括用于选择用户数据备份技术的计算机代码；以及

用于执行用户数据备份技术的计算机代码包括用于将所述多个存储设备中的数据迁移到远程存储***的计算机代码。