CN1728101A - 数据存储设备及其数据存储方法 - Google Patents

数据存储设备及其数据存储方法 Download PDF

Info

Publication number
CN1728101A
CN1728101A CNA2005100875540A CN200510087554A CN1728101A CN 1728101 A CN1728101 A CN 1728101A CN A2005100875540 A CNA2005100875540 A CN A2005100875540A CN 200510087554 A CN200510087554 A CN 200510087554A CN 1728101 A CN1728101 A CN 1728101A
Authority
CN
China
Prior art keywords
data
pen recorder
order
storage device
data storage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2005100875540A
Other languages
English (en)
Inventor
粥川义明
浅井稔也
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN1728101A publication Critical patent/CN1728101A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/18Error detection or correction; Testing, e.g. of drop-outs
    • G11B20/1833Error detection or correction; Testing, e.g. of drop-outs by adding special lists or symbols to the coded information
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1076Parity data used in redundant arrays of independent storages, e.g. in RAID systems
    • G06F11/1088Reconstruction on already foreseen single or plurality of spare disks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1076Parity data used in redundant arrays of independent storages, e.g. in RAID systems
    • G06F11/1092Rebuilding, e.g. when physically replacing a failing disk

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

本发明提供了一种能够减小用于更换有故障的存储装置的维护会话的次数的数据存储设备以及其数据存储方法。该数据存储设备包括:多个数据HDD;多个错误校正HDD;数据分配和错误校正代码产生装置,其将输入数据在所述数据HDD中进行分配和记录,根据所述错误校正HDD的数目从所述数据中产生错误校正代码,并将所述错误校正代码记录在所述错误校正HDD中;以及数据恢复装置,其利用从剩余的HDD中读取的数据和错误校正代码,恢复在其中发生了故障或响应延迟的HDD中的数据。

Description

数据存储设备及其数据存储方法
技术领域
本发明涉及适合于应用到例如HDD阵列单元的一种数据存储设备及其数据存储方法。
背景技术
近年来,HDD(硬盘驱动器)阵列单元已经在广播站和后处理中经常用于存储AV(音频/视频)数据。在HDD阵列单元中,多个HDD被安装到单个的单元中以便同时实现大容量存储和高的数据传输率。
例如,在广播站中对用作非线性编辑***的AV服务器提出了巨大的存储容量、高可靠性和高数据传输率的要求,因此HDD阵列单元被用作存储器。这种AV服务器具有多个记录/再现端口,其中的每个端口在操作期间以高比特率输入和输出数据流。对于AV服务器提出的要求包括:(1)在例如直播传送期间防止视频或音频流出故障方面的绝对可靠性,和(2)满足一定最小水平的响应性能(实时特性)。
然而,作为存储器使用的HDD甚至于***中的其它装置相比也是具有低的可靠性的装置。因此,为HDD阵列单元提供了按照RAID(RedundantArrays of Inexpensive Disks,廉价盘的冗余阵列)配置的冗余,从而支持处理各种故障的功能。这样的功能的示例包括基于奇偶的错误校正、通过重建的数据重构、数据再分配处理(其中,当一个HDD发生响应延迟时,从另一HDD校正并输出该HDD的数据)、通过安装备用HDD而得到缩短了的MTTR(Mean Time To Repair,平均修复时间)
在过去,在这种AV服务器以及类似设备中使用的HDD阵列单元被配置为RAID级别3或级别5***,而HDD冗余仅仅是1(例如,见专利对比文献1)。
专利对比文献1:日本专利申请公开第No.2000-299835(段落0058和0059,图2)。
不过,如果在这种具有冗余仅仅为1的HDD阵列单元中一个HDD出现故障,则剩余HDD必须用来执行重建并且恢复出现故障的HDD的数据,然而,在重建完成之前***必须在没有冗余(RAID级别0)的状态下继续运行,如果在此期间在另一个HDD中出现一个错误或响应延迟,则在视频或音频流中出现噪声,以及在最坏的情况下出现直播问题。
为了使得无冗余的状态尽可能的短,HDD必须被更换并且重建要尽可能迅速地完成。为此目的,采用了一种安排,其中,上述备用HDD被预先安装并且紧接在HDD故障之后自动地开始重建。即便如此,随着近年来HDD容量已经增加,在某些情况下在***运行期间要花费数日来重建。在使用这种盘阵列设备的AV服务器中,在用于修理HDD的维护期间和在恢复期间保持***可靠性是很关键的。
在维护中发生两种费用,它们是更换HDD准备的费用和由服务技术人员进行现场服务的费用。由于HDD价格的稳步下降,维护的费用大部分由技术人员现场服务的费用组成。该维护费用是用户的重要负担,盘校准设备(disk alignment equipment)的主要目标是通过较少的维护会话(maintenancesession)降低现场服务费用。此外,对于HDD恢复自身的需求的发生意味着***运行在RAID级别0上的降级的可靠性,因此存在对在恢复期间保持***可靠性的强烈需求。
发明内容
针对上述问题,本发明提供了一种数据存储设备,包括多个安装在诸如HDD阵列单元的单个单元中的多个数据存储装置,在该单元中,即使在一个存储装置中出现故障或者响应延迟,也具有连续运行在保持冗余的状态的能力,并且减小了用于更换出故障的存储装置的维护会话的次数。
为了实现上述目的,根据本发明实施方式的一种数据存储设备包括:多个数据记录装置;多个错误校正记录装置;数据分配和错误校正代码产生装置,用于将输入数据在所述数据记录装置中进行分配和记录,根据所述错误校正记录装置的数目从所述数据中产生错误校正代码从而将所述错误校正代码记录在所述错误校正记录装置中;以及数据恢复装置,其利用从剩余的记录装置中读取的数据和错误校正代码,恢复在所述数据记录装置和错误校正记录装置之中发生了故障或响应延迟的记录装置中的数据。
在该数据存储设备中,将输入数据分配到多个数据记录装置中进行记录,根据错误校正记录装置的数目从数据中产生的错误校正代码被记录到多个错误校正记录装置中。因此冗余等于错误校正记录装置的数目。
当在任何记录装置中发生了故障或响应延迟时,利用从剩余的数据记录装置和错误纠正代码记录装置中读取的数据和错误校正代码,恢复该记录装置内部的数据。如上面解释的那样,因为冗余等于错误校正记录装置的数目,所以即使在比错误校正记录装置数目少1的多个记录装置中发生了故障或响应延迟,在数据恢复期间仍然可以保持1或更大的冗余。
通过这种方式,即使在一个记录装置中发生了故障或响应延迟,操作仍然可以按照保证冗余的状态继续下去。
此外,直到在与错误校正记录装置最大数目同样的数目的记录装置中发生了故障,即使不更换有故障的记录装置也可以恢复数据。因此,可以减少用于更换有故障的记录装置的维护会话的数目。
优选地,该数据存储设备的一个例子还包括:请求输出装置,其输出用于请求更换有故障的记录装置的信息,以及操作装置,用于选择是否更换有故障的记录装置,直到有故障的记录装置的数目与所述错误校正记录装置的最大数目相等,其中,在所述操作装置没有选择执行更换的情况下,即使有故障的记录装置没有得到更换,所述请求输出装置也停止输出所述信息。
因此,只要数目在错误校正记录装置的最大数目的范围之内,用户就可以任意地选择是否进行更换任何数目的有故障的记录装置的维护。
此外,优选地,该数据存储设备的一个例子还包括:至少一个备用记录装置,请求输出装置,其输出用于请求更换有故障的记录装置的信息,以及操作装置,用于选择是否更换有故障的记录装置,直到有故障的记录装置的数目至少与所述备用记录装置的数目相等,其中,在记录装置故障的数目在所述备用记录装置的数目的范围之内的情况下,所述数据恢复装置在所述备用记录装置中记录该恢复的数据,以及在所述操作装置选择不执行更换的情况下,即使有故障的记录装置没有得到更换,所述请求输出装置也停止输出所述信息。
结果,一直到有故障的记录装置的数目与备用记录装置的数目,用户可以任意地选择是否进行更换任意数目的有故障的记录装置的维护,而同时保持冗余等于错误校正记录装置的数目。此外,在记录装置有故障而还有备用记录装置时,但恰好在进行维护(服务技术人员在现场),则可以选择更换,从而可以进一步减小维护会话的总数。
为了解决上述的技术问题,提供了一种类似于上述数据存储设备的数据存储方法。根据本发明实施方式该数据存储方法包括:数据分配和记录步骤,将输入数据在所述数据记录装置中进行分配和记录;错误校正代码产生和记录步骤,根据所述错误校正记录装置的数目从所述数据中产生错误校正代码,并将所述错误校正代码记录在所述错误校正记录装置中;以及数据恢复步骤,利用从剩余的记录装置中读取的数据和错误校正代码,恢复在所述数据记录装置和错误校正记录装置之中发生了故障或响应延迟的记录装置中的数据。
此外,作为例子提出了一种应用在包括多个数据记录装置、多个错误校正记录装置和至少一个备用记录装置的数据存储设备中的数据存储方法。该方法包括:数据恢复步骤,利用从剩余的记录装置中读取的数据和错误校正代码,恢复在所述数据记录装置和错误校正记录装置之中发生了故障或响应延迟的记录装置中的数据;请求输出步骤,输出用于请求更换有故障的记录装置的信息;操作步骤,用于选择是否更换有故障的记录装置,直到有故障的记录装置的数目至少与所述备用记录装置的数目相等;其中,在记录装置故障的数目在所述备用记录装置的数目的范围之内的情况下,在所述数据恢复步骤中在所述备用记录装置中记录该恢复的数据,以及在所述操作步骤没有选择执行更换的情况下,即使有故障的记录装置没有得到更换,在所述请求输出步骤中也停止输出所述信息。
通过上述方法可以获得类似于上述数据存储设备的操作。
根据本发明的实施方式,有利的结果在于,在一个将多个数据记录装置安装在单个单元中的数据存储设备中,即使在一个记录装置中发生了故障或响应延迟,操作仍然可以按照保证冗余的状态继续下去,并且可以减小用于更换有故障的存储装置的维护会话。
有利的结果还在于,在错误校正记录装置的最大数目的范围之内,用户可以任意地选择是否进行更换任何数目有故障的记录装置的维护。
另外,有利的结果还在于,直到有故障的记录装置的数目等于备用记录装置的数目,用户可以任意地选择是否进行更换任何数目有故障的记录装置的维护,而同时保持冗余等于错误校正记录装置的数目;有利的结果还在于,在记录装置有故障而还有备用记录装置时,恰好在进行维护,则通过选择更换可以进一步减小维护会话的总数目。
附图说明
图1是示意地示出了应用本发明的AV服务器配置的框图;
图2是示出图1中存储单元中HDD阵列单元的配置的框图;
图3是示出图2的控制板的电路配置的框图;
图4示出图2的控制面板的外部视图;以及
图5是示出在HDD出故障时由图3的CPU执行的处理的流程图。
具体实施方式
下面,利用附图详细地解释将本发明应用于用作广播站中非线性编辑***的AV服务器的实施方式。图1是示意地示出应用本发明的AV服务器配置的框图。该AV服务器包括输入/输出处理器1和存储单元。
输入/输出处理器1具有多个(例如六个)输入/输出端口,并且按照SDI(串联数字接口)或其它同步传输格式或者按照异步传输格式与外部设备进行AV数据的输入和输出。
输入/输出处理器1按照预定的编码方法对从输入/输出端口输入的AV数据进行编码(压缩),并将数据通过光纤通道3传输到存储单元。输入/输出处理器1还对通过光纤通道3从存储单元传输的数据进行解码(扩展),并且从输入/输出端口输出数据。
注意到在典型AV服务器中的输入/输出处理器1的配置是公知的,而应用本发明的AV服务器的输入/输出处理器的配置可以具有该典型的配置,因此省略了详细的解释。
存储单元具有多个HDD阵列单元。图2是示出了存储单元中的一个HDD阵列单元的配置的框图。该HDD阵列单元包括:15个HDD4(1)至4(15)、用于控制每个HDD4的控制板5、连接HDD4和控制板5的母板6、用于更换HDD4并管理HDD阵列单元的控制面板7、用于为这些单元的每个提供电源的两个电源单元8、用于冷却HDD4和控制板5等等的两个风扇9。
在15个HDD4中,10个HDD4(1)至4(10)是用于数据的HDD,4个HDD4(11)至4(14)是用于错误校正的HDD,而剩余一个HDD4(15)是一个备用HDD。
在HDD4(1)至4(14)中的一个出现故障并且该HDD的数据被恢复和记录(重建)在HDD4(15)上的情况下,有故障的HDD(用于数据或用于错误校正的HDD)被移动到HDD4(15)的位置上。此外,在更换了HDD的情况下,备用HDD被移动到该HDD的位置。因此,在初始状态下HDD4(1)至4(10)、HDD4(11)至4(14)、HDD4(15)分别是用于数据的HDD、用于错误校正的HDD、备用HDD;但是每当执行了重建和更换,数据HDD、错误校正HDD以及备用HDD的位置发生了改变。不过,如下面解释的那样,作为表示数据HDD、错误校正HDD以及备用HDD的符号,分别贯穿全文使用符号HDD4(1)至4(10)、HDD4(11)至4(14)以及HDD4(15)。
也如图1所示,控制板5由通过光纤通道3连接到输入/输出处理器1,并且控制板5还由Ethernet10连接到外部维护终端(个人计算机)11。
图3是表示控制板5的电路配置的框图。控制板5包括:光纤通道控制器12、分割(striping)和ECC单元13、存储器(RAM)14、HDD控制器15、网络接口16、CPU17。分割和ECC单元13具有一个FPGA,它是一个可编程LSI器件。
通过光纤通道3从输入/输出处理器1(图1)传输的数据,通过光纤通道控制器12被送至分割和ECC单元13。分割和ECC单元13对数据进行分割,从而送入10个通道,分别被记录在数据HDD4(1)至4(10)中,而同时在存储器14中缓冲数据。从在这10个通道中的数据产生出被记录在4个错误校正HDD4(11)至4(14)中的李德-所罗门(Reed-Solomon)(14,10)代码。
由分割和ECC单元13对其进行分割的数据通过HDD控制器15和母板6(图2)被送至数据HDD4(1)至4(10),并且被记录在HDD4(1)至4(10)中。
在分割和ECC单元13中产生的李德-所罗门代码通过HDD控制器15和母板6被送至错误校正HDD4(11)至4(14),并且被记录在HDD4(11)至4(14)中。因此,HDD阵列单元具有等于4个HDD的冗余。
在数据再现期间,从每个数据HDD4(1)至4(10)读出的数据以及从每个错误校正HDD4(11)至4(14)读出的李德-所罗门代码,通过母板6、HDD控制器15以及分割和ECC单元13被送至存储器14,并且在存储器14中的缓冲之后,被送至分割和ECC单元13。分割和ECC单元13利用来自数据HDD4(1)至4(10)的数据以及来自错误校正HDD4(11)至4(14)的李德-所罗门代码,执行错误校正。按照这种方式再现的数据通过光纤通道3从光纤通道控制器12传输到输入/输出处理器1。
基于连同数据一起从输入/输出处理器1传输的命令,CPU17控制HDD4(1)至4(15)。例如,如果在数据再现期间在数据HDD4(1)至4(10)的任何一个中发生了故障或响应延迟,则在CPU17的控制之下,利用从剩余的数据HDD中读出的数据和从错误校正HDD4(11)至4(14)中读出的李德-所罗门代码,恢复该HDD中的数据。
如上面解释的那样,该HDD阵列单元具有等于HDD数目4的冗余,使得即使在HDD4(1)至4(10)中直到最多三个单元发生了故障或响应延迟,则在保持1或更高的冗余的同时也可以进行数据恢复。
通过这种方式,即使在HDD4(1)至4(14)中的一个发生了故障或响应延迟,AV服务器的操作可以按照保证冗余的状态得到继续。
此外,对于直到最大4个有故障的HDD4(1)至4(14),即使不更换有故障的HDD也可以恢复数据。结果,可以减小用于更换有故障的HDD的维护会话,从而可以降低了维护费用。
当HDD4(1)至4(14)中的一个有故障时,CPU17执行图5中所示出的处理,下面基于控制面板7和维护终端上的操作针对有故障的HDD对其进行解释。
图4示出控制面板7(图2)的外部视图。控制面板7位于存储单元外壳的表面上,并且配备了用于显示各种菜单和状态的LCD(液晶显示器)、用于从显示在LCD21上的菜单中进行选择的附加成形的摇臂键22、以及作为LED(发光二极管)灯23至25的指示器。
LED灯23是***灯,正常情况下点亮,而在HDD故障期间闪烁为桔黄色,以及在诸如导致不能进行数据记录的严重故障的情况下闪烁为红色。LED灯24是电源灯,正常情况下点亮,而在两个电源8(图2)之一有故障期间闪烁为桔黄色。LED灯25是指示HDD访问状态的显示灯,在访问期间闪烁。
显示在LCD21上的菜单包括用来选择是否更换HDD4(1)至4(14)中已经有故障的HDD的菜单。尽管没有示出,同样的菜单也显示在上述维护终端11(图2)的显示器上。
图5是示出在HDD4(1)至4(14)中任一个有故障时由控制板5上的CPU17(图3)执行的关于更换有故障的HDD的处理的流程图。每当HDD4(1)至4(14)的任一个有故障就启动该处理;首先,将指示故障的状态信息输出到输入/输出处理器1(图1),而将维护请求(请求更换有故障的HDD的信息)输出到控制面板7和维护终端11(图2)两者(步骤S1)。
响应于该维护请求,在控制面板7上LED灯23(图4)闪烁为桔黄色。尽管没有示出,在维护终端11上响应于该维护请求也在显示器上显示预定的报警。
跟随着步骤S1,判断该故障是否是第一故障(S2)。如果“是”,则利用备用HDD4(15)开始自动重建。也就是说,从剩余的HDD4(1)至4(14)中读出的数据中,利用李德-所罗门代码恢复在HDD4(1)至4(14)中有故障的HDD中的数据,并且将被恢复的数据记录在备用HDD4(15)中(步骤S3)。
随后,正如上面解释的那样,将用来选择是否更换有故障的HDD的菜单显示在控制面板7的LCD21(图4)上以及维护终端11的显示器上(步骤S4)。然后,关于是否在控制面板7上或者在维护终端11上已经执行选择不进行更换的操作,做出判断(步骤S5)。
如果“是”,则将用于撤消步骤S1中的维护请求输出的信息输出给控制面板7和维护终端11(步骤S6)。然后结束处理。
响应于该撤销信息,在控制面板7上LED灯23返回到正常点亮状态。在维护终端11上也响应于该维护请求的撤销而撤销上述报警的显示。
当在步骤S5中回答是“否”(当已经执行了选择更换有故障的HDD的操作),进入待机直到有故障的HDD更换完成(步骤S7)。在更换完成时,处理进入到步骤S6。
当在步骤S2中回答是“否”(当故障是在两个或更多HDD中),类似于步骤S7,进入待机直到有故障的HDD的更换完成(步骤S8)。
当更换完成时,开始重建。也就是说,例如如果在两个HDD中有故障,则从HDD4(1)至4(15)中除了两个有故障的HDD外的13个HDD读出的数据中,利用李德-所罗门代码恢复在有故障的HDD中的数据,并且将被恢复的数据记录在最新更换的数据HDD中(步骤S9)。然后,处理进入到步骤S6。
下面,解释当在HDD阵列单元中的HDD4(1)至4(14)中发生了故障时保证冗余的方式,以及减小用来更换有故障的HDD的维护会话的数目的方式。当在HDD阵列单元中的一个HDD中发生了故障时,在输出维护请求之后,数据被自动地恢复(重建)到备用HDD4(15)上(图5中的步骤S1至S3)。
如上所述,在过去具有RAID级别3或级别5配置的HDD阵列单元中,在重建期间***的可靠性由于HDD冗余的损失而极大地减小。另一方面,在本实施方式的HDD阵列单元中,***(AV服务器)的可靠性由于保证了3的最小HDD冗余而被维持。此外,即使一个HDD有故障也没有必要立刻更换该HDD,因此用户可以通过操作控制面板7或维护终端11撤销维护请求(从而不进行维护)(图5中的步骤S4至S6)。
然而,当单个HDD有故障时,如果其它维护恰好在进行(如果服务技术人员在),则如果服务技术人员更换该有故障的HDD,则该维护请求被自动撤销,并且所有HDD返回到正常的状态(图5中的步骤S5,S6,S7)。
如果随后两个HDD有故障,则因为备用HDD已经在使用,因此不自动地开始重建。在这种情况下,同样在首次故障的HDD中的数据被自动地重建并记录到备用HDD,从而保证了3的冗余。
控制面板7和维护终端11被设计成,当第二HDD有故障时维护请求不能被撤销,因此要求有服务技术人员进行的维护,并且在更换HDD时数据被恢复(重建)到最新更换的HDD上,随后维护请求被自动地撤销(图5中的步骤S1,S2,S8,S9,S6)。在第二HDD有故障的时刻,通过一次更换两个直到该时刻有故障的HDD,与每次HDD故障时进行更换的情况相比维护会话的数目减少了一半。
另外,即使仅仅在一个HDD中有故障,如果恰好要进行维护(服务技术人员在现场),则通过更换该HDD(图5中的步骤S5,S7,S6),维护会话的总数目可以被进一步减小。
几乎所有目前使用的HDD具有800,000小时或更多的MTBF(平均故障间隔时间),而对于HDD阵列单元的保修期(使用周期)例如是五年或更短。在连续使用AV服务器的情况下(一天24小时以及一年365天),在五年的周期中对于HDD的预期故障率从MTBF计算大约是5.3%;当每个HDD阵列单元使用14个HDD时,预期在五年周期中一个HDD将出故障。因此,通过执行在图5中示出的处理可以实现有效的免维护操作。
注意到,在上述例子中,仅仅当故障发生在第一HDD(与现有的备用HDD同样数目)时,才可以操作控制面板7或维护终端11撤销维护请求,而不更换有故障的HDD。然而,作为另一个例子,可以将***设计成,使得直到有故障的HDD的数目达到了三个单元(此时冗余是2)、四个单元(此时冗余是1)、或五个单元(此时没有冗余)还可以撤销维护请求。在这些情况下,分别可以将维护会话的数目减小至正常数目的1/3、1/4和1/5。
此外,在上述实施方式中提供了单一的备用HDD;但是作为另一个例子,备用HDD的数目可以是两个单元(伴以9个数据HDD和4个错误校正HDD),或者备用HDD的数目可以是三个单元(伴以8个数据HDD和4个错误校正HDD)。通过这种备用HDD的数目的增加,与单一有故障HDD的情况类似,当两个或三个HDD有故障时可以进行自动的重建,使得可以进一步减小维护会话的数目。不过,因为HDD配置经常受到所要求的记录容量(数据HDD的数目)和造价的影响,在实际中备用HDD的数目常常是1。
此外,在上面的例子中安装了15个HDD;不过,为了进一步增加HDD冗余或者将备用HDD的数目增加到2或更大,可以安装大于15的HDD数目。
另外,在上面的例子中提供了10个数据HDD和4个错误校正HDD;然而,数据HDD和错误校正HDD的数目可以分别被设定为适当的复数值。
再者,在上面的例子中将本发明应用到了作为AV服务器使用的HDD阵列单元;不过,也可以将本发明应用到其它HDD阵列单元。
此外,也可以将本发明应用到不是HDD阵列单元的***中,这些***是数据存储设备,并且其中在一个单一的单元中安装了多个记录介质(例如,半导体存储器器件或者光盘)。
本领域的技术人员应该理解,根据设计要求和其它因素可以进行改动、组合、次组合以及变更,只要它们落入所附权利要求或其等价物的范围之内。

Claims (19)

1.一种数据存储设备,包括:
多个数据记录装置;
多个错误校正记录装置;
数据分配和错误校正代码产生装置,其将输入数据在所述数据记录装置中进行分配和记录,根据所述错误校正记录装置的数目从所述数据中产生错误校正代码,并将所述错误校正代码记录在所述错误校正记录装置中;以及
数据恢复装置,其利用从剩余的记录装置中读取的数据和错误校正代码,恢复在所述数据记录装置和错误校正记录装置之中发生了故障或响应延迟的记录装置中的数据。
2.根据权利要求1所述的数据存储设备,还包括:
请求输出装置,其输出用于请求更换有故障的记录装置的信息,以及
操作装置,用于选择是否更换有故障的记录装置,直到有故障的记录装置的数目与所述错误校正记录装置的最大数目相等,
其中,在所述操作装置选择不执行更换的情况下,即使有故障的记录装置没有得到更换,所述请求输出装置也暂停输出所述信息。
3.根据权利要求2所述的数据存储设备,其中,所述操作装置是所述数据存储设备的控制面板或外部终端。
4.根据权利要求3所述的数据存储设备,其中,所述控制面板包括:
显示装置,用于显示用来选择是否更换有故障的记录装置的菜单;
***灯,用于显示所述记录装置的有故障的状态;
电源灯;和
显示灯,用于显示所述记录装置的访问状态。
5.根据权利要求1所述的数据存储设备,还包括:
至少一个备用记录装置,
请求输出装置,其输出用于请求更换有故障的记录装置的信息,以及
操作装置,用于选择是否更换有故障的记录装置,直到有故障的记录装置的数目至少与所述备用记录装置的数目相等,
其中,在有故障记录装置的数目在所述备用记录装置的数目的范围之内的情况下,所述数据恢复装置在所述备用记录装置中记录所恢复的数据,以及
在所述操作装置选择不执行更换的情况下,即使有故障的记录装置没有得到更换,所述请求输出装置也停止输出所述信息。
6.根据权利要求5所述的数据存储设备,其中,所述操作装置是所述数据存储设备的控制面板或外部终端。
7.根据权利要求6所述的数据存储设备,其中,所述控制面板包括:
显示装置,用于显示用来选择是否更换有故障的记录装置的菜单;
***灯,用于显示所述记录装置的有故障的状态;
电源灯;和
显示灯,用于显示所述记录装置的访问状态。
8.一种数据存储方法,应用在包括多个数据记录装置和多个错误校正记录装置的数据存储设备中,该方法包括:
数据分配和记录步骤,将输入数据分配并记录到所述数据记录装置中;
错误校正代码产生和记录步骤,根据所述错误校正记录装置的数目从所述数据中产生错误校正代码,并将所述错误校正代码记录在所述错误校正记录装置中;以及
数据恢复步骤,利用从剩余的记录装置中读取的数据和错误校正代码,恢复在所述数据记录装置和所述错误校正记录装置之中发生了故障或响应延迟的记录装置中的数据。
9.根据权利要求8所述的数据存储设备的数据存储方法,还包括:
请求输出步骤,输出用于请求更换有故障的记录装置的信息,以及
操作步骤,用于选择是否更换有故障的记录装置,直到有故障的记录装置的数目与所述错误校正记录装置的最大数目相等,
其中,在所述操作步骤没有选择执行更换的情况下,即使有故障的记录装置没有得到更换,所述请求输出步骤也暂停输出所述信息。
10.根据权利要求9所述的数据存储设备的数据存储方法,其中,所述操作步骤是在所述数据存储设备的控制面板或外部终端上进行的操作。
11.根据权利要求10所述的数据存储设备的数据存储方法,其中,所述控制面板操作是对在该控制面板上的显示装置上菜单的操作,以便选择是否更换所述有故障的记录装置。
12.根据权利要求8所述的数据存储设备的数据存储方法,其中所述存储设备还包括至少一个备用记录装置,该方法还包括:
请求输出步骤,输出用于请求更换有故障的记录装置的信息,以及
操作步骤,选择是否更换有故障的记录装置,直到有故障的记录装置的数目至少与所述备用记录装置的数目相等,
其中,在有故障记录装置的数目在所述备用记录装置的数目的范围之内的情况下,在所述数据恢复步骤中将所恢复的数据记录到所述备用记录装置,以及
在所述操作步骤没有选择执行更换的情况下,即使有故障的记录装置没有得到更换,所述请求输出步骤也停止输出所述信息。
13.根据权利要求12所述的数据存储设备的数据存储方法,其中,所述操作步骤是所述数据存储设备的控制面板或外部终端上进行的操作。
14.根据权利要求13所述的数据存储设备的数据存储方法,其中,所述控制面板操作是对在该控制面板上的显示装置上菜单的操作,以便选择是否更换所述有故障的记录装置。
15.一种数据存储方法,应用在包括多个数据记录装置、多个错误校正记录装置和至少一个备用记录装置的数据存储设备中,该方法包括:
数据恢复步骤,利用从剩余的记录装置中读取的数据和错误校正代码,恢复在所述数据记录装置和所述错误校正记录装置之中发生了故障或响应延迟的记录装置中的数据;
请求输出步骤,输出用于请求更换有故障的记录装置的信息;
操作步骤,用于选择是否更换有故障的记录装置,直到有故障的记录装置的数目至少与所述备用记录装置的数目相等;
其中,在有故障记录装置的数目在所述备用记录装置的数目的范围之内的情况下,在所述数据恢复步骤中将所恢复的数据记录到所述备用记录装置,以及
在所述操作步骤没有选择执行更换的情况下,即使有故障的记录装置没有得到更换,所述请求输出步骤也停止输出所述信息。
16.根据权利要求15所述的数据存储设备的数据存储方法,其中,在有故障记录装置的数目在超出所述备用记录装置的数目的范围的情况下,在更换了所述有故障的记录装置之后,在所述数据恢复步骤中将所恢复的数据记录到所更换的记录装置;以及
在所述请求输出步骤中在数据恢复之后停止所述信息的输出。
17.根据权利要求15所述的数据存储设备的数据存储方法,其中,所述操作步骤是在所述数据存储设备的控制面板或外部终端上进行的操作。
18.根据权利要求17所述的数据存储设备的数据存储方法,其中,所述控制面板操作是对在该控制面板的显示装置上菜单的操作,以便选择是否更换所述有故障的记录装置。
19.一种数据存储设备,包括:
多个数据记录单元;
多个错误校正记录单元;
数据分配和错误校正代码产生单元,其将输入数据在所述数据记录单元中进行分配和记录,根据所述错误校正记录单元的数目从所述数据中产生错误校正代码,并将所述错误校正代码记录在所述错误校正记录单元中;以及
数据恢复单元,其利用从剩余的记录单元中读取的数据和错误校正代码,恢复在所述数据记录单元和错误校正记录单元之中发生了故障或响应延迟的记录单元中的数据。
CNA2005100875540A 2004-07-28 2005-07-27 数据存储设备及其数据存储方法 Pending CN1728101A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP220497/04 2004-07-28
JP2004220497A JP2006040044A (ja) 2004-07-28 2004-07-28 データ蓄積装置及びそのデータ蓄積方法

Publications (1)

Publication Number Publication Date
CN1728101A true CN1728101A (zh) 2006-02-01

Family

ID=35733786

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2005100875540A Pending CN1728101A (zh) 2004-07-28 2005-07-27 数据存储设备及其数据存储方法

Country Status (3)

Country Link
US (1) US20060026456A1 (zh)
JP (1) JP2006040044A (zh)
CN (1) CN1728101A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101840311B (zh) * 2009-12-30 2012-01-11 创新科存储技术有限公司 适用于raid***的自动修复方法以及raid***
CN102567236A (zh) * 2010-12-11 2012-07-11 鸿富锦精密工业(深圳)有限公司 家庭多媒体装置
CN106201339A (zh) * 2016-06-27 2016-12-07 浪潮(北京)电子信息产业有限公司 一种定位延迟磁盘的方法及***
CN107015890A (zh) * 2015-12-01 2017-08-04 三星电子株式会社 存储设备、具有其的服务器***以及其操作方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7877626B2 (en) * 2007-12-31 2011-01-25 Datadirect Networks, Inc. Method and system for disk storage devices rebuild in a data storage system
CN103123799A (zh) * 2011-11-18 2013-05-29 鸿富锦精密工业(深圳)有限公司 速率指示电路与硬盘背板以及电子装置

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5402428A (en) * 1989-12-25 1995-03-28 Hitachi, Ltd. Array disk subsystem
JP2743606B2 (ja) * 1991-04-11 1998-04-22 三菱電機株式会社 アレイ型記録装置
US5331646A (en) * 1992-05-08 1994-07-19 Compaq Computer Corporation Error correcting code technique for improving reliablility of a disk array
US5623595A (en) * 1994-09-26 1997-04-22 Oracle Corporation Method and apparatus for transparent, real time reconstruction of corrupted data in a redundant array data storage system
JPH09305328A (ja) * 1996-05-13 1997-11-28 Fujitsu Ltd ディスクアレイ装置
JPH1040637A (ja) * 1996-07-19 1998-02-13 Sony Corp 情報管理装置
WO1998036414A1 (fr) * 1997-02-14 1998-08-20 Sony Corporation Procede d'enregistrement/reproduction de donnees et dispositif associe
JP4499193B2 (ja) * 1997-04-07 2010-07-07 ソニー株式会社 記録再生装置及び記録再生方法
JP3745506B2 (ja) * 1997-07-12 2006-02-15 ソニー株式会社 データ処理装置及び方法
WO2004092951A2 (en) * 2003-04-18 2004-10-28 Sap Ag Managing a computer system with blades
JP4144549B2 (ja) * 2004-03-31 2008-09-03 日本電気株式会社 データ保存システムおよび該システムの制御方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101840311B (zh) * 2009-12-30 2012-01-11 创新科存储技术有限公司 适用于raid***的自动修复方法以及raid***
CN102567236A (zh) * 2010-12-11 2012-07-11 鸿富锦精密工业(深圳)有限公司 家庭多媒体装置
CN107015890A (zh) * 2015-12-01 2017-08-04 三星电子株式会社 存储设备、具有其的服务器***以及其操作方法
CN107015890B (zh) * 2015-12-01 2021-09-21 三星电子株式会社 存储设备、具有其的服务器***以及其操作方法
CN106201339A (zh) * 2016-06-27 2016-12-07 浪潮(北京)电子信息产业有限公司 一种定位延迟磁盘的方法及***
CN106201339B (zh) * 2016-06-27 2019-05-10 浪潮(北京)电子信息产业有限公司 一种定位延迟磁盘的方法及***

Also Published As

Publication number Publication date
JP2006040044A (ja) 2006-02-09
US20060026456A1 (en) 2006-02-02

Similar Documents

Publication Publication Date Title
US9104790B2 (en) Arranging data handling in a computer-implemented system in accordance with reliability ratings based on reverse predictive failure analysis in response to changes
US20140122441A1 (en) Distributed Object Storage System Comprising Performance Optimizations
US20110264949A1 (en) Disk array
CN1825269A (zh) 盘阵列设备和数据备份方法
CN103513942B (zh) 独立冗余磁盘阵列的重构方法及装置
CN103929609B (zh) 一种录像回放方法和装置
CN1728101A (zh) 数据存储设备及其数据存储方法
US7496785B2 (en) Enclosure-based raid parity assist
CN1779649A (zh) 在处理数据时检验数据完整性的装置及方法
CN102520890B (zh) 基于gpu的rs-draid***及存储设备数据控制方法
US20070220206A1 (en) RAID Overlapping
CA2715967C (en) Video media data storage system and related methods
US10448062B2 (en) Pre-fetching media content to reduce peak loads
JP2006285889A (ja) データ記憶装置、再構築制御装置、再構築制御方法、プログラム及び記憶媒体
CN102135862B (zh) 一种磁盘存储***及其数据访问方法
CN116501553A (zh) 数据恢复方法、装置、***、电子设备及存储介质
CN110895497B (zh) 一种分布式存储中降低纠删码修复的方法及装置
US7904650B2 (en) Data storage apparatus and data reading method
CN100588235C (zh) 视频信息存储装置及方法
CN104572374A (zh) 存储的处理方法、装置和存储设备
CN112015337A (zh) 基于区块链技术连接分布式nas存储设备的***
EP2130129B1 (en) System and method for increasing video server storage bandwidth
CN1177806A (zh) 数据记录/再现装置
CN112860476A (zh) 一种基于视频分层存储的近似纠删码编码方法及装置
CN111813331A (zh) 用于操作数据存储***的方法、***和非暂时性计算机可读介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication