JP2001344076A - ディスクアレイ装置 - Google Patents

ディスクアレイ装置

Info

Publication number
JP2001344076A
JP2001344076A JP2000167484A JP2000167484A JP2001344076A JP 2001344076 A JP2001344076 A JP 2001344076A JP 2000167484 A JP2000167484 A JP 2000167484A JP 2000167484 A JP2000167484 A JP 2000167484A JP 2001344076 A JP2001344076 A JP 2001344076A
Authority
JP
Japan
Prior art keywords
data
disk
control unit
memory
write
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000167484A
Other languages
English (en)
Inventor
Hirofumi Morita
浩文 森田
Takashi Ishida
崇 石田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2000167484A priority Critical patent/JP2001344076A/ja
Priority to US09/783,528 priority patent/US6816981B2/en
Publication of JP2001344076A publication Critical patent/JP2001344076A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1008Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's in individual solid state devices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1076Parity data used in redundant arrays of independent storages, e.g. in RAID systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

(57)【要約】 【課題】 データの信頼性を維持することができ、性能
低下の問題が生ずることが少ないディスクアレイ装置を
提供すること。 【解決手段】 RAID4,5のディスクアレイ装置に
おいて、ディスク縮退時、デバイス制御部2で作成した
冗長データを、バッテリバックアップされたサブシステ
ム制御部1のメモリ1aに転送し、書き込みが終了する
まではメモリ上に冗長データを保持する。そして、電源
瞬断の後の回復時、ディスクドライブ3からデータの読
み込みを行わず、メモリ1a上の書き込みデータとパリ
ティデータで書き込みを行う。また、ディスク正常時の
電源瞬断の後の回復時、書き込み対象となるデータ及び
パリティを格納するディスクドライブ以外のディスクド
ライブから冗長同一グループデータを読出し、それらと
書き込みデータから新冗長データを作成し対象ディスク
へ書き込む。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、複数のディスク装
置から構成され、ディスク故障時の修復機能を備えたデ
ィスクアレイ装置に関する。
【0002】
【従来の技術】近年、サブシステム内のコンポーネント
を多重化し冗長度をもった装置が実用化されている。こ
の装置は冗長構成と障害の極所化機能により、連続可用
性を高めディスク一台の故障時におけるデータの自動修
復機能を持つものであり、データの冗長化方法によりR
AID0〜RAID5までの6段階に分類される(RA
ID:Redundant Array of Inexpensive Disks)。図1
4(a)にRAID4のシステムの概略を示す。RAI
D4は同図に示すように、読み出し/書き込み単位に複
数に分配されたデータをそれぞれ格納する複数のデータ
用ディスクD0,D2,…と、パリティを生成する手段
Pと、パリティを格納するディスク装置DPを備え、デ
ータの修復情報にはパリティ方式を採用している。
【0003】データは同図のA0,A2,…に示すよう
に複数に分配され(一般には所定長)、分配されたデー
タA0,A2,…はそれぞれデータ用ディスクD0,D
2,…に分散して格納され、パリティは一つの専用ディ
スクDPに格納される。なお、以下の説明では、上記の
ように分配されて異なったディスクに格納されたデータ
を冗長同一グループデータ、あるいは、単に冗長グルー
プのデータと言い、これらのデータが格納されるディス
ク群を冗長グループのディスクと言う。また、パリティ
を冗長データともいう。ディスクに異常が発生した場
合、ディスク上のデータは、残りの同一グループデータ
とパリティ(冗長データ)から再生される。RAID4
は同時に複数の読み出しが可能だが、同時に複数の書き
込みはできない。また、更新時には、必ず更新前のデー
タとパリティを読み出し、更新パリティを作成後書き込
むといった余分なアクセスが必要である(これをライト
ペナルティという)。
【0004】図14(b)にRAID5のシステムの概
要を示す。RAID5は、複数に分配されたデータとパ
リティを格納する複数のディスクD1,D2,…と、パ
リティを生成する手段Pとから構成され、RAID4と
同様、データの修復情報にはパリティ方式を採用してい
る。データは、同図のA0,A1,…,B0,B1,…
に示すように複数に分配され、それぞれディスクD1,
D2,…に分散して格納される。また、データA0,A
1,…のパリティPA、データB0,B1,…のパリテ
ィPBも各ディスクディスクD1,D2,D3,…に分
散して格納される。RAID5においても、RAID4
と同様、ディスクに異常が発生した場合、ディスク上の
データは上記同一グループデータとパリティ(冗長デー
タ)から再生される。RAID5は同時に複数ディスク
の読み出し、書き込みが可能であり、更新時には、上記
ライトペナルティが発生する。また、パリティ更新中の
ディスクへは、読み出し/書き込みのアクセスができな
い。
【0005】図15は上記RAID4又は5を適用可能
なディスクアレイ装置における書き込みシーケンス例を
示す図であり、同図はRAID4の場合を示している。
同図において、101はサブシステム制御部、101a
はサブシステム制御部内のメモリ、102はサブシステ
ム内インタフェース部(以下、インタフェースをI/F
と略記する)、103はデバイス制御部、103aはバ
ッファ、104はデバイスI/F部、105はディスク
群であり、D0〜D2はデータディスク、Pは冗長デー
タを格納する冗長ディスクである。また、同図中のOD
(OldData)は更新対象データ(以下では旧デー
タともいう)、OP(OldParity)は更新対象
冗長データ(以下では、旧パリティともいう)、ND
(New Data)は書き込みデータ、NP(New
Parity)は書き込み冗長データ(以下では新パ
リティともいう)、IPは中間冗長データである。
【0006】図15に示すようなディスクアレイ装置お
いて、その書き込み動作は、以下のように行われる(図
中の(a) 〜(g) は、以下の(a) 〜(g) に対応してい
る)。 (a) 書き込みデータND1をサブシステム制御部101
のメモリ101aから、デバイス制御部103のバッフ
ァ103aへ転送する。 (b) 書き込み対象となるディスク内のデータOD1をバ
ッファ103aへ読み出す。 (c) 書き込み対象データの冗長グループの冗長データO
Pをバッファ103aへ読み出す。 (d) OD1とOPを排他的論理和演算することにより、
中間冗長データIPを生成する。 (e) ND1とIPを排他的論理和演算することにより新
冗長データNPを生成する。 (f) ND1をディスク105へ書き込む。 (g) NPをディスク105へ書き込む。 この際(a) 〜(c) 及び(e) 〜(f) 範囲内での順序は固定
されなくとも書き込み動作は実現可能とされる。
【0007】
【発明が解決しようとする課題】上記のような書き込み
動作を行うシステムにおいて停電等による瞬断が発生し
た場合のデータの信頼性の維持には以下のような方法が
考えられている。 (1)装置全体のバッテリバックアッブシステムによる
サブシステムの動作の継続。 (2)不揮発性メモリによる書き込みデータの維持 上記(1)においては装置に供給される電源が断たれた
場合においてもサブシステムの動作は継続されるためそ
のデータは保証される。上記(2)においては書き込み
データがメモリ上に残存するため電源再投入後に再度デ
ィスクへの書き込み動作を行うことで殆どの場合リカバ
リ可能である。しかしながら、上記(1)においてはサ
ブシステム全体をバックアップするためには大容量なバ
ッテリを必要とし、実装上その占める割合は非常に大き
なものとなる。また上記(2)においては電源断前に書
き込みが行われている途中でかつ冗長データが書き込み
途中であった場合で、そのRAID内が電源断前に縮退
モード(少なくとも一台のディスクが故障時)にある、
又は電源再投入後にRAID内の縮退モードに移行した
場合には、その冗長グループの冗長性は失われ、故障デ
ィスクのデータの復元又はその冗長グループのデータの
書き込みは不可能(正しく行われない)となる。このよ
うな状態はWrite Holeとも表現されている。
【0008】このような問題に対応するため、メモリ1
01a上に冗長データを常時管理し、また書き込みの進
行状況をメモリ101a上に記録しその進行状況により
その冗長データを使用してリカバリを行うようにし、上
記状態を避けることも考えられてきているが、書き込み
時に常に冗長データの転送が必要となるなどの性能低下
が問題となる。本発明は上記事情に鑑みなされたもので
あって、本発明の目的は、縮退モードであったり、電源
断の後の電源再投入時であっても、データの信頼性を維
持することができ、性能低下の問題が生ずることが少な
いディスクアレイ装置を提供することである。
【0009】
【課題を解決するための手段】図1は本発明の概要を説
明する図である。同図に示すように、本発明は、少なく
ともメモリ1aがバッテリ1bによりバックアップされ
たサブシステム制御部1と、複数のディスクからなるデ
ィスクドライブ群3と、ディスクを制御するデバイス制
御部2とを備え、ライトデータを上記複数のディスクの
それぞれに分配して書き込むとともに、該分配された複
数のデータから冗長データを生成し、該冗長データを上
記複数のディスクのうち、分配したデータを格納したデ
ィスク以外のディスクに書き込む前記RAID4,5の
ディスクアレイ装置において、以下のモードを設け、前
記正常時、ディスク縮退時、電源瞬断後の回復時の書き
込み時において、各状態に応じたモードで動作させる。 1)正常時には、更新対象データODと更新対象冗長デ
ータOPと書き込みデータNDとから新冗長データNP
を生成し、書き込みデータNDと新冗長データNPを対
象ディスクへ書き込む。 2)ディスク縮退時には、データの書き込みに際し、デ
バイス制御部で作成した冗長データNPを、バッテリバ
ックアップされたサブシステム制御部のメモリに転送す
る。そして、書き込みが終了するまではメモリ上に冗長
データNPを保持する。 3)電源瞬断の後の再書き込み時、その対象となるデー
タ及びパリティを格納するディスクドライブ以外のディ
スクドライブから冗長同一グループ内のデータODを読
出し、それらとメモリ内の書き込みデータNDから新冗
長データNPを作成し、書き込みデータNDと新冗長デ
ータNPを対象ディスクへ書き込む。 4)ディスク縮退時に、電源瞬断の後の再書き込みを行
う場合、ディスクドライブからデータの読み込みを行わ
ず、バッテリバックアップされたメモリ上の書き込みデ
ータNDとパリティデータNPで書き込みを行う。 以上のように、本発明においては、縮退モードのとき、
冗長データNPを電源バックアップされたメモリ1aに
転送するようにしたので、縮退モード時における電源瞬
断後の再書き込み時にも、正しい書き込みを行うことが
できる。このため、常時、冗長データNPをメモリに転
送する必要がなく、性能劣化を最低限に抑止でき、か
つ、高い信頼性を維持することができる。また、RAI
Dグループ内の他ディスクの冗長同一グループデータO
Dと、メモリ内の書き込みデータNDから新冗長データ
NPを生成することにより、システム電源断後の電源再
投入時、ディスク上のデータが正しくない、もしくは信
用できない場合であっても、正しい書き込みを行うこと
ができる。
【0010】
【発明の実施の形態】図2に本発明が適用可能なディス
クアレイ装置の概略構成例を示す。図2は大規模なディ
スクアレイ装置に用いられる構成を示しており、11は
サブシステム制御部であり、MPU、メモリ等を含む。
12は上記サブシステム制御部11と他の制御部とを接
続するための内部I/Fであり、複数のプロセッサを有
するデバイス制御部13が接続される。デバイス制御部
13は上記サブシステム制御部11の指示に従い、ディ
スクドライブ群15を制御する制御部であり、バッファ
13a、MPU13b、デバイスI/F部14を制御す
るためのコントローラ、RAID4,5動作において必
要な排他的論理和(Exclusive OR:XOR
又はEORと記述されることもある)演算機能などを有
する。14はデバイス制御部とディスクドライブを接続
するためのデバイスI/F部であり、この構成例はシリ
アルI/Fのイメージであるが、パラレルI/Fであっ
ても良い。15はデータが格納されるディスクドライブ
群である。
【0011】図3は小規模なディスクアレイサブシステ
ムに用いられる構成を示しており、21はサブシステム
を制御するサブシステム制御部であり、サブシステム制
御部21は図2に示したデバイス制御部の機能を兼ね、
前記したメモリに加え、バッファ部21aとXOR演算
機能を有する。14,15はそれぞれ図2に示したデバ
イスI/F部、ディスクドライブ群である。図4に図2
に示す装置のハードウェア構成例を示す。同図におい
て、サブシステム制御部11はチャネルI/F部を介し
て上位装置に接続されており、サブシステム制御部11
はメモリ11a、MPU11b、バスインタフェース部
11cを備えており、上記MPU11bはメモリ11a
に格納されているプログラムに従って動作する。また、
メモリ11aには、プログラムの他に、転送データや制
御データが格納される。上記サブシステム制御部11の
少なくともメモリ11aはバッテリ11dによりバック
アップされ、電源断時にも格納されたデータ等は保持さ
れる。なお、メモリ11aをバッテリバックアップして
も長時間の電源断には対応することができないので、例
えば、図示しない特定のディスクドライブをバッテリバ
ックアップし、電源断時にメモリ11a内のユーザデー
タ及び制御情報(冗長データを含む)を上記ディスクに
書き込み、電源再投入後にメモリ上に再度展開するよう
に構成してもよい。
【0012】13はデバイス制御部であり、デバイス制
御部13は、バッファ13a、MPU13b、上記MP
U13bを動作させるプログラム等を格納したメモリ1
3c、バスインタフェース部13dを備えている。前記
したXOR演算は、例えば上記MPU13aにより実行
される。上記サブシステム制御部11とデバイス制御部
13はバスBUSを介して接続されており、前記図2に
示したサブシステム内I/F部12は、上記バスBU
S、バスインタフェース部11c、バスインタフェース
部13d等から構成され部分に対応する。デバイス制御
部13は前記したようにデバイスI/F部14を介して
ディスクドライブ群15に接続される。
【0013】次に、図2に示すディスクアレイ装置を前
述のRAID4、5を適用した場合について、本実施例
の動作を説明する。なお、以下の説明ではRAID4に
ついて説明するが、RAID5の場合についても同様に
適用することができる。また、以下の実施例では、図2
に示すシステムについて説明するが、本発明は図3のシ
ステムにも同様に適用することができる。図2、図4に
おいて、本実施例のサブシステム制御部11はディスク
ドライブ群内で構成されるRAIDの状態を正常/縮退
/データ喪失(同一グループのデータの内、2つのディ
スクのデータが読めないもしくは信用できない場合)に
区別して個々に管理し、その状態を参照してディスクド
ライブ群への書き込み命令を実行する。
【0014】また、このサブシステム制御部11はデバ
イス制御部12に書き込みを指示する際、以下のモード
を指定することができ、デバイス制御部12はそれを実
行する機能を持つ。 (1) モード1 更新対象データODと、更新対象冗長データOPを読出
し、排他的論理和をとり中間冗長データIPを生成し、
さらに、書き込みデータNDとの排他的論理和をとり、
書き込み冗長データNPを生成し、NPとNDの対象デ
ィスクへの書き込みを行う。この「モード1」は正常時
に選択され動作は前記図15で説明した通りである。 (2) モード2 デバイス制御部13がNPを作成した際、それをサブシ
ステム制御部11のメモリ11a上へ転送し、転送後に
対象ディスクへの書き込みを行う。このモード2は、後
述するようにディスク縮退状態の書き込み時に選択され
る。
【0015】(3) モード3 OD、OPをディスクから読み出すことなく、冗長同一
グループの他のディスク内の上記ODと同一のアドレス
からデータを読出しそれらとメモリ上のNDからNPを
生成し、対象ディスクへの書き込みを行う。このモード
3は、後述するように、ディスクが縮退状態でないと
き、書き込み中に予期しない電源断が生じ、電源再投入
後にサブシステム制御部11のメモリ11aに未書き込
みデータが存在している場合の再書き込み時に選択され
る。 (4) モード4 OD、OPをディスクから読み出すことなく、メモリ上
にあるNPとNDの対象ディスクへの書き込みを行う。
このモード4は、後述するようにディスク縮退時、書き
込み中に予期しない電源断が生じ、電源再投入後にサブ
システム制御部11のメモリ11aに未書き込みデータ
が存在している場合の再書き込み時に選択される。
【0016】上記モードの切り替えは次のように行われ
る。ディスクの一台が故障し、デバイス制御部13から
サブシステム制御部11が異常終了通知を受けると、サ
ブシステム制御部13は、特定ディスクへのアクセスが
不能で動作継続不可能である場合、縮退状態と認識し、
書き込み時のモードを正常モードから縮退モードに移行
する。また、サブシステム制御部11の書き込み命令に
対するデバイス制御部13からの正常応答の有無を判断
し正常応答が無いままサブシステム制御部11が装置電
源断を認識した場合、その書き込み処理を仕掛かり中と
判断し、電源再投入時に、未書き込みデータがメモリ1
1a上に存在している場合、上記モード3(ディスク正
常時),モード4(ディスク縮退時)で書き込みを行
う。
【0017】図5に、上記正常時のモード(モード1)
から縮退時のモード(モード2)への移行のフローチャ
ートを示す。図5において、上位装置からRAIDへの
アクセスがあり、正常終了であれば、正常モードのまま
次のRAIDへのアクセスを待つ。正常終了でない場合
には、特定ディスクへのアクセスが不能であるのかを調
べる。特定ディスクへのアクセスが不能である場合に
は、縮退モードに移行する。また、特定ディスクへのア
クセスが不能でない場合には、リトライを行い、正常終
了すれば正常モードのまま、次のRAIDへのアクセス
を待つ。正常終了しない場合には、所定回数に達するま
でリトライを行い、所定回数に達すると、エラー処理を
行う。
【0018】次に、本実施例のディスクアレイシステム
の動作について説明する。 (1)正常時 対象となるRAIDが正常な状態ではサブシステム制御
部は、前記「モード1」での書き込み動作をデバイス動
作に対し指示を行う。この場合の動作は、図15で説明
したのと同じである。図6に、正常時における通常の書
き込み動作のフローチャートを示す。同図において、ま
ず、書き込みデータND1をメモリ11aに保持したま
ま、バッファ13aに転送する(ステップS1)。つい
で、書き込み対象となっている旧データ(更新対象デー
タ)OD1をディスク15からバッファ13aに読み込
む(ステップS2)。次に、書き込み対象の冗長データ
(更新対象冗長データ)OPをディスク15からバッフ
ァ13aへ読み込む(ステップS3)。
【0019】そして、OD1とOPの排他的論理和(X
OR)を演算し、中間パリティ(中間冗長データ)IP
を作成し(ステップS4)、さらに、ND1とIPの排
他的論理和(XOR)を演算し、新パリティ(書き込み
冗長データ)NPを作成する(ステップS5)。以上の
ようにして新パリティNPが作成されたら、書き込みデ
ータND1、新パリティNPのディスク15への書き込
みを開始する(ステップS6)。そして、書き込みが終
了するまで待ち(ステップS7)、書き込みが正常終了
したらメモリ11a上のND1を削除して(ステップS
9)処理を終了する。また、書き込みが正常終了しなか
った場合には、ステップS8からステップS10に行
き、リトライ回数が所定回数になったかを調べ、所定回
数になっていなければ、ステップS6に戻り、書き込み
をリトライする。そして、所定回数リトライしても正常
終了しない場合にはエラー処理を行う(ステップS1
1)。
【0020】(2)ディスクドライブ群のあるディスク
ドライブに異常が発生した場合(ディスク縮退時) ディスクドライブ群のあるディスクドライブに何らかの
異常が発生した場合は図7に示すように動作する。サブ
システム制御部11からの読出し/書き込み又はその他
のディスクアクセス系のコマンドに対し、ディスクドラ
イブ群15のあるディスクドライブ(例えば図7におけ
るディスクD1)に何らかの異常が発生した場合、デバ
イス制御部13はサブシステム制御部11へ、異常終了
通知を行う(図7の(a) )。通知を受けたサブシステム
制御部11は、その内容を判断してディスクの故障によ
る動作継続不可能である場合、内部の構成変更情報の変
更(RAID状態を縮退状態に変更する)を行い(図7
の(b) )、そのディスクドライブを切り離す命令を出し
(図7の(c) )、縮退モードに移行する。
【0021】この縮退モードにあるRAIDに対する書
き込み動作を図8のフローチャートにより説明する。書
き込みデータND2をサブシステム制御部11のメモリ
11aに保持したまま、書き込みデータND2を、デバ
イス制御部13のバッファ13aに転送する(ステップ
S1)。ついで、ND2が故障したディスクに書き込む
データであるかを調べ(ステップS2)、故障ディスク
に書き込むデータでない場合には、書き込み対象となっ
ている旧データ(更新対象データ)OD2をディスク1
5からバッファ13aに読み込み(ステップS3)、更
新対象冗長データ(OP)をディスク15からバッファ
13aに読み込む(ステップS4)。ついで、旧データ
OD2と更新対象冗長データOPの排他的論理和(XO
R)を作成しIPとし(ステップS5)、書き込みデー
タND2とIPの排他的論理和(XOR)を作成しNP
とする(ステップS6)。
【0022】また、ND2が故障したディスクに書き込
むデータである場合には、更新対象データOD2の冗長
同一グループデータOD0、OD1をディスク15から
読み込み(ステップS7)、OD0とOD1と書き込み
データND2との排他的論理和を求めて新パリティNP
とする(ステップS8)。上記のようにして新パリティ
NPが作成されたら、NPをサブシステム制御部11の
メモリ11aに転送する(ステップS9)。ついで、正
常終了するまで待ち、書き込みデータND2、新パリテ
ィNPのディスク15への書き込みを開始する(ステッ
プS10,S11)。そして、書き込みが終了するまで
待ち(ステップS12)、書き込みが正常終了したらメ
モリ11a上のND2を削除して処理を終了する(ステ
ップS14)。また、書き込みが正常終了しなかった場
合には、ステップS13からステップS15に行き、リ
トライ回数が所定回数になったかを調べ、所定回数にな
っていなければ、ステップS11に戻り、書き込みをリ
トライする。そして、所定回数リトライしても正常終了
しない場合にはエラー処理を行う(ステップS16)。
以上のように、ディスク縮退時には、作成した新冗長デ
ータNPをサブシステム制御部11のメモリ11aに転
送し保持する(前記モード2の動作)。
【0023】図9に、上記した書き込みデータND2が
故障したディスクに書き込むデータでない場合の動作シ
ーケンス例を示す。サブシステム制御部11は書き込み
動作をデバイス制御部13に指示する前に該当するRA
IDの状態を確認する。この場合、その書き込み対象と
なるRAIDの状態は縮退とされているのでサブシステ
ム制御部11はデバイス制御部13に対して次のように
書き込みを指示する。 (a) 書き込みデータND2をメモリ11aに保持したま
ま、メモリ11aからバッファ13aへ転送する。 (b) 書き込み対象となるディスク内の旧データOD2を
バッファ13aへ読み出す。 (c) 書き込み対象部分が属する冗長グループの冗長デー
タOPをバッファ13aへ読み出す。 (d) OD2とOPをXOR演算することにより、中間冗
長データIPを生成する。 (e) ND2とIPをXOR演算することにより新冗長デ
ータNPを生成する。 (f) NPをサブシステム制御部11のメモリ11aに書
き込む。 (g) ND2,NPをディスク15へ書き込み、メモリ1
1a上のND2を削除する。
【0024】図10に上記した書き込みデータND2が
故障したディスクに書き込むデータの場合の動作シーケ
ンス例を示す。 (a) 書き込みデータND2をメモリ11aに保持したま
ま、メモリ11aからバッファ部13aへ転送する。 (b) (c) OD2、OPをディスクから読み出すことな
く、冗長グループの他のディスク内の旧データOD0,
OD1をバッファ部13aへ読み出す。 (d) OD0,OD1,ND2をXOR演算することによ
り、新冗長データNPを生成する(中間冗長データIP
の作成については同図では省略されている。以下同様に
IPの作成についての説明は省略する)。 (e) NPをサブシステム制御部11のメモリ11aに書
き込む。 (f) ND2,NPを書き込み対象ディスク15へ書き込
み、メモリ11a上のND2を削除する。
【0025】(3)電源断後の回復時の動作 次に、書き込み動作中に瞬断等による予期せぬ電源断の
場合を考える。前記「モード1(正常時のモード)」
で、書き込み動作中に予期せぬ電源断が生じた際、サブ
システム制御部11のメモリ11aの電源のみがバック
アップされているとした場合、ディスクドライブ群15
への対象ディスクに対する書き込みは中断される。すな
わち、サブシステム制御部11の書き込み命令に対する
デバイス制御部からの正常応答の有無を判断し正常応答
が無いままサブシステム制御部11が装置電源断を認識
した場合、その書き込み処理を仕掛かり中と判断し、対
象ディスクに対する書き込みは中断される。その後、電
源が再投入された後にメモリ11a上に未書き込みのデ
ータが存在している場合には書き込みは再試行される。
ここで、ディスク縮退状態でない場合(正常時)であっ
ても、再度「モード1(正常時のモード)」で書き込み
を行った場合、電源前の書き込みは中断しているため旧
データOD(更新対象データ)の読み込み時のデータは
正しくない可能性があり使用することはできない。そこ
で電源投入時に未書き込みのデータが存在している場
合、サブシステム制御部11は前記「モード3」で書き
込みを行うようにデバイス制御部13に指示を出す。
【0026】また、ディスクが縮退状態にあるとき、そ
の書き込みは前記「モード2」で行われる。「モード
2」で書き込み動作中に、予期せぬ電源断が生じた場
合、サブシステム制御部11のみ電源がバックアップさ
れているとした場合、前記したようにディスクドライブ
15のそのディスクに対する書き込みは中断される。そ
の後、電源が再投入された後にメモリ11a上に未書き
込みのデータが存在している場合には書き込みは再試行
されるが、このとき再度「モード2」で書き込みを行っ
た場合、電源前の書き込みは中断しているため、更新対
象データ(旧データ)ODの読み込み時のデータは正し
くない可能性があり使用することはできない。さらに、
前記「モード3」で書き込みを再試行した場合、そのR
AIDはすでに縮退状態にあるためParityの生成
は不可能となる。しかし、瞬断前の書き込みは前記「モ
ード2」で行われているためメモリ内に未書き込みの新
冗長データNPが保持されている。そこで電源投入時に
メモリ11a内に未書き込みのデータおよび未書き込み
のNPが存在している場合には、サブシステム制御部1
1は前記「モード4」で書き込みを行うようデバイス制
御部13に指示を出す。
【0027】上記電源瞬断後の回復時の書き込み動作に
ついて、図11のフローチャートにより説明する。電源
瞬断後の回復時、メモリ11a上に書き込みデータND
2が登録されているかを調べ(ステップS1)、登録さ
れていない場合には処理を終了する。また、登録されて
いる場合には、ND2の属する冗長グループが縮退モー
ドになっているかを調べる(ステップS2)。縮退モー
ドになっていない場合には、書き込み対象となっている
更新対象データOD2と冗長同一グループのデータOD
0、OD1をディスク15からバッファ13aに読み込
む(ステップS3)。また、メモリ11aからバッファ
13aに書き込みデータND2を転送する(ステップS
4)。ついで、上記OD0とOD1と書き込みデータN
D2の排他的論理和(XOR)を作成し、新冗長データ
NPとする(ステップS5)。一方、縮退モードの場合
には、ステップS6において、メモリ11a上に新冗長
データNPが保持されているかを調べ、保持されている
場合には、書き込みデータND2、NPをバッファ13
aに転送する。また、保持されていない場合にはステッ
プS3に行く。ついで、書き込みデータND2、新パリ
ティNPのディスク15への書き込みを開始する(ステ
ップS8)。
【0028】そして、書き込みが終了するまで待ち(ス
テップS9)、書き込みが正常終了したらメモリ11a
上のND2を削除して処理を終了する(ステップS1
0,S11)。また、書き込みが正常終了しなかった場
合には、ステップS10からステップS12に行き、リ
トライ回数が所定回数になったかを調べ、所定回数にな
っていなければ、ステップS8に戻り、書き込みをリト
ライする。そして、所定回数リトライしても正常終了し
ない場合にはエラー処理を行う(ステップS13)。
【0029】図12に縮退状モードでない場合における
電源瞬断後の回復時の書き込み動作シーケンス例を示
す。 (a) 書き込みデータND2をメモリ11aからバッファ
部13aへ転送する。 (b) (c) 冗長グループ内のOD2と同一のアドレスから
冗長同一グループのデータOD0,OD1をバッファ部
13aへ読み出す。 (d) 上記冗長同一グループデータOD0、OD1、ND
2をXOR演算し、新冗長データNPを作成する。 (e) ND2,NPをディスクへ書き込む。
【0030】図13に縮退モードにおける電源瞬断後の
回復時の書き込み動作シーケンス例を示す。 (a) 書き込みデータNDをメモリ11aからバッファ部
13aへ転送する。 (b) NPをメモリ11aからバッファ部13aへ転送す
る。 (c) NDをディスクへ書き込む。 (d) NPをディスクへ書き込みむ。
【0031】
【発明の効果】以上説明したように、本発明をRAID
4,5が適用可能なディスクアレイ装置に適用すること
により以下の効果を得ることができる。 (1)縮退モードのときに冗長データを電源バックアッ
プされたメモリに転送するようにしたので、従来例のよ
うに常時、冗長データをメモリに転送する場合と比べ、
性能劣化を最低限に抑止でき、かつ、高い信頼性を維持
することができる。 (2)縮退モードにおいて、システム電源断後の電源再
投入時の書き込み動作時にメモリ上の冗長データを使用
することでディスク上への冗長データの書き込み途中で
有る無いに関わらず正しい書き込みを行うことができ
る。 (3)RAIDグループ内の他ディスクの同一グループ
データと、メモリ内の書き込みデータから新冗長データ
を生成することにより、縮退時、あるいは、ディスク上
のデータが書き込み途中で有る無いに関わらず正しい冗
長データを作成することができる。 特に、ディスク正常時のシステム電源断後の電源再投入
時に、RAIDグループ内の他ディスクの同一グループ
データと、メモリ内の書き込みデータから新冗長データ
を生成することにより、ディスク上のデータが正しくな
い、もしくは信用できない場合であっても、正しい書き
込みを行うことができる。
【図面の簡単な説明】
【図1】本発明の概要を説明する図である。
【図2】本発明が適用可能なディスクアレイ装置の概略
構成例を示す図(1)である。
【図3】本発明が適用可能なディスクアレイ装置の概略
構成例を示す図(2)である。
【図4】本発明の実施例のハードウェア構成例を示す図
である。
【図5】縮退モードの設定処理のフローチャートであ
る。
【図6】正常時における書き込み動作のフローチャート
である。
【図7】ディスクドライブ群のあるディスクドライブに
何らかの異常が発生した場合の動作を説明する図であ
る。
【図8】縮退モードのときの書き込み動作を示すフロー
チャートである。
【図9】縮退モードの書き込み動作シーケンス例(1)
を示す図である。
【図10】縮退モードの書き込み動作シーケンス例
(2)を示す図である。
【図11】電源瞬断後の回復時の書き込み動作を示すフ
ローチャートである。
【図12】電源瞬断後の回復時の書き込み動作シーケン
ス例(縮退モードでないとき)を示す図である。
【図13】電源瞬断後の回復時の書き込み動作シーケン
ス例(縮退モード時)を示す図である。
【図14】RAID4,5を説明する図である。
【図15】ディスクアレイ装置における書き込み動作シ
ーケンス例を示す図である。
【符号の説明】
1 サブシステム制御部 1a メモリ 1b バッテリ 2 デバイス制御部 3 ディスクドライブ群 11 サブシステム制御部 11a メモリ 11b MPU 12 サブシステム内インタフェース部 13 デバイス制御部 13a バッファ 13b MPU 14 デバイスインタフェース部 15 ディスクドライブ群
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G11B 20/18 570 G11B 20/18 570Z 572 572B 572F 576 576Z Fターム(参考) 5B018 GA02 KA15 KA21 LA06 MA14 QA05 QA06 5B065 BA01 CA11 CA30 CC08 CE12 EA02 EA23 EA24 5D044 BC01 CC04 DE68 DE94 HH07 HH17

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 少なくともメモリがバッテリバックアッ
    プされたサブシステム制御部と、 複数のディスクと、該ディスクを制御するデバイス制御
    部とを備え、 ライトデータを上記複数のディスクのそれぞれに分配し
    て書き込むとともに、該分配された複数のデータから冗
    長データを生成し、該冗長データを上記複数のディスク
    のうち、分配したデータを格納したディスク以外のディ
    スクに書き込むディスクアレイ装置であって、 上記ディスクへデータを書き込む際、上記サブシステム
    制御部のメモリ上に書き込みデータを、書き込み処理が
    終了まで保持するとともに、上記複数のディスクの内の
    1乃至複数のディスクが故障したディスク縮退時には、
    デバイス制御部内のバッファに存在する冗長データをサ
    ブシステム制御部のメモリに転送して保持することを特
    徴とするディスクアレイ装置。
  2. 【請求項2】 ディスク縮退時に上記ディスクへデータ
    を書き込む際、書き込み対象となるディスクが故障して
    いる場合、ディスクへの書き込みデータと、正常動作し
    ているディスク上の冗長同一グループのデータとから冗
    長データを生成し、該冗長データを上記サブシステム制
    御部のメモリに転送することを特徴とする請求項1のデ
    ィスクアレイ装置。
  3. 【請求項3】 電源投入に際し、サブシステム制御部の
    メモリ中に保持された冗長データを使用して書き込み動
    作を行うことを特徴とする請求項1または請求項2のデ
    ィスクアレイ装置。
  4. 【請求項4】 電源投入に際し、書き込み対象ディスク
    以外のディスクに格納された冗長同一グループのデータ
    を用いて冗長データを生成することを特徴とする請求項
    1または請求項2のディスクアレイ装置。
  5. 【請求項5】 電源再投入時に、サブシステム制御部の
    メモリ内に未書き込みデータが存在するとき、請求項3
    または請求項4の書き込み動作を行うことを特徴とする
    ディスクアレイ装置。
JP2000167484A 2000-06-05 2000-06-05 ディスクアレイ装置 Pending JP2001344076A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2000167484A JP2001344076A (ja) 2000-06-05 2000-06-05 ディスクアレイ装置
US09/783,528 US6816981B2 (en) 2000-06-05 2001-02-15 Disk array device including a memory with backup power supply and method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000167484A JP2001344076A (ja) 2000-06-05 2000-06-05 ディスクアレイ装置

Publications (1)

Publication Number Publication Date
JP2001344076A true JP2001344076A (ja) 2001-12-14

Family

ID=18670634

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000167484A Pending JP2001344076A (ja) 2000-06-05 2000-06-05 ディスクアレイ装置

Country Status (2)

Country Link
US (1) US6816981B2 (ja)
JP (1) JP2001344076A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008052752A (ja) * 2007-10-26 2008-03-06 Hitachi Ltd 記憶装置システム
US7370148B2 (en) 2005-03-14 2008-05-06 Fujitsu Limited Storage system, control method thereof, and program
US7925830B2 (en) 2003-02-17 2011-04-12 Hitachi, Ltd. Storage system for holding a remaining available lifetime of a logical storage region
JP2012522292A (ja) * 2009-03-27 2012-09-20 サンドフォース インク. 記憶装置システムの論理ブロックアドレス割り当て解除管理およびデータハードニング

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7103653B2 (en) * 2000-06-05 2006-09-05 Fujitsu Limited Storage area network management system, method, and computer-readable medium
EP1361516A3 (en) * 2002-04-30 2011-05-18 Hitachi, Ltd. Method and system for backing up power supply of disk array device
US6922752B2 (en) * 2002-08-23 2005-07-26 Hewlett-Packard Development Company, L.P. Storage system using fast storage devices for storing redundant data
JP2005115771A (ja) * 2003-10-09 2005-04-28 Hitachi Ltd ディスクアレイ装置
JP4391192B2 (ja) 2003-10-09 2009-12-24 株式会社日立製作所 ディスクアレイ装置
JP4497918B2 (ja) 2003-12-25 2010-07-07 株式会社日立製作所 ストレージシステム
JP2005346321A (ja) 2004-06-02 2005-12-15 Hitachi Ltd ディスクアレイ装置及びディスクアレイ装置のバッテリ出力制御方法
KR101091910B1 (ko) * 2005-12-29 2011-12-08 삼성테크윈 주식회사 실시간 전송 프로토콜을 사용하는 비디오 서버의 제어 방법및 그 기록 매체
US8392400B1 (en) 2005-12-29 2013-03-05 Amazon Technologies, Inc. Method and apparatus for stress management in a searchable data service
JP2007188421A (ja) * 2006-01-16 2007-07-26 Fujitsu Ltd 電源供給制御装置および電源供給制御方法
US8024520B2 (en) * 2007-09-21 2011-09-20 Hewlett-Packard Development Company, L.P. Maintaining data stored in a memory module when transferring the memory module from a first controller to a second controller
JP5207988B2 (ja) * 2009-01-07 2013-06-12 キヤノン株式会社 情報処理装置、情報処理装置の制御方法、プログラム、及び記憶媒体
US8938641B2 (en) * 2012-09-27 2015-01-20 Intel Corporation Method and apparatus for synchronizing storage volumes
CN104866386B (zh) * 2015-05-31 2018-04-27 上海交通大学 具有最优更新代价的编码及解码方法
TWI564716B (zh) * 2015-10-08 2017-01-01 光寶電子(廣州)有限公司 固態儲存裝置及其相關資料寫入方法
CN106569730B (zh) * 2015-10-08 2019-03-22 光宝电子(广州)有限公司 固态储存装置及其相关资料写入方法
CN109725824A (zh) * 2017-10-27 2019-05-07 伊姆西Ip控股有限责任公司 用于向存储***中的盘阵列写入数据的方法和设备
CN110058791B (zh) * 2018-01-18 2022-05-10 伊姆西Ip控股有限责任公司 存储***以及相应的方法和计算机可读介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0664838B2 (ja) * 1988-09-02 1994-08-22 松下電器産業株式会社 光デイスクファイル装置
US5596708A (en) * 1994-04-04 1997-01-21 At&T Global Information Solutions Company Method and apparatus for the protection of write data in a disk array
US5634033A (en) * 1994-12-16 1997-05-27 At&T Global Information Solutions Company Disk array storage system architecture for parity operations simultaneous with other data operations
US5533190A (en) * 1994-12-21 1996-07-02 At&T Global Information Solutions Company Method for maintaining parity-data consistency in a disk array
WO1997001139A1 (en) * 1995-06-23 1997-01-09 Elonex Plc Disk array controller with enhanced synchronous write
US5889933A (en) * 1997-01-30 1999-03-30 Aiwa Co., Ltd. Adaptive power failure recovery

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7925830B2 (en) 2003-02-17 2011-04-12 Hitachi, Ltd. Storage system for holding a remaining available lifetime of a logical storage region
US8370572B2 (en) 2003-02-17 2013-02-05 Hitachi, Ltd. Storage system for holding a remaining available lifetime of a logical storage region
US7370148B2 (en) 2005-03-14 2008-05-06 Fujitsu Limited Storage system, control method thereof, and program
JP2008052752A (ja) * 2007-10-26 2008-03-06 Hitachi Ltd 記憶装置システム
JP4685079B2 (ja) * 2007-10-26 2011-05-18 株式会社日立製作所 記憶装置システム
JP2012522292A (ja) * 2009-03-27 2012-09-20 サンドフォース インク. 記憶装置システムの論理ブロックアドレス割り当て解除管理およびデータハードニング
JP2014078257A (ja) * 2009-03-27 2014-05-01 Lsi Corp 記憶装置システムの論理ブロックアドレス割り当て解除管理およびデータハードニング

Also Published As

Publication number Publication date
US20010049799A1 (en) 2001-12-06
US6816981B2 (en) 2004-11-09

Similar Documents

Publication Publication Date Title
JP2001344076A (ja) ディスクアレイ装置
US6990611B2 (en) Recovering data from arrays of storage devices after certain failures
JP3618529B2 (ja) ディスクアレイ装置
JP2603757B2 (ja) アレ−ディスク装置の制御方法
JP4815825B2 (ja) ディスクアレイ装置及びその再構築方法
JP3058743B2 (ja) ディスクアレイ制御装置
JP4472995B2 (ja) 増分不一致を使用するミラーコピーの生成方法
EP0521924B1 (en) Methods and apparatus for assigning signatures to members of a set of mass storage devices
US6606683B2 (en) Information recording apparatus and control method thereof
JP2002108573A (ja) ディスクアレイ装置、そのエラー制御方法、ならびにその制御プログラムを記録した記録媒体
JP2013041455A (ja) ストレージシステム、ストレージ制御装置およびストレージ制御方法
US20060190683A1 (en) Disk array apparatus and backup method of data
WO2002091111A2 (en) Parity mirroring between controllers in an active-active controller pair
JP2000056935A (ja) ディスクアレイ装置の制御方法及びディスクアレイ装置
US7620786B2 (en) Storage recovery using a delta log
JP4248164B2 (ja) ディスクアレイのエラー回復方法、ディスクアレイ制御装置及びディスクアレイ装置
JP2010026812A (ja) 磁気ディスク装置
JPH06119126A (ja) ディスクアレイ装置
JP3790756B2 (ja) ディスクアレイ装置、ディスク制御装置及びディスクアレイのデータ障害を復旧する方法
JPH07306758A (ja) ディスクアレイ装置及びその制御方法
JP5598124B2 (ja) データ記録再生装置、データ記録方法、及び、データ記録プログラム
JP2830840B2 (ja) ディスクアレイ修復処理方式及び方法
JP2000039970A (ja) ディスクアレイシステムの二重障害防止制御方式
JP2004102815A (ja) 論理ディスク間データコピー方法、論理ディスク間データコピー用プログラム、及びディスクコントローラ
JPH11154058A (ja) ディスクアレイ装置及びデータ保守方法

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20030708

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060616