JP2006227964A

JP2006227964A - ストレージシステム、処理方法及びプログラム

Info

Publication number: JP2006227964A
Application number: JP2005041688A
Authority: JP
Inventors: Yasuo Noguchi; 泰生野口; Kazutaka Ogiwara; 一隆荻原; Seiji Toda; 誠二戸田; Mitsuhiko Ota; 光彦太田; Riichiro Take; 理一郎武
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2005-02-18
Filing date: 2005-02-18
Publication date: 2006-08-31
Also published as: US20060190682A1

Abstract

【課題】ＲＡＩＤ装置間でミラー化した場合のＲＡＩＤ装置内で復旧可能な障害に対し復旧のための入出力回数を低減して修復時間を短縮する。
【解決手段】ストレージシステムは、複数のＲＡＩＤ装置をネットワークに接続し、ＲＡＩＤ装置間でデータをプライマリデータとセカンダリデータにミラーリングして多重化する。ＲＡＩＤ構成により装置内で復旧可能なディスク装置の障害が発生すると、ミラーリング先のＲＡＩＤ装置に障害ディスク装置に対応したディスク装置のデータを要求し、転送されたデータをスペアディスク装置に書き込んで復旧させる。データ修復時には、プライマリデータの入出力について、ＲＡＩＤ構成ディスク装置群のアクセス権と個別デバイス装置のアクセス権とを排他制御する。
【選択図】図１

Description

本発明は、ネットワークに接続した複数のＲＡＩＤ装置をミラーリングして多重化したストレージシステム、処理方法及びプログラムに関し、特に、ＲＡＩＤ装置内のデバイス障害により縮退状態になった際に効率的な復旧処理を行うストレージシステム、処理方法及びプログラムに関する。

従来、電子文書や観測データやログなどのテラオーダとなる大規模な蓄積するデータを常時アクセス可能な媒体に蓄積して高速に参照できることが、ビジネスプロセスの改善やセキュリティの要求から望まれている。

このようなデータを格納するには大容量で長期保存に耐える安価なストレージシステムが必要である。これを実現するために複数のＲＡＩＤ装置をネットワークで接続し、仮想ストレージシステムとして利用することが行なわれている。

大規模なストレージシステムではＲＡＩＤ装置単体の信頼性では不十分なため、ＲＡＩＤ装置内の冗長性に加えて、ネットワークを介してＲＡＩＤ間でミラーリングを行ない、ＲＡＩＤ装置間での冗長化を行なっている。

図１５（Ａ）は従来のＲＡＩＤ多重化システムであり、ネットワーク１００に対しパーソナルコンピュータ１０２〜１〜１０２−４を介してＲＡＩＤ装置１０４−１〜１０４−４を接続している。ＲＡＩＤ装置１０４−１〜１０４−４のそれぞれは、図１６のＲＡＩＤ装置１０４−１のように、ＲＡＩＤコントローラ１０６に対し複数のストレージデバイスとしてディスク装置１０８−１〜１０８−４を接続してデータＤ１〜Ｄ３とパリティＰを格納して例えばＲＡＩＤ４を構成している。なお、ＲＡＩＤ４はパリティＰを固定したディスク装置に格納している。なお、１１２はスペアディスク装置である。

図１５（Ａ）のＲＡＩＤ装置間のミラーリングは、例えばＲＡＩＤ装置１０４−１にプライマリデータＡを格納すると、このミラー先としてＲＡＩＤ装置１０４−３に同じ内容のセカンダリデータＡを格納している。またＲＡＩＤ装置１０４−２，１０４−４でミラー化し、プライマリデータＢとセカンダリデータＢを格納している。

ＲＡＩＤ装置間でミラーリングしたストレージシステムにおいて、例えば図１５（Ｂ）のように、ＲＡＩＤ装置１０４−２でノード障害を起した場合には、修復後にミラーリング先となるＲＡＩＤ装置１０４−４のセカンダリデータＢをネットワーク１００を経由して書き込むことで復旧させることができる。

図１７（Ａ）は、ＲＡＩＤ装置間でミラーリングした別のストレージシステムであり、ＲＡＩＤ装置１０４−１〜１０４−４の各々の記憶領域を管理単位に分割し、管理単位ごとに異なるＲＡＩＤ装置にミラーリングしている。例えばＲＡＩＤ装置１０４−４には管理単位でプライマリデータＡが格納され、これに対応してミラー先となるＲＡＩＤ装置１０４−２に同じ内容のセカンダリデータＡを格納している。

このようなストレージシステムにおいて、例えば図１７（Ｂ）のように、ＲＡＩＤ装置１０４−２がノード障害を起した場合、障害で失われたセカンダリデータＡについては、ミラー先のＲＡＩＤ装置１０４−１からネットワーク経由で読み出してＲＡＩＤ装置１０４−３の空き領域にコピーデータＡとして書き込んで復旧し、また障害で失われたセカンダリデータＣについては、ミラー先のＲＡＩＤ装置１０４−４からネットワーク経由で読み出してＲＡＩＤ装置１０４−１の空き領域にコピーデータＣとして書き込んで復旧する。

一方、ＲＡＩＤ装置内で障害復旧可能な場合は、ネットワーク経由のデータコピーは行なわず、ＲＡＩＤ装置固有の障害復旧を行なう。図１８はＲＡＩＤ装置１０４−１のディスク装置１０８−２が故障して縮退した場合であり、ＲＡＩＤ４を例にとっていることから、正常なディスク装置１０８−１，１０８−３，１０８−４からデータＤ１，Ｄ３及びパリティＰをＲＡＩＤコントローラ１０６で読出して排他論理和１１０を取ることで喪失したデータＤ１を復元してスペアディスク装置１１２に書込み、書込みの済んだスペアディスク装置１１２を故障したディスク装置１０８−２に置き換えるＲＡＩＤ構成の変更で復旧させている。
特開２００２−１０８５７１号公報

しかしながら、このような従来のＲＡＩＤ装置間でミラー化したストレージシステムにあっては、ＲＡＩＤ構成デバイスの１つが故障するといった装置内で復旧可能な障害に対しては、図１８に示したように、装置内でＲＡＩＤの冗長性を活用して喪失したデータを復旧しているが、この復旧処理はデータの入出力回数が多くなるため処理に時間がかかり、その間、ユーザによるデータアクセスが遅延するなどの影響を受ける。

即ち図１８の場合には、ディスク装置１０８−１，１０８−３，１０８−４についての３回のリード、１回の排他論理和計算、更にスペアディスク装置１１２に対する１回のライトを必要とし、入出力回数が多くなる。この入出力回数は、ＲＡＩＤを構成するディスク装置が増加すると更に増加する。同様な問題はパリティを分散させるＲＡＩＤ５でも生ずる。

本発明は、ＲＡＩＤ装置間でミラー化した場合のＲＡＩＤ装置内で復旧可能な障害に対し復旧のための入出力回数を低減して修復時間を短縮するストレージシステム、処理方法及びプログラムを提供することを目的とする。

図１は本発明の原理説明である。

本発明は、図１（Ａ）のように、複数のＲＡＩＤ装置１０をネットワーク１４に接続し、ＲＡＩＤ装置１０間でデータをプライマリデータとセカンダリデータにミラーリングして多重化したストレージシステムを対象する。

このようなストレージシステムにつき本発明は、ＲＡＩＤ装置１０の各々に、図１（Ｂ）のように、ＲＡＩＤ構成デバイス及びスペアデバイスを備えた複数のデバイス（ディスク装置１８）と、上位装置からの要求に対しプライマリデータを格納した前記ＲＡＩＤ構成デバイスを対象に要求処理を実行するＲＡＩＤ処理部（ＲＡＩＤコントローラ３８）と、ＲＡＩＤ構成により装置内で復旧可能なデバイスの障害発生時に、ミラーリング先のＲＡＩＤ装置に障害デバイスに対応したデバイスのデータを要求し、転送されたデータをスペアデバイスに書き込んで復旧させるコピー要求処理部２８と、障害先のＲＡＩＤ装置からデータ要求を受けた際に、対象デバイスのデータを読出して要求元に転送するコピー応答処理部３０と、ＲＡＩＤ構成デバイスのアクセス権と個別デバイスのアクセス権とを排他制御する排他機構３６とを設けたことを特徴とする。

ここで、コピー要求処理部は、障害デバイスがプライマリデータを格納していた場合、ミラーリング先のＲＡＩＤ装置にセカンダリデータを要求し、転送されたセカンダリデータをスペアデバイスに書き込んで復旧させ、コピー応答処理部は、障害先のＲＡＩＤ装置からセカンダリデータ要求を受けた際に、対象デバイスのセカンダリデータを読出して要求元に転送する。

この場合、排他機構は、コピー要求処理部のセカンダリデータ要求に先立ってスペアデバイスに対する排他アクセス権を取得し、転送されたセカンダリデータをスペアデバイスに書き込んだ後に排他アクセス権を開放する。

コピー要求処理部は、障害デバイスがセカンダリデータを格納していた場合、ミラーリング先のＲＡＩＤ装置にプライマリデータを要求し、転送されたプライマリデータをスペアデバイスに書き込んで復旧させた後に書込み終了を通知し、コピー応答処理部は、障害先のＲＡＩＤ装置からプライマリデータ要求を受けた際に、対象デバイスのプライマリデータを読出して要求元に転送する。

この場合、排他機構は、コピー応答処理部が障害先のＲＡＩＤ装置からプライマリデータ要求を受けた際に、アクセス対象デバイスに対する排他アクセス権を取得してプライマリデータを読み出して転送させ、転送後に障害先のＲＡＩＤ装置から書込み終了通知を受信して排他アクセス権を開放する。

ＲＡＩＤ装置は、ミラーリング先のＲＡＩＤ装置を示すミラー構成情報及びＲＡＩＤ構成デバイスの構成を示すＲＡＩＤ構成情報を保持し、コピー要求処理部はデバイス障害時にミラー構成情報からミラーリング先のＲＡＩＤ装置を検索すると共に、ＲＡＩＤ構成情報から障害デバイスに対応したデバイスを検索してデータを要求する
ＲＡＩＤ装置は装置全体でミラーリングしてデータを多重化する。ＲＡＩＤ装置は管理単位ごとにミラーリング先を変えてデータを多重化しても良い。ＲＡＩＤ装置は、ネットワーク接続された計算機のクラスタで構成された各ノード装置の配下に接続される。

本発明は、複数のＲＡＩＤ装置をネットワークに接続し、ＲＡＩＤ装置間でデータをプライマリデータとセカンダリデータにミラーリングして多重化したストレージシステムの処理方法を提供する。

本発明の処理方法は、
上位装置からの要求に対しプライマリデータを格納した複数のデバイスによるＲＡＩＤ構成デバイスを対象に要求処理を実行するＲＡＩＤ処理ステップと、
ＲＡＩＤ構成により装置内で復旧可能なデバイスの障害発生時に、ミラーリング先のＲＡＩＤ装置に障害デバイスに対応したデバイスのデータを要求し、転送されたデータをスペアデバイスに書き込んで復旧させるコピー要求処理ステップと、
障害先のＲＡＩＤ装置からデータ要求を受けた際に、対象デバイスのデータを読出して要求元に転送するコピー応答処理ステップと、
前記ＲＡＩＤ構成デバイスのアクセス権と個別デバイスのアクセス権とを排他制御する排他制御ステップと、
を備えたことを特徴とする。

本発明は、複数のＲＡＩＤ装置をネットワークに接続し、前記ＲＡＩＤ装置間でデータをプライマリデータとセカンダリデータにミラーリングして多重化したプログラムの前記ＲＡＩＤ装置のコンピュータにより実行されるプログラムを提供する。

本発明のプログラムは、前記ＲＡＩＤ装置のコンピュータに、
上位装置からの要求に対しプライマリデータを格納した複数のデバイスによるＲＡＩＤ構成デバイスを対象に要求処理を実行するＲＡＩＤ処理ステップと、
ＲＡＩＤ構成により装置内で復旧可能なデバイスの障害発生時に、ミラーリング先のＲＡＩＤ装置に障害デバイスに対応したデバイスのデータを要求し、転送されたデータをスペアデバイスに書き込んで復旧させるコピー要求処理ステップと、
障害先のＲＡＩＤ装置からデータ要求を受けた際に、対象デバイスのデータを読出して要求元に転送するコピー応答処理ステップと、
ＲＡＩＤ構成デバイスのアクセス権と個別デバイスのアクセス権とを排他制御する排他制御ステップと、
を実行させることを特徴とする。

なお、本発明の処理方法及びプログラムの詳細は、本発明のストレージシステムと基本的に同じである。

本発明によれば、ＲＡＩＤ装置内でＲＡＩＤ構成の冗長性を利用して復元可能なデバイス故障について、ミラー先のＲＡＩＤ装置における障害デバイスに対応したデバイスのデータをネットワークを介して読み出してスペアデバイスに書込むことで、即ちネットワーク経由でコピーすることで、復旧のための入出力回数をミラー先のリードと障害元のライトの２回に減らし、これによって障害発生時の修復時間を短縮し、データ修復の際のユーザによるアクセスへの影響を必要最小限に抑えることができる。

またネットワーク経由のコピーにより故障デバイスのデータを修復する際に、コピーに必要な入出力の対象となるプライマリデータを格納している個別デバイスにつき排他アクセス権を獲得することで、修復中のユーザによるＲＡＩＤ構成デバイスに対する入出力処理を抑止し、アクセスの競合を確実に防止することができる。

図２は本発明によるストレージシステムのシステム構成を示したブロック図である。図２において、ＲＡＩＤ装置１０−１〜１０−４はノード装置１２−１〜１２−４を介してネットワーク１４により接続されており、ホスト１６からのユーザによる入出力要求を処理する。ノード装置１２−１〜１２−４はパーソナルコンピュータで構成され、このコンピュータ群によりクラスタシステムを構築している。

ＲＡＩＤ装置１０−１は、この例にあってはデータ用のデバイスとしてディスク装置１８−１１〜１８−１４の４台が設置され、更にスペアディスク装置２０−１を設置している。ディスク装置１８−１１〜１８−１４及びスペアディスク装置２０−１は磁気ディスク装置を使用する。磁気ディスク装置以外に光ディスク装置、半導体メモリなど適宜のデバイスを使用することができる。

残りのＲＡＩＤ装置１０−２〜１０−４についても同様にデータ用のディスク装置１８−２１〜１８−２４，１８−３１〜１８−３４，１８−４１〜１８−４４及びスペアディスク装置２０−２〜２０−４を設けている。

ＲＡＩＤ装置１０−１〜１０−４は装置間でデータをミラーリングして多重化している。ＲＡＩＤ装置間でのミラーリングによる多重化は、図１５の従来例に示したのと同じＲＡＩＤ装置全体でミラー化する構成と、図１８の従来例に示したようにＲＡＩＤ装置内における管理単位ごとにミラーリング先を変えてデータを多重化するミラー化のいずれかを採用している。

図３は図２のストレージシステムに設けているノード装置１２−１及びＲＡＩＤ装置１０−１の機能構成を示したブロック図であり、図２に示したＲＡＩＤ装置１０−１〜１０−４全体でミラー化した場合の機能構成を示している。

図３において、ノード装置１２−１にはネットワークインタフェース２２、ノードコントローラ２４及びミラー構成情報として機能する他ノード情報２６が設けられている。ノード装置１２−１としては具体的にはマイクロコンピュータを使用する。ノードコントローラ２４には本発明の障害デバイスに対するネットワークを経由したデータ修復を実行するためコピー要求処理部２８とコピー応答処理部３０が設けられている。

ＲＡＩＤ装置１０−１にはＲＡＩＤインタフェース３２、ディスクインタフェース３４、排他機構３６、ＲＡＩＤコントローラ３８及びＲＡＩＤ構成情報４０が設けられている。ＲＡＩＤ装置１０−１におけるＲＡＩＤインタフェース３２、ＲＡＩＤコントローラ３８及びＲＡＩＤ構成情報４０は、通常のＲＡＩＤ装置が備えた機能であり、これに加えて本発明にあっては新たにディスクインタフェース３４と排他機構３６の機能を設けている。

ノード装置１４−１のノードコントローラ２４に設けているコピー要求処理部２８は、ＲＡＩＤ構成をとるディスク装置１８−１１〜１８−１４のいずれかが故障した障害発生時に、ミラー構成情報としての他ノード情報２６からミラーリング先のＲＡＩＤ装置を検索し、検索したミラーリング先のＲＡＩＤ装置に対し障害デバイスに対応したデバイスのデータを要求し、この要求に対し転送されたデータをスペアディスク装置２０−１に書き込んで復旧させる。

コピー応答処理部３０は障害先のＲＡＩＤ装置からデータ要求を受けた際に、対象となるディスク装置のデータを読み出して要求元に転送する。排他機構３６はＲＡＩＤインタフェース３２によるＲＡＩＤ構成デバイスとしてのディスク装置１８−１１〜１８−１４に対する排他アクセス権とディスク装置１８−１１〜１８−１４及びスペアディスク装置２０−１の個別のディスク装置に対する排他アクセス権を排他制御する。

ここで図２に示したネットワークに接続したＲＡＩＤ装置全体でミラーリングしたストレージシステムにあっては、例えばＲＡＩＤ装置１０−１にホスト１６からの入出力によるプライマリデータを格納し、このプライマリデータに対応して予めミラー先として設定された例えばＲＡＩＤ装置１０−３に同じデータをセカンダリデータとして格納している。

このため図３のＲＡＩＤ装置１０−１における排他機構３６はディスク装置１８−１１〜１８−１４がプライマリデータを格納している場合に、ユーザによるＲＡＩＤ構成に対するアクセス権と障害ディスク修復時のコピー処理における個別ディスクに対するアクセス権とを排他制御することになる。これに対しセカンダリデータを記録したＲＡＩＤ装置、例えば図２のＲＡＩＤ装置１０−３にあっては、ホスト１６からのユーザによる入出力要求がないことからＲＡＩＤ構成のディスク装置と個別ディスク装置の入出要求を排他制御する処理は必要ない。

ＲＡＩＤ装置１０−１のＲＡＩＤ構成情報４０にあっては、ディスク装置１８−１１〜１８−１４について例えばＲＡＩＤ４を例にとると、ディスク装置１８−１１〜１８−１３がデータディスク装置であり、ディスク装置１８−１４がパリティディスク装置であり、スペアディスク装置２０−１が存在し、更にディスク装置１８−１１〜１８−１４に格納しているデータがプライマリデータであることを登録している。

ＲＡＩＤコントローラ３８はＲＡＩＤ構成情報４０に従いＲＡＩＤインタフェース３２に対するノード装置１２−１を経由したネットワークからの入出力要求を処理する。

ノード装置１２−１の他ノード情報２６にはＲＡＩＤ装置１０−１とミラーリングしたミラー先のノードアドレスが登録されている。ここで他ノード情報２６としてはノードコントローラ２４がネットワークインタフェース２２を経由して他ノードのノードコントローラにノード情報を問い合わせるインタフェースであってもよい。この点はＲＡＩＤ構成情報４０についても同様であり、ノードコントローラ２４がＲＡＩＤコントローラ３８にＲＡＩＤ構成情報を問い合わせるインタフェースとして実現してもよい。

図４は、ＲＡＩＤ装置全体をミラーリングしている場合の本発明のストレージシステムにおける障害発生時の処理を示した説明図である。図４において、ＲＡＩＤ装置１０−１のディスク装置１８−１２が故障などの障害を起こしたとすると、図３のＲＡＤＩ装置１０−１に設けているＲＡＩＤコントローラ３８がディスク装置１８−１２の障害を検出してＲＡＩＤ構成情報４０に記録し、さらにノードコントローラ２４に障害発生を通知する。

ＲＡＩＤ装置１０−１からの障害通知を受けてノード装置１２−１のノードコントローラ２４はコピー要求処理部２８を起動し、他ノード情報２６の参照によりミラー先のノード情報として例えばノード装置１２−３を検索し、ノード装置１２−３に対し故障ディスク装置１８−１２に対応したディスク装置１８−３２からのデータ要求を行う。

障害側ノード装置１２−１からのデータ要求に対しミラーリング先のノード装置１２−３は故障ディスク装置１８−１２に対応して同じデータを格納しているディスク装置１８−３２からデータを読み出し、ネットワーク１４を介して要求元のノード装置１２−１に対しコピー転送５０を行う。

ミラーリング先のノード装置１２−３からの読み出しデータの転送を受けたノード装置１２−１は、ＲＡＩＤ装置１０−１のスペアディスク装置２０−１に対し転送された読み出しデータを書き込む。スペアディスク装置２０−１に対するコピー転送されたデータの書き込みが完了すると、図３のＲＡＩＤ装置１０−１に設けているＲＡＩＤ構成情報４０について、故障したディスク装置１８−１２をデータの修復の済んだスペアディスク装置２０−１に置き換えてＲＡＩＤ構成情報を更新し、修復処理を終了する。

このように本発明のＲＡＩＤ装置全体をミラーリングしている場合のＲＡＤＩ装置内でＲＡＩＤ構成の冗長性を利用して修復可能な障害が発生した場合、ネットワーク１４を経由してミラーリング先の障害ディスクに対応するディスクからデータを読み出してデータを修復することで、データ修復のための入出力処理はミラーリング先のディスクからのデータの読み出し１回と、修復元のスペアディスク装置に対する転送データの書き込み１回という最小の入出力要求でデータの修復処理を完了することができ、データ修復に要する時間を短縮し、その間におけるホスト１６からのユーザの入出力要求に対する影響を最小限に抑えることができる。

図４の障害の修復処理にあっては、ＲＡＩＤ装置１０−１のデータはプライマリデータであり、ミラーリング先のＲＡＩＤ装置１０−３のデータはセカンダリデータである。この場合には、プライマリデータを格納しているＲＡＩＤ装置１０−１に設けた排他機構３６がスペアディスク装置２０−１に対する個別入出力要求を実行するために、排他アクセス権を獲得しており、これによってデータ修復中におけるホスト１６からのＲＡＩＤ構成ディスク装置に対する入出力要求は抑止されることになる。

図５は図４に示したプライマリデータを格納しているＲＡＩＤ装置１０−１でディスク装置が故障して障害を起こした場合の修復処理を、障害発生ノードであるノード装置１２−１とミラー先となるノード装置１２−３の間のやり取りを含めて示したタイムチャートである。尚、ここでは障害発生元のノード装置を単に障害発生ノード１２−１とし、ミラー先をミラーノード１２−３としている。

図５において、障害発生ノード装置１２−１にあっては、ステップＳ１でディスク装置の故障であるプライマリデータの喪失を認識すると、ステップＳ２でプライマリデータの要求処理を開始し、ステップＳ３でスペアディスク装置２０−１の個別アクセスのための排他アクセス権を獲得する。

次にステップＳ４で他のノード情報２６からミラーノード１２−３を特定し、ステップＳ５でミラーノード１２−３に対しデータ要求のコマンドを送信する。ミラーノード１２−３にあっては、ステップＳ１０１で障害発生ノード１２−１からのデータ要求のコマンドに基づきセカンダリデータ送信処理を開始する。このセカンダリデータ送信処理はステップＳ１０２で故障ディスク装置１８−１２に対応したミラーディスク装置１８−３２からセカンダリデータを読み出し、ステップＳ１０３で読み出したセカンダリデータを障害発生ノード１２−１にネットワーク１４を経由して転送する。

障害発生ノード１２−１にあっては、ステップＳ６でミラーノード１２−３からのセカンダリデータを受信してスペアディスク装置２０−１に書き込み、書き込み終了でＲＡＩＤ構成情報４０を更新する。続いてステップＳ７でデータ修復が終了したことから排他アクセス権を開放し、ＲＡＩＤ構成のディスク装置に対するホスト１６からのアクセスを可能とする。

図６は図４のセカンダリデータを格納したＲＡＩＤ装置１０−３のディスク装置が故障した場合の修復処理のタイムチャートであり、ＲＡＩＤ装置１０−３のノード装置１２−３を障害ノードとしＲＡＩＤ装置１０−１のノード装置１２−３をミラーノードとしている。

図６において、障害ノード１２−３にあってはステップＳ１でディスク装置故障でセカンダリデータの喪失を検知し、ステップＳ２でセカンダリデータ要求処理を開始する。このセカンダリデータ要求処理はステップＳ３で他ノード情報２６からミラーノード１２−１を特定し、ステップＳ４でミラーノード１２−１に対しデータ要求のコマンドを送信する。

ミラーノード１２−１にあってはステップＳ１０１で障害ノード１２−３からのコマンドに基づくデータ要求にしたがってプライマリデータ送信処理を開始する。このプライマリデータ送信処理はステップＳ１０２で故障ディスク装置に対応したミラーノード１２−１のＲＡＩＤ装置におけるディスク装置に対する排他アクセス権を獲得した後、ステップＳ１０３でミラーディスク装置からプライマリデータを読み出し、ステップＳ１０４で読み出したプライマリデータを障害発生ノード１２−３にネットワーク１４を経由して転送する。

障害発生ノード１２−３にあってはステップＳ５でミラーノード１２−１から受信したプライマリデータをスペアディスク装置に書き込んだ後にＲＡＩＤ構成情報を更新し、ステップＳ６で書き込み完了通知のコマンドをミラーノード１０−１に送信する。ミラーノード１２−１にあってはステップＳ１０５で障害発生ノード１２−３からの書き込み完了通知を受信し、ステップＳ１０２で獲得したスペアディスク装置に対する排他アクセス権を開放し、ミラーノード１２−１に対するホスト１６からのユーザによる入出力処理を可能とする。

図７は図３に示したＲＡＩＤ装置全体をミラーリングした実施形態におけるノードコントローラ２４によるコピー要求処理のフローチャートである。図７において、ノードコントローラ２４によるコピー要求処理は、ＲＡＩＤコントローラ３８がディスク装置の障害を検知してノードコントローラ２４に通知することにより開始される。このノード処理の開始時にはＲＡＩＤコントローラ３８によってＲＡＩＤ構成情報４０に故障ディスク装置の記録が行われている。

このようにしてノード処理が開始されると、ステップＳ１でＲＡＩＤ構成情報４０から故障ディスク装置を特定し、続いてステップＳ２でスペアディスク装置２０−１が書き込み修復中であることをＲＡＩＤ構成情報４０に記録する。続いてステップＳ３で管理単位の領域を選択し、ステップＳ４でミラーノードに対しデータ要求処理を実行する。

続いてステップＳ５でミラーノードからコピー転送されたデータをスペアディスク装置２０−１に書き込む、書込処理を実行する。ステップＳ６にあっては全管理単位の処理終了の有無をチェックしており、全管理単位の処理が終了するまでステップＳ３からの処理を繰り返す。

全管理単位の処理が終了するとステップＳ７に進み、スペアディスク装置２０−１をデータディスク装置またはパリティディスク装置とするようにＲＡＩＤ構成情報４０を変更して一連の処理を終了する。この図７のコピー要求処理におけるステップＳ４のデータ要求処理及びステップＳ５のデータ書込処理にあっては後の説明でさらに詳細に説明する。

図８は図３のノードコントローラ２４に設けたコピー応答処理部３０におけるコピー応答処理のフローチャートである。図８において、コピー応答処理は、ステップＳ１でコマンド受信の有無をチェックしており、コマンドを受信するとこれを解読し、ステップＳ２でセカンダリデータを格納しているノード装置からのデータ要求か否かチェックする。

セカンダリデータを格納しているノード装置からのデータ要求であった場合にはステップＳ３に進み、プライマリデータ送信処理を開始する。このプライマリデータ送信処理はステップＳ４で対象ディスク装置に対する排他アクセス権を獲得し、この状態でステップＳ５に進みディスク装置からプライマリデータを読み出し、ステップＳ６で要求元に対する読み出したプライマリデータを送信する。

ステップＳ７にあっては受信コマンドがセカンダリデータの書込終了応答か否かチェックしており、書込終了応答であった場合にはステップＳ４で取得した排他アクセス権をステップＳ８で開放する。

ステップＳ９にあっては受信コマンドの内容がプライマリデータを格納したノード装置からのデータ要求か否かチェックしており、プライマリデータを格納したノード装置からのデータ要求であった場合にはステップＳ１０に進み、セカンダリデータの送信処理を開始する。

このセカンダリデータの送信処理はステップＳ１１で対象ディスク装置からセカンダリデータを読み出して、ステップＳ１２で読み出したセカンダリデータを要求元のノードに送信する。このステップＳ９〜Ｓ１２のセカンダリデータの要求に対する読み出し処理にあっては排他アクセス権の制御は行わない。このようなステップＳ１〜Ｓ１２の応答処理をステップＳ１３で停止指示があるまで繰り返すことになる。

図９は図７のステップＳ４のデータ要求処理のフローチャートである。図９のデータ要求処理にあっては、ステップＳ１でデータ要求元となるＲＡＩＤ装置がプライマリデータを格納したプライマリノードか否かチェックする。プライマリノードであった場合にはステップＳ２に進み、プライマリデータの要求処理を開始する。

プライマリデータの要求処理はステップＳ３でデータを修復するスペアディスク装置に対する排他アクセス権を獲得した後、ステップＳ４で他ノード情報からミラーディスク装置をもつミラーノードを特定し、ステップＳ５で指定された管理単位の領域を送信するようにセカンダリデータを格納したＲＡＩＤ装置のノード、すなわちセカンダリノードに対しデータ要求のコマンドを送信する。

一方、ステップＳ１で要求元がセカンダリノードであった場合にはステップＳ６のセカンダリノード要求処理を開始する。このセカンダリノード要求処理はステップＳ７で他ノード情報からミラーディスク装置をもつミラーノードを特定した後、ステップＳ８で指定された管理単位の領域を送信するようにセカンダリノードにコマンドを送信する。このセカンダリノード送信要求処理にあっては排他アクセス権の制御は行わない。

図１０は図７のステップＳ５におけるデータ書込処理のフローチャートである。図１０において、データ書込処理はステップＳ１でコマンド受信をチェックしており、コマンドを受信するとそれを解読し、ステップＳ２でセカンダリデータの書き込みか否かチェックする。

セカンダリデータの書き込みであった場合にはステップＳ３に進み、スペアディスク装置に受信したセカンダリデータを書き込み、ステップＳ４で排他アクセス権を開放する。このステップＳ４で開放する排他アクセス権は図９のステップＳ３で獲得されたアクセス権である。

一方、受信コマンドからステップＳ２においてプライマリデータの書き込みであることを認識した場合には、ステップＳ５に進み、スペアディスク装置に受信したプライマリデータを書き込んだ後、ステップＳ６で書き込み完了通知をミラーノードに対し送信する。このステップＳ６の書き込み完了通知を受けたミラーノードは図８のフローチャートのステップＳ７でセカンダリデータの書き込み完了通知を受信し、ステップＳ８で排他アクセス権を開放することになる。

図１１は図２のストレージシステムにおいてＲＡＩＤ装置における管理単位ごとにミラー先が異なる場合の修復処理の説明図である。

図１１において、ＲＡＩＤ装置１０−１のディスク装置には管理単位ごとにプライマリデータ（Ａ１，Ａ２，Ａ３，ＰＡ）が格納されており、ミラーリング先となるＲＡＩＤ装置１０−２にはセカンダリデータ（Ａ１，Ａ２，Ａ３，ＰＡ）が格納されている。またＲＡＩＤ装置１０−３の管理単位としてプライマリデータ（Ｄ１，Ｄ２，Ｄ３，ＰＤ）が格納され、このミラー先となるノード装置１２−３にセカンダリデータ（Ｂ１，Ｂ２，Ｂ３，ＰＢ）が格納されている。

このような管理単位ごとにミラー先が異なるストレージシステムにおいて例えばＲＡＩＤ装置１０−１のディスク装置１８−１２が故障して障害を起こした場合にはノード装置１２−１は管理単位ごとにデータ要求を行ってスペアディスク装置２０−１にデータを修復する。

すなわちディスク装置１８−１２の故障で喪失したプライマリデータＡ２については,ミラー先となるＲＡＩＤ装置１０−２のディスク装置１８−２２からセカンダリデータＡ２を読み出して、コピー転送５２を行うことでスペアディスク装置２０−１に修復する。また故障したディスク装置１８−１２の別の管理単位となるプライマリデータＢ２についてはミラー先となるＲＡＩＤ装置１０−３のディスク装置１８−３２のセカンダリデータＢ２を読み出してコピー転送５４を行い、スペアディスク装置２０−１に修復する。

この図１１のように管理単位ごとにミラー先を異なるようにした場合のノード装置１２−１〜１２−３及びＲＡＩＤ装置１０−１〜１０−３の構成は、基本的に図３の実施形態と同じであり、障害を修復する際のコピー要求処理及びコピー応答処理がＲＡＩＤ装置における管理単位ごとに行われる点が相違する。

図１２は図１１のＲＡＩＤ装置の管理単位ごとにミラー先が異なる場合のコピー要求処理のフローチャートである。図１２のコピー要求処理は、図７のＲＡＩＤ装置全体をミラー化している場合と同様、図３のＲＡＩＤ装置１０−１におけるＲＡＩＤコントローラ３８がディスク装置の障害を検知してノードコントローラ２４に対しＲＡＩＤインタフェース３２を経由して通知することにより開始され、このときＲＡＩＤコントローラ３８によってＲＡＩＤ構成情報４０に故障ディスク装置の記録が行われている。

図１２において、コピー要求処理は、まずステップＳ１でＲＡＩＤ構成情報４０から故障ディスク装置を特定し、ステップＳ２でスペアディスク装置が書き込み修復中であることをＲＡＩＤ構成情報４０に記録した後、ステップＳ３でＲＡＩＤ装置における管理単位の領域を選択する。

続いてステップＳ４で他ノード情報から選択したミラーノードに対し管理単位のデータ要求処理を実行する。続いてステップＳ５で全管理単位の処理を終了したか否かチェックし、処理が終了するまでステップＳ３からの処理を繰り返す。このステップＳ４におけるミラーノードに対する管理単位ごとのデータ要求処理は管理単位ごとにミラー先が異なることから、異なったミラーノードに対しデータ要求を行うことになる。

ステップＳ５で全管理単位の処理が終了すると、ステップＳ６に進み、受信したミラーノードからのデータをスペアディスク装置に書き込む。この書き込み処理をステップＳ７で全管理単位の書き込みが終了するまで繰り返す。

書き込みが終了するとステップＳ８に進み、スペアディスク装置をデータディスク装置またはパリティディスク装置とするようにＲＡＩＤ構成情報を変更し、一連の修復処理を終了する。

このＲＡＩＤ装置における管理単位ごとにミラー先が異なる場合のコピー要求処理におけるステップＳ４のデータ要求処理は図９のフローチャートと同じであり、またステップＳ６のデータ書き込み処理は図１０のフローチャートと同じになる。さらにＲＡＩＤ装置の管理単位ごとにミラー先が異なる場合の図３のコピー応答処理部３０によるコピー応答処理は図８のコピー応答処理のフローチャートと同じになる。

図１３は本発明のストレージシステムにおけるノード及びＲＡＩＤ装置の他の実施形態であり、この実施形態にあってはパーソナルコンピュータとディスク装置でノード装置及びＲＡＩＤ装置を構成するようにしたことを特徴とする。

図１３において、ネットワーク１４に対してはパーソナルコンピュータ１５−１を複数のディスク装置１８−１１〜１８−１４及びスペアディスク装置２０−１が設けられる。パーソナルコンピュータ１５−１上にはネットワークインタフェース２２、ノードコントローラ２４、ソフトウェアＲＡＩＤモジュール６２及びディスクインタフェース６４が設けられ、ノードコントローラ２４には排他機構６６と他ノード情報インタフェース６８が設けられ、ソフトウェアＲＡＩＤモジュール６２にはＲＡＩＤインタフェース７０、ＲＡＩＤ構成情報インタフェース７２が設けられている。

この実施形態にあってはノードコントローラ２４はパーソナルコンピュータ１５−１のソフトウェアで実現している。またソフトウェアＲＡＩＤモジュール６２はディスクインタフェース６４を経由してディスク装置１８−１１〜１８−１４及びスペアディスク装置２０−１をＲＡＩＤ構成デバイスとしてアクセス可能とする仮想ドライバである。

ノードコントローラ２４はディスクインタフェース６４を経由してディスク装置１８−１１〜１８−１４及びスペアディスク装置２０−１の個別アクセスを行うこともソフトウェアＲＡＩＤモジュール６２のＲＡＩＤインタフェース７０を経由してディスク装置１８−１１〜１８−１４によるＲＡＩＤ構成に対するアクセスを行うことも可能であり、故障ディスク装置に対する修復の際にプライマリデータの入出力を行う際には排他アクセス権を獲得して個別ディスク装置のアクセスを要求し、ユーザによるＲＡＩＤ構成に対するアクセスを抑止する排他機構６６の制御機能を実現する。

更に、この実施形態にあってはノード情報を保持するかわりにノードコントローラ２４の機能によりミラー先を特定するために使用する他ノード情報インタフェース６８の機能を設けている。またソフトウェアＲＡＩＤモジュール６２にあってはＲＡＩＤ構成情報を保持するかわりにＲＡＩＤ構成情報インタフェース７２によりＲＡＩＤ構成情報を取得する機能を実現している。

図１４は本発明のストレージシステムのノードを構成する他の実施形態の説明図であり、この実施形態にあってはノード装置及びＲＡＩＤ装置をパーソナルコンピュータ１５−１とストレージエリアネットワーク（ＳＡＮ）７６で構成したことを特徴とする。

図１４において、パーソナルコンピュータ１５−１にネットワークインタフェース２２、ノードコントローラ２４、ソフトウェアＲＡＩＤモジュール６２を設けた点は図１３の実施形態と同じであるが、ディスク装置１８−１１〜１８−１３をストレージエリアネットワーク（ＳＡＮ）７６を用いて構成しており、このためパーソナルコンピュータ１５−１にはストレージエリアネットワークインタフェース７４が設けられている。

ストレージエリアネットワーク７６を設けたディスク装置１８−１１〜１８−１３にあっては、スペアディスク装置を常時接続する必要はなく、いずれかのディスク装置が故障したデータ修復時に新規にディスク装置を接続すればよい。

また図１４の実施形態はストレージエリアネットワーク（ＳＡＮ）７６のディスク装置を使用する場合を例にとっているが、同様な機能をもつｉＳＣＳＩなどのネットワークディスク装置を使用するようにしてもよい。

更に本発明はネットワークに接続されたＲＡＩＤ装置を有するノードで使用されるプログラムを提供するものであり、このプラグラムはノードを提供するコンピュータにより実行され、プログラムの内容は図７、図８、図９、図１０及び図１２のフローチャートに示した内容となる。

また本発明のプログラムを実行するコンピュータのハードウェア環境は、ＣＰＵのバスにＲＡＭ、ハードディスクドコントローラ（ソフト）、フロッピィディスクドライバ（ソフト）、ＣＤ−ＲＯＭドライバ（ソフト）、マウスコントローラ、キーボードコントローラ、ディスプレイコントローラ、通信用ボードが接続される。ハードディスクコントローラはハードディスクドライブを接続し、本発明のプログラムをローディングしており、コンピュータの起動時にハードディスクドライブから必要なプログラムを呼び出して、ＲＡＭ上に展開し、ＣＰＵにより実行する。

尚、本発明はその目的と利点を損なうことのない適宜の変形を含み、また上記の実施形態に示した数値による限定は受けない。

ここで本発明の特徴を列挙すると次の付記のようになる。
（付記）
（付記１）
複数のＲＡＩＤ装置をネットワークに接続し、前記ＲＡＩＤ装置間でデータをプライマリデータとセカンダリデータにミラーリングして多重化したストレージシステムに於いて、
前記ＲＡＩＤ装置の各々に、
ＲＡＩＤ構成デバイス及びスペアデバイスを備えた複数のデバイスと、
上位装置からの要求に対しプライマリデータを格納した前記ＲＡＩＤ構成デバイスを対象に要求処理を実行するＲＡＩＤ処理部と、
ＲＡＩＤ構成により装置内で復旧可能なデバイスの障害発生時に、ミラーリング先のＲＡＩＤ装置に障害デバイスに対応したデバイスのデータを要求し、転送されたデータをスペアデバイスに書き込んで復旧させるコピー要求処理部と、
障害先のＲＡＩＤ装置からデータ要求を受けた際に、対象デバイスのデータを読出して要求元に転送するコピー応答処理部と、
前記ＲＡＩＤ構成デバイスのアクセス権と個別デバイスのアクセス権とを排他制御する排他機構と、
を設けたことを特徴とするストレージシステム。（１）

（付記２）
付記１記載のストレージシステムに於いて、
前記コピー要求処理部は、前記障害デバイスがプライマリデータを格納していた場合、ミラーリング先のＲＡＩＤ装置にセカンダリデータを要求し、転送されたセカンダリデータをスペアデバイスに書き込んで復旧させ、
前記コピー応答処理部は、障害先のＲＡＩＤ装置からセカンダリデータ要求を受けた際に、対象デバイスのセカンダリデータを読出して要求元に転送することを特徴とするストレージシステム。（２）

（付記３）
付記２記載のストレージシステムに於いて、前記排他機構は、前記コピー要求処理部のセカンダリデータ要求に先立って前記スペアデバイスに対する排他アクセス権を取得し、転送されたセカンダリデータをスペアデバイスに書き込んだ後に前記排他アクセス権を開放することを特徴とするストレージシステム。（３）

（付記４）
付記１記載のストレージシステムに於いて、
前記コピー要求処理部は、前記障害デバイスがセカンダリデータを格納していた場合、ミラーリング先のＲＡＩＤ装置にプライマリデータを要求し、転送されたプライマリデータをスペアデバイスに書き込んで復旧させた後に書込み終了を通知し、
前記コピー応答処理部は、障害先のＲＡＩＤ装置からプライマリデータ要求を受けた際に、対象デバイスのプライマリデータを読出して要求元に転送することを特徴とするストレージシステム。（４）

（付記５）
付記４記載のストレージシステムに於いて、前記排他機構は、前記コピー応答処理部が障害先のＲＡＩＤ装置からプライマリデータ要求を受けた際に、アクセス対象デバイスに対する排他アクセス権を取得してプライマリデータを読み出して転送させ、転送後に障害先のＲＡＩＤ装置からの前記書込み終了通知を受信して前記排他アクセス権を開放することを特徴とするストレージシステム。（５）

（付記６）
付記１記載のストレージシステムに於いて、
前記ＲＡＩＤ装置は、ミラーリング先のＲＡＩＤ装置を示すミラー構成情報及びＲＡＩＤ構成デバイスの構成を示すＲＡＩＤ構成情報を保持し、
前記コピー要求処理部はデバイス障害時に前記ミラー構成情報からミラーリング先のＲＡＩＤ装置を検索すると共に、前記ＲＡＩＤ構成情報から障害デバイスに対応したデバイスを検索してデータを要求することを特徴とするストレージシステム。（６）

（付記７）
付記１記載のストレージシステムに於いて、前記ＲＡＩＤ装置は装置全体でミラーリングしてデータを多重化したことを特徴とするストレージシステム。（７）

（付記８）
付記１記載のストレージシステムに於いて、前記ＲＡＩＤ装置は管理単位ごとにミラーリング先を変えてデータを多重化したことを特徴とするストレージシステム。（８）

（付記９）
付記１記載のストレージシステムに於いて、前記ＲＡＩＤ装置は、ネットワーク接続された計算機のクラスタで構成される各ノードの配下に接続されたことを特徴とするストレージシステム。

（付記１０）
複数のＲＡＩＤ装置をネットワークに接続し、前記ＲＡＩＤ装置間でデータをプライマリデータとセカンダリデータにミラーリングして多重化したストレージシステムの処理方法に於いて、
上位装置からの要求に対しプライマリデータを格納した複数のデバイスによるＲＡＩＤ構成デバイスを対象に要求処理を実行するＲＡＩＤ処理ステップと、
ＲＡＩＤ構成により装置内で復旧可能なデバイスの障害発生時に、ミラーリング先のＲＡＩＤ装置に障害デバイスに対応したデバイスのデータを要求し、転送されたデータをスペアデバイスに書き込んで復旧させるコピー要求処理ステップと、
障害先のＲＡＩＤ装置からデータ要求を受けた際に、対象デバイスのデータを読出して要求元に転送するコピー応答処理ステップと、
前記ＲＡＩＤ構成デバイスのアクセス権と個別デバイスのアクセス権とを排他制御する排他制御ステップと、
を備えたことを特徴とするストレージシステムの処理方法。（９）

（付記１１）
付記１０記載のストレージシステムの処理方法に於いて、
前記コピー要求処理ステップは、前記障害デバイスがプライマリデータを格納していた場合、ミラーリング先のＲＡＩＤ装置にセカンダリデータを要求し、転送されたセカンダリデータをスペアデバイスに書き込んで復旧させ、
前記コピー応答処理ステップは、障害先のＲＡＩＤ装置からセカンダリデータ要求を受けた際に、対象デバイスのセカンダリデータを読出して要求元に転送することを特徴とするストレージシステムの処理方法。

（付記１２）
付記１１記載のストレージシステムの処理方法に於いて、前記排他制御ステップは、前記コピー要求処理ステップのセカンダリデータ要求に先立って前記スペアデバイスに対する排他アクセス権を取得し、転送されたセカンダリデータをスペアデバイスに書き込んだ後に前記排他アクセス権を開放することを特徴とするストレージシステムの処理方法。

（付記１３）
付記１０記載のストレージシステムの処理方法に於いて、
前記コピー要求処理ステップは、前記障害デバイスがセカンダリデータを格納していた場合、ミラーリング先のＲＡＩＤ装置にプライマリデータを要求し、転送されたプライマリデータをスペアデバイスに書き込んで復旧させた後に書込み終了を通知し、
前記コピー応答処理ステップは、障害先のＲＡＩＤ装置からプライマリデータ要求を受けた際に、対象デバイスのプライマリデータを読出して要求元に転送することを特徴とするストレージシステムの処理方法。

（付記１４）
付記１３記載のストレージシステムの処理方法に於いて、前記排他制御ステップは、前記コピー応答処理ステップが障害先のＲＡＩＤ装置からプライマリデータ要求を受けた際に、アクセス対象デバイスに対する排他アクセス権を取得してプライマリデータを読み出して転送させ、転送後に障害先のＲＡＩＤ装置から前記書込み終了通知を受信して前記排他アクセス権を開放することを特徴とするストレージシステムの処理方法。

（付記１５）
付記１０記載のストレージシステムの処理方法に於いて、
前記ＲＡＩＤ装置は、ミラーリング先のＲＡＩＤ装置を示すミラー構成情報及びＲＡＩＤ構成デバイスの構成を示すＲＡＩＤ構成情報を保持し、
前記コピー要求処理ステップはデバイス障害時に前記ミラー構成情報からミラーリング先のＲＡＩＤ装置を検索すると共に、前記ＲＡＩＤ構成情報から障害デバイスに対応したデバイスを検索してデータを要求することを特徴とするストレージシステムの処理方法

（付記１６）
付記１０記載のストレージシステムの処理方法に於いて、前記ＲＡＩＤ装置は装置全体でミラーリングしてデータを多重化したことを特徴とするストレージシステムの処理方法。

（付記１７）
付記１０記載のストレージシステムの処理方法に於いて、前記ＲＡＩＤ装置は管理単位ごとにミラーリング先を変えてデータを多重化したことを特徴とするストレージシステムの処理方法。

（付記１８）
付記１０記載のストレージシステムの処理方法に於いて、前記ＲＡＩＤ装置は、ネットワーク接続された計算機のクラスタとの各ノードの配下に接続されたことを特徴とするストレージシステムの処理方法。

（付記１９）
複数のＲＡＩＤ装置をネットワークに接続し、前記ＲＡＩＤ装置間でデータをプライマリデータとセカンダリデータにミラーリングして多重化した前記ＲＡＩＤ装置のコンピュータに、
上位装置からの要求に対しプライマリデータを格納した複数のデバイスによるＲＡＩＤ構成デバイスを対象に要求処理を実行するＲＡＩＤ処理ステップと、
ＲＡＩＤ構成により装置内で復旧可能なデバイスの障害発生時に、ミラーリング先のＲＡＩＤ装置に障害デバイスに対応したデバイスのデータを要求し、転送されたデータをスペアデバイスに書き込んで復旧させるコピー要求処理ステップと、
障害先のＲＡＩＤ装置からデータ要求を受けた際に、対象デバイスのデータを読出して要求元に転送するコピー応答処理ステップと、
前記ＲＡＩＤ構成デバイスのアクセス権と個別デバイスのアクセス権とを排他制御する排他制御ステップと、
を実行させることを特徴とするプログラム。（１０）

（付記２０）
付記１９記載のプログラムに於いて、
前記コピー要求処理ステップは、前記障害デバイスがプライマリデータを格納していた場合、ミラーリング先のＲＡＩＤ装置にセカンダリデータを要求し、転送されたセカンダリデータをスペアデバイスに書き込んで復旧させ、
前記コピー応答処理ステップは、障害先のＲＡＩＤ装置からセカンダリデータ要求を受けた際に、対象デバイスのセカンダリデータを読出して要求元に転送することを特徴とするプログラム。

（付記２１）
付記２０記載のプログラムに於いて、前記排他制御ステップは、前記コピー要求処理ステップのセカンダリデータ要求に先立って前記スペアデバイスに対する排他アクセス権を取得し、転送されたセカンダリデータをスペアデバイスに書き込んだ後に前記排他アクセス権を開放することを特徴とするプログラム。

（付記２２）
付記１９記載のプログラムに於いて、
前記コピー要求処理ステップは、前記障害デバイスがセカンダリデータを格納していた場合、ミラーリング先のＲＡＩＤ装置にプライマリデータを要求し、転送されたプライマリデータをスペアデバイスに書き込んで復旧させた後に書込み終了を通知し、
前記コピー応答処理ステップは、障害先のＲＡＩＤ装置からプライマリデータ要求を受けた際に、対象デバイスのプライマリデータを読出して要求元に転送することを特徴とするプログラム。

（付記２３）
付記２２記載のプログラムに於いて、前記排他制御ステップは、前記コピー応答処理ステップが障害先のＲＡＩＤ装置からプライマリデータ要求を受けた際に、アクセス対象デバイスに対する排他アクセス権を取得してプライマリデータを読み出して転送させ、転送後に障害先のＲＡＩＤ装置から前記書込み終了通知を受信して前記排他アクセス権を開放することを特徴とするプログラム。

（付記２４）
付記１９記載のプログラムに於いて、
前記ＲＡＩＤ装置は、ミラーリング先のＲＡＩＤ装置を示すミラー構成情報及びＲＡＩＤ構成デバイスの構成を示すＲＡＩＤ構成情報を保持し、
前記コピー要求処理ステップはデバイス障害時に前記ミラー構成情報からミラーリング先のＲＡＩＤ装置を検索すると共に、前記ＲＡＩＤ構成情報から障害デバイスに対応したデバイスを検索してデータを要求することを特徴とするプログラム

（付記２５）
付記１９記載のプログラムに於いて、前記ＲＡＩＤ装置は装置全体でミラーリングしてデータを多重化したことを特徴とするプログラム。

（付記２６）
付記１９記載のプログラムに於いて、前記ＲＡＩＤ装置は管理単位ごとにミラーリング先を変えてデータを多重化したことを特徴とするプログラム。

（付記２７）
付記１９記載のプログラムに於いて、前記ＲＡＩＤ装置は、ネットワーク接続された計算機のクラスタとの各ノードの配下に接続されたことを特徴とするプログラム。

本発明の原理説明図本発明によるストレージシステムのブロック図図２のノード装置及びＲＡＩＤ装置の機能構成のブロック図ＲＡＩＤ装置全体をミラー化した場合のデータ修復処理の説明図図４でプライマリデータを格納したノードの障害発生によるデータ修復処理のタイムチャート図４でセカンダリデータを格納したノードの障害発生によるデータ修復処理のタイムチャート図３のノードコントローラによるコピー要求処理のフローチャート図３のノードコントローラによるコピー応答処理のフローチャート図７のステップＳ４のデータ要求処理のフローチャート図７のステップＳ５のデータ書込処理のフローチャートＲＡＩＤ装置での管理単位毎にミラー先が異なる本発明のストレージシステムのデータ修復処理の説明図図１１のデータ修復処理で実行されるノードコントローラのコピー要求処理のフローチャートソフトウェアＲＡＩＤモジュールを用いた本発明のノード装置の他の実施形態のブロック図ストレージエリアネットワークのディスク装置を使用する本発明のノード装置の他の実施形態のブロック図ＲＡＩＤ装置全体をミラー化した従来のストレージシステムの説明図図１５のＲＡＩＤ装置の説明図ＲＡＩＤ装置内の管理領域毎にミラー先の異なる従来のストレージシステムの説明図従来のＲＡＩＤ装置内で故障ディスク装置のデータを修復する処理の説明図

符号の説明

１０，１０−１〜１０−４：ＲＡＩＤ装置
１２，１２−１〜１２−４：ノード装置
１４：ネットワーク
１５−１：パーソナルコンピュータ
１６：ホスト
１８，１８−１１〜１８−４４：ディスク装置
２０−１〜２０−４：スペアディスク装置
２２：ネットワークインタフェース
２４：ノードコントローラ
２６：他ノード情報
２８：コピー要求処理部
３０：コピー応答処理部
３２，７０：ＲＡＩＤインタフェース
３４，６４：ディスクインタフェース
３６，６６：排他機構
３８：ＲＡＩＤコントローラ
４０：ＲＡＩＤ構成情報
５０，５２，５４：コピー転送
６２：ソフトウェアＲＡＩＤモジュール
６８：他ノード情報インタフェース
７２：ＲＡＩＤ構成情報インタフェース
７４：ストレージエリアネットワークインタフェース
７６：ストレージエリアネットワーク（ＳＡＮ）

Claims

複数のＲＡＩＤ装置をネットワークに接続し、前記ＲＡＩＤ装置間でデータをプライマリデータとセカンダリデータにミラーリングして多重化したストレージシステムに於いて、
前記ＲＡＩＤ装置の各々に、
ＲＡＩＤ構成デバイス及びスペアデバイスを備えた複数のデバイスと、
上位装置からの要求に対しプライマリデータを格納した前記ＲＡＩＤ構成デバイスを対象に要求処理を実行するＲＡＩＤ処理部と、
ＲＡＩＤ構成により装置内で復旧可能なデバイスの障害発生時に、ミラーリング先のＲＡＩＤ装置に障害デバイスに対応したデバイスのデータを要求し、転送されたデータをスペアデバイスに書き込んで復旧させるコピー要求処理部と、
障害先のＲＡＩＤ装置からデータ要求を受けた際に、対象デバイスのデータを読出して要求元に転送するコピー応答処理部と、
前記ＲＡＩＤ構成デバイスのアクセス権と個別デバイスのアクセス権とを排他制御する排他機構と、
を設けたことを特徴とするストレージシステム。
請求項１記載のストレージシステムに於いて、
前記コピー要求処理部は、前記障害デバイスがプライマリデータを格納していた場合、ミラーリング先のＲＡＩＤ装置にセカンダリデータを要求し、転送されたセカンダリデータをスペアデバイスに書き込んで復旧させ、
前記コピー応答処理部は、障害先のＲＡＩＤ装置からセカンダリデータ要求を受けた際に、対象デバイスのセカンダリデータを読出して要求元に転送することを特徴とするストレージシステム。
請求項２記載のストレージシステムに於いて、前記排他機構は、前記コピー要求処理部のセカンダリデータ要求に先立って前記スペアデバイスに対する排他アクセス権を取得し、転送されたセカンダリデータをスペアデバイスに書き込んだ後に前記排他アクセス権を開放することを特徴とするストレージシステム。
請求項１記載のストレージシステムに於いて、
前記コピー要求処理部は、前記障害デバイスがセカンダリデータを格納していた場合、ミラーリング先のＲＡＩＤ装置にプライマリデータを要求し、転送されたプライマリデータをスペアデバイスに書き込んで復旧させた後に書込み終了を通知し、
前記コピー応答処理部は、障害先のＲＡＩＤ装置からプライマリデータ要求を受けた際に、対象デバイスのプライマリデータを読出して要求元に転送することを特徴とするストレージシステム。
請求項４記載のストレージシステムに於いて、前記排他機構は、前記コピー応答処理部が障害先のＲＡＩＤ装置からプライマリデータ要求を受けた際に、アクセス対象デバイスに対する排他アクセス権を取得してプライマリデータを読み出して転送させ、転送後に障害先のＲＡＩＤ装置からの前記書込み終了通知を受信して前記排他アクセス権を開放することを特徴とするストレージシステム。
請求項１記載のストレージシステムに於いて、
前記ＲＡＩＤ装置は、ミラーリング先のＲＡＩＤ装置を示すミラー構成情報及びＲＡＩＤ構成デバイスの構成を示すＲＡＩＤ構成情報を保持し、
前記コピー要求処理部はデバイス障害時に前記ミラー構成情報からミラーリング先のＲＡＩＤ装置を検索すると共に、前記ＲＡＩＤ構成情報から障害デバイスに対応したデバイスを検索してデータを要求することを特徴とするストレージシステム。
請求項１記載のストレージシステムに於いて、前記ＲＡＩＤ装置は装置全体でミラーリングしてデータを多重化したことを特徴とするストレージシステム。
請求項１記載のストレージシステムに於いて、前記ＲＡＩＤ装置は管理単位ごとにミラーリング先を変えてデータを多重化したことを特徴とするストレージシステム。
複数のＲＡＩＤ装置をネットワークに接続し、前記ＲＡＩＤ装置間でデータをプライマリデータとセカンダリデータにミラーリングして多重化したストレージシステムの処理方法に於いて、
上位装置からの要求に対しプライマリデータを格納した複数のデバイスによるＲＡＩＤ構成デバイスを対象に要求処理を実行するＲＡＩＤ処理ステップと、
ＲＡＩＤ構成により装置内で復旧可能なデバイスの障害発生時に、ミラーリング先のＲＡＩＤ装置に障害デバイスに対応したデバイスのデータを要求し、転送されたデータをスペアデバイスに書き込んで復旧させるコピー要求処理ステップと、
障害先のＲＡＩＤ装置からデータ要求を受けた際に、対象デバイスのデータを読出して要求元に転送するコピー応答処理ステップと、
前記ＲＡＩＤ構成デバイスのアクセス権と個別デバイスのアクセス権とを排他制御する排他制御ステップと、
を備えたことを特徴とするストレージシステムの処理方法。
複数のＲＡＩＤ装置をネットワークに接続し、前記ＲＡＩＤ装置間でデータをプライマリデータとセカンダリデータにミラーリングして多重化した前記ＲＡＩＤ装置のコンピュータに、
上位装置からの要求に対しプライマリデータを格納した複数のデバイスによるＲＡＩＤ構成デバイスを対象に要求処理を実行するＲＡＩＤ処理ステップと、
ＲＡＩＤ構成により装置内で復旧可能なデバイスの障害発生時に、ミラーリング先のＲＡＩＤ装置に障害デバイスに対応したデバイスのデータを要求し、転送されたデータをスペアデバイスに書き込んで復旧させるコピー要求処理ステップと、
障害先のＲＡＩＤ装置からデータ要求を受けた際に、対象デバイスのデータを読出して要求元に転送するコピー応答処理ステップと、
前記ＲＡＩＤ構成デバイスのアクセス権と個別デバイスのアクセス権とを排他制御する排他制御ステップと、
を実行させることを特徴とするプログラム。