JP2008204238A - ディスクアレイ装置、ディスクアレイ復旧方法、そのプログラム及び記憶媒体 - Google Patents

ディスクアレイ装置、ディスクアレイ復旧方法、そのプログラム及び記憶媒体 Download PDF

Info

Publication number
JP2008204238A
JP2008204238A JP2007040563A JP2007040563A JP2008204238A JP 2008204238 A JP2008204238 A JP 2008204238A JP 2007040563 A JP2007040563 A JP 2007040563A JP 2007040563 A JP2007040563 A JP 2007040563A JP 2008204238 A JP2008204238 A JP 2008204238A
Authority
JP
Japan
Prior art keywords
hard disk
disk
disk array
power supply
failed hard
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007040563A
Other languages
English (en)
Inventor
Junta Tanaka
淳太 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2007040563A priority Critical patent/JP2008204238A/ja
Publication of JP2008204238A publication Critical patent/JP2008204238A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】故障モードに陥ったハードディスクを用いた仮復旧の成功率が向上するディスクアレイ装置を提供する。
【解決手段】ディスクアレイコントローラaにてハードディスクg−1の故障を検出して、ディスクアレイから論理的に切り離した際に、バックパネルコントローラcを制御して、電源供給用スイッチf−1を開放してハードディスクg−1に対する電源dからの供給を停止することにより、ハードディスクg−1の物理的なリセットを実施し、しかる後、ハードディスクg−1の回転動作が完全に停止するまでの所要時間をタイマeにて計時した後、ハードディスクg−1への電源供給を再開する。さらに、ハードディスクg−1全面への全データ再構築を実施し、再構築に成功した場合、ディスクアレイへの再組み込みを行う。再構築に失敗した場合は、ハードディスクg−1への電源供給を停止した状態を継続し、ディスクアレイから物理的に切り離す。
【選択図】図1

Description

本発明は、ディスクアレイ装置およびディスクアレイ復旧方法に関し、特に、ディスクアレイコントローラとバックパネルとを用いてハードディスクの電源管理を行うことによってディスクアレイの復旧を行うディスクアレイ装置およびディスクアレイ復旧方法に関する。
ディスクアレイコントローラに接続されているハードディスクにおいて故障が発生した場合、ディスクアレイコントローラは、故障ハードディスクに対して論理的な切り離しを行い、バックパネルに配置されたLED等のランプの発光状態を変更して管理者に異常の発生を通知する。特許文献1の実開平2−11544号公報「ハードディスクドライブの保護装置」に記載のような従来の技術では、管理者によるハードディスク交換等により復旧するまでの間、故障ディスクをそのまま用いて、再組み込みを行う機能により仮復旧を行う。
実開平2−11544号公報(第5−6頁)
従来の技術では、前述のように、ディスクアレイコントローラにより論理的に切り離されたハードディスクをそのまま用いて再組み込みを行う。しかし、故障モードに陥り、ディスクアレイコントローラより故障状態として認識されたハードディスクは、論理的に切り離されただけでは、故障モードがクリアされていない場合がほとんどである。それ故に、この故障モードに陥ったハードディスクを用いて再組み込みを行うと、復旧に失敗するという問題があった。
本発明は、かかる事情に鑑みてなされたものであり、本発明の目的とするところは、ディスクアレイコントローラにより故障状態として認識され、ディスクアレイより切り離されたハードディスクに対して、ディスクアレイコントローラおよびバックパネルを用いた物理リセットを行い、故障モードをクリアした後、縮退状態にあるディスクアレイに再組み込みを行い、仮復旧させることにある。
さらに、本発明の目的とするところは、仮復旧する際に、ディスクアレイコントローラにより、物理リセットを行ったハードディスク全面にデータを再構築する復旧処理を行い、復旧に成功したか否かを確認し、縮退状態にあるディスクアレイに再組み込みを行うか否かを判定可能とし、ディスクアレイの冗長性を強化を図ることにある。
前述の課題を解決するため、本発明によるディスクアレイ装置、ディスクアレイ復旧方法、そのプログラム及び記憶媒体は、次のような特徴的な構成を採用している。
(1)1ないし複数のハードディスクをアレイ状に備えたディスクアレイ装置において、故障が検出されて、ディスクアレイから論理的に切り離された故障ハードディスクに対して、電源の供給を停止することにより、物理的なリセットを実施した後、当該故障ハードディスクへの電源供給を再開するディスクアレイ装置。
(2)前記故障ハードディスクの前記ディスクアレイからの論理的な切り離し状態、前記故障ハードディスクへの電源供給停止による物理的なリセットの実施状態、あるいは、当該故障ハードディスクへの電源供給の再開状態のうち、1ないし複数の状態を、表示ランプによりユーザに通知する上記(1)のディスクアレイ装置。
(3)前記ハードディスクへの電源供給を停止した後、当該故障ハードディスクの回転動作が完全に停止するまでの所要時間の経過後に、当該故障ハードディスクへの電源供給を再開する上記(1)または(2)のディスクアレイ装置。
(4)前記故障ハードディスクへの電源供給が再開された際に、論理的に切り離されていた前記ディスクアレイへの再組み込みを行う上記(1)ないし(3)のいずれかのディスクアレイ装置。
(5)前記故障ハードディスクへの電源供給の再開後に、当該故障ハードディスクの前記ディスクアレイへの再組み込みを行う動作に先立って、当該ハードディスクの全面に、全データ再構築を実施する上記(1)ないし(4)のいずれかのディスクアレイ装置。
(6)前記故障ハードディスク全面に対する全データ再構築を実施した際に、全データ再構築に成功したか否かを判定し、成功した場合に、前記ディスクアレイへの再組み込みを行う上記(5)のディスクアレイ装置。
(7)前記故障ハードディスク全面に対する全データ再構築に成功し、前記ディスクアレイへの再組み込みを行った際に、前記ディスクアレイへの再組み込みに成功した旨を、表示ランプによりユーザに通知する上記(6)のディスクアレイ装置。
(8)前記故障ハードディスク全面に対する全データ再構築を実施した際に、全データ再構築に失敗した場合、当該故障ハードディスクに対する電源の供給を継続して停止した状態にし、前記ディスクアレイから物理的に切り離す上記(5)ないし(7)のいずれかのディスクアレイ装置。
(9)前記故障ハードディスク全面に対する全データ再構築に失敗し、前記ディスクアレイから物理的に切り離した際に、前記ディスクアレイから物理的に切り離された旨を、表示ランプによりユーザに通知する上記(7)のディスクアレイ装置。
(10)1ないし複数のハードディスクをアレイ状に備えたディスクアレイ装置におけるディスクアレイ復旧方法であって、故障が検出されて、ディスクアレイから論理的に切り離された故障ハードディスクに対して、電源の供給を停止することにより、物理的なリセットを実施した後、当該故障ハードディスクへの電源供給を再開するディスクアレイ復旧方法。
(11)前記ハードディスクへの電源供給を停止した後、当該故障ハードディスクの回転動作が完全に停止するまでの所要時間の経過後に、当該故障ハードディスクへの電源供給を再開する上記(10)のディスクアレイ復旧方法。
(12)前記故障ハードディスクへの電源供給が再開された際に、論理的に切り離されていた前記ディスクアレイへの再組み込みを行う上記(10)または(11)のディスクアレイ復旧方法。
(13)前記故障ハードディスクへの電源供給の再開後に、当該故障ハードディスクの前記ディスクアレイへの再組み込みを行う動作に先立って、当該ハードディスクの全面に、全データ再構築を実施する上記(10)ないし(12)のいずれかのディスクアレイ復旧方法。
(14)前記故障ハードディスク全面に対する全データ再構築を実施した際に、全データ再構築に成功したか否かを判定し、成功した場合に、前記ディスクアレイへの再組み込みを行う上記(13)のディスクアレイ復旧方法。
(15)前記故障ハードディスク全面に対する全データ再構築を実施した際に、全データ再構築に失敗した場合、当該故障ハードディスクに対する電源の供給を継続して停止した状態にし、前記ディスクアレイから物理的に切り離す上記(13)または(14)のディスクアレイ復旧方法。
(16)上記(10)ないし(15)のいずれかの処理をコンピュータに実行させるためのプログラム。
(17)上記(16)のプログラムを格納、記憶した記憶媒体。
本発明のディスクアレイ装置、ディスクアレイ復旧方法、そのプログラム及び記憶媒体によれば、以下のような効果を得ることができる。
第1の効果は、故障モードに陥ったハードディスクを用いた仮復旧の成功率が向上するため、ディスクアレイとしての冗長性も向上する。
その理由は、故障モードに陥ったハードディスクを電源断による物理リセットを行うことにより、故障モードをクリアすることが可能であるからである。ハードディスク内部の電子部品や機構部品あるいはPCB(Printed Circuit Board)の電気的、機械的な故障を除けば、ハードディスクの一時的な誤動作やファームウェア停止等の故障モードについては、電源のリセットを行うことによって解消することができる。この結果、故障モードをクリアしたハードディスクを用いて仮復旧を成功させることによって、別のハードディスクが物理的に故障した際にも、ディスクアレイの縮退運転を行うことが可能であるため、ディスクアレイの冗長性を向上させることができる。
第2の効果は、物理的に故障したハードディスクを完全に切り離すことができる。
その理由は、物理リセットにより故障モードをクリアした後に、ハードディスク全面へのデータ書き込み(データ再構築)を実施した結果として、仮復旧が失敗した場合、そのハードディスクはファームウェアのリセット等では回避することができない物理的な故障が発生している可能性が大きい。かかるハードディスクに対しては、電源供給の停止状態を継続して物理的な切り離しを行うことにより、ディスクアレイを構成している他のハードディスクに影響を与えることを未然に防ぐことができる。
以下、本発明によるディスクアレイ装置、ディスクアレイ復旧方法、そのプログラム及び記憶媒体の好適な実施例について添付図を参照して説明する。尚、以下の実施例において説明される動作処理手順(ステップ)をコンピュータに実行させるプログラム及び当該プログラムを格納、記憶した記憶媒体も本発明の実施例に含まれる。
(本発明の特徴)
本発明の実施例の説明に先立って、まず、本発明の特徴について、その概要を説明する。本発明に係るディスクアレイ装置においては、障害発生時に論理的に切り離してそのまま再組み込みを行うのではなく、一旦、障害が発生したハードディスクの電源を切断して、物理的なリセットを掛けることによって、より確実な障害復旧を試みるように構成し、さらに、ハードディスクの再組み込みの実施前に、故障ハードディスク全面に対してデータの再構築を行うことにより復旧可能か否かを判定するように構成することに、本発明の主要な特徴がある。
つまり、本発明は、ハードディスクの異常発生を検知したときに、仮縮退を行い、物理リセットを掛けて、しかる後に、データの全面復旧を行い、整合性を確認する。整合性の確認結果によって、再組み込みを行うのか、本縮退させるのかを決定する点に、その特徴がある。
(本発明の実施例の構成の説明)
図1は、本発明のディスクアレイ装置の構成の一例を示すブロック構成図であり、ハードディスクに対する電源の供給系統を中心にして示している。図1のディスクアレイ装置は、1ないし複数のハードディスクg−1〜g−nをアレイ状に備えており、ディスクアレイコントローラa、ハードディスクg−1〜g−nを接続するためのバックパネルbおよびハードディスクg−1〜g−nへの電源供給を制御する電源制御用スイッチf−1〜f−nによって構成される。
バックパネルbは、バックパネルコントローラc、電源d、タイマe、LEDw−1〜w−nおよび電源制御用スイッチf−1〜f−nによって構成される。
ディスクアレイコントローラaとバックパネルbに接続されるバックパネルコントローラcおよびハードディスクg−1〜g−nとはバスhを介して通信を行う。バックパネルコントローラcと電源制御用スイッチf−1〜f−nとはスイッチ制御線iによって接続されている。バックパネルコントローラcとLEDw−1〜w−nとはLED制御線xによって接続されている。
電源dは、電源線jを介してハードディスクg−1〜g−nへ電源供給を行う。電源線jは、スイッチf−1〜f−nを用いてハードディスクg−1〜g−nへの電源供給・切断が制御される。
つまり、本実施例のディスクアレイ装置は、故障モードに陥ったハードディスクに対する電源供給および電源供給停止の制御をし、物理的な接続および切り離しを行う電源制御手段、ハードディスクに対する電源供給の停止状態の継続時間を測定する時間測定手段、ハードディスクに対する復旧状態を監視し、その成否によりハードディスクに対する処置を決定する判定手段、ハードディスクが接続されているスロットの表示ランプ例えばLEDに対し、前記判定手段により処置された状態に合わせた表示を行う表示手段を少なくとも備えて構成されている。
前記電源制御手段は、図1のディスクアレイコントローラaおよびバックパネルコントローラcにより構成される。ディスクアレイコントローラaにおいては、バックパネルコントローラcを制御して、電源供給用スイッチf−1〜f−nの開閉動作を行わせることにより、故障状態と認識されたハードディスク例えばハードディスクg−1に対して、電源dからの電源供給を停止することにより、物理的な切り離しを行う。また、前記電源制御手段は、電源供給が停止された故障ハードディスクg−1が完全に停止したことを前記時間測定手段にて確認し、バックパネルコントローラcを制御して、故障ハードディスクg−1に対する電源再投入の制御を行う。
前記時間測定手段は、図1のバックパネルコントローラcおよびタイマeにより構成される。バックパネルコントローラcにおいて故障ハードディスクg−1に対する電源供給の停止が行われた後、バックパネルコントローラcに内蔵のタイマeを用いて故障ハードディスクg−1が完全に停止するまでの経過時間を作り出す。故障ハードディスクg−1が完全に停止したと予測される時間までタイマeの計時が進むと、その旨を前記電源制御手段に伝達する。
前記判定手段は、図1のディスクアレイコントローラaにより構成される。ディスクアレイコントローラaは、ハードディスク全面に対する全データの再構築を実施するなど、故障ハードディスクg−1に対する復旧処理の成否を監視する。復旧処理が成功した場合は、ディスクアレイへの再組み込みを行い、前記表示手段に対して物理リセットを行ったハードディスクg−1のスロット番号を伝える。逆に、復旧処理が失敗した場合は、前記電源制御手段を用いて、ハードディスクg−1に対する物理的な切り離しを行い、前記表示手段に対して故障ハードディスクg−1のスロット番号を伝える。
前記表示手段は、図1のバックパネルコントローラcおよび表示ランプ例のLEDw−1〜w−nにより構成される。バックパネルコントローラcは、前記判定手段より伝達された故障ハードディスクg−1のスロット番号および状態を受信し、スロット番号に対応するLEDw−1にその状態に合わせた表示を行い、管理者に故障ハードディスクg−1の現在の状況を伝える。
(実施例の動作の説明)
図2は、本発明の一例である図1のディスクアレイ装置における電源制御の状態遷移の一例を示す状態遷移図であり、故障ハードディスクに対する電源供給状態の遷移状況の一例を示している。また、図3は、本発明の一例である図1のディスクアレイ装置における電源制御の流れの一例を示すフローチャートであり、故障状態と判定されたハードディスクの復旧手順の一例を示している。
ハードディスクg−1にて故障が発生した場合を仮定して、本発明のディスクアレイ装置における電源制御の一例を図2、図3を用いて説明する。まず、図2の状態遷移図を用いて、ハードディスクg−1の電源供給状態(ON/OFF状態)の遷移について説明する。図2において、状態kは、ハードディスクg−1の電源がONの状態にあって、ディスクアレイに組み込まれている状態を示し、状態lは、ハードディスクg−1の電源がONからOFFに切り替わって、スピン動作(回転動作)がまだ停止せずに、Spin Down(スピン・ダウン)動作中にある状態にあり、ディスクアレイから物理的に切り離されている状態を示し、状態mは、ハードディスクg−1の電源がOFFからONに切り替わって、回転速度が所定の速度まで上昇していなく、Spin Up(スピン・アップ)動作中にある状態にあり、ディスクアレイに再度組み込もうとしている状態を示している。
次に、図3のフローチャートを用いて、故障が検知されたハードディスクg−1の電源ON/OFFを行う電源制御の流れを、図2の状態kから状態lへ遷移し、次いで、ハードディスクg−1の回転動作の停止を確認した後、図2の状態lから状態mへ遷移し、最後に、状態mから状態kに復帰するまでの制御手順(復旧手順)として、説明する。
(1)故障ハードディスクの電源切断(状態k→状態l)
まず、図2の状態kの電源ON状態にあって、ディスクアレイに組み込まれて、運用中の状態にあるハードディスクg−1に故障が検知されて、電源をOFFにして、図2の状態lに遷移する場合について、図3の流れを説明する。
まず、ハードディスクg−1に故障が発生すると、図3のフローチャートが起動されるが、故障が発生した段階では、故障ハードディスクg−1の状態は、電源がまだONになっている図2の状態kの状態にある。ここで、ディスクアレイコントローラaは、ハードディスクg−1の故障発生を、バスhを介して認識し、ハードディスクg−1のステータスを故障とみなす。
ハードディスクg−1の故障発生を検知したディスクアレイコントローラaは、故障ハードディスクg−1を論理的に切り離すとともに、バックパネルコントローラcを制御して、ハードディスクg−1の故障状態を、ハードディスクg−1のスロット番号に対応するLEDw−1の表示を故障発生の表示に変更することによって管理者に伝える(ステップn)。
次いで、ディスクアレイコントローラaは、バックパネルコントローラcに対して、ハードディスクg−1に対する電源供給停止の指令を出力する。電源供給停止の指令を受信したバックパネルコントローラcは、スイッチf−1を電源供給停止の状態となるように、スイッチ制御線iを用いて変更することによって、ハードディスクg−1に対する電源dからの電源供給を停止する(ステップo)。なお、ステップnにおけるLEDw−1の表示変更の制御とステップoにおける電源供給の停止の制御との順序は、逆にしても良い。
(2)故障ハードディスクの回転停止の確認(状態l)
次に、図2の状態lを示す電源OFF状態に切り替えたことによって、Spin Down動作を実行中の状態に遷移した故障ハードディスクg−1がSpin Down動作を完了して、完全に停止するまで待ち合わせる場合について、図3の流れを説明する。
故障ハードディスクg−1に対する電源dからの電源供給を停止するために、スイッチ制御線iを介してスイッチf−1を電源供給停止の状態に変更したバックパネルコントローラcは、次に、故障ハードディスクg−1のSpin Down動作が終了して、完全に停止した状態になるまでの時間の経過を待ち合わせるために、バックパネルコントローラcに実装されているタイマeを起動して、電源供給停止した時点からの経過時間Tが、故障ハードディスクg−1への電源供給が停止してからSpin Downを完了するまでの所要時間Nに達するまで(ステップpの(T<N)の場合)、待ち合わせる。
経過時間Tが所要時間Nに達した時点で(ステップpの(T≧N)の場合)、故障ハードディスクg−1が完全に停止して電源再投入までのタイミングに達したことを検知し、故障ハードディスクg−1の電源の再供給が可能なタイミングになったことを判別する。
(3)故障ハードディスクへの電源の再供給(状態l→状態m)
次に、Spin Down動作を実行中であった故障ハードディスクg−1がSpin Down動作を完了して、完全に停止した後、電源をONにして、図2の状態mの状態に遷移する場合について、図3の流れを説明する。
バックパネルコントローラcのタイマeによる計時動作によって、故障ハードディスクg−1が完全にSpin Down動作を完了するまでの時間が経過したときに、バックパネルコントローラcは、スイッチf−1を電源供給の状態となるように、スイッチ制御線iを用いて変更することによって、故障ハードディスクg−1に対する電源dからの電源供給を再開する。故障ハードディスクg−1は、電源の供給再開により、Spin Up動作を開始する(ステップq)。
ここで、ディスクアレイコントローラaは、バスhを介して、緊急復旧用に故障ハードディスクg−1に対する物理リセット(電源供給停止による)が実施された後、電源供給が再開されたことを認識し、故障ハードディスクg−1に対する復旧を開始する(ステップr)。
(4)故障ハードディスクの電源供給状態の継続(状態m→状態k)
次に、Spin Up動作を実行中の故障ハードディスクg−1がSpin Up動作を完了して、通常のアクセスが可能なサービス状態に復帰することにより、ディスクアレイに組み込まれた図2の状態kの状態に遷移する場合について、図3の流れを説明する。
故障ハードディスクg−1に対する復旧を開始したディスクアレイコントローラaは、まず、故障ハードディスクg−1に対して、全面にデータの書き込み動作を行い、全データの再構築を行うことにより、元の記憶状態に復旧させる(ステップs)。
この時、全面データの再構築中の実行状況を、管理者が認識しやすいように、特定ステータスを故障ハードディスクg−1のスロット番号に対応するLEDw−1の表示によって通知する(ステップt)。
故障ハードディスクg−1に対する全面データの再構築に成功して、復旧が完了した場合は(ステップtの「成功」の場合)、ディスクアレイコントローラaは、故障ハードディスクg−1を状態kに復帰させて、当該ハードディスクg−1を論理的にディスクアレイに組み入れるとともに、当該ハードディスクg−1に対する仮復旧が行われた旨を、当該ハードディスクg−1のスロット番号に対応するLEDw−1の表示にて管理者に通知する(ステップu)。
一方、故障ハードディスクg−1に対する全面データの再構築に失敗して、復旧ができなかった場合は(ステップtの「失敗」の場合)、ディスクアレイコントローラaは、バックパネルコントローラcに対して、電源供給停止の指令を再度出力する。電源供給停止の指令を受信したバックパネルコントローラcは、スイッチf−1を電源供給停止の状態となるように、スイッチ制御線iを用いて変更することによって、ハードディスクg−1に対する電源dからの電源供給を停止する(ステップv)。
さらに、ディスクアレイコントローラaは、バックパネルコントローラcを制御して、ハードディスクg−1の故障状態を、ハードディスクg−1のスロット番号に対応するLEDw−1の表示を、仮復旧が不可能な物理的な故障発生の表示に変更することによって、管理者に伝えるとともに、電源供給の停止状態を継続して、ディスクアレイから完全に切り離す(ステップw)。以降は、管理者により、ハードディスクg−1の物理的な故障からの復旧が完了するまで、ハードディスクg−1はディスクアレイから物理的に切り離されて、ディスクアレイは縮退モードによる運転が行われる。
次に、以上に説明した本実施例について、さらに補足して説明する。ディスクアレイコントローラaにバスhを介して接続されているハードディスクg−1〜g−nのいずれかに故障が発生した場合には、ディスクアレイコントローラaは、故障ハードディスク例えばハードディスクg−1に対して論理的な切り離しを行う。
従来の技術においては、かくのごとく、論理的に切り離されたハードディスクg−1は、故障ハードディスクとしてディスクアレイコントローラaにて管理されているものの、管理者によるハードディスクの交換等による復旧までの間は、故障ハードディスクg−1をそのままの状態で、再組み込みを行なう仮復旧を行うように制御される。しかし、故障状態に陥ったハードディスクg−1は、論理的な切り離し・再組み込みを行うだけでは、故障モードがリセットされない場合がほとんどであり、その後の仮復旧に失敗するという問題が頻繁に発生してしまう。
図1〜図3にて説明した本発明の実施例においては、前述のような問題を解決するために、故障モードのハードディスクg−1に対して電源供給を停止する物理的なリセットを行い、しかる後、故障モードがリセットされたハードディスクg−1を用いた仮復旧を実施する手順を採用している。つまり、本発明の実施例は、(1)故障ハードディスクg−1の電源供給停止、(2)故障ハードディスクg−1に対する電源再供給、および、(3)物理リセット実施済みのハードディスクg−1への全データ再構築による仮復旧の手順を経ることにより、故障モードのハードディスクの復旧手順が構成されている。
(1)故障ハードディスクg−1の電源供給停止
ディスクアレイコントローラaは、故障が発生したハードディスクg−1を論理的に切り離す。さらに、ハードディスクに対する電源切断手段により故障ハードディスクg−1に対する電源の供給を停止する。これにより、故障ハードディスクg−1には、物理的なリセットが掛かり、一時的な誤動作による故障状態やファームウェア上の障害モード等による故障状態が、復旧された状態になる。
(2)故障ハードディスクに対する電源再供給
電源供給を停止した故障ハードディスクg−1がSpin Down(スピン・ダウン)して、スピン動作(回転動作)が完全に停止するまでの所要時間Nを、タイマeを用いて監視し、Spin Down動作の完了後に、故障ハードディスクg−1に対する電源供給を再開する。
(3)物理リセット実施済みのハードディスクg−1への全データ再構築による仮復旧
電源再供給が行われ、Spin Up(スピン・アップ)したハードディスクg−1に対して、ディスクアレイコントローラaは、全面にデータの再書き込みを実施し、元の記憶状態に復旧させた後、自動的にディスクアレイに再組み込みする。ここで、全データ再構築と復旧動作とが成功し、再組み込みが成功した場合は、バックパネルbの対応するLEDw−1への表示を用いて物理リセットによる復旧を実施した旨を管理者に伝える。一方、復旧作業に失敗した場合は、再度電源供給手段を用いて、電源の供給を停止して、物理的な切り離しを行い、バックパネルbの対応するLEDw−1への表示を用いて、ハードディスクg−1は、物理リセットでは除去することができない物理的な故障が発生した旨を管理者に伝える。
(本実施例の効果の説明)
以上に詳細に説明したように、本実施例に示した構成および動作を実施することにより、次のような効果が得られる。
第1の効果は、故障モードに陥ったハードディスクを用いた仮復旧の成功率が向上するため、ディスクアレイとしての冗長性も向上する。
その理由は、故障モードに陥ったハードディスクを電源断による物理リセットを行うことにより、故障モードをクリアすることが可能であるからである。ハードディスク内部の電子部品や機構部品あるいはPCBの電気的、機械的な故障を除けば、ハードディスクの一時的な誤動作やファームウェア停止等の故障モードについては、電源のリセットを行うことによって解消することができる。この結果、故障モードをクリアしたハードディスクを用いて仮復旧を成功させることによって、別のハードディスクが物理的に故障した際にも、ディスクアレイの縮退運転を行うことが可能であるため、ディスクアレイの冗長性を向上させることができる。
第2の効果は、物理的に故障したハードディスクを完全に切り離すことができる。
その理由は、物理リセットにより故障モードをクリアした後に、ハードディスク全面へのデータ書き込み(データ再構築)を実施した結果として、仮復旧が失敗した場合、そのハードディスクはファームウェアのリセット等では回避することができない物理的な故障が発生している可能性が大きい。かかるハードディスクに対しては、電源供給の停止状態を継続して物理的な切り離しを行うことにより、ディスクアレイを構成している他のハードディスクに影響を与えることを未然に防ぐことができる。
さらには、次のような利用も実現可能である。(N+1)の冗長度を有するディスクアレイ構成を使用したディスクアレイ装置において、ハードディスクの故障状態による縮退が発生した場合。ディスクアレイ装置は、縮退状態となった旨を、離れた場所にいる管理者にネットワーク等を用いて通達する。ここで、もし、縮退が発生した際に管理者が不在だった場合、ディスクアレイ装置は縮退状態のまま動作することになり、この状態にてもう1台のハードディスクが故障するとシステムダウンにつながる。本発明の活用例として、このような管理者不在時に発生したディスクアレイの縮退状態を、物理的なリセットを掛けることにより故障モードをクリアしたハードディスクを用いた仮復旧を行うことによって回避することができる。また、表示ランプ例であるLEDにて故障モードをクリアしたハードディスクや物理的な故障により切り離されたハードディスクを管理者に伝えて、管理者の到着後の復旧処理を容易化することができる。
以上、本発明の好適実施例の構成を説明した。しかし、斯かる実施例は、本発明の単なる例示に過ぎず、何ら本発明を限定するものではないことに留意されたい。本発明の要旨を逸脱することなく、特定用途に応じて種々の変形変更が可能であることが、当業者には容易に理解できよう。
本発明のディスクアレイ装置の構成の一例を示すブロック構成図である。 本発明の一例である図1のディスクアレイ装置における電源制御の状態遷移の一例を示す状態遷移図である。 本発明の一例である図1のディスクアレイ装置における電源制御の流れの一例を示すフローチャートである。
符号の説明
a ディスクアレイコントローラ
b バックパネル
c バックパネルコントローラ
d 電源
e タイマ
f−1〜f−n 電源制御用スイッチ
g−1〜g−n ハードディスク
h バス
i スイッチ制御線
j 電源線
w−1〜w−n LED
x LED制御線

Claims (17)

  1. 1ないし複数のハードディスクをアレイ状に備えたディスクアレイ装置において、故障が検出されて、ディスクアレイから論理的に切り離された故障ハードディスクに対して、電源の供給を停止することにより、物理的なリセットを実施した後、当該故障ハードディスクへの電源供給を再開することを特徴とするディスクアレイ装置。
  2. 前記故障ハードディスクの前記ディスクアレイからの論理的な切り離し状態、前記故障ハードディスクへの電源供給停止による物理的なリセットの実施状態、あるいは、当該故障ハードディスクへの電源供給の再開状態のうち、1ないし複数の状態を、表示ランプによりユーザに通知することを特徴とする請求項1に記載のディスクアレイ装置。
  3. 前記ハードディスクへの電源供給を停止した後、当該故障ハードディスクの回転動作が完全に停止するまでの所要時間の経過後に、当該故障ハードディスクへの電源供給を再開することを特徴とする請求項1または2に記載のディスクアレイ装置。
  4. 前記故障ハードディスクへの電源供給が再開された際に、論理的に切り離されていた前記ディスクアレイへの再組み込みを行うことを特徴とする請求項1ないし3のいずれかに記載のディスクアレイ装置。
  5. 前記故障ハードディスクへの電源供給の再開後に、当該故障ハードディスクの前記ディスクアレイへの再組み込みを行う動作に先立って、当該ハードディスクの全面に、全データ再構築を実施することを特徴とする請求項1ないし4のいずれかに記載のディスクアレイ装置。
  6. 前記故障ハードディスク全面に対する全データ再構築を実施した際に、全データ再構築に成功したか否かを判定し、成功した場合に、前記ディスクアレイへの再組み込みを行うことを特徴とする請求項5に記載のディスクアレイ装置。
  7. 前記故障ハードディスク全面に対する全データ再構築に成功し、前記ディスクアレイへの再組み込みを行った際に、前記ディスクアレイへの再組み込みに成功した旨を、表示ランプによりユーザに通知することを特徴とする請求項6に記載のディスクアレイ装置。
  8. 前記故障ハードディスク全面に対する全データ再構築を実施した際に、全データ再構築に失敗した場合、当該故障ハードディスクに対する電源の供給を継続して停止した状態にし、前記ディスクアレイから物理的に切り離すことを特徴とする請求項5ないし7のいずれかに記載のディスクアレイ装置。
  9. 前記故障ハードディスク全面に対する全データ再構築に失敗し、前記ディスクアレイから物理的に切り離した際に、前記ディスクアレイから物理的に切り離された旨を、表示ランプによりユーザに通知することを特徴とする請求項7に記載のディスクアレイ装置。
  10. 1ないし複数のハードディスクをアレイ状に備えたディスクアレイ装置におけるディスクアレイ復旧方法であって、故障が検出されて、ディスクアレイから論理的に切り離された故障ハードディスクに対して、電源の供給を停止することにより、物理的なリセットを実施した後、当該故障ハードディスクへの電源供給を再開することを特徴とするディスクアレイ復旧方法。
  11. 前記ハードディスクへの電源供給を停止した後、当該故障ハードディスクの回転動作が完全に停止するまでの所要時間の経過後に、当該故障ハードディスクへの電源供給を再開することを特徴とする請求項10に記載のディスクアレイ復旧方法。
  12. 前記故障ハードディスクへの電源供給が再開された際に、論理的に切り離されていた前記ディスクアレイへの再組み込みを行うことを特徴とする請求項10または11に記載のディスクアレイ復旧方法。
  13. 前記故障ハードディスクへの電源供給の再開後に、当該故障ハードディスクの前記ディスクアレイへの再組み込みを行う動作に先立って、当該ハードディスクの全面に、全データ再構築を実施することを特徴とする請求項10ないし12のいずれかに記載のディスクアレイ復旧方法。
  14. 前記故障ハードディスク全面に対する全データ再構築を実施した際に、全データ再構築に成功したか否かを判定し、成功した場合に、前記ディスクアレイへの再組み込みを行うことを特徴とする請求項13に記載のディスクアレイ復旧方法。
  15. 前記故障ハードディスク全面に対する全データ再構築を実施した際に、全データ再構築に失敗した場合、当該故障ハードディスクに対する電源の供給を継続して停止した状態にし、前記ディスクアレイから物理的に切り離すことを特徴とする請求項13または14に記載のディスクアレイ復旧方法。
  16. 請求項10ないし15のいずれかに記載の処理をコンピュータに実行させるためのプログラム。
  17. 請求項16に記載のプログラムを格納、記憶した記憶媒体。
JP2007040563A 2007-02-21 2007-02-21 ディスクアレイ装置、ディスクアレイ復旧方法、そのプログラム及び記憶媒体 Pending JP2008204238A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007040563A JP2008204238A (ja) 2007-02-21 2007-02-21 ディスクアレイ装置、ディスクアレイ復旧方法、そのプログラム及び記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007040563A JP2008204238A (ja) 2007-02-21 2007-02-21 ディスクアレイ装置、ディスクアレイ復旧方法、そのプログラム及び記憶媒体

Publications (1)

Publication Number Publication Date
JP2008204238A true JP2008204238A (ja) 2008-09-04

Family

ID=39781670

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007040563A Pending JP2008204238A (ja) 2007-02-21 2007-02-21 ディスクアレイ装置、ディスクアレイ復旧方法、そのプログラム及び記憶媒体

Country Status (1)

Country Link
JP (1) JP2008204238A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010198264A (ja) * 2009-02-25 2010-09-09 Fujitsu Ltd 冗長化システム、制御装置、制御方法
US10027532B2 (en) 2015-06-24 2018-07-17 Fujitsu Limited Storage control apparatus and storage control method

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09167427A (ja) * 1995-12-14 1997-06-24 Fujitsu Ltd ディスクアレイ装置
JPH09305329A (ja) * 1996-05-14 1997-11-28 Ekushingu:Kk 記憶装置アレイシステム
JP2002108573A (ja) * 2000-09-28 2002-04-12 Nec Corp ディスクアレイ装置、そのエラー制御方法、ならびにその制御プログラムを記録した記録媒体
JP2006252236A (ja) * 2005-03-11 2006-09-21 Nec Corp ハードディスク装置およびその電源制御方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09167427A (ja) * 1995-12-14 1997-06-24 Fujitsu Ltd ディスクアレイ装置
JPH09305329A (ja) * 1996-05-14 1997-11-28 Ekushingu:Kk 記憶装置アレイシステム
JP2002108573A (ja) * 2000-09-28 2002-04-12 Nec Corp ディスクアレイ装置、そのエラー制御方法、ならびにその制御プログラムを記録した記録媒体
JP2006252236A (ja) * 2005-03-11 2006-09-21 Nec Corp ハードディスク装置およびその電源制御方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010198264A (ja) * 2009-02-25 2010-09-09 Fujitsu Ltd 冗長化システム、制御装置、制御方法
JP4739432B2 (ja) * 2009-02-25 2011-08-03 富士通株式会社 冗長化システム、制御装置、制御方法
US10027532B2 (en) 2015-06-24 2018-07-17 Fujitsu Limited Storage control apparatus and storage control method

Similar Documents

Publication Publication Date Title
TWI337304B (en) Method for fast system recovery via degraded reboot
CN100517246C (zh) 一种计算机远程控制方法及***
JP5234115B2 (ja) 情報処理装置,処理部切換方法及び処理部切換プログラム
CN105700969A (zh) 服务器***
JPH11345219A (ja) アプリケ―ション実現方法及びアプリケ―ション実現装置
JP2003150280A (ja) バックアップ管理システムおよび方法
WO2012053110A1 (ja) 障害監視装置、障害監視方法及びプログラム
WO2015104841A1 (ja) 多重系システムおよび多重系システム管理方法
JP2015035175A (ja) 情報処理装置、仮想マシン制御方法および仮想マシン制御プログラム
US20040019824A1 (en) Mirrored extensions to a multiple disk storage system
US7861112B2 (en) Storage apparatus and method for controlling the same
JP2008204238A (ja) ディスクアレイ装置、ディスクアレイ復旧方法、そのプログラム及び記憶媒体
JP5445572B2 (ja) コンピュータシステム、待機電力削減方法、及びプログラム
JP2007011751A (ja) 計算機および退避復元プログラム
JP7288662B2 (ja) 障害監視復旧システム、その方法、およびそのプログラム
JP5387767B2 (ja) 実行中のプログラムの更新技術
TWI547798B (zh) 資料儲存系統及其控制方法
JP2009032100A (ja) 二重化plc
JP2004054616A (ja) ファームウェア自動修復機能を有する情報処理装置
JP6911591B2 (ja) 情報処理装置、制御装置および情報処理装置の制御方法
JP2011170680A (ja) フォールト・トレラントサーバ
JP2010146362A (ja) 制御装置、ストレージ装置および制御方法
JP4830698B2 (ja) 担当lun制御を用いたraid制御を行うディスクコントローラおよび診断制御方法
JP2007233667A (ja) 障害検出方式
JP2010147803A (ja) 通信装置および通信装置起動時の運用情報復元方法

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20091211

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20091214

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100119

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111219

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120110

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120529