JP2007286937A - ストレージ装置及びストレージ装置の電源障害管理方法 - Google Patents

ストレージ装置及びストレージ装置の電源障害管理方法 Download PDF

Info

Publication number
JP2007286937A
JP2007286937A JP2006114039A JP2006114039A JP2007286937A JP 2007286937 A JP2007286937 A JP 2007286937A JP 2006114039 A JP2006114039 A JP 2006114039A JP 2006114039 A JP2006114039 A JP 2006114039A JP 2007286937 A JP2007286937 A JP 2007286937A
Authority
JP
Japan
Prior art keywords
power supply
unit
data processing
storage
failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006114039A
Other languages
English (en)
Inventor
Naomi Okada
尚規 岡田
Hidehiro Nagaya
英弘 長屋
Shin Nakamura
伸 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2006114039A priority Critical patent/JP2007286937A/ja
Priority to US11/473,032 priority patent/US7581137B2/en
Publication of JP2007286937A publication Critical patent/JP2007286937A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/30Means for acting in the event of power-supply failure or interruption, e.g. power-supply fluctuations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Power Sources (AREA)
  • Debugging And Monitoring (AREA)

Abstract

【課題】本発明によるストレージ装置は、データ処理基板に電源異常が発生した場合、データ処理基板の主要機能を停止させてから、電源異常に関する情報をメモリに保存させることができる。
【解決手段】ストレージ装置1に取り付けられるデータ処理基板2の電源コントローラ2Aは、電圧検出回路2Dからの検出信号に基づいて、基板2上に搭載されているDC/DC電源2Bの作動状態を監視している。電源異常が検出された場合、電源コントローラ2Aは、直ちに全てのDC/DC電源2Bの作動を停止させる。DC/DC電源2Bの停止によって、データ処理基板2の主要な機能は停止する。そして、電源コントローラ2Aは、電源異常に関する情報をメモリ2Fに記憶させ、補助電源2Eを停止させる。メモリ2Fに保存された情報は、他のデータ処理基板等である中継装置4を介して、管理装置5に転送することができる。
【選択図】図1

Description

本発明は、ストレージ装置及びストレージ装置の電源障害管理方法に関する。
ストレージ装置は、多数のハードディスクドライブをアレイ状に接続した記憶部を備えており、サーバ等のホストコンピュータ(以下「ホスト」)に、論理的な記憶領域(論理ボリューム)を提供する。
信頼性や高可用性を高めるために、ストレージ装置では、RAID(Redundant Array of Independent Disks)に基づく冗長化された記憶領域をホストに提供する。このようなストレージ装置は、少なくとも一つ以上の制御基板を備えている。この制御基板は、ホストとの間のデータ授受及びハードディスクドライブとの間のデータ授受を制御する。
制御基板に何らかの障害が発生した場合、この障害の生じた制御基板のみを閉塞処理させることにより、ストレージ装置の動作を停止させずに、障害の生じた制御基板を交換できるようにした技術は知られている(特許文献1)。
制御基板に障害が発生した場合、制御基板の有する複数の機能のそれぞれについて、個別に電源供給を制御できるようにした技術も知られている(特許文献2)。
電子計算機システム内で生じた障害に関する情報を収集し、この障害情報を不揮発メモリに格納させることにより、システムの保守性を向上させる技術も知られている(特許文献3)。
特開2003−36127号公報 特開2006−31630号公報 特開平5−324367号公報
制御基板は電源電圧を監視しており、電源電圧の異常を検出した場合、直ちに制御基板内の全ての電源供給を停止させる。電源電圧の異常によって電子回路が誤動作すると、この誤動作によって不正なデータの読み書きが行われる可能性等があるためである。例えば、複数種類の電源電圧を用いるLSI(Large Scale Integration)等では、そのうちの一種類の電源電圧が停止した状態で長時間動作を続けると、素子破壊を招く可能性もある。そこで、制御基板は、安全性及び信頼性を維持するために、いずれか一つの電源電圧に異常が生じた場合でも、直ちに全ての電源電圧を停止させる。
その後、電源異常の検出された制御基板は、保守員によってストレージ装置から取り外されて、ベンダの修理センタ等に送付される。しかし、制御基板のどの電源電圧に異常が生じたかを示す情報は存在しないため、修理センタの作業者は、電源異常の生じた制御基板を試験用のストレージ装置に装着して、電源異常の再現を試みる。作業者は、制御基板上の多くの箇所の電圧波形を観測しながら、原因を究明する。従って、故障した部位の特定や原因の究明のために長い時間を必要とし、検査作業や解析作業の作業性が低い。
本発明は、上記の問題点に鑑みてなされたもので、その目的は、電源障害に関する情報をデータ処理基板に保持させることにより、障害解析作業等の作業性を向上させることができるようにしたストレージ装置及びストレージ装置の電源障害管理方法を提供することにある。本発明の他の目的は、障害の検出された電源部を直ちに停止させた後で、電源障害に関する情報を補助電源の電源電圧を用いて記憶部に書き込ませることにより、信頼性の確保及び保守性の向上を実現できるようにしたストレージ装置及びストレージ装置の電源障害管理方法を提供することにある。本発明のさらなる目的は、後述する実施形態の記載から明らかになるであろう。
上記課題を解決すべく、本発明の一つの観点に従うストレージ装置は、上位装置に記憶領域を提供するストレージ装置であって、少なくとも一つ以上のデータ処理基板を備えており、データ処理基板は、負荷に電力を供給する少なくとも一つ以上の電源部と、電源部の作動状態を検出して信号を出力する検出部と、検出部からの信号に基づいて電源部の作動を制御する少なくとも一つ以上の電源制御部と、監視結果を記憶するための記憶部と、電源部の作動が停止した場合でも、記憶部への情報書込みを可能とするための補助電源部と、を備えており、電源制御部は、電源部の作動状態を監視して、この監視結果を記憶部に記憶させ、かつ、電源部に障害が検出された場合は当該電源部の作動を停止させるようになっている。
本発明の実施形態では、記憶部に記憶された監視結果をデータ処理基板の外部に出力するためのインターフェース部を備える。
本発明の実施形態では、データ処理基板は、それぞれ異なる電源部の作動を制御するための複数の電源制御部を備えており、各電源制御部は、それぞれの制御下にある電源部の作動状態を所定の場合に監視し、この監視結果を記憶部にそれぞれ記憶させる。
本発明の実施形態では、データ処理基板は複数設けられており、各データ処理基板のうち一方のデータ処理基板の電源制御部によって電源障害が検出された場合には、一方のデータ処理基板から他方のデータ処理基板に電源障害の発生を通知する。
本発明の実施形態では、他方のデータ処理基板は、一方のデータ処理基板から通知を受領した場合、上位装置に電源障害の発生を通知する。
本発明の実施形態では、データ処理基板は複数設けられており、各データ処理基板のうち一方のデータ処理基板の記憶部に記憶されている状態検出情報に、他方のデータ処理基板からアクセス可能である。
本発明の実施形態では、電源制御部は、検出部からの信号に基づいて電源部に障害が発生したと判定した場合には、障害の発生した電源部に関する監視結果を記憶部に記憶させる。
本発明の実施形態では、電源制御部は、電源部の作動を停止させた後で、監視結果を記憶部に記憶させる。
本発明の実施形態では、電源制御部は、定期的に電源部の作動状態を監視し、この監視結果を記憶部に記憶させる。
本発明の実施形態では、電源制御部は、予め設定された所定の条件が検出された場合に、電源部の作動状態を監視し、この監視結果及び検出された所定の条件とを対応付けて記憶部に記憶させる。所定の条件としては、例えば、電源電圧の異常が検出された場合、前回の監視時から所定の時間が経過した場合、予め設定された所定の状態変更(動作)が検出された場合等を挙げることができる。所定の状態変更としては、例えば、新規インストール、リプレース、増設、減設、稼働停止等を挙げることができる。
本発明の実施形態では、記憶部に記憶されている監視結果のうち所定の情報のみが選択して読み出される。
本発明の実施形態では、電源制御部は、電源部の障害発生を検出した場合、この障害発生が検出されたときの監視結果を記憶部に記憶させた後、補助電源の作動を停止させるようになっている。
本発明の他の観点に従うストレージシステムは、上位装置と記憶デバイスとの間のデータ授受を制御するストレージ装置と、このストレージ装置に接続された管理装置とを有するストレージシステムであって、(1)ストレージ装置は、上位装置及び/または記憶デバイスとの間のデータ授受をそれぞれ処理するための第1データ処理基板及び第2データ処理基板を備えており、(2)第1データ処理基板及び第2データ処理基板は、互いに通信可能に接続されており、かつ、第1基板と、第1基板に一体的に設けられる複数の第2基板とを含んでそれぞれ構成される。(3)第1基板は、データ転送を行うためのデータ転送回路と、データ転送回路に電源を供給するための複数の第1電源部と、各第1電源部の出力電圧をそれぞれ検出して信号を出力する第1電圧検出部と、第1電圧検出部からの信号に基づいて各第1電源部の作動をそれぞれ制御する第1電源制御部と、記憶部と、記憶部に記憶された情報を出力するためのインターフェース部と、を備えて構成される。(4)各第2基板は、マイクロプロセッサ回路と、マイクロプロセッサ回路に電源を供給するための複数の第2電源部と、各第2電源部の出力電圧をそれぞれ検出して信号を出力する第2電圧検出部と、第2電圧検出部からの信号に基づいて各第2電源部の作動をそれぞれ制御する第2電源制御部と、を備えて構成される。(5)第1電源制御部は、所定の場合に、各第1電源部の作動状態の監視結果を記憶部に記憶させ、第2電源制御部は、所定の場合に、各第2電源部の作動状態の監視結果を記憶部に記憶させ、(6)第1データ処理基板のマイクロプロセッサ回路及び第2データ処理基板のマイクロプロセッサ回路は、第1データ処理基板の記憶部及び第2データ処理基板の記憶部にそれぞれアクセス可能であり、記憶部に記憶された監視結果を管理装置に出力可能となっており、(7)第1データ処理基板のマイクロプロセッサ回路及び第2データ処理基板のマイクロプロセッサ回路は、記憶部に記憶された監視結果のうち一部の情報のみを取得可能となっている。
本発明のさらに別の観点に従うストレージ装置の電源障害管理方法は、複数のデータ処理基板を有するストレージ装置の電源障害を管理するための方法であって、各データ処理基板は、負荷に電力を供給する複数の電源部をそれぞれ備え、各電源部の作動状態をそれぞれ検出するステップと、検出された作動状態に基づいて各電源部に障害が発生しているか否かを判定するステップと、各電源部のいずれかに障害が発生していると判定された場合には、各電源部の作動を全て停止させるステップと、障害の検出された電源部に関する情報を記憶部に記憶させるステップと、記憶部に記憶された情報を読み出すステップと、読み出された情報を解析するステップと、をそれぞれ実行する。
以下、図面に基づき、本発明の実施の形態を説明する。本実施形態では、以下に述べるように、制御パッケージ内で生じた電源障害に関する情報を、その制御パッケージ内に保持させる。そして、その制御パッケージに保持された電源障害に関する情報にアクセスするための手段を提供する。
図1は、本実施形態によるストレージ装置1の全体概要を示す構成説明図である。ストレージ装置1は、例えば、複数の制御パッケージ2と、制御パッケージ2に電源を供給するためのメイン電源3とを備えている。制御パッケージ2は、「データ処理基板」に該当する。
制御パッケージ2は、例えば、「電源制御部」としての電源コントローラ2Aと、「電源部」としてのDC/DC電源2Bと、「負荷」としての複数の回路2Cと、「検出部」としての電圧検出回路2Dと、「補助電源部」としての補助電源2Eと、「記憶部」としてのメモリ2Fと、「インターフェース部」としてのインターフェース(図中「I/F」)2Gとを備えて構成される。
電源コントローラ2Aは、各DC/DC電源2Bの作動を制御する。電源コントローラ2Aは、例えば、予め設定されている所定の立ち上げシーケンスに従って、各DC/DC電源2Bを所定の順番で作動させる。また、電源コントローラ2Aは、いずれかのDC/DC電源2Bから出力される電源電圧に異常が検出された場合、直ちに全てのDC/DC電源2Bの作動を停止させる。
さらに、電源コントローラ2Aは、全てのDC/DC電源2Bの作動を停止させた後で、電源電圧の異常に関する情報をメモリ2Fに書込む。そして、電源コントローラ2Aは、電源電圧の異常に関する情報(電源障害情報)を書き込んだ後、補助電源2Eの作動を停止させる。
DC/DC電源2Bは、電源コントローラ2Aによって制御されるもので、メイン電源3から供給された交流または直流の電源電圧を、所定の直流電源に変換して出力させるものである。各DC/DC電源2Bは、例えば、3.3ボルトや1.5ボルト等のように、それぞれ異なる値の電源電圧を出力する。各DC/DC電源2Bから出力される電源電圧は、所定の回路2Cにそれぞれ供給される。
回路2Cは、例えば、データ転送を行うための専用LSIや、マイクロプロセッサ、その他の電子回路等として構成される。例えば、ある回路2Cは一種類の電源電圧のみで動作し、他の回路2Cは、複数種類の電源電圧を用いて動作する。
電圧検出回路2Dは、各DC/DC電源2Bから出力される電源電圧をそれぞれ検出し、検出された電源電圧を電源コントローラ2Aに出力する。電源コントローラ2Aは、電圧検出回路2Dからの検出信号に基づいて、DC/DC電源2Bから出力される電源電圧に異常が生じたか否かを判定する。
補助電源2Eは、各DC/DC電源2Bと独立して設けられており、メイン電源3から供給される電源電圧を所定の直流電圧に変換して、電源コントローラ2A及びメモリ2Fの情報書込み部にそれぞれ供給する。電源コントローラ2Aは、各DC/DC電源2Bの作動が停止した場合でも、補助電源2Eから供給される電源電圧を用いて、電源障害に関する情報をメモリ2Fに書き込むことができる。
メモリ2Fは、電源障害に関する情報を記憶するための記憶デバイスであって、例えば、フラッシュメモリやFeRAM (Ferroelectric Random Access Memory)等の不揮発メモリから構成される。バックアップ電源が不要で、データの追加記録が可能な記憶デバイスであれば、メモリ2Fとして好適に用いることができる。不揮発メモリの場合は、バックアップ電源が不要なため、構成を簡素化することができる。但し、これに限らず、例えば、SRAM(Static Random Access Memory)等のようなバックアップ電源を必要とする他の記憶デバイスを用いる構成でもよい。
インターフェース2Gは、メモリ2Fに記憶されている電源障害情報を外部に出力するためのものである。このインターフェース2Gには、中継装置4を介して、管理装置5が接続されている。中継装置4としては、例えば、別のデータ処理基板が用いられる。即ち、ストレージ装置1の備える複数のデータ処理基板2は、互いに相手方のデータ処理基板2から電源障害に関する情報を読み出すことができる。異なるデータ処理基板(中継装置4)によって読み出された電源障害に関する情報は、管理装置5に伝達される。管理装置5は、電源障害に関する情報を画面に表示等することにより、保守員やユーザに、電源障害の発生等を通知する。
上述のように、電源障害が発生した場合、そのデータ処理基板2では、全てのDC/DC電源2Bの作動が直ちに停止され、その後に、電源障害に関する情報がメモリ2Fに書き込まれる。ストレージ装置1は、電源障害の生じたデータ処理基板2について閉塞処理を行い、ストレージ装置1から取り外せる状態にする。なお、電源障害の生じたデータ処理基板2で担当していたデータアクセス処理等は、他の正常なデータ処理基板2によって肩代わりされる。
ストレージ装置1から取り外されたデータ処理基板2は、ストレージ装置1のベンダによって運営される修理センタ等に送られる。修理センタでは、電源障害の生じたデータ処理基板2のメモリ2Fから電源障害に関する情報を読出して、どのDC/DC電源2Bに異常が生じたのかを確認する。また、修理センタでは、電源障害の生じたデータ処理基板2を別のストレージ装置1に取り付けて、電源障害の再現を試みる。このような障害解析作業によって得られたデータや知見は、例えば、障害情報データベースに蓄積され、ストレージ装置1の改善等に用いられる。
本実施形態は、上述のように構成されるため、以下の効果を奏する。本実施形態では、データ処理基板2上に電源障害に関する情報を保持させるため、障害の解析作業や保守作業の作業性を向上させることができる。
また、本実施形態では、全てのDC/DC電源2Bの作動を停止させてから、電源障害に関する情報をメモリ2Fに書き込むため、回路2Cの誤動作等を防止して信頼性を維持しつつ、保守作業等の効率を改善できる。
さらに、本実施形態では、メモリ2Fから電源障害に関する情報を読み出すためのインターフェース2Gを設け、他のデータ処理基板2(中継装置4)を介して、電源障害に関する情報を外部に取り出すことができる。これにより、電源障害の生じたストレージ装置1においても、障害の生じたデータ処理基板2から電源障害に関する情報をその場で直ちに取得することができ、かつ、電源障害の生じたストレージ装置1と物理的に離れた修理センタ等においても、その障害の生じたデータ処理基板2から電源障害に関する情報を読み出すことができ、保守作業における使い勝手が向上する。以下、本実施形態を詳細に説明する。
図2は、ストレージ装置を含むストレージシステムの全体構成を模式的に示す説明図である。このストレージシステムは、例えば、ストレージ装置10と、管理端末20と、ホスト30と、管理サーバ40とを備えることができる。
ストレージ装置10の詳細はさらに後述する。管理端末20は、例えば、パーソナルコンピュータや携帯情報端末等のようなコンピュータ装置として構成されており、例えば、LAN等の通信ネットワークCN2(図3参照)を介して、ストレージ装置10の制御パッケージ142に接続されている。また、管理端末20は、LANやインターネット等の通信ネットワークCN3を介して、管理サーバ40に接続することもできる。管理サーバ40は、複数の管理端末20に接続可能であり、例えば、各管理端末20により収集された電源障害情報を統計解析等することもできる。
管理端末20は、管理用のユーザインターフェース(図中「UI」と略記)21を備えている(図3参照)。ユーザは、管理用ユーザインターフェース21を用いて、ストレージ装置10の構成を変更等したり、ストレージ装置10から各種の情報(性能情報、環境情報等)を取得することができる。また、管理用ユーザインターフェース21には、後述のように、制御パッケージ142内で生じた電源障害に関する情報が表示される。なお、ユーザインターフェース21は、文字や画像等による画面出力に限らず、合成音声メッセージ等によって各種の通知を行うこともできる。
ホスト30は、例えば、サーバコンピュータ、メインフレームマシン等のようなコンピュータ装置として構成される。ホスト30は、例えば、LAN(Local Area Network)やSAN(Storage Area Network)等の通信ネットワークCN1を介して、ストレージ装置10の制御パッケージ142に接続される。ホスト30は、ストレージ装置10内に設けられたボリューム133(図3参照)に、データを読み書きする。
なお、管理端末20がストレージ装置10の電源障害の状態を管理する場合を例に挙げるが、これに限らず、ホスト30にストレージ管理プログラムを設け、ホスト30がストレージ装置10の電源障害を管理する構成でもよい。
ストレージ装置10の構成を説明する。ストレージ装置10は、例えば、基本筐体11と、増設筐体12とを備えて構成されており、基本筐体11と増設筐体12とは、SAN等の通信経路17を介して接続されている。基本筐体11は、ストレージ装置10の動作を制御等するための基本的な機能を集約した筐体であり、増設筐体12は、ユーザの希望等によって任意に追加されるオプション筐体である。
基本筐体11には、例えば、ハードディスクボックス13と、コントローラ14と、AC/DC電源(以下「メイン電源」)15と、バッテリ部16とが設けられる。増設筐体12には、例えば、ハードディスクボックス13と、メイン電源15と、バッテリ部16とが設けられている。
コントローラ14は、複数の制御パッケージ141,142等から構成される。一つの制御パッケージ141はホスト30とのデータ授受を制御するためのチャネルアダプタパッケージであり、他の一つの制御パッケージ142は、ディスクドライブ131とのデータ授受を制御するためのディスクアダプタパッケージである。なお、これら以外に、メモリパッケージ等もコントローラ14に設けられる。
図3を用いて、ストレージ装置10の構成を説明する。ストレージ装置10のコントローラ14は、例えば、複数のチャネルアダプタ141と、複数のディスクアダプタ142と、キャッシュメモリ143と、共有メモリ144と、接続制御部145と、サービスプロセッサ146とを備えて構成することができる。なお、以下の説明では、チャネルアダプタ141をCHA141と、ディスクアダプタ142をDKA142と、サービスプロセッサ146をSVP146と、それぞれ略記する。
CHA141は、ホスト30との間のデータ転送を制御するもので、複数の通信ポート281を備えている。ストレージ装置10には、複数のCHA141を設けることができる。CHA141は、例えば、オープン系サーバ用CHA、メインフレーム系用CHA等のように、ホスト30の種類に応じて用意される。各CHA141は、それぞれに接続されたホスト30から、データの読み書きを要求するコマンドを受信し、ホスト30から受信したコマンドに従って動作する。
DKA142は、ストレージ装置10内に複数個設けることができる。各DKA142は、各ディスクドライブ131との間のデータ通信を制御する。各DKA142と各ディスクドライブ131とは、ファイバチャネルプロトコルに従ってブロック単位のデータ転送を行う。各DKA142は、ディスクドライブ131の状態を随時監視しており、この監視結果は、ネットワークCN5を介して、SVP146に送信される。
なお、各CHA141及び各DKA142をそれぞれ別々の制御回路基板として構成することもできるし、一つの制御回路基板にCHA機能及びDKA機能をそれぞれ設けることもできる。
キャッシュメモリ143は、例えば、ホスト30から読み出されたデータやホスト30から書き込まれたデータ等を記憶する。共有メモリ(あるいは制御メモリ)144は、ストレージ装置10の作動を制御するための各種制御情報や管理情報等を記憶する。
なお、キャッシュメモリ143と共有メモリ144とを別々のメモリ回路基板として構成してもよいし、一つのメモリ回路基板内にキャッシュメモリ143及び共有メモリ144を実装してもよい。また、キャッシュメモリの一部を制御情報を格納するための制御領域として使用し、他の部分をデータを記憶するためのキャッシュ領域として使用する構成でもよい。
接続制御部145は、各CHA141と、各DKA142と、キャッシュメモリ143と、共有メモリ144とをそれぞれ接続するものである。これにより、全てのCHA141,DKA142は、キャッシュメモリ143及び共有メモリ144にそれぞれアクセス可能である。接続制御部145は、例えば、クロスバスイッチ等として構成される。
SVP146は、内部ネットワークCN5を介して、各CHA141にそれぞれ接続されている。SVP146は、例えば、共有メモリ144やCHA141を介して、各DKA142の状態をそれぞれ取得することもできる。SVP146は、ストレージ装置10内の各種状態に関する情報をそれぞれ取得し、これらの情報を管理端末20に提供する。また、SVP146は、管理端末20からの指示に基づいて、ストレージ装置10の構成変更を行うこともできる。
次に、ストレージ装置10の記憶構造について説明する。ストレージ装置10は、複数のディスクドライブ131を備えることができる。ディスクドライブ131としては、例えば、ハードディスクドライブ、半導体メモリドライブ、光ディスクドライブ、光磁気ディスクドライブ、磁気テープドライブ等を挙げることができる。また、ディスクドライブ131をハードディスクドライブとして構成する場合、例えば、SATA(Serial AT Attachment)ディスクや、FC(Fibre Channel)ディスク等を挙げることができる。異なる種類のハードディスクドライブを混在させることもできる。
ディスクドライブ131の記憶領域を用いて、一つまたは複数の論理ボリューム(図中「LU」と略記)133を生成することができる。この論理ボリューム133は、論理的記憶デバイスとも呼ばれる。例えば、一つのディスクドライブ131の記憶領域に、一つまたは複数の論理ボリューム133を作成することができる。または、複数のディスクドライブ131の記憶領域をグループ化して、一つまたは複数の論理ボリューム133を設けることもできる。このようなグループ132は、パリティグループまたはRAIDグループと呼ばれる。管理端末20は、ホスト30と論理ボリューム133との間のアクセスパスを設定し、ホスト30に論理ボリューム133を提供する。ホスト30は、この論理ボリューム133にアクセスすることにより、データの読み書きを行う。
次に、コントローラ14によるデータ入出力処理を先に説明する。CHA141は、ホスト30から受信したリードコマンドを共有メモリ144に記憶させる。DKA142は、共有メモリ144を随時参照しており、未処理のリードコマンドを発見すると、ディスクドライブ131からデータを読み出して、キャッシュメモリ143に記憶させる。CHA141は、キャッシュメモリ143にコピーされたデータを読み出し、ホスト30に送信する。
CHA141は、ホスト30からライトコマンドを受信すると、ライトコマンドを共有メモリ144に記憶させる。CHA141は、受信したライトデータをキャッシュメモリ143に記憶させる。CHA141は、キャッシュメモリ143にライトデータを記憶させた後、ホスト30に書込み完了を報告する。DKA142は、共有メモリ144に記憶されたライトコマンドに従って、キャッシュメモリ143に記憶されたライトデータを読出す。DKA142は、書込み先として指定された論理ボリューム133を構成するディスクドライブ131に、ライトデータを記憶させる。なお、ライトデータをディスクドライブ131に書き込んだ後で、ホスト30に書込み完了を報告する構成でもよい。
以下、「データ処理基板」に対応する制御パッケージの例として、CHA141のパッケージを例に挙げて説明する。なお、DKA142等の他のパッケージについても、本発明の電源障害管理方法は有効に機能する。
図4は、CHA141の概略構成を示す回路図である。CHA141は、例えば、電源コントローラ210と、DC/DC電源220A,220B,220Cと、各種の電子回路230A,230B,230Cと、電圧検出回路240と、補助電源250と、メモリ260と、インターフェース270とを備えている。
電源コントローラ210は、各DC/DC電源220A,220B,220Cの作動をそれぞれ制御する。また、電源コントローラ210は、電源障害が発生した場合等に、各DC/DC電源220A,220B,220Cの作動を直ちに停止させた後で、電源障害に関する情報(電源障害情報)をメモリ260に書き込む。
DC/DC電源220A,220B,220Cは、メイン電源15から入力される電源電圧を変換して出力する。DC/DC電源220A,220B,220Cは、それぞれ異なる種類の電源電圧を回路230A,230B,230Cに供給する。なお、以下の説明では、特に区別する必要がない場合は、「DC/DC電源220」と略記する場合がある。
電子回路230A,230B,230Cは、例えば、データ転送用LSIやマイクロプロセッサ、その他の電子回路のように構成される。本実施例では、説明の便宜上、例えば、電子回路230Aが、データ転送回路及びマイクロプロセッサの機能をそれぞれ実現するものとする。後述の実施例では、データ転送を行う回路とマイクロプロセッサとを区別して説明する。なお、各電子回路を特に区別する必要がない場合、「電子回路230」と略記する場合がある。
電圧検出回路240は、各DC/DC電源220から出力される電源電圧の値を監視しており、検出された電圧値を電源コントローラ210に入力する。図中、電圧検出回路240から各DC/DC電源220毎にそれぞれ出力される検出信号に、SENS1,SENS2,SENS3の符号を付す。
補助電源250は、各DC/DC電源220とは別に設けられており、メイン電源15から入力される電源電圧を所定の直流電圧に変換して、電源コントローラ210及びメモリ260にそれぞれ供給する。詳細は後述するが、補助電源250は、各DC/DC電源220の作動が停止した後も、所定の比較的短い時間の間だけ、電源コントローラ210及びメモリ260に電力を供給し続ける。そして、電源コントローラ210がメモリ260に電源障害情報を書き込んだ後、補助電源250の作動は停止される。これにより、CHA141の全機能が停止する。
メモリ260は、例えば、不揮発メモリとして構成される。メモリ260には、電源コントローラ210によって、電源障害情報(後述のステータス情報またはステータス履歴情報)が書き込まれる。
メモリ260には、インターフェース270が接続されており、このインターフェース270を介して、メモリ260に記憶された情報をCHA141の外部に読み出すことができるようになっている。例えば、インターフェース270には、図3中の接続制御部145を介して、別のCHA141が接続されている。この別のCHA141は、SVP146を介して管理端末20に接続されている。これにより、管理端末20は、SVP146等を介して、メモリ260内に記憶された電源障害情報を読出し、ユーザや保守員に障害の発生等を通知することができる。
次に、各DC/DC電源220が正常状態であるか異常状態であるかを判別するための方法を説明する。図5は、各DC/DC電源220を作動させる場合の立ち上げシーケンスを示す説明図である。
図中「ST」は、ステータス期間を示す。一つの例として、正常な立ち上げシーケンスでは、最初に第1期間ST1において第1DC/DC電源220Aを作動させ、次に第2期間ST2において第2DC/DC電源220Bを作動させ、最後に、第3期間ST3において第3DC/DC電源220Cを作動させる。電源コントローラ210が、所定の順番(第1DC/DC電源→第2DC/DC電源→第3DC/DC電源)で、各DC/DC電源220をそれぞれ作動させることにより、回路230が正常に起動する。
第1DC/DC電源220Aが作動を開始すると、電圧検出回路240は、第1DC/DC電源220Aの出力電圧を検出し、検出信号(SENS1)を電源コントローラ210に出力する。これにより、電源コントローラ210は、第1DC/DC電源220Aが正常に起動したことを確認する。正常に起動した場合、第1DC/DC電源220Aのステータスは、”0”から”1”に変化する。ステータス”0”は停止状態を示し、ステータス”1”は作動状態を示す。
以下同様に、第2DC/DC電源220B,第3DC/DC電源220Cが作動を開始すると、そのステータスは”0”から”1”に変化する。上述のように、電源コントローラ210は、所定の順番で各DC/DC電源220A,220B,220Cを作動させる。
従って、最初の第1期間ST1では、第1DC/DC電源220Aのステータスのみが”1”となり、第2DC/DC電源220B及び第3DC/DC電源220Cのステータスはそれぞれ”0”となる。次の第2期間ST2では、第1DC/DC電源220A及び第2DC/DC電源220Bのステータスがそれぞれ”1”となり、第3DC/DC電源220Cのステータスのみが”0”となる。最後の第3期間ST3では、全てのDC/DC電源220A,220B,220Cのステータスは、全て”1”となる。
図6は、ステータス情報フォーマット300の例を示す説明図である。このフォーマット300を参照することにより、各DC/DC電源220が正常に動作しているか否かを容易に判別することができる。
第1期間ST1では、第1DC/DC電源220Aのステータスのみが”1”となり、他の第2DC/DC電源220B及び第3DC/DC電源220Cのステータスはそれぞれ”0”となる場合のみが、正常状態(OK)を示す。これ以外の場合は、全て異常状態(NG)を示すことになる。正常状態におけるステータスの組合せを白い矢印で示す。
同様に、第2期間ST2では、第1DC/DC電源220A及び第2DC/DC電源220Bのステータスがそれぞれ”1”で、第3DC/DC電源220Cのステータスのみが”0”となった場合のみが、正常状態を示す。これ以外の場合は、全て異常状態となる。
同様に、第3期間ST3では、全てのDC/DC電源220A,220B,220Cのステータスが全て”1”となったばあいのみが正常状態を示す。これ以外の場合は、全て異常状態となる。
図6の下側に示すように、電源コントローラ210は、所定の場合に、ステータス履歴情報310を作成し、このステータス履歴情報310をメモリ260に記憶させる。所定の場合とは、例えば、各DC/DC電源220のいずれかに異常が検出された場合等であるが、後述のように、これ以外の場合でも、電源コントローラ210は、ステータス履歴情報310を作成することができる。
ステータス履歴情報310とは、電源障害に関する情報であり、例えば、連続番号と、ステータス情報とを対応付けることにより、構成される。連続番号は、各ステータス履歴情報310をそれぞれ識別するための番号であり、例えば3ビットが割り当てられる。ステータス情報は、ある期間STにおける各DC/DC電源220のステータスの組合せを示す情報であり、例えば5ビットが割り当てられる。
ステータス情報の最初の2ビットは、期間STの区別に使用される。第1期間ST1は”01”、第2期間ST2は”10”、第3期間ST3は”11”となる。ステータス情報の残りの3ビットは、ステータスの組合せを示す。この3ビットは、各DC/DC電源220のステータスをそれぞれ示す。最初の1ビットは、第1DC/DC電源220Aのステータスを示し、次の1ビットは第2DC/DC電源220Bのステータスを示し、最後の1ビットは第3DC/DC電源220Cのステータスを示す。例えば、”000”は全てのDC/DC電源220の作動が停止していることを示し、”111”は全てのDC/DC電源220が作動していることを示す。また、”100”は第1DC/DC電源220のみが作動していることを示す。つまり、期間を区別する2ビットとステータスの組合せを示す3ビットとによって、どのDC/DC電源220に異常が生じたかを判別することができる。このように、ステータス履歴情報310は、合計8ビットのデータとして構成可能である。
なお、図6に示すステータス履歴情報310の構成は一例であり、本発明はこれに限定されない。例えば、後述の実施例で明らかになるように、ストレージ装置10の構成変更等に関する情報や時刻情報等を含めることもできる。また、どのCHA141に関する情報であるかを示すために、CHA141を特定するための識別情報を含めてもよい。さらに、どのストレージ装置10で使用されていたかを示すために、ストレージ装置10の装置番号等を含めることもできる。
図7は、電源異常(電源障害)を監視するための処理と電源異常を解析するための処理とを示すフローチャートである。なお、以下の各フローチャートも同様であるが、各フローチャートは、本発明の理解及び実施に必要な範囲で処理の概要を示しており、実際のプログラムと相違する場合がある。
まず、図7中の左側に示すように、電源コントローラ210は、電圧検出回路240からの信号(SENS1〜SENS3)をそれぞれ読込み(S11)、図5に示す正常な電源シーケンスを確認し(S12)、電源異常の有無を判定する(S13)。
電源異常が生じた場合(S13:YES)、電源コントローラ210は、直ちに全てのDC/DC電源220の作動を停止させる(S14)。これにより、各電子回路230の作動もそれぞれ停止する。しかし、電源コントローラ210及びメモリ260だけは、補助電源250によってバックアップされている。
CHA141の主要なデータ処理機能(電子回路230で実現される機能)のみを停止させた後、電源コントローラ210は、電源異常が検出されたときにおける各DC/DC電源220のステータスに基づいてステータス履歴情報310を作成し、この作成したステータス履歴情報310をメモリ260に記憶させる(S15)。なお、本実施例では、電源異常が検出された場合にのみステータス履歴情報310を作成するため、ステータス履歴情報という名称に代えて、ステータス管理情報等と呼び変えることもできる。
電源コントローラ210は、ステータス履歴情報310をメモリ260に書き込んだ後、補助電源250の作動を停止させる(S16)。これにより、障害の検出されたCHA141は、機能を停止する。
管理端末20は、電源障害(電源異常)の検出されたCHA141のメモリ260に、別の正常なCHA141を介してアクセスし、ステータス履歴情報310を読み出すことができる(S17)。そして、ユーザや保守員は、メモリ260から読み出したステータス履歴情報310を管理端末20の画面に表示等させることにより、ステータス履歴情報310の内容を解析することができる(S18)。この解析結果は、例えば、管理サーバ40によって一元管理されている障害情報データベースに保存される(S19)。
なお、上記の説明では、ストレージ装置10の設置されている場所で、電源障害を解析する場合を述べたが、これに限らず、例えば、修理工場や研究所等において、CHA141のメモリ260からステータス履歴情報310を読み出して、障害の解析等を行うこともできる。
本実施例は、上述のように構成されるため、以下の効果を奏する。本実施例では、CHA141等のパッケージ内に電源障害に関する情報(ステータス履歴情報310)を保持させるため、障害の解析作業や保守作業の作業性を向上させることができる。
本実施例では、補助電源250によってステータス履歴情報310の生成及び保存に関する部分のみを部分的にバックアップする構成とした。これにより、全てのDC/DC電源220の作動を停止させてから、ステータス履歴情報310をメモリ260に書き込むことができる。従って、電子回路230の誤動作等を防止して信頼性を維持することができ、かつ、保守作業等の作業性を向上させることができる。
つまり、本実施例では、電源異常が発生した場合、この電源異常によって直接的な影響を受けうる主要機能(データ処理機能、データ転送機能)を直ちに停止させ、電源異常に関する情報を保存する機能だけをバックアップする。これにより、電源異常の発生時に、データ処理またはデータ転送に関する不具合が生じるのを未然に防止しつつ、電源異常に関する情報を保存して、障害の通知や解析処理に役立たせることができる。
本実施例では、メモリ260からステータス履歴情報310を読み出すためのインターフェース270を設けるため、管理端末20は、他のCHA141を介して、ステータス履歴情報310を取得することができる。これにより、電源障害の生じたストレージ装置10においても、障害の生じたCHA141から電源障害に関する情報をその場で直ちに取得して、ある程度の調査を行うことができる。また、修理センタ等においても、その電源障害の生じたCHA141のメモリ260からステータス履歴情報310を読み出すことができ、保守作業における使い勝手が向上する。
図8〜図11に基づいて、本発明の第2実施例を説明する。本実施例を含む以下の各実施例は、第1実施例の変形例に該当する。以下の説明では、第1実施例との相違点を中心に説明する。本実施例では、データ処理基板の一例であるCHA141を複数の基板201,202から2階建てで構成し、複数の基板202で検出された電源障害に関する情報を共通のメモリ261に記憶させる。
図8は、CHA141の基板構造を模式的に示す説明図である。図8(a)の斜視図に示すように、このCHA141は、例えば、ベース基板201と、ベース基板201の一方の側に搭載された複数のMP基板202とから、構成されている。ベース基板201は「第1基板」に該当し、MP基板202は「第2基板」に該当する。図8(b)の平面図にも示すように、ベース基板(図中「ベースPCB」)201には、例えば、4個のMP基板(図中「MP-PCB」)202が設けられており、両基板201,202はコネクタ等で接続されている。
図9は、ベース基板201の回路構成を示す回路図である。ベース基板201は、各MP基板202によって共通に利用される各種回路が搭載されている。ベース基板201は、例えば、電源コントローラ211と、複数のDC/DC電源221A,221B,221Cと、データ転送回路231Aと、電圧検出回路241と、補助電源251と、メモリ261と、ホスト30と接続するための通信ポート281と、SVP146と接続するためのポート282とを備えて構成される。なお、DC/DC電源221A,221B,221Cを特に区別する必要がない場合、DC/DC電源221と略記する。
電源コントローラ211,DC/DC電源221,電圧検出回路241,補助電源251,メモリ261は、上述した電源コントローラ210,DC/DC電源220,電圧検出回路241,補助電源250及びメモリ260と同様の機能を発揮する。従って、詳細な説明は割愛する。
データ転送回路231Aは、ホスト30から受信したデータをキャッシュメモリ143に格納させたり、キャッシュメモリ143に記憶されたデータをホスト30に転送するための回路である。
複数のDC/DC電源220のうち第1DC/DC電源221Aは、ベース基板201上の各MP基板202にもそれぞれ電力を供給する。各MP基板202は、ベース基板201上のメモリ261とデータ転送回路231A及びポート282にそれぞれ接続されている。
図10は、一つのMP基板202の構成に着目した回路図である。図10では、紙面の都合上、ベース基板201の構成を簡略化して示す。図10中の上側に示すように、MP基板201は、例えば、電源コントローラ212と、複数のDC/DC電源222A,222B,222Cと、複数の電子回路232A,232B,232Cと、電圧検出回路242と、補助電源252とを備えて構成される。電子回路231Aは、CHA141の動作を制御するためのマイクロプロセッサである。
ベース基板201の構成とMP基板202の構成とを比較するとわかるように、メモリ261は、ベース基板201にのみ設けられている。つまり、本実施例では、ベース基板201及び各MP基板202のそれぞれにおいて電源障害の有無を監視し、ベース基板201に設けられた共通のメモリ261に、各基板201,202で作成されたステータス履歴情報をそれぞれ記憶させるようになっている。
図10に示すように、もしも第1のMP基板201の第2DC/DC電源222Bの電圧出力に異常が検出された場合、MP基板201の電源コントローラ212は、全てのDC/DC電源222A〜222Cの作動を停止させる。その後、電源コントローラ212は、ステータス履歴情報310を作成し、このステータス履歴情報310をベース基板201上のメモリ261に記憶させる。
ユーザや保守員等は、管理端末20からSVP146を介して、正常に稼働しているいずれかのマイクロプロセッサ232Aにアクセスし、このマイクロプロセッサ232Aを介してメモリ261からステータス履歴情報310を読み出す。
図11は、本実施例による電源異常管理処理及び電源異常解析処理を示すフローチャートである。電源異常(電源障害)は、ベース基板201及び各MP基板202のいずれにおいても発生しうるが、ここでは、MP基板202で電源障害が発生した場合を例に挙げて説明する。なお、ベース基板201で電源障害が生じた場合の例は、別の実施例で説明する。
MP基板202の電源コントローラ212は、電圧検出回路242からの検出信号を読込み(S21)、正常な電源シーケンスと比較することにより(S22)、電源異常が発生したか否かを判定する(S23)。
電源異常が発生したと判定された場合(S23:YES)、電源コントローラ212は、直ちに全てのDC/DC電源222の作動を停止させる(S24)。電源コントローラ212は、電源異常の検出されたDC/DC電源222に関するステータス履歴情報310を作成して、このステータス履歴情報310をベース基板201上のメモリ261に記憶させる(S25)。そして、電源コントローラ212は、補助電源252の作動を停止させて、本処理を終了する(S26)。
ここで、本実施例では、それぞれ異なる電源コントローラ211,212で作成されたステータス履歴情報310を、共通のメモリ261に記憶させる。従って、ステータス履歴情報310には、どの電源コントローラ211,212で作成された情報であるかを示すための識別情報を追加することができる。この識別情報の例として、図11中では、「基板番号」を挙げている。これに代えて、「連続番号」の中に、どの電源コントローラ211,212で作成された情報であるかを示す情報を含める構成でもよい。または、メモリ261の記憶領域を予め分割しておき、各電源コントローラ211,212の使用する記憶領域を予め決定しておく構成でもよい。
ユーザや保守員等は、電源異常の検出されたCHA141内に設けられている他の正常なMP基板202上のマイクロプロセッサ232Aを介して、メモリ261内のステータス履歴情報310を読み出すことができる。読み出されたステータス履歴情報310は、SVP146から管理端末20に転送される。以下、第1実施例と同様に、ユーザ等は、ステータス履歴情報310を解析し(S28)、解析結果を障害情報データベースに保存させる(S29)。
このように構成される本実施例も前記第1実施例と同様の効果を奏する。これに加えて、本実施例では、ベース基板201と複数のMP基板202との2階建て構成でCHA141を構成する場合に、ベース基板201にのみメモリ261を設けるため、構成を簡素化することができる。即ち、ベース基板201の電源コントローラ211及び各MP基板202の電源コントローラ212は、それぞれのステータス履歴情報310を共通のメモリ261に記憶させることができる。そして、メモリ261に記憶されたステータス履歴情報310は、正常に稼働しているマイクロプロセッサ232Aを介して読み出すことができる。
図12,図13,図14に基づいて第3実施例を説明する。本実施例では、複数のCHA141によってクラスタを構成しており、いずれか一方のCHA141のベース基板201で電源異常が検出された場合は、他方のクラスタのCHA141を介して、電源障害の発生をホスト30に通知する。
図12は、本実施例のストレージ装置10の主要構成を模式的に示す説明図である。本実施例では、2つのCHA141によってクラスタを構成している。図12の左側に示すように、一方のCHA141のベース基板201で電源異常が発生すると、ベース基板201の電源コントローラ211は、全てのDC/DC電源221の作動を停止させる。これにより、データ転送回路231Aは機能を停止する。電源コントローラ211は、他系のCHA141(クラスタを構成する相手方のCHA141であり、図12中の右側に示すCHAである)に、電源異常の発生を通知する。また、電源コントローラ211は、ステータス履歴情報310をメモリ261に保存させる。
ベース基板201で電源異常が発生した場合、ベース基板201の機能が停止されるため、このCHA141の機能も停止する。従って、ホスト30は、この電源障害の生じたCHA141を用いてデータアクセスを行うことはできない。
そこで、クラスタを構成する他方のCHA141は、一方のCHA141の電源コントローラ211からの通知に基づいて、ホスト30に電源障害の発生を通知する。これにより、ホスト30は、正常に作動しているCHA141を用いて、ボリューム133へのデータアクセスを行う。
メモリ261に記憶されたステータス履歴情報310は、他方のCHA141のいずれかのマイクロプロセッサ232Aを用いて読み出すことができる。
図13は、本実施例による電源異常監視処理等を示すフローチャートである。以下の説明では、ホスト30が使用しているクラスタ1に電源障害が発生した場合を例に挙げて説明する。
まず、クラスタ1のCHA141に搭載されている電源コントローラ211は、電圧検出回路241からの検出信号を読込み(S31)、正常な電源シーケンスと比較することにより(S32)、電源異常が発生したか否かを判定する(S33)。
電源異常が発生したと判定した場合(S33:YES)、クラスタ1の電源コントローラ211は、その管理下にある全てのDC/DC電源221の作動を直ちに停止させ(S34)、ステータス履歴情報310をメモリ261に記憶させる(S35)。そして、クラスタ1の電源コントローラ211は、電源異常が発生した旨をクラスタ2のCHA141に通知した後(S36)、補助電源251の作動を停止させる(S37)。
クラスタ2のCHA141に搭載されているいずれかのマイクロプロセッサ232Aは、クラスタ1の電源コントローラ211から障害の発生を知らせる通知を受領すると(S38)、電源障害が発生した旨をホスト30に通知する(S39)。
ホスト30は、クラスタ2のCHA141からの通知を受領すると(S40)、ストレージ装置10へのアクセスパスをクラスタ1からクラスタ2に切り替えて、ライトデータを再転送する(S41)。なお、ホスト30がライトアクセスする場合を例に挙げて説明するが、リードアクセスの場合も同様である。クラスタ1に障害が発生した場合、ホスト30は、クラスタ2のCHA141を用いて、所望のデータを読み出す。
一方、電源異常の解析を行う場合、ユーザや保守員等は、管理端末20からSVP146を介して、クラスタ2のいずれかのマイクロプロセッサ232Aにアクセスし、このマイクロプロセッサ232Aを介して、メモリ261内のステータス履歴情報310を読み出す(S42)。そして、ユーザ等は、クラスタ1のステータス履歴情報310を解析し(S43)、この解析結果を障害情報データベースに保存させる(S44)。
図14は、複数のホスト30がストレージ装置10に接続されている場合に、どのホスト30に電源障害の発生を通知すべきか決定する方法を示す説明図である。例えば、ストレージ装置10の共有メモリ144には、ホスト管理情報T1が記憶されている。
ホスト管理情報T1は、例えば、各ホスト30をそれぞれ識別するためのホスト識別情報と、そのホスト30が使用しているポートを識別するためのポート識別情報とを多io付けて管理している。識別情報としては、例えば、IP(Internet Protocol)アドレスやWWN(World Wide Name)等を用いることができる。このようなホスト管理情報T1を参照することにより、クラスタ2のCHA141は、いずれのホスト30に電源障害の発生を通知すべきかを決定することができる。
このように構成される本実施例も前記第1実施例と同様の効果を奏する。これに加えて、本実施例では、クラスタ構成の場合に、一方のクラスタで生じた電源障害を他方のクラスタからホスト30に通知する。従って、ホスト30は、タイムアウトエラーの検出を待たずに、正常なクラスタに切り替えて、データアクセスを行うことができ、ユーザの使い勝手が向上する。
図15,図16を用いて第4実施例を説明する。本実施例では、MP基板202上で電源異常が検出された場合の処理方法を開示する。図15は、本実施例によるストレージ装置10の主要構成を模式的に示す説明図である。
例えば、クラスタ1のCHA141に搭載されているいずれかのMP基板202で電源異常が検出された場合、このMP基板202の電源コントローラ212は、全てのDC/DC電源222の作動を直ちに停止させ、そして、ステータス履歴情報310をメモリ261に記憶させる。なお、図15中では、紙面の都合上、ステータス履歴情報310を「ST情報」と略記している。
ベース基板201で電源異常が生じた場合とは異なり、いずれかのMP基板202で電源異常が生じた場合は、同一のベース基板201に設けられている別のMP基板202を介して、ホスト30のアクセスを処理することができる。つまり、クラスタ1の第2MP基板(図中「MP2-PCB」)で電源異常が生じた場合、クラスタ1の第1MP基板(MP1-PCB)、第3MP基板(MP3-PCB)または第4MP基板(MP4-PCB)のいずれか一つを用いることにより、ホスト30からのアクセス要求を処理可能である。
そこで、この場合は、いずれか一つの正常なMP基板202のマイクロプロセッサ232Aから、ホスト30に電源障害の発生を通知し、同一のクラスタ1内で、ホスト30からのアクセス要求を処理する。
図16は、本実施例による電源異常監視処理等を示すフローチャートである。クラスタ1のMP基板202(例えば、図15中のMP2-PCB)は、電圧検出回路242からの信号を読込み(S51)、正常な電源シーケンスと比較して(S52)、電源異常が生じたか否かを判定する(S53)。
電源異常の発生が検出されると(S53:YES)、電源コントローラ212は、直ちに全てのDC/DC電源222の作動を停止させ(S54)、ステータス履歴情報310をメモリ261に記憶させる(S55)。
そして、クラスタ1のいずれか一つの正常なMP基板202上のマイクロプロセッサ232Aは、電源異常の発生を通知した後(S56)、補助電源252の作動を停止させる(S57)。
ホスト30は、クラスタ1のCHA141から電源障害の発生を知らせる通知を受領すると(S58)、クラスタ1の正常なマイクロプロセッサ232Aを一つ選択し、この選択されたマイクロプロセッサ232Aにデータを再転送する(S59)。ホスト30は、電源障害の発生を通知してきたマイクロプロセッサ232Aを選択可能である。
一方、電源異常の解析を行う場合は、ユーザ等は、管理端末20からSVP146を介して、クラスタ1のいずれか正常なマイクロプロセッサ232Aにアクセスし、このマイクロプロセッサ232Aを介して、メモリ261内のステータス履歴情報310を読み出す(S60)。ユーザ等は、クラスタ1のステータス履歴情報310を解析し(S61)、この解析結果を障害情報データベースに保存させる(S62)。
このように構成される本実施例も前記第1実施例と同様の効果を奏する。これに加えて、本実施例では、MP基板202で電源異常が生じた場合、同一のベース基板201上に設けられている別の正常なMP基板202を用いて、ホスト30からのアクセス要求を処理することができる。
図17,図18に基づいて第5実施例を説明する。本実施例では、クラスタ構成を備える場合に、一方のクラスタで電源障害の発生が検出された場合でも、その電源障害の発生をホスト30に通知しない。
本実施例は、第3実施例と共通の構成を多く備えるため、第3実施例との相違点を中心に説明する。図17は、本実施例によるストレージ装置10の主要構成を模式的に示す説明図である。本実施例でも前記第3実施例と同様に、一方のクラスタ1で電源異常が検出された場合、この電源異常の発生は他方のクラスタ2に通知される。しかし、本実施例では、クラスタ2のCHA141は、電源異常の発生をホスト30に通知しない。ホスト30は、クラスタ1へのアクセス要求の応答が所定時間内に返ってこない場合に、エラーの発生を検知し、アクセスパスをクラスタ2に切り替える。
図18は、電源異常監視処理等を示すフローチャートである。図18中のS71〜S77は、図13中のS31〜S37と同一であり、図18中のS81〜S83は、図13中のS42〜S44と同一である。従って、S71〜S77,S81〜S83の説明を省略し、その他のステップを中心に説明する。
クラスタ2のCHA141は、クラスタ1のベース基板201に搭載されている電源コントローラ211から電源障害の発生を知らせる通知を受領した場合でも(S78)、ホスト30への通知は行わない。
従って、ホスト30は、クラスタ1のCHA141に向けて発行したアクセス要求がタイムアウトエラーになった場合に(S79:YES)、クラスタ1で何らかの障害が発生したことを知る。そこで、ホスト30は、クラスタ2のCHA141にアクセスパスを切り替えて、再びデータを転送する(S80)。
このように構成される本実施例も前記第1実施例と同様の効果を奏する。これに加えて、本実施例では、電源障害の発生をホスト30に通知しないため、第3実施例に比較して制御構成を簡素化することができる。
図19〜図21に基づいて第6実施例を説明する。本実施例では、所定のアクションが検出された場合に、ステータス履歴情報310を生成してメモリ261に保存させるようになっている。
図19は、本実施例によるストレージ装置10のうち、ベース基板201を中心に示す構成説明図である。例えば、電源コントローラ211は、ステータス履歴情報330をメモリ261に記憶させるためのトリガを検知する機能211Aと、ステータス履歴情報330をメモリ261に記憶させるための機能211Bとを備える。
図20は、本実施例によるステータス履歴情報330の構成を示す説明図である。メモリ261には、複数のステータス履歴情報330を記憶させることができる。ポインタ320は、最新のステータス履歴情報330の格納先アドレスを示す。メモリ261には、その先頭アドレスから順番に、ステータス履歴情報330が順番に保存されていく。メモリ261の空き容量が無くなるか、または所定値以下に低下すると、ポインタ320の値はクリアされ、再びメモリ261の先頭アドレスを指し示す。このようにして、メモリ261は繰り返し使用される。従って、メモリ261の記憶容量が少ない場合でも、常時、最新の一定数のステータス履歴情報330を効率よく保存することができる。
本実施例のステータス履歴情報330は、例えば、連続番号と、年月日と、アクション種別と、ステータス情報とを対応付けることにより構成される。これら以外に、ステータス履歴情報330を作成した電源コントローラを識別する情報等を加えてもよい。
「年月日」とは、そのステータス履歴情報330が作成された年月日を示す時刻情報である。月日に限らず、時分秒の情報を含めてもよい。「アクション種別」とは、そのステータス履歴情報330が作成される原因となったトリガ(アクション)の種類を示す情報である。
アクションの種類としては、例えば、新規インストール、リプレース、増設、減設、稼働中、休止中等を挙げることができる。新規インストールとは、ストレージ装置10に何らかの新しい構成要素(基板や装置あるいはソフトウェア)が設けられた場合である。リプレースとは、ストレージ装置10の既存の構成要素が新たな構成要素に変更された場合である。増設とは、ストレージ装置10の既存の構成要素が追加された場合であり、減設とは、ストレージ装置10の既存の構成要素が取り外された場合である。稼働中とは、ストレージ装置10が正常に稼働している場合である。休止中とは、ストレージ装置10が作動を停止している場合である。「稼働中」の場合、例えば、予め設定された所定の周期で、ステータス履歴情報330が作成される。
これらの予め設定されたアクションが検出されると、CHA141内の各電源コントローラ211,212は、それぞれの管理下にあるDC/DC電源221,222について、ステータス履歴情報330を作成し、メモリ261に記憶させる。
図21は、電源異常監視処理等を示すフローチャートである。ここでは、説明の便宜上、各電源コントローラ211,212のうち、電源コントローラ211を例に挙げて説明する。電源コントローラ211は、電圧検出回路241の信号を読込み(S91)、正常な電源シーケンスと比較することにより(S92)、電源異常が生じたか否かを判定する(S93)。
電源異常が生じた場合(S93:YES)、電源コントローラ211は、全てのDC/DC電源221の作動を直ちに停止させ(S94)、ステータス履歴情報330を作成してメモリ261に記憶させる(S95)。そして、電源コントローラ211は、補助電源251の作動を停止させる(S96)。
電源が正常である場合(S93:NO)、電源コントローラ211は、所定のアクションが発生したか否かを判定する(S97)。上述の通り、電源コントローラ211は、新規インストールや増設等のアクションが検出された場合、または、所定の時間が経過した場合のように、所定のアクションが発生すると(S97:YES)、ステータス履歴情報330を作成してメモリ261に記憶させる(S98)。
電源異常の解析処理S99〜S101は、第1実施例で述べた図7中のS17〜S19と同様であるため、説明を省略する。なお、ベース基板201の電源コントローラ211を例に挙げて説明したが、各MP基板202の電源コントローラ212も、上記同様に、電源異常の発生が検出された場合、及び所定のアクションが発生した場合に、ステータス履歴情報330を作成してメモリ261に記憶させる。
このように構成される本実施例も前記第1実施例と同様の効果を奏する。これに加えて、本実施例では、電源障害が発生する前から、ステータス履歴情報330を作成して保存することができる。従って、障害の予兆に関する情報を収集することができ、この予兆情報を利用して、電源障害の解析作業を行うことができる。
本実施例では、所定のアクションが発生した場合に、ステータス履歴情報330を作成するため、電源障害の発生しやすいアクションが何であるか等を比較的容易に究明することができ、解析作業の効率を高めることができる。
図22,図23に基づいて第7実施例を説明する。本実施例では、ステータス履歴情報330を選別して転送可能となっている。図22は、本実施例によるストレージ装置の主要構成の概略を模式的に示す説明図である。
本実施例でも、説明の便宜上、電源コントローラ211を例に挙げて説明する。電源コントローラ211は、前記第6実施例で述べたように、所定の時間が経過した場合や所定のアクションが発生した場合に、ステータス履歴情報330を作成して、メモリ261に記憶させる。従って、メモリ261には、複数のステータス履歴情報330がそれぞれ記憶されることになる。メモリ261に記憶される各ステータス履歴情報330の全体をD1とする。
電源異常が発生した場合、他系(例えば、クラスタ2)のマイクロプロセッサ232Aは、全てのステータス履歴情報330(D1)のうち、電源異常時のステータス履歴情報330のみを読み出す。この電源異常時のステータス履歴情報330をD2とする。他系のマイクロプロセッサ232Aは、ストレージ装置10の信頼性維持の観点から、クラスタ1における電源異常の発生のみを知れば足りるためである。
SVP146は、電源異常時のステータス履歴情報330(D2)のうち、例えば、どのDC/DC電源221で電源異常が生じたかの情報(D3)のみを、他系のマイクロプロセッサ232Aから取得する。故障したパッケージ(ここでは、クラスタ1のCHA141)を特定できれば足りるためである。
また、他系のマイクロプロセッサ232Aは、クラスタ1で電源障害が生じた旨をホスト30に通知する。この電源障害の発生通知をD4とする。
このように、本実施例では、全てのステータス履歴情報330(D1)→電源異常時のステータス履歴情報330(D2)→SVP146への通知(D3)→ホスト30への通知(D4)の順番で、伝達される情報が選別され、情報量が減少していく。
図23は、電源異常監視処理等を示すフローチャートである。説明の便宜上、クラスタ1のベース基板201で電源異常が生じた場合を説明する。前記第6実施例と同様に、ベース基板201の電源コントローラ211は、電圧検出回路241の信号を読込み(S111)、正常な電源シーケンスと比較することにより(S112)、電源異常が生じたか否かを判定する(S113)。
電源異常が生じた場合(S113:YES)、電源コントローラ211は、全てのDC/DC電源221の作動を直ちに停止させ(S114)、ステータス履歴情報330を作成してメモリ261に記憶させる(S115)。そして、電源コントローラ211は、電源異常の発生をクラスタ2に通知した後(S116)、補助電源251の作動を停止させる(S117)。
電源が正常である場合(S113:NO)、電源コントローラ211は、所定のアクションが発生したか否かを判定する(S118)。電源コントローラ211は、所定のアクションが発生すると(S118:YES)、ステータス履歴情報330を作成してメモリ261に記憶させる(S119)。従って、メモリ261には、電源異常が発生する前のステータス履歴情報330が蓄積されていく。
クラスタ2のマイクロプロセッサ232Aは、クラスタ1からの通知を受領すると(S120)、クラスタ1のメモリ261にアクセスして、電源異常時のステータス履歴情報330(D2)を読み出す(S121)。そして、クラスタ2のマイクロプロセッサ232Aは、電源障害が発生した旨をホスト30に通知する(S122)。ホスト30に通知される情報はD4であり、この情報D4には、クラスタ1で電源障害が発生した旨の情報が含まれている。
また、クラスタ2のマイクロプロセッサ232Aは、クラスタ1のどのパッケージ(この例ではCHA141)が故障したのかを、SVP146に通知する(S123)。SVP146に通知される情報はD3であり、この情報D3には電源障害の発生したパッケージを特定する情報が含まれている。
ホスト30は、クラスタ2からの通知を受領すると(S124)、クラスタ2のいずれかのCHA141にデータを再度転送する(S125)。SVP146は、クラスタ2からの通知を受領すると(S126)、管理端末20のユーザインターフェース21に故障箇所及び交換指示を表示させる(S127)。
なお、紙面の都合上、電源異常の解析処理は省略する。しかし、本実施例においても、前記第6実施例のS99〜S101と同様に、クラスタ1のCHA141で発生した電源異常を解析することができる。解析処理を行う場合は、メモリ261に記憶されている全てのステータス履歴情報330(D1)を読み出す。
このように構成される本実施例も前記第6実施例と同様の効果を奏する。これに加えて、本実施例では、メモリ261に記憶される全てのステータス履歴情報330(D1)をそのまま転送するのではなく、転送の各段階毎に、必要な範囲の情報を選別して転送する構成とした。従って、転送される情報の量を必要最低限に抑制することができる。
なお、本発明は、上述した実施の形態に限定されない。当業者であれば、本発明の範囲内で、種々の追加や変更等を行うことができる。例えば、各実施例を適宜組み合わせることができる。
また、上記各実施例では、データ処理基板としてCHA141を例に挙げて説明したが、本発明はこれに限らず、例えば、DKA142等にも適用可能である。
本発明の実施形態の概念を示す説明図である。 ストレージ装置を含むストレージシステムの全体構成を示す説明図である。 ストレージ装置のブロック図である。 データ処理基板としてのCHAの構成を示す説明図である。 DC/DC電源の正常な立ち上げシーケンスを示す説明図である。 ステータス情報フォーマットを示す説明図である。 電源異常監視処理及び電源異常解析処理を示すフローチャートである。 第2実施例に係るストレージ装置に使用されるデータ処理基板の基板構造を模式的に示す説明図である。 ベース基板の構成に着目したブロック図である。 一つのMP基板の構成に着目したブロック図である。 電源異常監視処理等を示すフローチャートである。 第3実施例に係るストレージ装置の要部を模式的に示す説明図である。 電源異常監視処理等を示すフローチャートである。 ホストとポートとの対応関係を管理する方法を示す説明図である。 第4実施例に係るストレージ装置の要部を模式的に示す説明図である。 電源異常監視処理等を示すフローチャートである。 第5実施例に係るストレージ装置の要部を模式的に示す説明図である。 電源異常監視処理等を示すフローチャートである。 第6実施例に係るストレージ装置に用いられるデータ処理基板としてのCHAの構成を示すブロック図である。 ステータス履歴情報の構成及び管理方法を示す説明図である。 電源異常監視処理等を示すフローチャートである。 第7実施例に係るストレージ装置の要部を模式的に示す説明図である。 電源異常監視処理等を示すフローチャートである。
符号の説明
1…ストレージ装置、2…データ処理基板、2A…電源コントローラ、2B…DC/DC電源、2C…電子回路、2D…電圧検出回路、2E…補助電源、2F…メモリ、2G…インターフェース、3…メイン電源、4…中継装置、5…管理装置、10…ストレージ装置、11…基本筐体、12…増設筐体、13…ハードディスクボックス、14…コントローラ、15…メイン電源、16…バッテリ部、17…通信経路、20…管理端末、21…管理用ユーザインターフェース、30…ホスト、40…管理サーバ、131…ディスクドライブ、132…パリティグループ、133…論理ボリューム、141…チャネルアダプタ(CHA)、142…ディスクアダプタ(DKA)、143…キャッシュメモリ、144…共有メモリ、145…接続制御部、146…サービスプロセッサ(SVP)、201…ベース基板、202…MP基板、210、211,212…電源コントローラ、220,220A,220B,220C,221,221A,221B,221C,222,222A,222B,222C…DC/DC電源、230,230A,230B,230C…電子回路、231A…データ転送回路、232A…マイクロプロセッサ、240,241,242…電圧検出回路、250、251,252…補助電源、260,261…メモリ、270…インターフェース、281,282…通信ポート、310,330…ステータス履歴情報

Claims (14)

  1. 上位装置に記憶領域を提供するストレージ装置であって、
    少なくとも一つ以上のデータ処理基板を備えており、
    前記データ処理基板は、
    負荷に電力を供給する少なくとも一つ以上の電源部と、
    前記電源部の作動状態を検出して信号を出力する検出部と、
    前記検出部からの信号に基づいて前記電源部の作動を制御する少なくとも一つ以上の電源制御部と、
    監視結果を記憶するための記憶部と、
    前記電源部の作動が停止した場合でも、前記記憶部への情報書込みを可能とするための補助電源部と、
    を備えており、
    前記電源制御部は、前記電源部の作動状態を監視して、この監視結果を前記記憶部に記憶させ、かつ、前記電源部に障害が検出された場合は当該電源部の作動を停止させるようになっているストレージ装置。
  2. 前記記憶部に記憶された前記監視結果を前記データ処理基板の外部に出力するためのインターフェース部を備えた請求項1に記載のストレージ装置。
  3. 前記データ処理基板は、それぞれ異なる電源部の作動を制御するための複数の電源制御部を備えており、
    前記各電源制御部は、それぞれの制御下にある前記電源部の作動状態を所定の場合に監視し、この監視結果を前記記憶部にそれぞれ記憶させる請求項1に記載のストレージ装置。
  4. 前記データ処理基板は複数設けられており、
    前記各データ処理基板のうち一方のデータ処理基板の前記電源制御部によって電源障害が検出された場合には、前記一方のデータ処理基板から前記他方のデータ処理基板に前記電源障害の発生を通知する請求項1に記載のストレージ装置。
  5. 前記他方のデータ処理基板は、前記一方のデータ処理基板から前記通知を受領した場合、前記上位装置に前記電源障害の発生を通知する請求項4に記載のストレージ装置。
  6. 前記データ処理基板は複数設けられており、
    前記各データ処理基板のうち一方のデータ処理基板の前記記憶部に記憶されている前記状態検出情報に、前記他方のデータ処理基板からアクセス可能である請求項1に記載のストレージ装置。
  7. 前記電源制御部は、前記検出部からの前記信号に基づいて前記電源部に障害が発生したと判定した場合には、前記障害の発生した電源部に関する前記監視結果を前記記憶部に記憶させる請求項1に記載のストレージ装置。
  8. 前記電源制御部は、前記電源部の作動を停止させた後で、前記監視結果を前記記憶部に記憶させる請求項7に記載のストレージ装置。
  9. 前記電源制御部は、定期的に前記電源部の作動状態を監視し、この監視結果を前記記憶部に記憶させる請求項1に記載のストレージ装置。
  10. 前記電源制御部は、予め設定された所定の条件が検出された場合に、前記電源部の作動状態を監視し、この監視結果及び前記検出された所定の条件とを対応付けて前記記憶部に記憶させる請求項1に記載のストレージ装置。
  11. 前記記憶部に記憶されている前記監視結果のうち所定の情報のみが選択して読み出される請求項1に記載のストレージ装置。
  12. 前記電源制御部は、前記電源部の障害発生を検出した場合、この障害発生が検出されたときの監視結果を前記記憶部に記憶させた後、前記補助電源の作動を停止させる請求項1に記載のストレージ装置。
  13. 上位装置と記憶デバイスとの間のデータ授受を制御するストレージ装置と、このストレージ装置に接続された管理装置とを有するストレージシステムであって、
    (1)前記ストレージ装置は、前記上位装置及び/または前記記憶デバイスとの間のデータ授受をそれぞれ処理するための第1データ処理基板及び第2データ処理基板を備えており、
    (2)前記第1データ処理基板及び前記第2データ処理基板は、互いに通信可能に接続されており、かつ、
    第1基板と、
    前記第1基板に一体的に設けられる複数の第2基板とを含んでそれぞれ構成され、
    (3)前記第1基板は、
    データ転送を行うためのデータ転送回路と、
    前記データ転送回路に電源を供給するための複数の第1電源部と、
    前記各第1電源部の出力電圧をそれぞれ検出して信号を出力する第1電圧検出部と、
    前記第1電圧検出部からの信号に基づいて前記各第1電源部の作動をそれぞれ制御する第1電源制御部と、
    記憶部と、
    前記記憶部に記憶された情報を出力するためのインターフェース部と、
    を備えて構成され、
    (4)前記各第2基板は、
    マイクロプロセッサ回路と、
    前記マイクロプロセッサ回路に電源を供給するための複数の第2電源部と、
    前記各第2電源部の出力電圧をそれぞれ検出して信号を出力する第2電圧検出部と、
    前記第2電圧検出部からの信号に基づいて前記各第2電源部の作動をそれぞれ制御する第2電源制御部と、
    を備えて構成され、
    (5)前記第1電源制御部は、所定の場合に、前記各第1電源部の作動状態の監視結果を前記記憶部に記憶させ、
    前記第2電源制御部は、前記所定の場合に、前記各第2電源部の作動状態の監視結果を前記記憶部に記憶させ、
    (6)前記第1データ処理基板の前記マイクロプロセッサ回路及び前記第2データ処理基板の前記マイクロプロセッサ回路は、前記第1データ処理基板の前記記憶部及び前記第2データ処理基板の前記記憶部にそれぞれアクセス可能であり、前記記憶部に記憶された前記監視結果を前記管理装置に出力可能となっており、
    (7)前記第1データ処理基板の前記マイクロプロセッサ回路及び前記第2データ処理基板の前記マイクロプロセッサ回路は、前記記憶部に記憶された前記監視結果のうち一部の情報のみを取得可能となっている、ストレージ装置。
  14. 複数のデータ処理基板を有するストレージ装置の電源障害を管理するための方法であって、
    前記各データ処理基板は、負荷に電力を供給する複数の電源部をそれぞれ備え、
    前記各電源部の作動状態をそれぞれ検出するステップと、
    前記検出された作動状態に基づいて前記各電源部に障害が発生しているか否かを判定するステップと、
    前記各電源部のいずれかに前記障害が発生していると判定された場合には、前記各電源部の作動を全て停止させるステップと、
    前記障害の検出された電源部に関する情報を記憶部に記憶させるステップと、
    前記記憶部に記憶された前記情報を読み出すステップと、
    前記読み出された情報を解析するステップと、
    をそれぞれ実行するストレージ装置の電源障害管理方法。
JP2006114039A 2006-04-18 2006-04-18 ストレージ装置及びストレージ装置の電源障害管理方法 Pending JP2007286937A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2006114039A JP2007286937A (ja) 2006-04-18 2006-04-18 ストレージ装置及びストレージ装置の電源障害管理方法
US11/473,032 US7581137B2 (en) 2006-04-18 2006-06-23 Storage apparatus and storage apparatus power supply failure management method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006114039A JP2007286937A (ja) 2006-04-18 2006-04-18 ストレージ装置及びストレージ装置の電源障害管理方法

Publications (1)

Publication Number Publication Date
JP2007286937A true JP2007286937A (ja) 2007-11-01

Family

ID=38662518

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006114039A Pending JP2007286937A (ja) 2006-04-18 2006-04-18 ストレージ装置及びストレージ装置の電源障害管理方法

Country Status (2)

Country Link
US (1) US7581137B2 (ja)
JP (1) JP2007286937A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102200824A (zh) * 2011-05-13 2011-09-28 哈尔滨工业大学 一种双模冗余供电***
JP2014502378A (ja) * 2010-06-07 2014-01-30 ジェイソン・エイ・サリヴァン コンピュータシステムの知的であり柔軟な管理および監視のためのシステムおよび方法
JP2014120179A (ja) * 2012-12-18 2014-06-30 Hgst Netherlands B V 停電障害状況におけるイベントトレース情報の復旧
JP2018013978A (ja) * 2016-07-21 2018-01-25 Necプラットフォームズ株式会社 障害内容特定装置、障害内容特定方法、及び、障害内容特定プログラム
JP2022139034A (ja) * 2021-03-11 2022-09-26 Necプラットフォームズ株式会社 電源装置、電源装置の制御方法及び電源装置の制御プログラム

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008123501A (ja) * 2006-10-15 2008-05-29 Fujitsu Ten Ltd 車両用情報記録装置
JP2008158612A (ja) * 2006-12-21 2008-07-10 Rohm Co Ltd 電源装置および電源システム
JP4961997B2 (ja) * 2006-12-22 2012-06-27 富士通株式会社 ストレージ装置、ストレージ装置の制御方法、及びストレージ装置の制御プログラム
JP4833164B2 (ja) * 2007-07-24 2011-12-07 株式会社日立製作所 ストレージサブシステム及び電源システム
US7908505B2 (en) * 2007-09-28 2011-03-15 International Business Machines Corporation Apparatus, system, and method for event, time, and failure state recording mechanism in a power supply
US7917806B2 (en) * 2007-12-18 2011-03-29 International Business Machines Corporation System and method for indicating status of an on-chip power supply system
US8028195B2 (en) * 2007-12-18 2011-09-27 International Business Machines Corporation Structure for indicating status of an on-chip power supply system
US7774649B2 (en) * 2008-01-31 2010-08-10 Ncr Corporation Self-service terminal
JP2010026677A (ja) * 2008-07-17 2010-02-04 Hitachi Ltd ファイル共有装置及びファイル共有システム
US8395483B2 (en) * 2009-10-07 2013-03-12 Garth Conboy Power controller for an electronic reader device
US8392756B2 (en) * 2010-06-17 2013-03-05 Hitachi, Ltd. Storage apparatus and method of detecting power failure in storage apparatus
TW201221987A (en) * 2010-11-23 2012-06-01 Inventec Corp Detection method for configuration of power supply units and detection system using the same
JP5234374B2 (ja) * 2011-03-02 2013-07-10 日本電気株式会社 差動信号伝送回路、ディスクアレイコントローラ及び差動信号伝送ケーブル
JP5758052B2 (ja) * 2012-01-30 2015-08-05 株式会社日立製作所 ストレージ装置
JP6128388B2 (ja) * 2012-09-14 2017-05-17 パナソニックIpマネジメント株式会社 情報処理装置
CN104679199A (zh) * 2013-11-28 2015-06-03 英业达科技有限公司 自适应多种电源的***及其方法
CN105099193A (zh) * 2014-04-16 2015-11-25 台达电子企业管理(上海)有限公司 直流到直流电源装置
US9110805B1 (en) * 2014-10-27 2015-08-18 Quanta Computer Inc. Preventing device power on after unrecoverable error
JP6386084B2 (ja) 2014-12-19 2018-09-05 株式会社東芝 電子機器及び方法
WO2016125690A1 (ja) * 2015-02-05 2016-08-11 日立オートモティブシステムズ株式会社 車両制御装置
US10788872B2 (en) * 2015-09-21 2020-09-29 Hewlett Packard Enterprise Development Lp Server node shutdown
KR102280433B1 (ko) * 2015-09-23 2021-07-22 삼성전자주식회사 전력 공급 회로 및 이를 포함하는 저장 장치
FR3048564B1 (fr) * 2016-03-01 2019-04-19 Safran Electrical & Power Dispositif de distribution electrique comprenant au moins un controleur d'alimentation
JP2018196209A (ja) * 2017-05-15 2018-12-06 富士通株式会社 電源監視装置、ストレージ装置及び電源監視方法
US10852801B2 (en) 2017-09-15 2020-12-01 Hewlett Packard Enterprise Development Lp Determine a failure event of a power supply
JP2020013271A (ja) * 2018-07-17 2020-01-23 キオクシア株式会社 電源装置、電源制御方法及び記憶装置
US20230117637A1 (en) * 2021-10-19 2023-04-20 Arista Networks, Inc. Saving volatile system state

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05324367A (ja) 1992-05-25 1993-12-07 Fujitsu Ltd 障害情報記録方法
JP3161189B2 (ja) 1993-12-03 2001-04-25 株式会社日立製作所 記憶システム
JP3474665B2 (ja) * 1995-03-02 2003-12-08 富士通株式会社 計算機システムの電源制御装置及び方法
US6243838B1 (en) * 1997-05-13 2001-06-05 Micron Electronics, Inc. Method for automatically reporting a system failure in a server
US6345369B1 (en) * 1998-11-12 2002-02-05 International Business Machines Corporation Environmental and power error handling extension and analysis for systems with redundant components
JP4219516B2 (ja) * 1999-12-20 2009-02-04 富士通株式会社 電源制御装置及び電源制御方法及び記憶媒体
US6629248B1 (en) * 2000-03-30 2003-09-30 Intel Corporation Apparatus and method for maintaining a security association for manageability across power failures
US7114098B2 (en) * 2001-03-20 2006-09-26 American Power Conversion Corporation Power supply critical state monitoring system
US6865685B2 (en) * 2001-03-20 2005-03-08 American Power Conversion Power supply event notification system for sending an electronic notification to multiple destinations
US6904541B1 (en) * 2001-08-10 2005-06-07 Emc Corporation Methods and apparatus for providing power to electronic circuitry
US7287187B2 (en) * 2001-10-15 2007-10-23 Sun Microsystems, Inc. Method and apparatus for supplying redundant power
EP1361516A3 (en) * 2002-04-30 2011-05-18 Hitachi, Ltd. Method and system for backing up power supply of disk array device
JP3661665B2 (ja) 2002-05-27 2005-06-15 株式会社日立製作所 パッケージの閉塞方法
US7049798B2 (en) * 2002-11-13 2006-05-23 Power-One, Inc. System and method for communicating with a voltage regulator
US7836339B2 (en) * 2003-03-31 2010-11-16 Intel Corporation Computer memory power backup
JP3711559B2 (ja) * 2003-08-08 2005-11-02 オムロン株式会社 情報処理装置および方法、記録媒体、並びにプログラム
US20050177780A1 (en) * 2004-01-23 2005-08-11 An-Sheng Chang Powered interface card and method of providing backup power supply
US7275182B2 (en) * 2004-03-25 2007-09-25 International Business Machines Corporation Method and apparatus for correlating UPS capacity to system power requirements
JP2006031630A (ja) 2004-07-21 2006-02-02 Hitachi Ltd ストレージ装置及びストレージ装置の消費電力制御方法
US7363518B2 (en) * 2004-07-22 2008-04-22 Dell Products L.P. Information handling system with power fault protection circuit
US7392429B2 (en) * 2004-12-22 2008-06-24 Microsoft Corporation System and method for maintaining persistent state data
US7464292B2 (en) * 2005-03-15 2008-12-09 Network Appliance, Inc. Redundant power system with no latent single failure point
US7404092B2 (en) * 2005-04-22 2008-07-22 Dell Products L.P. Power supply control in a server system
US7526674B2 (en) * 2005-12-22 2009-04-28 International Business Machines Corporation Methods and apparatuses for supplying power to processors in multiple processor systems

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014502378A (ja) * 2010-06-07 2014-01-30 ジェイソン・エイ・サリヴァン コンピュータシステムの知的であり柔軟な管理および監視のためのシステムおよび方法
CN102200824A (zh) * 2011-05-13 2011-09-28 哈尔滨工业大学 一种双模冗余供电***
CN102200824B (zh) * 2011-05-13 2013-07-03 哈尔滨工业大学 一种双模冗余供电***
JP2014120179A (ja) * 2012-12-18 2014-06-30 Hgst Netherlands B V 停電障害状況におけるイベントトレース情報の復旧
JP2018013978A (ja) * 2016-07-21 2018-01-25 Necプラットフォームズ株式会社 障害内容特定装置、障害内容特定方法、及び、障害内容特定プログラム
WO2018016554A1 (ja) * 2016-07-21 2018-01-25 Necプラットフォームズ株式会社 障害内容特定装置、障害内容特定方法、及び、障害内容特定プログラムが格納された記録媒体
US11474922B2 (en) 2016-07-21 2022-10-18 Nec Platforms, Ltd. Fault content identification device, fault content identification method, and recording medium in which fault content identification program is stored
JP2022139034A (ja) * 2021-03-11 2022-09-26 Necプラットフォームズ株式会社 電源装置、電源装置の制御方法及び電源装置の制御プログラム

Also Published As

Publication number Publication date
US7581137B2 (en) 2009-08-25
US20070260918A1 (en) 2007-11-08

Similar Documents

Publication Publication Date Title
JP2007286937A (ja) ストレージ装置及びストレージ装置の電源障害管理方法
US7111084B2 (en) Data storage network with host transparent failover controlled by host bus adapter
JP4786312B2 (ja) 記憶制御装置及び記憶制御装置のエラー情報管理方法
JP3831377B2 (ja) コンピュータ・システムにおける電力障害を解析する方法および装置
US7612467B2 (en) Power device and power device power supply method
US7650532B2 (en) Storage system
JP2007280554A (ja) ストレージ装置の電力供給装置及びストレージ装置の管理方法
JP2009015584A (ja) 記憶制御装置及び筐体単位の電源制御方法
GB2415526A (en) System and method of SCSI and SAS hardware validation
CN110750309B (zh) 可远程控制电子设备的***及方法
JP2007025933A (ja) ストレージシステム及びそのファームウェア自動更新方法
JP4642347B2 (ja) ストレージシステム
US8099634B2 (en) Autonomic component service state management for a multiple function component
US7421596B2 (en) Disk array system
TWI713325B (zh) 可遠端控制電子設備的系統及方法
JP4371720B2 (ja) 記憶装置システム及び記憶装置システムの保守方法
JP2009104412A (ja) ストレージ装置及びその制御方法
JP2007299213A (ja) Raid制御装置および障害監視方法
JP2007018049A (ja) 記憶制御システム
US7254016B1 (en) Data storage system with improved serviceability features
CN113835971A (zh) 一种服务器背板异常点灯的监测方法及相关组件
JP2008198055A (ja) ディスクアレイ障害処理システム、装置、方法、及びプログラム
JP2005134940A (ja) 記憶制御装置及び記憶制御装置の保守システム
JP3448197B2 (ja) 情報処理装置
JPH1153329A (ja) 情報処理システム