JP4404353B2 - ディスク故障を抑止するディスクアレイ - Google Patents

ディスク故障を抑止するディスクアレイ Download PDF

Info

Publication number
JP4404353B2
JP4404353B2 JP2004154077A JP2004154077A JP4404353B2 JP 4404353 B2 JP4404353 B2 JP 4404353B2 JP 2004154077 A JP2004154077 A JP 2004154077A JP 2004154077 A JP2004154077 A JP 2004154077A JP 4404353 B2 JP4404353 B2 JP 4404353B2
Authority
JP
Japan
Prior art keywords
disk
head
disk array
data
disk device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004154077A
Other languages
English (en)
Other versions
JP2005338976A (ja
Inventor
育哉 八木沢
卓二 小河
賢一 ▲高▼本
義則 常田
東 加納
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2004154077A priority Critical patent/JP4404353B2/ja
Priority to US10/924,813 priority patent/US7181570B2/en
Priority to EP04029459A priority patent/EP1600949A1/en
Priority to CNB2004101041185A priority patent/CN100339816C/zh
Publication of JP2005338976A publication Critical patent/JP2005338976A/ja
Application granted granted Critical
Publication of JP4404353B2 publication Critical patent/JP4404353B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B21/00Head arrangements not specific to the method of recording or reproducing
    • G11B21/02Driving or moving of heads
    • G11B21/12Raising and lowering; Back-spacing or forward-spacing along track; Returning to starting position otherwise than during transducing operation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1076Parity data used in redundant arrays of independent storages, e.g. in RAID systems
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B15/00Driving, starting or stopping record carriers of filamentary or web form; Driving both such record carriers and heads; Guiding such record carriers or containers therefor; Control thereof; Control of operating function
    • G11B15/675Guiding containers, e.g. loading, ejecting cassettes
    • G11B15/68Automatic cassette changing arrangements; automatic tape changing arrangements
    • G11B15/682Automatic cassette changing arrangements; automatic tape changing arrangements with fixed magazines having fixed cassette storage cells, e.g. in racks
    • G11B15/6835Automatic cassette changing arrangements; automatic tape changing arrangements with fixed magazines having fixed cassette storage cells, e.g. in racks the cassettes being transferred to a fixed recorder or player using a moving carriage
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B17/00Guiding record carriers not specifically of filamentary or web form, or of supports therefor
    • G11B17/22Guiding record carriers not specifically of filamentary or web form, or of supports therefor from random access magazine of disc records
    • G11B17/26Guiding record carriers not specifically of filamentary or web form, or of supports therefor from random access magazine of disc records the magazine having a cylindrical shape with vertical axis
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/18Error detection or correction; Testing, e.g. of drop-outs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/18Error detection or correction; Testing, e.g. of drop-outs
    • G11B20/1833Error detection or correction; Testing, e.g. of drop-outs by adding special lists or symbols to the coded information
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/002Programmed access in sequence to a plurality of record carriers or indexed parts, e.g. tracks, thereof, e.g. for editing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/36Monitoring, i.e. supervising the progress of recording or reproducing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B5/00Recording by magnetisation or demagnetisation of a record carrier; Reproducing by magnetic means; Record carriers therefor
    • G11B5/48Disposition or mounting of heads or head supports relative to record carriers ; arrangements of heads, e.g. for scanning the record carrier to increase the relative speed
    • G11B5/54Disposition or mounting of heads or head supports relative to record carriers ; arrangements of heads, e.g. for scanning the record carrier to increase the relative speed with provision for moving the head into or out of its operative position or across tracks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2211/00Indexing scheme relating to details of data-processing equipment not covered by groups G06F3/00 - G06F13/00
    • G06F2211/10Indexing scheme relating to G06F11/10
    • G06F2211/1002Indexing scheme relating to G06F11/1076
    • G06F2211/1088Scrubbing in RAID systems with parity
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0673Single storage device
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/40Combinations of multiple record carriers
    • G11B2220/41Flat as opposed to hierarchical combination, e.g. library of tapes or discs, CD changer, or groups of record carriers that together store one title
    • G11B2220/415Redundant array of inexpensive disks [RAID] systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Description

本発明は主として、コンピュータがアクセスするデータを記憶するストレージシステムに関わり、特に、複数のディスク装置を有するディスクアレイシステムに関する。
計算機に接続されるストレージシステムの一種に、ディスクアレイシステムがある。ディスクアレイシステムは、RAID(Redundant Arrays of Inexpensive Disks)システムとも呼ばれ、アレイ状に配置された複数のディスク装置及びそれらを制御する制御部(ディスクアレイコントローラ)とを有するストレージシステムである。ディスクアレイシステムでは、リード要求(データの読み出し要求)およびライト要求(データの書き込み要求)がディスク装置の並列動作によって高速に処理され、かつデータに冗長性が付加される。ディスクアレイシステムは、非特許文献1に開示されているように、付加される冗長データの種類とその構成により5つのレベルに分類されている。
一方、データの書込み及び読み出し要求に基づいた負荷情報に応じて、ディスクアレイ装置を省エネモードへと移行させ、特定のディスクへの給電を抑えることで消費電力を減少させる技術が特許文献1に開示されている。
特開2002-297320号公報 ディー・パターソン(D.Patterson)、外2名、「ケース・フォー・リダンダント・アレイ・オブ・インエクスペンシブ・ディスク(A Case for Redundant Arrays of Inexpensive Disks(RAID))」、エー.シー.エム.シグモッド コンファレンスプロシーディング(ACM SIGMOD Conference Proceeding)、1988年6月、p.109-116
ディスクアレイシステムに適用するディスク装置の中には、稼動期間(寿命)が短く、24時間連続稼動できないものもある。たとえばパーソナルコンピュータ用に設計された低コストなATA(AT Attachment)ディスク等である。ATAディスクは、10時間/日程度の使用条件を想定して製造されているケースが多い。一方、ディスクアレイシステムは、24時間、365日連続稼動という使用条件が想定される場合も多く、ディスクアレイシステムにATAディスクを適用すると、単位時間あたりのATAディスクの稼動時間が増え、ディスク装置の障害率が増加するという問題がある。このため、ディスクアレイシステムに使用されるディスク装置の信頼性低下を抑制する、もしくはディスク装置の信頼性を向上させる技術が必要となる。
ディスクアレイシステムは、計算機からアクセスされデータを格納するディスクアレイシステムであって、ディスクアレイコントローラと、データを格納する複数のディスク装置とを有し、前記複数のディスク装置は各々、データが記録されるメディアと、当該メディアに対するデータの読み書きを実行するヘッドと、当該ヘッドの位置を制御するヘッド位置制御部とを有しており、前記ディスクアレイコントローラは、前記ディスク装置内の記憶領域からデータを読み出すことにより前記記憶領域に障害が生じているか否かをチェックするオンラインデータチェック処理を実行しており、最後に前記計算機から前記ディスク装置に格納されているデータへのアクセス要求を受信してからの経過時間が計測されたことを契機に、前記ディスク装置に対するオンラインデータチェック処理を停止し、前記オンラインデータチェック処理の停止後に、前記ディスク装置のヘッドを、当該ヘッドがメディアに対するデータの読み書きを実行する際の位置とは異なる位置に移動するよう、前記ディスク装置にアンロード有効化指示を発行し、前記ディスク装置のヘッド位置制御部は、前記アンロード有効化指示に基づいて、前記ヘッドの位置を移動し、前記ディスクコントローラは、前記ディスク装置に対する前記オンラインデータチェック処理を停止した後、初めて前記計算機から前記ディスク装置に格納されているデータへのアクセス要求を受信した時を契機に、前記ディスク装置のヘッドを、前記ヘッドがメディアに対するデータの読み書きを実行可能な位置に移動するよう、前記ディスク装置にアンロード無効化指示を発行し、前記ヘッドが移動した後に、前記ディスク装置に対するオンラインデータチェック処理を再開し、前記計算機からのアクセス要求が頻発するときに、前記ディスク装置へのアクセスと前記オンラインデータチェック処理を実施し、前記計算機からのアクセス要求が来ないときに、前記オンラインデータチェック処理を抑止し、かつ、前記ディスク装置のヘッドをアンロード状態にすることを特徴とする。
ディスクアレイシステムに用いられるディスク装置の信頼性を向上させることができる。
以下、図面を用いて本発明の一実施形態を説明する。尚以下に説明する実施形態は一例であって、これにより発明が限定されるものではない。
(1)計算機システムの構成例
本実施形態における、計算機システムの構成例を、図1を用いて説明する。
図1において、100はホストコンピュータ、200はディスクアレイコントローラ、500はディスク装置群、700は管理端末である。ディスクアレイコントローラ200はディスク装置群500と接続され、ディスクアレイコントローラ200とディスク装置群500とでディスクアレイシステムを構成している。また、ホストコンピュータ100および管理端末700はディスクアレイコントローラ200に接続されている。
ディスク装置群500は、複数のディスク装置501―504からなる。ディスクアレイシステムにおいては、各々異なるディスク装置に格納される複数のデータがRAIDのパリティグループを構成している。パリティグループを構成するデータのうち一部はホストコンピュータ100からアクセスされるデータであり、残りのデータはホストコンピュータ100からアクセスされる前述のデータから生成されるパリティデータである。パリティデータは、あるディスク装置の記憶領域に障害が生じた際に、その記憶領域に格納されているデータを復元するために用いられる冗長データである。パリティデータは、例えば同じパリティグループを構成する、他のデータの排他的論理和を計算することによって生成される。尚、ディスク装置501―504は、論理ボリュームであるLU520を構成する。
ディスクアレイコントローラ200は、ディスクアレイシステムを制御するCPU201、CPU201が実行するプログラムや情報を格納したメモリ202、ホストコンピュータ100からアクセスされるデータを一時的に格納するキャッシュ203、ホストとのデータの送受信を行うホストFC I/F204、ディスク装置群500との送受信を行うディスクI/F206、管理端末700と制御情報の送受信を行う管理I/F207、タイマ208を有しており、これらは相互に内部通信路を介して接続され通信可能である。
メモリ202は、以下のプログラム、情報、情報格納エリアを有している。
(a)ディスクアレイシステムを制御するためのRAID制御プログラム210
(b)ディスク装置群500にコマンドを発行するディスクコマンド発行プログラム220
(c)ディスク装置群500の管理を行うディスク管理プログラム230
(d)ディスク装置群500に含まれるディスク装置各々の情報を記録するディスク管理テーブル240
(e)ディスク装置の動作時間を計測するディスク動作時間計測プログラム250
(f)ディスク装置の動作時間を一定の基準にしたがって判定するディスク動作時間判定プログラム255
(g)管理端末700へディスク装置に関する情報を通知するディスク情報通知プログラム260
(h)ディスク装置へアンロードを指示するか否かを判断する際に用いられる、非アクセス時間のしきい値を格納する、非アクセス時間しきい値設定エリア270
(i)ホストコンピュータ100からの要求に基づくディスク装置へのアクセスが来ない時間を格納するタイマ値格納エリア275
(j)管理端末700との通信を行う管理端末通信プログラム280
(k)ディスク装置へのアクセスがあったかどうかを監視するアクセス監視プログラム261
(l)ディスク装置へアンロードの有効化、または、無効化を指示するアンロード制御プログラム262
(m)ディスク装置からデータが読み出せるかどうかのチェックであるオンラインデータチェックを実施するオンラインチェックプログラム263
尚、オンラインチェックプログラム263によって実行されるオンラインデータチェックには例えば2つの方法がある。第一の方法は、ディスク装置からデータが読み出せるかどうかをチェックするベリファイと呼ばれる方法である。第二の方法は、パリティグループを構成する複数のデータを、複数のディスク装置から読み出し、RAIDのパリティグループとして整合性がとれているかどうか(例えば、パリティデータが、同じパリティグループに属する他のデータの排他的論理和となっているか)をチェックするパリティチェックと呼ばれる方法である。
オンラインデータチェックは、ホストコンピュータ100からディスクアレイシステムに対して発行されたアクセス要求を、ディスクアレイコントローラ200が実行する合間に、ディスクアレイコントローラの制御によって実行される。具体的には、オンラインチェックプログラム263によって、ホストコンピュータ100からのアクセスとは関係なくディスク装置内の記憶領域からデータが読み出される。上述の第1の方法ではデータの読出しに成功すれば正常、失敗すればエラーとなる。また上述の第二の方法ではオンラインチェックプログラム263によって更に読み出されたデータの内容がチェックされ、パリティグループのデータとして整合性がとれていれば正常、整合性がとれていなければエラーとなる。オンラインデータチェックによってエラーが検出された場合には、ディスクアレイコントローラ200は、エラーが検出された記憶領域に格納されていたデータを、このデータと同じパリティグループに属するデータから復元して、ディスク装置内の別の記憶領域に格納する。
アンロード処理については、後述する。
管理端末700は、ユーザ、もしくは、保守員から、ディスクアレイコントローラ200に設定する設定情報を受け付ける入力部710と、ディスクアレイ200から取得したの情報を出力する出力部720とを有する。入力部710はキーボード、マウス等であり、出力部720はディスプレイ等である。
図2は、ディスク装置501の構成例を示す図である。ディスク装置502〜504も同様の構成である。
450は回転機構により回転し、データを格納するメディア、460はメディア450に対するデータの書き込み/読み出しを行うヘッドである。メディア450の回転機構については図を省略する。
434は外部とのインターフェースである外部I/Fであり、本実施形態ではディスクアレイコントローラ200のディスクI/F206と接続される。431はディスク装置501の制御を行うプロセッサ、432はプロセッサ431によって実行されるプログラムやデータを格納しているメモリ、435はヘッド460の位置制御を行うヘッド位置制御部、436はヘッド460を介してメディア450へのデータ書き込み/データ読み出しを行うインターフェースであるメディアI/Fである。
メモリ432は、以下のプログラム、格納領域を有している。
(a)外部I/F434を介してディスクアレイコントローラ200からコマンドを受信するコマンド受信プログラム441
(b)ディスク装置501内でのデータ転送を実行するデータ転送プログラム442
(c)ディスクコントローラ200から受信したコマンドによって指定されたアドレスを、実際のメディア450上の位置を示すアドレスに変換するアドレス変換プログラム443
(d)データをバッファリングするデータバッファ444
(e)メディア450へのアクセスを制御するメディアアクセスプログラム445
(f)ヘッド460の位置を決定するヘッド位置決めプログラム446
(g)ヘッド460のロード/アンロード制御を行うアンロード制御プログラム451
ここで、アンロードについて説明する。ロード/アンロード方式対応のディスク装置においては、ヘッド460をメディア450から離れたアンロード位置に退避することができる。アンロード位置はメディアから離れた位置にあるため、この位置からはヘッドはメディアに対するデータの読み書きを実行することはできず、またメディアとヘッドとが接触することもない。従ってヘッド460をアンロード位置に退避することで、ヘッド460とメディア450の接触を回避し、ディスク装置の障害率を低減することができる。
また、ヘッド460をアンロード位置に退避した状態においても、メディア450自体は回転を継続することができる。従ってディスク装置へのアクセスがあった場合、メディア450の回転が停止している場合と比べ十分に短い時間で、ヘッド460をロード位置、すなわち、メディア450上のメディアに対するデータの読み書きを実行可能な位置に移動することができる。メディア450の回転が停止している状態でホストコンピュータ100からメディア上に記録されたデータへのアクセスがあった場合には、メディアの回転を再開するのに時間がかかるため、ホストコンピュータ100がアクセスコマンドを発行してからディスクアレイシステムがコマンドに応答するまでの時間が長くなり、ホストコンピュータ100に対するディスクアレイシステムの応答がタイムアウトとなってしまう可能性がある。しかし上述の様にヘッドがアンロード位置に退避した状態においてもメディア450の回転は持続していれば、短時間でヘッドをロード位置に戻してメディア450に記録されているデータにアクセスすることができるので、ディスクアレイシステムの応答がタイムアウトとなってしまうことはない。
図3は、ディスク管理テーブル240の一例を示す図である。
ディスク管理テーブル240に格納されるパラメータとしては、ディスク装置の識別番号を表す「ディスクNo.」、ディスク装置の累積通電時間を示す「累積通電時間」、ディスク装置の累積アンロード時間を示す「累積アンロード時間」、ある期間内のディスク装置の通電時間を示す「差分通電時間」、ある期間内のアンロード時間を示す「差分アンロード時間」、累積通電時間のしきい値を示す「累積通電時間しきい値」、アンロードしていない、すなわち、ロード状態であった累積時間の比率である累積非アンロード率のしきい値を示す「累積非アンロード率しきい値」、ある期間内のアンロードしていない、すなわち、ロード状態であった時間の比率である差分非アンロード率のしきい値を示す「差分非アンロード率しきい値」がある。
ここで、累積非アンロード率は、(1−「累積アンロード時間」)/「累積通電時間」の百分率と定義する。また、差分非アンロード率は、(1−「差分アンロード時間」)/「差分通電時間」の百分率と定義する。「累積通電時間しきい値」には、通電時間としてディスクの製品寿命、もしくは、製品寿命が近づいている目安となる値を設定する。
ユーザ、または、保守員は、管理端末700の入力部710を用いて、「累積通電時間しきい値」、「累積非アンロード率しきい値」、「差分非アンロード率しきい値」、「非アクセス時間しきい値」を入力する。管理端末700は、管理I/F207を介して、入力部から受け付けた情報をディスクアレイコントローラ200の管理端末通信プログラム280に送信し、管理端末通信プログラム280は受信した情報をディスク管理テーブル240、または、非アクセス時間しきい値設定エリア270に設定する。
(2)ディスク装置のアンロード機能
図2を用いて、ディスク装置501―504のアンロード機能を説明する。ディスク装置501―504は同様の構成を有することからディスク装置501を例にとり説明する。
ディスクアレイコントローラ200のアンロード制御プログラム262により発行されたアンロード有効化コマンド若しくはアンロード無効化コマンドは、外部I/F434を介してコマンド受信プログラム441により受信され、コマンド受信プログラム411がコマンドの種別を判定する。
コマンド受信プログラム411が、受信コマンドをアンロード有効化コマンドであると判断した場合には、アンロード制御プログラム451が、ヘッド位置制御部435に指示を行ない、ヘッド460をアンロード位置に移動させる。反対に、コマンド受信プログラム411が受信コマンドをアンロード無効化コマンドだと判断した場合には、アンロード制御プログラム451がヘッド位置制御部435に指示を行い、ヘッド460をロード位置に移動させる。
なお、受信コマンドがアンロード有効化コマンドであった場合、アンロード制御プログラム451は即時にアンロード指示をヘッド位置制御部435に出すのではなく、ある一定時間経過後にヘッド位置制御部435に指示を出してヘッド460をアンロード位置に移動させてもよい。また、受信コマンドがアンロード無効化コマンドであった場合、アンロード制御プログラム451は即時にヘッド位置制御部435に指示を出すのではなく、リード要求やライト要求等のI/O系のコマンドをディスクアレイコントローラ200からコマンド受信プログラム411が受信した契機でヘッド位置制御部435に指示を出して、ヘッド460をロード位置に移動してもよい。
(3)ディスクアレイコントローラのアンロード支援動作
ディスクアレイコントローラ200は、ホストコンピュータ100からのアクセス要求に応じて、ディスク装置501―504へのアクセスを実施する。ディスクアレイコントローラ200は、ホストコンピュータ100からのアクセス要求が頻発するときにディスク装置へのアクセスとオンラインデータチェックを実施し、ホストコンピュータ100からのアクセス要求が来ないときに、オンラインデータチェックを抑止し、かつ、ディスク装置のヘッドをアンロード状態にすることで、ディスク装置の故障率を低減する。
ディスクアレイコントローラ200によって実行されるアンロード支援動作の処理フローの一例を、図4のフローチャートを用いて、ディスク装置501に対する制御を例にとり説明する。
まず、アンロード制御プログラム262はディスク装置501に対してアンロード無効化コマンドを発行し、ディスク装置501のヘッド460をロード状態とする(ステップ1001)。次にディスク管理プログラム230は、オンラインチェックプログラム263を用いて、ディスク装置501のオンラインデータチェックを開始する(ステップ1002)。
そして、アクセス監視プログラム261はタイマ208を監視し、ディスク装置501に格納されているデータに対するホストコンピュータ100からのアクセスが来なかった時間の計測を開始する(ステップ1003)。
アクセス監視プログラム261は、ディスクコマンド発行プログラム220からディスクI/F206に対して、ディスク装置へのアクセスコマンドの発行があったか、即ちホストコンピュータ100の要求に基づきディスク装置501へのアクセスがあったかどうかを監視する(ステップ1004)。ホストコンピュータ100からディスクアレイシステムへリード要求やライト要求等のアクセス要求コマンドが発行された場合、ディスクアレイコントローラ200はこのアクセス要求コマンドを受信し、RAID制御プログラム210がアクセス対象のデータを格納しているディスク装置を特定し、特定されたディスク装置に対してディスクコマンド発行プログラム220がI/O系のコマンドを発行する。従ってアクセス監視プログラム261はディスクコマンド発行プログラム220がディスクI/F206に対してI/O系のコマンドを発行したか否かを監視する。
ホストコンピュータ100の要求に基づくディスク装置501へのアクセスがない場合は、ステップ1006に移る。ホストコンピュータ100の要求に基づくディスク装置501へのアクセスがあった場合は、アクセス監視プログラム261がタイマ値をクリアし(ステップ1005)、ステップ1006に移る。
ステップ1006では、アクセス監視プログラム261が、ステップ1003で計測を開始したタイマの値が非アクセス時間しきい値設定エリア270に設定されている非アクセス時間しきい値に到達したかどうかを判定する(ステップ1006)。非アクセス時間しきい値に到達していない場合は、ステップ1004に移る。
非アクセス時間しきい値に到達していた場合、オンラインチェックプログラム263は、オンラインデータチェックを停止し(ステップ1007)、アンロード制御プログラム262はディスク装置501にアンロード有効化コマンドを発行し、ヘッド460をアンロード状態にする(ステップ1008)。
アクセス監視プログラム261は、ディスクI/F206に対して、ディスクコマンド発行プログラム220からコマンド発行があり、ホストコンピュータ100からの要求に基づくディスク装置501へのアクセスがあったかどうかを監視する(ステップ1009)。ホストコンピュータ100の要求に従ったディスク装置501へのアクセスがない場合は、ステップ1009を繰り返す。
ホストコンピュータ100の要求に従って、ディスク装置501へのディスクアクセスがあった場合は、ステップ1001に移る。アンロード制御プログラム262は、ディスク装置501のヘッド460がアンロード状態にある時に、ホストコンピュータ100からの要求に基づき当該ディスク装置501へのアクセスが生ずると、ディスク装置501のヘッド460をロード状態とするようアンロード無効化コマンドを出す(ステップ1001)。その後の処理は上述の通りである。
なお、上述のステップ1004においては、ディスク装置501へのディスクアクセスはホストコンピュータ100の要求に従って実行されるものとして記載しているが、ホストコンピュータ100の要求に従って実行されるディスクアクセスに限られることなく、ディスクコマンド発行プログラム220が発行する、ヘッド460を介したメディア450へのアクセスが発生するコマンド全般についてアクセス監視プログラム261が監視するようにしておいてもよい。
以上が、アンロード支援動作の処理フローである。
(4)アンロードモニタ動作
ディスク動作時間計測プログラム250は、一定周期で各ディスク装置501〜504の通電時間の累積をカウントし、図3のディスク管理テーブル240の「累積通電時間」に積算値を設定する。
また、ディスク動作時間計測プログラム250は、図4のステップ1008からステップ1001までの時間をカウントし、ヘッド460がアンロード状態にあった時間の累積として、ディスク管理テーブル240の「累積アンロード時間」に積算値を設定する。
また、ディスク動作時間計測プログラム250は、ある特定の期間における通電時間とアンロード時間をそれぞれディスク管理テーブル240の「差分通電時間」、「差分アンロード時間」に設定する。尚、この「特定の期間」は、管理端末700が入力部710を介してユーザ若しくは管理者より受信し、管理I/F207を介してディスクアレイコントローラ200に設定される。
次に、ディスク動作時間判定プログラム255によるアンロードモニタ動作の処理フローの一例を図5に示す。
ディスク動作時間判定プログラム255は、ディスク管理テーブル240の「累積通電時間」が、「累積通電時間しきい値」を超えたかどうかを判定する(ステップ2001)。しきい値を超えた場合、ディスク動作時間判定プログラム255はディスク情報通知プログラム260を用いて、管理端末700に累積通電時間がしきい値を超えたことを通知し(ステップ2002)、ステップ2003に移る。しきい値を超えていない場合は、ステップ2003に移る。
次に、ディスク動作時間判定プログラム255は、累積非アンロード率が、ディスク管理テーブル240の「累積非アンロード率しきい値」を超えたかどうかを判定する(ステップ2003)。しきい値を超えた場合、ディスク動作時間判定プログラム255はディスク情報通知プログラム260を用いて、管理端末700に累積非アンロード率がしきい値を超えたことを通知し(ステップ2004)、ステップ2005に移る。しきい値を超えていない場合は、ステップ2005に移る。
次に、ディスク動作時間判定プログラム255は、差分非アンロード率が、ディスク管理テーブル240の「差分非アンロード率しきい値」を超えたかどうかを判定する(ステップ2005)。しきい値を超えた場合、ディスク動作時間判定プログラム255はディスク情報通知プログラム260を用いて、管理端末700に差分非アンロード率がしきい値を超えたことを通知し(ステップ2006)、ステップ2001に移る。しきい値を超えていない場合は、ステップ2001に移る。
以上がアンロードモニタ動作の処理フローである。管理端末700は、ディスク情報通知プログラム260から通知を受けると、出力部720に通知された情報を出力する。
尚、ディスク情報通知プログラム260は、ディスク動作時間判定プログラム255の指示によって動作するだけでなく、管理端末を介して受信したユーザ若しくは保守員からの指示によっても動作する。例えば、ユーザもしくは保守員が、ディスクアレイコントローラ200が有するディスク管理テーブル240の情報を取得する場合、管理端末700の入力部710に情報の取得要求を入力する。ディスクアレイコントローラ200のディスク情報通知プログラム260は、入力部710と管理I/F207を介して情報の取得要求を受け取り、管理端末700にディスク管理テーブル240に格納されている情報を通知する。管理端末700は出力部720により、通知された情報を出力する。
以上で説明した実施形態によれば、ホストコンピュータ100からディスクアレイシステムへのアクセスが生じていない時間帯は、ディスク装置のヘッドをアンロード位置に退避させることで、ディスク装置のメディアとヘッドの接触を抑止し、ディスク装置の故障を低減することができる。
更にディスク装置のヘッドがアンロード位置にある状態ではオンラインデータチェックを停止し、ヘッドがロード状態にある場合にはオンラインデータチェックを実行することにより、オンラインデータチェックを効率的に実施でき、ディスク装置の信頼性を向上できる。即ち、ヘッドのアンロード化とオンラインデータチェックとを併用することができるので、ヘッドのアンロード化によるディスク装置の故障の低減と、オンラインデータチェックによる障害記憶領域の検出と検出された障害記憶領域に格納されているデータの復元とによりディスク装置の信頼性を向上させることができる。
また、ディスク装置のヘッドをアンロード位置に退避させた状態においても、メディアの回転は維持できるので、ホストコンピュータ100への応答性能の劣化(応答時間の長期化)を抑えることができる。
尚、図4に示したアンロード支援動作に替えて、アンロード制御プログラムはアンロード無効化、アンロード有効化を一定の時間間隔で繰り返すよう、一定の時間間隔でアンロード無効化コマンド、アンロード有効化コマンドを交互に発行しても良い。この場合、「一定の時間間隔」は、ディスクの寿命内でヘッドのアンロード無効化/有効化の繰り返し回数の仕様制限を超えないような値であることが望ましく、管理端末の入力部710を介してユーザ若しくは保守員がディスクアレイシステムに設定可能な構成であることが望ましい。この場合にも、アンロード制御プログラム262がアンロード無効化コマンドを発行すると、その後にディスク管理プログラム230がオンラインチェックプログラム263を用いてオンラインデータチェックの実行を開始し、アンロード制御プログラム262がアンロード有効化コマンドを発行する前にオンラインチェックプログラムの実行を停止する。この結果、ディスクの稼動開始と停止の繰り返し制限の遵守に相当するヘッドのアンロード無効化/有効化の繰り返し制限の遵守を達成することができる。
尚、上述の実施形態においてはディスク装置の一例として、ATAディスクを記載したが、ディスク装置の信頼性向上の観点から、ディスク装置はATAディスク以外のディスク装置、例えばATAディスクより信頼性の低いディスク装置は勿論、ATAディスク装置より信頼性の高いFCディスクの様なディスク装置であってもよい。
一実施形態における計算機システムのシステム構成例を示す図である。 ディスク装置の構成例を示す図である。 ディスク管理テーブルの一例を示す図である。 アンロード支援動作の処理フローの一例を示す図である。 アンロードモニタ動作の処理フローの一例を示すである。
符号の説明
100・・・ホストコンピュータ
200・・・ディスクアレイコントローラ
500・・・ディスク装置群
700・・・管理端末
435・・・ヘッド位置制御部
450・・・メディア
460・・・ヘッド

Claims (6)

  1. 計算機からアクセスされデータを格納するディスクアレイシステムであって、
    ディスクアレイコントローラと、
    データを格納する複数のディスク装置とを有し、
    前記複数のディスク装置は各々、データが記録されるメディアと、当該メディアに対するデータの読み書きを実行するヘッドと、当該ヘッドの位置を制御するヘッド位置制御部とを有しており、
    前記ディスクアレイコントローラは、
    前記ディスク装置内の記憶領域からデータを読み出すことにより前記記憶領域に障害が生じているか否かをチェックするオンラインデータチェック処理を実行しており、
    最後に前記計算機から前記ディスク装置に格納されているデータへのアクセス要求を受信してからの経過時間が計測されたことを契機に、前記ディスク装置に対するオンラインデータチェック処理を停止し、
    前記オンラインデータチェック処理の停止後に、前記ディスク装置のヘッドを、当該ヘッドがメディアに対するデータの読み書きを実行する際の位置とは異なる位置に移動するよう、前記ディスク装置にアンロード有効化指示を発行し、
    前記ディスク装置のヘッド位置制御部は、前記アンロード有効化指示に基づいて、前記ヘッドの位置を移動し、
    前記ディスクコントローラは、
    前記ディスク装置に対する前記オンラインデータチェック処理を停止した後、初めて前記計算機から前記ディスク装置に格納されているデータへのアクセス要求を受信した時を契機に、前記ディスク装置のヘッドを、前記ヘッドがメディアに対するデータの読み書きを実行可能な位置に移動するよう、前記ディスク装置にアンロード無効化指示を発行し、
    前記ヘッドが移動した後に、前記ディスク装置に対するオンラインデータチェック処理を再開し、
    前記計算機からのアクセス要求が頻発するときに、前記ディスク装置へのアクセスと前記オンラインデータチェック処理を実施し、前記計算機からのアクセス要求が来ないときに、前記オンラインデータチェック処理を抑止し、かつ、前記ディスク装置のヘッドをアンロード状態にする
    ことを特徴とするディスクアレイシステム。
  2. 請求項1記載のディスクアレイシステムであって、
    前記ディスクアレイコントローラは、所定の期間ごとに前記アンロード無効化指示と前記アンロード有効化指示とを繰り返し発行することを特徴とするディスクアレイシステム。
  3. 請求項1記載のディスクアレイシステムであって、
    前記複数のディスク装置は各々ATAディスクであることを特徴とするディスクアレイシステム。
  4. 請求項1記載のディスクアレイシステムであって、
    前記ディスクアレイコントローラは、管理端末に情報を出力する管理インタフェースを有しており、
    前記ディスクアレイコントローラは、前記複数のディスク装置各々の通電時間を計測しており、当該通電時間が所定の閾値を超えた場合にはその旨を前記管理インタフェースを介して前記管理端末に通知することを特徴とするディスクアレイシステム。
  5. 請求項1記載のディスクアレイシステムであって、
    前記ディスクアレイコントローラは、管理端末に情報を出力する管理インタフェースを有しており、
    前記ディスクアレイコントローラは、前記複数のディスク装置各々について、前記ヘッドがメディアに対するデータの読み書きが実行可能な位置にある累積時間を計測しており、計測結果を前記管理インタフェースを介して前記管理端末に出力することを特徴とするディスクアレイシステム。
  6. 請求項5記載のディスクアレイシステムであって、
    前記ディスクアレイコントローラは、前記複数のディスク装置各々について、所定の期間内において、前記ヘッドがメディアに対するデータの読み書きが実行可能な位置にある時間を計測しており、当該計測結果を前記インタフェースを介して前記管理端末に出力することを特徴とするディスクアレイシステム。
JP2004154077A 2004-05-25 2004-05-25 ディスク故障を抑止するディスクアレイ Expired - Fee Related JP4404353B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2004154077A JP4404353B2 (ja) 2004-05-25 2004-05-25 ディスク故障を抑止するディスクアレイ
US10/924,813 US7181570B2 (en) 2004-05-25 2004-08-25 Diskarray system for suppressing disk fault
EP04029459A EP1600949A1 (en) 2004-05-25 2004-12-13 Diskarray system for suppressing disk fault
CNB2004101041185A CN100339816C (zh) 2004-05-25 2004-12-29 抑制记录盘故障的记录盘阵列***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004154077A JP4404353B2 (ja) 2004-05-25 2004-05-25 ディスク故障を抑止するディスクアレイ

Publications (2)

Publication Number Publication Date
JP2005338976A JP2005338976A (ja) 2005-12-08
JP4404353B2 true JP4404353B2 (ja) 2010-01-27

Family

ID=34927742

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004154077A Expired - Fee Related JP4404353B2 (ja) 2004-05-25 2004-05-25 ディスク故障を抑止するディスクアレイ

Country Status (4)

Country Link
US (1) US7181570B2 (ja)
EP (1) EP1600949A1 (ja)
JP (1) JP4404353B2 (ja)
CN (1) CN100339816C (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7106540B1 (en) * 2005-06-03 2006-09-12 International Business Machines Corporation Ensuring rate of spin-up/spin-down cycles for spindle motor in a hard disk drive does not exceed rate spindle motor is designed to handle
US7752488B2 (en) * 2006-01-06 2010-07-06 International Business Machines Corporation Method to adjust error thresholds in a data storage and retrieval system
JP2018151776A (ja) * 2017-03-10 2018-09-27 キヤノン株式会社 情報処理装置とその制御方法、及びプログラム

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5148432A (en) * 1988-11-14 1992-09-15 Array Technology Corporation Arrayed disk drive system and method
JPH04205619A (ja) * 1990-11-30 1992-07-27 Toshiba Corp ディスク制御システム
US5537566A (en) * 1991-12-17 1996-07-16 Fujitsu Limited Apparatus and method for controlling background processing in disk array device
JP3183719B2 (ja) * 1992-08-26 2001-07-09 三菱電機株式会社 アレイ型記録装置
JPH06332623A (ja) * 1993-05-24 1994-12-02 Mitsubishi Electric Corp アレイ型記録装置及び記録装置
JP3078972B2 (ja) * 1993-11-05 2000-08-21 富士通株式会社 ディスクアレイ装置
SG42871A1 (en) 1993-12-21 1997-10-17 Ibm Inner diameter disk drive head/slider load/unload device
US5801894A (en) 1994-10-11 1998-09-01 International Business Machines Corporation Power-saving high performance data storage system
US5615335A (en) * 1994-11-10 1997-03-25 Emc Corporation Storage system self-test apparatus and method
JPH08235761A (ja) * 1994-11-17 1996-09-13 Integral Peripherals Inc ディスク駆動装置における電力節減の方法
US5859738A (en) 1996-07-15 1999-01-12 Seagate Technology, Inc. Head positioning in storage system during periods of inactivity
US5872670A (en) 1997-02-07 1999-02-16 Quantum Corporation Methods and apparatus for preventing disk drive damage by parking a transducer during microprocessor failures
US5958066A (en) * 1997-06-03 1999-09-28 Emc Corporation On-line scanning and maintenance of a disk drive array
JP2000305716A (ja) * 1999-04-23 2000-11-02 Sony Corp ディスク制御装置及びディスク制御方法
JP3888816B2 (ja) * 1999-11-24 2007-03-07 富士通株式会社 ヘッドのロード/アンロード制御方法及び記憶装置
US6476996B1 (en) 2000-02-15 2002-11-05 Western Digital Technologies, Inc. Disk drive comprising an actuator driver circuit for retracting a head independent of a servo microprocessor when a spindle speed fault mode is detected
JP3705073B2 (ja) * 2000-03-30 2005-10-12 日本電気株式会社 磁気記憶装置のヘッドアンロードの制御方法及び磁気記憶装置
US6480970B1 (en) * 2000-05-17 2002-11-12 Lsi Logic Corporation Method of verifying data consistency between local and remote mirrored data storage systems
US6986075B2 (en) * 2001-02-23 2006-01-10 Hewlett-Packard Development Company, L.P. Storage-device activation control for a high-availability storage system
JP2002297320A (ja) 2001-03-30 2002-10-11 Toshiba Corp ディスクアレイ装置
JP2003141839A (ja) * 2001-11-01 2003-05-16 Hitachi Ltd ロード/アンロード方法及びこれを用いた磁気ディスク装置

Also Published As

Publication number Publication date
EP1600949A1 (en) 2005-11-30
US7181570B2 (en) 2007-02-20
CN1702611A (zh) 2005-11-30
US20050268034A1 (en) 2005-12-01
CN100339816C (zh) 2007-09-26
JP2005338976A (ja) 2005-12-08

Similar Documents

Publication Publication Date Title
US7281088B2 (en) Disk array apparatus and disk array apparatus controlling method
KR101574844B1 (ko) Smr raid용의 대블록 무작위 쓰기 핫 스페어 ssd 구현
JP5958020B2 (ja) ストレージシステム
US20090083483A1 (en) Power Conservation In A RAID Array
US8601212B2 (en) Scheduling read operations during drive reconstruction in an array of redundant disk drives
JP5022773B2 (ja) ジャーナルを利用したリモートコピーのコピー先となるストレージシステムの消費電力を節約する方法及びシステム
JP2006301714A (ja) アレイコントローラ、当該アレイコントローラを含む情報処理装置及びディスクアレイ制御方法
JP5141278B2 (ja) ディスクアレイシステム,ディスクアレイ制御方法及びディスクアレイ制御用プログラム
US20100115310A1 (en) Disk array apparatus
JP2002297320A (ja) ディスクアレイ装置
US10795790B2 (en) Storage control apparatus, method and non-transitory computer-readable storage medium
US8447927B2 (en) Storage system, control device and storage device
JP4698710B2 (ja) ストレージシステムおよびその省電力方法
JP4775843B2 (ja) ストレージシステム及び記憶制御方法
JP4404353B2 (ja) ディスク故障を抑止するディスクアレイ
JP6287613B2 (ja) 制御装置、および診断制御プログラム
JP4968078B2 (ja) 故障診断装置及び故障診断方法
JP4752787B2 (ja) ディスクアレイ装置、該ディスクアレイ装置に用いられる電源制御方法及び電源制御プログラム
US7581126B2 (en) Information recording apparatus
JP5505329B2 (ja) ディスクアレイ装置及びその制御方法
US8453007B2 (en) Storage device and recovery method
US11481324B2 (en) Storage control device, storage medium and storage control method
JP2007257577A (ja) Raid制御装置、方法及びプログラム並びにディスクアレイ装置
JP2000293318A (ja) ディスクアレイ装置およびメディアエラー救済方法
JP2000330732A (ja) ディスクアレイ装置

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20060424

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060913

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20090206

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20090216

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090820

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091008

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091029

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091030

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121113

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121113

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131113

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees