JP3063666B2 - アレイディスク制御装置 - Google Patents
アレイディスク制御装置Info
- Publication number
- JP3063666B2 JP3063666B2 JP9080998A JP8099897A JP3063666B2 JP 3063666 B2 JP3063666 B2 JP 3063666B2 JP 9080998 A JP9080998 A JP 9080998A JP 8099897 A JP8099897 A JP 8099897A JP 3063666 B2 JP3063666 B2 JP 3063666B2
- Authority
- JP
- Japan
- Prior art keywords
- disk
- failure
- value
- interface
- management table
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Techniques For Improving Reliability Of Storages (AREA)
Description
データを分散して書き込むアレイディスクを制御するア
レイディスク制御装置に係り、特に、ディスクまたはデ
ィスクインターフェースでの障害発生時にディスクの切
り離しを行うアレイディスク制御装置に関する。
に開示されているように、磁気ディスク装置のリードエ
ラーまたはシークエラーの発生状況を監視し、媒体異常
がある磁気ディスクを切り離すアレイディスク制御装置
が提案されている。これは、エラーの発生回数により媒
体の状態を検出し、エラーの発生回数が予め定められた
値を越えたときに当該ディスクを強制的に切り離すもの
である。
4−67476号公報に示されている従来の技術ては、
媒体異常の発生頻度を知るために各媒体欠陥の位置に関
する構報を記憶しておかなければならなず、すると、非
常に大きな記憶容量が必要となってしまう、という不都
合があった。
フェース制御部に異常があった場合であっても、当該デ
ィスクインタフェース制御部に接続されているディスク
に異常があるとして切り離してしまう、という不都合が
あった。
品質が向上し、記録媒体の障害による障害は比較的少な
く、例え発生しても交代セクター処理などによりあまり
大きな被害が生じにくい。逆に、ディスクの記録密度の
高密度化などに伴い、ヘッドの記録面への吸着、あるい
は、スピンドルモータの故障、アレイディスク制御装置
とディスクとの間のインターフェースの障害のようにデ
ィスクの記録媒体の一部の障害よりもディスク全体がア
クセス不能になる障害の方が生じやすく、また、これに
よる被害の方がディスク全体がアクセス不能になる分大
きなものとなる。
ンドルモータの故障などディスク自身の障害に対しては
従来技術の延長でディスクを切り離すことで信頼性を向
上させることができる。しかし、ディスクインターフェ
ースの障害に関してはディスク自身の障害であるか、ア
レイディスク制御装置のインターフェース部の障害であ
るかの切り分けは困難であり、従来技術のようにエラー
の発生履歴をカウントすることによりディスクを切り離
すことは悪影響を招くことがある。
ク制御装置から各ディスク71〜74をアクセスできる
ように構成されたアレイディスク装置で、アレイディス
ク制御装置10A内のディスクインターフェース制御回
路42Aが故障した場合、ディスク52Aを切り離すこ
とにより処理の継続は可能であるが、この場合正常なデ
ィスクを切り離すことになってしまう。
の1つのディスクの一部分の領域に障害がある場合に、
他のディスクに障害が発生したとして切り離してしまう
と、当該1つのディスクの障害のない他の部分のデータ
を読み出すことができなくなってしまう、という不都合
があった。すなわち、障害の発生の回数で単純に切り離
し処理を行うと、復旧可能なデータであっても喪失して
しまう、という不都合があった。
は、媒体の障害により書き込みができない場合にはデー
タを格納するデータディスクとパリティデータを格納す
る冗長ディスクとの整合性をとるため、障害ディスクを
切り離して処理を行う必要がある。
でデータを復旧してホストコンピュータに転送すること
が可能なため、より影響が大きくなるディスク全体の切
り離しは行わず一時的な切り離しだけで処理を継続しよ
うとすることがある。あるいは、媒体に比較的軽微な障
害が発生しているが、再試行により救済することが可能
な状況ではディスクの切り離しは行われない場合があ
る。
るが、そのディスクの切り離しが行われていない状態に
なることがあり得る。このような状態で他のディスクで
重度な障害が発生した場合には、従来技術のように障害
の発生頻度をカウントする方法だけでディスクを切り離
すようにすると、ディスクは切り離されて処理を継続し
てしまうことになる。
理を継続することが可能であるが、これにより冗長性が
なくなるため、の部分的な媒体障害の発生している部分
はその後読み出すことができなくなる。これは、すでに
書き込まれているデータを読み出せない、すなわちデー
タの消失という、データを書き込むことができなくなり
処理を中断するよりも大きな問題になる。
改善し、特に、少ない障害履歴情報で、的確にディスク
の切り離しを行い、信頼性を向上させることのできるア
レイディスク制御装置を提供することを、その目的とす
る。
位装置から送信されたデータを受信するホストインタフ
ェース制御部と、このホストインタフェースで受信した
データを冗長構成にして複数のディスクに格納するアレ
イ制御手段とを備えている。さらに、アレイ制御手段
に、ディスクの障害に応じて予め定められた値が格納さ
れるディスク障害管理テーブルを併設している。そし
て、アレイ制御手段が、ディスクの障害が発生したとき
にディスク障害管理テーブルの値を増加させるディスク
障害値加算機能と、当該ディスクに対して正常にデータ
の格納又は読み出しが行われたときにはディスク障害管
理テーブルの値を減少させるディスク障害値減算機能
と、ディスク障害管理テーブルのディスク障害値が予め
定められたしきい値よりも上回ったときに当該インタフ
ェースを切り離す機能をとを備えた、という構成を採っ
ている。
応じてディスクの切り離し処理を行う。このとき、本発
明では、ディスクの障害に応じて予め定められた値が格
納されるディスク障害管理テーブルを用いる。アレイ制
御手段は、ディスク障害値加算機能により、ディスクの
障害が発生したときにディスク障害管理テーブルの値を
増加させる。一方、間欠的な障害によってディスクの切
り離しを行うことを防止するため、ディスク障害値減算
機能によって、ディスクに対して正常にデータの格納又
は読み出しが行われたときにはディスク障害管理テーブ
ルの値を減少させる。そして、アレイ制御手段は、ディ
スク切り離し機能により、ディスク障害管理テーブルの
ディスク障害値が予め定められたしきい値よりも上回っ
たときに当該インタフェースを切り離す。ディスク障害
値減算機能によって、回復不能なメディアの障害の発生
と、間欠的なリード/ライトエラーの発生とを的確にデ
ィスク障害管理テーブルに反映される。このため、軽度
の障害で切り離す必要がないときに切り離し処理を行う
ことがない。
段が、前記複数のディスクをさらに複数の領域に分割す
ると共に、前記ディスク障害管理テーブルが、当該分割
領域ごとに障害の履歴を管理するテーブル項目を有し、
ディスク障害値加算機能が、ディスクの障害が発生した
ときに一定値aを加算する機能を備え、ディスク障害管
理テーブルのしきい値を、前記一定値aのn倍に設定す
ると共に、このnの値を、前記上位装置が同一データを
自動的にリトライする回数に設定し、ディスク障害値減
算機能が、前記ディスクの分割領域数に応じて一定値a
よりも小さい値を減算する機能を備えた、という構成を
採っている。これにより前述した目的を達成しようとす
るものである。
する。本実施形態によるアレイディスク制御装置は、上
位装置から送信されたデータを受信するホストインタフ
ェース制御部と、このホストインタフェースで受信した
データを冗長構成にして複数のディスクに格納するアレ
イ制御手段とを備えている。このアレイ制御手段に、デ
ィスクの障害に応じて予め定められた値が格納されるデ
ィスク(メディア)障害管理テーブルを併設している。
害が発生したときにディスク障害管理テーブルの値を増
加させるディスク障害値加算機能と、当該ディスクに対
して正常にデータの格納又は読み出しが行われたときに
はディスク障害管理テーブルの値を減少させるディスク
障害値減算機能と、ディスク障害管理テーブルのディス
ク障害値が予め定められたしきい値よりも上回ったとき
に当該インタフェースを切り離すディスク切り離し機能
とを備えている。
が、ディスクに対して正常にデータの格納又は読み出し
が行われたときには、ディスク障害値加算機能によって
加算されたディスク障害値を減算する。このため、間欠
的なディスクの障害の場合には、ディスク障害値加算機
能によってディスク障害値が加算されても、正常な動作
が継続することによりディスク障害値はしきい値に至ら
ず、従って、切り離す必要がない場合に切り離し処理を
行うことがない。
が、複数のディスク装置をさらに複数の領域に分割する
と共に、ディスク障害管理テーブルが、当該分割領域ご
とに障害の履歴を管理するテーブル項目を有する。さら
に、ディスク障害値加算機能が、ディスクの障害が発生
したときに一定値aを加算する機能を備え、ディスク障
害管理テーブルのしきい値を、一定値aのn倍に設定す
ると共に、このnの値を、上位装置が同一データを自動
的にリトライする回数に設定する。そして、ディスク障
害値減算機能が、ディスク装置の分割領域数に応じて一
定値aよりも小さい値を減算する機能を備える。
割領域とディスクに障害が発生する箇所との大きさの相
違と、上位装置が同一データを自動的にリトライする回
数を考慮している。上位装置が同一データの書き込みを
繰り返す回数が3回だとすると、3回繰り返して書き込
みが行えない場合には、書き込み又は読み出しを行うデ
ィスクの位置は同一箇所であるため、当該データを書き
込もうとしたセクタにメディアの障害が発生していると
判定できる。従って、しきい値をaのn倍とすると、こ
のnを上位装置が同一のデータをリトライする回数に設
定すると、この上位装置のリトライが不成功となった場
合には、必ず障害有りとなり、切り離し処理の対象とす
る。
置から出力され、一部に障害のある分割領域に異なる命
令によってアクセスするときには、実際にアクセスする
箇所が異なる。この場合には、分割領域の正常な箇所に
アクセスすることがあるため、正常な箇所へのアクセス
によってディスク障害値を減算していく。しかし、この
減算の値は、加算の設定値aよりも十分に小さい値とす
ることで、ディスクに障害が発生したという履歴をディ
スク障害テーブルに残しておく。すなわち、分割領域が
小さい場合には、一旦障害が発生したとされる箇所が正
常な状態となったと判定できる場合であっても、分割領
域が大きく、分割領域のなかに障害のある部分とない部
分とがある場合には、障害が発生した分割領域であって
も正常にデータのリードライトが行える場合が多くな
る。このため、減算する値は、ディスク装置の分割領域
数に応じて一定値aよりも小さい値とする。この小さい
値での減算が継続すると、すなわち、正常なリードライ
トが繰り返されると、ディスク障害テーブルの値は0と
なる。一方、上位装置からリトライ命令が繰り返される
と、大きい値aが加算されるため、しきい値に達する。
このように分割領域としきい値及び加算、減算値の関係
を設定するため、的確にディスクの切り離し処理を行う
ことができる。
ィスク切り離し機能によってディスクを切り離す制御を
行うときにディスク障害管理テーブルによって他のディ
スクも障害を有するとされた場合には当該切り離し制御
を中止する切り離し中止機能を備える。この切り離し中
止機能により、自動的に切り離し処理を行うのは複数の
ディスクのうち1台のみに障害が発生している場合に限
られ、このため、切り離し処理を行ってもデータの冗長
構成によりデータを復旧することができる。一方、1台
に障害が判定され、切り離し処理を行うとしたときであ
っても、他のディスクにも障害がある場合には、当該他
のディスクの障害部分についてのデータの復旧ができな
くなるため、切り離し処理を行わずに、上位装置に報告
する。このため、切り離し処理によりデータを読み出せ
なくなる事態の発生を確実に防止することができる。
するデバイスインタフェースの障害を監視するアレイデ
ィスク制御装置にあっては、このデバイスインタフェー
スの障害状態に応じて切り離し処理を行う。この実施形
態では、ディスク障害管理テーブルに、デバイスインタ
ーフェースの障害に応じて予め定められた値が格納され
るデバイスインタフェース障害管理テーブルを併設す
る。さらに、アレイ制御手段が、デバイスインターフェ
ースの障害が発生したときにデバイスインタフェース障
害管理テーブルの値を増加させるインタフェース障害値
加算機能と、当該デバイスインタフェースを介して正常
にデータの格納又は読み出しが行われたときにデバイス
インタフェース障害管理テーブルの値を減少させるイン
タフェース障害値減算機能と、デバイスインタフェース
障害管理テーブルのインタフェース障害値が予め定めら
れたしきい値よりも上回ったときに当該インタフェース
を切り離すデバイスインタフェース切り離し機能とを備
える。
てディスクの切り離し処理を行う場合であっても、一旦
障害が発生したのちに正常にデータの転送が行えた場合
には、障害値の減算を行う。これにより、切り離し処理
が必要な場合にのみ切り離し処理を行うことができる。
形態では、アレイ制御手段が2台以上あり、同一のディ
スクへそれぞれのアレイ制御手段が接続されている場合
には、切り離し処理を行ったのち、他方のアレイ制御手
段によって当該ディスクにアクセスする。すなわち、こ
の実施形態では、デバイスインタフェース切り離し機能
に、当該デバイスインタフェース切り離し機能によって
デバイスインタフェースが切り離された場合には上位装
置からの再試行を複数のアレイ制御手段を順次選択して
行う制御をする再試行制御機能を併設する。これによ
り、ディスクインタフェースの切り離し処理と他のアレ
イ制御手段による接続という復旧処理とを自動的に行う
ことができる。
図である。図1に示すように、本実施形態では、接続さ
れているディスク毎にメディアの障害が検出された履歴
を記憶するメディア障害管埋テーブル(ディスク障害管
理テーブル)1と、接続されているディスクインターフ
ェース41〜44毎に、インターフェース障害が検出さ
れ、ホストコンピュータに報告された履歴を記憶するデ
バイスインターフェース障害管理テーブル2とを有して
いる。
加算又は減算するのは、図1に示す例では、マイクロプ
ログラム処理部5が行う。このマイクロプログラム処理
部5は、CPU,RAM等の構成を備え、障害値の加算
又は減算を行う手順が記載されたプログラムを実行する
ことで、アレイ制御手段の各種機能を実現する。
又はデバイスインタフェースの障害が検出または報告さ
れたときには該当するメディア障害管理テーブル1又は
デバイスインターフェース障害管理テーブル2にあらか
じめ設定された値を加算する。
生しなかったとき、あるいは一時的に障害を回避するた
めに当該ディスクを切り離して処理を行った場合には当
該ディスクのメディア障害管埋テーブル1、およびデバ
イスインターフェース障害管埋テーブル2の内容からあ
らかじめ設定された値を減ずる。
ディスクに対してアクセスする前にメディア障害管埋テ
ーブル1、および、デバイスインターフェース障害管埋
テーブル2の内容を調べ、規定値を超えていたときに当
該ディスクを障害と見なして切り離しの対象とする。上
述したアレイ制御手段は、このマイクロプログラム処理
部5と、アレイ制御部3とを備える。
ディア障害管理テーブル1、および、デバイスインター
フェース障害管理テーブル2の内容を調べ切り離しの対
象となるディスクが検出された場合に、他のディスクの
メディア障害履歴がある場合にはディスクの切り離しを
中止する機能を有している。
ために必要な情報は1ディスク当たりディスクインター
フェース障害の履歴管埋のための1つと、メディアに障
害履歴管埋のための1ディスクの記録領域を分割した数
に対応するだけの情報があればいい。例えば、1ディス
クの記録領域を32分割したのであれば32個の記憶領
域があればいい。ディスクインターフェース、または、
メディアの障害が検出された場合には対応する障害履歴
管埋テーブルにあらかじめ設定された値を加算する。
場合に当該ディスクを切り離しの対象とする処理は従来
より行われていた。本発明では、ディスクへのアクセス
で異常が発生しなかった場合には、当該記憶領域に対応
するメディア障害管埋テーブル1、および、デバイスイ
ンターフェース障害管理テーブル2の内容からあらかじ
め設定された値を減ずる。これにより、間欠的に発生し
得る軽微な障害が累積されてディスクが切り離されるこ
とを防止する。
生した場合には、必ずホストコンピュータへの障害報告
を行う。デバイソインターフェース障害管埋テーブル2
の加算はホストコンピュータへの障害報告時に加工され
るため、ホストコンピュータが障害の発生を認識した回
数として扱うことができる。複数のアレイディスク制御
装置から同一ディスクに対してアクセス可能なシステム
ではホストコンピュータが障害の発生を認識することに
よって、他のアレイディスク制御装置を経由して再試行
を行うことが可能になる。
ターフェース制御回路の故障であればこの再試行によっ
てディスクを切り離すことなく、他の正常なアレイディ
スク制御装置を使用して処理の継続が可能になる。ディ
スクインターフェース障害の原因がディスク側にあれば
ホストコンピュータが他のアレイディスク制御装置を経
由して再試行を行っても回復せず、再度最初に障害を報
告したアレイディスク制御装置を使用して再試行を操り
返す。これにより、デバイスインターフェース障害管埋
テーブル2の値が加算されしきい値を越えるとディスク
の切り離しの対象になる。
ディスクは実際に切り離す前に他のディスクのメディア
障害管理テーブル1の内容を調べ、障害の発生履歴が残
っている場合にはそのディスクの切り離しにより復旧で
きないデータが発生する可能性があるため切り離しを中
止する。これにより、ディスクの切り離しによって読み
出せないデータが生ずることを防ぐ。
る。
1構成例を示すブロック図である。アレイディスク制御
装置は、ホストコンピュータとアレイディスク制御装置
との間のデータ転送制御を行うホストインターフェース
制御部6と、ホストコンピュータから送られたデータの
複数ディスクへの分散、RAIDでの冗長データの生
成、あるいは複数ディスク(直接アクセス記憶装置,D
ASD)から読み出したデータからのオリジナルデータ
(ホストコンピュータから送られた時の形)への合成、
冗長データとの整合性のチェック、冗長データによるデ
ータの修復などを行うアレイ制御部3と、データを記憶
するディスク71,72,73,74と、各ディスク7
1,72,73,74とアレイ制御部3との間のインタ
ーフェース制御を行うディスクインターフェース制御部
41,42,43,44とを備えている。
管埋テーブル1を備えている、本実施例では、メディア
障害管埋テーブル1は、各ディスク71,72,73,
74の記録領域を8分割して個々の領域毎にエラーの発
生履歴をカウントする1バイトのカウンタの集合であ
る。また、アレイディスク制御装置は、デバイスインタ
ーフェース障害管埋テーブル2を備えている。このデバ
イスインターフェース障害管埋テーブル2は、各ディス
クインターフェース制御部41,42,43,44毎に
エラーの発生履歴をカウントする1バイトのカウンタの
集合である。
ンターフェース制御部6、アレイ制御部3など各部の動
作制御を行う部分であり、本実施例では、メディア障害
管埋テーブル1、デバイスインターフェース障害管理テ
ーブル2の更新もマイクロプログラム処理部5によって
マイクロプログラムによって実現されている。
する。この例では、ディスク障害の加算値を(2
0)16,しきい値を(60)16,減算値を(01)16と
する。また、ディスクを8領域に分割する。そして、デ
バイスインタフェースの障害の加算値を(01)16,し
きい値を(03),減算は初期値(00)へクリアする
処理により行う。上位装置のオペレーティングシステム
のリトライ回数は3回である。この設定により、切り離
し処理の適否の判断が良好に行われる。
受け付け、切り離し対象ディスクの有無をチェックする
処理のフローチャートである。
フェース制御部6を経由してホストコンピュータからコ
マンドを受け付けると(ステップS201)、このコマ
ンドで指定された読み出し、または書き込みアドレスか
らアクセスするディスク71〜74と、記録領域がディ
スクの全記録域を8分割したどの領域(以下ゾーンと記
す)に含まれるかを決定する(ステップS202)。
ップS202で決定されたディスク、ゾーンに対応する
カウンタの内容を読み出す(ステップS203)。複数
のディスク、またはゾーンにまたがる場合は、そのカウ
ンタ値の全てをあらかじめ設定されたしきい値と比較す
る(ステップS204)。
されているものとする。しきい値を超えるカウンタ値が
ない場合には、続いてデバイスインターフェース障害管
埋テーブル2の中からステップS202で決定された使
用するディスクに対応するディスクインターフェース制
御部41〜44の障害履歴カウントを読み出す(ステッ
プS205)。
ウンタ値の全てをあらかじめ設定されたしきい値と比較
する(ステップS206)。ここではしきい値として
(03)16が設定されている。このため、デバイスイン
タフェースの障害が3回報告された場合に当該インタフ
ェースの切り離しを行う。ステップS204、206何
れの判断でもしきい値を越えていない場合には、必要な
ディスクを選択してディスクをアクセスする(ステップ
S208)。
ディスクが切り離されている場合にはデータ復旧できる
様に冗長ディスクを使用するかどうかの判断も行う。メ
ディア障害管埋テーブル1の内容がしきい値を越えてい
ないかどうかの判断(ステップS204)、および、デ
バイスインターフェース障害管埋テーブル2の内容がし
きい値を越えていないかどうかの判断(ステップS20
6)でしきい値を越えているカウンタが検出された場合
には、このディスクを切り離し対象として切り離しの可
否の判断を行う(ステップS207)。
バイスインターフェース障害管埋テーブル2の内容がし
きい値を越えていて、なおかつ切り離し可能な状態であ
れば、ステップS207で切り離され、必要なディスク
を選択して読み出し、書き込みなどのアクセスの実行を
行う(ステップS208)。
障害管埋テーブル1、および、デバイスインターフェー
ス障害管理テーブル2の操作に関するフローチャートで
ある。ディスクへのアクセス後、最初にディスクインタ
ーフェースに関する障害の有無を判断する(ステップS
301)。
れた場合には、エラーの検出されたディスクに対応する
デバイスインターフェース障害管埋テーブル2のカウン
タの内容に(01)を加算し(ステップS302)、ホ
ストコンピュータにエラーの発生を知らせるステータス
を報告する(ステップS303)。
れなかった場合には、使用した全てのディスクに対応す
るデバイスインターフェース障害管理テーブル2の内容
を(00)にクリアする(ステップS304)。
れなかった場合には、続いてディスクのエラーの有無を
調べる(ステップS305)。ディスクでのエラーも発
生していなければ、ホストコンピュータに正常終了を示
すステータスを報告し(ステップS309)、さらにア
クセス対象になったディスク、およびゾーンの対応する
メディア障害管埋テーブル1の内容から(01)を減じ
る(ステップS310)。
障害管理テーブル1の該当するカウンタの値が(00)
の場合、すなわち、メディア障害の発生履歴がない場合
にはスキップされ、何もしない。
ーが発生した場合にはエラーの発生したディスク、およ
び発生位置に対応するゾーンを確定する(ステップS3
06)。ステップS306で決定されたゾーンに対応す
るカウンタをメディア障害管理テーブル1から読み出
し、カウンタ値に(20)16を加算し(ステップS30
7)、ホストコンピュータにエラーの発生を示すステー
タスを報告する(ステップS303)。
同様に、アクセス対象になり、なおかつエラーの発生し
なかったディスク、ゾーンに対応するメディア障害管埋
テーブル1のカウンタは(01)を減じる(ステップS
310)。
ディア障害管理テーブル1の該当するカウンタの値が
(00)の場合、すなわち、メディア障害の発生履歴が
ない場合にはスキップされ、何もしない。
により障害が発生した場合でもメディア障害管理テーブ
ル1、およびデバイスインターフェース障害管理テーブ
ル2のカウンタ値の操作だけで、この時点ではディスク
の切り離しは行わない。
ホストコンピュータにエラーが報告され、ホストコンピ
ュータ側の判断で有限回の再試行を行うことにより、メ
ディア障害管埋テーブル1、または、デバイスインター
フェース障害管理テーブル2のカウント値が増加してデ
ィスクの切り離しに至る。
ア障害管埋テーブル1、または、デバイスインターフェ
ース障害管理テーブル2の内容がしきい値を越えてして
いる場合のディスクの切り離しの可否は図4のフローチ
ャートに示されるしきい値を越えている場合には、まず
最初に現在のアレイディスクの状態をチェックする(ス
テップS401)。
クと1台の冗長ディスクによって構成されているものを
想定している。したがって、すでに1台のディスクが切
り離されている場合には冗長性を失っており、これ以上
のディスクの切り離しはできないため、すでに切り離し
済みのディスクが存在しないかどうかを調べる(ステッ
プS401)。
場合には、何もせずにディスク切り離しの可否の判断を
終了する。切り離し済みのディスクが存在せず冗長性を
維持できている時には、切り離し対象とされたディスク
以外のディスクに関するメディアの障害履歴をメディア
障害管埋テーブル1から読み出す。読み出すカウンタは
全てのゾーンを対象に読み出す(ステップS402)。
害履歴の有無を判断するために、読み出したカウンタ値
を調べる(ステップS403)。(00)以外のものが
存在する場合には切り離すことによって後に読み出せな
くなるデータが発生する可能性があるため切り離しを中
止する。
害履歴がない場合には、さらに切り離し対象のディスク
以外のディスクに対応するディスクインターフェースの
障害履歴をデバイスインターフェース障害管理テーブル
2から読み出す(ステップS404)。
応するディスクインターフェースに障害履歴を調ベ(ス
テップS403)、(00)以外のものが存在する場合
には切り離すことによって後に読み出せなくなるデータ
が発生する可能性があるため切り離しを中止する。他の
ディスクインターフェース制御部に障害履歴がない場合
には、切り離し対象のディスクを切り離す(ステップS
406)。
のアレイディスク制御装置10A,10Bから同一ディ
スク71〜74をアクセス可能な構成を採った場合につ
いて説明する。この場合もアレイディスク制御装置の動
作は前述の処理と全く同じである。
つのディレクタに交互に再試行を行うことにより、障害
の原因がアレイディスク制御装置10A内のディスクイ
ンターフェース制御部41A〜44Aにある場合にはア
レイディスク制御装置10B側から再試行をすることに
よって、入出力命令は成功し、ディスクを切り離すこと
なく処理を継続することができる。
場合には、2つのアレイディスク制御装置10A、10
B何れを通してもエラーが発生し、ホストコンピュータ
にエラーが報告される度にメディア障害管理テーブル1
の内容、または、デバイスインターフェース障害管埋テ
ーブル2の内容が増加して、ホストコンピュータが無条
件に再試行を繰り返すことによってディスクの切り離し
に至る。
効果を奏する。
制御部の数に相当するカウンタと各ディスクの記録領域
をメディアエラー管埋のために分割した数だけのカウン
タ用意すればよく、少ない制御情報で障害ディスクの切
り離し管理を行うことができる。
の障害のようにアレイディスク制御装置側に原因がある
場合と、ディスク側に原因がある場合との切り分けが容
易でない障害でも、的確に障害ディスクの切り離し制御
を行うことができる。
らなるアレイディスク装置ではホストコンピュータから
の再試行を各アレイディスク制御装置を通して交互に実
行することにより、アレイディスク制御装置側に原因が
ある場合と、ディスク側に原因がある場合とを的確に切
り分け、アレイディスク制御装置側に障害がある場合に
は正常なディスクを切り離すことなく処理を継続可能に
し、ディスク側に原因がある場合にはディスクを切り離
して処理の継続を可能にすることができる。
試行を前提にしているが、ホストコンピュータからの再
試行は単に再試行を行うアレイディスク制御装置を交互
に切り換えるだけでよく、ソフトウェアによる複雑なス
テータス解析等は必要ないため、アレイディスク装置を
使用するためのソフトウェアの負担も増えることはな
い。
する課題の項でも記載したように冗長性を持ったアレイ
ディスクでは、媒体の障害により書き込みができない場
合にはデータを格納するデータディスクとパリティデー
タを格納する冗長ディスクとの整合性をとるため、障害
ディスクを切り離して処理を行う必要があるが、読み出
しの場合には冗長ディスクでデータを復旧してホストコ
ンピュータに転送することが可能なため、より影響が大
きくなるディスク全体の切り離しは行わず一時的な切り
離しだけで処理を継続しようとすることがある。
しているが、再試行により救済することが可能な状況で
はディスクの切り離しは行われない場合がある。
るが、そのディスクの切り離しが行われていない場合で
も、ディスクの切り離しを行うための判断の際に、メデ
ィア障害管理テーブル、あるいはデバイスインターフェ
ース障害管埋テーブルをチェックし、他のディスクでの
障害の有無を容易に判断することができるため、安易な
ディスクの切り離しで後に読めないデータが生ずること
を避けることができる。
で、これによると、アレイ制御手段が、ディスクの障害
が発生したときにディスク障害管理テーブルの値を増加
させ、一方、ディスクに対して正常にデータの格納又は
読み出しが行われたときにはディスク障害管理テーブル
の値を減少させ、そして、ディスク障害管理テーブルの
ディスク障害値が予め定められたしきい値よりも上回っ
たときに当該インタフェースを切り離すため、回復不能
なメディアの障害の発生と、間欠的なリード/ライトエ
ラーの発生とを的確にディスク障害管理テーブルに反映
することができ、このため、軽度の障害で切り離す必要
がないときに切り離し処理を行うことがなく、さらに、
加算値と減算値及びしきい値を上位装置のリトライ回数
及びディスクの管理上の分割領域数に応じて設定するこ
とで、ディスクの一部に障害が発生したときであっても
良好にその状態をディスク障害管理テーブルに反映する
ことができ、さらに、デバイスインタフェースの状態を
重ねて管理することで、切り離し処理を必要な場合にの
み行うことができ、また、切り離し処理を行うときに、
ディスク障害管理テーブルを用いて他のディスクの状態
を確認して他のディスクにも障害がある場合には切り離
し処理を中止するため、冗長構成に基づいて復旧ができ
なくなる事態を良好に回避することができる。このよう
に、少ない障害履歴情報で、的確にディスクの切り離し
を行い、信頼性を向上させることができ、さらに、分割
領域としきい値及び加算、減算値の関係を設定すること
で、より的確にディスクの切り離し処理を行うことがで
きる、という従来にない優れたアレイディスク制御装置
を提供することができる。
すブロック図である。
クセス開始前の切り離し判断の処理を示すフローチャー
トである。
クセス後のエラー履歴管埋の処理を示すフローチャート
である。
スク切り離しの判断処理を示すフローチャートである。
たアレイディスクの1構成例を示すブロック図である。
ィスクの1構成例を示すブロック図である。
ーブル 3,3A,3B アレイ制御部 5,5A,5B マイクロプログラム処理部 6,6A,6B ホストインターフェース制御部 10,10A,10B アレイディスク制御装置 41,42,43,44 ディスクインターフェース制
御部 41A,42A,43A,44A ディスクインターフ
ェース制御部 41B,42B,43B,44B ディスクインターフ
ェース制御部 71,72,73,74 ディスク
Claims (4)
- 【請求項1】 上位装置から送信されたデータを受信す
るホストインタフェース制御部と、このホストインタフ
ェースで受信したデータを冗長構成にして複数のディス
クに格納するアレイ制御手段と、前記ディスクの障害に
応じて予め定められた値が格納されるディスク障害管理
テーブルとを備えたアレイディスク制御装置において、 前記アレイ制御手段が、前記ディスクの障害が発生した
ときに前記ディスク障害管理テーブルの値を増加させる
ディスク障害値加算機能と、当該ディスクに対して正常
にデータの格納又は読み出しが行われたときには前記デ
ィスク障害管理テーブルの値を減少させるディスク障害
値減算機能と、前記ディスク障害管理テーブルのディス
ク障害値が予め定められたしきい値よりも上回ったとき
に当該インタフェースを切り離すディスク切り離し機能
とを備えると共に、 前記アレイ制御手段が、前記複数のディスクをさらに複
数の領域に分割すると共に、前記ディスク障害管理テー
ブルが、当該分割領域ごとに障害の履歴を管理するテー
ブル項目を有し、 前記ディスク障害値加算機能が、ディスクの障害が発生
したときに一定値aを加算する機能を備え、 前記ディスク障害管理テーブルのしきい値を、前記一定
値aのn倍に設定すると共に、このnの値を、前記上位
装置が同一データを自動的にリトライする回数に設定
し、 前記ディスク障害値減算機能が、前記ディスクの分割領
域数に応じて一定値aよりも小さい値を減算する機能を
備えたことを特徴とするアレイディスク制御装置。 - 【請求項2】 前記ディスク障害管理テーブルに、デバ
イスインターフェースの障害に応じて予め定められた値
が格納されるデバイスインタフェース障害管理テーブル
を併設し、 前記アレイ制御手段が、前記デバイスインターフェース
の障害が発生したときに前記デバイスインタフェース障
害管理テーブルの値を増加させるインタフェース障害値
加算機能と、当該デバイスインタフェースを介して正常
にデータの格納又は読み出しが行われたときに前記デバ
イスインタフェース障害管理テーブルの値を減少させる
インタフェース障害値減算機能と、前記デバイスインタ
フェース障害管理テーブルのインタフェース障害値が予
め定められたしきい値よりも上回ったときに当該インタ
フェースを切り離すデバイスインタフェース切り離し機
能とを備えたことを特徴とする請求項1記載のアレイデ
ィスク制御装置。 - 【請求項3】 上位装置から送信されたデータを受信す
るホストインタフェース制御部と、このホストインタフ
ェース制御部で受信したデータを冗長構成にすると共に
デバイスインタフェースを介して複数のディスクに格納
するアレイ制御手段とを備えたアレイディスク制御装置
において、 前記アレイ制御手段に、前記デバイスインターフェース
の障害に応じて予め定められた値が格納されるデバイス
インタフェース障害管理テーブルを併設し、 前記アレイ制御手段が、前記デバイスインターフェース
の障害が発生したときに前記デバイスインタフェース障
害管理テーブルの値を増加させるインタフェース障害値
加算機能と、当該デバイスインタフェースを介して正常
にデータの格納又は読み出しが行われたときに前記デバ
イスインタフェース障害管理テーブルの値を減少させる
インタフェース障害値減算機能と、前記デバイスインタ
フェース障害管理テーブルのインタフェース障害値が予
め定められたしきい値よりも上回ったときに当該インタ
フェースを切り離すデバイスインタフェース切り離し機
能とを備えたことを特徴とするアレイディスク制御装
置。 - 【請求項4】 上位装置から送信されたデータを受信す
るホストインタフェース制御部と、このホストインタフ
ェース制御部で受信したデータを記憶する複数のディス
クにそれぞれ接続されデバイスインタフェースを介して
前記複数のディスクに格納する複数のアレイ制御手段と
を備えたアレイディスク制御装置において、 前記アレイ制御手段に、前記デバイスインターフェース
の障害に応じて予め定められた値が格納されるデバイス
インタフェース障害管理テーブルを併設し、 前記アレイ制御手段がそれぞれ、前記デバイスインター
フェースの障害が発生したときには前記デバイスインタ
フェース障害管理テーブルの値を増加させるテーブル値
加算機能と、当該デバイスインタフェースを介して正常
にデータの格納又は読み出しが行われたときには前記デ
バイスインタフェース障害管理テーブルの値を減少させ
るテーブル値減算機能と、前記デバイスインタフェース
障害管理テーブルの値が予め定められたしきい値よりも
上回ったときに当該インタフェースを切り離すデバイス
インタフェース切り離し機能とを備えると共に、 このデバイスインタフェース切り離し機能に、当該デバ
イスインタフェース切り離し機能によってデバイスイン
タフェースが切り離された場合には前記上位装置からの
再試行を前記複数のアレイ制御手段を順次選択して行う
制御をする再試行制御機能を併設したことを特徴とした
アレイディスク制御装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9080998A JP3063666B2 (ja) | 1997-03-31 | 1997-03-31 | アレイディスク制御装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9080998A JP3063666B2 (ja) | 1997-03-31 | 1997-03-31 | アレイディスク制御装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH10275060A JPH10275060A (ja) | 1998-10-13 |
JP3063666B2 true JP3063666B2 (ja) | 2000-07-12 |
Family
ID=13734164
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP9080998A Expired - Fee Related JP3063666B2 (ja) | 1997-03-31 | 1997-03-31 | アレイディスク制御装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3063666B2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6985979B2 (en) * | 2001-12-17 | 2006-01-10 | Matsushita Electric Industrial Co., Ltd. | Digital data processing device, bus controlling method, bus controlling program and recording medium |
JP4547170B2 (ja) * | 2004-03-08 | 2010-09-22 | 株式会社日立製作所 | ディスクアレイ装置およびその制御方法 |
JP2006079418A (ja) | 2004-09-10 | 2006-03-23 | Fujitsu Ltd | 記憶制御装置、制御方法及びプログラム |
JP4678384B2 (ja) * | 2007-03-30 | 2011-04-27 | 日本電気株式会社 | リンク障害診断方法、ディスクアレイ・システム、及びリンク障害診断プログラム |
JP4542163B2 (ja) | 2008-02-27 | 2010-09-08 | 富士通株式会社 | ディスクアレイ装置、ディスクアレイ制御方法及びディスクアレイ制御装置 |
WO2010116514A1 (ja) * | 2009-04-09 | 2010-10-14 | 富士通株式会社 | Raid制御装置 |
US8533539B2 (en) * | 2010-09-17 | 2013-09-10 | Symantec Corporation | Fault handling systems and methods |
JP2015222454A (ja) * | 2012-09-18 | 2015-12-10 | 三菱電機株式会社 | Raid障害自己修復装置 |
-
1997
- 1997-03-31 JP JP9080998A patent/JP3063666B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH10275060A (ja) | 1998-10-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3184171B2 (ja) | ディスクアレイ装置、そのエラー制御方法、ならびにその制御プログラムを記録した記録媒体 | |
US7526684B2 (en) | Deterministic preventive recovery from a predicted failure in a distributed storage system | |
US7587631B2 (en) | RAID controller, RAID system and control method for RAID controller | |
JP2002108573A (ja) | ディスクアレイ装置、そのエラー制御方法、ならびにその制御プログラムを記録した記録媒体 | |
JPH11345095A (ja) | ディスクアレイ装置およびその制御方法 | |
JP2005322399A (ja) | 磁気ディスク記憶装置におけるトラック・データ完全性の維持方法 | |
JP3681766B2 (ja) | ディスクアレイ装置 | |
JP2006079418A (ja) | 記憶制御装置、制御方法及びプログラム | |
US20060277354A1 (en) | Library apparatus | |
WO2017097233A1 (zh) | 一种数据存储负载的容错方法及iptv*** | |
JP3063666B2 (ja) | アレイディスク制御装置 | |
US7191365B2 (en) | Information recorder and its control method | |
JPH09269871A (ja) | ディスクアレイ装置におけるデータ再冗長化方式 | |
US20070234107A1 (en) | Dynamic storage data protection | |
CN108170375B (zh) | 一种分布式存储***中的超限保护方法和装置 | |
US20060155718A1 (en) | Multiple copy track stage recovery in a data storage system | |
JP4012420B2 (ja) | 磁気ディスク装置及びディスク制御装置 | |
JP2006268502A (ja) | アレイコントローラ、メディアエラー修復方法及びプログラム | |
JPH1195933A (ja) | ディスクアレイ装置 | |
JP2006079219A (ja) | ディスクアレイ制御装置およびディスクアレイ制御方法 | |
WO2010011217A1 (en) | Data storage method, apparatus and system for interrupted write recovery | |
CN111601062A (zh) | 用于车载监控录像的存储安全容错方法及*** | |
JP2008084168A (ja) | 情報処理装置及びデータ修復方法 | |
JP2005149248A (ja) | メタデータ修復方式,方法および記憶装置ならびにプログラム | |
JP2003186627A (ja) | 磁気テープ装置データパックアップ制御方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20000404 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090512 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100512 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110512 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110512 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120512 Year of fee payment: 12 |
|
LAPS | Cancellation because of no payment of annual fees |