JP2006185312A

JP2006185312A - 障害解析装置及び障害解析方法

Info

Publication number: JP2006185312A
Application number: JP2004380071A
Authority: JP
Inventors: Tetsuya Teramachi; 哲也寺町
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2004-12-28
Filing date: 2004-12-28
Publication date: 2006-07-13

Abstract

【課題】正確に自動で、アクセスルートの障害箇所を特定し、障害の無いアクセスルートに切り替える。
【解決手段】障害が検出された場合、通常アクセスを実行したアクセスルート上の全ての構成要素が、障害箇所候補とされる。障害箇所候補へテスト用アクセスが実行される。障害特定手段１１ｃにより、１以上のアクセスルートでテスト用アクセスが実行された結果、最後の１つとなった障害箇所候補の構成要素が障害箇所とされる。アクセスルート切替手段１１ｄにより、障害箇所として特定された構成要素を経由しないアクセスルートに切り替えられる。
【選択図】図１

Description

本発明は、コンピュータシステムの障害解析装置及び障害解析方法に関し、特に、冗長化されたアクセスルートと複数の装置とを含むコンピュータシステムの障害解析装置及び障害解析方法に関する。

コンピュータシステムは、データを記憶装置に記憶したり、データを記憶装置から抽出したりしている。このため、記憶装置はコンピュータシステムにとって不可欠な存在である。

しかも、コンピュータシステムにおいて、利用するデータは年々増加するので、大容量の記憶装置が必要である。現在、低価格の大容量の記憶装置が出現しており、入手しやすくなっている。

また、コンピュータシステムでは、終日運転に対応するために、複数の記憶装置を論理的に１台の記憶装置として使用している（ディスクアレイ）。このディスクアレイを採用したコンピュータシステムは、コンピュータシステムの中に予備の記憶装置を準備している。そして、自動的に、予備の記憶装置に運用している記憶装置のデータを通常時に転送している。このようにすると、コンピュータシステムの中の１つの記憶装置において、使用不可能となるような障害が発生した場合に対応できるようになる。

ディスクアレイを使用し、かつ、複数のアクセスルートを持つコンピュータシステムも現れている。ここで、アクセスルートの障害については、オペレータが障害箇所を特定しているか、自動で大まかな障害箇所を特定している。なぜなら、コンピュータシステムはマルチベンダが一般的であり、大まかなインタフェースが統一されているだけだからである。そして、障害箇所を使用しないで済むように、使用するアクセスルートを手動か自動で変更している（例えば、特許文献１参照）。
特開平９−２５９００１号公報

しかし、手動で使用するアクセスルートを変更する場合は、オペレータが接続ミスを発生させやすい。
また、自動で使用するアクセスルートを変更する場合、障害箇所が存在することしか分かっていないので、後述するように機能的に何の問題も無い活性箇所を停止させることがあり、コンピュータシステムの運用効率を低下させている。例えば、中継器が存在するネットワークの場合、障害箇所の特定が困難であり、関係する構成要素を全て交換する等の悪い運用効率になっている。しかも、活性箇所を停止させてしまうと、復旧に時間がかかる。具体的には、図３０を参照して説明する。

図３０は、従来のシステム構成図における障害への対応の例を示す図である。
従来のシステム構成図は、第１のコンピュータ１１０と第２のコンピュータ２１０と中継器３１０、４１０と記憶装置５３０と伝送路Ｌ３１、Ｌ３２、Ｌ３３、Ｌ３４、Ｌ３５、Ｌ３６、Ｌ３７、Ｌ３８とから構成される。第１のコンピュータ１１０と第２のコンピュータ２１０とは、ユーザの端末装置であり、ユーザのサービス要求に応答するか、ユーザのサービス要求をサーバに送信する。中継器３１０、４１０は、第１のコンピュータ１１０と第２のコンピュータ２１０と記憶装置５３０とを互いに接続する。記憶装置５３０は、第１のコンピュータ１１０と第２のコンピュータ２１０とから、データを記憶させられる。第１のコンピュータ１１０と第２のコンピュータ２１０と中継器３１０、４１０と記憶装置５３０とは、伝送路Ｌ３１、Ｌ３２、Ｌ３３、Ｌ３４、Ｌ３５、Ｌ３６、Ｌ３７、Ｌ３８を介して、互いに通信している。

第１のコンピュータ１１０は、アダプタ１１１、１１２とから構成される。アダプタ１１１、１１２は、第１のコンピュータ１１０をネットワークに接続する。アダプタ１１１、１１２とは、互いに通信している。

第２のコンピュータ２１０は、アダプタ２１１、２１２とから構成される。第１のコンピュータ１１０と第２のコンピュータ２１０との関係において、同じ名称の構成要素ならば、構成要素の機能も同じである。

記憶装置５３０は、コントローラ５３１、５３２と記憶装置本体５３３とから構成される。コントローラ５３１、５３２は、記憶装置５３０をネットワークに接続する。記憶装置本体５３３は、記憶装置５３０の本体である。コントローラ５３１、５３２と記憶装置本体５３３とは、互いに通信している。

従来では、第１のコンピュータ１１０と第２のコンピュータ２１０との環境を統一するために、第１のコンピュータ１１０におけるアダプタ１１１と伝送路Ｌ３１と中継器３１０と伝送路Ｌ３５とコントローラ５３１とのアクセスルートに障害が検出されると、第２のコンピュータ２１０におけるアダプタ２１１と伝送路Ｌ３３と中継器３１０と伝送路Ｌ３５とコントローラ５３１とのアクセスルートも使用しないようにしている。

ここで、障害箇所がアダプタ１１１の場合、第２のコンピュータ２１０での冗長性が失われ、信頼性が低下する。
本発明は、このような点に鑑みてなされたものであり、利用しているアクセスルートに関して、自動で、アクセスルートの障害箇所を正確に特定し、障害の無いアクセスルートに切り替える障害解析装置及び障害解析方法を提供することを目的とする。

本発明では、上記課題を解決するために、図１に示すように、複数の装置間の通常アクセスにおいて障害を検出すると、通常アクセスを実行したアクセスルート上の全ての構成要素を障害箇所候補とする障害検出手段１１ａと、障害検出手段１１ａで障害が検出されると、障害箇所候補へテスト用アクセスを実行し、テスト用アクセスで障害を検出しなかった場合、テスト用アクセスを実行したアクセスルート上の全ての構成要素を障害箇所候補から除外し、テスト用アクセスで障害を検出した場合、テスト用アクセスを実行したアクセスルート上に配置されていない全ての構成要素を障害箇所候補から除外する障害診断手段１１ｂと、障害診断手段１１ｂにおいて、１以上のアクセスルートでテスト用アクセスが実行された結果、最後の１つとなった障害箇所候補の構成要素を障害箇所とする障害特定手段１１ｃと、複数の装置間の通常アクセス用のアクセスルートを、障害特定手段１１ｃで障害箇所として特定された構成要素を経由しないアクセスルートに切り替えるアクセスルート切替手段１１ｄとを提供する。

このようにすると、複数の装置間の通常アクセスにおいて障害が検出された場合、障害検出手段１１ａにより、通常アクセスを実行したアクセスルート上の全ての構成要素が、障害箇所候補とされる。障害検出手段１１ａで障害が検出されると、障害箇所候補へテスト用アクセスが実行される。障害診断手段１１ｂにより、テスト用アクセスで障害が検出されなかった場合、テスト用アクセスを実行したアクセスルート上の全ての構成要素が、障害箇所候補から除外される。障害診断手段１１ｂにより、テスト用アクセスで障害が検出された場合、テスト用アクセスを実行したアクセスルート上に配置されていない全ての構成要素が、障害箇所候補から除外される。障害特定手段１１ｃにより、障害診断手段１１ｂにおいて１以上のアクセスルートでテスト用アクセスが実行された結果、最後の１つとなった障害箇所候補の構成要素が、障害箇所とされる。アクセスルート切替手段１１ｄにより、複数の装置間の通常アクセス用のアクセスルートが、障害特定手段１１ｃで障害箇所として特定された構成要素を経由しないアクセスルートに切り替えられる。

本発明では、通常アクセスにおいて障害を検出すると、テスト用アクセスを繰り返すようにした。そして、障害箇所を特定し、障害箇所として特定された構成要素を経由しないアクセスルートに切り替えるようにした。

これにより、障害箇所を正確に特定することができ、障害箇所を容易に交換できるようになる。

以下、本発明の実施の形態を図面を参照して説明する。
まず、本発明の概念について説明し、その後、実施の形態の具体的な内容を説明する。
図１は、本発明の概念図である。

本発明の障害解析装置が使用される障害解析システムは、コンピュータ１０と中継器２０、３０と装置４０と伝送路Ｌ１、Ｌ２、Ｌ３、Ｌ４、Ｌ５、Ｌ６、Ｌ７、Ｌ８とから構成される。コンピュータ１０は、ユーザの端末装置であり、ユーザのサービス要求に応答するか、ユーザのサービス要求をサーバに送信する。中継器２０、３０は、コンピュータ１０と装置４０とを互いに接続する。装置４０は、コンピュータ１０から、データを記憶させられる。コンピュータ１０と中継器２０、３０と装置４０とは、伝送路Ｌ１、Ｌ２、Ｌ３、Ｌ４、Ｌ５、Ｌ６、Ｌ７、Ｌ８を介して、互いに通信している。

コンピュータ１０は、障害解析装置１１とアダプタ１２、１３とから構成される。障害解析装置１１は、利用しているアクセスルートに関して、アクセスルートの障害箇所を特定し、障害の無いアクセスルートに切り替える。アダプタ１２、１３は、コンピュータ１０をネットワークに接続する。障害解析装置１１とアダプタ１２、１３とは、互いに通信している。

装置４０は、コントローラ４１、４２と装置本体４３とから構成される。コントローラ４１、４２は、装置４０をネットワークに接続する。装置本体４３は、装置４０の本体である。コントローラ４１、４２と装置本体４３とは、互いに通信している。

障害解析装置１１は、障害検出手段１１ａと障害診断手段１１ｂと障害特定手段１１ｃとアクセスルート切替手段１１ｄとから構成される。
障害検出手段１１ａは、複数の装置間の通常アクセスにおいて障害を検出すると、通常アクセスを実行したアクセスルート上の全ての構成要素を障害箇所候補とする。

障害診断手段１１ｂは、障害検出手段１１ａで障害が検出されると、障害箇所候補へテスト用アクセスを実行し、テスト用アクセスで障害を検出しなかった場合、テスト用アクセスを実行したアクセスルート上の全ての構成要素を障害箇所候補から除外する。さらに障害診断手段１１ｂは、テスト用アクセスで障害を検出した場合、テスト用アクセスを実行したアクセスルート上に配置されていない全ての構成要素を障害箇所候補から除外する。

障害特定手段１１ｃは、障害診断手段１１ｂにおいて、１以上のアクセスルートでテスト用アクセスが実行された結果、最後の１つとなった障害箇所候補の構成要素を障害箇所とする。

アクセスルート切替手段１１ｄは、複数の装置間の通常アクセス用のアクセスルートを、障害特定手段１１ｃで障害箇所として特定された構成要素を経由しないアクセスルートに切り替える。

障害検出手段１１ａと障害診断手段１１ｂと障害特定手段１１ｃとアクセスルート切替手段１１ｄとは、互いに通信している。
例えば、コンピュータ１０と装置４０との通信が、伝送路Ｌ１、Ｌ５を利用して実現されている。そして、伝送路Ｌ１、Ｌ５にエラーが発生すると、伝送路Ｌ３、Ｌ５に切り替えて、エラーが無い場合、伝送路Ｌ１もしくはアダプタ１２が故障箇所である。さらに、伝送路Ｌ２、Ｌ７に切り替えて、エラーが無い場合、伝送路Ｌ１が故障箇所である。その後、伝送路Ｌ１、Ｌ５を、エラーの無い伝送路Ｌ２、Ｌ７に切り替える。

このようにすると、障害を発生させた構成要素を正確に自動で把握でき、容易に交換できる。
以下、実施の形態の具体的な内容を説明する。

［第１の実施の形態］
図２は、第１の実施の形態のシステム構成図である。第１のコンピュータ１００と第２のコンピュータ２００とは、利用しているアクセスルートに関して、アクセスルートの障害箇所を特定し、障害の無いアクセスルートに切り替える。

第１の実施の形態のシステム構成図は、第１のコンピュータ１００と第２のコンピュータ２００と中継器３００、４００と記憶装置５００と伝送路Ｌ１１、Ｌ１２、Ｌ１３、Ｌ１４、Ｌ１５、Ｌ１６、Ｌ１７、Ｌ１８とから構成される。第１のコンピュータ１００と第２のコンピュータ２００とは、データを記憶装置５００に書き込んだり、データを記憶装置５００から引き出したりする。中継器３００、４００は、第１のコンピュータ１００と第２のコンピュータ２００と記憶装置５００とを互いに接続する。記憶装置５００は、第１のコンピュータ１００と第２のコンピュータ２００とから送られるデータを記憶する。第１のコンピュータ１００と第２のコンピュータ２００と中継器３００、４００と記憶装置５００とは、伝送路Ｌ１１、Ｌ１２、Ｌ１３、Ｌ１４、Ｌ１５、Ｌ１６、Ｌ１７、Ｌ１８を介して、互いに通信している。

第１のコンピュータ１００は、障害特定部１０３とアクセスルート切替部１０４とアダプタ１０１、１０２とから構成される。
障害特定部１０３は、記憶装置５００への通常アクセスにおいて、障害を検出した場合、通常アクセスを実行したアクセスルート上の全ての構成要素を障害箇所候補とする。そして、障害箇所候補へテスト用アクセスを実行する。テスト用アクセスで障害を検出しなかった場合、テスト用アクセスを実行したアクセスルート上の全ての構成要素を、障害箇所候補から除外する。テスト用アクセスで障害を検出した場合、テスト用アクセスを実行したアクセスルート上に配置されていない全ての構成要素を、障害箇所候補から除外する。最後に、１以上のアクセスルートでテスト用アクセスを実行した結果として、最後の１つとなった障害箇所候補の構成要素を障害箇所とする。

アクセスルート切替部１０４は、記憶装置５００への通常アクセスが実行されて障害が検出されたアクセスルートを、障害箇所として特定された構成要素を経由しないアクセスルートに切り替える。

アダプタ１０１、１０２は、第１のコンピュータ１００をネットワークに接続する。
障害特定部１０３とアクセスルート切替部１０４とアダプタ１０１、１０２とは、互いに通信している。

第２のコンピュータ２００は、障害特定部２０３とアクセスルート切替部２０４とアダプタ２０１、２０２とから構成される。第１のコンピュータ１００と第２のコンピュータ２００との関係において、同じ名称の構成要素ならば、構成要素の機能も同じである。

記憶装置５００は、コントローラ５０１、５０２と記憶装置本体５０３とから構成される。コントローラ５０１、５０２は、記憶装置５００をネットワークに接続する。記憶装置本体５０３は、記憶装置５００の本体である。コントローラ５０１、５０２と記憶装置本体５０３とは、互いに通信している。

また、第１のコンピュータ１００の障害特定部１０３と第２のコンピュータ２００の障害特定部２０３とは、互いに通信し、連帯して動作する。
図３は、障害特定部の例を示す図である。障害特定部１０３は、全てのアクセスルート上において各構成要素に対する障害確認部を複数有している。障害特定部１０３は、デーモンを利用して各構成要素を監視している。デーモンから各構成要素に命令が出て、障害特定部１０３は、各構成要素からの応答を取得する。

障害特定部１０３は、各構成要素に対する障害確認部として、記憶装置本体に対する障害確認部１０３ａ、アダプタに対する障害確認部１０３ｂ、コントローラ（自経路）に対する障害確認部１０３ｃ、コントローラ（他経路）に対する障害確認部１０３ｄ、中継器及び中継器前伝送路に対する障害確認部１０３ｅ及び中継器及び中継器後伝送路に対する障害確認部１０３ｆから構成される。記憶装置本体に対する障害確認部１０３ａ、アダプタに対する障害確認部１０３ｂ、コントローラ（自経路）に対する障害確認部１０３ｃ、コントローラ（他経路）に対する障害確認部１０３ｄ、中継器及び中継器前伝送路に対する障害確認部１０３ｅ及び中継器及び中継器後伝送路に対する障害確認部１０３ｆは、互いに通信している。

以下に、各構成要素に対する障害確認部について説明する。
図４は、記憶装置本体に対する障害確認部の処理の例を示す図である。
記憶装置本体に対する障害確認部１０３ａが、図４に太字で示されるアクセスルートを確認すると、正常なら、記憶装置本体５０３へのアクセスルートは正常である。異常なら、記憶装置本体５０３へのアクセスルートは異常であり、アダプタ１０１と伝送路Ｌ１１と中継器３００と伝送路Ｌ１５とコントローラ５０１と記憶装置本体５０３との中で、何れかが異常である。

なお、原則的に、記憶装置本体５０３の自らの障害を管理する機能により、記憶装置本体５０３そのものが異常な場合は、明確に異常であることを外部に通知する。つまり、記憶装置本体５０３へのアクセスルートが異常な場合と記憶装置本体５０３そのものが異常な場合とが存在するが、後者については明確になる。

図５は、アダプタに対する障害確認部の処理の例を示す図である。ここで、通常アクセスを実行したアクセスルートの一部を経由したテスト用アクセスを実行する。
アダプタに対する障害確認部１０３ｂが、図５に太字で示されるアクセスルートを確認すると、正常なら、アダプタ１０１へのアクセスルートは正常である。異常なら、アダプタ１０１へのアクセスルートは異常であり、アダプタ１０１は異常である。

図６は、コントローラ（自経路）に対する障害確認部の処理の例を示す図である。ここで、通常アクセスを実行したアクセスルートの一部を経由したテスト用アクセスを実行する。

コントローラ（自経路）に対する障害確認部１０３ｃが、図６に太字で示されるアクセスルートを確認すると、正常なら、コントローラ５０１へのアクセスルートは正常である。異常なら、コントローラ５０１へのアクセスルートは異常であり、アダプタ１０１と伝送路Ｌ１１と中継器３００と伝送路Ｌ１５とコントローラ５０１との中で、何れかが異常である。

図７は、コントローラ（他経路）に対する障害確認部の処理の例を示す図である。ここで、通常アクセスを実行したアクセスルートと異なるアクセスルートを経由したテスト用アクセスを実行する。

コントローラ（他経路）に対する障害確認部１０３ｄが、図７に太字で示されるアクセスルートを確認すると、正常なら、コントローラ５０１へのアクセスルートは正常である。異常なら、コントローラ５０１へのアクセスルートは異常である。

ここで、自経路と他経路との両方が異常な場合、コントローラ５０１は異常である。
なお、コントローラ（他経路）に対する障害確認部１０３ｄは、記憶装置５００の内部の処理を伴う。この場合において、例えば、UNIX（登録商標）のUSCSIコマンドのSEND DIAGNOSTIC/RECEIVE DIAGNOSTICを利用して、コントローラ５０１とコントローラ５０２との間を互いに通信している。

図８は、中継器及び中継器前伝送路に対する障害確認部の処理の例を示す図である。ここで、通常アクセスを実行したアクセスルートの一部を経由したテスト用アクセスを実行する。そして、通常アクセスを実行したアクセスルートと異なるアクセスルートを経由したテスト用アクセスを実行する。

中継器及び中継器前伝送路に対する障害確認部１０３ｅが、図８に太字で示される２つのアクセスルートを確認すると、左側が正常なら、コントローラ５０１への左側のアクセスルートは正常である。左側が異常なら、コントローラ５０１への左側のアクセスルートは異常である。右側が正常なら、コントローラ５０１への右側のアクセスルートは正常である。右側が異常なら、コントローラ５０１への右側のアクセスルートは異常である。

ここで、左側が正常で右側が異常なら、アダプタ２０１と伝送路Ｌ１３との中で、何れかが異常である。右側が正常で左側が異常なら、アダプタ１０１と伝送路Ｌ１１との中で、何れかが異常である。

図９は、中継器及び中継器後伝送路に対する障害確認部の処理の例を示す図である。ここで、通常アクセスを実行したアクセスルートの一部を経由したテスト用アクセスを実行する。そして、通常アクセスを実行したアクセスルートと異なるアクセスルートを経由したテスト用アクセスを実行する。

中継器及び中継器後伝送路に対する障害確認部１０３ｆが、図９に太字で示される２つのアクセスルートを確認すると、左側が正常なら、コントローラ５０１への左側のアクセスルートは正常である。左側が異常なら、コントローラ５０１への左側のアクセスルートは異常である。右側が正常なら、コントローラ５０２への右側のアクセスルートは正常である。右側が異常なら、コントローラ５０２への右側のアクセスルートは異常である。

ここで、左側が正常で右側が異常なら、伝送路Ｌ１６とコントローラ５０２との中で、何れかが異常である。右側が正常で左側が異常なら、伝送路Ｌ１５とコントローラ５０１との中で、何れかが異常である。

以上において、例えば、コントローラ（他経路）に対する障害確認部１０３ｄ以外の他の障害確認部は、UNIXのUSCSIコマンドのTEST UNIT READYを利用している。
以下に、上述した各障害確認部を利用して、障害箇所の特定の処理を説明する。

図１０は、第１の実施の形態の処理の例を示すフローチャートの前半である。
［Ｓ１１］障害特定部１０３が、初期設定として既に記憶しているアクセスルート情報を取得する。なお、アクセスルート情報は、設定ファイルに指定できる。ここで、アクセスルート情報とは、スタートポイントからエンドポイントまでのアクセスルートに、何が存在するかの情報である。

［Ｓ１２］障害特定部１０３が、初期設定として既に記憶している各構成要素に対する障害確認部を取得する。なお、実行する順番に、各構成要素に対する障害確認部を後述する設定ファイルに記載できる。

［Ｓ１３］障害特定部１０３の中の記憶装置本体に対する障害確認部１０３ａが、記憶装置本体５０３までの障害の有無を判断する。障害が存在する場合、他の構成要素を確認するため、Ｓ１５へ進む。障害が存在しない場合、次のアクセスルートを確認するため、Ｓ１１へ進む。

［Ｓ１５］記憶装置本体５０３自体の障害の場合、障害特定部１０３が、アクセスルート切替部１０４に、障害の存在を通知する。
［Ｓ１６］障害特定部１０３の中のアダプタに対する障害確認部１０３ｂが、アダプタ１０１までの障害の有無を判断する。障害が存在する場合、アダプタ１０１の障害が発見されたため、Ｓ１７へ進む。障害が存在しない場合、他の構成要素を確認するため、Ｓ１８へ進む。

［Ｓ１７］障害特定部１０３が、アダプタ１０１の障害を確認する。そして、次のアクセスルートを確認するため、Ｓ１１へ進む。
［Ｓ１８］障害特定部１０３の中の自経路でのコントローラに対する障害確認部１０３ｃが、コントローラ５０１までの障害の有無を判断する。障害が存在する場合、他の構成要素を確認するため、Ｓ２０へ進む。障害が存在しない場合、記憶装置本体５０３の障害が発見されたため、Ｓ１９へ進む。

［Ｓ１９］障害特定部１０３が、記憶装置本体５０３の障害を確認する。そして、次のアクセスルートを確認するため、Ｓ１１へ進む。
［Ｓ２０］障害特定部１０３が、伝送路Ｌ１１、Ｌ１５と中継器３００とコントローラ５０１との中の何れかの障害を確認する。そして、図１１のＡへ進む。

図１１は、第１の実施の形態の処理の例を示すフローチャートの後半である。
［Ｓ２１］図１０のＡから、障害特定部１０３の中の他経路でのコントローラに対する障害確認部１０３ｄが、コントローラ５０１までの障害の有無を判断する。障害が存在する場合、コントローラ５０１の障害が発見されたため、Ｓ２２へ進む。障害が存在しない場合、他の構成要素を確認するため、Ｓ２３へ進む。

［Ｓ２２］障害特定部１０３が、コントローラ５０１の障害を確認する。そして、次のアクセスルートを確認するため、図１０のＢを介してＳ１１へ進む。
［Ｓ２３］障害特定部１０３が、伝送路Ｌ１１、Ｌ１５と中継器３００との中の何れかの障害を確認する。

［Ｓ２４］障害特定部１０３の中の中継器及び中継器前伝送路に対する障害確認部１０３ｅが、伝送路Ｌ１３までの障害の有無を判断する。障害が存在する場合、他の構成要素を確認するため、Ｓ２６へ進む。障害が存在しない場合、伝送路Ｌ１１の障害が発見されたため、Ｓ２５へ進む。

［Ｓ２５］障害特定部１０３が、伝送路Ｌ１１の障害を確認する。そして、次のアクセスルートを確認するため、図１０のＢを介してＳ１１へ進む。
［Ｓ２６］障害特定部１０３が、伝送路Ｌ１５と中継器３００との中の何れかの障害を確認する。

［Ｓ２７］障害特定部１０３の中の中継器及び中継器後伝送路に対する障害確認部１０３ｆが、伝送路Ｌ１６までの障害の有無を判断する。障害が存在する場合、中継器３００の障害が発見されたため、Ｓ２８へ進む。障害が存在しない場合、伝送路Ｌ１５の障害が発見されたため、Ｓ２９へ進む。

［Ｓ２８］障害特定部１０３が、中継器３００の障害を確認する。そして、次のアクセスルートを確認するため、図１０のＢを介してＳ１１へ進む。
［Ｓ２９］障害特定部１０３が、伝送路Ｌ１５の障害を確認する。そして、次のアクセスルートを確認するため、図１０のＢを介してＳ１１へ進む。

このようにすると、障害箇所の特定を自動で正確に実行できる。これによって、コンピュータシステムの保守者による障害箇所の特定ミスを未然に防止できる。そして、保守に対する大幅な効率化を図ることができる。

以下に、障害箇所を含むアクセスルートを障害箇所を含まないアクセスルートへ変更する場合について説明する。
図１２は、通信テーブルの例を示す図である。

通信テーブル６０は、名称と使用伝送路と通信状況とから構成される。名称は、アクセスルートの名称である。使用伝送路は、名称に関係するアクセスルートが使用する伝送路である。通信状況は、名称に関係するアクセスルートの状況である。なお、通信状況は、アクセスルートが運用されている場合運用用となり、アクセスルートが待機している場合待機用となり、アクセスルートがアクセスルートを診断する目的の場合診断用となる。

ここで、運用用と診断用と待機用との図１２の記載は、第１の実施の形態の初期値である。通信１は、伝送路Ｌ１１、Ｌ１５を使用し、運用用である。通信２は、伝送路Ｌ１１、Ｌ１６を使用し、診断用である。通信３は、伝送路Ｌ１２、Ｌ１７を使用し、診断用である。通信４は、伝送路Ｌ１２、Ｌ１８を使用し、待機用である。通信５は、伝送路Ｌ１３、Ｌ１５を使用し、運用用である。通信６は、伝送路Ｌ１３、Ｌ１６を使用し、診断用である。通信７は、伝送路Ｌ１４、Ｌ１７を使用し、診断用である。通信８は、伝送路Ｌ１４、Ｌ１８を使用し、待機用である。

アクセスルート切替部１０４、２０４は、第１のコンピュータ１００と第２のコンピュータ２００と記憶装置５００とが接続された場合、通信テーブル６０を作成する。記憶装置５００に対し入出力が始まると、障害特定部１０３、２０３の障害情報により、障害箇所交換時に障害箇所が存在するアクセスルートにコンピュータがアクセスしないように、障害箇所が存在するアクセスルートを障害箇所が存在しないアクセスルートに切り替える。

図１３は、アクセスルート情報の例を示す図である。
アクセスルート情報８０は、第１のコンピュータ表現部８１と第２のコンピュータ表現部８２とから表現される。第１のコンピュータ表現部８１は、第１のコンピュータ１００に関係するアクセスルートを表現する。第２のコンピュータ表現部８２は、第２のコンピュータ２００に関係するアクセスルートを表現する。

さらに、存在するアクセスルート情報８０は、アダプタ表現部８３と中継器表現部８４とコントローラ表現部８５とから表現される。アダプタ表現部８３は、アクセスルートが利用しているアダプタを表現する。中継器表現部８４は、アクセスルートが利用している中継器を表現する。コントローラ表現部８５は、アクセスルートが利用しているコントローラを表現する。

これらのアクセスルート情報８０は、ＯＳ(Operating System)内で定義されている。
なお、障害情報は、図１３の情報を利用する。
図１４は、アクセスルート選択情報の例を示す図である。もともと複数存在するアクセスルートを１つの仮想デバイスとして見せている。

アクセスルート選択情報９０は、仮想デバイス名９１と仮想デバイス番号９２と第１の名称９３と第２の名称９４とユーザ用名称９５と第１の予備の名称９６と第２の予備の名称９７とから表現される。

仮想デバイス名９１は、仮想デバイスの名称である。仮想デバイス番号９２は、仮想デバイス名９１に関係する仮想デバイスの番号である。第１の名称９３は、仮想デバイス名９１に関係する仮想デバイスにされるアクセスルートの名称である。第２の名称９４は、仮想デバイス名９１に関係する仮想デバイスにされるアクセスルートの名称である。なお、通常は第１の名称９３に関係するアクセスルートが仮想デバイスになる。ユーザ用名称９５は、仮想デバイスにされるアクセスルートのユーザ用の名称である。第１の予備の名称９６は、仮想デバイスを利用しない場合において、第１の名称９３に関係するアクセスルートのユーザ用の名称である。第２の予備の名称９７は、仮想デバイスを利用しない場合において、第２の名称９４に関係するアクセスルートのユーザ用の名称である。

図１５は、障害情報の表現の例を示す図である。
障害情報６００は、障害名称６０１と障害説明開始部６０２と第１の障害説明部６０３と第２の障害説明部６０４と障害説明終了部６０５とから表現される。

障害名称６０１は、障害が検出されたアクセスルートの名称である。障害説明開始部６０２は、障害の説明の開始を宣言する。第１の障害説明部６０３において、cmd＿flag=3の場合アダプタ１０１以外の障害であり、cmd＿flag=1の場合アダプタ１０１の障害である。第２の障害説明部６０４において、es＿key=0x4の場合記憶装置５００以外の障害であり、es＿key=0x3の場合記憶装置５００の障害である。es＿key=0x4、es＿key=0x3の場合、記憶装置５００のコントローラが障害特定部１０３へ報告する。なお、この機能はそもそも記憶装置５００が有している。障害説明終了部６０５は、障害の説明の終了を宣言する。

図１６は、アダプタに対するアクセスルート切替部の処理の例を示す図である。
障害特定部１０３によりアダプタ１０１が障害箇所として特定された場合、影響を受けるアクセスルートは、通信１及び通信２である。この場合、アクセスルート切替部１０４、２０４は、通信１を停止させ、通信４を運用用にする。アクセスルート切替部１０４、２０４は、通信２を停止させる。

図１７は、コントローラに対するアクセスルート切替部の処理の例を示す図である。
障害特定部１０３によりコントローラ５０１が障害箇所として特定された場合、影響を受けるアクセスルートは、通信１、通信３、通信５及び通信７である。この場合、アクセスルート切替部１０４、２０４は、通信１を停止させ、通信４を運用用にする。アクセスルート切替部１０４、２０４は、通信３を停止させる。アクセスルート切替部１０４、２０４は、通信５を停止させ、通信８を運用用にする。アクセスルート切替部１０４、２０４は、通信７を停止させる。

図１８は、中継器前の伝送路に対するアクセスルート切替部の処理の例を示す図である。
障害特定部１０３により伝送路Ｌ１１が障害箇所として特定された場合、影響を受けるアクセスルートは、通信１及び通信２である。この場合、アクセスルート切替部１０４、２０４は、通信１を停止させ、通信４を運用用にする。アクセスルート切替部１０４、２０４は、通信２を停止させる。

図１９は、中継器に対するアクセスルート切替部の処理の例を示す図である。
障害特定部１０３により中継器３００が障害箇所として特定された場合、影響を受けるアクセスルートは、通信１、通信２、通信５及び通信６である。この場合、アクセスルート切替部１０４、２０４は、通信１を停止させ、通信４を運用用にする。アクセスルート切替部１０４、２０４は、通信２を停止させる。アクセスルート切替部１０４、２０４は、通信５を停止させ、通信８を運用用にする。アクセスルート切替部１０４、２０４は、通信６を停止させる。

図２０は、中継器後の伝送路に対するアクセスルート切替部の処理の例を示す図である。
障害特定部１０３により伝送路Ｌ１５が障害箇所として特定された場合、影響を受けるアクセスルートは、通信１及び通信５である。この場合、アクセスルート切替部１０４、２０４は、通信１を停止させ、通信４を運用用にする。アクセスルート切替部１０４、２０４は、通信５を停止させ、通信８を運用用にする。

このようにすると、構成要素の交換の際、コンピュータシステムに対する操作が不要となるため、操作ミスが起こり得ない。また、コンピュータシステムの知識が少ない人でも、構成要素の交換を実行しやすい。

そして、通常業務において、処理性能を落とすことのない継続運用可能な高信頼性のコンピュータシステムを実現できる。
［第２の実施の形態］
以下に、第１の実施の形態と比較して、各構成要素に対する障害確認部の起動の順序が記憶されている設定ファイルを利用する場合について説明する。

図２１は、第２の実施の形態のシステム構成図である。
第２の実施の形態のシステム構成図は、第１の実施の形態と比較して、第１のコンピュータ１００が第１のコンピュータ１００ｚに変化し、第２のコンピュータ２００が第２のコンピュータ２００ｚに変化し、障害特定部１０３が障害特定部１０３ｚに変化し、障害特定部２０３が障害特定部２０３ｚに変化している。そして、第１のコンピュータ１００ｚと第２のコンピュータ２００ｚとに設定ファイル５０が追加されている。

第１の実施の形態と第２の実施の形態との関係において、障害特定部１０３ｚ、２０３ｚを除いた構成要素の名称が同一の場合は構成要素の機能も同一である。設定ファイル５０は、各構成要素に対する障害確認部の起動の順序を記憶する。そして、障害特定部１０３ｚ、２０３ｚにより参照される。

図２２は、設定ファイルの例を示す図である。各構成要素に対する障害確認部の起動の順序を設定ファイルに指定する。
設定ファイル５０は、構成要素名と障害確認部の略称と異常応答時の障害箇所と正常応答時の障害箇所とから構成される。構成要素名は、構成要素の名称である。障害確認部の略称は、構成要素名に関係する構成要素の障害を確認する手段の略称である。異常応答時の障害箇所は、構成要素名に関係する構成要素が異常である場合、障害を発生させている構成要素である。正常応答時の障害箇所は、構成要素名に関係する構成要素が正常である場合、障害を発生させている構成要素である。

具体的には、実行する順番に、各構成要素に対する障害確認部の起動の順序を設定ファイル５０に記載する。図１０と図１１との処理を設定ファイル５０に記載すると、図２２のようになる。

設定ファイル５０は、記憶装置本体に対する障害確認部５１、アダプタに対する障害確認部５２、コントローラ（自経路）に対する障害確認部５３、コントローラ（他経路）に対する障害確認部５４、中継器及び中継器前伝送路に対する障害確認部５５、中継器及び中継器後伝送路に対する障害確認部５６から構成される。

記憶装置本体に対する障害確認部５１は、記憶装置本体５０３という構成要素に対して障害確認を実行し、（ａ）と略称される。
アダプタに対する障害確認部５２は、アダプタ１０１という構成要素に対して障害確認を実行し、（ｂ）と略称され、異常応答時にはアダプタ１０１を障害箇所とする。

コントローラ（自経路）に対する障害確認部５３は、コントローラ５０１という構成要素に対して障害確認を実行し、（ｃ）と略称され、正常応答時には記憶装置本体５０３を障害箇所とする。

コントローラ（他経路）に対する障害確認部５４は、コントローラ５０１という構成要素に対して障害確認を実行し、（ｄ）と略称され、異常応答時にはコントローラ５０１を障害箇所とし、正常応答時には伝送路Ｌ１１、Ｌ１５及び中継器３００を障害箇所とする。

中継器及び中継器前伝送路に対する障害確認部５５は、中継器３００という構成要素に対して障害確認を実行し、（ｅ）と略称され、異常応答時には中継器３００を障害箇所とし、正常応答時には伝送路Ｌ１１を障害箇所とする。

中継器及び中継器後伝送路に対する障害確認部５６は、伝送路Ｌ１６という構成要素に対して障害確認を実行し、（ｆ）と略称され、異常応答時には中継器３００を障害箇所とし、正常応答時には伝送路Ｌ１５を障害箇所とする。

このように、設定ファイル５０を使用すれば、テスト用アクセスを自由に実行でき、構成要素の構成が複雑なコンピュータシステムの場合でも、障害箇所の細かい特定が容易になる。そして、構成要素の障害の原因も特定しやすくなる。

具体的には、既存のコンピュータシステムにHub等の中継器を追加した場合、その構成要素がコンピュータから障害確認可能な機能を有していれば、その構成要素を設定ファイル５０に追加することで、障害箇所の自動特定が可能になる。

［第３の実施の形態］
以下に、第１の実施の形態と比較して、記憶装置が１つから２つに増加した場合について説明する。

図２３は、第３の実施の形態のシステム構成図である。
第３の実施の形態のシステム構成図は、第１のコンピュータ１００と第２のコンピュータ２００と中継器３００、４００と第１の記憶装置５１０と第２の記憶装置５２０と伝送路Ｌ１１、Ｌ１２、Ｌ１３、Ｌ１４、Ｌ１５、Ｌ１６、Ｌ１７、Ｌ１８、Ｌ１９、Ｌ２０、Ｌ２１、Ｌ２２とから構成される。第１のコンピュータ１００と第２のコンピュータ２００とは、ユーザの端末装置であり、ユーザのサービス要求に応答するか、ユーザのサービス要求をサーバに送信する。中継器３００、４００は、第１のコンピュータ１００と第２のコンピュータ２００と第１の記憶装置５１０と第２の記憶装置５２０とを、互いに接続する。第１の記憶装置５１０は、第１のコンピュータ１００と第２のコンピュータ２００とから、データを記憶させられる。第２の記憶装置５２０は、第１のコンピュータ１００と第２のコンピュータ２００とから、データを記憶させられる。第１のコンピュータ１００と第２のコンピュータ２００と中継器３００、４００と第１の記憶装置５１０と第２の記憶装置５２０とは、伝送路Ｌ１１、Ｌ１２、Ｌ１３、Ｌ１４、Ｌ１５、Ｌ１６、Ｌ１７、Ｌ１８、Ｌ１９、Ｌ２０、Ｌ２１、Ｌ２２を介して、互いに通信している。

第１のコンピュータ１００については、第１の実施の形態で示した通りである。
第２のコンピュータ２００については、第１の実施の形態で示した通りである。
第１の記憶装置５１０は、コントローラ５１１、５１２と記憶装置本体５１３とから構成される。コントローラ５１１、５１２は、第１の記憶装置５１０をネットワークに接続する。記憶装置本体５１３は、第１の記憶装置５１０の本体である。コントローラ５１１、５１２と記憶装置本体５１３とは、互いに通信している。

第２の記憶装置５２０は、コントローラ５２１、５２２と記憶装置本体５２３とから構成される。コントローラ５２１、５２２は、第２の記憶装置５２０をネットワークに接続する。記憶装置本体５２３は、第２の記憶装置５２０の本体である。コントローラ５２１、５２２と記憶装置本体５２３とは、互いに通信している。

図２４は、通信テーブルの例を示す図である。
通信テーブル７０は、名称と使用伝送路と通信状況とから構成される。名称は、アクセスルートの名称である。使用伝送路は、名称に関係するアクセスルートが使用する伝送路である。通信状況は、名称に関係するアクセスルートの状況である。なお、通信状況は、アクセスルートが運用されている場合運用用となり、アクセスルートが待機している場合待機用となり、アクセスルートがアクセスルートを診断する目的の場合診断用となる。

ここで、運用用と診断用と待機用との図２４の記載は、第３の実施の形態の初期値である。通信１は、伝送路Ｌ１１、Ｌ１５を使用し、運用用である。通信２は、伝送路Ｌ１１、Ｌ１６を使用し、診断用である。通信３は、伝送路Ｌ１１、Ｌ１７を使用し、運用用である。通信４は、伝送路Ｌ１１、Ｌ１８を使用し、診断用である。通信５は、伝送路Ｌ１２、Ｌ１９を使用し、診断用である。通信６は、伝送路Ｌ１２、Ｌ２０を使用し、待機用である。通信７は、伝送路Ｌ１２、Ｌ２１を使用し、診断用である。通信８は、伝送路Ｌ１２、Ｌ２２を使用し、待機用である。通信９は、伝送路Ｌ１３、Ｌ１５を使用し、運用用である。通信１０は、伝送路Ｌ１３、Ｌ１６を使用し、診断用である。通信１１は、伝送路Ｌ１３、Ｌ１７を使用し、運用用である。通信１２は、伝送路Ｌ１３、Ｌ１８を使用し、診断用である。通信１３は、伝送路Ｌ１４、Ｌ１９を使用し、診断用である。通信１４は、伝送路Ｌ１４、Ｌ２０を使用し、待機用である。通信１５は、伝送路Ｌ１４、Ｌ２１を使用し、診断用である。通信１６は、伝送路Ｌ１４、Ｌ２２を使用し、待機用である。

アクセスルート切替部１０４、２０４は、第１のコンピュータ１００と第２のコンピュータ２００と第１の記憶装置５１０と第２の記憶装置５２０とが接続された場合、通信テーブル７０を作成する。第１の記憶装置５１０と第２の記憶装置５２０とに対し入出力が始まると、障害特定部１０３、２０３の障害情報により、障害箇所交換時に障害箇所が存在するアクセスルートにコンピュータがアクセスしないように、障害箇所が存在するアクセスルートを障害箇所が存在しないアクセスルートに切り替える。

図２５は、中継器後の伝送路に対するアクセスルート切替部の処理の例を示す図である。
障害特定部１０３により伝送路Ｌ１５が障害箇所として特定された場合、影響を受けるアクセスルートは、通信１及び通信９である。この場合、アクセスルート切替部１０４、２０４は、通信１を停止させ、通信６を運用用にする。アクセスルート切替部１０４、２０４は、通信９を停止させ、通信１４を運用用にする。

図２６は、図２５の場合による通信テーブルの変化を示す図である。
通信テーブル７０において、通信１が停止に、通信６が運用用に、通信９が停止に、通信１４が運用用に変化する。

図２７は、コントローラに対するアクセスルート切替部の処理の例を示す図である。
障害特定部１０３によりコントローラ５１１が障害箇所として特定された場合、影響を受けるアクセスルートは、通信１、通信５、通信９及び通信１３である。この場合、アクセスルート切替部１０４、２０４は、通信１を停止させ、通信６を運用用にする。アクセスルート切替部１０４、２０４は、通信５を停止させる。アクセスルート切替部１０４、２０４は、通信９を停止させ、通信１４を運用用にする。アクセスルート切替部１０４、２０４は、通信１３を停止させる。

図２８は、図２７の場合による通信テーブルの変化を示す図である。
通信テーブル７０において、通信１が停止に、通信６が運用用に、通信５が停止に、通信９が停止に、通信１４が運用用に、通信１３が停止に変化する。

そして、通常業務において、処理性能を落とすことのない継続運用可能な高信頼性のコンピュータシステムを実現できる。
図２９は、コンピュータのハードウェア構成の例を示す図である。コンピュータ８００は、ＣＰＵ(Central Processing Unit)８０１によって装置全体が制御されている。ＣＰＵ８０１には、バス８０７を介してＲＡＭ(Random Access Memory)８０２、ハードディスクドライブ（ＨＤＤ:Hard Disk Drive）８０３、グラフィック処理装置８０４、入力インタフェース８０５、および通信インタフェース８０６が接続されている。

ＲＡＭ８０２には、ＣＰＵ８０１に実行させるＯＳのプログラムやアプリケーションプログラムの少なくとも一部が一時的に格納される。また、ＲＡＭ８０２には、ＣＰＵ８０１による処理に必要な各種データが格納される。ＨＤＤ８０３には、ＯＳやアプリケーションプログラムが格納される。

グラフィック処理装置８０４には、モニタ９０１が接続されている。グラフィック処理装置８０４は、ＣＰＵ８０１からの命令に従って、画像をモニタ９０１の画面に表示させる。入力インタフェース８０５には、キーボード９０２とマウス９０３とが接続されている。入力インタフェース８０５は、キーボード９０２やマウス９０３から送られてくる信号を、バス８０７を介してＣＰＵ８０１に送信する。

通信インタフェース８０６は、ネットワーク９０４に接続されている。通信インタフェース８０６は、ネットワーク９０４を介して、他のコンピュータとの間でデータの送受信を行う。

以上のようなハードウェア構成によって、本実施の形態の処理機能を実現することができる。
なお、上記の処理機能は、コンピュータによって実現することができる。その場合、障害解析装置が有すべき機能の処理内容を記述したプログラムが提供される。そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリなどがある。磁気記録装置には、ハードディスク装置（ＨＤＤ）、フレキシブルディスク（ＦＤ）、磁気テープなどがある。光ディスクには、ＤＶＤ(Digital Versatile Disc)、ＤＶＤ−ＲＡＭ(Random Access Memory)、ＣＤ−ＲＯＭ(Compact Disc Read Only Memory)、ＣＤ−Ｒ(Recordable)／ＲＷ(ReWritable)などがある。光磁気記録媒体には、ＭＯ(Magneto-Optical disk)などがある。

プログラムを流通させる場合には、例えば、そのプログラムが記録されたＤＶＤ、ＣＤ−ＲＯＭなどの可搬型記録媒体が販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することもできる。

プログラムを実行するコンピュータは、例えば、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、プログラムに従った処理を実行する。なお、コンピュータは、可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することもできる。また、コンピュータは、サーバコンピュータからプログラムが転送される毎に、逐次、受け取ったプログラムに従った処理を実行することもできる。

（付記１）複数の情報機器及び前記情報機器間を接続する１個以上の伝送路を構成要素とする複数のアクセスルートで通信可能な複数の装置間の通信の障害を解析する障害解析装置において、
前記複数の装置間の通常アクセスにおいて障害を検出すると、前記通常アクセスを実行したアクセスルート上の全ての構成要素を障害箇所候補とする障害検出手段と、
前記障害検出手段で障害が検出されると、前記障害箇所候補へテスト用アクセスを実行し、前記テスト用アクセスで障害を検出しなかった場合、前記テスト用アクセスを実行したアクセスルート上の全ての構成要素を、前記障害箇所候補から除外し、前記テスト用アクセスで障害を検出した場合、前記テスト用アクセスを実行したアクセスルート上に配置されていない全ての構成要素を、前記障害箇所候補から除外する障害診断手段と、
前記障害診断手段において、１以上のアクセスルートで前記テスト用アクセスが実行された結果、最後の１つとなった前記障害箇所候補の構成要素を障害箇所とする障害特定手段と、
前記複数の装置間の前記通常アクセス用のアクセスルートを、前記障害特定手段で障害箇所として特定された構成要素を経由しないアクセスルートに切り替えるアクセスルート切替手段と、
を有することを特徴とする障害解析装置。

（付記２）前記障害診断手段は、テスト用アクセスの起動の順序が記憶されている設定ファイルを参照し、前記設定ファイルで示される順序で前記テスト用アクセスを実行することを特徴とする付記１記載の障害解析装置。

（付記３）前記障害診断手段は、前記通常アクセスを実行したアクセスルートの一部の構成要素を経由したアクセスルートで前記テスト用アクセスを実行することを特徴とする付記１記載の障害解析装置。

（付記４）前記障害診断手段は、前記通常アクセスを実行したアクセスルートと異なる構成要素を経由したアクセスルートで前記テスト用アクセスを実行することを特徴とする付記１記載の障害解析装置。

（付記５）前記複数の装置は、記憶装置と前記記憶装置に対してネットワーク経由でアクセスするコンピュータであり、前記情報機器には、前記記憶装置内でデータを記憶する装置本体、前記装置本体を制御するコントローラ、前記ネットワーク上でデータを中継する中継器及び前記コンピュータにおいて通信を制御するアダプタが含まれることを特徴とする付記１記載の障害解析装置。

（付記６）コンピュータにより、複数の情報機器及び前記情報機器間を接続する１個以上の伝送路を構成要素とする複数のアクセスルートで通信可能な複数の装置間の通信の障害を解析する障害解析方法において、
障害検出手段が、前記複数の装置間の通常アクセスにおいて障害を検出すると、前記通常アクセスを実行したアクセスルート上の全ての構成要素を障害箇所候補とし、
障害診断手段が、前記障害検出手段で障害が検出されると、前記障害箇所候補へテスト用アクセスを実行し、前記テスト用アクセスで障害を検出しなかった場合、前記テスト用アクセスを実行したアクセスルート上の全ての構成要素を、前記障害箇所候補から除外し、前記テスト用アクセスで障害を検出した場合、前記テスト用アクセスを実行したアクセスルート上に配置されていない全ての構成要素を、前記障害箇所候補から除外し、
障害特定手段が、前記障害診断手段において、１以上のアクセスルートで前記テスト用アクセスが実行された結果、最後の１つとなった前記障害箇所候補の構成要素を障害箇所とし、
アクセスルート切替手段が、前記複数の装置間の前記通常アクセス用のアクセスルートを、前記障害特定手段で障害箇所として特定された構成要素を経由しないアクセスルートに切り替える、
ことを特徴とする障害解析方法。

（付記７）複数の情報機器及び前記情報機器間を接続する１個以上の伝送路を構成要素とする複数のアクセスルートで通信可能な複数の装置間の通信の障害を解析する障害解析プログラムにおいて、
コンピュータに、
障害検出手段は、前記複数の装置間の通常アクセスにおいて障害を検出すると、前記通常アクセスを実行したアクセスルート上の全ての構成要素を障害箇所候補とし、
障害診断手段は、前記障害検出手段で障害が検出されると、前記障害箇所候補へテスト用アクセスを実行し、前記テスト用アクセスで障害を検出しなかった場合、前記テスト用アクセスを実行したアクセスルート上の全ての構成要素を、前記障害箇所候補から除外し、前記テスト用アクセスで障害を検出した場合、前記テスト用アクセスを実行したアクセスルート上に配置されていない全ての構成要素を、前記障害箇所候補から除外し、
障害特定手段は、前記障害診断手段において、１以上のアクセスルートで前記テスト用アクセスが実行された結果、最後の１つとなった前記障害箇所候補の構成要素を障害箇所とし、
アクセスルート切替手段は、前記複数の装置間の前記通常アクセス用のアクセスルートを、前記障害特定手段で障害箇所として特定された構成要素を経由しないアクセスルートに切り替える、
処理を実行させることを特徴とする障害解析プログラム。

（付記８）複数の情報機器及び前記情報機器間を接続する１個以上の伝送路を構成要素とする複数のアクセスルートで通信可能な複数の装置間の通信の障害を解析する障害解析プログラムを記録したコンピュータ読み取り可能な記録媒体において、
コンピュータに、
障害検出手段は、前記複数の装置間の通常アクセスにおいて障害を検出すると、前記通常アクセスを実行したアクセスルート上の全ての構成要素を障害箇所候補とし、
障害診断手段は、前記障害検出手段で障害が検出されると、前記障害箇所候補へテスト用アクセスを実行し、前記テスト用アクセスで障害を検出しなかった場合、前記テスト用アクセスを実行したアクセスルート上の全ての構成要素を、前記障害箇所候補から除外し、前記テスト用アクセスで障害を検出した場合、前記テスト用アクセスを実行したアクセスルート上に配置されていない全ての構成要素を、前記障害箇所候補から除外し、
障害特定手段は、前記障害診断手段において、１以上のアクセスルートで前記テスト用アクセスが実行された結果、最後の１つとなった前記障害箇所候補の構成要素を障害箇所とし、
アクセスルート切替手段は、前記複数の装置間の前記通常アクセス用のアクセスルートを、前記障害特定手段で障害箇所として特定された構成要素を経由しないアクセスルートに切り替える、
処理を実行させることを特徴とする障害解析プログラムを記録したコンピュータ読み取り可能な記録媒体。

本発明の概念図である。第１の実施の形態のシステム構成図である。障害特定部の例を示す図である。記憶装置本体に対する障害確認部の処理の例を示す図である。アダプタに対する障害確認部の処理の例を示す図である。コントローラ（自経路）に対する障害確認部の処理の例を示す図である。コントローラ（他経路）に対する障害確認部の処理の例を示す図である。中継器及び中継器前伝送路に対する障害確認部の処理の例を示す図である。中継器及び中継器後伝送路に対する障害確認部の処理の例を示す図である。第１の実施の形態の処理の例を示すフローチャートの前半である。第１の実施の形態の処理の例を示すフローチャートの後半である。通信テーブルの例を示す図である。存在するアクセスルートの表現の例を示す図である。アクセスルート情報の表現の例を示す図である。障害情報の表現の例を示す図である。アダプタに対するアクセスルート切替部の処理の例を示す図である。コントローラに対するアクセスルート切替部の処理の例を示す図である。中継器前の伝送路に対するアクセスルート切替部の処理の例を示す図である。中継器に対するアクセスルート切替部の処理の例を示す図である。中継器後の伝送路に対するアクセスルート切替部の処理の例を示す図である。第２の実施の形態のシステム構成図である。設定ファイルの例を示す図である。第３の実施の形態のシステム構成図である。通信テーブルの例を示す図である。中継器後の伝送路に対するアクセスルート切替部の処理の例を示す図である。図２５の場合による通信テーブルの変化を示す図である。コントローラに対するアクセスルート切替部の処理の例を示す図である。図２７の場合による通信テーブルの変化を示す図である。コンピュータのハードウェア構成の例を示す図である。従来のシステム構成図における障害への対応の例を示す図である。

符号の説明

１０コンピュータ
１１障害解析装置
１１ａ障害検出手段
１１ｂ障害診断手段
１１ｃ障害特定手段
１１ｄアクセスルート切替手段
１２アダプタ
１３アダプタ
２０中継器
３０中継器
４０装置
４１コントローラ
４２コントローラ
４３装置本体
Ｌ１伝送路
Ｌ２伝送路
Ｌ３伝送路
Ｌ４伝送路
Ｌ５伝送路
Ｌ６伝送路
Ｌ７伝送路
Ｌ８伝送路

Claims

複数の情報機器及び前記情報機器間を接続する１個以上の伝送路を構成要素とする複数のアクセスルートで通信可能な複数の装置間の通信の障害を解析する障害解析装置において、
前記複数の装置間の通常アクセスにおいて障害を検出すると、前記通常アクセスを実行したアクセスルート上の全ての構成要素を障害箇所候補とする障害検出手段と、
前記障害検出手段で障害が検出されると、前記障害箇所候補へテスト用アクセスを実行し、前記テスト用アクセスで障害を検出しなかった場合、前記テスト用アクセスを実行したアクセスルート上の全ての構成要素を、前記障害箇所候補から除外し、前記テスト用アクセスで障害を検出した場合、前記テスト用アクセスを実行したアクセスルート上に配置されていない全ての構成要素を前記障害箇所候補から除外する障害診断手段と、
前記障害診断手段において、１以上のアクセスルートで前記テスト用アクセスが実行された結果、最後の１つとなった前記障害箇所候補の構成要素を障害箇所とする障害特定手段と、
前記複数の装置間の前記通常アクセス用のアクセスルートを、前記障害特定手段で障害箇所として特定された構成要素を経由しないアクセスルートに切り替えるアクセスルート切替手段と、
を有することを特徴とする障害解析装置。
前記障害診断手段は、テスト用アクセスの起動の順序が記憶されている設定ファイルを参照し、前記設定ファイルで示される順序で前記テスト用アクセスを実行することを特徴とする請求項１記載の障害解析装置。
前記障害診断手段は、前記通常アクセスを実行したアクセスルートの一部の構成要素を経由したアクセスルートで前記テスト用アクセスを実行することを特徴とする請求項１記載の障害解析装置。
前記障害診断手段は、前記通常アクセスを実行したアクセスルートと異なる構成要素を経由したアクセスルートで前記テスト用アクセスを実行することを特徴とする請求項１記載の障害解析装置。
コンピュータにより、複数の情報機器及び前記情報機器間を接続する１個以上の伝送路を構成要素とする複数のアクセスルートで通信可能な複数の装置間の通信の障害を解析する障害解析方法において、
障害検出手段が、前記複数の装置間の通常アクセスにおいて障害を検出すると、前記通常アクセスを実行したアクセスルート上の全ての構成要素を障害箇所候補とし、
障害診断手段が、前記障害検出手段で障害が検出されると、前記障害箇所候補へテスト用アクセスを実行し、前記テスト用アクセスで障害を検出しなかった場合、前記テスト用アクセスを実行したアクセスルート上の全ての構成要素を、前記障害箇所候補から除外し、前記テスト用アクセスで障害を検出した場合、前記テスト用アクセスを実行したアクセスルート上に配置されていない全ての構成要素を、前記障害箇所候補から除外し、
障害特定手段が、前記障害診断手段において、１以上のアクセスルートで前記テスト用アクセスが実行された結果、最後の１つとなった前記障害箇所候補の構成要素を障害箇所とし、
アクセスルート切替手段が、前記複数の装置間の前記通常アクセス用のアクセスルートを、前記障害特定手段で障害箇所として特定された構成要素を経由しないアクセスルートに切り替える、
ことを特徴とする障害解析方法。