JP5080140B2 - I/oデバイス切り替え方法 - Google Patents
I/oデバイス切り替え方法 Download PDFInfo
- Publication number
- JP5080140B2 JP5080140B2 JP2007156339A JP2007156339A JP5080140B2 JP 5080140 B2 JP5080140 B2 JP 5080140B2 JP 2007156339 A JP2007156339 A JP 2007156339A JP 2007156339 A JP2007156339 A JP 2007156339A JP 5080140 B2 JP5080140 B2 JP 5080140B2
- Authority
- JP
- Japan
- Prior art keywords
- switch
- computer
- devices
- server
- failure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2053—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
- G06F11/2089—Redundant storage control functionality
- G06F11/2092—Techniques of failing over between control units
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2017—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where memory access, memory control or I/O control functionality is redundant
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2023—Failover techniques
- G06F11/2033—Failover techniques switching over of hardware resources
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2038—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with a single idle spare processing component
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2002—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant
- G06F11/2007—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant using redundant communication media
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Hardware Redundancy (AREA)
Description
より具体的には、本発明はI/Oスイッチに接続されたI/Oデバイスに障害が発生した場合に、適確にI/Oデバイスの切り替え制御を行うことにある。
該管理サーバは、該I/Oスイッチに接続することができる複数の種類のI/Oデバイスであって、該計算機に割り当てられていない1または複数の該I/Oデバイスを待機用I/Oデバイスとして定義して管理するI/Oデバイス管理テーブルと、少なくとも複数の該I/Oデバイスで発生する障害を検出する障害検出部と、該障害検出部で障害が検出された場合、該I/Oデバイス管理テーブルを参照して、該障害が発生した該I/Oデバイスと同じ種類のI/Oデバイスを選択するI/Oデバイス選択部と、障害が発生した該I/Oデバイスを、該I/Oデバイス選択部によって選択されたI/Oデバイスに切替えるI/Oデバイス切り替え部と、を有し、新たに切替えられたI/Oデバイスを、該I/Oスイッチを介して該計算機に接続する計算機システムとして構成される。
図1は、一実施例による計算機システムの全体構成図を示す。
計算機システムにおいて、管理サーバ101は、ネットワークスイッチ113を介して複数のサーバ装置114に接続され、更に複数のサーバ装置114は複数のスイッチ装置115に接続される。スイッチ装置115には複数のソケット116を介してI/Oデバイス117が接続され、I/Oデバイスの内のいくつかはストレージ装置118と接続され、サーバ装置114からストレージ装置118をアクセスすることができる。通常、サーバ装置114とストレージ装置118との間でジョブが実行され、管理サーバ101は、サーバ装置114やI/Oデバイス117の障害の監視及び回復制御を行う。
本実施例では、管理サーバ101が、サーバ装置114やI/Oデバイス117の障害を監視し、障害時に正常な状態に回復する例を示すものである。
管理サーバ101は、メモリ201、プロセッサ202、ディスクインターフェース203及びネットワークインターフェース204を有する。メモリ201には、障害管理部102、I/Oスイッチ管理テーブル108、サーバ管理テーブル109、サーバ切り替え管理テーブル110、デバイスプール管理テーブル111、負荷管理テーブル112、デバイス識別子書き換えプログラム119が格納される。
障害管理部102は、障害検出部103,I/Oデバイス選択部104,サーバ切り替え部105、I/Oデバイス切り替え部106,デバイスプール検査部120,I/Oデバイス高信頼化割り当て部107が含まれる。メモリ内の障害管理部102やテーブル108〜112は、プロセッサ202に読み込まれ処理されて所定の機能や動作を実現する。ディスクインターフェース203は、管理サーバ101を起動するためのプログラムが格納されたディスクに接続される。ネットワークインターフェース204は、ネットワークに接続され各装置の障害情報などを転送する。
サーバ装置114は、メモリ301、プロセッサ302、I/Oスイッチインターフェース303,BMC(Base board Management Controller)304を有する。メモリ301には、サーバ装置114で処理されるプログラムが格納され、それらのプログラムはプロセッサ302で実行される。I/Oスイッチインターフェース303はI/Oスイッチ装置115に接続される。BMC304は、サーバ装置114内のハードウェアに障害が発生した場合に、ネットワークを介して障害を通知する機能を有する。BMC304は障害の発生箇所とは独立に動作できるため、メモリ301やプロセッサ302に障害が発生したとしても障害通知を転送することができる。
I/Oスイッチ装置115は、メモリ401、制御プロセッサ402、ネットワークインターフェース403、クロスバスイッチ404、ポート407を有する。メモリ401には、クロスバスイッチ制御部405、ポート管理テーブル406が格納される。クロスバスイッチ制御部405は、ポート407毎の状態や割り当てを制御する機能を有する。メモリ401内のクロスバスイッチ制御部405やポート管理テーブル406は、制御プロセッサ402に読み込まれて実行される。I/Oスイッチ装置115は、ネットワークインターフェース403を介して、I/Oスイッチの障害情報の転送や、I/Oスイッチ装置115の制御を行うためのコマンドを受信することができる。ポート管理テーブルは、ポート407毎の状態や割り当て情報を格納する。クロスバスイッチ404は、ポート407間でデータの転送制御を行う。
ストレージ装置118は、ストレージ制御装置501とディスク装置502を有する。ストレージ制御装置501は、サーバ装置114と接続され、ディスク装置502内のディスク503に対して読み込みおよび書き込みの制御を行う。ディスク装置502内のディスク503には、それぞれ論理ユニット(LU)と呼ばれる識別子が付けられ、サーバ装置114から論理ユニットを識別できるようになっている。
サーバ装置114のいずれかに障害が発生した場合に、I/Oスイッチ装置115のデータ転送経路を変更して、待機サーバ601を使用して回復する動作を行う。サーバ装置114は、業務処理などを実行するための役割と、待機サーバ601とに役割が分けられる。いずれの役割のサーバも、複数設けることができる。
I/Oデバイス117のいずれかに障害が発生した場合に、I/Oデバイスを交代し障害回復を行う動作を行う。特徴的なことは、未使用のデバイスを待機用としてまとめて管理するデバイスプール704を設定したことである。デバイスプール704には、複数の種類のI/Oデバイスがプールされ、障害時の交代に備える。ユーザは、I/Oスイッチ装置115を、ソケット116を介して複数の種類のI/Oデバイスと自由に接続することができる。例えば、ネットワーク接続を行うためのNIC(Network Interface Card)やストレージ装置118と接続するためのHBA(Host Bus Adapter)等がある。I/Oスイッチ装置115は、あらゆるデータを転送することができる経路を提供する。I/Oに機能を持つのはI/Oデバイス117であり、I/Oデバイス117はサーバ装置114と違って、均一の機能を有している訳ではない。
この例は、複数(2つ)のデバイスプール801を設定したものである。I/Oデバイス117に障害が発生した場合、デバイスプール801のいずれかから、同じ機能を有するI/Oデバイス117を選択して割り当てることができる。図7の例と同様に、I/Oデバイスの固有情報の引き継ぎ(802)も行うことができる。複数のデバイスプール801を有することで、例えば、I/Oデバイス117の性能毎にデバイスプールを分けて性能管理を容易化したり、I/Oデバイス117の種類毎に分けて種類の管理を容易化したり、I/Oスイッチ装置115毎に分けて経路の多重化により高信頼化された構成に対応した障害回復を行うことが可能である。
901は、I/Oスイッチ装置115毎に割り当てられるI/Oスイッチ識別子である。902はI/Oスイッチ装置115のポート番号である。903はポートに接続されたデバイスの種類を示す情報を示し、例えば、NICであればMAC(Media Access Control address)アドレス、HBAであればWWN(World Wide Name)等である。904は、I/Oデバイス117毎の固有情報であるデバイス識別子である。905は、I/Oデバイス117の状態を示し、例えば、正常動作可能、障害発生の如き情報である。
1001はサーバ装置識別子、1002はサーバ装置114のプロセッサ構成、1003はメモリ構成を示す情報である。また、1004はサーバ装置114が接続されているI/Oスイッチ装置115のポート番号、1005はサーバ装置114に割り当てられているI/Oデバイス117が接続されたポート番号、1006はサーバ装置114に割り当てられたI/Oデバイス117の種類、1007は、サーバ装置に割り当てられたディスクの論理ユニット番号を示す情報である。サーバ管理テーブル109によって、サーバ装置114に割り当てられたI/Oデバイス117を管理することができる。
1101はサーバ識別子、1102はサーバ装置の障害時に切り替え先となるサーバ装置の識別子を示す。例えば、HOST1に障害が発生した場合には、HOST4を交代用のサーバ装置とするといった情報が保管される。1103はI/O多重接続構成を示し、例えば、HOST1のNICおよびHBAはそれぞれ多重化され高信頼化されているといった情報である。I/Oデバイス117を多重化することで、いずれか一つのI/Oデバイスに障害が発生しても正常なI/Oデバイス117を用いて処理を継続することができる。
サーバ切り替え管理テーブル110によって、サーバ装置114に障害が発生した場合の交代用サーバ装置を定義することができる。また、I/O多重化接続構成を記述できるようにしたことで、I/Oデバイス117等に障害が発生した場合に、高信頼性を保ったまま回復を行うための情報として用いることができる。
1201はI/Oスイッチ装置115の識別子、1202はポート番号、1203はI/Oデバイス117の割り当て状態を示し、例えばサーバ装置114に割り当て済みか未割当かといった情報である。1204はデバイスプール割り当て状態を示す情報である。
図示の例では、SW1/SW2のポート6,7がデバイスプールとして割り当てられている。デバイスプールは交代用のI/Oデバイス117を規定しているので、I/Oデバイス117に障害が発生した時に、管理者は、障害発生元のI/Oデバイス117の種類や優先度などに応じて交代先のI/Oデバイスを割り当てることができる。
ここで負荷とは、I/Oスイッチ装置115の負荷を示す。1301はI/Oスイッチ装置115の識別子が格納される。1302はポート番号が格納される。1303は総転送データ量が格納される。1304は、単位時間当たりのトラフィック量が格納される。負荷管理テーブル112は、I/Oスイッチ装置115のネットワークインターフェース403から定期的に性能情報を取得し更新を行う。負荷管理テーブル112によって、I/Oスイッチ装置115のポート毎の負荷を知ることができるようになる。
1401はI/Oスイッチ装置115の物理ポート番号、1402は割り当てグループを示す情報である。割り当てグループとはポートのつながりを示し、例えば割り当てグループが同一のポート間ではデータの転送は可能であるが、他の異なる割り当てグループ間とはデータ転送することはできない。1403は論理ポート番号であり、サーバ装置114に対してポート番号を仮想化したものである。例えば、物理ポート番号が4のポートには論理ポートが2に割り当てられているため、サーバ装置114にはポート番号2に見せかけることができる。
ホスト装置114に対して割り当てグループ1502の機能を用いて任意のI/Oデバイス117を割り当てることができる。また、I/Oデバイス117が接続されたポート番号407を仮想化し論理ポート1501としてサーバ装置114に見せることができる。割り当てグループ1502によって、他の割り当てグループ1502からI/Oデバイス117にアクセスすることはできないため、信頼性を向上することができる。
サーバ装置114からI/Oスイッチ装置115に対してデータを送信した場合のパケットの構造を1601〜1604に示す。1601は送信元のポート番号、1602は送信先のポート番号、1603は論理ポートを一時的に格納する領域、1604は送信するデータである。1601〜1604のパケットがI/Oスイッチ装置115に転送されると、クロスバスイッチ制御部405とポート管理テーブル406によって、送信先ポート番号1602は論理ポート番号から物理ポート番号に変換されI/Oデバイス117に転送される。この際、パケット返送時に論理ポートに変換し直す必要があるため論理ポート番号は1603の領域(LP)に保存される。
まず、パケットから送信元と送信先のポート番号およびLPを取得する(S1701)。そして論理ポート番号(LP)が有効かどうかをチェックする(S1702)。例えば、無効を“FF”等のように定義しておくことで実現できる。LPが有効の場合はS1703に移行して、パケットのLP(論理ポート)領域の内容を送信元ポート番号にコピーする。そして、LP(論理ポート)領域の内容を無効化して(S1704)、送信先ポートにパケットを送信する(S1709)。
障害発生通知を受信すると(S1801)、その障害発生通知は障害が発生した装置から管理サーバ101へ転送される。管理サーバ101では、サーバ装置114の障害がどうかを判定する(S1802)。判定の結果、サーバ装置114の障害の場合は、S1803に移行しサーバ切り替え部を呼び出す。その後、I/Oスイッチ装置115の障害かどうかを判定する(S1804)。判定の結果、I/Oスイッチ装置115の障害の場合には、S1805に移行し、I/Oスイッチ装置115の閉塞処理を行う。
その後、I/Oスイッチ装置115に接続されたI/Oデバイス117の障害かどうかを判定する(S1804)。判定の結果、I/Oデバイス117の障害の場合は、S1807に移行し、I/Oデバイス切り替え部の呼び出しを行う。
この処理によって、サーバ装置114の障害とI/Oデバイス117の障害によって回復方法を変更することができる。これにより、障害が発生していないI/Oデバイス117を新たに割り当てたサーバ装置114でも引き続き使用することができるため、回復に必要なハードウェアを削減することができるようになる。
まず、障害発生メッセージから障害が発生したサーバ装置の識別子を取得する(S1901)。障害が発生したサーバ装置を停止する(S1902)。これは、障害が発生したサーバ装置114によって不要なI/Oの発行を防ぐため、及びサーバ装置114に割り当てられたI/Oデバイス117を解放するためである。
次に、サーバ管理テーブル109を検索し、障害が発生したサーバ装置114のプロセッサ302、メモリ301の構成を取得する(S1903)。更に、サーバ切り替え管理テーブル110を検索し、待機用のサーバからプロセッサ302、メモリ301の構成条件を満たす待機用サーバを検索する(S1904)。また、サーバ管理テーブル109を検索し、障害が発生したサーバ装置114が接続されたI/Oポート番号を取得する(S1905)。
この処理によって、サーバ装置114に障害が発生した場合に、障害が発生したサーバ装置114が使用していたI/Oデバイス117を待機用のサーバ装置114に引き継ぐことができる。
まず、障害発生メッセージから障害が発生したI/Oデバイス117に接続されたI/Oスイッチ識別子904、I/Oポート902、接続デバイス903を取得する(S2001)。そして、サーバ管理テーブル109から、障害が発生したI/Oデバイス117が割り当てられたサーバ装置114とサーバ装置114が接続されたポート番号1004を取得する(S2002)。また、障害が発生したI/Oデバイス117が割り当てられたサーバ装置114を停止する(S2003)。これは、障害が発生したサーバ装置114によって不要なI/Oの発行を防ぐため、及びサーバ装置114に割り当てられたI/Oデバイス117を解放するためである。
その後、障害が発生したI/Oデバイス117が割り当てられたサーバ装置114をネットワークブートし、障害が発生したI/Oデバイス117のデバイス識別子904を新たに割り当てたI/Oデバイス117に書き込む(S2007)。ここで、ネットワークブートするプログラムは、デバイス識別子書き換えプログラム119である。デバイス識別子書き換えプログラム119は、サーバ装置114を使用して起動する最低限のプログラムとデバイス識別子904を書き換えるためのプログラムが格納されている。これにより、障害が発生したI/Oデバイス117と同じデバイス識別子904を新たに割り当てられたI/Oデバイス117に引き継ぐことができるため、システムの構成を変更することなくサーバ装置114を起動することができるようになる。
最後に、障害が発生したI/Oデバイス117が割り当てられたサーバ装置114を通常のディスクから再起動する(S2008)。
まず、サーバ切り替え管理テーブル110から、障害が発生したI/Oデバイス117がI/O多重接続構成1103に含まれるか検索する(S2101)。障害が発生したI/Oデバイス117がI/O多重接続構成1103であった場合はS2103に移行し、I/Oデバイス高信頼化割り当て部107の呼び出しを行う(S2103)。一方、障害が発生したI/Oデバイス117がI/O多重接続構成1103でなかった場合は、I/Oスイッチ装置115毎のプールされたデバイス数を求める(S2104)。
まず、I/Oスイッチ管理テーブル108から、障害が発生したI/Oデバイス117が接続されたI/Oスイッチ装置115を検索する(S2201)。そして、デバイスプール管理テーブル111から、S2201で検索されたI/Oスイッチ装置115に属するデバイスプールを抽出する(S2202)。その後、抽出されたデバイスプール1204から、障害が発生したI/Oデバイス117と同じ種類のI/Oデバイス117を選択する(S2203)。
この処理により、サーバ装置115内で複数のI/Oデバイス117を用いてI/Oデバイス117の高信頼化を行っている場合に、複数のI/Oデバイス117の経路が異なるI/Oスイッチ装置115を通過するように設定することで、高信頼性を維持したままI/Oデバイス117の交替を可能になる。
サーバ装置114内のメモリ301に格納されたオペレーティングシステム(OS)2301において、NICやHBAの高信頼化2303が設定されている場合の動作例を示す。高信頼化のために、NICやHBAを複数用いている。また、I/Oスイッチ装置115が多重化されている場合、それぞれの異なるI/Oスイッチ装置115を通過するように設定することで、より高信頼化を実現できる。このような高信頼構成をI/Oデバイス117の障害時に引き継ぐために、I/Oスイッチ装置115毎にデバイスプール2305を設け、障害が発生したI/Oデバイス117が接続されたI/Oスイッチ装置115に属するデバイスプール2305の中から交代用のI/Oデバイス117を割り当てることで実現できる。この際、MACアドレスやWWNのようなデバイス識別子の引き継ぎ2304を行うことで、より互換性を高めることができる。
まず、サーバ管理テーブル109を検索し、I/Oデバイス117の種類毎に割り当てI/Oデバイス数を集計する(S2401)。既にサーバ装置114に割り当て済みのI/Oデバイス117の種類が最低でも1つはデバイスプールに確保されているかチェックする(S2402)。このチェックで十分なI/Oデバイス117がデバイスプールに確保されていなかった場合、S2404に移行して、管理者に対して不足しているI/Oデバイス117を報告する(S2404)。このような処理フローをI/Oデバイス117の構成変更を契機に実行することで、デバイスプールに不足したI/Oデバイス117を管理者が事前に検知し対応することができる。
Claims (11)
- 複数の計算機が、1または複数のI/Oスイッチを介して、外部装置と接続するための複数のI/Oデバイスに接続され、該複数の計算機と該I/Oスイッチはネットワークを介して管理サーバと接続される計算機システムにおいて、該計算機に1または複数の任意の該I/Oデバイスを割り当てて、かつその割り当てを変更するI/Oデバイスの切替え方法であって、
該管理サーバは、
該I/Oスイッチに対応して該I/Oスイッチのポート番号と、該ポートに接続した該I/Oデバイスの種類を示す情報と、該I/Oデバイスの識別子を保持したI/Oスイッチ管理テーブルと、該計算機に対応して該計算機が接続した該I/Oスイッチのポート番号、該計算機に割り当てられた該I/Oデバイスが接続したポート番号と、該計算機に割り当てた該I/Oデバイスの種類を保持したサーバ管理テーブルとを有し、
該I/Oスイッチに接続することができる複数の種類のI/Oデバイスを管理するI/Oデバイス管理テーブルに、該計算機に割り当てされていない1または複数の該I/Oデバイスを待機用I/Oデバイスとして定義して登録し、
該計算機に接続された該I/Oデバイスのいずれかに障害が発生した場合に、障害が発生した該I/Oデバイスに接続した該I/Oスイッチの識別子、該I/Oスイッチのポート番号、該I/Oデバイスの種類を示す情報を取得し、
該サーバ管理テーブルから、障害が発生したI/Oデバイスが割り当てられた計算機と該計算機が接続したポート番号を取得し、
該I/Oデバイス管理テーブルを参照して該待機用のI/Oデバイスの中から該障害が発生したI/Oデバイスと同じ種類の該I/Oデバイスを選択し、
選択した該I/Oデバイスを障害が発生したI/Oデバイスが割り当てられた計算機に割当てる
ことを特徴とするI/Oデバイス切り替え方法。 - I/Oデバイス管理テーブルは該I/Oデバイスの固有の識別子を保持し、該障害が発生したI/Oデバイスの識別子を該I/Oデバイス管理テーブルから取得するとともに、該選択されたI/Oデバイスの識別子を該障害が発生したI/Oデバイスが有する識別子に書き換えることを特徴とする請求項1のI/Oデバイス切り替え方法。
- 該識別子の書き換えは、該障害が発生したI/Oデバイスに割り当てられている該計算機に該識別子を書き換えるためのプログラムを転送し該識別子を書き換えることを特徴とする請求項2のI/Oデバイス切り替え方法。
- 該I/Oスイッチは該I/Oデバイスが接続されたポート番号を、該計算機からは任意のポート番号に変換する機能を有し、該I/Oデバイスの障害時に、該選択されたI/Oデバイスが接続されたポート番号を該障害が発生したI/Oデバイスが接続されたポート番号と同じになるようにポート番号を変換することを特徴とする請求項1のI/Oデバイス切り替え方法。
- 該I/Oスイッチ毎にそれぞれ待機用のI/Oデバイスを設け、該I/Oデバイスの障害時に、該I/Oスイッチ毎の待機用のI/Oデバイスの数が多い方から交代用のI/Oデバイスを選択することを特徴とする請求項1のI/Oデバイス切り替え方法。
- 該I/Oスイッチ毎にそれぞれ待機用のI/Oデバイスを設け、該I/Oデバイスの障害時に、負荷が小さい該I/Oスイッチに設けられた待機用のI/Oデバイスから交代用のI/Oデバイスを選択することを特徴とする請求項1のI/Oデバイス切り替え方法。
- 該計算機は同じ種類の複数の該I/Oデバイスを用いて高信頼化されている場合に、該I/Oスイッチ毎にそれぞれ待機用のI/Oデバイスを設け、該I/Oデバイスの障害時に、該障害が発生したI/Oデバイスが接続された該I/Oスイッチに設けられた待機用のI/Oデバイスの中から交代用のI/Oデバイスを選択することを特徴とする請求項1のI/Oデバイス切り替え方法。
- 該計算機に割り当てられた該I/Oデバイスの種類と該待機用のI/Oデバイスの種類を比較し、該待機用のI/Oデバイスの種類が該計算機に割り当てられた該I/Oデバイスの種類よりも少ない場合に、待機用のI/Oデバイスが不足していることを管理者に通知することを特徴とする請求項1のI/Oデバイス切り替え方法。
- 複数の計算機と、該複数の計算機に接続される1または複数のI/Oスイッチと、該I/Oスイッチに接続され、外部装置と接続するための複数のI/Oデバイスと、該複数の計算機にネットワークを介して接続され、該計算機及び該I/Oデバイスの状態を監視すると共に、該計算機に接続された1または複数該I/Oデバイスの割り当てを変更する制御を行う管理サーバと、を含む計算機システムにおいて、
該管理サーバは、
該I/Oスイッチに対応して該I/Oスイッチのポート番号と、該ポートに接続した該I/Oデバイスの種類を示す情報と、該I/Oデバイスの識別子を保持したI/Oスイッチ管理テーブルと、該計算機に対応して該計算機が接続した該I/Oスイッチのポート番号、該計算機に割り当てられた該I/Oデバイスが接続したポート番号と、該計算機に割り当てた該I/Oデバイスの種類を保持したサーバ管理テーブルと、
該I/Oスイッチに接続することができる複数の種類のI/Oデバイスを管理するI/Oデバイス管理テーブルに、該計算機に割り当てされていない1または複数の該I/Oデバイスを待機用I/Oデバイスとして定義して登録し、該計算機に接続された該I/Oデバイスのいずれかに障害が発生した場合に、障害が発生した該I/Oデバイスに接続した該I/Oスイッチの識別子、該I/Oスイッチのポート番号、該I/Oデバイスの種類を示す情報を取得し、該サーバ管理テーブルから、障害が発生したI/Oデバイスが割り当てられた計算機と該計算機が接続したポート番号を取得する障害検出部と、
該I/Oデバイス管理テーブルを参照して該待機用のI/Oデバイスの中から該障害が発生したI/Oデバイスと同じ種類の該I/Oデバイスを選択し、選択した該I/Oデバイスを障害が発生したI/Oデバイスが割り当てられた計算機に割当てるI/Oデバイス切り替え部と、を有することを特徴とする計算機システム。 - 前記管理サーバは、
前記I/Oデバイス管理テーブルが、I/Oスイッチの識別子に対応して、ポート番号と、I/Oデバイスの割り当て状態を示す情報とを登録して管理している場合には、I/Oデバイスの割り当て状態を変更することを特徴とする請求項9の計算機システム。 - 該I/Oデバイス管理テーブルは、該I/Oデバイスの固有の識別子を保持し、該障害が発生したI/Oデバイスの識別子を該I/Oデバイス管理テーブルから取得するとともに、該選択されたI/Oデバイスの識別子によって該障害が発生したI/Oデバイスが有する識別子を書き換えることを特徴とする請求項9又は10の計算機システム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007156339A JP5080140B2 (ja) | 2007-06-13 | 2007-06-13 | I/oデバイス切り替え方法 |
US11/902,364 US7809977B2 (en) | 2007-06-13 | 2007-09-20 | I/O device switching method |
US12/872,713 US8156367B2 (en) | 2007-06-13 | 2010-08-31 | I/O device switching method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007156339A JP5080140B2 (ja) | 2007-06-13 | 2007-06-13 | I/oデバイス切り替え方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008310489A JP2008310489A (ja) | 2008-12-25 |
JP5080140B2 true JP5080140B2 (ja) | 2012-11-21 |
Family
ID=40133413
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007156339A Expired - Fee Related JP5080140B2 (ja) | 2007-06-13 | 2007-06-13 | I/oデバイス切り替え方法 |
Country Status (2)
Country | Link |
---|---|
US (2) | US7809977B2 (ja) |
JP (1) | JP5080140B2 (ja) |
Families Citing this family (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090125901A1 (en) * | 2007-11-13 | 2009-05-14 | Swanson Robert C | Providing virtualization of a server management controller |
US7925917B1 (en) | 2008-04-03 | 2011-04-12 | United Services Automobile Association (Usaa) | Systems and methods for enabling failover support with multiple backup data storage structures |
WO2009144824A1 (ja) * | 2008-05-30 | 2009-12-03 | 富士通株式会社 | 情報処理装置、転送回路及び情報処理装置のエラー制御方法 |
JP5180729B2 (ja) * | 2008-08-05 | 2013-04-10 | 株式会社日立製作所 | 計算機システム及びバス割当方法 |
JP5380978B2 (ja) * | 2008-09-26 | 2014-01-08 | 富士通株式会社 | 伝送装置、伝送装置の制御方法および伝送装置の制御プログラム |
JP5272265B2 (ja) * | 2008-09-29 | 2013-08-28 | 株式会社日立製作所 | Pciデバイス共有方法 |
US8902733B2 (en) | 2008-12-02 | 2014-12-02 | Nec Corporation | Communication network management system, method and program, and management computer |
US8711678B2 (en) * | 2008-12-02 | 2014-04-29 | Nec Corporation | Communication network management system, method and program, and management computer |
JP5401679B2 (ja) * | 2009-02-19 | 2014-01-29 | 株式会社日立製作所 | 計算機システム、管理方法及び管理サーバ |
WO2010113215A1 (ja) * | 2009-03-31 | 2010-10-07 | 富士通株式会社 | 固有識別情報管理装置、情報処理装置及び固有識別情報の設定方法 |
JP5074457B2 (ja) * | 2009-06-04 | 2012-11-14 | 株式会社日立製作所 | 計算機システム、スイッチ切り替え方法及びpciスイッチ |
RU2524857C2 (ru) * | 2009-09-16 | 2014-08-10 | Сименс Акциенгезелльшафт | Способ работы подстанции системы электроснабжения |
JP5266590B2 (ja) | 2009-09-18 | 2013-08-21 | 株式会社日立製作所 | 計算機システムの管理方法、計算機システム及びプログラム |
JP5069732B2 (ja) * | 2009-10-05 | 2012-11-07 | 株式会社日立製作所 | 計算機装置、計算機システム、アダプタ承継方法 |
EP2511827B1 (en) * | 2009-12-07 | 2015-12-02 | Fujitsu Limited | Information system |
JP2011191854A (ja) * | 2010-03-12 | 2011-09-29 | Hitachi Ltd | 計算機システム、計算機システムの制御方法及びプログラム |
US8717878B2 (en) * | 2010-03-25 | 2014-05-06 | Canon Kabushiki Kaisha | Providing feedback information when network streaming over multiple physical interfaces |
US8369349B2 (en) * | 2010-03-25 | 2013-02-05 | Canon Kabushiki Kaisha | Network streaming over multiple physical interfaces using feedback information |
US8375139B2 (en) | 2010-06-28 | 2013-02-12 | Canon Kabushiki Kaisha | Network streaming over multiple data communication channels using content feedback information |
US8990443B2 (en) | 2010-12-14 | 2015-03-24 | Hitachi, Ltd. | Computer system and management server |
TWI437426B (zh) * | 2011-07-08 | 2014-05-11 | Quanta Comp Inc | 伺服器機櫃系統 |
CN102955502B (zh) * | 2011-08-25 | 2017-05-17 | 赛恩倍吉科技顾问(深圳)有限公司 | 背板接口电路、硬盘背板及服务器*** |
JP5634379B2 (ja) * | 2011-10-27 | 2014-12-03 | 株式会社日立製作所 | 計算機システムおよび計算機システムの情報保存方法 |
CN104603701B (zh) * | 2012-09-05 | 2017-03-08 | 三菱电机株式会社 | 输入输出响应控制设定装置 |
JP6200707B2 (ja) * | 2013-06-28 | 2017-09-20 | 富士通株式会社 | スイッチおよび制御方法 |
WO2015011895A1 (ja) * | 2013-07-23 | 2015-01-29 | 日本電気株式会社 | 情報処理装置、i/oシステム、及び、i/o制御方法 |
US10310745B2 (en) | 2017-05-19 | 2019-06-04 | Samsung Electronics Co., Ltd. | Method and apparatus for fine tuning and optimizing NVMe-oF SSDs |
JP6528868B1 (ja) * | 2018-02-13 | 2019-06-12 | オムロン株式会社 | セッション制御装置、セッション制御方法及びプログラム |
JP6528869B1 (ja) * | 2018-02-13 | 2019-06-12 | オムロン株式会社 | セッション制御装置、セッション制御方法及びプログラム |
US11023402B2 (en) * | 2019-07-02 | 2021-06-01 | National Instruments Corporation | Switch pruning in a switch fabric bus chassis |
JP7179810B2 (ja) * | 2020-10-27 | 2022-11-29 | 株式会社日立製作所 | クラスタシステム、クラスタシステムのフェイルオーバー制御方法 |
JP7338608B2 (ja) * | 2020-10-30 | 2023-09-05 | 横河電機株式会社 | 装置、方法およびプログラム |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5374329A (en) * | 1976-12-14 | 1978-07-01 | Nec Corp | Change-over system in trouble of electronic computer system |
US5313584A (en) * | 1991-11-25 | 1994-05-17 | Unisys Corporation | Multiple I/O processor system |
JP2912802B2 (ja) * | 1993-10-14 | 1999-06-28 | 富士通株式会社 | ディスクアレイ装置の故障対処方法および装置 |
JP3595099B2 (ja) * | 1997-03-17 | 2004-12-02 | 富士通株式会社 | デバイスアレイ・システム |
JP4461511B2 (ja) * | 1999-06-09 | 2010-05-12 | 株式会社日立製作所 | ディスクアレイ装置及びディスク装置へのデータ読み出し/書き込み方式 |
JP3684419B2 (ja) * | 1999-06-16 | 2005-08-17 | 日本電気株式会社 | 多重化構成自動復旧システム |
JP2002215473A (ja) * | 2001-01-23 | 2002-08-02 | Mitsubishi Electric Corp | 情報処理装置及び多重化方式 |
JP2004272527A (ja) * | 2003-03-07 | 2004-09-30 | Hitachi Ltd | ディスクアレイ装置および障害回復制御方法 |
US20040181707A1 (en) * | 2003-03-11 | 2004-09-16 | Hitachi, Ltd. | Method and apparatus for seamless management for disaster recovery |
US7661014B2 (en) * | 2003-04-23 | 2010-02-09 | Dot Hill Systems Corporation | Network storage appliance with integrated server and redundant storage controllers |
JP4653965B2 (ja) * | 2004-04-08 | 2011-03-16 | 株式会社日立製作所 | 入出力インタフェースモジュールの管理方法 |
JP2005301638A (ja) * | 2004-04-12 | 2005-10-27 | Hitachi Ltd | ディスクアレイ装置及びディスクアレイ装置のリザーブ解除制御方法 |
JP4303187B2 (ja) * | 2004-11-10 | 2009-07-29 | 富士通株式会社 | プログラム、記憶制御方法及び記憶装置 |
JP4969791B2 (ja) * | 2005-03-30 | 2012-07-04 | 株式会社日立製作所 | ディスクアレイ装置およびその制御方法 |
JP2007087039A (ja) * | 2005-09-21 | 2007-04-05 | Hitachi Ltd | ディスクアレイシステム及びその制御方法 |
US20080114961A1 (en) * | 2006-11-15 | 2008-05-15 | Cisco Technology, Inc. | Transparent device switchover in a storage area network |
-
2007
- 2007-06-13 JP JP2007156339A patent/JP5080140B2/ja not_active Expired - Fee Related
- 2007-09-20 US US11/902,364 patent/US7809977B2/en not_active Expired - Fee Related
-
2010
- 2010-08-31 US US12/872,713 patent/US8156367B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US8156367B2 (en) | 2012-04-10 |
US7809977B2 (en) | 2010-10-05 |
US20100325477A1 (en) | 2010-12-23 |
US20080313362A1 (en) | 2008-12-18 |
JP2008310489A (ja) | 2008-12-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5080140B2 (ja) | I/oデバイス切り替え方法 | |
JP5068056B2 (ja) | 障害回復方法、計算機システム及び管理サーバ | |
JP4572250B2 (ja) | 計算機切り替え方法、計算機切り替えプログラム及び計算機システム | |
US8074099B2 (en) | Failure recovery method, failure recovery program and management server | |
US8010827B2 (en) | Method and computer system for failover | |
JP4448878B2 (ja) | 障害回復環境の設定方法 | |
JP5877552B1 (ja) | ストレージシステム及びリソース割当て方法 | |
JP4462024B2 (ja) | ディスク引き継ぎによるフェイルオーバ方法 | |
JP5216336B2 (ja) | 計算機システム、管理サーバ、および、不一致接続構成検知方法 | |
JP2007072571A (ja) | 計算機システム及び管理計算機ならびにアクセスパス管理方法 | |
US11226753B2 (en) | Adaptive namespaces for multipath redundancy in cluster based computing systems | |
US20130201992A1 (en) | Information processing system and information processing apparatus | |
US9448615B2 (en) | Managing power savings in a high availability system at a redundant component level of granularity | |
JP2010003061A (ja) | 計算機システム及びそのi/o構成変更方法 | |
JP2013073289A (ja) | 多重化システム、データ通信カード、状態異常検出方法、及びプログラム | |
JP5316616B2 (ja) | 業務引き継ぎ方法、計算機システム、及び管理サーバ | |
JPWO2013108386A1 (ja) | 計算機システムの管理方法、計算機システム及び記憶媒体 | |
JP5266347B2 (ja) | 引継方法、計算機システム及び管理サーバ | |
US11755438B2 (en) | Automatic failover of a software-defined storage controller to handle input-output operations to and from an assigned namespace on a non-volatile memory device | |
JP4877368B2 (ja) | ディスク引き継ぎによるフェイルオーバ方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100222 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111228 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120105 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120301 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120807 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120830 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150907 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5080140 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |