JP5773166B2

JP5773166B2 - 計算機の制御方法、計算機及び計算機システム

Info

Publication number: JP5773166B2
Application number: JP2012086306A
Authority: JP
Inventors: 輝昌上畑
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 2012-04-05
Filing date: 2012-04-05
Publication date: 2015-09-02
Anticipated expiration: 2032-04-05
Also published as: EP2648095B1; EP2648095A2; EP2648095A3; JP2013218400A; US20130268745A1

Description

本発明は、少なくとも２つ以上の計算機をネットワーク経由で個別に起動することができるコンピュータシステムで、計算機間で処理を引き継ぐ場合の起動時の制御方法の改良に関する。

サーバを冗長構成し、稼働中の現用系サーバに故障や障害などが発生したときに、予備として用意しておいた予備系サーバに処理を引き継がせる障害回復機能を有する計算機システムが広く採用されている。障害回復機能では、故障が発生した時点の現用系サーバの設定を予備系サーバに自動的に設定する必要がある。

ネットワーク機器やストレージ機器等を引き継ぐ方法としてホストバスアダプタ（ＨｏｓｔＢｕｓＡｄａｐｔｅｒ）を使用する方法がある。

ＨＢＡは、ホストシステム（コンピュータ）と他のネットワーク機器やストレージ機器を接続するハードウェアである。各ＨＢＡにはユニークなワールドワイドネーム（World Wide Name：ＷＷＮ) が付与されている。このＷＷＮを予備系サーバのＨＢＡが引き継ぐことによって予備系のサーバは、現用系のサーバが使用していたストレージ機器を引き継ぐことができる（例えば、特許文献１）。

また、ネットワーク経由で計算機を起動させる技術としては、マジックパケットを制御対象の計算機のＮＩＣ（Network Interface Card）へ送信することで、計算機の電源を投入するＷａｋｅＯｎＬＡＮ（以下、ＷＯＬ）という技術が知られている（例えば、特許文献２）。

特開２０１０−０３３４０３号公報国際公開第２００８／１１７４７２号

近年、ＭＡＣアドレスを書き換えるインターフェースを備えたネットワークインターフェースカード（Network Interface Card：NIC）が用いられている。

現用系サーバ（現用系計算機）の故障時に予備系サーバ（予備系計算機）へ処理を引き継がせる場合、ＭＡＣアドレスを引き継ぐことによって、ネットワークインターフェースカードでも上述のＨＢＡと同様に、予備系のサーバは現用系のサーバが使用していたネットワークを利用することができる。

障害回復機能を有する計算機システムで、稼働中の現用系サーバに故障が発生して予備系サーバに、ＭＡＣアドレスの引継ぎを行う場合、故障した現用系サーバの業務を予備系のサーバで引き継いで、現用系のサーバを停止させると、ＭＡＣアドレスを引き継いだ予備系サーバと現用系のサーバが同じＭＡＣアドレスを持つ場合があった。この状態でユーザ端末などがＷＯＬでサーバを起動させようとした場合、故障した現用系のサーバが意図せず起動してしまう、という問題があった。

そこで、本発明は、サーバの引き継ぎを行った後に、意図しないサーバが起動するのを抑止することを目的とする。

上記課題を解決するための本発明の一例は以下のとおりである。プロセッサと、メモリと、識別子を設定される通信デバイスと、ハードウェアの構成を管理する構成管理部と、を備えた計算機であって、前記構成管理部は、前記通信デバイスの識別子を受信し、前記受信した識別子と、前記通信デバイスに設定された識別子とを比較して、前記受信した識別子と前記通信デバイスに設定された識別子とが不一致のときには、前記受信した識別子で前記通信デバイスに設定された識別子を書き換え、前記通信デバイスは、所定の情報を受信したときには前記構成管理部に前記計算機の起動を要求する起動制御部と、前記計算機の起動を要求したときには前記起動制御部が所定値を設定する起動情報と、を有し、前記構成管理部は、前記受信した識別子と前記通信デバイスに設定された識別子とが不一致のときには、前記起動情報の値が前記所定値であるか否かを判定し、前記起動情報の値が前記所定値であれば前記計算機の電源を遮断する。

したがって、本発明は、現用系の計算機から予備系の計算機へＭＡＣアドレスを引き継ぐ場合において、ＷＯＬのマジックパケットが送信されても、意図しないタイミングでの計算機の起動を抑止できる。

本発明の実施形態を示し、障害回復処理を行う計算機システムの一例を示すブロック図である。本発明の実施形態を示し、サーバと管理モジュールの一例を示すブロック図である。本発明の実施形態を示し、管理モジュールで行われる障害回復処理の一例を示すフローチャートである。本発明の実施形態を示し、障害発生前のＭＡＣアドレス管理テーブルの一例を示す図である。本発明の実施形態を示し、障害発生前のサーバ１のＭＡＣアドレスの一例を示す図である。本発明の実施形態を示し、障害発生前のサーバ２のＭＡＣアドレスの一例を示す図である。本発明の実施形態を示し、障害回復処理後のＭＡＣアドレス管理テーブルの一例を示す図である。本発明の実施形態を示し、障害回復処理後のサーバ１のＭＡＣアドレスの一例を示す図である。本発明の実施形態を示し、障害回復処理後のサーバ２のＭＡＣアドレスの一例を示す図である。本発明の実施形態を示し、障害が発生したサーバに対するＭＡＣアドレス設定処理のシーケンス図である。本発明の実施形態を示し、現用系を引き継ぐ予備系のサーバに対するＭＡＣアドレス設定処理のシーケンス図である。本発明の実施形態を示し、サーバで行われるＭＡＣアドレス設定処理の一例を示すフローチャートである。

以下、本発明の一実施形態を添付図面に基づいて説明する。

図１は、本発明の実施形態を示し、障害回復処理を行う計算機システムの一例を示すブロック図である。計算機システム１０１は、サーバ１（１１０−１）と、サーバ２（１１０−２）と、これらのサーバ１、２を制御する管理モジュール１５０と、管理モジュール１５０とサーバ１、２とを接続する管理ネットワーク２１０と、サーバ１、２とユーザ端末１８０を接続する業務ネットワーク２２０から構成される。

サーバ１（１１０−１）とサーバ２（１１０−２）は、ＭＡＣアドレスを書き換え可、能かつＷＯＬ（Wake On LAN）に対応したＮＩＣ（Network Interface Card）１２０−１、１２０−２をそれぞれ備える。ユーザ端末１８０は、業務ネットワーク２２０を介してマジックパケットを送信することで、サーバ１（１１０−１）またはサーバ２（１１０−２）の電源を投入することができる。

なお、以下ではサーバの総称を符号１１０で表し、現用系はサーバ１とし、予備系はサーバ２とする。管理モジュール１５０は後述するようにサーバ１１０を監視して障害回復処理を行う。

サーバ１は、ハードウェアを制御するファームウェアとしてのＢＩＯＳ（Basic I/O System）１１３−１と、管理モジュール１５０からの指令に応じてサーバ１のＢＩＯＳ１１３−１を介してハードウェアの制御や設定を行うＢＭＣ（Basement Management Controller）１１４−１を含む。サーバ２も同様であり、ハードウェアを制御するファームウェアとしてのＢＩＯＳ１１３−２と、管理モジュール１５０からの指令に応じてサーバ２のＢＩＯＳ１１３−２を介してハードウェアの制御や設定を行うＢＭＣ１１４−２を含む。

なお、以下ではＮＩＣの総称を符号１２０で表し、また、ＢＩＯＳの総称を符号１１３で表し、ＢＭＣの総称を符号１１４で表す。

図２は、本発明における管理モジュール１５０とサーバ１１０の詳細な構成を示すブロック図である。サーバ１とサーバ２は同一の構成であるので、サーバ１１０として図示した。サーバ１１０には、ＣＰＵ（プロセッサ）１１１、メモリ１１２、ＢＩＯＳ１１３、ＢＭＣ１１４、ＮＩＣ１２０が含まれる。

ＮＩＣ１２０には記憶部１２１と、ＷＯＬフラグ制御部（起動制御部）１２４が含まれる。記憶部１２１には、ＭＡＣアドレス１２２、ＷＯＬフラグ（起動情報）１２３が格納される。なお、各ＮＩＣ１２０のＭＡＣアドレス１２２は、ＮＩＣ１２０−１はＭＡＣアドレス１２２−１で表し、ＮＩＣ１２０−２はＭＡＣアドレス１２２−２で表す。

管理モジュール１５０には管理モジュールコントローラ１６０とＭＡＣアドレス管理テーブル記憶領域１７０が含まれる。管理モジュールコントローラ１６０にはＭＡＣアドレス１２２の変更を管理するＢＩＯＳ要求管理部１６１と、障害回復処理を行う障害管理部１６２が含まれる。ＭＡＣアドレス管理テーブル記憶領域１７０にはＭＡＣアドレス管理テーブル（識別子管理情報）４００が格納される。

ＢＩＯＳ要求管理部１６１は、ＢＭＣ１１４を介してＢＩＯＳ１１３にデータの転送が可能である。ユーザ端末１８０とＮＩＣ１２０は業務ネットワーク２２０で接続されている。ユーザ端末１８０はＮＩＣ１２０へマジックパケットを送信することができる。マジックパケットは、サーバ１１０のＮＩＣ１２０に割り当てられているＭＡＣアドレス１２２を１６回繰り返す。

ＮＩＣ１２０のＷＯＬフラグ制御部（起動制御部）１２４は、受信したマジックパケットのＭＡＣアドレス１２２と記憶部１２１に格納されているＭＡＣアドレス１２２−１、１２２−２が一致すれば、ＷＯＬフラグ（起動情報）１２３を「１」（所定値）にセットして、サーバ１１０の電源をＯＮにする指令をＢＩＯＳ１１３へ送信する。

ＢＩＯＳ１１３は、ＮＩＣ１２０またはＢＭＣ１１４から電源ＯＮの要求を受け付けるとサーバ１１０の電源を投入する。また、ＢＩＯＳ１１３は、ＢＭＣ１１４から電源ＯＦＦの要求を受け付けるとサーバ１１０の電源を遮断する。なお、ＢＩＯＳ１１３は、サーバ１１０の電源制御やデバイスの設定などのハードウェアの構成を管理するファームウェア（構成管理部）として機能する。ＢＩＯＳ１１３はＣＰＵ１１１で実行される。

ここで、管理モジュール１１５の管理モジュールコントローラ１６０は、図示しないＣＰＵ（プロセッサ）とメモリを備えて、ＢＩＯＳ要求管理部１６１と障害管理部１６２をメモリにロードしてＣＰＵで実行する。

管理モジュールコントローラ１６０のＣＰＵは、各機能部のプログラムに従って動作することによって、所定の機能を実現する機能部として動作する。例えば、ＣＰＵは、障害管理プログラムに従って動作することで障害管理部１６２として機能する。他のプログラムについても同様である。さらに、ＣＰＵは、各プログラムが実行する複数の処理のそれぞれを実現する機能部としても動作する。計算機及び計算機システムは、これらの機能部を含む装置及びシステムである。

管理モジュールコントローラ１６０の各機能を実現するプログラム、テーブル等の情報は、ストレージサブシステムや不揮発性半導体メモリ、ハードディスクドライブ、ＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）等の記憶デバイス、または、ＩＣカード、ＳＤカード、ＤＶＤ等の計算機読み取り可能な非一時的データ記憶媒体に格納することができる。また、ＭＡＣアドレス管理テーブル記憶領域１７０は、上述のストレージサブシステムや不揮発性半導体メモリ、ハードディスクドライブに設定することができる。

図３は、管理モジュールコントローラ１６０の障害管理部１６２とＢＩＯＳ要求管理部１６１で行われる障害回復処理の一例を示すフローチャートである。

管理モジュールコントローラ１６０の障害管理部１６２は、サーバ１で障害を検出したときにサーバ１の処理をサーバ２へ引き継ぐため、サーバ１の電源をＯＦＦにしてサーバ２の電源をＯＮにする処理である。この処理は、障害管理部１６２がサーバ１１０で障害を検知したときに実行される。なお、サーバ１１０の障害の検知は、公知または周知の技術を適用すればよいので、ここでは詳述しない。

障害管理部１６２はサーバ１で障害を検出（ステップ３１０）した後で、サーバ１の電源をＯＦＦにするようＢＭＣ１１４−１に指令する（ステップ３２０）。ＢＭＣ１１４−１は、管理モジュール１５０から電源遮断要求を受信すると、ＢＩＯＳ１１３−１に電源遮断を指令し、サーバ１の電源を遮断させる。

障害管理部１６２は、ＭＡＣアドレス管理テーブル記憶領域１７０に保存されているＭＡＣアドレス管理テーブル４００のサーバ１とサーバ２のＭＡＣアドレスを交換する（ステップ３３０）。障害管理部１６２は、サーバ２の電源をＯＮにする要求をＢＭＣ１１４−２に送信する。ＢＭＣ１１４−２は、管理モジュール１５０から電源ＯＮの要求を受信すると、ＢＩＯＳ１１３−２に電源供給開始を指令し、サーバ２の電源をＯＮにして起動させる（ステップ３４０）。

次に、ＢＩＯＳ要求管理部１６１は、ＭＡＣアドレス管理テーブル記憶領域１７０に格納されているＭＡＣアドレス管理テーブル４００からサーバ１とサーバ２の新たなＭＡＣアドレス４１２をそれぞれのＢＭＣ１１４−１、１１４−２に転送する（ステップ３５０）。

サーバ２のＢＭＣ１１４−２は、ＢＩＯＳ１１３−２からの要求に応じて新たなＭＡＣアドレス４１２を送信し、ＢＩＯＳ１１３−２はサーバ２のＮＩＣ１２０−２に新たなＭＡＣアドレス４１２を設定する。

上記の処理ではサーバ２のＮＩＣ１２０−２には、ステップ３３０で切り替えられた新たなＭＡＣアドレス４１２、換言すればサーバ１のＮＩＣ１２０−１のＭＡＣアドレス１２２−１が設定され、サーバ１の処理を引き継ぐことができる。

一方、電源を遮断したサーバ１のＮＩＣ１２０−１は、ＭＡＣアドレス管理テーブル４００上ではサーバ２のＭＡＣアドレス１２２−２に切り替えられている。しかし、サーバ１はＭＡＣアドレスの切り替え以前に電源を遮断しているので、ＮＩＣ１２０−１のＭＡＣアドレス１２２−１は変更されていない。

図４Ａは障害発生前のＭＡＣアドレス管理テーブル記憶領域１７０に保存されるＭＡＣアドレス管理テーブル４００の一例を示す図である。図４Ｂは障害発生前の現用系サーバ１のＭＡＣアドレスの一例を示す図である。図４Ｃは、障害発生前の予備系サーバ２のＭＡＣアドレスの一例を示す図である。

ＭＡＣアドレス管理テーブル４００は、サーバ１１０の識別子を格納するＩＤ４１１と、サーバ１１０に割り当てたＭＡＣアドレス４１２と、サーバ１１０が現用系と予備（または待機）系の何れであるかを格納する系４１３からひとつのエントリが構成される。

サーバ１のＮＩＣ１２０−１の記憶部１２１に保存されている障害発生前のＭＡＣアドレス１２２−１（ＡＡ：ＡＡ:ＡＡ：ＡＡ:ＡＡ：ＡＡ）は、図４Ｂのように、ＭＡＣアドレス管理テーブル４００と一致する。

サーバ２のＮＩＣ１２０−２の記憶部１２１に保存されている障害発生前のＭＡＣアドレス１２２−２（ＢＢ：ＢＢ：ＢＢ：ＢＢ：ＢＢ：ＢＢ）は、図４Ｃのように、ＭＡＣアドレス管理テーブル４００と一致する。

なお、本実施例では、サーバ１とサーバ２のＭＡＣアドレス１２２−１、１２２−２の一例として、それぞれＡＡ：ＡＡ:ＡＡ：ＡＡ:ＡＡ：ＡＡ、ＢＢ：ＢＢ：ＢＢ：ＢＢ：ＢＢ：ＢＢを用いて説明するが、ＭＡＣアドレスの内容はこの例に限定されない。

図５Ａは、障害発生後のＭＡＣアドレス管理テーブル記憶領域１７０に保存されるＭＡＣアドレス管理テーブル４００Ａの一例を示す図である。図５Ｂは、障害回復処理後のサーバ１のＭＡＣアドレスの一例を示す図である。図５Ｃは、障害回復処理後のサーバ２のＭＡＣアドレスの一例を示す図である。

現用系のサーバの処理を引き継いだサーバ２のＮＩＣ１２０−２に保存されている障害発生後のＭＡＣアドレス１２２−２（ＡＡ：ＡＡ：ＡＡ：ＡＡ：ＡＡ：ＡＡ）は、図５Ｃのように、ＭＡＣアドレス管理テーブル４００Ａと一致する。管理モジュールコントローラ１６０の障害管理部１６２はステップ３３０でＭＡＣアドレス管理テーブル４００の現用系のＭＡＣアドレス（ＡＡ：ＡＡ：ＡＡ：ＡＡ：ＡＡ：ＡＡ）と予備系のＭＡＣアドレス（ＢＢ：ＢＢ：ＢＢ：ＢＢ：ＢＢ：ＢＢ）とを交換し、図５ＡのＭＡＣアドレス管理テーブル４００Ａのようになる。

ＢＩＯＳ要求管理部１６１は、ＭＡＣアドレス管理テーブル記憶領域１７０に格納されているＭＡＣアドレス管理テーブル４００Ａに基づいて、サーバ１のＢＭＣ１１４−１に新たなＭＡＣアドレス（ＢＢ：ＢＢ：ＢＢ：ＢＢ：ＢＢ：ＢＢ）を、サーバ２のＢＭＣ１１４−２に新たなＭＡＣアドレス（ＡＡ：ＡＡ：ＡＡ：ＡＡ：ＡＡ：ＡＡ）を送信する（ステップ３５０）。

サーバ２のＢＭＣ１１４−２は、ＭＡＣアドレス管理テーブル４００Ａに従いＮＩＣ１２０−２のＭＡＣアドレス１２２−２を新たなＭＡＣアドレス（ＡＡ：ＡＡ：ＡＡ：ＡＡ：ＡＡ：ＡＡ）で書き換える。

しかしサーバ１のＢＭＣ１１４−１は、ステップ３２０で電源をＯＦＦにされたので、ＭＡＣアドレス１２２−１（ＡＡ：ＡＡ：ＡＡ：ＡＡ：ＡＡ：ＡＡ）を書き換えることができない。そのため、障害回復処理後のサーバ１のＭＡＣアドレス１２２−１（ＡＡ：ＡＡ：ＡＡ：ＡＡ：ＡＡ：ＡＡ）は、図５Ｂのように、ＭＡＣアドレス管理テーブル４００Ａと一致しない。

これにより、サーバ２のＮＩＣ１２０−２とサーバ１のＮＩＣ１２０−１のＭＡＣアドレス１２２は、図５Ｂ、図５Ｃのように同じＭＡＣアドレス（ＡＡ：ＡＡ：ＡＡ：ＡＡ：ＡＡ：ＡＡ）をもつことになる。

図５Ｂ、図５Ｃの状態でサーバ２も停止させた後、ユーザ端末１８０からサーバ２をＷＯＬで起動させるためにマジックパケットを送信すると、同じＭＡＣアドレスを有する２つのサーバ１、サーバ２の両方のサーバの電源が投入されることになる。

ＮＩＣ１２０の記憶部１２１に記憶されているＭＡＣアドレス１２２とマジックパケットで送られてきたＭＡＣアドレスが一致していればサーバ１１０の電源が投入される。このため、障害が発生したサーバ１も一時的に電源ＯＮになるが、本発明では後述の処理によって、ＭＡＣアドレスが重複する複数のサーバ１１０が意図しないタイミングで起動（例えば同時起動）するのを抑止する。

図６は、障害が発生したサーバ１にＭＡＣアドレスを設定する処理のシーケンス図である。このシーケンス図は、図３の障害回復処理後の処理を示し、ユーザ端末１８０からＷＯＬを行った例である。

まず、管理モジュール１５０のＢＩＯＳ要求管理部１６１が、ＭＡＣアドレスの設定を開始して（６０１）、現用系のサーバ１の新たなＭＡＣアドレスをサーバ１のＢＭＣ１１４−１へ通知する（６０２）。このＭＡＣアドレスの設定処理は、図３のステップ３５０の処理に相当する。障害が発生したサーバ１は、図３の障害回復処理で電源を遮断しているので、ＢＭＣ１１４−１のみが稼働しており、ＢＩＯＳ１１３−１は起動していない。この状態で、ユーザ端末１８０からマジックパケット６０３が送信される（６０３）。

上述のように、サーバ１のＭＡＣアドレス１２２−１とサーバ２のＭＡＣアドレス１２２−２は、同一のＭＡＣアドレス（ＡＡ：ＡＡ：ＡＡ：ＡＡ：ＡＡ：ＡＡ）を有する。ＮＩＣ１２０−１のＷＯＬフラグ制御部１２４は、マジックパケット６０３のＭＡＣアドレスと自身のＭＡＣアドレス１２２−１が一致するので、ＷＯＬフラグ１２３を「１」にセットする（６０４）。そして、ＮＩＣ１２０−１はサーバ１のＢＩＯＳ１１３−１に対して、電源をＯＮにするよう要求する（６０５）。

ＢＩＯＳ１１３−１は、ＮＩＣ１２０−１からの電源ＯＮの要求を受信すると、サーバ１の電源をＯＮにする（６０６）。次にＢＩＯＳ１１３−１は、ＢＭＣ１１４−１にＭＡＣアドレス取得要求を送信する（６０７）。ＢＭＣ１１４−１は、ステップ６０２の障害回復処理で管理モジュール１５０から受信した新たなＭＡＣアドレス（ＢＢ：ＢＢ：ＢＢ：ＢＢ：ＢＢ：ＢＢ）をＢＩＯＳ１１３−１へ転送する（６０８）。

ＢＩＯＳ１１３−１は、ＮＩＣ１２０−１に新たなＭＡＣアドレス（ＢＢ：ＢＢ：ＢＢ：ＢＢ：ＢＢ：ＢＢ）を通知し（６０９）、記憶部１２１のＭＡＣアドレス１２２−１に新たなＭＡＣアドレス（ＢＢ：ＢＢ：ＢＢ：ＢＢ：ＢＢ：ＢＢ）を設定する（６１０）。

そして、ＢＩＯＳ１１３−１は、ＮＩＣ１２０−１のＷＯＬフラグ１２３の値が「１」であればサーバ１の電源を遮断する（６１１、６１２）。

以上の処理によって障害回復処理で停止したサーバ１は、予備系のサーバ２と重複するＭＡＣアドレス１２２−１を有するため、ＷＯＬで電源が投入される。電源が投入された際には、ＢＩＯＳ１１３−１が新たなＭＡＣアドレスをＢＭＣ１１４−１に要求して、ＮＩＣ１２０−１のＭＡＣアドレス１２２−１を更新することができる。その後、ＢＩＯＳ１１３−１は障害が発生したサーバ１を停止させることができる。

したがって、障害発生により停止していたサーバ１１０がＷＯＬで電源がＯＮになっても、新たなＭＡＣアドレスに更新することにより、サーバ間でＭＡＣアドレスが重複するのを解消し、ＭＡＣアドレスが重複する複数のサーバ１１０が意図せず起動するのを抑止できる。

図７は、現用系のサーバ１を引き継ぐサーバ２にＭＡＣアドレスを設定する処理のシーケンス図である。このシーケンス図は、図３の障害回復処理後の処理を示す。

まず、管理モジュールコントローラ１６０の障害管理部１６２は、サーバ２に電源をＯＮにする要求を送信する（７０１、７０２）。この処理は、図３のステップ３４０に相当する。次に管理モジュールコントローラ１６０のＢＩＯＳ要求管理部１６１が、ＭＡＣアドレスの設定を開始して（７０３）、予備系のサーバ２の新たなＭＡＣアドレス（ＡＡ：ＡＡ：ＡＡ：ＡＡ：ＡＡ：ＡＡ）をＢＭＣ１１４−２へ通知する（７０４）。このＭＡＣアドレスの設定処理は、図３のステップ３５０の処理に相当する。

サーバ２のＢＩＯＳ１１３−２は、ＢＭＣ１１４−２から電源ＯＮの要求を受信すると電源をＯＮにしてサーバ２を起動する（７０５、７０６）。

次にＢＩＯＳ１１３−２は、ＢＭＣ１１４−２にＭＡＣアドレス取得要求を送信する（７０７）。ＢＭＣ１１４−２は、ステップ７０４の障害回復処理で管理モジュール１５０から受信した新たなＭＡＣアドレス（ＡＡ：ＡＡ：ＡＡ：ＡＡ：ＡＡ：ＡＡ）をＢＩＯＳ１１３−２へ転送する（７０８）。

ＢＩＯＳ１１３−２は、ＮＩＣ１２０−２に新たなＭＡＣアドレス（ＡＡ：ＡＡ：ＡＡ：ＡＡ：ＡＡ：ＡＡ）を通知し（７０９）、記憶部１２１のＭＡＣアドレス１２２−２に新たなＭＡＣアドレス（ＡＡ：ＡＡ：ＡＡ：ＡＡ：ＡＡ：ＡＡ）を設定する（７１０）。

以上の処理によって、障害が発生したサーバ１を停止させた後に起動した予備系のサーバ２は、管理モジュール１５０から受信した新たなＭＡＣアドレス（ＡＡ：ＡＡ：ＡＡ：ＡＡ：ＡＡ：ＡＡ）でＮＩＣ１２０−２のＭＡＣアドレス１２２−２を更新し、現用系のサーバ１の処理を引き継ぐことができる。

図８は、サーバで行われるＭＡＣアドレス設定処理の一例を示すフローチャートである。この処理は、サーバ１１０の起動時に実行される。

まず、サーバ１１０のＢＩＯＳ１１３は、ＢＭＣ１１４からの電源ＯＮにする要求や、ＮＩＣ１２０へのマジックパケットなどによって電源を投入して起動する（８０１）。なお、ＷＯＬでサーバ１１０を起動したときには、ＷＯＬフラグ制御部１２４がＷＯＬフラグ１２３を「１」にセットする。

次に、ＢＩＯＳ１１３は、ＢＭＣ１１４に対してＭＡＣアドレスの取得要求を送信し、ＢＭＣ１１４は新たなＭＡＣアドレスがあればＢＩＯＳ１１３へ転送する。ＢＩＯＳ１１３はＢＭＣ１１４から新たなＭＡＣアドレスを取得する（８０２）。

次に、ＢＩＯＳ１１３は、ＢＭＣ１１４から取得したＭＡＣアドレスと、ＮＩＣ１２０に設定されたＭＡＣアドレス１２２が一致するか否かを判定する（８０３）。ＢＭＣ１１４から取得したＭＡＣアドレスと、ＮＩＣ１２０に設定されたＭＡＣアドレス１２２が一致する場合には、正常な起動と判定して処理を終了する。

一方、ＢＭＣ１１４から取得したＭＡＣアドレスと、ＮＩＣ１２０に設定されたＭＡＣアドレス１２２が不一致である場合には、ステップ８０４へ進む。この不一致である場合とは、ステップ３２０において自身のサーバの電源がＯＦＦになったので、ＮＩＣ１２０に設定されたＭＡＣアドレス１２２を、ＢＩＯＳ要求管理部１６１から自身のサーバに送信された新たなＭＡＣアドレスに書き換えていない状態を示している。すなわち、自身のサーバ（サーバ１）と他のサーバ（サーバ２）とでＭＡＣアドレスが重複している状態を示す。

ＢＩＯＳ１１３は、ＢＭＣ１１４から取得したＭＡＣアドレスを、ＮＩＣ１２０のＭＡＣアドレス１２２に設定し、ＮＩＣ自身のＭＡＣアドレス１２２を更新する（８０４）。

次に、ＢＩＯＳ１１３は、ＮＩＣ１２０の記憶部１２１のＷＯＬフラグ１２３がセットされているか否かを判定する（８０５）。ＷＯＬフラグ１２３がクリアされていれば処理を終了し、ＷＯＬフラグ１２３がセットされていればサーバ１１０の電源をＯＦＦにする（８０６）。

以上の説明のように、本発明を適用した計算機システムによれば、図５Ａ〜図５Ｃの様にサーバ１のＮＩＣ１２０−１と、サーバ２のＮＩＣ１２０−２のＭＡＣアドレスが一致している場合に、ＷＯＬでサーバ１、サーバ２の両方が起動したとしても障害が発生したサーバが稼働状態になるのを抑止して、新たなＭＡＣアドレスに更新することができる。

なお、上記実施形態では、サーバ１１０の電源制御や監視あるいはＭＡＣアドレスの転送をＢＭＣ１１４で行う例を示したが、図示しないＳＶＰ（SerVice Processor）など、サーバのハードウェアの制御及び監視を行うサーバ制御モジュールで行っても良い。

また、上記実施形態では、サーバ１１０の電源制御やデバイスの設定などのハードウェアの構成を管理するファームウェア（構成管理部）としてＢＩＯＳを用いる例を示したが、ＵＥＦＩ（Unified Extensible Firmware Interface）を用いてもよい。

また、上記実施形態では、複数のサーバ１１０の障害回復処理を管理モジュール１５０で行う例を示したが、図示しない管理計算機で行うようにしても良い。

また、上記実施形態では、通信デバイスとしてＮＩＣ１２０を採用し、通信デバイスの識別子としてＭＡＣアドレスを採用した例を示したが、識別子を書き換え可能な通信デバイスであれば本発明を適用することができる。例えば、通信デバイスとしてＨＢＡ（Host Bus Adapter）を採用し、識別子としてＷＷＮ（World Wide Name）を採用することができる。

また、上記実施形態では、サーバ１の処理をサーバ２へ引き継ぐ契機を障害の発生とした例を示したが、障害の有無に限定されず、管理者やユーザの指令に応じる等、所定の条件においてサーバ間の引き継ぎを実行しても良い。

１１０サーバ
１１１ＣＰＵ
１１２メモリ
１１３ＢＩＯＳ
１１４ＢＭＣ
１２０ＮＩＣ
１２２ＭＡＣアドレス
１２３ＷＯＬフラグ
１２４ＷＯＬフラグ制御部
１５０管理モジュール
１６０管理モジュールコントローラ
１６１ＢＩＯＳ要求管理部
１６２障害管理部
１７０ＭＡＣアドレス管理テーブル記憶領域

Claims

プロセッサと、メモリと、識別子を設定される通信デバイスと、ハードウェアの構成を管理する構成管理部と、を備えた計算機であって、
前記構成管理部は、
前記通信デバイスの識別子を受信し、
前記受信した識別子と、前記通信デバイスに設定された識別子とを比較して、前記受信した識別子と前記通信デバイスに設定された識別子とが不一致のときには、前記受信した識別子で前記通信デバイスに設定された識別子を書き換え、
前記通信デバイスは、
所定の情報を受信したときには前記構成管理部に前記計算機の起動を要求する起動制御部と、
前記計算機の起動を要求したときには前記起動制御部が所定値を設定する起動情報と、を有し、
前記構成管理部は、
前記受信した識別子と前記通信デバイスに設定された識別子とが不一致のときには、前記起動情報の値が前記所定値であるか否かを判定し、前記起動情報の値が前記所定値であれば前記計算機の電源を遮断することを特徴とする計算機。
請求項１に記載の計算機であって、
前記通信デバイスは、ネットワークインターフェースを備えたことを特徴とする計算機。
請求項２に記載の計算機であって、
前記識別子は、ＭＡＣアドレスであることを特徴とする計算機。
請求項１に記載の計算機であって、
前記通信デバイスは、ホストバスアダプタであることを特徴とする計算機。
請求項４に記載の計算機であって、
前記識別子は、ワールドワイドネーム（ＷＷＮ）であることを特徴とする計算機。
プロセッサと、メモリと、識別子を設定される通信デバイスと、ハードウェアの構成を管理する構成管理部と、を備えた計算機の制御方法であって、
前記通信デバイスは、
所定の情報を受信したときには前記構成管理部に前記計算機の起動を要求する起動制御部と、前記計算機の起動を要求したときには前記起動制御部が所定値を設定する起動情報と、を有し、
前記構成管理部が、前記通信デバイスの識別子を受信する第１のステップと、
前記構成管理部が、前記受信した識別子と、前記通信デバイスに設定された識別子とを比較する第２のステップと、
前記構成管理部が、前記受信した識別子と前記通信デバイスに設定された識別子とが不一致のときには、前記受信した識別子を前記通信デバイスの識別子に設定する第３のステップと、
前記構成管理部は、前記受信した識別子と前記通信デバイスに設定された識別子とが不一致のときには、前記起動情報の値が前記所定値であるか否かを判定する第４のステップと、
前記構成管理部は、前記起動情報の値が前記所定値であれば前記計算機の電源をＯＦＦにする第５のステップと、
を含むことを特徴とする計算機の制御方法。
請求項６に記載の計算機の制御方法であって、
前記通信デバイスは、ネットワークインターフェースを備えたことを特徴とする計算機の制御方法。
請求項７に記載の計算機の制御方法であって、
前記識別子は、ＭＡＣアドレスであることを特徴とする計算機の制御方法。
請求項６に記載の計算機の制御方法であって、
前記通信デバイスは、ホストバスアダプタであることを特徴とする計算機の制御方法。
請求項９に記載の計算機の制御方法であって、
前記識別子は、ワールドワイドネーム（ＷＷＮ）であることを特徴とする計算機の制御方法。
プロセッサとメモリと識別子を設定される第１の通信デバイスとを備えた第１の計算機と、
プロセッサとメモリと識別子を設定される第２の通信デバイスとを備えた第２の計算機と、
所定の条件となったときには前記第１の計算機の処理を前記第２の計算機へ引き継がせる管理モジュールと、を備えた計算機システムであって、
前記管理モジュールは、
前記第１の通信デバイスの識別子と、前記第２の通信デバイスの識別子を管理する識別子管理情報を有し、
前記第１の計算機を監視して前記所定の条件となったとき、当該第１の計算機に電源の遮断を指令した後に、前記第２の計算機に電源の投入を指令し、前記識別子管理情報を参照して、前記第１の計算機に前記第２の通信デバイスの識別子を送信し、
前記第１の計算機は、前記第１の計算機の電源が投入されると、
受信した第２の通信デバイスの識別子と前記第１の通信デバイスに設定された識別子が不一致のときには、前記受信した第２の通信デバイスの識別子を前記第１の通信デバイスの識別子に設定し、
前記第１の通信デバイスは、
所定の情報を受信したときには前記第１の計算機の第１の構成管理部に前記第１の計算機の起動を要求する第１の起動制御部と、
前記第１の計算機の起動を要求したときには前記第１の起動制御部が所定値を設定する第１の起動情報と、を有し、
前記第１の構成管理部は、
前記受信した識別子と前記第１の通信デバイスに設定された識別子とが不一致のときには、前記第１の起動情報の値が前記所定値であるか否かを判定し、前記第１の起動情報の値が前記所定値であれば前記第１の計算機の電源を遮断し、
前記第２の通信デバイスは、
所定の情報を受信したときには前記第２の計算機の第２の構成管理部に前記第２の計算機の起動を要求する第２の起動制御部と、
前記第２の計算機の起動を要求したときには前記第２の起動制御部が所定値を設定する第２の起動情報と、を有し、
前記第２の構成管理部は、
前記受信した識別子と前記第２の通信デバイスに設定された識別子とが不一致のときには、前記第２の起動情報の値が前記所定値であるか否かを判定し、前記第２の起動情報の値が前記所定値であれば前記第２の計算機の電源を遮断することを特徴とする計算機システム。