JP2003162515A

JP2003162515A - クラスタシステム

Info

Publication number: JP2003162515A
Application number: JP2001358105A
Authority: JP
Inventors: Kazuhiro Suzuki; 和宏鈴木
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2001-11-22
Filing date: 2001-11-22
Publication date: 2003-06-06

Abstract

(57)【要約】【課題】本発明は、複数のノードを一つのクラスタと
して動作し、アイドル状態のノードについて節電するこ
とによりクラスタ全体の省電力化を図ることができるク
ラスタシステムを提供する。【解決手段】ソフトウエアSCore１がＯＳ２のａｐｍ
コマンドを呼び出す。ａｐｍコマンドで、ＢＩＯＳ３に
対するＢＩＯＳコールでサスペンド状態への移行を指示
する。ＢＩＯＳは、ハードウエア４のメモリに対して実
行状態を保持したまま、ＣＰＵやハードディスクの動作
を停止して当該ノードをサスペンド状態にする。当該ノ
ードをリジュームして起動する場合は、マジックパケッ
トを受け取ったネットワークインタフェース５が、ハー
ドウエア４に対しＷＯＬメッセージを送る。ハードウエ
ア４は、ＢＩＯＳに対してリジュームリクエストコマン
ドを発行し、ＢＩＯＳがＣＰＵやハードディスクを実行
状態に復帰する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、複数のノードを有
するクラスタシステムに関し、特に、複数のノードを一
つのクラスタとして動作させる際に、クラスタ全体の省
電力化を図るクラスタシステムに関する。

【０００２】

【従来の技術】クラスタは、プロセッサとメモリの組か
らなるノードの複数をネットワークで結合したマルチコ
ンピュータであり、その複数のノードを動作させて同一
作業目的の処理を実行させる。これにより、パーソナル
コンピュータ（ＰＣ）単体では限界であった処理能力や
信頼性を向上させるクラスタシステムを構築できる。

【０００３】ここで、クラスタシステムについて、シス
テムの機能面で分類すると、大きく分けて、高可用性
（ＨＡ）クラスタと高速処理コンピューティング（ＨＰ
Ｃ）クラスタとがある。さらに、複数の機能を組み合わ
せた種類のものも多く使用されている。このようなクラ
スタにおいて使用され、複数のノードを一つのクラスタ
として動作させるためのソフトウエアがクラスタシステ
ムソフトウエアである。一般的に、このクラスタシステ
ムソフトウエアの概要を以下に説明する。（ＨＡ型クラスタ）ＨＡ型クラスタには、フェイルオー
バ型とロードバランシング型とがある。・フェイルオーバ型２台またはそれ以上のノードを動作させ、何らかの原因
で動作不能になった場合に、バックアップとして待機さ
せておいた他のノードがその処理を引き継ぐことによっ
て高可用性を向上させている。フェイルオーバ型クラス
タのシステムソフトウエアには、種々の製品が出されて
いる。・ロードバランシング型ＷＷＷやＦＴＰサーバなどのサーバを多重化して、スケ
ーラビリティを実現するクラスタシステムである。一つ
のロードバランサに対するＩＰレベルのセッションを背
後に控える複数のサービスノードに割り振ることによっ
て負荷分散を行っている。割り振る方法にはいくつかあ
るが、順番に処理を割り振るラウンドロビン型やサービ
スノードやネットワークトラフィックの負荷を監視しな
がら負荷の少ないサービスノードに処理を割り振るダイ
ナミックなロードバランサなどの構成を取ることが多
い。ロードバランシング型クラスタのシステムソフトウ
エアについても、種々の製品が出されている。（ＨＰＣ型クラスタ）ＨＰＣ型クラスタでは、複数のノ
ードが協調動作することによって並列処理アプリケーシ
ョンを高速に実行できるようになっている。ノード間の
インターコネクトのデータ転送帯域が狭いとそこがボト
ルネックとなって全体の処理能力が低下するために、ギ
ガビットEthernetやMyrinetなどの高速なインタフェー
スで接続されることがある。並列処理アプリケーション
作成にはＭＰＩやＰＶＭ等のライブラリがあり、これら
は数値演算ライブラリと合わせて学術研究分野で利用さ
れている。こうした特徴を持つＨＰＣ型クラスタのシス
テムソフトウエアには、（技）新情報開発機構による
“SCore”等が挙げられる。

【０００４】

【発明が解決しようとする課題】ここで、図１に、ＨＰ
Ｃ型クラスタの概略構成を示した。図示のクラスタは、
複数のノードＮ１乃至Ｎ６で構成されている。図１の
（ａ）では、当該クラスタで処理すべきアプリケーショ
ンが無い状態を示しており、ノードＮ１のみが動作し、
他のノードＮ２乃至Ｎ６はアイドル状態になっている。

【０００５】そこへ、当該クラスタで処理すべきアプリ
ケーションが到来すると、クラスタシステムソフトウエ
アは、図１の（ｂ）に示されるように、ノードＮ２乃至
Ｎ６に対してジョブ投入を行う。このとき、一つのアプ
リケーションを全てのノードに分散並行処理させること
もできるが、２以上の異なるアプリケーションを処理す
る場合、複数のノードを２以上の郡に分けて、各郡にそ
れぞれのアプリケーションを割り振り、並行処理させる
こともできる。

【０００６】次いで、各ノードにおいて、アプリケーシ
ョン処理が終了したときには、各ノードは、図１の
（ｂ）の並行処理状態から、図１の（ａ）のアイドル状
態に移行する。

【０００７】例えば、ソフトウエアSCoreのようなＨＰ
Ｃ型クラスタ上でのアプリケーションを最大性能で処理
するために、当該アプリケーションについて、該クラス
タで管理される最大ノード数で実行することが多いと考
えられる。しかしながら、アプリケーションによっては
最高性能が出るノード数が全ノード数よりも小さい場合
もある。また、クラスタ内のノードをいくつかのサブク
ラスタに分けて、それぞれのサブクラスタで複数のアプ
リケーションを起動するような場合は、アプリケーショ
ンの終了時間の違いからアイドル状態のノードができて
しまう可能性がある。

【０００８】ノードの動作がアイドル状態であっても、
ノード自体には、消費電力を必要としているため、アイ
ドル状態のノードが多数存在することは無駄な消費電力
が増大することになり、クラスタ全体のノード数が大き
くなるにつれて、さらに大きな問題点となっている。

【０００９】そこで、本発明は、複数のノードを一つの
クラスタとして動作させる際に、アイドル状態のノード
について節電することによりクラスタ全体の省電力化を
図ることができるクラスタシステムを提供することを目
的とする。

【００１０】

【課題を解決するための手段】そこで、上記課題を解決
するため、本発明では、アプリケーションを複数のノー
ドに分散処理させるノードの動作管理を行うクラスタシ
ステムにおいて、前記ノードがアイドル状態のときには
当該ノードの動作を停止状態にさせ、前記ノードが前記
処理を実行するときに当該ノードの起動を行うこととし
た。

【００１１】そして、前記ノードには、自ノードのアイ
ドル状態を検出して該ノードの動作を停止状態にする機
能を備えた。

【００１２】また、複数の前記ノードの動作状態を記憶
する記憶手段を備え、前記ノードを起動する際に、当該
ノードについて起動状態であることが記憶されている場
合には、当該ノードに対しては起動信号を出さないよう
にした。

【００１３】さらに、複数の段階による省電力状態を設
定でき、前記ノードのアイドル時間が長くなるにつれて
次第に省電力状態の段階を上げていく機能を備えた。

【００１４】また、異なる周辺機器に接続されているノ
ード上で実行されているジョブを、同一の周辺機器に接
続されたノードに集めるプロセスマイグレーション機能
を備えた。

【００１５】

【発明の実施の形態】次に、本発明のクラスタシステム
による実施形態について、図を参照しながら実施形態別
に以下に説明する。〔第１の実施形態〕先ず、クラスタの動作原理から説明
する。クラスタ内の複数のノードに関する動作について
は、図１に示したが、従来のクラスタシステムでは、ノ
ードで処理すべきジョブが無いときには、各ノードはア
イドル状態となっていた。しかし、本実施形態によるク
ラスタシステムにおいては、ノードで処理すべきジョブ
が無いときには、該当ノードをサスペンド状態に移行さ
せておく。そして、アプリケーションが到来し、処理す
べきジョブが必要なノードに割り当てられるときに、該
当ノードをリジュームして、ジョブの処理を行うように
する。ジョブの処理が終了したときには、当該ノードを
再びサスペンド状態に移行させる。

【００１６】次いで、ノード内の動作原理について説明
する。クラスタシステムで管理される複数のノードのう
ち、代表的にその一つのノードに注目して、該ノード内
の動作の概要を、図２に示した。同図に示されたクラス
タシステムには、クラスタシステムソフトウエア１に、
具体例としてソフトウエアSCoreを用いた場合を示して
いる。

【００１７】図２において、２は、ＰＣのシステム管理
をし、ユーザ操作環境を提供する基本ソフトウエアであ
るＯＳを、３は、ＰＣに接続されている周辺機器を制御
する基本入出力システムのソフトウエアであるＢＩＯＳ
を、４は、ＰＣのハードウエアを、そして、５は、ＰＣ
のネットワークインタフェースをそれぞれ表している。
ここで、ＯＳ２、ＢＩＯＳ３、ハードウエア４、そし
て、ネットワークインタフェース５は、一つのノードに
備えられているものである。なお、ＯＳ２には、例え
ば、ソフトウエアLinuxを用いてもよい。また、図２で
は、ネットワークインタフェース５にＬＡＮカードを用
いている場合を示した。

【００１８】そこで、ソフトウエアSCore１が管理する
当該ノードをサスペンド状態に移行する場合には、先
ず、ソフトウエアSCore１がＯＳ２のソフトウエアLinux
のａｐｍコマンドを呼び出す。ａｐｍコマンドは、ＢＩ
ＯＳ３に対するＢＩＯＳコールでサスペンド状態への移
行を指示する。ＢＩＯＳ３は、ハードウエア４における
メモリに対して実行状態を保持したまま、ＣＰＵやハー
ドディスクの動作を停止して、当該ノードをサスペンド
状態に移行させる。

【００１９】反対に、アプリケーション処理が割り当て
られ、当該ノードを起動する必要があるとき、当該ノー
ドをリジュームする場合は、マジックパケットを受け取
ったネットワークインタフェース５のＬＡＮカードが、
ハードウエア４に対してＷＯＬメッセージを送る。ＷＯ
Ｌメッセージを受けたハードウエア４は、ＢＩＯＳ３に
対してリジュームリクエストコマンドを発行し、ＢＩＯ
Ｓ３が実行状態を復帰させた後で、Linuxプログラムに
よる制御に戻される。

【００２０】ここで、本実施形態によるクラスタシステ
ムにおけるサスペンド機能について説明する。一般的
に、ＰＣには、アドバンスドパワーマネージメント（Ａ
ＰＭ）と呼ばれる電力管理機能が備えられている。この
ＡＰＭは、マイクロソフト社とインテル社が共同で規格
化したＰＣの電源管理に関する規約である。ＡＰＭによ
って、ＯＳが電源を切ったりサスペンドしたりすること
ができる。もともとはノート型ＰＣ等において内臓バッ
テリの消費電力量を押さえるための機能であったが、最
近のデスクトップ型ＰＣやサーバ機等でもサポートされ
ている。

【００２１】ＡＰＭによる電源管理によって、スタンバ
イ状態とサスペンド状態に移行することができる。スタ
ンバイ状態では、ハードディスクや画面の動作を停止す
ることによって消費電力を下げるものであり、サスペン
ド状態では、メモリ上に実行状態を保持するようにして
ＣＰＵの動作をも停止し、メモリのみに電源を供給する
だけとする。そのために、サスペンド状態は、スタンバ
イ状態よりも消費電力を低くすることができる状態とい
うことになる。

【００２２】さらに、ＰＣの電源管理機能として、ハイ
バネーション状態を備えているものもある。これは、実
行状態を含めたメモリの内容をハードディスク上に書き
出しておき、完全に電源を切ることができるというもの
である。ハイバネーション状態は、主にノート型ＰＣに
採用されている機能であり、使用しているマシンにおい
て、ハイバネーション状態がサポートされていない場合
もあるが、ハイバネーション状態に関する機能として、
サスペンド状態に移行させることもできる。

【００２３】本実施形態のクラスタシステムでは、クラ
スタを構成する複数のノードの個々において、各ノード
に備えられたサスペンド機能を利用するものであり、ア
プリケーション処理が割り当てられないときには、クラ
スタシステムソフトウエアによって当該ノードをサスペ
ンド状態とし、システム全体としての電力消費を抑えて
いる。

【００２４】次に、クラスタシステムソフトウエアがク
ラスタを構成する複数のノードに処理すべきアプリケー
ションを割り振るときには、アプリケーション処理に必
要な数のノードを動作状態にしなければならない。その
対象ノードは、サスペンド状態に移行しているので、当
該ノードをサスペンド状態から動作状態に復帰させる必
要がある。そこで、本実施形態のクラスタシステムにお
いて、動作状態に復帰させるリジュームについて以下に
説明する。

【００２５】リジュームとは、ＰＣにおいて一般的に用
いられており、スタンバイ状態、サスペンド状態、ハイ
バネーション状態から復帰することを指しており、これ
によって、ノードの動作が起動される。リジュームによ
って復帰させる際のイベントは、マシンに内蔵された周
辺機器やＢＩＯＳによって異なったものになる。主なイ
ベントを以下に示す。ａ）電源（サスペンド）スイッチを押下する。ｂ）予め定義された時間によるタイマでサスペンド・リ
ジュームする。ｃ）モデムカードを内蔵したマシンでモデムに着信があ
る。ｄ）ＰＣＩバスに挿されたＬＡＮカードにマジックパケ
ットと呼ばれる特別なパケットが到達する（ウエイクオ
ンＬＡＮ：ＷＯＬ）。

【００２６】リジュームによって復帰させるＰＣに関わ
るイベントとして、一般的には、上述のａ）乃至ｄ）が
挙げられるが、本実施形態によるクラスタシステムで
は、それらのうちで、ｃ）のモデム着信と、ｄ）のマジ
ックパケット到着ＷＯＬのいずれかのイベントが採用さ
れる。

【００２７】ここで、図２に示したように、ノードにＬ
ＡＮカードが備えられていて、イベントがＷＯＬである
場合について説明する。マジックパケットは、ＡＭＤ社
が開発したＷＯＬのための特殊なパケットで、該パケッ
ト内に、６つの“0xFF”と１６個のＬＡＮカードのＭＡ
Ｃアドレスが並べられているものである。このパケット
をネットワークに対してブロードキャストすることによ
って電源投入やリジュームを行うことができる。

【００２８】ユーザレベルのソフトウエアからリモート
マシンをリジュームさせるためには、ＷＯＬが最も容易
に実現できる方式である。ただ、ＷＯＬを利用するに
は、ＷＯＬ対応のＬＡＮカードが搭載されている必要が
ある。このようなＬＡＮカードがマジックパケットを受
け取ると、マザーボードに対して電源ＯＮの命令信号を
伝えることにより、マシンに対する電源投入又はリジュ
ームすることができる。

【００２９】次に、図２のノード内処理において、当該
ノードをサスペンド状態に移行させるタイミングについ
て説明する。クラスタシステムにおいては、ソフトウエ
アSCoreは、クラスタ内の全てのノードに対し動作して
おり、それぞれのノードが協調動作してユーザのジョブ
について並行処理を実行している。ユーザのジョブが無
いアイドル状態のとき、ソフトウエアSCoreは、図３に
示すようなコード群を実行するようになっている。

【００３０】ソフトウエアSCoreがアイドルループにお
いて実行するコード群のうち、図中で下線を付したsele
ct( )システムコールは、次のジョブを待っている状態
を示している。select( )関数の“timeout”で指定した
時間内に監視しているファイルディスクリプタに変化が
ない場合には０を返す。図３内のselect( )システムコ
ールは、処理すべきメッセージの到着を監視しており、
select( )システムコールが０を返した場合には、この
ノードで実行処理するべきジョブが無いということを意
味する。そこで、select( )システムコールが０を返す
ようになってからの回数をカウントして、このカウント
値が設定されたアイドルカウント最大値“IDLE_COUNT_M
AX”を上回ったときに、ＡＰＭによってサスペンド状態
に移行させる。この時、ジョブの割り当てを管理してい
るサーバノードについては、サスペンド状態に移行させ
ないようにしなければならない。サスペンド状態に移行
する時にカウンタの値をリセットして次回のサスペンド
に備える。

【００３１】また、本実施形態によるクラスタシステム
におけるリジュームタイミングについて説明する。マル
チスレッドテンプレートライブラリＭＰＣ＋＋では、図
４のようなテンプレートによって、ノードＮＯＤＥ上で
関数ＦＵＮＣを呼び出すことができるようになってい
る。ソフトウエアSCoreも、ＭＰＣ＋＋で書かれてお
り、これらのテンプレートによってリモート関数呼び出
しを行うことができる。

【００３２】該テンプレートにおいて、invoke( )は、
関数ＦＵＮＣの終了を待つ同期型呼び出しであり、ainv
oke( )は、終了を待たずに処理を進める非同期型の呼び
出しである。ノードＮＯＤＥが自分自身とは異なってい
る場合は、リモート呼び出しを意味する。リモート呼び
出しの場合にはリモート側のノードをリジュームしてか
ら関数呼び出しを行うようにする。

【００３３】リジュームには、対象ノードのＭＡＣアド
レスを使ったマジックパケットを送出することによって
行う。クラスタのノードやネットワークの情報を管理し
ているデータベースサーバSCoreboardは、Ethernetカー
ドの情報としてノード番号とＭＡＣアドレスをテーブル
として保持している。マジックパケットを生成する場合
には、データベースサーバSCoreboardに問い合わせるこ
とによって対象ノードのＭＡＣアドレスを得ることがで
きる。

【００３４】リモート呼び出しごとにリジュームをする
と、動作しているノードに対してもマジックパケットを
送ることになって無駄が生じる。そこで各ノードの状態
を記憶しておいて、これと比較してからリジュームする
ことで無駄を省くことができる。

【００３５】そのため、サスペンドするノードとリジュ
ームさせるノードが異なっているので、全ノードで共通
に参照できるメモリ空間に、ノードの状態を記憶してお
かなければならない。これは、ＭＰＣ＋＋のグローバル
ポインタ“GlobalPtr”クラステンプレートで実現する
ことができる。GlobalPtrクラステンプレートは任意の
型をパラメータとして受け取って、その型のオブジェク
トを指すグローバルポインタを生成する。グローバルポ
インタは、全てのノードから共通にアクセスすることが
できる。

【００３６】次に、ジョブが終了した場合の動作につい
て説明する。ジョブが終了すると、ソフトウエアSCore
は、全てのノードのハードディスクをフラッシュするた
めに、sync_all( )関数が呼び出される。これは全ての
ノードに対して、ainvoke( )テンプレートによってsync
( )システムコールを呼び出すためのものである。これ
を呼び出すと、ジョブが割り当てられていなかったサス
ペンド中のノードにも、sync( )システムコールを呼び
出す時にリジュームしてしまう。これは不必要なリジュ
ームであるため、sync_all( )関数の中で実行中のノー
ドにだけ、sync()システムコールを実行するようにし
た。

【００３７】次いで、クラスタシステム内の異なるノー
ド間において、それらの動作状態に移行するタイミング
によっては競合状態となる場合がある。その競合状態に
よってデッドロックが発生することになるが、それを回
避する手段について、以下に説明する。

【００３８】図３に示したアイドルループは、プライオ
リティが低いスレッドとして動作しているため、他のノ
ードをリジユームさせている時間や同期待ちの時間など
で実行される可能性がある。また、図５のような競合状
態によってデッドロックが発生する可能性がある。

【００３９】図５に示されるように、ノード１がノード
２をリジュームする場合、ノード１でノード２の状態が
サスペンド状態ではないことを確認してリモート関数呼
び出しを行ったとする。この時、ノード２の状態確認と
リモート呼び出しの間でノード２がサスペンドしてしま
う場合が考えられる。

【００４０】そこで、リジュームされた場合に、アイド
ルループを回った回数を−1に設定する。アイドルルー
プ側ではカウンタが−1に設定されていた場合には、サ
スペンド要求を出さないようにする。カウンタを−１に
設定することは、当該ノードから該ノードと異なるノー
ドの動作を停止状態に移行させるまで、カウンタに動作
の停止を禁止する状態を設定したこととなる。ジョブが
終了した時に、カウンタの値をリセットしてサスペンド
可能な状態に戻す。これによって、ジョブが割り当てら
れてから終了するまでの間は、そのノードがサスペンド
してデッドロックを起すことを回避できる。

【００４１】なお、以上においては、クラスタを構成す
るノードの省電力に対しては、サスペンド状態への移行
によって行うようにしたが、接続されている周辺機器に
応じてこの省電力状態を変化させることもできる。例え
ば、ＣＲＴだけを停止するとか、ＣＲＴとハードディス
クを停止するなどといった段階的な省電力状態を設定す
ることができる。この様にすることによって、全ての周
辺機器を停止させると起動するための時間がかかるため
に、アイドル時間と起動時間とを考慮して、例えば、ア
イドル時間が長くなるにつれて次第に省電力状態を上げ
ていくなど、より細かい省電力制御を行うことができ
る。〔第２の実施形態〕プロセスマイグレーションとは、動
作中のプロセスの状態を一旦ハードディスクに書き出し
て、新たに他のノード上でハードディスクに書き出され
た状態を読込んでプロセスの実行を縦続するための仕組
みである。

【００４２】クラスタ内のノード数が多くなると、電源
タップ、インターコネクトのハブ等に係る周辺機器の数
も多くなる。そして、物理的に離れているノードは、異
なる電源タップやインターコネクトハブに接続されるこ
とになる。プロセスマイグレーションによって異なる周
辺機器に繋がれているノード上で動作しているジョブ
を、同一の周辺機器に接続されている近いノードに移動
することができる。これによって使われていない周辺機
器を増やし、これらの電源を落とすことによって周辺機
器による消費電力を下げることができる。

【００４３】図６に、本実施形態によるクラスタシステ
ムにプロセスマイグレーションを適用して、省電力化を
図った例を示した。図６においては、３つのノード群が
ハブを介して結合されてクラスタシステムを形成してい
る。図６（ａ）には、ハブＨ１に、ノードＮ11乃至Ｎ16
が、ハブＨ２には、ノードＮ21乃至Ｎ26が、そして、ハ
ブＨ３には、ノードＮ31乃至Ｎ36がそれぞれ結合されて
いる。図６（ａ）では、ハブＨ１において、ノードＮ11
とノードＮ12が、ハブＨ２において、ノードＮ23とノー
ドＮ24が、そして、ハブＨ３において、ノードＮ31が動
作状態にある。それらのノードが動作状態にあること
を、便宜的に、図中では太線で示している。他のノード
は、アイドル状態にある。

【００４４】各ノードが、図６（ａ）に示されるような
場合には、ハブＨ１乃至Ｈ３に結合されている全てのノ
ードに電源供給されている。そのため、各ハブにおいて
アプリケーション処理で動作しているノードが少なくて
も、電力が消費され、省電力にはならない。

【００４５】そこで、図６（ｂ）に示されるように、例
えば、ハブＨ２のノードＮ23とノードＮ24と、ハブＨ３
のノードＮ31とで実行されるアプリケーション処理を、
ハブＨ１のノードＮ13乃至Ｎ15に移動させる。このと
き、ハブＨ１におけるノードＮ13乃至Ｎ15は、処理が移
動される前に、動作停止状態からリジュームされて起動
している。このようにすると、ハブＨ２とハブＨ３に属
する各ノードへのアプリケーション処理の割り当てが必
要無くなり、これらのノードについてはアイドル状態と
なって、ノードの動作を停止状態に移行させることがで
きる。このことは、ハブ間に跨って分散していたアプリ
ケーション処理を特定のハブに集中させることができ、
ハブＨ１においては、電力消費が増えるものの、システ
ム全体で見ると、省電力化を図ることができる。〔第３の実施形態〕ＰＣの電力管理機能には、ＡＰＭの
他に、電力制御インタフェースであるＡＣＰＩ（Advanc
ed Configuration and Power Interface）が提案されて
おり、このＡＣＰＩをサポートしたマシンも多く製品化
されている。ＡＣＰＩは、ノードに備えられたＯＳから
ノードの電源管理を行うことを規定したものである。そ
こで、ソフトウエアMS−Ｗｉｎｄｏｗｓ（登録商標）や
Linux等の多くのＯＳで採り入れられている。上述した
本実施形態の例では、ＡＰＭによる電源管理による場合
について説明したが、このＡＰＭの代わりに、ＡＣＰＩ
を実装してサポートしたマシンとして、ノードのＯＳに
よって柔軟に電源管理を行うことが可能である。

【００４６】なお、以上において、本実施形態における
クラスタシステムでは、ＨＰＣ型クラスタを用いた場合
を説明してきたが、本実施形態による省電力化の手法
は、ＨＰＣ型に限られるものではなく、その手法は、複
数のノードでアプリケーション処理を行うシステムであ
れば、適用可能であり、ＨＡ型クラスタにも使用するこ
とができる。

【００４７】以下に、本発明によるクラスタシステムに
関する実施の態様について示した。（付記１）アプリケーションを複数のノードに分散処
理させるノードの動作管理を行うクラスタシステムにお
いて、前記ノードがアイドル状態のときには当該ノード
の動作を停止状態にさせ、前記ノードが前記処理を実行
するときに当該ノードの起動を行うことを特徴とするク
ラスタシステム。（付記２）前記ノードは、自ノードのアイドル状態を
検出して該ノードの動作を停止状態にする機能を備える
ことを特徴とする付記１に記載のクラスタシステム。（付記３）前記ノードのアイドルループ回数をカウン
トするカウンタを有し、前記ノードから該ノードと異な
るノードの動作を停止状態に移行させるまで、前記カウ
ンタに前記動作の停止を禁止する状態を設定することを
特徴とする付記２に記載のクラスタシステム。（付記４）複数の前記ノードの動作状態を記憶する記
憶手段を有し、前記ノードを起動する際に、当該ノード
について起動状態であることが記憶されている場合に
は、当該ノードに対しては起動信号を出さないことを特
徴とする付記１又は２に記載のクラスタシステム。（付記５）複数の段階による省電力状態が設定され、
前記ノードのアイドル時間が長くなるにつれて次第に省
電力状態の段階を上げていく機能を備えることを特徴と
する付記１又２に記載のクラスタシステム。（付記６）前記ノードの動作停止状態には、スタンバ
イ状態、サスペンド状態、又はハイバネーション状態が
含まれることを特徴とする付記１又２に記載のクラスタ
システム。（付記７）異なる周辺機器に接続されているノード上
で実行されているジョブを、同一の周辺機器に接続され
たノードに集めるプロセスマイグレーション機能を有す
ることを特徴とする付記１乃至６のいずれかに記載のク
ラスタシステム。（付記８）前記ノードは、ウエイクオンＬＡＮメッセ
ージを受けたときに起動することを特徴とした付記１又
は２に記載のクラスタシステム。（付記９）前記ノードは、内蔵モデムに着信信号を受
けたときに起動することを特徴とした付記１又は２に記
載のクラスタシステム。（付記１０）前記ノードは、アドバンスドパフォーマ
ンスマネージメント機能によって該ノードの電源を管理
することを特徴とした付記１又は２に記載のクラスタシ
ステム。（付記１１）前記ノードは、電力制御インタフェース
ＡＣＰＩを有し、前記電力インタフェースＡＣＰＩによ
り、前記ノードに備えられるＯＳから該ノードの電源を
管理することを特徴とする付記１又は２に記載のクラス
タシステム。

【００４８】

【発明の効果】以上説明したように、本発明によれば、
複数のノードからなるクラスタシステムにおいて、アイ
ドル状態のノードに対して動作停止状態とすることによ
り、アイドル状態のノードが存在することによるクラス
タシステムの無駄な消費電力の増大を防ぎ、クラスタシ
ステムの省電力化を実現することができる。

【図面の簡単な説明】

【図１】クラスタシステムにおけるノードの動作状態を
説明する図である。

【図２】本実施形態のクラスタシステムの一ノード内に
おけるサスペンド状態への移行動作と、リジュームでの
復帰動作を説明する図である。

【図３】ソフトウエアのアイドルループにおける実行コ
マンド群を説明する図である。

【図４】マルチスレッドテンプレートライブラリにおけ
るinvokeテンプレートを示す図である。

【図５】異なるノード間におけるサスペンドとリジュー
ムとが競合状態にある場合を説明する図である。

【図６】プロセスマイグレーションを本実施形態のクラ
スタシステムに適用した場合を説明する図である。

【符号の説明】

１…クラスタシステムソフトウエア２…ＯＳ３…ＢＩＯＳ４…ハードウエア５…ネットワークインタフェース

Claims

【特許請求の範囲】

【請求項１】アプリケーションを複数のノードに分散
処理させるノードの動作管理を行うクラスタシステムに
おいて、前記ノードがアイドル状態のときには当該ノードの動作
を停止状態にさせ、前記ノードが前記処理を実行すると
きに当該ノードの起動を行うことを特徴とするクラスタ
システム。
【請求項２】前記ノードは、自ノードのアイドル状態
を検出して該ノードの動作を停止状態にする機能を備え
ることを特徴とする請求項１に記載のクラスタシステ
ム。
【請求項３】複数の前記ノードの動作状態を記憶する
記憶手段を有し、前記ノードを起動する際に、当該ノードについて起動状
態であることが記憶されている場合には、当該ノードに
対しては起動信号を出さないことを特徴とする請求項１
又は２に記載のクラスタシステム。
【請求項４】複数の段階による省電力状態が設定さ
れ、前記ノードのアイドル時間が長くなるにつれて次第に省
電力状態の段階を上げていく機能を備えることを特徴と
する請求項１又２に記載のクラスタシステム。
【請求項５】異なる周辺機器に接続されているノード
上で実行されているジョブを、同一の周辺機器に接続さ
れたノードに集めるプロセスマイグレーション機能を有
することを特徴とする付記１乃至４のいずれかに記載の
クラスタシステム。