JP2003162515A - クラスタシステム - Google Patents

クラスタシステム

Info

Publication number
JP2003162515A
JP2003162515A JP2001358105A JP2001358105A JP2003162515A JP 2003162515 A JP2003162515 A JP 2003162515A JP 2001358105 A JP2001358105 A JP 2001358105A JP 2001358105 A JP2001358105 A JP 2001358105A JP 2003162515 A JP2003162515 A JP 2003162515A
Authority
JP
Japan
Prior art keywords
node
nodes
state
cluster system
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2001358105A
Other languages
English (en)
Inventor
Kazuhiro Suzuki
和宏 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2001358105A priority Critical patent/JP2003162515A/ja
Publication of JP2003162515A publication Critical patent/JP2003162515A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Power Sources (AREA)

Abstract

(57)【要約】 【課題】 本発明は、複数のノードを一つのクラスタと
して動作し、アイドル状態のノードについて節電するこ
とによりクラスタ全体の省電力化を図ることができるク
ラスタシステムを提供する。 【解決手段】 ソフトウエアSCore1がOS2のapm
コマンドを呼び出す。apmコマンドで、BIOS3に
対するBIOSコールでサスペンド状態への移行を指示
する。BIOSは、ハードウエア4のメモリに対して実
行状態を保持したまま、CPUやハードディスクの動作
を停止して当該ノードをサスペンド状態にする。当該ノ
ードをリジュームして起動する場合は、マジックパケッ
トを受け取ったネットワークインタフェース5が、ハー
ドウエア4に対しWOLメッセージを送る。ハードウエ
ア4は、BIOSに対してリジュームリクエストコマン
ドを発行し、BIOSがCPUやハードディスクを実行
状態に復帰する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、複数のノードを有
するクラスタシステムに関し、特に、複数のノードを一
つのクラスタとして動作させる際に、クラスタ全体の省
電力化を図るクラスタシステムに関する。
【0002】
【従来の技術】クラスタは、プロセッサとメモリの組か
らなるノードの複数をネットワークで結合したマルチコ
ンピュータであり、その複数のノードを動作させて同一
作業目的の処理を実行させる。これにより、パーソナル
コンピュータ(PC)単体では限界であった処理能力や
信頼性を向上させるクラスタシステムを構築できる。
【0003】ここで、クラスタシステムについて、シス
テムの機能面で分類すると、大きく分けて、高可用性
(HA)クラスタと高速処理コンピューティング(HP
C)クラスタとがある。さらに、複数の機能を組み合わ
せた種類のものも多く使用されている。このようなクラ
スタにおいて使用され、複数のノードを一つのクラスタ
として動作させるためのソフトウエアがクラスタシステ
ムソフトウエアである。一般的に、このクラスタシステ
ムソフトウエアの概要を以下に説明する。 (HA型クラスタ)HA型クラスタには、フェイルオー
バ型とロードバランシング型とがある。 ・フェイルオーバ型 2台またはそれ以上のノードを動作させ、何らかの原因
で動作不能になった場合に、バックアップとして待機さ
せておいた他のノードがその処理を引き継ぐことによっ
て高可用性を向上させている。フェイルオーバ型クラス
タのシステムソフトウエアには、種々の製品が出されて
いる。 ・ロードバランシング型 WWWやFTPサーバなどのサーバを多重化して、スケ
ーラビリティを実現するクラスタシステムである。一つ
のロードバランサに対するIPレベルのセッションを背
後に控える複数のサービスノードに割り振ることによっ
て負荷分散を行っている。割り振る方法にはいくつかあ
るが、順番に処理を割り振るラウンドロビン型やサービ
スノードやネットワークトラフィックの負荷を監視しな
がら負荷の少ないサービスノードに処理を割り振るダイ
ナミックなロードバランサなどの構成を取ることが多
い。ロードバランシング型クラスタのシステムソフトウ
エアについても、種々の製品が出されている。 (HPC型クラスタ)HPC型クラスタでは、複数のノ
ードが協調動作することによって並列処理アプリケーシ
ョンを高速に実行できるようになっている。ノード間の
インターコネクトのデータ転送帯域が狭いとそこがボト
ルネックとなって全体の処理能力が低下するために、ギ
ガビットEthernetやMyrinetなどの高速なインタフェー
スで接続されることがある。並列処理アプリケーション
作成にはMPIやPVM等のライブラリがあり、これら
は数値演算ライブラリと合わせて学術研究分野で利用さ
れている。こうした特徴を持つHPC型クラスタのシス
テムソフトウエアには、(技)新情報開発機構による
“SCore”等が挙げられる。
【0004】
【発明が解決しようとする課題】ここで、図1に、HP
C型クラスタの概略構成を示した。図示のクラスタは、
複数のノードN1乃至N6で構成されている。図1の
(a)では、当該クラスタで処理すべきアプリケーショ
ンが無い状態を示しており、ノードN1のみが動作し、
他のノードN2乃至N6はアイドル状態になっている。
【0005】そこへ、当該クラスタで処理すべきアプリ
ケーションが到来すると、クラスタシステムソフトウエ
アは、図1の(b)に示されるように、ノードN2乃至
N6に対してジョブ投入を行う。このとき、一つのアプ
リケーションを全てのノードに分散並行処理させること
もできるが、2以上の異なるアプリケーションを処理す
る場合、複数のノードを2以上の郡に分けて、各郡にそ
れぞれのアプリケーションを割り振り、並行処理させる
こともできる。
【0006】次いで、各ノードにおいて、アプリケーシ
ョン処理が終了したときには、各ノードは、図1の
(b)の並行処理状態から、図1の(a)のアイドル状
態に移行する。
【0007】例えば、ソフトウエアSCoreのようなHP
C型クラスタ上でのアプリケーションを最大性能で処理
するために、当該アプリケーションについて、該クラス
タで管理される最大ノード数で実行することが多いと考
えられる。しかしながら、アプリケーションによっては
最高性能が出るノード数が全ノード数よりも小さい場合
もある。また、クラスタ内のノードをいくつかのサブク
ラスタに分けて、それぞれのサブクラスタで複数のアプ
リケーションを起動するような場合は、アプリケーショ
ンの終了時間の違いからアイドル状態のノードができて
しまう可能性がある。
【0008】ノードの動作がアイドル状態であっても、
ノード自体には、消費電力を必要としているため、アイ
ドル状態のノードが多数存在することは無駄な消費電力
が増大することになり、クラスタ全体のノード数が大き
くなるにつれて、さらに大きな問題点となっている。
【0009】そこで、本発明は、複数のノードを一つの
クラスタとして動作させる際に、アイドル状態のノード
について節電することによりクラスタ全体の省電力化を
図ることができるクラスタシステムを提供することを目
的とする。
【0010】
【課題を解決するための手段】そこで、上記課題を解決
するため、本発明では、アプリケーションを複数のノー
ドに分散処理させるノードの動作管理を行うクラスタシ
ステムにおいて、前記ノードがアイドル状態のときには
当該ノードの動作を停止状態にさせ、前記ノードが前記
処理を実行するときに当該ノードの起動を行うこととし
た。
【0011】そして、前記ノードには、自ノードのアイ
ドル状態を検出して該ノードの動作を停止状態にする機
能を備えた。
【0012】また、複数の前記ノードの動作状態を記憶
する記憶手段を備え、前記ノードを起動する際に、当該
ノードについて起動状態であることが記憶されている場
合には、当該ノードに対しては起動信号を出さないよう
にした。
【0013】さらに、複数の段階による省電力状態を設
定でき、前記ノードのアイドル時間が長くなるにつれて
次第に省電力状態の段階を上げていく機能を備えた。
【0014】また、異なる周辺機器に接続されているノ
ード上で実行されているジョブを、同一の周辺機器に接
続されたノードに集めるプロセスマイグレーション機能
を備えた。
【0015】
【発明の実施の形態】次に、本発明のクラスタシステム
による実施形態について、図を参照しながら実施形態別
に以下に説明する。 〔第1の実施形態〕先ず、クラスタの動作原理から説明
する。クラスタ内の複数のノードに関する動作について
は、図1に示したが、従来のクラスタシステムでは、ノ
ードで処理すべきジョブが無いときには、各ノードはア
イドル状態となっていた。しかし、本実施形態によるク
ラスタシステムにおいては、ノードで処理すべきジョブ
が無いときには、該当ノードをサスペンド状態に移行さ
せておく。そして、アプリケーションが到来し、処理す
べきジョブが必要なノードに割り当てられるときに、該
当ノードをリジュームして、ジョブの処理を行うように
する。ジョブの処理が終了したときには、当該ノードを
再びサスペンド状態に移行させる。
【0016】次いで、ノード内の動作原理について説明
する。クラスタシステムで管理される複数のノードのう
ち、代表的にその一つのノードに注目して、該ノード内
の動作の概要を、図2に示した。同図に示されたクラス
タシステムには、クラスタシステムソフトウエア1に、
具体例としてソフトウエアSCoreを用いた場合を示して
いる。
【0017】図2において、2は、PCのシステム管理
をし、ユーザ操作環境を提供する基本ソフトウエアであ
るOSを、3は、PCに接続されている周辺機器を制御
する基本入出力システムのソフトウエアであるBIOS
を、4は、PCのハードウエアを、そして、5は、PC
のネットワークインタフェースをそれぞれ表している。
ここで、OS2、BIOS3、ハードウエア4、そし
て、ネットワークインタフェース5は、一つのノードに
備えられているものである。なお、OS2には、例え
ば、ソフトウエアLinuxを用いてもよい。また、図2で
は、ネットワークインタフェース5にLANカードを用
いている場合を示した。
【0018】そこで、ソフトウエアSCore1が管理する
当該ノードをサスペンド状態に移行する場合には、先
ず、ソフトウエアSCore1がOS2のソフトウエアLinux
のapmコマンドを呼び出す。apmコマンドは、BI
OS3に対するBIOSコールでサスペンド状態への移
行を指示する。BIOS3は、ハードウエア4における
メモリに対して実行状態を保持したまま、CPUやハー
ドディスクの動作を停止して、当該ノードをサスペンド
状態に移行させる。
【0019】反対に、アプリケーション処理が割り当て
られ、当該ノードを起動する必要があるとき、当該ノー
ドをリジュームする場合は、マジックパケットを受け取
ったネットワークインタフェース5のLANカードが、
ハードウエア4に対してWOLメッセージを送る。WO
Lメッセージを受けたハードウエア4は、BIOS3に
対してリジュームリクエストコマンドを発行し、BIO
S3が実行状態を復帰させた後で、Linuxプログラムに
よる制御に戻される。
【0020】ここで、本実施形態によるクラスタシステ
ムにおけるサスペンド機能について説明する。一般的
に、PCには、アドバンスドパワーマネージメント(A
PM)と呼ばれる電力管理機能が備えられている。この
APMは、マイクロソフト社とインテル社が共同で規格
化したPCの電源管理に関する規約である。APMによ
って、OSが電源を切ったりサスペンドしたりすること
ができる。もともとはノート型PC等において内臓バッ
テリの消費電力量を押さえるための機能であったが、最
近のデスクトップ型PCやサーバ機等でもサポートされ
ている。
【0021】APMによる電源管理によって、スタンバ
イ状態とサスペンド状態に移行することができる。スタ
ンバイ状態では、ハードディスクや画面の動作を停止す
ることによって消費電力を下げるものであり、サスペン
ド状態では、メモリ上に実行状態を保持するようにして
CPUの動作をも停止し、メモリのみに電源を供給する
だけとする。そのために、サスペンド状態は、スタンバ
イ状態よりも消費電力を低くすることができる状態とい
うことになる。
【0022】さらに、PCの電源管理機能として、ハイ
バネーション状態を備えているものもある。これは、実
行状態を含めたメモリの内容をハードディスク上に書き
出しておき、完全に電源を切ることができるというもの
である。ハイバネーション状態は、主にノート型PCに
採用されている機能であり、使用しているマシンにおい
て、ハイバネーション状態がサポートされていない場合
もあるが、ハイバネーション状態に関する機能として、
サスペンド状態に移行させることもできる。
【0023】本実施形態のクラスタシステムでは、クラ
スタを構成する複数のノードの個々において、各ノード
に備えられたサスペンド機能を利用するものであり、ア
プリケーション処理が割り当てられないときには、クラ
スタシステムソフトウエアによって当該ノードをサスペ
ンド状態とし、システム全体としての電力消費を抑えて
いる。
【0024】次に、クラスタシステムソフトウエアがク
ラスタを構成する複数のノードに処理すべきアプリケー
ションを割り振るときには、アプリケーション処理に必
要な数のノードを動作状態にしなければならない。その
対象ノードは、サスペンド状態に移行しているので、当
該ノードをサスペンド状態から動作状態に復帰させる必
要がある。そこで、本実施形態のクラスタシステムにお
いて、動作状態に復帰させるリジュームについて以下に
説明する。
【0025】リジュームとは、PCにおいて一般的に用
いられており、スタンバイ状態、サスペンド状態、ハイ
バネーション状態から復帰することを指しており、これ
によって、ノードの動作が起動される。リジュームによ
って復帰させる際のイベントは、マシンに内蔵された周
辺機器やBIOSによって異なったものになる。主なイ
ベントを以下に示す。 a)電源(サスペンド)スイッチを押下する。 b)予め定義された時間によるタイマでサスペンド・リ
ジュームする。 c)モデムカードを内蔵したマシンでモデムに着信があ
る。 d)PCIバスに挿されたLANカードにマジックパケ
ットと呼ばれる特別なパケットが到達する(ウエイクオ
ンLAN:WOL)。
【0026】リジュームによって復帰させるPCに関わ
るイベントとして、一般的には、上述のa)乃至d)が
挙げられるが、本実施形態によるクラスタシステムで
は、それらのうちで、c)のモデム着信と、d)のマジ
ックパケット到着WOLのいずれかのイベントが採用さ
れる。
【0027】ここで、図2に示したように、ノードにL
ANカードが備えられていて、イベントがWOLである
場合について説明する。マジックパケットは、AMD社
が開発したWOLのための特殊なパケットで、該パケッ
ト内に、6つの“0xFF”と16個のLANカードのMA
Cアドレスが並べられているものである。このパケット
をネットワークに対してブロードキャストすることによ
って電源投入やリジュームを行うことができる。
【0028】ユーザレベルのソフトウエアからリモート
マシンをリジュームさせるためには、WOLが最も容易
に実現できる方式である。ただ、WOLを利用するに
は、WOL対応のLANカードが搭載されている必要が
ある。このようなLANカードがマジックパケットを受
け取ると、マザーボードに対して電源ONの命令信号を
伝えることにより、マシンに対する電源投入又はリジュ
ームすることができる。
【0029】次に、図2のノード内処理において、当該
ノードをサスペンド状態に移行させるタイミングについ
て説明する。クラスタシステムにおいては、ソフトウエ
アSCoreは、クラスタ内の全てのノードに対し動作して
おり、それぞれのノードが協調動作してユーザのジョブ
について並行処理を実行している。ユーザのジョブが無
いアイドル状態のとき、ソフトウエアSCoreは、図3に
示すようなコード群を実行するようになっている。
【0030】ソフトウエアSCoreがアイドルループにお
いて実行するコード群のうち、図中で下線を付したsele
ct( )システムコールは、次のジョブを待っている状態
を示している。select( )関数の“timeout”で指定した
時間内に監視しているファイルディスクリプタに変化が
ない場合には0を返す。図3内のselect( )システムコ
ールは、処理すべきメッセージの到着を監視しており、
select( )システムコールが0を返した場合には、この
ノードで実行処理するべきジョブが無いということを意
味する。そこで、select( )システムコールが0を返す
ようになってからの回数をカウントして、このカウント
値が設定されたアイドルカウント最大値“IDLE_COUNT_M
AX”を上回ったときに、APMによってサスペンド状態
に移行させる。この時、ジョブの割り当てを管理してい
るサーバノードについては、サスペンド状態に移行させ
ないようにしなければならない。サスペンド状態に移行
する時にカウンタの値をリセットして次回のサスペンド
に備える。
【0031】また、本実施形態によるクラスタシステム
におけるリジュームタイミングについて説明する。マル
チスレッドテンプレートライブラリMPC++では、図
4のようなテンプレートによって、ノードNODE上で
関数FUNCを呼び出すことができるようになってい
る。ソフトウエアSCoreも、MPC++で書かれてお
り、これらのテンプレートによってリモート関数呼び出
しを行うことができる。
【0032】該テンプレートにおいて、invoke( )は、
関数FUNCの終了を待つ同期型呼び出しであり、ainv
oke( )は、終了を待たずに処理を進める非同期型の呼び
出しである。ノードNODEが自分自身とは異なってい
る場合は、リモート呼び出しを意味する。リモート呼び
出しの場合にはリモート側のノードをリジュームしてか
ら関数呼び出しを行うようにする。
【0033】リジュームには、対象ノードのMACアド
レスを使ったマジックパケットを送出することによって
行う。クラスタのノードやネットワークの情報を管理し
ているデータベースサーバSCoreboardは、Ethernetカー
ドの情報としてノード番号とMACアドレスをテーブル
として保持している。マジックパケットを生成する場合
には、データベースサーバSCoreboardに問い合わせるこ
とによって対象ノードのMACアドレスを得ることがで
きる。
【0034】リモート呼び出しごとにリジュームをする
と、動作しているノードに対してもマジックパケットを
送ることになって無駄が生じる。そこで各ノードの状態
を記憶しておいて、これと比較してからリジュームする
ことで無駄を省くことができる。
【0035】そのため、サスペンドするノードとリジュ
ームさせるノードが異なっているので、全ノードで共通
に参照できるメモリ空間に、ノードの状態を記憶してお
かなければならない。これは、MPC++のグローバル
ポインタ“GlobalPtr”クラステンプレートで実現する
ことができる。GlobalPtrクラステンプレートは任意の
型をパラメータとして受け取って、その型のオブジェク
トを指すグローバルポインタを生成する。グローバルポ
インタは、全てのノードから共通にアクセスすることが
できる。
【0036】次に、ジョブが終了した場合の動作につい
て説明する。ジョブが終了すると、ソフトウエアSCore
は、全てのノードのハードディスクをフラッシュするた
めに、sync_all( )関数が呼び出される。これは全ての
ノードに対して、ainvoke( )テンプレートによってsync
( )システムコールを呼び出すためのものである。これ
を呼び出すと、ジョブが割り当てられていなかったサス
ペンド中のノードにも、sync( )システムコールを呼び
出す時にリジュームしてしまう。これは不必要なリジュ
ームであるため、sync_all( )関数の中で実行中のノー
ドにだけ、sync()システムコールを実行するようにし
た。
【0037】次いで、クラスタシステム内の異なるノー
ド間において、それらの動作状態に移行するタイミング
によっては競合状態となる場合がある。その競合状態に
よってデッドロックが発生することになるが、それを回
避する手段について、以下に説明する。
【0038】図3に示したアイドルループは、プライオ
リティが低いスレッドとして動作しているため、他のノ
ードをリジユームさせている時間や同期待ちの時間など
で実行される可能性がある。また、図5のような競合状
態によってデッドロックが発生する可能性がある。
【0039】図5に示されるように、ノード1がノード
2をリジュームする場合、ノード1でノード2の状態が
サスペンド状態ではないことを確認してリモート関数呼
び出しを行ったとする。この時、ノード2の状態確認と
リモート呼び出しの間でノード2がサスペンドしてしま
う場合が考えられる。
【0040】そこで、リジュームされた場合に、アイド
ルループを回った回数を−1に設定する。アイドルルー
プ側ではカウンタが−1に設定されていた場合には、サ
スペンド要求を出さないようにする。カウンタを−1に
設定することは、当該ノードから該ノードと異なるノー
ドの動作を停止状態に移行させるまで、カウンタに動作
の停止を禁止する状態を設定したこととなる。ジョブが
終了した時に、カウンタの値をリセットしてサスペンド
可能な状態に戻す。これによって、ジョブが割り当てら
れてから終了するまでの間は、そのノードがサスペンド
してデッドロックを起すことを回避できる。
【0041】なお、以上においては、クラスタを構成す
るノードの省電力に対しては、サスペンド状態への移行
によって行うようにしたが、接続されている周辺機器に
応じてこの省電力状態を変化させることもできる。例え
ば、CRTだけを停止するとか、CRTとハードディス
クを停止するなどといった段階的な省電力状態を設定す
ることができる。この様にすることによって、全ての周
辺機器を停止させると起動するための時間がかかるため
に、アイドル時間と起動時間とを考慮して、例えば、ア
イドル時間が長くなるにつれて次第に省電力状態を上げ
ていくなど、より細かい省電力制御を行うことができ
る。 〔第2の実施形態〕プロセスマイグレーションとは、動
作中のプロセスの状態を一旦ハードディスクに書き出し
て、新たに他のノード上でハードディスクに書き出され
た状態を読込んでプロセスの実行を縦続するための仕組
みである。
【0042】クラスタ内のノード数が多くなると、電源
タップ、インターコネクトのハブ等に係る周辺機器の数
も多くなる。そして、物理的に離れているノードは、異
なる電源タップやインターコネクトハブに接続されるこ
とになる。プロセスマイグレーションによって異なる周
辺機器に繋がれているノード上で動作しているジョブ
を、同一の周辺機器に接続されている近いノードに移動
することができる。これによって使われていない周辺機
器を増やし、これらの電源を落とすことによって周辺機
器による消費電力を下げることができる。
【0043】図6に、本実施形態によるクラスタシステ
ムにプロセスマイグレーションを適用して、省電力化を
図った例を示した。図6においては、3つのノード群が
ハブを介して結合されてクラスタシステムを形成してい
る。図6(a)には、ハブH1に、ノードN11乃至N16
が、ハブH2には、ノードN21乃至N26が、そして、ハ
ブH3には、ノードN31乃至N36がそれぞれ結合されて
いる。図6(a)では、ハブH1において、ノードN11
とノードN12が、ハブH2において、ノードN23とノー
ドN24が、そして、ハブH3において、ノードN31が動
作状態にある。それらのノードが動作状態にあること
を、便宜的に、図中では太線で示している。他のノード
は、アイドル状態にある。
【0044】各ノードが、図6(a)に示されるような
場合には、ハブH1乃至H3に結合されている全てのノ
ードに電源供給されている。そのため、各ハブにおいて
アプリケーション処理で動作しているノードが少なくて
も、電力が消費され、省電力にはならない。
【0045】そこで、図6(b)に示されるように、例
えば、ハブH2のノードN23とノードN24と、ハブH3
のノードN31とで実行されるアプリケーション処理を、
ハブH1のノードN13乃至N15に移動させる。このと
き、ハブH1におけるノードN13乃至N15は、処理が移
動される前に、動作停止状態からリジュームされて起動
している。このようにすると、ハブH2とハブH3に属
する各ノードへのアプリケーション処理の割り当てが必
要無くなり、これらのノードについてはアイドル状態と
なって、ノードの動作を停止状態に移行させることがで
きる。このことは、ハブ間に跨って分散していたアプリ
ケーション処理を特定のハブに集中させることができ、
ハブH1においては、電力消費が増えるものの、システ
ム全体で見ると、省電力化を図ることができる。 〔第3の実施形態〕PCの電力管理機能には、APMの
他に、電力制御インタフェースであるACPI(Advanc
ed Configuration and Power Interface)が提案されて
おり、このACPIをサポートしたマシンも多く製品化
されている。ACPIは、ノードに備えられたOSから
ノードの電源管理を行うことを規定したものである。そ
こで、ソフトウエアMS−Windows(登録商標)や
Linux等の多くのOSで採り入れられている。上述した
本実施形態の例では、APMによる電源管理による場合
について説明したが、このAPMの代わりに、ACPI
を実装してサポートしたマシンとして、ノードのOSに
よって柔軟に電源管理を行うことが可能である。
【0046】なお、以上において、本実施形態における
クラスタシステムでは、HPC型クラスタを用いた場合
を説明してきたが、本実施形態による省電力化の手法
は、HPC型に限られるものではなく、その手法は、複
数のノードでアプリケーション処理を行うシステムであ
れば、適用可能であり、HA型クラスタにも使用するこ
とができる。
【0047】以下に、本発明によるクラスタシステムに
関する実施の態様について示した。 (付記1) アプリケーションを複数のノードに分散処
理させるノードの動作管理を行うクラスタシステムにお
いて、前記ノードがアイドル状態のときには当該ノード
の動作を停止状態にさせ、前記ノードが前記処理を実行
するときに当該ノードの起動を行うことを特徴とするク
ラスタシステム。 (付記2) 前記ノードは、自ノードのアイドル状態を
検出して該ノードの動作を停止状態にする機能を備える
ことを特徴とする付記1に記載のクラスタシステム。 (付記3) 前記ノードのアイドルループ回数をカウン
トするカウンタを有し、前記ノードから該ノードと異な
るノードの動作を停止状態に移行させるまで、前記カウ
ンタに前記動作の停止を禁止する状態を設定することを
特徴とする付記2に記載のクラスタシステム。 (付記4) 複数の前記ノードの動作状態を記憶する記
憶手段を有し、前記ノードを起動する際に、当該ノード
について起動状態であることが記憶されている場合に
は、当該ノードに対しては起動信号を出さないことを特
徴とする付記1又は2に記載のクラスタシステム。 (付記5) 複数の段階による省電力状態が設定され、
前記ノードのアイドル時間が長くなるにつれて次第に省
電力状態の段階を上げていく機能を備えることを特徴と
する付記1又2に記載のクラスタシステム。 (付記6) 前記ノードの動作停止状態には、スタンバ
イ状態、サスペンド状態、又はハイバネーション状態が
含まれることを特徴とする付記1又2に記載のクラスタ
システム。 (付記7) 異なる周辺機器に接続されているノード上
で実行されているジョブを、同一の周辺機器に接続され
たノードに集めるプロセスマイグレーション機能を有す
ることを特徴とする付記1乃至6のいずれかに記載のク
ラスタシステム。 (付記8) 前記ノードは、ウエイクオンLANメッセ
ージを受けたときに起動することを特徴とした付記1又
は2に記載のクラスタシステム。 (付記9) 前記ノードは、内蔵モデムに着信信号を受
けたときに起動することを特徴とした付記1又は2に記
載のクラスタシステム。 (付記10) 前記ノードは、アドバンスドパフォーマ
ンスマネージメント機能によって該ノードの電源を管理
することを特徴とした付記1又は2に記載のクラスタシ
ステム。 (付記11) 前記ノードは、電力制御インタフェース
ACPIを有し、前記電力インタフェースACPIによ
り、前記ノードに備えられるOSから該ノードの電源を
管理することを特徴とする付記1又は2に記載のクラス
タシステム。
【0048】
【発明の効果】以上説明したように、本発明によれば、
複数のノードからなるクラスタシステムにおいて、アイ
ドル状態のノードに対して動作停止状態とすることによ
り、アイドル状態のノードが存在することによるクラス
タシステムの無駄な消費電力の増大を防ぎ、クラスタシ
ステムの省電力化を実現することができる。
【図面の簡単な説明】
【図1】クラスタシステムにおけるノードの動作状態を
説明する図である。
【図2】本実施形態のクラスタシステムの一ノード内に
おけるサスペンド状態への移行動作と、リジュームでの
復帰動作を説明する図である。
【図3】ソフトウエアのアイドルループにおける実行コ
マンド群を説明する図である。
【図4】マルチスレッドテンプレートライブラリにおけ
るinvokeテンプレートを示す図である。
【図5】異なるノード間におけるサスペンドとリジュー
ムとが競合状態にある場合を説明する図である。
【図6】プロセスマイグレーションを本実施形態のクラ
スタシステムに適用した場合を説明する図である。
【符号の説明】
1…クラスタシステムソフトウエア 2…OS 3…BIOS 4…ハードウエア 5…ネットワークインタフェース

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 アプリケーションを複数のノードに分散
    処理させるノードの動作管理を行うクラスタシステムに
    おいて、 前記ノードがアイドル状態のときには当該ノードの動作
    を停止状態にさせ、前記ノードが前記処理を実行すると
    きに当該ノードの起動を行うことを特徴とするクラスタ
    システム。
  2. 【請求項2】 前記ノードは、自ノードのアイドル状態
    を検出して該ノードの動作を停止状態にする機能を備え
    ることを特徴とする請求項1に記載のクラスタシステ
    ム。
  3. 【請求項3】 複数の前記ノードの動作状態を記憶する
    記憶手段を有し、 前記ノードを起動する際に、当該ノードについて起動状
    態であることが記憶されている場合には、当該ノードに
    対しては起動信号を出さないことを特徴とする請求項1
    又は2に記載のクラスタシステム。
  4. 【請求項4】 複数の段階による省電力状態が設定さ
    れ、 前記ノードのアイドル時間が長くなるにつれて次第に省
    電力状態の段階を上げていく機能を備えることを特徴と
    する請求項1又2に記載のクラスタシステム。
  5. 【請求項5】 異なる周辺機器に接続されているノード
    上で実行されているジョブを、同一の周辺機器に接続さ
    れたノードに集めるプロセスマイグレーション機能を有
    することを特徴とする付記1乃至4のいずれかに記載の
    クラスタシステム。
JP2001358105A 2001-11-22 2001-11-22 クラスタシステム Withdrawn JP2003162515A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001358105A JP2003162515A (ja) 2001-11-22 2001-11-22 クラスタシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001358105A JP2003162515A (ja) 2001-11-22 2001-11-22 クラスタシステム

Publications (1)

Publication Number Publication Date
JP2003162515A true JP2003162515A (ja) 2003-06-06

Family

ID=19169343

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001358105A Withdrawn JP2003162515A (ja) 2001-11-22 2001-11-22 クラスタシステム

Country Status (1)

Country Link
JP (1) JP2003162515A (ja)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005352864A (ja) * 2004-06-11 2005-12-22 Canon Inc 入出力装置および入力装置の制御方法
JP2007310876A (ja) * 2006-05-16 2007-11-29 Samsung Electronics Co Ltd タスク実行のための装置及び方法
JP2007536657A (ja) * 2004-05-08 2007-12-13 インターナショナル・ビジネス・マシーンズ・コーポレーション 仮想マシン・コンピュータ・プログラムの動的マイグレーション
US7358643B2 (en) 2004-11-12 2008-04-15 Brother Kogyo Kabushiki Kaisha Piezoelectric actuator, method for manufacturing piezoelectric actuator, and liquid transporting apparatus
JP2008521127A (ja) * 2004-11-17 2008-06-19 レイセオン カンパニー ハイパフォーマンスコンピューティング(hpc)システムにおけるフォルトトレランス及びリカバリ
WO2008117472A1 (ja) * 2007-03-27 2008-10-02 Fujitsu Limited コンピュータ、遠隔起動方法、および遠隔起動プログラム
WO2008146677A1 (ja) * 2007-05-24 2008-12-04 Nec Corporation 仮想マシン管理装置、仮想マシン管理方法および仮想マシン管理プログラム
US7958508B2 (en) 2007-03-09 2011-06-07 Hitachi, Ltd. Method of power-aware job management and computer system
JP2012190101A (ja) * 2011-03-09 2012-10-04 Nec Corp クラスタシステム
US8910175B2 (en) 2004-04-15 2014-12-09 Raytheon Company System and method for topology-aware job scheduling and backfilling in an HPC environment
US9037833B2 (en) 2004-04-15 2015-05-19 Raytheon Company High performance computing (HPC) node having a plurality of switch coupled processors
US9158676B2 (en) 2012-05-04 2015-10-13 Samsung Electronics Co., Ltd. Nonvolatile memory controller and a nonvolatile memory system
US9178784B2 (en) 2004-04-15 2015-11-03 Raytheon Company System and method for cluster management based on HPC architecture
US9201707B2 (en) 2011-02-02 2015-12-01 Nec Corporation Distributed system, device, method, and program
US10802832B2 (en) 2017-12-15 2020-10-13 Fujitsu Limited Information processing device and method of controlling computers
US10928883B2 (en) 2018-01-23 2021-02-23 Nec Corporation System management device

Cited By (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9904583B2 (en) 2004-04-15 2018-02-27 Raytheon Company System and method for topology-aware job scheduling and backfilling in an HPC environment
US9189278B2 (en) 2004-04-15 2015-11-17 Raytheon Company System and method for topology-aware job scheduling and backfilling in an HPC environment
US9037833B2 (en) 2004-04-15 2015-05-19 Raytheon Company High performance computing (HPC) node having a plurality of switch coupled processors
US8984525B2 (en) 2004-04-15 2015-03-17 Raytheon Company System and method for topology-aware job scheduling and backfilling in an HPC environment
US8910175B2 (en) 2004-04-15 2014-12-09 Raytheon Company System and method for topology-aware job scheduling and backfilling in an HPC environment
US11093298B2 (en) 2004-04-15 2021-08-17 Raytheon Company System and method for topology-aware job scheduling and backfilling in an HPC environment
US10769088B2 (en) 2004-04-15 2020-09-08 Raytheon Company High performance computing (HPC) node having a plurality of switch coupled processors
US9594600B2 (en) 2004-04-15 2017-03-14 Raytheon Company System and method for topology-aware job scheduling and backfilling in an HPC environment
US9832077B2 (en) 2004-04-15 2017-11-28 Raytheon Company System and method for cluster management based on HPC architecture
US10621009B2 (en) 2004-04-15 2020-04-14 Raytheon Company System and method for topology-aware job scheduling and backfilling in an HPC environment
US9178784B2 (en) 2004-04-15 2015-11-03 Raytheon Company System and method for cluster management based on HPC architecture
US9928114B2 (en) 2004-04-15 2018-03-27 Raytheon Company System and method for topology-aware job scheduling and backfilling in an HPC environment
US10289586B2 (en) 2004-04-15 2019-05-14 Raytheon Company High performance computing (HPC) node having a plurality of switch coupled processors
JP2007536657A (ja) * 2004-05-08 2007-12-13 インターナショナル・ビジネス・マシーンズ・コーポレーション 仮想マシン・コンピュータ・プログラムの動的マイグレーション
US8566825B2 (en) 2004-05-08 2013-10-22 International Business Machines Corporation Dynamic migration of virtual machine computer programs upon satisfaction of conditions
US8156490B2 (en) 2004-05-08 2012-04-10 International Business Machines Corporation Dynamic migration of virtual machine computer programs upon satisfaction of conditions
JP2005352864A (ja) * 2004-06-11 2005-12-22 Canon Inc 入出力装置および入力装置の制御方法
JP4565618B2 (ja) * 2004-06-11 2010-10-20 キヤノン株式会社 入出力装置および入出力装置の制御方法
US7560852B2 (en) 2004-11-12 2009-07-14 Brother Kogyo Kabushiki Kaisha Piezoelectric actuator, method for manufacturing piezoelectric actuator, and liquid transporting apparatus
US7358643B2 (en) 2004-11-12 2008-04-15 Brother Kogyo Kabushiki Kaisha Piezoelectric actuator, method for manufacturing piezoelectric actuator, and liquid transporting apparatus
JP2008521127A (ja) * 2004-11-17 2008-06-19 レイセオン カンパニー ハイパフォーマンスコンピューティング(hpc)システムにおけるフォルトトレランス及びリカバリ
JP2007310876A (ja) * 2006-05-16 2007-11-29 Samsung Electronics Co Ltd タスク実行のための装置及び方法
US8056077B2 (en) 2006-05-16 2011-11-08 Samsung Electronics Co., Ltd. Apparatus and method for performing a task
US7958508B2 (en) 2007-03-09 2011-06-07 Hitachi, Ltd. Method of power-aware job management and computer system
US8661238B2 (en) 2007-03-27 2014-02-25 Fujitsu Limited Identifying an OS corresponding to an address included in a magic packet and determining whether activation of the OS is permitted
JP5304640B2 (ja) * 2007-03-27 2013-10-02 富士通株式会社 コンピュータ、起動方法、および起動プログラム
WO2008117472A1 (ja) * 2007-03-27 2008-10-02 Fujitsu Limited コンピュータ、遠隔起動方法、および遠隔起動プログラム
JP5206674B2 (ja) * 2007-05-24 2013-06-12 日本電気株式会社 仮想マシン管理装置、仮想マシン管理方法および仮想マシン管理プログラム
US8250574B2 (en) 2007-05-24 2012-08-21 Nec Corporation Virtual machine management via use of table in which virtual machine information is registered on a time basis
WO2008146677A1 (ja) * 2007-05-24 2008-12-04 Nec Corporation 仮想マシン管理装置、仮想マシン管理方法および仮想マシン管理プログラム
US9201707B2 (en) 2011-02-02 2015-12-01 Nec Corporation Distributed system, device, method, and program
US8819459B2 (en) 2011-03-09 2014-08-26 Nec Corporation Reducing power consumption in cluster system of mutual standby type
JP2012190101A (ja) * 2011-03-09 2012-10-04 Nec Corp クラスタシステム
US9158676B2 (en) 2012-05-04 2015-10-13 Samsung Electronics Co., Ltd. Nonvolatile memory controller and a nonvolatile memory system
US10802832B2 (en) 2017-12-15 2020-10-13 Fujitsu Limited Information processing device and method of controlling computers
US10928883B2 (en) 2018-01-23 2021-02-23 Nec Corporation System management device

Similar Documents

Publication Publication Date Title
KR100745477B1 (ko) 단일 스레드와 동시 멀티스레드 모드간의 멀티스레드프로세서의 동적 스위칭
US10949249B2 (en) Task processor
US8171321B2 (en) Method and apparatus for cost and power efficient, scalable operating system independent services
JP2003162515A (ja) クラスタシステム
US7694158B2 (en) Parallel processing method and system, for instance for supporting embedded cluster platforms, computer program product therefor
JP4196333B2 (ja) 並列処理システム及び並列処理プログラム
US9047120B2 (en) Virtual queue processing circuit and task processor
US7523344B2 (en) Method and apparatus for facilitating process migration
US7797555B2 (en) Method and apparatus for managing power from a sequestered partition of a processing system
US20120272243A1 (en) Protecting high priority workloads in a virtualized datacenter
EP2495655B1 (en) Method for switching operating system and electronic apparatus using the same
US8468383B2 (en) Reduced power failover system
US20060085794A1 (en) Information processing system, information processing method, and program
EP2169514B1 (en) Methods and systems to perform a computer task in a reduced power consumption state
US20060149985A1 (en) Power management of multi-processor servers
US20100235662A1 (en) Server power manager and method for dynamically managing server power consumption
JP2015513735A (ja) ポータブルコンピューティングデバイスにおいて要求をスケジューリングするための方法およびシステム
US7636861B2 (en) Bus technique for controlling power states of blades in a blade enclosure
WO2014139379A1 (zh) 一种异构操作***中内核运行的方法及装置
US11366679B2 (en) Guest operating system wake-up method, device, electronic apparatus, and readable medium
JP2012243096A (ja) ゲストos管理装置、ゲストos管理方法及びゲストos管理プログラム
US8832483B1 (en) System-on-chip with power-save mode processor
JP3690666B2 (ja) マルチコンピュータシステム
US7210047B2 (en) Method of switching modes of a computer operating in a grid environment based on the current operating mode
US20180341482A1 (en) Method and arrangement for utilization of a processing arrangement

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20050201