JP5151203B2 - ジョブスケジューリング装置及びジョブスケジューリング方法 - Google Patents

ジョブスケジューリング装置及びジョブスケジューリング方法 Download PDF

Info

Publication number
JP5151203B2
JP5151203B2 JP2007079429A JP2007079429A JP5151203B2 JP 5151203 B2 JP5151203 B2 JP 5151203B2 JP 2007079429 A JP2007079429 A JP 2007079429A JP 2007079429 A JP2007079429 A JP 2007079429A JP 5151203 B2 JP5151203 B2 JP 5151203B2
Authority
JP
Japan
Prior art keywords
computer
job
temperature
power consumption
computers
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007079429A
Other languages
English (en)
Other versions
JP2008242614A (ja
Inventor
俊祐 秋元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2007079429A priority Critical patent/JP5151203B2/ja
Publication of JP2008242614A publication Critical patent/JP2008242614A/ja
Application granted granted Critical
Publication of JP5151203B2 publication Critical patent/JP5151203B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Power Sources (AREA)

Description

本発明はジョブスケジューリング装置及びジョブスケジューリング方法に係り、特に計算機にジョブを割り当てるジョブスケジューリング装置及びジョブスケジューリング方法に関する。
近年、計算機の単位体積当たりの処理能力の進歩に伴って、その単位体積当たりの消費電力や発熱量も増え続けている。最近では、計算機の処理性能は自身の消費電力による発熱量に制限されるようになってきている。この傾向は、複数の計算機によって構成される並列計算機システムにおいても同様であるが、各計算機を密接して設置することの多い並列計算機システムにおいては個別に設置される熱対策以上に熱の問題への緻密な対応が求められている。
並列計算機システムにおける熱対策としては、例えば各計算機が最大出力で運用されるような状況下であっても、過熱によって計算機が停止したりパフォーマンスが低下したりすることのないよう、予め計算機同士をある程度離して設置する方法が最も安全な対策であると考えられる。しかし、近年の計算機の運用を考えると、全ての計算機が最大出力で運用されるような状況は稀なケースである場合が多い。そのような運用を考慮してサーバを離して配置した場合、システム全体の単位体積当りの計算能力は落ちてしまう。限られた体積で性能が求められる場合、ある程度密着して計算機を配置し、運用で熱対策を行う必要性が求められる。また、近年、計算機の消費電力の増加にマシンルームの設備投資が間に合わず、冷却能力の足りないマシンルームで発熱の多い計算機を運用したいといった要求もよくある。このような場合も運用で熱問題を解決する必要があるだろう。
そのような運用の一形態として、ジョブの配置を工夫することで発熱する計算機を分散させ、特定の計算機の過熱を防ぐという手法がある。しかしながら、ある計算機にジョブ配置することによる他の計算機への温度の影響を考慮しながら緻密にジョブの配置を行うジョブスケジューリング手法はまだ提案されていない。
運用における柔軟な熱対策の一つとして、ジョブスケジューリングを工夫することにより、熱の発生を分散させ、ある箇所の温度が極度に過熱しないように制御する方法が考えられる。その一手法として、各計算機の温度をモニタし、常に最も温度の低い計算機にジョブを割り当てるというジョブスケジューリング装置が既に提案されている(例えば、特許文献1参照)。
また、マルチプロセッサシステムにおいて、制御用ICが過熱する可能性があるプロセッサがあるか否か確認し、過熱する可能性が無い場合には、プロセッサの割当に従ってスレッドのディスパッチを行い、過熱する可能性が有る場合には、現状の空きプロセッサに加えて新しい空きプロセッサができるまでジョブの割当を待機することにより、過熱による処理停止の発生を抑制するようにしたマルチプロセッサシステムも知られている(例えば、特許文献2参照)。
更に、プロセッサの予測温度を計算し、予測温度が条件の範囲内であれば、プロセッサに対しタスクを割り当てるプロセッサシステムも知られている(例えば、特許文献3参照)。
特開2004−126968号公報(第6頁) 特開2006−099624号公報(第9頁) 特開2006−133995号公報(第12−13頁)
しかしながら、特許文献1記載の従来のジョブスケジューリング装置では、ジョブの割り当てによる周囲温度の変化については考慮されておらず、限界温度ぎりぎりで動作していた計算機Aの近くの計算機Bに消費電力の高いジョブを割り当てることで、計算機Aの周辺温度が上がり、計算機Aがダウンしてしまうといったことが考えられる。
また、特許文献2や特許文献3記載の発明では、タスクを割り当てることで発生する一時的な発熱量のみを参考として温度予測を行っているので、精度の高い温度予測ができず、計算機がダウンするリスクが高い。更に、特許文献1〜3記載の発明はいずれも計算機へのジョブ割当によって発生する熱量が周辺の計算機に及ぼす二次的な温度変化を用いて温度予測したり、周辺の計算機で発生する発熱量も考慮に入れた温度予測をしていないため、計算機がダウンしない範囲でより高いパフォーマンスを引き出すことができない。
本発明は以上の点に鑑みなされたもので、周辺の計算機の発熱量も考慮した温度予測を行うことにより、システムの過熱による計算機のパフォーマンスダウンやシステムダウンを防止し得るジョブスケジューリング装置及びジョブスケジューリング方法を提供することを目的とする。
また、本発明の他の目的は、冷却能力の不足したマシンルームで計算機を運用する場合でも、決められた温度制限の中で最大限の能力を引き出すことが可能なジョブスケジューリング装置及びジョブスケジューリング方法を提供することにある。
上記の目的を達成するため、本発明のジョブスケジューリング装置は、複数の計算機にネットワークを介して接続され、各計算機毎にジョブを割り当てるジョブスケジューリング装置であって、割り当て可能な全てのジョブを予め複数の種類に分類し、複数の計算機のそれぞれについてジョブを割り当てた計算機の消費電力とジョブの実行時間とを対応させた履歴を種類毎に記憶したジョブ履歴テーブルを有し、割り当てようとする所望のジョブに応じた種類の分類結果を出力するジョブ分類手段と、ジョブ分類手段の分類結果に基づき各計算機のジョブ履歴テーブルを参照して得た、所望のジョブの種類における平均消費電力及び平均ジョブ実行時間から、所望のジョブを複数の計算機の各計算機に別々に割り当てた時の、各計算機毎の消費電力量増加分を予測し、その消費電力量増加分の予測値と、複数の計算機のそれぞれから入力される各計算機毎に検出された少なくとも各計算機の内部の温度情報及び消費電力情報とから、所望のジョブを複数の計算機のうちの一の計算機に割り当てた時の、一の計算機及び一の計算機の周辺の計算機のそれぞれの温度変化を予測することを複数の計算機の各計算機について行い、得られた各計算機の温度変化の予測値に基づいて所望のジョブを割り当てる計算機を決定する割当決定手段と、割当決定手段により決定された計算機に対して、所望のジョブを割り当てるジョブ割当手段と、ジョブを割り当てられた計算機の一定時間後の消費電力情報を取得し、ジョブの完了後にそのジョブの種類をインデックスとして、ジョブ完了までの時間とジョブ実行中の消費電力の値とをジョブ履歴テーブルに追加更新するジョブ履歴テーブル管理手段とを有することを特徴とする。
また、上記の目的を達成するため、本発明のジョブスケジューリング装置は、複数の計算機のそれぞれの大きさ情報、計算機設置位置情報及び設置場所の冷却能力情報に基づく各計算機毎の環境情報を保存する環境情報保存装置を有すると共に、複数の計算機は環境温度を計測する環境温度計測手段を更に有しており、
割当決定手段は、所望のジョブを割り当てた一の計算機であるジョブ割り当て計算機とそのジョブ割り当て計算機の周辺の計算機のそれぞれの温度変化の予測値と、環境温度計測手段からの環境温度との和である各計算機の予測温度が、ジョブ割り当て計算機及びジョブ割り当て計算機の周辺の計算機のそれぞれに環境情報保存装置から読み出した環境情報に基づいて設定されている最大許容環境温度を超えず、かつ、予測温度と最大許容環境温度との差の温度が最小値を示し、かつ、最小値を示す差の温度のうち最大の差の温度を示したときのジョブ割り当て計算機をジョブを割り当てる計算機として決定し、最大の差の温度を示す計算機が存在しない場合、ジョブの割り当てを保留することを特徴とする。
この発明では、計算機が設置される場所(マシンルーム)の冷却能力が不足している場合は、決められた温度制限(最大許容環境温度)の中でジョブ割当に適した計算機を求めることができる。この場合、その計算機システムの最高性能を引き出すことはできないが、コスト対パフォーマンスのバランスを見て意図的にマシンルームへの投資を抑えたり、マシンルームの設備が整わないうちに計算能力の高い最新の計算機を動作させておいて、後から設備を整えたりすることが可能となる。
また、この発明では予想の結果、条件を満たす計算機が見付けられない場合、ジョブの割り当てを保留し、現在割り当てられているジョブが終了するのを待つ。これにより、温度問題によるシステムダウンやパフォーマンスダウンを回避することが可能である。
また、上記の目的を達成するため、本発明のジョブスケジューリング装置は、上記の割当決定手段が、複数の計算機のそれぞれから入力される各計算機毎に検出された少なくとも各計算機の内部の温度情報及び消費電力情報とに基づいて、所望のジョブを各計算機に割り当てる前と割り当てた後の各計算機の温度の差分を計測し、各計算機毎に消費電力情報が示す消費電力量の上昇値と計測した温度の差分が示す温度の上昇値との相関関係から相関関数を求め、その相関関数を用いて各計算機の消費電力量の上昇値に基づいて周辺の計算機における温度上昇値を推定し、その推定値に基づいて所望のジョブを割り当てる計算機を決定する手段であることを特徴とする。
また、上記の目的を達成するため、本発明のジョブスケジューリング方法は、複数の計算機にネットワークを介して接続され、各計算機毎にジョブを割り当てるジョブスケジューリング方法であって、割り当て可能な全てのジョブを予め複数の種類に分類し、複数の計算機のそれぞれについてジョブを割り当てた計算機の消費電力とジョブの実行時間とを対応させた履歴を種類毎に記憶したジョブ履歴テーブルを有し、割り当てようとする所望のジョブに応じた種類の分類結果を出力する第1のステップと、第1のステップの分類結果に基づき各計算機のジョブ履歴テーブルを参照して得た、所望のジョブの種類における平均消費電力及び平均ジョブ実行時間から、所望のジョブを複数の計算機の各計算機に別々に割り当てた時の、各計算機毎の消費電力量増加分を予測する第2のステップと、第2のステップによる消費電力量増加分の予測値と、複数の計算機のそれぞれから入力される各計算機毎に検出された少なくとも各計算機の内部の温度情報及び消費電力情報とから、所望のジョブを複数の計算機のうちの一の計算機に割り当てた時の、一の計算機及び一の計算機の周辺の計算機のそれぞれの温度変化を予測することを複数の計算機の各計算機について行い、得られた各計算機の温度変化の予測値に基づいて所望のジョブを割り当てる計算機を決定する第3のステップと、第3のステップにより決定された計算機に対して、所望のジョブを割り当てる第4のステップと、ジョブを割り当てられた計算機の一定時間後の消費電力情報を取得し、ジョブの完了後にそのジョブの種類をインデックスとして、ジョブ完了までの時間とジョブ実行中の消費電力の値とをジョブ履歴テーブルに追加更新する第5のステップとを含むことを特徴とする。
本発明では、ジョブスケジューリング装置が各計算機の設置位置や周辺環境などの情報を持ち、数値計算によりジョブの投入や移動による各計算機の周辺の温度変化を予測し、その予測に基づいてジョブ割り当てを行う計算機を決定することができる。各計算機の周辺の温度変化の予測には、予めジョブを割り当てたときの発熱量を予測しておく必要がある。本発明では、実際にジョブを割り当てたときの消費電力増加の履歴を残しておき、そこから類推する手法をとる。ジョブは予め何種類かに分類しておき、履歴はその種類毎にとられる。消費電力の予測値は、ジョブを割り当てる前の消費電力値と、履歴情報の平均値などからある程度の精度で求めることが可能である。
本発明によれば、ジョブを各計算機に割り当てた時の自計算機と周辺の全ての計算機の温度変化をそれぞれ予測し、その予測値に基づいて所望のジョブを割り当てる計算機を決定することで、ジョブを割り当てた結果発生する発熱量だけでなく、周辺の計算機の発熱量をも含めて温度予測してジョブの割り付けを決定することができ、システムを構成する複数の計算機のうち特定の計算機で過熱が起きることを防ぎ、システムのダウンや全体パフォーマンスの低下を予防することができる。
また、本発明によれば、冷却能力の不足したマシンルームで計算機を運用する場合でも、決められた温度制限の中で最大限の能力を引き出すことができ、予想の結果、条件を満たす計算機が見付けられない場合、ジョブの割り当てを保留し、現在割り当てられているジョブが終了するのを待つことで、温度問題によるシステムダウンやパフォーマンスダウンを回避することが可能である。
次に、本発明を実施するための最良の形態について図面と共に説明する。図1は本発明になるジョブスケジューリング装置の一実施の形態の構成図を示す。同図において、並列計算機システム100は、ネットワーク101によって各計算機111、112、113などを接続した計算機システムである。この並列計算機システム100におけるジョブの割り付けは、同じネットワーク101に接続されたスケジューリング装置103が行う。各計算機111、112、113は環境温度センサ121、CPU温度センサ122、並びに消費電力センサ123を備えており、スケジューリング装置103はネットワーク101を通じてこれらの情報を読み出すことができる。また、各計算機111、112、113には、最大許容環境温度124が設定されており、同様にスケジューリング装置103から読み出すことができる。この最大許容環境温度情報は、例えば不揮発性メモリに予め設定されているものとする。別の実装としては、最大許容環境温度124は外から書き換え可能として、マシンルームの冷却能力に応じて設定するという実装も考えられる。
本実施の形態では、各計算機111、112、113は環境温度センサ121の値とCPU温度センサ122の値とに応じて自動的に計算機内の冷却温度を調整する。この冷却制御は、例えばBMC(Baseboard Management Controller)などが行う。この機能により、本実施の形態では各計算機111、112、113の内部の冷却については考慮しない。
また、ネットワーク101には各計算機111、112、113が設置されている位置情報を保存しておくための環境情報保存装置102が接続されている。この環境情報もまたスケジューリング装置103から読み出し可能である。また、別の実装方法として、位置情報は各計算機111、112、113に保存されているという実装も考えられる。また、環境温度保存装置102には、より正確な温度予測を行うためのデータとして、各計算機111、112、113の大きさ情報(幅、奥行き、高さ)、各計算機111、112、113が設置してあるマシンルームの構造情報、マシンルームの冷却能力を保存している。スケジューリング装置103はこれらの情報を読み出して、演算の際の境界条件として用いることで、温度予測を正確に行うことができる。
図2はスケジューリング装置103の一例の構成図を示す。同図において、割当決定部203は各計算機111、112、113の温度センサ値、消費電力センサ値、ジョブを割り付けた際の消費電力の予測値、環境パラメータなどを基に計算機間にジョブを割り当てた際の温度変化を予測し、その予測値を基にジョブの割り付け先計算機を決定する。また、ジョブ分類器201、ジョブ履歴テーブル202、履歴テーブル管理部204は、ジョブの消費電力を予測するために存在する。
全てのジョブに対して増加消費電力分を予想するのは難しいため、ジョブを予め複数の種類に分類し、ジョブ履歴テーブル202にはこれらの種類毎に履歴がとられる。この場合のジョブの種類とは、例えばデータベース検索トランザクション、ウェブ(Web)リクエスト、データ処理などであり、スケジューリング装置103が分類を行う。
図3はジョブ履歴テーブル202の一例を示す。同図に示すように、ジョブ履歴テーブル202は、Webリクエスト、データベース検索、データ処理1、データ処理2のジョブの種類毎に、履歴、消費電力増加、ジョブ時間とを対応付けて記憶している。このジョブ履歴テーブル202は図1のネットワーク101に接続されているスケジューリング装置103がジョブを決定する複数の計算機111、112、113のそれぞれに対応して設けられている。従って、図3に示すジョブ履歴テーブル202はネットワークに接続されたある一つの計算機についてのジョブ履歴テーブルであり、その中の「履歴」はその一つの計算機の履歴である。
次に、本実施の形態の動作について詳細に説明する。まず、図1の環境情報保存部102に対して、予め各計算機111、112、113の設置位置情報を入力しておく。この設置位置情報は、マシンルーム内における縦方向、横方向、高さ方向といった簡単な情報でもよい。この設置位置情報の入力は人手で行うことを想定しているが、各計算機111、112、113の設置位置情報はRFIDなどの公知の技術を用いて自動的に入力される手段が提供されてもよい。また、同様に、環境温度の計算に必要な各種パラメータを図1の環境情報保存装置102に設定しておく。これは例えば、各計算機111、112、113の大きさ情報、マシンルームの構造情報、各計算機111、112、113の排熱方向、マシンルーム全体の排熱能力、などの情報である。
図4(A)、(B)はジョブを割り当てる先の計算機の決定方法を説明するための構成図とフローチャートを示す。図4(A)、(B)に示すように、ジョブ分類器201でジョブを分類し(ステップS1)、割当決定部203がジョブ履歴テーブル202からジョブを割り当てた際の消費電力の増加分の予想値を得る。同時に、各計算機111、112、113の環境温度センサ121の値、各計算機111、112、113の環境パラメータを取得する(ステップS2)。
続いて、割当決定部203は各計算機にジョブを割り当てたときの全ての計算機111、112、113における一定時間後の環境温度を予測して割当先を決定する(ステップS3)。その後、ジョブ分類器201が割当先にジョブの割り当てを行う(ステップS4)。
上記のジョブの割り当てについて、具体的に説明する。スケジューリング装置103は、あるジョブをある計算機Nに割り当てたときの消費電力の増加分W_Nを、例えば図3のジョブの種類毎の履歴の平均で推定する。図3が例えば図1の計算機111のジョブ履歴テーブルであれば、計算機111に各ジョブを割り当てた時の平均消費電力量の増加分は、平均消費電力と平均時間とから以下の表1のように求められる。
Figure 0005151203
これを各計算機について計算し、その消費電力量に基づいて、ジョブの割当先の計算機を決定する。
次に、ステップS4のジョブ割当先の決定方法について更に具体的に説明する。まず、ある計算機NにジョブKを割り当てた時の消費電力の増加量Ws(N,K)に基づいて、ジョブKを割り当てた一の計算機である自計算機(ここでは、計算機N)と周辺の計算機の温度の上昇値を推定する。計算機NにジョブKを割り当てた時の、計算機N又は周辺の計算機Mの温度の上昇推定量をTup(M,N,K)として、全ての周辺の計算機Mについて上限環境温度Tlim(M)を超えないN,Kの組み合わせを探索し、割り当て行う。
例えば、図1の計算機111、112、113を計算機1,2,3と表記すると共に、これらの計算機のジョブを割り当てる前の環境温度が表2のように示されるものとし、またこれらの計算機の上限環境温度を40℃とし、Webリクエストのジョブを各計算機に割り当てたときの、各計算機の平均消費電力量が表3のようになったものとする。
Figure 0005151203
Figure 0005151203
次に、その平均消費電力量を用いて計算機xにジョブを割り当てた時の、計算機(自計算機と他計算機)yの温度上昇量の推定値を表4のように求め、計算機xにジョブを割り当てた時の、計算機(自計算機と他計算機)yの温度の推定値を表5のように求める。
Figure 0005151203
Figure 0005151203
ただし、表4及び表5において縦軸の計算機は上記の計算機xを示し、横軸の計算機は上記の計算機yを示す。従って、例えば、表4の2行1列目の「0.3」は計算機2(112)にジョブを割り当てた時の、計算機1(111)の温度上昇の推定値を示し、表5の2行1列目の「37.5」は計算機2(112)にジョブを割り当てた時の、計算機1(111)の温度の推定値を示す。
その結果、表5から計算機1(111)にジョブを割り当てたときは、上限環境温度(40℃)と温度推定値との差分が最も小さな計算機yは計算機2(112)の1.2℃であり、また、計算機2(112)にジョブを割り当てたときは、上限環境温度(40℃)と温度推定値との差分が最も小さな計算機yは計算機2(112)の0.2℃であり、また、計算機3(113)にジョブを割り当てたときは、上限環境温度(40℃)と温度推定値との差分が最も小さな計算機yは計算機2(112)の1.25℃であることが分かる。このうち、差分温度が最も大きな1.25℃はジョブを計算機3(113)に割り当てた場合であるので、計算機3(113)に割り当てるのが最も上限環境温度(40℃)からのマージンが大きいと推定できるため、スケジューリング装置103は計算機3(113)にジョブを割り当てることになる。
次に、ジョブ管理テーブル202の管理について、図5(A)のスケジューリング装置103の構成図と同図(B)のフローチャートと共に説明する。まず、ジョブ分類器201はジョブを予めある程度の種類に分類する(ステップS11)。続いて、ジョブ分類器201はジョブ割当先の計算機を決定し(ステップS12)、ジョブを各計算機に投入した後(ステップS13)、履歴テーブル管理部204が一定時間後の投入計算機の消費電力センサ123の値を読んでおく(ステップS14)。
続いて、履歴テーブル管理部204は、計算機のジョブの完了を確認すると、そのジョブの種類をインデックスとして、ジョブ完了までの時間と、ジョブ実行中の消費電力センサ123で検出した消費電力値をジョブ履歴テーブル202に追加書き込みをする(ステップS15)。ジョブ履歴テーブル202は各ジョブの種類に対して有限のエントリしか持ち得ないため、ラウンドロビン方式でエントリを上書きしていく。
ところで、消費電力上昇値から他の計算機の温度上昇の推定値を求める方法としては、以下の方法がある。スケジューリング装置103がまず、ジョブを割り当てる度に図3のような消費電力の履歴を取り、これから消費電力量を求め、続いてジョブを割り当てる前とジョブが終了した時の全計算機の温度の差分をとる。続いて、スケジューリング装置103は、各計算機毎に消費電力量の上昇値と温度の上昇値の図6に示すような相関図を作成し、それに基づいて相関関数を求める(例えば、一次式で)。この相関関数を用いて、スケジューリング装置103は各計算機毎に、その計算機の消費電力量の上昇値から他の計算機における温度上昇値を推定する。
なお、前記環境温度の予測は、熱拡散を数値計算で解くことによって得ることもできる。この場合はスケジューリング装置103は、このために必要な情報を環境情報保存装置102から読み出し、適当な大きさの格子を設定して熱伝導や対流による温度変化の時間発展を数値計算する。系がある程度平衡に達したと判断したら数値計算を止め、そのときの他の各計算機における温度変化の予想値を記憶しておく。
スケジューリング装置103は、この予想を全ての計算機111、112、113に対して行い、温度条件が最も緩くなるジョブの割り当てを採用する。温度条件が最も緩いジョブの割り当てとは、温度条件が最もシビアな計算機(最大許容環境温度と環境温度の差が最も小さな計算機)の最大許容環境温度と環境温度の差が最も大きくなる割り当てである。すなわち、計算機iにジョブを割り付けた際の計算機j(自計算機iも含む)における予想環境温度をTijとし、また、計算機jの最大許容環境温度をTCjとすると、ジョブを各計算機iに割り当てた時の各計算機jそれぞれにおける最大許容環境温度TCjと予想環境温度Tijとの差分の温度が最も小さな複数の計算機jのうち、最大の差分温度を示すときのジョブが割り当てられている計算機i、すなわち、max_i(min_j(TCj-Tij))を満たす割り当て計算機iを求める。この計算機iが温度条件が最も緩くなるジョブの割当先計算機となる。
このような計算機iが存在しない場合、スケジューリング装置103は、ジョブの割り当てをペンディングし、現在実行されているジョブが一つでも終了するのを待ち、再度割当先を決定する。また、各計算機の最大許容環境温度は書き換え可能にして、マシンルームの冷却能力が不足しているような場合に、この値を調整することでマシンルームの冷却能力を超える過熱を防ぐ運用を行うこともできる。この場合の設定値TC_limitは、計算機を設置する際に予め求めておく。
本発明のジョブスケジューリング装置の一実施の形態の構成図である。 図1中のスケジューリング装置の一例の構成図である。 図2中のジョブ履歴テーブルの一例を示す図である。 ジョブを割り当てる先の計算機の決定方法を説明するためのスケジューリング装置の構成図と動作説明用フローチャートである。 ジョブ管理テーブルの管理方法を説明するためのスケジューリング装置の構成図と動作説明用フローチャートである。 計算機の消費電力量上昇と温度上昇との相関関係の一例を示す図である。
符号の説明
100 並列計算機システム
101 ネットワーク
102 環境情報保存装置
103 スケジューリング装置
111、112、113 計算機
121 環境温度センサ
122 CPU温度センサ
123 消費電力センサ
124 最大許容環境温度
201 ジョブ分類器
202 ジョブ履歴テーブル
203 割当決定部
204 履歴テーブル管理部

Claims (6)

  1. 複数の計算機にネットワークを介して接続され、各計算機毎にジョブを割り当てるジョブスケジューリング装置であって、
    割り当て可能な全てのジョブを予め複数の種類に分類し、前記複数の計算機のそれぞれについてジョブを割り当てた計算機の消費電力とジョブの実行時間とを対応させた履歴を前記種類毎に記憶したジョブ履歴テーブルを有し、割り当てようとする所望のジョブに応じた種類の分類結果を出力するジョブ分類手段と、
    前記ジョブ分類手段の前記分類結果に基づき各計算機の前記ジョブ履歴テーブルを参照して得た、前記所望のジョブの種類における平均消費電力及び平均ジョブ実行時間から、前記所望のジョブを前記複数の計算機の各計算機に別々に割り当てた時の、各計算機毎の消費電力量増加分を予測し、その消費電力量増加分の予測値と、前記複数の計算機のそれぞれから入力される各計算機毎に検出された少なくとも各計算機の内部の温度情報及び消費電力情報とから、前記所望のジョブを前記複数の計算機のうちの一の計算機に割り当てた時の、前記一の計算機及び前記一の計算機の周辺の計算機のそれぞれの温度変化を予測することを前記複数の計算機の各計算機について行い、得られた各計算機の前記温度変化の予測値に基づいて前記所望のジョブを割り当てる計算機を決定する割当決定手段と、
    前記割当決定手段により決定された計算機に対して、前記所望のジョブを割り当てるジョブ割当手段と
    ジョブを割り当てられた計算機の一定時間後の消費電力情報を取得し、ジョブの完了後にそのジョブの種類をインデックスとして、ジョブ完了までの時間とジョブ実行中の消費電力の値とを前記ジョブ履歴テーブルに追加更新するジョブ履歴テーブル管理手段と
    を有することを特徴とするジョブスケジューリング装置。
  2. 前記複数の計算機のそれぞれの大きさ情報、計算機設置位置情報及び設置場所の冷却能力情報に基づく各計算機毎の環境情報を保存する環境情報保存装置を有すると共に、前記複数の計算機は環境温度を計測する環境温度計測手段を更に有しており、
    前記割当決定手段は、
    前記所望のジョブを割り当てた前記一の計算機であるジョブ割り当て計算機とそのジョブ割り当て計算機の周辺の計算機のそれぞれの前記温度変化の予測値と、前記環境温度計測手段からの前記環境温度との和である各計算機の予測温度が、前記ジョブ割り当て計算機及び前記ジョブ割り当て計算機の周辺の計算機のそれぞれに前記環境情報保存装置から読み出した前記環境情報に基づいて設定されている最大許容環境温度を超えず、かつ、前記予測温度と前記最大許容環境温度との差の温度が最小値を示し、かつ、最小値を示す差の温度のうち最大の差の温度を示したときのジョブ割り当て計算機をジョブを割り当てる計算機として決定し、前記最大の差の温度を示す計算機が存在しない場合、ジョブの割り当てを保留することを特徴とする請求項1記載のジョブスケジューリング装置。
  3. 前記割当決定手段は、前記複数の計算機のそれぞれから入力される各計算機毎に検出された少なくとも各計算機の内部の温度情報及び消費電力情報とに基づいて、前記所望のジョブを各計算機に割り当てる前と割り当てた後の各計算機の温度の差分を計測し、各計算機毎に前記消費電力情報が示す消費電力量の上昇値と計測した温度の差分が示す温度の上昇値との相関関係から相関関数を求め、その相関関数を用いて各計算機の消費電力量の上昇値に基づいて周辺の計算機における温度上昇値を推定し、その推定値に基づいて前記所望のジョブを割り当てる計算機を決定する手段であることを特徴とする請求項1記載のジョブスケジューリング装置。
  4. 複数の計算機にネットワークを介して接続され、各計算機毎にジョブを割り当てるジョブスケジューリング方法であって、
    割り当て可能な全てのジョブを予め複数の種類に分類し、前記複数の計算機のそれぞれについてジョブを割り当てた計算機の消費電力とジョブの実行時間とを対応させた履歴を前記種類毎に記憶したジョブ履歴テーブルを有し、割り当てようとする所望のジョブに応じた種類の分類結果を出力する第1のステップと、
    前記第1のステップの前記分類結果に基づき各計算機の前記ジョブ履歴テーブルを参照して得た、前記所望のジョブの種類における平均消費電力及び平均ジョブ実行時間から、前記所望のジョブを前記複数の計算機の各計算機に別々に割り当てた時の、各計算機毎の消費電力量増加分を予測する第2のステップと、
    前記第2のステップによる前記消費電力量増加分の予測値と、前記複数の計算機のそれぞれから入力される各計算機毎に検出された少なくとも各計算機の内部の温度情報及び消費電力情報とから、前記所望のジョブを前記複数の計算機のうちの一の計算機に割り当てた時の、前記一の計算機及び前記一の計算機の周辺の計算機のそれぞれの温度変化を予測することを前記複数の計算機の各計算機について行い、得られた各計算機の前記温度変化の予測値に基づいて前記所望のジョブを割り当てる計算機を決定する第3のステップと、
    前記第3のステップにより決定された計算機に対して、前記所望のジョブを割り当てる第4のステップと
    ジョブを割り当てられた計算機の一定時間後の消費電力情報を取得し、ジョブの完了後にそのジョブの種類をインデックスとして、ジョブ完了までの時間とジョブ実行中の消費電力の値とを前記ジョブ履歴テーブルに追加更新する第5のステップと
    を含むことを特徴とするジョブスケジューリング方法。
  5. 前記複数の計算機のそれぞれの大きさ情報、計算機設置位置情報及び設置場所の冷却能力情報に基づく各計算機毎の環境情報を保存する環境情報保存装置を有すると共に、前記複数の計算機は環境温度を計測する環境温度計測手段を更に有しており、
    前記第3のステップは、
    前記所望のジョブを割り当てた前記一の計算機であるジョブ割り当て計算機とそのジョブ割り当て計算機の周辺の計算機のそれぞれの前記温度変化の予測値と、前記環境温度計測手段からの前記環境温度との和である各計算機の予測温度が、前記ジョブ割り当て計算機及び前記ジョブ割り当て計算機の周辺の計算機のそれぞれに前記環境情報保存装置から読み出した前記環境情報に基づいて設定されている最大許容環境温度を超えず、かつ、前記予測温度と前記最大許容環境温度との差の温度が最小値を示し、かつ、最小値を示す差の温度のうち最大の差の温度を示したときのジョブ割り当て計算機をジョブを割り当てる計算機として決定し、前記最大の差の温度を示す計算機が存在しない場合、ジョブの割り当てを保留することを特徴とする請求項記載のジョブスケジューリング方法。
  6. 前記第3のステップは、前記複数の計算機のそれぞれから入力される各計算機毎に検出された少なくとも各計算機の内部の温度情報及び消費電力情報とに基づいて、前記所望のジョブを各計算機に割り当てる前と割り当てた後の各計算機の温度の差分を計測し、各計算機毎に前記消費電力情報が示す消費電力量の上昇値と計測した温度の差分が示す温度の上昇値との相関関係から相関関数を求め、その相関関数を用いて各計算機の消費電力量の上昇値に基づいて周辺の計算機における温度上昇値を推定する温度上昇値推定ステップと、前記温度上昇値の推定値に基づいて前記所望のジョブを割り当てる計算機を決定する決定ステップとからなることを特徴とする請求項記載のジョブスケジューリング方法。
JP2007079429A 2007-03-26 2007-03-26 ジョブスケジューリング装置及びジョブスケジューリング方法 Expired - Fee Related JP5151203B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007079429A JP5151203B2 (ja) 2007-03-26 2007-03-26 ジョブスケジューリング装置及びジョブスケジューリング方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007079429A JP5151203B2 (ja) 2007-03-26 2007-03-26 ジョブスケジューリング装置及びジョブスケジューリング方法

Publications (2)

Publication Number Publication Date
JP2008242614A JP2008242614A (ja) 2008-10-09
JP5151203B2 true JP5151203B2 (ja) 2013-02-27

Family

ID=39913919

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007079429A Expired - Fee Related JP5151203B2 (ja) 2007-03-26 2007-03-26 ジョブスケジューリング装置及びジョブスケジューリング方法

Country Status (1)

Country Link
JP (1) JP5151203B2 (ja)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5098978B2 (ja) * 2008-12-02 2012-12-12 富士通株式会社 消費電力削減支援プログラム、情報処理装置、および消費電力削減支援方法
JP5245852B2 (ja) * 2009-01-17 2013-07-24 日本電気株式会社 サーバ処理分散装置、サーバ処理分散方法及びサーバ処理分散プログラム
JP5531465B2 (ja) * 2009-06-30 2014-06-25 日本電気株式会社 情報システム、制御装置、そのデータ処理方法およびプログラム
JP5549131B2 (ja) 2009-07-07 2014-07-16 富士通株式会社 ジョブ割当装置、ジョブ割当方法及びジョブ割当プログラム
US8489745B2 (en) 2010-02-26 2013-07-16 International Business Machines Corporation Optimizing power consumption by dynamic workload adjustment
JP5601024B2 (ja) * 2010-05-20 2014-10-08 富士通株式会社 電力平準化方法、システム及びプログラム
JP5648397B2 (ja) 2010-09-28 2015-01-07 富士通株式会社 計算処理システム、そのジョブ分散配置方法及びジョブ分散配置プログラム
JP5597872B2 (ja) * 2010-10-21 2014-10-01 株式会社日立製作所 分散情報処理システム、分散情報処理方法及びデータ転送装置
WO2012081079A1 (ja) 2010-12-13 2012-06-21 富士通株式会社 情報処理装置、電力制御方法、および電力制御プログラム
JP5568535B2 (ja) * 2011-09-28 2014-08-06 株式会社日立製作所 データセンタの負荷割当て方法及び情報処理システム
JP5309200B2 (ja) * 2011-10-26 2013-10-09 株式会社野村総合研究所 運用管理装置および情報処理システム
JP5887846B2 (ja) * 2011-11-10 2016-03-16 日本電気株式会社 電力制御システムおよび電力制御方法
JP5801732B2 (ja) * 2012-01-24 2015-10-28 株式会社日立製作所 情報処理システムの運用管理方法
JP5787365B2 (ja) * 2012-09-18 2015-09-30 Necフィールディング株式会社 電力制御装置、電力制御システム、電力制御方法及びプログラム
JP6083305B2 (ja) * 2013-04-08 2017-02-22 富士通株式会社 電子機器冷却システム
JP6201530B2 (ja) * 2013-08-30 2017-09-27 富士通株式会社 情報処理システム、ジョブ管理装置、ジョブ管理装置の制御プログラム、及び、情報処理システムの制御方法
JP6349982B2 (ja) * 2014-06-06 2018-07-04 富士通株式会社 情報処理装置、情報処理装置の制御方法および情報処理装置の制御プログラム
JP6384321B2 (ja) * 2014-12-26 2018-09-05 富士通株式会社 ジョブ割当プログラム、方法及び装置
JP6826919B2 (ja) * 2017-03-14 2021-02-10 株式会社富士通アドバンストエンジニアリング データ分配装置及びデータ分配比率の決定方法
JP7367565B2 (ja) 2020-03-03 2023-10-24 富士通株式会社 電力制御装置および電力制御プログラム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07332709A (ja) * 1994-06-14 1995-12-22 Sekisui Chem Co Ltd 輻射冷暖房装置
JP2004240669A (ja) * 2003-02-05 2004-08-26 Sharp Corp ジョブスケジューラおよびマルチプロセッサシステム
US7051946B2 (en) * 2003-05-29 2006-05-30 Hewlett-Packard Development Company, L.P. Air re-circulation index
JP2005141669A (ja) * 2003-11-10 2005-06-02 Nippon Telegr & Teleph Corp <Ntt> グリッドコンピューティング及びグリッドコンピューティングにおける負荷分散方法
US8224639B2 (en) * 2004-03-29 2012-07-17 Sony Computer Entertainment Inc. Methods and apparatus for achieving thermal management using processing task scheduling
JP3781758B2 (ja) * 2004-06-04 2006-05-31 株式会社ソニー・コンピュータエンタテインメント プロセッサ、プロセッサシステム、温度推定装置、情報処理装置および温度推定方法
JP2006285317A (ja) * 2005-03-31 2006-10-19 Tokyo Electric Power Co Inc:The 負荷判定システム、負荷分散システムおよび異常検出システム

Also Published As

Publication number Publication date
JP2008242614A (ja) 2008-10-09

Similar Documents

Publication Publication Date Title
JP5151203B2 (ja) ジョブスケジューリング装置及びジョブスケジューリング方法
JP4895266B2 (ja) 管理システム、管理プログラムおよび管理方法
US9176483B2 (en) Unified and flexible control of multiple data center cooling mechanisms
US7877751B2 (en) Maintaining level heat emission in multiprocessor by rectifying dispatch table assigned with static tasks scheduling using assigned task parameters
Kaushik et al. T*: A data-centric cooling energy costs reduction approach for Big Data analytics cloud
US20120005505A1 (en) Determining Status Assignments That Optimize Entity Utilization And Resource Power Consumption
JP2011123873A (ja) データセンターにおいて電力を動的に割り当てる方法および装置
JP5891680B2 (ja) 電力制御装置、電力制御方法、および電力制御プログラム
US20090210741A1 (en) Information processing apparatus and information processing method
TWI533146B (zh) 虛擬資源調整裝置、方法及儲存其之電腦可讀取紀錄媒體
JP5098978B2 (ja) 消費電力削減支援プログラム、情報処理装置、および消費電力削減支援方法
US10095204B2 (en) Method, medium, and system
JP4930909B2 (ja) コンピュータ環境最適化システム、コンピュータ環境最適化方法、及びコンピュータ環境最適化プログラム
CN102693164A (zh) 防止缓存溢出的设备和方法
JP2017041191A (ja) リソース管理装置、リソース管理プログラム、及びリソース管理方法
KR20190042465A (ko) 분할 메모리 관리장치 및 방법
JP5853109B2 (ja) 計算機、計算機システムの制御装置及び記録媒体
JP2010072733A (ja) サーバ管理装置,サーバ管理方法及びプログラム
EP2277094A1 (en) Arrangement for operating a data center using building automation system interface
JP2016115213A (ja) 情報処理装置、データ処理方法、およびデータ処理プログラム
JP4749380B2 (ja) インストール管理方法とインストール管理プログラムとインストール管理装置
JP6960491B2 (ja) 管理システム及び基盤システムの管理方法
JPWO2015075803A1 (ja) 情報処理装置、方法、プログラム及び記録媒体
JP2018013971A (ja) 管理装置、情報処理方法、及びプログラム
JP2022121124A (ja) ジョブ割当制御装置、ジョブ割当制御方法、及び、ジョブ割当制御プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100302

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111128

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111206

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120203

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120605

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120803

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121106

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121119

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151214

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5151203

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees