JP2016126458A - ジョブ割当プログラム、方法及び装置 - Google Patents

ジョブ割当プログラム、方法及び装置 Download PDF

Info

Publication number
JP2016126458A
JP2016126458A JP2014265796A JP2014265796A JP2016126458A JP 2016126458 A JP2016126458 A JP 2016126458A JP 2014265796 A JP2014265796 A JP 2014265796A JP 2014265796 A JP2014265796 A JP 2014265796A JP 2016126458 A JP2016126458 A JP 2016126458A
Authority
JP
Japan
Prior art keywords
information
temperature
information processing
job
jobs
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014265796A
Other languages
English (en)
Other versions
JP6384321B2 (ja
Inventor
本間 毅
Takeshi Honma
毅 本間
保 仙石
Tamotsu Sengoku
保 仙石
徳富 長尾
Noritomi Nagao
徳富 長尾
尚明 小野
Naoaki Ono
尚明 小野
清治 神戸
Seiji Kambe
清治 神戸
裕治 伊藤
Yuji Ito
裕治 伊藤
春樹 服部
Haruki Hattori
春樹 服部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2014265796A priority Critical patent/JP6384321B2/ja
Priority to US14/974,365 priority patent/US10095204B2/en
Publication of JP2016126458A publication Critical patent/JP2016126458A/ja
Application granted granted Critical
Publication of JP6384321B2 publication Critical patent/JP6384321B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B15/00Systems controlled by a computer
    • G05B15/02Systems controlled by a computer electric
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F24HEATING; RANGES; VENTILATING
    • F24FAIR-CONDITIONING; AIR-HUMIDIFICATION; VENTILATION; USE OF AIR CURRENTS FOR SCREENING
    • F24F11/00Control or safety arrangements
    • F24F11/50Control or safety arrangements characterised by user interfaces or communication
    • F24F11/52Indication arrangements, e.g. displays
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F24HEATING; RANGES; VENTILATING
    • F24FAIR-CONDITIONING; AIR-HUMIDIFICATION; VENTILATION; USE OF AIR CURRENTS FOR SCREENING
    • F24F11/00Control or safety arrangements
    • F24F11/62Control or safety arrangements characterised by the type of control or by internal processing, e.g. using fuzzy logic, adaptive control or estimation of values
    • F24F11/63Electronic processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/20Cooling means
    • G06F1/206Cooling means comprising thermal management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5094Allocation of resources, e.g. of the central processing unit [CPU] where the allocation takes into account power or heat criteria
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F24HEATING; RANGES; VENTILATING
    • F24FAIR-CONDITIONING; AIR-HUMIDIFICATION; VENTILATION; USE OF AIR CURRENTS FOR SCREENING
    • F24F11/00Control or safety arrangements
    • F24F11/30Control or safety arrangements for purposes related to the operation of the system, e.g. for safety or monitoring
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F24HEATING; RANGES; VENTILATING
    • F24FAIR-CONDITIONING; AIR-HUMIDIFICATION; VENTILATION; USE OF AIR CURRENTS FOR SCREENING
    • F24F2110/00Control inputs relating to air properties
    • F24F2110/10Temperature
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Human Computer Interaction (AREA)
  • Combustion & Propulsion (AREA)
  • Mechanical Engineering (AREA)
  • Chemical & Material Sciences (AREA)
  • Signal Processing (AREA)
  • Mathematical Physics (AREA)
  • Fuzzy Systems (AREA)
  • Automation & Control Theory (AREA)
  • Debugging And Monitoring (AREA)

Abstract

【課題】サーバの温度に基づくジョブ割当を適切に行うジョブ割当プログラム、方法及び装置を提供する。【解決手段】ジョブ割当方法は、複数のジョブを実行した第1情報処理装置から取得した、第1情報処理装置の温度の情報に基づき、ジョブを実行した場合における温度の変化量である第1変化量の情報を複数のジョブの各々について生成する。複数のジョブのうち特定のジョブを実行した複数の第2情報処理装置の各々から取得した、当該第2情報処理装置の温度の情報に基づき、特定のジョブを実行した場合における温度の変化量である第2変化量の情報を複数の第2情報処理装置の各々について生成する。複数の第2情報処理装置の温度の情報と、複数のジョブの各々についての第1変化量の情報と、複数の第2情報処理装置の各々についての第2変化量の情報とに基づき、複数のジョブの各々を複数の第2情報処理装置のいずれに割り当てるか決定する。【選択図】図17

Description

本発明は、ジョブの割当技術に関する。
サーバの高密度化及び高性能化などに伴い、データセンタにおいて消費される電力量が増加しており、消費電力量の増加が発熱量の増加をもたらしている。発熱量の増加による温度上昇はサーバの熱暴走や故障を発生させるため、データセンタの安定稼働を阻害する原因になり、また、サーバの寿命を短くするといった弊害をもたらす。
上記の問題を解決するため、サーバが配置されたサーバルーム等には空調機が導入される。しかしながら、空調機によって発生する空気の流れが行き届きにくい場所においては、高温の空気が滞る現象(以下、熱だまりと呼ぶ)が発生することがある。この現象について図1を用いて説明する。図1の例においては、サーバルームにサーバA乃至Pと空調機とが設置されている。空調機は送風によってサーバルーム内の温度を低下させる。サーバA乃至Pはジョブを実行する。
空調機から比較的近い場所に設置されているサーバA乃至Hは、空調機から送られてきた強い風の流れによって冷却されるため、サーバA乃至Hの周辺においては熱だまりが発生しにくい。しかし、空調機から比較的遠い場所に設置されているサーバI乃至Pは、空調機から送られてくる風が弱いため冷却されにくい。特に、サーバI乃至Pの周辺のうち空調機から最も遠い場所には空調機からの風が行き届きにくいため、熱だまりが発生する。
このように、サーバの設置場所の違いによって温度の上がりやすさに違いが生じる。また、温度の上がりやすさの違いは、常駐の基本ソフトウエア等による処理負荷の違いによっても生じる。前述のとおり、温度上昇は様々な問題を引き起こすため、局所的な温度上昇を生じさせないようにジョブを割り当てるのが好ましい。但し、ジョブの実行を開始した後に温度の上昇を検知したとしても、ジョブを途中で終了させると途中までの実行が無駄になるため、安易にジョブを終了させることはできない。
なお、温度の情報に基づきタスク等の割り当てを行う技術は存在する。例えば、或る文献は、複数のプロセッサの各々について温度を測定し、測定された温度に基づいて複数のプロセッサに対してタスクを割り当てる技術を開示する。
しかしながら、たとえ現状の温度が低いプロセッサにタスクを割り当てるようにしても、例えば温度が上がりやすいプロセッサに処理負荷が大きいタスクを割り当てたような場合には、温度の大幅な上昇を引き起こすことになる。
国際公開第2003/083693号 特開2006−133995号公報 特開2008−242614号公報 特開2010−108324号公報
従って、本発明の目的は、1つの側面では、サーバの温度に基づくジョブ割当を適切に行うための技術を提供することである。
本発明に係るジョブ割当方法は、複数のジョブを実行した第1情報処理装置から取得した、第1情報処理装置の温度の情報に基づき、ジョブを実行した場合における温度の変化量である第1変化量の情報を複数のジョブの各々について生成し、複数のジョブのうち特定のジョブを実行した複数の第2情報処理装置の各々から取得した、当該第2情報処理装置の温度の情報に基づき、特定のジョブを実行した場合における温度の変化量である第2変化量の情報を複数の第2情報処理装置の各々について生成し、複数の第2情報処理装置の温度の情報と、複数のジョブの各々についての第1変化量の情報と、複数の第2情報処理装置の各々についての第2変化量の情報とに基づき、複数のジョブの各々を複数の第2情報処理装置のいずれに割り当てるか決定する処理を含む。
1つの側面では、サーバの温度に基づくジョブ割当を適切に行えるようになる。
図1は、熱だまりの発生について説明するための図である。 図2は、本実施の形態におけるシステムの概要を示す図である。 図3は、管理装置の機能ブロック図である。 図4Aは、テストサーバのハードウエア構成の一例を示す図である。 図4Bは、テストサーバのハードウエア構成の一例を示す図である。 図5は、第1データ格納部に格納されるジョブネットデータの一例を示す図である。 図6は、事前処理部が実行する処理の処理フローを示す図である。 図7Aは、CPU温度の時系列データの一例を示す図である。 図7Bは、HDD温度の時系列データの一例を示す図である。 図8は、実行実績データの一例を示す図である。 図9は、CPU温度と時間との関係を示す図である。 図10は、第1CPUデータの一例を示す図である。 図11は、HDD温度と時間との関係を示す図である。 図12は、第1HDDデータの一例を示す図である。 図13は、第1温度データの一例を示す図である。 図14は、事前処理部が実行する処理の処理フローを示す図である。 図15は、第2温度データの一例を示す図である。 図16は、第1サーバデータの一例を示す図である。 図17は、第1の実施の形態における実行管理部が実行する処理の処理フローを示す図である。 図18は、第3データ格納部に格納されるサーバ温度のデータの一例を示す図である。 図19は、第2サーバデータの一例を示す図である。 図20は、第3サーバデータの一例を示す図である。 図21は、第3サーバデータの一例を示す図である。 図22は、第3サーバデータの一例を示す図である。 図23は、第4サーバデータの一例を示す図である。 図24は、フィードバック処理部が実行する処理の処理フローを示す図である。 図25は、第5サーバデータの一例を示す図である。 図26は、第5サーバデータの一例を示す図である。 図27は、サーバ温度と処理負荷との関係を示す図である。 図28は、サーバ温度と処理負荷との関係を示す図である。 図29は、指定データの一例を示す図である。 図30は、第5サーバデータの一例を示す図である。 図31は、CPU使用率の時系列データの一例を示す図である。 図32は、IO使用率の時系列データの一例を示す図である。 図33は、第3の実施の形態における実行管理部が実行する処理の処理フローを示す図である。 図34は、コンピュータの機能ブロック図である。
[実施の形態1]
図2に、本実施の形態におけるシステムの概要を示す。データセンタ等におけるサーバルーム5には、ジョブを実行する実行サーバA乃至Pと、サーバルーム5を冷却するため送風を行う空調機50とが設置される。実行サーバA乃至Pは、例えばLAN(Local Area Network)であるネットワーク7を介して、実行サーバA乃至Pによるジョブの実行及びテストサーバ3によるジョブの実行を管理する管理装置1に接続される。但し、図を見やすくするため、管理装置1と実行サーバA乃至Pとの間の結線を省略する。管理装置1には、ネットワーク7を介して、ジョブを実行するテストサーバ3が接続される。なお、図2においては管理装置1がサーバルーム5の外に設置されているが、サーバルーム5の中に設置されてもよい。
図3に、管理装置1の機能ブロック図を示す。管理装置1は、事前処理部11と、実行管理部12と、フィードバック処理部13と、第1データ格納部14と、第2データ格納部15と、第3データ格納部16と、第4データ格納部17を有する。
事前処理部11は、第1データ格納部14に格納されたデータに基づき、テストサーバ3の温度上昇(℃)をジョブネット毎に算出し、算出結果を第2データ格納部15に格納する。また、事前処理部11は、第2データ格納部15に格納されたデータに基づき、予め定められた条件に基づき選択されたジョブネット(以下、基準ジョブネットと呼ぶ)の実行による温度上昇(℃)を実行サーバ毎に算出し、算出結果を第2データ格納部15に格納する。実行管理部12は、第2データ格納部15に格納されたデータに基づき実行サーバA乃至Pにジョブを割り当てる処理等を実行し、処理結果を第3データ格納部16に格納する。フィードバック処理部13は、第3データ格納部16に格納されたデータに基づき処理を実行し、処理結果を第4データ格納部17に格納する。
図4Aに、テストサーバ3のハードウエア構成の一例を示す。テストサーバ3は、CPU(Central Processing Unit)31と、CPU31に取り付けられた温度センサ310と、例えばメインメモリであるメモリ32と、HDD(Hard Disk Drive)33と、HDD33に取り付けられた温度センサ330とを有する。CPU31、メモリ32、及びHDD33はバス30によって接続される。温度センサ310はCPU温度を測定し、温度センサ330はHDD温度を測定する。なお、実行サーバA乃至Pのハードウエア構成は、テストサーバ3のハードウエア構成と同じである。
なお、温度は測定場所によって値が異なるため、テストサーバ3の温度を表す代表値(以下では、サーバ温度と呼ぶ)を定義する。本実施の形態においては、サーバ温度をs=αc+(1−α)hによって算出する。ここで、sはサーバ温度であり、cはCPU温度であり、hはHDD温度である。αは0<α<1を満たす実数であり、管理者が予め設定する。但し、サーバ温度の算出方法はここで説明した方法に限られるわけではない。実行サーバA乃至Pについても同様とする。
また、図4Bに示すように、サーバ温度の測定用の温度センサを別途設けてもよい。図4Bに示すテストサーバ3は、CPU31と、CPU31に取り付けられた温度センサ310と、メモリ32と、HDD33と、温度センサ330と、サーバ温度を測定する温度センサ34とを有する。CPU31、メモリ32、HDD33、及び温度センサ34はバス30によって接続される。但し、温度センサ34を設置する場所は、図4Bに示したような場所に限られるわけではない。
なお、実行サーバA乃至Pのハードウエア構成は、テストサーバ3のハードウエア構成と同じである。
図5に、第1データ格納部14に格納されるジョブネットデータの一例を示す。図5の例では、ジョブネット名と、ジョブ名と、バッチファイル名とが格納される。ジョブネットとは、実行順序が決まっている複数のジョブの集まりのことである。例えばジョブネット「netA」は、ジョブ「jobA」とジョブ「jobB」とを含む。なお、第1データ格納部14には、事前処理における実行スケジュール及び実際の実行スケジュールも格納される。
次に、図6乃至図30を用いて、管理装置1が実行する処理について説明する。まず、管理装置1の事前処理部11が温度上昇をジョブネット毎に算出する処理について説明する。
事前処理部11は、第1データ格納部14から、事前処理における実行スケジュール及びジョブネットデータを読み出す(図6:ステップS1)。
事前処理部11は、各ジョブネットの実行要求を、事前処理における実行スケジュールどおりにテストサーバ3に送信する(ステップS3)。テストサーバ3がジョブ実行用のバッチファイルを有していない場合には、実行要求はジョブ実行用のバッチファイルを含む。なお、事前処理においては、複数のジョブネットが並行して実行されることはないものとする。また、或るジョブネットを実行した後、次のジョブネットを実行するまでの時間を十分に確保することにより、テストサーバ3の温度が下がりきった状態でジョブネットの実行を開始してもよい。
テストサーバ3は、ジョブネットを実行する。テストサーバ3における温度センサ310及び温度センサ330は、CPU温度及びHDD温度を定期的に(例えば1秒毎に)計測しており、テストサーバ3は、計測されたCPU温度及びHDD温度のデータを管理装置1に送信する。なお、テストサーバ3は、CPU温度のデータ及びHDD温度のデータを、ジョブネット毎に一括して送信してもよい。また、テストサーバ3は、各ジョブの開始時刻及び終了時刻の情報を含む実行実績データを管理装置1に送信する。
事前処理部11は、CPU温度のデータ及びHDD温度のデータ並びに実行実績データをテストサーバ3から順次取得する。そして、事前処理部11は、CPU温度の時系列データ及びHDD温度の時系列データを生成し(ステップS5)、CPU温度の時系列データ及びHDD温度の時系列データ並びに実行実績データを第2データ格納部15に格納する。
図7Aに、第2データ格納部15に格納される、CPU温度の時系列データの一例を示す。図7Aの例では、1秒毎に計測されたCPU温度のデータが格納される。
図7Bに、第2データ格納部15に格納される、HDD温度の時系列データの一例を示す。図7Bの例では、1秒毎に計測されたHDD温度のデータが格納される。
図8に、第2データ格納部15に格納される実行実績データの一例を示す。図8の例では、ジョブ毎に開始時刻と終了時刻とが格納される。
図6の説明に戻り、事前処理部11は、第2データ格納部15に格納された、CPU温度の時系列データ及びHDD温度の時系列データ並びに実行実績データに基づき、各ジョブについて、CPUの温度上昇(℃)及びHDDの温度上昇(℃)を算出する(ステップS7)。
ここで、ステップS7の処理について説明する。例えば、或るジョブネット(ここでは、ジョブネットJとする)の実行を開始したところ、図9に示すようにCPU温度が上昇したとする。図9において、縦軸はCPUの温度上昇を表し、横軸はジョブネットJの実行を開始してから経過した時間(単位は秒)を表す。図9の例においては、ジョブAはジョブネットJの実行開始の時点から10秒間実行され、ジョブBはジョブネットJの実行開始の時点から20秒間実行され、ジョブCはジョブネットJの実行開始の時点から30秒間実行され、ジョブDはジョブネットJの実行開始から30秒経過した時点から10秒間実行される。
図9の例の場合、ジョブネットJの実行開始の時点から10秒間において(0.6−0.0)℃温度が上昇しているので、以下のような式が成立する。但し、CAはジョブAの実行によるCPUの温度上昇を表し、CBはジョブBの実行によるCPUの温度上昇を表し、CCはジョブCの実行によるCPUの温度上昇を表し、CDはジョブDの実行によるCPUの温度上昇を表す。また、図9に示した期間については、排熱による温度の低下については無視できるものとする。
Figure 2016126458
ジョブネットJの実行開始の時点から10秒経過した時点から10秒間においては(1.0−0.6)℃温度が上昇しているので、以下のような式が成立する。
Figure 2016126458
ジョブネットJの実行開始の時点から20秒経過した時点から10秒間においては(1.2−1.0)℃温度が上昇しているので、以下のような式が成立する。
Figure 2016126458
ジョブネットJの実行開始の時点から30秒経過した時点から10秒間においては(1.3−1.2)℃温度が上昇しているので、以下のような式が成立する。
Figure 2016126458
以上の連立方程式を解くことにより、基づきCA、CB、CC、及びCDを求めることができる。この結果として、事前処理部11は、図10に示すような第1CPUデータを生成し、第2データ格納部15に格納する。図10の例では、第1CPUデータは、ジョブネット名と、ジョブ名と、CPUの温度上昇(℃)とを含む。
同様に、ジョブネットJの実行を開始したところ、図11に示すようにHDD温度が上昇したとする。図11において、縦軸はHDDの温度上昇を表し、横軸はジョブネットJの実行を開始してから経過した時間(秒)を表す。
図11の例の場合、ジョブネットJの実行開始の時点から10秒間において(0.8−0.0)℃温度が上昇しているので、以下のような式が成立する。但し、HAはジョブAの実行によるHDDの温度上昇を表し、HBはジョブBの実行によるHDDの温度上昇を表し、HCはジョブCの実行によるHDDの温度上昇を表し、HDはジョブDの実行によるHDDの温度上昇を表す。また、図11に示した期間については、排熱による温度の低下については無視できるものとする。
Figure 2016126458
ジョブネットJの実行開始の時点から10秒経過した時点から10秒間においては(1.1−0.8)℃温度が上昇しているので、以下のような式が成立する。
Figure 2016126458
ジョブネットJの実行開始の時点から20秒経過した時点から10秒間においては(1.2−1.1)℃温度が上昇しているので、以下のような式が成立する。
Figure 2016126458
ジョブネットJの実行開始の時点から30秒経過した時点から10秒間においては(1.3−1.2)℃温度が上昇しているので、以下のような式が成立する。
Figure 2016126458
以上の連立方程式を解くことにより、基づきHA、HB、HC、及びHDを求めることができる。この結果として、事前処理部11は、図12に示すような第1HDDデータを生成し、第2データ格納部15に格納する。図12の例では、第1HDDデータは、ジョブネット名と、ジョブ名と、HDDの温度上昇とを含む。
図6の説明に戻り、事前処理部11は、第1CPUデータ及び第1HDDデータに基づき、CPUの温度上昇及びHDDの温度上昇からサーバ温度の上昇(℃)を各ジョブについて算出する(ステップS9)。ステップS9においては、例えば、S=αC+(1−α)Hによってサーバ温度の上昇を算出する。ここで、Sはサーバ温度の上昇であり、CはCPUの温度上昇であり、HはHDDの温度上昇である。αは0<α<1を満たす実数であり、上で述べたように、管理者が予め設定する。但し、サーバ温度の上昇を算出する方法はここで説明した方法に限られるわけではない。
事前処理部11は、ジョブ毎の温度上昇から、ジョブネット毎の温度上昇(℃)を算出する(ステップS11)。ここまでの処理の結果として、事前処理部11は、図13に示すような第1温度データを生成し、第2データ格納部15に格納する。図13の例では、第1温度データは、ジョブネット名と、ジョブ名と、CPUの温度上昇と、HDDの温度上昇と、ジョブの実行による温度上昇と、ジョブネットの実行による温度上昇とが格納される。そして処理を終了する。
以上のような処理を実行すれば、ジョブネットの実行によってどの程度温度が上昇するかを各ジョブネットについて予め見積もることができるようになる。なお、1台のテストサーバ3にジョブネットを実行させるので、サーバの性能或いは設置場所の違いによって温度上昇にバラツキが生じることを防ぐことができる。
次に、図14乃至図16を用いて、管理装置1の事前処理部11が基準ジョブネットの実行による温度上昇を実行サーバ毎に算出する処理について説明する。
まず、事前処理部11は、第2データ格納部15に格納された第1温度データから、ジョブネット名及びジョブネットの実行による温度上昇を含む第2温度データを生成する。そして、事前処理部11は、第2温度データのエントリを、ジョブネットの実行による温度上昇をキーにして降順にソートする(図14:ステップS21)。
図15に、ステップS21の処理が実行された後の第2温度データの一例を示す。図15の例では、ジョブネット名と、ジョブネットの実行による温度上昇とを含む。そして、第2温度データのエントリは、ジョブネットの実行による温度上昇によってソートされている。
図14の説明に戻り、事前処理部11は、第2温度データから、予め定められた条件に基づき基準ジョブネットを選択する(ステップS23)。本実施の形態において、予め定められた条件とは、ジョブネットの実行による温度上昇が最も大きいという条件である。このような条件を採用するのは、基準ジョブネットによる温度上昇が小さいジョブネットを選択すると、実行サーバのサーバ温度が変化したことを確認するのが困難である場合があるからである。但し、その他の条件に基づき基準ジョブネットを選択してもよい。例えば、ジョブネットの実行による温度上昇が所定の閾値より大きいジョブネットの中からランダムに選択してもよい。或いは、実行時間が所定の時間より長いジョブネットについては温度上昇が比較的大きいと考えられるため、実行時間に基づきジョブネットを選択してもよい。
事前処理部11は、実行サーバA乃至Pの各々に、基準ジョブネットの実行要求を送信する(ステップS25)。実行サーバA乃至Pが基準ジョブネット用のバッチファイルを有していない場合には、実行要求は基準ジョブネット用のバッチファイルを含む。これに応じ、実行サーバA乃至Pの各々は基準ジョブネットを実行し、サーバ温度のデータを順次管理装置1に送信する。
事前処理部11は、サーバ温度のデータ並びに実行実績データを実行サーバA乃至Pから順次取得し(ステップS27)、第2データ格納部15に格納する。第2データ格納部15に格納されるサーバ温度のデータのフォーマットは、図7A及び図7Bに示したフォーマットと同様である。実行実績データは、基準ジョブネットの開始時刻及び終了時刻を含むとする。
事前処理部11は、第2データ格納部15に格納されたサーバ温度のデータ及び実行実績データに基づき、基準ジョブネットの実行開始時点におけるサーバ温度と基準ジョブネットの実行終了時点におけるサーバ温度との差を算出することで、基準ジョブネットによる温度上昇を実行サーバA乃至Pの各々について算出する(ステップS29)。そして、事前処理部11は、実行サーバの識別子と基準ジョブネットによる温度上昇とを含む第1サーバデータを生成し、第2データ格納部15に格納する。
図16に、第1サーバデータの一例を示す。図16の例では、第1サーバデータは、実行サーバの識別子と、基準ジョブネットの実行による温度上昇とを含む。
図14の説明に戻り、事前処理部11は、第1サーバデータのエントリを、基準ジョブネットの実行による温度上昇をキーにして昇順にソートする(ステップS31)。そして処理を終了する。
以上のように、基準ジョブネットを各実行サーバに実行させることで、温度の上がりやすさを表す指標を取得できるようになる。
次に、図17乃至図23を用いて、管理装置1の実行管理部12が実際に実行サーバA乃至Pにジョブを割り当てる際に実行する処理について説明する。
まず、実行管理部12は、実行サーバA乃至Pからサーバ温度のデータを取得し(図17:ステップS40)、実行サーバA乃至Pのサーバ温度のデータを第3データ格納部16に格納する。
図18に、第3データ格納部16に格納されるサーバ温度のデータの一例を示す。図18の例では、実行サーバ名と、その実行サーバのサーバ温度とを含む。
ここで、実行管理部12は、第2データ格納部15に格納された第1サーバデータ及び第3データ格納部16に格納されたサーバ温度のデータから、図19に示すような第2サーバデータを生成し、第3データ格納部16に格納する。図19の例では、第2サーバデータは、実行サーバ名と、その実行サーバのサーバ温度と、基準ジョブネットの実行による温度上昇とが格納される。
さらに、実行管理部12は、第3データ格納部16に格納された第2サーバデータから、図20に示すような第3サーバデータを生成し、第3データ格納部16に格納する。図20の例では、第3サーバデータは、実行サーバ名と、基準ジョブネットの実行による温度上昇の値と、温度の予測値とが格納される。予測値は、この段階では、実行サーバのサーバ温度と同じである。すなわち、第2サーバデータにおける「サーバ温度」のカラム名を予測値」に変更してカラムの位置を移動すれば、第3サーバデータが得られる。なお、実行管理部12は、第3サーバデータのエントリを、予測値を第1キーとし且つ基準ジョブネットの実行による温度上昇を第2キーとして昇順にソートしておく。
図17の説明に戻り、実行管理部12は、第1データ格納部14に格納された、実際の実行スケジュールに基づき、実行すべきジョブネットを1つ特定する(ステップS41)。
実行管理部12は、第3サーバデータから、予測値が低い順で上位所定位以内又は上位所定数以下の実行サーバを特定する(ステップS42)。そして、実行管理部12は、特定された実行サーバのうち、基準ジョブネットによる温度上昇が最も小さい(すなわち、温度が上がりにくい)実行サーバを特定する(ステップS43)。例えば第3サーバデータが図20に示すようなデータである場合、第1行目のエントリに係る実行サーバが特定される。但し、他の方法で実行サーバを特定してもよい。
なお、第4データ格納部17に指定データが格納されている場合には、ステップS43において、特定された実行サーバが指定データによる指定の条件を満たすか判断してもよい。指定データについては後述する。
実行管理部12は、ステップS43において特定された実行サーバに、ステップS41において特定されたジョブネットの実行要求を送信する(ステップS45)。実行サーバがジョブネット用のバッチファイルを有していない場合には、実行要求はジョブネット用のバッチファイルを含む。
実行管理部12は、第3データ格納部16に格納された第3サーバデータを更新する(ステップS47)。具体的には、図21に示すように、実行すべきジョブネットの実行による温度上昇が、ステップS43において特定された実行サーバのサーバ温度に加算される。図21の例では、実行サーバ「svD」の予測値が、22.0+0.19=22.19(℃)に更新される。
実行管理部12は、第3データ格納部16に格納された第3サーバデータのエントリを、予測値を第1キーとし且つ基準ジョブネットの実行による温度上昇を第2キーとして昇順にソートする(ステップS49)。ステップS49の処理により、第3サーバデータは、図22に示すような状態になる。図22の例においては、実行サーバ「svD」のエントリが、第3行目に移動している。
実行管理部12は、第1データ格納部14に格納された、実際の実行スケジュールに基づき、次に実行すべきジョブネットが有るか判断する(ステップS51)。次に実行すべきジョブネットが有る場合(ステップS51:Yesルート)、ステップS41の処理に戻る。
次に実行すべきジョブネットが無い場合(ステップS51:Noルート)、実行管理部12は、各実行サーバから、その実行サーバにおいてジョブネットの実行が終了した場合にサーバ温度のデータを取得する(ステップS53)。そして、実行管理部12は、各実行サーバから取得したサーバ温度と、第3サーバデータとに基づき、図23に示すような第4サーバデータを生成し、第3データ格納部16に格納する。そして処理を終了する。
図23に、第4サーバデータの一例を示す。図23の例では、サーバ名と、基準ジョブネットの実行による温度上昇と、温度の予測値と、温度の実測値とが格納される。実測値のカラムには、ステップS53において取得された、実行サーバA乃至Pのサーバ温度が格納される。
以上のような処理を実行すれば、現状の温度が比較的高い実行サーバ及び温度が上がりやすい実行サーバに対してはジョブが割り当てられにくくなるので、他の実行サーバに比べて温度が大幅に上昇する実行サーバが生じにくくなる。すなわち、実行サーバA乃至Pの温度を平準化できるようになる。
これにより、サーバルーム5において安定的に実行サーバA乃至Pを稼働できるようになり、また、実行サーバA乃至Pの寿命を伸ばすことができるようになる。
また、熱だまりの発生を抑制できるので、空調機50の設定温度を下げ、空調機50による電力の消費を減らすことができるようになる。
次に、図24乃至図30を用いて、フィードバック処理部13が実行する処理について説明する。
まず、フィードバック処理部13は、第3データ格納部16に格納された第4サーバデータに基づき、予測値と実測値との差を各実行サーバについて算出する(図24:ステップS61)。予測値と実測値との差は、実測値から予測値を差し引くことにより算出される。そして、フィードバック処理部13は、第5サーバデータを生成し、第4データ格納部17に格納する。
図25に、第5サーバデータの一例を示す。図25の例では、実行サーバ名と、基準ジョブネットの実行による温度上昇と、予測値と、実測値と、予測値と実測値との差が格納される。
フィードバック処理部13は、第5サーバデータのエントリを、予測値と実測値との差をキーにして降順に並び替える(ステップS63)。図25に示した第5サーバデータのエントリを並び替えると、例えば図26に示すようなデータが得られる。
フィードバック処理部13は、例えば管理装置1の表示装置に、第5サーバデータを出力する(ステップS65)。これにより、管理者は、予測値と実測値との乖離が大きい実行サーバを容易に確認することができる。
フィードバック処理部13は、管理者から、実行サーバが実行すべきジョブネットの指定、及び、実行サーバが実行すべきでないジョブネットの指定を受け付け(ステップS67)、指定データを生成する。そして、フィードバック処理部13は、指定データを第4データ格納部17に格納する。そして処理を終了する。
温度の予測値と実測値との差が大きくなる理由の1つに、実行サーバの処理負荷が大きいジョブの実行が長引くことがある。例えば、ジョブAとジョブBとジョブCとを含むジョブネットを実行することを考える。各ジョブの実行が長引くことなく終了した場合におけるサーバ温度の変化を、図27に示す。図27において、縦軸はサーバ温度を表し、横軸は時刻を表し、矩形図形はジョブを表し、矩形図形の縦軸方向の長さは処理負荷の大きさを表し、矩形図形の横軸方向の長さはジョブの処理時間を表す。この例においては、ジョブAの処理負荷がジョブBの処理負荷及びジョブCの処理負荷より大きい。サーバ温度は、ジョブAの実行が続く間は上昇するが、ジョブAの実行が終了した後は上昇しない。本実施の形態においては、ジョブAの実行が完了した場合に実測値を取得するので、実測値は時刻t1におけるサーバ温度である。
ここで、ジョブAの実行が通常よりも長引いた場合の例を図28に示す。図28の例では、ジョブAの実行が完了するまでの時間が図27の例と比較して長くなり、ジョブAの完了時刻は時刻t1より後の時刻t2である。このような場合には、CPUの使用時間及びHDDの使用時間が図27の例と比較して長くなるため、それがサーバ温度の上昇をもたらす。そのため、時刻t1におけるサーバ温度よりも時刻t2におけるサーバ温度より高くなり、予測値と実測値との差の拡大をもたらすことになる。
管理者は、出力された第5サーバデータ及び実行サーバの実行履歴等を参照することにより、予測値と実測値との乖離をもたらすジョブネットを特定する。例えば、図28の例においてジョブAを含むジョブネット(ここでは、ジョブネット「netK」とする)を実行している実行サーバが実行サーバ「svM」である場合には、予測値と実測値との乖離が実行サーバ「svM」より小さい実行サーバ(ここでは、実行サーバ「svN」であるとする)にジョブネット「netK」を実行させるようにする。そこで、ステップS67において、管理者等は、実行サーバ「svM」が実行すべきでないジョブネットとしてジョブネット「netK」を指定し、実行サーバ「svN」が実行すべきジョブネットとしてジョブネット「netK」を指定する。或いは、実行サーバ「svM」より高い処理性能を有する実行サーバにジョブネット「netK」を実行させてもよい。
図29に、指定データの一例を示す。図29の例では、実行サーバ名と、実行すべきジョブネットの名前と、実行すべきでないジョブネットの名前とが格納される。
以上のような処理を実行すれば、次回以降、管理装置1は指定データに基づいてジョブの割り当てを行えるようになる。これにより、実行サーバA乃至Pのサーバ温度をさらに平準化できるようになる。例えば、図30に示すような第5サーバデータが得られるようになる。図26の例と比較すると、予測値と実測値との差は縮小しており、また、実行サーバA乃至Pの実測値は平準化されている。
[実施の形態2]
第2の実施の形態においては、温度上昇をより高精度で求める方法について説明する。
例えば、ジョブAを20秒間実行することによって、CPU温度が0.6℃上昇したとする。第1の実施の形態によれば、ジョブAの実行中に他のジョブを実行していない場合、ジョブAの実行による温度上昇は0.6℃となる。
ここで、20秒間のうち前半の10秒間については、ジョブAのCPU使用率は20%であり、後半の10秒間については、ジョブAのCPU使用率は10%であったとする。このような場合には、前半の10秒間での温度上昇と後半の10秒間での温度上昇とは異なると考えられる。具体的には、前半の10秒間での温度上昇は0.6*(20/(20+10))=0.4℃であり、後半の10秒間での温度上昇は0.6*(10/(20+10))=0.2℃である。
上記のようにCPU使用率を考慮すれば、より正確にCPUの温度上昇を算出できるようになる。同様に、IO(Input/Output)使用率を考慮すれば、より正確にHDDの温度上昇を算出できるようになる。
そこで、第2の実施の形態においては、CPU使用率及びIO使用率を使用してCPUの温度上昇及びHDDの温度上昇を算出する。
具体的には、事前処理部11は、ステップS5において、CPU温度のデータ及びHDD温度のデータに加えて、CPU使用率のデータ及びIO使用率のデータを取得する。そして、事前処理部11は、CPU使用率の時系列データ及びIO使用率の時系列データを生成し、第2データ格納部15に格納する。なお、CPU使用率及びIO使用率は、テストサーバ3のOS(Operating System)の機能によって取得することができる。
図31に、CPU使用率の時系列データの一例を示す。図31の例では、ジョブネット名と、ジョブ名とが格納される。また、各ジョブについて、1秒毎に計測されたCPU使用率のデータが格納される。
図32に、IO使用率の時系列データの一例を示す。図32の例では、ジョブネット名と、ジョブ名とが格納される。また、各ジョブについて、1秒毎に計測されたIO使用率のデータ並びに読み込みのバイト数及び書き込みのバイト数が格納される。
そして、ステップS7においては、CPU使用率をさらに用いて連立方程式を生成する。例えば図9に示した例の場合、以下のような連立方程式を生成する。
まず、開始時点から10秒間においては、(0.6−0.0)℃温度が上昇しているので、以下のような式が成立する。但し、CAはジョブAの実行によるCPUの温度上昇(℃)を表し、CBはジョブBの実行によるCPUの温度上昇(℃)を表し、CCはジョブCの実行によるCPUの温度上昇(℃)を表し、CDはジョブDの実行によるCPUの温度上昇(℃)を表す。また、UX,kはジョブXの開始後k秒後における、ジョブXのCPU使用率を表す。また、図9に示した期間については、排熱による温度の低下については無視できるものとする。
Figure 2016126458
ジョブネットJの実行開始の時点から10秒経過した時点から10秒間においては(1.0−0.6)℃温度が上昇しているので、以下のような式が成立する。
Figure 2016126458
ジョブネットJの実行開始の時点から20秒経過した時点から10秒間においては(1.2−1.0)℃温度が上昇しているので、以下のような式が成立する。
Figure 2016126458
ジョブネットJの実行開始の時点から30秒経過した時点から10秒間においては(1.3−1.2)℃温度が上昇しているので、以下のような式が成立する。
Figure 2016126458
以上の連立方程式を解くことにより、基づきCA、CB、CC、及びCDを求めることができる。なお、HDDの温度上昇については、IO使用率のデータを用いて同様の計算を行えばよいので、説明を省略する。
以上のようにすれば、より正確にCPUの温度上昇及びHDDの温度上昇を算出できるようになる。
[実施の形態3]
第3の実施の形態においては、実行管理部12が実行する処理の他の例について説明する。
まず、実行管理部12は、実行サーバA乃至Pからサーバ温度のデータを取得し(図33:ステップS70)、実行サーバA乃至Pのサーバ温度のデータを第3データ格納部16に格納する。本処理は、ステップS40の処理と同じである。
実行管理部12は、第1データ格納部14に格納された、実際の実行スケジュールに基づき、実行すべきジョブネットを1つ特定する(ステップS71)。本処理は、ステップS41の処理と同じである。
実行管理部12は、第3サーバデータから、予測値が最も低い実行サーバのその予測値との差が所定値以下である予測値を有する実行サーバを特定する(ステップS72)。そして、実行管理部12は、特定された実行サーバのうち、基準ジョブネットによる温度上昇が最も小さい実行サーバを特定する(ステップS73)。以降の処理は、ステップS45乃至S53の処理と同じであるので、説明を省略する。
以上のような処理であっても、実行サーバA乃至Pの温度を平準化できるようになる。
以上本発明の一実施の形態を説明したが、本発明はこれに限定されるものではない。例えば、上で説明した管理装置1の機能ブロック構成は実際のプログラムモジュール構成に一致しない場合もある。
また、上で説明した各テーブルの構成は一例であって、上記のような構成でなければならないわけではない。さらに、処理フローにおいても、処理結果が変わらなければ処理の順番を入れ替えることも可能である。さらに、並列に実行させるようにしても良い。
なお、各テーブルに格納される値は一例であって、上記のような値が格納されなければならないわけではなく、また、上で示した予測値及び実測値は実際の運用結果を示すものではない。
また、上ではジョブの割り当ての際にサーバ温度を利用するが、サーバ温度の代わりにジョブの実行状況(例えば、処理負荷或いはキューの状況)を利用してもよい。
また、上ではCPUの温度上昇及びHDDの温度上昇を算出する際に排熱による温度低下を考慮していないが、例えば数式に排熱項を導入することにより、排熱による温度低下を考慮してCPUの温度上昇及びHDDの温度上昇を算出してもよい。
なお、上で述べた管理装置1は、コンピュータ装置であって、図34に示すように、メモリ2501とCPU(Central Processing Unit)2503とハードディスク・ドライブ(HDD:Hard Disk Drive)2505と表示装置2509に接続される表示制御部2507とリムーバブル・ディスク2511用のドライブ装置2513と入力装置2515とネットワークに接続するための通信制御部2517とがバス2519で接続されている。オペレーティング・システム(OS:Operating System)及び本実施例における処理を実施するためのアプリケーション・プログラムは、HDD2505に格納されており、CPU2503により実行される際にはHDD2505からメモリ2501に読み出される。CPU2503は、アプリケーション・プログラムの処理内容に応じて表示制御部2507、通信制御部2517、ドライブ装置2513を制御して、所定の動作を行わせる。また、処理途中のデータについては、主としてメモリ2501に格納されるが、HDD2505に格納されるようにしてもよい。本発明の実施例では、上で述べた処理を実施するためのアプリケーション・プログラムはコンピュータ読み取り可能なリムーバブル・ディスク2511に格納されて頒布され、ドライブ装置2513からHDD2505にインストールされる。インターネットなどのネットワーク及び通信制御部2517を経由して、HDD2505にインストールされる場合もある。このようなコンピュータ装置は、上で述べたCPU2503、メモリ2501などのハードウエアとOS及びアプリケーション・プログラムなどのプログラムとが有機的に協働することにより、上で述べたような各種機能を実現する。
以上述べた本発明の実施の形態をまとめると、以下のようになる。
本実施の形態に係るジョブ割当方法は、(A)複数のジョブを実行した第1情報処理装置から取得した、第1情報処理装置の温度の情報に基づき、ジョブを実行した場合における温度の変化量である第1変化量の情報を複数のジョブの各々について生成し、(B)複数のジョブのうち特定のジョブを実行した複数の第2情報処理装置の各々から取得した、当該第2情報処理装置の温度の情報に基づき、特定のジョブを実行した場合における温度の変化量である第2変化量の情報を複数の第2情報処理装置の各々について生成し、(C)複数の第2情報処理装置の温度の情報と、複数のジョブの各々についての第1変化量の情報と、複数の第2情報処理装置の各々についての第2変化量の情報とに基づき、複数のジョブの各々を複数の第2情報処理装置のいずれに割り当てるか決定する処理を含む。
上で述べたようにして生成された第2変化量は第2情報処理装置の温度の変化しやすさを表す。これにより、温度が変化しやすい第2情報処理装置へジョブを割り当てることを回避するといった対応が可能になるので、温度に基づくジョブ割当を適切に行えるようになる。
また、上で述べた複数の第2情報処理装置のいずれに割り当てるか決定する処理において、(c1)複数のジョブの各々について、複数の第2情報処理装置のうち温度が低い順で上位所定順位以内又は上位所定数以下の第2情報処理装置を特定し、特定された当該第2情報処理装置の中から、第2変化量に基づき、当該ジョブが割り当てられる第2情報処理装置を決定してもよい。このようにすれば、複数の第2情報処理装置の温度が平準化するようにジョブを割り当てることができるようになる。
また、上で述べた複数の第2情報処理装置のいずれに割り当てるか決定する処理において、(c2)複数のジョブの各々について、複数の第2情報処理装置のうち最も温度が低い第2情報処理装置の当該温度との差が所定値以内である温度の第2情報処理装置を特定し、特定された当該第2情報処理装置の中から、第2変化量に基づき、当該ジョブが割り当てられる第2情報処理装置を決定してもよい。このようにすれば、複数の第2情報処理装置の温度が平準化するようにジョブを割り当てることができるようになる。
また、本ジョブ割当方法は、(D)複数のジョブの各々について、当該ジョブについての第1変化量を、当該ジョブを割り当てられる第2情報処理装置の温度に加算した値で、当該ジョブを割り当てられる第2情報処理装置の温度の情報を更新する処理をさらに含んでもよい。このようにすれば、既に割り当てたジョブによる温度変化を考慮したジョブ割当が可能になる。
また、本ジョブ割当方法は、第1の情報処理装置から、開始時刻及び終了時刻の情報を複数のジョブの各々について取得する処理をさらに含んでもよい。そして、上で述べた第1変化量を複数のジョブの各々について生成する処理において、(a1)複数のジョブの各々について、当該ジョブの開始時刻における第1の情報処理装置の温度と当該ジョブの終了時刻における第1の情報処理装置の温度との差を算出することにより、第1変化量を生成してもよい。このようにすれば、第1変化量の情報を適切に生成できるようになる。
また、第1情報処理装置の温度の情報は、第1情報処理装置におけるプロセッサの温度の情報と第1情報処理装置における記憶装置の温度の情報とに基づき生成された情報であってもよい。ジョブを実行した場合にはプロセッサ及び記憶装置の温度が特に変化するので、上で述べたようにすれば、温度の情報がより適切に生成されるようになる。
また、本ジョブ割当方法は、(E)第1情報処理装置から、プロセッサの使用率の情報と記憶装置に対する入出力の使用率の情報とを取得する処理をさらに含んでもよい。そして、上で述べた第1変化量の情報を複数のジョブの各々について生成する処理において、(a2)第1情報処理装置の温度の情報と、プロセッサの使用率の情報と、記憶装置に対する入出力の使用率の情報とに基づき、ジョブを実行した場合における温度の変化量である第1変化量の情報を複数のジョブの各々について生成してもよい。このようにすれば、より高精度な第1変化量を生成できるようになる。
また、本ジョブ割当方法は、(F)複数のジョブの実行が完了した場合、複数の第2情報処理装置の各々から、第2の情報処理装置の温度の情報を取得し、(G)取得した複数の第2情報処理装置の温度と、更新後の複数の第2情報処理装置の温度との差についての情報を生成し、生成された当該差についての情報を出力する処理をさらに含んでもよい。このようにすれば、計算により求めた温度と実際の温度との差を管理者等が確認できるようになる。
なお、上記方法による処理をコンピュータに行わせるためのプログラムを作成することができ、当該プログラムは、例えばフレキシブルディスク、CD−ROM、光磁気ディスク、半導体メモリ、ハードディスク等のコンピュータ読み取り可能な記憶媒体又は記憶装置に格納される。尚、中間的な処理結果はメインメモリ等の記憶装置に一時保管される。
以上の実施例を含む実施形態に関し、さらに以下の付記を開示する。
(付記1)
コンピュータに、
複数のジョブを実行した第1情報処理装置から取得した、前記第1情報処理装置の温度の情報に基づき、ジョブを実行した場合における温度の変化量である第1変化量の情報を前記複数のジョブの各々について生成し、
前記複数のジョブのうち特定のジョブを実行した複数の第2情報処理装置の各々から取得した、当該第2情報処理装置の温度の情報に基づき、前記特定のジョブを実行した場合における温度の変化量である第2変化量の情報を前記複数の第2情報処理装置の各々について生成し、
前記複数の第2情報処理装置の温度の情報と、前記複数のジョブの各々についての前記第1変化量の情報と、前記複数の第2情報処理装置の各々についての前記第2変化量の情報とに基づき、前記複数のジョブの各々を前記複数の第2情報処理装置のいずれに割り当てるか決定する、
処理を実行させるジョブ割当プログラム。
(付記2)
前記複数の第2情報処理装置のいずれに割り当てるか決定する処理において、
前記複数のジョブの各々について、前記複数の第2情報処理装置のうち温度が低い順で上位所定順位以内又は上位所定数以下の第2情報処理装置を特定し、特定された当該第2情報処理装置の中から、前記第2変化量に基づき、当該ジョブが割り当てられる第2情報処理装置を決定する
ことを特徴とする付記1記載のジョブ割当プログラム。
(付記3)
前記複数の第2情報処理装置のいずれに割り当てるか決定する処理において、
前記複数のジョブの各々について、前記複数の第2情報処理装置のうち最も温度が低い第2情報処理装置の当該温度との差が所定値以内である温度の第2情報処理装置を特定し、特定された当該第2情報処理装置の中から、前記第2変化量に基づき、当該ジョブが割り当てられる第2情報処理装置を決定する
ことを特徴とする付記1記載のジョブ割当プログラム。
(付記4)
前記複数のジョブの各々について、当該ジョブについての前記第1変化量を、当該ジョブを割り当てられる第2情報処理装置の温度に加算した値で、当該ジョブを割り当てられる第2情報処理装置の温度の情報を更新する、
処理をさらに実行させる付記2又は3記載のジョブ割当プログラム。
(付記5)
前記第1の情報処理装置から、開始時刻及び終了時刻の情報を前記複数のジョブの各々について取得する
処理をさらに実行させ、
前記第1変化量を前記複数のジョブの各々について生成する処理において、
前記複数のジョブの各々について、当該ジョブの開始時刻における前記第1の情報処理装置の温度と当該ジョブの終了時刻における前記第1の情報処理装置の温度との差を算出することにより、前記第1変化量を生成する
ことを特徴とする付記1乃至4のいずれか1つ記載のジョブ割当プログラム。
(付記6)
前記第1情報処理装置の温度の情報は、前記第1情報処理装置におけるプロセッサの温度の情報と前記第1情報処理装置における記憶装置の温度の情報とに基づき生成された情報である
ことを特徴とする付記1乃至5のいずれか1つ記載のジョブ割当プログラム。
(付記7)
前記第1情報処理装置から、前記プロセッサの使用率の情報と前記記憶装置に対する入出力の使用率の情報とを取得する、
処理をさらに実行させ、
前記第1変化量の情報を前記複数のジョブの各々について生成する処理において、
前記第1情報処理装置の温度の情報と、前記プロセッサの使用率の情報と、前記記憶装置に対する入出力の使用率の情報とに基づき、ジョブを実行した場合における温度の変化量である第1変化量の情報を前記複数のジョブの各々について生成する、
ことを特徴とする付記6記載のジョブ割当プログラム。
(付記8)
前記複数のジョブの実行が完了した場合、前記複数の第2情報処理装置の各々から、前記第2の情報処理装置の温度の情報を取得し、
取得した前記複数の第2情報処理装置の温度と、更新後の前記複数の第2情報処理装置の温度との差についての情報を生成し、生成された当該差についての情報を出力する、
処理をさらに実行させる付記4記載のジョブ割当プログラム。
(付記9)
コンピュータが、
複数のジョブを実行した第1情報処理装置から取得した、前記第1情報処理装置の温度の情報に基づき、ジョブを実行した場合における温度の変化量である第1変化量の情報を前記複数のジョブの各々について生成し、
前記複数のジョブのうち特定のジョブを実行した複数の第2情報処理装置の各々から取得した、当該第2情報処理装置の温度の情報に基づき、前記特定のジョブを実行した場合における温度の変化量である第2変化量の情報を前記複数の第2情報処理装置の各々について生成し、
前記複数の第2情報処理装置の温度の情報と、前記複数のジョブの各々についての前記第1変化量の情報と、前記複数の第2情報処理装置の各々についての前記第2変化量の情報とに基づき、前記複数のジョブの各々を前記複数の第2情報処理装置のいずれに割り当てるか決定する、
処理を実行するジョブ割当方法。
(付記10)
複数のジョブを実行した第1情報処理装置から取得した、前記第1情報処理装置の温度の情報に基づき、ジョブを実行した場合における温度の変化量である第1変化量の情報を前記複数のジョブの各々について生成し、前記複数のジョブのうち特定のジョブを実行した複数の第2情報処理装置の各々から取得した、当該第2情報処理装置の温度の情報に基づき、前記特定のジョブを実行した場合における温度の変化量である第2変化量の情報を前記複数の第2情報処理装置の各々について生成する第1生成部と、
前記複数の第2情報処理装置の温度の情報と、前記複数のジョブの各々についての前記第1変化量の情報と、前記複数の第2情報処理装置の各々についての前記第2変化量の情報とに基づき、前記複数のジョブの各々を前記複数の第2情報処理装置のいずれに割り当てるか決定する決定部と、
を有するコンピュータ。
1 管理装置 3 テストサーバ
5 サーバルーム 50 空調機
11 事前処理部 12 実行管理部
13 フィードバック処理部 14 第1データ格納部
15 第2データ格納部 16 第3データ格納部
17 第4データ格納部

Claims (10)

  1. コンピュータに、
    複数のジョブを実行した第1情報処理装置から取得した、前記第1情報処理装置の温度の情報に基づき、ジョブを実行した場合における温度の変化量である第1変化量の情報を前記複数のジョブの各々について生成し、
    前記複数のジョブのうち特定のジョブを実行した複数の第2情報処理装置の各々から取得した、当該第2情報処理装置の温度の情報に基づき、前記特定のジョブを実行した場合における温度の変化量である第2変化量の情報を前記複数の第2情報処理装置の各々について生成し、
    前記複数の第2情報処理装置の温度の情報と、前記複数のジョブの各々についての前記第1変化量の情報と、前記複数の第2情報処理装置の各々についての前記第2変化量の情報とに基づき、前記複数のジョブの各々を前記複数の第2情報処理装置のいずれに割り当てるか決定する、
    処理を実行させるジョブ割当プログラム。
  2. 前記複数の第2情報処理装置のいずれに割り当てるか決定する処理において、
    前記複数のジョブの各々について、前記複数の第2情報処理装置のうち温度が低い順で上位所定順位以内又は上位所定数以下の第2情報処理装置を特定し、特定された当該第2情報処理装置の中から、前記第2変化量に基づき、当該ジョブが割り当てられる第2情報処理装置を決定する
    ことを特徴とする請求項1記載のジョブ割当プログラム。
  3. 前記複数の第2情報処理装置のいずれに割り当てるか決定する処理において、
    前記複数のジョブの各々について、前記複数の第2情報処理装置のうち最も温度が低い第2情報処理装置の当該温度との差が所定値以内である温度の第2情報処理装置を特定し、特定された当該第2情報処理装置の中から、前記第2変化量に基づき、当該ジョブが割り当てられる第2情報処理装置を決定する
    ことを特徴とする請求項1記載のジョブ割当プログラム。
  4. 前記複数のジョブの各々について、当該ジョブについての前記第1変化量を、当該ジョブを割り当てられる第2情報処理装置の温度に加算した値で、当該ジョブを割り当てられる第2情報処理装置の温度の情報を更新する、
    処理をさらに実行させる請求項2又は3記載のジョブ割当プログラム。
  5. 前記第1の情報処理装置から、開始時刻及び終了時刻の情報を前記複数のジョブの各々について取得する
    処理をさらに実行させ、
    前記第1変化量を前記複数のジョブの各々について生成する処理において、
    前記複数のジョブの各々について、当該ジョブの開始時刻における前記第1の情報処理装置の温度と当該ジョブの終了時刻における前記第1の情報処理装置の温度との差を算出することにより、前記第1変化量を生成する
    ことを特徴とする請求項1乃至4のいずれか1つ記載のジョブ割当プログラム。
  6. 前記第1情報処理装置の温度の情報は、前記第1情報処理装置におけるプロセッサの温度の情報と前記第1情報処理装置における記憶装置の温度の情報とに基づき生成された情報である
    ことを特徴とする請求項1乃至5のいずれか1つ記載のジョブ割当プログラム。
  7. 前記第1情報処理装置から、前記プロセッサの使用率の情報と前記記憶装置に対する入出力の使用率の情報とを取得する、
    処理をさらに実行させ、
    前記第1変化量の情報を前記複数のジョブの各々について生成する処理において、
    前記第1情報処理装置の温度の情報と、前記プロセッサの使用率の情報と、前記記憶装置に対する入出力の使用率の情報とに基づき、ジョブを実行した場合における温度の変化量である第1変化量の情報を前記複数のジョブの各々について生成する、
    ことを特徴とする請求項6記載のジョブ割当プログラム。
  8. 前記複数のジョブの実行が完了した場合、前記複数の第2情報処理装置の各々から、前記第2の情報処理装置の温度の情報を取得し、
    取得した前記複数の第2情報処理装置の温度と、更新後の前記複数の第2情報処理装置の温度との差についての情報を生成し、生成された当該差についての情報を出力する
    処理をさらに実行させる請求項4記載のジョブ割当プログラム。
  9. コンピュータが、
    複数のジョブを実行した第1情報処理装置から取得した、前記第1情報処理装置の温度の情報に基づき、ジョブを実行した場合における温度の変化量である第1変化量の情報を前記複数のジョブの各々について生成し、
    前記複数のジョブのうち特定のジョブを実行した複数の第2情報処理装置の各々から取得した、当該第2情報処理装置の温度の情報に基づき、前記特定のジョブを実行した場合における温度の変化量である第2変化量の情報を前記複数の第2情報処理装置の各々について生成し、
    前記複数の第2情報処理装置の温度の情報と、前記複数のジョブの各々についての前記第1変化量の情報と、前記複数の第2情報処理装置の各々についての前記第2変化量の情報とに基づき、前記複数のジョブの各々を前記複数の第2情報処理装置のいずれに割り当てるか決定する、
    処理を実行するジョブ割当方法。
  10. 複数のジョブを実行した第1情報処理装置から取得した、前記第1情報処理装置の温度の情報に基づき、ジョブを実行した場合における温度の変化量である第1変化量の情報を前記複数のジョブの各々について生成する第1生成部と、
    前記複数のジョブのうち特定のジョブを実行した複数の第2情報処理装置の各々から取得した、当該第2情報処理装置の温度の情報に基づき、前記特定のジョブを実行した場合における温度の変化量である第2変化量の情報を前記複数の第2情報処理装置の各々について生成する第2生成部と、
    前記複数の第2情報処理装置の温度の情報と、前記複数のジョブの各々についての前記第1変化量の情報と、前記複数の第2情報処理装置の各々についての前記第2変化量の情報とに基づき、前記複数のジョブの各々を前記複数の第2情報処理装置のいずれに割り当てるか決定する決定部と、
    を有するコンピュータ。
JP2014265796A 2014-12-26 2014-12-26 ジョブ割当プログラム、方法及び装置 Expired - Fee Related JP6384321B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2014265796A JP6384321B2 (ja) 2014-12-26 2014-12-26 ジョブ割当プログラム、方法及び装置
US14/974,365 US10095204B2 (en) 2014-12-26 2015-12-18 Method, medium, and system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014265796A JP6384321B2 (ja) 2014-12-26 2014-12-26 ジョブ割当プログラム、方法及び装置

Publications (2)

Publication Number Publication Date
JP2016126458A true JP2016126458A (ja) 2016-07-11
JP6384321B2 JP6384321B2 (ja) 2018-09-05

Family

ID=56163714

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014265796A Expired - Fee Related JP6384321B2 (ja) 2014-12-26 2014-12-26 ジョブ割当プログラム、方法及び装置

Country Status (2)

Country Link
US (1) US10095204B2 (ja)
JP (1) JP6384321B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018151920A (ja) * 2017-03-14 2018-09-27 株式会社富士通アドバンストエンジニアリング データ分配装置及びデータ分配比率の決定方法

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015095132A (ja) * 2013-11-13 2015-05-18 富士通株式会社 情報処理システム、情報処理システムの制御方法及び管理装置の制御プログラム
US10585465B2 (en) * 2016-07-14 2020-03-10 Seagate Technology Llc Environmental state profiling for electronics devices arranged in a multi-dimensional array
US11742038B2 (en) * 2017-08-11 2023-08-29 Advanced Micro Devices, Inc. Method and apparatus for providing wear leveling
US11551990B2 (en) * 2017-08-11 2023-01-10 Advanced Micro Devices, Inc. Method and apparatus for providing thermal wear leveling

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003083693A1 (fr) * 2002-04-03 2003-10-09 Fujitsu Limited Planificateur de taches dans un systeme de traitement distribue
US20050055590A1 (en) * 2003-09-04 2005-03-10 Farkas Keith Istvan Application management based on power consumption
JP2006106807A (ja) * 2004-09-30 2006-04-20 Toshiba Corp マルチプロセッサ計算機及びプログラム
JP2006133995A (ja) * 2004-11-04 2006-05-25 Toshiba Corp プロセッサシステム及びその制御方法
JP2007179437A (ja) * 2005-12-28 2007-07-12 Fujitsu Ltd 管理システム、管理プログラムおよび管理方法
JP2007241376A (ja) * 2006-03-06 2007-09-20 Fujitsu Ten Ltd 情報処理装置
JP2008242614A (ja) * 2007-03-26 2008-10-09 Nec Corp ジョブスケジューリング装置及びジョブスケジューリング方法
JP2009277022A (ja) * 2008-05-15 2009-11-26 Fujitsu Ltd 情報処理システム、負荷制御方法、および負荷制御プログラム
JP2011204128A (ja) * 2010-03-26 2011-10-13 Nomura Research Institute Ltd 運用管理装置および運用管理方法
JP2013073413A (ja) * 2011-09-28 2013-04-22 Hitachi Ltd データセンタの負荷割当て方法及び情報処理システム
US20130283289A1 (en) * 2012-04-19 2013-10-24 International Business Machines Corporation Environmentally aware load-balancing

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7461273B2 (en) * 2005-05-16 2008-12-02 Hewlett-Packard Development Company, L.P. Power distribution among servers
JP2010108324A (ja) 2008-10-31 2010-05-13 Hitachi Ltd 物理計算機及び冷却装置の制御方法及びサーバシステム
US8631411B1 (en) * 2009-07-21 2014-01-14 The Research Foundation For The State University Of New York Energy aware processing load distribution system and method
JP5621287B2 (ja) * 2010-03-17 2014-11-12 富士通株式会社 負荷分散システムおよびコンピュータプログラム

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003083693A1 (fr) * 2002-04-03 2003-10-09 Fujitsu Limited Planificateur de taches dans un systeme de traitement distribue
US20050055590A1 (en) * 2003-09-04 2005-03-10 Farkas Keith Istvan Application management based on power consumption
JP2006106807A (ja) * 2004-09-30 2006-04-20 Toshiba Corp マルチプロセッサ計算機及びプログラム
JP2006133995A (ja) * 2004-11-04 2006-05-25 Toshiba Corp プロセッサシステム及びその制御方法
JP2007179437A (ja) * 2005-12-28 2007-07-12 Fujitsu Ltd 管理システム、管理プログラムおよび管理方法
JP2007241376A (ja) * 2006-03-06 2007-09-20 Fujitsu Ten Ltd 情報処理装置
JP2008242614A (ja) * 2007-03-26 2008-10-09 Nec Corp ジョブスケジューリング装置及びジョブスケジューリング方法
JP2009277022A (ja) * 2008-05-15 2009-11-26 Fujitsu Ltd 情報処理システム、負荷制御方法、および負荷制御プログラム
JP2011204128A (ja) * 2010-03-26 2011-10-13 Nomura Research Institute Ltd 運用管理装置および運用管理方法
JP2013073413A (ja) * 2011-09-28 2013-04-22 Hitachi Ltd データセンタの負荷割当て方法及び情報処理システム
US20130283289A1 (en) * 2012-04-19 2013-10-24 International Business Machines Corporation Environmentally aware load-balancing

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018151920A (ja) * 2017-03-14 2018-09-27 株式会社富士通アドバンストエンジニアリング データ分配装置及びデータ分配比率の決定方法

Also Published As

Publication number Publication date
JP6384321B2 (ja) 2018-09-05
US20160187018A1 (en) 2016-06-30
US10095204B2 (en) 2018-10-09

Similar Documents

Publication Publication Date Title
JP6384321B2 (ja) ジョブ割当プログラム、方法及び装置
US10877533B2 (en) Energy efficient workload placement management using predetermined server efficiency data
JP5151203B2 (ja) ジョブスケジューリング装置及びジョブスケジューリング方法
WO2017112058A1 (en) Method to assess energy efficiency of hpc system operated with & without power constraints
JP2008225995A (ja) ポリシ作成支援方法、ポリシ作成支援システム、およびプログラム
JP2011118794A (ja) バッチジョブ処理時間推定プログラム、方法及び装置
JP2011186701A (ja) リソース割当装置、リソース割当方法、およびリソース割当プログラム
US20150370593A1 (en) System construction device and system construction method
JP2017151656A (ja) 並列処理装置、電力係数算出プログラムおよび電力係数算出方法
JP6176390B2 (ja) 情報処理装置、解析方法、及び、プログラム記録媒体
JP5576085B2 (ja) 分散コンピュータシステム及びその運用方法
JP2019097327A (ja) 電力需要予測装置、電力需要予測方法およびプログラム
JP2017053555A (ja) 効率決定装置、効率決定方法及び効率決定プログラム
US10216606B1 (en) Data center management systems and methods for compute density efficiency measurements
JP5843716B2 (ja) 電力管理システム、電力管理方法、統合管理装置及びプログラム
JP6963465B2 (ja) 計算機システム及びデータ処理の制御方法
JP2016212609A (ja) 仮想マシン運用支援システムおよび仮想マシン運用支援方法
JP2015108877A (ja) 予測時間分布生成装置、制御方法、及びプログラム
JP6930938B2 (ja) 運転計画作成装置、運転計画作成方法、およびプログラム
JP5056346B2 (ja) 情報処理装置、情報処理システム、仮想サーバの移動処理の制御方法、及び、プログラム
JP6988556B2 (ja) 情報処理装置、ジョブ状態表示方法およびジョブ状態表示プログラム
JP5648397B2 (ja) 計算処理システム、そのジョブ分散配置方法及びジョブ分散配置プログラム
WO2013145272A1 (ja) 情報処理装置、及びプログラム
US11740674B2 (en) Systems and methods for reducing stranded power capacity
JP6708348B2 (ja) 管理装置、管理システム、管理方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20171113

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180619

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180710

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180723

R150 Certificate of patent or registration of utility model

Ref document number: 6384321

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees