JP2020047140A - ジョブ実行システムおよびジョブ実行方法 - Google Patents

ジョブ実行システムおよびジョブ実行方法 Download PDF

Info

Publication number
JP2020047140A
JP2020047140A JP2018176732A JP2018176732A JP2020047140A JP 2020047140 A JP2020047140 A JP 2020047140A JP 2018176732 A JP2018176732 A JP 2018176732A JP 2018176732 A JP2018176732 A JP 2018176732A JP 2020047140 A JP2020047140 A JP 2020047140A
Authority
JP
Japan
Prior art keywords
job
throttling
computing node
node
notification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018176732A
Other languages
English (en)
Other versions
JP7124592B2 (ja
Inventor
安田 昌生
Masao Yasuda
昌生 安田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2018176732A priority Critical patent/JP7124592B2/ja
Publication of JP2020047140A publication Critical patent/JP2020047140A/ja
Application granted granted Critical
Publication of JP7124592B2 publication Critical patent/JP7124592B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Power Sources (AREA)

Abstract

【課題】 スロットリングが頻発した場合であっても実行されるジョブの遅延をできるだけ避けることを可能とさせる。【解決手段】 ジョブ実行システムは、割り当てられたジョブおよびスロットリングをそれぞれに実行する、第1計算ノードと、第1計算ノードと別の計算ノードである第2計算ノードと、を備えるサーバと、ジョブを管理するジョブスケジューラと、を備える。ジョブを実行する第1計算ノードは、所定時間内においてスロットリングが実行された時間の累計である累計時間が所定の時間閾値を超えたか否かを判定し、累計時間が時間閾値を超えた場合、その旨の通知をジョブスケジューラに送信する。通知を受信したジョブスケジューラは、第1計算ノードで実行中のジョブを一時停止させ、一時停止させたジョブを第2計算ノードに割り当て、割り当てたジョブをリスタートさせる。【選択図】 図1

Description

本発明は、ジョブ実行システムおよびジョブ実行方法に関する。
近年、AI分析等で大規模計算の要求が高まっており、計算能力の向上が求められている。そこで、一台のサーバに、たとえば、PCIe(Peripheral Component Interconnect Express)拡張カードタイプのアクセラレータ(計算ノードとも呼ぶ)を複数台搭載することにより、高性能のコンピュータシステムが実現される。上記において、AIは、Artificial Intelligenceの略である。また、PCIeは、PCI−SIGの登録商標である。
しかしながら、このPCIe拡張カードタイプのアクセラレータは、計算処理能力が高いがゆえに消費電力が高くなるため、プロセッサの温度上昇が問題となっている。
そこで、多くのアクセラレータは、スロットリングと呼ばれる機能を搭載している。スロットリングは、たとえば、アクセラレータに搭載されるプロセッサのクロックや命令発行のレートを抑えることによりプロセッサのパフォーマンスを抑制することで温度上昇を抑制させ、データの信頼性を保証し、システムの寿命を延ばす機能である。
上記に関連して、たとえば、特許文献1には、スケジューラが、ジョブ管理テーブルに登録されている使用計算機群についてそれらの温度が高いか調べ、1台でも温度が高いと判断された場合は、その計算機上のジョブを他の温度の低い計算機に移動する技術が記載されている。
特許文献2には、スケジュール作成部が、制御目標テーブルとタスクテーブルを参照して動作周波数に応じたタスクのスケジューリングを行う技術が記載されている。
特開2004−126968号公報 特開2005−346301号公報
スロットリングによりシステムの停止は回避される。しかしながら、逆に、エラーが表面化しないため、スロットリングが頻発した場合、すなわち、所定時間内におけるスロットリングの実行累計時間が一定値を超えた場合、性能が中途半端に低下した状態で使用され続けられる可能性がある。この場合、結果的に、ジョブの完了時間が長期化する虞がある。
特許文献1、2の技術は、いずれも、スロットリングによる性能低下に伴い発生する問題を解決するための技術ではない。
本発明は、上記課題を解決するためになされたものであり、スロットリングが頻発した場合であっても実行されるジョブの遅延をできるだけ避けることが可能な技術を提供することを目的とする。
本発明のジョブ実行システムは、割り当てられたジョブおよびスロットリングをそれぞれに実行する、第1計算ノードと、前記第1計算ノードと別の計算ノードである第2計算ノードと、を備えるサーバと、前記ジョブを管理するジョブスケジューラと、を備え、前記ジョブを実行する前記第1計算ノードは、所定時間内においてスロットリングが実行された時間の累計である累計時間が所定の時間閾値を超えたか否かを判定し、前記累計時間が前記時間閾値を超えた場合、その旨の通知を前記ジョブスケジューラに送信し、前記通知を受信した前記ジョブスケジューラは、前記第1計算ノードで実行中の前記ジョブを一時停止させ、一時停止させた前記ジョブを第2計算ノードに割り当て、割り当てた前記ジョブをリスタートさせる。
本発明のジョブ実行方法は、割り当てられたジョブおよびスロットリングをそれぞれに実行する、第1計算ノードと、前記第1計算ノードと別の計算ノードである第2計算ノードと、を備えるサーバと、前記ジョブを管理するジョブスケジューラと、をジョブ実行システムに設け、前記ジョブを実行する前記第1計算ノードは、所定時間内においてスロットリングが実行された時間の累計である累計時間が所定の時間閾値を超えたか否かを判定し、前記累計時間が前記時間閾値を超えた場合、その旨の通知を前記ジョブスケジューラに送信し、前記通知を受信した前記ジョブスケジューラは、前記第1計算ノードで実行中の前記ジョブを一時停止させ、一時停止させた前記ジョブを第2計算ノードに割り当て、割り当てた前記ジョブをリスタートさせることを特徴とする。
本発明によれば、スロットリングが頻発した場合であっても実行されるジョブの遅延をできるだけ避けることが可能となる。
本発明の第1の実施形態に係るジョブ実行システムの構成例を示すブロック図である。 図1に示されるジョブ実行システムの動作例(ジョブ実行方法)を説明するためのフローチャートである。 本発明の第2の実施形態に係るジョブ実行システムの構成例を示すブロック図である。 スロットリングの実行例を示す図である。 図3に示すジョブ実行システムの動作例(計算処理方法)を説明するためのフローチャートである。 第2の実施形態による効果を説明するための図である。
[第1の実施形態]
図1は、本発明の第1の実施形態に係るジョブ実行システム500の構成例を示すブロック図である。ジョブ実行システム500は、割り当てられたジョブおよびスロットリングをそれぞれに実行する、第1計算ノード530と、第1計算ノード530と別の計算ノードである第2計算ノード540と、を備えるサーバ520と、ジョブを管理するジョブスケジューラ510と、を備える。第1計算ノード530および第2計算ノード540は、それぞれに1つ以上のプロセッサを搭載する。プロセッサは、たとえば、CPU(Central Processing Unit)やGPU(Graphics Processing Unit)である。GPUは、近年では汎用の高速な数値計算装置として様々な分野(たとえば、科学技術計算や暗号処理、仮想通貨、音声認識・合成、人工知能)で利用されるようになっている。このようなGPUは、GPGPU(General Purpose GPU)あるいはGPUコンピューティングと呼ばれる。また、プロセッサは、CPUにGPUの機能を統合したものであってもよい。
スロットリングとは、第1計算ノード530および第2計算ノード540上の各プロセッサの、たとえば、クロックや命令発行のレートを抑えることで計算ノードのパフォーマンスを抑制する機能である。
ジョブを実行する第1計算ノード530は、所定時間内においてスロットリングが実行された時間の累計である累計時間が所定の時間閾値を超えたか否かを判定し、累計時間が時間閾値を超えた場合、その旨の通知をジョブスケジューラ510に送信する。上記の所定時間とは、所定の単位時間のことであり、基本的には任意の時間長である。ただし、一般的には、1つのジョブの遂行時間はとても短いので、所定時間=1つのジョブが遂行される時間、と見なすことができる。また、時間閾値は、たとえば、スロットリングが頻発していると判断可能な時間長である。時間閾値は、ユーザの経験に基づいて、あるいは所定の計算ルールによる計算によって、任意に設定することができる。
上記通知を受信したジョブスケジューラ510は、第1計算ノード530で実行中のジョブを一時停止させ、ジョブを第2計算ノード540に割り当て、割り当てたジョブをリスタートさせる。
図2は、図1に示されるジョブ実行システム500の動作例(ジョブ実行方法)を説明するためのフローチャートである。
ジョブを実行する第1計算ノード530は、累計時間が時間閾値を超えたか否かを判定し、累計時間が時間閾値を超えた場合、その旨の通知をジョブスケジューラ510に送信する(ステップS100)。
上記通知を受信したジョブスケジューラ510は、第1計算ノード530で実行中のジョブを一時停止させ、一時停止させたジョブを第2計算ノード540に割り当て、割り当てたジョブをリスタートさせる(ステップS101)。
以上説明した第1の実施形態において、ジョブを実行する第1計算ノード530におけるスロットリングの累計時間が時間閾値を超えたことが検知された場合、その旨の通知がジョブスケジューラ510へ送信される。ジョブスケジューラ510は、第1計算ノード530で実行中のジョブを一時停止させ、ジョブを第2計算ノード540に割り当て、割り当てたジョブをリスタートさせる。
従って、第1の実施形態では、スロットリングにより性能低下している計算ノード(たとえば、第1計算ノード530)が使い続けられることが回避され、結果として、ジョブ実行時間が長くなることを防ぐことができる。
なお、スロットリングの詳細制御や、計算ノードおよびジョブスケジューラの各詳細構成については、後述する第2の実施形態にて説明する。
[第2の実施形態]
(構成の説明)
図3は、本発明の第2の実施形態に係るジョブ実行システム1の構成例を示すブロック図である。
ジョブ実行システム1は、ジョブスケジューラ10と、複数の計算ノードを含む1つ以上のサーバ20と、を含む。図3では、1つ以上のサーバが「サーバ20」であり、複数の計算ノードが「計算ノード40(図1の第1計算ノードに相当)」および「計算ノード41(図1の第2計算ノードに相当)」である場合が例示される。もちろん、図3の例示はあくまで一例あって、サーバおよび計算ノードのそれぞれの数は上記に限定されない。計算ノードは、たとえば、PCIe拡張カードタイプのアクセラレータである。
サーバ20とジョブスケジューラ10とは、ネットワークを介して接続される。
サーバ20は、計算ノード制御部30と、計算ノード40と、計算ノード41と、を備える。
計算ノード制御部30は、サーバ20内の計算ノード40および計算ノード41を制御するユニットであって、たとえば、ジョブスケジューラ10からの指示を各計算ノードへ送信し、各計算ノードからの通知をジョブスケジューラ10へ送信する。
具体的には、計算ノード制御部30は、超過判定部403から、カウント値が時間閾値を超えた旨の通知を受信すると、当該通知をジョブスケジューラ10へ送信する。
計算ノード40は、温度センサ400と、スロットリング制御部401と、スロットリングカウンタ402と、超過判定部403と、を有する。なお、計算ノード40および計算ノード41は、それぞれに1つ以上のプロセッサ(図3において不図示)を搭載する。また、スロットリングとは、計算ノード40および計算ノード41上の各プロセッサの、たとえば、クロックや命令発行のレートを抑えることで計算ノードのパフォーマンスを抑制する機能である。なお、計算ノード41の各構成は、計算ノード40と同等であるため、計算ノード41の各構成についての説明は省略する。
温度センサ400は、計算ノード40の温度を検出する。計算ノード40の温度とは、例えば、計算ノード40内で最も温度が上昇するデバイスの温度である。また、温度は、複数のポイント(たとえば、高温となりそうなでデバイスであるプロセッサや電源部の各位置)で測定された各温度の平均値であってもよい。
スロットリング制御部401は、スロットリングをオンする温度閾値である第1温度閾値と、スロットリングをオフする温度閾値である第2温度閾値とを、あらかじめ保持している。この場合、第1温度閾値と第2温度閾値との関係は、「第1温度閾値>第2温度閾値」である。
図4は、スロットリングの実行例を示す図である。図4において、縦軸は、計算ノード(例えば、計算ノード40)の温度であり、横軸は、時間である。温度センサ400によって検出された温度が第1温度閾値を上回る場合、スロットリング制御部401は、計算ノード40のスロットリングをオンにし、スロットリングカウンタ402へ、スロットリングをオンした旨の通知を送信する。スロットリングがオンになると、たとえば、クロックや命令発行のレートが抑制され、計算ノード40のパフォーマンスを低下する。
一方、検出された温度が第2温度閾値を下回る場合、スロットリング制御部401は、計算ノード40のスロットリングをオフにし、スロットリングカウンタ402へ、スロットリングをオフした旨の通知を送信する。
なお、温度閾値は、必ずしも2つ(第1温度閾値および第2温度閾値)である必要はなく、1つであってもよい。その場合、検出された温度がその1つの温度閾値を上回った場合にはスロットリングをオンにし、検出された温度がその温度閾値以下の場合にはスロットリングをオフにする制御が実行される。
スロットリングカウンタ402は、所定時間内においてスロットリングが実行された時間の累計である累計時間を計測する。スロットリングカウンタ402は、ジョブが割り付けられる際にカウント値をリセットし、スロットリング制御部401から、計算ノード40のスロットリングをオンしたことの通知が送信されると、カウントを開始する。一方、スロットリング制御部401から、計算ノード40のスロットリングをオフしたことの通知が送信されると、スロットリングカウンタ402は、カウントを停止させるとともに、そのカウント値を累計時間として計測し、累計時間を、スロットリングがオフされるたびに、超過判定部403へ送信する。カウント値は、リセットされてから次にリセットされるまで、スロットリングのオン/オフにかかわらず維持される。すなわち、カウント値は、累計時間を反映している。
超過判定部403は、所定の時間閾値(第1の実施形態参照)を予め記憶している。すなわち、所定時間内においてスロットリングが実行された時間の累計である累計時間が上記時間閾値を超えたか否かを判定することは、計算ノード40の性能が一定程度低下していることを測定することと同等である。
累計時間が時間閾値を超えた場合、超過判定部403は、その旨を示す通知を計算ノード制御部30へ送信する。
計算ノード制御部30は、累計時間が時間閾値を超えた旨を示す通知をジョブスケジューラ10へ送信する。
ジョブスケジューラ10は、サーバ20の計算ノード制御部30から、ジョブを実行する計算ノード40において累計時間が時間閾値を超えた旨を示す通知を受信する。ジョブスケジューラ10は、計算ノード40で実行中のジョブを一時停止させ、このジョブを別の計算ノード(たとえば、計算ノード41)に割り当てる。そして、ジョブスケジューラ10は、別の計算ノードに対して、割り当てたジョブをリスタートさせる指示を行う。
なお、ジョブスケジューラ10は、計算ノード40で実行中のジョブを一時停止させる際、当該ジョブに対して中断した位置を示すチェックポイントを設定してもよい。このようにすることにより、ジョブをリスタートさせる際、中断した位置からリスタートさせることができる。
また、ジョブスケジューラ10は、ジョブを割り付ける際に、ジョブが割り付けられる計算ノードのスロットリングカウンタ402をリセットする。
(動作の説明)
図5は、図3に示すジョブ実行システム1の動作例(計算処理方法)を説明するためのフローチャートである。
ジョブスケジューラ10は、ジョブを割り付ける計算ノード(例えば、計算ノード40)を決定する(ステップS1)。ジョブスケジューラ10は、計算ノード40のスロットリングカウンタ402に対してリセットを指示する(ステップS2)。スロットリングカウンタ402は、ジョブスケジューラ10からのリセット指示を受けカウントをリセットする(ステップS3)。
ジョブスケジューラ10は、計算ノード40に対してジョブを投入する(ステップS4)。計算ノード40ではジョブの実行が開始される(ステップS5)。やがて、計算ノード40では、ジョブの実行により温度が上昇し、スロットリング制御部401によりスロットリングのオンとオフが繰り返される(ステップS6)。スロットリングカウンタ402は、スロットリングがオフされるたびに、累計時間を計測する。
スロットリングが頻発することで、累計時間が時間閾値を超えるようになると(ステップS7)、超過判定部403は、累計時間が時間閾値を超えた旨の通知を計算ノード制御部30へ送信する。計算ノード制御部30は、ジョブを実行する計算ノード40において累計時間が時間閾値を超えた旨を示す通知をジョブスケジューラ10へ送信する。ジョブスケジューラ10は、サーバ20の計算ノード制御部30から、ジョブを実行する計算ノード40において累計時間が時間閾値を超えた旨を示す通知を受信する(ステップS8)。
ジョブスケジューラ10は、計算ノード40で実行中のジョブに対しチェックポイントを設定し(ステップS9)、一時停止させる(ステップS10)。その後、ジョブスケジューラ10は、一時停止させたジョブを割り当てる計算ノード(例えば、計算ノード41)を決定する(ステップS11)。ジョブスケジューラ10は、計算ノード41のスロットリングカウンタ402に対してカウントのリセットを指示する(ステップ12)。スロットリングカウンタ402は、ジョブスケジューラ10からのリセット指示を受けカウントをリセットする(ステップS13)。ジョブスケジューラ10は、計算ノード41に対して、一時停止したジョブについて、チェックポイントのリストアおよび再開を指示する(ステップS14)。計算ノード41において、一時停止したジョブが再開される(ステップS15)。
(効果の説明)
図6は、以上説明した第2の実施形態による効果を説明するための図である。以下では、たとえば、ファンの故障等で冷却性能が低下した計算ノード40でジョブを実行したケースを想定して説明する。
一般的なジョブ実行システムの場合、ジョブ完了に至るまでの間に幾度もスロットリングが有効になり、ジョブの実行を計算ノード40でそのまま続けていると、スロットリングの度にジョブの進行が停滞するため、結果的に、ジョブの完了時間が長くなってしまう。
一方、本実施形態のジョブ実行システム1は、計算ノード40におけるスロットリングの累計時間が時間閾値を超えていると判断した場合、ジョブを実行させるノードを、別の計算ノードである計算ノード41に切り替え、当該ジョブを再開させる。この場合、計算ノード41ではファンの故障等は発生していない可能性が高いため、スロットリングは発生しないか、あるいは、その頻度は高くない。従って、スロットリングによってジョブ実行が停滞することがなく、結果としてジョブ実行時間が長くなることを回避することができる。
なお、以上説明した第2の実施形態において、「別の計算ノード」は、ジョブを実行している計算ノード以外の計算ノードであれば十分である。ただし、この場合、「別の計算ノード」を、たとえば、エラー(特に、発熱に関連するエラー)が発生していない計算ノードとすると、再開するジョブの実行長期化をより一層確実に阻止することができて好適である。
以上、各実施形態を用いて本発明を説明したが、本発明の技術的範囲は、上記各実施形態の記載に限定されない。上記各実施形態に多様な変更又は改良を加えることが可能であることは当業者にとって自明である。従って、そのような変更又は改良を加えた形態もまた本発明の技術的範囲に含まれることは説明するまでもない。また、以上説明した各実施形態において使用される、数値や各構成の名称等は例示的なものであり適宜変更可能である。
1 ジョブ実行システム
10 ジョブスケジューラ
20 サーバ
30 計算ノード制御部
40 計算ノード
41 計算ノード
400 温度センサ
401 スロットリング制御部
402 スロットリングカウンタ
403 超過判定部
500 ジョブ実行システム
510 ジョブスケジューラ
520 サーバ
530 第1計算ノード
540 第2計算ノード

Claims (5)

  1. 割り当てられたジョブおよびスロットリングをそれぞれに実行する、第1計算ノードと、前記第1計算ノードと別の計算ノードである第2計算ノードと、を備えるサーバと、
    前記ジョブを管理するジョブスケジューラと、
    を備え、
    前記ジョブを実行する前記第1計算ノードは、所定時間内においてスロットリングが実行された時間の累計である累計時間が所定の時間閾値を超えたか否かを判定し、前記累計時間が前記時間閾値を超えた場合、その旨の通知を前記ジョブスケジューラに送信し、
    前記通知を受信した前記ジョブスケジューラは、前記第1計算ノードで実行中の前記ジョブを一時停止させ、一時停止させた前記ジョブを第2計算ノードに割り当て、割り当てた前記ジョブをリスタートさせる
    ことを特徴とするジョブ実行システム。
  2. 前記第1計算ノードは、
    前記ジョブが割り付けられる際にカウント値をリセットし、前記第1計算ノードにおいて前記スロットリングがオンになるとカウントを開始し、前記スロットリングがオフされるとカウントを停止し、前記カウントの値であるカウント値を計測し、前記カウント値を前記累計時間として前記スロットリングがオフされるたびに送信するスロットリングカウンタと、
    前記時間閾値を予め記憶し、前記累計時間が前記時間閾値を超えた場合、その旨を示す通知を、前記ジョブスケジューラに送信する超過判定部と
    を備える請求項1記載のジョブ実行システム。
  3. 前記第1計算ノードは、さらに、
    温度を検出する温度センサと、
    前記スロットリングをオンする温度閾値である第1温度閾値と、前記スロットリングをオフする温度閾値である第2温度閾値とを、あらかじめ保持し、前記温度センサによって検出された温度が前記第1温度閾値を上回る場合に前記スロットリングをオンにし、前記スロットリングカウンタに対して前記スロットリングをオンした旨の通知を送信し、一方、前記温度が前記第2温度閾値を下回る場合、前記スロットリングをオフにし、前記スロットリングカウンタに対して前記スロットリングをオフした旨の通知を送信するスロットリング制御部と
    を備える請求項2記載のジョブ実行システム。
  4. 前記ジョブスケジューラは、前記第1計算ノードで実行中の前記ジョブを一時停止させる際、当該ジョブに対して中断した位置を示すチェックポイントを設定する請求項1乃至3のいずれか1項に記載のジョブ実行システム。
  5. 割り当てられたジョブおよびスロットリングをそれぞれに実行する、第1計算ノードと、前記第1計算ノードと別の計算ノードである第2計算ノードと、を備えるサーバと、
    前記ジョブを管理するジョブスケジューラと、
    をジョブ実行システムに設け、
    前記ジョブを実行する前記第1計算ノードは、所定時間内においてスロットリングが実行された時間の累計である累計時間が所定の時間閾値を超えたか否かを判定し、前記累計時間が前記時間閾値を超えた場合、その旨の通知を前記ジョブスケジューラに送信し、
    前記通知を受信した前記ジョブスケジューラは、前記第1計算ノードで実行中の前記ジョブを一時停止させ、一時停止させた前記ジョブを第2計算ノードに割り当て、割り当てた前記ジョブをリスタートさせる
    ことを特徴とするジョブ実行方法。
JP2018176732A 2018-09-21 2018-09-21 ジョブ実行システムおよびジョブ実行方法 Active JP7124592B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018176732A JP7124592B2 (ja) 2018-09-21 2018-09-21 ジョブ実行システムおよびジョブ実行方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018176732A JP7124592B2 (ja) 2018-09-21 2018-09-21 ジョブ実行システムおよびジョブ実行方法

Publications (2)

Publication Number Publication Date
JP2020047140A true JP2020047140A (ja) 2020-03-26
JP7124592B2 JP7124592B2 (ja) 2022-08-24

Family

ID=69901487

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018176732A Active JP7124592B2 (ja) 2018-09-21 2018-09-21 ジョブ実行システムおよびジョブ実行方法

Country Status (1)

Country Link
JP (1) JP7124592B2 (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007122337A (ja) * 2005-10-27 2007-05-17 Sonac Kk 演算装置
JP2009223637A (ja) * 2008-03-17 2009-10-01 Fujitsu Ltd ジョブ割当装置、ジョブ割当方法、及び、ジョブ割当プログラム
JP2010015192A (ja) * 2008-06-30 2010-01-21 Hitachi Ltd 情報処理システムおよびそのシステムにおける省電力制御方法
JP2014126891A (ja) * 2012-12-25 2014-07-07 Fujitsu Ltd 情報処理装置、情報処理装置の冷却制御方法、冷却制御プログラム
JP2016200923A (ja) * 2015-04-09 2016-12-01 富士通株式会社 並列計算制御装置、並列計算システムおよびマイグレーション時間推定プログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007122337A (ja) * 2005-10-27 2007-05-17 Sonac Kk 演算装置
JP2009223637A (ja) * 2008-03-17 2009-10-01 Fujitsu Ltd ジョブ割当装置、ジョブ割当方法、及び、ジョブ割当プログラム
JP2010015192A (ja) * 2008-06-30 2010-01-21 Hitachi Ltd 情報処理システムおよびそのシステムにおける省電力制御方法
JP2014126891A (ja) * 2012-12-25 2014-07-07 Fujitsu Ltd 情報処理装置、情報処理装置の冷却制御方法、冷却制御プログラム
JP2016200923A (ja) * 2015-04-09 2016-12-01 富士通株式会社 並列計算制御装置、並列計算システムおよびマイグレーション時間推定プログラム

Also Published As

Publication number Publication date
JP7124592B2 (ja) 2022-08-24

Similar Documents

Publication Publication Date Title
CN110825544B (zh) 计算节点及其失效检测方法与云端数据处理***
EP2430538B1 (en) Allocating computing system power levels responsive to service level agreements
US8484495B2 (en) Power management in a multi-processor computer system
EP3087503B1 (en) Cloud compute scheduling using a heuristic contention model
US10025686B2 (en) Generating and communicating platform event digests from a processor of a system
US9477295B2 (en) Non-volatile memory express (NVMe) device power management
JP5317010B2 (ja) 仮想マシン配置システム、仮想マシン配置方法、プログラム、仮想マシン管理装置およびサーバ装置
US20160378570A1 (en) Techniques for Offloading Computational Tasks between Nodes
US20100205607A1 (en) Method and system for scheduling tasks in a multi processor computing system
US20120297216A1 (en) Dynamically selecting active polling or timed waits
US8892819B2 (en) Multi-core system and external input/output bus control method
TW201636771A (zh) 在非核心組織中之電力管理技術
JP2014048972A (ja) 処理装置、情報処理装置、及び消費電力管理方法
JP2008171293A (ja) 仮想計算機システムのスケジューリング方法
JP2015148890A (ja) 情報処理装置、情報処理システム、および情報処理システムの制御方法
JP6955163B2 (ja) 情報処理装置、情報処理方法及びプログラム
US7467289B1 (en) Indicating acknowledge of stable state of pipeline resource when freeze bit set and context switch inhibited
US8862786B2 (en) Program execution with improved power efficiency
US11243603B2 (en) Power management of an event-based processing system
KR101672357B1 (ko) 응답 타이밍 최적화에 기초하는 멀티프로세서 시스템에서의 주파수 조정 수행
JP2020047140A (ja) ジョブ実行システムおよびジョブ実行方法
US9285865B2 (en) Dynamic link scaling based on bandwidth utilization
JP2011233057A (ja) マルチプロセッサシステム、マルチプロセッサの制御方法およびマルチプロセッサの制御方法のプログラム
JP2021043725A (ja) 計算システム、計算方法及びプログラム
JP6112205B2 (ja) 情報処理システム、装置、方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210816

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20211015

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220622

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220712

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220725

R151 Written notification of patent or utility model registration

Ref document number: 7124592

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151