JP6364815B2 - ジョブ管理装置及びジョブ管理方法 - Google Patents

ジョブ管理装置及びジョブ管理方法 Download PDF

Info

Publication number
JP6364815B2
JP6364815B2 JP2014037994A JP2014037994A JP6364815B2 JP 6364815 B2 JP6364815 B2 JP 6364815B2 JP 2014037994 A JP2014037994 A JP 2014037994A JP 2014037994 A JP2014037994 A JP 2014037994A JP 6364815 B2 JP6364815 B2 JP 6364815B2
Authority
JP
Japan
Prior art keywords
node
job
model
physical
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014037994A
Other languages
English (en)
Other versions
JP2015162160A (ja
Inventor
葵 川原
葵 川原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2014037994A priority Critical patent/JP6364815B2/ja
Publication of JP2015162160A publication Critical patent/JP2015162160A/ja
Application granted granted Critical
Publication of JP6364815B2 publication Critical patent/JP6364815B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Power Sources (AREA)

Description

本発明は、情報処理システムに関するものであり、特にクラスタシステム用いた情報処理システムに関するものである。
情報社会の発展に伴い、高性能な情報処理システムが広く用いられるようになっている。高性能な情報処理システムは、例えば、多大なデータを処理して有用なデータを抽出するような用途に使われる。高性能な情報処理システムに関する分野は、HPC(High Performance Computing)分野とも呼ばれる。高い情報処理能力が要求される情報処理システムでは、多数のノードで構成され、各ノードで分散して処理が行われることがある。このように、情報処理システムを構成する各ノードに処理を分散して、多大なデータを処理することを可能にした情報処理システムはクラスタシステムとも呼ばれる。
クラスタシステムを構成する各ノードでは、ジョブと呼ばれる処理単位で情報の処理が行われる。クラスタシステムを用いて行う情報処理は多様な分野で行われるので、処理単位となるジョブも多様性を有する。そのため、情報処理システムを構成するノードも処理の多様性を満たすように備えられている必要がある。また、情報処理システムの運用を安定して継続的に行うためには、あるノードで障害が生じたときでも情報処理システム全体として処理を継続できる必要がある。クラスタシステムでは、各ノードが有するリソースを仮想ノードとして組み合わせて情報の処理を行うことにより、多様性や継続性の要求に対応する。そのため、クラスタシステムでは、各ノードが有するリソースをジョブに的確に割り当ててジョブを実行することで、高い処理性能を維持しつつ、継続的な運用が可能となり得る。
高い情報処理能力を要求されるクラスタシステムは、情報の処理を行う計算用のノードの他にも通信装置やディスク装置など多くの装置により構成されている。処理するデータ量の増加に伴って必要な装置の数も増加し、クラスタシステムを構成する各装置の消費電力は膨大なものとなり得る。また、クラスタシステムを構成する各装置を安定して稼働させるためには、発熱を抑制するための冷却が必要であり、冷却のための電力も増加している。よって、クラスタシステムで使用する電力の総和は膨大なものとなり、使用する電力量を抑制する要求も高い。そのため、クラスタシステムは、情報処理システムとしての性能を確保しつつ、消費電力等を抑制して効率的な運用を行えることが望ましい。情報処理システムの効率的な運用のために消費電力を抑制する方法としては、例えば、ジョブに効率的にノードを割り当てることによりノードの集約化を行って稼働するノードの数を抑制する方法がある。ノードの集約化を行うためには、ノードの有するリソースを有効に活用するためのジョブへのノードの割り当て技術が必要となる。
クラスタシステムにおいて、ノードの有するリソースを有効に活用するためのジョブへのノードの割り当てに関する技術としては、例えば、特許文献1のような技術が開示されている。
特許文献1は、クラスタシステムで実行するジョブにノードを割り当てるジョブ管理装置に関するものである。特許文献1のジョブ管理装置は、ジョブにノードを割り当てる際に、ジョブへの仮想ノードを割り当て、および、仮想ノードに対応した物理ノードの割り当ての2段階で割り当てを行う。ジョブが投入されると、ジョブ管理装置はジョブの実行に必要なリソース要件を満たす仮想ノードをジョブに割り当てる。次に、ジョブ管理装置は、割り当てた仮想ノードに相当するリソースを有する物理ノードを選択し、選択した物理ノードをジョブに割り当てる。また、ジョブ管理装置は、物理ノードのリソースだけでなくノード間の構成要件も判断基準に含めて、仮想ノードに割り当てる物理ノードを選択する。例えば、ノード間の構成要件として、ネットワークトポロジや分散ファイルシステム等が判断基準に用いられる。
特許文献1では、ジョブに割り当てる物理ノードを選択する際に、ノード間の構成要件を判断基準に含めて選択することにより、障害発生時などに同等のシステム性能となるように物理ノードを選択することができるとしている。よって、特許文献1では、ノードに障害が発生した場合でも、処理性能を維持した状態で情報処理システムの運用が継続できるとしている。また、障害等の発生した物理ノードについて、障害等の発生していない部分のリソースを仮想ノードとみなしてジョブへの割り当てを行うことができるため、ノードの使用効率が向上するとしている。
特開2013−210833号公報
しかしながら、特許文献1の技術は次のような点で十分ではない。特許文献1のジョブ管理装置は、ジョブに物理ノードを割り当てる際に、ノード間の構成要件を判断基準に用いている。そのような構成とすることにより、回線や分散ファイルシステム等の特性を考慮してジョブを実行するために必要な性能をシステムとして有するように物理ノードを割り当て、情報処理システムの性能を維持することが可能となり得る。しかし、特許文献1では、ジョブに割り当てる物理ノードをリソースやノード間の構成要件を満たすことを基準として選択している。すなわち、特許文献1では、ジョブを実行する物理ノードを決定する際に、物理のノードごとの消費電力のような固有の特性については考慮していない。そのため、ソースやノード間の構成要件を満たすように物理ノードの選択が行われたとしても、情報処理システムの運用効率の低下が生じる可能性がある。例えば、消費電力の大きなノードが選択された場合などには、情報処理システム全体としての消費電力が増大して情報処理システムの運用効率が低下する。
また、情報処理システムでは、システムを構成するノードの追加や撤去などの構成の組み替えや、ノードの故障や保守作業などにより、使用されるノードが変化することが多い。そのため、同じリソースを有するノードを選択したとしても、使用されるノードが変わることにより消費電力量等が変化して、効率的な運用には適さないノードが選択される可能性が高くなり得る。そのような物理ノードの割り当て方法では、情報処理システムを効率的に運用することを目的とした場合には十分ではなく、ジョブへの物理ノードの割り当ての最適化が必要となる。よって、特許文献1の技術は、情報処理システムを効率的に運用することを目的として、ノードの有するリソースを有効に活用するようにジョブへのノードの割り当てを行う技術としては十分ではない。
本発明は、リソースを有効に活用しつつ、ジョブの実行に最適な物理ノードを選択することが可能となるジョブ管理装置を得ることを目的としている。
上記の課題を解決するため、本発明のジョブ管理装置は、ノードモデル生成手段と、ジョブ解析手段と、ノードモデル選択手段と、ノード評価手段と、ノード決定手段を備えている。ノードモデル生成手段は、ネットワークを介して複数台接続された物理ノードを構成するリソースのうち、仮想ノードとして動作するリソースの組み合わせをノードモデルとして複数パターン生成する。ジョブ解析手段は、投入されたジョブの実行に必要なリソースを抽出する。ノードモデル選択手段は、ジョブ解析手段が抽出したリソースに適応するノードモデルを選択する。ノード評価手段は、ノードモデルに対応した物理ノードの特性を所定の方法で評価する。ノード決定手段は、ノードモデルに対応した物理ノードの中から、ノード評価手段による評価結果を基に、ジョブを実行する物理ノードを決定する。
また、本発明のジョブ管理方法は、ネットワークを介して複数台接続された物理ノードを構成するリソースのうち、仮想ノードとして動作するリソースの組み合わせをノードモデルとして複数パターン生成する。本発明のジョブ管理方法は、投入されたジョブの実行に必要なリソースを抽出し、抽出したリソースに適応するノードモデルを選択する。本発明のジョブ管理方法は、ノードモデルに対応した物理ノードの特性を所定の方法で評価する。本発明のジョブ管理方法は、ノードモデルに対応した物理ノードの中から、所定の方法での評価結果を基に、ジョブを実行する物理ノードを決定する。
本発明によると、リソースを有効に活用しつつ、ジョブの実行に最適な物理ノードを選択することが可能となる。
本発明の第1の実施形態の構成の概要を示す図である。 本発明の第2の実施形態の構成の概要を示す図である。 本発明の第2の実施形態のノードの構成の概要を示す図である。 本発明の第2の実施形態のジョブ管理装置の構成の概要を示す図である。 本発明の第2の実施形態における実行モデルの例を示す図である。 本発明の第2の実施形態におけるノードモデルの例を示す図である。 本発明の第2の実施形態におけるノードモデルの例を示す図である。 本発明の第2の実施形態における実行モデルとノードモデルの関係を示す図である。 本発明の第2の実施形態における動作フローの概要を示す図である。 本発明の第3の実施形態の構成の概要を示す図である。 本発明の第3の実施形態のノードの構成の概要を示す図である。 本発明の第3の実施形態のジョブ管理装置の構成の概要を示す図である。 本発明の第3の実施形態における動作フローの概要を示す図である。 本発明の第3の実施形態における動作フローの概要を示す図である。 本発明の第3の実施形態における動作フローの概要を示す図である。
本発明の第1の実施形態について図を参照して詳細に説明する。図1は本実施形態のジョブ管理装置の構成の概要を示したものである。本実施形態のジョブ管理装置は、ノードモデル生成手段1と、ジョブ解析手段2と、ノードモデル選択手段3と、ノード評価手段4と、ノード決定手段5を備えている。
ノードモデル生成手段1は、ネットワークを介して複数台接続された物理ノードを構成するリソースのうち、仮想ノードとして動作するリソースの組み合わせをノードモデルとして複数パターン生成する。ジョブ解析手段2は、投入されたジョブの実行に必要なリソースを抽出する。ノードモデル選択手段3は、ジョブ解析手段2が抽出したリソースに適応するノードモデルを選択する。ノード評価手段4は、ノードモデルに対応した物理ノードの特性を所定の評価方法で評価する。ノード決定手段5は、ノードモデルに対応した物理ノードの中から、ノード評価手段4による評価結果を基に、ジョブを実行する物理ノードを決定する。
本実施形態のジョブ管理装置では、ノードモデル選択手段3が投入されたジョブに適応するノードモデルを選択している。ノードモデルは、1つの物理ノードが有するリソースを組み合わせて仮想ノードを形成する際の、リソースの組み合わせ方のパターンを示したものである。本実施形態のジョブ管理装置では、ノード評価手段4が選択されたノードモデルに対応した物理ノードの評価を行っている。また、本実施形態のジョブ管理装置では、ノード評価手段4による評価結果を基にジョブを実行する物理ノードを決定している。本実施形態のジョブ管理装置は、仮想ノードとして物理ノードをジョブに割り当てることでリソースを有効に活用することができる。また、本実施形態のジョブ管理装置は、所定の評価方法で評価した結果を基に、ジョブを実行する物理ノードを決定することで、ジョブの実行に最適な物理ノードを選択することができる。その結果、本実施形態のジョブ管理装置では、リソースを有効に活用しつつ、ジョブの実行に最適な物理ノードを選択することが可能となる。
本発明の第2の実施形態について図を参照して詳細に説明する。図2は本実施形態の情報処理システムの構成の概要を示したものである。本実施形態の情報処理システムは、ノード10と、ジョブ管理装置20を備えている。ノード10は、情報処理システムの設計に応じて複数、備えられている。各ノード10およびジョブ管理装置20は通信回線60を介して接続され、互いにデータの送受信を行う。通信回線60は専用回線としてもよく、他の情報処理システム等との共用回線を用いてもよい。また、各ノード10およびジョブ管理装置20は同一のデータセンタ等の施設に備えられていてもよく、複数の拠点に分散して備えられていてもよい。
本実施形態の情報処理システムは、情報処理を複数のノード10に分散して行うクラスタシステムとして構成されている。本実施形態の情報処理システムでは、ジョブ管理装置20が、投入されたジョブにジョブを実行するノード10を割り当てて、ジョブの実行を管理する。
図3はノード10の構成の概要を示したものである。図10に示す通り、ノード10は、情報処理部11と、リソース状態管理部12と、通信機能部13を備えている。情報処理部11は、CPU(Central Processing Unit;中央演算処理装置)や記憶装置などで構成され、ジョブを実行する機能を有する。本実施形態では、CPUや記憶装置などジョブの実行に必要な装置をリソースと呼ぶ。情報処理部11の構成は、全てまたは複数のノード10で同じでもよく、ノード10ごとに異なっていてもよい。情報処理部11のCPUや記憶装置は、それぞれ複数、備えられていてもよい。また、記憶装置には、ノード10におけるジョブの実行に関するプログラム等を保存するための記憶装置の他に、ジョブの実行の結果得られた情報データ等を保存するための記憶装置が備えられていてもよい。
リソース状態管理部12は、情報処理部11の各リソースの使用予定や稼働状態を管理する機能を有する。リソース状態管理部12は、各リソースの使用予定の情報と現在の稼働状態の情報を保存している。稼動状態とは、省電力化のために動作を抑制した待機状態や、ジョブの実行に備えて全てのリソースが可能である起動状態のことをいう。
通信機能部13は、通信回線60を介してジョブ管理装置20および他のノード10との通信を行う機能を有する。通信機能部13は、ジョブ管理装置20および他のノード10から通信回線60を介して送られてきたデータを、情報処理部11およびリソース状態管理部12に送る。また、通信機能部13は、情報処理部11およびリソース状態管理部12がジョブ管理装置20および他のノード10に送るデータを通信回線60に出力する。
図4はジョブ管理装置20の構成の概要を示したものである。図4に示す通り、ジョブ管理装置20は、ジョブアサイン部21と、情報管理部22と、通信機能部23を備えている。ジョブアサイン部21は、組合せモデル選択部31と、ノードモデル選択部32と、物理ノード選択部33を備えている。ノードモデル選択部32は、実行ノード決定ポリシー管理部34を備えている。物理ノード選択部33は、空き時間検索部35と、消費電力予測部36と、物理ノード決定部37を備えている。
組合せモデル選択部31は、実行パターンに対応したノードモデルの候補を選択する機能を有する。組合せモデル選択部31は、実行パターンと組合せ情報保持部57に保存されている組合せ情報を照合することによりノードモデルの選択を行う。
実行パターンは、ジョブの実行に必要なリソースの組み合わせの一覧と各リソースの使われ方を定義した情報である。実行パターンは、ジョブの類型ごとに設定されている。実行パターンは情報保持部41に実行パターン情報55として保存されている。実行パターン情報55は、情報処理システムを設置した際または構成を組み替えた際などに、実行パターン作成部43により作成される。
実行パターンについて例を用いて説明する。図5に示すような、4つのCPUを有するノード10と記憶装置としてのディスク装置で構成されているユニットを例にして説明する。図5のような構成のユニットにおいてジョブを実行する場合、リソースの使い方は、例えば、4つのCPUを使う場合や、4つのCPUとディスク装置を使う場合などに分けることができる。図5では、実行パターン1としてCPUを4つ使うパターンについて、「実行パターン1、CPU4つ、ディスクI/O無し」のように示している。また、実行パターン2として、CPU4つとディスク装置を使う場合について、「実行パターン2、CPU4つ、ディスクI/O有り」のように示している。ディスクI/O(Input / Output)は、ディスク装置へのインタフェースを示し、ディスク装置へのアクセス、すなわち使用が可能であるかを示している。ディスクI/O無しの場合は、ディスク装置を使用しない場合を示し、ディスク装置有りはディスク装置を使用する場合を示している。
このように、実行パターンは、ジョブの実行に必要なリソースの組み合わせ等を定義した情報である。本実施形態の実行パターンは、情報処理システムが有するリソースの全ての組み合わせパターンについて定義されている。実行パターンは、ジョブの実行で実際に使用されることが想定されるリソースの組み合わせのみについて定義されていてもよい。
ノードモデルは、各ノード10が提供できるリソースの組み合わせを示したものである。すなわち、ノードモデルは、物理ノードであるノード10が備えるリソースを組み合わせて形成される仮想ノードの構成を、組合せのパターンごとに示したものである。図6は、4つのCPUを備えたノード10において設定されるノードモデルの例を示したものである。図6は、CPUのみを備えたノード10を例として示しているが、実際のノードモデルはCPU以外にも記憶装置等のリソースについての情報も含んでいる。4つのCPUを備えたノード10では、ノードモデルは4CPUモデル、3CPUモデル、2CPUモデルおよび1CPUモデルの4種類となる。
4CPUモデルは物理ノード全体を1つの仮想ノードをみなす場合であり、物理ノードと仮想ノードの構成が一致している。3CPUモデルは、4つのCPUのうち3つのCPUを1つのノードとみなした仮想ノードとして使用するモデルである。2CPUモデルは、4つのCPUのうち2つのCPUを1つのノードとみなした仮想ノードとして使用するモデルである。2CPUモデルとみなした場合は、2台の仮想ノードを設定することができる。また、1CPUモデルは4つのCPUを個々に独立したノードとみなして仮想ノードとして使用するモデルである。1CPUモデルでは1CPUのリソースを持つ4台の仮想ノードとみなすことができる。
図7は、各ノードモデルを構成するリソースの例を表として示したものである。図7の例では、ノードモデルの識別子を「ノードモデル番号」として示している。また、図7では、リソースの種類として「CPU数」、「メモリ」、「ディスク」および「ネットワーク」の項目を示し、項目ごとの特性が記録されている。図7の「CPU数」はCPUの数を示している。また、図7の「メモリ」はノード10が演算処理の際に用いる一次記憶装置の記憶容量を示している。図7の「ディスク」は、ノード10が処理した結果等を記憶する記憶装置の記憶容量を示している。図7の「ネットワーク」は、外部のネットワークへの接続の有無、すなわち、外部のネットワークからの情報取得等の可否を示している。
本実施形態では、各ノードモデルには1つ以上の物理ノード、すなわちノード10の情報が関連づけられている。本実施形態においてノードモデルは、ノード10が有するリソースを分割して仮想ノードとした場合の、リソースの組み合わせパターン全てについて設定されているので、必ず、対応する物理ノードが存在するからである。このような構成に代えて、ノード10の最大構成となるノードモデルにのみ関連づけておき、一部のリソースが使用された段階で残りのリソースに相当するノードモデルに関連づけられる構成とすることもできる。最大構成となるノードモデルにのみ関連づける場合は、関連づけられた物理ノードが無いノードモデルが存在する。
図8は実行パターンとノードモデルの関係を示したものである。図8に示すように、各実行パターンに対応するノードモデルがそれぞれ選択される。1つの実行パターンに対応するノードモデルの選び方には、複数通りの選び方が存在する。また、ノードモデルごとに、ノードモデルに相当する仮想ノードを有する物理ノードの情報がノードモデル情報56として情報保持部41に保存されている。また、図8ではCPUを2つ使用し、通信環境が必要なジョブが投入され、そのジョブが実行パターン3に相当する場合の例について示している。
組合せ情報は、実行モデルと対応するノードモデルを関連づけるための情報である。例えば、6つのCPUで実行されるジョブの実行モデルに対して、4つのCPUを含むノードモデルと、2つのCPUを含むノードモデルを組み合わせた情報が組み合わせ情報57として情報保持部41に保存されている。
ノードモデル選択部32は、ノードモデルの順位づけを行う機能を有する、ノードモデルの順位づけは、性能を維持しつつ効率的にジョブを実行できるノードモデルを選択するために行われる。ノードモデル選択部32は、内部に備える実行ノード決定ポリシー保存部34を参照して、ジョブを実行したときの実行性能を評価値として算出する。実行ノード決定ポリシー保存部34には、実行性能の評価値を算出する際の基準となる情報が保存されている。評価値を算出する際の基準の情報としては、例えば、ジョブの内容ごとに使用する装置とその装置の処理性能に応じた評価値の情報が保存されている。評価値を算出する際の基準は複数の基準が設定され、ジョブの種類等により使い分けられる方法としてもよい。ノードモデル選択部32は、算出した評価値を基に評価値が高いノードモデルが上位となるように、ノードモデルの順位づけを行う。
物理ノード選択部33は、ジョブの実行にノード10を割り当てるために、ノードモデルに対応した物理ノードを選択する機能を有する。物理ノード選択部33は、空き時間検索部35と、消費電力予測部36と、物理ノード決定部37を備えている。空き時間検索部35は、物理ノードとしてジョブに割り当てる対象となるノード10の空き時間を抽出する機能を有する。消費電力予測部36は、物理ノードとしてジョブに割り当てる対象となるノード10およびノード外設備の消費電力を抽出する機能を有する。ノード外設備は、ネットワーク装置や冷却装置など、情報処理システムを運用する際にノード10以外に必要となる設備のことをいう。物理ノード決定部37は、空き時間の情報および消費電力の情報を基に、ジョブに物理ノードとして割り当てるノード10を決定する。
情報管理部22は、情報保持部41と、ジョブ情報作成部42、実行パターン作成部43と、実行パターン決定部44と、ノードモデル作成部45と、ノードモデル更新部46と、組合せ作成部47を備えている。
情報保持部41は、ジョブ情報51と、ノード情報52と、ノード外設備情報53と、消費電力情報54と、実行パターン情報55と、ノードモデル情報56と、組合せ情報57を保存している。
ジョブ情報51は、ジョブの実行に必要なリソースや処理方法に関する情報である。ジョブ情報51は、ジョブ特性を基に生成される。ジョブ特性とは、投入されたジョブについて使用するCPUの数、メモリ量、通信方法および計算特性など、ジョブを実行する際の必要なリソースや処理方法のことをいう。すなわち、ジョブ特性は、ユーザの設定値やジョブを実行するプログラムの特性等により定まるジョブを実行する際の処理の特徴を表す情報である。計算特性は、ジョブを実行するノード10を分散した方が良いか、分散させた方が良いのかなど処理方法に関する情報である。
ノード情報52は、ノード10の構成や性能を示す情報である。ノード情報52は、各ノード10が備えるリソースの種類、リソースごとの性能、台数および通信環境の情報により構成されている。また、ノード情報52は、各ノード10のリソースごとにジョブの実行の予定の情報が記録されている。ノード外設備情報53は、ジョブの実行に必要なノード10以外のノード外設備に関する情報である。ノード外設備情報53は、ノード外設備の種類、台数およびジョブの実行での使用予定の情報により構成されている。
消費電力情報54は、各ノード10のリソースごとの消費電力およびノード外設備の消費電力の情報により構成されている。実行パターン情報55は、ジョブの類型ごとの実行パターンの情報により構成されている。
ジョブ情報作成部42は、投入されたジョブのジョブ特性を解析しジョブ情報を生成する機能を有する。ジョブ情報作成部42は、投入されたジョブのジョブ特性を解析して生成したジョブ情報を情報保持部41にジョブ情報51として保存する。
実行パターン作成部43は、実行パターンを生成する機能を有する。実行パターン作成部43は、情報処理システムが設置された際や構成の組み替えが行われた際に実行パターンを生成し、実行パターン情報55として情報保持部41に保存する。ジョブの処理方法は典型的なパターンに分けられる場合が多い。そのため、あらかじめ実行パターンを作成しておくことにより、ジョブ投入時のジョブへの物理ノードの割り当てに要する処理量を低減することができる。そのような構成に代えて、ジョブの投入時に実行パターンが作成される構成とすることもできる。また、ジョブに対応する実行パターンが存在しなかったときのみ、新たに実行パターンが作成される構成とすることもできる。
実行パターン決定部44は、投入されたジョブのジョブ特性に対応した実行パターンを決定する機能を有する。実行パターン決定部44は、ジョブ特性に適合した実行パターンを選択し、投入されたジョブの実行パターンとして決定する。
ノードモデル作成部45は、ノード情報52を基にノードモデルを作成する機能を有する。ノードモデル作成部45は、物理ノードであるノード10が備えるリソースを組み合わせて仮想ノードを構成した際の、リソースの組合せのパターンをノードモデルして生成する。生成されたノードモデルは、対応するノード10の情報と関連付けられてノードモデル情報56として情報保持部41に保存されている。ノードモデル情報56のノード10の情報としては、各ノードモデルに対して仮想ノードとして割り当て可能なノード10の情報が保存されている。
ノードモデル更新部46は、ノードモデル情報56を更新する機能を有する。ノードモデル更新部46は、ジョブへのノード10の割り当てが行われた際や、ジョブの実行が完了してノード10に仮想ノードとして使用可能な空きができたときにノードモデル情報56の更新を行う。
組合せ作成部47は、実行パターンに対応したノードモデルの組み合わせを生成する機能を有する。組合せ作成部47は、例えば、6つのCPUで実行されるジョブに対応する実行パターンに対して、4つのCPUを含むノードモデルと、2つのCPUを含むノードモデルを組み合わせる。
通信機能部23は、通信回線60を介して各ノード10と通信を行う機能を有する。通信機能部23は、各ノード10から通信回線60を介して送られてきたデータを、ジョブアサイン部21および情報管理部22に送る。また、通信機能部23は、ジョブアサイン部21および情報管理部22が各ノード10に送るデータを通信回線60に出力する。
本実施形態の情報処理システムにおいてジョブにノード10が割り当てられる際の動作について図9を参照して説明する。図9は、本実施形態の情報処理システムにおいてジョブにジョブの実行に必要なノードを割り当てる際のフローの概要を示したものである。ジョブの実行に必要な所定の情報とともにジョブが投入される。ジョブの実行に必要な所定の情報としては、例えば、ノード数、メモリ量、ネットワークトポロジおよび実行予定時間の指定の情報が用いられる。
ジョブが投入されると、ジョブ管理装置20のジョブ情報作成部42は、所定の情報およびジョブ特性を解析してジョブ情報を作成する(ステップ201)。ジョブ情報作成部42はジョブ情報を作成すると、情報保持部41にジョブ情報51として保存する。
ジョブ情報51が保存されると、実行パターン決定部42は、ジョブ情報を基にジョブに適応する実行パターンを決定する(ステップ202)。実行パターンが決定されると、ジョブアサイン部21の組合せモデル選択部31は、実行パターンに対応するノードモデルを、情報保持部41のノードモデル情報56から選択する。組合せモデル選択部31は、組合せ情報57を参照して実行パターンに対応するノードモデルの候補を選択する(ステップ203)。実行パターンに対応するノードモデルが複数ある場合は、組合せモデル選択部31は、複数のノードモデルを選択する。
候補となるノードモデルが選択されると、ノードモデル選択部32は、選択したノードモデルの順位づけを行い、順位リストを作成する(ステップ204)。ノードモデル選択部32は、実行ノード決定ポリシー保存部34を参照して、ジョブを実行したときの実行性能を評価値として算出する。実行ノード決定ポリシー保存部34には、各リソースの処理能力などの情報が保存されている。また、実行性能とは、例えば、処理時間の速さのことをいう。ノードモデル選択部32は、算出した評価値を基に評価値が高いノードモデルが上位となるように、ノードモデルの順位づけを行う。
ノードモデルの順位づけが行われると、物理ノード選択部33の空き時間検索部35は、最上位のノードモデルでジョブを実行した場合に、ジョブの実行に割り当てる物理ノードの空き時間を検索する。すなわち、空き時間検索部35は、検索の対象となるノードモデルに含まれる物理ノードのリソースに、投入されたジョブを実行するための空き時間があるかを検索する(ステップ205)。同じノード10の一部のリソースが既にジョブに割り当てられているノードモデルがある場合は、空き時間検索部35はノード情報52を参照してリソースの競合の有無を確認し、競合しない空き時間を抽出する。
ジョブを割り当てる物理ノードの候補が抽出されると、消費電力予測部36は、候補となる物理ノードにジョブを割り当てた場合の、システム全体の消費電力量を算出する。消費電力予測部36は、候補として割り当てられた各物理ノードの消費電力量と、ジョブの実行に必要な物理ノード以外の各設備の消費電力量の総和として、システム全体の消費電力量を算出する。消費電力予測部36は、ノード情報52、ノード外設備情報53および消費電力情報54を参照して消費電力量の算出を行う。
最上位のノードモデルの消費電力量が算出されると、物理ノード決定部35は、消費電力量を基に各物理ノードの評価点を算出する(ステップ206)。評価点は、消費電力量が小さいほど高くなるように設定され、物理ノード決定部35に保存されている。評価点を算出する際に、物理ノード決定部35は算出された消費電力量と、あらかじめ設定されている所定の閾値を比較する。所定の閾値は、システム全体で許容される消費電力量の値として設定されている。消費電力量が所定の閾値以上の物理ノードは候補から除外され、評価点は算出されない。設定されている空き時間に、消費電力量の総和が所定の閾値未満の物理ノードが無く、割り当て可能な物理ノードが無い場合は(ステップ207でNo)、次の順位のノードモデルに対してステップ205からの動作が行われる。
設定されている空き時間に、消費電力量が所定の閾値未満の物理ノードがある場合は(ステップ207でYes)、物理ノード決定部35は、評価点を基にジョブに物理ノードを割り当てる(ステップ208)。物理ノード決定部35は、設定されている空き時間において評価点が最も高い物理ノードをジョブに割り当てる。
ジョブに割り当てられる物理ノードが決定されると、ノードモデル更新部46は、ノードモデル情報56として保存されているノードモデルの情報から、ジョブに割り当てた物理ノードを削除する(ステップ209)。割り当てに用いた物理ノードに未使用のリソースがある場合は、ノードモデル更新部46は未使用のリソースがある物理ノードの未使用分のリソースを該当するノードモデル情報56に登録する(ステップ210)。ジョブへの物理ノードの割り当てが行われると、設定された時間にジョブが実行される。
本実施形態の情報処理システムは、ジョブ管理装置20が投入されたジョブを解析して対応する実行モデルを決定し、実行モデルに対応したノードモデルを選択している。また、ジョブ管理装置20は、ノードモデルに相当する仮想ノードとして物理ノードを割り当てた場合に、異なるジョブが同時に同一のリソースを利用する競合が起こらないようにしている。このようにジョブに物理ノードであるノード10を割り当てることにより、同一物理ノードを仮想ノードとして同時に複数のジョブに割り当てることも可能となり得る。そのため、ノード10のリソースを効率的に活用したジョブの割り当てを行うことができる。
また、ジョブ管理装置20は、ジョブに割り当てる候補の物理ノードのリソースを、ジョブの実行に使用した場合における消費電力量を評価している。ジョブ管理装置20は、評価結果を基にジョブに物理ノードの割り当てを行っている。このような方法でジョブへの物理ノードの割り当てを行うことにより、ジョブに割り当てる物理ノードの選択を最適化することができる。また、ジョブに割り当てる際に評価を行って割り当てているので、情報処理システムの構成が変化した場合や使用可能なノード10が変化した場合においても、最適な物理ノードを選択することが可能となる。以上より、本実施形態の情報処理システムでは、リソースを効率的に活用しつつ、消費電力を抑制するような、ジョブへのノードの最適な割り当てが可能となる。
本発明の第3の実施形態について図を参照して詳細に説明する。図10は本実施形態の情報処理システムの構成の概要を示したものである。第2の実施形態の情報処理システムでは、ジョブ管理装置が投入されたジョブにノードの割り当てを行った。本実施形態の情報処理システムでは、第2の実施形態と同様の投入されたジョブへのノードの割り当てに加え、ノードの稼働状態の制御を行う。
本実施形態の情報処理システムは、ノード70と、ジョブ管理装置80を備えている。ノード70は、情報処理システムの設計に応じて複数、備えられている。各ノード70およびジョブ管理装置80は通信回線61を介して接続され、互いにデータの送受信を行う。通信回線は専用回線としてもよく、他の情報処理システム等との共用回線を用いてもよい。また、各ノード70およびジョブ管理装置80は同一のデータセンタ等の施設に備えられていてもよく、複数の拠点に分散して備えられていてもよい。
図11は、本実施形態のノード70の構成の概要を示したものである。図11に示す通り、本実施形態のノード70は、情報処理部71と、リソース状態管理部72と、通信機能部73と、省電力モード制御部74を備えている。情報処理部71、リソース状態管理部72および通信機能部73の構成と機能は、第2の実施形態の同名称の部位と同様である。
省電力モード制御部74は、省電力休止制御部75と、ノード休止制御部76を備えている。省電力休止制御部75は、ノード70の待機状態への移行および待機状態から起動状態への移行を制御する機能を有する。省電力休止制御部75は、資源停止ルール管理部77を備えている。資源停止ルール管理部77には、待機状態に移行する際に動作を停止するリソースの情報が保存されている。待機状態は、ノード70の一部のリソースへの電源供給を停止または最小限化して電力消費量を抑制している状態である。
ノード休止制御部76は、ノード70の休止状態への移行および休止状態から起動状態への移行を制御する機能を有する。休止状態は、起動のために必要な回路等のみに電源が供給されほぼ全ての機能が停止されている状態である。休止状態は待機状態に比べて、起動している回路が少なく消費電力も小さい。また待機状態は休止状態に比べ消費電力は増加するが、起動状態へ移行を休止状態からに比べて短時間で行うことができる。
図12は、本実施形態のジョブ管理装置80の構成の概要を示したものである。図12に示す通り、本実施形態のジョブ管理装置80は、ジョブアサイン部81と、情報管理部82と、省電力制御部83と、通信機能部84を備えている。
ジョブアサイン部81は、組合せモデル選択部91と、ノードモデル選択部92と、物理ノード選択部93を備えている。ノードモデル選択部92は、実行ノード決定ポリシー管理部94を備えている。物理ノード選択部93は、空き時間検索部95と、消費電力予測部96と、物理ノード決定部97を備えている。ジョブアサイン部81の各部位の構成および機能は、それぞれ第2の実施形態の同名称の部位と同様である。
情報管理部82は、情報保持部101と、ジョブ情報作成部102、実行パターン作成部103と、実行パターン決定部104と、ノードモデル作成部105と、ノードモデル更新部106と、組合せ作成部107を備えている。
情報保持部101は、ジョブ情報111と、ノード情報112と、ノード外設備情報113と、消費電力情報114と、実行パターン情報115と、ノードモデル情報116と、組合せ情報117を保存している。情報管理部82の各部位の構成および機能は、それぞれ第2の実施形態の同名称の部位と同様である。また、情報保持部101に保存されている各情報の構成は、第2の実施形態の同名称の情報と同様である。通信機能部84の、構成および機能は、第2の実施形態の通信機能部と同様である。
省電力制御部83は、ジョブに割り当てられていないノード70の稼働状態を待機状態または休止状態として制御する機能を有する。また、省電力制御部83は、待機状態または休止状態のノード70を起動状態に移行するように制御する機能を有する。
本実施形態の情報処理システムにおいて、ジョブに対しジョブを実行する物理ノードとしてノード70を割り当てる際の動作は、第2の実施形態のステップ201からステップ210までの動作と同様である。
次に、本実施形態の情報処理システムにおいてジョブに割り当てられたノード70が稼動状態を移行する際の動作について図13を参照して説明する。図13は、ジョブ管理装置80が、ノード70の稼働状態の移行を制御する際の動作フローの概要を示したものである。
投入されたジョブへのノード70の割り当てが終わると、省電力制御部83は、ジョブ情報111を参照して実行予定のジョブが使用するノード70およびノード外設備の情報を抽出する。使用するノード70の情報を抽出すると、省電力制御部83は、ノード情報112およびノード外設備情報113から実行予定のジョブが使用するノード70およびノード外設備の稼働状態の情報を取得する(ステップ221)。
待機状態や休止状態となっていて、ジョブの実行のために稼動状態を変更する必要のあるノード70やノード外設備がある場合(ステップ222でYes)、省電力制御部83は、起動状態への移行が必要と判断する。起動状態への移行が必要と判断すると、省電力制御部83は、起動状態への移行を要求する信号を稼動状態変更信号として該当するノード70またはノード外設備に送信する(ステップ223)。
起動状態への移行を要求する稼動状態変更信号を受け取ると、ノード70は休止または待機状態の各リソースへの電源供給を開始して起動し起動状態に移行する(ステップ224)。起動状態への移行を完了すると、ノード70は起動が完了したことを示す信号を、移行完了信号としてジョブ管理装置80に送信する。また、起動状態への移行が完了すると、リソース状態管理部72は、保存しているリソースに関する情報について、起動状態に移行したリソースの情報を、起動状態であることを示す情報に更新する。起動が完了したことを示す移行完了信号を受け取ると(ステップ225)、ジョブ管理装置80の省電力制御部83は、ノード情報112に含まれている該当するノード70の情報を更新する(ステップ226)。
ジョブの実行に使用するノード70およびノード外設備が起動状態で、ジョブの実行のために稼動状態を変更する必要のない場合は(ステップ222でNo)、ジョブ管理装置80は稼動状態の移行に関する動作を終了する。
次に、ジョブに物理ノードとして割り当てられなかったノード70が、起動状態から待機状態または休止状態に稼動状態を移行する際の動作について図14および図15を参照して説明する。図14は、ジョブ管理装置80がノード70の稼働状態の移行を制御する際のフローの概要を示している。また、図15は、ノード70が稼動状態を移行する際のフローの概要を示している。
図14を参照して、起動状態から、待機状態または休止状態にノード70等の稼動状態を移行する際のジョブ管理装置80の動作について説明する。省電力制御部83は、ジョブ情報111を参照して実行予定のジョブが使用するノード70およびノード外設備の情報を抽出する。使用するノード70等の情報を抽出すると、省電力制御部83は、ノード情報112およびノード外設備情報113からジョブの実行に使用する予定の無いノード70およびノード外設備の稼働状態の情報を取得する(ステップ231)。
起動状態にあり、ジョブでの使用予定の無いノード70やノード外設備がある場合(ステップ232でYes)、省電力制御部83は該当するノード70やノード外設備の稼働状態の変更が必要であると判断する。稼動状態の変更の必要があると判断すると、省電力制御部83は移行先が待機状態であるか休止状態であるかを判断する。省電力制御部83は、該当するノード70のリソースを使用する予定の無いときは休止状態に移行すると判断する。また、省電力制御部83は、該当するノード70の一部のリソースに使用予定があるときは待機状態に移行すると判断する。移行先の稼働状態を判断すると、省電力制御部83は、対象となるノード70等に稼働状態の変更を要求する稼動状態変更信号を送る(ステップ233)。稼動状態変更信号には、待機状態への移行か休止状態への移行かについての情報が含まれている。
稼動状態変更信号を受け取ると、ノード70等は稼働状態の移行の動作を行う(ステップ234)。ステップ234におけるノード70等の稼働状態の移行の動作は、図15を参照して説明する。ノード70またはノード外設備は、待機状態または休止状態への移行を要求する稼動状態変更信号を受け取る(ステップ241)。受け取った稼動状態変更信号が待機状態への移行を要求する信号であるとき(ステップ242でNo)、省電力休止制御部75は所定のリソースを停止して待機状態に移行する(ステップ243)。待機状態に移行する所定のリソースは、資源停止ルール管理部77に保存されている基準に従って決定される。待機状態に移行すると、ノード70は稼働状態の移行が完了したことを示す移行完了信号をジョブ管理装置80に送信する(ステップ244)。また、待機状態への移行が完了すると、リソース状態管理部72は、保存している各リソースに関する情報について、待機状態に移行したリソースの情報を、待機状態であることを示す情報に更新する。
受け取った稼動状態変更信号が休止状態への移行を要求する信号であるとき(ステップ242でYes)、ノード休止制御部76はノード70の全てのリソースを停止して休止状態に移行させる(ステップ245)。ノード70が休止状態に移行するときはハイバネーションによるノード70の停止処理を行うこともできる。休止状態に移行する際に、ノード状態管理部72は、保存している各リソースに関する情報について、全てのリソースの情報を休止状態であることを示す情報に更新する。休止状態に移行する際に、ノード70は稼働状態の移行が完了したことを示す移行完了信号をジョブ管理装置80に送信する(ステップ244)。以上で、ステップ234におけるノード70側の稼働状態の移行に関する動作は終了する。
ノード70が稼動状態の移行を完了したことを示す移行完了信号を受信すると(ステップ235)、ジョブ管理装置80の省電力制御部83は、ノード情報112に含まれる該当するノード70の情報を更新する(ステップ236)。
ジョブの実行に使用しないノード70およびノード外設備が待機状態または休止状態で、稼動状態を変更する必要のない場合は(ステップ232でNo)、ジョブ管理装置80は稼動状態の移行に関する動作を終了する。以上で、ジョブ管理装置80がノード70の稼働状態の移行を制御する際の動作は終了する。
本実施形態の情報処理システムでは、ジョブの割り当てが行われた後に、ジョブの実行に使用する予定の無いノード70およびノード外設備の稼働状態を変更している。本実施形態の情報処理システムでは、使用予定の無いノード70等を、通常の起動状態よりも消費電力量の小さい待機状態や休止状態に移行させることにより消費電力を抑制している。その結果、本実施形態の情報処理システムは、消費電力量をより削減することができ、効率的な運用が可能となり得る。
第2の実施形態および第3の実施形態のジョブ管理装置の各機能は、サーバ等の情報処理装置で動作するコンピュータプログラムにより実行される構成とすることもできる。このような構成とする場合、ジョブ管理装置は1台の情報処理装置で構成されていてもよく、複数の情報処理装置が回線を介して接続されて構成されていてもよい。
第2の実施形態および第3の実施形態のジョブ管理装置は、投入されたジョブに対応する実行モデルを判断し、実行モデルに対応するノードモデルの選択を行っている。このような構成に代えて、投入されたジョブに対応するノードモデルを直接、選択する方法とすることもできる。ノードモデルを直接、選択する方法を用いる場合には、ジョブ管理装置は、ジョブに割り当てられていないリソースを基にノードモデルを構成するか、物理ノードをあらかじめ決めたリソースごとに分割してノードモデルを構成する。このような構成とした場合、物理ノードごとに所定の基準によりジョブへの割り当てられやすさまたは割り当てにくさが定義される。例えば、あるジョブの実行のためにある物理ノードを占有した方が処理性能を維持できるなど効率がよい場合は、該当する物理ノードは他のジョブへの割り当てにくいような評価点が設定される。他のジョブへ割り当てられにくい評価点を設定することにより、他のジョブへ他の物理ノードが割り当てられないときにのみジョブへの割り当てが行われるようにする。このような方法で、ジョブへの物理ノードの割り当てを管理することにより、ジョブ管理装置は、リソースを有効に活用しつつ個々のジョブの処理性能を維持するジョブの管理が可能となる。
本発明は、クラスタシステムを用いた情報処理システムに利用することができる。
1 ノードモデル生成手段
2 ジョブ解析手段
3 ノードモデル選択手段
4 ノード評価手段
5 ノード決定手段
10 ノード
11 情報処理部
12 リソース状態管理部
13 通信機能部
20 ジョブ管理装置
21 ジョブアサイン部
22 情報管理部
23 通信機能部
31 組合せモデル選択部
32 ノードモデル選択部
33 物理ノード選択部
34 実行ノード決定ポリシー管理部
35 空き時間検索部
36 消費電力予測部
37 物理ノード決定部
41 情報保持部
42 ジョブ情報作成部
43 実行パターン作成部
44 実行パターン決定部
45 ノードモデル作成部
46 ノードモデル更新部
47 組合せ作成部
51 ジョブ情報
52 ノード情報
53 ノード外設備情報
54 消費電力情報
55 実行パターン情報
56 ノードモデル情報
57 組合せ情報
60 通信回線
61 通信回線
70 ノード
71 情報処理部
72 リソース状態管理部
73 通信機能部
74 省電力モード制御部
75 省電力休止制御部
76 ノード休止制御部
77 資源停止ルール管理部
80 ジョブ管理装置
81 ジョブアサイン部
82 情報管理部
83 省電力制御部
84 通信機能部
91 組合せモデル選択部
92 ノードモデル選択部
93 物理ノード選択部
94 実行ノード決定ポリシー管理部
95 空き時間検索部
96 消費電力予測部
97 物理ノード決定部
101 情報保持部
102 ジョブ情報作成部
103 実行パターン作成部
104 実行パターン決定部
105 ノードモデル作成部
106 ノードモデル更新部
107 組合せ作成部
111 ジョブ情報
112 ノード情報
113 ノード外設備情報
114 消費電力情報
115 実行パターン情報
116 ノードモデル情報
117 組合せ情報
201−210 ジョブ管理装置の動作ステップ
221−226 ジョブ管理装置の動作ステップ
231−236 ノードの動作ステップ

Claims (10)

  1. ネットワークを介して複数台接続された物理ノードを構成するリソースのうち、仮想ノードとして動作する前記リソースの組み合わせをノードモデルとして複数パターン生成するノードモデル生成手段と、
    投入されたジョブの実行に必要なリソースを抽出するジョブ解析手段と、
    前記ジョブ解析手段が抽出した前記リソースに適応する前記ノードモデルを選択し、前記ジョブを実行する際の実行性能を基に前記ノードモデルの順位づけを行うノードモデル選択手段と、
    前記ノードモデルに対応した前記物理ノードの特性を所定の評価方法で評価するノード評価手段と、
    前記実行性能を基にした前記順位が上位の前記ノードモデルにおいて、前記順位が上位の前記ノードモデルに対応した前記物理ノードの中から、前記ノード評価手段による評価結果を基に、前記ジョブを実行する前記物理ノードを決定するノード決定手段と
    を備えることを特徴とするジョブ管理装置。
  2. 前記所定の評価方法は前記物理ノードごとに、前記ジョブの実行に割り当てた場合における消費電力を算出した結果に基づいて評価する方法であり、
    前記ノード決定手段は、前記ジョブを実行した際の消費電力を抑制するように、前記ジョブを実行する前記物理ノードを決定することを特徴とする請求項1に記載のジョブ管理装置。
  3. ジョブを類型ごとに分類し、各類型の前記ジョブの実行に必要なリソースを定義した実行パターンを生成する実行パターン生成手段をさらに備え、
    前記ノードモデル選択手段は、前記ジョブ解析手段による抽出結果に対応した前記実行パターンを決定し、前記実行パターンに応じた前記ノードモデルを選択することを特徴とする請求項1または2いずれかに記載のジョブ管理装置。
  4. 前記ノードモデルに対応した前記物理ノードのうち、前記ジョブに割り当てられなかった前記物理ノードを、消費電力を抑制する所定の稼動状態となるように制御するノード制御手段をさらに備えることを特徴とする請求項1から3いずれかに記載のジョブ管理装置。
  5. 請求項1から4いずれかに記載のジョブ管理装置と、
    複数のノード装置と、
    を備え、
    前記ジョブ管理装置の前記ノード評価手段は、前記ノードモデルに対応する前記ノード装置を前記物理ノードとして前記所定の評価方法で評価し、前記ノード決定手段は、前記ノード評価手段による評価結果を基に、前記ジョブを実行する前記ノード装置を決定することを特徴とする情報処理システム。
  6. ネットワークを介して複数台接続された物理ノードを構成するリソースのうち、仮想ノードとして動作する前記リソースの組み合わせをノードモデルとして複数パターン生成するノードモデル生成処理と、
    投入されたジョブの実行に必要なリソースを抽出するジョブ解析処理と、
    前記ジョブ解析処理において抽出した前記リソースに適応する前記ノードモデルを選択し、前記ジョブを実行する際の実行性能を基に前記ノードモデルの順位づけを行うノードモデル選択処理と、
    前記ノードモデルに対応した前記物理ノードの特性を所定の評価方法で評価するノード評価処理と、
    前記実行性能を基にした前記順位が上位の前記ノードモデルにおいて、前記順位が上位の前記ノードモデルに対応した前記物理ノードの中から、前記ノード評価処理による評価結果を基に、前記ジョブを実行する前記物理ノードを決定するノード決定処理と
    コンピュータに実行させることを特徴とするコンピュータプログラム。
  7. ネットワークを介して複数台接続された物理ノードを構成するリソースのうち、仮想ノードとして動作する前記リソースの組み合わせをノードモデルとして複数パターン生成し、
    投入されたジョブの実行に必要なリソースを抽出し、
    抽出した前記リソースに適応する前記ノードモデルを選択し、前記ジョブを実行する際の実行性能を基に前記ノードモデルの順位づけを行い、
    前記ノードモデルに対応した前記物理ノードの特性を所定の評価方法で評価し、
    前記実行性能を基にした前記順位が上位の前記ノードモデルにおいて、前記順位が上位の前記ノードモデルに対応した前記物理ノードの中から、前記所定の方法での評価結果を基に、前記ジョブを実行する前記物理ノードを決定することを特徴とするジョブ管理方法。
  8. 前記所定の評価方法は前記物理ノードごとに前記ジョブの実行に割り当てた場合における消費電力を算出した結果に基づいて評価する方法であり、
    前記ジョブを実行した際の消費電力を抑制するように、前記ジョブを実行する前記物理ノードを決定すること特徴とする請求項7に記載のジョブ管理方法。
  9. ジョブを類型ごとに分類し、各類型の前記ジョブの実行に必要なリソースを定義した実行パターンを生成し、
    抽出した前記リソースに対応した前記実行パターンを決定し、前記実行パターンに応じた前記ノードモデルを選択することを特徴とする請求項7または8いずれかに記載のジョブ管理方法。
  10. 前記ノードモデルに対応した前記物理ノードのうち、前記ジョブに割り当てられなかった前記物理ノードを、消費電力を抑制する所定の稼動状態となるように制御することを特徴とする請求項7から9いずれかに記載のジョブ管理方法。
JP2014037994A 2014-02-28 2014-02-28 ジョブ管理装置及びジョブ管理方法 Active JP6364815B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014037994A JP6364815B2 (ja) 2014-02-28 2014-02-28 ジョブ管理装置及びジョブ管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014037994A JP6364815B2 (ja) 2014-02-28 2014-02-28 ジョブ管理装置及びジョブ管理方法

Publications (2)

Publication Number Publication Date
JP2015162160A JP2015162160A (ja) 2015-09-07
JP6364815B2 true JP6364815B2 (ja) 2018-08-01

Family

ID=54185198

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014037994A Active JP6364815B2 (ja) 2014-02-28 2014-02-28 ジョブ管理装置及びジョブ管理方法

Country Status (1)

Country Link
JP (1) JP6364815B2 (ja)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009057208A1 (ja) * 2007-10-31 2009-05-07 Fujitsu Limited 資源割当プログラム、管理ノード、資源割当方法、および並列計算機システム
JP4724730B2 (ja) * 2008-04-09 2011-07-13 株式会社日立製作所 情報処理システムの運用管理方法、運用管理プログラム、および運用管理装置、ならびに情報処理システム

Also Published As

Publication number Publication date
JP2015162160A (ja) 2015-09-07

Similar Documents

Publication Publication Date Title
US9880887B2 (en) Method, computer program and device for allocating computer resources of a cluster for executing a task submitted to said cluster
Zhao et al. A new energy-aware task scheduling method for data-intensive applications in the cloud
Bicer et al. Time and cost sensitive data-intensive computing on hybrid clouds
JP6241300B2 (ja) ジョブスケジューリング装置、ジョブスケジューリング方法、およびジョブスケジューリングプログラム
US8694679B2 (en) Control device, method and program for deploying virtual machine
Wang et al. Fresh: Fair and efficient slot configuration and scheduling for hadoop clusters
US10445131B2 (en) Core prioritization for heterogeneous on-chip networks
US20160048413A1 (en) Parallel computer system, management apparatus, and control method for parallel computer system
Wang et al. Bubble budgeting: Throughput optimization for dynamic workloads by exploiting dark cores in many core systems
KR20130019698A (ko) 사용자 스케줄러와 마이그레이션(Migration)을 통한 자원 최적화 방법 및 시스템
Pandey et al. A heuristic method towards deadline-aware energy-efficient mapreduce scheduling problem in Hadoop YARN
JP2013210833A (ja) ジョブ管理装置、ジョブ管理方法、及びプログラム
CN111352735A (zh) 数据加速方法、装置、存储介质及设备
JP6620609B2 (ja) 分散処理実行管理プログラム、分散処理実行管理方法および分散処理実行管理装置
JP5810918B2 (ja) スケジューリング装置、スケジューリング方法及びプログラム
US9715268B2 (en) Reducing power by vacating subsets of CPUs and memory
Majumder et al. Energy-aware real-time tasks processing for fpga-based heterogeneous cloud
Sanjeevi et al. DTCF: deadline task consolidation first for energy minimisation in cloud data centres
JP5692355B2 (ja) コンピュータシステム、制御システム、制御方法および制御プログラム
JP6364815B2 (ja) ジョブ管理装置及びジョブ管理方法
Lin et al. Impact of MapReduce policies on job completion reliability and job energy consumption
JP2012038275A (ja) 取引計算シミュレーションシステム、方法及びプログラム
Li et al. Topology-aware scheduling on blue waters with proactive queue scanning and migration-based job placement
JPWO2014192254A1 (ja) 仮想マシン制御装置、仮想マシン制御方法とそのプログラムを記録したコンピュータ読み取り可能な記録媒体、および、データセンタ
JP2015090688A (ja) MapReduceジョブ管理システム、MapReduceジョブ管理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170116

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20171130

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171219

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180213

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180605

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180618

R150 Certificate of patent or registration of utility model

Ref document number: 6364815

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150