JP5577745B2 - クラスタシステム、プロセス配置方法、及びプログラム - Google Patents
クラスタシステム、プロセス配置方法、及びプログラム Download PDFInfo
- Publication number
- JP5577745B2 JP5577745B2 JP2010040632A JP2010040632A JP5577745B2 JP 5577745 B2 JP5577745 B2 JP 5577745B2 JP 2010040632 A JP2010040632 A JP 2010040632A JP 2010040632 A JP2010040632 A JP 2010040632A JP 5577745 B2 JP5577745 B2 JP 5577745B2
- Authority
- JP
- Japan
- Prior art keywords
- job
- processes
- calculation
- nodes
- node
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Multi Processors (AREA)
Description
従来は、単体性能が高い計算ノードを少数接続した計算クラスタが利用されてきた。この場合、接続形態は全てのノード間で直接通信できる単段クロスバー方式であり、これにより均一なインターコネクト通信性能が実現できていた。
図1は、本実施形態によるクラスタシステム10の構成を示す図である。図に示すように、クラスタシステム10は、フロントエンド100、バッチサーバ200、計算ノード300を備えている。各フロントエンド100、バッチサーバ200、及び各計算ノード300は、通信ネットワークを介して接続されている。また、計算ノード300間のインターコネクト通信性能は均一ではなく、隣接していない計算ノード300へは他の計算ノード300を経由して通信を行う必要がある。
図に示すように、フロントエンド100は、バッチ要求部101を備えている。バッチ要求部101は、バッチサーバ200にバッチ要求を送信する。バッチ要求には計算ジョブとジョブの通信特性が含まれる。バッチ要求部101は、コンピュータのプロセッサにおいて実行されることにより実現される機能ブロックである。
ジョブ管理部202は、バッチリクエスト記憶部205を参照し、計算ノード300の割り当てを決定する。
インターコネクト通信性能テーブル作成部203は、全ての計算ノード300のインターコネクト通信性能を取得し、インターコネクト通信性能テーブルを作成する。
バッチリクエスト記憶部205は、ジョブ受付部201で受信したバッチ要求を記憶する。
クラスタシステム10の動作は、実行順に、システムの運用開始時、バッチ処理要求時、ジョブ実行開始時の3つに分けることができる。
運用が開始されると、バッチサーバ200のインターコネクト通信性能テーブル作成部203が、接続されている全ての計算ノード300のインターコネクト通信性能を取得し、インターコネクト通信性能テーブルを作成する(ステップS101)。
まず、フロントエンド100のバッチ要求部101からバッチサーバ200へバッチ要求が送信される(ステップS201)。バッチ要求には、ジョブの実行要求とジョブの通信特性が含まれる。
ジョブの通信特性は、図7に示すように、ジョブのプロセス配置を格子状とみなし、格子の各次元の優先順位、次元軸に配置するプロセス数を設定する。図7中のプロセス番号は、ジョブに含まれる個々のプロセスを識別する番号である。次元の小さい順に0から番号が振られている。
バッチサーバ200は、バッチリクエスト記憶部205に格納されているジョブの実行時間になると、情報配布部204によって各計算ノード300へバッチ要求と割り当てノード一覧を送信する(ステップS301)。
ここでは、図6に示す通信特性を持つジョブに対して、図9に示すノードが割り当てられた場合を例に説明する。また、各ノード間のインターコネクト通信性能は図4に示すとおりとする。
これにより、計算ノードの接続形態にかかわらず、プロセスを計算ノードに最適に配置し、通信時間を最適化し、ジョブの実行性能を向上させることができる。
(付記1)複数の計算ノードと、
フロントエンド装置を介して要求されたバッチ処理を、前記複数の計算ノードに割り当てるバッチサーバを備えたクラスタシステムであって、
前記バッチサーバは、
各々の前記計算ノード間のインターコネクト通信性能情報を含むテーブルを作成する、インターコネクト通信性能テーブル作成部と、
運用開始時に、各々の前記計算ノードに、前記インターコネクト通信性能テーブルを送信すると共に、前記バッチ処理の要求時に、各々の前記計算ノードに前記バッチ処理に含まれるジョブと、前記ジョブの通信特性を送信する、情報配布部と、を備え、
前記計算ノードは、
前記ジョブの通信特性と、前記インターコネクト通信性能を突き合わせることにより、各計算ノードに配置するプロセスを決定するプロセス配置計算部、を備えた、クラスタシステム。
前記ジョブの通信特性には、前記ジョブに含まれるプロセスを各プロセス間の通信特性に基づいて格子状に配置した場合の、前記格子を構成する各次元の優先順位、及び各次元軸上に配置されるプロセス数の情報を含み、
前記プロセス配置計算部は、
前記優先順位と前記各次元軸上に配置されるプロセス数に基づいて、各プロセス間の通信特性と前記計算ノード間のインターコネクト通信性能が合致するように、各計算ノードに配置するプロセスを決定する、クラスタシステム。
各々の前記計算ノードに、前記インターコネクト通信性能テーブルを送信する工程と、
バッチ処理の要求を受け、各々の前記計算ノードに前記バッチ処理に含まれるジョブと、前記ジョブの通信特性を送信する工程と、
前記計算ノードが、前記ジョブの通信特性と、前記インターコネクト通信性能を突き合わせることにより、各計算ノードに配置するプロセスを決定する工程と、を備えた、プロセス配置方法。
複数の計算ノード間のインターコネクト通信性能情報を含むテーブルを作成する、インターコネクト通信性能テーブル作成部と、
運用開始時に、各々の前記計算ノードに、前記インターコネクト通信性能テーブルを送信すると共に、バッチ処理の要求時に、各々の前記計算ノードに前記バッチ処理に含まれるジョブと、前記ジョブの通信特性を送信する、情報配布部と、 して機能させるプログラム。
Claims (4)
- 複数の計算ノードと、
フロントエンド装置を介して要求されたバッチ処理を、前記複数の計算ノードに割り当てるバッチサーバを備えたクラスタシステムであって、
前記バッチサーバは、
各々の前記計算ノード間のインターコネクト通信性能情報を含むテーブルを作成する、インターコネクト通信性能テーブル作成部と、
運用開始時に、各々の前記計算ノードに、前記インターコネクト通信性能テーブルを送信すると共に、前記バッチ処理の要求時に、各々の前記計算ノードに前記バッチ処理に含まれるジョブと、前記ジョブの通信特性を送信する、情報配布部と、を備え、
前記計算ノードは、
前記ジョブの通信特性と、前記インターコネクト通信性能を突き合わせることにより、各計算ノードに配置するプロセスを決定するプロセス配置計算部、を備え、
前記ジョブの通信特性には、前記ジョブに含まれるプロセスを各プロセス間の通信特性に基づいて格子状に配置した場合の、前記格子を構成する各次元の優先順位、及び各次元軸上に配置されるプロセス数の情報を含み、
前記プロセス配置計算部は、
前記優先順位と前記各次元軸上に配置されるプロセス数に基づいて、各プロセス間の通信特性と前記計算ノード間のインターコネクト通信性能が合致するように、各計算ノードに配置するプロセスを決定する、クラスタシステム。 - 各々の計算ノード間のインターコネクト通信性能情報を含むテーブルを作成する工程と、
各々の前記計算ノードに、前記インターコネクト通信性能テーブルを送信する工程と、
バッチ処理の要求を受け、各々の前記計算ノードに前記バッチ処理に含まれるジョブと、前記ジョブの通信特性を送信する工程と、
前記計算ノードが、前記ジョブの通信特性と、前記インターコネクト通信性能を突き合わせることにより、各計算ノードに配置するプロセスを決定する工程と、を備え、
前記ジョブの通信特性には、前記ジョブに含まれるプロセスを各プロセス間の通信特性に基づいて格子状に配置した場合の、前記格子を構成する各次元の優先順位、及び各次元軸上に配置されるプロセス数の情報を含み、
前記各計算ノードに配置するプロセスを決定する工程では、
前記優先順位と前記各次元軸上に配置されるプロセス数に基づいて、各プロセス間の通信特性と前記計算ノード間のインターコネクト通信性能が合致するように、各計算ノードに配置するプロセスを決定する、プロセス配置方法。 - コンピュータを、
複数の計算ノード間のインターコネクト通信性能情報を含むテーブルを作成する、インターコネクト通信性能テーブル作成部と、
運用開始時に、各々の前記計算ノードに、前記インターコネクト通信性能テーブルを送信すると共に、バッチ処理の要求時に、各々の前記計算ノードに前記バッチ処理に含まれるジョブと、前記ジョブの通信特性を送信する、情報配布部と、して機能させ、
前記ジョブの通信特性には、前記ジョブに含まれるプロセスを各プロセス間の通信特性に基づいて格子状に配置した場合の、前記格子を構成する各次元の優先順位、及び各次元軸上に配置されるプロセス数の情報を含む、プログラム。 - コンピュータを、
バッチサーバによって複数の計算ノードに割り当てられたバッチ処理を実行する計算ノードとして機能させるプログラムであって、
前記プログラムは、前記コンピュータを、
前記バッチサーバから受信した前記バッチ処理に含まれるジョブの通信特性と、複数の計算ノード間のインターコネクト通信性能情報を突き合わせることにより、各計算ノードに配置するプロセスを決定するプロセス配置計算部として機能させ、
前記ジョブの通信特性には、前記ジョブに含まれるプロセスを各プロセス間の通信特性に基づいて格子状に配置した場合の、前記格子を構成する各次元の優先順位、及び各次元軸上に配置されるプロセス数の情報を含み、
前記プロセス配置計算部は、
前記優先順位と前記各次元軸上に配置されるプロセス数に基づいて、各プロセス間の通信特性と前記計算ノード間のインターコネクト通信性能が合致するように、各計算ノードに配置するプロセスを決定する、プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010040632A JP5577745B2 (ja) | 2010-02-25 | 2010-02-25 | クラスタシステム、プロセス配置方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010040632A JP5577745B2 (ja) | 2010-02-25 | 2010-02-25 | クラスタシステム、プロセス配置方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011175573A JP2011175573A (ja) | 2011-09-08 |
JP5577745B2 true JP5577745B2 (ja) | 2014-08-27 |
Family
ID=44688354
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010040632A Expired - Fee Related JP5577745B2 (ja) | 2010-02-25 | 2010-02-25 | クラスタシステム、プロセス配置方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5577745B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5853794B2 (ja) * | 2012-03-19 | 2016-02-09 | 富士通株式会社 | 転置装置、転置方法、および転置プログラム |
JP6447329B2 (ja) * | 2015-04-09 | 2019-01-09 | 富士通株式会社 | 並列計算制御装置、並列計算システムおよびマイグレーション時間推定プログラム |
JP6492977B2 (ja) | 2015-06-01 | 2019-04-03 | 富士通株式会社 | 並列演算装置、並列演算システム、ノード割当プログラム及びノード割当方法 |
JP6503945B2 (ja) | 2015-07-13 | 2019-04-24 | 富士通株式会社 | 情報処理装置、並列計算機システム、ファイルサーバ通信プログラム及びファイルサーバ通信方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8117288B2 (en) * | 2004-10-12 | 2012-02-14 | International Business Machines Corporation | Optimizing layout of an application on a massively parallel supercomputer |
-
2010
- 2010-02-25 JP JP2010040632A patent/JP5577745B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2011175573A (ja) | 2011-09-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109218355B (zh) | 负载均衡引擎,客户端,分布式计算***以及负载均衡方法 | |
US10733026B2 (en) | Automated workflow selection | |
US20190324819A1 (en) | Distributed-system task assignment method and apparatus | |
CN107111517B (zh) | 针对归约器任务的虚拟机优化分配和/或生成 | |
US9092266B2 (en) | Scalable scheduling for distributed data processing | |
JP5770721B2 (ja) | 情報処理システム | |
JP5429382B2 (ja) | ジョブ管理装置及びジョブ管理方法 | |
JP6364880B2 (ja) | 並列計算機システム,ジョブ管理装置の制御プログラム,及び並列計算機システムの制御方法 | |
WO2015001850A1 (ja) | タスク割り当て判定装置、制御方法、及びプログラム | |
CN107291536B (zh) | 一种云计算环境下应用任务流调度方法 | |
US9298500B2 (en) | Information processing system and control method of information processing system for managing jobs in a distributed multi-node environment | |
US20110314157A1 (en) | Information processing system, management apparatus, processing requesting apparatus, information processing method, and computer readable medium storing program | |
JP2014191594A (ja) | 分散処理システム | |
CN114500355B (zh) | 路由方法、片上网络、路由节点和路由装置 | |
JP5577745B2 (ja) | クラスタシステム、プロセス配置方法、及びプログラム | |
JP2016024612A (ja) | データ処理制御方法、データ処理制御プログラムおよびデータ処理制御装置 | |
US8316367B2 (en) | System and method for optimizing batch resource allocation | |
JP2007102332A (ja) | 負荷分散システム及び負荷分散方法 | |
JP5983623B2 (ja) | タスク配置装置及びタスク配置方法 | |
CN113127289B (zh) | 一种基于yarn集群的资源管理方法、计算机设备和存储介质 | |
JP2019046041A (ja) | 情報処理装置、情報処理システム、情報処理装置の制御方法及び情報処理装置の制御プログラム | |
JP6191361B2 (ja) | 情報処理システム、情報処理システムの制御方法及び制御プログラム | |
JP2012038275A (ja) | 取引計算シミュレーションシステム、方法及びプログラム | |
WO2020022018A1 (ja) | リソース割当装置、リソース管理システム、および、リソース割当プログラム | |
KR101393237B1 (ko) | 그리드 컴퓨팅에서 동적 유효자원 재배치 기반 작업 할당 장치 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130111 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140121 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140123 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140318 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140404 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140526 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140610 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140623 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5577745 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |