JP2002259353A - 広域クラスタ通信の設定方法、クラスタノードマネージャ装置、クラスタ装置および広域クラスタネットワーク - Google Patents

広域クラスタ通信の設定方法、クラスタノードマネージャ装置、クラスタ装置および広域クラスタネットワーク

Info

Publication number
JP2002259353A
JP2002259353A JP2001056937A JP2001056937A JP2002259353A JP 2002259353 A JP2002259353 A JP 2002259353A JP 2001056937 A JP2001056937 A JP 2001056937A JP 2001056937 A JP2001056937 A JP 2001056937A JP 2002259353 A JP2002259353 A JP 2002259353A
Authority
JP
Japan
Prior art keywords
cluster
job
network
parameter value
wide area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001056937A
Other languages
English (en)
Inventor
Motoki Saito
基樹 齊藤
Toru Okugawa
徹 奥川
Koji Sasayama
浩二 笹山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2001056937A priority Critical patent/JP2002259353A/ja
Publication of JP2002259353A publication Critical patent/JP2002259353A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Multi Processors (AREA)
  • Computer And Data Communications (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

(57)【要約】 【課題】 他のクラスタ装置にジョブを振り分ける際
に、ユーザにとって最適な構成となるように、ジョブを
振り分けるクラスタを動的に設定することが可能な広域
クラスタ通信の設定方法を提供する。 【解決手段】 アプリケーションジョブを複数のサーバ
で実行するクラスタ装置を複数個用いて構成されるクラ
スタネットワークにおける広域クラスタ通信の設定方法
であって、他のクラスタ装置にアプリケーションジョブ
を振り分ける際に、前記各クラスタ装置のリソース管理
情報、および、ネットワーク制御情報に基づき、アプリ
ケーションジョブを振り分けるクラスタ装置を動的に設
定する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、広域クラスタ通信
の設定方法、クラスタノードマネージャ装置、クラスタ
装置および広域クラスタネットワークに係わり、特に、
計算機間通信、パケット通信等における、広域エリアで
利用されるデータ転送に適用して有効な技術に関する。
【0002】
【従来の技術】従来のネットワークのトラフィックエン
ジニアリングは、ネットワークを構成しているルータお
よびスイッチの負荷状態やホップ数等に基づいて行われ
ている。一方、サーバの負荷分散については、それとは
独立に管理サーバが各サーバのリソースを観測して、負
荷分散を行うシステムが一般的である。
【0003】
【発明が解決しようとする課題】低価格のコンピュータ
をクラスタ状に接続して、スーパーコンピュータ級のパ
フォーマンスを得る分散ネットワークシステムの研究が
盛んになっている。今後、クラスタ装置が大規模化され
た場合、LAN(Local Area Network)環境のみなら
ず、MAN(Metropolitan Area Network)、WAN(W
ide Area Network)など広域エリアに分散したクラスタ
装置が必要になると予想される。なお、ここで言うクラ
スタ装置とは、複数のサーバが連携してアプリケーショ
ンを実行するようなシステムを指している。
【0004】しかしながら、従来の広域負荷分散方式で
は、ネットワークのトラフィックエンジニアリングと、
クラスタの負荷分散とが、それぞれ独立で機能している
ために、ネットワークのトラフィックエンジニアリン
グ、サーバの負荷分散それぞれが最適な状態であって
も、サービスを享受するユーザにとって最適であるとは
限らない。すなわち、ルータにかかるトラフィックは空
いているとしても、その下にあるサーバの負荷が高く、
結果としてユーザヘの応答に時間がかかってしまうよう
な状態が発生してしまう恐れがある。また、クラスタ通
信は信頼性が重要であるためLANエリアでは有効であ
るが、広域なネットワークを利用してしまうことによ
り、通信の信頼性に問題が生じたり、信頼性を得るため
にTCP(Transmission Control Protocol)処理のよ
うな複雑な処理を実装してしまうと、広域クラスタ構成
を利用するメリットが薄れてしまう。
【0005】本発明は、前記従来技術の問題点を解決す
るためになされたものであり、本発明の目的は、広域ク
ラスタ通信の設定方法において、他のクラスタ装置にジ
ョブを振り分ける際に、ユーザにとって最適な構成とな
るように、ジョブを振り分けるクラスタを動的に設定す
ることが可能となる技術を提供することにある。また、
本発明の他の目的は、前述の広域クラスタ通信の設定方
法を実行するためのクラスタノードマネージャ装置を提
供することにある。また、本発明の他の目的は、前述の
クラスタノードマネージャ装置を備えるクラスタ装置を
提供することにある。また、本発明の他の目的は、前述
のクラスタ装置を備える広域クラスタネットワークを提
供することにある。本発明の前記ならびにその他の目的
と新規な特徴は、本明細書の記述及び添付図面によって
明らかにする。
【0006】
【課題を解決するための手段】本発明の広域クラスタ通
信の設定方法では、MPLS(Multi-Protocol LabelSw
itching)に代表されるようなトラフィックエンジニア
リング技術に、SNMP(Simple Network Management
Protocol)のようなリソース管理プロトコルを融合して
クラスタ通信を行う。即ち、本発明では、リソース管理
プロトコルを用いて得られるサーバのリソース情報を、
ジョブの処理時間で正規化してパラメータ化し、さら
に、ネットワークのトポロジ情報とネットワークリソー
ス情報を収集して、ネットワークのリソース情報を、ネ
ットワークを伝搬する時間で正規化してパラメータ化を
行う。ネットワークのリソース情報と、クラスタシステ
ムのリソース情報という本来異なるリソース情報を、時
間によって正規化したパラメータを用いる事で共通のパ
ラメータとして扱うことが可能になり、ネットワークを
考慮してユーザにとって最適な構成にクラスタ通信を動
的に制御することができる。
【0007】本願において開示される発明のうち、代表
的なものの概要を簡単に説明すれば、下記の通りであ
る。即ち、本発明は、アプリケーションジョブを複数の
サーバで実行するクラスタ装置を複数個用いて構成され
るクラスタネットワークにおける広域クラスタ通信の設
定方法であって、他のクラスタ装置にアプリケーション
ジョブを振り分ける際に、前記各クラスタ装置のリソー
ス管理情報、および、ネットワーク制御情報に基づき、
アプリケーションジョブを振り分けるクラスタ装置を動
的に設定することを特徴とする。
【0008】本発明の好ましい実施の形態では、前記各
クラスタ装置の使用状況、および、ネットワークリソー
スの使用状況を時間で正規化してパラメータ化し、当該
パラメータ値に基づきアプリケーションジョブを振り分
けるクラスタ装置を動的に設定することを特徴とする。
本発明の好ましい実施の形態では、前記パラメータ値に
基づき、前記他のクラスタ装置にアプリケーションジョ
ブを振り分ける時点より以前に、前記パラメータ値とは
異なるパラメータ値に基づき他のクラスタ装置へのパス
を設定することを特徴とする。
【0009】また、本発明は、アプリケーションジョブ
を複数のサーバで実行するクラスタ装置における、アプ
リケーションジョブの振り分けを制御するクラスタノー
ドマネージャ装置であって、クラスタネットワークに接
続されている他のクラスタ装置のリソース管理情報、お
よびネットワーク制御情報を格納するシステムリソース
情報データベースと、前記他のクラスタ装置にアプリケ
ーションジョブを振り分ける際に、前記システムリソー
ス情報データベースに基づき、前記アプリケーションジ
ョブを振り分けるクラスタ装置を動的に設定し、クラス
タマスタサーバに指示する最適ジョブ振り分け計算手段
とを備えることを特徴とする。本発明の好ましい実施の
形態では、前記システムリソース情報データベースは、
前記各クラスタ装置の使用状況、および、ネットワーク
リソースの使用状況を時間で正規化してパラメータ化し
たパラメータ値を格納し、前記最適ジョブ振り分け計算
手段は、前記パラメータ値に基づき、前記アプリケーシ
ョンジョブを振り分けるクラスタ装置を動的に設定する
ことを特徴とする。
【0010】本発明の好ましい実施の形態では、前記最
適ジョブ振り分け計算手段は、前記アプリケーションジ
ョブを振り分けるクラスタ装置を、クラスタマスタサー
バに指示する前に、隣接するルータに対して、パス設定
を要求することを特徴とする。本発明の好ましい実施の
形態では、前記最適ジョブ振り分け計算手段からの指示
に基づき、前記アプリケーションジョブを振り分けるク
ラスタ装置との間のパスを直接設定するパス設定手段
を、さらに備えることを特徴とする。本発明の好ましい
実施の形態では、前記最適ジョブ振り分け計算手段は、
前記パラメータ値に基づき前記他のクラスタ装置にアプ
リケーションジョブを振り分ける時点より以前に、前記
パラメータ値とは異なるパラメータ値に基づき他のクラ
スタ装置との間のパス設定を前記パス設定手段に指示す
ることを特徴とする。
【0011】また、本発明は、クラスタ装置であって、
複数のクラスタサーバと、クラスタマスタサーバと、前
述のクラスタノードマネージャとを備えることを特徴と
する。また、本発明は、複数のクラスタ装置と、前記各
クラスタ装置との間の通信経路を設定する複数のルータ
とを用いて構成される広域クラスタネットワークであっ
て、前記複数のクラスタ装置の少なくとも1つは、前述
のクラスタ装置であることを特徴とする。
【0012】
【発明の実施の形態】以下、図面を参照して本発明の実
施の形態を詳細に説明する。なお、実施の形態を説明す
るための全図において、同一機能を有するものは同一符
号を付け、その繰り返しの説明は省略する。 [実施の形態1]図1は、本発明の実施の形態1の広域
クラスタ通信の設定方法が適用されるネットワーク構成
を示すブロック図である。図1に示すネットワークは、
LANクラスタ装置(以下、単に、クラスタと称す
る。)(3−1)の内部で処理が行われている、あるア
プリケーションジョブが、LANクラスタ(3−1)で
の処理負荷が上昇してきた場合、WANクラスタ1(7
−1)〜WANクラスタ3(7−3)へジョブを振り分
けるシステムのネットワーク構成図である。なお、前述
したように、本明細書で言うクラスタとは、複数のクラ
スタサーバ(以下、単に、サーバと称する。)(5−1
−1〜N,5−2−1〜N)が連携してアプリケーショ
ンを実行するようなシステムを指している。
【0013】図2は、図1に示すネットワークにおい
て、ル−タ処理能力およびサーバ処理能力を、時間によ
り正規化したパラメータ値を与えた場合のネットワーク
構成図である。図2において、P[n]が、パラメータ
値がnであることを表しており、このパラメータ値は、
前述したように、例えば、サーバであれば、そのリソー
ス情報をジョブの処理時間で正規化してパラメータ化し
た値、また、ネットワークのリソース情報であれば、ネ
ットワークを伝搬する時間で正規化してパラメータ化し
た値である。ここで、アプリケーションが起動されるク
ラスタをLANクラスタ(3−1)、他のクラスタをW
ANクラスタ1(7−1)〜WANクラスタ3(7−
3)と呼ぶ。
【0014】通常のトラフィックエンジニアリングは、
ルーティングプロトコルによる制御やルーク・スイッチ
の混雑度に基づいて行われている。一方、クラスタ等の
負荷分散については、SNMP(Simple Network Manag
ement Protocol)を利用して、サーバのCPU使用率メ
モリ使用率などのリソース情報のやりとりを行い、それ
に基づいて負荷分散を行うのが一般的である。以下、図
2を参照して、広域クラスタネットワークにおける、従
来の広域負荷分散方式を説明する。従来の広域負荷分散
方式においては、まず、どこのサーバを利用するかを決
め、目的とするサーバに到達する際のルータ間の負荷の
状態およびホップ数や論理的な距離を見て、経路ラベル
を付与する。
【0015】仮に、ネットワークの状態が図2に示す状
態であるとするとき、従来の広域負荷分散方式において
は、LANクラスタ(3−1)での処理負荷が上昇し、
WANクラスタ1(7−1)〜WANクラスタ3(7−
3)の中の1つにジョブを振り分ける際に、サーバのリ
ソースパラメータが最小のWANクラスタ3(7−3)
が選択される。ここで、最小ホップ数から経路を判定す
る場合、クラスタマスタサーバ(4−1)からWANク
ラスタ3(7−3)への経路として、クラスタマスタサ
ーバ(4−1)→エッジルータ1(1−1)→コアルー
タ3(2−3)→エッジルータ4(1−4)→WANク
ラスタ3(7−3)が選択される。この場合、相手先の
サーバ・クラスタに到達して処理を行い、結果を元のサ
ーバに返すまでに要する時間は、クラスタマスタサーバ
(4−1)からWANクラスタ3(7−3)までで[2
0{=(3)+(5)+(2)+(5)+(5)}]、
WANクラスタ3内で[18]、WANクラスタ3(7
−3)からクラスタマスタサーバ(4−1)までで[2
0{=(3)+(5)+(2)+(5)+(5)}]で
あるので、全体で[58]となる。
【0016】また、WANクラスタ3(7−3)までの
リソースパラメータが最小になるように経路を判定する
場合は、クラスタマスタサーバ(4−1)からWANク
ラスタ3(7−3)への経路として、クラスタマスタサ
ーバ(4−1)→エッジルータ1(1−1)→コアルー
タ1(2−1)→コアルータ2(2−2)→エッジルー
タ4(1−4)→WANクラスタ3(7−3)が選択さ
れる。この場合、相手先のサーバ・クラスタに到達して
処理を行い、結果を元のサーバに返すまでに要する時間
は、クラスタマスタサーバ(4−1)からWANクラス
タ3(7−3)までで[16{=(3)+(1)+
(2)+(1)+(2)+(2)+(5)}]、WAN
クラスタ3(7−3)内で[18]、WANクラスタ3
(7−3)からクラスタマスタサーバ(4−1)までで
[16{=(5)+(2)+(2)+(1)+(2)+
(1)+(3)}]であるので、全体で[50]とな
る。
【0017】次に、本発明の実施の形態の広域負荷分散
方式に説明する。本実施の形態では、クラスタのサーバ
リソースの状態と経路の負荷状況および経路の通信速度
から導かれるパラメータ値に基づいて最適な接続先クラ
スタを決定する。即ち、後述するクラスタパラメータ値
と経路パラメータ値との合計値であるシステムパラメー
タ値が最小となるWANクラスタが選択される。本実施
の形態では、LANクラスタ(3−1)での処理負荷が
上昇し、WANクラスタ1(7−1)〜WANクラスタ
3(7−3)の中の1つにジョブを振り分ける際に、W
ANクラスタ1(7−1)が選択される。また、クラス
タマスタサーバ(4−1)からWANクラスタ1(7−
1)への経路として、クラスタマスタサーバ(4−1)
→エッジルータ1(1−1)→コアルータ1(2−1)
→エッジルータ2(1−2)→WANクラスタ1(7−
1)が選択される。この場合、相手先のサーバ・クラス
タに到達して処理を行い、結果を元のサーバに返すまで
に要する時間は、クラスタマスタサーバ(6−1)から
WANクラスタ1(7−1)までで[14{=(3)+
(1)+(2)+(5)+(3)}]、WANクラスタ
1(7−1)内で[20]、WANクラスタ1(7−
1)からクラスタマスタサーバ(4−1)までで[14
{=(3)+(5)+(2)+(1)+(3)}]であ
るので、全体で[48]となり、従来の広域負荷分散方
式よりも、高速に処理を行うことが可能であることがわ
かる。
【0018】[実施の形態2]図3は、本発明の実施の
形態2のLANクラスタ装置が採用されるネットワーク
構成を示すブロック図である。図3に示すネットワーク
は、エッジルータとクラスタネットワークとの間に、ク
ラスタネットワークの各サーバの負荷情報を観測し、ま
た広域網からネットワーク管理情報を収集して、その両
者に基づいて、最適なアプリケーションジョブの振り分
けを行うクラスタノードマネージャ装置(9−1,9−
n)が配置される点で、図1、図2に示すネットワーク
装置と相違している。図4は、本実施の形態のクラスタ
ノードマネージャ装置(9−1)の概略構成を示すブロ
ック図である。なお、他のクラスタノードマネージャ装
置(9−n)の構成も図4と同じである。図4に示すよ
うに、クラスタノードマネージャ装置(9−1)は、ク
ラスタ制御用のリソース管理マネージャ(以下、クラス
タリソース管理マネージャと称する。)(10−1)、
ネットワーク制御用のリソース管理マネージャ(以下、
ネットワークリソース管理マネージャと称する。)(1
4−1)、クラスタのトポロジデータベース(16−
1)、システムリソースデータベース(17−1)、最
適なアプリケーションジョブを計算するための手段(以
下、最適ジョブ振り分け計算手段)(18−1)とで構
成される。
【0019】クラスタリソース管理マネージャ(10−
1)は、クラスタノードマネージャ装置(9−1)に直
接接続されているクラスタのLANクラスタリソース情
報データベース(11−1)、遠隔地にありLANクラ
スタ内のノードと相互に通信を行って広域クラスタを形
成するWANクラスタのWANクラスタ情報データベー
ス(12−1)を有し、その両者からクラスタリソース
情報データベース(13−1)を作成する。LANクラ
スタリソース情報データベース(11−1)は、SNM
P等リソース管理プロトコルによって収集されるLAN
クラスタのリソース情報により作成されるデータベース
であり、その内容を図5に示す。WANクラスタリソー
ス情報データベース(12−1)は、SNMP等リソー
ス管理プロトコルによって収集されるWANクラスタの
リソース情報により作成されるデータベースであり、そ
の内容を図6に示す。これのらのデータベースに基づ
き、クラスタリソース情報データベース(13−1)が
作成される。
【0020】ネットワークリソース管理マネージャ(1
4−1)は、ネットワーク情報データベース(15−
1)を備える。ネットワーク情報データベース(15−
1)、OSPF(Open Shortest PathFirst)などによ
って得られるネットワークトポロジ情報と、SNMPな
どのリソース管理プロトコルによって得られるネットワ
ークの帯域幅や予約時間などのリソース情報を収集する
事により作成されるデータベースであり、その内容を図
7に示す。システムリソースデータベース(17−1)
は、クラスタリソース情報データベース(13−1)と
ネットワーク情報データベース(15−1)とから作成
されるデータベースであり、その内容を図8に示す。こ
の図8に示す各値は、図2に示すネットワーク構成にお
ける、クラスタマスタサーバ(4−1)2から、各WA
Nクラスタ1(7−1)〜WANクラスタ3(7−3)
への経路情報と、システムパラメータとを示している。
【0021】この図8において、WANクラスタ1(7
−1)〜WANクラスタ3(7−3)のクラスタパラメ
ータ値は、図6に示すWANクラスタ1(7−1)〜W
ANクラスタ3(7−3)のクラスタパラメータ値が入
力される。また、経路パラメータ値は、図7に示す各ル
ートごとのネットワークパラメータが入力される。シス
テムパラメータ値は、クラスタパラメータ値と経路パラ
メータ値とを加算した値であり、図8に示す場合では、
システムパラメータ値が最小となるのは、WANクラス
タがWANクラスタ1(7−1)で、経路がルート1の
ときに最小(48)となるので、前述したように、LA
Nクラスタ(3−1)での処理負荷が上昇し、WANク
ラスタ1(7−1)〜WANクラスタ3(7−3)の中
の1つにジョブを振り分ける際に、WANクラスタ1
(7−1)と、クラスタマスタサーバ(4−1)→エッ
ジルータ1(1−1)→コアルータ1(2−1)→エッ
ジルータ2(1−2)→WANクラスタ1(7−1)の
経路が選択される。
【0022】図9は、図8に示すクラスタノードマネー
ジャ装置(9−1)の処理手順を説明するためのフロー
チャートである。クラスタリソース管理マネージャ(1
0−1)は、クラスタノードマネージャ装置(9−1)
に直接接続されているクラスタのリソース情報を、SN
MPなどのリソース管理プロトコルを用い、かつ設定し
たポーリング周期で収集し(ステップ101)、クラス
タLANクラスタリソース情報データベース(11−
1)を作成または更新する(ステップ102)。クラス
タリソース管理マネージャ(10−1)は、遠隔地にあ
りLANクラスタ内のノードと相互に通信を行って広域
クラスタを形成するWANクラスタのリソース情報を、
SNMPなどのリソース管理プロトコルを用い、かつ設
定したポーリング周期で収集し(ステップ103)、W
ANクラスタ情報データベース(12−1)を作成また
は更新する(ステップ104)。このとき、LANクラ
スタのリソース情報を収集するためのポーリング周期と
WANクラスタのリソース情報を収集するためのポーリ
ング周期は異なっても良い。
【0023】クラスタリソース管理マネージャ(10−
1)は、LANクラスタリソース情報データベース(1
1−1)、あるいはWANクラスタリソース情報データ
ベース(12−1)のどちらかのデータベースが更新さ
れた時に、クラスタリソース情報データベース(13−
1)を更新する(ステップ105)。ネットワークリソ
ース管理マネージャ(14−1)は、クラスタトポロジ
データベース(16−1)に基づいて、広域クラスタを
形成する遠隔クラスタが接続されているルータまでのネ
ットワークリソース情報を、OSPFのようなネットワ
ークトポロジを通知するプロトコル、あるいは、SNM
Pのようなリソース管理プロトコルを用い、かつ設定し
たポーリング周期で収集し(ステップ111)、ネット
ワーク情報データベース(15−1)を作成または更新
する(ステップ112)。このとき、トポロジ情報、お
よびリソース情報を収集するポーリング周期は、LAN
クラスタリソース情報を収集するポーリング周期および
WANクラスタリソース情報を収集するポーリング周期
と異なっても良い。
【0024】クラスタノードマネージャ装置(9−1)
は、クラスタリソース情報データベース(13−1)と
ネットワーク情報データベース(15−1)から、クラ
スタシステムとしてのシステムリソース情報データベー
ス(17−1)を作成するとともに、クラスタリソース
情報データベース(13−1)、あるいは、ネットワー
ク情報データベース(15−1)のどちらかの更新があ
った場合に、システムリソース情報データベース(17
−1)の更新を行う(ステップ106)。システムリソ
ース情報データベース(17−1)の更新があった場合
に、最適ジョブ振り分け計算手段(18−1)は、シス
テムリソース情報データベース(17−1)を参照し
て、最適経路を選択するアルゴリズムに基づいて、最適
なLANおよびWANクラスタを選択して、アプリケー
ションジョブの最適振り分けを行うようにクラスタマス
タサーバ(4−1,4−2)に制御指示を出す(ステッ
プ107)。クラスタノードマネージャ装置(9−1)
が、図4に示す構成である場合、WANクラスタ1(7
−1)〜WANクラスタ3(7−3)への送信が選択さ
れた場合は、隣接ルータにパスの設定要求を通知する。
【0025】以下、最適ジョブ振り分け計算手段(18
−1)における最適振り分けアルゴリズムの処理手順を
図10に示すフローチャートを用いて説明する。最適ジ
ョブ振り分け計算手段(18−1)は、システムリソー
ス情報データベース(18−1)の更新が行われた場
合、システムリソース情報データベース(17−1)を
参照し(ステップ121)、LANクラスタのクラスタ
パラメ−タ値よりも小さいクラスタパラメータ値を有す
るWANクラスタが少なくとも1つ存在するか否かを判
断する(ステップ122)。ステップ122でYesの
場合は、システムリソース情報データベース(17−
1)を参照しシステムパラメータ値が最も小さい経路を
選択し、該当するWANクラスタヘのパスを確保し(ス
テップ124)、該当するWANクラスタにジョブを振
り分けるように、クラスタマスタサーバ(4−1,4−
2)に制御指示を送る(ステップ125)。なお、該当
するWANクラスタが2つ以上ある場合には、クラスタ
パラメ−タ値が最も小さいWANクラスタを選択しても
よいし、あるいは、任意の1つのWANクラスタを選択
してもよい。ステップ122でNoの場合は、LANク
ラスタリソース情報データベース(11−1)を参照し
て、LANクラスタ内でCPUリソースに応じた負荷分
散制御を行う様に、クラスタマスタサーバ(4−1,4
−2)に制御指示を送る。
【0026】図11は、図10に示す最適振り分けアル
ゴリズムを用いた場合の、システムのタイムチャートを
示す図である。図11において、クラスタノードマネー
ジャ装置(例えば、図3の9−1)と各構成要素を結ぶ
細線は、各構成要素のリソースを管理するための通信を
表しており、クラスタマスタサーバ(例えば、図3の4
−1)と、LANクラスタ(図3の3−1)内のサーバ
装置(例えば、図3の5−1−1〜5−1−N)および
WANクラスタ(例えば、図3の7−1〜7−3)を結
ぶ太線は実際のクラスタ通信を表している。また、クラ
スタノードマネージャ装置とクラスタマスタサーバとを
結ぶ太破線は振り分け制御指示のための通信を表してお
り、最適ジョブ振り分け装置とエッジルータを結ぶ中太
線は経路を確保するためのパス設定要求を表している。
【0027】[実施の形態3]図12は、本実施の形態
のクラスタノードマネージャ装置(9−1)の概略構成
を示すブロック図である。本発明の実施の形態2のクラ
スタノードマネージャ装置(9−1)は、装置内にパス
設定用モジュール(19−1)を備えるとともに、最適
ジョブ振り分け計算手段(18−1)の機能が、前述の
実施の形態のクラスタノードマネージャ装置(9−1)
と相違する。本実施の形態では、クラスタノードマネー
ジャ装置自体にパス設定機能があるため、WANクラス
タのクラスタノードマネージャ装置との間のパス設定お
よび管理を行う。以下、本実施の形態2のクラスタノー
ドマネージャ装置(9−1)について、前述の実施の形
態のクラスタノードマネージャ装置(9−1)との相違
点を中心に説明する。
【0028】図13は、本実施の形態における、最適ジ
ョブ振り分け計算手段(18−1)の最適振り分けアル
ゴリズムを示すフローチャートである。本実施の形態2
において、最適ジョブ振り分け計算手段(18−1)
は、システムリソース情報データベース(17−1)の
更新が行われた場合、システムリソース情報データベー
ス(17−1)を参照し(ステップ131)、LANク
ラスタのクラスタパラメ−タ値が閾値A以上であるか否
かを判断する(ステップ132)。ステップ132でN
oの場合には、クラスタパラメータが閾値A以下のWA
Nクラスタに対してパスが張られている否かを判断する
(ステップ133)。ステップ133でNoの場合、お
よび、ステップ133でYesの場合はパスを解放した
後(ステップ134)、LANクラスタリソース情報デ
ータベース(11−1)を参照し(ステップ135)、
LANクラスタ内でCPUリソースに応じた負荷分散制
御を行う様に、クラスタマスタサーバ(4−1,4−
2)に制御指示を送る(ステップ136)。
【0029】ステップ132でYesの場合には、パラ
メータ値が閾値A以下のクラスタパラメータ値を有する
WANクラスタが少なくとも1つ存在するか否かを判断
する(ステップ137)。ステップ137でNoの場合
には、前述のステップ135、136を実行する。ステ
ップ137でYesの場合には、該当するWANクラス
タへのパスが張られているかどうかの確認を行い(ステ
ップ138)、ステップ138でYesの場合、およ
び、ステップ138でNoの場合はパスの確保を行って
(ステップ139)、LANクラスタのクラスタパラメ
ータ値が閥値Bを越えているか否かを判断する(ステッ
プ140)。ステップ140でYesの場合は、該当す
るWANクラスタにジョブ割当てを行う様にクラスタマ
スタサーバ(4−1,4−2)に対して制御指示を送
る。ステップ140でNoの場合には、前述のステップ
135、136を実行する。なお、閾値Aは、やや負荷
が大きくなってきた状態、また、閾値Bは、さらに負荷
が高い状態に値に設定する。
【0030】図14は、図13に示す最適振り分けアル
ゴリズムをアルゴリズムを用いた場合の、システムのタ
イムチャートを示す図である。図14において、クラス
タノードマネージャ装置(例えば、図3の9−1)と各
構成要素とを結ぶ細線は、各構成要素のリソースを管理
するための通信を表しており、クラスタマスタサーバ
(例えば、図3の4−1)と、LANクラスタ(図3の
3−1)内のサーバ装置(例えば、図3の5−1−1〜
5−1−N)およびWANクラスタ(例えば、図3の7
−1〜7−3)を結ぶ太線は実際のクラスタ通信を表し
ている。また、クラスタノードマネージャ装置とクラス
タマスタサーバを結ぶ太破線は振り分け制御指示のため
の通信を表しており、クラスタノードマネージャ装置と
エッジルータを結ぶ中太線は経路を確保するためのパス
設定要求を表している。
【0031】このように、本実施の形態では、LANク
ラスタ(例えば、図3の3−1)のリソースに余裕があ
るにも係らず、クラスタパラメータ値が低いからといっ
て、WANクラスタ(例えば、図3の7−1〜7−3)
にジョブを振り分けることを避けることができるため、
ネットワークリソースの無駄な確保を避けることが可能
となる。以上、本発明者によってなされた発明を、前記
実施の形態に基づき具体的に説明したが、本発明は、前
記実施の形態に限定されるものではなく、その要旨を逸
脱しない範囲において種々変更可能であることは勿論で
ある。
【0032】
【発明の効果】本願において開示される発明のうち代表
的なものによって得られる効果を簡単に説明すれば、下
記の通りである。 (1)本発明によれば、アプリケーションを享受するユ
ーザにとって最適なクラスタ構成を動的に作成すること
が可能となる。 (2)本発明によれば、制御処理に特化した装置を配置
することにより、従来のネットワーク装置を変更するこ
となく広域クラスタ通信を行うことが可能となる。 (3)本発明によれば、広域で信頼性の高い、高速クラ
スタ通信が可能となる。
【図面の簡単な説明】
【図1】本発明の実施の形態1の広域クラスタ通信の設
定方法が適用されるネットワーク構成を示すブロック図
である。
【図2】図1に示すネットワークにおいて、ル−タ処理
能力およびサーバ処理能力を、時間により正規化したパ
ラメータ値を与えた場合のネットワーク構成図である。
【図3】本発明の実施の形態2のLANクラスタ装置が
採用されるネットワーク構成を示すブロック図である。
【図4】本発明の実施の形態2のクラスタノードマネー
ジャ装置の概略構成を示すブロック図である。
【図5】図4に示すLANクラスタリソース情報データ
ベースの内容を示す図である。
【図6】図4に示すWANクラスタリソース情報データ
ベースの内容を示す図である。
【図7】図4に示すネットワーク情報データベースの内
容を示す図である。
【図8】図4に示すシステムリソースデータベースの内
容を示す図である。
【図9】本発明の実施の形態2のクラスタノードマネー
ジャ装置の処理手順を説明するためのフローチャートで
ある。
【図10】図4に示す最適ジョブ振り分け計算手段にお
ける最適振り分けアルゴリズムを示すフローチャートで
ある。
【図11】図10に示す最適振り分けアルゴリズムを用
いた場合の、システムのタイムチャートを示す図であ
る。
【図12】本発明の実施の形態3のクラスタノードマネ
ージャ装置の概略構成を示すブロック図である。
【図13】図12に示す最適ジョブ振り分け計算手段に
おける最適振り分けアルゴリズムを示すフローチャート
である。
【図14】図13に示す最適振り分けアルゴリズムを用
いた場合の、システムのタイムチャートを示す図であ
る。
【符号の説明】
1−1〜4…エッジルータ、2−1〜3…コアルータ、
3−1…LANクラスタ、4−1,4−2…クラスタマ
スタサーバ、5−1−1〜N,5−2−1〜N…クラス
タサーバ、6−1〜N…クラスタスイッチ、7−1〜3
…WANクラスタ、8−1…ユーザシステム、9−1〜
N…クラスタノードマネージャ装置、10−1…クラス
タリソース管理マネージャ、11−1…LANクラスタ
リソース情報データベース、12−1…WANクラスタ
リソース情報データベース、13−1…クラスタリソー
ス情報データベース、14−1…ネットワークリソース
管理マネージャ、15−1…ネットワーク情報データベ
ース、16−1…クラスタトポロジデータベース、17
−1…システムリソース情報データベース、18−1…
最適ジョブ振り分け計算手段、19−1…パス設定用モ
ジュール。
フロントページの続き (72)発明者 笹山 浩二 東京都千代田区大手町二丁目3番1号 日 本電信電話株式会社内 Fターム(参考) 5B045 GG02 5B089 GA11 GA31 HA06 HB06 JA11 JB15 KA06 KB03 KB10 KC60 KG05 5K030 GA01 GA11 GA16 HA08 HC01 HD03 HD06 KA01 KA05 KA07 KA13 LE01

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 アプリケーションジョブを複数のサーバ
    で実行するクラスタ装置を複数個用いて構成されるクラ
    スタネットワークにおける広域クラスタ通信の設定方法
    であって、 他のクラスタ装置にアプリケーションジョブを振り分け
    る際に、前記各クラスタ装置のリソース管理情報、およ
    び、ネットワーク制御情報に基づき、アプリケーション
    ジョブを振り分けるクラスタ装置を動的に設定すること
    を特徴とする広域クラスタ通信の設定方法。
  2. 【請求項2】 前記各クラスタ装置の使用状況、およ
    び、ネットワークリソースの使用状況を時間で正規化し
    てパラメータ化し、当該パラメータ値に基づきアプリケ
    ーションジョブを振り分けるクラスタ装置を動的に設定
    することを特徴とする請求項1に記載の広域クラスタ通
    信の設定方法。
  3. 【請求項3】 前記パラメータ値に基づき、前記他のク
    ラスタ装置にアプリケーションジョブを振り分ける時点
    より以前に、前記パラメータ値とは異なるパラメータ値
    に基づき他のクラスタ装置へのパスを設定することを特
    徴とする請求項2に記載の広域クラスタ通信の設定方
    法。
  4. 【請求項4】 アプリケーションジョブを複数のサーバ
    で実行するクラスタ装置における、アプリケーションジ
    ョブの振り分けを制御するクラスタノードマネージャ装
    置であって、 クラスタネットワークに接続されている他のクラスタ装
    置のリソース管理情報、およびネットワーク制御情報を
    格納するシステムリソース情報データベースと、 前記他のクラスタ装置にアプリケーションジョブを振り
    分ける際に、前記システムリソース情報データベースに
    基づき、前記アプリケーションジョブを振り分けるクラ
    スタ装置を動的に設定し、クラスタマスタサーバに指示
    する最適ジョブ振り分け計算手段とを備えることを特徴
    とするクラスタノードマネージャ装置。
  5. 【請求項5】 前記システムリソース情報データベース
    は、前記各クラスタ装置の使用状況、および、ネットワ
    ークリソースの使用状況を時間で正規化してパラメータ
    化したパラメータ値を格納し、 前記最適ジョブ振り分け計算手段は、前記パラメータ値
    に基づき、前記アプリケーションジョブを振り分けるク
    ラスタ装置を動的に設定することを特徴とする請求項4
    に記載のクラスタノードマネージャ装置。
  6. 【請求項6】 前記最適ジョブ振り分け計算手段は、前
    記アプリケーションジョブを振り分けるクラスタ装置
    を、クラスタマスタサーバに指示する前に、隣接するル
    ータに対して、パス設定を要求することを特徴とする請
    求項4または請求項5に記載のクラスタノードマネージ
    ャ装置。
  7. 【請求項7】 前記最適ジョブ振り分け計算手段からの
    指示に基づき、前記アプリケーションジョブを振り分け
    るクラスタ装置との間のパスを直接設定するパス設定手
    段を、さらに備えることを特徴とする請求項4ないし請
    求項6のいずれか1項に記載のクラスタノードマネージ
    ャ装置。
  8. 【請求項8】 前記最適ジョブ振り分け計算手段は、前
    記パラメータ値に基づき前記他のクラスタ装置にアプリ
    ケーションジョブを振り分ける時点より以前に、前記パ
    ラメータ値とは異なるパラメータ値に基づき他のクラス
    タ装置との間のパス設定を前記パス設定手段に指示する
    ことを特徴とする請求項7に記載のクラスタノードマネ
    ージャ装置。
  9. 【請求項9】 複数のクラスタサーバと、 クラスタマスタサーバと、 請求項4ないし請求項8のいずれか1項のクラスタノー
    ドマネージャとを備えることを特徴とするクラスタ装
    置。
  10. 【請求項10】 複数のクラスタ装置と、前記各クラス
    タ装置との間の通信経路を設定する複数のルータとを用
    いて構成される広域クラスタネットワークであって、 前記複数のクラスタ装置の少なくとも1つは、請求項9
    に記載のクラスタ装置であることを特徴とする広域クラ
    スタネットワーク。
JP2001056937A 2001-03-01 2001-03-01 広域クラスタ通信の設定方法、クラスタノードマネージャ装置、クラスタ装置および広域クラスタネットワーク Pending JP2002259353A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001056937A JP2002259353A (ja) 2001-03-01 2001-03-01 広域クラスタ通信の設定方法、クラスタノードマネージャ装置、クラスタ装置および広域クラスタネットワーク

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001056937A JP2002259353A (ja) 2001-03-01 2001-03-01 広域クラスタ通信の設定方法、クラスタノードマネージャ装置、クラスタ装置および広域クラスタネットワーク

Publications (1)

Publication Number Publication Date
JP2002259353A true JP2002259353A (ja) 2002-09-13

Family

ID=18916885

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001056937A Pending JP2002259353A (ja) 2001-03-01 2001-03-01 広域クラスタ通信の設定方法、クラスタノードマネージャ装置、クラスタ装置および広域クラスタネットワーク

Country Status (1)

Country Link
JP (1) JP2002259353A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100654391B1 (ko) 2005-04-22 2006-12-06 이광훈 클러스터 시스템 제어 방법 및 상기 제어 방법을 수행하는컴퓨터 판독 가능한 기록 매체를 포함하는 클러스터 시스템
US7461166B2 (en) 2003-02-21 2008-12-02 International Business Machines Corporation Autonomic service routing using observed resource requirement for self-optimization
JP2010282533A (ja) * 2009-06-08 2010-12-16 Mitsubishi Electric Corp 計算機システム、計算機リソース制御方法および計算機リソース制御プログラム
JP2011134215A (ja) * 2009-12-25 2011-07-07 Taito Corp クラスタリングシステム
JP2015184974A (ja) * 2014-03-25 2015-10-22 株式会社Nttドコモ リソース管理装置およびリソース管理方法
JP2016506557A (ja) * 2012-11-26 2016-03-03 サイクル コンピューティング,エルエルシー 異なる環境どうし間でのジョブ実行依頼のトランスペアレントなルーティング

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06168217A (ja) * 1992-11-25 1994-06-14 Hitachi Ltd 並列演算機構の構成方法及び装置並びに並列演算機構
JPH07141302A (ja) * 1993-11-17 1995-06-02 Agency Of Ind Science & Technol 並列計算機における負荷分散方法
JPH09288648A (ja) * 1996-04-19 1997-11-04 Matsushita Electric Ind Co Ltd ネットワークにおける分散処理方法及びそのシステム
WO1999018534A2 (en) * 1997-10-06 1999-04-15 Web Balance, Inc. System for balancing loads among network servers

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06168217A (ja) * 1992-11-25 1994-06-14 Hitachi Ltd 並列演算機構の構成方法及び装置並びに並列演算機構
JPH07141302A (ja) * 1993-11-17 1995-06-02 Agency Of Ind Science & Technol 並列計算機における負荷分散方法
JPH09288648A (ja) * 1996-04-19 1997-11-04 Matsushita Electric Ind Co Ltd ネットワークにおける分散処理方法及びそのシステム
WO1999018534A2 (en) * 1997-10-06 1999-04-15 Web Balance, Inc. System for balancing loads among network servers

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7461166B2 (en) 2003-02-21 2008-12-02 International Business Machines Corporation Autonomic service routing using observed resource requirement for self-optimization
KR100654391B1 (ko) 2005-04-22 2006-12-06 이광훈 클러스터 시스템 제어 방법 및 상기 제어 방법을 수행하는컴퓨터 판독 가능한 기록 매체를 포함하는 클러스터 시스템
JP2010282533A (ja) * 2009-06-08 2010-12-16 Mitsubishi Electric Corp 計算機システム、計算機リソース制御方法および計算機リソース制御プログラム
JP2011134215A (ja) * 2009-12-25 2011-07-07 Taito Corp クラスタリングシステム
JP2016506557A (ja) * 2012-11-26 2016-03-03 サイクル コンピューティング,エルエルシー 異なる環境どうし間でのジョブ実行依頼のトランスペアレントなルーティング
JP2015184974A (ja) * 2014-03-25 2015-10-22 株式会社Nttドコモ リソース管理装置およびリソース管理方法

Similar Documents

Publication Publication Date Title
AU2014414703B2 (en) Data forwarding method, device and system in software-defined networking
Korilis et al. Architecting noncooperative networks
US5491690A (en) Method and apparatus to speed up the path selection in a packet switching network
US9367366B2 (en) System and methods for collaborative query processing for large scale data processing with software defined networking
US6393026B1 (en) Data packet processing system and method for a router
CN100454830C (zh) 网络域中实现路径计算的方法
US9628391B2 (en) Recursive load balancing in a loop-free routing topology using routing arcs
CN101001200B (zh) 一种区域间流量工程全网计算方法及***
CN107294852B (zh) 一种使用拓扑分散短路径集的网络路由方法
Bera et al. Traffic-aware dynamic controller assignment in SDN
JP2004048661A (ja) ネットワークのパス構成のための方法および装置
WO2001086891A2 (en) System and method for application object transport
CN112084027B (zh) 片上网络数据传输方法、装置、片上网络、设备及介质
Shi et al. Real-time communication analysis with a priority share policy in on-chip networks
CN113810205A (zh) 服务算力信息的上报、接收方法、服务器及数据中心网关
CN105357124A (zh) 一种MapReduce带宽优化方法
EP3879767B1 (en) Distributed label assignment for labeled routing protocol routes
CN109995875A (zh) 虚拟化数据分发弹性网络***
Patil Load balancing approach for finding best path in SDN
JP3830937B2 (ja) 高速パケット網のためのパケットスケジューリングシステム及び方法
Oida et al. ARS: an efficient agent-based routing system for QoS guarantees
WO2022016969A1 (zh) 一种数据处理方法及装置
JP2002259353A (ja) 広域クラスタ通信の設定方法、クラスタノードマネージャ装置、クラスタ装置および広域クラスタネットワーク
US20050027880A1 (en) System and method for routing information in a nodal computer network
JP2002247087A (ja) Ipネットワーク負荷分散方法、ipネットワーク、ipルーティング装置及びルートサーバ装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050216

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050405

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050726