JP4961833B2 - クラスタシステム、負荷分散方法、最適化クライアントプログラム、及び調停サーバプログラム - Google Patents

クラスタシステム、負荷分散方法、最適化クライアントプログラム、及び調停サーバプログラム Download PDF

Info

Publication number
JP4961833B2
JP4961833B2 JP2006140202A JP2006140202A JP4961833B2 JP 4961833 B2 JP4961833 B2 JP 4961833B2 JP 2006140202 A JP2006140202 A JP 2006140202A JP 2006140202 A JP2006140202 A JP 2006140202A JP 4961833 B2 JP4961833 B2 JP 4961833B2
Authority
JP
Japan
Prior art keywords
node
nodes
arbitration
load
bus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006140202A
Other languages
English (en)
Other versions
JP2007310710A (ja
Inventor
学 宮崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2006140202A priority Critical patent/JP4961833B2/ja
Priority to US11/737,833 priority patent/US7623460B2/en
Publication of JP2007310710A publication Critical patent/JP2007310710A/ja
Application granted granted Critical
Publication of JP4961833B2 publication Critical patent/JP4961833B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/11Identifying congestion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/12Avoiding congestion; Recovering from congestion
    • H04L47/125Avoiding congestion; Recovering from congestion by balancing the load, e.g. traffic engineering

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Debugging And Monitoring (AREA)

Description

本発明は、複数の情報処理装置(ノード)を備えるクラスタシステム、及び負荷分散方法に関し、特に複数のノードに接続されるI/Oスロットを選択的に変更できるスイッチを備えるクラスタシステム、及びそのクラスタシステムにおける負荷分散方法に関する。
近年、障害発生時にシステムが停止せずに処理を継続する目的や、大きな負荷に対して処理能力の向上させるを目的で、多数の情報処理装置(ノード)が接続されたクラスタシステムが必要とされている。このようなクラスタシステムでは各ノードにどのように仕事(ジョブ)を割り振るかという負荷分散が重要である。
従来のクラスタシステムではプロセッサリソースについての負荷分散を目指すものが主流であった。又、柔軟性のある負荷分散を実現するために各ノードは対称なハードウェア構成であることが望ましい。具体的には、あるノードからのみアクセス可能なストレージが存在する場合、そのノードとストレージへの負荷が集中する時、他のデバイスはそのストレージにアクセスできないため、当該ノードやストレージへの負荷を他のノードに逃がすことが出来ない。従って、すべてのノードは全てのデバイスにアクセス可能であることが必要となる。通常、各ノードにおけるI/O環境はアダプタとブリッジ(例えばPCIブリッジ)の接続が固定である。このため各ノードに対し自由に負荷が分散されるためには、すべてのノードに同じアダプタを実装する必要があり、非常に冗長な構成となる。
一方、より柔軟なIO構成を実現するため、各ノードのPCIブリッジと各PCIスロットとの間にスイッチを用意して、自由にPCIブリッジとPCIスロットとの接続を変更できるクラスタシステムが開発されている。この場合、スイッチを制御して各ノードと各PCIスロットとの接続を切り替えられるので、ノードの数だけ同じアダプタを用意する必要は無く、アダプタの利用効率は良い。しかし、各ノードに対する負荷は時間で変化するため、少ないアダプタを効率良く使用することが望まれている。
しかし、従来技術による負荷分散方法では、プロセッサリソースに基づいて割り振る負荷が決定される。このため、プロセッサまでの経路に問題がある場合、必ずしも適切なプロセッサに負荷が割り振られるとは限らない。例えば、使用率が低いプロセッサに負荷が投入されても、そのノードのIOスロットまでの経路が輻輳している場合、そのプロセッサは投入された負荷を処理できない可能性がある。このため、プロセッサリソースに基づいて負荷分散を行っても、システム性能が向上しない可能性がある。
又、柔軟な負荷分散が実現されるために全てのノードが対称になるようにアダプタカードが用意されると、カードの利用効率が低くなりコストが上がってしまう。しかしコストを下げるために必要な枚数のアダプタしか用意しないと、特に時間によって変化する負荷に対応することは難しい。
一方、負荷分散に係る従来技術が以下の開示例に記載されている。特開2002−163241号公報には、需要変動に応じてサービス提供側の資源を動的に再構成するクライアントサーバシステムが記載されている(特許文献1参照)。又、特開平5−089064号公報には、複数の装置制御部を介してホストコンピュータと通信を行い、複数の装置制御部の負荷状態を監視する負荷管理部を備えるコンピュータシステムが記載されている(特許文献2)。特許文献2に記載の負荷管理部は装置制御部の負荷状態に応じてホストコンピュータと通信する各装置制御部又は各装置を変更して負荷分散を行う。又、特開平7−250085号公報にはデータ通信装置におけるバスの負荷分散方法が記載されている(特許文献3参照)。特許文献3に記載のデータ通信装置は、複数のモジュールと複数のバスと、各モジュールのトラヒック量に応じてモジュールに接続するバスを選択する制御手段とを備えている。又、特開平9−016534号公報には、ネットワークで結合され分散構成された計算機における分散型プロセス処理方法が記載されている(特許文献4参照)。特許文献4に記載の方法では、計算機に関する静的性能と動的な負荷状況の変動などハードウェア資源に関する情報と計算機環境内のソフトウェア環境に関する情報とに基づいてジョブをサーバプロセスに分配し実行処理する。更に、特開平11−065727号公報には、I/Oスロットの接続を任意のI/Oバスに変更してI/Oバスの負荷分散を実行するコンピュータが記載されている(特許文献5参照)。
特開2002−163241号公報 特開平5−089064号公報 特開平7−250085号公報 特開平9−016534号公報 特開平11−065727号公報
本発明の目的は、負荷分散に伴うシステム性能の低下を防止するクラスタシステムを提供することにある。
又、本発明の他の目的は、ノードのI/Oにおける負荷量に応じて、ノードのI/Oまでの経路を動的に変更できるクラスタシステムを提供することにある。
更に、本発明による他の目的は、少ないハードウェア資源を活用した低コストなクラスタシステムを提供することにある。
以下に、[発明を実施するための最良の形態]で使用される番号・符号を括弧付きで用いて、[課題を解決するための手段]を説明する。この番号・符号は、[特許請求の範囲]の記載と[発明を実施するための最良の形態]の記載との対応関係を明らかにするために付加されたものであるが、[特許請求の範囲]に記載されている発明の技術的範囲の解釈に用いてはならない。
本発明によるクラスタシステムは、複数のI/Oスロット(4)と、複数のノード(1、1’)と、複数のI/Oスロット(4)と複数のノード(1、1’)との間に設けられるスイッチ(3)とを具備する。複数のノード(1、1’)は、複数のI/Oスロット(4)のいずれかを介して相互に接続される。本発明に係るスイッチ(3)は、複数のノード(1、1’)の各々と複数のI/Oスロット(2)の内、対応するI/Oスロット(2)との間の経路における負荷状態に応じて、ノード(1、1’)に接続されるI/Oスロット(2)を変更する。又、複数のノードのいずれか(1’)は、その負荷状態に応じて複数のノード(1、1’)が実行するタスクを決定する。このように、本発明によるクラスタシステムは、各ノードのI/Oにおける負荷状態に応じて、その接続先のI/Oスロット(2)を変更し、且つ、各ノード(1、1’)が処理すべきタスク(負荷)を決定する。このため、本発明によれば、ノードのI/Oが高負荷状態である場合、接続先のI/Oスロットを他のI/Oスロットに変更して、当該ノードのI/Oにかかる負荷を低減することができる。又、ノードのI/Oにおける負荷状態を考慮してタスク(負荷)をノード(1、1’)に割り当てるため、I/Oが高負荷状態のノードを避けて負荷分散することができる。更に、動的にノード(1、1’)とI/Oスロット(4)との経路を変更することができるため、負荷分散の柔軟性とI/Oスロットに接続するためのアダプタの高い利用効率を得ることができる。
又、複数のノード(1、1’)の各々は、複数のI/Oスロット(4)のいずれかに接続されるプロセッサ(11、11’)と、プロセッサ(11、11’)とI/Oスロット(4)との間の経路(2、16)における性能情報(106、107)を取得する性能カウンタ(140、150)とを備えることが好ましい。この場合、プロセッサ(11、11’)は、性能情報(106、107)が閾値を越える場合、自身に接続されるI/Oスロット(4)までの経路(2、16)が高負荷状態であると判定する。スイッチ(3)は、高負荷状態と判定されたノードに接続されるI/Oスロットを他のI/Oスロットに変更する。本発明によれば、各ノードにおいて自身のI/Oの負荷状態の監視、高負荷状態の判定を行うため、負荷状態の変動に迅速、柔軟に対処することができる。
本発明によるクラスタシステムは、スイッチ(3)と複数のノード(1、1’)とを相互に接続されるスイッチ管理ネットワーク(5)を更に具備することが好ましい。又、複数のノードは調停ノード(1’)を含むことが好ましい。複数のノード(1、1’)の各々は、性能情報(106、107)をスイッチ管理ネットワーク(5)を介して調停ノード(1’)に送信する。調停ノード(1’)は、複数のノード(1、1’)から送信された性能情報(106、107)に基づいて構成変更要求(113)を発行する。複数のノード(1、1’)の各々は、構成変更要求(113)に基づいて、スイッチ管理ネットワーク(5)を介してスイッチ(3)を制御して自ノードに接続されたI/Oスロット(4)を変更する。このように、本発明のクラスタシステムは、ノード間を結ぶデータ伝送路とは別に、負荷状態の伝達及びスイッチ(3)の制御に使用されるスイッチ管理ネットワークが設けられる。このため、ノード間のデータ伝送に影響を与えることなく、又、ノードのI/Oにおける障害や高負荷状態に影響される事無く、スイッチ(3)制御が行われ得る。又、複数のノードのうち、ノードとI/Oスロットとの接続制御を一元管理する調停ノード(1’)が設けられるため、統一的にスイッチ(3)を制御することができる。
又、調停ノード(1’)は、複数のノード(1、1’)から送信された性能情報(106、107)に基づいて複数のノード(1、1’)の各々が処理すべきタスクを指定する最適構成情報(109)を生成して複数のノード(1、1’)に送信することが好ましい。複数のノード(1、1’)の各々のプロセッサ(11、11’)は、最適構成情報(109)に示されたタスクを処理する。本発明に係る調停ノード(1’)は、性能情報(106、107)を考慮してノード(1、1’)が処理すべきタスク(負荷量)を決定することができる。すなわちノード(1、1’)のI/Oにおける負荷状況を考慮して各ノードに与える負荷の大きさを決定することができる。
I/Oスロット(4)までの経路が高負荷状態であると判定したノード(1、1’)は、調停ノード(1’)に調停要求(111)を発行する。調停ノード(1’)は、調停要求(111)に応答して複数のノード(1、1’)に対し性能情報要求(112)を発行する。複数のノード(1、1’)の各々は、性能情報要求(112)に応答して自身に接続されるI/Oスロット(4)までの経路における性能情報(106、107)を調停ノード(1’)に送信する。このように、調停ノード(1’)は、I/Oスロット(4)までの経路の高負荷状態の検出をトリガに、各ノードの性能情報を収集し、それぞれの経路を変更することができる。
更に、複数のノードの各々は、性能情報(106、107)を時系列的に記録した性能統計情報(103)を有することが好ましい。又、調停ノード(1’)は、ノード(1、1’)の接続先となるI/Oスロット(4)の変更条件を規定するユーザポリシ(105)を有することが好ましい。この場合、ノード(1、1’)は、性能情報要求(112)に応答して性能統計情報(103)を調停ノード(1’)に送信する。調停ノード(1’)は、性能統計情報(103)がユーザポリシ(105)に適合している場合、構成変更要求(113)を発行して、ノードの接続先I/Oスロットの変更、及びタスクの割り当てを行う。このように、本発明によれば、ノード(1、1’)間の接続構成を変更するための条件をユーザポリシとして設定できるため、より柔軟性のある負荷分散を行うことができる。
性能情報(106、107)は、ノード(1、1’)に設けられたプロセッサ(11、11’)とI/Oスロット(4)との間における伝送路の使用率又はトランザクション数であることが好ましい。又、複数のノード(1、1’)の各々は、PCIバス(2)を介してスイッチ(3)に接続されるPCIブリッジ(14)を更に備えることが好ましい。本発明に係るPCIブリッジ(15)は、PCIバス(2)における第1の性能情報(107)を取得する第1のカウンタ(150)を備える。プロセッサ(11、11’)は、第1の性能情報(107)が閾値を越える場合、PCIバス(2)が高負荷状態であると判定し、調停ノード(1’)に調停要求(111)を発行する。このように、本発明に係るノード(1、1’)はPCIバス(2)の負荷状態に応じて自身へのI/Oへの経路及び処理すべきタスクを変更できる。
更に、複数のノードの各々(1、1’)は、プロセッサ(11、11’)とPCIブリッジ(15)との間に接続されるノースブリッジ(14)を更に備える。本発明に係るノースブリッジ(14)は、ノースブリッジ(14)とPCIブリッジ(15)との間における第2の性能情報(106)を取得する第2のカウンタ(140)を備えることが好ましい。プロセッサ(11、11’)は、第2の性能情報(106)が閾値を越える場合、ノースブリッジ(14)とPCIブリッジ(15)との間(16)が高負荷状態であると判定し、調停ノード(1’)に調停要求(111)を発行する。このように、本発明に係るノード(1、1’)は、PCIバス(2)とは異なる伝送長、又はクロックで動作するシステムバス(16)の負荷状態に応じて自身へのI/Oへの経路及び処理すべきタスクを変更できる。
本発明によるクラスタシステム、及び負荷分散方法は、適切なノードを適切に選択して負荷分散を実行し、システム性能を向上することができる。
又、動的にノードに接続されるI/Oスロットを変更することができる。
更に、少ないハードウェア資源で低コストなクラスタシステムを提供できる。
以下、添付図面を参照して、本発明によるクラスタシステムの実施の形態が説明される。図面において同一、又は類似の参照符号は、同一、類似、又は等価な構成要素を示している。又、同様な構成が複数ある構成要素には、それぞれ下付き番号が付された参照符号が付与される。この場合、複数の構成要素に共通の説明がなされる場合、下付き符号が外された参照符号によって説明される。
(構成)
本実施の形態は、マウントラック型のブレードサーバを一例に説明される。図1は、本発明によるブレードサーバの実施の形態における構成図である。本発明によるブレードサーバは、図1を参照して、ブレードサーバは、調停ノード1’、複数のノード1〜1(n個)、PCI(Peripheral Components Interconnect)バス2〜2、スイッチ部3、PCIスロット4〜4(m個)を具備する。調停ノード1’及びノード1はプロセッサやメモリを備えるコンピュータ装置(サーバブレード)である。調停ノード1’及びノード1は、PCIバス2及びPCIスロット4を介して相互に接続される。スイッチ部3はPCIバス2とPCIスロット4との間に設けられる。スイッチ部3は、調停ノード1’及びノード1〜1のそれぞれと、PCIスロット4〜4のそれぞれとを選択的に接続する。又、スイッチ部3と調停ノード1’及びノード1は、スイッチ管理ネットワーク5を介して接続されている。尚、本実施の形態では、拡張バス及び拡張スロットの規格としてPCIが採用されているが、他の規格が採用された形態でも構わない。PCIスロット4〜4は、全て同一のバス幅でも、異なるバス幅を組み合わせた形態でもどちらでも構わない。
スイッチ部3は、例えばスイッチ機能を有するチップである。本実施の形態では、スイッチ部3とPCIスロット4は1つの基板に搭載されたI/Oパッケージを形成する。調停ノード1’及びノード1は図示しないアダプタカードを介してこのI/Oパッケージに装着されることでブレードサーバ(クラスタシステム)を形成する。スイッチ管理ネットワーク5は、PCIバス2と高速伝送バスであるPCIバス2とは別の通信バスである。調停ノード1’及びノード1は、このスイッチ管理ネットワーク5を介してスイッチ部3を制御してスイッチ部3の構成を変更する。すなわち、高速伝送を必要としないスイッチ制御に、データ伝送用のバス以外のスイッチ管理ネットワーク5を使用することで、データ伝送用のバスの使用帯域を有効に使用できる。
図2は、本発明によるノード1の実施の形態における構成図である。図2を参照して、ノード1は、複数のプロセッサを有するプロセッサ群11、BMC(Baseboard Management Controller)12、メモリ13、ノースブリッジ14、PCIブリッジ15、内部バス16を具備している。プロセッサ群11は、ノースブリッジ14及びPCIブリッジ15を介してPCIバス2に接続される。ノースブリッジ14はプロセッサ群11、BMC12、メモリ13、及び内部バス16に接続される。ノースブリッジ14は接続される各構成とプロセッサ群11との間における情報の伝送を制御するインターフェイスと、メモリコントローラを装備しているチップセットである。又、ノースブリッジ14は内部バス16を介してPCIブリッジ15に接続され、内部バス16における情報の伝送を制御する。PCIブリッジ15は、PCIバス2に接続されPCIバス2における情報の伝送を制御するチップセットである。メモリ13は、ROMに例示される記憶装置であり、最適化クライアントプログラム101と性能カウンタドライバ102とを格納している。又、メモリ13には、自ノードとPCIスロット4との間における負荷状態の履歴データとして性能統計情報103が記録されることが好ましい。
ノースブリッジ14は、内部バス16内の性能情報106を監視する性能カウンタ140を備える。又、PCIブリッジ15は、スイッチ部3とPCIブリッジ15との間におけるPCIバス2の性能情報107を監視する性能カウンタ150を備える。ここで性能情報106、107とは、バスにおける負荷状態を示す情報であり、例えば、それぞれのバスの使用率やトランザクション数である。
プロセッサ群11は、SMP(Symmetric Multiple Processor)やASMP(Asymmetric Multiple Processor)に例示されるマルチプロセッサである。プロセッサ群11は、PCIバス2を介して付与されたタスクを処理する。又、プロセッサ群11は、メモリ13内に格納された最適化クライアントプログラム101及び性能カウンタドライバ102を実行して、自ノードとPCIスロット4との間にかかる負荷の監視やスイッチ部3の制御を行う。
最適化クライアントプログラム101や性能カウンタドライバ102は、OS上で動作するプログラムである。プロセッサ群11は、性能カウンタドライバ102を実行することで、性能カウンタ140、150を制御してプロセッサ群11とPCIスロット4との間における性能情報106、107を抽出する。性能情報106、107の抽出時期は、一定時刻毎でも任意の時期でもよい。しかし、負荷状態の変動履歴を監視するため、一定周期で性能情報106、107が抽出されることが好ましい。この際、プロセッサ11は、一定周期で抽出した性能情報106、107を性能統計情報103としてメモリ13に格納する。
プロセッサ群11は最適化クライアントプログラム101を実行することで、自身とPCIスロット4との間における負荷状態の監視、監視区間が高負荷状態になった場合に調停ノード1’への最適化要求、調停ノード1’からの要求に応答して性能情報106、107又は性能統計情報108の送信、入力された負荷プログラムの実行、スイッチ部3を制御して自身の接続先のPCIスロット4の変更等の処理を行う。
BMC12は、シリアルバスを介してプロセッサ群11及びメモリ13に接続される。BMC12は、プロセッサ群11やOS(Operation system)に依存せずにノード内の状態監視を行う。又、スイッチ管理ネットワーク5を介してスイッチ部3及び調停ノード1’に接続される。BMC12はスイッチ管理ネットワーク5経由でスイッチ部3の構成情報114を取得し、プロセッサ群12に送信する。ここで、構成情報114とは、調停ノード1’及びノード1がどのPCIスロット4に接続されているかを示す接続関係を示す情報である。スイッチ部3の制御や構成情報14の取得には、高速な経路は必要ではないため、プロセッサ群11は、通常の伝送路とは別のBMC12及びスイッチ管理ネットワーク5を介してスイッチ部3の制御や構成情報14の取得を行う。
本発明によるブレードサーバは、複数のノードのうち任意のノードを調停ノード1’として使用する。図3は、本発明による調停ノード1’の実施の形態における構成図である。図3を参照して、調停ノード1’は、ノード1と同様にプロセッサ群11’、BMC(Baseboard Management Controller)12、メモリ13’、ノースブリッジ14、PCIブリッジ15、内部バス16を具備している。ノード1と調停ノード1’は同様な構成であるが、メモリ13’に調停サーバプログラム104とユーザポリシ105とが格納されている点で他のノード1と異なる。尚、メモリ13’は他のノード1と同様に最適化クライアントプログラム101、性能カウンタドライバ102、性能統計情報103とを格納している。調停ノード1’のプロセッサ群11’は最適化クライアントプログラム101及び性能カウンタドライバ102を実行することで、プロセッサ群11と同様に、自身とPCIスロット4との間における負荷状態を監視、高負荷状態の通知、及び接続先のPCIスロット4の変更等を行うことができる。以下、最適化クライアントプログラム101を実行するプロセッサ群11’の動作は、プロセッサ群11の動作と同じなのでその説明は省略される。
調停ノード1’のプロッセッサ群11’は、調停サーバプログラム104を実行することで、全てのノード1〜1から性能情報106、107を取得し、この性能情報106、107を用いて最適構成を決定する。詳細には、調停ノード1’は現在のノード1のCPU使用率と、全てのノードから取得した性能情報106、107とに基づいて最適構成を決定する。ここで、最適構成とは、調停ノード1’及びノード1〜1のそれぞれが処理する負荷(タスク)を指定する情報である。プロセッサ群11’は、各ノードにおけるCPUの使用率や、ノード〜PCIスロット間の経路にかかる負荷が分散されるように最適構成を決定する。尚、プロセッサ群11’はノード1のCPUの使用率を従来技術と同様な方法で取得する。プロセッサ群11’は決定した最適構成を最適構成情報109としてノード1に転送する。
更に、プロセッサ群11’は性能情報106、107に基づき、調停ノード1’及びノード1の接続先PCIスロット4を決定し、ノード1に対し構成変更要求113を発行する。構成変更要求113には調停ノード1’及びノード1とPCIスロット4との接続関係を規定した情報が含まれている。ノード1は構成変更要求113に応答して自身の接続先PCIスロット4を変更する。
メモリ13’に格納されるユーザポリシ105は、現在の構成(調停ノード1’及びノード1とPCIスロット4との接続構成)を変更するかどうかの判定条件である。例えば、ノード1とPCIスロット4との間が高負荷状態であるかどうかを判定する基準値と、高負荷状態の許容継続時間とがユーザポリシ105として設定される。プロセッサ群11’は、ノード1’から転送された性能統計情報108と、ユーザポリシ105とを用いて現在の構成を変更するか否かを決定する。
(動作)
図4から7を参照して、本発明によるブレードサーバの実施の形態における構成変更処理の動作が説明される。図4は、本発明によるブレードサーバの構成変更処理の動作を示すシーケンス図である。図5は、最適化クライアントプログラム101による調停要求処理の動作を示すフロー図である。図6は、最適化クライアントプログラム101による性能情報報告処理、及び構成変更処理の動作を示すフロー図である。図7は、調停サーバプログラム104による構成変更要求処理の動作を示すフロー図である。
図4を参照して、本発明によるブレードサーバの構成変更処理の実施の形態における動作が説明される。ここでは、図4を参照して複数のノード1〜1のうち、ノード1において高負荷状態が検出されたものとして説明される。ノード1は自身に接続されるPCIスロット4までの経路を監視し、高負荷状態であると判定すると、調停要求111を調停ノード1’に発行する(ステップS102、S104)。調停ノード1’は調停要求111に応答して、性能情報要求112を全てのノード1〜1に発行する(ステップS106)。ノード1〜1は、性能情報要求112に応答して最新の性能情報106、107又は性能統計情報103を調停ノード1’に転送する(ステップ」S108)。ここでは、それぞれのノード1から性能統計情報103が転送されるものとする。
調停ノード1’は、全てのノード1〜1のそれぞれから転送された性能統計情報103を用いて最適構成を決定する(ステップS110)。又、調停ノード1’は、ユーザポリシ105を用いてノード1から転送された性能統計情報103を参照して、構成を変更するか否かを判定する。例えば、監視区間の高負荷状態がユーザポリシ105に設定された許容時間を越えて継続している場合、構成を変更すると判定する。構成を変更すると判定した調停ノード1’は、構成変更要求113を発行するとともに最適構成情報109をノード1〜1に転送する(ステップS114)。ノード1〜1のそれぞれは、構成変更要求113に基づいて接続先のPCIスロット4を変更する(ステップS116)。又、転送された最適構成情報109に基づき、指定されたタスクを処理する。
以上のように、本発明によるブレードサーバは、調停ノード1’及びノード1〜PCIスロット4間の経路における負荷状態に応じてその接続構成を変更する。このため、PCIスロット4までの経路が高負荷状態であるノード1の使用を避けて負荷分散を行うことができる。又、調停ノード1’は、ノード1におけるCPUの使用率や、ノード1のI/Oデバイスにおける負荷に応じて負荷分散を行うことができる。更に、動的にノード1とI/Oスロット4との経路を変更することができるため、負荷分散の柔軟性とI/Oスロット4に接続するためのアダプタの高い利用効率を得ることができる。
図5を参照して、ステップS102及びステップS104におけるノード1の調停要求処理の動作が示される。ノード1では、内部バス16及びPCIバス2の負荷状態を監視し、それぞれの負荷状態を性能情報106、性能情報107として定期的に抽出している。又、抽出した性能情報106及び107を性能統計情報103としてメモリ13に格納し、負荷状態の履歴管理を行っている。
ノード1のプロセッサ群11は最適化クライアントプログラム101を実行することで、図5に示されるステップS1からステップS3の負荷状態監視処理、及び調停要求処理を実行する。プロセッサ群11は、定期的に性能統計情報103を参照して内部バス16及びPCIバス2の負荷状態を監視する(ステップS1)。次に、性能統計情報103の中で最新の性能情報106及び107に基づき高負荷状態であるかを判定する(ステップS2)。最適化クライアントプログラムには高負荷状態の判定のための閾値が設定される。例えば、閾値としてバスの使用率50%が設定される。この閾値はユーザによって自由に設定可能であることが好ましい。又、ノード1〜1によって異なった値が設定されても構わない。更に、内部バス16、PCIバス2のそれぞれの対する閾値は異なる値が設定されても構わない。
プロセッサ群11は、ステップS2において高負荷状態であると判定するまで、周期的に性能統計情報103の監視処理を続ける(ステップS2NO)。ステップS2において高負荷状態と判定すると(ステップS2YES)、BMC12及びスイッチ管理ネットワーク5を介して調停ノード1’に対し調停要求111を発行する(ステップS3)。ここで、内部バス16とPCIバス2はそれぞれ異なる転送長、クロックで動作しているため、PCIブリッジ15〜PCIスロット4間の負荷状態(性能情報107)に問題が無くても、ノースブリッジ14〜PCIブリッジ15の負荷状態(性能情報106)に問題がある場合がある。又はその逆の場合がある。このため、調停要求111は、内部バス16、PCIバス2のどちらか一方が高負荷状態と判定されたときに発行されることが好ましい。調停要求111発行後、再びステップS2に移行し、プロセッサ群11は周期的に内部バス16及びPCIバス2の負荷状態の監視を続ける(ステップS3)。以上のように、本発明によれば、各ノード1において自身のI/Oの負荷状態の監視、高負荷状態の判定を行うため、負荷状態の変動に迅速、柔軟に対処することができる。
次に、図6を参照して、ノード1におけるメッセージ監視処理、性能情報報告処理、及び構成変更処理の動作が説明される。最適化クライアントプログラムを実行するプロセッサ群11は、図6に示されるステップS10〜S15までのメッセージ監視処理、性能情報報告処理、及び構成変更処理を実行する。
プロセッサ群11は、調停ノード1’からのメッセージを監視している(ステップS10、S11)。調停ノード1’からメッセージを受け取ると、そのメッセージが性能情報要求112である場合(ステップS12YES)、性能統計情報103から現在の性能情報106、107をBMC12及びスイッチ管理ネットワークを介して調停ノード1’に転送する(ステップS13)。又、調停ノードから受け取ったメッセージが構成変更要求113である場合(ステップS12NO、ステップS14YES)、構成変更要求113に基づいて構成を変更する(ステップS15)。プロセッサ群11は、性能情報106、107の転送、構成変更を終了すると再びメッセージの監視処理を続ける。
構成変更要求113には、ノード1が設定すべきハードウェア構成(どのPCIスロット2にどのノード1のPCIブリッジ15を接続すべきか)が記述されている。ノード1のプロセッサ群11は、構成変更要求113に従ってBMC12及びスイッチ管理ネットワーク5を介してスイッチ部3をコントロールし、自身のPCIブリッジ15と接続するPCIスロット4を変更する。この際、プロセッサ群11は、BMC12から転送された構成情報114を参照して変更前のスイッチ部3の構成を確認する。プロセッサ群11は、BMC12及びスイッチ管理ネットワーク5を介してスイッチ部3から構成情報114を取得するため、他ノード1に接続されているPCIスロット4を確認することができる。従来技術では、他ノード1のデバイス情報は他ノード1に問い合わせる必要があった。しかし、障害等により他ノード1への通信経路が断たれた場合、そのノードに割り当てられていたデバイス(PCIスロット4)をOS経由で確認することは困難である。一方、本発明によれば、BMC12を利用してスイッチ部3から構成情報を取得しているため、他ノードとの通信経路の状況に左右されずにノード1とPCIスロット4との切り離しや復旧(接続)を容易に行うことができる。
以上のように、本発明のクラスタシステムは、ノード1間を結ぶデータ伝送路とは別に、負荷状態の伝達及びスイッチ3の制御に使用されるスイッチ管理ネットワーク5が設けられる。このため、ノード間のデータ伝送に影響を与えることなく、又、ノード1のI/Oにおける障害や高負荷状態に影響される事無く、スイッチ部3の制御が行われ得る。又、複数のノードのうち、ノード1とPCIスロット4との接続制御を一元管理する調停ノード1’が設けられるため、統一的にスイッチ部3を制御することができる。
図7を参照して、調停ノード1’におけるメッセージ監視処理、調停処理、及び最適構成生成処理、及び構成変更要求処理の動作が説明される。調停ノードのプロセッサ群11’は、調停サーバプログラム104を実行することで、図7に示されるステップS20〜S28に示されるメッセージ監視処理、調停処理、最適構成生成処理、構成変更要求処理を実行する。
プロセッサ群11’は、ノード1〜1からのメッセージを監視している(ステップS20、S21)。プロセッサ群11は、ノード1からメッセージを受け取ると、そのメッセージが調停要求111である場合(ステップS22YES)、性能情報要求112を全てのノード1〜1に発行する(ステップS23)。ノード1から受け取ったメッセージが性能情報報告である場合(ステップS22NO、ステップS24YES)、全ての性能情報報告を受け付けるまで、ステップS20〜S24の動作を繰り返す。ここで、ノード1は、性能情報報告として自身が記録している性能統計情報108を調停ノード1’に転送する。プロセッサ群11’は、全てのノード1〜1からそれぞれの性能統計情報108を取得すると最適構成を決定し、最適構成情報109を生成する(ステップS25YES、ステップS26)。このように、調停ノード1’は、I/Oスロット4までの経路における高負荷状態の検出をトリガとして、ノード1〜1の性能情報を収集し、それぞれの経路の変更、及び負荷分散を実行することができる。
最適構成情報109について詳細に説明される。最適構成情報109は、各ノード1が処理すべきタスクを指定する情報である。例えば、最適構成情報109は、タスク処理を実行するノードと処理対象のタスクとが対応付けられた情報を含む。プロセッサ群11’は、性能統計情報108内の最新の性能情報106、107を参照して、各ノード1までの経路(内部バス16又はPCIバス2)のうち、負荷の高い経路と低い経路を特定する。又、ノード1毎のCPU(ここではプロセッサ群11)のリソースの使用率等に例示される負荷状態を把握し、高負荷状態(又は低負荷状態)のCPUを有するノード1を特定する。プロセッサ群11’は、負荷の高い処理(タスク)を、低負荷状態の経路に接続されたノード1、又は/及びプロセッサ群11が低負荷状態であるノード1に移動するように最適構成情報109を生成する。
最適構成情報109の設定例を以下に示す。負荷が1つのノードに偏って実行されている場合、調停ノード1’は、ノード1から取得した性能統計情報103に含まれる性能情報106、107を参照して、最も低負荷状態の経路を特定する。調停ノード1’は調停要求111の発行元ノード(例えばノード1)の接続先のPCIスロット4と、低負荷状態の経路に接続されたPCIスロット4とを変更するように構成変更要求113を発行する。次に、調停ノード1’及びノード1〜PCIスロット4間の経路にかかる負荷を平等化するように、各ノード1に付与するタスクを決定し、最適構成情報109を生成する。この際、ノード1で処理されるタスクのうち最も負荷が高いタスクを、最も負荷の軽い経路に接続されたノード1に移動する。尚、調停ノード1’は、OSが把握しているタスク毎のI/O処理量に基づいて、経路に対するタスクの負荷量を知ることができる。
プロセッサ群11’はCPUリソースも考慮して最適構成情報109を生成する。この際、プロセッサ群11’はCPUリソースとノード1までの経路の負荷状態のうち、より負荷の高い方を優先して負荷分散を実行する。例えば、PCIバス2の使用率が65%のノード1と、CPU使用率が60%のノード1がある場合、ノード1に付与されたタスクのうち最も高負荷のタスクを他のノード1に移動する。又、調停ノード1’は、経路の負荷状態に応じて負荷分散を実行するのと並行して、従来技術のように、ノード1〜1のCPUリソースのみに基づいて負荷分散を実行することが好ましい。この場合、調停ノード1’は、ノード1までの経路における高負荷状態が解消されている状態で、CPUリソースに基づく負荷分散を実行できる。
プロセッサ群11’は、ユーザポリシ105とノード1から送信された性能統計情報103に基づいて構成変更可否を判定する(ステップS27)。プロセッサ群11’は性能統計情報103に含まれる現在の性能情報106、107が示す高負荷状態がどのくらい継続しているかを確認する。プロセッサ群11’は高負荷状態の継続時間がユーザポリシ105に含まれる許容時間を越えている場合(ステップS27YES)構成変更要求113を発行するとともに、最適構成情報109を全てのノード1〜1に転送する(ステップS28)。又、プロセッサ群11’は、確認した高負荷状態の継続時間がユーザポリシ105に含まれる許容時間を越えていない場合(ステップS27No)、構成を変更せず再びステップS20のメッセージ監視に移行する。
ノード1〜1のそれぞれは、構成変更要求113に応答して、BMC12及びスイッチ管理ネットワーク5を介してスイッチ部3を制御して接続先のPCIスロット4を変更する。又、最適構成情報109に指定されたタスク(負荷)を実行する。
以上のように、本発明によるブレードサーバは、各ブリッジ間のバスの使用率を最適構成決定の元情報に使っている。このため、プロセッサのリソースが空いているので負荷を投入したが、IOまでの経路が詰まっていたために性能が出ないという状況を回避できる。又、本発明によるブレードサーバは、スイッチ3によってノード1とPCIスロット4との接続を自由に変更できる。このため、ノード1の数と同じ数のアダプタを用意する必要はなく、アダプタの利用効率は向上する。又、本発明は、時間によって変化する負荷に応じてノード1〜PCIスロット4間の接続を変更できるため、動的な負荷の変動に適応している。このため、より少ないアダプタを効率的に使用することができる。
以上、本発明の実施の形態を詳述してきたが、具体的な構成は上記実施の形態に限られるものではなく、本発明の要旨を逸脱しない範囲の変更があっても本発明に含まれる。本実施の形態ではブレードサーバを一例に説明されたが、これに限定されず、複数のコンピュータを接続したクラスタシステムにも適用され得ることは言うまでもない。
図1は、本発明によるクラスタシステムの実施の形態における構成図である。 図2は、本発明に係るノードの実施の形態における構成図である。 図3は、本発明に係る調停ノードの実施の形態における構成図である。 図4は、本発明によるクラスタシステムの実施の形態における構成変更処理の動作を示すシーケンス図である。 図5は、本発明に係る最適化クライアントプログラムによる調停要求処理の動作を示すフロー図である。 図6は、本発明に係る最適化クライアントプログラムによる性能情報報告処理、及び構成変更処理の動作を示すフロー図である。 図7は、本発明に係る調停サーバプログラムによる構成変更要求処理の動作を示すフロー図である。
符号の説明
1、1〜1:ノード
1’:調停ノード
2、2〜2:PCIバス
3:スイッチ部
〜4:PCIスロット
5:スイッチ管理ネットワーク
11、11’:プロセッサ群
12:BMC(Baseboard Management Controller)
13、13’:メモリ
14:ノースブリッジ
15:PCIブリッジ
16:内部バス
140、150:性能カウンタ
101:最適化クライアントプログラム
102:性能カウンタドライバ
103:性能統計情報
104:調停サーバプログラム
105:ユーザポリシ
106、107:性能情報
108:性能統計情報
109:最適構成情報
111:調停要求
112:性能情報要求
113:構成変更要求
114:構成情報

Claims (14)

  1. 複数のI/Oスロットと、
    複数のノードと、
    前記複数のI/Oスロットと前記複数のノードとの間に設けられ、前記複数のノードのそれぞれと前記複数のI/Oスロットのそれぞれとの接続を制御するスイッチと、
    前記スイッチと前記複数のノードとを相互に接続するスイッチ管理ネットワークとを具備し、
    前記複数のノードのそれぞれは、
    前記スイッチと前記ノードとを、拡張バスを介して接続するブリッジと、
    ノースブリッジと、
    前記ブリッジと前記ノースブリッジとを接続する内部バスと、
    前記ノースブリッジに接続され、タスクを処理するプロセッサと
    を備え、
    前記プロセッサは、前記内部バスの負荷を監視し、前記負荷が閾値を超えた場合、前記複数のノードにおける調停ノードに対し、前記スイッチ管理ネットワークを介して、前記内部バスが高負荷状態であることを示す調停要求を発行し、
    前記調停ノードは、前記調停要求に応じて前記複数のノードのそれぞれから、前記スイッチ管理ネットワークを介して、前記内部バス、及び拡張バスの負荷を時系列的に記録した性能統計情報を監視結果として取得し、前記監視結果に基づき、前記高負荷状態の継続時間が、予め設定された時間を超える場合、前記調停要求を発行した前記ノードの前記プロセッサを高負荷状態にしている前記タスクを、前記負荷の低い前記内部バス、及び拡張バスを使用しているノードに実行させる情報を含む構成変更要求を、前記スイッチ管理ネットワークを介して、前記複数のノードに発行し、
    前記複数のノードのそれぞれは、前記スイッチ管理ネットワークを介して、前記スイッチを制御し、前記構成変更要求に基づいて、接続する前記I/Oスロットを変更する
    クラスタシステム。
  2. 請求項1に記載のクラスタシステムにおいて、
    前記複数のノードのそれぞれは、前記内部バスの使用率を監視する性能モニタを更に備え、
    前記プロセッサは、前記内部バスの使用率が閾値を超える場合、前記内部バスが高負荷状態であると判定する
    クラスタシステム。
  3. 請求項1に記載のクラスタシステムにおいて、
    前記複数のノードのそれぞれは、前記内部バスのトランザクション数を監視する性能モニタを更に具備し、
    前記プロセッサは、前記内部バスのトランザクション数が閾値を超える場合、前記内部バスが高負荷状態であると判定する
    クラスタシステム。
  4. 請求項1から3のいずれか1項に記載のクラスタシステムにおいて、
    前記プロセッサは、前記拡張バスにおける負荷を監視し、前記拡張バスの負荷が閾値を超える場合、前記拡張バスが高負荷状態であると判定し、前記調停ノードに前記調停要求を発行する
    クラスタシステム。
  5. 請求項4に記載のクラスタシステムにおいて、
    前記複数のノードのそれぞれは、前記拡張バスの使用率を監視する性能モニタを更に備え、
    前記プロセッサは、前記拡張バスの使用率が閾値を超える場合、前記拡張バスが高負荷状態であると判定する
    クラスタシステム。
  6. 請求項4に記載のクラスタシステムにおいて、
    前記複数のノードのそれぞれは、前記拡張バスのトランザクション数を監視する性能モニタを更に具備し、
    前記プロセッサは、前記拡張バスのトランザクション数が閾値を超える場合、前記拡張バスが高負荷状態であると判定する
    クラスタシステム。
  7. 複数のI/Oスロットと、
    複数のノードと、
    前記複数のI/Oスロットと前記複数のノードとの間に設けられ、前記複数のノードのそれぞれと前記複数のI/Oスロットのそれぞれとの接続を制御するスイッチと、
    前記スイッチと前記複数のノードとを相互に接続するスイッチ管理ネットワークとを具備し、
    前記複数のノードのそれぞれは、
    前記スイッチと前記ノードとを、拡張バスを介して接続するブリッジと、
    ノースブリッジと、
    前記ブリッジと前記ノースブリッジとを接続する内部バスと、
    前記ノースブリッジに接続され、タスクを処理するプロセッサと
    を備えるクラスタシステムにおいて、
    前記プロセッサが、
    前記内部バスの負荷を監視するステップと、
    前記負荷が閾値を超えた場合、前記複数のノードにおける調停ノードに対し、前記スイッチ管理ネットワークを介して、前記内部バスが高負荷状態であることを示す調停要求を発行するステップと、
    前記調停ノードが、
    前記調停要求に応じて前記複数のノードのそれぞれから、前記スイッチ管理ネットワークを介して、前記内部バス、及び拡張バスの負荷を時系列的に記録した性能統計情報を監視結果として取得するステップと、
    前記監視結果に基づき、前記高負荷状態の継続時間が、予め設定された時間を超える場合、前記調停要求を発行した前記ノードの前記プロセッサを高負荷状態にしている前記タスクを、前記負荷の低い前記内部バス、及び拡張バスを使用しているノードに実行させる情報を含む構成変更要求を、前記スイッチ管理ネットワークを介して、前記複数のノードに発行するステップと、
    前記複数のノードのそれぞれが、前記スイッチ管理ネットワークを介して、前記スイッチを制御し、前記構成変更要求に基づいて、接続する前記I/Oスロットを変更するステップと
    を具備する
    負荷分散方法。
  8. 請求項7に記載の負荷分散方法において、
    前記複数のノードのそれぞれは、前記内部バスの使用率を監視する性能モニタを更に備え、
    前記調停要求を発行するステップは、
    前記内部バスの使用率が閾値を超える場合、前記内部バスが高負荷状態であると判定する
    負荷分散方法。
  9. 請求項7に記載の負荷分散方法において、
    前記複数のノードのそれぞれは、前記内部バスのトランザクション数を監視する性能モニタを更に備え、
    前記調停要求を発行するステップは、
    前記内部バスのトランザクション数が閾値を超える場合、前記内部バスが高負荷状態であると判定する
    負荷分散方法。
  10. 請求項7から9のいずれか1項に記載の負荷分散方法において、
    前記プロセッサが、
    自身に接続される前記拡張バスにおける負荷を監視するステップを更に具備し、
    前記調停要求を発行するステップは、前記拡張バスの負荷が閾値を超える場合、前記拡張バスが高負荷状態であると判定するステップを備える
    負荷分散方法。
  11. 請求項10に記載の負荷分散方法において、
    前記複数のノードのそれぞれは、前記拡張バスの使用率を監視する性能モニタを更に備え、
    前記調停要求を発行するステップは、
    前記拡張バスの使用率が閾値を超える場合、前記拡張バスが高負荷状態であると判定する
    負荷分散方法。
  12. 請求項10に記載の負荷分散方法において、
    前記複数のノードのそれぞれは、前記拡張バスのトランザクション数を監視する性能モニタを更に備え、
    前記調停要求を発行するステップは、
    前記拡張バスのトランザクション数が閾値を超える場合、前記拡張バスが高負荷状態であると判定する
    負荷分散方法。
  13. 請求項7乃至12のいずれか1項に記載の負荷分散方法において、ノードが実行するステップを、ノードのプロセッサに実行させるためのプログラム。
  14. 請求項7乃至12のいずれか1項に記載の負荷分散方法において、調停ノードが実行するステップを、調停ノードのプロセッサに実行させるためのプログラム。
JP2006140202A 2006-05-19 2006-05-19 クラスタシステム、負荷分散方法、最適化クライアントプログラム、及び調停サーバプログラム Expired - Fee Related JP4961833B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2006140202A JP4961833B2 (ja) 2006-05-19 2006-05-19 クラスタシステム、負荷分散方法、最適化クライアントプログラム、及び調停サーバプログラム
US11/737,833 US7623460B2 (en) 2006-05-19 2007-04-20 Cluster system, load distribution method, optimization client program, and arbitration server program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006140202A JP4961833B2 (ja) 2006-05-19 2006-05-19 クラスタシステム、負荷分散方法、最適化クライアントプログラム、及び調停サーバプログラム

Publications (2)

Publication Number Publication Date
JP2007310710A JP2007310710A (ja) 2007-11-29
JP4961833B2 true JP4961833B2 (ja) 2012-06-27

Family

ID=38821882

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006140202A Expired - Fee Related JP4961833B2 (ja) 2006-05-19 2006-05-19 クラスタシステム、負荷分散方法、最適化クライアントプログラム、及び調停サーバプログラム

Country Status (2)

Country Link
US (1) US7623460B2 (ja)
JP (1) JP4961833B2 (ja)

Families Citing this family (124)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8028090B2 (en) 2008-11-17 2011-09-27 Amazon Technologies, Inc. Request routing utilizing client location information
US7991910B2 (en) 2008-11-17 2011-08-02 Amazon Technologies, Inc. Updating routing information based on client location
US8606996B2 (en) 2008-03-31 2013-12-10 Amazon Technologies, Inc. Cache optimization
US7970820B1 (en) 2008-03-31 2011-06-28 Amazon Technologies, Inc. Locality based content distribution
US8533293B1 (en) 2008-03-31 2013-09-10 Amazon Technologies, Inc. Client side cache management
US8156243B2 (en) 2008-03-31 2012-04-10 Amazon Technologies, Inc. Request routing
US8321568B2 (en) 2008-03-31 2012-11-27 Amazon Technologies, Inc. Content management
US7962597B2 (en) 2008-03-31 2011-06-14 Amazon Technologies, Inc. Request routing based on class
US8447831B1 (en) 2008-03-31 2013-05-21 Amazon Technologies, Inc. Incentive driven content delivery
US8601090B1 (en) 2008-03-31 2013-12-03 Amazon Technologies, Inc. Network resource identification
US9407681B1 (en) 2010-09-28 2016-08-02 Amazon Technologies, Inc. Latency measurement in resource requests
US9912740B2 (en) 2008-06-30 2018-03-06 Amazon Technologies, Inc. Latency measurement in resource requests
US7925782B2 (en) 2008-06-30 2011-04-12 Amazon Technologies, Inc. Request routing using network computing components
JP2010055296A (ja) * 2008-08-27 2010-03-11 Fujitsu Ltd 負荷分散プログラム及び負荷分散装置
US8316124B1 (en) 2008-09-29 2012-11-20 Amazon Technologies, Inc. Managing network data display
US8051166B1 (en) 2008-09-29 2011-11-01 Amazon Technologies, Inc. Service provider optimization of content management
US7930393B1 (en) 2008-09-29 2011-04-19 Amazon Technologies, Inc. Monitoring domain allocation performance
US7865594B1 (en) 2008-09-29 2011-01-04 Amazon Technologies, Inc. Managing resources consolidation configurations
US8117306B1 (en) 2008-09-29 2012-02-14 Amazon Technologies, Inc. Optimizing content management
US8122124B1 (en) 2008-09-29 2012-02-21 Amazon Technologies, Inc. Monitoring performance and operation of data exchanges
US8286176B1 (en) * 2008-09-29 2012-10-09 Amazon Technologies, Inc. Optimizing resource configurations
US8732309B1 (en) 2008-11-17 2014-05-20 Amazon Technologies, Inc. Request routing utilizing cost information
US8060616B1 (en) 2008-11-17 2011-11-15 Amazon Technologies, Inc. Managing CDN registration by a storage provider
US8073940B1 (en) 2008-11-17 2011-12-06 Amazon Technologies, Inc. Managing content delivery network service providers
US8065417B1 (en) 2008-11-17 2011-11-22 Amazon Technologies, Inc. Service provider registration by a content broker
US8521880B1 (en) 2008-11-17 2013-08-27 Amazon Technologies, Inc. Managing content delivery network service providers
US8122098B1 (en) 2008-11-17 2012-02-21 Amazon Technologies, Inc. Managing content delivery network service providers by a content broker
US7917618B1 (en) 2009-03-24 2011-03-29 Amazon Technologies, Inc. Monitoring web site content
US8688837B1 (en) 2009-03-27 2014-04-01 Amazon Technologies, Inc. Dynamically translating resource identifiers for request routing using popularity information
US8756341B1 (en) 2009-03-27 2014-06-17 Amazon Technologies, Inc. Request routing utilizing popularity information
US8521851B1 (en) 2009-03-27 2013-08-27 Amazon Technologies, Inc. DNS query processing using resource identifiers specifying an application broker
US8412823B1 (en) 2009-03-27 2013-04-02 Amazon Technologies, Inc. Managing tracking information entries in resource cache components
US8782236B1 (en) 2009-06-16 2014-07-15 Amazon Technologies, Inc. Managing resources using resource expiration data
US8397073B1 (en) 2009-09-04 2013-03-12 Amazon Technologies, Inc. Managing secure content in a content delivery network
US8433771B1 (en) 2009-10-02 2013-04-30 Amazon Technologies, Inc. Distribution network with forward resource propagation
US8331370B2 (en) 2009-12-17 2012-12-11 Amazon Technologies, Inc. Distributed routing architecture
US8331371B2 (en) 2009-12-17 2012-12-11 Amazon Technologies, Inc. Distributed routing architecture
US9495338B1 (en) 2010-01-28 2016-11-15 Amazon Technologies, Inc. Content distribution network
US8626970B2 (en) 2010-06-23 2014-01-07 International Business Machines Corporation Controlling access by a configuration to an adapter function
US8615645B2 (en) 2010-06-23 2013-12-24 International Business Machines Corporation Controlling the selectively setting of operational parameters for an adapter
US8549182B2 (en) 2010-06-23 2013-10-01 International Business Machines Corporation Store/store block instructions for communicating with adapters
US8635430B2 (en) 2010-06-23 2014-01-21 International Business Machines Corporation Translation of input/output addresses to memory addresses
US8572635B2 (en) 2010-06-23 2013-10-29 International Business Machines Corporation Converting a message signaled interruption into an I/O adapter event notification
US8566480B2 (en) 2010-06-23 2013-10-22 International Business Machines Corporation Load instruction for communicating with adapters
US8621112B2 (en) 2010-06-23 2013-12-31 International Business Machines Corporation Discovery by operating system of information relating to adapter functions accessible to the operating system
US8468284B2 (en) 2010-06-23 2013-06-18 International Business Machines Corporation Converting a message signaled interruption into an I/O adapter event notification to a guest operating system
US8639858B2 (en) 2010-06-23 2014-01-28 International Business Machines Corporation Resizing address spaces concurrent to accessing the address spaces
US8510599B2 (en) 2010-06-23 2013-08-13 International Business Machines Corporation Managing processing associated with hardware events
US8505032B2 (en) 2010-06-23 2013-08-06 International Business Machines Corporation Operating system notification of actions to be taken responsive to adapter events
US8650337B2 (en) 2010-06-23 2014-02-11 International Business Machines Corporation Runtime determination of translation formats for adapter functions
US8650335B2 (en) * 2010-06-23 2014-02-11 International Business Machines Corporation Measurement facility for adapter functions
US9195623B2 (en) 2010-06-23 2015-11-24 International Business Machines Corporation Multiple address spaces per adapter with address translation
US9342352B2 (en) 2010-06-23 2016-05-17 International Business Machines Corporation Guest access to address spaces of adapter
US8924528B1 (en) 2010-09-28 2014-12-30 Amazon Technologies, Inc. Latency measurement in resource requests
US9003035B1 (en) 2010-09-28 2015-04-07 Amazon Technologies, Inc. Point of presence management in request routing
US9712484B1 (en) 2010-09-28 2017-07-18 Amazon Technologies, Inc. Managing request routing information utilizing client identifiers
US8819283B2 (en) 2010-09-28 2014-08-26 Amazon Technologies, Inc. Request routing in a networked environment
US10958501B1 (en) 2010-09-28 2021-03-23 Amazon Technologies, Inc. Request routing information based on client IP groupings
US8938526B1 (en) 2010-09-28 2015-01-20 Amazon Technologies, Inc. Request routing management based on network components
US8577992B1 (en) 2010-09-28 2013-11-05 Amazon Technologies, Inc. Request routing management based on network components
US8468247B1 (en) 2010-09-28 2013-06-18 Amazon Technologies, Inc. Point of presence management in request routing
US10097398B1 (en) 2010-09-28 2018-10-09 Amazon Technologies, Inc. Point of presence management in request routing
US8930513B1 (en) 2010-09-28 2015-01-06 Amazon Technologies, Inc. Latency measurement in resource requests
US8452874B2 (en) 2010-11-22 2013-05-28 Amazon Technologies, Inc. Request routing processing
TW201222274A (en) * 2010-11-30 2012-06-01 Inventec Corp Computer chassis system
US8626950B1 (en) 2010-12-03 2014-01-07 Amazon Technologies, Inc. Request routing processing
US9391949B1 (en) 2010-12-03 2016-07-12 Amazon Technologies, Inc. Request routing processing
CN102486746A (zh) * 2010-12-03 2012-06-06 鸿富锦精密工业(深圳)有限公司 服务器及其检测pci***错误的方法
US10467042B1 (en) 2011-04-27 2019-11-05 Amazon Technologies, Inc. Optimized deployment based upon customer locality
CN103095740A (zh) * 2011-10-27 2013-05-08 英业达科技有限公司 节点沟通方法
US8650281B1 (en) 2012-02-01 2014-02-11 Symantec Corporation Intelligent arbitration servers for network partition arbitration
US8904009B1 (en) 2012-02-10 2014-12-02 Amazon Technologies, Inc. Dynamic content delivery
US10021179B1 (en) 2012-02-21 2018-07-10 Amazon Technologies, Inc. Local resource delivery network
US9172674B1 (en) 2012-03-21 2015-10-27 Amazon Technologies, Inc. Managing request routing information utilizing performance information
US10623408B1 (en) 2012-04-02 2020-04-14 Amazon Technologies, Inc. Context sensitive object management
US9154551B1 (en) 2012-06-11 2015-10-06 Amazon Technologies, Inc. Processing DNS queries to identify pre-processing information
US9525659B1 (en) 2012-09-04 2016-12-20 Amazon Technologies, Inc. Request routing utilizing point of presence load information
US9323577B2 (en) 2012-09-20 2016-04-26 Amazon Technologies, Inc. Automated profiling of resource usage
US9135048B2 (en) 2012-09-20 2015-09-15 Amazon Technologies, Inc. Automated profiling of resource usage
US10205698B1 (en) 2012-12-19 2019-02-12 Amazon Technologies, Inc. Source-dependent address resolution
JP5660149B2 (ja) 2013-03-04 2015-01-28 日本電気株式会社 情報処理装置、ジョブスケジューリング方法およびジョブスケジューリングプログラム
US9294391B1 (en) 2013-06-04 2016-03-22 Amazon Technologies, Inc. Managing network computing components utilizing request routing
CN104199739B (zh) * 2014-08-26 2018-09-25 浪潮(北京)电子信息产业有限公司 一种基于负载均衡的推测式Hadoop调度方法
US10027739B1 (en) 2014-12-16 2018-07-17 Amazon Technologies, Inc. Performance-based content delivery
US9769248B1 (en) 2014-12-16 2017-09-19 Amazon Technologies, Inc. Performance-based content delivery
US10097448B1 (en) 2014-12-18 2018-10-09 Amazon Technologies, Inc. Routing mode and point-of-presence selection service
US10033627B1 (en) 2014-12-18 2018-07-24 Amazon Technologies, Inc. Routing mode and point-of-presence selection service
US10091096B1 (en) 2014-12-18 2018-10-02 Amazon Technologies, Inc. Routing mode and point-of-presence selection service
US10225365B1 (en) 2014-12-19 2019-03-05 Amazon Technologies, Inc. Machine learning based content delivery
US10311372B1 (en) 2014-12-19 2019-06-04 Amazon Technologies, Inc. Machine learning based content delivery
US10311371B1 (en) 2014-12-19 2019-06-04 Amazon Technologies, Inc. Machine learning based content delivery
JP6428309B2 (ja) * 2015-01-27 2018-11-28 富士通株式会社 演算処理システムおよび演算処理システムの制御方法
US10225326B1 (en) 2015-03-23 2019-03-05 Amazon Technologies, Inc. Point of presence based data uploading
US9887932B1 (en) 2015-03-30 2018-02-06 Amazon Technologies, Inc. Traffic surge management for points of presence
US9819567B1 (en) 2015-03-30 2017-11-14 Amazon Technologies, Inc. Traffic surge management for points of presence
US9887931B1 (en) 2015-03-30 2018-02-06 Amazon Technologies, Inc. Traffic surge management for points of presence
US9832141B1 (en) 2015-05-13 2017-11-28 Amazon Technologies, Inc. Routing based request correlation
US10616179B1 (en) 2015-06-25 2020-04-07 Amazon Technologies, Inc. Selective routing of domain name system (DNS) requests
US10097566B1 (en) 2015-07-31 2018-10-09 Amazon Technologies, Inc. Identifying targets of network attacks
US9742795B1 (en) 2015-09-24 2017-08-22 Amazon Technologies, Inc. Mitigating network attacks
US9774619B1 (en) 2015-09-24 2017-09-26 Amazon Technologies, Inc. Mitigating network attacks
US9794281B1 (en) 2015-09-24 2017-10-17 Amazon Technologies, Inc. Identifying sources of network attacks
US10270878B1 (en) 2015-11-10 2019-04-23 Amazon Technologies, Inc. Routing for origin-facing points of presence
US10049051B1 (en) 2015-12-11 2018-08-14 Amazon Technologies, Inc. Reserved cache space in content delivery networks
US10257307B1 (en) 2015-12-11 2019-04-09 Amazon Technologies, Inc. Reserved cache space in content delivery networks
US10348639B2 (en) 2015-12-18 2019-07-09 Amazon Technologies, Inc. Use of virtual endpoints to improve data transmission rates
US10075551B1 (en) 2016-06-06 2018-09-11 Amazon Technologies, Inc. Request management for hierarchical cache
US10110694B1 (en) 2016-06-29 2018-10-23 Amazon Technologies, Inc. Adaptive transfer rate for retrieving content from a server
US9992086B1 (en) 2016-08-23 2018-06-05 Amazon Technologies, Inc. External health checking of virtual private cloud network environments
US10033691B1 (en) 2016-08-24 2018-07-24 Amazon Technologies, Inc. Adaptive resolution of domain name requests in virtual private cloud network environments
US10505961B2 (en) 2016-10-05 2019-12-10 Amazon Technologies, Inc. Digitally signed network address
US10831549B1 (en) 2016-12-27 2020-11-10 Amazon Technologies, Inc. Multi-region request-driven code execution system
US10372499B1 (en) 2016-12-27 2019-08-06 Amazon Technologies, Inc. Efficient region selection system for executing request-driven code
US10938884B1 (en) 2017-01-30 2021-03-02 Amazon Technologies, Inc. Origin server cloaking using virtual private cloud network environments
US10503613B1 (en) 2017-04-21 2019-12-10 Amazon Technologies, Inc. Efficient serving of resources during server unavailability
US11075987B1 (en) 2017-06-12 2021-07-27 Amazon Technologies, Inc. Load estimating content delivery network
US10447648B2 (en) 2017-06-19 2019-10-15 Amazon Technologies, Inc. Assignment of a POP to a DNS resolver based on volume of communications over a link between client devices and the POP
US10742593B1 (en) 2017-09-25 2020-08-11 Amazon Technologies, Inc. Hybrid content request routing system
US10592578B1 (en) 2018-03-07 2020-03-17 Amazon Technologies, Inc. Predictive content push-enabled content delivery network
US10862852B1 (en) 2018-11-16 2020-12-08 Amazon Technologies, Inc. Resolution of domain name requests in heterogeneous network environments
US11025747B1 (en) 2018-12-12 2021-06-01 Amazon Technologies, Inc. Content request pattern-based routing system
CN110417674B (zh) * 2019-07-26 2022-06-21 新华三技术有限公司合肥分公司 一种数据流量分担方法及装置
CN111782422B (zh) * 2020-06-30 2023-08-15 百度在线网络技术(北京)有限公司 分布式消息处理方法、装置、电子设备及存储介质
CN112615909B (zh) * 2020-12-10 2022-12-16 安徽鸿程光电有限公司 在级联存储服务器集群中存储数据的方法及相关设备

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3628847B2 (ja) 1997-08-18 2005-03-16 株式会社日立製作所 バス切り換え装置、コンピュータ、および情報処理装置
JPH0589064A (ja) 1991-09-25 1993-04-09 Nec Corp コンピユータシステムにおける装置制御部の負荷分散方式
JPH07250085A (ja) 1994-03-10 1995-09-26 Fujitsu Ltd データ通信装置におけるバスの負荷分散方法及びデータ通信装置用バス切替制御装置
JPH0916534A (ja) 1995-06-30 1997-01-17 N Ii C Joho Syst:Kk 分散型プロセス処理方法およびその装置
US6078990A (en) * 1998-02-06 2000-06-20 Ncr Corporation Volume set configuration using a single operational view
US5948090A (en) * 1998-06-05 1999-09-07 Compaq Computer Corporation Method and apparatus for controlling reset of component boards in a computer system
US6330656B1 (en) * 1999-03-31 2001-12-11 International Business Machines Corporation PCI slot control apparatus with dynamic configuration for partitioned systems
JP2002163241A (ja) 2000-11-29 2002-06-07 Ntt Data Corp クライアントサーバシステム
JP4214682B2 (ja) * 2001-01-24 2009-01-28 株式会社日立製作所 計算機およびその入出力手段
JP3749835B2 (ja) * 2001-03-01 2006-03-01 株式会社日立製作所 情報処理装置
JP2003316522A (ja) * 2002-04-26 2003-11-07 Hitachi Ltd 計算機システムおよび計算機システムの制御方法
US7275103B1 (en) * 2002-12-18 2007-09-25 Veritas Operating Corporation Storage path optimization for SANs
JP4241921B2 (ja) * 2004-06-10 2009-03-18 株式会社日立製作所 計算機システム及びその資源割当て方法
JP5068023B2 (ja) * 2006-03-29 2012-11-07 株式会社日立製作所 計算機システム及び論理パス切替方法

Also Published As

Publication number Publication date
US20070286184A1 (en) 2007-12-13
US7623460B2 (en) 2009-11-24
JP2007310710A (ja) 2007-11-29

Similar Documents

Publication Publication Date Title
JP4961833B2 (ja) クラスタシステム、負荷分散方法、最適化クライアントプログラム、及び調停サーバプログラム
JP4920391B2 (ja) 計算機システムの管理方法、管理サーバ、計算機システム及びプログラム
KR101781063B1 (ko) 동적 자원 관리를 위한 2단계 자원 관리 방법 및 장치
US8782657B2 (en) Dynamic creation and destruction of IO resources based on actual load and resource availability
JP6186787B2 (ja) データ転送装置、データ転送システム、データ転送方法及びプログラム
US8270295B2 (en) Reassigning virtual lane buffer allocation during initialization to maximize IO performance
JP2001331333A (ja) 計算機システム及び計算機システムの制御方法
JP2006048680A (ja) 複数のインスタンスアプリケーションに対し負荷分散装置を動作させるシステムおよび方法
US8381220B2 (en) Job scheduling and distribution on a partitioned compute tree based on job priority and network utilization
JPWO2010050041A1 (ja) 計算機システム
US20200042608A1 (en) Distributed file system load balancing based on available node capacity
US11329890B2 (en) Network-aware workload management using artificial intelligence and exploitation of asymmetric link for allocating network resources
CN1979423A (zh) 多处理器负载分配调整方法
JP4834622B2 (ja) ビジネスプロセス運用管理システム、方法、プロセス運用管理装置およびそのプログラム
KR20130052599A (ko) 가상 데이터 센터 시스템
KR100704300B1 (ko) 네트워크에 배치된 서버 공유시스템 및 그 운영방법
US11435812B1 (en) Efficient utilization of spare datacenter capacity
JP2016167213A (ja) ブレード装置およびブレード装置管理方法
US20100083034A1 (en) Information processing apparatus and configuration control method
JP2009003537A (ja) 計算機
JP2010231601A (ja) グリッドコンピューティングシステム、リソース制御方法およびリソース制御プログラム
JPH0434640A (ja) 計算サーバホスト選択方式
JP4567586B2 (ja) 処理装置
JP5445561B2 (ja) 情報処理システムおよび情報処理方法
JP6127039B2 (ja) クラスタシステムにおけるクラスタ処理の方法及び装置、及びシステム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090415

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100913

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110127

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110921

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111115

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111216

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120213

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120228

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120312

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150406

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees