JP4809209B2 - サーバ仮想化環境における系切り替え方法及び計算機システム - Google Patents
サーバ仮想化環境における系切り替え方法及び計算機システム Download PDFInfo
- Publication number
- JP4809209B2 JP4809209B2 JP2006356576A JP2006356576A JP4809209B2 JP 4809209 B2 JP4809209 B2 JP 4809209B2 JP 2006356576 A JP2006356576 A JP 2006356576A JP 2006356576 A JP2006356576 A JP 2006356576A JP 4809209 B2 JP4809209 B2 JP 4809209B2
- Authority
- JP
- Japan
- Prior art keywords
- application
- cluster
- guest
- unit
- virtualization
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2048—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant where the redundant components share neither address space nor persistent storage
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0712—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a virtual computing platform, e.g. logically partitioned systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1479—Generic software techniques for error detection or fault masking
- G06F11/1482—Generic software techniques for error detection or fault masking by means of middleware or OS functionality
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1479—Generic software techniques for error detection or fault masking
- G06F11/1482—Generic software techniques for error detection or fault masking by means of middleware or OS functionality
- G06F11/1484—Generic software techniques for error detection or fault masking by means of middleware or OS functionality involving virtual machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2023—Failover techniques
- G06F11/2028—Failover techniques eliminating a faulty processor or activating a spare
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2097—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements maintaining the standby controller/processing unit updated
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0751—Error or fault detection not based on redundancy
- G06F11/0754—Error or fault detection not based on redundancy by exceeding limits
- G06F11/0757—Error or fault detection not based on redundancy by exceeding limits by exceeding a time limit, i.e. time-out, e.g. watchdogs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2201/00—Indexing scheme relating to error detection, to error correction, and to monitoring
- G06F2201/815—Virtual
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Hardware Redundancy (AREA)
Description
「CLUSTERPRO(登録商標)を利用したVMware(登録商標)Rサーバ統合ソリューション」、[online]、日本電気株式会社 発行、[平成18年10月31日検索]、インターネット<URL:http://www.ace.comp.nec.co.jp/CLUSTERPRO/doc/pp_lin/CLUSTERPRO_VMware.pdf>
<第1の実施の形態>
本発明に関する図と説明は、本発明を鮮明に理解するのに適当な要素を示すために簡略化されており、発明を実施するのに支障ない範囲で既知の要素等は省略していることを理解されたい。本技術中で従来技術の中には、本発明を実装するために他の要素が望ましく、かつ/または、必要とされると思われるものが幾つかある。しかし、技術中のこれらの要素は既知であり、本発明の理解を容易にするものではないので、ここでは説明しない。
また、以下の説明では、各プログラムは実行系(または現用系)のモジュール番号で説明している場合もあるが、それらの説明は、待機系の対応したプログラムの説明も兼ねる場合もある。さらに、以降の図に示す符号において、他の図中の数字と同様の番号を用いているものがあるが、それらについては特に説明がない場合、他の図の説明と同様である。
図10は、第2の実施形態を示すフローチャートで、前記第1の実施の形態の図9の一部を変更したものである。その他の構成は前記第1実施形態と同様である。
図11から図15は、第3の実施の形態を示す。図11は、本発明の第3の実施形態を表した物理計算機Aの機能ブロック図である。
図16は第4の実施形態を示し、前記第3の実施形態の図14の一部を変更したものである。その他の構成は前記第3実施形態と同様である。
図17〜図19は、第5の実施の形態を示し、前記第3の実施形態の図11、図14、図15に代わって実行する処理である。
図20から図23は、第6の実施形態を示し、ゲストOSを実行するCPUの割り当てを管理するCPUスケジューラ部514とCPU割付表515を設け、前記第5の実施形態の図18に示す処理を図23に置き換えたものである。
図24から図28は、第7の実施形態を示し、前記第6実施形態のゲストOSを実行するCPUの割り当てを管理するCPUスケジューラ部514とCPU割付表516を、前記第1の実施形態に適用し、さらに前記第1実施形態の図9に示す処理を図27に置き換えたものである。
120 スレーブクラスタプログラム
121 アプリケーション状態通知部
122 アプリケーション監視部
123 系切り替え制御部
130 ゲストOS
510 サーバ仮想化プログラム
511 ゲストOS制御部
512 ゲストOS監視部
520 マスタクラスタプログラム
530 ホストOS
522 系切り替え制御部
524 ホストOS監視部
Claims (15)
- 少なくとも1つ以上の物理計算機で稼動する第1の仮想化部と第2の仮想化部と、
前記第1の仮想化部で稼動するゲストOSと、当該ゲストOS上で稼動するアプリケーションからなる第1の系と、
前記第2の仮想化部で稼動するゲストOSと、当該ゲストOS上で稼動するアプリケーションからなる第2の系と、
前記第2の仮想化部でゲストOSとアプリケーションを起動可能な第3の系と、を備え、
前記各ゲストOS上で稼動して当該ゲストOS上のアプリケーションを監視し、障害発生時には前記アプリケーションを第1の系と第2の系の間で切り替える第1のクラスタ処理を実行する第1のクラスタ管理部と、
前記各仮想化部上で稼動して、当該仮想化部上で稼動するゲストOSと他の仮想化部を監視し、障害発生時には前記第1の系のゲストOS及びアプリケーションを第3の系へ移動し、前記ゲストOS及びアプリケーションを起動することで第1の系と第3の系の間で切り替える第2のクラスタ処理を第2のクラスタ管理部が実行して、前記第1の系と第2の系または第3の系の間でゲストOSまたはアプリケーションを切り替えるクラスタシステムの系切り替え方法であって、
前記第2のクラスタ処理が、前記第1の系のゲストOSまたは第1の仮想化部を監視して障害を検出するステップと、
前記第2のクラスタ処理が、前記障害を検出したときには、前記障害を検出したゲストOS上の第1のクラスタ処理を判定するステップと、
前記第2のクラスタ処理が、前記判定した第1のクラスタ処理に対して系切り替えを指令するステップと
前記第1のクラスタ処理が、前記ゲストOS上のアプリケーションの障害を監視するステップと、
前記第1のクラスタ処理が、前記アプリケーションの障害を検出したときには、第1の系と第2の系との間で当該アプリケーションを切り替えるステップと、
前記第1のクラスタ処理が、前記第2のクラスタ処理から前記系切り替え指令を取得したときには、前記第1の系と第2の系の間で当該アプリケーション及びゲストOSを切り替えるステップと、
を含むことを特徴とするクラスタシステムの系切り替え方法。 - 前記第1のクラスタ処理が、前記ゲストOS上のアプリケーションの障害を監視するステップは、
第1の系の第1のクラスタ処理が、当該第1のクラスタ処理を実行するゲストOS上のアプリケーションの情報を取得するステップと、
前記第1の系の第1のクラスタ処理が、前記取得したアプリケーションの情報を前記第1の仮想化部の前記第2のクラスタ処理へ通知するステップと、を含み、
第2のクラスタ処理が、前記第1のクラスタ処理からのアプリケーションの情報を取得するステップと、
前記第1の仮想化部の第2のクラスタ処理が、前記各ゲストOS上の第1のクラスタ処理からそれぞれ受信したアプリケーションの情報を一括して第2の仮想化部の第2のクラスタ処理へ通知するステップと、
前記第2の仮想化部の第2のクラスタ処理が、前記第1の系から受信したアプリケーションの情報を、当該アプリケーションに対応するゲストOS上の第1のクラスタ処理へ通知するステップと、を含み、
第2の系の第1のクラスタ処理が、前記第2の系の前記第2のクラスタ処理から取得した第1の系のアプリケーションの情報に基づいて、前記アプリケーションの障害を監視することを特徴とする請求項1に記載のクラスタシステムの系切り替え方法。 - 前記アプリケーションの情報は、アプリケーションの稼動情報を含み、
前記第1の系の第1のクラスタ処理が、前記取得したアプリケーションの情報を前記第2のクラスタ処理へ通知するステップは、
前記アプリケーションの稼動情報を前記第2のクラスタ処理へ通知することを特徴とする請求項2に記載のクラスタシステムの系切り替え方法。 - 少なくとも1つ以上の物理計算機で稼動する第1の仮想化部と第2の仮想化部と、
前記第1の仮想化部で稼動するゲストOSと、当該ゲストOS上で稼動するアプリケーションからなる第1の系と、
前記第2の仮想化部で稼動するゲストOSと、当該ゲストOS上で稼動するアプリケーションからなる第2の系と、
前記第2の仮想化部で任意のゲストOSとアプリケーションを起動可能な第3の系と、を備え、
前記各ゲストOS上で稼動して当該ゲストOS上のアプリケーションを監視し、障害発生時には前記アプリケーションを第1の系と第2の系の間で切り替える第1のクラスタ処理を実行する第1のクラスタ管理部と、
前記各仮想化部上で稼動して、当該仮想化部上で稼動するゲストOSと他の仮想化部を監視し、障害発生時には前記第1の系のゲストOS及びアプリケーションを第3の系へ移動し、前記ゲストOS及びアプリケーションを起動することで第1の系と第3の系の間で切り替える第2のクラスタ処理を第2のクラスタ管理部が実行して、前記第1の系と第2の系または第3の系の間でゲストOSまたはアプリケーションを切り替えるクラスタシステムの系切り替え方法であって、
前記第1のクラスタ処理が、当該第1のクラスタ処理を実行するゲストOS上のアプリケーションの情報を取得するステップと、
前記第1の系の第1のクラスタ処理が、前記取得したアプリケーションの情報を前記第2のクラスタ処理へ通知するステップと、
前記第1の仮想化部の第2のクラスタ処理が、前記第1のクラスタ処理から前記アプリケーションの情報を取得するステップと、
前記第1の仮想化部の第2のクラスタ処理が、前記各ゲストOS上の第1のクラスタ処理からそれぞれ取得したアプリケーションの情報を集約するステップと、
前記第1の仮想化部の前記第2のクラスタ処理が、前記集約したアプリケーションの情報を、一括して第2の仮想化部の第2のクラスタ処理へ通知するステップと、
前記第2の仮想化部の第2のクラスタ処理が、前記アプリケーションの情報をハートビートとして取得し、当該アプリケーションに対応する第2の系のゲストOS上の第1のクラスタ処理へ転送するステップと、
前記第2の系の第1のクラスタ処理が、前記第2のクラスタ処理から転送された前記アプリケーションの情報に基づいて、前記第1の系のアプリケーションの障害を監視し、障害を検知したときには前記アプリケーションを第1の系から第2の系へ切り替えるステップと、
を含むことを特徴とするクラスタシステムの系切り替え方法。 - 前記アプリケーションの情報は、アプリケーションの稼動情報を含み、
第1の系の第1のクラスタ処理が、前記取得したアプリケーションの情報を前記第2のクラスタ処理へ通知するステップは、前記アプリケーションの稼動情報を前記第2のクラスタ処理へ通知することを特徴とする請求項4に記載のクラスタシステムの系切り替え方法。 - 前記第1の仮想化部の第2のクラスタ処理が、前記集約したアプリケーションの情報を、一括して第2の仮想化部の第2のクラスタ処理へ通知するステップは、
前記第1の仮想化部の第2のクラスタ処理が、第1の系のゲストOSの状態を取得するステップと、
前記取得したゲストOSの状態と、前記取得したアプリケーションの障害状態とを一括して前記第2の仮想化部の第2のクラスタ処理へ通知するステップと、
を含むことを特徴とする請求項4に記載のクラスタシステムの系切り替え方法。 - 少なくとも1つ以上の物理計算機で稼動する第1の仮想化部と第2の仮想化部と、
前記第1の仮想化部で稼動するゲストOSと、当該ゲストOS上で稼動するアプリケーションからなる第1の系と、
前記第2の仮想化部で稼動するゲストOSと、当該ゲストOS上で稼動するアプリケーションからなる第2の系と、
前記第2の仮想化部で任意のゲストOSとアプリケーションを起動可能な第3の系と、を備え、
前記各ゲストOS上で稼動して当該ゲストOS上のアプリケーションを監視し、障害発生時には前記アプリケーションを第1の系と第2の系の間で切り替える第1のクラスタ処理を実行する第1のクラスタ管理部と、
前記各仮想化部上で稼動して、当該仮想化部上で稼動するゲストOSと他の仮想化部を監視し、障害発生時には前記第1の系のゲストOS及びアプリケーションを第3の系へ移動し、前記ゲストOS及びアプリケーションを起動することで第1の系と第3の系の間で切り替える第2のクラスタ処理を第2のクラスタ管理部が実行して、前記第1の系と第2の系または第3の系の間でゲストOSまたはアプリケーションを切り替えるクラスタシステムの系切り替え方法であって、
前記第1の系の第1のクラスタ処理が、当該第1のクラスタ処理を実行するゲストOS上のアプリケーションを監視するステップと、
前記第1の系の第1のクラスタ処理が、前記アプリケーションに障害が発生したときには第1の仮想化部の第2のクラスタ処理に障害の状態を通知するステップと、
前記第1の仮想化部の第2のクラスタ処理が、前記アプリケーションの障害の状態を取得したときにのみ前記第2の仮想化部の第2のクラスタ処理へ当該アプリケーションの障害の状態通知するステップと、
前記第2の仮想化部の第2のクラスタ処理が、前記アプリケーションの障害の状態を取得したときには、前記第2の系の第1のクラスタ処理に系切り替えを指令することを特徴とするクラスタシステムの系切り替え方法。 - 前記第1の仮想化部の第2のクラスタ処理が、前記アプリケーションの障害の状態を取得したときにのみ前記第2の仮想化部の第2のクラスタ処理へ当該アプリケーションの障害の状態を通知するステップは、
前記第1の仮想化部の第2のクラスタ処理が、第1の系のゲストOSの状態を取得するステップと、
前記取得したゲストOSの状態と、前記取得したアプリケーションの障害状態とを一括して前記第2の仮想化部の第2のクラスタ処理へ通知するステップと、
を含むことを特徴とする請求項7に記載のクラスタシステムの系切り替え方法。 - 前記第1の仮想化部の第2のクラスタ処理が、前記アプリケーションの障害の状態を取得したときにのみ前記第2の仮想化部の第2のクラスタ処理へ当該アプリケーションの障害の状態を通知するステップは、
所定の周期で第1の系の仮想化部のハートビートに、前記アプリケーションの障害の状態を加えて、前記第2の仮想化部の第2のクラスタ処理へ通知することを特徴とする請求項7に記載のクラスタシステムの系切り替え方法。 - 前記第2の系の第1のクラスタ処理が、前記アプリケーションを起動して待機させるステップと、
前記第2の系の第1のクラスタ処理が、前記アプリケーションを待機させたことを第2の仮想化部の第2のクラスタ処理へ通知するステップと、
前記第2の仮想化部の第2のクラスタ処理が、前記通知に基づいて前記アプリケーションを待機させたゲストOSへのリソースの割当を低減して待機させるステップと、
前記第2の仮想化部の第2のクラスタ処理が、前記第1の系のアプリケーションの障害の状態を取得したときには、前記待機させたゲストOSへのリソースの割当を増大させた後に、系切り替えを行うことを特徴とする請求項7に記載のクラスタシステムの系切り替え方法。 - 少なくとも1つ以上の物理計算機と、
前記物理計算機で稼動する第1の仮想化部と第2の仮想化部と、
前記第1の仮想化部で稼動するゲストOSと、当該ゲストOS上で稼動するアプリケーションからなる第1の系と、
前記第2の仮想化部で稼動するゲストOSと、当該ゲストOS上で稼動するアプリケーションからなる第2の系と、
前記第2の仮想化部で任意のゲストOSとアプリケーションを起動可能な第3の系と、
前記第1の系のアプリケーションまたは第2の系のアプリケーションを監視して、障害発生時に前記アプリケーションを第1の系と第2の系の間で切り替える第1のクラスタ管理部と、
前記第1の系のゲストOSと第1の仮想化部を監視して、障害発生時に前記ゲストOSを第1の系と第3の系の間で切り替える第2のクラスタ管理部と、
を備えた計算機システムにおいて、
前記第1のクラスタ管理部は、
前記ゲストOS上のアプリケーションの情報を取得するアプリケーション監視部と、
前記取得したアプリケーションの情報を前記第2のクラスタ管理部へ通知するアプリケーション状態通知部と、
前記アプリケーションの情報に障害情報が含まれるときには、前記アプリケーションを第1の系と第2の系との間で切り替える系切り替え制御部と、を備え、
前記第2のクラスタ管理部は、
前記第1のクラスタ管理部から受信したアプリケーションの情報を、他の仮想化部の第2のクラスタ管理部へ通知し、または、他の系から受信したアプリケーションの情報を前記第1のクラスタ管理部へ転送する通信部と、を備え、
第2の系の第1のクラスタ管理部が、前記第2の仮想化部の前記第2のクラスタ管理部から取得した第1の系のアプリケーションの情報に基づいて、前記アプリケーションの障害を監視することを特徴とする計算機システム。 - 前記第1のクラスタ管理部は、前記第1の系と第2の系の各ゲストOS上でそれぞれ稼動し、
前記第2のクラスタ管理部は、前記第1の系と第2の系の各仮想化部でそれぞれ稼動し、
前記第1の系の第1のクラスタ管理部は、前記アプリケーション状態通知部が前記アプリケーションの情報を前記第1の仮想化部の第2のクラスタ管理部へ通知し、
前記第1の仮想化部の第2のクラスタ管理部は、前記通信部が前記アプリケーションの情報を前記第2の仮想化部の第2のクラスタ管理部へ通知し、
前記第2の仮想化部の第2のクラスタ管理部は、前記通信部が第1の仮想化部の第2のクラスタ管理部から前記アプリケーションの情報を受信し、当該情報を前記第2の系の第1のクラスタ管理部へ通知し、
前記第2の系の第1のクラスタ管理部は、
前記アプリケーション監視部が前記第1の系のアプリケーションを監視して、当該アプリケーションに情報に障害情報が含まれる場合には、前記系切り替え制御部が、第1の系のアプリケーションを、第2の系に引き継ぐことを特徴とする請求項11に記載の計算機システム。 - 前記第2のクラスタ管理部は、
前記アプリケーションの情報からアプリケーションを監視し、当該アプリケーションに障害が発生した場合には、前記第1のクラスタ管理部へ系切り替えの指令を通知する系切り替え制御部を有し、
前記第1のクラスタ管理部は、前記第1の系と第2の系の各ゲストOS上でそれぞれ稼動し、
前記第2のクラスタ管理部は、前記第1の系と第2の系の各仮想化部でそれぞれ稼動し、
前記第1の系の第1のクラスタ管理部は、前記アプリケーション状態通知部が前記アプリケーションの情報を前記第1の仮想化部の第2のクラスタ管理部へ通知し、
前記第1の仮想化部の第2のクラスタ管理部は、前記通信部が前記アプリケーションの情報を前記第2の仮想化部の第2のクラスタ管理部へ通知し、
前記第2の仮想化部の第2のクラスタ管理部は、前記通信部が第1の仮想化部の第2のクラスタ管理部から前記アプリケーションの情報を受信し、前記系切り替え制御部が前記アプリケーションの障害情報が含まれる時には前記第2の系の第1のクラスタ管理部に系切り替えの指令を通知し、
前記第2の系の第1のクラスタ管理部は、前記系切り替え制御部が第1の系のアプリケーションを第2の系へ引き継ぐことを特徴とする請求項11に記載の計算機システム。 - 前記第1の系及び第2の系の仮想化部は、複数のゲストOSを稼動させ、
前記各ゲストOS上のアプリケーション毎に前記第1のクラスタ管理部がアプリケーションの情報とゲストOSの情報を前記第2のクラスタ管理部へ通知し、
前記第2のクラスタ管理部の通信部は、第1のクラスタ管理部からのアプリケーションの情報とゲストOSの情報を集約し、当該集約した情報を他の仮想化部の第2のクラスタ管理部へ通知することを特徴とする請求項11に記載の計算機システム。 - 前記第2の系の第1のクラスタ処理が、前記アプリケーションを起動して待機させるステップと、
前記第2の系の第1のクラスタ処理が、前記アプリケーションを待機させたことを第2の仮想化部の第2のクラスタ管理部へ通知するステップと、
前記第2の仮想化部の第2のクラスタ処理が、前記通知に基づいて前記アプリケーションを待機させたゲストOSへのリソースの割当を低減して待機させるステップと、
前記第2の仮想化部の第2のクラスタ処理が、前記第1の系のアプリケーションの障害の状態を取得したときには、前記待機させたゲストOSへのリソースの割当を増大させた後に、系切り替えを行うことを特徴とする請求項4に記載のクラスタシステムの系切り替え方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006356576A JP4809209B2 (ja) | 2006-12-28 | 2006-12-28 | サーバ仮想化環境における系切り替え方法及び計算機システム |
US11/707,876 US7617411B2 (en) | 2006-12-28 | 2007-02-20 | Cluster system and failover method for cluster system |
US12/585,734 US8015431B2 (en) | 2006-12-28 | 2009-09-23 | Cluster system and failover method for cluster system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006356576A JP4809209B2 (ja) | 2006-12-28 | 2006-12-28 | サーバ仮想化環境における系切り替え方法及び計算機システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008165637A JP2008165637A (ja) | 2008-07-17 |
JP4809209B2 true JP4809209B2 (ja) | 2011-11-09 |
Family
ID=39585774
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006356576A Expired - Fee Related JP4809209B2 (ja) | 2006-12-28 | 2006-12-28 | サーバ仮想化環境における系切り替え方法及び計算機システム |
Country Status (2)
Country | Link |
---|---|
US (2) | US7617411B2 (ja) |
JP (1) | JP4809209B2 (ja) |
Families Citing this family (82)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8365021B2 (en) * | 2005-06-17 | 2013-01-29 | Nec Corporation | Information processing device comprising a plurality of domains having a plurality of processors, recovery device, program and recovery method |
US7689820B2 (en) * | 2006-09-27 | 2010-03-30 | L3 Communications Corporation | Rapid-boot computing device with dual operating systems |
JP2008123357A (ja) * | 2006-11-14 | 2008-05-29 | Honda Motor Co Ltd | 並列計算機システム、並列計算方法および並列計算機用プログラム |
US8776041B2 (en) * | 2007-02-05 | 2014-07-08 | Microsoft Corporation | Updating a virtual machine monitor from a guest partition |
JP4782042B2 (ja) * | 2007-02-21 | 2011-09-28 | 富士通株式会社 | 電子計算機及びソフトウェアによるユーザインタフェースの実現方法 |
US8209417B2 (en) * | 2007-03-08 | 2012-06-26 | Oracle International Corporation | Dynamic resource profiles for clusterware-managed resources |
US8682916B2 (en) | 2007-05-25 | 2014-03-25 | F5 Networks, Inc. | Remote file virtualization in a switched file system |
JP2010541100A (ja) * | 2007-10-03 | 2010-12-24 | スケールアウト ソフトウェア インコーポレイテッド | 計算グリッド上に高可用性データ並列操作を実装する方法 |
US8548953B2 (en) | 2007-11-12 | 2013-10-01 | F5 Networks, Inc. | File deduplication using storage tiers |
US8370679B1 (en) * | 2008-06-30 | 2013-02-05 | Symantec Corporation | Method, apparatus and system for improving failover within a high availability disaster recovery environment |
US8549582B1 (en) | 2008-07-11 | 2013-10-01 | F5 Networks, Inc. | Methods for handling a multi-protocol content name and systems thereof |
JP2010066931A (ja) * | 2008-09-09 | 2010-03-25 | Fujitsu Ltd | 負荷分散機能を有した情報処理装置 |
US8732716B2 (en) * | 2008-09-30 | 2014-05-20 | International Business Machines Corporation | Virtualization across physical partitions of a multi-core processor (MCP) |
JP5223707B2 (ja) * | 2009-02-05 | 2013-06-26 | 富士通株式会社 | ソフトウェア更新指示プログラム、ソフトウェア更新指示方法、および情報処理装置 |
US8549364B2 (en) * | 2009-02-18 | 2013-10-01 | Vmware, Inc. | Failure detection and recovery of host computers in a cluster |
US8719823B2 (en) * | 2009-03-04 | 2014-05-06 | Vmware, Inc. | Managing latency introduced by virtualization |
JP2010205209A (ja) * | 2009-03-06 | 2010-09-16 | Hitachi Ltd | 管理計算機、計算機システム、物理リソース割り当て方法 |
US9372711B2 (en) | 2009-07-20 | 2016-06-21 | Google Technology Holdings LLC | System and method for initiating a multi-environment operating system |
US9367331B2 (en) | 2009-07-20 | 2016-06-14 | Google Technology Holdings LLC | Multi-environment operating system |
US9348633B2 (en) | 2009-07-20 | 2016-05-24 | Google Technology Holdings LLC | Multi-environment operating system |
US9389877B2 (en) | 2009-07-20 | 2016-07-12 | Google Technology Holdings LLC | Multi-environment operating system |
US8397088B1 (en) | 2009-07-21 | 2013-03-12 | The Research Foundation Of State University Of New York | Apparatus and method for efficient estimation of the energy dissipation of processor based systems |
US8700752B2 (en) * | 2009-11-03 | 2014-04-15 | International Business Machines Corporation | Optimized efficient LPAR capacity consolidation |
US9274851B2 (en) * | 2009-11-25 | 2016-03-01 | Brocade Communications Systems, Inc. | Core-trunking across cores on physically separated processors allocated to a virtual machine based on configuration information including context information for virtual machines |
US9195500B1 (en) | 2010-02-09 | 2015-11-24 | F5 Networks, Inc. | Methods for seamless storage importing and devices thereof |
US8769155B2 (en) | 2010-03-19 | 2014-07-01 | Brocade Communications Systems, Inc. | Techniques for synchronizing application object instances |
US8406125B2 (en) * | 2010-03-19 | 2013-03-26 | Brocade Communications Systems, Inc. | Synchronization of multicast information using incremental updates |
US9104619B2 (en) | 2010-07-23 | 2015-08-11 | Brocade Communications Systems, Inc. | Persisting data across warm boots |
US8495418B2 (en) | 2010-07-23 | 2013-07-23 | Brocade Communications Systems, Inc. | Achieving ultra-high availability using a single CPU |
US8458510B2 (en) * | 2010-08-12 | 2013-06-04 | International Business Machines Corporation | LPAR creation and repair for automated error recovery |
JP5354107B2 (ja) * | 2010-08-16 | 2013-11-27 | 富士通株式会社 | 情報処理装置、リモート保守方法、及びプログラム |
US9286298B1 (en) * | 2010-10-14 | 2016-03-15 | F5 Networks, Inc. | Methods for enhancing management of backup data sets and devices thereof |
JP2012093868A (ja) * | 2010-10-26 | 2012-05-17 | Nec Corp | サービス提供システム、サービス提供サーバ、サービス提供方法、及びプログラム |
US8782238B2 (en) | 2010-11-05 | 2014-07-15 | Verizon Patent And Licensing Inc. | Server clustering in a computing-on-demand system |
US8589721B2 (en) * | 2010-11-30 | 2013-11-19 | International Business Machines Corporation | Balancing power consumption and high availability in an information technology system |
US8468383B2 (en) | 2010-12-08 | 2013-06-18 | International Business Machines Corporation | Reduced power failover system |
JP2012216008A (ja) * | 2011-03-31 | 2012-11-08 | Nec Corp | 仮想計算機装置及び仮想計算機装置の制御方法 |
US8887006B2 (en) * | 2011-04-04 | 2014-11-11 | Microsoft Corporation | Proactive failure handling in database services |
JP5548647B2 (ja) * | 2011-04-25 | 2014-07-16 | 株式会社日立製作所 | 計算機システムでの部分障害処理方法 |
US9354900B2 (en) | 2011-04-28 | 2016-05-31 | Google Technology Holdings LLC | Method and apparatus for presenting a window in a system having two operating system environments |
US20120278747A1 (en) * | 2011-04-28 | 2012-11-01 | Motorola Mobility, Inc. | Method and apparatus for user interface in a system having two operating system environments |
US8713378B2 (en) * | 2011-07-07 | 2014-04-29 | Microsoft Corporation | Health monitoring of applications in a guest partition |
US9143335B2 (en) | 2011-09-16 | 2015-09-22 | Brocade Communications Systems, Inc. | Multicast route cache system |
KR101336389B1 (ko) * | 2011-10-05 | 2013-12-04 | 한국원자력연구원 | 다중 스위칭 컨트롤러를 이용한 동기식 이중화 시스템 및 방법 |
JP5687173B2 (ja) * | 2011-11-15 | 2015-03-18 | 株式会社日立製作所 | 通信システム及び方法、ハートビート代行サーバ |
WO2013084305A1 (ja) * | 2011-12-06 | 2013-06-13 | 株式会社日立製作所 | 仮想化多重系構成制御方法及び計算機システム |
US9342348B2 (en) * | 2012-01-23 | 2016-05-17 | Brocade Communications Systems, Inc. | Transparent high availability for stateful services |
US9020912B1 (en) | 2012-02-20 | 2015-04-28 | F5 Networks, Inc. | Methods for accessing data in a compressed file system and devices thereof |
US20130275966A1 (en) | 2012-04-12 | 2013-10-17 | International Business Machines Corporation | Providing application based monitoring and recovery for a hypervisor of an ha cluster |
US20130293573A1 (en) | 2012-05-02 | 2013-11-07 | Motorola Mobility, Inc. | Method and Apparatus for Displaying Active Operating System Environment Data with a Plurality of Concurrent Operating System Environments |
US9342325B2 (en) | 2012-05-17 | 2016-05-17 | Google Technology Holdings LLC | Synchronizing launch-configuration information between first and second application environments that are operable on a multi-modal device |
US9342376B2 (en) * | 2012-06-27 | 2016-05-17 | Intel Corporation | Method, system, and device for dynamic energy efficient job scheduling in a cloud computing environment |
JP5913003B2 (ja) * | 2012-08-29 | 2016-04-27 | 株式会社日立製作所 | 計算機制御装置、方法およびプログラム |
US10581763B2 (en) | 2012-09-21 | 2020-03-03 | Avago Technologies International Sales Pte. Limited | High availability application messaging layer |
US9203690B2 (en) | 2012-09-24 | 2015-12-01 | Brocade Communications Systems, Inc. | Role based multicast messaging infrastructure |
US9519501B1 (en) | 2012-09-30 | 2016-12-13 | F5 Networks, Inc. | Hardware assisted flow acceleration and L2 SMAC management in a heterogeneous distributed multi-tenant virtualized clustered system |
US10375155B1 (en) | 2013-02-19 | 2019-08-06 | F5 Networks, Inc. | System and method for achieving hardware acceleration for asymmetric flow connections |
US9554418B1 (en) | 2013-02-28 | 2017-01-24 | F5 Networks, Inc. | Device for topology hiding of a visited network |
US9244826B2 (en) * | 2013-03-15 | 2016-01-26 | International Business Machines Corporation | Managing CPU resources for high availability micro-partitions |
US9043575B2 (en) | 2013-03-15 | 2015-05-26 | International Business Machines Corporation | Managing CPU resources for high availability micro-partitions |
US9189381B2 (en) | 2013-03-15 | 2015-11-17 | International Business Machines Corporation | Managing CPU resources for high availability micro-partitions |
US9727357B2 (en) * | 2013-10-01 | 2017-08-08 | International Business Machines Corporation | Failover detection and treatment in checkpoint systems |
US9262289B2 (en) * | 2013-10-11 | 2016-02-16 | Hitachi, Ltd. | Storage apparatus and failover method |
CN103559124B (zh) * | 2013-10-24 | 2017-04-12 | 华为技术有限公司 | 故障快速检测方法及装置 |
US9619349B2 (en) | 2014-10-14 | 2017-04-11 | Brocade Communications Systems, Inc. | Biasing active-standby determination |
GB2532732B (en) * | 2014-11-25 | 2019-06-26 | Ibm | Integrating a communication bridge into a data procesing system |
US10061664B2 (en) * | 2015-01-15 | 2018-08-28 | Cisco Technology, Inc. | High availability and failover |
JP6299640B2 (ja) * | 2015-03-23 | 2018-03-28 | 横河電機株式会社 | 通信装置 |
US10834065B1 (en) | 2015-03-31 | 2020-11-10 | F5 Networks, Inc. | Methods for SSL protected NTLM re-authentication and devices thereof |
US10404698B1 (en) | 2016-01-15 | 2019-09-03 | F5 Networks, Inc. | Methods for adaptive organization of web application access points in webtops and devices thereof |
US10282261B2 (en) * | 2016-06-20 | 2019-05-07 | Vmware, Inc. | Pooled memory heartbeat in shared memory architecture |
US10412198B1 (en) | 2016-10-27 | 2019-09-10 | F5 Networks, Inc. | Methods for improved transmission control protocol (TCP) performance visibility and devices thereof |
JP2018116477A (ja) * | 2017-01-18 | 2018-07-26 | 富士通株式会社 | 情報処理装置および情報処理システム |
US10567492B1 (en) | 2017-05-11 | 2020-02-18 | F5 Networks, Inc. | Methods for load balancing in a federated identity environment and devices thereof |
JP7056868B2 (ja) * | 2017-12-19 | 2022-04-19 | 日本電気通信システム株式会社 | システム、計算機、システム制御方法及びプログラム |
US11223689B1 (en) | 2018-01-05 | 2022-01-11 | F5 Networks, Inc. | Methods for multipath transmission control protocol (MPTCP) based session migration and devices thereof |
CN108282526B (zh) * | 2018-01-22 | 2021-02-05 | 中国软件与技术服务股份有限公司 | 双集群间服务器动态分配方法及*** |
US10833943B1 (en) | 2018-03-01 | 2020-11-10 | F5 Networks, Inc. | Methods for service chaining and devices thereof |
US12003422B1 (en) | 2018-09-28 | 2024-06-04 | F5, Inc. | Methods for switching network packets based on packet data and devices |
CN111385107B (zh) * | 2018-12-27 | 2021-07-06 | 大唐移动通信设备有限公司 | 一种服务器的主备切换处理方法及装置 |
WO2023276040A1 (ja) * | 2021-06-30 | 2023-01-05 | 三菱電機株式会社 | 情報処理装置、ジョブ実行システム、及び制御方法 |
JP7498731B2 (ja) * | 2022-01-17 | 2024-06-12 | 株式会社日立製作所 | クラスタシステム、復旧方法 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04141744A (ja) * | 1990-10-02 | 1992-05-15 | Fujitsu Ltd | 仮想計算機のホットスタンバイ制御システム |
JP3022768B2 (ja) * | 1996-04-24 | 2000-03-21 | 日本電気ソフトウェア株式会社 | 仮想計算機システム |
JP2001216171A (ja) * | 2000-01-31 | 2001-08-10 | Toshiba Corp | 仮想計算機システム |
US6728896B1 (en) * | 2000-08-31 | 2004-04-27 | Unisys Corporation | Failover method of a simulated operating system in a clustered computing environment |
JP4426736B2 (ja) * | 2001-04-27 | 2010-03-03 | 株式会社日立製作所 | プログラム修正方法およびプログラム |
JP2004005113A (ja) * | 2002-05-31 | 2004-01-08 | Nec System Technologies Ltd | 複数の実計算機上で動作する仮想計算機システム及びその制御方法 |
JP2004361994A (ja) * | 2003-05-30 | 2004-12-24 | Toshiba Corp | データ管理装置、データ管理方法及びプログラム |
US20060085668A1 (en) * | 2004-10-15 | 2006-04-20 | Emc Corporation | Method and apparatus for configuring, monitoring and/or managing resource groups |
US7730486B2 (en) * | 2005-02-28 | 2010-06-01 | Hewlett-Packard Development Company, L.P. | System and method for migrating virtual machines on cluster systems |
JP4544146B2 (ja) * | 2005-11-29 | 2010-09-15 | 株式会社日立製作所 | 障害回復方法 |
JP2007304845A (ja) * | 2006-05-11 | 2007-11-22 | Nec Corp | 仮想計算機システムおよびソフトウェア更新方法 |
US7814364B2 (en) * | 2006-08-31 | 2010-10-12 | Dell Products, Lp | On-demand provisioning of computer resources in physical/virtual cluster environments |
JP5032191B2 (ja) * | 2007-04-20 | 2012-09-26 | 株式会社日立製作所 | サーバ仮想化環境におけるクラスタシステム構成方法及びクラスタシステム |
US7809976B2 (en) * | 2007-04-30 | 2010-10-05 | Netapp, Inc. | System and method for failover of guest operating systems in a virtual machine environment |
US7840839B2 (en) * | 2007-11-06 | 2010-11-23 | Vmware, Inc. | Storage handling for fault tolerance in virtual machines |
US8117495B2 (en) * | 2007-11-26 | 2012-02-14 | Stratus Technologies Bermuda Ltd | Systems and methods of high availability cluster environment failover protection |
-
2006
- 2006-12-28 JP JP2006356576A patent/JP4809209B2/ja not_active Expired - Fee Related
-
2007
- 2007-02-20 US US11/707,876 patent/US7617411B2/en not_active Expired - Fee Related
-
2009
- 2009-09-23 US US12/585,734 patent/US8015431B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20080162983A1 (en) | 2008-07-03 |
US7617411B2 (en) | 2009-11-10 |
US20100017643A1 (en) | 2010-01-21 |
JP2008165637A (ja) | 2008-07-17 |
US8015431B2 (en) | 2011-09-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4809209B2 (ja) | サーバ仮想化環境における系切り替え方法及び計算機システム | |
US10628273B2 (en) | Node system, server apparatus, scaling control method, and program | |
US11947697B2 (en) | Method and system to place resources in a known state to be used in a composed information handling system | |
JP5332000B2 (ja) | 複合型計算機装置、複合型計算機の管理方法及び管理サーバ | |
US9176834B2 (en) | Tolerating failures using concurrency in a cluster | |
US20160226788A1 (en) | Managing use of lease resources allocated on fallover in a high availability computing environment | |
JP2009232207A (ja) | ネットワークスイッチ装置、サーバシステム及びサーバシステムにおけるサーバ移送方法 | |
US8677374B2 (en) | Resource management in a virtualized environment | |
JP2008269332A (ja) | サーバ仮想化環境におけるクラスタシステム構成方法及びクラスタシステム | |
US20080307254A1 (en) | Information-processing equipment and system therefor | |
KR101585160B1 (ko) | 독립실행환경을 제공하는 분산 컴퓨팅 시스템 및 분산 컴퓨팅 시스템의 제어방법 | |
WO2019160030A1 (ja) | サービス提供システム、資源割り当て方法、及び資源割り当てプログラム | |
JP6123626B2 (ja) | 処理再開方法、処理再開プログラムおよび情報処理システム | |
JP2012018556A (ja) | 計算機システム及び計算機システムの系切替制御方法 | |
US20130061086A1 (en) | Fault-tolerant system, server, and fault-tolerating method | |
US10241874B2 (en) | Checkpoint method for a highly available computer system | |
JP2008107966A (ja) | 計算機システム | |
JP5151509B2 (ja) | 仮想マシンシステム及びそれに用いる仮想マシン分散方法 | |
CN111935244A (zh) | 一种业务请求处理***及超融合一体机 | |
KR20160105636A (ko) | 멀티 노드 시스템의 서버 가상화 방법 및 그 장치 | |
CN113608836A (zh) | 一种基于集群的虚拟机高可用方法及*** | |
US20210042322A1 (en) | System and method of time-based snapshot synchronization | |
EP1815333A1 (en) | Migration of tasks in a computing system | |
JP2017027166A (ja) | 運用管理装置、運用管理プログラムおよび情報処理システム | |
JP2003186681A (ja) | マルチコンピュータシステム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20091204 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110502 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110531 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110725 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110809 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110818 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140826 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4809209 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |