JP2020205121A - フォールトトレラントシステム、サーバ、それらの運用方法、及びプログラム - Google Patents

フォールトトレラントシステム、サーバ、それらの運用方法、及びプログラム Download PDF

Info

Publication number
JP2020205121A
JP2020205121A JP2020163124A JP2020163124A JP2020205121A JP 2020205121 A JP2020205121 A JP 2020205121A JP 2020163124 A JP2020163124 A JP 2020163124A JP 2020163124 A JP2020163124 A JP 2020163124A JP 2020205121 A JP2020205121 A JP 2020205121A
Authority
JP
Japan
Prior art keywords
server
storage
synchronization area
virtual
application
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020163124A
Other languages
English (en)
Other versions
JP6954693B2 (ja
Inventor
中村 輝男
Teruo Nakamura
輝男 中村
祐治 今井
Yuji Imai
祐治 今井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Platforms Ltd
Original Assignee
NEC Platforms Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP2019100508A external-priority patent/JP6773345B1/ja
Application filed by NEC Platforms Ltd filed Critical NEC Platforms Ltd
Priority to JP2020163124A priority Critical patent/JP6954693B2/ja
Publication of JP2020205121A publication Critical patent/JP2020205121A/ja
Application granted granted Critical
Publication of JP6954693B2 publication Critical patent/JP6954693B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Hardware Redundancy (AREA)
  • Debugging And Monitoring (AREA)

Abstract

【課題】共有ディスクアレイ装置を不要としつつ、フォールトトレランスを実現可能とする。【解決手段】第1サーバ11及び第2サーバ12は、ディスクイメージ31を記憶するストレージ21のストレージ同期エリアを、仮想アドレスを用いてNFSでマウントする。第1サーバ11は、運用系として稼動した仮想システムのメモリの内容のスナップショットを取得し、第2サーバ12に送信する。また、第1サーバ11は、ストレージ21のストレージ同期エリアの内容をストレージ22のストレージ同期エリアに複製する。第2サーバ12は、第1サーバ11に障害が発生した場合、ストレージ22に仮想アドレスを設定し、その仮想アドレスを用いて、NFSでストレージ22のストレージ同期エリアをマウントする。第2サーバ12は、第1サーバ11から受信したスナップショットを用いて、仮想システム42上でアプリケーション52を実行する。【選択図】図1

Description

本開示は、フォールトトレラントシステム、サーバ、及びそれらの運用方法に関する。
可用性を高めた計算機システムとして、アクティブ/スタンバイ方式のHA(High Availability)クラスタが知られている。HAクラスタは、相互に接続された複数のサーバを有する。複数のサーバは、運用系のサーバと待機系のサーバとを含む。通常時、運用系のサーバは処理を実行しており、運用系のサーバに障害が生じた場合、待機系のサーバが処理の実行を引き継ぐ。このようにすることで、クラスタ全体としては異常なく稼動し続けているように見える。
ここで、仮想化技術を用いたHAクラスタとして、例えば特許文献1に記載のシステムが知られている。特許文献1に記載のシステムは、運用系サーバ、待機系サーバ、管理サーバ、及びディスクアレイ装置を有する。運用系サーバ及び待機系サーバ上では、仮想サーバを提供するサーバ仮想化機構が稼動している。管理サーバは、運用系サーバのサーバ仮想化機構の上で稼動している仮想サーバのメモリイメージのスナップショットを取得し、ディスクアレイ装置に格納する。
管理サーバは、運用系サーバに障害が検出された場合、障害が発生した運用系サーバが使用していたディスクアレイ装置内のOS(Operating System)起動ディスクを、待機系サーバに割り当てる処理を行う。管理サーバは待機系サーバの電源をオンにし、待機系サーバはOS起動ディスクを用いて起動する。管理サーバは、運用系サーバ上で稼動していた仮想サーバのメモリイメージを用いて、待機系サーバ上で稼動中のサーバ仮想化機構の上に、運用系サーバで稼動していた仮想サーバを起動させる。
特開2010−211819号公報
特許文献1では、運用系サーバに割り当てられていたOS起動ディスクを待機系サーバに割り当てることで、待機系サーバにおいて仮想サーバを起動することができる。しかしながら、特許文献1に記載のシステムは、運用系サーバ及び待機系サーバの双方からアクセスが可能な共有ディスクアレイ装置が必要である。このため、特許文献1に記載のシステムは、共有ディスクアレイ装置を用いずに、運用系サーバ及び待機系サーバが個別に有するストレージを用いる構成には適用できない。
ここで、HAクラスタにおいて使用できる分散ストレージシステムとして、DRBD(Distributed Replicated Block Device)が知られている。DRBDは、TCP/IP(Transmission Control Protocol / Internet Protocol)ネットワークを通じて、複数のサーバ間のブロックデバイス(パーティション)をミラーリングする。DRBDは、シングルプライマリモードとデュアルプライマリモードとを有する。シングルプライマリモードでは、複数のサーバのうちの1つがプライマリとなり、プライマリのみがデータを更新できる。これに対し、デュアルプライマリモードでは、全てのサーバがプライマリとなり、各サーバはデータを更新することができる。
DRBDのシングルプライマリモードを使用したHAクラスタでは、ストレージ内にあるDRBDのストレージ同期エリアには、データベースのようなデータが保存される。仮想化技術を用いたHAクラスタにおいて、プライマリサーバがダウンした場合、セカンダリサーバ側のストレージ及び仮想システムが待機系から運用系に切り替わる。運用系となったセカンダリサーバの仮想システム上のアプリケーションは、DRBDによりストレージ同期されている自身のストレージ上のデータベースを参照して処理を実行する。このようにすることで、システムの運用状態を継続可能である。
しかしながら、上記HAクラスでは、プライマリサーバの仮想化システムのメモリの内容はセカンダリサーバの仮想化システムには引き継がれない。このため、システム状態がデータベース化されておらず、仮想化システムのメモリ上で状態を保持するリアルタイムシステム(アプリケーション)においては、フォールトトレランスを実現することができない。
仮想化システムのメモリを同期するためには、プライマリサーバ及びセカンダリサーバが同一のディスクイメージを使用して仮想化システムを起動する必要がある。しかしながら、DRBDのシングルプライマリモードでは、待機系においてDRBDのストレージ同期エリアをマウントすることができない。このため、待機系であるセカンダリサーバ側でディスクイメージを参照することができず、仮想システム(待機系)を起動することができない。
本開示は、上記に鑑み、システム状態がデータベース化されない場合でも、共有ディスクアレイ装置を不要としつつ、フォールトトレランスを実現できるフォールトトレラントシステム、サーバ、及びそれらの運用方法を提供することを目的とする。
上記目的を達成するために、本開示は、第1の態様として、サーバ仮想化機構を用いて構築される仮想システムのディスクイメージをストレージ同期エリアに記憶する第1ストレージを有する第1サーバと、第2ストレージを有する第2サーバとを有し、前記第1ストレージの前記ストレージ同期エリアに仮想アドレスが設定されており、前記第1サーバ及び前記第2サーバは、それぞれ、前記仮想アドレスを用いて、NFS(Network File System)で前記第1ストレージのストレージ同期エリアをマウントし、前記第1サーバは、前記マウントしたストレージ同期エリアの前記ディスクイメージを用いて前記仮想システムを運用系として稼動し、該稼動した仮想システム上でアプリケーションを実行し、かつ、前記仮想システムのメモリの内容のスナップショットを取得して前記第2サーバに送信し、前記第2サーバは、前記マウントしたストレージ同期エリアの前記ディスクイメージを用いて前記仮想システムを待機系として稼動し、前記稼動した仮想システム上でアプリケーションの実行を待機し、前記第1サーバから前記スナップショットを受信して記憶し、前記第1サーバは、前記第1ストレージのストレージ同期エリアの内容を前記第2ストレージのストレージ同期エリアに複製し、前記第2サーバは、前記第1サーバに障害が発生した場合、前記第2ストレージのストレージ同期エリアに仮想アドレスを設定し、該仮想アドレスを用いて、前記NFSで前記第2ストレージのストレージ同期エリアをマウントし、記憶した前記スナップショットを用いて、前記仮想システム上で前記アプリケーションを実行するフォールトトレラントシステムを提供する。
本開示は、第2の態様として、サーバ仮想化機構を用いて構築される仮想システムのディスクイメージをストレージ同期エリアに記憶するストレージと、前記仮想システム上で動作するアプリケーションとを有し、前記ストレージのストレージ同期エリアに設定された仮想アドレスを用いて、NFS(Network File System)で前記ストレージのストレージ同期エリアをマウントし、前記マウントしたストレージ同期エリアの前記ディスクイメージを用いて前記仮想システムを運用系として稼動し、該稼動した仮想システム上で前記アプリケーションを実行し、前記仮想システムのメモリの内容のスナップショットを取得して、前記仮想アドレスを用いて前記ストレージのストレージ同期エリアをマウントする他のサーバに送信し、前記ストレージのストレージ同期エリアの内容を前記他のサーバのストレージのストレージ同期エリアに複製する、サーバを提供する。
本開示は、第3の態様として、ストレージと、サーバ仮想化機構を用いて構築される仮想システム上で動作するアプリケーションとを有し、前記仮想システムのディスクイメージをストレージ同期エリアに記憶する他のサーバのストレージの前記ストレージ同期エリアに設定される仮想アドレスを用いて、NFS(Network File System)で前記他のサーバのストレージのストレージ同期エリアをマウントし、前記マウントしたストレージ同期エリアの前記ディスクイメージを用いて前記仮想システムを待機系として稼動し、前記稼動した仮想システム上でアプリケーションの実行を待機し、前記他のサーバから、前記ディスクイメージを用いて前記他のサーバ上で運用系として稼動され、該運用系として稼動するシステム上でアプリケーションが実行される仮想システムのメモリの内容のスナップショットを受信して記憶し、前記他のサーバに障害が発生した場合、前記他のサーバのストレージのストレージ同期エリアの内容が複製される自サーバのストレージのストレージ同期エリアに仮想アドレスを設定し、該仮想アドレスを用いて、前記NFSで自サーバのストレージのストレージ同期エリアをマウントし、記憶した前記スナップショットを用いて、前記仮想システム上で前記アプリケーションを実行する、サーバを提供する。
本開示は、第4の態様として、サーバ仮想化機構を用いて構築される仮想システムのディスクイメージをストレージ同期エリアに記憶する第1ストレージを有する第1サーバ、及び第2ストレージを有する第2サーバが、それぞれ、前記第1ストレージの前記ストレージ同期エリアに設定される仮想アドレスを用いて、NFS(Network File System)で前記第1ストレージのストレージ同期エリアをマウントし、前記第1サーバが、前記マウントしたストレージ同期エリアの前記ディスクイメージを用いて前記仮想システムを運用系として稼動し、該稼動した仮想システム上でアプリケーションを実行し、かつ、前記仮想システムのメモリの内容のスナップショットを取得して前記第2サーバに送信し、前記第2サーバは、前記マウントしたストレージ同期エリアの前記ディスクイメージを用いて前記仮想システムを待機系として稼動し、前記稼動した仮想システム上でアプリケーションの実行を待機し、前記第1サーバから受信したスナップショットを記憶し、前記第1サーバは、前記第1ストレージのストレージ同期エリアの内容を前記第2ストレージのストレージ同期エリアに複製し、前記第2サーバは、前記第1サーバに障害が発生した場合、前記第2ストレージのストレージ同期エリアに仮想アドレスを設定し、該仮想アドレスを用いて、前記NFSで前記第2ストレージのストレージ同期エリアをマウントし、記憶した前記スナップショットを用いて、前記仮想システム上で前記アプリケーションを実行するフォールトトレラントシステムの運用方法を提供する。
本開示は、第5の態様として、サーバ仮想化機構を用いて構築される仮想システムのディスクイメージをストレージ同期エリアに記憶する自サーバのストレージの前記ストレージ同期エリアに設定される仮想アドレスを用いて、NFS(Network File System)で前記ストレージのストレージ同期エリアをマウントし、前記マウントしたストレージ同期エリアの前記ディスクイメージを用いて前記仮想システムを運用系として稼動し、該稼動した仮想システム上でアプリケーションを実行し、前記仮想システムのメモリの内容のスナップショットを取得して、前記仮想アドレスを用いて前記ストレージのストレージ同期エリアをマウントする他のサーバに送信し、前記ストレージのストレージ同期エリアの内容を前記他のサーバのストレージのストレージ同期エリアに複製するサーバの運用方法を提供する。
本開示は、第6の態様として、サーバ仮想化機構を用いて構築される仮想システムのディスクイメージをストレージ同期エリアに記憶する他のサーバのストレージの前記ストレージ同期エリアに設定される仮想アドレスを用いて、NFS(Network File System)で前記他のサーバのストレージのストレージ同期エリアをマウントし、前記マウントしたストレージ同期エリアの前記ディスクイメージを用いて前記仮想システムを待機系として稼動し、前記稼動した仮想システム上でアプリケーションの実行を待機し、前記他のサーバから、前記ディスクイメージを用いて前記他のサーバ上で運用系として稼動され、該運用系として稼動されたシステム上でアプリケーションが実行される仮想システムのメモリの内容のスナップショットを受信して記憶し、前記他のサーバに障害が発生した場合、前記他のサーバのストレージのストレージ同期エリアの内容が複製される自サーバのストレージのストレージ同期エリアに仮想アドレスを設定し、該仮想アドレスを用いて、前記NFSで自サーバのストレージのストレージ同期エリアをマウントし、記憶した前記スナップショットを用いて、前記仮想システム上で前記アプリケーションを実行するサーバの運用方法を提供する。
本開示のフォールトトレラントシステム、サーバ、及びそれらの運用方法は、システム状態がデータベース化されない場合でも、共有ディスクアレイ装置を不要としつつ、フォールトトレランスを実現することができる。
本開示に係るフォールトレラントシステムの概略構成を示すブロック図。 本開示の一実施形態に係るフォールトトレラントシステムを示すブロック図。 通常時におけるフォールトトレラントシステムを示すブロック図。 プライマリサーバに障害が発生した場合のフォールトトレラントシステムを示すブロック図。 プライマリサーバにおける通常時の動作手順を示すフローチャート。 セカンダリサーバにおける通常時の動作手順を示すフローチャート。 プライマリサーバにおいて呼制御アプリの動作に障害が発生した場合の動作手順を示すフローチャート。 プライマリサーバに障害が発生した場合の動作手順を示すフローチャート。 サーバ装置の構成例を示すブロック図。
本開示の実施の形態の説明に先立って、本開示の概要を説明する。図1は、本開示に係るフォールトレラントシステムの概略構成を示す。フォールトトレラントシステム10は、第1サーバ11と第2サーバ12とを有する。第1サーバ11は、ストレージ21を有する。ストレージ21は、ストレージ同期エリアを有する。ストレージ同期エリアは、サーバ仮想化機構を用いて構築される仮想システムのディスクイメージ31を記憶する。
第2サーバ12は、ストレージ22を有する。第1サーバ11は、自身のストレージ21のストレージ同期エリアの内容を第2サーバ12のストレージ22のストレージ同期エリアに複製する。ストレージ同期エリアの内容が複製されることで、第2サーバ12のストレージ22には、第1サーバ11のストレージ21に記憶される仮想システムのディスクイメージ31と同じ内容のディスクイメージ32が記憶される。
ストレージ21のストレージ同期エリアには仮想アドレスが設定されている。第1サーバ11及び第2サーバ12は、それぞれ仮想アドレスを用いて、NFSでストレージ21のストレージ同期エリアをマウントする。
第1サーバ11は、マウントしたストレージ同期エリアのディスクイメージ31を用いて仮想システム41を運用系として稼動する。第1サーバ11は、稼動した仮想システム41上でアプリケーション51を実行する。第1サーバ11は、仮想システム41のメモリの内容のスナップショットを取得し、取得したスナップショットを第2サーバ12に送信する。
第2サーバ12は、マウントしたストレージ同期エリアのディスクイメージ31を用いて仮想システム42を待機系として稼動する。第2サーバ12は、稼動した仮想システム42上でアプリケーション52の実行を待機する。第2サーバ12は、第1サーバ11から、仮想システム41のメモリの内容のスナップショットを受信し、記憶する。
第2サーバ12は、第1サーバ11に障害が発生した場合、自身のストレージ22のストレージ同期エリアに仮想アドレスを設定する。第2サーバ12は、設定した仮想アドレスを用いて、NFSでストレージ22のストレージ同期エリアをマウントする。また、第2サーバ12は、第1サーバ11から受信して記憶したスナップショットを用いて、仮想システム42上でアプリケーション52を実行する。
本開示では、第1サーバ11のストレージ21は、仮想システムのディスクイメージ31をストレージ同期エリアに記憶する。第1サーバ11及び第2サーバ12は、それぞれ、ストレージ21のストレージ同期エリアに設定された仮想アドレスを用いて、NFSでストレージ21のストレージ同期エリアをマウントする。第1サーバ11は、ストレージ同期エリアの内容を、第2サーバ12にストレージ22に複製する。このようにすることで、第1サーバ11のストレージ21の仮想システムのディスクイメージ31と、第2サーバ12のストレージ22の仮想システムのディスクイメージ32とを同期させることができる。
ここで、例えば、ストレージ同期エリアの同期にDRBDのシングルプライマリモードが用いられる場合、第2サーバ12は、DRBDの待機系である、自身のストレージ22のストレージ同期エリアをマウントすることができない。本開示では、第2サーバ12は、仮想アドレスを用いて第1サーバ11のストレージ21のストレージ同期エリアをマウントしている。このようにすることで、第2サーバ12は、自身のストレージ22を直接にマウントすることができなくても、第1サーバ11において仮想システム41の起動に用いられるディスクイメージ31を使用して、仮想システム42を起動できる。また、本開示では、第2サーバ12は第1サーバ11のストレージ21のストレージ同期エリアをNFSでマウントしているため、双方のサーバから共通にアクセスが可能な共有ディスクアレイ装置などは必要ない。
また、本開示では、第1サーバ11は、仮想システム41のメモリの内容のスナップショットを取得する。第2サーバ12は、第1サーバ11からスナップショットを受信し、記憶する。第2サーバ12は、第1サーバ11で障害が発生した場合、自身のストレージ22のストレージ同期エリアに仮想アドレスを設定し、仮想アドレスを用いて、NFSでストレージ22のストレージ同期エリアをマウントする。また、第2サーバ12は、第1サーバ11から受信したスナップショットを用いてアプリケーション52を実行し、第1サーバ11の仮想システム41において実行されていたアプリケーション51の実行を引き継ぐ。このようにすることで、システム状態がデータベース化されない場合でも、共有ディスクアレイ装置を不要としつつ、フォールトトレランスを実現することができる
以下、図面を参照しつつ、本開示の実施の形態を詳細に説明する。図2は、本開示の一実施形態に係るフォールトトレラントシステムを示す。フォールトトレラントシステム100は、プライマリサーバ110、及びセカンダリサーバ130を有する。フォールトトレラントシステム100は図1のフォールトトレラントシステム10に対応する。プライマリサーバ110は図1の第1サーバ11に対応し、セカンダリサーバ130は図1の第2サーバ12に対応する。
本実施形態において、フォールトトレラントシステム100は、ホット−スタンバイ構成のシステムとして構成される。通常時、プライマリサーバ110は運用系として動作する。セカンダリサーバ130は、待機系として用いられ、運用系であるプライマリサーバ110に障害が発生した場合に、プライマリサーバ110で提供されていた処理を引き継いで実施する。
プライマリサーバ110は、ハードウェア111として、ネットワークインタフェースカード(NIC:Network Interface Card)118及び119と、ストレージ120とを有する。ハードウェア111は、プロセッサ及びメモリなども含む。NIC118は、呼制御ネットワークを介して、電話機201などに接続される。NIC119は、FT(Fault Tolerance)ネットワークを介して、セカンダリサーバ130に接続される。ストレージ120は、プライマリサーバ110上に構築される仮想システムのディスクイメージを含む。ストレージ120は、図1のストレージ21に対応する。
セカンダリサーバ130の構成は、プライマリサーバ110と同様である。セカンダリサーバ130は、ハードウェア131として、NIC138及び139と、ストレージ140とを有する。ハードウェア131は、プロセッサ及びメモリなども含む。NIC138は、呼制御ネットワークを介して、電話機201などに接続される。NIC139は、FTネットワークを介して、プライマリサーバ110に接続される。ストレージ140は、図1のストレージ22に対応する。
なお、図2では図面簡略化のために電話機201が1つのみ示されているが、プライマリサーバ110及びセカンダリサーバ130は、呼制御ネットワークを介して複数の電話機201に接続され得る。また、呼制御ネットワークに接続される装置は、電話機能を有する装置であればよく、電話機201には限定されない。
ここで、ストレージ120及びストレージ140はストレージ同期エリアを有し、ストレージ同期エリアの内容は同期される。ストレージの同期には、例えばストレージのレプリケーションのためのソフトウェアであるDRBDが用いられる。DRBDは、TCP/IPネットワークを通じて複数のサーバのストレージ(ブロックデバイス)をリアルタイムでレプリケートするソフトウェアである。本実施形態では、特に、DRBDのシングルプライマリモードを使用して、プライマリサーバ110とセカンダリサーバ130との間でストレージ同期エリア(ブロックストレージ)の内容がミラーリングされる。
本実施形態において、DRBDの運用系に仮想IPアドレス(以下、ACT IP)とも呼ぶ)が設定される。通常時、プライマリサーバ110のストレージ120がDRBDの運用系として用いられ、セカンダリサーバ130のストレージ140がDRBDの待機系として用いられる。プライマリサーバ110及びセカンダリサーバ130は、それぞれ、ACT IPを用いて、NFSでストレージ120のストレージ同期エリアをマウントする。
プライマリサーバ110で動作するホストOS112は、ハイパーバイザ121を含む。ホストOS112には、例えばLinux(登録商標)系のOSが用いられる。ハイパーバイザ121には、例えばKVM(Kernel-based Virtual Machine)が用いられる。ホストOS112上では、QEMU113、DRBD116、及び監視アプリケーション117が動作する。QEMU(Quick Emulator)113は、オープンソースのエミュレータである。QEMU113は、仮想ハードウェアを提供し、ホストOS112(ハイパーバイザ121)上に仮想マシン(仮想システム)を構築する。QEMU113上には、LinuxなどのゲストOS114が動作している。
ここで、プライマリサーバ110上で稼動する仮想システムでは、システム状態がデータベース化されず、メモリ上でシステムを管理するリアルタイムシステム(アプリケーション)が稼動する。特に、本実施形態では、そのようなリアルタイムアプリケーションとして、呼制御アプリケーション(以下、呼制御アプリとも呼ぶ)115が稼動する。呼制御アプリ115は、ゲストOS114上で動作する。呼制御アプリ115は、外線と内線、或いは内線同士を接続する呼制御を実施するアプリケーションソフトウェアである。なお、仮想システム上で実行されるアプリケーションは呼制御アプリ115には限定されず、他のアプリケーションであってもよい。
プライマリサーバ110は、呼制御アプリ115に動作に応じて変化し得る仮想システムのメモリの内容を、セカンダリサーバ130に送信する。プライマリサーバ110は、例えばKVMのライブマイグレーション機能(vmotion機能)を利用して、仮想システムのメモリの内容をセカンダリサーバ130に送信する。例えば、プライマリサーバ110は、所定時間間隔、例えば数百ミリ秒から数秒程度の間隔で、仮想システムのメモリの内容のスナップショットを取得する。プライマリサーバ110は、取得したスナップショットを、NIC119を通じてセカンダリサーバ130に送信する。セカンダリサーバ130は、NIC139を通じて、プライマリサーバ110からスナップショットを受信する。セカンダリサーバ130は、受信したスナップショットを記憶装置に記憶する。セカンダリサーバ130は、例えば受信したスナップショットを記憶装置に上書き保存する。
DRBD116は、ストレージ120内のストレージ同期エリアの内容を、セカンダリサーバ130のストレージ140にレプリケートする。DRBD116は、ストレージ120のストレージ同期エリアの内容が変更される場合、その変更の内容をセカンダリサーバ130に送信する。ストレージ120は、ストレージ同期エリアに、仮想システムのディスクイメージを記憶する。DRBDを用いることで、プライマリサーバ110のストレージ120と、セカンダリサーバ130のストレージ140に記憶される仮想システムのディスクイメージの内容が同じ内容に保たれる。
監視アプリケーション(以下、監視アプリとも呼ぶ)117は、ゲストOS114上で動作する呼制御アプリ115の動作を監視する。監視アプリ117は、呼制御アプリ115が正常に動作していない場合、その旨を、NIC119を通じてセカンダリサーバ130に通知する。また、監視アプリケーション117は、NIC119を通じて、セカンダリサーバ130を監視する。
セカンダリサーバ130で動作するホストOS132は、ハイパーバイザ141を含む。ホストOS132には、例えばLinux系のOSが用いられる。ハイパーバイザ141には、例えばKVMが用いられる。ホストOS132上では、QEMU133、DRBD136、及び監視アプリケーション137が動作する。QEMU133は、仮想ハードウェアを提供する。QEMU133は、ホストOS132(ハイパーバイザ141)上に仮想マシン(仮想システム)を構築する。
QEMU133上には、LinuxなどのゲストOS134が動作している。呼制御アプリ135は、ゲストOS134上で動作する。呼制御アプリ135は、外線と内線、或いは内線同士を接続する呼制御を実施するアプリケーションソフトウェアである。プライマリサーバ110において呼制御アプリ115が正常に動作している場合、セカンダリサーバ130において呼制御アプリ135は動作していない。
DRBD136は、プライマリサーバ110のストレージ120のストレージ同期エリアの内容を、セカンダリサーバ130のストレージ140にレプリケートする。プライマリサーバ110のストレージ120においてストレージ同期エリアの内容が変更された場合、DRBD136は、プライマリサーバ110からその変更の内容を受信する。DRBD136は、セカンダリサーバ130のストレージ140に、プライマリサーバ110から受信した変更の内容を反映させる。
監視アプリ137は、ゲストOS134上で動作する呼制御アプリ135の動作を監視する。監視アプリ137は、呼制御アプリ135が正常に動作していない場合、その旨を、NIC139を通じてプライマリサーバ110に通知する。また、監視アプリ137は、NIC139を通じてプライマリサーバ110を監視する。プライマリサーバ110に障害が発生した場合、セカンダリサーバ130は、ストレージ140のストレージ同期エリアをDRBDの運用系に切り替える。その際、セカンダリサーバ130は、ストレージ140のストレージ同期エリアにACT IPを設定する。セカンダリサーバ130は、ACT IPを用いて、NFSでストレージ140のストレージ同期エリアをマウントする。
セカンダリサーバ130は、プライマリサーバ110から呼制御アプリ115が正常に動作していない旨が通知された場合、及びプライマリサーバ110に障害が発生した場合、自サーバ上で稼動する仮想システムを運用系に切り替える。セカンダリサーバ130は、運用系に切り替えた仮想システム上で、プライマリサーバ110から受信し、記憶していたスナップショットを用いて、呼制御アプリ135を実行する。呼制御アプリ135は、プライマリサーバ110の呼制御アプリ115で実行していた処理を引き継ぐ。このようにすることで、プライマリサーバ110が障害でダウンした場合でも、セカンダリサーバ130が、プライマリサーバ110で提供されていたサービスを、ほぼ途切れることなく提供し続けることができる。
図3は、通常時におけるフォールトトレラントシステム100を示す。プライマリサーバ110のストレージ120は、DRBDの運用系であるストレージ同期エリア122を有する。ストレージ同期エリア122は、例えば「/drbd_share」などの所定のフォルダに設定される。ストレージ同期エリア122である「/drbd_share」には、仮想システムのディスクイメージ(以下、単にディスクイメージとも呼ぶ)123が記憶される。ディスクイメージ123は、図1のディスクイメージ31に対応する。
また、セカンダリサーバ130のストレージ140は、DRBDの待機系であるストレージ同期エリア142を有する。ストレージ同期エリア142は、例えば「/drbd_share」などの所定のフォルダに設定される。プライマリサーバ110のDRBD116(図2を参照)は、ストレージ同期エリア122に記憶されるディスクイメージ123をセカンダリサーバ130に送信する。セカンダリサーバ130のDRBD136は、ストレージ同期エリア142である「/drbd_share」に、プライマリサーバ110から受信したディスクイメージ123を複製したディスクイメージ143を記憶する。プライマリサーバ110において、ディスクイメージ123に変更が生じると、その変更はセカンダリサーバ130のディスクイメージ143にも反映される。ディスクイメージ143は、図1のディスクイメージ32に対応する。
プライマリサーバ110のストレージ同期エリア122には、例えばACT IP「172.31.0.10」が設定される。プライマリサーバ110は、ACT IPを用いて、NFSで、ストレージ同期エリア122をマウントする。プライマリサーバ110において、ストレージ同期エリア122は、例えば「/mnt/nfs-client/」などの所定のマウントポイント124にマウントされる。また、セカンダリサーバ130は、ACT IPを用いて、NFSで、ストレージ同期エリア122をマウントする。セカンダリサーバ130において、ストレージ同期エリア122は、例えば「/mnt/nfs-client/」などの所定のマウントポイント144にマウントされる。
プライマリサーバ110は、NFSでマウントしたストレージ同期エリア122のディスクイメージ123を用いて、仮想システム125を起動する。プライマリサーバ110は、仮想システム125を運用系として稼動させる。プライマリサーバ110は、仮想システム125上で、ゲストOS114と呼制御アプリ115とを稼動させる。プライマリサーバ110は、定期的に仮想システム125のメモリの内容のスナップショットを取得し、セカンダリサーバ130に送信する。仮想システム125は、図1の仮想システム41に対応する。
また、セカンダリサーバ130は、NFSでマウントしたストレージ同期エリア122のディスクイメージ123を用いて、仮想システム145を待機系として起動する。セカンダリサーバ130は、仮想システム145上で、ゲストOS134及び呼制御アプリ135の実行を待機する。仮想システム145は、図1の仮想システム42に対応する。セカンダリサーバ130は、プライマリサーバ110から、仮想システム125のメモリの内容のスナップショットを定期的に受信し、記憶する。セカンダリサーバ130は、例えば新たなスナップショットを受信するたびに、前回受信したスナップショットを新たに受信したスナップショットで上書きする。
図4は、プライマリサーバ110に障害が発生した場合のフォールトトレラントシステム100を示す。監視アプリ137(図2を参照)は、例えば何らかの原因でプライマリサーバ110との通信が途絶えた場合、プライマリサーバ110の障害を検出する。監視アプリ137がプライマリサーバ110の障害を検出した場合、セカンダリサーバ130は、DRBDの運用系を自サーバのストレージ140に切り替える。セカンダリサーバ130は、自身のストレージ140のストレージ同期エリア142にACT IP「172.31.0.10」を設定する。セカンダリサーバ130は、ACT IP「172.31.0.10」を用いて、NFSでストレージ同期エリア142をマウントポイント144にマウントする。
また、セカンダリサーバ130は、監視アプリ137がプライマリサーバ110の障害を検出した場合、仮想システム145を待機系から運用系に切り替える。セカンダリサーバ130は、障害発生前に受信していたスナップショットを用いて、最後にスナップショットが取得されたときの仮想システム145内のメモリの内容を、仮想システム145に再現する。運用系に切り替えられた仮想システム145において、呼制御アプリ135は、再現されたメモリの内容を参照しつつ、プライマリサーバ110の仮想システム125が提供していた呼制御処理を引き継ぐ。このようにすることで、プライマリサーバ110がダウンした場合でも、電話機201(図2を参照)に対して、呼制御を継続して提供することができる。
続いて、フォールトトレラントシステム及びサーバの運用方法を含む動作手順を説明する。図5は、プライマリサーバ110における通常時の動作手順を示す。プライマリサーバ110は、ACT IPを用いて、ストレージ120のストレージ同期エリア122をNFSでマウントポイント124にマウントする(ステップS11)。プライマリサーバ110は、マウントしたストレージ同期エリア122に記憶されるディスクイメージ123を使用して、仮想システム125を運用系として起動する。(ステップS12)。
プライマリサーバ110は、仮想システム125において、ゲストOS114を起動し、ゲストOS114上で呼制御アプリ115を実行する(ステップS13)。プライマリサーバ110は、仮想システム125内のメモリの内容のスナップショットを取得する(ステップS14)。プライマリサーバ110は、例えば所定のチェックポイント周期が経過したか否かを判断し、チェックポイント周期が経過するたびにスナップショットを取得する。プライマリサーバ110は、スナップショットの取得では、前回のスナップショット取得から変更があったメモリの内容を取得する。プライマリサーバ110は、取得したスナップショットをセカンダリサーバ130に送信する(ステップS15)。プライマリサーバ110は、スナップショットの取得及び送信と並行して、ストレージ120のストレージ同期エリア122の内容に変更が生じた場合は、その変更内容をセカンダリサーバ130に送信する。
図6は、セカンダリサーバ130における通常時の動作手順を示す。セカンダリサーバ130は、ACT IPを用いて、プライマリサーバ110のストレージ120のストレージ同期エリア122をNFSでマウントポイント144にマウントする(ステップS21)。セカンダリサーバ130は、マウントしたストレージ同期エリア122に記憶されるディスクイメージ123を使用して、仮想システム145を待機系として起動する。(ステップS22)。
セカンダリサーバ130は、仮想システム145において、ゲストOS134を起動し、ゲストOS134上で呼制御アプリ135の実行を待機する(ステップS23)。セカンダリサーバ130は、プライマリサーバ110から、仮想システム125内のメモリの内容のスナップショットを受信する(ステップS24)。セカンダリサーバ130は、受信したスナップショットを記憶する。セカンダリサーバ130は、スナップショットの受信と並行して、ストレージ120のストレージ同期エリア122の変更内容を受信する。セカンダリサーバ130は、ストレージ140のストレージ同期エリア142の内容を、ストレージ120のストレージ同期エリア122の内容と同期させる。
図7は、プライマリサーバ110において呼制御アプリ115の動作に障害が発生した場合の動作手順を示す。プライマリサーバ110は、監視アプリ117(図2を参照)を用いて、ゲストOS114上で実行される呼制御アプリ115の動作を監視する(ステップS31)。プライマリサーバ110は、呼制御アプリ115の動作が異常であるか否かを判断する(ステップS32)。プライマリサーバ110は、呼制御アプリ115の動作が異常ではないと判断した場合、ステップS31に戻り、呼制御アプリ115の動作を継続して監視する。プライマリサーバ110は、ステップS32で呼制御アプリ115の動作が異常と判断した場合、セカンダリサーバ130に動作異常を通知する(ステップS33)。
セカンダリサーバ130は、プライマリサーバ110から動作異常が通知された場合、仮想システム145(図4を参照)を、待機系から運用系に変更する(ステップS34)。このとき、プライマリサーバ110自体の動作に異常がなく、セカンダリサーバ130がストレージ120のストレージ同期エリア122に正常にアクセスできる場合、DRBDの運用系の切替えは実施されない。セカンダリサーバ130は、運用系に切り替えた仮想システム145において、図6のステップS24で受信していたスナップショットを用いて、呼制御アプリ135を実行する(ステップS35)。
図8は、プライマリサーバ110に障害が発生した場合の動作手順を示す。セカンダリサーバ130は、監視アプリ137(図2を参照)を用いて、プライマリサーバ110を監視する(ステップS41)。セカンダリサーバ130は、プライマリサーバ110に異常が発生したか否かを判断する(ステップS42)。セカンダリサーバ130は、プライマリサーバ110が異常ではないと判断した場合、ステップS41に戻り、プライマリサーバ110を継続して監視する。
セカンダリサーバ130は、ステップS42でプライマリサーバ110が異常と判断した場合、DRBDの運用系を切り替える(ステップS43)。セカンダリサーバ130は、ステップS43では、DRBDの運用系を、プライマリサーバ110のストレージ120のストレージ同期エリア122から、セカンダリサーバ130のストレージ140のストレージ同期エリア142に切り替える。その際、セカンダリサーバ130は、ストレージ同期エリア142に、仮想アドレスを設定する(ステップS44)。セカンダリサーバ130は、仮想アドレスを用いて、ストレージ同期エリア142をNFSでマウントポイント144にマウントする(ステップS45)。
セカンダリサーバ130は、仮想システム145を待機系から運用系に変更する(ステップS46)。セカンダリサーバ130は、運用系に切り替えた仮想システム145において、図6のステップS24で受信していたスナップショットを用いて、呼制御アプリ135を実行する(ステップS47)。ストレージ同期エリア142に記憶されるディスクイメージ143は、プライマリサーバ110においてストレージ同期エリア122に記憶されるディスクイメージ123と同期されている。従って、呼制御アプリ135は、プライマリサーバ110側の呼制御アプリ115から、正常に呼制御処理を引き継ぐことができる。
本実施形態では、プライマリサーバ110のストレージ120及びセカンダリサーバ130のストレージ140のストレージ同期エリアは、DRBDのシングルプライマリモードを用いて同期される。本実施形態において、DRBDのシングルプライマリモードは、一般的な使用方法であるデータの同期ではなく、仮想システムを起動するためのディスクイメージを同期させるために使用される。本実施形態では、通常動作時は、プライマリサーバ110側のストレージ同期エリアをDRBDの運用系とし、セカンダリサーバ130側のストレージ同期エリアを待機系とする。このようにすることで、システム運用中に、ストレージ同期エリアの内容を同期させることができる。
本実施形態では、通常動作時は、プライマリサーバ110側の仮想システムのディスクイメージを記憶するストレージ同期エリアに仮想アドレスが設定される。プライマリサーバ110及びセカンダリサーバ130は、それぞれプライマリサーバ110側のストレージ同期エリアを、仮想アドレスを用いてNFSでマウントする。このようにすることで、DRBDの待機系であるセカンダリサーバ130においても、プライマリサーバ110と同一のディスクイメージを使用して、仮想システムを起動することが可能となる。本実施形態では、セカンダリサーバ130は、プライマリサーバ110側のストレージ同期エリアを、仮想アドレスを用いてNFSでマウントしている。このため、共有ディスクアレイ装置などの外部ディスク装置は不要である。
本実施形態では、ライブマイグレーション機能などを使用して、プライマリサーバ110側の仮想システムのメモリの内容と、セカンダリサーバ130側の仮想システムのメモリの内容とが同期される。プライマリサーバ110に障害が発生した場合、セカンダリサーバ130側のストレージ同期エリアがDRBDの運用系となり、セカンダリサーバ130側のストレージ同期エリアに仮想アドレスが設定される。このようにすることで、セカンダリサーバ130において、NFSのマウント状態を維持でき、仮想システムの運用状態を停止することなく、仮想システムの運用系をセカンダリサーバ130側に切り替えることができる。
上記において、セカンダリサーバ130は、起動している仮想システムに対して、プライマリサーバ110側のディスクイメージで起動していた状態のまま、NFSのマウント状態を維持できる。従って、セカンダリサーバ130は、仮想システムが参照するディスクイメージがプライマリサーバ110側からセカンダリサーバ130側に切り替わったことを意識せずに、NFSマウント状態を維持することができる。本実施形態において、ハイパーバイザ上に構築される仮想システムでは、システム状態がデータベース化されておらず、メモリ上で状態を保持するリアルタイムアプリケーションが動作している。このような場合でも、ストレージ同期に、仮想システム内のメモリ同期を併用することで、プライマリサーバ110に障害が発生し、DRBDの運用系が切り替えられた後も、セカンダリサーバ130で仮想システムの稼動状態を継続することができる。
なお、プライマリサーバ110及びセカンダリサーバ130には、仮想化技術に対応した一般的なサーバ装置を用いることができる。図9は、サーバ装置の構成例を示す。サーバ装置300は、CPU(Central Processing Unit)301、メインメモリ302、記憶装置303、入力インターフェイス304、表示コントローラ305、データリーダ/ライタ306、通信インターフェイス307、及び通信インターフェイス308を備える。サーバ装置300において、これら要素は、バス309を介して、互いにデータ通信可能に接続される。
CPU301は、記憶装置303に格納された、プログラム(コード)をメインメモリ302に展開し、プログラムを実行することで、各種の演算を実施する。メインメモリ302は、典型的には、DRAM(Dynamic Random Access Memory)などの揮発性の記憶装置である。サーバ装置300をプライマリサーバ110又はセカンダリサーバ130として機能させるためのプログラムは、例えば、コンピュータ読み取り可能な記録媒体320に格納された状態で提供される。プログラムは、インターネットなどのネットワークを通じて提供されてもよい。
上記プログラムは、様々なタイプの非一時的なコンピュータ可読媒体を用いて格納され、コンピュータ(サーバ装置)に供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記憶媒体を含む。非一時的なコンピュータ可読媒体の例は、例えばフレキシブルディスク、磁気テープ、又はハードディスクなどの磁気記録媒体、例えば光磁気ディスクなどの光磁気記録媒体、CD(compact disc)、又はDVD(digital versatile disk)などの光ディスク媒体、及び、マスクROM(read only memory)、PROM(programmable ROM)、EPROM(erasable PROM)、フラッシュROM、又はRAM(random access memory)などの半導体メモリを含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体を用いてコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバなどの有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。
記憶装置303、例えばハードディスクドライブなどディスク装置、或いはフラッシュメモリなどの半導体記憶装置として構成される。記憶装置303は、プライマリサーバ110のストレージ120、又はセカンダリサーバ130のストレージ140に対応する。入力インターフェイス304は、CPU301と、キーボード及びマウスといった入力機器310との間のデータ伝送を仲介する。表示コントローラ305は、表示装置330と接続され、表示装置330での表示を制御する。データリーダ/ライタ306は、CPU301と記録媒体320との間のデータ伝送を仲介する。データリーダ/ライタ306は、例えば記録媒体320からプログラムを読み出し、読み出したプログラムをCPU301に伝送する。
通信インターフェイス307及び308は、CPU301と、他の装置又はネットワークとの間のデータ伝送を仲介する。例えば、通信インターフェイス307はプライマリサーバ110のNIC118に対応し、通信インターフェイス308はプライマリサーバ110のNIC119に対応する。あるいは、通信インターフェイス307はセカンダリサーバ130のNIC138に対応し、通信インターフェイス308はセカンダリサーバ130のNIC139に対応する。
以上、本開示の実施形態を詳細に説明したが、本開示は、上記した実施形態に限定されるものではなく、本開示の趣旨を逸脱しない範囲で上記実施形態に対して変更や修正を加えたものも、本開示に含まれる。
例えば、上記の実施形態の一部又は全部は、以下の付記のようにも記載され得るが、以下には限られない。
[付記1]
サーバ仮想化機構を用いて構築される仮想システムのディスクイメージをストレージ同期エリアに記憶する第1ストレージを有する第1サーバと、
第2ストレージを有する第2サーバとを有し、
前記第1ストレージの前記ストレージ同期エリアに仮想アドレスが設定されており、前記第1サーバ及び前記第2サーバは、それぞれ、前記仮想アドレスを用いて、NFS(Network File System)で前記第1ストレージのストレージ同期エリアをマウントし、
前記第1サーバは、前記マウントしたストレージ同期エリアの前記ディスクイメージを用いて前記仮想システムを運用系として稼動し、該稼動した仮想システム上でアプリケーションを実行し、かつ、前記仮想システムのメモリの内容のスナップショットを取得して前記第2サーバに送信し、
前記第2サーバは、前記マウントしたストレージ同期エリアの前記ディスクイメージを用いて前記仮想システムを待機系として稼動し、前記稼動した仮想システム上でアプリケーションの実行を待機し、前記第1サーバから前記スナップショットを受信して記憶し、
前記第1サーバは、前記第1ストレージのストレージ同期エリアの内容を前記第2ストレージのストレージ同期エリアに複製し、
前記第2サーバは、前記第1サーバに障害が発生した場合、前記第2ストレージのストレージ同期エリアに仮想アドレスを設定し、該仮想アドレスを用いて、前記NFSで前記第2ストレージのストレージ同期エリアをマウントし、記憶した前記スナップショットを用いて、前記仮想システム上で前記アプリケーションを実行するフォールトトレラントシステム。
[付記2]
前記第1サーバは、所定時間間隔で前記スナップショットを取得して前記第2サーバに送信する付記1に記載のフォールトトレラントシステム。
[付記3]
前記第2サーバは、前記第1サーバを監視し、前記第1サーバに障害が発生した場合、前記第2サーバのストレージを待機系から運用系に切り替える付記1又は2に記載のフォールトトレラントシステム。
[付記4]
前記第1サーバ及び前記第2サーバは、それぞれ前記第1サーバ及び前記第2サーバのそれぞれの上で稼動する仮想システム上で動作するアプリケーションの実行を監視し、
前記第2サーバは、前記第1サーバ上で稼動する仮想システム上で動作するアプリケーションの実行に障害が発生した場合、前記第2サーバ上で稼動する仮想システム上で動作するアプリケーションを、待機状態から動作状態に切り替える付記1から3何れか1つに記載のフォールトトレラントシステム。
[付記5]
前記第1ストレージのストレージ同期エリアの内容は、DRBD(Distributed Replicated Block Device)のシングルプライマリモードを用いて前記第2ストレージのストレージ同期エリアに複製される付記1から4何れか1つに記載のフォールトトレラントシステム。
[付記6]
前記アプリケーションは、前記第1サーバ及び第2サーバとネットワークを介して接続される電話機能を有する装置の呼を制御する呼制御アプリケーションである付記1から5何れか1つに記載のフォールトトレラントシステム。
[付記7]
前記アプリケーションは、システム状態をデータベース化せず、システム状態をメモリ上で管理する付記1から6何れか1つに記載のフォールトトレラントシステム。
[付記8]
サーバ仮想化機構を用いて構築される仮想システムのディスクイメージをストレージ同期エリアに記憶するストレージと、
前記仮想システム上で動作するアプリケーションとを有し、
前記ストレージのストレージ同期エリアに設定された仮想アドレスを用いて、NFS(Network File System)で前記ストレージのストレージ同期エリアをマウントし、
前記マウントしたストレージ同期エリアの前記ディスクイメージを用いて前記仮想システムを運用系として稼動し、該稼動した仮想システム上で前記アプリケーションを実行し、
前記仮想システムのメモリの内容のスナップショットを取得して、前記仮想アドレスを用いて前記ストレージのストレージ同期エリアをマウントする他のサーバに送信し、
前記ストレージのストレージ同期エリアの内容を前記他のサーバのストレージのストレージ同期エリアに複製する、
サーバ。
[付記9]
所定時間間隔で前記スナップショットを取得して前記他のサーバに送信する付記8に記載のサーバ。
[付記10]
前記ストレージのストレージ同期エリアの内容は、DRBD(Distributed Replicated Block Device)のシングルプライマリモードを用いて前記他のサーバのストレージのストレージ同期エリアに複製される付記8又は9に記載のサーバ。
[付記11]
ストレージと、
サーバ仮想化機構を用いて構築される仮想システム上で動作するアプリケーションとを有し、
前記仮想システムのディスクイメージをストレージ同期エリアに記憶する他のサーバのストレージの前記ストレージ同期エリアに設定される仮想アドレスを用いて、NFS(Network File System)で前記他のサーバのストレージのストレージ同期エリアをマウントし、
前記マウントしたストレージ同期エリアの前記ディスクイメージを用いて前記仮想システムを待機系として稼動し、前記稼動した仮想システム上でアプリケーションの実行を待機し、
前記他のサーバから、前記ディスクイメージを用いて前記他のサーバ上で運用系として稼動され、該運用系として稼動するシステム上でアプリケーションが実行される仮想システムのメモリの内容のスナップショットを受信して記憶し、
前記他のサーバに障害が発生した場合、前記他のサーバのストレージのストレージ同期エリアの内容が複製される自サーバのストレージのストレージ同期エリアに仮想アドレスを設定し、該仮想アドレスを用いて、前記NFSで自サーバのストレージのストレージ同期エリアをマウントし、記憶した前記スナップショットを用いて、前記仮想システム上で前記アプリケーションを実行する、
サーバ。
[付記12]
前記他のサーバを監視し、前記他のサーバに障害が発生した場合、自サーバのストレージを待機系から運用系に切り替える付記11に記載のサーバ。
[付記13]
前記他のサーバ上で稼動する仮想システム上で動作するアプリケーションの実行を監視し、
前記他のサーバ上で稼動する仮想システム上で動作するアプリケーションの実行に障害が発生した場合、自サーバ上で稼動する仮想システム上で動作するアプリケーションを、待機状態から動作状態に切り替える付記11又は12に記載のサーバ。
[付記14]
サーバ仮想化機構を用いて構築される仮想システムのディスクイメージをストレージ同期エリアに記憶する第1ストレージを有する第1サーバ、及び第2ストレージを有する第2サーバが、それぞれ、前記第1ストレージの前記ストレージ同期エリアに設定される仮想アドレスを用いて、NFS(Network File System)で前記第1ストレージのストレージ同期エリアをマウントし、
前記第1サーバが、前記マウントしたストレージ同期エリアの前記ディスクイメージを用いて前記仮想システムを運用系として稼動し、該稼動した仮想システム上でアプリケーションを実行し、かつ、前記仮想システムのメモリの内容のスナップショットを取得して前記第2サーバに送信し、
前記第2サーバは、前記マウントしたストレージ同期エリアの前記ディスクイメージを用いて前記仮想システムを待機系として稼動し、前記稼動した仮想システム上でアプリケーションの実行を待機し、前記第1サーバから受信したスナップショットを記憶し、
前記第1サーバは、前記第1ストレージのストレージ同期エリアの内容を前記第2ストレージのストレージ同期エリアに複製し、
前記第2サーバは、前記第1サーバに障害が発生した場合、前記第2ストレージのストレージ同期エリアに仮想アドレスを設定し、該仮想アドレスを用いて、前記NFSで前記第2ストレージのストレージ同期エリアをマウントし、記憶した前記スナップショットを用いて、前記仮想システム上で前記アプリケーションを実行するフォールトトレラントシステムの運用方法。
[付記15]
サーバ仮想化機構を用いて構築される仮想システムのディスクイメージをストレージ同期エリアに記憶する自サーバのストレージの前記ストレージ同期エリアに設定される仮想アドレスを用いて、NFS(Network File System)で前記ストレージのストレージ同期エリアをマウントし、
前記マウントしたストレージ同期エリアの前記ディスクイメージを用いて前記仮想システムを運用系として稼動し、該稼動した仮想システム上でアプリケーションを実行し、
前記仮想システムのメモリの内容のスナップショットを取得して、前記仮想アドレスを用いて前記ストレージのストレージ同期エリアをマウントする他のサーバに送信し、
前記ストレージのストレージ同期エリアの内容を前記他のサーバのストレージのストレージ同期エリアに複製するサーバの運用方法。
[付記16]
サーバ仮想化機構を用いて構築される仮想システムのディスクイメージをストレージ同期エリアに記憶する他のサーバのストレージの前記ストレージ同期エリアに設定される仮想アドレスを用いて、NFS(Network File System)で前記他のサーバのストレージのストレージ同期エリアをマウントし、
前記マウントしたストレージ同期エリアの前記ディスクイメージを用いて前記仮想システムを待機系として稼動し、前記稼動した仮想システム上でアプリケーションの実行を待機し、
前記他のサーバから、前記ディスクイメージを用いて前記他のサーバ上で運用系として稼動され、該運用系として稼動されたシステム上でアプリケーションが実行される仮想システムのメモリの内容のスナップショットを受信して記憶し、
前記他のサーバに障害が発生した場合、前記他のサーバのストレージのストレージ同期エリアの内容が複製される自サーバのストレージのストレージ同期エリアに仮想アドレスを設定し、該仮想アドレスを用いて、前記NFSで自サーバのストレージのストレージ同期エリアをマウントし、記憶した前記スナップショットを用いて、前記仮想システム上で前記アプリケーションを実行するサーバの運用方法。
[付記17]
サーバ仮想化機構を用いて構築される仮想システムのディスクイメージをストレージ同期エリアに記憶する自サーバのストレージの前記ストレージ同期エリアに設定される仮想アドレスを用いて、NFS(Network File System)で前記ストレージのストレージ同期エリアをマウントし、
前記マウントしたストレージ同期エリアの前記ディスクイメージを用いて前記仮想システムを運用系として稼動し、該稼動した仮想システム上でアプリケーションを実行し、
前記仮想システムのメモリの内容のスナップショットを取得して、前記仮想アドレスを用いて前記ストレージのストレージ同期エリアをマウントする他のサーバに送信し、
前記ストレージのストレージ同期エリアの内容を前記他のサーバのストレージのストレージ同期エリアに複製する処理をサーバに実行させるためのプログラム。
[付記18]
サーバ仮想化機構を用いて構築される仮想システムのディスクイメージをストレージ同期エリアに記憶する他のサーバのストレージの前記ストレージ同期エリアに設定される仮想アドレスを用いて、NFS(Network File System)で前記他のサーバのストレージのストレージ同期エリアをマウントし、
前記マウントしたストレージ同期エリアの前記ディスクイメージを用いて前記仮想システムを待機系として稼動し、前記稼動した仮想システム上でアプリケーションの実行を待機し、
前記他のサーバから、前記ディスクイメージを用いて前記他のサーバ上で運用系として稼動され、該運用系として稼動されたシステム上でアプリケーションが実行される仮想システムのメモリの内容のスナップショットを受信して記憶し、
前記他のサーバに障害が発生した場合、前記他のサーバのストレージのストレージ同期エリアの内容が複製される自サーバのストレージのストレージ同期エリアに仮想アドレスを設定し、該仮想アドレスを用いて、前記NFSで自サーバのストレージのストレージ同期エリアをマウントし、記憶した前記スナップショットを用いて、前記仮想システム上で前記アプリケーションを実行する処理をサーバに実行させるためのプログラム。
10:フォールトトレラントシステム
11:第1サーバ
12:第2サーバ
21、22:ストレージ
31、32:ディスクイメージ
41、42:仮想システム
51、52:アプリケーション
100:フォールトトレラントシステム
110:プライマリサーバ
111、131:ハードウェア
112、132:ホストOS
113、133:QEMU
114、134:ゲストOS
115、135:呼制御アプリケーション
116、136:DRBD
117、137:監視アプリケーション
118、119、138、139:NIC
120、140:ストレージ
121、141:ハイパーバイザ
122、142:ストレージ同期エリア
123、143:仮想システムのディスクイメージ
124、144:マウントポイント
125、145:仮想システム
130:セカンダリサーバ

Claims (17)

  1. サーバ仮想化機構を用いて構築される仮想システムのディスクイメージをストレージ同期エリアに記憶する第1ストレージを有する第1サーバと、
    第2ストレージを有する第2サーバと
    を有し、
    前記第1ストレージの前記ストレージ同期エリアに仮想アドレスが設定されており、
    前記第1サーバ及び前記第2サーバは、それぞれ、前記仮想アドレスを用いて、NFS(Network File System)で前記第1ストレージのストレージ同期エリアをマウントし、
    前記第1サーバは、
    前記マウントしたストレージ同期エリアの前記ディスクイメージを用いて前記仮想システムを運用系として稼動し、
    該稼動した仮想システム上でアプリケーションを実行し、かつ、
    前記仮想システムのメモリの内容のスナップショットを取得して前記第2サーバに送信し、
    前記第2サーバは、
    前記マウントしたストレージ同期エリアの前記ディスクイメージを用いて前記仮想システムを待機系として稼動し、
    前記稼動した仮想システム上でアプリケーションの実行を待機し、
    前記第1サーバから前記スナップショットを受信して記憶し、
    前記第1サーバは、
    前記第1ストレージのストレージ同期エリアの内容を前記第2ストレージのストレージ同期エリアに複製し、
    前記第2サーバは、
    前記第1サーバに障害が発生した場合、前記第2ストレージのストレージ同期エリアに仮想アドレスを設定し、
    該仮想アドレスを用いて、前記NFSで前記第2ストレージのストレージ同期エリアをマウントし、
    記憶した前記スナップショットを用いて、前記仮想システム上で前記アプリケーションを実行する、
    フォールトトレラントシステムにおいて、
    前記第1サーバは、
    所定時間間隔で前記スナップショットを取得して前記第2サーバに送信する、
    フォールトトレラントシステム。
  2. 前記アプリケーションは、
    システム状態をデータベース化せず、システム状態をメモリ上で管理する、
    請求項1に記載のフォールトトレラントシステム。
  3. サーバ仮想化機構を用いて構築される仮想システムのディスクイメージをストレージ同期エリアに記憶するストレージと、
    前記仮想システム上で動作するアプリケーションと
    を有し、
    前記ストレージのストレージ同期エリアに設定された仮想アドレスを用いて、NFS(Network File System)で前記ストレージのストレージ同期エリアをマウントし、
    前記マウントしたストレージ同期エリアの前記ディスクイメージを用いて前記仮想システムを運用系として稼動し、
    該稼動した仮想システム上で前記アプリケーションを実行し、
    前記仮想システムのメモリの内容のスナップショットを取得し、
    該取得したスナップショットを、前記仮想アドレスを用いて前記ストレージのストレージ同期エリアをマウントし、
    該マウントしたストレージ同期エリアの前記ディスクイメージを用いて仮想システムを待機系として稼動し、
    該稼動した仮想システム上でアプリケーションの実行を待機する他のサーバに送信し、
    前記ストレージのストレージ同期エリアの内容を前記他のサーバのストレージのストレージ同期エリアに複製する、
    サーバにおいて、
    所定時間間隔で前記スナップショットを取得して前記他のサーバに送信する、
    サーバ。
  4. 前記ストレージのストレージ同期エリアの内容は、
    DRBD(Distributed Replicated Block Device)のシングルプライマリモードを用いて、前記他のサーバのストレージのストレージ同期エリアに複製される、
    請求項3に記載のサーバ。
  5. ストレージと、
    サーバ仮想化機構を用いて構築される仮想システム上で動作するアプリケーションと
    を有し、
    前記仮想システムのディスクイメージをストレージ同期エリアに記憶する他のサーバのストレージの前記ストレージ同期エリアに設定される仮想アドレスを用いて、NFS(Network File System)で前記他のサーバのストレージのストレージ同期エリアをマウントし、
    前記マウントしたストレージ同期エリアの前記ディスクイメージを用いて前記仮想システムを待機系として稼動し、
    前記稼動した仮想システム上でアプリケーションの実行を待機し、
    前記他のサーバから、前記ディスクイメージを用いて前記他のサーバ上で運用系として稼動され、該運用系として稼動するシステム上でアプリケーションが実行される仮想システムのメモリの内容のスナップショットを受信して記憶し、
    前記他のサーバに障害が発生した場合、
    前記他のサーバのストレージのストレージ同期エリアの内容が複製される自サーバのストレージのストレージ同期エリアに仮想アドレスを設定し、
    該仮想アドレスを用いて、前記NFSで自サーバのストレージのストレージ同期エリアをマウントし、
    記憶した前記スナップショットを用いて、前記仮想システム上で前記アプリケーションを実行する、
    サーバにおいて、
    前記他のサーバを監視し、
    前記他のサーバに障害が発生した場合、
    自サーバのストレージを待機系から運用系に切り替える、
    サーバ。
  6. 前記他のサーバ上で稼動する仮想システム上で動作するアプリケーションの実行を監視し、
    前記他のサーバ上で稼動する仮想システム上で動作するアプリケーションの実行に障害が発生した場合、
    自サーバ上で稼動する仮想システム上で動作するアプリケーションを、待機状態から動作状態に切り替える、
    請求項5に記載のサーバ。
  7. サーバ仮想化機構を用いて構築される仮想システムのディスクイメージをストレージ同期エリアに記憶する第1ストレージを有する第1サーバ、及び第2ストレージを有する第2サーバが、それぞれ、
    前記第1ストレージの前記ストレージ同期エリアに設定される仮想アドレスを用いて、NFS(Network File System)で前記第1ストレージのストレージ同期エリアをマウントし、
    前記第1サーバが、
    前記マウントしたストレージ同期エリアの前記ディスクイメージを用いて前記仮想システムを運用系として稼動し、
    該稼動した仮想システム上でアプリケーションを実行し、かつ、
    前記仮想システムのメモリの内容のスナップショットを取得して前記第2サーバに送信し、
    前記第2サーバは、
    前記マウントしたストレージ同期エリアの前記ディスクイメージを用いて前記仮想システムを待機系として稼動し、
    前記稼動した仮想システム上でアプリケーションの実行を待機し、
    前記第1サーバから受信したスナップショットを記憶し、
    前記第1サーバは、
    前記第1ストレージのストレージ同期エリアの内容を前記第2ストレージのストレージ同期エリアに複製し、
    前記第2サーバは、
    前記第1サーバに障害が発生した場合、
    前記第2ストレージのストレージ同期エリアに仮想アドレスを設定し、
    該仮想アドレスを用いて、前記NFSで前記第2ストレージのストレージ同期エリアをマウントし、
    記憶した前記スナップショットを用いて、前記仮想システム上で前記アプリケーションを実行する
    フォールトトレラントシステムにおいて、
    前記第1サーバが、
    所定時間間隔で前記スナップショットを取得して前記第2サーバに送信する、
    フォールトトレラントシステムの運用方法。
  8. 前記第2サーバが、
    前記第1サーバを監視し、
    前記第1サーバに障害が発生した場合、
    前記第2サーバのストレージを待機系から運用系に切り替える、
    請求項7に記載のフォールトトレラントシステムの運用方法。
  9. 前記第1サーバ及び前記第2サーバが、それぞれ
    前記第1サーバ及び前記第2サーバのそれぞれの上で稼動する仮想システム上で動作するアプリケーションの実行を監視し、
    前記第2サーバが、
    前記第1サーバ上で稼動する仮想システム上で動作するアプリケーションの実行に障害が発生した場合、
    前記第2サーバ上で稼動する仮想システム上で動作するアプリケーションを、待機状態から動作状態に切り替える
    請求項7又は8に記載のフォールトトレラントシステムの運用方法。
  10. 前記第1ストレージのストレージ同期エリアの内容は、
    DRBD(Distributed Replicated Block Device)のシングルプライマリモードを用いて
    前記第2ストレージのストレージ同期エリアに複製される
    請求項7から9何れか1つに記載のフォールトトレラントシステムの運用方法。
  11. 前記アプリケーションは、
    前記第1サーバ及び第2サーバとネットワークを介して接続される電話機能を有する装置の呼を制御する呼制御アプリケーションである
    請求項7から10何れか1つに記載のフォールトトレラントシステムの運用方法。
  12. 前記アプリケーションは、
    システム状態をデータベース化せず、システム状態をメモリ上で管理する
    請求項7から11何れか1つに記載のフォールトトレラントシステムの運用方法。
  13. サーバ仮想化機構を用いて構築される仮想システムのディスクイメージをストレージ同期エリアに記憶する自サーバのストレージの前記ストレージ同期エリアに設定される仮想アドレスを用いて、NFS(Network File System)で前記ストレージのストレージ同期エリアをマウントし
    前記マウントしたストレージ同期エリアの前記ディスクイメージを用いて前記仮想システムを運用系として稼動し、
    該稼動した仮想システム上でアプリケーションを実行し、
    前記仮想システムのメモリの内容のスナップショットを取得し、
    該取得したスナップショットを、前記仮想アドレスを用いて前記ストレージのストレージ同期エリアをマウントし、該マウントしたストレージ同期エリアの前記ディスクイメージを用いて仮想システムを待機系として稼動し、該稼動した仮想システム上でアプリケーションの実行を待機する他のサーバに送信し、
    前記ストレージのストレージ同期エリアの内容を前記他のサーバのストレージのストレージ同期エリアに複製する、
    サーバの運用方法において、
    所定時間間隔で前記スナップショットを取得して前記他のサーバに送信する、
    サーバの運用方法。
  14. 前記ストレージのストレージ同期エリアの内容は、
    DRBD(Distributed Replicated Block Device)のシングルプライマリモードを用いて、前記他のサーバのストレージのストレージ同期エリアに複製される、
    請求項13に記載のサーバの運用方法。
  15. サーバ仮想化機構を用いて構築される仮想システムのディスクイメージをストレージ同期エリアに記憶する他のサーバのストレージの前記ストレージ同期エリアに設定される仮想アドレスを用いて、
    NFS(Network File System)で前記他のサーバのストレージのストレージ同期エリアをマウントし、
    前記マウントしたストレージ同期エリアの前記ディスクイメージを用いて前記仮想システムを待機系として稼動し、
    前記稼動した仮想システム上でアプリケーションの実行を待機し、
    前記他のサーバから、前記ディスクイメージを用いて前記他のサーバ上で運用系として稼動され、該運用系として稼動されたシステム上でアプリケーションが実行される仮想システムのメモリの内容のスナップショットを受信して記憶し、
    前記他のサーバに障害が発生した場合、
    前記他のサーバのストレージのストレージ同期エリアの内容が複製される自サーバのストレージのストレージ同期エリアに仮想アドレスを設定し、
    該仮想アドレスを用いて、前記NFSで自サーバのストレージのストレージ同期エリアをマウントし、
    記憶した前記スナップショットを用いて、前記仮想システム上で前記アプリケーションを実行する、
    サーバの運用方法において、
    前記他のサーバを監視し、
    前記他のサーバに障害が発生した場合、
    自サーバのストレージを待機系から運用系に切り替える、
    サーバの運用方法。
  16. 前記他のサーバ上で稼動する仮想システム上で動作するアプリケーションの実行を監視し、
    前記他のサーバ上で稼動する仮想システム上で動作するアプリケーションの実行に障害が発生した場合、
    自サーバ上で稼動する仮想システム上で動作するアプリケーションを、待機状態から動作状態に切り替える
    請求項15に記載のサーバの運用方法。
  17. サーバに、
    請求項13から16何れか1つに記載のサーバの運用方法
    を実行させるためのプログラム。
JP2020163124A 2019-05-29 2020-09-29 フォールトトレラントシステム、サーバ、それらの運用方法、及びプログラム Active JP6954693B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020163124A JP6954693B2 (ja) 2019-05-29 2020-09-29 フォールトトレラントシステム、サーバ、それらの運用方法、及びプログラム

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2019100508A JP6773345B1 (ja) 2019-05-29 2019-05-29 フォールトトレラントシステム、サーバ、及びそれらの運用方法
JP2020163124A JP6954693B2 (ja) 2019-05-29 2020-09-29 フォールトトレラントシステム、サーバ、それらの運用方法、及びプログラム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2019100508A Division JP6773345B1 (ja) 2019-05-29 2019-05-29 フォールトトレラントシステム、サーバ、及びそれらの運用方法

Publications (2)

Publication Number Publication Date
JP2020205121A true JP2020205121A (ja) 2020-12-24
JP6954693B2 JP6954693B2 (ja) 2021-10-27

Family

ID=73837950

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020163124A Active JP6954693B2 (ja) 2019-05-29 2020-09-29 フォールトトレラントシステム、サーバ、それらの運用方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP6954693B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114791789A (zh) * 2022-05-05 2022-07-26 北京天融信网络安全技术有限公司 一种虚拟机容错***、方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005209191A (ja) * 2004-01-20 2005-08-04 Internatl Business Mach Corp <Ibm> 高可用性システムの遠隔エンタープライズ管理
JP2009003631A (ja) * 2007-06-20 2009-01-08 Nec Corp 冗長構成サーバシステム、同期処理方法、及びプログラム
JP2013186692A (ja) * 2012-03-08 2013-09-19 Hitachi Systems Ltd 仮想マシン提供システム
JP2016177716A (ja) * 2015-03-23 2016-10-06 横河電機株式会社 冗長化pcシステム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005209191A (ja) * 2004-01-20 2005-08-04 Internatl Business Mach Corp <Ibm> 高可用性システムの遠隔エンタープライズ管理
JP2009003631A (ja) * 2007-06-20 2009-01-08 Nec Corp 冗長構成サーバシステム、同期処理方法、及びプログラム
JP2013186692A (ja) * 2012-03-08 2013-09-19 Hitachi Systems Ltd 仮想マシン提供システム
JP2016177716A (ja) * 2015-03-23 2016-10-06 横河電機株式会社 冗長化pcシステム

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
二川 潤,外2名: "「DRBDと仮想化技術を利用した耐障害性と汎用性の高いサーバファームの構築」", 情報処理学会 シンポジウム インターネットと運用技術(IOT) 2008 [ONLINE], JPN6021033678, 4 December 2008 (2008-12-04), pages 105 - 110, ISSN: 0004583053 *
加森 剛徳,外4名: "「属性ベース暗号による認証を用いたグローバルライブマイグレーション支援システムの開発」", 情報処理学会 シンポジウム インターネットと運用技術シンポジウム(IOT) 2017 [ONLINE, JPN6021033676, 30 November 2017 (2017-11-30), pages 25 - 32, ISSN: 0004583055 *
田村 芳明,外3名: "「Kemari:仮想マシン間の同期による耐故障クラスタリング」", コンピュータシステム・シンポジウム論文集, vol. 第2009巻,第13号, JPN6021033677, 19 November 2009 (2009-11-19), pages 11 - 20, ISSN: 0004583054 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114791789A (zh) * 2022-05-05 2022-07-26 北京天融信网络安全技术有限公司 一种虚拟机容错***、方法及装置

Also Published As

Publication number Publication date
JP6954693B2 (ja) 2021-10-27

Similar Documents

Publication Publication Date Title
US10114834B2 (en) Exogenous virtual machine synchronization and replication
US9747179B2 (en) Data management agent for selective storage re-caching
US9727429B1 (en) Method and system for immediate recovery of replicated virtual machines
US8874746B1 (en) Collaboration between discrete systems and a shared system to consolidate shared storage-related services
US11106556B2 (en) Data service failover in shared storage clusters
JP4572250B2 (ja) 計算機切り替え方法、計算機切り替えプログラム及び計算機システム
US9280428B2 (en) Method for designing a hyper-visor cluster that does not require a shared storage device
JP2011060055A (ja) 仮想計算機システム、仮想マシンの復旧処理方法及びそのプログラム
US20060179218A1 (en) Method, apparatus and program storage device for providing geographically isolated failover using instant RAID swapping in mirrored virtual disks
US9992058B2 (en) Redundant storage solution
US20170161163A1 (en) System and method for providing failovers for a cloud-based computing environment
JP2012190175A (ja) フォールトトレラントシステム、サーバ、フォールトトレラント化方法およびプログラム
JP6954693B2 (ja) フォールトトレラントシステム、サーバ、それらの運用方法、及びプログラム
JP6773345B1 (ja) フォールトトレラントシステム、サーバ、及びそれらの運用方法
JP5285045B2 (ja) 仮想環境における故障復旧方法及びサーバ及びプログラム
JP2020129184A (ja) クラスタシステム、その制御方法、サーバ、及びプログラム
KR102327520B1 (ko) 무중단 네트워크 미러링 솔루션 시스템 및 그 방법
JPH09293001A (ja) 無停止保守システム
JP2009003631A (ja) 冗長構成サーバシステム、同期処理方法、及びプログラム
US11704071B1 (en) Delegating low priority tasks to a passive storage controller
CN117827544B (zh) 热备份***、方法、电子设备及存储介质
CN112019601B (zh) 一种基于分布式存储Ceph的两节点实现方法及***
CN112965790B (zh) 一种基于pxe协议的虚拟机启动方法及电子设备
US20220215001A1 (en) Replacing dedicated witness node in a stretched cluster with distributed management controllers
JP2021082052A (ja) 制御装置及び制御プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200929

TRDD Decision of grant or rejection written
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210825

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210831

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210922

R150 Certificate of patent or registration of utility model

Ref document number: 6954693

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150