JP2009187090A - Cluster system and information processing method - Google Patents
Cluster system and information processing method Download PDFInfo
- Publication number
- JP2009187090A JP2009187090A JP2008023724A JP2008023724A JP2009187090A JP 2009187090 A JP2009187090 A JP 2009187090A JP 2008023724 A JP2008023724 A JP 2008023724A JP 2008023724 A JP2008023724 A JP 2008023724A JP 2009187090 A JP2009187090 A JP 2009187090A
- Authority
- JP
- Japan
- Prior art keywords
- virtual
- server
- storage
- transfer device
- physical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Hardware Redundancy (AREA)
Abstract
Description
本発明は、クラスタシステムに関する。 The present invention relates to a cluster system.
サーバを複数台使用して冗長化することによりシステムの可用性を向上させるクラスタシステムが知られている。クラスタシステムは、運用系のサーバと待機系のサーバを備え、運用系のサーバに障害が生じたときに、運用系のサーバの業務を待機系のサーバに引き継がせることによりサービスの継続性を図る。クラスタシステムの性能を良くするために、様々な視点から試みがなされている。 A cluster system is known in which a plurality of servers are used for redundancy to improve system availability. The cluster system includes an active server and a standby server. When a failure occurs in the active server, the service of the active server is transferred to the standby server to ensure service continuity. . Attempts have been made from various viewpoints to improve the performance of the cluster system.
例えば、特許文献1に開示されたシステムは、運用系の物理サーバと待機系の物理サーバを備え、運用系の物理サーバに仮想サーバが設けられている。運用系の物理サーバと待機系の物理サーバが仮想サーバの業務を代行可能に構築されている。通常、運用系の物理サーバにより仮想サーバの業務を代行してサービスを行い、運用系の物理サーバに障害が生じたときに、待機系の物理サーバは運用系に昇格して仮想サーバの業務を代行する。クライアントは、接続先のサーバアドレスを仮想サーバのアドレスに設定すれば、物理サーバが切り替わっても接続先のサーバアドレスの再設定を行わずにサービスを継続的に受けることができる。 For example, the system disclosed in Patent Literature 1 includes an active physical server and a standby physical server, and the active physical server includes a virtual server. The active physical server and the standby physical server are configured to be able to perform virtual server tasks. Normally, the active physical server performs services on behalf of the virtual server business, and when a failure occurs in the active physical server, the standby physical server is promoted to the active system to perform virtual server business. Act on behalf. By setting the connection destination server address to the virtual server address, the client can continuously receive the service without resetting the connection destination server address even if the physical server is switched.
また、特許文献2に開示されたシステムは、複数の運用系の物理サーバと、1つの待機系の物理サーバを備え、各運用系の物理サーバには複数の仮想サーバが設けられている。いずれかの運用系の物理サーバに障害が生じたときに、待機系の物理サーバにより、障害が生じた運用系の物理サーバ上の仮想サーバを稼動させる。こうすることにより、複数の運用系の物理サーバに対して1つの待機系の物理サーバのみを用意すればよいので、サーバの数を減らすことができ、システムの規模を小さくできる。 The system disclosed in Patent Document 2 includes a plurality of active physical servers and one standby physical server, and each active physical server includes a plurality of virtual servers. When a failure occurs in any of the active physical servers, the virtual server on the active physical server in which the failure has occurred is operated by the standby physical server. In this way, since only one standby physical server needs to be prepared for a plurality of active physical servers, the number of servers can be reduced and the scale of the system can be reduced.
特許文献3に開示されたシステムは、バスを介して接続された、同時に同じ処理を行う3つ以上の処理装置を備える。これらの処理装置の結果が一致すれば、すべての処理装置が正常であると判断する。一方、結果が他の処理装置の結果と一致しない処理装置があれば、該処理装置を切り離し、他の処理装置により処理を続行する。こうすることにより、信頼性の高い処理システムを実現する。 The system disclosed in Patent Document 3 includes three or more processing devices that are connected via a bus and simultaneously perform the same processing. If the results of these processing devices match, it is determined that all the processing devices are normal. On the other hand, if there is a processing device whose result does not match the result of another processing device, the processing device is disconnected and the processing is continued by the other processing device. In this way, a highly reliable processing system is realized.
特許文献4にも相似したシステムが開示されている。
特許文献1と特許文献2に開示されたシステムは、運用系の物理サーバに仮想サーバを構築し、運用系の物理サーバに生じたときに待機系の物理サーバにより仮想サーバを稼動させるため、運用系の物理サーバに障害が生じ、仮想サーバの動作が停止したことを検出してから、再起動するまで時間がかかるという問題がある。また、運用系の物理サーバが停止したときに、該物理サーバ上で処理され、まだ出力されていない内容が破棄されてしまうため、待機系の物理サーバにより仮想サーバを起動させた後、データの整合性を確認するなど煩雑の処理が必要である。 The systems disclosed in Patent Literature 1 and Patent Literature 2 are constructed in such a way that a virtual server is constructed on the active physical server, and the virtual server is operated by the standby physical server when the virtual server is generated on the active physical server. There is a problem that it takes a long time to restart after detecting that the physical server of the host system has failed and the operation of the virtual server has stopped. In addition, when the active physical server stops, the contents that have been processed on the physical server and have not been output yet are discarded. Therefore, after the virtual server is started by the standby physical server, Complicated processing such as checking consistency is necessary.
特許文献3と特許文献4に開示されたシステムをサーバシステムに適用すると、実質的には、複数の物理サーバを同時に稼働させることになる。そのため、障害が生じたサーバのサービスを受けていたクライアントは、該サーバがバスから切り離された後に正常のサーバへの再接続手続きが煩雑であると共に、アドレスの再設定などにより再びサービスを受けることができるまで時間がかかることである。 When the systems disclosed in Patent Literature 3 and Patent Literature 4 are applied to a server system, a plurality of physical servers are substantially operated simultaneously. For this reason, a client that has received the service of the server in which the failure has occurred is not able to reconnect to the normal server after the server is disconnected from the bus, and receives the service again by resetting the address. It takes time to complete.
本発明は、上記事情を鑑みてなされたものであり、上記問題を解決し、可用性の高いクラスタシステムを提供する。 The present invention has been made in view of the above circumstances, and solves the above problems and provides a highly available cluster system.
本発明の一つの態様は、クラスタシステムである。このクラスタシステムは、2つの物理サーバと、該2つの物理サーバにそれぞれ設けられた2つの仮想サーバと、仮想サーバが動作するためのソフトウェアを格納するストレージと、物理サーバとストレージ間でデータ転送を行うストレージ転送装置と、物理サーバと外部との間でデータ転送を行う外部データ転送装置を備える。 One aspect of the present invention is a cluster system. This cluster system includes two physical servers, two virtual servers provided on the two physical servers, storage for storing software for operating the virtual servers, and data transfer between the physical servers and the storage. A storage transfer device for performing data transfer, and an external data transfer device for transferring data between the physical server and the outside.
2つの仮想サーバは、それぞれプライマリ/セカンダリとして動作し、I/O処理を含む同じ処理を行う。 The two virtual servers operate as primary / secondary, respectively, and perform the same processing including I / O processing.
ストレージ転送装置と外部データ転送装置は、プライマリとして動作する仮想サーバがある物理サーバに転送するデータを、セカンダリとして動作する仮想サーバがある物理サーバにも転送する。 The storage transfer device and the external data transfer device transfer data to be transferred to the physical server having the virtual server operating as the primary to the physical server having the virtual server operating as the secondary.
物理サーバは、ストレージ転送装置と、自身に設けられた仮想サーバとの間でデータ転送を行う仮想ストレージ伝送装置と、外部データ転送装置と、自身に設けられた仮想サーバとの間でデータ転送を行う仮想外部データ転送装置とを備える。 The physical server transfers data between the storage transfer device and the virtual storage transmission device that transfers data between the virtual server provided in itself, the external data transfer device, and the virtual server provided in itself. And a virtual external data transfer device for performing.
仮想ストレージ転送装置と仮想外部データ転送装置は、同物理サーバ内の仮想サーバ宛てのデータを該仮想サーバに転送し、該仮想サーバから前記ストレージまたは外部に出力するデータについては、該仮想サーバがプライマリとして動作する場合にはデータをストレージ転送装置または外部データ転送装置に転送する一方、該仮想サーバがセカンダリとして動作する場合にはデータを破棄する。 The virtual storage transfer device and the virtual external data transfer device transfer the data addressed to the virtual server in the physical server to the virtual server, and the virtual server is the primary for the data output from the virtual server to the storage or the outside. When the virtual server operates as a secondary, the data is transferred to a storage transfer device or an external data transfer device, while when the virtual server operates as a secondary, the data is discarded.
なお、上記態様のクラスタシステムを装置や方法として置き換えて表現したものも、本発明の態様としては有効である。 A representation of the cluster system in the above aspect replaced with an apparatus or method is also effective as an aspect of the present invention.
本発明にかかる技術によれば、クラスタシステムにおいて、サーバの切替え時にサービスが再稼働するまでの時間を短縮できる。 According to the technique according to the present invention, in the cluster system, it is possible to shorten the time until the service is restarted when the server is switched.
図1は、本発明の実施の形態にかかるクラスタシステム100を示す。クラスタシステム100は、物理サーバ200と、物理サーバ300と、ネットワークスイッチ(以下LANスイッチという)120と、ストレージスイッチ(以下SANスイッチという)140と、ストレージ160を備える。
FIG. 1 shows a
ストレージ160は、複数のハードディスクHDD((図示の例では3つ:HDD162、HDD164、HDD166)を備え、物理サーバ200と物理サーバ300に構築された後述する仮想サーバのOS(以下ゲストOSという。OS:オペレーティング システム)のソフトウェアを格納している。物理サーバ200と物理サーバ300は、SANスイッチ140を介してストレージ160に格納されたゲストOSソフトウェアを実行させることにより仮想サーバを実現する。
The
SANスイッチ140は、ストレージ160と接続されていると共に、そのポート142が物理サーバ200に接続され、ポート144が物理サーバ300に接続される。
The
LANスイッチ120は、外部ネットワーク(以下外部LANという)400と、物理サーバ200および物理サーバ300との間のパケット転送を行う。
The
物理サーバ200は、ハードウェア240と、ハードウェア240を制御する仮想マシンモニタ(以下ハイパーバイザという)230を有する。LANスイッチ120は、外部ネットワーク400と接続されていると共に、そのポート122が物理サーバ200に接続され、ポート124が物理サーバ300に接続される。
The
ハードウェア240は、SANスイッチ140におけるポート142と接続するホストバスアダプタ(以下HBAという)242と、LANスイッチ120におけるポート122と接続するネットワークインタフェースコントローラ(以下NICという)244を備える。HBA242とNIC244は、物理インタフェースである。
The
ハイパーバイザ230上に、複数のゲストOS(図示の例では2つ:ゲストOS210、ゲストOS220)が稼動しており、それぞれ仮想サーバを構成する。なお、前述したように、ゲストOS210とゲストOS220のソフトウェアは、ストレージ160に格納されている。
On the
ハイパーバイザ230は、仮想インタフェースとして、ストレージ160と通信するための仮想HBA231と、LAN通信を行うための仮想NIC233と、SANスイッチをエミュレートした仮想SANスイッチ232、LANスイッチをエミュレートした仮想LANスイッチ234を備える。仮想SANスイッチ232はハードウェア240におけるHBA242と接続され、仮想LANスイッチ234はハードウェア240におけるNIC244と接続される。
The
ゲストOS210は、仮想HBA212と仮想NIC214を備え、ゲストOS220は、仮想HBA222と、仮想NIC224を備える。
The guest OS 210 includes a
物理サーバ200における全ての仮想HBAは、仮想SANスイッチ232に接続され、仮想SANスイッチ232、HBA242、SANスイッチ140を介してストレージ160とデータの送受信を行う。また、物理サーバ200における全ての仮想NICは、仮想LANスイッチ234に接続され、仮想LANスイッチ234、NIC244、LANスイッチ120を介して外部ネットワーク400と通信を行う。
All virtual HBAs in the
ハイパーバイザ230は、さらにリソース監視部235を備える。リソース監視部235は、各ゲストOSに割り当てたリソースの監視を行うものであり、具体的にはゲストOSに割り当てたCPUリソース、割当時間、割込処理数、I/O処理数などのリソースを監視する。
The
物理サーバ300は、HBA342とNIC344を有するハードウェア340と、ハードウェア340上で動作するハイパーバイザ330と、ハイパーバイザ330上で動作する複数のゲストOSを備え、物理サーバ200と同じ構成である。なお、ハイパーバイザ230のリソース監視部235と、ハイパーバイザ330のリソース監視部335は、例えば図示しないインターコネクトを介して互いに通信可能である。
The
前述したように、ハイパーバイザがハードウェア上で動作し、ゲストOSがハイパーバイザ上で動作することにより仮想サーバが実現される。以下において、説明上の便宜のため、ゲストOSを仮想サーバとして説明する。 As described above, the virtual server is realized by the hypervisor operating on the hardware and the guest OS operating on the hypervisor. In the following, for convenience of explanation, the guest OS will be described as a virtual server.
本実施の形態において、ゲストOS210とゲストOS310は、プライマリ/セカンダリの関係を有し、I/0処理を含め、同様の処理を行う。ここで、例として、ゲストOS210がプライマリで動作し、ゲストOS310がセカンダリで動作することにして詳細に説明する。
In the present embodiment, the
LANスイッチ120において、プライマリゲストOSがある側に接続されるポート(以下プライマリ側ポート)は通常の通信を行い、セカンダリゲストOSがある側に接続されるポート(以下セカンダリ側ポートという)は、外部ネットワーク400からプライマリ側ポートに転送されるパケットをコピーしてセカンダリ側の物理サーバに転送する。
In the
ゲストOS210がプライマリであり、ゲストOS310がセカンダリであるため、LANスイッチ120のポート122はプライマリ側ポートになり、ポート124は、セカンダリ側ポートになる。例えば、外部ネットワーク400から受信し、ポート122から物理サーバ200のNIC244に向けてパケットが送出されたとする。ポート124は、このパケットをコピーして物理サーバ300のNIC344に送出する。すなわち、外部ネットワーク400からポート122を介してNIC244に転送される全てのパケットについて、同様なパケットがポート124を介してNIC344にも転送される。
Since the
NIC244とNIC344は、プロスミスキャスモード(無差別モード)で動作し、受信したすべてのパケットを仮想LANスイッチ234と仮想LANスイッチ334にそれぞれ転送する。
The
仮想LANスイッチ234と仮想LANスイッチ334は、受信したパケットの宛先MACアドレスを参照し、このMACアドレスに対応する仮想NICにパケットを転送する。
The
LAN通信について、ゲストOS210の仮想NIC214と、ゲストOS310の仮想NIC314は同じMACアドレスを有する。そのため、ゲストOS210とゲストOS310は、同様なパケットを受信する。
For LAN communication, the
ゲストOS210とゲストOS310は、受信したパケットに応じて処理を行う。前述したように、ゲストOS210とゲストOS310は、同じ処理を行う。
The
また、仮想NIC214は、ゲストOS210から出力したパケットを仮想SANスイッチ232に転送する。仮想NIC314も、ゲストOS310から出力したパケットを仮想LANスイッチ334に転送する。
In addition, the
仮想SANスイッチ232は、仮想NIC214から転送されてきたパケットの宛先MACアドレスに応じて転送を行う。仮想LANスイッチ234は、仮想NIC324から転送されてきたパケットの宛先MACアドレスが、同じ物理サーバ300内の仮想NIC宛てのものであればMACアドレスに応じて転送を行うが、このパケットがNIC344を介して外部に出力するパケットであればそれを破棄する。また、仮想NIC214からブロードキャストでパケットが送出された場合、このパケットはLANスイッチ120、NIC344を介して仮想LANスイッチ334に到達するが、仮想NIC314のMACアドレスが、パケットの送信元のMAC(すなわち仮想NIC214のMACアドレス)と同じであるため、このパケットは仮想NIC314に転送されない。
The
このように、ゲストOS210とゲストOS310は、同じパケットが入力され、同じ処理を行うが、物理サーバ200と物理サーバ300の外部には、プライマリ側のゲストOS210からのみパケットの出力がなされる。
As described above, the
ゲストOS210の仮想HBA212と、ゲストOS310の仮想HBA312も、同じアドレスを有する。たとえば、HBAのインタフェースとしてFC(ファイバチャネル)が使用される場合には、仮想HBA212と仮想HBA312は同じWWN(World Wide Name)を有する。また、HBAのインタフェースとしてIP−SANが使用される場合には、仮想HBA212と例えば、このパケットの宛先が仮想NIC224のMACアドレスであればそれをNI213は、同じMACアドレスを有する。
The
SANスイッチ140、HBA242、仮想SANスイッチ232、仮想HBA212、HBA342、仮想SANスイッチ332、仮想HBA312も、LAN通信と同じように、ストレージ160からゲストOS210とゲストOS310に同じデータが入力されるが、ストレージ160には、プライマリ側のゲストOS210からのみデータが出力されるように構成されている。
The
上記のように、HBA、NICのI/Oについて、プライマリ側のゲストOS210とゲストOS310は同じI/O処理を行う。ただし、送受信するI/Oは、セカンダリの方がプライマリより遅れて処理されるため、ハイパーバイザ230とハイパーバイザ330は、リソース監視部235とリソース監視部335を介して相互に通信を行い、I/Oの順序が逆転しないように調整を行う。また、2つのハイパーバイザは、それぞれのゲストOSにCPUリソースの割当てを行うが、この割当ても、ハイパーバイザ230とハイパーバイザ330間で調整しながら行われる。ゲストOSのCPU処理についても、I/O処理と同じように、プライマリの方が先行し、セカンダリの方はプライマリより遅れて処理を行う。
As described above, the
このように、物理サーバ200におけるゲストOS210はプライマリとして動作し、物理サーバ300におけるゲストOS310はセカンダリとして動作する。2つのゲストOSは、LAN通信について外部ネットワーク400から同じパケットが入力され、ストレージアクセスについてストレージ160から同じデータが入力され、同じ処理を行う。また、外部ネットワーク400とストレージ160へは、ゲストOS210からの出力のみが転送される。
Thus, the
ハイパーバイザ230とハイパーバイザ330は、死活監視のためにインターコネクトを介して通信を行い、プライマリ側のハイパーバイザ230からの通信が途切れた場合、ハイパーバイザ330は、物理サーバ200に故障が生じたとして、ゲストOS310がプライマリに昇格するように下記の処理を行う。
The
LANスイッチ120は、仮想NIC214と仮想NIC314のMACアドレスを宛先とするパケットをポート122に転送するようになっていた。LANスイッチ120が、受信したパケットにあるMACアドレスを学習して保管するFDB(Forwarding Database)に基づいてパケットを転送するため、ハイパーバイザ330は、ダミーのARP(Address Resolution Protocol)を発行して、仮想NIC214と仮想NIC314のMACアドレスを宛先とするパケットの転送先をポート124になるようにFDBを変更する。そして、ポート122からポート124にパケットをコピーする設定を、ポート124からポート122にコピーするように変更する。
The
SANスイッチ140のポート142とポート144について、ポート142からポート144へコピーする設定を、ポート144からポート142にコピーするように変更する。
For the
また、仮想LANスイッチ334において、仮想NIC314からNIC344に向けて送出したパケットを破棄する設定を、NIC344に転送するように変更する。
In the
また、仮想SANスイッチ332において、仮想HBA312からHBA342に向けて送出したデータを破棄する設定を、HBA342に転送するように変更する。
In the
上記設定の終了をもって、ゲストOS310は、プライマリに昇格する。
Upon completion of the above settings, the
その後、物理サーバ200が復旧すると、ハイパーバイザ230は、ハイパーバイザ330との通信を再開すると共に、ハイパーバイザ330から、ゲストOS310のメモリデータをインターコネクトを介してコピーする。その後、ハイパーバイザ330は、一旦ゲストOS310の処理を止め、上記コピー後のメモリデータの差分、ページテーブル情報、リソース監視部335で保管しているリソース情報もハイパーバイザ230にコピーする。そして、ハイパーバイザ230は、ゲストOS210をセカンダリとして動作させるため、ゲストOS210から外部へ送出するパケットやデータを破棄するように、仮想SANスイッチ232と仮想LANスイッチ234の設定を行う。これらの準備が終了すると、ハイパーバイザ230は、ハイパーバイザ330に通知をし、ハイパーバイザ330は、プライマリとして再びゲストOS310を動作させる。ハイパーバイザ230も、ゲストOS310のセカンダリとしてゲストOS210を動作させる。
Thereafter, when the
このように、本実施の形態のクラスタシステム100によれば、2つの異なる物理サーバに仮想サーバをそれぞれ設け、I/O処理を含めた同じ処理をほぼ同時に2つの仮想サーバに行わせる。外部からの入力については、同じパケットやデータを2つの仮想サーバに入力し、外部への出力については、プライマリ側の出力のみが送出される。そして、プライマリの仮想サーバがある物理サーバに障害が生じたときに、セカンダリの仮想サーバがプライマリに昇格し、外部への出力ができるようになる。また、障害が生じた物理サーバが復旧した後は、プライマリに昇格した仮想サーバのセカンダリとして、同様の処理を行う。
As described above, according to the
こうすることにより、まず、サーバの切替えがあっても、クライアントは接続先のサーバのアドレスなどを気にせずにサービスを受けることができる。 By doing so, even if the server is switched, the client can receive the service without worrying about the address of the connection destination server.
また、プライマリ/セカンダリの仮想サーバは、ほぼ同時に同じ処理を行うので、サーバ切替時に、サービスの再稼働までの時間を短縮することができる。 Further, since the primary / secondary virtual servers perform the same process almost simultaneously, the time until the service is restarted can be shortened when the servers are switched.
さらに、プライマリ/セカンダリの仮想サーバは、ほぼ同時に同じ処理を行うので、プライマリの方が処理してまだ出力していない内容は、セカンダリの方で得られており、破棄されることが無い。 Further, since the primary / secondary virtual servers perform the same process almost simultaneously, the contents processed by the primary and not yet output are obtained by the secondary and are not discarded.
また、従来ではクラスタシステムを構築する際に、OS毎のクラスタ用ソフトウェアの開発が必要である。それに対して、本実施の形態では、2つの仮想化サーバによりクラスタシステムを構成するので、OS毎に対応しなくてよい。 Conventionally, when building a cluster system, it is necessary to develop cluster software for each OS. On the other hand, in this embodiment, since the cluster system is configured by two virtualization servers, it is not necessary to correspond to each OS.
以上、実施の形態をもとに本発明を説明した。実施の形態は例示であり、本発明の主旨から逸脱しない限り、さまざまな変更、増減を加えてもよい。これらの変更、増減が加えられた変形例も本発明の範囲にあることは当業者に理解されるところである。 The present invention has been described above based on the embodiment. The embodiment is an exemplification, and various changes and increases / decreases may be added without departing from the gist of the present invention. It will be understood by those skilled in the art that modifications to which these changes and increases / decreases are also within the scope of the present invention.
100 クラスタシステム 120 LANスイッチ
122 ポート 124 ポート
140 SANスイッチ 142 ポート
144 ポート 160 ストレージ
162 HDD 164 HDD
166 HDD 200 物理サーバ
210 ゲストOS 212 仮想HBA
214 仮想NIC 220 ゲストOS
222 仮想HBA 224 仮想NIC
230 ハイパーバイザ 231 仮想HBA
232 仮想SANスイッチ 233 仮想NIC
234 仮想LANスイッチ 235 リソース監視部
240 ハードウェア 242 HBA
244 NIC 300 物理サーバ
310 ゲストOS 312 仮想HBA
314 仮想NIC 320 ゲストOS
322 仮想HBA 324 仮想NIC
330 ハイパーバイザ 331 仮想HBA
332 仮想SANスイッチ 333 仮想NIC
334 仮想LANスイッチ 335 リソース監視部
340 ハードウェア 342 HBA
344 NIC 400 外部ネットワーク
100
166
214
222
232
234 Virtual LAN switch 235
244
314
322
332
334 Virtual LAN switch 335
344
Claims (4)
該2つの物理サーバにそれぞれ設けられた2つの仮想サーバと、
前記仮想サーバが動作するためのソフトウェアを格納するストレージと、
前記物理サーバと前記ストレージ間でデータ転送を行うストレージ転送装置と、
前記物理サーバと外部との間でデータ転送を行う外部データ転送装置とを備え、
前記2つの仮想サーバは、それぞれプライマリ/セカンダリとして動作し、I/O処理を含む同じ処理を行い、
前記ストレージ転送装置と前記外部データ転送装置は、プライマリとして動作する仮想サーバがある物理サーバに転送するデータを、セカンダリとして動作する仮想サーバがある物理サーバにも転送し、
前記物理サーバは、
前記ストレージ転送装置と、自身に設けられた仮想サーバとの間でデータ転送を行う仮想ストレージ伝送装置と、
前記外部データ転送装置と、自身に設けられた仮想サーバとの間でデータ転送を行う仮想外部データ転送装置とを備え、
前記仮想ストレージ転送装置と前記仮想外部データ転送装置は、同じ物理サーバ内の仮想サーバ宛てのデータを該仮想サーバに転送し、該仮想サーバから前記ストレージまたは外部に出力するデータについては、該仮想サーバがプライマリとして動作する場合には前記データを前記ストレージ転送装置または前記外部データ転送装置に転送する一方、該仮想サーバがセカンダリとして動作する場合には前記データを破棄することを特徴とするクラスタシステム。 Two physical servers,
Two virtual servers respectively provided in the two physical servers;
Storage for storing software for operating the virtual server;
A storage transfer device for transferring data between the physical server and the storage;
An external data transfer device for transferring data between the physical server and the outside,
The two virtual servers each operate as a primary / secondary, perform the same processing including I / O processing,
The storage transfer device and the external data transfer device transfer data transferred to a physical server having a virtual server operating as a primary to a physical server having a virtual server operating as a secondary,
The physical server is
A virtual storage transmission device for transferring data between the storage transfer device and a virtual server provided in the storage transfer device;
A virtual external data transfer device that performs data transfer between the external data transfer device and a virtual server provided in the external data transfer device;
The virtual storage transfer device and the virtual external data transfer device transfer data addressed to a virtual server in the same physical server to the virtual server, and for data to be output from the virtual server to the storage or outside, the virtual server A cluster system, wherein when the virtual server operates as a primary, the data is transferred to the storage transfer device or the external data transfer device, while when the virtual server operates as a secondary, the data is discarded.
前記仮想外部データ転送装置は、仮想LANスイッチであり、
前記物理サーバは、前記LANスイッチのポートと前記仮想LANスイッチとの間に接続され、プロミスキャスモードで動作するNIC(Network Interface Controller)をさらに備え、
前記LANスイッチは、外部ネットワークから、プライマリとして動作する仮想サーバがある物理サーバの前記NICと接続されたポートに転送するデータをコピーして、セカンダリとして動作する仮想サーバがある物理サーバの前記NICと接続されたポートに転送し、
前記NICは、プロミスキャスモードで動作し、
前記2つの仮想サーバは、同じMAC(Media Access Control)アドレスを有する仮想NICを備えることを特徴とする請求項1に記載のクラスタシステム。 The external data transfer device is a LAN (Local Area Network) switch for transferring data between an external network and the physical server,
The virtual external data transfer device is a virtual LAN switch,
The physical server further includes a NIC (Network Interface Controller) connected between the port of the LAN switch and the virtual LAN switch and operating in a promiscuous mode,
The LAN switch copies data to be transferred from an external network to a port connected to the NIC of a physical server having a virtual server operating as a primary, and the NIC of the physical server having a virtual server operating as a secondary Forward to the connected port,
The NIC operates in promiscuous mode,
The cluster system according to claim 1, wherein the two virtual servers include virtual NICs having the same MAC (Media Access Control) address.
セカンダリとして動作する仮想サーバは、プライマリとして動作する仮想サーバの動作停止を検出した際に、プライマリとして動作することを特徴とする請求項1または2に記載のクラスタシステム。 The two virtual servers perform alive monitoring on each other,
3. The cluster system according to claim 1, wherein the virtual server that operates as the secondary operates as the primary when the stop of the operation of the virtual server that operates as the primary is detected. 4.
前記仮想サーバが動作するためのソフトウェアを格納するストレージからまたは外部から、プライマリとして動作する仮想サーバがある物理サーバに転送するデータを、セカンダリとして動作する仮想サーバがある物理サーバにも転送し、
プライマリとして動作する仮想サーバから外部または前記ストレージへ出力するデータを外部または前記ストレージに転送する一方、セカンダリとして動作する仮想サーバから外部または前記ストレージへ出力するデータを破棄することを特徴とする情報処理方法。 Two virtual servers respectively provided in two physical servers operate as primary / secondary, perform the same processing including I / O processing,
From the storage for storing the software for operating the virtual server or from the outside, the data transferred to the physical server with the virtual server operating as the primary is transferred to the physical server with the virtual server operating as the secondary,
Information output from a virtual server operating as a primary to the outside or the storage is transferred to the outside or the storage, while data output from a virtual server operating as a secondary to the outside or the storage is discarded Method.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008023724A JP5262145B2 (en) | 2008-02-04 | 2008-02-04 | Cluster system and information processing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008023724A JP5262145B2 (en) | 2008-02-04 | 2008-02-04 | Cluster system and information processing method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009187090A true JP2009187090A (en) | 2009-08-20 |
JP5262145B2 JP5262145B2 (en) | 2013-08-14 |
Family
ID=41070304
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008023724A Expired - Fee Related JP5262145B2 (en) | 2008-02-04 | 2008-02-04 | Cluster system and information processing method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5262145B2 (en) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012014674A (en) * | 2010-06-04 | 2012-01-19 | Nippon Telegr & Teleph Corp <Ntt> | Failure recovery method, server, and program in virtual environment |
WO2012063294A1 (en) * | 2010-11-12 | 2012-05-18 | 株式会社日立製作所 | Computer system |
JP2013088826A (en) * | 2011-10-13 | 2013-05-13 | Hitachi Ltd | Data input method in redundant system |
JP2013527532A (en) * | 2010-05-14 | 2013-06-27 | マイクロソフト コーポレーション | Interconnecting virtual network members |
JP2013540317A (en) * | 2010-09-27 | 2013-10-31 | フィッシャー−ローズマウント システムズ,インコーポレイテッド | Method and apparatus for virtualizing a process control system |
CN103703653A (en) * | 2011-07-22 | 2014-04-02 | 魁北克水电公司 | Switching apparatus, control system and method for varying impedance of phase line |
WO2015132953A1 (en) * | 2014-03-07 | 2015-09-11 | 三菱電機株式会社 | Computer device and computer mechanism |
EP2583417A4 (en) * | 2010-06-18 | 2016-03-02 | Nokia Solutions & Networks Oy | Server cluster |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1091467A (en) * | 1996-09-17 | 1998-04-10 | Hitachi Ltd | Multiplex system computer and its backup method |
JPH10190712A (en) * | 1996-12-20 | 1998-07-21 | Nec Corp | Packet distribution device |
JPH1115502A (en) * | 1997-06-24 | 1999-01-22 | Mitsubishi Electric Corp | Digital controller |
JP2004032224A (en) * | 2002-06-25 | 2004-01-29 | Hitachi Ltd | Server takeover system and method thereof |
JP2006165877A (en) * | 2004-12-06 | 2006-06-22 | Oki Techno Creation:Kk | Communication system, communication method, and communication program |
JP2006189963A (en) * | 2004-12-28 | 2006-07-20 | Hitachi Ltd | Storage access control method, cluster system, path connection switch, and storage access control program |
JP2006209487A (en) * | 2005-01-28 | 2006-08-10 | Hitachi Ltd | Computer system, computer, storage device, and management terminal |
JP2007042001A (en) * | 2005-08-05 | 2007-02-15 | Hitachi Ltd | Computer system, synchronization processing method, and program |
JP2007148839A (en) * | 2005-11-29 | 2007-06-14 | Hitachi Ltd | Failure recovery method |
JP2007158870A (en) * | 2005-12-07 | 2007-06-21 | Hitachi Ltd | Virtual computer system and network communication method thereof |
JP2007272263A (en) * | 2006-03-30 | 2007-10-18 | Hitachi Ltd | Method for managing computer, computer system, and management program |
JP2007299161A (en) * | 2006-04-28 | 2007-11-15 | Hitachi Ltd | San management method and san management system |
-
2008
- 2008-02-04 JP JP2008023724A patent/JP5262145B2/en not_active Expired - Fee Related
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1091467A (en) * | 1996-09-17 | 1998-04-10 | Hitachi Ltd | Multiplex system computer and its backup method |
JPH10190712A (en) * | 1996-12-20 | 1998-07-21 | Nec Corp | Packet distribution device |
JPH1115502A (en) * | 1997-06-24 | 1999-01-22 | Mitsubishi Electric Corp | Digital controller |
JP2004032224A (en) * | 2002-06-25 | 2004-01-29 | Hitachi Ltd | Server takeover system and method thereof |
JP2006165877A (en) * | 2004-12-06 | 2006-06-22 | Oki Techno Creation:Kk | Communication system, communication method, and communication program |
JP2006189963A (en) * | 2004-12-28 | 2006-07-20 | Hitachi Ltd | Storage access control method, cluster system, path connection switch, and storage access control program |
JP2006209487A (en) * | 2005-01-28 | 2006-08-10 | Hitachi Ltd | Computer system, computer, storage device, and management terminal |
JP2007042001A (en) * | 2005-08-05 | 2007-02-15 | Hitachi Ltd | Computer system, synchronization processing method, and program |
JP2007148839A (en) * | 2005-11-29 | 2007-06-14 | Hitachi Ltd | Failure recovery method |
JP2007158870A (en) * | 2005-12-07 | 2007-06-21 | Hitachi Ltd | Virtual computer system and network communication method thereof |
JP2007272263A (en) * | 2006-03-30 | 2007-10-18 | Hitachi Ltd | Method for managing computer, computer system, and management program |
JP2007299161A (en) * | 2006-04-28 | 2007-11-15 | Hitachi Ltd | San management method and san management system |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013527532A (en) * | 2010-05-14 | 2013-06-27 | マイクロソフト コーポレーション | Interconnecting virtual network members |
JP2012014674A (en) * | 2010-06-04 | 2012-01-19 | Nippon Telegr & Teleph Corp <Ntt> | Failure recovery method, server, and program in virtual environment |
EP2583417A4 (en) * | 2010-06-18 | 2016-03-02 | Nokia Solutions & Networks Oy | Server cluster |
JP2013540317A (en) * | 2010-09-27 | 2013-10-31 | フィッシャー−ローズマウント システムズ,インコーポレイテッド | Method and apparatus for virtualizing a process control system |
US11320797B2 (en) | 2010-09-27 | 2022-05-03 | Fisher-Rosemount Systems, Inc | Methods and apparatus to virtualize a process control system |
GB2499143A (en) * | 2010-11-12 | 2013-08-07 | Hitachi Ltd | Computer system |
JP5733318B2 (en) * | 2010-11-12 | 2015-06-10 | 株式会社日立製作所 | Computer system |
US9208029B2 (en) | 2010-11-12 | 2015-12-08 | Hitachi, Ltd. | Computer system to switch logical group of virtual computers |
GB2499143B (en) * | 2010-11-12 | 2018-12-26 | Hitachi Ltd | Computer system |
WO2012063294A1 (en) * | 2010-11-12 | 2012-05-18 | 株式会社日立製作所 | Computer system |
CN103703653A (en) * | 2011-07-22 | 2014-04-02 | 魁北克水电公司 | Switching apparatus, control system and method for varying impedance of phase line |
US20140125137A1 (en) * | 2011-07-22 | 2014-05-08 | Hydro-Quebec | Switching apparatus, control system and method for varying an impedance of a phase |
JP2014522219A (en) * | 2011-07-22 | 2014-08-28 | イドロ−ケベック | Switching device, control system, and method for changing impedance of phase wire |
US9941680B2 (en) | 2011-07-22 | 2018-04-10 | Hydro-Quebec | Switching apparatus, control system and method for varying an impedance of a phase line |
JP2013088826A (en) * | 2011-10-13 | 2013-05-13 | Hitachi Ltd | Data input method in redundant system |
WO2015132953A1 (en) * | 2014-03-07 | 2015-09-11 | 三菱電機株式会社 | Computer device and computer mechanism |
CN106068501A (en) * | 2014-03-07 | 2016-11-02 | 三菱电机株式会社 | Computer installation and computer mechanism |
US10089200B2 (en) | 2014-03-07 | 2018-10-02 | Mitsubishi Electric Corporation | Computer apparatus and computer mechanism |
Also Published As
Publication number | Publication date |
---|---|
JP5262145B2 (en) | 2013-08-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5262145B2 (en) | Cluster system and information processing method | |
EP2361467B1 (en) | Redundant intermediary switch solution for detecting and managing fibre channel over ethernet (fcoe) switch failures | |
US8429446B2 (en) | Method and apparatus for managing virtual ports on storage systems | |
US8880935B2 (en) | Redundancy and load balancing in remote direct memory access communications | |
JP5817308B2 (en) | Server, server system, and server redundancy switching method | |
US8874952B2 (en) | Computer system and availability method thereof | |
KR100992050B1 (en) | Method and system for protocol offload and direct i/o with i/o sharing in a virtualized network environment | |
WO2017114017A1 (en) | Computer device, system and method for implementing load balancing | |
US8739179B2 (en) | Method and system for low-overhead data transfer | |
US20080263544A1 (en) | Computer system and communication control method | |
JP2013514588A (en) | Virtual memory target offload technology | |
US11349706B2 (en) | Two-channel-based high-availability | |
US11777804B2 (en) | Automatic system provisioning for NVME-over-fabric storage | |
US9787590B2 (en) | Transport-level bonding | |
EP3038296B1 (en) | Pool element status information synchronization method, pool register and pool element | |
US20130061086A1 (en) | Fault-tolerant system, server, and fault-tolerating method | |
US9906459B2 (en) | Socket state transfer | |
US9558149B2 (en) | Dual system | |
Guay et al. | Early experiences with live migration of SR-IOV enabled InfiniBand | |
KR20150002426A (en) | Methods for supporting mobility of virtual machine in network input output virtualization environment and apparatus for performing the same | |
JP2005136690A (en) | High speed network address taking over method, network device and its program | |
WO2018223991A1 (en) | Method and system for switching between active bng and standby bng, and bng | |
US9584444B2 (en) | Routing communication between computing platforms | |
JP5170000B2 (en) | Redundant pair detection method, communication device, redundant pair detection program, recording medium | |
JP2024078801A (en) | COMMUNICATION DEVICE, COMMUNICATION SYSTEM, COMMUNICATION CONTROL METHOD, AND PROGRAM |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110107 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121214 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130122 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130314 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130402 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130415 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5262145 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |