JPH08235132A - Hot stand-by control method for multiserver system - Google Patents

Hot stand-by control method for multiserver system

Info

Publication number
JPH08235132A
JPH08235132A JP7033500A JP3350095A JPH08235132A JP H08235132 A JPH08235132 A JP H08235132A JP 7033500 A JP7033500 A JP 7033500A JP 3350095 A JP3350095 A JP 3350095A JP H08235132 A JPH08235132 A JP H08235132A
Authority
JP
Japan
Prior art keywords
host
server host
server
address
spare
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7033500A
Other languages
Japanese (ja)
Inventor
Hiroyuki Tomizawa
広幸 富沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP7033500A priority Critical patent/JPH08235132A/en
Publication of JPH08235132A publication Critical patent/JPH08235132A/en
Pending legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)

Abstract

PURPOSE: To eliminate a need to switch network addresses by a client system when an in-use host is switched to a stand-by host. CONSTITUTION: In-use server hosts 101 and 103, a stand-by server host 102, and a client host 108 are connected to one another by a LAN 106. Further, the respective hosts are mutually connected by a LAN 107 for monitoring a host fault. The monitor program of the in-use host 101 sends the network address A of its host to the monitor program of the stand-by host 102 through the LAN 107. If a fault occurs to the in-use host 101, the monitor program informs the monitor program of the stand-by host 102 of a system switching instruction and the monitor program of the stand-by host 102 rewrites the network address into A.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、クライアントサーバ型
のオンライントランザクション処理に関し、特に、現用
ホストと予備ホストから構成され、現用ホストに異常が
発生したときに、予備ホストに切り替えるマルチサーバ
システムのホットスタンバイ制御方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a client / server type online transaction processing, and more particularly to a hot server of a multi-server system which is composed of a working host and a spare host and is switched to the spare host when an abnormality occurs in the working host. The present invention relates to a standby control method.

【0002】[0002]

【従来の技術】通常、オンライン計算機システムなどに
おいては、計算機システムの障害に備えて別の計算機シ
ステムを用意した冗長構成が採られていて、これにより
システムの信頼性を確保している。このような例として
は、特開昭62−248037号公報に記載された計算
機システムの切り替え方式がある。
2. Description of the Related Art Normally, in an online computer system or the like, a redundant configuration in which another computer system is prepared in preparation for a failure of the computer system is adopted, thereby ensuring system reliability. As such an example, there is a computer system switching method described in JP-A-62-248037.

【0003】この切り替え方式においては、オンライン
トランザクションプロセスサーバ(実行システム)と待
機システムとを備え、実行システムに障害が発生した場
合に、待機システムを使用することにより実行システム
の処理を継続し、待機中に実行していたプロセス(ジョ
ブ)については、切り替え時処理定義テーブルに定義さ
れている処理(ジョブの処理キャンセルなど)を実行す
ることにより、切り替え後のオンライン処理が、待機中
に実行されていたジョブによって影響を受けることを防
止するものである。
In this switching method, an online transaction process server (execution system) and a standby system are provided, and when a failure occurs in the execution system, the standby system is used to continue the processing of the execution system and wait. For the process (job) that was being executed during the process, the online process after switching was executed while waiting by executing the process (such as canceling the job process) defined in the process definition table for switching. It prevents the job from being affected by the job.

【0004】[0004]

【発明が解決しようとする課題】しかし、上記した従来
技術は、ローカルエリアネットワークを使用しておら
ず、またローカルエリアネットワークを使用したとして
も、切り替え後のサーバシステムがネットワークアドレ
スを引き継いでいない。このため切り替え後において、
多数のクライアントシステムは、新たなネットワークア
ドレスに再接続しなければならず、特にシステム切替発
生時に使用されていなかったクライアントシステムにつ
いても、ネットワークアドレスを切り替える必要があ
り、切り替え時の処理が煩雑になるという問題があっ
た。
However, in the above-mentioned conventional technique, the local area network is not used, and even if the local area network is used, the server system after switching does not take over the network address. Therefore, after switching,
Many client systems have to reconnect to a new network address, and it is necessary to switch the network address even for a client system that was not used at the time of system switching, which makes the switching process complicated. There was a problem.

【0005】このようなことから、オンライントランザ
クションサーバが障害になった場合、当該サーバが使用
していたネットワークアダプタのアドレスを待機システ
ムに切り替えて使用することにより、クライアントシス
テムは同じアドレスを用いてサーバシステムと通信する
ことができ、ホストが切り替わっても同じアドレスで接
続できる方式が求められている。
Therefore, when the online transaction server fails, the client system uses the same address by switching the address of the network adapter used by the server to the standby system. There is a need for a method that can communicate with the system and can connect with the same address even if the host switches.

【0006】本発明の目的は、現用ホストを予備ホスト
に切り替えたときに、クライアントシステムでのネット
ワークアドレスの切り替え処理を不要にしたマルチサー
バシステムのホットスタンバイ制御方法を提供すること
にある。
An object of the present invention is to provide a hot standby control method for a multi-server system, which eliminates the need to switch the network address in the client system when the active host is switched to the spare host.

【0007】[0007]

【課題を解決するための手段】前記目的を達成するため
に、本発明では、複数のサーバホストと、クライアント
ホストがネットワーク(以下、第1のネットワークとい
う)で接続され、該サーバホストは現用サーバホスト
と、待機系の予備サーバホストからなり、該現用サーバ
ホストに障害が発生したときに、該予備サーバホストに
切り替えて処理を実行するマルチサーバシステムのホッ
トスタンバイ制御方法において、前記現用サーバホスト
と予備サーバホストとをホスト障害監視用のネットワー
ク(以下、第2のネットワークという)で接続し、前記
現用サーバホストは、自ホストと前記第1のネットワー
クとを接続する第1のアドレスを管理し、前記予備サー
バホストは、自ホストと前記第1のネットワークとを接
続する第2のアドレスを管理し、前記現用サーバホスト
は、該第2のネットワークを介して、該第1のアドレス
を予備サーバホストに送信して記憶し、前記現用サーバ
ホストに障害が発生したとき、前記現用サーバホスト
は、自ホストで管理されている前記第1のアドレスを無
効にし、該第2のネットワークを介して、システム切り
替え指示を前記予備サーバホストに通知し、該通知され
た前記予備サーバホストは、自ホストで管理されている
前記第2のアドレスを、前記第1のアドレスに書き換え
ることを特徴としている。
To achieve the above object, according to the present invention, a plurality of server hosts and a client host are connected by a network (hereinafter referred to as a first network), and the server host is an active server. A hot standby control method for a multi-server system comprising a host and a standby server host of a standby system, which switches to the standby server host and executes processing when a failure occurs in the active server host. A spare server host is connected to a network for monitoring a host failure (hereinafter referred to as a second network), and the active server host manages a first address connecting the own host and the first network, The spare server host is connected to a second address connecting the host and the first network. The active server host transmits the first address to the spare server host via the second network and stores the first address, and when the active server host fails, the active server host Disables the first address managed by the own host, notifies the spare server host of a system switching instruction via the second network, and the notified spare server host It is characterized in that the second address managed by the host is rewritten to the first address.

【0008】[0008]

【作用】現用のサーバホストのモニタプログラムは、ド
ライバプログラムから自ホストのローカルエリアネット
ワークアドレスを得る。現用のサーバホストのモニタプ
ログラムは、監視用ローカルエリアネットワークを介し
て、予備のサーバホストのモニタプログラムに、該得ら
れたローカルネットワークアドレスを送信する。現用の
サーバホストに障害が発生したとき、現用のサーバホス
トのモニタプログラムは、現用のサーバホストのドライ
バプログラムに対して、ローカルエリアネットワークア
ドレスを無効にするとともに、システム切替指示を予備
のサーバホストのモニタプログラムに通知する。予備の
サーバホストのモニタプログラムは、ドライバプログラ
ムに対して、先に受信したローカルエリアネットワーク
アドレスへのアドレスの書き換えを要求し、ドライバプ
ログラムは、先に受信したローカルエリアネットワーク
アドレスに書き換える。これにより、クライアントホス
トでは、ネットワークアドレスを切り替える処理が不要
になる。
The monitor program of the active server host obtains the local area network address of its own host from the driver program. The monitor program of the current server host sends the obtained local network address to the monitor program of the spare server host via the monitoring local area network. When a failure occurs in the active server host, the monitor program of the active server host invalidates the local area network address to the driver program of the active server host and sends a system switching instruction to the spare server host. Notify the monitor program. The monitor program of the spare server host requests the driver program to rewrite the address to the previously received local area network address, and the driver program rewrites to the previously received local area network address. This eliminates the need for the client host to switch the network address.

【0009】[0009]

【実施例】以下、本発明の一実施例を図面を用いて具体
的に説明する。 〈実施例1〉図1は、本発明の一実施例に係るシステム
構成を示す。図において、101は現用のサーバホスト
(#1)、102は予備のサーバホスト、103は現用
のサーバホスト(#2)、104は現用のサーバホスト
101と予備のサーバホスト102との間に設けられた
共用ディスク群、105は現用のサーバホスト103と
予備のサーバホスト102との間に設けられた共用ディ
スク群である。この共用ディスク群104、105に
は、ログ情報、データベースなどが格納され、サーバホ
ストによってアクセスされる。また、現用のサーバホス
ト(実行サーバホスト)101と103は、通常時に業
務を実行し、バックアップは予備のサーバホスト(待機
サーバホスト)102によって行われる。
DESCRIPTION OF THE PREFERRED EMBODIMENTS One embodiment of the present invention will be specifically described below with reference to the drawings. <Embodiment 1> FIG. 1 shows a system configuration according to an embodiment of the present invention. In the figure, 101 is a working server host (# 1), 102 is a spare server host, 103 is a working server host (# 2), and 104 is provided between the working server host 101 and the spare server host 102. The shared disk group 105 is a shared disk group provided between the active server host 103 and the spare server host 102. The shared disk groups 104 and 105 store log information, databases, etc., and are accessed by the server host. In addition, the active server hosts (execution server hosts) 101 and 103 execute jobs at normal times, and backup is performed by the backup server host (standby server host) 102.

【0010】106はローカルエリアネットワーク(L
AN#1)、107はホスト障害監視用のローカルエリ
アネットワーク(LAN#2)、108はクライアント
ホストである。
Reference numeral 106 denotes a local area network (L
AN # 1), 107 are local area networks (LAN # 2) for host failure monitoring, and 108 is a client host.

【0011】各サーバホスト101、102、103と
クライアントホスト108とは、ローカルエリアネット
ワーク106で相互に接続されている。また、現用のサ
ーバホスト101とローカルエリアネットワーク106
とは、アドレス(A)のローカルエリアネットワークア
ダプタ109で接続されている。同様に、予備のサーバ
ホスト102とローカルエリアネットワーク106と
は、アドレス(B)のローカルエリアネットワークアダ
プタ110で接続され、現用のサーバホスト103とロ
ーカルエリアネットワーク106とは、アドレス(C)
のローカルエリアネットワークアダプタ111で接続さ
れている。クライアントホスト108とローカルエリア
ネットワーク106とは、アドレス(D)のローカルエ
リアネットワークアダプタ112で接続されている。
The server hosts 101, 102, 103 and the client host 108 are connected to each other via a local area network 106. In addition, the active server host 101 and the local area network 106
Are connected by the local area network adapter 109 of the address (A). Similarly, the spare server host 102 and the local area network 106 are connected by the local area network adapter 110 having the address (B), and the active server host 103 and the local area network 106 have the address (C).
The local area network adapter 111 is connected. The client host 108 and the local area network 106 are connected by the local area network adapter 112 of the address (D).

【0012】さらに、各サーバホスト101、102、
103とホスト障害監視用のローカルエリアネットワー
ク107とは、それぞれアドレスがX、Y、Zのアダプ
タ113、114、115で接続されている。
Further, each server host 101, 102,
103 and the local area network 107 for host fault monitoring are connected by adapters 113, 114 and 115 having addresses X, Y and Z, respectively.

【0013】図2は、各サーバホストにおけるソフトウ
エアの構成例を示す。現用のサーバホスト101のソフ
トウエアは、オペレーティングシステム(OS1)20
1と、OS1中に含まれたローカルエリアネットワーク
のアダプタドライバプログラム204(DRV1)と、
これらの上位に存在する、ホットスタンバイを制御する
モニタプログラム207(MON1)から構成されてい
る。
FIG. 2 shows a software configuration example in each server host. The software of the current server host 101 is the operating system (OS1) 20.
1 and a local area network adapter driver program 204 (DRV1) included in OS1,
It is composed of a monitor program 207 (MON1) which controls the hot standby, which exists above these.

【0014】予備のサーバホスト102のソフトウエア
と、現用のサーバホスト103のソフトウエアについて
も、同様にそれぞれ、オペレーティングシステム(OS
2、3)202、203と、アダプタドライバプログラ
ム205(DRV2)、206(DRV3)と、モニタ
プログラム208(MON2)、209(MON3)か
ら構成されている。
Similarly, the software of the spare server host 102 and the software of the active server host 103 are respectively set in the operating system (OS).
2, 3) 202 and 203, adapter driver programs 205 (DRV2) and 206 (DRV3), and monitor programs 208 (MON2) and 209 (MON3).

【0015】また、現用のサーバホスト101、103
上には、それぞれオンライントランザクションプログラ
ム210(OLTP1)、211(OLTP2)とユー
ザアプリケーションプログラム212(UAP1)、2
13(UAP2)が格納されている。予備のサーバホス
ト102には、2つのオンライントランザクションプロ
グラム214(OLTP2S)、215(OLTP1
S)と、2つのユーザアプリケーションプログラム21
6(UAP2S)、217(UAP1S)が格納されて
いる。なお、上記した説明では、サーバ上の各プログラ
ムを区別して表しているが、予備のサーバホストが実行
サーバホストに切り替えられるものであるから、各サー
バホストのソフトウエア構成は基本的には同じである。
In addition, the active server hosts 101 and 103
Above the online transaction programs 210 (OLTP1), 211 (OLTP2) and the user application program 212 (UAP1), 2 respectively.
13 (UAP2) is stored. The backup server host 102 includes two online transaction programs 214 (OLTP2S) and 215 (OLTP1).
S) and two user application programs 21
6 (UAP2S) and 217 (UAP1S) are stored. In the above description, each program on the server is shown separately, but since the spare server host is switched to the execution server host, the software configuration of each server host is basically the same. is there.

【0016】図3は、本発明のシステム切替え時におけ
る、ネットワークアドレスの引き継ぎを説明する図であ
る。以下に、図1、2、3を参照して、現用のサーバホ
スト101から予備のサーバホスト102にシステムを
切替えたときのネットワークアドレスの引き継ぎ動作を
説明する。
FIG. 3 is a diagram for explaining the takeover of the network address when the system is switched according to the present invention. A network address takeover operation when the system is switched from the active server host 101 to the spare server host 102 will be described below with reference to FIGS.

【0017】現用のサーバホスト101のドライバプロ
グラム204は、ローカルエリアネットワークアドレス
(A)をLANアダプタ109からメモリ上に読み込ん
で管理している。これにより、他のホストからのアドレ
ス要求に対して、メモリ上のローカルエリアネットワー
クアドレス(A)を返すことができる。
The driver program 204 of the active server host 101 reads and manages the local area network address (A) from the LAN adapter 109 on the memory. As a result, the local area network address (A) on the memory can be returned in response to an address request from another host.

【0018】現用のサーバホスト101のモニタプログ
ラム207は、初期設定処理においてドライバプログラ
ム204から自ホスト101のローカルエリアネットワ
ークアドレス(A)を取得する。そして、モニタプログ
ラム207は、監視用ローカルエリアネットワーク10
7を介して、予備のサーバホスト102のモニタプログ
ラム208に、ローカルネットワークアドレス(A)を
送信する。これにより、予備のサーバホスト102は、
現用のサーバホスト101と同じローカルエリアネット
ワークアドレス(A)を認識することができる。
The monitor program 207 of the active server host 101 acquires the local area network address (A) of its own host 101 from the driver program 204 in the initial setting process. Then, the monitor program 207 executes the monitoring local area network 10
7, the local network address (A) is transmitted to the monitor program 208 of the spare server host 102. As a result, the spare server host 102
The same local area network address (A) as the active server host 101 can be recognized.

【0019】現用のサーバホスト101に障害が発生し
たとき、モニタプログラム207は現用のサーバホスト
101のドライバプログラム204に対して、ローカル
エリアネットワークアドレス(A)を無効にするととも
に、システム切替指示を、監視用ローカルエリアネット
ワーク107を介して、予備のサーバホスト102のモ
ニタプログラム208に通知する。
When a failure occurs in the active server host 101, the monitor program 207 disables the local area network address (A) and instructs the driver program 204 of the active server host 101 to switch the system. Notify the monitor program 208 of the spare server host 102 via the monitoring local area network 107.

【0020】予備のサーバホスト102のモニタプログ
ラム208は、ドライバプログラム205に対して、ロ
ーカルエリアネットワークアドレス(A)へのアドレス
の書き換えを要求する。ドライバプログラム205は、
メモリ上に書かれたローカルエリアネットワークアドレ
ス(B)を(A)に書き換える。そして、切り替えられ
た予備のサーバホスト102が、障害となった現用のサ
ーバホスト101の処理を引き継ぐ。このように、シス
テム切替と関連したローカルエリアネットワークアドレ
スの書き換えは、ローカルエリアネットワークアドレス
の重複使用を防止することができる。また、現用のサー
バホストを予備のサーバホストに切り替えたときに、ク
ライアントシステムでのネットワークアドレスの切り替
え処理が不要になる。
The monitor program 208 of the spare server host 102 requests the driver program 205 to rewrite the address to the local area network address (A). The driver program 205 is
The local area network address (B) written on the memory is rewritten to (A). Then, the spare server host 102 that has been switched over takes over the processing of the active server host 101 that has failed. In this way, rewriting the local area network address associated with system switching can prevent duplicate use of the local area network address. Also, when the active server host is switched to the spare server host, the network address switching process in the client system becomes unnecessary.

【0021】〈実施例2〉上記した実施例のアドレス切
替え方式においては、オンライントランザクションサー
バと同一ホスト上にあって同じネットワークアドレスを
使用するディスク共有サーバ、リモートログインサーバ
等のサーバプロセスは、使用していたアドレスが待機シ
ステムに移るため、元のホストで継続してネットワーク
を使用した処理が続行できなくなる。そこで、本実施例
2では、オンライントランザクションサーバのような重
要な特定のプロセスを単独で待機システムに切り替える
のではなく、実行システムで処理していた全てのまたは
複数のプロセスを一括して待機システムに切り替える制
御方法を採るようにしている。
<Embodiment 2> In the address switching method of the above embodiment, server processes such as a disk sharing server and a remote login server which are on the same host as the online transaction server and use the same network address are used. The original address is transferred to the standby system, and the original host cannot continue to use the network. Therefore, in the second embodiment, instead of switching an important specific process such as an online transaction server to the standby system alone, all or a plurality of processes processed by the execution system are collectively switched to the standby system. The control method for switching is adopted.

【0022】図4は、プロセスのグループ単位でシステ
ムを切り替える実施例におけるテーブル構成例を示す。
すなわち、ホットスタンバイを制御するモニタプログラ
ムに、プロセスのグループ、重要なプロセス、再起動す
るプロセスの順番を定義して、重要なプロセスに障害が
発生した時に、システム切替の際に登録されているプロ
セスを起動するものである。なお、この実施例のシステ
ム構成は、図1に示す構成を用い、現用のサーバホスト
101と予備のサーバホスト102の図示しないメモリ
に、図4のテーブルが格納されている。
FIG. 4 shows an example of a table structure in an embodiment in which the system is switched in units of process groups.
In other words, in the monitor program that controls hot standby, the order of process groups, important processes, and restart processes is defined, and when a failure occurs in an important process, the process registered when the system is switched over. Is to start. The system configuration of this embodiment uses the configuration shown in FIG. 1, and the table of FIG. 4 is stored in the memory (not shown) of the active server host 101 and the spare server host 102.

【0023】現用のサーバホスト101で実行されるプ
ロセスグループをGA、GB、GCとし、プロセスグル
ープGAはプロセスGAP1〜GAP4からなり、プロ
セスグループGBはプロセスGBP1〜GBP3からな
り、プロセスグループGCはプロセスGCP1〜GCP
3からなる。そして、例えばプロセスグループGAのプ
ロセスについては、プロセスGAP1、GAP2、GA
P3、GAP4が連繋し、重要度の高いプロセスGAP
1とGAP3にはシステム切替えフラグONが設定さ
れ、重要度の低いプロセスGAP2とGAP4にはシス
テム切替えフラグOFFが設定される。
The process groups executed by the active server host 101 are GA, GB, and GC. The process group GA includes processes GAP1 to GAP4, the process group GB includes processes GBP1 to GBP3, and the process group GC includes process GCP1. ~ GCP
Consists of three. Then, for example, for processes of the process group GA, processes GAP1, GAP2, GA
P3 and GAP4 are linked, and process GAP of high importance
The system switching flag ON is set for 1 and GAP3, and the system switching flag OFF is set for the processes GAP2 and GAP4 of low importance.

【0024】現用のサーバホスト101で、プロセスグ
ループGAに属する一つのプロセスGAP1が障害にな
ったとする。プロセスGAP1のシステム切替えフラグ
がONに設定されているので、プロセスGAP1と連繋
している他のプロセス(GAP2〜GAP4)を強制的
に停止させて、予備のサーバホスト102において対応
するプロセス(GAP1〜GAP4)を再起動する。そ
の再起動を行うとき、グループ内の切替順位にしたがっ
て、まずプロセスGAP1を最初に起動し、起動の完了
確認と同期して、切り替え順位が2番目のプロセスGA
P3を起動する。その後、同様に同期を取って、順位が
3番目の二つのプロセスGAP2とGAP4を並列に起
動して、切替が実行される。
It is assumed that one process GAP1 belonging to the process group GA fails in the active server host 101. Since the system switch flag of the process GAP1 is set to ON, the other processes (GAP2 to GAP4) linked to the process GAP1 are forcibly stopped, and the corresponding process (GAP1 to GAP1 to GAP1 to GAP1) in the spare server host 102 is stopped. Restart GAP4). When the restart is performed, the process GAP1 is first started according to the switching order in the group, and the process GA having the second switching order is synchronized with the completion confirmation of the startup.
Start P3. After that, in the same manner, the two processes GAP2 and GAP4 having the third rank are activated in parallel, and the switching is executed.

【0025】また、プロセスグループGAに属するプロ
セスGPA3が障害になったときの処理も、前述したプ
ロセスGAP1の障害の場合と同様である。しかし、シ
ステム切替えフラグがOFFに設定されているプロセス
GAP2またはGAP4が、現用のサーバホスト101
で障害になっても、重要度が低いので、前述したように
プロセスグループGAを予備のサーバホスト102にシ
ステム切替えせずに、現用のサーバホスト101上でプ
ロセスGAP2またはGAP4を再起動して、業務を続
行する。
The processing when the process GPA3 belonging to the process group GA fails is also the same as in the case where the process GAP1 fails. However, the process GAP2 or GAP4 in which the system switching flag is set to OFF is not the active server host 101.
Even if a failure occurs, the importance is low, so as described above, the process GAP2 or GAP4 is restarted on the active server host 101 without switching the system of the process group GA to the spare server host 102. Continue work.

【0026】このように、本実施例では、プロセスグル
ープごとに管理しているので、プロセスグループGAが
システム切替を実行しても、他のプロセスグループGB
またはGCに対して影響を及ぼさず、またホスト全体が
障害になった場合には、プロセスグループごとにシステ
ム切替を行うことができる。
As described above, in this embodiment, since each process group is managed, even if the process group GA executes system switching, another process group GB is used.
Alternatively, the system can be switched for each process group if it does not affect the GC and if the entire host fails.

【0027】〈実施例3〉実施例1で説明したホットス
タンバイシステムにおいて、現用ホストと予備ホストが
1:1に対応している構成だけでなく、経済的に配慮さ
れた現用ホスト2機と予備ホスト1機の構成や、複数の
現用ホストが互いに他方の待機機能を持つような構成を
採る場合には、一つの現用ホストが障害になると、同一
ホストに実行サーバシステムと当該実行サーバシステム
とは異なる実行サーバシステムの待機サーバシステムが
共存する状態が生じ、共存したホスト上では実行サーバ
システムの性能の劣化の問題が発生する。そこで、本実
施例では、待機サーバシステムをシステム切替可能な状
態のままで第3の別のホストに移動する方法を採るよう
にしたものである。
<Embodiment 3> In the hot standby system described in Embodiment 1, not only the configuration in which the active host and the spare host correspond to each other 1: 1 but also the economically considered active host 2 and the spare In the case of adopting a configuration of one host or a configuration in which a plurality of active hosts have the other standby function for each other, if one active host fails, the execution server system and the execution server system are on the same host. The standby server systems of different execution server systems coexist, and the performance degradation of the execution server system occurs on the coexisting hosts. Therefore, in this embodiment, a method is adopted in which the standby server system is moved to a third different host while the system can be switched.

【0028】図5は、待機システムを予備のサーバホス
トから他のホストに移動する実施例の説明図である。ま
ず初期起動で第1段階の状態になる。この第1段階の状
態では、現用のサーバホスト101(SH1)、103
(SH3)がそれぞれ現用のシステムとなり、予備のサ
ーバホスト102(SH2)が待機システムとなる。
FIG. 5 is an explanatory diagram of an embodiment in which the standby system is moved from the spare server host to another host. First of all, the state of the first stage is reached by initial startup. In the state of the first stage, the active server hosts 101 (SH1), 103
(SH3) becomes the active system, and the spare server host 102 (SH2) becomes the standby system.

【0029】その後、サーバホスト103(SH3)で
実行されているオンライントランザクションプログラム
(OLTP2)に障害が発生したとき、システム切替を
行って、予備のサーバホスト102(SH2)の待機シ
ステム(OLTP2S)が実行サーバ(OLTP2)と
なって、第2段階の状態になる。
After that, when a failure occurs in the online transaction program (OLTP2) executed by the server host 103 (SH3), the system is switched so that the standby system (OLTP2S) of the spare server host 102 (SH2) becomes available. It becomes the execution server (OLTP2) and enters the second stage.

【0030】この結果、予備のサーバホスト102の実
行システム(OLTP2)は、待機システム(OLTP
1S)が存在しているために、メモリなどの資源が少な
くなり、障害発生前の現用のサーバホスト103(SH
2)で動作していた場合に比べ性能が低下してしまう。
As a result, the execution system (OLTP2) of the spare server host 102 becomes the standby system (OLTP2).
1S) exists, resources such as memory are reduced, and the active server host 103 (SH
The performance will be lower than if it was operating in 2).

【0031】そこで、予備のサーバホスト102(SH
2)にある待機システム(OLTP1S)を、サーバホ
スト103(SH3)に移動させる。すなわち、サーバ
ホスト102(SH2)にある待機システム215(O
LTP1S)をそのままにして、サーバホスト103
(SH3)で待機システム(OLTP1S)を起動す
る。これにより、第3段階の状態になる。この起動が完
了する直前の状態で、サーバホスト102(SH2)の
待機システム(OLTP1S)を停止させ、サーバホス
ト103(SH3)の待機システム(OLTP1S)の
起動を完了させ、第4段階の状態となる。
Therefore, the spare server host 102 (SH
The standby system (OLTP1S) in 2) is moved to the server host 103 (SH3). That is, the standby system 215 (O) in the server host 102 (SH2).
LTP1S) as it is and the server host 103
The standby system (OLTP1S) is activated at (SH3). As a result, the state of the third stage is reached. In the state immediately before the completion of this activation, the standby system (OLTP1S) of the server host 102 (SH2) is stopped, the activation of the standby system (OLTP1S) of the server host 103 (SH3) is completed, and the state of the fourth stage is set. Become.

【0032】このように、本実施例の移動方法によれ
ば、待機システム(OLTP1S)の移動中に、サーバ
ホスト101(SH1)の実行システム(OLTP1)
が障害になっても、サーバホスト102(SH2)の待
機システム(OLTP1S)がシステム切替を実行する
ことができる。このように、多様なシステム運用が実現
されることから、ホットスタンバイシステムの適用範囲
が拡大した場合でも、きめ細かい運用が可能となる。
As described above, according to the moving method of this embodiment, the execution system (OLTP1) of the server host 101 (SH1) is moved while the standby system (OLTP1S) is moving.
Even if a failure occurs, the standby system (OLTP1S) of the server host 102 (SH2) can perform system switching. In this way, since various system operations are realized, even if the application range of the hot standby system is expanded, fine operation can be performed.

【0033】[0033]

【発明の効果】以上、説明したように、本発明によれ
ば、現用サーバホストと予備サーバホストとをホスト障
害監視用の第2のネットワークで接続し、現用サーバホ
ストは、自ホストと第1のネットワークとを接続する第
1のアドレスを管理し、予備サーバホストは、自ホスト
と第1のネットワークとを接続する第2のアドレスを管
理し、現用サーバホストは、第2のネットワークを介し
て第1のアドレスを予備サーバホストに送信して記憶
し、現用サーバホストに障害が発生したとき、現用サー
バホストは、自ホストで管理されている第1のアドレス
を無効にし、第2のネットワークを介して、システム切
り替え指示を予備サーバホストに通知し、通知された予
備サーバホストは、自ホストで管理されている第2のア
ドレスを、第1のアドレスに書き換えているので、障害
の発生した現用サーバホストのアドレスが予備サーバホ
ストに引き継がれ、これにより、クライアントホストに
おけるネットワークアドレスの切替運用が不要になる。
またクライアントからみたサーバシステムの障害回復時
間を最小限にすることができる。
As described above, according to the present invention, the active server host and the spare server host are connected by the second network for host failure monitoring, and the active server host and the first server are connected to each other. Manages a first address for connecting to another network, the spare server host manages a second address for connecting the self-host and the first network, and the active server host manages via the second network. The first address is transmitted to and stored in the spare server host, and when a failure occurs in the active server host, the active server host invalidates the first address managed by its own host and sets the second network Through the system switching instruction to the spare server host, and the notified spare server host sends the first address to the second address managed by the own host. Since the rewriting to the scan, address of the primary server failed host has taken over the spare server host, thereby, the switching operation of the network address is not required in the client host.
Moreover, the failure recovery time of the server system seen from the client can be minimized.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施例に係るシステム構成を示す。FIG. 1 shows a system configuration according to an embodiment of the present invention.

【図2】各サーバホストにおけるソフトウエアの構成例
を示す。
FIG. 2 shows a configuration example of software in each server host.

【図3】本発明のシステム切替え時における、ネットワ
ークアドレスの引き継ぎを説明する図である。
FIG. 3 is a diagram for explaining inheritance of a network address at the time of system switching according to the present invention.

【図4】プロセスのグループ単位でシステムを切り替え
る実施例におけるテーブル構成例を示す。
FIG. 4 shows an example of a table configuration in an embodiment in which the system is switched for each group of processes.

【図5】待機システムを予備のサーバホストから他のホ
ストに移動する実施例の説明図である。
FIG. 5 is an explanatory diagram of an embodiment in which a standby system is moved from a spare server host to another host.

【符号の説明】[Explanation of symbols]

101、103 現用のサーバホスト 102 予備のサーバホスト 104、105 共用ディスク群 106 ローカルエリアネットワーク 107 ホスト障害監視用のローカルエリアネットワー
ク 108 クライアントホスト 109、110、111、112、113、114、1
15 ローカルエリアネットワークアダプタ
101, 103 Active server host 102 Spare server host 104, 105 Shared disk group 106 Local area network 107 Local area network for host failure monitoring 108 Client host 109, 110, 111, 112, 113, 114, 1
15 Local Area Network Adapter

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】 複数のサーバホストと、クライアントホ
ストがネットワーク(以下、第1のネットワークとい
う)で接続され、該サーバホストは現用サーバホスト
と、待機系の予備サーバホストからなり、該現用サーバ
ホストに障害が発生したときに、該予備サーバホストに
切り替えて処理を実行するマルチサーバシステムのホッ
トスタンバイ制御方法において、前記現用サーバホスト
と予備サーバホストとをホスト障害監視用のネットワー
ク(以下、第2のネットワークという)で接続し、前記
現用サーバホストは、自ホストと前記第1のネットワー
クとを接続する第1のアドレスを管理し、前記予備サー
バホストは、自ホストと前記第1のネットワークとを接
続する第2のアドレスを管理し、前記現用サーバホスト
は、該第2のネットワークを介して、該第1のアドレス
を予備サーバホストに送信して記憶し、前記現用サーバ
ホストに障害が発生したとき、前記現用サーバホスト
は、自ホストで管理されている前記第1のアドレスを無
効にし、該第2のネットワークを介して、システム切り
替え指示を前記予備サーバホストに通知し、該通知され
た前記予備サーバホストは、自ホストで管理されている
前記第2のアドレスを、前記第1のアドレスに書き換え
ることを特徴するマルチサーバシステムのホットスタン
バイ制御方法。
1. A plurality of server hosts and a client host are connected by a network (hereinafter referred to as a first network), and the server host comprises an active server host and a standby spare server host, and the active server host. In the hot standby control method of a multi-server system that switches to the spare server host and executes processing when a failure occurs in the backup server host, the active server host and the spare server host are connected to a network for host failure monitoring (hereinafter referred to as the second Network)), the active server host manages a first address connecting the own host and the first network, and the spare server host connects the own host and the first network. It manages the second address to be connected, and the active server host manages the second network. Via the network, the first address is transmitted to and stored in the spare server host, and when a failure occurs in the active server host, the active server host manages the first address managed by its own host. Via the second network, the system switching instruction is notified to the spare server host, and the notified spare server host sends the second address managed by the own host to the second address. A hot standby control method for a multi-server system, characterized by rewriting to a first address.
JP7033500A 1995-02-22 1995-02-22 Hot stand-by control method for multiserver system Pending JPH08235132A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7033500A JPH08235132A (en) 1995-02-22 1995-02-22 Hot stand-by control method for multiserver system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7033500A JPH08235132A (en) 1995-02-22 1995-02-22 Hot stand-by control method for multiserver system

Publications (1)

Publication Number Publication Date
JPH08235132A true JPH08235132A (en) 1996-09-13

Family

ID=12388277

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7033500A Pending JPH08235132A (en) 1995-02-22 1995-02-22 Hot stand-by control method for multiserver system

Country Status (1)

Country Link
JP (1) JPH08235132A (en)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10105423A (en) * 1996-09-27 1998-04-24 Nec Corp Fault monitoring system for network server
US6145090A (en) * 1997-09-05 2000-11-07 Hitachi, Ltd. Switch control method of redundantly structured computer system
KR100383490B1 (en) * 2000-05-17 2003-05-12 주식회사 신텔정보통신 System and method for high availabilty network
JP2007122439A (en) * 2005-10-28 2007-05-17 Kyocera Corp Communication apparatus and communication method
JP2008533573A (en) * 2005-03-10 2008-08-21 テレコム・イタリア・エッセ・ピー・アー Disaster recovery architecture
JP2012100313A (en) * 2011-12-22 2012-05-24 Telecom Italia Spa Failure recovery architecture
JP2013225208A (en) * 2012-04-20 2013-10-31 Toyota Motor Corp Information processing apparatus, information processing method and program
JP2017513119A (en) * 2014-12-29 2017-05-25 同方威視技▲術▼股▲分▼有限公司 Automatic switching method and system

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10105423A (en) * 1996-09-27 1998-04-24 Nec Corp Fault monitoring system for network server
US6145090A (en) * 1997-09-05 2000-11-07 Hitachi, Ltd. Switch control method of redundantly structured computer system
KR100383490B1 (en) * 2000-05-17 2003-05-12 주식회사 신텔정보통신 System and method for high availabilty network
JP2008533573A (en) * 2005-03-10 2008-08-21 テレコム・イタリア・エッセ・ピー・アー Disaster recovery architecture
US8266473B2 (en) 2005-03-10 2012-09-11 Telecom Italia S.P.A. Disaster recovery architecture
JP2007122439A (en) * 2005-10-28 2007-05-17 Kyocera Corp Communication apparatus and communication method
JP4619925B2 (en) * 2005-10-28 2011-01-26 京セラ株式会社 Communication apparatus and communication method
JP2012100313A (en) * 2011-12-22 2012-05-24 Telecom Italia Spa Failure recovery architecture
JP2013225208A (en) * 2012-04-20 2013-10-31 Toyota Motor Corp Information processing apparatus, information processing method and program
JP2017513119A (en) * 2014-12-29 2017-05-25 同方威視技▲術▼股▲分▼有限公司 Automatic switching method and system
US10379976B2 (en) 2014-12-29 2019-08-13 Nuctech Company Limited Automatic switching method and automatic switching system

Similar Documents

Publication Publication Date Title
US7340637B2 (en) Server duplexing method and duplexed server system
US7933987B2 (en) Application of virtual servers to high availability and disaster recovery solutions
US7657786B2 (en) Storage switch system, storage switch method, management server, management method, and management program
JP4572250B2 (en) Computer switching method, computer switching program, and computer system
US20110289417A1 (en) User interface for configuring and managing the cluster
US20090138541A1 (en) Fault-Tolerant Networks
JP2003022258A (en) Backup system for server
JP2002328813A (en) Method for correcting program
JP3482992B2 (en) Redundant LAN system and method for switching between active and standby systems
US20020073409A1 (en) Telecommunications platform with processor cluster and method of operation thereof
JPH08235132A (en) Hot stand-by control method for multiserver system
JP5285045B2 (en) Failure recovery method, server and program in virtual environment
JP2002024048A (en) High availability system
JP7104016B2 (en) Transparent database session recovery with client-side cache
JPH09293001A (en) Non-stop maintenance system
WO2020241032A1 (en) Fault-tolerant system, server, fault-tolerant system operation method, server operation method, and program for server operation method
JPH09305558A (en) Data base server for duplex system
JPH0879246A (en) Distributed communication system and fault recovery method therefor
JP2002149439A (en) Method for switching server and server device in distributed processing system
JP2003298624A (en) Communication path securing method in service control application execution program
CN112965790B (en) PXE protocol-based virtual machine starting method and electronic equipment
JPH09288590A (en) Virtual computer system
JPH0895932A (en) System switching control method for distributed processing system
CN114500577A (en) Data access system and data access method
JPH08221287A (en) System changeover controlling method