JPH08185330A - 冗長コンピュータシステム切り替え方法 - Google Patents

冗長コンピュータシステム切り替え方法

Info

Publication number
JPH08185330A
JPH08185330A JP6326666A JP32666694A JPH08185330A JP H08185330 A JPH08185330 A JP H08185330A JP 6326666 A JP6326666 A JP 6326666A JP 32666694 A JP32666694 A JP 32666694A JP H08185330 A JPH08185330 A JP H08185330A
Authority
JP
Japan
Prior art keywords
computer
spare
active
computers
operation mode
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6326666A
Other languages
English (en)
Inventor
Manabu Tsukada
学 塚田
Masahide Yamashita
正秀 山下
Hiroyuki Yamashita
博之 山下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP6326666A priority Critical patent/JPH08185330A/ja
Publication of JPH08185330A publication Critical patent/JPH08185330A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)

Abstract

(57)【要約】 【目的】 より経済的に、従来と同等以上のシステム信
頼性を実現する冗長コンピュータシステム切り替え方法
を提供する。 【構成】 現用コンピュータ101,111,121,
131に固定的に割り当てられた、高速バックアップを
実現する1次予備コンピュータ102,112,12
2,132を伝送路160に接続し、更にシステムの高
信頼化を図るための2次予備コンピュータ141,14
2も伝送路に接続し全現用及び前記1次予備コンピュー
タで共用し、かつ、予備コンピュータの信頼性確保のた
め、集中コンピュータ管理装置150にて、正常時に、
周期的に全てのコンピュータを現用コンピュータとして
動作させ、異常を迅速に検出可能とし、また、現用コン
ピュータ異常時に、1次予備コンピュータを現用に切り
替えて高速バックアップするとともに、共用2次予備コ
ンピュータをこの新たな1次予備コンピュータに割り当
てる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、複数の現用コンピュー
タと、この現用コンピュータの予備に当たる1次予備コ
ンピュータと、僅かな共用2次予備コンピュータと、コ
ンピュータ間の切り替え制御を集中的に行う集中コンピ
ュータ管理装置とで構成される冗長コンピュータシステ
ムの切り替え方法に関する。
【0002】
【従来の技術】従来は、コンピュータ異常時のバックア
ップ方法として、以下の方法が採られていた。 (1)n重化構成:現用コンピュータ対応に固定的に予
備コンピュータが割り当てられており、現用コンピュー
タに障害が発生した場合、前記予備コンピュータが処理
を引き継ぐ方法である。また、更に高信頼度が要求され
る場合には上記予備コンピュータを増設するなどして、
冗長度を高める方法である。一方、前記予備コンピュー
タの正常性確認は、定期保守時等に保守試験プログラム
を実行することにより行っていた。 (2)k out of n構成:LCMPのネットワ
ーク分散システムにおいて、k台のコンピュータが必要
な場合、n台のコンピュータを用意し、コンピュータが
異常時に他コンピュータが処理をバックアップする方法
である。 (3)DIPSの高速予備切り替え方式(NTT研究実
用化報告第36巻第8号P1021〜1057記載):
2台の現用コンピュータと1台の待機系コンピュータで
チェックポイントデータファイルを共有し、予備系コン
ピュータは2台の現用コンピュータとプログラムとデー
タをロードシェアシステムとして動作可能にしておき、
現用コンピュータ異常時に、これらコンピュータを集中
管理するシステム制御処理装置の制御により、予備コン
ピュータにチェックポイントデータファイルを利用しバ
ックアップさせる方法である。
【0003】
【発明が解決しようとする課題】上記従来技術において
は、以下の問題があった。 (1)n重化構成では、現用コンピュータ対応に固定的
に予備コンピュータが割り付けられており、現用コンピ
ュータの状態変化に同期して予備コンピュータの状態を
更新することにより、現用コンピュータ異常時に高速バ
ックアップを実現することが可能である。しかし、2重
冗長構成以上の信頼度を確保するためには、予備(以下
1次予備と呼ぶ)に更に予備(以下2次予備と呼ぶ)を
追加する必要があり、システム全体での予備コンピュー
タのコストが約(n−1)/nを占め不経済であった。
また、特にn−1が予備コンピュータの場合には予備コ
ンピュータの経年劣化などによる異常のため既に故障し
ている場合には、現用コンピュータ異常時に多重障害が
発生することによりシステムダウンになる問題もある。 (2)k台の現用コンピュータと(n−k)台の予備コ
ンピュータから構成されるk out of n構成シ
ステムおよびDIPSの高速予備切り替え方式は、予備
コンピュータは、現用コンピュータ異常時にこれをバッ
クアップする共用予備コンピュータの状態を、故障にな
ったコンピュータの故障になる直前の状態にする必要が
あるが、共用しているため故障以前の状態にするまでに
時間がかかる問題があった。また、共用予備コンピュー
タは現用コンピュータ異常時に使用されるため、共用予
備コンピュータが経年劣化などにより故障している場合
には、現用コンピュータが故障するケースでは多重障害
になり切り替えに時間がかかるとともに信頼性が著しく
低下する問題があった。本発明の目的は、現用コンピュ
ータに固定的に割り当てられた、高速バックアップを実
現する1次予備コンピュータを伝送路に接続し、更にシ
ステムの高信頼化を図るための2次予備コンピュータも
伝送路に接続し、この2次予備コンピュータを全現用及
び前記1次予備コンピュータで共用し、かつ、予備コン
ピュータの信頼性確保のため、正常時に、周期的に全て
のコンピュータを現用コンピュータとして動作させ、異
常を迅速に検出可能とし、また、現用コンピュータ異常
時に、1次予備コンピュータを現用に切り替えて高速バ
ックアップするとともに、共用2次予備コンピュータを
この新たな1次予備コンピュータに割り当て、経済的
に、従来と同等以上のシステム信頼性を実現する冗長コ
ンピュータシステム切り替え方法を提供することにあ
る。
【0004】
【課題を解決するための手段】上記目的を達成するた
め、 全コンピュータの動作モード(現用、1次予備、2次
予備、異常)、ノードアドレスを管理する状態管理テー
ブル(図2の231)、 全コンピュータを対象とする動作モード変更タイミン
グを通知するタイマ(図2の241)を有し、図3〜図
5に示すフローに従ってコンピュータ間の切り替え制御
を行う切り替え制御処理部(図2の240)、 図6、図7に示すフローに従って、前記状態管理テー
ブル読み出し/更新を行うコンピュータ管理部(図2の
230)、 図9に示す処理フローに従って、前記切り替え制御処
理部から通知された異常コンピュータのノードアドレス
情報をネットワーク管理者に通知したり、異常コンピュ
ータを修復した保守者からの修復完了通知によりネット
ワーク管理者がコンピュータ状態を更新する等のために
使用する端末とのインタフェース制御を行う管理者イン
タフェース制御部(図2の250)、の要素〜を追
加したコンピュータを集中コンピュータ管理装置(図1
の150)として設置し、 a.コンピュータのノードアドレス及びそのコンピュー
タと現用或いは1次予備の関係にあるコンピュータのノ
ードアドレス格納用のアドレステーブル(図10の43
1)、 b.図11〜図15に示すフローに従ってコンピュータ
間の切り替え処理を行う切り替え処理部(図10の45
0)、 c.第1タイマ(図10の441)と第2タイマ(図1
0の442)を有し、図18に示すフローに従って現用
コンピュータの異常を監視する監視処理部(図10の4
40)、 d.図16に示すフローに従って前記監視処理部と前記
切り替え処理部から、及び集中コンピュータ管理装置か
らの指示により、前記アドレステーブルを更新したり読
み出したりするアドレス管理部(図10の430)、 e.図17に示す動作フローに従い動作するホットスタ
ンバイ処理部(図10の460)、 の要素a〜eを、現用、1次予備及び2次予備のコンピ
ュータに追加し、これら全てのコンピュータを伝送路で
接続する。
【0005】
【作用】本発明においては、上記手段を追加することに
より、集中コンピュータ管理装置が、全コンピュータを
管理し、これらコンピュータ間で一定時間毎に順次、1
次予備コンピュータから2次予備コンピュータへ、現用
から1次予備コンピュータに保持情報をそっくり送信し
て動作モードを変更させ、全コンピュータを現用コンピ
ュータとして動作させる。また、1次予備コンピュータ
が現用コンピュータの異常を検出すると、その1次予備
コンピュータは直ちに現用コンピュータになり高速バッ
クアップし、集中コンピュータ管理装置に検出したコン
ピュータの異常通知を通知する。コンピュータの異常を
通知された集中コンピュータ管理装置は、周期的動作モ
ード変更制御を中断し、任意の2次予備コンピュータ
を、新たに現用になり異常通知したコンピュータの1次
予備として割り当て、その新たに現用になったコンピュ
ータから保持情報をそっくり新たに割り当てた1次予備
コンピュータに転送させて1次予備コンピュータにする
ことにより、経済的な構成で迅速な検出および切り替え
が可能となる。
【0006】
【実施例】以下、本発明の一実施例を図面により説明す
る。図1は、本発明の一実施例におけるコンピュータシ
ステムの構成図で、複数のコンピュータ、集中コンピュ
ータ管理装置150及び伝送路160から構成される。
101、111、121、131は現用コンピュータ
で、102、112、122、132は1次予備コンピ
ュータであり、それぞれ101と102、111と11
2、121と122、131と132が現用コンピュー
タと1次予備コンピュータとの対応関係を示す。141
と142は共用の2次予備コンピュータである。なお、
点線部分は各コンピュータ内の追加部分を示す。
【0007】図2は、本発明の一実施例における集中コ
ンピュータ管理装置の構成例である。集中コンピュータ
管理装置は通信制御処理部210、メッセージ処理部2
20、切り替え制御処理部240、タイマ241、コン
ピュータ管理部230、状態管理テーブル231及び管
理者インタフェース制御部250から構成される。タイ
マ241は、予め設定された時間間隔で動作モード切り
替え指示を切り替え制御処理部240に通知する。な
お、151は追加部分を示す。
【0008】ここで、切り替え制御処理部240の処理
フローを図3〜図5に示す。本実施例では、現用コンピ
ュータの異常を検出した1次予備コンピュータから予備
要求メッセージを受信すると(ステップ3011)、そ
の1次予備コンピュータへ異常通知・予備要求メッセー
ジ受信完了の応答メッセージを転送する(ステップ30
12)。あるいは、1次予備コンピュータの異常を検出
した現用コンピュータから予備要求メッセージを受信す
ると(ステップ3013)、その現用コンピュータへ異
常通知・予備要求メッセージ受信完了の応答メッセージ
を送信する(ステップ3014)。この後、周期的切り
替えタイマを停止して周期的切り替えを中断する(ステ
ップ3015)。次に、受信メッセージから異常が検出
された現用コンピュータのノードアドレスとその一次予
備コンピュータのノードアドレスを抽出し(ステップ3
016)、管理者インタフェース制御部へ異常コンピュ
ータのノードアドレス通知し(ステップ3017)、さ
らにコンピュータ管理部にその異常コンピュータのノー
ドアドレスと、新たに1次予備候補となる2次予備コン
ピュータの割当て要求を通知する(ステップ301
8)。一方、コンピュータ管理部から1次予備候補とな
る2次予備コンピュータのノードアドレスを受信すると
(ステップ3021)、その2次予備コンピュータに、
新たに現用となったコンピュータのノードアドレス通知
メッセージを転送する(ステップ3022)。
【0009】また、ノードアドレス通知メッセージを転
送された2次予備コンピュータから、ノードアドレス設
定完了メッセージを受信した場合は(ステップ303
1,3032のYES)、新たに現用となったコンピュ
ータに、2次予備コンピュータのノードアドレスを含む
役割交代メッセージを転送する(ステップ3033)。
あるいは(ステップ3032のNO)、管理者インタフ
ェース制御部に異常を通知し(ステップ3034)、コ
ンピュータ管理部に新たな1次予備候補の2次予備コン
ピュータの割当て要求を通知する(ステップ303
5)。一方、役割交代メッセージを転送された現用コン
ピュータから、役割交代処理完了報告メッセージを受信
した場合は(ステップ3041、3042のYES)、
コンピュータ管理部に、状態管理テーブル中の、役割交
代が完了した2次予備コンピュータの動作モードを1次
予備に更新する要求を送信し(ステップ3043)、周
期的切り替えのためのタイマ設定を行う(ステップ30
44)。また、役割交代処理完了報告メッセージを受信
した場合は(ステップ3041、3042のNO)、管
理者インタフェース制御部に異常を通知し(ステップ3
034)、コンピュータ管理部に新たな1次予備候補の
2次予備コンピュータの割当て要求を通知する(ステッ
プ3035)。その周期的切り替えタイマの割り込みが
発生すると(ステップ3051)、コンピュータ管理部
へ切り替え元と切り替え先のノードアドレスを要求する
(ステップ3052)。そして、コンピュータ管理部か
ら切り替え元と切り替え先のノードアドレスを受信する
と(ステップ3061)、切り替え先に切り替え元のノ
ードアドレス通知メッセージを転送する(ステップ30
62)。
【0010】また、コンピュータ管理部230の処理フ
ローを図6、図7に示す。本実施例では、切り替え制御
処理部から、異常コンピュータのノードアドレスと2次
予備コンピュータ検索依頼の通知を受信すると(ステッ
プ5081)、その異常コンピュータに関する動作モー
ドを異常に更新し、2次予備コンピュータのノードアド
レスを検索して(ステップ5082)、切り替え制御処
理部に通知する(ステップ5083)。一方、切り替え
制御処理部から、切り替え元および切り替え先コンピュ
ータのノードアドレスの要求を受信すると(ステップ5
091)、切り替え元と切り替え先の関係を、1次予備
と2次予備、現用と1次予備として順次状態管理テーブ
ルからそれぞれのノードアドレスを検索し(ステップ5
092)、切り替え制御処理部に通知する(ステップ5
093)。また、切り替え制御処理部から状態管理テー
ブルの更新依頼を受信すると(ステップ5101)、更
新を実行し(ステップ5102)、管理者インタフェー
ス制御部に実行結果を通知する(ステップ5103)。
また、管理者インタフェース制御部から状態管理テーブ
ルの更新/検索通知を受信すると(ステップ511
1)、更新/検索を実行し(ステップ5112)、管理
者インタフェース制御部に実行結果を通知する(ステッ
プ5113)。
【0011】なお、状態管理テーブル231の構成例は
図8に示す通りであって、各コンピュータのノードアド
レス情報を保持するノードアドレス欄301、動作モー
ド欄302、現用/1次予備のノードアドレス欄303
からなる。また、管理者インタフェース制御部250の
処理フローを図9に示す。本実施例では、コンピュータ
管理部あるいは切り替え制御処理部から表示情報を受信
すると、通知情報を編集、表示する(ステップ700
1、7002)。また、入力情報を受信して、コンピュ
ータ管理部へ各種要求を通知する(ステップ701
1)。
【0012】図10は、本発明の一実施例におけるコン
ピュータの構成図である。本実施例では、メッセージ転
送部420、通信制御処理部410等からなるコンピュ
ータに、アドレス管理部430、アドレステーブル43
1、監視処理部440、第1タイマ441、第2タイマ
442、切り替え処理部450、ホットスタンバイ処理
部460を追加する。なお、170は追加部分を示す。
この切り替え処理部450の処理フローを図11〜図1
5に示す。本実施例では、図11、図12のように、監
視処理部から現用コンピュータの異常検出の報告を受信
すると(ステップ9011)、各部430、440、4
50、460の動作モードを現用に更新し(ステップ9
012)、集中コンピュータ管理装置に異常通知・予備
要求メッセージを送信する(ステップ9013、901
4)。一方、集中コンピュータ管理装置から異常通知・
予備要求メッセージ受信の応答メッセージを受信すると
(ステップ9041)、正常終了するか(ステップ90
42のYES)、集中コンピュータ管理装置に処理完了
メッセージを転送する(ステップ9042のNO、90
36)。また、集中コンピュータ管理装置から役割交代
メッセージを受信すると(ステップ9021)、保持情
報を読み出し、情報転送メッセージとして1次予備候補
のコンピュータに送信する(ステップ9022)。ま
た、2次予備コンピュータから情報転送完了報告メッセ
ージを受信すると(ステップ9031、9032のYE
S)、そのコンピュータの動作モードをチェックし(ス
テップ9033)、1次予備ならば各部430、44
0、450、460の動作モードを2次予備に更新し
(ステップ9034)、現用ならばアドレス管理部へ1
次予備コンピュータのノードアドレス設定要求を通知し
て(ステップ9035)、集中コンピュータ管理装置に
処理完了メッセージを転送する(ステップ9036)。
【0013】また、図13のように、切り替え元からそ
のコンピュータの保持情報転送メッセージを受信すると
(ステップ9051)、そのメッセージの転送元ノード
アドレスと切り替え元のノードアドレスとを比較し(ス
テップ9052)、不一致ならば転送元ノードアドレス
不一致の情報転送完了報告メッセージを転送元に送信す
る(ステップ9053)。また、一致するならば受信情
報を格納し(ステップ9054)、各部430、44
0、450、460の動作モードを1次予備に更新し
(ステップ9055)、転送元に情報転送完了報告メッ
セージを送信する(ステップ9056)。
【0014】また、図14のように、周期的切り替えを
行う場合においては、集中コンピュータ管理装置から役
割交代メッセージを受信すると(ステップ9061)、
該当のコンピュータの動作モードをチェックし(ステッ
プ9062)、1次予備であれば保持情報を読み出し、
情報転送メッセージとして切り替え先に送信する(ステ
ップ9063)。また、現用であれば1次予備コンピュ
ータに現用モードへの切り替え指示を含む情報転送メッ
セージを送信する(ステップ9064)。一方、切り替
え先から情報転送完了報告メッセージを受信すると(ス
テップ9071、9072のYES)、転送元の動作モ
ードをチェックし(ステップ9073)、現用ならば各
部430、440、450、460の動作モードを1次
予備に更新し(ステップ9074)、1次予備ならば各
部430、440、450、460の動作モードを2次
予備に更新して(ステップ9075)、集中コンピュー
タ管理装置に処理完了メッセージを転送する(ステップ
9076)。
【0015】また、周期的切り替えを行う場合におい
て、図15のように、切り替え元からそのコンピュータ
の保持情報転送メッセージを受信すると(ステップ90
81)、そのメッセージの転送元ノードアドレスと切り
替え元のノードアドレスを比較し(ステップ908
2)、不一致であれば転送元ノードアドレス不一致の情
報転送完了メッセージを転送元に送信する(ステップ9
083)。また、一致であれば、さらにモード切り替え
のみ指示かをチェックし(ステップ9084)、そうで
あれば各部430、440、450、460の動作モー
ドを現用に更新する(ステップ9085)。また、そう
でなければ受信情報を格納し(ステップ9086)、各
部430、440、450、460の動作モードを1次
予備に更新して(ステップ9087)、転送元に情報転
送完了報告メッセージを送信する(ステップ908
8)。
【0016】また、アドレス管理部430の処理フロー
を図16に示す。本実施例では、集中コンピュータ管理
装置から現用コンピュータノードアドレス通知メッセー
ジを受信すると、アドレステーブルに現用ノードアドレ
スを設定する(ステップ1301)。図17は、本発明
の一実施例におけるコンピュータのアドレステーブル4
31の構成を示す図である。アドレス管理部430は、
図17に示すように動作モードに応じて二つのノードア
ドレスを設定する。ノードアドレスには、そのコンピュ
ータが現用モードの場合、そのコンピュータのノードア
ドレスが設定され、1次予備モードの場合、そのコンピ
ュータに対応する現用コンピュータのノードアドレスが
設定されている。2次予備及び異常モードの場合、その
コンピュータのノードアドレスのみが設定されている。
【0017】また、ホットスタンバイ処理部460の処
理フローを図18に示す。本実施例では、現用コンピュ
ータの保持情報を更新する場合、メモリ等に蓄積された
更新情報を情報メッセージとして1次予備コンピュータ
に送信する(ステップ1401)。また、その1次予備
コンピュータから情報転送完了報告メッセージを受信し
た場合、異常があれば(ステップ1421のNO)、集
中コンピュータ管理装置に異常通知・予備要求メッセー
ジを送信する(ステップ1422)。また、現用コンピ
ュータから情報転送メッセージを受信した場合は、メモ
リ等の格納情報を更新し(ステップ1411)、現用コ
ンピュータへ情報転送メッセージ・完了報告メッセージ
を送信する(ステップ1412)。
【0018】また、監視処理部440の処理フローを図
19に示す。本実施例では、第2タイマからタイムアウ
トを受信するか、あるいは、1次予備コンピュータに対
応した現用コンピュータからの監視応答メッセージを受
信して異常検出した場合は、切り替え処理部に異常を通
知する(ステップ1501)。また、正常応答であれば
第2タイマを停止する(ステップ1512)。また、第
1タイマからの割り込みを受信した場合は、1次予備コ
ンピュータに対応した現用コンピュータからの監視メッ
セージを転送し(ステップ1521)、その監視メッセ
ージに対する第2タイマを設定する(ステップ152
2)。
【0019】次に、本発明のコンピュータ間交信の一実
施例を図20〜図25により説明する。図20、図21
は、本発明の一実施例におけるコンピュータ異常時の切
り替え概念を示すフローチャートである。本実施例で
は、集中コンピュータ管理装置において、各コンピュー
タから異常報告を受信すると、周期的切り替え動作を停
止し(ステップ1701)、コンピュータ動作状態管理
手段(図2の230、231等)から、2次予備コンピ
ュータのノードアドレスを選択し、現用コンピュータに
2次予備との間で待機2重構成をとるように指示する
(ステップ1702)。この指示を受けて、現用/1次
予備コンピュータでは、指定された2次予備コンピュー
タに自機の保持情報と1次予備モードへの変更指示を送
信する(ステップ1711)。そして、その送信先から
完了報告を受信すると(ステップ1712)、集中コン
ピュータ管理装置に転送する(ステップ1713)。集
中コンピュータ管理装置は、その現用/1次予備コンピ
ュータからの完了報告を受信すると(ステップ170
3)、周期的切り替え用タイマを再起動する(ステップ
1704)。なお、2次予備コンピュータは、動作モー
ド変更指示を受信すると、同時に送信された保持情報を
格納し(ステップ1721)、自機の動作モードを1次
予備に更新して(ステップ1722)、その保持情報送
信元に完了報告を送信する(ステップ1723)。
【0020】次に、現用コンピュータ異常のケースにつ
いてより詳細に述べる。図22は、本発明の一実施例に
おけるコンピュータ間交信(現用コンピュータ異常のケ
ース)を示す図である。本実施例では、1次予備コンピ
ュータ112が現用コンピュータの異常を監視メッセー
ジの受信時間間隔と受信監視応答メッセージの内容によ
り検出(a)すると、1次予備コンピュータの動作モー
ドを現用モードに変更(b)し、集中コンピュータ管理
装置150に異常通知・予備要求メッセージを転送する
(c)。集中コンピュータ管理装置150は、異常通知
・予備要求メッセージを受信すると受信応答メッセージ
を1次予備コンピュータ112に転送(d)するととも
に、コンピュータ間の動作モードの周期的切り替え制御
を中断する。また、状態管理テーブルを検索し、コンピ
ュータ112をバックアップする2次予備コンピュータ
142のノードアドレスを読み出し、その2次予備コン
ピュータ142に1次予備コンピュータ112のノード
アドレスを通知する、ノードアドレス通知メッセージを
転送する(e)。2次予備コンピュータ142は、この
ノードアドレス通知メッセージを受信すると、アドレス
テーブルに通知されたノードアドレスを格納し、設定完
了メッセージを集中コンピュータ管理装置150に転送
する(f)。更に、集中コンピュータ管理装置150
は、設定完了メッセージを受信すると、新たな現用コン
ピュータ112に対し、2次予備コンピュータ142と
の間での役割を交代する役割交代メッセージを転送する
(g)。役割交代メッセージを受信した現用コンピュー
タ112は、そのコンピュータのメモリ情報/情報蓄積
格納情報などの保有情報を読み出し、2次予備コンピュ
ータ142に情報転送メッセージとして転送する
(h)。この情報転送メッセージを受信した2次予備コ
ンピュータは、既に受信済みのノードアドレスに対応す
る新たな現用コンピュータからのメッセージであれば、
受信し受信情報に対応する格納場所に格納して、処理終
了後、そのコンピュータの動作モードを1次予備モード
にして、完了報告メッセージを現用コンピュータ112
に転送する(i)。そして、この完了報告メッセージを
受信した現用コンピュータ112は、新たな1次予備コ
ンピュータの動作モードを1次予備に更新し、役割交代
処理の完了報告メッセージを集中コンピュータ管理装置
150に転送する(j)。この完了報告メッセージを受
信した集中コンピュータ管理装置150は、2次予備コ
ンピュータ142の動作モードを1次予備に変更し、周
期的動作モード切り替え処理を再開する。一方、異常と
なった現用コンピュータは、修復後は未使用コンピュー
タとして使用される。
【0021】次に、本実施例の周期的切り替えの概念に
ついて述べる。図23、図24は、本発明の一実施例に
おけるコンピュータの周期的切り替えの概念を示すフロ
ーチャートである。本実施例では、集中コンピュータ管
理装置において、周期的切り替え用タイマを再起動した
後(ステップ1901)、コンピュータ動作状態管理手
段から1次予備および2次予備コンピュータのノードア
ドレスを選択し、それらの間での動作モード交代を指示
する(ステップ1902)。この指示を受けた現用/1
次予備コンピュータでは、指定された2次予備コンピュ
ータに自機の保持情報と動作モードの変更指示を送信し
(ステップ1911)、その送信先からの完了報告を受
信すると(ステップ1912)、自機の動作状態を2次
予備に変更し(ステップ1913)、集中コンピュータ
管理装置に完了報告を送信する(ステップ1914)。
集中コンピュータ管理装置は、交代指示送信先が1次予
備の場合の完了報告を受信すると(ステップ190
3)、次にコンピュータ動作状態管理手段から現用コン
ピュータと2次予備コンピュータのノードアドレを選択
し、それらの間での動作モード交代を指示する(ステッ
プ1904)。そして、交代指示送信先が現用の場合の
完了報告を受信すると(ステップ1905)、ステップ
1901に戻って一連の処理を繰り返す。なお、2次予
備コンピュータでは、動作モード変更指示を受信する
と、現用/1次予備コンピュータから送信された保持情
報を格納し(ステップ1921)、自機をその保持情報
送信元の動作状態に変更して(ステップ1922)、そ
の送信元に完了報告を送信する(ステップ1923)。
【0022】次に、周期的切り替えケースについてより
詳細に述べる。図25は、本発明の一実施例におけるコ
ンピュータ間交信(周期的切り替えケース)を示す図で
ある。集中コンピュータ管理装置150は、状態管理テ
ーブル231が保持するコンピュータ情報を検索し、先
ず1次予備コンピュータ112を検索するとともに2次
予備コンピュータ142を検索し、2次予備コンピュー
タ142に1次予備コンピュータ112のノードアドレ
ス通知用のノードアドレス通知メッセージを転送する
(ア)。2次予備コンピュータ142は、このノードア
ドレス通知メッセージを受信すると、そのコンピュータ
内のアドレステーブルにそのノードアドレスを格納し、
設定完了メッセージを集中コンピュータ管理装置150
に転送する(イ)。設定完了メッセージを転送された集
中コンピュータ管理装置150は、1次予備コンピュー
タ112に対し、2次予備コンピュータ142との間で
の役割交代を行う役割交代メッセージを転送する
(ウ)。役割交代メッセージを受信した1次予備コンピ
ュータ112は、そのコンピュータのメモリ情報と情報
蓄積装置格納情報などの保持情報を読み出し、2次予備
コンピュータ142に情報転送メッセージとして転送す
る(エ)。この情報転送メッセージを受信した2次予備
コンピュータは、受信メッセージのノードアドレスとノ
ードアドレス通知メッセージで受信した1次予備コンピ
ュータのノードアドレスを比較し、一致時取り込み、受
信メッセージ内の情報を対応する格納場所に格納する。
処理終了後、そのコンピュータの動作モードを1次予備
コンピュータにして、完了報告メッセージを1次予備コ
ンピュータ112に転送する(オ)。そして、この完了
報告メッセージを転送された1次予備コンピュータ11
2は、動作モードを2次予備モードに変更し役割交代処
理の完了報告メッセージを集中コンピュータ管理装置1
50に転送する(カ)。この完了報告メッセージを受信
した集中コンピュータ管理装置150は、状態管理テー
ブル上のコンピュータ142の動作モードを1次予備
に、また、コンピュータ112の動作モードを2次予備
に変更する。次に、現用から2次予備への動作モード切
り替え処理を継続し、現用コンピュータ111を検索す
るとともに2次予備コンピュータ112を検索し、2次
予備コンピュータ112に現用コンピュータ111のノ
ードアドレス通知用のノードアドレス通知メッセージを
転送する(キ)。2次予備コンピュータ112は、この
ノードアドレス通知メッセージを受信すると、そのコン
ピュータ内のアドレステーブルに格納し、設定完了メッ
セージを集中コンピュータ管理装置150に転送する
(ク)。設定完了メッセージを転送された集中コンピュ
ータ管理装置150は、設定完了メッセージを受信する
と、現用コンピュータ111に対し、2次予備コンピュ
ータ112との間での役割交代を行う役割交代メッセー
ジを転送する(ケ)。役割交代メッセージを受信した現
用コンピュータ111は、そのコンピュータのメモリ情
報と情報蓄積装置格納情報などの保持情報を読み出し、
2次予備コンピュータ112に情報転送メッセージとし
て転送する(コ)。この情報転送メッセージを受信した
2次予備コンピュータは、受信メッセージのノードアド
レスとノードアドレス通知メッセージで転送された現用
コンピュータのノードアドレスを比較し、一致時取り込
み、受信メッセージ内の情報を対応する格納場所に格納
して、処理終了後、そのコンピュータの動作モードを現
用モードにして、完了報告メッセージを現用コンピュー
タ111に転送する(サ)。そして、この完了報告メッ
セージを転送された現用コンピュータ111は、動作モ
ードを2次予備モードに変更し役割交代処理の完了報告
メッセージを集中コンピュータ管理装置150に転送す
る(シ)。この完了報告メッセージを受信した集中コン
ピュータ管理装置150は、状態管理テーブル上の新た
な現用コンピュータ112の動作モードを現用に、ま
た、新たな2次予備コンピュータ111の動作モードを
2次予備に変更して、以上の動作モード切り替え処理を
繰り返す。
【0023】
【発明の効果】本発明によれば、次の効果が得られる。 (1)正常時でも、現用、1次予備、共用2次予備コン
ピュータ間で周期的に動作モードを切り替えることによ
り、1次予備コンピュータ、2次予備コンピュータの故
障等を速やかに検出できる。更に、定期保守の稼働が不
要になり、保守コストの削減が望める。 (2)僅かな共用2次予備コンピュータだけで、コンピ
ュータ異常時に、迅速に任意の共用2次予備コンピュー
タを割り当て、この共用2次予備コンピュータで直ちに
待機2重化冗長構成を形成させることにより、高信頼
で、かつ経済的な冗長システムの構築が可能となる。
【図面の簡単な説明】
【図1】本発明の一実施例におけるコンピュータシステ
ムの構成図である。
【図2】本発明の一実施例における集中コンピュータ管
理装置の構成図である。
【図3】本発明の一実施例における切り替え制御処理部
の処理フローチャートの一部である。
【図4】本発明の一実施例における切り替え制御処理部
の処理フローチャートの一部である。
【図5】本発明の一実施例における切り替え制御処理部
の処理フローチャートの一部である。
【図6】本発明の一実施例におけるコンピュータ管理部
の処理フローチャートの一部である。
【図7】本発明の一実施例におけるコンピュータ管理部
の処理フローチャートの一部である。
【図8】本発明の一実施例における状態管理テーブルの
構成を示す図である。
【図9】本発明の一実施例における管理者インタフェー
ス制御部の処理フローチャートである。
【図10】本発明の一実施例におけるコンピュータの構
成図である。
【図11】本発明の一実施例における切り替え処理部の
処理フローチャートの一部である。
【図12】本発明の一実施例における切り替え処理部の
処理フローチャートの一部である。
【図13】本発明の一実施例における切り替え処理部の
処理フローチャートの一部である。
【図14】本発明の一実施例における切り替え処理部の
処理フローチャートの一部である。
【図15】本発明の一実施例における切り替え処理部の
処理フローチャートの一部である。
【図16】本発明の一実施例におけるアドレス管理部の
処理フローチャートである。
【図17】本発明の一実施例におけるコンピュータのア
ドレステーブルの構成を示す図である。
【図18】本発明の一実施例におけるホットスタンバイ
処理部の処理フローチャートである。
【図19】本発明の一実施例における監視処理部の処理
フローチャートである。
【図20】本発明の一実施例におけるコンピュータ異常
時の切り替え概念を示すフローチャートの一部である。
【図21】本発明の一実施例におけるコンピュータ異常
時の切り替え概念を示すフローチャートの一部である。
【図22】本発明の一実施例におけるコンピュータ間交
信(現用コンピュータ異常のケース)を示す図である。
【図23】本発明の一実施例におけるコンピュータの周
期的切り替えの概念を示すフローチャートの一部であ
る。
【図24】本発明の一実施例におけるコンピュータの周
期的切り替えの概念を示すフローチャートの一部であ
る。
【図25】本発明の一実施例におけるコンピュータ間交
信(周期的切り替えケース)を示す図である。
【符号の説明】
101,111,121,131:現用コンピュータ、
102,112,122,132:1次予備コンピュー
タ、141,142:共用2次予備コンピュータ、15
0:集中コンピュータ管理装置、160:伝送路。

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 複数の動作モードを有する複数のコンピ
    ュータで構成されたシステムにおいて、 現用コンピュータに割り当てられた1次予備コンピュー
    タおよび該現用及び1次予備コンピュータ共用の2次予
    備コンピュータを伝送路上に接続し、現用コンピュータ
    の異常が検出された場合には、当該1次予備コンピュー
    タを現用コンピュータに切り替え、該現用コンピュータ
    から全保持情報を該1次予備コンピュータに転送させ、
    任意の前記2次予備コンピュータを新たな1次予備コン
    ピュータとして割り当てることを特徴とする冗長コンピ
    ュータシステム切り替え方法。
  2. 【請求項2】 前記複数のコンピュータに対し、周期的
    に、1次予備コンピュータから2次予備コンピュータ
    へ、現用コンピュータから1次予備コンピュータへ、全
    保持情報を送信して動作モードを変更させ、全コンピュ
    ータを現用コンピュータとして動作させることを特徴と
    する請求項1記載の冗長コンピュータシステム切り替え
    方法。
  3. 【請求項3】 複数の動作モードを有する複数のコンピ
    ュータと、該コンピュータの動作状態を集中的に管理
    し、該コンピュータの動作モードをコンピュータ異常時
    に変更制御する集中コンピュータ管理装置とが、伝送路
    を介して接続され、前記コンピュータが、処理要求を実
    行する動作モードの現用コンピュータと、該現用コンピ
    ュータ異常時に、該現用コンピュータと同期的に動作す
    る1次予備コンピュータが現用コンピュータ対応に割り
    当てられ、現用および1次予備コンピュータから共用さ
    れる2次予備コンピュータとして使用されるシステムに
    おいて、 イ)集中コンピュータ管理装置が周期的に各コンピュー
    タの動作モードを交代させる契機を通知するタイマから
    の通知を受信時、該タイマを再起動する工程と、 ロ)集中コンピュータ管理装置がコンピュータ動作状態
    管理手段から1次予備コンピュータと、2次予備コンピ
    ュータのノードアドレスを選択し、1次予備コンピュー
    タに2次予備コンピュータとの間での動作モード交代を
    指示する工程と、 ハ)動作モード交代指示を送信された1次予備コンピュ
    ータが、指定された2次予備コンピュータに該コンピュ
    ータの保持情報と1次予備への動作モード変更指示を送
    信する工程と、 ニ)1次予備コンピュータから保持情報を送信された2
    次コンピュータが、該情報を格納し、動作モードを1次
    予備に変更し、完了報告を保持情報送信元の1次予備コ
    ンピュータに送信する工程と、 ホ)2次予備コンピュータから完了報告を受信した1次
    予備コンピュータが、当該動作モードを2次予備に変更
    し、集中コンピュータ管理装置に完了報告を送信する工
    程と、 ヘ)1次予備コンピュータから完了報告を受信した集中
    コンピュータ管理装置がタイマからの通知を受信する工
    程と、 ト)集中コンピュータ管理装置がコンピュータ動作状態
    管理手段から現用コンピュータと2次予備コンピュータ
    のノードアドレスを選択し、現用コンピュータに2次予
    備コンピュータとの間での動作モード交代を指示する工
    程と、 チ)動作モード交代指示を送信された現用コンピュータ
    が、指定された2次予備コンピュータに該コンピュータ
    の保持情報と現用への動作モード変更指示を送信する工
    程と、 リ)現用コンピュータから保持情報を送信された2次予
    備コンピュータが、該情報を格納し、動作モードを現用
    に変更し、完了報告を保持情報送信元の現用コンピュー
    タに送信する工程と、 ヌ)新たに現用になったコンピュータから完了報告を受
    信した現用コンピュータが、当該動作モードを2次予備
    に変更し、集中コンピュータ管理装置に完了報告を送信
    する工程と、 ル)新たに2次予備になったコンピュータから完了報告
    を受信した集中コンピュータ管理装置がタイマからの通
    知を受信する工程と、 ヲ)集中コンピュータ管理装置がコンピュータ異常報告
    受信時、タイマを停止し、動作モード交代を中断し、コ
    ンピュータ動作状態管理手段から2次予備コンピュータ
    のノードアドレスを選択し、現用コンピュータに2次予
    備コンピュータとの間での待機2重冗長構成生成を指示
    する工程と、 ワ)動作モード交代指示を送信された現用コンピュータ
    が、指定された2次予備コンピュータに該コンピュータ
    の保持情報と現用への動作モード変更指示を送信する工
    程と、 カ)現用コンピュータから保持情報を送信された2次予
    備コンピュータが、該情報を格納し、動作モードを現用
    に変更し、完了報告を保持情報送信元の現用コンピュー
    タに送信する工程と、 ヨ)新たに現用になったコンピュータから完了報告を受
    信した現用コンピュータが、動作モードを2次予備に変
    更し、集中コンピュータ管理装置に完了報告を送信する
    工程と、 タ)新たに2次予備になったコンピュータから完了報告
    を受信した集中コンピュータ管理装置がタイマからの通
    知を受信する工程と、 レ)異常コンピュータのバックアップ完了時、タイマを
    再開し、動作モード交代を再開する工程と、 を備えたことを特徴とする冗長コンピュータシステム切
    り替え方法。
JP6326666A 1994-12-28 1994-12-28 冗長コンピュータシステム切り替え方法 Pending JPH08185330A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6326666A JPH08185330A (ja) 1994-12-28 1994-12-28 冗長コンピュータシステム切り替え方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6326666A JPH08185330A (ja) 1994-12-28 1994-12-28 冗長コンピュータシステム切り替え方法

Publications (1)

Publication Number Publication Date
JPH08185330A true JPH08185330A (ja) 1996-07-16

Family

ID=18190315

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6326666A Pending JPH08185330A (ja) 1994-12-28 1994-12-28 冗長コンピュータシステム切り替え方法

Country Status (1)

Country Link
JP (1) JPH08185330A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006259945A (ja) * 2005-03-16 2006-09-28 Nec Corp 冗長システム及びその構成制御方法並びにプログラム
JP2007122573A (ja) * 2005-10-31 2007-05-17 Nec Corp 仮想サーバシステム、分散制御方法およびプログラム
JP2007172334A (ja) * 2005-12-22 2007-07-05 Internatl Business Mach Corp <Ibm> 並列型演算システムの冗長性を確保するための方法、システム、およびプログラム
JP2008250421A (ja) * 2007-03-29 2008-10-16 Hitachi Ltd ストレージ保守・管理装置の冗長化方法、及びその方法を使用する装置
US7752493B2 (en) 2004-03-08 2010-07-06 Fujitsu Limited High reliability system, redundant construction control method, and program
US20130205017A1 (en) * 2012-02-03 2013-08-08 Fujitsu Limited Computer failure monitoring method and device
JP2013161252A (ja) * 2012-02-03 2013-08-19 Fujitsu Ltd 冗長コンピュータ制御プログラム、方法、及び装置
JP2016040675A (ja) * 2014-08-12 2016-03-24 日本電信電話株式会社 冗長化システム、およびレプリケーション方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7752493B2 (en) 2004-03-08 2010-07-06 Fujitsu Limited High reliability system, redundant construction control method, and program
JP2006259945A (ja) * 2005-03-16 2006-09-28 Nec Corp 冗長システム及びその構成制御方法並びにプログラム
JP2007122573A (ja) * 2005-10-31 2007-05-17 Nec Corp 仮想サーバシステム、分散制御方法およびプログラム
JP2007172334A (ja) * 2005-12-22 2007-07-05 Internatl Business Mach Corp <Ibm> 並列型演算システムの冗長性を確保するための方法、システム、およびプログラム
US8713352B2 (en) 2005-12-22 2014-04-29 International Business Machines Corporation Method, system and program for securing redundancy in parallel computing system
JP2008250421A (ja) * 2007-03-29 2008-10-16 Hitachi Ltd ストレージ保守・管理装置の冗長化方法、及びその方法を使用する装置
US20130205017A1 (en) * 2012-02-03 2013-08-08 Fujitsu Limited Computer failure monitoring method and device
JP2013161252A (ja) * 2012-02-03 2013-08-19 Fujitsu Ltd 冗長コンピュータ制御プログラム、方法、及び装置
JP2016040675A (ja) * 2014-08-12 2016-03-24 日本電信電話株式会社 冗長化システム、およびレプリケーション方法

Similar Documents

Publication Publication Date Title
US8032786B2 (en) Information-processing equipment and system therefor with switching control for switchover operation
JP4572250B2 (ja) 計算機切り替え方法、計算機切り替えプログラム及び計算機システム
JP2001306349A (ja) バックアップ装置及びバックアップ方法
JPH0363744A (ja) コンピユータ・ネツトワークにおける適用業務セッションの保存方法、制御方法及び保存装置
KR20070026327A (ko) 액티브 라우팅 컴포넌트 장애 처리 방법 및 장치
JP3887130B2 (ja) 高可用性計算機システム及び同システムにおけるデータバックアップ方法
CN112468328A (zh) 一种基于交换式拓扑的双余度fc-ae-1553网络重构方法
JP7316779B2 (ja) 施設監視システム、および、施設監視システムにおける通信方法
JPH08185330A (ja) 冗長コンピュータシステム切り替え方法
JP5285045B2 (ja) 仮想環境における故障復旧方法及びサーバ及びプログラム
JPH09293059A (ja) 分散システム及びその運用管理方法
JP4806382B2 (ja) 冗長化システム
JP2004355446A (ja) クラスタシステム及びその制御方法
JP2001027951A (ja) マルチプロセッサ構成の情報処理システムにおけるファイルロード装置と記録媒体
JP3203935B2 (ja) ホットスタンバイシステム切り替えシステム
JPH09305558A (ja) 二重化システムのデータベースサーバ
JPH05314075A (ja) オンラインコンピュータ装置
JPH07152697A (ja) 疎結合計算機システム
JPH07141308A (ja) 情報処理システムにおけるバックアップ方法
JP2010152742A (ja) 通信制御装置
CN115499296B (zh) 一种云桌面热备管理方法、装置及***
JP2000066913A (ja) 任意プロセッサのプログラム・データ無中断更新システム
JPH06195318A (ja) 分散処理システム
JP2000132441A (ja) 分散データベースシステム、処理装置及びデータベースアクセス方法
JPH05108517A (ja) マルチプロセツサシステムにおける通信バスの障害制御方式