JPH1196033A - 情報処理装置 - Google Patents

情報処理装置

Info

Publication number
JPH1196033A
JPH1196033A JP9255011A JP25501197A JPH1196033A JP H1196033 A JPH1196033 A JP H1196033A JP 9255011 A JP9255011 A JP 9255011A JP 25501197 A JP25501197 A JP 25501197A JP H1196033 A JPH1196033 A JP H1196033A
Authority
JP
Japan
Prior art keywords
unit
active
information processing
standby
processing device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9255011A
Other languages
English (en)
Other versions
JP3420919B2 (ja
Inventor
Atsuo Kobayashi
敦夫 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Hitachi Information Technology Co Ltd
Original Assignee
Hitachi Ltd
Hitachi Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd, Hitachi Information Technology Co Ltd filed Critical Hitachi Ltd
Priority to JP25501197A priority Critical patent/JP3420919B2/ja
Publication of JPH1196033A publication Critical patent/JPH1196033A/ja
Application granted granted Critical
Publication of JP3420919B2 publication Critical patent/JP3420919B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)

Abstract

(57)【要約】 【課題】ホットスタンバイシステムの確実、高速なバッ
クアップ切り替えを安価に実現する。 【解決手段】現用機100(1)がダウンした場合、そ
の補助処理装置120(1)がリセット信号RSTを駆
動して主処理装置110(1)を停止させた後、ダウン
通知電文を通信路130により予備機100(2)に通
知し、予備機の主処理装置110(2)に業務を引き継
がせる。あるいは予備機100(2)がヘルスチェツク
で現用機100(1)のダウンを検出し、補助処理装置
120(2)を通じて切り離し要求電文を通信路130
に出し、現用機の補助処理装置120(1)がリセット
信号RSTを起動して主処理装置110(1)を停止さ
せ、しかる後に予備機の主処理装置110(2)が業務
を引き継ぐ。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、現用機のバックア
ップのための予備機をホットな状態で待機させるホット
スタンバイシステムの現用機または予備機として動作す
る情報処理装置に係り、特に、ホットスタンバイシステ
ムのバックアップ切り替え高速化、システム稼動率向上
に好適な情報処理装置に関する。
【0002】
【従来の技術】ホットスタンバイシステムのバックアッ
プ切り替え方式として、予備機側で現用機のヘルスチェ
ックを定期的に行い、現用機のダウンを検出した時に予
備機からの制御で現用機の切り離しを行い、しかる後に
予備機が現用機の業務を引き継ぐ方式が従来より広く採
用されている。
【0003】また、現用処理系と待機処理系からなるデ
ュプレックスシステムにおいて、現用処理系で自系の障
害を検出した時に待機処理系へ割込み信号を送出し、そ
れに対する待機処理系からの受付信号を受け取ると割込
み信号送出フラグ情報をセットしておき、待機処理系で
は割込み信号を受け付けた後に強制停止信号を現用処理
系へ送出し、現用処理系では、強制停止信号を受けた時
に、割込み信号送出フラグ情報がセットされていること
を条件に自系の処理実行を停止させ、待機処理系が現用
処理系の処理を引き継ぐ系切替制御方式が知られている
(例えば特公昭63−43771号公報)。
【0004】
【発明が解決しようとする課題】前述の予備機によるヘ
ルスチェックによって現用機のダウンを検出してバック
アップ切り替えを行う方式は、確実性にやや欠ける点が
あった。すなわち、一般的に、ヘルスチェックは、予備
機と現用機の間の通信路を通じて、予備機より「Are y
ou alive?」というようなことを意味する電文を現用機
に送り、それに対する「I am alive.」というようなこ
とを意味する応答電文を確認するという単純な折り返し
通信によっているので、通信誤りや電文抜けにより現用
機のダウンを誤検出したり、逆に見過ごしたりする危険
があり、その結果、無用なバックアップ切り替えが起動
されたり、必要なバックアップ切り替えが行われないこ
とがあった。
【0005】また、ホットスタンバイシステムにおい
て、現用機がダウンしてから予備機が稼動するまでのバ
ックアップ切り替え時間は不稼動時間となるため、シス
テムの稼働率はバックアップ切り替え時間に大きく依存
するが、このバックアップ切り替え時間はヘルスチェッ
ク時間間隔より短くすることができない。しかるに、ヘ
ルスチェックには上に述べたような通信誤りや電文抜け
の可能性があり、1回の確認応答で現用機のダウンを判
断することは信頼性に問題があるため、ある程度の時間
をとって確認の中身に冗長性を持たせる必要があり、ヘ
ルスチェックの結果、ダウンとしてことを十分な確度で
判定するために要する時間は一般に数十秒から数分とか
なり長い。したがって、バックアップ切り替え時間の短
縮が困難であった。
【0006】なお、バックアップ切り替え時間を短縮す
るためにヘルスチェック時間間隔を無理に短縮すると、
上に述べたように信頼性が悪化するほか、ヘルスチッェ
クのために計算機時間が大きく割かれシステムスループ
ットの低下をまねくという別の問題がある。
【0007】また、特公昭63−43771号公報の系
切替制御方式は、現用機(現用処理系)と予備機(待機
処理系)の台数の多いホットスタンバイシステムに適用
しようとすると、すべての現用機と予備機との間を割込
み信号、その受付信号、強制停止指示信号等を伝達する
ための信号線で結線しなければならず、バックアップ切
り替え機構が大規模、高価なものになるという問題があ
る。
【0008】本発明の目的は、ホットスタンバスシステ
ムの現用機または予備機として動作する情報処理装置に
おいて、システムスループットの低下を招くことなく、
より確実なバックアップ切り替えが可能で、バックアッ
プ切り替え時間も短縮可能な情報処理装置を提供するこ
とにある。
【0009】本発明のもう一つの目的は、ホットスタン
バイシステムの現用機と予備機の台数が多い場合にも、
バックアップ切り替えのために膨大な信号線の結線を必
要とせず、バックアップ切り替え機構を安価に実現可能
な情報処理装置を提供することにある。
【0010】
【課題を解決するための手段】前記目的を達成するた
め、本発明のホットスタンバイシステムの現用機又は予
備機として動作する情報処理装置によれば、現用機とし
て動作時に当該現用機のダウンを検出して当該現用機の
ためのバックアップ切り替えを起動する手段と、予備機
として動作時に現用機側のダウンを検出して現用機のた
めのバックアップ切り替えを起動する手段の両方が設け
られる。
【0011】現用機として動作時、そのダウンを直接的
に検出できるため、ダウンした現用機からバックアップ
切り替えを起動することにより、迅速なバックアップ切
り替え処理が可能になる。そして、そのバックアップ切
り替えの処理に失敗した場合(例えば、ダウンした現用
機の切り離しが予備機に正常に伝達できず、予備機側が
バックアップ処理を行わないような場合)でも、その現
用機のダウンが予備機側で検出されれば、予備機として
動作時に、予備機からバックアップ切り替えが起動さ
れ、バックアップ切り替え処理に成功する可能性が高
い。つまり、本発明の情報処理装置によるホットスタン
バイシステムにおいては、現用機からのバックアップ切
り替え起動と予備機からのバックアップ切り替え起動の
併用により、全体としてバックアップ切り替え時間の短
縮が可能になるとともに、フェイルセーフ効果を得られ
バックアップ切り替えの確実性が高まる。さらに、予備
機側で現用機のダウン検出を従来と同様のヘルスチッェ
クで行う場合でも、システムスループットの低下をもた
らすようなヘルスチェック時間間隔の無理な短縮を行う
必要がない。
【0012】また、本発明によれば、ダウンした現用機
より、それが切り離されたことが当該現用機に対する予
備機に通知され、また、ダウンした現用機に、当該現用
機に対する予備機より切り離しが指示される。この場
合、バックアップ切り替えに関連した現用機と予備機と
の間での切り離し通知や切り離し指示の受け渡しのため
に、全情報処理装置に共通な一つの通信路を設けるだけ
でよく、システム上の情報処理装置の台数が多い場合で
も、前記特公昭63−43771号の方式のようなバッ
クアップ切り替え機構の大規模化を避けることができ
る。
【0013】ところで、ダウンした現用機に対し、その
現用機及び予備機からバックアップ切り替えが重複して
起動され、ダウンした現用機の切り離し処理が重複して
行われると不都合な場合がある。例えば、現用機の切り
離しをシステムリセットによって行うとすると、2回目
のリセットで1回目のリセット時の情報処理装置の状況
が破壊されてしまい、ダウン原因の解析に支障をきたす
恐れがある。本発明の情報処理装置によれば、現用機と
して動作時、その切り離し処理の重複実行を防止するた
めの手段が設けられるため、そのような不都合を回避で
きる。
【0014】
【発明の実施の形態】以下、図面を用い、本発明の実施
の形態を説明する。図1は、ホットスタンバイシステム
において現用機又は予備機として用いられる本発明の情
報処理装置の一例を示す概略ブロック図である。図1に
おいて、情報処理装置100は、業務処理又はバックア
ップ処理を実行する主処理装置110に加え、バックア
ップ切り替えに関与する補助処理装置120を有する。
補助処理装置120は通信手段121、センサインタフ
ェース部122、通信ポート123、リセット信号駆動
部124及び制御部125からなる。
【0015】リセット信号駆動部124は主処理装置1
10に対するリセット信号RSTの駆動を行うものであ
る。通信手段121は主処理装置110と補助処理装置
120との情報受け渡しのための手段で、例えばシリア
ル通信回線、又は主処理装置110との共有メモリもし
くは共有レジスタである。センサインタフェース部12
2は、主処理装置110の動作異常、電源112の電圧
異常、冷却ファン114の動作異常等、主処理装置11
0による業務続行が不可能な異常を検出するものであ
る。通信ポート123は、補助処理装置間通信路130
に接続された他の情報処理装置の補助処理装置との間で
通信を行うためのものである。この補助処理装置間通信
路130を利用して、複数の情報処理装置の補助処理装
置間で障害発生の通知及び切り離し要求の通知が伝送さ
れる。制御部125は、補助処理装置120内の各部の
制御等を行う部分である。
【0016】図2に、図1の情報処理装置が2台、現用
機あるいは予備機1台として利用されるホットスタンバ
イシステムの一例を示す。図2において、2台の情報処
理装置100(1),100(2)はそれぞれ図1に示
した構成のものであるが、図面の煩雑さを避けるため内
部構成は簡略化されている。ここでは、便宜上、情報処
理装置100(1)を現用機、他方の情報処理装置10
0(2)を予備機として説明するが、その逆であっても
構わない。業務用資源200は、主処理装置が業務処理
を実行する上で必要なデータを格納した外部記憶装置、
通信回線等である。
【0017】まず、予備機100(2)からバックアッ
プ切り替えを起動する場合について説明する。この場
合、現用機100(1)の切り離しの開始契機は、予備
機100(2)のオペレータによる切り離し起動操作、
又は現用機100(1)に対する定期的なヘルスチェッ
クによる異常検出である。このヘルスチェックは、従来
と同様に、予備機100(2)から定期的に現用機10
0(1)へ確認電文を送り、それに対する現用機100
(1)からの応答電文を確認することによって行われ
る。例えば、予備機100(2)において、その主処理
装置110(2)上のプログラムが補助処理装置120
(2)に対し現用機への確認電文の送信を指示する。こ
の指示を通信手段121を介して受け取った補助処理装
置120(2)の制御部125は、現用機100(1)に
対する確認電文を通信ポート123より補助処理装置間
通信路130へ送出する。現用機100(1)におい
て、補助処理装置120(1)はこの確認電文を通信ポ
ート123を介して受信すると、その制御部125はセ
ンサインタフェース部122が異常を検出していなけれ
ば、正常の旨の応答電文を通信ポート123より補助処
理装置間通信路130で予備機100(2)へ返す。予
備機100(2)においては、補助処理装置120
(2)が応答電文を通信ポート123で受信し、それを
通信手段121を介して主処理装置110(2)へ送
る。その主処理装置110(2)上のプログラムは、発
行した確認電文に対する応答電文を確認することによ
り、現用機100(1)が正常であるか異常であるかを
判断する。
【0018】予備機100(2)において、ヘルスチェ
ツクにより現用機100(1)の動作異常が検出される
か、あるいはオペレータの切り離し起動操作がなされる
と、主処理装置110(2)上のプログラムが通信手段
121を介して補助処理装置120(2)に対し現用機
の切り離しを指示する。補助処理装置120(2)の制
御部125は、現用機100(1)に対する切り離し要
求電文を通信ポート123より補助処理装置間通信路1
30へ送出する。この切り離し要求電文の形式は図3に
その例を示すとおり、送信先アドレス300、送信元ア
ドレス301及び切り離しコマンド識別子302を含
む。この例では現用機100(1)には#1のアドレス
が割り当てられ、予備機100(2)には#2のアドレ
スが割り当てられている。
【0019】この切り離し要求電文は、現用機100
(1)の補助処理装置120(1)に通信ポート123
を介して受信される。補助処理装置120(1)の制御
部125は、受信した切り離し要求電文中の送信先アド
レスと自系のアドレスとの一致を確認すると、その電文
を自系に対する切り離し要求電文と判断し、リセット信
号駆動部124でリセット信号RSTを駆動させること
により主処理装置110(1)を停止させる。これによ
り、現用機100(1)の主処理装置110(1)から
業務用資源200へのアクセスが停止する。この後、予
備機100(2)の主処理装置110(2)は業務用資
源200を使用して業務処理を引き継ぐ。現用機100
(1)の主処理装置110(1)により各トランザクシ
ョンを処理中に、その処理進行状況を示す情報が主処理
装置110(1)上の特殊なプログラムによって業務用
資源200に逐次記憶されている。予備機100(2)
は、この情報に基づいて現用機100(1)によるトラ
ンザクション処理の状況を把握し、現用機100(1)
の処理を適切に引き継ぐことができる。
【0020】次に、現用機100(1)側でその異常を
検出してバックアップ切り替えを起動する場合について
説明する。現用機100(1)の補助処理装置120
(1)において、制御部125はセンサインタフェース
部122を介して主処理装置110(1)のマシンチェ
ック、電源異常、冷却ファン異常など主処理装置110
(1)が動作続行不能な障害状態を検出すると、リセッ
ト信号駆動部124でリセット信号RSTを駆動させる
ことにより主処理装置110(1)を停止させる。これ
で業務用資源200は現用機100(1)から切り離さ
れる。
【0021】この後、現用機100(1)の補助処理装
置120(1)の制御部125は、通信ポート123を
介し予備機100(2)に対するダウン通知電文を補助
処理装置間通信路130へ送出する。このダウン通知電
文は図4に例を示すように、送信先アドレス400、送
信元アドレス、及び電文種別を含む。このダウン通知電
文は、予備機100(2)の補助処理装置120(2)
に通信ポート123を介して受信される。補助処理装置
120(2)の制御部125は、このダウン通知電文の
内容を通信手段121を介して主処理装置110(2)
に渡す。主処理装置110(2)上のプログラムは、そ
のダウン通知電文の送信先アドレスと自系のアドレスと
の一致を確認すると、現用機100(1)のバックアッ
プ処理を開始し、業務用資源200に記憶されている現
用機100(1)の処理進行状況情報を参照して業務処
理を引き継ぐ。なお、予備機100(2)において現用
機100(1)とのバックアップ関係が明かであれば、
ダウン通知電文を図6に示すようなブロードキャスト電
文(後述)としてもよいことは当然である。
【0022】図5に、図1の情報処理装置が3台、現用
機兼予備機として利用されるホットスタンバイシステム
の一例を示す。図5において、3台の情報処理装置10
0(11),100(12),100(13)はそれぞ
れ図1に示した構成のものであるが、図2の場合と同様
に図面の煩雑さを避けるため内部構成は簡略化されてい
る。
【0023】業務はプロセスA、プロセスB、プロセス
C、プロセスDの直列系で構成され、業務を実行するに
は4つのプロセスA,B,C,Dが同時に稼動するする
必要があるものとする。4つのプロセスは3台の情報処
理装置に分散して現用プロセスとして実行される。各プ
ロセス毎にその機能実行上必要な外部記憶装置及び通信
回線などのプロセス用資源を持ち、各プロセス用資源は
バックアップ関係にある情報処理装置から互いにアクセ
スできるように接続される。また、各現用プロセスに対
応して、その現用プロセスが実行されている情報処理装
置とは別の情報処理装置上にスタンバイ用の予備プロセ
スを待機しておくものとする。
【0024】図5の例では、アドレス#1の情報処理装
置100(11)はプロセスAに関する現用機であると
ともにプロセスBに関する予備機であり、通常は現用プ
ロセスAを実行し、予備プロセスBを実行待機する。し
たがって、この情報処理装置100(11)の主処理装
置110(11)には、プロセスA用資源501とプロ
セスB用資源502が接続される。アドレス#2の情報
処理装置100(12)はプロセスB,Cに関する現用機
であるとともにプロセスA,Dに関する予備機であり、
通常は現用プロセスB,Cを実行し、予備プロセスA,
Dを実行待機する。したがって、この情報処理装置10
0(12)の主処理装置110(12)には、プロセス
A用資源501、プロセスB用資源502、プロセスC
用資源503及びプロセスD用資源504が接続され
る。また、アドレス#3の情報処理装置100(13)
はプロセスDに関する現用機であるとともにプロセスC
に関する予備機であり、通常は現用プロセスDを実行
し、プロセスCを実行待機する。この情報処理装置10
0(13)の主処理装置110(13)には、プロセス
C用資源503とプロセスD用資源504が接続され
る。
【0025】現用機兼予備機としての各情報処理装置1
00(11),100(12),100(13)は、そ
の主処理装置110(11),110(12),110
(13)上のプログラムにより、対応したプロセスの状
態が、図5の下段に示すようなスタンバイ状態記憶状況
511,512,513として仮想記憶上に記録され
る。これらスタンバイ状態記憶状況には、プロセスが予
備状態である場合に、そのプロセスがバックアップすべ
き情報処理装置のアドレスも併せて記録される。例えば
アドレス#1の情報処理装置100(11)のスタンバ
イ状態記憶状況511は、情報処理装置100(11)
に現用プロセスA521と予備プロセスB522があ
り、予備プロセスB522はアドレス#2の情報処理装
置100(12)上の現用プロセスB523をバックア
ップするため待機していることを示す。同様に、アドレ
ス#2の情報処理装置100(12)のスタンバイ状態
記憶状況512は、情報処理装置100(12)上で現
用プロセスB523、現用プロセスC524が動作し、
予備プロセスA525がアドレス#1の情報処理装置1
00(11)上の現用プロセスAをバックアップして待
機し、予備プロセスD526がアドレス#3の情報処理
装置100(13)上の現用プロセスDをバックアップ
して待機していることを示す。
【0026】ここで、アドレス#2の情報処理装置10
0(12)において、主処理装置110(12)の異常
が生じた場合のバックアップ切り替えの動作を説明す
る。
【0027】まず、障害を発生した情報処理装置100
(12)が自らバックアップ切り替えを起動する場合に
ついて説明する。情報処理装置100(12)におい
て、補助処理装置120(12)がセンサインタフェー
ス部122を介して主処理装置110(12)のマシン
チェック、電源異常、冷却ファン異常など主処理装置1
10(12)が動作を続行不能な状態を検出すると、補
助処理装置120(12)の制御部125はリセット信号
駆動部124によってリセット信号RSTを駆動させ、
主処理装置110(12)をプロセス用資源501〜5
04から切り離し、この場合に予備機として動作する情
報処理装置100(11),100(13)との資源アク
セスの競合を防止する。この後、情報処理装置100
(12)の補助処理装置120(12)において、制御
部125は通信ポート123を介しダウン通知電文を補
助処理装置間通信路130へ送出する。
【0028】このダウン通知電文の形式は図6にその例
を示すとおり、システム内の全情報処理装置の補助処理
装置に受信されるべきブロードキャスト通知であり、送
信先アドレス601にブロードキャストアドレスが設定
され、送信元アドレス602にダウンした情報処理装置
100(12)のアドレス#2が設定される。
【0029】このダウン通知電文を受信したアドレス#
1の情報処理装置100(11)の補助処理装置120
(11)は、ダウン通知電文の内容を通信手段121に
より主処理装置110(11)に伝達する。主処理装置
110(11)上のプログラムは、ダウン通知電文中に
示される送信元アドレスすなわち#2と、スタンバイ状
態記憶状況511中の予備プロセスB522のスタンバ
イ対象アドレスすなわち#2が一致することを条件に、
予備プロセスB522を現用として動作する。予備プロ
セスB522は現用プロセスとなり、プロセスB用資源
502を使用して部分的に業務を引き継ぐ。
【0030】ダウン通知電文はブロードキャスト通知で
あるため、アドレス#3の情報処理装置100(13)
の補助処理装置120(13)でも同様に受信される。
これを契機に、アドレス#1の情報処理装置100(1
3)においても、同様のプロセス切り替えを行い、予備
プロセスC528を現用プロセスとし、プロセスC用資
源503を使用して部分的に業務処理を引き継ぐ。この
ようにして、ダウンしたアドレス#2の情報処理装置1
00(12)を除いた2台の情報処理装置100(1
1),100(13)上に業務処理に必要なプロセス
A,B,C,Dがすべて揃い今まで通り業務を続行でき
る。
【0031】次に、予備機側からバックアップ切り替え
を起動する場合について説明する。各情報処理装置10
0(11),100(12),100(13)は、予備
プロセスのスタンバイ対象である他の情報処理装置に対
し、定期的なヘルスチェックを行う。例えば、アドレス
#1の情報処理装置100(11)の主処理装置110
(11)上のプログラムは、スタンバイ状態記憶情報5
11を参照し、予備プロセスB522のスタンバイ対象
であるアドレス#2の情報処理装置100(12)に対
する確認電文を補助処理装置120(11)を介して補
助処理装置間通信路130へ送出し、それに対する応答
電文を確認することによりアドレス#2の情報処理装置
100(12)のヘルスチェツクを行う。
【0032】このヘルスチェックでアドレス#2の情報
処理装置100(12)の異常を検出した場合(アドレ
ス#1の情報処理装置100(11)のオペレータによ
りアドレス#2の情報処理装置100(12)の切り離
し起動操作を行った場合も同様)、アドレス#1の情報
処理装置100(11)の主処理装置110(11)上
のプログラムは、通信手段121を介して補助処理装置
120(11)に対しアドレス#2の情報処理装置10
0(12)の切り離しを指示する。補助処理装置120
(11)の制御部125は、ダウンした現用機たる情報
処理装置100(12)に対する切り離し要求電文(図
3)を通信ポート123より補助処理装置間通信路13
0へ送出する。
【0033】この切り離し要求電文を受信したアドレス
#2の情報処理装置100(12)の補助処理装置12
0(12)において、制御部125は、その切り離し要
求電文中の送信先アドレスと自系のアドレスとの一致を
確認すると、その電文を自系に対する切り離し要求電文
と判断し、リセット信号駆動部124でリセット信号R
STを駆動させることにより主処理装置110(12)
を停止させ、プロセス用資源501〜504から切り離
す。この後、補助処理装置120(12)の制御部12
5は、通信ポート123を介し、前述したブロードキャ
スト通知であるダウン通知電文を補助処理装置間通信路
130へ送出する。このダウン通知電文を受信したアド
レス#1の情報処理装置110(11)とアドレス#3
の情報処理装置100(13)は、それぞれ前述したよ
うなプロセスの切り替えを行い、プロセスB,Cを現用
プロセスとして分担し業務処理を続行する。
【0034】ところで、同じ情報処理装置に対する切り
離しが重複して起動されることがあり得る。例えば、異
常を発生した情報処理装置が自らの起動により主処理装
置に対するリセット信号を駆動したが、その際のダウン
通知電文がバックアップ側の他の情報処理装置に正常に
伝達されず、その後にバックアップ側の他の情報処理装
置がヘルスチェックでその異常を検出して切り離し要求
電文を送出するようなケースである。もし、その切り離
し要求電文に応答して、異常を発生した情報処理装置で
主処理装置に対するリセット信号を再び駆動してしまう
と、1回目のリセット時の情報処理装置の状況が保存さ
れず、ダウン原因の解析に支障をきたす。これを防止す
るため、各情報処理装置(100)において、補助処理
装置(120)の制御部(125)は、その主処理装置
(110)の切り離し回数をカウントし、そのカウント
が0であることを条件にリセット信号RSTの駆動を行
い、リセット信号RSTの重複駆動を禁止する。そし
て、制御部(125)は、主処理装置(110)のリブ
ート時に、そのカウンタをゼロクリアする。
【0035】ここまでは、現用機を業務用資源またはプ
ロセス用資源から切り離すための主処理装置の停止手段
としてリセット信号を用いる例を示したが、システムリ
セットによる切り離しを行うと、情報処理装置内の障害
時のレジスタ内容が失われ障害対策に支障を来すことが
ある。これを防ぐために、前述のバックアップ切り替え
処理手順において補助処理装置がリセット信号に代えて
割込み信号を用い、割込みを受けた主処理装置上のプロ
グラムが業務用資源またはプロセス用資源へのアクセス
を停止する手順を採用することができる。また、割込み
による業務用資源またはプロセス用資源へのアクセス停
止の応答を、通信手段により、予め定められた時間内に
主処理装置から補助処理装置へ伝達することとし、これ
がなされなかった場合に補助処理装置からリセットを行
うようにすることもできる。これらによって、障害機の
切り離しを確実に行ったうえで、障害の程度に応じて可
能な限り詳細な障害状況を情報処理装置内に残すことが
できる。
【0036】
【発明の効果】以上の説明から明らかなように、本発明
の情報処理装置によれば、ホットスタンバイシステムの
バックアップ切り替えの確実化、高速化が可能である。
また、システムスループットの低下を招くことなく、バ
ックアップ切り替え時間の短縮が可能である。また、ホ
ットスタンバイシステムを構成する情報処理装置の台数
が多い場合でも、バックアップ切り替え機構の大規模化
を避けることができる。さらに、バックアップ切り替え
の対象となった情報処理装置のダウン時の状況を保存す
ることができる。よって、ホットスタンバイシステムの
稼働効率を向上できる、等々の効果を得られる。
【図面の簡単な説明】
【図1】ホットスタンバイシステムに用いられる本発明
の情報処理装置の構成例を示すブロック図である。
【図2】本発明の情報処理装置が2台からなるホットス
タンバイシステムの一例を示すブロック図である。
【図3】切り離し要求電文の一例を示す図である。
【図4】ダウン通知電文の一例を示す図である。
【図5】本発明の情報処理装置が3台で4つのプロセス
を相互にバックアップするホットスタンバイシステムの
一例を示すブロック図である。
【図6】ダウン通知電文の一例を示す図である。
【符号の説明】
100 情報処理装置 110 主処理装置 112 電源 114 冷却ファン 120 補助処理装置 121 通信手段 122 センサインタフェース部 123 通信ポート 124 リセット信号駆動部 125 制御部 130 補助処理装置間通信路 100(1) 情報処理装置(現用機) 100(2) 情報処理装置(予備機) 100(11) 情報処理装置(現用機兼予備機) 100(12) 情報処理装置(現用機兼予備機) 100(13) 情報処理装置(現用機兼予備機) 200 業務用資源 501 プロセスA用資源 502 プロセスB用資源 503 プロセスC用資源 504 プロセスD用資源 511,512,513,514 スタンバイ状態記憶
状況 RST リセット信号

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 ホットスタンバイシステムの現用機又は
    予備機として動作する情報処理装置であって、 現用機として動作時に当該現用機のダウンを検出して当
    該現用機のためのバックアップ切り替えを起動する手段
    と、 予備機として動作時に現用機側のダウンを検出して現用
    機のためのバックアップ切り替えを起動する手段を具備
    することを特徴とする情報処理装置。
  2. 【請求項2】 現用機として動作時に当該現用機のダウ
    ンを検出すると、当該現用機を切り離すとともにダウン
    通知を予備機側に送信する手段と、 予備機として動作時に現用機側からダウン通知を受信す
    ると、当該予備機を現用機に切り替える手段と、 予備機として動作時に現用機側のダウンを検知すると、
    切り離し要求を現用機側に送信するとともに当該予備機
    を現用機に切り替える手段と、 現用機として動作時に予備機側から切り離し要求を受信
    すると、当該現用機を切り離す手段とを具備することを
    特徴とする請求項1記載の情報処理装置。
  3. 【請求項3】 現用機として動作時にその切り離し処理
    の重複実行を防止するための手段を具備することを特徴
    とする請求項1もしくは2記載の情報処理装置。
JP25501197A 1997-09-19 1997-09-19 情報処理装置 Expired - Fee Related JP3420919B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP25501197A JP3420919B2 (ja) 1997-09-19 1997-09-19 情報処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP25501197A JP3420919B2 (ja) 1997-09-19 1997-09-19 情報処理装置

Publications (2)

Publication Number Publication Date
JPH1196033A true JPH1196033A (ja) 1999-04-09
JP3420919B2 JP3420919B2 (ja) 2003-06-30

Family

ID=17272964

Family Applications (1)

Application Number Title Priority Date Filing Date
JP25501197A Expired - Fee Related JP3420919B2 (ja) 1997-09-19 1997-09-19 情報処理装置

Country Status (1)

Country Link
JP (1) JP3420919B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006309292A (ja) * 2005-04-26 2006-11-09 Nec Corp サーバ装置、サーバシステム、及びサーバシステムでの系切り換え方法
JP2011170445A (ja) * 2010-02-16 2011-09-01 Nec Corp サーバシステムの障害監視装置、サーバシステム、及びサーバシステムの障害監視方法
JP2012090010A (ja) * 2010-10-18 2012-05-10 Nakayo Telecommun Inc 通信装置、および通信装置のバックアップ方法
JP2013003724A (ja) * 2011-06-14 2013-01-07 Denso Corp 車載電子制御装置
JP2017120507A (ja) * 2015-12-28 2017-07-06 東芝三菱電機産業システム株式会社 多重化システム及び多重化システムにおける監視制御装置の切換方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006309292A (ja) * 2005-04-26 2006-11-09 Nec Corp サーバ装置、サーバシステム、及びサーバシステムでの系切り換え方法
JP2011170445A (ja) * 2010-02-16 2011-09-01 Nec Corp サーバシステムの障害監視装置、サーバシステム、及びサーバシステムの障害監視方法
JP2012090010A (ja) * 2010-10-18 2012-05-10 Nakayo Telecommun Inc 通信装置、および通信装置のバックアップ方法
JP2013003724A (ja) * 2011-06-14 2013-01-07 Denso Corp 車載電子制御装置
JP2017120507A (ja) * 2015-12-28 2017-07-06 東芝三菱電機産業システム株式会社 多重化システム及び多重化システムにおける監視制御装置の切換方法

Also Published As

Publication number Publication date
JP3420919B2 (ja) 2003-06-30

Similar Documents

Publication Publication Date Title
US6148415A (en) Backup switching control system and method
JPH03164837A (ja) 通信制御処理装置の切替方法
JP3806600B2 (ja) 多重系システムの系切り替え方法
JP3420919B2 (ja) 情報処理装置
JP2000020336A (ja) 二重化通信システム
JPH06197112A (ja) 管理システム
US6480466B1 (en) Terminal switching apparatus and method
JPH10171769A (ja) 複合計算機システム
JP7403433B2 (ja) プラント制御システムの通信装置及び通信方法
JPH09311841A (ja) マルチプロセッサシステム
JP2001175545A (ja) サーバシステムおよび障害診断方法ならびに記録媒体
JP2007026038A (ja) パス監視システム,パス監視方法,およびパス監視プログラム
JPS5870670A (ja) 二重系の交換機の障害情報転送方式
JP2636610B2 (ja) バックアップ方式
JPH1049450A (ja) 遠隔監視システムの異常時の復旧方式
JP2000330829A (ja) 系間通信処理装置
JP2000349900A (ja) 交換装置の障害処理方式
JP3012491B2 (ja) 二重化装置のマイクロ診断方法
JPH06290126A (ja) 計算機システム障害監視方式
JP2002182994A (ja) 情報処理システム及びそれに用いる転送制御方法
JPH08147255A (ja) 障害監視方式
JP2000242616A (ja) 障害処理装置,障害処理方法および記録媒体
JPS6375843A (ja) 異常監視方式
JPS63279646A (ja) 網管理装置の自動再開処理方式
JPH03237556A (ja) マルチホストシステムの通信管理方式

Legal Events

Date Code Title Description
S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313115

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313115

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313115

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090418

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090418

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100418

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110418

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120418

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120418

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130418

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140418

Year of fee payment: 11

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees