JPS62105243A - システム障害の復旧装置 - Google Patents

システム障害の復旧装置

Info

Publication number
JPS62105243A
JPS62105243A JP60245372A JP24537285A JPS62105243A JP S62105243 A JPS62105243 A JP S62105243A JP 60245372 A JP60245372 A JP 60245372A JP 24537285 A JP24537285 A JP 24537285A JP S62105243 A JPS62105243 A JP S62105243A
Authority
JP
Japan
Prior art keywords
processor
storage device
information
external storage
failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60245372A
Other languages
English (en)
Inventor
Kenichi Kuroiwa
黒岩 謙一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP60245372A priority Critical patent/JPS62105243A/ja
Publication of JPS62105243A publication Critical patent/JPS62105243A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)
  • Multi Processors (AREA)
  • Maintenance And Management Of Digital Transmission (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、システム障害の復旧装置に関し、とくに複数
のプロセッサにより構成されるシステムの障害勾発生時
の復旧装置に関する。
〔従来の技術〕
従来、複数のマイクロプロセッサなどにより構成される
システムにおいて、1つのマイクロプロセッサのサブシ
ステム内でハードフェア障害、ノイズ、7フームクエア
のバグ等により、通常動作の続行不能な障害が発生した
場合、障害解析には発生当時直後の情報が不可欠である
ため、システム全体が動作の継続を停止していた。
〔発明が解決しようとする問題点〕
しかし、クラスタシステムのターミナルコントローラや
ファイルチーバ等、多数の端末に対して通信制御やファ
イルアクセスサービスを行うシステムの場合、システム
単体の機能が停止すると接続されている趨末全数の機能
に支障をきたし、また、この種のシステムは通常有効な
表示機能をもっておらず、オペレータが常についている
わけでもないので、障害発生時にユーザが障害情報を把
握し【システムを即座に復旧させることは困難である。
本発明の目的は、1つのプロセッサで障害が発生しても
システム全体の機能を停止することなく、障害発生プロ
セッサの復旧を自動的に行ない、またシステムが復旧し
た後でも障害原因解析のために障害発生当時直後の情報
を簡単に得ることを可能にするものである。
〔問題点を解決するための手段〕
本発明によるシステム障害の復旧装置は、処理ユニット
ならびにメモリ、I10制御装置からなるプロセッサを
複数有すると共に、これらの各プロセッサは他のプロセ
ッサとの情報交換のための送信部ならびに受信部を備え
、該プロセッサの中の少なくとも1つのプロセッサが外
部記憶装置を制御しているシステムであって、前記各プ
ロセッサは、自プロセッサ内で異常障害が発生した場合
に、前記外部記憶装置を制御しているプロセッサに該異
常障害の情報を送信する手段と、核内プロセッサの通常
処理を再起動する手段とを有し、前記外部記憶装置を制
御しているプロセッサは、自プロセッサの通常処理を継
続しながら、前記異常障害の情報を受信して該外部記憶
装置にd1シ録する手段と、前記異常障害が発生したプ
ロセッサに、該外部記憶装置から核プロセッサのシステ
ムプログラムを転送する手段とを有しているため、異常
障害発生時にシステム全体の機能停止を回避でき、しか
も復旧した後でも障害原因の解析のために障害発生直後
の情報を簡単に得ることを可能にす゛る。
〔実 施 例〕
以下に本発明を、その実施例について図面を参照して説
明する。
第1図は本発明による一実施例を示すブロック図で、処
理ユニット1はバスBAを介在して、メモリ2、入出力
用のI10制御装置3、送信部5 、12゜19、26
ならびに受信部7 、14.21.28に接続され、I
10制御装置3には外部記憶装置4が接続されている。
なお、処理ユニット1、メモリ2、I10制御装置3、
外部記憶装置4、送信部5〜26、ならびに受信部7〜
28は、チプシステムであるプロ七ツナ人を構成してい
る。
同様に処理ユニット9はバスBBを介在して、メモリ1
0、I10制御装置11、受信部6ならびに送信部8に
接続されて、これらはプロセッサBを構成している。以
下同じように、プロセッサC,ブロセッサD、〜プロセ
ッサNが構成されている。
プロセッサAの第1の送信部5は、プロセッサBの受信
部6に接続され、プロセッサAの第1の受信部7は、プ
ロセッサBの送信部8に接続されており、同様にしてプ
ロセラ−9−Aは、プロセッサC,D−Nに接続されて
いて、処理ユニット1は処理ユニツ) 9 、16.2
3.30と情報の送受信を行ないながら、外部記憶装f
4を制御して処理を実行し、同じ様に処理ユニツ) 9
 、16.23.30は、処理ユニット1と情報の送受
信を行ないなから、各プロセッサC,D、Nの図示略の
入出力(Ilo )機器を制御して処理を実現している
なお、メモ910.17.24.31には、各プロセラ
fB〜Nのシステムのファームウェアと、システム障害
の復旧を実現するための異常障害の処理プログラムとが
格納されている。また、この異常障害処理プログラムは
、異常障害発生時のプログラムの暴走等により破壊され
ることがないようROM化されて実裟される。
つぎに異常4害の処理プログラムの動作を、プロセッサ
BKて異常障害が発生した場合を例にとり、第2図のフ
ローチャートを、参照して説明する。
プロセッサBがステップ塩の様に処理をスタートシ、ス
テップBtのシステムファームウェアの実行中に、ステ
ップB、の如く異常り檎害が検出された場合、システム
ファームクエアから異常障害処理プログラムに制御がわ
たされ、ステップB4の様K、障害解析用の異常情報の
データが送信部8からプロセッサA側に送信される。
一方、プロセッサAはすでにステップAIの様に処理を
スタートしていて、ステップ^のシステムファームウェ
アの実行中に、ステップA、の如くプロセラ−fBから
の受信データをチェックして、ステップA4の様に受信
データが異常障害の情報であった場合、プロセラfBと
の間O情報の送受信により実行していた処理が、すべて
異常終了したものと判断して、ステップA、の如く、プ
ロセッサBとの通信状態をクリアしたのち、ステップA
6のように、メモリ2内にある外部記憶装置4用の転送
用バッファエリアへ上記の異常障害情報を転送してのち
、ステップA、の如く、プロセッサBへ異常障害情報の
受信完了を通知する。
つぎにプロセラ−iAは外部記憶装置4に、ステップA
、の様に、上述の異常障害情報を転送して書き込み、こ
の書き込みの完了後、ステップA9に示される如(、プ
ロセラfBのシステムファームウェアであるシステムプ
ログラムを読み出して、該プロセッサBに送信、すなわ
ちデータ転送する。
プロセッサBは、受信したシステムファームクエアのプ
ログラムをメモリ2に再展開しくステップB、)、終了
後、ステップB、に示すようにシステムファームクエア
を再起動する。プロセラ−fBのシステムファームウェ
アは、起動直後に、プロセッサAに対して復旧完了を通
知する(ステップB、)。
なお、プロセラfAのシステムファームクエアは、上述
したプロセラ411−Bに対する異常R害処理中にも、
他のプロセッサC,Nからの割り込み受信に対して、復
旧中のプロセッサBに依存しないかぎりは、通常の処理
を侵先して行なう。
〔発明の効果〕
以上説明したように本発明は、複数プロセッサにより構
成されるシステムにおいて、あるプロセッサに障害が発
生した場合に、外部記憶装置を制御するプロセッサが自
プロセッサの通常処理を継続しながら、障害発生プロセ
ッサの障害情報の記録およびシステムファームクエアの
再転送等の障害復旧動作を行うことにより、障害発生に
よる装置全体の完全な機能停止を回避し障害発生プロセ
ッサの復旧を自動的に行うとともに、システムが復旧し
た後でも、障害原因解析のために障害発生当時直後のす
a報を外部記憶装置から簡単に得ることができる効果が
ある。
【図面の簡単な説明】
第1図は本発明によるシステム障害の復旧装置を示す一
実施例の構成図、第2図は異常障害発生時の異常障害処
理プログラムの動作を示すフローチャートである。 A、B、C,D〜N・・・・・・プロセッサ1、9.1
6.23.30  ・・・・・・処理ユニット(CPU
)2、10.17.24.31・・・・・・メ  モ 
 リ3、11.18.25.32・・・・・・I10制
御装置4・・・・・・・・・・・・・・・・・・・・・
・・・・・・・・・外部記憶装置5、12.19.26
・・・・・・・・・・・・送  信  部7、14.2
1.28・・・・・・・・・・・・受  信  部6、
13.20.27・・・・・・・・・・・・受  信 
 部8、15.22.29・・・・・・・・・・・・送
  信  部。

Claims (1)

  1. 【特許請求の範囲】 処理ユニットならびにメモリ、I/O制御装置からなる
    プロセッサを複数有すると共に、これらの各プロセッサ
    は他のプロセッサとの情報交換のための送信部ならびに
    受信部を備え、該プロセッサの中の少なくとも1つのプ
    ロセッサが外部記憶装置を制御しているシステムであっ
    て、 前記各プロセッサは、自プロセッサ内で異常障害が発生
    した場合に、前記外部記憶装置を制御しているプロセッ
    サに該異常障害の情報を送信する手段と、該自プロセッ
    サの通常処理を再起動する手段とを有し、 前記外部記憶装置を制御しているプロセッサは、自プロ
    セッサの通常処理を継続しながら、前記異常障害の情報
    を受信して該外部記憶装置に記録する手段と、前記異常
    障害が発生したプロセッサに、該外部記憶装置から該プ
    ロセッサのシステムプログラムを転送する手段とを 有していることを特徴とするシステム障害の復旧装置。
JP60245372A 1985-10-31 1985-10-31 システム障害の復旧装置 Pending JPS62105243A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60245372A JPS62105243A (ja) 1985-10-31 1985-10-31 システム障害の復旧装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60245372A JPS62105243A (ja) 1985-10-31 1985-10-31 システム障害の復旧装置

Publications (1)

Publication Number Publication Date
JPS62105243A true JPS62105243A (ja) 1987-05-15

Family

ID=17132682

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60245372A Pending JPS62105243A (ja) 1985-10-31 1985-10-31 システム障害の復旧装置

Country Status (1)

Country Link
JP (1) JPS62105243A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06284168A (ja) * 1993-03-30 1994-10-07 Nec Corp オンライン情報処理装置
US5418938A (en) * 1991-12-27 1995-05-23 Fujitsu Limited Data management system having CPUs to each other via dual-port memory

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5418938A (en) * 1991-12-27 1995-05-23 Fujitsu Limited Data management system having CPUs to each other via dual-port memory
JPH06284168A (ja) * 1993-03-30 1994-10-07 Nec Corp オンライン情報処理装置

Similar Documents

Publication Publication Date Title
JP3047275B2 (ja) バックアップ切り換え制御方法
KR100557399B1 (ko) 네트웍 매체 링크상태 기능을 이용한 컴퓨터 클러스터링시스템의 가용도 개선방법
US6594709B1 (en) Methods and apparatus for transferring data using a device driver
JPH10154085A (ja) 二重化された監視/制御プロセッサによるシステム監視・制御方法および二重化監視/制御プロセッサ・システム
JPS62105243A (ja) システム障害の復旧装置
JP3190880B2 (ja) スタンバイシステム、スタンバイ方法、および記録媒体
JP3420919B2 (ja) 情報処理装置
JPH05224964A (ja) バス異常通知方式
JP2004013723A (ja) 共有メモリを使ったクラスタ構成を採用した情報処理システムの障害処理装置と方法
JP2000148525A (ja) サービスプロセッサ二重化システムの現用系負荷軽減方法
JPS58225738A (ja) 分散形伝送システム
JPH06152570A (ja) 二重化データ処理装置における系切替え処理方式
JP2605507B2 (ja) データ復元方式
JPS60247760A (ja) デ−タ通信システム
JP3316739B2 (ja) 装置間インタフェース制御方式
JP3830558B2 (ja) オンラインシステムおよびその通信制御方法
JPH03237556A (ja) マルチホストシステムの通信管理方式
JPS62180454A (ja) 通信システムの障害情報収集方法
JPH02310755A (ja) ヘルスチェック方式
JP2583169B2 (ja) 通信処理装置の運用プログラム切替方法
JPS62190536A (ja) 冗長構成制御方式
JPS63279646A (ja) 網管理装置の自動再開処理方式
JPH1023046A (ja) ポーリング式監視方法
JPH09160875A (ja) マルチエージェント相互バックアップ方式
JPH04291650A (ja) データ破壊防止機能を有する情報処理システム