JPH1173336A - 計算機システムの障害自動復旧システム - Google Patents

計算機システムの障害自動復旧システム

Info

Publication number
JPH1173336A
JPH1173336A JP9249565A JP24956597A JPH1173336A JP H1173336 A JPH1173336 A JP H1173336A JP 9249565 A JP9249565 A JP 9249565A JP 24956597 A JP24956597 A JP 24956597A JP H1173336 A JPH1173336 A JP H1173336A
Authority
JP
Japan
Prior art keywords
failure
recovery
information
fault
recovery procedure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9249565A
Other languages
English (en)
Inventor
Junichi Nakamura
淳一 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP9249565A priority Critical patent/JPH1173336A/ja
Publication of JPH1173336A publication Critical patent/JPH1173336A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

(57)【要約】 【課題】計算機システムにおいて、利用者の経験に依存
せず、即時に、自動的に障害復旧を行う障害復旧方式の
提要。 【解決手段】障害発生時のエラーコードに対応する障害
詳細情報として障害内容説明情報及び障害復旧手順格納
先アドレス情報を備えた障害詳細情報記憶部を備え、障
害発生時には、障害詳細情報記憶部を参照してエラーコ
ードから障害復旧手順格納先を特定して通信接続し、前
記障害復旧手順格納先にはエラーコードに対応する障害
復旧手順情報が予め用意されており、前記障害復旧手順
格納先から取得した障害復旧手順情報を基に、障害復旧
処理を実行する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、計算機システムの
障害復旧システムに関し、特に自動復旧機能を有する障
害復旧システムに関する。
【0002】
【従来の技術】従来、計算機のオペレーティングシステ
ムと計算機上で動作する各アプリケーション・ソフトウ
ェアおいて、障害が発生した際の警告方法としては、エ
ラーコードや障害の結果を表す簡単なメッセージを表示
させる方法が一般的である。
【0003】そして、利用者は、障害の原因究明や解決
策を講じるために、利用者自身が表示されたメッセージ
を確認しながら、マニュアルを参照したり、各アプリケ
ーション開発元や、各ハードウェア開発元に復旧方法を
問い合わせるなどして、復旧処理を行っていた。
【0004】また、例えば特開平4−147348号公
報に記載されているように、デュプレクス構成の計算機
システムにおいては、業務処理計算機に対し、待機用計
算機を個別に用意して障害発生状況を常に監視し、障害
発生時には、利用者が予め作成して待機用計算機に格納
しておいた障害処理レコードにより復旧処理を行う構成
とされている。
【0005】
【発明が解決しようとする課題】しかしながら、従来の
障害復旧方式は下記記載の問題点を有している。
【0006】第1の問題点として、上記特開平4−14
7348号公報等に提案される障害復旧方式において
は、障害復旧の為に用意されている障害処理レコードに
より全ての障害を復旧することは困難である、というこ
とである。
【0007】その理由は、前記障害処理レコーダが、利
用者によって作成される為、利用者が予め発生を予測し
得る障害以外については、復旧処理を行うことができな
い、からである。
【0008】第2の問題点は、上記特開平4−1473
48号公報等に提案される障害復旧方式においては、シ
ステム全体、特にネットワークに対し、常に負荷がかか
ることになる、ということである。
【0009】その理由は、各業務処理計算機に対して待
機用計算機を個別に用意し、待機用計算機は常に業務処
理計算機の障害発生状況を監視する必要がある、ためで
ある。
【0010】第3の問題点は、従来の障害復旧方式にお
いては、障害発生時に表示されるメッセージを基に、利
用者が手動で復旧処理を行う場合、例えば利用者の不慣
れなどのため、障害の復旧に時間を要する、ということ
である。
【0011】その理由は、障害発生時に表示されるメッ
セージなどは予め各計算機上に格納する必要があるた
め、格納領域に制限があり、各障害の原因を取り除きシ
ステムを復旧させるのに充分な情報を格納させることは
困難であり、このため、障害の原因究明や解決策を講じ
るためには、利用者自身が表示されたメッセージを確認
しながらマニュアルを参照したり、各アプリケーション
開発元や、各ハードウェア開発元に復旧方法を問い合わ
せるなどして、復旧処理を行わなければならない、こと
による。
【0012】したがって本発明は、上記問題点に鑑みて
なされたものであって、その目的は、計算機上で発生す
る全ての障害に対し、利用者の経験に依存せず、即時
に、自動的に復旧処理を行う計算機システムの障害復旧
方式を提供することにある。
【0013】
【課題を解決するための手段】前記目的を達成するた
め、本発明は、計算機システムにおいて、障害発生時に
システムまたはアプリケーションから発行されるエラー
コードに対応する障害詳細情報として障害内容説明情報
及び障害復旧手順格納先アドレス情報を格納した障害詳
細情報記憶部と、障害発生時のエラーコードから前記障
害詳細情報記憶部を検索して障害復旧手順格納先を特定
して該障害復旧手順格納先に通信接続する手段と、を備
え、前記障害復旧手順格納先には、エラーコードに対応
する障害復旧手順情報を予め用意しておき、前記障害復
旧手順格納先は、前記計算機システムにおける前記障害
発生時の前記エラーコードを受けて該エラーコードに対
応する障害復旧手順情報を前記計算機システムに通知
し、前記計算機システムでは前記障害復旧手順格納先か
ら送信された障害復旧手順情報を基に、障害復旧処理を
実行する。
【0014】
【発明の実施の形態】本発明の実施の形態について以下
に説明する。本発明の計算機システムの障害復旧方式
は、その好ましい実施の形態において、計算機のオペレ
ーティングシステム(図1の2)が検出するエラーコー
ドと計算機上で動作する各アプリケーション・ソフトウ
ェア(図1の3)が検出するエラーコードと、そのエラ
ーコードに対する障害詳細情報(障害復旧手順格納先の
アドレス、障害の原因などに関する情報)を記憶した障
害詳細情報記憶部(図1の6)と、常時計算機の障害発
生状況を監視する障害監視手段(図1の4)と、この障
害監視手段から通知されたエラーコードを基に障害詳細
情報記憶部を参照し障害詳細情報を取得する復旧支援制
御手段(図1の5)と、復旧支援制御手段で取得した障
害詳細情報を表示する障害情報表示手段(図1の7)
と、障害詳細情報(障害復旧手順格納先のアドレス)を
基に復旧支援制御手段からの指示により、遠隔地の障害
復旧手順格納先との通信を行う通信制御手段(図1の9
−1、9−2)と、遠隔地の障害復旧手順格納先におい
て障害復旧手順情報を格納した障害復旧手順記憶部(図
1の11)と、障害復旧手順記憶部を参照し復旧支援制
御手段に対し通信制御手段を経由して復旧処理の指示を
行う復旧処理指示手段(図1の10)と、復旧支援制御
手段からの指示により復旧処理を行う復旧処理実行制御
手段(図1の8)と、を備えて構成されている。
【0015】本発明の実施の形態において、障害発生状
況は障害監視手段(図1の4)にて常に監視され検出さ
れる。このため、障害が発生した場合、即座に復旧処理
を開始することができる。また、計算機内で障害発生状
況の監視を行うため、監視のための待機用計算機を用意
する必要が無くなる。
【0016】そして、復旧支援制御手段(図1の5)の
指示により、障害情報表示部(図1の7)へは障害に関
する情報が表示される。このため、利用者は障害の発生
状況を自分の目で確認することができる。
【0017】また、障害詳細情報記憶部(図1の6)に
は、エラーコードに対応する障害詳細情報として、遠隔
地の障害復旧手順格納先のアドレスを格納しており、障
害復旧手段については計算機内には格納させていない。
このため、計算機の資源を節約することができる。
【0018】復旧支援制御手段(図1の5)の指示によ
り、障害詳細情報記憶部(図1の6)に格納されている
障害復旧手順格納先のアドレスを参照して、通信制御手
段(図1の9−1,9−2)にて遠隔地の障害復旧手順
格納先(図1の12)との間での通信を実現する。この
ため、障害が発生していない間は、外部と接続し通信を
行う必要が無い。
【0019】遠隔地の障害復旧手順格納先(図1の1
2)の障害復旧手順記憶部(図1の11)には、エラー
コードに対応する障害復旧手順情報が格納されており、
障害発生時に随時参照される。このため、各計算機上に
は障害復旧手順情報を格納しておく必要がない。
【0020】遠隔地の障害復旧手順格納先(図1の1
2)の復旧処理指示手段(図1の10)は、障害復旧手
順記憶部(図1の11)を参照し、障害復旧手順情報を
取得し、復旧支援制御手段(図1の5)に対して復旧作
業を指示する。
【0021】復旧支援制御手段(図1の5)では、遠隔
地の障害復旧手順格納先(図1の12)の復旧処理指示
部からの指示と障害復旧手順情報により、復旧処理実行
制御手段(図1の8)に対し、復旧処理の実行指示を行
う。復旧支援制御手段からの指示により、復旧処理実行
制御手段にて障害の復旧処理が実行される。このため、
利用者自身の介入無しに自動で障害を復旧することがで
きる。
【0022】
【実施例】次に、上記した本発明の実施の形態について
更に詳細に説明すべく、本発明の実施例について図面を
参照して詳細に説明する。
【0023】図1は、本発明の一実施例の構成を示す図
である。図1を参照すると、本発明の一実施例におい
て、オペレーティングシステム(OS)2と各アプリケ
ーション・ソフトウェア3が発行するエラーコードとそ
のエラーコードに対応する障害詳細情報を記憶した障害
詳細情報記憶部6と、常時計算機の障害発生状況を監視
する障害監視手段4と、障害監視手段に4よって検出さ
れたエラーコードを基に、障害詳細情報記憶部6を参照
して障害詳細情報を取得する復旧支援制御手段5と、復
旧支援制御手段5で取得した障害詳細情報を表示する障
害情報表示部7と、障害詳細情報(障害復旧手順格納先
のアドレス)を基に、復旧支援制御手段5からの指示に
より、遠隔地の障害復旧手順格納先12との通信を行う
通信制御手段9−1、9−2と、を備え、遠隔地の障害
復旧手順格納先12において、障害復旧手順情報を格納
した障害復旧手順記憶部11と、障害復旧手順記憶部1
1を参照し復旧支援制御手段5に対し復旧処理の指示を
行う復旧処理指示手段10と、通信制御手段9−1、9
−2を介し復旧処理指示手段10からの指示により復旧
処理を行う復旧処理実行制御手段8を備えて構成されて
いる。
【0024】図2は、本発明の一実施例における障害詳
細情報記憶部6の障害詳細情報レコードの内容を示す説
明図である。障害詳細情報レコードは、エラーコード2
0、障害詳細情報21からなり、障害詳細情報21は障
害内容説明情報22と復旧手順格納先アドレス情報23
からなる。
【0025】次に、本発明の一実施例の動作について、
図1及び図2を参照して詳細に説明する。
【0026】オペレーティングシステム2や各アプリケ
ーション・ソフトウェア3において障害が発生した場
合、エラーコードが検出される。障害の発生状況は、障
害監視手段4により、常に監視されている。検出された
エラーコードは、障害監視手段4より復旧支援制御手段
5へ渡される。
【0027】復旧支援制御手段5は、エラーコードを受
け取ると、エラーコードとそのエラーコードに対応する
障害詳細情報21を記憶した障害詳細情報記憶部6を参
照し障害詳細情報21を取得する。
【0028】復旧支援制御手段5は、障害詳細情報21
を取得すると、その中の障害内容説明情報22(図2参
照)を障害情報表示手段7へ引き渡す。また、復旧支援
制御手段5は、障害詳細情報21の中の、障害復旧手順
格納先アドレス情報23を通信制御手段9−1へ引き渡
す。
【0029】通信制御手段9−1は、障害復旧手順格納
先アドレス情報23により接続先を決定し、該当する遠
隔地の障害復旧手順格納先12内の通信制御手段9−2
との接続を行い、通信を確立する。
【0030】通信制御手段9−1、9−2間で通信が確
立すると、復旧支援制御手段5はエラーコードを復旧処
理指示手段10へ引き渡す。
【0031】復旧処理指示手段10は、取得したエラー
コードより、障害復旧手順記憶部11を参照し障害復旧
手順情報を取得する。障害復旧手順情報はオペレーティ
ングシステムの開発元や各アプリケーション・ソフトウ
ェアの開発元が予め用意するもので、好ましくは各エラ
ーコードに対応する障害復旧のための処理が実行形式に
て格納されている。
【0032】復旧処理指示手段10は、通信制御手段9
−1、9−2を介し、取得した障害復旧手順情報を復旧
支援制御手段5へ引き渡す。
【0033】復旧支援制御手段5は取得した障害復旧手
順情報を、順次、復旧処理実行制御手段8へ引き渡す。
【0034】復旧処理実行制御手段8は、順次取得した
障害復旧手順情報に従い、復旧処理を実行する。
【0035】このような構成としたことにより、本発明
の一実施例においては、計算機のオペレーティングシス
テムや計算機上で動作するアプリケーション・ソフトウ
ェアにおいて障害が発生した場合において、利用者の介
入を必要とせずに、自動的に即座に障害復旧を行うこと
が可能となる。
【0036】
【発明の効果】以上説明したように、本発明によれば下
記記載の効果を奏する。
【0037】本発明の第1の効果は、計算機上で発生す
るほぼ全ての障害に対して、復旧処理を行うことが可能
となる、ということである。
【0038】その理由は、本発明においては、計算機シ
ステムにおいて障害発生時に表示されるエラーメッセー
ジそれぞれに対し、復旧のための処理(障害復旧処理手
順情報)を、各開発元に用意させることで、確実な復旧
処理の実現を可能としている、からである。
【0039】本発明の第2の効果は、正常動作時には他
の計算機とその接続の必要が無くなり、これにより、シ
ステム全体、特にネットワークの負荷を低減するができ
る、ということである。
【0040】その理由は、本発明においては、障害監視
手段を各計算機内で実行させることにより、常に待機用
計算機による障害監視を行う必要が無くなるからであ
る。
【0041】本発明の第3の効果は、利用者の経験によ
らず、即時に復旧が可能となる、ということである。
【0042】その理由は、本発明においては、障害復旧
のための情報を遠隔地の障害復旧手順格納先に格納する
ことにより、情報の格納領域の制限を意識する必要が無
くなり、このため、システムを復旧するのに充分な情報
を用意することが可能となり、利用者の介入を必要とせ
ずに、自動的に復旧処理を完了することができる、ため
である。
【図面の簡単な説明】
【図1】本発明の一実施例のシステム構成を示すブロッ
ク図である。
【図2】本発明の一実施例における障害詳細情報レコー
ドの内容を示す説明図である。
【符号の説明】
1 障害監視機能 2 オペレーティングシステム(OS) 3 各アプリケーションソフトウェア 4 障害監視手段 5 復旧支援制御手段 6 障害詳細情報記憶部 7 障害情報表示手段 8 復旧処理実行制御手段 9−1,9−2 通信制御手段 10 復旧処理指示手段 11 障害復旧手順記憶部 12 遠隔地の障害復旧手順格納先 20 エラーコード 21 障害詳細情報 22 障害内容説明情報 23 障害復旧手順格納先アドレス情報

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】計算機システムにおいて、障害発生時にシ
    ステムまたはアプリケーションから発行されるエラーコ
    ードに対応する障害詳細情報として障害内容説明情報及
    び障害復旧手順格納先アドレス情報を格納した障害詳細
    情報記憶部と、 障害発生時のエラーコードから前記障害詳細情報記憶部
    を検索して障害復旧手順格納先を特定して該障害復旧手
    順格納先に通信接続する手段と、を備え、 前記障害復旧手順格納先には、エラーコードに対応する
    障害復旧手順情報を予め用意しておき、前記障害復旧手
    順格納先は、前記計算機システムにおける前記障害発生
    時の前記エラーコードを受けて該エラーコードに対応す
    る障害復旧手順情報を前記計算機システムに通知し、前
    記計算機システムでは前記障害復旧手順格納先から送信
    された障害復旧手順情報を基に、障害復旧処理を実行す
    る、ことを特徴とする計算機システムの障害自動復旧シ
    ステム。
  2. 【請求項2】計算機のオペレーティングシステムが検出
    したエラーコードと、前記計算機上で動作する各アプリ
    ケーション・ソフトウェアが検出したエラーコードと、
    そのエラーコードに対する、障害復旧手順格納先のアド
    レス、障害の原因などに関する情報からなる障害詳細情
    報を記憶した障害詳細情報記憶部と、 常時、前記計算機の障害発生状況を監視する障害監視手
    段と、 前記障害監視手段から通知されたエラーコードを基に、
    前記障害詳細情報記憶部を参照し障害詳細情報を取得す
    る復旧支援制御手段と、 前記復旧支援制御手段で取得した障害詳細情報を表示す
    る障害情報表示手段と、 障害詳細情報の障害復旧手順格納先のアドレスを基に、
    前記復旧支援制御手段からの指示により、遠隔地の障害
    復旧手順格納先との通信を行う通信制御手段と、 遠隔地の障害復旧手順格納先において障害復旧手順情報
    を格納した障害復旧手順記憶部と、 前記障害復旧手順記憶部を参照して前記復旧支援制御手
    段に対し前記通信制御手段を経由し復旧処理の指示を行
    う復旧処理指示手段と、 前記復旧処理指示手段からの指示により復旧処理を行う
    復旧処理実行制御手段と、 を備え、 障害が発生した場合に複数存在する各障害復旧手順格納
    先のうち該当する障害復旧手順格納先からの指示により
    自動的に、即時に、復旧を行うようにしたことを特徴と
    する、計算機システムの障害自動復旧システム。
JP9249565A 1997-08-29 1997-08-29 計算機システムの障害自動復旧システム Pending JPH1173336A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9249565A JPH1173336A (ja) 1997-08-29 1997-08-29 計算機システムの障害自動復旧システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9249565A JPH1173336A (ja) 1997-08-29 1997-08-29 計算機システムの障害自動復旧システム

Publications (1)

Publication Number Publication Date
JPH1173336A true JPH1173336A (ja) 1999-03-16

Family

ID=17194902

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9249565A Pending JPH1173336A (ja) 1997-08-29 1997-08-29 計算機システムの障害自動復旧システム

Country Status (1)

Country Link
JP (1) JPH1173336A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002169707A (ja) * 2000-11-30 2002-06-14 Nri & Ncc Co Ltd コンピュータ運用管理システム及び運用管理方法
US6633997B1 (en) 1999-06-22 2003-10-14 Nec Corporation System for automatically restoring trouble, method and storage medium
JP2005228323A (ja) * 2004-02-12 2005-08-25 Internatl Business Mach Corp <Ibm> テクノロジの利用に関する追跡ならびに請求書作成の方法およびシステム
JP2007287042A (ja) * 2006-04-19 2007-11-01 Oki Electric Ind Co Ltd システム障害監視装置および障害情報配信システム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6633997B1 (en) 1999-06-22 2003-10-14 Nec Corporation System for automatically restoring trouble, method and storage medium
JP2002169707A (ja) * 2000-11-30 2002-06-14 Nri & Ncc Co Ltd コンピュータ運用管理システム及び運用管理方法
JP2005228323A (ja) * 2004-02-12 2005-08-25 Internatl Business Mach Corp <Ibm> テクノロジの利用に関する追跡ならびに請求書作成の方法およびシステム
JP2007287042A (ja) * 2006-04-19 2007-11-01 Oki Electric Ind Co Ltd システム障害監視装置および障害情報配信システム

Similar Documents

Publication Publication Date Title
US5432715A (en) Computer system and monitoring method
US6567937B1 (en) Technique for remote state notification and software fault recovery
KR20040047209A (ko) 네트워크 상의 컴퓨터 시스템의 자동 복구 방법 및 이를구현하기 위한 컴퓨터 시스템의 자동 복구 시스템
JPH1173336A (ja) 計算機システムの障害自動復旧システム
JPH0983516A (ja) ネットワーク障害診断装置
JP3208885B2 (ja) 障害監視システム
JP3266904B2 (ja) 静的接続型ネットワークにおける監視システム
JP5029697B2 (ja) オペレーションシステムのサーバシステム
JPH10222324A (ja) ネットワークシステム
JP2000112847A (ja) クライアント・サーバシステム及びクライアント稼働監視方法
JP2003256399A (ja) ホットスタンバイシステム切り替え制御方式
JPH0291735A (ja) リモート障害保守管理システム
JP2000215074A (ja) システムの運用方式及び障害自動復旧方式
JPH1125062A (ja) 障害回復システム
JPH09160875A (ja) マルチエージェント相互バックアップ方式
JPH0955880A (ja) テレビスタジオマスターシステム
JP3099757B2 (ja) ネットワーク監視装置
JP2002222176A (ja) サーバ・ベースド・コンピューティングモデルにおけるアプリケーションサーバ計算機障害自動復旧装置及び方法
JP3317278B2 (ja) Fddi障害監視方法、fddi障害監視装置、プログラムを記録した記録媒体、ネットワークシステム
JPH10260870A (ja) システム起動/終了制御装置
JPH02310755A (ja) ヘルスチェック方式
JP2000099482A (ja) 問題管理システム
JP2889888B2 (ja) 通信処理装置
JPH07191920A (ja) コンピュータネットワーク
JPS62105243A (ja) システム障害の復旧装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20000808