JPH0250232A - 計算機システムのデータ保存方法 - Google Patents

計算機システムのデータ保存方法

Info

Publication number
JPH0250232A
JPH0250232A JP63200109A JP20010988A JPH0250232A JP H0250232 A JPH0250232 A JP H0250232A JP 63200109 A JP63200109 A JP 63200109A JP 20010988 A JP20010988 A JP 20010988A JP H0250232 A JPH0250232 A JP H0250232A
Authority
JP
Japan
Prior art keywords
time
data
main memory
startup
memory data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63200109A
Other languages
English (en)
Other versions
JPH0727484B2 (ja
Inventor
Shigenori Kaneko
茂則 金子
Tomoaki Nakamura
智明 中村
Hirokazu Kasashima
広和 笠嶋
Keijirou Hayashi
林 慶治郎
Koichiro Sakuraba
恒一郎 桜庭
Yasuo Sekine
康雄 関根
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Hitachi Information and Control Systems Inc
Original Assignee
Hitachi Ltd
Hitachi Process Computer Engineering Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd, Hitachi Process Computer Engineering Inc filed Critical Hitachi Ltd
Priority to JP63200109A priority Critical patent/JPH0727484B2/ja
Publication of JPH0250232A publication Critical patent/JPH0250232A/ja
Publication of JPH0727484B2 publication Critical patent/JPH0727484B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、計算機システムのデータ保存方法、特に計算
機システムのシステムダウン時の障害解析用データの収
集に好適なデータ保存方法に関する。
〔従来の技術] 従来のシステム異常が発生した場合の文献には、rUN
IX S”/STIIEM V  システムアト・ミニ
ストレージョン・リファレンス・マニュアル」(第2版
、リリース3.0.第303頁、AT&Tユニックスパ
シフィック株式会社発行)がある、この文献には、rs
ysdumpJのコマンドの表示がある。コマンド5y
sdu■pは、主記憶データをフロッピーディスクのよ
うな補助記憶へオペレータが退避するコマンドである。
この退避後、システム立上げを行う。
システム立上げの従来例を第7図に示す、システム異常
により、システムダウン1が発生すると、システムの立
上げ処理(再立上げ処理)2を開始する。この再立上げ
開始によって、先ず主記憶上に格納されている主記憶デ
ータをディスクへ自動収集(退避)する、ここで、主記
憶データとは。
システムダウン時のデータであるが、正確にはシステム
ダウンして再立上げ開始時の主記憶データのことである
。しかし、この区別は特に意味を持たない、システムダ
ウン時から再立上げ時まではデータの破壊が生ずること
はなく、またその間の時間幅も短時間であることが多い
ためでもあり。
実質的に同一データであるとみてよい。
ステップ4で、立上げ処理の推移をみて立上げ成功か否
かを判定する。立上げ成功であれば、先にステップ3で
退避したディスク上の主記憶データをM/T等ヘコビー
する。
立上げ失敗の判定(7)であれば、再びステップ2へ戻
る。そして再びシステム再立上げ開始を行い、次いでス
テップ3で主記憶上のエラー時のデータをディスクへ自
動収集する。以下、繰返すことになる。
〔発明が解決しようとする課題〕
第1の従来例は、オペレータが退避処理を指示するため
、誤動作した場合、主記憶データが破壊されることがあ
るとの問題点を持つ。
第2の従来例は、システムダウン時の立上げ、及び再立
上げ失敗時に、その時の主記憶データを自動的ビ退避す
ることができ、併せて自動立上げを可能にするとの長所
を持つ。
しかし、この第2の従来例では、立上げ失敗(4)が引
続いて起る場合、ステップ3で最新立上げ時の主記憶デ
ータを無条件にディスクへ移す処理を行う、ディスク上
には前回の立上げ時の主記憶データD1が格納されてい
たが、この主記憶データエリアに最新立上げ時の主記憶
データD2が上書きされてしまう、この結果、Dlの破
壊が生ずる。尚、データD1及びD2とも大きなデータ
量であり、且つディスク上の退避エリアも事前に固定し
ており、上書きは、さけられない。
前回立上げ時の主記憶データDiが破壊されて困る理由
は、前回立上げ時の主記憶データD1は前回のシステム
ダウン時の主記憶上のデータであり、ダウン解析に欠く
ことのできないデータであるのに対し、引き続いて起る
システムダウン(立上げ失敗)時の主記憶データD2は
、Dlと異なり、Dlを得てから短時間内で得られる主
記憶データであり、01に対してD2は信頼性が薄く、
ダウン解析用には信頼性の少ないデータと云えるからで
ある。
従って、D2よりはDlが重要であり、DlをD2で上
書きしてDlを破壊することは、ダウン解析の障害とな
る。また、Dlは、ダウン解析のみでなく、ダウン時ま
でに得た一定の信頼性を持つデータであり、復帰後のデ
ータ処理に利用可能なデータであり、破壊があっては困
る。
本発明の目的は、立上げを複数回繰返しても最初のシス
テムダウン時のデータを保存可能とじた計算機システム
のデータ保存方法を提供するものである。
〔課題を解決するための手段〕
本発明は、計算機システムダウン時に、そのダウン時(
又は、再立上げ時、但し、前述の如く実質的に同義)の
主記憶データの他に該再立上げ時の主記憶データ退避時
の時刻をもディスクに書込み1次のシステムダウン時又
は立上げ失敗時には。
該時刻をみて制限時間以内での発生であればその時の主
記憶データのディスクへの上書きを禁止して最初のシス
テムダウン時の主記憶データの破壊を防止し、時刻をみ
て制限時間以上での発生であれば、この最新のシステム
ダウン又は立上げ失敗時の主記憶データをディスクへ上
書きし、併せて該最新システムダウン又は立上げ失敗時
の時刻を前記時刻の上に上書きするようにした。
更に、本発明は、ディスク上に複数の退避個所を設けて
おき、各システムダウン又は立上げ失敗の回数だけ主記
憶データ及び発生時刻を回避させる。この回数は、退避
個所の個数に相当する。
〔作 用〕
本発明によれば、システムダウンに伴うデータ退避時の
時刻を格納させておくため、次のシステムダウン又は立
上げ失敗時にはその時刻をみて制限時間以上の経過の場
合のみ主記憶データの上書きができるようになる。従っ
て、制限時間内の再発生時には、前回時の主記憶データ
は破壊されることはない。
更に2本発明によれば、引き続く複数回のシステムダウ
ン又は立上げ失敗があっても、無条件に一定回数までは
そのまま主記憶データを退避させることができる。
〔実施例〕
第1図は本発明のデータ保存装置での処理の実施例であ
る。この第1図は第7図と対比するとよい。第7図に比
べ本実施例では、ステップ2Aをステップ2と3との間
に挿入し、ステップ3Aをステップ3と4との間に挿入
した。
先ず、システムダウン(1)すると、ステップ2で再立
上げ開始をする。この開始と共に、前回データ収集時刻
と現在時刻とを、ディスクをみて比較する。制限時間n
未満であれば、ステップ4に行く、制限時間n以上であ
れば、ステップ3へ進む、ここで、制限時間nとは、主
記憶データの破壊を許すか否かの基準時間である。
n時間以上経過していれば、ステップ3へ移り。
主記憶データをディスクへ収集(退避)する、退避完了
後、この退避時の時刻(収集時刻も同義)をステップ3
Aでディスクへ格納する。
次にステップ4で立上げ失敗か否かを判定し、成功であ
れば、ステップ5,6を経て終了する。
立上げ失敗であれば、ステップ2へ移る。
尚、システム再立上げ失敗(ステップ7)が発生する原
因には以下の理由がある0発生可能性の大なる順序で記
述すると以下となる。
(1)再立上げ時、ファイルシステムのチエツクを行い
、もし、異常を発見した場合は、ディスク上で修復する
。このとき、ディスク上の管理テーブルと主メモリ上の
管理テーブルの完全−敗北が不可のため、再立上げを行
うことになる。
(2)立上げ失敗ではないが、ユーザがもう一度立上げ
直してしまったときがある。
(3)前回稼動中の実行環境保存モードで立上げたが、
この実行環境自体が破壊されていて、O8がダウンする
場合がある(本来なら保存しないモードで立上げるべき
だが、操作を誤った場合)。
実行環境保存の例としては、システム共用データで前回
実行時の主メモリデータを破壊せずに使いたい場合、前
回と同じ論理アドレスに割り付け、他の使用を許さない
第2図は1本発明において補助記憶上にデータの退避エ
リアを1つだけ持つ場合の実施例のシステム構成を示し
た図である。
まず、第2図におけるように補助記憶102上に。
主記憶101上にある前回システム稼動時の主記憶デー
タ106を退避するエリア110を用意する。この退避
エリア110の中に、前回システム稼動時の主記憶デー
タ106の退避を禁止する退避禁止フラグ111と前記
主記憶データ106を退避エリア110へ退避した場合
の退避時刻112を記録するエリアを用意する。
システム立上げ時には、システム立上げプログラム10
3が主記憶101上に用意される。システムに電源投入
後初めてのシステム立上げを除いて、前回システム稼動
時の主記憶データ106は存在する。
このため、システム立上げプログラム103は、システ
ムに電源投入後初めてのシステム立上げでないとき、前
回システム稼動時の主記憶データ106を補助記憶10
2上に用意した退避エリア110へデータを転送してか
らオンラインシステムの立上げ処理を行うように作られ
ている。
システム立上げ時に、前記前回システム稼動時主記憶デ
ータ106を前記退避エリア110へ転送する処理の流
れを第3図に示した。以下、第2図、第3図を使用して
前記データ退避処理について詳しく説明する。
前記システム立上げプログラム103は、まず。
退避判定サブルーチン105ヘリンクする。このサブル
ーチン105は、前記補助記憶102から退避禁止フラ
グ111と前回の退避時刻112を読み込み(200)
、さらに現在時刻104を読み込む(201)、次にデ
ータの退避可能か否かを判定するためにまず退避禁止フ
ラグの判定を行う(202)、退避禁止フラグが無効で
あれば前記サブルーチン105は、データ退避可である
ことをリターン値として返す、退避禁止フラグが有効の
ときは、前回退避時刻と現在時刻とを比較しく203)
、あらかじめ決められた時間が経過していたときは、デ
ータ退避可であることをリターン値として返し、経過し
ていなかったときは、データ退避不可であることをリタ
ーン値として返す。
前記リターン値が、データ退避禁止であったときは、前
記システム立上げプログラム103は、すぐにオンライ
ン・システムの立上げ処理207を行う。逆に、前記リ
ターン値が、データ退避可であったときは、前記システ
ム立上げプログラム103は、データ退避時刻の設定(
204)と退避禁止フラグの設定(205)を前記補助
記憶102上に対して行い。
前回システム稼動時の主記憶データ106を前記補助記
憶102上のデータ退避エリア110へ退避してからオ
ンラインシステムの立上げ処理207を行う。
以上、第2図、第3図を用いてシステム立上げ時に、前
回システム稼動時の主記憶データを自動的に補助記憶上
へ退避する処理について説明して来たが、第4図を使っ
て実際に保守を行うときの手順との関係で、この退避処
理について説明する。
第4図の(a)に通常のシステム保守の手順を示した。
第2図で示したような計算機システムでシステム異常が
発生した場合、システムダウンの時間を短かくするため
、すぐに立上げ直すことが多いが、このときは、まずシ
ステム再立上げ(300)を行う。この処理の中で、上
記で説明したように第3図に示した手順で前回システム
稼動時の主記憶データ106を補助記憶102へ退避処
理を行うが。
このときには、補助記憶102上の退避禁止フラグ11
1は無効となっているので、データの退避が行われる。
このとき、退避禁止フラグ111が有効にされ、データ
退避時刻112が設定される。システムが立上がった後
に、補助記憶102上の退避データ110を磁気テープ
等にコピー(301) L/ 、工場等へ持ち返りシス
テム異常の原因を究明する。更に。
もしまたシステム異常が発生したときに備えて、データ
退避禁止フラグ111を第2図に示したリセット用プロ
グラム107を使って無効化しておく。
また、第4図(b)に示したように、システム異常が発
生した後にシステム再立上げ(303)を行ったときに
別な障害が発生(304) して、再度システムの再立
上げ(305)を行う必要が発生することがある。この
ような場合は、最初に発生したシステム異常のデータが
最も重要であるが、第3図に示した手順で立上げ処理が
行われるため、最初のシステム再立上げ(303)のと
きだけ、前回システム稼動中の主記憶データ106が補
助記憶102の退避エリア110へ退避され、その後の
システム再立上げ(305)時は、退避禁止フラグが有
効でかっ、前回の退避時刻112から一定時間経過して
いないので、前記データ退避は行われない。
以上のように、ユーザは、システム異常発生時も、メー
カーの保守員に連絡をとった後1通常のオペレーション
でシステムを立上げ゛直すだけで良く、システム異常時
の主記憶データ106は、補助記憶102の退避エリア
110に退避されているので、保守員が現地に到着後、
磁気テープ等に収集できる。この点において、前回デー
タ退避時刻112から、再度データ退避可とするまでの
時間は、保守員が現地に列名して−通りの作業を終了す
るのに十分な時間としておくと良い。
本実施例によれば、従来、ユーザのオペレーションに委
ねられていたシステム異常発生時の主記憶データをユー
ザのオペレーションに委ねることなく確実に収集するこ
とができる。この二とにより、ユーザは余分なオペレー
ションを行わずにすむのでオペレーションミスをほとん
どすることなく迅速にシステムを再立上げすることがで
き、システムの停止時間も短かくするという効果が得ら
れる。
次に、補助記憶上に複数の退避エリアを用意した場合の
1実施例を第5図、第6図を使って詳しく説明する。
第5図におけるように、補助記憶102上に、退避エリ
アA401.退避エリアB4O2,退避エリアC403
を用意し、各々の退避エリアにデータ退避時刻404.
405.406を持たせる。
前記実施例と同様に、システムに電源投入後、初めての
システム立上げでないときについての処理について説明
する。
システム立上げを開始すると、主記憶101上にシステ
ム立上げプログラム103が用意される。前記システム
立上げプログラム103はまず、データ退避エリア選択
サブルーチン400ヘリンクする。
前記サブルーチンは、まず、補助記憶102上の退避エ
リアA401.退避エリアB4O2,退避エリアC40
3の各々から、データ退避時刻404.405.406
を読み込む(SOO)。次に、前記で読み込んだ退避時
刻の新旧を比較し、一番古いものを選び出し、それに対
応する退避エリアを選択する(501)。どのエリアが
選択されたかは前記サブルーチン400のリターン値と
して返る。この前ステップで選択された退避エリアをリ
ターン値として受は取った前記システム立上げプログラ
ム103は、前記選択された退避エリアへデータ退避時
刻を・設定する(502)、さらに、前記退避エリアへ
前記主記憶101上の前回システム稼動時の主記憶デー
タ106を退避する(503)。これらの処理終了後、
前記システム立上げプログラム103は、オンラインシ
ステムの立上げ処理を行う。
本実施例によれば、前実施例と同じように、従来、ユー
ザオペレーションに委ねられていたシステム異常発生時
の主記憶データをユーザのオペレーションに委ねること
なく確実に収集することができる6本実施例では、デー
タ退避エリアを複数設けたことにより、第4図(b)の
ように−度異常が発生した後、続けて異常が発生した場
合でも、二度目の異常データを退避しておくことができ
る。
さらに、本実施例では、3個の退避エリアを設けたため
、4回連続してシステム異常が発生した場合、一番古い
データが上書きされてしまうが、前記実施例と組み合わ
せれば、最初に発生したシステム異常から3回分のデー
タを退避しておくことができる。
本実施例においても、システム異常が発生した場合は、
ユーザは、保守員に連絡した後システムを再立上げする
だけでよく、システム異常発生時の主記憶データは、補
助記憶に退避されているので、保守員が現地へ到着後、
磁気テープ等に収集できる。このため、前記実施例と同
様に効果が得られる。
各実施例では、退避時刻以外に、ダウン時(異常発生時
)の時刻をも保存させておくとよい。この場合、異常発
生時の時刻は、主記憶データの一部として扱ってよい。
〔発明の効果〕
以上述べたように、本発明によれば、計算機システムに
おいて、システム異常が発生したとき、システム異常発
生時の主記憶データをシステムを再立上げするだけで補
助記憶に退避することができ、何度立上げ直しても、最
初の異常時の主記憶データを保存することができる。
このことにより、システムダウンの時間を短かくするこ
とができ、システム異常時の主記憶データを確実に保存
することができるためシステム保守性が向上する。
【図面の簡単な説明】
第1図は本発明の保存装置の処理の実施例図。 第2図は本発明の1実施例のシステム構成図、第3図は
第1図の実施例の処理を示すフローチャート図、第4図
はシステム異常発生時の保守方法を示すフローチャート
図、第5図は本発明の1実施例のシステム構成図、第6
図は第5図の実施例の処理を示すフローチャート図、第
7図は従来の処理フロー図である。 101・・・主記憶、102・・・補助記憶、103・
・・システム立上げプログラム、104・・・現在時刻
を記憶しているエリア、105・・・補助記憶上の前回
システム稼動時データの退避禁止フラグと退避時刻を読
み込み、現在時刻と比較するプログラム、106・・・
前回システム稼動時のデータ、+07・・・システムが
立上がった後、補助記憶上の退避禁止フラグをリセット
するプログラム、108・・・主記憶と補助記憶との間
のデータ転送路、110,401,402,403・・
・補助記憶上の前回システム稼動時の主記憶データの退
避エリア、Ut・・・データ退避禁止フラグ、112・
・・データ退避時刻、400・・・補助記憶上のデータ
退避時刻を読み込み比較判定するプログラム、404,
405,406・・・データの退避時刻を示す。

Claims (1)

  1. 【特許請求の範囲】 1、システムダウン時又は立上げ失敗時に計算機システ
    ムの再立上げを開始し、前回のデータ退避時刻と今回の
    退避時刻とを比較し、制限時間以上経過していれば主記
    憶データを補助記憶へ自動退避させ且つ該退避時刻を上
    記前回の退避時刻に代って記憶させ、制限時間以下の経
    過であれば又は経過後であっても上記退避時刻の記憶後
    にシステムの立上げが失敗か否か判定し、立上げ失敗の
    際には前記再立上げの開始条件たる立上げ失敗時として
    設定させ、立上げ成功の際には補助記憶内の主記憶デー
    タをシステムダウン又は立上げ失敗時のデータとして読
    出してなる計算機システムのデータ保存方法。 2、上記補助記憶上の主記憶データ及び収集時刻の退避
    エリアは、複数個とし、システムダウン回数及び立上げ
    失敗の回数に合せて該エリアを配分してなる請求項1記
    載の計算機システムのデータ保存方法。 3、上記補助記憶上に退避するものは、主記憶データ、
    退避時刻の他に退避禁止フラグとしてなる請求項1又は
    2記載の計算機システムのデータ保存方法。
JP63200109A 1988-08-12 1988-08-12 計算機システムのデータ保存方法 Expired - Lifetime JPH0727484B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63200109A JPH0727484B2 (ja) 1988-08-12 1988-08-12 計算機システムのデータ保存方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63200109A JPH0727484B2 (ja) 1988-08-12 1988-08-12 計算機システムのデータ保存方法

Publications (2)

Publication Number Publication Date
JPH0250232A true JPH0250232A (ja) 1990-02-20
JPH0727484B2 JPH0727484B2 (ja) 1995-03-29

Family

ID=16418978

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63200109A Expired - Lifetime JPH0727484B2 (ja) 1988-08-12 1988-08-12 計算機システムのデータ保存方法

Country Status (1)

Country Link
JP (1) JPH0727484B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH047650A (ja) * 1990-04-25 1992-01-13 Hitachi Ltd 障害情報ログ方法及びデータ処理装置
JPH08292904A (ja) * 1995-04-20 1996-11-05 Hokkaido Nippon Denki Software Kk ダンプ採取制御方式

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH047650A (ja) * 1990-04-25 1992-01-13 Hitachi Ltd 障害情報ログ方法及びデータ処理装置
JPH08292904A (ja) * 1995-04-20 1996-11-05 Hokkaido Nippon Denki Software Kk ダンプ採取制御方式

Also Published As

Publication number Publication date
JPH0727484B2 (ja) 1995-03-29

Similar Documents

Publication Publication Date Title
US5065311A (en) Distributed data base system of composite subsystem type, and method fault recovery for the system
JPH07281934A (ja) システムファイルの更新及び復元方法
JP5183542B2 (ja) 計算機システム及び設定管理方法
JP3481737B2 (ja) ダンプ採取装置およびダンプ採取方法
US7305578B2 (en) Failover method in a clustered computer system
US5421003A (en) Disk storage system with fault tolerant media maintenance
JP3030658B2 (ja) 電源故障対策を備えたコンピュータシステム及びその動作方法
JPH0250232A (ja) 計算機システムのデータ保存方法
JP2006065440A (ja) プロセス管理システム
US7058666B1 (en) Automatic database monitoring system
JP2011053780A (ja) 復旧システム、復旧方法及びバックアップ制御システム
JP2513060B2 (ja) 故障回復型計算機
JPH04369735A (ja) 計算機システムのバックアップ方式
JPH03105434A (ja) エラーロギングシステム
JP3263987B2 (ja) 自動iplの初期設定処理方法
JPH04141751A (ja) 大容量記憶媒体障害復旧方式
JPH04330531A (ja) チェックポイント処理方式
JPH10161815A (ja) ディスク二重化管理装置およびディスク二重化管理方法
JPS6125250A (ja) 情報処理装置の障害回復方法
JP2001184224A (ja) 計算機システムおよび同システムにおけるi/o装置の制御方法
JPH04160646A (ja) システム制御方法
JPS6326412B2 (ja)
JPH0652053A (ja) 故障回復型計算機システム
JPH01196646A (ja) メモリバックアップ方式
JPS6325745A (ja) システム障害情報出力方式

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090329

Year of fee payment: 14

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090329

Year of fee payment: 14