JPH05314075A - オンラインコンピュータ装置 - Google Patents

オンラインコンピュータ装置

Info

Publication number
JPH05314075A
JPH05314075A JP4114911A JP11491192A JPH05314075A JP H05314075 A JPH05314075 A JP H05314075A JP 4114911 A JP4114911 A JP 4114911A JP 11491192 A JP11491192 A JP 11491192A JP H05314075 A JPH05314075 A JP H05314075A
Authority
JP
Japan
Prior art keywords
computer
terminal computer
terminal
alternative
fault
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4114911A
Other languages
English (en)
Inventor
Tadayoshi Nakano
忠良 中野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP4114911A priority Critical patent/JPH05314075A/ja
Publication of JPH05314075A publication Critical patent/JPH05314075A/ja
Priority to US08/433,827 priority patent/US5533191A/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/2028Failover techniques eliminating a faulty processor or activating a spare
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/26Functional testing
    • G06F11/273Tester hardware, i.e. output processing circuits
    • G06F11/2736Tester hardware, i.e. output processing circuits using a dedicated service processor for test
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/2025Failover techniques using centralised failover control functionality

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Hardware Redundancy (AREA)
  • Multi Processors (AREA)

Abstract

(57)【要約】 【目的】 現用、予備の2系統を要するオンラインシス
テムのコンピュータ装置において、現用コンピュータ運
転中に休止状態となる予備コンピュータのジョブ資源を
省く。 【構成】 予備コンピュータは設けず、現用コンピュー
タ相互で障害発生時にバックアップを行い合う。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はオンラインシステムな
ど、バックアップ用計算機を準備して障害発生時に対処
を要する計算機システムに利用する。特に、バックアッ
プ用計算機の有効利用技術に関する。
【0002】
【従来の技術】オンラインシステムの円滑な運営を行う
上では、オンラインシステムの障害発生時に、いかに迅
速に障害となったオンラインシステムの業務を再開させ
るかが重要である。
【0003】これまでは、オンラインシステムの障害発
生時の代替用のオンラインシステムをあらかじめ別のホ
ストコンピュータにて立ち上げておき、障害発生時に代
替用のシステムに切替えて運用を継続していた。
【0004】ただし、代替用のオンラインシステムは、
本来のオンラインシステムの障害発生前は処理を行え
ず、障害発生での切替え完了後に処理が可能となる。す
なわち、あくまでも本来のオンラインシステムのバック
アップのためだけにシステムに常駐しているに過ぎな
い。
【0005】
【発明が解決しようとする課題】このようなやり方で
は、バックアップ専用にさらに一系統余分なオンライン
システムが必要であり、一つの業務に対して通常は休止
している倍のジョブ資源を用意しなければならない。
【0006】本発明はこのような背景に行われたもので
あり、複数系統の計算機システムをそれぞれ有効に活用
しながら、障害発生時にはお互いをバックアップし、さ
らに通常時においても計画的に連係し、業務運用形態の
変更を可能にする計算機バックアップ装置の提供を目的
とする。
【0007】
【課題を解決するための手段】本発明は、1台のホスト
コンピュータと、このホストコンピュータに接続される
複数の端末コンピュータとを備えたオンラインコンピュ
ータ装置において、前記ホストコンピュータは、前記複
数の端末コンピュータの動作状態を検出する手段と、こ
の検出する手段の障害出力に対応して前記端末コンピュ
ータの一つに対して、2以上の業務を並列処理させる手
段とを含み、前記端末コンピュータには、他の端末コン
ピュータのハードウェアリソースデータおよびソフトウ
ェア環境定義データがあらかじめ蓄積され、前記並列処
理させる手段の制御により他の端末コンピュータで処理
すべき業務を自端末コンピュータで処理すべき業務と並
列的に代替処理する手段を含むことを特徴とする。ま
た、前記並列処理させる手段は、計画切替操作のために
操作卓からの入力手段を備えることが望ましい。
【0008】
【作用】ホットスタンバイ制御部では、端末コンピュー
タ障害発生時に代替処理を同一ホストコンピュータ内の
任意の端末コンピュータで実行させるために、端末コン
ピュータとその代替用の端末コンピュータとの対応関係
を代替システム設定回路により設定する。さらに、端末
コンピュータの障害発生を運転状態監視回路が検出し、
障害が発生した旨を障害通知回路が事前設定されている
代替用の端末コンピュータに通知する。また、さらに障
害となった端末コンピュータの復旧後は切戻回路が、操
作卓から入力されるオペレータコマンドにより業務運用
を障害発生前の端末コンピュータに切り戻す。また、端
末コンピュータ運転中にも計画切替回路が、操作卓から
入力されるオペレータコマンドにより業務運用を任意の
端末コンピュータに切り替え運用させることができる。
【0009】端末コンピュータでは、障害発生元の業務
運用を引き継ぐために必要となるハードウェアリソース
を規定したハードウェアリソースデータと端末コンピュ
ータのソフトウェア動作環境を規定したソフトウェア環
境定義データをリソース設定回路により設定する。代替
運用継続回路は端末コンピュータの障害通知を受け取
り、リソース設定回路によりバッファに事前設定されて
いる障害元のハードウェアリソースとソフトウェア動作
環境を引き継ぎ、障害元の業務を該端末コンピュータで
代行運用する。
【0010】
【実施例】図1および図2を参照して本発明実施例の構
成を説明する。図1は本発明実施例の全体構成図であ
る。図2は本発明実施例装置の要部ブロック図である。
【0011】本発明は、1台のホストコンピュータ20
と、このホストコンピュータ20に接続される2台の端
末コンピュータ30および31とを備えたオンラインコ
ンピュータ装置40において、ホストコンピュータ20
は、2台の端末コンピュータ30および31の動作状態
を検出する手段としてのジョブ状態テーブル12と、こ
の検出する手段であるジョブ状態テーブル12の障害出
力に対応して端末コンピュータ30および31の一つに
対して、2以上の業務を並列処理させる手段としてのホ
ットスタンバイ制御部11とを含み、端末コンピュータ
30および31には、自分以外の端末コンピュータ30
または31のハードウェアリソースデータおよびソフト
ウェア環境定義データがあらかじめバッファ3および
3′に蓄積され、並列処理させる手段であるホットスタ
ンバイ制御部11の制御により他の端末コンピュータ3
0または31で処理すべき業務を自端末コンピュータ3
0または31で処理すべき業務と並列的に代替処理する
手段としての代替運用継続回路2および2′を含むこと
を特徴とする。また、並列処理させる手段であるホット
スタンバイ制御部11は、操作卓13からの入力手段で
ある切戻回路9および計画切替回路10を備える。
【0012】本発明実施例装置のホストコンピュータ2
0は、業務運用系の端末コンピュータ30および31に
接続され、ホットスタンバイ制御部11と、OSが保有
しジョブの運転状態の情報が格納されたジョブ状態テー
ブル12と、オペレータのコマンド操作用の操作卓13
とから構成されている。ホットスタンバイ制御部11に
は、代替システム設定回路6と、運転状態監視回路7
と、障害通知回路8と、切戻回路9と、計画切替回路1
0とが設けられている。
【0013】また、端末コンピュータ30および31に
は、リソース設定回路1および1′と、代替運用設定回
路2および2′と、リソース情報が格納されるバッファ
3および3′とが設けられている。
【0014】次に、図1〜図5を参照して、本発明実施
例装置の動作を説明する。図3は、ハードウェアリソー
スデータ状態を示す図である。図4は代替システム設定
情報を示す図である。図5は本発明実施例装置の障害発
生時の動作を示すフローチャートである。本発明実施例
では端末コンピュータ30および31は2系統としてい
る。
【0015】2台の端末コンピュータ30および31を
立ち上げる際に、リソース設定回路1および1′におい
て、上位情報としてホスト内の2台の端末コンピュータ
30および31のハードウェアリソースを規定したハー
ドウェアリソースデータと端末コンピュータ30および
31を動作させるために必要なソフトウェア動作環境を
規定したソフトウェア環境定義データとが入力され、各
端末コンピュータ30および31のバッファ3および
3′に設定される。ソフトウェア環境定義データとして
は、端末コンピュータ30および31の動作モード、業
務名、メモリ資源の利用量等プログラムを実行する上で
必要とされるソフトウェア資源および環境とから構成さ
れている。
【0016】図3に示すように、バッファ3および3′
に格納されるハードウェアリソースデータとしては、端
末コンピュータ30および31を運用する上で必要とな
るデータベース情報と、ジャーナル情報が格納される外
部記憶装置の格納装置名およびファイル名の情報、また
端末コンピュータ30および31を利用する端末情報、
代替運用継続の際に使用する障害発生前までの業務運用
情報を格納したログファイルの格納装置名およびファイ
ル名、また各々のハードウェアリソースデータがどの端
末コンピュータ30および31に対応するかを規定した
端末コンピュータ30の識別データ等の運転ログ情報で
構成されている。
【0017】ホットスタンバイ制御部11を立ち上げる
際には、代替システム設定回路6において、端末コンピ
ュータ30と、端末コンピュータ31とをそれぞれ相互
に障害発生時の代替システムとして割当て設定してお
く。割り当て情報は、図4に示すように業務名、実行オ
ンライントランザクションシステム名、代替オンライン
トランザクションシステム名とから構成され、バッファ
3および3′に格納される。
【0018】ここで、2つの端末コンピュータ30およ
び31は通常運転時、各々独自の業務トランザクション
処理を実行している。これら端末コンピュータ30およ
び31の運転状態は、ジョブ状態テーブル12に常時設
定され、状態として「実行中」、「正常終了」、「異常
終了」などの状態を保持している。
【0019】次に、図5を参照して障害発生時の動作を
説明する。端末コンピュータ30に障害が発生すると
(S1)、ジョブ状態テーブル12上の端末コンピュー
タ30の運転状態が「異常終了」に遷移する。ホットス
タンバイ制御部11は、運転状態監視回路7において、
適時端末コンピュータ30および31の運転状態を監視
しており、端末コンピュータ30および31の異常を検
出する(S2)。代替システム設定回路6において設定
されたデータを基に、障害通知回路8において、端末コ
ンピュータ30の代替システムが端末コンピュータ31
であると判定し(S3)、端末コンピュータ31に対し
て、端末コンピュータ30の業務代替運用開始指示を発
行する。代替運用開始指示は端末コンピュータ31への
コマンド指示で実行され、コマンドには障害発生オンラ
イントランザクションシステム名が付加される。また、
この際にバッファ3および3′内に設定されていた代替
システム設定情報を代替運用継続回路2および2′は図
4に示すように、業務G1の実行端末コンピュータ30
のシステム名をTR2に、代替端末コンピュータ31の
システム名をTR1に変更しておく。端末コンピュータ
31の代替運用継続回路2′はホットスタンバイ制御部
11からの代替運用開始指示を受け取ると、障害発生端
末コンピュータ30のシステム名を認識し、リソース設
定回路1′により設定された端末コンピュータ30のハ
ードウェアリソースデータとソフトウェア動作環境定義
をバッファ3′より所得し、端末コンピュータ30の代
替運用を開始する(S4)。以降、端末コンピュータ3
1は、自系分のトランザクション処理と端末コンピュー
タ30で処理されていたトランザクション処理の両方を
実行することになる。以上の処理により、障害発生時の
ための専用代替えシステムを用意せずとも、他の業務処
理実行中の端末コンピュータ31に障害となったトラン
ザクション処理の継続運用を可能とさせる。また、障害
が発生した端末コンピュータ30が復旧した場合(S
5)、オペレータによる制御卓13からの業務G1の端
末コンピュータ30への切り戻し要求をホットスタンバ
イ制御部11内の切戻回路9が受け付けると、障害通知
回路8にて、端末コンピュータ30へ業務G1の端末コ
ンピュータ31からの代替運用開始指示を発行するとと
もに、端末コンピュータ31に業務G1の停止コマンド
を発行する(S6)。業務停止コマンドはオンライント
ランザクションシステムの一般的な提供コマンドである
ため、ここでは特に詳細説明を省く。端末コンピュータ
30は、業務G1の運用を再開する(S7)。以上の処
理にて、障害発生後の端末コンピュータ30の復旧を待
った上での切り戻し運用が実現される。
【0020】また、端末コンピュータ30および31の
運転中に、制御卓13からのオペレータによる業務名G
1の端末コンピュータ30から端末コンピュータ31へ
計画切替要求を発行することもできる。ホットスタンバ
イ制御部11内の計画切替回路10は要求を受け付ける
と、障害通知回路8において端末コンピュータ31へ業
務G1の代替運用開始指示を発行するとともに端末コン
ピュータ30に業務G1の停止コマンドを発行する。こ
こでの停止コマンドも端末コンピュータ30および31
の一般的な提供コマンドであるため、詳細説明を省く。
端末コンピュータ31は、障害発生と同様の手順で、業
務G1の運用を開始する。以上のように端末コンピュー
タ30が障害まで至らないが、処理の遅延が顕著化して
きた場合、もしくは端末コンピュータ30および31内
の業務再編成を動的に実施したい場合等のために、この
計画切替回路10が有効となる。
【0021】本発明実施例は、2台の端末コンピュータ
30および31を接続した場合を説明したが、接続され
る端末コンピュータ数はさらに増やした構成とすること
もできる。
【0022】
【発明の効果】以上説明したように、本発明を用いれば
複数系統の計算機システムをそれぞれ有効に活用しなが
ら、障害発生時にはお互いをバックアップし、さらに通
常時においても計画的に連係し、業務運用形態の変更を
可能にする。
【図面の簡単な説明】
【図1】本発明実施例の全体構成図。
【図2】本発明実施例装置の要部ブロック図。
【図3】ハードウェアリソースデータ状態を示す図。
【図4】代替システム設定情報を示す図。
【図5】本発明実施例装置の障害発生時の動作を示すフ
ローチャート。
【符号の説明】
1、1′ リソース設定回路 2、2′ 代替運用継続回路 3、3′ バッファ 6 代替システム設定回路 7 運転状態監視回路 8 障害通知回路 9 切戻回路 10 計画切替回路 11 ホットスタンバイ制御部 12 ジョブ状態テーブル 13 操作卓 20 ホストコンピュータ 30、31端末コンピュータ 40 オンラインコンピュータ装置

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 1台のホストコンピュータと、このホス
    トコンピュータに接続される複数の端末コンピュータと
    を備えたオンラインコンピュータ装置において、 前記ホストコンピュータは、 前記複数の端末コンピュータの動作状態を検出する手段
    と、この検出する手段の障害出力に対応して前記端末コ
    ンピュータの一つに対して、2以上の業務を並列処理さ
    せる手段とを含み、 前記端末コンピュータには、 他の端末コンピュータのハードウェアリソースデータお
    よびソフトウェア環境定義データがあらかじめ蓄積さ
    れ、 前記並列処理させる手段の制御により他の端末コンピュ
    ータで処理すべき業務を自端末コンピュータで処理すべ
    き業務と並列的に代替処理する手段を含むことを特徴と
    するオンラインコンピュータ装置。
  2. 【請求項2】 前記並列処理させる手段は、操作卓から
    の入力手段を備えた請求項1記載のオンラインコンピュ
    ータ装置。
JP4114911A 1992-05-07 1992-05-07 オンラインコンピュータ装置 Pending JPH05314075A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP4114911A JPH05314075A (ja) 1992-05-07 1992-05-07 オンラインコンピュータ装置
US08/433,827 US5533191A (en) 1992-05-07 1995-05-04 Computer system comprising a plurality of terminal computers capable of backing up one another on occurrence of a fault

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4114911A JPH05314075A (ja) 1992-05-07 1992-05-07 オンラインコンピュータ装置

Publications (1)

Publication Number Publication Date
JPH05314075A true JPH05314075A (ja) 1993-11-26

Family

ID=14649719

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4114911A Pending JPH05314075A (ja) 1992-05-07 1992-05-07 オンラインコンピュータ装置

Country Status (2)

Country Link
US (1) US5533191A (ja)
JP (1) JPH05314075A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013134712A (ja) * 2011-12-27 2013-07-08 Bank Of Tokyo-Mitsubishi Ufj Ltd 情報処理装置

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5812748A (en) * 1993-06-23 1998-09-22 Vinca Corporation Method for improving recovery performance from hardware and software errors in a fault-tolerant computer system
US5978565A (en) 1993-07-20 1999-11-02 Vinca Corporation Method for rapid recovery from a network file server failure including method for operating co-standby servers
US5918227A (en) * 1996-05-06 1999-06-29 Switchboard, Inc. On-line directory service with a plurality of databases and processors
JPH1011369A (ja) * 1996-06-27 1998-01-16 Hitachi Ltd 通信システムおよびホットスタンバイ切替機能を備える情報処理装置
US7389312B2 (en) 1997-04-28 2008-06-17 Emc Corporation Mirroring network data to establish virtual storage area network
US6389551B1 (en) 1998-12-17 2002-05-14 Steeleye Technology, Inc. Method of preventing false or unnecessary failovers in a high availability cluster by using a quorum service

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3229260A (en) * 1962-03-02 1966-01-11 Ibm Multiprocessing computer system
US4228496A (en) * 1976-09-07 1980-10-14 Tandem Computers Incorporated Multiprocessor system
US4412281A (en) * 1980-07-11 1983-10-25 Raytheon Company Distributed signal processing system
US4870704A (en) * 1984-10-31 1989-09-26 Flexible Computer Corporation Multicomputer digital processing system
EP0228559A1 (de) * 1985-12-17 1987-07-15 BBC Brown Boveri AG Fehlertolerante Mehrrechneranordnung
FR2602891B1 (fr) * 1986-08-18 1990-12-07 Nec Corp Systeme de correction d'erreur d'un systeme a multiprocesseurs pour corriger une erreur dans un processeur en mettant le processeur en condition de controle apres achevement du redemarrage du microprogramme a partir d'un point de reprise
US4847837A (en) * 1986-11-07 1989-07-11 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Local area network with fault-checking, priorities and redundant backup
US4939752A (en) * 1989-05-31 1990-07-03 At&T Company Distributed timing recovery for a distributed communication system
US5307481A (en) * 1990-02-28 1994-04-26 Hitachi, Ltd. Highly reliable online system
US5271013A (en) * 1990-05-09 1993-12-14 Unisys Corporation Fault tolerant computer system
US5214652A (en) * 1991-03-26 1993-05-25 International Business Machines Corporation Alternate processor continuation of task of failed processor
US5247664A (en) * 1991-03-28 1993-09-21 Amoco Corporation Fault-tolerant distributed database system and method for the management of correctable subtransaction faults by the global transaction source node
US5408649A (en) * 1993-04-30 1995-04-18 Quotron Systems, Inc. Distributed data access system including a plurality of database access processors with one-for-N redundancy

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013134712A (ja) * 2011-12-27 2013-07-08 Bank Of Tokyo-Mitsubishi Ufj Ltd 情報処理装置
US9081723B2 (en) 2011-12-27 2015-07-14 The Bank Of Tokyo—Mitsubishi Ufj. Ltd. Data processing device

Also Published As

Publication number Publication date
US5533191A (en) 1996-07-02

Similar Documents

Publication Publication Date Title
JPS6375963A (ja) システム回復方式
JP5285045B2 (ja) 仮想環境における故障復旧方法及びサーバ及びプログラム
JPH05314075A (ja) オンラインコンピュータ装置
WO2024022469A1 (zh) 磁盘阵列冗余方法、***、计算机设备和存储介质
US7437445B1 (en) System and methods for host naming in a managed information environment
JPH07160370A (ja) 停電管理装置
JPH10116261A (ja) 並列計算機システムのチェックポイントリスタート方法
JP2004046658A (ja) データ転送方法
JPH0683657A (ja) サービスプロセッサの切り換え方式
JPH0879246A (ja) 分散型通信システムおよびその障害回復方法
JP2001014290A (ja) マルチプロセッサシステム
JP5359234B2 (ja) ジョブ実行システム、及びジョブフロー引継ぎ制御プログラム
JPH10326201A (ja) 分散バッチジョブ処理システムおよびその障害時におけるジョブの自動再起動方法
JPH0764930A (ja) Cpu間相互監視方法
JPH09288590A (ja) 仮想計算機システム
JP2704137B2 (ja) 現用・予備切り換え方式
JPH09297692A (ja) 多重化システム
JPS59206973A (ja) ジョブのバックアップ方法
JPS62190543A (ja) 通信系障害高速立ち上げ制御方式
JP2016224490A (ja) 冗長化システム
JP2795246B2 (ja) メモリ二重化システムにおける割り込み処理時の障害リカバリ装置
JPH0277943A (ja) システムリカバリ方法
JP2699291B2 (ja) 電源異常処理装置
JP2000047893A (ja) 複数オンラインシステムにおける障害回復方法およびオンライン処理システム
JPH02196341A (ja) 情報処理装置の障害復旧方式