JPS61183769A - System recovery controlling system - Google Patents

System recovery controlling system

Info

Publication number
JPS61183769A
JPS61183769A JP60023014A JP2301485A JPS61183769A JP S61183769 A JPS61183769 A JP S61183769A JP 60023014 A JP60023014 A JP 60023014A JP 2301485 A JP2301485 A JP 2301485A JP S61183769 A JPS61183769 A JP S61183769A
Authority
JP
Japan
Prior art keywords
state
processing
master
slave
ipl
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP60023014A
Other languages
Japanese (ja)
Other versions
JPH0350304B2 (en
Inventor
Akio Komiya
小宮 昭夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP60023014A priority Critical patent/JPS61183769A/en
Publication of JPS61183769A publication Critical patent/JPS61183769A/en
Publication of JPH0350304B2 publication Critical patent/JPH0350304B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)
  • Multi Processors (AREA)

Abstract

PURPOSE:To eliminate an incorrrect recovery processing caused by a misoperation of an operator by executing a control of the time of recovery by referring to a ready state of the other system and a display of the previous master/slave state. CONSTITUTION:An A system 1a and a B system 1b have the same constitution, and are provided with processors 2a, 2b, main storage devices 3a, 3b, and auxiliary storage devices 4a, 4b. When starting an operation of the system, when an IPL is designated from each system console 8a, 8b, an IPL processing is executed. The system whose IPL processing has been started decides automatically whether the own system is used as a master or not, by referring to a ready state of the other system, and a display of the previous master/slave state which has been stored in a check point file, etc.

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、二重化された情報処理システムの、障害によ
りダウンしたシステムを、初期プログラムロードを行っ
て、稼動状態に回復する場合の、システム回復制御方式
に関する。
[Detailed Description of the Invention] [Industrial Application Field] The present invention relates to system recovery when a duplexed information processing system that has gone down due to a failure is restored to an operating state by performing an initial program load. Regarding control method.

二重化情報処理システムの一方式において、両システム
が正常に稼動する状況では、一方をマスク、他方をスレ
ーブシステムとして両システムを並列に稼動し、マスタ
システムの出力を正規の出力とする態様の、いわゆるデ
ュアル運用状態で運用される。
In one type of duplex information processing system, when both systems are operating normally, one system is operated in parallel with one as a mask and the other as a slave system, and the output of the master system is the normal output. Operated in dual operational state.

この状態で、何等かの原因により、一方のシステムが正
常に稼動できない状態、即ちダウン状態になると、他方
のシステムがマスクとなって(又はマスク状態を維持し
て)、いわゆるシングル運用状態に切り替わり、マスク
のみの単一システムで業務を1!続する。
In this state, if one system cannot operate normally for some reason, that is, goes down, the other system becomes a mask (or maintains a mask state) and switches to a so-called single operation state. , a single system that only requires masks! Continue.

シングル運用状態で、稼動中のシステムが更にダウンし
た場合等、両システムがダウンしている状態になれば、
いわゆるシステムダウン状態であうで、業務の処理は当
然停止する。
In a single operation mode, if both systems are down, such as when the running system goes down further,
The system is in a so-called system down state, and business processing naturally stops.

特に、このようなシステムダウン状態から回復して、シ
ステムの稼動を再開する場合には、最後まで稼動してい
た側のシステムに保持されているはずの、いわゆるチェ
ックポイントファイル等の、最近の諸データを使って、
システムダウンの直前の状態に、業務処理状態を回復し
、中断された業務を継続するようにする必要がある。
In particular, when recovering from such a system down state and restarting the system, recent information such as so-called checkpoint files, which should have been kept in the system that was running until the end, will be deleted. using data,
It is necessary to restore the business processing state to the state immediately before the system went down and to continue the interrupted business.

〔従来の技術と発明が解決しようとする問題点〕第2図
は、二重化情報処理システムの一構成例を示すブロック
図である。
[Prior art and problems to be solved by the invention] FIG. 2 is a block diagram showing an example of the configuration of a duplex information processing system.

A系システム1aと、B系システム1bは同一の構成を
有し、処理装置2a、2b、主記憶装置3a、3b、及
び補助記憶装置4a、4bに代表される周辺装置等から
なる。
The A system 1a and the B system 1b have the same configuration and consist of peripheral devices such as processing units 2a and 2b, main storage devices 3a and 3b, and auxiliary storage devices 4a and 4b.

外部からの入力は、入力線5によって示すように、AS
B系両システムに入力され、両システムが稼動可能であ
れば、並列に同じ処理が実行されるが、外部への出力は
、出力線6に示すように、マスクとされる一方のシステ
ム(図の場合は、A系システム)から出力される。
The external input is as shown by input line 5.
If the input is input to both systems of B system, and both systems are operable, the same processing will be executed in parallel, but the output to the outside will be from one system which is used as a mask, as shown by output line 6. In this case, it is output from the A system).

両システム1a、lb間には、例えば信号線7を設け、
互いに相手システムの状態を監視等することができる。
For example, a signal line 7 is provided between both systems 1a and lb,
Both parties can monitor the status of the other party's system.

、システムの運用開始において、各システムコンソール
8a、8bから初期プログラムロード(以下において、
IPLという)を指定すると、例えば第3図の処理の流
れにより、IPL処理が行われる。
, At the start of system operation, the initial program is loaded from each system console 8a, 8b (in the following,
When IPL is specified, IPL processing is performed according to the processing flow shown in FIG. 3, for example.

まず、処理のステップ10で、診断プログラムが動いて
、自システムの状態を診断し、その結果ステップ11で
正常であれば、以降の処理に進むが、正常で無い場合は
、例えばステップ12で可能な場合はシステムコンソー
ル8a又は8bに表示して、停止する。
First, in step 10 of the process, the diagnostic program runs and diagnoses the state of the own system. If the result is normal in step 11, the process proceeds to the subsequent process, but if it is not normal, it can be done in step 12, for example. If so, it is displayed on the system console 8a or 8b and stopped.

正常な場合は、ステップ13で所要のプログラムをロー
ドする。
If normal, the required program is loaded in step 13.

次のステップ14で、例えば信号線7により、所要の信
号を授受することにより、相手システムが稼動可能な状
態(以下において、レディ状態という)かを検査する。
In the next step 14, by transmitting and receiving necessary signals through the signal line 7, for example, it is checked whether the partner system is in an operable state (hereinafter referred to as a ready state).

相手システムがレディ状態でなければ、ステップ15で
、自システムをマスクとし、例えば補助記憶装置4a又
は4bに記憶されている、いわゆるチェックポイントフ
ァイルを読み出すことにより、ダウン状態からの回復か
判断し、必要な場合には所要の回復処理を行った後、通
常の業務処理を開始する。
If the other system is not in the ready state, in step 15, it is determined whether the system has recovered from the down state by using the own system as a mask and reading a so-called checkpoint file stored in the auxiliary storage device 4a or 4b, for example. After performing necessary recovery processing if necessary, normal business processing is started.

相手システムが既にレディであれば、ステップ16に進
んで、スレーブとなり、相手のマスタシステムとデュア
ル運用状態に入るための処理をした上、相手システムと
同期した状態で業務処理を開始する。
If the other system is already ready, the process proceeds to step 16, where it becomes a slave, performs processing to enter a dual operation state with the other party's master system, and then starts business processing in synchronization with the other system.

前記のように、システムダウン状態から、正しく回復す
るためには、システムダウン時にマスクであったシステ
ムが、マスクとして稼動状態に入る必要がある。
As described above, in order to properly recover from a system down state, the system that was a mask when the system went down needs to enter an operating state as a mask.

このために、システムダウンからの回復において、従来
はオペレータが、何れをマスクとすべきか判断して、該
当の1システムのみを、まずIPLする。それによって
、そのシステムが、前記処理の流れに説明したように、
マスクとして動き出すことができる。
For this reason, when recovering from a system down, conventionally, an operator determines which system should be used as a mask and first performs IPL on only that one system. Thereby, the system, as described in the process flow above,
It can be activated as a mask.

次に要すれば、他方のシステムのIPL処理を起動する
ことにより、そのシステムはスレーブとなり、デュアル
運用状態が構成される。
Next, if desired, by activating the IPL process of the other system, that system becomes a slave and a dual operational state is established.

従って、オペレータが、最初にIPLするシステムの選
択を誤ると、誤った回復処理が行われて、例えばシステ
ムダウン後の業務処理を混乱させるような事態を発生す
るという問題があった。
Therefore, if the operator makes a mistake in selecting the system to be IPLed first, there is a problem in that incorrect recovery processing is performed, which may disrupt business processing after a system failure, for example.

〔問題点を解決するための手段〕[Means for solving problems]

前記の問題点は、マスタシステム及びスレーブシステム
からなる二重化情報処理システムの初期プログラムロー
ド処理に際し、該2システムの各々で稼動し、それぞれ
自システム及び相手システムの稼動可能状態を検出する
第1の手段、及び稼動中の自システムのマスタ/スレー
ブ状態を判定して、該状態表示を保持する第2の手段を
有し、上記第1の手段により検出した上記状態、及び上
記第2の手段に保持する、以前の状態に基づいて、上記
初期プログラムロード後のマスタ/スレーブ状態を決定
するように構成した本発明のシステム回復制御方式によ
って解決される。
The above-mentioned problem arises when the initial program load processing of a duplex information processing system consisting of a master system and a slave system is performed by a first means that operates in each of the two systems and detects the operable state of the own system and the other system. , and a second means for determining the master/slave status of the system in operation and retaining the status display, the status detected by the first means and the second unit retaining the status. The problem is solved by the system recovery control method of the present invention, which is configured to determine the master/slave state after the initial program loading based on the previous state.

〔作用〕[Effect]

即ち、IPL処理を起動されたシステムが、相手システ
ムのレディ状態と、チェックポイントファイル等に記憶
されている、以前のマスタ/スレーブ状態の表示とを参
照することにより、自システムをマスクとするか否かを
、自動的に判断するように、回復時の制御を構成する。
In other words, the system that has started the IPL process may mask its own system by referring to the ready state of the other system and the display of the previous master/slave state stored in the checkpoint file or the like. The control at the time of recovery is configured so as to automatically determine whether or not.

これにより、オペレータは、両システムのIPL処理を
同時に起動すれば、自動的にマスタ/スレーブが正しく
決定し、システムの回復が行われることになる。
As a result, if the operator starts the IPL processing of both systems at the same time, the master/slave will be automatically determined correctly and the system will be recovered.

〔実施例〕〔Example〕

第1図は本発明の一実施例構成の処理の流れ図である。 FIG. 1 is a flowchart of processing in an embodiment of the present invention.

従来と同様に、処理のステップ10で、診断プログラム
が動いて、自システムの状態を診断し、その結果正常で
あれば、ステップ13まで進む。
As in the past, in step 10 of the process, a diagnostic program runs to diagnose the state of the own system, and if the result is normal, the process proceeds to step 13.

ステップ20で、相手システムとの信号授受によって、
相手システムの状態を検査する。
In step 20, by exchanging signals with the other system,
Check the status of the other system.

相手システムがレディ状態でないことを検出すると、ス
テップ15に進んで、自システムをマスクとし、必要な
場合には所要の回復処理を行った後、通常の業務処理を
開始する。
If it is detected that the partner system is not in a ready state, the process proceeds to step 15, where the own system is used as a mask, and after performing necessary recovery processing if necessary, normal business processing is started.

ステップ20で、相手システムが既にマスクとして動作
してい□ると判定すると、ステップ16に進み、自シス
テムをスレーブとし、相手のマスタシステムとデュアル
運用状態に入るための処理をした上、相手システムと同
期した状態で業務処理を開始する。
If it is determined in step 20 that the other system is already operating as a mask, the process proceeds to step 16, where the own system is made a slave, processes are performed to enter a dual operation state with the other party's master system, and the other system is connected to the other system. Start business processing in a synchronized state.

ステップ20で、相手システムがレディでIPL処理中
と判定すると、ステップ22に進み、例えば補助記憶装
置4a又は4bに記憶されているチェックポイントファ
イルから、以前(ダウン状態からの回復の場合、最近の
ダウンの直前)のシステムの状態の記録を読み出す。
In step 20, if it is determined that the partner system is ready and is in the process of IPL processing, the process proceeds to step 22, and the previous (in the case of recovery from a down state, the recent Read the record of the state of the system (just before it went down).

ステップ23で、そのシステム状態から、自システムが
マスクであったかを検査し、マスクで無かった場合(こ
の場合には、スレーブであった場合と、何れの状態とも
表示されて無い場合とを含む゛)には、ステップ16に
進み、自システムをスレーブとし、相手のマスタシステ
ムとデュアル運用状態に入る。
In step 23, it is checked whether the own system is a mask based on the system status, and if it is not a mask (this case includes cases where it is a slave and cases where no status is displayed). ), proceed to step 16, make the own system a slave, and enter a dual operation state with the other party's master system.

ステップ23で、自システムがマスクであったと識別し
た場合には、ステップ24において、以前のシステム状
態の記録から、シングル運用状態であったかを更に検査
する。
If it is determined in step 23 that the own system is a mask, it is further checked in step 24 whether it was in a single operation state from the record of the previous system state.

シングル運用状態であった場合には、相手システムがマ
スクの状態で先にダウンしており、相手システムには、
そのシステム状態の記録がそのま\最近の記録として保
持されている可能性があり、この場合相手システムもマ
スクとして動きだすことになる。
If the system was in single operation mode, the other system would have gone down first in the masked state, and the other system would have
There is a possibility that the record of the system status is kept as it is/as a recent record, and in this case, the other system will also start acting as a mask.

このように、両システムがマスクとなることを防ぐため
に、ステップ25で相手システムに切り捨て信号を送る
ことによって、相手システムで実行中のIPL処理を中
止させ、その後ステップ15の回復処理に進む。この場
合に相手システムは、その後改めてIPL処理を起動さ
れることにより、デュアル運用状態のスレーブとなる。
In this manner, in order to prevent both systems from becoming masks, the IPL processing being executed in the partner system is stopped by sending a truncation signal to the partner system in step 25, and then the process proceeds to the recovery process in step 15. In this case, the other system becomes a slave in a dual operation state by starting the IPL process again.

ステップ24で、以前がシングル運用状態で無いと識別
した場合には、前記の処理が必要ないので、直ちにステ
ップ15の処理に進む。
If it is determined in step 24 that the previous single operation state is not present, the process immediately proceeds to step 15 since the above process is not necessary.

〔発明の効果〕〔Effect of the invention〕

以上の説明から明らかなように本発明によれば、二重化
情報処理システムのシステムダウンからの回復において
、オペレータの誤操作による不正な回復処理が除かれる
ので、情報処理システムの信頼性、可用性を改善すると
いう著しい工業的効果がある。
As is clear from the above description, according to the present invention, when recovering a redundant information processing system from a system failure, unauthorized recovery processing due to operator error is eliminated, thereby improving the reliability and availability of the information processing system. This has a significant industrial effect.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明一実施例の処理の流れ図、第2図はシス
テムの一構成例ブロック図、第3図は従来の一構成例の
処理の流れ図である。 図において、 la、 lbは情報処理システム、 2a、2bは処理装置、  3a、3bは主記憶装置、
4a、4bは補助記憶装置、5は入力線、6は出力線、
      7は信号線、8a、 8bはシステムコン
ソール、 く恭ノ10 10〜25は処理のステップを示す。 茅  1  月 第 2 目 亭 3 S
FIG. 1 is a flowchart of processing according to an embodiment of the present invention, FIG. 2 is a block diagram of an example of a system configuration, and FIG. 3 is a flowchart of processing of an example of a conventional configuration. In the figure, la and lb are information processing systems, 2a and 2b are processing units, 3a and 3b are main storage units,
4a and 4b are auxiliary storage devices, 5 is an input line, 6 is an output line,
7 is a signal line, 8a and 8b are system consoles, and 10 to 25 are processing steps. Kaya January 2nd day 3 S

Claims (1)

【特許請求の範囲】[Claims] マスタシステム及びスレーブシステムからなる二重化情
報処理システムの初期プログラムロード処理に際し、該
2システムの各々で稼動し、それぞれ自システム及び相
手システムの稼動可能状態を検出する第1の手段、及び
稼動中の自システムのマスタ/スレーブ状態を判定して
、該状態表示を保持する第2の手段を有し、上記第1の
手段により検出した上記状態、及び上記第2の手段に保
持する、以前の状態に基づいて、上記初期プログラムロ
ード後のマスタ/スレーブ状態を決定するように構成さ
れていることを特徴とするシステム回復制御方式。
During the initial program load process of a duplex information processing system consisting of a master system and a slave system, a first means that operates in each of the two systems and detects the operable state of the own system and the other system, and an automatic means that is in operation. a second means for determining a master/slave state of the system and retaining an indication of the state; the state detected by the first means and the previous state retained in the second means; A system recovery control method, characterized in that the system is configured to determine a master/slave state after loading the initial program based on the above.
JP60023014A 1985-02-08 1985-02-08 System recovery controlling system Granted JPS61183769A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60023014A JPS61183769A (en) 1985-02-08 1985-02-08 System recovery controlling system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60023014A JPS61183769A (en) 1985-02-08 1985-02-08 System recovery controlling system

Publications (2)

Publication Number Publication Date
JPS61183769A true JPS61183769A (en) 1986-08-16
JPH0350304B2 JPH0350304B2 (en) 1991-08-01

Family

ID=12098634

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60023014A Granted JPS61183769A (en) 1985-02-08 1985-02-08 System recovery controlling system

Country Status (1)

Country Link
JP (1) JPS61183769A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04213122A (en) * 1990-12-06 1992-08-04 Fujitsu Ltd Switchover control system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04213122A (en) * 1990-12-06 1992-08-04 Fujitsu Ltd Switchover control system

Also Published As

Publication number Publication date
JPH0350304B2 (en) 1991-08-01

Similar Documents

Publication Publication Date Title
US6266785B1 (en) File system filter driver apparatus and method
JPH10312327A (en) Mirroring monitor system
JPS5913783B2 (en) Duplicate file method
JPS61183769A (en) System recovery controlling system
JP3022768B2 (en) Virtual computer system
JP2679575B2 (en) I / O channel fault handling system
JPS62284440A (en) Software resource maintenance system for terminal equipment
EP1845447B1 (en) Method, apparatus and software for preventing switch failures in the presence of faults
JPH10161815A (en) Disk duplex management device and method therefor
JPH052499A (en) Job trouble re-processing system of information processor
JPS597982B2 (en) Restart method in case of system failure of computer system
JPH04330531A (en) Check point processing system
JPS6149225A (en) Operation of information processing system
JPH0320780B2 (en)
JPS6341943A (en) Error restoring system for logic unit
JPH04171539A (en) Duplex computer system
JP2849780B2 (en) Computer system
JPS6156537B2 (en)
JPS6335988B2 (en)
JPS6127793B2 (en)
JPH06187102A (en) Duplex disk processing system
JPS63195746A (en) Log processing system
JPS635779B2 (en)
JPS6247722A (en) Starting method for terminal equipment
JPH0813064B2 (en) Emergency control circuit

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees