JP2959467B2 - Fault recovery system, fault recovery method, and medium for storing fault recovery program in loosely coupled multi-computer system - Google Patents

Fault recovery system, fault recovery method, and medium for storing fault recovery program in loosely coupled multi-computer system

Info

Publication number
JP2959467B2
JP2959467B2 JP8105201A JP10520196A JP2959467B2 JP 2959467 B2 JP2959467 B2 JP 2959467B2 JP 8105201 A JP8105201 A JP 8105201A JP 10520196 A JP10520196 A JP 10520196A JP 2959467 B2 JP2959467 B2 JP 2959467B2
Authority
JP
Japan
Prior art keywords
computer
recovery
computers
update
identifier
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP8105201A
Other languages
Japanese (ja)
Other versions
JPH0934853A (en
Inventor
裕治 山岸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP8105201A priority Critical patent/JP2959467B2/en
Publication of JPH0934853A publication Critical patent/JPH0934853A/en
Application granted granted Critical
Publication of JP2959467B2 publication Critical patent/JP2959467B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)
  • Multi Processors (AREA)

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は、疎結合多重計算機シス
テムにおける障害復旧システム、障害復旧方法、および
障害復旧プログラムを記憶する媒体に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a failure recovery system, a failure recovery method, and a medium for storing a failure recovery program in a loosely-coupled multiple computer system.

【0002】[0002]

【従来の技術】「IMS/VS EXTENDED RECOVERY FACILITY(X
RF): GENERAL INFORMATION, GG24-3150-00,IBM World T
rade Corporation,March 1987」には、計算機に障害が発
生しても利用者が該障害の影響を受けることなく業務を
続行することができる信頼性の高い計算機システムであ
る、疎結合多重計算機システムを利用したホットスタン
バイシステムが記載されている。
[Prior Art] "IMS / VS EXTENDED RECOVERY FACILITY (X
RF): GENERAL INFORMATION, GG24-3150-00, IBM World T
rade Corporation, March 1987 "describes a loosely coupled multiple computer system that is a highly reliable computer system that allows users to continue their business without being affected by the failure even if the computer fails. The hot standby system used is described.

【0003】このホットスタンバイシステムは、業務処
理を実施する稼動系計算機(以下、稼働系とする)と、
稼動系に障害が発生した場合に、復旧処理を行う待機系
計算機(以下、待機系とする)との2つの系により構成
される。稼動系が各計算機間で共有しているデータを更
新中に該稼動系に障害が発生した場合、稼働系によって
中途半端に更新されたデータを待機系が更新前の状態に
復旧した後、待機系が新たに稼動系に切り替わり、業務
を継続して実行する。
[0003] This hot standby system includes an active computer (hereinafter referred to as an active computer) for executing business processing,
It is composed of two systems: a standby system computer (hereinafter referred to as a standby system) that performs recovery processing when a failure occurs in the active system. If a failure occurs in the active system while the active system is updating data shared between the computers, the standby system restores the data halfway updated by the active system to the state before the update, and then waits. The system is newly switched to the active system, and the business is executed continuously.

【0004】[0004]

【発明が解決しようとする課題】この従来のホットスタ
ンバイシステムにおいては、障害が発生した計算機によ
って中途半端に更新されたデータを更新前の状態に復旧
するために必要となる情報を、復旧処理を行う他の計算
機に予め渡しておく準備処理が必要であった。
In the conventional hot standby system, information necessary for restoring half-updated data by a failed computer to the state before the update is used for restoration processing. A preparatory process for handing over to another computer in advance was required.

【0005】しかしながら、この従来のホットスタンバ
イシステムにおいては、この準備処理が何らかの原因で
行えなかった場合には、稼動系で障害が発生しても、待
機系が稼働系によって更新されたデータを復旧するため
に必要な情報を得ることができないため、該復旧処理を
行うことができないという問題点がある。
However, in the conventional hot standby system, if this preparation process cannot be performed for some reason, even if a failure occurs in the active system, the standby system recovers the data updated by the active system. However, there is a problem that the recovery process cannot be performed because information necessary for performing the recovery process cannot be obtained.

【0006】また、稼働系と待機系が1対1に構成され
ているため、定期保守作業等を実施するために待機系の
計算機を停止している場合には、復旧処理を行うことが
できないという問題点がある。
[0006] Further, since the active system and the standby system are configured in a one-to-one relationship, if the computer of the standby system is stopped for performing periodic maintenance work, recovery processing cannot be performed. There is a problem.

【0007】本発明の目的は、疎結合多重計算機システ
ムを構成する計算機のいずれかに障害が発生しても、利
用者が該障害により影響を受けることなく業務を続行す
ることができる信頼性の高い計算機システムを提供する
ことにある。
SUMMARY OF THE INVENTION An object of the present invention is to provide a reliable computer system that allows a user to continue work without being affected by a failure even if one of the computers constituting the loosely coupled multiple computer system fails. It is to provide a high computer system.

【0008】本発明の他の目的は、疎結合多重計算機シ
ステムを構成する計算機のいずれかに障害が発生して
も、他に正常に動作している計算機が存在している場合
にはそれらの内のいずれかの計算機によって、障害が発
生した計算機によって更新されたデータを更新前の状態
に復旧することができるようにすることにある。
Another object of the present invention is to provide a computer system in which a failure occurs in any of the loosely-coupled multi-computer systems, if any of the computers are operating normally. The purpose of the present invention is to allow any one of the computers to recover data updated by the failed computer to the state before the update.

【0009】さらに本発明の他の目的は、障害が発生し
た計算機によって更新されたデータを更新前の状態に復
旧する計算機が、該復旧処理を行うために必要とする情
報を障害が発生する前に受け取らなくても、該復旧処理
を行うことができるようにすることにある。
Still another object of the present invention is to provide a computer for restoring data updated by a computer in which a failure has occurred to a state before the update, by using information necessary for performing the recovery processing before the failure occurs. The recovery processing can be performed without receiving the information.

【0010】[0010]

【課題を解決するための手段】本発明の第1の疎結合多
重計算機システムにおける障害復旧システムは、複数の
計算機と、前記複数の計算機間で共有される共有データ
と、前記複数の計算機毎に、前記共有データの更新前の
状態を更新処理情報として保持する更新記録保持手段
と、前記複数の計算機のいずれかに何らかの障害が発生
したことを、障害が発生していない他の計算機に通知す
る障害通知手段とを備え、前記複数の計算機のそれぞれ
が、業務実施時において、前記共有データの更新前の状
態を前記更新処理情報として前記更新記録保持手段に格
納した後に、該共有データを更新し、業務終了時におい
て、前記更新処理情報を削除することを特徴とする。
According to a first aspect of the present invention, there is provided a fault recovery system in a loosely coupled multi-computer system, comprising: a plurality of computers; shared data shared among the plurality of computers; Update record holding means for holding the state of the shared data before update as update processing information, and notifying another computer having no failure that one of the plurality of computers has failed. Failure notification means, each of the plurality of computers updates the shared data after storing the state of the shared data before the update as the update processing information in the update record holding means at the time of business operation. At the end of the work, the update processing information is deleted.

【0011】本発明の第2の疎結合多重計算機システム
における障害復旧システムは、第1の疎結合多重計算機
システムにおける障害復旧システムにおいて、前記複数
の各計算機のそれぞれが、さらに、前記障害通知手段か
ら他の計算機に障害が発生した旨の通知を受信した時
に、該他の計算機の前記更新記録保持手段に格納されて
いる前記更新処理情報を元にして前記共有データを更新
前の状態に復旧することを特徴とする。
In a second aspect of the present invention, there is provided a fault recovery system in a loosely-coupled multi-computer system, wherein each of the plurality of computers further comprises: Upon receiving a notification that a failure has occurred in another computer, the shared data is restored to a state before the update based on the update processing information stored in the update record holding unit of the other computer. It is characterized by the following.

【0012】本発明の第3の疎結合多重計算機システム
における障害復旧システムは、複数の計算機と、前記複
数の計算機間で共有される共有データと、前記複数の計
算機毎に、前記共有データの更新前の状態を更新処理情
報として保持する更新記録保持手段と、前記共有データ
に対して更新処理を行っている計算機の識別子を登録す
る排他手段と、前記複数の計算機のいずれかに何らかの
障害が発生したことを、障害が発生していない他の計算
機に通知する障害通知手段とを備え、前記複数の計算機
のそれぞれが、業務実施時において、前記排他手段に他
の計算機の識別子が登録されていない場合にのみ、該排
他手段に自計算機の識別子を登録し、前記共有データの
更新前の状態を前記更新処理情報として前記更新記録保
持手段に格納した後に、該共有データを更新し、業務終
了時において、前記更新処理情報を削除し、前記排他手
段から自計算機の識別子を削除することを特徴とする。
A third aspect of the present invention provides a fault recovery system in a loosely-coupled multiple computer system, comprising: a plurality of computers; shared data shared among the plurality of computers; and updating of the shared data for each of the plurality of computers. Update record holding means for holding the previous state as update processing information, exclusion means for registering the identifier of the computer performing the update processing on the shared data, and occurrence of any failure in any of the plurality of computers Failure notification means for notifying other computers in which a failure has not occurred, wherein each of the plurality of computers does not have an identifier of another computer registered in the exclusive means at the time of business operation Only in this case, the identifier of the own computer is registered in the exclusive unit, and the state before the update of the shared data is stored in the update record holding unit as the update processing information. To, and updating the shared data, at the time of the close of business, and deletes the update process information, and deletes the identifier of the computer from the exclusion means.

【0013】本発明の第4の疎結合多重計算機システム
における障害復旧システムは、第3の疎結合多重計算機
システムにおける障害復旧システムにおいて、前記複数
の各計算機のそれぞれが、さらに、前記障害通知手段か
ら他の計算機に障害が発生した旨の通知を受信した時
に、前記排他手段に登録されている該他の計算機の識別
子を削除して自計算機の識別子を登録し、該他の計算機
の前記更新記録保持手段に格納されている前記更新処理
情報を元にして前記共有データを更新前の状態に復旧
し、前記排他手段に登録されている自計算機の識別子を
削除することを特徴とする。
[0013] In a fourth aspect of the present invention, there is provided a fault recovery system in a third loosely-coupled multi-computer system, wherein each of the plurality of computers further comprises: Upon receiving a notification that a failure has occurred in another computer, the identifier of the other computer registered in the exclusion means is deleted, the identifier of the own computer is registered, and the update record of the other computer is registered. The shared data is restored to the state before the update based on the update processing information stored in the holding unit, and the identifier of the own computer registered in the exclusive unit is deleted.

【0014】本発明の第5の疎結合多重計算機システム
における障害復旧システムは、複数の計算機と、前記複
数の計算機間で共有される共有データと、前記複数の計
算機毎に、前記共有データの更新前の状態を更新処理情
報として保持する更新記録保持手段と、前記共有データ
に対して更新処理を行っている計算機の識別子を登録す
る排他手段と、前記複数の計算機毎に、該計算機の識別
子と該計算機の復旧処理が行われているか否かを示す情
報とを含むリカバリ情報と、前記複数の計算機のいずれ
かに何らかの障害が発生したことを、障害が発生してい
ない他の計算機に通知する障害通知手段とを備え、前記
複数の計算機のそれぞれが、業務実施時において、前記
排他手段に他の計算機の識別子が登録されていない場合
にのみ、該排他手段に自計算機の識別子を登録し、前記
共有データの更新前の状態を前記更新処理情報として前
記更新記録保持手段に格納した後に、該共有データを更
新し、業務終了時において、前記更新処理情報にリカバ
リ不要の識別子を付し、前記排他手段から自計算機の識
別子を削除することを特徴とする。
A fifth aspect of the present invention provides a fault recovery system in a loosely-coupled multiple computer system, comprising: a plurality of computers; shared data shared among the plurality of computers; and updating of the shared data for each of the plurality of computers. Update record holding means for holding a previous state as update processing information, exclusion means for registering an identifier of a computer which is performing update processing on the shared data, and an identifier of the computer for each of the plurality of computers. The recovery information including information indicating whether or not the recovery process of the computer is being performed, and a notification that some failure has occurred in any of the plurality of computers is notified to another computer in which no failure has occurred. Failure notification means, and each of the plurality of computers performs the exclusive operation only when the identifier of another computer is not registered in the exclusive means at the time of business operation. Register the identifier of the own computer in, and store the state before the update of the shared data as the update processing information in the update record holding unit, and then update the shared data. An identifier that does not require recovery is attached, and the identifier of the own computer is deleted from the exclusive unit.

【0015】本発明の第6の疎結合多重計算機システム
における障害復旧システムは、第5の疎結合多重計算機
システムにおける障害復旧システムにおいて、前記複数
の計算機のそれぞれが、さらに、前記障害通知手段から
他の計算機に障害が発生した旨の通知を受信した時に、
該他の計算機の前記リカバリ情報を参照して復旧処理が
行われているか否かを判定し、復旧処理が行われていな
いと判定した場合には、前記排他手段に登録されている
該他の計算機の識別子を削除して自計算機の識別子を登
録し、該他の計算機の前記リカバリ情報に復旧処理を行
う旨を登録し、該他の計算機の前記更新記録保持手段に
格納されている前記更新処理情報の内、リカバリ不要の
識別子が付されていないものを元にして前記共有データ
を更新前の状態に復旧し、該更新処理情報にリカバリ不
要の識別子を付し、前記排他手段に登録されている自計
算機の識別子を削除し、該他の計算機の前記リカバリ情
報を削除することを特徴とする。
In a sixth aspect of the present invention, there is provided a fault recovery system in a fifth loosely-coupled multi-computer system, wherein each of the plurality of computers is further provided from the fault notification means. When receiving notification that a failure has occurred in the computer of
It is determined whether or not recovery processing is being performed by referring to the recovery information of the other computer. If it is determined that recovery processing has not been performed, the other computer registered in the exclusive unit is Deleting the identifier of the computer, registering the identifier of the own computer, registering that the recovery process is to be performed in the recovery information of the other computer, and updating the update stored in the update record holding unit of the other computer The shared data is restored to the state before the update based on the processing information without the recovery-unnecessary identifier, and the update processing information is appended with the recovery-unnecessary identifier and registered in the exclusive unit. The identifier of the own computer is deleted, and the recovery information of the other computer is deleted.

【0016】本発明の第7の疎結合多重計算機システム
における障害復旧システムは、複数の計算機と、前記複
数の計算機間で共有される共有データと、前記複数の計
算機毎に、前記共有データの更新前の状態を更新処理情
報として保持する更新記録保持手段と、前記複数の計算
機毎に、前記更新記録保持手段が設定されている装置の
装置名を保持する更新記録管理手段と、前記共有データ
に対して更新処理を行っている計算機の識別子を登録す
る排他手段と、前記複数の計算機毎に、該計算機の識別
子、該計算機が保持している前記更新記録管理手段が設
定されている装置の装置名、該計算機の復旧処理が行わ
れているか否かを示す情報、および該復旧処理を行って
いる他の計算機の計算機識別子を含むリカバリ情報と、
前記複数の計算機のいずれかに何らかの障害が発生した
ことを、障害が発生していない他の計算機に通知する障
害通知手段とを備え、前記複数の計算機のぞれぞれが、
業務開始時において、自計算機の識別子と自計算機の前
記更新記録管理手段を設定した装置の装置名を格納した
前記リカバリ情報を作成し、業務実施時において、前記
排他手段に他の計算機の識別子が登録されていない場合
にのみ、該排他手段に自計算機の識別子を登録し、前記
共有データの更新前の状態を前記更新処理情報として前
記更新記録保持手段に格納した後に、該共有データを更
新し、業務終了時において、前記更新処理情報にリカバ
リ不要の識別子を付し、前記排他手段から自計算機の識
別子を削除することを特徴とする。
A fault recovery system in a seventh loosely coupled multiple computer system according to the present invention includes a plurality of computers, shared data shared among the plurality of computers, and updating of the shared data for each of the plurality of computers. Update record holding means for holding a previous state as update processing information; update record management means for holding, for each of the plurality of computers, a device name of an apparatus for which the update record holding means is set; An exclusive unit for registering an identifier of a computer that is performing an update process, and an apparatus of an apparatus in which the identifier of the computer and the update record management unit held by the computer are set for each of the plurality of computers. Recovery information including a name, information indicating whether or not recovery processing of the computer is being performed, and computer identifiers of other computers that are performing the recovery processing;
Failure notification means for notifying another computer in which a failure has not occurred that any failure has occurred in any of the plurality of computers, and each of the plurality of computers has
At the start of a job, the recovery information storing the identifier of the own computer and the device name of the device that has set the update record management unit of the own computer is created, and at the time of job execution, the identifier of another computer is stored in the exclusive unit. Only when it is not registered, after registering the identifier of the own computer in the exclusive unit and storing the state of the shared data before update as the update processing information in the update record holding unit, update the shared data. At the end of work, an identifier that does not require recovery is added to the update processing information, and the identifier of the own computer is deleted from the exclusive unit.

【0017】本発明の第8の疎結合多重計算機システム
における障害復旧システムは、第7の疎結合多重計算機
システムにおける障害復旧システムにおいて、前記複数
の計算機のそれぞれが、さらに、前記障害通知手段から
他の計算機に障害が発生した旨の通知を受信した時に、
該他の計算機の前記リカバリ情報を参照して復旧処理が
行われているか否かを判定し、復旧処理が行われていな
いと判定した場合には、前記排他手段に登録されている
該他の計算機の識別子を削除して自計算機の識別子を登
録し、該他の計算機の前記リカバリ情報に復旧処理を行
う旨および自計算機の識別子を登録し、該他の計算機の
前記リカバリ情報を参照して前記更新記録保持手段が設
定されている装置の装置名を認識し、該更新記録保持手
段に格納されている前記更新処理情報の内、リカバリ不
要の識別子が付されていないものを元にして前記共有デ
ータを更新前の状態に復旧し、該更新処理情報にリカバ
リ不要の識別子を付し、前記排他手段に登録されている
自計算機の識別子を削除し、該他の計算機の前記リカバ
リ情報を削除することを特徴とする。
An eighth aspect of the present invention provides a fault recovery system in a loosely-coupled multi-computer system, wherein each of the plurality of computers is further connected to the fault notification means from the fault notifying means. When receiving notification that a failure has occurred in the computer of
It is determined whether or not recovery processing is being performed by referring to the recovery information of the other computer. If it is determined that recovery processing has not been performed, the other computer registered in the exclusive unit is Delete the identifier of the computer, register the identifier of the own computer, register the recovery information in the recovery information of the other computer and register the identifier of the own computer, and refer to the recovery information of the other computer. The update record holding unit recognizes the device name of the set device, and among the update processing information stored in the update record holding unit, based on the update processing information to which the recovery unnecessary identifier is not attached, The shared data is restored to the state before the update, the update processing information is given an identifier that does not require recovery, the identifier of the own computer registered in the exclusive unit is deleted, and the recovery information of the other computer is deleted. Do And wherein the door.

【0018】本発明の第9の疎結合多重計算機システム
における障害復旧システムは、第8の疎結合多重計算機
システムにおける障害復旧システムにおいて、前記複数
の計算機のそれぞれが、さらに、前記障害通知手段から
他の計算機に障害が発生した旨の通知を受信した時に、
該他の計算機が復旧処理を行っている旨登録されている
前記リカバリ情報が存在するか否かを判定し、存在する
場合には、該リカバリ情報に対応する計算機によって更
新された前記共有データについても、該他の計算機によ
って更新された該共有データを復旧する処理と同様にし
て、更新前の状態に復旧することを特徴とする。
According to a ninth loosely-coupled multi-computer system of the present invention, there is provided a fault recovery system in the eighth loosely-coupled multi-computer system. When receiving notification that a failure has occurred in the computer of
It is determined whether or not the recovery information registered that the other computer is performing the recovery process exists, and if so, the shared data updated by the computer corresponding to the recovery information is determined. Also, similar to the process of restoring the shared data updated by the other computer, the shared data is restored to the state before the update.

【0019】本発明の第1の疎結合多重計算機システム
における障害復旧方法は、複数の計算機と、該複数の計
算機間で共有される共有データと、該複数の各計算機毎
に、前記共有データの更新前の状態を更新処理情報とし
て保持する更新記録保持手段と、前記複数の計算機のい
ずれかに何らかの障害が発生したことを、障害が発生し
ていない他の計算機に通知する障害通知手段とを備えた
疎結合多重計算機システムにおいて、前記複数の計算機
のそれぞれが、業務実施時において、前記共有データの
更新前の状態を前記更新処理情報として前記更新記録保
持手段に格納した後に、該共有データを更新し、業務終
了時において、前記更新処理情報を削除することを特徴
とする。
The first method of restoring a loosely-coupled multi-computer system of the present invention is a method of recovering a plurality of computers, shared data shared among the plurality of computers, and a method of recovering the shared data for each of the plurality of computers. Update record holding means for holding a state before update as update processing information; and fault notifying means for notifying another computer in which no fault has occurred that any of the plurality of computers has failed. In the loosely-coupled multi-computer system provided, each of the plurality of computers stores the state before the update of the shared data in the update record holding unit as the update processing information at the time of business operation, and then stores the shared data in the update record holding unit. Updating and deleting the update processing information at the end of work.

【0020】本発明の第2の疎結合多重計算機システム
における障害復旧方法は、第1の疎結合多重計算機シス
テムにおける障害復旧方法において、前記複数の計算機
のそれぞれが、さらに、前記障害通知手段から他の計算
機に障害が発生した旨の通知を受信した時に、該他の計
算機の前記更新記録保持手段に格納されている前記更新
処理情報を元にして前記共有データを更新前の状態に復
旧することを特徴とする。
The second method for restoring failure in a loosely-coupled multi-computer system according to the present invention is the method for restoring failure in a first loosely-coupled multi-computer system, wherein each of the plurality of computers further comprises: When receiving a notification that a failure has occurred in one of the computers, the shared data is restored to the state before the update based on the update processing information stored in the update record holding unit of the other computer. It is characterized by.

【0021】本発明の第3の疎結合多重計算機システム
における障害復旧方法は、複数の計算機と、該複数の計
算機間で共有される共有データと、該複数の計算機毎
に、前記共有データの更新前の状態を更新処理情報とし
て保持する更新記録保持手段と、前記共有データに対し
て更新処理を行っている計算機の識別子を登録する排他
手段と、前記複数の計算機のいずれかに何らかの障害が
発生したことを、障害が発生していない他の計算機に通
知する障害通知手段とを備えた疎結合多重計算機システ
ムにおいて、前記複数の計算機のそれぞれが、業務実施
時において、前記排他手段に他の計算機の識別子が登録
されていない場合にのみ、該排他手段に自計算機の識別
子を登録し、前記共有データの更新前の状態を前記更新
処理情報として前記更新記録保持手段に格納した後に、
該共有データを更新し、業務終了時において、前記更新
処理情報を削除し、前記排他手段から自計算機の識別子
を削除することを特徴とする。
According to a third aspect of the present invention, there is provided a failure recovery method in a loosely-coupled multiple computer system, comprising: a plurality of computers; shared data shared among the plurality of computers; and updating of the shared data for each of the plurality of computers. Update record holding means for holding the previous state as update processing information, exclusion means for registering the identifier of the computer performing the update processing on the shared data, and occurrence of any failure in any of the plurality of computers In a loosely coupled multiplex computer system having a failure notifying means for notifying another computer in which a failure has not occurred, each of the plurality of computers is provided with another computer to the exclusive means at the time of business operation. Only when the identifier of the shared data is not registered, the identifier of the own computer is registered in the exclusive unit, and the state before the update of the shared data is used as the update processing information. After storing the new record holding means,
The shared data is updated, and at the end of business, the update processing information is deleted, and the identifier of the own computer is deleted from the exclusive unit.

【0022】本発明の第4の疎結合多重計算機システム
における障害復旧方法は、第3の疎結合多重計算機シス
テムにおける障害復旧方法において、前記複数の計算機
のそれぞれが、さらに、前記障害通知手段から他の計算
機に障害が発生した旨の通知を受信した時に、前記排他
手段に登録されている該他の計算機の識別子を削除して
自計算機の識別子を登録し、該他の計算機の前記更新記
録保持手段に格納されている前記更新処理情報を元にし
て前記共有データを更新前の状態に復旧し、前記排他手
段に登録されている自計算機の識別子を削除することを
特徴とする。
According to a fourth aspect of the present invention, there is provided a fault recovery method in a loosely-coupled multi-computer system, wherein each of the plurality of computers is further transmitted from the fault notifying means. When receiving a notification that a failure has occurred in one of the computers, the identifier of the other computer registered in the exclusive unit is deleted and the identifier of the own computer is registered, and the update record holding of the other computer is performed. The shared data is restored to the state before the update based on the update processing information stored in the means, and the identifier of the own computer registered in the exclusion means is deleted.

【0023】本発明の第5の疎結合多重計算機システム
における障害復旧方法は、複数の計算機と、前記複数の
計算機間で共有される共有データと、前記複数の計算機
毎に、前記共有データの更新前の状態を更新処理情報と
して保持する更新記録保持手段と、前記共有データに対
して更新処理を行っている計算機の識別子を登録する排
他手段と、前記複数の計算機毎に、該計算機の識別子と
該計算機の復旧処理が行われているか否かを示す情報と
を含むリカバリ情報と、前記複数の計算機のいずれかに
何らかの障害が発生したことを、障害が発生していない
他の計算機に通知する障害通知手段とを備えた疎結合多
重計算機システムにおいて、前記複数の計算機のそれぞ
れが、業務実施時において、前記排他手段に他の計算機
の識別子が登録されていない場合にのみ、該排他手段に
自計算機の識別子を登録し、前記共有データの更新前の
状態を前記更新処理情報として前記更新記録保持手段に
格納した後に、該共有データを更新し、業務終了時にお
いて、前記更新処理情報にリカバリ不要の識別子を付
し、前記排他手段から自計算機の識別子を削除すること
を特徴とする。
According to a fifth aspect of the present invention, there is provided a fault recovery method in a loosely-coupled multiple computer system, comprising: a plurality of computers; shared data shared among the plurality of computers; and updating of the shared data for each of the plurality of computers. Update record holding means for holding a previous state as update processing information, exclusion means for registering an identifier of a computer which is performing update processing on the shared data, and an identifier of the computer for each of the plurality of computers. The recovery information including information indicating whether or not the recovery process of the computer is being performed, and a notification that some failure has occurred in any of the plurality of computers is notified to another computer in which no failure has occurred. In the loosely-coupled multi-computer system provided with the fault notifying means, each of the plurality of computers may have an identifier of another computer registered in the exclusive means at the time of business operation. Only when it is not, the identifier of the own computer is registered in the exclusive unit, the state before the update of the shared data is stored in the update record holding unit as the update processing information, and then the shared data is updated. At the time of termination, an identifier that does not require recovery is added to the update processing information, and the identifier of the own computer is deleted from the exclusive unit.

【0024】本発明の第6の疎結合多重計算機システム
における障害復旧方法は、第5の疎結合多重計算機シス
テムにおける障害復旧方法において、前記複数の計算機
のそれぞれが、さらに、前記障害通知手段から他の計算
機に障害が発生した旨の通知を受信した時に、該他の計
算機の前記リカバリ情報を参照して復旧処理が行われて
いるか否かを判定し、復旧処理が行われていないと判定
した場合には、前記排他手段に登録されている該他の計
算機の識別子を削除して自計算機の識別子を登録し、該
他の計算機の前記リカバリ情報に復旧処理を行う旨を登
録し、該他の計算機の前記更新記録保持手段に格納され
ている前記更新処理情報の内、リカバリ不要の識別子が
付されていないものを元にして前記共有データを更新前
の状態に復旧し、該更新処理情報にリカバリ不要の識別
子を付し、前記排他手段に登録されている自計算機の識
別子を削除し、該他の計算機の前記リカバリ情報を削除
することを特徴とする。
According to a sixth aspect of the present invention, there is provided a fault recovery method for a loosely-coupled multi-computer system, wherein each of the plurality of computers is further transmitted from the fault notification means to the other. When a notification indicating that a failure has occurred in one of the computers has been received, it is determined whether or not recovery processing has been performed by referring to the recovery information of the other computer, and it has been determined that recovery processing has not been performed. In this case, the identifier of the other computer registered in the exclusion means is deleted, the identifier of the own computer is registered, the recovery information of the other computer is registered to perform recovery processing, and the other information is registered. Of the update processing information stored in the update record holding means of the computer, the shared data is restored to the state before the update based on the information not having the recovery unnecessary identifier, Given the recovery unnecessary identifier updating information, it deletes the identifier of the computer which is registered in the exclusive device, and deletes the recovery information of the other computer.

【0025】本発明の第7の疎結合多重計算機システム
における障害復旧方法は、複数の計算機と、前記複数の
計算機間で共有される共有データと、前記複数の計算機
毎に、前記共有データの更新前の状態を更新処理情報と
して保持する更新記録保持手段と、前記複数の計算機毎
に、前記更新記録保持手段が設定されている装置の装置
名を保持する更新記録管理手段と、前記共有データに対
して更新処理を行っている計算機の識別子を登録する排
他手段と、前記複数の計算機毎に、該計算機の識別子、
該計算機が保持している前記更新記録管理手段が設定さ
れている装置の装置名、該計算機の復旧処理が行われて
いるか否かを示す情報、および該復旧処理を行っている
他の計算機の計算機識別子を含むリカバリ情報と、前記
複数の計算機のいずれかに何らかの障害が発生したこと
を、障害が発生していない他の計算機に通知する障害通
知手段とを備えた疎結合多重計算機システムにおいて、
前記複数の計算機のそれぞれが、業務開始時において、
自計算機の識別子と自計算機の前記更新記録管理手段を
設定した装置の装置名を格納した前記リカバリ情報を作
成し、業務実施時において、前記排他手段に他の計算機
の識別子が登録されていない場合にのみ、該排他手段に
自計算機の識別子を登録し、前記共有データの更新前の
状態を前記更新処理情報として前記更新記録保持手段に
格納した後に、該共有データを更新し、業務終了時にお
いて、前記更新処理情報にリカバリ不要の識別子を付
し、前記排他手段から自計算機の識別子を削除すること
を特徴とする。
[0025] In a seventh aspect of the present invention, there is provided a fault recovery method in a loosely-coupled multi-computer system, comprising the steps of: updating a plurality of computers; shared data shared among the plurality of computers; Update record holding means for holding a previous state as update processing information; update record management means for holding, for each of the plurality of computers, a device name of an apparatus for which the update record holding means is set; Exclusive means for registering an identifier of a computer that is performing update processing on the computer; and for each of the plurality of computers, an identifier of the computer,
The device name of the device in which the update record management means held by the computer is set, information indicating whether or not the recovery process of the computer is being performed, and the name of the other computer that is performing the recovery process. In a loosely coupled multiplex computer system comprising: recovery information including a computer identifier; and a failure notifying unit for notifying another computer in which a failure has not occurred that any one of the plurality of computers has failed.
Each of the plurality of computers, at the start of business,
When the recovery information storing the identifier of the own computer and the device name of the device that has set the update record management unit of the own computer is created, and when executing the business, the identifier of another computer is not registered in the exclusive unit. Only after registering the identifier of the own computer in the exclusive unit and storing the state of the shared data before update in the update record holding unit as the update processing information, the shared data is updated. An identifier that does not require recovery is added to the update processing information, and the identifier of the own computer is deleted from the exclusive unit.

【0026】本発明の第8の疎結合多重計算機システム
における障害復旧方法は、第7の疎結合多重計算機シス
テムにおける障害復旧方法において、前記複数の計算機
のそれぞれが、さらに、前記障害通知手段から他の計算
機に障害が発生した旨の通知を受信した時に、該他の計
算機の前記リカバリ情報を参照して復旧処理が行われて
いるか否かを判定し、復旧処理が行われていないと判定
した場合には、前記排他手段に登録されている該他の計
算機の識別子を削除して自計算機の識別子を登録し、該
他の計算機の前記リカバリ情報に復旧処理を行う旨およ
び自計算機の識別子を登録し、該他の計算機の前記リカ
バリ情報を参照して前記更新記録保持手段が設定されて
いる装置の装置名を認識し、該更新記録保持手段に格納
されている前記更新処理情報の内、リカバリ不要の識別
子が付されていないものを元にして前記共有データを更
新前の状態に復旧し、該更新処理情報にリカバリ不要の
識別子を付し、前記排他手段に登録されている自計算機
の識別子を削除し、該他の計算機の前記リカバリ情報を
削除することを特徴とする。
According to an eighth aspect of the present invention, there is provided a fault recovery method in a loosely-coupled multi-computer system, wherein each of the plurality of computers is further connected to the fault notification means. When a notification indicating that a failure has occurred in one of the computers has been received, it is determined whether or not recovery processing has been performed by referring to the recovery information of the other computer, and it has been determined that recovery processing has not been performed. In this case, the identifier of the other computer registered in the exclusion unit is deleted, the identifier of the own computer is registered, and the recovery information is executed in the recovery information of the other computer, and the identifier of the own computer is changed. Registering, referring to the recovery information of the other computer, recognizing the device name of the device in which the update record holding unit is set, and updating the update name stored in the update record holding unit. The shared data is restored to the state before the update based on the processing information without the recovery-unnecessary identifier, and the update processing information is appended with the recovery-unnecessary identifier and registered in the exclusive unit. The identifier of the own computer is deleted, and the recovery information of the other computer is deleted.

【0027】本発明の第9の疎結合多重計算機システム
における障害復旧方法は、第8の疎結合多重計算機シス
テムにおける障害復旧方法において、前記複数の計算機
のそれぞれが、さらに、前記障害通知手段から他の計算
機に障害が発生した旨の通知を受信した時に、該他の計
算機が復旧処理を行っている旨登録されている前記リカ
バリ情報が存在するか否かを判定し、存在する場合に
は、該リカバリ情報に対応する計算機によって更新され
た前記共有データについても、該他の計算機によって更
新された該共有データを復旧する処理と同様にして、更
新前の状態に復旧することを特徴とする。
According to a ninth aspect of the present invention, there is provided a fault recovery method in a loosely-coupled multi-computer system, wherein each of the plurality of computers further includes another When receiving a notification that a failure has occurred in one of the computers, it is determined whether or not the recovery information registered that the other computer is performing a recovery process exists. The shared data updated by the computer corresponding to the recovery information is restored to the state before the update in the same manner as the process of restoring the shared data updated by the other computer.

【0028】[0028]

【0029】[0029]

【0030】[0030]

【0031】[0031]

【0032】[0032]

【0033】[0033]

【0034】[0034]

【0035】[0035]

【0036】[0036]

【0037】[0037]

【発明の実施の形態】以下本発明の一実施例について、
図を参照しながら詳細に説明する。
BEST MODE FOR CARRYING OUT THE INVENTION Hereinafter, one embodiment of the present invention will be described.
This will be described in detail with reference to the drawings.

【0038】図1を参照すると、本発明の一実施例であ
る疎結合多重計算機システムにおける障害復旧システム
は、疎結合多重計算機システムを構成する計算機1、計
算機2、および計算機3と、すべての計算機間で共有す
る共有データ20と、共有データ20に対して更新処理
を行っている計算機を管理する排他手段11と疎結合多
重計算機システムを構成するいずれかの計算機で障害が
発生した場合に、他の正常に動作している計算機が復旧
処理を行うために必要なリカバリ情報を保持するリカバ
リ情報保持手段12とを含む多重計算機制御手段10
と、各計算機における業務処理により共有データ20が
更新された時に該更新処理情報を各計算機毎に保持する
更新記録保持手段31、32、および33と、各計算機
毎に保持している更新記録保持手段31、32、および
33に関する情報を各計算機において保持する更新記録
管理手段41、42、および43と、計算機に障害が発
生した場合に、その障害発生を他のすべての計算機に報
告する障害通知手段50とから構成されている。
Referring to FIG. 1, a failure recovery system in a loosely-coupled multi-computer system according to one embodiment of the present invention includes a computer 1, a computer 2, and a computer 3, which constitute a loosely-coupled multi-computer system, and all computers. When a failure occurs in any of the computers constituting the loosely coupled multi-computer system, the shared data 20 to be shared between the computers, the exclusion unit 11 for managing the computer performing the update process on the shared data 20, And a recovery information holding unit 12 for holding recovery information necessary for a normally operating computer to perform recovery processing.
Update record holding means 31, 32, and 33 for holding the update processing information for each computer when the shared data 20 is updated by business processing in each computer; and update record holding means for each computer. Update record management means 41, 42, and 43 for retaining information on the means 31, 32, and 33 in each computer; and, when a failure occurs in a computer, a failure notification for reporting the failure occurrence to all other computers. And means 50.

【0039】なお、疎結合多重計算機システムでは、シ
ステムを構成する各計算機を識別するために、各計算機
毎に固有の計算機識別子を保持しており、計算機1は計
算機識別子として1、計算機2は計算機識別子として
2、計算機3は計算機識別子として3の値をそれぞれ保
持している。
In the loosely coupled multi-computer system, a computer identifier unique to each computer is held in order to identify each computer constituting the system. Computer 1 is 1 as a computer identifier, and computer 2 is a computer. The computer 3 holds a value of 3 as an identifier, and the computer 3 holds a value of 3 as a computer identifier.

【0040】共有データ20は、すべての計算機でアク
セス可能なディスク装置上に配置される。
The shared data 20 is located on a disk device accessible by all computers.

【0041】更新記録保持手段31、32、および33
は、端末等から入力されたある論理的な単位の処理(以
下、トランザクションとする)が、何らかの原因により
処理を中断された場合に、該処理の過程において更新さ
れたデータを更新前の状態に戻すロールバック処理を行
うための更新前のデータの情報を保持するもので、各計
算機毎に設定されるが、すべての計算機でアクセスする
ことができるディスク装置上に配置される。
Update record holding means 31, 32 and 33
When processing of a certain logical unit (hereinafter referred to as a transaction) input from a terminal or the like is interrupted for some reason, data updated in the course of the processing is returned to the state before the update. It retains information of data before update for performing rollback processing to be returned, and is set for each computer, but is arranged on a disk device that can be accessed by all computers.

【0042】ただし、他の計算機の更新記録保持手段に
対してアクセスを行うのは、復旧処理を行う計算機が、
障害が発生した計算機の更新記録保持手段に対してアク
セスする時だけである。
However, the access to the update record holding means of another computer is performed by the computer performing the recovery processing.
This is only when accessing the update record holding unit of the failed computer.

【0043】更新記録管理手段41、42、および43
は、それぞれ更新記録保持手段31、32、および33
を配置しているディスク装置の装置名等の情報を保持
し、各計算機に接続されたディスク装置上に配置され、
通常の運用中は、自計算機からのみアクセスすることが
できるものであり、他の計算機からは該ディスク装置に
アクセスすることはできない。
Update record management means 41, 42 and 43
Are update record holding units 31, 32, and 33, respectively.
Holds information such as the device name of the disk device on which is located, is located on the disk device connected to each computer,
During normal operation, the disk device can be accessed only from its own computer, and cannot be accessed from other computers.

【0044】図2を参照すると、リカバリ情報保持手段
12は、計算機毎のリカバリ情報121、122、およ
び123を含む。
Referring to FIG. 2, the recovery information holding means 12 includes recovery information 121, 122, and 123 for each computer.

【0045】図3を参照すると、これらのリカバリ情報
121、122、および123は、それぞれの計算機の
計算機識別子が設定される計算機識別子情報12−1
と、復旧処理状態を示すリカバリ処理状態情報12−2
と、更新記録管理手段41、42、および43を配置し
ている装置の装置名を示す更新記録管理手段配置装置名
情報12−3とを含む。
Referring to FIG. 3, the recovery information 121, 122, and 123 are computer identifier information 12-1 in which the computer identifier of each computer is set.
And recovery process status information 12-2 indicating the recovery process status
And update record management means arrangement device name information 12-3 indicating the name of the device in which the update record management means 41, 42, and 43 are arranged.

【0046】図4を参照すると、リカバリ処理状態情報
12−2は、それぞれの計算機の復旧処理が行われてい
る(「1」)か否(「0」)かを示す復旧処理識別情報
12−2−1と、復旧処理を行っている計算機の計算機
識別子である復旧処理計算機識別情報12−2−2とを
含む。
Referring to FIG. 4, recovery process status information 12-2 indicates whether or not the recovery process of each computer is being performed ("1") or not ("0"). 2-1 and recovery process computer identification information 12-2-2, which is a computer identifier of the computer performing the recovery process.

【0047】次に本発明の一実施例の動作について、図
1〜図7を参照して説明する。
Next, the operation of one embodiment of the present invention will be described with reference to FIGS.

【0048】計算機1は、業務処理を開始する前に、リ
カバリ情報保持手段12内に、計算機1のリカバリ情報
121を設定する(ステップ61)。
The computer 1 sets the recovery information 121 of the computer 1 in the recovery information holding means 12 before starting the business process (step 61).

【0049】リカバリ情報121には、計算機1のリカ
バリ情報であることを示すために計算機1の計算機識別
子「1」を計算機識別子情報12−1に設定し、さらに
更新記録管理手段41を配置している装置の装置名を更
新記録管理手段配置装置名情報12−3に設定する。
In the recovery information 121, the computer identifier "1" of the computer 1 is set in the computer identifier information 12-1 to indicate that it is the recovery information of the computer 1, and the update record management means 41 is arranged. The device name of the present device is set in the update record management means arrangement device name information 12-3.

【0050】計算機1は、業務処理を開始し、共有デー
タ20に対する更新要求が発生すると、排他手段11に
他の計算機が該共有データ20を使用しているという情
報が格納されているか否かを判定し(ステップ62)、
他の計算機が使用していないと判定した場合には、排他
手段11に自身が該共有データ20を使用する旨登録し
(ステップ63)、更新記録保持手段31に共有データ
20の更新前のデータを更新処理情報として出力した
(ステップ64)後、該共有データ20を更新する(ス
テップ65)。
The computer 1 starts the business process, and when an update request for the shared data 20 occurs, the computer 1 checks whether or not information indicating that another computer is using the shared data 20 is stored in the exclusive unit 11. Judge (step 62)
If it is determined that the shared data 20 is not being used by another computer, the exclusive unit 11 registers itself to use the shared data 20 (step 63), and the update record holding unit 31 stores the data before the update of the shared data 20. Is output as update processing information (step 64), and the shared data 20 is updated (step 65).

【0051】計算機1は、あるトランザクションの処理
が終了すると、更新記録保持手段31に保持する更新処
理情報に図示しない「リカバリ不要」の識別子を付す
(ステップ66)とともに、共有データ20を使用して
いる旨の情報を排他手段11から削除する(ステップ6
7)。
When the processing of a certain transaction is completed, the computer 1 attaches an unillustrated “recovery unnecessary” identifier to the update processing information held in the update record holding means 31 (step 66) and uses the shared data 20. Is deleted from the exclusive unit 11 (step 6).
7).

【0052】同様にして、業務処理を実施する計算機2
および計算機3においても、共有データ20へのアクセ
スを行いながら業務処理を行う。
Similarly, the computer 2 for executing the business process
Also, the computer 3 performs business processing while accessing the shared data 20.

【0053】計算機1において障害が発生すると、障害
通知手段50は、疎結合多重計算機システムを構成する
他の計算機2および計算機3に対して、計算機1の障害
発生を通知する。この通知には、障害を発生した計算機
1の計算機識別子「1」が含まれている。
When a failure occurs in the computer 1, the failure notifying means 50 notifies the other computers 2 and 3 constituting the loosely coupled multiple computer system of the occurrence of the failure in the computer 1. This notification includes the computer identifier “1” of the computer 1 in which the failure has occurred.

【0054】障害通知を受けた計算機2および計算機3
は、障害通知に含まれる計算機識別子「1」をキーにし
てリカバリ情報保持手段12内のリカバリ情報121を
識別し、さらに該リカバリ情報121のリカバリ処理状
態情報12−2内の復旧処理識別情報12−2−1が、
他の計算機により計算機1の復旧処理がすでに実施され
ていることを示しているか否かを判定する(ステップ7
1)。
Computer 2 and computer 3 that received the failure notification
Identifies the recovery information 121 in the recovery information holding unit 12 using the computer identifier “1” included in the failure notification as a key, and further identifies the recovery process identification information 12 in the recovery process status information 12-2 of the recovery information 121. -2-1 is
It is determined whether or not it indicates that the recovery processing of the computer 1 has already been performed by another computer (step 7).
1).

【0055】計算機2および計算機3は、計算機1の復
旧処理が未だ行われていないと判定した場合には、排他
手段11に登録されている計算機1が共有データ20を
使用している旨の情報を削除し(ステップ72)、自身
が使用する旨の情報を登録する(ステップ73)ととも
に、リカバリ情報121のリカバリ処理状態情報12−
2内の復旧処理識別情報12−2−1に復旧処理中であ
ることを示す「1」を設定し(ステップ74)、さらに
復旧処理計算機識別子情報12−2−2に自計算機の計
算機識別子(「2」または「3」)を設定することによ
り計算機1を復旧処理実施中の状態とし(ステップ7
5)、自計算機にて計算機1の復旧処理を開始する。
When the computer 2 and the computer 3 determine that the recovery processing of the computer 1 has not been performed yet, the information indicating that the computer 1 registered in the exclusion means 11 uses the shared data 20. Is deleted (step 72), information indicating that it is used by itself is registered (step 73), and the recovery processing state information 12- in the recovery information 121 is deleted.
2 is set to “1” indicating that the recovery process is being performed (Step 74), and the computer identifier of the own computer is set in the recovery process computer identifier information 12-2-2. By setting “2” or “3”, the computer 1 is brought into a state where the recovery processing is being performed (step 7).
5) The own computer starts the recovery process of the computer 1.

【0056】一方、障害が発生した計算機1のリカバリ
情報121がリカバリ情報保持手段12内に見つからな
い場合、もしくは、リカバリ情報121のリカバリ処理
状態情報12−2内の復旧処理識別情報12−2−1
が、他の計算機により計算機1の復旧処理がすでに実施
されていることを示している場合には、自計算機による
復旧処理は不要と判断し、復旧処理は行わない。
On the other hand, if the recovery information 121 of the failed computer 1 is not found in the recovery information holding means 12, or the recovery processing identification information 12-2- in the recovery processing status information 12-2 of the recovery information 121 is used. 1
However, if it indicates that the recovery processing of the computer 1 has already been performed by another computer, the recovery processing by the own computer is determined to be unnecessary, and the recovery processing is not performed.

【0057】次に計算機2および計算機3は、障害が発
生した計算機1の更新記録管理手段41を配置している
装置の装置名を、リカバリ情報121の更新記録管理手
段配置装置名情報12−3から取得し、この計算機1の
更新記録管理手段41を配置している装置を自計算機に
取り込む。
Next, the computer 2 and the computer 3 enter the device name of the device in which the update record management means 41 of the computer 1 in which the failure has occurred is assigned to the update record management means arrangement device name information 12-3 of the recovery information 121. And fetches the device in which the update record management means 41 of the computer 1 is arranged in its own computer.

【0058】さらに計算機2および計算機3は、取り込
んだ装置内の更新記録管理手段41を参照して、更新記
録保持手段31を配置している装置の装置名を得る(ス
テップ76)。
Further, the computer 2 and the computer 3 obtain the device name of the device in which the update record holding unit 31 is arranged by referring to the update record management unit 41 in the fetched device (step 76).

【0059】上述のとおり、この更新記録保持手段31
には、計算機1による共有データ20の更新処理情報が
格納されているが、この更新処理情報にはトランザクシ
ョンの処理が終了して「リカバリ不要」となっている情
報も含まれている。
As described above, this update record holding means 31
Stores the update processing information of the shared data 20 by the computer 1, and this update processing information also includes information indicating that the processing of the transaction has been completed and "recovery is unnecessary".

【0060】計算機2および計算機3は、更新記録保持
手段31に格納されている更新処理情報の内、「リカバ
リ不要」となっていないもの、すなわちトランザクショ
ンが中断したために共有データ20に対する更新処理が
中途半端になったことを示す更新処理情報を元にして、
該共有データ20を復旧する(ステップ77)。
The computer 2 and the computer 3 perform update processing on the shared data 20 in the update processing information stored in the update record holding unit 31 that is not “recovery unnecessary”, that is, the transaction is interrupted. Based on the update processing information indicating that it has become odd,
The shared data 20 is restored (step 77).

【0061】以上の復旧処理が終了したならば、計算機
2および計算機3は、共有データ20の復旧に用いた更
新記録保持手段31内の更新処理情報を「リカバリ不
要」とし(ステップ78)、排他手段11から自身が共
有データ20を使用している旨の情報を削除し(ステッ
プ79)、リカバリ情報保持手段12から計算機1のリ
カバリ情報121を削除し(ステップ7A)、さらに、
計算機1から取り込んだ更新記録管理手段41を保持す
る装置を自計算機から解放する(ステップ7B)。
When the above recovery processing is completed, the computer 2 and the computer 3 change the update processing information in the update record holding means 31 used for the recovery of the shared data 20 to “recovery unnecessary” (step 78), The information that the shared data 20 is used by itself is deleted from the means 11 (step 79), the recovery information 121 of the computer 1 is deleted from the recovery information holding means 12 (step 7A), and
The device holding the update record management means 41 fetched from the computer 1 is released from its own computer (step 7B).

【0062】このように他の計算機によって障害が発生
した計算機1によって更新された共有データ20が復旧
された後、該計算機1を再起動することができる。
After the shared data 20 updated by the computer 1 in which a failure has occurred by another computer is restored, the computer 1 can be restarted.

【0063】また、計算機1で障害が発生し、計算機2
が復旧処理を行っている途中において、計算機2にも障
害が発生した場合には、計算機2によって更新された共
有データ20の復旧処理を計算機3が行う。
When a failure occurs in the computer 1 and the computer 2
If a failure occurs in the computer 2 during the recovery process, the computer 3 performs the recovery process of the shared data 20 updated by the computer 2.

【0064】計算機3は、上述のとおり、計算機2によ
って更新された共有データ20を復旧するとともに、リ
カバリ情報保持手段12内に存在する計算機毎のリカバ
リ情報をサーチし、復旧処理識別情報12−2−1が1
で、かつ、復旧処理計算機識別情報12−2−2が障害
を発生した計算機2の計算機識別子である2となってい
るものが存在していた場合、このリカバリ情報(この場
合リカバリ情報121)に対応する計算機(計算機1)
によって更新された共有データ20をも復旧する必要が
あると認識し、これも同様に復旧する。
As described above, the computer 3 restores the shared data 20 updated by the computer 2, searches the recovery information for each computer existing in the recovery information holding means 12, and retrieves the recovery process identification information 12-2. -1 is 1
If there is a computer whose recovery processing computer identification information 12-2-2 is the computer identifier 2 of the computer 2 in which the failure has occurred, the recovery information (in this case, the recovery information 121) is included in the recovery information. Corresponding computer (Computer 1)
It recognizes that it is necessary to restore the shared data 20 updated as well, and this is also restored.

【0065】このようにして、復旧処理を行っている計
算機に障害が発生した場合でも、該計算機によって更新
された共有データを復旧することができる。
In this way, even if a failure occurs in the computer performing the recovery process, the shared data updated by the computer can be recovered.

【0066】すべての計算機は、自身に障害が発生せず
に業務処理の終了を行う場合に、排他手段11から自身
が共有データ20を使用している旨の情報を削除し、リ
カバリ情報保持手段12から、自計算機のリカバリ情報
を削除する。例えば、計算機1が業務処理を終了する
時、計算機1のリカバリ情報121をリカバリ情報保持
手段12から削除する。
All the computers delete the information indicating that they are using the shared data 20 from the exclusion unit 11 and terminate the business process without causing a failure in the computer. 12, the recovery information of the own computer is deleted. For example, when the computer 1 ends the business process, the recovery information 121 of the computer 1 is deleted from the recovery information holding unit 12.

【0067】以降、計算機1にて障害が発生し、障害通
知手段50により計算機2および計算機3に、その障害
発生が通知されても、リカバリ情報保持手段12内に計
算機1のリカバリ情報121が存在しないため、計算機
2、計算機3のいずれの計算機も計算機1の復旧処理を
行わない。
After that, even if a failure occurs in the computer 1 and the failure notification unit 50 notifies the computer 2 and the computer 3 of the occurrence of the failure, the recovery information 121 of the computer 1 exists in the recovery information holding unit 12. Therefore, neither the computer 2 nor the computer 3 performs the recovery process of the computer 1.

【0068】以上により、本発明の一実施例である疎結
合多重計算機システムにおける障害復旧システムの処理
が終了する。
With the above, the processing of the failure recovery system in the loosely coupled multiple computer system according to one embodiment of the present invention is completed.

【0069】本発明の一実施例である疎結合多重計算機
システムにおける障害復旧システムは、疎結合多重計算
機システムを構成する計算機のいずれかに障害が発生し
ても、他に正常に動作している計算機が存在している場
合にはそれらの内のいずれかの計算機によって、障害が
発生した計算機によって更新されたデータを更新前の状
態に復旧することができる効果を有している。
The failure recovery system in the loosely coupled multi-computer system according to one embodiment of the present invention operates normally even if a failure occurs in any of the computers constituting the loosely coupled multi-computer system. When a computer exists, there is an effect that any one of the computers can restore the data updated by the failed computer to the state before the update.

【0070】また、本発明の他の実施例である疎結合多
重計算機システムにおける障害復旧プログラムは、上述
した障害復旧システムと同等の処理を行うことができ、
さらに該プログラムは、メモリ、ディスク、フロッピー
ディスク、およびCD−ROM等の記憶媒体に記憶する
ことができる。
Further, the failure recovery program in the loosely coupled multiple computer system according to another embodiment of the present invention can perform the same processing as the above-described failure recovery system.
Further, the program can be stored in a storage medium such as a memory, a disk, a floppy disk, and a CD-ROM.

【0071】[0071]

【発明の効果】以上説明したように、本発明の疎結合多
重計算機システムにおける障害復旧システム、障害復旧
方法、および障害復旧プログラムを記憶する媒体によれ
ば、疎結合多重計算機システムを構成する計算機のいず
れかに障害が発生しても、利用者が該障害により影響を
受けることなく業務を続行することができる信頼性の高
い計算機システムを提供することができる効果を有して
いる。
As described above, according to the failure recovery system, the failure recovery method, and the medium for storing the failure recovery program in the loosely-coupled multiple computer system of the present invention, the computer constituting the loosely-coupled multiple computer system can be used. Even if a failure occurs in any of them, there is an effect that it is possible to provide a highly reliable computer system that allows a user to continue work without being affected by the failure.

【0072】また、疎結合多重計算機システムを構成す
る計算機のいずれかに障害が発生しても、他に正常に動
作している計算機が存在している場合にはそれらの内の
いずれかの計算機によって、障害が発生した計算機によ
って更新されたデータを更新前の状態に復旧することが
できる効果を有している。
Further, even if a failure occurs in any of the computers constituting the loosely-coupled multiple computer system, if there is another normally operating computer, any of the computers operates. Thus, the data updated by the failed computer can be restored to the state before the update.

【0073】さらに、障害が発生した計算機によって更
新されたデータを更新前の状態に復旧する計算機が、該
復旧処理を行うために必要とする情報を障害が発生する
前に受け取っておくという、事前の準備処理が不要とな
る効果を有している。
Further, the computer which restores the data updated by the failed computer to the state before the update receives the information necessary for performing the recovery processing before the failure occurs. This has the effect that the preparation processing of the above becomes unnecessary.

【0074】さらに、計算機間をチャネルおよび通信回
線によって接続する必要がないため、安価な疎結合多重
計算機システムを構築することができるという効果を有
している。
Further, since there is no need to connect the computers by channels and communication lines, there is an effect that an inexpensive loosely coupled multiplex computer system can be constructed.

【図面の簡単な説明】[Brief description of the drawings]

【図1】図1は本発明の一実施例である疎結合多重計算
機システムにおける障害復旧システムの構成を示す図で
ある。
FIG. 1 is a diagram showing a configuration of a failure recovery system in a loosely coupled multiple computer system according to an embodiment of the present invention.

【図2】図2は本発明の一実施例におけるリカバリ情報
保持手段12の内容を示す図である。
FIG. 2 is a diagram showing the contents of a recovery information holding means 12 according to one embodiment of the present invention.

【図3】図3は本発明の一実施例におけるリカバリ情報
121、122、および123の内容を示す図である。
FIG. 3 is a diagram showing contents of recovery information 121, 122, and 123 in one embodiment of the present invention.

【図4】図4は本発明の一実施例におけるリカバリ処理
状態情報12−2の内容を示す図である。
FIG. 4 is a diagram showing the contents of recovery processing status information 12-2 in one embodiment of the present invention.

【図5】図5は本発明の一実施例における計算機1の共
有データ20に対する更新処理を示す流れ図である。
FIG. 5 is a flowchart showing an update process for the shared data 20 of the computer 1 in one embodiment of the present invention.

【図6】図6は本発明の一実施例における計算機2およ
び計算機3が計算機によって更新された共有データ20
を更新前の状態に復旧する処理を示す流れ図である。
FIG. 6 is a diagram illustrating shared data 20 updated by the computers 2 and 3 according to an embodiment of the present invention.
9 is a flowchart showing a process for restoring the state before updating.

【符号の説明】[Explanation of symbols]

1 計算機 2 計算機 3 計算機 10 多重計算機制御手段 11 排他手段 12 リカバリ情報保持手段 20 共有データ 31 更新記録保持手段 32 更新記録保持手段 33 更新記録保持手段 41 更新記録管理手段 42 更新記録管理手段 43 更新記録管理手段 50 障害通知手段 121 計算機1のリカバリ情報 122 計算機1のリカバリ情報 123 計算機1のリカバリ情報 12−1 計算機識別子情報 12−2 リカバリ処理状態情報 12−3 更新記録管理手段配置装置名情報 12−2−1 復旧処理識別情報 12−2−2 復旧処理計算機識別情報 REFERENCE SIGNS LIST 1 computer 2 computer 3 computer 10 multi-computer control means 11 exclusive means 12 recovery information holding means 20 shared data 31 update record holding means 32 update record holding means 33 update record holding means 41 update record management means 42 update record management means 43 update record Management means 50 failure notification means 121 recovery information of computer 1 122 recovery information of computer 1 123 recovery information of computer 1 12-1 computer identifier information 12-2 recovery processing state information 12-3 update record management means arrangement device name information 12- 2-1 Recovery process identification information 12-2-2 Recovery process computer identification information

Claims (18)

(57)【特許請求の範囲】 (57) [Claims] 【請求項1】 複数の計算機と、A plurality of computers; 前記複数の計算機間で共有される共有データと、Shared data shared among the plurality of computers, 前記複数の計算機毎に、前記共有データの更新前の状態The state before updating the shared data for each of the plurality of computers
を更新処理情報として保持する更新記録保持手段と、Update record holding means for holding as update processing information, 前記複数の計算機のいずれかに何らかの障害が発生したSome failure has occurred in any of the above computers
ことを、障害が発生していない他の計算機に通知する障Notification to other computers that have not failed.
害通知手段とを備え、Harm notification means, 前記複数の計算機のそれぞれは、Each of the plurality of computers, 業務実施時において、前記共有データの更新前の状態をAt the time of business operation, the state before updating the shared data
前記更新処理情報として前記更新記録保持手段に格納しStored in the update record holding means as the update processing information
た後に、該共有データを更新し、After updating the shared data, 業務終了時において、前記更新処理情報を削除することAt the end of work, delete the update processing information
を特徴とする疎結合多重計算機システムにおける障害復Recovery in loosely coupled multi-computer systems characterized by
旧システム。Old system.
【請求項2】 前記複数の各計算機のそれぞれは、さら2. Each of the plurality of computers further comprises:
に、To 前記障害通知手段から他の計算機に障害が発生した旨のThe failure notification means indicates that another computer has failed.
通知を受信した時に、該他の計算機の前記更新記録保持When the notification is received, the update record of the other computer is retained.
手段に格納されている前記更新処理情報を元にして前記Based on the update processing information stored in the means
共有データを更新前の状態に復旧することを特徴とするRecover shared data to the state before update
請求項1記載の疎結合多重計算機システムにおける障害A fault in the loosely coupled multiple computer system according to claim 1.
復旧システム。Recovery system.
【請求項3】 複数の計算機と、3. A plurality of computers, 前記複数の計算機間で共有される共有データと、Shared data shared among the plurality of computers, 前記複数の計算機毎に、前記共有データの更新前の状態The state before updating the shared data for each of the plurality of computers
を更新処理情報として保持する更新記録保持手段と、Update record holding means for holding as update processing information, 前記共有データに対して更新処理を行っている計算機のOf a computer that is performing an update process on the shared data
識別子を登録する排他手段と、An exclusive unit for registering an identifier; 前記複数の計算機のいずれかに何らかの障害が発生したSome failure has occurred in any of the above computers
ことを、障害が発生していない他の計算機に通知する障Notification to other computers that have not failed.
害通知手段とを備え、Harm notification means, 前記複数の計算機のそれぞれは、Each of the plurality of computers, 業務実施時において、前記排他手段に他の計算機の識別At the time of business operation, the exclusive unit identifies another computer
子が登録されていない場合にのみ、該排他手段に自計算Only when the child is not registered, the exclusive means
機の識別子を登録し、前記共有データの更新前の状態をRegister the identifier of the device and check the status before updating the shared data.
前記更新処理情報として前記更新記録保持手段に格納しStored in the update record holding means as the update processing information
た後に、該共有After the share データを更新し、Update the data, 業務終了時において、前記更新処理情報を削除し、前記At the end of work, delete the update processing information,
排他手段から自計算機の識別子を削除することを特徴とIt is characterized by deleting the identifier of its own computer from exclusive means
する疎結合多重計算機システムにおける障害復旧システRecovery system in a loosely coupled multi-computer system
ム。M
【請求項4】 前記複数の各計算機のそれぞれは、さら4. Each of the plurality of computers further comprises:
に、To 前記障害通知手段から他の計算機に障害が発生した旨のThe failure notification means indicates that another computer has failed.
通知を受信した時に、前記排他手段に登録されている該When the notification is received, the
他の計算機の識別子を削除して自計算機の識別子を登録Delete the identifier of the other computer and register the identifier of the own computer
し、該他の計算機の前記更新記録保持手段に格納されてAnd stored in the update record holding means of the other computer.
いる前記更新処理情報を元にして前記共有データを更新Update the shared data based on the update processing information
前の状態に復旧し、前記排他手段に登録されている自計The previous status is restored, and the total
算機の識別子を削除することを特徴とする請求項3記載4. The method according to claim 3, wherein the identifier of the computer is deleted.
の疎結合多重計算機システムにおける障害復旧システRecovery System for Loosely Coupled Multiple Computer Systems
ム。M
【請求項5】 複数の計算機と、5. A plurality of computers, 前記複数の計算機間で共有される共有データと、Shared data shared among the plurality of computers, 前記複数の計算機毎に、前記共有データの更新前の状態The state before updating the shared data for each of the plurality of computers
を更新処理情報として保持する更新記録保持手段と、Update record holding means for holding as update processing information, 前記共有データに対して更新処理を行っている計算機のOf a computer that is performing an update process on the shared data
識別子を登録する排他手段と、An exclusive unit for registering an identifier; 前記複数の計算機毎に、該計算機の識別子と該計算機のFor each of the plurality of computers, an identifier of the computer and a
復旧処理が行われているか否かを示す情報とを含むリカInformation indicating whether or not recovery processing is being performed.
バリ情報と、Bali information and 前記複数の計算機のいずれかに何らかの障害が発生したSome failure has occurred in any of the above computers
ことを、障害が発生していない他の計算機に通知する障Notification to other computers that have not failed.
害通知手段とを備え、Harm notification means, 前記複数の計算機のそれぞれは、Each of the plurality of computers, 業務実施時において、前記排他手段に他の計算機の識別At the time of business operation, the exclusive unit identifies another computer
子が登録されていない場合にのみ、該排他手段に自計算Only when the child is not registered, the exclusive means
機の識別子を登録し、前記共有データの更新前の状態をRegister the identifier of the device and check the status before updating the shared data.
前記更新処理情報として前記更新記録保持手段に格納しStored in the update record holding means as the update processing information
た後に、該共有データを更新し、After updating the shared data, 業務終了時において、前記更新処理情報にリカバリ不要No recovery is required for the update processing information at the end of business
の識別子を付し、前記排他手段から自計算機の識別子をOf the own computer from the exclusive means.
削除することを特徴とする疎結合多重計算機システムにA loosely coupled multi-computer system characterized by deletion
おける障害復旧システム。Disaster recovery system.
【請求項6】 前記複数の計算機のそれぞれは、さら6. Each of the plurality of computers further comprises:
に、To 前記障害通知手段から他の計算機に障害が発生した旨のThe failure notification means indicates that another computer has failed.
通知を受信した時に、該他の計算機の前記リカバリ情報When receiving the notification, the recovery information of the other computer
を参照して復旧処理が行われているか否かを判定し、復To determine whether or not recovery processing is being performed.
旧処理が行われていないと判定した場合には、前記排他If it is determined that the old process has not been performed, the exclusive
手段に登録されている該他の計算機の識別子を削除してDelete the identifier of the other computer registered in the means
自計算機の識別子を登録し、該他の計算機の前記リカバRegister the identifier of the own computer, and perform the recovery of the other computer.
リ情報に復旧処理を行う旨を登録し、該他の計算機の前Registered that recovery processing is to be performed, in front of the other computer.
記更新記録保持手段に格納されている前記更新処理情報The update processing information stored in the update record holding means
の内、リカバリ不要の識別子が付されていないものを元Of those that do not have an identifier that does not require recovery
にして前記共有データを更新前の状態に復旧し、該更新To restore the shared data to the state before the update,
処理情報にリカバリ不要の識別子を付し、前記排他手段The processing information is given an identifier that does not require recovery, and the exclusive unit
に登録されている自計算機の識別子を削除し、該他の計Deletes the identifier of the computer registered in the
算機の前記リカバリ情報を削除することを特徴とする請A contract for deleting the recovery information of the computer.
求項5記載の疎結合多重計算機システムにおける障害復Failure recovery in a loosely coupled multiple computer system according to claim 5
旧システム。Old system.
【請求項7】 複数の計算機と、7. A plurality of computers, 前記複数の計算機間で共有される共有データと、Shared data shared among the plurality of computers, 前記複数の計算機毎に、前記共有データの更新前の状態The state before updating the shared data for each of the plurality of computers
を更新処理情報として保持する更新記録保持手段と、Update record holding means for holding as update processing information, 前記複数の計算機毎に、前記更新記録保持手段が設定さThe update record holding unit is set for each of the plurality of computers.
れている装置の装置名を保持する更新記録管理手段と、Update record management means for holding the device name of the device being 前記共有データに対して更新処理を行っている計算機のOf a computer performing an update process on the shared data
識別子を登録する排他手段と、An exclusive unit for registering an identifier; 前記複数の計算機毎に、該計算機の識別子、該計算機がFor each of the plurality of computers, an identifier of the computer,
保持している前記更新記録管理手段が設定されている装The device in which the update record management means is set.
置の装置名、該計算機の復旧処理が行われているか否かDevice name and whether or not the computer has been restored
を示す情報、および該復旧処理を行っている他の計算機Indicating that the other computer is performing the recovery process
の計算機識別子を含むリカバリ情報と、Recovery information including the computer identifier of 前記複数の計算機のいずれかに何らかの障害が発生したSome failure has occurred in any of the above computers
ことを、障害が発生していない他の計算機に通知する障Notification to other computers that have not failed.
害通知手段とを備え、Harm notification means, 前記複数の計算機のぞれぞれは、Each of the plurality of computers, 業務開始時において、自計算機の識別子と自計算機の前At the start of business, the identifier of the local computer and the location before the local computer
記更新記録管理手段を設定した装置の装置名を格納したThe device name of the device for which the update record management means is set is stored.
前記リカバリ情報を作成し、Creating the recovery information, 業務実施時において、前記排他手段に他の計算機の識別At the time of business operation, the exclusive unit identifies another computer
子が登録されていないChild not registered 場合にのみ、該排他手段に自計算Only if the self-calculation
機の識別子を登録し、前記共有データの更新前の状態をRegister the identifier of the device and check the status before updating the shared data.
前記更新処理情報として前記更新記録保持手段に格納しStored in the update record holding means as the update processing information
た後に、該共有データを更新し、After updating the shared data, 業務終了時において、前記更新処理情報にリカバリ不要No recovery is required for the update processing information at the end of business
の識別子を付し、前記排他手段から自計算機の識別子をOf the own computer from the exclusive means.
削除することを特徴とする疎結合多重計算機システムにA loosely coupled multi-computer system characterized by deletion
おける障害復旧システム。Disaster recovery system.
【請求項8】 前記複数の計算機のそれぞれは、さら8. Each of the plurality of computers further comprises:
に、To 前記障害通知手段から他の計算機に障害が発生した旨のThe failure notification means indicates that another computer has failed.
通知を受信した時に、該他の計算機の前記リカバリ情報When receiving the notification, the recovery information of the other computer
を参照して復旧処理が行われているか否かを判定し、復To determine whether or not recovery processing is being performed.
旧処理が行われていないと判定した場合には、前記排他If it is determined that the old process has not been performed, the exclusive
手段に登録されている該他の計算機の識別子を削除してDelete the identifier of the other computer registered in the means
自計算機の識別子を登録し、該他の計算機の前記リカバRegister the identifier of the own computer, and perform the recovery of the other computer.
リ情報に復旧処理を行う旨および自計算機の識別子を登The recovery information and the identifier of the computer.
録し、該他の計算機の前記リカバリ情報を参照して前記Record, refer to the recovery information of the other computer, and
更新記録保持手段が設定されている装置の装置名を認識Recognize the device name of the device for which update record holding means is set
し、該更新記録保持手段に格納されている前記更新処理And the update processing stored in the update record holding means.
情報の内、リカバリ不要の識別子が付されていないものInformation that does not have an identifier that does not require recovery
を元にして前記共有データを更新前の状態に復旧し、該The shared data is restored to the state before the update based on the
更新処理情報にリカバリ不要の識別子を付し、前記排他The update processing information is given an identifier that does not require recovery, and the exclusive
手段に登録されている自計算機の識別子を削除し、該他Deletes the identifier of the own computer registered in the
の計算機の前記リカバリ情報を削除することを特徴とすThe recovery information of the computer is deleted.
る請求項7記載の疎結合多重計算機システムにおける障The fault in the loosely coupled multiple computer system according to claim 7.
害復旧システム。Harm recovery system.
【請求項9】 前記複数の計算機のそれぞれは、さら9. Each of the plurality of computers further comprises:
に、To 前記障害通知手段から他の計算機に障害が発生した旨のThe failure notification means indicates that another computer has failed.
通知を受信した時に、該他の計算機が復旧処理を行ってWhen receiving the notification, the other computer performs recovery processing
いる旨登録されている前記リカバリ情報が存在するか否Whether the recovery information registered to be
かを判定し、存在する場合には、該リカバリ情報に対応And if it exists, respond to the recovery information
する計算機によって更新された前記共有データについてThe shared data updated by the computer
も、該他の計算機によって更新された該共有データを復Also restores the shared data updated by the other computer.
旧する処理と同様にして、更新前の状態に復旧することRestore to the state before the update in the same way as the old process
を特徴とする請求項8記載の疎結合多重計算機システム9. The loosely-coupled multi-computer system according to claim 8, wherein
における障害復旧システム。Disaster recovery system.
【請求項10】 複数の計算機と、該複数の計算機間で10. A plurality of computers and a plurality of computers.
共有される共有データと、該複数の各計算機毎に、前記The shared data to be shared and the plurality of computers,
共有データの更新前の状態を更新処理情報として保持すRetain the state of shared data before update as update processing information
る更新記録保持手段と、前記複数の計算機のいずれかにUpdate record holding means, and one of the plurality of computers.
何らかの障害Any obstacle が発生したことを、障害が発生していないThat no fault has occurred
他の計算機に通知する障害通知手段とを備えた疎結合多Loosely coupled multi-function with failure notification means for notifying other computers
重計算機システムにおいて、In heavy computer systems, 前記複数の計算機のそれぞれは、Each of the plurality of computers, 業務実施時において、前記共有データの更新前の状態をAt the time of business operation, the state before updating the shared data
前記更新処理情報として前記更新記録保持手段に格納しStored in the update record holding means as the update processing information
た後に、該共有データを更新し、After updating the shared data, 業務終了時において、前記更新処理情報を削除することAt the end of work, delete the update processing information
を特徴とする疎結合多重計算機システムにおける障害復Recovery in loosely coupled multi-computer systems characterized by
旧方法。Old method.
【請求項11】 前記複数の計算機のそれぞれは、さら11. Each of the plurality of computers further comprises:
に、To 前記障害通知手段から他の計算機に障害が発生した旨のThe failure notification means indicates that another computer has failed.
通知を受信した時に、該他の計算機の前記更新記録保持When the notification is received, the update record of the other computer is retained.
手段に格納されている前記更新処理情報を元にして前記Based on the update processing information stored in the means
共有データを更新前の状態に復旧することを特徴とするRecover shared data to the state before update
請求項10記載の疎結合多重計算機システムにおける障An obstacle in the loosely coupled multiple computer system according to claim 10.
害復旧方法。Damage recovery method.
【請求項12】 複数の計算機と、該複数の計算機間で12. A plurality of computers and a communication between the plurality of computers.
共有される共有データと、該複数の計算機毎に、前記共The shared data to be shared and the shared
有データの更新前の状態を更新処理情報として保持するRetain the state of existing data before update as update processing information
更新記録保持手段と、前記共有データに対して更新処理Update record holding means and update processing for the shared data
を行っている計算機の識別子を登録する排他手段と、前Exclusive means for registering the identifier of the computer performing the
記複数の計算機のいずれかに何らかの障害が発生したこNote that some sort of failure has occurred in any of the computers.
とを、障害が発生していない他の計算機に通知する障害To notify other computers where no failure has occurred
通知手段とを備えた疎結合多重計算機システムにおいLoosely coupled multi-computer system with notification means
て、hand, 前記複数の計算機のそれぞれは、Each of the plurality of computers, 業務実施時において、前記排他手段に他の計算機の識別At the time of business operation, the exclusive unit identifies another computer
子が登録されていない場合にのみ、該排他手段に自計算Only when the child is not registered, the exclusive means
機の識別子を登録し、前記共有データの更新前の状態をRegister the identifier of the device and check the status before updating the shared data.
前記更新処理情報として前記更新記録保持手段に格納しStored in the update record holding means as the update processing information
た後に、該共有データを更新し、After updating the shared data, 業務終了時において、前記更新処理情報を削除し、前記At the end of work, delete the update processing information,
排他手段から自計算機の識別子を削除することを特徴とIt is characterized by deleting the identifier of its own computer from exclusive means
する疎結合多重計算機システムにおける障害復旧方法。Recovery method in a loosely coupled multiple computer system.
【請求項13】 前記複数の計算機のそれぞれは、さら13. Each of the plurality of computers further comprises:
に、To 前記障害通知手段から他の計算機に障害が発生した旨のThe failure notification means indicates that another computer has failed.
通知を受信した時に、前記排他手段に登録されている該When the notification is received, the
他の計算機の識別子を削除して自計算機の識別Identify own computer by deleting identifier of other computer 子を登録Register child
し、該他の計算機の前記更新記録保持手段に格納されてAnd stored in the update record holding means of the other computer.
いる前記更新処理情報を元にして前記共有データを更新Update the shared data based on the update processing information
前の状態に復旧し、前記排他手段に登録されている自計The previous status is restored, and the total
算機の識別子を削除することを特徴とする請求項12記13. The method according to claim 12, wherein the identifier of the computer is deleted.
載の疎結合多重計算機システムにおける障害復旧方法。Recovery method in the loosely coupled multi-computer system described above.
【請求項14】 複数の計算機と、前記複数の計算機間14. A plurality of computers, and between the plurality of computers
で共有される共有データと、前記複数の計算機毎に、前And the shared data shared by the plurality of computers,
記共有データの更新前の状態を更新処理情報として保持Retain the state of shared data before update as update processing information
する更新記録保持手段と、前記共有データに対して更新Update record holding means for updating the shared data
処理を行っている計算機の識別子を登録する排他手段Exclusive means for registering the identifier of the computer performing the processing
と、前記複数の計算機毎に、該計算機の識別子と該計算And, for each of the plurality of computers, an identifier of the computer and the
機の復旧処理が行われているか否かを示す情報とを含むInformation indicating whether or not the machine has been restored.
リカバリ情報と、前記複数の計算機のいずれかに何らかRecovery information and any information on any of the computers
の障害が発生したことを、障害が発生していない他の計The failure of one of the
算機に通知する障害通知手段とを備えた疎結合多重計算Loosely-coupled multiple computation with fault notification means for notifying the computer
機システムにおいて、Machine system, 前記複数の計算機のそれぞれは、Each of the plurality of computers, 業務実施時において、前記排他手段に他の計算機の識別At the time of business operation, the exclusive unit identifies another computer
子が登録されていない場合にのみ、該排他手段に自計算Only when the child is not registered, the exclusive means
機の識別子を登録し、前記共有データの更新前の状態をRegister the identifier of the device and check the status before updating the shared data.
前記更新処理情報として前記更新記録保持手段に格納しStored in the update record holding means as the update processing information
た後に、該共有データを更新し、After updating the shared data, 業務終了時において、前記更新処理情報にリカバリ不要No recovery is required for the update processing information at the end of business
の識別子を付し、前記排他手段から自計算機の識別子をOf the own computer from the exclusive means.
削除することを特徴とする疎結合多重計算機システムにA loosely coupled multi-computer system characterized by deletion
おける障害復旧方法。Disaster recovery method.
【請求項15】 前記複数の計算機のそれぞれは、さら15. Each of the plurality of computers further comprises:
に、To 前記障害通知手段から他の計算機に障害が発生した旨のThe failure notification means indicates that another computer has failed.
通知を受信した時に、該他の計算機の前記リカバリ情報When receiving the notification, the recovery information of the other computer
を参照して復旧処理が行われているか否かを判定し、復To determine whether or not recovery processing is being performed.
旧処理が行われていないと判定した場合には、前記排他If it is determined that the old process has not been performed, the exclusive
手段に登録されている該他の計算機の識別子を削除してDelete the identifier of the other computer registered in the means
自計算機の識別子を登録し、該他の計算機の前記リカバRegister the identifier of the own computer, and perform the recovery of the other computer.
リ情報に復旧処理を行う旨を登録し、該他の計算機の前Registered that recovery processing is to be performed, in front of the other computer.
記更新記録保持手段に格納されている前記更新処理情報The update processing information stored in the update record holding means
の内、リカバリ不要の識別子が付されていないものを元Of those that do not have an identifier that does not require recovery
にして前記共有データを更新前の状態に復旧し、該更新To restore the shared data to the state before the update,
処理情報にリカバリ不要の識別子を付し、前記排他手段The processing information is given an identifier that does not require recovery, and the exclusive unit
に登録されている自計算機Your computer registered in の識別子を削除し、該他の計Delete the identifier of
算機の前記リカバリ情報を削除することを特徴とする請A contract for deleting the recovery information of the computer.
求項14記載の疎結合多重計算機システムにおける障害Failure in the loosely coupled multi-computer system according to claim 14.
復旧方法。Recovery method.
【請求項16】 複数の計算機と、前記複数の計算機間16. A plurality of computers, and between the plurality of computers
で共有される共有データと、前記複数の計算機毎に、前And the shared data shared by the plurality of computers,
記共有データの更新前の状態を更新処理情報として保持Retain the state of shared data before update as update processing information
する更新記録保持手段と、前記複数の計算機毎に、前記Update record holding means, and for each of the plurality of computers,
更新記録保持手段が設定されている装置の装置名を保持Holds the device name of the device for which update record holding means is set
する更新記録管理手段と、前記共有データに対して更新Update record management means for updating the shared data
処理を行っている計算機の識別子を登録する排他手段Exclusive means for registering the identifier of the computer performing the processing
と、前記複数の計算機毎に、該計算機の識別子、該計算And, for each of the plurality of computers, an identifier of the computer,
機が保持している前記更新記録管理手段が設定されていThe update record management means held by the
る装置の装置名、該計算機の復旧処理が行われているかName of the device to be restarted and whether the computer has been restored
否かを示す情報、および該復旧処理を行っている他の計Information indicating whether or not other
算機の計算機識別子を含むリカバリ情報と、前記複数のRecovery information including a computer identifier of the computer;
計算機のいずれかに何らかの障害が発生したことを、障If any of the computers have failed,
害が発生していない他の計算機に通知する障害通知手段Failure notification means for notifying other computers that have not caused harm
とを備えた疎結合多重計算機システムにおいて、In a loosely coupled multi-computer system having 前記複数の計算機のそれぞれは、Each of the plurality of computers, 業務開始時において、自計算機の識別子と自計算機の前At the start of business, the identifier of the local computer and the location before the local computer
記更新記録管理手段を設定した装置の装置名を格納したThe device name of the device for which the update record management means is set is stored.
前記リカバリ情報を作成し、Creating the recovery information, 業務実施時において、前記排他手段に他の計算機の識別At the time of business operation, the exclusive unit identifies another computer
子が登録されていない場合にのみ、該排他手段に自計算Only when the child is not registered, the exclusive means
機の識別子を登録し、前記共有データの更新前の状態をRegister the identifier of the device and check the status before updating the shared data.
前記更新処理情報として前記更新記録保持手段に格納しStored in the update record holding means as the update processing information
た後に、該共有データを更新し、After updating the shared data, 業務終了時において、前記更新処理情報にリカバリ不要No recovery is required for the update processing information at the end of business
の識別子を付し、前記排他手段から自計算機の識別子をOf the own computer from the exclusive means.
削除することを特徴とする疎結合多重計算機システムにA loosely coupled multi-computer system characterized by deletion
おける障害復旧方法。Disaster recovery method.
【請求項17】 前記複数の計算機のそれぞれは、さら
に、 前記障害通知手段から他の計算機に障害が発生した旨の
通知を受信した時に、該他の計算機の前記リカバリ情報
を参照して復旧処理が行われているか否かを判定し、復
旧処理が行われていないと判定した場合には、前記排他
手段に登録されている該他の計算機の識別子を削除して
自計算機の識別子を登録し、該他の計算機の前記リカバ
リ情報に復旧処理を行う旨および自計算機の識別子を登
録し、該他の計算機の前記リカバリ情報を参照して前記
更新記録保持手段が設定されている装置の装置名を認識
し、該更新記録保持手段に格納されている前記更新処理
情報の内、リカバリ不要の識別子が付されていないもの
を元にして前記共有データを更新前の状態に復旧し、該
更新処理情報にリカバリ不要の識別子を付し、前記排他
手段に登録されている自計算機の識別子を削除し、該他
の計算機の前記リカバリ情報を削除することを特徴とす
る請求項16記載の疎結合多重計算機システムにおける
障害復旧方法。
17. Each of the plurality of computers further comprises:
In, when the fault from the fault notifying means other computer receiving the notification of the occurrence, and determines whether the recovery process with reference to the recovery information of the other computers is being performed, the recovery processing If it is determined that has not been performed, the identifier of the other computer registered in the exclusion means is deleted, the identifier of the own computer is registered, and a recovery process is performed on the recovery information of the other computer. Registering the effect and registering the identifier of the own computer, referring to the recovery information of the other computer, recognizing the device name of the device in which the update record holding unit is set, and storing the update name in the update record holding unit Restoring the shared data to the state before the update based on the update processing information having no recovery-unnecessary identifier attached thereto, and attaching the recovery-unnecessary identifier to the update processing information, Registered in And which removes the identifier of the computer, failure recovery method in a loosely coupled multi-computer system according to claim 16, wherein the deleting the recovery information of the other computer.
【請求項18】 前記複数の計算機のそれぞれは、さら18. Each of the plurality of computers further comprises:
に、To 前記障害通知手段から他の計算機に障害が発生した旨のThe failure notification means indicates that another computer has failed.
通知を受信した時に、該他の計算機が復旧処理を行ってWhen receiving the notification, the other computer performs recovery processing
いる旨登録されている前記リカバリ情報が存在するか否Whether the recovery information registered to be
かを判定し、存在する場合には、該リカバリ情報に対応And if it exists, respond to the recovery information
する計算機によって更新された前記共有データについてThe shared data updated by the computer
も、該他の計算機によって更新された該共有データを復Also restores the shared data updated by the other computer.
旧する処理と同様にして、更新前の状態に復旧することRestore to the state before the update in the same way as the old process
を特徴とする請求項17記載の疎結合多重計算機システ18. The loosely-coupled multi-computer system according to claim 17, wherein
ムにおける障害復旧方法。Recovery method in the system.
JP8105201A 1995-05-17 1996-04-25 Fault recovery system, fault recovery method, and medium for storing fault recovery program in loosely coupled multi-computer system Expired - Lifetime JP2959467B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8105201A JP2959467B2 (en) 1995-05-17 1996-04-25 Fault recovery system, fault recovery method, and medium for storing fault recovery program in loosely coupled multi-computer system

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP7-118084 1995-05-17
JP11808495 1995-05-17
JP8105201A JP2959467B2 (en) 1995-05-17 1996-04-25 Fault recovery system, fault recovery method, and medium for storing fault recovery program in loosely coupled multi-computer system

Publications (2)

Publication Number Publication Date
JPH0934853A JPH0934853A (en) 1997-02-07
JP2959467B2 true JP2959467B2 (en) 1999-10-06

Family

ID=26445536

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8105201A Expired - Lifetime JP2959467B2 (en) 1995-05-17 1996-04-25 Fault recovery system, fault recovery method, and medium for storing fault recovery program in loosely coupled multi-computer system

Country Status (1)

Country Link
JP (1) JP2959467B2 (en)

Also Published As

Publication number Publication date
JPH0934853A (en) 1997-02-07

Similar Documents

Publication Publication Date Title
US7934262B1 (en) Methods and apparatus for virus detection using journal data
EP1569120B1 (en) Computer system for recovering data based on priority of the data
US7860836B1 (en) Method and apparatus to recover data in a continuous data protection environment using a journal
US7565572B2 (en) Method for rolling back from snapshot with log
US7747830B2 (en) Backup system with continuous data protection
JP5021929B2 (en) Computer system, storage system, management computer, and backup management method
KR100983300B1 (en) Recovery from failures within data processing systems
US20040093358A1 (en) File system for creating switched logical I/O paths for fault recovery
CN110807064B (en) Data recovery device in RAC distributed database cluster system
JP2001356945A (en) Data backup recovery system
JP2005196683A (en) Information processing system, information processor and control method of information processing system
US7418624B2 (en) Hot standby system
JP2000194678A (en) Asynchronous i/o highly available in cluster computer system
CN114356650A (en) Data backup method, device, equipment, system and storage medium
JP2959467B2 (en) Fault recovery system, fault recovery method, and medium for storing fault recovery program in loosely coupled multi-computer system
US5761403A (en) Failure recovery system and failure recovery method in loosely coupled multi-computer system, and medium for storing failure recovery program
CN111090491B (en) Virtual machine task state recovery method and device and electronic equipment
JP4464872B2 (en) Computer system and computer control method
JPH1040123A (en) System and method for job management
US9152817B1 (en) Methods and systems for performing data protection operations
JPH08335206A (en) Automatic transaction restoration system of loosely coupled multicomputer system
CN114880319A (en) Method and device for backing up index
JP2594761B2 (en) Journal file management device
CN111563010A (en) Data synchronization method, system and storage medium based on dual-computer redundancy system
JP2850757B2 (en) Failure handling method in hierarchical file system

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19990629

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070730

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080730

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090730

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100730

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110730

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110730

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120730

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120730

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130730

Year of fee payment: 14

EXPY Cancellation because of completion of term