JPH05189168A - System for automatically recovering fault track - Google Patents

System for automatically recovering fault track

Info

Publication number
JPH05189168A
JPH05189168A JP4024574A JP2457492A JPH05189168A JP H05189168 A JPH05189168 A JP H05189168A JP 4024574 A JP4024574 A JP 4024574A JP 2457492 A JP2457492 A JP 2457492A JP H05189168 A JPH05189168 A JP H05189168A
Authority
JP
Japan
Prior art keywords
track
input
data
output
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4024574A
Other languages
Japanese (ja)
Inventor
Hideki Nasu
秀樹 那須
Kaname Tayama
要 田山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
TOHOKU NIPPON DENKI SOFTWARE KK
NEC Corp
NEC Solution Innovators Ltd
Original Assignee
TOHOKU NIPPON DENKI SOFTWARE KK
NEC Corp
NEC Software Tohoku Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by TOHOKU NIPPON DENKI SOFTWARE KK, NEC Corp, NEC Software Tohoku Ltd filed Critical TOHOKU NIPPON DENKI SOFTWARE KK
Priority to JP4024574A priority Critical patent/JPH05189168A/en
Publication of JPH05189168A publication Critical patent/JPH05189168A/en
Pending legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)

Abstract

PURPOSE:To improve reliability and operability by automatically recoverying a track fault immediately without requiring human labor when the track fault is generated. CONSTITUTION:In the system to perform file access while regarding two physical files respectively prepared on two different media as one logical duplex file 1, a data input/output control means 21 executes the input/output of data to the duplex file 1 corresponding to a request from a user program. When any input/output error is detected, an input/output error detecting means 22 inputs/outputs data specified times and judges whether recovery is disabled or not. When the recovery is disabled, an alternative track allocating means 23 allocates a previously prepared alternative track to a track generating the fault. On the other hand, a data copy control part 5 inputs data from the normal side track and outputs normal data onto the allocated alternative track.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は障害トラック自動復旧方
式に関し、特に、二重化ファイル制御方式を採用したコ
ンピュータシステムにおいて入出力障害が発生したと
き、何ら人手を介入することなく自動的に障害トラック
の復旧を行うことを可能とした方式に関するものであ
る。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a faulty track automatic restoration system, and more particularly to a faulty track automatic restoration system without any human intervention when an input / output fault occurs in a computer system adopting a duplicated file control system. The present invention relates to a method that enables restoration.

【0002】[0002]

【従来の技術】従来より、データファイルを二重化する
ことにより、磁気ディスク装置等の外部記憶装置や入出
力制御装置等に障害が発生しても、正常な系で入出力処
理を継続し、業務停止を未然に防止するようにしてい
る。
2. Description of the Related Art Conventionally, by duplicating data files, even if a failure occurs in an external storage device such as a magnetic disk device or an input / output control device, the input / output processing is continued in a normal system and the business We are trying to prevent outages.

【0003】この場合、二重化されたデータファイル
(二重化ファイル)はそれぞれ物理的に異なる2つの媒
体上に作成されるが、二重化ファイルアクセス制御を介
することにより、ユーザプログラムからは論理的に1つ
のファイルとして扱うことができる。なお、2つのファ
イルは、二重化ファイルアクセス制御により、常にデー
タの内容が同一に保たれるようになっている。
In this case, a duplicated data file (duplicated file) is created on two physically different media, but a user program logically creates one file through the duplicated file access control. Can be treated as It should be noted that the contents of the data of the two files are always kept the same by the duplicated file access control.

【0004】ところで、従来におけるトラック障害時の
処理は次のように行われていた。
By the way, the conventional processing at the time of a track failure has been performed as follows.

【0005】二重化ファイルに対するデータの入出力中
に入出力障害が発生した場合、二重化ファイルアクセス
制御部にはトラック障害として通知される。
When an input / output failure occurs while inputting / outputting data to / from a duplicated file, the duplicated file access controller is notified as a track failure.

【0006】二重化ファイルアクセス制御部は、そのト
ラックに対して以降はアクセスが行われないように、障
害情報管理手段を介して障害情報管理ファイルにそのト
ラックが障害トラックである旨を登録する。
The duplicated file access control unit registers that the track is a faulty track in the fault information management file via the fault information management means so that the track will not be accessed thereafter.

【0007】それ以降のデータ処理業務では、障害情報
管理ファイルの内容に従い、正常な系のトラックに対し
てデータの入出力が行われる。
In the subsequent data processing work, data is input / output to / from a normal system track according to the contents of the failure information management file.

【0008】障害により一方の系が閉塞されたトラック
については、単一系となり、再び同じトラックに障害が
生じた場合には業務停止を免れない。
A truck in which one system is blocked due to a failure becomes a single system, and when a failure occurs in the same truck again, the work must be stopped.

【0009】そのため、操作員は定期的に障害情報管理
ファイルを検査して障害トラックの検出を行い、その障
害トラックに代替トラックを割り当て、正常な系からデ
ータの複写を行うことによって復旧を行っていた。
Therefore, the operator regularly inspects the fault information management file to detect a faulty track, assigns an alternative track to the faulty track, and copies data from a normal system to restore the faulty track. It was

【0010】[0010]

【発明が解決しようとする課題】上述したように、従来
は個々の障害トラックの復旧を操作員の作業によって行
っていたため、次のような欠点が指摘されていた。
As described above, in the prior art, the individual faulty trucks were restored by the work of the operator, so the following drawbacks were pointed out.

【0011】両系障害(主系のあるトラックが障害の
とき、副系の相対的に同一のアドレスのトラックが障害
トラックとなること)による業務停止を回避するために
は、短い時間間隔で操作員による障害情報ファイルの検
査および障害トラックの復旧を行う必要がある。これが
充分に実施できない環境では、両系障害による業務停止
を充分に防止することができない。
In order to avoid a business stoppage due to a failure of both systems (when a track having a main system fails, a track having a relatively same address in the sub system becomes a failure track), operation is performed at short time intervals. It is necessary to inspect the fault information file and repair the fault track by the staff. In an environment where this cannot be fully implemented, it is not possible to sufficiently prevent business interruption due to a failure in both systems.

【0012】障害トラックの復旧に常に操作員の作業
が必要なため、運用性が悪い。
Operability is poor because the operator's work is always required to recover the faulty truck.

【0013】人手が介入するため、操作ミスによる二
重障害の危険性がある。
Since human intervention is involved, there is a risk of double failure due to operation error.

【0014】本発明は上記の点に鑑み提案されたもので
あり、その目的とするところは、二重化ファイルアクセ
スを行っているシステムにおいてトラック障害が発生し
た場合に、即座に人手を要さずに自動的に復旧を行うこ
とができ、信頼性,運用性を向上することのできる障害
トラック自動復旧方式を提供することにある。
The present invention has been proposed in view of the above points, and an object of the present invention is to immediately and without requiring manpower when a track failure occurs in a system which is performing dual file access. An object of the present invention is to provide a faulty truck automatic restoration method that can automatically restore and improve reliability and operability.

【0015】[0015]

【課題を解決するための手段】本発明は上記の目的を達
成するため、異なる2つの媒体上にそれぞれ作成された
物理的に2つのファイルを論理的に1つの二重化ファイ
ルとみなしてファイルアクセスを行う二重化ファイルア
クセス制御機能を有するコンピュータシステムにおい
て、ユーザプログラムからの要求により二重化ファイル
に対してデータの入出力を行うデータ入出力制御手段
と、データ入出力制御手段における入出力エラーを検出
した際に規定回数の再入出力を行わせ、回復が不可能か
否かを判断する入出力エラー検出手段と、回復が不可能
な場合に入出力エラー検出手段により起動され、予め用
意されている代替トラックを障害の発生したトラックに
割り当てる代替トラック割り当て手段と、正常な側のト
ラックからデータの入力を行い、割り当てた代替トラッ
ク上へ正常なデータの出力を行うデータ複写制御部とを
備えるようにしている。
In order to achieve the above object, the present invention considers two files physically created on two different media as logically one duplicated file and performs file access. In a computer system having a duplicated file access control function, a data input / output control means for inputting / outputting data to / from a duplicated file in response to a request from a user program and an input / output error in the data input / output control means are detected. Input / output error detection means for performing re-input / output a prescribed number of times to determine whether or not recovery is possible, and an alternative track prepared in advance that is started by the input / output error detection means when recovery is impossible To the faulty track, and input data from the normal side track. It was carried out, so that and a data copy control section for outputting the normal data on the alternate track allocation.

【0016】[0016]

【作用】本発明の障害トラック自動復旧方式にあって
は、データ入出力制御手段がユーザプログラムからの要
求により二重化ファイルに対してデータの入出力を行
い、入出力エラー検出手段がデータ入出力制御手段にお
ける入出力エラーを検出した際に規定回数の再入出力を
行わせて回復が不可能か否かを判断し、回復が不可能な
場合に入出力エラー検出手段により起動された代替トラ
ック割り当て手段が予め用意されている代替トラックを
障害の発生したトラックに割り当て、データ複写制御部
が正常な側のトラックからデータの入力を行って割り当
てた代替トラック上へ正常なデータの出力を行う。
In the automatic fault track recovery system of the present invention, the data input / output control means inputs / outputs data to / from the duplicated file in response to a request from the user program, and the input / output error detection means controls the data input / output. When an input / output error in the means is detected, the input / output error detection means is caused to perform re-input / output a prescribed number of times to determine whether or not recovery is possible. The means allocates a preliminarily prepared alternative track to the faulty track, and the data copy control unit inputs data from the normal side track and outputs normal data onto the allocated alternative track.

【0017】[0017]

【実施例】以下、本発明の実施例につき、図面を参照し
て説明する。
Embodiments of the present invention will be described below with reference to the drawings.

【0018】図1は本発明の障害トラック自動復旧方式
の一実施例を示す構成図である。
FIG. 1 is a block diagram showing an embodiment of the faulty truck automatic restoration system of the present invention.

【0019】図1において、二重化ファイル1は、ユー
ザプログラム7により業務処理のためにデータの入出力
の対象となるデータファイルであり、異なる2つの媒体
(磁気ディスク装置等)上にそれぞれ作成された物理的
に2つのファイルを論理的に1つのファイルとして扱っ
たものである。
In FIG. 1, a duplicated file 1 is a data file that is a target of data input / output by a user program 7 for business processing, and is created on two different media (such as a magnetic disk device). Two files are physically treated as one file logically.

【0020】また、機能部としては、データ入出力制御
手段21,入出力エラー検出手段22,代替トラック割
り当て手段23を含み、二重化ファイルアクセスのため
の一連の動作を制御する二重化ファイルアクセス制御部
2と、障害情報管理ファイル3の管理を行う障害情報管
理制御部4と、代替トラックへのデータ複写を行うデー
タ複写制御部5と、ファイルに対する入出力動作を制御
するファイル入出力制御部6とが設けられている。各部
の機能等の詳細については、重複を避けるため、以下の
動作を通して説明する。
The functional unit includes a data input / output control unit 21, an input / output error detection unit 22, and an alternative track allocation unit 23, and controls a series of operations for accessing a duplicated file. A failure information management control unit 4 for managing the failure information management file 3, a data copy control unit 5 for copying data to an alternative track, and a file input / output control unit 6 for controlling input / output operations for files. It is provided. Details of the functions and the like of each unit will be described through the following operations in order to avoid duplication.

【0021】以下、上記の実施例の動作を場合を分けて
説明する。
The operation of the above-described embodiment will be described below for different cases.

【0022】(1)二重化ファイルに対する正常時にお
けるデータの入出力動作 ユーザプログラム7よりデータ処理のためファイル入出
力制御部6に対してデータの入出力要求が行われると、
ファイル入出力制御部6は、対象ファイルが二重化ファ
イル1であれば、二重化ファイルアクセス制御部2内の
データ入出力制御手段21に対してデータの入出力要求
を行う。
(1) Data input / output operation for a duplicated file in a normal state When the user program 7 issues a data input / output request to the file input / output control unit 6 for data processing,
If the target file is the duplicated file 1, the file input / output control unit 6 makes a data input / output request to the data input / output control unit 21 in the duplicated file access control unit 2.

【0023】データ入出力制御手段21は、入出力要求
があると、障害情報管理部4を介して障害情報管理ファ
イル3内の障害情報を参照し、入出力を行うトラックの
妥当性を検査する。
When an input / output request is made, the data input / output control means 21 refers to the fault information in the fault information management file 3 via the fault information management section 4 to check the validity of the track for input / output. ..

【0024】当該トラックが正常であることが保証され
ると、データ入出力制御手段21は、要求された二重化
ファイル1内の該当するトラックに対してデータの入出
力を行う。この際、入力は正系,副系のいずれかあるい
は両方から行い、出力は両方に対して行う。
When it is guaranteed that the track is normal, the data input / output control means 21 inputs / outputs data to / from the corresponding track in the requested duplicated file 1. At this time, input is performed from either or both of the primary system and the secondary system, and output is performed to both.

【0025】データ入出力制御手段21は、入出力動作
の完了を待ち合わせ、ファイル入出力制御部6を介して
ユーザプログラム7に入出力の完了を通知する。
The data input / output control means 21 waits for the completion of the input / output operation and notifies the user program 7 of the completion of the input / output through the file input / output control unit 6.

【0026】(2)入出力エラーが検出された場合の動
作 データ入出力制御手段21により入出力が行われた二重
化ファイル1内のあるトラックにおいて入出力障害が発
生した場合、図示しない外部記憶装置制御部よりデータ
入出力制御手段21に対して入出力エラーが通知され
る。
(2) Operation when an input / output error is detected When an input / output failure occurs in a certain track in the duplicated file 1 which is input / output by the data input / output control means 21, an external storage device (not shown) The control unit notifies the data input / output control means 21 of an input / output error.

【0027】この入出力エラーは更にデータ入出力制御
手段21より入出力エラー検出手段22に通知される。
This input / output error is further notified from the data input / output control means 21 to the input / output error detection means 22.

【0028】このとき、入出力エラー検出手段22は、
再び入出力動作を行わせるが、規定された回数を越えて
も入出力動作が正常に終了しない場合、そのトラックは
障害であるとみなす。
At this time, the input / output error detecting means 22 is
The I / O operation is performed again, but if the I / O operation does not end normally even after the specified number of times is exceeded, the track is regarded as a failure.

【0029】入出力エラー検出手段22は、障害情報管
理制御部4を介して障害情報管理ファイル3にトラック
障害情報を登録し、続いて、代替トラック割り当て手段
23を起動する。
The input / output error detection means 22 registers the track failure information in the failure information management file 3 via the failure information management control unit 4, and subsequently activates the alternative track allocation means 23.

【0030】起動された代替トラック割り当て手段23
は、予め用意されている代替トラックを障害トラックに
割り当て、入出力エラー検出手段22に代替トラックの
割り当てが完了したことを通知し、入出力エラー検出手
段22はデータ複写制御部5を起動する。
The activated alternative track assigning means 23
Assigns a previously prepared alternative track to the faulty track, notifies the input / output error detecting means 22 that the alternative track has been assigned, and the input / output error detecting means 22 activates the data copy control section 5.

【0031】起動されたデータ複写制御部5は、二重化
ファイル1の正常な系の相対的に同一のアドレスのトラ
ックよりデータを入力し、割り当てた代替トラック上に
そのデータを出力する。
The activated data copy control unit 5 inputs data from the track of the normal system of the duplicated file 1 having a relatively same address, and outputs the data to the assigned alternative track.

【0032】データ複写が正常に終了したならば、その
旨を入出力エラー検出手段22に通知し、また、障害情
報管理制御部4を介して障害情報管理ファイル3にアク
セスし、そのトラックのトラック障害情報を削除する。
When the data copying is normally completed, the fact is notified to the input / output error detecting means 22, and the fault information management file 3 is accessed through the fault information management control unit 4 to track the track. Delete the fault information.

【0033】更に、入出力エラー検出手段22は、デー
タ入出力制御手段21に障害回復の成功を通知する。
Further, the input / output error detection means 22 notifies the data input / output control means 21 of the success of failure recovery.

【0034】データ入出力制御手段21は、ファイル入
出力制御部6を介してユーザプログラム7に入出力要求
の完了を通知し、一連の入出力動作を完了する。このと
き、障害回復処理が行われたことがユーザプログラムに
通知されることはなく、また、ユーザプログラム7側も
これを意識する必要はない。
The data input / output control means 21 notifies the user program 7 of the completion of the input / output request via the file input / output control unit 6 and completes a series of input / output operations. At this time, the user program is not notified that the failure recovery processing has been performed, and the user program 7 need not be aware of this.

【0035】[0035]

【発明の効果】以上説明したように、本発明の障害トラ
ック自動復旧方式にあっては、次のような効果がある。
As described above, the faulty track automatic restoration system of the present invention has the following advantages.

【0036】トラックの障害が発生した場合、即座に
自動的に代替トラックの割り当てを行い、正常なトラッ
クからのデータの複写を行って復旧を完了するため、両
系障害が発生する危険がほとんどなく、システムの信頼
性を大幅に高めることができる。
When a track failure occurs, an alternative track is immediately and automatically assigned, data is copied from a normal track, and recovery is completed. Therefore, there is almost no risk of failure of both systems. , The reliability of the system can be greatly increased.

【0037】障害トラックの復旧に操作員の作業が不
要であるため、運用性が良い。
Operability is good because no operator work is required to restore the faulty truck.

【0038】人手が介入しないため、操作ミス等の人
為的ミスによる二重障害の危険性がない。
Since there is no human intervention, there is no risk of double failure due to human error such as operation error.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の障害トラック自動復旧方式の一実施例
を示す構成図である。
FIG. 1 is a configuration diagram showing an embodiment of a faulty track automatic restoration system of the present invention.

【符号の説明】[Explanation of symbols]

1……二重化ファイル 2……二重化ファイルアクセス制御部 21…データ入出力制御手段 22…入出力エラー検出手段 23…代替トラック割り当て手段 3……障害情報管理ファイル 4……障害情報管理制御部 5……データ複写制御部 6……ファイル入出力制御部 7……ユーザプログラム 1 ... Duplicated file 2 ... Duplicated file access control unit 21 ... Data input / output control unit 22 ... Input / output error detection unit 23 ... Alternative track allocation unit 3 ... Fault information management file 4 ... Fault information management control unit 5 ... … Data copy controller 6 …… File input / output controller 7 …… User program

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】 異なる2つの媒体上にそれぞれ作成され
た物理的に2つのファイルを論理的に1つの二重化ファ
イルとみなしてファイルアクセスを行う二重化ファイル
アクセス制御機能を有するコンピュータシステムにおい
て、 ユーザプログラムからの要求により二重化ファイルに対
してデータの入出力を行うデータ入出力制御手段と、 データ入出力制御手段における入出力エラーを検出した
際に規定回数の再入出力を行わせ、回復が不可能か否か
を判断する入出力エラー検出手段と、 回復が不可能な場合に入出力エラー検出手段により起動
され、予め用意されている代替トラックを障害の発生し
たトラックに割り当てる代替トラック割り当て手段と、 正常な側のトラックからデータの入力を行い、割り当て
た代替トラック上へ正常なデータの出力を行うデータ複
写制御部とを備えたことを特徴とする障害トラック自動
復旧方式。
1. A computer system having a duplicated file access control function for performing file access by physically considering two files respectively created on two different media as one duplicated file, and from a user program. Of the data input / output control means for inputting / outputting data to / from the duplicated file in response to the request of I / O error detecting means for judging whether or not it is possible, normal track allocating means for allocating a preliminarily prepared alternative track to the faulty track when the recovery is impossible, Data is input from the track on the other side, and normal data is Failure TRACK recovery method is characterized in that a data copy control unit that performs output.
JP4024574A 1992-01-14 1992-01-14 System for automatically recovering fault track Pending JPH05189168A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4024574A JPH05189168A (en) 1992-01-14 1992-01-14 System for automatically recovering fault track

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4024574A JPH05189168A (en) 1992-01-14 1992-01-14 System for automatically recovering fault track

Publications (1)

Publication Number Publication Date
JPH05189168A true JPH05189168A (en) 1993-07-30

Family

ID=12141941

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4024574A Pending JPH05189168A (en) 1992-01-14 1992-01-14 System for automatically recovering fault track

Country Status (1)

Country Link
JP (1) JPH05189168A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001100930A (en) * 1999-09-28 2001-04-13 Mitsubishi Electric Corp Mirror disk controller

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63193381A (en) * 1987-02-05 1988-08-10 Toshiba Corp File storage controlling system
JPH02291011A (en) * 1989-04-28 1990-11-30 Fujitsu Ltd Memory device
JPH04168670A (en) * 1990-11-01 1992-06-16 Nec Field Service Ltd Trouble treatment system of magnetic disk

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63193381A (en) * 1987-02-05 1988-08-10 Toshiba Corp File storage controlling system
JPH02291011A (en) * 1989-04-28 1990-11-30 Fujitsu Ltd Memory device
JPH04168670A (en) * 1990-11-01 1992-06-16 Nec Field Service Ltd Trouble treatment system of magnetic disk

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001100930A (en) * 1999-09-28 2001-04-13 Mitsubishi Electric Corp Mirror disk controller

Similar Documents

Publication Publication Date Title
JP2703479B2 (en) Data processing method and system having security function of time zero backup session
USRE37038E1 (en) Method and system for automated termination and resumption in a time zero backup copy process
US6266785B1 (en) File system filter driver apparatus and method
US7370248B2 (en) In-service raid mirror reconfiguring
US20040098637A1 (en) Apparatus and method for enhancing data availability by leveraging primary/backup data storage volumes
CN106557703A (en) safety detection
JP2005235058A (en) Snapshot acquisition method, snapshot acquisition device, and computer program provided with snapshot acquisition function
JPH0420493B2 (en)
JP2006099784A (en) Computer backup system operable in opened state of file
KR20120140652A (en) Buffer disk in flashcopy cascade
WO2007141180A2 (en) Apparatus and method for cluster recovery
CA2071346A1 (en) Method and means for time zero backup copy of data
JPH05189168A (en) System for automatically recovering fault track
JPH07121315A (en) Disk array
JPS58175064A (en) Processing system of multiplex volume
JPH103396A (en) System for restoring multiplex control fault
US7353432B1 (en) Maintaining high data integrity
JP4358943B2 (en) Automatic backup system and recording medium recording automatic backup program
JPH0436421B2 (en)
JPH07113877B2 (en) Redundant volume recovery processing method
JPS63201818A (en) Dual file restoring system
JPH0944317A (en) Registering system for alternate sector
JPH10161815A (en) Disk duplex management device and method therefor
JPH04141751A (en) Fault recovery system for mass storage medium
JPH04235639A (en) Non-stop operation processing system for computer system