JPH0546580A - High-reliability data update system for extended storage - Google Patents

High-reliability data update system for extended storage

Info

Publication number
JPH0546580A
JPH0546580A JP20900191A JP20900191A JPH0546580A JP H0546580 A JPH0546580 A JP H0546580A JP 20900191 A JP20900191 A JP 20900191A JP 20900191 A JP20900191 A JP 20900191A JP H0546580 A JPH0546580 A JP H0546580A
Authority
JP
Japan
Prior art keywords
data
cluster
storage
ssu
error
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP20900191A
Other languages
Japanese (ja)
Inventor
Yoshiji Sano
好次 佐野
Satoru Tateishi
覚 立石
Takashi Chiba
隆 千葉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP20900191A priority Critical patent/JPH0546580A/en
Publication of JPH0546580A publication Critical patent/JPH0546580A/en
Pending legal-status Critical Current

Links

Landscapes

  • Multi Processors (AREA)

Abstract

PURPOSE:To store old data by inhibiting data from being transferred from a data buffer to a storage area according to a check result when a cluster at a data transfer source is disconnected owing to a fault. CONSTITUTION:When double writing is started, write data from a cluster is stored in the data buffer(DB) 20 of the port part of each system storage device(SSU). The DB20 has storage capacity corresponding to the maximum transfer length of data transferred from the cluster. A data check circuit(DC) 16 checks cluster write data to check whether or not there is an error. A data buffer control circuit(BC) 19 outputs the data stored in the DB20 to the storage part of the SSU when none of the data has an error. Further, the BC19 inhibits the data of the DB20 from being outputted when an error is detected by the checking of the DC16 to prevent indeterminate data from being written in the storage part of the SSU.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、複数のクラスタにより
共有されるシステム記憶装置のデータの破壊防止を保証
する高信頼性データ更新方式に関する
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a high-reliability data updating system which guarantees prevention of data destruction of a system storage device shared by a plurality of clusters.

【0002】[0002]

【従来の技術】最近、コンピュータ処理技術の発展に伴
い、中央処理装置、チャネル処理装置、主記憶装置、主
記憶制御装置等を有する独立のデータ処理装置を一つの
クラスタと考え、複数のクラスタが多重化された拡張記
憶(以後システム記憶装置という)を共有する複合シス
テム(System Coupled Multi−P
rocessor:SCMP)が実用化されている。
2. Description of the Related Art Recently, with the development of computer processing technology, an independent data processing device having a central processing unit, a channel processing unit, a main storage unit, a main storage control unit, etc. is considered as one cluster, and a plurality of clusters are formed. A complex system (System Coupled Multi-P) sharing a shared extended storage (hereinafter referred to as a system storage device)
processor (SCMP) has been put to practical use.

【0003】SCMPシステムにおいては、一般にシス
テム記憶装置(以後SSUという)は、それが格納する
データの破壊防止の保証を強化するために多重化されて
いる。
In an SCMP system, system storage devices (hereinafter referred to as SSUs) are typically multiplexed in order to enhance the guarantee of preventing the destruction of data stored in the system storage devices.

【0004】図6は、4台のクラスタが二重化構成のS
SUを共有するSCMPシステムを示す。図6におい
て、1および2は二つのSSUを示し、3、4、5およ
び6はそれぞれクラスタを示す。
FIG. 6 shows an S in which four clusters are duplicated.
1 illustrates an SCMP system that shares SU. In FIG. 6, 1 and 2 indicate two SSUs, and 3, 4, 5 and 6 indicate clusters, respectively.

【0005】各クラスタ3、4、5および6は、それぞ
れのクラスタの動作を制御する中央処理装置(CP
U)、チャネルのデータ転送を制御するチャネル処理装
置(CHP)、主記憶装置(MSU)、CPUとCHP
のMSUに対するアクセスを制御する主記憶制御装置
(MCU)からなる。
Each cluster 3, 4, 5 and 6 has a central processing unit (CP) which controls the operation of each cluster.
U), a channel processing unit (CHP) that controls the data transfer of the channel, a main memory unit (MSU), a CPU and a CHP
Of the main memory controller (MCU) that controls access to the MSU.

【0006】SSU1は記憶領域を有する記憶部1aお
よび各クラスタに接続されるポート部1bを有し、同様
にSSU2は記憶部2aおよびポート部2bを有する。
各ポート部1bおよび2bは各クラスタ3,4,5,6
に対応する4つのポートを有する。各クラスタのMCU
はSSU1およびSSU2の対応するポートと接続され
ている。
The SSU1 has a storage unit 1a having a storage area and a port unit 1b connected to each cluster. Similarly, the SSU2 has a storage unit 2a and a port unit 2b.
Each port section 1b and 2b is associated with each cluster 3, 4, 5, 6
4 ports corresponding to MCU of each cluster
Are connected to the corresponding ports of SSU1 and SSU2.

【0007】図6のSCMPシステムは、SSU1およ
びSSU2のデータ内容を同一に保持することにより高
信頼性記憶システムを構成している。なお、記憶システ
ムの信頼性を向上するために記憶領域を多重化すること
が一般に行われているが、記憶装置内を多重化する方式
では、記憶装置全体に及ぶ障害(制御系障害という)が
起こった場合に対処が困難である。
The SCMP system of FIG. 6 constitutes a high reliability storage system by keeping the data contents of SSU1 and SSU2 the same. Note that it is common to multiplex storage areas to improve the reliability of the storage system, but with the method of multiplexing inside the storage device, a failure (referred to as a control system failure) in the entire storage device It is difficult to deal with when it happens.

【0008】図6に示すSCMPシステムは、2台のS
SUに同一内容を保持し、一方のSSUで障害が発生し
た場合は、このSSUをシステムプログラムによりシス
テムから切り離し、残りのSSU内のデータを使用して
システムの継続運用が可能なように構成され、これによ
ってシステムの信頼性を高めている。
The SCMP system shown in FIG. 6 has two S
If the SU retains the same contents and one SSU fails, this SSU is separated from the system by the system program, and the data in the remaining SSU is used to enable continuous operation of the system. , Which increases the reliability of the system.

【0009】SCMPシステムの一方のSSUで障害が
発生し、二重化されたSSU内のデータの等価性が崩れ
た場合、等価性損傷というエラー信号によって全クラス
タに通報するようになっている。
When a failure occurs in one SSU of the SCMP system and the equivalence of data in the duplicated SSU is broken, an error signal called equivalence damage is sent to all clusters.

【0010】SCMPシステムのいずれかのクラスタに
障害が発生した場合はこの障害クラスタは切り離され
る。
If any cluster in the SCMP system fails, the failed cluster is disconnected.

【0011】[0011]

【発明が解決しようとする課題】図7および8は、上記
従来のSCMPシステムにおいてクラスタからSSUに
対する二重書き込みが行われている最中に、クラスタに
障害が発生した時の動作を示す。二重書き込みとは一つ
のクラスタから二つのSSUに対して同時に同じデータ
を書き込むことである。
FIGS. 7 and 8 show the operation when a failure occurs in the cluster during double writing from the cluster to the SSU in the conventional SCMP system. Double writing is to write the same data to two SSUs simultaneously from one cluster.

【0012】図7は、クラスタ4から二つのSSUに対
して二重書き込みが開始される直前の、各SSUの記憶
部1aおよび2aの内容を示す。すなわち、記憶部1a
および2aには旧データが格納されている。
FIG. 7 shows the contents of the storage units 1a and 2a of each SSU immediately before the double writing is started from the cluster 4 to the two SSUs. That is, the storage unit 1a
And 2a store old data.

【0013】クラスタ4から二つのSSUに対して二重
書き込みが行われると、旧データは新データに逐次置き
換えられていく。二重書き込みの途中でクラスタ4が障
害を起こすと、クラスタ4はシステムから切り離され
る。
When double writing is performed from the cluster 4 to the two SSUs, the old data is sequentially replaced with the new data. If the cluster 4 fails during double writing, the cluster 4 is disconnected from the system.

【0014】図8は、クラスタ4が切り離された時点で
の各SSUの記憶部1aおよび2aの内容を示す。図8
において、実線矢印は新データが増加していく方向、点
線矢印は旧データが減少していく方向を示す。図示のよ
うに、各記憶部1aおよび2a内にはそれぞれ新データ
と旧データとが混在したまま残ることになる。
FIG. 8 shows the contents of the storage units 1a and 2a of each SSU when the cluster 4 is separated. Figure 8
In, the solid arrow indicates the direction in which the new data increases, and the dotted arrow indicates the direction in which the old data decreases. As shown in the figure, the new data and the old data remain mixed in each of the storage units 1a and 2a.

【0015】一方、データ復旧(リカバリ)はソフトウ
ェアがSSUの記憶領域内にある制御テーブルを使用し
て定期的にチェックポイントでログ(LOG)情報を採
取することにより実施している。従って、ソフトウェア
が使用する制御テーブル内に新旧両データが混在する場
合はデータリカバリの手順が複雑になり、システムの性
能低下の原因になっていた。
On the other hand, data recovery is performed by the software periodically collecting log (LOG) information at checkpoints by using a control table in the storage area of the SSU. Therefore, when both old and new data are mixed in the control table used by the software, the procedure of data recovery becomes complicated, which causes the system performance to deteriorate.

【0016】本発明は、従来のSCMPシステムの上記
欠点を除去し、クラスタが二重書き込み実施中クラスタ
障害が発生しても、SSUの記憶領域に新旧データが混
在しないような拡張記憶の高信頼性データ更新方式を提
供することを目的とする。
The present invention eliminates the above-mentioned drawbacks of the conventional SCMP system, and even if a cluster failure occurs while the cluster is being double-written, high reliability of extended storage is ensured so that old and new data are not mixed in the storage area of the SSU. The purpose is to provide a sex data update method.

【0017】[0017]

【課題を解決するための手段】本発明による高信頼性デ
ータ更新方式は、中央処理装置、主記憶装置、主記憶制
御装置を少なくとも有するデータ処理システムをクラス
タとし、複数のクラスタと、前記複数のクラスタによっ
て共有され任意にアクセスされる多重化されたシステム
記憶装置とからなる複合システムにおいて、前記多重化
されたシステム記憶装置の各々は、クラスタからの書き
込みデータの最大転送長分の容量を有しクラスタからの
書き込みデータを一時蓄えるデータバッフアと、データ
バッフアに蓄えられるデータのエラーをチェックする手
段と、チェック手段によりエラーが検出されなかった場
合にのみデータバッフアに蓄えられたデータを記憶領域
に書き込むように制御する手段とを備えて構成される。
A high-reliability data updating method according to the present invention uses a data processing system having at least a central processing unit, a main storage unit, and a main storage control unit as a cluster, and a plurality of clusters and the plurality of clusters. In a complex system comprising a multiplexed system storage device shared by a cluster and arbitrarily accessed, each of the multiplexed system storage devices has a capacity corresponding to a maximum transfer length of write data from the cluster. A data buffer that temporarily stores the write data from the cluster, a means for checking errors in the data stored in the data buffer, and a control to write the data stored in the data buffer to the storage area only when no error is detected by the checking means. And means for doing so.

【0018】[0018]

【作用】上記構成により、制御手段は、データ転送元の
クラスタが障害のため切り離されたとき、チェック手段
のチェック結果に基づき、データバッフアから記憶領域
へのデータの転送を抑止するように制御を行う。これに
よって、クラスタ障害により記憶領域内に新旧データが
混在することはなく、旧データは保存される。
With the above structure, when the cluster of the data transfer source is disconnected due to a failure, the control means controls the transfer of data from the data buffer to the storage area based on the check result of the check means. .. This prevents old and new data from being mixed in the storage area due to a cluster failure, and preserves the old data.

【0019】また、クラスタから多重化されたシステム
記憶装置に対して二重書き込みを行っている最中に一つ
のシステム記憶装置に障害が発生しこの障害システム記
憶装置がシステムから切り離されても、他のシステム記
憶装置の制御手段は、チェック手段によってデータのエ
ラーが検出されない限り、クラスタからの新データをデ
ータバッフアから記憶領域へ書き込むように制御する。
Further, even if a failure occurs in one system storage device during double writing from the cluster to the multiplexed system storage device, and this failed system storage device is disconnected from the system, The control means of the other system storage device controls so that new data from the cluster is written from the data buffer to the storage area unless the data error is detected by the checking means.

【0020】これにより、一つのSSUが障害を起こし
ても、他の障害の無いSSUはクラスタからの新しいデ
ータを記憶領域内に受け入れることができる。上記のよ
うにして、クラスタから多重化されたシステム記憶装置
に対して二重書き込みを行っている最中に、SSUある
いはクラスタに障害が発生しても、SSUの記憶領域内
のデータは保証される。
Thus, if one SSU fails, the other non-failed SSUs can accept new data from the cluster in the storage area. As described above, the data in the storage area of the SSU is guaranteed even if a failure occurs in the SSU or the cluster during double writing from the cluster to the multiplexed system storage device. It

【0021】[0021]

【実施例】以下、本発明の実施例について詳細に説明す
る。本発明のSCMPシステムにおいて各SSUは、各
クラスタと対応して接続される複数のポート部と、各ポ
ート部とパイプラインで接続される記憶部からなる(図
6参照)。
EXAMPLES Examples of the present invention will be described in detail below. In the SCMP system of the present invention, each SSU includes a plurality of port units connected to each cluster and a storage unit connected to each port unit by a pipeline (see FIG. 6).

【0022】図1は一つのクラスタと対応するポート部
の回路図である。他のクラスタに接続されるポート部も
同じ構成である。クラスタからは、要求元を示すリクエ
スト信号、書き込み命令を示すオペレーションコード、
書き込み先アドレス、および転送データの長さ(転送
長)を含むクラスタ制御情報(CLS)と、書き込みデ
ータ(CLS WD)がポート部へ送られ、ポート部の
プリポート1に入力する。
FIG. 1 is a circuit diagram of a port unit corresponding to one cluster. Ports connected to other clusters have the same configuration. From the cluster, the request signal indicating the request source, the operation code indicating the write instruction,
The cluster control information (CLS) including the write destination address and the length of the transfer data (transfer length) and the write data (CLS WD) are sent to the port unit and input to the preport 1 of the port unit.

【0023】プリポート1はレジスタ10、11、1
2、13および14からなり、それぞれ、リクエスト信
号、オペレーションコード、転送長、アドレス、および
クラスタ書き込みデータを格納する。
The preport 1 has registers 10, 11, 1
2, 13, and 14, which store request signals, operation codes, transfer lengths, addresses, and cluster write data, respectively.

【0024】レジスタ10および11の出力はリクエス
ト制御回路17に接続される。レジスタ12の出力は転
送長レジスタ15に接続される。また、レジスタ13の
出力はプリポート2のアドレスレジスタ18に接続され
る。
The outputs of the registers 10 and 11 are connected to the request control circuit 17. The output of the register 12 is connected to the transfer length register 15. The output of the register 13 is connected to the address register 18 of the preport 2.

【0025】転送長レジスタ15の出力はリクエスト制
御回路17およびデータバッファ制御回路19に接続さ
れる。
The output of the transfer length register 15 is connected to the request control circuit 17 and the data buffer control circuit 19.

【0026】リクエスト制御回路17は要求元、オペレ
ーションコード、およびデータ転送長に基づき優先順位
を決め、優先順位信号をポート21および優先順位制御
回路25へ出力する。
The request control circuit 17 determines the priority based on the request source, the operation code and the data transfer length, and outputs the priority signal to the port 21 and the priority control circuit 25.

【0027】アドレスレジスタ18はリクエスト制御回
路17からの制御を受け、アドレス信号をポート21へ
出力する。ポート21の出力はセレクタ24に接続され
る。セレクタ24には他のクラスタに対応するポート部
のポート21からの出力も接続されている。
The address register 18 is controlled by the request control circuit 17 and outputs an address signal to the port 21. The output of the port 21 is connected to the selector 24. The output from the port 21 of the port unit corresponding to another cluster is also connected to the selector 24.

【0028】セレクタ24は優先順位制御回路25から
の制御信号によって、各クラスタに対応するポート21
の内の一つを選択し、パイプライン27を介してSSU
の記憶部へアドレスを送る。
The selector 24 receives the control signal from the priority control circuit 25, and the port 21 corresponding to each cluster.
Select one of the SSUs via pipeline 27
Send the address to the memory of.

【0029】一方、プリポート1のデータレジスタ14
の出力はデータチェック回路16およびデータバッフア
20に接続される。データバッフア20はクラスタから
転送されるデータの最大転送長分の容量を有する。
On the other hand, the data register 14 of the preport 1
Is connected to the data check circuit 16 and the data buffer 20. The data buffer 20 has a capacity for the maximum transfer length of data transferred from the cluster.

【0030】データバッフア20に格納されたデータは
データバッファ制御回路19によって制御される。デー
タバッファ制御回路19は、転送長レジスタ15からデ
ータの転送長に関する情報を入力し、データの制御を行
う。
The data stored in the data buffer 20 is controlled by the data buffer control circuit 19. The data buffer control circuit 19 inputs information on the data transfer length from the transfer length register 15 and controls the data.

【0031】データチェック回路16はレジスタ14か
らのクラスタ書き込みデータ(CLS WD)をチェッ
クしてエラーの有無を調べ、その結果をデータバッファ
制御回路19へ出力する。データバッファ制御回路19
は、全データにエラーが認められないならばデータバッ
フア20内に形成されたデータをプリポート2のデータ
レジスタ22を通じて8バイトずつ出力させるように制
御する。
The data check circuit 16 checks the cluster write data (CLS WD) from the register 14 to check if there is an error, and outputs the result to the data buffer control circuit 19. Data buffer control circuit 19
Controls all the data formed in the data buffer 20 to output 8 bytes at a time through the data register 22 of the preport 2 if no error is recognized in all the data.

【0032】レジスタ22の出力はポートWD23にお
いて16バイトにまとめられた後、セレクタ25の対応
入力端子に供給される。セレクタ25は優先順位制御回
路25からの制御信号により、各クラスタに対応するポ
ートWD23の各出力のうちの一つを選択する。
The output of the register 22 is put into 16 bytes at the port WD 23 and then supplied to the corresponding input terminal of the selector 25. The selector 25 selects one of the outputs of the port WD 23 corresponding to each cluster according to the control signal from the priority control circuit 25.

【0033】セレクタ26の出力は16バイトのレジス
タ28を介して16バイトの書き込みデータとしてSS
Uの記憶部へ送られる。
The output of the selector 26 is sent as SS data of 16 bytes to the SS via the register 28 of 16 bytes.
Sent to U's storage.

【0034】データバッファ制御回路19は、データチ
ェック回路16におけるチェックの結果エラーが検出さ
れた時は、データバッフア20のデータの出力を禁止す
ることにより不定データがSSUの記憶部に書き込まれ
るのを防止する。
When an error is detected as a result of the check by the data check circuit 16, the data buffer control circuit 19 prohibits the output of the data of the data buffer 20 to prevent the undefined data from being written in the storage unit of the SSU. To do.

【0035】以下、図1に示すSSUのポート部を有す
るSCMPシステムの動作について説明する。図2およ
び3は、クラスタ4から二つのSSUに二重書き込みを
実施中にクラスタ4に障害が発生した場合における、各
SSUの記憶部1aおよび2aの内容の変化を示す。
The operation of the SCMP system having the SSU port section shown in FIG. 1 will be described below. 2 and 3 show changes in the contents of the storage units 1a and 2a of each SSU when a failure occurs in the cluster 4 while the double writing is being performed from the cluster 4 to the two SSUs.

【0036】図2はクラスタ4が二重書き込みを開始す
る直前の記憶部1aおよび2aの内容である。すなわ
ち、記憶部1aおよび2aのいずれにも旧データが格納
されている。
FIG. 2 shows the contents of the storage units 1a and 2a immediately before the cluster 4 starts double writing. That is, old data is stored in both the storage units 1a and 2a.

【0037】二重書き込みが開始されると、クラスタ4
からの書き込みデータは各SSUのポート部のデータバ
ッフア20に蓄えられる。データバッフア20に蓄えら
れるデータはデータチェック回路16によってチェック
され、全書き込みデータにエラーが無いことが確認され
るまで、ポート部から記憶部へのデータ転送は行われな
い。
When double writing is started, the cluster 4
The write data from is stored in the data buffer 20 at the port of each SSU. The data stored in the data buffer 20 is checked by the data check circuit 16, and data transfer from the port unit to the storage unit is not performed until it is confirmed that all write data have no error.

【0038】図3は、二重書き込み実施中にクラスタ4
に障害が発生した時の各SSUの記憶部1aおよび2a
の内容を示す。図示のように、各記憶部1aおよび2a
共二重書き込み開始時の内容のままである。このよう
に、各SSUの記憶領域の旧データは保全される。
FIG. 3 shows that the cluster 4 was
Storage units 1a and 2a of each SSU when a failure occurs in the
Indicates the contents of. As shown, each storage unit 1a and 2a
The contents at the start of co-duplication writing remain unchanged. In this way, the old data in the storage area of each SSU is preserved.

【0039】図4および5は、クラスタ4が二つのSS
Uに対して二重書き込み実施中に一方のSSUの記憶部
に障害が発生した場合の、各SSUの記憶部の内容の変
化を示す。
4 and 5 show that the cluster 4 has two SSs.
The change in the contents of the storage unit of each SSU when a failure occurs in the storage unit of one SSU during the double writing to U is shown.

【0040】図4は、クラスタ4が二重書き込みを開始
する直前の各記憶部1aおよび2aの内容を示す。すな
わち、記憶部1aおよび2aのいずれにも旧データが格
納されている。
FIG. 4 shows the contents of the storage units 1a and 2a immediately before the cluster 4 starts double writing. That is, old data is stored in both the storage units 1a and 2a.

【0041】二重書き込みが開始されると、クラスタ4
からの書き込みデータは各SSUのポート部のデータバ
ッフア20に蓄えられる。データバッフア20に蓄えら
れるデータはデータチェック回路16によってチェック
され、全書き込みデータにエラーが無いことが確認され
るまで、ポート部から記憶部へのデータ転送は行われな
い。
When double writing is started, the cluster 4
The write data from is stored in the data buffer 20 at the port of each SSU. The data stored in the data buffer 20 is checked by the data check circuit 16, and data transfer from the port unit to the storage unit is not performed until it is confirmed that there is no error in all write data.

【0042】図5は、二重書き込み実施中にSSU1の
記憶部1aに障害が発生した時の各SSUの記憶部1a
および2aの内容を示す。障害を発生した方の記憶部1
aの内容は不定データである。従って、この障害SSU
はシステムから切り離される。
FIG. 5 shows the storage unit 1a of each SSU when a failure occurs in the storage unit 1a of the SSU1 during double writing.
And the contents of 2a are shown. Memory unit 1 of the person who has the fault
The content of a is indefinite data. Therefore, this failure SSU
Is disconnected from the system.

【0043】しかし、SSU2の記憶部2aに対するデ
ータの書き込みは、データチェック回路16においてエ
ラーが検出されない限り続行され、書き込みデータに全
くエラーが無ければ、記憶部2aの内容は全部新データ
に置き換えられる。このようにして、クラスタから二つ
のSSUに対して二重書き込み実施中に一方のSSUに
障害が発生しても、他方のSSU内に新データが確保さ
れる。
However, the writing of data to the storage unit 2a of the SSU 2 is continued unless an error is detected by the data check circuit 16, and if there is no error in the write data, the contents of the storage unit 2a are all replaced with new data. .. In this way, even if a failure occurs in one SSU during double writing from the cluster to two SSUs, new data is secured in the other SSU.

【0044】[0044]

【発明の効果】本発明によれば、クラスタから複数のS
SUに対して二重書き込み実施中にクラスタに障害が発
生してもいずれのSSU内にも旧データが保存される。
また、二重書き込み実施中にいずれかのSSUに障害が
発生しても、他方のSSU内に新データが格納される。
According to the present invention, a plurality of S from clusters can be obtained.
Even if the cluster fails during double writing to the SU, old data is stored in any SSU.
Further, even if a failure occurs in one of the SSUs during double writing, new data is stored in the other SSU.

【0045】従って、SCMPシステムにおいて、ソフ
トウエアによるデータリカバリが容易になるとともに、
SSUのデータ更新時における信頼性が格段に向上す
る。
Therefore, in the SCMP system, data recovery by software becomes easy, and
The reliability at the time of updating the SSU data is significantly improved.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の構成を示す図である。FIG. 1 is a diagram showing a configuration of the present invention.

【図2】本発明のクラスタ障害発生時の動作を示す図
(その1)である。
FIG. 2 is a diagram (No. 1) showing the operation when a cluster failure occurs according to the present invention.

【図3】本発明のクラスタ障害発生時の動作を示す図
(その2)である。
FIG. 3 is a diagram (No. 2) showing the operation according to the present invention when a cluster failure occurs.

【図4】本発明のSSU障害発生時の動作を示す図(そ
の1)である。
FIG. 4 is a diagram (No. 1) showing an operation when an SSU failure occurs according to the present invention.

【図5】本発明のSSU障害発生時の動作を示す図(そ
の2)である。
FIG. 5 is a diagram (No. 2) showing the operation when an SSU failure occurs according to the present invention.

【図6】SCMPシステムの構成を示す図である。FIG. 6 is a diagram showing a configuration of an SCMP system.

【図7】従来の技術を説明するための図(その1)であ
る。
FIG. 7 is a diagram (No. 1) for explaining a conventional technique.

【図8】従来の技術を説明するための図(その2)であ
る。
FIG. 8 is a diagram (part 2) for explaining the conventional technique.

【符号の説明】[Explanation of symbols]

1、2 システム記憶装置(SSU) 1a、2a 記憶部 1b、2b ポート部 3、4、5、6 クラスタ 10 リクエストレジスタ 11 オペレーションコードレジスタ 12 転送長レジスタ 13 アドレスレジスタ 14 書き込みデータレジスタ 15 転送長レジスタ 16 データチェック回路 17 リクエスト制御回路 18 アドレスレジスタ 19 データバファ制御回路 20 データバッフア 21 ポート 22 データレジスタ 23 ポートWD 24、26 セレクタ 25 優先順位制御回路 27 パイプライン 28 レジスタ 1, 2 System storage unit (SSU) 1a, 2a Storage unit 1b, 2b Port unit 3, 4, 5, 6 Cluster 10 Request register 11 Operation code register 12 Transfer length register 13 Address register 14 Write data register 15 Transfer length register 16 Data check circuit 17 Request control circuit 18 Address register 19 Data buffer control circuit 20 Data buffer 21 Port 22 Data register 23 Port WD 24, 26 Selector 25 Priority control circuit 27 Pipeline 28 Register

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】中央処理装置、主記憶装置、主記憶制御装
置を少なくとも有するデータ処理システムをクラスタと
し、複数のクラスタと、前記複数のクラスタによって共
有され任意にアクセスされる多重化されたシステム記憶
装置とからなる複合システムにおいて、前記多重化され
たシステム記憶装置の各々は、 前記クラスタからの書き込みデータの最大転送長分の容
量を有しクラスタからの書き込みデータを一時蓄えるデ
ータバッフアと、 前記データバッフアに蓄えられるデータのエラーをチェ
ックする手段と、 前記チェック手段によりエラーが検出されなかった場合
にのみ前記データバッフアに蓄えられたデータを記憶領
域に書き込むように制御する手段とを備えることを特徴
とする拡張記憶の高信頼性データ更新方式。
1. A data processing system having at least a central processing unit, a main storage unit, and a main storage control unit is defined as a cluster, and a plurality of clusters and a multiplexed system storage shared by the plurality of clusters and arbitrarily accessed. In the complex system including a device, each of the multiplexed system storage devices has a data buffer having a capacity of a maximum transfer length of write data from the cluster and temporarily storing write data from the cluster, and a data buffer in the data buffer. An extension comprising means for checking an error in stored data, and means for controlling to write the data stored in the data buffer into a storage area only when no error is detected by the checking means. Reliable data update method for memory.
【請求項2】前記制御手段は、データ転送元のクラスタ
が障害のため切り離されたとき、前記チェック手段のチ
ェック結果に基づき、前記データバッフアから前記記憶
領域へのデータの転送を抑止することにより前記記憶領
域内の旧データを保存することを特徴とする請求項1の
拡張記憶の高信頼性データ更新方式。
2. The control means prevents the data transfer from the data buffer to the storage area based on the check result of the checking means when the cluster of the data transfer source is separated due to a failure. The high-reliability data updating method for extended storage according to claim 1, wherein old data in the storage area is saved.
【請求項3】前記クラスタから前記多重化されたシステ
ム記憶装置に対して二重書き込みを行っている最中に一
つのシステム記憶装置に障害が発生しこの障害システム
記憶装置がシステムから切り離されても、他のシステム
記憶装置の前記制御手段は、前記チェック手段によって
データのエラーが検出されない限り、前記クラスタから
の新データを前記データバッフアから前記記憶領域へ書
き込むように制御することを特徴とする請求項1の拡張
記憶の高信頼性データ更新方式。
3. A fault occurs in one system storage device during double writing from the cluster to the multiplexed system storage device, and the faulty system storage device is disconnected from the system. Also, the control means of another system storage device controls to write new data from the cluster to the storage area from the data buffer unless a data error is detected by the checking means. A highly reliable data update method for extended storage according to item 1.
JP20900191A 1991-08-21 1991-08-21 High-reliability data update system for extended storage Pending JPH0546580A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP20900191A JPH0546580A (en) 1991-08-21 1991-08-21 High-reliability data update system for extended storage

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP20900191A JPH0546580A (en) 1991-08-21 1991-08-21 High-reliability data update system for extended storage

Publications (1)

Publication Number Publication Date
JPH0546580A true JPH0546580A (en) 1993-02-26

Family

ID=16565665

Family Applications (1)

Application Number Title Priority Date Filing Date
JP20900191A Pending JPH0546580A (en) 1991-08-21 1991-08-21 High-reliability data update system for extended storage

Country Status (1)

Country Link
JP (1) JPH0546580A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH086871A (en) * 1994-06-20 1996-01-12 Nec Corp Fault detection system
WO2011121666A1 (en) 2010-03-31 2011-10-06 富士通株式会社 Multi-cluster system

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60231248A (en) * 1984-05-02 1985-11-16 Nec Corp Common memory device

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60231248A (en) * 1984-05-02 1985-11-16 Nec Corp Common memory device

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH086871A (en) * 1994-06-20 1996-01-12 Nec Corp Fault detection system
JP2979962B2 (en) * 1994-06-20 1999-11-22 日本電気株式会社 Failure detection system
WO2011121666A1 (en) 2010-03-31 2011-10-06 富士通株式会社 Multi-cluster system

Similar Documents

Publication Publication Date Title
US5548743A (en) Data processing system with duplex common memory having physical and logical path disconnection upon failure
JP2994070B2 (en) Method and apparatus for determining the state of a pair of mirrored data storage units in a data processing system
US6266785B1 (en) File system filter driver apparatus and method
US5724501A (en) Quick recovery of write cache in a fault tolerant I/O system
US20040078637A1 (en) Method for maintaining consistency and performing recovery in a replicated data storage system
JP2002287999A (en) Server duplexing method, duplex server system, and duplex database server
US5742851A (en) Information processing system having function to detect fault in external bus
JPH06214782A (en) System and method for introduction of processor control code
JPH0546580A (en) High-reliability data update system for extended storage
EP0418030A2 (en) Improvements in and relating to stable memory circuits
US7039757B2 (en) Cluster disk array system and a method for operating the cluster disk array system
US6701330B1 (en) Protecting duplicate/lost updates against host failures
US7302526B1 (en) Handling memory faults for mirrored memory
US6687852B1 (en) Ultra reliable disk memory for duplex processor platforms
JPS6357823B2 (en)
JP3266956B2 (en) System storage
JP2504836B2 (en) Information processing system
JP2716571B2 (en) Redundant data security device
JPH07168673A (en) Dual system device
KR100249809B1 (en) A continuous memory backup apparatus and method
JPH076050A (en) Duplex system switching method
JPH05204869A (en) Information processor
JPH07287694A (en) Multiplex processing system and memory synchronous control method
JPH11161545A (en) Control method for closely coupled multiprocessor system, closely coupled multiprocessor system and storage medium therefor
JP2810265B2 (en) Data storage device and information processing system

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 19980203