JPH01286060A - 記憶装置におけるeccエラー処理方式 - Google Patents

記憶装置におけるeccエラー処理方式

Info

Publication number
JPH01286060A
JPH01286060A JP63116655A JP11665588A JPH01286060A JP H01286060 A JPH01286060 A JP H01286060A JP 63116655 A JP63116655 A JP 63116655A JP 11665588 A JP11665588 A JP 11665588A JP H01286060 A JPH01286060 A JP H01286060A
Authority
JP
Japan
Prior art keywords
error
bit
bit error
block
address
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63116655A
Other languages
English (en)
Other versions
JP2503249B2 (ja
Inventor
Takashi Ihi
孝 井比
Tokuji Furuto
古戸 徳二
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP63116655A priority Critical patent/JP2503249B2/ja
Publication of JPH01286060A publication Critical patent/JPH01286060A/ja
Application granted granted Critical
Publication of JP2503249B2 publication Critical patent/JP2503249B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Techniques For Improving Reliability Of Storages (AREA)
  • For Increasing The Reliability Of Semiconductor Memories (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔概 要〕 ECC回路をそなえた記憶装置におけるECCエラー検
出時の処理方式に関し。
多ビット・エラーが発生したとき、可能な限りエラー発
生箇所を局限できるようにして、故障修理等の復旧処理
の効率化と迅速化とを図ることを目的とし。
5EC−DED−SbEDコードを用いたECC回路を
そなえた記録装置において、1ビット・エラーもしくは
多ビット・エラーが発生したそのエラー・アドレス、1
ビット・エラーの位置、シンドロームを含むエラー情報
を、エラー発生ごとに複数回分格納するエラー情報格納
部を設け、多ビット・エラー発生時に、エラー情報格納
部に格納されているエラー情報を用いて、多ビット・エ
ラーに近接して発生した1ピント・エラーの有無を検出
し、1ビット・エラーが有るときそのエラー・アドレス
と前記多ビット・エラーのエラー・アドレスとを比較し
1両エラー・アドレスが一致したとき、前記多ビット・
エラーのシンドロームと1ビット・エラーの位置とに基
づいて、多ビット・エラーを生じたブロックを判定する
構成をもつ。
〔産業上の利用分野〕
本発明は、ECC回路をそなえた記憶装置におけるEC
Cエラー検出時の処理方式に関するものであり、特に多
ピント・エラーが検出された場合のエラー位置の特定お
よびエラー位置メモリの置き換えを行う処理方式に関す
る。
〔発明の背景〕
複数ビットで構成されるRAMを複数個用いて1ワード
を構成した記憶装置では、1つのRAMが故障すると多
ビット・エラーとなってしまう。
しかし従来のECC回路では、多ビット・エラー発生時
に、これらの複数個のRAMの中のどのRAMが故障し
たかを判定することができない。
また、これらのエラーが検出された場合、エラーの原因
がRAMなのか、あるいはRAM以外の周辺回路の故障
によるものかを区別することも。
従来は不可能であった。
ところで、エラーが1ビット・エラーの場合にはECC
回路で救済できるために修復はさほど急を要しないが、
多ビット・エラーの場合にはシステム・ダウンとなるた
めに至急、修復する必要がある。
一般にRAMはアレーカード上に搭載されており、RA
Mの故障と判断できるから、アレーカードのみを交換す
ればよく、比較的短い時間でシステムを復旧できる。し
かし故障がアレーカードでなかった場合には、記憶装置
そのものを交換する必要があるために、長い時間システ
ムを停止しなければならない。
たとえば、故障原因がアレーカードと判断した場合、シ
ステムを1回止めてアレーを交換するが。
これでも直らない場合には、再度システムを止めて、今
度は記憶装置全体を入れ換えなければならなくなる。ま
たこの逆に、アレーカードのみを交換すればよいものを
、装置を交換したりすることもある。このようなことに
なる原因は、交換単位1          毎での故
障位置の切り分けができないためである。
この結果、顧客に多大な迷惑をかけてしまうことになる
このため、特に多ビット・エラーが発生した場合には、
正確なエラーが発生した場合には、正確なエラー発生位
置を迅速に把握して故障修理に対応しなければ、システ
ム・ダウンの時間を不要に長くしてしまう。
また近年の記憶装置は、その処理能率を向上させるため
に、小さな記憶単位を多数用い、各記憶単位が並列動作
可能なようにインターリーブ構成されている。ここで各
記憶単位は、BANKあるいはWAYと呼ばれている。
1つのBANKの中では、ワード方向に多数のRAMを
用いてひとつの列を作り、増設方向にもいくつかのRA
Mを用いて9.いくつかの列を作る。
このようにしてIWAY当たりの記憶容量を大き ′く
しで、全体的に高速動作が可能でかつ、大容量の記憶装
置が構成される。
このような記憶装置では、多数のRAMを使用するため
ECC回路が必要である。またRAMが複数ビットで構
成されていることから特殊なコードを使用したECC回
路にしなければならない。
ここで使用されるECCコードは、複数ビットで構成さ
れるRAMに対応しているものであり、どのRAM1個
が故障して1ないし複数ビット誤りが生じたとしても、
絶対に誤訂正しないようなコードが使用されている。こ
れが5EC−DED−SbEDコードと呼ばれるコード
であり、1ビット・エラーを修正し、bビット・エラー
を検出する機能をそなえているものである。
第7図は、b=4の場合の1ビット・エラー修正4ビッ
ト・エラー検出可能な5EC−DED−34EDコード
の一例である。コードそのものは一般的なものであり、
いくつもの種類のコードが考案されていて、すでに公知
な技術となっているので、詳細な説明は省(。
このコードは、1個のRAMが4ピントで構成されるR
AMを使用した記憶装置のECC回路に使用されるコー
ドであり、1個のRAMが故障して、2L°ツト・エラ
ーないし4ビット・エラーを発生しても、誤って他のピ
ントを訂正したりすることのないように作られている。
コードは4列ずつが1組になって、この組が1個のRA
Mに対応している。ここの例ではRAM00ないしRA
M17で示す18個のRAMを使って、1ワード、72
ビツトのデータを構成している。
1個のRAMが故障して1ビツトが誤ると、1ビット・
エラーが発生するが、この時のシンドローム(エラーパ
ターン)は全部で72列あるパターンのうち、ただ1つ
の列のパターンが得られるようにECC回路が構成され
ている。これによって訂正が可能となる。ところが、2
〜4ビツトのエラーになるとシンドロームが混じり合っ
て、いずれの列とも一致しない。しかし、エラーがあっ
たことのみは識別できる。
本発明は、このようなECCコードを用いてエラー修正
および検出を行うECC回路をそなえた記憶装置におけ
るECCエラー処理性能の向上を図るものである。
〔従来の技術〕
記憶装置に使用されているECC回路によってエラーが
検出されると、シンドローム(エラーパターン)と、こ
の時のエラーを生じたアドレスとで構成されるエラー情
報が得られる。
1ビット・エラー発生時は、このシンドロームを解析す
ることにより、エラー・ピントの位置が判り、このため
1ワードが複数のアレーカードにまたがって構成されて
いた場合でも、どのアレーカードが故障しているかが決
定できる。またこれらのエラー情報は、l事象もしくは
、複数事象分について装置内に保存されているのが普通
である。
従って、1ビット・エラーがシステムが運用中に発生し
ていても、従来は直ぐに修理することをせず、このシス
テムが定期保守時期になるまで待って、装置内に保存さ
れているエラー情報を使用し、アレーカードあるいは装
置を交換するなどの修理を行っていた。
1ビット・エラー時の場合はこれでもよいが。
システム運用中に多ビット・エラーが発生した場合には
筒車ではなく、まず故障した物を交換するために、それ
がアレーカードか、アレーカードを制御するための回路
(以下MACと称する)かの切り分けをしなければなら
ない。
この場合、複数ビットで構成されるRAMが故障すると
1ビツトないし複数ビットのエラーとなるので、これら
のエラーが過去に発生していなかったかどうかを、装置
内に保存されている先のエラー情報を参照して調べてみ
る。そして、同じアドレスのRAMの位置にエラーが発
生していた場合には、アレーカードを疑い、他方、エラ
ー・アドレスが不一致の場合には、装置側を疑って交換
の対象としていた。
しかし、WAYアドレス等が異なる場合は9MAC側を
疑うことにさほど大きな過ちは無いが。
−敗している場合においてアレーカードが悪いと決める
のは危険である。
これは、そのWAYにのみ関するMAC側の回路の故障
等が考えられるからである。したがって。
この種の故障があった場合には、アレーカードを交換し
て復旧させると2回以上システム・ダウンが発生するこ
とになる。
〔発明が解決しようとする課題〕
前述したように、従来の記憶装置におけるECC処理方
式では、システム運用中に多ビット・エラーが発生した
場合、故障部品を交換するために。
故障原因がアレーカード側かMAC側かを過去のエラー
発生情報より判断して切り分け、被疑部品を交換してい
た。そのため仮にアレーカードが悪いとしてこれを交換
した後に、また同じ障害が発生した場合には、今度はM
AC側を交換しなければならなくなり、結局2度ものシ
ステム・ダウンを起してしまうことがあった。
また、エラーが発生した時点では被疑部品の特定に確証
が得られず5また重要なシステムであって再度のダウン
に耐えられないものの場合には。
両方の部品を一度に交換してしまうしかなかった。
これは交換時間がロスとなるばかりでなく、保守部品の
単位を大きくしておかなければならないという問題があ
った。
また、交換した部品は工場等に持ち帰り、故障調査およ
び修理が行われるが、原因がアレーカードと判明してい
ても、多ビット・エラーの場合には、このアレーカード
上に搭載されている複数個のRAMの内のどれが故障を
起しているかは判らず、しかもこの情報はどこにも残さ
れていないため、過去の故障情報を利用して総合的に故
障箇所を判断することができなかった。
また最悪のケースとして、MACとアレーカードの両方
の部品が交換された場合、更に時間がかかるということ
があった。つまり1片方のみに原因があるにもかかわら
ず1両方の被疑部品を調査しなければならなかったから
である。
従って、1ビツト、多ビット・エラーがそれぞれ発生し
ている中で、これらのエラー・アドレスを見て、多ビッ
ト・エラーの障害原因が記憶装置内の制御回路(MAC
)側なのか、アレーカード内のRAM側なのかを即座に
判断して、必並最小限の部品の交換、および必要最小限
の時間でシステムを復旧できることが望ましい。また、
故障原因がアレーカードにある場合、故障しているRA
Mブロックを指示する情報が残り、後の故障修理の助け
となることが望ましい。さらに交替メモリを具備してい
る記憶装置においては、このRAMブロックをそっくり
交替メモリと交替させて1部品の交換無しに、つまりシ
ステムの電源を切断することなく即座にシステムを復旧
させることができることが望ましい。
本発明は、多ビット・エラーが発生したとき。
可能な限りエラー発生箇所を局限できるようにして、故
障修理等の復旧処理の効率化と迅速化とを図ることを目
的とする。
〔課題を解決するための手段〕
本発明は、以下の事実を考慮に入れることによって9課
題の解決を図るものである。
一般的に1部品の故障というものは、単一故障が多く、
同時に2個以上の部品が故障する確率は低いこと、従っ
て複数ビットを有している1個の部品が故障した場合、
この部品に関係するピントのみにエラーが発生し、他の
ブロックに対応するRAMは故障しないと考えることが
できる。
・更にこれらのエラーとなっているビットを含む1ワー
ドの“l”、“O′のデータは、ランダム値に近いこと
、このために、この故障部品に関係するピント部分には
、データにより1ビツト、もしくは多ビット・エラーが
発生すること。
・計算機システムは、高速に大容量のデータを書込み、
読出しを常に行っているから、−旦、エラーが出ると、
エラーが連続的に発生しやすいこと。
・5EC−DED−SbEDコードを用いたECC回路
は、多ビット・エラー発生時に、エラー・ブロックの位
置にほぼ固有のシンドロームを出力するので、これから
エラー・ブロック位置を推定できること。
・故障部品(ブロック)では、1ビット・エラーと多ビ
ット・エラーが高い相関で発生すると考えられるので、
エラー情報間で相関をとり、多ビット・エラーと1ビッ
ト・エラーが同じアドレスで発生しているとき、1ビッ
ト・エラーのエラー・ビット位置が多ビット・エラーで
推定されたエラー・ブロックに含まれていれば、そのエ
ラー・ブロックは高い確率で故障と判定できること。
第1図に9本発明の原理的構成を例示的方法で示す。
図において。
1は、メモリであり、適当なブロック構成をとっている
、たとえばアレーカード上のRAMチップ1個を1ブロ
ツクとしたり、または制御回路側にある書込み、読出し
データレジスタを数ビットずつ1個のLSI等で構成し
ている場合、このLSI等のチップ1個を1ブロツクと
する。
2は、ECC回路であり、5EC−DED−SbEDコ
ードによるECCチエツクを行い、シンドローム(エラ
ーパターン)を生成する。
3は、エラー解析部であり、シンドロームに基づいて、
1ピント・エラーか多ビット・エラーかの判定、1ビッ
ト・エラーの場合のエラー・ビット位置の決定および修
正、などを行う。
4は、エラー情報記憶部であり、エラー解析部3による
エラー解析結果と、シンドローム、エラー・アドレスな
どからなるエラー情報が、エラー発生ごとに複数(Nと
する)回数分格納される。
5は、エラー・ブロック判定部であり、エラー解析部3
が多ビット・エラーを検出したとき、エラー情報記憶部
4のエラー情報に基づいて、可能な場合にエラー・ブロ
ックを特定する。
具体的には、多ビット・エラーに近接してlビット・エ
ラーが発生しているかどうかを調べ、1ビット・エラー
が発生していたとき9両方のエラー・アドレスが−敗し
、かつ1ピント・エラーの位置が、多ピント・エラーの
シンドロームから推定されたブロックの位置に一激する
かどうかを調べ、全て一致するとき、そのブロックを故
障と判定する。
故障と判定されたブロックの位置は記録され。
故障修理の際利用可能にする。また交替メモリが用意さ
れている場合、故障ブロックと自動的に交替させる。
〔作 用〕
はじめに2本発明において、5EC−DED−SbED
コードにより多ビット・エラー発生時のエラー・ブロッ
クを推定する方法について述べる。
第7図に示す5EC−DED−34EDコードの例で説
明すると、1ビット・エラーが発生した場合には1図示
されている72列のコードのいずれか1つがシンドロー
ム・パターンとして生成されることになり、そのエラー
・ビットの位置が特定できる。しかし、2ないし4ビツ
トの多ビット・エラーが発生した場合には、生成される
シンドローム・パターンが72列のコードのいずれとも
一致せず、エラーが発生したことは判ってもエラー・ブ
ロックの位置は特定できない。
しかし、各ブロックに対応するRAMのうちの1個が故
障して多ビット・エラーが発生したときのシンドローム
を計算してみると、第2図に例示されるように、故障し
たブロックの位置ごとにシンドローム・パターンに微妙
な差異が生ずる。
たとえば、1つのブロックのうち、4ビット全部が誤っ
た時のシンドロームは、第2図に示されている各ブロッ
クにおいて左端の1列に示すように1&IILか存在せ
ず、このシンドロームのパターンは、他のブロックで4
ビット全部が誤った時のそれとは異っている。
同様にして1つのRAM中において、任意の3ピントが
誤った場合には、 4C3の組み合せに応じて4通りの
シンドローム・パターンができる。
これらのパターンの場合は、他のブロック内の任意の3
ビツトが誤った時、たまたま同じパターンを生じるケー
スも若干存在する。第2図において。
各ブロックに右端の4列が、任意の3ピントを誤った時
のシンドローム・パターンを示している。
同様にして1つのRAM中において、任意の2ビツトが
誤った場合には、 4C3の組合せに応じて6通りのシ
ンドローム・パターンができる。これらのパターンにつ
いては、他のブロック内の任意の2ビツトが誤った時に
、たまたま同じパターンになるケースも若干存在する。
このため本発明では多ビット・エラーの場合に。
故障したブロックを1つに絞れないことがあるので、そ
のシンドロームからいくつかのブロック位置をまず候補
として推定する。
そして多ビット・エラーに前後して1ビット・エラーが
同じアドレスで重ねて発生しているときには、1ビット
・エラー位置が多ビット・エラーにおける先の推定ブロ
ック位置のうちの1つに含まれる場合に限り、その推定
ブロック位置を多ビット・エラーの発生位置として特定
する。
なおここでの1ビット・エラーは、あるブロック内にお
いて複数ビットが誤り、他のビットが誤訂正を受けた結
果のものではない、これは、ここで使用しているECC
コードによって保証されている。従って故障が1つのR
AMにしか発生していない場合に1ビット・エラーが発
生したなら。
このエラーの発生原因は、このRAMの故障によるもの
しかないといえる。
一般的な5EC−DEDのみのECCコードを使用した
場合には、ブロック・エラーが発生したときに他のビッ
トを誤訂正する確率が高いので。
本発明では5EC−DED−SbEDコードを使用する
ことを前提としている。
第1図に示された本発明の構成では、エラー・プロンク
判定部5が、多ビット・エラーの故障部品特定処理を行
う0図中のフローはそのアルゴリズムを示したもので、
ハードウェア回路あるいはソフトウェア手段によって実
現される。
以下、N単にフローの各ステップ■ないし■を説明する
。なお、エラー情報記憶部4には、エラー解析部3によ
って生成された最近のエラー情報が、複数回分格納され
ているものとする。
■:多ビット・エラーを検出する。
■:■で多ピント・エラーが検出されたとき、その近く
で1ビット・エラーが生じているかどうかを調べる。
■:■で1ビット・エラーが尋食出されたならそのアド
レスと、多ピント・エラーのアドレスとを比較し、一致
しているかどうかを判定する。
■:■でアドレスが一致した場合、1ビット・エラーの
エラー・ビット位置が多ビット・エラーの推定エラー・
ブロックに含まれるかどうかを調べる。
■:■で1ビット・エラーのエラー・ビット位置を含む
推定エラー・ブロックが検出されたとき。
その推定エラー・ブロックを故障部品と判定し。
記録する。
■:■でアドレス不一致および■で該当する推定エラー
・ブロックが存在しなかった場合には、推定エラー・ブ
ロック以外の部品の故障と判定する。
〔実施例〕
第3図に2本発明の実施例による記憶値W(MSU)の
構成を示す0図において。
IOは、記憶装置(MSU)。
11.22はチエツク・ビット発生器(CG)。
12ないし16,20.21.25はレジスタ。
17.18.24はデコーダ(DEC)。
19は、複数のRAMからなるインターリーブ構成のメ
モリ。
23は、排他的OR回路。
26は、エラー情報記憶回路。
27は、エラー・ブロック判定回路。
2日は、排他的OR回路で構成された訂正回路である。
簡単に動作を説明する。書き込みアクセスの場合1図示
されていない記憶制御袋W(MCU)からデータ(WD
)とアドレス(A D D)が与 えられると、データ
(WD)は、レジスタ12にセットされるとともに、チ
エツク・ビット発生器(CG)11に人力され、チエツ
ク・ビット(ECCビット)が生成されて、レジスタ1
3にセントされる。またアドレス(A D D)は、バ
ンク・アドレス、RAM内アドレス、チップ・アドレス
に分離されて、それぞれレジスタ14゜15.16にセ
ントされる。
バンク、アドレスおよびチップ・アドレスは。
それぞれデコーダ17.18により、バンク・セレクト
信号およびチップ・セレクト信号に変換され、RAM内
アドレスとともに、メモリ19に与えられる。
そしてこれらのアドレスによって選択されたメモリ19
の番地に、データ(WD)およびそのチエツク・ビット
が書き込まれる。
一方、読み出しアクセスの場合には、与えられたアドレ
スにより選択されたメモリの番地からデータとチエツク
・ビットが読み出され、それぞれレジスタ20.21に
セットされる。
レジスタ20のデータは、チエツク・ビット発生器(C
G)22へ入力されて、チエツク・ビットが生成される
。この生成されたチエツク・ビットと、レジスタ21の
チエツク・ビットとは、それぞれ排他的OR回路23へ
入力され、レジスタ20のデータにエラーがある場合、
それに応じたシンドロームが生成される。正常データの
場合のシンドロームのパターンは、 all″0”であ
る。
シンドロームは、デコーダ(DEC)24で。
修正用データとして、1ビット・エラーのエラー・ビッ
ト位置1.修正可エラー/修正不能エラーなどの各情報
に変換される。
修正用データは、1ビット・エラーのときにのみ発生さ
れ、訂正回路28に入力されて、レジスタ20からのデ
ータのエラー・ピントを修正する。
1ビット・エラーあるいは多ビット・エラーがある場合
、デコーダ24から出力される各情報と。
そ゛のときのアドレスおよびシンドロームが、エラー情
報記憶回路26に書き込まれる。
エラー・ブロック判定回路27は、エラー情報記憶回路
2G中に、多ピット・エラーのエラー情報を検出すると
、近傍にある1ビット・エラーのエラー情報との間の相
関を調べ、一定の条件のもとてエラー・ブロック位置を
判定する。
第4図および第5図に9.エラー情報記憶回路26およ
びエラー・ブロック判定回路27の詳細な実施例構成を
示す。
エラー情報記憶回路26は、第4図上部に示される3段
4行のシフトレジスタ群で構成されている。シフトレジ
スタの段数は3段に限られるものではなく、多い程多(
のエラー情報を格納でき。
エラー情報間の相関を多くとることができる0段は5T
AGE−0,5TAGE−1,5TAGE−2で表わさ
れ1行は、S、C3,E、CEで表わされる。これらの
シフトレジスタ群には、以下に述べる種々のエラー情報
が入力されるが、同じエラー情報が重複入力されないよ
うにする。
8行、C8行は多ビット・エラー用で、8行のシフトレ
ジスタには、8ビツトのシンドローム5YNDが入力さ
れ、C8行のシンドロームレジスタには、多ビット・エ
ラーすなわちデータ・ブロック・エラー(DBE)が発
生したときのバンク・アドレスおよびバンク内チップ・
セレクト(C3)アドレス等からなるエラー・アドレス
DBE−ADが入力される。
E行、CE行は1ビット・エラー用で、E行のシフトレ
ジスタには、7ビツトからなる1ビット・エラーのピン
ト位置データE−BITが入力され、CE行のシフトレ
ジスタには、1ピント・エラー(S B E)が発生し
たときのエラー・アドレス5BE−ADが入力される。
S、C5,E、CEの各行のシフトレジスタでは、デー
タが入力されるごとに以前のデータが右シフトされる。
その結果の各段5TAGE−0゜1.2から出力される
信号は、それぞれ次のように表わされる。
S−0,3−1,3−2 C3−0,C3−1,C5−2 E−0,8−1,E−2 CE−0,CE−1,CB−2 これらの信号は、第4図の下部に示されているエラー・
ブロック判定回路27の3つの点線ブロックからなるア
ドレス比較部27a、27b。
27cに選択的に入力される。
アドレス比較部27aは、、CE−0に一致するC3−
0.C3−1,C3−2を比較器CMP−00、CMP
−01,CMP−02でそれぞれ検出し、エラー・アド
レスの一致が得られた段のS信号(SYND)、E信号
(E−B IT)、CE倍信号SBE−AD)を、5O
UT−0,EOUT−0,CADD−0として出力する
。なお先行する段の比較で一致が得られたとき、後段の
比較は禁止され、情報の重なり合いが防止される。
アドレス比較部27b、27Cは、27aと同様な構成
をもち、それぞれGE−1,CB−2に一致する03−
0.C3−1,C3−2を検出して、一致する段のS、
E、CEの各信号を、S。
UT−1,EOUT−1,CADD−1,および5OU
T−2,EOUT−2,CADD−2として出力する。
これらの信号は、全部で3組出力されるが、同時には各
組が選択されないように制御されている。
各アドレス比較部27a、27b、27cには。
いずれかの段でエラー・アドレスの一致が得られたとき
を検出するOR回路0R−1sT、0R−2ND、0R
−3RDが設けられており(OR−2ND、0R−3R
Dは図示省略)、ソれぞれから一致検出信号MATCH
IST、MATCH2ND、MATCH3RDが出力さ
れる。
0R−I STは、定数10”入力により常時出力可能
にされ、0R−2NDは、MATCHIsTが“1″の
とき(−敗検出)出力を禁止され、0R−3RDは、M
ATCHISTかMATCH2NDが“1″のとき出力
を禁止される。したがって、MATCHIST、MAT
CH2ND。
MATCH3RDは、この配列順に優先順位をもつ択一
的信号である。
各アドレス比較部27a、27b、27cから出力され
る5OUT、EOUT、CADD(7)各信号は、エラ
ー・ブロック判定回路27の残りの部分を構成する第5
図の回路における入力側のAND回路において、MAT
CHIST、MATCH2ND、MATCH3RDによ
って選択され、それぞれシンドローム・デコーダ5YN
D−DEC,エラー・ビット位置、デコーダE−BIT
−DEC,エラー・アドレス・レジスタEADに入力さ
れる。
5YND−DECは、シンドローム5YNDをデコード
し、ブロック・エラー信号EBL−3ELを出力する。
ここでEBL−3EL信号は。
18個のブロックのうちの1つを示す信号であり。
1〜敗本がオンとなる。これが候補。
一方、E−BIT−DECは1選択されたE−BITを
デコードして、1ビット・エラーの位置をブロック単位
で示すビット・エラー信号EBT−3ELを出力し、1
ビット・エラーがあれば。
必ずいずれかの1つのブロックに対応する線がオンとな
るようにする。
各18本のEBL−3EL信号とEBT−3EL信号と
は、AND回路で論理積をとられ、オン同士が一致した
ビットに対応するエラー・ブロック・レジスタEBLの
ピット位置をオンにセントする。エラー・ブロック・レ
ジスタEBLは、ブロック数に対応するビット数をもっ
ている。
このようにして、多ビット・エラーのエラー・ブロック
と1ビット・エラーのエラー・ブロックとが一致したと
き、対応するエラー・アドレスが。
エラー・アドレス・レジスタEADに格納される。
ここでアドレス長は、8ビツトあるものとされる。
これにより、エラー・ブロック・レジスタEBLとエラ
ー・アドレス・レジスタEADとを見ることにより、多
ビット・エラーを生じたかどうか。
また多ビット・エラーを生じたとき、そのブロックのア
ドレスと位置とを知ることができ、具体的にはアレーカ
ード上の故障したRAMを特定することができる。また
これらのレジスタEBL、EADに何も情報がセットさ
れていないエラーの場合には、RAMの単一故障による
多ビット・エラー以外のエラーとして、たとえばMAC
部を疑うことができる。
これらのエラー・ブロック・レジスタEBL。
エラー・アドレス・レジスタEADの情報を用いること
により、故障したメモリのブロック(たとえばRAM)
を交替メモリとして予め用意したメモリのブロック(R
AM)と交替させることができる。第6図にその1実施
例を示す。
なお第6図では9図を簡単にするため、バンクを1つだ
け示しである。またアドレスの奥行(増設方向)として
RAMチップが4つ使われており、これを選択するため
に2ビツトのチップセレクトアドレスがある。図中のA
LT−REGADDレジスタには、エラー・アドレス中
の2ビツトのチップ・セレクト・アドレスと交替指示が
セットされ、ALT−REG  DATAレジスタには
、エラー・ブロックの位置を示す5ピントの情報が格納
される。これによって18ブロツク中の1ブロツクを選
択する交替メモリALT−MEMは、ブロックサイズの
4ビツトのデータを格納する大きさをもつ。
書き込みデータWDは72ピントあり、セレクタ5EL
−0を介して書き込みレジスタWD−REGに格納され
る。
メモリMEMを格納する各RAMが正常の場合には、書
き込みレジスタWD−REGの出力は。
並列にメモリMEMに入力され、アドレスADDによっ
て選択された番地に書き込まれる。またメモリMEMか
ら読み出された72ビツトの読み出しデータRDは、セ
レクタ5EL−2を介して読み出しレジスタRD−RE
Gに格納され、ECC処理されて出力される。
ECC処理で多ビット・エラーが検出されると。
ALT−REG  DATAレジスタに前述したエラー
・ブロックの位置情報がセットされ、ALT−REG 
 ADDレジスタにエラー・アドレス2ビツトがセット
される。また交替指示ビットもオンにされる。
書き込み時には、ALT−REG  DATAレジスタ
のエラー・ブロック位置情報によりセレクタ5EL−1
を醸■韮し、8亥当するエラー・ブロックの4ビットデ
ータALT−WDを選択して、交替メモリALT−ME
Mに送る。一方、比較器COMPは、入力されたアドレ
スADDと、ALT−REG  ADDレジスタのエラ
ー・アドレスとを比較し、一致したとき、交替メモリA
LT−MEMに対して、ライト・イネーブル信号WEを
出力する。
セレクタ5EL−2は、ALT−REG  DATAレ
ジスタに含まれるエラー・ブロックの位置情報により7
2ビツト中の対応の4ビツトが選択され、ALT−RE
G  ADDレジスタに含まれる交替指示ビットとによ
り制御され、メモリMEMから読み出されるエラー・ブ
ロック・データを。
交替メモリALT−MEMから読み出したブロック・デ
ータで書き換え、読み出しレジスタRD−REGに格納
する。
なお、交替メモリALT−MEMを使用した直後は、交
替メモリALT−MEM中のデータは確定していないの
で、クリアが必要となる。この作業は、svpソフトに
よる命令等で、CPUを使用して記憶装置に書き込み命
令を発行することによりなされる。
多ビット・エラーが発生したとき仮に装置がシステムダ
ウンするものとすれば、記憶装置内部のメモリの内容を
保証する必要がない、したがって。
システムダウンを確認した後は交替メモリを起動して交
替させてしまい、交替したRAM部分に該当するアドレ
ス領域をCPUからクリアすることが可能である。この
後、簡単なメモリ・テストを施した後、エラーが発生し
ない場合には、システムに対し再IPLを起動して、復
旧させることができる。
本実施例では、アレーカード上のRAM1個をエラー・
ブロック1個と定義し、それに基づくシンドローム・パ
ターンに対応するデコーダを準備してお(ことにより、
MAC等の制御回路の故障の場合の被疑箇所の推定も可
能となる。
〔発明の効果〕
本発明は、1ビツト、多ビット・エラーがそれぞれ発生
している中で、これらのエラー・アドレスを見て、多ビ
ット・エラーの障害原因が記憶装置内の制御回路(MA
C)側なのか、アレーカード内のRAM側なのかを即座
に判断して、必要最小限の部品の交換、および必要最小
限の時間でシステムを復旧させることがで、きる。
また、故障原因がアレーカードにある場合、故障してい
るRAMブロックを指示する情報を残し。
後の故障修理を容易にする。
また、交替メモリを具備している記憶装置においては、
このRAMブロックをそり(り交替メモリと交替させて
2部品の交換無し、つまりシステムの電源を切断するこ
となく即座にシステムを復旧させることができる。
【図面の簡単な説明】
第1図は本発明の原理的構成図、第2図は本発明の詳細
な説明するための多ビット・エラーのシンドロームの説
明図、第3図は本発明の1実施例による記憶装置の構成
図、第4図および第5図はそれぞれ本発明の1実施例に
よる詳細回路図、第6図は交替メモリをもつ本発明の1
実施例の回路図、第7図は5EC−DED−34EDコ
ードの説明図である。 第1図中。 l:メモリ 2 : ECC回路 3:エラー解析部 4:エラー情報記憶部 5:エラー・ブロック判定部

Claims (1)

  1. 【特許請求の範囲】 1)SEC−DED−SbEDコードを用いたECC回
    路(2)をそなえた記憶装置において、1ビット・エラ
    ーもしくは多ビット・エラーが発生したそのエラー・ア
    ドレス、1ビット・エラーの位置、シンドロームを含む
    エラー情報を、エラー発生ごとに複数回分格納するエラ
    ー情報記憶部(4)を設け、 多ビット・エラー発生時に、エラー情報記憶部(4)に
    格納されているエラー情報を用いて、多ビット・エラー
    に近接して発生した1ビット・エラーの有無を検出し、
    1ビット・エラーが有るときそのエラー・アドレスと前
    記多ビット・エラーのエラー・アドレスとを比較し、両
    エラー・アドレスが一致したとき、前記多ビット・エラ
    ーのシンドロームと1ビット・エラーの位置とに基づい
    て、多ビット・エラーを生じたブロックを判定すること
    を特徴とする記憶装置におけるECCエラー処理方式。 2)請求項1において、交替用メモリを設け、エラーと
    判定されたブロックを交替用メモリで置き換えることを
    特徴とする記憶装置におけるECCエラー処理方式。
JP63116655A 1988-05-13 1988-05-13 記憶装置におけるeccエラ―処理方式 Expired - Fee Related JP2503249B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63116655A JP2503249B2 (ja) 1988-05-13 1988-05-13 記憶装置におけるeccエラ―処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63116655A JP2503249B2 (ja) 1988-05-13 1988-05-13 記憶装置におけるeccエラ―処理方式

Publications (2)

Publication Number Publication Date
JPH01286060A true JPH01286060A (ja) 1989-11-17
JP2503249B2 JP2503249B2 (ja) 1996-06-05

Family

ID=14692610

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63116655A Expired - Fee Related JP2503249B2 (ja) 1988-05-13 1988-05-13 記憶装置におけるeccエラ―処理方式

Country Status (1)

Country Link
JP (1) JP2503249B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008165772A (ja) * 2007-01-02 2008-07-17 Internatl Business Mach Corp <Ibm> メモリ・システム内の障害メモリ要素を識別する方法及びメモリ・システム
JP2010512601A (ja) * 2006-12-14 2010-04-22 インテル コーポレイション メモリにおけるキャッシュを利用した誤り検出及び訂正方法及び装置
JP2014010712A (ja) * 2012-06-29 2014-01-20 Fujitsu Ltd 電子装置、電子装置制御方法及び電子装置制御プログラム
WO2022074947A1 (ja) * 2020-10-08 2022-04-14 ソニーセミコンダクタソリューションズ株式会社 メモリ制御回路、メモリ、および、メモリモジュール

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010512601A (ja) * 2006-12-14 2010-04-22 インテル コーポレイション メモリにおけるキャッシュを利用した誤り検出及び訂正方法及び装置
JP2008165772A (ja) * 2007-01-02 2008-07-17 Internatl Business Mach Corp <Ibm> メモリ・システム内の障害メモリ要素を識別する方法及びメモリ・システム
JP2014010712A (ja) * 2012-06-29 2014-01-20 Fujitsu Ltd 電子装置、電子装置制御方法及び電子装置制御プログラム
WO2022074947A1 (ja) * 2020-10-08 2022-04-14 ソニーセミコンダクタソリューションズ株式会社 メモリ制御回路、メモリ、および、メモリモジュール

Also Published As

Publication number Publication date
JP2503249B2 (ja) 1996-06-05

Similar Documents

Publication Publication Date Title
US6754858B2 (en) SDRAM address error detection method and apparatus
US5663969A (en) Parity-based error detection in a memory controller
US8140940B2 (en) Method and apparatus for controlling memory
US9042191B2 (en) Self-repairing memory
JPH02278449A (ja) フオールト・トレラント・メモリ・システム
US5666371A (en) Method and apparatus for detecting errors in a system that employs multi-bit wide memory elements
AU597140B2 (en) Efficient address test for large memories
US4251863A (en) Apparatus for correction of memory errors
JPH03248251A (ja) 情報処理装置
US7076686B2 (en) Hot swapping memory method and system
CN112612637B (zh) 内存数据存储方法、内存控制器、处理器芯片及电子设备
US6842867B2 (en) System and method for identifying memory modules having a failing or defective address
JPS6237422B2 (ja)
JPH01286060A (ja) 記憶装置におけるeccエラー処理方式
US20060036913A1 (en) Method to reduce soft error rate in semiconductor memory
JP5361826B2 (ja) 記録ユニット及び故障チップ特定方法
JPH09231785A (ja) 不揮発性半導体記憶装置
JP2006323434A (ja) データ処理装置及びそのメモリ訂正方法
JPH01292550A (ja) 誤り検出回路
US20240168845A1 (en) Memory including error correction circuit and operating method thereof
US11609813B2 (en) Memory system for selecting counter-error operation through error analysis and data process system including the same
JPH01283654A (ja) エラー検出装置
JPH04341998A (ja) メモリ回路
JPS6010661B2 (ja) 誤り検査方式
JPS61253564A (ja) 記憶装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees