JPH06100985B2

JPH06100985B2 - 階層キャッシュ・メモリ装置

Info

Publication number: JPH06100985B2
Application number: JP3180445A
Authority: JP
Inventors: 博文村谷
Original assignee: 工業技術院長
Priority date: 1991-06-26
Filing date: 1991-06-26
Publication date: 1994-12-12
Anticipated expiration: 2009-12-12
Also published as: JPH052534A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、複数のプロセッサとメ
イン・メモリとの間に階層的に複数のキャッシュ・メモ
リを配置するように構成した階層キャッシュ・メモリ装
置に関するものである。

【０００２】

【従来の技術】従来、商用並列計算機に採用されるマル
チプロセッサ・アーキテクチャには、他のマルチプロセ
ッサ・アーキテクチャと比較して、その実現の容易さ、
実行するプログラムのプログラミングの容易さなどの理
由からバス共有型のマルチプロセッサが用いられてい
る。しかし、このようなバス共有型のものは、その問題
点としてプロセッサの台数が多くなったときにバス・ボ
トルネックが生ずることがある。

【０００３】この問題を解決するものとして、複数のプ
ロセッサとメイン・メモリの間にキャッシュ・メモリを
設け、メイン・メモリへのアクセス頻度を実効的に減少
させることで、より多くのプロセッサがバスを共有でき
るようにすることが考えられている。

【０００４】一方、このようなアーキテクチャには、各
キャッシュ・メモリ間およびキャッシュ・メモリとメイ
ン・メモリ間のデータの一貫性に関する問題、いわゆ
る、キャッシュ・コンシステンシ問題がある。

【０００５】この問題の解決策としては、スヌーピング
・キャッシュを用いた方法と、ディレクトリ・ベースの
方法が考えられている。

【０００６】ここで、スヌーピング・キャッシュによる
方法について述べると、この方法では、キャッシュ・メ
モリ間のデータの一貫性を保証するためにキャッシュ・
コンシステンシ・プロトコルを採用しているが、これま
でにキャッシュ・コンシステンシ・プロトコルとして数
多くのものが提案されてきた（例えば、ＰｅｒＳｔｅ
ｎｓｔｒｏｍ，“ＳｕｒｖｅｙｏｆＣａｃｈｅＣ
ｏｈｅｒｅｎｃｅＳｃｈｅｍｅｓｆｏｒＭｕｌｔ
ｉｐｒｏｃｅｓｓｏｒｓ，”ＩＥＥＥＣｏｍｐｕｔｅ
ｒ２３，６（１９９０），１２−２４）。

【０００７】一方、このようにキャッシュ・メモリを有
するバス共有型のマルチプロセッサでも、プロセッサの
数が増えると、やはりバス・ボトルネックが問題とな
る。これは、データ・アクセスのためのバス・トランザ
クション頻度の増加と、それに加えて、キャッシュ・メ
モリ間およびメイン・メモリとキャッシュ・メモリ間で
のデータ一貫性を保つためのバス・トランザクションの
頻度が増加するためである。

【０００８】この問題を解決するものとして、キャッシ
ュ・メモリとメイン・メモリの間に新たなキャッシュ・
メモリを階層的に設けた階層キャッシュ・メモリ装置が
考えられている。（例えば、ＡｎｄｒｅｗＷ．Ｗｉｌ
ｓｏｎ，Ｊｒ．，“ＨｉｅｒａｒｃｈｉｃａｌＣａｃ
ｈｅ／ＢｕｓＡｒｃｈｉｔｅｃｔｕｒｅｆｏｒＳｈａ
ｒｅｄＭｅｍｏｒｙＭｕｌｔｉｐｒｏｃｅｓｓｏｒ
ｓ，”Ｐｒｏｃ．１４ｔｈＩｎｔ´ｌＳｙｍｐ．
ｏｎＣｏｍｐｕｔｅｒＡｒｃｈｉｔｅｃｔｕｒｅ
（１９８７），２４４−２５２）。

【０００９】図５２は、この種の階層キャッシュ・メモ
リ装置の概念図である。この場合、複数のプロセッサ１
にそれぞれ所有されたプライベート・キャッシュ（以下
ではファースト・キャッシュと呼ぶ）２を所定個数（図
示例では４個）の単位で相互に接続するためのバス（以
下ではキャッシュ・バスと呼ぶ）３を接続し、このキャ
ッシュ・バス３に新たなキャッシュ（以下ではセカンド
・キャッシュと呼ぶ）４を接続してクラスタ５を構成し
ている。そして、このように構成した各クラスタ５をメ
イン・メモリ６を接続した新たなバス（以下ではメモリ
・バスと呼ぶ）７に接続している。

【００１０】一方、このような階層構造を持つキャッシ
ュ・メモリ装置は、キャッシュ・コンシステンシ・プロ
トコルとして、ライト・スルー方式のような制御が比較
的単純で実現の容易なものが採用されることが多いが、
バス・トラフィックをさらに軽減するため、従来の１階
層のキャッシュ・コンシステンシ・プロトコルを拡張し
た複雑なプロトコルも提案されている。

【００１１】ここで、従来、１階層のキャッシュ・コン
システンシ・プロトコルとしては、すでに数多くのもの
が提案され、さまざまな性能評価も行われている。例え
ば、Ｂｅｒｋｅｌｅｙ方式のプロトコルでは、これはイ
ンバリデーション・タイプのキャッシュ・プロトコルで
あるが、キャッシュ・ブロックごとにキャッシュ・ブロ
ックの状態に関する情報を格納する手段を持ち、その状
態として「４」種類を有したものがある。具体的には、
各状態の意味は下記の通りである（ＧａｅｔａｎｏＢ
ｏｒｒｉｅｌｌｏｅｔａｌ．，“Ｄｅｓｉｇｎａ
ｎｄＩｍｐｌｅｍｅｎｔａｔｉｏｎｏｆａｎＩｎ
ｔｅｇｒａｔｅｄＳｎｏｏｐｉｎｇＤａｔａＣａｃ
ｈｅ，”ＵＣＢ／ＣＳＤ８４／１９９（１９８
４））。

【００１２】ＩＮＶ（Ｉｎｖａｌｉｄ）：データは無効
である。

【００１３】ＵＮＯ（ＵｎＯｗｎｅｄ）：データは有効
であるが、他のキャッシュ・メモリと共有している可能
性がある。

【００１４】ＮＯＮ（ＯｗｎｅｄＮｏｎＥｘｃｌｕｓ
ｉｖｅｌｙ）：そのブロックのオーナーシップを持つ、
他のキャッシュ・メモリに知らせること（データの無効
化）なく更新はできない。

【００１５】ＥＸＣ（ＯｗｎｅｄＥｘｃｌｕｓｉｖｅ
ｌｙ）：他のキャッシュ・メモリとそのブロックを共有
していないので、局所的に更新できる。

【００１６】ここで、“オーナーシップを持つ”キャッ
シュ・ブロックとは、そのキャッシュ・ブロックのデー
タが最新のデータであり、そのキャッシュ・ブロックの
追い出しが発生した際にはデータをコピー・バックする
必要性があるキャッシュ・ブロックであるという意味で
ある。

【００１７】一方、１階層のキャッシュ・コンシステン
シ・プロトコルを拡張した２階層のキャッシュ・メモリ
装置の階層キャッシュ・コンシステンシ・プロトコルも
提案されている。この場合、図５２の各プロセッサ１に
備えられているファースト・キャッシュ２のキャッシュ
・ブロックの状態としては、上述の「４」つの状態をそ
のまま用いることができる。また、これらのファースト
・キャッシュ２とメイン・メモリ６との間に接続される
セカンド・キャッシュ４のキャッシュ・ブロックの状態
は、上述した４つの状態をそのままの意味で用いること
はできない。具体的には、次のような階層キャッシュ・
コンシステンシ・プロトコルが提案されている。（浅野
滋博，“２階層並列キャッシュ・コンシステンシ・プロ
トコル，”情報処理学会計算機アーキテクチャ研究会報
告８０−３（１９９０），１７−２４）。

【００１８】ＩＮＶ：データは有効である。

【００１９】ＵＮＯ：データは有効であるが、他のセカ
ンド・キャッシュと共有している可能性がある。

【００２０】ＮＯＮ：そのブロックのオーナーシップを
持つが、他のセカンド・キャッシに知らせることなく更
新はできない。

【００２１】ＥＸＣ：同じクラスタ内のファースト・キ
ャッシュの中にオーナーシップを持つものがある。

【００２２】この場合、このようなキャッシュ・プロト
コルのセカンド・キャッシュのキャッシュ・ブロックの
状態遷移は、図５３に示すようになっている。ここで、
図面中のＲＦＯ、ＲＳＨ、ＷＦＩ、ＷＷＩは、バス・コ
マンドの種類を表し、添え字Ｃ、Ｍは、それぞれのコマ
ンドがキャッシュ・バスまたはメモリ・バスのものであ
ることを表している。そして、これらのコマンドの意味
は次のようになっている。

【００２３】ＲＳＨ：データコピーを要求するコマンド
（オーナーシップの移行を伴わない）。

【００２４】ＲＦＯ：データコピーを要求するコマンド
（オーナーシップの移行を伴う）。

【００２５】ＷＦＩ：無効化のためのコマンド。

【００２６】ＷＷＩ：コピー・バックのためのコマン
ド。

【００２７】次に、このようなコンシステンシ・プロト
コルを持つ階層キャッシュ・メモリ装置の動作例を図５
４乃至図６０を用いて説明する。まず、図５４は、ある
プロセッサＰ１がファースト・キャッシュＣ１にリード
の要求を出したところ、ファースト・キャッシュＣ１は
要求されたデータのコピーを持たず、キャッシュ・バス
Ｂ１にデータのコピーを要求するコマンドＲＳＨを送出
した状態を示している。この場合、要求されたデータを
同じクラスタ内の他のファースト・キャッシュＣ２が持
っていれば、そのファースト・キャッシュＣ２がデータ
コピーを要求元のファースト・キャッシュＣ１に返すよ
うになる。ところが、同じクラスタ５内の他のファース
ト・キャッシュＣ２が要求されたデータを持たない場合
は、セカンド・キャッシュＣ３がそのデータを持ってい
れば、要求元のファースト・キャッシュＣ１にデータの
コピーを返すようになる。

【００２８】しかし、セカンド・キャッシュＣ３にも要
求データが存在しない場合には、このセカンド・キャッ
シュＣ３よりメモリ・バスＢ２にデータのコピーを要求
するコマンドＲＳＨを送出する（図５５）。この場合、
セカンド・キャッシュＣ３の発したコマンドＲＳＨの要
求するデータが他のセカンド・キャッシュＣ４に存在し
ないならば、メイン・メモリＭがデータコピーをセカン
ド・キャッシュＣ３に返すようになる。また、他のセカ
ンド・キャッシュＣ４に要求されたデータが存在すれ
ば、そのセカンド・キャッシュＣ４がデータのコピーを
返すようになる。ただし、セカンド・キャッシュＣ４に
おいて要求されたデータがＥＸＣ状態ならば、図５６が
示すように、セカンド・キャッシュＣ４と直接にキャッ
シュ・バスＢ３で接続されたファースト・キャッシュＣ
５のいずれかに最新のデータがあるので、セカンド・キ
ャッシュＣ４はキャッシュ・バスＢ３にデータのコピー
を要求するコマンドを発する。そして、図５７が示すよ
うに、最新のデータを持つファースト・キャッシュＣ５
のキャッシュ・ブロックの状態をＵＮＯにし、データコ
ピーをセカンド・キャッシュＣ４に返すようになる。

【００２９】次に、図５８に示すように、セカンド・キ
ャッシュＣ４は、受け取ったデータを保存し、キャッシ
ュ・ブロックの状態をＮＯＮにし、データコピーをセカ
ンド・キャッシュＣ３に返す。データを受け取ったセカ
ンド・キャッシュＣ３は、図５９に示すように、データ
を保存し、キャッシュ・ブロックの状態をＵＮＯにし、
データコピーをファースト・キャッシュＣ１に返す。デ
ータを受け取ったファースト・キャッシュＣ１は、図６
０に示すように、データを保存し、キャッシュ・ブロッ
クの状態をＵＮＯにし、プロセッサＰ１にデータのコピ
ーを返す。このようにして一連の動作が完了する。

【００３０】ところで、一般にセカンド・キャッシュの
容量はファースト・キャッシュの容量より大きく設定さ
れることが多く、ファースト・キャッシュから追い出さ
れたブロックがセカンド・キャッシュに留まる場合があ
ることが期待される。このような場合には、このキャッ
シュ・ブロックへのアクセスが再び行われた際に、メモ
リ・バスにまで要求を出すことなく、データのフェッチ
を行うことが可能である。これは再びメイン・メモリに
アクセスする時間よりも短い時間でアクセスできるので
キャッシュの階層化によりシステム性能の向上が期待で
きる理由である。

【００３１】ところが、セカンド・キャッシュとして上
述した図５３に示す状態遷移のキャッシュ・プロトコル
を持つ階層キャッシュ・メモリ装置においては、上述し
たような効果が必ずしも期待できない場合がある。これ
は、次のような場合である。

【００３２】いま、ファースト・キャッシュにおいてＥ
ＸＣ状態またはＮＯＮ状態にあったキャッシュ・ブロッ
クが追い出されてセカンド・キャッシュにコピー・バッ
クされると、セカンド・キャッシュではそのデータがＮ
ＯＮ状態となって保存される。

【００３３】次に、プロセッサがこのブロックのデータ
に対してライトのアクセスを行うと、セカンド・キャッ
シュにおいて要求されたブロックの状態は、他のクラス
タのセカンド・キャッシュとデータを共有しているかも
しれないＮＯＮ状態なので、メモリ・バスに対して他の
セカンド・キャッシュの対応するエントリを無効化する
ための要求ＷＦＩが発せられる。このとき、実際には他
のセカンド・キャッシュと共有していなかったとして
も、そのセカンド・キャッシュのキャッシュ・ブロック
の状態がＮＯＮ状態である限り無効化のための要求をメ
モリ・バスに発せざるをえなくなる。

【００３４】このような問題点が目立つのは、例えば、
シングルプロセッサで動作するプログラムをあるプロセ
ッサに割付けて実行するような場合を考えると、この場
合のプロセッサは他のプロセッサ上のプログラムとデー
タ共有をしていないので、メモリ・バス上に他のセカン
ド・キャッシュのブロックを無効化するためのバス・コ
マンドＷＦＩを本来発する必要が全くない。ところが、
図５３に示すキャッシュ・プロトコルでは、無駄なバス
・コマンドが発せられることになる。

【００３５】

【発明が解決しようとする課題】このように従来の階層
キャッシュ・メモリ装置であって、コンシステンシ・キ
ャッシュ・プロトコルとしてＢｅｒｋｅｌｅｙ方式の４
状態キャッシュ・プロトコルを拡張することで得られる
プロトコルを用いたものは、メモリ・バスに本来不要な
無効化するためのバス・トランザクションが生じてしま
う。この無駄なバス・トランザクションは、システム性
能を低下させるものであり、特に、メモリ・バスがボト
ルネックとなるシステムにおいては、このような無駄な
バス・トランザクションの発生によるバス・トラフィッ
クの増加は、システム性能を著しく低下させる原因にな
っている。

【００３６】本発明は上記事情に鑑みてなされたもの
で、無効化のためのバス・トランザクションのうち本来
不要なものの発生を抑えることができ、システム性能の
向上を図ることができる階層キャッシュ・メモリ装置を
提供することを目的とする。

【００３７】

【課題を解決するための手段】本発明は、複数のプロセ
ッサにそれぞれ設けられた第１のキャッシュ・メモリ、
これらの第１のキャッシュ・メモリを所定個数の単位で
相互に接続するキャシュ・バス、これらキャシュ・バス
にそれぞれ設けられた第２のキャッシュ・メモリ、これ
ら第２のキャッシュ・メモリを相互に接続するメモリ・
バス、このメモリ・バスに接続されたメイン・メモリと
を具備した階層キャッシュ・メモリ装置であって、第２
のキャッシュ・メモリのキャッシュ・ブロックごとに、
そのデータが他の第２のキャッシュ・メモリと共有され
ておらず、かつ、第２のキャッシュ・メモリとキュャシ
ュ・バスで接続されている第１のキャッシュ・メモリ中
に更新による当該第２のキャッシュ・メモリ内のデータ
よりも最新の値を持つものがない状態、いわゆるオーナ
ーシップを持つものが存在しないことを表す情報を格納
可能にし、第１のキャッシュ・メモリから第２のキャッ
シュ・メモリに対してデータのリードまたはライトのた
めデータのコピーの要求または他のクラスタのキャッシ
ュ・メモリ内のデータの無効化のための要求が生じる
と、第２のキャッシュ・メモリのキャッシュ・ブロック
に格納された情報に基づいた状態を判断し、この状態を
満足するものである場合、他の第２のキャッシュ・メモ
リに対してリードまたはライトのためのデータのコピー
要求またはデータの無効化のための要求を送出すること
なく前記データのコピー要求元の第１のキャッシュ・メ
モリに対して応答を返すようにしている。

【００３８】

【作用】この結果、本発明によれば、第１のキャッシュ
・メモリにおいてその第１のキャッシュ・メモリ自らが
オーナーシップを持つキャッシュ・ブロックが追い出さ
れてコピー・バックが発生した際に、第２のキャッシュ
・メモリ内に、コピー・バックされたキャッシュ・ブロ
ックの状態を、そのキャッシュ・ブロックを他のクラス
タと共有しておらず、かつ、その第２のキャッシュ・メ
モリと同じクラスタ内の第１のキャッシュ・メモリには
そのキャッシュ・ブロックのオーナーシップを持つもの
が存在しないことを表わす状態の情報を格納する。そし
て、（１）第１のキャッシュ・メモリにおいてリード・
ミスまたはライト・ミスし、データのコピーを要求する
コマンドがキャッシュ・バスに発せられ、同じクラスタ
内の他の第１のキャッシュ・メモリに要求されたデータ
が存在せず、かつ、同じクラスタ内の第２のキャッシュ
・メモリにおいて要求されたデータが上記情報に基づい
た状態を満足するものである場合は、第２のキャッシュ
・メモリは、データのコピーを要求するコマンドをメモ
リ・バスに発することなく、第１のキャッシュ・メモリ
にデータと共に応答を返す。その際、第２のキャッシュ
・メモリにおけるそのキャッシュ・ブロックの状態は、
リードの場合には変えず、ライトの場合にはＥＸＣ状態
に変えるようになる。（２）第１のキャッシュ・メモリ
において他のキャッシュとデータを共有しているキャッ
シュ・ブロックに対するライトが発生し、無効化のため
のバス・コマンドがキャッシュ・バスに発せられ、同じ
クラスタ内の第２のキャッシュ・メモリに要求されたデ
ータが他の先に述べた状態を満足するものでにある場合
は、第２のキャッシュ・メモリは、他のクラスタのデー
タを無効化するためのバス・コマンドをメモリ・バスに
発することなく、第１のキャッシュ・メモリに応答を返
すようになる。（３）第１のキャッシュ・メモリにおい
てリード・ミスし、そのデータのコピーを要求するコマ
ンドがキャッシュ・バスに発せられ、同じクラスタ内の
他の第１のキャッシュ・メモリ内にも第２のキャッシュ
・メモリ内にもそのデータが存在せず、メモリ・バス経
由で他の第２のキャッシュ・メモリに対してデータのコ
ピーを要求するコマンドが発せられ、要求されたデータ
が他のある第２のキャッシュ・メモリにおいて先に述べ
た状態を満足するものである場合は、キャッシュ・バス
に対して第１のキャッシュ・メモリへのデータのコピー
の要求のためのバス・コマンドを発することなく、メモ
リ・バスにデータのコピーと共に応答を返す。その際第
２のキャッシュ・メモリ内のそのキャッシュ・ブロック
の状態は他の第２のキャッシュ・メモリとのデータの共
有があることを表わす状態に遷移するようになる。

【００３９】これにより不要なバス・トラフィックを防
ぐことができるようになり、システムの性能の向上をも
たらすことが可能になる。特に、メモリ・バスがシステ
ム性能のネックになっている場合は、その効果は著し
い。

【００４０】

【実施例】以下、本発明の一実施例を図面に従い説明す
る。

【００４１】まず、本発明の階層キャッシュ・メモリ装
置の概略構成については、先に述べた図５２のものと同
様であり、ここでの説明は省略する。

【００４２】次に、図１は、同階層キャッシュ・メモリ
装置に用いられるセカンド・キャッシュの概略構成を示
している。図において、１１はタグ・メモリ、１２は状
態メモリ、１３はデータ・メモリである。また、１４は
上述したキャッシュ・バス３のインタフェース部、１５
は上述したメモリ・バス７のインタフェース部、１６は
キャッシュ・バス３に対してコマンドの受け渡しを行う
キャッシュ・バス・コントローラ、１７はメモリ・バス
７に対してコマンドの受け渡しを行うメモリ・バス・コ
ントローラである。さらに、１８、１９はヒット／ミス
の判定出力を発するコンパレータ、２０、２１はセレク
タである。

【００４３】ここで、状態メモリ１２は、キャッシュ・
ブロックの状態を表わす情報が格納されている。キャッ
シュ・バス・コントローラ１６は、キャッシュ・バス３
からのコマンドに対して応答するための制御とキャッシ
ュ・バス３にコマンドを発するための制御を行う。メモ
リ・バス・コントローラ１７は、メモリ・バス７からの
コマンドに対して応答するための制御とメモリ・バス７
にコマンドを発するための制御を行う。この場合、これ
らキャッシュ・バス・コントローラ１６およびメモリ・
バス・コントローラ１７は、それぞれの制御を行うため
にタグ・メモリ１１や状態メモリ１２に格納されている
情報を利用するようになっている。

【００４４】次に、同実施例で採用する階層キャッシュ
・プロトコルについて説明する。

【００４５】この場合、キャッシュ・ブロックの状態の
意味を説明するために、ＭＯＥＳＩモデルを拡張して得
られるモデルを導入する。本来のＭＯＥＳＩモデルはＦ
ｕｔｕｒｅｂｕｓの標準化においてキャッシュ・プロト
コルを統一的に理解するために提案されたモデルである
（ＰａｕｌＳｗｅａｚｅｙａｎｄＡｌａｎＪａ
ｙＳｍｉｔｈ “ＡＣｌａｓｓｏｆＣｏｍｐａ
ｔｉｂｌｅＣａｃｈｅＣｏｎｓｉｓｔｅｎｃｙＰｒ
ｏｔｏｃｏｌｓａｎｄｔｈｅｉｒＳｕｐｐｏｒｔ
ｂｙｔｈｅＩＥＥＥＦｕｔｕｒｅｂｕｓ，”Ｐ
ｒｏｃ．１３ｔｈＩｎｔ´ｌＳｙｍｐｏｓｉｕｍ
ｏｎＣｏｍｐｕｔｅｒＡｒｃｈｉｔｅｃｔｕｒ
ｅ，（１９８８），２８０−２８９）。そして、ＭＯＥ
ＳＩモデルはキャッシュ・ブロックの状態を特徴付ける
性質として、次の三つを考えている。

【００４６】ｖａｌｉｄｉｔｙ：有効であるか（ｖａｌ
ｉｄ）否か（ｉｎｖａｌｉｄ）。

【００４７】ｏｗｎｅｒｓｈｉｐ：オーナーシップを持
つか（ｏｗｎｅｄ）否か（ｕｎｏｗｎｅｄ）。

【００４８】ｅｘｃｌｕｓｉｖｅｎｅｓｓ：他キャッシ
ュと共有されているか（ｓｈａｒｅｄ）否か（ｅｘｃｌ
ｕｓｉｖｅ）。

【００４９】ここで、オーナーシップを持つとは、その
キャッシュ・ブロックが最新のデータを持っており、キ
ャッシュから追い出されるときにはコピー・バックを行
う必要があるということである。この考え方に従うと、
Ｂｅｒｋｅｌｅｙ方式のプロトコルにおける４つの状態
の意味は次のようになる。

【００５０】ＩＮＶ：ｉｎｖａｌｉｄＵＮＯ：ｖａｌｉｄ＆ｕｎｏｗｎｅｄ＆（ｐｏ
ｔｅｎｔｉａｌｌｙ）ｓｈａｒｅｄＮＯＮ：ｖａｌｉｄ＆ｏｗｎｅｄ＆（ｐｏｔｅ
ｎｔｉａｌｌｙ）ｓｈａｒｅｄＥＸＣ：ｖａｌｉｄ＆ｏｗｎｅｄ＆ｅｘｃｌｕ
ｓｉｖｅしかして、１階層のキャッシュ・メモリ装置の場合は、
このような意味付けで十分であったが、２階層の階層キ
ャッシュ・メモリ装置の場合のキャッシュ・コンシステ
ンシ・プロトコルの状態を説明するには、この３つの性
質だけでは十分とは言えない。特に、セカンド・キャッ
シュのキャッシュ・ブロックの状態に対しては階層キャ
ッシュ・メモリ装置のクラスタ構造を反映した性質を導
入して意味付けを行う必要がある。

【００５１】そこで、ＭＯＥＳＩモデルを次のように拡
張する。この場合、キャッシュ・ブロックの状態を特徴
付ける性質として次の５つを考える：ｖａｌｉｄｉｔｙ：有効であるか（ｖａｌｉｄ）否か
（ｉｎｖａｌｉｄ）ｃ−ｏｗｎｅｒｓｈｉｐ：クラスタとしてオーナーシッ
プを持つか（ｃ−ｏｗｎｅｄ）否か（ｃ−ｕｎｏｗｎｅ
ｄ）。

【００５２】ｃ−ｅｘｃｌｕｓｉｖｅｎｅｓｓ：他クラ
スタと共有しているか（ｃ−ｓｈａｒｅｄ）否か（ｃ−
ｅｘｃｌｕｓｉｖｅ）。

【００５３】ｉ−ｏｗｎｅｒｓｈｉｐ：クラスタ内でオ
ーナーシップを持つか（ｉ−ｏｗｎｅｄ）否か（ｉ−ｕ
ｎｏｗｎｅｄ）。

【００５４】ｉ−ｅｘｃｌｕｓｉｖｅｎｅｓｓ：クラス
タ内で他キャッシュと共有しているか（ｉ−ｓｈａｒｅ
ｄ）否か（ｉ−ｅｘｃｌｕｓｉｖｅ）。

【００５５】ここで、オーナーシップについて説明する
と、図５２においてファースト・キャッシュ２は、オー
ナーシップを持っているキャッシュ・ブロックが追い出
された際には、そのデータをセカンド・キャッシュ４に
対してコピー・バックする必要があり、セカンド・キャ
ッシュ４は、オーナーシップを持つキャッシュ・ブロッ
クが追い出された際には、そのデータをメイン・メモリ
６にコピー・バックする必要がある。そして、“クラス
タとしてオーナーシップを持つ”という意味は、そのキ
ャッシュを含んでいるクラスタ５内のファースト・キャ
ッシュ２の中にそのキャシュ・ブロックのオーナーシッ
プを持つものが存在するか、もしくは、そのクラスタ５
内のファースト・キャッシュ２の中にそのキャッシュ・
ブロックのオーナーシップを持つものが無いが、セカン
ド・キャッシュ４がそのキャッシュ・ブロックのオーナ
ーシップを持っているかのいずれかであるという意味で
ある。また、セカンド・キャッシュ４が“クラスタ内で
オーナーシップ”を持つとは、そのセカンド・キャッシ
ュ４を含んでいるクラスタ５内のファースト・キャッシ
ュ２の中にはそのキャッシュ・ブロックのオーナーシッ
プを持つものがないが、セカンド・キャッシュ４自身は
そのキャッシュ・ブロックのオーナーシップを持ってい
るという意味である。さらに、ファースト・キャッシュ
２が“クラスタ内でオーナーシップを持つ”とは、その
ファースト・キャッシュ２がそのキャッシュ・ブロック
のオーナーシップを持つという意味である。従って、こ
の定義によれば、ｉ−ｏｗｎｅｄならば必ずｃ−ｏｗｎ
ｅｄであると言える。しかし、ｃ−ｏｗｎｅｄであるか
らと言って必ずしもｉ−ｏｗｎｅｄではない。

【００５６】次に、共有について説明すると、一般にフ
ァースト・キャッシュ２があるキャッシュ・ブロックを
共有するとは、他のファースト・キャッシュ２がやはり
そのキャッシュ・ブロックのデータを持っていることを
意味する。また、セカンド・キャッシュ４があるキャッ
シュ・ブロックを共有するとは、他のセカンド・キャッ
シュ４がやはりそのキャッシュ・ブロックのデータを持
っていることを意味する。そして、“クラスタとして共
有している”とは、そのキャッシュを含むクラスタ５で
はない別のクラスタ５内のキャッシュ（ファースト・キ
ャッシュ２でもセカンド・キャッシュ４でもよい）がや
はりそのキャッシュ・ブロックのデータを持っているこ
とを意味する。また、セカンド・キャッシュ４が“クラ
スタ内で共有する”とは、そのセカンド・キャッシュ４
を含むクラスタ５内のファースト・キャッシュ２の中に
そのキャッシュ・ブロックのデータを持つものがあるこ
とを意味している。さらに、ファースト・キャッシュ２
が“クラスタ内で共有する”とは、そのファースト・キ
ャッシュ２を含むクラスタ５内の他のファースト・キャ
ッシュ２あるいはセカンド・キャッシュ４がそのキャッ
シュ・ブロックのデータを持っていることを意味してい
る。（本実施例では、ファースト・キャッシュ２にある
データは必ずそのクラスタ５内のセカンド・キャッシュ
４も持っているというマルチレベル包含性が成り立って
いるので、ファースト・キャッシュ２がｉ−ｅｘｃｌｕ
ｓｉｖｅのキャッシュ・ブロックを持つことはない。）
しかして、先に述べたＢｅｒｋｅｌｅｙ方式のキャッシ
ュ・プロトコルの素直な拡張によるキャッシュ・プロト
コルにおけるセカンド・キャッシュ４のキャッシュ・ブ
ロックの状態の意味は次のようになる：ＩＮＶ：ｉｎｖａｌｉｄＵＮＯ：ｖａｌｉｄ＆ｃ−ｕｎｏｗｎｅｄ＆ｃ
−ｓｈａｒｅｄ＆ｉ−ｕｎｏｗｎｅｄ＆ｉ−ｓｈ
ａｒｅｄＮＯＮ：ｖａｌｉｄ＆ｃ−ｏｗｎｅｄ＆ｃ−ｓ
ｈａｒｅｄ＆ｉ−ｏｗｎｅｄ＆ｉ−ｓｈａｒｅ
ｄＥＸＣ：ｖａｌｉｄ＆ｃ−ｏｗｎｅｄ＆ｃ−ｅ
ｘｃｌｕｓｉｖｅ＆ｉ−ｕｎｏｗｎｅｄ＆ｉ−ｓ
ｈａｒｅｄセカンド・キャッシュ４の状態メモリは各ブロックがこ
れらのいずれの状態にあるかを表わす情報を格納する。
そして、本発明では、新たな状態として下記の状態を導
入する。

【００５７】ＥＸＩ：ｖａｌｉｄ＆ｃ−ｏｗｎｅｄ
＆ｃ−ｅｘｃｌｕｓｉｖｅ＆ｉ−ｏｗｎｅｄ＆
ｉ−ｓｈａｒｅｄ以下、これをＥＸＩ状態と呼ぶことにする。

【００５８】次に、セカンド・キャッシュ４の状態メモ
リに格納する情報について説明する。本実施例では、セ
カンド・キャッシュ４の状態メモリ内には各キャッシュ
・ブロックのｖａｌｉｄｉｔｙ、ｃ−ｏｗｎｅｒｓｈｉ
ｐ、ｃ−ｅｘｃｌｕｓｉｖｅｎｅｓｓ、ｉ−ｏｗｎｅｒ
ｓｈｉｐ、ｉ−ｅｘｃｌｕｓｉｖｅｎｅｓｓを表すため
に１ビットずつのメモリ領域を割り当てている。つま
り、セカンド・キャッシュ４の状態メモリには、（００
０００）をＩＮＶ状態、（１００００）がＵＮＯ状態、
（１１０１０）がＮＯＮ状態、（１１１００）がＥＸＣ
状態、（１１１１０）がＥＸＩ状態を表すように各情報
が格納される。ここで、（ｂ０，ｂ１，ｂ２，ｂ３，ｂ
４）の５ビットの各ビットは、ｂ０：ｖａｌｉｄｉｔ
ｙ、ｂ１：ｃ−ｏｗｎｅｒｓｈｉｐ、ｂ２：ｃ−ｅｘｃ
ｌｕｓｉｖｅｎｅｓｓ、ｂ３：ｉ−ｏｗｎｅｒｓｈｉ
ｐ、ｂ４：ｉ−ｅｘｃｌｕｓｉｖｅｎｅｓｓという意味
である。以下ではこれらのビットを状態ビットと呼ぶこ
とにする。ただし、これまでの説明で分かるように、セ
カンド・キャッシュのキャッシュ・ブロックの状態はど
の状態においてもｉ−ｅｘｃｌｕｓｉｖｅｎｅｓｓがｉ
−ｓｈａｒｅｄなのでｉ−ｅｘｃｌｕｓｉｖｅｎｅｓｓ
に関するビットを格納する必要がない。

【００５９】次に、図２（ａ）は、状態メモリの内容を
示している。ここでは、セカンド・キャッシュ４は、ブ
ロック数Ｎで４ウェイのセット・アソシアティブ方式の
キャッシュ・メモリの場合を示している。この場合、各
エントリに対応して４ビットの領域が割り当てられられ
るが、セカンド・キャッシュ４のキャッシュ・ブロック
の状態と状態ビットの対応を表している図３から分かる
ように、ｃ−ｏｗｎｅｒｓｈｉｐ＝（ｃ−ｅｘｃｌｕｓ
ｉｖｅｎｅｓｓ｜ｉ−ｏｗｎｅｒｓｈｉｐ）という関係
があるので、ｃ−ｏｗｎｅｒｓｈｉｐ、ｃ−ｅｘｃｌｕ
ｓｉｖｅ、ｉ−ｏｗｎｅｒｓｈｉｐの全てを状態メモリ
に保存する必要はない。そこで、これら３ビットの内ｃ
−ｅｘｃｌｕｓｉｖｅｎｅｓｓとｉ−ｏｗｎｅｒｓｈｉ
ｐの２ビットだけを格納してもよい。この時の例を図２
（ｂ）に示している。図２（ｂ）では、状態メモリ内に
ｖａｌｉｄｉｔｙ、ｃ−ｅｘｃｌｕｓｉｖｅｎｅｓｓ、
ｉ−ｏｗｎｅｒｓｈｉｐの３ビットを格納している。ま
た、図２には示していないが、これらの情報をエンコー
ドして格納してもよい。ただし、その場合も状態メモリ
には、５状態を識別するために、セカンド・キャッシュ
４のエントリ当たり最低３ビットを格納する領域が必要
である。

【００６０】なお、本実施例ではファースト・キャッシ
ュ２の状態はＢｅｒｋｅｌｅｙ方式をそのまま用いる。
拡張されたＭＯＥＳＩモデルでファースト・キャッシュ
２のキャッシュ・ブロックの状態を意味付けるならば、
ファースト・キャッシュ２は階層キャッシュ・メモリ装
置の木構造のトポロジーの葉の部分にあり、自分をルー
トとする部分木には自分以外にノードが存在しないの
で、ｃ−ｏｗｎｅｒｓｈｉｐ、ｉ−ｏｗｎｅｒｓｈｉｐ
やｃ−ｅｘｃｌｕｓｉｖｅ、ｉ−ｅｘｃｌｕｓｉｖｅと
いった区別は不要である。そこでファースト・キャッシ
ュ２をそれ自身からなるサブクラスタであると解釈し
て、ｖａｌｉｄｉｔｙ、ｃ−ｏｗｎｅｒｓｈｉｐ、ｃ−
ｅｘｃｌｕｓｉｖｅｎｅｓｓの三つの状態ビットで状態
を実現する。ＩＮＶ状態（０００）、ＵＮＯ状態（１０
０）、ＮＯＮ状態（１１０）、ＥＸＣ状態（１１１）の
４状態である。ファースト・キャッシュ２のキャッシュ
・ブロックの状態をＢ０：ｖａｌｉｄ、Ｂ１：ｃ−ｏｗ
ｎｅｄ、Ｂ２：ｃ−ｅｘｃｌｕｓｉｖｅの３ビットの状
態ビットで表現することにする。図４は、ファースト・
キャッシュ２の状態と状態ビットの対応を表している。
ただし、状態数が４状態なので、エンコードして状態を
格納することも可能である。その場合は、１エントリあ
たり２ビットの領域で十分である。

【００６１】次に、図５は、キャッシュ・ブロックの状
態遷移について述べる。この場合、同図では、本実施例
におけるセカンド・キャッシュ４におけるキャッシュ・
ブロックの状態遷移を示している。そして、Ｂｅｒｋｅ
ｌｅｙ方式の素直な拡張により得られるキャッシュ・プ
ロトコルの状態遷移図である上述した図５３と比較する
と、コピー・バックされたキャッシュ・ブロックの状態
はＮＯＮ状態ではなくＥＸＩ状態になる点と、そのＥＸ
Ｉに対してキャッシュ・バス３からオーナーシップの移
行を伴うデータのコピーの要求のコマンドＲＦＯや無効
化のためのコマンドＷＦＩが来た際にはＥＸＣに遷移す
る点に特徴を有している。

【００６２】次に、セカンド・キャッシュ４においてキ
ャッシュ・バス・コントローラ１６がキャッシュ・バス
３からのコマンドに対して行う応答について説明する。

【００６３】図６は、本実施例のセカンド・キャッシュ
４がコピー・バック後のＥＸＩ状態のキャッシュ・ブロ
ックに対するバス・コマンドをキャッシュ・バス３から
受けた際の応答を示す図である。本実施例ではコピー・
バック後にＮＯＮ状態ではなくＥＸＩ状態であることか
ら、他のクラスタにはそのデータのコピーが存在してい
ないことが分かるので、次にそのキャッシュ・ブロック
に対してキャッシュ・バス３からＲＦＯやＷＦＩが来た
際には、メモリ・バス７に対して他のクラスタの無効化
の為のコマンドＷＦＩを送出する必要がない。つまり、
コピー・バック直後のキャッシュ・ブロックは他のセカ
ンド・キャッシュ４と共有されていないという事実を利
用して不要なバス・トランザクションを減らすことを実
現している。

【００６４】次に、本実施例においてセカンド・キャッ
シュ４が上に述べたような動作を行うためにキャッシュ
・バス・コントローラ１６がＲＦＯやＷＦＩがキャッシ
ュ・バス３から来た際に状態メモリの内容を利用してど
のような処理を行うかを説明する。

【００６５】この場合、セカンド・キャッシュ４のキャ
ッシュ・バス・コントローラ１６は、キャッシュ・バス
７からコマンドを受けると、アドレスのタグ部とタグ・
メモリ１１から検索したタグ部をコンパレータ１８で比
較しキャッシュ・ヒット／ミスの判定を行う。以下では
本発明に特徴的なＲＦＯとＷＦＩがキャッシュ・ヒット
した場合の処理について説明する。

【００６６】図７は、キャッシュ・バス３からのＲＦＯ
がヒットした場合のキャッシュ・バス・コントローラ１
６の処理内容を表している。キャッシュ・バス・コント
ローラ１６はヒットしたエントリのｃ−ｅｘｃｌｕｓｉ
ｖｅｎｅｓｓがｃ−ｅｘｃｌｕｓｉｖｅかｃ−ｓｈａｒ
ｅｄかを判定する（ステップＡ１）。ここで、ｃ−ｅｘ
ｃｌｕｓｉｖｅの場合にはｉ−ｏｗｎｅｒｓｈｉｐがｉ
−ｏｗｎｅｄかｉ−ｕｎｏｗｎｅｄかを判定する（ステ
ップＡ２）。もし、ｉ−ｏｗｎｅｄならば、そのエント
リのデータを返し（ステップＡ３）、状態をＥＸＣに遷
移させる。もし、ｉ−ｕｎｏｗｎｅｄならば、データは
返さない（ステップＡ４）。一方、ステップＡ１で、ｃ
−ｓｈａｒｅｄを判定した場合にはｖａｌｉｄｉｔｙが
ｖａｌｉｄかｉｎｖａｌｉｄかを判定する（ステップＡ
５）。もし、ｖａｌｉｄならば、ＷＦＩをメモリ・バス
７に送出し（ステップＡ６）、それに対する応答が返っ
てから、状態をＥＸＣにしてからデータを返す（ステッ
プＡ７）。もし、ステップＡ５でｉｎｖａｌｉｄを判定
したならば、ＲＦＯをメモリ・バス７に送出し（ステッ
プＡ８）、それに対する応答が返ってから、データをデ
ータ・メモリ１３に格納するとともに状態をＥＸＣにし
てからデータを返す（ステップＡ９）。本実施例では、
メモリ・バス７にＷＦＩやＲＦＯのコマンドを送出する
際には、キャッシュ・バス・コントローラ１６はメモリ
・バス・コントローラ１７に対して割り込みをかけ、メ
モリ・バス・コントローラ１７がメモリ・バス７へコマ
ンドを送出する。

【００６７】次に、図８は、キャッシュ・バス３からの
ＷＦＩがヒットした場合のキャッシュ・バス・コントロ
ーラ１６の処理内容を表している。キャッシュ・バス・
コントローラ１６はヒットしたエントリのｃ−ｅｘｃｌ
ｕｓｉｖｅｎｅｓｓがｃ−ｅｘｃｌｕｓｉｖｅかｃ−ｓ
ｈａｒｅｄかを判定する（ステップＢ１）。ｃ−ｅｘｃ
ｌｕｓｉｖｅの場合にはメモリ・バスに対してＷＦＩを
送出することなく状態をＥＸＣにしてから応答を返す
（ステップＢ２）。一方、ステップＢ１でｃ−ｓｈａｒ
ｅｄを判定した場合にはｖａｌｉｄｉｔｙがｖａｌｉｄ
かｉｎｖａｌｉｄかを判定する（ステップＢ３）。も
し、ｖａｌｉｄならば、ＷＦＩをメモリ・バスに送出
し、それに対する応答が返ってから状態をＥＸＣにして
から応答を返す（ステップＢ４）。もし、ｉｎｖａｌｉ
ｄならばエラーとなる（ステップＢ５）。

【００６８】次に、本発明の効果を動作に従って説明す
る。

【００６９】この場合、相異なるアドレスＡ1 とＡ2 は
セカンド・キャッシュ４内のそれぞれ相異なるキャッシ
ュ・ブロックＢ1 とＢ2 にマップされ、ファースト・キ
ャッシュ２の同一のキャッシュ・ブロックＢにマップさ
れるものとする。

【００７０】まず、従来のＢｅｒｋｅｌｅｙ方式の拡張
によるキャッシュ・プロトコルにおいて、無駄なバス・
トランザクションが発生する状況を考えると、まず、図
９は、あるプロセッサＰがアドレスＡ1 に対してライト
を行い、ファースト・キャッシュ２でキャッシュ・ミス
が発生したところをあらわしている。図１０は、ファー
スト・キャッシュ２はキャッシュ・バス３にオーナの移
行を伴うデータのコピーの要求のコマンド（ＲＦＯ）を
発したが、同じクラスタ内の他のファースト・キャッシ
ュ２はそのデータのコピーを持たず、しかもセカンド・
キャシュ４においてもキャッシュ・ミスを起こしたとこ
ろを表している。図１１は、セカンド・キャッシュ４は
オーナーシップの移行を伴うデータのコピーの要求のコ
マンドＲＦＯをメモリ・バスに発したところを表してい
る。

【００７１】図１２は、メモリ・バスに対して発したＲ
ＦＯに対する応答が返り、キャッシュ・ブロックＢ１に
そのデータが格納され、そのエントリの状態はＥＸＣに
なったところを表している。図１３は、セカンド・キャ
ッシュ４がデータを返し、ファースト・キャッシュ２が
返されたデータを格納し、エントリの状態をＥＸＣにし
たところを表している。図１４は、ファースト・キャッ
シュ２がライトを完了し、応答をプロセッサ１に返し、
プロセッサ１は動作を再開したところを表している。図
１５は、同じプロセッサ１がアドレスＡ2 に対してライ
トを行ないキャッシュ・ミスし、キャッシュ・ブロック
Ｂのデータをコピー・バックする必要が生じたところを
表している。

【００７２】図１６は、ファースト・キャッシュ２のキ
ャッシュ・ブロックＢのデータがセカンド・キャッシュ
４にコピー・バックされ、そのエントリの状態がＥＸＣ
からＮＯＮに変えられたところを表している。図１７
は、コピー・バックが完了したところを表している。続
いて、図１８は、プロセッサＰが要求しているアドレス
に対応するデータのコピーを要求するコマンドＲＦＯを
メモリ・バス７に発したところ、セカンド・キャッシュ
４でキャッシュ・ミスしたところを表している。図１９
は、セカンド・キャッシュ４がデータのコピーを要求す
るコマンドＲＦＯをメモリ・バス７に発したところを表
している。

【００７３】図２０は、ＲＦＯに対する応答が返り、セ
カンド・キャッシュ４は、返されたデータを格納し、そ
のエントリの状態をＥＸＣに変えたところを表してい
る。図２１は、セカンド・キャッシュ４がデータととも
に応答をファースト・キャッシュ２に返し、ファースト
・キャッシュ２は返されたデータを格納し、そのエント
リの状態をＥＸＣにしたところを表している。図２２
は、ファースト・キャッシュ２がライトが完了し応答を
プロセッサ１に返し、プロセッサ１が動作を再開したと
ころを表している。図２３は、プロセッサ１が再びアド
レスＡ1 に対してライトの要求をしたところが、ファー
スト・キャッシュ２のキャッシュ・ブロックＢにはアド
レスＡ2 のデータが格納されており、コピー・バックの
必要が生じたところを表している。

【００７４】図２４は、ファースト・キャッシュ２はキ
ャッシュ・ブロックＢのデータをコピー・バックするコ
マンドをキャッシュ・バス３に発し、セカンド・キャッ
シュ４のキャッシュ・ブロックＢ2 に最新のデータが格
納され、そのエントリの状態がＮＯＮ状態に変えられた
ところを表している。図２５は、アドレスＡ2 のデータ
のコピー・バックが完了したところを表している。図２
６は、ファースト・キャッシュ２がアドレスＡ1 のデー
タのコピーを要求するコマンドＲＦＯをキャッシュ・バ
ス３に発し、それがセカンド・キャッシュ４において、
キャッシュ・ブロックＢ1 にヒットしたところを表して
いる。

【００７５】図２７は、ＲＦＯがヒットしたキャッシュ
・ブロックＢ1 がＮＯＮ状態のために、他のセカンド・
キャッシュ４にあるかもしれないデータのコピーを無効
化するためのコマンドＷＦＩをメモリ・バス７に発した
ところを表している。図２８は、コマンドＷＦＩに対す
る応答が返り、セカンド・キャッシュ４はキャシュ・ブ
ロックＢ1 の状態をＥＸＣに変えたところを表してい
る。図２９は、セカンド・キャッシュ４がファースト・
キャッシュ２に対して、アドレスＡ1 のデータのコピー
と共に応答を返し、ファースト・キャッシュ２は返され
たデータを格納し、そのエントリの状態をＥＸＣに変え
たところを表している。図３０は、ファースト・キャッ
シュ２が、ライトを完了し、プロセッサ１に対して応答
を返し、プロセッサ１が動作を再開したところを表して
いる。

【００７６】しかして、このような動作において図２６
と図２７の間に他のセカンド・キャッシュ４からＢ1 の
データに対するＲＳＨが来ない場合には、このＷＦＩは
全く無駄なバス・トランザクションとなる。なぜなら
ば、他のセカンド・キャッシュ４はこのデータのコピー
を持たないからである。しかし、従来のものでは、コピ
ー・バックされたセカンド・キャッシュ４のキャッシュ
・ブロックはオーナーであって、かつ、そのクラスタ内
のファースト・キャッシュ２には最新のデータが存在し
ないという意味でＮＯＮ状態にするのだが、ＮＯＮ状態
には、他のクラスタとデータを共有している可能性があ
るということも意味するために、他のセカンド・キャッ
シュ４に対して共有しているかもしれないデータのコピ
ーを無効化するためバス・コマンドＷＦＩを発しなけれ
ばならない。

【００７７】ところで、バス共有のマルチプロセッサ
は、共有データへのアクセス回数の全アクセス回数に占
める割合が十分小さくなるように使われる。この割合が
大きいプログラムを実行すると、無効化のためのコマン
ドのようにキャッシュ間のデータの一貫性の保証のため
のバス・トランザクションが頻発してしまい、バス・ボ
トルネックが生じマルチプロセッサ化によるシステムの
性能の向上はあまり期待できないからである。従って、
マルチプロセッサのメモリ・アクセスはほとんどがプラ
イベート・データへのアクセスで、極一部が共有データ
へのアクセスである。このような状況では、上でのべた
ＷＦＩは、ほとんどの場合には無駄である。極端な場合
として、プログラム実行中において、各プロセッサ上の
プログラムが互いにデータを共有しない場合には、この
ようなＷＦＩはすべて無駄となってしまう。

【００７８】次に、本実施例のセカンド・キャッシュ４
により、上述した無駄なＷＦＩの発生が防止できること
を説明する。

【００７９】まず、図３１は、上述の図９と同じくプロ
セッサ１がアドレスＡ1 に対してライトを行い、ファー
スト・キャッシュ２でキャッシュ・ミスが発生したとこ
ろを表している。図３２は、ファースト・キャッシュ２
がキャッシュ・バス３にオーナの移行を伴うデータのコ
ピーの要求のコマンド（ＲＦＯ）を発したが、同じクラ
スタ内の他のファースト・キャッシュ２はそのデータの
コピーを持たず、しかもセカンド・キャシュ４において
もキャッシュ・ミスを起こしたところを表している。

【００８０】図３３は、セカンド・キャッシュ４がオー
ナーシップの移行を伴うデータのコピー要求のコマンド
ＲＦＯをメモリ・バス７に発したところを表している。
図３４は、メモリ・バス７に対して発したＲＦＯに対す
る応答が返り、キャッシュ・ブロックＢ1 にそのデータ
が格納され、そのエントリの状態はＥＸＣになったとこ
ろを表している。図３５は、セカンド・キャッシュ４が
データを返し、ファースト・キャッシュ２が返されたデ
ータを格納し、エントリの状態をＥＸＣにしたところを
表している。図３６は、ファースト・キャッシュ２がラ
イトを完了し、応答をプロセッサ１に返し、プロセッサ
１は動作を再開したところを表している。図３７は、同
じプロセッサ１がアドレスＡ2 に対してライトを行ない
キャッシュ・ミスし、キャッシュ・ブロックＢのデータ
をコピー・バックする必要が生じたところを表してい
る。ここまでは、従来例とまったく同じ動作である。

【００８１】図３８は、ファースト・キャッシュ２のキ
ャッシュ・ブロックＢのデータがセカンド・キャッシュ
４にコピー・バックされ、そのエントリの状態がＥＸＣ
からＥＸＩに変えられたところを表している。図３９
は、コピー・バックが完了したところを表している。続
いて、図４０は、プロセッサ１が要求しているアドレス
Ａ2 に対応するデータのコピーを要求するコマンドＲＦ
Ｏをメモリ・バス７に発したところ、セカンド・キャッ
シュ４でキャッシュ・ミスしたところを表している。図
４１は、セカンド・キャッシュ４がデータのコピーを要
求するコマンドＲＦＯをメモリ・バス７に発したところ
を表している。

【００８２】図４２は、ＲＦＯに対する応答が返り、セ
カンド・キャッシュ４が返されたデータをキャッシュ・
ブロックＢ2 に格納し、そのエントリの状態をＥＸＣに
変えたところを表している。図４３は、セカンド・キャ
ッシュ４がデータとともに応答をファースト・キャッシ
ュ２に返し、ファースト・キャッシュ２は返されたデー
タをキャッシュ・ブロックＢに格納し、そのエントリの
状態をＥＸＣにしたところを表している。図４４は、フ
ァースト・キャッシュ２がライトが完了し応答をプロセ
ッサ１に返し、プロセッサ１が動作を再開したところを
表している。

【００８３】図４５は、プロセッサ１が再びアドレスＡ
1 に対してライトの要求をしたところが、ファースト・
キャッシュ２のキャッシュ・ブロックＢにはアドレスＡ
2 のデータが格納されており、コピー・バックの必要が
生じたところを表している。図４６は、ファースト・キ
ャッシュ２はキャッシュ・ブロックＢのデータをコピー
・バックするコマンドをキャッシュ・バス３に発し、セ
カンド・キャッシュ４のキャッシュ・ブロックＢ2 に最
新のデータが格納され、そのエントリの状態がＥＸＩに
変えられたところを表している。図４７は、アドレスＡ
2 のデータのコピー・バックが完了したところを表して
いる。図４８は、ファースト・キャッシュ２がアドレス
Ａ1 のデータのコピーを要求するコマンドＲＦＯをキャ
ッシュ・バス３に発し、それがセカンド・キャッシュ４
において、キャッシュ・ブロックＢ1 にヒットしたとこ
ろを表している。

【００８４】図４９は、ＲＦＯがヒットしたキャッシュ
・ブロックＢ1 がＥＸＩ状態のために、他のセカンド・
キャッシュにはそのデータのコピーが存在しないことが
分かるので、ＷＦＩを発することなくエントリの状態を
ＥＸＣに変え、データのコピーをファースト・キャッシ
ュに返すことができる。図５０は、セカンド・キャッシ
ュ４がファースト・キャッシュ２に対して、アドレスＡ
1のデータのコピーと共に応答を返し、ファースト・キ
ャッシュ２は返されたデータを格納し、そのエントリの
状態をＥＸＣに変えたところを表している。図５１は、
ファースト・キャッシュ２が、ライトを完了し、プロセ
ッサ１に対して応答を返し、プロセッサ１が動作を再開
したところを表している。

【００８５】しかして、上述した従来の例と異なるの
は、コピー・バックされたＢ1 の状態がＮＯＮではなく
ＥＸＩになるということである。従って、再び同じプロ
セッサ１がＡ1 に対してライトを行うと、Ｂ2 に対する
コピー・バックのあと、ＲＦＯがセカンド・キャッシュ
４のキャッシュ・ブロックＢ1 にヒットした際に、メモ
リ・バス７に対して他のセカンド・キャッシュ４に対す
る無効化のコマンドＷＦＩを発することなくキャッシュ
・ブロックＢ1 はＥＸＣに遷移し、データがファースト
・キャッシュ２に返され、キャッシュ・ブロックＢはＥ
ＸＣになる。従って、上述した状況では、従来発生して
いた無駄なバス・コマンドＷＦＩを発生しないようにで
きるので、メモリ・バス７のバス・トラフィックを減少
させることができ、システム性能を向上させることがで
きる。

【００８６】また、キャッシュ・バス３からのＷＦＩが
セカンド・キャッシュ４でＥＸＩ状態にヒットした場合
にも、ＷＦＩをメモリ・バス７に出す必要がない。この
ような状況が発生するのは、セカンド・キャッシュ４に
コピー・バックされたデータを再びプロセッサ１がリー
ドのアクセスをすると、セカンド・キャッシュ４の状態
はＥＸＩのままで、ファースト・キャッシュ２にデータ
が返される。その返されたデータが格納されているキャ
ッシュ・ブロックに対して、ライトのアクセスが行われ
るとファースト・キャッシュ２から他のファースト・キ
ャッシュ２や他のクラスタ５のセカンド・キャッシュ４
に対してデータの無効化を要求するコマンドＷＦＩが発
せられる。このコマンドがセカンド・キャッシュ４のコ
ピー・バックされたキャッシュ・ブロックにヒットする
と、従来例では、ＮＯＮ状態にヒットなのでＷＦＩが発
せられるが、本実施例ではＥＸＩ状態なのでＷＦＩを発
することなくＥＸＣ状態に遷移するようになる。

【００８７】なお、上述した実施例では、バス・コマン
ドの数や種類を変えない。従って、従来例にしたがって
作られたシステムのセカンド・キャッシュをすべてまた
は一部のクラスタでも本実施例のセカンド・キャッシュ
４と交換しても、キャッシュの一貫性は保証される。こ
の性質より、同一のシステムにおいて、セカンド・キャ
ッシュ４に新たな状態ビットを導入しバス・トラフィッ
クの軽減による性能向上を重視するか、あるいは、少な
い状態ビット数により制御の容易さと低いコストを重視
するかにより、セカンド・キャッシュ４を選択すること
によりシステム構成に選択の余地が生ずる。

【００８８】また、上述では、２階層キャッシュ・メモ
リに限定して実施例の説明を行っているが、木構造のト
ポロジーを持つならば多階層のキャッシュ・メモリ装置
においても、セカンド・キャッシュと同じ機能を持つ階
層（但しキャッシュ・メモリの容量までは同じである必
要はない）を繰り返すことにより実現できる。

【００８９】その他、本発明は、上記実施例にのみ限定
されず、要旨を変更しない範囲で適宜変形して実施でき
る。

【００９０】

【発明の効果】本発明によれば、（１）ファースト・キ
ャッシュでライト・ミスし、セカンド・キャッシュ内の
先に述べた状態にあるデータに対して、データのコピー
を要求するバス・コマンドがキャッシュ・バスに発せら
れても、データのコピーを要求するバス・コマンドをメ
モリ・バスに発する必要をなくすことができる。また、
（２）ファースト・キャッシュで他のキャッシュとデー
タを共有しているキャッシュ・ブロックに対するライト
が発生し、無効化のためのバス・コマンドがキャッシュ
・バスに発せられ、同じクラスタ内のセカンド・キャッ
シュにおいて要求されたデータが先の状態にある場合に
は、他のクラスタのデータを無効化するためのバス・コ
マンドをメモリ・バスに発する必要をなくすことができ
る。さらに、（３）先に述べた状態にあるデータに対し
て他のセカンド・キャッシュからリードの要求がある場
合に、ファースト・キャッシュへのリードのためのバス
・コマンドをキャッシュ・バスに対して発する必要もな
くすことができる。

【００９１】この結果として、データの一貫性を保つた
めのバス・トランザクションの内から本来不要であった
ものの発生を防ぐことが可能となり、バス・トラフィッ
クを軽減しシステムの性能を向上させることができる。
特に、メモリ・バスがボトルネックになっているような
場合には、その効果は著しい。また、バス・トラフィッ
クの軽減により、同じバスに従来例よりも多いプロセッ
サを接続させても並列効果を落とさないという効果も期
待できる。さらに、バス・コマンドの数や種類を変えな
いので、同一システムにおいて従来例と本実施例のセカ
ンド・キャッシュの共存を許し、システム構成のフレク
シビリティを高めることができる。

【図面の簡単な説明】

【図１】本発明の一実施例に用いられるセカンド・キャ
ッシュの概略構成を示す図。

【図２】図１に示すセカンド・キャッシュの状態メモリ
の内容を示す図。

【図３】図１に示すセカンド・キャッシュの状態と状態
ビットの対応を示す図。

【図４】本発明の一実施例に用いられるファースト・キ
ャッシュの状態と状態ビットの対応を示す図。

【図５】図１に示すセカンド・キャッシュのキャッシュ
・ブロックの状態遷移図。

【図６】図１に示すセカンド・キャッシュのキャッシュ
・ブロックがファースト・キャッシュからコピー・バッ
クされた際にバス・コマンドに対して行う応答状態を示
す図。

【図７】図１に示すセカンド・キャッシュに対してキャ
ッシュ・バスからオーナーシップの移行を伴うデータの
コピーを要求するコマンドＲＦＯが来た際の応答を説明
するための図。

【図８】図１に示すセカンド・キャッシュに対してキャ
ッシュ・バスから無効化のためのコマンドＷＦＩが来た
際の応答を説明するための図。

【図９】従来例として無駄なバス・トランザクションが
発生する状況を説明するための図。

【図１０】従来例として無駄なバス・トランザクション
が発生する状況を説明するための図。

【図１１】従来例として無駄なバス・トランザクション
が発生する状況を説明するための図。

【図１２】従来例として無駄なバス・トランザクション
が発生する状況を説明するための図。

【図１３】従来例として無駄なバス・トランザクション
が発生する状況を説明するための図。

【図１４】従来例として無駄なバス・トランザクション
が発生する状況を説明するための図。

【図１５】従来例として無駄なバス・トランザクション
が発生する状況を説明するための図。

【図１６】従来例として無駄なバス・トランザクション
が発生する状況を説明するための図。

【図１７】従来例として無駄なバス・トランザクション
が発生する状況を説明するための図。

【図１８】従来例として無駄なバス・トランザクション
が発生する状況を説明するための図。

【図１９】従来例として無駄なバス・トランザクション
が発生する状況を説明するための図。

【図２０】従来例として無駄なバス・トランザクション
が発生する状況を説明するための図。

【図２１】従来例として無駄なバス・トランザクション
が発生する状況を説明するための図。

【図２２】従来例として無駄なバス・トランザクション
が発生する状況を説明するための図。

【図２３】従来例として無駄なバス・トランザクション
が発生する状況を説明するための図。

【図２４】従来例として無駄なバス・トランザクション
が発生する状況を説明するための図。

【図２５】従来例として無駄なバス・トランザクション
が発生する状況を説明するための図。

【図２６】従来例として無駄なバス・トランザクション
が発生する状況を説明するための図。

【図２７】従来例として無駄なバス・トランザクション
が発生する状況を説明するための図。

【図２８】従来例として無駄なバス・トランザクション
が発生する状況を説明するための図。

【図２９】従来例として無駄なバス・トランザクション
が発生する状況を説明するための図。

【図３０】従来例として無駄なバス・トランザクション
が発生する状況を説明するための図。

【図３１】本発明の一実施例において無駄なバス・トラ
ンザクションの発生が防げる状況を説明するための図。

【図３２】同発明の一実施例において無駄なバス・トラ
ンザクションの発生が防げる状況を説明するための図。

【図３３】同発明の一実施例において無駄なバス・トラ
ンザクションの発生が防げる状況を説明するための図。

【図３４】同発明の一実施例において無駄なバス・トラ
ンザクションの発生が防げる状況を説明するための図。

【図３５】同発明の一実施例において無駄なバス・トラ
ンザクションの発生が防げる状況を説明するための図。

【図３６】同発明の一実施例において無駄なバス・トラ
ンザクションの発生が防げる状況を説明するための図。

【図３７】同発明の一実施例において無駄なバス・トラ
ンザクションの発生が防げる状況を説明するための図。

【図３８】同発明の一実施例において無駄なバス・トラ
ンザクションの発生が防げる状況を説明するための図。

【図３９】同発明の一実施例において無駄なバス・トラ
ンザクションの発生が防げる状況を説明するための図。

【図４０】同発明の一実施例において無駄なバス・トラ
ンザクションの発生が防げる状況を説明するための図。

【図４１】同発明の一実施例において無駄なバス・トラ
ンザクションの発生が防げる状況を説明するための図。

【図４２】同発明の一実施例において無駄なバス・トラ
ンザクションの発生が防げる状況を説明するための図。

【図４３】同発明の一実施例において無駄なバス・トラ
ンザクションの発生が防げる状況を説明するための図。

【図４４】同発明の一実施例において無駄なバス・トラ
ンザクションの発生が防げる状況を説明するための図。

【図４５】同発明の一実施例において無駄なバス・トラ
ンザクションの発生が防げる状況を説明するための図。

【図４６】同発明の一実施例において無駄なバス・トラ
ンザクションの発生が防げる状況を説明するための図。

【図４７】同発明の一実施例において無駄なバス・トラ
ンザクションの発生が防げる状況を説明するための図。

【図４８】同発明の一実施例において無駄なバス・トラ
ンザクションの発生が防げる状況を説明するための図。

【図４９】同発明の一実施例において無駄なバス・トラ
ンザクションの発生が防げる状況を説明するための図。

【図５０】同発明の一実施例において無駄なバス・トラ
ンザクションの発生が防げる状況を説明するための図。

【図５１】同発明の一実施例において無駄なバス・トラ
ンザクションの発生が防げる状況を説明するための図。

【図５２】階層キャッシュ・メモリ装置の概略構成を示
す図。

【図５３】従来のセカンド・キャッシュにおけるキャッ
シュ・ブロックの状態遷移図。

【図５４】従来の階層キャッシュ・メモリ装置の動作例
を示す図。

【図５５】従来の階層キャッシュ・メモリ装置の動作例
を示す図。

【図５６】従来の階層キャッシュ・メモリ装置の動作例
を示す図。

【図５７】従来の階層キャッシュ・メモリ装置の動作例
を示す図。

【図５８】従来の階層キャッシュ・メモリ装置の動作例
を示す図。

【図５９】従来の階層キャッシュ・メモリ装置の動作例
を示す図。

【図６０】従来の階層キャッシュ・メモリ装置の動作例
を示す図。

【符号の説明】

１…プロセッサ、２…ファースト・キャッシュ、３…キ
ャッシュ・バス、４…セカンド・キャッシュ、５…クラ
スタ、６…メイン・メモリ、７…メモリ・バス、１１…
タグ・メモリ、１２…状態メモリ、１３…データ・メモ
リ、１４…キャッシュ・バス・インタフェース部、１５
…メモリ・バス・インタフェース部、１６…キャッシュ
・バス・コントローラ、１７…メモリ・バス・コントロ
ーラ、１８、１９…コンパレータ、２０、２１…セレク
タ。

Claims

【特許請求の範囲】

【請求項１】複数のプロセッサにそれぞれ設けられた
第１のキャッシュ・メモリ、これらの第１のキャッシュ
・メモリを所定個数の単位で相互に接続するキャッシュ
・バス、これらキャッシュ・バスにそれぞれ設けられた
第２のキャッシュ・メモリ、これら第２のキャッシュ・
メモリを相互に接続するメモリ・バス、このメモリ・バ
スに接続されたメイン・メモリとを具備した階層キャッ
シュ・メモリ装置において、前記第２のキャッシュ・メ
モリのキャッシュ・ブロックごとに、少なくともそのデ
ータが他の第２のキャッシュ・メモリと共有されておら
ず、かつ、前記第２のキャッシュ・メモリと前記キュッ
シュ・バスで接続されている前記第１のキャッシュ・メ
モリ中に更新による当該第２のキャッシュ・メモリ内の
データよりも最新の値を持つものがない状態を表す情報
を格納可能にし、前記第１のキャッシュ・メモリから前
記第２のキャッシュ・メモリに対してデータのリードま
たはライトのデータのコピーの要求または他のクラスタ
のキャッシュ・メモリ内のデータの無効化のための要求
が生じると、前記第２のキャッシュ・メモリのキャッシ
ュ・ブロックに格納された情報に基づいた状態を判断
し、該状態を満足するものである場合、他の第２のキャ
ッシュ・メモリに対してリードまたはライトのためのデ
ータのコピー要求またはデータの無効化のための要求を
送出することなく前記データのコピー要求元の第１のキ
ャッシュ・メモリに対して応答を返すようにしたことを
特徴とする階層キャッシュ・メモリ装置。
【請求項２】第２のキャッシュ・メモリ装置のキャッ
シュ・ブロックごとに格納される状態に関する情報は、
そのデータが有効であるか否かに関する情報、そのデー
タが他の第２のキャッシュ・メモリと共有しているか否
かに関する情報、第２のキャッシュ・メモリとキュシュ
・バスで接続される第１のキャッシュ・メモリ中に更新
による当該第２のキャッシュ・メモリ内のデータよりも
最新の値を持つものがないか否かに関する情報のうち少
なくとも２つの情報を格納することを特徴とする請求項
１記載の階層キャッシュ・メモリ装置。