JP3629511B2 - 不均等メモリ・アクセス・システムにおいてトランザクションのキャンセルによるデータ損失を避けるための方法およびシステム - Google Patents
不均等メモリ・アクセス・システムにおいてトランザクションのキャンセルによるデータ損失を避けるための方法およびシステム Download PDFInfo
- Publication number
- JP3629511B2 JP3629511B2 JP2000045925A JP2000045925A JP3629511B2 JP 3629511 B2 JP3629511 B2 JP 3629511B2 JP 2000045925 A JP2000045925 A JP 2000045925A JP 2000045925 A JP2000045925 A JP 2000045925A JP 3629511 B2 JP3629511 B2 JP 3629511B2
- Authority
- JP
- Japan
- Prior art keywords
- node
- request
- data
- memory
- data access
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F12/00—Accessing, addressing or allocating within memory systems or architectures
- G06F12/02—Addressing or allocation; Relocation
- G06F12/08—Addressing or allocation; Relocation in hierarchically structured memory systems, e.g. virtual memory systems
- G06F12/0802—Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches
- G06F12/0806—Multiuser, multiprocessor or multiprocessing cache systems
- G06F12/0813—Multiuser, multiprocessor or multiprocessing cache systems with a network or matrix configuration
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Memory System Of A Hierarchy Structure (AREA)
Description
【発明の属する技術分野】
本発明は、一般にデータ処理の方法およびシステム、詳細にはコンピュータ・システムにおいてデータの損失を避けるための方法およびシステムに関する。さらに詳細には、本発明は、不均等メモリ・アクセス(NUMA)のコンピュータ・システムにおいて、トランザクションのキャンセルによるデータの損失を避けるための方法およびシステムに関する。
【0002】
【従来の技術】
多数の個別プロセッサの処理能力を直列にハーネスすることによって、より高いコンピュータ・システムの性能が達成できることは、コンピュータ技術分野ではよく知られている。多重プロセッサ(MP)コンピュータ・システムは、いくつかの異なるトポロジーで設計することができ、そのそれぞれが各アプリケーションの性能要件およびソフトウェア環境に応じて、特定のアプリケーションに対してより好適である可能性がある。最も一般的なMPコンピュータ・トポロジーの1つが、一般に共用システム相互接続に結合されているシステム・メモリや入出力(I/O)サブシステムなどの共通の資源を複数のプロセッサが共用する、対称的マルチ・プロセッサ(SMP)構成である。こうしたコンピュータ・システムは、SMPコンピュータ・システム内のすべてのプロセッサが、共用システム・メモリ内に格納されているデータに対して理論的に同じアクセス待ち時間を有するので、対称的であると言われる。
【0003】
SMPコンピュータ・システムは、比較的単純なプロセッサ間通信およびデータ共用の方法を使用することができるが、スケーラビリティが制限されている。すなわち、一般的なSMPコンピュータ・システムの性能は、通常、スケールに従って(すなわちさらにプロセッサが追加されるにつれて)改善されると予想できるが、固有のバス、メモリ、および入出力(I/O)の帯域幅制限により、共用資源の利用が最適化される、実装に依存したサイズを超えてSMPをスケーリングすると、重要な利点が得られなくなる。したがって、システムのスケールが大きくなるほど、特にシステム・メモリにおいて、SMPトポロジーそれ自体がある程度帯域幅制限を受ける。SMPコンピュータ・システムも製造効率の点からうまくスケールされない。たとえば、構成要素によっては単一プロセッサおよび小規模SMPコンピュータ・システムのどちらでも使用できるように最適化できるが、このような構成要素は大規模SMPで使用するには効率が悪いことが多い。逆に、大規模SMPで使用するように設計された構成要素は、コストの点で、小規模システムで使用するには非実用的である。
【0004】
その結果、ある程度複雑さが増すという犠牲を払って、SMPコンピュータ・システムの数多くの制限を解決する代替設計として、不均等メモリ・アクセス(NUMA)として知られるMPコンピュータ・システム・トポロジーが出現した。一般的なNUMAコンピュータ・システムは、それぞれが1つまたは複数のプロセッサおよびローカル「システム」メモリを含む、いくつかの相互接続されたノードを含む。リモート・ノードのシステム・メモリに格納されているデータよりも、ローカル・ノードのシステム・メモリに格納されているデータの方が各プロセッサのアクセス待ち時間が少ないので、こうしたコンピュータ・システムは、不均等メモリ・アクセスを有すると言われている。NUMAシステムは、異なるノードのキャッシュ間でデータのコヒーレンスが維持されるかどうかによって、非コヒーレントまたはキャッシュ・コヒーレントのいずれかとしてさらに分類できる。キャッシュ・コヒーレントのNUMA(CC−NUMA)システムの複雑さは、各ノード内にある様々なレベルのキャッシュ・メモリ間およびシステム・メモリ間だけではなく、異なるノードのキャッシュ・メモリ間およびシステム・メモリで、ハードウェアがデータのコヒーレンスを維持するのに追加の通信が必要なことに起因するところが大きい。しかしNUMAコンピュータ・システムは、NUMAコンピュータ・システム内の各ノードが小規模なSMPシステムとして実装できるので、従来のSMPコンピュータ・システムが持つスケーラビリティの制限を解決している。したがって、各ノード内の共用構成要素は、ほんのわずかなプロセッサが使用するように最適化できる一方で、システム全体が比較的少ない待ち時間を維持しながら、大規模並列処理が利用できるという恩恵を受ける。
【0005】
NUMAシステムをスケーラブルなキャッシュ・コヒーレントに設計する場合は、単純なSMP設計には存在しないデータのコヒーレント問題を解決しなければならない。たとえば、単一バスのMPコンピュータ・システムでは、システム・バス上でトランザクションがキャンセルされる場合にデータ損失は発生しない。データ損失は、データ要素(キャッシュ・ラインなど)の有効なコピーだけがシステムの任意のまたはすべてのキャッシュまたはメモリから失われる、1組の状況として考えることができる。SMPシステムのキャッシュ・コヒーレンス・プロトコルは、こうした損失が発生しないように設計される。たとえば、SMPシステムのプロセッサによって読取りトランザクションが「再試行」される場合、データが実際にバスに送られる前に、バス上にあるすべての装置、すなわちデータの要求側、データの提供側、およびすべてのスヌーパに「再試行」を表示することができる。これによって、有効なコピーしか有しない装置によって、データが廃棄されない、すなわち「損失」しないことが保証される。また、データが提供された場合に発生するように、システム内のキャッシュの状態が変化することはないことが保証される。単一バスMPは、トランザクションを「キャンセル」するためのプロトコル機構の存在に対するデータのコヒーレンスも維持する。装置がデータを要求した場合、データが提供される前にデータが必要でなくなったことを要求側が示すと、トランザクションは「キャンセル」される。トランザクションは、トランザクションを発した装置、たとえばバッファが一杯になったメモリ制御装置など以外の装置によってキャンセルすることができる。第三者がこの方法でトランザクションをキャンセルすると、データがまだ必要な場合に限って、要求側はトランザクションを再発行する。その後データの有効なコピーは、常駐するメモリから提供されたり除去されたりすることはない。トランザクションのキャンセルはSMPシステムの一般的な機能ではないが、すべての探索側がシステム・バス上で同時にトランザクションを見ることができるので、コヒーレンスを犠牲にせずにキャンセル機構を含むことができる。
【0006】
トランザクションによっては潜在的に待ち時間が長いため、高性能のNUMAシステムは、プロトコル機構が以前に発行されたトランザクションをキャンセルするのにより有用となることがある。特定の環境では、NUMAシステムはもはや必要でない見込みフェッチを取り消すためにキャンセル方法を使用することができる。プロセッサはトランザクションの一時停止を維持し、貴重なバス帯域幅を無駄にするようなデータを転送するために、資源を無駄にしてはならないので、これは適切なことであろう。ただしNUMAシステムでは、そのような状況を検出して矯正する処置を講じない限り、トランザクションのキャンセル中にデータが損失することのあるトランザクションを発生させる状況になる可能性がある。データを提供するノードでは成功するが、リモート・ノードからのデータがまだ移行中である場合に受取り側ノードではキャンセルされる、リモート処理ノードに対して発行されたREADトランザクションの場合を考えてみる。この場合は、データの有効なコピーのみの損失、すなわちデータのコヒーレンスの損失が発生することがある。
【0007】
前述の場合、データを提供するノード側で、トランザクションのキャンセルがリモート処理ノードに伝送される前にキャッシュの状態が変化すると、データの損失が発生する。キャンセルは、読み取られたデータが提供されるバスとは物理的に異なるバス上で発生するので、SMPシステムで発生するようなキャッシュ状態の変更を防ぐことはできない。読取りトランザクションは、トランザクションがデータの受取り側ノードでキャンセルされる前、またはキャンセルが物理的に別個のバス間で通信可能になる前に、1つのバス上で首尾よく完了し、そのバスでのキャッシュの状態変更をトリガすることができる。このような状況下では、これらのバス間でインターフェースしている制御装置は、特に、データがまだメモリに書き込まれていないキャッシュ・ラインの修正済みコピーである場合、このデータの有効なコピーを保持し続けることができる。トランザクションがいったんキャンセルされると、ノード制御装置によって保持されるデータに対して読取り要求が発行されることはなく、したがってデータは失われ、メモリの整合性はなくなる。この問題は、ノード制御装置を介して修正済みデータをメモリへ書き込むどんなデータ・トランザクション中にでも発生する可能性がある。
【0008】
【発明が解決しようとする課題】
したがって、これらの状況を検出して修正し、データおよびコヒーレンスの損失を避けるための方法およびシステムを提供することが必要である。
【0009】
【課題を解決するための手段】
不均等メモリ・アクセス(NUMA)データ処理システムは、少なくとも第1のノードおよび第2のノードが結合されたノード相互接続を含む。第1および第2のノードはそれぞれ、ローカル相互接続と、ローカル相互接続に結合されているシステム・メモリと、ローカル相互接続とノード相互接続の間に置かれたノード制御装置とを含む。ノード制御装置は、NUMAデータ処理システムの性質によって、データ損失を招く可能性のある一定の状況を検出する。これらの状況は、ノード制御装置が修正済みのキャッシュ・ラインのコピーのみで終わり、修正済みのキャッシュ・ラインを要求した元のトランザクションが、同じタグを使って再発行されることがないか、またはまったく再発行されないという、共通の特徴を共用する。ノード制御装置は、専用のタグを使用して修正済みのキャッシュに関するシステム・メモリへの専用の書込みトランザクションを発行することによって、これらの状況を是正し、次いで修正済みキャッシュ・ラインが保持しているデータを提供する。これにより、修正済みデータがシステム・メモリへ書き込まれることが保証される。
【0010】
【発明の実施の形態】
I.NUMAシステム
A.システムの概要
図面、特に図1を参照すると、本発明の例示的実施形態による、不均等メモリ・アクセス(NUMA)コンピュータ・システムの構成図が示されている。図の実施形態は、たとえば、ワークステーション、サーバ、またはメインフレーム・コンピュータとして実現することができる。図からわかるように、NUMAコンピュータ・システム8は、ノード相互接続22によって相互接続されたいくつか(N個)の処理ノード10a〜10dを含む。処理ノード10a〜10dは、それぞれ少なくとも1つ、最高M個までのプロセッサ12を含む。プロセッサ12a〜12dは同一であり、米国ニューヨーク州アーモンクのインターナショナル・ビジネス・マシーンズ・コーポレイション(IBM)から市販のPowerPCTMラインのプロセッサを備えることが好ましい。プロセッサ12a〜12dはそれぞれ、レジスタ、命令フロー論理、およびプログラム命令を実行するのに使用される実行ユニットに加えて、それぞれがレベル2(L2)キャッシュ14a〜14dと共に、システム・メモリ18から関連するプロセッサ12にデータをステージングする際に使用される、オンチップのレベル1(L1)キャッシュ(図示せず)を含む。つまり、L1キャッシュおよびL2キャッシュ14a〜14dは、関連するプロセッサ12によってアクセスされることの多いデータを一時的にバッファする、システム・メモリ18とプロセッサ12との間の中間記憶装置として機能する。L2キャッシュ14は一般にL1キャッシュよりも記憶域が大きいが、アクセス待ち時間は長くなる。たとえば、L2キャッシュ14a〜14dの記憶容量は1〜16メガバイト(MB)であり、オンチップのL1キャッシュの記憶容量は8〜32キロバイトである。L2キャッシュ14a〜14dは、図1ではプロセッサ12の外部にあるものとして図示されているが、別法として、追加レベルのオンチップ・キャッシュ・メモリとして、関連するプロセッサ12中に組み込むこともできることを理解されたい。さらに、追加のデータ記憶域を提供するために、1つまたは複数の追加レベルのキャッシュ・メモリ(L3、L4等)が使用できることも理解されたい。以下の考察では、プロセッサ12およびその関連するキャッシュ階層(L1、L2等)が、それぞれ単一のスヌーパであるとみなされる。
【0011】
図からわかるように、処理ノード10a〜10dはそれぞれ、システム・メモリ18およびL2キャッシュ14a〜14dと共にローカル相互接続16に結合されたノード制御装置20をさらに含む。各ノード制御装置20は、少なくとも2つの機能を実行することにより、リモート処理ノード10に対するローカル・エージェントとして働く。第1に各ノード制御装置20は、リモート処理ノード10へのローカル通信トランザクションの伝送を容易にするために、関連するローカル相互接続16をスヌープする。第2に、各ノード制御装置20は、ノード相互接続22上の通信トランザクションをスヌープし、関連するローカル相互接続16上の関連する通信トランザクションのマスタとなる。各ローカル相互接続16上での通信は、アービタ24によって制御される。以下で詳述するように、アービタ24は、プロセッサ12により生成されたバス要求信号に基づいてローカル相互接続16へのアクセスを規制し、ローカル相互接続16上でスヌープされた通信トランザクションに関するコヒーレンス応答をコンパイルする。
【0012】
もちろん、NUMAコンピュータ・システム8は、追加装置をさらに含むことができる。これらの追加装置は、本発明を理解するのに必要でなく、したがって本発明を不明瞭にするのを避けるために省略される。たとえば各ノード10は、入出力装置(たとえば、表示装置、キーボード、またはグラフィカル・ポインタ)、オペレーティング・システムおよびアプリケーション・ソフトウェアを格納するための不揮発性記憶装置、ならびにネットワークまたは付属装置に接続するためのシリアル・ポートおよびパラレル・ポートもサポートすることができる。
【0013】
B.メモリ構成
NUMAコンピュータ・システム8のすべてのプロセッサ12は、単一の物理メモリ領域を共用しており、これは、各物理アドレスがいずれか1つのシステム・メモリ18内で単一のロケーションのみに関連付けられていることを意味する。したがって、一般にNUMAコンピュータ・システム8内の任意のプロセッサ12によるアクセスが可能なシステム・メモリ全体の内容を、4つのシステム・メモリ18間で区分されているものと見なすことができる。たとえば、図1に示された本発明の例示的実施形態では、プロセッサ12は、汎用メモリ領域および未使用領域の両方を含む、16ギガバイトのアドレス領域をアドレス指定する。汎用メモリ領域は、500メガバイトのセグメントに分割され、4つの各処理ノード10が4番目ごとのセグメントに割り振られる。未使用領域はおよそ2ギガバイトを含むことが可能であり、システム制御、ならびにそれぞれがいずれか1つの各処理ノード10に割り振られている周辺のメモリおよび入出力領域を含む。
【0014】
この考察では、特定のデータをそのシステム・メモリ18に格納する処理ノードを、そのデータのホーム・ノードと呼び、他の処理ノードを特定のデータに関するリモート・ノードと呼ぶ。
【0015】
C.メモリのコヒーレンス
各システム・メモリ18内に格納されたデータは、NUMAコンピュータ・システム8内の任意のプロセッサ12による要求、アクセス、および修正が可能であるため、NUMAコンピュータ・システム8は、同じ処理ノード内のキャッシュ間および異なる処理ノード内のキャッシュ間の両方でコヒーレンスを維持するために、キャッシュ・コヒーレンス・プロトコルを実装する。したがって、NUMAコンピュータ・システム8は、CC−NUMAコンピュータ・システムとして分類するのが適切である。実装されるキャッシュ・コヒーレンス・プロトコルは実装依存型であり、たとえば周知の修正(M)、排他的(E)、共用(S)、無効(I)(MESI)プロトコルまたはその変形を備えることができる。以下では、L1キャッシュ、L2キャッシュ14、およびアービタ24が従来のMESIプロトコルを実装するが、そのノード制御装置20はM、S、およびI状態を認識し、E状態は正確さのためにM状態にマージされるとみなされる。すなわちノード制御装置20は、リモート・キャッシュによって排他的に保持されるデータが実際に修正されたかどうかにかかわらず、そのデータを修正されたと想定する。
【0016】
D.相互接続アーキテクチャ
ローカル相互接続16およびノード相互接続22は、それぞれ任意のバス・ベースの同報通信アーキテクチャ、スイッチ・ベースの同報通信アーキテクチャ、またはスイッチ・ベースの非同報通信アーキテクチャを使って実装することができる。ただし、例示的実施形態では、少なくともノード相互接続22は、IBMコーポレイションによって開発された6xx通信プロトコルによって制御されるスイッチ・ベースの非同報通信相互接続として実装されている。ローカル相互接続16およびノード相互接続22では分割トランザクションが可能であるが、これはアドレスと通信トランザクションを備えたデータ保有期間との間に固定されたタイミング関係がなく、データ・パケットに対して関連するアドレス・パケットとは異なった命令を出すことができることを意味する。ローカル相互接続16およびノード相互接続22の使用度を、通信トランザクションのパイプライン化によって定めることも好ましい。そうすると、前の通信トランザクションのマスタが各受信者からのコヒーレンス応答を受け取る前に、後続の通信トランザクションがソースとなることが可能となる。
【0017】
ノード相互接続22を介した処理ノード10間で、およびローカル相互接続16を介したスヌーパ間で情報を搬送するために、実装される相互接続アーキテクチャのタイプにかかわらず、アドレス、データ、およびコヒーレンス応答という、少なくとも3タイプの「パケット」(ここで使用されるパケットとは、一般に情報の個別単位を指す)が使用される。ここで表1および表2を参照すると、アドレスおよびデータ・パケットに関する関連フィールドの要約および定義がそれぞれ与えてある。
【表1】
【表2】
【0018】
表1および表2に示すように、受信者ノードまたはスヌーパが各パケットが属する通信トランザクションを判定できるようにするために、通信トランザクション内の各パケットはトランザクション・タグで識別される。追加のフロー制御論理および関連するフロー制御信号を使用して、有限の通信資源の使用が規制できることを、当業者であれば理解されよう。
【0019】
各処理ノード10内では、状態およびコヒーレンス応答が各スヌーパとローカル・アービタ24との間で通信される。状態およびコヒーレンス通信に使用されるローカル相互接続16内の信号ラインを、以下の表3にまとめて示す。
【表3】
【0020】
ローカル相互接続16のARespラインおよびAStatラインを介して伝送される状態およびコヒーレンス応答は、関連するアドレス・パケットとの間に、固定されているがプログラム可能なタイミング関係を有することが好ましい。たとえば、ローカル相互接続16上で伝送されるアドレス・パケットを各スヌーパが首尾よく受け取ったか否かに関する予備表示を与えるAStatOutボートが、アドレス・パケットを受け取った後の第2サイクルで要求される場合がある。アービタ24は、AStatOutボートをコンパイルし、次いで、固定されているがプログラム可能な数のサイクル(たとえば1サイクル)後に、AStatInボートを発行する。可能なAStatボートを、以下の表4にまとめて示す。
【表4】
【0021】
AStatIn期間に続き、固定されているがプログラム可能な数のサイクル(たとえば2サイクル)後に、ARespOutボートが要求される場合がある。アービタ24は、好ましくは次のサイクル中に、各スヌーパのARespOutボートをコンパイルしてARespInボートも送達する。可能なARespボートは、降順の優先順位でARespボートなどをリスト表示した、以下の表5にまとめて示すコヒーレンス応答を含むことが好ましい。
【表5】
【0022】
通常はノード制御装置20によって発行されるReRun ARespボートは、スヌープされた要求が長い待ち時間を有し(たとえば、リモート処理ノード側のプロセッサ12またはシステム・メモリ18によって要求が提供される)、要求のソースが後でトランザクションを再発行するように命令されることを示す。したがって、Retry ARespボートとは対照的に、ReRunは、ReRunをボートしたトランザクションの受信者(トランザクションの発信者ではない)に、通信トランザクションを後で再発行させる義務を負わせる。
【0023】
次に図2を参照すると、相互接続22上のノード制御装置20間で応答およびコマンドを通信する際に使用される、Iコマンドの例示的実施形態が示されている。図からわかるように、Iコマンド36は、コマンド・タイプ・フィールド33、ターゲット・ノード・フィールド35、ソース・ノード・フィールド37、トランザクション・タグ・フィールド38、および有効(V)フィールド39という、5つのフィールドを含む。コマンド・タイプ・フィールド33は、Iコマンド36のタイプの符号化表示を提供する。コマンド・タイプ・フィールド33内で符号化できる可能なIコマンドのいくつかを、以下の表6にまとめて示す。
【表6】
【0024】
各タイプのIコマンドについて、受信者はターゲット・ノード・フィールド35に指定され、送信側ノードはソース・ノード・フィールド37に指定され、Iコマンドが関係するトランザクションはトランザクション・タグ・フィールド38内に指定される。Iコマンド36の妥当性は、有効(V)フィールド39によって示される。
【0025】
E.ノード制御装置
次に図3を参照すると、図1のNUMAコンピュータ・システム8のノード制御装置20をより詳細に表した構成図が例示されている。図3からわかるように、ローカル相互接続16とノード相互接続22との間に結合されている各ノード制御装置20は、トランザクション受信ユニット40、トランザクション送信ユニット42、データ受信ユニット(DRU)44、およびデータ送信ユニット(DSU)46を含む。トランザクション受信ユニット40、トランザクション送信ユニット42、DRU44、およびDSU46は、たとえばフィールド・プログラム可能ゲート配列(FPGA)またはアプリケーション特有の集積回路(ASIC)を使って実装することができる。図に示すように、ノード・コントローラ20を介したアドレス・パスおよびデータ・パスは、アドレス信号はトランザクション受信ユニット40およびトランザクション送信ユニット42で処理され、データ信号はDSU44およびDRU46で処理されるように、2つに分岐する。
【0026】
ノード相互接続22のトランザクション・フロー・オフを示すように指定されているトランザクション受信ユニット40は、Iコマンド・チャネルを介して他のノードからIコマンドを受信すること、ノード相互接続22の共用アドレス・バスからトランザクションを受け入れること、ローカル相互接続16上でトランザクションを発行すること、およびトランザクション送信ユニット42に応答を転送することに対する責任を負っている。トランザクション受信ユニット40は、ノード相互接続22からトランザクションを受信し、トランザクション送信ユニット42内のマスタ54およびコヒーレンス応答論理56の両方に選択したトランザクションを渡す、応答マルチプレクサ52を含む。応答マルチプレクサ52からの通信トランザクションの受信に応答して、バス・マスタ54は、受信された通信トランザクションと同じか、またはエヴィクションなどディレクトリ保守のためにTSU内でディレクトリ制御用に生成される、そのローカル相互接続16上での通信トランザクションを開始することができる。
【0027】
ノード相互接続22上でトランザクションを流すためのコンジットであるトランザクション送信ユニット42は、その名称が示すように、トランザクション受信ユニット40と対話してメモリ要求トランザクションを処理し、DRU44およびDSU46にコマンドを発行してローカル相互接続16とノード相互接続22との間のデータ伝送を制御する。トランザクション送信ユニット42はさらに、コヒーレンス応答論理56を備えたノード相互接続22のために選択した(すなわちMSI)コヒーレンス・プロトコルを実装し、ディレクトリ制御論理58を備えたコヒーレンス・ディレクトリ50を維持する。
【表7】
【0028】
コヒーレンス・ディレクトリ50は、ローカル処理ノードがホーム・ノードであるリモート・ノード内でキャッシュに対して確認されたデータのシステム・メモリ・アドレスの表示(たとえばキャッシュ・ライン)を格納する。各データに関するこのアドレス表示は、こうした各リモート処理ノードでのデータのコピーおよびデータのコヒーレンス状態を有する、各リモート処理ノードの識別子に関連して格納される。コヒーレンス・ディレクトリ50のエントリに関する可能なコヒーレンス状態を、表7にまとめて示す。表7に示すように、リモート処理ノードによって保持されるキャッシュ・ラインのコヒーレンス状態に関する知識は不正確である。この不正確さは、リモートに保持されたキャッシュ・ラインが、ホーム・ノードのノード制御装置20に通知せずに、SからI、EからI、またはEからMへの移行を実行できるという事実による。
【0029】
II.データ損失の問題
次に図4および5を参照すると、NUMAコンピュータ・システム内でトランザクションがキャンセルされることよって生じる、データ損失状況の例が図示されている。図4では、ホーム・ノード10aのプロセッサ12aによって行われるキャッシュ・ラインに対するREAD要求は、キャッシュ・ラインが修正状態で保持されるリモート・ノード10bに転送される。次いでREAD要求は、リモート・ノード10bで修正・介入応答を受信する。修正・介入応答は、1つのキャッシュ・メモリが、修正されたデータを1つまたは複数の他のキャッシュ・メモリに直接提供できるようにし、要求が読取り専用要求の場合は、修正されたデータを受信したすべてのキャッシュ・メモリを共用状態にする、コヒーレンス・ボートである。MESIプロトコルおよびMSIプロトコルにおいて、共用状態とは、すべてのキャッシュ・メモリがホーム・ノード10aのシステム・メモリにあるラインのコピーに適合しているということを意味する。したがって、ラインを修正状態で保持したリモート・ノード10bのキャッシュ・メモリは共用状態に進むが、キャッシュ・ラインのホーム・ノードがノード10aなので、ホーム・ノード10aのシステム・メモリは更新されなければならない。図5に示すように、修正・介入応答は修正データと共に、ReRunトランザクションが発行されるホーム・ノード10aにその後返信される。ホーム・ノード10aのプロセッサ12aがトランザクションを再発行すると、トランザクションはホーム・ノード10aのエージェントによってキャンセルされる。ReRunトランザクションがキャンセルされる多くの理由の1つは、トランザクションがもはや不必要であると思われる見込みREADであったためである。その間に、リモート・ノード10bのキャッシュ・メモリは、キャッシュ・ラインが現在共用状態になっており、そのキャッシュ・ラインの唯一の有効なコピーがノード制御装置20に保存されていて、ローカル・メモリ18に達する方法がないので、このキャッシュ・ラインを暗黙に廃棄した可能性がある。前述の状況が検出され矯正されない限り、このデータは失われる。前述の状況に関連する別の問題は、データが損失した後にバスの衝突検出プロトコルによるデッドロックを引き起こす可能性のあるデータ転送が発生するまでは、ノード制御装置20内のキャッシュ・コヒーレンス・ディレクトリが消去されないことである。
【0030】
III.データ損失問題の解決方法
データ損失問題を解決するには、ノード制御装置20内のキャッシュ・コヒーレンス・ディレクトリが前述のすべての事象を監視できなければならない。これは、ノード制御装置20がそれに対して可視性を有する情報の場合に可能である。ノード制御装置20は、トランザクションがコヒーレンス応答ボーティング・ウィンドウから消去されるまで、すべてのトランザクションをバッファに入れる必要もある。ノード制御装置が修正・介入をボートしているReRunされたトランザクションがキャンセルされたことをノード制御装置20が検出すると、その後前述のデータ損失シナリオが発生すると言われる。NUMAコンピュータ・システムは一般に、そのトランザクションの種類を示すトランザクションのアドレスを備えたRビット属性などの表示を提供する。たとえば、R=0はオリジナル・トランザクションを表し、R=1はこれまでにReRunされ、ReRun要求によって再発行されるトランザクションを表す。
【0031】
ノード制御装置20がいったんデータ損失シナリオを検出すると、ノード制御装置20は以下のようにそのデータ損失シナリオを解決しなければならない。ノード制御装置20は、修正されたデータをローカル・メモリ18に書き戻しできるようにする、ローカル・バス16上の要求を生成しなければならない。ノード制御装置20は、トランザクションが応答段階を通過するまで前のトランザクションをすべて保持するので、ノード制御装置20は、データをローカル・メモリ18に書き戻しするために、書き戻し・消去(WBC)バス・トランザクションを生成することができる。ノード制御装置20は、ノード制御装置20が所有しているタグ領域内のタグを使用しなければならない。タグを所有しているプロセッサがタグを再度使用する可能性があるか、または別のバス・マスタが同じタグによって混乱する可能性があるので、オリジナル・タグは使用できない。ノード制御装置20は、保留バッファの識別子(ID)、ノードID、およびその独自のバス・マスタIDを使用して、固有のタグを生成することができる。
【0032】
ノード制御装置20にバスが認可されると、ノード制御装置20は新しいタグの付いたWBCトランザクションを生成し、Rビットは「1」に設定される。ノード制御装置20は、データ・バッファ内に保持しているデータもWBCに提供する。そのデータのタグは、新しいトランザクション・タグに合うように変更される。ノード制御装置20が別々のアドレス・ユニットとデータ・ユニットに分けられている場合、データ・ユニット内に常駐するデータ・パケットも新しいタグに付け替える必要がある。これは、古いタグと新しいタグの両方をデータ・ユニットに渡すコマンドを使って達成される。データがメモリに書き込まれるまで、ノード制御装置20内のコヒーレンス機構は、キャッシュ・ラインに対するトランザクションを再試行して、このキャッシュ・ラインのコヒーレンスを保護しなければならない。Rビットが「1」に設定されているので、ノード制御装置20は独自のWBCトランザクションを再試行しない。WBC要求がいったん完了すると、エントリは保留バッファから削除され、ディレクトリ状態は更新される。
【0033】
次に図6、図7、図8を参照すると、本発明の例示的実施形態による、キャンセルされたトランザクションによって引き起こされるデータ損失状況の解決例が示されている。図6に示すように、ホーム・ノード10aでのREAD要求は、修正されたデータが常駐するリモート・ノード10bに転送される。READ要求は、リモート・ノード10bで修正・介入のボートを受け取る。次いでリモート・ノード10bは、図7に示すように、修正・介入ボートおよび修正されたデータをホーム・ノード10aに送信する。ホーム・ノード10aのプロセッサ12aが、ノード制御装置20からのReRun要求の結果としてR=1トランザクションを再発行すると、ホーム・ノード10aは再試行のボートを発行するので、トランザクションがキャンセルされる。ノード制御装置20は、データ損失シナリオの発生を監視することができる。ノード制御装置20は次いで前述のように新しいタグを生成し、R=1でWBC要求を発行する。ノード制御装置20内のコヒーレンス機構は、図8に示すように、WBC要求がローカルに生成されたWBC要求のReRunであるかのように、WBC要求を完了させることができる。その結果、ここでローカル・メモリ18内のデータが有効になる。
【0034】
以上述べてきたように、本発明は、NUMAコンピュータ・システム内でのトランザクションのキャンセルによるデータ損失を避けるための改良方法を提供するものである。
【0035】
まとめとして、本発明の構成に関して以下の事項を開示する。
【0036】
(1)相互接続に結合された少なくとも2つのノードを含み、前記少なくとも2つのノードがそれぞれローカル・システム・メモリを含む、不均等メモリ・アクセス(NUMA)コンピュータ・システムにおいて、トランザクションのキャンセルによるデータ損失を避けるための方法であって、
ホーム・ノードから修正されたデータが常駐するリモート・ノードへのデータ・アクセス要求に応答して、修正・介入ボートを前記修正されたデータと共に前記リモート・ノードから前記ホーム・ノードへ送信するステップと、
その後、前記ホーム・ノードに配置されたノード制御装置からの再発行要求の結果として、前記ホーム・ノードに配置されたプロセッサがデータ・アクセス要求を再発行するのに応答して、前記ホーム・ノードからの前記データ・アクセス要求をキャンセルするステップと、
前記修正されたデータを、前記ノード制御装置から前記ホーム・ノードに配置されたローカル・システム・メモリに送達するための書き戻し要求を発行するステップとを含む方法。
(2)前記データ・アクセス要求が、修正されたデータをメモリに書き込ませる任意のトランザクションを含む、上記(1)に記載の方法。
(3)前記再発行されたデータ・アクセス要求トランザクションが、再発行インジケータ・ビット・セットを有する、上記(1)に記載の方法。
(4)前記書き戻し要求がライン書き戻し要求である、上記(1)に記載の方法。
(5)前記ホーム・ノードに配置されているプロセッサによって書き戻し要求を発行する前記ステップが、前記データ・アクセス要求のキャンセルに応答して実行される、上記(1)に記載の方法。
(6)書き戻し要求を発行する前記ステップが、修正・介入を送信する前記ステップとキャンセル・ボートを発行する前記ステップに応答して実行される、上記(1)に記載の方法。
(7)トランザクションのキャンセルによるデータの損失を避けることのできる不均等メモリ・アクセス(NUMA)コンピュータ・システムであって、相互接続に結合された少なくとも2つのノードを含み、前記少なくとも2つのノードがそれぞれローカル・システム・メモリを含み、
ホーム・ノードから修正されたデータが常駐するリモート・ノードへのデータ・アクセス要求に応答して、修正・介入ボートを前記修正されたデータと共に前記リモート・ノードから前記ホーム・ノードへ送信する手段と、
前記ホーム・ノードに配置されたノード制御装置からの再発行要求の結果として、前記ホーム・ノードに配置されたプロセッサがデータ・アクセス要求を再発行するのに応答して、前記ホーム・ノードからの前記データ・アクセス要求をキャンセルする手段と、
前記修正されたデータを、前記ノード制御装置から前記ホーム・ノードに配置されたローカル・システム・メモリに送達するための書き戻し要求を発行する手段とを含むNUMAコンピュータ・システム。
(8)前記データ・アクセス要求が、修正されたデータをメモリに書き込ませる任意のトランザクションを含む、上記(7)に記載のNUMAコンピュータ・システム。
(9)前記再発行されたデータ・アクセス要求トランザクションが、再発行インジケータ・ビット・セットを有する、上記(7)に記載のNUMAコンピュータ・システム。
(10)前記書き戻し要求がライン書き戻し要求である、上記(7)に記載のNUMAコンピュータ・システム。
(11)前記ホーム・ノードに配置されているプロセッサによって書き戻し要求を発行する前記手段が、前記データ・アクセス要求のキャンセルに応答して実行される、上記(7)に記載のNUMAコンピュータ・システム。
(12)書き戻し要求を発行する前記手段が、修正・介入の送信とキャンセル・ボートの発行に応答して実行される、上記(7)に記載のNUMAコンピュータ・システム。
【図面の簡単な説明】
【図1】本発明の好ましい実施形態による、不均等メモリ・アクセス(NUMA)コンピュータ・システムの構成図である。
【図2】I−コマンドの例示的実施形態を示す図である。
【図3】図1に示されたノード制御装置のさらに詳細な構成図である。
【図4】NUMAコンピュータ・システムにおいて、キャンセル済みトランザクションによって引き起こされるデータ損失状況を示す図である。
【図5】NUMAコンピュータ・システムにおいて、キャンセル済みトランザクションによって引き起こされるデータ損失状況を示す図である。
【図6】本発明の好ましい実施形態により、キャンセル済みトランザクションによって引き起こされるデータ損失状況のソリューションを示す図である。
【図7】本発明の好ましい実施形態により、キャンセル済みトランザクションによって引き起こされるデータ損失状況のソリューションを示す図である。
【図8】本発明の好ましい実施形態により、キャンセル済みトランザクションによって引き起こされるデータ損失状況のソリューションを示す図である。
【符号の説明】
10a 処理ノード
10b 処理ノード
12a プロセッサ
16 ローカル相互接続
18 メモリ
20 ノード制御装置
24 アービタ
Claims (12)
- 相互接続に結合された少なくとも2つのノードを含み、前記少なくとも2つのノードがそれぞれローカル・システム・メモリを含む、不均等メモリ・アクセス(NUMA)コンピュータ・システムにおいて、トランザクションのキャンセルによるデータ損失を避けるための方法であって、
ホーム・ノードから、修正されたデータがキャッシュメモリに保存されているリモート・ノードへのデータ・アクセス要求に応答して、前記リモート・ノードが、修正・介入ボートを前記修正されたデータと共に前記ホーム・ノードのノード制御装置へ送信するステップと、
その後、前記ホーム・ノードに配置されたノード制御装置からの再発行要求の結果として、前記ホーム・ノードに配置されたプロセッサがデータ・アクセス要求を再発行するステップと、
前記ホーム・ノードが前記再発行されたデータ・アクセス要求をキャンセルした場合には、前記ノード制御装置が、前記修正されたデータを、前記ノード制御装置から前記ホーム・ノードに配置されたローカル・システム・メモリに書き戻すための書き戻し要求を発行するステップとを含む方法。 - 前記データ・アクセス要求及び前記再発行されたデータ・アクセス要求が、修正されたデータをメモリに書き込ませる任意の要求を含む、請求項1に記載の方法。
- 前記再発行されたデータ・アクセス要求が、再発行インジケータ・ビット・セットを用いて表示される、請求項1に記載の方法。
- 前記書き戻し要求がライン書き戻し要求である、請求項1に記載の方法。
- 前記ホーム・ノードに配置されているノード制御装置が書き戻し要求を発行する前に、前記書き戻し要求に付するタグを生成するステップをさらに含む、請求項1〜4のいずれか1項に記載の方法。
- 前記データ・アクセス要求及び前記再発行されたデータ・アクセス要求が、 READ 要求である、請求項1に記載の方法。
- トランザクションのキャンセルによるデータの損失を避けることのできる不均等メモリ・アクセス(NUMA)コンピュータ・システムであって、相互接続に結合された少なくとも2つのノードを含み、前記少なくとも2つのノードがそれぞれローカル・システム・メモリを含み、
ホーム・ノードから、修正されたデータがキャッシュメモリに保存されているリモート・ノードへのデータ・アクセス要求に応答して、前記リモート・ノードが修正・介入ボートを前記修正されたデータと共に前記リモート・ノードから前記ホーム・ノードのノード制御装置へ送信する手段を含み、
前記ホーム・ノードに配置されたプロセッサは、前記ノード制御装置からの再発行要求の結果として、データ・アクセス要求を再発行する手段を含み、
前記ノード制御装置は、前記再発行されたデータ・アクセス要求がキャンセルされた場合に、前記修正されたデータを、前記ノード制御装置から前記ホーム・ノードに配置されたローカル・システム・メモリに送達するための書き戻し要求を発行する手段を含む、ことを特徴とするNUMAコンピュータ・システム。 - 前記データ・アクセス要求及び前記再発行されたデータ・アクセス要求が、修正されたデータをメモリに書き込ませる任意の要求を含む、請求項7に記載のNUMAコンピュータ・システム。
- 前記再発行されたデータ・アクセス要求が、再発行インジケータ・ビット・セットを用いて表示される、請求項7に記載のNUMAコンピュータ・システム。
- 前記書き戻し要求がライン書き戻し要求である、請求項7に記載のNUMAコンピュータ・システム。
- 前記ノード制御装置が、前記書き戻し要求に付するタグを生成する手段をさらに含む、請求項7〜10のいずれか1項に記載のNUMAコンピュータ・システム。
- 前記データ・アクセス要求及び前記再発行されたデータ・アクセス要求が READ 要求である、請求項7に記載のNUMAコンピュータ・システム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/259378 | 1999-02-26 | ||
US09/259,378 US6192452B1 (en) | 1999-02-26 | 1999-02-26 | Method and system for avoiding data loss due to cancelled transactions within a non-uniform memory access system |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000250883A JP2000250883A (ja) | 2000-09-14 |
JP3629511B2 true JP3629511B2 (ja) | 2005-03-16 |
Family
ID=22984698
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000045925A Expired - Fee Related JP3629511B2 (ja) | 1999-02-26 | 2000-02-23 | 不均等メモリ・アクセス・システムにおいてトランザクションのキャンセルによるデータ損失を避けるための方法およびシステム |
Country Status (3)
Country | Link |
---|---|
US (1) | US6192452B1 (ja) |
JP (1) | JP3629511B2 (ja) |
CN (1) | CN1116642C (ja) |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6591348B1 (en) * | 1999-09-09 | 2003-07-08 | International Business Machines Corporation | Method and system for resolution of transaction collisions to achieve global coherence in a distributed symmetric multiprocessor system |
JP2001167077A (ja) * | 1999-12-09 | 2001-06-22 | Nec Kofu Ltd | ネットワークシステムにおけるデータアクセス方法、ネットワークシステムおよび記録媒体 |
US6938128B1 (en) | 2000-07-20 | 2005-08-30 | Silicon Graphics, Inc. | System and method for reducing memory latency during read requests |
US6678798B1 (en) * | 2000-07-20 | 2004-01-13 | Silicon Graphics, Inc. | System and method for reducing memory latency during read requests |
US8635410B1 (en) | 2000-07-20 | 2014-01-21 | Silicon Graphics International, Corp. | System and method for removing data from processor caches in a distributed multi-processor computer system |
US6915387B1 (en) | 2000-07-20 | 2005-07-05 | Silicon Graphics, Inc. | System and method for handling updates to memory in a distributed shared memory system |
US6826619B1 (en) | 2000-08-21 | 2004-11-30 | Intel Corporation | Method and apparatus for preventing starvation in a multi-node architecture |
US6487643B1 (en) * | 2000-09-29 | 2002-11-26 | Intel Corporation | Method and apparatus for preventing starvation in a multi-node architecture |
US20020078118A1 (en) * | 2000-12-19 | 2002-06-20 | Cone Robert W. | Network interface application specific integrated circuit to allow direct attachment for an appliance,such as a printer device |
US6772298B2 (en) | 2000-12-20 | 2004-08-03 | Intel Corporation | Method and apparatus for invalidating a cache line without data return in a multi-node architecture |
US7234029B2 (en) * | 2000-12-28 | 2007-06-19 | Intel Corporation | Method and apparatus for reducing memory latency in a cache coherent multi-node architecture |
US7213049B2 (en) * | 2001-07-17 | 2007-05-01 | Bea Systems, Inc. | System and method for transaction processing with transaction property feature |
US7266587B2 (en) * | 2002-05-15 | 2007-09-04 | Broadcom Corporation | System having interfaces, switch, and memory bridge for CC-NUMA operation |
US20040059858A1 (en) * | 2002-09-23 | 2004-03-25 | Blankenship Robert G. | Methods and arrangements to enhance a downbound path |
US8185602B2 (en) | 2002-11-05 | 2012-05-22 | Newisys, Inc. | Transaction processing using multiple protocol engines in systems having multiple multi-processor clusters |
US7386626B2 (en) * | 2003-06-23 | 2008-06-10 | Newisys, Inc. | Bandwidth, framing and error detection in communications between multi-processor clusters of multi-cluster computer systems |
US7395347B2 (en) * | 2003-08-05 | 2008-07-01 | Newisys, Inc, | Communication between and within multi-processor clusters of multi-cluster computer systems |
US20090039482A1 (en) * | 2005-08-31 | 2009-02-12 | Jiangqi He | Package Including a Microprocessor & Fourth Level Cache |
US20080320233A1 (en) * | 2007-06-22 | 2008-12-25 | Mips Technologies Inc. | Reduced Handling of Writeback Data |
US7769957B2 (en) * | 2007-06-22 | 2010-08-03 | Mips Technologies, Inc. | Preventing writeback race in multiple core processors |
US8627014B2 (en) * | 2008-12-30 | 2014-01-07 | Intel Corporation | Memory model for hardware attributes within a transactional memory system |
CN102122256B (zh) * | 2011-03-28 | 2013-01-09 | 中国人民解放军国防科学技术大学 | 一种用于进程间通信的管道式通信方法及*** |
US20120311262A1 (en) * | 2011-06-01 | 2012-12-06 | International Business Machines Corporation | Memory cell presetting for improved memory performance |
US9280468B2 (en) * | 2011-10-26 | 2016-03-08 | Qualcomm Technologies, Inc. | Three channel cache-coherency socket protocol |
US9287005B2 (en) | 2013-12-13 | 2016-03-15 | International Business Machines Corporation | Detecting missing write to cache/memory operations |
US10237169B2 (en) * | 2016-04-01 | 2019-03-19 | Intel Corporation | Technologies for quality of service based throttling in fabric architectures |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5297269A (en) * | 1990-04-26 | 1994-03-22 | Digital Equipment Company | Cache coherency protocol for multi processor computer system |
US5895484A (en) * | 1997-04-14 | 1999-04-20 | International Business Machines Corporation | Method and system for speculatively accessing cache memory data within a multiprocessor data-processing system using a cache controller |
US5940856A (en) * | 1997-04-14 | 1999-08-17 | International Business Machines Corporation | Cache intervention from only one of many cache lines sharing an unmodified value |
US5943684A (en) * | 1997-04-14 | 1999-08-24 | International Business Machines Corporation | Method and system of providing a cache-coherency protocol for maintaining cache coherency within a multiprocessor data-processing system |
US6067611A (en) * | 1998-06-30 | 2000-05-23 | International Business Machines Corporation | Non-uniform memory access (NUMA) data processing system that buffers potential third node transactions to decrease communication latency |
US6085293A (en) * | 1998-08-17 | 2000-07-04 | International Business Machines Corporation | Non-uniform memory access (NUMA) data processing system that decreases latency by expediting rerun requests |
US6081874A (en) * | 1998-09-29 | 2000-06-27 | International Business Machines Corporation | Non-uniform memory access (NUMA) data processing system that speculatively issues requests on a node interconnect |
US6067603A (en) * | 1998-10-01 | 2000-05-23 | International Business Machines Corporation | Non-uniform memory access (NUMA) data processing system that speculatively issues requests on a node interconnect |
US6115804A (en) * | 1999-02-10 | 2000-09-05 | International Business Machines Corporation | Non-uniform memory access (NUMA) data processing system that permits multiple caches to concurrently hold data in a recent state from which data can be sourced by shared intervention |
-
1999
- 1999-02-26 US US09/259,378 patent/US6192452B1/en not_active Expired - Fee Related
- 1999-12-24 CN CN99126571.8A patent/CN1116642C/zh not_active Expired - Fee Related
-
2000
- 2000-02-23 JP JP2000045925A patent/JP3629511B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US6192452B1 (en) | 2001-02-20 |
CN1264874A (zh) | 2000-08-30 |
CN1116642C (zh) | 2003-07-30 |
JP2000250883A (ja) | 2000-09-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3629511B2 (ja) | 不均等メモリ・アクセス・システムにおいてトランザクションのキャンセルによるデータ損失を避けるための方法およびシステム | |
EP1153349B1 (en) | Non-uniform memory access (numa) data processing system that speculatively forwards a read request to a remote processing node | |
US6115804A (en) | Non-uniform memory access (NUMA) data processing system that permits multiple caches to concurrently hold data in a recent state from which data can be sourced by shared intervention | |
US6108764A (en) | Non-uniform memory access (NUMA) data processing system with multiple caches concurrently holding data in a recent state from which data can be sourced by shared intervention | |
CA2280172C (en) | Non-uniform memory access (numa) data processing system that holds and reissues requests at a target processing node in response to a retry | |
US6275907B1 (en) | Reservation management in a non-uniform memory access (NUMA) data processing system | |
US6067603A (en) | Non-uniform memory access (NUMA) data processing system that speculatively issues requests on a node interconnect | |
EP0817051B1 (en) | Multiprocessing system having coherency related error logging capabilities and method therefor | |
EP0817077B1 (en) | A multiprocessing system configured to perform prefetching operations and method therefor | |
CA2271536C (en) | Non-uniform memory access (numa) data processing system that buffers potential third node transactions to decrease communication latency | |
US6081874A (en) | Non-uniform memory access (NUMA) data processing system that speculatively issues requests on a node interconnect | |
EP0817070B1 (en) | Multiprocessing system employing a coherency protocol including a reply count | |
US6266743B1 (en) | Method and system for providing an eviction protocol within a non-uniform memory access system | |
EP0817072A2 (en) | A multiprocessing system configured to store coherency state within multiple subnodes of a processing node | |
JP3575595B2 (ja) | 不均等メモリ・アクセス・システム内で書き戻しの衝突によって生じるライブロックを避けるための方法およびシステム | |
JP3574031B2 (ja) | 不均等メモリ・アクセス・システム内で無効化トランザクションの衝突によって生じるライブロックを避けるための方法およびシステム | |
US6085293A (en) | Non-uniform memory access (NUMA) data processing system that decreases latency by expediting rerun requests |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040106 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040402 Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20040402 |
|
RD12 | Notification of acceptance of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7432 Effective date: 20040402 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20040405 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040621 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20040915 Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040915 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040915 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20041018 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20041018 |
|
RD14 | Notification of resignation of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7434 Effective date: 20041018 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20041111 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071224 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081224 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |