JPH09204403A

JPH09204403A - 並列計算機

Info

Publication number: JPH09204403A
Application number: JP8011540A
Authority: JP
Inventors: Keimei Fujii; 啓明藤井; Tadaaki Isobe; 忠章磯部; Makoto Koga; 誠古賀; Hideya Akashi; 英也明石
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 1996-01-26
Filing date: 1996-01-26
Publication date: 1997-08-05
Also published as: US6119150A

Abstract

(57)【要約】【課題】メッセージパッシング型の並列計算機における
データ転送に係わるソフトウェアによるキャッシュ一致
制御処理のオーバヘッドを低減してデータ転送性能を向
上させ、又、データ転送時にキャッシュメモリを意識し
制御するというプログラム上の制約を緩和する。【解決手段】ストレージコントローラからの要求に応じ
てキャッシュ一致制御を行う演算プロセッサを採用し、
ストレージコントローラに、キャッシュ一致制御処理部
を設け、キャッシュ一致制御処理部が、データ転送に係
わる主記憶アクセスのアクセス先アドレス領域を対象と
したキャッシュ一致制御を行うと共に、キャッシュ一致
制御処理を基本的にキャッシュラインに1回となるよう
にしてキャッシュ一致制御を含むデータ転送を行う。【効果】データ転送に係わるソフトウェアによるキャッ
シュ一致制御処理が不要となり、キャッシュメモリ制御
を含めたデータ転送効率が向上し、プログラム上の制約
が緩和される。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、分散メモリ方式の
並列計算機に係わり、特に、並列計算機を構成する要素
プロセッサ間でのデータ送受信時における、送受信対象
データを格納する主記憶領域に対するキャッシュメモリ
と主記憶の内容一致制御を実現する並列計算機に関す
る。

【０００２】

【従来の技術】計算機に対する高速処理性能への要求
は、演算プロセッサを複数台連携して使用する並列計算
機の登場を促した。科学技術計算などのいわゆるスーパ
ーコンピューティング分野への適用を目的とする並列計
算機は、数百台から数千台の演算プロセッサを有し、そ
の演算プロセッサが相互結合網で接続されるという形態
をとる。また、この形態の並列計算機は、各演算プロセ
ッサがそれぞれ主記憶を有し、それを管理するという構
成方式（一般に分散メモリ方式と呼ぶ）をとる。

【０００３】分散メモリ方式の並列計算機では、各演算
プロセッサが他の演算プロセッサが管理する主記憶上の
データを参照したい場合に、演算プロセッサ間の相互結
合網を介したデータ転送によってこれを実現する。分散
メモリ方式の並列計算機は、このデータ転送の実現方法
の違いによって、分散共有メモリ型とメッセージパッシ
ング型の２種類に分類される。

【０００４】分散共有メモリ型の並列計算機では、他演
算プロセッサの主記憶領域を指すアドレスへのロード／
ストア命令（機械語命令）の実行によって自動的にデー
タ転送が発生する。この時のデータ転送量は、ロード／
ストア命令が対象とするワード（方式によっては数十ワ
ード）程度である。一方、メッセージパッシング型の並
列計算機では、プログラム上の手続き（関数）により明
示的にデータ転送機構を動作させてデータ転送を実現す
る。この時のデータ転送量は、ハードウェア的な限界が
あるものの、その限界までの範囲内で任意であり、数キ
ロワード以上といった多量のデータ転送も実現できる。

【０００５】上述のとおり、分散共有メモリ型とメッセ
ージパッシング型では、データ転送起動のメカニズムや
転送データ量に相違があるが、さらに演算プロセッサが
キャッシュメモリを有する場合の制御機構が大幅に異な
る。分散共有メモリ型の並列計算機では、バス結合のマ
ルチプロセッサ（シンメトリックマルチプロセッサ：Ｓ
ＭＰ）と同様に、データ転送にともなって、キャッシュ
メモリと主記憶との内容一致制御（コヒーレンス制御）
をハードウェアによって自動的に行う。例えば、米国Ｓ
ｔａｎｆｏｒｄ大学のＤａｓｈという分散共有メモリ型
の並列計算機では、ディレクトリ方式という方式でコヒ
ーレンス制御を実現している。しかし、このような制御
機構を実現するのは、ハードウェアコストの面からは不
利である。一方、メッセージパッシング型の並列計算機
では、データ転送にともなうコヒーレンス制御はハード
ウェアでは行わず、ソフトウェアで明示的に行う。具体
的には、キャッシュメモリを制御するフラッシュ（キャ
ッシュメモリ上のデータが主記憶と異なる場合にその内
容を主記憶に書き戻した後、そのデータ領域をキャッシ
ュメモリ上から消失させる）命令やパージ（キャッシュ
メモリ上からデータ領域を消失させる）命令などを用い
てデータ転送の前に転送するデータ領域をキャッシュメ
モリから消失させておき、キャッシュメモリと主記憶の
内容不一致を防止する。

【０００６】

【発明が解決しようとする課題】上述したとおり、メッ
セージパッシング型の並列計算機では、データ転送時に
キャッシュメモリと主記憶の内容不一致を防止すること
を目的として、データ転送（送信あるいは受信）前にソ
フトウェアによって明示的にキャッシュメモリのフラッ
シュまたはパージ処理が必要になる。データ転送の性能
という観点で述べると、このようなソフトウェア処理は
それ自体大変なオーバヘッド（性能低下要因）であり、
また、データ転送時に、キャッシュメモリという本来ハ
ードウェアに任せておけば良い要素をソフトウェアで意
識し、制御する必要が生じるという点は、プログラム全
体（アルゴリズム）にとっても大きな制約事項となり、
処理効率を低下させる。

【０００７】このようなメッセージパッシング型の並列
計算機におけるデータ転送にともなうソフトウェアのオ
ーバヘッドを低減し、プログラム上の制約を緩和すると
いうのが本発明が解決しようとする課題である。

【０００８】

【課題を解決するための手段】シンメトリックマルチプ
ロセッサを構成するときに用いられる演算プロセッサ
は、バスを介して伝えられるトランザクション要求に応
じてハードウェアでキャッシュメモリを制御する（フラ
ッシュまたはパージ処理を行う）機構を有している。本
発明は、並列計算機の演算プロセッサとして、バスを介
して伝えられるトランザクション要求に応じてハードウ
ェアでキャッシュメモリを制御する機構を有している演
算プロセッサを採用することを前提とする。

【０００９】そして、上記課題を解決するために、本発
明の並列計算機は、データ転送の際に、そのデータの送
信あるいは受信と並行して、その送信／受信で発生する
主記憶アクセスの送信元あるいは受信先のアドレス領域
を対象としたキャッシュメモリ制御（フラッシュあるい
はパージ）要求を演算プロセッサに対し順次発行してい
く回路を有する。

【００１０】また、本発明の並列計算機は、データ転送
が連続アドレス領域のデータを扱うという特徴を利用し
て、演算プロセッサに対するキャッシュメモリ制御要求
の発行回数を、基本的にはキャッシュメモリへの登録単
位であるキャッシュラインごとに1回となるようにし、
キャッシュメモリ制御を含めたデータ転送の効率を向上
させる。

【００１１】具体的には、それぞれが、命令プロセッ
サ、主記憶、前記主記憶へのアクセスの効率向上に使用
するキャッシュメモリを有する複数のプロセッサと、前
記複数のプロセッサを結合する相互結合網とからなり、
データ書き込みを前記キャッシュメモリと前記主記憶の
両方に対して同時に行う、分散メモリ方式の並列計算機
において、前記相互結合網を介して転送されるデータを
前記プロセッサが前記相互結合網から受信する際に、受
信データを格納する主記憶領域の内容を前記キャッシュ
メモリから消失させる消失手段と、前記消失手段の実行
後に、前記受信データを前記主記憶に書き込む手段を設
ける。また、前記消失手段は、前記主記憶から前記キャ
ッシュメモリへのデータ複写の単位となる複数語からな
る連続アドレス領域に対するデータの受信が前記相互結
合網から繰り返されている間は、前記連続アドレス領域
への１つ目の受信データの前記主記憶への書き込みの前
に一度だけ前記連続アドレス領域を前記キャッシュメモ
リから消失させ、前記連続アドレス領域が一度前記キャ
ッシュメモリから消失されると、前記連続アドレス領域
が再び前記キャッシュメモリに複写されるまで、前記連
続アドレス領域に対する受信データを受けた際、前記連
続アドレス領域を前記キャッシュメモリから消失させる
動作を行わない様にする。更にまた前記連続アドレス領
域へのデータの受信が継続している間に前記連続アドレ
ス領域が再び前記キャッシュメモリに複写された場合に
は、前記連続アドレス領域が再び前記キャッシュメモリ
に複写された以降１つめの受信データの前記主記憶への
書き込みの前に１度だけ前記連続アドレス領域を前記キ
ャッシュメモリから消失させ、以降は前記連続アドレス
領域が再び前記キャッシュメモリに複写されるまで、前
記連続アドレス領域に対する受信データを受けた際、前
記連続アドレス領域を前記キャッシュメモリから消失さ
せる動作を行わない様にする。

【００１２】次に、それぞれが、命令プロセッサ、主記
憶、前記主記憶へのアクセスの効率向上に使用するキャ
ッシュメモリを有する複数のプロセッサと、前記複数の
プロセッサを結合する相互結合網とからなり、通常はデ
ータの書き込みを前記キャッシュメモリに対して行い、
かつ前記主記憶への書き戻し要求があったときにデータ
の書き込みを主記憶に対して行う、分散メモリ方式の並
列計算機において、前記相互結合網を介して転送される
データを前記プロセッサが受信する際に、前記受信する
データを格納する前記主記憶領域の内容が前記キャッシ
ュメモリと前記主記憶の間で異なる場合に前記主記憶領
域の内容を前記キャッシュメモリから前記主記憶に書き
戻し、かつ前記受信データを格納する主記憶領域の内容
を前記キャッシュメモリから消失させる第１の手段と、
第１の手段の実行後、前記受信データを前記主記憶に書
き込む手段を有する様にする。次に又、前記第１の手段
は、前記主記憶から前記キャッシュメモリへのデータ複
写の単位となる複数語からなる連続アドレス領域に対す
るデータの受信が繰り返されている間は、前記連続アド
レス領域への１つ目の受信データの前記主記憶への書き
込みの前に１度だけ、前記キャッシュメモリ上の前記連
続アドレス領域の内容が主記憶と異なる場合に前記連続
アドレス領域の内容を主記憶に反映し、かつ前記連続ア
ドレス領域を前記キャッシュメモリから消失させ、以降
は前記連続アドレス領域が再び前記キャッシュメモリに
複写されるまでは前記連続アドレス領域に対する受信デ
ータを受けた際、前記キャッシュメモリ上の前記連続ア
ドレス領域の内容が主記憶と異なる場合に前記連続アド
レス領域の内容を主記憶に反映し、かつ前記連続アドレ
ス領域を前記キャッシュメモリから消失させる動作を行
わない様にする。次に又、前記第１の手段は、前記連続
アドレス領域へのデータ受信が継続している間に前記連
続アドレス領域が再び前記キャッシュメモリに複写され
た場合には、前記連続アドレス領域が再び前記キャッシ
ュメモリに複写された以降１つ目の受信データの主記憶
への書き込みの前に１度だけ、前記キャッシュメモリ上
の前記連続アドレス領域の内容が主記憶と異なる場合に
前記連続アドレス領域の内容を主記憶に反映し、かつ前
記連続アドレス領域を前記キャッシュメモリから消失さ
せ、以降は前記連続アドレス領域が再び前記キャッシュ
メモリに複写されるまでは前記連続アドレス領域に対す
る受信データを受けても、前記キャッシュメモリ上の前
記連続アドレス領域の内容が主記憶と異なる場合に前記
連続アドレス領域の内容を主記憶に反映し、かつ前記連
続アドレス領域を前記キャッシュメモリから消失させる
動作を行わない様にする。

【００１３】更に、それぞれが、命令プロセッサ、主記
憶、前記主記憶へのアクセスの効率向上に使用するキャ
ッシュメモリを有する複数のプロセッサと、前記複数の
プロセッサを結合する相互結合網とからなり、通常はデ
ータの書き込みを前記キャッシュメモリに対して行い、
かつ前記主記憶への書き戻し要求があったときにデータ
の書き込みを主記憶に対して行う、分散メモリ方式の並
列計算機において、前記相互結合網を介して転送される
データを前記プロセッサが送信する際に、前記送信デー
タが格納される主記憶領域の内容が前記キャッシュメモ
リと前記主記憶の間で異なる場合に前記主記憶領域の内
容を前記キャッシュメモリから前記主記憶に書き戻し、
かつ前記送信データが格納される主記憶領域の内容を前
記キャッシュメモリから消失させる第１の手段と、前記
第１の手段の実行後、前記送信データを前記主記憶から
読み出し手段を設ける。更に又、前記主記憶から前記キ
ャッシュメモリへのデータ複写の単位となる複数語から
なる連続アドレス領域からのデータの送信が繰り返され
ている間は、前記連続アドレス領域への１つめの送信デ
ータの主記憶からの読み出しの前に１度だけ、前記キャ
ッシュメモリ上の前記連続アドレス領域の内容が主記憶
と異なる場合に前記連続アドレス領域の内容を前記主記
憶に反映し、かつ前記連続アドレス領域を前記キャッシ
ュメモリから消失させるという動作を行い、以降は前記
連続アドレス領域が再び前記キャッシュメモリに複写さ
れるまでは前記連続アドレス領域からの送信データ読み
出しの際、前記キャッシュメモリ上の前記連続アドレス
領域の内容が主記憶と異なる場合に前記連続アドレス領
域の内容を前記主記憶に反映し、かつ前記連続アドレス
領域を前記キャッシュメモリから消失させるという動作
を行わない様にする。更に又、前記連続アドレス領域か
らのデータ送信が継続している間に前記連続アドレス領
域が再び前記キャッシュメモリに複写された場合には、
前記連続アドレス領域が再び前記キャッシュメモリに複
写された以降１つめの送信データの主記憶からの読み出
しの前に１度だけ、前記キャッシュメモリ上の前記連続
アドレス領域の内容が主記憶と異なる場合に前記連続ア
ドレス領域の内容を主記憶に反映し、かつ前記連続アド
レス領域を前記キャッシュメモリから消失させるという
動作を行い、以降は前記連続アドレス領域が再び前記キ
ャッシュメモリに複写されるまでは前記連続アドレス領
域からの送信データ読み出しがあっても、前記キャッシ
ュメモリ上の前記連続アドレス領域の内容が主記憶と異
なる場合に前記連続アドレス領域の内容を主記憶に反映
し、かつ前記連続アドレス領域を前記キャッシュメモリ
から消失させるという動作を行わない様にする。

【００１４】

【発明の実施の形態】

（実施の形態１）本発明の実施の形態を図を用いながら
説明する。図２は、メッセージパッシング型の並列計算
機の概略構成を示している。メッセージパッシング型の
並列計算機は、数十から数百、数千といった台数の要素
プロセッサ２０１（２０１ａ、２０１ｂ、・・・、２０
１ｎ）で構成され、要素プロセッサ２０１各々は、相互
結合網２０２に接続され、その相互結合網２０２を介し
て他の要素プロセッサ２０１とデータの授受を行う。相
互結合網２０２の構成方法は様々であるが、本発明では
この相互結合網２０２の構成方法を特に限定しない。

【００１５】要素プロセッサ２０１の構成方法もまた多
種多様になるが、その一例を図３で概略的に示す。要素
プロセッサ２０１の主な構成要素は、演算プロセッサ
（命令プロセッサとも呼ばれる）３０１、演算プロセッ
サ３０１に付随するキャッシュメモリ（単にキャッシュ
と呼ぶ場合もある）３０２、演算プロセッサ３０１や後
述のネットワークインタフェース３０５およびＩ／Ｏイ
ンタフェース３０３から発行されるデータアクセス要求
にしたがって適当な記憶デバイスにアクセスを行うスト
レージコントローラ３０４、ストレージコントローラ３
０４で制御される主記憶３０６、相互結合網２０２に接
続し、データ転送を制御するネットワークインタフェー
ス３０５、および、ストレージコントローラ３０４から
の要求によってＩ／Ｏ装置にアクセスを行うＩ／Ｏイン
タフェース３０３などである。なお、Ｉ／Ｏインタフェ
ース３０３は構成によっては存在しないケースも考えら
れる。

【００１６】要素プロセッサ２０１中、演算プロセッサ
３０１は、プログラム処理を行うユニットであり、ネッ
トワークインタフェース３０５は、演算プロセッサ３０
１からの指令にしたがって、メッセージパッシング型の
並列計算機の特徴であるデータ転送（メッセージパッシ
ング）を演算プロセッサ３０１のプログラム処理とは独
立に行うユニットである。演算プロセッサ３０１とネッ
トワークインタフェース３０５が独立に動作するため、
ストレージコントローラ３０４は、演算プロセッサ３０
１からの主記憶３０６のアクセスを処理すると同時に、
ネットワークインタフェース３０５からのデータ転送に
ともなう主記憶３０６へのアクセスも処理する。本発明
は、このストレージコントローラ３０４内に実現する機
構に係わる。

【００１７】次に、本実施の形態においての前提事項に
ついて述べる。まず、本発明は、メッセージパッシング
型の並列計算機での適用を前提とする。メッセージパッ
シング型の並列計算機では、１回のデータ転送（データ
の送信または受信）に際して、ネットワークインタフェ
ース３０５からストレージコントローラ３０４に対して
発行される主記憶アクセス要求のアクセス先アドレス
は、ワード単位（主記憶へアクセスできる一定単位であ
ればよい）で連続あるいは一定ワード間隔（ストライ
ド）となるが、いずれにせよ昇順となる。

【００１８】また、本発明では、演算プロセッサ３０１
として、演算プロセッサ３０１の外部（図３の場合、ス
トレージコントローラ３０４）からの要求に応じてハー
ドウェアでキャッシュメモリ３０２を制御する機構（キ
ャッシュコヒーレンス機構）を持つものを採用すること
を前提とする。

【００１９】さらに、本発明の実施の形態を詳述する前
に整理しておかなければならない点としてキャッシュメ
モリ３０２の実現方法がある。キャッシュメモリ３０２
には、ストアスルー方式とコピーバック方式という２種
類の実現方法が存在する。この種類分けは、演算プロセ
ッサ３０１におけるストア命令の実行結果の主記憶３０
６への反映のさせ方による。ストアスルー方式は、演算
プロセッサ３０１によってストア命令が実行される度に
そのストア結果をキャッシュメモリ３０２に反映させる
と同時に主記憶３０６にも反映させる方式である。一
方、コピーバック方式は、演算プロセッサ３０１によっ
てストア命令が実行されてもそのストア結果をキャッシ
ュメモリ３０２にのみ反映させ、主記憶３０６にはその
時点ではストア結果を反映させない方式である。コピー
バック方式でストア結果が主記憶３０６に反映されるの
は、キャッシュメモリ３０２から主記憶３０６への書き
戻し命令が実行された場合、あるいは、演算プロセッサ
３０１外部からの要求によってキャッシュメモリ３０２
から主記憶３０６への書き戻しが実行された場合のみで
ある。

【００２０】本発明の実施の形態は、このキャッシュメ
モリ３０２の実現方法によって若干異なったものとな
る。まず、ここではストアスルー方式のキャッシュメモ
リ３０２を採用した場合の実施の形態を説明する。コピ
ーバック方式のキャッシュメモリ３０２を採用した場合
の実施の形態については、後段で変形例として説明す
る。

【００２１】キャッシュメモリ３０２にストアスルー方
式を採用した場合、演算プロセッサ３０１がネットワー
クインタフェース３０５に対して、他要素プロセッサ２
０１へのデータ送信開始を要求した時点では、主記憶３
０６上のデータは、（ストア結果が常に主記憶３０６に
反映されているため）送信したい最新のデータとなって
いる。したがって、データ送信に際しては、主記憶３０
６とキャッシュメモリ３０２の内容一致制御（コヒーレ
ンス制御）は不要である。

【００２２】一方、データの受信については、演算プロ
セッサ３０１の動作とは無関係に発生するため、主記憶
３０６とキャッシュメモリ３０２の内容一致制御（コヒ
ーレンス制御）が必要になる。

【００２３】本実施の形態では、このようなストアスル
ー方式のキャッシュメモリ３０２を想定してストレージ
コントローラ３０４内に実現するコヒーレンス制御機構
を図４に基づき説明する。なお、以降の記述において、
Ｉ／Ｏインタフェース３０３がらみの動作は特に主題と
する内容とは関係が無いため省略する。また、図４につ
いてもＩ／Ｏインタフェース３０３がらみの処理要素に
ついては記述を省略した。

【００２４】図４はストレージコントローラ３０４の詳
細構成を示す。図４に於いて、演算プロセッサインタフ
ェース部１０１は、演算プロセッサ３０１からのストレ
ージコントローラ３０４に対する処理要求を受けつけ、
さらに、その処理結果としての読み出しデータを演算プ
ロセッサ３０１に伝達したり、あるいは、ネットワーク
インタフェース３０５からの演算プロセッサ３０１への
処理要求を受け、これを演算プロセッサ３０１に伝達す
る。ネットワークインタフェース３０５からの演算プロ
セッサ３０１への処理要求とは、例えばデータ送信処理
の終了を伝えるための割り込み処理要求などであり、こ
のような要求は、まず、ストレージコントローラ３０４
内のコマンド・データ受け取り部１１０が受け取り、内
容を解読した後に信号線L１０７を介して演算プロセッ
サインタフェース部１０１に伝えられ、そこから演算プ
ロセッサ３０１に伝達される。

【００２５】コマンド・データ受け取り部１１０および
コマンド・データ送出部１１３は、それぞれネットワー
クインタフェース３０５からの処理要求を受ける部分と
ネットワークインタフェース３０５からの処理要求に対
する処理結果（主記憶読み出しデータ）や演算プロセッ
サ３０１からの処理要求をネットワークインタフェース
３０５に伝える部分である。ここで、演算プロセッサ３
０１からの処理要求とは、例えばデータ送信開始要求な
どであり、このような要求は、まず演算プロセッサイン
タフェース部１０１が受け取り、その演算プロセッサイ
ンタフェース部１０１がその内容を解読した結果、信号
線L１０８を介してコマンド・データ送出部１１３に伝
える。

【００２６】主記憶インタフェース部１１４は、演算プ
ロセッサ３０１やネットワークインタフェース３０５か
らの主記憶３０６へのアクセス要求を受け、これを主記
憶３０６に伝達し、さらに、そのアクセス（主記憶読み
出し）結果を主記憶３０６から受け取り、これを各アク
セス元に伝達する。ここでもう少し詳しくこの主記憶ア
クセスに関わるパスについて記述する。まず、演算プロ
セッサ３０１からの主記憶アクセス要求は、はじめに演
算プロセッサインタフェース部１０１で受理され、L１
０２を介してアクセス権制御部１１１に伝わり、次にア
クセス権制御部１１１から主記憶インタフェース部１１
４に伝わる。そして、そのアクセス結果（主記憶読み出
しデータ）は、主記憶３０６からいったん主記憶インタ
フェース部１１４に伝えられ、さらに主記憶インタフェ
ース部１１４からL１０１を介して演算プロセッサイン
タフェース部１０１に伝えられたのち、演算プロセッサ
インタフェース部１０１から演算プロセッサ３０１に伝
えられる。一方、ネットワークインタフェース３０５か
らの主記憶アクセス要求は、まずコマンド・データ受け
取り部１１０で受理され、その内容解析の結果、主記憶
アクセス発行部１１２に伝えられ、そこからアクセス権
制御部１１１を介して主記憶インタフェース部１１４に
伝わる。そして、そのアクセス結果（主記憶読み出しデ
ータ）は、主記憶３０６からいったん主記憶インタフェ
ース部１１４に伝えられ、さらに主記憶インタフェース
部１１４からコマンド・データ送出部１１３に伝えら
れ、そこからネットワークインタフェース３０５に伝え
られる。

【００２７】ここで示したとおり、アクセス権制御部１
１１は、演算プロセッサ３０１からの主記憶アクセス要
求とネットワークインタフェース３０５からの主記憶ア
クセス要求が初めて合流するところであり、互いに独立
して任意に発生する演算プロセッサ３０１およびネット
ワークインタフェース３０５からの主記憶アクセス要求
を順序づけする。少なくとも主記憶３０６の同じアドレ
スへのアクセス順はアクセス権制御部で受理された順番
に従う。

【００２８】続いて、本発明の主題であるコヒーレンス
制御について述べる。基本的な動作は以下の流れとな
る。

【００２９】（１）ネットワークインタフェース３０５
でのデータ受信にともない、コマンド・データ受け取り
部１１０がネットワークインタフェース３０５から主記
憶３０６へのデータ書き込み要求を受ける。

【００３０】（２）コマンド・データ受け取り部１１０
は、主記憶アクセス発行部１１２に対して主記憶書き込
み要求を発行する。

【００３１】（３）コマンド・データ受け取り部１１０
は、（２）と同時に主記憶書き込み先と同じアドレスを
対象としてストレージコントローラ３０４内キャッシュ
一致制御処理部に対してキャッシュ一致制御要求を発行
する。なお、ストレージコントローラ３０４内キャッシ
ュ一致制御処理部という名称は図４中に明示しないが、
当該処理部は図４中の読み出しアドレスレジスタ１０
２、キャッシュ一致制御要求発行部１０３、キャッシュ
一致制御要求発行待ち判定部１０４、アドレス一致監視
部１０５、キャッシュ一致制御要求レジスタ１０６、キ
ャッシュ一致制御要求発行判定部１０７および受信側ア
ドレスレジスタ１０９からなる機能部分であり、コマン
ド・データ受け取り部１１０と演算プロセッサインタフ
ェース部１０１の中間的な位置で機能する。

【００３２】（４）ストレージコントローラ３０４内キ
ャッシュ一致制御処理部は、必要に応じて、また、後述
するタイミングにおいてキャッシュ一致制御要求を演算
プロセッサインタフェース部１０１に伝える。

【００３３】（５）演算プロセッサインタフェース部１
０１は、演算プロセッサ３０１に対してキャッシュ一致
制御要求を発行する。演算プロセッサ３０１は、この要
求に応じてキャッシュ一致制御を行う（本実施の形態で
は、ストアスルー方式のキャッシュメモリを仮定してい
るため、キャッシュメモリ３０２に対する書き込みデー
タは常に主記憶３０６に対して反映されており、したが
って、この場面でのキャッシュ一致制御とはキャッシュ
エントリの無効化のみを行うキャッシュパージ処理であ
る）。

【００３４】次に、ストレージコントローラ３０４内キ
ャッシュ一致制御処理部の構成と動作を説明する。

【００３５】読み出しアドレスレジスタ１０２は、スト
レージコントローラ３０４で処理中のキャッシュライン
読み出しの対象アドレスを保持するレジスタである。キ
ャッシュライン読み出しとは、演算プロセッサ３０１の
キャッシュメモリ３０２の管理単位であるキャッシュラ
インと呼ぶ連続アドレス領域を主記憶から読み出す処理
であり、演算プロセッサ３０１内におけるメモリ読み出
し命令の読み出し対象がキャッシュメモリ３０２内に存
在しなかった場合に演算プロセッサ３０１からストレー
ジコントローラ３０４に対して発行される。この読み出
しアドレスレジスタ１０２は、キャッシュライン読み出
しアドレスを保持するフィールドの他に有効ビットフィ
ールドを持っており、この有効ビットフィールドによっ
て保持しているアドレスに対するキャッシュライン読み
出し処理がストレージコントローラ３０４内で処理中か
否かを示す。

【００３６】演算プロセッサインタフェース部１０１
は、演算プロセッサ３０１からキャッシュライン読み出
し要求を受けると、そのキャッシュライン全てを読み出
すために必要な数の主記憶読み出し要求を生成し、それ
をアクセス権制御部１１１に順次伝えていく。この時の
１つ目の主記憶読み出し要求がアクセス権制御部に受理
された時点でストレージコントローラ３０４内で当該キ
ャッシュラインに対する読み出し処理が始まったことに
なる。この時点で演算プロセッサインタフェース部１０
１はキャッシュラインの読み出しアドレスをL１０４に
のせて読み出しアドレスレジスタ１０２にセットすると
同時に、L１０３を介して「有効」を示す情報（例え
ば”１”）を読み出しアドレスレジスタ１０２の有効ビ
ットフィールドにセットする。一方、キャッシュライン
読み出しにともなって演算プロセッサインタフェース部
１０１で生成された複数の主記憶読み出し結果が全て演
算プロセッサインタフェース部１０１を介して演算プロ
セッサ３０１に伝わると当該キャッシュラインに対する
読み出しが終了したことになる。この時点で演算プロセ
ッサインタフェース部１０１はL１０３を介して「無
効」を示す情報（「有効」を示す値の逆値、先の例にな
らえば”０”）を読み出しアドレスレジスタ１０２の有
効ビットフィールドにセットする。このように、読み出
しアドレスレジスタ１０２は、その有効ビットフィール
ドが「有効」であることでストレージコントローラ３０
４でキャッシュライン読み出しが処理中であることを示
し、かつその対象アドレスがキャッシュライン読み出し
アドレスを保持するフィールドに示された値であること
を示している。

【００３７】受信側アドレスレジスタ１０９は、前回の
キャッシュ一致制御要求の対象アドレスを保持するフィ
ールドと有効ビットフィールドを持つ。コマンド・デー
タ受け取り部１１０は、ネットワークインタフェース３
０５から主記憶への書き込み要求を受け取ると、主記憶
アクセス発行部１１２に対して主記憶書き込み要求を発
行すると同時にL１１７を介してキャッシュ一致制御要
求発行判定部１０７に対してキャッシュ一致制御要求を
発行する。キャッシュ一致制御要求発行判定部１０７
は、その要求の対象アドレスとL１１４を介して伝わる
受信側アドレスレジスタ１０９の内容を比較する。受信
側アドレスレジスタ１０９の有効ビットフィールドが
「有効」であり、かつ、L１１７を介して伝わる要求の
対象アドレスと受信側アドレスレジスタ１０９の前回の
キャッシュ一致制御要求の対象アドレスを保持するフィ
ールドの内容が一致すれば、後述するように、対象とす
るキャッシュラインは、演算プロセッサ３０１のキャッ
シュメモリ３０２上には存在しないことが保証されるた
め、この時のキャッシュ一致制御要求をキャンセルし、
その旨をL１２０を介してコマンド・データ受け取り部
１１０に伝える。その信号を受け取ったコマンド・デー
タ受け取り部１１０は、その回の主記憶書き込みにとも
なうキャッシュ一致制御が完了したと解釈し、新たな主
記憶書き込み要求を処理し始める。一方、キャッシュ一
致制御要求発行判定部１０７における判定の結果、受信
側アドレスレジスタ１０９の有効ビットフィールドが
「無効」であるか、または、L１１７を介して伝わる要
求の対象アドレスと受信側アドレスレジスタ１０９の前
回のキャッシュ一致制御要求の対象アドレスを保持する
フィールドの内容が不一致であれば、キャッシュ一致制
御要求発行判定部１０７は、キャッシュ一致制御要求を
受理してこれをキャッシュ一致制御要求レジスタ１０６
に登録し、該レジスタ１０６の有効ビットを「有効」に
セットし、その旨をL１２０を介してコマンド・データ
受け取り部１１０に伝える。この信号を受け取ったコマ
ンド・データ受け取り部１１０は、その時のキャッシュ
一致制御要求の対象アドレスを受信側アドレスレジスタ
１０９にセットすると同時に、受信側アドレスレジスタ
１０９の有効ビットフィールドに「有効」を示す内容を
セットし、また、その回の主記憶書き込みにともなうキ
ャッシュ一致制御が完了したと解釈して新たな主記憶書
き込み要求を処理し始める。なお、上述のアドレス比較
は、対象アドレスが属するキャッシュラインの先頭アド
レスの比較という形でなされる。

【００３８】受信側アドレスレジスタ１０９の有効ビッ
トフィールドは、初期値は「無効」である。受信側アド
レスレジスタ１０９の有効ビットフィールドが「有効」
にセットされるのは、上述のとおり、キャッシュ一致制
御要求発行判定部１０７がキャッシュ一致制御要求を受
理し、これに応じてコマンド・データ受け取り部１１０
がセットする場合のみである。一方、受信側アドレスレ
ジスタ１０９の有効ビットフィールドが「有効」から
「無効」にリセットされるのは、アドレス一致監視部１
０５が、L１１４を介して伝わる受信側アドレスレジス
タ１０９の前回のキャッシュ一致制御要求の対象アドレ
スを保持するフィールドの内容とL１１０を介して伝わ
る読みだしアドレスレジスタ１０２のキャッシュライン
読み出しアドレスを保持するフィールドの内容が一致
し、かつ、受信側アドレスレジスタ１０９および読み出
しアドレスレジスタ１０２各々の有効ビットフィールド
がともに「有効」であるという状態を検出したときであ
り、そのリセットはアドレス一致監視部１０５によって
L１１２を介して行われる。

【００３９】この受信側アドレスレジスタ１０９の有効
ビットフィールドに関する制御は、ストレージコントロ
ーラ３０４内キャッシュ一致制御処理部における処理の
正当性を保証し、かつ、そのキャッシュ一致制御自体の
効率を高め、演算プロセッサ３０１におけるプログラム
処理や相互結合網２０２におけるデータ転送にとっての
無駄なオーバヘッドおよび処理ネックの発生を防止す
る。まず、受信側アドレスレジスタ１０９の有効ビット
フィールドが「有効」であることによって、その時の受
信側アドレスレジスタ１０９の前回のキャッシュ一致制
御要求の対象アドレスを保持するフィールドの内容が示
すアドレスのキャッシュラインが演算プロセッサ３０１
のキャッシュメモリ３０２には存在しないことが保証で
きる。受信側アドレスレジスタ１０９の有効ビットフィ
ールドが「有効」であれば、その時の受信側アドレスレ
ジスタ１０９の前回のキャッシュ一致制御要求の対象ア
ドレスを保持するフィールドの内容が示すアドレスに対
して少なくとも１回はキャッシュ一致制御が行われてお
り、その１回のキャッシュ一致制御によって、演算プロ
セッサ３０１のキャッシュメモリ３０２からは当該アド
レスのキャッシュラインは無くなっている。さらに、こ
の受信側アドレスレジスタ１０９の有効ビットフィール
ドが「有効」であり続けることで、先に失われたキャッ
シュラインの読み出しが始まっていないことも保証され
る。仮に、このキャッシュラインの読み出しが始まって
いれば、その対象アドレスが読み出しアドレスレジスタ
１０２にセットされ、さらに読み出しアドレスレジスタ
１０２の有効ビットフィールドに「有効」がセットされ
ているはずである。そして、この状態は、アドレス一致
監視部１０５が受信側アドレスレジスタ１０９の有効ビ
ットフィールドの値を「無効」にリセットする条件が成
立している状態である。したがって、受信側アドレスレ
ジスタ１０９の有効ビットフィールドが「有効」であり
続けることは、その時の受信側アドレスレジスタ１０９
の前回のキャッシュ一致制御要求の対象アドレスを保持
するフィールドの内容が示すアドレスのキャッシュライ
ンが演算プロセッサ３０１のキャッシュメモリ３０２に
は存在せず、かつ、その後新たに読み出されてもいない
ことを保証している。この保証によって、先述したとお
り、受信側アドレスレジスタ１０９の有効ビットフィー
ルドが「有効」であり、かつ、L１１７を介して伝わる
キャッシュ一致制御要求の対象アドレスとL１１４を介
して伝わる受信側アドレスレジスタ１０９の前回のキャ
ッシュ一致制御要求の対象アドレスを保持するフィール
ドの内容が一致する場面でのキャッシュ一致制御要求発
行判定部１０７におけるキャッシュ一致制御要求のキャ
ンセルという制御が可能となる。なお、この制御は、メ
ッセージパッシング型の並列計算機のデータ転送にとっ
て都合がよく、処理の効率を高めるものである。メッセ
ージパッシング型の並列計算機におけるデータ転送は、
大量のデータを（読み出し／書き込み先）アドレス昇順
で転送する。また、そのアドレスも連続したアドレスで
あるケースがほとんどである。そうすると、データ受信
時には、同じキャッシュライン領域を対象とした主記憶
書き込みが連続的に発生する。このような点を考える
と、キャッシュ一致制御は、その１つのキャッシュライ
ン領域への複数の書き込みの総てに対して発行する必要
はなく、基本的には（途中で当該キャッシュラインに対
する演算プロセッサ３０１からの読み出しが発生しない
限り）、最初の１個目の書き込みに対してのみ発行する
だけで十分である。そして、本発明の構成は、そのよう
な処理を実現しているため、データ転送の効率を高める
ことができる。

【００４０】逆に、受信側アドレスレジスタ１０９の有
効ビットフィールドが「有効」であり、その受信側アド
レスレジスタ１０９の前回のキャッシュ一致制御要求の
対象アドレスを保持するフィールドの内容が示すアドレ
スのキャッシュラインに対する読み出しが始まった場
合、当該キャッシュラインはしかる後に演算プロセッサ
３０１のキャッシュメモリ３０２に存在することになる
ため、キャッシュライン読み出しが開始された以降に発
生した（順番は先述のとおりアクセス権制御部１１１で
のアクセスの受理／不受理で制御される）当該キャッシ
ュライン領域のアドレスに対するキャッシュ一致制御要
求は、当該キャッシュラインが演算プロセッサ３０１の
キャッシュメモリ３０２に登録された後に演算プロセッ
サ３０１に対して伝えられなければならない。上述のア
ドレス一致監視部１０５が受信側アドレスレジスタ１０
９の有効ビットを「無効」にリセットする処理は、この
ようなタイミングで発生したキャッシュ一致制御要求が
キャンセルされることなく発行されるようにするための
制御である。また、本ケースにおいて当該キャッシュラ
インが演算プロセッサ３０１のキャッシュメモリ３０２
に登録された後に当該キャッシュライン領域のアドレス
に対するキャッシュ一致制御要求を演算プロセッサ３０
１に伝達するという順番制御は、キャッシュ一致制御要
求発行待ち判定部１０４によって行われる。

【００４１】キャッシュ一致制御要求発行待ち判定部１
０４は、上記述べた順番制御も含めて、演算プロセッサ
３０１の動作を把握しつつ、一方で、Ｌ１１１によって
伝えられるキャッシュ一致制御要求レジスタ１０６内の
キャッシュ一致制御要求の存在を知ると共に、演算プロ
セッサ３０１へキャッシュ一致制御要求を発行するタイ
ミングを制御する。

【００４２】演算プロセッサインタフェース部１０１
は、演算プロセッサ３０１からキャッシュ一致制御要求
発行抑止信号が発行されている場合や、他のトランザク
ション発行やデータ転送を演算プロセッサ３０１に対し
て実施している場合には、L１０５に抑止信号をのせ、
その状態をキャッシュ一致制御要求発行待ち判定部１０
４に伝える。この抑止信号を受けたキャッシュ一致制御
要求発行待ち判定部１０４は、キャッシュ一致制御要求
を発行させないようにキャッシュ一致制御要求発行部１
０３を制御線L１０９によって制御するとともに、L１１
６を介してコマンド・データ受け取り部１１０に対し
て、キャッシュ一致制御要求の生成を抑止する。この抑
止を受けたコマンド・データ受け取り部１１０は、キャ
ッシュ一致制御要求発行判定部１０７によってキャッシ
ュ一致要求発行が認められてもその発行を見合わせる。
ただし、コマンド・データ受け取り部１１０は、キャッ
シュ一致制御要求発行判定部１０７によってキャッシュ
一致制御要求がキャンセルされたケースにはキャッシュ
一致制御要求発行待ち判定部１０４からの抑止の制限を
受けずに動作する。

【００４３】また、キャッシュ一致制御要求発行待ち判
定部１０４は、L１１０で伝達される読み出しアドレス
レジスタ１０２の有効ビットフィールドの内容が「有
効」であり、かつ、同レジスタ１０２のキャッシュライ
ン読み出しアドレスを保持するフィールドの内容とL１
１１を介して伝達されるキャッシュ一致制御要求レジス
タ１０６の内容を比較し、そのアドレス情報が一致した
場合には、読み出しアドレスレジスタ１０２の有効ビッ
トフィールドの内容が先述したように演算プロセッサイ
ンタフェースによって「無効」にリセットされるまで、
キャッシュ一致制御要求の発行を抑止する。この抑止時
の制御も上述のL１０５による抑止に従う制御と同じで
ある。

【００４４】キャッシュ一致制御要求発行待ち判定部１
０４において上記抑止状態が成立していない場合には、
キャッシュ一致制御要求は発行可能である。この状態
で、キャッシュ一致制御要求レジスタ１０６にキャッシ
ュ一致制御要求が存在すれば、キャッシュ一致制御要求
発行部１０３がL１１１を介してその要求を読みとり、
これをL１０６を介して演算プロセッサインタフェース
部１０１に伝える。この要求を受けた演算プロセッサイ
ンタフェース部１０１は、さらにその要求をトランザク
ションとして演算プロセッサ３０１に伝え、演算プロセ
ッサ３０１が実際にキャッシュ一致制御を実施する。

【００４５】以上が、本発明に関わる実施の形態１であ
る。

【００４６】（実施の形態１の変形例１）本発明の実施
の形態１では、演算プロセッサ３０１のキャッシュメモ
リ３０２にストアスルー方式を採用した場合の実施の形
態を述べた。本変形例１では、同キャッシュメモリ３０
２に実施の形態１で説明したコピーバック方式を採用し
た場合の実施の形態について図１に基づいて説明を行
う。

【００４７】キャッシュメモリ３０２にコピーバック方
式を採用した場合、演算プロセッサ３０１がネットワー
クインタフェース３０５に対して、他要素プロセッサ２
０１へのデータ送信開始を要求した時点では、送信対象
のデータに関して、主記憶３０６上とキャッシュメモリ
３０２上で内容が異なる可能性がある。この場合、最新
の内容は、キャッシュメモリ３０２上に存在しているた
め、送信対象データに関してキャッシュメモリ３０２か
らの主記憶３０６への書き戻しが必要となる。この点が
先の実施の形態１との大きな相違点である。この制御を
実現するために、図１のストレージコントローラ３０４
内キャッシュ一致制御処理部（名称については図４と同
様に図１中にも明示していない。構成要素については後
述する）には図４の構成要素に加えて送信側アドレスレ
ジスタ１０８が存在している。この制御機構に関しては
後段で詳述する。

【００４８】一方、データの受信についても、同様に、
主記憶３０６とキャッシュメモリ３０２の内容一致制御
制御が必要であり、また、その内容一致制御の方法も、
キャッシュメモリ３０２上のデータの主記憶３０６への
書き戻しという処理が新たに必要になるため、実施の形
態１と若干制御機構が異なる。

【００４９】なお、本変形例においても、実施の形態１
と同様に、Ｉ／Ｏインタフェース３０３がらみの動作は
特に主題とする内容とは関係が無いため省略する。図１
についてもＩ／Ｏインタフェース３０３がらみの処理要
素については記述を省略した。

【００５０】図１において、ストレージコントローラ３
０４内の演算プロセッサインタフェース部１０１、アク
セス権制御部１１１、主記憶インタフェース部１１４、
コマンド・データ受け取り部１１０、主記憶アクセス発
行部１１２、コマンド・データ送出部１１３、およびス
トレージコントローラ３０４内キャッシュ一致制御処理
部を構成する読み出しアドレスレジスタ１０２、キャッ
シュ一致制御要求発行部１０３、キャッシュ一致制御要
求発行待ち判定部１０４、アドレス一致監視部１０５、
キャッシュ一致制御要求レジスタ１０６、キャッシュ一
致制御要求発行判定部１０７、受信側アドレスレジスタ
１０９に関しては、その機能や役割および構成が実施の
形態１に示した図４のものとほぼ同じである。ただし、
キャッシュ一致制御におけるキャッシュメモリ３０２上
のデータの主記憶３０６への書き戻し（コピーバック）
処理に関して、ストレージコントローラ３０４内キャッ
シュ一致制御処理部に新たにコピーバック完了監視部１
１５が用意され、さらに演算プロセッサインタフェース
１０１およびコマンド・データ受け取り部１１０にコピ
ーバック処理に対応した制御動作が加わる。また、デー
タ受信時だけでなく、データ送信時にもキャッシュ一致
制御が必要になるため、これに対しても、ストレージコ
ントローラ３０４内キャッシュ一致制御処理部に新たに
送信側アドレスレジスタ１０８が用意され、アドレス一
致監視部１０５およびキャッシュ一致制御要求発行判定
部１０７、コマンド・データ受け取り部１１０にデータ
送信時に対応した制御動作が加わる。

【００５１】以降、ストレージコントローラ３０４内の
制御動作および機構に関しては、ほとんどの部分が実施
の形態１と同じであるため、本変形例では、制御動作お
よび機構の異なる点についてのみ説明する。

【００５２】まず、データ送信時に関わるキャッシュ一
致制御について述べる。基本的な動作は以下の流れとな
る。

【００５３】（１）ネットワークインタフェース３０５
でのデータ送信にともない、コマンド・データ受け取り
部１１０がネットワークインタフェース３０５から主記
憶３０６へのデータ読み出し要求を受ける。

【００５４】（２）コマンド・データ受け取り部１１０
は、受け取った主記憶読み出し要求の読み出し先と同じ
アドレスを対象としてストレージコントローラ３０４内
キャッシュ一致制御処理部に対してキャッシュ一致制御
要求を発行する。

【００５５】（３）ストレージコントローラ３０４内キ
ャッシュ一致制御処理部は、キャッシュ一致制御が必要
でないと判定した場合にはその旨をコマンド・データ受
け取り部１１０に伝え、キャッシュ一致制御が必要であ
ると判定した場合には、後述するタイミングにおいてキ
ャッシュ一致制御要求を演算プロセッサインタフェース
部１０１に伝える。そして、演算プロセッサインタフェ
ース部１０１は、演算プロセッサ３０１に対してキャッ
シュ一致制御要求を発行する。演算プロセッサ３０１
は、この要求に応じてキャッシュ一致制御を行う。この
際に、演算プロセッサ３０１は、必要に応じてコピーバ
ック処理を実行する（キャッシュラインデータの主記憶
３０６への書き込み要求を順次発行する）。演算プロセ
ッサインタフェース部１０１は、そのコピーバック処理
の終了を検出（詳細は後述する）した後にキャッシュ一
致制御処理が終了したということをストレージコントロ
ーラ３０４内キャッシュ一致制御処理部に伝える。そし
て、その情報がコマンド・データ受け取り部１１０に伝
えられる。

【００５６】（４）コマンド・データ受け取り部１１０
は、ストレージコントローラ３０４内キャッシュ一致制
御処理部からキャッシュ一致制御が不要である旨を伝え
られるか、あるいは、キャッシュ一致制御処理が終了し
たことを伝えられると先の主記憶読み出し要求を主記憶
アクセス発行部１１２に伝え、次の処理要求を待つ。

【００５７】次に、このデータ送信時に関わるキャッシ
ュ一致制御要求発行に関するストレージコントローラ３
０４内キャッシュ一致制御処理部の制御動作を説明す
る。基本的な動作は、実施の形態１でのストレージコン
トローラ３０４内キャッシュ一致制御処理部の制御動作
とほとんど同じであり、受信側アドレスレジスタ１０９
の代わりに送信側アドレスレジスタ１０８が制御に使用
される点が異なる。送信側アドレスレジスタ１０８の構
成は、受信側アドレスレジスタ１０９と同じであり、前
回の（データ送信時のデータ読み出しにともなう）キャ
ッシュ一致制御要求の対象アドレスを保持するフィール
ドと有効ビットフィールドを持つ。コマンド・データ受
け取り部１１０は、ネットワークインタフェース３０５
から主記憶への読み出し要求を受け取ると、L１１７を
介してキャッシュ一致制御要求発行判定部１０７に対し
てキャッシュ一致制御要求を発行する。キャッシュ一致
制御要求発行判定部１０７は、その要求の対象アドレス
とL１１５を介して伝わる送信側アドレスレジスタ１０
８の内容を比較する。送信側アドレスレジスタ１０８の
有効ビットフィールドが「有効」であり、かつ、L１１
７を介して伝わる要求の対象アドレスと送信側アドレス
レジスタ１０８の前回のキャッシュ一致制御要求の対象
アドレスを保持するフィールドの内容が一致すれば、実
施の形態１で説明したとおり、対象とするキャッシュラ
インは、演算プロセッサ３０１のキャッシュメモリ３０
２上には存在しないことが保証されるため、この時のキ
ャッシュ一致制御要求をキャンセルし、その旨をL１２
０を介してコマンド・データ受け取り部１１０に伝え
る。その信号を受け取ったコマンド・データ受け取り部
１１０は、その回の主記憶読み出しにともなうキャッシ
ュ一致制御が完了したと解釈し、この時の主記憶読み出
し要求を主記憶アクセス発行部１１２に対して伝え、次
の処理要求を待つ。一方、キャッシュ一致制御要求発行
判定部１０７における判定の結果、送信側アドレスレジ
スタ１０８の有効ビットフィールドが「無効」である
か、または、L１１７を介して伝わる要求の対象アドレ
スと送信側アドレスレジスタ１０８の前回のキャッシュ
一致制御要求の対象アドレスを保持するフィールドの内
容が不一致であれば、キャッシュ一致制御要求発行判定
部１０７は、キャッシュ一致制御要求を受理してこれを
キャッシュ一致制御要求レジスタ１０６に登録し、該レ
ジスタ１０６の有効ビットを「有効」にセットし、その
旨をL１２０を介してコマンド・データ受け取り部１１
０に伝える。この信号を受け取ったコマンド・データ受
け取り部１１０は、その時のキャッシュ一致制御要求の
対象アドレスを送信側アドレスレジスタ１０８にセット
すると同時に、送信側アドレスレジスタ１０８の有効ビ
ットフィールドに「有効」を示す内容をセットし、キャ
ッシュ一致制御処理の終了がL１２２を介して伝達され
る（このL１２２に関する動作については後述する）の
を待つ。L１２２を介してキャッシュ一致制御処理の終
了が伝達されると、コマンド・データ受け取り部は、そ
の時の主記憶読み出し要求を主記憶アクセス発行部１１
２に伝え、次の処理要求を待つ。なお、上述のアドレス
比較は、対象アドレスが属するキャッシュラインの先頭
アドレスの比較という形でなされる。

【００５８】送信側アドレスレジスタ１０８の有効ビッ
トフィールドに関する制御も、受信側アドレスレジスタ
１０９のそれと同じである。まず、初期値は「無効」で
ある。送信側アドレスレジスタ１０８の有効ビットフィ
ールドが「有効」にセットされるのは、上述のとおり、
キャッシュ一致制御要求発行判定部１０７がキャッシュ
一致制御要求を受理し、これに応じてコマンド・データ
受け取り部１１０がセットする場合のみである。一方、
送信側アドレスレジスタ１０８の有効ビットフィールド
が「有効」から「無効」にリセットされるのは、アドレ
ス一致監視部１０５が、L１１５を介して伝わる送信側
アドレスレジスタ１０８の前回のキャッシュ一致制御要
求の対象アドレスを保持するフィールドの内容とL１１
０を介して伝わる読みだしアドレスレジスタ１０２のキ
ャッシュライン読み出しアドレスを保持するフィールド
の内容が一致し、かつ、送信側アドレスレジスタ１０８
および読みだしアドレスレジスタ１０２各々の有効ビッ
トフィールドがともに「有効」であるという状態を検出
したときであり、そのリセットはアドレス一致監視部１
０５によってL１１３を介して行われる。

【００５９】次に、データ受信時に関わるキャッシュ一
致制御について述べる。基本的な動作は以下の流れとな
る。

【００６０】（１）ネットワークインタフェース３０５
でのデータ受信にともない、コマンド・データ受け取り
部１１０がネットワークインタフェース３０５から主記
憶３０６へのデータ書き込み要求を受ける。

【００６１】（２）コマンド・データ受け取り部１１０
は、受け取った主記憶書き込み要求の書き込み先と同じ
アドレスを対象としてストレージコントローラ３０４内
キャッシュ一致制御処理部に対してキャッシュ一致制御
要求を発行する。

【００６２】（３）ストレージコントローラ３０４内キ
ャッシュ一致制御処理部は、キャッシュ一致制御が必要
でないと判定した場合にはその旨をコマンド・データ受
け取り部１１０に伝え、キャッシュ一致制御が必要であ
ると判定した場合には、後述するタイミングにおいてキ
ャッシュ一致制御要求を演算プロセッサインタフェース
部１０１に伝える。そして、演算プロセッサインタフェ
ース部１０１は、演算プロセッサ３０１に対してキャッ
シュ一致制御要求を発行する。演算プロセッサ３０１
は、この要求に応じてキャッシュ一致制御を行う。この
際に、演算プロセッサ３０１は、必要に応じてコピーバ
ック処理を実行する（キャッシュラインデータの主記憶
３０６への書き込み要求を順次発行する）。演算プロセ
ッサインタフェース部１０１は、そのコピーバック処理
の終了を検出（詳細は後述する）した後にキャッシュ一
致制御処理が終了したということをストレージコントロ
ーラ３０４内キャッシュ一致制御処理部に伝える。そし
て、その情報がコマンド・データ受け取り部１１０に伝
えられる。

【００６３】（４）コマンド・データ受け取り部１１０
は、ストレージコントローラ３０４内キャッシュ一致制
御処理部からキャッシュ一致制御が不要である旨を伝え
られるか、あるいは、キャッシュ一致制御処理が終了し
たことを伝えられると先の主記憶書き込み要求を主記憶
アクセス発行部１１２に伝え、次の処理要求を待つ。

【００６４】このデータ受信時に関わるキャッシュ一致
制御要求発行に関するストレージコントローラ３０４内
キャッシュ一致制御処理部の制御動作は、実施の形態１
でのストレージコントローラ３０４内キャッシュ一致制
御処理部の制御動作とほとんど同じである。異なるの
は、コマンド・データ受け取り部１１０が、ネットワー
クインタフェース３０５から主記憶への書き込み要求を
受け取った際に、すぐにはその書き込み要求を主記憶ア
クセス発行部１１２には伝えずに、キャッシュ一致制御
要求発行判定部１０７によるキャッシュ一致制御不要判
定または、キャッシュ一致制御処理の完了を待ち合わせ
る点である。データ受信時、コマンド・データ受け取り
部１１０は、ネットワークインタフェース３０５から主
記憶への書き込み要求を受け取ると、L１１７を介して
キャッシュ一致制御要求発行判定部１０７に対してキャ
ッシュ一致制御要求を発行する。キャッシュ一致制御要
求発行判定部１０７は、その要求の対象アドレスとL１
１４を介して伝わる受信側アドレスレジスタ１０９の内
容を比較する。受信側アドレスレジスタ１０９の有効ビ
ットフィールドが「有効」であり、かつ、L１１７を介
して伝わる要求の対象アドレスと受信側アドレスレジス
タ１０９の前回のキャッシュ一致制御要求の対象アドレ
スを保持するフィールドの内容が一致すれば、実施の形
態１で説明したとおり、対象とするキャッシュライン
は、演算プロセッサ３０１のキャッシュメモリ３０２上
には存在しないことが保証されるため、この時のキャッ
シュ一致制御要求をキャンセルし、その旨をL１２０を
介してコマンド・データ受け取り部１１０に伝える。そ
の信号を受け取ったコマンド・データ受け取り部１１０
は、その回の主記憶書き込みにともなうキャッシュ一致
制御が完了したと解釈し、主記憶アクセス発行部１１２
に対してその時の主記憶書き込み要求を発行し、新たな
処理要求を待つ。

【００６５】一方、キャッシュ一致制御要求発行判定部
１０７における判定の結果、受信側アドレスレジスタ１
０９の有効ビットフィールドが「無効」であるか、また
は、L１１７を介して伝わる要求の対象アドレスと受信
側アドレスレジスタ１０９の前回のキャッシュ一致制御
要求の対象アドレスを保持するフィールドの内容が不一
致であれば、キャッシュ一致制御要求発行判定部１０７
は、キャッシュ一致制御要求を受理してこれをキャッシ
ュ一致制御要求レジスタ１０６に登録し、該レジスタ１
０６の有効ビットを「有効」にセットし、その旨をL１
２０を介してコマンド・データ受け取り部１１０に伝え
る。この信号を受け取ったコマンド・データ受け取り部
１１０は、その時のキャッシュ一致制御要求の対象アド
レスを受信側アドレスレジスタ１０９にセットすると同
時に、受信側アドレスレジスタ１０９の有効ビットフィ
ールドに「有効」を示す内容をセットし、キャッシュ一
致制御処理の終了がL１２２を介して伝達される（このL
１２２に関する動作については後述する）のを待つ。L
１２２を介してキャッシュ一致制御処理の終了が伝達さ
れると、コマンド・データ受け取り部は、その時の主記
憶書き込み要求を主記憶アクセス発行部１１２に伝え、
次の処理要求を待つ。なお、上述のアドレス比較は、対
象アドレスが属するキャッシュラインの先頭アドレスの
比較という形でなされる。

【００６６】受信側アドレスレジスタ１０９の有効ビッ
トフィールドに関する制御は、実施の形態１と全く同じ
である。

【００６７】キャッシュ一致制御要求発行待ち判定部１
０４による制御は、データ送信に関わるキャッシュ一致
制御要求およびデータ受信に関わるキャッシュ一致制御
要求のいずれに対しても実施の形態１と同じである。

【００６８】次に、コマンド・データ受け取り部１１０
におけるキャッシュ一致制御処理の終了待ち合わせに関
する制御について述べる。データ送信にともなう送信デ
ータの主記憶３０６からの読み出し時であってもデータ
受信にともなう受信データの主記憶３０６への書き込み
時であっても、キャッシュ一致制御要求がキャッシュ一
致制御要求発行判定部１０７で受理された場合には、コ
マンド・データ受け取り部１１０は、キャッシュ一致制
御処理の終了がL１２２を介して伝達されるのを待つ。L
１２２に対してキャッシュ一致制御処理の終了情報をの
せるのは、コピーバック完了監視部１１５の役割であ
る。コピーバック完了監視部１１５は、演算プロセッサ
インタフェース部１０１が、自身が発行したキャッシュ
一致制御要求トランザクションに対して、演算プロセッ
サ３０１からコピーバックなしで完了する旨を伝えられ
た場合、あるいは、演算プロセッサインタフェース部１
０１が、自身が発行したキャッシュ一致制御要求トラン
ザクションに対して、演算プロセッサ３０１からコピー
バックトランザクションとしてキャッシュライン分の主
記憶書き込み要求を受け取り、これが総てアクセス権制
御部１１１に受理された場合に、演算プロセッサインタ
フェース部１０１からキャッシュ一致制御処理の完了信
号をL１２１を介して受け取る。そして、コピーバック
完了監視部１１５は、その完了信号をL１２２を介して
コマンド・データ受け取り部１１０に伝える。

【００６９】この制御によって、主記憶３０６に最新の
データが存在する状態での主記憶３０６へのアクセスが
保証される。

【００７０】以上が、本発明に関わる実施の形態１に対
する変形例１である。

【００７１】（実施の形態１の変形例２）本発明の実施
の形態１およびその変形例１は、データの送信あるいは
受信にともなうネットワークインタフェース３０５から
主記憶３０６へのアクセス総てを対象としてキャッシュ
一致制御を行うという記述になっている。

【００７２】プログラムの性質あるいはアルゴリズムに
よっては、このようなハードウェアによるキャッシュ一
致制御が不要であるか、あるいはソフトウェアによるキ
ャッシュ一致制御を実施した方が処理効率が良い場合も
存在する。そのような場合においても一律ハードウェア
による上記キャッシュ一致制御を行うと、そのオーバヘ
ッドがプログラムの処理性能を低下させてしまう原因と
なる可能性がある。この点を考慮して本変形例２では、
ネットワークインタフェース３０５から主記憶３０６へ
のアクセスを要求するネットワークインタフェース３０
５からストレージコントローラ３０４のコマンド・デー
タ受け取り部１１０に対するトランザクションとして、
「キャッシュ一致制御を必要とする」主記憶読み出し／
書き込み要求を行うトランザクションと「キャッシュ一
致制御を必要としない」主記憶読み出し／書き込み要求
を行うトランザクションの大きく分けて２種類を定義す
る。

【００７３】キャッシュ一致制御を必要とする主記憶読
み出し／書き込み要求を行うトランザクションを受けた
コマンド・データ受け取り部１１０は、実施の形態１お
よびその変形例１で述べたとおりストレージコントロー
ラ３０４内キャッシュ一致制御処理部に対してキャッシ
ュ一致制御要求を発行しながらその制御にしたがって主
記憶アクセス要求を主記憶アクセス発行部１１２に対し
て発行していく。一方、キャッシュ一致制御を必要とし
ない主記憶読み出し／書き込み要求を行うトランザクシ
ョンを受けたコマンド・データ受け取り部１１０は、ス
トレージコントローラ３０４内キャッシュ一致制御処理
部に対する制御要求は一切発行せずに受け取った主記憶
アクセス要求をキャッシュ一致制御とは無関係に次々と
主記憶アクセス発行部１１２に発行していく。

【００７４】ネットワークインタフェース３０５が、そ
の主記憶アクセス要求をストレージコントローラ３０４
に伝える際に、キャッシュ一致制御を必要とするタイプ
とキャッシュ一致制御を必要としないタイプのどちらの
トランザクションを選択するかという制御に関しては、
以下に示すような様々な実現方法がある。

【００７５】（１）データ転送時に転送データに付加す
るパケットヘッダ内の一制御情報として、そのデータの
受信時にキャッシュ一致制御を必要とするか否かを示す
情報を埋め込む。ネットワークインタフェース３０５
は、受信したパケットのパケットヘッダ内の当該情報ビ
ットによって、キャッシュ一致制御を必要とするタイプ
とキャッシュ一致制御を必要としないタイプのいずれか
のトランザクションの発行を決定する。

【００７６】（２）データ転送に関わる転送データが格
納されている（データ送信時）あるいは転送データを格
納する（データ受信時）主記憶３０６上のバッファ領域
に関する制御情報によって、キャッシュ一致制御の必要
／不要を示す。ネットワークインタフェース３０５は、
データの送信あるいは受信に先だって、当該バッファ領
域に関する制御情報を読み取り、キャッシュ一致制御の
必要／不要を判定してから判定結果に応じてキャッシュ
一致制御を必要とするタイプとキャッシュ一致制御を必
要としないタイプのいずれかのトランザクションの発行
を決定する。

【００７７】（３）ネットワークインタフェース３０５
内にキャッシュ一致制御の要／不要を示す制御レジスタ
を用意し、データ転送に先立って当該レジスタにキャッ
シュ一致制御の要／不要を設定する。データ転送にとも
ない、ネットワークインタフェース３０５は当該レジス
タの内容にしたがってキャッシュ一致制御を必要とする
タイプとキャッシュ一致制御を必要としないタイプのい
ずれかのトランザクションの発行を決定する。

【００７８】以上のネットワークインタフェース３０５
内の制御は、データ転送に関わるデータ長制御や転送形
態制御などの他の制御情報を扱う際の従来の技術の範疇
で実現が可能であるため、詳細な記述は省略する。本変
形例２の要点は、データ転送に関する制御情報として新
たにキャッシュ一致制御の要／不要という項目を追加し
た点である。

【００７９】

【発明の効果】本発明によれば、メッセージパッシング
型の並列計算機でのデータ転送において、そのデータの
送信あるいは受信と並行して、その送信／受信で発生す
る主記憶アクセスの送信元あるいは受信先のアドレス領
域を対象としたキャッシュ一致制御をハードウェアによ
って自動的に行い、かつ、そのメッセージパッシング型
のデータ転送が連続アドレス領域のデータを扱うという
特徴を利用して演算プロセッサに対するキャッシュ一致
制御要求の発行回数を基本的にはキャッシュメモリへの
登録単位であるキャッシュラインごとに1回となるよう
にするため、従来メッセージパッシング型の並列計算機
におけるデータ転送で問題となっていたキャッシュ一致
制御に関わるソフトウェアのオーバヘッドをなくしてキ
ャッシュメモリ制御を含めたデータ転送の効率を向上さ
せ、また、プログラム上の制約を緩和できる。

【図面の簡単な説明】

【図１】本発明に係わるストレージコントローラの構成
を示す図である。

【図２】本発明に係わるメッセージパッシング型の並列
計算機の概略構成を示す図である。

【図３】本発明に係わる要素プロセッサの概略構成を示
す図である。

【図４】本発明に係わるストレージコントローラの構成
を示す図である。

【符号の説明】

２０１・・・要素プロセッサ、２０２・・・相互結合
網、３０１・・・演算プロセッサ、３０２・・・キャッ
シュメモリ、３０４・・・ストレージコントローラ、３
０５・・・ネットワークインタフェース、３０６・・・
主記憶。

フロントページの続き (72)発明者明石英也東京都国分寺市東恋ケ窪１丁目280番地株式会社日立製作所中央研究所内

Claims

【特許請求の範囲】

【請求項１】それぞれが、命令プロセッサ、主記憶、前
記主記憶へのアクセスの効率向上に使用するキャッシュ
メモリを有する複数のプロセッサと、前記複数のプロセ
ッサを結合する相互結合網とからなり、データ書き込み
を前記キャッシュメモリと前記主記憶の両方に対して同
時に行う、分散メモリ方式の並列計算機において、前記相互結合網を介して転送されるデータを前記プロセ
ッサが前記相互結合網から受信する際に、受信データを
格納する主記憶領域の内容を前記キャッシュメモリから
消失させる消失手段と、前記消失手段の実行後に、前記受信データを前記主記憶
に書き込む手段を有することを特徴とする並列計算機。
【請求項２】前記消失手段は、前記主記憶から前記キャッシュメモリへのデータ複写の
単位となる複数語からなる連続アドレス領域に対するデ
ータの受信が前記相互結合網から繰り返されている間
は、前記連続アドレス領域への１つ目の受信データの前
記主記憶への書き込みの前に一度だけ前記連続アドレス
領域を前記キャッシュメモリから消失させ、前記連続アドレス領域が一度前記キャッシュメモリから
消失されると、前記連続アドレス領域が再び前記キャッ
シュメモリに複写されるまで、前記連続アドレス領域に
対する受信データを受けた際、前記連続アドレス領域を
前記キャッシュメモリから消失させる動作を行わないこ
とを特徴とする請求項１の並列計算機。
【請求項３】前記消失手段は、前記連続アドレス領域へのデータの受信が継続している
間に前記連続アドレス領域が再び前記キャッシュメモリ
に複写された場合には、前記連続アドレス領域が再び前
記キャッシュメモリに複写された以降１つめの受信デー
タの前記主記憶への書き込みの前に１度だけ前記連続ア
ドレス領域を前記キャッシュメモリから消失させ、以降は前記連続アドレス領域が再び前記キャッシュメモ
リに複写されるまで、前記連続アドレス領域に対する受
信データを受けた際、前記連続アドレス領域を前記キャ
ッシュメモリから消失させる動作を行わないことを特徴
とする請求項２の並列計算機。
【請求項４】それぞれが、命令プロセッサ、主記憶、前
記主記憶へのアクセスの効率向上に使用するキャッシュ
メモリを有する複数のプロセッサと、前記複数のプロセ
ッサを結合する相互結合網とからなり、通常はデータの
書き込みを前記キャッシュメモリに対して行い、かつ前
記主記憶への書き戻し要求があったときにデータの書き
込みを主記憶に対して行う、分散メモリ方式の並列計算
機において、前記相互結合網を介して転送されるデータを前記プロセ
ッサが受信する際に、前記受信するデータを格納する前
記主記憶領域の内容が前記キャッシュメモリと前記主記
憶の間で異なる場合に前記主記憶領域の内容を前記キャ
ッシュメモリから前記主記憶に書き戻し、かつ前記受信
データを格納する主記憶領域の内容を前記キャッシュメ
モリから消失させる第１の手段と、第１の手段の実行後、前記受信データを前記主記憶に書
き込む手段を有することを特徴とする並列計算機。
【請求項５】前記第１の手段は、前記主記憶から前記キャッシュメモリへのデータ複写の
単位となる複数語からなる連続アドレス領域に対するデ
ータの受信が繰り返されている間は、前記連続アドレス
領域への１つ目の受信データの前記主記憶への書き込み
の前に１度だけ、前記キャッシュメモリ上の前記連続ア
ドレス領域の内容が主記憶と異なる場合に前記連続アド
レス領域の内容を主記憶に反映し、かつ前記連続アドレ
ス領域を前記キャッシュメモリから消失させ、以降は前記連続アドレス領域が再び前記キャッシュメモ
リに複写されるまでは前記連続アドレス領域に対する受
信データを受けた際、前記キャッシュメモリ上の前記連
続アドレス領域の内容が主記憶と異なる場合に前記連続
アドレス領域の内容を主記憶に反映し、かつ前記連続ア
ドレス領域を前記キャッシュメモリから消失させる動作
を行わないことを特徴とする請求項４のデータ転送機
構。
【請求項６】前記第１の手段は、前記連続アドレス領域へのデータ受信が継続している間
に前記連続アドレス領域が再び前記キャッシュメモリに
複写された場合には、前記連続アドレス領域が再び前記
キャッシュメモリに複写された以降１つ目の受信データ
の主記憶への書き込みの前に１度だけ、前記キャッシュ
メモリ上の前記連続アドレス領域の内容が主記憶と異な
る場合に前記連続アドレス領域の内容を主記憶に反映
し、かつ前記連続アドレス領域を前記キャッシュメモリ
から消失させ、以降は前記連続アドレス領域が再び前記キャッシュメモ
リに複写されるまでは前記連続アドレス領域に対する受
信データを受けても、前記キャッシュメモリ上の前記連
続アドレス領域の内容が主記憶と異なる場合に前記連続
アドレス領域の内容を主記憶に反映し、かつ前記連続ア
ドレス領域を前記キャッシュメモリから消失させる動作
を行わないことを特徴とする請求項５の並列計算機。
【請求項７】それぞれが、命令プロセッサ、主記憶、前
記主記憶へのアクセスの効率向上に使用するキャッシュ
メモリを有する複数のプロセッサと、前記複数のプロセ
ッサを結合する相互結合網とからなり、通常はデータの
書き込みを前記キャッシュメモリに対して行い、かつ前
記主記憶への書き戻し要求があったときにデータの書き
込みを主記憶に対して行う、分散メモリ方式の並列計算
機において、前記相互結合網を介して転送されるデータを前記プロセ
ッサが送信する際に、前記送信データが格納される主記
憶領域の内容が前記キャッシュメモリと前記主記憶の間
で異なる場合に前記主記憶領域の内容を前記キャッシュ
メモリから前記主記憶に書き戻し、かつ前記送信データ
が格納される主記憶領域の内容を前記キャッシュメモリ
から消失させる第１の手段と、前記第１の手段の実行後、前記送信データを前記主記憶
から読み出し手段を有することを特徴とする並列計算
機。
【請求項８】前記第１の手段は、前記主記憶から前記キャッシュメモリへのデータ複写の
単位となる複数語からなる連続アドレス領域からのデー
タの送信が繰り返されている間は、前記連続アドレス領
域への１つめの送信データの主記憶からの読み出しの前
に１度だけ、前記キャッシュメモリ上の前記連続アドレ
ス領域の内容が主記憶と異なる場合に前記連続アドレス
領域の内容を前記主記憶に反映し、かつ前記連続アドレ
ス領域を前記キャッシュメモリから消失させるという動
作を行い、以降は前記連続アドレス領域が再び前記キャッシュメモ
リに複写されるまでは前記連続アドレス領域からの送信
データ読み出しの際、前記キャッシュメモリ上の前記連
続アドレス領域の内容が主記憶と異なる場合に前記連続
アドレス領域の内容を前記主記憶に反映し、かつ前記連
続アドレス領域を前記キャッシュメモリから消失させる
という動作を行わないことを特徴とする請求項７の並列
計算機。
【請求項９】前記第１の手段は、前記連続アドレス領域からのデータ送信が継続している
間に前記連続アドレス領域が再び前記キャッシュメモリ
に複写された場合には、前記連続アドレス領域が再び前
記キャッシュメモリに複写された以降１つめの送信デー
タの主記憶からの読み出しの前に１度だけ、前記キャッ
シュメモリ上の前記連続アドレス領域の内容が主記憶と
異なる場合に前記連続アドレス領域の内容を主記憶に反
映し、かつ前記連続アドレス領域を前記キャッシュメモ
リから消失させるという動作を行い、以降は前記連続アドレス領域が再び前記キャッシュメモ
リに複写されるまでは前記連続アドレス領域からの送信
データ読み出しがあっても、前記キャッシュメモリ上の
前記連続アドレス領域の内容が主記憶と異なる場合に前
記連続アドレス領域の内容を主記憶に反映し、かつ前記
連続アドレス領域を前記キャッシュメモリから消失させ
るという動作を行わないことを特徴とする請求項８の並
列計算機。
【請求項１０】請求項１から３において、更に、前記相互結合網を介して転送されるデータを前記プロセ
ッサが前記相互結合網から受信する際に、該キャッシュ
メモリに絡んだ制御は行わずに前記受信データを前記主
記憶に書き込む第２の手段と、前記消失手段および前記消失手段の実行後に前記受信デ
ータを前記主記憶に書き込む手段と、または前記第２の
手段とを選択する手段を有する並列計算機。
【請求項１１】請求項４から６において、更に、前記相互結合網を介して転送されるデータを前記プロセ
ッサが前記相互結合網から受信する際に、該キャッシュ
メモリに絡んだ制御は行わずに前記受信データを前記主
記憶に書き込む第２の手段と、前記第１の手段および前記第１の手段の実行後に前記受
信データを前記主記憶に書き込む手段と、または前記第
２の手段とを選択する手段を有する並列計算機。
【請求項１２】請求項７から９において、更に、前記相互結合網を介して転送されるデータを前記プロセ
ッサが前記相互結合網から受信する際に、該キャッシュ
メモリに絡んだ制御は行わずに前記送信データを前記主
記憶に書き込む第２の手段と、前記第１の手段および前記第１の手段の実行後に前記送
信データを前記主記憶に書き込む手段と、または前記第
２の手段とを選択する手段を有する並列計算機。