JP2792699B2

JP2792699B2 - コンピュータシステム、アライン制御装置および方法

Info

Publication number: JP2792699B2
Application number: JP1502292A
Authority: JP
Inventors: ヒリス，ダブリュー・ダニエル
Original assignee: SHINKINGU MASHIINZU CORP
Current assignee: SHINKINGU MASHIINZU CORP
Priority date: 1988-02-02
Filing date: 1989-02-01
Publication date: 1998-09-03
Anticipated expiration: 2013-09-03
Also published as: DE68928164T2; EP0394362B1; JPH04505675A; ATE155264T1; DE68928164D1; WO1989007299A1; EP0394362A1; EP0394362A4

Description

【発明の詳細な説明】技術分野本発明は、複数のプロセッサを有するコンピュータシ
ステムに関し、該複数のプロセッサのオペレーションを
アラインさせるアライン制御装置および方法に関する。

背景技術多数のマルチプロセッサが当技術分野で公知である。
A.WangおよびF.A.Brigg著「並列処理におけるコンピュ
ータ・アーキテクチャ」（McGraw Hill社、1984年発
行）を参照されたい。例示しているこのようなシステム
には、Illiac−IVと、Burroughs社（現Unisys社）製のB
urroughs Scientific Processor（BSP）と、NASA Godda
rd Space Flight Centerで開発されGoodyear Aerospace
社により製造された超並列プロセッサ（Massively Para
llel Processor;MPP）と、ICL of England社製のDAP
と、Goodyear Aerospace社により設計されたSTARANと、
International Business Machines社製のIBM370/168MP
およびIBM3081/3084と、Sperry Univac社（現Unisys
社）製のUnivac1100/80と、Tandem−16Nonstop、Burrou
ghs社（現Unisys社）製のＤ−825と、Denelcore社製のH
EPと、Cray Research社製のCray X−MPおよびCray−２
と、Carnegie Mellon大学で開発されたCm＊およびC.mmp
が含まれる。

最近、何千個ものプロセッサが並列にオペレートされ
るマルチプロセッサが紹介された。このようなプロセッ
サの１つに、本願の譲受人が製造販売しているConnecti
on Machine Computerがあり、この詳細は米国特許第4,5
98,400号に記載してある。ここに、米国特許第4,598,40
0号の番号を付して本明細書の一部とする。このConnect
ion Machine Computerのうち現在入手可能なものは、１
つの中心コンピュータと、１つのマイクロコントローラ
と、65536個の並列プロセッサを備えている。この中心
コンピュータは、適正にプログラムされた市販のコンピ
ュータ、例えば、Symbolics 3600−series LISP Machin
eのようなコンピュータでもよい。このマイクロコント
ローラは、32ビットの並列バスにより並列プロセッサ・
アレイに供給される命令のシーケンスを生成する慣用の
設計の命令シーケンサである。このマイクロコントロー
ラは、データ出力とステータス情報として用いることが
できる汎用シグナル、すなわち、GLOBAL（大域）シグナ
ルであるシグナルを、並列処理アレイから受信する。

個々のマルチプロセッサが情報を交換することができ
るように、マルチプロセッサのオペレーションを同期さ
せるという問題は、全てのマルチプロセッサに共通した
問題である。これらの問題は回避することができる。SI
MD（single operation stream,multiple data stream）
環境、すなわち、全ての処理ユニットが異なるデータに
対してオペレートするが、同一の命令ストリームを並列
に受信する環境で、マルチプロセッサの全てのプロセッ
サをオペレートして回避することができる。しかし、各
プロセッサがMIMD（muliple instruction stream,multi
ple data stream）環境で各自の命令ストリームに対し
てオペレートする限り、マルチプロセッサの複数のプロ
セッサを独立にオペレートさせることは利点がある。

同期とは、各プロセッサが各自のプログラムのある点
に到達したときに、各プロセッサがビットをレジスタに
セットすることであり、この場合、各プロセッサが他の
プロセッサとアライン（align）される。この同期点に
達すると同時に、各プロセッサはレジスタをテストし
て、全てのビットが適正にセットされたかどうかを判定
し、このようなビットが全てセットされるまで、プロセ
ッサはそのプログラムを先に進ませない。このような手
法を用いると、各プロセッサが、各同期点で、予め定め
たオペレーションを同時に行うように、プロセッサを厳
密に時間同期させることができる。

発明の開示多くのオペレーションでは、複数のプロセッサのオペ
レーションを厳密に時間同期させる必要はない。むし
ろ、任意のプロセッサが別の指示されたタスクの実施を
開始することができる前に、各プロセッサが指定された
タスクを実施したことを保証するだけで充分である。そ
れ程厳密でないこの同期形態を、本明細書では、アライ
ン（align）と呼ぶ。本発明によれば、複数のマルチプ
ロセッサをアラインする方法および装置が発明された。
本装置は、各プロセッサと関係付けをした１つのアライ
ン・ユニットと、アライン・ユニットの出力を組み合わ
せ、アライン・ユニットに情報をブロードキャストする
ロジック・ネットワークとを備えるのが好ましい。アラ
インされるプロセッサからの命令ストリームにアライン
要求を挿入し、このようなプロセッサを、このようなプ
ロセッサが全てアライン要求を行い、任意の必要なオペ
レーションを完了するまで、待機させる、ことによりア
ラインされる。

各プロセッサと関係付けをしたアライン・ユニット
は、命令ストリームをモニタし、アライン要求を検出す
る。ロジック・ネットワークは説明上はANDゲートであ
り、各アライン・ユニットをテストして、アライン要求
を検出したかどうかを判定し、プロセッサおよび／また
は相互結合ネットワークをテストして、必要なオペレー
ションが全て完了したどうかを判定するものである。全
てのユニットがこのような要求を行い、しかも、必要な
オペレーションが全て完了したとき、ロジック・ネット
ワークはアライン・ユニットに通知し、アライン・ユニ
ットはプロセッサに通知する。

本発明の上記および他の目的、特徴、および利点は、
本発明の詳細な説明から容易に明らかになるであろう。

図面の簡単な説明第１図は本発明を適用したマルチプロセッサの実施の
形態を示すブロック図である。

第２図は本発明に係るアライン・ユニットの実施の形
態を示すブロック図である。

第３図は本発明の組合わせロジックの１ユニットの例
を示す図である。

第４図は第２図に示すアライン・ユニットのオペレー
ションを示す状態図である。

第５図は本発明の第２の実施の形態を示すブロック図
である。

発明を実施するための最良の形態第１図に示すように、図示した本発明に係る装置は、
プロセッサ10のアレイと、アライン・ユニット20のアレ
イと、組合わせ論理セル30のアレイと、相互結合ネット
ワーク40と、制御装置50とを備えている。図示したプロ
セッサは、それぞれ、演算理論ユニットと、読出し／書
込みメモリと、入出力手段とを含む。多くのこのような
プロセッサは当技術分野では周知のものである。図示の
プロセッサとしては、8038タイプのマイクロプロセッ
サ、例えば、Intel社製のマイクロプロセッサがある。

相互結合ネットワーク40は、プロセッサ間通信を行
う。特に、相互結合ネットワーク40は、プロセッサとプ
ロセッサの間で、データおよび制御情報を交換すること
ができる。多数の相互結合ネットワークが当技術分野で
は公知である。例えば、C.WuおよびT.Feng著「並列およ
び分散処理のための相互結合ネットワーク」（IEEE,198
4年）を参照されたい。図示の通信ネットワークは、各
プロセッサと、各プロセッサの最も近い近傍のプロセッ
サとを、２次元以上の直交アレイになるように接続した
構成である。２つのこのようなネットワークは米国特許
第4,598,400号に記載してあるが、他の多くのネットワ
ークも当技術分野では公知である。

図示のプロセッサと相互結合ネットワークは、典型的
には、幾つかのタイプの制御装置50の制御によりオペレ
ートされる。Connection Machine Computerのプロセッ
サおよび相互結合ネットワークの場合には、図示したよ
うな制御装置は、Symbolics 3600 Series LISPマシンで
あり、マイクロコントローラである。他の多くの制御装
置が他のマルチプロセッサとともに用いられている。

マルチプロセッサのプロセッサ間で通信がある場合、
別のプロセッサがある指定されたオペレーションをパフ
ォームする前に、そのプロセッサによりパフォームされ
るオペレーションがあるステップに達したことを保証す
ることは、多分必要なことである。例えば、データが第
１のプロセッサからフェッチされ、第２のプロセッサに
渡された場合、データがフェッチされる前に、そのデー
タが第１のプロセッサに存在していることを保証するこ
とは必要なことである。必要なときに、そのデータが存
在することを保証するには、個々のプロセッサをアライ
ンすることが必要である。このことは、全てのプロセッ
サがSIMD環境で厳密に並列にオペレートすることにより
達成することができる。しかし、プロセッサをMIMD環境
でオペレートし、必要な場合にのみアラインさせること
は、多くの場合、多分利点がある。

本発明によれば、あるプロセッサ・グループのプロセ
ッサ間のアラインは、各プロセッサの命令ストリーム
に、追加の命令を２つ挿入することにより行われる。２
つの追加の命令とは、アライン要求命令と、アラインが
達成されたどうかのテスト命令である。典型的には、ア
ライン要求命令の発行は、プロセッサ群のプロセッサ
に、プロセッサがアラインするように要求する命令（通
信命令のような命令）を、命令ストリームが発行した以
後に、行われる。テスト命令は、命令ストリームにおい
て、アラインが達成されなければならなかった時点の直
前に、発行される。

例えば、プロセッサ・グループの各プロセッサから、
各プロセッサの近傍のプロセッサに、データが転送さ
れ、そのデータとプロセッサに存在するデータと組合わ
されるものと仮定する。このグループに属する近傍のプ
ロセッサ対を、プロセッサｉ−１と、プロセッサｉとし
て識別した場合は、各プロセッサのこのようなデータと
組合わせるため、次に記載する命令ストリームを、プロ
セッサ・グループの各プロセッサに供給することができ
る。

01プロセッサｉ−１からのデータをプロセッサｉのレジ
スタＡに送信する 02プロセッサｉのレジスタＢからのデータをレジスタＣ
に移動する 03レジスタＡの内容をプロセッサｉのレジスタＣの内容
に加える適正なデータがレジスタＣの内容に加えられる前に、
この適正なデータがレジスタＡに存在することが、必要
なことは明らかである。このことを保証するには、プロ
セッサのオペレーションをアラインする必要がある。

本発明によれば、このようなアラインは、アライン要
求命令およびテスト命令を命令ストリームに挿入するこ
とにより達成される。上述の例では、命令ストリームは
次のようになる。すなわち、 01プロセッサｉ−１からのデータをプロセッサｉのレジ
スタＡに送信する 02アラインを要求する 03データをプロセッサｉのレジスタＢからレジスタＣに
移動する。

04アラインされたかどうかテストする 05偽である場合は、テストを再実行する 06真である場合は、レジスタＡの内容をプロセッサｉの
レジスタＣの内容に加える本発明によれば、アライン要求命令およびテスト命令
は、アラインされる各プロセッサからの命令ストリーム
に挿入され、全てのプロセッサがアライン要求命令をア
サート（assert）するまで、これらのプロセッサはテス
ト命令を求めて待機する。

このようなアライン要求命令およびテスト命令を処理
する好ましい装置は、第１図のアライン・ユニット20
と、組合わせ論理セル30を備えている。第１図に示すよ
うに、各プロセッサ10はアライン・ユニットにそれぞれ
接続してあり、アライン・ユニットにシグナルを送信
し、アライン・ユニットからシグナルを受信する。第２
図に示すように、アライン・ユニット20は、それぞれ、
４つのＤタイプ・フリップフロップ21、22、23、24を備
えるとともに、表１に示す入出力テーブルをインプリメ
ントする組合わせロジック26を備えている。第３図に示
すように、論理セル30は、それぞれ、ANDゲート33を備
えているが、２つのＤタイプ・フリップフロップ35、36
は任意指定である。論理セルは２分木状に接続してあ
り、２分木の最下位レベルの各論理セルは、１対のアラ
イン・ユニット20に接続してある。

各アライン・ユニットは、各アライン・ユニットが接
続されたプロセッサから、当該プロセッサにより実行さ
れている命令ストリームINSTを受信する。表１の入出力
テーブルでは、以下にさらに詳細に説明するが、各アラ
イン・ユニットは、当該プロセッサに、アラインが達成
されたかどうかを表すシグナルALIGN（アライン）を供
給する。さらに、各アライン・ユニットも、各アライン
・ユニットが接続された論理セルの入力に、出力シグナ
ルASSERTを供給し、その論理セルからシグナルREADY
（レディ）を受信する。このシグナルREADYはフリップ
フロップ21に供給され、ついで、組合わせロジック26に
供給される。

論理セル30のANDゲート33は、入力線31、32からシグ
ナルASSERTを受信し、出力線34上に（フリップフロップ
36を介するか否かは、任意指定である）、出力シグナル
ASSERTを出力する。第３図に示す本発明に係る実施の形
態では、ANDゲート33への両入力線31、32上の論理ハイ
のシグナルがアサートされるまで、出力線34上の論理ハ
イのシグナルはアサートされない。２つの論理セルから
の出力ASSERTシグナルは、２分木の次に上位のレベルの
論理セル30の２つの入力として供給される。

ANDツリーの最上位のセルは、相互結合ネットワーク
が空であることを表すシグナルであって相互結合ネット
ワーク40からのシグナルを有するとともに、ANDゲート6
0に入力される出力線34を有する。この相互結合ネット
ワークは、このネットワークを介してメッセージがルー
ティングされていない場合は、常に、空である。相互結
合ネットワークの中には、この状態が存在するか否かの
テストが、慣用のテストであるものもあり、ネットワー
クが空であることを表すシグナルを供給することは、当
技術分野の通常の技術の範囲内である。第１図に示す好
ましい実施の形態では、空のネットワークが存在するか
否かのテストは、相互結合ネットワーク上のメッセージ
・トラフィックが完了したことを保証するために行われ
る。

論理ハイの空シグナルが、最上位のセルのアサート出
力線34上の論理ハイのシグナルと一致すると、レディシ
グナルがANDゲート60により２分木の最上位のセルの入
力レディ線37に供給される。このレディシグナルは、２
分木の次に下位のレベルの２つのセルの入力レディ線37
にそれぞれ接続された２つの出力レディ線38、39に供給
される（フリップフロップ35を介するか否かは、任意指
定である）。READYシグナルがアライン・ユニット20の
アレイ全体にブロードキャストされるように、この２分
木の最下位レベルで、READYシグナルは、各セルによ
り、２つのアライン・ユニット20に供給される。

一般的に、アライン・ユニット20および論理セル30の
オペレーションは、あるアライン・ユニットが、当該ア
ライン・ユニットで受信された命令ストリームにおい
て、アラインREQUEST（要求）シグナルを検出すると、
当該アライン・ユニットからのASSERT線上に、論理ハイ
のシグナルが出力されるようなオペレーションである。
各アライン・ユニットがアラインREQUESTシグナルを検
出した場合か、検出した場合にのみ、２分木の最上位の
レベルの論理セル30からの出力線34が論理ハイになる。
相互結合ネットワーク40上のメッセージ・トラフィック
が、アラインREQUESTシグナルを全てのプロセッサが発
行した後のある時点で完了した場合には、空シグナルが
論理ハイとなるとともに、ANDゲート60の出力も論理ハ
イとなる。その結果、論理ハイのREADYシグナルは、論
理セル30を直通して全てのアライン・ユニットにブロー
ドキャストされ、全てのアライン・ユニットで、論理ハ
イのREADYシグナルがGRANT（認可）シグナルとして認識
される。

このGRANTシグナルは各アライン・ユニットにより処
理され、プロセッサからの命令ストリームの各TEST（テ
スト）命令ごとに、１つの論理ハイのALIGN命令をプロ
セッサに出力する。命令ストリームのTESTシグナルの前
に、GRANTシグナルが受信された場合には、各アライン
・ユニットは、このGRANTシグナルを単にストアして待
機する。このTESTシグナルが最初に受信された場合は、
アライン・ユニットも同様に待機する。TESTシグナルお
よびGRANTシグナルの両方のシグナルを受信すると直ち
に、アライン・ユニットはプロセッサに論理ハイのALIG
Nシグナルを発行し、ついで、そのプロセッサはイネー
ブルされ、アラインが要求するオペレーションを行う。

表１と、第４図の状態図は、アライン・ユニット20
と、その組合わせロジック26と、フリップフロップ22〜
24のオペレーションを表しているので、アライン・ユニ
ットのオペレーションの詳細は、表１と、第４図の状態
図と協働して説明するのが最も良い。第４図に示すよう
に、アライン・ユニットを、６つの状態、すなわち、ID
LE（アイドル）と、PEND（保留）と、BLOCK（ブロッキ
ング）と、QUEUE（キュー）と、GOT（取得）と、SAVE
（保管）のうちのいずれかの状態にすることができる。
アライン・ユニットの状態は、フリップフロップ22、2
3、24に２進符号化形式でストアされ、組合わせロジッ
ク26の入力として、プロセッサからの命令ストリームIN
STと、フリップフロップ21からのGRANTシグナルととも
に供給される。この命令ストリームはプロセッサに供給
される命令シーケンスであり、本発明によれば、３つの
タイプの命令、すなわち、アラインREQUESTと、TEST
と、第４図でそれぞれ記号Ｒと、Ｔと、Ｏにより表わさ
れる全てのOTHER命令を含む。論理ハイのGRANTシグナル
は、第４図にＧで示し、論理ローのGRANTシグナルは
で示す。

組合わせロジック26の入力の異なる組合わせは、表１
の左側の３つの列に示す。。これらの入力に応答して、
組合わせロジック26により生成された出力は、表１の右
側の３つの列に示す。表１に示すように、１つの出力は
アライン・ユニットの次の状態を指定し、他の２つ出力
はALIGN線およびASSERT線の論理レベルを指定する。入
力の幾つかの組合わせが不可能である場合は、次の状態
がERRORであることが示され、ALIGNレベルおよびASSERT
レベルは定義されない。

第１図に示す装置は、アライン・ユニットをIDLE状態
に初期設定する。通常は、各アライン・ユニットはIDLE
状態であり、プロセッサからの命令ストリームで任意の
命令（REQUEST命令を除く）を受信しても、IDLE状態で
ある。このことは、Ｏとラベルを付したループにより
示される。IDLE状態にある間、ALIGNおよびASSERTの両
方の出力は論理ローである。アライン・ユニットは、以
下に詳細に述べるが、REQUESTシグナルを受信すると直
ちに、PEND状態に変化し、PEND状態にある場合は、ASSE
RT出力を論理ハイにする。全てのアライン・ユニットの
ASSERT出力が論理ハイとなり、相互結合ネットワークが
空である場合、GRANTシグナルは論理ハイになり、GRANT
シグナルが論理ハイになると、アライン・ユニットは、
表１で指定されるように出力シグナルを生成する。TEST
命令および論理ローのGRANTシグナルが受信された場合
には、アライン・ユニットは最終的にIDLE状態になるこ
とになる。

表１に示すように、REQUESTシグナルが命令ストリー
ムで検出され、しかも、論理ハイのGRANTシグナルが論
理セルから受信されなかった場合には、アライン・ユニ
ットは、第４図に線Ｒで示すとともに、表１の３行目
に示すように、IDLE状態からPEND状態に変化する。一
旦、PEND状態になると、論理ハイのGRANTシグナルが受
信されない場合は、アライン・ユニットの状態は変化し
ないことになる。PEND状態にある間、組合わせロジック
26は入力シグナルの可能な任意の組合わせに対しても、
論理ハイのASSERTシグナルを発行することになる。ASSE
RTシグナルは論理セル30の入力に供給される。全てのAS
SERTシグナルが論理ハイであり、しかも、相互結合ネッ
トワークが空である場合、論理ハイREADYシグナルが全
てのアライン・ユニットにブロードキャストされ、全て
のプロセッサが完了する必要がある命令（例えば、通信
命令）を、全てのプロセッサが完了したことを示し、従
って、アラインされたことを示す。この論理ハイのREAD
Yシグナルは表１の論理ハイのGRANTシグナルである。論
理ハイのGRANTシグナルがOTHER命令とともに受信された
場合、このアライン・ユニットは、第４図に線OGで示す
とともに、表１の12行目に示すように、GOT状態に変化
し、引き続き論理ハイのASSERTシグナルを発行している
間、論理ハイのALIGNシグナルを発行する。

任意のOTHER命令が引き続き受信され、GRANTシグナル
が引き続き論理ハイである場合は、組み合わせロジック
はGOT状態のままであるが、ASSERTシグナルは論理ロー
になる。その結果、GRANTシグナルは論理ローになる。O
THER命令が受信されている間、このGRANTシグナルが論
理ローである場合、アライン・ユニットはSAVE状態に切
換わる。このSAVE状態は、TEST命令が受信されるまで変
化しない。ついで、アライン・ユニットはIDLE状態に戻
る。

しかし、アライン・ユニットがGOT状態にある間に、T
EST命令が受信された場合は、アライン・ユニットは、
（GRANTシグナルが論理ハイである場合は、）BLOCK状態
に変化し、（GRANTシグナルが論理ローである場合
は、）IDLE状態に変化し、その結果、AASSERTシグナル
が論理ローになる。

BLOCK状態により、他のアライン・オペレーションの
実施が阻止される。このアライン・ユニットがBLOCK状
態にあり、しかも、GRANTシグナルが論理ローである間
に、このアライン・ユニットでOTHER命令が受信される
と直ちに、このアライン・ユニットは、BLOCK状態とIDL
E状態の間の線Ｏで示すように、IDLE状態に戻る。し
かし、別のREQUEST命令が受信された場合は、アライン
・ユニットは、GRANTシグナルが論理ローである場合
は、PEND状態に戻り、GRANTシグナルが論理ハイである
場合は、QUEUE状態に戻る。アライン・ユニットは、GRA
NTシグナルが論理ハイである限り、QUEUE状態のままで
あり、GRANTシグナルが論理ローになると、PEND状態に
戻ることになる。

あるいはまた、PEND状態であって、GRANTシグナルが
論理ハイである間に、アライン・ユニットがTEST命令を
受信した場合は、このアライン・ユニットはBLOCK状態
に変化することになる。BLOCK状態でのオペレーション
は、上述したオペレーションと同一である。

本発明の別の実施例の形態を第５図に示す。第５図に
示すように、本装置は、プロセッサ110のアレイと、ア
ライン・ユニット120のアレイと、組合わせ論理セル130
のアレイと、相互結合ネットワーク140とを備えてい
る。プロセッサ110と、アライン・ユニット120と、組合
わせ論理セル130は、第１図に示すプロセッサ10と、ア
ライン・ユニット20と、論理セル30と同一でも良い。プ
ロセッサ110は図示しない制御装置により制御すること
ができる。しかし、相互結合ネットワーク140は、個々
のルータ142と、各プロセッサ対間のコネクション・パ
ス144の形態で実現される点でネットワーク40と異な
る。

このような場合、プロセッサごとに、プロセッサを検
査することにより、相互結合ネットワーク上のメッセー
ジ・トラフィックが存在しないか否かをテストすること
ができる。従って、各プロセッサに対するルータは出力
信号を生成する。この出力信号は、互いに関係付けをし
たプロセッサ間のコネクション・パス上にメッセージ・
トラフィックが存在しない場合、論理ハイになる。この
信号はANDゲートの１つの入力として供給される。ANDゲ
ートには、別の１つの入力として、そのプロセッサと関
係付けをしたアライン・ユニット130の出力が入力され
る。その結果、そのプロセッサと関係付けをした相互結
合ネットワークの一部におけるメッセージ・トラフィッ
クが存在しない場合は、論理ハイのシグナルがANDゲー
ト146により論理セル130に供給され、論理ハイのASSERT
シグナルがアライン・ユニットにより生成される。当
然、このため、第１図の論理セル30の２分木の最上位セ
ルから、第５図の論理セル130の２分木の最下位セルへ
のメッセージ・トラフィックが存在するか否かをテスト
する場所が変更される。他の点では、アライン・ユニッ
トと、論理セルのオペレーションは、第１図ないし第４
図に関する説明と同様である。

本発明は、数多くの環境で、実施することができる。
例えば、プロセッサがIntel 80386マイクロプロセッサ
である場合は、80386命令セットのうちのINおよびOUT命
令を用いて、アライン・ユニットに命令を供給し、アラ
イン・ユニットからALIGNシグナルを受信することによ
り、本発明を実施することができる。

例示的なコードは次のようなコードを備えている。す
なわち、 1.MOV AL,5 データが送信されるプロ
セッサのアドレス５をロード 2.OUT sending device,AL 送信装置によりデータを
送信 3.ADD AL,CL メッセージのデータを計
算 4.OUT sending device,AL 送信装置によりデータを
送信 5.MOV AL,1 アライン要求を表わす１
のビットをALにロード 6.OUT align unit,AL レジスタALの１のビット
をアライン・ユニット20に送信・・・ 20.IN AL,align unit アライン・ユニットから
のALIGNシグナルをレジスタALにロード 21.TEST AL,1 レジスタALのシグナルが
１のビットであるか否かをテスト 22.INE 20 １のビットでない場合、
行番号20の命令に戻る 23.IN AL,receiving device １のビットである場合
は、受信装置からのシグナルをレジスタALにロードする
ことにより、例示したように、プログラムを続ける本発明の実施に際して、プロセッサがそのプログラム
を続けることができる前に、プロセッサ間の通信が完了
することが必要である時は、常に、アラインの要求が各
プロセッサにより行われる。上記のコード例では、アラ
インの要求は行番号６で行われる。アラインの要求は、
各プロセッサと関係付けをしたアライン・ユニット20に
より処理され、論理ハイのASSERTシグナルとして、論理
セル30にフォワーディングされる。これらの要求は、論
理セル30によりAND演奏され、全てのプロセッサがこの
ような要求を行うと、論理ハイのシグナルがANDゲート6
0に供給される。相互結合ネットワークが空である場合
は、論理ハイのREADYシグナルがANDゲート60により、論
理セル30を介して、全てのアライン・ユニット20にブロ
ードキャストされる。

上記のコード例では、READYシグナルまたはGRANTシグ
ナルの論理レベルは、それぞれ、このシグナルレベルを
個々に読み出す線20、21、22上の命令によりモニタさ
れ、論理レベルが１のビット、すなわち、論理ハイであ
るかどうかをテストし、この１のビットが受信されなか
った場合は、再循環する。これらの命令は、表１のTEST
命令と、ALIGNシグナルの機能を与える。

全プロセッサはREADYシグナルが論理ハイになった時
にアラインされる。すなわち、READYシグナルの論理ハ
イは、行番号６でのアライン要求と、例えば、行番号20
〜23でテストを開始してレジスタALに１のビットが存在
するときの間の時点で生じる。しかし、各プロセッサが
同時にこのようなテストを行う必要はなく、また、最初
にこのようなテストをREADYシグナルが論理ハイになっ
た後に行う必要はない。プログラムが行番号20〜21に到
達する前に、論理ハイのREADYシグナルが受信された場
合は、アライン・ユニットはこれらの行番号に到達する
まで、この情報を保管する。アライン・ユニットは、プ
ログラムが行番号20に到達したとき、READYシグナルが
依然として論理ローである場合は、READYグナルが論理
ハイになるまで、プログラムは行番号20〜22の命令を単
に繰り返すだけである。

当業者にとって当然であるが、本発明を実施する際
に、多くの変更を行なうことができる。例えば、本発明
は相互結合ネットワーク上の通信が完了したか否かをテ
ストする装置（ANDゲート60）に関して記載したが、こ
のような通信ネットワークのテストの代わりに行なう
か、あるいは、このようなテストに加えて、他のテスト
を行うことも望ましい。従って、コンピュータ・システ
ムが数値計算コプロセッサを含む場合か、あるいは、ソ
フトウェアが種々のサブルーチンを含み、これらサブル
ーチンの出力がプロセッサからプロセッサに通信される
データを変更した場合、このような装置あるいはオペレ
ーションがプロセッサにREADYシグナルを発行する前
に、それらのタスクを完了したことを保証するため、こ
のような装置およびオペレーションをテストすることが
望ましい。このようなテストは次のようにして容易に行
なうことができる。すなわち、プログラムを続けること
ができる前にオペレーションが完了しなければならない
各ハードウエアまたはソフトウエア・エレメントと関係
付けをしたアクティビティ・フラッグの状態を、グロー
バルORネットワークを用いてテストすることは、容易に
行うことができる。

フロントページの続き (58)調査した分野(Int.Cl.⁶，ＤＢ名) G06F 15/163 ＪＯＩＳＥＰＡＴＤＩＡＬＯＧＷＰＩ

Claims

(57)【特許請求の範囲】

【請求項１】コンピュータシステムの備える複数のプロ
セッサでありそれぞれ個々の命令ストリームを処理する
複数のプロセッサのオペレーションをアラインさせる方
法であり、前記各命令ストリームが、アライン要求タイ
プと、アライン・テスト・タイプと、少なくとも１つの
他の命令タイプとを含む複数の命令タイプの命令を含
み、前記各命令ストリームが、該命令ストリームに位置
するアライン要求タイプの少なくとも１つの命令であっ
てある時点で実行される命令を含むとともに、前記命令
ストリームに位置するアライン・テスト・タイプの少な
くとも１つの命令であって前記アライン要求タイプの命
令より後の時点で実行される命令を含み、前記命令スト
リームに位置する別の命令タイプの少なくとも１つの命
令であってアライン要求タイプの命令を実行する時点
と、アライン・テスト・タイプの命令を実行する時点と
の間で実行される命令を含むアライン制御方法であっ
て、 A.前記複数のプロセッサが、それぞれ、前記アライン要
求タイプの個々の命令ストリームからの命令を実行する
と直ちに、要求指示を生成し、その後、引き続き命令を
実行するステップと、 B.前記複数のプロセッサが、それぞれ、前記アライン・
テスト・タイプの個々の命令ストリームからの命令を実
行しても、アライン指示がない場合、前記命令ストリー
ムのその後の命令の処理をディセーブルするステップ
と、 C.前記複数のプロセッサが全て前記要求指示を生成した
とき、アライン指示を生成し、前記複数のプロセッサを
イネーブルにして、前記アライン・テスト・タイプの命
令の後の個々の命令ストリームからの命令を実行するス
テップとを備えたことを特徴とする複数のプロセッサをアライン
させる方法。
【請求項２】コンピュータシステムにおいて、 A.個々の命令ストリームを処理する複数のプロセッサで
あって、各命令ストリームは、アライン要求タイプと、
アライン・テスト・タイプと、少なくとも１つの他の命
令タイプを含む複数の異なる命令タイプの命令のシーケ
ンスを含み、各命令ストリームは、該命令ストリームに
位置するアライン要求タイプの少なくとも１つの命令で
あってある時点で実行される命令を含むとともに、前記
命令ストリームに位置するアライン・テスト・タイプの
少なくとも１つの命令であって前記アライン要求タイプ
の命令より後の時点で実行される命令を含み、前記命令
ストリームに位置する別の命令タイプの少なくとも１つ
の命令であってアライン要求タイプの命令を実行する時
点と、アライン・テスト・タイプの命令を実行する時点
の間で実行される命令を有する少なくとも幾つかの命令
ストリームを含み、各プロセッサは、前記アライン要求
タイプの命令を処理する間、アライン要求指示を生成
し、各プロセッサは、前記アライン・テスト・タイプの
命令を処理する間、アライン・テスト指示を生成し、ア
ライン指示を受信したか否かをモニタし、各プロセッサ
は、アライン指示受信後まで、前記アライン・テスト・
タイプの前記命令の後の命令を処理することが禁止され
る複数のプロセッサと、 B.前記全プロセッサによりアライン要求指示が生成され
た後に、各プロセッサからのアライン・テスト指示を受
信したとき、この受信に応答して、前記各プロセッサに
対して、アライン指示を生成するアライン・ネットワー
クとを備えたことを特徴とするコンピュータ・システム。
【請求項３】請求の範囲第２項に記載のコンピュータ・
システムにおいて、前記アライン・ネットワークは、 A.各プロセッサに関係付けをした状態制御回路であっ
て、 i.第１状態と、アライン状態回路がアライン要求を生成
する第２状態と、前記アライン状態回路がアライン指示
を生成する第３状態とを有するアライン状態回路と、 ii.該アライン状態回路をイネーブルにして、 a.前記第１状態から前記第２状態にシフトし、命令スト
リームに位置するアライン要求タイプの命令を、関係付
けをしたプロセッサが受信したとき、この受信に応答し
て、アライン要求を生成し、 b.前記第２状態から前記第３状態にシフトし、レディシ
グナルのアサートと、命令ストリームに位置するアライ
ン・テスト・タイプの命令の前記プロセッサによる受信
が一致したとき、それに応答して、アライン指示を生成
し、 c.前記レディ信号のネゲーションに応答して、前記第３
状態から前記第１状態にシフトする状態制御回路と、 B.アライン要求を生成する前記全プロセッサに関係付け
をした前記アライン状態回路に応答して、前記アサート
・シグナルをアサートし、そうでない場合には、前記レ
ディシグナルをネゲートされた状態に維持する一致テス
ト手段とを備えたことを特徴とするコンピュータ・システム。
【請求項４】請求の範囲第３項に記載のコンピュータシ
ステムにおいて、前記一致テスト手段は、前記全プロセ
ッサからのアライン要求が一致したとき、前記レディシ
グナルを生成することを特徴とするコンピュータ・シス
テム。
【請求項５】請求の範囲第４項において、前記一致テス
ト手段は、ルート論理セルと、複数のリーフ論理セルを定義する木
構造状に結合された複数の論理セルであって、複数の子
から入力シグナルを受信すると、その受信に応答して、
親に結合されている出力シグナルを生成する一致回路を
それぞれ含む論理セルであり、前記アサート・シグナル
をルートセルに伝播する論理セルと、予め定めた数のアライン状態回路からのアライン要求信
号を入力信号として有し、アサート・シグナルを出力シ
グナルとしてそれぞれ生成するリーフセルと、前記全アライン状態制御回路に結合するためのレディ指
示を生成するレディ指示生成回路を含むルートセルとを備えたことを特徴とするコンピュータ・システム。
【請求項６】請求の範囲第５項において、前記論理セル
は、それぞれ、クロックシグナルに応答して前記一致回
路からの出力シグナルをラッチするラッチ回路であっ
て、ルートセルに向けて伝播されている前記アサート・
シグナルを備えたラッチされた出力シグナルを生成する
ラッチ回路をさらに含むことを特徴とするコンピュータ
・システム。
【請求項７】請求の範囲第５項において、前記論理セル
は、それぞれ、クロックシグナルに応答して親論理セル
からのレディ指示をラッチするラッチであって、ラッチ
されたレディ指示を子に伝送し、該レディ指示を、前記
ルート論理セルからリーフ論理セルに伝播するラッチを
含むレディ指示分配回路をさらに含み、前記リーフ論理
セルは、前記ラッチによりラッチされたレディ指示を、
前記ラッチに結合されているアライン状態回路に伝送す
ることを特徴とするコンピュータ・システム。
【請求項８】請求の範囲第２項において、前記プロセッ
サ間でメッセージを転送する相互結合手段であって、選
択されたステータス状態を示すステータス情報シグナル
をさらに生成する相互結合手段をさらに備え、前記アラ
イン・ネットワークは、前記ステータス情報シグナルに
応答して、前記各プロセッサに対するアライン指示をさ
らに生成することを特徴とするコンピュータ・システ
ム。
【請求項９】コンピュータシステムの備える複数のプロ
セッサでありそれぞれ命令ストリームを定義している自
分の命令シーケンスを実行する複数のプロセッサのオペ
レーションをアラインさせるアライン制御装置であっ
て、前記各命令ストリームが、アライン要求タイプと、
アライン・テスト・タイプと、少なくとも１つの他の命
令タイプを含む複数のタイプの命令を含み、前記各命令
ストリームが、該命令ストリームに位置するアライン要
求タイプの少なくとも１つの命令であってある時点で実
行される命令を含むとともに、前記命令ストリームに位
置するアライン・テスト・タイプの少なくとも１つの命
令であって前記アライン要求タイプの命令より後の時点
で実行される命令を含み、前記命令ストリームに位置す
る別の命令タイプの少なくとも１つの命令であってアラ
イン要求タイプの命令を実行する時点と、アライン・テ
スト・タイプの命令を実行する時点の間で実行される命
令を有する少なくとも幾つかの命令ストリームを含むア
ライン制御装置において、 A.当該プロセッサの個々の命令ストリームからの命令を
当該プロセッサが処理するのに応答して、当該プロセッ
サにそれぞれ関係付けをした複数のテスト手段であっ
て、前記命令をテストして、該命令がアライン要求タイ
プの命令か、アライン・テスト・タイプの命令かを判定
する複数のテスト手段と、 B.該全テスト手段がアライン要求タイプの命令を検出し
たと判定し、このような判定を用いて、レディシグナル
の生成を制御する判定手段と、 C.当該プロセッサと関係付けをした複数の禁止手段であ
って、前記レディシグナルが前記判定手段により生成さ
れるまで、前記アライン・テスト・タイプの命令を越え
て、前記関係付けをしたプロセッサが命令を実行するこ
とを禁止する複数の禁止手段とを備えたことを特徴とするアライン制御装置。
【請求項１０】請求の範囲第９項において、前記テスト
手段は、それぞれ、 A.アライン・プロセスの現状態の指示をストアする手段
と、 B.レディシグナルと、前記プロセッサからの命令ストリ
ームの実行を表すシグナルと、前記現状態を表すシグナ
ルとに応答して、前記アライン・プロセスの次の状態
と、アサート・シグナルと、アラインが達成されたか否
かを示すシグナルとを識別するシグナルを生成する手段
とを備えたことを特徴とするアライン制御装置。
【請求項１１】請求の範囲第９項において、前記判定手
段は、前記プロセッサからのアライン要求が一致したと
きレディシグナルを生成することを特徴とするアライン
制御装置。
【請求項１２】請求の範囲第11項において、前記判定手
段は、ルート論理セルと、複数のリーフ論理セルを定義する木
構造状に結合された複数の論理セルであって、複数の子
から入力シグナルを受信すると、その受信に応答して、
親に結合されている出力シグナルを生成する一致回路を
それぞれ含む論理セルと、予め定めた数のアライン状態回路からのアライン要求信
号を入力信号として有し、アサート・シグナルを出力シ
グナルとしてそれぞれ生成するリーフセルと、前記アサート・シグナルをルートセルに伝播する論理セ
ルと、前記全アライン状態制御回路に結合するためのレディ指
示を生成するレディ指示生成回路を含むルートセルとを備えたことを特徴とするアライン制御装置。
【請求項１３】請求の範囲第12項において、それぞれ、
クロックシグナルに応答して前記一致回路からの出力シ
グナルをラッチするラッチ回路であって、ルートセルに
向けて伝播されている前記アサート・シグナルを備えた
ラッチされた出力シグナルを生成するラッチ回路をさら
に含むことを特徴とするアライン制御装置。
【請求項１４】請求の範囲第12項において、前記論理セ
ルは、それぞれ、クロックシグナルに応答して親論理セ
ルからのレディ指示をラッチするラッチであって、ラッ
チされたレディ指示を子に伝送し、該レディ指示を、前
記ルート論理セルからリーフ論理セルに伝播するラッチ
を含むレディ指示分配回路をさらに含み、前記リーフ論
理セルは、前記ラッチによりラッチされたレディ指示
を、前記ラッチに結合されているアライン状態回路に伝
送することを特徴とするアライン制御装置。