JPH02210538A

JPH02210538A - 集積回路と演算処理システム

Info

Publication number: JPH02210538A
Application number: JP1261219A
Authority: JP
Inventors: Roger G Cox; ロジャー・ジー・コックス; Michael W Yeager; マイケル・ダブリュ・イエーガー; Lance L Flake; ランス・エル・フレイク
Original assignee: United Technologies Corp
Current assignee: RTX Corp
Priority date: 1988-10-05
Filing date: 1989-10-05
Publication date: 1990-08-21
Also published as: GB2224376A; DE3933171A1; GB8922234D0; FR2637397A1; US4996661A

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】［発明の目的］〈産業上の利用分野〉本発明は、特別の用途に使用される演算処理ユニットに
関し、浮動小数点数のための演算処理ユニットに関する
。

〈従来の技術〉従来、高性能なデジタル信号処理の適用には高速度で実
行される浮動小数点計算が必要である。

汎用ＣＰＵは実時間計算の実行に適していない。

従来より、浮動小数点計算に適した特別なチップを作る
ために様々な試みが行なわれている。このような装置の
１つとして、レイジオン・コーポレイション（Ｒａｙｔ
ｈｅｏｎ　Ｃｏｒｐｏｒａｔｉｏｎ）社のＲＡＭ　１０
０浮動小数点アキュムレータプロセッサがある。

固定小数点数のために設計された別の演算チップには、
米国特許出願箱０５６，６２７号明細書に開示されてい
るものがある。

〈発明が解決しようとする課題〉本発明の目的は、浮動小数点数に適した演算処理装置を
提供することにある。

［発明の構成］〈課題を解決するための手段〉本発明は、２個の３２ビツト乗算装置と３個のＡＬＵ　
（演算論理装置）とを有する特定の用途に適した演算集
積回路に関する。この装置の特徴は、パイプラインアー
キテクチャの形態にある。

本発明の別の特徴は、実行すべき演算だけでなく、チッ
プが実装されるシステムについても適当な多数の異なる
データ通路を有するように構成し得ることである。

本発明の更に別の特徴は、機能コードがチップに沿って
データと共にパイプライン化され、それにより従来のビ
ットスライス装置のバルキー制御構造が排除され、かつ
該チップをサイクル毎に再構成できることである。

本発明の他の特徴及び利点については、添付図面を参照
しつつ以下に好適実施例を用いて詳述する。

〈実施例〉第１図には、本発明の３２ビツトの実施例の高レベルブ
ロック図が示されている。データポートＣＳＤ、ＥＳＦ
は双方向性であり、かつポートＴ１Ｘは入力ポートであ
る。いずれのサイクルに於ても、ポートＣ，Ｄが入力ま
たは出力であり、かつポートＥ、Ｆが逆に出力または入
力である。内部入力ポートＲＳＳは多重系であり、デー
タの流れ方向に応じてバスＣ，Ｄの対を入力として、ま
たはバスＥ、Ｆの対を入力として選択する。これ以上の
情報については、ユナイテッドφチクノロシーズ・マイ
クロエレクトロニック・センター（Ｕｎｉｔｅｄ　Ｔｅ
ｃｈｎｏｌｏｇｉｅｓ　Ｍｌｃｒｏｅｌｅｃｔｒｏ口ｉ
ｃ　Ｃｅｎｔｅｒ）のｒＵＴ６９５Ｂ２　　ＩＱＭＡＣ
パイブラインドプロセッサ（Ｐｉｐｅｌｉｎｅｄ　Ｐｒ
ｏｃｅｓｓｏｒ　）　Ｊを参照されたい。

このチップの全体構成は、制御信号に応じて多数のデー
タ通路を設定し得る内部結合された入力レジスタとマル
チプレクサ（ＭＵＸＥＳ　）からなる入力部１１０と、
２個の浮動小数点乗算器と並列なのデータパイプセット
とを有しかつ第１ＡＬＵに接続された第１処理部３０と
、前記ＡＬＵからの入力と前記データパイプセット及び
一方の前記乗算器に接続されたマルチプレクサ１２０か
らの入力と出力部からくる２本のフィードバック通路２
４１．２４３からの入力とを有する第２マルチプレクサ
・レジスタセット１１５と、並列な２個のＡＬＵ１６２
．１６５と前記ＡＬＵ１６２．１６５の出力から１対の
バス２６２．２６４及び中間マルチプレクサセット１１
５への２本のフィードバック通路２４１．２４３に接続
された出力レジスタ・マルチプレクサセットとを有する
第２処理部１２０とを備える。

第１図の右側には、２組の機能線及び制御線が前記チッ
プの端子から制御ユニット１３２〜１４２からなる制御
ステーションセット１３０に入っている。関数信号及び
制御信号は各ブロックで復号されて本システムの異なる
段に制御信号を供給する。例えば制御ブロック１３０に
於て、信号が復号されてマルチプレクサ１１０の選択さ
れた１または２以上の入力バスを開き、かつ該入力バス
を乗算器１５０．１５５のいずれかに接続する。

制御ユニット１３４では、データ通路及び前記乗算器が
制御されて多数の異なる乗算演算のいずれかを実行する
。

前記チップの全体構成は、データが」二部に流れ込みか
つ多数の通路を通過して下部に移動するようになってい
る。符号３０で示される上部は、２個の乗算器１５０．
１５５とＡＬＵ１６０とを有する。これらの乗算器１５
０．１５５は、前記チップの２タロツクサイクルに於て
複素乗算を実行する。乗算器１５０．１５５はパイプラ
イン化されかつパイプラインレジスタによって２つの部
分に分割されていることにより、後からくるデータは前
記乗算器の２サイクルの走行時間を待つ必要なくして次
のサイクルに入ることができる。これらと同等のパイプ
ライン乗算器が、アナログ・デバイシズ（Ａｎａｌｏｇ
　Ｄｅｖｉｃｅｓ）社の１９８７年１０月イ寸アナログ
・デバイシズ・ＤＳＰ・プロダクツ・ハンドツ・ツク（
八ｎａｌｏｇ　Ｄｅｖｉｃｅｓ’ＤＳＰ　Ｐｒｏｄｕｃ
ｔｓｌｌａｎｄｂｏｏｋ）の第４〜５１頁に記載される
ＡＤＳＰ３２１１マルチプライア・チップ（Ｍｕｌ　ｔ
ｉｐｌ　１ｅｒＣｈｉｐ　）に開示されている。データ
は、第１クロックサイクルに於て上部レジスタからパイ
プラインレジスタに送られ、かつ更に第２クロックサイ
クルに於て出力レジスタに送られる。

前記チップが実行する複素乗算及び累算命令が表１に要
約されている。数字にイ」される星印は、その数が乗算
する前に共役化されていることを示す。複素結果は出力
ポートＹ、Ｚに現れる。第４図には乗算を行なうための
考えられる４個のデータ通路が示されており、システム
設計者にとってその要求に適合するように実行可能な直
列または並列の様々な形を示している。レーダ信号処理
から採用した表記方法によって、■　（同相）及びＱ（
矩象）が複素数の実成分と虚成分であり、従ってＡＩが
複索数Ａの実数部分であり、かつＡＱが虚数部分である
。実数は小文字で表示される。

また、前記チップは、高速フーリエ変換（ＦＦＴ）バタ
フライ演算のための特別な命令を実行する。ＦＦＴ命令
は両方のＡＬＵ１６２．１６５を使用して、前記チップ
がちょうど２サイクルでＦＦＴバタフライの２つの複素
加算を実行できるようにする。第５図は、これらの演算
に使用されるデータ通路を示している。第２の特別演算
は、複素数の大きさを２乗することであり、第６図はこ
れらの演算に使用されるデータ通路を示している。

特別な形の乗算には、２つの乗算が同時に行われるよう
にする双対乗算・加算がある。この型式の命令は、各ク
ロックサイクルについて双対乗算・加算命令を用いて４
つのクロックサイクルに於て２つの２行２列のマトリッ
クスを乗算するために使用されるシーケンスを示す第７
図に示されるように、マトリックスの乗算の速度を速く
する。

表３は、双対乗算・加算命令の変形を示しており、それ
にはアキュムレータのいくつかの乗算・加算命令の結果
を累積することが含まれる。このアキュムレータの使用
は、追加の積の項を合計しなければならない２行２列よ
り大きいマトリックスの乗算に於て有用である。

当業者であれば、これらの開示事項から本発明を適用し
て特別な仕事を実行することは容易である。コンピュー
タ・グラフィックスに応用する場合には、４行４列のマ
トリックスの拡張的使用が含まれ、かつチップ」二に係
数を記憶するためにマルチプレクサユニット１１０の乗
算器近傍に追加のレジスタ・制御線セットを設けると有
利である。

遅いメモリを使用した場合には、１個または２個のレジ
スタを１本または２本以−にの入力バスに接続して係数
を保持し、それによって該レジスタ内に記憶される係数
に使用されるデータがロードされかつ演算処理された後
に、新しい係数が記憶されかつ新しいデータセットが読
み込まれるようにすると好都合である。

４エレメントベクトルに４行４列のマトリックスを掛け
る場合には、上述した米国特許出願に於て詳述したよう
に、本発明の特徴を利用して各アキュムレータが同時に
循環する２つの部分和を有することができる。出力ベク
トルの４エレメントは、単一乗算・加算命令が使用され
た場合にそれぞれ４つの部分和項によって形成され、か
つ第７図に示される双対乗算・加算命令が使用された場
合に２つの部分和項によって形成される。成るエレメン
トを形成する４つの不完全相は、それぞれ同時にアキュ
ムレータ内に存在する。この特徴を利用して、都合の良
い順序で入力データを提供し、第７図に示される各２項
の計算結果をアキュムレータ内で循環する正しいエレメ
ント和に送ることができる。

本発明による回路は、該回路の下部に於て２項累算を実
行しつつ、回路上部に於て２項が乗算されかつ同時に加
算される双対乗算・加算命令を用いて、各出力エレメン
トが２連続クロックサイクル′？−竪虚Ｊ　する←うに
構成される。この場合に、牙）７・ノ　）□、イ］ｒ　
−−、−“パ１に関する如何なるデー　　り先にブロッ
クに入ることができ、かつ同？・に、他の項に行くデー
タはブロックに入ることができる。

別の実施例では、より好都合な場合には、１個のアキュ
ムレータと２個の下側ＡＬＵから形成される４個の「有
効」アキュムレータとの間で中間項を累算しつつ、異な
る出力項に貢献するデータを入力の流れにインタリーブ
することができる。

この場合に於て４行４列のマトリックスを使用するなら
ば、双対乗算・加算命令を使用する方法が好都合である
。第１サイクル０に於て、入力ベクトルからのエレメン
ト１．３にマトリックスからのエレメントＩＬ１Ｂがロ
ードされ、２つの積が加算され、かつ「偶数」サイクル
でいずれかのアキュムレータに記憶される。サイクル１
では、異なる入力数セットが同様に処理され、かつ「奇
数」サイクルでアキュムレータにロードされる。

次に、サイクル３に於て、残りの数、入力ベクトルのエ
レメント２．４及びマトリックスのエレメント１２．１
４が乗算され、２つの積が加算され、かつ最終結４（４
がアキュム；−夕に形成される。

表４は、双対実数乗算・累算（ＭＡＣ）関数の全ての組
合せを実行する９個の命令を示している。

これらの命令は、デバイスが多重チャネル実数有限イン
パルス応答デジタルフィルタを実行する際に有用である
。

表５には、ＡＬＵ１６２．１６５、出力バイブライン１
２０及びバス２４１．２４３を一体的に双対アキュムレ
ータとしてより柔軟に使用し得る累算命令が記載されて
いる。ＡＬＵ１６２、バス２４１、中間マルチプレクサ
１１５の部分及び出力バイブライン１２２を一体化して
Ｙアキュムレータが形成され、かつＡＬＵ１６５、バス
２４３、中間マルチプレクサ１１５の部分及び出力バイ
ブライン１２０を一体化してＺアキュムレータが形成さ
れる。これらＹアキュムレータ及びＺアキュムレータに
ついては表５を参照する。ＹアキュムレータまたはＺア
キュムレータは、別個に使用された場合にそれぞれ１ク
ロックサイクル毎にまたは奇数または偶数の２クロック
サイクル毎に実数を累算するために使用することができ
、かつ本願出願人による別個の米国特許出願に記載され
るように１個の物理的アキュムレータを共有する「有効
」アキュムレータ内で複素数を累算するために使用する
ことができる。

また、１サイクルで複素数の累算ができるようにＹアキ
ュムレータ及びＺアキュムレータ両方を用いることがで
きる。命令ＰＬＰＴ及びＡＤＤＰＴによって、上述した
米国特許明細書に開示されるように部分和レジスタの制
御及び部分和の加算が可能になる。後述するように、こ
れらのアキュムレータ命令は、パイプライン関数コード
を使用する第１図の各制御ユニット１３０によってサイ
クル毎に他の命令と結合される。

ここで使用される用語は、パイプラインサイクルＯがシ
ステムを通過する２つのサイクルのうちの第１サイクル
を意味する。前記システムの待ち時間は９クロックサイ
クルであり、従って、ＦＦＴ演算のサイクル０（パイプ
ラインサイクル０）は第９番目のクロックサイクル後に
結果の部分が出力ポートに現れるように前記システムの
各段を通過するために９クロックサイクルを要する。同
様に、入力データの第２セットが第１セット（パイプラ
インサイクル１）の後に１クロックサイクルで入り、最
終出力データは９クロックサイクル後に現れる。パイプ
ラインサイクル０が前記チップを通過する際にデータに
ついて異なる演算処理が実行されるが、これはデータが
前記チップのいずれの段にあるかと無関係にパイプライ
ンサイクル０と呼ぶ。

以下に、本発明により第１図のエレメントを用いて完全
ＦＦＴバタフライを２サイクルで計算する要領を説明す
る。ＦＦＴ計算は第１に複素乗算からなり、それに続い
て２つの複素加算が行なわれる。この実施例の場合に、
第５図に示されるようにＰＡＴＨモード＝００と仮定す
ることによって、サイクル０に於てＤＩがＣバスに入力
し、ＢＱがＤバスに入力し、ＷｌがＴバスに入力し、か
つＷＱがＸバスに入力する。サイクル１では、ＡＩが前
記チップのＣバスに入力されるのに対して、ＡＱがＤバ
スに到達する。複素乗算に関する式は、Ｐ　Ｉ　＝　（
Ｂ　Ｉ　ＸＷＩ）−（ＢＱＸＷＱ）と、ＰＱ＝　（Ｂ　
Ｉ　ｘＷＱ）＋　（ＢＱｘＷＩ）とである。バタフライ
加算式は次の通りである。即ち、ＡＩ’＝ＡＩ＋ＢＩ、
ＡＱ’　＝ＡＱ＋ＢＱ、ＢＩ’　＝ＡＩ−ＰＩ、及びＢ
Ｑ’　＝ＡＱ−ＰＱである。

サイクル０に於て、乗算器及びＡＬＵ１６０はＰＩを以
下のように計算する。ＢＩがバス２２０に、ＷＩがバス
２２４に、ＢＱがバス２２６に、ＷＱがバス２２８にそ
れぞれ供給される。次に、乗算器１５０．１５５が２つ
の実数積を計算する。

第１の実数積がバス２３１を通ってＡＬＵ１６０の入力
Ａに送られ、かつ第２の実数積がバス２３０からマルチ
プレクサ１２５を通ってバス２３４からＡＬＵ１６０の
入力Ｂに送られる。上述した実数積がＡＬＵ１５０に到
達するのと同じサイクルで制御信号がバス４０４に送ら
れてＡＬＵに減算Ａ−Ｂを実行するように指令し、それ
によって実数積ＰＩがバス２３８に接続されたＡＬＵ１
６０の出力に発生するように、パイプライン化された各
段１３２．１３４．１３６によって同期化させて制御が
行なわれる。

同様にして、サイクル１に於て、ＢＱがバス２２２に、
ＷＩがバス２２４に、ＢＩがバス２２６に、ＷＱがバス
２２８にそれぞれ供給される。次に、乗算器１５０．１
５５が２つの虚数積を計算する。第１の虚数積がバス２
３１を介してＡＬＵ１６０の入力Ａに送られ、かつ第２
の虚数積がバス２３０からマルチプレクサ１２５を通過
してバス２３４からＡＬＵ１６０の入力Ｂに送られる。

サイクル１の制御は同様にして同期化され、上述した虚
数積がＡＬＵ１６０の入力Ａ、Ｂに到達するのと同じサ
イクルに於て、制御信号がバス４０４に到達してＡＬＵ
加算を実行するように指令し、バス２３８にＰＱを発生
させる。

これらの演算が行われていると同時期に、入力バイブラ
イン１１０、データパイプ１２７及びマルチプレクサ１
２５が対応するＡＩ値を、実数ＰＩ値がバス２３８に現
れると同時に到達するように乗算器を通過させることに
よってバス２３６に転送する。次に、中間マルチプレク
サ１１５がＡＩ値及びＰＩ値をその出力へ送ることによ
って、ＡＩが両バス２４２．２４６に、及びＰＩが両バ
ス２４４．２４８にそれぞれ現れる。パイプライン制御
構造１３６．１３８の特性から、加算を実行するように
ＡＬＵ１６２を命令する制御信号がバス４０７に到達す
ると同時に、バス４０６がＡＬＵ１６５にＢ−Ａの減算
を実行するように命令する。その結果、パイプラインサ
イクル０について、バス２４７の出力にＡＩ’が含まれ
、かつバス２４９の出力にＢＩ’が含まれる。パイプラ
インサイクル１では、ＡＱの値が入力バイブライン１１
０、データパイプ１２７及びマルチプレクサ１２５を介
して送られて、虚数値ＰＱがバス２３８に現れると同時
にバス２３６に到達するように制御が行なわれる。

同様にして、ＡＬＵ１６２に加算が命令されるのに対し
てＡＬＵ１６５はＢ−Ａの減算を実行するように命令さ
れ、その結果、パイプライン化された結果ＡＱ’がバス
２４７に、かつＢＱ’がバス２４９にそれぞれ現れる。

第２処理部１２０の出力バイブライン及びマルチプレク
サは、最終的にパイプラインサイクル０に於てＥバスが
Ｂｌ’出力を伝送し、かつＦバスがＢＱ’出力を伝送す
るように出力を構成する。パイプラインサイクル１では
、ＥバスがＡＩ’の結果を伝送し、かつＦバスがＡＱ’
の結果を伝送する。マルチプレクサの演算が表７、表８
及び第１１図、第１２図に示されている。

次に、ＲＴＡＡＳＸ命令の場合に本発明の各エレメント
を使用して双対実数乗算及び累算命令を実行する要領を
説明する。この命令によってＣバス及びＴバスにデータ
の積が発生してＥ出力に送られ、かつ同時に、Ｄバス及
びＸバスにデータの積が発生し、Ｚアキュムレータの値
に加算されてその合計値がＦ出力に送られる。入力バイ
ブライン／マルチプレクサからなる入力部１１０は、バ
ス２１２からＣデータを受け取ってバス２２２に送り、
バス２１６からＴデータを受け取ってバス２２４に送り
、バス２２４からＤデータを受け取ってバス２２６に送
り、かつＸデータをバス２２８に送る。次に、上述した
データは乗算器１５０．１５５によって乗算され、積Ｃ
Ｔがバス２３１に、かつ積ＤＸがバス２３０にそれぞれ
発生する。

ＲＴＡＡＳＸの命令コードは、積ＣＴを入力Ａから出力
バス２３８に全く変更することなく送るようにＡＬＵ１
６０が命令されるように、制御ユニット１３２．１３４
．１３６を介して同時にパイプライン化される。同様に
、マルチプレクサ１２５は積ＤＸをバス２３０からバス
２３６へ送る。

制御ユニット１３８に於てパイプライン制御の復号オペ
レーションが続いているので、中間マルチプレクサ１１
５は積ＣＴをバス２４２に通過させ、積ＤＸをバス２４
６に、かつバス２４３のＺアキュムレータ値をバス２４
８に通過させるように命令される。パイプラインオペレ
ーションが続いているので、制御ユニット１４０はバス
４０７を介してＡＬＵ１６２に対して結果ＣＴを含む入
力Ａをバス２４７に通過させるように命令し、かつＡＬ
Ｕ１６５に対してバス４０６を介して加算を実行させ、
それによってＺアキュムレータにＤＸ値を加えたものが
バス２４９に現れるようにする。

更に、制御ユニット１４２と出カニニット１２０とがパ
イプライン結果ＣＴをＥバスに送り、かつＺアキュムレ
ータとＤＸの合計値をＦバスに送る。

次の実施例では、本発明のエレメントを用いてＲＴＡＳ
ＸまたはＡＲＴＡＳＸ命令のような双対乗算・加算形式
の命令を実行する要領を説明する。

これら２つの命令は、ＲＴＡＳＸがＹアキュムレータを
使用しないのに対して、ＡＲＴＡＳＸが双対乗算・加算
の結果をＹアキュムレータの既存値に加算し、かつその
結果を更に累算するためにＹアキュムレータに記憶する
点を除いて同一である。

これが唯一の相違点であることから、２つの命令は２個
の乗算器１５０．１５５及びＡＬＵ１６０によって同様
に処理される。

乗算器１５０は、バス２２２のＣデータとバス２２４の
Ｔデータとを受け取り、かつ双対実数乗算命令に於て上
述したように、結果ＣＴをバス２３１に送る。乗算器１
５５はバス２２６でＤデータをかつバス２２８でＸデー
タを受け取り、かつ上述したように結果ＤＸをバス２３
０へ送る。パイプラインのこの位置に於て、制御ユニッ
ト１３４はマルチプレクサ１２５に命令してバス２３０
の積ＤＸをバス２３４に送らせる。これによって、ＡＬ
Ｕ１６０は２つの積を加算しかつその合計値をバス２３
８に送ることができる。合計値ＣＴ＋ＤＸは、次に中間
マルチプレクサ１１５によって制御ユニット１３８の制
御下でバス２３８からバス２４２に送られる。

ＡＲＴＡＳＸ命令のように累算処理を選択できる命令の
場合には、制御ユニット１３８は、Ｙアキュムレータ値
を含むバス２４１をバス２４４、即ちＡＬＵ１６２の入
力Ｂに指向させる。次に、制御ユニット１４０は命令を
復号し、かつその命令に基づいてＡＬＵ１６２への指令
を発生する。

命令がＲＴＡＳＸの場合には、バス４０７に於ける指令
は単に結果ＣＴ＋ＤＸを含む入力Ａをバス２４７に通過
させることである。命令がＡＲＴＡＳＸの場合には、制
御ユニット１４０がＡＬＵＩ６２に入力Ａと入力Ｂとを
加算させる指令をバス４０７に発生する。この場合に、
バス２４７にはＣＴ＋ＤＸ＋Ｙアキュムレータの合計値
が含まれる。更に、制御ユニット１４２及び出力バイブ
ライン１２０が、パイプライン結果をバス２４７から出
力Ｅへ送る。

」二連したように、本発明の特徴の１つは、第１図に示
されるようなパイプライン制御構造１３０にある。この
構造は、データがチップの中を流れるのと同じ割合で機
能コードをチップ内をパイプラインで送る。このパイプ
ライン構造の利点は、パイプラインでない従来の制御構
造に於て要求されるように、命令コードが変わる毎に全
てのデータパイプラインを空にする必要なく命令が結合
されるようにサイクル毎に命令コードを変更できる点に
ある。

上述したように、本発明の別の特徴の１つは、デバイス
が複素数を処理する際に多数のデータ通路に適合するよ
うに形成し得る点である。本発明は、６個の入力オペラ
ンドと２個のＦＦＴパフライ計算計算−を転送するため
に、第５図に示、れる３つのプログラム可能な通路モー
ドを有する。

従来のＦＦＴデバイスは、システムを設計する際に処理
チップとシステムメモリとの間でこの複素データを転送
するために単一の固定された構成を使用せざるを得なか
った。様々な方法でデータ転送を構成できるので、本発
明を用いて様々なシステムアーキテクチャを構成するこ
とができる。

例えば、第２図はＦＦＴ計算のためのＲＡＭベースのメ
モリ装置を示している。この場合、通路モードは、第５
図のオプション００について、添字Ｉを付した実数デー
タが一方のバスにかつ添字Ｑを付した複素データが他方
のバスに現れるように、複素数を処理するように各バス
対が構成されるようにプログラムされる。２メモリサイ
クルがバタフライ毎に要求され、第１サイクルで複素オ
ペランドＢが入って結果が出て行き、かつ第２サイクル
でオペランドＡが入りかつ結果が出て行く。

これは、アドレスジェネレータが簡単に実数データワー
ド及び複素データワード双方を含む、−のメモリ場所を
向くことができるので、ＲＡＭ型システムにとって好都
合な構成である。

別の設計によるＦＦＴシステムは、第３図に示されるＦ
ＩＦＯベースのメモリシステムである。

このシステムは第５図の通路０１の形状を使用しており
、各バスが実数データ及び虚数データを入３つ力及び出力双方について交互サイクルで転送するように
、バスが各複素オペランドについて構成されている。こ
の構成は、第３図に示すような定数幾何（ｃｏｎｓｔａ
ｎｔ−ｇｅｏｍｅｔｒｙ　）アルゴリズムを使用する信
号の流れ図にデータバスの構成を適合させなければなら
ない多くの場合に好都合である。このような構成によっ
て、データメモリのためのアドレスジェネレータを設け
る必要が排除される。

このシーケンスについて詳細に説明する前に、第１図の
パイプライン構造について更に説明を加えることにする
。入力バイブライン１００及び制御ユニット１３２は、
それぞれ２段階のパイプラインレジスタを備える。これ
は、バスＣに於けるデータワードが２クロックサイクル
後までバス２２２または２２６に現れないことを意味す
る。同様に、バス４２０に於ける命令関数コードが２サ
イクル後までバス４２２に現ｔ′ｌない。乗算器１５０
．１５５は、制御ユニット１３４と同様にそれぞれ３段
階のパイプラインレジスタを有し、それによって乗算器
１５０の出力即ちバス２３１は、３サイクル先にバス２
２２．２２４に供給される・入力に基づく積を運ぶ。同
様に、制御ユニット１３４を介してバス４２２からバス
４２４にパイプライン化される関数コードには３サイク
ルの遅れがある。残りのデータブロック即ちＡＬＵ１６
０、中間パイプライン１１５、及びＡＬＵ１６２．１６
５は全てルベルのパイプラインレジスタを備えており、
それによって各モジュールの入力バスからその出力バス
までに１クロックサイクルの遅れがある。各制御ユニッ
ト１３６．１３８．１４０．１４２はそれぞれ同様に１
個のレジスタを備えており、それによって各レベルに於
て各制御信号が対応する入力データと同じサイクルでデ
ータブロックに到達する。

上述した全パイプラインレジスタの結果は、入力データ
及び関数コードがチップの入力に送られてから９サイク
ル後に該チップの出力に現れる。

当業者であれば、異なる数のパイプラインレジスタによ
って容易に他のデバイスを案出することができる。

入力と出力との間の接続が表６乃至表８及び第１０図乃
至第１２図に要約されている。各表に於ける数は、接続
するために要求されるクロックサイクルの数であり、Ｘ
は直接接続を、−一は接続が不可能であることをそれぞ
れ示している。２つの数は２つの異なる通路の結果を示
している。入力部１１０を簡単化した線図が第１０図に
示され、３レベルのレジスタ９２０．９５０．９６０が
表わされている。当業者であれば、その要求に適合させ
て類似のマルチプレクサ／レジスタの構成を容易に考え
出すことができる。第１１図及び第１２図には、それぞ
れユニット１１５及びユニット１２１について類似の線
図が示されている。

第４図に示されるシーケンスに於ては、タイミングが異
なるデータ通路の構成によって調整されることが明かで
ある。例えば、通路０１．１０．１１に於て、入力デー
タが人カニニット内の段をバイパスすることにより、４
つの数がサイクル０に於て乗算器に提供される。また、
複素乗算の場合には、実数項及び虚数項が連続サイクル
に於てＡＬＵ１６０から中間マルチプレクサユニット１
１５に通過する。サイクル０でデータを出力に送るため
に、より遅いデータが出力レジスタセット１２０の１段
をバイパスする。この出力レジスタセラ１−１２０の通
常の待ち時間は、複素乗算及び他の命令によってより後
のデータがパイプラインレジスタレベルを通過すること
により、全ての出力がサイクル０に於て同時に出力ポー
トに送られる以外のサイクルである。別の実施例では、
中間マルチプレクサセットに於て時間のシフトを行うこ
とができる。

より従来の型式に近いＲＡＭベースのＦＦＴシステムが
第２図に示されている。このシステム設計では、対応す
る表９に於てＣ，Ｄ及びＥ、Ｆでそれぞれ表されるメモ
リ３２０．３４０として記載された２個のＲＡＭバンク
が使用されている。

第３のメモリ３３０がＦＦＴ係数を保持する。各メモリ
は、例えばアドバンスト・マイクロ・デバイシズ（八ｄ
ｖａｎｃｅｄ　Ｍｉｃｒｏ　Ｄｅｖｌｃｅｓ）の２９５
４０型のような市販されているアドレスジェネレータに
よってアドレスされる。アドレスジェネレータ３１０が
ＲＡＭ　（ランＲＡＭアクセスメモリ）３２０を操作し
、アドレスジェネレータ３５０がＲＡＭ−３４０を操作
し、かつアドレスジェネレータ３１２がメモリ３３０を
操作する。

２本のバス２１２．２１４がＲＡＭ３２Ｑをプロセッサ
に接続し、かつこれらはデータをメモリからまたはメモ
リへ転送できるように双方向性である。これらの双方向
バスは第１図に示される３状態データバツフア１７０．
１７２．１７４．１７６を用いてチップ」二で実行され
る。バス２１２．２１４（Ｃバス及びＤバス）をチップ
への入力として使用する場合、出力バッファ１７０．１
７２がオフになりかつバッファ１７４．１７６がオンと
なって、出力データがバス２６２からバッファ１７４を
介してバス２０２（Ｅバス）に流れ、かつデータがバス
出力２６４からバッファ１７６を介してバス２０４　（
Ｆバス）に流れる。データの向きが逆になると、バス２
０２．２０４が入力バスとなり、かつバッファ１７４．
１７６がオフとなるのに対して、バッファ１７０．１７
２がオンになる。この場合、出力バス２６２からのデー
タはバッファ１７０を介してバス２１２に流れ、かつバ
ス２６４からのデータがバッファ１７２を介してバス２
１４に流れる。

データの流れの向きに応じて、第１０図に示されるよう
なマルチプレクサ及びレジスタからなる入力部１１０の
マルチプレクサ９２２．９２４が選択されて、入力デー
タのためにその時点で構成されているバスから入力デー
タがレジスタ９１０．９１２即ちＲレジスタ及びＳレジ
スタに入るようにする。バス２０２．２０４は前記プロ
セッサをＲＡＭ３４０に接続し、かつ双方向性である。

制御装置５３０は、様々なユニットに適当な制御信号を
送る有限状態機械、ＣＰＵまたは他の従来装置を表して
いる。

表９は、８ポイントのＦＦＴについて第２図のシステム
のための計算シーケンスを示している。

使用されるアルゴリズムは、１９７５年プレンティス・
ホール（Ｐｒｅｎｔｉｃｅ−Ｈａｌｌ　）発行のラビナ
ー（Ｒａｂｉｎｅｒ　）及びゴールド（Ｇｏｌｄ）によ
る「セオリー・アンド・アプリケイジョン・オブ・シグ
ナル・プロセッシングｊ　　（Ｔｈｅｏｒｙ　ａｎｄ　
Ａｐｐｌｉｃａｔｉｏｎｏｆ　Ｓｉｇｎａｌ　Ｐｒｏｃ
ｅｓｓｉｎｇ　）の第３６２頁に示されているような時
間アルゴリズムに於ける従来の１０進法である。このア
ルゴリズムの流れ図が第８図に示されている。

第８図及び第９図は、ＦＦＴアルゴリズムの計算シーケ
ンスを詳細に示す流れ図である。各黒点は複素データワ
ードの記憶場所を表している。左側の縦の行は、時系列
の入力データＴＯ乃至Ｔ７を表わしている。内側の２列
のデータム５乃至Ａ１２及びＢ５乃至Ｂ１２が中間結果
を表しているのに対して、最後の列ＦＯ乃至Ｆ７が周波
数領域出力データを表している。各十字形交差は、左側
からの入力として２つの複素データワード（Ａ及びＢ）
を必要とし、かつ右側に２つの複素結果（Ａ’及びＢ’
　）を発生させる１個のＦＦＴバタフライを表している
。各バタフライには、その頂点に計算シーケンスを表す
数が表示されている。

また、各バタフライは、下側入力の足にＷ値を有する。

このＷ値はＢ入力の複素乗算に関連する三角係数である
。Ｂ′比出力、バタフライの十字形交差の下側右側の足
である。この流れ図に関する詳細な説明は、上述したラ
ビナー及びゴールドの著書の第３５９頁を参照されたい
。

バス毎に４つ即ち全部で１２のＦＦＴバタフライが必要
である。第１パス（サイクル１〜１７）に於て、ＴＯ〜
Ｔ７で示される複素時間データがＲＡＭ３２０からサイ
クル１乃至８で第１の４つのバタフライについて前記プ
ロセッサに読み込まれる。サイクル１０乃至１７に於て
、データがＲＡＭ３４０に書き込まれる。そして、サイ
クル１８で始まる次のバスに於て、データバスの向きが
反転される。ここで、データがＲＡＭ３４０から読み出
され、かつデータがプロセッサからＲＡＭ３２０に書き
込まれる。サイクル１８乃至１８に於てデータがＲＡＭ
３４０から読み出されるのに対して、サイクル２７乃至
３４に於てはバタフライの結果がＲＡＭ３２０に書き込
まれる。再び、サイクル３５に於てバスの向きが逆転さ
れ、かつ第３のバスが開始する。サイクル３５乃至４２
に於て、データがＲＡＭ３２０からプロセッサに読み込
まれ、かつその結果データがサイクル４４乃至５１に於
てプロセッサからＲＡＭ３４０に書き込まれる。

本発明のパイプラインによって、データがプロセッサに
読み込まれてから書き出されるまでに９サイクルの遅れ
が常にある。より大きなサイズのＦＦＴ計算については
、バスの向きが変更された後の最初の９サイクルとバス
の向きが変更される前の９サイクルとを除いて、ＲＡＭ
への読み出し及び書き込みが同時に行われる点に注意す
べきである。本発明は、ノルデン・システム（Ｎｏｒｄ
ｅｎ　Ｓｙｓｔｅｍｓ）からのＣＡＰＥチップに基き、
２つのＲＡＭブロック間に同一の双方向バス転送機構を
使用するが、２サイクルのみについてＦ′ＦＴバタフラ
イを実行しかっＣＡＰＥの固定小数点計算より正確な浮
動小数点結果を発生する上述した米国特許出願の改良で
ある。ＣＡＰＥプロセッサには、前記バタフライを行う
ために４メモリサイクル及びクロックサイクルが必要で
あった。

表１０は、第９図に示される定数幾何ＦＦＴアルゴリズ
ムに於ける８ポイント１０進法の計算シーケンスを示し
ている。このアルゴリズムは、第３図に示されるＦＩＦ
Ｏシステムの構成に適している。ＦＩＦＯは先入れ先出
しメモリを意味する。

ＦＩＦＯメモリは、少くとも１個のワードがメモリ内に
既に記憶されている場合には、同時に読み取りかつ書き
込むことができる。定数幾何アルゴリズムについては、
上述した信号処理に関する著書の第５７６頁に記載され
ている。

４個のＦＩＦＯは、それぞれユニット５２０の制御下に
於て、他（７：）ＦＩＦＯから独立して読み取りまたは
書き込むように指示される。第３図に示すように、Ｐ　
Ｉ　ＦＯ５００は、その入力が前記プロセッサの出力バ
ス２０２であり、かつ前記プロセッサのＣ入力バスであ
るバス２１２を駆動するように接続されている。また、
Ｐ　Ｉ　ＦＯ５０２は、バス２０２から入力を受け取り
、かつワードを読むことが要求される際に前記プロセッ
サのＤ入力バス２１４を駆動する。ブロック５２０は、
アルゴリズムによって要求されるようにＦＩＦＯに各サ
イクルで読み出しまたは書き込みを行わせる適当な信号
を送る状態機械、ＣＰＵまたは他の装置を表す。Ｐ　Ｉ
　ＦＯ５０４は前記プロセッサの出力パス２０４に接続
されて入力を受け取り、かっこのＦＩＦＯの出力は、ワ
ードを読むことが要求される際にＣ入力バスを駆動する
。また、ＦＩＦＯ５０６はバス２０４からデータを受け
取り、がっ要求されるとデータをバス２１４に送る。Ｆ
ＩＦＯは、常に連続的にデータを読み出しかつ書き込む
ので、定数幾何ＦＦＴアルゴリズムに於てデータを記憶
するのに適している。

初期データは、データ点Ｔ４、Ｔ６に於てＦＩＦＯ５０
０に記憶され、かつ実数データ及び虚数データがそれぞ
れ記憶される。これらは４ワードは、順に読み出されて
、最初の４サイクルに於て表１０に示されるようにＣパ
ス（バス２１２）に現れる。同様にして、Ｐ　Ｉ　ＦＯ
５０２は最初にバスＤ（バス２１４）にロードされるＴ
Ｏ，Ｔ２を保持し、かつＰ　Ｉ　ＦＯ５０４は最初にバ
ス２１２にロードされるＴ５及びＴ７を保持し、かつＦ
ＩＦＯ５０６はバス２１４にロードされるＴ３及びＴ１
を保持する。最初の４サイクルはＰ　Ｉ　ＦＯ５００，
５０２から読み出して最初の２つのバタフライについて
前記プロセッサにデータを供給する。

次の２つのバターｙ−ｙイは、Ｆ　Ｉ　ＦＯ５０４，５
゜６から入力データを得る。サイクル１ｏに於て、最初
のバタフライの結果がバス２０２．２０４のパイプライ
ン出力に現われ、かっＦ　Ｉ　ＦＯ５０２，５０４に書
き込まれる。

プロセスは続けられるが、このシステムではバスの方向
が決して変化しないので、バタフライ４の結果がメモリ
に書き込まれる前にバタフライ５の計算を開始すること
ができる。バタフライ５は、Ａ６Ｉがサイクル１４でＦ
　Ｉ　ＦＯ５０６１：書き込まれるので、サイクル１５
で始めることができる。

第２パスの第１バタフライであるバタフライ５は、第１
バスから書き込まれる最後のバタフライであ５するバタフライ４の結果の前に始めることができるので、
サイクル１０．１６．１７について読み出しサイクルと
書き込みサイクルとが同時に行われる。バタフライ８の
結果が書き出される前にバタフライ９が始まるサイクル
２９．３０．３１に於て第３バスが開始する際に、同様
の状態が生じる。

一般に、より大きなサイズのＦＦＴ計算については、計
算の第１パスの一番最初の９サイクル及び最後のバスの
一番最後の９サイクルを除いて全てのサイクルに於て読
み出しサイクルと書き込みサイクルとが重複する。

当業者にとって明かなように、本発明によるデータ通路
は、演算のシーケンスに於てデータ通路が変化する時ま
たは点が重要であるという意味に於て時間成分を有する
。上述したＲＡＭベースの実施例では、データの流れの
向きが反転される前にデータ通路内のデータが「追い出
される」ことが重要である。ＦＩＦＯベースのシステム
では、データがループ状に循環しているので、この遅れ
が排除される。上述の実施例は、各バスに係数を変えて
同じ式を適応するフーリエ変換に関するものであるが、
実行される算術演算がバスによって異なるような本発明
を利用した例えば関数のたたみこみ（ｃｏｎｖｏｌｕｔ
ｉｏｎ　）のような他の算術順序が考えられる。

また、本発明は上述した特定の実施例に限定されるもの
ではなく、その技術的範囲内に於て様々な変形・変更を
加えて実施することができる。例えば、当業者であれば
、第２図及び第３図の係数メモリのように再使用される
べきデータまたは係数をチップ上に記憶するという特徴
を付加することができる。また、ＲＡＭ３２０，３４０
には、入出力データの転送を容易にするためにデュアル
ポート型のＲＡＭを使用することができる。同様に、Ｆ
　Ｉ　ＦＯ５００〜５０４は適当なポートを有する２個
または唯１個のメモリユニットとすることができる。ま
た、別の実施例では、ＲＡＭ３２０．３４０をアドレス
ジェネレータ３１０．３５０と共に両方のメモリバンク
を収容する１個のユニットに一体化することができる。

名称ＣＭＵＬＭＵＬＪＡＭＵＬＪＢＭＭＡＭＡＪＡＭＡＪＢＣＭＳＭＳＪＡＣＭＳ　Ｊ　ＢＭＵＬＭＵＬＪＡＭＭＡＭＭＡ　Ｊ　ＡＣＭＳＭＳＪＡ表１複素乗算／累算命令関　　数ＡＸＢ−＋ＣＡ＊ＸＢ−ＣＡＸＢ＊→Ｃ（ＡＸＢ）　＋Ａｃ　ｃ−＋Ａｃ　ｃ、　Ｃ（Ａ＊ｘＢ
）　＋Ａｃ　ｃ−＋Ａｃ　ｃ、Ｃ（ＡＸＢ＊）　＋Ａｃ
　Ｃ＋ＡＣＣ，Ｃ（ＡｘＢ）　−Ａｃ　ｃ→Ａｃ　ｃ、
　Ｃ（Ａ＊ＸＢ）　−ＡＣＣ＋ＡＣＣ，Ｃ（ＡｘＢ＊）　−ＡＣＣ−Ａｃ　ｃ、　ＣＡＸｂ−＋ＣＡＸｂ−＋Ｃ（Ａｘｂ）　＋Ａｃ　ｃ−＋Ａｃ　ｃ、　Ｃ（Ａ＊ｘｂ
）　＋Ａｃｃ→Ａｃｃ、Ｃ（Ａｘｂ）　−ＡＣＣ＋Ａｃ　ｃ、　Ｃ（Ａ＊ｘＢ）　
−Ａｃ　ｃ＋Ａｃ　Ｃ，Ｃ名称ＦＦＴＦＦＴＦＦＴ４ＡＧＳＱ表２ＦＦＴ及び大きさの２乗命令関　　数フォワードＤＩＴバタフライインバースＤＩＴバタフライインバースＲａｄｉｘ−４Ｄ　Ｉ　Ｔ（ＡＩｘＡＩ）＋　（ＡＱｘＡＱ） →　Ｃ（Ａ　Ｉ　ＸＡ　Ｉ）　＋（ＡＱＸＡＱ）＋Ａｃｃ　　
　−＋Ａｃｃ、ＣＡＧＳＱＡ表３双対乗算・加算命令名称　　　　関　数ＲＴＡＳＸ　　　　（ＲｘＴ）　＋（ＳｘＸ）→ＡＣＣ
１ＹＩＮＲＴＡＳＸ　　−（ＲｘＴ）　＋　（ＳｘＸ）→ＡＣ
Ｃ１Ｙ。

ＲＴＳＳＸ　　　（ＲｘＴ）　−（ＳｘＸ）→Ａｃｃ、
Ｙ。

ＮＲＴＳＳＸ　　−（ＲＸＴ）　−（ＳＸＸ）→Ａｃｃ
、Ｙ。

ＡＲＴＡＳＸ　　（ＲｘＴ）　＋　（ＳｘＸ）＋ＡＣＣ
→Ａｃｃ、Ｙ。

ＡＮＲＴＡＳＸ　−（ＲＸＴ）　＋　（ＳＸＸ）＋Ａ　
ｃ　ｃ−＋Ａ　ｃ　ｃ、　Ｙ。

ＡＲＴＳＳＸ　　（ＲＸＴ）　−（ＳＸＸ）＋ＡＣＣ→
Ａｃｅ、、Ｙ。

ＡＮＲＴＳＳＸ　−（ＲｘＴ）　−（ＳｘＸ）＋ＡＣＣ
→Ａｃｅ、Ｙ。

名称ＴＳＸ表４双対実数ＭＡＣ命令機　　　　能（ＲＸＴ）　　　　　　　　−＋Ｙａ　ｃ　ｃ、Ｙ（Ｓ
ＸＸ）　　　　　　　　−＋Ｚａｃｃ、　　ＺＴＡＡＳ
Ｘ（ＲＸＴ）　　　　　　　　−＋Ｙａｃｃ、Ｙ（’５Ｘ
Ｘ）＋Ｚａｃｃ−＋Ｚａｃｃ、ＺＴＡＳＳＸ（ＲＸＴ）　　　　　　　　−＋Ｙａｃｃ、Ｙ（ＳＸＸ
）　　−Ｚａｃｃ−＋Ｚａｃｃ、　　ＺＡＲＴＳＸ（ＲＸＴ）＋Ｙａ　ｃ　ｃ−＋Ｙａ　ｃ　ｃ、Ｙ（ＳＸ
Ｘ）　　　　　　　　−＋Ｚａｃｃ、　　ＺＡＡＲＴＡ
ＡＳＸ（ＲＸＴ）＋Ｙａ　ｃ　ｃ−＋Ｙａ　ｃ　ｃ、Ｙ（ｓｘ
ｘ）＋Ｚａｃｃ−＋Ｚａｃｃ、　　ＺＡＡＲＴＡＳＳＸ（ＲｘＴ）　十Ｙａｃ　ｃ−＋Ｙａｃ　ｃ、Ｙ（ＳＸＸ
）ＡＳＲＴＳＸ（ＲＸ　Ｔ）（ＳｘＸ）ＡＳＲＴＡＡＳＸ（ＲＸ　Ｔ）（ＳｘＸ）ＡＳＲＴＡＳＳＸ（ＲＸ　Ｔ）（ＳｘＸ） −Ｚａ　ｃ　ｃ−＋Ｚａ　ｃ　ｃ。

Ｙａｃｃ−＋Ｙａｃｃ。

→Ｚａｃｃ。

Ｙａｃｃ−＋Ｙａｃｃ。

十Ｚａｃｃ−＋ＺａｃＣ。

Ｙａ　ｃ　ｃ−＋Ｙａ　ｃ　ｃ、ＹＺａｃｃ−＋Ｚａｃｃ、　　Ｚ表５累算命令名称　　　機　能ＬＲ８Ｒ−＋Ｙａｃｃ、　Ｙ；　Ｓ−＋ＺａｃｃＬＴＸＴ−＋Ｙａｃｃ、Ｙ；　Ｘ−＋Ｚａｃｃ。

ＬＲＲ−＋Ｙａ　ｃ　ｃ、　Ｙ　；　Ｒ−＋Ｚ　ａ　ｃ　ｃ
。

ＬＳＳ−＋Ｙａｃｃ、Ｙ；　Ｓ−＋Ｚａｃｃ。

ＬＴＴ−＋Ｙａｃｃ、Ｙ；　Ｔ−＋Ｚａｃｃ。

ＬＸＸ−＋Ｙａ　ｃ　ｃ、　Ｙ　；　Ｘ−＋Ｚ　ａ　ｃ　ｃ
。

ＬＯＯ−＋Ｚａｃｃ、Ｙ；　Ｏ−＋ＺａｃｃＰＬＰＴ　　　
　部分和プリロードＤＤＲ８ＵＢＲ３ＤＤＲＵＢＲＤＤＳＵＢＳＤＤＰＴＲ＋Ｙａ　ｃ　ｃ−＋Ｙａ　ｃ　ｃ。

Ｓ＋Ｚａｃｃ−＋Ｚａｃｃ。

Ｒ−Ｙａ　ｃ　ｃ−＋Ｙａ　ｃ　ｃ。

５−Ｙａ　ｃ　ｃ−”Ｚａ　ｃ　ｃ。

Ｒ＋Ｙａ　ｃ　ｃ−＋Ｙａ　ｃ　ｃ。

Ｒ＋Ｚ　ａ　ＣＣ＋Ｚ　ａ　ｃ　ｃ。

Ｒ−Ｙａ　ｃ　ｃ−＊Ｙａ　ｃ　ｃ。

Ｒ−Ｚ　ａ　ｃ　ｃ−＊Ｚ　ａ　ｃ　ｃ。

Ｓ＋Ｙａｃｃ→Ｙａｃｃ。

Ｓ＋Ｚａｃｃ−＋Ｚａｃｃ。

５−Ｙａ　ｃ　ｃ−＋Ｙａ　ｃ　ｃ。

５−Ｚａｃｃ−＋Ｚａｃｃ。

部分和加算表６人カバイブライン＋マルチプレクサ・モジュール１１６
　の接続入力バス　２１２　２１４　２１６　２１８出
力バス２２９　　　　　　　　　−−１　　また１ま　２　　
　　２２２６　　　　１または　２　　　　　２２２８
　　　　　　　　　−−１　または　２　　　　２　　
１　または　２表７中間パイプライン＋マルチプレクサ書モジュール１１５
の接続入力バス　２４１　２３８　２３６　２４３出力
バス２４４　　　　　　Ｘ−−１１２４８−−−−ＩＸまたは　１表８出カバイブライン＋マルチプレクサ・モジュール１２０
の接Ｉ入カバス　　　　２４７　　　　　２４９出力バ
ス２６２　　　　　　　　　　１または　２または　３　
　　　　　　２２６４　　　　　　　　　　１または　
２　　　　　　　　１または　２Ｗ２＋ＷＯＱ２ＱＷＯＱ２Ｑ７Ｑ５Ｑ５Ｑ６Ｑ６Ｑ７Ｑ７Ｑ８Ｑ八８ＱｌｌｌＩＯＩｌｌｌＢＩＩＱ　− ９Ｑ１２Ｑ　− ＢＩＯＱ　− ＢＩＩＱ　− ９Ｑ１２Ｑ　− ＢＩＯＱ　− Ｂ１０　　ＷＯＩ９ＱＷＯＱ表９ＲＡＭベースのシステム使用の８ポイントＦＦＴ計算シ
ーケンスバ　ス　　　　　　　　　　　　　ＲＡＭＤＩ
ＲＣＤ　　　　Ｔ　　　　Ｘ　　　　Ｅ　　　　ＰＣＤ
ＥＰＯＴ４１　　Ｔ４Ｑ　　ＷＯＩ　　ＷＯＱ−−ｒＯ
ＴＯＩＴＯＱ−−−−ｒＯＴｅ３　　　Ｔ６Ｑ　　ＷＯＩ　　　ＷＯＱ　　　−
−ｒＯＴ２Ｔ２Ｑ−−−−ｒＯＴ５１　　　Ｔ５Ｑ　　　ＷＯＩ　　　ＷＯＱ　　　
−−ｒＯＴＩＩＴＩＱ−−−−ｒＯＴ７１　　　Ｔ７Ｑ　　ＷＯＩ　　　ＷＯＱ　　　−
−ｒＯＴ３１Ｔ３Ｑ−−−−ｒＯ０−−−−Ａ６１Ａ６ＱｗＯ−−−−八５　　　　ｌ５Ｑ　　　　ｗＯ−−−−Ｂ
ｆｌｉｌＢｆｉＱｗＯ−−−−Ｂ５１Ｂ５ＱｗＯ−−−−Ａ８１Ａ８ＱｗＯ−−−−八７　　　Δ７Ｑ　　　　ｗＯ−−−−８８
１，８８Ｑ　　　　ｗＩＯＩＯｌｌｌｌＢＩＯＱ　Ｗｌｌｌ０ＱＢＩＩＱ　Ｗ２＋Ｉ　ＩＱＢ１２Ｑ　Ｗ３１１２ＱＬＱ２Ｑ３Ｑ４ＱＷＯＱ５ＱＩＱ６Ｑ２Ｑ７Ｑ３Ｑ表１０ＦＩＦＯベースのシステム使用の８−ポイントＦＦＴ計
算シーケンス式　ス　　　　　　　　　　　ＦＩＦＯサ
イクル　　ＣＤ　　　　　Ｘ　　　　　Ｅ　　　　　Ｆ
’ＥＣＥＤＦ’ＣＰＤＬＴ４１　　ＴＯＩ　　ＷＯＩ　
　　−−ｒ　　ｒ２Ｔ４Ｑ　　　ＴＯＱ　　　ＷＯＱ　
　　　　−−ｒ　　　　ｒ３Ｔ６１　　　Ｔ２１　　　
ＷＯＩ　　　　　−−ｒ　　　　ｒ４Ｔ６Ｑ　　　Ｔ２
Ｑ　　　ＷＯＱ　　　　　−−ｒ　　　　ｒ５Ｔ５１　
　　Ｔｌｌ　　　ＷＯＩ　　　　　−−ｒ　　　　ｒ６
Ｔ５Ｑ　　　ＴＩＱ　　　ＷＯＱ　　　　　−−ｒ　　
　　ｒ７Ｔ７１　　　Ｔ３１　　　ＷＯＩ　　　　　−
−ｒ　　　　ｒ８Ｔ７Ｑ　　　Ｔ７Ｑ　　　ＷＯＱ　　
　　　−−ｒ　　　　ｒ１０　　　−　　　−　　　　
−Ａ５１Ａ７１　　　　　　　　　ｗ　　　　　　　ｗ
ｌｌ　　　−−−八５Ｑ　　　Ａ７Ｑ　　　　　　　　
ｗ　　　　　　　ｗｌ、２　　　−　　　　−　　　　
−８５１　　　Ｂ７１　　　　ｗ　　　　　　　ｗｌ３
　　　−　　　　−　　　　−Ｂ５ＱＢ７Ｑ　　　　ｗ
　　　　　　　ｗｌ、４　　　−　　　−　　　　−Ａ
６１Ａ８１　　　　　　　　　ｗ　　　　　　　ｗｌ、
５Ｂ５１　　　Ａ５１　　　ＷＯＩ　　　Ａ６Ｑ　　　
Ａ８Ｑ　　　　ｒ　　　ｒ、ｗ　　　　　　ｗｌ、ＢＢ
５Ｑ　　　八５Ｑ　　　ＷＯＱ　　　Ｂ８１　　８８］
　　　ｒ、ｗ　　　ｒ　　　　ｗｌ、７Ｂｅｌ　　Ａ６
１　　ＷＯＩ　　Ｂ１０　　Ｂ１０　　ｒ、ｗ　　ｒｌ
８　Ｂ１０　　Δ６ＱＷＯＱ　　　−−ｒ　　　　ｒｌ
、９　　Ｂ７１　　Ａ７１　　Ｗ２Ｉ２０　Ｂ１０　　
Ａ７Ｑ　　Ｗ２Ｑ２１　Ｂ８１　　Ａ８１　　Ｗ２１２２　Ｂ１０　　Ａ８Ｑ　　Ｗ２ＱＢＡ９１　　ＡＩＩＩ　　　　　ｗＡ９Ｑ　　ＡＩＩＱ　　　　　ｗＢ９１　　Ｂ１１１　　ｗＢ９Ｑ　　ＢＩＩＱ　　Ｗ Δ］旧Ａ１２１　　　　ｗＢ９１　　Ａ９１　　ＷＯＩ　　ΔＩＯＱ　Ａ１２Ｑ　
　、ｒ、ｗＢ９Ｑ　　Ａ９Ｑ　　ＷＯＱ　　ＢＩＯＩ　
Ｂ１２１　　；９□、・１ｒＢＩＯＩ　　Ａｌ０Ｉ　　
Ｗｌｌ　　ＢＩＯＱ　ＢＬ２Ｑ　ｒ、ｗ　　ｒＢＩＯＱ
ＡＩＯＱＷＩＱ　　　−−ｒ　　　ｒＢｉｌｌ　　ＡＩ
ＬＩ　　Ｗ２１ＢＩＩＱ　ＡＩＩＱ　Ｗ２ＱＢ１２１　　Ａ１２１　　Ｗ３１Ｂ１２Ｑ　Ａ１２Ｑ　Ｗ３ＱＯＩＯＱｉｌＩＱ２Ｑ３ＱＰｄ２　　　　　　ｗ４ＱＦ５１　　　ｗＰ５Ｑ　　　ｗＢＩ６ＱＰ７１　　　ｗＰ７Ｑ　　　ｗ

【図面の簡単な説明】

第１図は、本発明による回路を示す高レベル論理図であ
る。第２図は、ＲＡＭベースのシステムに使用するシステム
を示す論理図である。第３図は、ＦＩＦＯベースのシステムを示す論理図であ
る。第４図は、複素乗算に関する異なるデータ通路を示す説
明図である。第５図は、ＦＦＴバタフライ演算に関する異なるデータ
通路を示す説明図である。第６図は、データの平方演算に有用なデータ通路を示す
説明図である。第７図は、マトリックス乗算のシーケンスを示す説明図
である。第８図及び第９図は、それぞれ第２図及び第３図のシス
テムに於けるデータの流れを示す線図である。第１０図は、第１図の入力部を詳細に説明する論理図で
ある。第１１図は、第１図の中間マルチプレクサ１１５を詳細
に示す論理図である。第１２図は、第１図の出力部を詳細に示す論理図である
。３０・・・第１処理部　　１１０・・・入力部１１５・
・・中間マルチプレクサセット１２０・・・第２処理部
　１２５・・・マルチプレクサ１２７・・・データパイ
プ１３０・・・制御ステーション１３２．１３４．１３
６．１３８．１４０．１４２・・・制御ユニット１５０．１５５・・・マルチプレクサ１６０．１６２．１６５・・・ＡＬＵ１７０．１７２・・・出力バッファ１７４．１７６・・・バッファ２０２．２０４・・・バス２４１．２４３・・・フィードバック通路２１２．２１
４．２１６．２１８・・・バス３１０．３１２・・・ア
ドレスジェネレータ３２０・・・ＲＡＭ　　　　３３０
・・・メモリ３４０・・・ＲＡＭ３５０・・・アドレスジェネレータ５００．５０２．５０４．５０６・・・ＦＩＦＯ５０８
・・・メモリ５１０・・・アドレスジェネレータ５２０．５３０・・・制御ユニット９１０．９１２・・・レジスタ

Claims

【特許請求の範囲】

（１）所定の数の回路クロックサイクルからなる待ち時
間を有する一連のパイプラインサイクルに於てデータが
所定の制御可能に選択されたデータ通路セットのいずれ
かのデータ通路の処理段セットを順番に通過し、かつ記
憶された制御データを有しかつ前記処理段セットに対応
する制御レジスタセットから順に復号された制御下で操
作されるようなパイプラインデータ構造を有し、浮動小
数点数を処理するための集積回路であって、少なくとも４個のデータ入出力手段の内の少なくとも２
個の入出力手段を２個の乗算器の入力ポートに制御可能
に接続するための第１レジスタ・マルチプレクサセット
を有し、かつ前記乗算器が前記第１レジスタ・マルチプ
レクサセットと並列に接続されると共に、少くとも１ク
ロックサイクルでデータを記憶するための制御可能な記
憶手段と、記憶手段をバイパスするための制御可能なバ
イパス手段と、少くとも２つの通路にデータを向けるた
めの制御可能なマルチプレックス手段とを備え、所定の
算術演算のためのデータが前記第１レジスタ・マルチプ
レクサセット内で所定の基準コンフィギュレーションに
変換されて少くとも２つのコンフィギュレーションで前
記集積回路内に入るようにする入力部と、その出力データについて処理するために２個の前記乗算
器の両方の出力ポートに接続された第１ＡＬＵ（演算論
理装置）と、前記第１ＡＬＵと、前記両乗算器を回避する前記第１レ
ジスタ・マルチプレクサセットからの第２データ通路と
、第３レジスタ・マルチプレクサセットからの２本のフ
ィードバック通路とに接続された第２レジスタ・マルチ
プレクサセットと、前記第２レジスタ・マルチプレクサ
セットと前記第３レジスタ・マルチプレクサセットとの
間に並列に接続され、かつそれぞれが、前記第２レジス
タ・マルチプレクサセットまたは前記第３レジスタ・マ
ルチプレクサセットの一方からのレジスタを用いて２個
の前記乗算器の所定の一方からの出力データを累算する
アキュムレータモードを有するように、前記第２レジス
タ・マルチプレクサセットの部分から前記第３レジスタ
・マルチプレクサセットの部分を通って前記第２レジス
タ・マルチプレクサセットに戻るデータ通路に接続され
ている２個のＡＬＵとを備えることを特徴とする集積回
路。
（２）少くとも２個の前記コンフィギュレーションが、
第１及び第２実数成分と第１及び第２虚数成分とを有す
る第１及び第２複素数が４個の前記データポートに並列
に送られる第１コンフィギュレーションと、前記第１実
数成分及び前記第１虚数成分が４個のデータポートのい
ずれかに直列に送られ、かつ前記第２実数成分及び前記
第２虚数成分が４個の前記データポートの他方に直列に
送られる第２コンフィギュレーションとからなり、前記
第２コンフィギュレーションに於て、直列に入ったデー
タが２個の前記乗算器に並列に送られるように、制御可
能な前記記憶手段及び前記バイパス手段が前記第１及び
第２複素数の２つの前記成分を処理することを特徴とす
る特許請求の範囲第１項に記載の集積回路。
（３）前記第１及び第２複素数の選択された成分が、第
１パイプラインサイクルで乗算演算を実行する際に前記
入力部に保持され、かつ第２パイプラインサイクルの際
に２個の前記乗算器に再び送られるように、２個の前記
乗算器が、２クロックサイクルで１つの複素乗算が要求
される４つの乗算演算を実行し、かつ前記データが第１
パイプラインサイクルに於て前記第１コンフィギュレー
ションの前記データポートに供給されることを特徴とす
る特許請求の範囲第２項に記載の集積回路。
（４）前記第１及び第２複素数の全ての前記成分が第１
の組合せに於て２個の前記乗算器に送られ、かつ前記第
１パイプラインサイクルで前記入力部に保持され、前記
第１及び第２複素数の全ての前記成分が更に前記第２パ
イプラインサイクルに於て第２の組合せに於て２個の前
記乗算器に送られることを特徴とする特許請求の範囲第
３項に記載の集積回路。
（５）前記第２コンフィギュレーションに於て、２個の
前記乗算器が２クロックサイクルで複素乗算に要求され
る４個の乗算演算を実行し、それによって、２つの前記
複素数の２つの成分が第１パイプラインサイクルに入り
、かつ前記第１パイプラインサイクルの直後の第２パイ
プラインサイクルに前記２つの複素数の残りの２つの成
分が入ると共に、前記第２パイプラインサイクルに入っ
たデータが１サイクルで前記入力部に記憶され、かつ即
座に２個の前記乗算器に送られることによって、乗算が
前記第１パイプラインサイクルで行われて前記第１パイ
プラインサイクル及び前記第２パイプラインサイクル双
方に入ったデータに影響を与え、かつ、前記第１パイプ
ラインサイクルに入ったデータが前記入力部に保持され
て前記第２パイプラインサイクルに於て前記第２パイプ
ラインサイクルに入ったデータと乗算されることを特徴
とする特許請求の範囲第２項に記載の集積回路。
（６）複素積を作る第１及び第２複素数の乗算と、アキ
ュムレータレジスタに記憶される量への前記積の加算と
からなる乗算・累算演算がデータ通路に従って、前記第
１及び第２複素数の４つの前記成分が前記第１パイプラ
インサイクルまたは第２パイプラインサイクルの少くと
も一方に於て前記集積回路に入り、２個の前記乗算器を
通過して４つの積項を作り、４個の前記積項が前記第１
ＡＬＵに於て２つずつ加算されて前記第１及び第２パイ
プラインサイクルの際に実数積成分及び虚数積成分を形
成し、かつ前記実数積成分及び虚数積成分が前記第２レ
ジスタ・マルチプレクサセットを通過しかつ少くとも一
方の前記ＡＬＵに於て実数部分和及び虚数部分和に累算
されるように行われることを特徴とすると特許請求の範
囲第１項に記載の集積回路。
（７）前記第１及び第２積成分が、その中の第１の成分
が前記第１パイプラインサイクルに送られかつ第２の成
分が前記第２パイプラインサイクルで送られると共に、
１クロックサイクルの相対的遅れをもって２個の前記Ａ
ＬＵに送られるように、前記第１ＡＬＵから前記第２レ
ジスタ・マルチプレクサセット内に送られ、かつ前記第１及び第２積成分が、２個の前記ＡＬＵの出力か
ら前記第３レジスタ・マルチプレクサセットを介して前
記第２レジスタ・マルチプレクサセットにデータをフィ
ードバックすることによって形成される第１及び第２ア
キュムレータに累算され、それによって前記実数積成分
及び虚数積成分と、対応する実数部分アキュムレータ和
及び虚数アキュムレータ和とが前記第２レジスタ・マル
チプレクサセットを同時に通過することを特徴とする特
許請求の範囲第６項に記載の集積回路。
（８）一方のＡＬＵ及び部分和項が第２サイクルを通過
することを特徴とする特許請求の範囲第１項に記載の集
積回路。
（９）マトリックス乗算に適した所定のデータ通路が制
御可能に選択された前記データ通路セットから選択され
るようになっており、４つの数からなる入力セットが第
１パイプラインサイクルで前記入力部に送られ、前記第１パイプラインサイクルが２個の前記乗算器を通
過して２つの中間積項を形成するように、前記４数入力
セットが２連続クロックサイクルの間に２個の前記乗算
器に於て所定の通り２つずつ同時に乗算され、２つの前記中間積項が前記第１ＡＬＵに入りかつ加算さ
れて第１部分和項を作り、かつ、前記部分和項が時間従属データ通路に於て前記第２レジ
スタ・マルチプレクサセットを介して２個の前記ＡＬＵ
の選択した一方の前記ＡＬＵに入り、かつ前記第３レジ
スタ・マルチプレクサセットを通過して所定の出力デー
タポートに送られることを特徴とする特許請求の範囲第
１項に記載の集積回路。
（１０）２個の前記ＡＬＵが共にアキュムレータとして
構成され、かつ２つの部分和が奇数サイクル及び偶数サ
イクルで各アキュムレータに於て同時に累算され、それ
によって４つの部分和が２個の前記ＡＬＵによって形成
される４個の有効アキュムレータに同時に現われ、かつ
前記集積回路が前記入力部から２個の前記乗算器、前記
第１ＡＬＵ、前記第２レジスタ・マルチプレクサセット
及び２個の前記ＡＬＵの一方を通過して延長する４本の
データ通路を有し、かつその内の２本の前記データ通路
が前記各ＡＬＵに同時に存在することによって、４要素
のベクトルと４行４列のマトリックスとの乗算に要求さ
れる４個の前記部分和項を計算できるようになっている
ことを特徴とする特許請求の範囲第９項に記載の集積回
路。
（１１）それぞれに実数部分と虚数部分とを有する２つ
の浮動小数点複素数を乗算し、かつそれらの積を２つの
連続パイプラインサイクルで累算するためのパイプライ
ンアーキテクチャを有し、かつ入力モジュールと、２個
の乗算器と、少くとも２個のＡＬＵとを備える集積回路
であって、前記入力モジュールが、２つの前記複素数の
４つの成分の少なくとも２成分を同時に受け取ることが
でき、２個の前記複素数の４つの成分の第１セットを同
時に第１パイプラインサイクルに送って、パイプライン
アーキテクチャを順に通過させかつ次に第２パイプライ
ンサイクルに於て同時に２つの前記複素数の４つの成分
の第２セットを前記入力モジュールと少くとも２個の前
記ＡＬＵの内の第１ＡＬＵの２個の入力ポートとの間に
並列に接続される２個の前記乗算器に送ることができ、
２個の前記乗算器がそれぞれ内部パイプラインレジスタ
を有し、それによって前記２つの複素数の４成分の前記
第１セットが前記乗算器の前記内部パイプラインレジス
タ内にある時前記複素数の４成分の前記第２セットが前
記第２パイプラインサイクルに於て前記乗算器に送られ
、前記第１セット及び第２セットが前記乗算器内で同時
に演算処理されて前記積の２つの実数部分項と２つの虚
数部分項とを形成し、前記第１ＡＬＵが２つの前記連続パイプラインサイクル
に於て２つの複素数を加算できるようなっており、２つ
の前記複素数の前記積の前記実数部分項及び虚数部分項
が２つの前記連続パイプラインサイクルに於て順次加算
されて実数積成分と虚数積成分とを有する２個の前記複
素数の複素積を形成し、前記第１ＡＬＵが、２個の前記
入力ポートからデータが送られる内部パイプラインレジ
スタを有し、かつ該データが次に第２クロックサイクル
で前記第１ＡＬＵに送り出されるようになっており、そ
れによって前記第１セットと第２セットとが同時に前記
第ＡＬＵ内で演算処理され、かつ、少なくとも２個の前記ＡＬＵの第２ＡＬＵが前記第１Ａ
ＬＵの出力に接続され、かつ２つの前記連続パイプライ
ンサイクルに於て前記複素積の前記実数積成分と虚数積
成分とが実数累算部分和項と虚数累算部分和項とのに加
算によって累算されるようにアキュムレータとして機能
するようになっており、前記実数または虚数積成分の一
方が前記第１パイプラインサイクルで累算され、かつそ
の他方が前記第２パイプラインサイクルで累算されると
共に、前記第２ＡＬＵが、１クロックサイクルでデータ
が入力ポートから送られるような内部パイプラインレジ
スタを有しかつ該データが第２クロックサイクルで前記
第１ＡＬＵから送り出され、それによって前記実数部分
和項及び虚数部分和項が前記第２ＡＬＵ内で同時に演算
処理されることを特徴とする集積回路。
（１２）前記第１ＡＬＵが、前記第２ＡＬＵの第１入力
ポート及び第２入力ポートと、前記第１ＡＬＵの出力ポ
ート及び前記第２ＡＬＵの出力ポートに接続されたフィ
ードバックバスとの間に制御可能なデータ通路を設ける
ためのマルチプレクサ及びレジスタのネットワークを介
して前記第２ＡＬＵに接続され、それによって前記マル
チプレクサ・レジスタネットワークが前記第２ＡＬＵと
結合されてアキュムレータを形成することを特徴とする
特許請求の範囲第１１項に記載の集積回路。
（１３）少くとも２個のデータメモリユニットと、前記
メモリユニットに接続された単チップ算術プロセッサと
を有する複素数を処理するための演算処理システムであ
って、前記単チップ算術プロセッサがパイプラインアーキテク
チャと少くとも４個の双方向データポートと少くとも１
個の追加ポートとを有し、かつ前記各データメモリユニ
ットが前記双方向データポートの対に接続されており、前記算術プロセッサが、その内部にデータを少くとも２
つのデータ通路コンフィギュレーションのいずれかに送
るための時間従属データ通路を設定するための内部デー
タ通路制御手段と、前記両双方向データポート対がデー
タをメモリとの間で両方向に送って複素数の実数成分と
虚数成分とを同時に運ぶ第１コンフィギュレーションと
、前記両双方向データポート対がデータを１方向に送っ
て複素数の実数成分と虚数成分とを同時に運ぶ第２コン
フィギュレーションとを有し、それによって前記単チッ
プ算術プロセッサが、ＲＡＭベースのデータ処理装置に
於て、データが第１データポート対を介して第１ＲＡＭ
から読み出されて前記プロセッサにより演算処理され、
かつその演算結果がデータの流れが逆転される第２パス
より先の第１パスに於て第２データポート対を介して第
２ＲＡＭに書き込まれるように使用され、かつＦＩＦＯ
ベースのデータ処理装置に於て、データが少くとも２つ
のパスに於てＦＩＦＯメモリから第１データポート対を
介して１方向に送られて、かつ第２データポートから前
記ＦＩＦＯメモリに戻るように使用されることを特徴と
する演算処理システム。
（１４）前記算術プロセッサが、前記第１コンフィギュ
レーションに於ける前記データ通路が前記第１データポ
ート対の第１データポート及び第２データポートに同時
に送られる実数部分と虚数部分とを有する複素数の第１
セットを順に前記第１データポート対に送り込むような
マルチパスＦＦＴバタフライ演算を実行するための乗算
手段とＡＬＵ手段とを有し、前記第１複素数セットが制御可能なマルチプレクサ・レ
ジスタ手段を介して１対の乗算器に送られ、前記第１複
素数セットの所定の第１対が第１及び第２パイプライン
サイクルに於ける前記第１データポート対に送られて前
記第１及び第２パイプラインサイクルに於て前記算術プ
ロセッサを通過し、前記ＦＦＴバタフライ演算によって
得られる複素数が所定のプロセッサ待ち時間の後に第２
データポート対を介して前記第２ＲＡＭに送られ、かつ
前記第１複素数セットの残りの複素数が同じデータ通路
に沿って順に前記算術プロセッサを通過することによっ
て、前記ＦＦＴバタフライ演算によって得られる第２複
素数セットが前記第１パスの後で前記第２ＲＡＭに記憶
されるようになっており、かつ、前記第２複素数セットの最後の複素数が前記第２ＲＡＭ
に記憶された後に、前記内部データ通路制御手段がデー
タ通路の接続を変更し、かつ前記第２ＲＡＭから前記第
２データポート対を介して前記第１ＲＡＭに延長する第
２データ通路を介して前記第２複素数セットについて前
記ＦＦＴバタフライ演算を繰り返し実行することを特徴
とする特許請求の範囲第１３項に記載の演算処理システ
ム。
（１５）前記算術プロセッサが、前記第２コンフィグレ
ーションに於ける前記データ通路が前記第１データポー
ト対の一方のデータポート対に順に送られる実数部分と
複素部分とを有する複素数の第１セットを順にＦＩＦＯ
手段から前記第１データポート対に送り込むようなマル
チパスＦＦＴバタフライ演算を実行するための乗算手段
とＡＬＵ手段とを備え、前記第２複素数セットが制御可能なマルチプレクサ・レ
ジスタ手段を介して１対の乗算器に送られ、前記第１複
素数セットの所定の第１対が第１及び第２パイプライン
サイクルに於て前記第１データポート対に送られて前記
第１及び第２パイプラインサイクルに於て前記算術プロ
セッサを通過し、前記ＦＦＴバタフライ演算によって得
られる複素数が所定のプロセッサ待ち時間の後に第２デ
ータポート対を介して前記ＦＩＦＯ手段に送られ、かつ
前記第１複素数セットの残りの複素数が同じデータ通路
に沿って順に前記算術プセッサを通過することによって
、前記ＦＦＴバタフライ演算によって得られる第２複素
数セットが前記待ち時間の後の前記開始時及び前記第１
パスの間に記憶され、かつ、前記算術プロセッサが、前記第２複素数セットについて
前記ＦＦＴバタフライ演算を前記第２複素数セットの最
後の複素数が前記ＦＩＦＯ手段に記憶される前に繰り返
して実行し始め、それらを前記第１データポート対を介
して読み込みかつ前記ＦＦＴバタフライ演算によって得
られる第３複素数セットを前記ＦＩＦＯ手段に書き込む
ことを特徴とする特許請求の範囲第１３項に記載の演算
処理システム。
（１６）前記ＦＩＦＯ手段が、前記第２データポート対
と前記第１データポート対との間に並列に接続された２
対のＦＩＦＯと、それぞれが前記入力ポート対の一方の
入力ポートに接続された第１ＦＩＦＯ対に接続された第
１出力ポートと、それぞれが前記入力ポート対の一方の
入力ポートに接続された第２ＦＩＦＯ対に接続された第
２出力ポートとを有し、前記第２データポート対の各デ
ータポートと前記第１データポート対の両データポート
との間にフィードバックデータ通路が設定され、かつ、出力データポートから出現する数を該出力データポート
に接続された前記ＦＩＦＯ対の一方または他方に選択的
に送り込み、それによって前記複素数セットが並列をな
す前記ＦＩＦＯの所定の複素数の部分集合として記憶さ
れ、かつフィードバックされたデータが並列をなす１対
のＦＩＦＯに送り込まれて２つずつ同時に前記第１デー
タポート対に送られる制御手段を備えることを特徴とす
る特許請求の範囲第１５項に記載の演算処理システム。