JPH02210538A - 集積回路と演算処理システム - Google Patents

集積回路と演算処理システム

Info

Publication number
JPH02210538A
JPH02210538A JP1261219A JP26121989A JPH02210538A JP H02210538 A JPH02210538 A JP H02210538A JP 1261219 A JP1261219 A JP 1261219A JP 26121989 A JP26121989 A JP 26121989A JP H02210538 A JPH02210538 A JP H02210538A
Authority
JP
Japan
Prior art keywords
data
pipeline
alu
pair
complex numbers
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1261219A
Other languages
English (en)
Inventor
Roger G Cox
ロジャー・ジー・コックス
Michael W Yeager
マイケル・ダブリュ・イエーガー
Lance L Flake
ランス・エル・フレイク
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
RTX Corp
Original Assignee
United Technologies Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by United Technologies Corp filed Critical United Technologies Corp
Publication of JPH02210538A publication Critical patent/JPH02210538A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/38Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
    • G06F7/48Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
    • G06F7/483Computations with numbers represented by a non-linear combination of denominational numbers, e.g. rational numbers, logarithmic number system or floating-point numbers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/141Discrete Fourier transforms
    • G06F17/142Fast Fourier transforms, e.g. using a Cooley-Tukey type algorithm
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2207/00Indexing scheme relating to methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F2207/38Indexing scheme relating to groups G06F7/38 - G06F7/575
    • G06F2207/3804Details
    • G06F2207/386Special constructional features
    • G06F2207/3884Pipelining

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Discrete Mathematics (AREA)
  • Nonlinear Science (AREA)
  • Complex Calculations (AREA)
  • Advance Control (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的] 〈産業上の利用分野〉 本発明は、特別の用途に使用される演算処理ユニットに
関し、浮動小数点数のための演算処理ユニットに関する
〈従来の技術〉 従来、高性能なデジタル信号処理の適用には高速度で実
行される浮動小数点計算が必要である。
汎用CPUは実時間計算の実行に適していない。
従来より、浮動小数点計算に適した特別なチップを作る
ために様々な試みが行なわれている。このような装置の
1つとして、レイジオン・コーポレイション(Rayt
heon Corporation)社のRAM 10
0浮動小数点アキュムレータプロセッサがある。
固定小数点数のために設計された別の演算チップには、
米国特許出願箱056,627号明細書に開示されてい
るものがある。
〈発明が解決しようとする課題〉 本発明の目的は、浮動小数点数に適した演算処理装置を
提供することにある。
[発明の構成] 〈課題を解決するための手段〉 本発明は、2個の32ビツト乗算装置と3個のALU 
(演算論理装置)とを有する特定の用途に適した演算集
積回路に関する。この装置の特徴は、パイプラインアー
キテクチャの形態にある。
本発明の別の特徴は、実行すべき演算だけでなく、チッ
プが実装されるシステムについても適当な多数の異なる
データ通路を有するように構成し得ることである。
本発明の更に別の特徴は、機能コードがチップに沿って
データと共にパイプライン化され、それにより従来のビ
ットスライス装置のバルキー制御構造が排除され、かつ
該チップをサイクル毎に再構成できることである。
本発明の他の特徴及び利点については、添付図面を参照
しつつ以下に好適実施例を用いて詳述する。
〈実施例〉 第1図には、本発明の32ビツトの実施例の高レベルブ
ロック図が示されている。データポートCSD、ESF
は双方向性であり、かつポートT1Xは入力ポートであ
る。いずれのサイクルに於ても、ポートC,Dが入力ま
たは出力であり、かつポートE、Fが逆に出力または入
力である。内部入力ポートRSSは多重系であり、デー
タの流れ方向に応じてバスC,Dの対を入力として、ま
たはバスE、Fの対を入力として選択する。これ以上の
情報については、ユナイテッドφチクノロシーズ・マイ
クロエレクトロニック・センター(United Te
chnologies Mlcroelectro口i
c Center)のrUT695B2  IQMAC
パイブラインドプロセッサ(Pipelined Pr
ocessor ) Jを参照されたい。
このチップの全体構成は、制御信号に応じて多数のデー
タ通路を設定し得る内部結合された入力レジスタとマル
チプレクサ(MUXES )からなる入力部110と、
2個の浮動小数点乗算器と並列なのデータパイプセット
とを有しかつ第1ALUに接続された第1処理部30と
、前記ALUからの入力と前記データパイプセット及び
一方の前記乗算器に接続されたマルチプレクサ120か
らの入力と出力部からくる2本のフィードバック通路2
41.243からの入力とを有する第2マルチプレクサ
・レジスタセット115と、並列な2個のALU162
.165と前記ALU162.165の出力から1対の
バス262.264及び中間マルチプレクサセット11
5への2本のフィードバック通路241.243に接続
された出力レジスタ・マルチプレクサセットとを有する
第2処理部120とを備える。
第1図の右側には、2組の機能線及び制御線が前記チッ
プの端子から制御ユニット132〜142からなる制御
ステーションセット130に入っている。関数信号及び
制御信号は各ブロックで復号されて本システムの異なる
段に制御信号を供給する。例えば制御ブロック130に
於て、信号が復号されてマルチプレクサ110の選択さ
れた1または2以上の入力バスを開き、かつ該入力バス
を乗算器150.155のいずれかに接続する。
制御ユニット134では、データ通路及び前記乗算器が
制御されて多数の異なる乗算演算のいずれかを実行する
前記チップの全体構成は、データが」二部に流れ込みか
つ多数の通路を通過して下部に移動するようになってい
る。符号30で示される上部は、2個の乗算器150.
155とALU160とを有する。これらの乗算器15
0.155は、前記チップの2タロツクサイクルに於て
複素乗算を実行する。乗算器150.155はパイプラ
イン化されかつパイプラインレジスタによって2つの部
分に分割されていることにより、後からくるデータは前
記乗算器の2サイクルの走行時間を待つ必要なくして次
のサイクルに入ることができる。これらと同等のパイプ
ライン乗算器が、アナログ・デバイシズ(Analog
 Devices)社の1987年10月イ寸アナログ
・デバイシズ・DSP・プロダクツ・ハンドツ・ツク(
八nalog Devices’DSP Produc
tsllandbook)の第4〜51頁に記載される
ADSP3211マルチプライア・チップ(Mul t
ipl 1erChip )に開示されている。データ
は、第1クロックサイクルに於て上部レジスタからパイ
プラインレジスタに送られ、かつ更に第2クロックサイ
クルに於て出力レジスタに送られる。
前記チップが実行する複素乗算及び累算命令が表1に要
約されている。数字にイ」される星印は、その数が乗算
する前に共役化されていることを示す。複素結果は出力
ポートY、Zに現れる。第4図には乗算を行なうための
考えられる4個のデータ通路が示されており、システム
設計者にとってその要求に適合するように実行可能な直
列または並列の様々な形を示している。レーダ信号処理
から採用した表記方法によって、■ (同相)及びQ(
矩象)が複素数の実成分と虚成分であり、従ってAIが
複索数Aの実数部分であり、かつAQが虚数部分である
。実数は小文字で表示される。
また、前記チップは、高速フーリエ変換(FFT)バタ
フライ演算のための特別な命令を実行する。FFT命令
は両方のALU162.165を使用して、前記チップ
がちょうど2サイクルでFFTバタフライの2つの複素
加算を実行できるようにする。第5図は、これらの演算
に使用されるデータ通路を示している。第2の特別演算
は、複素数の大きさを2乗することであり、第6図はこ
れらの演算に使用されるデータ通路を示している。
特別な形の乗算には、2つの乗算が同時に行われるよう
にする双対乗算・加算がある。この型式の命令は、各ク
ロックサイクルについて双対乗算・加算命令を用いて4
つのクロックサイクルに於て2つの2行2列のマトリッ
クスを乗算するために使用されるシーケンスを示す第7
図に示されるように、マトリックスの乗算の速度を速く
する。
表3は、双対乗算・加算命令の変形を示しており、それ
にはアキュムレータのいくつかの乗算・加算命令の結果
を累積することが含まれる。このアキュムレータの使用
は、追加の積の項を合計しなければならない2行2列よ
り大きいマトリックスの乗算に於て有用である。
当業者であれば、これらの開示事項から本発明を適用し
て特別な仕事を実行することは容易である。コンピュー
タ・グラフィックスに応用する場合には、4行4列のマ
トリックスの拡張的使用が含まれ、かつチップ」二に係
数を記憶するためにマルチプレクサユニット110の乗
算器近傍に追加のレジスタ・制御線セットを設けると有
利である。
遅いメモリを使用した場合には、1個または2個のレジ
スタを1本または2本以−にの入力バスに接続して係数
を保持し、それによって該レジスタ内に記憶される係数
に使用されるデータがロードされかつ演算処理された後
に、新しい係数が記憶されかつ新しいデータセットが読
み込まれるようにすると好都合である。
4エレメントベクトルに4行4列のマトリックスを掛け
る場合には、上述した米国特許出願に於て詳述したよう
に、本発明の特徴を利用して各アキュムレータが同時に
循環する2つの部分和を有することができる。出力ベク
トルの4エレメントは、単一乗算・加算命令が使用され
た場合にそれぞれ4つの部分和項によって形成され、か
つ第7図に示される双対乗算・加算命令が使用された場
合に2つの部分和項によって形成される。成るエレメン
トを形成する4つの不完全相は、それぞれ同時にアキュ
ムレータ内に存在する。この特徴を利用して、都合の良
い順序で入力データを提供し、第7図に示される各2項
の計算結果をアキュムレータ内で循環する正しいエレメ
ント和に送ることができる。
本発明による回路は、該回路の下部に於て2項累算を実
行しつつ、回路上部に於て2項が乗算されかつ同時に加
算される双対乗算・加算命令を用いて、各出力エレメン
トが2連続クロックサイクル′?−竪虚J する←うに
構成される。この場合に、牙)7・ノ )□、イ]r 
−−、−“パ1に関する如何なるデー  り先にブロッ
クに入ることができ、かつ同?・に、他の項に行くデー
タはブロックに入ることができる。
別の実施例では、より好都合な場合には、1個のアキュ
ムレータと2個の下側ALUから形成される4個の「有
効」アキュムレータとの間で中間項を累算しつつ、異な
る出力項に貢献するデータを入力の流れにインタリーブ
することができる。
この場合に於て4行4列のマトリックスを使用するなら
ば、双対乗算・加算命令を使用する方法が好都合である
。第1サイクル0に於て、入力ベクトルからのエレメン
ト1.3にマトリックスからのエレメントIL1Bがロ
ードされ、2つの積が加算され、かつ「偶数」サイクル
でいずれかのアキュムレータに記憶される。サイクル1
では、異なる入力数セットが同様に処理され、かつ「奇
数」サイクルでアキュムレータにロードされる。
次に、サイクル3に於て、残りの数、入力ベクトルのエ
レメント2.4及びマトリックスのエレメント12.1
4が乗算され、2つの積が加算され、かつ最終結4(4
がアキュム;−夕に形成される。
表4は、双対実数乗算・累算(MAC)関数の全ての組
合せを実行する9個の命令を示している。
これらの命令は、デバイスが多重チャネル実数有限イン
パルス応答デジタルフィルタを実行する際に有用である
表5には、ALU162.165、出力バイブライン1
20及びバス241.243を一体的に双対アキュムレ
ータとしてより柔軟に使用し得る累算命令が記載されて
いる。ALU162、バス241、中間マルチプレクサ
115の部分及び出力バイブライン122を一体化して
Yアキュムレータが形成され、かつALU165、バス
243、中間マルチプレクサ115の部分及び出力バイ
ブライン120を一体化してZアキュムレータが形成さ
れる。これらYアキュムレータ及びZアキュムレータに
ついては表5を参照する。YアキュムレータまたはZア
キュムレータは、別個に使用された場合にそれぞれ1ク
ロックサイクル毎にまたは奇数または偶数の2クロック
サイクル毎に実数を累算するために使用することができ
、かつ本願出願人による別個の米国特許出願に記載され
るように1個の物理的アキュムレータを共有する「有効
」アキュムレータ内で複素数を累算するために使用する
ことができる。
また、1サイクルで複素数の累算ができるようにYアキ
ュムレータ及びZアキュムレータ両方を用いることがで
きる。命令PLPT及びADDPTによって、上述した
米国特許明細書に開示されるように部分和レジスタの制
御及び部分和の加算が可能になる。後述するように、こ
れらのアキュムレータ命令は、パイプライン関数コード
を使用する第1図の各制御ユニット130によってサイ
クル毎に他の命令と結合される。
ここで使用される用語は、パイプラインサイクルOがシ
ステムを通過する2つのサイクルのうちの第1サイクル
を意味する。前記システムの待ち時間は9クロックサイ
クルであり、従って、FFT演算のサイクル0(パイプ
ラインサイクル0)は第9番目のクロックサイクル後に
結果の部分が出力ポートに現れるように前記システムの
各段を通過するために9クロックサイクルを要する。同
様に、入力データの第2セットが第1セット(パイプラ
インサイクル1)の後に1クロックサイクルで入り、最
終出力データは9クロックサイクル後に現れる。パイプ
ラインサイクル0が前記チップを通過する際にデータに
ついて異なる演算処理が実行されるが、これはデータが
前記チップのいずれの段にあるかと無関係にパイプライ
ンサイクル0と呼ぶ。
以下に、本発明により第1図のエレメントを用いて完全
FFTバタフライを2サイクルで計算する要領を説明す
る。FFT計算は第1に複素乗算からなり、それに続い
て2つの複素加算が行なわれる。この実施例の場合に、
第5図に示されるようにPATHモード=00と仮定す
ることによって、サイクル0に於てDIがCバスに入力
し、BQがDバスに入力し、WlがTバスに入力し、か
つWQがXバスに入力する。サイクル1では、AIが前
記チップのCバスに入力されるのに対して、AQがDバ
スに到達する。複素乗算に関する式は、P I = (
B I XWI)−(BQXWQ)と、PQ= (B 
I xWQ)+ (BQxWI)とである。バタフライ
加算式は次の通りである。即ち、AI’=AI+BI、
AQ’ =AQ+BQ、BI’ =AI−PI、及びB
Q’ =AQ−PQである。
サイクル0に於て、乗算器及びALU160はPIを以
下のように計算する。BIがバス220に、WIがバス
224に、BQがバス226に、WQがバス228にそ
れぞれ供給される。次に、乗算器150.155が2つ
の実数積を計算する。
第1の実数積がバス231を通ってALU160の入力
Aに送られ、かつ第2の実数積がバス230からマルチ
プレクサ125を通ってバス234からALU160の
入力Bに送られる。上述した実数積がALU150に到
達するのと同じサイクルで制御信号がバス404に送ら
れてALUに減算A−Bを実行するように指令し、それ
によって実数積PIがバス238に接続されたALU1
60の出力に発生するように、パイプライン化された各
段132.134.136によって同期化させて制御が
行なわれる。
同様にして、サイクル1に於て、BQがバス222に、
WIがバス224に、BIがバス226に、WQがバス
228にそれぞれ供給される。次に、乗算器150.1
55が2つの虚数積を計算する。第1の虚数積がバス2
31を介してALU160の入力Aに送られ、かつ第2
の虚数積がバス230からマルチプレクサ125を通過
してバス234からALU160の入力Bに送られる。
サイクル1の制御は同様にして同期化され、上述した虚
数積がALU160の入力A、Bに到達するのと同じサ
イクルに於て、制御信号がバス404に到達してALU
加算を実行するように指令し、バス238にPQを発生
させる。
これらの演算が行われていると同時期に、入力バイブラ
イン110、データパイプ127及びマルチプレクサ1
25が対応するAI値を、実数PI値がバス238に現
れると同時に到達するように乗算器を通過させることに
よってバス236に転送する。次に、中間マルチプレク
サ115がAI値及びPI値をその出力へ送ることによ
って、AIが両バス242.246に、及びPIが両バ
ス244.248にそれぞれ現れる。パイプライン制御
構造136.138の特性から、加算を実行するように
ALU162を命令する制御信号がバス407に到達す
ると同時に、バス406がALU165にB−Aの減算
を実行するように命令する。その結果、パイプラインサ
イクル0について、バス247の出力にAI’が含まれ
、かつバス249の出力にBI’が含まれる。パイプラ
インサイクル1では、AQの値が入力バイブライン11
0、データパイプ127及びマルチプレクサ125を介
して送られて、虚数値PQがバス238に現れると同時
にバス236に到達するように制御が行なわれる。
同様にして、ALU162に加算が命令されるのに対し
てALU165はB−Aの減算を実行するように命令さ
れ、その結果、パイプライン化された結果AQ’がバス
247に、かつBQ’がバス249にそれぞれ現れる。
第2処理部120の出力バイブライン及びマルチプレク
サは、最終的にパイプラインサイクル0に於てEバスが
Bl’出力を伝送し、かつFバスがBQ’出力を伝送す
るように出力を構成する。パイプラインサイクル1では
、EバスがAI’の結果を伝送し、かつFバスがAQ’
の結果を伝送する。マルチプレクサの演算が表7、表8
及び第11図、第12図に示されている。
次に、RTAASX命令の場合に本発明の各エレメント
を使用して双対実数乗算及び累算命令を実行する要領を
説明する。この命令によってCバス及びTバスにデータ
の積が発生してE出力に送られ、かつ同時に、Dバス及
びXバスにデータの積が発生し、Zアキュムレータの値
に加算されてその合計値がF出力に送られる。入力バイ
ブライン/マルチプレクサからなる入力部110は、バ
ス212からCデータを受け取ってバス222に送り、
バス216からTデータを受け取ってバス224に送り
、バス224からDデータを受け取ってバス226に送
り、かつXデータをバス228に送る。次に、上述した
データは乗算器150.155によって乗算され、積C
Tがバス231に、かつ積DXがバス230にそれぞれ
発生する。
RTAASXの命令コードは、積CTを入力Aから出力
バス238に全く変更することなく送るようにALU1
60が命令されるように、制御ユニット132.134
.136を介して同時にパイプライン化される。同様に
、マルチプレクサ125は積DXをバス230からバス
236へ送る。
制御ユニット138に於てパイプライン制御の復号オペ
レーションが続いているので、中間マルチプレクサ11
5は積CTをバス242に通過させ、積DXをバス24
6に、かつバス243のZアキュムレータ値をバス24
8に通過させるように命令される。パイプラインオペレ
ーションが続いているので、制御ユニット140はバス
407を介してALU162に対して結果CTを含む入
力Aをバス247に通過させるように命令し、かつAL
U165に対してバス406を介して加算を実行させ、
それによってZアキュムレータにDX値を加えたものが
バス249に現れるようにする。
更に、制御ユニット142と出カニニット120とがパ
イプライン結果CTをEバスに送り、かつZアキュムレ
ータとDXの合計値をFバスに送る。
次の実施例では、本発明のエレメントを用いてRTAS
XまたはARTASX命令のような双対乗算・加算形式
の命令を実行する要領を説明する。
これら2つの命令は、RTASXがYアキュムレータを
使用しないのに対して、ARTASXが双対乗算・加算
の結果をYアキュムレータの既存値に加算し、かつその
結果を更に累算するためにYアキュムレータに記憶する
点を除いて同一である。
これが唯一の相違点であることから、2つの命令は2個
の乗算器150.155及びALU160によって同様
に処理される。
乗算器150は、バス222のCデータとバス224の
Tデータとを受け取り、かつ双対実数乗算命令に於て上
述したように、結果CTをバス231に送る。乗算器1
55はバス226でDデータをかつバス228でXデー
タを受け取り、かつ上述したように結果DXをバス23
0へ送る。パイプラインのこの位置に於て、制御ユニッ
ト134はマルチプレクサ125に命令してバス230
の積DXをバス234に送らせる。これによって、AL
U160は2つの積を加算しかつその合計値をバス23
8に送ることができる。合計値CT+DXは、次に中間
マルチプレクサ115によって制御ユニット138の制
御下でバス238からバス242に送られる。
ARTASX命令のように累算処理を選択できる命令の
場合には、制御ユニット138は、Yアキュムレータ値
を含むバス241をバス244、即ちALU162の入
力Bに指向させる。次に、制御ユニット140は命令を
復号し、かつその命令に基づいてALU162への指令
を発生する。
命令がRTASXの場合には、バス407に於ける指令
は単に結果CT+DXを含む入力Aをバス247に通過
させることである。命令がARTASXの場合には、制
御ユニット140がALUI62に入力Aと入力Bとを
加算させる指令をバス407に発生する。この場合に、
バス247にはCT+DX+Yアキュムレータの合計値
が含まれる。更に、制御ユニット142及び出力バイブ
ライン120が、パイプライン結果をバス247から出
力Eへ送る。
」二連したように、本発明の特徴の1つは、第1図に示
されるようなパイプライン制御構造130にある。この
構造は、データがチップの中を流れるのと同じ割合で機
能コードをチップ内をパイプラインで送る。このパイプ
ライン構造の利点は、パイプラインでない従来の制御構
造に於て要求されるように、命令コードが変わる毎に全
てのデータパイプラインを空にする必要なく命令が結合
されるようにサイクル毎に命令コードを変更できる点に
ある。
上述したように、本発明の別の特徴の1つは、デバイス
が複素数を処理する際に多数のデータ通路に適合するよ
うに形成し得る点である。本発明は、6個の入力オペラ
ンドと2個のFFTパフライ計算計算−を転送するため
に、第5図に示、れる3つのプログラム可能な通路モー
ドを有する。
従来のFFTデバイスは、システムを設計する際に処理
チップとシステムメモリとの間でこの複素データを転送
するために単一の固定された構成を使用せざるを得なか
った。様々な方法でデータ転送を構成できるので、本発
明を用いて様々なシステムアーキテクチャを構成するこ
とができる。
例えば、第2図はFFT計算のためのRAMベースのメ
モリ装置を示している。この場合、通路モードは、第5
図のオプション00について、添字Iを付した実数デー
タが一方のバスにかつ添字Qを付した複素データが他方
のバスに現れるように、複素数を処理するように各バス
対が構成されるようにプログラムされる。2メモリサイ
クルがバタフライ毎に要求され、第1サイクルで複素オ
ペランドBが入って結果が出て行き、かつ第2サイクル
でオペランドAが入りかつ結果が出て行く。
これは、アドレスジェネレータが簡単に実数データワー
ド及び複素データワード双方を含む、−のメモリ場所を
向くことができるので、RAM型システムにとって好都
合な構成である。
別の設計によるFFTシステムは、第3図に示されるF
IFOベースのメモリシステムである。
このシステムは第5図の通路01の形状を使用しており
、各バスが実数データ及び虚数データを入3つ 力及び出力双方について交互サイクルで転送するように
、バスが各複素オペランドについて構成されている。こ
の構成は、第3図に示すような定数幾何(consta
nt−geometry )アルゴリズムを使用する信
号の流れ図にデータバスの構成を適合させなければなら
ない多くの場合に好都合である。このような構成によっ
て、データメモリのためのアドレスジェネレータを設け
る必要が排除される。
このシーケンスについて詳細に説明する前に、第1図の
パイプライン構造について更に説明を加えることにする
。入力バイブライン100及び制御ユニット132は、
それぞれ2段階のパイプラインレジスタを備える。これ
は、バスCに於けるデータワードが2クロックサイクル
後までバス222または226に現れないことを意味す
る。同様に、バス420に於ける命令関数コードが2サ
イクル後までバス422に現t′lない。乗算器150
.155は、制御ユニット134と同様にそれぞれ3段
階のパイプラインレジスタを有し、それによって乗算器
150の出力即ちバス231は、3サイクル先にバス2
22.224に供給される・入力に基づく積を運ぶ。同
様に、制御ユニット134を介してバス422からバス
424にパイプライン化される関数コードには3サイク
ルの遅れがある。残りのデータブロック即ちALU16
0、中間パイプライン115、及びALU162.16
5は全てルベルのパイプラインレジスタを備えており、
それによって各モジュールの入力バスからその出力バス
までに1クロックサイクルの遅れがある。各制御ユニッ
ト136.138.140.142はそれぞれ同様に1
個のレジスタを備えており、それによって各レベルに於
て各制御信号が対応する入力データと同じサイクルでデ
ータブロックに到達する。
上述した全パイプラインレジスタの結果は、入力データ
及び関数コードがチップの入力に送られてから9サイク
ル後に該チップの出力に現れる。
当業者であれば、異なる数のパイプラインレジスタによ
って容易に他のデバイスを案出することができる。
入力と出力との間の接続が表6乃至表8及び第10図乃
至第12図に要約されている。各表に於ける数は、接続
するために要求されるクロックサイクルの数であり、X
は直接接続を、−一は接続が不可能であることをそれぞ
れ示している。2つの数は2つの異なる通路の結果を示
している。入力部110を簡単化した線図が第10図に
示され、3レベルのレジスタ920.950.960が
表わされている。当業者であれば、その要求に適合させ
て類似のマルチプレクサ/レジスタの構成を容易に考え
出すことができる。第11図及び第12図には、それぞ
れユニット115及びユニット121について類似の線
図が示されている。
第4図に示されるシーケンスに於ては、タイミングが異
なるデータ通路の構成によって調整されることが明かで
ある。例えば、通路01.10.11に於て、入力デー
タが人カニニット内の段をバイパスすることにより、4
つの数がサイクル0に於て乗算器に提供される。また、
複素乗算の場合には、実数項及び虚数項が連続サイクル
に於てALU160から中間マルチプレクサユニット1
15に通過する。サイクル0でデータを出力に送るため
に、より遅いデータが出力レジスタセット120の1段
をバイパスする。この出力レジスタセラ1−120の通
常の待ち時間は、複素乗算及び他の命令によってより後
のデータがパイプラインレジスタレベルを通過すること
により、全ての出力がサイクル0に於て同時に出力ポー
トに送られる以外のサイクルである。別の実施例では、
中間マルチプレクサセットに於て時間のシフトを行うこ
とができる。
より従来の型式に近いRAMベースのFFTシステムが
第2図に示されている。このシステム設計では、対応す
る表9に於てC,D及びE、Fでそれぞれ表されるメモ
リ320.340として記載された2個のRAMバンク
が使用されている。
第3のメモリ330がFFT係数を保持する。各メモリ
は、例えばアドバンスト・マイクロ・デバイシズ(八d
vanced Micro Devlces)の295
40型のような市販されているアドレスジェネレータに
よってアドレスされる。アドレスジェネレータ310が
RAM (ランRAMアクセスメモリ)320を操作し
、アドレスジェネレータ350がRAM−340を操作
し、かつアドレスジェネレータ312がメモリ330を
操作する。
2本のバス212.214がRAM32Qをプロセッサ
に接続し、かつこれらはデータをメモリからまたはメモ
リへ転送できるように双方向性である。これらの双方向
バスは第1図に示される3状態データバツフア170.
172.174.176を用いてチップ」二で実行され
る。バス212.214(Cバス及びDバス)をチップ
への入力として使用する場合、出力バッファ170.1
72がオフになりかつバッファ174.176がオンと
なって、出力データがバス262からバッファ174を
介してバス202(Eバス)に流れ、かつデータがバス
出力264からバッファ176を介してバス204 (
Fバス)に流れる。データの向きが逆になると、バス2
02.204が入力バスとなり、かつバッファ174.
176がオフとなるのに対して、バッファ170.17
2がオンになる。この場合、出力バス262からのデー
タはバッファ170を介してバス212に流れ、かつバ
ス264からのデータがバッファ172を介してバス2
14に流れる。
データの流れの向きに応じて、第10図に示されるよう
なマルチプレクサ及びレジスタからなる入力部110の
マルチプレクサ922.924が選択されて、入力デー
タのためにその時点で構成されているバスから入力デー
タがレジスタ910.912即ちRレジスタ及びSレジ
スタに入るようにする。バス202.204は前記プロ
セッサをRAM340に接続し、かつ双方向性である。
制御装置530は、様々なユニットに適当な制御信号を
送る有限状態機械、CPUまたは他の従来装置を表して
いる。
表9は、8ポイントのFFTについて第2図のシステム
のための計算シーケンスを示している。
使用されるアルゴリズムは、1975年プレンティス・
ホール(Prentice−Hall )発行のラビナ
ー(Rabiner )及びゴールド(Gold)によ
る「セオリー・アンド・アプリケイジョン・オブ・シグ
ナル・プロセッシングj  (Theory and 
Applicationof Signal Proc
essing )の第362頁に示されているような時
間アルゴリズムに於ける従来の10進法である。このア
ルゴリズムの流れ図が第8図に示されている。
第8図及び第9図は、FFTアルゴリズムの計算シーケ
ンスを詳細に示す流れ図である。各黒点は複素データワ
ードの記憶場所を表している。左側の縦の行は、時系列
の入力データTO乃至T7を表わしている。内側の2列
のデータム5乃至A12及びB5乃至B12が中間結果
を表しているのに対して、最後の列FO乃至F7が周波
数領域出力データを表している。各十字形交差は、左側
からの入力として2つの複素データワード(A及びB)
を必要とし、かつ右側に2つの複素結果(A’及びB’
 )を発生させる1個のFFTバタフライを表している
。各バタフライには、その頂点に計算シーケンスを表す
数が表示されている。
また、各バタフライは、下側入力の足にW値を有する。
このW値はB入力の複素乗算に関連する三角係数である
。B′比出力、バタフライの十字形交差の下側右側の足
である。この流れ図に関する詳細な説明は、上述したラ
ビナー及びゴールドの著書の第359頁を参照されたい
バス毎に4つ即ち全部で12のFFTバタフライが必要
である。第1パス(サイクル1〜17)に於て、TO〜
T7で示される複素時間データがRAM320からサイ
クル1乃至8で第1の4つのバタフライについて前記プ
ロセッサに読み込まれる。サイクル10乃至17に於て
、データがRAM340に書き込まれる。そして、サイ
クル18で始まる次のバスに於て、データバスの向きが
反転される。ここで、データがRAM340から読み出
され、かつデータがプロセッサからRAM320に書き
込まれる。サイクル18乃至18に於てデータがRAM
340から読み出されるのに対して、サイクル27乃至
34に於てはバタフライの結果がRAM320に書き込
まれる。再び、サイクル35に於てバスの向きが逆転さ
れ、かつ第3のバスが開始する。サイクル35乃至42
に於て、データがRAM320からプロセッサに読み込
まれ、かつその結果データがサイクル44乃至51に於
てプロセッサからRAM340に書き込まれる。
本発明のパイプラインによって、データがプロセッサに
読み込まれてから書き出されるまでに9サイクルの遅れ
が常にある。より大きなサイズのFFT計算については
、バスの向きが変更された後の最初の9サイクルとバス
の向きが変更される前の9サイクルとを除いて、RAM
への読み出し及び書き込みが同時に行われる点に注意す
べきである。本発明は、ノルデン・システム(Nord
en Systems)からのCAPEチップに基き、
2つのRAMブロック間に同一の双方向バス転送機構を
使用するが、2サイクルのみについてF′FTバタフラ
イを実行しかっCAPEの固定小数点計算より正確な浮
動小数点結果を発生する上述した米国特許出願の改良で
ある。CAPEプロセッサには、前記バタフライを行う
ために4メモリサイクル及びクロックサイクルが必要で
あった。
表10は、第9図に示される定数幾何FFTアルゴリズ
ムに於ける8ポイント10進法の計算シーケンスを示し
ている。このアルゴリズムは、第3図に示されるFIF
Oシステムの構成に適している。FIFOは先入れ先出
しメモリを意味する。
FIFOメモリは、少くとも1個のワードがメモリ内に
既に記憶されている場合には、同時に読み取りかつ書き
込むことができる。定数幾何アルゴリズムについては、
上述した信号処理に関する著書の第576頁に記載され
ている。
4個のFIFOは、それぞれユニット520の制御下に
於て、他(7:)FIFOから独立して読み取りまたは
書き込むように指示される。第3図に示すように、P 
I FO500は、その入力が前記プロセッサの出力バ
ス202であり、かつ前記プロセッサのC入力バスであ
るバス212を駆動するように接続されている。また、
P I FO502は、バス202から入力を受け取り
、かつワードを読むことが要求される際に前記プロセッ
サのD入力バス214を駆動する。ブロック520は、
アルゴリズムによって要求されるようにFIFOに各サ
イクルで読み出しまたは書き込みを行わせる適当な信号
を送る状態機械、CPUまたは他の装置を表す。P I
 FO504は前記プロセッサの出力パス204に接続
されて入力を受け取り、かっこのFIFOの出力は、ワ
ードを読むことが要求される際にC入力バスを駆動する
。また、FIFO506はバス204からデータを受け
取り、がっ要求されるとデータをバス214に送る。F
IFOは、常に連続的にデータを読み出しかつ書き込む
ので、定数幾何FFTアルゴリズムに於てデータを記憶
するのに適している。
初期データは、データ点T4、T6に於てFIFO50
0に記憶され、かつ実数データ及び虚数データがそれぞ
れ記憶される。これらは4ワードは、順に読み出されて
、最初の4サイクルに於て表10に示されるようにCパ
ス(バス212)に現れる。同様にして、P I FO
502は最初にバスD(バス214)にロードされるT
O,T2を保持し、かつP I FO504は最初にバ
ス212にロードされるT5及びT7を保持し、かつF
IFO506はバス214にロードされるT3及びT1
を保持する。最初の4サイクルはP I FO500,
502から読み出して最初の2つのバタフライについて
前記プロセッサにデータを供給する。
次の2つのバターy−yイは、F I FO504,5
゜6から入力データを得る。サイクル1oに於て、最初
のバタフライの結果がバス202.204のパイプライ
ン出力に現われ、かっF I FO502,504に書
き込まれる。
プロセスは続けられるが、このシステムではバスの方向
が決して変化しないので、バタフライ4の結果がメモリ
に書き込まれる前にバタフライ5の計算を開始すること
ができる。バタフライ5は、A6Iがサイクル14でF
 I FO5061:書き込まれるので、サイクル15
で始めることができる。
第2パスの第1バタフライであるバタフライ5は、第1
バスから書き込まれる最後のバタフライであ5す るバタフライ4の結果の前に始めることができるので、
サイクル10.16.17について読み出しサイクルと
書き込みサイクルとが同時に行われる。バタフライ8の
結果が書き出される前にバタフライ9が始まるサイクル
29.30.31に於て第3バスが開始する際に、同様
の状態が生じる。
一般に、より大きなサイズのFFT計算については、計
算の第1パスの一番最初の9サイクル及び最後のバスの
一番最後の9サイクルを除いて全てのサイクルに於て読
み出しサイクルと書き込みサイクルとが重複する。
当業者にとって明かなように、本発明によるデータ通路
は、演算のシーケンスに於てデータ通路が変化する時ま
たは点が重要であるという意味に於て時間成分を有する
。上述したRAMベースの実施例では、データの流れの
向きが反転される前にデータ通路内のデータが「追い出
される」ことが重要である。FIFOベースのシステム
では、データがループ状に循環しているので、この遅れ
が排除される。上述の実施例は、各バスに係数を変えて
同じ式を適応するフーリエ変換に関するものであるが、
実行される算術演算がバスによって異なるような本発明
を利用した例えば関数のたたみこみ(convolut
ion )のような他の算術順序が考えられる。
また、本発明は上述した特定の実施例に限定されるもの
ではなく、その技術的範囲内に於て様々な変形・変更を
加えて実施することができる。例えば、当業者であれば
、第2図及び第3図の係数メモリのように再使用される
べきデータまたは係数をチップ上に記憶するという特徴
を付加することができる。また、RAM320,340
には、入出力データの転送を容易にするためにデュアル
ポート型のRAMを使用することができる。同様に、F
 I FO500〜504は適当なポートを有する2個
または唯1個のメモリユニットとすることができる。ま
た、別の実施例では、RAM320.340をアドレス
ジェネレータ310.350と共に両方のメモリバンク
を収容する1個のユニットに一体化することができる。
名称 CMUL MULJA MULJB MMA MAJA MAJB CMS MSJA CMS J B MUL MULJA MMA MMA J A CMS MSJA 表1 複素乗算/累算命令 関  数 AXB−+C A*XB−C AXB*→C (AXB) +Ac c−+Ac c、 C(A*xB
) +Ac c−+Ac c、C(AXB*) +Ac
 C+ACC,C(AxB) −Ac c→Ac c、
 C(A*XB) −ACC+ACC,C (AxB*) −ACC−Ac c、 CAXb−+C AXb−+C (Axb) +Ac c−+Ac c、 C(A*xb
) +Acc→Acc、C (Axb) −ACC+Ac c、 C(A*xB) 
−Ac c+Ac C,C名称 FFT FFT FFT4 AGSQ 表2 FFT及び大きさの2乗命令 関  数 フォワードDITバタフライ インバースDITバタフライ インバースRadix−4D I T (AIxAI)+ (AQxAQ) → C (A I XA I) +(AQXAQ)+Acc  
 −+Acc、C AGSQA 表3 双対乗算・加算命令 名称    関 数 RTASX    (RxT) +(SxX)→ACC
1YI NRTASX  −(RxT) + (SxX)→AC
C1Y。
RTSSX   (RxT) −(SxX)→Acc、
Y。
NRTSSX  −(RXT) −(SXX)→Acc
、Y。
ARTASX  (RxT) + (SxX)+ACC
→Acc、Y。
ANRTASX −(RXT) + (SXX)+A 
c c−+A c c、 Y。
ARTSSX  (RXT) −(SXX)+ACC→
Ace、、Y。
ANRTSSX −(RxT) −(SxX)+ACC
→Ace、Y。
名称 TSX 表4 双対実数MAC命令 機    能 (RXT)        −+Ya c c、Y(S
XX)        −+Zacc、  ZTAAS
X (RXT)        −+Yacc、Y(’5X
X)+Zacc−+Zacc、ZTASSX (RXT)        −+Yacc、Y(SXX
)  −Zacc−+Zacc、  ZARTSX (RXT)+Ya c c−+Ya c c、Y(SX
X)        −+Zacc、  ZAARTA
ASX (RXT)+Ya c c−+Ya c c、Y(sx
x)+Zacc−+Zacc、  ZAARTASSX (RxT) 十Yac c−+Yac c、Y(SXX
) ASRTSX (RX T) (SxX) ASRTAASX (RX T) (SxX) ASRTASSX (RX T) (SxX) −Za c c−+Za c c。
Yacc−+Yacc。
→Zacc。
Yacc−+Yacc。
十Zacc−+ZacC。
Ya c c−+Ya c c、Y Zacc−+Zacc、  Z 表5 累算命令 名称   機 能 LR8 R−+Yacc、 Y; S−+ZaccLTX T−+Yacc、Y; X−+Zacc。
LR R−+Ya c c、 Y ; R−+Z a c c
LS S−+Yacc、Y; S−+Zacc。
LT T−+Yacc、Y; T−+Zacc。
LX X−+Ya c c、 Y ; X−+Z a c c
LO O−+Zacc、Y; O−+ZaccPLPT   
 部分和プリロード DDR8 UBR3 DDR UBR DDS UBS DDPT R+Ya c c−+Ya c c。
S+Zacc−+Zacc。
R−Ya c c−+Ya c c。
5−Ya c c−”Za c c。
R+Ya c c−+Ya c c。
R+Z a CC+Z a c c。
R−Ya c c−*Ya c c。
R−Z a c c−*Z a c c。
S+Yacc→Yacc。
S+Zacc−+Zacc。
5−Ya c c−+Ya c c。
5−Zacc−+Zacc。
部分和加算 表6 人カバイブライン+マルチプレクサ・モジュール116
 の接続入力バス 212 214 216 218出
力バス 229         −−1  また1ま 2  
  2226    1または 2     2228
         −−1 または 2    2  
1 または 2表7 中間パイプライン+マルチプレクサ書モジュール115
の接続入力バス 241 238 236 243出力
バス 244      X−−11 248−−−−IXまたは 1 表8 出カバイブライン+マルチプレクサ・モジュール120
の接I入カバス    247     249出力バ
ス 262          1または 2または 3 
      2264          1または 
2        1または 2W2+ WOQ 2Q WOQ 2Q 7Q 5Q 5Q 6Q 6Q 7Q 7Q 8Q 八8Q lll IOI lll BIIQ − 9Q 12Q − BIOQ − BIIQ − 9Q 12Q − BIOQ − B10  WOI 9Q WOQ 表9 RAMベースのシステム使用の8ポイントFFT計算シ
ーケンスバ ス             RAMDI
RCD    T    X    E    PCD
EPOT41  T4Q  WOI  WOQ−−rO
TOITOQ−−−−r OTe3   T6Q  WOI   WOQ   −
−rOT2T2Q−−−−r OT51   T5Q   WOI   WOQ   
−−rOTIITIQ−−−−r OT71   T7Q  WOI   WOQ   −
−rOT31T3Q−−−−r O 0−−−−A61A6Qw O−−−−八5    l5Q    wO−−−−B
flilBfiQw O−−−−B51B5Qw O−−−−A81A8Qw O−−−−八7   Δ7Q    wO−−−−88
1,88Q    w IO IO ll ll BIOQ Wll l0Q BIIQ W2+ I IQ B12Q W31 12Q LQ 2Q 3Q 4Q WOQ 5Q IQ 6Q 2Q 7Q 3Q 表10 FIFOベースのシステム使用の8−ポイントFFT計
算シーケンス式 ス           FIFOサ
イクル  CD     X     E     F
’ECEDF’CPDLT41  TOI  WOI 
  −−r  r2T4Q   TOQ   WOQ 
    −−r    r3T61   T21   
WOI     −−r    r4T6Q   T2
Q   WOQ     −−r    r5T51 
  Tll   WOI     −−r    r6
T5Q   TIQ   WOQ     −−r  
  r7T71   T31   WOI     −
−r    r8T7Q   T7Q   WOQ  
   −−r    r10   −   −    
−A51A71         w       w
ll   −−−八5Q   A7Q        
w       wl、2   −    −    
−851   B71    w       wl3
   −    −    −B5QB7Q    w
       wl、4   −   −    −A
61A81         w       wl、
5B51   A51   WOI   A6Q   
A8Q    r   r、w      wl、BB
5Q   八5Q   WOQ   B81  88]
   r、w   r    wl、7Bel  A6
1  WOI  B10  B10  r、w  rl
8 B10  Δ6QWOQ   −−r    rl
、9  B71  A71  W2I20 B10  
A7Q  W2Q 21 B81  A81  W21 22 B10  A8Q  W2Q B A91  AIII     w A9Q  AIIQ     w B91  B111  w B9Q  BIIQ  W Δ]旧A121    w B91  A91  WOI  ΔIOQ A12Q 
 、r、wB9Q  A9Q  WOQ  BIOI 
B121  ;9□、・1rBIOI  Al0I  
Wll  BIOQ BL2Q r、w  rBIOQ
AIOQWIQ   −−r   rBill  AI
LI  W21 BIIQ AIIQ W2Q B121  A121  W31 B12Q A12Q W3Q OI OQ il IQ 2Q 3Q Pd2      w 4Q F51   w P5Q   w BI 6Q P71   w P7Q   w
【図面の簡単な説明】
第1図は、本発明による回路を示す高レベル論理図であ
る。 第2図は、RAMベースのシステムに使用するシステム
を示す論理図である。 第3図は、FIFOベースのシステムを示す論理図であ
る。 第4図は、複素乗算に関する異なるデータ通路を示す説
明図である。 第5図は、FFTバタフライ演算に関する異なるデータ
通路を示す説明図である。 第6図は、データの平方演算に有用なデータ通路を示す
説明図である。 第7図は、マトリックス乗算のシーケンスを示す説明図
である。 第8図及び第9図は、それぞれ第2図及び第3図のシス
テムに於けるデータの流れを示す線図である。 第10図は、第1図の入力部を詳細に説明する論理図で
ある。 第11図は、第1図の中間マルチプレクサ115を詳細
に示す論理図である。 第12図は、第1図の出力部を詳細に示す論理図である
。 30・・・第1処理部  110・・・入力部115・
・・中間マルチプレクサセット120・・・第2処理部
 125・・・マルチプレクサ127・・・データパイ
プ130・・・制御ステーション132.134.13
6.138.140.142・・・制御ユニット 150.155・・・マルチプレクサ 160.162.165・・・ALU 170.172・・・出力バッファ 174.176・・・バッファ 202.204・・・バス 241.243・・・フィードバック通路212.21
4.216.218・・・バス310.312・・・ア
ドレスジェネレータ320・・・RAM    330
・・・メモリ340・・・RAM 350・・・アドレスジェネレータ 500.502.504.506・・・FIFO508
・・・メモリ 510・・・アドレスジェネレータ 520.530・・・制御ユニット 910.912・・・レジスタ

Claims (16)

    【特許請求の範囲】
  1. (1)所定の数の回路クロックサイクルからなる待ち時
    間を有する一連のパイプラインサイクルに於てデータが
    所定の制御可能に選択されたデータ通路セットのいずれ
    かのデータ通路の処理段セットを順番に通過し、かつ記
    憶された制御データを有しかつ前記処理段セットに対応
    する制御レジスタセットから順に復号された制御下で操
    作されるようなパイプラインデータ構造を有し、浮動小
    数点数を処理するための集積回路であって、 少なくとも4個のデータ入出力手段の内の少なくとも2
    個の入出力手段を2個の乗算器の入力ポートに制御可能
    に接続するための第1レジスタ・マルチプレクサセット
    を有し、かつ前記乗算器が前記第1レジスタ・マルチプ
    レクサセットと並列に接続されると共に、少くとも1ク
    ロックサイクルでデータを記憶するための制御可能な記
    憶手段と、記憶手段をバイパスするための制御可能なバ
    イパス手段と、少くとも2つの通路にデータを向けるた
    めの制御可能なマルチプレックス手段とを備え、所定の
    算術演算のためのデータが前記第1レジスタ・マルチプ
    レクサセット内で所定の基準コンフィギュレーションに
    変換されて少くとも2つのコンフィギュレーションで前
    記集積回路内に入るようにする入力部と、 その出力データについて処理するために2個の前記乗算
    器の両方の出力ポートに接続された第1ALU(演算論
    理装置)と、 前記第1ALUと、前記両乗算器を回避する前記第1レ
    ジスタ・マルチプレクサセットからの第2データ通路と
    、第3レジスタ・マルチプレクサセットからの2本のフ
    ィードバック通路とに接続された第2レジスタ・マルチ
    プレクサセットと、前記第2レジスタ・マルチプレクサ
    セットと前記第3レジスタ・マルチプレクサセットとの
    間に並列に接続され、かつそれぞれが、前記第2レジス
    タ・マルチプレクサセットまたは前記第3レジスタ・マ
    ルチプレクサセットの一方からのレジスタを用いて2個
    の前記乗算器の所定の一方からの出力データを累算する
    アキュムレータモードを有するように、前記第2レジス
    タ・マルチプレクサセットの部分から前記第3レジスタ
    ・マルチプレクサセットの部分を通って前記第2レジス
    タ・マルチプレクサセットに戻るデータ通路に接続され
    ている2個のALUとを備えることを特徴とする集積回
    路。
  2. (2)少くとも2個の前記コンフィギュレーションが、
    第1及び第2実数成分と第1及び第2虚数成分とを有す
    る第1及び第2複素数が4個の前記データポートに並列
    に送られる第1コンフィギュレーションと、前記第1実
    数成分及び前記第1虚数成分が4個のデータポートのい
    ずれかに直列に送られ、かつ前記第2実数成分及び前記
    第2虚数成分が4個の前記データポートの他方に直列に
    送られる第2コンフィギュレーションとからなり、前記
    第2コンフィギュレーションに於て、直列に入ったデー
    タが2個の前記乗算器に並列に送られるように、制御可
    能な前記記憶手段及び前記バイパス手段が前記第1及び
    第2複素数の2つの前記成分を処理することを特徴とす
    る特許請求の範囲第1項に記載の集積回路。
  3. (3)前記第1及び第2複素数の選択された成分が、第
    1パイプラインサイクルで乗算演算を実行する際に前記
    入力部に保持され、かつ第2パイプラインサイクルの際
    に2個の前記乗算器に再び送られるように、2個の前記
    乗算器が、2クロックサイクルで1つの複素乗算が要求
    される4つの乗算演算を実行し、かつ前記データが第1
    パイプラインサイクルに於て前記第1コンフィギュレー
    ションの前記データポートに供給されることを特徴とす
    る特許請求の範囲第2項に記載の集積回路。
  4. (4)前記第1及び第2複素数の全ての前記成分が第1
    の組合せに於て2個の前記乗算器に送られ、かつ前記第
    1パイプラインサイクルで前記入力部に保持され、前記
    第1及び第2複素数の全ての前記成分が更に前記第2パ
    イプラインサイクルに於て第2の組合せに於て2個の前
    記乗算器に送られることを特徴とする特許請求の範囲第
    3項に記載の集積回路。
  5. (5)前記第2コンフィギュレーションに於て、2個の
    前記乗算器が2クロックサイクルで複素乗算に要求され
    る4個の乗算演算を実行し、それによって、2つの前記
    複素数の2つの成分が第1パイプラインサイクルに入り
    、かつ前記第1パイプラインサイクルの直後の第2パイ
    プラインサイクルに前記2つの複素数の残りの2つの成
    分が入ると共に、前記第2パイプラインサイクルに入っ
    たデータが1サイクルで前記入力部に記憶され、かつ即
    座に2個の前記乗算器に送られることによって、乗算が
    前記第1パイプラインサイクルで行われて前記第1パイ
    プラインサイクル及び前記第2パイプラインサイクル双
    方に入ったデータに影響を与え、かつ、前記第1パイプ
    ラインサイクルに入ったデータが前記入力部に保持され
    て前記第2パイプラインサイクルに於て前記第2パイプ
    ラインサイクルに入ったデータと乗算されることを特徴
    とする特許請求の範囲第2項に記載の集積回路。
  6. (6)複素積を作る第1及び第2複素数の乗算と、アキ
    ュムレータレジスタに記憶される量への前記積の加算と
    からなる乗算・累算演算がデータ通路に従って、前記第
    1及び第2複素数の4つの前記成分が前記第1パイプラ
    インサイクルまたは第2パイプラインサイクルの少くと
    も一方に於て前記集積回路に入り、2個の前記乗算器を
    通過して4つの積項を作り、4個の前記積項が前記第1
    ALUに於て2つずつ加算されて前記第1及び第2パイ
    プラインサイクルの際に実数積成分及び虚数積成分を形
    成し、かつ前記実数積成分及び虚数積成分が前記第2レ
    ジスタ・マルチプレクサセットを通過しかつ少くとも一
    方の前記ALUに於て実数部分和及び虚数部分和に累算
    されるように行われることを特徴とすると特許請求の範
    囲第1項に記載の集積回路。
  7. (7)前記第1及び第2積成分が、その中の第1の成分
    が前記第1パイプラインサイクルに送られかつ第2の成
    分が前記第2パイプラインサイクルで送られると共に、
    1クロックサイクルの相対的遅れをもって2個の前記A
    LUに送られるように、前記第1ALUから前記第2レ
    ジスタ・マルチプレクサセット内に送られ、かつ 前記第1及び第2積成分が、2個の前記ALUの出力か
    ら前記第3レジスタ・マルチプレクサセットを介して前
    記第2レジスタ・マルチプレクサセットにデータをフィ
    ードバックすることによって形成される第1及び第2ア
    キュムレータに累算され、それによって前記実数積成分
    及び虚数積成分と、対応する実数部分アキュムレータ和
    及び虚数アキュムレータ和とが前記第2レジスタ・マル
    チプレクサセットを同時に通過することを特徴とする特
    許請求の範囲第6項に記載の集積回路。
  8. (8)一方のALU及び部分和項が第2サイクルを通過
    することを特徴とする特許請求の範囲第1項に記載の集
    積回路。
  9. (9)マトリックス乗算に適した所定のデータ通路が制
    御可能に選択された前記データ通路セットから選択され
    るようになっており、4つの数からなる入力セットが第
    1パイプラインサイクルで前記入力部に送られ、 前記第1パイプラインサイクルが2個の前記乗算器を通
    過して2つの中間積項を形成するように、前記4数入力
    セットが2連続クロックサイクルの間に2個の前記乗算
    器に於て所定の通り2つずつ同時に乗算され、 2つの前記中間積項が前記第1ALUに入りかつ加算さ
    れて第1部分和項を作り、かつ、 前記部分和項が時間従属データ通路に於て前記第2レジ
    スタ・マルチプレクサセットを介して2個の前記ALU
    の選択した一方の前記ALUに入り、かつ前記第3レジ
    スタ・マルチプレクサセットを通過して所定の出力デー
    タポートに送られることを特徴とする特許請求の範囲第
    1項に記載の集積回路。
  10. (10)2個の前記ALUが共にアキュムレータとして
    構成され、かつ2つの部分和が奇数サイクル及び偶数サ
    イクルで各アキュムレータに於て同時に累算され、それ
    によって4つの部分和が2個の前記ALUによって形成
    される4個の有効アキュムレータに同時に現われ、かつ
    前記集積回路が前記入力部から2個の前記乗算器、前記
    第1ALU、前記第2レジスタ・マルチプレクサセット
    及び2個の前記ALUの一方を通過して延長する4本の
    データ通路を有し、かつその内の2本の前記データ通路
    が前記各ALUに同時に存在することによって、4要素
    のベクトルと4行4列のマトリックスとの乗算に要求さ
    れる4個の前記部分和項を計算できるようになっている
    ことを特徴とする特許請求の範囲第9項に記載の集積回
    路。
  11. (11)それぞれに実数部分と虚数部分とを有する2つ
    の浮動小数点複素数を乗算し、かつそれらの積を2つの
    連続パイプラインサイクルで累算するためのパイプライ
    ンアーキテクチャを有し、かつ入力モジュールと、2個
    の乗算器と、少くとも2個のALUとを備える集積回路
    であって、前記入力モジュールが、2つの前記複素数の
    4つの成分の少なくとも2成分を同時に受け取ることが
    でき、2個の前記複素数の4つの成分の第1セットを同
    時に第1パイプラインサイクルに送って、パイプライン
    アーキテクチャを順に通過させかつ次に第2パイプライ
    ンサイクルに於て同時に2つの前記複素数の4つの成分
    の第2セットを前記入力モジュールと少くとも2個の前
    記ALUの内の第1ALUの2個の入力ポートとの間に
    並列に接続される2個の前記乗算器に送ることができ、
    2個の前記乗算器がそれぞれ内部パイプラインレジスタ
    を有し、それによって前記2つの複素数の4成分の前記
    第1セットが前記乗算器の前記内部パイプラインレジス
    タ内にある時前記複素数の4成分の前記第2セットが前
    記第2パイプラインサイクルに於て前記乗算器に送られ
    、前記第1セット及び第2セットが前記乗算器内で同時
    に演算処理されて前記積の2つの実数部分項と2つの虚
    数部分項とを形成し、 前記第1ALUが2つの前記連続パイプラインサイクル
    に於て2つの複素数を加算できるようなっており、2つ
    の前記複素数の前記積の前記実数部分項及び虚数部分項
    が2つの前記連続パイプラインサイクルに於て順次加算
    されて実数積成分と虚数積成分とを有する2個の前記複
    素数の複素積を形成し、前記第1ALUが、2個の前記
    入力ポートからデータが送られる内部パイプラインレジ
    スタを有し、かつ該データが次に第2クロックサイクル
    で前記第1ALUに送り出されるようになっており、そ
    れによって前記第1セットと第2セットとが同時に前記
    第ALU内で演算処理され、かつ、 少なくとも2個の前記ALUの第2ALUが前記第1A
    LUの出力に接続され、かつ2つの前記連続パイプライ
    ンサイクルに於て前記複素積の前記実数積成分と虚数積
    成分とが実数累算部分和項と虚数累算部分和項とのに加
    算によって累算されるようにアキュムレータとして機能
    するようになっており、前記実数または虚数積成分の一
    方が前記第1パイプラインサイクルで累算され、かつそ
    の他方が前記第2パイプラインサイクルで累算されると
    共に、前記第2ALUが、1クロックサイクルでデータ
    が入力ポートから送られるような内部パイプラインレジ
    スタを有しかつ該データが第2クロックサイクルで前記
    第1ALUから送り出され、それによって前記実数部分
    和項及び虚数部分和項が前記第2ALU内で同時に演算
    処理されることを特徴とする集積回路。
  12. (12)前記第1ALUが、前記第2ALUの第1入力
    ポート及び第2入力ポートと、前記第1ALUの出力ポ
    ート及び前記第2ALUの出力ポートに接続されたフィ
    ードバックバスとの間に制御可能なデータ通路を設ける
    ためのマルチプレクサ及びレジスタのネットワークを介
    して前記第2ALUに接続され、それによって前記マル
    チプレクサ・レジスタネットワークが前記第2ALUと
    結合されてアキュムレータを形成することを特徴とする
    特許請求の範囲第11項に記載の集積回路。
  13. (13)少くとも2個のデータメモリユニットと、前記
    メモリユニットに接続された単チップ算術プロセッサと
    を有する複素数を処理するための演算処理システムであ
    って、 前記単チップ算術プロセッサがパイプラインアーキテク
    チャと少くとも4個の双方向データポートと少くとも1
    個の追加ポートとを有し、かつ前記各データメモリユニ
    ットが前記双方向データポートの対に接続されており、 前記算術プロセッサが、その内部にデータを少くとも2
    つのデータ通路コンフィギュレーションのいずれかに送
    るための時間従属データ通路を設定するための内部デー
    タ通路制御手段と、前記両双方向データポート対がデー
    タをメモリとの間で両方向に送って複素数の実数成分と
    虚数成分とを同時に運ぶ第1コンフィギュレーションと
    、前記両双方向データポート対がデータを1方向に送っ
    て複素数の実数成分と虚数成分とを同時に運ぶ第2コン
    フィギュレーションとを有し、それによって前記単チッ
    プ算術プロセッサが、RAMベースのデータ処理装置に
    於て、データが第1データポート対を介して第1RAM
    から読み出されて前記プロセッサにより演算処理され、
    かつその演算結果がデータの流れが逆転される第2パス
    より先の第1パスに於て第2データポート対を介して第
    2RAMに書き込まれるように使用され、かつFIFO
    ベースのデータ処理装置に於て、データが少くとも2つ
    のパスに於てFIFOメモリから第1データポート対を
    介して1方向に送られて、かつ第2データポートから前
    記FIFOメモリに戻るように使用されることを特徴と
    する演算処理システム。
  14. (14)前記算術プロセッサが、前記第1コンフィギュ
    レーションに於ける前記データ通路が前記第1データポ
    ート対の第1データポート及び第2データポートに同時
    に送られる実数部分と虚数部分とを有する複素数の第1
    セットを順に前記第1データポート対に送り込むような
    マルチパスFFTバタフライ演算を実行するための乗算
    手段とALU手段とを有し、 前記第1複素数セットが制御可能なマルチプレクサ・レ
    ジスタ手段を介して1対の乗算器に送られ、前記第1複
    素数セットの所定の第1対が第1及び第2パイプライン
    サイクルに於ける前記第1データポート対に送られて前
    記第1及び第2パイプラインサイクルに於て前記算術プ
    ロセッサを通過し、前記FFTバタフライ演算によって
    得られる複素数が所定のプロセッサ待ち時間の後に第2
    データポート対を介して前記第2RAMに送られ、かつ
    前記第1複素数セットの残りの複素数が同じデータ通路
    に沿って順に前記算術プロセッサを通過することによっ
    て、前記FFTバタフライ演算によって得られる第2複
    素数セットが前記第1パスの後で前記第2RAMに記憶
    されるようになっており、かつ、 前記第2複素数セットの最後の複素数が前記第2RAM
    に記憶された後に、前記内部データ通路制御手段がデー
    タ通路の接続を変更し、かつ前記第2RAMから前記第
    2データポート対を介して前記第1RAMに延長する第
    2データ通路を介して前記第2複素数セットについて前
    記FFTバタフライ演算を繰り返し実行することを特徴
    とする特許請求の範囲第13項に記載の演算処理システ
    ム。
  15. (15)前記算術プロセッサが、前記第2コンフィグレ
    ーションに於ける前記データ通路が前記第1データポー
    ト対の一方のデータポート対に順に送られる実数部分と
    複素部分とを有する複素数の第1セットを順にFIFO
    手段から前記第1データポート対に送り込むようなマル
    チパスFFTバタフライ演算を実行するための乗算手段
    とALU手段とを備え、 前記第2複素数セットが制御可能なマルチプレクサ・レ
    ジスタ手段を介して1対の乗算器に送られ、前記第1複
    素数セットの所定の第1対が第1及び第2パイプライン
    サイクルに於て前記第1データポート対に送られて前記
    第1及び第2パイプラインサイクルに於て前記算術プロ
    セッサを通過し、前記FFTバタフライ演算によって得
    られる複素数が所定のプロセッサ待ち時間の後に第2デ
    ータポート対を介して前記FIFO手段に送られ、かつ
    前記第1複素数セットの残りの複素数が同じデータ通路
    に沿って順に前記算術プセッサを通過することによって
    、前記FFTバタフライ演算によって得られる第2複素
    数セットが前記待ち時間の後の前記開始時及び前記第1
    パスの間に記憶され、かつ、 前記算術プロセッサが、前記第2複素数セットについて
    前記FFTバタフライ演算を前記第2複素数セットの最
    後の複素数が前記FIFO手段に記憶される前に繰り返
    して実行し始め、それらを前記第1データポート対を介
    して読み込みかつ前記FFTバタフライ演算によって得
    られる第3複素数セットを前記FIFO手段に書き込む
    ことを特徴とする特許請求の範囲第13項に記載の演算
    処理システム。
  16. (16)前記FIFO手段が、前記第2データポート対
    と前記第1データポート対との間に並列に接続された2
    対のFIFOと、それぞれが前記入力ポート対の一方の
    入力ポートに接続された第1FIFO対に接続された第
    1出力ポートと、それぞれが前記入力ポート対の一方の
    入力ポートに接続された第2FIFO対に接続された第
    2出力ポートとを有し、前記第2データポート対の各デ
    ータポートと前記第1データポート対の両データポート
    との間にフィードバックデータ通路が設定され、かつ、 出力データポートから出現する数を該出力データポート
    に接続された前記FIFO対の一方または他方に選択的
    に送り込み、それによって前記複素数セットが並列をな
    す前記FIFOの所定の複素数の部分集合として記憶さ
    れ、かつフィードバックされたデータが並列をなす1対
    のFIFOに送り込まれて2つずつ同時に前記第1デー
    タポート対に送られる制御手段を備えることを特徴とす
    る特許請求の範囲第15項に記載の演算処理システム。
JP1261219A 1988-10-05 1989-10-05 集積回路と演算処理システム Pending JPH02210538A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US07/253,826 US4996661A (en) 1988-10-05 1988-10-05 Single chip complex floating point numeric processor
US253,826 1988-10-05

Publications (1)

Publication Number Publication Date
JPH02210538A true JPH02210538A (ja) 1990-08-21

Family

ID=22961863

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1261219A Pending JPH02210538A (ja) 1988-10-05 1989-10-05 集積回路と演算処理システム

Country Status (5)

Country Link
US (1) US4996661A (ja)
JP (1) JPH02210538A (ja)
DE (1) DE3933171A1 (ja)
FR (1) FR2637397A1 (ja)
GB (1) GB2224376A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1994023384A1 (en) * 1993-03-31 1994-10-13 Sony Corporation Apparatus for adaptively processing video signals
JP2016045703A (ja) * 2014-08-22 2016-04-04 富士通株式会社 処理装置、処理装置の処理方法及びプログラム
JP2016530631A (ja) * 2013-08-14 2016-09-29 クアルコム,インコーポレイテッド ベクトルの算術的削減

Families Citing this family (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0235524A (ja) * 1988-03-14 1990-02-06 Advanced Micro Devicds Inc バスコンパチブルプログラマブルシーケンサ
US5153848A (en) * 1988-06-17 1992-10-06 Bipolar Integrated Technology, Inc. Floating point processor with internal free-running clock
US5179530A (en) * 1989-11-03 1993-01-12 Zoran Corporation Architecture for integrated concurrent vector signal processor
EP0442116A3 (en) * 1990-02-13 1993-03-03 Hewlett-Packard Company Pipeline method and apparatus
US5163017A (en) * 1990-03-23 1992-11-10 Texas Instruments Incorporated Pipelined Fast Fourier Transform (FFT) architecture
US5128888A (en) * 1990-04-02 1992-07-07 Advanced Micro Devices, Inc. Arithmetic unit having multiple accumulators
US5055712A (en) * 1990-04-05 1991-10-08 National Semiconductor Corp. Register file with programmable control, decode and/or data manipulation
US5179531A (en) * 1990-04-27 1993-01-12 Pioneer Electronic Corporation Accelerated digital signal processor
JP2959104B2 (ja) * 1990-10-31 1999-10-06 日本電気株式会社 信号処理プロセッサ
US5421028A (en) * 1991-03-15 1995-05-30 Hewlett-Packard Company Processing commands and data in a common pipeline path in a high-speed computer graphics system
DE4130451B4 (de) * 1991-09-13 2004-09-16 Diehl Stiftung & Co.Kg Schaltungsstruktur zur Durchführung der schnellen Fourier-Transformation
US5420815A (en) * 1991-10-29 1995-05-30 Advanced Micro Devices, Inc. Digital multiplication and accumulation system
US5241493A (en) * 1991-12-16 1993-08-31 International Business Machines Corporation Floating point arithmetic unit with size efficient pipelined multiply-add architecture
WO1993021577A1 (en) * 1992-04-09 1993-10-28 Electronic Associates, Inc. Multiprocessor computer system and method for parallel processing of scalar operations
US5845093A (en) * 1992-05-01 1998-12-01 Sharp Microelectronics Technology, Inc. Multi-port digital signal processor
US5603012A (en) * 1992-06-30 1997-02-11 Discovision Associates Start code detector
US5329283A (en) * 1993-04-28 1994-07-12 Environmental Research Institute Of Michigan Synthetic aperture radar digital signal processor
DE69415126T2 (de) * 1993-10-21 1999-07-08 Sun Microsystems Inc Gegenflusspipelineprozessor
KR970002394B1 (ko) * 1994-05-09 1997-03-05 삼성전자 주식회사 산술 논리 연산장치와 다중 가산기들 사이의 데이타 전송회로
US5778250A (en) * 1994-05-23 1998-07-07 Cirrus Logic, Inc. Method and apparatus for dynamically adjusting the number of stages of a multiple stage pipeline
US5717620A (en) * 1995-10-24 1998-02-10 Airnet Communications Corporation Improved-accuracy fast-Fourier-transform butterfly circuit
GB2317466B (en) * 1996-09-23 2000-11-08 Advanced Risc Mach Ltd Data processing condition code flags
US5996066A (en) * 1996-10-10 1999-11-30 Sun Microsystems, Inc. Partitioned multiply and add/subtract instruction for CPU with integrated graphics functions
US6205459B1 (en) * 1996-12-18 2001-03-20 Yamaha Corporation Digital signal processor and digital signal processing system incorporating same
US5941940A (en) * 1997-06-30 1999-08-24 Lucent Technologies Inc. Digital signal processor architecture optimized for performing fast Fourier Transforms
US6549925B1 (en) * 1998-05-18 2003-04-15 Globespanvirata, Inc. Circuit for computing a fast fourier transform
US6557022B1 (en) * 2000-02-26 2003-04-29 Qualcomm, Incorporated Digital signal processor with coupled multiply-accumulate units
US6625630B1 (en) * 2000-06-05 2003-09-23 Dsp Group Ltd. Two cycle FFT
WO2002037259A1 (en) * 2000-11-01 2002-05-10 Bops, Inc. Methods and apparatus for efficient complex long multiplication and covariance matrix implementation
US6748411B1 (en) 2000-11-20 2004-06-08 Agere Systems Inc. Hierarchical carry-select multiple-input split adder
US7010558B2 (en) * 2001-04-19 2006-03-07 Arc International Data processor with enhanced instruction execution and method
JP2003016051A (ja) * 2001-06-29 2003-01-17 Nec Corp 複素ベクトル演算プロセッサ
JP2005309474A (ja) * 2002-06-28 2005-11-04 Nokia Corp 離散コサイン変換(dct)を実行するために用いるdctプロセッサ
KR100492091B1 (ko) * 2002-12-10 2005-06-01 삼성전자주식회사 프로그래머블 프로세서에서의 고속 푸리에 변환 연산회로및 연산방법
US7660841B2 (en) * 2004-02-20 2010-02-09 Altera Corporation Flexible accumulator in digital signal processing circuitry
EP1728171A2 (en) * 2004-03-26 2006-12-06 Atmel Corporation Dual-processor complex domain floating-point dsp system on chip
ITMI20040600A1 (it) * 2004-03-26 2004-06-26 Atmel Corp Sistema dsp su chip a doppio processore a virgola mobile nel dominio complesso
US8250337B2 (en) * 2006-04-28 2012-08-21 Qualcomm Incorporated Array processor with two parallel processing paths of multipliers and ALUs with idle operation capability controlled by portions of opcode including indication of valid output
US8175853B2 (en) * 2008-03-28 2012-05-08 International Business Machines Corporation Systems and methods for a combined matrix-vector and matrix transpose vector multiply for a block-sparse matrix
CN102768654A (zh) * 2011-05-05 2012-11-07 中兴通讯股份有限公司 具有fft基2蝶运算处理能力的装置及其实现运算的方法
US9329835B1 (en) * 2011-10-19 2016-05-03 Marvell International Ltd. Systems and methods for performing mathematical functions
US9274750B2 (en) * 2012-04-20 2016-03-01 Futurewei Technologies, Inc. System and method for signal processing in digital signal processors
US9279883B2 (en) * 2013-02-19 2016-03-08 Infineon Technologies Ag Method and device for radar applications
US9098449B2 (en) 2013-03-15 2015-08-04 Analog Devices, Inc. FFT accelerator
US9672192B2 (en) * 2014-11-11 2017-06-06 Texas Instruments Incorporated High performance implementation of the FFT butterfly computation
US11983530B2 (en) * 2020-03-27 2024-05-14 Intel Corporation Reconfigurable digital signal processing (DSP) vector engine

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3800130A (en) * 1973-07-09 1974-03-26 Rca Corp Fast fourier transform stage using floating point numbers
US4025771A (en) * 1974-03-25 1977-05-24 Hughes Aircraft Company Pipe line high speed signal processor
US4107773A (en) * 1974-05-13 1978-08-15 Texas Instruments Incorporated Advanced array transform processor with fixed/floating point formats
JPS5833572B2 (ja) * 1977-10-21 1983-07-20 株式会社東芝 情報処理方式
GB2077009B (en) * 1980-05-30 1985-04-17 Fairchild Camera Instr Co Microprocessor
KR860001434B1 (ko) * 1980-11-21 1986-09-24 후지쑤 가부시끼가이샤 데이타 처리시 스템
US4488252A (en) * 1982-02-22 1984-12-11 Raytheon Company Floating point addition architecture
US4589067A (en) * 1983-05-27 1986-05-13 Analogic Corporation Full floating point vector processor with dynamically configurable multifunction pipelined ALU
US4612626A (en) * 1983-12-27 1986-09-16 Motorola Inc. Method of performing real input fast fourier transforms simultaneously on two data streams
FR2568036B1 (fr) * 1984-07-20 1989-06-02 Thomson Csf Circuit de calcul
US4689762A (en) * 1984-09-10 1987-08-25 Sanders Associates, Inc. Dynamically configurable fast Fourier transform butterfly circuit
US4794517A (en) * 1985-04-15 1988-12-27 International Business Machines Corporation Three phased pipelined signal processor
EP0211613A3 (en) * 1985-07-31 1989-05-10 Sperry Corporation Scientific processor vector file organization
US4754412A (en) * 1985-10-07 1988-06-28 Schlumberger Systems & Services, Inc. Arithmetic logic system using the output of a first alu to control the operation of a second alu

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1994023384A1 (en) * 1993-03-31 1994-10-13 Sony Corporation Apparatus for adaptively processing video signals
JP2016530631A (ja) * 2013-08-14 2016-09-29 クアルコム,インコーポレイテッド ベクトルの算術的削減
JP2016045703A (ja) * 2014-08-22 2016-04-04 富士通株式会社 処理装置、処理装置の処理方法及びプログラム

Also Published As

Publication number Publication date
GB2224376A (en) 1990-05-02
DE3933171A1 (de) 1990-04-12
GB8922234D0 (en) 1989-11-15
FR2637397A1 (fr) 1990-04-06
US4996661A (en) 1991-02-26

Similar Documents

Publication Publication Date Title
JPH02210538A (ja) 集積回路と演算処理システム
EP0282825B1 (en) Digital signal processor
US5303172A (en) Pipelined combination and vector signal processor
Ramacher SYNAPSE—A neurocomputer that synthesizes neural algorithms on a parallel systolic engine
US5226171A (en) Parallel vector processing system for individual and broadcast distribution of operands and control information
US5081573A (en) Parallel processing system
EP0075593B1 (en) A bit slice microprogrammable processor for signal processing applications
US5381357A (en) Complex adaptive fir filter
EP0268435B1 (en) Multinode reconfigurable pipeline computer
KR970001899B1 (ko) 메모리연결형 파면어레이 프로세서
JP2744526B2 (ja) 準16基数プロセッサおよび方法
US3787673A (en) Pipelined high speed arithmetic unit
US4740894A (en) Computing processor with memoryless function units each connected to different part of a multiported memory
US5669010A (en) Cascaded two-stage computational SIMD engine having multi-port memory and multiple arithmetic units
US4807183A (en) Programmable interconnection chip for computer system functional modules
US5361367A (en) Highly parallel reconfigurable computer architecture for robotic computation having plural processor cells each having right and left ensembles of plural processors
JPH07141175A (ja) アクティブメモリおよび処理方式
JPH03138759A (ja) 信号プロセツサ
JPH0425586B2 (ja)
JPH0228864A (ja) マルチプロセッサ・サブシステム
US4953119A (en) Multiplier circuit with selectively interconnected pipelined multipliers for selectively multiplication of fixed and floating point numbers
US4524428A (en) Modular input-programmable logic circuits for use in a modular array processor
US6622153B1 (en) Virtual parallel multiplier-accumulator
US4860249A (en) Multizone array processor implementing two sided zone buffers with each side being dynamically configured as a working or I/O side
US5845093A (en) Multi-port digital signal processor