JPH05197550A - 超並列計算機のalu構成方式 - Google Patents

超並列計算機のalu構成方式

Info

Publication number
JPH05197550A
JPH05197550A JP874792A JP874792A JPH05197550A JP H05197550 A JPH05197550 A JP H05197550A JP 874792 A JP874792 A JP 874792A JP 874792 A JP874792 A JP 874792A JP H05197550 A JPH05197550 A JP H05197550A
Authority
JP
Japan
Prior art keywords
address
memory
alu
input
stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP874792A
Other languages
English (en)
Inventor
Sanehisa Doi
実久 土肥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP874792A priority Critical patent/JPH05197550A/ja
Publication of JPH05197550A publication Critical patent/JPH05197550A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Advance Control (AREA)
  • Multi Processors (AREA)

Abstract

(57)【要約】 【目的】ALUの構成に簡単な機能を追加して処理速度
を向上することのできる超並列計算機のALU構成方式
を提供する。 【構成】各種の演算を実行するための演算器3とデータ
を記憶するメモリ4とをそれぞれに有する複数のプロセ
ッサ2を備え、この各プロセッサ2を1つの制御プロセ
ッサ1で並列に動作させる。各演算器3において、アド
レス格納手段31は、メモリ4をアクセスする際のアド
レスを格納するものであって、アドレス制御手段32
は、アドレス格納手段31に格納されるべきアドレスを
生成するとともに、このアドレス値に従ってメモリ4を
アクセスすることで、メモリ4の中の異なるメモリ領域
をアクセスするよう構成する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、各種の演算を実行する
ための演算器とデータを記憶するメモリとをそれぞれに
有する複数のプロセッサを備え、この各プロセッサを1
つの制御プロセッサで並列に動作させる超並列計算機の
ALU構成方式に関する。
【0002】
【従来の技術】近年のコンピュータシステムの高速・大
容量化の要求に伴い、プロセッサを多量に接続して処理
を分散させる技術が要求されている。このため、簡単な
構成からなるプロセッサエレメントを多数接続した超並
列計算機が提供されている。この場合、データは、各プ
ロセッサエレメントに割り振られているので、それぞれ
独立に計算を行なう必要があった。
【0003】このように従来の超並列計算機において
は、多数のプロセッサエレメントを実装するために、A
LU(算術論理演算装置)を簡単に構成することで機能
を制限していた。このため、各プロセッサでは、独立の
メモリ領域に対してアクセスできなかった。例えば浮動
小数点数の演算やデータ検索などで多く用いられるテー
ブル参照などの処理に対しては、全て同時にプロセッサ
がデータを処理できず、全ての条件での処理を全てのプ
ロセッサが実行しなければならなかった。
【0004】よって、一部のプロセッサのための命令が
大半となってしまい、無駄が多くなっていた。また、各
プロセッサで処理できる能力を向上すべく、浮動小数点
数の演算のための機能やテーブル参照の機能などをAL
Uに持たせると、そのためにALUの構成が複雑になっ
てしまう。このため、プロセッサのサイズが大きくなっ
て多数のプロセッサを並列計算機に実装できず、前述し
たような特殊な機能を用いない処理に対しては、処理能
力が低下したと等価となり、結果として全体の処理能力
を向上できなかった。
【0005】
【発明が解決しようとする課題】このように、ALUの
構成を簡単にした場合には、浮動小数点数の演算やテー
ブル参照の処理のように、プロセッサがある程度の独立
性を持っていなければならないような処理に対しては、
処理速度を向上できないという問題があった。
【0006】これに対し、ALUの構成を多機能にした
場合、追加した特殊な機能をあまり用いないようなアプ
リケーションの場合には、実際にあまり用いられない部
分のために多くの物量を使ってしまうといった問題があ
った。
【0007】本発明の目的は、ALUの構成に簡単な機
能を追加して処理速度を向上することのできる超並列計
算機のALU構成方式を提供することにある。
【0008】
【課題を解決するための手段】本発明は、上記課題を解
決し目的を達成するために次のようした。図1は本発明
の原理図である。
【0009】本発明は、各種の演算を実行するための演
算器3とデータを記憶するメモリ4とをそれぞれに有す
る複数のプロセッサ2を備え、この各プロセッサ2を1
つの制御プロセッサ1で並列に動作させる。各演算器3
において、アドレス格納手段31は、メモリ4をアクセ
スする際のアドレスを格納するものであって、アドレス
制御手段32は、アドレス格納手段31に格納されるべ
きアドレスを生成するとともに、このアドレス値に従っ
てメモリ4をアクセスすることで、メモリ4の中の異な
るメモリ領域をアクセスするよう構成する。
【0010】より好適には以下のようにするのが望まし
い。すなわち、アドレス制御手段32は、外部から入力
するアドレスまたはアドレス格納手段31から入力する
アドレスのいずれかを選択する選択手段41を有し、こ
の選択手段41の出力によりアドレスバスを駆動するよ
う構成する。
【0011】また、アドレス制御手段32は、外部から
のアドレスのアドレス格納手段31への入力を許可する
許可手段42を有し、アドレス格納手段31の出力によ
りアドレスバスを駆動するよう構成する。
【0012】さらに、アドレス制御手段32によりメモ
リ4の中の異なるメモリ領域をアクセスすることで、浮
動小数点数の演算を行なうことを特徴とする。さらに、
アドレス制御手段32は、複数の検索キーとメモリ4内
の各データのための各アドレスとを対応付けて登録した
アドレステーブル50を参照して、検索キーに対応する
データのアドレスをアドレス格納手段31に格納し、ア
ドレス格納手段31に格納されたアドレスに対応するメ
モリ4の中のメモリ領域をアクセスすることで、データ
を読み出すよう構成する。
【0013】
【作用】本発明によれば、アドレス制御手段により、ア
ドレスレジスタに格納すべきアドレスを生成し、メモリ
をアクセスする際にアドレスレジスタから読み出したア
ドレス値に従ってメモリ領域をアクセスするので、アド
レス値の設定値により異なるメモリ領域をアクセスでき
る。
【0014】従って、ALUに簡単な機能構成を追加す
るのみで、プロセッサ毎の独立性の高い処理に対しても
処理速度を向上でき、特に専用のハードウェアを設ける
必要がないので、プロセッサの設計が容易であり、1プ
ロセッサ当りのハードウェア量も比較的少なく、多数の
プロセッサを実装することができる。
【0015】また、選択手段により外部から入力するア
ドレスまたはアドレス格納手段31から入力するアドレ
スのいずれかを選択できるから、メモリのメモリ領域を
任意に変えることができる。
【0016】また、許可手段により外部からのアドレス
をアドレス格納手段に入力許可した場合には、アドレス
格納手段より外部からの入力アドレスが出力されるか
ら、外部からの入力アドレスによってメモリのメモリ領
域を任意に変えられる。
【0017】さらに、浮動小数点数の演算を行なう場合
に、任意のメモリ領域をアクセスすることで、従来のA
LUの機能よりも、プロセッサ毎のデータに応じて効率
的に行える。
【0018】また、アドレステーブルを参照し、アドレ
ス格納手段に格納されたアドレスに対応するメモリの中
のメモリ領域をアクセスすることで、データを読み出す
ので、処理速度を向上できる。
【0019】
【実施例】以下、本発明の具体的な実施例を説明する。
図2は本発明の実施例の構成ブロック図、図3は各プロ
セッサ内のALUの構成ブロック図である。
【0020】図2において、2次元に配列されたプロセ
ッサアレイPE2(PE(0,0)〜PE(m,n))
は、並列に動作するものであって、後述するように各種
の演算を実行するためのALU3(演算器)を備えてい
る。各プロセッサアレイPE2は、データの授受を行う
ためのデータ放送収集回路10を介して制御プロセッサ
1に接続され、この制御プロセッサ1の命令によって各
プロセッサアレイPE2が並列に動作するようになって
いる。
【0021】図3において、各プロセッサアレイPE2
(PE(0,0)〜PE(m,n))は、データを記憶
するメモリ4と、このメモリ4に接続され各種の演算を
実行するためのALU3(演算器)とを備えている。A
LU3は、次のように構成される。
【0022】入力制御回路33は、各種の演算を行なう
ALU本体30の入力側とメモリ4とに接続され、出力
制御回路39は、ALU本体30の出力側とメモリ4と
に接続されている。アドレスレジスタ31は、ALU本
体30と入力制御回路33との間に設けられ、アドレス
制御回路32は、アドレスレジスタ31に接続され且つ
入力制御回路33と出力制御回路39との間に設けられ
ている。
【0023】ALU本体30は、次のように構成され
る。命令制御回路34は、制御フラグを発生する制御フ
ラグ発生器38からのフラグ値によって、論理演算回路
35、加減算回路36、比較回路37のいずれの演算を
実行するかを切り換え制御する。
【0024】論理演算回路35は、任意の論理演算を実
行してその演算出力を出力制御回路39、アドレスレジ
スタ31、制御フラグ発生器38に出力する。加減算回
路36は、データの加算または減算を行いその演算出力
を出力制御回路39、アドレスレジスタ31、制御フラ
グ発生器38に出力する。
【0025】比較回路37は、データの比較を行ないそ
の比較結果を出力制御回路39、アドレスレジスタ3
1、制御フラグ発生器38に出力する。アドレスレジス
タ31は、メモリアクセスのためのアドレス制御回路3
2に接続され、プロセッサアレイ毎のメモリ4をアクセ
スする際のアドレスを格納している。
【0026】アドレス制御回路32は、アドレスレジス
タ31に格納すべきアドレスを生成したり、生成された
アドレス値に従ったメモリ4におけるメモリ領域をアク
セスすべく、入力制御回路33及び出力制御回路39に
対して動作し、入力及び出力のメモリ4のアクセス領域
を変えることができる。
【0027】図4はアドレス制御回路の例1の構成を示
す図である。図4において、アドレス制御回路は、次の
ように構成される。入力アドレスレジスタ31−1は、
ALU本体30の入出力に接続されアドレス生成回路3
2−1で生成された入力アドレスIA1を格納する。セ
レクタ41−1は、アドレス生成回路32−1からの入
力アドレスIA1と外部からの入力アドレスEA1のい
ずれかを選択し、選択された入力アドレスで入力ポート
IP1のためのアドレスバスAB1を駆動するようにな
っている。
【0028】入力アドレスレジスタ31−2は、ALU
本体30の入出力に接続されアドレス生成回路32−2
で生成された入力アドレスIA2を格納する。セレクタ
41−2は、アドレス生成回路32−2からの入力アド
レスIA2と外部からの入力アドレスEA2のいずれか
を選択し選択された入力アドレスで入力ポートIP2の
ためのアドレスバスAB2を駆動するようになってい
る。
【0029】出力アドレスレジスタ31−3は、ALU
本体30の入出力に接続されアドレス生成回路32−3
で生成された出力アドレスOAを格納する。セレクタ4
1−3は、アドレス生成回路32−3からの出力アドレ
スOAと外部からの出力アドレスEA3のいずれかを選
択して出力ポートOPのためのアドレスバスAB3を駆
動するようになっている。
【0030】このように構成された実施例におけるAL
Uの構成方式において、アドレス生成回路32−1〜3
2−3により、入力アドレスレジスタ31−1〜31−
2及び出力アドレスレジスタ31−3に格納すべきアド
レスを生成し、アドレス生成回路32−1〜32−3か
らアドレスIA1,IA2,OAがセレクタ41−1〜
41−3に入力する。
【0031】また、外部からアドレスEA1,EA2,
EA3がセレクタ41−1〜41−3に入力し、セレク
タ41−1〜41−3では、アドレスIA1,IA2,
OAまたはアドレスEA1,EA2,EA3のいずれか
を選択する。
【0032】よって、入力制御回路33及び出力制御回
路39を動作させることにより、セレクタ41−1〜4
1−3によって選択されたアドレス値に従ったメモリ4
のメモリ領域をアクセスするので、アドレス値の設定値
により異なるメモリ領域をアクセスできる。すなわち、
メモリのメモリ領域を任意に変えることができる。
【0033】従って、ALUに簡単なアドレスレジスタ
31,アドレス制御回路32を追加するのみで、プロセ
ッサ毎の独立性の高い処理に対しても処理速度を向上で
き、特に専用のハードウェアを設ける必要がないので、
プロセッサの設計が容易であり、1プロセッサ当りのハ
ードウェア量も比較的少なく、多数のプロセッサを実装
することができる。
【0034】図5はアドレス制御回路の例2の構成を示
す図である。図5に示すアドレス制御回路は、アドレス
レジスタの出力が直接にアドレスバスを駆動している例
である。
【0035】ゲート回路42−1は、外部からのアドレ
スEA1の入力アドレスレジスタ31−1への入力を許
可し、入力アドレスレジスタ31−1の出力により直接
にアドレスバスAB1を駆動するよう構成する。ゲート
回路42−2は、外部からのアドレスEA2の入力アド
レスレジスタ31−2への入力を許可し、入力アドレス
レジスタ31−2の出力により直接にアドレスバスAB
2を駆動するよう構成する。
【0036】ゲート回路42−3は、外部からのアドレ
スEA3の出力アドレスレジスタ31−3への入力を許
可し、出力アドレスレジスタ31−3の出力により直接
にアドレスバスAB3を駆動するよう構成する。
【0037】このようにゲート回路42−1〜42−3
により外部からのアドレスEA1〜EA3を入力アドレ
スレジスタ及び出力アドレスレジスタに入力許可した場
合には、入力アドレスレジスタ及び出力アドレスレジス
タより外部からのアドレスが直接に出力されるから、外
部からのアドレスによってメモリのメモリ領域を任意に
変えられる。
【0038】図6は浮動小数点数の表し方を示す図、図
7は実施例におけるALU構成方式を適用した浮動小数
点数の加算処理のフロー図、図8は従来のALU構成方
式を適用した浮動小数点数の加算処理のフロー図であ
る。
【0039】浮動小数点数は、一般にはM×BEの形で
表され、Mを仮数部と呼び、Eを指数部と呼び、Bを基
数と呼んでいる。例えば図6に示すように32ビットで
浮動小数点数を表す例を示す。ここでは、仮数部24ビ
ット、指数部7ビット、仮数の正負の符号として1ビッ
トからなる。
【0040】浮動小数点数は同じ数値でも指数部と仮数
部とを調整すれば、色々の表示を行うことができる。こ
れを指数部が最小となるように浮動小数点数を表すこと
を正規化と呼ぶ。
【0041】以下、本実施例のALU構成方式と従来の
ALU構成方式との比較を説明する。浮動小数点数の加
算演算では、まず正規化されている数値を桁合わせし、
加算すべき2数を加減算回路36によって加算を実行
し、最後に結果を正規化しなければならない。
【0042】まず、実施例の方式を図7に示すフロー図
に従って説明する。まず、加算すべき2数の仮数部の格
納アドレスのうち最下位ビットのアドレスをそれぞれア
ドレスレジスタ31−1,31−2に格納する(ステッ
プ101)。このステップ101で10msの時間を要
する。
【0043】次に加算すべき2数の指数部を比較回路3
7によって比較し、大きい側の指数部の値を図示しない
レジスタAの指数部に格納する(ステップ102)。こ
のステップ102で30msの時間を要する。
【0044】さらに比較回路37の比較結果により、加
算すべき2数の指数部の小さい側のアドレスレジスタに
格納された仮数を、2数の指数の差分だけ加減算回路3
6によって減算する(ステップ103)。これにより、
指数部の桁合わせが行われたことになる。このステップ
103で10msの時間を要する。
【0045】次に、それぞれのアドレスレジスタ31−
1,31−2に格納されたアドレスからのデータ、すな
わち2つの仮数の加算を加減算回路36で行い、仮数の
加算結果をレジスタAの仮数部に格納する(ステップ1
04)。これにより、レジスタAには、指数部に2数の
うちの大きい指数が格納され、仮数部に2つの仮数の和
が格納される。このステップ104で30msの時間を
要する。
【0046】最後にレジスタAに格納された値を前述し
た要領で正規化(標準化)する(ステップ105)。こ
のステップ105で100msの時間を要する。なお、
各プロセッサ毎に独立にシフト幅を制御できるシフトレ
ジスタを持つ場合にはこれを用いるが、持たない場合に
でも本発明の機能を使うことで効率良く標準化の処理を
行なうことができる。
【0047】次に従来方式を図8に示すフロー図に従っ
て説明する。まず、加算する2数の指数部を比較回路3
7によって比較する(ステップ201)。このステップ
201で10msの時間を要する。
【0048】次に2数のうちの指数部の大きいものをレ
ジスタAに格納し、指数部の小さいものをレジスタBに
格納する(ステップ202)。このステップ202で3
0msの時間を要する。
【0049】さらにレジスタAに格納された指数とレジ
スタBに格納された指数との差を加減算回路36によっ
て求め、指数の差分をレジスタDに格納する(ステップ
203)。このステップ203で10msの時間を要す
る。
【0050】次にレジスタDに格納された指数の差分だ
け、レジスタBに格納された仮数を右にシフトする演算
を行なう(ステップ204)。このステップ204で1
000msの時間を要する。なお、このステップの処理
は、実際にはいくつかの命令によって実現されるが、こ
こでは説明を簡単にするために1つにまとめている。
【0051】さらにレジスタAに格納された仮数とレジ
スタBに格納された仮数とを加算し、加算結果をレジス
タCの仮数部に格納し、レジスタAに格納された指数を
レジスタCの指数部に格納する(ステップ205)。こ
のステップ205で30msの時間を要する。
【0052】なお、各プロセッサ毎に独立にシフト幅を
制御できるシフトレジスタを持つ場合には仮数部のビッ
ト長分の回数1ビットずつシフトする必要がある。最後
にレジスタCの値を標準化する(ステップ206)。こ
のステップ206で1000msの時間を要する。
【0053】以上説明したように従来の方式では、各プ
ロセッサが独立したメモリ領域のアクセスができないた
めに、桁合わせの際にシフト演算を行なう(ステップ2
04)必要がある。
【0054】一方、本実施例では、任意のメモリ領域を
アクセスすることで、シフト演算を行なうことなく、加
算処理を行なうことができるので、処理を高速化でき
る。例えば図7に示す浮動小数点数の加算では、従来の
方式に対して約20倍の処理速度が得られる。
【0055】図9は実施例におけるALU構成方式を適
用したテーブル参照の例を示す図、図10はテーブル参
照の処理のフロー図である。アドレステーブル50は、
複数の検索キー1〜Nとメモリ4内の各データ1〜Nの
ための各アドレスとを対応付けて登録したものである。
アドレス制御回路32により、このアドレステーブル5
0を参照して、検索キーに対応するデータのアドレスを
アドレスレジスタ31に格納し(ステップ301)、ア
ドレスレジスタ31に格納されたアドレスに対応するメ
モリ4の中のメモリ領域をアクセスすることで、データ
を読み出す(ステップ302)。
【0056】すなわち、従来の方式では、各プロセッサ
が独立したメモリ領域をアクセスできないために、テー
ブル参照を行えなかったが、本実施例によれば、図8に
示すようにアドレステーブル50を参照し、アドレスレ
ジスタ31に格納されたアドレスに対応するメモリの中
のメモリ領域をアクセスすることで、データを読み出す
ので、処理速度を向上できる。
【0057】
【発明の効果】本発明によれば、簡単な構成を追加する
のみで、プロセッサ毎の独立性の高い処理に対しても処
理速度を向上でき、特に専用のハードウェアを設ける必
要がないので、プロセッサの設計が容易であり、1プロ
セッサ当りのハードウェア量も比較的少なく、多数のプ
ロセッサを実装することができる。
【0058】また、選択手段により外部から入力するア
ドレスまたはアドレス格納手段から入力するアドレスの
いずれかを選択できるから、メモリのメモリ領域を任意
に変えることができる。
【0059】また、許可手段により外部からのアドレス
をアドレス格納手段に入力許可した場合には、アドレス
格納手段より外部からの入力アドレスが出力されるか
ら、外部からの入力アドレスによってメモリのメモリ領
域を任意に変えられる。
【0060】さらに、浮動小数点数の演算を行なう場合
に、任意のメモリ領域をアクセスすることで、従来のA
LUの機能よりも、プロセッサ毎のデータに応じて効率
的に行える。
【0061】また、アドレステーブルを参照し、アドレ
ス格納手段に格納されたアドレスに対応するメモリの中
のメモリ領域をアクセスすることで、データを読み出す
ので、処理速度を向上できる。
【図面の簡単な説明】
【図1】本発明の原理図である。
【図2】本発明の実施例の構成ブロック図である。
【図3】実施例の各プロセッサ内部のALUの構成を示
す図である。
【図4】アドレス制御回路の例1の構成ブロック図であ
る。
【図5】アドレス制御回路の例2の構成ブロック図であ
る。
【図6】浮動小数点数の表し方を示す図である。
【図7】実施例におけるALU構成方式を適用した浮動
小数点数の加算処理のフロー図である。
【図8】従来のALU構成方式を適用した浮動小数点数
の加算処理のフロー図である。
【図9】実施例におけるALU構成方式を適用したテー
ブル参照の例を示す図である。
【図10】テーブル参照の処理のフロー図である。
【符号の説明】
1・・制御プロセッサ 2・・プロセッサアレイ 3・・ALU 4・・メモリ 10・・データ放送収集回路 30・・ALU本体 31・・アドレスレジスタ 32・・アドレス制御回路 33・・入力制御回路 34・・命令制御回路 35・・論理演算回路 36・・加減算回路 37・・比較回路 38・・制御フラグ発生器 39・・出力制御回路 41・・セレクタ 42・・ゲート回路 50・・アドレステーブル

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 各種の演算を実行するための演算器
    (3)とデータを記憶するメモリ(4)とをそれぞれに
    有する複数のプロセッサ(2)を備え、この各プロセッ
    サ(2)を1つの制御プロセッサ(1)で並列に動作さ
    せる超並列計算機において、 前記各演算器(3)は、前記メモリ(4)をアクセスす
    る際のアドレスを格納するアドレス格納手段(31)
    と、 このアドレス格納手段(31)に格納されるべきアドレ
    スを生成するとともに、このアドレス値に従って前記メ
    モリ(4)をアクセスするアドレス制御手段(32)と
    を有し、 前記アドレス制御手段(32)は、前記メモリ(4)の
    中の異なるメモリ領域をアクセスすることを特徴とする
    超並列計算機のALU構成方式。
  2. 【請求項2】 前記アドレス制御手段(32)は、外部
    から入力するアドレスまたは前記アドレス格納手段(3
    1)から入力するアドレスのいずれかを選択する選択手
    段(41)を有し、この選択手段(41)の出力により
    アドレスバスを駆動することを特徴とする請求項1記載
    の超並列計算機のALU構成方式。
  3. 【請求項3】 前記アドレス制御手段(32)は、外部
    からのアドレスの前記アドレス格納手段(31)への入
    力を許可する許可手段(42)を有し、前記アドレス格
    納手段(31)の出力によりアドレスバスを駆動するこ
    とを特徴とする請求項1記載の超並列計算機のALU構
    成方式。
  4. 【請求項4】 前記アドレス制御手段(32)により前
    記メモリ(4)の中の異なるメモリ領域をアクセスする
    ことで、浮動小数点数の演算を行なうことを特徴とする
    請求項1記載の超並列計算機のALU構成方式。
  5. 【請求項5】 前記アドレス制御手段(32)は、複数
    の検索キーと前記メモリ(4)内の各データのための各
    アドレスとを対応付けて登録したアドレステーブル(5
    0)を参照して、前記検索キーに対応する前記データの
    アドレスを前記アドレス格納手段(31)に格納し、ア
    ドレス格納手段(31)に格納されたアドレスに対応す
    る前記メモリ(4)の中のメモリ領域をアクセスするこ
    とで、データを読み出すことを特徴とする請求項1記載
    の超並列計算機のALU構成方式。
JP874792A 1992-01-21 1992-01-21 超並列計算機のalu構成方式 Withdrawn JPH05197550A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP874792A JPH05197550A (ja) 1992-01-21 1992-01-21 超並列計算機のalu構成方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP874792A JPH05197550A (ja) 1992-01-21 1992-01-21 超並列計算機のalu構成方式

Publications (1)

Publication Number Publication Date
JPH05197550A true JPH05197550A (ja) 1993-08-06

Family

ID=11701530

Family Applications (1)

Application Number Title Priority Date Filing Date
JP874792A Withdrawn JPH05197550A (ja) 1992-01-21 1992-01-21 超並列計算機のalu構成方式

Country Status (1)

Country Link
JP (1) JPH05197550A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7562198B2 (en) 2004-06-09 2009-07-14 Renesas Technology Corp. Semiconductor device and semiconductor signal processing apparatus

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7562198B2 (en) 2004-06-09 2009-07-14 Renesas Technology Corp. Semiconductor device and semiconductor signal processing apparatus
US7791962B2 (en) 2004-06-09 2010-09-07 Renesas Technology Corp. Semiconductor device and semiconductor signal processing apparatus
US8089819B2 (en) 2004-06-09 2012-01-03 Renesas Electronics Corporation Semiconductor device and semiconductor signal processing apparatus

Similar Documents

Publication Publication Date Title
US20200334038A1 (en) Variable format, variable sparsity matrix multiplication instruction
JP3573755B2 (ja) 画像処理プロセッサ
JP2835103B2 (ja) 命令指定方法及び命令実行方式
US6571268B1 (en) Multiplier accumulator circuits
US6327605B2 (en) Data processor and data processing system
KR100470299B1 (ko) 곱셈-누산 연산의 단일 사이클 처리
CN103793203B (zh) 响应于输入数据值降低fma单元中的功率消耗
US6735611B2 (en) Arithmetic processor
US4675809A (en) Data processing system for floating point data having a variable length exponent part
US20030055860A1 (en) Rounding mechanisms in processors
US4229801A (en) Floating point processor having concurrent exponent/mantissa operation
US4466077A (en) Method and apparatus for division employing associative memory
US6108682A (en) Division and/or square root calculating circuit
EP0530372B1 (en) Numerical expression converter and vector processor using the same
WO1991015819A1 (en) High performance interlock collapsing scism alu apparatus
US5426743A (en) 3-1 Arithmetic logic unit for simultaneous execution of an independent or dependent add/logic instruction pair
CN101802779A (zh) 具有可重新组构的浮点单元的处理器
JP2001524698A (ja) マルチプレシジョン整数演算用の装置
US20030005013A1 (en) Floating point system that represents status flag information within a floating point operand
US7747667B2 (en) Data processing apparatus and method for determining an initial estimate of a result value of a reciprocal operation
US3818460A (en) Extended main memory addressing apparatus
JP4574030B2 (ja) コンピュータ算術演算のための部分一致部分出力キャッシュ装置
CN114691217A (zh) 用于8位浮点矩阵点积指令的装置、方法和***
JP3479385B2 (ja) 情報処理装置
JPH05197550A (ja) 超並列計算機のalu構成方式

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 19990408