JP2009026136A - マルチプロセッサ装置 - Google Patents

マルチプロセッサ装置 Download PDF

Info

Publication number
JP2009026136A
JP2009026136A JP2007189770A JP2007189770A JP2009026136A JP 2009026136 A JP2009026136 A JP 2009026136A JP 2007189770 A JP2007189770 A JP 2007189770A JP 2007189770 A JP2007189770 A JP 2007189770A JP 2009026136 A JP2009026136 A JP 2009026136A
Authority
JP
Japan
Prior art keywords
coprocessor
processor
instruction
resources
circuit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007189770A
Other languages
English (en)
Inventor
Shinji Kashiwagi
伸次 柏木
Hiroyuki Nakajima
博行 中島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Electronics Corp
Original Assignee
NEC Electronics Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Electronics Corp filed Critical NEC Electronics Corp
Priority to JP2007189770A priority Critical patent/JP2009026136A/ja
Priority to US12/175,700 priority patent/US20090106467A1/en
Publication of JP2009026136A publication Critical patent/JP2009026136A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/38Concurrent instruction execution, e.g. pipeline or look ahead
    • G06F9/3885Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/38Concurrent instruction execution, e.g. pipeline or look ahead
    • G06F9/3877Concurrent instruction execution, e.g. pipeline or look ahead using a slave processor, e.g. coprocessor

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Advance Control (AREA)

Abstract

【課題】1つのコプロセッサを密結合バスを介して複数のプロセッサからアクセス可能とするマルチプロセッサ装置の提供。
【解決手段】複数のプロセッサ(101A、101B)に対して共通に設けられ、複数の資源を有するコプロセッサ(126)と、前記プロセッサによるコプロセッサバス(密結合バス)(114)を介してのコプロセッサ(126)の資源の使用に関して、前記プロセッサから前記コプロセッサに対して発行される命令に応じて、資源単位又は資源の階層単位で、複数のプロセッサ(101A、101B)間での競合を調停するアービトレーション回路(117)を備え、アービトレーション回路(117)による制御のもと複数のプロセッサ(101A、101B)による密結合バス(114)を介してのコプロセッサ内の、同一又は異なる階層の複数の資源の同時使用が可能とされる。
【選択図】図2

Description

本発明は、複数のプロセッサを備えた装置に関し、特に、複数のプロセッサ間でコプロセッサ資源を共有する装置に適用して好適なシステム構成に関する。
この種のマルチプロセッサ(並列プロセッサ)システムの典型的な構成の一例を、図9に示す(非特許文献1参照)。マルチプロセッサ(並列プロセッサ)システムは、対称または非対称のプロセッサとコプロセッサを複数持ち、メモリや周辺IOなどをプロセッサ間で共有する。
コプロセッサ(co−processor)は、
・特定の処理(オーディオ、ビデオ、ワイヤレス、あるいは、浮動小数点演算やFFT(Fast Fourier Transform)等の数値演算、・・)を担うことでプロセッサを補助するものと、
・特定の処理(オーディオ、ビデオ、ワイヤレス・・・)に必要な処理を丸ごと処理するといったハードウェア・アクセラレータ的なものがある。
複数のプロセッサを備えたマルチプロセッサにおいて、コプロセッサは、メモリと同様に、プロセッサ間で共有する場合と、プロセッサにローカルに専有する場合とがある。
図9に示した例は、コプロセッサをローカルに専有する構成であり、コンフィギュラブルプロセッサMeP(Media embedded Processor)技術を用いたLSI構成の一例が示されている。
図9のオーディオCODEC MePモジュールは、プロセッサを補助するもので、MePコア(基本プロセッサ)で不足している、VLIW(Very Long Instruction Word)命令を演算するコプロセッサとして、オーディオVLIWコプロセッサを追加している。VLIW命令として積和乗算などの汎用的な演算命令を追加定義し、オーディオCODEC処理をアクセレートする。ビデオフィルタ・モジュールは、ビデオフィルタのハードウエアエンジンが用意され、アクセラレータとして機能し、モジュール内の回路資源はビデオフィルタにのみ使われる。
図10は、図9の構成を説明するために簡略化して示した図である。図10に示すように、プロセッサ201A、プロセッサ201Bは、それぞれプロセッサのローカルバスを介して特定用途向けコプロセッサ203A、203Bと密結合している。なお、ローカルメモリ202A、202Bは、それぞれ、プロセッサ201A、201Bで実行される命令や作業データを格納する。
マルチプロセッサとそれに接続された周辺ハードウェア(コプロセッサや各種周辺装置)とを効率的に強調させる構成の並列処理装置が特許文献1に開示されている。図11は、特許文献1に開示されたCPUの構成を示す図である。図11を参照すると、タスクあるいはスレッドを実行する複数のプロセッサ部P0〜P3を備え、コプロセッサ130a、130b、周辺装置40a〜40dの周辺ハードウェアと接続されたCPU10を含み、タスクあるいはスレッドを実行しているプロセッサ部それぞれが実行中のタスクあるいはスレッドの実行内容に応じて周辺ハードウェアに処理依頼を行う、というものである。図12は、図11の構成を簡略化して示した図である。図12に示すように、プロセッサP0〜P3、コプロセッサ130a、130bは共通バスに接続されており、プロセッサP0〜P3はコプロセッサ130a、130bに共通バスを介してアクセスする。
特開2006−260377号公報 東芝半導体 製品カタログ MeP(Media embedded Processor)概説 インターネットURL:<http://www.semicon.toshiba.co.jp/docs/catalog/ja/BCJ0043_catalog.pdf>
上記した関連技術の構成は、以下のような課題を有している(以下は、本発明者等の分析結果による)。
図9、図10に示した構成の場合、コプロセッサのローカルバスにそれぞれ密結合させた場合、共通バス上の別のプロセッサから、コプロセッサにアクセスすることができない。
また、プロセッサ201A、201Bの各々が、コプロセッサ203A、203Bに必要な回路(演算器やレジスタなど)をローカルに持つこととなり、他のプロセッサとのコプロセッサ(演算資源)レベルでの共有、もしくは回路資源(演算器やレジスタなどの回路レベル)での共有が困難となる。
そして、コプロセッサは、各々のプロセッサのコプロセッサIF(インタフェース)にローカルに密結合されているため、ある機能に特化したコプロセッサを、他のプロセッサから利用できなくなる。図9に示した構成の場合、特定用途毎に専用モジュールを用意しているため、各モジュール内の回路資源は他の用途への利用(流用)が困難である。
例えば、上述のビデオフィルタ・モジュールのようなハードウエア・エンジンでは、他の用途で利用できない。
また、不具合(故障・不良)等でハードウエア・エンジンが利用できなくなった場合、処理性能を極力おとさずに、代替手段を用意することが困難となる。
例えば、オーディオCODECモジュールのVLIW命令で処理を加速化させる代替手段が考えられるが、その場合オーディオとの同時処理に支障が出る。
一方、図12に示したように、コプロセッサを、共通バス上に配置した場合、全てのプロセッサからアクセスすることができ、コプロセッサ資源の共有が可能となる。しかしながら、共有メモリや周辺IOへのアクセスと共用する共通バスを介するため、低速メモリや低速IOへのアクセスがあった場合など、バストラフィック、負荷に影響を受けやすく、このため、リアルタイム性に劣る。
本願で開示される発明は、前記課題の認識に基づき創案されたものであって、概略以下のように構成される。
本発明の1つの側面に係るマルチプロセッサ装置においては、複数のプロセッサに対して共通に設けられ、複数の資源を有するコプロセッサと、前記プロセッサから前記コプロセッサに対して発行される命令に応じて、資源単位又は複数の資源の階層について、前記複数のプロセッサ間での競合を調停するアービトレーション手段と、を備えている。
本発明において、前記コプロセッサは、前記プロセッサから前記コプロセッサに対して発行される命令に応じて、複数の資源の接続関係を可変に設定する、構成とされる。
本発明において、前記密結合バスが、前記複数のプロセッサが前記コプロセッサにそれぞれ別々の層でアクセスするバスを含む構成としてもよい。
本発明において、前記アービトレーション手段による制御のもと、前記複数のプロセッサによる、前記密結合バスを介しての、前記コプロセッサ内の互いに競合しない、同一又は異なる階層の複数の資源の同時使用が可能とされる。
本発明において、前記コプロセッサ内の1つ又は複数の資源を排他的に利用する拡張命令を命令セットとして用意しておき、前記複数のプロセッサから、前記拡張命令が前記コプロセッサに対して同時に発行された場合、前記アービトレーション手段により、前記拡張命令に対応した1つ又は複数の資源単位での競合が調停される構成としてもよい。
本発明において、前記拡張命令は、回路資源の単位機能に対応する第1層の拡張命令群と、前記第1層の拡張命令に対応する回路資源を複数以上組み合わせて所定の機能を実現する第2層の拡張命令群と、を含むようにしてもよい。さらに、前記第2層の拡張命令に対応する回路資源を組み合わせて所定の機能を実現する第3層の拡張命令群を含むようにしてもよい。
本発明において、前記コプロセッサは、前記プロセッサと密結合バスを介してのインタフェースを行うインタフェース回路と、前記密結合バスを介して前記プロセッサから与えられたコマンドを解釈するデコーダと、コマンドをデコードした信号でコプロセッサの機能を制御する制御回路と、演算回路、レジスタファイルを含む回路資源群と、前記回路資源の入出力バスに配置されたマルチプレクサ群と、を備え、前記制御回路は、前記マルチプレクサ群の接続先を指定する選択信号を出力する、構成としてもよい。
本発明によれば、複数のプロセッサの共通バスとは別のバスを介しての補助プロセッサの使用を調停する構成としたことにより、1つの補助プロセッサを複数のプロセッサで使用可能とするとともに、共通バスを介してアクセスする場合と比べて高速化を可能とし、リアルタイム処理に好適とされる。
また本発明によれば、回路資源単位だけでなく、階層定義した命令単位での、競合調停をすることによって、さらに高度な競合解決が可能となる。また、上位層の命令に対して変更を加えたい場合に、中位層や下位層の命令を用いたプログラミングによる変更を可能としており、ハードウエアの変更を回避可能としている
前記した本発明についてさらに詳細に説述すべく、添付図面を参照して実施例を説明する。本実施例において、コプロセッサ内の回路資源を、RT(Register Transfer)レベルで扱うALU(Arithmetic Logic Unit)やレジスタファイルなどで分類するための手法として、該資源を排他的に利用するコプロセッサ命令(拡張コプロセッサ命令ともいう)を用意する。
本実施例において、プロセッサは、コプロセッサと密結合バスを介して接続され、アービトレーション回路により、使用する資源の競合の調停が行われる。本実施例において、例えば、複数のプロセッサから同時に発行されたコプロセッサ命令は、コプロセッサ命令の間で資源競合していなければ、コプロセッサ内で並列実行される。
本実施例においては、コプロセッサ内の回路資源を、RTレベルで扱うALUやレジスタファイルなどで分類する手法として、例えば、
・四則演算やメモリ転送のような単位機能のまま定義した下位層の拡張コプロセッサ命令群、
・回路資源を複数以上組み合わせて異なるアプリケーション間で汎用的に流用可能な機能を実現する中位層の拡張コプロセッサ命令群、
・中位層の拡張コプロセッサ命令を構成する回路資源を組み合わせて実現する特定用途に限定された上位層の拡張コプロセッサ命令群
のように、拡張コプロセッサ命令を階層定義する。
以上の特徴を実現するコプロセッサは、資源群として、
・プロセッサとインタフェースするためのバスインタフェース回路(密結合バス・インタフェース回路)、
・密結合バスから与えられたオペコードなどの命令(コマンド)を解釈するデコーダ回路、
・命令(コマンド)をデコードした信号でコプロセッサの機能を制御する制御回路、
・RTレベルで扱うALUやレジスタファイルなどで分類した回路資源群、
・各々の回路資源の入出力バスに配置したマルチプレクサ群、
・マルチプレクサ群の接続先を指定するモード信号(選択信号)、
を備えている。
コプロセッサにおいて、制御回路が出力するモード信号(選択信号)の状態によって、回路資源群の入出力バスの接続先が変わり、階層定義された様々なコプロセッサ命令の実行を可能とする。
コマンド(コプロセッサ命令)やパイプライン状態などの信号が転送されるバスを「密結合バス」という。プロセッサと密結合バスを介して接続されるコプロセッサを「密結合コプロセッサ」ともいう。プロセッサと、メモリ、周辺IO等が接続され、アドレス、制御信号、データが転送されるバスを「疎結合バス」という。
<実施例1>
図1は、本発明の第1の実施例の構成を示す図である。図1を参照すると、本実施例において、並列プロセッサを構成する複数のプロセッサ101A、101Bは、共通バス105を介して共有メモリ103、周辺IO(共有コプロセッサ)104に接続している。各プロセッサ101A、101Bは、共通バス105とは別のローカルバスを介して専有のメモリ(ローカルメモリ)102A、102Bに接続されている。コプロセッサ116は、特定の処理(オーディオ、ビデオ、ワイヤレス・・)を担うことでプロセッサを補助する。本実施例においては、コプロセッサ116は、コプロセッサバス(マルチレイヤバス)114を介してプロセッサ101Aとプロセッサ101B間で共有されている。さらに、プロセッサ101A、101B間でのコプロセッサ116の資源の競合を調停するアービトレーション回路(コプロ・アクセス・アービトレーション回路)115を備えている。
本実施例において、コプロセッサ116は、コプロセッサバス・インタフェースIF−(1)、IF−(2)を備え、マルチレイヤのコプロセッサバス114に接続している。マルチレイヤのコプロセッサバス114は、複数のプロセッサからの同時アクセスを可能とするバスである。
アービトレーション回路(コプロ・アクセス・アービトレーション回路)115は、プロセッサ101Aとプロセッサ101Bから、コプロセッサ116の資源の使用要求111A、111Bを受け、同一の資源に対する使用要求が重複した場合には、信号112A、112Bにより、一方のプロセッサによるコプロセッサ116の資源の使用を許可し、他方のプロセッサによるコプロセッサ116の資源の使用をウェイト(WAIT)させる。
プロセッサ116において、資源Aと資源Bには、それぞれの入出力バス上に、マルチプレクサ(MUX)を備え、マルチレイヤバス114の個々のレイヤから、アクセスできる。
インタフェースIF−(1)からの信号はIF−(1)に直結するMUX、次段のMUXを介して、資源A又は資源Bに伝達され、インタフェースIF−(2)からの信号はIF−(2)に直結するMUX、次段のMUXを介して、資源A又は資源Bに伝達される。
資源A、資源Bからの信号は、MUXを介してIF−(1)又はIF−(2)に伝達される。4つのMUXは、インタフェースと接続する2つのIOポートと、資源A、Bと接続する2つのIOポート間の接続を切替えるマトリックス・スイッチを構成している。
コプロセッサ116内の資源Aと資源Bには、コプロセッサバス114のそれぞれ別のレイヤからアクセスすることができるため、プロセッサ101Aとプロセッサ101Bでコプロセッサ116の使用要求が重複した場合にも、要求が、資源Aと資源Bで分かれていれば、競合せず、同時使用が可能である。
一方、プロセッサ101Aとプロセッサ101Bでコプロセッサ116の同一の資源に対する使用要求が重複した場合には、アービトレーション回路(コプロ・アクセス・アービトレーション回路)115は一方のプロセッサによるコプロセッサ116の資源の使用を許可し、他方のプロセッサによるコプロセッサ116の資源の使用要求に対してWAITをかける。
本実施例によれば、プロセッサ101Aとプロセッサ101Bでコプロセッサ116の使用要求が重複した場合、要求が、資源Aと資源Bで分かれていれば、競合せず、同時使用可能となる。資源A又は資源Bの単位で使用要求が競合した場合、アービトレーション回路115はどちらかのプロセッサにWAITをかける。
図1において、インタフェースIFの数は2つに限定されるものでないことは勿論である。また、図1では、簡単のため、資源A、Bが図示されているが、本発明はかかる構成に限定されるものでなく、資源A、Bの上層に、入出力バスにMUXを備えた資源をさらに備えた構成としてもよいことは勿論である。
<実施例2>
次に、本発明の第2の実施例について説明する。図2は、本実施例における、コプロセッサ命令の階層設計に関する概念を示す図である。図2に示すコプロセッサの構成は、図1に示した構成とは、コプロセッサ内の資源の分類の仕方を変えている。
図2を参照すると、コプロセッサ126において、回路資源を、RT(Register Transfer)レベルで扱うALUやレジスタファイルなどで分類する方法として、
・四則演算やメモリ転送のような単位機能のまま定義した下位層の拡張コプロセッサ命令群と、
・下位層の回路資源を複数以上組み合わせて、異なるアプリケーション間で汎用的に流用可能な機能を実現する中位層の拡張コプロセッサ命令群と、
・中位層の拡張コプロセッサ命令を構成する回路資源を組み合わせて実現する特定用途に限定された上位層の拡張コプロセッサ命令群と、
を備えている。すなわち、コプロセッサ命令に階層構造を導入している。
例えば、図2では、積和算(multiply and accumulate)やシフト命令といった一般的なプロセッサ命令と同程度のサイクル数・演算回路で実現できるものをレベル1(下位層)の命令としている。このレベル1の命令は、資源A〜Hの個々の回路資源で実現する。
積和算などレベル1命令の組み合わせでFFT(Fast Fourier Transform)などの信号処理を実現する命令をレベル2(中位層)としている。中位層命令I〜Lがこれに相当する。
さらに、FFTやIFFT(Inverse FFT)などレベル2命令を組合せてDCT、IDCT(Discrete Consine Transform)などを実現する命令をレベル3(上位層)としている。最上位層命令X〜Yがこれに相当する。なお、本発明において、階層化の層数は3層に限定されるものでないことは勿論である。
レベル2やレベル3の命令においては、コプロセッサ126内のハードウエアによるシーケンサや、有限状態マシン(FSM)によって、回路資源A〜Hを制御し、レベル2またはレベル3としての機能の処理を行う。
例えばレベル2の命令において、
中位層命令Iは、資源AとBで構成され、
中位層命令Jは、資源CとDで構成され、
中位層命令Kは、資源EとFで構成され、
中位層命令Lは、資源GとHで構成される。
さらに、レベル3の命令においては、
最上位命令Xは資源A〜Dで構成され、
最上位命令Yは資源E〜Hで構成される。
このように、コプロセッサ126において、各階層の拡張コプロセッサ命令を構成する回路資源は異なり、発行される複数の命令の組み合わせによっては重複しないケースもある。複数のプロセッサから発行される拡張コプロセッサ命令による回路資源への使用要求が競合しない場合、複数の拡張コプロセッサ命令の同時実行が可能となる。
<実施例3>
図3は、他の実施例として、圧縮オーディオのマルチ規格(フォーマット)対応のデコーダの構成例を示す図である。図3において、コプロセッサ126内の最も長い破線の左側がAAC(Advance Audio Coding)用、右側はMP3(MPEG1 Audio Layer−3)用である。それぞれのオーディオデコードに必要とする信号処理方式や演算精度が異なり、それぞれに必要な演算器や係数テーブルなどを回路資源A〜Hとして用意されている。
例えば、
資源Aと資源Bは、AAC−デコードに必要なIMDCT(Inverse Modified Discrete Cosine Transform)−1024ポイントを処理するための回路資源である。
資源Aは32x16乗算器、資源Bは、IMDCT−1024ポイントのための係数テーブルである。
AAC−デコードの処理をするためには、上位層命令(AAC−decode)を実行させればすむが、上位層命令(AAC−decode)だけを定義していたのでは、デコード処理に変更を加えたい場合に、ハードウエアでシーケンス制御を行っているため、変更が容易でない(ハードウエアの変更が必要)。
そこで、本実施例においては、資源A〜Dのレベル1命令や、IMDCT−1024ポイントやIMDCT−128ポイントの中位層命令を定義しておき、中位層の命令を使ったAAC−decode処理ソフトウェアを構築することで、デコード処理の変更が容易になる。
また、本実施例によれば、コプロセッサの回路資源を流用することができる。このため、プロセッサ命令に置き換えるよりも、性能悪化は少なくてすむ。
<実施例4>
図4は、本実施例におけるコプロセッサの回路構成の一例を示す図である。なお、図4に示す構成においては、図1のアービトレーション回路115の機能を、コプロセッサ116内の制御回路内に実装している。
コプロセッサは、
プロセッサとインタフェースするためのコプロセッサバス・インタフェース(I/F)回路(「密結合バス・インタフェース回路」ともいう)と、
密結合バスから与えられたオペコードなどの命令(コマンド)を解釈するデコーダ回路と、
命令(コマンド)をデコードした信号にしたがってコプロセッサの機能を制御する制御回路と、
RTレベルで扱うALUやレジスタファイルなどで分類した回路資源群と、
各々の回路資源の入出力バスに配置したマルチプレクサ群と、
を備えている。マルチプレクサ群の接続先は、制御回路からのモード信号(選択信号)で設定される。
すなわち、本実施例においては、コプロセッサ116の制御回路が出力するモード信号(選択信号)の状態によって、コプロセッサ116内の回路資源群の入出力バスの接続先が変わり、階層定義された様々な拡張コプロセッサ命令の実現を可能とする。
コプロセッサバス・インタフェースは、ソースバス、ターゲットバス、宛先リードバス、ライトバスが接続される。またプロセッサ101からの要求、命令(オペコード)、即値データ、コプロセッサ116からのウエイト、パイプライン状態等が転送される。
回路資源群/マルチプレクサ群は、図1の資源A、BとMUXに対応している。制御回路/FSM(Finite State machine)は、MUX選択信号と即値等を回路資源群/マルチプレクサ群に供給し、プロセッサ101からの要求を受け、資源の競合発生時、プロセッサ101にウエイト信号を送出する。
デコーダは、プロセッサ101から転送されたオペコード、コマンドをデコードする。
図4には、3通りの拡張コプロセッサ命令が実行された時の回路構成の変化が示されている。
命令Aは、右上の破線部(a)のように、演算器AとBを並列動作させる処理を1クロックサイクルで行う。
命令Bは、右中の破線部(b)のように、1サイクル目で、演算器Aを動作させ、演算結果をレジスタCに格納し、2サイクル目で演算器Bを動作させ演算結果をレジスタBに格納するという具合に、2サイクルかけて命令実行を行う。
破線部(c)では、演算器Aを使った命令Cと、演算器Bを使った命令Dを、同時実行している状態を示す。
図5は、一例として、プロセッサAとプロセッサBから同時にコプロセッサ命令が発行されたときのパイプラインの遷移を示す図である。本実施例においては、プロセッサA、Bからコプロセッサヘ送るコマンド(命令)は、レベル1乃至レベル3の命令からなる。また、プロセッサから転送されたコプロセッサ命令を受け取ったコプロセッサにおいて、デコード(DE)ステージから開始し、演算実行(EX)ステージで実行した演算結果を、メモリアクセス(ME)ステージでプロセッサ側に返すようにしてもよい。
図5に示す例では、プロセッサA、Bで同時に発行されたコプロセッサ命令は、コプロセッサ116内の回路資源が競合しないため、コプロセッサ116内で同時に実行することが可能である。すなわち、プロセッサA、Bでフェッチされたコプロセッサ命令は、プロセッサA、Bのデコード(DE)ステージでコプロセッサ116に転送され、コプロセッサ116において、例えば2本のパイプラインにて同時に並列実行される。あるいは、コプロセッサ116において、パイプラインの各ステージを時分割で実行するようにしてもよい。
プロセッサAで発行され、コプロセッサ116で実行されたコプロセッサ命令は、コプロセッサ116の演算実行(EX−A)ステージのあと演算結果がレジスタ(REG)に格納され、プロセッサAのメモリアクセス(ME)ステージでプロセッサAに演算結果が返送され、ライトバック(WB)ステージでプロセッサAのレジスタに演算結果が格納される。
プロセッサBで発行され、コプロセッサ116で実行されたコプロセッサ命令は、コプロセッサ116の演算実行(EX−B)ステージのあと演算結果がメモリ(MEM)に格納され、プロセッサAのメモリアクセス(ME)ステージでプロセッサBに演算結果が返送され、ライトバック(WB)ステージでプロセッサBのレジスタに演算結果が格納される。プロセッサ側のメモリアクセス(ME)ステージにおいて、データメモリへのメモリアクセス等は、疎結合バスによる。
コプロセッサ命令によっては、EXステージのみ動作するものもあれば、MEMステージまで必要とするもの、DEステージから必要とするものと様々あり、それら命令が使う回路資源が競合しなければ、複数のコプロセッサを同時実行することが可能となる。
本実施例によれば、プロセッサのローカルバスに密結合されたコプロセッサの演算資源は、プロセッサ間で共有可能となり、コプロセッサの演算資源の共有と、密結合による高速アクセスとを両立させることができる。
次に、図6を参照して、本実施例における、密結合バスを介したコプロセッサのアクセス調停について説明する。特に制限されないが、本実施例において、命令パイプラインは、命令フェッチ(IF)、デコード(DE)、演算実行(EX)、メモリアクセス(ME)、結果格納(WB)の5段のステージを含むものとする。例えばロード命令の場合、EXステージでアドレスの計算が行われ、MEステージでデータメモリからデータが読み出され、WBステージで読み出しデータがレジスタに書き込まれる。ストア命令の場合、EXステージでアドレスの計算が行われ、MEステージでデータはデータメモリに書き込まれ、WBステージでは何も行われない。
図6(A)を参照すると、プロセッサAでは、命令をローカルメモリ(あるいは、プロセッサA内蔵の命令メモリ)よりフェッチし(IF)、デコード(DE)ステージにて、フェッチした命令が、コプロセッサ命令であると判定された場合、該命令を、コプロセッサで実行させるため、コプロセッサの使用要求を、アービトレーション回路(図1の115)に出力する。プロセッサAは、アービトレーション回路から使用許諾を受け、当該命令をコプロセッサに送信する。コプロセッサでは、プロセッサAから受け取った当該命令のデコード(COP DE)、命令の実行(COP EX)、メモリアクセス(COP ME)の各ステージを実行し、プロセッサAによるライトバックステージ(WB)が実行される。特に制限されないが、コプロセッサのメモリアクセス(COP ME)ステージにおいて、コプロセッサでの命令実行結果(演算結果)が、プロセッサAのローカルバスを介してプロセッサAに転送され、プロセッサAのライトバック(WB)ステージにおいて、プロセッサA内のレジスタに書き込まれる構成としてもよい。この場合、プロセッサAは、MEステージでデータメモリのかわりに、コプロセッサから演算結果を受け取り、WBステージで結果をレジスタに格納することになる。なお、図6(A)に示す例では、各プロセッサにおける命令パイプライン・ステージ(DE、EX、ME)と、該プロセッサが発行したコプロセッサ命令を実行するコプロセッサの命令パイプライン・ステージ(COP DE、COP EX、COP ME)とが同期しているが、コプロセッサとプロセッサの動作周波数が相違してもよいことは勿論である。あるいは、コプロセッサがプロセッサと非同期で動作し、コプロセッサで演算が終了した場合、READY信号をプロセッサに通知する構成としてもよい。
プロセッサBも、当該命令のデコード(COP DE)、命令の実行(COP EX)、メモリアクセス(COP ME)の各ステージをコプロセッサで行わせることになる。この場合、アービトレーション回路(図1の115)は、コプロセッサの命令デコード(DE)ステージ(プロセッサA発行のコプロセッサ命令のDEステージ分)に相当する期間、プロセッサBをウェイト状態とし、プロセッサB発行のコプロセッサ命令に関してデコード(DE)ステージがストールされる。つづいて、ウェイト(WAIT)が解除される。プロセッサBは、アービトレーション回路から使用許諾(WAIT解除)を受け、当該命令をコプロセッサに送信する。コプロセッサでは、プロセッサBから受け取った当該命令のデコード(COP DE)、命令の実行(COP EX)、メモリアクセス(COP ME)の各ステージを順次実行し、プロセッサBによるライトバックステージ(WB)が実行される。
図6(A)には、コプロセッサの命令デコード(DE)ステージでの回路資源に競合が生じた例(例えばプロセッサA、Bで同時に発行されたコプロセッサ命令が同一の場合)が示されているが、アクセスの競合が調停される対象は、命令デコード(DE)ステージに限定されるものでなく、演算実行(EX)ステージ、メモリアクセス(ME)ステージにおいて、コプロセッサの回路資源に競合が生じた場合、使用が許可されたプロセッサ以外のプロセッサによるコプロセッサの回路資源の使用は、ウェイト状態に設定される。
一方、プロセッサA、Bがそれぞれ発行したコプロセッサ命令に、回路資源のアクセス競合がない場合には、図6(B)に示すように、WAIT信号は非活性(LOW)のままであり、コプロセッサでは、プロセッサAとプロセッサBからのコプロセッサ命令の命令デコード(DE)からメモリアクセス(ME)のパイプライン・ステージが同時に実行される。特に制限されないが、図6(A)、(B)に示す例では、コプロセッサ116は2本のパイプラインを備え、2命令同時発行可能な構成としてもよい。
本実施例では、プロセッサに密結合されたコプロセッサの回路資源の競合の調整を、命令パイプラインのステージ単位で行っている。例えば図1のアービトレーション回路115において、コプロセッサ116のパイプラインのステージの進捗情報(現在のステージ)が、コプロセッサバス114を介して通知され、アービトレーション回路115では、対応する資源の使用を監視し、使用要求対象の資源と競合が生じるか判別する制御を行う。すなわち、密結合バスには、コプロセッサ116からコプロセッサ116のパイプラインの状態等の信号が転送される構成としてもよい。この場合、プロセッサ101A、101Bには、コプロセッサバス114を介してパイプラインの状態等が通知される。
密結合バスを介しての資源の競合を調停するアービトレーション回路115においては、パイプラインのステージ単位で資源競合の調停を行っているが、パイプラインのステージ単位ではなく、命令サイクル単位で、プロセッサ間でのコプロセッサ116の資源競合の調停を行うようにしてもよいことは勿論である。
図7は、比較例として、プロセッサを共通バス等の疎結合バスを介してコプロセッサに接続した場合の命令パイプラインの推移を示す図である。
プロセッサが共通バス等の疎結合バスを介してコプロセッサに命令を渡す場合、プロセッサの命令パイプラインのメモリアクセス(ME)ステージにおいて、コプロセッサに命令が渡され、コプロセッサでは、プロセッサのメモリアクセス(ME)ステージの後半に当該命令のデコード(COP DE)が行われ、プロセッサのライトバック(WB)ステージに対応するサイクルで、コプロセッサの演算実行(EX)ステージが実行され、つづいてメモリアクセス(COP ME)ステージが実行される。特に制限されないが、コプロセッサにおけるメモリアクセス(COP ME)ステージでは、コプロセッサからプロセッサへデータの転送が行われる。図7に示す例では、共通バス等の疎結合バスのバスサイクルが低速であるため、バスアクセスによりプロセッサ側のパイプラインに停止期間が生じる。例えばコプロセッサにおけるメモリアクセス(COP ME)ステージに対応する期間、プロセッサ側のパイプラインに空きが生じている。
図7(A)に示すように、プロセッサAとプロセッサBのメモリアクセス(ME)ステージに競合がある場合、プロセッサBのメモリアクセス(ME)(したがって、コプロセッサへコプロセッサ命令を転送しコプロセッサでコプロセッサ命令をデコードするDEステージ)は、コプロセッサにおいて、プロセッサA発行のコプロセッサ命令のデコード(COP DE)、命令実行(COP EX)、メモリアクセス(COP ME)のステージが終了するまで、待機状態とされる。すなわち、共通バス等の疎結合バスにおいては、プロセッサA発行の命令を実行するコプロセッサのメモリアクセス(COP ME)は、プロセッサBのメモリアクセス(ME)ステージと、バス資源の競合が生じるため、プロセッサA発行の命令のデコード(COP DE)、命令実行(COP EX)、メモリアクセス(COP ME)のステージが終了するまで、プロセッサBのメモリアクセス(ME)ステージはストールされる。
コプロセッサにおけるプロセッサA発行の命令のメモリアクセス(COP ME)ステージ終了後、プロセッサBのメモリアクセス(ME)ステージのウェイトが解除され、これを受けて、プロセッサB発行のコプロセッサ命令がコプロセッサに転送され、コプロセッサにおいて、プロセッサB発行のコプロセッサ命令のデコード(COP DE)、実行(COP EX)、メモリアクセス(COP ME)の各ステージが順次実行される。
プロセッサA、Bから発行されるコプロセッサ命令に、回路資源のアクセス競合がない場合には、図7(B)に示すように、ウェイト(WAIT)信号は非活性(LOW)のままである。図7(B)に示す例において、プロセッサBでは、プロセッサAのメモリアクセス(ME)のステージでは、プロセッサBにおける命令フェッチ(IF)、デコード(DE)、実行(EX)が行われ、プロセッサAのメモリアクセス(ME)につづいて、プロセッサBのメモリアクセス(ME)のステージが実行される。すなわち、コプロセッサでは、プロセッサA発行の命令のメモリアクセス(COP ME)につづいて、プロセッサB発行の命令のデコードCOP DE)が行われる。
図6(A)に示した密結合バスの場合、アクセス競合時にパイプラインがストールされる期間(遅延)は、例えばパイプライン1段分の期間(図6(A)ではDEステージ)であるのに対して、図7(A)の疎結合バスの場合、アクセス競合が生じた場合のプロセッサのMEステージのストールされる期間は長く、特にバスサイクルが低速である場合、ストールされる期間は長くなり、パイプラインに停止期間が生じる。図6(A)に示した密結合バスの場合、パイプラインの停止(空き)は生じていない。
図8は、本実施例のコプロセッサを用いた構成において、複数サイクルのコプロセッサの命令が競合した場合を説明するための図である。コプロセッサで実行されるパイプラインにおいて、複数サイクルのコプロセッサ命令が競合した場合を示している。プロセッサA発行のコプロセッサ命令を実行するコプロセッサにおけるパイプラインの演算実行ステージ(COP EX1〜EX5)において、プロセッサBのコプロセッサ命令で使う資源アクセスが競合している場合、この期間、アービトレーション回路(図1の115)から、プロセッサBへのWAIT信号が出力され、コプロセッサにおけるプロセッサB発行のコプロセッサ命令のデコード(DE)ステージがストールされる。コプロセッサにおけるプロセッサA発行のコプロセッサ命令の演算実行ステージ(COP EX5)の終了後、プロセッサB発行のコプロセッサ命令の演算実行ステージ(COP EX1〜EX5)とメモリアクセス(COP ME)ステージが実行される。
なお、本実施例では、資源競合のアービトレーション(調停)制御を、命令パイプラインのステージ単位で行う例を説明したが、資源のアクセス競合に基づき、命令サイクル単位でのアービトレーション、複数命令単位でのアクセス・アービトレーションを行ってもよい。
上記実施例では、コプロセッサ内の回路資源をRTレベルで扱うALUやレジスタファイルなどで分類する方法として、それら資源を用いたコプロセッサ命令を階層定義している。このため、以下のような効果を奏する。
前記第1の実施例によれば、複数のプロセッサは密結合コプロセッサ内の回路資源(演算器など)に個々にアクセス可能となり、分類した回路単位で資源有効活用(同時使用)が可能となる。
前記第2の実施例によれば、コプロセッサ内の回路資源をRTレベルで扱うALUやレジスタファイルなどで分類する方法として、それら回路資源を用い拡張コプロセッサ命令を階層定義することによって、回路資源単位だけでなく、階層定義した命令単位での、競合調停をすることによって、さらに高度な競合解決が可能となる。
また、最上位命令に対して変更を加えたい場合に、中位層や下位層の命令を用いたプログラミングによる変更が可能となる(図4参照)。すなわち、ハードウエアの変更を回避可能としている。
なお、上記の特許文献、非特許文献の各開示を、本書に引用をもって繰り込むものとする。本発明の全開示(請求の範囲を含む)の枠内において、さらにその基本的技術思想に基づいて、実施形態ないし実施例の変更・調整が可能である。また、本発明の請求の範囲の枠内において種々の開示要素の多様な組み合わせないし選択が可能である。すなわち、本発明は、請求の範囲を含む全開示、技術的思想にしたがって当業者であればなし得るであろう各種変形、修正を含むことは勿論である。
本発明の第1の実施例の概略構成を示す図である。 本発明の第2の実施例のコプロセッサの構成を示す図である。 本発明の第3の実施例のコプロセッサの構成の一例を示す図である。 本発明の第4の実施例のコプロセッサの構成の一例を示す図である。 本発明の第4の実施例の動作の一例を示す図である。 密結合バスでのアクセス競合の有無を説明するための図である。 疎結合バスでのアクセス競合の有無を説明するための図である。 密結合バスでのアクセス競合の有無を説明するための図である。 関連技術の構成を示す図である。 図9の構成を説明する図である。 関連技術の構成を示す図である。 図11の構成を説明する図である。
符号の説明
10 CPU
30 メモリ
40a、40b、40c、40d 周辺装置
101 プロセッサ
101A、201A プロセッサA
101B、201B プロセッサB
102A、202A ローカルメモリ
102B、202B ローカルメモリ
103、204 共用メモリ
104 共有コプロセッサ
105、206 共通バス
116、126、203A、203B コプロセッサ(密結合コプロセッサ)
115 アービトレーション回路
111A、111B 信号線(コプロセッサ使用要求)
112A、112B 信号線(WAIT信号)
114 コプロセッサバス(マルチレイヤ)

Claims (8)

  1. 複数のプロセッサに対して共通に設けられ、複数の資源を有するコプロセッサと、
    前記プロセッサから前記コプロセッサに対して発行される命令に応じて、資源単位又は複数の資源の階層について、前記複数のプロセッサ間での競合を調停するアービトレーション手段と、
    を備えている、マルチプロセッサ装置。
  2. 前記コプロセッサは、前記プロセッサから前記コプロセッサに対して発行される命令に応じて、前記コプロセッサの複数の資源の接続関係を可変に設定する、請求項1記載のマルチプロセッサ装置。
  3. 前記密結合バスは、前記複数のプロセッサが前記コプロセッサにそれぞれ別々の層でアクセスするバスを含む、請求項1記載のマルチプロセッサ装置。
  4. 前記アービトレーション手段による制御のもと、前記複数のプロセッサによる、前記密結合バスを介しての、前記コプロセッサ内の互いに競合しない、同一又は異なる階層の複数の資源の同時使用が可能とされる、請求項1記載のマルチプロセッサ装置。
  5. 前記コプロセッサ内の1つ又は複数の資源を排他的に利用する拡張命令を命令セットとして用意しておき、
    前記複数のプロセッサから、前記拡張命令が前記コプロセッサに対して同時に発行された場合、前記アービトレーション手段により、前記拡張命令に対応した1つ又は複数の資源単位での競合が調停される、請求項1記載のマルチプロセッサ装置。
  6. 前記拡張命令は、
    回路資源の単位機能に対応する第1層の拡張命令群と、
    前記第1層の拡張命令に対応する回路資源を複数組み合わせて所定の機能を実現する第2層の拡張命令群と、
    を含む、請求項5記載のマルチプロセッサ装置。
  7. 前記拡張命令は、
    前記第2層の拡張命令に対応する回路資源を組み合わせて所定の機能を実現する第3層の拡張命令群を含む、請求項6記載のマルチプロセッサ装置。
  8. 前記コプロセッサは、前記プロセッサと密結合バスを介してのインタフェースを行うインタフェース回路と、
    前記密結合バスを介して前記プロセッサから与えられたコマンドを解釈するデコーダと、
    コマンドをデコードした信号でコプロセッサの機能を制御する制御回路と、
    演算回路、レジスタファイルを含む回路資源群と、
    前記回路資源の入出力バスに配置されたマルチプレクサ群と、
    を備え、前記制御回路は、前記マルチプレクサ群の接続先を指定する選択信号を出力する、請求項5記載のマルチプロセッサ装置。
JP2007189770A 2007-07-20 2007-07-20 マルチプロセッサ装置 Pending JP2009026136A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2007189770A JP2009026136A (ja) 2007-07-20 2007-07-20 マルチプロセッサ装置
US12/175,700 US20090106467A1 (en) 2007-07-20 2008-07-18 Multiprocessor apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007189770A JP2009026136A (ja) 2007-07-20 2007-07-20 マルチプロセッサ装置

Publications (1)

Publication Number Publication Date
JP2009026136A true JP2009026136A (ja) 2009-02-05

Family

ID=40397874

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007189770A Pending JP2009026136A (ja) 2007-07-20 2007-07-20 マルチプロセッサ装置

Country Status (2)

Country Link
US (1) US20090106467A1 (ja)
JP (1) JP2009026136A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101510162B (zh) * 2009-03-26 2011-11-02 浙江大学 一种基于延时策略的软件事务内存的实现方法

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5565228B2 (ja) * 2010-09-13 2014-08-06 ソニー株式会社 プロセッサ
JP2013222364A (ja) * 2012-04-18 2013-10-28 Renesas Electronics Corp 信号処理回路
US11875183B2 (en) * 2018-05-30 2024-01-16 Texas Instruments Incorporated Real-time arbitration of shared resources in a multi-master communication and control system
CN111782580B (zh) * 2020-06-30 2024-03-01 北京百度网讯科技有限公司 复杂计算装置、方法、人工智能芯片和电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59106075A (ja) * 1982-12-10 1984-06-19 Hitachi Ltd デ−タ処理システム
JPH07281896A (ja) * 1994-04-15 1995-10-27 Hitachi Ltd 情報処理装置
JP2007087244A (ja) * 2005-09-26 2007-04-05 Sony Corp コプロセッサ及びコンピュータシステム

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3805247A (en) * 1972-05-16 1974-04-16 Burroughs Corp Description driven microprogrammable multiprocessor system
US5182801A (en) * 1989-06-09 1993-01-26 Digital Equipment Corporation Apparatus and method for providing fast data transfer between multiple devices through dynamic reconfiguration of the memory space of the devices
US5265257A (en) * 1990-06-22 1993-11-23 Digital Equipment Corporation Fast arbiter having easy scaling for large numbers of requesters, large numbers of resource types with multiple instances of each type, and selectable queuing disciplines
JP2908598B2 (ja) * 1991-06-06 1999-06-21 松下電器産業株式会社 情報処理装置
US5371893A (en) * 1991-12-27 1994-12-06 International Business Machines Corporation Look-ahead priority arbitration system and method
WO1994027216A1 (en) * 1993-05-14 1994-11-24 Massachusetts Institute Of Technology Multiprocessor coupling system with integrated compile and run time scheduling for parallelism
US6594752B1 (en) * 1995-04-17 2003-07-15 Ricoh Company, Ltd. Meta-address architecture for parallel, dynamically reconfigurable computing
EP0752666A3 (en) * 1995-07-06 2004-04-28 Sun Microsystems, Inc. Method and apparatus for fast-forwarding slave requests in a packet-switched computer system
US5754865A (en) * 1995-12-18 1998-05-19 International Business Machines Corporation Logical address bus architecture for multiple processor systems
US6173349B1 (en) * 1996-10-18 2001-01-09 Samsung Electronics Co., Ltd. Shared bus system with transaction and destination ID
US5784394A (en) * 1996-11-15 1998-07-21 International Business Machines Corporation Method and system for implementing parity error recovery schemes in a data processing system
US6055619A (en) * 1997-02-07 2000-04-25 Cirrus Logic, Inc. Circuits, system, and methods for processing multiple data streams
US5941949A (en) * 1997-05-14 1999-08-24 Citrix Systems, Inc. System and method for transmitting data from a server application to more than one client node
US5949982A (en) * 1997-06-09 1999-09-07 International Business Machines Corporation Data processing system and method for implementing a switch protocol in a communication system
US6026478A (en) * 1997-08-01 2000-02-15 Micron Technology, Inc. Split embedded DRAM processor
US6049845A (en) * 1997-11-05 2000-04-11 Unisys Corporation System and method for providing speculative arbitration for transferring data
US6230229B1 (en) * 1997-12-19 2001-05-08 Storage Technology Corporation Method and system for arbitrating path contention in a crossbar interconnect network
US6041400A (en) * 1998-10-26 2000-03-21 Sony Corporation Distributed extensible processing architecture for digital signal processing applications
US6185221B1 (en) * 1998-11-09 2001-02-06 Cabletron Systems, Inc. Method and apparatus for fair and efficient scheduling of variable-size data packets in an input-buffered multipoint switch
US7072817B1 (en) * 1999-10-01 2006-07-04 Stmicroelectronics Ltd. Method of designing an initiator in an integrated circuit
US6628662B1 (en) * 1999-11-29 2003-09-30 International Business Machines Corporation Method and system for multilevel arbitration in a non-blocking crossbar switch
US6829697B1 (en) * 2000-09-06 2004-12-07 International Business Machines Corporation Multiple logical interfaces to a shared coprocessor resource
US6687797B1 (en) * 2001-05-17 2004-02-03 Emc Corporation Arbitration system and method
US7714870B2 (en) * 2003-06-23 2010-05-11 Intel Corporation Apparatus and method for selectable hardware accelerators in a data driven architecture
US7013357B2 (en) * 2003-09-12 2006-03-14 Freescale Semiconductor, Inc. Arbiter having programmable arbitration points for undefined length burst accesses and method
US7584345B2 (en) * 2003-10-30 2009-09-01 International Business Machines Corporation System for using FPGA technology with a microprocessor for reconfigurable, instruction level hardware acceleration
US7587543B2 (en) * 2006-01-23 2009-09-08 International Business Machines Corporation Apparatus, method and computer program product for dynamic arbitration control
US7844805B2 (en) * 2006-08-23 2010-11-30 Via Technologies, Inc. Portable processing device having a modem selectively coupled to a RISC core or a CISC core
US9262356B2 (en) * 2006-12-15 2016-02-16 Lantiq Beteiligungs-GmbH & Co.KG Arbiter device and arbitration method
US8156273B2 (en) * 2007-05-10 2012-04-10 Freescale Semiconductor, Inc. Method and system for controlling transmission and execution of commands in an integrated circuit device

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59106075A (ja) * 1982-12-10 1984-06-19 Hitachi Ltd デ−タ処理システム
JPH07281896A (ja) * 1994-04-15 1995-10-27 Hitachi Ltd 情報処理装置
JP2007087244A (ja) * 2005-09-26 2007-04-05 Sony Corp コプロセッサ及びコンピュータシステム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101510162B (zh) * 2009-03-26 2011-11-02 浙江大学 一种基于延时策略的软件事务内存的实现方法

Also Published As

Publication number Publication date
US20090106467A1 (en) 2009-04-23

Similar Documents

Publication Publication Date Title
US11494194B2 (en) Processor having multiple cores, shared core extension logic, and shared core extension utilization instructions
JP6708335B2 (ja) ユーザレベルの分岐及び結合を行うプロセッサ、方法、システム、及び命令
JP3524110B2 (ja) マイクロコンピュータシステム
EP2140347B1 (en) Processing long-latency instructions in a pipelined processor
US5179530A (en) Architecture for integrated concurrent vector signal processor
TWI386814B (zh) 具動態工作管理能力之多處理器界面及其程式載卸方法
AU2007212342B2 (en) Thread optimized multiprocessor architecture
JP2701179B2 (ja) データ処理システム
US20080046689A1 (en) Method and apparatus for cooperative multithreading
EP2587384B1 (en) Configurable data transfer in a digital signal processing system
JP2007041781A (ja) リコンフィグ可能な集積回路装置
TW201741872A (zh) 根據指令類型來配置負載及儲存緩衝器的處理器、方法及系統
KR100834180B1 (ko) 프로그램/명령어의 실행을 구동하는 “l”구동법 및그것의 아키텍처와 프로세서
JP2009026136A (ja) マルチプロセッサ装置
US8055882B2 (en) Multiplexing commands from processors to tightly coupled coprocessor upon state based arbitration for coprocessor resources
Kawano et al. Fine-grain multi-thread processor architecture for massively parallel processing
US11243778B1 (en) Instruction dispatch for superscalar processors
WO2003044688A2 (en) Latency tolerant processing equipment
Pulka et al. Multithread RISC architecture based on programmable interleaved pipelining
JPH02211534A (ja) 並列処理装置
JPH01295366A (ja) ベクトル処理装置
JPS63318635A (ja) デ−タ処理装置
JP2003330907A (ja) マイクロコンピュータシステム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100419

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111226

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120117

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120515