JP4719655B2 - ネットワーク上におけるプロセッサ制御技術 - Google Patents

ネットワーク上におけるプロセッサ制御技術 Download PDF

Info

Publication number
JP4719655B2
JP4719655B2 JP2006262023A JP2006262023A JP4719655B2 JP 4719655 B2 JP4719655 B2 JP 4719655B2 JP 2006262023 A JP2006262023 A JP 2006262023A JP 2006262023 A JP2006262023 A JP 2006262023A JP 4719655 B2 JP4719655 B2 JP 4719655B2
Authority
JP
Japan
Prior art keywords
processor
host
memory
execution
file image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006262023A
Other languages
English (en)
Other versions
JP2007095065A (ja
Inventor
達也 岩本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Interactive Entertainment Inc
Original Assignee
Sony Interactive Entertainment Inc
Sony Computer Entertainment Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Interactive Entertainment Inc, Sony Computer Entertainment Inc filed Critical Sony Interactive Entertainment Inc
Publication of JP2007095065A publication Critical patent/JP2007095065A/ja
Application granted granted Critical
Publication of JP4719655B2 publication Critical patent/JP4719655B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/38Concurrent instruction execution, e.g. pipeline or look ahead
    • G06F9/3861Recovery, e.g. branch miss-prediction, exception handling
    • G06F9/3865Recovery, e.g. branch miss-prediction, exception handling using deferred exception handling, e.g. exception flags
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/485Task life-cycle, e.g. stopping, restarting, resuming execution
    • G06F9/4856Task life-cycle, e.g. stopping, restarting, resuming execution resumption being on a different machine, e.g. task migration, virtual machine migration

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multi Processors (AREA)
  • Image Processing (AREA)
  • Peptides Or Proteins (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Mobile Radio Communication Systems (AREA)

Description

本出願は、その優先日と同時に出願され、本出願と譲受人が共通する米国特許出願「発明の名称:CELLプロセッサついての方法および装置(CELL PROCESSOR METHODS AND APPARATUS)、John P.Bates,Payton R.White,Attila Vass」に関連し、関連出願の主題は、ここに引用により組み込まれる。
本出願は、その優先日と同時に出願され、本出願と譲受人が共通する米国特許出願「発明の名称:CELLプロセッサのタスクとデータの管理(CELL PROCESSOR TASK AND DATA MANAGEMENT)、Richard B.Stenson,John P.Bates」に関連し、関連出願の主題は、ここに引用により組み込まれる。
本出願は、その優先日と同時に出願され、本出願と譲受人が共通する米国特許出願「発明の名称:CELLプロセッサのためのSPUタスクマネージャ(SPU TASK MANAGER FOR CELL PROCESSOR)、John P.Bates,Payton R.White,Richard B.Stenson,Howard Berkey,Attila Vass,Mark Cerny」に関連し、関連出願の主題は、ここに引用により組み込まれる。
本出願は、その優先日と同時に出願され、本出願と譲受人が共通する米国特許出願「発明の名称:CELLプロセッサにおいてメモリコピー機能を実現するための方法および装置(METHOD AND SYSTEM FOR PERFORMING MEMORY COPY FUNCTION ON A CELL PROCESSOR)、Antoine Labour,John P.Bates,Richard B.Stenson」に関連し、関連出願の主題は、ここに引用により組み込まれる。
本実施例は、CELLプロセッサに関連し、より詳細には、ネットワーク上において複数のCELLプロセッサを制御するための技術、に関する。
CELLプロセッサとは、並行処理可能なマイクロプロセッサの一種である。基本構成のCELLプロセッサには、1つのPPE(Power Processor Element)(「Processing Element」すなわち「PE」ともよばれる)と、複数のSPE(Synergistic Processing Elements)が含まれる。PPEとSPEは、EIB(Element Interconnect Bus)とよばれる内部高速バスによって接続される。CELLプロセッサは、携帯型デバイスからメインフレームまでのさまざまなアプリケーションについて対応可能に設計されている。
ある種のCELLプロセッサでは、SPEは一体的な実行環境(monolithic execution environment)となる。CELLプロセッサ上で実行されるアプリケーションの可搬性やネットワーク透過性を向上させるように、各SPEは互いに独立性の高い実行主体となっている。このようなポータブルなSPEアプリケーションは、SPUレット(SPUlet)とかアプレット(APUlet)とよばれる。しかし、いろいろなSPUレットに対して同一サイズの実行環境を割り当てるのは問題がある。特に、SPUレットは単一粒度にだけなることもある。通常の従来型SPUレットは、単一のSPEにロードされる、実行可能形式の単一ファイルイメージである。アプリケーションプログラムがより多くのリソース(計算資源)を必要とすると予想される場合、これらのリソースを複数のSPUレットに分割するのは効率的ではない。特に、SPUレットがネットワークを横断して伝送される必要があるときにはなおさらである。
したがって、CELLプロセッサのアプリケーションを、ネットワークの内外で動作できるようにパッケージ化して移動させる上では、より大きなサイズの移動可能単位にてデータを構造化するための技術、が必要である。
本発明のある態様は、2以上のCELLプロセッサをネットワーク上で動作させるための方法である。各CELLプロセッサは、PPU(Power Processor Unit)と、メインメモリと、1以上のSPE(Synergistic processing engine)と、を備える。各SPEは、SPU(Synergistic Processing Unit)と、ローカルストレージと、MFC(Memory Flow Controller)と、を備える。
この方法は、ネットワークを介して、クライアントデバイスのCELLプロセッサであるクライアントCELLプロセッサから、ホストデバイスのCELLプロセッサであるホストCELLプロセッサに対してファイルイメージを転送するステップを含み、このファイルイメージとは、SPUイメージと共有初期化データ、または、2以上のSPUイメージを含む。
本発明の教授するところは、添付図面とあわせて以下の詳細な説明を考慮することにより容易に理解されるでろう。
以下の記述においては、例示のために多くの特定的な詳細を含むけれども、本発明の範囲内において、以下の詳細について多くの変形や変更が可能であることは、当業者には理解されるところである。したがって、下記に示す本発明の実施例は、請求項に記載の発明の一般性を失わせるものでも制約を設けるものでもない。
本発明の実施例におけるCELLプロセッサは、下記において拡張SPUレットとして参照される移動単位にて、CELLプロセッサ中の1以上のSPEについての動作関連情報をロード、ストア、セーブ可能である。従来型SPUレットと異なり、本実施例における拡張SPUレットは、2以上のSPUイメージ、または、1以上のSPUイメージと共有初期化データのような複数SPUについての追加的な動作関連情報を含むことができる。通常、共有データは、拡張SPUレットを実行する2以上のSPEによって共有される。実行コンテキストの独立性ためには、PPUに共有データへアクセスさせない方が望ましい。ただし、PPUは、一時停止(サスペンド:suspend)や実行再開(レジューム:resume)のような管理上の理由からアクセスできる。拡張SPUレットと管理用PPUの間の通信は、メモリ上に特別に設定されたメッセージボックス領域を介して実行可能である。拡張SPUレットは従来型SPUレットよりも粒度が大きい。拡張SPUレットは、複数SPEのセットアップ、共有初期化データや追加的なコードなどのためのメモリ追加割り当て、SPEとシステムメインメモリの間のメモリマッピングに関連した問題についても対応できる。
一般的には、CELLプロセッサは、4つの分離された機能コンポーネントを含む。PPE(PowerPC Processor Element)、SPU(Synergistic Processor Unit)、MFC(メモリフローコントローラ:Memory Flow Controller)、IIC(内部割込コントローラ:Internal Interrupt Controller)である。PPEとSPUは、CBEA準拠プロセッサの計算ユニットである。各SPUは、専用のローカルストレージ、MMU(メモリ管理ユニット:Memory Management Unit)とそれに対応する専用のMFC、RMT(書き換え管理テーブル:Replacement Management Table)を持たなければならない。これらのコンポーネントの組み合わせを、SPUエレメント(SPE)とよぶ。CELLプロセッサは、マザーボードやその他セカンド−レベル・パッケージにおけるシングルチップやマルチチップのモジュール(あるいは、複数のマルチチップモジュール)、複数のシングルチップモジュールであってもよく、目的とする設計についての使用技術やコストパフォーマンス特性によって決定すればよい。
制約的な意味ではない設例として、図1は、CBEA(CELLブロードバンドエンジン・アーキテクチャ:Cell Broadband engine architecture)として知られるアーキテクチャ準拠のCELLプロセッサ100を示している。同図設例に示すようにCELLプロセッサは、PPEの複数個の集合(PPEグループ)と、SPEの複数個の集合(SPEグループ)を備えることができる。あるいは、CELLプロセッサは、単一のSPEと単一のPPEにより、単一のSPEグループと単一のPPEグループだけを備えてもよい。グループ内の各ユニットは、ハードウェア資源を共有できる。ただし、ソフトウェアからは、SPEとPPEは独立した要素として見えなければならない。
図1に示す例では、CELLプロセッサ100は、SG−0、・・・、SG−nといった多数のSPEグループと、PG−0、・・・、PG−pといった多数のPPEグループを含む。各SPEグループは、SPE0、・・・、SPEgといった多数のSPEを含む。また、CELLプロセッサ100は、メインメモリ(MEM)と入出力機能(I/O)も含む。以下に述べる1以上の拡張SPUレット102は、メインメモリMEMに格納される。
各PPEグループは、PPE−0、・・・、PPE−gといった多数のPPEを含む。この例では、SPEグループは、単一のキャッシュSL1を共有する。キャッシュSL1は、ローカルストレージとメインストレージの間におけるDMA転送のためのファーストレベルキャッシュである。グループ内の各PPEは、それぞれ専用のファーストレベル(内部)キャッシュL1を持つ。加えて、グループ内のPPEは、単一のセカンドレベル(外部)キャッシュL2を共有する。図1では、SPEとPPEのためのキャッシュが示されているが、一般的なCELLプロセッサ、特にCBEA準拠プロセッサにとってこれは必須の構成ではない。
要素接続バスEIBは、上記に示したさまざまなコンポーネントを接続する。各SPEグループにおけるSPEと各PPEグループにおけるPPEは、バス・インタフェース・ユニットBIUを介して、EIBにアクセスできる。CELLプロセッサ100は、通常、プロセッサ内に2つのコントローラを含む。1つは、EIBとメインメモリMEMの間のデータの流れを制御するメモリ・インタフェース・コントローラMICである。もう一つは、I/OとEIBの間のデータの流れを制御するバス・インタフェース・コントローラBICである。MIC、BIC、BIU、EIBについての実装はさまざまであるが、各実装に応じた機能や回路については当業者にとっては既知のものである。
各SPEは、SPU(SPU0、・・・、SPUg)を備える。SPEグループにおける各SPUは、専用のローカルストレージ領域LSと専用のメモリ・フロー・コントローラMFCを備える。MFCは、メモリ管理ユニットMMUと対応づけられる。MMUは、メモリ保護やアクセス許可に関する情報の保持および処理を行う。
PPEは、キャッシュ付きの64ビットのパワーPC・プロセッサ・ユニット(PPU)である。CBEA準拠システムでは、PPEは、ベクトル・マルチメディア・拡張ユニット(vector multimedia extension unit)を内蔵する。PPEは汎用処理用ユニットであり、(メモリ保護テーブルのような)システム管理資源にアクセスできる。CBEA定義のハードウェア資源は、PPEから見えるように物理アドレスに明示的にマップされる。それゆえ、いずれのPPEも、適切かつ有効なアドレス値により、どんなリソースでも直接アドレスできる。PPEの主要機能は、システム内におけるSPEタスクの割り当てと管理である。
SPEは、PPEに比べれば計算ユニットとしては複雑ではない。SPEにはシステム管理機能がないからである。SPEは、SIMD(single instruction,multiple data)による処理機能を備え、割り当てられたタスクを実行するために必要なデータ転送を(PPEによってセットアップされたアクセス属性にしたがって)開始する。SPUの目的は、計算ユニットのいっそうの高密度集積を要求し、所与の命令セットを効果的に実行できるようなアプリケーションを実現とすることである。システムにおいて、PPEに管理されるべきSPUの数は、さまざまなアプリケーションについてコスト的に効率的な処理を実現できるように決められる。SPUは、新たな命令セットアーキテクチャを実装する。
MFCコンポーネントは、本質的にはデータ転送エンジンである。MFCは、CELLプロセッサのメインストレージとSPEのローカルストレージの間におけるデータの転送、保護、同期に関する主要機能を担う。MFCコマンドは、転送の実行を示す。アーキテクチャ上におけるMFCの最重要目的は、できるかぎり高速・正確にデータ転送を実行し、CELLプロセッサの全体としてのスループットを最大化することである。データ転送用コマンドは、MFC・DMAコマンドとして参照される。これらのコマンドが変換されて、ローカルストレージ領域とメインストレージ領域の間のDMA転送となる。
通常、各MFCは、同時に複数のDMA転送をサポートし、複数のMFCコマンドを保持・処理できる。このような機能を実現するため、MFCは、MFCコマンドキューを保持・処理する。MFCは、複数個の転送要求キューに投入したり、それらを同時発行することもできる。各MFCは、対応するSPUのためのキュー(MFC・SPU・コマンドキュー)と、他のプロセッサやデバイスのためのキュー(MFC・プロキシ・コマンドキュー)を備える。論理的には、MFCキューの集合は、常に、CELLプロセッサ内の各SPUに対応づけられている。しかし、アーキテクチャ実装によっては、SPUグループのように複数のSPU間で単一の物理的なMFCを共有することもできる。このような場合にも、ソフトウェアからは、すべてのMFCに関連する装置がSPUごとに別々にあるように見えなければならない。各MFC・DMA・データ転送要求コマンドは、ローカルストレージのアドレス(LSA:local strage address)と有効アドレス(EA:effective address)の両方を含む。ローカルストレージアドレスは、該当SPUのローカルストレージ領域だけを直接アドレスできる。有効アドレスは、もう少し一般的に応用できる。実アドレス空間にエイリアス(別名:aliase)がなされているときには(すなわち、MFC-SR1[D]に'1'がセットされるとき)、全SPUのローカルストレージ領域も含めて、メインストレージを参照できるからである。
MFCは2種類のインタフェースを提供する。1つは、SPU用であり、もう1つは、プロセスグループ内における他のプロセッサやデバイス全てのためである。SPUは、MFC制御用にチャネルインタフェース(channel interface)を使う。この場合、SPUで実行されるコードは、当該SPU用のMFC・SPU・コマンドキューにだけアクセスできる。他プロセッサやデバイスは、メモリマップされたレジスタにより、MFCを制御できる。システム内のプロセッサやデバイスは、MFCを制御し、SPUに代わってMFC・プロキシ・要求コマンドを発行できる。MFCは、また、帯域予約やデータ同期もサポートする。SPU間、および/または、SPUとPPU間、SPEとPPE間の通信用の装置には、シグナルイベントと対応づけられるシグナル通知レジスタが含まれる。通常、PPEとSPEは、PPEがSPEへメッセージを転送するルーターの役割を担うスター型トポロジーにて接続される。このようなトポロジーでは、SPE同士はダイレクトに通信しない。代わりに、各SPEや各PPEは、一方通行のシグナル通知レジスタを持ち、これは、メールボックスとして参照される。メールボックスは、SPEとホストOSの同期をとるために使うことができる。
IICコンポーネントは、PPEに対する割り込みの優先順位を管理する。IICの主目的は、プロセッサ内の他のコンポーネントからの割り込みを、メインシステムの割込コントローラを使わずに扱うことである。IICは、実際、セカンドレベルのコントローラである。CBEA準拠プロセッサに対する内部割り込み、あるいは、CBEA準拠プロセッサによるマルチプロセッサシステム内における割り込みの全てを扱うように想定されている。通常、システム割込コントローラは、CELLプロセッサに対する外部割り込みの全てに対応する。
CELLプロセッサシステムにおいては、ソフトウェアは、まず、外部のシステム割込コントローラからの割り込みがあったかを判定するために、しばしば、IICをチェックしなければならない。IICは、全てのI/Oデバイスからの割り込みの処理に関し、メインのシステム割込コントローラを代替するものではない。
CELLプロセッサには、2種類のストレージドメイン(storage domain:記憶領域)がある。ローカルストレージドメインとメインストレージドメインである。SPEのローカルストレージは、ローカルストレージドメイン内にある。他の装置やメモリは、全てメインストレージドメイン内にある。ローカルストレージは、記憶領域を1以上に分離した領域から成り、各領域は特定のSPUと関連付けられる。各SPUは、(データのロードやストアといった操作も含めて)自己に関連するローカルストレージドメイン内の命令のみを実行可能である。ローカルストレージのエイリアスが有効化されていないときには、システム内の他のストレージを対象とするデータ転送要求は、常に、(各SPUの)ローカルストレージドメインとメインストレージドメインの間でデータを転送するためのMFC・DMAコマンドを発行することでしか実行できない。
SPUプログラムは、ローカルアドレスによりローカルストレージドメインを参照する。ただし、特権ソフトウェアは、MFC-SR1の第Dビットを「1」にセットすることによって、SPUのローカルストレージドメインをメインストレージドメインにエイリアスできる。各ローカルストレージ領域には、メインストレージドメイン内の実アドレスが割り当てられることになる(実アドレスは、システムメモリにおけるバイト単位アドレスかI/Oデバイスにおけるバイト単位アドレスのいずれかである。)。これにより、特権ソフトウェアは、アプリケーションの有効アドレス空間にローカルストレージ領域を割り当てることが可能となり、あるSPUのローカルストレージと別のSPUのローカルストレージの間のDMA転送が可能となる。
別プロセッサやデバイスは、メインストレージドメインへのアクセスにより、直接的に、ローカルストレージ領域をアクセス可能となる。このローカルストレージ領域は、メインストレージドメインによって示される実アドレス空間に対して、所定の変換方式にてマップされている有効アドレスやI/Oバスアドレスによって、メインストレージドメインとエイリアスされている。
メインストレージドメインとエイリアスされているローカルストレージ領域を使ったデータ転送では、キャッシュが禁じられる。このようなアクセスは、ローカルストレージドメインにおいて、SPUのローカルストレージへのアクセス(たとえば、SPUのロード、ストア、命令フェッチ)と一貫性を保てないからである。ローカルストレージ領域をメインストレージドメインの実アドレス空間とエイリアスさせることにより、メインストレージ領域へアクセスする他のプロセッサやデバイスは、ローカルストレージに直接アクセスすることができる。しかし、エイリアスされたローカルストレージは、キャッシュ禁止にて処理されなければならないので、PPEのロード命令やストア命令による大量のデータ転送ではパフォーマンスが悪くなる。ローカルストレージドメインとメインストレージドメインの間におけるデータ転送では、ストール(stall)を避けるためにMFC・DMA・コマンドを使用する。
CBEAにおけるメインストレージへのアドレッシングは、パワーPC・アーキテクチャにおいて定義されているアドレッシングと互換性がある。CBEAは、パワーPCアーキテクチャのコンセプトを基礎としつつも、MFCによるメインストレージへのアドレッシングにまで拡張されている。
SPUやその他のプロセッサ、デバイス上において実行されるアプリケーションプログラムは、メインメモリにアクセスするために有効アドレスを使う。有効アドレスは、PPEがロード、ストア、分岐、キャッシュ命令を実行したり、後続命令をフェッチするときに計算される。SPUのプログラムは、MFCコマンドのパラメータとして有効アドレスを示さねばならない。「PowerPC Architecture,Book3」の「overview of address translation」に記載されている処理方法により、有効アドレスから実アドレスへの変換がなされる。実アドレスとは、変換された有効アドレスによって参照されるメインストレージ上における位置である。メインストレージは、システム内の全てのPPE、MFC、I/Oデバイスによって共有される。このレベルのストレージに保持される情報の全ては、システム内の全プロセッサ、全デバイスから見ることができる。このストレージ領域は、構造的にはフラットであってもよいし、階層的なキャッシュ構造を備えてもよい。プログラムは、有効アドレスによってこのレベルのストレージを参照する。
システムのメインメモリは、通常、システムコンフィギュレーション(system configuration)、データ転送同期、メモリマップドI/O、I/Oサブシステムといった処理用の特殊ハードウェアレジスタやアレーと、汎用の不揮発性記憶媒体も含む。メインメモリには、さまざまな設定をすることができる。制約的な意味ではない設例として、表1は、CBEAとして知られる実装のCELLプロセッサについて、メインメモリにおけるアドレス空間のサイズを示す。
Figure 0004719655
CELLプロセッサ100は、プロセッサとシステム内においてクリティカル・リソース(critical resource)の管理機能を持ってもよい。CELLプロセッサの管理対象となるリソースは、TLB(translation lookaside buffers)とデータ、命令キャッシュである。これらのリソースは実装依存のテーブルによって制御される。
TLBやキャッシュを管理するためのテーブルはRMTとして参照され、各MMUと対応づけられる。このようなテーブルはオプショナルなものであるが、システムのボトルネックとなりうるクリティカル・リソース用のテーブルは有用であることが多い。SPEグループは、DMA転送のためのファーストレベルキャッシュとなるSL1キャッシュをキャッシュ階層に含んでもよい。SL1キャッシュも、RMTを持ってもよい。
CELLプロセッサの実装技術について更に詳述する。以下の内容は、本発明の実施例に関連したデータ構造と処理方法について説明するものである。以下の実施例は上記したアーキテクチャを持つCELLプロセッサについての実装を制約するものではない。とはいえ、以下の実施例は、多かれ少なかれ、拡張SPUレットが直面し利用され得る環境としてのCELLアーキテクチャによる実装を示す。
図2は、拡張SPUレットと共に動作するCELLプロセッサ200の一例を示す。例として、このCELLプロセッサは、メインメモリ202と、単一のPPE204、8つのSPE206を備えている。ただし、CELLプロセッサには任意の数のSPEを設置できる。図2において、リング型のエレメント相互接続バス210により、メモリ、PPE、SPEは、互いに、また、I/Oデバイス208とも通信可能である。拡張SPUレット212は、メインメモリ202に格納され、他のCELLプロセッサに、たとえば、I/Oデバイス208やネットワーク214を介して伝送されたり、CELLプロセッサを構成するさまざまなSPE206に断片としてロードされる。
上記したように、拡張SPUレット102、212は、通常、1以上のSPUイメージと非初期化データなどの追加的なデータ、あるいは、2以上のSPUイメージを含む。図3は、拡張SPUレット300を構成するデータの配置を示す。このデータには、これに限るものではないが、SPUイメージ302、共有初期化データ(share initialized data)304、非初期化データ(uninitialized data)306の関連情報、メッセージボックス308、が含まれる。拡張SPUレット300は、ファイルヘッダ310を含むこともある。
SPUイメージ302は、通常、CELLプロセッサにおけるSPEのローカル保持データを含む。SPUイメージは、CELLプロセッサの処理中に各SPEから集められる。SPUイメージには、SPUによって処理されたデータ、SPUによって処理されるべきデータ、SPUがデータを処理するためのコード、が含まれる。SPUイメージ302には、拡張SPUレット300が一時停止されてたときの、MFCのDMA状態(DMA state)とSPEのハードウェア状態(hardware state)に関するデータも含まれてもよい。初期化データ304は、設定に応じて、メインメモリに保持され、および/または、それぞれが特定の処理を実行している複数のSPE間で共有される設定値を持つデータである。反対に、非初期化データは、所定の設定値ではなく、既知データに関連するパラメータを持つ。たとえば、非初期化データ306の関連情報は、データ型、データのために必要なメモリ空間のサイズや位置を示す。メッセージボックス308は、SPUやPPUが入出力データストリームにアクセスするためのメモリのウィンドウ(窓)である。ホスト・オペレーティングシステムは、メッセージボックス308を通して、(通信ソケットなどの)システムサービスを提供できる。拡張SPUレット300も、インタフェースとしてメッセージボックス308を使うことにより、クライアントの環境に対して情報を返送してもよい。
メッセージボックス領域308は、PPUと拡張SPUレット300の間の通信に使われる。メッセージボックスは、複数のメッセージボックスに分割されてもよい。各ボックスは、拡張SPUレットからPPE、PPEからSPEのような単方向通信のために使うこともできる。メッセージボックス308は、ハンドシェイキングのために読み手側および書き手側によって管理領域と共に更新されるシングル・バッファやリング・バッファとして設計することもできる。メッセージボックス領域308内の情報のフォーマットはアプリケーション次第であるが、事前設定されたなんらかの規約は存在しうる。そのような事前設定規約は、ファイルヘッダ310に示される。
制約的な意味ではない設例として、ファイルヘッダ310は、ホストの設定規約により、拡張SPUレットがクライアントと通信するためにメッセージボックス308を使うように指定できる。あるいは、ファイルヘッダ310は、SPEがPPUに対してシステムサービスを依頼するためにメッセージボックス308を使うよう指定してもよい。そのようなシステムサービスの例としては、追加メモリの要求、新しいネットワークの接続開始などが挙げられる。更に、ファイルヘッダ310は、PPUが拡張SPUレット300の一時停止要求をメッセージボックス308を介して行うよう指定してもよい。
拡張SPUレットの内容が、コンテキストに依存する点は重要である。たとえば、ある拡張SPUレットがメインメモリにセーブされたとき、システムメモリにおけるその拡張SPUレット300のイメージは、SPUイメージ302、共有初期化データ304、非初期化データ306の関連情報およびメッセージボックス308を含む。これらのデータの組み合わせは、システムメモリにて拡張SPUレットのイメージとして参照される。しかし、拡張SPUレット300が、ネットワークを介して、クライアントデバイスから別のCELLプロセッサ(以下、「ホストプロセッサ」とよぶ)に転送されるときには、SPUイメージ302と初期化データ304にファイルヘッダ310が結合される。このようなデータの組み合わせ(以下、「ファイルイメージ」とよぶ)が転送対象となる。
ファイルヘッダ310は、ホストCELLプロセッサへの伝達用としての、拡張SPUレットについての情報を持つ。ヘッダ情報は、実行情報と拡張SPUレット情報に分類される。実行情報は、ホストリソース(host resources)、通信仕様、SPUレットの実行環境に関するその他の基準を示してもよい。拡張SPUレット情報は、メモリのレイアウト、マッピング、スタートオフセットやその他の初期化情報、メッセージボックスの設定などを示す。
そのような情報には、たとえば、メモリ可用性(その拡張SPUレットを実行するためにどのくらいのメモリが必要か)、SPU可用性(その拡張SPUレットを実行するためには何個のSPUが必要か)、拡張SPUレットのために必要なネットワーク待ち時間(network latency)、通信帯域およびシステム周波数、コントロールフロー情報(ホストマシンやクライアントマシンは、その拡張SPUレットに割り込んだり停止させたりする権限があるのか)、メモリオフセット、1以上のSPUイメージのブレークポイント(breakpoints)、1以上のSPUイメージのサイズ、メモリマッピング情報、メッセージボックスのレイアウト、メッセージボックスの容量などが含まれてもよい。ヘッダーは、システムや動作がそれに基づいて確立されるべき、ユーザ、ID、システム、関数、データ型、チャネル、フラグ、キー、パスワード、プロトコル、ターゲット、プロファイルなどに関する数値を定義してもよい。このような情報は、拡張SPUレットに関連するものであったり、拡張SPUレットにより指定されるものであってもよい。これに限る意図ではないが、拡張SPUレットがその一部となるアプリケーションの全体的な目的を達成するための、プログラム、システム、モジュール、オブジェクトの動作の設定、初期化、変更、同期に関する情報を含んでもよい。このようなアプリケーションは、アプリケーション、プロトコル、アプリケーションの符号化・復号・トランスコーディング(trancecording)、トランザクションに関するセキュリティ情報を含んでもよい。ファイルヘッダ310は、転送前にPPEによって生成され、SPUイメージおよび初期化データと共に転送される。一方、ファイルヘッダ310は、ファイルイメージの一部となり、スタック転送の一部として送出される。
一般的には、SPUは、特権的SPU制御にはアクセスできない。結果として、拡張SPUレット300が各SPEに適切なコードをロードし、コードがロード後にスタート可能となる必要がある。更に、拡張SPUレット300は、お互いのコミュニケーションのためには、メインメモリの共有部分やお互いに対してSPEをマップするためのメモリマップ情報を含むのが好ましい。
図4は、拡張SPUレットによりネットワーク上で2以上のCELLプロセッサを制御するための通常の方法400を示している。ステップ402において、拡張SPUレットは、クライアントデバイスからホストデバイスにファイルイメージのかたちで転送される。ホストおよびクライアントCELLプロセッサ間のファイルイメージの転送は、ネットワークやバス上で発生する。ここでいうネットワークは、これに限る意図ではないが、セキュアな、あるいは、セキュアでないネットワーク、たとえば、ローカルエリアネットワーク(LAN:Local Area Network)、ワイドエリアネットワーク(WAN:Wide Area Network)、あるいは、インターネットのような公的ネットワークであってもよい。たとえば、クライアントマシンは、SPUレットの残り部分を送る前に、ホストマシンに対してファイルヘッダ310を先に送ってもよい。ホストマシンは、受け入れ基準に対するファイルヘッダの情報を分析できる。たとえば、SPUレットの対象ホストマシンや他のデバイスは、充分なSPU、セキュリティ・クリアランス、権限、設定、メモリなど、拡張SPUレットを実行可能であるか判定する。ホストマシンは、拡張SPUレットを受け入れ可能か判定したり、あるいは、別のデバイスやターゲットマシンに、拡張SPUレットを転送したりできる。
ホストマシンが拡張SPUレットを受け取ると、ステップ404において、ホストマシンは拡張SPUレットのためにシステムメモリを割り当てる。ホストマシンは、ファイルヘッダの情報により、SPUイメージ302や共有初期化データ304のためにメモリのブロックのサイズやデータ型を確保する。いったんメモリ空間が確保されると、ステップ406において、ホストプロセッサは、拡張SPUレット300のSPUイメージ302と共有初期化データ304をホストCELLプロセッサのメインメモリにロードする。ホストCELLプロセッサは、(もしあれば)非初期化データやメッセージボックスのための領域も確保する。PPUのメインメモリに領域確保することが好ましい。しかし、SPUレット・アプリケーションは、そのSPUレット・アプリケーションによっては、PPUのメモリ、および/または、1以上のSPUのローカル保持領域に設定するかもしれない。通常、ビデオ・トランスコーディング(video transcoding)のような複雑な処理に対応する拡張リーチメモリ(extended reach memory)を充足するようにメインメモリに確保される。図5Aと図5Bは、ホストデバイスのCELLプロセッサ(ホストCELLプロセッサ)における拡張SPUレットのデータ構造を示す。図5Aに示すように、ホストプロセッサは、SPUイメージ302と初期化データ304、ファイルヘッダ310を含むファイルイメージを受け取る。通常、SPUイメージ302と初期化データ304だけが、ホストCELLプロセッサのメインメモリに格納される。これらは、拡張SPUレット300の「足跡(フットプリント:footprint)」をメインメモリに形成する。ヘッダ310のデータは、ホストプロセッサがそれを使い終わると破棄される。
ステップ408において、ホストCELLプロセッサは、非初期化データ506とメッセージボックス508のために、メインメモリに領域を割り当てる。図5Aに示すように、SPUイメージ302、初期化データ304、非初期化データ506とメッセージボックス508の割り当て領域は、ホストCELLプロセッサのメインメモリ内に拡張SPUレット300のイメージを形成する。ステップ410において、ホストプロセッサは、拡張SPUレット300のために(図5Bに示すように)SPE510を割り当てる。SPE510が割り当てられると、ステップ412においてSPUイメージ302が割当先のSPE510にロードされる。それから、SPEは、ステップ414においてホストCELLプロセッサ上にて実行可能となる。
図6は、ネットワークを介したCELLプロセッサ間における拡張SPUレットの移動方法の例を追加的に示す。SPUレットは、どんなクライアントでも作ることができる。図6は、クライアントCELLプロセッサ601によって生成されたSPUレットを対象とした例を示している。この例では、クライアントCELLプロセッサは、自己のSPE602、603の2つを使って処理を実行する。命令やデータは、ステップ606、608にて示すように、メインメモリ604からSPU1とSPU2にロードされる。ステップ610において、SPU1とSPU2は実行される。クライアントCELLプロセッサのPPE612は、ステップ614においてSPU1とSPU2に割り込んで、停止させる必要があるかを判定する。割り込み理由はさまざまである。たとえば、PPEが、もっと優先度の高い仕事を実行するためにSPE602や603が必要であると判断する場合がある。処理は、他の位置よりもキリのいい位置まで進められる。たとえば、処理は、ホストデバイスに転送すべき大量のデータを生成しようとする地点まで実行される。ネットワークの帯域幅によっては、部分的に完了した処理をホストでバイスに転送し、そのデバイスにデータを生成させる方が効率的な場合もある。
SPU1とSPU2が停止した後、SPU1とSPU2がローカルに保持するコンテンツは、ステップ616と618において、SPUイメージ620、622としてメインメモリ604に保存(save)される。ステップ624において、PPE612は、SPUイメージ620、622および初期化データ626を含む、SPUレットのファイルイメージを生成する。初期化データは、SPE602、603、PPE612によってシステムメモリ内に生成される。SPUイメージ620、622と初期化データ626に、上述したファイルヘッダと結びつけることによりファイルイメージが生成される。ステップ628において、ファイルイメージは、ネットワーク630を超えて、ホストCELLプロセッサ631に送出される。ファイルヘッダに示される受け入れ基準が充足されたと仮定すると、SPUイメージ620、622、初期化データ626は、ホストCELLプロセッサのメインメモリ634にロードされる。ここから、ステップ636とステップ638において、SPUイメージ620、622は、ホストCELLプロセッサ631のSPE632、633にロードされ、ステップ640とステップ642において実行される。SPE632、633は、通常のCELL処理アプリケーションとして完了するまで実行継続する。完了すると、拡張SPUレットは、ステータスをクライアントCELLプロセッサ601に返送し、(必須ではないが)ホストCELLプロセッサ631に完了通知を行う。ホストCELLプロセッサ631上で実行されるオペレーティングシステム(OS)は、そのときに、メインメモリ634における拡張SPUレットのイメージとその関連データを(上書きなどによって)破棄できるようになる。
ステップ646において、ホストCELLプロセッサは、たとえば、より高優先度の仕事を実行させるために、SPE632、633のSPUの処理に割り込むこともできる。SPUの動作が停止すると、上述したようにSPUイメージはメインメモリにセーブされる。SPUイメージは、ステップ650において初期化データ648やコードなどとバンドルされてファイルイメージとなる。一方、PPE646は、SPEが使えるようになるまで待機する(ステップ652)。SPUは、それから、ステップ654と656において、SPUの動作を再開させることができる。あるいは、ステップ658において、ファイルイメージをネットワーク630を介して別のホスト660や元のクライアントCELLプロセッサ601に出力することもできる。
先の例では、SPUイメージ620、622は、ステップ616、618においてクライアントCELLプロセッサ601によってセーブされた。同様に、ステップ650におけるファイルイメージ生成処理は、ホストCELLプロセッサ631においてSPUイメージをセーブする処理を含んでもよい。拡張SPUレットの伝送を実現するためには、サスペンド機能やレジューム機能があることが望ましい。好ましくは、サスペンド(一時停止)では、協調的に実行権限を明け渡すのがよい。たとえば、ホストOSは、拡張SPUレットにサスペンドを通知する。それから、SPUレットは、すべてのDMAやSPEの実行を停止させ、段階的に、実行を譲渡し、ホストOSに通知する。ホストOSは、拡張SPUレットの実行状態をセーブする。
図7は、クライアントまたはホストCELLプロセッサが拡張SPUレットの実行状態をセーブする処理700のフローチャートである。説明のため、同図では、あるCELLプロセッサにおけるPPE701と1つのSPE702の動作を示す。当業者であれば、同様の処理を複数のSPUイメージのセーブにまで拡張できることは理解されるところであろう。
PPU701は、SPE702で実行中のどんな処理でも止める。たとえば、PPUは、ステップ703においてSPEのPU内のストップレジスタに書き込みを行う。これにより、ステップ704において、SPE702のSPUのコア(core)はストップする。更に、SPE702のMFCにおけるDMA動作を止める必要があるかもしれない。ステップ705において、PPE701はSPE702のMFCのDMA・STOP・レジスタに書き込みを行い、ステップ706にてDMAを停止させることができる。DMAが停止すると、ステップ707において、PPE701はSPE702のDMA状態を取得できる。ステップ706においてSPUの実行が停止するときに、DMA動作状態関連情報をDMAレジスタから読み出すことにより実現可能である。このような情報は、SPE702のために、拡張SPUレットの一部としてメインメモリに保持される。
ステップ709において、PPUはSPE702のローカル状態、たとえば、SPE702のローカルストレージ(LS)の内容を取得する。このような動作は、SPUレジスタに書き込みを行い、MFCを介してLSの内容を読み出すことにより実行される。通常、LSはコードとデータの両方を含み、それらは、拡張SPUレットの一部として、たとえば、SPUイメージとしてメインメモリにセーブされる。
しばしば、SPUのハードウェア状態、たとえば、拡張SPUレットの一部としてレジスタやチャネルの値をセーブしておくことは好ましい。SPUイメージの一部としてこのようなデータをセーブするためには、PPEはステップ711においてSPE702にSPU・SAVEというコードを送出しなければならない。この処理は、レジスタへの書き込みとコード転送のためのDMA書き込みを含む。PPUは、ステップ713においてSPUのプログラムカウンタをセットし、ステップ715においてSPUにSPU・SAVEコードを実行させるために、たとえば、SPUの実行レジスタへの書き込みによりシグナル通知する。SPUは、ステップ708にてSPU・SAVEコードを実行開始し、ステップ710においてハードウェア状態を示すレジスタやチャネルを読み出し、ステップ712において、拡張SPUレットの一部としてメインメモリに対してハードウェア状態情報を送出する。
SPUイメージやその他の情報をセーブする処理は、SPUの動作をサスペンドする処理の一部である。図8は、拡張SPUレットとしてセーブされるサスペンド情報800を示す。この例では、単一のCELLシステム上で実行されるタスクがサスペンドし、他のホストに転送可能な拡張SPUレットに変化するとして説明する。情報800は、SPUイメージ802、初期化データのような共有情報804、追加コード、非初期化データ806の関連情報、上記したメッセージボックス808を含む。先述した情報は、システムメモリイメージ801を形成する。SPUイメージ802と共有情報804は、ファイルヘッダ810と結合され、ファイルイメージ803を形成する。更に、情報800は、ランタイムのLS状態805に対応するSPUイメージ812を含む。
ファイルイメージ803におけるSPUイメージ802は、SPUレットが実行開始するときにロードされるものである。SPUイメージ802は、ローカルストレージのサイズ一杯となってはならない。これらは、システムメモリから自力で追加コードをロードできる。サスペンドされたSPUイメージ812は、ローカルストレージ状態のスナップショットであり、ローカルストレージのサイズいっぱいとなるべきものであり、サスペンド地点に至るまでに完了したデータやコードのロードやアンロードを反映する。
情報800は、更に、SPEプロセッサの実行状態814(たとえば、上記したようなハードウェア状態やDMAの状態)を含む。制約的な意味ではない設例として、プロセッサの実行状態814は、レジスタ、チャネル状態、MFC状態、命令ポインタ、デクリメンタ(decrementer)、浮動小数点例外状態などを含む。拡張SPUレットは、スタート時においてはそのような情報を必要としないため、実行状態814は分離される。拡張SPUレットは、コンテキスト情報を要求せずにフレッシュな状態でスタートするように想定されている。反対に、SPUレットをサスペンドするには、レジューム実行のために全てのハードウェアコンテキスト情報をセーブしなければならない。
加えて、情報800は、接続情報のような管理情報816を含む。最低限、ホストは、IPアドレスのようなクライアントに関する情報を保持する必要がある。実行を再開し、クライアントとの接続を再確立するために必要な情報は、拡張SPUレットの転送先のホストに渡されなければならない。ここで含まれるものは、転送に関するオーセンティケーション・モデル(authentication model)に基づいている。
下記に限定するものではないが、コンパイル時に転送可能なSPUレットとなるように設定される必要がある。ここでいう転送とは、ある実行環境から別の実行環境にプログラムを移動させることなので、システム上におけるあらゆるものからのプログラムの独立性が高い必要がある。本実施例において、CELLベースの分散ネットワークは、全て、拡張SPUレットと共に開始可能な実行形式のプログラムを持つ。もし、拡張SPUレットがローカルに実行を開始するなら、他のホストへの転送にはコンテキストのセーブだけが必要である。SPEプログラムの任意の動作セットから動的に拡張SPUレットを生成することは必須ではない。
図6の関連説明は、ステップ654とステップ656においてサスペンドされているSPUレットのレジュームについても言及している。一般性を毀損する意味ではない設例として、図9は、拡張SPUレットの実行停止を再開させる処理900のフローチャートを示す。ステップ902において、SPEやメインメモリ、メッセージボックスなどのシステムリソースが拡張SPUレットの実行のために再割り当てされる。ステップ904では、メインメモリの一部におけるセーブされた情報、たとえば、SPUのローカルに保持されているランタイムイメージがSPEにロードされる。ステップ906では、SPEの実行状態が再保持され、ステップ908ではSPEの実行が再開される。
一般性を毀損する意味ではない設例として、図10は、CELLプロセッサ1001のSPE1002が一時停止後に再開する処理の詳細を示すフローチャートである。図10に示すプロセスは、複数のSPUの一時停止後に再開する処理にまで拡張可能であることは当業者には理解されるところである。この例では、CELLプロセッサ1001のメインメモリ1004には、たとえば、SPUハードウェア状態1008、SPUローカルストレージイメージ1010、DMA状態1012を含むファイルイメージなどのSPUレット1006がロードされる。拡張SPUレット1006は、CELLプロセッサ1001上で実行される処理の割り込みやサスペンドの結果として保持されたり、別のCELLプロセッサから導入されたりする。いずれにしても、この例示目的のため、SPE1002がステップ1014にて停止すると仮定する。
CELLプロセッサ1001のPPU1016は、ハードウェア状態ローダープログラム(hardware state loader program)1018をSPE1002に送出する。この処理には、SPE1002のLSへのDMA書き込みと、SPE1002のSPUへのレジスタ書き込みが含まれ、これにより、ステップ1020において、ハードウェア状態ローダプログラムを実行させる。ステップ1022において、ハードウェア状態ローダープログラム1020により、SPE1002は、メインメモリ1004に格納されている拡張SPUレット1006からSPUハードウェア状態1008をロードし、STOP・SIGNAL命令を実行する。この命令により、SPUのプログラムは停止し、(PPU1016などの)外部環境に対してシグナルが発せされる。更なる命令は実行されない。ステップ1024において、PPU1016は、メインメモリ1004からSPE1002のローカル記憶領域にSPUローカルストレージイメージ1010をロードする。ステップ1026において、PPU1016は、メインメモリ1004からSPEのローカル記憶領域に、たとえば、適切なレジスタへの書き込みにより、DMA状態1012をロードする。
PPU1016は、ステップ1028において、DMA動作を開始するためにSPEのMFCにDMA・スタートコマンドを送出する。この処理には、MFCのスタートレジスタへの書き込み処理が含まれてもよい。DMAは、ステップ1030にて実行開始する。ステップ1032においてプログラムカウンタがセットされる。PPU1016は、ステップ1034において、たとえば、SPU実行レジスタへの書き込みにより、SPU実行コマンドを送出する。SPUは、それから、ステップ1036にて、たとえば、動作が一時停止されていた地点から実行開始する。
拡張SPUレットをロードし、ハードウェア状態を設定し、DMA状態をロードするステップは、本質的には、図10に関連して説明したとおりである。ハードウェア状態とDMA状態をロードするシーケンスは省略されてもよい。初期ロードでは、通常、DMAやハードウェアの状態の復元がなされる。
以上は、本発明の最適な実施例の完全な記述であるが、さまざまな変更、変形、等価物への置き換えが可能である。それゆえ、本発明の範囲は、上記記述に関してではなく、請求項により定義されるべきであり、完全な等価物の範囲も含まれる。記述された特徴は、それが好ましいものであれ、そうでないものであれ、上記したさまざまな特徴と組み合わされてもよい。請求項においては、通常、特に断らない限りは、各要素は1またはそれ以上の数量を想定している。請求項の記載事項は、「〜手段」のような記載によって、明示される場合のほかは、いわゆるミーンズ・プラス・ファンクション特有の限定的意味で解してはならない。
本実施例において、拡張SPUレットを実装するCELLブロードバンドエンジンアーキテクチャの模式図である。 本実施例におけるCELLプロセッサの模式図である。 本実施例における拡張SPUレットのブロック図である。 本実施例における拡張SPUレットの実行過程を示すフローチャートである。 実行ステージにおける拡張SPUレットのメモリアロケーションを示すブロック図である。 別の実行ステージにおける拡張SPUレットのメモリアロケーションを示すブロック図である。 本実施例において、CELLプロセッサの拡張SPUレットによるネットワークオペレーションのフローチャートである。 SPU状態のセーブ処理の例を示すフローチャートである。 本実施例において、サスペンド中のSPUレットのためにセーブされているサスペンド状態情報のメモリ構造を示すブロック図である。 サスペンド中の拡張SPUレットの動作を再開するときのフローチャートの一例である。 SPEを一時停止から再開させる処理過程を示すフローチャートである。

Claims (56)

  1. 2以上のプロセッサをネットワーク上で動作させるための方法であって、
    各プロセッサは、
    第1プロセッサと、
    メインメモリと、
    1以上の第2プロセッサと、
    を備えており、
    各第2プロセッサは、
    専用に対応づけられた専用ローカルメモリと、
    MFC(Memory Flow Controller)と、
    を備えており、
    ネットワークを介して、クライアントデバイスのプロセッサであるクライアントプロセッサが、そのクライアントプロセッサから、ホストデバイスのプロセッサであるホストプロセッサに対してファイルイメージを転送するステップを含み、
    前記ファイルイメージは、一の第2プロセッサの専用ローカルメモリのコンテンツと共有初期化データ、または、2以上の第2プロセッサの専用ローカルメモリのコンテンツを含み、
    前記共有初期化データは、それぞれが特定の処理を実行している複数の第2プロセッサ間で共有される設定値を持つデータであることを特徴とする方法。
  2. 前記ホストプロセッサが、ホストプロセッサのメインメモリであるホストメインメモリに、一の第2プロセッサの専用ローカルメモリのコンテンツと共有初期化データのための領域を確保するステップ、を更に含むことを特徴とする請求項1に記載の方法。
  3. 前記ホストプロセッサが、ホストメインメモリに確保された領域に一の第2プロセッサの専用ローカルメモリのコンテンツと共有初期化データをロードするステップ、を更に含むことを特徴とする請求項2に記載の方法。
  4. 前記ホストプロセッサが、ホストプロセッサのメインメモリであるホストメインメモリに、非初期化データとメッセージボックスのための領域を確保するステップ、を更に含むことを特徴とする請求項1に記載の方法。
  5. 前記ホストプロセッサが、ホストプロセッサの第2プロセッサにファイルイメージのデータをロードするステップ、を更に含むことを特徴とする請求項1に記載の方法。
  6. ファイルイメージのデータをロードするステップは、前記ホストプロセッサが、ファイルイメージをホストプロセッサにおける第2プロセッサのローカルメモリにロードするステップ、を含むことを特徴とする請求項5に記載の方法。
  7. 前記ホストプロセッサが、ホストプロセッサの第2プロセッサにおいて、ファイルイメージのデータから読み出した処理(process)を実行するステップ、を更に含むことを特徴とする請求項5に記載の方法。
  8. 前記ホストプロセッサが、ホストプロセッサの第2プロセッサにおいて、処理の実行を一時停止するステップ、を更に含むことを特徴とする請求項5に記載の方法。
  9. 処理の実行を一時停止するステップは、前記ホストプロセッサが、全てのDMAと第2プロセッサの処理実行を停止させるステップ、を含むことを特徴とする請求項8に記載の方法。
  10. 処理の実行を一時停止するプロセスは、前記ホストプロセッサが、処理が実行されている1以上の第2プロセッサの実行状態を保存するステップ、を含むことを特徴とする請求項8に記載の方法。
  11. 実行状態とは、2つ以上の第2プロセッサの専用ローカルメモリのコンテンツを含む実行時にローカルに保持される状態(runtime local store state)と、プロセッサの実行状態情報(processor execution state information)を含む第2プロセッサ状態と、を含む情報であることを特徴とする請求項10に記載の方法。
  12. 前記ホストプロセッサが、実行状態を異なるホストに転送するステップ、を更に含むことを特徴とする請求項10に記載の方法。
  13. 実行状態を異なるホストに転送するステップは、前記ホストプロセッサが、ネットワークを介して実行状態を異なるホストに転送するステップ、を含むことを特徴とする請求項12に記載の方法。
  14. 前記ホストプロセッサが、実行状態をホストからクライアントに返送するステップ、を更に含むことを特徴とする請求項10に記載の方法。
  15. 前記ホストプロセッサが、ホストプロセッサの1以上の第2プロセッサにおいて、処理の実行を再開させるステップ、を更に含むことを特徴とする請求項10に記載の方法。
  16. 処理の実行を再開させるステップは、前記ホストプロセッサが、処理に対して資源(resource)を再割り当てするステップ、を含むことを特徴とする請求項15に記載の方法。
  17. 処理の実行を再開させるステップは、前記ホストプロセッサが、ファイルイメージの一部をシステムメモリにロードするステップ、を含むことを特徴とする請求項15に記載の方法。
  18. 処理の実行を再開させるステップは、前記ホストプロセッサが、第2プロセッサの実行状態を復元するステップ、を含むことを特徴とする請求項15に記載の方法。
  19. 処理を再開するステップは、前記ホストプロセッサが、ホストプロセッサにおける1以上の第2プロセッサのレジスタに、保存された実行状態から得られるハードウェア状態のデータを格納するステップ、を含むことを特徴とする請求項15に記載の方法。
  20. 1以上のレジスタに格納するステップは、前記ホストプロセッサが、ハードウエア状態ローダープログラムをホストプロセッサの第2プロセッサにロードするステップ、を含むことを特徴とする請求項19に記載の方法。
  21. 1以上のレジスタに格納するステップは、前記ホストプロセッサが、ハードウエア状態ローダープログラムをホストプロセッサの第2プロセッサにて実行するステップ、を含むことを特徴とする請求項20に記載の方法。
  22. 処理の実行を再開させるステップは、前記ホストプロセッサが、ファイルイメージから得られた第2プロセッサの専用ローカルメモリのコンテンツをホストプロセッサにおける第2プロセッサのローカルな保持領域にロードするステップ、を含むことを特徴とする請求項15に記載の方法。
  23. 処理の実行を再開させるステップは、前記ホストプロセッサが、ホストプロセッサにおける第2プロセッサの1以上のレジスタに、第2プロセッサのファイルイメージから得られたDMA(Direct Memory Access)状態を格納するステップ、を含むことを特徴とする請求項15に記載の方法。
  24. ファイルイメージを転送する前に、
    前記クライアントプロセッサが、クライアントプロセッサにおいて処理を実行するステップと、
    前記クライアントプロセッサが、前記処理を停止させるステップと、
    前記クライアントプロセッサが、クライアントプロセッサにおいて前記処理を実行している第2プロセッサの状態を保存するステップと、
    を更に含み、
    ファイルイメージは、その保存された状態を反映したデータであることを特徴とする請求項1に記載の方法。
  25. 状態を保存するステップは、前記クライアントプロセッサが、処理を実行している第2プロセッサのコア(core)を停止させるステップ、を含むことを特徴とする請求項24に記載の方法。
  26. 状態を保存するステップは、コアを停止させたあと、前記クライアントプロセッサが、処理を実行する第2プロセッサのMFCを停止させるステップ、を含むことを特徴とする請求項25に記載の方法。
  27. 状態を保存するステップは、更に、前記クライアントプロセッサが、1以上のレジスタからMFCの状態を取得するステップ、を含むことを特徴とする請求項25に記載の方法。
  28. 状態を保存するステップは、更に、前記クライアントプロセッサが、MFCからローカル状態を取得するステップ、を含むことを特徴とする請求項25に記載の方法。
  29. 状態を保存するステップは、更に、前記クライアントプロセッサが、SAVEコードを第2プロセッサに送信し、そのコードを前記第2プロセッサにて実行させるステップ、を含むことを特徴とする請求項24に記載の方法。
  30. 第2プロセッサにてコードを実行させるステップは、前記クライアントプロセッサが、第2プロセッサのハードウェア状態を読み出すステップ、を含むことを特徴とする請求項29に記載の方法。
  31. ハードウェア状態を読み出すステップは、前記クライアントプロセッサが、第2プロセッサの1以上のレジスタを読み出すステップ、を含むことを特徴とする請求項30に記載の方法。
  32. ハードウェア状態を読み出すステップは、前記クライアントプロセッサが、第2プロセッサの1以上のチャネルを読み出すステップ、を含むことを特徴とする請求項30に記載の方法。
  33. ホストプロセッサが、ホストプロセッサにおける第2プロセッサにて処理を再開させるステップ、を更に含むことを特徴とする請求項24に記載の方法。
  34. 処理を再開させるステップは、ホストプロセッサが、ホストプロセッサにおける第2プロセッサの1以上のレジスタにファイルイメージから得られたハードウェア状態を格納するステップ、を含むことを特徴とする請求項33に記載の方法。
  35. 1以上のレジスタに格納するステップは、ホストプロセッサが、第2プロセッサのハードウェア状態ローダープログラムをホストプロセッサの第2プロセッサにロードするステップ、を含むことを特徴とする請求項34に記載の方法。
  36. 1以上のレジスタに格納するステップは、ホストプロセッサが、第2プロセッサのハードウェア状態ローダープログラムをホストプロセッサにおける第2プロセッサにて実行するステップ、を含むことを特徴とする請求項35に記載の方法。
  37. 処理の実行を再開させるステップは、ホストプロセッサが、ファイルイメージから得られる第2プロセッサの専用ローカルメモリのコンテンツを、ホストプロセッサにおける第2プロセッサのローカルな保持領域にロードするステップ、を含むことを特徴とする請求項33に記載の方法。
  38. 処理の実行を再開させるステップは、ホストプロセッサが、ホストプロセッサの第2プロセッサにおける1以上のレジスタに、第2プロセッサのファイルイメージから得られたDMA状態のデータを格納するステップ、を含むことを特徴とする請求項33に記載の方法。
  39. 前記クライアントプロセッサが、クライアントプロセッサからホストプロセッサにファイルヘッダを転送するステップ、を更に含むことを特徴とする請求項1に記載の方法。
  40. ホストプロセッサが、ホストプロセッサについて、ファイルヘッダの情報に基づいてファイルイメージを受け入れるか否かを判定するステップ、を更に含むことを特徴とする請求項39に記載の方法。
  41. ファイルヘッダは、
    メモリ可用性、第2プロセッサ可用性、ネットワークレイテンシ、ネットワーク帯域幅、システム周波数、コントロールフロー情報(control flow information)、メモリのオフセット、1以上の第2プロセッサの専用ローカルメモリのコンテンツのブレークポイント、1以上の第2プロセッサの専用ローカルメモリのコンテンツのサイズ、メモリレイアウト、メモリのマッピング情報、メッセージボックスのレイアウト、メッセージボックスの容量、ホストリソース、通信仕様(connection requirements)、ファイルイメージの実行環境に関するその他の基準のうち、1以上のタイプの情報を含むことを特徴とする請求項39に記載の方法。
  42. ファイルヘッダは、
    システムや操作がそれに基づいて確立されるべき、ユーザ、ID、システム、関数、データ型、チャネル、フラグ、キー、パスワード、プロトコル、ターゲット、プロファイルなどに関する数値であって、ファイルイメージに関連するものであったり、ファイルイメージにより指定される情報を定義することを特徴とする請求項39に記載の方法。
  43. ファイルヘッダは、
    ファイルイメージがその一部となるアプリケーションの全体的な目的を達成するための、プログラム、システム、モジュール、オブジェクトの動作の設定、初期化、変更、同期に関する情報を定義することを特徴とする請求項39に記載の方法。
  44. ファイルヘッダを転送するステップは、前記クライアントプロセッサが、ファイルイメージの転送に先立ってファイルヘッダを生成するステップ、を含むことを特徴とする請求項39に記載の方法。
  45. ファイルヘッダを転送するステップは、前記クライアントプロセッサが、ファイルヘッダをファイルイメージの一部として転送するステップ、を含むことを特徴とする請求項39に記載の方法。
  46. 第1プロセッサと、
    1以上の第2プロセッサと、
    第1プロセッサおよび第2プロセッサと接続されるメインメモリと、を備えるプロセッサシステムのためのファイルイメージを示すデータを保持する記録媒体であって、
    各第2プロセッサは、
    専用に対応づけられた専用ローカルメモリを備え、
    ファイルイメージは、一の第2プロセッサの専用ローカルメモリのコンテンツと共有初期化データ、または、2以上の第2プロセッサの専用ローカルメモリのコンテンツを含み、
    前記共有初期化データは、それぞれが特定の処理を実行している複数の第2プロセッサ間で共有される設定値を持つデータであることを特徴とするプロセッサにて読み取り可能な記録媒体。
  47. 前記ファイルイメージは、更に、ファイルヘッダを含むことを特徴とする請求項46に記載のプロセッサにて読み取り可能な記録媒体。
  48. ファイルヘッダは、
    メモリ可用性、第2プロセッサ可用性、ネットワークレイテンシ、ネットワーク帯域幅、システム周波数、コントロールフロー情報(control flow information)、メモリのオフセット、1以上の第2プロセッサの専用ローカルメモリのコンテンツのブレークポイント、1以上の第2プロセッサの専用ローカルメモリのコンテンツのサイズ、メモリレイアウト、メモリのマッピング情報、メッセージボックスのレイアウト、メッセージボックスの容量、ホストリソース、通信仕様(connection requirements)、ファイルイメージの実行環境に関するその他の基準のうち、1以上のタイプの情報を含むことを特徴とする請求項47に記載のプロセッサにて読み取り可能な記録媒体。
  49. ファイルヘッダは、
    システムや操作がそれに基づいて確立されるべき、ユーザ、ID、システム、関数、データ型、チャネル、フラグ、キー、パスワード、プロトコル、ターゲット、プロファイルなどに関する数値であって、ファイルイメージに関連するものであったり、ファイルイメージにより指定される情報を定義することを特徴とする請求項47に記載のプロセッサにて読み取り可能な記録媒体。
  50. ファイルヘッダは、
    ファイルイメージがその一部となるアプリケーションの全体的な目的を達成するための、プログラム、システム、モジュール、オブジェクトの動作の設定、初期化、変更、同期に関する情報を定義することを特徴とする請求項47に記載のプロセッサにて読み取り可能な記録媒体。
  51. 前記コントロールフロー情報は、ホストまたはクライアントのプロセッサがプロセスに割り込み可能か否かに関する情報を含むことを特徴とする請求項48に記載のプロセッサにて読み取り可能な記録媒体。
  52. 第1プロセッサと、
    1以上の第2プロセッサと、
    第1プロセッサおよび第2プロセッサと接続されるメインメモリと、を備えるプロセッサシステムであって、
    各第2プロセッサは、
    専用に対応づけられた専用ローカルメモリを備え、
    本プロセッサシステムは、ファイルイメージを示すデータをメインまたは専用ローカルメモリに保持し、
    前記ファイルイメージは、一の第2プロセッサの専用ローカルメモリのコンテンツと、異なるプロセッサシステムの一時停止された処理実行状態に関する共有初期化データ、または、前記処理実行状態に関連する2以上の第2プロセッサの専用ローカルメモリのコンテンツを含み、
    前記一のまたは2以上の第2プロセッサの専用ローカルメモリのコンテンツは、一時停止された処理を実行するための実行可能なコードを含み、
    前記共有初期化データは、それぞれが特定の処理を実行している複数の第2プロセッサ間で共有される設定値を持つデータであることを特徴とするプロセッサシステム。
  53. ファイルイメージは、更に、ファイルヘッダを含むことを特徴とする請求項52に記載のプロセッサシステム。
  54. ファイルヘッダは、
    メモリ可用性、第2プロセッサ可用性、ネットワークレイテンシ、ネットワーク帯域幅、システム周波数、コントロールフロー情報(control flow information)、メモリのオフセット、1以上の第2プロセッサの専用ローカルメモリのコンテンツのブレークポイント、1以上の第2プロセッサの専用ローカルメモリのコンテンツのサイズ、メモリレイアウト、メモリのマッピング情報、メッセージボックスのレイアウト、メッセージボックスの容量、ホストリソース、通信仕様(connection requirements)、ファイルイメージの実行環境に関するその他の基準のうち、1以上のタイプの情報を含むことを特徴とする請求項53に記載のプロセッサシステム。
  55. ファイルヘッダは、
    システムや操作がそれに基づいて確立されるべき、ユーザ、ID、システム、関数、データ型、チャネル、フラグ、キー、パスワード、プロトコル、ターゲット、プロファイルなどに関する数値であって、ファイルイメージに関連するものであったり、ファイルイメージにより指定される情報を定義することを特徴とする請求項53に記載のプロセッサシステム。
  56. ファイルヘッダは、
    ファイルイメージがその一部となるアプリケーションの全体的な目的を達成するための、プログラム、システム、モジュール、オブジェクトの動作の設定、初期化、変更、同期に関する情報を定義することを特徴とする請求項53に記載のプロセッサシステム。
JP2006262023A 2005-09-27 2006-09-27 ネットワーク上におけるプロセッサ制御技術 Expired - Fee Related JP4719655B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/238,086 US8316220B2 (en) 2005-09-27 2005-09-27 Operating processors over a network
US11/238,086 2005-09-27

Publications (2)

Publication Number Publication Date
JP2007095065A JP2007095065A (ja) 2007-04-12
JP4719655B2 true JP4719655B2 (ja) 2011-07-06

Family

ID=37654872

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006262023A Expired - Fee Related JP4719655B2 (ja) 2005-09-27 2006-09-27 ネットワーク上におけるプロセッサ制御技術

Country Status (4)

Country Link
US (2) US8316220B2 (ja)
EP (2) EP2284702A1 (ja)
JP (1) JP4719655B2 (ja)
CN (2) CN1972293A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017016285A (ja) * 2015-06-30 2017-01-19 キヤノン株式会社 複数のデータ処理部でバッファを共有するデータ制御装置、制御方法

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006027639A1 (en) * 2004-09-09 2006-03-16 Pirelli Tyre S.P.A. Method for allowing a control of a vehicle provided with at least two wheels in case of puncture of a tyre
US7522168B2 (en) * 2005-09-27 2009-04-21 Sony Computer Entertainment Inc. Cell processor task and data management
US7506123B1 (en) * 2005-09-27 2009-03-17 Sony Computer Entertainment Inc. Method and system for performing memory copy function on a cell processor
US7734827B2 (en) * 2005-09-27 2010-06-08 Sony Computer Entertainment, Inc. Operation of cell processors
US7472261B2 (en) * 2005-11-08 2008-12-30 International Business Machines Corporation Method for performing externally assisted calls in a heterogeneous processing complex
US8595747B2 (en) * 2005-12-29 2013-11-26 Sony Computer Entertainment Inc. Efficient task scheduling by assigning fixed registers to scheduler
US8238442B2 (en) 2006-08-25 2012-08-07 Sony Computer Entertainment Inc. Methods and apparatus for concealing corrupted blocks of video data
US8699561B2 (en) * 2006-08-25 2014-04-15 Sony Computer Entertainment Inc. System and methods for detecting and handling errors in a multi-threaded video data decoder
US7647483B2 (en) * 2007-02-20 2010-01-12 Sony Computer Entertainment Inc. Multi-threaded parallel processor methods and apparatus
GB0703974D0 (en) * 2007-03-01 2007-04-11 Sony Comp Entertainment Europe Entertainment device
US7934063B2 (en) * 2007-03-29 2011-04-26 International Business Machines Corporation Invoking externally assisted calls from an isolated environment
US8589943B2 (en) 2007-08-15 2013-11-19 Sony Computer Entertainment Inc. Multi-threaded processing with reduced context switching
CN101398803B (zh) * 2007-09-28 2011-04-06 国际商业机器公司 管理数据移动的方法和使用该方法的细胞宽带引擎处理器
EP2289001B1 (en) 2008-05-30 2018-07-25 Advanced Micro Devices, Inc. Local and global data share
US8261117B2 (en) * 2008-09-11 2012-09-04 International Business Machines Corporation Virtualization in a multi-core processor (MCP)
US7870309B2 (en) * 2008-12-23 2011-01-11 International Business Machines Corporation Multithreaded programmable direct memory access engine
US10922258B2 (en) * 2017-12-22 2021-02-16 Alibaba Group Holding Limited Centralized-distributed mixed organization of shared memory for neural network processing

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09179834A (ja) * 1995-12-25 1997-07-11 Hitachi Ltd 並列システムにおけるプロセスのスケジューリング方法
JP2002007364A (ja) * 2000-06-22 2002-01-11 Fujitsu Ltd 並列計算機システムのジョブスケジューリングを行うスケジューリング装置
JP2004246702A (ja) * 2003-02-14 2004-09-02 Toshiba Corp 計算機システム、計算機装置、計算機システムにおけるデータアクセス方法及びプログラム
JP2005235229A (ja) * 2004-02-20 2005-09-02 Sony Computer Entertainment Inc マルチプロセッサシステムにおけるプロセッサタスクの移動方法および装置

Family Cites Families (73)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3496551A (en) 1967-07-13 1970-02-17 Ibm Task selection in a multi-processor computing system
US3596257A (en) 1969-09-17 1971-07-27 Burroughs Corp Method and apparatus for allocating small memory spaces to a computer program
US4562538A (en) * 1983-05-16 1985-12-31 At&T Bell Laboratories Microprocessor having decision pointer to process restore position
US5003466A (en) * 1987-02-06 1991-03-26 At&T Bell Laboratories Multiprocessing method and arrangement
US5047923A (en) 1987-08-21 1991-09-10 Siemens Aktiengesellschaft Modularly structured digital communication system for interconnecting terminal equipment and public networks
US5016166A (en) * 1989-04-12 1991-05-14 Sun Microsystems, Inc. Method and apparatus for the synchronization of devices
US5185694A (en) 1989-06-26 1993-02-09 Motorola, Inc. Data processing system utilizes block move instruction for burst transferring blocks of data entries where width of data blocks varies
US5136712A (en) 1989-06-29 1992-08-04 Digital Equipment Corporation Temporary object handling system and method in an object based computer operating system
EP0416767A3 (en) 1989-09-08 1992-04-29 Digital Equipment Corporation Position independent code location system
US5452452A (en) 1990-06-11 1995-09-19 Cray Research, Inc. System having integrated dispatcher for self scheduling processors to execute multiple types of processes
US5930522A (en) * 1992-02-14 1999-07-27 Theseus Research, Inc. Invocation architecture for generally concurrent process resolution
US5428779A (en) * 1992-11-09 1995-06-27 Seiko Epson Corporation System and method for supporting context switching within a multiprocessor system having functional blocks that generate state programs with coded register load instructions
JP2809962B2 (ja) 1993-03-02 1998-10-15 株式会社東芝 資源管理方式
US5528513A (en) 1993-11-04 1996-06-18 Digital Equipment Corp. Scheduling and admission control policy for a continuous media server
US5745778A (en) 1994-01-26 1998-04-28 Data General Corporation Apparatus and method for improved CPU affinity in a multiprocessor system
US5884077A (en) * 1994-08-31 1999-03-16 Canon Kabushiki Kaisha Information processing system and method in which computer with high load borrows processor of computer with low load to execute process
US5794017A (en) 1995-02-06 1998-08-11 International Business Machines Corporation Method and system of updating graphics memory in a graphics display system through multiple address transferring of pixel data
JP3085899B2 (ja) * 1995-06-19 2000-09-11 株式会社東芝 マルチプロセッサシステム
US6728959B1 (en) 1995-08-08 2004-04-27 Novell, Inc. Method and apparatus for strong affinity multiprocessor scheduling
US5832262A (en) 1995-09-14 1998-11-03 Lockheed Martin Corporation Realtime hardware scheduler utilizing processor message passing and queue management cells
US6341324B1 (en) * 1995-10-06 2002-01-22 Lsi Logic Corporation Exception processing in superscalar microprocessor
US5978843A (en) 1995-12-06 1999-11-02 Industrial Technology Research Institute Scalable architecture for media-on-demand servers
WO1997035254A1 (en) 1996-03-19 1997-09-25 Massachusetts Institute Of Technology Computer system and computer implemented process for representing software system descriptions and for generating executable computer programs and computer system configurations from software system descriptions
US5826081A (en) 1996-05-06 1998-10-20 Sun Microsystems, Inc. Real time thread dispatcher for multiprocessor applications
US6144986A (en) 1997-03-27 2000-11-07 Cybersales, Inc. System for sorting in a multiprocessor environment
US6003112A (en) 1997-06-30 1999-12-14 Intel Corporation Memory controller and method for clearing or copying memory utilizing register files to store address information
US6378072B1 (en) * 1998-02-03 2002-04-23 Compaq Computer Corporation Cryptographic system
US6442663B1 (en) * 1998-06-19 2002-08-27 Board Of Supervisors Of Louisiana University And Agricultural And Mechanical College Data collection and restoration for homogeneous or heterogeneous process migration
US6295598B1 (en) 1998-06-30 2001-09-25 Src Computers, Inc. Split directory-based cache coherency technique for a multi-processor computer system
US6289369B1 (en) 1998-08-25 2001-09-11 International Business Machines Corporation Affinity, locality, and load balancing in scheduling user program-level threads for execution by a computer system
US6952827B1 (en) * 1998-11-13 2005-10-04 Cray Inc. User program and operating system interface in a multithreaded environment
JP3250729B2 (ja) * 1999-01-22 2002-01-28 日本電気株式会社 プログラム実行装置及びそのプロセス移動方法並びにプロセス移動制御プログラムを格納した記憶媒体
JP3993342B2 (ja) 1999-06-24 2007-10-17 株式会社日立製作所 電子計算機における処理の中断/再開方法
US6463457B1 (en) * 1999-08-26 2002-10-08 Parabon Computation, Inc. System and method for the establishment and the utilization of networked idle computational processing power
US6665699B1 (en) 1999-09-23 2003-12-16 Bull Hn Information Systems Inc. Method and data processing system providing processor affinity dispatching
DE60033615T2 (de) 1999-10-21 2007-10-31 International Business Machines Corp. Verfahren und System, um das Verteilen von IP-Datagrammen auf mehrere Server gemäß einer definierten Strategie zu erzwingen
GB2394336B (en) 1999-11-19 2004-09-08 Gen Dynamics Decisions Systems Method of allocating memory
US6591377B1 (en) * 1999-11-24 2003-07-08 Unisys Corporation Method for comparing system states at different points in time
US7058750B1 (en) 2000-05-10 2006-06-06 Intel Corporation Scalable distributed memory and I/O multiprocessor system
US6981260B2 (en) 2000-05-25 2005-12-27 International Business Machines Corporation Apparatus for minimizing lock contention in a multiple processor system with multiple run queues when determining the threads priorities
US7565651B1 (en) 2000-05-25 2009-07-21 Oracle International Corporation Parallel task scheduling system for computers
US20030154284A1 (en) 2000-05-31 2003-08-14 James Bernardin Distributed data propagator
US6986052B1 (en) 2000-06-30 2006-01-10 Intel Corporation Method and apparatus for secure execution using a secure memory partition
US6502170B2 (en) 2000-12-15 2002-12-31 Intel Corporation Memory-to-memory compare/exchange instructions to support non-blocking synchronization schemes
US7233998B2 (en) 2001-03-22 2007-06-19 Sony Computer Entertainment Inc. Computer architecture and software cells for broadband networks
US6526491B2 (en) 2001-03-22 2003-02-25 Sony Corporation Entertainment Inc. Memory protection system and method for computer architecture for broadband networks
US6785756B2 (en) 2001-05-10 2004-08-31 Oracle International Corporation Methods and systems for multi-policy resource scheduling
US7127477B2 (en) * 2001-11-06 2006-10-24 Everyware Solutions Inc. Method and system for access to automatically synchronized remote files
WO2004015553A1 (en) 2002-08-13 2004-02-19 Nokia Corporation Computer architecture for executing a program in a secure of insecure mode
US7089547B2 (en) 2002-09-13 2006-08-08 International Business Machines Corporation Firmware updating
US7039736B2 (en) 2003-01-15 2006-05-02 Hewlett-Packard Development Company, L.P. Systems and methods for accessing bus-mastered system resources
JP2004287801A (ja) 2003-03-20 2004-10-14 Sony Computer Entertainment Inc 情報処理システム、情報処理装置、分散情報処理方法及びコンピュータプログラム
JP2004320174A (ja) 2003-04-11 2004-11-11 Matsushita Electric Ind Co Ltd 認証システム、認証装置、認証方法
US7236738B2 (en) * 2003-08-01 2007-06-26 Pathfire, Inc. Multicast control systems and methods for dynamic, adaptive time, bandwidth,frequency, and satellite allocations
US7236998B2 (en) * 2003-09-25 2007-06-26 International Business Machines Corporation System and method for solving a large system of dense linear equations
US7523157B2 (en) 2003-09-25 2009-04-21 International Business Machines Corporation Managing a plurality of processors as devices
US7516456B2 (en) 2003-09-25 2009-04-07 International Business Machines Corporation Asymmetric heterogeneous multi-threaded operating system
US7478390B2 (en) 2003-09-25 2009-01-13 International Business Machines Corporation Task queue management of virtual devices using a plurality of processors
US7444632B2 (en) * 2003-09-25 2008-10-28 International Business Machines Corporation Balancing computational load across a plurality of processors
US7321958B2 (en) * 2003-10-30 2008-01-22 International Business Machines Corporation System and method for sharing memory by heterogeneous processors
US7614053B2 (en) 2004-02-20 2009-11-03 Sony Computer Entertainment Inc. Methods and apparatus for task management in a multi-processor system
US8028292B2 (en) 2004-02-20 2011-09-27 Sony Computer Entertainment Inc. Processor task migration over a network in a multi-processor system
US20050228967A1 (en) * 2004-03-16 2005-10-13 Sony Computer Entertainment Inc. Methods and apparatus for reducing power dissipation in a multi-processor system
US7298377B2 (en) * 2004-06-24 2007-11-20 International Business Machines Corporation System and method for cache optimized data formatting
US7383405B2 (en) * 2004-06-30 2008-06-03 Microsoft Corporation Systems and methods for voluntary migration of a virtual machine between hosts with common storage connectivity
US7304646B2 (en) * 2004-08-19 2007-12-04 Sony Computer Entertainment Inc. Image data structure for direct memory access
US7376860B2 (en) * 2004-12-16 2008-05-20 International Business Machines Corporation Checkpoint/resume/restart safe methods in a data processing system to establish, to restore and to release shared memory regions
US7522168B2 (en) 2005-09-27 2009-04-21 Sony Computer Entertainment Inc. Cell processor task and data management
US8037474B2 (en) 2005-09-27 2011-10-11 Sony Computer Entertainment Inc. Task manager with stored task definition having pointer to a memory address containing required code data related to the task for execution
US8141076B2 (en) 2005-09-27 2012-03-20 Sony Computer Entertainment Inc. Cell processor methods and apparatus
US7506123B1 (en) 2005-09-27 2009-03-17 Sony Computer Entertainment Inc. Method and system for performing memory copy function on a cell processor
US7734827B2 (en) 2005-09-27 2010-06-08 Sony Computer Entertainment, Inc. Operation of cell processors
US7975269B2 (en) 2005-09-27 2011-07-05 Sony Computer Entertainment Inc. Parallel processor methods and apparatus

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09179834A (ja) * 1995-12-25 1997-07-11 Hitachi Ltd 並列システムにおけるプロセスのスケジューリング方法
JP2002007364A (ja) * 2000-06-22 2002-01-11 Fujitsu Ltd 並列計算機システムのジョブスケジューリングを行うスケジューリング装置
JP2004246702A (ja) * 2003-02-14 2004-09-02 Toshiba Corp 計算機システム、計算機装置、計算機システムにおけるデータアクセス方法及びプログラム
JP2005235229A (ja) * 2004-02-20 2005-09-02 Sony Computer Entertainment Inc マルチプロセッサシステムにおけるプロセッサタスクの移動方法および装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017016285A (ja) * 2015-06-30 2017-01-19 キヤノン株式会社 複数のデータ処理部でバッファを共有するデータ制御装置、制御方法

Also Published As

Publication number Publication date
US20070074206A1 (en) 2007-03-29
CN1941780A (zh) 2007-04-04
EP2284702A1 (en) 2011-02-16
JP2007095065A (ja) 2007-04-12
CN1972293A (zh) 2007-05-30
EP1770520A3 (en) 2008-01-23
US20130318333A1 (en) 2013-11-28
US8316220B2 (en) 2012-11-20
EP1770520A2 (en) 2007-04-04

Similar Documents

Publication Publication Date Title
JP4719655B2 (ja) ネットワーク上におけるプロセッサ制御技術
JP4719656B2 (ja) ネットワーク上におけるプロセッサ制御技術
US7478390B2 (en) Task queue management of virtual devices using a plurality of processors
US8549521B2 (en) Virtual devices using a plurality of processors
JP4309420B2 (ja) 特定のspeを使ってcellプロセッサのアトミックなコンペア・アンド・スワップ命令を実行するための技術
US7200695B2 (en) Method, system, and program for processing packets utilizing descriptors
JP5737050B2 (ja) 情報処理装置、割込み制御方法および割込み制御プログラム
KR100992034B1 (ko) 동적 논리적 파티션 기능을 갖는 컴퓨팅 환경에서의 컴퓨터메모리 관리
US9063771B2 (en) User-level re-initialization instruction interception
KR0170565B1 (ko) 메모리 관리 방법, 마이크로커널 구조 데이타 프로세싱 시스템, 운영 체제 퍼스낼리티 시스템 동작 방법, 퍼스낼리티 뉴트럴 서비스 프로그램 실행 방법 및 응용 프로그램 실행방법
JP5668014B2 (ja) プロセッサにおけるタスクおよびデータ管理
US7451278B2 (en) Global pointers for scalable parallel applications
JPH1185618A (ja) 仮想メモリ変換を制御する方法
JP4130465B2 (ja) メモリ転送処理サイズが異なるプロセッサに関してアトミックな処理を実行するための技術
JPH1173365A (ja) データ移動操作を最適化する方法
JP2019164661A (ja) 情報処理装置、情報処理方法及びプログラム
Willmann Efficient hardware/software architectures for highly concurrent network servers
Goglin High Bandwidth Data Transfer with OPIOM & Myrinet: Application to Remote Video

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090722

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100816

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100824

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101025

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20101125

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20101220

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110118

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110311

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110329

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110404

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140408

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees