JP5493575B2 - 情報処理装置及び情報処理装置の制御方法 - Google Patents

情報処理装置及び情報処理装置の制御方法 Download PDF

Info

Publication number
JP5493575B2
JP5493575B2 JP2009185893A JP2009185893A JP5493575B2 JP 5493575 B2 JP5493575 B2 JP 5493575B2 JP 2009185893 A JP2009185893 A JP 2009185893A JP 2009185893 A JP2009185893 A JP 2009185893A JP 5493575 B2 JP5493575 B2 JP 5493575B2
Authority
JP
Japan
Prior art keywords
packet
crossbar
information processing
processing apparatus
crossbar switch
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009185893A
Other languages
English (en)
Other versions
JP2011039744A (ja
Inventor
悠造 ▲高▼木
隆志 豊島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2009185893A priority Critical patent/JP5493575B2/ja
Priority to EP20100171928 priority patent/EP2288084B1/en
Priority to US12/805,588 priority patent/US8589614B2/en
Publication of JP2011039744A publication Critical patent/JP2011039744A/ja
Application granted granted Critical
Publication of JP5493575B2 publication Critical patent/JP5493575B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/10Packet switching elements characterised by the switching fabric construction
    • H04L49/101Packet switching elements characterised by the switching fabric construction using crossbar or matrix
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/25Routing or path finding in a switch fabric

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Multi Processors (AREA)
  • Bus Control (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Use Of Switch Circuits For Exchanges And Methods Of Control Of Multiplex Exchanges (AREA)

Description

本発明は、ネットワークシステム、情報処理装置及びネットワークシステムの制御方法に関する。
計算機(又は、コンピュータ)等の情報処理装置の性能は年々向上し続けているが、半導体回路の微細化限界の到来等に伴う動作クロック周波数の上昇カーブの飽和により、CPU(Central Processing Unit)等のプロセッサの性能を向上するのには限界がある。このため、近年では複数のプロセッサを備えた並列計算機により更なる性能の向上が図られている。
並列計算機の性能は、プロセッサ単体の演算速度だけでなく、プロセッサ間の通信に要する時間、即ち、通信速度にも依存する。プロセッサ単体の性能を向上するのには限界があるため、現在の状況では並列計算機の更なる性能向上を図るためにはプロセッサ間の通信速度の向上が要求される。並列計算機における通信速度は、大きく分けて2つの要素に分けることができる。一つはデータ転送時間たるレイテンシであり、もう一つはデータ転送の帯域幅たるバンド幅である。
レイテンシは、データの通信開始から通信終了までにかかる時間であり、レイテンシが短い程通信速度は向上する。しかし、並列計算機の性能向上のために並列計算機の構造を複雑にすると、論理が複雑になり結果として使用するトランジスタの数が増大して信号遅延が発生するため、レイテンシが低下してしまう。又、レイテンシの影響は、並列計算機の規模が大きくなる程蓄積され、並列計算機システム全体の更なる性能向上を難しくしている。
バンド幅は、一度に転送できるデータ量を示す尺度であり、当然ながら一度に多くのデータ量を転送可能であることが望ましい、しかし、単純に一度に転送可能なデータ量を増加すると、一度に転送するビット数が増加するためにデータの転送及び保持等に用いるトランジスタ数も増加し、結果として並列計算機を構成する大規模集積回路(LSI:Large Scale Integrated circuit)の半導体チップの面積が増加してしまう。このため、一度に転送するビット数を増加させたことによりデータ転送の同期に時間がかかり、結果的に上記レイテンシを低下させてしまう。
図1は、従来のネットワークシステム(又は、ネットワークアーキテクチャ)の一例を説明する図である。図1は、2次元メッシュトーラス(Mesh Torus)トポロジー等の2次元メッシュトポロジーを用いるネットワークシステム1を示す。図1に示すように、ネットワークシステム1は、クロスバスイッチ(Crossbar Switch)2と、クロスバスイッチ2に接続されたクロスバインタフェース3−1〜3−4を有する。各クロスバインタフェース3−1〜3−4からのデータは、全てクロスバスイッチ2を経由してクロスバインタフェース3−1〜3−4へ再分配される。
各クロスバインタフェース3−1〜3−4には、ノード5が接続されている。ノード5は、プロセッサ等の計算ノード5、或いは、入出力(I/O:Input and Output)ノードであり、少なくとも1個のノード5が計算ノードである。ネットワークシステム1及び4個のノード5は、情報処理装置を形成しており、2以上のノード5が計算ノードの場合には並列計算機が形成される。
図1からもわかるように、計算機に限らず、ネットワークシステムにおいてもレイテンシ及びバンド幅がトレードオフの関係にあり、レイテンシ及びバンド幅の両方を向上することは難しい。
特開平11−212866号公報 特開2002−328838号公報 特開平10−215266号公報
従来の計算機やネットワークシステムでは、レイテンシ及びバンド幅の両方を向上することが難しいという問題があった。
そこで、本発明は、レイテンシ及びバンド幅の両方を向上可能なネットワークシステム、情報処理装置及びネットワークシステムの制御方法を提供することを目的とする。
本発明の一観点によれば、クロスバスイッチと、前記クロスバスイッチに接続されたポートを有する複数のクロスバインタフェースと、前記複数のクロスバインタフェースのうち、使用頻度が所定値以上のポートの組を形成するクロスバインタフェース同士を直接接続するバイパスルートを備えたネットワークシステムが提供される。
本発明の一観点によれば、第1の計算を行った結果に基づき、パケットを送信する第1の計算ノードと、前記第1の計算ノードに接続され、前記第1の計算ノードからのパケットに含まれるヘッダを解析する第1の解析部と、前記第1の解析部に接続され、第1の要求を出力するとともに、出力した前記第1の要求に対する第1の許可を入力するまで前記第1の計算ノードからのパケットを第1のバッファに保持するとともに、前記第1の許可を入力した場合、前記第1の解析部によるヘッダの解析結果に応じて、前記第1のバッファに保持した前記第1の計算ノードからのパケットに基づき、第1のパケットと第2のパケットとを送信する第1の送信部と、前記第1の送信部に接続され、前記第1の送信部から入力した前記第1の要求に基づき、前記第1の許可を出力するとともに、前記第1の送信部からの第1のパケットを受信し、受信した第1のパケットの経路を切り換えるクロスバスイッチと、前記クロスバスイッチと前記第1の送信部とに接続され、前記クロスバスイッチからの第1のパケットと前記第1の送信部からの第2のパケットとを並列に受信する第2の受信部と、接続された前記第2の受信部から受信した第1のパケットと第2のパケットとに基づき、計算を行う第2の計算ノードを有する情報処理装置が提供される。
本発明の一観点によれば、情報処理装置の制御方法において、前記情報処理装置が有する第1の計算ノードが、第1の計算を行った結果に基づき、パケットを送信し、前記情報処理装置が有する、前記第1の計算ノードに接続された第1の解析部が、前記第1の計算ノードからのパケットに含まれるヘッダを解析し、前記情報処理装置が有する、前記第1の解析部に接続された第1の送信部が、第1の要求を出力し、前記情報処理装置が有する、前記第1の送信部に接続されたクロスバスイッチが、前記第1の送信部から入力した前記第1の要求に基づき、第1の許可を出力し、前記第1の送信部が、出力した前記第1の要求に対する前記第1の許可を入力するまで前記第1の計算ノードからのパケットを第1のバッファに保持するとともに、前記第1の許可を入力した場合、前記第1の解析部によるヘッダの解析結果に応じて、前記第1のバッファに保持した前記第1の計算ノードからのパケットに基づき、第1のパケットと第2のパケットとを送信し、前記クロスバスイッチが、前記第1の送信部からの第1のパケットを受信し、受信した第1のパケットの経路を切り換え、前記情報処理装置が有する、前記クロスバスイッチと前記第1の送信部とに接続された第2の受信部が、前記クロスバスイッチからの第1のパケットと前記第1の送信部からの第2のパケットとを並列に受信し、前記情報処理装置が有する第2の計算ノードが、接続された前記第2の受信部から受信した第1のパケットと第2のパケットとに基づき、計算を行う情報処理装置の制御方法が提供される。
開示のネットワークシステム、情報処理装置及びネットワークシステムの制御方法によれば、レイテンシ及びバンド幅の両方を向上することができる。
従来のネットワークシステムの一例を説明する図である。 実施例におけるネットワークシステムの一例を説明する図である。 クロスバスイッチの一例を説明する図である。 同時通信の性能評価のシミュレーション結果を示す図である。 実施例におけるネットワークシステムの他の例を説明する図である。 実施例におけるネットワークシステムの他の例を説明する図である。 実施例におけるネットワークシステムの他の例を説明する図である。 実施例におけるネットワークシステムの他の例を説明する図である。 クロスバインタフェースの一例を説明する図である。 クロスバスイッチの動作を説明するフローチャートである。
開示のネットワークシステム、情報処理装置及びネットワークシステムの制御方法では、通信経路の偏り、即ち、ポートの使用頻度(又は、データ通信頻度)の偏りに注目して、レイテンシ及びバンド幅の両方を向上させる。レイテンシとバンド幅両方を向上させることによって、並列計算機等の情報処理装置の性能を向上することができる。
以下に、開示のネットワークシステム、情報処理装置及びネットワークシステムの制御方法の各実施例を図面と共に説明する。
多くの並列計算機では、デッドロック(Deadlock)を回避するために次元オーダルーティング(DOR:Dimension Order Routing)等のデッドロックを論理的に回避する通信経路選択アルゴリズムが採用されている。このような通信経路選択アルゴリズムを採用すると、通信経路の偏り、即ち、使用頻度(又は、データ通信頻度)の高いポートの組と使用頻度がそれほど高くないポートの組が発生する。
例えば、2次元メッシュトポロジーで次元オーダルーティング(DOR)を採用すると、クロスバスイッチ(Crossbar Switch)等の分配型スイッチネットワーク(Distributed Switched Network)を経由するデータは、目的とする(又は、宛先となる)ノード座標のX座標を一致させてからY座標を一致させるような通信経路を選択して転送される。全てのデータは、各々が目的とするノード座標のX座標を一致させる際に同じ順序でX座標を横切り、目的とするノード座標のY座標を一致させる際に同じ順序でY座標を横切るので、デッドロックが回避できる。説明の便宜上、例えば2次元メッシュ上の座標を(x、y)として、座標(0,0)から座標(n,n)にデータを転送する場合、X軸のポート同士の通信がn回、Y軸のポート同士の通信がn−1回、X軸のポートとY軸のポートの通信が1回となり、X軸のポート同士又はY軸のポート同士といった同軸のポート同士の通信の回数が、それ以外のX軸のポートとY軸のポート間である異なる軸のポート間の通信の回数と比べて多い。
そこで、本発明の一実施例では、使用頻度の偏りに注目して、レイテンシ及びバンド幅の両方を向上させる。レイテンシ及びバンド幅の両方を向上させることにより、例えば並列計算機等の情報処理装置の性能を向上可能となる。
図2は、実施例におけるネットワークシステム(又は、ネットワークアーキテクチャ)の一例を説明する図である。図2は、2次元メッシュトーラス(Mesh Torus)トポロジー、2次元ライントーラス(Line Torus)トポロジー、2次元メッシュリング(Mesh Ring)トポロジー、2次元ラインリング(Line Ring)トポロジーのいずれかのトポロジーを用いるネットワークシステム11を示す。図2に示すように、ネットワークシステム11は、クロスバスイッチ(Crossbar Switch)12と、クロスバスイッチ12に接続されたクロスバインタフェース(又は、スイッチインタフェース)13−1〜13−4と、バイパスルート14−1,14−2を有する。ポートを形成する各クロスバインタフェース13−1〜13−4は、クロスバスイッチ12と対応するノード50−1〜50−4との間に接続される。ノード50−1〜50−4は、例えば各種計算(又は、演算)を実行するCPU、プロセッサ等の計算ノード、或いは、入出力(I/O:Input and Output)ノードであり、ノード50−1〜50−4のうち少なくとも1個のノードが計算ノードである。ネットワークシステム11及び4個のノード50−1〜50−4は、情報処理装置を形成しており、ノード50−1〜50−4のうち2個以上のノードが計算ノードの場合には並列計算機が形成される。つまり、情報処理装置は、クロスバスイッチ12と、クロスバインタフェース13−1〜13−4と、バイパスルート14−1,14−2と、ノード50−1〜50−4を有する。
各クロスバインタフェース13−1〜13−4からのデータは、データの経路を切り替えるクロスバスイッチ12を経由してクロスバインタフェース13−1〜13−4へ再分配されか、或いは、クロスバスイッチ12を経由することなくバイパスルート14−1,14−2を経由して対応するクロスバインタフェースへ転送される。
図3は、クロスバスイッチ12の一例を説明する図である。この例では、クロスバスイッチ12はX軸方向に配置されたn個(nは2以上の自然数)のスイッチ(SW)121と、Y軸方向に配置されたn個のスイッチ121を有する。このようなクロスバスイッチ12において、2次元メッシュトーラストポロジー、2次元ライントーラストポロジー、2次元メッシュリングトポロジー、2次元ラインリングトポロジーのいずれかのトポロジーで通信経路選択アルゴリズムとして次元オーダルーティング(DOR)を採用し、例えば2次元メッシュ上の座標を(x、y)として、座標(0,0)から座標(n,n)にデータを転送する場合、X軸のポート同士の通信がn回、Y軸のポート同士の通信がn−1回、X軸のポートとY軸のポートの通信が1回となる。このように、X軸のポート同士又はY軸のポート同士といった同軸のポート同士の通信の回数が、それ以外のX軸のポートとY軸のポート間である異なる軸のポート間の通信の回数と比べて多い。そこで、この例では、使用頻度が所定値以上で高いポートの組を形成するX軸同士のクロスバインタフェース13−1,13−2がバイパスルート14−1により接続されており、使用頻度が所定値以上で高いポートの組を形成するY軸同士のクロスバインタフェース13−3,13−4がバイパスルート14−2により接続されているが、バイパスルートにより接続されるクロスバインタフェースはこれに限定されない。
尚、X軸のポートがn個でY軸のポートがn個のクロスバスイッチ12は、図3のようにn個のスイッチ121を用いる構成に限定されるものではないことは言うまでもない。
例えば、採用する通信経路選択アルゴリズムが互いに異なる軸のポート同士の通信の回数が同軸同士の通信の回数と比べて多い場合には、クロスバインタフェース13−1,13−4がバイパスルートにより接続され、クロスバインタフェース13−2,13−2がバイパスルートにより接続されていても良い。
このように、使用頻度(又は、データ通信頻度)が所定値以上で高いポートの組を形成する例えばクロスバインタフェース13−1,13−2間のデータ転送を、クロスバスイッチ12を経由せずに直接バイパスルート14−1を経由して行う。これにより、バイパスルート14−1を通るデータに関しては、クロスバスイッチ12を経由せずに直接クロスバインタフェース13−1,13−2のポート間でデータ転送が行われるので、クロスバスイッチ12を経由する場合と比べて低いレイテンシでデータ転送を行うことができる。又、クロスバインタフェース13−1,13−2を経由するデータ転送の大多数がバイパスルート14−1を経由するデータ転送となるため、レイテンシが実質的に低下する。
更に、バイパスルートを設けることで、クロスバインタフェースが仮想チャネルを有する場合には、バイパスルートを経由するデータとそれ以外のクロスバスイッチ12を経由するデータとを同時に、即ち、並列に転送することも可能であり、バンド幅を実質的に増加させることができる。例えば、クロスバインタフェース13−1からクロスバインタフェース13−2へパケットを転送する際に、バイパスルート14−1を経由してデータを転送すると共に、同時にクロスバスイッチ12を経由してデータを転送することにより、バンド幅を2倍にすることができる。尚、パケットの形式(又は、フォーマット)は特に限定されないが、分配型(又は、分散型)ルーティング(Distributed Routing)の場合、パケットには宛先情報やパケットの発行元(ソース)の情報を含むルーティング情報が含まれる。例えばヘッダとデータ部で形成されるパケットの場合、ルーティング情報はパケットのヘッダに含まれており、データはデータ部に含まれている。
尚、図2は、ネットワークシステム11内の接続を説明するためのものであり、クロスバインタフェース13−1〜13−4のクロスバスイッチ12に対する物理的位置は図2の位置に限定されるものではない。又、後述する図5〜図8においても、図示された各クロスバインタフェースのクロスバスイッチに対する位置は、物理的な位置を示すものではない。
図4は、同時通信の性能評価のシミュレーション結果を示す図である。図4中、縦軸は未到達パケット数を示し、横軸は経過時間をCPUサイクル数で示す。例えば、図2のクロスバインタフェース13−1からクロスバインタフェース13−2へパケットを転送する際に、データは目的とする(又は、宛先となる)ノード座標のX座標を一致させてからY座標を一致させるような通信経路を選択する。図4において、Axはクロスバスイッチ12を経由する場合のX座標を一致させる処理の性能評価のシミュレーション結果、Ayはクロスバスイッチ12を経由する場合のY座標を一致させる処理の性能評価のシミュレーション結果、A−1はクロスバインタフェース13−1からクロスバインタフェース13−2へクロスバスイッチ12を経由してパケットを転送した場合の性能評価のシミュレーション結果を示し、図1の従来例においてクロスバインタフェース3−1からクロスバインタフェース3−2へクロスバスイッチ2を経由してパケットを転送した場合の性能評価のシミュレーション結果に相当する。又、Bxはクロスバスイッチ12を経由せずに直接バイパスルート14−1を経由する場合のX座標を一致させる処理の性能評価のシミュレーション結果、Byはクロスバスイッチ12を経由せずに直接バイパスルート14−1を経由する場合のY座標を一致させる処理の性能評価のシミュレーション結果、B−1はクロスバインタフェース13−1からクロスバインタフェース13−2へクロスバスイッチ12を経由せずに直接バイパスルート14−1を経由してパケットを転送した場合の性能評価のシミュレーション結果を示す。図4のシミュレーション結果B−1とシミュレーション結果A−1の比較から、シミュレーション結果B−1について10%の性能向上が確認された。尚、図4のシミュレーション結果は、正規化されたパケット転送速度について算出されている。
図5は、実施例におけるネットワークシステムの他の例を説明する図である。図5は、2次元メッシュトーラストポロジー、2次元ライントーラストポロジー、2次元メッシュリングトポロジー、2次元ラインリングトポロジーのいずれかのトポロジーを用いるネットワークシステム11を示す。図5中、図2と同一部分には同一符号を付し、その説明は省略する。この例では、同軸のポート同士の通信の回数がそれ以外の通信の回数と比べて多い通信経路選択アルゴリズムが採用されているので、+X軸のポートを有するクロスバインタフェース13−1と−X軸のポートを有するクロスバインタフェース13−2がバイパスルート14−1により接続されている。又、+Y軸のポートを有するクロスバインタフェース13−3と−Y軸のポートを有するクロスバインタフェース13−4がバイパスルート14−2により接続されている。尚、クロスバインタフェース13−1,13−2の+X軸,−X軸のポートとは、クロスバスイッチ11の対応するX軸のポートに接続されたポートであり、クロスバインタフェース13−3,13−4の+Y軸,−Y軸のポートとは、クロスバスイッチ11の対応するY軸のポートに接続されたポートであり、+X,−X,+Y,−Y軸のポートとは便宜上付けられたポート名である。
図6は、実施例におけるネットワークシステムの他の例を説明する図である。図6は、3次元メッシュトーラストポロジー、3次元ライントーラストポロジー、3次元メッシュリングトポロジー、3次元ラインリングトポロジーのいずれかのトポロジーを用いるネットワークシステム21を示す。クロスバスイッチ12Aには、クロスバインタフェース13−1〜13−4に加え、更にクロスバインタフェース13−5,13−6が接続されている。図6中、図5と同一部分には同一符号を付し、その説明は省略する。この例では、同軸のポート同士の通信の回数がそれ以外の通信の回数と比べて多い通信経路選択アルゴリズムが採用されているので、+Z軸のポートを有するクロスバインタフェース13−5と−Z軸のポートを有するクロスバインタフェース13−6がバイパスルート14−3により接続されている。
ポートを形成するクロスバインタフェース13−5,13−6は、クロスバスイッチ12Aと対応するノード50−5〜50−6との間に接続される。ノード50−5,〜50−6は、計算ノード、或いは、I/Oノードであり、ノード50−1〜50−6のうち少なくとも1個のノードが計算ノードである。ネットワークシステム21及び6個のノード50−1〜50−6は、情報処理装置を形成しており、ノード50−1〜50−6のうち2個以上のノードが計算ノードの場合には並列計算機が形成される。つまり、情報処理装置は、クロスバスイッチ12Aと、クロスバインタフェース13−1〜13−6と、バイパスルート14−1〜14−3と、ノード50−1〜50−6を有する。
図7は、実施例におけるネットワークシステムの他の例を説明する図である。図7は、2次元メッシュトーラストポロジー、2次元ライントーラストポロジー、2次元メッシュリングトポロジー、2次元ラインリングトポロジーのいずれかのトポロジーを用いるネットワークシステム31を示す。図7中、図5と同一部分には同一符号を付し、その説明は省略する。この例では、互いに異なる軸のポート同士の通信の回数が同軸のポート同士の通信の回数と比べて多い通信経路選択アルゴリズムが採用されているので、+X軸のポートを有するクロスバインタフェース13−1と+Y軸のポートを有するクロスバインタフェース13−3がバイパスルート14−4により接続されている。又、−X軸のポートを有するクロスバインタフェース13−2と−Y軸のポートを有するクロスバインタフェース13−4がバイパスルート14−5により接続されている。
図8は、実施例におけるネットワークシステムの他の例を説明する図である。図8は、ツリー型トポロジーを用いるネットワークシステム41を示す。クロスバスイッチ12Bには、親のクロスバインタフェース13A−1及び子のクロスバインタフェース13B−1,13B−2が接続されている。親のクロスバインタフェース13A−1からクロスバスイッチ12Bを介して子のクロスバインタフェース13B−1,13B−2が分岐することでツリー型が形成されている。この例では、子のクロスバインタフェース13B−1,13B−2のポートから親のクロスバインタフェース13A−1のポートへ通信の回数が子のクロスバインタフェース13B−1,13B−2のポート同士の通信の回数と比べて多い通信経路選択アルゴリズムが採用されているので、子のクロスバインタフェース13B−1のポートと親のクロスバインタフェース13A−1のポートがバイパスルート14B−1により接続されている。又、子のクロスバインタフェース13B−2のポートと親のクロスバインタフェース13A−1のポートがバイパスルート14B−2により接続されている。尚、この例では、子のクロスバインタフェース13B−1,13B−2のポートから親のクロスバインタフェース13A−1のポートへのバイパスルート14B−1,14B−2が設けられているが、親のクロスバインタフェース13A−1から子のクロスバインタフェース13B−1,13B−2のポートへのバイパスルートを更に設けても良いことは言うまでもない。
ポートを形成するクロスバインタフェース13A−1,13B−1,13B−2は、クロスバスイッチ12Bと対応するノード50A−1,50B−1,50B−2との間に接続される。ノード50−A−1,50B−1,50B−2は、計算ノード、或いは、I/Oノードであり、ノード50A−1,50B−1,50B−2のうち少なくとも1個のノードが計算ノードである。ネットワークシステム41及び3個のノード50A−1,50B−1,50B−2は、情報処理装置を形成しており、ノードノード50A−1,50B−1,50B−2のうち2個以上のノードが計算ノードの場合には並列計算機が形成される。つまり、情報処理装置は、クロスバスイッチ12Bと、クロスバインタフェース13A−1,13B−1,13B−2と、バイパスルート14B−1,14B−2と、ノードノード50A−1,50B−1,50B−2を有する。
ツリー型トポロジーにおいて、例えば孫及びひ孫のクロスバインタフェースを更に設ける場合には、図8に示すようにノード50B−1に孫のクロスバインタフェース13C−1が接続され、孫のクロスバインタフェース13C−1はクロスバスイッチ12Cを介してひ孫のクロスバインタフェース(図示せず)に接続される。孫のクロスバインタフェース13C−1及びひ孫のクロスバインタフェースの構成は、クロスバインタフェース13A−1,13B−1,13B−2と同様の構成で良い。又、クロスバスイッチ12Cの構成も、クロスバスイッチ12Bと同様の構成で良い。
尚、上記ネットワークシステム11,21,31,41においては、1つのクロスバインタフェースに対して接続されるバイパスルートは1つであるが、採用する通信経路選択アルゴリズムに応じて、1つのクロスバインタフェースに対して2以上のクロスバインタフェースを接続するために2以上のバイパスルートを接続するようにしても良い。例えば、図6に示すネットワークシステム21において、+X軸のポートを有するクロスバインタフェース13−1と+Z軸のポートを有するクロスバインタフェース13−5をバイパスルートにより接続しても良い。
図9は、クロスバインタフェースの一例を説明する図である。説明の便宜上、図9に示すクロスバインタフェース13に接続されるバイパスルート14は1つであるものとする。クロスバインタフェース13は、図9に示す如く接続されたクロスバ受信部131、外部インタフェース132、ヘッダ解析部133、及びクロスバ送信部134を有する。
クロスバ受信部131には、クロスバスイッチ12からのパケットと、バイパスルート14からのパケットが入力される。使用する通信プロトコルに応じてパケットをクロスバスイッチ12を経由するかバイパスルート14を経由するかのいずれか1つを選択する排他制御がクロスバインタフェース13に対して予め行われているので、クロスバ受信部131はクロスバスイッチ12からのパケット又はバイパスルート14からのパケットを外部インタフェース132へ供給する。
外部インタフェース132は、ノード50に接続される。ノード50は、計算ノード又はI/Oノードである。外部インタフェース132は、クロスバ受信部131からのパケットをノード50へ出力し、ノード50からのパケットをヘッダ解析部133へ供給する。ノード50は、メモリ(図示せず)等と共に例えば並列計算機を形成するシステムボード(図示せず)に搭載されたCPUであっても良い。又、ノード50は、上記システムボードとは別体のI/Oボードに搭載されたI/Oインタフェースであっても良い。
ヘッダ解析部133は、外部インタフェース132からのパケットのヘッダに含まれるルーティング情報に基づいて目的とする(又は、宛先となる)ノード座標、即ち、パケットの宛先情報を認識し、パケットを転送するべきポートのX座標及びY座標を決定する。ヘッダに含まれるルーティング情報は、パケットの宛先情報(例えば、デスティネーションアドレス)に加え、パケットの発行元の情報(例えば、ソースアドレス)を含んでも良い。
クロスバ送信部134は、リクエストを発行してクロスバスイッチ12からパケットの送信を許可するグラント(Grant)が与えられると、外部インタフェース132からヘッダ解析部133を介して得られるパケットをクロスバスイッチ12へ出力する。一方、リクエストを発行してもクロスバスイッチ12からグラントが与えられないと、クロスバ送信部134は、外部インタフェース132からヘッダ解析部133を介して得られるパケットをクロスバスイッチ12へ出力することなくバイパスルート14へ出力する。
クロスバ送信部134は、FIFO(First-In-First-Out)等で形成されたバッファ(図示せず)が複数個並列接続された構成を有しても良い。この場合、クロスバ送信部134は、発行したリクエストに対してクロスバスイッチ12からグラントが与えられるまではパケットをバッファ内に保持することができる。このように、クロスバインタフェース13がバッファを用いた仮想チャネルを有する場合には、バイパスルート14を経由するデータとそれ以外のクロスバスイッチ12を経由するデータとを同時に、即ち、並列に転送することも可能であり、バンド幅を実質的に増加させることができる。
クロスバインタフェースに接続されるバイパスルートが2以上の場合には、図9と同様の構成が各バイパスルートに対して設けられることは言うまでもない。
並列計算機は、一般的にはネットワーク用のポートとCPUのポートを有し、場合によってはI/Oノードのポートを有する。ここでは説明の便宜上、CPUのポート名をCPU0,CPU1とし、I/Oノードのポート名をIO0、IO1とする。次元オーダルーティング(DOR)を採用している場合、CPUのポートCPU0,CPU1は+X軸、−X軸のポートと通信する可能性が高いので、図5又は図6の場合のようにCPU0と+X軸のポート、CPU1と−X軸のポートを組にしてバイパスルートを設けることができる。この場合、CPU側で+X軸のポートに出力されるものはCPUのポートCPU0に入れるようにするアルゴリズムを加えるとより効果的である。
又、次元オーダルーティング(DOR)を採用している場合は、I/OノードはZ軸のポートと通信する可能性が高い。そこで、IO0と+Z軸のポート、IO1と−Z軸のポートを組にしてバイパスルートを設けることができる。
尚、言うまでもなく、上記実施例のネットワークシステムは、並列計算機の通信のみに対して適用可能なものではなく、汎用的に利用できる。
図10は、クロスバスイッチの動作、即ち、調停処理を説明するフローチャートである。ここでは説明の便宜上、図5に示すクロスバスイッチ12の動作を例に取って説明する。
図10において、ステップS21は、+X,−X,+Y,−Y軸のポートからのリクエスト(要求)を確認し、ステップS22は、+X,−X,+Y,−Y軸のポートのいずれかの軸からパケットを受け取っているか否かを判定する。リクエストは、クロスバスイッチ12がポート(入力ポート)から受け取ったパケットを出力するべきポート(出力ポート)を示す。ステップS22の判定結果がYESであると、ステップS23は+X,−X,+Y,−Y軸のポートへはパケットの送信を許可するグラントを与えることなく、処理はステップS34へ進む。ステップS34は、受け取っているパケットが終了したか否かを判定し、判定結果がYESになると処理はステップS21へ戻る。
ステップS22の判定結果がNOであると、ステップS24は、+X軸のポートからのリクエストがあるか否かを判定し、判定結果がYESであると処理はステップS25へ進み、判定結果がNOであれば処理はステップS26へ進む。ステップS25は、+X軸のポートへグラントを与え、処理は後述するステップS33へ進む。ステップS26は、−X軸のポートからのリクエストがあるか否かを判定し、判定結果がYESであると処理はステップS27へ進み、判定結果がNOであれば処理はステップS28へ進む。ステップS27は、−X軸のポートへグラントを与え、処理は後述するステップS33へ進む。ステップS28は、+Y軸のポートからのリクエストがあるか否かを判定し、判定結果がYESであると処理はステップS29へ進み、判定結果がNOであれば処理はステップS30へ進む。ステップS29は、+Y軸のポートへグラントを与え、処理は後述するステップS33へ進む。ステップS30は、−Y軸のポートからのリクエストがあるか否かを判定し、判定結果がYESであると処理はステップS31へ進み、判定結果がNOであれば処理はステップS32へ進む。ステップS31は、−Y軸のポートへグラントを与え、処理はステップS33へ進む。
ステップS33は、リクエストの処理が終了したか否かを判定し、判定結果がYESになると処理はステップS21へ戻る。又、ステップS32の後、処理はステップS21へ戻る。
このようにして、クロスバスイッチ12は、パケットを受け取っていないときにリクエストがきたらこのリクエストのソースへグラントを与える。上記調停処理は、クロスバスイッチ12内の出力ポートの部分で実行可能である。
以上の実施例を含む実施形態に関し、更に以下の付記を開示する。
(付記1)
クロスバスイッチと、
前記クロスバスイッチに接続されたポートを有する複数のクロスバインタフェースと、
前記複数のクロスバインタフェースのうち、使用頻度が所定値以上のポートの組を形成するクロスバインタフェース同士を直接接続するバイパスルートを備えた、ネットワークシステム。
(付記2)
前記バイパスルートで直接接続されるクロスバインタフェースは、通信経路選択アルゴリズムに基づいて決定されている、付記1記載のネットワークシステム。
(付記3)
前記通信経路選択アルゴリズムは次元オーダルーティングであり、前記バイパスルートで直接接続されるクロスバインタフェースは、データの宛先となるノード座標と同軸のポートを形成する、付記2記載のネットワークシステム。
(付記4)
前記バイパスルートで直接接続されるクロスバインタフェースは、データの宛先となるノード座標と互いに異なる軸のポートを形成する、付記2記載のネットワークシステム。
(付記5)
各クロスバインタフェースは、前記クロスバスイッチとプロセッサ又は入出力ノードとの間に接続されている、付記1乃至4のいずれか1項記載のネットワークシステム。
(付記6)
各クロスバインタフェースは、前記クロスバスイッチ及び前記バイパスルートに接続されたクロスバ送信部を有し、
前記クロスバ送信部は、リクエストを発行して前記クロスバスイッチからパケットの送信を許可するグラントが与えられると前記プロセッサ又は入出力ノードからのパケットを前記クロスバスイッチへ出力すると共に、前記リクエストを発行して前記クロスバスイッチからグラントが与えられないと前記プロセッサ又は入出力ノードからのパケットを前記クロスバスイッチへ出力することなく前記バイパスルートへ出力する、付記5記載のネットワークシステム。
(付記7)
第1の計算を行い、パケットを送信する第1の計算ノードと、
前記第1の計算ノードに接続され、前記第1の計算ノードが送信するパケットを転送する第1のクロスバインタフェースと、
接続された前記第1の計算ノードからのパケットを受信し、パケットの経路を切り替えるクロスバスイッチと、
前記クロスバスイッチと前記第1のクロスバインタフェースに接続され、前記クロスバスイッチ又は前記第1のクロスバインタフェースからのパケットを転送する第2のクロスバインタフェースと、
接続された前記第2のクロスバインタフェースからのパケットを受信し、第2の計算を行う第2の計算ノードを有する情報処理装置。
(付記8)
前記第2のクロスバインタフェースは、前記クロスバスイッチからのパケットと、前記第1のクロスバインタフェースからのパケットを同時に受信する付記7記載の情報処理装置。
(付記9)
前記第2のクロスバインタフェースは、前記クロスバスイッチ及び前記第2のクロスバインタフェースに接続されたクロスバ送信部を有し、
前記クロスバ送信部は、パケット送信の要求を発行して前記クロスバスイッチからパケットの送信の許可が与えられた場合、前記計算ノードからのパケットを前記クロスバスイッチへ出力するとともに、前記要求を発行して前記クロスバスイッチから前記許可が与えられない場合、前記第1のクロスバインタフェースへ出力する付記7記載の情報処理装置。
(付記10)
クロスバスイッチと、
複数のノードと、
ポートを有すると共に前記クロスバスイッチと前記複数のノードの間に接続された複数のクロスバインタフェースと、
前記複数のクロスバインタフェースのうち、使用頻度が所定値以上のポートの組を形成するクロスバインタフェース同士を直接接続するバイパスルートを備え、
前記複数のノードは、少なくとも1つの計算ノードと少なくとも1つの入出力ノードで形成される、情報処理装置。
(付記11)
前記バイパスルートで直接接続されるクロスバインタフェースは、通信経路選択アルゴリズムに基づいて決定されている、付記10記載の情報処理装置。
(付記12)
前記通信経路選択アルゴリズムは次元オーダルーティングであり、前記バイパスルートで直接接続されるクロスバインタフェースは、データの宛先となるノード座標と同軸のポートを形成する、付記11記載の情報処理装置。
(付記13)
前記バイパスルートで直接接続されるクロスバインタフェースは、データの宛先となるノード座標と互いに異なる軸のポートを形成する、付記11記載の情報処理装置。
(付記14)
各クロスバインタフェースは、前記クロスバスイッチ及び前記バイパスルートに接続されたクロスバ送信部を有し、
前記クロスバ送信部は、リクエストを発行して前記クロスバスイッチからパケットの送信を許可するグラントが与えられると前記ノードからのパケットを前記クロスバスイッチへ出力すると共に、前記リクエストを発行して前記クロスバスイッチからグラントが与えられないと前記ノードからのパケットを前記クロスバスイッチへ出力することなく前記バイパスルートへ出力する、付記10乃至13のいずれか1項記載の情報処理装置。
(付記15)
各クロスバインタフェースは、前記クロスバスイッチ及び前記バイパスルートに接続されたクロスバ受信部を有し、
前記クロスバ受信部は、前記クロスバスイッチからのパケットと、前記クロスバインタフェースからのパケットを入力し、使用する通信プロトコルに応じた排他制御によりいずれか一方のパケットを選択出力する、付記10乃至13記載の情報処理装置。
(付記16)
各クロスバインタフェースは、仮想チャネルを有すると共に前記クロスバスイッチ及び前記バイパスルートに接続されたクロスバ受信部を有し、
前記クロスバ受信部は、前記クロスバスイッチからのパケットと、前記クロスバインタフェースからのパケットを同時に入力し、両方のデータとを仮想チャネルを用いて並列に転送する、付記10乃至13記載の情報処理装置。
(付記17)
第1の計算を行う第1の計算ノードが、パケットを送信するステップと、
前記第1の計算ノードに接続された第1のクロスバインタフェースが、前記第1の計算ノードが送信するパケットを転送するステップと、
クロスバスイッチが、前記クロスバスイッチに接続された前記第1の計算ノードからのパケットを受信し、パケットの経路を切り替えるステップと、
前記クロスバスイッチと前記第1のクロスバインタフェースに接続された第2のクロスバインタフェースが、前記クロスバスイッチ又は前記第1のクロスバインタフェースからのパケットを転送するステップと、
第2の計算を行う第2の計算ノードが、前記第2の計算ノードに接続された前記第2のクロスバインタフェースからのパケットを受信するステップを含むネットワークシステムの制御方法。
(付記18)
前記第2のクロスバインタフェースは、前記クロスバスイッチからのパケットと、前記第1のクロスバインタフェースからのパケットを同時に受信する付記17記載のネットワークシステムの制御方法。
(付記19)
前記第2のクロスバインタフェースは、前記クロスバスイッチ及び前記第2のクロスバインタフェースに接続されたクロスバ送信部を有し、
前記クロスバ送信部は、パケット送信の要求を発行して前記クロスバスイッチからパケットの送信の許可が与えられた場合、前記計算ノードからのパケットを前記クロスバスイッチへ出力するとともに、前記要求を発行して前記クロスバスイッチから前記許可が与えられない場合、前記第1のクロスバインタフェースへ出力する付記17記載のネットワークシステムの制御方法。
(付記20)
第1のクロスバインタフェースが受信したパケットをクロスバスイッチへ転送するステップと、
前記クロスバスイッチが前記第1のクロスバスイッチからのパケットの経路を通信経路選択アルゴリズムに基づいて決定された経路に切り替えて転送するステップと、
前記クロスバスイッチと前記第1のクロスバインタフェースに接続された第2のクロスバインタフェースが、前記クロスバスイッチからのパケット又は前記第1のクロスバインタフェースからのパケットをバイパスルートを介して受信するステップを含む、ネットワークシステムの制御方法。
(付記21)
前記第1のクロスバインタフェースからリクエストを発行して前記クロスバスイッチからパケットの送信を許可するグラントが与えられると前記第1のクロスバインタフェースが受信したパケットを前記クロスバスイッチへ出力すると共に、前記リクエストを発行して前記クロスバスイッチからグラントが与えられないと前記第1のクロスバインタフェースが受信したパケットを前記クロスバスイッチへ出力することなく前記バイパスルートを介して前記第2のクロスバインタフェースへ出力するステップを含む、付記20記載のネットワークシステムの制御方法。
(付記22)
前記第2のクロスバインタフェースが前記クロスバスイッチからのパケットと前記クロスバインタフェースからのパケットを入力し、使用する通信プロトコルに応じた排他制御によりいずれか一方のパケットを前記第2のクロスバインタフェースに接続されたノードに選択出力するステップを含む、付記20記載のネットワークシステムの制御方法。
(付記23)
前記第2のクロスバインタフェースが前記クロスバスイッチからのパケットと前記バイパスルートを介した前記第1のクロスバインタフェースからのパケットを同時に入力し、両方のデータとを仮想チャネルを用いて前記第2のクロスバインタフェースに接続されたノードに並列に転送する、付記20記載のネットワークシステムの制御方法。
以上、開示のネットワークシステム及び情報処理装置を実施例により説明したが、本発明は上記実施例に限定されるものではなく、本発明の範囲内で種々の変形及び改良が可能であることは言うまでもない。
11 ネットワークシステム
12 クロスバスイッチ
13−1〜13−4 クロスバインタフェース
14−1,14−2 バイパスルート
50,50−1〜50−6 ノード

Claims (8)

  1. 第1の計算を行った結果に基づき、パケットを送信する第1の計算ノードと、
    前記第1の計算ノードに接続され、前記第1の計算ノードからのパケットに含まれるヘッダを解析する第1の解析部と、
    前記第1の解析部に接続され、第1の要求を出力するとともに、出力した前記第1の要求に対する第1の許可を入力するまで前記第1の計算ノードからのパケットを第1のバッファに保持するとともに、前記第1の許可を入力した場合、前記第1の解析部によるヘッダの解析結果に応じて、前記第1のバッファに保持した前記第1の計算ノードからのパケットに基づき、第1のパケットと第2のパケットとを送信する第1の送信部と、
    前記第1の送信部に接続され、前記第1の送信部から入力した前記第1の要求に基づき、前記第1の許可を出力するとともに、前記第1の送信部からの第1のパケットを受信し、受信した第1のパケットの経路を切り換えるクロスバスイッチと、
    前記クロスバスイッチと前記第1の送信部とに接続され、前記クロスバスイッチからの第1のパケットと前記第1の送信部からの第2のパケットとを並列に受信する第2の受信部と、
    接続された前記第2の受信部から受信した第1のパケットと第2のパケットとに基づき、計算を行う第2の計算ノードを有する情報処理装置。
  2. 前記第2の受信部は、前記クロスバスイッチからの第1のパケットと前記第1の送信部からの第2のパケットとを同時に受信する請求項1記載の情報処理装置。
  3. 前記第2の計算ノードはさらに、第2の計算を行った結果に基づき、パケットを送信し、
    前記情報処理装置はさらに、前記第2の計算ノードに接続され、前記第2の計算ノードからのパケットに含まれるヘッダを解析する第2の解析部と、
    前記第2の解析部に接続され、第2の要求を出力するとともに、出力した前記第2の要求に対する第2の許可を入力するまで前記第2の計算ノードからのパケットを第2のバッファに保持するとともに、前記第2の許可を入力した場合、前記第2の解析部によるヘッダの解析結果に応じて、前記第2のバッファに保持した前記第2の計算ノードからのパケットに基づき、第3のパケットと第4のパケットとを送信する第2の送信部と、
    前記第2の送信部から入力した前記第2の要求に基づき、前記第2の許可を出力するとともに、前記第2の送信部からの第3のパケットを受信し、受信した第3のパケットの経路を切り換える前記クロスバスイッチと前記第2の送信部とに接続され、前記クロスバスイッチからの第3のパケットと前記第2の送信部からの第4のパケットとを並列に受信する第1の受信部とを有し、
    前記第1の計算ノードはさらに、接続された前記第1の受信部から受信した第3のパケットと第4のパケットとに基づき、計算を行う請求項1又は2記載の情報処理装置。
  4. 前記第1の受信部は、前記クロスバスイッチからの第3のパケットと前記第2の送信部からの第4のパケットとを同時に受信する請求項3記載の情報処理装置。
  5. 情報処理装置の制御方法において、
    前記情報処理装置が有する第1の計算ノードが、第1の計算を行った結果に基づき、パケットを送信し、
    前記情報処理装置が有する、前記第1の計算ノードに接続された第1の解析部が、前記第1の計算ノードからのパケットに含まれるヘッダを解析し、
    前記情報処理装置が有する、前記第1の解析部に接続された第1の送信部が、第1の要求を出力し、
    前記情報処理装置が有する、前記第1の送信部に接続されたクロスバスイッチが、前記第1の送信部から入力した前記第1の要求に基づき、第1の許可を出力し、
    前記第1の送信部が、出力した前記第1の要求に対する前記第1の許可を入力するまで前記第1の計算ノードからのパケットを第1のバッファに保持するとともに、前記第1の許可を入力した場合、前記第1の解析部によるヘッダの解析結果に応じて、前記第1のバッファに保持した前記第1の計算ノードからのパケットに基づき、第1のパケットと第2のパケットとを送信し、
    前記クロスバスイッチが、前記第1の送信部からの第1のパケットを受信し、受信した第1のパケットの経路を切り換え、
    前記情報処理装置が有する、前記クロスバスイッチと前記第1の送信部とに接続された第2の受信部が、前記クロスバスイッチからの第1のパケットと前記第1の送信部からの第2のパケットとを並列に受信し、
    前記情報処理装置が有する第2の計算ノードが、接続された前記第2の受信部から受信した第1のパケットと第2のパケットとに基づき、計算を行う情報処理装置の制御方法。
  6. 前記第2の受信部は、前記クロスバスイッチからの第1のパケットと前記第1の送信部からの第2のパケットとを同時に受信する請求項5記載の情報処理装置の制御方法。
  7. 前記第2の計算ノードはさらに、第2の計算を行った結果に基づき、パケットを送信し、
    前記情報処理装置が有する、前記第2の計算ノードに接続された第2の解析部が、前記第2の計算ノードからのパケットに含まれるヘッダを解析し、
    前記情報処理装置が有する、前記第2の解析部に接続された第2の送信部が、第2の要求を出力し、
    前記クロスバスイッチが、前記第2の送信部から入力した前記第2の要求に基づき、第2の許可を出力し、
    前記第2の送信部が、出力した前記第2の要求に対する前記第2の許可を入力するまで前記第2の計算ノードからのパケットを第2のバッファに保持するとともに、前記第2の許可を入力した場合、前記第2の解析部によるヘッダの解析結果に応じて、前記第2のバッファに保持した前記第2の計算ノードからのパケットに基づき、第3のパケットと第4のパケットとを送信し、
    前記クロスバスイッチが、前記第2の送信部からの第3のパケットを受信し、受信した第3のパケットの経路を切り換え、
    前記情報処理装置が有する第1の受信部が、前記クロスバスイッチからの第3のパケットと前記第2の送信部からの第4のパケットとを並列に受信し、
    前記第1の計算ノードはさらに、接続された前記第1の受信部から受信した第3のパケットと第4のパケットとに基づき、計算を行う請求項5又は6記載の情報処理装置の制御方法。
  8. 前記第1の受信部は、前記クロスバスイッチからの第3のパケットと前記第2の送信部からの第4のパケットとを同時に受信する請求項7記載の情報処理装置の制御方法。
JP2009185893A 2009-08-10 2009-08-10 情報処理装置及び情報処理装置の制御方法 Active JP5493575B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2009185893A JP5493575B2 (ja) 2009-08-10 2009-08-10 情報処理装置及び情報処理装置の制御方法
EP20100171928 EP2288084B1 (en) 2009-08-10 2010-08-04 Network system, information processing apparatus, and control method for network system
US12/805,588 US8589614B2 (en) 2009-08-10 2010-08-06 Network system with crossbar switch and bypass route directly coupling crossbar interfaces

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009185893A JP5493575B2 (ja) 2009-08-10 2009-08-10 情報処理装置及び情報処理装置の制御方法

Publications (2)

Publication Number Publication Date
JP2011039744A JP2011039744A (ja) 2011-02-24
JP5493575B2 true JP5493575B2 (ja) 2014-05-14

Family

ID=42797073

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009185893A Active JP5493575B2 (ja) 2009-08-10 2009-08-10 情報処理装置及び情報処理装置の制御方法

Country Status (3)

Country Link
US (1) US8589614B2 (ja)
EP (1) EP2288084B1 (ja)
JP (1) JP5493575B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5493575B2 (ja) * 2009-08-10 2014-05-14 富士通株式会社 情報処理装置及び情報処理装置の制御方法
JP5499902B2 (ja) * 2010-05-26 2014-05-21 セイコーエプソン株式会社 プロセッサーシステム
JP2012146201A (ja) 2011-01-13 2012-08-02 Toshiba Corp オンチップルータ及びそれを用いたマルチコアシステム
EP2690562A4 (en) * 2011-03-22 2017-03-01 Fujitsu Limited Parallel computing system and control method of parallel computing system
US8983218B2 (en) 2012-04-11 2015-03-17 Texas Instruments Incorporated Virtual boundary processing simplification for adaptive loop filtering (ALF) in video coding
US9081891B2 (en) * 2012-07-31 2015-07-14 Hewlett-Packard Development Company, L.P. Reconfigurable crossbar networks
CN109714294B (zh) * 2017-10-25 2020-07-14 华为技术有限公司 物理层芯片、网络安全设备及数据转发方法
US11502934B2 (en) * 2018-08-21 2022-11-15 The George Washington Univesity EZ-pass: an energy performance-efficient power-gating router architecture for scalable on-chip interconnect architecture

Family Cites Families (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6373460A (ja) * 1986-09-17 1988-04-04 Fujitsu Ltd 放送時におけるマルチプロセツサのネツトワ−ク構成方式
JPS63289666A (ja) * 1987-05-21 1988-11-28 Toyo Commun Equip Co Ltd コンピュ−タ・システム
US5179715A (en) * 1987-03-11 1993-01-12 Toyo Communication Co., Ltd. Multiprocessor computer system with process execution allocated by process managers in a ring configuration
JP2543878B2 (ja) * 1987-03-31 1996-10-16 株式会社東芝 並列処理システム
JPH02100151A (ja) * 1988-10-06 1990-04-12 Nec Corp 記憶アクセス制御装置
US5175824A (en) * 1989-05-08 1992-12-29 Trw Inc. Crossbar switch connected modular multiprocessor system with processor timing relationship selected and synchronized to be appropriate for function being performed
JP2770936B2 (ja) * 1990-12-18 1998-07-02 インターナショナル・ビジネス・マシーンズ・コーポレイション 通信ネットワークおよび通信チャンネルをつくる方法
US5822605A (en) * 1994-03-24 1998-10-13 Hitachi, Ltd. Parallel processor system with a broadcast message serializing circuit provided within a network
JP3504033B2 (ja) * 1994-06-29 2004-03-08 株式会社日立製作所 プロセッサ間データ転送方法及び並列計算機
JP2607851B2 (ja) * 1994-09-17 1997-05-07 株式会社東芝 プロセッサ間ルーティング方式
US5721842A (en) * 1995-08-25 1998-02-24 Apex Pc Solutions, Inc. Interconnection system for viewing and controlling remotely connected computers with on-screen video overlay for controlling of the interconnection switch
US6728258B1 (en) * 1995-11-15 2004-04-27 Hitachi, Ltd. Multi-processor system and its network
US5898826A (en) * 1995-11-22 1999-04-27 Intel Corporation Method and apparatus for deadlock-free routing around an unusable routing component in an N-dimensional network
US6094434A (en) * 1996-12-30 2000-07-25 Compaq Computer Corporation Network switch with separate cut-through buffer
US6285679B1 (en) * 1997-08-22 2001-09-04 Avici Systems, Inc. Methods and apparatus for event-driven routing
JP3037254B2 (ja) 1998-01-29 2000-04-24 甲府日本電気株式会社 多段クロスバおよびコンピュータ装置
DE19815097C2 (de) * 1998-04-03 2002-03-14 Siemens Ag Busmasterumschalteinheit
KR100277167B1 (ko) * 1998-06-05 2001-01-15 윤덕용 가상버스들을사용한연결망을갖는분산컴퓨팅시스템및데이터통신방법
JP3721283B2 (ja) * 1999-06-03 2005-11-30 株式会社日立製作所 主記憶共有型マルチプロセッサシステム
US6751698B1 (en) * 1999-09-29 2004-06-15 Silicon Graphics, Inc. Multiprocessor node controller circuit and method
US6751699B1 (en) * 2000-07-07 2004-06-15 Systran Corporation Fibre channel mini-hub powered by and supported within a host computer and directly controlled over a bus of the host computer
US6973078B2 (en) * 2001-04-20 2005-12-06 Sun Microsystems, Inc. Method and apparatus for implementing low latency crossbar switches with integrated storage signals
JP3607638B2 (ja) * 2001-05-01 2005-01-05 エヌイーシーコンピュータテクノ株式会社 クロスバ装置及びコンピュータ装置
US7088678B1 (en) * 2001-08-27 2006-08-08 3Com Corporation System and method for traffic shaping based on generalized congestion and flow control
US20040022094A1 (en) * 2002-02-25 2004-02-05 Sivakumar Radhakrishnan Cache usage for concurrent multiple streams
JP4338068B2 (ja) * 2002-03-20 2009-09-30 株式会社日立製作所 ストレージシステム
US8001266B1 (en) * 2003-03-31 2011-08-16 Stretch, Inc. Configuring a multi-processor system
US20050044320A1 (en) * 2003-08-19 2005-02-24 Sun Microsystems, Inc. Cache bank interface unit
US20050100035A1 (en) * 2003-11-11 2005-05-12 Avici Systems, Inc. Adaptive source routing and packet processing
US7852836B2 (en) * 2003-11-19 2010-12-14 Cray Inc. Reduced arbitration routing system and method
US7873693B1 (en) * 2004-02-13 2011-01-18 Habanero Holdings, Inc. Multi-chassis fabric-backplane enterprise servers
US7486619B2 (en) * 2004-03-04 2009-02-03 International Business Machines Corporation Multidimensional switch network
TWI274255B (en) * 2004-11-08 2007-02-21 Asustek Comp Inc Motherboard
US7502378B2 (en) * 2006-11-29 2009-03-10 Nec Laboratories America, Inc. Flexible wrapper architecture for tiled networks on a chip
US8151088B1 (en) * 2008-07-08 2012-04-03 Tilera Corporation Configuring routing in mesh networks
JP4868255B2 (ja) * 2008-09-24 2012-02-01 日本電気株式会社 プロセッサ、プロセッサの制御方法及び情報処理装置
JP2010218364A (ja) * 2009-03-18 2010-09-30 Fujitsu Ltd 情報処理システム、通信制御装置および方法
US8306042B1 (en) * 2009-06-19 2012-11-06 Google Inc. Class-based deterministic packet routing
JP5493575B2 (ja) * 2009-08-10 2014-05-14 富士通株式会社 情報処理装置及び情報処理装置の制御方法

Also Published As

Publication number Publication date
US20110035530A1 (en) 2011-02-10
EP2288084A3 (en) 2011-08-03
EP2288084B1 (en) 2014-04-09
JP2011039744A (ja) 2011-02-24
EP2288084A2 (en) 2011-02-23
US8589614B2 (en) 2013-11-19

Similar Documents

Publication Publication Date Title
JP5493575B2 (ja) 情報処理装置及び情報処理装置の制御方法
US9742630B2 (en) Configurable router for a network on chip (NoC)
US8819616B2 (en) Asymmetric mesh NoC topologies
KR101937211B1 (ko) 상호 연결에서 이종 채널 용량
EP2280513B1 (en) Router, information processing device having said router, and packet routing method
JP5083464B2 (ja) ネットワークオンチップとネットワークルーティング方法とシステム
US7889725B2 (en) Computer cluster
US10523599B2 (en) Buffer sizing of a NoC through machine learning
US9258358B2 (en) Parallel computing system and control method of parallel computing system
US7552270B2 (en) Signal transmission method, bridge unit, and information processing apparatus
Lahtinen et al. Comparison of synthesized bus and crossbar interconnection architectures
EP2405362B1 (en) A connection arrangement
CN115580572B (zh) 路由方法、路由节点、路由装置和计算机可读存储介质
Nambinina et al. Extension of the lisnoc (network-on-chip) with an axi-based network interface
US9497141B2 (en) Switch point having look-ahead bypass
Wu et al. Design and simulation of a torus structure and route algorithm for network on chip
Zulkefli et al. A efficacy of different buffer size on latency of network on chip (NoC)
US20230370392A1 (en) Network-on-chip architecture for handling different data sizes
Alimi et al. Network-on-Chip Topologies: Potentials, Technical Challenges, Recent Advances and Research Direction
JP5880169B2 (ja) バス回路
JP2017120542A (ja) 並列情報処理装置、データ転送方法及びデータ転送プログラム
Samanth et al. Design and Analysis of Four Port Router for Network-On-Chip Applications
JP2011193258A (ja) 半導体集積回路装置、経路決定回路及び経路決定方法
US11093436B2 (en) Arithmetic processing device, information processing apparatus, and control method of the arithmetic processing device
Prasad et al. Efasbran: error free adaptive shared buffer router architecture for network on chip

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120405

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130912

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131001

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131127

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131210

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140121

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140204

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140217

R150 Certificate of patent or registration of utility model

Ref document number: 5493575

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150