JPH06131309A - Parallel computer system - Google Patents

Parallel computer system

Info

Publication number
JPH06131309A
JPH06131309A JP28268192A JP28268192A JPH06131309A JP H06131309 A JPH06131309 A JP H06131309A JP 28268192 A JP28268192 A JP 28268192A JP 28268192 A JP28268192 A JP 28268192A JP H06131309 A JPH06131309 A JP H06131309A
Authority
JP
Japan
Prior art keywords
processing element
usable
program
network
execution program
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP28268192A
Other languages
Japanese (ja)
Inventor
Masaki Kawaguchi
正樹 川口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP28268192A priority Critical patent/JPH06131309A/en
Publication of JPH06131309A publication Critical patent/JPH06131309A/en
Pending legal-status Critical Current

Links

Landscapes

  • Multi Processors (AREA)

Abstract

PURPOSE:To execute a program without reloading a source program even under the environment of use for plural users or even when there is any unusable processing element. CONSTITUTION:A fault diagnostic program is loaded from a host computer 12 to a network, the fault processing element or disconnected communication line is detected in advance, and a usable PE number list 22 writing usable PE numbers is prepared. Next, the source program applied the temporary PE number is complied and linked at the host computer 12, afterwards, the provided executing program is applied to a PE number managing part 20, and the temporary PE number is converted to the usable PE number by referring to the usable PE number list 22. Thus, the usable PE number is applied to the executing program and afterwards, the executing program is loaded to the prescribed processing element.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】この発明は並列計算機システムに
関し、特にたとえば各処理要素に付与されたPE番号
(処理要素番号)に従ってデータを送受信する、並列計
算機システムに関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a parallel computer system, and more particularly to a parallel computer system that transmits and receives data according to a PE number (processing element number) assigned to each processing element.

【0002】[0002]

【従来の技術】従来より、並列計算機システムでは、各
処理要素で実行されるプログラムはソースプログラムの
段階で指定されており、ソースプログラムのコンパイル
およびリンクを行った後に、実行プログラムを各処理要
素へロードしていた。
2. Description of the Related Art Conventionally, in a parallel computer system, the program executed by each processing element is specified at the stage of the source program, and after the source program is compiled and linked, the execution program is sent to each processing element. Was loading.

【0003】[0003]

【発明が解決しようとする課題】このような従来の並列
計算機システムでは、複数のユーザが同時にプログラム
を実行しようとしたとき、使用するPE番号が重なれ
ば、ソースプログラムを書き換えて再びコンパイルおよ
びリンクを行うという作業が必要であった。また、並列
計算機システムが極めて多数の処理要素を含む場合に
は、その中のいくつかの処理要素は故障しているという
可能性が大きくなる。このとき、故障している処理要素
を検出した場合には、従来の並列計算機システムでは故
障した処理要素を使用しないように、ソースプログラム
を書き換えて再びコンパイルおよびリンクを行うという
作業を行わないと、各処理要素でプログラムを実行する
ことができなかった。
In such a conventional parallel computer system, when a plurality of users try to execute a program at the same time, if the PE numbers to be used overlap, the source program is rewritten to compile and link again. It was necessary to do the work. Further, when the parallel computer system includes a very large number of processing elements, there is a high possibility that some of the processing elements are out of order. At this time, when a faulty processing element is detected, in order to avoid using the faulty processing element in the conventional parallel computer system, it is necessary to rewrite the source program and compile and link again, The program could not be executed on each processing element.

【0004】それゆえに、この発明の主たる目的は、複
数のユーザが同一処理要素を使用しようとする環境下や
使用不能な処理要素が存在している場合であっても、ソ
ースプログラムを書き換えることなくプログラムを実行
できる、並列計算機システムを提供することである。
Therefore, the main object of the present invention is to rewrite a source program without rewriting even in an environment where a plurality of users try to use the same processing element or when there is an unusable processing element. It is to provide a parallel computer system capable of executing a program.

【0005】[0005]

【課題を解決するための手段】この発明は、各処理要素
で実行される実行プログラムに仮処理要素番号を付与す
る手段、実行プログラムの仮処理要素番号を使用可能処
理要素番号に変換する処理要素番号変換手段、および使
用可能処理要素番号に対応する処理要素に実行プログラ
ムをロードする手段を備える、並列計算機システムであ
る。
According to the present invention, a means for assigning a temporary processing element number to an execution program executed by each processing element, a processing element for converting a temporary processing element number of an execution program into a usable processing element number. A parallel computer system comprising number conversion means and means for loading an execution program into a processing element corresponding to an available processing element number.

【0006】[0006]

【作用】ソースプログラムに仮想的に取り扱われる仮P
E番号を付与して、ホスト計算機でソースプログラムの
コンパイルおよびリンクを行った後に実行プログラムを
得る。その実行プログラムをPE番号変換手段に与え
る。PE番号変換手段では、仮PE番号を使用可能PE
番号に変換した後、使用可能な各処理要素に所望のプロ
グラムをロードしていく。
[Function] Temporary P virtually handled by the source program
An E number is given to obtain an execution program after compiling and linking the source program with the host computer. The execution program is given to the PE number conversion means. A temporary PE number can be used with the PE number conversion means.
After converting into a number, a desired program is loaded into each available processing element.

【0007】[0007]

【発明の効果】この発明によれば、ソースプログラムを
書き換えることなく、自動的に仮PE番号を使用可能P
E番号に変換するので、複数のユーザが使用する環境下
や、使用不能な処理要素が存在している場合であっても
プログラムを実行することができる。
According to the present invention, the temporary PE number can be automatically used without rewriting the source program.
Since it is converted into the E number, the program can be executed even in an environment used by a plurality of users or even when there is an unavailable processing element.

【0008】この発明の上述の目的,その他の目的,特
徴および利点は、図面を参照して行う以下の実施例の詳
細な説明から一層明らかとなろう。
The above-mentioned objects, other objects, features and advantages of the present invention will become more apparent from the following detailed description of the embodiments with reference to the drawings.

【0009】[0009]

【実施例】図1を参照して、この実施例の並列計算機シ
ステム10はホスト計算機(これは上位ネットワークで
あってもよい)12を含む。ホスト計算機(または上位
ネットワーク)12は、仮PE番号を付与して作成され
たソースプログラムのコンパイルおよびリンクを行って
実行プログラムを得て、その実行プログラムをPE番号
変換部14へ送る。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENT Referring to FIG. 1, a parallel computer system 10 of this embodiment includes a host computer (which may be a host network) 12. The host computer (or host network) 12 compiles and links a source program created with a temporary PE number to obtain an execution program, and sends the execution program to the PE number conversion unit 14.

【0010】そして、PE番号変換部14で仮PE番号
を実際の使用可能PE番号に変換した後、実行プログラ
ムをインタフェース16を介してネットワーク18の所
定の処理要素に与える。インタフェース16は、バスイ
ンタフェースまたはプラスタインタフェースである。ネ
ットワーク18はメッシュ配列された多数の処理要素P
E(0,0)−PE(n,m)を含む。ネットワーク1
8上においては、処理要素PE(0,0)−PE(n,
m)はトーラスメッシュネットワークとして構成され
る。なお、トーラスメッシュネットワークとは、多数の
処理要素をマトリクス状に配置し、行方向の処理要素を
互いに循環的に結合しかつ列方向の処理要素を互いに循
環的に結合する行方向通信線RCおよび列方向通信線C
Cによって、任意の処理要素間におけるデータ通信を可
能にする構成を意味する。この実施例で言えば、第1行
に配列されたn個の処理要素PE(0,0)−PE
(n,0)は行方向通信線RC0によって循環的に(リ
ング状に)結合され、第2行に含まれる処理要素PE
(0,1)−PE(n,1)は行方向通信線RC1によ
って循環的に結合され、第m行の処理要素PE(0,
m)−PE(n,m)は行方向通信線RCmによって循
環的に結合される。さらに、第1列に配置されたm個の
処理要素PE(0,0)−PE(0,m)は列方向通信
線CC0によって循環的に結合され、第2列に含まれる
処理要素PE(1,0)−PE(1,m)は列方向通信
線CC1によって循環的に結合され、そして第n列の処
理要素PE(n,0)−PE(n,m)は列方向通信線
CCnによって循環的に結合される。
After the PE number converting unit 14 converts the temporary PE number into an actual usable PE number, the execution program is given to a predetermined processing element of the network 18 via the interface 16. The interface 16 is a bus interface or a plaster interface. The network 18 has a large number of processing elements P arranged in a mesh.
Includes E (0,0) -PE (n, m). Network 1
8 on the processing elements PE (0,0) -PE (n,
m) is configured as a torus mesh network. A torus mesh network is a row-direction communication line RC in which a large number of processing elements are arranged in a matrix and processing elements in the row direction are cyclically coupled to each other and processing elements in the column direction are cyclically coupled to each other. Column direction communication line C
By C, it means a configuration that enables data communication between arbitrary processing elements. In this embodiment, n processing elements PE (0,0) -PE arranged in the first row.
(N, 0) is cyclically (ring-shaped) coupled by the row-direction communication line RC0 and is included in the processing element PE included in the second row.
(0,1) -PE (n, 1) are cyclically coupled by the row-direction communication line RC1 and the processing element PE (0,0,0) of the m-th row is
m) -PE (n, m) are cyclically coupled by a row communication line RCm. Further, the m processing elements PE (0,0) -PE (0, m) arranged in the first column are cyclically coupled by the column direction communication line CC0, and the processing elements PE (included in the second column are 1,0) -PE (1, m) are cyclically coupled by a column direction communication line CC1, and the processing elements PE (n, 0) -PE (n, m) in the nth column are column direction communication lines CCn. Are cyclically combined by.

【0011】このトーラスメッシュネットワークにおい
ては、ホスト計算機12と各処理要素PE(0,0)−
PE(n,m)との間でデータを通信するために、各列
方向通信線CC0,CC1,・・・,CCnに、それぞ
れ、インサータとして、ネットワークインタフェースN
IFを挿入する。ここで注目すべきは、PE番号変換部
14であり、その内容および動作を説明する。図2に示
すように、PE番号変換部14はPE番号管理部20を
含み、さらにPE番号管理部20によって作成される使
用可能PE番号表22が含まれる。
In this torus mesh network, the host computer 12 and each processing element PE (0,0)-
In order to communicate data with PE (n, m), the network interface N is used as an inserter for each column direction communication line CC0, CC1, ..., CCn.
Insert IF. What should be noted here is the PE number conversion unit 14, and its contents and operation will be described. As shown in FIG. 2, the PE number conversion unit 14 includes a PE number management unit 20, and further includes a usable PE number table 22 created by the PE number management unit 20.

【0012】PE番号管理部20は図3に示すような使
用可能PE番号情報を有し、この情報によってPE番号
を管理する。使用可能PE番号情報のデータ構造として
は、図3に示すように、識別子,ネットワークサイズ,
PE番号の始点位置,次の領域リストへのポインタ,分
割した領域情報へのポインタによって構成される。識別
子には、たとえば「0」〜「3」が用いられ、「0」は
そのデータ構造が示す領域が未使用,「1」はそのデー
タ構造が示す領域が使用,「2」はその領域をより細か
な領域に分割,「3」はその領域が予備の処理要素であ
ることをそれぞれ示す。
The PE number management unit 20 has usable PE number information as shown in FIG. 3, and manages the PE number by this information. As the data structure of usable PE number information, as shown in FIG. 3, an identifier, a network size,
It is composed of the starting point position of the PE number, a pointer to the next area list, and a pointer to the divided area information. For example, "0" to "3" are used as the identifiers, "0" indicates that the area indicated by the data structure is unused, "1" indicates that the area indicated by the data structure is used, and "2" indicates that area. The area is divided into smaller areas, and "3" indicates that the area is a preliminary processing element.

【0013】処理要素でプログラムの実行が全く行われ
ていない最初の状態では、たとえば図4(A)に示すよ
うな処理要素全体の領域を表す使用可能PE番号情報が
ただ1個存在する。なお、このときのネットワークサイ
ズはn×mである。そして、ホスト計算機12からPE
番号変換部14を介してネットワーク18の各処理要素
へ故障診断プログラムをロードする。そして、故障して
いる処理要素が検出され、予備の処理要素を確保しなけ
ればならない場合には、図4(B)に示すような予備の
処理要素の領域に関する使用可能PE番号情報が生成さ
れ、図4(A)に示す使用可能PE番号情報とリンクさ
れる。
In the initial state where the program is not executed at all in the processing element, there is only one usable PE number information indicating the area of the entire processing element as shown in FIG. 4 (A). The network size at this time is n × m. Then, from the host computer 12 to PE
The failure diagnosis program is loaded into each processing element of the network 18 via the number conversion unit 14. Then, when the processing element in failure is detected and the backup processing element must be secured, usable PE number information regarding the area of the backup processing element as shown in FIG. 4B is generated. , And the available PE number information shown in FIG.

【0014】図5には、白抜きで使用可能な処理要素2
4,黒点を付すことによって予備の処理要素26,斜線
を付すことによって故障している処理要素28が示され
る。このように故障している処理要素28が検出される
ため、図5の場合では、列方向に予備の処理要素26が
確保されている。このように、故障した処理要素が検出
されると、行方向の一部,列方向の一部,または行方向
および列方向の双方の一部が、予備の処理要素として確
保され、故障した処理要素の代わりに用いられる。この
とき、予備の処理要素としては、故障した処理要素がな
るべく分散する方向に確保され、予備の処理要素が行方
向に確保されれば同一y方向の予備の処理要素が選択さ
れ、予備の処理要素が列方向に確保されれば同一x方向
の予備の処理要素が選択される。図5の場合では、列方
向に故障した処理要素が並んでいるので、列方向に予備
の処理要素26が確保され、同一x方向の予備の処理要
素26が選択される。そして、ネットワーク18のサイ
ズは、図4(A)に示すように、予備の処理要素として
確保した分だけ小さくされ((n−1)×m)、図5の
場合にはネットワーク18のサイズが1列分小さくされ
る。
FIG. 5 shows a processing element 2 that can be used without a white line.
4, the spare processing elements 26 are indicated by black dots, and the defective processing elements 28 are indicated by hatching. Since the faulty processing element 28 is detected in this way, in the case of FIG. 5, the spare processing element 26 is secured in the column direction. In this way, when a failed processing element is detected, a part in the row direction, a part in the column direction, or a part in both the row direction and the column direction is secured as a spare processing element, and the failed processing element is secured. Used instead of an element. At this time, as the spare processing elements, the failed processing elements are secured in a direction as dispersed as possible, and if the spare processing elements are secured in the row direction, the spare processing elements in the same y direction are selected, and the spare processing elements are selected. If the elements are secured in the column direction, a spare processing element in the same x direction is selected. In the case of FIG. 5, since the failed processing elements are arranged in the column direction, the spare processing elements 26 are secured in the column direction, and the spare processing elements 26 in the same x direction are selected. Then, as shown in FIG. 4A, the size of the network 18 is reduced by the amount secured as a spare processing element ((n−1) × m), and in the case of FIG. It is reduced by one column.

【0015】また、図6に示すように、処理要素間を接
続している通信線の一部がたとえば切断などによって使
用できなくなる場合がある。図6に示すように、切断さ
れた通信線が列方向の一部である場合、並列計算機シス
テム10が、常に最短距離を通ってデータを送信する機
能を有していれば、列方向の処理要素へのデータ送信は
通信不能となる可能性がある。したがって、その場合に
は切断された通信線を含む列の処理要素30(通信線の
切断により通信できない処理要素)を飛ばして、すなわ
ち、その列の処理要素30にプログラムをロードしない
で隣の列の処理要素を代用し、その処理要素にプログラ
ムをロードする。このように通信できない処理要素が予
め検出された場合にも、上述と同様に予備の処理要素が
確保されることはいうまでもない。なお、切断した通信
線の個所が行方向であれば、行方向の処理要素を飛ばし
て隣の処理要素にプログラムをロードする。なお、ネッ
トワーク18における各処理要素のPE番号は、x方向
のPE番号およびy方向のPE番号の2つで指定され
る。
Further, as shown in FIG. 6, a part of the communication line connecting the processing elements may become unusable due to, for example, disconnection. As shown in FIG. 6, when the disconnected communication line is a part in the column direction, if the parallel computer system 10 has a function of always transmitting data through the shortest distance, processing in the column direction is performed. Sending data to an element can result in loss of communication. Therefore, in that case, the processing element 30 in the column including the disconnected communication line (the processing element that cannot communicate due to the disconnection of the communication line) is skipped, that is, the program is not loaded into the processing element 30 in the column and the adjacent column is processed. The processing element of is substituted, and the program is loaded into the processing element. Needless to say, even when a processing element that cannot communicate is detected in advance, a spare processing element is secured as described above. If the disconnected communication line is in the row direction, the processing element in the row direction is skipped and the program is loaded into the adjacent processing element. The PE number of each processing element in the network 18 is designated by two, a PE number in the x direction and a PE number in the y direction.

【0016】また、PE番号管理部20は使用可能PE
番号表22を作成するが、上述のように、ネットワーク
18に故障診断プログラムをロードすることによって、
処理要素が故障したり通信線の一部が切断され、使用不
能な処理要素を検出すると、PE番号管理部20は、た
とえば図7に示すように、使用可能PE番号が書き込ま
れた使用可能PE番号表22を作成する。図7では、た
とえば7×5の処理要素がネットワーク18に含まれて
おり、そのうちいくつかの処理要素が故障し、また一部
の通信線が切断されている。具体的には、PE番号が
(1,2)および(0,4)の処理要素が故障してお
り、それぞれ予備の処理要素として、(6,2)および
(6,4)の処理要素が与えられている。また、一部の
通信線が切断されているために、x方向のPE番号が3
の処理要素はすべて使用不能となっており、x方向のP
E番号が3の処理要素は使用可能PE番号表には存在し
ておらず、その代わりに(4,0),(4,1),
(4,2),(6,3),(4,4)のPE番号の処理
要素が用いられる。ここで、(4,3)のPE番号の処
理要素も故障しているので、その代わりに(6,3)の
PE番号の処理要素が用いられる。それに伴って、x方
向のPE番号が4の処理要素には、(5,0)〜(5,
4)のPE番号の処理要素が用いられる。このように、
故障やネットワークの一部の切断によって使用不能な処
理要素を用いない。
Further, the PE number management unit 20 is a usable PE.
The number table 22 is created, but by loading the failure diagnosis program into the network 18 as described above,
When an unusable processing element is detected due to a processing element failure or a part of the communication line being cut off, the PE number management unit 20 determines that the usable PE number in which the usable PE number is written as shown in FIG. 7, for example. The number table 22 is created. In FIG. 7, for example, 7 × 5 processing elements are included in the network 18, some of the processing elements have failed, and some of the communication lines have been disconnected. Specifically, the processing elements with PE numbers (1, 2) and (0, 4) have failed, and the processing elements with (6, 2) and (6, 4) are the backup processing elements, respectively. Has been given. In addition, the PE number in the x direction is 3 because some communication lines are disconnected.
All processing elements of P are unusable, and P in the x direction is
The processing element with an E number of 3 does not exist in the available PE number table, and instead (4,0), (4,1),
Processing elements with PE numbers of (4, 2), (6, 3) and (4, 4) are used. Here, since the processing element with the PE number of (4, 3) has also failed, the processing element with the PE number of (6, 3) is used instead. Along with that, the processing elements with the PE number of 4 in the x direction are (5, 0) to (5,
The processing element of PE number 4) is used. in this way,
Do not use unusable processing elements due to failure or disconnection of part of the network.

【0017】したがって、後述のように変換後のPE番
号が与えられ、そのPE番号のx方向の値とy方向の値
を基にして使用可能PE番号表を検索したとき、該当す
るPE番号がなくても、代用のPE番号が確保されてい
るので、使用不能な処理要素にプログラムがロードされ
ることはない。たとえば、変換後のx方向のPE番号が
1でy方向のPE番号が2のとき、使用可能PE番号表
を検出して与えられるPE番号は(6,2)となる。
Therefore, the PE number after conversion is given as described later, and when the usable PE number table is searched based on the values in the x direction and the y direction of the PE number, the corresponding PE number is found. Even if it does not exist, since the substitute PE number is reserved, the program will not be loaded into an unusable processing element. For example, when the converted PE number in the x direction is 1 and the converted PE number in the y direction is 2, the PE number given by detecting the usable PE number table is (6, 2).

【0018】このように、故障診断プログラムをネット
ワーク18の各処理要素にロードし、必要に応じて予備
処理要素領域に関する使用可能PE番号情報および使用
可能PE番号表を作成した後、実行プログラムをネット
ワーク18にロードする。ここではまず、仮PE番号が
2次元のPE番号で表現された実行プログラムについて
説明する。
In this way, after the failure diagnosis program is loaded into each processing element of the network 18 and the usable PE number information and the usable PE number table concerning the preliminary processing element area are created as necessary, the execution program is executed on the network. Load on 18. Here, first, an execution program in which the temporary PE number is expressed by a two-dimensional PE number will be described.

【0019】前提として、実行プログラム10のたとえ
ば先頭部分に、実行プログラムが使用する処理要素のネ
ットワークサイズのデータが、予めセットされているも
のとする。このとき、ネットワーク18に実装されてい
る処理要素のネットワークサイズ(処理要素数)が、実
装プログラム中で指定された2次元のPE番号のサイズ
よりも大きい場合には、図8に示すように、実装された
処理要素の一部をこの実行プログラムに割り当てる処理
を行う。このとき、図4(C)に示すような使用可能P
E番号情報が作成される。また、残りの未使用処理要素
については、別の実行プログラムのロード要求発生時に
処理要素を割り当てられるように、図4(D)〜(F)
に示す未使用領域1〜未使用領域3のような使用可能P
E番号情報が作成・管理される。
As a premise, it is assumed that the network size data of the processing elements used by the execution program is set in advance at the beginning of the execution program 10, for example. At this time, when the network size (the number of processing elements) of the processing elements mounted on the network 18 is larger than the size of the two-dimensional PE number designated in the mounting program, as shown in FIG. A process of assigning a part of the implemented processing elements to this execution program is performed. At this time, the usable P as shown in FIG.
E number information is created. Further, regarding the remaining unused processing elements, processing elements can be allocated so that processing elements can be allocated when a load request of another execution program occurs, as shown in FIGS.
Available P such as unused area 1 to unused area 3 shown in
E number information is created and managed.

【0020】すなわち、或る実行プログラムのロード要
求が発生すると、図4(C)に示す使用可能PE番号情
報が作成され、PE番号が(0,0)の処理要素を始点
として、実行プログラム中で指定されたネットワークサ
イズ分の処理要素が使用領域1として指定される。この
指定により、残りの領域は図8に示すようにたとえば3
分割され、それぞれ未使用領域1〜3として、図4
(D)〜(F)の使用可能PE番号情報が生成される。
ここで未使用領域は必ずしも3分割されるのではなく、
たとえば使用領域のx方向のサイズが全体領域のx方向
のサイズと一致したり、使用領域のy方向のサイズが全
体領域のy方向のサイズと一致すれば、未使用領域は1
つの場合もあり得る。そして、図4のように生成された
使用可能PE番号情報は、リスト構造の形でそれぞれポ
インタで結ばれる。また、図4(C)〜(F)の使用可
能PE番号情報は、図4(A)に示す全体領域の使用可
能PE番号情報に結ばれ、情報の検索が可能となる。
That is, when a load request for a certain execution program is generated, usable PE number information shown in FIG. 4C is created, and the processing element having a PE number of (0,0) is used as a starting point in the execution program. The processing elements corresponding to the network size designated by are designated as the usage area 1. By this designation, the remaining area is, for example, 3 as shown in FIG.
4 is divided into unused areas 1 to 3, respectively.
The usable PE number information of (D) to (F) is generated.
Here, the unused area is not necessarily divided into three,
For example, if the size of the used area in the x direction matches the size of the entire area in the x direction, or the size of the used area in the y direction matches the size of the entire area in the y direction, the unused area is 1
There can be two cases. The usable PE number information generated as shown in FIG. 4 is linked by pointers in the form of a list structure. The usable PE number information of FIGS. 4C to 4F is tied to the usable PE number information of the entire area shown in FIG. 4A, and the information can be searched.

【0021】そして、図8に示すように割り当てられた
処理要素の使用領域1について、PE番号管理部20で
PE番号変換が行われる。すなわち、仮PE番号が2次
元のPE番号で表現された実行プログラムを、ネットワ
ーク18の各処理要素にロードする場合、図9に示す動
作によって処理される。図9に示すステップS1におい
て、実行プログラムに記述されたx方向のPE番号を、
実装されているネットワーク18のx方向のサイズで割
り、ステップS3において、その余りをx方向のPE番
号とする。次いで、ステップS5において、実行プログ
ラムに記述されたy方向のPE番号を、実装されている
ネットワーク18のy方向のサイズで割り、ステップS
7においてその余りをy方向のPE番号とする。このと
き、ステップS1ないしS7で与えられたPE番号のx
方向の値とy方向の値とを基にして使用可能PE番号表
22を検索し、順次PE番号変換が実行される。ここ
で、変換後のPE番号が使用不能な処理要素に該当すれ
ば、予備の処理要素が代用される。図7でいえば、たと
えばx方向のPE番号が1でy方向のPE番号が2のと
きには、使用可能PE番号表22を検索して与えられる
使用可能PE番号は(6,2)となる。そして、ステッ
プS9において、指定された使用可能PE番号の処理要
素に、それぞれ実行プログラムをロードする。
Then, as shown in FIG. 8, the PE number management unit 20 performs PE number conversion on the used area 1 of the allocated processing element. That is, when the execution program in which the temporary PE number is expressed by a two-dimensional PE number is loaded on each processing element of the network 18, the execution program is processed by the operation shown in FIG. In step S1 shown in FIG. 9, the PE number in the x direction written in the execution program is
It is divided by the size of the mounted network 18 in the x direction, and the remainder is taken as the PE number in the x direction in step S3. Next, in step S5, the PE number in the y direction described in the execution program is divided by the size in the y direction of the installed network 18, and the step S5 is performed.
In FIG. 7, the remainder is the PE number in the y direction. At this time, x of the PE number given in steps S1 to S7
The usable PE number table 22 is searched based on the value of the direction and the value of the y direction, and the PE number conversion is sequentially executed. Here, if the PE number after conversion corresponds to an unusable processing element, a spare processing element is substituted. In FIG. 7, for example, when the PE number in the x direction is 1 and the PE number in the y direction is 2, the usable PE number given by searching the usable PE number table 22 is (6, 2). Then, in step S9, the execution programs are loaded into the processing elements having the specified usable PE numbers.

【0022】実行プログラムの終了後、PE番号管理部
20は、使用していた領域情報の識別子すなわち図4
(C)の使用領域1の識別子を未使用にする(1→
0)。また、図4(C)〜(F)のような同じレベルの
使用可能PE番号情報をチェックし、全ての使用可能P
E番号情報の識別子が未使用すなわち「0」であれば、
これらの使用可能PE番号情報を1つにまとめる操作を
行う。図4の例では、図4(A)に示す使用可能PE番
号情報に結ばれる図4(C)〜(F)に示す各使用可能
PE番号情報が全て未使用となれば、図4(C)〜
(F)に示す分割された使用可能PE番号情報を消去
し、図4(A)に示す全体領域の使用可能PE番号情報
の識別子を未使用すなわち「0」にする。
After the execution program is finished, the PE number management unit 20 determines the identifier of the area information used, that is, FIG.
The identifier of the used area 1 in (C) is made unused (1 →
0). In addition, the available PE number information of the same level as shown in FIGS. 4C to 4F is checked, and all available P numbers are checked.
If the identifier of the E number information is unused, that is, "0",
An operation of collecting these usable PE number information into one is performed. In the example of FIG. 4, if all of the usable PE number information shown in FIGS. 4C to 4F linked to the usable PE number information shown in FIG. ) ~
The divided usable PE number information shown in (F) is erased, and the identifier of the usable PE number information in the entire area shown in FIG. 4A is unused, that is, "0".

【0023】なお、或るプログラムがいくつかの処理要
素を使用して実行されている状態で、別のプログラムを
ロードする場合、PE番号管理部20は図4のように生
成された使用可能PE番号情報から、未使用状態の領域
を探す。或る領域が未使用で、かつその領域のサイズが
実行プログラムが使用する処理要素のサイズよりも大き
い場合には、その領域の一部を使用領域として割り当
て、残りの領域を、上述と同様に、未使用領域としてさ
らに3分割する。
When one program is being executed by using some processing elements and another program is loaded, the PE number management unit 20 uses the available PEs generated as shown in FIG. Search the unused area from the number information. When a certain area is unused and the size of the area is larger than the size of the processing element used by the execution program, a part of the area is allocated as a used area, and the remaining area is the same as above. , Is further divided into three as unused areas.

【0024】また、実行プログラムが使用する処理要素
のサイズが未使用領域よりも大きい場合には、たとえば
図4で示す未使用領域1と未使用領域3,もしくは未使
用領域2と未使用領域3とを合わせた領域のサイズと大
小比較される。2つの未使用領域を合わせた領域が、実
行プログラムが使用する処理要素のサイズより小さい場
合には、未使用領域1と未使用領域3,もしくは未使用
領域2と未使用領域3とのそれぞれの組合せのうち、大
きい方の領域の組合せを選択し、これを1個の領域とす
る。そして図9に示す動作によってPE番号が変換され
る。
When the size of the processing element used by the execution program is larger than the unused area, the unused area 1 and the unused area 3, or the unused area 2 and the unused area 3 shown in FIG. 4, for example, are used. The size is compared with the size of the combined area. When the area obtained by combining the two unused areas is smaller than the size of the processing element used by the execution program, the unused area 1 and the unused area 3, or the unused area 2 and the unused area 3 are respectively Of the combinations, the combination of the larger areas is selected, and this is set as one area. Then, the PE number is converted by the operation shown in FIG.

【0025】このように、PE番号管理部20では、複
数ユーザが使用する環境下や複数ジョブ実行時におい
て、各実行プログラムに対する処理要素の割り当てを管
理する。また、各処理要素の使用状況を管理するため
に、図4のような処理要素の使用状況に関する使用可能
PE番号情報を生成する。さらに、処理要素の一部が故
障したり、通信線の一部が切断している場合に対応でき
るように、図7に示すような使用可能PE番号表を作成
し、この使用可能PE番号表を検索しPE番号を変換す
ることで、実際にロードする処理要素が決定される。
As described above, the PE number management unit 20 manages the allocation of processing elements to each execution program under the environment used by a plurality of users and when a plurality of jobs are executed. In order to manage the usage status of each processing element, usable PE number information regarding the usage status of the processing element as shown in FIG. 4 is generated. Further, in order to cope with the case where a part of the processing element is broken down or a part of the communication line is disconnected, a usable PE number table as shown in FIG. 7 is created, and this usable PE number table is prepared. And the PE number is converted to determine the processing element to be actually loaded.

【0026】以上は、並列計算機システム10に実装さ
れている処理要素のネットワークサイズが実行プログラ
ム中で指定された2次元のPE番号のサイズよりも大き
い場合について述べたが、逆に、実装されている処理要
素のネットワークサイズが、実行プログラム中で指定さ
れた2次元のPE番号のサイズよりも小さい場合には、
実装された処理要素全てを実行プログラムに割り当て
る。その際の割り当て方式すなわちPE番号の変換は、
上述の図9の動作によって行われる。
The case where the network size of the processing elements installed in the parallel computer system 10 is larger than the size of the two-dimensional PE number specified in the execution program has been described above. If the network size of the existing processing element is smaller than the size of the two-dimensional PE number specified in the execution program,
All the implemented processing elements are assigned to the execution program. At that time, the allocation method, that is, the PE number conversion,
This is performed by the operation of FIG. 9 described above.

【0027】また、仮PE番号を図10に示すように1
次元のPE番号(PE0〜PEn)で表現された実行プ
ログラムを、図11で示すようなネットワーク18の各
処理要素にロードする場合について述べる。このネット
ワーク18では、PE番号が大きくなるに従って、矢印
の順に各処理要素へプログラムをロードしていく。この
ネットワーク18のサイズは、x方向はn,y方向はm
である。
The temporary PE number is 1 as shown in FIG.
A case will be described in which an execution program represented by dimension PE numbers (PE0 to PEn) is loaded into each processing element of the network 18 as shown in FIG. In this network 18, as the PE number increases, the program is loaded into each processing element in the order of the arrow. The size of this network 18 is n in the x direction and m in the y direction.
Is.

【0028】前提として、まず実行プログラム中で指定
される処理要素の数が、実装されているネットワーク1
8内に収まるかどうかを判断し、収まる場合には、ネッ
トワーク18の処理要素の全体領域を使用領域と未使用
領域とに分割する。このとき図4に示すような使用可能
PE番号情報が生成される。なお、未使用領域は3分割
に限定されず、1つの未使用領域となることもある。
As a premise, first, the number of processing elements specified in the execution program depends on the installed network 1.
It is determined whether or not it is within 8, and if it is within, the entire area of the processing elements of the network 18 is divided into a used area and an unused area. At this time, usable PE number information as shown in FIG. 4 is generated. Note that the unused area is not limited to three divisions, and may be one unused area.

【0029】次いでPE番号変換動作を、図12を参照
して説明する。まず、ステップS11においてPE番号
をnで割り、ステップS13においてPE番号/nの商
がmより小さいか否かを判断する。この商がmより小さ
いときにはステップS15において、商の値をy方向の
PE番号とする。一方、ステップS13において商がm
より小さい場合には、ステップS17において商の値を
mで割り、ステップS19においてその余りをy方向の
PE番号とする。ステップS15およびS19の処理
後、ステップS21に進み、ステップS21において仮
PE番号/nの商が偶数であるか否かを判断する。商が
偶数であれば、ステップS23においてその余りをx方
向のPE番号とし、ステップS21においてその商が奇
数であればステップS25において(n−余り−1)を
x方向のPE番号とする。このとき、変換後のPE番号
が、使用不能な処理要素に該当する場合には、その代わ
りに用いられる予備の処理要素が選択され、そのPE番
号が付与される。たとえば図5の例では、同一x方向の
予備の処理要素が選択される。そして、ステップS23
およびS25の処理後ステップS27に進み、ステップ
S27において指定された使用可能PE番号の処理要素
に実行プログラムをロードしていく。このようにして、
仮PE番号が1次元のPE番号で表現された実行プログ
ラムを、ネットワーク18の各処理要素へロードする。
Next, the PE number conversion operation will be described with reference to FIG. First, in step S11, the PE number is divided by n, and in step S13, it is determined whether the quotient of the PE number / n is smaller than m. When this quotient is smaller than m, the value of the quotient is set to the PE number in the y direction in step S15. On the other hand, in step S13, the quotient is m
If it is smaller, the quotient value is divided by m in step S17, and the remainder is taken as the PE number in the y direction in step S19. After the processes of steps S15 and S19, the process proceeds to step S21, and it is determined in step S21 whether the quotient of the temporary PE number / n is an even number. If the quotient is an even number, the remainder is set as the PE number in the x direction in step S23, and if the quotient is an odd number in step S21, (n-remainder-1) is set as the PE number in the x direction in step S25. At this time, when the PE number after conversion corresponds to an unusable processing element, a spare processing element to be used instead is selected and the PE number is assigned. For example, in the example of FIG. 5, spare processing elements in the same x direction are selected. And step S23
After the processing of S25 and S25, the process proceeds to step S27, and the execution program is loaded into the processing element of the usable PE number designated in step S27. In this way
The execution program in which the temporary PE number is expressed by a one-dimensional PE number is loaded into each processing element of the network 18.

【0030】さらに、仮PE番号が、3次元方向(x,
y,z)のPE番号で表現された実行プログラムを、ネ
ットワーク18の各処理要素へロードする場合には、実
行プログラム中で記述された処理要素のネットワークサ
イズ(l,m,n)から、サイズが大きい2つのPE番
号の方向を取り出し、この2つのPE番号の情報を基に
図9と同じ割付方式(PE番号変換方式)でPE番号を
変換し、実際の処理要素に実行プログラムをロードす
る。
Further, if the temporary PE number is three-dimensional (x,
When the execution program represented by the PE number of (y, z) is loaded into each processing element of the network 18, the size is calculated from the network size (l, m, n) of the processing element described in the execution program. Of the two PE numbers having a large number are extracted, the PE number is converted by the same allocation method (PE number conversion method) as in FIG. 9 based on the information of the two PE numbers, and the execution program is loaded into the actual processing element. .

【0031】なお、この実施例では、使用可能PE番号
が書き込まれた使用可能PE番号表22を作成したが、
これに限定されず、使用不能な処理要素のPE番号が書
き込まれた使用不能PE番号表を作成してもよい。この
場合、使用不能なPE番号についても図4に示すような
PE番号情報を作成する。そして、変換後のPE番号が
使用不能PE番号表に存在するか否かを判断し、存在し
ない場合には変換後のPE番号を使用可能PE番号と
し、存在する場合には予備処理要素の中から適当な処理
要素を選んで代用する。
In this embodiment, the usable PE number table 22 in which the usable PE numbers are written is prepared.
The present invention is not limited to this, and an unusable PE number table in which PE numbers of unusable processing elements are written may be created. In this case, PE number information as shown in FIG. 4 is also created for unusable PE numbers. Then, it is determined whether or not the converted PE number exists in the unusable PE number table, and if it does not exist, the converted PE number is used as the usable PE number. Select an appropriate processing element from the list and substitute it.

【図面の簡単な説明】[Brief description of drawings]

【図1】この発明の一実施例を示すブロック図である。FIG. 1 is a block diagram showing an embodiment of the present invention.

【図2】PE番号変換部を示すブロック図である。FIG. 2 is a block diagram showing a PE number conversion unit.

【図3】使用可能PE番号情報の基本データ構造を示す
図解図である。
FIG. 3 is an illustrative view showing a basic data structure of usable PE number information.

【図4】生成される使用可能PE番号情報の一例を示す
図解図である。
FIG. 4 is an illustrative view showing one example of usable PE number information generated.

【図5】個々の処理要素が故障している場合のPE番号
の割り当て処理を示す図解図である。
FIG. 5 is an illustrative view showing a PE number allocation process when an individual processing element is out of order.

【図6】処理要素間の通信線の一部が切断された状態を
示す図解図である。
FIG. 6 is an illustrative view showing a state in which a part of a communication line between processing elements is disconnected.

【図7】使用可能PE番号表の一例を示す図解図であ
る。
FIG. 7 is an illustrative view showing one example of a usable PE number table.

【図8】処理要素使用領域の割り当て状態を示す図解図
である。
FIG. 8 is an illustrative view showing a state of allocation of processing element use areas.

【図9】2次元のPE番号で表現された実行プログラム
を、2次元格子でかつトーラス状のネットワークの各処
理要素にロードする動作を示すフロー図である。
FIG. 9 is a flowchart showing an operation of loading an execution program represented by a two-dimensional PE number into each processing element of a two-dimensional lattice and torus network.

【図10】1次元のPE番号で表現された実行プログラ
ムを示す図解図である。
FIG. 10 is an illustrative view showing an execution program expressed by a one-dimensional PE number.

【図11】2次元格子でかつトーラス状のネットワーク
に実行プログラムをロードする状態を示す図解図であ
る。
FIG. 11 is an illustrative view showing a state in which an execution program is loaded on a two-dimensional lattice and torus network.

【図12】1次元のPE番号で表現されたプログラム
を、2次元格子でかつトーラス状のネットワークの各処
理要素にロードする動作を示すフロー図である。
FIG. 12 is a flowchart showing an operation of loading a program expressed by a one-dimensional PE number into each processing element of a two-dimensional lattice and torus network.

【符号の説明】[Explanation of symbols]

10 …並列計算機システム 12 …ホスト計算機 14 …PE番号変換部 18 …ネットワーク 20 …PE番号管理部 22 …使用可能PE番号表 10 ... Parallel computer system 12 ... Host computer 14 ... PE number conversion unit 18 ... Network 20 ... PE number management unit 22 ... Usable PE number table

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】各処理要素で実行される実行プログラムに
仮処理要素番号を付与する手段、 前記実行プログラムの仮処理要素番号を使用可能処理要
素番号に変換する処理要素番号変換手段、および前記使
用可能処理要素番号に対応する処理要素に前記実行プロ
グラムをロードする手段を備える、並列計算機システ
ム。
1. A means for assigning a temporary processing element number to an execution program executed by each processing element, a processing element number conversion means for converting a temporary processing element number of the execution program into a usable processing element number, and the use. A parallel computer system comprising means for loading the execution program into a processing element corresponding to a possible processing element number.
JP28268192A 1992-10-21 1992-10-21 Parallel computer system Pending JPH06131309A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP28268192A JPH06131309A (en) 1992-10-21 1992-10-21 Parallel computer system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP28268192A JPH06131309A (en) 1992-10-21 1992-10-21 Parallel computer system

Publications (1)

Publication Number Publication Date
JPH06131309A true JPH06131309A (en) 1994-05-13

Family

ID=17655676

Family Applications (1)

Application Number Title Priority Date Filing Date
JP28268192A Pending JPH06131309A (en) 1992-10-21 1992-10-21 Parallel computer system

Country Status (1)

Country Link
JP (1) JPH06131309A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002541586A (en) * 1999-04-09 2002-12-03 クリアスピード・テクノロジー・リミテッド Parallel data processing device

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002541586A (en) * 1999-04-09 2002-12-03 クリアスピード・テクノロジー・リミテッド Parallel data processing device
JP2011023036A (en) * 1999-04-09 2011-02-03 Rambus Inc Parallel data processing apparatus
JP2011023037A (en) * 1999-04-09 2011-02-03 Rambus Inc Parallel data processing apparatus

Similar Documents

Publication Publication Date Title
US6341308B1 (en) Input/output device information management system for multi-computer system
EP1465072B1 (en) Computer system with distributed file system for managing distributed files
JP4902282B2 (en) Business system configuration change method, management computer, and business system configuration change program
CN110990432A (en) Device and method for synchronizing distributed cache clusters across machine rooms
US5838949A (en) System and method for execution-sequenced processing of electronic design simulation results
CN113382077B (en) Micro-service scheduling method, micro-service scheduling device, computer equipment and storage medium
CN110427258A (en) Scheduling of resource control method and device based on cloud platform
CN111984729A (en) Heterogeneous database data synchronization method, device, medium and electronic equipment
CN111291062B (en) Data synchronous writing method and device, computer equipment and storage medium
JP5272185B2 (en) Computer system and storage system
JPH06131309A (en) Parallel computer system
US20050086665A1 (en) Autonomous device driver
CN112286580B (en) Method and device for processing pipeline operation and computer equipment
JP2016051395A (en) Image forming apparatus and resource management method
JP3941597B2 (en) Logical partitioned computer system
JPH07306795A (en) Data base equivalent processor of duplex system computer
JP2006146434A (en) Distributed application test method and distributed application test equipment
CN111884904B (en) Method and device for dynamically managing vxlan tunnel based on equipment configuration
JP2674907B2 (en) Computer system DMA channel allocation device
JP2005250722A (en) Sequential execution method for input/output dynamic reconfiguration
CN117950690A (en) Container group upgrading method, device, equipment, storage medium and program product
CN115586963A (en) Distributed micro-service research and development platform
JPH086834A (en) System and method for file resource management
KR100551834B1 (en) Composite Link Management Method in Network Management System
CN116010022A (en) Prest automatic expansion system, method and medium

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20010529