JPH06332874A - テストプログラム起動方法 - Google Patents

テストプログラム起動方法

Info

Publication number
JPH06332874A
JPH06332874A JP5121049A JP12104993A JPH06332874A JP H06332874 A JPH06332874 A JP H06332874A JP 5121049 A JP5121049 A JP 5121049A JP 12104993 A JP12104993 A JP 12104993A JP H06332874 A JPH06332874 A JP H06332874A
Authority
JP
Japan
Prior art keywords
job
test program
processor element
processor
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP5121049A
Other languages
English (en)
Inventor
Eriko Nakakuki
江里子 中茎
Yasuhiko Nakajima
康彦 中島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP5121049A priority Critical patent/JPH06332874A/ja
Publication of JPH06332874A publication Critical patent/JPH06332874A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Multi Processors (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)

Abstract

(57)【要約】 【目的】 本発明はテストプログラム起動方法に関し、
テストプログラムのオーバーヘッドを減らすと同時に、
ハードウエア障害が検出された際に、異常終了すべきジ
ョブを最小限に抑えることを目的とする。 【構成】 オペレーティングシステムOSi(i=0、
1、2・・)を有する複数のプロセッサエレメントPE
i(i=0、1、2・・)を具備し、各プロセッサエレ
メント内に、各OSの配下で実行させるハードウエア障
害検出用のテストプログラムを格納したマルチプロセッ
サシステムで、1つのジョブJAを、複数のプロセッサ
エレメントPE1、PE2に割り当てて処理しているシ
ステム運用中に、テストプログラムを起動させる方法に
おいて、1つのジョブJAの終了に同期して、ジョブJ
Aの実行に関わった全てのプロセッサエレメントで、オ
ペレーティングシステムが、一斉にテストプログラムを
起動させるように構成した。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、例えば、科学技術計算
用計算機など、複数のプロセッサエレメント(PE)を
具備したマルチプロセッサシステムに利用されるもので
あり、特に、オペレーティングシステム(以下、「O
S」という)の配下で実行されるテストプログラム(シ
ステムのハードウエア障害を検出するためのプログラ
ム)の起動方法に関する。
【0002】
【従来の技術】図8は従来技術の説明図1(Aはシステ
ム構成図、BはPE4処理時の説明図)、図9は従来技
術の説明図2(PE処理時のタイミングチャート)、図
10は従来技術の説明図3(PE4処理時のタイミング
チャート)である。
【0003】図8〜図10中、PE0、PE1、PE
2、PE3、PE4・・・はプロセッサエレメント(Pro
cessor Element) 、OS0、OS1、OS2、OS3、
OS4・・・はオペレーティングシステム(Operating S
ystem)、UP0、UP1、UP2、UP3、UP4・・
・はユーザプログラム、TE0、TE1、TE2、TE
3、TE4・・・はテストプログラム、JA、JB、J
C、JDはジョブを示す。
【0004】§1:マルチプロセッサシステムの説明・
・・図8A参照 従来、マルチプロセッサシステムとして、例えば、図8
Aに示したような構成のシステムが知られていた。
【0005】このシステムは、複数のプロセッサエレメ
ントPEi(i=0、1、2・・・n−1)を具備して
おり、その内の1個のプロセッサ、例えばPE0を、他
のプロセッサエレメントに対する制御用のプロセッサと
して使用するものである。
【0006】そして、各プロセッサエレメントPEi
(i=0、1、2・・・n−1)には、それぞれ、オペ
レーティングシステムOSi(i=0、1、2・・・n
−1)と、ユーザプログラムUPi(i=0、1、2・
・・n−1)と、テストプログラムTEi(i=0、
1、2・・・n−1)が設けてある。
【0007】この場合、テストプログラムTEi(i=
0、1、2・・・n−1)は、各プロセッサエレメント
PEi内のハードウエア障害を検出するためのプログラ
ムであり、各プロセッサエレメントPEi内のオペレー
ティングシステムOSiの配下で実行されるものであ
る。
【0008】ところで一般的に、上記のようなマルチプ
ロセッサシステムでは、或るジョブを実行する際、1つ
のジョブを複数のプロセッサエレメントに割り当てて実
行(並列処理)させる。
【0009】また、システムのハードウエア障害を検出
するために、各プロセッサエレメントでは、一定時間毎
に、テストプログラムを実行させている。この場合、O
Sからの割り込みにより、実行中のジョブを一時中断さ
せ、テストプログラムを起動して実行させている。
【0010】§2:PE4内の処理説明・・・図8B参
照 以下、プロセッサエレメントの処理の1例として、プロ
セッサエレメントPE4の処理例を、図8Bを参照しな
がら説明する。
【0011】プロセッサエレメントPE4内では、オペ
レーティングシステムOS4の配下で、ハードウエア障
害を検出するためのテストプログラムTE4を、一定時
間毎に実行させている。
【0012】その際、一定時間毎に、オペレーティング
システムOS4から、ユーザプログラムUP4に割り込
みを行うことにより、実行中のジョブを一時中断させ、
テストプログラムTE4を起動させる。
【0013】例えば、ユーザプログラムUP4により、
ジョブJAを実行している途中の時刻t1で、オペレー
ティングシステムOS4が、ユーザプログラムUP4に
割り込みを行うことにより、ジョブJAの処理を中断さ
せ、テストプログラムTE4を起動させる。
【0014】これにより、オペレーティングシステムO
S4の配下でテストプログラムTE4を実行し、ハード
ウエア障害の検出を行う。そして、時刻t2で、テスト
プログラムTE4の処理が終了すると、テストプログラ
ムTE4からオペレーティングシステムOS4に対し、
テストプログラムTE4の終了通知(処理の終了通知)
を行う。
【0015】このテストプログラムTE4の終了通知を
行う場合、テストプログラムTE4の実行で、ハードウ
エア障害を検出しなかったら、ハードウエアが正常であ
ることを報告する。
【0016】その後、中断していたジョブJAの続きを
実行し、時刻t3でジョブJAが終了すると、ユーザプ
ログラムUP4から、オペレーティングシステムOS4
に対し、ジョブJAの終了通知を行う。
【0017】以後、同様にして、ユーザプログラムUP
4を実行しながら、一定時間毎に、テストプログラムT
E4を起動させて実行する。なお、プロセッサエレメン
トPE4以外のプロセッサエレメントでも、上記と同様
にして、処理を行う。
【0018】§3:複数プロセッサエレメントによる処
理の説明・・・図9参照 上記構成のマルチプロセッサシステムにおいて、例え
ば、4個のプロセッサエレメントPE1、PE2、PE
3、PE4に、ジョブJAを割り当てた場合の処理例を
図9に基づいて説明する。なお、プロセッサエレメント
PE4の処理は、図8Bと同じである。
【0019】この場合、4個のプロセッサエレメントP
E1、PE2、PE3、PE4では、それぞれユーザプ
ログラムUP1、UP2、UP3、UP4により、ジョ
ブJAを実行する。
【0020】そして、各プロセッサエレメントPE1、
PE2、PE3、PE4では、それぞれ、図9に示した
所定の時刻にジョブJAを終了するが、プロセッサエレ
メントPE4では、時刻t1でジョブJAを中断し、テ
ストプログラムTE4を実行する。
【0021】その後、時刻t2でテストプログラムTE
4の処理が終了すると、ジョブJAの続きを実行し、時
刻t3で、ジョブJAを終了する。この場合、PE1〜
PE3では、ジョブJAの実行中にテストプログラムを
実行しなかった(テストプログラムの起動前に、ジョブ
JAが終了しているため)とすると、プロセッサエレメ
ントPE4だけが、テストプログラムTE4の実行時間
(t1〜t2の間)だけ、ジョブJAの処理が遅れるこ
とになる。
【0022】すなわち、ジョブJAの実行途中で、割り
込みによりテストプログラムを実行すると、テストプロ
グラムの実行時間だけ、ジョブJAの処理が遅れること
になる。
【0023】§4:テストプログラムにより、ハードウ
エア障害を検出した場合の説明・・・図10参照 以下、プロセッサエレメントPE4の処理例を、図10
のタイミングチャートに基づいて説明する。なお、図1
0において、Kはテストプログラムの起動周期である。
【0024】例えば、ユーザプログラムUP4により、
ジョブJAを実行している途中の時刻t1で、オペレー
ティングシステムOS4が、ユーザプログラムUP4に
割り込みを行うことにより、ジョブJAの処理を中断さ
せ、テストプログラムTE4を起動させる。
【0025】これにより、オペレーティングシステムO
S4の配下でテストプログラムTE4を実行し、ハード
ウエア障害の検出を行う。そして、時刻t2で、テスト
プログラムTE4の処理が終了すると、テストプログラ
ムTE4からオペレーティングシステムOS4に対し、
テストプログラムTE4の終了通知(処理の終了通知)
を行う。
【0026】この終了通知を行う場合、テストプログラ
ムTE4の実行で、ハードウエア障害を検出しなかった
ため(この例では正常とする)、ハードウエアが正常で
あることを報告する。
【0027】その後、中断していたジョブJAの続きを
実行し、時刻t3でジョブJAが終了すると、ユーザプ
ログラムUP4から、オペレーティングシステムOS4
に対し、ジョブJAの終了通知を行う。
【0028】その後、ユーザプログラムUP4により、
ジョブJB、JC、JDの順に処理を行い、ジョブJD
の実行途中の時刻t4で、テストプログラムの起動を行
う時刻(テストプログラムの起動周期K)になったとす
る。
【0029】この時刻t4で、再び、オペレーティング
システムOS4からユーザプログラムUP4に対し、割
り込みを行って、ジョブJDの処理を中断させ、テスト
プログラムTE4を起動させる。
【0030】このようにして、テストプログラムTE4
を実行し、時刻t5で、テストプログラムTE4の処理
が終了すると、テストプログラムTE4から、オペレー
ティングシステムOS4に対し、テストプログラムTE
4の終了通知を出す。
【0031】この時、テストプログラムTE4の実行に
より、ハードウエア障害を検出したとすると、テストプ
ログラムTE4の終了通知において、ハードウエアの異
常報告を行う。
【0032】以上のようにして、プロセッサエレメント
PE4の処理を行うが、上記時刻t5での異常報告で
は、時刻t2からt4の間に実行したジョブ全て(J
A、JB、JC、JD)が異常終了対象のジョブとな
る。
【0033】なお、この場合、ジョブJAが異常終了と
なるから、時刻t1以前に実行したジョブJAについて
も異常終了となる。
【0034】
【発明が解決しようとする課題】上記のような従来のも
のにおいては、次のような課題があった。 :各プロセッサエレメントで実行中のジョブに同期さ
せることなく、各プロセッサエレメントに対し、一定時
間毎にテストプログラムを実行させていた。
【0035】このため、複数のプロセッサエレメントに
またがるジョブの場合、テストプログラムを実行してい
たプロセッサエレメント(上記の例ではPE4)だけ、
処理が遅くなる(テストプログラムの実行時間だけ、ジ
ョブの終了が遅くなる)。
【0036】従って、処理効率が悪く、マルチプロセッ
サシステムの性能が低下する。 :テストプログラムの実行により、ハードウエア障害
が検出された際、障害の影響を受けたと思われるジョブ
を多数、異常終了させなければならなかった。
【0037】従って、この点でも、処理効率が悪く、マ
ルチプロセッサシステムの性能が低下する。本発明は、
このような従来の課題を解決し、マルチプロセッサシス
テムにおいて、テストプログラムのオーバーヘッドを減
らすと同時に、テストプログラムにより、ハードウエア
障害が検出された際に、異常終了すべきジョブを最小限
に抑えることを目的とする。
【0038】
【課題を解決するための手段】図1は本発明の原理説明
図であり、図1中、図8〜図10と同じものは、同一符
号で示してある。
【0039】本発明は上記の課題を解決するため、次の
ように構成した。 :それぞれ、オペレーティングシステム(OSi:i
=0、1、2・・・n−1)を有する複数のプロセッサ
エレメント(PEi:i=0、1、2・・・n−1)を
具備し、各プロセッサエレメント内に、上記各オペレー
ティングシステムの配下で実行させ、システムのハード
ウエア障害を検出するためのテストプログラム(TE
i:i=0、1、2・・・n−1)を格納したマルチプ
ロセッサシステムで、1つのジョブ(JA)を、複数の
プロセッサエレメント(PE1、PE2)に割り当てて
処理しているシステム運用中に、上記テストプログラム
を起動させるテストプログラム起動方法において、上記
1つのジョブ(JA)の終了に同期して、該ジョブ(J
A)の実行に関わった全てのプロセッサエレメント(P
E1、PE2)で、上記オペレーティングシステムが、
一斉にテストプログラムを起動させるように構成した。
【0040】:構成において、プロセッサエレメン
ト(PEi:i=0、1、2・・・n−1)の内、各プ
ロセッサエレメントに対する制御用のプロセッサエレメ
ント(PE0)が、1つのジョブ(JA)の実行に関わ
った全てのプロセッサエレメント(PE1、PE2)か
らのジョブ終了通知により、1つのジョブ(JA)の終
了を確認した時、上記ジョブ(JA)の実行に関わった
全てのプロセッサエレメント(PE1、PE2)に対
し、テストプログラムの起動を指示することにより、こ
れら各プロセッサエレメントのオペレーティングシステ
ム(OS1、OS2)が、それぞれ、テストプログラム
(TE1、TE2)を起動するように構成した。
【0041】
【作用】上記構成に基づく本発明の作用を、図1に基づ
いて説明する。例えば、プロセッサエレメントPE0を
制御用のプロセッサエレメントとし、2個のプロセッサ
エレメントPE1、PE2で、1つのジョブJAを処理
している場合に、テストプログラムを起動させるには、
次のようにする。
【0042】今、プロセッサエレメントPE1、PE2
で、それぞれユーザプログラムによりジョブJAを実行
しているとする。その後、プロセッサエレメントPE
1、PE2では、ジョブJAが終了すると、プロセッサ
エレメントPE0に対し、ジョブJAの終了通知を出
す。
【0043】このようにして、プロセッサエレメントP
E0が、プロセッサエレメントPE1、PE2からのジ
ョブJAの終了通知を受け取ることにより、各プロセッ
サエレメントPE1、PE2でのジョブJAの終了を確
認する。
【0044】そして、プロセッサエレメントPE0が、
プロセッサエレメントPE1、PE2でのジョブJAの
終了を確認した時、各プロセッサエレメントPE1、P
E2に対し、テストプログラムの起動指令を出す。
【0045】各プロセッサエレメントPE1、PE2で
は、プロセッサエレメントPE0からのテストプログラ
ムの起動指令を受け取ると、各オペレーティングシステ
ムOS1、OS2が直ちに、テストプログラムTE1、
TE2を起動させて、実行させる。
【0046】すなわち、プロセッサエレメントPE1で
は、テストプログラムTE1を実行し、プロセッサエレ
メントPE2では、テストプログラムTE2を実行す
る。そして、各プロセッサエレメントPE1、PE2で
のテストプログラムの処理が終了すると、それぞれ、プ
ロセッサエレメントPE0に対し、テストプログラムの
終了通知を行う。
【0047】プロセッサエレメントPE0では、各プロ
セッサエレメントPE1、PE2からのテストプログラ
ムの終了通知により、テストプログラムの終了を確認す
る。以上のようにして、テストプログラムを実行し、シ
ステムのハードウエア障害の検出を行う。
【0048】このようにすると、科学技術計算用計算機
など、ジョブ当たりのタイムスライスを大きくとれるマ
ルチプロセッサシステムにおいて、テストプログラムの
オーバーヘッドを減らすと同時に、テストプログラムに
より、ハードウエア障害が検出された際に、異常終了す
べきジョブを最小限に抑えることが可能となる。
【0049】
【実施例】以下、本発明の実施例を図面に基づいて説明
する。 (第1実施例の説明)図2〜図6は、本発明の第1実施
例を示した図であり、図2は第1実施例の説明図1(シ
ステム構成図)、図3は第1実施例の説明図2(PEの
説明図)、図4は第1実施例の説明図3(PEの処理フ
ローチャート)、図5は第1実施例の説明図4(PE処
理時のタイミングチャート)、図6は第1実施例の説明
図5(PE4処理時のタイミングチャート)である。
【0050】図2〜図6中、図1、図8〜図10と同じ
ものは、同一符号で示してある。 §1:マルチプロセッサシステムの構成の説明・・・図
2参照 第1実施例におけるマルチプロセッサシステムの構成
は、図2に示した通りである。
【0051】すなわち、このマルチプロセッサシステム
は、プロセッサエレメントPE0〜PE(n−1)から
なるn個のプロセッサエレメントPEi(i=0、1、
2・・・n−1)で構成されており、その内の1つのプ
ロセッサエレメントPE0を、他のプロセッサエレメン
トに対する制御用のプロセッサとしたシステムである。
【0052】§2:プロセッサエレメントの説明・・・
図3参照 上記マルチプロセッサシステムを構成する各プロセッサ
エレメントPEi(i=0、1、2・・・n−1)に
は、それぞれ、オペレーティングシステムOSi(i=
0、1、2・・・n−1)と、ユーザプログラムUPi
(i=0、1、2・・・n−1)と、テストプログラム
TEi(i=0、1、2・・・n−1)が設けてある。
【0053】この場合、テストプログラムTEiは、各
プロセッサエレメントPEi内のハードウエア障害を検
出するためのプログラムであり、各プロセッサエレメン
トPEi内のオペレーティングシステムOSiの配下で
実行されるものである。
【0054】上記各プロセッサエレメントPEiでは、
与えられたジョブの実行を終了すると、プロセッサエレ
メントPE0に対し、ジョブ終了通知を出し、プロセッ
サエレメントPE0からのテストプログラムの起動指令
に従って、テストプログラムの起動を行う。
【0055】また、プロセッサエレメントPE0では、
各プロセッサエレメントからのジョブ終了通知を受け取
り、ジョブの終了を確認する処理を行うと共に、各プロ
セッサエレメントに対し、テストプログラムの起動指令
を行う。
【0056】§3:フローチャートによるプロセッサエ
レメント(PE)の処理説明・・・図4参照 以下、図4の処理フローチャートに基づいて、各プロセ
ッサエレメントの処理を説明する。なお、図のS1〜S
4は、各処理番号を示す。
【0057】以下の例では、4個のプロセッサエレメン
トPE1、PE2、PE3、PE4で、1つのジョブJ
Aを処理している場合に、テストプログラムを起動させ
る例として説明する。
【0058】S1:この処理では、複数のプロセッサエ
レメントPEi(i=1、2、3、4)内で、それぞれ
ユーザプログラムUPi(i=1、2、3、4)により
ジョブJAを実行する。
【0059】すなわち、プロセッサエレメントPE1で
は、ユーザプログラムUP1によりジョブJAを実行
し、プロセッサエレメントPE2では、ユーザプログラ
ムUP2によりジョブJAを実行し、プロセッサエレメ
ントPE3では、ユーザプログラムUP3によりジョブ
JAを実行し、プロセッサエレメントPE4では、ユー
ザプログラムUP4によりジョブJAを実行する。
【0060】そして、各プロセッサエレメントでは、ジ
ョブJAが終了すると、プロセッサエレメントPE0
(制御用のプロセッサエレメント)に対し、ジョブJA
の終了通知を出す。
【0061】S2:この処理では、プロセッサエレメン
トPE0が、各プロセッサエレメントPEi(i=1、
2、3、4)からのジョブJAの終了通知を受け取るこ
とにより、各プロセッサエレメントでのジョブJAの終
了を確認する。
【0062】もし、いずれかのプロセッサエレメント
で、ジョブJAが終了していなければ、終了するのを待
つ。 S3:上記S2の処理で、プロセッサエレメントPE0
が、全てのプロセッサエレメントでのジョブJAが終了
したのを確認すると、各プロセッサエレメントPEi
(i=1、2、3、4)に対し、テストプログラムの起
動指令を出す。
【0063】各プロセッサエレメントでは、プロセッサ
エレメントPE0からのテストプログラムの起動指令を
受け取ると、直ちに、テストプログラムを起動させて
(一斉に起動させる)、実行させる。
【0064】すなわち、プロセッサエレメントPE1で
は、テストプログラムTE1を実行し、プロセッサエレ
メントPE2では、テストプログラムTE2を実行し、
プロセッサエレメントPE3では、テストプログラムT
E3を実行し、プロセッサエレメントPE4では、テス
トプログラムTE4を実行する。
【0065】そして、各プロセッサエレメントでのテス
トプログラムの処理が終了すると、それぞれ、プロセッ
サエレメントPE0に対し、テストプログラムの終了通
知を行う。
【0066】S4:この処理では、プロセッサエレメン
トPE0が、各プロセッサエレメントPEi(i=1、
2、3、4)からのテストプログラムの終了通知によ
り、テストプログラムの終了を確認する。
【0067】この場合、テストプログラムの処理が終了
しているプロセッサエレメントに対しては、プロセッサ
エレメントPE0が、新たなジョブの割り当てを行なっ
て該ジョブを実行させる。
【0068】§4:タイミングチャートによるプロセッ
サエレメントの処理説明・・・図5参照 上記各プロセッサエレメントの処理を、図5のタイミン
グチャートにより説明する。
【0069】なお、この例でも、図4と同様に、4個の
プロセッサエレメントPE1、PE2、PE3、PE4
で、1つのジョブJAを処理している場合に、テストプ
ログラムを起動させる例として説明する。
【0070】上記と同様にして、1つのジョブJAを、
4個のプロセッサエレメントPE1〜PE4に割り当て
て実行しているものとする。そして、時刻t1で、プロ
セッサエレメントPE3でのジョブJAが終了し、時刻
t2で、プロセッサエレメントPE1でのジョブJAが
終了し、時刻t3で、プロセッサエレメントPE2での
ジョブJAが終了し、時刻t4で、プロセッサエレメン
トPE4でのジョブJAが終了したとする。
【0071】この場合、プロセッサエレメントPE4で
のジョブJAの終了時刻t4が、ジョブJAの最も遅い
終了時刻となる。従って、制御用のプロセッサエレメン
トであるプロセッサエレメントPE0が、プロセッサエ
レメントPE4でのジョブJAの終了を確認すると、全
てのジョブJAの終了を確認できた状態となる。
【0072】このため、プロセッサエレメントPE0で
は、この時刻t4で、プロセッサエレメントPE1〜P
E4でのジョブJAの終了を確認すると、直ちに、各プ
ロセッサエレメントPE1〜PE4に対し、テストプロ
グラムの起動指令を出す。
【0073】この指令により、各プロセッサエレメント
PE1〜PE4では、それぞれテストプログラムを起動
し、実行する。すなわち、時刻t4で、プロセッサエレ
メントPE0からのテストプログラムの起動指令が出さ
れると、プロセッサエレメントPE1では、テストプロ
グラムTE1を実行し、プロセッサエレメントPE2で
は、テストプログラムTE2を実行し、プロセッサエレ
メントPE3では、テストプログラムTE3を実行し、
プロセッサエレメントPE4では、テストプログラムT
E4を実行する。
【0074】そして、各プロセッサエレメントでのテス
トプログラムの実行が終了すると、それぞれ、プロセッ
サエレメントPE0に対し、テストプログラムの終了報
告を行う。
【0075】§5:タイミングチャートによるPE4の
処理説明・・・図6参照 1例として、上記処理の内、プロセッサエレメントPE
4での処理の詳細を、図6のタイミングチャートに基づ
いて説明する。
【0076】なお、この例は、図5に示した例と同じ処
理例である。従って、この場合にも、4個のプロセッサ
エレメントPE1、PE2、PE3、PE4で、1つの
ジョブJAを処理している場合に、テストプログラムを
起動させるものである。
【0077】上記のように、プロセッサエレメントPE
4が、ジョブJAを最も遅く終了した場合、時刻t4
で、ジョブJAの終了通知を出した(図5と同じ)後、
プロセッサエレメントPE0からのテストプログラムの
起動指令が出される。
【0078】この時、プロセッサエレメントPE4のオ
ペレーティングシステムOS4では、テストプログラム
TE4を起動して実行させる。その後、時刻t5で、テ
ストプログラムTE4の処理が終了すると、テストプロ
グラムTE4から、オペレーティングシステムOS4に
対し、テストプログラムTE4の終了通知(処理の終了
通知)を出す。
【0079】この場合、テストプログラムTE4の実行
により、ハードウエア障害が検出できなかったとする
と、上記終了通知により、正常報告を行う。続いて、ユ
ーザプログラムUP4では、ジョブJB(ジョブJAと
は別のジョブ)を実行し、時刻t6で、ジョブJBの処
理が終了すると、ユーザプログラムUP4からオペレー
ティングシステムOS4に対し、ジョブJBの終了通知
を出す。
【0080】その後、時刻t7で、ジョブJBの全ての
処理が終了し、プロセッサエレメントPE0から、テス
トプログラムの起動指令が出されると、オペレーティン
グシステムOS4では、再びテストプログラムTE4を
起動し、実行させる。
【0081】そして、時刻t8でテストプログラムTE
4の処理が終了すると、テストプログラムTE4から、
オペレーティングシステムOS4に対し、テストプログ
ラムTE4の終了通知を出す。
【0082】この場合、テストプログラムTE4の実行
により、ハードウエア障害を検出したとすると、オペレ
ーティングシステムOS4に対し、異常報告を行う。こ
の時、異常終了対象ジョブは、時刻t5から時刻t6の
間に実行したジョブJBのみ(1つのジョブ)である。
【0083】(第2実施例の説明)図7は、本発明の第
2実施例の説明図(PE処理時のタイミングチャート)
である。図7中、図1〜図6と同じものは同一符号で示
してある。
【0084】第2実施例は、プロセッサエレメントPE
0〜PE3からなるプロセッサエレメント群にジョブJ
Aを割り当て、プロセッサエレメントPE4、PE5か
らなるプロセッサエレメント群にジョブJBを割り当て
た場合の処理例である。
【0085】以下、各プロセッサエレメントの処理を、
図7のタイミングチャートに基づいて説明する。なお、
図2、図3に示した構成は、第2実施例でも同じなの
で、これらの図も援用して説明する。
【0086】図示のように、プロセッサエレメントPE
0、PE1、PE2、PE3でジョブJAを実行し、プ
ロセッサエレメントPE4、PE5でジョブJBを実行
しているものとする。
【0087】:ジョブJAを実行するプロセッサエレ
メント群の処理説明 時刻t1で、プロセッサエレメントPE3でのジョブJ
Aが終了し、時刻t2で、プロセッサエレメントPE2
でのジョブJAが終了し、時刻t3で、プロセッサエレ
メントPE0でのジョブJAが終了し、時刻t4で、プ
ロセッサエレメントPE1でのジョブJAが終了したと
する。
【0088】この場合、プロセッサエレメントPE1で
のジョブJAの終了時刻t4が、ジョブJAの最も遅い
終了時刻となる。従って、制御用のプロセッサエレメン
トであるプロセッサエレメントPE0が、プロセッサエ
レメントPE1でのジョブJAの終了を確認すると、全
てのジョブJAの終了を確認できた状態となる。
【0089】このため、プロセッサエレメントPE0で
は、この時刻t4で、プロセッサエレメントPE0〜P
E3でのジョブJAの終了を確認すると、直ちに、各プ
ロセッサエレメントPE0〜PE3に対し、テストプロ
グラムの起動指令を出す。
【0090】この指令により、各プロセッサエレメント
PE0〜PE3では、それぞれテストプログラムを起動
し、実行する。すなわち、時刻t4で、プロセッサエレ
メントPE0からのテストプログラムの起動指令が出さ
れると、プロセッサエレメントPE0では、テストプロ
グラムTE0を実行し、プロセッサエレメントPE1で
は、テストプログラムTE1を実行し、プロセッサエレ
メントPE2では、テストプログラムTE2を実行し、
プロセッサエレメントPE3では、テストプログラムT
E3を実行する。
【0091】そして、各プロセッサエレメントでのテス
トプログラムの実行が終了すると、それぞれ、プロセッ
サエレメントPE0に対し、テストプログラムの終了通
知を行う。
【0092】:ジョブJBを実行するプロセッサエレ
メント群の処理説明 プロセッサエレメントPE4、PE5からなるプロセッ
サエレメント群では、ジョブJBを実行する。
【0093】この場合、時刻t5で、プロセッサエレメ
ントPE5でのジョブJBが終了し、時刻t6で、プロ
セッサエレメントPE4でのジョブJBが終了したとす
る。この場合、プロセッサエレメントPE4でのジョブ
JBの終了時刻t6が、ジョブJBの最も遅い終了時刻
となる。
【0094】従って、プロセッサエレメントPE0が、
プロセッサエレメントPE4でのジョブJBの終了を確
認すると、全てのジョブJBの終了を確認できた状態と
なる。
【0095】このため、プロセッサエレメントPE0で
は、この時刻t6で、プロセッサエレメントPE4、P
E5でのジョブJBの終了を確認すると、直ちに、各プ
ロセッサエレメントPE4、PE5に対し、テストプロ
グラムの起動指令を出す。
【0096】この指令により、各プロセッサエレメント
PE4、PE5では、それぞれテストプログラムを起動
し、実行する。すなわち、時刻t6で、プロセッサエレ
メントPE0からのテストプログラムの起動指令が出さ
れると、プロセッサエレメントPE4では、テストプロ
グラムTE4を実行し、プロセッサエレメントPE5で
は、テストプログラムTE5を実行する。
【0097】そして、各プロセッサエレメントでのテス
トプログラムの実行が終了すると、それぞれ、プロセッ
サエレメントPE0に対し、テストプログラムの終了通
知を行う。
【0098】以上のように、ジョブJAを実行するプロ
セッサエレメント群(PE0、PE1、PE2、PE
3)と、ジョブJBを実行するプロセッサエレメント群
(PE4、PE5)とが、それぞれ独立してテストプロ
グラムの起動を行っている。
【0099】すなわち、1つのジョブを単位とし、同じ
ジョブを実行したプロセッサエレメント群の全てのジョ
ブが終了すると、該ジョブを実行したプロセッサエレメ
ント群に対し、テストプログラムの起動を指令する。
【0100】このようにして、プロセッサエレメント群
毎に、テストプログラムを起動させ、実行させる。以上
実施例について説明したが、本発明は、科学技術計算用
計算機など、ジョブ当たりのタイムスライスを大きくと
れる各種の計算機、例えば、1つの大きなジョブを、複
数のプロセッサエレメントにより並列処理する計算機
(マルチプロセッサシステム)に適用して有効である。
【0101】なお、本発明のマルチプロセッサシステム
は、タイムスライスが小さいジョブに適用した場合、ジ
ョブの走行時間に対するテストプログラムの走行時間
が、相対的に増大し、システムの性能低下を引き起こ
す。
【0102】このため、本発明では、上記のようにジョ
ブ当たりのタイムスライスを大きくとれることが必要条
件である。
【0103】
【発明の効果】以上説明したように、本発明によれば次
のような効果がある。 :ジョブ当たりのタイムスライスを大きくとれる計算
機(マルチプロセッサシステム)において、テストプロ
グラムのオーバーヘッドを減らすことができる。
【0104】:ジョブ当たりのタイムスライスを大き
くとれる計算機、例えば、1つの大きなジョブを複数の
装置により並列処理するような計算機の運用中におい
て、テストプログラムにより、ハードウエア障害が検出
された際、異常終了すべきジョブを最小限に抑えること
ができる。このため、計算機を効率良く運用することが
可能となる。
【図面の簡単な説明】
【図1】本発明の原理説明図である。
【図2】第1実施例の説明図1(システム構成図)であ
る。
【図3】第1実施例の説明図2(PEの説明図)であ
る。
【図4】第1実施例の説明図3(PEの処理フローチャ
ート)である。
【図5】第1実施例の説明図4(PE処理時のタイミン
グチャート)である。
【図6】第1実施例の説明図5(PE4処理時のタイミ
ングチャート)である。
【図7】第2実施例の説明図(PE処理時のタイミング
チャート)である。
【図8】従来技術の説明図1(Aはシステム構成図、B
はPE4処理時の説明図)である。
【図9】従来技術の説明図2(PE処理時のタイミング
チャート)である。
【図10】従来技術の説明図3(PE4処理時のタイミ
ングチャート)である。
【符号の説明】
PE0、PE1、PE2 プロセッサエレメント OS0、OS1、OS2 オペレーティングシステム JA ジョブ TE1、TE2 テストプログラム

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 それぞれ、オペレーティングシステム
    (OSi:i=0、1、2・・・n−1)を有する複数
    のプロセッサエレメント(PEi:i=0、1、2・・
    ・n−1)を具備し、 各プロセッサエレメント内に、 上記各オペレーティングシステムの配下で実行させ、シ
    ステムのハードウエア障害を検出するためのテストプロ
    グラム(TEi:i=0、1、2・・・n−1)を格納
    したマルチプロセッサシステムで、 1つのジョブ(JA)を、複数のプロセッサエレメント
    (PE1、PE2・・・)に割り当てて処理しているシ
    ステム運用中に、上記テストプログラムを起動させるテ
    ストプログラム起動方法において、 上記1つのジョブ(JA)の終了に同期して、 該ジョブ(JA)の実行に関わった全てのプロセッサエ
    レメント(PE1、PE2・・・)で、 上記オペレーティングシステムが、一斉にテストプログ
    ラムを起動させることを特徴としたテストプログラム起
    動方法。
  2. 【請求項2】 上記プロセッサエレメント(PEi:i
    =0、1、2・・・n−1)の内、各プロセッサエレメ
    ントに対する制御用のプロセッサエレメント(PE0)
    が、 上記1つのジョブ(JA)の実行に関わった全てのプロ
    セッサエレメント(PE1、PE2・・・)からのジョ
    ブ終了通知により、1つのジョブ(JA)の終了を確認
    した時、 上記ジョブ(JA)の実行に関わった全てのプロセッサ
    エレメント(PE1、PE2・・・)に対し、テストプ
    ログラムの起動を指示することにより、 これら各プロセッサエレメントのオペレーティングシス
    テム(OS1、OS2・・・)が、それぞれ、テストプ
    ログラム(TE1、TE2・・・)を起動することを特
    徴とした請求項1記載のテストプログラム起動方法。
JP5121049A 1993-05-24 1993-05-24 テストプログラム起動方法 Withdrawn JPH06332874A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5121049A JPH06332874A (ja) 1993-05-24 1993-05-24 テストプログラム起動方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5121049A JPH06332874A (ja) 1993-05-24 1993-05-24 テストプログラム起動方法

Publications (1)

Publication Number Publication Date
JPH06332874A true JPH06332874A (ja) 1994-12-02

Family

ID=14801569

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5121049A Withdrawn JPH06332874A (ja) 1993-05-24 1993-05-24 テストプログラム起動方法

Country Status (1)

Country Link
JP (1) JPH06332874A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2192489A1 (en) 2008-11-28 2010-06-02 Hitachi Automotive Systems Ltd. Multi-core processing system for vehicle control or an internal combustion engine controller
JP2010218277A (ja) * 2009-03-17 2010-09-30 Toyota Motor Corp 故障診断システム、電子制御ユニット、故障診断方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2192489A1 (en) 2008-11-28 2010-06-02 Hitachi Automotive Systems Ltd. Multi-core processing system for vehicle control or an internal combustion engine controller
US8417990B2 (en) 2008-11-28 2013-04-09 Hitachi Automotive Systems, Ltd. Multi-core processing system for vehicle control or an internal combustion engine controller
JP2010218277A (ja) * 2009-03-17 2010-09-30 Toyota Motor Corp 故障診断システム、電子制御ユニット、故障診断方法

Similar Documents

Publication Publication Date Title
JP3982353B2 (ja) フォルトトレラントコンピュータ装置、その再同期化方法及び再同期化プログラム
JPH04350758A (ja) 多重処理能力を備えたワークステーション
JPH06332874A (ja) テストプログラム起動方法
JPH086800A (ja) データ処理装置及びマイクロプロセッサ
JPH10116261A (ja) 並列計算機システムのチェックポイントリスタート方法
JPH0675820A (ja) マルチプロセッサシステムにおける割り込み装置
JP2708172B2 (ja) 並列処理方法
JP2526835B2 (ja) プログラマブルコントロ―ラの二重化同期制御方式
JPH0644234B2 (ja) タスク管理装置
JPH064318A (ja) エラー検出方式
JPH04247531A (ja) 障害検出方式
JPH1027110A (ja) 複数台のコンピュータによるコンピュータシステム
JPH04100110A (ja) プログラマブルコントローラ
JPH01177133A (ja) イベント通知方式
JPH05342058A (ja) プロセス異常検知方式
JPH10207716A (ja) 割り込みマスク制御方式
JPS6033654A (ja) マイクロプロセツサ間デ−タ転送方式
JPH061466B2 (ja) ロック排他制御方式
JPS62106549A (ja) マルチプロセツサ・システム
JPH06242969A (ja) リアルタイムマルチタスクシステム
JPH1124944A (ja) プロセス同期方法
JPS63238641A (ja) マイクロプロセツサ障害簡易検出方式
JPS61143868A (ja) 多重化プロセス制御装置
JPS61226839A (ja) イベント処理方式
JPH0431421B2 (ja)

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20000801