JPS6113626B2 - - Google Patents
Info
- Publication number
- JPS6113626B2 JPS6113626B2 JP54009125A JP912579A JPS6113626B2 JP S6113626 B2 JPS6113626 B2 JP S6113626B2 JP 54009125 A JP54009125 A JP 54009125A JP 912579 A JP912579 A JP 912579A JP S6113626 B2 JPS6113626 B2 JP S6113626B2
- Authority
- JP
- Japan
- Prior art keywords
- program
- register
- backup
- cpu
- contents
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 150000001875 compounds Chemical class 0.000 claims description 13
- 238000000034 method Methods 0.000 claims description 8
- 238000010586 diagram Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
Landscapes
- Hardware Redundancy (AREA)
- Multi Processors (AREA)
Description
【発明の詳細な説明】
本発明は複合計算機システムにおいて一方の計
算機が故障したときに他の計算機により走行の継
続を行なう複合計算機システムのバツクアツプ方
式に関するものである。
算機が故障したときに他の計算機により走行の継
続を行なう複合計算機システムのバツクアツプ方
式に関するものである。
従来、複合計算機システムにおいて、一つのプ
ログラムを走行させるとき、一方の計算機が故障
しても他の計算機でそのプログラムを引きつづき
実行せしめるために同期方式を採用している。こ
の同期は命令の一つ一つの実行について同期させ
る場合(密結合という)と、プログラムの要所要
所でそのプログラムの実行経過をチエツクする場
合(粗結合)とがある。前者の場合には同期のた
めの特別なハードウエアが必要であり、一方の計
算機が何んらかの故障によつて渋帯したようなと
き、他の計算機も影響を受けて同期待ちで渋帯す
る。又、同期のための特別な時間が各命令毎にか
かる。
ログラムを走行させるとき、一方の計算機が故障
しても他の計算機でそのプログラムを引きつづき
実行せしめるために同期方式を採用している。こ
の同期は命令の一つ一つの実行について同期させ
る場合(密結合という)と、プログラムの要所要
所でそのプログラムの実行経過をチエツクする場
合(粗結合)とがある。前者の場合には同期のた
めの特別なハードウエアが必要であり、一方の計
算機が何んらかの故障によつて渋帯したようなと
き、他の計算機も影響を受けて同期待ちで渋帯す
る。又、同期のための特別な時間が各命令毎にか
かる。
後者の場合にはプログラムにおいて同期のため
計算機相互の通信モジユール等を通じての手続き
が必要であり、プログラミング上やつかいであ
る。又、同期点をきめ細かくとると、同期に要す
る時間がかかり、応答時間が長くなる。又、複合
計算機システムのうち主計算機が故障した場合、
従側の計算機は一旦前回の同期ポイントまでさか
のぼつて実行を開始する必要がある。そのために
さらにプログラムの実行は遅れてしまうことにな
る。上記二つの場合とも実行時間上の問題とハー
ドウエア及びプログラミング上の複雑さはさけ得
ない問題がある。
計算機相互の通信モジユール等を通じての手続き
が必要であり、プログラミング上やつかいであ
る。又、同期点をきめ細かくとると、同期に要す
る時間がかかり、応答時間が長くなる。又、複合
計算機システムのうち主計算機が故障した場合、
従側の計算機は一旦前回の同期ポイントまでさか
のぼつて実行を開始する必要がある。そのために
さらにプログラムの実行は遅れてしまうことにな
る。上記二つの場合とも実行時間上の問題とハー
ドウエア及びプログラミング上の複雑さはさけ得
ない問題がある。
本発明は上記のような従来の複合計算機システ
ムのバツクアツプ方式の欠点を除去するためにな
されたもので、複合計算機システムにバツクアツ
プ用レジスタを設けてバツクアツプを行なうこと
により完全な継続性をもつた複合計算機システム
のバツクアツプ方式を提供することを目的とす
る。
ムのバツクアツプ方式の欠点を除去するためにな
されたもので、複合計算機システムにバツクアツ
プ用レジスタを設けてバツクアツプを行なうこと
により完全な継続性をもつた複合計算機システム
のバツクアツプ方式を提供することを目的とす
る。
以下本発明の詳細を図示した一実施例により説
明する。
明する。
第1図において1及び2は計算機の演算制御装
置(以下CPUと略す)でそれぞれ主メモリ1
a,2aとレジスタ部3,4を有している。又
CPU1,2はそれぞれレジスタ部3,4と同一
構成のバツクアツプ用レジスタ5,6をもつ。
CPU1からバツクアツプ用レジスタ5の内容を
読み込めるように結ばれている。同様にCPU2
からバツクアツプ用レジスタ6の内容を読み込む
ことができる。バツクアツプ用レジスタ5,6に
はそれぞれ互いに他のCPU1,2のレジスタ部
3,4の内容が命令の実行度毎に移される。7は
CPU1,2に対する共通メモリである。8,9
は警報モジユールで、CPU1,2それぞれの故
障を検出する回路である。故障の種類としては例
えば主メモリ故障(パリテイエラー)、プログラ
ム渋帯、CPU電源異常等が含まれる。警報モジ
ユール8,9の出力はそれぞれ相手側のCPU
1,2に結ばれ、互に相手側のCPU1,2の故
障を検知することができるようになつている。
置(以下CPUと略す)でそれぞれ主メモリ1
a,2aとレジスタ部3,4を有している。又
CPU1,2はそれぞれレジスタ部3,4と同一
構成のバツクアツプ用レジスタ5,6をもつ。
CPU1からバツクアツプ用レジスタ5の内容を
読み込めるように結ばれている。同様にCPU2
からバツクアツプ用レジスタ6の内容を読み込む
ことができる。バツクアツプ用レジスタ5,6に
はそれぞれ互いに他のCPU1,2のレジスタ部
3,4の内容が命令の実行度毎に移される。7は
CPU1,2に対する共通メモリである。8,9
は警報モジユールで、CPU1,2それぞれの故
障を検出する回路である。故障の種類としては例
えば主メモリ故障(パリテイエラー)、プログラ
ム渋帯、CPU電源異常等が含まれる。警報モジ
ユール8,9の出力はそれぞれ相手側のCPU
1,2に結ばれ、互に相手側のCPU1,2の故
障を検知することができるようになつている。
第2図はCPU1,2のレジスタ部3,4バツ
クアツプ用レジスタ5,6の構成を示したもので
ある。レジスタ部3,4、バツクアツプ用レジス
タ5,6はそれぞれプログラム走行番地レジスタ
203,204,205,206、ステータスレ
ジスタ213,214,215,216、演算レ
ジスタ223,224,225,226とから構
成されている。
クアツプ用レジスタ5,6の構成を示したもので
ある。レジスタ部3,4、バツクアツプ用レジス
タ5,6はそれぞれプログラム走行番地レジスタ
203,204,205,206、ステータスレ
ジスタ213,214,215,216、演算レ
ジスタ223,224,225,226とから構
成されている。
第3図は共通メモリ7の使用状態の一例を示す
図で、30は現在走行中のプログラム番号を格納
する領域、31はプログラム走行スタート番地を
格納する領域、32はプログラムが実行されるに
従つて生ずる演算の途中結果を格納する領域であ
る。
図で、30は現在走行中のプログラム番号を格納
する領域、31はプログラム走行スタート番地を
格納する領域、32はプログラムが実行されるに
従つて生ずる演算の途中結果を格納する領域であ
る。
次に本発明の作用について図面を用いて説明す
る。
る。
第1図において、CPU1においてあるプログ
ラムが走行するとする。走行する前の手続きとし
て、共通メモリ7にそのプログラムの番号を領域
30に走行を許可された走行スタート番地を領域
31に格納する。しかる後にCPU1にそのプロ
グラムを実行する。プログラムの実行中、第2図
で示したようなレジスタの内容がレジスタ部3よ
りバツクアツプ用レジスタ6へ命令実行の度毎に
移される。もしそのプログラム実行中、CPU1
が故障した場合には、その故障はCPU2に警報
モジユール8を経由して知らされ、CPU2は共
通メモリ7の領域30から走行中のプログラム番
号を読み取り、そのプログラムの実行準備(例え
ばそのプログラムが図示しない補助記憶メモリに
ある場合はそのプログラムを主メモリ2aへ転送
する)し、さらにバツクアツプ用レジスタ6の内
容を読み取り、プログラム走行番地レジスタ20
6に格納されたCPU1における走行番地と、共
通メモリ7の領域31に格納された走行スタート
番地とにより、CPU2における新らしい再開走
行番地を求める。またレジスタ部6のステータレ
ジスタ216に格納されているステータスにより
CPU1におけるステータスと同一にし、さらに
演算レジスタ226の内容をCPU2のレジスタ
部4の演算レジスタ224に移して、そのプログ
ラムの実行を再開させる。これにより、プログラ
ムは完全にCPU1で実行された命令の次から完
全な形で再開始できる。又、CPU1でそのプロ
グラムの実行途中で生じた演算結果は共通メモリ
7の領域32の中にたくわえられているので、演
算途中のデータを失うことはない。
ラムが走行するとする。走行する前の手続きとし
て、共通メモリ7にそのプログラムの番号を領域
30に走行を許可された走行スタート番地を領域
31に格納する。しかる後にCPU1にそのプロ
グラムを実行する。プログラムの実行中、第2図
で示したようなレジスタの内容がレジスタ部3よ
りバツクアツプ用レジスタ6へ命令実行の度毎に
移される。もしそのプログラム実行中、CPU1
が故障した場合には、その故障はCPU2に警報
モジユール8を経由して知らされ、CPU2は共
通メモリ7の領域30から走行中のプログラム番
号を読み取り、そのプログラムの実行準備(例え
ばそのプログラムが図示しない補助記憶メモリに
ある場合はそのプログラムを主メモリ2aへ転送
する)し、さらにバツクアツプ用レジスタ6の内
容を読み取り、プログラム走行番地レジスタ20
6に格納されたCPU1における走行番地と、共
通メモリ7の領域31に格納された走行スタート
番地とにより、CPU2における新らしい再開走
行番地を求める。またレジスタ部6のステータレ
ジスタ216に格納されているステータスにより
CPU1におけるステータスと同一にし、さらに
演算レジスタ226の内容をCPU2のレジスタ
部4の演算レジスタ224に移して、そのプログ
ラムの実行を再開させる。これにより、プログラ
ムは完全にCPU1で実行された命令の次から完
全な形で再開始できる。又、CPU1でそのプロ
グラムの実行途中で生じた演算結果は共通メモリ
7の領域32の中にたくわえられているので、演
算途中のデータを失うことはない。
上記説明はCPU1にてプログラムを実行させ
る場合であるが逆の場合も同様である。
る場合であるが逆の場合も同様である。
上記説明はプログラムの走行時におけるCPU
故障に対するそのプログラムの再走行に関するも
のである。一方、オペレーテイングシステムの走
行中にどちらかのCPUが故障した場合は、健全
なCPUは上述のような手続きでプログラムの再
走行をしようとするが、オペレーテイングシステ
ム走行中においては第3図の領域30におけるプ
ログラム番号には例えば特殊な記号として“0”
を記憶させておくことにより、健全なCPUはこ
れを単に他のCPUの故障として認知するだけで
再開動作には入る必要はない。
故障に対するそのプログラムの再走行に関するも
のである。一方、オペレーテイングシステムの走
行中にどちらかのCPUが故障した場合は、健全
なCPUは上述のような手続きでプログラムの再
走行をしようとするが、オペレーテイングシステ
ム走行中においては第3図の領域30におけるプ
ログラム番号には例えば特殊な記号として“0”
を記憶させておくことにより、健全なCPUはこ
れを単に他のCPUの故障として認知するだけで
再開動作には入る必要はない。
以上説明したように本発明は複合計算機システ
ムにバツクアツプ用レジスタを附加することによ
り、故障検出時に健全なCPUでそれを読み取
り、プログラムを正確に故障を起した次のステツ
プより再開させることが出来、従来のような実行
時間の問題及び同期に要するプログラミングのわ
ずらわしさを解決することができる。これにより
複合計算機システムにおけるダイナミツクな実行
負荷分配制御も容易に実現することが可能であ
り、複合計算機システムを有効に作動せしめるこ
とができる。
ムにバツクアツプ用レジスタを附加することによ
り、故障検出時に健全なCPUでそれを読み取
り、プログラムを正確に故障を起した次のステツ
プより再開させることが出来、従来のような実行
時間の問題及び同期に要するプログラミングのわ
ずらわしさを解決することができる。これにより
複合計算機システムにおけるダイナミツクな実行
負荷分配制御も容易に実現することが可能であ
り、複合計算機システムを有効に作動せしめるこ
とができる。
第1図は複合計算機システムの一例を示すブロ
ツク図、第2図は第1図におけるレジスタ部3,
4、バツクアツプ用レジスタ5,6の構成を示す
図、第3図は第1図における共通メモリ7の使用
形態の一例を示す図である。 1,2…演算制御装置(CPU)、1a,2a…
主メモリ、3,4…レジスタ部、5,6…バツク
アツプ用レジスタ、7…共通メモリ、8,9…警
報モジユール、203〜206…プログラム走行
番地レジスタ、213〜216…ステータレジス
タ、223〜226…演算レジスタ、30,3
1,32…領域。
ツク図、第2図は第1図におけるレジスタ部3,
4、バツクアツプ用レジスタ5,6の構成を示す
図、第3図は第1図における共通メモリ7の使用
形態の一例を示す図である。 1,2…演算制御装置(CPU)、1a,2a…
主メモリ、3,4…レジスタ部、5,6…バツク
アツプ用レジスタ、7…共通メモリ、8,9…警
報モジユール、203〜206…プログラム走行
番地レジスタ、213〜216…ステータレジス
タ、223〜226…演算レジスタ、30,3
1,32…領域。
Claims (1)
- 1 複数の演算制御装置とバツクアツプ用レジス
タと共通メモリとを具備する複合計算機システム
において、一つの演算制御装置がプログラムを実
行する際に該プログラムの番号とスタート番地と
を前記共通メモリに格納し、プログラムを実行中
は該演算制御装置のレジスタ部の内容を命令実行
の度毎に前記バツクアツプ用レジスタに移し、該
演算制御装置が故障した場合他の演算制御装置は
前記バツクアツプ用レジスタの内容と前記共通メ
モリに格納された内容とを読みとつてプログラム
の再開番地と故障前のレジスタの内容とステータ
スとを求めてプログラムを再開することを特徴と
する複合計算機システムのバツクアツプ方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP912579A JPS55102064A (en) | 1979-01-31 | 1979-01-31 | Backup system in composite computer system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP912579A JPS55102064A (en) | 1979-01-31 | 1979-01-31 | Backup system in composite computer system |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS55102064A JPS55102064A (en) | 1980-08-04 |
JPS6113626B2 true JPS6113626B2 (ja) | 1986-04-14 |
Family
ID=11711908
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP912579A Granted JPS55102064A (en) | 1979-01-31 | 1979-01-31 | Backup system in composite computer system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS55102064A (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5872267A (ja) * | 1981-10-26 | 1983-04-30 | Hitachi Ltd | 2重系状態監視計算機装置 |
US4594660A (en) * | 1982-10-13 | 1986-06-10 | Honeywell Information Systems Inc. | Collector |
JPS6054052A (ja) * | 1983-09-02 | 1985-03-28 | Nec Corp | 処理継続方式 |
FR2649224B1 (fr) * | 1989-06-30 | 1995-09-01 | Nec Corp | Systeme de traitement de l'information capable de prendre facilement en charge le traitement d'un processeur defaillant |
JP3158517B2 (ja) * | 1991-08-26 | 2001-04-23 | 富士通株式会社 | 障害検出方式 |
JP6067548B2 (ja) * | 2013-12-18 | 2017-01-25 | トヨタ自動車株式会社 | 情報処理装置 |
-
1979
- 1979-01-31 JP JP912579A patent/JPS55102064A/ja active Granted
Also Published As
Publication number | Publication date |
---|---|
JPS55102064A (en) | 1980-08-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4965717A (en) | Multiple processor system having shared memory with private-write capability | |
US5327553A (en) | Fault-tolerant computer system with /CONFIG filesystem | |
US5317726A (en) | Multiple-processor computer system with asynchronous execution of identical code streams | |
US5890003A (en) | Interrupts between asynchronously operating CPUs in fault tolerant computer system | |
US5384906A (en) | Method and apparatus for synchronizing a plurality of processors | |
EP0433979A2 (en) | Fault-tolerant computer system with/config filesystem | |
JPH07117903B2 (ja) | 障害回復方法 | |
JPH08161279A (ja) | マルチプロセッサシステム | |
JPH0950424A (ja) | ダンプ採取装置およびダンプ採取方法 | |
JP2000112584A (ja) | 電源故障対策を備えたコンピュ―タシステム及びその動作方法 | |
JPS6113626B2 (ja) | ||
JP2002229811A (ja) | 論理分割システムの制御方法 | |
JPS6229820B2 (ja) | ||
CN117389781B (zh) | 服务器设备的异常侦测与恢复方法、***、服务器及介质 | |
JP4853620B2 (ja) | マルチプロセッサシステムと初期立ち上げ方法およびプログラム | |
KR19990057809A (ko) | 오류 방지 시스템 | |
JPS59206951A (ja) | 制御記憶誤り検出回路の診断方式 | |
JPH0462641A (ja) | マルチプロセッサシステム | |
JPH10161879A (ja) | 計算機システム | |
JPS5837583B2 (ja) | 情報処理装置 | |
JPS6077252A (ja) | 入出力制御装置 | |
JPH02122335A (ja) | Ras回路の試験方法 | |
JPS62237536A (ja) | 電子計算装置 | |
JPH05274169A (ja) | 計算機 | |
JPH11184722A (ja) | 分散処理システムにおける保守制御装置の自動復帰機構 |