JPH0630069B2 - 多重化システム - Google Patents

多重化システム

Info

Publication number
JPH0630069B2
JPH0630069B2 JP59160469A JP16046984A JPH0630069B2 JP H0630069 B2 JPH0630069 B2 JP H0630069B2 JP 59160469 A JP59160469 A JP 59160469A JP 16046984 A JP16046984 A JP 16046984A JP H0630069 B2 JPH0630069 B2 JP H0630069B2
Authority
JP
Japan
Prior art keywords
processor
processors
mode
monitoring
malfunction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP59160469A
Other languages
English (en)
Other versions
JPS6139138A (ja
Inventor
真也 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP59160469A priority Critical patent/JPH0630069B2/ja
Publication of JPS6139138A publication Critical patent/JPS6139138A/ja
Publication of JPH0630069B2 publication Critical patent/JPH0630069B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)
  • Multi Processors (AREA)
  • Hardware Redundancy (AREA)

Description

【発明の詳細な説明】 (1)発明の属する技術分野 本発明は情報処理装置に関し、特に複数のプロセッサで
構成するマルチプロセッサシステムに関する。
(2)従来技術の説明 マイクロプロセッサはその高性能化に伴い様々な分野で
応用されている。中でも銀行のオンライン端末、通信網
制御器、医療電子機器といった分野では非常に高い信頼
性が要求される。
従来のマイクロプロセッサで高信頼性の要求されるシス
テムを構成する場合、誤り訂正コードをつけてデータ転
送する方法や同一のマイクロプロセッサを数ケ用いてこ
れらに対して同時に同じ処理をさせ、得られた出力を比
較し誤動作(障害)を検知する方法等が提案されてい
る。
とくに後者の方法によれば高い信頼性が得られるが、同
時に同一処理を実行させる複数のマイクロプロセッサの
各出力毎の一致・不一致を検出する回路が出力ピン毎に
必要である。
また多重化を考慮したマイクロプロセッサシステムとし
て、主モード用プロセッサと監視モード用プロセッサと
を用いて監視モード用プロセッサで主モードのプロセッ
サの動作状態を監視し、誤動作が検出されると誤動作信
号を出力するものもある。
しかしながら、かかる多重化システムでは誤動作が検出
された後、誤動作を起こした故障プロセッサの切はなし
を行ない、かつリセット信号を発注してシステムの再起
動処理がなされなければならない。
すなわち、システムにおいて誤動作が検出された場合、
システムの破壊を防ぐために可能な限りすみやかにシス
テムを停止させる必要があるためリセット信号が用いら
れている。しかしながらリセット信号によればシステム
全体が初期化されてしまう。誤動作前の処理を続行させ
るためには、誤動作前のシステムの処理状態を記憶して
おくためのハードウェアが必要となる。さらにリセット
直後の処理として、そのリセット信号がシステムの本来
の初期化のためなのか、それとも誤動作によるものかを
判定する必要がある。従来、この処理はソフトウェアに
よって実行されていたためソフトウェアの負担が大き
く、実行速度が遅いという欠点を有していた。
(3)発明の目的の説明 本発明は高信頼性が要求される多重化システムにおい
て、誤動作検出後の処理をソフトウェアの負担なしに高
速に実行するシステムを提供することを目的とする。
(4)発明の構成 本発明によれば複数台のプロセッサを用い、そのうちの
少なくとも1つを主プロセッサとし、他のプロセッサを
監視プロセッサとして有する多重化プロセッサと、監視
プロセッサからの誤動作信号を受け、誤動作の判定を行
なう判定回路と、誤動作プロセッサの停止とシステムの
再構成、再起動を行なうシーケンスプロセッサとを含む
多重化システムを得る。
ここで主プロセッサとは与えられたプログラムを実行す
るプロセッサを意味し、監視プロセッサとは主プロセッ
サの動作状態を監視し異常が生じた場合に誤動作検出信
号を発生する機能を有するプロセッサを意味する。本発
明の好適な実施態様によれば、監視プロセッサは主プロ
セッサと同等の機能、すなわち主プロセッサが実行する
プログラムを実行すべき機能と主プロセッサの実行状態
を監視する機能との両方を有するものとして提供されて
いる。監視機能は主プロセッサの処理と監視プロセッサ
自身の処理(これらは同一内容の処理)と遂次比較し、
途中不一致処理が検出された場合、その時点で誤動作検
出信号を発生することによって実現される。シーケンス
プロセッサはこの信号をうけて全プロセッサを停止させ
る。判定回路は誤動作検出信号をうけて異常を認識す
る。しかしこの異常が主プロセッサで起きたか、監視プ
ロセッサで起きたものかを調べる必要がある。本発明の
好適な実施例によればこれは以下のようにして調べられ
る。すなわち、システムの中に監視プロセッサが少なく
とも2つ用意される。かかる2つの監視プロセッサは夫
々主プロセッサと同一の処理を実行し、かつ主プロセッ
サの処理との比較を実行する。このようになれば、誤動
作検出信号が2つの監視プロセッサから共に発生された
場合、異常は主プロセッサで生じたことがわかる。一
方、いずれか一方の監視プロセッサからのみ誤動作検出
信号が発生された場合は、それを発生した監視プロセッ
サ自身に異常が生じたことがわかる。従って、判定回路
は前者の場合は主プロセッサのダウンを判定し、残りの
2つの監視プロセッサのうちの一方を主プロセッサとし
て使うことをシーケンスプロセッサに知らせる。一方、
後者の場合は誤動作検出信号を発生した監視プロセッサ
をシステムから切り離すことをシーケンスプロセッサに
知らせる。シーケンスプロセッサはそれに従って異常プ
ロセッサの切り離し、システムの再構築、再起動を制御
する。
(5)発明の効果 本発明によれば異常プロセッサの検出、およびその切り
離しが容易で、かつソフトウェアの負担を借りずにシス
テムの再構築ができる。しかも、主プロセッサに異常が
なければシステム再構築後、プログラム処理を継続する
ことができる。さらに、主プロセッサダウンの時は、監
視プロセッサの少なくとも1つを主プロセッサとして扱
うことができ、プログラム処理高速に再開することがで
きる。従って、システムのダウンを最小にとどめること
ができる。
(6)実施例の説明 まず、第1図および第2図を参照して従来のマルチプロ
セッサシステムについて説明する。高信頼性を実現する
ために、同一機能を有するn個のマイクロプロセッサ1
01乃至103を有し、各プロセッサはm本の出力ピン
を有する。各ピン対応にm個の比較器104乃至106
が設けられている。比較器の入力端にはn個のプロセッ
サの各同一の出力ピンが接続され、計n個の信号が入力
される。比較器の内部は第2図のようになっている。す
なわち、n本の入力信号はNANDゲート201に入力
されるとともに、それらの反転信号がNANDゲート2
02に入力される。各NANDゲートの出力はANDゲ
ート203に入力される。従って、n個の入力信号のう
ち1個でも他とレベルの異なる信号が混っていればAN
Dゲート203から誤動作検出信号が発生される。誤動
作検信号は第1図のORゲート107を介してシステム
コントローラ(図示せず)に送られる。システムコント
ローラはORゲート107からの検出信号をうけると、
全部のプロセッサにリセット信号を送りシステムを停止
状態にする。システムの回復はシステムコントローラと
ソフトウェアとによって制御される。従って、ソフトウ
ェアの負担が大きく、かつまた、回復までに相当の時間
を要する。
これに対して本発明の一実施例によれば第3図のように
システムが構成される。
第3図は本発明の一実施例として三重化システムの一構
成を示すブロック図である。図において301,30
2,303は同一の機能を有するプロセッサであり、3
04はメモリ及びI/O装置である。各プロセッサとメ
モリ及びI/O装置304とはバス305で接続され
る。アドレス、データ、コントロール信号はこのバス3
05を介して転送される。306はシステム制御部で、
シーケンスプロセッサ307と誤動作プロセッサ判定回
路308とを含む。
プロセッサ301,302,303はそれ自体がプログ
ラムに基づく情報処理を行なう主モードと、主モードで
動作しているプロセッサの動作を監視する監視モードを
持つプロセッサでM/C端子に入力される信号によって
主モードと監視モードとが切換えられる。監視モードの
場合、プロセッサは主モードの動作以外に主モードで動
いている他のプロセッサの実行状態と自身の実行状態と
が比較される。主モードで動作している他のプロセッサ
(これが未来のプログラム処理プロセッサとして割り当
てられている)と監視モードで動作しているプロセッサ
との間に異なる動作が生じた時には、監視モードで動い
ているプロセッサのER端子がアクティブとなり誤動作
検出信号を発生する。またこれらのプロセッサはERH
ALT入力端子を有しており、この端子がアクティブに
なるとプロセッサは処理を停止する。次いでERHAL
T端子がインアクティブとなるとC/E端子(続行/障
害)の状態により異なった動作をする。つまりC/E端
子に“続行”を示す信号が入力されている時には中断し
ていた命令から続行し、C/E端子に障害を示す信号が
入力されている時にはあらかじめ定められたプログラム
を実行する。
システム制御部306のシーケンスプロセッサ(以下シ
ーケンスという)307は監視モードで動いているプロ
セッサから送られるER信号に応答する判定回路の制御
のもとに、全プロセッサの停止、システム再構成、再起
動の制御を行なう。誤動作プロセッサ判定回路は監視プ
ロセッサからのER信号を基に、誤動作したプロセッサ
を判定し、システム再構成に必要となる情報を生成す
る。
以下にその動作を説明する。
システムが起動された時点ではプロセッサ301が主モ
ードで動作し、プロセッサ302及び303が監視モー
ドで動作すると仮定する。処理進行中に監視モードのプ
ロセッサのうち1台でも主モードのプロセッサと異なっ
た動作を検知した場合には、そのプロセッサのER信号
がアクティブとなりシステム制御部へ通知される。ER
信号を受けたシステム制御部はシーケンサ307に起動
がかかる。シーケンサ307はシステムの破壊を最少に
とどめるためHALT1,HALT2,HALT3の全
信号をアクティブにする。これらの信号は各プロセッサ
のERHALT端子に入力され、これをうけて各プロセ
ッサは直ちに動作を停止する。次いでシーケンサ307
は誤動作プロセッサの判定回路308で生成された情報
をもとに、システムの再構成を行なう。
第4図は誤動作プロセッサ判定回路308において生成
される情報のフォーマット図を示している。監視モード
プロセッサ302,303のうちいずれか一方のみが誤
動作を検出した場合には、主モードプロセッサと他の監
視モードプロセッサとは同一の処理を行なっていたこと
になるため、誤動作を検出した監視モードプロセッサ自
体に障害が発生したことになる。よってそのプロセッサ
をシステムから切はなし、システムを再起動させる。ま
た、この場合には、主モードプロセッサは中断されてい
た命令を続行してもよいため、名プロセッサのC/E信
号として“続行”を表わす信号を出力する。
一方、監視モードプロセッサ302,303の両方が供
にER信号を出力した場合には、主モードプロセッサ3
01に障害が発生したことになり、主モードプロセッサ
301が切はなされる。この時、次の主モードプロセッ
サとして302を用いることができる。プロセッサ30
2のM/C端子には主モード指示信号を与えればよい。
またこの場合、中断していた命令の再会が不可能な時に
は誤動作解析プログラムを実行する必要があるために、
プロセッサへのC/E信号として“障害”を表わす信号
を出力する。
再構成を終えるとシーケンサ307はシステムを再起動
させるため、障害のないプロセッサに対してのみERH
ALT端子をインアクティブとする信号を与える。
この結果、障害のないプロセッサによりシステムが再構
築され、各プロセッサはそのC/E端子上の信号に応じ
て動作を開始する。つまりC/E端子が“続行”を表わ
す信号をうけていれば中断していた命令を再開し、反対
に“障害”を表わす信号をうけていれば誤動作解析処理
プログラムを実行する。誤動作解析処理プログラムは誤
動作の発生した命令が再実行可能か否かを判定し、再実
行可能であれば再実行し、再実行不可能な場合にはシス
テムに応じて、システム停止処理やシステム回復処理等
適当な処理単位で再起動がかけられる。
以上の処理の後に、2重化システムとして動作が開始さ
れる。この時はプロセッサ301が主モードで動作し、
プロセッサ303が監視モードで動作する。再び監視モ
ードのプロセッサ303が誤動作を検出した場合にはい
ずれのプロセッサに障害が発生したかは判断不可能であ
る。よってシーケンサ307は両プロセッサを停止さ
せ、システムの破壊を最少にとどめる。以上のシーケン
サ307の状態遷移を第5図に示す。
ここでは3重化システムの場合を説明したがさらにプロ
セッサの台数を増した場合にも同様の考え方で拡張可能
である。
(7)実施例の効果の説明 本実施例は以上説明したように、少なくとも1台の主モ
ードプロセッサと複数台の監視モードプロセッサで多重
化システムを構成することによって、誤動作が検知され
た時点で総てのプロセッサを直ちに停止させ、誤動作し
たプロセッサをシステムから除去し、主モードプロセッ
サが正常であった場合には中断した命令を再開し、主モ
ードプロセッサに障害が認められた場合には監視モード
プロセッサの中の1台を主モードに切替え誤動作処理を
実行することにより、誤動作検出後のシステム回復処理
を容易かつ高速に実行することができる。
【図面の簡単な説明】
第1図は従来の多重化システムの構成ブロック図であ
る。101,102,103……マイクロプロセッサ,
104,105,106……比較器,107……ORゲ
ート。第2図は第1図の比較器の回路図である。201
……NANDゲート,202……ORゲート,203…
…ANDゲート。第3図は本発明の一実施例として3重
化システムを構成したブロック図である。301,30
2,303……マイクロプロセッサ,304……メモリ
及びIO装置,305……バス,306……システム制
御部,307……シーケンサ,308……誤動作プロセ
ッサ判定回路。第4図は誤動作検出後のシステム再構成
のために生成される情報フォーマット図である。第5図
は第3図のシーケンサの状態遷移を示すフローチャート
である。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】共通バスを介して相互接続された3つ以上
    のプロセッサであって、プログラムを実行して情報処理
    を行う通常モードと当該通常モードに指定されたプロセ
    ッサと同一のプログラムを実行して当該通常モードに指
    定されたプロセッサの実行状態と自身の実行状態とを比
    較し両者が不一致のときに異常信号を発生する監視モー
    ドとをそれぞれが有する3つ以上のプロセッサと、これ
    らプロセッサの中の一つを前記通常モードに指定し残り
    の複数のプロセッサをそれぞれ前記監視モードに指定す
    るとともに、前記監視モードに指定されたプロセッサの
    夫々が前記異常信号を発生したときは前記通常モードに
    指定されたプロセッサをシステムから切り離し前記監視
    モードに指定された複数のプロセッサの一つを前記通常
    モードに残りを前記監視モードにそれぞれ指定してシス
    テムを再構築し、前記監視モードに指定されたプロセッ
    サの一つが前記異常信号を発生したときは当該プロセッ
    サをシステムから切り離し残りのプロセッサをそれぞれ
    のモードに指定してシステムを再起動する制御手段とを
    備えることを特徴とする多重化システム。
JP59160469A 1984-07-31 1984-07-31 多重化システム Expired - Lifetime JPH0630069B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59160469A JPH0630069B2 (ja) 1984-07-31 1984-07-31 多重化システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59160469A JPH0630069B2 (ja) 1984-07-31 1984-07-31 多重化システム

Publications (2)

Publication Number Publication Date
JPS6139138A JPS6139138A (ja) 1986-02-25
JPH0630069B2 true JPH0630069B2 (ja) 1994-04-20

Family

ID=15715619

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59160469A Expired - Lifetime JPH0630069B2 (ja) 1984-07-31 1984-07-31 多重化システム

Country Status (1)

Country Link
JP (1) JPH0630069B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6362933A (ja) * 1986-09-01 1988-03-19 Mitsuboshi Belting Ltd 歯付きベルト
JP4525762B2 (ja) 2008-02-04 2010-08-18 株式会社デンソー 車両用電子制御装置
JP5541246B2 (ja) * 2011-07-21 2014-07-09 株式会社デンソー 電子制御ユニット
JP5772716B2 (ja) * 2012-05-21 2015-09-02 株式会社デンソー 電子制御装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5931738B2 (ja) * 1978-07-26 1984-08-03 株式会社日立製作所 計算機システムの並列三重系構成方法
JPS55154639A (en) * 1979-05-18 1980-12-02 Sanyo Electric Co Ltd Control system for microcomputer
JPS56108161A (en) * 1980-01-31 1981-08-27 Nec Corp Operation control system for multiprocessor

Also Published As

Publication number Publication date
JPS6139138A (ja) 1986-02-25

Similar Documents

Publication Publication Date Title
US6058490A (en) Method and apparatus for providing scaleable levels of application availability
US4610013A (en) Remote multiplexer terminal with redundant central processor units
US7802138B2 (en) Control method for information processing apparatus, information processing apparatus, control program for information processing system and redundant comprisal control apparatus
JPH03131939A (ja) 高信頼性コンピュータ診断システム
JP5013324B2 (ja) コンピュータ装置及びそのbiosアップデート方法
JPH11143729A (ja) フォールトトレラントコンピュータ
US20050204123A1 (en) Boot swap method for multiple processor computer systems
JPH0934809A (ja) 高信頼化コンピュータシステム
KR100279204B1 (ko) 자동제어시스템에서현장제어장치의콘트롤러이중화제어방법및그장치
JPH0630069B2 (ja) 多重化システム
JPH06131314A (ja) 中央処理装置の異常監視装置
JPH02132529A (ja) 自動監視切替制御装置
JPH03179538A (ja) データ処理システム
JPH08287030A (ja) 多重系計算機システムの自動再起動装置および方法
JP5477725B2 (ja) フォールトトレラント情報処理システム、及びデバッグ方法
JP2000066913A (ja) 任意プロセッサのプログラム・データ無中断更新システム
JPS60142431A (ja) 計算機
JPH02182054A (ja) マルチプロセッサシステム
JPS6213700B2 (ja)
CN116483631A (zh) 一种基于冷热双备份机制的综合化电气***及其运行方法
JP3055906B2 (ja) 緊急動作方式
JPS6113627B2 (ja)
JPH07114521A (ja) マルチマイクロコンピュータシステム
JP2002108638A (ja) マイクロコンピュータのエラー検出方法及びエラー検出回路及びマイクロコンピュータシステム
CN111857312A (zh) 一种基于x86平台的多设备复位方法及装置