JP2000347758A - Information processor - Google Patents

Information processor

Info

Publication number
JP2000347758A
JP2000347758A JP11156647A JP15664799A JP2000347758A JP 2000347758 A JP2000347758 A JP 2000347758A JP 11156647 A JP11156647 A JP 11156647A JP 15664799 A JP15664799 A JP 15664799A JP 2000347758 A JP2000347758 A JP 2000347758A
Authority
JP
Japan
Prior art keywords
processor
processors
temperature abnormality
information
memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11156647A
Other languages
Japanese (ja)
Inventor
Atsuo Mochizuki
敦雄 望月
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Computertechno Ltd
Original Assignee
NEC Computertechno Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Computertechno Ltd filed Critical NEC Computertechno Ltd
Priority to JP11156647A priority Critical patent/JP2000347758A/en
Publication of JP2000347758A publication Critical patent/JP2000347758A/en
Pending legal-status Critical Current

Links

Landscapes

  • Memory System Of A Hierarchy Structure (AREA)

Abstract

PROBLEM TO BE SOLVED: To eliminate the mismatching of a memory shared among processors by reflecting the necessary information of a cache memory owned by a processor in which a temperature fault takes place on the shared main storage memory and also to reduce the occurrence rate of the system failure of an information processor composed of a multiprocessor by providing a degenerating function. SOLUTION: This processor has N(>=2) pieces of processors 101 to 10N which internally have cache memories 111 to 11N, temperature abnormality detection notifying circuits 121 to 12N and status information registers 131 to 13N having the status information of the all processors 101 10N, a bus 150 which connects the temperature abnormality detection notifying circuits of the processor 101 to 10N and a bus 160 which connects the processors 101 to 10N with a main storage memory 140.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、情報処理装置シス
テムの障害発生時におけるシステム運転の継続技術に関
するもので、特に複数のプロセッサから構成されプロセ
ッサ間で共有する共有メモリを持ったマルチプロセッサ
システムにおいて、あるプロセッサで温度異常を検出し
た場合、該プロセッサの持つキャッシュメモリで更新の
必要な情報を前記共有メモリへ反映をし終えた後、該プ
ロセッサをシステムから切り離すマルチプロセッサシス
テムの縮退機能を持った情報処理装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a technique for continuing system operation when a failure occurs in an information processing system, and more particularly to a multiprocessor system having a shared memory composed of a plurality of processors and shared by the processors. When a temperature abnormality is detected in a certain processor, the multiprocessor system has a degeneration function of disconnecting the processor from the system after the information required to be updated in the cache memory of the processor is reflected in the shared memory. The present invention relates to an information processing device.

【0002】[0002]

【従来の技術】公報番号特開平8−314578にはマ
ルチプロセッサシステムにおいて温度の異常が発生した
時の制御方法が記載されている。それによると、各プロ
セッサの温度データを各プロセッサ毎に設けた温度セン
サーで取り込み、各プロセッサからの温度データについ
て、その変化量を予め規定された数値と比較する。比較
の結果が正常であればプロセッサへの給電を停止するこ
とはしないが、冷却装置等の障害により、温度が急上昇
している事を検出すると該当するプロセッサへの給電を
停止する。給電の停止により温度の低下傾向を検出する
と再び当該プロセッサへの給電を再開するという技術内
容が記載されている。
2. Description of the Related Art JP-A-8-314578 describes a control method when a temperature abnormality occurs in a multiprocessor system. According to this, temperature data of each processor is taken in by a temperature sensor provided for each processor, and the amount of change in the temperature data from each processor is compared with a predetermined numerical value. If the result of the comparison is normal, the power supply to the processor is not stopped. However, when it is detected that the temperature has risen sharply due to a failure in the cooling device or the like, the power supply to the corresponding processor is stopped. This document describes a technique in which when a tendency of a decrease in temperature is detected due to a stop of power supply, power supply to the processor is restarted again.

【0003】又、共有メモリを持ったマルチプロセッサ
構成で個々のプロセッサが固有のキャッシュメモリを持
つようなシステムのキャッシュメモリの制御において、
コピーバック方式を採用した場合、キャッシュメモリの
あるデータを変更すると、その変更時点では共有主記憶
メモリの書き換えは行われず、キャッシュメモリ上の空
きエントリが無く、空きのエントリをキャッシュメモリ
上に作り出す必要が生じた場合、はじめて該データの共
有主記憶メモリへの反映が行われる。
Further, in controlling a cache memory of a system in which each processor has a unique cache memory in a multiprocessor configuration having a shared memory,
When the copy-back method is used, if data in the cache memory is changed, the shared main memory is not rewritten at the time of the change, there is no free entry in the cache memory, and a free entry must be created in the cache memory. Occurs, the data is first reflected in the shared main memory.

【0004】[0004]

【発明が解決しようとする課題】以上の従来技術にある
問題点は、マルチプロセッサシステムを構成するあるプ
ロセッサが温度異常を検出した場合、当該プロセッサの
持つキャッシュメモリに共有された主記憶メモリ上に更
新すべきデータが存在しても該データの共有された主記
憶メモリへの反映が行われず、該プロセッサの動作を終
了させてしまう事である。そのため、共有メモリ上で複
数のプロセッサから共有されているデータについてプロ
セッサ間での一貫性が保証されないという問題が発生す
る。
The problem with the prior art described above is that when a certain processor constituting a multiprocessor system detects an abnormal temperature, it will be stored in a main memory shared by a cache memory of the processor. Even if there is data to be updated, the data is not reflected on the shared main memory, and the operation of the processor is terminated. Therefore, there is a problem that data shared by a plurality of processors on the shared memory is not guaranteed to be consistent between the processors.

【0005】又、その一貫性の保証を取ることが出来な
い場合は、あるプロセッサでの温度異常の発生によって
マルチプロセッサシステム全体をシステムダウンとする
場合もあった。
[0005] Further, when it is not possible to guarantee the consistency, there is a case where the entire multiprocessor system is brought down due to the occurrence of a temperature abnormality in a certain processor.

【0006】[0006]

【課題を解決するための手段】本願の第1の発明の情報
処理装置は、プロセッサで発生した温度異常をプロセッ
サ相互間で通知する為の第1のバスと、前記プロセッサ
と前記プロセッサが共有する主記憶メモリとを接続する
第2のバスとを有し、前記プロセッサはキャッシュメモ
リと、温度異常の検出を行い該検出した温度異常を他の
前記プロセッサに通知する温度異常検出通知回路と、前
記全プロセッサについて運転を休止している非稼働状態
か動作中の稼働状態かを表したステータス情報レジスタ
とを備える。
An information processing apparatus according to a first aspect of the present invention shares a first bus for notifying a processor of a temperature abnormality generated between processors, and the processor and the processor share the first bus. A second bus for connecting to a main storage memory, wherein the processor is a cache memory, and a temperature abnormality detection notification circuit that detects a temperature abnormality and notifies the other processor of the detected temperature abnormality; A status information register indicating whether the inactive state in which all the processors are inactive or the active state in operation.

【0007】本願の第2の発明の情報処理装置は、第1
の発明において、温度異常を検出した前記プロセッサ
は、他の稼働状態にある全プロセッサに該温度異常の通
知を行い他の稼働状態にある全プロセッサから前記ステ
ータス情報レジスタの該温度異常を検出したプロセッサ
に関する動作状態を非稼働状態とした通知を受けると自
プロセッサの有する前記キャッシュメモリ中の更新が必
要な情報を前記主記憶メモリに反映することを備える。
[0007] The information processing apparatus of the second invention of the present application comprises a first information processing apparatus.
In the invention, the processor that has detected the temperature abnormality is a processor that notifies all the processors in other operating states of the temperature abnormality and detects the temperature abnormality in the status information register from all the processors in other operating states. And receiving information that requires updating in the cache memory of the own processor in the main memory when receiving a notification that the operation state of the processor is inactive.

【0008】本願の第3の発明の情報処理装置は、第1
及び第2の発明において、温度異常を検出した前記プロ
セッサは、自プロセッサの有する前記キャッシュメモリ
内の更新を必要とする情報の前記主記憶メモリへの反映
を終了すると該終了通知を全プロセッサを代表するプロ
セッサを通して他の稼働状態にある全プロセッサに通知
し自プロセッサの動作状態を非稼働状態とすることを備
える。
[0008] An information processing apparatus according to a third aspect of the present invention comprises:
In the second invention, when the processor that has detected the temperature abnormality finishes reflecting the information that needs updating in the cache memory of the own processor in the main storage memory, the processor notifies the completion notification to all processors. And notifying all the processors in the other operating states through the executing processor and setting the operating state of the own processor to the non-operating state.

【0009】本願の第4の発明の情報処理装置は、第
1、第2及び第3の発明において、温度異常の通知を受
けた稼働状態にある全プロセッサは、温度異常の発生し
たプロセッサによる前記キャッシュメモリ中の更新が必
要な情報の前記主記憶メモリへの一連の反映処理の間は
非稼働状態に入り前記温度異常の発生したプロセッサに
よる前記一連の反映処理が終わると通常の動作状態に戻
ることを備える。
In the information processing apparatus according to a fourth aspect of the present invention, in the first, second and third aspects, all the processors in the operating state that have received the notification of the temperature abnormality are operated by the processor in which the temperature abnormality has occurred. During a series of reflection processing of information that needs to be updated in the cache memory to the main storage memory, a non-operating state is entered, and after the series of reflection processing by the processor in which the temperature abnormality has occurred, a normal operation state is returned. It is prepared.

【0010】本願の第5の発明の情報処理装置は、内部
にキャッシュメモリと温度の異常を検出しそれを他のプ
ロセッサに通知する温度異常検出通知機能と全プロセッ
サのステータス情報をもつステータス情報レジスタを有
するN(≧2)個のプロセッサと、該プロセッサの温度異
常検出通知機能を接続する第1のバスと、該プロセッサ
と主記憶メモリを接続する第2のバスを有するマルチプ
ロセッサ構成を有する情報処理装置において、前記N個
の内の(N−1)個までのプロセッサが温度異常を検出し
た場合には、温度異常を検出したプロセッサは実行中及
び実行待ち命令を完了し、該プロセッサのキャッシュメ
モリ情報を主記憶メモリに反映し、該プロセッサを稼働
状態から非稼働状態に遷移させることによるプロセッサ
の縮退機能を持つことを備える。
According to a fifth aspect of the present invention, there is provided a temperature information register having a temperature abnormality detection notification function for internally detecting an abnormality in a cache memory and a temperature and notifying the abnormality to another processor, and a status information register for all processors. Having a multiprocessor configuration including N (≧ 2) processors having a first bus for connecting the temperature abnormality detection notification function of the processor, and a second bus for connecting the processor and the main storage memory In the processing device, when up to (N-1) of the N processors detect a temperature anomaly, the processor that has detected the temperature anomaly completes the executing and waiting instructions and executes the cache of the processor. It has a processor degeneration function by reflecting memory information to the main memory and causing the processor to transition from the operating state to the non-operating state. And

【0011】本願の第6の発明の情報処理装置は、第1
の発明において、温度異常を検出した前記プロセッサ
は、前記キャッシュメモリの更新が必要な情報の前記主
記憶メモリへの反映が終了すると前記第2のバスに接続
された電源の制御を行う電源制御回路に自プロセッサへ
の給電の停止を指示することを備える。
[0011] The information processing apparatus according to a sixth aspect of the present invention comprises a first information processing apparatus.
In the invention, the processor that detects the temperature abnormality includes a power supply control circuit that controls a power supply connected to the second bus when the reflection of the information that requires updating of the cache memory to the main storage memory ends. Instructing the processor to stop supplying power to its own processor.

【0012】[0012]

【発明の実施の形態】次に、本発明の実施の形態につい
て図面を参照して詳細に説明する。
Next, embodiments of the present invention will be described in detail with reference to the drawings.

【0013】図1を参照すると、本発明の情報処理装置
の第1の実施の形態を示すブロック図である。
FIG. 1 is a block diagram showing a first embodiment of an information processing apparatus according to the present invention.

【0014】本実施の形態は、内部にキャッシュメモリ
111〜11Nと、温度異常検出通知回路121〜12
Nと、全プロセッサ101〜10Nのステータス情報を
もつステータス情報レジスタ131〜13Nと、を有す
るN(≧2)個のプロセッサ101〜10Nと、プロセッ
サ101〜10Nの温度異常検出通知回路121〜12
Nをプロセッサ101〜10N相互間で接続するバス1
50と、プロセッサ101〜I0Nと主記憶メモリ14
0を接続するバス160とを有している。
In this embodiment, the cache memories 111 to 11N and the temperature abnormality detection notification circuits 121 to 12 are internally provided.
N (N ≧ 2) processors 101 to 10N having N and status information registers 131 to 13N having status information of all the processors 101 to 10N, and temperature abnormality detection notification circuits 121 to 12 of the processors 101 to 10N.
Bus 1 for connecting N among processors 101 to 10N
50, processors 101-ION and main memory 14
And a bus 160 for connecting the 0.

【0015】次に、本発明の実施の形態の動作について
図1と図2のフローチャートを参照して説明する。
Next, the operation of the embodiment of the present invention will be described with reference to the flowcharts of FIGS.

【0016】まず、全てのプロセッサ101〜10Nが
稼働状態であるとする。その時、例えばN個のプロセッ
サ101〜10Nの内のある1個のプロセッサ102
が、温度異常検出回路122によって温度の異常を検出
した場合(S1)、プロセッサ102は、プロセッサ1
02が温度異常を検出した時点での実行中の命令及び実
行待ち命令を完了させ、それ以降の命令は実行しない状
態に入る(S2)。そして、プロセッサ102の温度異
常検出通知回路122は、バス150にて他のプロセッ
サ101、103〜10Nに対し、プロセッサ102の
温度異常の発生を通知し、プロセッサ102は他プロセ
ッサ101、103〜10Nからの応答待ち状態に入る
(S3)。
First, it is assumed that all the processors 101 to 10N are operating. At that time, for example, one processor 102 among the N processors 101 to 10N
However, when the temperature abnormality is detected by the temperature abnormality detection circuit 122 (S1), the processor 102
02 completes the command being executed and the command waiting to be executed at the time when the temperature abnormality is detected, and enters a state in which subsequent commands are not executed (S2). Then, the temperature abnormality detection notification circuit 122 of the processor 102 notifies the other processors 101, 103 to 10N via the bus 150 of the occurrence of the temperature abnormality of the processor 102. (S3).

【0017】温度異常検出回路122からの温度異常の
発生通知を受け取ったプロセッサ102以外の各プロセ
ッサ101、103〜10Nは、各プロセッサ101、
103〜10Nが保有するステータス情報レジスタ13
1、133〜13Nのなかのプロセッサ102に対応す
る動作表示状態を非稼働状態(ホールド状態ともいう)
に変更する(S4)。
Each of the processors 101, 103 to 10N other than the processor 102 having received the notification of the occurrence of the temperature abnormality from the temperature abnormality detection circuit 122,
Status information register 13 held by 103 to 10N
1, an operation display state corresponding to the processor 102 in 133 to 13N is a non-operation state (also referred to as a hold state).
(S4).

【0018】非稼働状態とは、他の稼働状態にあるプロ
セッサからの該非稼働状態にあるプロセッサへのなんら
かの情報の送信による活性化が行われないと稼働状態に
なることは出来ない状態を表している。
The non-operation state indicates a state in which the processor cannot be in the operation state unless activated by transmitting some information from the processor in the other operation state to the processor in the non-operation state. I have.

【0019】温度異常の通知を受けたプロセッサ10
1、103〜10Nは、温度異常を検出したプロセッサ
102に対応するステータス情報レジスタ131、13
3〜13Nのビットを非稼働状態にした時点で、温度異
常を検出したプロセッサ102にステータス情報の変更
完了通知をバス160にて通知し(S5)、自身のプロ
セッサ101、103〜10Nを非稼働状態に遷移させ
る(S6)。
The processor 10 which has been notified of the temperature abnormality
1, 103 to 10N are status information registers 131 and 13 corresponding to the processor 102 that has detected the temperature abnormality.
When the bits of 3 to 13N are set to the non-operation state, the processor 102 that has detected the temperature abnormality is notified of the change completion of the status information via the bus 160 (S5), and the own processors 101 and 103 to 10N are non-operation. The state is transited (S6).

【0020】この時プロセッサ101、103〜10N
は非稼働状態に入るが一時的なものであるためステータ
ス情報レジスタ131、133〜13Nは操作しない。
At this time, the processors 101, 103 to 10N
Enters a non-operating state but is temporary, so that the status information registers 131, 133 to 13N are not operated.

【0021】温度異常を検出したプロセッサ102は、
前記ステータス情報の変更完了通知を他プロセッサ10
1、103〜10Nから全て受け付けた時点で(S
7)、プロセッサ102のキャッシュメモリ112上の
情報で主記憶メモリ140への更新が行われていないも
のについて、バス160にて主記憶メモリ140に反映
する(S8)。
When the processor 102 detects the temperature abnormality,
The status information change completion notification is sent to another processor 10.
(S)
7) The information in the cache memory 112 of the processor 102 that has not been updated in the main memory 140 is reflected on the main memory 140 via the bus 160 (S8).

【0022】そしてプロセッサ102は、予めN個のプ
ロセッサ101〜10Nを代表する権利を与えられたプ
ロセッサ(代表プロセッサという)101に主記憶書き
込み完了通知をバス160にて通知して(S9)非稼働
状態に入る(S10)。
The processor 102 notifies the processor (referred to as a representative processor) 101 that has been given the right to represent the N processors 101 to 10N in advance with a main memory write completion notice via the bus 160 (S9). The state is entered (S10).

【0023】非稼働状態であった代表プロセッサ101
は、プロセッサ102からの主記憶書き込み完了通知に
よって起動され、自身のプロセッサ101のステータス
情報レジスタ131の情報を参照して、バス160にて
稼働可能なプロセッサ103〜10Nの非稼働状態を解
除する通知を行い、稼働可能なプロセッサ103〜10
Nの動作を再開させる(S11)。尚、この時ステータ
ス情報レジスタ131は前述したようにプロセッサ10
2のみが非稼働状態である事を表している。
The representative processor 101 that has been in a non-operation state
Is activated by a main memory write completion notification from the processor 102 and refers to the information in the status information register 131 of the processor 101 to release the non-operating state of the processors 103 to 10N operable on the bus 160. And the operable processors 103 to 10
The operation of N is restarted (S11). At this time, the status information register 131 stores the processor 10 as described above.
Only 2 indicates the non-operation state.

【0024】この代表プロセッサの決め方は自由でよい
が、例えば最初はプロセッサ101としておき、プロセ
ッサ101で温度異常が発生するとその通知を受けた他
のプロセッサは自動的にプロセッサ102を代表プロセ
ッサとする論理を使用するのが自然である。その時ステ
ータス情報レジスタ131〜13Nを参照することでプ
ロセッサ102が既に温度異常によって非稼働状態であ
ることが分かればプロセッサ103が代表プロセッサと
なる。この論理に対応する回路は全てのプロセッサ10
1〜10Nに組み込まれる。
The method of determining the representative processor may be freely determined. For example, the processor 101 is initially set as the first processor, and when an abnormal temperature occurs in the processor 101, the other processor which has received the notification automatically sets the processor 102 as the representative processor. It is natural to use At this time, by referring to the status information registers 131 to 13N, if it is determined that the processor 102 is already in the non-operation state due to the temperature abnormality, the processor 103 becomes the representative processor. The circuits corresponding to this logic are all processors 10
1 to 10N.

【0025】前述の説明では代表プロセッサをプロセッ
サ101としプロセッサ102で温度異常が発生した場
合を説明したが、さらにこの状態において、代表プロセ
ッサ101で温度異常が発生したとする。代表プロセッ
サ101は命令の実行を中断し、ステータス情報レジス
タ131を参照して温度異常の通知を送信する対象とな
るプロセッサ101〜10Nを探し、それがプロセッサ
103〜10Nであることを検出する。
In the above description, the case where the representative processor is the processor 101 and a temperature abnormality has occurred in the processor 102 has been described. In this state, it is further assumed that a temperature abnormality has occurred in the representative processor 101. The representative processor 101 interrupts the execution of the instruction, refers to the status information register 131, searches for the processors 101 to 10N to which the notification of the temperature abnormality is to be transmitted, and detects that they are the processors 103 to 10N.

【0026】代表プロセッサ101は自身の温度異常の
通知をプロセッサ103〜10Nに対して送信する。こ
の通知を受けた状態で代表プロセッサはプロセッサ10
3に自動的に切り替わる事になる。プロセッサ103〜
10Nはステータス情報レジスタ133〜13Nのプロ
セッサ101に対応するビットを非稼働状態の表示にし
ステータス情報の変更完了通知をプロセッサ101に応
答する。以降は前述した通りである。プロセッサ101
は自身の持つキャッシュメモリ111の主記憶メモリ1
40への反映を終えると代表プロセッサ103へ主記憶
書き込み完了通知を行い、プロセッサ101は非稼働状
態に入る。
The representative processor 101 transmits a notification of its own temperature abnormality to the processors 103 to 10N. The representative processor receives the notification and the processor 10
It will automatically switch to 3. Processor 103-
10N makes the bits of the status information registers 133 to 13N corresponding to the processor 101 indicate the non-operating state, and responds to the processor 101 with a status information change completion notification. The subsequent steps are as described above. Processor 101
Is the main storage memory 1 of the cache memory 111 owned by itself.
Upon completion of the reflection on the main processor 40, the main processor 103 notifies the representative processor 103 of the completion of writing to the main memory, and the processor 101 enters a non-operation state.

【0027】N台あるプロセッサ101〜10Nのう
ち、(N−2)台のプロセッサが温度の異常により非稼
働状態になった状態では、稼働状態のプロセッサ数は2
台であるが、その状態で一方のプロセッサで温度の異常
が発生すると、2台のプロセッサ間で前述したような動
作が行われる。
In a state in which (N-2) processors out of the N processors 101 to 10N have become inactive due to abnormal temperature, the number of active processors is two.
If the temperature of one of the processors is abnormal in this state, the above-described operation is performed between the two processors.

【0028】その状態においては、最後の1台のみが動
作する事になるがその最後の1台においても温度の異常
が検出されるとシステムは停止状態となる。
In this state, only the last one operates, but even if the last one detects an abnormal temperature, the system is stopped.

【0029】次に、本発明の第2の実施の態様(図3)
について図面を参照して詳細に説明する。
Next, a second embodiment of the present invention (FIG. 3)
Will be described in detail with reference to the drawings.

【0030】図3を参照すると、本発明の第2の実施の
形態の構成は、第1の実施の形態の構成において、さら
に電源を制御する電源制御回路170と電源制御回路1
70の指示に従って各プロセッサや主記憶メモリ140
に電力を供給する電源供給回路180を有し、電源制御
回路170がバス160に接続されており、電源供給回
路180は各装置への給電を行う電力供給線を有してい
る点が異なっている。
Referring to FIG. 3, the configuration of the second embodiment of the present invention is different from the configuration of the first embodiment in that a power supply control circuit 170 and a power supply control circuit 1 for further controlling the power supply are provided.
Each processor and main memory 140 according to the instruction of 70
Power supply circuit 180 for supplying power to the power supply, a power supply control circuit 170 is connected to the bus 160, and the power supply circuit 180 has a power supply line for supplying power to each device. I have.

【0031】他の構成は同一の為、電源の停止に関わる
点を説明する。
Since the other configurations are the same, points related to the stop of the power supply will be described.

【0032】全プロセッサが稼働中の状態において、先
と同様にプロセッサ102において温度異常が発生した
とする。前述したような処理によってプロセッサ102
はキャッシュメモリ112の中の更新が必要な情報を主
記憶メモリ140に反映し終えたものとする。
It is assumed that a temperature abnormality has occurred in the processor 102 in a state where all the processors are in operation as described above. By the processing as described above, the processor 102
Indicates that the information that needs to be updated in the cache memory 112 has been reflected in the main memory 140.

【0033】プロセッサ102は代表プロセッサ101
に主記憶書き込み完了通知を送るが、続いて自分のプロ
セッサ識別番号を電源制御回路にバス160を通じて電
源制御回路170に送り自プロセッサ102への給電を
停止するように指示して非稼働状態に入る。これを受け
た電源制御回路170は電源供給回路180にプロセッ
サ102への給電停止を要求し電源供給回路180はプ
ロセッサ102への給電を停止する。
The processor 102 is a representative processor 101
To the power supply control circuit 170 via the bus 160, and instructs the power supply control circuit 170 to stop supplying power to the own processor 102 and enters a non-operation state. . In response to this, the power supply control circuit 170 requests the power supply circuit 180 to stop supplying power to the processor 102, and the power supply circuit 180 stops supplying power to the processor 102.

【0034】[0034]

【発明の効果】第1の効果は、温度障害の発生したプロ
セッサの持つキャッシュメモリの必要な情報を共有主記
憶メモリに反映することでプロセッサ間での共有メモリ
での不整合をなくす事ができ、第2の効果として縮退機
能をもつことで、マルチプロセッサからなる情報処理装
置のシステムダウンの発生率を低減することである。
The first effect is that the inconsistency in the shared memory between the processors can be eliminated by reflecting the necessary information of the cache memory of the processor in which the temperature failure has occurred in the shared main memory. The second effect is to reduce the rate of system down of an information processing device including a multiprocessor by having a degeneration function.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の第1の実施の形態を示すブロック図で
ある。
FIG. 1 is a block diagram showing a first embodiment of the present invention.

【図2】本発明の第1の実施の形態を示すフローチャー
トである。
FIG. 2 is a flowchart showing a first embodiment of the present invention.

【図3】本発明の第2の実施の形態を示すブロック図で
ある。
FIG. 3 is a block diagram showing a second embodiment of the present invention.

【符号の説明】[Explanation of symbols]

101〜10N プロセッサ 111〜11N キャッシュメモリ 121〜12N 温度異常検出通知回路 131〜13N ステータス情報レジスタ 140 主記憶メモリ 150 温度異常検出通知回路を接続するバス 160 プロセッサと主記憶メモリを接続するバス 170 電源制御回路 180 電源供給回路 101 to 10N Processor 111 to 11N Cache Memory 121 to 12N Temperature Abnormality Detection Notification Circuit 131 to 13N Status Information Register 140 Main Storage Memory 150 Bus for Connecting Temperature Abnormality Detection Notification Circuit 160 Bus for Connecting Processor and Main Storage Memory 170 Power Control Circuit 180 Power supply circuit

Claims (6)

【特許請求の範囲】[Claims] 【請求項1】 プロセッサで発生した温度異常をプロセ
ッサ相互間で通知する為の第1のバスと、前記プロセッ
サと前記プロセッサが共有する主記憶メモリとを接続す
る第2のバスとを有し、前記プロセッサはキャッシュメ
モリと、温度異常の検出を行い該検出した温度異常を他
の前記プロセッサに通知する温度異常検出通知回路と、
前記全プロセッサについて運転を休止している非稼働状
態か動作中の稼働状態かを表したステータス情報レジス
タとを備えることを特徴とする情報処理装置。
A first bus for notifying a processor of a temperature abnormality occurring between the processors, and a second bus connecting the processor and a main memory shared by the processors; The processor is a cache memory, a temperature abnormality detection notification circuit that detects a temperature abnormality and notifies the other processor of the detected temperature abnormality,
An information processing apparatus, comprising: a status information register indicating whether a non-operating state in which operation is suspended or an operating state in operation for all the processors.
【請求項2】 温度異常を検出した前記プロセッサは、
他の稼働状態にある全プロセッサに該温度異常の通知を
行い他の稼働状態にある全プロセッサから前記ステータ
ス情報レジスタの該温度異常を検出したプロセッサに関
する動作状態を非稼働状態とした通知を受けると自プロ
セッサの有する前記キャッシュメモリ中の更新が必要な
情報を前記主記憶メモリに反映することを特徴とする請
求項1記載の情報処理装置。
2. The processor, which detects an abnormal temperature,
Notifying all the processors in other operating states of the temperature abnormality and receiving a notification from all the processors in other operating states that the operating state of the processor that has detected the temperature abnormality in the status information register has been set to the non-operating state. 2. The information processing apparatus according to claim 1, wherein information required to be updated in the cache memory of the own processor is reflected in the main storage memory.
【請求項3】 温度異常を検出した前記プロセッサは、
自プロセッサの有する前記キャッシュメモリ内の更新を
必要とする情報の前記主記憶メモリへの反映を終了する
と該終了通知を全プロセッサを代表するプロセッサを通
して他の稼働状態にある全プロセッサに通知し自プロセ
ッサの動作状態を非稼働状態とする事を特徴とする請求
項1及び2記載の情報処理装置。
3. The processor that detects a temperature abnormality,
When the reflection of the information that needs updating in the cache memory of the own processor to the main storage memory is completed, the completion notification is notified to all the processors in other operating states through the processor representing all the processors. 3. The information processing apparatus according to claim 1, wherein the operation state is set to a non-operation state.
【請求項4】 温度異常の通知を受けた稼働状態にある
全プロセッサは、温度異常の発生したプロセッサによる
前記キャッシュメモリ中の更新が必要な情報の前記主記
憶メモリへの一連の反映処理の間は非稼働状態に入り前
記温度異常の発生したプロセッサによる前記一連の反映
処理が終わると通常の動作状態に戻ることを特徴とする
請求項1、2及び3記載の情報処理装置。
4. The processor in the operating state, which has received the notification of the temperature abnormality, operates during a series of reflection processing of the information required to be updated in the cache memory to the main storage memory by the processor in which the temperature abnormality has occurred. 4. The information processing apparatus according to claim 1, wherein the processor enters a non-operation state and returns to a normal operation state after the series of reflection processing by the processor in which the temperature abnormality has occurred.
【請求項5】 内部にキャッシュメモリと温度の異常を
検出しそれを他のプロセッサに通知する温度異常検出通
知機能と全プロセッサのステータス情報をもつステータ
ス情報レジスタを有するN(≧2)個のプロセッサと、該
プロセッサの温度異常検出通知機能を接続する第1のバ
スと、該プロセッサと主記憶メモリを接続する第2のバ
スを有するマルチプロセッサ構成を有する情報処理装置
において、前記N個の内の(N−1)個までのプロセッサ
が温度異常を検出した場合には、温度異常を検出したプ
ロセッサは実行中及び実行待ち命令を完了し、該プロセ
ッサのキャッシュメモリ情報を主記憶メモリに反映し、
該プロセッサを稼働状態から非稼働状態に遷移させるこ
とによるプロセッサの縮退機能をもつことを特徴とする
情報処理装置。
5. N (≧ 2) processors having a cache memory and a temperature abnormality detection notification function for detecting an abnormality in temperature and notifying the abnormality to other processors, and a status information register having status information of all processors. An information processing apparatus having a multi-processor configuration having a first bus connecting a function for notifying a temperature abnormality detection of the processor and a second bus connecting the processor and a main storage memory; When up to (N-1) processors detect a temperature abnormality, the processor that has detected the temperature abnormality completes the executing and waiting instructions, reflects the cache memory information of the processor in the main memory,
An information processing apparatus having a processor degeneration function by causing the processor to transition from an operating state to a non-operating state.
【請求項6】 温度異常を検出した前記プロセッサは、
前記キャッシュメモリの更新が必要な情報の前記主記憶
メモリへの反映が終了すると前記第2のバスに接続され
た電源の制御を行う電源制御回路に自プロセッサへの給
電の停止を指示する事を特徴とする請求項1記載の情報
処理装置。
6. The processor having detected the temperature abnormality,
When the reflection of the information that requires updating of the cache memory to the main storage memory is completed, the power supply control circuit that controls the power supply connected to the second bus is instructed to stop supplying power to its own processor. The information processing apparatus according to claim 1, wherein:
JP11156647A 1999-06-03 1999-06-03 Information processor Pending JP2000347758A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11156647A JP2000347758A (en) 1999-06-03 1999-06-03 Information processor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11156647A JP2000347758A (en) 1999-06-03 1999-06-03 Information processor

Publications (1)

Publication Number Publication Date
JP2000347758A true JP2000347758A (en) 2000-12-15

Family

ID=15632240

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11156647A Pending JP2000347758A (en) 1999-06-03 1999-06-03 Information processor

Country Status (1)

Country Link
JP (1) JP2000347758A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005527022A (en) * 2002-03-15 2005-09-08 インテル コーポレイション Processor temperature control interface
JP2008052550A (en) * 2006-08-25 2008-03-06 Nec Computertechno Ltd Multiprocessor system, memory control/coherency control apparatus, and method for guaranteeing coherency
JP2013521556A (en) * 2010-03-01 2013-06-10 エイアールエム リミテッド Data processing apparatus and method for transferring a workload between a transfer source processing circuit and a transfer destination processing circuit
US9170617B2 (en) 2009-06-30 2015-10-27 Kabushiki Kaisha Toshiba Information processing apparatus to selectively disable or throttle an external graphics controller

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005527022A (en) * 2002-03-15 2005-09-08 インテル コーポレイション Processor temperature control interface
JP2011070702A (en) * 2002-03-15 2011-04-07 Intel Corp Processor temperature control interface
JP4717352B2 (en) * 2002-03-15 2011-07-06 インテル コーポレイション Processor temperature control interface
JP2012238337A (en) * 2002-03-15 2012-12-06 Intel Corp Processor temperature control interface
JP2014017018A (en) * 2002-03-15 2014-01-30 Intel Corp Processor temperature control interface
JP2008052550A (en) * 2006-08-25 2008-03-06 Nec Computertechno Ltd Multiprocessor system, memory control/coherency control apparatus, and method for guaranteeing coherency
US9170617B2 (en) 2009-06-30 2015-10-27 Kabushiki Kaisha Toshiba Information processing apparatus to selectively disable or throttle an external graphics controller
JP2013521556A (en) * 2010-03-01 2013-06-10 エイアールエム リミテッド Data processing apparatus and method for transferring a workload between a transfer source processing circuit and a transfer destination processing circuit
US9286222B2 (en) 2010-03-01 2016-03-15 Arm Limited Data processing apparatus and method for transferring workload between source and destination processing circuitry

Similar Documents

Publication Publication Date Title
US7251746B2 (en) Autonomous fail-over to hot-spare processor using SMI
JP6438353B2 (en) Semiconductor device and diagnostic test method
JP5347414B2 (en) Synchronization control device, information processing device, and synchronization management method
EP2966650A2 (en) Memory built-in self test for a data processing apparatus
JPH0651802A (en) Programmable controller having backup function
CN101122877A (en) Duplex system and processor switching method
JP2009211517A (en) Virtual computer redundancy system
JP3301992B2 (en) Computer system with power failure countermeasure and method of operation
JP4653838B2 (en) Arithmetic processing device, control method of arithmetic processing device, and control program
EP0477385B1 (en) Method of resetting adapter module at failing time and computer system executing said method
JP2008083996A (en) Information processing apparatus, apparatus for controlling the same, method for controlling the same, and control program
JP2000347758A (en) Information processor
JP2001290758A (en) Computer system
JP3536293B2 (en) Redundant computer equipment
EP3428799B1 (en) Data access device and access error notification method
JP2019016218A (en) Information processing device, control device, and control method of information processing device
JP2003223338A (en) Duplex system
JPH08220198A (en) Battery backup memory unit and backup function testing method
JPH05216855A (en) Multi-cpu control system
JP2000172575A (en) Memory backup system
JP2815730B2 (en) Adapters and computer systems
JPH0395634A (en) Restart control system for computer system
JPH10247185A (en) Fault diagnostic system for processor
JPH0822441A (en) Information processor and its communication error detecting method
JP2009020545A (en) Anomaly monitoring device for computer

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20031118