JPH01154257A - Mutual monitor processing system - Google Patents

Mutual monitor processing system

Info

Publication number
JPH01154257A
JPH01154257A JP62314767A JP31476787A JPH01154257A JP H01154257 A JPH01154257 A JP H01154257A JP 62314767 A JP62314767 A JP 62314767A JP 31476787 A JP31476787 A JP 31476787A JP H01154257 A JPH01154257 A JP H01154257A
Authority
JP
Japan
Prior art keywords
monitoring
host computer
value
processing
count value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62314767A
Other languages
Japanese (ja)
Inventor
Hajime Maeda
一 前田
Masayoshi Nakao
昌善 中尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Nippon Telegraph and Telephone Corp
Original Assignee
Fujitsu Ltd
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd, Nippon Telegraph and Telephone Corp filed Critical Fujitsu Ltd
Priority to JP62314767A priority Critical patent/JPH01154257A/en
Publication of JPH01154257A publication Critical patent/JPH01154257A/en
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)
  • Multi Processors (AREA)

Abstract

PURPOSE:To perform mutual monitoring among host computers in simple constitution by adding a monitor device to a memory which is shared by many host computers. CONSTITUTION:A monitor processing part 23 is started by timer interruption for each proper time, for example, and therefore reads all monitor counters 22 allocated to the host computers 20 out of a memory 21 in a process step 30. Each value of the counter 22 is compared with zero, for example, in a step 31. If the count value is larger than zero, it is decided that the corresponding host computer is normally working. Then -1 is added to the count value in a step 32. While an abnormal state of the computer is decided if the count value is equal to zero. Then the informed fault is processed in a step 33. The step 33 is reset to the step 31 via a step 34 after a certain process. Then the next count value is processed in the same way and the step 34 proceeds to a step 35 when all count values are processed.

Description

【発明の詳細な説明】 〔概 要〕 情報処理システムにおける、複数のホスト計算機の状態
を相互に監視する処理方式に関し、簡易で効率のよい手
段によって確実に他ホスト計算機の状態を識別できる相
互監視処理方式を目的とし、 複数のホスト計算機と、該ホスト計算機から共用される
記憶装置を有する情報処理システムにおいて、該記憶装
置に、各該ホスト計算機ごとに個別に対応するように監
視カウンタを設け、各該ホスト計算機は所定周期ごとに
、該ホスト計算機に対応する該監視カウンタに、所定の
初期値を設定し、所定の他の該ホスト計算機に対応する
該監視カウンタに保持する値を、所定周期ごとに所定値
だけ変化し、該監視カウンタの値を使用して、該監視カ
ウンタに対応する該ホスト計算機の状態を判定するよう
に構成する。
[Detailed Description of the Invention] [Summary] Regarding a processing method for mutually monitoring the status of multiple host computers in an information processing system, mutual monitoring that can reliably identify the status of other host computers by a simple and efficient means is provided. In an information processing system having a plurality of host computers and a storage device shared by the host computers, a monitoring counter is provided in the storage device so as to correspond to each host computer individually, Each host computer sets a predetermined initial value in the monitoring counter corresponding to the host computer at a predetermined period, and sets the value held in the monitoring counter corresponding to the other predetermined host computer at a predetermined period. The configuration is configured such that the value of the monitoring counter changes by a predetermined value every time, and the state of the host computer corresponding to the monitoring counter is determined using the value of the monitoring counter.

〔産業上の利用分野〕[Industrial application field]

本発明は、情報処理システムにおける、複数のホスト計
算機の状態を相互に監視する処理方式に関する。
The present invention relates to a processing method for mutually monitoring the status of multiple host computers in an information processing system.

複数のホスト計算機が、磁気ディスク記憶装置等を共用
して、負荷分担等を可能にした情報処理システムはよく
知られ、そのようなシステムでは、それらホスト計算機
が稼働しているか、停止しているかの状態を、しばしば
相互に監視するようにする。
Information processing systems in which multiple host computers share a magnetic disk storage device to enable load sharing are well known. often monitor each other's status.

〔従来の技術と発明が解決しようとする問題点〕第3図
は情報処理システムの構成例を示すブロック図である。
[Prior art and problems to be solved by the invention] FIG. 3 is a block diagram showing an example of the configuration of an information processing system.

図において、複数のホスト計算機1は、磁気ディスク記
憶装置等で構成された記憶袋W2に接′続され、所要の
データを共用することができる。
In the figure, a plurality of host computers 1 are connected to a storage bag W2 composed of a magnetic disk storage device or the like, and can share required data.

記憶装置2には、ホスト計算機1の相互監視のために、
タイムスタンプ3の記憶領域が各ホスト計算機に対応し
て設けられる。
In the storage device 2, for mutual monitoring of the host computer 1,
A storage area for timestamp 3 is provided corresponding to each host computer.

各ホスト計算機lの監視処理部4は、例えば第4図の処
理の流れに示すように、適当な時間間隔でいわゆるタイ
マ割込を発生させて起動すると、処理ステップ10でク
ロック5から現時刻を読み出し、処理ステップ11で記
憶装置2の1計算機に割り当てられているタイムスタン
プ3にその時刻を書き込む。
For example, as shown in the processing flow in FIG. 4, the monitoring processing unit 4 of each host computer 1 starts up by generating a so-called timer interrupt at an appropriate time interval, and then receives the current time from the clock 5 in processing step 10. The time is read and written in the time stamp 3 assigned to one computer in the storage device 2 in processing step 11.

次に処理ステップ12で他のホスト計算機lに対応する
タイムスタンプ3を読み出して、各タイムスタンプの値
について次のように監視する。
Next, in processing step 12, the time stamp 3 corresponding to the other host computer 1 is read out, and the value of each time stamp is monitored as follows.

即ち、1つのタイムスタンプ値について、処理ステップ
13で現時刻と比較する。
That is, one time stamp value is compared with the current time in processing step 13.

比較の結果、タイムスタンプ値が現時刻以前の所定の範
囲内であれば、それに対応するホスト計算機は近い時点
にタイムスタンプを書き込んでいるので、正常に稼働し
ているとみなし、処理ステップ15を経て処理ステップ
13に戻り、次のタイムスタンプ値を処理する。
As a result of the comparison, if the timestamp value is within a predetermined range before the current time, the corresponding host computer has written a timestamp at a nearby point in time, so it is assumed that it is operating normally, and processing step 15 is performed. Then, the process returns to step 13 to process the next timestamp value.

もし処理ステップ13の比較結果が上記で無い場合には
、そのタイムスタンプ値に対応するホスト計算機が所定
の時間内にタイムスタンプを書き込む処理を実行しなか
ったことを示し、当該ホスト計算機は正常に稼働してい
ないと判断して、処理ステップ14において、障害通知
を出力する等の所定の障害処理を行う。
If the comparison result in processing step 13 is not as above, it indicates that the host computer corresponding to the timestamp value did not execute the process of writing the timestamp within the predetermined time, and the host computer has not performed normally. It is determined that the computer is not operating, and predetermined failure processing such as outputting a failure notification is performed in processing step 14.

以上のようにして、タイムスタンプ値をすべて処理する
と、処理ステップ15を経て処理ステップ16において
、次の処理のために割込タイマを適当な時間にセットし
て処理を終わる。
When all the time stamp values have been processed in the manner described above, the interrupt timer is set to an appropriate time for the next process in process step 15 and process step 16, and the process ends.

以上の監視処理を各ホスト計算機1の監視処理部4がそ
れぞれ実行することにより、相互に稼働状態を監視する
ことができるが、特に24時間連続サービスを行うよう
なシステムでは、日、月、年の変わりを考慮して、十分
な長さのタイムスタンプ値にする必要があるので、記憶
領域、監視処理時間の上の不利がある。
By having the monitoring processing unit 4 of each host computer 1 execute the above-mentioned monitoring processing, it is possible to mutually monitor the operating status of each other. Since it is necessary to set a timestamp value of sufficient length to take into account changes in the time, there are disadvantages in terms of storage space and monitoring processing time.

本発明は、より簡易な手段で、確実に他ホスト計算機の
状態を識別できる相互監視処理方式を目的とする。
An object of the present invention is to provide a mutual monitoring processing method that can reliably identify the status of other host computers using simpler means.

〔問題点を解決するための手段〕[Means for solving problems]

第1図は、本発明の構成を示すブロック図である。 FIG. 1 is a block diagram showing the configuration of the present invention.

図は情報処理システムの構成を示し、20はホスト計算
機、21は複数のホスト計算機20が共用する記憶装置
、22は各ホスト計算機20にそれぞれ対応して、記憶
装置21に設ける監視カウンタ、23は各ホスト計算機
20において監視カウンタ22を使用して相互監視処理
を実行する監視処理部である。
The figure shows the configuration of an information processing system, where 20 is a host computer, 21 is a storage device shared by a plurality of host computers 20, 22 is a monitoring counter provided in the storage device 21 corresponding to each host computer 20, and 23 is a storage device shared by a plurality of host computers 20. This is a monitoring processing unit that uses the monitoring counter 22 in each host computer 20 to execute mutual monitoring processing.

〔作 用〕[For production]

情報処理システムを構成する複数のホスト計算機20が
、共用する記憶装置21の記憶領域に、各ホスト計算機
20ごとの監視カウンタ22を持つ。
A plurality of host computers 20 constituting an information processing system have a monitoring counter 22 for each host computer 20 in a storage area of a shared storage device 21.

各ホスト計算機20の監視処理部23は、適当な時間ご
とにそれぞれ起動して、0計算機割当の監視カウンタ2
2に所定の初期値を設定する。
The monitoring processing unit 23 of each host computer 20 starts up at an appropriate time and updates the monitoring counter 2 assigned to 0 computers.
2 to a predetermined initial value.

又、自身以外の監視カウンタ22の値を、それぞれその
時のカウント値から所定値だけ所定の増減をしておく。
Further, the values of the monitoring counters 22 other than the monitoring counter 22 are each increased or decreased by a predetermined value from the current count value.

このようにして、監視カウンタ22の値を適当なときに
チエツクすれれば、停止したホスト計算機20に対応す
る監視カウンタ22の値は、初期値の再設定が無しに、
一定方向に増/濾されるので、゛監視カウンタ22の値
が一定値を越えたことにより、対応するホスト計算機2
0の異常を検出できる。
In this way, by checking the value of the monitoring counter 22 at an appropriate time, the value of the monitoring counter 22 corresponding to the stopped host computer 20 can be changed without resetting the initial value.
Since the value is increased/filtered in a certain direction, ``When the value of the monitoring counter 22 exceeds a certain value, the corresponding host computer 2
0 abnormalities can be detected.

〔実施例〕〔Example〕

第2図に、各ホスト計算820の監視処理部23におけ
る、実施例の監視処理の流れを示す。
FIG. 2 shows the flow of monitoring processing in the embodiment in the monitoring processing unit 23 of each host calculation 820.

第1図の監視処理部23は、従来のように例えば適当な
時間ごとにタイマ割込によって起動すると、第2図の処
理ステップ30で先ず記憶装置21から、他のホスト計
算機20に割り当てた監視カウンタ22をすべて読み出
す。
When the monitoring processing unit 23 in FIG. 1 is activated, for example, by a timer interrupt at an appropriate time as in the past, in processing step 30 in FIG. Read all counters 22.

読み出した監視カウンタ22の各カウント値について、
処理ステップ31で例えばカウント値が0より大きいか
比較し、大きければ対応するホスト計算機は正常に稼働
中とみなし、処理ステップ32でカウント値を−1する
For each read count value of the monitoring counter 22,
In processing step 31, it is compared whether the count value is greater than 0, for example, and if it is, it is assumed that the corresponding host computer is operating normally, and in processing step 32, the count value is decremented by 1.

カウント値がOになっていた場合には、対応するホスト
計算機が正常で無いと判断し、処理ステップ33で従来
のように、障害通知等の異常処理をする。
If the count value is O, it is determined that the corresponding host computer is not normal, and in processing step 33, abnormality processing such as notification of a failure is performed as in the conventional method.

何れかの処理の後、処理ステップ34を経て処理ステッ
プ31に戻り次のカウント値を前記のように処理し、す
べてのカウント値を処理すれば、処理ステップ34から
処理ステップ35に進む。なお、以上の処理の結果、自
身のカウンタについても処理ステップ31.32が無駄
に実行されるが差支え無く、自身のカウンタを除くため
の判定を毎繰り返しで行うより一般に効率がよい。
After any of the processes, the process returns to process step 31 via process step 34 and processes the next count value as described above, and when all count values have been processed, process proceeds from process step 34 to process step 35. Incidentally, as a result of the above processing, processing steps 31 and 32 are also executed in vain for the own counter, but this is okay and is generally more efficient than making a determination to exclude the own counter every time.

処理ステップ35で、百計算機に割り当てられている監
視カウンタ22に相当するカウント値を一定の初期値に
設定する。
In processing step 35, the count value corresponding to the monitoring counter 22 assigned to the 100 computer is set to a constant initial value.

処理ステップ36で前記の処理で更新したすべてのカウ
ント値と初期値を共に、記憶装置21上の各監視カウン
タ22に書き込み、処理ステップ37で次の監視処理の
ために割込タイマをセットして処理を終わる。
In processing step 36, all the count values and initial values updated in the above processing are written to each monitoring counter 22 on storage device 21, and in processing step 37, an interrupt timer is set for the next monitoring processing. Finish processing.

以上の処理を各監視処理部23が実行することにより、
実時間のタイムスタンプ等を使用しない簡易な処理で、
ホスト計算機20の稼働状態を相互に監視し、異常の発
生を確実に検出できる。
By each monitoring processing unit 23 executing the above processing,
Simple processing that does not use real-time timestamps, etc.
The operating states of the host computers 20 can be mutually monitored and the occurrence of an abnormality can be reliably detected.

なお、前記例では各監視処理部23が、すべての監視カ
ウンタ22を処理することとしたが、各監視処理部23
によって異なる監視範囲を分担するようにしてもよい。
In the above example, each monitoring processing section 23 processes all the monitoring counters 22, but each monitoring processing section 23
Different monitoring ranges may be assigned to different groups.

又他の監視カウンタ22のカウント値を各監視ごとに1
づつ減じて、0になるのを監視する例を示したが、変化
値は1に限らず、又増加させるようにしてもよ(、それ
らに応じて適当に設定する限界値によって、異常を検出
できることは明らかである。
Also, the count value of the other monitoring counter 22 is set to 1 for each monitoring.
We have shown an example in which the change value is decreased step by step and monitored until it reaches 0, but the change value is not limited to 1 and may also be increased (anomalies can be detected by setting appropriate limit values accordingly). It is clear that it can be done.

〔発明の効果〕〔Effect of the invention〕

以」二の説明から明らかなように本発明によれば、情報
処理システムにおける、複数のホスト計算機の状態の相
互監視が、簡易な手段で確実に実施できるので、システ
ムの信頼性を経済的に向上するという著しい工業的効果
がある。
As is clear from the following explanation, according to the present invention, the mutual monitoring of the status of multiple host computers in an information processing system can be reliably carried out by simple means, so that the reliability of the system can be economically improved. There is a significant industrial effect of improving

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明の構成を示すブロック図、第2図は本発
明の処理の流れ図、 第3図は従来の構成例を示すブロック図、第4図は従来
の処理の流れ図 である。 図において、 1.20はホスト計算機、2.21は記憶装置、3はタ
イムスタンプ、  4.23は監視処理部、10〜16
.30〜37は処理ステップ本発明の構成を示すブロッ
ク図 第1図 本発明の処理の流れ図 従来の構成例を示すブロック図 第3図 従来の処理の流れ図 第4図
FIG. 1 is a block diagram showing the configuration of the present invention, FIG. 2 is a flowchart of processing of the present invention, FIG. 3 is a block diagram showing an example of a conventional configuration, and FIG. 4 is a flowchart of conventional processing. In the figure, 1.20 is the host computer, 2.21 is the storage device, 3 is the time stamp, 4.23 is the monitoring processing unit, 10 to 16
.. 30 to 37 are processing steps. FIG. 1 is a block diagram showing the configuration of the present invention. FIG. 1 is a flowchart of the process of the present invention.

Claims (1)

【特許請求の範囲】 複数のホスト計算機(20)と、該ホスト計算機から共
用される記憶装置(21)を有する情報処理システムに
おいて、 該記憶装置(21)に、各該ホスト計算機ごとに個別に
対応するように監視カウンタ(22)を設け、各該ホス
ト計算機(20)は所定周期ごとに、該ホスト計算機に
対応する該監視カウンタに、所定の初期値を設定し(2
3)、 所定の他の該ホスト計算機に対応する該監視カウンタ(
22)に保持する値を、所定周期ごとに所定値だけ変化
し(23)、 該監視カウンタ(22)の値を使用して、該監視カウン
タに対応する該ホスト計算機の状態を判定する(23)
ように構成されていることを特徴とする相互監視処理方
式。
[Claims] In an information processing system having a plurality of host computers (20) and a storage device (21) shared by the host computers, each host computer has A monitoring counter (22) is provided correspondingly, and each host computer (20) sets a predetermined initial value in the monitoring counter corresponding to the host computer (20) at predetermined intervals.
3), the monitoring counter corresponding to the predetermined other host computer (
22) is changed by a predetermined value at predetermined intervals (23), and the value of the monitoring counter (22) is used to determine the state of the host computer corresponding to the monitoring counter (23). )
A mutual monitoring processing method characterized by being configured as follows.
JP62314767A 1987-12-10 1987-12-10 Mutual monitor processing system Pending JPH01154257A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62314767A JPH01154257A (en) 1987-12-10 1987-12-10 Mutual monitor processing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62314767A JPH01154257A (en) 1987-12-10 1987-12-10 Mutual monitor processing system

Publications (1)

Publication Number Publication Date
JPH01154257A true JPH01154257A (en) 1989-06-16

Family

ID=18057341

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62314767A Pending JPH01154257A (en) 1987-12-10 1987-12-10 Mutual monitor processing system

Country Status (1)

Country Link
JP (1) JPH01154257A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01200441A (en) * 1988-02-05 1989-08-11 Fuji Electric Co Ltd Mutual monitoring method among plural processors
JP2009271857A (en) * 2008-05-09 2009-11-19 Toshiba Corp Computer system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01200441A (en) * 1988-02-05 1989-08-11 Fuji Electric Co Ltd Mutual monitoring method among plural processors
JP2009271857A (en) * 2008-05-09 2009-11-19 Toshiba Corp Computer system

Similar Documents

Publication Publication Date Title
JPH01154257A (en) Mutual monitor processing system
JPH0259955A (en) Method for supervising operation of multiprocessor system
US5524206A (en) Sub-CPU monitoring system including dual port memory
JPH06266685A (en) Decentralized control system
JPH01140350A (en) Circuit for detecting runway of program in microcomputer
JPH02281343A (en) Cpu operation monitor system
JPS62263554A (en) Shared memory duplex system
JPS59140519A (en) Controller for robot
JP2744113B2 (en) Computer system
JPS5827538B2 (en) Mutual monitoring method
JPS62276637A (en) Operation supervisory circuit for central processing unit
JP2842748B2 (en) Monitoring and control method for information processing equipment
JPH02281344A (en) Program running monitor system
JP2778344B2 (en) Multiple processor system
JPH01169642A (en) Runaway detecting circuit
JP2011128780A (en) Ram diagnostic device and its program
JPH04293133A (en) Fault monitoring system in loosely coupled multi-processor system
JPS60252963A (en) State supervisory controlling system
JPS63291146A (en) Input/output processor
JPH02170243A (en) Self-diagnostic system for microprocessor
JPH07230432A (en) Calculating device
JPS60164857A (en) Microcomputer system
JPH03269749A (en) Input/output control monitor device
JPH02214413A (en) System for monitoring digital protective relay
JPH0225198A (en) Decentralized monitor system