JP2000010949A - リレー型分散ヘルスチェック制御システム及び方法 - Google Patents

リレー型分散ヘルスチェック制御システム及び方法

Info

Publication number
JP2000010949A
JP2000010949A JP10173178A JP17317898A JP2000010949A JP 2000010949 A JP2000010949 A JP 2000010949A JP 10173178 A JP10173178 A JP 10173178A JP 17317898 A JP17317898 A JP 17317898A JP 2000010949 A JP2000010949 A JP 2000010949A
Authority
JP
Japan
Prior art keywords
computer
health check
monitoring master
monitoring
master
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10173178A
Other languages
English (en)
Inventor
Takeo Sakakibara
健夫 榊原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP10173178A priority Critical patent/JP2000010949A/ja
Publication of JP2000010949A publication Critical patent/JP2000010949A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Multi Processors (AREA)
  • Computer And Data Communications (AREA)
  • Debugging And Monitoring (AREA)

Abstract

(57)【要約】 【課題】ネットワーク上に接続するコンピュータ数が増
大しても監視コンピュータの負荷の増大を抑止しネット
ワーク性能の低下を回避するヘルスチェック制御システ
ム及び方法の提供。 【解決手段】複数のコンピュータの一つを監視マスタと
し、他のコンピュータは起動時に監視マスタに対して起
動通知を行い、監視マスタは、起動通知を行った第一の
コンピュータに対し監視マスタに向けたヘルスチェック
の開始を指示し第一のコンピュータに向けてヘルスチェ
ックを行い、監視マスタは次に起動通知を行った第二の
コンピュータに対して第一のコンピュータに向けたヘル
スチェックの開始を指示し第二のコンピュータに向けて
ヘルスチェックを行い、同様に起動通知を行った第nコ
ンピュータに対して第n−1のコンピュータに向けたヘ
ルスチェックの開始を指示し監視マスタは第nのコンピ
ュータに向けてヘルスチェックを行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、複数のコンピュー
タが接続されたネットワークの障害監視システムに関
し、特に、監視コンピュータの負荷の低減しネットワー
クの有効利用を図るリレー型分散ヘルスチェック制御シ
ステム及び方法に関する。
【0002】
【従来の技術】従来、複数のコンピュータがネットワー
ク接続された分散システム等において、通信先の装置が
通信可能な状態か否かを調べるヘルスチェックを行うこ
とにより障害監視を行う場合、監視サーバを備え、監視
サーバからネットワーク上の複数のコンピュータに対し
て、一台ごとにヘルスチェック用の制御電文を送信する
ことによって行っている。
【0003】このため、ネットワーク上に接続するコン
ピュータの台数が増大すると、その分、ヘルスチェック
対象が増え、監視サーバの処理負荷が増大することにな
る。
【0004】そして、ネットワークトラフィックも、こ
の従来の方式では、監視サーバ地点に電文が集中する為
に、ネットワークに接続するコンピュータ台数の増加に
伴い通信性能の劣化を招くことになる。
【0005】
【発明が解決しようとする課題】上記したように、従来
のネットワークシステムにおいては、下記記載の問題点
を有している。
【0006】第1の問題点は、ネットワーク上に接続す
るコンピュータの台数が増加に伴い、ヘルスチェック対
象が増え、監視サーバの処理負荷が増大し、診断時間も
長大化する、ということである。
【0007】第2の問題点は、監視サーバ地点に電文が
集中する為に、ネットワークに接続するコンピュータ台
数の増加に伴いネットワークの転送性能が低下する、と
いうことである。
【0008】したがって、本発明は、上記問題点に鑑み
てなされたものであって、その目的は、ネットワーク上
に接続するコンピュータが増大しても監視コンピュータ
の負荷が増大することなく、且つネットワーク性能の低
下を回避するヘルスチェック制御システム及び方法を提
供することにある。
【0009】
【課題を解決するための手段】前記目的を達成するた
め、本発明は、ネットワーク上に接続された複数のコン
ピュータのうち、少なくとも一を監視マスタとし、これ
以外のコンピュータは起動時に前記監視マスタに対して
起動通知を行い、前記監視マスタは、前記起動通知を行
った第一のコンピュータに対して前記監視マスタに向け
てヘルスチェックを行うように指示するととともに前記
監視マスタが、前記第一のコンピュータに向けてヘルス
チェックを行い、前記監視マスタは、次に起動通知を行
った第二のコンピュータに対して、前記第一のコンピュ
ータに向けてヘルスチェックを行うように指示するとと
もに、前記監視マスタは前記第二のコンピュータに向け
てヘルスチェックを行うように切替え、同様にして、起
動通知を行った順番に第nコンピュータに対して第n−
1のコンピュータに向けてヘルスチェックを行うように
指示するとともに、前記監視マスタは前記第nのコンピ
ュータに向けてヘルスチェックを行うように切替制御す
ることを特徴とする。
【0010】
【発明の実施の形態】本発明の実施について以下に説明
する。本発明は、その好ましい実施の形態において、ネ
ットワーク上に接続された複数のコンピュータのうち、
少なくとも一を監視マスタ(図1のA)とし、これ以外
のコンピュータ(図1のB〜E)は起動時にこの監視マ
スタに対して起動通知を行い、監視マスタは、最初に起
動通知を行った第一のコンピュータ(図1のB)に対し
て監視マスタに向けてヘルスチェックを行うように指示
するととともに監視マスタが、第一のコンピュータ(図
1のB)に向けてヘルスチェックを行い、監視マスタ
は、次に起動通知を行った第二のコンピュータ(図2の
C)に対して、第一のコンピュータ(図1のB)に向け
てヘルスチェックを行うように指示するとともに、監視
マスタは第二のコンピュータ(図2のC)に向けてヘル
スチェックを行うように切替え、同様にして、起動通知
を行った第nコンピュータに対して第n−1のコンピュ
ータに向けてヘルスチェックを行うように指示するとと
もに、監視マスタは第nのコンピュータに向けてヘルス
チェックを行うように切替制御する。
【0011】監視マスタは、各コンピュータのヘルスチ
ェック先、及びチェック先のコンピュータの状態を記録
する管理用テーブル(図1の102)を備える。
【0012】ネットワーク上の複数コンピュータの通信
障害を検出するために、一定間隔でヘルスチェックを行
う際、そのLAN(ローカルエリアネットワーク)やW
AN(ワイドエリアネットワーク)を構成するコンピュ
ータの台数が幾ら増えても、各々のコンピュータがそれ
ぞれ他のコンピュータに対してヘルスチェックを行うこ
とにより、従来のように特定の監視サーバからのみヘル
スチェックを行う方式より監視サーバの処理負荷が増大
せず、またヘルスチェック用の制御電文が特定箇所に集
中する事がない。
【0013】また、本発明の実施の形態においては、複
数のコンピュータうちあるコンピュータに障害発生時、
障害コンピュータ(図4のC)に向けてヘルスチェック
を行っていたコンピュータ(図4のD)が障害を検出
し、ネットワーク切断通知を監視マスタに送信し、切断
通知を受けた前記監視マスタは、障害コンピュータ(図
4のC)が行っていたヘルスチェック先のコンピュータ
を検索し、切断通知を発行したコンピュータ(図4の
D)に対して、障害コンピュータに代替して、ヘルスチ
ェック先のコンピュータに向けてヘルスチェックを行う
ようにヘルスチェック先変更指示を発行するように構成
してもよい。
【0014】また本発明の実施の形態においては、監視
マスタ(図6のA)が、各コンピュータのヘルスチェッ
ク先、及びチェック先のコンピュータの状態を記録する
ための管理用テーブル(図6の102)を、監視マスタ
自身に向けてヘルスチェックを行っているコンピュータ
(図6のB)に対して転送しておき、監視マスタ上で管
理用テーブルの更新時には、該コンピュータ(図6の
B)に更新情報の通知を行い、監視マスタが障害時、監
視マスタをヘルスチェックしているコンピュータ(図6
のB)は、監視マスタから引き継いだ管理用テーブルを
参照して、監視マスタが行っていたヘルスチェック先の
コンピュータ(図7のE)に向けて、ヘルスチェックを
開始するとともに、該コンピュータ(図7のE)に向け
て監視マスタの変更通知を送信し、ネットワーク上の各
コンピュータは、ヘルスチェック先のコンピュータに向
けて監視マスタ変更通知をリレー形式で行い、以降コン
ピュータ(図7のB)が監視マスタの役割を引継ぐよう
に構成してもよい。
【0015】本発明によれば、ットワークを構成するコ
ンピュータの台数が増大しても、監視モニタの障害検出
性能が低下することなく、ヘルスチェック監視する事が
可能となる。
【0016】
【実施例】上記した本発明の実施の形態についてさらに
詳細に説明すべく、本発明の実施例について図面を参照
して以下に説明する。図1乃至図8は、本発明の一実施
例を説明するための図である。
【0017】図1を参照すると、ネットワーク101上
に複数のコンピュータ100−1〜100−5が接続さ
れており、このうち予め定められた所定のコンピュータ
(図では100−1)を監視モニタ用の監視マスタAと
する。
【0018】ネットワーク接続された他のコンピュータ
B乃至Eは、起動時に、監視マスタAに対して起動通知
を行う。
【0019】まずコンピュータBが起動通知1を行って
きた際、監視マスタAは、コンピュータBに向けてヘル
スチェックを開始し、コンピュータBに対して監視マス
タAに向けてヘルスチェックを始めるようにヘルスチェ
ック開始指示2を行う。そして監視マスタAに設けた管
理用のハッシュテーブル102上にコンピュータBの状
態を記録する。なお、管理用のハッシュテーブルには、
コンピュータ名とそのハッシュ値(ハッシングした値)
とチェック先のハッシュ値、及び障害情報等が格納され
る。図1を参照すると、管理用のハッシュテーブル10
2は、コンピュータAのチェック先がコンピュータB
(ハッシュ値は8)、コンピュータBのチェック先がコ
ンピュータA(ハッシュ値は3)であることを示してい
る。
【0020】次に図2に示すように、コンピュータCが
起動通知4を行ってきた際、監視マスタAは、コンピュ
ータCに対して、コンピュータBに向けてヘルスチェッ
クを開始するように指示5を送信するとともに、監視マ
スタAは、コンピュータCに向けてヘルスチェックを行
うように切替える。図2を参照すると、管理用のハッシ
ュテーブルは、コンピュータAのチェック先がコンピュ
ータCに切り替わり、コンピュータCのチェック先はコ
ンピュータBであることを示している。なお、コンピュ
ータBのチェック先はコンピュータAのままである。
【0021】同様にして、起動通知を行ってきたコンピ
ュータに対しては、一つ前に、起動通知を行ってきたコ
ンピュータに向けて、ヘルスチェックを開始するように
指示し、監視マスタA自身は、最も最近に起動通知を行
ってきたコンピュータに向けてのヘルスチェックを行
い、最終的に、通常運用中は、図3に模式的に示すよう
な、リレー型のヘルスチェックを行う。図3を参照する
と、管理用のハッシュテーブル102は、コンピュータ
Aのチェック先がコンピュータEに切り替わり、コンピ
ュータEのチェック先はコンピュータDであることを示
している。
【0022】次に図4に示すように、ネットワーク上に
あるコンピュータ(図4ではコンピュータC)に、障害
が発生した場合の動作について説明する。
【0023】まずコンピュータCに向けてヘルスチェッ
クを行っていたコンピュータDが障害を検出し、ネット
ワーク切断通知6を監視マスタAに対して行う。
【0024】この通知を受けて監視マスタAは、コンピ
ュータCが障害状態にあることを認識し、管理用のハッ
シュテーブルを参照して、コンピュータCを障害状態に
設定し(図4の管理用ハッシュテーブル102では
「×」印で示す)、同時に、今までコンピュータCが行
っていたヘルスチェック先を検索し、この場合、コンピ
ュータBに向けてヘルスチェックを行っていたため、切
断通知を行ってきたコンピュータDに対して、以後、コ
ンピュータBに向けて、ヘルスチェックを行うようにヘ
ルスチェック先変更指示7を行う。
【0025】その後、図5に示すように、コンピュータ
Cが復旧した場合には、コンピュータCはまず起動完了
通知8を監視マスタAに対して行う。監視マスタAは、
管理用のハッシュテーブル102を更新し、コンピュー
タCに対して、現在監視マスタAが現在ヘルスチェック
を行っているコンピュータEに対してヘルスチェックを
行うように指示9を発行し、監視マスタA自身は、ヘル
スチェック先をコンピュータEから、障害復旧後起動し
たコンピュータCへ切り替える。これは、先の新たにコ
ンピュータが起動してきた動作と同じとなる。
【0026】次に、監視マスタA自信の障害を考慮した
動作を説明する。
【0027】図6に示すように、監視マスタAは先に説
明した管理用のハッシュテーブル102を監視マスタA
自身に向けてヘルスチェックを行っているコンピュータ
B、すなわち監視マスタAに対して一番先に起動通知を
行ってきたコンピュータに対して、転送しておき(図6
の10)、コンピュータBでも管理用のハッシュテーブ
ルを保持し、監視マスタAでの管理用のハッシュテーブ
ルの更新時には、その都度コンピュータBに対して、更
新情報の通知を行うことで、整合性を保つ。
【0028】そして、監視マスタAが障害になった場合
には、図7に示すように、監視マスタAをヘルスチェッ
クしているコンピュータBが監視マスタAの障害を検出
できるので、これ以降、コンピュータBが監視マスタと
しての役割を果たすことになる。
【0029】まずコンピュータBは、監視マスタAから
引き継いだ管理用のハッシュテーブルを参照して(図7
の11)、監視マスタAが行っていたヘルスチェック先
のコンピュータEに向けて、ヘルスチェックを開始する
とともに、コンピュータEに向けて監視マスタの変更通
知12を送信する。その際、この監視マスタ変更通知
は、一斉通知として扱われ、ネットワーク上の各コンピ
ュータは、ヘルスチェック先のコンピュータに向けて監
視マスタ変更通知13をリレー形式で行う。
【0030】またコンピュータBは管理用ハッシュテー
ブルより自分自身に向けてヘルスチェックを行っている
コンピュータ(図7ではコンピュータC)に対して、こ
の管理用ハッシュテーブルを転送し、これ以降、テーブ
ルの更新の都度をコンピュータCに更新情報を通知し、
これを受けたコンピュータCで管理用ハッシュテーブル
の更新を行う。このようにして、たとえ監視マスタが障
害になっても、状態管理は次々のコンピュータへ引き継
がれる事となる。
【0031】また、監視マスタAが障害時にネットワー
クに接続していなかったコンピュータは、監視マスタ変
更を認識していない場合があるので、起動時、変更後の
監視マスタへの起動通知が失敗する可能性がある。
【0032】そこで、本発明の一実施例では、このよう
な場合、まず監視マスタAに対して起動完了通知を行っ
て失敗した後は、ブロードキャスト通知を行い監視マス
タを引き継いでいるコンピュータを探し出す。そして、
監視マスタを引き継いだコンピュータから、監視マスタ
変更通知とヘルスチェック先の指示を受ける事となる。
【0033】次に、監視マスタAが復旧した場合には、
図8に示すように、まず障害前に管理用テーブルを引き
継いでいたコンピュータBに対して、監視マスタ復旧通
知14を行う。
【0034】コンピュータBから最新の管理用のハッシ
ュテーブルを受け取り(15)、監視マスタの変更通知
16を行う。そしてコンピュータBに対して監視マスタ
Aに向けてヘルスチェックをするように変更指示を行
い、監視マスタA自身はコンピュータBが行っていたヘ
ルスチェック先のコンピュータに向けてヘルスチェック
を開始する。
【0035】またコンピュータBが管理用ハッシュテー
ブルを持っていない場合には、次にブロードキャスト通
知を行い監視マスタを引き継いでいるコンピュータを探
しだした後、上記の同様の動作を行う。
【0036】
【発明の効果】以上説明したように、本発明によれば、
ヘルスチェック制御電文の送信処理をネットワーク接続
する複数のコンピュータに分散させ、それぞれチェック
対象マシンを一台のみとし、障害報告等の通知電文のみ
を監視マスタに送信するように構成したことにより、監
視マスタの処理負荷の増大を抑止し、ネットワーク負荷
に対して影響の増大を抑止してヘルスチェック監視を行
うことができる、という効果を奏する。
【図面の簡単な説明】
【図1】本発明の一実施例を説明するための図である。
【図2】本発明の一実施例を説明するための図である。
【図3】本発明の一実施例を説明するための図である。
【図4】本発明の一実施例を説明するための図である。
【図5】本発明の一実施例を説明するための図である。
【図6】本発明の一実施例を説明するための図である。
【図7】本発明の一実施例を説明するための図である。
【図8】本発明の一実施例を説明するための図である。
【符号の説明】
1、4、8 起動通知 2、5 ヘルスチェック開始指示 6 切断通知 7、9 ヘルスチェック先変更指示 11 管理テーブルの参照更新 12、13、16 サーバ変更通知 14 復旧通知 15 管理テーブルの転送 A、E コンピュータ 100−1〜100−5 コンピュータ(A〜E) 101 ネットワーク 102 管理用ハッシュテーブル

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】ネットワーク上に接続された複数のコンピ
    ュータのうち、少なくとも一を監視マスタとし、これ以
    外のコンピュータは起動時に前記監視マスタに対して起
    動通知を行い、 前記監視マスタは、前記起動通知を行った第一のコンピ
    ュータに対して前記監視マスタに向けてヘルスチェック
    を行うように指示するととともに前記監視マスタが、前
    記第一のコンピュータに向けてヘルスチェックを行い、 前記監視マスタは、次に起動通知を行った第二のコンピ
    ュータに対して、前記第一のコンピュータに向けてヘル
    スチェックを行うように指示するとともに、前記監視マ
    スタは前記第二のコンピュータに向けてヘルスチェック
    を行うように切替え、同様にして、起動通知を行った順
    に第nコンピュータに対して第n−1のコンピュータに
    向けてヘルスチェックを行うように指示するとともに、
    前記監視マスタは前記第nのコンピュータに向けてヘル
    スチェックを行うように切替制御する、ことを特徴とす
    るヘルスチェック制御方法。
  2. 【請求項2】前記監視マスタが、管理用のテーブル上
    で、各コンピュータのヘルスチェック先、及びチェック
    先のコンピュータの状態を記録管理する、ことを特徴と
    する請求項1記載のヘルスチェック制御方法。
  3. 【請求項3】前記複数のコンピュータうち、あるコンピ
    ュータに障害発生時、該障害コンピュータに向けてヘル
    スチェックを行っていたコンピュータは該障害を検出し
    て、ネットワーク切断通知を前記監視マスタに送信し、 前記切断通知を受けた前記監視マスタは、前記障害コン
    ピュータが行っていたヘルスチェック先のコンピュータ
    を検索し、前記切断通知を発行したコンピュータに対し
    て、前記障害コンピュータに代替して、前記ヘルスチェ
    ック先のコンピュータに向けてヘルスチェックを行うよ
    うにヘルスチェック先変更指示を発行する、ことを特徴
    とする請求項1記載のヘルスチェック制御方法。
  4. 【請求項4】前記障害コンピュータが障害から復旧した
    場合、前記コンピュータ(「復旧コンピュータ」とい
    う)はまず起動完了通知を前記監視マスタに対して行
    い、前記監視マスタは、前記復旧コンピュータに対し
    て、前記監視マスタが現在ヘルスチェックを行っている
    コンピュータに対してヘルスチェックを行うように指示
    を発行し、前記監視マスタは、ヘルスチェック先を、前
    記現在ヘルスチェックを行っているコンピュータから、
    前記復旧コンピュータへ切り替える、ことを特徴とする
    請求項3記載のヘルスチェック制御方法。
  5. 【請求項5】前記監視マスタが、各コンピュータのヘル
    スチェック先、及びチェック先のコンピュータの状態を
    記録するための管理用テーブルを、前記監視マスタ自身
    に向けてヘルスチェックを行っているコンピュータ
    (「第一のコンピュータ」という)に対して転送してお
    き、前記監視マスタ上で前記管理用テーブルの更新時に
    は、前記第一のコンピュータに更新情報の通知を行い、
    前記第一のコンピュータは自装置上の前記管理用テーブ
    ルを前記更新情報にて更新し、 前記監視マスタが障害時、前記監視マスタをヘルスチェ
    ックしている前記第一のコンピュータは、前記監視マス
    タから引き継いだ管理用テーブルを参照して、前記監視
    マスタが行っていたヘルスチェック先のコンピュータに
    向けて、ヘルスチェックを開始するとともに、該コンピ
    ュータに向けて監視マスタの変更通知を送信し、前記ネ
    ットワーク上の各コンピュータは、ヘルスチェック先の
    コンピュータに向けて監視マスタ変更通知をリレー形式
    で行い、以降前記第一のコンピュータが監視マスタの役
    割を引継ぐ、ことを特徴とする請求項1記載のヘルスチ
    ェック制御方法。
  6. 【請求項6】前記監視マスタを引き継いだコンピュータ
    は、前記管理用テーブルより自分自身に向けてヘルスチ
    ェックを行っているコンピュータに対して前記管理用テ
    ーブルを転送し、これ以降、新たな監視マスタは、前記
    管理用テーブルの更新の都度前記コンピュータに更新情
    報を通知し、これを受けた前記コンピュータは自身の管
    理用テーブルの更新を行うことを特徴とする請求項5記
    載のヘルスチェック制御方法。
  7. 【請求項7】監視マスタを引き継いだコンピュータに対
    してあるコンピュータが起動完了通知を行って失敗した
    際、一斉同報通知を行い監視マスタを引き継いでいるコ
    ンピュータを探し出し、監視マスタを引き継いだコンピ
    ュータから、監視マスタ変更通知とヘルスチェック先の
    指示を受ける、ことを特徴とする請求項6記載のヘルス
    チェック制御方法。
  8. 【請求項8】前記障害が発生した監視マスタが復旧した
    場合(この監視マスタを「障害復旧マスタ」という)に
    は、監視マスタを引き継いでいたコンピュータに対し
    て、監視マスタ復旧通知を行い、 前記監視マスタを引き継いでいたコンピュータから最新
    の管理用テーブルを受け取り、監視マスタの変更通知行
    い、監視マスタを引き継いでいたコンピュータに対して
    障害復旧監視マスタに向けてヘルスチェックをするよう
    に変更指示を行い、障害復旧監視マスタ自身は、前記監
    視マスタを引き継いでいたコンピュータが行っていたヘ
    ルスチェック先のコンピュータに向けてヘルスチェック
    を開始する、ことを特徴とする請求項5記載のヘルスチ
    ェック制御方法。
  9. 【請求項9】前記監視マスタを引き継いでいたコンピュ
    ータが管理用テーブルを持っていない場合には、一斉同
    報通知を行い監視マスタを引き継いでいるコンピュータ
    を探しだした後、前記障害復旧監視マスタは、前記コン
    ピュータとの間で、管理用テーブルの取得、ヘルスチェ
    ックの変更指示及びヘルスチェックの開始を行う、こと
    を特徴とする請求項1記載のヘルスチェック制御方法。
  10. 【請求項10】複数のコンピュータがネットワーク接続
    されたシステムのヘルスチェック制御システムにおい
    て、 複数のコンピュータのうち少なくとも一を監視マスタと
    し、これ以外のコンピュータは起動時に前記監視マスタ
    に対して起動通知を行い、 前記監視マスタが、各コンピュータのヘルスチェック
    先、及びチェック先のコンピュータの状態を記録管理す
    るための管理用テーブルを備え、 前記起動通知を行った第一のコンピュータに対して前記
    監視マスタに向けてヘルスチェックを行うように指示す
    るととともに、前記監視マスタは、前記第一のコンピュ
    ータに向けてヘルスチェックを行い、 前記監視マスタは、次に起動通知を行った第二のコンピ
    ュータに対して、前記第一のコンピュータに向けてヘル
    スチェックを行うように指示するとともに、前記監視マ
    スタは、前記第二のコンピュータに向けてヘルスチェッ
    クを行うように切替え、同様にして、起動通知を行った
    順に第nコンピュータに対して第n−1のコンピュータ
    に向けてヘルスチェックを行うように指示するととも
    に、前記監視マスタは前記第nのコンピュータに向けて
    ヘルスチェックを行うように切替制御する手段を備え
    た、ことを特徴とするヘルスチェック制御システム。
  11. 【請求項11】前記複数のコンピュータうち、あるコン
    ピュータに障害発生時、障害コンピュータに向けてヘル
    スチェックを行っていたコンピュータが障害を検出し、
    ネットワーク切断通知を前記監視マスタに送信し、 前記切断通知を受けた前記監視マスタは、障害コンピュ
    ータが行っていたヘルスチェック先のコンピュータを検
    索し、前記切断通知を発行したコンピュータに対して、
    前記障害コンピュータに代替して、ヘルスチェック先の
    コンピュータに向けてヘルスチェックを行うようにヘル
    スチェック先変更指示を発行する手段を備えた、ことを
    特徴とする請求項10記載のヘルスチェック制御システ
    ム。
  12. 【請求項12】前記監視マスタが、管理用テーブルを、
    前記監視マスタ自身に向けてヘルスチェックを行ってい
    るコンピュータ(「第一のコンピュータ」という)に対
    して転送しておき、前記監視マスタ上で前記管理用テー
    ブルの更新時には、前記第一のコンピュータに更新情報
    の通知を行う手段を備え、 前記第一のコンピュータでは自信の管理用テーブルを前
    記更新情報に基づき更新し、 前記監視マスタが障害時、前記監視マスタをヘルスチェ
    ックしている前記第一のコンピュータは、前記監視マス
    タから引き継いだ管理用テーブルを参照して、前記監視
    マスタが行っていたヘルスチェック先のコンピュータに
    向けて、ヘルスチェックを開始するとともに、該コンピ
    ュータに向けて監視マスタの変更通知を送信し、前記ネ
    ットワーク上の各コンピュータは、ヘルスチェック先の
    コンピュータに向けて監視マスタ変更通知をリレー形式
    で行い、以降前記第一のコンピュータが監視マスタの役
    割を引継ぐ、ことを特徴とする請求項10記載のヘルス
    チェック制御システム。
JP10173178A 1998-06-19 1998-06-19 リレー型分散ヘルスチェック制御システム及び方法 Pending JP2000010949A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10173178A JP2000010949A (ja) 1998-06-19 1998-06-19 リレー型分散ヘルスチェック制御システム及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10173178A JP2000010949A (ja) 1998-06-19 1998-06-19 リレー型分散ヘルスチェック制御システム及び方法

Publications (1)

Publication Number Publication Date
JP2000010949A true JP2000010949A (ja) 2000-01-14

Family

ID=15955543

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10173178A Pending JP2000010949A (ja) 1998-06-19 1998-06-19 リレー型分散ヘルスチェック制御システム及び方法

Country Status (1)

Country Link
JP (1) JP2000010949A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001155002A (ja) * 1999-11-30 2001-06-08 Ntt Comware Corp 監視対象決定装置およびその記録媒体
US7293068B2 (en) 2000-05-25 2007-11-06 Hitachi, Ltd. Method and system for storing duplicate data
JP2010519819A (ja) * 2007-02-15 2010-06-03 タイコ エレクトロニクス サブシー コミュニケーションズ エルエルシー 分散型ネットワーク管理システムおよび方法
US9154382B2 (en) 2011-02-23 2015-10-06 Nec Corporation Information processing system

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0259955A (ja) * 1988-08-26 1990-02-28 Fuji Electric Co Ltd マルチプロセッサシステムにおける動作監視方法
JPH02165344A (ja) * 1988-12-20 1990-06-26 Nec Corp ホットスタンバイ方式
JPH02228740A (ja) * 1989-03-01 1990-09-11 Mitsubishi Electric Corp 二重系処理システム
JPH06332868A (ja) * 1993-05-21 1994-12-02 Matsushita Electric Ind Co Ltd システム多重化装置
JPH07234848A (ja) * 1993-12-28 1995-09-05 Fuji Facom Corp 計算機システムにおける二重化方式
JPH07311744A (ja) * 1994-05-17 1995-11-28 Mitsubishi Electric Corp 資源所在位置検出方式
JPH0895931A (ja) * 1994-09-26 1996-04-12 Mitsubishi Electric Corp 分散計算機システムの故障検出方法
JPH08329023A (ja) * 1995-05-30 1996-12-13 Shikoku Nippon Denki Software Kk 並列電子計算機システム

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0259955A (ja) * 1988-08-26 1990-02-28 Fuji Electric Co Ltd マルチプロセッサシステムにおける動作監視方法
JPH02165344A (ja) * 1988-12-20 1990-06-26 Nec Corp ホットスタンバイ方式
JPH02228740A (ja) * 1989-03-01 1990-09-11 Mitsubishi Electric Corp 二重系処理システム
JPH06332868A (ja) * 1993-05-21 1994-12-02 Matsushita Electric Ind Co Ltd システム多重化装置
JPH07234848A (ja) * 1993-12-28 1995-09-05 Fuji Facom Corp 計算機システムにおける二重化方式
JPH07311744A (ja) * 1994-05-17 1995-11-28 Mitsubishi Electric Corp 資源所在位置検出方式
JPH0895931A (ja) * 1994-09-26 1996-04-12 Mitsubishi Electric Corp 分散計算機システムの故障検出方法
JPH08329023A (ja) * 1995-05-30 1996-12-13 Shikoku Nippon Denki Software Kk 並列電子計算機システム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001155002A (ja) * 1999-11-30 2001-06-08 Ntt Comware Corp 監視対象決定装置およびその記録媒体
US7293068B2 (en) 2000-05-25 2007-11-06 Hitachi, Ltd. Method and system for storing duplicate data
JP2010519819A (ja) * 2007-02-15 2010-06-03 タイコ エレクトロニクス サブシー コミュニケーションズ エルエルシー 分散型ネットワーク管理システムおよび方法
US8775589B2 (en) 2007-02-15 2014-07-08 Tyco Electronics Subsea Communications Llc Distributed network management system and method
US9154382B2 (en) 2011-02-23 2015-10-06 Nec Corporation Information processing system

Similar Documents

Publication Publication Date Title
US6760859B1 (en) Fault tolerant local area network connectivity
US20050135233A1 (en) Redundant routing capabilities for a network node cluster
JP5982842B2 (ja) コンピュータ障害監視プログラム、方法、及び装置
JP2001077919A (ja) 冗長構成監視制御システム並びにその監視制御装置及び被監視制御装置
JPH05300163A (ja) シリアル通信網トポロギ情報生成方法及び装置
JP2000250771A (ja) サーバ二重化方式
JP2000010949A (ja) リレー型分散ヘルスチェック制御システム及び方法
KR101358995B1 (ko) 고가용성 관리 방법 및 시스템
CN114124803B (zh) 设备管理方法、装置、电子设备及存储介质
CN113824595B (zh) 链路切换控制方法、装置和网关设备
CN113794765A (zh) 基于文件传输的网闸负载均衡方法及装置
JP4133738B2 (ja) 高速ネットワークアドレス引継ぎ方法、ネットワーク装置及びプログラム
JP2001344125A (ja) 2重化ノードシステム
JPH09274573A (ja) バックアップ・システム
JPH1168790A (ja) Lanエミュレーションサーバ二重化方式
JPH08149145A (ja) Lanシステム
JP3144346B2 (ja) 通信処理装置の予備切り替えシステム
JP3398682B2 (ja) 通信系における冗長構成管理方法ならびにシステム
CN112491747B (zh) 一种高可用的数据交换集群的应用方法
JP2011054033A (ja) 監視制御装置
JP2000092079A (ja) 情報処理システム
JP2001306351A (ja) コンピュータシステムにおける障害対処方式
JP2546165B2 (ja) オンラインシステムおよびその回線選択方法
JPH04318721A (ja) 同報通信異常時の伝送路切り換え方式
JPH11306153A (ja) 分散システムのネットワーク管理方式

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20030415