JP2000082053A - ネットワ―ク監視装置 - Google Patents

ネットワ―ク監視装置

Info

Publication number
JP2000082053A
JP2000082053A JP11008439A JP843999A JP2000082053A JP 2000082053 A JP2000082053 A JP 2000082053A JP 11008439 A JP11008439 A JP 11008439A JP 843999 A JP843999 A JP 843999A JP 2000082053 A JP2000082053 A JP 2000082053A
Authority
JP
Japan
Prior art keywords
node
network
packet
monitoring
response
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11008439A
Other languages
English (en)
Inventor
Hiroo Kamiyo
浩夫 神余
Masato Ushijima
正人 牛島
Kenji Ueda
健治 植田
Yukio Yaguchi
幸男 矢口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP11008439A priority Critical patent/JP2000082053A/ja
Publication of JP2000082053A publication Critical patent/JP2000082053A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Small-Scale Networks (AREA)
  • Multi Processors (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

(57)【要約】 【課題】 監視メッセージが設定時間以内に到着しない
場合には、CPUの障害発生を認識するが、ネットワー
ク1に対するCPUの接続台数が増加すると、各CPU
の通信処理量が増大して、他の通信処理に支障をきたす
ため、他のCPUの監視周期を遅くする必要がある課題
があった。 【解決手段】 監視パケットを隣接上流ノード又は隣接
下流ノードに送信し、この隣接ノードから監視パケット
に対する応答パケットが送信されない場合には、ネット
ワークからその隣接ノードが離脱したことを検出する検
出ユニット(17)と、検出ユニットがその隣接ノード
の離脱を検出すると、その旨を示す通知パケットをネッ
トワーク11に接続された他の全てのノードに同報通信
する通知ユニット(17)とを備えた。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、ネットワークに
対するノードの接続状態等を監視するネットワーク監視
装置に関するものである。
【0002】
【従来の技術】図12は例えば特開平2−125361
号公報に示された従来のネットワーク監視装置を示す構
成図であり、図において、1はネットワーク、A1〜A
nはネットワーク1に接続されたホスト計算機(以下、
CPUという)、B1〜BnはCPUA1〜Anの記憶
装置、C1〜Cmは2以上のCPUと接続され、CPU
と端末間の通信を制御する端末制御装置、D1〜Dk,
E1〜Ek,F1〜Fkは端末である。
【0003】まず、CPUA1〜Anは、他のCPUの
動作状況や接続状況を監視するために、稼働中であるこ
とを示す監視メッセージの到着時刻を計測する時刻計測
手段と、予め設定された時間以内に監視メッセージが到
着したか否かを判定する判定手段を有している。
【0004】具体的には、一つのCPUが他のCPUの
動作状況等を集中管理するのではなく、各CPUが監視
メッセージをネットワーク1上にブロードキャストし、
各CPUが、他のCPUから送信される監視メッセージ
を独自に収集して診断する。なお、監視メッセージは周
期的に送信され、各CPUは、自装置が稼働中である限
り、監視メッセージを送信する。監視メッセージには自
装置の識別子が付加される。
【0005】例えば、図13に示すように、CPUAn
に障害が発生した場合、CPUA1,A2は監視メッセ
ージを送信するが、CPUAnは送信できない。各CP
Uは、他CPUからの監視メッセージ(例えば、CCA
−A等)の到着時刻を計測して、自己の記憶装置に記憶
する。一定時間以上、監視メッセージが到着しない場合
は、そのCPUに障害が発生したと判定する。
【0006】
【発明が解決しようとする課題】従来のネットワーク監
視装置は以上のように構成されているので、監視メッセ
ージが設定時間以内に到着しない場合には、CPUの障
害発生を認識するが、ネットワーク1に対するCPUの
接続台数が増加すると、各CPUの通信処理量が増大し
て、他の通信処理に支障をきたすため、他のCPUの監
視周期を遅くする必要がある課題があった。
【0007】また、各CPUは周期的に監視メッセージ
を他のCPUにブロードキャストする必要があるので、
ATMやEthernet Switchなどの高速ス
イッチ型ネットワークへの適用が難しく、物理トポロジ
ー制限がある課題もあった。
【0008】なお、ネットワーク1に接続された各CP
Uの通信処理量を抑制し、かつ、高速スイッチ型ネット
ワークに適用するためには、ブロードキャストによる相
互監視ではなく、各CPUが決められた相手を監視する
ユニキャスト相互監視を行えばよいが、サーバやマネー
ジャーを設けて監視を集中させると、そのサーバ等の障
害がネットワーク全体の障害を引き起こす不具合が発生
する。
【0009】この発明は上記のような課題を解決するた
めになされたもので、各CPU(ノード)の通信処理量
の増大を招くことなく、他のノードの監視周期を高める
ことができるとともに、高速スイッチ型ネットワークへ
の適用性を高めることができるネットワーク監視装置を
得ることを目的とする。
【0010】
【課題を解決するための手段】この発明に係るネットワ
ーク監視装置は、隣接下流ノードから監視パケットを受
信すると、監視パケットに対する応答パケットを隣接下
流ノードに送信する応答手段と、監視パケットを隣接上
流ノードに送信し、該隣接上流ノードから監視パケット
に対する応答パケットが送信されない場合には、ネット
ワークから隣接上流ノードが離脱したことを検出する検
出手段と、検出手段が隣接上流ノードの離脱を検出する
と、その旨を示す通知パケットをネットワークに接続さ
れた他の全てのノードに同報通信する通知手段とを備え
るものである。
【0011】この発明に係るネットワーク監視装置は、
隣接上流ノードから監視パケットを受信すると、監視パ
ケットに対する応答パケットを隣接上流ノードに送信す
る応答手段と、監視パケットを隣接下流ノードに送信
し、該隣接下流ノードから監視パケットに対する応答パ
ケットが送信されない場合には、ネットワークから隣接
上流ノードが離脱したことを検出する検出手段と、検出
手段が隣接下流ノードの離脱を検出すると、その旨を示
す通知パケットをネットワークに接続された他の全ての
ノードに同報通信する通知手段とを備えるものである。
【0012】この発明に係るネットワーク監視装置は、
隣接上流ノード及び隣接下流ノードを識別する論理アド
レスを格納する管理テーブルと、検出手段が隣接上流ノ
ード又は隣接下流ノードのネットワークからの離脱を検
出した場合又は通知手段からの通知パケットを受信した
場合に管理テーブルを更新する更新手段とをさらに備え
るものである。
【0013】この発明に係るネットワーク監視装置は、
ネットワーク監視装置を含むノードがネットワークに新
規に参入する場合、更新手段は、監視パケットをネット
ワークに接続された他の全てのノードに同報通信し、監
視パケットに対する応答パケットの受信結果に基づいて
管理テーブルを生成するものである。
【0014】この発明に係るネットワーク監視装置は、
ネットワークに新規に参入した他のノードから監視パケ
ットを受信すると、応答手段がその監視パケットに対す
る応答パケットを他のノードに送信するとともに、更新
手段が管理テーブルを更新するものである。
【0015】この発明に係るネットワーク監視装置は、
検出手段は自ノードと隣接上流ノード又は隣接下流ノー
ドとの間に位置する少なくも1つの未参入ノードに対し
て監視パケットを送信するものである。
【0016】この発明に係るネットワーク監視装置は、
自ノードと隣接上流ノード又は隣接下流ノードとの間に
規定数以上の未参入ノードがある場合、検出手段は監視
パケットをそれらの未参入ノードに同報通信するもので
ある。
【0017】この発明に係るネットワーク監視装置は、
検出手段が隣接上流ノード又は隣接下流ノードのネット
ワークからの離脱を検出した場合、上流又は下流のある
探索範囲に属する1つ以上の他のノードに対して監視パ
ケットを送信し、該監視パケットに対する応答パケット
の受信結果に基づいて新しい隣接上流ノード又は新しい
隣接下流ノードを探索する探索手段をさらに備えるもの
である。
【0018】この発明に係るネットワーク監視装置は、
探索手段は探索範囲で新しい隣接上流ノード又は新しい
隣接下流ノードを探索できない場合、探索範囲を上流方
向又は下流方向に変更して、再度、監視パケットを送信
するものである。
【0019】この発明に係るネットワーク監視装置は、
他のノードに送信するパケットに時刻系列番号を付加す
る番号付加手段をさらに備えるものである。
【0020】この発明に係るネットワーク監視装置は、
更新手段は他のノードからのパケットにより管理テーブ
ルを更新する際、パケットに付加された時刻系列番号を
参照し、そのパケットが他のノードで起きた最新の事象
に係るものである場合に限り、管理テーブルを更新する
ものである。
【0021】この発明に係るネットワーク監視装置は、
ノードの参入又は離脱が検出された場合、予め登録され
たキューに対してイベントを送信するイベント送信手段
をさらに備えるものである。
【0022】この発明に係るネットワーク監視装置は、
動作周期の異なる複数の検出手段及び通知手段をさらに
備えるものである。
【0023】
【発明の実施の形態】以下、この発明の実施の一形態を
説明する。 実施の形態1.図1はこの発明の実施の形態1によるネ
ットワーク監視装置の構成を示すブロック図であり、図
において、11はネットワーク、12はネットワークI
/F、P1〜PnはネットワークI/F12を介してネ
ットワーク11に接続されたノード、13は隣接上流ノ
ード及び隣接下流ノードを識別する論理アドレスを格納
するネットワーク状態テーブル(管理テーブル)、14
は他のノードに応答要求REQUEST(監視パケッ
ト)や応答RESPONSE(応答パケット)等を送信
するパケット送信部、15は他のノードから応答要求R
EQUESTや応答RESPONSE等を受信するパケ
ット受信部、16は隣接下流ノードから応答要求REQ
UESTを受信すると、応答要求REQUESTに対す
る応答RESPONSEをパケット送信部14を介して
隣接下流ノードに送信する状態管理部(応答手段)、1
7は応答要求REQUESTを隣接上流ノードに送信
し、パケット受信部15を介して状態管理部16が隣接
上流ノードの状態管理部16から応答要求REQUES
Tに対する応答RESPONSEを受信するか否かに応
じて、ネットワーク11から隣接上流ノードが離脱した
か否かを検出し、また、隣接上流ノードの離脱を検出す
ると、その旨を示すNOTIFYパケットを各ノードに
ブロードキャストする周期監視部(検出手段、通知手
段)である。
【0024】まず、図2は接続ノードによる論理リング
構成を示している。各ノードは論理リングの隣接上流ノ
ードを監視するが、例えば、ノードP2はノードP1を
監視し、ノードP4はノードP3が未参入なので、ノー
ドP2を監視する。各ノードは、周期的に隣接上流ノー
ドに対して応答要求REQUESTを送信し、隣接上流
ノードが応答要求REQUESTを受信すると、応答R
ESPONSEを要求元に応答し、要求元は応答RES
PONSEの到着タイムアウト監視により隣接上流ノー
ドの生存監視を行う。到着タイムアウトでリトライし、
規定リトライを実施しても応答が無ければ、隣接上流ノ
ードの離脱と判断する。図3の例では、ノードP4がノ
ードP2の離脱を検出し、NOTIFYパケットをネッ
トワーク11にブロードキャストする。
【0025】以下、図1を用いてネットワーク監視装置
の詳細動作について説明する。まず、ノードP1〜Pn
のネットワーク状態テーブル13には、ネットワーク1
1における各ノードの参入離脱状態や運転状態を示す情
報が格納され、ネットワーク11に対するノードの接続
台数分の配列構造を有している。各ノードのネットワー
ク11内の相対アドレス順序により、格納場所が決定さ
れている。
【0026】ノードP1の電源投入時、ネットワーク状
態テーブル13には、自身だけが参入した状態である。
周期監視部17は規定周期で応答要求REQUESTを
パケット送信部14を介して送信する。パケット送信部
14は、自身だけが参入しているならば、応答要求RE
QUESTをネットワーク11にブロードキャストす
る。
【0027】一方、既にネットワーク11に参入してい
るノードが存在する場合、既にネットワーク11に参入
しているノードP2〜Pnは、ノードP1から応答要求
REQUESTを受信すると、各自のネットワーク状態
テーブル13を参照して、隣接上流ノード(論理アドレ
スが昇順で最も近接するノード)が応答RESPONS
Eを返送する。図2の例では、ノードPnが応答RES
PONSEをノードP1に送信する。何故ならば、最も
小さい論理アドレスのノードPnは、ネットワーク11
上に存在する最も大きい論理アドレスのノードP1によ
り監視されるからである。
【0028】そして、ノードP1のパケット受信部15
が、ノードPnから応答RESPONSEを受信する
と、その応答RESPONSEを状態管理部16に転送
する。応答RESPONSEには、ノードPnのネット
ワーク状態テーブル13の格納情報が含まれているの
で、状態管理部16は、その格納情報をネットワーク状
態テーブル13に反映する。
【0029】なお、ノードP2〜PnはノードP1から
応答要求REQUESTを受信すると、ノードP1の参
入を検出し、自己のネットワーク状態テーブル13を更
新する。これにより、ノードP2〜PnはノードP1の
参入が反映されたネットワーク状態テーブル13を取得
する。
【0030】ノードP1がネットワーク11への参入に
成功すると、隣接上流ノードPnの周期監視を開始する
とともに、隣接下流ノードP2に監視されることとな
る。即ち、周期監視部17が規定周期で応答要求REQ
UESTを隣接上流ノードであるノードPnに送信す
る。そして、ノードPnのパケット受信部15が応答要
求REQUESTを受信すると、状態管理部16が応答
要求REQUESTの発信元であるノードP1に対し
て、応答RESPONSEをパケット送信部14を介し
て送信する。
【0031】なお、応答RESPONSEには、ノード
Pnのネットワーク状態テーブル13の格納情報が格納
されている。ネットワーク状態は、自状態を更新しなが
ら応答RESPONSEにより、隣接下流ノードへとバ
ケツリレーされていくので、ノードPnから応答RES
PONSEを受信したノードP1の状態管理部16は、
自状態を除いてネットワーク状態テーブル13に反映す
る。
【0032】一方、ノードPnから一定時間以内に、応
答RESPONSEがノードP1に届かなければ、周期
監視部17は応答要求REQUESTを再度送信する。
さらに、規定回数リトライしても応答が無ければ、ノー
ドP1とノードPn間の通信経路又はノードPnに異常
があったものと判断して、周期監視部17はノードPn
がネットワーク11から離脱したとみなす。そして、ノ
ードP1の周期監視部17は、ネットワーク状態テーブ
ル13に対してノードPnの離脱を設定する。さらに、
ノードPnの離脱を示すNOTIFYパケットをネット
ワーク11にブロードキャストする。そして、各ノード
はNOTIFYパケットを受信すると、各自のネットワ
ーク状態テーブル13を更新する。
【0033】ノードPnの離脱を検出したノードP1
は、次の隣接上流ノードであるノードP5を監視対象と
して、応答要求REQUESTの送信を開始する。次の
隣接上流ノードがなければ、ネットワーク11に単独で
参入していることになるので、電源投入状態と同様に、
応答要求REQUESTをブロードキャストする。応答
要求REQUESTを受信したノードは、自身が発信元
の隣接上流ノード又は隣接下流ノードであれば、応答R
ESPONSEを送信する。
【0034】次に、ネットワーク全体の動作について説
明する。各ノードが上記動作を行うので、ネットワーク
11にノードP1が単独で参入している場合は、応答要
求REQUESTを周期的にネットワーク11にブロー
ドキャストする。その後、例えば、ノードP4が参入す
ると、ノードP1がノードP4から応答要求REQUE
STを受信して、応答RESPONSEをノードP4に
送信した場合、または、ノードP4がノードP1から応
答要求REQUESTを受信して、応答RESPONS
EをノードP1に送信した場合、ノードP1,P4は互
いの存在を知り、それぞれのネットワーク状態テーブル
13を更新して互いを隣接上流モードとして周期監視を
開始する。
【0035】さらにノードP5がネットワーク11に参
入すると、既参入ノードであるノードP1,P4が新規
参入ノードであるノードP5の応答要求REQUEST
を受信して、ネットワーク状態テーブル13を更新し、
ノードP5は隣接上流ノードであるノードP4又は隣接
下流ノードであるノードP1から応答RESPONSE
を受信して、ネットワーク状態テーブル13を更新す
る。これにより、ノードP1は新規参入ノードであるノ
ードP5の周期監視を開始し、ノードP5は隣接上流ノ
ードとなったノードP4の周期監視を開始する。
【0036】ここで、ノードP1が電源断又は障害によ
り離脱した場合、ノードP1を監視する隣接下流ノード
であるノードP4は、応答要求REQUESTの送信を
周期的にリトライした後、ノードP1を離脱と判定す
る。ノードP4は自身のネットワーク状態テーブル13
にノードP1の離脱を反映し、ノードP1の離脱を示す
NOTIFYパケットをネットワーク11にブロードキ
ャストして、その旨を各ノードに通知する。NOTIF
Yパケットを受信したノードは、NOTIFYパケット
の内容を各自のネットワーク状態テーブル13に反映す
る。
【0037】ノードP1の離脱を検出したノードP4
は、次の隣接上流ノードであるノードP5の周期監視を
開始する。離脱したノードP1は、応答要求REQUE
STの送信を周期的にリトライした後、隣接上流ノード
P5の離脱を検出する。この間、ノードP1は、隣接下
流ノードP4から応答要求REQUESTも受信してい
ないので、ノードP5の離脱検出が自身の単独離脱であ
ると判定し、NOTIFYパケットをブロードキャスト
することなく、単独状態となり、応答要求REQUES
Tをブロードキャストする。
【0038】単独離脱とせずに、ノードP5の離脱を示
すNOTIFYパケットをブロードキャストすると、そ
の直前に外れていたコネクタが回復した場合には、各ノ
ードにノードP5の離脱を示すNOTIFYパケットが
届いてしまうため、ノードP1以外には離脱とはならな
いはずのノードP5の離脱誤報が出てしまう。
【0039】隣接上流ノードの離脱検出とともに、隣接
下流ノードを始めとする他ノードからのパケット受信タ
イムアウトをチェックして隣接上流ノードの離脱か、自
身の単独離脱かを判定することで、上記の離脱誤報を回
避できる。
【0040】このようにして、各ノードのネットワーク
11への参入離脱について、各ノードは論理アドレス昇
順の監視論理リングを構成し、論理リングの各隣接ノー
ド間で状態監視と状変通知を行うことで、各ノードがネ
ットワーク状態を監視する高信頼ネットワーク装置が得
られる。
【0041】以上で明らかなように、この実施の形態1
によれば、各ノードが同じ役割とプロトコルによりネッ
トワーク状態を監視するので、ネットワーク状態を集中
監視するサーバやマネージャ等をネットワークに設置す
ることなく、ネットワーク状態を監視することができる
ようになり、その結果、特定装置の障害によりネットワ
ークシステム全体が停止する不具合が解消され、ネット
ワークシステムの耐故障性が向上する。
【0042】また、ネットワーク11に与えられた論理
アドレスに基づく論理リングを形成して、論理リングの
隣接間の相互監視を行うので、ネットワーク11の物理
構成や媒体に依存しない。例えば、IPアドレスを論理
アドレスとして用いるならば、10Base−5,10
0Base−TX,ATMなどのネットワークに対応し
たネットワーク監視を実現できる。
【0043】さらに、ネットワーク監視をブロードキャ
ストで行うと、ネットワークに対する接続台数の増加に
伴い、各ノードの受信パケット数が増加する。しかし、
この実施の形態1では、通常監視を隣接ノード間のユニ
キャスト通信により行うため、通常時の受信処理パケッ
ト数は応答要求REQUESTと応答RESPONSE
だけである。また、スイッチ型ネットワークだと、ブロ
ードキャストパケットをスイッチが全ノードに複製配送
するため帯域利用率が悪化するが、実施の形態1ではス
イッチのノード間並行通信を利用して高い通信帯域を確
保できる。
【0044】この他に、各ノードのネットワーク監視装
置は隣接上流ノードを監視する代わりに、隣接下流ノー
ドを監視するようにしてもよい。例えば、ノードP2は
隣接下流ノードであるノードP3を監視する。この変形
例は、実施の形態1と同様の効果を奏する。なお、後述
する実施の形態でも、各ノードが隣接上流ノードを監視
するものについて説明するが、各ノードが隣接下流ノー
ドを監視するようにしてもよいことは言うまでもない。
【0045】実施の形態2.図4はこの発明の実施の形
態2によるネットワーク監視装置を示す構成図であり、
図において、図1と同一符号は同一または相当部分を示
すので説明を省略する。161はパケット受信部15を
介して受信した応答要求REQUESTが新規参入ノー
ドから送信された応答要求REQUESTであるか否か
を判断する参入管理部、162は応答要求REQUES
Tに対する応答RESPONSEをパケット送信部14
を介して送信する監視応答部、163は応答要求REQ
UESTに含まれるノード状態をネットワーク状態テー
ブル13に反映する状態更新部(更新手段)、171は
応答要求REQUESTの送信周期を計測し、送信時刻
になると送信指令を出力するタイマー、172は隣接上
流ノードの離脱を検出する離脱検出部、173は他のノ
ードの参入離脱の検出時及び自状態変化検出時にNOT
IFYパケットをネットワーク11にブロードキャスト
する状態通知部、174は応答要求REQUESTを隣
接上流ノードに周期的に送信する周期送信部である。
【0046】周期送信部174は、タイマー171から
送信指令を受けると、ネットワーク状態テーブル13を
参照して隣接上流ノードに認識し、応答要求REQUE
STを隣接上流ノードに送信する。離脱検出部172
は、周期送信部174が応答要求REQUESTを送信
すると、状態管理部16を介して隣接上流ノードからの
応答RESPONSEの有無を確認する。そして、応答
RESPONSEを受信しないならば、図示しないカウ
ンタをインクリメントするとともに、周期送信部174
が再度応答要求REQUESTを隣接上流ノードに送信
する。タイマー171からの送信指令受信後の所定の離
脱タイムアウト期間内に、周期送信部174は応答要求
REQUESTの送信を所定回数繰り返す。そして、離
脱検出部172が、その所定の離脱タイムアウト期間以
内に隣接上流ノードから応答RESPONSEをパケッ
ト受信部15及び状態管理部16を介して受信しないな
らば、即ち、離脱検出部172のカウンタが所定の値を
超えたならば、離脱検出部172は、隣接上流ノードは
通信できない離脱状態にあると確定して、ネットワーク
状態テーブル13に対して隣接上流ノードの離脱を設定
する。他のノードは当該離脱を知らないので、状態通知
部173が離脱を知らせるNOTIFYパケットをブロ
ードキャストする。これに対して、上記の所定の離脱タ
イムアウト期間内に、即ち、離脱検出部172のカウン
タが所定の値を超える前に応答があった場合には、再
び、タイマー171から送信指令を受けると、周期送信
部174は隣接上流ノードに対して応答要求REQUE
STの送信を開始する。
【0047】離脱検出部172は、隣接上流ノードの離
脱を検出すると、ネットワーク状態テーブル13を参照
して、次の隣接上流ノードを監視対象としてSEARC
Hパケットを送信する。次の隣接上流ノードも同時に離
脱していれば、周期送信部174が応答要求REQUE
STの送信を所定回数繰り返した後にその隣接ノードの
離脱を確定して、さらに次の隣接上流ノードの監視を試
みる。
【0048】一方、状態管理部16では、パケット受信
部15が他のノードから応答要求REQUESTを受信
すると、監視応答部162は、その発信元がネットワー
ク11の監視対象であり、応答要求相手に自分が含まれ
ていれば、応答RESPONSEを発信元に送信する。
応答RESPONSEには、自ノードのネットワーク状
態テーブル13を含む。
【0049】応答RESPONSEを受信すると、参入
管理部161は、発信元を調べ、隣接上流ノードであれ
ば、離脱検出部172のカウンタをリセットして所定の
離脱タイムアウト期間の計測を再度開始し、周期送信部
174は応答要求REQUESTの隣接上流ノードへの
送信を開始する。隣接上流ノードよりも自ノードに隣接
していれば、新規参入検出として、ネットワーク状態テ
ーブル13を更新し、状態通知部173に対して参入検
出通知を依頼する。隣接上流ノードよりも遠くのノード
からの応答要求RESPONSEであれば、その内容を
ネットワーク状態テーブル13に更新するが、状態通知
部173への送信依頼は行わない。
【0050】参入管理部161がNOTIFYパケット
を受信すると、その内容でネットワーク状態テーブル1
3を更新する。ノードの初期状態はネットワーク未参入
の単独状態であり、ネットワーク状態テーブル13に
は、自分自身しか存在しない。従って、初期状態にある
ノードは、その隣接上流ノードは自分自身であるとみな
しているので、周期送信部174がネットワーク11に
対し、応答要求REQUESTをネットワーク11にブ
ロードキャストし、ネットワーク11に接続された何れ
かのノードから応答RESPONSEを受信するまで、
応答要求REQUESTの送信を繰り返す。
【0051】これにより、ネットワーク状態テーブル1
3に自ノードの故障状態や動作状態を格納することで、
ネットワーク11の他ノードと、状態を相互管理するこ
とができる。自状態の変化があれば、状態通知部173
がNOTIFYパケットを送信する。
【0052】以上で明らかなように、この実施の形態2
によれば、各ノードに設けられており、他のネットワー
ク監視装置と協働して、ネットワーク上の論理アドレス
に基づいて論理リングを形成し、論理リングの隣接間で
定周期生存監視ならびにネットワーク状態更新を行うこ
とができるネットワーク監視装置が得られる。隣接上流
ノードの離脱と隣接上流ノード以内の新規参入につい
て、各ノードはネットワーク11に対する通知責任を持
つため、参入離脱の通知は、検出ノードから一度NOT
IFYパケットが送信されるだけであり、同じ内容のN
OTIFYパケットが複数回行われることはなく、トラ
フィックの低減と誤報抑制の効果がある。
【0053】実施の形態3.図5はこの発明の実施の形
態3によるネットワーク監視装置を示す構成図であり、
図において、図4と同一符号は実施の形態2のものと同
一または相当部分を示すので説明を省略する。175は
自ノードと隣接上流ノードの間に位置する未参入ノード
に対して、所定の周期で応答要求REQUESTを送信
する未参入監視部である。
【0054】例えば、リピータやハブなどのネットワー
ク接続装置により階層的にネットワークを構成した場
合、上位の接続装置の電源投入などを行うと、下位の複
数のネットワークが接続されて大きなネットワークが形
成される。ところで、上記実施の形態2によるネットワ
ーク監視装置は、単独で参入するノードを検出すること
が可能であるが、既に論理リングによる相互監視を行っ
ているネットワーク同士を接続したときに、より大きな
論理リングを形成することはできない。
【0055】そこで、この実施の形態3によるネットワ
ーク監視装置は、上記の実施の形態1における応答要求
REQUESTのブロードキャストによる参入検出に加
えて、隣接上流ノードまでの未参入ノードに対する参入
監視を行うことで、ネットワーク接続時に大きな論理リ
ングを構成する機能を提供する。
【0056】まず、論理リングにおいて、各ノードは隣
接上流の生存監視を行うだけでなく、自ノードと隣接上
流ノードの間に未参入ノードがあれば、その参入監視の
ため、応答要求REQUESTを所定の周期で未参入ノ
ードに送信する。その応答要求REQUESTを送出し
た後に参入したノードはその応答要求REQUESTを
受信でき、応答要求REQUESTの発信元に対して応
答RESPONSEを送信する。
【0057】例えば、図6に示すように、ノードP4は
隣接上流ノードであるノードP2の監視だけでなく、未
参入ノードP3に対しても応答要求REQUESTを送
信する。もし、ノードP3が既に参入していれば、ノー
ドP3から応答RESPONSEが送信される。
【0058】そして、状態管理部16の参入管理部16
1は、応答RESPONSEの発信元が隣接上流モード
の内側であれば、自己が送信した応答要求REQUES
Tに対する参入ノードからの応答であるから、ネットワ
ーク状態テーブル13を更新する。
【0059】次の監視周期では、先ほど参入検出したノ
ードが最隣接上流となるので離脱検出部172の図示し
ないカウンタをリセットして所定の離脱タイムアウト期
間の計測を再度開始して新たな隣接上流ノードの監視を
開始する。参入管理部161が複数の参入検出を行った
場合は、その全てをネットワーク状態テーブル13に反
映し、それらのうち最隣接上流ノードを次周期の隣接上
流ノードとする。隣接上流ノード以遠のノードから応答
RESPONSEを受信した場合は無視する。
【0060】参入管理部161が参入検出を行うと、状
態通知部173に対して状態通知依頼を発行し、次周期
において状態通知部173は、ネットワーク11の各ノ
ードに対し、参入検出したことを示すNOTIFYパケ
ットをネットワーク11にブロードキャストする。各ノ
ードはNOTIFYパケットにより参入ノードを認識す
る。
【0061】参入ノード自身は、監視応答部162が応
答要求REQUESTに対する応答RESPONSEを
送信する。応答要求REQUESTには、応答RESP
ONSEを送信するノードの範囲がREQUEST範囲
として含まれているので、監視応答部162は自身がR
EQUEST範囲、即ち、応答要求REQUESTの発
信元から隣接上流ノードまでの間に位置すれば、応答R
ESPONSEを送信する。また、上記の未参入ノード
監視を行っているので、現在の論理リングの隣接上流ノ
ードまでに現れた別ネットワークのノードの参入検出を
行うことができる。あるいは、別ネットワークのノード
からのNOTIFYパケットにより、ネットワーク状態
テーブル13を更新してより大きな論理リングを構成で
きる。
【0062】論理リングの隣接上流までの未参入ノード
数は2台接続時に(最大接続台数−2であるから、例え
ば、64台接続で62台を監視対象にしなければならな
い。)毎監視周期でこの未参入ノードに対し、応答要求
REQUESTを送信するのは送信側にとって負担が大
きい。しかし、全ての応答要求REQUESTをブロー
ドキャストすると、各ノードが受信処理するパケット数
が増えるため、受信側の負担が増える。そこで、未参入
監視部175は、隣接上流ノードまでの未参入台数が規
定値G以上だと、応答要求REQUESTをブロードキ
ャストとし、既定値G以下だと、それぞれに対する応答
要求REQUESTをユニキャストとすることで、全体
の送受信のバランスを図る。
【0063】論理リング最大接続数Nにおけるノードn
台接続時に、隣接上流ノードまでの監視台数の平均値は
N/n台である。全ての応答要求REQUESTをブロ
ードキャストとした場合のノード当たりの送信パケット
数は一定、受信パケット数は接続台数nに対する単調増
加となる。全ての応答要求REQUESTをユニキャス
トとした場合の平均送信パケット数は、監視台数の平均
値N/nに対する単調増加、受信パケット数は一定であ
る。従って、両者の交点が応答要求REQUESTのブ
ロードキャストとユニキャストの切替え点であり、この
ときnはNの平方根近傍となる。従って、切替え規定値
Gを√N近傍に規定し、隣接上流までの未参入ノードが
G以上だと、応答要求REQUESTをブロードキャス
ト、G未満だと応答要求REQUESTをユニキャスト
とする。
【0064】以上で明らかなように、この実施の形態3
によれば、リピータやハブ等の階層的ネットワーク構成
において、分断されたネットワークを接続した際に大き
な監視論理リングを再構成できるので、ネットワークの
物理構成に影響を受けずに適用が可能となる。
【0065】また、リング状況に応じてそれぞれがブロ
ードキャストとユニキャストを動的に切り替えるので、
論理リングの応答要求によるネットワークトラフィック
及び各ノードの送受信処理を低減できる効果がある。ま
た、ATMやイーサネットスイッチをノード間接続に用
いる場合は、ブロードキャスト切替え規定値Gを大きく
してユニキャスト数を増やすことで、スイッチ効率を高
めることができる。
【0066】実施の形態4.図7はこの発明の実施の形
態4によるネットワーク監視装置を示す構成図であり、
図において、図4と同一符号は実施の形態2のものと同
一または相当部分を示すので説明を省略する。176は
離脱検出部172により離脱が検出された場合、探索範
囲即ちSEARCH範囲に属するノードに対してSEA
RCHパケット(監視パケット)を送信し、SEARC
Hパケットに対する応答RESPONSEの受信結果に
基づいて隣接上流ノードを探索する隣接探索部(探索手
段)である。
【0067】通常の隣接上流ノードの周期監視におい
て、離脱検出部172が隣接上流ノードの離脱を検出す
ると、実施の形態2では、ネットワーク状態テーブル1
3を参照して、次の隣接上流ノードを監視対象としてS
EARCHパケットを送信していた。次の隣接上流ノー
ドも同時に離脱していれば、周期送信部174が所定回
数応答要求を送信した後に離脱したことを確定して、さ
らに次の隣接上流ノードの監視を試みる。従って、連続
した複数ノードが同時に離脱すれば、監視対象である生
存している隣接上流モードを探し出すのに(1つのノー
ドが離脱したことを確定するまでに要する期間、即ち、
周期送信部174が所定回数応答要求を送信する所定の
離脱タイムアウト期間)×(離脱したノードの数)の時
間が必要であった。
【0068】そこで、隣接探索部176は、離脱検出部
172が隣接上流モードの離脱を検出すると、図8に示
すように、ネットワーク状態テーブル13を参照して、
次の隣接上流ノードから上流数台を含むSEARCH範
囲に対してSEARCHパケットを送信し、応答のあっ
た最隣接ノードを隣接上流ノードとして監視対象に設定
する。隣接探索部176は、他の全てのノードをそれぞ
れ隣接したいくつかのノードを含む複数のグループに分
割し、それらのグループのうち上流側にあり最も近いグ
ループをまずSEARCH範囲とする。そして、以下で
述べるように、最初のSEARCH範囲で新たな隣接上
流ノードを探索することができない場合には、隣接探索
部176は、次の上流グループを次のSEARCH範囲
として探索する。即ち、最初のSEARCH範囲で新た
な隣接上流ノードを探索することができない場合には、
隣接探索部176はSEARCH範囲を以前のSEAR
CH範囲とオーバーラップしないように上流方向にシフ
トする。
【0069】SEARCHパケットには、応答要求RE
QUESTと同様に、応答RESPONSEを返すべき
ノードがSERACH範囲として含まれているので、周
期送信部174は、隣接探索部176により設定された
SEARCH範囲に対してSEARCHパケットを所定
の回数繰り返して送信する。SEARCH範囲を小さく
すると探索回数が多くなり、範囲を大きくすると多くの
応答RESPONSEを受信するため、その処理負担が
大きくなる。検索の負担及び応答を処理する負担をでき
るだけ減らすためには、SEARCH範囲に含まれるべ
きノード数は、上記実施の形態3における応答要求RE
QUESTのユニキャストとブロードキャストとの切替
規定値G程度が適切であり、周期送信部174はブロー
ドキャストかユニキャストでSEARCHパケットをそ
れらのノードに送信する。
【0070】隣接探索部176は、SEARCHパケッ
トにより隣接上流ノードを検出すると、その隣接上流ノ
ードまでの論理リング上の上流ノードはネットワーク1
1から離脱したものとみなすとともに、同じ探索範囲に
対して残った回数だけSEARCHパケットを繰り返し
送信する。状態管理部16がSEARCH範囲の探索中
のノードからの応答RESPONSEを受信すると、参
入管理部161は応答RESPONSEの発信元がSE
ARCH範囲であれば、発信元を隣接上流候補と比較し
て、より隣接であれば候補を置き換える。また、候補が
無いならば、その発信元を新たに候補に設定する。
【0071】応答RESPONSEの発信元がSEAR
CH範囲よりも隣接であれば、状態管理部16はその内
容をネットワーク状態テーブル13に反映し、周期監視
部17は発信元を隣接上流モードとして周期監視を開始
する。応答RESPONSEの発信元がSEARCH範
囲外であれば無視する。
【0072】隣接探索部176が上記所定の回数だけS
EARCHパケットを繰り返しSEARCH範囲に送信
終えると、最後の隣接候補を隣接上流ノードとして採用
する。そして、参入管理部161は、ネットワーク状態
テーブル13にその隣接候補を設定し、隣接候補までを
離脱ノードとして設定し、さらに、状態通知部173は
NOTIFYパケットをネットワーク11にブロードキ
ャストし、周期監視部17は隣接上流ノードの監視を開
始する。状態管理部16が上記所定回数繰り返しSEA
RCHパケットを送信しても応答を受信しないならば、
隣接探索部176はSEARCH範囲を上流方向にシフ
トして次のSEARCH範囲についてSEARCHパケ
ットの送信を行う。
【0073】状態管理部16が次のSEARCH範囲か
らもSEARCHパケットに対する応答を受信しないな
らば、隣接探索部176はSEARCH範囲を論理リン
グに沿ってさらに上流方向に移動する。そしして、SE
ARCH範囲がパケットリングを一周して自身まで到達
しても、何もSEARCH応答が無いならば、状態管理
部16は自分だけの単独参入状態であると判定し、ネッ
トワーク状態テーブル13を単独状態に設定し、周期監
視部17は応答要求REQUESTを周期的にブロード
キャストする。
【0074】以上で明らかなように、この実施の形態4
によれば、ハブ障害など連続する複数ノードの同時離脱
時において、迅速に隣接上流ノードを探し出して監視リ
ングを再構成して、定常監視を開始することができる。
また、部分探索SEARCHパケットにより、不要な応
答パケットが発生せず、通信処理の効率化を図ることが
できる。
【0075】実施の形態4の一変形例では、周期送信部
174が所定回数繰り返してSEARCHパケットをS
EARCH範囲に送信した後に隣接探索部176がSE
ARCH範囲で新たな隣接上流ノードを探索することが
できない場合には、SEARCH範囲を以前のSEAR
CH範囲とオーバーラップしないように上流方向にシフ
トする代わりに、周期送信部174は一回だけSEAR
CH範囲にSEARCHパケットを送信し、隣接探索部
176は新たな隣接上流ノードを探索することができな
い場合にはSEARCH範囲を以前のSERACH範囲
とオーバーラップするようにシフトする。実施の形態4
と同様に、隣接探索部176は、探索すべき論理リング
の全体をそれぞれがいくつかのノードを含む複数のグル
ープに分割する。
【0076】例えば、これら複数のグループのうちの上
流側で最も近い2つをSEARCH範囲としてまず選択
し、周期送信部174は新たな隣接上流ノードを探索す
るために、SEARCHパケットを一度だけそのSEA
RCH範囲に送信する。もし、隣接探索部176が新た
な隣接上流ノードを見つけだすことができないならば、
前に選択された2つのグループのうち遠い方と次の上流
グループとを次に探索すべきSEARCH範囲として選
択する。従って、この変形例によるネットワーク監視装
置は、SEARCHパケットをSEARCH範囲に送信
する度に、応答を受信しないならばSEARCH範囲が
オーバーラップするようにSEARCH範囲を所定のノ
ード数だけ上流方向にシフトするので、同じSEARC
H範囲を繰り返し探索する上記の実施の形態4による方
法と比較して、数周期早く新しい隣接上流ノートを見つ
け出すことができる。
【0077】さらに、SEARCH範囲にあるノードの
みがSEARCHパケットに対して応答することができ
るので、応答集中があったとしてもSEARCH範囲に
属するのノード数程度である。従って、SEARCH範
囲に属するノード数は、上記実施の形態3の未参入監視
部175が応答要求REQUESTのブロードキャスト
とユニキャストとを切替える切替え規定値G台程度に大
きくした方が効率的である。
【0078】また、実施の形態4の他の変形例では、隣
接探索部176は隣接上流ノードの候補が見つかると、
SEARCH範囲の上限を隣接上流ノードの候補とし下
限は現状のままとする。離脱したか否かを確定するため
にSEARCHパケットの送信を繰り返す対象は、その
上限より下流側にある狭められたSEARCH範囲にあ
るノードのみであるから、SEARCH範囲を絞り込む
ことで状態管理部16が余分な応答RESPONSEの
受信をせずに済む効果を奏する。
【0079】実施の形態5.図9はこの発明の実施の形
態5によるネットワーク監視装置を示す構成図であり、
図において、図4に示す実施の形態2によるものと同一
符号は同一または相当部分を示すので説明を省略する。
177は他のノードに送信するパケットに時刻系列番号
(REQUEST SEQUENCE:RSq)を付加
する状態シーケンス管理部(番号付加手段)であり、状
態シーケンス管理部177は、前回付加した時刻系列番
号RSqより大きい値の時刻系列番号RSqを他のノー
ドに送信するパケットに付加する。
【0080】ネットワーク通信では、コリジョンが発生
して再送失敗したり、受信バッファオーバフローでパケ
ットが破棄されたりするので、全てのパケットの到着が
保証されていない。NOTIFYパケットを取りこぼし
たノードが隣接下流ノードに対して、自身のネットワー
ク状態テーブル13の格納情報を応答RESPONSE
に入れて送ると、NOTIFYパケットを受信した隣接
下流ノードは、NOTIFYパケットよりも古い情報
で、ネットワーク状態テーブル13を更新しなくてはな
らないため、誤報が生じる。例えば、NOTIFYパケ
ットであるノードの離脱の通知を受けても、隣接上流ノ
ードからそのノードが参入していることを示す古い情報
が送られてくると、まだ参入していると間違って判定し
てしまう。
【0081】このようなNOTIFYパケットと応答R
ESPONSEの時間順序を逆転させないために、各ノ
ードに設けられた実施の形態5によるネットワーク監視
装置は、各々独立の時刻系列番号RSqを持ち、自身の
ノード状態に関する情報にその時刻系列番号RSqを属
性として付加する。状態シーケンス管理部177は、応
答RESPONSE,NOTIFYパケット送信時に自
身の時刻系列番号RSqを増分させて送信する。このと
き、状態シーケンス管理部177は自身のネットワーク
状態テーブル13の時刻系列番号RSqも更新する。
【0082】一方、状態管理部16が、時刻系列番号R
Sq付きの応答RESPONSE,NOTIFYパケッ
トを受信すると、受信したパケットの時刻系列番号RS
qとネットワーク状態テーブル13に格納された発信元
ノードの時刻系列番号RSqとを比較することにより受
信パケットの内容をネットワーク状態テーブル13に反
映させるか否かを判定する。即ち、受信パケットの時刻
系列番号RSqが新しければネットワーク状態テーブル
13を更新し、ネットワーク状態テーブル13の時刻系
列番号RSqが新しければ更新しない。受信パケットが
自ノードに付けられたより新しい時刻系列番号RSqを
有していてもネットワーク状態テーブル13を更新する
ことはないが、ネットワーク状態テーブル13に格納さ
れている時刻系列番号RSqは受信値で置く換える。時
刻系列番号RSqが同じであれば、格納された現在の時
刻系列番号RSqを変更しない。
【0083】時刻系列番号RSqは、原則として各ノー
ドが独立管理するが、ノード離脱時はネットワーク11
上に離脱したノードの離脱時点の時刻系列番号RSqが
存在するので、NOTIFYパケットを送信する離脱を
検出したノードは、それを上回る値の時刻系列番号RS
qを離脱したノードに与えなければならない。このため
に、離脱検出ノードはネットワーク状態テーブル13の
更新時に離脱ノードの時刻系列番号RSqを1以上、離
脱したことを確定するまでのリトライ回数未満だけ増加
させる。
【0084】時刻系列番号RSqは、各ノードで独立な
時刻系列を保証できればよいので、時刻タイムスタンプ
でもかまわないが、秒周期ならば秒、ミリ秒周期ならば
ミリ秒と監視周期の時間オーダに適合した単位とする。
また、時刻系列番号RSqの表現ビット数は、桁あふれ
オーバフローとなると初期値に再設定する。従って、2
つの異なるnビットの時刻系列番号RSqの大小関係
は、それらの時系列番号の差が、全てのビットが1の
(n/2)ビットの2進数の値より小さいならば、判定
可能である。このことを考慮すると、時刻系列番号RS
qのビット数は監視期間に応じて十分な長さとする必要
がある。例えば、周期0.1秒で16bitとすると、
時刻系列番号RSqは109分でオーバフローして初期
値に戻るので、時刻系列番号RSqの比較が成立するの
は54分以内である。従って、ノードは55分以上の一
時停止後に参入すると、参入検出されない事態が生じ
る。32bitだと、この期間は6.8年となる。
【0085】ノード一時停止時の時刻系列番号RSqの
オーバーフローによる動作不良を回避するためには、時
刻系列番号RSqの表現ビット数を予想される一時停止
期間より十分長くすることと、一時停止後に再度参入し
たノードは自身をリセットする。
【0086】再度参入したノードが自身をリセットする
と、そのノードの時刻系列番号RSqもリセットされ
る。しかし、ネットワーク11上の他ノードはそのリセ
ットしたノードの離脱時の時刻系列番号RSqを知って
いるため、他のノードがリセットしたノードが参入した
ことを検出し且つそのことを通知するには、そのリセッ
トしたノードはリセット時の時刻系列番号RSqの初期
値を特殊値に設定する。受信した応答要求REQUES
Tの時刻系列番号RSqが特殊値であれば、ネットワー
ク状態テーブル13に格納されている、送信元のノード
が離脱した際に割り付けられていた時刻系列番号RSq
を応答RESPONSEに付加して送信元のノードに返
信する。
【0087】これにより、そのリセットした送信元のノ
ードはネットワーク11に残した自身の時刻系列番号R
Sqを得て、以後の周期監視を進めることが可能とな
る。以上で明らかなように、この実施の形態5によれ
ば、各ノードが独立管理する時刻系列番号RSqでノー
ド状態の順序系列を管理できるようになったので、応答
RESPONSEやNOTIFYパケットのパケット喪
失や受信取りこぼしが発生しても、ネットワーク状態テ
ーブル13の時間順序性が損なわれることがない。従っ
て、事象(イベント)発生系列の乱れにより誤報が出
ず、信頼性の高いネットワークの状態監視が可能とな
る。
【0088】また、時刻系列番号RSqの初期値を特殊
値とすることで、リセット参入時や一時停止後の参入に
おいて動作不良なく正しい順序系列で参入検出や状態変
化を管理できる。
【0089】実施の形態6.図10はこの発明の実施の
形態6によるネットワーク監視装置を示す構成図であ
り、図において、図4と同一符号は同一または相当部分
を示すので説明を省略する。18は複数のアプリケーシ
ョン等がそれぞれノード状態の変化を読み出すための、
複数のアプリーケーションに対してそれぞれ割り当てら
れた複数のメッセージキュー(キュー)、19はイベン
ト通知部164に対し、通知すべきイベントの種類やイ
ベント発生の通知先であるメッセージキュー18を指定
するためのイベント管理テーブル、164はノードの参
入又は離脱が検出された場合、イベント管理テーブル1
9に登録されている対応するメッセージキュー18に対
してそのイベントの発生の通知を送信するイベント通知
部(イベント送信手段)である。
【0090】通信アプリケーションなどは、通信相手の
ノードが停止あるいは起動すると、通信処理を停止した
り再開して、通信相手を切り替える等の処理を行う。こ
のためには、ネットワーク状態テーブル13をポーリン
グ監視するだけでなく、状態管理部16から状態変化が
発生したときにイベント通知を受けるための手段が必要
である。イベント通知部164は、状態更新部163が
離脱参入の検出や、応答RESPONSE,NOTIF
Yパケットの受信で、ネットワーク状態テーブル13を
更新する際に、受信したそのような離脱参入の検出に関
する情報または受信したパケットとネットワーク状態テ
ーブル13の現在の内容とを比較して状態変化があれ
ば、対応するメッセージキュー18に対してメッセージ
を送信することで、メッセージキュー18を読みだし待
ちしていた別タスクに状態変化を通知する。
【0091】タスク1はノードの故障発生の通知を受け
たいが、タスク2はネットワーク11からの参入離脱の
通知を受けたいなど、複数の異なるタスクが異なる条件
でイベント通知待ちをする場合、各タスクは、イベント
管理テーブル19に、イベント通知を受けるイベント種
類、通知先のメッセージキュー18、通知対象のノード
などのイベント通知条件を設定する。イベント通知部1
64は、状態変化を検出した際に、イベント管理テーブ
ル19の各条件項目を参照して、通知条件を満足した場
合に指定のメッセージキュー18に対してイベントを通
知する。複数の設定がある場合は、その全ての条件と照
合して各メッセージキュー18に送信するので、全ての
待ち受けタスクにイベントを通知できる。
【0092】以上で明らかなように、この実施の形態6
によれば、ネットワーク11の他のノードに状態変化が
あった場合に、それを知りたいタスクに対して迅速に通
知することができる。通知先のタスクはネットワーク状
態テーブル13をポーリングするのではなく、変化に対
するイベント通知待ちとなるので、CPUを無駄に使う
ことがない。
【0093】実施の形態7.図11はこの発明の実施の
形態7によるネットワーク監視装置を示す構成図であ
り、図において、図1と同一符号は同一または相当部分
を示すので説明を省略する。17aは図4の周期監視部
17と同様の第1の周期監視部、17bは図7の周期監
視部17と同様の第2の周期監視部、20は第1及び第
2の周期監視部17a,17bの共通タイマーである。
【0094】実施の形態2では、ネットワーク論理リン
グの隣接上流ノードの周期生存監視のみを実行し、送受
信パケットは各周期において、1個ずつしかないため、
ネットワーク通信量も通信処理量も少なく、高速周期で
監視が可能である。その反面、複数のネットワークを接
続した場合や、連続した複数のノードが離脱した場合、
リング再構成に時間がかかる。
【0095】実施の形態4では、隣接上流ノードまでの
未参入ノードの参入監視を実行し、上流ノード離脱時に
は上流グループに対して上流探索を実施するため、短時
間でリング再構成ができる。ただし、そのために未参入
監視の通信量が増加し、上流探索のための処理が複雑化
する。
【0096】ネットワーク11の通信管理では、通信障
害は迅速に検出してデータ待避やネットワーク切替え等
の構成制御を行う必要があるが、参入検出は障害検出ほ
ど迅速な検出と構成制御は要求されない。従って、上流
生存監視は高速周期で実施し、参入監視やリング再構成
は低速周期で行うことで、迅速な障害検出と、十分な参
入検出性能を実現するとともに、監視通信処理の低減を
達成できる。
【0097】共通タイマー20は、二つの周期で動作
し、高速周期で周期監視部17aを起動する。周期監視
部17aは、図4の周期監視部17と同様に、隣接上流
ノードに対して応答要求REQUESTを送信する。単
独参入状態ならばブロードキャストし、状態変化があれ
ばNOTIFYパケットをブロードキャストする。各パ
ケットは、パケット送信部14からネットワーク11に
送信される。
【0098】また、共通タイマー20は、低速周期で周
期監視部17bを起動し、周期監視部17bは、図7の
周期監視部17と同様に、隣接上流ノードと未参入ノー
ドに対して、応答要求REQUESTを送信する。ま
た、状態変化があればNOTIFYパケットを通知す
る。各パケットはパケット送信部14からネットワーク
11に送信される。
【0099】高速、低速の両パケットは、パケット受信
部15で受信され、状態管理部16に渡される。状態管
理部16は、図7の状態管理部16と同様に、自身が応
答すべき応答要求REQUESTに対しては、応答RE
SPONSEを送信する。応答RESPONSEが監視
対象の隣接上流ノードからならば、タイムアウトフラグ
をリセットする。上流探索範囲からならば、上流候補の
更新と離脱確定処理を実施する。有効な応答RESPO
NSE又はNOTIFYパケットならば、ネットワーク
状態テーブル13を更新する。
【0100】隣接上流ノードが離脱すると、高速周期の
周期監視部17aが低速周期の周期監視部17bよりも
先に離脱を検出し、次隣接が生存するかどうかの周期監
視を開始する。低速周期の周期監視部17bは、高速周
期の周期監視部17aの離脱検出により、上流探索を実
施する。状態管理部16が、高速周期の周期監視部17
a又は低速周期の周期監視部17bの上流監視または上
流探索の応答RESPONSEを検出して、ネットワー
ク状態テーブル13を更新すると、周期監視部17a,
17bは共に隣接上流ノードの周期監視を開始する。低
速周期の周期監視部17bが上流探索開始する前に、状
態管理部16が高速周期の周期監視部17aの応答要求
REQUESTに対する応答RESPONSEを受信す
ると、その時点で上流確定するので低速周期の周期監視
部17bは上流探索を行わない。
【0101】ネットワーク11の監視管理対象ノードの
応答性にばらつきがあり、高速周期応答が可能な高速ノ
ードと高速周期応答が困難な低速ノードが存在すると
き、低速ノードにおいては、低速周期の周期監視部17
bのみを実行し、高速ノードにおいては、高速周期の周
期監視部17aと低速周期の周期監視部17bの両方を
実行する。このとき、各ノードはネットワーク状態テー
ブル13に高速ノードであるか低速ノードであるかを示
す状態フラグを持ち、ネットワーク参入時に自身が高速
ノードであるか低速ノードであるかを、即ち状態フラグ
を他ノードに通知する。高速周期の周期監視部17a
は、隣接上流ノードを参入高速ノードから選び、周期監
視する。従って、高速周期監視は高速ノードだけで論理
リングを形成して高速周期監視を行う。低速周期の周期
監視部17bは、低速ノードと高速ノードの両方を周期
監視および上流探索の対象とする。
【0102】低速ノードの状態管理部16は、下流の高
速ノードから応答要求REQUESTを受信しない。た
だし、高速周期の周期監視部17aはブロードキャスト
(単独参入の応答要求REQUESTとNOTIFYパ
ケット)は受信し、ネットワーク状態テーブル13を更
新する。即ち、低速ノードは高速周期での応答要求と応
答は行わないが、高速周期の周期監視部17aの状態通
知は受信処理することで、高速ノードの状態変化を得
る。
【0103】以上で明らかなように、この実施の形態7
によれば、上流生存監視は高速周期で実施し、参入監視
やリング再構成は低速周期で行うことで、迅速な障害検
出と、十分な参入検出性能を実現することができるとと
もに、監視通信処理の低減を図ることができる効果があ
る。また、ネットワーク11に接続された監視対象ノー
ドの応答性にばらつきがある場合、高速応答可能なノー
ドは高速低速の両方を実現し、高速応答不可能なノード
は低速のみを実現することで、ネットワーク監視が可能
となる。
【0104】なお、パケット受信部15及びパケット送
信部14を高速周期と低速周期で分離してもよく、ま
た、状態管理部16を高速周期と低速周期で分離しても
よい。また、低速周期の周期監視部17bに、図5の周
期監視部17や、図9の周期監視部17を適用してもよ
い。さらに、状態管理部16に、図10の状態管理部1
6のイベント通知機能を適用してもよい。
【0105】本発明の精神及び範囲から逸脱することな
く本発明の広範囲の異なる実施態様が構成され得る。本
発明は、添付クレームにおいて規定されたもの以外は、
その特定の実施態様に制約されるものではない。
【0106】
【発明の効果】以上のように、この発明によれば、隣接
下流ノードから監視パケットを受信すると、監視パケッ
トに対する応答パケットを隣接下流ノードに送信する応
答手段と、監視パケットを隣接上流ノードに送信し、該
隣接上流ノードから監視パケットに対する応答パケット
が送信されない場合には、ネットワークから隣接上流ノ
ードが離脱したことを検出する検出手段と、検出手段が
隣接上流ノードの離脱を検出すると、その旨を示す通知
パケットをネットワークに接続された他の全てのノード
に同報通信する通知手段とを備えたので、各ノードの通
信処理量の増大を招くことなく、他のノードの監視周期
を高めることができるとともに、高速スイッチ型ネット
ワークへの適用性を高めることができる効果がある。
【0107】この発明によれば、隣接上流ノードから監
視パケットを受信すると、監視パケットに対する応答パ
ケットを隣接上流ノードに送信する応答手段と、監視パ
ケットを隣接下流ノードに送信し、該隣接下流ノードか
ら監視パケットに対する応答パケットが送信されない場
合には、ネットワークから隣接上流ノードが離脱したこ
とを検出する検出手段と、検出手段が隣接下流ノードの
離脱を検出すると、その旨を示す通知パケットをネット
ワークに接続された他の全てのノードに同報通信する通
知手段とを備えたので、各ノードの通信処理量の増大を
招くことなく、他のノードの監視周期を高めることがで
きるとともに、高速スイッチ型ネットワークへの適用性
を高めることができる効果がある。
【0108】この発明によれば、隣接上流ノード及び隣
接下流ノードを識別する論理アドレスを格納する管理テ
ーブルと、検出手段が隣接上流ノード又は隣接下流ノー
ドのネットワークからの離脱を検出した場合又は通知手
段からの通知パケットを受信した場合に管理テーブルを
更新する更新手段とをさらに備えたので、各ノードが他
のノードの離脱を認識することができる効果がある。
【0109】この発明によれば、ネットワーク監視装置
を含むノードがネットワークに新規に参入する場合、更
新手段は、監視パケットをネットワークに接続された他
の全てのノードに同報通信し、監視パケットに対する応
答パケットの受信結果に基づいて管理テーブルを生成す
るので、ネットワークに参入する際、ネットワークに接
続されているノードを認識することができる効果があ
る。
【0110】この発明によれば、ネットワークに新規に
参入した他のノードから監視パケットを受信すると、応
答手段がその監視パケットに対する応答パケットを他の
ノードに送信するとともに、更新手段が管理テーブルを
更新するので、ネットワークに参入したノードを認識す
ることができる効果がある。
【0111】この発明によれば、検出手段は自ノードと
隣接上流ノード又は隣接下流ノードとの間に位置する少
なくも1つの未参入ノードに対して監視パケットを送信
するので、ネットワーク接続時に大きな論理リングを構
成する機能を提供することができる効果がある。
【0112】この発明によれば、自ノードと隣接上流ノ
ード又は隣接下流ノードとの間に規定数以上の未参入ノ
ードがある場合、検出手段は監視パケットをそれらの未
参入ノードに同報通信するので、論理リングの応答要求
によるネットワークトラフィックや、各ノードの送受信
処理を低減できる効果がある。
【0113】この発明によれば、検出手段が隣接上流ノ
ード又は隣接下流ノードのネットワークからの離脱を検
出した場合、上流又は下流のある探索範囲に属する1つ
以上の他のノードに対して監視パケットを送信し、該監
視パケットに対する応答パケットの受信結果に基づいて
新しい隣接上流ノード又は新しい隣接下流ノードを探索
する探索手段をさらに備えたので、不要な応答パケット
の発生が抑制されるようになり、その結果、通信処理の
効率化を図ることができる効果がある。
【0114】この発明によれば、探索手段は探索範囲で
新しい隣接上流ノード又は新しい隣接下流ノードを探索
できない場合、探索範囲を上流方向又は下流方向に変更
して、再度、監視パケットを送信するので、隣接上流ノ
ード又は隣接下流ノードを速やかに検出することができ
る効果がある。
【0115】この発明によれば、他のノードに送信する
パケットに時刻系列番号を付加する番号付加手段をさら
に備えたので、事象発生系列の乱れによる誤報が抑制さ
れるようになり、その結果、信頼性の高いネットワーク
の状態監視が可能になる効果がある。
【0116】この発明によれば、更新手段は他のノード
からのパケットにより管理テーブルを更新する際、パケ
ットに付加された時刻系列番号を参照し、そのパケット
が他のノードで起きた最新の事象に係るものである場合
に限り、管理テーブルを更新するので、事象発生系列の
乱れによる誤報の発生を防止することができる効果があ
る。
【0117】この発明によれば、ノードの参入又は離脱
が検出された場合、予め登録されたキューに対してイベ
ントを送信するイベント送信手段をさらに備えたので、
ネットワークの他のノードに状態変化があった場合に、
それを知りたいタスクに対して迅速に通知することがで
きる効果がある。また、通知先のタスクはネットワーク
状態テーブルをポーリングするのではなく、変化に対す
るイベント通知待ちとなるので、CPUを無駄に使うの
を抑制することができる効果がある。
【0118】この発明によれば、動作周期の異なる複数
の検出手段及び通知手段をさらに備えたので、迅速な障
害検出と、十分な参入検出性能実現できるとともに、監
視通信処理の低減を図ることができる効果がある。
【図面の簡単な説明】
【図1】 この発明の実施の形態1によるネットワーク
監視装置を示す構成図である。
【図2】 接続ノードによる論理リング構成を示す構成
図である。
【図3】 接続ノードによる論理リング構成を示す構成
図である。
【図4】 この発明の実施の形態2によるネットワーク
監視装置を示す構成図である。
【図5】 この発明の実施の形態3によるネットワーク
監視装置を示す構成図である。
【図6】 接続ノードによる論理リング構成を示す構成
図である。
【図7】 この発明の実施の形態4によるネットワーク
監視装置を示す構成図である。
【図8】 接続ノードによる論理リング構成を示す構成
図である。
【図9】 この発明の実施の形態5によるネットワーク
監視装置を示す構成図である。
【図10】 この発明の実施の形態6によるネットワー
ク監視装置を示す構成図である。
【図11】 この発明の実施の形態7によるネットワー
ク監視装置を示す構成図である。
【図12】 従来のネットワーク監視装置を示す構成図
である。
【図13】 障害発生時のメッセージ送信を説明する説
明図である。
【符号の説明】 11 ネットワーク、13 ネットワーク状態テーブル
(管理テーブル)、16 状態管理部(応答手段)、1
7 周期監視部(検出手段、通知手段)、18メッセー
ジキュー(キュー)、163 状態更新部(更新手
段)、164 イベント通知部(イベント送信手段)、
176 隣接探索部(探索手段)、177状態シーケン
ス管理部(番号付加手段)、P1〜Pn ノード。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 植田 健治 東京都千代田区丸の内二丁目2番3号 三 菱電機株式会社内 (72)発明者 矢口 幸男 東京都千代田区丸の内二丁目2番3号 三 菱電機株式会社内

Claims (13)

    【特許請求の範囲】
  1. 【請求項1】 ネットワークに接続されたあるノードに
    設けられたネットワーク監視装置において、 隣接下流ノードから監視パケットを受信すると、監視パ
    ケットに対する応答パケットを前記隣接下流ノードに送
    信する応答手段と、 監視パケットを隣接上流ノードに送信し、該隣接上流ノ
    ードから前記監視パケットに対する応答パケットが送信
    されない場合には、前記ネットワークから前記隣接上流
    ノードが離脱したことを検出する検出手段と、 前記検出手段が前記隣接上流ノードの離脱を検出する
    と、その旨を示す通知パケットを前記ネットワークに接
    続された他の全てのノードに同報通信する通知手段とを
    備えたネットワーク監視装置。
  2. 【請求項2】 ネットワークに接続されたあるノードに
    設けられたネットワーク監視装置において、 隣接上流ノードから監視パケットを受信すると、監視パ
    ケットに対する応答パケットを前記隣接上流ノードに送
    信する応答手段と、 監視パケットを隣接下流ノードに送信し、該隣接下流ノ
    ードから前記監視パケットに対する応答パケットが送信
    されない場合には、前記ネットワークから前記隣接上流
    ノードが離脱したことを検出する検出手段と、 前記検出手段が前記隣接下流ノードの離脱を検出する
    と、その旨を示す通知パケットを前記ネットワークに接
    続された他の全てのノードに同報通信する通知手段とを
    備えたネットワーク監視装置。
  3. 【請求項3】 隣接上流ノード及び隣接下流ノードを識
    別する論理アドレスを格納する管理テーブルと、検出手
    段が前記隣接上流ノード又は隣接下流ノードのネットワ
    ークからの離脱を検出した場合又は通知手段からの通知
    パケットを受信した場合に前記管理テーブルを更新する
    更新手段とをさらに備えた請求項1または請求項2記載
    のネットワーク監視装置。
  4. 【請求項4】 ネットワーク監視装置を含むノードがネ
    ットワークに新規に参入する場合、更新手段は、監視パ
    ケットを前記ネットワークに接続された他の全てのノー
    ドに同報通信し、監視パケットに対する応答パケットの
    受信結果に基づいて前記管理テーブルを生成する請求項
    3記載のネットワーク監視装置。
  5. 【請求項5】 ネットワークに新規に参入した他のノー
    ドから監視パケットを受信すると、応答手段がその監視
    パケットに対する応答パケットを前記他のノードに送信
    するとともに、更新手段が管理テーブルを更新する請求
    項4記載のネットワーク監視装置。
  6. 【請求項6】 検出手段は、自ノードと隣接上流ノード
    又は隣接下流ノードとの間に位置する少なくも1つの未
    参入ノードに対して監視パケットを送信する請求項1ま
    たは請求項2記載のネットワーク監視装置。
  7. 【請求項7】 自ノードと隣接上流ノード又は隣接下流
    ノードとの間に規定数以上の未参入ノードがある場合、
    検出手段は監視パケットをそれらの未参入ノードに同報
    通信する請求項6記載のネットワーク監視装置。
  8. 【請求項8】 検出手段が隣接上流ノード又は隣接下流
    ノードのネットワークからの離脱を検出した場合、上流
    又は下流のある探索範囲に属する1つ以上の他のノード
    に対して監視パケットを送信し、該監視パケットに対す
    る応答パケットの受信結果に基づいて新しい隣接上流ノ
    ード又は新しい隣接下流ノードを探索する探索手段をさ
    らに備えた請求項1または請求項2記載のネットワーク
    監視装置。
  9. 【請求項9】 探索手段は、探索範囲で新しい隣接上流
    ノード又は新しい隣接下流ノードを探索できない場合、
    探索範囲を上流方向又は下流方向に変更して、再度、監
    視パケットを送信する請求項8記載のネットワーク監視
    装置。
  10. 【請求項10】 他のノードに送信するパケットに時刻
    系列番号を付加する番号付加手段をさらに備えた請求項
    1または請求項2記載のネットワーク監視装置。
  11. 【請求項11】 更新手段は、他のノードからのパケッ
    トにより管理テーブルを更新する際、前記パケットに付
    加された時刻系列番号を参照し、そのパケットが前記他
    のノードで起きた最新の事象に係るものである場合に限
    り、前記管理テーブルを更新する請求項10記載のネッ
    トワーク監視装置。
  12. 【請求項12】 ノードの参入又は離脱が検出された場
    合、予め登録されたキューに対してイベントを送信する
    イベント送信手段をさらに備えた請求項5記載のネット
    ワーク監視装置。
  13. 【請求項13】 動作周期の異なる複数の検出手段及び
    通知手段をさらに備えた請求項1または請求項2記載の
    ネットワーク監視装置。
JP11008439A 1998-07-03 1999-01-14 ネットワ―ク監視装置 Pending JP2000082053A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11008439A JP2000082053A (ja) 1998-07-03 1999-01-14 ネットワ―ク監視装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP10-189463 1998-07-03
JP18946398 1998-07-03
JP11008439A JP2000082053A (ja) 1998-07-03 1999-01-14 ネットワ―ク監視装置

Publications (1)

Publication Number Publication Date
JP2000082053A true JP2000082053A (ja) 2000-03-21

Family

ID=26342954

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11008439A Pending JP2000082053A (ja) 1998-07-03 1999-01-14 ネットワ―ク監視装置

Country Status (1)

Country Link
JP (1) JP2000082053A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003533128A (ja) * 2000-05-09 2003-11-05 マルコニ コミュニケイションズ リミテッド 通信システム
JP2007110733A (ja) * 2005-10-14 2007-04-26 Samsung Electronics Co Ltd UPnPネットワークで非正常的に終了した被制御装置の終了メッセージを伝送するための方法及び装置
JP2008530925A (ja) * 2005-02-16 2008-08-07 ノキア・ジーメンス・ネットワークス・ゲゼルシャフト・ミト・ベシュレンクテル・ハフツング・ウント・コンパニー・コマンディトゲゼルシャフト ネットワークユニットの障害の通信ネットワークを介した信号伝送方式
JP2008234617A (ja) * 2007-02-23 2008-10-02 Matsushita Electric Works Ltd 設備監視システム及び監視装置
JP2010525693A (ja) * 2007-04-27 2010-07-22 中控科技集▲団▼有限公司 分散型イーサネットシステムおよび該システムに基づいて障害を検出する方法
WO2011013282A1 (ja) * 2009-07-30 2011-02-03 日本電気株式会社 定期処理実行システム、定期処理実行方法及び定期処理実行プログラム
JP2011229132A (ja) * 2010-03-30 2011-11-10 Yamaha Corp 通信装置、およびプログラム

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003533128A (ja) * 2000-05-09 2003-11-05 マルコニ コミュニケイションズ リミテッド 通信システム
JP2008530925A (ja) * 2005-02-16 2008-08-07 ノキア・ジーメンス・ネットワークス・ゲゼルシャフト・ミト・ベシュレンクテル・ハフツング・ウント・コンパニー・コマンディトゲゼルシャフト ネットワークユニットの障害の通信ネットワークを介した信号伝送方式
JP2007110733A (ja) * 2005-10-14 2007-04-26 Samsung Electronics Co Ltd UPnPネットワークで非正常的に終了した被制御装置の終了メッセージを伝送するための方法及び装置
US8621063B2 (en) 2005-10-14 2013-12-31 Samsung Electronics Co., Ltd. Method and apparatus for transmitting Byebye message when operation of controlled device in UPnP network is abnormally terminated
JP2008234617A (ja) * 2007-02-23 2008-10-02 Matsushita Electric Works Ltd 設備監視システム及び監視装置
JP2010525693A (ja) * 2007-04-27 2010-07-22 中控科技集▲団▼有限公司 分散型イーサネットシステムおよび該システムに基づいて障害を検出する方法
US8339969B2 (en) 2007-04-27 2012-12-25 Supcon Group Co., Ltd. Distributed ethernet system and method for detecting fault based thereon
WO2011013282A1 (ja) * 2009-07-30 2011-02-03 日本電気株式会社 定期処理実行システム、定期処理実行方法及び定期処理実行プログラム
JP2011229132A (ja) * 2010-03-30 2011-11-10 Yamaha Corp 通信装置、およびプログラム

Similar Documents

Publication Publication Date Title
US10674486B2 (en) System, security and network management using self-organizing communication orbits in distributed networks
US6574197B1 (en) Network monitoring device
EP1919138B1 (en) A method for implementing backup of the uplink
EP1697843B1 (en) System and method for managing protocol network failures in a cluster system
CA2311197A1 (en) Enhanced dual counter rotating ring network control system
US20020016874A1 (en) Circuit multiplexing method and information relaying apparatus
US7522598B2 (en) System and method of protecting an IGMP proxy
WO2002098059A1 (en) Method and system for implementing a fast recovery process in a local area network
JPH07297854A (ja) 交換網における相手固定接続管理方式、ノードの管理方式、及びノード
US20120026870A1 (en) Proxy agents in a network
JP2003186765A (ja) ネットワーク接続デバイス、ネットワーク接続デバイス管理システム、ネットワーク接続デバイス管理方法
Thean et al. Container-based MQTT broker cluster for edge computing
CN111935763B (zh) 无线网格网络中提高数据传输可靠性的方法、网络***
WO2016033502A1 (en) Network service aware routers, and applications thereof
JP2000082053A (ja) ネットワ―ク監視装置
US6985448B2 (en) Data transfer system capable of avoiding double reception of same data
US6792558B2 (en) Backup system for operation system in communications system
CN112468363B (zh) 一种链路连通性检测的方法及装置
CN113595828B (zh) 软件定义网络拓扑探测方法及***
CN113805788B (zh) 一种分布式存储***及其异常处理方法和相关装置
CN112636999A (zh) 一种端口的探测方法和网络监控***
CN113746574B (zh) 一种信息交互方法、***及设备
JP7279388B2 (ja) ルータシステムおよびパケット送信判定方法
JP2000278286A (ja) ネットワークシステム
CN114363342A (zh) 故障收敛方法及其相关装置和负载均衡集群

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040921