JP2010034876A - Fault monitoring server and network failure monitoring system - Google Patents
Fault monitoring server and network failure monitoring system Download PDFInfo
- Publication number
- JP2010034876A JP2010034876A JP2008195285A JP2008195285A JP2010034876A JP 2010034876 A JP2010034876 A JP 2010034876A JP 2008195285 A JP2008195285 A JP 2008195285A JP 2008195285 A JP2008195285 A JP 2008195285A JP 2010034876 A JP2010034876 A JP 2010034876A
- Authority
- JP
- Japan
- Prior art keywords
- failure
- network
- relay device
- communication
- fault
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
本発明は、ネットワークを構成する装置や通信回線にて、通信障害の発生有無を監視し、通信障害発生時にはその通信障害発生箇所を特定する障害監視サーバおよびネットワーク障害監視システムに関する。 The present invention relates to a failure monitoring server and a network failure monitoring system for monitoring whether or not a communication failure has occurred in an apparatus or a communication line constituting a network and identifying the location where the communication failure has occurred when a communication failure occurs.
従来、ネットワークシステムを構成するレイヤ2スイッチ(L2SW)、レイヤ3スイッチ(L3SW)の監視は、ネットワーク監視装置が、SNMP(Simple Network Management Protocol)に従い、スイッチと、スイッチの各ポートと接続するPC(Personal Computer)やプリンタなどの接続機器とのアップリンク/ダウンリンクを監視することにより行われている。しかし、この場合、ネットワーク監視装置は、スイッチの各ポートと接続するすべての接続機器について把握する必要がある。例えば、プリンタの電源が入っていなかったためアップリンクができず、その結果、ネットワーク監視装置は通信異常と判断する。この場合の通信異常はプリンタ故障ではないため、ネットワークシステム全体に対する影響は小さい。つまり、ネットワーク監視装置が、スイッチの各ポートと接続するすべての接続機器について把握せず、接続機器の状態が不明確であると、ネットワーク監視装置はスイッチの各ポートを監視していても、通信異常に対するネットワークシステム全体の影響が不明確になる。
そして、ポートのアップリンク/ダウンリンク監視では、接続機器の設定・状態により正常にアップリンクおよびダウンリンクが行われたにもかかわらず、通信できないことがある。そのため、前記したポートのアップリンク/ダウンリンク監視に加えて、ping(Packet INternet Groper)コマンドを使って接続機器のIP(Internet Protocol)アドレスを指定して要求パケット(IPパケット)を送信し、接続機器から応答パケット(IPパケット)を受信する疎通監視をすることが一般的である。
Conventionally, monitoring of a
In the uplink / downlink monitoring of the port, communication may not be possible even though the uplink and downlink are normally performed depending on the setting / status of the connected device. Therefore, in addition to the above-mentioned uplink / downlink monitoring of the port, the request packet (IP packet) is transmitted by specifying the IP (Internet Protocol) address of the connected device using the ping (Packet Internet Groper) command. In general, communication monitoring for receiving a response packet (IP packet) from a device is performed.
また、レイヤ2ネットワークを構成する各スイッチにパケット応答装置を接続して、コアスイッチに監視装置を接続する。パケット応答装置及び監視装置はIPv6に対応している。監視装置は、少なくともVLAN(Virtual Local Area Network)−IDを組み込んだIPv6アドレスを宛先としたping6コマンドを実行し、パケット応答装置からの応答パケットを受信し、受信結果を表示する。応答パケットの受信状況によって、監視者は、パケット応答装置に対応するスイッチにおけるVLAN−IDに対応するVLANの正常性を確認できる監視装置(例えば、特許文献1参照)が開示されている。
しかしながら、通信回線網の冗長化が行われたネットワークにおいて、ネットワーク監視装置がpingコマンドを使って要求パケットを送信して、パケット応答装置からの応答パケットを受信する方法では、通信障害発生箇所を特定することは困難である。
図8に、従来のネットワーク監視装置を備えた、通信回線網の冗長化が行われた従来のネットワーク監視システムの構成を示す。従来のネットワーク監視システム801は、従来のネットワーク監視装置802と、レイヤ2スイッチであるL2SW821,822と、レイヤ3スイッチであるL3SW831,832と、それぞれを接続する通信回線841,842,851,861,862と、ネットワーク803とを備える。
例えば、ネットワーク監視装置802からL2SW821にpingコマンドを使って要求パケットを送信した場合、送信した要求パケットがL2SW821に到達するまでの経路は、(1)ネットワーク監視装置802→通信回線841→L2SW821と、(2)ネットワーク監視装置802→通信回線842→L2SW822→通信回線851→L2SW821との2通りある。
However, in the network where the communication network is made redundant, the network monitoring device uses the ping command to send a request packet and receive the response packet from the packet response device. It is difficult to do.
FIG. 8 shows a configuration of a conventional network monitoring system provided with a conventional network monitoring device and having a communication network made redundant. A conventional network monitoring system 801 includes a conventional network monitoring device 802,
For example, when a request packet is transmitted from the network monitoring device 802 to the
ここで、ネットワーク監視装置802がL2SW821からの応答パケットを受信しなかった場合、L2SW821またはL2SW822で通信障害が発生したのか、もしくは、通信回線で通信障害が発生したのかがわからず、通信障害発生箇所を特定することが困難である。
さらに、例えば、ネットワーク監視装置802からL3SW831にpingコマンドを使って要求パケットを送信した場合、L2SW821に要求パケットを送信した場合と比較して、送信した要求パケットが目的地(L3SW831)に到達するまでの経路の数は増える。そのため、さらに、通信障害発生箇所を特定することが困難になる。
Here, when the network monitoring device 802 does not receive the response packet from the
Furthermore, for example, when a request packet is transmitted from the network monitoring apparatus 802 to the
そこで、前記した課題を解決するために、本発明は、ネットワークを構成する中継装置や通信回線に対して、通信障害の発生有無を監視し、通信障害発生時にはその通信障害発生箇所を特定する障害監視サーバおよびネットワーク障害監視システムを提供することを目的とする。 Therefore, in order to solve the above-described problem, the present invention monitors the presence / absence of a communication failure with respect to a relay device or a communication line that constitutes a network, and identifies a failure location when the communication failure occurs. An object is to provide a monitoring server and a network failure monitoring system.
本発明の障害監視サーバは、複数の中継装置(例えば、スイッチ)と通信回線を介して接続され、前記中継装置と前記通信回線とで構成される物理ネットワーク(例えば、通信回線網)の障害箇所を特定する障害監視サーバであって、各前記中継装置までツリー構造を成すように通信経路を形成し、前記通信経路がそれぞれ異なる複数の論理ネットワーク(例えば、VLAN)を設定する設定部と、各前記論理ネットワーク毎に、監視データ(例えば、要求パケット:IPパケット)を各前記中継装置に送信し、前記中継装置から応答データ(例えば、応答パケット:IPパケット)を受信する通信部と、前記論理ネットワーク毎の各前記中継装置からの前記応答データの受信有無から、前記物理ネットワークの障害箇所を特定する障害箇所特定部とを備える。 The failure monitoring server of the present invention is connected to a plurality of relay devices (for example, switches) via a communication line, and a failure location of a physical network (for example, a communication line network) configured by the relay device and the communication line. A setting unit configured to form a communication path so as to form a tree structure to each of the relay devices, and set a plurality of logical networks (for example, VLANs) having different communication paths, A communication unit that transmits monitoring data (for example, request packet: IP packet) to each relay device and receives response data (for example, response packet: IP packet) from the relay device for each logical network; A failure location that identifies the failure location of the physical network from the presence or absence of reception of the response data from each relay device for each network And a tough.
かかる構成によれば、通信経路が異なる論理ネットワークであるため、監視データの送付先が同じ中継装置から通信経路により応答データの受信があった場合(受信有)と、応答データの受信がなかった場合(受信無)とから、物理ネットワークの障害箇所を特定することができる。 According to this configuration, since the communication network is a different logical network, the response data is not received when the response data is received from the relay device having the same monitoring data destination via the communication route (reception is present). From the case (no reception), it is possible to identify the failure location of the physical network.
本発明によれば、ネットワークを構成する中継装置や通信回線に対して、通信障害の発生有無を監視し、通信障害発生時にはその通信障害発生箇所を特定する障害監視サーバおよびネットワーク障害監視システムを提供することができる。 According to the present invention, a fault monitoring server and a network fault monitoring system are provided for monitoring the presence / absence of a communication failure with respect to a relay device or a communication line constituting a network, and identifying the location of the communication failure when a communication failure occurs. can do.
図1は、本発明の実施形態に係るネットワーク障害監視システム1のネットワーク構成の一例を示す図である。(1)はVLANaの通信経路、(2)はVLANbの通信経路を示す図である。
本実施形態のネットワーク障害監視システム1は、障害監視サーバ2と、L2SW21、22と、L3SW31、32と、それぞれを接続する通信回線41、42、51、61、62と、ネットワーク3とを備える。
FIG. 1 is a diagram illustrating an example of a network configuration of a network
The network
L2SW21、22およびL3SW31、32は中継装置であり、特に、L2SW21、22はレイヤ2スイッチであり、L3SW31、32はレイヤ3スイッチである。
通信回線41、42、51、61、62は、LAN(Local Area Network)ケーブルにより実現される。
ネットワーク3は、レイヤ3スイッチ同士の通信を可能にする。
The
The communication lines 41, 42, 51, 61 and 62 are realized by a LAN (Local Area Network) cable.
The
障害監視サーバ2は、ネットワーク障害監視システム1が備える中継装置(L2SW21、22およびL3SW31、32)に対して、VLANを設定する。
例えば、障害監視サーバ2は中継装置(L2SW21、22およびL3SW31、32)に対して、図1の(1)VLANa、(2)VLANbに示すように、障害監視サーバ2から中継装置までツリー構造を成すように通信経路(ルート)を形成し、その通信経路がそれぞれ異なるVLANを設定する。例えば、VLANaには、(ルートa1:)障害監視サーバ2→通信回線41→L2SW21→通信回線61→L3SW31と、(ルートa2:)障害監視サーバ2→通信回線41→L2SW21→通信回線51→L2SW22→通信回線62→L3SW32とする通信経路が形成される。VLANbも同様に、(ルートb1:)障害監視サーバ2→通信回線42→L2SW22→通信回線51→L2SW21→通信回線61→L3SW31と、(ルートb2:)障害監視サーバ2→通信回線42→L2SW22→通信回線62→L3SW32とする通信経路が形成される。
The
For example, the
図2は、本発明の実施形態に係るネットワーク障害監視システム1aのネットワーク構成の一例を示す図である。
図2に示されるように、ネットワーク障害監視システム1aは、図1のネットワーク障害監視システム1に、さらにL2SW223と、通信回線252、253とを備えたものである。
ネットワーク障害監視システム1aは、ネットワークを構成する構成要素が追加されても、図1のネットワーク障害監視システム1と同様に、障害監視サーバ202は、ネットワーク障害監視システム1aが備える中継装置(L2SW221、222、223およびL3SW231、232)に対して、例えば、障害監視サーバ202は、図2の(1)VLANa〜(6)VLANfに示すように、障害監視サーバ202から中継装置(L2SW221、222、223およびL3SW231、232)までツリー構造を成すように通信経路を形成し、その通信経路に対してそれぞれ異なるVLANを設定する。
FIG. 2 is a diagram showing an example of a network configuration of the network
As shown in FIG. 2, the network
In the network
そして、障害監視サーバ2(図1)は、異なる通信経路をもつVLAN(VLANa、VLANb)が設定された中継装置(L2SW21、22およびL3SW31、32)に、VLAN毎に異なるIPアドレスを設定する。例えば、障害監視サーバ2は、L2SW21に対して、VLANaを設定したことを示す“192.168.1.21”のIPアドレスと、VLANbを設定したことを示す“192.168.2.21”のIPアドレスとを設定する。
また、障害監視サーバ2は、pingコマンドを利用して、中継装置(L2SW21、22およびL3SW31、32)に要求パケット(IPパケット)を送信する。このとき、要求パケットは、中継装置に設定されたVLANの通信経路に沿って、目的地である中継装置に到達する。そして、障害監視サーバ2は、送信した要求パケットに対する応答パケット(IPパケット)を中継装置から受信することで、障害監視サーバ2と中継装置との間で正常に通信が行われていることを判断する。
Then, the failure monitoring server 2 (FIG. 1) sets a different IP address for each VLAN in the relay devices (
Also, the
図3は、障害監視サーバ2の構成の一例を示すブロック図である。
図3に示されるように、障害監視サーバ2は、制御部310と、通信部320と、表示部330と、記憶部340とを備え、さらに、制御部310は、障害箇所特定部311と、設定部312とを備え、記憶部340は、VLAN設定IPアドレス記憶部341と、VLAN設定ルート記憶部342と、応答データ受信有無記憶部343と、障害箇所特定記憶部344とを備える。
FIG. 3 is a block diagram illustrating an example of the configuration of the
As shown in FIG. 3, the
制御部310は、CPU(Central Processing Unit)およびRAM(Random Access Memory)とROM(Read Only Memory)などで構成される。
通信部320は、ネットワークカード(NIC:Network Interface Card)により実現される。このNICは、障害監視サーバ2(通信部320)とLANケーブルなどで直接接続されているレイヤ2スイッチの数(例えば、図1ではL2SW21とL2SW22の2台)と同じ数だけ、障害監視サーバ2に備えられている。
表示部330は、ネットワーク障害監視システム1を利用する利用者に対して、情報を提供する液晶モニタなどにより実現される。
記憶部340は、HD(Hard Disk)、RAMなどにより実現される。
The
The
The
The storage unit 340 is realized by an HD (Hard Disk), a RAM, or the like.
制御部310は、記憶部340(後記のVLAN設定IPアドレス記憶部341)に記憶されたIPアドレスを取得し、通信部320に渡す。そして、制御部310は通信部320を制御して、pingコマンドを利用して、取得したIPアドレスが示す中継装置に要求パケットを送信する。
また、制御部310は、通信部320から応答パケットを受信したことを示す信号を受信する。そして、その応答パケットから、応答パケットを返信した中継装置のIPアドレスを取得する。制御部310の障害箇所特定部311は、そのIPアドレスに基づいて、記憶部340(後記のVLAN設定IPアドレス記憶部341)に記憶されたデータ(後記のVLAN設定IPアドレステーブル3411)から、応答パケットを返信した中継装置に設定されたVLANを特定する。これにより、障害箇所特定部311は、障害監視サーバ2から、応答パケットを返信した中継装置までのVLANの通信経路では、正常に通信が行われていると判断し、記憶部340(後記のL2SW応答パケット受信有無パターンテーブル3431、L3SW応答パケット受信有無パターンテーブル3432)に中継装置から応答パケットを受信したこと(正常に通信が行われたこと)を記録する。
The
一方、障害箇所特定部311は、要求パケットを中継装置に送信したが、その中継装置から応答パケットを受信しなかったとき、障害監視サーバ2から、応答パケットを返信しなかった中継装置までのVLANの通信経路では、通信障害が発生していると判断し、記憶部340に中継装置から応答パケットを受信していないこと(通信異常発生)を記録する。
また、障害箇所特定部311は、記憶部340から、中継装置から応答パケットを受信したことを記録したデータ(後記のL2SW応答パケット受信有無パターンテーブル3431、L3SW応答パケット受信有無パターンテーブル3432)と、予め記憶部340に記憶された、障害発生箇所とその障害が発生したときの中継装置から応答パケットの受信有無とが記録された障害発生箇所特定テーブル(L2SW監視用障害箇所特定テーブル3441、L3SW監視用障害箇所特定テーブル3442)とを参照して、障害発生箇所を特定する。
On the other hand, the fault
In addition, the failure
設定部312は、ネットワーク障害監視システム1が備える中継装置に対して、障害監視サーバ2から中継装置までツリー構造を成すように通信経路を形成し、その通信経路がそれぞれ異なるVLANを設定する。さらに、設定部312は、異なる通信経路をもつVLANが設定された中継装置に、VLAN毎に異なるIPアドレスを設定し、そのIPアドレスを記憶部340に記憶する。
The
ここで、図4は、記憶部340のVLAN設定IPアドレス記憶部341、VLAN設定ルート記憶部342に記憶されるテーブルの一例である。(1)は、VLAN設定IPアドレス記憶部341に記憶されるVLAN設定IPアドレステーブル3411、(2)は、VLAN設定ルート記憶部342に記憶されるVLAN設定ルートテーブル3421、(3)は、VLAN設定ルート記憶部342に記憶されるVLAN設定ルートテーブル3422である。
図5は、記憶部340の応答データ受信有無記憶部343に記憶されるテーブルの一例である。(1)は、L2SW応答パケット受信有無パターンテーブル3431、(2)は、L3SW応答パケット受信有無パターンテーブル3432である。
図6は、記憶部340の障害箇所特定記憶部344に記憶されるテーブルの一例である。(1)は、L2SW監視用障害箇所特定テーブル3441、(2)は、L3SW監視用障害箇所特定テーブル3442である。
Here, FIG. 4 is an example of a table stored in the VLAN setting IP
FIG. 5 is an example of a table stored in the response data reception presence /
FIG. 6 is an example of a table stored in the failure location specifying
記憶部340は、VLAN設定IPアドレス記憶部341と、VLAN設定ルート記憶部342と、応答データ受信有無記憶部343と、障害箇所特定記憶部344とを備える。
VLAN設定IPアドレス記憶部341は、図4に示されるVLAN設定IPアドレステーブル3411を記憶する。
VLAN設定IPアドレステーブル3411は、設定部312がVLAN毎に各スイッチに設定したIPアドレスを記憶している。
例えば、図4に示されるように、VLAN設定IPアドレステーブル3411は、VLANaが設定されたL2SW21、L2SW22、L3SW31、L3SW32のそれぞれのIPアドレス“192.168.1.21”、“192.168.1.22”、“192.168.1.31”、“192.168.1.32”を記憶する。同様に、VLANb、VLANzが設定されたL2SW21、L2SW22、L3SW31、L3SW32のそれぞれのIPアドレスを記憶する。
The storage unit 340 includes a VLAN setting IP
The VLAN setting IP
The VLAN setting IP address table 3411 stores IP addresses set by the
For example, as illustrated in FIG. 4, the VLAN setting IP address table 3411 includes IP addresses “192.168.1.21”, “192.168.1.22”, “192.168. “1.31” and “192.168.1.32” are stored. Similarly, the IP addresses of L2SW21, L2SW22, L3SW31, and L3SW32 in which VLANb and VLANz are set are stored.
VLAN設定ルート記憶部342は、図4に示されるVLAN設定ルートテーブル3421、3422を記憶する。
VLAN設定ルートテーブル3421は、設定部312がVLAN毎に各スイッチまでツリー構造を成すように形成した障害監視サーバ2からの通信経路(ルート)を記憶する。
例えば、図4に示されるように、VLAN設定ルートテーブル3421は、VLANaの場合、ルートa1:(障害監視サーバ2→)通信回線41→L2SW21→通信回線61→L3SW31と、ルートa2:(障害監視サーバ2→)通信回線41→L2SW21→通信回線51→L2SW22→通信回線62→L3SW32とする通信経路を記憶する。
また、VLAN設定ルートテーブル3422は、VLANzが設定された中継装置を記憶する。
例えば、図4に示されるように、要求パケット送信先を示す各中継装置を区別する情報として、L2SW21、L2SW22、L3SW31、L3SW32が記憶される。
The VLAN setting
The VLAN setting route table 3421 stores a communication path (route) from the
For example, as shown in FIG. 4, in the case of VLANa, the VLAN setting route table 3421 includes route a1: (fault monitoring
Further, the VLAN setting route table 3422 stores the relay device in which VLANz is set.
For example, as shown in FIG. 4, L2SW21, L2SW22, L3SW31, and L3SW32 are stored as information for distinguishing each relay device indicating a request packet transmission destination.
図4に示されるVLAN設定ルートテーブル3422に記憶された要求パケット送信先について、便宜上簡略化して記載したが、各中継装置を区別する情報として、MACアドレスが記憶されてもよい。 Although the request packet transmission destination stored in the VLAN setting route table 3422 shown in FIG. 4 is described in a simplified manner for convenience, a MAC address may be stored as information for distinguishing each relay device.
応答データ受信有無記憶部343(図3)は、図5に示されるL2SW応答パケット受信有無パターンテーブル3431と、L3SW応答パケット受信有無パターンテーブル3432とを記憶する。
L2SW応答パケット受信有無パターンテーブル3431には、通信部320がVLAN毎に設定された中継装置のうち、レイヤ2スイッチに送信した要求パケットに対して、レイヤ2スイッチが送信した応答パケットを通信部320が受信したか否かが記憶される。
例えば、図5に示されるように、L2SW応答パケット受信有無パターンテーブル3431には、VLANaが設定されたレイヤ2スイッチ(L2SW21とL2SW22)に送信した要求パケットに対して、L2SW21およびL2SW22から応答パケットを受信したことを示す“OK”が記憶されている。
The response data reception presence / absence storage unit 343 (FIG. 3) stores the L2SW response packet reception presence / absence pattern table 3431 and the L3SW response packet reception presence / absence pattern table 3432 shown in FIG.
In the L2SW response packet reception presence / absence pattern table 3431, the response packet transmitted by the
For example, as shown in FIG. 5, in the L2SW response packet reception presence / absence pattern table 3431, response packets from the L2SW 21 and
同様に、L3SW応答パケット受信有無パターンテーブル3432には、通信部320がVLAN毎に設定された中継装置のうち、レイヤ3スイッチに送信した要求パケットに対して、レイヤ3スイッチが送信した応答パケットを通信部320が受信したか否かが記憶される。
Similarly, in the L3SW response packet reception presence / absence pattern table 3432, the response packet transmitted by the
障害箇所特定記憶部344は、図6に示されるL2SW監視用障害箇所特定テーブル3441と、L3SW監視用障害箇所特定テーブル3442とを記憶する。
L2SW監視用障害箇所特定テーブル3441には、ネットワーク障害監視システム1に備えられた中継装置のうちレイヤ2スイッチが障害発生箇所であった場合と、障害監視サーバ2から各レイヤ2スイッチまでの通信経路上の通信回線が障害発生箇所であった場合に、VLAN毎に設定されたレイヤ2スイッチに要求パケットを送信したとき、レイヤ2スイッチから応答パケットを通信部320が受信するか否かを示す受信有無パターンが記憶される。
例えば、図6に示されるように、L2SW監視用障害箇所特定テーブル3441には、VLANaが設定されたレイヤ2スイッチ(L2SW21とL2SW22)に送信した要求パケットに対して、障害が発生していなければ(「障害箇所なし」)、L2SW21およびL2SW22から応答パケットを受信することを示す“OK”が記憶されている。また、障害がL2SW21にて発生していれば(障害発生箇所「L2SW21」)、L2SW21およびL2SW22から応答パケットを受信しないことを示す“NG”が記憶されている。
The failure location specifying
The failure location identification table 3441 for L2SW monitoring includes a case where a
For example, as shown in FIG. 6, in the failure location identification table 3441 for L2SW monitoring, if a failure has not occurred in the request packet transmitted to the
同様に、L3SW監視用障害箇所特定テーブル3442には、ネットワーク障害監視システム1に備えられた中継装置のうちレイヤ3スイッチが障害発生箇所であった場合と、各レイヤ2スイッチから各レイヤ3スイッチまでの通信経路上の通信回線が障害発生箇所であった場合に、VLAN毎に設定されたレイヤ3スイッチに要求パケットを送信したとき、レイヤ3スイッチから応答パケットを通信部320が受信するか否かを示す受信有無パターンが記憶される。
前記したL2SW監視用障害箇所特定テーブル3441と、L3SW監視用障害箇所特定テーブル3442とは、設定部312がVLANを設定した後、かつ、障害監視サーバ2(制御部310の障害箇所特定部311)がネットワーク障害監視システム1にて障害が発生した箇所(障害発生箇所)を特定する処理をする前に、予め記憶部340(障害箇所特定記憶部344)に記憶しておく。
Similarly, in the failure location identification table 3442 for L3SW monitoring, when the
The L2SW monitoring failure location specifying table 3441 and the L3SW monitoring failure location specifying table 3442 are set after the
通信部320は、制御部310に制御され、渡されたIPアドレスが示す中継装置に要求パケットを送信する。また、通信部320は、中継装置が返信した応答パケットを受信し、制御部310に応答パケットを受信したことを示す信号を送信する。
The
表示部330は、ネットワーク障害監視システム1を利用する利用者に対して、障害発生箇所を情報として提供するものである。本実施形態に係るネットワーク障害監視システム1に備えられる表示部330は、液晶モニタなどの画面上に障害発生箇所の位置情報を表示する。しかし、表示部330は、スピーカなどの音声で位置情報を報知するものであってもよいし、ネットワーク構成をマップしたネットワーク構成図にLEDなどを取り付け、光などの信号で位置情報を表示するものであってもよい。
The
図7は、本実施形態に係る障害監視サーバ2が障害箇所を特定する動作を示すフローチャートである。
以下、図7に示すフローチャートを参照しながら、図1および図3に示す本実施形態に係る障害監視サーバ2が図4〜図6に示すテーブルを用いて障害箇所を特定する動作について詳細に説明する。
FIG. 7 is a flowchart showing an operation in which the
Hereinafter, the operation of the
まず、制御部310は、設定部312が設定し、記憶部340のVLAN設定IPアドレス記憶部341に記憶したVLAN設定IPアドレステーブル3411(図4)と、記憶部340のVLAN設定ルート記憶部342に記憶したVLAN設定ルートテーブル3421、3422(図4)とに基づいて、VLAN毎に設定された中継装置のIPアドレスを取得する。次に、制御部310は、pingコマンドを使って中継装置のIPアドレスを指定し、通信部320に中継装置(スイッチ)へ各VLANの通信経路で(他にも反映)要求パケットを送信させる。そして、送信した要求パケットに対する中継装置(スイッチ)からの応答パケットを通信部320が受信する(ステップS701)。
例えば、制御部310は、L2SW21に対して、VLANaでは“192.168.1.21”のIPアドレスを指定して通信部320にVLANaの通信経路で要求パケットを送信させ、VLANbでは“192.168.2.21”のIPアドレスを指定して通信部320にVLANbの通信経路で要求パケットを送信させる。そして、L2SW21からのVLANaでの応答パケット、VLANbでの応答パケットを通信部320が受信する。
First, the
For example, the
制御部310の障害箇所特定部311は、通信部320が中継装置からの応答パケットを受信したか否かに基づいて、応答データ受信有無記憶部343にL2SW応答パケット受信有無パターンテーブル3431(図5)とL3SW応答パケット受信有無パターンテーブル3432(図5)とを作成する(ステップS702)。
例えば、障害箇所特定部311は、通信部320がL2SW21からのVLANaでの応答パケットを受信していれば、L2SW応答パケット受信有無パターンテーブル3431にて、VLANaのL2SW21に“OK”を書き込む。また、通信部320がL3SW31からのVLANaでの応答パケットを受信していなければ、L3SW応答パケット受信有無パターンテーブル3432にて、VLANaのL3SW31に“NG”を書き込む。このようにして、障害箇所特定部311は、L2SW応答パケット受信有無パターンテーブル3431とL3SW応答パケット受信有無パターンテーブル3432とを作成する。
Based on whether the
For example, if the
次に、障害箇所特定部311は、記憶部340から、障害箇所特定記憶部344に記憶されたL2SW監視用障害箇所特定テーブル3441(図6)を取得する(ステップS703)。
そして、障害箇所特定部311は、ステップS702で作成したL2SW応答パケット受信有無パターンテーブル3431(図5)に記録されたパケット受信有無パターンと、ステップS703で取得したL2SW監視用障害箇所特定テーブル3441(図6)に記録されたパケット受信有無パターンとを比較して、障害箇所があるか否かを判定する(ステップS704)
Next, the fault
Then, the failure
例えば、L2SW応答パケット受信有無パターンテーブル3431に記録されたパケット受信有無パターンと、L2SW監視用障害箇所特定テーブル3441に記録されたパケット受信有無パターンとを比較したときに、L2SW応答パケット受信有無パターンテーブル3431に記録されたパケット受信有無パターンが、図5に示される(OK,OK,OK,OK,OK,OK)であれば、図6に示されるL2SW監視用障害箇所特定テーブル3441に記録された「障害箇所なし」のパケット受信有無パターンと一致する。よって、障害箇所特定部311は、「障害箇所はない」と判定する。
また、L2SW応答パケット受信有無パターンテーブル3431に記録されたパケット受信有無パターンが(NG,NG,OK,OK,OK,OK)であれば、図6に示されるL2SW監視用障害箇所特定テーブル3441に記録された「通信回線41」のパケット受信有無パターンと一致する。よって、障害箇所特定部311は、「障害箇所がある」と判定する。
For example, when the packet reception presence / absence pattern recorded in the L2SW response packet reception presence / absence pattern table 3431 is compared with the packet reception presence / absence pattern recorded in the failure location specifying table 3441 for L2SW monitoring, the L2SW response packet reception presence / absence pattern table If the packet reception presence / absence pattern recorded in 3431 is (OK, OK, OK, OK, OK, OK) shown in FIG. 5, it is recorded in the L2SW monitoring failure location identification table 3441 shown in FIG. Matches the packet reception presence / absence pattern of “no fault location”. Therefore, the failure
Also, if the packet reception presence / absence pattern recorded in the L2SW response packet reception presence / absence pattern table 3431 is (NG, NG, OK, OK, OK, OK), the L2SW monitoring failure location identification table 3441 shown in FIG. It matches the recorded packet reception presence / absence pattern of “communication line 41”. Therefore, the failure
ここで、障害箇所特定部311が「障害箇所はない」と判定した場合(ステップS704,No)、障害箇所特定部311は、記憶部340から、障害箇所特定記憶部344に記憶されたL3SW監視用障害箇所特定テーブル3442(図6)を取得する(ステップS705)。
そして、障害箇所特定部311は、ステップS702で作成したL3SW応答パケット受信有無パターンテーブル3432(図5)に記録されたパケット受信有無パターンと、ステップS705で取得したL3SW監視用障害箇所特定テーブル3442(図6)に記録されたパケット受信有無パターンとを比較して、障害箇所があるか否かを判定する(ステップS706)
Here, when the failure
Then, the failure
例えば、L3SW応答パケット受信有無パターンテーブル3432に記録されたパケット受信有無パターンと、L3SW監視用障害箇所特定テーブル3442に記録されたパケット受信有無パターンとを比較したときに、L3SW応答パケット受信有無パターンテーブル3432に記録されたパケット受信有無パターンが、図5に示される(NG,OK,NG,OK,NG,OK)であれば、図6に示されるL3SW監視用障害箇所特定テーブル3442に記録された「L3SW32」のパケット受信有無パターンと一致する。よって、障害箇所特定部311は、「障害箇所がある」と判定する。
また、L3SW応答パケット受信有無パターンテーブル3432に記録されたパケット受信有無パターンが(OK,OK,OK,OK,OK,OK)であれば、図6に示されるL3SW監視用障害箇所特定テーブル3442に記録された「障害箇所なし」のパケット受信有無パターンと一致する。よって、障害箇所特定部311は、「障害箇所はない」と判定する。
For example, when the packet reception presence / absence pattern recorded in the L3SW response packet reception presence / absence pattern table 3432 is compared with the packet reception presence / absence pattern recorded in the L3SW monitoring failure location identification table 3442, the L3SW response packet reception presence / absence pattern table If the packet reception presence / absence pattern recorded in 3432 is (NG, OK, NG, OK, NG, OK) shown in FIG. 5, it is recorded in the L3SW monitoring failure location identification table 3442 shown in FIG. It matches the “L3SW32” packet reception presence / absence pattern. Therefore, the failure
If the packet reception presence / absence pattern recorded in the L3SW response packet reception presence / absence pattern table 3432 is (OK, OK, OK, OK, OK, OK), the L3SW monitoring failure location identification table 3442 shown in FIG. It matches the recorded packet reception presence / absence pattern of “no failure part”. Therefore, the failure
ここで、障害箇所特定部311が「障害箇所はない」と判定した場合(ステップS706,No)、障害箇所特定部311は処理を終了する。
一方、障害箇所特定部311がステップS704またはステップS706にて「障害箇所がある」と判定した場合(ステップS704,YesまたはステップS706,Yes)、障害箇所特定部311は、「障害箇所がある」と判定されたときに一致したパケット受信有無パターンから、障害発生箇所を特定する(ステップS707)。
例えば、ステップS706にて、L3SW応答パケット受信有無パターンテーブル3432に記録されたパケット受信有無パターンが、図5に示される(NG,OK,NG,OK,NG,OK)であれば、図6に示されるL3SW監視用障害箇所特定テーブル3442に記録された「L3SW32」のパケット受信有無パターンと一致するため、障害発生箇所は「L3SW32」と特定される。
Here, when the failure
On the other hand, when the failure
For example, if the packet reception presence / absence pattern recorded in the L3SW response packet reception presence / absence pattern table 3432 in step S706 is (NG, OK, NG, OK, NG, OK) shown in FIG. Since the packet reception presence / absence pattern of “L3SW32” recorded in the L3SW monitoring failure location specifying table 3442 shown in the figure matches, the failure occurrence location is specified as “L3SW32”.
そして、制御部310は、表示部330を制御して、障害発生箇所を表示させる(ステップS708)。その後、制御部310は、すべての処理を終了する。
And the
なお、前記した本実施形態に係るネットワーク障害監視システム1によれば、pingコマンドを利用して、障害監視サーバ2から要求パケットを送信する際に用いられるIPアドレスは、IPv4(Internet Protocol Version 4)で規定されるIPアドレスだけでなく、IPv6(Internet Protocol Version 6)で規定されるIPアドレスを用いてもよい。
Note that, according to the network
前記した本実施形態に係るネットワーク障害監視システム1によれば、pingコマンドを利用して、障害監視サーバ2から送信される要求パケットは、VLAN毎に異なる通信経路で、VLANの数だけ目的地の中継装置に送信される。そのため、目的地の中継装置が正常に通信可能な状態であれば、障害監視サーバ2は目的地の中継装置からの応答パケットを受信する。よって、目的地の中継装置からの応答パケットを受信しなかった場合、目的地の中継装置にて障害が発生していると容易に特定することができる。
According to the network
また、障害監視サーバ2が目的地の中継装置に、あるVLANの通信経路で送信した要求パケットに対する応答パケットは受信できたが、別のVLANの通信経路で送信した要求パケットに対する応答パケットは受信できなかった場合には、障害監視サーバ2から目的地の中継装置までの通信経路上に障害が発生していると容易に判断することができる。さらに、障害監視サーバ2が目的地の中継装置に、複数のVLANの通信経路で送信した要求パケットを送信することで、どのVLANの通信経路で送信した要求パケットに対する応答パケットを受信できなかったかを把握でき、応答パケットを受信できた/できなかった通信経路を比較することで、障害監視サーバ2から目的地の中継装置までのどの通信回線で障害が発生しているのかを容易に特定することができる。
In addition, the
前記した本実施形態に係るネットワーク障害監視システム1によれば、障害発生箇所を容易に特定することができるため、日常的に行われる障害監視が容易になる。また、ネットワーク障害発生時の対応もすぐに行うことができるといったネットワーク管理が容易になる。
According to the network
SNMPを使ったネットワーク管理によるネットワーク監視では、中継装置で動作するソフトウエアによる通信異常を検出することができないが、前記した本実施形態に係るネットワーク障害監視システム1によれば、その通信異常が中継装置で発生していると、障害発生箇所を特定することができる。また、SNMP機能を有さなくても、中継装置はpingコマンドによる要求パケットに対して応答パケットを返信することができるため、SNMP機能を有さない中継装置に対しても監視することができる。さらに、本実施形態に係るネットワーク障害監視システム1は、中継装置にSNMPに関する設定をする必要がない。そのため、中継装置のセキュリティレベルを下げることなく、中継装置を監視することができる。
In network monitoring by network management using SNMP, it is impossible to detect a communication abnormality caused by software operating on a relay device. However, according to the network
前記した本実施形態に係るネットワーク障害監視システム1によれば、障害監視サーバ2を独立した専用の機器としているが、メールサーバやファイルサーバなど各種サービス機能を有するサーバに備えられていてもよい。
また、本実施形態に係るネットワーク障害監視システム1によるネットワーク障害監視と、SNMPを使ったネットワーク管理によるネットワーク監視とを併用してもよい。併用することによって、pingコマンドを使って周期的にIPパケットを送出することにより、ハード故障(ポートのリンクアップ、リンクダウンなど)検出の即時性に優れ、さらに故障検出時には故障箇所を限定することができます。
According to the network
Further, network failure monitoring by the network
前記した本実施形態に係るネットワーク障害監視システム1によれば、障害監視サーバ2を1台だけ備えて、ネットワークの障害監視を行っているが、障害監視サーバを複数台備えてもよい。例えば、図9に示すように、ネットワーク障害監視システム1bが障害監視サーバ902aと障害監視サーバ902bとの2台を並列に備えることで、障害監視サーバを冗長化することができるため、ネットワークの障害監視を行っている障害監視サーバ902aに障害が発生しても、障害監視サーバ902bによりネットワークの障害監視を引き続き行うことができる。
According to the network
1 ネットワーク障害監視システム
2 障害監視サーバ
3 ネットワーク
21、22 L2SW(レイヤ2スイッチ)
31、32 L3SW(レイヤ3スイッチ)
41、42、51、61、62 通信回線
310 制御部
311 障害箇所特定部
312 設定部
320 通信部
330 表示部
340 記憶部
341 VLAN設定IPアドレス記憶部
342 VLAN設定ルート記憶部
343 応答データ受信有無記憶部
344 障害箇所特定記憶部
3411 VLAN設定IPアドレステーブル
3421、3422 VLAN設定ルートテーブル
3431 L2SW応答パケット受信有無パターンテーブル
3432 L3SW応答パケット受信有無パターンテーブル
3441 L2SW監視用障害箇所特定テーブル
3442 L3SW監視用障害箇所特定テーブル
1 Network
31, 32 L3SW (
41, 42, 51, 61, 62
Claims (6)
各前記中継装置までツリー構造を成すように通信経路を形成し、前記通信経路がそれぞれ異なる複数の論理ネットワークを設定する設定部と、
各前記論理ネットワーク毎に、監視データを各前記中継装置に送信し、前記中継装置から応答データを受信する通信部と、
前記論理ネットワーク毎の各前記中継装置からの前記応答データの受信有無から、前記物理ネットワークの障害箇所を特定する障害箇所特定部と
を備えることを特徴とする障害監視サーバ。 A failure monitoring server that is connected to a plurality of relay devices via a communication line and identifies a failure point of a physical network configured by the relay device and the communication line,
Forming a communication path so as to form a tree structure to each of the relay devices, a setting unit configured to set a plurality of logical networks different from each other,
For each logical network, a communication unit that transmits monitoring data to each relay device and receives response data from the relay device;
A failure monitoring server, comprising: a failure location identifying unit that identifies a failure location of the physical network based on whether or not the response data is received from each relay device for each logical network.
前記障害箇所特定部は、前記障害箇所特定テーブルに記憶された受信有無パターンと、前記論理ネットワーク毎の各前記中継装置からの前記応答データの受信有無パターンとを比較して、前記物理ネットワークの障害箇所を特定することを特徴とする請求項1に記載された障害監視サーバ。 The fault location specifying unit includes a fault location specifying table in which a fault occurrence location and a reception presence / absence pattern of response data from each relay device for each logical network at the time of the failure are stored in advance.
The failure location specifying unit compares the reception presence / absence pattern stored in the failure location specification table with the reception presence / absence pattern of the response data from each relay device for each logical network, and determines the failure of the physical network. The failure monitoring server according to claim 1, wherein a location is specified.
前記論理ネットワークは、VLANであり、
前記設定部は、前記中継装置に対して、前記VLAN毎に異なるIPアドレスを設定し、前記IPアドレスが設定された中継装置に要求パケットを送信し、前記中継装置から応答パケットを受信することを特徴とする請求項1または請求項2に記載された障害監視サーバ。 The monitoring data and the response data are packets issued by a ping command,
The logical network is a VLAN;
The setting unit sets a different IP address for each VLAN for the relay device, transmits a request packet to the relay device to which the IP address is set, and receives a response packet from the relay device. The fault monitoring server according to claim 1 or 2, wherein the fault monitoring server is characterized in that:
前記第1中継機器は、レイヤ2スイッチであり、
前記第2中継機器は、レイヤ3スイッチである
ことを特徴とする請求項1乃至請求項3の何れか1項に記載された障害監視サーバ。 The relay device includes a plurality of first relay devices and a plurality of second relay devices connected to the first relay device,
The first relay device is a layer 2 switch;
The fault monitoring server according to any one of claims 1 to 3, wherein the second relay device is a layer 3 switch.
前記障害監視サーバは、
前記障害監視サーバから各前記中継装置までツリー構造を成すように通信経路を形成し、前記通信経路がそれぞれ異なる複数の論理ネットワークを設定する設定部と、
各前記論理ネットワーク毎に、監視データを各前記中継装置に送信し、前記中継装置から応答データを受信する通信部と、
前記論理ネットワーク毎の各前記中継装置からの前記応答データの受信有無から、前記物理ネットワークの障害箇所を特定する障害箇所特定部と
を備えることを特徴とするネットワーク障害監視システム。 A network fault monitoring system for identifying a fault location in a physical network in which a fault monitoring server and a plurality of relay devices are connected via a communication line,
The fault monitoring server is
A communication path is formed so as to form a tree structure from the failure monitoring server to each of the relay devices, and a setting unit configured to set a plurality of logical networks having different communication paths,
For each logical network, a communication unit that transmits monitoring data to each relay device and receives response data from the relay device;
A network fault monitoring system comprising: a fault location identifying unit that identifies a fault location of the physical network based on whether or not the response data is received from each relay device for each logical network.
6. All the logical networks set by the setting unit cover communication paths that pass through all the relay apparatuses and all the communication lines included in the physical network. Network fault monitoring system described in 1.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008195285A JP2010034876A (en) | 2008-07-29 | 2008-07-29 | Fault monitoring server and network failure monitoring system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008195285A JP2010034876A (en) | 2008-07-29 | 2008-07-29 | Fault monitoring server and network failure monitoring system |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010034876A true JP2010034876A (en) | 2010-02-12 |
Family
ID=41738857
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008195285A Pending JP2010034876A (en) | 2008-07-29 | 2008-07-29 | Fault monitoring server and network failure monitoring system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2010034876A (en) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011118585A1 (en) * | 2010-03-24 | 2011-09-29 | 日本電気株式会社 | Information system, control apparatus, method of controlling virtual network, and program |
JP2012138778A (en) * | 2010-12-27 | 2012-07-19 | Mitsubishi Electric Corp | Network management device, network management system, and network management method |
WO2012124160A1 (en) | 2011-03-15 | 2012-09-20 | オムロン株式会社 | Connection abnormality detection method, network system, and master device |
JP2013016161A (en) * | 2011-06-30 | 2013-01-24 | Konica Minolta Laboratory Usa Inc | Method and system for network diagnosis to display possible cause on display of image forming apparatus |
JP2014075668A (en) * | 2012-10-03 | 2014-04-24 | Hitachi Ltd | Server, and network management method |
JP2015198386A (en) * | 2014-04-02 | 2015-11-09 | Necフィールディング株式会社 | Fault detector, fault detection system, fault detection method and program |
WO2020075587A1 (en) * | 2018-10-11 | 2020-04-16 | 日本電信電話株式会社 | Fault location estimation method and fault location estimation device |
WO2020085050A1 (en) * | 2018-10-26 | 2020-04-30 | 日本電信電話株式会社 | Inference method, inference device, and inference program |
WO2023187922A1 (en) * | 2022-03-28 | 2023-10-05 | 日本電信電話株式会社 | Communication control device, communication control method, and communication control program |
-
2008
- 2008-07-29 JP JP2008195285A patent/JP2010034876A/en active Pending
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011118585A1 (en) * | 2010-03-24 | 2011-09-29 | 日本電気株式会社 | Information system, control apparatus, method of controlling virtual network, and program |
JP2012138778A (en) * | 2010-12-27 | 2012-07-19 | Mitsubishi Electric Corp | Network management device, network management system, and network management method |
WO2012124160A1 (en) | 2011-03-15 | 2012-09-20 | オムロン株式会社 | Connection abnormality detection method, network system, and master device |
US9680691B2 (en) | 2011-03-15 | 2017-06-13 | Omron Corporation | Connection abnormality detection method, network system, and master device |
JP2013016161A (en) * | 2011-06-30 | 2013-01-24 | Konica Minolta Laboratory Usa Inc | Method and system for network diagnosis to display possible cause on display of image forming apparatus |
JP2014075668A (en) * | 2012-10-03 | 2014-04-24 | Hitachi Ltd | Server, and network management method |
JP2015198386A (en) * | 2014-04-02 | 2015-11-09 | Necフィールディング株式会社 | Fault detector, fault detection system, fault detection method and program |
WO2020075587A1 (en) * | 2018-10-11 | 2020-04-16 | 日本電信電話株式会社 | Fault location estimation method and fault location estimation device |
JP2020061685A (en) * | 2018-10-11 | 2020-04-16 | 日本電信電話株式会社 | Failure location estimation method and failure location estimation device |
WO2020085050A1 (en) * | 2018-10-26 | 2020-04-30 | 日本電信電話株式会社 | Inference method, inference device, and inference program |
JP2020068510A (en) * | 2018-10-26 | 2020-04-30 | 日本電信電話株式会社 | Estimation method, estimation device, and estimation program |
WO2023187922A1 (en) * | 2022-03-28 | 2023-10-05 | 日本電信電話株式会社 | Communication control device, communication control method, and communication control program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2010034876A (en) | Fault monitoring server and network failure monitoring system | |
US8270306B2 (en) | Fault management apparatus and method for identifying cause of fault in communication network | |
JP4840236B2 (en) | Network system and node device | |
CN104468181B (en) | The detection and processing of virtual network device failure | |
JP4598462B2 (en) | Provider network providing an L2-VPN service and edge router | |
US9178756B2 (en) | Method and device for processing location information of fault point | |
JP4517997B2 (en) | Network management apparatus and network system | |
US7512841B2 (en) | Method and system for network fault analysis | |
US9083615B2 (en) | Diagnosing network problems in an IPV6 dual stack network | |
JP2007194764A (en) | Operation management system | |
JP4861293B2 (en) | COMMUNICATION DEVICE, COMMUNICATION METHOD, AND COMMUNICATION PROGRAM | |
CN112291116A (en) | Link fault detection method and device and network equipment | |
JP2008022271A (en) | Network apparatus | |
JP4464256B2 (en) | Network host monitoring device | |
JP5035219B2 (en) | Communication path detection method, communication path detection program, and communication path detection apparatus | |
JP2013211680A (en) | Communication device | |
CN102868616B (en) | Method for establishing virtual MAC (Media Access Control) address table item in network as well as router and system | |
CN104618148A (en) | Firewall device and backup method thereof | |
WO2011144139A1 (en) | Method and device for detecting internet protocol address collision in autonomous system | |
JP4888067B2 (en) | Layer 2 switch and network monitoring method | |
JP5612560B2 (en) | Network relay device and network relay system | |
JP4258016B2 (en) | Network configuration control system | |
CN113037622A (en) | System and method for preventing BFD oscillation | |
JPH11331231A (en) | Multiplex network system and its communication equipment | |
JP5718287B2 (en) | Network fault monitoring system and method |