JP2010034876A - Fault monitoring server and network failure monitoring system - Google Patents

Fault monitoring server and network failure monitoring system Download PDF

Info

Publication number
JP2010034876A
JP2010034876A JP2008195285A JP2008195285A JP2010034876A JP 2010034876 A JP2010034876 A JP 2010034876A JP 2008195285 A JP2008195285 A JP 2008195285A JP 2008195285 A JP2008195285 A JP 2008195285A JP 2010034876 A JP2010034876 A JP 2010034876A
Authority
JP
Japan
Prior art keywords
failure
network
relay device
communication
fault
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008195285A
Other languages
Japanese (ja)
Inventor
Takemi Yanada
武実 梁田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2008195285A priority Critical patent/JP2010034876A/en
Publication of JP2010034876A publication Critical patent/JP2010034876A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To monitor the presence of the occurrence of a communication failure and to specify the communication failure occurrence part when the communication failure occurs, with respect to a repeater and a communication line configuring a network. <P>SOLUTION: The fault monitoring server 2 includes: a setting part 312 for forming a communication route so as to form a tree structure to respective repeaters and setting a plurality of logical networks wherein the communication route is different, respectively; a communication part 320 for transmitting monitoring data to the respective repeaters and receiving response data from the repeaters, for each logical network; and a fault specifying part 311 for specifying the fault part of a physical network comprising the repeater and the communication line from the presence of the reception of the response data from the respective repeaters for each logical network. <P>COPYRIGHT: (C)2010,JPO&INPIT

Description

本発明は、ネットワークを構成する装置や通信回線にて、通信障害の発生有無を監視し、通信障害発生時にはその通信障害発生箇所を特定する障害監視サーバおよびネットワーク障害監視システムに関する。   The present invention relates to a failure monitoring server and a network failure monitoring system for monitoring whether or not a communication failure has occurred in an apparatus or a communication line constituting a network and identifying the location where the communication failure has occurred when a communication failure occurs.

従来、ネットワークシステムを構成するレイヤ2スイッチ(L2SW)、レイヤ3スイッチ(L3SW)の監視は、ネットワーク監視装置が、SNMP(Simple Network Management Protocol)に従い、スイッチと、スイッチの各ポートと接続するPC(Personal Computer)やプリンタなどの接続機器とのアップリンク/ダウンリンクを監視することにより行われている。しかし、この場合、ネットワーク監視装置は、スイッチの各ポートと接続するすべての接続機器について把握する必要がある。例えば、プリンタの電源が入っていなかったためアップリンクができず、その結果、ネットワーク監視装置は通信異常と判断する。この場合の通信異常はプリンタ故障ではないため、ネットワークシステム全体に対する影響は小さい。つまり、ネットワーク監視装置が、スイッチの各ポートと接続するすべての接続機器について把握せず、接続機器の状態が不明確であると、ネットワーク監視装置はスイッチの各ポートを監視していても、通信異常に対するネットワークシステム全体の影響が不明確になる。
そして、ポートのアップリンク/ダウンリンク監視では、接続機器の設定・状態により正常にアップリンクおよびダウンリンクが行われたにもかかわらず、通信できないことがある。そのため、前記したポートのアップリンク/ダウンリンク監視に加えて、ping(Packet INternet Groper)コマンドを使って接続機器のIP(Internet Protocol)アドレスを指定して要求パケット(IPパケット)を送信し、接続機器から応答パケット(IPパケット)を受信する疎通監視をすることが一般的である。
Conventionally, monitoring of a layer 2 switch (L2SW) and a layer 3 switch (L3SW) constituting a network system is performed by a network monitoring device according to SNMP (Simple Network Management Protocol), and a PC (PC connected to each port of the switch). This is done by monitoring the uplink / downlink with connected devices such as personal computers and printers. However, in this case, the network monitoring device needs to grasp all the connected devices connected to each port of the switch. For example, since the printer is not turned on, the uplink cannot be performed, and as a result, the network monitoring apparatus determines that the communication is abnormal. Since the communication abnormality in this case is not a printer failure, the influence on the entire network system is small. In other words, if the network monitoring device does not know all the connected devices connected to each port of the switch and the status of the connected device is unclear, the network monitoring device can communicate even if it monitors each port of the switch. The influence of the entire network system on the abnormality becomes unclear.
In the uplink / downlink monitoring of the port, communication may not be possible even though the uplink and downlink are normally performed depending on the setting / status of the connected device. Therefore, in addition to the above-mentioned uplink / downlink monitoring of the port, the request packet (IP packet) is transmitted by specifying the IP (Internet Protocol) address of the connected device using the ping (Packet Internet Groper) command. In general, communication monitoring for receiving a response packet (IP packet) from a device is performed.

また、レイヤ2ネットワークを構成する各スイッチにパケット応答装置を接続して、コアスイッチに監視装置を接続する。パケット応答装置及び監視装置はIPv6に対応している。監視装置は、少なくともVLAN(Virtual Local Area Network)−IDを組み込んだIPv6アドレスを宛先としたping6コマンドを実行し、パケット応答装置からの応答パケットを受信し、受信結果を表示する。応答パケットの受信状況によって、監視者は、パケット応答装置に対応するスイッチにおけるVLAN−IDに対応するVLANの正常性を確認できる監視装置(例えば、特許文献1参照)が開示されている。
特開2006−135803号公報(段落0010、0013)
Further, a packet response device is connected to each switch constituting the layer 2 network, and a monitoring device is connected to the core switch. The packet response device and the monitoring device are compatible with IPv6. The monitoring device executes a ping6 command whose destination is an IPv6 address incorporating at least a VLAN (Virtual Local Area Network) -ID, receives a response packet from the packet response device, and displays the reception result. A monitoring device (see, for example, Patent Document 1) is disclosed in which the monitor can check the normality of the VLAN corresponding to the VLAN-ID in the switch corresponding to the packet response device depending on the reception status of the response packet.
JP 2006-135803 A (paragraphs 0010 and 0013)

しかしながら、通信回線網の冗長化が行われたネットワークにおいて、ネットワーク監視装置がpingコマンドを使って要求パケットを送信して、パケット応答装置からの応答パケットを受信する方法では、通信障害発生箇所を特定することは困難である。
図8に、従来のネットワーク監視装置を備えた、通信回線網の冗長化が行われた従来のネットワーク監視システムの構成を示す。従来のネットワーク監視システム801は、従来のネットワーク監視装置802と、レイヤ2スイッチであるL2SW821,822と、レイヤ3スイッチであるL3SW831,832と、それぞれを接続する通信回線841,842,851,861,862と、ネットワーク803とを備える。
例えば、ネットワーク監視装置802からL2SW821にpingコマンドを使って要求パケットを送信した場合、送信した要求パケットがL2SW821に到達するまでの経路は、(1)ネットワーク監視装置802→通信回線841→L2SW821と、(2)ネットワーク監視装置802→通信回線842→L2SW822→通信回線851→L2SW821との2通りある。
However, in the network where the communication network is made redundant, the network monitoring device uses the ping command to send a request packet and receive the response packet from the packet response device. It is difficult to do.
FIG. 8 shows a configuration of a conventional network monitoring system provided with a conventional network monitoring device and having a communication network made redundant. A conventional network monitoring system 801 includes a conventional network monitoring device 802, L2SWs 821 and 822 that are layer 2 switches, and L3SWs 831 and 832 that are layer 3 switches, and communication lines 841, 842, 851, and 861, respectively. 862 and a network 803.
For example, when a request packet is transmitted from the network monitoring device 802 to the L2SW 821 using a ping command, the route until the transmitted request packet reaches the L2SW 821 is (1) network monitoring device 802 → communication line 841 → L2SW 821. (2) There are two types of network monitoring device 802 → communication line 842 → L2SW 822 → communication line 851 → L2SW 821.

ここで、ネットワーク監視装置802がL2SW821からの応答パケットを受信しなかった場合、L2SW821またはL2SW822で通信障害が発生したのか、もしくは、通信回線で通信障害が発生したのかがわからず、通信障害発生箇所を特定することが困難である。
さらに、例えば、ネットワーク監視装置802からL3SW831にpingコマンドを使って要求パケットを送信した場合、L2SW821に要求パケットを送信した場合と比較して、送信した要求パケットが目的地(L3SW831)に到達するまでの経路の数は増える。そのため、さらに、通信障害発生箇所を特定することが困難になる。
Here, when the network monitoring device 802 does not receive the response packet from the L2SW 821, it is not known whether a communication failure has occurred in the L2SW 821 or L2SW 822 or a communication failure has occurred in the communication line, and the location of the communication failure has occurred. Is difficult to identify.
Furthermore, for example, when a request packet is transmitted from the network monitoring apparatus 802 to the L3SW 831 using the ping command, the transmitted request packet reaches the destination (L3SW 831) as compared with the case where the request packet is transmitted to the L2SW 821. The number of routes increases. Therefore, it becomes difficult to specify the location where the communication failure has occurred.

そこで、前記した課題を解決するために、本発明は、ネットワークを構成する中継装置や通信回線に対して、通信障害の発生有無を監視し、通信障害発生時にはその通信障害発生箇所を特定する障害監視サーバおよびネットワーク障害監視システムを提供することを目的とする。   Therefore, in order to solve the above-described problem, the present invention monitors the presence / absence of a communication failure with respect to a relay device or a communication line that constitutes a network, and identifies a failure location when the communication failure occurs. An object is to provide a monitoring server and a network failure monitoring system.

本発明の障害監視サーバは、複数の中継装置(例えば、スイッチ)と通信回線を介して接続され、前記中継装置と前記通信回線とで構成される物理ネットワーク(例えば、通信回線網)の障害箇所を特定する障害監視サーバであって、各前記中継装置までツリー構造を成すように通信経路を形成し、前記通信経路がそれぞれ異なる複数の論理ネットワーク(例えば、VLAN)を設定する設定部と、各前記論理ネットワーク毎に、監視データ(例えば、要求パケット:IPパケット)を各前記中継装置に送信し、前記中継装置から応答データ(例えば、応答パケット:IPパケット)を受信する通信部と、前記論理ネットワーク毎の各前記中継装置からの前記応答データの受信有無から、前記物理ネットワークの障害箇所を特定する障害箇所特定部とを備える。   The failure monitoring server of the present invention is connected to a plurality of relay devices (for example, switches) via a communication line, and a failure location of a physical network (for example, a communication line network) configured by the relay device and the communication line. A setting unit configured to form a communication path so as to form a tree structure to each of the relay devices, and set a plurality of logical networks (for example, VLANs) having different communication paths, A communication unit that transmits monitoring data (for example, request packet: IP packet) to each relay device and receives response data (for example, response packet: IP packet) from the relay device for each logical network; A failure location that identifies the failure location of the physical network from the presence or absence of reception of the response data from each relay device for each network And a tough.

かかる構成によれば、通信経路が異なる論理ネットワークであるため、監視データの送付先が同じ中継装置から通信経路により応答データの受信があった場合(受信有)と、応答データの受信がなかった場合(受信無)とから、物理ネットワークの障害箇所を特定することができる。   According to this configuration, since the communication network is a different logical network, the response data is not received when the response data is received from the relay device having the same monitoring data destination via the communication route (reception is present). From the case (no reception), it is possible to identify the failure location of the physical network.

本発明によれば、ネットワークを構成する中継装置や通信回線に対して、通信障害の発生有無を監視し、通信障害発生時にはその通信障害発生箇所を特定する障害監視サーバおよびネットワーク障害監視システムを提供することができる。   According to the present invention, a fault monitoring server and a network fault monitoring system are provided for monitoring the presence / absence of a communication failure with respect to a relay device or a communication line constituting a network, and identifying the location of the communication failure when a communication failure occurs. can do.

図1は、本発明の実施形態に係るネットワーク障害監視システム1のネットワーク構成の一例を示す図である。(1)はVLANaの通信経路、(2)はVLANbの通信経路を示す図である。
本実施形態のネットワーク障害監視システム1は、障害監視サーバ2と、L2SW21、22と、L3SW31、32と、それぞれを接続する通信回線41、42、51、61、62と、ネットワーク3とを備える。
FIG. 1 is a diagram illustrating an example of a network configuration of a network failure monitoring system 1 according to an embodiment of the present invention. (1) is a communication path for VLANa, and (2) is a communication path for VLANb.
The network failure monitoring system 1 according to the present embodiment includes a failure monitoring server 2, L2SWs 21 and 22, L3SWs 31 and 32, communication lines 41, 42, 51, 61, and 62 that connect them, and a network 3, respectively.

L2SW21、22およびL3SW31、32は中継装置であり、特に、L2SW21、22はレイヤ2スイッチであり、L3SW31、32はレイヤ3スイッチである。
通信回線41、42、51、61、62は、LAN(Local Area Network)ケーブルにより実現される。
ネットワーク3は、レイヤ3スイッチ同士の通信を可能にする。
The L2SWs 21 and 22 and the L3SWs 31 and 32 are relay devices. In particular, the L2SWs 21 and 22 are layer 2 switches, and the L3SWs 31 and 32 are layer 3 switches.
The communication lines 41, 42, 51, 61 and 62 are realized by a LAN (Local Area Network) cable.
The network 3 enables communication between layer 3 switches.

障害監視サーバ2は、ネットワーク障害監視システム1が備える中継装置(L2SW21、22およびL3SW31、32)に対して、VLANを設定する。
例えば、障害監視サーバ2は中継装置(L2SW21、22およびL3SW31、32)に対して、図1の(1)VLANa、(2)VLANbに示すように、障害監視サーバ2から中継装置までツリー構造を成すように通信経路(ルート)を形成し、その通信経路がそれぞれ異なるVLANを設定する。例えば、VLANaには、(ルートa1:)障害監視サーバ2→通信回線41→L2SW21→通信回線61→L3SW31と、(ルートa2:)障害監視サーバ2→通信回線41→L2SW21→通信回線51→L2SW22→通信回線62→L3SW32とする通信経路が形成される。VLANbも同様に、(ルートb1:)障害監視サーバ2→通信回線42→L2SW22→通信回線51→L2SW21→通信回線61→L3SW31と、(ルートb2:)障害監視サーバ2→通信回線42→L2SW22→通信回線62→L3SW32とする通信経路が形成される。
The failure monitoring server 2 sets a VLAN for the relay devices (L2SWs 21 and 22 and L3SWs 31 and 32) included in the network failure monitoring system 1.
For example, the fault monitoring server 2 has a tree structure from the fault monitoring server 2 to the relay device as shown in (1) VLANa and (2) VLANb of FIG. 1 with respect to the relay devices (L2SW21, 22 and L3SW31, 32). Communication paths (routes) are formed so as to be established, and VLANs having different communication paths are set. For example, in VLANa, (route a1 :) failure monitoring server 2 → communication line 41 → L2SW21 → communication line 61 → L3SW31 and (route a2) failure monitoring server 2 → communication line 41 → L2SW21 → communication line 51 → L2SW22 A communication path is formed from the communication line 62 to the L3SW 32. Similarly, VLANb (route b1 :) failure monitoring server 2 → communication line 42 → L2SW22 → communication line 51 → L2SW21 → communication line 61 → L3SW31 (route b2): failure monitoring server 2 → communication line 42 → L2SW22 → A communication path of communication line 62 → L3SW 32 is formed.

図2は、本発明の実施形態に係るネットワーク障害監視システム1aのネットワーク構成の一例を示す図である。
図2に示されるように、ネットワーク障害監視システム1aは、図1のネットワーク障害監視システム1に、さらにL2SW223と、通信回線252、253とを備えたものである。
ネットワーク障害監視システム1aは、ネットワークを構成する構成要素が追加されても、図1のネットワーク障害監視システム1と同様に、障害監視サーバ202は、ネットワーク障害監視システム1aが備える中継装置(L2SW221、222、223およびL3SW231、232)に対して、例えば、障害監視サーバ202は、図2の(1)VLANa〜(6)VLANfに示すように、障害監視サーバ202から中継装置(L2SW221、222、223およびL3SW231、232)までツリー構造を成すように通信経路を形成し、その通信経路に対してそれぞれ異なるVLANを設定する。
FIG. 2 is a diagram showing an example of a network configuration of the network failure monitoring system 1a according to the embodiment of the present invention.
As shown in FIG. 2, the network failure monitoring system 1 a is provided with the L2SW 223 and communication lines 252 and 253 in addition to the network failure monitoring system 1 in FIG. 1.
In the network fault monitoring system 1a, even if the constituent elements constituting the network are added, the fault monitoring server 202 is similar to the network fault monitoring system 1 in FIG. 1 in that the fault monitoring server 202 is a relay device (L2SW 221, 222 provided in the network fault monitoring system 1a). 223 and L3SWs 231 and 232), for example, the failure monitoring server 202 is connected to the relay devices (L2SWs 221, 222, 223 and 223) from the failure monitoring server 202 as shown in (1) VLANa to (6) VLANf of FIG. Communication paths are formed so as to form a tree structure up to L3SW 231 and 232), and different VLANs are set for the communication paths.

そして、障害監視サーバ2(図1)は、異なる通信経路をもつVLAN(VLANa、VLANb)が設定された中継装置(L2SW21、22およびL3SW31、32)に、VLAN毎に異なるIPアドレスを設定する。例えば、障害監視サーバ2は、L2SW21に対して、VLANaを設定したことを示す“192.168.1.21”のIPアドレスと、VLANbを設定したことを示す“192.168.2.21”のIPアドレスとを設定する。
また、障害監視サーバ2は、pingコマンドを利用して、中継装置(L2SW21、22およびL3SW31、32)に要求パケット(IPパケット)を送信する。このとき、要求パケットは、中継装置に設定されたVLANの通信経路に沿って、目的地である中継装置に到達する。そして、障害監視サーバ2は、送信した要求パケットに対する応答パケット(IPパケット)を中継装置から受信することで、障害監視サーバ2と中継装置との間で正常に通信が行われていることを判断する。
Then, the failure monitoring server 2 (FIG. 1) sets a different IP address for each VLAN in the relay devices (L2SW 21, 22 and L3SW 31, 32) in which VLANs (VLANa, VLANb) having different communication paths are set. For example, the failure monitoring server 2 sets an IP address “192.168.1.21” indicating that VLANa is set and an IP address “192.168.2.21” indicating that VLANb is set to the L2SW 21.
Also, the failure monitoring server 2 transmits a request packet (IP packet) to the relay devices (L2SWs 21 and 22 and L3SWs 31 and 32) using a ping command. At this time, the request packet reaches the relay device that is the destination along the VLAN communication path set in the relay device. Then, the failure monitoring server 2 receives a response packet (IP packet) to the transmitted request packet from the relay device, and determines that communication is normally performed between the failure monitoring server 2 and the relay device. To do.

図3は、障害監視サーバ2の構成の一例を示すブロック図である。
図3に示されるように、障害監視サーバ2は、制御部310と、通信部320と、表示部330と、記憶部340とを備え、さらに、制御部310は、障害箇所特定部311と、設定部312とを備え、記憶部340は、VLAN設定IPアドレス記憶部341と、VLAN設定ルート記憶部342と、応答データ受信有無記憶部343と、障害箇所特定記憶部344とを備える。
FIG. 3 is a block diagram illustrating an example of the configuration of the failure monitoring server 2.
As shown in FIG. 3, the failure monitoring server 2 includes a control unit 310, a communication unit 320, a display unit 330, and a storage unit 340, and the control unit 310 further includes a failure location specifying unit 311, The storage unit 340 includes a VLAN setting IP address storage unit 341, a VLAN setting route storage unit 342, a response data reception presence / absence storage unit 343, and a failure location specifying storage unit 344.

制御部310は、CPU(Central Processing Unit)およびRAM(Random Access Memory)とROM(Read Only Memory)などで構成される。
通信部320は、ネットワークカード(NIC:Network Interface Card)により実現される。このNICは、障害監視サーバ2(通信部320)とLANケーブルなどで直接接続されているレイヤ2スイッチの数(例えば、図1ではL2SW21とL2SW22の2台)と同じ数だけ、障害監視サーバ2に備えられている。
表示部330は、ネットワーク障害監視システム1を利用する利用者に対して、情報を提供する液晶モニタなどにより実現される。
記憶部340は、HD(Hard Disk)、RAMなどにより実現される。
The control unit 310 includes a CPU (Central Processing Unit), a RAM (Random Access Memory), a ROM (Read Only Memory), and the like.
The communication unit 320 is realized by a network card (NIC: Network Interface Card). This NIC has the same number of fault monitoring servers 2 as the number of layer 2 switches (for example, two of L2SW 21 and L2SW 22 in FIG. 1) directly connected to the fault monitoring server 2 (communication unit 320) via a LAN cable or the like. Is provided.
The display unit 330 is realized by a liquid crystal monitor or the like that provides information to a user who uses the network failure monitoring system 1.
The storage unit 340 is realized by an HD (Hard Disk), a RAM, or the like.

制御部310は、記憶部340(後記のVLAN設定IPアドレス記憶部341)に記憶されたIPアドレスを取得し、通信部320に渡す。そして、制御部310は通信部320を制御して、pingコマンドを利用して、取得したIPアドレスが示す中継装置に要求パケットを送信する。
また、制御部310は、通信部320から応答パケットを受信したことを示す信号を受信する。そして、その応答パケットから、応答パケットを返信した中継装置のIPアドレスを取得する。制御部310の障害箇所特定部311は、そのIPアドレスに基づいて、記憶部340(後記のVLAN設定IPアドレス記憶部341)に記憶されたデータ(後記のVLAN設定IPアドレステーブル3411)から、応答パケットを返信した中継装置に設定されたVLANを特定する。これにより、障害箇所特定部311は、障害監視サーバ2から、応答パケットを返信した中継装置までのVLANの通信経路では、正常に通信が行われていると判断し、記憶部340(後記のL2SW応答パケット受信有無パターンテーブル3431、L3SW応答パケット受信有無パターンテーブル3432)に中継装置から応答パケットを受信したこと(正常に通信が行われたこと)を記録する。
The control unit 310 acquires an IP address stored in the storage unit 340 (a VLAN setting IP address storage unit 341 described later) and passes the IP address to the communication unit 320. Then, the control unit 310 controls the communication unit 320 to transmit a request packet to the relay device indicated by the acquired IP address using a ping command.
Control unit 310 also receives a signal indicating that a response packet has been received from communication unit 320. Then, the IP address of the relay apparatus that has returned the response packet is acquired from the response packet. Based on the IP address, the failure location specifying unit 311 of the control unit 310 responds from data (VLAN setting IP address table 3411 described later) stored in the storage unit 340 (VLAN setting IP address storage unit 341 described later). The VLAN set in the relay apparatus that has returned the packet is specified. As a result, the failure location identifying unit 311 determines that communication is normally performed on the VLAN communication path from the failure monitoring server 2 to the relay device that has returned the response packet, and the storage unit 340 (L2SW described later) It is recorded in the response packet reception presence / absence pattern table 3431 and the L3SW response packet reception presence / absence pattern table 3432) that the response packet has been received from the relay device (communication has been performed normally).

一方、障害箇所特定部311は、要求パケットを中継装置に送信したが、その中継装置から応答パケットを受信しなかったとき、障害監視サーバ2から、応答パケットを返信しなかった中継装置までのVLANの通信経路では、通信障害が発生していると判断し、記憶部340に中継装置から応答パケットを受信していないこと(通信異常発生)を記録する。
また、障害箇所特定部311は、記憶部340から、中継装置から応答パケットを受信したことを記録したデータ(後記のL2SW応答パケット受信有無パターンテーブル3431、L3SW応答パケット受信有無パターンテーブル3432)と、予め記憶部340に記憶された、障害発生箇所とその障害が発生したときの中継装置から応答パケットの受信有無とが記録された障害発生箇所特定テーブル(L2SW監視用障害箇所特定テーブル3441、L3SW監視用障害箇所特定テーブル3442)とを参照して、障害発生箇所を特定する。
On the other hand, the fault location identifying unit 311 transmits a request packet to the relay device, but when no response packet is received from the relay device, the fault location server 311 VLAN from the fault monitoring server 2 to the relay device that has not returned the response packet. In the communication path, it is determined that a communication failure has occurred, and the storage unit 340 records that no response packet has been received from the relay device (communication abnormality has occurred).
In addition, the failure location specifying unit 311 records data (the L2SW response packet reception presence / absence pattern table 3431 and the L3SW response packet reception presence / absence pattern table 3432 described later) from the storage unit 340 that records reception of the response packet from the relay device, Failure location identification table (L2SW monitoring failure location identification table 3441, L3SW monitoring) recorded in advance in the storage unit 340 and recorded with the location where the failure occurred and whether or not a response packet has been received from the relay device. The failure occurrence location is identified with reference to the failure location identification table 3442).

設定部312は、ネットワーク障害監視システム1が備える中継装置に対して、障害監視サーバ2から中継装置までツリー構造を成すように通信経路を形成し、その通信経路がそれぞれ異なるVLANを設定する。さらに、設定部312は、異なる通信経路をもつVLANが設定された中継装置に、VLAN毎に異なるIPアドレスを設定し、そのIPアドレスを記憶部340に記憶する。   The setting unit 312 forms a communication path so as to form a tree structure from the fault monitoring server 2 to the relay apparatus for the relay apparatus included in the network fault monitoring system 1, and sets VLANs having different communication paths. Further, the setting unit 312 sets a different IP address for each VLAN in the relay device in which VLANs having different communication paths are set, and stores the IP address in the storage unit 340.

ここで、図4は、記憶部340のVLAN設定IPアドレス記憶部341、VLAN設定ルート記憶部342に記憶されるテーブルの一例である。(1)は、VLAN設定IPアドレス記憶部341に記憶されるVLAN設定IPアドレステーブル3411、(2)は、VLAN設定ルート記憶部342に記憶されるVLAN設定ルートテーブル3421、(3)は、VLAN設定ルート記憶部342に記憶されるVLAN設定ルートテーブル3422である。
図5は、記憶部340の応答データ受信有無記憶部343に記憶されるテーブルの一例である。(1)は、L2SW応答パケット受信有無パターンテーブル3431、(2)は、L3SW応答パケット受信有無パターンテーブル3432である。
図6は、記憶部340の障害箇所特定記憶部344に記憶されるテーブルの一例である。(1)は、L2SW監視用障害箇所特定テーブル3441、(2)は、L3SW監視用障害箇所特定テーブル3442である。
Here, FIG. 4 is an example of a table stored in the VLAN setting IP address storage unit 341 and the VLAN setting route storage unit 342 of the storage unit 340. (1) is a VLAN setting IP address table 3411 stored in the VLAN setting IP address storage unit 341, (2) is a VLAN setting route table 3421 stored in the VLAN setting route storage unit 342, and (3) is a VLAN. 3 is a VLAN setting route table 3422 stored in a setting route storage unit 342.
FIG. 5 is an example of a table stored in the response data reception presence / absence storage unit 343 of the storage unit 340. (1) is an L2SW response packet reception presence / absence pattern table 3431, and (2) is an L3SW response packet reception presence / absence pattern table 3432.
FIG. 6 is an example of a table stored in the failure location specifying storage unit 344 of the storage unit 340. (1) is an L2SW monitoring failure location specifying table 3441, and (2) is an L3SW monitoring failure location specifying table 3442.

記憶部340は、VLAN設定IPアドレス記憶部341と、VLAN設定ルート記憶部342と、応答データ受信有無記憶部343と、障害箇所特定記憶部344とを備える。
VLAN設定IPアドレス記憶部341は、図4に示されるVLAN設定IPアドレステーブル3411を記憶する。
VLAN設定IPアドレステーブル3411は、設定部312がVLAN毎に各スイッチに設定したIPアドレスを記憶している。
例えば、図4に示されるように、VLAN設定IPアドレステーブル3411は、VLANaが設定されたL2SW21、L2SW22、L3SW31、L3SW32のそれぞれのIPアドレス“192.168.1.21”、“192.168.1.22”、“192.168.1.31”、“192.168.1.32”を記憶する。同様に、VLANb、VLANzが設定されたL2SW21、L2SW22、L3SW31、L3SW32のそれぞれのIPアドレスを記憶する。
The storage unit 340 includes a VLAN setting IP address storage unit 341, a VLAN setting route storage unit 342, a response data reception presence / absence storage unit 343, and a failure location specifying storage unit 344.
The VLAN setting IP address storage unit 341 stores a VLAN setting IP address table 3411 shown in FIG.
The VLAN setting IP address table 3411 stores IP addresses set by the setting unit 312 for each switch for each VLAN.
For example, as illustrated in FIG. 4, the VLAN setting IP address table 3411 includes IP addresses “192.168.1.21”, “192.168.1.22”, “192.168. “1.31” and “192.168.1.32” are stored. Similarly, the IP addresses of L2SW21, L2SW22, L3SW31, and L3SW32 in which VLANb and VLANz are set are stored.

VLAN設定ルート記憶部342は、図4に示されるVLAN設定ルートテーブル3421、3422を記憶する。
VLAN設定ルートテーブル3421は、設定部312がVLAN毎に各スイッチまでツリー構造を成すように形成した障害監視サーバ2からの通信経路(ルート)を記憶する。
例えば、図4に示されるように、VLAN設定ルートテーブル3421は、VLANaの場合、ルートa1:(障害監視サーバ2→)通信回線41→L2SW21→通信回線61→L3SW31と、ルートa2:(障害監視サーバ2→)通信回線41→L2SW21→通信回線51→L2SW22→通信回線62→L3SW32とする通信経路を記憶する。
また、VLAN設定ルートテーブル3422は、VLANzが設定された中継装置を記憶する。
例えば、図4に示されるように、要求パケット送信先を示す各中継装置を区別する情報として、L2SW21、L2SW22、L3SW31、L3SW32が記憶される。
The VLAN setting route storage unit 342 stores VLAN setting route tables 3421 and 3422 shown in FIG.
The VLAN setting route table 3421 stores a communication path (route) from the failure monitoring server 2 formed by the setting unit 312 so as to form a tree structure up to each switch for each VLAN.
For example, as shown in FIG. 4, in the case of VLANa, the VLAN setting route table 3421 includes route a1: (fault monitoring server 2 →) communication line 41 → L2SW21 → communication line 61 → L3SW31 and route a2: (fault monitoring). Server 2 →) Communication line 41 → L2SW 21 → Communication line 51 → L2SW 22 → Communication line 62 → L3SW 32 is stored.
Further, the VLAN setting route table 3422 stores the relay device in which VLANz is set.
For example, as shown in FIG. 4, L2SW21, L2SW22, L3SW31, and L3SW32 are stored as information for distinguishing each relay device indicating a request packet transmission destination.

図4に示されるVLAN設定ルートテーブル3422に記憶された要求パケット送信先について、便宜上簡略化して記載したが、各中継装置を区別する情報として、MACアドレスが記憶されてもよい。   Although the request packet transmission destination stored in the VLAN setting route table 3422 shown in FIG. 4 is described in a simplified manner for convenience, a MAC address may be stored as information for distinguishing each relay device.

応答データ受信有無記憶部343(図3)は、図5に示されるL2SW応答パケット受信有無パターンテーブル3431と、L3SW応答パケット受信有無パターンテーブル3432とを記憶する。
L2SW応答パケット受信有無パターンテーブル3431には、通信部320がVLAN毎に設定された中継装置のうち、レイヤ2スイッチに送信した要求パケットに対して、レイヤ2スイッチが送信した応答パケットを通信部320が受信したか否かが記憶される。
例えば、図5に示されるように、L2SW応答パケット受信有無パターンテーブル3431には、VLANaが設定されたレイヤ2スイッチ(L2SW21とL2SW22)に送信した要求パケットに対して、L2SW21およびL2SW22から応答パケットを受信したことを示す“OK”が記憶されている。
The response data reception presence / absence storage unit 343 (FIG. 3) stores the L2SW response packet reception presence / absence pattern table 3431 and the L3SW response packet reception presence / absence pattern table 3432 shown in FIG.
In the L2SW response packet reception presence / absence pattern table 3431, the response packet transmitted by the layer 2 switch to the request packet transmitted to the layer 2 switch among the relay devices set by the communication unit 320 for each VLAN is displayed. Whether or not is received is stored.
For example, as shown in FIG. 5, in the L2SW response packet reception presence / absence pattern table 3431, response packets from the L2SW 21 and L2SW 22 are sent to the request packet transmitted to the layer 2 switch (L2SW 21 and L2SW 22) in which VLANa is set. “OK” indicating reception is stored.

同様に、L3SW応答パケット受信有無パターンテーブル3432には、通信部320がVLAN毎に設定された中継装置のうち、レイヤ3スイッチに送信した要求パケットに対して、レイヤ3スイッチが送信した応答パケットを通信部320が受信したか否かが記憶される。   Similarly, in the L3SW response packet reception presence / absence pattern table 3432, the response packet transmitted by the layer 3 switch to the request packet transmitted to the layer 3 switch among the relay devices set for each VLAN by the communication unit 320 is displayed. Whether or not the communication unit 320 has received is stored.

障害箇所特定記憶部344は、図6に示されるL2SW監視用障害箇所特定テーブル3441と、L3SW監視用障害箇所特定テーブル3442とを記憶する。
L2SW監視用障害箇所特定テーブル3441には、ネットワーク障害監視システム1に備えられた中継装置のうちレイヤ2スイッチが障害発生箇所であった場合と、障害監視サーバ2から各レイヤ2スイッチまでの通信経路上の通信回線が障害発生箇所であった場合に、VLAN毎に設定されたレイヤ2スイッチに要求パケットを送信したとき、レイヤ2スイッチから応答パケットを通信部320が受信するか否かを示す受信有無パターンが記憶される。
例えば、図6に示されるように、L2SW監視用障害箇所特定テーブル3441には、VLANaが設定されたレイヤ2スイッチ(L2SW21とL2SW22)に送信した要求パケットに対して、障害が発生していなければ(「障害箇所なし」)、L2SW21およびL2SW22から応答パケットを受信することを示す“OK”が記憶されている。また、障害がL2SW21にて発生していれば(障害発生箇所「L2SW21」)、L2SW21およびL2SW22から応答パケットを受信しないことを示す“NG”が記憶されている。
The failure location specifying storage unit 344 stores an L2SW monitoring failure location specifying table 3441 and an L3SW monitoring failure location specifying table 3442 shown in FIG.
The failure location identification table 3441 for L2SW monitoring includes a case where a layer 2 switch in the relay device provided in the network failure monitoring system 1 is a failure occurrence location and a communication path from the failure monitoring server 2 to each layer 2 switch. Reception indicating whether or not the communication unit 320 receives a response packet from the layer 2 switch when a request packet is transmitted to the layer 2 switch set for each VLAN when the upper communication line is a failure occurrence point A presence / absence pattern is stored.
For example, as shown in FIG. 6, in the failure location identification table 3441 for L2SW monitoring, if a failure has not occurred in the request packet transmitted to the layer 2 switch (L2SW 21 and L2SW 22) for which VLANa is set. (“No failure location”), “OK” indicating that a response packet is received from the L2SW 21 and L2SW 22 is stored. If a failure has occurred in the L2SW 21 (failure occurrence location “L2SW21”), “NG” indicating that no response packet is received from the L2SW 21 and L2SW 22 is stored.

同様に、L3SW監視用障害箇所特定テーブル3442には、ネットワーク障害監視システム1に備えられた中継装置のうちレイヤ3スイッチが障害発生箇所であった場合と、各レイヤ2スイッチから各レイヤ3スイッチまでの通信経路上の通信回線が障害発生箇所であった場合に、VLAN毎に設定されたレイヤ3スイッチに要求パケットを送信したとき、レイヤ3スイッチから応答パケットを通信部320が受信するか否かを示す受信有無パターンが記憶される。
前記したL2SW監視用障害箇所特定テーブル3441と、L3SW監視用障害箇所特定テーブル3442とは、設定部312がVLANを設定した後、かつ、障害監視サーバ2(制御部310の障害箇所特定部311)がネットワーク障害監視システム1にて障害が発生した箇所(障害発生箇所)を特定する処理をする前に、予め記憶部340(障害箇所特定記憶部344)に記憶しておく。
Similarly, in the failure location identification table 3442 for L3SW monitoring, when the layer 3 switch is a failure occurrence location in the relay device provided in the network failure monitoring system 1, and from each layer 2 switch to each layer 3 switch Whether or not the communication unit 320 receives a response packet from the layer 3 switch when a request packet is transmitted to the layer 3 switch set for each VLAN when the communication line on the communication path is a failure location Is stored.
The L2SW monitoring failure location specifying table 3441 and the L3SW monitoring failure location specifying table 3442 are set after the setting unit 312 sets the VLAN and the failure monitoring server 2 (failure location specifying unit 311 of the control unit 310). Is stored in the storage unit 340 (failure location specifying storage unit 344) in advance before performing processing for specifying a location where a failure has occurred (failure occurrence location) in the network failure monitoring system 1.

通信部320は、制御部310に制御され、渡されたIPアドレスが示す中継装置に要求パケットを送信する。また、通信部320は、中継装置が返信した応答パケットを受信し、制御部310に応答パケットを受信したことを示す信号を送信する。   The communication unit 320 is controlled by the control unit 310 and transmits a request packet to the relay device indicated by the passed IP address. The communication unit 320 receives the response packet returned from the relay device, and transmits a signal indicating that the response packet has been received to the control unit 310.

表示部330は、ネットワーク障害監視システム1を利用する利用者に対して、障害発生箇所を情報として提供するものである。本実施形態に係るネットワーク障害監視システム1に備えられる表示部330は、液晶モニタなどの画面上に障害発生箇所の位置情報を表示する。しかし、表示部330は、スピーカなどの音声で位置情報を報知するものであってもよいし、ネットワーク構成をマップしたネットワーク構成図にLEDなどを取り付け、光などの信号で位置情報を表示するものであってもよい。   The display unit 330 provides the location where the failure has occurred as information to the user who uses the network failure monitoring system 1. The display unit 330 provided in the network failure monitoring system 1 according to the present embodiment displays position information of a failure occurrence location on a screen such as a liquid crystal monitor. However, the display unit 330 may notify the position information by voice from a speaker or the like, or attaches an LED or the like to the network configuration diagram in which the network configuration is mapped, and displays the position information by a signal such as light. It may be.

図7は、本実施形態に係る障害監視サーバ2が障害箇所を特定する動作を示すフローチャートである。
以下、図7に示すフローチャートを参照しながら、図1および図3に示す本実施形態に係る障害監視サーバ2が図4〜図6に示すテーブルを用いて障害箇所を特定する動作について詳細に説明する。
FIG. 7 is a flowchart showing an operation in which the failure monitoring server 2 according to the present embodiment specifies a failure location.
Hereinafter, the operation of the failure monitoring server 2 according to the present embodiment illustrated in FIGS. 1 and 3 to identify the failure location using the tables illustrated in FIGS. 4 to 6 will be described in detail with reference to the flowchart illustrated in FIG. 7. To do.

まず、制御部310は、設定部312が設定し、記憶部340のVLAN設定IPアドレス記憶部341に記憶したVLAN設定IPアドレステーブル3411(図4)と、記憶部340のVLAN設定ルート記憶部342に記憶したVLAN設定ルートテーブル3421、3422(図4)とに基づいて、VLAN毎に設定された中継装置のIPアドレスを取得する。次に、制御部310は、pingコマンドを使って中継装置のIPアドレスを指定し、通信部320に中継装置(スイッチ)へ各VLANの通信経路で(他にも反映)要求パケットを送信させる。そして、送信した要求パケットに対する中継装置(スイッチ)からの応答パケットを通信部320が受信する(ステップS701)。
例えば、制御部310は、L2SW21に対して、VLANaでは“192.168.1.21”のIPアドレスを指定して通信部320にVLANaの通信経路で要求パケットを送信させ、VLANbでは“192.168.2.21”のIPアドレスを指定して通信部320にVLANbの通信経路で要求パケットを送信させる。そして、L2SW21からのVLANaでの応答パケット、VLANbでの応答パケットを通信部320が受信する。
First, the control unit 310 sets the VLAN setting IP address table 3411 (FIG. 4) set by the setting unit 312 and stored in the VLAN setting IP address storage unit 341 of the storage unit 340, and the VLAN setting route storage unit 342 of the storage unit 340. The IP address of the relay device set for each VLAN is acquired based on the VLAN setting route tables 3421 and 3422 (FIG. 4) stored in FIG. Next, the control unit 310 uses the ping command to specify the IP address of the relay device, and causes the communication unit 320 to transmit a request packet to the relay device (switch) via each VLAN communication path (reflected elsewhere). And the communication part 320 receives the response packet from the relay apparatus (switch) with respect to the transmitted request packet (step S701).
For example, the control unit 310 designates the IP address “192.168.1.21” in the VLANa to the L2SW 21 and causes the communication unit 320 to transmit the request packet through the communication path of the VLANa, and the IP address “192.168.2.21” in the VLANb. The address is specified, and the communication unit 320 is caused to transmit a request packet through the VLANb communication path. Then, the communication unit 320 receives the response packet in VLANa and the response packet in VLANb from the L2SW 21.

制御部310の障害箇所特定部311は、通信部320が中継装置からの応答パケットを受信したか否かに基づいて、応答データ受信有無記憶部343にL2SW応答パケット受信有無パターンテーブル3431(図5)とL3SW応答パケット受信有無パターンテーブル3432(図5)とを作成する(ステップS702)。
例えば、障害箇所特定部311は、通信部320がL2SW21からのVLANaでの応答パケットを受信していれば、L2SW応答パケット受信有無パターンテーブル3431にて、VLANaのL2SW21に“OK”を書き込む。また、通信部320がL3SW31からのVLANaでの応答パケットを受信していなければ、L3SW応答パケット受信有無パターンテーブル3432にて、VLANaのL3SW31に“NG”を書き込む。このようにして、障害箇所特定部311は、L2SW応答パケット受信有無パターンテーブル3431とL3SW応答パケット受信有無パターンテーブル3432とを作成する。
Based on whether the communication unit 320 has received a response packet from the relay device, the failure location specifying unit 311 of the control unit 310 stores the L2SW response packet reception presence / absence pattern table 3431 in the response data reception presence / absence storage unit 343 (FIG. 5). ) And an L3SW response packet reception presence / absence pattern table 3432 (FIG. 5) are created (step S702).
For example, if the communication unit 320 has received a VLANa response packet from the L2SW 21, the failure location specifying unit 311 writes “OK” to the L2SW 21 of the VLANa in the L2SW response packet reception presence / absence pattern table 3431. If the communication unit 320 has not received a response packet in VLANa from the L3SW 31, “NG” is written in the L3SW 31 of VLANa in the L3SW response packet reception presence / absence pattern table 3432. In this way, the failure location specifying unit 311 creates the L2SW response packet reception presence / absence pattern table 3431 and the L3SW response packet reception presence / absence pattern table 3432.

次に、障害箇所特定部311は、記憶部340から、障害箇所特定記憶部344に記憶されたL2SW監視用障害箇所特定テーブル3441(図6)を取得する(ステップS703)。
そして、障害箇所特定部311は、ステップS702で作成したL2SW応答パケット受信有無パターンテーブル3431(図5)に記録されたパケット受信有無パターンと、ステップS703で取得したL2SW監視用障害箇所特定テーブル3441(図6)に記録されたパケット受信有無パターンとを比較して、障害箇所があるか否かを判定する(ステップS704)
Next, the fault location specifying unit 311 acquires the L2SW monitoring fault location specifying table 3441 (FIG. 6) stored in the fault location specifying storage unit 344 from the storage unit 340 (step S703).
Then, the failure location specifying unit 311 includes the packet reception presence / absence pattern recorded in the L2SW response packet reception presence / absence pattern table 3431 (FIG. 5) created in step S702, and the L2SW monitoring failure location specification table 3441 (step S703). The packet reception presence / absence pattern recorded in FIG. 6) is compared to determine whether there is a failure portion (step S704).

例えば、L2SW応答パケット受信有無パターンテーブル3431に記録されたパケット受信有無パターンと、L2SW監視用障害箇所特定テーブル3441に記録されたパケット受信有無パターンとを比較したときに、L2SW応答パケット受信有無パターンテーブル3431に記録されたパケット受信有無パターンが、図5に示される(OK,OK,OK,OK,OK,OK)であれば、図6に示されるL2SW監視用障害箇所特定テーブル3441に記録された「障害箇所なし」のパケット受信有無パターンと一致する。よって、障害箇所特定部311は、「障害箇所はない」と判定する。
また、L2SW応答パケット受信有無パターンテーブル3431に記録されたパケット受信有無パターンが(NG,NG,OK,OK,OK,OK)であれば、図6に示されるL2SW監視用障害箇所特定テーブル3441に記録された「通信回線41」のパケット受信有無パターンと一致する。よって、障害箇所特定部311は、「障害箇所がある」と判定する。
For example, when the packet reception presence / absence pattern recorded in the L2SW response packet reception presence / absence pattern table 3431 is compared with the packet reception presence / absence pattern recorded in the failure location specifying table 3441 for L2SW monitoring, the L2SW response packet reception presence / absence pattern table If the packet reception presence / absence pattern recorded in 3431 is (OK, OK, OK, OK, OK, OK) shown in FIG. 5, it is recorded in the L2SW monitoring failure location identification table 3441 shown in FIG. Matches the packet reception presence / absence pattern of “no fault location”. Therefore, the failure location specifying unit 311 determines that “there is no failure location”.
Also, if the packet reception presence / absence pattern recorded in the L2SW response packet reception presence / absence pattern table 3431 is (NG, NG, OK, OK, OK, OK), the L2SW monitoring failure location identification table 3441 shown in FIG. It matches the recorded packet reception presence / absence pattern of “communication line 41”. Therefore, the failure location specifying unit 311 determines that “there is a failure location”.

ここで、障害箇所特定部311が「障害箇所はない」と判定した場合(ステップS704,No)、障害箇所特定部311は、記憶部340から、障害箇所特定記憶部344に記憶されたL3SW監視用障害箇所特定テーブル3442(図6)を取得する(ステップS705)。
そして、障害箇所特定部311は、ステップS702で作成したL3SW応答パケット受信有無パターンテーブル3432(図5)に記録されたパケット受信有無パターンと、ステップS705で取得したL3SW監視用障害箇所特定テーブル3442(図6)に記録されたパケット受信有無パターンとを比較して、障害箇所があるか否かを判定する(ステップS706)
Here, when the failure location specifying unit 311 determines that “there is no failure location” (step S704, No), the failure location specifying unit 311 monitors the L3SW stored in the failure location specification storage unit 344 from the storage unit 340. The failure location specifying table 3442 (FIG. 6) is acquired (step S705).
Then, the failure location specifying unit 311 includes the packet reception presence / absence pattern recorded in the L3SW response packet reception presence / absence pattern table 3432 (FIG. 5) created in step S702, and the L3SW monitoring failure location identification table 3442 (step S705). The packet reception presence / absence pattern recorded in FIG. 6) is compared to determine whether or not there is a failure location (step S706).

例えば、L3SW応答パケット受信有無パターンテーブル3432に記録されたパケット受信有無パターンと、L3SW監視用障害箇所特定テーブル3442に記録されたパケット受信有無パターンとを比較したときに、L3SW応答パケット受信有無パターンテーブル3432に記録されたパケット受信有無パターンが、図5に示される(NG,OK,NG,OK,NG,OK)であれば、図6に示されるL3SW監視用障害箇所特定テーブル3442に記録された「L3SW32」のパケット受信有無パターンと一致する。よって、障害箇所特定部311は、「障害箇所がある」と判定する。
また、L3SW応答パケット受信有無パターンテーブル3432に記録されたパケット受信有無パターンが(OK,OK,OK,OK,OK,OK)であれば、図6に示されるL3SW監視用障害箇所特定テーブル3442に記録された「障害箇所なし」のパケット受信有無パターンと一致する。よって、障害箇所特定部311は、「障害箇所はない」と判定する。
For example, when the packet reception presence / absence pattern recorded in the L3SW response packet reception presence / absence pattern table 3432 is compared with the packet reception presence / absence pattern recorded in the L3SW monitoring failure location identification table 3442, the L3SW response packet reception presence / absence pattern table If the packet reception presence / absence pattern recorded in 3432 is (NG, OK, NG, OK, NG, OK) shown in FIG. 5, it is recorded in the L3SW monitoring failure location identification table 3442 shown in FIG. It matches the “L3SW32” packet reception presence / absence pattern. Therefore, the failure location specifying unit 311 determines that “there is a failure location”.
If the packet reception presence / absence pattern recorded in the L3SW response packet reception presence / absence pattern table 3432 is (OK, OK, OK, OK, OK, OK), the L3SW monitoring failure location identification table 3442 shown in FIG. It matches the recorded packet reception presence / absence pattern of “no failure part”. Therefore, the failure location specifying unit 311 determines that “there is no failure location”.

ここで、障害箇所特定部311が「障害箇所はない」と判定した場合(ステップS706,No)、障害箇所特定部311は処理を終了する。
一方、障害箇所特定部311がステップS704またはステップS706にて「障害箇所がある」と判定した場合(ステップS704,YesまたはステップS706,Yes)、障害箇所特定部311は、「障害箇所がある」と判定されたときに一致したパケット受信有無パターンから、障害発生箇所を特定する(ステップS707)。
例えば、ステップS706にて、L3SW応答パケット受信有無パターンテーブル3432に記録されたパケット受信有無パターンが、図5に示される(NG,OK,NG,OK,NG,OK)であれば、図6に示されるL3SW監視用障害箇所特定テーブル3442に記録された「L3SW32」のパケット受信有無パターンと一致するため、障害発生箇所は「L3SW32」と特定される。
Here, when the failure location specifying unit 311 determines that “there is no failure location” (No in step S706), the failure location specifying unit 311 ends the process.
On the other hand, when the failure location specifying unit 311 determines that “there is a failure location” in step S704 or step S706 (step S704, Yes or step S706, Yes), the failure location specification unit 311 determines that “there is a failure location”. The failure occurrence location is identified from the packet reception presence / absence pattern that matches when it is determined (step S707).
For example, if the packet reception presence / absence pattern recorded in the L3SW response packet reception presence / absence pattern table 3432 in step S706 is (NG, OK, NG, OK, NG, OK) shown in FIG. Since the packet reception presence / absence pattern of “L3SW32” recorded in the L3SW monitoring failure location specifying table 3442 shown in the figure matches, the failure occurrence location is specified as “L3SW32”.

そして、制御部310は、表示部330を制御して、障害発生箇所を表示させる(ステップS708)。その後、制御部310は、すべての処理を終了する。   And the control part 310 controls the display part 330, and displays a failure location (step S708). Thereafter, the control unit 310 ends all the processes.

なお、前記した本実施形態に係るネットワーク障害監視システム1によれば、pingコマンドを利用して、障害監視サーバ2から要求パケットを送信する際に用いられるIPアドレスは、IPv4(Internet Protocol Version 4)で規定されるIPアドレスだけでなく、IPv6(Internet Protocol Version 6)で規定されるIPアドレスを用いてもよい。   Note that, according to the network fault monitoring system 1 according to the above-described embodiment, the IP address used when transmitting the request packet from the fault monitoring server 2 using the ping command is IPv4 (Internet Protocol Version 4). In addition to the IP address defined in the above, an IP address defined in IPv6 (Internet Protocol Version 6) may be used.

前記した本実施形態に係るネットワーク障害監視システム1によれば、pingコマンドを利用して、障害監視サーバ2から送信される要求パケットは、VLAN毎に異なる通信経路で、VLANの数だけ目的地の中継装置に送信される。そのため、目的地の中継装置が正常に通信可能な状態であれば、障害監視サーバ2は目的地の中継装置からの応答パケットを受信する。よって、目的地の中継装置からの応答パケットを受信しなかった場合、目的地の中継装置にて障害が発生していると容易に特定することができる。   According to the network fault monitoring system 1 according to the above-described embodiment, the request packet transmitted from the fault monitoring server 2 using the ping command is sent to the destinations corresponding to the number of VLANs on different communication paths for each VLAN. Sent to the relay device. Therefore, if the destination relay device can communicate normally, the failure monitoring server 2 receives a response packet from the destination relay device. Therefore, when a response packet from the destination relay device is not received, it can be easily identified that a failure has occurred in the destination relay device.

また、障害監視サーバ2が目的地の中継装置に、あるVLANの通信経路で送信した要求パケットに対する応答パケットは受信できたが、別のVLANの通信経路で送信した要求パケットに対する応答パケットは受信できなかった場合には、障害監視サーバ2から目的地の中継装置までの通信経路上に障害が発生していると容易に判断することができる。さらに、障害監視サーバ2が目的地の中継装置に、複数のVLANの通信経路で送信した要求パケットを送信することで、どのVLANの通信経路で送信した要求パケットに対する応答パケットを受信できなかったかを把握でき、応答パケットを受信できた/できなかった通信経路を比較することで、障害監視サーバ2から目的地の中継装置までのどの通信回線で障害が発生しているのかを容易に特定することができる。   In addition, the failure monitoring server 2 can receive a response packet to a request packet transmitted to a destination relay device via a communication path of a VLAN, but cannot receive a response packet to a request packet transmitted via a communication path of another VLAN. If there is no failure, it can be easily determined that a failure has occurred on the communication path from the failure monitoring server 2 to the destination relay device. Further, the fault monitoring server 2 transmits to the destination relay device a request packet transmitted through a plurality of VLAN communication paths, so as to determine which VLAN communication path the response packet for the request packet has not been received. Easily identify which communication line from the failure monitoring server 2 to the destination relay device is causing the failure by comparing the communication paths that can be grasped and that the response packet could be received or not. Can do.

前記した本実施形態に係るネットワーク障害監視システム1によれば、障害発生箇所を容易に特定することができるため、日常的に行われる障害監視が容易になる。また、ネットワーク障害発生時の対応もすぐに行うことができるといったネットワーク管理が容易になる。   According to the network failure monitoring system 1 according to the present embodiment described above, the failure occurrence location can be easily identified, so that failure monitoring performed on a daily basis is facilitated. In addition, network management is facilitated so that a network failure can be immediately handled.

SNMPを使ったネットワーク管理によるネットワーク監視では、中継装置で動作するソフトウエアによる通信異常を検出することができないが、前記した本実施形態に係るネットワーク障害監視システム1によれば、その通信異常が中継装置で発生していると、障害発生箇所を特定することができる。また、SNMP機能を有さなくても、中継装置はpingコマンドによる要求パケットに対して応答パケットを返信することができるため、SNMP機能を有さない中継装置に対しても監視することができる。さらに、本実施形態に係るネットワーク障害監視システム1は、中継装置にSNMPに関する設定をする必要がない。そのため、中継装置のセキュリティレベルを下げることなく、中継装置を監視することができる。   In network monitoring by network management using SNMP, it is impossible to detect a communication abnormality caused by software operating on a relay device. However, according to the network failure monitoring system 1 according to the above-described embodiment, the communication abnormality is relayed. If it occurs in the device, it is possible to identify the location of the failure. Even if the relay device does not have an SNMP function, the relay device can return a response packet in response to a request packet based on the ping command. Therefore, it is possible to monitor a relay device that does not have an SNMP function. Furthermore, the network failure monitoring system 1 according to the present embodiment does not require a setting related to SNMP in the relay device. Therefore, the relay device can be monitored without reducing the security level of the relay device.

前記した本実施形態に係るネットワーク障害監視システム1によれば、障害監視サーバ2を独立した専用の機器としているが、メールサーバやファイルサーバなど各種サービス機能を有するサーバに備えられていてもよい。
また、本実施形態に係るネットワーク障害監視システム1によるネットワーク障害監視と、SNMPを使ったネットワーク管理によるネットワーク監視とを併用してもよい。併用することによって、pingコマンドを使って周期的にIPパケットを送出することにより、ハード故障(ポートのリンクアップ、リンクダウンなど)検出の即時性に優れ、さらに故障検出時には故障箇所を限定することができます。
According to the network fault monitoring system 1 according to the above-described embodiment, the fault monitoring server 2 is an independent dedicated device, but may be provided in a server having various service functions such as a mail server and a file server.
Further, network failure monitoring by the network failure monitoring system 1 according to the present embodiment and network monitoring by network management using SNMP may be used in combination. By using it together, by sending out IP packets periodically using the ping command, it is possible to detect hardware failures (port link up, link down, etc.) immediately, and to limit the failure location when a failure is detected. I can.

前記した本実施形態に係るネットワーク障害監視システム1によれば、障害監視サーバ2を1台だけ備えて、ネットワークの障害監視を行っているが、障害監視サーバを複数台備えてもよい。例えば、図9に示すように、ネットワーク障害監視システム1bが障害監視サーバ902aと障害監視サーバ902bとの2台を並列に備えることで、障害監視サーバを冗長化することができるため、ネットワークの障害監視を行っている障害監視サーバ902aに障害が発生しても、障害監視サーバ902bによりネットワークの障害監視を引き続き行うことができる。   According to the network fault monitoring system 1 according to the above-described embodiment, only one fault monitoring server 2 is provided to perform network fault monitoring. However, a plurality of fault monitoring servers may be provided. For example, as shown in FIG. 9, the network fault monitoring system 1b includes two fault monitoring servers 902a and 902b in parallel, so that the fault monitoring server can be made redundant. Even if a failure occurs in the monitored failure monitoring server 902a, the failure monitoring server 902b can continue to perform network failure monitoring.

本発明の実施形態に係るネットワーク障害監視システム1のネットワーク構成の一例を示す図であり、(1)VLANaの通信経路、(2)VLANbの通信経路を示す図である。It is a figure which shows an example of the network structure of the network failure monitoring system 1 which concerns on embodiment of this invention, and is a figure which shows the communication path | route of (1) VLANa and (2) VLANb. 本発明の実施形態に係るネットワーク障害監視システム1aのネットワーク構成の一例を示す図であり、(1)VLANaの通信経路、(2)VLANbの通信経路、(3)VLANcの通信経路、(4)VLANdの通信経路、(5)VLANeの通信経路、(6)VLANfの通信経路を示す図である。It is a figure which shows an example of the network structure of the network failure monitoring system 1a which concerns on embodiment of this invention, (1) Communication path of VLANa, (2) Communication path of VLANb, (3) Communication path of VLANc, (4) It is a figure which shows the communication path of VLANd, (5) The communication path of VLANe, (6) The communication path of VLANf. 本実施形態の障害監視サーバ2の構成の一例を示すブロック図である。It is a block diagram which shows an example of a structure of the failure monitoring server 2 of this embodiment. (1)本実施形態のVLAN設定IPアドレス記憶部341に記憶されるVLAN設定IPアドレステーブル3411、(2)本実施形態のVLAN設定ルート記憶部342に記憶されるVLAN設定ルートテーブル3421、(3)VLAN設定ルートテーブル3422である。(1) VLAN setting IP address table 3411 stored in the VLAN setting IP address storage unit 341 of this embodiment, (2) VLAN setting route table 3421 stored in the VLAN setting route storage unit 342 of this embodiment, (3 ) VLAN setting route table 3422. (1)本実施形態の応答データ受信有無記憶部343に記憶されるL2SW応答パケット受信有無パターンテーブル3431、(2)L3SW応答パケット受信有無パターンテーブル3432である。(1) An L2SW response packet reception presence / absence pattern table 3431 stored in the response data reception presence / absence storage unit 343 of the present embodiment, and (2) an L3SW response packet reception presence / absence pattern table 3432. (1)本実施形態の障害箇所特定記憶部344に記憶されるL2SW監視用障害箇所特定テーブル3441、(2)L3SW監視用障害箇所特定テーブル3442である。(1) An L2SW monitoring failure location specifying table 3441 stored in the failure location specifying storage unit 344 of the present embodiment, and (2) an L3SW monitoring failure location specifying table 3442. 本実施形態に係る障害監視サーバ2が障害箇所を特定する動作を示すフローチャートである。It is a flowchart which shows the operation | movement which the failure monitoring server 2 which concerns on this embodiment specifies a failure location. 従来のネットワーク監視装置を備えた、通信回線網の冗長化が行われた従来のネットワーク監視システムの構成図である。It is a block diagram of the conventional network monitoring system provided with the conventional network monitoring apparatus in which the communication line network was made redundant. 本発明の実施形態に係るネットワーク障害監視システム1bが障害監視サーバを2台備えたネットワーク構成の一例を示す図である。1 is a diagram illustrating an example of a network configuration in which a network failure monitoring system 1b according to an embodiment of the present invention includes two failure monitoring servers.

符号の説明Explanation of symbols

1 ネットワーク障害監視システム
2 障害監視サーバ
3 ネットワーク
21、22 L2SW(レイヤ2スイッチ)
31、32 L3SW(レイヤ3スイッチ)
41、42、51、61、62 通信回線
310 制御部
311 障害箇所特定部
312 設定部
320 通信部
330 表示部
340 記憶部
341 VLAN設定IPアドレス記憶部
342 VLAN設定ルート記憶部
343 応答データ受信有無記憶部
344 障害箇所特定記憶部
3411 VLAN設定IPアドレステーブル
3421、3422 VLAN設定ルートテーブル
3431 L2SW応答パケット受信有無パターンテーブル
3432 L3SW応答パケット受信有無パターンテーブル
3441 L2SW監視用障害箇所特定テーブル
3442 L3SW監視用障害箇所特定テーブル
1 Network Fault Monitoring System 2 Fault Monitoring Server 3 Network 21, 22 L2SW (Layer 2 Switch)
31, 32 L3SW (Layer 3 switch)
41, 42, 51, 61, 62 Communication line 310 Control unit 311 Fault location specifying unit 312 Setting unit 320 Communication unit 330 Display unit 340 Storage unit 341 VLAN setting IP address storage unit 342 VLAN setting route storage unit 343 Response data reception presence / absence storage Unit 344 fault location specifying storage unit 3411 VLAN setting IP address table 3421, 3422 VLAN setting route table 3431 L2SW response packet reception presence / absence pattern table 3432 L3SW response packet reception presence / absence pattern table 3441 L2SW monitoring fault location specifying table 3442 L3SW monitoring fault location Specific table

Claims (6)

複数の中継装置と通信回線を介して接続され、前記中継装置と前記通信回線とで構成される物理ネットワークの障害箇所を特定する障害監視サーバであって、
各前記中継装置までツリー構造を成すように通信経路を形成し、前記通信経路がそれぞれ異なる複数の論理ネットワークを設定する設定部と、
各前記論理ネットワーク毎に、監視データを各前記中継装置に送信し、前記中継装置から応答データを受信する通信部と、
前記論理ネットワーク毎の各前記中継装置からの前記応答データの受信有無から、前記物理ネットワークの障害箇所を特定する障害箇所特定部と
を備えることを特徴とする障害監視サーバ。
A failure monitoring server that is connected to a plurality of relay devices via a communication line and identifies a failure point of a physical network configured by the relay device and the communication line,
Forming a communication path so as to form a tree structure to each of the relay devices, a setting unit configured to set a plurality of logical networks different from each other,
For each logical network, a communication unit that transmits monitoring data to each relay device and receives response data from the relay device;
A failure monitoring server, comprising: a failure location identifying unit that identifies a failure location of the physical network based on whether or not the response data is received from each relay device for each logical network.
前記障害箇所特定部は、障害発生箇所と、その障害発生時の前記論理ネットワーク毎の各前記中継装置からの応答データの受信有無パターンとが予め記憶された障害箇所特定テーブルを備え、
前記障害箇所特定部は、前記障害箇所特定テーブルに記憶された受信有無パターンと、前記論理ネットワーク毎の各前記中継装置からの前記応答データの受信有無パターンとを比較して、前記物理ネットワークの障害箇所を特定することを特徴とする請求項1に記載された障害監視サーバ。
The fault location specifying unit includes a fault location specifying table in which a fault occurrence location and a reception presence / absence pattern of response data from each relay device for each logical network at the time of the failure are stored in advance.
The failure location specifying unit compares the reception presence / absence pattern stored in the failure location specification table with the reception presence / absence pattern of the response data from each relay device for each logical network, and determines the failure of the physical network. The failure monitoring server according to claim 1, wherein a location is specified.
前記監視データおよび前記応答データは、pingコマンドによって発行されるパケットであり、
前記論理ネットワークは、VLANであり、
前記設定部は、前記中継装置に対して、前記VLAN毎に異なるIPアドレスを設定し、前記IPアドレスが設定された中継装置に要求パケットを送信し、前記中継装置から応答パケットを受信することを特徴とする請求項1または請求項2に記載された障害監視サーバ。
The monitoring data and the response data are packets issued by a ping command,
The logical network is a VLAN;
The setting unit sets a different IP address for each VLAN for the relay device, transmits a request packet to the relay device to which the IP address is set, and receives a response packet from the relay device. The fault monitoring server according to claim 1 or 2, wherein the fault monitoring server is characterized in that:
前記中継装置は、複数の第1中継装置と、前記第1中継装置に接続される複数の第2中継装置とを備え、
前記第1中継機器は、レイヤ2スイッチであり、
前記第2中継機器は、レイヤ3スイッチである
ことを特徴とする請求項1乃至請求項3の何れか1項に記載された障害監視サーバ。
The relay device includes a plurality of first relay devices and a plurality of second relay devices connected to the first relay device,
The first relay device is a layer 2 switch;
The fault monitoring server according to any one of claims 1 to 3, wherein the second relay device is a layer 3 switch.
障害監視サーバと複数の中継装置とが通信回線を介して接続される物理ネットワークの障害箇所を特定するネットワーク障害監視システムであって、
前記障害監視サーバは、
前記障害監視サーバから各前記中継装置までツリー構造を成すように通信経路を形成し、前記通信経路がそれぞれ異なる複数の論理ネットワークを設定する設定部と、
各前記論理ネットワーク毎に、監視データを各前記中継装置に送信し、前記中継装置から応答データを受信する通信部と、
前記論理ネットワーク毎の各前記中継装置からの前記応答データの受信有無から、前記物理ネットワークの障害箇所を特定する障害箇所特定部と
を備えることを特徴とするネットワーク障害監視システム。
A network fault monitoring system for identifying a fault location in a physical network in which a fault monitoring server and a plurality of relay devices are connected via a communication line,
The fault monitoring server is
A communication path is formed so as to form a tree structure from the failure monitoring server to each of the relay devices, and a setting unit configured to set a plurality of logical networks having different communication paths,
For each logical network, a communication unit that transmits monitoring data to each relay device and receives response data from the relay device;
A network fault monitoring system comprising: a fault location identifying unit that identifies a fault location of the physical network based on whether or not the response data is received from each relay device for each logical network.
前記設定部により設定されたすべての前記論理ネットワークは、前記物理ネットワークに含まれる、すべての前記中継装置と、すべての前記通信回線とを経由する通信経路を網羅することを特徴とする請求項5に記載されたネットワーク障害監視システム。
6. All the logical networks set by the setting unit cover communication paths that pass through all the relay apparatuses and all the communication lines included in the physical network. Network fault monitoring system described in 1.
JP2008195285A 2008-07-29 2008-07-29 Fault monitoring server and network failure monitoring system Pending JP2010034876A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008195285A JP2010034876A (en) 2008-07-29 2008-07-29 Fault monitoring server and network failure monitoring system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008195285A JP2010034876A (en) 2008-07-29 2008-07-29 Fault monitoring server and network failure monitoring system

Publications (1)

Publication Number Publication Date
JP2010034876A true JP2010034876A (en) 2010-02-12

Family

ID=41738857

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008195285A Pending JP2010034876A (en) 2008-07-29 2008-07-29 Fault monitoring server and network failure monitoring system

Country Status (1)

Country Link
JP (1) JP2010034876A (en)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011118585A1 (en) * 2010-03-24 2011-09-29 日本電気株式会社 Information system, control apparatus, method of controlling virtual network, and program
JP2012138778A (en) * 2010-12-27 2012-07-19 Mitsubishi Electric Corp Network management device, network management system, and network management method
WO2012124160A1 (en) 2011-03-15 2012-09-20 オムロン株式会社 Connection abnormality detection method, network system, and master device
JP2013016161A (en) * 2011-06-30 2013-01-24 Konica Minolta Laboratory Usa Inc Method and system for network diagnosis to display possible cause on display of image forming apparatus
JP2014075668A (en) * 2012-10-03 2014-04-24 Hitachi Ltd Server, and network management method
JP2015198386A (en) * 2014-04-02 2015-11-09 Necフィールディング株式会社 Fault detector, fault detection system, fault detection method and program
WO2020075587A1 (en) * 2018-10-11 2020-04-16 日本電信電話株式会社 Fault location estimation method and fault location estimation device
WO2020085050A1 (en) * 2018-10-26 2020-04-30 日本電信電話株式会社 Inference method, inference device, and inference program
WO2023187922A1 (en) * 2022-03-28 2023-10-05 日本電信電話株式会社 Communication control device, communication control method, and communication control program

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011118585A1 (en) * 2010-03-24 2011-09-29 日本電気株式会社 Information system, control apparatus, method of controlling virtual network, and program
JP2012138778A (en) * 2010-12-27 2012-07-19 Mitsubishi Electric Corp Network management device, network management system, and network management method
WO2012124160A1 (en) 2011-03-15 2012-09-20 オムロン株式会社 Connection abnormality detection method, network system, and master device
US9680691B2 (en) 2011-03-15 2017-06-13 Omron Corporation Connection abnormality detection method, network system, and master device
JP2013016161A (en) * 2011-06-30 2013-01-24 Konica Minolta Laboratory Usa Inc Method and system for network diagnosis to display possible cause on display of image forming apparatus
JP2014075668A (en) * 2012-10-03 2014-04-24 Hitachi Ltd Server, and network management method
JP2015198386A (en) * 2014-04-02 2015-11-09 Necフィールディング株式会社 Fault detector, fault detection system, fault detection method and program
WO2020075587A1 (en) * 2018-10-11 2020-04-16 日本電信電話株式会社 Fault location estimation method and fault location estimation device
JP2020061685A (en) * 2018-10-11 2020-04-16 日本電信電話株式会社 Failure location estimation method and failure location estimation device
WO2020085050A1 (en) * 2018-10-26 2020-04-30 日本電信電話株式会社 Inference method, inference device, and inference program
JP2020068510A (en) * 2018-10-26 2020-04-30 日本電信電話株式会社 Estimation method, estimation device, and estimation program
WO2023187922A1 (en) * 2022-03-28 2023-10-05 日本電信電話株式会社 Communication control device, communication control method, and communication control program

Similar Documents

Publication Publication Date Title
JP2010034876A (en) Fault monitoring server and network failure monitoring system
US8270306B2 (en) Fault management apparatus and method for identifying cause of fault in communication network
JP4840236B2 (en) Network system and node device
CN104468181B (en) The detection and processing of virtual network device failure
JP4598462B2 (en) Provider network providing an L2-VPN service and edge router
US9178756B2 (en) Method and device for processing location information of fault point
JP4517997B2 (en) Network management apparatus and network system
US7512841B2 (en) Method and system for network fault analysis
US9083615B2 (en) Diagnosing network problems in an IPV6 dual stack network
JP2007194764A (en) Operation management system
JP4861293B2 (en) COMMUNICATION DEVICE, COMMUNICATION METHOD, AND COMMUNICATION PROGRAM
CN112291116A (en) Link fault detection method and device and network equipment
JP2008022271A (en) Network apparatus
JP4464256B2 (en) Network host monitoring device
JP5035219B2 (en) Communication path detection method, communication path detection program, and communication path detection apparatus
JP2013211680A (en) Communication device
CN102868616B (en) Method for establishing virtual MAC (Media Access Control) address table item in network as well as router and system
CN104618148A (en) Firewall device and backup method thereof
WO2011144139A1 (en) Method and device for detecting internet protocol address collision in autonomous system
JP4888067B2 (en) Layer 2 switch and network monitoring method
JP5612560B2 (en) Network relay device and network relay system
JP4258016B2 (en) Network configuration control system
CN113037622A (en) System and method for preventing BFD oscillation
JPH11331231A (en) Multiplex network system and its communication equipment
JP5718287B2 (en) Network fault monitoring system and method