図1は、通信システムの一例を示す構成図である。通信システムは、端末装置4と、複数のサーバ(通信装置)61〜65と、端末装置4と複数のサーバ61〜65間に接続されたネットワークNWと、ネットワークNWを管理するネットワーク管理システムMとを有する。
端末装置4は、ネットワークNWを介して複数のサーバ61〜65との間でパケット(信号)を送受信する。端末装置4としては、例えばパーソナルコンピュータやスマートフォンが挙げられるが、これに限定されない。なお、本実施例では、ネットワークNWに流れる信号の形態として、パケットを挙げるが、これに限定されない。
複数のサーバ61〜65は、端末装置4と通信することにより、端末装置4のユーザに各種のサービスを提供する。サーバ61は、例えば音声サーバであり、端末装置4のユーザにIP(Internet Protocol)電話サービスを提供する。
サーバ62は、例えばメール(e-mail)サーバであり、端末装置4のユーザにメールサービスを提供する。サーバ63は、例えばストリーミングサーバであり、端末装置4のユーザに動画などのストリーミングサービスを提供する。
サーバ64は、例えばWEBサーバであり、端末装置4のユーザにWEBサービスを提供する。サーバ65は、端末装置4のユーザに他のサービスを提供する。なお、カッコ内のsrv1〜srv5は、ネットワーク管理システムが管理する各サーバ61〜64の名称であり、サーバ61〜65の近傍に記載された「192.168.1.10」〜「192.168.1.50」は、サーバ61〜65の各IPアドレスである。
ネットワークNWは、複数のサーバ61〜65の何れかを宛先または送信元とするパケットをそれぞれ中継する複数の中継装置(A〜F)5を含む。中継装置(A)5は、他装置との間でパケットを送受信するポート(送受信器)p0〜p4と、ポートp0〜p4間でパケットを交換するスイッチ(SW)50と、パケットの経路に関する経路情報52が格納されたメモリ51とを有する。中継装置(A〜F)5としては、例えばルータが挙げられるが、これに限定されず、例えばレイヤ2スイッチでもよい。
ポートp0は、光ファイバなどの伝送路を介して端末装置4と接続されており、ポートp1〜p4は、伝送路を介して中継装置(B〜E)5のポートp2に接続されている。スイッチ50は、メモリ51から経路情報52を読み出し、経路情報52に従ってポートp0〜p4間でパケットを転送する。経路情報52は、後述するように、一例として、パケットの宛先のサーバ61〜65のIPアドレスと、パケットが出力されるポートp0〜p4の出力ポートIDとを含む。
また、中継装置(B〜E)5のポートp1は、伝送路を介して中継装置(F)5のポートp6〜p9と接続されている。中継装置(F)5のポートp1〜p5は、伝送路を介してサーバ61〜65にそれぞれ接続されている。なお、中継装置(B〜F)5も、中継装置(A)5と同様に、スイッチ50と、経路情報52が格納されたメモリ51とを有するが、図示は省略されている。
ネットワーク管理システムMは、障害解析サーバ(ネットワーク管理装置)1、警報管理サーバ2、及び経路制御サーバ(経路制御装置)3を有する。障害解析サーバ1、警報管理サーバ2、及び経路制御サーバ3は、ネットワーク管理用の通信回線を介して、互いに接続され、また、ネットワークNW内の各中継装置5に接続されている。
経路制御サーバ3は、各中継装置5に、パケットの経路R1〜R4に関する経路情報52を設定する。これにより、端末装置4は、経路R1〜R4を介して、サーバ61〜64とパケットをそれぞれ送受信する。
経路R1は、中継装置(A)5、中継装置(B)5、及び中継装置(F)5を経由し、経路R2は、中継装置(A)5、中継装置(C)5、及び中継装置(F)5を経由する。経路R3は、中継装置(A)5、中継装置(D)5、及び中継装置(F)5を経由し、経路R4は、中継装置(A)5、中継装置(E)5、及び中継装置(F)5を経由する。
このように、経路制御サーバ3は、経路R1〜R4上の各中継装置5に経路情報を設定することにより、パケットは、端末装置4から経路R1〜R4を経由してサーバ61〜64に送信される。したがって、経路制御サーバ3は、SDNの技術により、ネットワークNW全体として、パケットの経路R1〜R4を柔軟に構成できる。
警報管理サーバ2は、各中継装置5に障害が発生したとき、当該中継装置5から、障害に応じた警報を受信する。警報管理サーバ2は、受信した警報に関する警報情報を障害解析サーバ1及び経路制御サーバ3に送信する。なお、警報管理サーバ2は、一度に複数の警報を受信した場合、障害解析サーバ1及び経路制御サーバ3に各警報に関する警報情報を1つずつ送信する。
経路制御サーバ3は、障害解析サーバ1の指示を受けると、ネットワークNW内のパケットの経路R1〜R4を制御する。経路制御サーバ3は、警報情報が「重度」の障害(信号断など)を示す場合、経路R1〜R4を切り替える。経路切り替えは、警報管理サーバ2から受信した警報情報に基づいて行われる。本実施例では、中継装置(C)5及び中継装置(D)5に障害が発生した場合を例に挙げて説明する。
経路制御サーバ3は、中継装置(C)5に「重度」の障害が発生した場合(×印参照)、中継装置(C)5を経由する経路R2を、該中継装置(C)5を迂回する迂回経路R2aに切り替える。迂回経路R2aは、中継装置(A)5、中継装置(B)5、及び中継装置(F)5を経由する。このため、端末装置4は、障害が発生した後、迂回経路R2aを介して、サーバ62とパケットを送受信する。
また、経路制御サーバ3は、中継装置(D)5に「重度」の障害が発生した場合(×印参照)、中継装置(D)5を経由する経路R3を、該中継装置(D)5を迂回する迂回経路R3aに切り替える。迂回経路R3aは、中継装置(A)5、中継装置(E)5、及び中継装置(F)5を経由する。このため、端末装置4は、障害が発生した後、迂回経路R3aを介して、サーバ63とパケットを送受信する。なお、経路制御サーバ3は、中継装置5に「軽度」の障害(1ビットエラーなど)が発生した場合、経路R1〜R4の切り替えを行わない。
経路制御サーバ3は、経路R1〜R4の切り替えが完了すると、各中継装置5の経路情報52を障害解析サーバ1に送信する。また、経路制御サーバ3は、障害が「軽度」である場合、経路切り替えを行うことなく、各中継装置5の経路情報52を障害解析サーバ1に送信する。
障害解析サーバ1は、受信した経路情報52に基づいて、障害の復旧処理の優先度を決定し、ネットワークNWの管理者に通知する。障害解析サーバ1は、後述するように、例えば障害の発生前及び発生後の経路情報を比較することにより、迂回経路R2a,R3a上の中継装置5に設定された経路情報を抽出し、該経路情報に基づいて障害の復旧処理の優先度を決定する。
図2は、経路制御サーバ3の一例を示す構成図である。経路制御サーバ3は、CPU(Central Processing Unit)20、ROM(Read Only Memory)21、RAM(Random Access Memory)22、HDD(Hard Disk Drive)23、及び通信処理部24を有する。
CPU20は、互いに信号の入出力ができるように、ROM21、RAM22、HDD23、及び通信処理部24と、データバス25を介して接続されている。ROM21は、CPU20を駆動するプログラムが格納されている。RAM22は、CPU20のワーキングメモリとして機能する。
HDD23には、ネットワークNWの構成を示すトポロジ情報230と、各中継装置5の経路情報231が格納されている。通信処理部24は、例えばネットワークインターフェースカードであり、各中継装置5、障害解析サーバ1、及び警報管理サーバ2との間で通信を行う。
CPU20は、ROM21からプログラムを読み込むと、機能として、経路探索部200、経路情報生成部201、及経路情報設定部202が形成される。経路探索部200は、トポロジ情報230に基づいて、端末装置4及びサーバ61〜64間の経路R1〜R4、及び障害発生時の迂回経路R2a,R3aを探索する。経路探索部200は、探索した経路を経路情報生成部201に通知する。
経路情報生成部201は、探索された経路R1〜R4または迂回経路R2a,R3aに基づいて、各中継装置5に設定する経路情報231を生成する。経路情報231は、例えば、設定対象の中継装置5を示す装置ID、当該経路のパケットの宛先及び送信元、該中継装置5においてパケットが出力されるポートp1,・・・,p9を示す出力ポートIDを含む。経路情報生成部201は、経路情報231の生成が完了すると、経路情報231をHDD23に格納し、生成完了を経路情報設定部202に通知する。
経路情報設定部202は、経路情報231の生成完了が通知されると、HDD23から経路情報231を読み出し、通信処理部24を介して各中継装置5に設定する。中継装置5に障害が発生した場合、経路情報設定部202は、障害解析サーバ1の指示を受けた後、経路情報231の設定処理を行う。この場合、経路情報設定部202は、設定処理の完了後、経路情報231を障害解析サーバ1に送信する。
図3は、障害解析サーバ1の一例を示す構成図である。障害解析サーバ1は、CPU10、ROM11、RAM12、HDD(記憶部)13、表示処理部14、及び通信処理部15を有する。
CPU10は、互いに信号の入出力ができるように、ROM11、RAM12、HDD13、表示処理部14、及び通信処理部15と、データバス16を介して接続されている。ROM11は、CPU10を駆動するプログラムが格納されている。RAM12は、CPU10のワーキングメモリとして機能する。
HDD13には、警報テーブル130、障害前経路情報テーブル131、経路情報比較テーブル132、及びサービス重要度テーブル(テーブル)133が記憶されている。表示処理部14は、例えば液晶モニタなどの表示装置に情報を表示させる処理を行う。通信処理部15は、例えばネットワークインターフェースカードであり、各中継装置5、経路制御サーバ3、及び警報管理サーバ2との間で通信を行う。
CPU10は、ROM11からプログラムを読み込むと、機能として、警報処理部100、経路情報取得部101、経路情報比較部102、優先度決定部(決定部)103、及び解析結果出力部104とが形成される。警報処理部100は、中継装置5に障害が発生したとき、警報管理サーバ2から通信処理部15を介して、発生した障害に対応する警報情報を受信する。警報処理部100は、受信した警報情報を、HDD13に格納された警報テーブル130に登録する。
図4には、警報テーブル130の一例が示されている。警報テーブル130は、「障害レベル」、「優先度」、「警報名」、「発生日時」、及び「障害箇所」の各情報を含む。警報テーブル130の情報のうち、「優先度」を除く各情報は、警報情報の内容に基づいて登録される。
「障害レベル」は、上記の「重度」または「軽度」を示す。上述したように、「重度」の障害の場合、経路R1〜R4の切り替えが行われ、「軽度」の障害の場合、経路R1〜R4の切り替えは行われない。
「警報名」は、障害に対応する警報の名称を示す。上記の「障害レベル」は、「警報名」に応じて決定される。つまり、複数の障害が発生した状態において、各障害に対応する「警報名」が同一であれば、「障害レベル」も同一である。本例において、「警報名」が「ALM1」である障害の「障害レベル」は、「重度」として扱われ、一方、後述するように、「警報名」が「ALM2」である障害の「障害レベル」は、「軽度」として扱われる。
「発生日時」は、障害の発生日時を示し、「障害箇所」は、障害が発生した中継装置5の装置ID(本例では、A〜Fとする)を示す。つまり、本例の警報情報は、1月1日の10時1分に、中継装置(C)5に警報「ALM1」が発生したことを示す。
上述したように、「警報名」が同一である複数の警報情報が通知された状態では、各警報情報が示す「障害レベル」も同一である。このため、ネットワークNWの管理者は、優先すべき障害の復旧処理を判断できない。例えば、障害の復旧処理が、障害の発生日時の早い順に行われた場合、優先すべき障害の復旧処理が後回しになる場合がある。この場合、障害の復旧処理の遅延が、各サーバ61〜65からネットワークNWを介して端末装置4のユーザに提供されるサービスに重大な影響を与え得る。
そこで、障害解析サーバ1は、障害が発生した中継装置5を迂回する迂回経路R2a,R3a上の他の中継装置5に設定された経路情報を取得する。障害解析サーバ1は、迂回経路R2a,R3aに関する経路情報が示すパケットの宛先または送信元のサーバ61〜65のサービスの重要度に基づいて、障害の復旧処理の優先度を決定することで、利便性を向上する。
警報テーブル130の「優先度」は、優先度決定部103により決定された障害の復旧処理の優先度を示す。「優先度」は、優先度の決定処理後に登録され、優先度の決定処理前、「−」を示す。
経路情報取得部101は、警報テーブル130への警報情報の登録後、経路制御サーバ3に経路制御を指示し、応答として、経路制御サーバ3から通信処理部15を介して経路情報231を取得する。経路情報取得部101は、取得した経路情報231を経路情報比較テーブル132に登録する。また、経路情報取得部101は、障害の発生の前後の各経路情報231を比較するため、障害の発生前に取得した経路情報231を障害前経路情報テーブル131に予め登録しておく。
図5(a)及び図5(b)には、障害前経路情報テーブル131及び経路情報比較テーブル132の一例がそれぞれ示されている。障害前経路情報テーブル131は、「装置ID」、「宛先アドレス」、及び「出力ポートID」を含む。「装置ID」、「宛先アドレス」、及び「出力ポートID」は、障害発生前に取得された経路情報231に含まれる情報である。
「装置ID」は、中継装置5を示す識別情報(A〜D)である。「宛先アドレス」は、当該中継装置5におけるパケットの宛先であるサーバ61〜65のIPアドレス(「192.168.1.10」〜「192.168.1.50」)である。つまり、「宛先アドレス」は、パケットのヘッダ部分に含まれる宛先アドレス(宛先情報)に一致する。また、「出力ポートID」は、「装置ID」が示す中継装置5において、当該パケットが出力されるポートp1〜p9(図1参照)を示す識別情報(p1〜p9)である。
本例の障害前経路情報テーブル131には、図1に示された経路R1〜R4に対応した経路情報231が登録されている。この経路情報231に従って、中継装置(A)5は、宛先アドレスが「192.168.1.10」〜「192.168.1.40」であるパケットを、ポートp1〜p4からそれぞれ送信する。中継装置(B〜E)5は、宛先アドレスが「192.168.1.10」〜「192.168.1.40」であるパケットをそれぞれポートp1から送信する。中継装置(F)5は、宛先アドレスが「192.168.1.10」〜「192.168.1.40」であるパケットを、ポートp1〜p4からそれぞれ送信する。
本例の障害前経路情報テーブル131には、端末装置4からサーバ61〜65に向かう方向(上り方向)に関する経路情報231が登録されているが、サーバ61〜65から端末装置4に向かう方向(下り方向)に関する経路情報231が登録されてもよい。この場合、障害前経路情報テーブル131には、「宛先アドレス」に代えて、パケットの送信元であるサーバ61〜65のIPアドレス(「192.168.1.10」〜「192.168.1.50」)を示す「送信元アドレス」が含まれる。送信元アドレスは、宛先アドレスと同様に、パケットのヘッダ部分に含まれる。
経路情報比較テーブル132は、「装置ID」、「宛先アドレス」、「出力ポートID」、「比較結果」、及び「サービス重要度」を含む。「装置ID」、「宛先アドレス」、及び「出力ポートID」は、障害発生後に取得された経路情報231に含まれる情報であり、その内容は障害前経路情報テーブル131と同様である。
すなわち、「装置ID」、「宛先アドレス」、及び「出力ポートID」には、障害の発生後、つまり経路制御後の経路情報231が登録される。本例の障害前経路情報テーブル131には、図1に示された迂回経路R2a及び経路R1,R3〜R4に関する経路情報231が登録されている。
迂回経路R2aに関する経路情報231に従って、中継装置(A)5は、宛先アドレスが「192.168.1.20」であるパケットをポートp1から送信する(図5(b)の符号K0参照)。また、中継装置(B)5は、宛先アドレスが「192.168.1.20」であるパケットをポートp1から送信する(図5(b)の符号K1参照)。後述するように、経路情報比較部102は、障害の復旧処理の優先度を決定するため、障害発生前後の経路情報231を比較することにより、経路情報比較テーブル132から迂回経路R2aに関する経路情報231(符号K0,K1)を抽出する。
「比較結果」は、障害前経路情報テーブル131及び経路情報比較テーブル132に登録された各経路情報231の比較結果を示す。経路情報231の比較処理は、経路情報比較部102により行われる。
経路情報比較部102は、障害前経路情報テーブル131に、「装置ID」、「宛先アドレス」、及び「出力ポートID」の組み合わせが一致する経路情報231が登録されている場合、「比較結果」に「変更なし」を登録する。また、経路情報比較部102は、障害前経路情報テーブル131に、「装置ID」及び「宛先アドレス」だけの組み合わせが一致する経路情報231が登録されている場合、「比較結果」に「変更あり」を登録する。さらに、経路情報比較部102は、障害前経路情報テーブル131に、「装置ID」及び「宛先アドレス」の組み合わせが一致する経路情報231が登録されていない場合、「比較結果」に「該当なし」を登録する。
本例の経路情報比較テーブル132に登録された経路情報231の「装置ID」、「宛先アドレス」、及び「出力ポートID」は、迂回経路R2aに関するものを除けば、障害前経路情報テーブル131に登録された経路情報231に一致する。このため、符号K0,K1で示されたもの以外の経路情報231の「比較結果」には、「変更なし」が登録されている。
符号K0で示された経路情報231は、符号L0で示された障害前経路情報テーブル131の経路情報231(図5(a)参照)と、「装置ID」(A)及び「宛先アドレス」(「192.168.1.20」)の組み合わせが一致するが、「出力ポートID」(p1、p2)が一致しない。このため、符号K0で示された経路情報231の「比較結果」には、「変更あり」が登録されている。
また、障害前経路情報テーブル131には、符号K1で示された経路情報231の「装置ID」(B)及び「宛先アドレス」(「192.168.1.20」)の組み合わせが一致する経路情報231が登録されていない。このため、符号K1で示された経路情報231の「比較結果」には、「該当なし」が登録されている。
このように、経路情報取得部101及び経路情報比較部102(取得部)は、中継装置(A〜F)5のうち、障害が発生した中継装置(C)5を迂回する迂回経路R2a上の他の中継装置(B)5に設定された、迂回経路R2aに関する経路情報231を取得する。より具体的には、経路情報比較部102は、上述したように、障害の発生前及び発生後の経路情報231の比較結果に基づいて、各中継装置5に設定された経路情報231から、迂回経路R2aに関する経路情報231を抽出する。
このため、経路制御サーバ3は、各中継装置5に設定した経路情報231から、迂回経路R2aに関する経路情報を抽出して障害解析サーバ1に送信する必要がないので、経路制御サーバ3の構成が簡単になる。もっとも、障害解析サーバ1は、経路制御サーバ3または各中継装置5に、全ての経路情報231ではなく、迂回経路R2a,R3aに関する経路情報231だけを送信するように要求してもよい。
また、優先度決定部103は、サービス重要度テーブル133を参照することにより、迂回経路R2aに関する経路情報231が示すパケットの宛先(または送信元)のサーバ61〜65から提供されるサービスの重要度に基づいて、障害復旧の優先度を決定する。より具体的には、優先度決定部103は、サービス重要度テーブル133から、図5(b)の符号K0,K1で示された経路情報231の「宛先アドレス」が示すサーバ61〜65のサービスの重要度を検索し、障害復旧の優先度として決定する。
図6(a)には、サービス重要度テーブル133の一例が示されている。サービス重要度テーブル133は、「サーバ名」、「IPアドレス」、「サービス種別」、及び「サービス重要度」を含む。
「サーバ名」は、各サーバ61〜65の名称「srv1」〜「srv5」であり、「IPアドレス」は、各サーバ61〜65のIPアドレスである(図1参照)。「サービス種別」は、各サーバ61〜65が端末装置4のユーザに提供するサービス(音声、メール、ストリーミング、WEB,その他)の種類を示す。
「サービス重要度」は、各サーバ61〜65が提供するサービスの重要度を示す。「サービス重要度」は、一例として、各サーバ61〜65のサービスが、障害が発生した場合に受ける影響の大きさを示す。例えば、IP電話サービスなどの「音声」サービスは、他のサービスより高いリアルタイム性を要求されるため、障害によりパケットが損失または遅延すると、他種のサービスよりも顕著に影響を受け、サービス品質が劣化する。このため、サーバ61の「サービス重要度」は、サーバ61〜65のうち、最も高い「5」が設定されている。
また、「メール」サービスは、リアルタイム性は要求されないが、例えば、使用頻度が高いため、障害によりパケットが損失または遅延すると、ネットワークNWの通信が重大な影響を受ける。このため、サーバ62の「サービス重要度」は、サーバ61〜65のうち、2番目に高い「4」が設定されている。
優先度決定部103は、図5(b)の符号K0,K1で示された経路情報231の「宛先アドレス」、つまり「192.168.10.20」に基づいて、サービス重要度テーブル133を参照する。優先度決定部103は、サービス重要度テーブル133から、IPアドレス「192.168.10.20」に対応するサービス重要度「4」を検索する(符号K2参照)。
優先度決定部103は、図6(b)の符号K3で示されるように、経路情報比較テーブル132に登録された経路情報231のうち、迂回経路R2aに関する経路情報231の「サービス重要度」に、検索した「4」を登録する。なお、優先度決定部103は、図5(b)の符号K1で示される経路情報231に代えて、図5(b)の符号K0で示される経路情報231の「サービス重要度」に、検索した「4」を登録してもよい。
さらに、優先度決定部103は、図6(c)の符号K4で示されるように、警報テーブル130の「優先度」に、「サービス重要度」の「4」を登録する。これにより、中継装置(C)5の障害の復旧処理の優先度が、「4」に決定される。なお、本例において、優先度は、「5」が最も高く、「1」が最も低い。
優先度決定部103は、優先度の決定処理が完了すると、決定処理の完了を解析結果出力部104に通知する。解析結果出力部104は、HDD13から警報テーブル130を読み出して、警報テーブル130の内容を、表示処理部14を介して液晶モニタなどの表示装置に出力する。
したがって、ネットワークNWの管理者は、表示装置に表示された警報テーブル130の内容を参照し、「優先度」に基づいて障害の復旧処理を行うことができる。
優先度決定部103は、中継装置(C)5に続いて中継装置(D)5にも障害が発生した場合、同様の手法により障害の復旧処理の優先度を決定する。優先度の決定に先立ち、優先度決定部103は、図7(a)に示されるように、図5(b)の経路情報比較テーブル132の経路情報231を障害前経路情報テーブル131にコピーすることにより、障害前経路情報テーブル131の経路情報231を更新する。
中継装置(D)5に障害が発生したとき、警報管理サーバ2は、中継装置(D)5に「重度」の障害が発生したことを示す警報情報を、障害解析サーバ1及び経路制御サーバ3に送信する。障害解析サーバ1において、警報処理部100は、警報テーブル130に、受信した警報情報を追加する。また、経路情報取得部101は、経路制御サーバ3に経路制御を指示する。
経路制御サーバ3は、障害が発生した中継装置(D)5を経由する経路R3を、中継装置(D)5を迂回する迂回経路R3aに切り替えるように、各中継装置5に経路情報231を設定する。経路情報取得部101は、経路制御サーバ3から各中継装置5に設定された経路情報231を取得し、図7(b)に示されるように、経路情報比較テーブル132に登録する。経路情報比較部102は、障害前経路情報テーブル131及び経路情報比較テーブル132の各経路情報231を比較し、比較結果を経路情報比較テーブル132に登録する。
これにより、符号K5,K5aで示されるように、迂回経路R3aに関する経路情報231の「比較結果」に、「該当なし」及び「変更なし」が登録される。優先度決定部103は、サービス重要度テーブル133(図6(a)参照)から、「該当なし」の経路情報231(符号K5参照)の「宛先アドレス」、つまり「192.168.1.30」に対応する「サービス重要度」として「3」を検索する。
したがって、優先度決定部103は、符号K5で示されるように、経路情報比較テーブル132の当該経路情報231の「サービス重要度」に「3」を登録する。なお、優先度決定部103は、「該当なし」の経路情報231に代えて、「変更あり」の経路情報231(符号K5a参照)の「宛先情報」に基づいて、「サービス重要度」を検索してもよい。
優先度決定部103は、図8の符号K6で示されるように、警報テーブル130に、中継装置(D)5の障害の復旧処理の優先度として「3」を登録する。解析結果出力部104は、警報テーブル130の内容を表示処理部14に出力する。これにより、警報テーブル130の内容が、表示装置に表示される。
したがって、ネットワークNWの管理者は、中継装置(C)5及び中継装置(D)5に発生した各障害の復旧処理の優先度を知ることができる。本例の場合、中継装置(C)5の障害の復旧処理の優先度「4」が、中継装置(D)5の障害の復旧処理の優先度「3」より高い。
このため、ネットワークNWの管理者は、中継装置(C)5の障害の復旧処理を行った後、中継装置(D)5の障害の復旧処理を行う。このように、本実施例によるサーバ61〜65が提供するサービスへの障害の影響を考慮して、優先度に基づいて障害の復旧処理の実行順序を決めることができるので、障害の復旧処理の利便性が向上する。
上記の実施例では、経路制御サーバ3の経路切り替え対象となる「重度」の障害が発生した場合を挙げたが、障害解析サーバ1は、経路切り替えの対象ではない「軽度」の障害が発生した場合でも、障害の復旧処理の優先度を決定することができる。
図9には、警報テーブル130の他例が示されている。本例の警報テーブル130は、1月1日の10時1分に、中継装置(C)5に、「軽度」の障害に対応する警報「ALM2」が発生したことを示す。
経路制御サーバ3は、障害が「軽度」であるため、障害解析サーバ1から経路制御の指示を受けても、経路切り替えを行うことなく、各中継装置5に設定されている経路情報231を障害解析サーバ1に送信する。
図10(a)及び図10(b)には、障害前経路情報テーブル131及び経路情報比較テーブル132の他例がそれぞれ示されている。本例において、経路制御サーバ3は経路切り替えを行わないため、障害前経路情報テーブル131及び経路情報比較テーブル132に登録された各経路情報231は、同一である。したがって、経路情報比較部102は、経路情報比較テーブル132の全ての「比較結果」に「変更なし」を登録する。
優先度決定部103は、図9の符号K7で示されるように、発生した障害の「障害箇所」を参照する。優先度決定部103は、「障害箇所」が「C」、つまり中継装置(C)5であるため、図10(b)の符号K8で示されるように、経路情報比較テーブル132から、「装置ID」が「C」である経路情報231の「宛先アドレス」(「192.168.1.20」)を取得する。
優先度決定部103は、サービス重要度テーブル133(図6(a)参照)を参照することにより、「宛先アドレス」である「192.168.1.20」に対応する「サービス重要度」を検索する。「192.168.1.20」に対応する「サービス重要度」は「4」であるため、優先度決定部103は、図11(a)の符号K9で示されるように、経路情報比較テーブル132の当該経路情報231の「サービス重要度」に「4」を登録する。
優先度決定部103は、図11(b)の符号K10で示されるように、警報テーブル130の「優先度」に「4」を登録する。なお、優先度決定部103は、仮に、「障害発生箇所」に該当する複数の経路情報231が存在し、経路情報比較テーブル132に複数の「サービス重要度」を登録した場合、「サービス重要度」の最大値を警報テーブル130の「優先度」に登録する。
解析結果出力部104は、警報テーブル130の内容を表示処理部14に出力する。これにより、警報テーブル130の内容が、表示装置に表示される。
したがって、ネットワークNWの管理者は、表示装置に表示された警報テーブル130の内容を参照し、「優先度」に基づいて障害の復旧処理を行うことができる。
優先度決定部103は、中継装置(C)5に続いて中継装置(D)5にも障害が発生した場合、同様の手法により障害の復旧処理の優先度を決定する。優先度の決定に先立ち、優先度決定部103は、図10(b)に示された経路情報比較テーブル132の経路情報231を障害前経路情報テーブル131にコピーすることにより、障害前経路情報テーブル131の経路情報231を更新する。
中継装置(D)5に障害が発生したとき、警報管理サーバ2は、中継装置(D)5に「軽度」の障害が発生したことを示す警報情報を、障害解析サーバ1及び経路制御サーバ3に送信する。障害解析サーバ1において、警報処理部100は、警報テーブル130に、受信した警報情報を追加する。また、経路情報取得部101は、経路制御サーバ3に経路制御を指示する。
経路制御サーバ3は、障害が「軽度」であるため、障害解析サーバ1から経路制御の指示を受けても、経路切り替えを行うことなく、各中継装置5に設定されている経路情報231を障害解析サーバ1に送信する。
経路情報取得部101は、経路制御サーバ3から各中継装置5に設定された経路情報231を取得し、図12(a)に示されるように、経路情報比較テーブル132に登録する。経路情報比較部102は、障害前経路情報テーブル131(図10(a)と同一)及び経路情報比較テーブル132の各経路情報231を比較し、比較結果を経路情報比較テーブル132に登録する。
本例でも経路切り替えは行われないため、障害前経路情報テーブル131及び経路情報比較テーブル132に登録された各経路情報231は、同一である。したがって、経路情報比較部102は、経路情報比較テーブル132の全ての「比較結果」に「変更なし」を登録する。
本例において、警報テーブル130の「障害箇所」は、「D」、つまり中継装置(D)5である。このため、優先度決定部103は、図12(a)の符号K11で示されるように、経路情報比較テーブル132から、「装置ID」が「D」である経路情報231の「宛先アドレス」(「192.168.1.30」)を取得する。
優先度決定部103は、サービス重要度テーブル133(図6(a)参照)を参照することにより、「宛先アドレス」である「192.168.1.30」に対応する「サービス重要度」を検索する。「192.168.1.30」に対応する「サービス重要度」は「3」であるため、優先度決定部103は、符号K11で示されるように、経路情報比較テーブル132の当該経路情報231の「サービス重要度」に「3」を登録する。
優先度決定部103は、図12(b)の符号K12で示されるように、警報テーブル130の「優先度」に「3」を登録する。なお、優先度決定部103は、仮に、「障害発生箇所」に該当する複数の経路情報231が存在し、経路情報比較テーブル132に複数の「サービス重要度」を登録した場合、「サービス重要度」の最大値を警報テーブル130の「優先度」に登録する。
解析結果出力部104は、警報テーブル130の内容を表示処理部14に出力する。これにより、警報テーブル130の内容が、表示装置に表示される。
したがって、ネットワークNWの管理者は、中継装置(C)5及び中継装置(D)5に発生した各障害の復旧処理の優先度を知ることができる。本例の場合、中継装置(C)5の障害の復旧処理の優先度「4」が、中継装置(D)5の障害の復旧処理の優先度「3」より高い。
このため、ネットワークNWの管理者は、中継装置(C)5の障害の復旧処理を行った後、中継装置(D)5の障害の復旧処理を行う。
このように、本実施例において、経路情報取得部101は、障害が発生した中継装置(C),(D)5(警報テーブル130の「障害箇所」)に設定された経路情報231を取得する。優先度決定部103は、サービス重要度テーブル133を参照することにより、該経路情報231が示す宛先アドレスのサーバ61〜65から提供されるサービスの重要度に基づいて、障害の復旧の優先度を決定する。
したがって、ネットワークNWの管理者は、決定された優先度に基づいて障害の復旧処理の実行順序を決めることができるので、障害の復旧処理の利便性が向上する。なお、本実施例において、優先度決定部103は、経路情報231の「宛先アドレス」に基づいて、「サービス重要度」を検索したが、下り方向の経路情報231を用いる場合、経路情報231の送信元アドレスに基づいて「サービス重要度」を検索する。
次に、障害解析サーバ1の各処理の詳細を説明する。
図13は、経路情報231の取得処理を示すフローチャートである。警報処理部100は、警報管理サーバ2から警報情報を受信したか否かを判定する(ステップSt1)。警報処理部100は、警報情報を受信していない場合(ステップSt1のNo)、処理を終了する。
警報処理部100は、警報情報を受信した場合(ステップSt1のYes)、警報情報を警報テーブル130に登録する(ステップSt2)。次に、経路情報取得部101は、経路制御サーバ3に経路制御を指示する(ステップSt3)。
経路制御サーバ3は、経路制御の指示を受けると、以下の処理を行う。経路情報設定部202は、警報情報が「重度」の障害を示す場合、障害が発生した中継装置(C),(D)5を経由する経路R2,R3を、中継装置(C),(D)5を迂回する迂回経路R2a,R3aに切り替えるように、各中継装置5に経路情報231を設定する。経路制御サーバ3は、各中継装置5に設定した経路情報231を障害解析サーバ1に送信する。一方、警報情報が「軽度」の障害を示す場合、経路情報設定部202は、経路制御を行うことなく、各中継装置5に設定されている経路情報231を障害解析サーバ1に送信する。
次に、経路情報取得部101は、経路制御サーバ3から経路情報231を受信したか否かを判定する(ステップSt4)。経路情報取得部101は、経路情報231を受信していない場合(ステップSt4のNo)、再びステップSt4の判定処理を行う。
また、経路情報取得部101は、経路情報231を受信した場合(ステップSt4のYes)、受信した経路情報231を経路情報比較テーブル132に登録する(ステップSt5)。このようにして、経路情報231の取得処理は行われる。
図14は、経路情報231の比較処理を示すフローチャートである。経路情報比較部102は、経路情報比較テーブル132から、経路情報231の1つを選択する(ステップSt11)。
次に、経路情報比較部102は、選択した経路情報231を、障害前経路情報テーブル131の各経路情報231と比較する(ステップSt12)。このとき、経路情報比較部102は、経路情報比較テーブル132から選択した経路情報231を、障害前経路情報テーブル131から順次に選択した経路情報231と比較する。
経路情報比較部102は、障害前経路情報テーブル131に、経路情報231の「装置ID」及び「宛先アドレス」の組み合わせが一致するものがなければ(ステップSt13のNo)、当該「比較結果」に「該当なし」を登録する(ステップSt17)。
また、経路情報比較部102は、障害前経路情報テーブル131に、経路情報231の「装置ID」及び「宛先アドレス」の組み合わせが一致するものがあれば(ステップSt13のYes)、「出力ポートID」が一致するか否かを判定する(ステップSt14)。「出力ポートID」が一致しない場合(ステップSt14のYes)、経路情報比較部102は、当該「比較結果」に「変更あり」を登録する(ステップSt18)。つまり、経路情報231の「装置ID」、「宛先アドレス」、「出力ポートID」のうち、「出力ポートID」だけが一致しない場合、当該「比較結果」には「変更あり」が登録される。
迂回経路R2a,R3aに関する経路情報231は、新規に生成されたもの、または「出力ポートID」が変更されたものであるため、「比較結果」として「該当なし」または「変更あり」が登録される(図5(b)の符号K0、K1参照)。このため、経路情報比較部102は、障害前経路情報テーブル131及び経路情報比較テーブル132の各経路情報231を比較することにより、迂回経路R2a,R3aに関する経路情報231を容易に抽出できる。
また、経路情報比較部102は、「出力ポートID」が一致する場合(ステップSt14のYes)、当該「比較結果」に「変更なし」を登録する(ステップSt15)。つまり、経路情報231の「装置ID」、「宛先アドレス」、「出力ポートID」の組み合わせが一致する場合、当該「比較結果」には「変更なし」が登録される。
次に、経路情報比較部102は、経路情報比較テーブル132に未選択の経路情報231があるか否かを判定する(ステップSt16)。経路情報比較部102は、未選択の経路情報231があれば(ステップSt16のYes)、他の経路情報231を選択して(ステップSt11)、同様の比較処理を行う。
また、経路情報比較部102は、未選択の経路情報231がなければ(ステップSt16のNo)、処理を終了する。このようにして、経路情報231の比較処理は行われる。
図15は、障害の復旧処理の優先度の決定処理を示すフローチャートである。優先度決定部103は、経路情報比較テーブル132に、「比較結果」が「該当なし」または「変更あり」である経路情報231があるか否かを判定する(ステップSt21)。これにより、優先度決定部103は、経路切り替えが行われたか否かを判定する。
優先度決定部103は、「比較結果」が「該当なし」または「変更あり」である経路情報231がある場合(ステップSt21のYes)、サービス重要度テーブル133から、該経路情報231の「宛先アドレス」に一致する「IPアドレス」の「サービス重要度」を検索する(ステップSt22)。優先度決定部103は、検索した「サービス重要度」を、経路情報比較テーブル132の当該経路情報231の「サービス重要度」に登録する(ステップSt23)。
優先度決定部103は、「比較結果」が「該当なし」または「変更あり」である他の経路情報231がある場合(ステップSt24のYes)、再びステップSt22の処理を行う。優先度決定部103は、「比較結果」が「該当なし」または「変更あり」である他の経路情報231がない場合(ステップSt24のNo)、経路情報比較テーブル132に登録された「サービス重要度」の最大値を警報テーブル130の「優先度」として登録する(ステップSt25)。
一方、優先度決定部103は、「比較結果」が「該当なし」または「変更あり」である経路情報231がない場合(ステップSt21のNo)、「装置ID」が警報テーブル130の「障害箇所」に一致する経路情報231の有無を判定する(ステップSt29)。優先度決定部103は、「装置ID」が警報テーブル130の「障害箇所」に一致する経路情報231がない場合(ステップSt29のNo)、障害が発生した中継装置5を経由する経路がないものとして、処理を終了する。
優先度決定部103は、「装置ID」が警報テーブル130の「障害箇所」に一致する経路情報231がある場合(ステップSt29のYes)、サービス重要度テーブル133から、当該経路情報231の「宛先アドレス」に一致する「IPアドレス」の「サービス重要度」を検索する(ステップSt30)。優先度決定部103は、検索した「サービス重要度」を、経路情報比較テーブル132の当該経路情報231の「サービス重要度」に登録する(ステップSt31)。
優先度決定部103は、「装置ID」が警報テーブル130の「障害箇所」に一致する他の経路情報231がある場合(ステップSt32のYes)、再びステップSt30の処理を行う。また、優先度決定部103は、「装置ID」が警報テーブル130の「障害箇所」に一致する他の経路情報231がない場合(ステップSt32のNo)、経路情報比較テーブル132に登録された「サービス重要度」の最大値を警報テーブル130の「優先度」として登録する(ステップSt25)。
次に、解析結果出力部104は、警報テーブル130の内容を表示処理部14に出力することにより、表示装置に表示する(ステップSt26)。次に、優先度決定部103は、障害前経路情報テーブル131に、経路情報比較テーブル132の経路情報231を登録することにより、障害前経路情報テーブル131を更新する(ステップSt27)。次に、優先度決定部103は、経路情報比較テーブル132の経路情報231をクリアする(ステップSt28)。このようにして、障害の復旧処理の優先度の決定処理は行われる。
これまで述べたように、実施例に係るネットワーク管理装置(障害解析サーバ)1は、取得部(経路情報取得部及び経路情報比較部)101,102と、記憶部(HDD)13と、決定部(優先度決定部)103とを有する。取得部101,102は、複数の通信装置(サーバ)61〜65の何れかを宛先または送信元とする信号(パケット)をそれぞれ中継する複数の中継装置(A〜F)5のうち、障害が発生した中継装置(C,D)に設定された経路情報231、または障害が発生した中継装置(C,D)5を迂回する迂回経路R2a,R3a上の他の中継装置(A,B)5に設定された、迂回経路に関する経路情報231を取得する。
記憶部13は、複数の通信装置61〜65の各々から提供されるサービスの重要度(「サービス重要度」)を示すテーブル(サービス重要度テーブル)133を記憶する。決定部103は、テーブル133を参照することにより、複数の通信装置61〜65のうち、経路情報231が示す信号の宛先または送信元の通信装置61〜65から提供されるサービスの重要度に基づいて、障害の復旧の優先度を決定する。
上記の構成によると、テーブル133を参照することにより、中継装置5の障害により影響を受けるサービスの重要度が検索され、障害の復旧の優先度は、検索されたサービスの重要度に基づいて決定される。したがって、実施例に係るネットワーク管理装置(障害解析サーバ)1によると、サービスへの障害の影響を考慮して、障害の復旧処理の実行順位を決定でき、復旧処理の利便性が向上する。
また、実施例に係るネットワーク管理システムMは、ネットワーク管理装置(障害解析サーバ)1と、経路制御装置(経路制御サーバ)3とを有する。経路制御装置3は、複数の通信装置(サーバ)61〜65の何れかを宛先または送信元とする信号(パケット)をそれぞれ中継する複数の中継装置(A〜F)5に経路情報231を設定する。ネットワーク管理装置(障害解析サーバ)1は、取得部(経路情報取得部及び経路情報比較部)101,102と、記憶部(HDD)13と、決定部(優先度決定部)103とを有する。
取得部101,102は、複数の中継装置(A〜F)5のうち、障害が発生した中継装置(C,D)に設定された経路情報231、または障害が発生した中継装置(C,D)5を迂回する迂回経路R2a,R3a上の他の中継装置(A,B)5に設定された、迂回経路に関する経路情報231を取得する。記憶部13は、複数の通信装置61〜65の各々から提供されるサービスの重要度(「サービス重要度」)を示すテーブル(サービス重要度テーブル)133を記憶する。決定部103は、テーブル133を参照することにより、複数の通信装置61〜65のうち、経路情報231が示す信号の宛先または送信元の通信装置から提供されるサービスの重要度に基づいて、障害の復旧の優先度を決定する。
実施例に係るネットワーク管理システムMは、実施例に係るネットワーク管理装置1と同様の構成を含むので、上述した内容と同様の作用効果を奏する。
また、実施例に係るネットワーク管理方法は、以下の工程を含む。
工程(1):複数の通信装置(サーバ)61〜65の何れかを宛先または送信元とする信号(パケット)をそれぞれ中継する複数の中継装置(A〜F)5のうち、障害が発生した中継装置(C,D)に設定された経路情報231、または障害が発生した中継装置(C,D)5を迂回する迂回経路R2a,R3a上の他の中継装置(A,B)5に設定された、迂回経路に関する経路情報231を取得する。
工程(2):複数の通信装置61〜65の各々から提供されるサービスの重要度(「サービス重要度」)を示すテーブル(サービス重要度テーブル)133を参照することにより、複数の通信装置61〜65のうち、経路情報231が示す信号の宛先または送信元の通信装置から提供されるサービスの重要度に基づいて、障害の復旧の優先度を決定する。
実施例に係るネットワーク管理方法は、実施例に係るネットワーク管理装置1と同様の構成を含むので、上述した内容と同様の作用効果を奏する。
上述した実施形態は本発明の好適な実施の例である。但し、これに限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々変形実施可能である。
なお、以上の説明に関して更に以下の付記を開示する。
(付記1) 複数の通信装置の何れかを宛先または送信元とする信号をそれぞれ中継する複数の中継装置のうち、障害が発生した中継装置に設定された経路情報、または障害が発生した中継装置を迂回する迂回経路上の他の中継装置に設定された、前記迂回経路に関する経路情報を取得する取得部と、
前記複数の通信装置の各々から提供されるサービスの重要度を示すテーブルを記憶する記憶部と、
前記テーブルを参照することにより、前記複数の通信装置のうち、前記経路情報が示す前記信号の宛先または送信元の通信装置から提供されるサービスの前記重要度に基づいて、前記障害の復旧の優先度を決定する決定部とを有することを特徴とするネットワーク管理装置。
(付記2) 前記取得部は、前記障害の発生前及び発生後の経路情報の比較結果に基づいて、前記他の中継装置に設定された経路情報から、前記迂回経路に関する前記経路情報を抽出することを特徴とする付記1に記載のネットワーク管理装置。
(付記3) ネットワーク管理装置と、経路制御装置とを有するネットワーク管理システムにおいて、
前記経路制御装置は、複数の通信装置の何れかを宛先または送信元とする信号をそれぞれ中継する複数の中継装置に経路情報を設定し、
前記ネットワーク管理装置は、
前記複数の中継装置のうち、障害が発生した中継装置に設定された経路情報、または障害が発生した中継装置を迂回する迂回経路上の他の中継装置に設定された、前記迂回経路に関する経路情報を、前記経路制御装置から取得する取得部と、
前記複数の通信装置の各々から提供されるサービスの重要度を示すテーブルを記憶する記憶部と、
前記テーブルを参照することにより、前記複数の通信装置のうち、前記経路情報が示す前記信号の宛先または送信元の通信装置から提供されるサービスの前記重要度に基づいて、前記障害の復旧の優先度を決定する決定部とを有することを特徴とするネットワーク管理システム。
(付記4) 前記取得部は、前記障害の発生前及び発生後の経路情報の比較結果に基づいて、前記他の中継装置に設定された経路情報から、前記迂回経路に関する前記経路情報を抽出することを特徴とする付記3に記載のネットワーク管理システム。
(付記5) 複数の通信装置の何れかを宛先または送信元とする信号をそれぞれ中継する複数の中継装置のうち、障害が発生した中継装置に設定された経路情報、または障害が発生した中継装置を迂回する迂回経路上の他の中継装置に設定された、前記迂回経路に関する経路情報を取得し、
前記複数の通信装置の各々から提供されるサービスの重要度を示すテーブルを参照することにより、前記複数の通信装置のうち、前記迂回経路に関する経路情報が示す前記信号の宛先または送信元の通信装置から提供されるサービスの前記重要度に基づいて、前記障害の復旧の優先度を決定することを特徴とするネットワーク管理方法。
(付記6) 前記障害の発生前及び発生後の経路情報の比較結果に基づいて、前記他の中継装置に設定された経路情報から、前記迂回経路に関する前記経路情報を抽出することを特徴とする付記5に記載のネットワーク管理方法。