JP4485344B2 - サーバ装置、障害経路診断方法、および障害経路診断プログラム - Google Patents

サーバ装置、障害経路診断方法、および障害経路診断プログラム Download PDF

Info

Publication number
JP4485344B2
JP4485344B2 JP2004377704A JP2004377704A JP4485344B2 JP 4485344 B2 JP4485344 B2 JP 4485344B2 JP 2004377704 A JP2004377704 A JP 2004377704A JP 2004377704 A JP2004377704 A JP 2004377704A JP 4485344 B2 JP4485344 B2 JP 4485344B2
Authority
JP
Japan
Prior art keywords
failure
pattern
communication
route
monitoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004377704A
Other languages
English (en)
Other versions
JP2006186633A (ja
Inventor
貴子 秋政
卓 守屋
顯 木戸
貴子 竹島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2004377704A priority Critical patent/JP4485344B2/ja
Publication of JP2006186633A publication Critical patent/JP2006186633A/ja
Application granted granted Critical
Publication of JP4485344B2 publication Critical patent/JP4485344B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Description

本発明は、障害経路診断システム、障害経路診断方法、および障害経路診断プログラムに関し、特に自動監視でもって監視ネットワーク上にて検出した障害経路を自動診断する方法に関する。
ネットワークの自動監視方法は、複数の監視対象機器に対して1つの監視マネージャを設け、監視マネージャと情報を送受信する監視エージェントを設け、監視マネージャから監視エージェントに対して一定の周期でポーリングを行ない、そのポーリングの疎通により生存と判断する方法が一般的である。ここで監視エージェントは監視対象機器でもあり、ルータ・スイッチ等の情報収集手段を持たない機器との疎通を監視するサーバでもある。 ポーリングがタイムアウトした場合、すなわち障害が発生した場合には障害個所を速やかに特定する必要があるが、従来はシステムの管理者や管理オペレータが、監視画面に表示されたネットワーク監視の結果の警報情報を見て、障害を検知した後、障害情報を収集し、保守マニュアルに従い障害個所の診断を実施していた。
この障害個所の診断を自動化する方法として、例えば、複数のネットワーク機器にて構成されるネットワークを監視するネットワーク監視装置において、ネットワークを構成する各機器を物理的な接続関係で階層的に管理する手段と、その階層情報を基に、ある機器が障害となった場合の実障害と擬似障害(上位の機器が障害である為にそれ以下の機器を障害とみなされる障害)を判別する手段を設けたことを特徴とするネットワーク監視方式(特許文献1参照)などが提案されている。
特開2001−86117号公報
従来技術においては、一つの監視マネージャから全ての監視エージェントに対して疎通確認を行なうという一対全の経路監視が前提であり、監視マネージャと監視エージェントとの間の経路監視のみが対象で、監視エージェント相互間の経路は監視対象にしていない。このため、この経路で障害が発生した場合には検知が難しいという問題があった。
また、従来技術においては、機器が完全にダウンした障害を想定しており、障害時の経路監視情報に整合性があることが前提である。しかし実際には障害機器を絞り込むための経路監視情報に整合性がとれない障害、例えば機器がダウンに至らず不安定になっている等で一時的に疎通不可が発生するような不整合障害が多く発生しており、従来技術においてはこれらを検出することが難しいという問題があった。
そこで本発明は上記課題を鑑みてなされたものであり、障害検出の漏れを無くして障害機器の確実な特定を可能とする、障害経路診断システム、障害経路診断方法、および障害経路診断プログラムを提供することを主たる目的とする。
上記課題を解決する本発明のサーバ装置は、複数の監視対象機器とネットワークを介して接続されたサーバ装置であって、監視対象機器毎に、監視対象機器相互間の疎通経路パターンと、疎通経路において発生が想定される障害パターンとを対応付けて格納した障害情報データベースと、経路監視情報収集信号を前記ネットワークを介して前記各監視対象機器に送信し、前記各監視対象機器から疎通確認結果を前記ネットワークを介して収集し、該収集した疎通確認結果を、前記障害情報データベースにおける前記疎通経路パターンに照合し、前記疎通確認結果と前記疎通経路パターンとを対応づけた経路監視情報テーブルを生成し、前記経路監視情報テーブルを前記障害情報データベースに照合して、同一の疎通経路パターンにおいて前記疎通確認結果と一致する前記障害パターンの有無を判定し、前記疎通確認結果と一致する障害パターンを検出できた場合、当該障害パターンに対応する監視対象機器を障害発生機器として特定し、前記疎通確認結果と一致する障害パターンを検出できなかった場合、前記経路監視情報テーブルと前記障害情報データベースにおける各障害パターンとの疎通確認結果の一致度を算出し、該算出した一致度が所定値以上となった障害パターンを検出し、該障害パターンに対応する障害機器を障害発生機器候補として特定する、制御部とを有することを特徴とする。
また、本発明の障害経路診断方法は、監視対象機器毎に、監視対象機器相互間の疎通経路パターンと、疎通経路において発生が想定される障害パターンとを対応付けて格納した障害情報データベースを備え、複数の監視対象機器とネットワークを介して接続されたサーバ装置が、経路監視情報収集信号を前記ネットワークを介して前記各監視対象機器に送信し、前記各監視対象機器から疎通確認結果を前記ネットワークを介して収集し、該収集した疎通確認結果を、前記障害情報データベースにおける前記疎通経路パターンに照合し、前記疎通確認結果と前記疎通経路パターンとを対応づけた経路監視情報テーブルを生成し、前記経路監視情報テーブルを前記障害情報データベースに照合して、同一の疎通経路パターンにおいて前記疎通確認結果と一致する前記障害パターンの有無を判定し、前記疎通確認結果と一致する障害パターンを検出できた場合、当該障害パターンに対応する監視対象機器を障害発生機器として特定し、前記疎通確認結果と一致する障害パターンを検出できなかった場合、前記経路監視情報テーブルと前記障害情報データベースにおける各障害パターンとの疎通確認結果の一致度を算出し、該算出した一致度が所定値以上となった障害パターンを検出し、該障害パターンに対応する障害機器を障害発生機器候補として特定する、ことを特徴とする。
また、本発明の障害経路診断プログラムは、監視対象機器毎に、監視対象機器相互間の疎通経路パターンと、疎通経路において発生が想定される障害パターンとを対応付けて格納した障害情報データベースを備え、複数の監視対象機器とネットワークを介して接続されたサーバ装置に、経路監視情報収集信号を前記ネットワークを介して前記各監視対象機器に送信する処理と、前記各監視対象機器から疎通確認結果を前記ネットワークを介して収集する処理と、該収集した疎通確認結果を、前記障害情報データベースにおける前記疎通経路パターンに照合し、前記疎通確認結果と前記疎通経路パターンとを対応づけた経路監視情報テーブルを生成する処理と、前記経路監視情報テーブルを前記障害情報データベースに照合して、同一の疎通経路パターンにおいて前記疎通確認結果と一致する前記障害パターンの有無を判定し、前記疎通確認結果と一致する障害パターンを検出できた場合、当該障害パターンに対応する監視対象機器を障害発生機器として特定し、前記疎通確認結果と一致する障害パターンを検出できなかった場合、前記経路監視情報テーブルと前記障害情報データベースにおける各障害パターンとの疎通確認結果の一致度を算出し、該算出した一致度が所定値以上となった障害パターンを検出し、該障害パターンに対応する障害機器を障害発生機器候補として特定する処理と、を実行させることを特徴とする。
その他、本願が開示する課題、及びその解決方法は、発明の実施の形態の欄、及び図面により明らかにされる。
本発明によれば、障害検出の漏れを無くして障害機器の確実な特定が可能となる。
−−−システム構成−−−
以下に本発明の実施形態について図面を用いて詳細に説明する。
図1は本実施形態における障害経路診断システムを含むネットワーク構成図である。本実施形態においては、障害経路診断システム100としての機能を備えたサーバ装置を監視マネージャと称している。また、監視対象機器120としては、監視エージェント110とその間を結ぶスイッチやルータ類をも含むものとできる。図1の例では、各機器が3台のスイッチSa、Sb、Sc(106〜108)と、1台のルータRa(109)とで介して接続されている。
本発明の障害経路診断システム100(以下、システム100)は、本発明の障害経路診断方法を実行する機能を実現すべく書き換え可能メモリなどのプログラムデータベース31に格納されたプログラム32をメモリ33に読み出し、演算装置たるCPU34により実行する。
また、前記システム100は、コンピュータ装置が一般に備えている各種キーボードやボタン類などの入出力インターフェイス35、ならびに監視エージェント110や監視対象機器120との間のデータ授受を担う通信手段36などを有している。
システム100は、前記通信手段36により、前記監視エージェント110や監視対象機器120らと例えばインターネットやLAN、シリアル・インターフェース通信線などのネットワーク130を介して接続し、疎通結果の情報を受信したり、疎通確認の指示を送信したりする。システム100の各種機能部と通信手段36との間ではI/O部37がデータのバッファリングや各種仲介処理を実行している。
続いて、前記システム100が例えばプログラム102に基づき構成・保持する機能部につき説明を行う。なお、前記システム100は、監視エージェント120と監視対象機器130との間の疎通経路パターンと、前記疎通経路において発生が想定される障害パターンとを対応付けて格納した障害情報データベース16を備えるものとする。なお、前記疎通経路パターンは、監視エージェント120と監視対象機器130との間の全ての疎通経路パターンであることが好ましい。
システム100は、監視エージェントから収集した疎通確認結果を、前記障害情報データベース16における疎通経路パターンに照合し、疎通確認結果と疎通経路パターンとを対応づけた経路監視情報テーブル17を生成する、ネットワーク監視部12を備える。
なお、前記ネットワーク監視部12が、前記監視エージェント110に対して、監視対象機器120との疎通確認の実行を指示することとすれば好適である。
また、システム100は、前記経路監視情報テーブル17を前記障害情報データベース16に照合して、同一の疎通経路パターンにおいて疎通確認結果と一致する障害パターンを検出し、当該障害パターンに対応する障害機器を障害発生機器として特定する、障害判定部13を備える。
なお、前記障害判定部13は、同一の疎通経路パターンにおいて疎通確認結果と一致する障害パターンが検出できない場合、前記障害情報データベース16と経路監視情報テーブル17との一致度を算定して当該一致度が所定値以上となった障害パターンを検出し、当該障害パターンに対応する障害機器を障害発生機器候補として特定することとすれば好適である。
また、システム100は、前記監視対象機器120に向けて疎通確認を行なう疎通確認実行部14と、疎通結果の収集処理を行なう経路監視情報収集部15とを備えるものとできる。
また、システム100は、ネットワーク監視開始時に必要な情報を構築する初期設定部11を備えるものとできる。この初期設定部11は、ネットワーク監視開始前に、ネットワーク監視に際し障害機器の特定や経路監視情報テーブル17を作成する処理に必要な初期情報を設定するものである。
前記初期設定部11は、ネットワークシステム上の機器ごとに(監視対象機器だけでなく、その間を介するスイッチやルータ等も含む)、障害時に、各監視エージェント110と通信相手先の監視対象機器120との間において想定される疎通確認の結果をまとめた障害パターンを作成し、各想定障害機器と障害パターンを対応付け、各障害パターンの集合体を図5や図6に示すような障害情報データベース16として保持する処理を行なう。また、全疎通経路パターンである経路監視情報テーブル17の初期情報を作成する。
なお、本実施形態では、単一の機器障害に対する障害パターン作成を想定しているが、複数機器障害時の障害パターンを作成しても良い。また、障害パターンの形式は、テキスト形式やテーブル形式等さまざまな形式を用いてもよいが、本例ではテーブル形式を想定する。
また、前記監視エージェント110は、前記監視対象機器120に向けて疎通確認を行なう疎通確認実行部21と、疎通結果の収集処理を行なう経路監視情報収集部22と、を備えることとする。図1における監視エージェント110たる、サーバB、サーバC、サーバD、サーバE(102〜105)は、通信相手先の監視対象機器120に向けてポーリング等を用いて疎通確認を行なう疎通確認実行部21と、疎通結果の収集処理を行なう経路監視情報収集部22とを備えている。図1ではサーバB(102)の機能構成のみ示しているが、サーバC(103)、サーバD(104)、サーバE(105)も同様の構成を持つものとする。
また、システム100たる監視マネージャは、監視エージェント110と同様、疎通確認実行部及び経路監視情報収集部を備えることも可能であり、図1の例では、、疎通確認実行部14と経路監視情報収集部15を備えることとしている。
なお、これまで示した システム100における各機能部11〜15は、ハードウェアとして実現してもよいし、メモリやHDD(Hard Disk Drive)などの適宜な記憶装置に格納したプログラムとして実現するとしてもよい。この場合、前記CPU34がプログラム実行に合わせて記憶装置より該当プログラムをメモリ33に読み出して、これを実行することとなる。
また、前記ネットワーク130に関しては、インターネット、LANの他、ATM回線や専用回線、WAN(Wide Area Network)、電灯線ネットワーク、無線ネットワーク、公衆回線網、携帯電話網、シリアル・インターフェース通信線など様々なネットワークを採用することも出来る。また、VPN(Virtual Private Network)など仮想専用ネットワーク技術を用いれば、インターネットを採用した際にセキュリティ性を高めた通信が確立され好適である。なお、前記シリアル・インターフェイスは、単一の信号線を用いて1ビットずつ順次データを送るシリアル伝送で、外部機器と接続するためのインターフェースを指し、通信方式としてはRS-232C、RS-422、IrDA、USB、IEEE1394、ファイバ・チャネルなどが想定できる。
−−−経路監視情報の収集及び編集処理−−−
以下、障害経路診断方法の実際手順について、図に基づき説明する。なお、以下で説明する障害経路診断方法に対応する各種動作は、前記システム100がメモリ33に読み出して実行するプログラム32によって実現される。そして、このプログラム32は、以下に説明される各種の動作を行うためのコードから構成されている。
以下に、経路監視情報の収集及び編集の処理手順を説明する。図2は、本実施形態における経路監視情報の収集・編集処理の手順を示すフロー図である。まず、システム100たる監視マネージャにおけるネットワーク監視部12が起動されると、監視マネージャは、各監視エージェント110に対して、経路監視情報収集の信号を送る(ステップ1210)。 前記ネットワーク監視部12は、従来のネットワーク監視方法同様、所定周期で起動するものとしたり、ユーザあるいはシステム管理者がコマンド実行により起動するものとしてもよい。
監視エージェント110であるサーバB(102)、サーバC(103)、サーバD(104)、サーバE(105)は前記信号を受け取ると、疎通確認実行部21を機能させ、通信相手先の監視対象機器120に向けてポーリング等を用いた疎通確認を行なう(ステップ1220)。ここではサーバB(102)での処理を説明するが、サーバC(103)、サーバD(104)、サーバE(105)での処理も同様である。
監視エージェント110における経路監視情報収集部22では、疎通確認の結果を収集する(ステップ1230)。前記ステップ1220とステップ1230の処理は、通信相手先の監視対象機器120の全てに対して実施するまで繰り返すものとする。これにより全疎通経路の疎通確認結果を得ることとなる。
なお、本実施形態で用いる疎通確認の結果とは、ポーリング等を用い通信相手先の監視対象機器120に向けた応答に対して、前記監視対象機器120が返信を返した場合を疎通確認ができたこととし、返信を返さず無応答やタイムアウトとなった場合を疎通確認できないこととする。また、本実施形態では、疎通確認ができた場合の疎通結果を「0」、一方、疎通確認が出来なかった場合の疎通結果を「1」の記号として象徴する。
サーバB(102)の経路監視情報の収集完了を確認後(ステップ1240)、監視マネージャのサーバAは、サーバB(102)の疎通結果、及び同様にサーバC(103)、サーバD(104)、サーバE(105)の疎通結果を収集する(ステップ1250)。
前記サーバAは、収集した疎通結果をまとめ、経路監視情報テーブル17を作成する(ステップ1260)。この経路監視情報テーブル17は、テーブル形式だけでなくテキスト形式等さまざまな形式を用いてもよいが、本実施形態においては、図4や図7に示すようなテーブル形式をもつこととする。以上の処理により、現時点での、ネットワークシステム上の経路監視情報を採取することができる。
−−−経路監視情報から障害判定を行なう処理−−−
図3は、本実施形態における経路監視情報から障害判定を行なう処理手順を示すフロー図である。次に、経路監視情報から障害判定を行なう処理手順を説明する。監視マネージャのサーバAのネットワーク監視部12での処理終了後、障害判定部13が起動する。
この障害判定部13は、各監視エージェント110から採取した経路監視情報から、障害の有無を判定し、障害発生時は、障害機器の絞込みを行なう。まず経路監視情報テーブル17の疎通結果より、障害が発生しているか否かの判定を行なう(ステップ1310)。 経路監視情報テーブル17に疎通確認ができなかった結果である「1」がない場合は(ステップ1310:NO)、システムは正常に稼動していると判定し(ステップ1311)、障害判定部13での処理は終了する。
他方、前記経路監視情報テーブル17に「1」がある場合は、ネットワークシステム上の機器において障害が発生していると判定し(ステップ1310:YES)、次に処理を進める。この場合、前記障害判定部13は、経路監視情報テーブル17に関し、障害情報データベース16の障害パターンと疎通結果が一致するものがあるかどうか逐一チェックをする(ステップ1320)。
この処理において、障害パターンと疎通結果とが一致している場合(ステップ1330:YES)は、一致した障害パターンに対応づけられている想定障害機器において、障害が発生している可能性が高いと判定し(ステップ1331)、この判定結果をシステム管理者に通知する(ステップ1360)。通知方法としては、システム100または所定端末のディスプレイ画面に判定結果を表示したり、或いは所定端末にメール送信したりする。他方、前記判定において、障害パターンと疎通結果とが一致していないとした場合(ステップ1330:NO)、次に処理を進める。
この場合、障害判定部13は、経路監視情報テーブル17と障害情報データベース16の各障害パターンとの疎通結果の一致度を算出する(ステップ1340)。この一致度は障害情報データベース16の障害パターンごとに一つずつ算出する。ここでは、一致度に閾値を設けることとする。障害情報データベース16の各障害パターンで求められた一致度において閾値を超えたものがあれば(ステップ1350:YES)、障害判定部13は障害が発生している可能性が高い機器と判定して(ステップ1352)、この判定結果をシステム管理者に通知する(ステップ1360)。
他方、前記判定において全て閾値以下の場合(ステップ1350:NO)、問題になるほどの障害が発生していないものと判定し(ステップ1351)、システム管理者への通知は行なわずに処理を終了する。
−−−障害判定処理の具体例−−−
続いて、上記の障害判定処理を障害パターン例を用いて具体的に説明する。
図4は、本実施形態における経路監視情報テーブル17の設定内容例1を示す図であり、スイッチSb(107)が障害になった場合の経路監視情報テーブル17の構成例である。この経路監視情報テーブル17では、横軸が各監視エージェント(本障害例では、サーバA(101)を含む)を、縦軸にその監視エージェントが疎通確認を行った通信相手先の監視対象機器を示している。
例えば、サーバB(102)の場合、監視エージェントBが通信している監視対象機器はサーバA(101)、サーバC、サーバD、サーバE(103〜105)の4台であり、各々の通信相手先の監視対象機器へ疎通確認を行なったものとする。
スイッチSb(107)において障害が発生した場合、スイッチSb(107)を経由する、(1)サーバB(102)から監視エージェントC(103)へ、(2)サーバC(103)からサーバB(102)への疎通確認ができない。また、他の経路では、Sb(107)を経由しないため疎通確認ができる。前に述べたように本障害例では、疎通確認ができた通信相手先には応答フラグ「0」を、疎通確認できない通信相手先には無応答フラグ「1」を設定するものとする。
図5及び図6は、本実施形態における障害パターンの設定内容例1を示す図であり、図5はスイッチSb(107)の障害パターン、図6はスイッチSc(108)の障害パターンである。このような、図5、図6に示す障害情報データベース16と、図4に示す経路監視情報テーブル17とを用いて、互いの疎通結果を比較すると、図5に示すSb障害パターンと経路監視情報テーブル17における疎通確認結果とが一致することがわかる。したがって、前記障害判定部13はスイッチSb(107)において障害が発生していると判定する。
図7は、本実施形態における経路監視情報テーブルの設定内容例2を示す図であり、スイッチSc(108)において経路監視情報の不整合障害が発生した場合の経路監視情報テーブルの構成例である。
このような障害の場合、障害機器が機器のダウンまでに至らない等の理由のために、一時的に障害機器経由の疎通確認が可能となり、障害機器を絞り込むための経路情報に整合性が取れなくなる。本障害例では、スイッチSc(108)を経由する(1)サーバD(104)からサーバE(105)へ、(2)サーバE(105)からサーバD(104)へのみ一時的に疎通確認ができるが、他のスイッチSc(108)を経由する経路では、疎通確認ができないものとする。
図5、図6に示す障害情報データベース16において、破線で囲っている部分が、スイッチSc(108)の経路監視情報の不整合障害時に得られた経路監視情報テーブル17と障害パターンの疎通結果フラグの設定が一致している部分である。本例では、結果の一致数(図5、図6の破線で囲っている分のセルの数)を経路監視組み合わせ数で割ることにより求められた数値を当該障害パターンの一致度として定義することができる。この場合、前記一致度は、各々、図5の障害情報データベース16に対応するものが30%、図6の障害情報データベース16に対応するものが90%となる。
これにより、図7に示した経路監視情報テーブル17は、図6の障害パターンであるスイッチSc(108)障害パターンとの一致度が最も高いことが分かり、障害判定部13は、スイッチSc(108)が障害である可能性が高いと判定し、判定結果をシステム管理者に通知することとなる。
本発明によれば、監視マネージャが直接検知しえない監視エージェント間の経路を含めたネットワーク経路の監視を行なうことが可能になる。これにより、ネットワークにおいてほぼ漏れなく障害機器を検知することができる。
また障害機器を絞りこむための経路情報の整合性がとれないような複雑な障害の場合でも、障害パターンとの一致度を比較することにより効率的に障害機器を推定し検知することが出来る。このため、実際に機器がダウンする前に予防措置を講じることが可能となり、影響範囲を最小限にすることができる。
したがって、障害検出の漏れを無くして障害機器の確実な特定が可能となる。
以上、本発明の実施の形態について、その実施の形態に基づき具体的に説明したが、これに限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能である。
本実施形態における障害経路診断システムを含むネットワーク構成図である。 本実施形態における経路監視情報の収集・編集処理の手順を示すフロー図である。 本実施形態における経路監視情報から障害判定を行なう処理手順を示すフロー図である。 本実施形態における経路監視情報テーブルの設定内容例1を示す図である。 本実施形態における障害パターンの設定内容例1を示す図である。 本実施形態における障害パターンの設定内容例2を示す図である。 本実施形態における経路監視情報テーブルの設定内容例2を示す図である。
符号の説明
11 監視マネージャの初期設定部
12 監視マネージャのネットワーク監視部
13 監視マネージャの障害判定部
14 監視マネージャの疎通確認実行部
15 監視マネージャの経路監視情報収集部
16 障害情報データベース
17 経路監視情報テーブル
21 監視エージェント(サーバB)の疎通確認実行部
22 監視エージェント(サーバB)の経路監視情報収集部
31 プログラムデータベース
32 プログラム
33 メモリ
34 CPU
35 入出力インターフェイス
36 通信手段
37 I/O部
100 障害経路診断システム、システム、監視マネージャ
102 監視エージェント(サーバB)
103 監視エージェント(サーバC)
104 監視エージェント(サーバD)
105 監視エージェント(サーバE)
106 スイッチSa
107 スイッチSb
108 スイッチSc
109 ルータRa
110 監視エージェント
120 監視対象機器
130 ネットワーク

Claims (3)

  1. 複数の監視対象機器とネットワークを介して接続されたサーバ装置であって、
    監視対象機器毎に、監視対象機器相互間の疎通経路パターンと、前記疎通経路において発生が想定される障害パターンとを対応付けて格納した障害情報データベースと、
    経路監視情報収集信号を前記ネットワークを介して前記各監視対象機器に送信し、前記各監視対象機器から疎通確認結果を前記ネットワークを介して収集し、該収集した疎通確認結果を、前記障害情報データベースにおける前記疎通経路パターンに照合し、前記疎通確認結果と前記疎通経路パターンとを対応づけた経路監視情報テーブルを生成し、前記経路監視情報テーブルを前記障害情報データベースに照合して、同一の疎通経路パターンにおいて前記疎通確認結果と一致する前記障害パターンの有無を判定し、前記疎通確認結果と一致する障害パターンを検出できた場合、当該障害パターンに対応する監視対象機器を障害発生機器として特定し、前記疎通確認結果と一致する障害パターンを検出できなかった場合、前記経路監視情報テーブルと前記障害情報データベースにおける各障害パターンとの疎通確認結果の一致度を算出し、該算出した一致度が所定値以上となった障害パターンを検出し、該障害パターンに対応する障害機器を障害発生機器候補として特定する、制御部と、
    を有することを特徴とするサーバ装置
  2. 監視対象機器毎に、監視対象機器相互間の疎通経路パターンと、前記疎通経路において発生が想定される障害パターンとを対応付けて格納した障害情報データベースを備え、複数の監視対象機器とネットワークを介して接続されたサーバ装置が、
    経路監視情報収集信号を前記ネットワークを介して前記各監視対象機器に送信し、
    前記各監視対象機器から疎通確認結果を前記ネットワークを介して収集し、
    収集した疎通確認結果を、前記障害情報データベースにおける前記疎通経路パターンに照合し、前記疎通確認結果と前記疎通経路パターンとを対応づけた経路監視情報テーブルを生成し、
    前記経路監視情報テーブルを前記障害情報データベースに照合して、同一の疎通経路パターンにおいて前記疎通確認結果と一致する前記障害パターンの有無を判定し、前記疎通確認結果と一致する障害パターンを検出できた場合、当該障害パターンに対応する監視対象機器を障害発生機器として特定し、前記疎通確認結果と一致する障害パターンを検出できなかった場合、前記経路監視情報テーブルと前記障害情報データベースにおける各障害パターンとの疎通確認結果の一致度を算出し、該算出した一致度が所定値以上となった障害パターンを検出し、該障害パターンに対応する障害機器を障害発生機器候補として特定する、
    ことを特徴とする障害経路診断方法。
  3. 監視対象機器毎に、監視対象機器相互間の疎通経路パターンと、前記疎通経路において発生が想定される障害パターンとを対応付けて格納した障害情報データベースを備え、複数の監視対象機器とネットワークを介して接続されたサーバ装置に、
    経路監視情報収集信号を前記ネットワークを介して前記各監視対象機器に送信する処理と、
    前記各監視対象機器から疎通確認結果を前記ネットワークを介して収集する処理と、
    収集した疎通確認結果を、前記障害情報データベースにおける前記疎通経路パターンに照合し、前記疎通確認結果と前記疎通経路パターンとを対応づけた経路監視情報テーブルを生成する処理と、
    前記経路監視情報テーブルを前記障害情報データベースに照合して、同一の疎通経路パターンにおいて前記疎通確認結果と一致する前記障害パターンの有無を判定し、前記疎通確認結果と一致する障害パターンを検出できた場合、当該障害パターンに対応する監視対象機器を障害発生機器として特定し、前記疎通確認結果と一致する障害パターンを検出できなかった場合、前記経路監視情報テーブルと前記障害情報データベースにおける各障害パターンとの疎通確認結果の一致度を算出し、該算出した一致度が所定値以上となった障害パターンを検出し、該障害パターンに対応する障害機器を障害発生機器候補として特定する処理と、
    を実行させることを特徴とする障害経路診断プログラム。
JP2004377704A 2004-12-27 2004-12-27 サーバ装置、障害経路診断方法、および障害経路診断プログラム Expired - Fee Related JP4485344B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004377704A JP4485344B2 (ja) 2004-12-27 2004-12-27 サーバ装置、障害経路診断方法、および障害経路診断プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004377704A JP4485344B2 (ja) 2004-12-27 2004-12-27 サーバ装置、障害経路診断方法、および障害経路診断プログラム

Publications (2)

Publication Number Publication Date
JP2006186633A JP2006186633A (ja) 2006-07-13
JP4485344B2 true JP4485344B2 (ja) 2010-06-23

Family

ID=36739410

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004377704A Expired - Fee Related JP4485344B2 (ja) 2004-12-27 2004-12-27 サーバ装置、障害経路診断方法、および障害経路診断プログラム

Country Status (1)

Country Link
JP (1) JP4485344B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4536142B2 (ja) 2006-09-15 2010-09-01 富士通株式会社 経路確認方法及び装置
JP5155986B2 (ja) * 2009-10-30 2013-03-06 株式会社エヌ・ティ・ティ・ドコモ 監視システム、監視方法、監視用プログラム
JP6443909B2 (ja) * 2014-04-02 2018-12-26 Necフィールディング株式会社 障害検出装置、障害検出システム、障害検出方法、および、プログラム
JP6997378B2 (ja) * 2018-10-26 2022-01-17 日本電信電話株式会社 推定方法、推定装置及び推定プログラム
JP7440747B2 (ja) * 2020-01-27 2024-02-29 富士通株式会社 情報処理装置、情報処理システムおよびネットワーク疎通確認方法
CN112583640A (zh) * 2020-12-02 2021-03-30 厦门渊亭信息科技有限公司 一种基于知识图谱的服务故障检测方法及装置

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03153140A (ja) * 1989-11-09 1991-07-01 Fujitsu Ltd パターン・ビットマップによる故障判定方式
JPH03262346A (ja) * 1990-03-13 1991-11-22 Nec Corp 障害判定方式
JPH05260050A (ja) * 1992-03-13 1993-10-08 Hitachi Ltd 網障害診断システム
JPH08223251A (ja) * 1995-02-08 1996-08-30 Fujitsu Ltd 回線品質劣化区間推定方法
JPH08288944A (ja) * 1995-04-18 1996-11-01 Hitachi Ltd 通信設備管理システム
JPH10164060A (ja) * 1996-11-28 1998-06-19 Fujitsu Ltd データ通信装置における監視方式
JP2000349753A (ja) * 1999-06-03 2000-12-15 Nec Corp 伝送終端装置用の保守装置
JP2001244946A (ja) * 2000-03-01 2001-09-07 Mitsubishi Electric Corp ネットワーク監視装置
JP2001251300A (ja) * 2000-03-08 2001-09-14 Nec Eng Ltd ネットワーク保守方式
JP2001333063A (ja) * 2000-05-24 2001-11-30 Nec Corp ネットワーク管理システム及びそれに用いるアラーム管理方法
JP2004208235A (ja) * 2002-12-26 2004-07-22 Matsushita Electric Ind Co Ltd 遠隔監視制御システム、被監視装置、監視装置、及び装置情報のデータ収集方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03153140A (ja) * 1989-11-09 1991-07-01 Fujitsu Ltd パターン・ビットマップによる故障判定方式
JPH03262346A (ja) * 1990-03-13 1991-11-22 Nec Corp 障害判定方式
JPH05260050A (ja) * 1992-03-13 1993-10-08 Hitachi Ltd 網障害診断システム
JPH08223251A (ja) * 1995-02-08 1996-08-30 Fujitsu Ltd 回線品質劣化区間推定方法
JPH08288944A (ja) * 1995-04-18 1996-11-01 Hitachi Ltd 通信設備管理システム
JPH10164060A (ja) * 1996-11-28 1998-06-19 Fujitsu Ltd データ通信装置における監視方式
JP2000349753A (ja) * 1999-06-03 2000-12-15 Nec Corp 伝送終端装置用の保守装置
JP2001244946A (ja) * 2000-03-01 2001-09-07 Mitsubishi Electric Corp ネットワーク監視装置
JP2001251300A (ja) * 2000-03-08 2001-09-14 Nec Eng Ltd ネットワーク保守方式
JP2001333063A (ja) * 2000-05-24 2001-11-30 Nec Corp ネットワーク管理システム及びそれに用いるアラーム管理方法
JP2004208235A (ja) * 2002-12-26 2004-07-22 Matsushita Electric Ind Co Ltd 遠隔監視制御システム、被監視装置、監視装置、及び装置情報のデータ収集方法

Also Published As

Publication number Publication date
JP2006186633A (ja) 2006-07-13

Similar Documents

Publication Publication Date Title
JP4758259B2 (ja) ネットワーク監視装置及び方法
US7281040B1 (en) Diagnostic/remote monitoring by email
CN106789306B (zh) 通信设备软件故障检测收集恢复方法和***
CN103138988B (zh) 网络故障的定位处理方法及装置
JP2013130901A (ja) 監視サーバおよびそれを用いたネットワーク機器復旧システム
JP2021043592A (ja) 情報処理システム
JP4485344B2 (ja) サーバ装置、障害経路診断方法、および障害経路診断プログラム
JP2013206073A (ja) ネットワーク管理システム、ネットワーク管理方法、ネットワーク監視システム、及び、ネットワーク管理プログラム
JPH09205429A (ja) ネットワーク故障診断装置及び故障予測装置並びにその診断及び予測方法
CN113079059A (zh) 网络状态监测方法、装置、电子设备及可读存储介质
JP4775894B2 (ja) 遠隔診断用の仲介装置
JP4668117B2 (ja) ネットワーク管理システムおよび方法
JP2007156869A (ja) アラーム管理装置及びアラーム管理方法
JP2007264907A (ja) 障害通報システム、障害通報方法及び障害通報プログラム
CN109450712A (zh) 一种通信设备的故障检测方法
KR20170127876A (ko) 로그 결함 분석 기반 장애 대응 시스템 및 방법
JP6351076B2 (ja) 保守装置、ネットワークシステム及びその保守方法
JP2016200961A (ja) サーバー障害監視システム
JPH1188471A (ja) 試験方法及び試験装置
JP2018142092A (ja) 稼動確認装置、稼動確認プログラム、稼動確認方法、及び稼動確認システム
CN117155937B (zh) 集群节点故障检测方法、装置、设备及存储介质
JP2005252765A (ja) ネットワーク故障判定装置及びネットワーク保守システム及びネットワーク故障判定方法及びプログラム
CN112636944B (zh) Olt设备脱网智能诊断方法及***
JP3166730B2 (ja) 交換機の自動試験装置および交換機の自動試験方法、並びに記録媒体
JP4413758B2 (ja) 監視装置及びそのプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070216

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090122

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090414

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090612

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100323

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100324

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130402

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140402

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees