JPWO2006117833A1 - 監視シミュレーション装置,方法およびそのプログラム - Google Patents

監視シミュレーション装置,方法およびそのプログラム Download PDF

Info

Publication number
JPWO2006117833A1
JPWO2006117833A1 JP2007514397A JP2007514397A JPWO2006117833A1 JP WO2006117833 A1 JPWO2006117833 A1 JP WO2006117833A1 JP 2007514397 A JP2007514397 A JP 2007514397A JP 2007514397 A JP2007514397 A JP 2007514397A JP WO2006117833 A1 JPWO2006117833 A1 JP WO2006117833A1
Authority
JP
Japan
Prior art keywords
monitoring
information
design data
storage unit
component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007514397A
Other languages
English (en)
Other versions
JP4598065B2 (ja
Inventor
岡田 利司郎
利司郎 岡田
山嵜 利哉
利哉 山嵜
隆男 上原
隆男 上原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JPWO2006117833A1 publication Critical patent/JPWO2006117833A1/ja
Application granted granted Critical
Publication of JP4598065B2 publication Critical patent/JP4598065B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/26Functional testing
    • G06F11/261Functional testing by simulating additional hardware, e.g. fault simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3457Performance evaluation by simulation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Computer And Data Communications (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)
  • Debugging And Monitoring (AREA)

Abstract

設計データ記憶部20は,監視対象のコンピュータシステムを構成する構成要素に関する設計データを記憶する。また,監視条件記憶部21は,監視対象に対する異常検出の監視条件と,監視対象が監視条件に該当する場合に出力すべきエラー情報とを記憶する。構成部品擬似障害設定部11は,設計データ中の各構成要素を,順に一つずつ擬似的に故障させる設定を行う。監視条件チェック部12は,各監視条件について,ネットワーク探査部14により設計データを探査することにより,一つの構成要素が故障状態に設定されている状態で監視条件が成立するか否かを調べ,成立する監視条件に該当するエラー情報をすべて抽出する。その結果に基づき,擬似的に故障させた構成要素と抽出したすべてのエラー情報との対応情報を,監視シミュレーション結果記憶部22に格納する。

Description

本発明は,コンピュータシステムの構成情報を用いて故障箇所と監視のエラーメッセージの関係を得るシミュレーションを行い,網羅的な故障箇所とエラーメッセージとの一覧を作成する監視シミュレーション装置,方法およびそのプログラムに関する。
コンピュータシステムを運用する場合,故障が発生したときにはできるだけ早く故障箇所を発見して復旧させることが求められる。このために,ネットワークシステム中に監視装置を組み込んで,監視ツールを使いシステムの動作状況を監視することが行われている。
監視の方法には,監視地点から対象機器への通信が可能かどうかをPINGコマンドやHTTPなどのプロトコルを使って確認し,故障を発見する方法や,監視装置が対象機器から一定周期で生存通知のメッセージを受信し,一定期間を超えて生存通知メッセージが到着しない場合に故障と判定する方法や,各機器が自己チェックを行い,異常があった場合に通信を使って監視装置に通知する方法など,さまざまな方法がある。これらのエラーメッセージの通知や監視は,ネットワークシステムでは一般にIP通信によって行われているために,故障箇所とエラーメッセージとが必ずしも1対1には対応しない。
すなわち,複数の機器から構成されるコンピュータシステムにおいては,いずれかの機器で障害が発生すると,その障害が発生した機器からばかりではなく,その機器と通信を行っている他の機器などからもエラーメッセージが連鎖的に出力されることがある。そのため,コンピュータシステムの運用管理者がエラーメッセージを見ただけで障害が発生した機器を特定することは,大変難しいものとなっている。
これに対して,発生する複数のエラーの組み合わせと障害が発生した可能性がある機器との対応テーブルを作成し,そのテーブルを用いて発生したエラーの組み合わせから障害が発生した可能性がある機器を推定して出力する技術がある。このような技術としては,例えば,特許文献1に記載されている画像処理システムなどの例がある。
特許文献1に記載されている画像処理システムでは,関連する複数のエラーが発生したときに真のエラーの原因特定を迅速に行うことができるようにするため,あらかじめ複数のエラー状態の組み合わせを示すエラーパターンごとにそれぞれ真のエラーに基づくエラーメッセージが格納された情報テーブルを作成しておき,発生したエラーパターンに対して情報テーブルを検索することにより,該当するエラーメッセージを出力している。
特開2002−139807号公報
しかし,従来の技術では,関連する複数のエラーが発生したときに真のエラー原因を特定する情報を出力するためには,コンピュータシステムの設計者が,特許文献1に示されるような情報テーブルをあらかじめ作成して用意する必要がある。
故障する機器の数やエラーメッセージの種類が比較的少ないシステムでは,人間が上記の情報テーブルをあらかじめ作成することはそれほど困難な作業ではない。しかし,特に,ネットワーク化されたコンピュータシステムでは,システムの監視装置が監視する機器の数が非常に多いのが普通であり,エラーメッセージの数も多く,どの機器が故障するとどのようなエラーメッセージの組み合わせが出力されるかを,設計者がネットワーク図を見て対応づけるのは大変な煩雑さを伴う作業であった。また,人手で作成することにより,エラーメッセージの組み合わせに漏れが生じたり,故障箇所の特定情報の設定誤りが生じる可能性が高くなるという問題があった。
また,上記特許文献1の技術では,新たなエラーパターンに対しては,オペレータが,適切なエラーメッセージを情報テーブルにその都度登録する必要がある。したがって,従来の技術は,既知のエラーパターンに対しては真のエラーの原因を迅速に特定することができるが,情報テーブルに登録されていないエラーパターンに対しては真のエラー原因の特定は困難であった。
本発明は,従来上記の情報テーブルの作成を,コンピュータシステムの設計者がコンピュータシステムのネットワーク図を見ながら人手で行っており,情報テーブルの作成作業が大変煩雑であるという問題,人為的なエラーメッセージの設定誤りが生じることがあるという問題を解決し,設計されたコンピュータシステムの構成情報から,網羅的な故障箇所とエラーメッセージとの一覧を自動的に作成する技術を提供することを目的とする。
本発明の監視シミュレーション装置は,上記の課題を解決するため,監視対象を含む複数の構成要素から構成されるコンピュータシステムの監視をシミュレーションするにあたって,コンピュータシステムを構成する各構成要素の接続関係情報を含む設計データを記憶する設計データ記憶部と,監視対象に対する異常検出の監視条件と,監視対象が監視条件に該当するという異常が検出された場合に出力すべきエラー情報とを記憶する監視条件記憶部とを用い,まず,設計データ記憶部に記憶されている各構成要素を,順に一つずつ擬似的に故障させる設定を行う。次に,コンピュータシステムにおける一つの構成要素を擬似的に故障させた状態で,前記監視条件記憶部に記憶された各監視条件が成立するか否かを,設計データに基づいて探査し,監視条件が成立する場合に,その成立する監視条件に該当するエラー情報をすべて抽出する。この結果から,監視シミュレーション結果記憶部に,擬似的に故障させた構成要素と抽出したすべてのエラー情報との対応情報を格納する。
このようにして,監視シミュレーション結果記憶部に,監視対象の網羅的な故障位置とエラー情報との一覧が作成されるので,監視装置は監視時にこれを参照することにより,複数のエラー情報をもとに障害原因の候補を特定することができる。また,故障位置とエラー情報との関係により,監視系を改善することができる。
さらに,上記発明において,設計データ記憶部に記憶された構成要素とコンピュータシステムが行う業務との関係情報と,業務の重要度情報とを用い,コンピュータシステムにおける一つの構成要素を擬似的に故障させた状態で,当該コンピュータシステムが業務を遂行できるか否かを,設計データに基づいて探査し,業務が遂行できないことを検出した場合に,その業務に該当する重要度の情報を抽出する。この重要度の情報を,擬似的に故障させた構成要素と抽出したすべてのエラー情報との対応情報に加えて,監視シミュレーション結果記憶部に格納する。
これにより,監視装置は,監視時にエラーが検出された場合に,その障害の重要度から緊急性を判断し,適切な対応をとるように運用管理者に通知することが可能になる。また,システム設計者は,重要度の情報からコンピュータシステムの信頼性を高めるための設計改善情報を得ることができる。
本発明は,ネットワークシステムの構成情報とシステム監視ツールの監視条件の一覧を組み合わせて,監視シミュレーションを行い,故障位置と監視のエラーメッセージの関係の情報を収集し,網羅的な故障箇所とエラーメッセージとの一覧の作成を自動的に行うので,設計者の作業負担が軽減されるだけでなく,人為的なエラーメッセージの設定誤りや設定漏れをなくし,エラーメッセージから故障箇所を精度よく特定することが可能になる。また,シミュレーションの結果得られた一覧表を逆引きして,監視不能箇所を発見したり,故障箇所の特定ができないエラーメッセージなどの監視の問題点を発見したりすることができるようになる。
本発明の実施の形態による監視シミュレーション装置の構成例を示す図である。 設計されたネットワーク図の例を示す図である。 各部品に付与された管理対象IDの例を示す図である。 機器テーブルの例を示す図である。 関係一覧テーブルの例を示す図である。 業務サーバマトリクスの例を示す図である。 通信マトリクスの例を示す図である。 業務ソフトウェアマトリクスの例を示す図である。 監視条件テーブルの例を示す図である。 設計データから作成されるトポロジデータの例を示す図である。 本実施の形態による監視シミュレーション処理フローチャートである。 監視シミュレーション結果テーブルの例を示す図である。
符号の説明
1 監視シミュレーション装置
2 ネットワーク管理DB
3 ネットワーク設計処理装置
4 監視装置
5 出力装置
10 設計データ入力部
11 構成部品擬似障害設定部
12 監視条件チェック部
13 重要度チェック部
14 ネットワーク探査部
20 設計データ記憶部
21 監視条件記憶部
22 監視シミュレーション結果記憶部
40 エラー発生検出部
41 エラー情報記憶部
42 障害原因特定部
以下,本発明の実施の形態について,図を用いて説明する。
図1は,本発明の実施の形態による監視シミュレーション装置の構成例を示す図である。監視シミュレーション装置1は,設計データ入力部10,構成部品擬似障害設定部11,監視条件チェック部12,重要度チェック部13,ネットワーク探査部14を備える。これらは,CPUおよびメモリ等からなるハードウェアと,ソフトウェアプログラムとからなるコンピュータによって実現される。監視シミュレーション装置1には,ネットワーク管理DB(データベース)2が接続されている。
ネットワーク管理DB2は,設計データ記憶部20,監視条件記憶部21,監視シミュレーション結果記憶部22を備える。
ネットワーク設計処理装置3は,CADによりネットワークシステムを設計し,その設計データを設計データ記憶部20に格納するコンピュータである。
設計データ入力部10は,ネットワーク管理DB2の設計データ記憶部20から設計データを入力し,入力された設計データからそのネットワークシステムを構成する各機器とそれらの接続および内蔵関係を示すトポロジデータを作成する。
構成部品擬似障害設定部11は,設計データ入力部10で作成されたトポロジデータにおいて,設計されたネットワークシステムを構成する各機器を,1つずつ順に擬似的に故障状態に設定する。実際に運用中の機器を故障状態にすることは容易ではないが,設計されたデータ上の機器のステータスを故障状態に設定することは容易である。
監視条件チェック部12は,ネットワーク管理DB2の監視条件記憶部21から監視条件を入力し,構成部品擬似障害設定部11によってある機器が擬似的に故障状態とされたトポロジデータの探査をネットワーク探査部14に依頼し,入力された監視条件の成立をチェックする。チェック結果は,ネットワーク管理DB2の監視シミュレーション結果記憶部22に記憶される。
重要度チェック部13は,構成部品擬似障害設定部11によってある機器が擬似的に故障状態とされたトポロジデータの探査をネットワーク探査部14に依頼し,設計されたネットワークシステムで行われる業務への影響をチェックする。チェック結果は,ネットワーク管理DB2の監視シミュレーション結果記憶部22に記憶される。
ネットワーク探査部14は,監視条件チェック部12,重要度チェック部13からの依頼を受けてネットワークシステムの監視条件に基づく経路探査を行い,発生するエラー事象を検出してその結果を返す。
監視シミュレーション装置1によって得られる監視シミュレーション結果は,ネットワークシステムで発生し得るエラーの識別情報とそのエラーの原因となる機器との対応情報である。エラーの識別情報とは,エラーごとに一意に付与されたエラーコードまたはエラーメッセージである。その監視シミュレーション結果は,ネットワーク管理DB2で管理され,実際に運用されるネットワークシステムの監視に用いられる。
監視装置4は,実際に運用されるネットワークシステムの監視を行う。監視装置4は,エラー発生検出部40,エラー情報記憶部41,障害原因特定部42を備える。これらは,CPUおよびメモリ等からなるハードウェアと,ソフトウェアプログラムとからなるコンピュータ・システムによって実現される。監視装置4には,出力装置5が接続されている。
エラー発生検出部40は,運用中のネットワークシステムで発生する障害を検出し,そのエラー情報をエラー情報記憶部41に記憶する。
障害原因特定部42は,エラー情報記憶部41のエラー情報とネットワーク管理DB2の監視シミュレーション結果記憶部22の監視シミュレーション結果とから,障害の原因となっている機器を特定し,その特定された機器を出力装置5に出力する。
以下,図2〜図12を用いて,本実施の形態をより具体的に説明する。
図2は,設計されたネットワーク図の例を示す図である。ここでは,ネットワーク設計処理装置3によって,図2のネットワーク図のウィンドウ61内に表示されているようなネットワーク図が作成されたものとする。図2に示すネットワーク図において,設計されたネットワークシステムは,FireWall102から外部の端末であるterm128に接続されている。
WWWサーバ111,DBサーバ120は,外部の顧客に対してサービスを行うためのサービス系サーバである。term128は,WWWサーバ111にアクセスすることにより,設計されたネットワークシステムが提供するサービスを受けることができる。
ADMINサーバ123は,ネットワークシステムを構成する各機器の状態のチェックなどの保守管理を行うためのメンテナンス系サーバである。このADMINサーバ123は,例えば図1に示す監視装置4に相当する機能を持つ。
FireWall102,WWWサーバ111,DBサーバ120,ADMINサーバ123には,ネットワークインタフェースカード(101,103,110,112,119,122,124)が装着されている。なお,以下,ネットワークインタフェースカードをNICと記す。
NIC103,NIC110,NIC122は,それぞれLANケーブル104,LANケーブル109,LANケーブル121で,HUB(1)106のポート105,ポート108,ポート107に接続されている。また,NIC112,NIC119,NIC124は,それぞれLANケーブル113,LANケーブル118,LANケーブル125で,HUB(2)115のポート114,ポート117,ポート116に接続されている。
また,WWWサーバ111にはアプリケーションプログラム(以下,単にアプリケーションという)のapl126が,DBサーバ120にはdb−soft127がインストールされている。
さらに,図2のネットワーク図には,サービス用とメンテナンス用の2種類の通信設定が記述されている。図中,破線の矢印はサービス用の通信設定を表しており,2点鎖線の矢印はメンテナンス用の通信設定を表している。
図2のネットワーク図には,サービス用の通信設定として,term128からWWWサーバ111のNIC110への通信設定129,WWWサーバ111のNIC112からDBサーバ120のNIC119への通信設定130が記述されている。
また,図2のネットワーク図には,メンテナンス用の通信設定として,ADMINサーバ123のNIC122から,FireWall102のNIC103,HUB106,WWWサーバ111のNIC110に,それぞれ通信設定131,通信設定132,通信設定133が,ADMINサーバ123のNIC124から,WWWサーバ111のNIC112,HUB115,DBサーバ120のNIC119に,それぞれ通信設定134,通信設定135,通信設定136が,apl126からWWWサーバ111のNIC112を経由してADMINサーバ123のNIC124に通信設定137が記述されている。
ネットワークシステムの設計者は,プロパティ設定を行いたいネットワーク図上の機器または通信の矢印をマウスの右ボタンでクリックし(これを右クリックという),プロパティ設定のウィンドウ62を開く。設計者は,プロパティ設定のウィンドウ62上で,その機器の各属性を設定することができる。属性とは,例えば機器の名称,型格,IPアドレス,バージョン番号,また他の機器との接続関係や内蔵関係を示す情報などである。通信の属性情報の場合には,通信の種類,通信の始点,終点のIPアドレスやプロトコル情報を含む。
各機器および通信の属性情報は,あらかじめネットワーク図に使用する機器および通信の部品ごとに定義しておくことができ,これを部品属性情報として,ネットワーク設計処理装置3が管理する属性ファイル(図示省略)に保持しておくことができる。プロパティ設定のウィンドウ62では,その属性ファイルに事前に定義されていた属性の項目については,属性ファイルから読み出した属性情報がデフォルト値として埋め込まれる。したがって,設計者は,プロパティ設定のウィンドウ62から個々の機器または通信に特有の属性情報だけを入力すればよく,例えばサーバのホスト名やアドレス情報など,必要最小限の属性情報を入力するだけでよい。
図3は,各部品に付与された管理対象IDの例を示す図である。ネットワーク図を構成する各部品には,それぞれを一意に認識することが可能な管理対象IDが付与されている。図3において,楕円の中の数字がその部品に付与された管理対象IDである。これらの管理対象IDは,ネットワーク図に図形要素の部品(オブジェクトという)が張り付けられるときに,ネットワーク設計処理装置3によって自動的に付与される識別子である。
図4は,機器テーブルの例を示す図である。図4の例に示す機器テーブル23は,ネットワーク設計処理装置3によって図2に示すネットワーク図をもとに作成されたネットワークの構成情報を持つテーブルであり,ネットワーク管理DB2中の設計データ記憶部20に格納される。機器テーブル23のレコードは,その機器を一意に識別する「管理対象ID」,その機器の「名称」,「型格」,その機器に割り当てられた「IPアドレス」の項目などからなる。
図5は,関係一覧テーブルの例を示す図である。図5の例に示す関係一覧テーブル24は,図2に示すネットワーク図をもとに作成された機器同士の関係を示す情報のテーブルであり,ネットワーク管理DB2中の設計データ記憶部20に格納される。関係一覧テーブル24は,親となる機器の管理対象IDを示す親ID,子となる機器の管理対象IDを示す子ID,親IDで示された機器と子IDで示された機器との関係の情報などからなる。関係としては,親IDと子IDの機器が接続されていることを示す「接続」,親IDの機器に子IDの機器が内蔵されていることを示す「内蔵」,親IDの機器に子IDのソフトウェアがインストールされていることを示す「インストール」などがあるが,これらをまとめて接続または内蔵関係という。
図6は,業務サーバマトリクスの例を示す図である。図6の例に示す業務サーバマトリクス25は,各業務処理と各サーバとの関連を示す情報であり,ネットワーク管理DB2中の設計データ記憶部20に格納される。図6の業務サーバマトリクス25において,監視業務はメンテナンス系の業務処理であり,業務Aはサービス系の業務処理である。この業務サーバマトリクス25は,ネットワーク図の作成時に入力されたサーバの属性情報をもとに作成される。
各業務処理には,重要度が設定されている。重要度が高い業務処理は,障害発生時などに早急な復旧を必要とする業務処理である。これに対して重要度が低い業務処理は,障害発生時などに緊急の対処を要しない業務処理である。図6の業務サーバマトリクス25の例では,業務Aは重要度が高く設定されており,監視業務は重要度が低く設定されている。
図6の業務サーバマトリクス25から,監視業務に関連するのは,ADMINサーバ123であり,業務Aに関連するのは,WWWサーバ111,DBサーバ120であることがわかる。それぞれ関連するサーバに問題が発生すると,その業務処理に影響を及ぼす。例えば,ADMINサーバ123に問題が発生すると,監視業務に影響を及ぼす。
図7は,通信マトリクスの例を示す図である。図7の例に示す通信マトリクス26は,ネットワーク図上で設定された通信の情報であり,ネットワーク管理DB2中の設計データ記憶部20に格納される。この通信マトリクス26は,ネットワーク図の作成時に入力された通信設定の属性情報をもとに作成される。
図7の例の通信マトリクス26は,特にサービス系のアプリケーションを中心とした通信マトリクス26である。term128とWWWサーバ111+apl126との間の通信は,プロトコルとしてhttpを使用し,図2に示すネットワーク図の通信設定129にあたる。WWWサーバ111+apl126とDBサーバ120+db−soft127との間の通信は,プロトコルとしてsqlを使用し,図2に示すネットワーク図の通信設定130にあたる。なお,ここで“sql”はデータベース検索用のコマンドの総称である。
図7にはサービス系の通信マトリクス26の例のみが記載されているが,ネットワークシステムの保守管理を行うためのメンテナンス系の通信マトリクス26も,別に存在する。ここでは,説明の簡潔化のため図示を省略する。
図8は,業務ソフトウェアマトリクスの例を示す図である。図8の例に示す業務ソフトウェアマトリクス27は,各業務処理と各ソフトウェアとの関連を示す情報であり,ネットワーク管理DB2中の設計データ記憶部20に格納される。この業務ソフトウェアマトリクス27は,ネットワーク図の作成時に入力されたソフトウェアの属性情報をもとに作成される。
図8の業務ソフトウェアマトリクス27から,業務Aにはapl126とdb−soft127との使用が設定されていることがわかる。監視業務に関するソフトウェアについては,まだ設定されていない。
図9は,監視条件テーブルの例を示す図である。図9の例に示す監視条件テーブル28は,あらかじめ作成された図2のネットワーク図に示すネットワークシステムの監視条件のテーブルであり,ネットワーク管理DB2中の監視条件記憶部21に格納される。監視条件テーブル28のレコードは,監視の対象となる機器の「管理対象ID」,監視を行う「監視サーバ」,監視の対象となる機器の名称である「監視対象」,エラーが発生する「条件」,エラーが発生したときの「エラーコード」,「エラーメッセージ」の項目などからなる。なお,図9の監視条件テーブル28の1番下のレコードの条件にある“AP”は,アプリケーションを示す。
例えば,図9の監視条件テーブル28の1番上のレコードは,ADMINサーバ123から管理対象IDが“3”であるNIC103への通信ができない場合に,“E3”のエラーコード,“NIC103 PINGエラー”のエラーメッセージが出力されることを示している。
図9の監視条件テーブル28の各レコードは,上から順に,図2のネットワーク図における通信設定131,通信設定132,通信設定133,通信設定134,通信設定135,通信設定136,通信設定137に対応する。通信設定131,通信設定132,通信設定133,通信設定134,通信設定135,通信設定136については,ADMINサーバ123から各機器へのPINGによる監視を示す。通信設定137は,apl126がDBサーバ120との通信に異常を発見した場合に,apl126がDBサーバ120との間の通信異常をADMINサーバ123に通知することを示す。ADMINサーバ123は,この通信によってDB通信モジュールの異常を知ることができる。
ここで,ネットワーク図の作成時に入力されたメンテナンス通信設定の属性情報から,監視条件テーブル28を作成することも可能である。例えば,図2のネットワーク図において,記述されたメンテナンス通信設定に属性情報として「条件」,「エラーコード」,「エラーメッセージ」などをプロパティで設定しておけば,それらの属性情報から自動的に監視条件テーブル28を作成することが可能である。
監視シミュレーション装置1は,設計データ記憶部20から入力した設計データから作成されたトポロジデータにおいて,ある機器を故障状態に設定してネットワーク探査を行う。このとき,監視条件テーブル28の条件が成立して発行される1または複数のエラーコードを抽出する。抽出された1または複数のエラーコードが,実際に運用されるネットワークシステム上でその機器が故障した場合に発生するエラーコードである。
図10は,設計データから作成されるトポロジデータの例を示す図である。図10のトポロジデータは,図4の機器テーブル23,図5の関係一覧テーブル24などから作成されるものである。図10のトポロジデータにおいて,各機器を示す四角,三角,丸の中の数字は,図4の機器テーブル23の管理対象IDに対応する。なお,図10では,このトポロジデータをわかりやすくするためグラフ化して表示しているが,監視シミュレーション装置1のメモリ内では,各機器のノードとそれらをリンクするポインタの情報からなるデータとしてトポロジデータが保持されることになる。
図10に示すようなトポロジデータにおいて,構成部品擬似障害設定部11が各機器を順に故障状態に設定し,ネットワーク探査部14がネットワークシステムの探査を行い,監視条件チェック部12が監視条件テーブル28の条件成立のチェックを行う。ネットワークシステムの探査を行うとは,例えば監視条件として与えられた監視のための通信が正常に行われるかどうかをトポロジデータをトレースして調べることであり,監視条件が成立するとは,ネットワークの探査により異常が検出されてエラーコードが確定することをいう。
例えば,図10に示すトポロジデータにおいて,管理対象IDが“6”のHUB(1)106を故障状態に設定してネットワークシステムの探査を行うと,監視を行っている装置すなわち管理対象IDが“23”であるADMINサーバ123から,管理対象IDが“6”のHUB(1)106を経由した通信が行えないため,図9の監視条件テーブル28から,“E3”,“E6”,“E10”のエラーコードが抽出される。
また,図10に示すようなトポロジデータにおいて,構成部品擬似障害設定部11が各機器を順に故障状態に設定し,ネットワーク探査部14がネットワークシステムの探査を行い,重要度チェック部13が業務処理への影響のチェックを行う。
例えば,図10に示すトポロジデータにおいて,管理対象IDが“6”のHUB(1)106を故障状態に設定してネットワークシステムの探査を行うと,通信マトリクス26により,term128(管理対象ID=28)とWWWサーバ111のアプリケーションapl126との通信すなわちサービス用の通信設定129が通信不可となることが分かり,業務サーバマトリクス25により,WWWサーバ111は業務Aに関係することが分かるので,業務Aへの影響が検出される。また,図6の業務サーバマトリクス25から,重要度“高い”が抽出される。
図11は,本実施の形態による監視シミュレーション処理フローチャートである。監視シミュレーション装置1において,設計データ入力部10は,設計データ記憶部20から入力された設計データから,ネットワーク構成のトポロジデータを作成する(ステップS10)。
構成部品擬似障害設定部11は,トポロジデータの構成部品を1つ選択し(ステップS11),その選択された構成部品を“故障中”に設定する(ステップS12)。
ネットワーク探査部14は,選択された構成部品が“故障中”に設定されたネットワークを探査し,監視条件チェック部12は,監視条件記憶部21から入力された各監視条件の成立をチェックする(ステップS13)。成立する監視条件があれば(ステップS14),選択された構成部品の監視シミュレーション結果に,監視条件成立によって発生するエラーコードを記録する(ステップS15)。
また,重要度チェック部13は,ネットワーク探査部14による探査結果から,業務処理への影響を検査する(ステップS16)。業務サーバマトリクス25を参照し,業務処理への影響があれば(ステップS17),選択された構成部品の監視シミュレーション結果に,重要度を設定する(ステップS18)。
次に,選択された部品の“故障中”の設定を解除する(ステップS19)。すべての構成部品についてシミュレーションが終了したかを判定し(ステップS20),まだ終了していなければ,すべての構成部品についてシミュレーションが終了するまで,ステップS11〜S20の処理を繰り返す。
図12は,監視シミュレーション結果テーブルの例を示す図である。図12の例の監視シミュレーション結果テーブル29は,図2のネットワーク図に示すネットワークシステムにおいて,監視シミュレーション装置1による監視シミュレーション処理により得られる情報である。監視シミュレーション装置1は,図12に示すような監視シミュレーション結果テーブル29を,ネットワーク管理DB2の監視シミュレーション結果記憶部22に格納する。
図12の例の監視シミュレーション結果テーブル29のレコードは,故障状態が仮定された機器の「管理対象ID」,故障状態が仮定された機器の名称である「異常対象」,その機器の故障状態が仮定されたときに監視シミュレーション処理によって抽出される「エラーコード」,その機器の故障状態が仮定されたときに監視シミュレーション処理によって設定される「重要度」の項目などからなる。
重要度は,異常対象となる機器が業務処理に与える影響の程度が示されている。そのため,異常対象となる機器が業務処理に与える影響がない場合には,重要度は設定されなくてもよい。図12の監視シミュレーション結果テーブル29の例では,すべての機器について重要度が設定されているが,監視シミュレーションの対象となるネットワークシステムに冗長構成があれば,故障しても業務処理に影響を与えない機器が存在することとなる。
以上の監視シミュレーション処理の動作の例を説明する。例えば図11のステップS11において,管理対象ID=7のポート107を選択したとする。構成部品擬似障害設定部11は,図10のトポロジデータ上でポート107を故障中の状態に設定する(ステップS12)。監視条件チェック部12は,監視条件テーブル28中に設定されている各監視条件の通信が可能かどうかの経路の探査をネットワーク探査部14に依頼し,各監視条件の成立をチェックする(ステップS13)。
監視条件テーブル28における管理対象ID=3の監視対象(NIC103−FW)は,ポート107が故障中であるためADMINサーバ123からの通信経路がなく,通信できないという監視条件が成立することになる。したがって,監視条件チェック部12は,監視シミュレーション結果テーブル29におけるポート107(管理対象ID=7)のエラーコードの欄にエラーコードE3を記録する(ステップS15)。ここで,通信経路があるかどうかは,図10に示すトポロジデータにおいて,通信の始点と終点のノードを結ぶ線があるかどうかによって判断される。なお,途中に故障中の機器があると断線として扱われる。また,ADMINサーバ123とWWWサーバ111とDBサーバ120は,IPパケットを中継する機能を持たないので,これらは通信の始点と終点にはなり得るが,通信がこれらを通過して行われることはない。
同様に,監視条件テーブル28における管理対象ID=6の監視対象(HUB(1))は,これもポート107が故障中であるためADMINサーバ123からの通信経路がなく,通信できないという監視条件が成立する。したがって,監視条件チェック部12は,監視シミュレーション結果テーブル29におけるポート107(管理対象ID=7)のエラーコードの欄にエラーコードE6を追記する。管理対象ID=10の監視対象(NIC110−WWW)に対しても通信経路がないため,エラーコードE10のエラーが生じることがわかり,監視シミュレーション結果テーブル29にこのエラーコードE10を追記する。
この結果,監視シミュレーション結果テーブル29におけるポート107(管理対象ID=7)のエラーコードの欄には,E3,E6,E10のエラーコードが格納され,もし,運用中に,実際にポート107が故障すると,エラーコードE3,E6,E10のメッセージが出力されることがわかる。
また,重要度チェック部13は,ポート107(管理対象ID=7)を擬似的に故障中に設定した状態で,業務処理への影響を検査する(ステップS16)。この業務処理への影響の検査は,図7に示す通信マトリクス(アプリケーション)26の通信が可能かどうかをネットワーク探査部14によって探査することによって行う。図10に示すトポロジデータから明らかなように,ポート107が故障してもterm(管理対象ID=28)とWWWサーバのアプリケーションaplとの通信が可能である。また,WWWサーバのアプリケーションaplとDBサーバのソフトウェアdb−softとの通信も支障がない。したがって,業務Aには影響がないことがわかる。一方,ADMINサーバの監視業務は,ポート107の故障によって影響を受けるので,図6に示す業務サーバマトリクス25から,ポート107の故障の重要度は「低い」ということがわかる。この結果から,重要度チェック部13は,監視シミュレーション結果テーブル29におけるポート107(管理対象ID=7)の重要度の欄に「低い」を記録する。
監視シミュレーション装置1は,以上のような故障状態の設定と,ネットワーク探査による監視条件のチェックおよび重要度のチェックを,トポロジデータの各ノード,すなわち図4に示す機器テーブル23の各機器に対して順次行うことにより,図12に示すような監視シミュレーション結果テーブル29の情報を得ることができる。
監視装置4は,監視シミュレーション結果記憶部22に格納された監視シミュレーション結果テーブル29を参照し,実際に運用されているネットワークシステムから発生したエラーコードの組み合わせから障害の原因となっている機器を特定する。図12に示すような監視シミュレーション結果テーブル29があれば,エラーコードの組み合わせから障害の原因となっている機器を絞り込むことができる。また,障害が業務処理に与える影響の程度を知ることができる。エラー情報記憶部41に記憶されたエラー情報は,障害の原因を特定した後に削除される。または,一定期間ごとにロギングデータとして出力された後,削除される。
すなわち,実際の運用システムにおいて,図2に示すADMINサーバ123が,図9に示す監視条件テーブル28に従って,管理対象ID=3,6,10,12,15,19に対してそれぞれPINGコマンドを発行し,その応答を監視したとする。このとき,例えば管理対象IDが12,15,19の機器からの応答がなく,これらがPINGエラーになったとすると,エラーコードE12,E15,E19がエラー情報として上がる。したがって,監視シミュレーション結果テーブル29のエラーコードの欄から,故障の可能性のある機器が,HUB(2)(管理対象ID=15),ポート116(管理対象ID=16),NIC124−ADMIN(管理対象ID=24),またはLANケーブル(管理対象ID=25)のいずれかである可能性が大きいことが分かる。
これにより,実際に運用されているネットワークシステムに障害が発生しても,その原因となっている機器の特定が容易となるため,ネットワークシステムの早期の復旧が期待できるようになる。また,故障箇所の業務処理に与える影響の程度が分かるため,早急な対応が必要か否かの判断が容易となる。
また,実際にネットワークシステムの構築に入る前に監視シミュレーション結果テーブル29の内容を確認することにより,ネットワークシステム監視の盲点となる部分を洗い出し,ネットワークシステムの変更,メンテナンス通信設定の変更,追加などの対策を検討することも可能である。
例えば,図12の監視シミュレーション結果テーブル29を見ると,term128のエラーが検出できないことが分かる。したがって,ネットワークシステムの運用管理者は,ADMINサーバ123からterm128に定期的にPINGコマンドを発行するなどの対策を検討する必要がある。
また,例えば,NIC112に故障が発生するとapl126がDBサーバ120と通信することができなくなるため,E26が発生するはずである。ところが,図2のネットワーク図において,通信設定137はNIC112経由で設定されているため,NIC112の故障によりADMINサーバ123はE26を検出することができない。したがって,ネットワークシステムの運用管理者は,apl126からNIC110経由でADMINサーバ123に向かう通信設定を検討する必要があることが分かる。
以上の監視シミュレーション装置1が行う処理および監視装置4が行う処理は,コンピュータとソフトウェアプログラムとによって実現することができ,そのプログラムをコンピュータ読み取り可能な記録媒体に記録することも,ネットワークを通して提供することも可能である。
本発明は,ネットワークシステムの構成情報とシステム監視ツールの監視条件の一覧を組み合わせて,故障位置と監視のエラーメッセージの関係を得るシミュレーションを行い,網羅的な故障箇所とエラーメッセージとの一覧の作成を自動的に行い,監視系の改善やエラーメッセージから故障箇所を特定することを可能にする技術である。

Claims (6)

  1. 監視対象を含む複数の構成要素から構成されるコンピュータシステムの監視をシミュレーションする監視シミュレーション装置であって,
    前記コンピュータシステムを構成する各構成要素の接続関係情報を含む設計データを記憶する設計データ記憶部と,
    前記監視対象に対する異常検出の監視条件と,前記監視対象が監視条件に該当するという異常が検出された場合に出力すべきエラー情報とを記憶する監視条件記憶部と,
    前記設計データ記憶部に記憶されている各構成要素を,順に一つずつ擬似的に故障させる設定を行う擬似障害設定部と,
    前記擬似障害設定部によりコンピュータシステムにおける一つの構成要素を擬似的に故障させた状態で,前記監視条件記憶部に記憶された各監視条件が成立するか否かを,前記設計データに基づいて探査し,監視条件が成立する場合に,その成立する監視条件に該当するエラー情報をすべて抽出する監視条件チェック部と,
    前記擬似的に故障させた構成要素と前記抽出したすべてのエラー情報との対応情報を記憶する監視シミュレーション結果記憶部とを備える
    ことを特徴とする監視シミュレーション装置。
  2. 請求項1記載の監視シミュレーション装置において,
    前記設計データ記憶部は,さらに前記構成要素とコンピュータシステムが行う業務との関係情報と,業務の重要度情報とを記憶し,
    前記擬似障害設定部によりコンピュータシステムにおける一つの構成要素を擬似的に故障させた状態で,当該コンピュータシステムが業務を遂行できるか否かを,前記設計データに基づいて探査し,業務が遂行できないことを検出した場合に,その業務に該当する重要度の情報を抽出する重要度チェック部を備え,
    前記監視シミュレーション結果記憶部は,前記擬似的に故障させた構成要素と前記抽出したすべてのエラー情報との対応情報に加えて,前記重要度チェック部が抽出した重要度の情報を記憶する
    ことを特徴とする監視シミュレーション装置。
  3. 監視対象を含む複数の構成要素から構成されるコンピュータシステムの監視を,コンピュータがシミュレーションする監視シミュレーション方法であって,
    前記コンピュータが,
    前記コンピュータシステムを構成する各構成要素の接続関係情報を含む設計データを記憶する設計データ記憶部から設計データを入力する過程と,
    入力した設計データ中の各構成要素を,順に一つずつ擬似的に故障させる設定を行う過程と,
    前記監視対象に対する異常検出の監視条件と,前記監視対象が監視条件に該当するという異常が検出された場合に出力すべきエラー情報とをあらかじめ記憶する監視条件記憶部から,監視条件を読み出す過程と,
    前記コンピュータシステムにおける一つの構成要素を擬似的に故障させた状態で,前記監視条件記憶部から読み出した監視条件が成立するか否かを,前記設計データに基づいて探査し,監視条件が成立する場合に,その成立する監視条件に該当するエラー情報をすべて抽出する過程と,
    前記擬似的に故障させた構成要素と前記抽出したすべてのエラー情報との対応情報を,監視シミュレーション結果記憶部に格納する過程とを有する
    ことを特徴とする監視シミュレーション方法。
  4. 請求項3記載の監視シミュレーション方法において,
    前記設計データを入力する過程では,前記設計データ記憶部からさらに前記構成要素とコンピュータシステムが行う業務との関係情報と,業務の重要度情報とを入力し,
    前記擬似的に故障させる設定を行う過程においてコンピュータシステムにおける一つの構成要素を擬似的に故障させた状態で,当該コンピュータシステムが業務を遂行できるか否かを,前記設計データに基づいて探査し,業務が遂行できないことを検出した場合に,その業務に該当する重要度の情報を抽出する過程と,
    前記監視シミュレーション結果記憶部に,前記擬似的に故障させた構成要素と前記抽出したすべてのエラー情報との対応情報に加えて,前記重要度チェック部が抽出した重要度の情報を格納する過程とを有する
    ことを特徴とする監視シミュレーション方法。
  5. 監視対象を含む複数の構成要素から構成されるコンピュータシステムの監視をシミュレーションする監視シミュレーション方法をコンピュータに実行させるための監視シミュレーションプログラムであって,
    前記コンピュータシステムを構成する各構成要素の接続関係情報を含む設計データを記憶する設計データ記憶部から設計データを入力する処理と,
    入力した設計データ中の各構成要素を,順に一つずつ擬似的に故障させる設定を行う処理と,
    前記監視対象に対する異常検出の監視条件と,前記監視対象が監視条件に該当するという異常が検出された場合に出力すべきエラー情報とをあらかじめ記憶する監視条件記憶部から,監視条件を読み出す処理と,
    前記コンピュータシステムにおける一つの構成要素を擬似的に故障させた状態で,前記監視条件記憶部から読み出した監視条件が成立するか否かを,前記設計データに基づいて探査し,監視条件が成立する場合に,その成立する監視条件に該当するエラー情報をすべて抽出する処理と,
    前記擬似的に故障させた構成要素と前記抽出したすべてのエラー情報との対応情報を,監視シミュレーション結果記憶部に格納する処理とを,
    コンピュータに実行させるための監視シミュレーションプログラム。
  6. 請求項5記載の監視シミュレーションプログラムにおいて,
    前記設計データを入力する処理では,前記設計データ記憶部からさらに前記構成要素とコンピュータシステムが行う業務との関係情報と,業務の重要度情報とを入力し,
    前記擬似的に故障させる設定を行う処理においてコンピュータシステムにおける一つの構成要素を擬似的に故障させた状態で,当該コンピュータシステムが業務を遂行できるか否かを,前記設計データに基づいて探査し,業務が遂行できないことを検出した場合に,その業務に該当する重要度の情報を抽出する処理と,
    前記監視シミュレーション結果記憶部に,前記擬似的に故障させた構成要素と前記抽出したすべてのエラー情報との対応情報に加えて,前記重要度チェック部が抽出した重要度の情報を格納する処理とを,
    さらにコンピュータに実行させるための監視シミュレーションプログラム。
JP2007514397A 2005-04-25 2005-04-25 監視シミュレーション装置,方法およびそのプログラム Expired - Fee Related JP4598065B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2005/007773 WO2006117833A1 (ja) 2005-04-25 2005-04-25 監視シミュレーション装置,方法およびそのプログラム

Publications (2)

Publication Number Publication Date
JPWO2006117833A1 true JPWO2006117833A1 (ja) 2008-12-18
JP4598065B2 JP4598065B2 (ja) 2010-12-15

Family

ID=37307640

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007514397A Expired - Fee Related JP4598065B2 (ja) 2005-04-25 2005-04-25 監視シミュレーション装置,方法およびそのプログラム

Country Status (5)

Country Link
US (1) US7617086B2 (ja)
JP (1) JP4598065B2 (ja)
AU (1) AU2005331434B2 (ja)
GB (1) GB2440069B (ja)
WO (1) WO2006117833A1 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008011082A (ja) * 2006-06-28 2008-01-17 Fujitsu Ltd ネットワークの冗長方法及びその中位装置と上位装置
US8135990B2 (en) * 2006-08-11 2012-03-13 Opnet Technologies, Inc. Multi-variate network survivability analysis
JP2008269171A (ja) * 2007-04-18 2008-11-06 Hitachi Ltd ストレージシステム、管理サーバ、ストレージシステムのシステム再構成支援方法及び管理サーバのシステム再構成支援方法
JP4648961B2 (ja) * 2008-03-25 2011-03-09 富士通株式会社 装置メンテナンスシステム、方法および情報処理装置
JP2011101140A (ja) * 2009-11-05 2011-05-19 Univ Of Electro-Communications ネットワークエミュレータ装置、ネットワークエミュレータ装置の制御方法、およびプログラム
JP5604905B2 (ja) * 2010-02-22 2014-10-15 富士通株式会社 仮想テープ装置
JP5604989B2 (ja) * 2010-05-31 2014-10-15 富士通株式会社 探索装置、探索方法および探索プログラム
US20120209578A1 (en) * 2011-02-16 2012-08-16 David Victor Stevens Method and system for simulating a monitoring system
WO2013018202A1 (ja) * 2011-08-02 2013-02-07 富士通株式会社 データ通信装置および制御方法
WO2013111317A1 (ja) * 2012-01-27 2013-08-01 富士通株式会社 情報処理方法、装置及びプログラム
US9606902B2 (en) 2012-07-03 2017-03-28 Hitachi, Ltd. Malfunction influence evaluation system and evaluation method using a propagation flag
US9490995B1 (en) * 2012-11-01 2016-11-08 Juniper Networks, Inc. Simulation system for network devices in a network

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05225104A (ja) * 1992-02-13 1993-09-03 Hitachi Software Eng Co Ltd ネットワーク管理システム
JPH07319930A (ja) * 1994-05-26 1995-12-08 Hitachi Ltd 情報ネットワークの設計支援装置
JP2002223293A (ja) * 2001-01-29 2002-08-09 Hitachi Ltd ネットワーク保守管理方法および装置
JP2004088536A (ja) * 2002-08-28 2004-03-18 Fujitsu Ltd ループ型伝送路の障害監視システム
JP2004312224A (ja) * 2003-04-04 2004-11-04 Meidensha Corp ネットワークシステムの障害発生シミュレーション方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5351247A (en) * 1988-12-30 1994-09-27 Digital Equipment Corporation Adaptive fault identification system
US5001714A (en) * 1989-11-07 1991-03-19 Array Analysis, Inc. Unpredictable fault detection using adaptive inference testing techniques
JPH0566958A (ja) * 1991-09-10 1993-03-19 Nec Corp 情報処理装置の擬似障害試験装置
JP3334174B2 (ja) * 1992-08-27 2002-10-15 富士通株式会社 障害処理検証装置
US5862362A (en) * 1995-10-05 1999-01-19 Microsoft Corporation Network failure simulator
US5867689A (en) * 1996-05-01 1999-02-02 Mci Communications Corporation Method and apparatus for emulating a digital cross-connect switch network using a flexible topology to test MCS network management
US6633782B1 (en) * 1999-02-22 2003-10-14 Fisher-Rosemount Systems, Inc. Diagnostic expert in a process control system
JP2000322284A (ja) * 1999-05-07 2000-11-24 Nec Ibaraki Ltd 疑似多重障害発生装置
US7047176B2 (en) * 2000-05-05 2006-05-16 Fujitsu Limited Method and system for hardware simulation
JP2002139807A (ja) 2000-10-31 2002-05-17 Fuji Photo Film Co Ltd 表示装置、表示方法及び画像処理システム
US20030187967A1 (en) * 2002-03-28 2003-10-02 Compaq Information Method and apparatus to estimate downtime and cost of downtime in an information technology infrastructure
US7334222B2 (en) * 2002-09-11 2008-02-19 International Business Machines Corporation Methods and apparatus for dependency-based impact simulation and vulnerability analysis

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05225104A (ja) * 1992-02-13 1993-09-03 Hitachi Software Eng Co Ltd ネットワーク管理システム
JPH07319930A (ja) * 1994-05-26 1995-12-08 Hitachi Ltd 情報ネットワークの設計支援装置
JP2002223293A (ja) * 2001-01-29 2002-08-09 Hitachi Ltd ネットワーク保守管理方法および装置
JP2004088536A (ja) * 2002-08-28 2004-03-18 Fujitsu Ltd ループ型伝送路の障害監視システム
JP2004312224A (ja) * 2003-04-04 2004-11-04 Meidensha Corp ネットワークシステムの障害発生シミュレーション方法

Also Published As

Publication number Publication date
WO2006117833A1 (ja) 2006-11-09
US20080086295A1 (en) 2008-04-10
AU2005331434A1 (en) 2006-11-09
GB0720877D0 (en) 2007-12-05
AU2005331434B2 (en) 2009-11-26
JP4598065B2 (ja) 2010-12-15
GB2440069B (en) 2010-01-27
US7617086B2 (en) 2009-11-10
GB2440069A (en) 2008-01-16

Similar Documents

Publication Publication Date Title
JP4598065B2 (ja) 監視シミュレーション装置,方法およびそのプログラム
JP5684946B2 (ja) イベントの根本原因の解析を支援する方法及びシステム
JP5745077B2 (ja) 根本原因を解析する管理計算機及び方法
US7664986B2 (en) System and method for determining fault isolation in an enterprise computing system
JP5542398B2 (ja) 障害の根本原因解析結果表示方法、装置、及びシステム
JPWO2004061681A1 (ja) 運用管理方法および運用管理サーバ
JP2001188765A (ja) 分散コンピューティング環境で複数の関係する障害を表す障害情報を参照する技法
CN104718533A (zh) 企业设备的强健硬件故障管理***、方法及架构
JP2011197785A (ja) ログ収集システムおよびログ収集プログラム
CN113672456A (zh) 应用平台的模块化自监听方法、***、终端及存储介质
CN110119325A (zh) 服务器故障处理方法、装置、设备及计算机可读存储介质
US9021078B2 (en) Management method and management system
US10558513B2 (en) System management apparatus and system management method
US10938623B2 (en) Computing element failure identification mechanism
JPWO2011051999A1 (ja) 情報処理装置及び情報処理装置の制御方法
CN115686921A (zh) 一种多路径异常检测修复方法、装置、设备及介质
US9354962B1 (en) Memory dump file collection and analysis using analysis server and cloud knowledge base
JP6070040B2 (ja) データベースシステム、データベース装置、データベースの障害回復方法およびプログラム
JP4575020B2 (ja) 障害解析装置
US9372746B2 (en) Methods for identifying silent failures in an application and devices thereof
CN113821412A (zh) 一种设备运维管理方法及装置
JP5938495B2 (ja) 根本原因を解析する管理計算機、方法及び計算機システム
JP7368762B2 (ja) 警報監視システム、警報監視方法、及びプログラム
CN117235107B (zh) 数据访问处理方法、装置、电子设备及存储介质
WO2020261325A1 (ja) 障害切り分けシステム、方法およびプログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100622

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20100820

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20100820

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100921

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100922

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131001

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees