JP3598394B2 - サービス管理方法及び装置 - Google Patents

サービス管理方法及び装置 Download PDF

Info

Publication number
JP3598394B2
JP3598394B2 JP2943697A JP2943697A JP3598394B2 JP 3598394 B2 JP3598394 B2 JP 3598394B2 JP 2943697 A JP2943697 A JP 2943697A JP 2943697 A JP2943697 A JP 2943697A JP 3598394 B2 JP3598394 B2 JP 3598394B2
Authority
JP
Japan
Prior art keywords
service
information
action plan
network device
service component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2943697A
Other languages
English (en)
Other versions
JPH10229396A (ja
Inventor
顕一 池本
正和 馬場
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2943697A priority Critical patent/JP3598394B2/ja
Publication of JPH10229396A publication Critical patent/JPH10229396A/ja
Application granted granted Critical
Publication of JP3598394B2 publication Critical patent/JP3598394B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Computer And Data Communications (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Maintenance And Management Of Digital Transmission (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、サービス管理方法及び装置に係り、特に、ネットワークサービスを効率的に運用するために、ネットワーク機器の適切な使用を行うと共に、ネットワーク機器のトラブル発生に迅速に対処してサービス品質の維持を図り、ユーザへサービス品質の報告を行うサービス管理方法及び装置に関する。
【0002】
【従来の技術】
従来のネットワークサービスの管理方法は、ネットワークに接続されているサーバやクライアントなどに関する機能や性能の諸元などに関する機器情報、負荷の状況や稼働率などに関する性能情報、ネットワーク内の通信状況などに関するトラヒック情報をそれぞれ個別の情報として、別々に表示し、管理を行う人間が、これらの情報を関連付け、総合してサービスの運用状態を判断するという方法が一般的である。
【0003】
また、ネットワーク機器の故障や負荷の収集などによって、前述のサービスが適切に運用できなくなり、ネットワークの構成やサービスの設定を変更する必要が生じた場合には、管理を行う人間が、ネットワーク機器毎に各作業を個別に入力・指示を行い、ユーザへのサービス運用状態の報告などはユーザの問い合わせに応じて調査し、報告している。
【0004】
【発明が解決しようとする課題】
しかしながら、上記の従来のネットワークサービスの管理方法では、ネットワークサービスを管理するために、ネットワークサービスを構成するネットワーク機器の状態をすべて把握し、ネットワークサービスの運用状態を判断する作業を人間が行わなければならず、企業におけるコンピュータネットワークのように多数のネットワーク機器が接続された大規模なネットワークサービスの運用管理は非常に困難である。
【0005】
さらに、ネットワークサービスに何らかのトラブルが生じた場合、トラブルの原因となるネットワーク機器を探索し、復旧作業を1つ1つ人手を介して行わなければならないため、非常に手間がかかる。
また、上記のトラブル発生時に影響を受けているユーザへサービスの状態を報告する仕組みはなく、ユーザの問い合わせが来てからサービスの状態を調査し、報告している。
【0006】
本発明は、上記の点に鑑みなされたもので、ネットワークサービスを構成するネットワーク機器の状態把握のための情報収集を自動的に行い、サービスの運用状態を判断し、サービス運用状態にトラブルが発生した場合には、どの部分がトラブルの原因と考えられるのか、自動的に判断し、対策方法を立案し、影響を受けているユーザへの報告も自動的に行うサービス管理方法及び装置を提供することを目的とする。
【0007】
【課題を解決するための手段】
図1は、本発明の原理を説明するための図である。
本発明は、複数のネットワーク機器が接続されたネットワーク上で動作するネットワークサービスを管理するサービス管理方法において、
ネットワーク機器の過負荷や性能の劣化、機能停止などのトラブルが発生した場合に、
予め設定された時間間隔毎にネットワーク機器のエージェントに対して収集する情報を要求するコマンドを送信し、該ネットワーク機器のエージェントからネットワーク機器情報を取得し、ネットワーク機器情報保存手段に保存する情報収集過程(ステップ1)と、
ネットワーク機器情報保存手段に保存されたネットワーク機器情報について、サービス構成要素情報保存手段に保存されている、ネットワーク機器の接続関係を示すリンク情報、リンク属性、状態判断データ項目、ユーザ情報を含むサービス構成要素情報からなるサービス構成要素の状態を判断するためのサービス構成要素情報を参照し、サービスを提供する上で必要となるサービス構成要素の役割を果たしているかの判断を行い、判断結果をサービス構成要素状態情報としてサービス構成要素状態情報保存手段に保存するサービス構成要素状態判断過程(ステップ2)と、
サービス構成要素状態情報保存手段に保存されているサービス構成要素状態情報と、前記サービス構成情報保存手段に保存されているサービスの状態を判断するための、構成要素、システム制約数、及び制約構成情報からなる情報を参照して、サービスが正常でない場合に、該サービスに影響を与えるユーザの使用するネットワーク機器の影響範囲と影響の度合を判定するサービス状態判断過程(ステップ3)と、
サービス状態判断過程において判断された結果に基づいて、サービスの運用に従った対処方法とアクションプランとしてサービスの運用上優先度の高いアクションプランから順次作成するアクションプラン作成過程(ステップ4)と、
アクションプラン作成過程において作成されたアクションプランを優先度の高いものから管理者に提示し、該管理者によって選択されたアクションプランを実行するアクションプラン実行過程(ステップ5)と、からなる。
【0008】
また、本発明は、サービス構成要素状態判断過程において、サービス構成要素情報保存手段の状態判断データ項目毎に設定された判断指標に基づいて評価を行う。
【0009】
また、本発明は、アクションプラン作成過程において、
通知対象、通知方法、プラン内容として設定された候補の中から選択し、組み合わせ、優先度順を付与したアクションプランを作成する。
【0011】
また、本発明は、アクションプラン実行過程において、当該アクションプランを実行するために必要な通信方法や制御方法を選択し、利用する。
図2は、本発明の原理構成図である。
本発明は、複数のネットワーク機器が接続されたネットワーク上で動作するネットワークサービスを管理するサービス管理装置であって、
サービスを構成しているサービス構成要素の状態を判断するためのサービス構成要素情報として、ネットワーク機器の接続関係を示すリンク情報、リンク属性、状態判断データ項目、ユーザ情報を含むサービス構成要素情報を保存するサービス構成要素情報保存手段20と、
サービス構成要素の状態を判断した評価結果を保持するサービス構成要素状態情報保存手段25と、
サービスの状態を判断するための、構成要素、システム制約数および制約構成要素からなる情報を保持するサービス構成情報保存手段19と、
ネットワーク機器から収集された情報を保存するネットワーク機器情報保存手段21と、
予め設定された時間間隔毎にネットワーク機器のエージェントに対して収集する情報を要求するコマンドを送信し、該ネットワーク機器のエージェントからネットワーク機器情報を取得し、ネットワーク機器情報保存手段21に保存する情報収集手段100と、
ネットワーク機器情報保存手段21のネットワーク機器情報について、サービス構成要素情報保存手段20に保存されているサービス構成要素の状態を判断するための情報を参照し、サービスを提供する上で必要となるサービス構成要素の役割を果たしているかの判断を行い、判断結果をサービス構成要素状態情報としてサービス構成要素状態情報保存手段25に保存するサービス構成要素状態判断手段200と、
サービス構成要素状態情報保存手段25に保存されているサービス構成要素状態情報が正常であるかを、サービス構成情報保存手段19に保存されている情報を参照して、サービスが正常か否かを判定し、正常でない場合に、サービスの利用に影響を受ける、ユーザの使用するネットワーク機器の影響範囲と影響の度合を判定するサービス状態判断手段12と、
サービス状態判断手段12により判断された結果に基づいて、サービスの運用に従った対処方法とアクションプランとしてサービスの運用上優先度の高いアクションプランから順次作成するアクションプラン作成手段15と、
アクションプラン作成手段15により作成されたアクションプランを優先度の高いものから管理者に提示し、該管理者によって選択されたアクションプランを実行するアクションプラン実行手段16と、を有する。
【0012】
また、上記のサービス構成要素状態判断手段は、サービス構成要素情報保存手段の状態判断データ項目毎に設定された判断指標に基づいて評価を行う手段を含む。
【0013】
また、上記のアクションプラン作成手段は、
通知対象、通知方法、プラン内容として設定された候補の中から選択し、組み合わせ、優先度順を付与したアクションプランを作成する手段を有する。
【0015】
また、上記のアクションプラン実行手段400は、
実行したアクションプランの履歴情報を保持するアクションプラン履歴情報保持手段と、
アクションプランの履歴情報を提示するアクションプラン履歴情報提示手段とを含む。
【0016】
上記のように、本発明は、ルータやハブ、クライアントコンピュータ、サーバコンピュータなどのネットワーク機器が接続されたネットワーク上で運用されているネットワークサービスにおいて、ネットワーク機器に何らかのトラブルが発生した場合に、ネットワーク機器から収集した情報に基づいて、サービスの運用状態を判断して、サービスが正常状態でない場合は、ユーザが使用するクライアントコンピュータへの影響を識別して、サービス管理者へ提示すると共に、サービス運用方針に基づいた対処方法をアクションプランとして作成し、優先度の高いプランからサービス管理者に提示する。さらに、サービス管理者が提示されたアクションプランを選択することで自動的にアクションプランを実行するものである。
【0017】
これにより、サービス管理者は容易にサービスの運用状態を判断することが可能となり、正常状態でないサービスに対し、迅速に対処することが可能となる。また、本発明は、サービスの構成情報に基づいてネットワーク機器からサービスに関する情報を収集し、サービスの状態判断を行い、サービス管理者に提示する。これは、従来においては、ネットワークに接続された様々なネットワーク機器を管理するために一般的に用いられているManagement Information Base (MIB)情報を収集する程度であったのに対し、サービス毎にサービスを運用する上でネットワーク機器に要求されるMIB情報以外の性能値まで収集することにより、詳細な状態監視が可能となる。
【0018】
また、サービスの状態監視をネットワーク機器のレベルではなく、複数のネットワーク機器から構成されるサービスのレベルで状態管理を行い、ネットワーク機器のトラブルによりサービスが正常状態でないと判断した場合には、トラブルによってサービスが正常状態ではなくなった影響範囲と影響の度合いを判定する。さらに、トラブルに対する対策をアクションプランとしてサービス運用方針に基づき作成・提示し、サービス管理者は提示されたアクションプランのうち、実行するプランを選択することによって、選択されたアクションプランが自動的に実行される。
【0019】
これは、従来の管理方法では、ネットワーク機器から収集したMIB情報に基づいて、ネットワーク機器の状態変化を監視するのみで、サービスの運用上、どこがトラブルの原因となり、どの部分へどの程度影響しているのか、さらに、どのように対処していくべきかは管理者の知識にまかされていたのに対し、本発明では、サービスの状態監視とアクションプランの作成、実行を行うことにより、管理者の知識のレベルに依存せず、管理者の作業負荷を軽減した迅速なサービス管理が可能である。
【0020】
このように、本発明は、ネットワーク上で運用しているサービスの構成を記述したサービス構成情報に基づいて、サービスを運用していく上で必要な構成要素であるネットワーク機器から情報を収集し、サービスの状態判断を行い、トラブルなどにより、サービスが正常状態でない場合には、トラブルによる影響範囲と影響具合の判定を行い、トラブルに対するアクションプランをサービスの運用方式に基づき作成し、サービス管理者に提示し、サービス管理者が実行したいアクションプランを選択することで、自動的にアクションプランを実行することにより、管理者自身が、サービスの運用していく上で、トラブルを生じているネットワーク機器を調査し、影響範囲を推定し、対策を考え、実行するという作業を軽減し、効率的にサービスの運用管理を行うことができる。
【0021】
【発明の実施の形態】
以下、本発明にかかる実施の形態を図面を参照して説明する。
図3は、本発明のサービス管理システムの構成を示すブロック図である。
同図に示すシステムは、ネットワーク1、当該ネットワーク1に接続されるサービス管理コンピュータ4と多数のネットワーク機器2から構成される。
【0022】
サービス管理コンピュータ4は、ネットワーク機器2によって提供されるサービスを管理するコンピュータであり、管理者5への入出力を提供する入出力制御部6とサービス管理を行うための情報処理を行う情報処理制御部7と、サービス管理を行うための情報を保持する情報保存部8とを有する。管理者5は、サービス管理コンピュータ4を使用する。
【0023】
ネットワーク機器2a〜2nは、ネットワークサービスを提供するために必要となるサーバコンピュータ、クライアントコンピュータ、ハブやルータなどであり、サービス管理コンピュータから要求された情報を返信するエージェント26を持つ。ユーザは、サーバコンピュータ、クライアントコンピュータなどコンピュータ毎に存在する。
【0024】
以下、サービス管理コンピュータ構成を詳細に説明する。
サービス管理コンピュータ4は、入出力制御部6内に、管理者へサービスの状態や対処策を提示する表示部9、管理者からの対処策の選択情報など入力を受け取る入力制御部10とを有する。
さらに、情報処理制御部7内に、情報の収集や処理を行う時間を管理するタイマ部11、サービスの状態を判断するサービス状態判断部12、サービスを構成しているサービス構成要素の状態を判断するサービス構成要素状態判断部13、ネットワーク機器2から情報収集を行うネットワーク機器情報収集部14、サービスの状態から判断してアクションプランを作成するアクションプラン作成部15、作成されたアクションプランを表示部9に提示し、管理者5からの入力制御部10からの入力に基づいて、アクションプランを実行するアクションプラン実行部16、アクションプランを実行する際に用いる通知・制御ツール17とを有する。
【0025】
そして、情報保存部8内にネットワーク機器からの収集した情報を保持するネットワーク機器情報保存部21、サービスを構成しているサービス構成要素の状態を判断するための情報を保持するサービス構成要素情報保存部20、サービス構成要素の状態を判断した評価結果を保持するサービス構成要素状態情報保存部25、サービスの状態を判断するための情報を保持するサービス構成情報保存部19、サービスの状態を判断する際の指針となる情報を保持するサービス運用方針を保持するサービス運用方針情報保存部22、サービス影響状態情報保存部23、サービスの状態から判断して作成されたアクションプランを保持するアクションプラン情報保存部18、実行されたアクションプラン内容を履歴として保存するアクションプラン実行履歴情報保存部24を有する。
【0026】
次に、図3の構成において、複数のネットワーク機器から構成されるネットワークサービスをサービス管理コンピュータ4で管理する場合の全体の動作を図4を参照して説明する。
図4は、本発明の全体の動作の概略を示すフローチャートである。
ステップ100) タイマ部11が時間計測を開始する。
【0027】
ステップ200) ネットワーク機器情報収集部14がタイマ部11の時間経過の通知を受け、ネットワーク機器のエージェントに対して収集する情報を要求するコマンドを送信し、ネットワーク機器のエージェントから要求した情報を含んだ返信を受け、受け取った情報をネットワーク機器情報保存部21に保存する。この処理の詳細を図5を用いて後述する。
【0028】
ステップ300) ネットワーク機器情報保存部21に保存した収集情報とサービス構成要素情報保存部20に保存してあるサービスを構成するサービス構成要素の状態を判断するための情報から、サービス構成要素状態判断部13がネットワーク機器2のサービスを提供する上で必要となるサービス構成要素の役割を果しているかの判断を行う。その判断結果をサービス構成要素状態情報保存部25に保存する。詳細な動作は図6を用いて後述する。
【0029】
ステップ400) サービス構成要素状態情報保存部25に保存したサービス構成要素の状態情報とサービス構成情報保存部19に保存してあるサービスの状態を判断するための情報から、サービス状態判断部12がサービスの状態判断を行う。サービスの状態が正常でない場合、ユーザへの影響分析を行う。それらの判断結果をサービス状態情報、サービス影響状態情報保存部23に保存し、さらに表示部9に渡し、管理者に提示する。詳細な動作は図7を用いて後述する。
【0030】
ステップ500) アクションプラン作成部15は、サービス状態情報、サービス影響状態情報保存部23を監視し、変化があった場合には、サービス運用方針情報保存部22から状態変化したサービスに関するサービス運用方針情報を読み込み、今後の対象方法を示すアクションプランを複数作成し、運用上重要なプランから優先度を付け、アクションプラン情報保存部18に保存する。詳細な動作は図8を用いて後述する。
【0031】
ステップ600) アクションプラン実行部16は、アクションプラン情報保存部18を監視し、変化があった場合には、表示部9に渡し、管理者に提示する。管理者の入力は入力制御部10を介してアクションプラン実行部16が受け取り、通知・制御ツール17を用いて選択されたアクションプランを実行する。実行したアクションプランは、アクションプラン実行履歴情報保存部24に履歴として保存する。詳細な動作は、図9を用いて後述する。
【0032】
図5は、本発明のネットワーク機器情報収集部における情報収集動作のフローチャートである。
ステップ201) ネットワーク機器情報収集部14は、サービス構成要素情報保存部20からネットワーク機器2のサービス構成要素としての役割を果しているか、状態を判断するための、ネットワーク機器情報とその情報の収集間隔の情報を読み込む。
【0033】
ステップ202) タイマ部11からの時間経過の通知を用いて、情報の収集間隔が経過したネットワーク機器情報から、その情報を保持しているネットワーク機器2に対して、情報収集を要求するコマンドを送信する。
ステップ203) 送信されたコマンドをネットワーク機器のエージェントが受け取り、そのエージェントがネットワーク機器2内に保持されている情報から探索、獲得し、サービス管理コンピュータ4に対して要求された情報をのせて返信する。
【0034】
ステップ204) サービス管理コンピュータ4のネットワーク機器情報収集部14がネットワーク機器2から返信されてきた情報を受信する。
ステップ205) ネットワーク機器情報収集部14は、要求した情報を受信情報から抽出し、ネットワーク機器情報保存部21に保存する。
図6は、本発明の構成要素状態判断部の動作のフローチャートである。
処理の詳細な動作を示すフローチャートであり、ステップ300の内容を詳細に記述したもので、ネットワーク機器2から収集した情報に基づいてサービス構成の状態判断を行い、その判断結果を保存する処理の動作である。
【0035】
ステップ301) サービス構成要素状態判断部13は、サービス構成要素情報保存部20からサービス構成要素の状態を判断するための情報を読み込む。
ステップ302) タイマ部11からの時間経過の通知を用いて、サービス構成要素の状態判断を行うために設定された動作間隔が経過したことを確認する。
ステップ303) サービス構成要素の状態判断を1つずつサービス構成要素を選択して行うが、まだ状態判断をしていないサービス構成要素が存在するか判断する。
【0036】
ステップ304) まだ、状態判断していないサービス構成要素を1つ選択する。
ステップ305) サービス構成要素状態判断部13は、選択したサービス構成要素に関係する最新の情報をネットワーク機器情報保存部21から読み込む。
ステップ306) サービス構成要素に関係するネットワーク機器情報の評価を1つずつネットワーク機器情報を選択して行うが、まだ、評価をしていないネットワーク機器情報が存在するか判断する。
【0037】
ステップ307) まだ、評価していないネットワーク機器2を1つ選択し、ステップ301で読み込んでいる情報の中から対応するサービス構成要素の状態判断指標を抽出し、ネットワーク機器情報を評価する。
ステップ308) サービス構成要素に関係するネットワーク機器情報の評価が全て終わった後、それらの評価を総合してサービス構成要素の状態を判断する。
【0038】
ステップ309) 判断結果をサービス構成要素状態情報保存部25に保存する。
図7は、本発明のサービス状態判定部の動作のフローチャートであり、サービス構成要素の状態判断結果の情報に基づいてサービスの状態判断を行い、その判断結果を保存する処理の動作である。
【0039】
ステップ401) サービス状態判断部12は、サービス構成情報保存部19からサービスの状態を判断するための情報を読み込む。
ステップ402) タイマ部11からの時間経過の通知を用いて、サービスの状態判断を行う設定された動作間隔が経過したことを確認する。
ステップ403) サービスの状態判断を1つずつサービスを選択して行うが、まだ、状態判断をしていないサービスが存在するか判断する。
【0040】
ステップ404) まだ、状態判断していないサービスを1つ選択する。
ステップ405) サービス状態判断部12は、選択したサービスを構成するサービス構成要素の状態の最新の情報をサービス構成要素状態保存部25から読み込む。
ステップ406) サービスの状態を判断する。
【0041】
ステップ407) サービスの状態判断結果が正常か、正常でないかを識別する。
ステップ408) サービスの状態が正常でない場合、影響を受けているユーザの判定や影響の度合いの判別などサービスの影響状態判断を行う。
ステップ409) サービスの状態判断結果とサービスが正常でない場合は、サービスの影響状態判断結果をサービス状態情報・サービスの影響状態情報保存部23に保存する。
【0042】
図8は、本発明のアクションプラン作成部の動作のフローチャートであり、サービスの状態判断結果が正常でなかった場合の対処方法であるアクションプランを作成し、そのアクションプランを保存する処理動作である。
ステップ501) アクションプラン作成部15は、サービス状態情報・サービス影響状態情報保存部23に書き込まれる情報を監視する。
【0043】
ステップ502) まだ、アクションプランを作成していない、サービス状態が正常でないサービスがあるかを識別する。
ステップ503) ステップ502で識別したサービス状態が正常でないサービスに関して、アクションプラン作成部15は、サービス状態情報・サービス影響状態情報保存部23から情報を読み込む。
【0044】
ステップ504) アクションプラン作成部15は、ステップ502で識別したサービス状態が正常でないサービスに関する運用方式情報をサービス運用方針情報保存部22から読み込む。
ステップ505) サービスの状態情報・影響情報と運用方針情報からアクションプランを作成し、運用方針に基づいてアクションプランに優先順位を付ける。
【0045】
ステップ506) 作成したアクションプランをアクションプラン情報保存部18に保存する。
図9は、本発明のアクションプラン実行部の動作を示すフローチャートであり、アクションプランが新たに作成された場合に、そのアクションプランを管理者に提示し、管理者がアクションプランを選択することで、選択されたアクションプランが自動的に実行され、その実行されたアクションプランを履歴として保存する。
【0046】
ステップ601) アクションプラン実行部16は、アクションプラン情報保存部18に書き込まれる情報を監視する。
ステップ602) 新たに書き込まれたアクションプランがあるか識別する。
ステップ603) 新たなアクションプランがある場合には、アクションプラン情報保存部18からそのアクションプランを読み込み、表示部9に渡し、管理者5に提示する。
【0047】
ステップ604) さらに、提示したアクションプランに関係する、今までに実行したアクションプランの履歴をアクションプラン実行履歴保存部24から読み込み、表示部9に渡し、管理者5に提示する。
ステップ605) 管理者からの入力が入力制御部10にあるか、一定時間、監視する。
【0048】
ステップ606) 入力制御部10に管理者からアクションプランの選択が判別された場合、選択されたアクションプランをアクションプラン実行部16に通知する。
ステップ607) アクションプラン実行部16は、選択されたアクションプランの内容を解釈し、通知・制御ツール部17を用いて、サービスの利用に影響を受けているユーザへ状態通知やネットワーク機器2の遠隔制御などのアクションプランを実行する。
【0049】
ステップ608) 実行したアクションプランを履歴として残すため、アクションプラン実行履歴情報保存部24に実行したアクションプランを保存する。
【0050】
【実施例】
以下、図面と共に本発明の実施例を説明する。
本例では、複数のネットワーク機器2を用いて構築されたWWWのネットワークサービスを例に説明する。
まず、サービス構成情報とサービス構成要素情報について情報の内容を定義し、WWWのサービス構成例を示し、そのサービス構成をサービス構成情報・サービス構成要素情報の定義で記述した情報を前提として、1つのサービス構成要素にトラブルが発生した際のサービス構成要素の状態判断例と、サービス状態判断例、さらに、サービスの状態を基にしたアクションプラン作成例を示す手順により説明する。
【0051】
ネットワークサービスの状態判断をする際に必要となる、サービス構成情報とサービス構成要素情報を図10に示すER図として定義する。このER図では、サービスは複数の構成要素から構成されていて(1)、それぞれの構成要素はリンク情報によって構成要素間の接続先、リンク属性によって接続関係が決められ(2)、構成要素の接続先、接続関係はサービス毎に保持される(3)。構成要素がコンピュータの場合には、構成要素を使用するユーザが決められる(4)。サービスはその特性によってサービスを運用していく上での構成要素に対する制約が決められ(5)、制約を受ける構成要素名が決められる(6)。
【0052】
それぞれの構成要素は、状態を判断するためのデータ項目を持ち(7)、そのデータは情報収集をすべきデータ項目(9)と収集したデータ項目を評価するための閾値(8)からなる。
サービスの構成としては、図11に示すWWWのネットワークサービスの例を用いる。このサービスは、WWWのサーバは、WWWサーバとWWWサーバの情報を定期的に転送して同一の情報を保持するミラー化したWWWミラーサーバの2台の負荷分散構成になっており、ルータ▲1▼〜ルータ▲4▼の間は、リング状に接続されており、ルータ間の接続が1か所故障しても他の接続をたどって通信を停止することなく続行することができるサービス構成となっている。
【0053】
図11のサービス構成を図10に示すサービス構成情報・サービス構成要素定義を用いると、図12、図13に示す情報として記述される。
図12は、サービス構成の定義を記述したもので、サービス名は“WWWサービス”であり、サービス構成要素は、WWWサーバ、WWWミラーサーバ、ハブ▲1▼〜ハブ▲5▼、ルータ▲1▼〜ルータ▲4▼、クライアント▲1▼〜クライアント▲3▼である。サービス構成から運用上の制約としては、WWWサーバとWWWミラーサーバのどちらかが正常であれば、サービスは提供できるので、システム制約数が1で制約を受ける制約構成要素がWWWサーバとWWWミラーサーバとなる。
【0054】
図13は、構成要素の定義を記述したもので、構成要素としてWWWサーバとルータ▲1▼の定義を示している。WWWサーバの構成要素名は、“WWWサーバ”であり、他の構成要素との接続を示すリンク情報はハブ▲1▼であり、サービス運用上の接続関係の役割を表すリンク属性は、特別な役割はないので、一般であり、WWWサーバの状態を判断するための状態判断データ項目としては、Remote Procedure Call (RPC)を用いて収集するサーバの性能値と性能値に対する閾値、WWWサービスで使用するHyper Text Transfer Protocol(HTTP)を用いて試験する項目と試験項目に対する閾値、Simple Network Management Protocol(SNMP)を用いて収集するネットワーク性能値と当該性能値に対する閾値とする。また、このWWWサーバを使用するユーザをAとする。次にルータ▲1▼については、構成要素名はルータ▲1▼であり、リンク情報は、ルータ▲2▼、ルータ▲4▼、ハブ▲1▼、ハブ▲2▼であり、リンク属性は、リンク情報に対応してルータ▲2▼とはリング構成、ルータ▲4▼とは、リング構成、ハブ▲1▼とは一般、ハブ▲2▼とは一般、状態判断データ項目はSNMP性能値とそれに対する閾値であり、ユーザはユーザが使用するものではないのでなしとする。
【0055】
以降では、上記のサービス運用中にWWWサーバにトラブルが発生した場合を想定し、サービス状態判断方法を図面を参照して説明する。
ネットワーク機器情報収集部14により、構成要素の状態判断データが収集され、サービス構成要素状態判断部13により構成要素の状態判断データを設定された判断指標である閾値を基準に評価し、それぞれの評価結果を総合して構成要素の状態判断を行う。図14は、この状態判断過程を示している。状態判断データとして4つのデータ項目があり、それぞれのデータについて判断指標である閾値を基に評価を行っていて、例えば、状態判断データ項目が必須プロセス状態であるものについては、RPCを用いて収集したプロセスの状態値、ダウンに対し、判断指標はアップとなっているため、状態判断データの評価としては、「故障状態」と評価する。他の状態判断データ項目についても、評価を行い、それぞれのデータ項目毎に評価結果を出す。その評価結果のうち、1つでも『故障状態』と評価した項目があれば、その構成要素はサービス運用への役割を欠くことになるため、WWWサーバの状態を「故障状態」と判断している。
【0056】
サービス状態判断部12により、構成要素の状態判断結果とサービス構成情報を基に、サービスの状態判断とサービス影響判断を行う。図15は、この状態判断過程を示している。WWWサービスのサービス構成に記述されている構成要素に対してそれぞれ状態判断結果を調べ、正常でない状態の構成要素が存在するか調査する。ここでは、WWWサーバが故障状態と判明するので、WWWサーバがWWWサービスに及ぼす影響を分析する。WWWサービスのサービス構成情報内の、制約構成要素にWWWサーバが含まれていることが判明するが、システム制約数が1であるため、WWWサーバが故障してもWWWミラーサーバが正常であれば、サービスは提供できると判断できる。しかし、性能的にはサーバ2台で運用していたものを1台で運用するためサービスの状態が不良になると判断し、サービス状態は不良状態と判断する。また、WWWサーバの接続関係による影響を調べるため、、WWWサーバの構成要素情報内のリンク属性を調査する。ここでは、リンク属性は一般であるため、構成要素の接続関係からサービスの状態に影響を及ぼすことはないと判断する。次に、サービスの状態が正常状態ではないので、正常でない影響範囲を調べる。WWWサーバの故障によって影響の及ぶ範囲は、WWWサーバがサービス構成情報の制約構成要素に含まれることから、サービスを運用する上で必須の構成要素であることが判別し、全てのクライアントに影響を及ぼすことが判明する。
【0057】
サービスが正常でないことが判断されたため、アクションプランを作成することになる。アクションプランの作成方法としては、図16に示すように、誰、何に対して(通知対象)、どのような方法で(通知方法)、どのようなプランを(プラン内容)作成するのか、それぞれ設定された候補の中から選択して、組み合わせる方法をとる。ここでは、電子メールや電子掲示板のサービスが運用されており、電話やファクシミリが使用できることを前提としている。
【0058】
アクションプランとしては、WWWサーバが故障状態にあるので、まず、WWWサーバを修復しなければならないこと、そして状況の報告をユーザにしなければならないこと、また、状況が悪化している場合には、ユーザにサービスの利用を自粛するよう通告しなければならないこと等が考えられ、それらのプランに優先度を付けて以下のようなアクションプランを作成する。
1.WWWサーバのシステム管理者に電話や電子メールで修復依頼:
2.電子掲示板にWWWサービスが不良状態であることを掲示:
3.ユーザに電子メールでWWWサービスが不良状態であることを同報通知:
4.各部署の管理者に電子メールでWWWサービスが不良状態であるので、利用を控えるよう同報通知:
なお、本発明は、上記の実施例に限定されることなく、特許請求の範囲内で種々変更・応用が可能である。
【0059】
【発明の効果】
上述のように、本発明のサービス管理方法及びシステムでは、ネットワーク機器にトラブルが発生した場合、ネットワーク機器から情報を収集し、サービス構成情報に基づいて、サービスの状態判断を行い、該トラブルによるサービスの影響範囲と影響程度を判定し、該トラブルに対する対処方法をサービスの運用方針に基づき、アクションプランとして作成し、管理者に提示し、管理者が実行するアクションプランを選択することにより、選択されたアクションプランを自動的に実行するため、管理者の知識や経験、勘に頼らず、サービスの運用方針に適切に反映した対処を迅速にとることができ、サービスの運用状態を良い状態に保つことができる。
【0060】
また、これにより、管理者の稼働時間の短縮や、サービスを運用していく上で、必要となる設備の適切な配置と構成を可能とし、設備投資コストや、運用コストを大幅に節約できる。
【図面の簡単な説明】
【図1】本発明の原理を説明するための図である。
【図2】本発明の原理構成図である。
【図3】本発明のシステム構成図である。
【図4】本発明の全体の動作の概略を示すフローチャートである。
【図5】本発明のネットワーク機器情報収集部における情報収集動作のフローチャートである。
【図6】本発明の構成要素状態判定部の動作のフローチャートである。
【図7】本発明のサービス状態判断部の動作のフローチャートである。
【図8】本発明のアクションプラン作成部の動作のフローチャートである。
【図9】本発明のアクションプラン実行部の動作のフローチャートである。
【図10】本発明の一実施例のサービス構成情報・サービス構成要素情報を定義したER図である。
【図11】本発明の一実施例のWWWサービスのネットワーク構成を示す図である。
【図12】本発明の一実施例のWWWサービスのサービス構成情報の内容の例を示す図である。
【図13】本発明の一実施例のWWWサービスの構成要素情報の内容の例を示す図である。
【図14】本発明の一実施例のWWWサービスの構成要素の判断の内容の例を示す図である。
【図15】本発明の一実施例のWWWサービスの状態判断の内容の例を示す図である。
【図16】本発明の一実施例のWWWサービスのアクションプラン作成の内容の例を示す図である。
【符号の説明】
1 ネットワーク
2 ネットワーク機器
3 ユーザ
4 サービス管理コンピュータ
5 管理者
6 入出力制御部
7 情報処理制御部
8 情報保存部
9 表示部
10 入力制御部
11 タイマ部
12 サービス状態判断部、サービス状態判断手段
13 サービス構成要素状態判断部、サービス構成要素判断手段
14 ネットワーク機器情報収集部、情報収集手段
15 アクションプラン作成部、アクションプラン作成手段
16 アクションプラン実行部、アクションプラン実行手段
17 通知・制御ツール部
18 アクションプラン情報保存部
19 サービス構成情報保存部、サービス構成情報保存手段
20 サービス構成要素情報保存部、サービス構成要素情報保存手段
21 ネットワーク機器情報保存部、ネットワーク機器情報保存手段
22 サービス運用方針情報保存部
23 サービス状態情報・サービス影響状態情報保存部
24 アクションプラン実行履歴情報保存部
25 サービス構成要素状態情報保存部、サービス構成要素状態情報保存手段
26 エージェント

Claims (8)

  1. 複数のネットワーク機器が接続されたネットワーク上で動作するネットワークサービスを管理するサービス管理方法において、
    前記ネットワーク機器の過負荷や性能の劣化、機能停止などのトラブルが発生した場合に、
    予め設定された時間間隔毎に前記ネットワーク機器のエージェントに対して収集する情報を要求するコマンドを送信し、該ネットワーク機器のエージェントからネットワーク機器情報を取得し、ネットワーク機器情報保存手段に保存する情報収集過程と、
    前記ネットワーク機器情報保存手段に保存された前記ネットワーク機器情報について、サービス構成要素情報保存手段に保存されている、前記ネットワーク機器の接続関係を示すリンク情報、リンク属性、状態判断データ項目、ユーザ情報を含むサービス構成要素情報からなるサービス構成要素の状態を判断するためのサービス構成要素情報を参照し、サービスを提供する上で必要となるサービス構成要素の役割を果たしているかの判断を行い、判断結果をサービス構成要素状態情報としてサービス構成要素状態情報保存手段に保存するサービス構成要素状態判断過程と、
    前記サービス構成要素状態情報保存手段に保存されているサービス構成要素状態情報と、前記サービス構成情報保存手段に保存されているサービスの状態を判断するための、構成要素、システム制約数、及び制約構成情報からなる情報を参照して、サービスが正常でない場合に、該サービスに影響を与えるユーザの使用するネットワーク機器の影響範囲と影響の度合を判定するサービス状態判断過程と、
    前記サービス状態判断過程において判断された結果に基づいて、サービスの運用に従った対処方法とアクションプランとしてサービスの運用上優先度の高いアクションプランから順次作成するアクションプラン作成過程と、
    前記アクションプラン作成過程において作成された前記アクションプランを優先度の高いものから管理者に提示し、該管理者によって選択されたアクションプランを実行するアクションプラン実行過程と、からなることを特徴とするサービス管理方法。
  2. 前記サービス構成要素状態判断過程において、
    前記サービス構成要素情報保存手段の前記状態判断データ項目毎に設定された判断指標に基づいて評価を行う請求項1記載のサービス管理方法。
  3. 前記アクションプラン作成過程において、
    通知対象、通知方法、プラン内容として設定された候補の中から選択し、組み合わせ、優先度順を付与したアクションプランを作成する請求項1記載のサービス管理方法。
  4. 前記アクションプラン実行過程において、
    前記アクションプランを実行するために必要な通信方法や制御方法を選択し、利用する請求項1記載のサービス管理方法。
  5. 複数のネットワーク機器が接続されたネットワーク上で動作するネットワークサービスを管理するサービス管理装置であって、
    サービスを構成しているサービス構成要素の状態を判断するためのサービス構成要素情報として、前記ネットワーク機器の接続関係を示すリンク情報、リンク属性、状態判断データ項目、ユーザ情報を含むサービス構成要素情報を保存するサービス構成要素情報保存手段と、
    サービス構成要素の状態を判断した評価結果を保持するサービス構成要素状態情報保存手段と、
    サービスの状態を判断するための、構成要素、システム制約数及び制約構成要素からなる情報を保存するサービス構成情報保存手段と、
    前記ネットワーク機器から収集された情報を保存するネットワーク機器情報保存手段と、
    予め設定された時間間隔毎に前記ネットワーク機器のエージェントに対して収集する情報を要求するコマンドを送信し、該ネットワーク機器のエージェントからネットワーク機器情報を取得し、前記ネットワーク機器情報保存手段に保存する情報収集手段と、
    前記ネットワーク機器情報保存手段の前記ネットワーク機器情報について、前記サービス構成要素情報保存手段に保存されている前記サービス構成要素の状態を判断するための情報を参照し、サービスを提供する上で必要となるサービス構成要素の役割を果たしているかの判断を行い、判断結果をサービス構成要素状態情報として前記サービス構成要素状態情報保存手段に保存するサービス構成要素状態判断手段と、
    前記サービス構成要素状態情報保存手段に保存されているサービス構成要素状態情報が正常であるかを、前記サービス構成情報保存手段に保存されている情報を参照して、サービスが正常か否かを判定し、正常でない場合に、サービスの利用に影響を受ける、ユーザの使用するネットワーク機器の影響範囲と影響の度合を判定するサービス状態判断手段と、
    前記サービス状態判断手段により判断された結果に基づいて、サービスの運用に従った対処方法とアクションプランとしてサービスの運用上優先度の高いアクションプランから順次作成するアクションプラン作成手段と、
    前記アクションプラン作成手段により作成された前記アクションプランを優先度の高いものから管理者に提示し、該管理者によって選択されたアクションプランを実行するアクションプラン実行手段と、を有することを特徴とするサービス管理装置。
  6. 前記サービス構成要素状態判断手段は、
    前記サービス構成要素情報保存手段の前記状態判断データ項目毎に設定された判断指標に基づいて評価を行う手段を含む請求項5記載のサービス管理装置
  7. 前記アクションプラン作成手段は、
    通知対象、通知方法、プラン内容として設定された候補の中から選択し、組み合わせ、優先度順を付与したアクションプランを作成する手段を有する請求項5記載のサービス管理装置。
  8. 前記アクションプラン実行手段は、
    実行したアクションプランの履歴情報を保持するアクションプラン履歴情報保存手段と、
    前記アクションプランの履歴情報を提示するアクションプラン履歴情報提示手段とを含む請求項記載のサービス管理装置
JP2943697A 1997-02-13 1997-02-13 サービス管理方法及び装置 Expired - Lifetime JP3598394B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2943697A JP3598394B2 (ja) 1997-02-13 1997-02-13 サービス管理方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2943697A JP3598394B2 (ja) 1997-02-13 1997-02-13 サービス管理方法及び装置

Publications (2)

Publication Number Publication Date
JPH10229396A JPH10229396A (ja) 1998-08-25
JP3598394B2 true JP3598394B2 (ja) 2004-12-08

Family

ID=12276094

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2943697A Expired - Lifetime JP3598394B2 (ja) 1997-02-13 1997-02-13 サービス管理方法及び装置

Country Status (1)

Country Link
JP (1) JP3598394B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4240874B2 (ja) 2001-11-09 2009-03-18 日本電気株式会社 情報提供システム、情報端末、情報提供装置、判定装置及びそれらに用いるプログラム並びに情報提供方法
JP4575020B2 (ja) * 2004-04-28 2010-11-04 三菱電機株式会社 障害解析装置
JP2007011823A (ja) * 2005-07-01 2007-01-18 Yokogawa Electric Corp 分散コンピューティング環境における管理システム
JP4872262B2 (ja) 2005-07-27 2012-02-08 日本電気株式会社 管理支援システム、管理支援方法、および管理支援プログラム
KR100868734B1 (ko) * 2006-12-15 2008-11-13 신코엠 주식회사 발진주파수를 가변시킬 수 있는 발진기
WO2009040876A1 (ja) * 2007-09-28 2009-04-02 Fujitsu Limited ネットワーク管理装置及びプログラム
JP5245990B2 (ja) * 2009-03-31 2013-07-24 東京電力株式会社 通信ネットワークにおける提供サービスの管理システムおよびその方法
JP6933295B2 (ja) * 2018-03-30 2021-09-08 日本電気株式会社 運用管理装置、方法及びプログラム
JP7436146B2 (ja) * 2019-02-07 2024-02-21 日本電信電話株式会社 障害情報周知装置及び障害情報周知方法

Also Published As

Publication number Publication date
JPH10229396A (ja) 1998-08-25

Similar Documents

Publication Publication Date Title
US6856942B2 (en) System, method and model for autonomic management of enterprise applications
US7051244B2 (en) Method and apparatus for managing incident reports
US8504679B2 (en) Methods, systems and computer program products for managing execution of information technology (IT) processes
CA2618935C (en) Monitoring and management of distributed information systems
US7028228B1 (en) Method and apparatus for identifying problems in computer networks
CN104699759B (zh) 一种数据库自动化运行维护方法
US8499204B2 (en) Method and apparatus for maintaining the status of objects in computer networks using virtual state machines
KR100322152B1 (ko) 분산컴퓨팅환경에 대한 클라이언트에 기초한 애플리케이션 사용가능도 및 응답 모니터링 및 리포팅
US6363384B1 (en) Expert system process flow
US7296194B1 (en) Method and apparatus for maintaining the status of objects in computer networks using virtual state machines
US7886302B2 (en) System and methods for tracking processing unit usage
EP1103116A1 (en) Systems and methods for monitoring distributed applications using diagnostic information
US6678729B1 (en) Method of monitoring the availability of a messaging and VOIP networking
JP3598394B2 (ja) サービス管理方法及び装置
US7120633B1 (en) Method and system for automated handling of alarms from a fault management system for a telecommunications network
Stevenson Network Management: What it is and what it isn’t
Muller Improving network operations with intelligent agents
AU2005270749B2 (en) Monitoring and management of distributed information systems
JP2001265623A (ja) 監視装置
JP2014137635A (ja) 応答時間監視プログラム、方法および応答時間監視装置
JP2001005795A (ja) 分散システムにおける異常検出方法
Jailani et al. FMS: A computer network fault management system based on the OSI standards
Janhunen Benefits of automation in network monitoring
JP2023179110A (ja) 障害対応支援装置及び方法
WO2001061492A1 (en) Method and apparatus for integrating response time and enterprise management

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20031216

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20031224

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040220

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040629

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040726

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040817

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7426

Effective date: 20040818

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040830

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080924

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080924

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090924

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090924

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100924

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100924

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110924

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120924

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130924

Year of fee payment: 9

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term