JP5514040B2 - Operation management system, operation management method, and operation management apparatus - Google Patents
Operation management system, operation management method, and operation management apparatus Download PDFInfo
- Publication number
- JP5514040B2 JP5514040B2 JP2010182892A JP2010182892A JP5514040B2 JP 5514040 B2 JP5514040 B2 JP 5514040B2 JP 2010182892 A JP2010182892 A JP 2010182892A JP 2010182892 A JP2010182892 A JP 2010182892A JP 5514040 B2 JP5514040 B2 JP 5514040B2
- Authority
- JP
- Japan
- Prior art keywords
- command
- event
- analysis
- operation management
- scenario
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Computer And Data Communications (AREA)
- Debugging And Monitoring (AREA)
Description
本発明は、複数の装置の動作状況を監視して必要な制御指示を行うことによって対象システムの運用保守を行う運用管理システム、運用管理方法及び運用管理装置に関する。 The present invention relates to an operation management system, an operation management method, and an operation management apparatus that perform operation maintenance of a target system by monitoring operation states of a plurality of apparatuses and issuing necessary control instructions.
近年、複数のコンピュータを結合してクラスタを構成することで、コンピュータシステムのスケーラビリティやアベイラビリティを確保する技術が発展している。このような技術により、安価に高性能で高可用なシステムを構築することが可能となる。しかし、大規模なシステムを構築するためには、膨大な数のコンピュータとそれらを結合するための機器とが必要となり,このような多数の装置や機器を保守・運用するために要するコストを抑えることが課題となる。 2. Description of the Related Art In recent years, a technology has been developed that ensures the scalability and availability of a computer system by connecting a plurality of computers to form a cluster. Such a technique makes it possible to construct a high-performance and highly-available system at low cost. However, in order to build a large-scale system, a huge number of computers and devices for connecting them are necessary, and the cost required for maintaining and operating such a large number of devices and devices is suppressed. Is a problem.
これに関する従来技術として、特許文献1には、被制御対象装置で特定のイベントが発生したときの動作を制御局が所定のシーケンスにしたがって自動制御する監視制御システムにおいて、自動制御の不実行を検知してオペレータに通知する技術が開示されている。
As a prior art related to this,
しかしながら、前記従来技術では、個々の被制御対象装置ごとに異なる各種監視情報から制御局がイベントの発生を検知して、被制御対象装置ごとに異なる制御手段を用いて自動制御を行う必要があった。そのため、例えば、新たな装置や機器が追加設置されたり、装置や機器の更新などによって仕様が変更されたりした場合などには、その都度制御局の自動制御の手順を変更しなければならないという課題があった。 However, in the prior art, it is necessary for the control station to detect the occurrence of an event from various types of monitoring information that differs for each controlled device, and to perform automatic control using different control means for each controlled device. It was. Therefore, for example, when a new device or device is additionally installed or the specification is changed by updating the device or device, the automatic control procedure of the control station must be changed each time. was there.
本発明は、前記の課題を解決するためになされたものであり、被制御対象装置として新たな装置や機器が追加設置されたり、装置や機器の更新などによって仕様が変更されたりした場合においても、自動制御の手順の変更が不要な運用管理システム、運用管理方法及び運用管理装置を提供することを目的とする。 The present invention has been made to solve the above-described problem, and even when a new device or device is additionally installed as a device to be controlled, or when specifications are changed by updating the device or device, etc. An object of the present invention is to provide an operation management system, an operation management method, and an operation management apparatus that do not require a change in the procedure of automatic control.
前記の目的を達成するために、本発明の運用管理システムは、それぞれが自装置に関する所定のイベントの発生を通知する自装置固有の形式のイベントメッセージを送信し、受信した自装置固有の形式のコマンドにしたがって自装置の制御を行う1以上の被管理装置と、前記被管理装置から受信した前記イベントメッセージが示すイベント情報を解析して解析結果を生成する手順が記述された解析用シナリオ、前記解析結果についての判断の手順が記述された判断用シナリオ、及び、前記イベント情報の種別ごとに、各前記被管理装置が送信する前記イベントメッセージの形式を示した1以上の個別イベントパターンを記憶する記憶部と、前記被管理装置から前記イベントメッセージを受信したとき、当該イベントメッセージを前記個別イベントパターンと照合することによって、当該イベントメッセージが示すイベント情報を取得し、前記取得したイベント情報に基づいて前記解析用シナリオを実行して前記解析結果を生成する解析部、及び、当該解析結果に基づいて前記判断用シナリオを実行して前記コマンドを送信するかまたはアラートを送信するかを判断する判断部とを備える運用管理装置とがネットワークを介して接続されることを特徴とする。 In order to achieve the above object, each of the operation management systems of the present invention transmits an event message in a format unique to the own device for notifying the occurrence of a predetermined event related to the own device, and in the format unique to the received device . One or more managed devices that control the device according to a command, and an analysis scenario in which a procedure for analyzing event information indicated by the event message received from the managed device and generating an analysis result is described, For each judgment scenario describing a procedure for judging the analysis result and each type of event information, one or more individual event patterns indicating the format of the event message transmitted by each managed device are stored. When the event message is received from the storage unit and the managed device, the event message is received by the individual event. By matching the preparative pattern, obtains the event information the event message indicates, analysis unit to generate the analysis results by executing the analysis scenarios based on the obtained event information, and, on the analysis result An operation management apparatus including a determination unit that executes the determination scenario and determines whether to transmit the command or to transmit an alert is connected via a network.
これにより、被管理装置の種類が増えたり仕様が変更されたりした場合においても、個別イベントパターンのデータを修正するだけで済み、運用管理シナリオの修正が必要なケースを大幅に削減することができる。 As a result, even if the types of managed devices increase or specifications change, it is only necessary to correct the data of individual event patterns, and the cases where the operation management scenario needs to be corrected can be greatly reduced. .
また、本発明の他の運用管理システムは、前記の運用管理システムにおいて、前記記憶部には、前記コマンドの種別ごとに、各前記被管理装置が受信する前記コマンドの形式を示した1以上の個別コマンドパターンがさらに記憶され、前記判断部によって前記コマンドを送信すると判断されたとき、前記個別コマンドパターンを参照することによって、送信先の前記被管理装置に対応する形式の個別コマンドを生成して送信する制御部を備えることを特徴とする。 According to another operation management system of the present invention, in the operation management system, the storage unit includes one or more types of commands received by each managed device for each type of the command. An individual command pattern is further stored, and when it is determined that the command is to be transmitted by the determination unit, an individual command having a format corresponding to the destination managed device is generated by referring to the individual command pattern. A control unit for transmitting is provided .
これにより、被管理装置の種類が増えたり仕様が変更されたりした場合においても、個別イベントパターンのデータを修正するだけで済み、運用管理シナリオの修正が必要なケースを大幅に削減することができる。 As a result, even if the types of managed devices increase or specifications change, it is only necessary to correct the data of individual event patterns, and the cases where the operation management scenario needs to be corrected can be greatly reduced. .
また、本発明の他の運用管理システムは、前記の運用管理システムにおいて、前記解析用シナリオのなかに、新たな形式のコマンドが、そのコマンドを受信したときに実行すべき処理と対応付けられて記述されている場合、前記解析部は、前記運用管理装置が外部から前記新たな形式のコマンドを受信したときに、当該コマンドに対応付けられた前記実行すべき処理を実行することを特徴とする。 Further, according to another operation management system of the present invention, in the operation management system, a command in a new format is associated with a process to be executed when the command is received in the analysis scenario. When described, when the operation management apparatus receives the new format command from the outside, the analysis unit executes the process to be executed associated with the command. .
これにより、運用管理のための新たなコマンドを追加することができ、より効率的に運用管理を実施することが可能となる。 As a result, a new command for operation management can be added, and operation management can be performed more efficiently.
なお、本発明の運用管理方法及び運用管理装置の特徴とその効果とは、前記の内容と重複するので、ここでの説明は割愛する。 Note that the features and effects of the operation management method and operation management apparatus of the present invention are the same as those described above, and will not be described here.
本発明によれば、被制御対象装置として新たな装置や機器が追加設置されたり、装置や機器の更新などによって仕様が変更されたりした場合においても、自動制御の手順の変更が不要な運用管理システム、運用管理方法及び運用管理装置を提供することができる。 According to the present invention, even when a new device or device is additionally installed as a device to be controlled, or when the specification is changed due to an update of the device or device, operation management that does not require a change in the automatic control procedure. A system, an operation management method, and an operation management apparatus can be provided.
以下、本発明を実施するための形態を適宜図面を参照して説明する。
図1は、本発明を適用した運用管理システムの装置構成例を示すブロック図である。図1に示すように、運用管理システム10は、管理者端末3が接続される上位管理装置1と、それぞれが1以上の被管理装置4の監視制御を行う複数の下位管理装置2とを備えて構成される。上位管理装置1と下位管理装置2との間、及び、下位管理装置2と被管理装置4との間は、不図示のネットワークを介して互いに通信可能に接続される。
DESCRIPTION OF EMBODIMENTS Hereinafter, embodiments for carrying out the present invention will be described with reference to the drawings as appropriate.
FIG. 1 is a block diagram showing an apparatus configuration example of an operation management system to which the present invention is applied. As shown in FIG. 1, the operation management system 10 includes a higher-
なお、図1の装置構成例では、上位管理装置1は1台となっているが、複数の上位管理装置1を設置するとともに、その上位にさらに上位管理装置1を設置して多階層の構成としてもよい。
In the example of the apparatus configuration of FIG. 1, the
被管理装置4は、例えば、Webサーバやアプリケーションサーバ等の、ユーザに各種の情報サービスを提供するためのコンピュータである。これらの被管理装置4は、それぞれが自身の装置やサービスの状態、CPU負荷等を監視し、それらの監視結果に基づいて自装置固有の条件で各種のイベントメッセージ(以下、「個別イベント」と言う。)を送信する。この個別イベントは、例えば、「サービスAでエクセプション(想定外の事象)が発生した」、「ノード1で障害が発生した」、「ノード1のCPU使用率は95%です。」といったものである。
The managed
また、被管理装置4は、装置固有のコマンド(以下、「個別コマンド」と言う。)を外部から受信し、それらの個別コマンドにしたがって自身の装置やサービスを制御する。この個別コマンドは、例えば、「サービスAを停止せよ」、「ノード1を切り離せ」といったものである。
Further, the managed
下位管理装置2は、データ通信機能を備えたコンピュータによって構成され、配下の1以上の被管理装置4から送信される個別イベントを受信することによって、それぞれの被管理装置4の動作状況を取得し、所定の運用管理シナリオに基づいて被管理装置4の動作を自動制御したり、上位管理装置1にアラートイベントを送信したり、上位管理装置1からの制御指示のコマンド(以下、「統括コマンド」と言う。)をそれぞれの被管理装置4の個別コマンドに変換して被管理装置4に伝達したりする。
The lower-
上位管理装置1は、ディスプレイやキーボードなどの入出力装置を有する管理者端末3との入出力インタフェース及びデータ通信機能を備えたコンピュータによって構成され、複数の下位管理装置2を介して被管理装置4の全体を統括管理する。
The
上位管理装置1は、下位管理装置2からアラートイベントを受信し、記憶部に記憶された所定の運用管理シナリオに基づいて下位管理装置2に統括コマンドを自動送信したり、管理者端末3に必要な警告通知を表示させたりする。また、管理者から入力される制御指示を所定形式の統括コマンドに変換して下位管理装置2に伝達したり、さらに上位の上位管理装置が存在する場合には、上位管理装置にアラートイベントを送信して上位管理装置からの制御指示を配下の下位管理装置2に伝達したりする。
The
これにより、例えば、上位管理装置1は、管理者からの制御指示にしたがって「CPU使用率が80%以上であれば、サービスA停止」といった、すべての被管理装置4を統括制御するための統括コマンドを発行して被管理装置4の全体を統括管理する。
As a result, for example, the
図2は、運用管理システム10の機能構成例を示すブロック図である。なお、図2には、1台の下位管理装置2についての詳細機能構成を示している。また、上位管理装置1もこれとほぼ同様な構成を有するが図示は省略している。
FIG. 2 is a block diagram illustrating a functional configuration example of the operation management system 10. FIG. 2 shows a detailed functional configuration of one
図2に示すように、下位管理装置2は、フィルタリング・集約部21、キャッシュ部22、解析部23、DB(Database)部24、判断部25、及び制御部26を備えて構成される。これらの各部は、下位管理装置2が備える不図示のCPUが、不図示の記憶部に記憶された所定のプログラムを不図示の主メモリにロードして実行することによって具現化される。
As shown in FIG. 2, the lower-
フィルタリング・集約部21は、被管理装置4から送信される個別イベントと、上位管理装置1から送信される統括コマンドとを、それぞれ受信して、それらの中から対処不要なものを除去するフィルタリング処理と、複数の個別イベントをまとめて1つの集約イベントに変換する集約処理とを実行し、処理結果のイベント及びコマンドをキャッシュ部22に引き渡す。
The filtering / aggregating
このとき、除去すべき個別イベントや統括コマンドの種類を予め記憶部に登録しておくようにしてもよいし、取り込むべき個別イベント及び統括コマンドの種類を予め記憶部に登録しておくようにしてもよい。また、個別イベントや統括コマンドのパラメータ値と所定のしきい値との比較結果によって除去するか取り込むかを判定するようにしてもよい。さらに、受信した個別イベントを後記する個別イベントパターンと照合することによって、受信した個別イベントに該当するイベント情報を生成する機能を、フィルタリング・集約部21にもたせるものとしてもよい。
At this time, the types of individual events and general commands to be removed may be registered in the storage unit in advance, or the individual events and general commands to be captured may be registered in the storage unit in advance. Also good. Further, it may be determined whether to remove or take in according to the comparison result between the parameter value of the individual event or the general command and a predetermined threshold value. Further, the filtering / aggregating
また、個別イベントの集約処理では、例えば、同一種類の個別イベントが短時間で繰り返し受信された場合は、それらを受信回数をパラメータ値としてもつ1つの集約イベントに変換したり、パラメータ値の変化量が比較的小さい複数の個別イベントの中から、それを代表する1つのイベントだけを取り込んだりすることにより、処理対象となるイベントの数を絞り込む。 Also, in the individual event aggregation process, for example, when individual events of the same type are repeatedly received in a short time, they are converted into one aggregate event having the number of receptions as a parameter value, or the amount of change in the parameter value The number of events to be processed is narrowed down by fetching only one event representing the event from a plurality of individual events having a relatively small.
キャッシュ部22は、フィルタリング・集約部21から引き渡されたイベント及びコマンドを、所定期間保持する。この保持する所定期間は、イベントやコマンドの種類に応じて可変にしてもよいし、同一種類の新たなイベントやコマンドによって上書きするようにしてもよい。また、キャッシュ部22は、必要に応じて後記する解析部23から引き渡された解析結果や判断部25から引き渡された判断結果をも所定期間保持する。そして、キャッシュ部22は、解析部23または判断部25からの取得要求を受け付けて、保持しているイベント、コマンド、解析結果、または判断結果を要求元に返送する。
The
DB部24は、必要に応じて解析部23から引き渡された解析結果や判断部25から引き渡された判断結果を、永続的に保持し、解析部23または判断部25からの取得要求を受け付けて、保持している解析結果または判断結果を要求元に返送する。
The
解析部23は、不図示の記憶部に記憶され、運用管理の手順が記述された複数の解析用シナリオ27に基づいて、キャッシュ部22及びDB部24に保持されているイベント、コマンド、解析結果、及び判断結果を取得して装置状態などの解析を行い、解析結果を判断部25に引き渡す。また、解析用シナリオ27に基づいて、今回の解析結果を次回以降の解析や判断に用いるために解析結果をキャッシュ部22に引き渡して所定期間保持させ、あるいは、解析結果をDB部24に引き渡して永続的に保持させる。
The
キャッシュ部22から過去の解析結果の取得が必要となる例としては、過去に行った障害対策と同じ対策を短時間で繰り返さないようにするために、当該対策を指示した解析結果を取得するような場合を挙げることができる。また、DB部24から過去の解析結果の取得が必要となる例としては、被管理装置4の延べの障害発生回数が所定値を超えたらその装置を交換するというような解析を行う場合を挙げることができる。
As an example in which it is necessary to obtain a past analysis result from the
図3は、解析部23によって参照される解析用シナリオ27の例である。図3に例示した解析用シナリオ27aは、被管理装置4のCPU使用率が所定値以上になったらある特定のサービスを停止するように指令するためのシナリオである。
FIG. 3 is an example of an
図3の例のように、解析用シナリオ27には、始め(図の左側)に、解析に使用されるコマンドやイベントなどの定義が記述される。図3の例では、キャッシュ部22から、「CPU使用率が[xx]%以上であれば、[サービスA]停止」([]内は可変の文字列を表す。)というコマンドと、CPU使用率イベントとの2つを取得すべきことが記述されている。これにより、解析部23は、キャッシュ部22に対してこれらの2つに該当するコマンドとイベントとの取得を要求し、該当するものがキャッシュ部22に保持されていれば、キャッシュ部22からその内容が解析部23に返送される。
As in the example of FIG. 3, in the
図3の例のように、解析用シナリオ27では、任意の形式のコマンドの取得が指定できるので、運用管理に利用する新たなコマンドを追加することができる。なお、図3の例では、キャッシュ部22からイベントとコマンドとを取得する場合を示したが、キャッシュ部22またはDB部24から前回の解析結果や判断結果をも合わせて取得するものとしてもよい。
As in the example of FIG. 3, in the
ところで、個別イベントのメッセージ形式は、同種のイベントを通知するものであっても被管理装置4の種類ごとに異なる場合がある。例えば、CPU使用率イベントであれば、図4に例示するようないくつかのパターンが存在する。なお、図内の下線が付された文字列は、イベントのパラメータ値となる可変部分を表している。しかも、これらのパターンは新製品が登場したりソフトウェアのバージョンアップが行われたりしたときに変更される可能性が高い。
By the way, the message format of the individual event may differ depending on the type of the managed
そこで、図4に例示したような複数の異なるメッセージ形式のパターンを個別イベントパターン29として別途不図示の記憶部に登録しておく。この個別イベントパターン29を参照することによって、解析部23は、それぞれのパターンに対応する個別イベントの取得要求をキャッシュ部22に対して発行することができる。
Therefore, a plurality of patterns of different message formats as exemplified in FIG. 4 are separately registered in the storage unit (not shown) as
同じように、個別コマンドの形式も、同種の制御動作を指示するものであっても被管理装置4の種類ごとに異なる場合がある。例えば、サービス停止コマンドであれば、図5に例示するようないくつかのパターンが存在する。なお、図内の下線が付された文字列は、コマンドのパラメータ値となる可変部分を表している。
Similarly, the format of the individual command may differ depending on the type of the managed
そこで、図5に例示したような複数の異なるコマンドパターンを個別コマンドパターン30として別途不図示の記憶部に登録しておく。この個別コマンドパターン30を参照することによって、制御部26は、判断部25から引き渡される判断結果に応じて、それぞれの被管理装置4に適合した個別コマンドを生成して送信することができる。
Therefore, a plurality of different command patterns as illustrated in FIG. 5 are separately registered in a storage unit (not shown) as
再び図3に戻って説明を続ける。解析用シナリオ27には、続いて、取得したコマンドやイベントなどに対して実行すべき処理内容と、最終的に出力する解析結果の仕様とが記述される。図3の例では、キャッシュ部22から取得したCPU使用率イベントのなかから、指定されたしきい値:[xx]以上の値をもつイベントを抽出し、抽出されたイベントと指定された停止サービス名:[サービスA]とから、当該サービスを停止する対象ノード(被管理装置4)と停止サービス名との対として解析結果を出力すべきことが記述されている。
Returning to FIG. 3 again, the description will be continued. In the
また、解析部23は、他の解析用シナリオ27に基づいて、例えば、ある被管理装置4からある特定の個別イベントを単位時間あたりに所定回数以上受信した場合に、その被管理装置4に障害が発生したという解析結果を生成する。このとき、障害発生に至るまでに受信した個別イベントをキャッシュ部22に保持させておくことにより、各個別イベントの受信状況に応じてより詳細な解析結果を得ることが可能となる。これにより、解析部23は、例えば、故障部位や故障の種類などを特定し、故障部位を切り離したり、関連するサービスを停止させたりするような解析結果を出力することができる。
In addition, the
なお、解析部23によって実行される解析処理は、所定の周期で実行するようにしてもよいし、キャッシュ部22に新たなイベント、コマンド、解析結果、または判断結果が保持される都度、実行するようにしてもよい。
The analysis process executed by the
判断部25は、解析結果についての判断の手順が記述された複数の判断用シナリオ28に基づいて、判断結果を制御部26に引き渡して被管理装置4を自動制御するのか、判断結果を上位管理装置1に通知して上位管理装置1からの指示を仰ぐのかの判断を行う。
Based on a plurality of
判断部25は、判断用シナリオ28に基づいて、キャッシュ部22及びDB部24に保持されているイベント、コマンド、解析結果、及び判断結果を取得して判断を行い、判断結果を制御部26に引き渡すか、あるいは、上位管理装置1に判断結果を表すアラートイベントを送信する。また、判断用シナリオ28に基づいて、今回の判断結果を次回以降の解析や判断に用いるために判断結果をキャッシュ部22に引き渡して所定期間保持させ、あるいは、判断結果をDB部24に引き渡して永続的に保持させる。
Based on the
図6は、判断部25によって参照される判断用シナリオ28の例である。図6に例示した判断用シナリオ28aは、被管理装置4のサービスにおいてエクセプション(想定外の事象)が発生したら上位管理装置1にアラートイベントを送信するためのシナリオである。判断用シナリオ28bは、被管理装置4のサービスにおいて所定回数以上の障害が発生したら上位管理装置1にアラートイベントを送信するためのシナリオである。また、判断用シナリオ28cは、被管理装置4の特定のサービスを停止するためのシナリオである。
FIG. 6 is an example of the
このように、判断用シナリオ28には、解析部23から引き渡される解析結果に対応して実行すべき処理内容が記述される。
In this way, the
制御部26は、判断部25から引き渡された判断結果に応じて、個別コマンドパターン30を参照してそれぞれの被管理装置4に適合した個別コマンドを生成して送信する。
The
図7は、被管理装置4を制御するための個別コマンドを自動送信するときの動作例を示すシーケンスチャートである。
FIG. 7 is a sequence chart showing an operation example when an individual command for controlling the managed
被管理装置4から下位管理装置2に個別イベントM1が送信されると、フィルタリング・集約部21は、その個別イベントM1を受信し、不要イベントの除去とイベントの集約とを行い(S1)、その結果として得られる集約イベント等M2をキャッシュ部22に引き渡す。キャッシュ部22は、引き渡された集約イベント等の受信イベントを所定期間保持する(S2)。
When the individual event M1 is transmitted from the managed
他方、上位管理装置1から下位管理装置2に統括コマンド等M3が送信されると、フィルタリング・集約部21は、その統括コマンド等M3を受信し、不要コマンドの除去等を行い(S3)、その結果として得られる統括コマンド等M4をキャッシュ部22に引き渡す。キャッシュ部22は、引き渡された統括コマンド等の受信コマンドを所定期間保持する(S4)。
On the other hand, when the overall command M3 is transmitted from the upper
一方で、解析部23は、キャッシュ部22に対して、所定の周期でそれぞれの解析用シナリオ27の実行に必要なコマンドやイベント等の取得要求M5,M6を発行し(S5)、該当するコマンドやイベント等があればキャッシュ部22から統括コマンド・集約イベント等M7が解析部23に引き渡される。
On the other hand, the
そして、解析部23は、それぞれの解析用シナリオ27に基づいて、キャッシュ部22から引き渡されたコマンド・イベント等の解析を行い、例えば、コマンド送信を指示する解析結果M8を判断部25に引き渡す(S6)。
Then, the
判断部25は、引き渡された解析結果M8に該当する判断用シナリオ28に基づいて、解析結果の判断を行い、例えば、被管理装置4に特定の個別コマンドを送信する判断結果M9を制御部26に引き渡す(S7)。
The
続いて、制御部26は、個別コマンドパターン30を参照して、引き渡された判断結果M9によって指示された制御内容に該当する被管理装置4に適合した個別コマンドM10を生成して当該被管理装置4に送信する(S8)。
Subsequently, the
図8は、被管理装置4に関するアラートイベントを上位管理装置1に送信するときの動作例を示すシーケンスチャートである。
FIG. 8 is a sequence chart illustrating an operation example when an alert event related to the managed
図8において解析部23がコマンド・イベント等を解析するステップS1からS6に至るまでの動作は、前記した図7の動作と基本的に同じであるので説明を省き、ステップS6以降の動作について説明する。
In FIG. 8, the operation from step S1 to step S6 in which the
ここでは、ステップS6において、解析部23は、ある解析用シナリオ27に基づいて、コマンド・イベント等の解析を行った結果、例えば、アラート送信を指示する解析結果M11を判断部25に引き渡したものとする。
Here, in step S6, the
さらに、この解析用シナリオ27には、今回の解析結果をキャッシュ部22とDB部24との双方に保持するよう記述されているので、解析部23は、解析結果M12をキャッシュ部22に引き渡し、解析結果M13をDB部24に引き渡す。
Furthermore, since this
これにより、キャッシュ部22は、引き渡された解析結果M12を所定期間保持し(S10)、DB部24は、引き渡された解析結果M13を永続して保持する(S11)。
Accordingly, the
一方、判断部25は、引き渡された解析結果M11に該当する判断用シナリオ28に基づいて、解析結果の判断を行い、例えば、アラートイベントを生成して上位管理装置1にアラートイベントM14を送信するとともに、アラートイベントM15をキャッシュ部22に引き渡す(S9)。
On the other hand, the
これにより、上位管理装置1は、受信したアラートイベントM14に該当する不図示の運用管理シナリオに基づいて下位管理装置2に制御を指示する統括コマンドを自動送信したり、必要であれば管理者端末3にアラート内容を表示させて管理者から入力される制御指示を統括コマンドに変換して下位管理装置2に伝達したりする。またキャッシュ部22は、引き渡されたアラートイベントM15を所定期間保持する(S12)。これにより、以前に送信したアラートイベントがキャッシュ部22に保持されている所定期間は同様のアラートイベントを送信しないように抑止することが可能となる。
As a result, the
以上説明したように、本発明の運用管理システムでは、監視制御の対象となるそれぞれの被管理装置が自身の状態を通知するためのイベントを発行し、監視制御の主体をなる管理装置が所定の運用管理の手順が記述された運用管理シナリオに基づいて、イベントの解析と対応する処置と決定して自動制御動作を実行する。そのため、管理者に通知されるアラートの頻度を少なくして、管理者の作業効率の向上を図ることができる。 As described above, in the operation management system of the present invention, each managed device to be monitored and controlled issues an event for notifying its own state, and the management device that is the subject of monitoring control has a predetermined Based on the operation management scenario in which the operation management procedure is described, the event analysis and the corresponding action are determined and the automatic control operation is executed. Therefore, it is possible to reduce the frequency of alerts notified to the administrator and improve the work efficiency of the administrator.
また、監視制御の対象となる被管理装置が追加されたり、仕様が変更されたりした場合であっても、それに伴う運用管理シナリオの改変の手間を軽減することができる。 Further, even if a managed device to be monitored and controlled is added or the specification is changed, it is possible to reduce the trouble of modifying the operation management scenario associated therewith.
1 上位管理装置
2 下位管理装置(運用管理装置)
3 管理者端末
4 被管理装置
10 運用管理システム
21 フィルタリング・集約部(イベントメッセージ受信部)
22 キャッシュ部
23 解析部(運用管理シナリオ実行部)
24 DB部
25 判断部(運用管理シナリオ実行部)
26 制御部
27 解析用シナリオ(運用管理シナリオ)
28 判断用シナリオ(運用管理シナリオ)
29 個別イベントパターン
30 個別コマンドパターン
1
3
22
24
26
28 Judgment scenario (operation management scenario)
29
Claims (9)
前記被管理装置から受信した前記イベントメッセージが示すイベント情報を解析して解析結果を生成する手順が記述された解析用シナリオ、前記解析結果についての判断の手順が記述された判断用シナリオ、及び、前記イベント情報の種別ごとに、各前記被管理装置が送信する前記イベントメッセージの形式を示した1以上の個別イベントパターンを記憶する記憶部と、
前記被管理装置から前記イベントメッセージを受信したとき、当該イベントメッセージを前記個別イベントパターンと照合することによって、当該イベントメッセージが示すイベント情報を取得し、前記取得したイベント情報に基づいて前記解析用シナリオを実行して前記解析結果を生成する解析部、及び、当該解析結果に基づいて前記判断用シナリオを実行して前記コマンドを送信するかまたはアラートを送信するかを判断する判断部とを備える運用管理装置と
がネットワークを介して接続されることを特徴とする運用管理システム。 One or more managed devices, each of which transmits an event message in a format specific to the own device for notifying the occurrence of a predetermined event related to the own device, and controls the own device in accordance with the received command in a format specific to the own device;
An analysis scenario describing a procedure for analyzing event information indicated by the event message received from the managed device and generating an analysis result, a determination scenario describing a determination procedure for the analysis result, and For each type of event information, a storage unit that stores one or more individual event patterns indicating the format of the event message transmitted by each managed device;
When the event message is received from the managed device, the event message indicated by the event message is acquired by collating the event message with the individual event pattern, and the analysis scenario is based on the acquired event information. And an analysis unit that generates the analysis result by executing and a determination unit that executes the determination scenario based on the analysis result and determines whether to transmit the command or alert An operation management system characterized in that a management apparatus is connected via a network.
前記記憶部には、前記コマンドの種別ごとに、各前記被管理装置が受信する前記コマンドの形式を示した1以上の個別コマンドパターンがさらに記憶され、
前記判断部によって前記コマンドを送信すると判断されたとき、前記個別コマンドパターンを参照することによって、送信先の前記被管理装置に対応する形式の個別コマンドを生成して送信する制御部を備える
ことを特徴とする運用管理システム。 In the operation management system according to claim 1,
The storage unit further stores one or more individual command patterns indicating the format of the command received by each managed device for each type of the command,
A control unit configured to generate and transmit an individual command in a format corresponding to the transmission destination managed device by referring to the individual command pattern when the determination unit determines to transmit the command. An operation management system characterized by this.
前記解析用シナリオのなかに、新たな形式のコマンドが、そのコマンドを受信したときに実行すべき処理と対応付けられて記述されている場合、
前記解析部は、前記運用管理装置が外部から前記新たな形式のコマンドを受信したときに、当該コマンドに対応付けられた前記実行すべき処理を実行して前記解析結果を生成する
ことを特徴とする運用管理システム。 In the operation management system according to claim 1 or claim 2,
In the analysis scenario, when a command in a new format is described in association with a process to be executed when the command is received,
When the operation management apparatus receives the new format command from the outside, the analysis unit executes the process to be executed associated with the command and generates the analysis result. Operation management system.
前記被管理装置から受信した前記イベントメッセージが示すイベント情報を解析して解析結果を生成する手順が記述された解析用シナリオ、前記解析結果についての判断の手順が記述された判断用シナリオ、及び、前記イベント情報の種別ごとに、各前記被管理装置が送信する前記イベントメッセージの形式を示した1以上の個別イベントパターンを記憶する記憶部と、
前記解析用シナリオを実行する解析部及び前記判断用シナリオを実行する判断部とを備える運用管理装置とが、ネットワークを介して接続された運用管理システムにおける運用管理方法であって、
前記解析部が、前記被管理装置から前記イベントメッセージを受信したとき、当該イベントメッセージを前記個別イベントパターンと照合することによって、当該イベントメッセージが示すイベント情報を取得し、前記取得したイベント情報に基づいて前記解析用シナリオを実行して前記解析結果を出力するステップと、
前記判断部が、前記解析結果に基づいて前記判断用シナリオを実行して前記コマンドを送信するかまたはアラートを送信するかを判断するステップと
を有することを特徴とする運用管理方法。 One or more managed devices, each of which transmits an event message in a format specific to the own device for notifying the occurrence of a predetermined event related to the own device, and controls the own device in accordance with the received command in a format specific to the own device;
An analysis scenario describing a procedure for analyzing event information indicated by the event message received from the managed device and generating an analysis result, a determination scenario describing a determination procedure for the analysis result, and For each type of event information, a storage unit that stores one or more individual event patterns indicating the format of the event message transmitted by each managed device;
An operation management apparatus comprising an analysis unit that executes the analysis scenario and a determination unit that executes the determination scenario is an operation management method in an operation management system connected via a network,
When the analysis unit receives the event message from the managed device, it acquires event information indicated by the event message by comparing the event message with the individual event pattern, and based on the acquired event information Executing the analysis scenario and outputting the analysis result ;
And a step of determining whether the determination unit executes the determination scenario based on the analysis result and transmits the command or an alert. .
前記記憶部には、前記コマンドの種別ごとに、各前記被管理装置が受信する前記コマンドの形式を示した1以上の個別コマンドパターンがさらに記憶されており、
前記判断用シナリオを実行するステップにおいて、前記判断部によって前記コマンドを送信すると判断されたとき、前記個別コマンドパターンを参照することによって、送信先の前記被管理装置に対応する形式の個別コマンドを生成するステップを、
さらに有することを特徴とする運用管理方法。 In the operation management method according to claim 4,
The storage unit further stores one or more individual command patterns indicating the format of the command received by each managed device for each type of the command,
In the step of executing the determination scenario, when the determination unit determines that the command is to be transmitted, an individual command having a format corresponding to the managed device as a transmission destination is generated by referring to the individual command pattern Step to
An operation management method, further comprising:
前記解析用シナリオのなかに、新たな形式のコマンドが、そのコマンドを受信したときに実行すべき処理と対応付けられて記述されている場合、
前記解析部は、前記運用管理装置が外部から前記新たな形式のコマンドを受信したときに、当該コマンドに対応付けられた前記実行すべき処理を実行して前記解析結果を生成する
ことを特徴とする運用管理方法。 In the operation management method according to claim 4 or 5,
In the analysis scenario, when a command in a new format is described in association with a process to be executed when the command is received,
When the operation management apparatus receives the new format command from the outside, the analysis unit executes the process to be executed associated with the command and generates the analysis result. Operation management method to do.
前記被管理装置から受信した前記イベントメッセージが示すイベント情報を解析して解析結果を生成する手順が記述された解析用シナリオ、前記解析結果についての判断の手順が記述された判断用シナリオ、及び、前記イベント情報の種別ごとに、各前記被管理装置が送信する前記イベントメッセージの形式を示した1以上の個別イベントパターンを記憶する記憶部と、
前記被管理装置から前記イベントメッセージを受信したとき、当該イベントメッセージを前記個別イベントパターンと照合することによって、当該イベントメッセージが示すイベント情報を取得し、前記取得したイベント情報に基づいて前記解析用シナリオを実行して前記解析結果を出力する解析部、及び、当該解析結果に基づいて前記判断用シナリオを実行して前記コマンドを送信するかまたはアラートを送信するかを判断する判断部と
を備えることを特徴とする運用管理装置。 From one or more managed devices that each transmit an event message in a format unique to the own device for notifying the occurrence of a predetermined event related to the own device, and control the own device according to the received command in a format unique to the own device. An event message receiver for receiving event messages;
An analysis scenario describing a procedure for analyzing event information indicated by the event message received from the managed device and generating an analysis result, a determination scenario describing a determination procedure for the analysis result, and For each type of event information, a storage unit that stores one or more individual event patterns indicating the format of the event message transmitted by each managed device;
When the event message is received from the managed device, the event message indicated by the event message is acquired by collating the event message with the individual event pattern, and the analysis scenario is based on the acquired event information. And an analysis unit that outputs the analysis result and a determination unit that executes the determination scenario based on the analysis result and determines whether the command is transmitted or the alert is transmitted. An operation management device characterized by this.
前記記憶部には、前記コマンドの種別ごとに、各前記被管理装置が受信する前記コマンドの形式を示した1以上の個別コマンドパターンがさらに記憶され、
前記判断部によって前記コマンドを送信すると判断されたとき、前記個別コマンドパターンを参照することによって、送信先の前記被管理装置に対応する形式の個別コマンドを生成して送信する制御部を備える
ことを特徴とする運用管理装置。 The operation management device according to claim 7,
The storage unit further stores one or more individual command patterns indicating the format of the command received by each managed device for each type of the command,
A control unit configured to generate and transmit an individual command in a format corresponding to the transmission destination managed device by referring to the individual command pattern when the determination unit determines to transmit the command. An operation management apparatus characterized by the above.
前記解析用シナリオのなかに、新たな形式のコマンドが、そのコマンドを受信したときに実行すべき処理と対応付けられて記述されている場合、
前記解析部は、外部から前記新たな形式のコマンドを受信したときに、当該コマンドに対応付けられた前記実行すべき処理を実行して前記解析結果を生成する
ことを特徴とする運用管理装置。 In the operation management device according to claim 7 or claim 8,
In the analysis scenario, when a command in a new format is described in association with a process to be executed when the command is received,
When the analysis unit receives a command of the new format from the outside, the operation management apparatus generates the analysis result by executing the process to be executed associated with the command.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010182892A JP5514040B2 (en) | 2010-08-18 | 2010-08-18 | Operation management system, operation management method, and operation management apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010182892A JP5514040B2 (en) | 2010-08-18 | 2010-08-18 | Operation management system, operation management method, and operation management apparatus |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012043121A JP2012043121A (en) | 2012-03-01 |
JP5514040B2 true JP5514040B2 (en) | 2014-06-04 |
Family
ID=45899368
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010182892A Active JP5514040B2 (en) | 2010-08-18 | 2010-08-18 | Operation management system, operation management method, and operation management apparatus |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5514040B2 (en) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014241072A (en) * | 2013-06-12 | 2014-12-25 | 日本電気通信システム株式会社 | Instruction generation device, instruction generation method, and instruction generation program |
JP6096700B2 (en) * | 2014-03-28 | 2017-03-15 | 株式会社日立製作所 | API providing system |
FR3021138B1 (en) * | 2014-05-16 | 2017-10-06 | Bull | EVENT CORRELATION ARCHITECTURE FOR SUPERCALCULATOR MONITORING |
US10652103B2 (en) * | 2015-04-24 | 2020-05-12 | Goldman Sachs & Co. LLC | System and method for handling events involving computing systems and networks using fabric monitoring system |
JP7047621B2 (en) * | 2018-06-21 | 2022-04-05 | 日本電信電話株式会社 | Operation device and operation method |
JP7090797B2 (en) * | 2018-12-03 | 2022-06-24 | セールスフォース ドット コム インコーポレイティッド | Test engine for automatic operation management |
WO2021090470A1 (en) * | 2019-11-08 | 2021-05-14 | 日本電信電話株式会社 | Operation device, maintenance management system, operation method, and program |
WO2021156972A1 (en) * | 2020-02-05 | 2021-08-12 | 日本電信電話株式会社 | Maintenance management system, message control device, message control method, and program |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11110258A (en) * | 1997-10-02 | 1999-04-23 | Nec Corp | Error message diagnostic device |
JP2001092687A (en) * | 1999-09-24 | 2001-04-06 | Hitachi Ltd | Integral operating system for computer and server system |
-
2010
- 2010-08-18 JP JP2010182892A patent/JP5514040B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2012043121A (en) | 2012-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5514040B2 (en) | Operation management system, operation management method, and operation management apparatus | |
CN108566290B (en) | Service configuration management method, system, storage medium and server | |
US20170075746A1 (en) | Information processing device and monitoring method | |
CN100549975C (en) | Computer maintenance support system and analysis server | |
JP2006277696A (en) | Job execution monitoring system, job control device and program, and job execution method | |
US20090070425A1 (en) | Data processing system, method of updating a configuration file and computer program product | |
CN108632106A (en) | System for monitoring service equipment | |
CN112785150A (en) | Production line scheduling system and method based on automobile pressure sensor | |
JP5268589B2 (en) | Information processing apparatus and information processing apparatus operating method | |
WO2022062661A1 (en) | Operation notification method and apparatus, and storage medium and electronic apparatus | |
CN104486149B (en) | A kind of finite state machine method for ground test | |
US8677323B2 (en) | Recording medium storing monitoring program, monitoring method, and monitoring system | |
US9575865B2 (en) | Information processing system and monitoring method | |
CN112787868B (en) | Information synchronization method and device | |
CN108965382B (en) | File transfer method, device, equipment and medium based on BMC (baseboard management controller) | |
CN111162959B (en) | Parameter-based avionics interface data communication protocol fuzzy test method | |
CN102141973A (en) | Cluster management method and device and cluster management and monitoring system | |
CN104834587B (en) | Method and system for debugging RS-485 bus slave computer on line | |
US20120246286A1 (en) | Modifying computer management request | |
CN108021407B (en) | Service processing method and device based on network equipment | |
EP3780551A1 (en) | Method and system for managing assets in a cloud computing environment | |
CN112214437A (en) | Storage device, communication method and device and computer readable storage medium | |
WO2018173698A1 (en) | Monitoring system, computer-readable storage medium, and monitoring method | |
JP2002149509A (en) | Network management system | |
CN112583621B (en) | Method, equipment and system for automatically quitting commissioning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20121001 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20130201 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131022 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131112 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131224 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140325 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140328 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5514040 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |