JP5514040B2 - Operation management system, operation management method, and operation management apparatus - Google Patents

Operation management system, operation management method, and operation management apparatus Download PDF

Info

Publication number
JP5514040B2
JP5514040B2 JP2010182892A JP2010182892A JP5514040B2 JP 5514040 B2 JP5514040 B2 JP 5514040B2 JP 2010182892 A JP2010182892 A JP 2010182892A JP 2010182892 A JP2010182892 A JP 2010182892A JP 5514040 B2 JP5514040 B2 JP 5514040B2
Authority
JP
Japan
Prior art keywords
command
event
analysis
operation management
scenario
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010182892A
Other languages
Japanese (ja)
Other versions
JP2012043121A (en
Inventor
雄介 中野
泰文 小川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2010182892A priority Critical patent/JP5514040B2/en
Publication of JP2012043121A publication Critical patent/JP2012043121A/en
Application granted granted Critical
Publication of JP5514040B2 publication Critical patent/JP5514040B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Computer And Data Communications (AREA)
  • Debugging And Monitoring (AREA)

Description

本発明は、複数の装置の動作状況を監視して必要な制御指示を行うことによって対象システムの運用保守を行う運用管理システム、運用管理方法及び運用管理装置に関する。   The present invention relates to an operation management system, an operation management method, and an operation management apparatus that perform operation maintenance of a target system by monitoring operation states of a plurality of apparatuses and issuing necessary control instructions.

近年、複数のコンピュータを結合してクラスタを構成することで、コンピュータシステムのスケーラビリティやアベイラビリティを確保する技術が発展している。このような技術により、安価に高性能で高可用なシステムを構築することが可能となる。しかし、大規模なシステムを構築するためには、膨大な数のコンピュータとそれらを結合するための機器とが必要となり,このような多数の装置や機器を保守・運用するために要するコストを抑えることが課題となる。   2. Description of the Related Art In recent years, a technology has been developed that ensures the scalability and availability of a computer system by connecting a plurality of computers to form a cluster. Such a technique makes it possible to construct a high-performance and highly-available system at low cost. However, in order to build a large-scale system, a huge number of computers and devices for connecting them are necessary, and the cost required for maintaining and operating such a large number of devices and devices is suppressed. Is a problem.

これに関する従来技術として、特許文献1には、被制御対象装置で特定のイベントが発生したときの動作を制御局が所定のシーケンスにしたがって自動制御する監視制御システムにおいて、自動制御の不実行を検知してオペレータに通知する技術が開示されている。   As a prior art related to this, Patent Document 1 discloses that automatic control is not executed in a monitoring control system in which a control station automatically controls an operation when a specific event occurs in a controlled device according to a predetermined sequence. Thus, a technique for notifying an operator is disclosed.

特開平7−303292号公報Japanese Unexamined Patent Publication No. 7-303292

しかしながら、前記従来技術では、個々の被制御対象装置ごとに異なる各種監視情報から制御局がイベントの発生を検知して、被制御対象装置ごとに異なる制御手段を用いて自動制御を行う必要があった。そのため、例えば、新たな装置や機器が追加設置されたり、装置や機器の更新などによって仕様が変更されたりした場合などには、その都度制御局の自動制御の手順を変更しなければならないという課題があった。   However, in the prior art, it is necessary for the control station to detect the occurrence of an event from various types of monitoring information that differs for each controlled device, and to perform automatic control using different control means for each controlled device. It was. Therefore, for example, when a new device or device is additionally installed or the specification is changed by updating the device or device, the automatic control procedure of the control station must be changed each time. was there.

本発明は、前記の課題を解決するためになされたものであり、被制御対象装置として新たな装置や機器が追加設置されたり、装置や機器の更新などによって仕様が変更されたりした場合においても、自動制御の手順の変更が不要な運用管理システム、運用管理方法及び運用管理装置を提供することを目的とする。   The present invention has been made to solve the above-described problem, and even when a new device or device is additionally installed as a device to be controlled, or when specifications are changed by updating the device or device, etc. An object of the present invention is to provide an operation management system, an operation management method, and an operation management apparatus that do not require a change in the procedure of automatic control.

前記の目的を達成するために、本発明の運用管理システムは、それぞれが自装置に関する所定のイベントの発生を通知する自装置固有の形式のイベントメッセージを送信し、受信した自装置固有の形式のコマンドにしたがって自装置の制御を行う1以上の被管理装置と、前記被管理装置から受信した前記イベントメッセージが示すイベント情報を解析して解析結果を生成する手順が記述された解析用シナリオ、前記解析結果についての判断の手順が記述された判断用シナリオ、及び、前記イベント情報の種別ごとに、各前記被管理装置が送信する前記イベントメッセージの形式を示した1以上の個別イベントパターンを記憶する記憶部と、前記被管理装置から前記イベントメッセージを受信したとき、当該イベントメッセージを前記個別イベントパターンと照合することによって、当該イベントメッセージが示すイベント情報を取得し、前記取得したイベント情報に基づいて前記解析用シナリオを実行して前記解析結果を生成する解析部、及び、当該解析結果に基づいて前記判断用シナリオを実行して前記コマンドを送信するかまたはアラートを送信するかを判断する判断部とを備える運用管理装置とがネットワークを介して接続されることを特徴とする。 In order to achieve the above object, each of the operation management systems of the present invention transmits an event message in a format unique to the own device for notifying the occurrence of a predetermined event related to the own device, and in the format unique to the received device . One or more managed devices that control the device according to a command, and an analysis scenario in which a procedure for analyzing event information indicated by the event message received from the managed device and generating an analysis result is described, For each judgment scenario describing a procedure for judging the analysis result and each type of event information, one or more individual event patterns indicating the format of the event message transmitted by each managed device are stored. When the event message is received from the storage unit and the managed device, the event message is received by the individual event. By matching the preparative pattern, obtains the event information the event message indicates, analysis unit to generate the analysis results by executing the analysis scenarios based on the obtained event information, and, on the analysis result An operation management apparatus including a determination unit that executes the determination scenario and determines whether to transmit the command or to transmit an alert is connected via a network.

これにより、被管理装置の種類が増えたり仕様が変更されたりした場合においても、個別イベントパターンのデータを修正するだけで済み、運用管理シナリオの修正が必要なケースを大幅に削減することができる。   As a result, even if the types of managed devices increase or specifications change, it is only necessary to correct the data of individual event patterns, and the cases where the operation management scenario needs to be corrected can be greatly reduced. .

また、本発明の他の運用管理システムは、前記の運用管理システムにおいて、前記記憶部には、前記コマンドの種別ごとに、各前記被管理装置が受信する前記コマンドの形式を示した1以上の個別コマンドパターンがさらに記憶され、前記判断部によって前記コマンドを送信すると判断されたとき、前記個別コマンドパターンを参照することによって、送信先の前記被管理装置に対応する形式の個別コマンドを生成して送信する制御部を備えることを特徴とする。 According to another operation management system of the present invention, in the operation management system, the storage unit includes one or more types of commands received by each managed device for each type of the command. An individual command pattern is further stored, and when it is determined that the command is to be transmitted by the determination unit, an individual command having a format corresponding to the destination managed device is generated by referring to the individual command pattern. A control unit for transmitting is provided .

これにより、被管理装置の種類が増えたり仕様が変更されたりした場合においても、個別イベントパターンのデータを修正するだけで済み、運用管理シナリオの修正が必要なケースを大幅に削減することができる。   As a result, even if the types of managed devices increase or specifications change, it is only necessary to correct the data of individual event patterns, and the cases where the operation management scenario needs to be corrected can be greatly reduced. .

また、本発明の他の運用管理システムは、前記の運用管理システムにおいて、前記解析用シナリオのなかに、新たな形式のコマンドが、そのコマンドを受信したときに実行すべき処理と対応付けられて記述されている場合、前記解析部は、前記運用管理装置が外部から前記新たな形式のコマンドを受信したときに、当該コマンドに対応付けられた前記実行すべき処理を実行することを特徴とする。 Further, according to another operation management system of the present invention, in the operation management system, a command in a new format is associated with a process to be executed when the command is received in the analysis scenario. When described, when the operation management apparatus receives the new format command from the outside, the analysis unit executes the process to be executed associated with the command. .

これにより、運用管理のための新たなコマンドを追加することができ、より効率的に運用管理を実施することが可能となる。   As a result, a new command for operation management can be added, and operation management can be performed more efficiently.

なお、本発明の運用管理方法及び運用管理装置の特徴とその効果とは、前記の内容と重複するので、ここでの説明は割愛する。   Note that the features and effects of the operation management method and operation management apparatus of the present invention are the same as those described above, and will not be described here.

本発明によれば、被制御対象装置として新たな装置や機器が追加設置されたり、装置や機器の更新などによって仕様が変更されたりした場合においても、自動制御の手順の変更が不要な運用管理システム、運用管理方法及び運用管理装置を提供することができる。   According to the present invention, even when a new device or device is additionally installed as a device to be controlled, or when the specification is changed due to an update of the device or device, operation management that does not require a change in the automatic control procedure. A system, an operation management method, and an operation management apparatus can be provided.

本発明に係る運用管理システムの装置構成例を示すブロック図である。It is a block diagram which shows the apparatus structural example of the operation management system which concerns on this invention. 本発明に係る運用管理システムの機能構成例を示すブロック図である。It is a block diagram which shows the function structural example of the operation management system which concerns on this invention. 解析部によって参照される解析用シナリオの例である。It is an example of the scenario for analysis referred by the analysis part. 解析部によって参照されるCPU使用率イベントのパターン定義例である。It is a pattern definition example of a CPU usage rate event referred to by an analysis unit. 制御部によって参照されるサービス停止コマンドのパターン定義例である。It is a pattern definition example of the service stop command referred to by the control unit. 判断部によって参照される判断用シナリオの例である。It is an example of the scenario for judgment referred by the judgment part. 被管理装置に制御コマンドを自動送信する動作の例を示すシーケンスチャーSequence chart showing an example of an operation for automatically sending a control command to a managed device トである。Is. 上位管理装置にアラートイベントを送信する動作の例を示すシーケンスチャートである。It is a sequence chart which shows the example of operation | movement which transmits an alert event to a high-order management apparatus.

以下、本発明を実施するための形態を適宜図面を参照して説明する。
図1は、本発明を適用した運用管理システムの装置構成例を示すブロック図である。図1に示すように、運用管理システム10は、管理者端末3が接続される上位管理装置1と、それぞれが1以上の被管理装置4の監視制御を行う複数の下位管理装置2とを備えて構成される。上位管理装置1と下位管理装置2との間、及び、下位管理装置2と被管理装置4との間は、不図示のネットワークを介して互いに通信可能に接続される。
DESCRIPTION OF EMBODIMENTS Hereinafter, embodiments for carrying out the present invention will be described with reference to the drawings as appropriate.
FIG. 1 is a block diagram showing an apparatus configuration example of an operation management system to which the present invention is applied. As shown in FIG. 1, the operation management system 10 includes a higher-level management device 1 to which an administrator terminal 3 is connected, and a plurality of lower-level management devices 2 that each monitor and control one or more managed devices 4. Configured. The upper management apparatus 1 and the lower management apparatus 2 and the lower management apparatus 2 and the managed apparatus 4 are connected to be communicable with each other via a network (not shown).

なお、図1の装置構成例では、上位管理装置1は1台となっているが、複数の上位管理装置1を設置するとともに、その上位にさらに上位管理装置1を設置して多階層の構成としてもよい。   In the example of the apparatus configuration of FIG. 1, the upper management apparatus 1 is one, but a plurality of higher management apparatuses 1 are installed, and a higher management apparatus 1 is further installed above the upper management apparatuses 1 to provide a multi-tier configuration. It is good.

被管理装置4は、例えば、Webサーバやアプリケーションサーバ等の、ユーザに各種の情報サービスを提供するためのコンピュータである。これらの被管理装置4は、それぞれが自身の装置やサービスの状態、CPU負荷等を監視し、それらの監視結果に基づいて自装置固有の条件で各種のイベントメッセージ(以下、「個別イベント」と言う。)を送信する。この個別イベントは、例えば、「サービスAでエクセプション(想定外の事象)が発生した」、「ノード1で障害が発生した」、「ノード1のCPU使用率は95%です。」といったものである。   The managed device 4 is a computer for providing various information services to the user, such as a Web server or an application server. Each of these managed devices 4 monitors its own device and service status, CPU load, etc., and based on the monitoring results, various event messages (hereinafter referred to as “individual events”) under conditions specific to the device itself. Say.) The individual events are, for example, “an exception (an unexpected event) has occurred in service A”, “a failure has occurred in node 1”, and “the CPU usage rate of node 1 is 95%”. .

また、被管理装置4は、装置固有のコマンド(以下、「個別コマンド」と言う。)を外部から受信し、それらの個別コマンドにしたがって自身の装置やサービスを制御する。この個別コマンドは、例えば、「サービスAを停止せよ」、「ノード1を切り離せ」といったものである。   Further, the managed device 4 receives device-specific commands (hereinafter referred to as “individual commands”) from the outside, and controls its own devices and services according to these individual commands. The individual commands are, for example, “Stop service A” and “Disconnect node 1”.

下位管理装置2は、データ通信機能を備えたコンピュータによって構成され、配下の1以上の被管理装置4から送信される個別イベントを受信することによって、それぞれの被管理装置4の動作状況を取得し、所定の運用管理シナリオに基づいて被管理装置4の動作を自動制御したり、上位管理装置1にアラートイベントを送信したり、上位管理装置1からの制御指示のコマンド(以下、「統括コマンド」と言う。)をそれぞれの被管理装置4の個別コマンドに変換して被管理装置4に伝達したりする。   The lower-level management device 2 is configured by a computer having a data communication function, and acquires the operation status of each managed device 4 by receiving individual events transmitted from one or more managed devices 4 under its control. , Automatically controlling the operation of the managed device 4 based on a predetermined operation management scenario, sending an alert event to the higher-level management device 1, and a command for control instruction from the higher-level management device 1 (hereinafter referred to as “overall command”). Are converted into individual commands of each managed device 4 and transmitted to the managed device 4.

上位管理装置1は、ディスプレイやキーボードなどの入出力装置を有する管理者端末3との入出力インタフェース及びデータ通信機能を備えたコンピュータによって構成され、複数の下位管理装置2を介して被管理装置4の全体を統括管理する。   The upper management device 1 is configured by a computer having an input / output interface and a data communication function with an administrator terminal 3 having an input / output device such as a display and a keyboard, and the managed device 4 via a plurality of lower management devices 2. Overall management.

上位管理装置1は、下位管理装置2からアラートイベントを受信し、記憶部に記憶された所定の運用管理シナリオに基づいて下位管理装置2に統括コマンドを自動送信したり、管理者端末3に必要な警告通知を表示させたりする。また、管理者から入力される制御指示を所定形式の統括コマンドに変換して下位管理装置2に伝達したり、さらに上位の上位管理装置が存在する場合には、上位管理装置にアラートイベントを送信して上位管理装置からの制御指示を配下の下位管理装置2に伝達したりする。   The upper management apparatus 1 receives an alert event from the lower management apparatus 2 and automatically transmits an overall command to the lower management apparatus 2 based on a predetermined operation management scenario stored in the storage unit or is necessary for the administrator terminal 3 Display warning alerts. In addition, the control instruction input from the administrator is converted into a general command of a predetermined format and transmitted to the lower management apparatus 2, or if there is a higher-order upper management apparatus, an alert event is transmitted to the upper management apparatus. Then, the control instruction from the upper management apparatus is transmitted to the subordinate management apparatus 2 under control.

これにより、例えば、上位管理装置1は、管理者からの制御指示にしたがって「CPU使用率が80%以上であれば、サービスA停止」といった、すべての被管理装置4を統括制御するための統括コマンドを発行して被管理装置4の全体を統括管理する。   As a result, for example, the upper management device 1 performs overall control for controlling all the managed devices 4 such as “stop service A if the CPU usage rate is 80% or more” in accordance with a control instruction from the administrator. A command is issued to manage the entire managed device 4 as a whole.

図2は、運用管理システム10の機能構成例を示すブロック図である。なお、図2には、1台の下位管理装置2についての詳細機能構成を示している。また、上位管理装置1もこれとほぼ同様な構成を有するが図示は省略している。   FIG. 2 is a block diagram illustrating a functional configuration example of the operation management system 10. FIG. 2 shows a detailed functional configuration of one lower management apparatus 2. Further, the upper management apparatus 1 has substantially the same configuration as this, but the illustration thereof is omitted.

図2に示すように、下位管理装置2は、フィルタリング・集約部21、キャッシュ部22、解析部23、DB(Database)部24、判断部25、及び制御部26を備えて構成される。これらの各部は、下位管理装置2が備える不図示のCPUが、不図示の記憶部に記憶された所定のプログラムを不図示の主メモリにロードして実行することによって具現化される。   As shown in FIG. 2, the lower-level management device 2 includes a filtering / aggregation unit 21, a cache unit 22, an analysis unit 23, a DB (Database) unit 24, a determination unit 25, and a control unit 26. These units are realized by a CPU (not shown) included in the lower level management device 2 loading a predetermined program stored in a storage unit (not shown) into a main memory (not shown) and executing it.

フィルタリング・集約部21は、被管理装置4から送信される個別イベントと、上位管理装置1から送信される統括コマンドとを、それぞれ受信して、それらの中から対処不要なものを除去するフィルタリング処理と、複数の個別イベントをまとめて1つの集約イベントに変換する集約処理とを実行し、処理結果のイベント及びコマンドをキャッシュ部22に引き渡す。   The filtering / aggregating unit 21 receives the individual event transmitted from the managed device 4 and the overall command transmitted from the higher-level management device 1, and performs filtering processing for removing unnecessary ones from them. And an aggregation process for converting a plurality of individual events into one aggregated event, and delivering the process result event and command to the cache unit 22.

このとき、除去すべき個別イベントや統括コマンドの種類を予め記憶部に登録しておくようにしてもよいし、取り込むべき個別イベント及び統括コマンドの種類を予め記憶部に登録しておくようにしてもよい。また、個別イベントや統括コマンドのパラメータ値と所定のしきい値との比較結果によって除去するか取り込むかを判定するようにしてもよい。さらに、受信した個別イベントを後記する個別イベントパターンと照合することによって、受信した個別イベントに該当するイベント情報を生成する機能を、フィルタリング・集約部21にもたせるものとしてもよい。   At this time, the types of individual events and general commands to be removed may be registered in the storage unit in advance, or the individual events and general commands to be captured may be registered in the storage unit in advance. Also good. Further, it may be determined whether to remove or take in according to the comparison result between the parameter value of the individual event or the general command and a predetermined threshold value. Further, the filtering / aggregating unit 21 may be provided with a function of generating event information corresponding to the received individual event by comparing the received individual event with an individual event pattern described later.

また、個別イベントの集約処理では、例えば、同一種類の個別イベントが短時間で繰り返し受信された場合は、それらを受信回数をパラメータ値としてもつ1つの集約イベントに変換したり、パラメータ値の変化量が比較的小さい複数の個別イベントの中から、それを代表する1つのイベントだけを取り込んだりすることにより、処理対象となるイベントの数を絞り込む。   Also, in the individual event aggregation process, for example, when individual events of the same type are repeatedly received in a short time, they are converted into one aggregate event having the number of receptions as a parameter value, or the amount of change in the parameter value The number of events to be processed is narrowed down by fetching only one event representing the event from a plurality of individual events having a relatively small.

キャッシュ部22は、フィルタリング・集約部21から引き渡されたイベント及びコマンドを、所定期間保持する。この保持する所定期間は、イベントやコマンドの種類に応じて可変にしてもよいし、同一種類の新たなイベントやコマンドによって上書きするようにしてもよい。また、キャッシュ部22は、必要に応じて後記する解析部23から引き渡された解析結果や判断部25から引き渡された判断結果をも所定期間保持する。そして、キャッシュ部22は、解析部23または判断部25からの取得要求を受け付けて、保持しているイベント、コマンド、解析結果、または判断結果を要求元に返送する。   The cache unit 22 holds the event and command delivered from the filtering / aggregating unit 21 for a predetermined period. The predetermined period to be held may be variable according to the type of event or command, or may be overwritten by a new event or command of the same type. In addition, the cache unit 22 also holds the analysis result delivered from the analysis unit 23 described later and the judgment result delivered from the judgment unit 25 as necessary. Then, the cache unit 22 receives an acquisition request from the analysis unit 23 or the determination unit 25 and returns the held event, command, analysis result, or determination result to the request source.

DB部24は、必要に応じて解析部23から引き渡された解析結果や判断部25から引き渡された判断結果を、永続的に保持し、解析部23または判断部25からの取得要求を受け付けて、保持している解析結果または判断結果を要求元に返送する。   The DB unit 24 permanently holds the analysis result delivered from the analysis unit 23 and the judgment result delivered from the determination unit 25 as necessary, and accepts an acquisition request from the analysis unit 23 or the determination unit 25. The analysis result or judgment result held is returned to the request source.

解析部23は、不図示の記憶部に記憶され、運用管理の手順が記述された複数の解析用シナリオ27に基づいて、キャッシュ部22及びDB部24に保持されているイベント、コマンド、解析結果、及び判断結果を取得して装置状態などの解析を行い、解析結果を判断部25に引き渡す。また、解析用シナリオ27に基づいて、今回の解析結果を次回以降の解析や判断に用いるために解析結果をキャッシュ部22に引き渡して所定期間保持させ、あるいは、解析結果をDB部24に引き渡して永続的に保持させる。   The analysis unit 23 stores an event, a command, and an analysis result held in the cache unit 22 and the DB unit 24 based on a plurality of analysis scenarios 27 that are stored in a storage unit (not shown) and that describes an operation management procedure. And the determination result is acquired, the apparatus state and the like are analyzed, and the analysis result is delivered to the determination unit 25. Further, based on the analysis scenario 27, the analysis result is transferred to the cache unit 22 and held for a predetermined period in order to use the analysis result of this time for subsequent analysis and determination, or the analysis result is transferred to the DB unit 24. Make it permanent.

キャッシュ部22から過去の解析結果の取得が必要となる例としては、過去に行った障害対策と同じ対策を短時間で繰り返さないようにするために、当該対策を指示した解析結果を取得するような場合を挙げることができる。また、DB部24から過去の解析結果の取得が必要となる例としては、被管理装置4の延べの障害発生回数が所定値を超えたらその装置を交換するというような解析を行う場合を挙げることができる。   As an example in which it is necessary to obtain a past analysis result from the cache unit 22, in order not to repeat the same countermeasure as the fault countermeasure performed in the past in a short time, the analysis result instructing the countermeasure is acquired. Can be mentioned. Further, as an example in which it is necessary to obtain past analysis results from the DB unit 24, there is a case where an analysis is performed in which a device is replaced when the total number of failure occurrences of the managed device 4 exceeds a predetermined value. be able to.

図3は、解析部23によって参照される解析用シナリオ27の例である。図3に例示した解析用シナリオ27aは、被管理装置4のCPU使用率が所定値以上になったらある特定のサービスを停止するように指令するためのシナリオである。   FIG. 3 is an example of an analysis scenario 27 referred to by the analysis unit 23. The analysis scenario 27a illustrated in FIG. 3 is a scenario for instructing to stop a specific service when the CPU usage rate of the managed device 4 exceeds a predetermined value.

図3の例のように、解析用シナリオ27には、始め(図の左側)に、解析に使用されるコマンドやイベントなどの定義が記述される。図3の例では、キャッシュ部22から、「CPU使用率が[xx]%以上であれば、[サービスA]停止」([]内は可変の文字列を表す。)というコマンドと、CPU使用率イベントとの2つを取得すべきことが記述されている。これにより、解析部23は、キャッシュ部22に対してこれらの2つに該当するコマンドとイベントとの取得を要求し、該当するものがキャッシュ部22に保持されていれば、キャッシュ部22からその内容が解析部23に返送される。   As in the example of FIG. 3, in the analysis scenario 27, definitions of commands and events used for analysis are described at the beginning (left side of the figure). In the example of FIG. 3, from the cache unit 22, a command “CPU [service A] stop if CPU usage rate is equal to or higher than [xx]%” (inside [] represents a variable character string), and CPU usage. It is described that two of the rate events should be acquired. As a result, the analysis unit 23 requests the cache unit 22 to acquire commands and events corresponding to these two, and if the corresponding items are held in the cache unit 22, the cache unit 22 receives the commands and events. The contents are returned to the analysis unit 23.

図3の例のように、解析用シナリオ27では、任意の形式のコマンドの取得が指定できるので、運用管理に利用する新たなコマンドを追加することができる。なお、図3の例では、キャッシュ部22からイベントとコマンドとを取得する場合を示したが、キャッシュ部22またはDB部24から前回の解析結果や判断結果をも合わせて取得するものとしてもよい。   As in the example of FIG. 3, in the analysis scenario 27, acquisition of a command in an arbitrary format can be specified, so that a new command used for operation management can be added. In the example of FIG. 3, an event and a command are acquired from the cache unit 22, but the previous analysis result and determination result may be acquired from the cache unit 22 or the DB unit 24 together. .

ところで、個別イベントのメッセージ形式は、同種のイベントを通知するものであっても被管理装置4の種類ごとに異なる場合がある。例えば、CPU使用率イベントであれば、図4に例示するようないくつかのパターンが存在する。なお、図内の下線が付された文字列は、イベントのパラメータ値となる可変部分を表している。しかも、これらのパターンは新製品が登場したりソフトウェアのバージョンアップが行われたりしたときに変更される可能性が高い。   By the way, the message format of the individual event may differ depending on the type of the managed device 4 even if the same type of event is notified. For example, for a CPU usage rate event, there are several patterns as illustrated in FIG. Note that the underlined character string in the figure represents a variable part that becomes an event parameter value. Moreover, these patterns are likely to change when new products appear or when software is upgraded.

そこで、図4に例示したような複数の異なるメッセージ形式のパターンを個別イベントパターン29として別途不図示の記憶部に登録しておく。この個別イベントパターン29を参照することによって、解析部23は、それぞれのパターンに対応する個別イベントの取得要求をキャッシュ部22に対して発行することができる。   Therefore, a plurality of patterns of different message formats as exemplified in FIG. 4 are separately registered in the storage unit (not shown) as individual event patterns 29. By referring to the individual event pattern 29, the analysis unit 23 can issue an acquisition request for an individual event corresponding to each pattern to the cache unit 22.

同じように、個別コマンドの形式も、同種の制御動作を指示するものであっても被管理装置4の種類ごとに異なる場合がある。例えば、サービス停止コマンドであれば、図5に例示するようないくつかのパターンが存在する。なお、図内の下線が付された文字列は、コマンドのパラメータ値となる可変部分を表している。   Similarly, the format of the individual command may differ depending on the type of the managed device 4 even if it instructs the same type of control operation. For example, for a service stop command, there are several patterns as illustrated in FIG. Note that the underlined character string in the figure represents a variable part that becomes a command parameter value.

そこで、図5に例示したような複数の異なるコマンドパターンを個別コマンドパターン30として別途不図示の記憶部に登録しておく。この個別コマンドパターン30を参照することによって、制御部26は、判断部25から引き渡される判断結果に応じて、それぞれの被管理装置4に適合した個別コマンドを生成して送信することができる。   Therefore, a plurality of different command patterns as illustrated in FIG. 5 are separately registered in a storage unit (not shown) as individual command patterns 30. By referring to the individual command pattern 30, the control unit 26 can generate and transmit an individual command suitable for each managed device 4 in accordance with the determination result delivered from the determination unit 25.

再び図3に戻って説明を続ける。解析用シナリオ27には、続いて、取得したコマンドやイベントなどに対して実行すべき処理内容と、最終的に出力する解析結果の仕様とが記述される。図3の例では、キャッシュ部22から取得したCPU使用率イベントのなかから、指定されたしきい値:[xx]以上の値をもつイベントを抽出し、抽出されたイベントと指定された停止サービス名:[サービスA]とから、当該サービスを停止する対象ノード(被管理装置4)と停止サービス名との対として解析結果を出力すべきことが記述されている。   Returning to FIG. 3 again, the description will be continued. In the analysis scenario 27, the processing contents to be executed for the acquired command or event and the specification of the analysis result to be finally output are described. In the example of FIG. 3, an event having a specified threshold value: [xx] or more is extracted from the CPU usage rate events acquired from the cache unit 22, and the extracted event and the specified stop service are extracted. The name: [service A] describes that the analysis result should be output as a pair of the target node (managed device 4) to stop the service and the stop service name.

また、解析部23は、他の解析用シナリオ27に基づいて、例えば、ある被管理装置4からある特定の個別イベントを単位時間あたりに所定回数以上受信した場合に、その被管理装置4に障害が発生したという解析結果を生成する。このとき、障害発生に至るまでに受信した個別イベントをキャッシュ部22に保持させておくことにより、各個別イベントの受信状況に応じてより詳細な解析結果を得ることが可能となる。これにより、解析部23は、例えば、故障部位や故障の種類などを特定し、故障部位を切り離したり、関連するサービスを停止させたりするような解析結果を出力することができる。   In addition, the analysis unit 23 causes a failure in the managed device 4 when, for example, a specific individual event is received from a managed device 4 a predetermined number of times per unit time based on another analysis scenario 27. Generates the analysis result that occurred. At this time, by holding the individual events received until the failure occurs in the cache unit 22, it is possible to obtain more detailed analysis results according to the reception status of each individual event. Thereby, the analysis part 23 can output the analysis result which identifies a failure part, the kind of failure, etc., for example, isolates a failure part, or stops a related service.

なお、解析部23によって実行される解析処理は、所定の周期で実行するようにしてもよいし、キャッシュ部22に新たなイベント、コマンド、解析結果、または判断結果が保持される都度、実行するようにしてもよい。   The analysis process executed by the analysis unit 23 may be executed at a predetermined cycle, or is executed whenever a new event, command, analysis result, or determination result is held in the cache unit 22. You may do it.

判断部25は、解析結果についての判断の手順が記述された複数の判断用シナリオ28に基づいて、判断結果を制御部26に引き渡して被管理装置4を自動制御するのか、判断結果を上位管理装置1に通知して上位管理装置1からの指示を仰ぐのかの判断を行う。   Based on a plurality of determination scenarios 28 in which determination procedures for analysis results are described, the determination unit 25 delivers the determination results to the control unit 26 to automatically control the managed device 4, and determines whether the determination results are superordinately managed. It is determined whether to notify the device 1 and ask for an instruction from the upper management device 1.

判断部25は、判断用シナリオ28に基づいて、キャッシュ部22及びDB部24に保持されているイベント、コマンド、解析結果、及び判断結果を取得して判断を行い、判断結果を制御部26に引き渡すか、あるいは、上位管理装置1に判断結果を表すアラートイベントを送信する。また、判断用シナリオ28に基づいて、今回の判断結果を次回以降の解析や判断に用いるために判断結果をキャッシュ部22に引き渡して所定期間保持させ、あるいは、判断結果をDB部24に引き渡して永続的に保持させる。   Based on the determination scenario 28, the determination unit 25 obtains an event, a command, an analysis result, and a determination result held in the cache unit 22 and the DB unit 24, makes a determination, and sends the determination result to the control unit 26. Or an alert event representing a determination result is transmitted to the upper management apparatus 1. In addition, based on the scenario for determination 28, the determination result is transferred to the cache unit 22 and held for a predetermined period in order to be used for the subsequent analysis and determination, or the determination result is transferred to the DB unit 24. Make it permanent.

図6は、判断部25によって参照される判断用シナリオ28の例である。図6に例示した判断用シナリオ28aは、被管理装置4のサービスにおいてエクセプション(想定外の事象)が発生したら上位管理装置1にアラートイベントを送信するためのシナリオである。判断用シナリオ28bは、被管理装置4のサービスにおいて所定回数以上の障害が発生したら上位管理装置1にアラートイベントを送信するためのシナリオである。また、判断用シナリオ28cは、被管理装置4の特定のサービスを停止するためのシナリオである。   FIG. 6 is an example of the determination scenario 28 referred to by the determination unit 25. The determination scenario 28a illustrated in FIG. 6 is a scenario for transmitting an alert event to the upper management apparatus 1 when an exception (an unexpected event) occurs in the service of the managed apparatus 4. The determination scenario 28b is a scenario for transmitting an alert event to the higher-level management apparatus 1 when a predetermined number of failures occur in the service of the managed apparatus 4. The determination scenario 28 c is a scenario for stopping a specific service of the managed device 4.

このように、判断用シナリオ28には、解析部23から引き渡される解析結果に対応して実行すべき処理内容が記述される。   In this way, the determination scenario 28 describes the processing contents to be executed in accordance with the analysis result delivered from the analysis unit 23.

制御部26は、判断部25から引き渡された判断結果に応じて、個別コマンドパターン30を参照してそれぞれの被管理装置4に適合した個別コマンドを生成して送信する。   The control unit 26 refers to the individual command pattern 30 according to the determination result delivered from the determination unit 25, and generates and transmits an individual command suitable for each managed device 4.

図7は、被管理装置4を制御するための個別コマンドを自動送信するときの動作例を示すシーケンスチャートである。   FIG. 7 is a sequence chart showing an operation example when an individual command for controlling the managed device 4 is automatically transmitted.

被管理装置4から下位管理装置2に個別イベントM1が送信されると、フィルタリング・集約部21は、その個別イベントM1を受信し、不要イベントの除去とイベントの集約とを行い(S1)、その結果として得られる集約イベント等M2をキャッシュ部22に引き渡す。キャッシュ部22は、引き渡された集約イベント等の受信イベントを所定期間保持する(S2)。   When the individual event M1 is transmitted from the managed device 4 to the lower level management device 2, the filtering / aggregating unit 21 receives the individual event M1, removes unnecessary events, and aggregates events (S1). The resulting aggregated event M2 is delivered to the cache unit 22. The cache unit 22 holds the received event such as the delivered aggregated event for a predetermined period (S2).

他方、上位管理装置1から下位管理装置2に統括コマンド等M3が送信されると、フィルタリング・集約部21は、その統括コマンド等M3を受信し、不要コマンドの除去等を行い(S3)、その結果として得られる統括コマンド等M4をキャッシュ部22に引き渡す。キャッシュ部22は、引き渡された統括コマンド等の受信コマンドを所定期間保持する(S4)。   On the other hand, when the overall command M3 is transmitted from the upper level management apparatus 1 to the lower level management apparatus 2, the filtering / aggregation unit 21 receives the overall command M3, and removes unnecessary commands (S3). The overall command M4 and the like obtained as a result are delivered to the cache unit 22. The cache unit 22 holds the received command such as the delivered general command for a predetermined period (S4).

一方で、解析部23は、キャッシュ部22に対して、所定の周期でそれぞれの解析用シナリオ27の実行に必要なコマンドやイベント等の取得要求M5,M6を発行し(S5)、該当するコマンドやイベント等があればキャッシュ部22から統括コマンド・集約イベント等M7が解析部23に引き渡される。   On the other hand, the analysis unit 23 issues acquisition requests M5 and M6 such as commands and events necessary for executing each analysis scenario 27 to the cache unit 22 in a predetermined cycle (S5), and the corresponding commands. If there is an event or the like, a general command / aggregated event M7 is delivered from the cache unit 22 to the analysis unit 23.

そして、解析部23は、それぞれの解析用シナリオ27に基づいて、キャッシュ部22から引き渡されたコマンド・イベント等の解析を行い、例えば、コマンド送信を指示する解析結果M8を判断部25に引き渡す(S6)。   Then, the analysis unit 23 analyzes the command / event delivered from the cache unit 22 based on each analysis scenario 27, and delivers, for example, an analysis result M8 instructing command transmission to the determination unit 25 ( S6).

判断部25は、引き渡された解析結果M8に該当する判断用シナリオ28に基づいて、解析結果の判断を行い、例えば、被管理装置4に特定の個別コマンドを送信する判断結果M9を制御部26に引き渡す(S7)。   The determination unit 25 determines the analysis result based on the determination scenario 28 corresponding to the delivered analysis result M8. For example, the determination unit 25 transmits the determination result M9 for transmitting a specific individual command to the managed device 4. (S7).

続いて、制御部26は、個別コマンドパターン30を参照して、引き渡された判断結果M9によって指示された制御内容に該当する被管理装置4に適合した個別コマンドM10を生成して当該被管理装置4に送信する(S8)。   Subsequently, the control unit 26 refers to the individual command pattern 30 to generate an individual command M10 suitable for the managed device 4 corresponding to the control content indicated by the delivered determination result M9, and the managed device 4 (S8).

図8は、被管理装置4に関するアラートイベントを上位管理装置1に送信するときの動作例を示すシーケンスチャートである。   FIG. 8 is a sequence chart illustrating an operation example when an alert event related to the managed device 4 is transmitted to the upper management device 1.

図8において解析部23がコマンド・イベント等を解析するステップS1からS6に至るまでの動作は、前記した図7の動作と基本的に同じであるので説明を省き、ステップS6以降の動作について説明する。   In FIG. 8, the operation from step S1 to step S6 in which the analysis unit 23 analyzes the command / event and the like is basically the same as the operation of FIG. 7 described above, so the description is omitted and the operation after step S6 is described. To do.

ここでは、ステップS6において、解析部23は、ある解析用シナリオ27に基づいて、コマンド・イベント等の解析を行った結果、例えば、アラート送信を指示する解析結果M11を判断部25に引き渡したものとする。   Here, in step S6, the analysis unit 23 analyzes the command / event based on a certain analysis scenario 27, for example, the analysis result M11 instructing the alert transmission is delivered to the determination unit 25. And

さらに、この解析用シナリオ27には、今回の解析結果をキャッシュ部22とDB部24との双方に保持するよう記述されているので、解析部23は、解析結果M12をキャッシュ部22に引き渡し、解析結果M13をDB部24に引き渡す。   Furthermore, since this analysis scenario 27 describes that the analysis result of this time is held in both the cache unit 22 and the DB unit 24, the analysis unit 23 delivers the analysis result M12 to the cache unit 22, The analysis result M13 is delivered to the DB unit 24.

これにより、キャッシュ部22は、引き渡された解析結果M12を所定期間保持し(S10)、DB部24は、引き渡された解析結果M13を永続して保持する(S11)。   Accordingly, the cache unit 22 holds the delivered analysis result M12 for a predetermined period (S10), and the DB unit 24 permanently holds the delivered analysis result M13 (S11).

一方、判断部25は、引き渡された解析結果M11に該当する判断用シナリオ28に基づいて、解析結果の判断を行い、例えば、アラートイベントを生成して上位管理装置1にアラートイベントM14を送信するとともに、アラートイベントM15をキャッシュ部22に引き渡す(S9)。   On the other hand, the determination unit 25 determines the analysis result based on the determination scenario 28 corresponding to the delivered analysis result M11, for example, generates an alert event and transmits the alert event M14 to the higher-level management device 1. At the same time, the alert event M15 is delivered to the cache unit 22 (S9).

これにより、上位管理装置1は、受信したアラートイベントM14に該当する不図示の運用管理シナリオに基づいて下位管理装置2に制御を指示する統括コマンドを自動送信したり、必要であれば管理者端末3にアラート内容を表示させて管理者から入力される制御指示を統括コマンドに変換して下位管理装置2に伝達したりする。またキャッシュ部22は、引き渡されたアラートイベントM15を所定期間保持する(S12)。これにより、以前に送信したアラートイベントがキャッシュ部22に保持されている所定期間は同様のアラートイベントを送信しないように抑止することが可能となる。   As a result, the upper management apparatus 1 automatically transmits an overall command for instructing control to the lower management apparatus 2 based on an operation management scenario (not shown) corresponding to the received alert event M14, or an administrator terminal if necessary. The alert content is displayed in FIG. 3, and the control instruction input from the administrator is converted into a general command and transmitted to the lower management apparatus 2. In addition, the cache unit 22 holds the delivered alert event M15 for a predetermined period (S12). As a result, it is possible to prevent a similar alert event from being transmitted during a predetermined period in which the previously transmitted alert event is held in the cache unit 22.

以上説明したように、本発明の運用管理システムでは、監視制御の対象となるそれぞれの被管理装置が自身の状態を通知するためのイベントを発行し、監視制御の主体をなる管理装置が所定の運用管理の手順が記述された運用管理シナリオに基づいて、イベントの解析と対応する処置と決定して自動制御動作を実行する。そのため、管理者に通知されるアラートの頻度を少なくして、管理者の作業効率の向上を図ることができる。   As described above, in the operation management system of the present invention, each managed device to be monitored and controlled issues an event for notifying its own state, and the management device that is the subject of monitoring control has a predetermined Based on the operation management scenario in which the operation management procedure is described, the event analysis and the corresponding action are determined and the automatic control operation is executed. Therefore, it is possible to reduce the frequency of alerts notified to the administrator and improve the work efficiency of the administrator.

また、監視制御の対象となる被管理装置が追加されたり、仕様が変更されたりした場合であっても、それに伴う運用管理シナリオの改変の手間を軽減することができる。   Further, even if a managed device to be monitored and controlled is added or the specification is changed, it is possible to reduce the trouble of modifying the operation management scenario associated therewith.

1 上位管理装置
2 下位管理装置(運用管理装置)
3 管理者端末
4 被管理装置
10 運用管理システム
21 フィルタリング・集約部(イベントメッセージ受信部)
22 キャッシュ部
23 解析部(運用管理シナリオ実行部)
24 DB部
25 判断部(運用管理シナリオ実行部)
26 制御部
27 解析用シナリオ(運用管理シナリオ)
28 判断用シナリオ(運用管理シナリオ)
29 個別イベントパターン
30 個別コマンドパターン
1 Upper management device 2 Lower management device (operation management device)
3 Administrator terminal 4 Managed device 10 Operation management system 21 Filtering / aggregation unit (event message reception unit)
22 cache part 23 analysis part (operation management scenario execution part)
24 DB unit 25 Judgment unit (operation management scenario execution unit)
26 Control Unit 27 Analysis Scenario (Operation Management Scenario)
28 Judgment scenario (operation management scenario)
29 Individual event pattern 30 Individual command pattern

Claims (9)

それぞれが自装置に関する所定のイベントの発生を通知する自装置固有の形式のイベントメッセージを送信し、受信した自装置固有の形式のコマンドにしたがって自装置の制御を行う1以上の被管理装置と、
前記被管理装置から受信した前記イベントメッセージが示すイベント情報を解析して解析結果を生成する手順が記述された解析用シナリオ、前記解析結果についての判断の手順が記述された判断用シナリオ、及び、前記イベント情報の種別ごとに、各前記被管理装置が送信する前記イベントメッセージの形式を示した1以上の個別イベントパターンを記憶する記憶部と、
前記被管理装置から前記イベントメッセージを受信したとき、当該イベントメッセージを前記個別イベントパターンと照合することによって、当該イベントメッセージが示すイベント情報を取得し、前記取得したイベント情報に基づいて前記解析用シナリオを実行して前記解析結果を生成する解析部、及び、当該解析結果に基づいて前記判断用シナリオを実行して前記コマンドを送信するかまたはアラートを送信するかを判断する判断部とを備える運用管理装置と
がネットワークを介して接続されることを特徴とする運用管理システム。
One or more managed devices, each of which transmits an event message in a format specific to the own device for notifying the occurrence of a predetermined event related to the own device, and controls the own device in accordance with the received command in a format specific to the own device;
An analysis scenario describing a procedure for analyzing event information indicated by the event message received from the managed device and generating an analysis result, a determination scenario describing a determination procedure for the analysis result, and For each type of event information, a storage unit that stores one or more individual event patterns indicating the format of the event message transmitted by each managed device;
When the event message is received from the managed device, the event message indicated by the event message is acquired by collating the event message with the individual event pattern, and the analysis scenario is based on the acquired event information. And an analysis unit that generates the analysis result by executing and a determination unit that executes the determination scenario based on the analysis result and determines whether to transmit the command or alert An operation management system characterized in that a management apparatus is connected via a network.
請求項1に記載の運用管理システムにおいて、
前記記憶部には、前記コマンドの種別ごとに、各前記被管理装置が受信する前記コマンドの形式を示した1以上の個別コマンドパターンがさらに記憶され、
前記判断部によって前記コマンドを送信すると判断されたとき、前記個別コマンドパターンを参照することによって、送信先の前記被管理装置に対応する形式の個別コマンドを生成して送信する制御部を備える
ことを特徴とする運用管理システム。
In the operation management system according to claim 1,
The storage unit further stores one or more individual command patterns indicating the format of the command received by each managed device for each type of the command,
A control unit configured to generate and transmit an individual command in a format corresponding to the transmission destination managed device by referring to the individual command pattern when the determination unit determines to transmit the command. An operation management system characterized by this.
請求項1または請求項2に記載の運用管理システムにおいて、
前記解析用シナリオのなかに、新たな形式のコマンドが、そのコマンドを受信したときに実行すべき処理と対応付けられて記述されている場合、
前記解析部は、前記運用管理装置が外部から前記新たな形式のコマンドを受信したときに、当該コマンドに対応付けられた前記実行すべき処理を実行して前記解析結果を生成する
ことを特徴とする運用管理システム。
In the operation management system according to claim 1 or claim 2,
In the analysis scenario, when a command in a new format is described in association with a process to be executed when the command is received,
When the operation management apparatus receives the new format command from the outside, the analysis unit executes the process to be executed associated with the command and generates the analysis result. Operation management system.
それぞれが自装置に関する所定のイベントの発生を通知する自装置固有の形式のイベントメッセージを送信し、受信した自装置固有の形式のコマンドにしたがって自装置の制御を行う1以上の被管理装置と、
前記被管理装置から受信した前記イベントメッセージが示すイベント情報を解析して解析結果を生成する手順が記述された解析用シナリオ、前記解析結果についての判断の手順が記述された判断用シナリオ、及び、前記イベント情報の種別ごとに、各前記被管理装置が送信する前記イベントメッセージの形式を示した1以上の個別イベントパターンを記憶する記憶部と、
前記解析用シナリオを実行する解析部及び前記判断用シナリオを実行する判断部とを備える運用管理装置とが、ネットワークを介して接続された運用管理システムにおける運用管理方法であって、
前記解析部が、前記被管理装置から前記イベントメッセージを受信したとき、当該イベントメッセージを前記個別イベントパターンと照合することによって、当該イベントメッセージが示すイベント情報を取得し、前記取得したイベント情報に基づいて前記解析用シナリオを実行して前記解析結果を出力するステップと、
前記判断部が、前記解析結果に基づいて前記判断用シナリオを実行して前記コマンドを送信するかまたはアラートを送信するかを判断するステップと
を有することを特徴とする運用管理方法。
One or more managed devices, each of which transmits an event message in a format specific to the own device for notifying the occurrence of a predetermined event related to the own device, and controls the own device in accordance with the received command in a format specific to the own device;
An analysis scenario describing a procedure for analyzing event information indicated by the event message received from the managed device and generating an analysis result, a determination scenario describing a determination procedure for the analysis result, and For each type of event information, a storage unit that stores one or more individual event patterns indicating the format of the event message transmitted by each managed device;
An operation management apparatus comprising an analysis unit that executes the analysis scenario and a determination unit that executes the determination scenario is an operation management method in an operation management system connected via a network,
When the analysis unit receives the event message from the managed device, it acquires event information indicated by the event message by comparing the event message with the individual event pattern, and based on the acquired event information Executing the analysis scenario and outputting the analysis result ;
And a step of determining whether the determination unit executes the determination scenario based on the analysis result and transmits the command or an alert. .
請求項4に記載の運用管理方法において、
前記記憶部には、前記コマンドの種別ごとに、各前記被管理装置が受信する前記コマンドの形式を示した1以上の個別コマンドパターンがさらに記憶されており、
前記判断用シナリオを実行するステップにおいて、前記判断部によって前記コマンドを送信すると判断されたとき、前記個別コマンドパターンを参照することによって、送信先の前記被管理装置に対応する形式の個別コマンドを生成するステップを、
さらに有することを特徴とする運用管理方法。
In the operation management method according to claim 4,
The storage unit further stores one or more individual command patterns indicating the format of the command received by each managed device for each type of the command,
In the step of executing the determination scenario, when the determination unit determines that the command is to be transmitted, an individual command having a format corresponding to the managed device as a transmission destination is generated by referring to the individual command pattern Step to
An operation management method, further comprising:
請求項4または請求項5に記載の運用管理方法において、
前記解析用シナリオのなかに、新たな形式のコマンドが、そのコマンドを受信したときに実行すべき処理と対応付けられて記述されている場合、
前記解析部は、前記運用管理装置が外部から前記新たな形式のコマンドを受信したときに、当該コマンドに対応付けられた前記実行すべき処理を実行して前記解析結果を生成する
ことを特徴とする運用管理方法。
In the operation management method according to claim 4 or 5,
In the analysis scenario, when a command in a new format is described in association with a process to be executed when the command is received,
When the operation management apparatus receives the new format command from the outside, the analysis unit executes the process to be executed associated with the command and generates the analysis result. Operation management method to do.
それぞれが自装置に関する所定のイベントの発生を通知する自装置固有の形式のイベントメッセージを送信し、受信した自装置固有の形式のコマンドにしたがって自装置の制御を行う1以上の被管理装置から前記イベントメッセージを受信するイベントメッセージ受信部と、
前記被管理装置から受信した前記イベントメッセージが示すイベント情報を解析して解析結果を生成する手順が記述された解析用シナリオ、前記解析結果についての判断の手順が記述された判断用シナリオ、及び、前記イベント情報の種別ごとに、各前記被管理装置が送信する前記イベントメッセージの形式を示した1以上の個別イベントパターンを記憶する記憶部と、
前記被管理装置から前記イベントメッセージを受信したとき、当該イベントメッセージを前記個別イベントパターンと照合することによって、当該イベントメッセージが示すイベント情報を取得し、前記取得したイベント情報に基づいて前記解析用シナリオを実行して前記解析結果を出力する解析部、及び、当該解析結果に基づいて前記判断用シナリオを実行して前記コマンドを送信するかまたはアラートを送信するかを判断する判断部
を備えることを特徴とする運用管理装置。
From one or more managed devices that each transmit an event message in a format unique to the own device for notifying the occurrence of a predetermined event related to the own device, and control the own device according to the received command in a format unique to the own device. An event message receiver for receiving event messages;
An analysis scenario describing a procedure for analyzing event information indicated by the event message received from the managed device and generating an analysis result, a determination scenario describing a determination procedure for the analysis result, and For each type of event information, a storage unit that stores one or more individual event patterns indicating the format of the event message transmitted by each managed device;
When the event message is received from the managed device, the event message indicated by the event message is acquired by collating the event message with the individual event pattern, and the analysis scenario is based on the acquired event information. And an analysis unit that outputs the analysis result and a determination unit that executes the determination scenario based on the analysis result and determines whether the command is transmitted or the alert is transmitted. An operation management device characterized by this.
請求項7に記載の運用管理装置において、
前記記憶部には、前記コマンドの種別ごとに、各前記被管理装置が受信する前記コマンドの形式を示した1以上の個別コマンドパターンがさらに記憶され、
前記判断部によって前記コマンドを送信すると判断されたとき、前記個別コマンドパターンを参照することによって、送信先の前記被管理装置に対応する形式の個別コマンドを生成して送信する制御部を備える
ことを特徴とする運用管理装置。
The operation management device according to claim 7,
The storage unit further stores one or more individual command patterns indicating the format of the command received by each managed device for each type of the command,
A control unit configured to generate and transmit an individual command in a format corresponding to the transmission destination managed device by referring to the individual command pattern when the determination unit determines to transmit the command. An operation management apparatus characterized by the above.
請求項7または請求項8に記載の運用管理装置において、
前記解析用シナリオのなかに、新たな形式のコマンドが、そのコマンドを受信したときに実行すべき処理と対応付けられて記述されている場合、
前記解析部は、外部から前記新たな形式のコマンドを受信したときに、当該コマンドに対応付けられた前記実行すべき処理を実行して前記解析結果を生成する
ことを特徴とする運用管理装置。
In the operation management device according to claim 7 or claim 8,
In the analysis scenario, when a command in a new format is described in association with a process to be executed when the command is received,
When the analysis unit receives a command of the new format from the outside, the operation management apparatus generates the analysis result by executing the process to be executed associated with the command.
JP2010182892A 2010-08-18 2010-08-18 Operation management system, operation management method, and operation management apparatus Active JP5514040B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010182892A JP5514040B2 (en) 2010-08-18 2010-08-18 Operation management system, operation management method, and operation management apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010182892A JP5514040B2 (en) 2010-08-18 2010-08-18 Operation management system, operation management method, and operation management apparatus

Publications (2)

Publication Number Publication Date
JP2012043121A JP2012043121A (en) 2012-03-01
JP5514040B2 true JP5514040B2 (en) 2014-06-04

Family

ID=45899368

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010182892A Active JP5514040B2 (en) 2010-08-18 2010-08-18 Operation management system, operation management method, and operation management apparatus

Country Status (1)

Country Link
JP (1) JP5514040B2 (en)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014241072A (en) * 2013-06-12 2014-12-25 日本電気通信システム株式会社 Instruction generation device, instruction generation method, and instruction generation program
JP6096700B2 (en) * 2014-03-28 2017-03-15 株式会社日立製作所 API providing system
FR3021138B1 (en) * 2014-05-16 2017-10-06 Bull EVENT CORRELATION ARCHITECTURE FOR SUPERCALCULATOR MONITORING
US10652103B2 (en) * 2015-04-24 2020-05-12 Goldman Sachs & Co. LLC System and method for handling events involving computing systems and networks using fabric monitoring system
JP7047621B2 (en) * 2018-06-21 2022-04-05 日本電信電話株式会社 Operation device and operation method
JP7090797B2 (en) * 2018-12-03 2022-06-24 セールスフォース ドット コム インコーポレイティッド Test engine for automatic operation management
WO2021090470A1 (en) * 2019-11-08 2021-05-14 日本電信電話株式会社 Operation device, maintenance management system, operation method, and program
WO2021156972A1 (en) * 2020-02-05 2021-08-12 日本電信電話株式会社 Maintenance management system, message control device, message control method, and program

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11110258A (en) * 1997-10-02 1999-04-23 Nec Corp Error message diagnostic device
JP2001092687A (en) * 1999-09-24 2001-04-06 Hitachi Ltd Integral operating system for computer and server system

Also Published As

Publication number Publication date
JP2012043121A (en) 2012-03-01

Similar Documents

Publication Publication Date Title
JP5514040B2 (en) Operation management system, operation management method, and operation management apparatus
CN108566290B (en) Service configuration management method, system, storage medium and server
US20170075746A1 (en) Information processing device and monitoring method
CN100549975C (en) Computer maintenance support system and analysis server
JP2006277696A (en) Job execution monitoring system, job control device and program, and job execution method
US20090070425A1 (en) Data processing system, method of updating a configuration file and computer program product
CN108632106A (en) System for monitoring service equipment
CN112785150A (en) Production line scheduling system and method based on automobile pressure sensor
JP5268589B2 (en) Information processing apparatus and information processing apparatus operating method
WO2022062661A1 (en) Operation notification method and apparatus, and storage medium and electronic apparatus
CN104486149B (en) A kind of finite state machine method for ground test
US8677323B2 (en) Recording medium storing monitoring program, monitoring method, and monitoring system
US9575865B2 (en) Information processing system and monitoring method
CN112787868B (en) Information synchronization method and device
CN108965382B (en) File transfer method, device, equipment and medium based on BMC (baseboard management controller)
CN111162959B (en) Parameter-based avionics interface data communication protocol fuzzy test method
CN102141973A (en) Cluster management method and device and cluster management and monitoring system
CN104834587B (en) Method and system for debugging RS-485 bus slave computer on line
US20120246286A1 (en) Modifying computer management request
CN108021407B (en) Service processing method and device based on network equipment
EP3780551A1 (en) Method and system for managing assets in a cloud computing environment
CN112214437A (en) Storage device, communication method and device and computer readable storage medium
WO2018173698A1 (en) Monitoring system, computer-readable storage medium, and monitoring method
JP2002149509A (en) Network management system
CN112583621B (en) Method, equipment and system for automatically quitting commissioning

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20121001

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20130201

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131022

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131112

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131224

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140325

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140328

R150 Certificate of patent or registration of utility model

Ref document number: 5514040

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150