JP7467078B2 - Monitoring device and program - Google Patents
Monitoring device and program Download PDFInfo
- Publication number
- JP7467078B2 JP7467078B2 JP2019208091A JP2019208091A JP7467078B2 JP 7467078 B2 JP7467078 B2 JP 7467078B2 JP 2019208091 A JP2019208091 A JP 2019208091A JP 2019208091 A JP2019208091 A JP 2019208091A JP 7467078 B2 JP7467078 B2 JP 7467078B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- unit
- group
- transaction
- application
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012806 monitoring device Methods 0.000 title claims description 34
- 230000005540 biological transmission Effects 0.000 claims description 4
- 230000006870 function Effects 0.000 description 46
- 230000004044 response Effects 0.000 description 46
- 238000005259 measurement Methods 0.000 description 31
- 230000001186 cumulative effect Effects 0.000 description 30
- 238000010586 diagram Methods 0.000 description 28
- 238000000034 method Methods 0.000 description 24
- 238000012545 processing Methods 0.000 description 20
- 238000001514 detection method Methods 0.000 description 17
- 230000005856 abnormality Effects 0.000 description 11
- 230000008569 process Effects 0.000 description 11
- 230000002159 abnormal effect Effects 0.000 description 9
- 238000005553 drilling Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 230000000052 comparative effect Effects 0.000 description 3
- RDYMFSUJUZBWLH-UHFFFAOYSA-N endosulfan Chemical compound C12COS(=O)OCC2C2(Cl)C(Cl)=C(Cl)C1(Cl)C2(Cl)Cl RDYMFSUJUZBWLH-UHFFFAOYSA-N 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Landscapes
- Computer And Data Communications (AREA)
Description
本発明は、監視装置及びプログラムに関する。 The present invention relates to a monitoring device and a program.
従来、コンピュータシステム全体を監視し、評価する方法が知られている。(例えば、特許文献1を参照)。 Conventionally, methods for monitoring and evaluating an entire computer system have been known (see, for example, Patent Document 1).
多数のアプリケーションオンラインサービスを提供する分散コンピュータ環境では、多くの物理サーバにおいて仮想技術を利用して構築された仮想マシン上でホストOSが稼動し、それらが、様々な役割を持つ論理サーバが構成されている。また、当該論理サーバ上で、当該アプリケーションが当該アプリケーションの様々なサービスの実行単位であるトランザクションが入り混じった状態(以下、トランザクションミックスと言う。)で、前記分散コンピュータ環境で実行される。このような複雑なコンピュータシステムの性能管理では、刻々と変化するトランザクション量とトランザクションミックスと、それに応じて変化するサーバの資源利用状況やミドルウェアの制御機能の活動状況を把握し、監視し、レポーティングを行う運用が必要とされる。さらに、アプリケーションが日々更新されることに伴い、監視対象となるトランザクションの種類も日々増加する。
これらを個々のホスト単位やトランザクション単位など、個別に管理することは容易ではなく、従来では、システム毎に個別の仕組みを構築して運用方法を確立した上で、システムを熟知しているシステム管理者や運用担当者のスキルに依存した運用が行われている。例えば、性能異常が発生した場合に、その影響範囲を特定したり、その異常の原因がアプリケーションに起因するものなのか、サーバに起因するものなのかを切り分け、アプリケーション開発者やシステム管理者が様々な情報を収集して分析し、問題個所の特定を行うという煩雑な手順と人のスキルに依存した問題判別を行っている。このような手法では異常発生原因の特定に時間がかかるという問題が生じていた。
すなわち、従来手法によると、システム管理者はコンピュータシステムに異常が発生していることを発見できても、トランザクションの種類が日々増加するため、その異常を引き起こす異常状態発生箇所、及び異常状態を引き起こす原因の特定には時間がかかるという問題があった。
In a distributed computer environment that provides many application online services, a host OS runs on a virtual machine constructed using virtual technology in many physical servers, and these virtual machines are configured as logical servers with various roles. Furthermore, on the logical servers, the application is executed in the distributed computer environment in a state where transactions, which are execution units of various services of the application, are mixed (hereinafter referred to as transaction mix). In performance management of such a complex computer system, it is necessary to grasp, monitor, and report on the ever-changing transaction volume and transaction mix, and the corresponding changes in server resource utilization status and middleware control function activity status. Furthermore, as applications are updated daily, the types of transactions to be monitored are also increasing daily.
It is not easy to manage these individually, such as by individual host or transaction, and so conventionally, individual mechanisms and operation methods were built for each system, and operations were then performed that depended on the skills of system administrators and operators who were familiar with the system. For example, when a performance anomaly occurred, the scope of the impact was identified, and whether the cause of the anomaly was due to the application or the server was determined, and the application developer or system administrator had to collect and analyze various information to identify the problem area, which was a cumbersome procedure and dependent on human skill. This method had the problem of taking a long time to identify the cause of the anomaly.
In other words, with conventional methods, even if a system administrator could discover that an abnormality had occurred in a computer system, because the number of transaction types increases daily, it took a long time to identify the location of the abnormal condition that caused the abnormality and the cause of the abnormal condition.
本発明は、このような状況に鑑みてなされたものであり、異常状態発生箇所及び異常状態を引き起こす原因の特定を容易にすることができる監視装置及びプログラムを提供することを目的とする。 The present invention was made in consideration of these circumstances, and aims to provide a monitoring device and program that can easily identify the location of an abnormal condition and the cause of the abnormal condition.
本発明の一態様に係る監視装置は、複数の論理サーバと前記論理サーバ上で動作する複数のアプリケーションとを含んで構成されるコンピュータシステム内においてやり取りされる情報伝達の実行単位であるトランザクションを識別する情報であり、前記トランザクションの宛先であるアプリケーションを上位階層識別子と下位階層識別子とにより示す宛先情報を含むトランザクション情報を取得するトランザクション情報取得部と、前記トランザクション情報に含まれる前記上位階層識別子が属するグループを示すアプリケーショングループ情報と前記上位階層識別子との対応関係を記憶するアプリケーショングループ情報記憶部から、取得された前記トランザクション情報が示す前記トランザクションが属するアプリケーショングループ情報を取得するアプリケーショングループ情報取得部と、取得された前記トランザクション情報が示す前記トランザクションの宛先のアプリケーションが複数のアプリケーショングループのうちいずれのアプリケーショングループに属するかを判定する判定部と、前記判定部が判定する結果に基づき、前記トランザクションについての統計演算を行う統計部と、前記統計部による統計演算の結果を出力する出力部とを有し、前記上位階層識別子は、さらに複数の識別子からなる階層構造を有しており、前記判定部は、階層順によって、より上位の識別子から下位の識別子に向けて判定を行い、少なくとも上位階層の識別子が一致した場合に、前記トランザクション情報が示す前記トランザクションが複数のアプリケーショングループのうちいずれのアプリケーショングループに属するかを判定する。 A monitoring device according to one aspect of the present invention has a transaction information acquisition unit that acquires transaction information, which is information identifying a transaction, which is an execution unit of information transmission exchanged within a computer system comprising a plurality of logical servers and a plurality of applications running on the logical servers, and which includes destination information indicating an application that is the destination of the transaction using an upper hierarchical identifier and a lower hierarchical identifier; an application group information acquisition unit that acquires application group information to which the transaction indicated by the acquired transaction information belongs from an application group information storage unit that stores a correspondence between application group information indicating a group to which the upper hierarchical identifier included in the transaction information belongs and the upper hierarchical identifier; a judgment unit that judges to which application group out of a plurality of application groups the application that is the destination of the transaction indicated by the acquired transaction information belongs; a statistics unit that performs statistical calculations on the transaction based on the result of the judgment by the judgment unit; and an output unit that outputs the result of the statistical calculation by the statistics unit, wherein the upper hierarchical identifier has a hierarchical structure composed of a plurality of identifiers, and the judgment unit makes a judgment in hierarchical order from a higher identifier to a lower identifier, and judges to which application group out of a plurality of application groups the transaction indicated by the transaction information belongs if at least the upper hierarchical identifiers match .
また、本発明の一態様に係る監視装置において、前記上位階層識別子は、ドメイン、中機能レベル、小機能レベルの3階層を有する。 In addition, in a monitoring device according to one aspect of the present invention, the upper hierarchical identifier has three hierarchical levels: domain, medium function level, and small function level.
また、本発明の一態様に係るプログラムは、コンピュータに、複数の論理サーバと前記論理サーバ上で動作する複数のアプリケーションとを含んで構成されるコンピュータシステム内においてやり取りされる情報伝達の実行単位であるトランザクションを識別する情報であり、前記トランザクションの宛先であるアプリケーションを上位階層識別子と下位階層識別子とにより示す宛先情報を含むトランザクション情報を取得するトランザクション情報取得ステップと、前記トランザクション情報に含まれる前記上位階層識別子が属するグループを示すアプリケーショングループ情報と前記上位階層識別子との対応関係を記憶するアプリケーショングループ情報記憶部から、取得された前記トランザクション情報が示す前記トランザクションが属するアプリケーショングループ情報を取得するアプリケーショングループ情報取得ステップと、取得された前記トランザクション情報が示す前記トランザクションの宛先のアプリケーションが複数のアプリケーショングループのうちいずれのアプリケーショングループに属するかを判定する判定ステップと、前記判定ステップにより判定された結果に基づき、前記トランザクションについての統計演算を行う統計ステップと、前記統計ステップにより統計演算された結果を出力する出力ステップとを実行させるプログラムであり、前記上位階層識別子は、さらに複数の識別子からなる階層構造を有しており、前記判定ステップは、階層順によって、より上位の識別子から下位の識別子に向けて判定を行い、少なくとも上位階層の識別子が一致した場合に、前記トランザクション情報が示す前記トランザクションが複数のアプリケーショングループのうちいずれのアプリケーショングループに属するかを判定する。
Also, a program according to one aspect of the present invention includes a transaction information acquisition step of acquiring transaction information, which is information identifying a transaction, which is an execution unit of information transmission exchanged within a computer system configured to include a plurality of logical servers and a plurality of applications running on the logical servers, and which includes destination information indicating an application that is a destination of the transaction by an upper hierarchical identifier and a lower hierarchical identifier; and an application group information acquisition step of acquiring application group information to which the transaction indicated by the acquired transaction information belongs from an application group information storage unit that stores a correspondence relationship between application group information indicating a group to which the upper hierarchical identifier included in the transaction information belongs and the upper hierarchical identifier. a determination step of determining to which of a plurality of application groups the application of the destination of the transaction indicated by the acquired transaction information belongs; a statistical step of performing statistical calculations on the transaction based on the result determined by the determination step; and an output step of outputting the result of the statistical calculation by the statistical step, wherein the upper layer identifier has a hierarchical structure made up of a plurality of identifiers, and the determination step performs a determination in hierarchical order from a higher identifier to a lower identifier, and when at least the identifiers of the higher layer match, it is determined to which of a plurality of application groups the transaction indicated by the transaction information belongs.
本発明によれば、多数のアプリケーションオンラインサービスを提供し、分散コンピュータ環境上で稼働する複数のコンピュータシステムの性能情報の把握を容易にし、異常状態発生箇所、及び異常状態を引き起こす原因の特定を可能にし、前記グループ情報に基づいた定期的なレポーティングを実現できる監視装置及びプログラムを提供できる。 The present invention provides a monitoring device and program that can provide multiple application online services, facilitate understanding of performance information for multiple computer systems running in a distributed computer environment, enable identification of the location of an abnormal state and the cause of the abnormal state, and realize periodic reporting based on the group information.
以下、本発明の実施形態について、図面を参照しながら説明する。
[システム監視装置1の概要]
図1は、実施形態におけるシステム監視装置の概要の一例を示す図である。
システム監視装置1は、監視対象システム2の監視を行う。この一例で監視とは、監視対象システム2の性能に関する情報をリアルタイムに、または一定時間ごとに計測し、提示することをいう。監視対象システム2の処理能力は、特定のホスト3又は特定のアプリケーション4にかかる負荷が変化することにより、変化する場合がある。例えば、監視対象システム2の処理能力は、特定のホスト3又は特定のアプリケーション4にかかる負荷が大きくなると、低下することがある。そこでシステム監視装置1は、監視対象システム2にかかる負荷が大きくなることにより処理能力が低下しているホスト3又はアプリケーション4を特定するべく、監視対象システム2を監視する。
Hereinafter, an embodiment of the present invention will be described with reference to the drawings.
[Overview of system monitoring device 1]
FIG. 1 is a diagram illustrating an example of an overview of a system monitoring device according to an embodiment.
The
監視対象システム2は、ホスト3と、アプリケーション4とを備える。
ホスト3は、物理サーバに備えられるアプリケーション4が動作するためのシステムである。1つの物理サーバに対して1つのホスト3が備えられてもよいし、1つの物理サーバに対して複数のホスト3が備えられてもよいし、複数の物理サーバに1つのホスト3が備えられていてもよい。
アプリケーション4は、ホスト3上で動作するプログラム等である。1つのホスト3上で1つのアプリケーション4が動作してもよいし、1つのホスト3上で複数のアプリケーション4が動作してもよいし、複数のホスト3上で1つのアプリケーション4が動作してもよい。
この一例でホスト3は、ウェブアプリケーションサーバ(以下、APサーバとする。)、オペレーティングシステム(以下、OSとする。)、仮想マシン(以下、VMとする。)、論理サーバ、物理サーバ、ネットワーク、データベースマネジメントシステム(以下、DBMSとする。)等を含む。
また、この一例でアプリケーション4は、WUI(ウェブユーザーインターフェース)、ウェブアプリケーション、サービスインターフェース、ビジネスロジック、インテグレーションロジック、データベースリソース等を含む。
つまり、この一例で監視対象システム2は、複数の論理サーバであるホスト3とホスト3上で動作する複数のアプリケーション4とを含んで構成される。
The monitored
The
The application 4 is a program or the like that runs on the
In this example, the
In this example, the application 4 includes a WUI (Web User Interface), a web application, a service interface, business logic, integration logic, database resources, and the like.
That is, in this example, the monitored
[システム監視装置1の機能構成]
図2は、実施形態におけるシステム監視装置の機能構成の一例を示す図である。
システム監視装置1は、トランザクション情報取得部100と、グループ判定部200と、制御部300と、出力部400と、操作検出部5とを備える。
[Functional configuration of system monitoring device 1]
FIG. 2 is a diagram illustrating an example of a functional configuration of the system monitoring device according to the embodiment.
The
操作検出部5は、ユーザからの操作を検出するデバイス(不図示)を備えており、ユーザの操作に応じた情報を取得する。ユーザの操作を検出するデバイスには、スイッチ、キーボード、ポインティングデバイス、音声認識デバイスなどが含まれていてもよい。
ここで、ユーザとは、例えばシステム監視装置1を使用する者である。監視対象システム2を使用する事業者の従業員であってもよいし、監視対象システム2のメンテナンスを担当する者であってもよい。
The
Here, the user refers to, for example, a person who uses the
トランザクション情報取得部100は、監視対象システム2よりトランザクション情報TXIを取得する。トランザクション情報TXIとは、トランザクションを識別する情報である。トランザクションとは、システム内においてやり取りされる情報伝達の実行単位である。
トランザクション情報TXIは、トランザクションの宛先であるアプリケーションを示す宛先情報を含む。また、トランザクション情報TXIは、複数のホストのうち一のホストを識別するホスト情報を含む。つまりトランザクションとは監視対象システム2内で行われた処理であり、当該処理が行われたホスト3とアプリケーション4を特定する情報を含む。
トランザクション情報取得部100は、監視対象システム2より取得したトランザクション情報TXIを、グループ判定部200及び制御部300に提供する。
The transaction
The transaction information TXI includes destination information that indicates the application that is the destination of the transaction. The transaction information TXI also includes host information that identifies one of multiple hosts. In other words, a transaction is a process that is performed within the monitored
The transaction
グループ判定部200は、論理サーバグループ情報取得部210と、論理サーバグループ情報記憶部220と、アプリケーショングループ情報取得部230と、アプリケーショングループ情報記憶部240と、判定部250とを備える。
The
ここでグループとは、監視対象システム2を装置単位や機能単位などに基づき分割した1単位である。この一例でグループには、論理サーバに基づく単位で分割した論理サーバグループと、アプリケーションに基づく単位で分割したアプリケーショングループとがある。
図3は、実施形態におけるグループの一例を示す図である。この図に示した一例において監視対象システム2は、論理サーバごとに分割したサーバV100とサーバV200とを備える。サーバV100は、ホストV110とホストV120とを備える。サーバV200は、ホストV210とホストV220とを備える。このように監視対象システム2は、階層を分けて論理サーバごとにグループ化される。つまり、論理サーバグループ情報VSGIは、複数のホスト情報で構成されるコンピュータシステムを一のグループとして定義した第一の論理サーバグループと、複数の第一の論理サーバグループを一のグループとして定義した第二の論理サーバグループとを備える。
また、この図に示した一例において監視対象システム2は、アプリケーションごとに分割したドメインA100とドメインA200とを備える。
ドメインA100は中機能レベルA110と中機能レベルA120とを備える。中機能レベル110は、小機能レベル111を備える。中機能レベル210は、小機能レベルA211と、小機能レベルA212とを備える。このように監視対象システム2は、階層を分けてアプリケーションごとにグループ化される。つまり、アプリケーショングループ情報は、複数の宛先情報を持つコンピュータシステムを一のグループとして定義した第一のアプリケーショングループと、複数の第一のアプリケーショングループを一のグループとして定義した第二のアプリケーショングループと、複数の第二のアプリケーショングループを一のグループとして定義した第三のアプリケーショングループと、複数の第三のアプリケーショングループを一のグループとして定義した第四のアプリケーショングループとを備える。
Here, a group is a unit obtained by dividing the monitored
3 is a diagram showing an example of a group in an embodiment. In the example shown in this figure, the monitored
In the example shown in this figure, the monitored
The domain A100 includes a medium function level A110 and a medium function level A120. The medium function level 110 includes a
図2に戻り、判定部250は、トランザクション情報取得部100からトランザクション情報TXIを取得し、取得したトランザクション情報TXIを論理サーバグループ情報取得部210及びアプリケーショングループ情報取得部230に提供する。
論理サーバグループ情報記憶部220は、ホスト情報と複数のホスト情報を一のグループとして定義した論理サーバグループとの対応関係を示す論理サーバグループ情報を記憶する。つまり論理サーバグループ情報記憶部220は、ホスト情報をグループ化し、それぞれのホスト情報がどのグループに属するかの情報を記憶する。
論理サーバグループ情報取得部210は、判定部250から取得するトランザクション情報TXIに基づいて、当該トランザクションが属する論理サーバグループを論理サーバグループ情報記憶部220から取得する。論理サーバグループ情報取得部210は、当該トランザクションが属する論理サーバグループを論理サーバグループ情報VSGIとして判定部250に提供する。
アプリケーショングループ情報記憶部240は、宛先情報と複数の宛先情報を一のグループとして定義したアプリケーショングループとの対応関係を示すアプリケーショングループ情報を記憶する。つまり、アプリケーショングループ情報記憶部240は、宛先情報をグループ化し、それぞれの宛先情報がどのグループに属するかの情報を記憶する。
アプリケーショングループ情報取得部230は、判定部250から取得するトランザクション情報TXIに基づいて、当該トランザクションが属するアプリケーショングループをアプリケーショングループ情報記憶部240から取得する。アプリケーショングループ情報取得部230は、当該トランザクションが属するアプリケーショングループをアプリケーショングループ情報APGIとして、判定部250に提供する。
グループ情報取得部260は論理サーバグループ情報取得部210とアプリケーショングループ情報取得部230とを備える。グループ情報取得部260は宛先情報と複数の宛先情報を一のグループとして定義したアプリケーショングループとの対応関係を示すアプリケーショングループ情報APGIを記憶するアプリケーショングループ情報記憶部240、及びホスト情報と複数のホスト情報を一のグループとして定義した論理サーバグループとの対応関係を示す論理サーバグループ情報VSGIを記憶する論理サーバグループ情報記憶部220のうちの少なくとも一方から、トランザクション情報取得部100が取得するトランザクション情報TXIが属するグループについてのグループ情報を取得する。
Returning to FIG. 2, the
The logical server group
The logical server group
The application group
The application group
The group
判定部250は、アプリケーショングループ情報取得部230が取得するアプリケーショングループ情報と、論理サーバグループ情報取得部210が取得する論理サーバグループ情報とに基づき、当該トランザクション(すなわち、トランザクション情報取得部100が取得するトランザクション情報TXIが示すトランザクション)の属するアプリケーショングループ又は論理サーバグループの両方を判定する。
具体的には、判定部250は、トランザクションがどのアプリケーショングループに属するのか、また、該当トランザクションが実行されるホストがどの論理サーバグループに属するのかについて判定する。判定部250によるアプリケーショングループ及び論理サーバグループの判定結果を、総称してグループ判定結果とも称する。
なお、判定部250は、アプリケーショングループと論理サーバグループのうち、いずれか一方のみについて判定するようにしてもよい。
判定部250は、当該トランザクションが属する論理サーバグループと、アプリケーショングループとの情報(つまり、グループ判定結果)を、トランザクション情報TXIに付加し、トランザクショングループ情報TXGIとして制御部300に提供する。判定部250は、論理サーバグループ情報取得部210から取得する論理サーバグループ情報VSGI及びアプリケーショングループ情報取得部230から取得するアプリケーショングループ情報APGIを制御部300に提供する。
以下、制御部300の機能構成の詳細について図4を参照して説明する。
The
Specifically, the
The determining
The
The functional configuration of the
[システム監視装置1が備える制御部300の機能構成]
図4は、実施形態におけるシステム監視装置が備える制御部300の機能構成の一例を示す図である。
[Functional configuration of the
FIG. 4 is a diagram showing an example of the functional configuration of the
制御部300は、トランザクション情報取得部100よりトランザクション情報TXIを取得し、グループ判定部200より、トランザクショングループ情報TXGIを取得する。また、制御部300は、性能情報SPIと、累計性能情報ASPIと、統計後性能情報SSPIと、警告情報ALIとを出力部400に提供する。
制御部300は、計測部310と、統計部320と、グループ選択情報取得部330と、比較部340と、警告部350と、閾値情報取得部360と表示選択部370とを備える。
The
The
計測部310は、システムの性能を測る指標を計測する。
システムの性能を測る指標には、トランザクション情報TXIに基づくシステムの性能を測る指標と、トランザクション情報TXIに基づかないシステムの性能を測る指標とがある。
The
The indicators for measuring the system performance include an indicator for measuring the system performance based on the transaction information TXI, and an indicator for measuring the system performance not based on the transaction information TXI.
トランザクション情報TXIに基づくシステムの性能を測る指標とは、例えば、応答時間、単位時間当たりのトランザクション数(以下、TRX要求件数とする。)等である。
計測部310は、トランザクション情報TXIに基づいて、システムの性能を測る指標を計測する。
具体的には、計測部310は、トランザクション情報取得部100からトランザクション情報TXIを取得する。計測部310は、取得したトランザクション情報TXIが示すトランザクションに基づいて、性能情報SPIを計測する。ここで性能情報SPIとは、システムの性能を測る指標についての情報である。この一例において性能情報SPIとは、応答時間、TRX要求件数等である。
Indicators for measuring system performance based on transaction information TXI include, for example, response time, the number of transactions per unit time (hereinafter referred to as the number of TRX requests), and the like.
The
Specifically, the
トランザクション情報TXIに基づかないシステムの性能を測る指標とは、例えば、OSやミドルウェア(OLTPやDBMS)等の活動やリソース情報に基づくシステムの性能を測る指標である。トランザクション情報TXIに基づかないシステムの性能を測る指標は、例えば、単位時間当たりのOSの単位時間当たりのページングやOLTPのメモリ管理処理等の活動指標であったり、CPU使用率、メモリ使用率等のリソース利用状況指標等である。
計測部310は、不図示のリソース情報取得部が監視対象システム2から取得するリソース情報に基づいて、システムの性能を測る指標を計測する。
リソース情報取得部は、監視対象システム2が備えるOS、ミドルウェア、アプリケーション、ソフトウェア等からリソース情報を取得する。
リソース情報は、監視対象システム2が備える物理的リソース及び論理的リソースの使用状況を示す情報を含む。つまり、リソース情報取得部は、監視対象システム2が備えるリソースの使用状況を示す情報を含むリソース情報を取得する。
具体的には、計測部310は、リソース情報取得部からリソース情報を取得する。計測部310は、取得したリソース情報に基づいて、性能情報SPIを計測する。ここで性能情報SPIとは、システムの性能を測る指標についての情報である。この一例において性能情報SPIとは、CPU使用率、メモリ使用率、TPS等である。
計測部310は、計測した性能情報SPIを、比較部340および統計部320に提供する。
An index for measuring the performance of a system not based on transaction information TXI is, for example, an index for measuring the performance of a system based on the activity or resource information of an OS or middleware (OLTP or DBMS), etc. An index for measuring the performance of a system not based on transaction information TXI is, for example, an activity index such as paging per unit time of an OS or memory management processing per unit time of an OLTP, or a resource utilization status index such as a CPU utilization rate or a memory utilization rate.
The
The resource information acquisition unit acquires resource information from the OS, middleware, applications, software, etc., included in the monitored
The resource information includes information indicating the usage status of the physical resources and logical resources provided in the monitored
Specifically, the
The
閾値情報取得部360は、ユーザにより設定されたシステムの性能を測る指標に対する閾値を取得する。
具体的には、閾値情報取得部360は、操作検出部5がユーザの操作を検出することにより、閾値情報THIを取得する。ここで閾値情報THIとは、システムの性能を測る指標に対してユーザが設定する閾値である。閾値情報THIは、システムの性能を測る指標ごとに設定することができる。例えば、応答時間がシステムの性能を測る指標となるシステムの場合、任意の時間を閾値情報THIとして設定することができる。同様に、TRX要求件数、CPU使用率、メモリ使用率等を閾値情報THIとして設定できる。
また、グループ毎に閾値情報THIを設定することも可能である。具体的には、閾値情報THIは、宛先、ホスト、アプリケーショングループ又は論理サーバグループ毎に設定可能である。例えば、ある特定のアプリケーションについて監視したい場合、当該アプリケーションに対して閾値情報THIを設定することで、当該アプリケーションの監視をすることができる。
閾値情報取得部360は、比較部340に対して、閾値情報THIを提供する。
The threshold
Specifically, the threshold
It is also possible to set the threshold information THI for each group. Specifically, the threshold information THI can be set for each destination, host, application group, or logical server group. For example, when it is desired to monitor a specific application, the application can be monitored by setting the threshold information THI for the application.
The threshold
比較部340は、閾値情報取得部360が取得する閾値と、計測部310が計測するシステムの性能を測る指標とを比較する。
具体的には、比較部340は、閾値情報取得部360より閾値情報THIを、計測部310より性能情報SPIを取得する。比較部340は、取得した閾値情報THIと、性能情報SPIとを比較する。例えばユーザが、監視対象システム2の応答時間について、任意の時間を閾値情報THIとして設定したとする。比較部340は、計測部310が計測する応答時間と、閾値情報取得部360が取得する閾値情報THIを比較する。比較部340は、計測部310により計測される応答時間が、閾値情報取得部360により取得される閾値情報THIの範囲内にある場合、正常状態であると判定する。また、応答時間が閾値情報THIの範囲外にある場合、異常状態であると判定する。つまり比較部340は、計測部310が計測するシステムの性能を測る指標である性能情報SPIに基づき、性能情報SPIが閾値情報THIを超えるか否かの比較を行う。
比較部340は、比較した結果を比較性能情報CPIとして警告部350及び統計部320に提供する。
The
Specifically, the
The
グループ選択情報取得部330は、ユーザにより選択されたグループを操作検出部5から取得する。
The group selection
統計部320は、計測部310が計測するシステムの性能を測る指標についての統計処理を行う。例えば、統計部320は、システムの性能を測る指標についての単位時間ごとの平均値等を求める統計処理を行う。
具体的には、統計部320は、比較部340より比較性能情報CPIを取得し、計測部310より性能情報SPIを取得し、グループ判定部200よりトランザクショングループ情報TXGIを取得する。統計部320は、取得した情報(例えば、比較性能情報CPI、性能情報SPI及びトランザクショングループ情報TXGI)に基づき、統計処理を行う。
一例として、統計部320は、性能情報SPIに基づき、累計性能情報ASPIと、統計後性能情報SSPIと、グループ別統計情報GSPIとを算出する。
累計性能情報ASPIとは、性能情報SPIについて統計処理を行った結果である。より具体的には、この一例において累計性能情報ASPIとは、X軸に時間を取り、Y軸に性能情報SPIをとった2次元のグラフで表される情報である。
統計後性能情報SSPIとは、性能情報SPIと、比較性能情報CPIとに基づき、統計処理を行った結果である。より具体的には、この一例において統計後性能情報SSPIとは、X軸に時間を取り、Y軸に性能情報SPIが閾値の範囲外にあった回数をとった2次元のグラフで表される情報である。
グループ別統計情報GSPIとは、トランザクショングループ情報TXGIに基づき、グループ毎に性能情報SPIについて統計処理を行った結果である。より具体的には、この一例においてグループ別統計情報GSPIとは、X軸に時間を取り、Y軸に特定のグループの性能情報SPIをとった2次元のグラフで表される情報である。上述した通り、グループには、論理サーバグループ及びアプリケーショングループが存在し、またそれぞれのグループは複数のグループを備えることがある。したがって、グループ別統計情報GSPIは、論理サーバグループ情報記憶部220及びアプリケーショングループ情報記憶部240に記憶されているグループごとに分かれている。つまり統計部320は、グループ判定部200が判定するトランザクショングループ情報TXGIに基づき、トランザクション情報TXIが示すトランザクションについての統計演算を行う。
統計部320は、性能情報SPIと、累計性能情報ASPIと、統計後性能情報SSPIと、グループ別統計情報GSPIとを表示選択部370に提供する。
The
Specifically, the
As an example, the
The cumulative performance information ASPI is a result of performing statistical processing on the performance information SPI. More specifically, in this example, the cumulative performance information ASPI is information represented on a two-dimensional graph with time on the X-axis and the performance information SPI on the Y-axis.
The post-statistics performance information SSPI is a result of performing statistical processing based on the performance information SPI and the comparative performance information CPI. More specifically, in this example, the post-statistics performance information SSPI is information represented as a two-dimensional graph with time on the X-axis and the number of times the performance information SPI was outside the threshold range on the Y-axis.
The group-specific statistical information GSPI is a result of performing statistical processing on the performance information SPI for each group based on the transaction group information TXGI. More specifically, in this example, the group-specific statistical information GSPI is information represented by a two-dimensional graph with time on the X-axis and performance information SPI of a specific group on the Y-axis. As described above, a group includes a logical server group and an application group, and each group may include multiple groups. Therefore, the group-specific statistical information GSPI is divided into groups stored in the logical server group
The
グループ選択情報取得部330は、操作検出部5がユーザの操作を検出することにより、グループ選択情報SGIを取得する。ここでグループ選択情報SGIとは、ユーザが選択するグループの情報である。ユーザは監視対象システム2に異常が発生していることを発見した場合、その異常を引き起こす異常状態発生箇所の特定を行う。システム監視装置1において、システムの性能を測る指標は、グループごとに表示することが可能である。選択されるグループの一例について、図3に戻って説明を行う。
例えば監視対象システム2の応答時間が、ユーザが設定する閾値情報THIを超えている状況において、ユーザが異常発生個所の特定を行う場合について説明する。この一例においてユーザは操作検出部5を通じて、サーバV100を選択する。グループ選択情報取得部330はサーバV100が選択されたことをグループ選択情報SGIとして取得し、表示選択部370に提供する。表示選択部370は、ユーザにより選択されたサーバV100の応答時間を出力部400に提供する。もし、サーバV100の応答時間が監視対象システム2の応答時間と同様に閾値情報THIで設定した範囲を超えていた場合、原因はサーバV100にあることが推定される。さらにユーザは、サーバV100を構成するホストV110やホストV120等のグループを選択し、応答時間を確かめることにより、異常発生箇所の特定を行うことが可能となる。
またユーザは、操作検出部5を通じて、アプリケーションについても特定する事が可能である。この一例において、監視対象システム2の応答時間が閾値情報THIの範囲外にある場合、異常の発生原因がハードウェアによるものか、ソフトウェアによるものかの判断が難しい場合がある。そこで、ソフトウェアによる異常発生箇所を特定するため、アプリケーションごとのアプリケーショングループを選択することにより、アプリケーションに問題がある場合の異常発生箇所も特定が可能である。この一例においてユーザは操作検出部5を通じて、ドメインA100を選択する。グループ選択情報取得部330はドメインA100が選択されたことをグループ選択情報SGIとして取得し、表示選択部370に提供する。表示選択部370は、ユーザにより選択されたドメインA100の応答時間を出力部400に提示させる。もし、ドメインA100の応答時間が監視対象システム2の応答時間と同様に閾値情報THIで設定した範囲を超えていた場合、原因はドメインA100にあることが推定される。さらにユーザは、ドメインA100を構成するドメインA110やドメインA120等のグループを選択し、応答時間を確かめることにより、異常が発生しているアプリケーションの特定を行うことが可能となる。
つまり、グループ選択情報SGIとは、統計部320が行った統計演算の結果が出力部400から出力されることに応じて選択されるアプリケーショングループまたは論理サーバグループを選択するグループ選択情報である。
グループ選択情報取得部330は、取得したグループ選択情報SGIを、表示選択部370に提供する。
The group selection
For example, a case where a user specifies the location of an abnormality when the response time of the monitored
The user can also specify the application through the
In other words, the group selection information SGI is group selection information that selects an application group or a logical server group that is selected in response to the result of the statistical calculation performed by the
The group selection
表示選択部370は、統計部320が統計処理を行った結果について、出力部400に提供する情報を選択する。
具体的には、表示選択部370は、統計部320より性能情報SPIと、累計性能情報ASPIと、統計後性能情報SSPIと、グループ別統計情報GSPIとを取得し、グループ選択情報取得部330よりグループ選択情報SGIを取得する。表示選択部370は、グループ選択情報SGIに基づき、統計部320が行った統計演算の結果の中から、(前記出力部による)出力対象の統計演算の結果を選択する。表示選択部370は、性能情報SPIと、累計性能情報ASPIと、統計後性能情報SSPIと、グループ別統計情報GSPIとを提供する。
The
Specifically, the
警告部350は、比較部340が比較した結果、システムの性能を測る指標が閾値を超えた場合に、警告を行う。
具体的には、警告部350は、比較部340より比較性能情報CPIを取得する。警告部350は、性能情報SPIが閾値情報THIを超えていた場合に、警告情報ALIを出力部400に提供する。警告部350は、比較性能情報CPIが示す閾値を超えた性能情報SPIの値と、宛先又はホストと、アプリケーショングループ又は論理サーバグループとを、出力部に提示させる。
ここで性能情報SPIは、瞬間的に比較性能情報CPIを超える場合がある。ユーザが異常箇所の特定や原因の特定を目的としている場合において、警告の閾値を超えたとしても、その期間が非常に短い場合(例えば、瞬間的なノイズなどの場合)には、システム監視装置1はユーザに対する警告の必要がない場合がある。そこで、警告部350は、性能情報SPIが閾値情報THIを超えている時間が所定の判定時間を超える場合に出力部400に対して警告情報ALIを提供する。
性能情報SPIが閾値情報THIを超えている時間が所定の判定時間を超えるか否かの判定には、時間を測定する方法と、回数を測定する方法とがある。
時間を測定する方法とは、性能情報SPIが閾値情報THIを上回った時点から、性能情報SPIが閾値情報THIを下回った時点までの時間が、所定の判定時間を超えるか否かの判定を行う方法である。警告部350は、性能情報SPIが閾値情報THIを上回っている時間が所定の判定時間を超えた場合に、出力部400に対して警告情報ALIを提供する。
回数を測定する方法とは、所定の時間ごとに性能情報SPIが閾値情報THIを超えているか否かを測定し、性能情報SPIが閾値情報THIを超えた回数が、所定回数に達したか否かの判定を行う方法である。警告部350は、性能情報SPIが閾値情報THIを超えた回数が、所定回数に達した場合に、出力部400に対して警告情報ALIを提供する。
時間を測定する方法と、回数を測定する方法とは、いずれも性能情報SPIが閾値情報THIを超えている時間を測定している。警告部350は、所定の判定時間を超える場合に出力部400に対して警告情報ALIを提供する。
すなわち、警告部350は、瞬間的に性能情報SPIが悪化した場合などのノイズによって警告が行われてしまう頻度を低減することができる。
The
Specifically, the
Here, the performance information SPI may momentarily exceed the comparative performance information CPI. When the user is trying to identify the location or cause of an anomaly, even if the warning threshold is exceeded, if the period of time is very short (for example, in the case of momentary noise, etc.), the
The method of determining whether the time during which the performance information SPI exceeds the threshold information THI exceeds a predetermined determination time includes a method of measuring the time and a method of measuring the number of times.
The method of measuring time is a method of judging whether or not the time from when the performance information SPI exceeds the threshold information THI to when the performance information SPI falls below the threshold information THI exceeds a predetermined judgment time. When the time during which the performance information SPI exceeds the threshold information THI exceeds the predetermined judgment time, the
The method of measuring the number of times is a method of measuring whether or not the performance information SPI exceeds the threshold information THI at predetermined time intervals, and judging whether or not the number of times the performance information SPI exceeds the threshold information THI reaches a predetermined number. The
In both the method of measuring the time and the method of measuring the number of times, the time during which the performance information SPI exceeds the threshold information THI is measured. The
In other words, the
出力部400は、制御部300の表示選択部370より、性能情報SPIと、累計性能情報ASPIと、統計後性能情報SSPIと、グループ別統計情報GSPIと、警告情報ALIとを取得する。出力部400は、取得した性能情報SPIと、累計性能情報ASPIと、統計後性能情報SSPIと、グループ別統計情報GSPIと、警告情報ALIとを、出力する。一例として、出力部400は、性能情報SPIと、累計性能情報ASPIと、警告情報ALIと統計後性能情報SSPIと、グループ別統計情報GSPIとを表示部(不図示)に出力することで、表示させる。表示部は、例えば液晶表示面である。表示部は、画像表示装置であるとして説明するが、これに限られず、プリンタ装置やスピーカ装置などの情報出力装置として構成されていてもよい。
すなわち、出力部400は、性能情報SPIと、累計性能情報ASPIと、統計後性能情報SSPIと、グループ別統計情報GSPIと、警告情報ALIとを出力する。
The
That is, the
[システム監視装置1の画面構成]
図5は、実施形態におけるシステム監視装置の画面構成の一例を示す図である。この一例では、出力部400は、同図に示すダッシュボード画面D900を、不図示の表示部に表示させる。ダッシュボード画面D900は、累積性能情報画像D100と、性能情報画像D300と、選択情報画像D500とを画面の構成要素として備える。
[Screen configuration of system monitoring device 1]
5 is a diagram showing an example of a screen configuration of a system monitoring device in an embodiment. In this example, the
累積性能情報画像D100は、累積平均応答時間表示画像D110と、累積TRX要求件数表示画像D120と、累積CPU使用率表示画像D130とを画面の構成要件として備えている。累積平均応答時間表示画像D110、累積TRX要求件数表示画像D120、及び累積CPU使用率表示画像D130は、累計性能情報ASPIに基づいて表示される。
この一例において累積平均応答時間表示画像D110は、横軸(以後、X軸とする。)に時間を、縦軸(以後、Y軸とする。)に平均応答時間をとっている。つまり累積平均応答時間表示画像D110は、時間ごとの平均応答時間を示している。
累積TRX要求件数表示画像D120は、X軸に時間を、Y軸にTRX要求件数をとっている。つまり、累積TRX要求件数表示画像D120は、時間ごとのTRX要求件数を示している。
累積CPU使用率表示画像D130は、X軸に時間を、Y軸にCPU使用率をとっている。つまり、累積CPU使用率表示画像D130は、時間ごとのCPU使用率を示している。
累積平均応答時間表示画像D110、累積TRX要求件数表示画像D120、及び累積CPU使用率表示画像D130は、時間が経過するごとに更新されてもよい。この一例において、X軸は画面左側が古い時点における情報であり、画面右側は新しい時点における情報である。累積平均応答時間表示画像D110、累積TRX要求件数表示画像D120、及び累積CPU使用率表示画像D130は、単位時間経過に伴う更新時において、表示されている値は全体が画面左にシフトし、画面左側の最も古い情報が非表示となる。画面右側の空いた箇所に新しい情報が表示される。つまり、値が時間と共にスクロールすることで、ユーザはシステムの性能を測る指標をリアルタイムに監視することができる。
The cumulative performance information image D100 includes, as screen components, a cumulative average response time display image D110, a cumulative number of TRX requests display image D120, and a cumulative CPU utilization display image D130. The cumulative average response time display image D110, the cumulative number of TRX requests display image D120, and the cumulative CPU utilization display image D130 are displayed based on the cumulative performance information ASPI.
In this example, the cumulative average response time display image D110 has time on the horizontal axis (hereinafter, referred to as the X-axis) and average response time on the vertical axis (hereinafter, referred to as the Y-axis). In other words, the cumulative average response time display image D110 shows the average response time for each hour.
The cumulative TRX request number display image D120 has time on the X-axis and the number of TRX requests on the Y-axis. That is, the cumulative TRX request number display image D120 shows the number of TRX requests for each hour.
The accumulated CPU utilization rate display image D130 has time on the X-axis and CPU utilization rate on the Y-axis. That is, the accumulated CPU utilization rate display image D130 shows the CPU utilization rate for each hour.
The cumulative average response time display image D110, the cumulative number of TRX requests display image D120, and the cumulative CPU utilization display image D130 may be updated every time time passes. In this example, the X-axis is information at an older time point on the left side of the screen, and information at a newer time point on the right side of the screen. When updating the cumulative average response time display image D110, the cumulative number of TRX requests display image D120, and the cumulative CPU utilization display image D130 with the passage of a unit time, the displayed values are shifted to the left of the screen as a whole, and the oldest information on the left side of the screen is hidden. New information is displayed in the empty space on the right side of the screen. In other words, the values scroll over time, allowing the user to monitor the indicators that measure the performance of the system in real time.
性能情報画像D300は、平均応答時間表示画像D310と、TRX要求件数表示画像D320と、CPU使用率表示画像D330と、メモリ使用率表示画像D340と、TPS表示画像D350とを画面の構成要件として備えている。平均応答時間表示画像D310、TRX要求件数表示画像D320、CPU使用率表示画像D330、メモリ使用率表示画像D340、及びTPS表示画像D350は、性能情報SPIに基づいて表示される。平均応答時間表示画像D310は、応答時間の単位時間当たりの平均値を示している。TRX要求件数表示画像D320は、TRX要求件数の単位時間当たりの平均値を示している。CPU使用率表示画像D330は、CPU使用率の単位時間当たりの平均値を示している。メモリ使用率表示画像D340は、メモリ使用率の単位時間当たりの平均値を示している。TPS表示画像D350は、TPSの単位時間当たりの平均値を示している。単位時間は任意に設定可能である。この一例においての単位時間は、累積性能情報画像D100で示されるX軸の時間と同一の時間を用いている。 The performance information image D300 includes an average response time display image D310, a number of TRX requests display image D320, a CPU utilization display image D330, a memory utilization display image D340, and a TPS display image D350 as screen components. The average response time display image D310, the number of TRX requests display image D320, the CPU utilization display image D330, the memory utilization display image D340, and the TPS display image D350 are displayed based on the performance information SPI. The average response time display image D310 shows the average value per unit time of the response time. The number of TRX requests display image D320 shows the average value per unit time of the number of TRX requests. The CPU utilization display image D330 shows the average value per unit time of the CPU utilization. The memory utilization display image D340 shows the average value per unit time of the memory utilization. The TPS display image D350 shows the average value of the TPS per unit time. The unit time can be set arbitrarily. In this example, the unit time is the same as the time on the X-axis shown in the cumulative performance information image D100.
また別の実施例として、性能情報画像D300は、瞬時値を示してもいい。その場合、累積性能情報画像D100が備える瞬時値計測バーによりどの時点の値を表示するかを決定する。累積平均応答時間表示画像D110は、平均応答時間瞬時値計測バーD111を備えている。平均応答時間瞬時値計測バーD111は、操作検出部5により検出したユーザの操作により、移動される。操作検出部5が検出した操作は、不図示の計測バー操作取得部により取得され、表示選択部370に提供される。表示選択部370は、平均応答時間瞬時値計測バーD111が示す時点の瞬時値を、平均応答時間表示画像D310として、出力部400に出力する。
累積平均応答時間表示画像D110と同様に、累積TRX要求件数表示画像D120は、TRX要求件数瞬時値計測バーD121を備えている。表示選択部370は、TRX要求件数瞬時値計測バーD121の操作により検出された時点の瞬時値を、TRX要求件数表示画像D320として、出力部400に出力する。
同様に、累積CPU使用率表示画像D130は、CPU使用率瞬時値計測バーD131を備えている。CPU使用率瞬時値計測バーD131の操作により検出された時点の瞬時値を、CPU使用率表示画像D330として、出力部400に出力する。
As another example, the performance information image D300 may show an instantaneous value. In that case, the instantaneous value measurement bar included in the cumulative performance information image D100 determines which value is to be displayed at which point in time. The cumulative average response time display image D110 includes an average response time instantaneous value measurement bar D111. The average response time instantaneous value measurement bar D111 is moved by a user operation detected by the
Like the cumulative average response time display image D110, the cumulative TRX request number display image D120 includes a TRX request number instantaneous value measurement bar D121. The
Similarly, the accumulated CPU utilization rate display image D130 includes a CPU utilization rate instantaneous value measurement bar D131. An instantaneous value at a point in time detected by operating the CPU utilization rate instantaneous value measurement bar D131 is output to the
選択情報画像D500は、応答時間分布画像D510と、サーバグループ別CPU使用率表示画像D520と、アプリ閾値違反件数表示画像D530と、インフラ閾値違反件数表示画像D540とを画面の構成要件として備える。
応答時間分布画像D510は、応答時間の分布を示している。X軸には時間の範囲が示され、Y軸には該当するトランザクションの件数を百分率で表している。応答時間分布画像D510は、累計性能情報ASPIに含まれる情報を使用している。統計部320は、性能情報SPIに含まれる応答時間について統計処理を行い、統計後性能情報SSPIとして表示選択部370に提供する。ユーザは、応答時間分布画像D510により、累積平均応答時間表示画像D110と比較して、より統計的にシステムの性能を監視することができる。
サーバグループ別CPU使用率表示画像D520は、グループ別にCPU使用率及びメモリ使用率を表示したものである。グループ選択情報取得部330は、操作検出部5がユーザから取得したグループ選択情報SGIを取得する。グループ選択情報取得部330は表示選択部370にグループ選択情報SGIを提供する。表示選択部370はグループ選択情報SGIに基づき、表示するグループを選択する。表示選択部370は、グループ別統計情報GSPIとして出力部400に出力する。この一例では、論理サーバグループごとにCPU使用率及びメモリ使用率を表示している。グループ選択情報SGIにより選択されているグループは、グループ1、グループ2、及びグループ3である。
アプリ閾値違反件数表示画像D530、及びインフラ閾値違反件数表示画像D540は、閾値情報取得部360が取得した閾値の範囲を、性能情報SPIが超えた場合の件数を表示している。アプリ閾値違反件数表示画像D530は、特定のアプリケーショングループが閾値を超えた件数を示しており、インフラ閾値違反件数表示画像D540は、特定の論理サーバグループが閾値を超えた件数を示している。
なお、選択情報画像D500に表示する画像の種類は、不図示のダッシュボード表示情報取得部が操作検出部5からユーザの操作を検出することにより、表示選択部370が選択する。つまり、選択情報画像D500はユーザにより任意で決めることが可能である。
The selection information image D500 includes, as screen components, a response time distribution image D510, a server group-specific CPU usage rate display image D520, an application threshold violation count display image D530, and an infrastructure threshold violation count display image D540.
The response time distribution image D510 shows the distribution of response times. The X-axis shows the time range, and the Y-axis shows the number of corresponding transactions as a percentage. The response time distribution image D510 uses information included in the accumulated performance information ASPI. The
The server group-specific CPU utilization display image D520 displays the CPU utilization and memory utilization by group. The group selection
The application threshold violation count display image D530 and the infrastructure threshold violation count display image D540 display the number of cases where the performance information SPI exceeds the range of the threshold acquired by the threshold
The type of image to be displayed in the selection information image D500 is selected by the
[トランザクション統計処理動作の一例]
図6は、実施形態におけるトランザクション統計処理動作の一例を示す図である。図6を参照して、監視対象システム2からトランザクション情報TXIを取得し、統計処理を行う流れについて説明する。
(ステップS110)トランザクション情報取得部100は、複数のホスト3上で動作する複数のアプリケーション4を含んで構成される監視対象システム2において、やり取りされる情報伝達の実行単位であるトランザクション情報TXIを取得する。ここでトランザクション情報取得部100が取得するトランザクション情報TXIは、複数のホストのうち情報伝達が行われたホストを識別するホスト情報と、情報伝達が行われたアプリケーションを識別する宛先情報とを含む。
トランザクション情報取得部100は、取得したトランザクション情報TXIを計測部310及び判定部250に提供する。
(ステップS120)計測部310は、トランザクション情報取得部100からトランザクション情報TXIを取得する。計測部310は、トランザクション情報TXIに基づいて、システムの性能を測る指標を計測する。この一例でシステムの性能を測る指標とは、応答時間、TRX要求件数、CPU使用率、メモリ使用率、TPS等である。システムの性能を測る指標を、性能情報SPIとして統計部320に提供する。
(ステップS130)一方、判定部250はトランザクション情報取得部100からトランザクション情報TXIを取得する。判定部250は、取得したトランザクション情報TXIを論理サーバグループ情報取得部210及びアプリケーショングループ情報取得部230に提供する。
論理サーバグループ情報取得部210は、トランザクション情報TXIに含まれるホスト情報が属するグループの情報について、論理サーバグループ情報記憶部220を検索する。論理サーバグループ情報取得部210は、検索により得たトランザクション情報TXIに含まれるホスト情報が属するグループの情報を、論理サーバグループ情報VSGIとして、判定部250に提供する。
アプリケーショングループ情報取得部230は、トランザクション情報TXIに含まれる宛先情報が属するグループの情報について、アプリケーショングループ情報記憶部240を検索する。アプリケーショングループ情報取得部230は、検索により得たトランザクション情報TXIに含まれる宛先情報が属するグループの情報を、アプリケーショングループ情報APGIとして、判定部に提供する。
判定部250は、論理サーバグループ情報取得部210より論理サーバグループ情報VSGIを取得し、アプリケーショングループ情報取得部230より、アプリケーショングループ情報APGIを取得する。判定部250は、トランザクション情報TXIに論理サーバグループ情報VSGIとアプリケーショングループ情報APGIを付加し、トランザクショングループ情報TXGIとして、統計部320に提供する。
(ステップS140)統計部320は、計測部310より性能情報SPIを取得し、判定部250よりトランザクショングループ情報TXGIを取得する。統計部320は取得した情報に基づき、統計処理を行う。この一例において統計部320は、統計処理により、累計性能情報ASPIと、グループ別統計情報GSPIと、統計後性能情報SSPIとを算出する。
累計性能情報ASPIは、性能情報SPIにより示される瞬時値を、積算して得られる情報である。
グループ別統計情報GSPIとは、性能情報SPIとトランザクショングループ情報TXGIに基づき、性能情報SPIにより示される瞬時値を、グループ毎に積算して得られる情報である。
統計後性能情報SSPIとは、上述した統計処理以外により統計処理された情報である。この一例において統計部320は閾値情報取得部360が取得する閾値情報THIに基づいて、閾値で指定された範囲を超える性能情報SPIを積算して得られる情報である。
統計部320は、性能情報SPIと、累計性能情報ASPIと、統計後性能情報SSPIと、グループ別統計情報GSPIとを表示選択部370に提供する。
(ステップS150)表示選択部370は、統計部320より、性能情報SPIと、累計性能情報ASPIと、統計後性能情報SSPIと、グループ別統計情報GSPIとを取得する。表示選択部370は取得した情報を出力部400に出力する。
[Example of transaction statistical processing operation]
6 is a diagram showing an example of a transaction statistical processing operation in the embodiment. A flow of acquiring transaction information TXI from the monitored
(Step S110) The transaction
The transaction
(Step S120) The
(Step S130) Meanwhile, the
The logical server group
The application group
The
(Step S140) The
The accumulated performance information ASPI is information obtained by accumulating the instantaneous values indicated by the performance information SPI.
The group-based statistical information GSPI is information obtained by accumulating the instantaneous values indicated by the performance information SPI for each group, based on the performance information SPI and the transaction group information TXGI.
The post-statistical performance information SSPI is information that has been subjected to statistical processing other than the above-mentioned statistical processing. In this example, the
The
(Step S150) The
[グループ選択動作の一例]
図7は、実施形態におけるグループの統計情報表示動作の一例を示す図である。図7を参照して、ユーザにより選択されたグループを取得し、選択されたグループのグループ別統計情報GSPIを提示する流れについて説明する。
(ステップS210)統計部320はトランザクショングループ情報TXGIをグループ判定部200から取得し、表示選択部370に提供する。表示選択部370は、トランザクショングループ情報TXGIを出力部400に出力する。
(ステップS220)ユーザは、グループ情報をドリルダウンにより、選択することができる。
ここで、ドリルダウンとは、グループを上位の階層から下位の階層に向けて順次(例えば、一階層ずつ)選択していくことをいう。例えば、図3の例において、ドリルダウンによりグループが選択される流れを説明する。下段に示されるアプリケーショングループを選択されるとする。ユーザによりドメインA100又はドメインA200の選択が行われる。この時点では中機能レベル及び小機能レベルの下位の階層は提示されていない。操作検出部5がドメインA100の選択を検出すると、出力部400は、中機能レベルA110及び中機能レベルA120の提示を行う。この時点では下位の階層である小機能レベルは提示されていない。操作検出部5が中機能レベルA110の選択を検出すると、出力部400は小機能レベルA111を提示する。このように、ユーザはドリルダウンにより階層を一階層ずつ下げてグループを選択していく。
図7に戻り、操作検出部5はユーザによるグループ情報の選択動作を検出し、選択されたグループをグループ選択情報SGIとしてグループ選択情報取得部330に提供する。
(ステップS230)表示選択部370は、グループ選択情報取得部330よりグループ選択情報SGIを取得し、統計部320よりグループ別統計情報GSPIを取得する。表示選択部370は、グループ選択情報SGIにより示されたグループのグループ別統計情報GSPIを出力部400に提供する。出力部400はグループ別統計情報GSPIを出力する。
[An example of group selection operation]
7 is a diagram showing an example of a group statistical information display operation in an embodiment. With reference to FIG. 7, a flow of acquiring a group selected by a user and presenting group-specific statistical information GSPI of the selected group will be described.
(Step S210) The
(Step S220) The user can select group information by drilling down.
Here, drilling down means selecting groups sequentially (for example, one layer at a time) from a higher level to a lower level. For example, in the example of FIG. 3, a flow of selecting a group by drilling down will be described. Assume that the application group shown in the lower row is selected. The user selects domain A100 or domain A200. At this point, the lower levels of the medium function level and the small function level are not presented. When the
Returning to FIG. 7, the
(Step S230) The
[比較・警告動作の一例]
図8は、実施形態におけるシステムの性能を測る指標を比較し、警告を行う動作の一例を示す図である。
(ステップS310)閾値情報取得部360は、操作検出部5により閾値情報THIを取得する。閾値情報取得部360は、取得した閾値情報THIを比較部340に提供する。
(ステップS320)比較部340は、閾値情報取得部360より閾値情報THIを取得し、計測部310より性能情報SPIを取得する。比較部340は取得した閾値情報THIと性能情報SPIとを比較する。
(ステップS330)比較部340は、性能情報SPIが閾値情報THIで示される範囲の範囲外である場合、すなわち(ステップS330;YES)の場合、処理をステップS340に進める。比較部340は、性能情報SPIが閾値情報THIで示される範囲の範囲内である場合、すなわち(ステップS330;NO)の場合、処理をステップS320に進める。比較部340は、計測部310から性能情報SPIを取得するたびに、性能情報SPIと閾値情報THIとの比較を行う。
(ステップS340)警告部350は、比較部340から、性能情報SPIが閾値情報THIの範囲外にあることを示す、比較性能情報CPIを取得する。警告部350は、警告情報ALIを出力部400に提供する。出力部400は、警告情報ALIを取得すると、警告情報ALIを提示する。
警告情報ALIは、ユーザに対して警告を行うことを目的しているので、手段は問わない。例えばユーザのディスプレイに表示されるポップアップウィンドウのようなものでもよいし、SNMPTrapなどのネットワークを利用したイベント通知でもよいし、音声デバイスによるアナウンスでもよいし、システムを管理する関係者に電子メールが送信されても良い。
[Example of comparison and warning action]
FIG. 8 is a diagram showing an example of an operation for comparing indicators for measuring system performance and issuing a warning in the embodiment.
(Step S310) The threshold
(Step S320) The comparing
(Step S330) If the performance information SPI is outside the range indicated by the threshold information THI, i.e. (Step S330; YES), the
(Step S340) The
The warning information ALI is intended to warn the user, and may be given by any means, such as a pop-up window displayed on the user's display, an event notification using a network such as SNMP Trap, an announcement by a voice device, or an email sent to the person in charge of managing the system.
[URIの一部一致によるグループ判定動作の一例]
図9から図12は、URI(Uniform Resource Identifier)の一部一致によるグループ判定について説明する図である。図9から図12を参照しながら、URIの一部一致によるグループ判定について説明する。
図9は、実施形態における宛先情報の一例を示す図である。同図に示すURIは、トランザクション情報TXIに含まれる宛先情報の一例である。この場合、トランザクション情報TXIは、URIによりトランザクションの宛先を示す。
[An example of group determination operation based on partial match of URI]
9 to 12 are diagrams for explaining group determination based on partial matching of URIs (Uniform Resource Identifiers). Group determination based on partial matching of URIs will be explained with reference to FIGS.
9 is a diagram showing an example of destination information in an embodiment. The URI shown in the figure is an example of destination information included in the transaction information TXI. In this case, the transaction information TXI indicates the destination of the transaction by the URI.
この一例において、宛先情報であるURIは、トランザクションの宛先であるアプリケーションを上位階層識別子I10と、下位階層識別子I20とにより示す。判定部250は、上位階層識別子I10により、トランザクション情報取得部100により取得されたアプリケーショングループを判定する。
上位階層識別子I10は、アプリケーショングループを識別する。上位階層識別子I10は、アプリケーショングループを示す情報と対応づけられ、アプリケーショングループ情報記憶部240に記憶される。
In this example, the URI, which is the destination information, indicates the application that is the destination of the transaction by an upper layer identifier I10 and a lower layer identifier I20. The
The upper layer identifier I10 identifies an application group. The upper layer identifier I10 is associated with information indicating the application group and is stored in the application group
この一例において、上位階層識別子I10は、さらに複数の識別子からなる階層構造を有している。具体的には、上位階層識別子I10は、さらにドメインI11、中機能レベルI12及び小機能レベルI13の3階層を有する。
なお、この一例において、上位階層識別子I10は、ドメインI11、中機能レベルI12及び小機能レベルI13の3階層を有しているとして説明するが、この一例に限定されない。上位階層識別子I10は、階層構造を有していなくてもよく、上位階層識別子I10は、更に複数の階層に分かれていてもよい。
In this example, the upper hierarchical identifier I10 has a hierarchical structure made up of a plurality of identifiers. Specifically, the upper hierarchical identifier I10 has three hierarchical levels: a domain I11, a medium function level I12, and a small function level I13.
In this example, the upper layer identifier I10 is described as having three hierarchies, namely, a domain I11, a medium function level I12, and a small function level I13, but is not limited to this example. The upper layer identifier I10 does not need to have a hierarchical structure, and may be further divided into multiple hierarchies.
下位階層識別子I20は、トランザクションの宛先であるアプリケーションを示す。この一例において、判定部250は、下位階層識別子I20によりアプリケーショングループを判定しない。
同図の一例では、下位階層識別子I20は、“aaa”と、“bbb”と、“ccc”との3階層に分かれているが、下位階層識別子I20が持つ階層の数は、この一例に限定されない。下位階層識別子I20は、階層構造を有していなくてもよく、下位階層識別子I20は、更に複数の階層に分かれていてもよい。
The lower layer identifier I20 indicates the application that is the destination of the transaction. In this example, the
In the example shown in the figure, the lower layer identifier I20 is divided into three layers, "aaa", "bbb", and "ccc", but the number of layers that the lower layer identifier I20 has is not limited to this example. The lower layer identifier I20 does not need to have a hierarchical structure, and the lower layer identifier I20 may be further divided into multiple layers.
図10は、実施形態におけるアプリケーショングループ情報の一例を示す図である。同図を参照しながら、アプリケーショングループ情報について具体的に説明する。
図10(A)は、URIが有する上位階層識別子I10の一例を示す図である。同図に示す“System1”は、監視対象システム2の一例である。この一例において、“System1”は、ドメインI11として、“Domain1”と、“Domain2”のグループを有する。“Domain1”は、中機能レベルI12として、“Func11”と、“Func12”のグループを有する。“Domain2”は、中機能レベルI12として、“Func21”のグループを有する。“Func11”は、小機能レベルI13として、“Sub-func111”のグループを有する。“Func21”は、小機能レベルI13として、“Sub-func211”と、“Sub-func212”のグループを有する。
10 is a diagram showing an example of application group information in the embodiment, which will be specifically described with reference to the drawing.
FIG. 10A is a diagram showing an example of an upper hierarchical identifier I10 possessed by a URI. "System1" shown in the figure is an example of a monitored
図10(B)は、アプリケーショングループ情報記憶部240に記憶されるアプリケーショングループ情報の一例について示す図である。同図は、図10(A)に示したURIが有する上位階層識別子I10が、アプリケーショングループ情報記憶部240に記憶される場合の一例を示す図である。アプリケーショングループ情報記憶部240は、上位階層識別子I10とアプリケーショングループとの対応関係を記憶する。
Figure 10(B) is a diagram showing an example of application group information stored in the application group
アプリケーショングループ情報記憶部240に記憶されるアプリケーショングループである“Domain1”と、“Domain2”とは、ドメインI11の一例である。同図において“Domain1”のURIは、“Domain.sample1.co.jp”として、“Domain2”のURIは、“Domain.sample2.co.jp”として定義される。
"Domain1" and "Domain2", which are application groups stored in the application group
アプリケーショングループ情報記憶部240に記憶されるアプリケーショングループである“Func11”と、“Func12”とは、“Domain1”の下位階層に定義される中機能レベルI12の一例である。同図において、“Func11”のURIは、“Domain.sample1.co.jp/Func11”として定義される。“Func12”のURIは、“Domain.sample1.co.jp/Func12”として定義される。“Func21”は、“Domain2”の下位階層に定義される中機能レベルI12の一例である。同図において、“Func21”のURIは、“Domain.sample2.co.jp/Func21”として定義される。
"Func11" and "Func12", which are application groups stored in the application group
アプリケーショングループ情報記憶部240に記憶されるアプリケーショングループである“Sub-func111”は、“Func11”の下位下層に定義される小機能レベルI13の一例である。同図において、“Sub-func111”のURIは、“Domain.sample1.co.jp/Func11/Sub-func111”として定義される。“Sub-func211”と、“Sub-func212”とは、“Func21”の下位下層に定義される小機能レベルI13の一例である。同図において、“Sub-func211”のURIは、“Domain.sample2.co.jp/Func21/Sub-func211”として定義される。“Sub-func212”のURIは、“Domain.sample2.co.jp/Func21/Sub-func212”として定義される。
"Sub-func111", an application group stored in the application group
図11は、実施形態におけるグループ判定部が行う判定の結果の一例を示す図である。グループ判定部が行う判定の具体例について、同図を参照しながら説明する。この一例において、判定部250は、階層順によって、より上位の識別子から下位の識別子に向けて判定を行う。判定部250は、少なくとも上位階層の識別子が一致した場合に、トランザクション情報TXIが示すトランザクションが属するアプリケーショングループを判定する。具体的には、判定部250は、トランザクション情報TXIが示すトランザクションが属するアプリケーショングループを、複数のアプリケーショングループのうちいずれのアプリケーショングループに属するかを判定する。
Figure 11 is a diagram showing an example of the results of a determination made by the group determination unit in an embodiment. A specific example of the determination made by the group determination unit will be described with reference to the same figure. In this example, the
例えば、同図における宛先情報U1の場合について説明する。
図2に戻り、判定部250は、トランザクション情報取得部100からトランザクション情報TXIを取得し、取得したトランザクション情報TXIをアプリケーショングループ情報取得部230に提供する。アプリケーショングループ情報取得部230は、判定部250から取得するトランザクション情報TXIに基づいて、取得したトランザクションが属するアプリケーショングループをアプリケーショングループ情報記憶部240から取得する。
For example, the case of destination information U1 in the figure will be described.
2 , the
図11に進み、アプリケーショングループ情報記憶部240は、上位階層識別子I10と、アプリケーショングループとの対応関係を記憶する。宛先情報U1の場合、上位階層識別子I10は“Domain.sample1.co.jp/Func11/Sub-func111”であり、下位階層識別子I20は、“Category1/List1.xhtml”である。アプリケーショングループ情報取得部230は、アプリケーショングループ情報記憶部240から、上位階層識別子I10が示すアプリケーショングループを取得する。
宛先情報U1の場合、上位階層識別子I10に示されるドメインI11は“Domain.sample1.co.jp”である。“Domain.sample1.co.jp”のグループは、“Domain1”であるため、宛先情報U1のドメインI11のグループは“Domain1”である。
宛先情報U1の上位階層識別子I10に示される中機能レベルI12は、“Domain.sample1.co.jp”に属する“Func11”である。“Domain.sample1.co.jp/Func11”のグループは、“Func11”であるため、宛先情報U1の中機能レベルI12のグループは“Func11”である。
宛先情報U1の上位階層識別子I10に示される小機能レベルI13は、“Domain.sample1.co.jp/Func11”に属する“Sub-func111”である。“Domain.sample1.co.jp/Func11/Sub-func111”のグループは、“Sub-func111”であるため、宛先情報U1の小機能レベルI13のグループは“Sub-func111”である。
11, the application group
In the case of the destination information U1, the domain I11 indicated in the upper hierarchical identifier I10 is "Domain.sample1.co.jp." The group of "Domain.sample1.co.jp" is "Domain1," so the group of the domain I11 of the destination information U1 is "Domain1."
The intermediate function level I12 indicated in the upper hierarchical identifier I10 of the destination information U1 is "Func11" belonging to "Domain.sample1.co.jp". Since the group of "Domain.sample1.co.jp/Func11" is "Func11", the group of the intermediate function level I12 of the destination information U1 is "Func11".
The sub-function level I13 indicated in the upper hierarchical identifier I10 of the destination information U1 is "Sub-func111" belonging to "Domain.sample1.co.jp/Func11". Since the group of "Domain.sample1.co.jp/Func11/Sub-func111" is "Sub-func111", the group of the sub-function level I13 of the destination information U1 is "Sub-func111".
図2に戻り、アプリケーショングループ情報取得部230は、取得したアプリケーショングループをアプリケーショングループ情報APGIとして、判定部250に提供する。
判定部250は、取得したアプリケーショングループの情報を、トランザクション情報TXIに付加し、トランザクショングループ情報TXGIとして制御部300に提供する。統計部320は、判定部250が判定する結果に基づき、トランザクションについての統計演算を行う。出力部400は、統計部320による統計演算の結果を出力する。
Returning to FIG. 2, the application group
The
図11に進み、宛先情報U2及び宛先情報U3は、宛先情報U1と同一の上位階層識別子I10を有する。したがって、宛先情報U1,宛先情報U2及び宛先情報U3は、それぞれ異なる下位階層識別子I20を有しているにもかかわらず、同一のグループと判定される。 Continuing with FIG. 11, destination information U2 and destination information U3 have the same upper hierarchical identifier I10 as destination information U1. Therefore, destination information U1, destination information U2, and destination information U3 are determined to be in the same group, even though they each have a different lower hierarchical identifier I20.
宛先情報U4は、宛先情報U1、宛先情報U2及び宛先情報U3と、ドメインI11及び中機能レベルI12が同一である。したがって宛先情報U4は、宛先情報U1、宛先情報U2及び宛先情報U3と、ドメインI11及び中機能レベルI12において、同一のグループである。
一方、宛先情報U4の小機能レベルI13は、“Sub-func119”である。“Sub-func119”は、アプリケーショングループ情報記憶部240に定義されていないため、いずれの小機能レベルI13のグループにも属さないと判定される。
The destination information U4 is in the same domain I11 and the same intermediate functional level I12 as the destination information U1, U2, and U3. Therefore, the destination information U4 is in the same group as the destination information U1, U2, and U3 in the domain I11 and the intermediate functional level I12.
On the other hand, the sub-function level I13 of the destination information U4 is “Sub-func119.” Since “Sub-func119” is not defined in the application group
宛先情報U5のドメインI11は“Domain.sample2.co.jp”であるため、宛先情報U5のドメインI11のグループ は“Domain2”であると判定される。
一方、宛先情報U5の中機能レベルI12のグループは、アプリケーショングループ情報記憶部240に定義されていない“Func29”であるため、宛先情報U5はいずれの中機能レベルI12のグループにも属さないと判定される。
Since the domain I11 of the destination information U5 is "Domain.sample2.co.jp", the group of the domain I11 of the destination information U5 is determined to be "Domain2".
On the other hand, since the group of the medium function level I12 of the destination information U5 is "Func29" which is not defined in the application group
[宛先情報の一部一致によるグループ判定の一連の動作]
図12は、実施形態における宛先情報の一部一致によるグループ判定の一連の動作の一例を示す図である。
(ステップS410)判定部250は、トランザクション情報取得部100から取得したトランザクション情報TXIに含まれる宛先情報の、ドメインI11に一致するグループがあるか否かを判定する。具体的には、判定部250は、トランザクション情報TXIをアプリケーショングループ情報取得部230に提供し、アプリケーショングループ情報APGIを取得する。判定部250は、アプリケーショングループ情報取得部230からアプリケーショングループ情報APGIを取得し、ドメインI11に一致するグループがあるか否かを判定する。処理をステップS412に進める。
(ステップS412)トランザクション情報取得部100から取得したトランザクション情報TXIに含まれる宛先情報の、ドメインI11に一致するグループがない場合(すなわちステップS412;NOの場合)処理をステップS414に進める。一致するグループがある場合(すなわちステップS412;YESの場合)処理をステップS420に進める。
(ステップS414)判定部250は、監視対象システム2には対応するアプリケーショングループ情報が存在しない(つまり、当該トランザクションは監視対象システム2に属さないトランザクションである)と判定する。判定部250は、判定した情報をトランザクション情報TXIに付加し、トランザクショングループ情報TXGIとして制御部300に提供する。
[A series of operations for group determination based on partial match of destination information]
FIG. 12 is a diagram showing an example of a series of operations for group determination based on partial match of destination information in the embodiment.
(Step S410) The
(Step S412) If there is no group that matches domain I11 of the destination information included in the transaction information TXI acquired from the transaction information acquisition unit 100 (i.e., step S412 returns NO), the process proceeds to step S414. If there is a group that matches (i.e., step S412 returns YES), the process proceeds to step S420.
(Step S414) The
(ステップS420)判定部250は、アプリケーショングループ情報取得部230から取得したアプリケーショングループ情報APGIに、中機能レベルI12に一致するグループがあるか否かを判定する。処理をステップS422に進める。
(ステップS422)トランザクション情報取得部100から取得したトランザクション情報TXIに含まれる宛先情報の、中機能レベルI12に一致するグループがない場合(すなわちステップS422;NOの場合)処理をステップS424に進める。一致するグループがある場合(すなわちステップS422;YESの場合)処理をステップS430に進める。
(ステップS424)判定部250は、トランザクション情報取得部100から取得したトランザクション情報TXIに含まれる宛先情報には、ドメインI11のみ一致するグループが存在すると判定する。判定部250は、判定した情報をトランザクション情報TXIに付加し、トランザクショングループ情報TXGIとして制御部300に提供する。
(Step S420) The determining
(Step S422) If there is no group that matches the medium function level I12 of the destination information included in the transaction information TXI acquired from the transaction information acquisition unit 100 (i.e., step S422 returns NO), the process proceeds to step S424. If there is a matching group (i.e., step S422 returns YES), the process proceeds to step S430.
(Step S424) The
(ステップS430)判定部250は、アプリケーショングループ情報取得部230から取得したアプリケーショングループ情報APGIに、小機能レベルI13に一致するグループがあるか否かを判定する。処理をステップS432に進める。
(ステップS432)トランザクション情報取得部100から取得したトランザクション情報TXIに含まれる宛先情報の、小機能レベルI13に一致するグループがない場合(すなわちステップS432;NOの場合)処理をステップS434に進める。一致するグループがある場合(すなわちステップS432;YESの場合)処理をステップS440に進める。
(ステップS434)判定部250は、トランザクション情報取得部100から取得したトランザクション情報TXIに含まれる宛先情報には、ドメインI11及び中機能レベルI12に一致するグループが存在すると判定する。判定部250は、判定した情報をトランザクション情報TXIに付加し、トランザクショングループ情報TXGIとして制御部300に提供する。
(ステップS440)判定部250は、トランザクション情報取得部100から取得したトランザクション情報TXIに含まれる宛先情報には、ドメインI11、中機能レベルI12及び小機能レベルI13に一致するグループが存在すると判定する。判定部250は、判定した情報をトランザクション情報TXIに付加し、トランザクショングループ情報TXGIとして制御部300に提供する。
(Step S430) The determining
(Step S432) If there is no group that matches the small function level I13 of the destination information included in the transaction information TXI acquired from the transaction information acquisition unit 100 (i.e., step S432 returns NO), the process proceeds to step S434. If there is a matching group (i.e., step S432 returns YES), the process proceeds to step S440.
(Step S434) The
(Step S440) The
[実施形態の効果のまとめ]
以上説明したように、トランザクション情報TXIは、アプリケーションの宛先を上位階層識別子I10と下位階層識別子I20とにより示す宛先情報を含む。本実施形態のシステム監視装置1は、アプリケーショングループ情報取得部230と、判定部250とを備えることにより、トランザクション情報取得部100が取得したトランザクションが属するアプリケーショングループを判定する。具体的には、判定部250は、トランザクション情報TXIに含まれる上位階層識別子I10により、取得したトランザクションのアプリケーショングループを判定する。
判定部250は、上位階層識別子I10によりアプリケーショングループを判定するため、本実施形態のシステム監視装置1は、トランザクション情報TXIに含まれる宛先情報の一部が一致することにより、トランザクションが属するアプリケーショングループの判定を行うことができる。
[Summary of Effects of the Embodiments]
As described above, the transaction information TXI includes destination information indicating the destination of an application by an upper hierarchical layer identifier I10 and a lower hierarchical layer identifier I20. The
Since the
ここで、日々のシステムの使用や、システムの更新といった、監視対象システム2の運用に伴い、新しいアプリケーションの宛先がシステムに加えられることは珍しくない。従来新しいアプリケーションの宛先が加えられる毎に、アプリケーショングループの定義を行う必要があった。
しかしながら、すべてのアプリケーションの宛先について、アプリケーショングループ情報記憶部240に記憶させることは困難であった。
本実施形態のシステム監視装置1は、上位階層識別子I10によりグループの判定を行うことにより、下位の階層の宛先情報が異なっていても、上位階層識別子I10により、グループを判定することができる。つまり、本実施形態のシステム監視装置1によれば、未知の下位階層識別子I20を有するトランザクションについてもアプリケーショングループの判定をすることができる。
Here, it is not uncommon for new application destinations to be added to the system along with the operation of the monitored
However, it is difficult to store the destinations of all applications in the application group
The
また、上述した実施形態によれば、上位階層識別子I10は、複数の階層により構成される。判定部250は、上位階層の一致によりトランザクションのアプリケーショングループを判定する。
したがって、本実施形態のシステム監視装置1は、上位階層識別子を複数の階層により構成することで、トランザクションをより詳細にグループ化した場合の統計情報と、ある程度の括りでグループ化した場合の統計情報とを監視することができる。
本実施形態のシステム監視装置1によれば、監視対象システム2に問題が生じた場合、異常発生箇所、及び異常状態を引き起こす原因の特定を容易にすることができる。
According to the embodiment described above, the upper layer identifier I10 is composed of a plurality of layers. The
Therefore, the
According to the
また、上述した実施形態によれば、上位階層識別子I10は、ドメインI11、中機能レベルI12、小機能レベルI13の3階層を有する。
したがって、システム監視装置1は、アプリケーションが有する機能ごとにグループを設定することができる。
Furthermore, according to the embodiment described above, the upper layer identifier I10 has three layers: domain I11, medium function level I12, and small function level I13.
Therefore, the
なお、上述した実施形態におけるシステム監視装置1が備える各部の機能の全体あるいはその機能の一部は、これらの機能を実現するためのプログラムをコンピュータにより読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現してもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。
The functions of each unit of the
また、「コンピュータにより読み取り可能な記録媒体」とは、光磁気ディスク、ROM、CD-ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶部のことをいう。さらに、「コンピュータにより読み取り可能な記録媒体」とは、インターネット等のネットワークを介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでもよい。また、上記プログラムは、前述した機能の一部を実現するためのものであってもよく、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよい。 In addition, "computer-readable recording medium" refers to portable media such as optical magnetic disks, ROMs, and CD-ROMs, and storage units such as hard disks built into computer systems. Furthermore, "computer-readable recording medium" may also include devices that dynamically store programs for a short period of time, such as communication lines when transmitting programs over a network such as the Internet, and devices that store programs for a certain period of time, such as volatile memory within a computer system that serves as a server or client in such cases. Furthermore, the above-mentioned program may be one that realizes part of the functions described above, or may be one that can realize the functions described above in combination with a program already recorded in the computer system.
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何ら限定されるものではなく、本発明の趣旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。 Although the above describes the form for carrying out the present invention using an embodiment, the present invention is in no way limited to such an embodiment, and various modifications and substitutions can be made without departing from the spirit of the present invention.
1…システム監視装置、2…監視対象システム、3…ホスト、4…アプリケーション、5…操作検出部、100…トランザクション情報取得部、200…グループ判定部、300…制御部、400…出力部、210…論理サーバグループ情報取得部、220…論理サーバグループ情報記憶部、230…アプリケーショングループ情報取得部、240…アプリケーショングループ情報記憶部、250…判定部、310…計測部、320…統計部、330…グループ選択情報取得部、340…比較部、350…警告部、360…閾値情報取得部、370…表示選択部、TXI…トランザクション情報、TXGI…トランザクショングループ情報、VSGI…論理サーバグループ情報、APGI…アプリケーショングループ情報、SGI…グループ選択情報、SPI…性能情報、SSPI…統計後性能情報、THI…閾値情報、CPI…比較性能情報、ALI…警告情報 1...system monitoring device, 2...monitored system, 3...host, 4...application, 5...operation detection unit, 100...transaction information acquisition unit, 200...group judgment unit, 300...control unit, 400...output unit, 210...logical server group information acquisition unit, 220...logical server group information storage unit, 230...application group information acquisition unit, 240...application group information storage unit, 250...judgment unit, 310...measurement unit, 320...statistics unit, 330...group selection information acquisition unit, 340...comparison unit, 350...warning unit, 360...threshold information acquisition unit, 370...display selection unit, TXI...transaction information, TXGI...transaction group information, VSGI...logical server group information, APGI...application group information, SGI...group selection information, SPI...performance information, SSPI...post-statistics performance information, THI...threshold information, CPI...comparison performance information, ALI...warning information
Claims (3)
前記トランザクション情報に含まれる前記上位階層識別子が属するグループを示すアプリケーショングループ情報と前記上位階層識別子との対応関係を記憶するアプリケーショングループ情報記憶部から、取得された前記トランザクション情報が示す前記トランザクションが属するアプリケーショングループ情報を取得するアプリケーショングループ情報取得部と、
取得された前記トランザクション情報が示す前記トランザクションの宛先のアプリケーションが複数のアプリケーショングループのうちいずれのアプリケーショングループに属するかを判定する判定部と、
前記判定部が判定する結果に基づき、前記トランザクションについての統計演算を行う統計部と、
前記統計部による統計演算の結果を出力する出力部と
を有し、
前記上位階層識別子は、さらに複数の識別子からなる階層構造を有しており、
前記判定部は、階層順によって、より上位の識別子から下位の識別子に向けて判定を行い、少なくとも上位階層の識別子が一致した場合に、前記トランザクション情報が示す前記トランザクションが複数のアプリケーショングループのうちいずれのアプリケーショングループに属するかを判定する
監視装置。 a transaction information acquisition unit that acquires transaction information, which is information identifying a transaction that is an execution unit of information transmission exchanged within a computer system that is configured to include a plurality of logical servers and a plurality of applications that operate on the logical servers, and which includes destination information that indicates an application that is a destination of the transaction by an upper layer identifier and a lower layer identifier;
an application group information acquisition unit that acquires application group information to which the transaction indicated by the acquired transaction information belongs from an application group information storage unit that stores a correspondence relationship between application group information indicating a group to which the upper layer identifier included in the transaction information belongs and the upper layer identifier;
a determination unit that determines to which application group among a plurality of application groups an application that is a destination of the transaction indicated by the acquired transaction information belongs;
a statistics unit that performs statistical calculations on the transactions based on the results of the determination made by the determination unit;
and an output unit that outputs a result of the statistical calculation by the statistical unit,
the upper hierarchical identifier further has a hierarchical structure made up of a plurality of identifiers,
The determination unit performs determination in hierarchical order, from higher identifiers to lower identifiers, and when at least the identifiers in the higher hierarchy match, determines to which of multiple application groups the transaction indicated by the transaction information belongs.
請求項1に記載の監視装置。 The monitoring device according to claim 1 , wherein the upper hierarchical identifier has three hierarchical levels: a domain, a medium function level, and a small function level.
複数の論理サーバと前記論理サーバ上で動作する複数のアプリケーションとを含んで構成されるコンピュータシステム内においてやり取りされる情報伝達の実行単位であるトランザクションを識別する情報であり、前記トランザクションの宛先であるアプリケーションを上位階層識別子と下位階層識別子とにより示す宛先情報を含むトランザクション情報を取得するトランザクション情報取得ステップと、
前記トランザクション情報に含まれる前記上位階層識別子が属するグループを示すアプリケーショングループ情報と前記上位階層識別子との対応関係を記憶するアプリケーショングループ情報記憶部から、取得された前記トランザクション情報が示す前記トランザクションが属するアプリケーショングループ情報を取得するアプリケーショングループ情報取得ステップと、
取得された前記トランザクション情報が示す前記トランザクションの宛先のアプリケーションが複数のアプリケーショングループのうちいずれのアプリケーショングループに属するかを判定する判定ステップと、
前記判定ステップにより判定された結果に基づき、前記トランザクションについての統計演算を行う統計ステップと、
前記統計ステップにより統計演算された結果を出力する出力ステップと
を実行させるためのプログラムであり、
前記上位階層識別子は、さらに複数の識別子からなる階層構造を有しており、
前記判定ステップは、階層順によって、より上位の識別子から下位の識別子に向けて判定を行い、少なくとも上位階層の識別子が一致した場合に、前記トランザクション情報が示す前記トランザクションが複数のアプリケーショングループのうちいずれのアプリケーショングループに属するかを判定する
プログラム。 On the computer,
a transaction information acquisition step of acquiring transaction information including destination information that identifies a transaction, which is an execution unit of information transmission exchanged within a computer system configured to include a plurality of logical servers and a plurality of applications running on the logical servers, and indicates an application that is a destination of the transaction by an upper hierarchical identifier and a lower hierarchical identifier;
an application group information acquisition step of acquiring application group information to which the transaction indicated by the acquired transaction information belongs from an application group information storage unit that stores a correspondence relationship between application group information indicating a group to which the upper layer identifier included in the transaction information belongs and the upper layer identifier;
a determination step of determining to which application group among a plurality of application groups an application at a destination of the transaction indicated by the acquired transaction information belongs;
a statistical step of performing a statistical calculation on the transaction based on the result of the determination step;
and an output step of outputting the results of the statistical calculation performed by the statistical step,
the upper hierarchical identifier further has a hierarchical structure made up of a plurality of identifiers,
The determination step performs a determination in hierarchical order, from a higher identifier to a lower identifier, and when at least the identifiers in the higher hierarchy match, determines which of a plurality of application groups the transaction indicated by the transaction information belongs to.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019208091A JP7467078B2 (en) | 2019-11-18 | 2019-11-18 | Monitoring device and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019208091A JP7467078B2 (en) | 2019-11-18 | 2019-11-18 | Monitoring device and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021081928A JP2021081928A (en) | 2021-05-27 |
JP7467078B2 true JP7467078B2 (en) | 2024-04-15 |
Family
ID=75965260
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019208091A Active JP7467078B2 (en) | 2019-11-18 | 2019-11-18 | Monitoring device and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7467078B2 (en) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015025379A1 (en) | 2013-08-21 | 2015-02-26 | 株式会社日立製作所 | Monitoring device, monitoring method, and recording medium |
-
2019
- 2019-11-18 JP JP2019208091A patent/JP7467078B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015025379A1 (en) | 2013-08-21 | 2015-02-26 | 株式会社日立製作所 | Monitoring device, monitoring method, and recording medium |
Also Published As
Publication number | Publication date |
---|---|
JP2021081928A (en) | 2021-05-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20200358826A1 (en) | Methods and apparatus to assess compliance of a virtual computing environment | |
JP7439189B2 (en) | Real-time processing of data streams received from software with integrated measurement means | |
US8533536B2 (en) | Monitoring data categorization and module-based health correlations | |
US7676706B2 (en) | Baselining backend component response time to determine application performance | |
JP5416833B2 (en) | Performance monitoring device, method and program | |
US7673191B2 (en) | Baselining backend component error rate to determine application performance | |
US9354960B2 (en) | Assigning virtual machines to business application service groups based on ranking of the virtual machines | |
US8966392B2 (en) | Event management apparatus, systems, and methods | |
US9384114B2 (en) | Group server performance correction via actions to server subset | |
US20200364607A1 (en) | Systems and methods for unsupervised anomaly detection using non-parametric tolerance intervals over a sliding window of t-digests | |
US9329924B2 (en) | Monitoring system and monitoring program | |
US8285841B2 (en) | Service quality evaluator having adaptive evaluation criteria | |
US7788280B2 (en) | Method for visualisation of status data in an electronic system | |
KR20090007566A (en) | Model-based event processing | |
WO2011118051A1 (en) | System control method in computing system, and control system | |
JPWO2017029700A1 (en) | Management system for managing information systems | |
WO2016028669A1 (en) | Systems and methods for correlating derived metrics for system activity | |
US11461290B2 (en) | System and method for run-time adaptable policy engine for heterogeneous managed entities | |
US10282245B1 (en) | Root cause detection and monitoring for storage systems | |
JP7467078B2 (en) | Monitoring device and program | |
JP7423271B2 (en) | Monitoring devices, monitoring systems and monitoring programs | |
US10223189B1 (en) | Root cause detection and monitoring for storage systems | |
JP7304252B2 (en) | Monitoring device and program | |
US20180032388A1 (en) | Management system for managing computer system | |
JP7035527B2 (en) | Information processing equipment, information processing system, information processing method and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220906 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230615 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230718 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230912 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231128 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240111 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240312 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240403 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7467078 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |