JPWO2016103650A1

JPWO2016103650A1 - 運用管理装置、運用管理方法、及び、運用管理プログラムが記録された記録媒体

Info

Publication number: JPWO2016103650A1
Application number: JP2016541727A
Authority: JP
Inventors: 三木　清一; 清一三木; 昌尚棗田
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2014-12-22
Filing date: 2015-12-17
Publication date: 2017-04-27
Anticipated expiration: 2035-12-17
Also published as: US20170351563A1; WO2016103650A1; US10719380B2; JP6008070B1; EP3239839A1; EP3239839A4

Abstract

監視対象システムに関する特定の障害状態が継続的に検出される状況において、実際に障害が発生しているか否かを判定可能とする。運用管理装置は、監視対象システムに関する性能指標の計測値と、相異なる２つの前記性能指標の関係を表す相関モデルとを用いて、相異なる２つの前記性能指標の組み合わせに関する障害を示す障害情報を検出する。運用管理装置は、当該検出された前記障害情報を時系列に保持し、当該障害情報に基づいて、特定の前記組み合わせについて、前記障害情報が継続して検出されたか否かを判定する。運用管理装置は、特定の前記性能指標を含み前記障害情報が検出された上記組み合わせのうち、前記障害情報が継続して検出されたと判定された上記組み合わせに関する情報と、特定の前記性能指標を含む他の上記組み合わせに関する情報とに基づいて、前記性能指標に関する異常の程度を表す異常スコアを算出する。

Description

本発明は監視対象の装置あるいはシステム等において発生する異常を検知可能な運用管理装置、運用管理方法、及び、運用管理用プログラム等に関する。

近年、各種プラントあるいは社会的なインフラストラクチャー等のような、比較的複雑なシステム（あるいは当該システムを構成する構成要素）の重要性が高まるにつれ、これらのシステムを安定的に運用、管理することが求められている。これに伴い、これらのシステムの運用状況や稼働状況を監視し、これらのシステムにおいて発生した異常を検知可能な技術が求められている。

このような、管理対象のシステムにおける異常を検知可能な技術に関して、以下の特許文献が開示されている。

特許文献１（特許第５２６７６８４号公報）は、システムの稼働状況を監視する運用管理装置等に関する技術を開示する。特許文献１に開示された装置は、複数の監視対象装置から、複数の性能指標（メトリック）の計測値を取得し、２つの相異なるメトリックについて、その相関モデルを生成する。特許文献１に開示された装置は、相関モデルを用いて算出した、あるメトリックに関する推定値と当該メトリックの実測値とを比較した結果に基づいて、異常項目を検出する。特許文献１に開示された装置は、監視対象装置毎に、２つのメトリックによる組み合わせの総数と検出した異常項目数とを用いて異常スコアを算出し、係る異常スコアが高いメトリックを、異常発生源として特定する。なお、特許文献１に開示された技術は、同一の階層に存在する複数の監視対象装置において共通する異常項目を除外することにより、階層間の異常の波及による影響を排除可能である。

特許文献２（特開２００９−１９９５３３号公報）は、障害が発生する予兆を検知して、障害発生箇所を特定する運用管理装置等に関する技術を開示する。特許文献２に開示された装置は、複数の監視対象装置から、複数の性能情報（上記メトリックに相当）を取得し、相異なる２つの性能情報の間の相関関数を表す相関モデルを生成する。特許文献２に開示された装置は、当該相関モデルを用いて、新たに検知した性能情報が相関関係を破壊するか否かを判定し、当該判定の結果に基づいて異常スコアを算出することにより、異常の発生を分析する。特許文献２に開示された装置は、定常的に破壊される相関関係が存在する場合には、当該相関関係を表す相関モデルを削除する。

特許文献３（国際公開第２０１３／０２７５６２号）は、システムにおける障害の発生を検知する運用管理装置等に関する技術を開示する。特許文献３に開示された装置は、上記各特許文献と同様、監視対象装置（システム）の性能指標（メトリック）に関する相関モデルを生成し、係る相関関係の異常（状態）を検出する。特許文献３に開示された装置は、検出した相関関係の異常と、当該異常の継続度合いとに基づいて、異常スコアを算出する。特許文献３に開示された技術は、異常スコアが大きい（即ち、異常度が大きいか、あるいは異常の継続度が大きい）性能指標を特定することにより、システムに発生した異常を分析する。

特許文献４（国際公開第２０１３／１３６７３９号）は、システムにおける障害の発生を検知する運用管理装置等に関する技術を開示する。特許文献４に開示された装置は、上記各特許文献と同様、監視対象装置（システム）の性能指標（メトリック）に関する相関モデルを生成し、係る相関関係の異常（状態）を検出する。特許文献４に開示された装置は、システムの構成変更を検知した場合、構成変更後のメトリックの測定値に基づいて、相関モデルを再生成し、変更された構成に合せて、相関関係の破壊を検出するパターンを変更する。これにより、特許文献４に開示された技術は、監視対象装置（システム）に構成変更が発生した場合においても、当該システムにおいて発生する障害を適切に分析可能である。

特許第５２６７６８４号公報特開２００９−１９９５３３号公報国際公開第２０１３／０２７５６２号国際公開第２０１３／１３６７３９号

運用管理装置が、監視対象装置（あるいはシステム）から取得した性能指標（あるいはその組み合わせ）を用いて、当該監視対象装置における異常の発生を検知する場合を想定する。この場合、特定の性能指標（あるいはその組み合わせ）について、継続的に（あるいは定常的に）に異常状態が検知される可能性が有る。例えば、特定の性能指標に関する相関モデルを作成した際のシステムの状況（状態）と、係る相関モデルを適用する際のシステムの状況（状態）とが異なる場合、係るシステムの状況が正常であっても、継続的に異常状態が検知される可能性が有る。

このような状況においても、運用管理装置は、例えば、監視対象装置が正常状態から異常状態に変化した場合に、当該監視対象装置において実際に異常が発生しているか否かを判定可能であることが望ましい。また、運用管理装置は、このような状況においても、異常箇所を特定可能であることが望ましい。

これに対して、上記特許文献１に開示された技術は、特定の時点における特定の性能指標（あるいはその組み合わせ）に関する異常スコアを算出するのみである。即ち、上記特許文献１に開示された技術は、異常が発生している性能指標に関する時間変化を考慮しない。このことから、特許文献1に開示された技術は、特定の性能指標（あるいはその組み合わせ）が、定常的に異常状態を示す場合に、係る性能指標に関する異常が実際に発生しているか否かを正しく判定できない可能性が有る。

また、上記特許文献２に開示された技術は、定常的な異常状態が検出された場合（上記特許文献２においては、相関関係が定常的に破壊されている場合）、係る相関関係に関する相関モデルを削除する。このことから、特許文献２に開示された技術は、削除した相関モデルに関する性能指標に関して真に異常が発生している場合、係る異常を検知できない可能性がある。

また、上記特許文献３に開示された技術は、異常スコアを算出する際、ある性能指標に関して検知された異常の継続度に着目する。しかしながら、特許文献３に開示された技術は、ある性能指標が継続的に異常を表す場合に、当該性能指標に実際に異常が生じているかによらず、異常スコアが大きいと判定してしまう可能性がある。

なお、特許文献４に開示された技術は、監視対象装置の構成変更に応じて、異常検出に用いる相関モデル等を変更する技術である。よって、係る技術を、継続的に検出される異常状態の分析に対して適用することは困難である。

本発明は、上記のような事情を鑑みてなされたものである。即ち、本発明は、監視対象システムに関する特定の異常（障害）状態が継続的に検出される状況において、実際に異常（障害）が発生しているか否かを判定可能な情報を提供する運用管理装置等を提供することを主たる目的とする。

上記の目的を達成すべく、本発明の一態様に係る運用管理装置は、以下の構成を備える。即ち、本発明の一態様に係る運用管理装置は、監視対象システムに関する性能指標の計測値を１以上取得し、相異なる２つの上記性能指標の関係を表す相関モデルを用いることにより、上記取得した計測値に基づいて、相異なる２つの上記性能指標の組み合わせに関する障害を示す障害情報を検出する障害検出部と、当該検出された上記障害情報を時系列に保持する障害情報蓄積部と、上記障害情報蓄積部に保持された上記障害情報に基づいて、特定の上記性能指標を含む上記組み合わせについて、上記障害情報が継続して検出されたか否かを判定し、特定の上記性能指標を含み上記障害情報が検出された上記組み合わせである１以上の第１の組み合わせのうち、上記障害情報が継続して検出されたと判定された上記組み合わせである１以上の第２の組み合わせに関する情報と、特定の上記性能指標を含む他の上記組み合わせに関する情報とに基づいて、上記性能指標に関する異常の程度を表す異常スコアを算出する異常スコア計算部と、を備える。

また、本発明の一態様に係る運用管理方法は、以下の構成を備える。即ち、本発明の一態様に係る運用管理方法は、情報処理装置が、監視対象システムに関する性能指標の計測値を１以上取得し、相異なる２つの上記性能指標の関係を表す相関モデルを用いることにより、上記取得した計測値に基づいて、相異なる２つの上記性能指標の組み合わせに関する障害を示す障害情報を検出し、当該検出された上記障害情報を時系列に保持し、当該保持された上記障害情報に基づいて、特定の上記性能指標を含む上記組み合わせについて、上記障害情報が継続して検出されたか否かを判定し、特定の上記性能指標を含み、上記障害情報が検出された上記組み合わせである１以上の第１の組み合わせのうち、上記障害情報が継続して検出されたと判定された上記組み合わせである１以上の第２の組み合わせに関する情報と、特定の上記性能指標を含む他の上記組み合わせに関する情報とに基づいて、上記性能指標に関する異常の程度を表す異常スコアを算出する。

また、同目的は、上記構成を有する運用管理装置、並びに対応する運用管理方法を、コンピュータによって実現するコンピュータ・プログラム、及び、そのコンピュータ・プログラムが格納されている、コンピュータ読み取り可能な記録媒体等によっても達成される。

本発明によれば、監視対象システムに関する特定の異常（障害）状態が継続的に検出される状況において、実際に異常（障害）が発生しているか否かを判定可能な情報を提供することができる。

図１は、本発明の第１の実施形態における運用管理装置の機能的な構成を例示するブロック図である。図２は、本発明の第１の実施形態における運用管理装置の動作を例示するフローチャートである。図３は、本発明の第１の実施形態における障害情報の具体例を例示する図である。図４は、本発明の第１の実施形態の変形例における運用管理装置の機能的な構成を例示するブロック図である。図５は、本発明の第１の実施形態の変形例におけるユーザ・インタフェースの一つの具体例を示す図である。図６は、本発明の第１の実施形態の変形例におけるユーザ・インタフェースの他の具体例を示す図である。図７は、本発明の第２の実施形態における運用管理装置の機能的な構成を例示するブロック図である。図８は、本発明の第３の実施形態における運用管理装置の機能的な構成を例示するブロック図である。図９は、本発明の各実施形態に係る運用管理装置を実現可能なハードウェアの構成を例示する図である。

次に、本発明を実施する形態について図面を参照して詳細に説明する。以下の各実施形態に記載されている構成は単なる例示であり、本発明の技術範囲はそれらには限定されない。

以下の各実施形態において説明される運用管理装置は、専用のハードウェア装置、あるいは、専用のハードウェア装置の組み合わせにより構成されたシステムとして実現されてもよい。また、係る運用管理装置は、１以上の物理的な情報処理装置又は仮想的な情報処理装置又はそれらの組み合わせにより構成されるシステムとして実現されてもよい。係る運用管理装置を実現する情報処理装置のハードウェア構成例（図９）については後述する。

複数の物理的あるいは論理的に離間した各種ハードウェア装置あるいは情報処理装置を用いて運用管理装置を実現する場合、それらの構成要素は、無線、有線、あるいはそれらの組み合わせによる通信ネットワークを用いて、相互に通信可能に接続されていてもよい。なお、運用管理装置が、仮想的な情報処理装置を用いて実現される場合、上記通信ネットワークは、仮想的な通信ネットワークとして構成されてもよい。

なお、以下の説明において、下記各実施形態における運用管理装置が障害（異常）の発生を検知する対象を、まとめて「監視対象装置」と称する。係る監視対象装置は、単一の装置であってもよく、複数の装置の組み合わせとして構成されたシステム（監視対象システム）であってもよい。

＜第１の実施形態＞
以下、本発明の第１の実施形態について説明する。

［構成の説明］
まず、本発明の第１の実施形態における運用管理装置の構成について、図１を参照して説明する。図１は、本実施形態における運用管理装置１００の機能的な構成を例示するブロック図である。

図１を参照すると、本発明の第１の実施形態における運用管理装置１００は、性能情報蓄積部１０１と、相関モデル記憶部１０２と、障害検出部１０３と、障害情報蓄積部１０４と、異常スコア計算部１０５とを備える。

係る運用管理装置１００は、例えば、ＣＰＵ（中央処理装置：ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）を有する、各種情報処理装置を用いて実現されてもよい。係る運用管理装置１００を実現可能なハードウェア構成については、後述する。

図１に例示する構成においては、運用管理装置１００は、各構成要素（性能情報蓄積部１０１、相関モデル記憶部１０２、障害検出部１０３、障害情報蓄積部１０４、及び、異常スコア計算部１０５）を含む、単一の装置として構成される。本発明はこれには限定されず、運用管理装置１００を構成する構成要素は、物理的あるいは論理的に離間した複数の物理的な装置、あるいは、仮想的な装置を用いてそれぞれ個別に実現されてもよい。

以下、運用管理装置１００を構成する構成要素について説明する。

性能情報蓄積部１０１は、例えば、各種センサ等から得られた、監視対象装置に関する性能指標（メトリック）の値（計測値あるいは実測値）を保持する。係るセンサは、監視対象装置の内部に設けられてもよい。また、係るセンサは、監視対象装置の外部から、当該監視対象装置に関する各種情報を取得してもよい。係るセンサは、例えば、監視対象装置の温度、負荷状態、単位時間当たりの処理能力、メモリの残容量等に関する情報等、適切な情報を性能指標（メトリック）として計測することができる。

性能情報蓄積部１０１は、例えば、ある性能指標の値と、当該性能指標が計測された時刻とを関連付けて時系列データとして保持してもよい。

性能情報蓄積部１０１は、後述する障害検出部１０３に対して、所定の時刻におけるメトリック、あるいは、当該メトリックに関する時系列データを提供可能である。

相関モデル記憶部１０２は、相関モデルを記憶する。相関モデル記憶部１０２は、障害検出部１０３、及び、異常スコア計算部１０５に対して、係る相関モデルを提供可能である。

相関モデルは、様々な組み合わせの２つの性能指標（メトリック）の間の関係を表現したモデルである。運用管理装置１００（特には、後述する障害検出部１０３）は、相関モデルを用いることにより、一方のメトリックの値から、他方のメトリックの値を推定（算出）することができる。より具体的には、係る相関モデルは、例えば、２つのメトリックの間の相関関係を表す変換関数を用いて実現可能である。この場合、係る変換関数を用いて、２つのメトリックのうち、一方のメトリックの値（計測値）から、他方のメトリックの値に関する推定値が算出される。係る相関モデルは、例えば、特開２００９−１９９５３３号公報に記載された技術を用いて生成することができる。本実施形態における相関モデルは、２つのメトリックの組み合わせと、当該組み合わせに含まれる２つのメトリックの関係を表す情報（例えば上記相関関数等）とを、複数含んでもよい。なお、以下において、２つのメトリックの組み合わせを単に「メトリックの組み合わせ」と称する場合がある。係る相関モデルは、相関モデル記憶部1０２に対して、予め与えられてもよい。

障害検出部１０３は、所定の時刻において収集された性能指標（メトリック）の値（実測値）を性能情報蓄積部１０１から読み出す。具体的には、障害検出部１０３は、性能情報蓄積部１０１から提供されるメトリックの値を取得してもよく、性能情報蓄積部１０１に蓄積されたメトリックの値を参照してもよい。また、障害検出部１０３は、相関モデル記憶部１０２から相関モデルを読み出す。具体的には、障害検出部１０３は、相関モデル記憶部１０２から提供される相関モデルを取得してもよく、相関モデル記憶部１０２に蓄積された相関モデルを参照してもよい。

障害検出部１０３は、上記性能情報蓄積部１０１から読み出した性能指標（メトリック）の値（実測値）を用いて、上記相関モデルに含まれる２つのメトリックの組み合わせに関する障害情報を検出する。係る障害情報は、メトリックの組み合わせに関して、障害（異常）が発生したか否かを判定可能な情報である。

具体的には、障害検出部１０３は、２つのメトリックの組み合わせのうち、一方のメトリック（第１のメトリック（第１の性能指標））の値（実測値）を用いて、他方のメトリック（第２のメトリック（第２の性能指標））の推定値を算出する。そして、障害検出部１０３は、第２のメトリックに関する推定値と、上記性能情報蓄積部１０１から読み出した当該第２のメトリックに関する実測値との差分を算出する。なお、障害検出部１０３は、第２のメトリックに関する推定値と、上記性能情報蓄積部１０１から読み出した当該第２のメトリックに関する実測値との差分に比例するような値を算出してもよい。係る差分に比例する値は、上記算出した差分に対して適宜加工（演算等）を施すことにより算出されてもよい。以下において、上記説明した差分、及び、差分に比例するような値をまとめて、「差分等」と称する。

障害検出部１０３は、算出した差分等が所定値（基準値）を超える場合に、このメトリックの組み合わせに関する障害情報を検出する。この場合、障害検出部１０３は、このメトリックの組み合わせに含まれる各メトリック（性能指標）について、障害情報を検出してもよい。

障害情報蓄積部１０４は、障害検出部１０３が検出する障害情報を保持する。障害情報蓄積部１０４は、係る障害情報と、係る障害情報が記録された時刻とを関連付けて、時系列データとして保持してもよい。具体的には、障害情報蓄積部１０４は、相関モデルに含まれる、１以上の２つのメトリックの組み合わせについて、それぞれ、各時刻において障害が検出されたか否か（実測値と推測値との間の差分等が所定値以上かどうか）を記録（保持）してもよい。障害情報蓄積部１０４は、例えば、図３に例示するような形式により、係る障害情報の時系列データを保持してもよい。なお、障害情報蓄積部１０４は、図３に例示する形式に限定されず、他の適切な形式により障害情報（あるいは障害情報の時系列データ）を保持してよい。

異常スコア計算部１０５は、障害が検知された２つのメトリックの組み合わせに含まれる、それぞれのメトリックごとに、当該メトリックに関する異常の程度を表す異常スコアを算出する。係る異常スコアは、当該メトリックの実測値が取得された監視対象装置において発生した可能性がある障害（異常）の程度を表す。

異常スコア計算部１０５は、障害検出部１０３から障害情報を受け付ける。異常スコア計算部１０５は、障害が検知された２つのメトリックの組み合わせ（第１の組み合わせ）に基づいて、それぞれのメトリック毎に、障害（異常）が検知された数を計数（カウント）する。この場合、異常スコア計算部１０５は、障害（異常）が検知された数に比例する数を計数してもよい。上記障害（異常）が検知された数に比例する数は、障害（異常）が検知された数を加工（演算等）することにより算出されてもよい。以下、上記障害（異常）が検知された数と、上記障害（異常）が検知された数に比例する数とを、まとめて「検知異常数」と称する。

異常スコア計算部１０５は、例えば、障害が検知された２つのメトリックの組み合わせについて、それぞれのメトリック毎に障害が検知された回数に比例するように検知異常数をカウントしてもよい。異常スコア計算部１０５は、例えば、単純に検出回数を検知異常数としてもよい。例えば、あるメトリック１とメトリック２との組み合わせ、及び、メトリック１とメトリック３との組み合わせにおいて障害が検知された場合を仮定する。メトリック１乃至メトリック３は、それぞれ任意の監視対象措置等に関する性能指標（メトリック）であってよい。この場合、異常スコア計算部１０５は、例えば、メトリック１の検知異常数を「２」、メトリック２とメトリック３との検知異常数をそれぞれ「１」として計数（算出）する。上記に限定されず、異常スコア計算部１０５は、例えば、検出された異常の度合（相関モデルからの外れ度合）に基づいて検知異常数を算出してもよい。また、異常スコア計算部１０５は、例えば、対数など、検出回数が増えるにつれ検知異常数の増加が鈍化するような算出方法を用いて、検知異常数を算出してもよい。

本実施形態における異常スコア計算部１０５は、検知異常数を算出する際、障害情報蓄積部１０４が保持する障害情報の時系列データを参照する。そして、異常スコア計算部１０５は、障害情報の時系列データに基づいて、ある２つのメトリックの組み合わせについて、継続的に障害が検知されているか否かを判定する。異常スコア計算部１０５は、継続的に障害が検知されていると判定した２つのメトリックの組み合わせ（第２の組み合わせ）を、検知異常数のカウントから除外するよう処理する。即ち、異常スコア計算部１０５は、障害が検知されたメトリックの組み合わせ（第１の組み合わせ）から、継続的に障害が検知されたメトリックの組み合わせ（第２の組み合わせ）を除外して、検知異常数を取得（算出）する。これにより、異常スコア計算部１０５は、正常状態から異常状態へのシステムの変化を鋭敏に検知可能な、障害（異常）検知処理を実現することができる。

具体的には、異常スコア計算部１０５は、例えば、特定の時点からの過去「ｎ」時点（時系列データの中の「ｎ」回の計測時点）の中で、障害として検知された回数「ｍ」から、異常検出率（ｂｒｏｋｅｎｒａｔｉｏ）を、以下の計算式を用いて算出してもよい。なお、下式（１）において、記号”／”は、除算を表す記号である。

異常検出率（ｂｒｏｋｅｎｒａｔｉｏ）＝ｍ／ｎ（式１）
異常スコア計算部１０５は、ある２つのメトリックの組み合わせに関する上記異常検出率が所定の基準値を超える場合に、その２つのメトリックの組み合わせを、検知異常数にカウントしないよう処理してもよい。即ち、この場合、異常スコア計算部１０５は、過去「ｎ」時点において検知した障害の比率（割合）に基づいて、当該障害が継続しているか否かを判定する。

異常スコア計算部１０５は、上記に限らず、検知した障害の時間的な連続性を考慮してもよい。障害の時間的な連続性は、例えば、特定のメトリックの組み合わせに関して検知された障害が、どの程度連続しているかを表す。具体的には、異常スコア計算部１０５は、特定の時点からの過去「ｎ」時点のうち、（障害検知総数でなく、）時間的に当該特定の時点に一番直近の連続する障害検知の数を「ｐ」として、異常検出率を以下の計算式を用いて算出してもよい。

異常検出率（ｂｒｏｋｅｎｒａｔｉｏ）＝ｐ／ｎ（式２）
異常スコア計算部１０５は、上記に限らず、特定の時点からの過去「ｎ」時点（第１の期間）の内、当該「ｎ」時点の間に含まれる適当な期間（第２の期間）において連続して検知された障害検知数を「ｐ」としてもよい。

異常スコア計算部１０５は、更に、相関モデル記憶部１０２から相関モデルを受け付ける。そして、異常スコア計算部１０５は、それぞれのメトリック毎に、そのメトリックを含む、上記相関モデルに含まれる２つのメトリックの組み合わせの総数を、相関モデル数として取得（算出）する。例えば、具体例として相関モデルにメトリック１とメトリック２の組み合わせ、及び、メトリック１とメトリック３の組み合わせ、及び、メトリック１とメトリック４の組み合わせが含まれる場合を仮定する。この場合、異常スコア計算部１０５は、メトリック１に関する相関モデル数を「３」と算出する。即ち、相関モデル数は、特定のメトリックを含む、２以上のメトリックの組み合わせの総数を表す。

異常スコア計算部１０５は、上記相関モデル数に占める上記検知異常数の割合を異常スコアとして算出する。例えば、相関モデル数が「２０」、検知異常数が「７」の場合、異常スコア計算部１０５は、異常スコアを「０．３５」と算出する。

運用管理装置１００を構成するこれらの構成要素は、監視対象装置の状態の時間変化を考慮して、当該監視対象装置における異常を検知するように機能する。これにより、運用管理装置１００は、特定の性能指標（メトリック）の組み合わせについて、実際に異常が生じているか否かに関わらず定常的に異常状態が検知されるような場合でも、監視対象装置の異常を検知可能である。即ち、運用管理装置１００は、特定の性能指標（メトリック）の組み合わせに関する検知結果が示す状態が正常状態から異常状態に変化した場合に、監視対象装置における障害（異常）の発生を検知可能である。また、運用管理装置１００は、係る障害（異常）の発生箇所を適切に特定可能である。

［動作の説明］
次に、本実施形態における運用管理装置１００の動作について、図２を参照して詳細に説明する。図２は、本実施形態における運用管理装置１００の動作を例示するフローチャートである。なお、以下においては、運用管理装置１００における主たる構成である、異常スコア計算部１０５の動作（特には、検知異常数を算出する処理）を中心に説明する。

先ず、異常スコア計算部１０５は、監視対象装置に関する全てのメトリックについて、それぞれステップＳ２０２乃至ステップＳ２１１の処理を繰り返す（ステップＳ２０１乃至Ｓ２１２）。異常スコア計算部１０５は、例えば、性能情報蓄積部１０１に蓄積されたメトリックを参照することにより、監視対象装置に関する全てのメトリックをそれぞれ参照してもよい。また、監視対象装置に関する全てのメトリックに関する情報が、予め異常スコア計算部１０５に設定されてもよい。

次に、異常スコア計算部１０５は、上記監視対象装置に関する全てのメトリックのうち、ある特定のメトリックを選択する。そして、異常スコア計算部１０５は、当該選択したメトリックの検知異常数を「０（ゼロ）」にリセット（初期化）する（ステップＳ２０２）。

次に、異常スコア計算部１０５は、相関モデル記憶部１０２から相関モデルを読み込む（ステップＳ２０３）。

異常スコア計算部１０５は、上記相関モデルに含まれる２つのメトリックの組み合わせの内、ステップＳ２０２において選択されたメトリックを含む全ての組み合わせについて、ステップＳ２０５乃至ステップＳ２１０の処理を繰り返す（ステップＳ２０４乃至ステップＳ２１１）。

異常スコア計算部１０５は、ステップＳ２０２において選択されたメトリックを含む、ある２つのメトリックの組み合わせを選択する。そして、異常スコア計算部１０５は、障害検出部１０３から提供された情報を用いて、当該選択したメトリックの組み合わせに関する障害が検知されたか否かを確認する（ステップＳ２０５）。なお、異常スコア計算部１０５は、障害情報蓄積部１０４に蓄積された障害情報を参照することにより、上記選択したメトリックの組み合わせに関する障害が検知されたか否かを確認してもよい。

係る確認の結果、ステップＳ２０５において選択した２つのメトリックの組み合わせに関する障害が検知された場合（ステップＳ２０６においてＹＥＳ）、異常スコア計算部１０５は、ステップＳ２０７以下の処理を実行する。即ち、異常スコア計算部１０５は、障害情報蓄積部１０４から当該２つのメトリックの組み合わせに関する障害情報を読み込む（ステップＳ２０７）。

次に、異常スコア計算部１０５は、当該読み込んだ障害情報に基づいて、上記選択したメトリックの組み合わせに関する障害が継続的に検知されているか否かを判定する（ステップＳ２０８）。具体的には、異常スコア計算部１０５は、例えば、上記（式１）を用いて、過去「ｎ」時点中の障害検知数「ｍ」から異常検出率を算出する。そして、異常スコア計算部１０５は、異常検出率が所定の閾値（基準値）以下か否か判定する。上記算出した異常検出率が、所定の閾値以下の場合、異常スコア計算部１０５は、上記選択したメトリックの組み合わせに関する障害が継続していないと判定する。

ステップＳ２０８における処理の結果、上記選択したメトリックの組み合わせに関する障害が継続していないと判定された場合（ステップＳ２０９においてＮＯ）、異常スコア計算部１０５は、当該メトリックに関する検知異常数を更新する（ステップＳ２１０）。この場合、異常スコア計算部１０５は当該メトリックに関する検知異常数を「１」増やしてよい。

なお、ステップＳ２０６においてＮＯの場合、及び、ステップＳ２０９においてＹＥＳの場合、異常スコア計算部１０５は、ステップＳ２０４に戻って処理を繰り返す（図２の繰り返し処理２）。

異常スコア計算部１０５は、あるメトリックを含む２つのメトリックの組み合わせ全てについて、ステップＳ２０５乃至ステップＳ２１０の処理を繰り返し（図２の繰り返し処理１）、当該メトリックに関する検知異常数を算出する（ステップＳ２１１）。その後、異常スコア計算部１０５は、ステップＳ２０１に戻って、次のメトリックに関する処理を実行する（ステップＳ２１２）。

［効果の説明］
次に、本実施形態における運用管理装置１００が奏する効果について説明する。本実施形態における運用管理装置１００は、異常スコア計算部１０５において異常スコアを計算する際、障害情報蓄積部１０４を参照することにより、障害が継続しているかどうかを考慮する。即ち、本実施形態における運用管理装置１００は、監視対象装置の状態の時間変化を考慮して、当該監視対象装置に関する異常を検知するように構成されている。

これにより、運用管理装置１００は、特定の性能指標（メトリック）の組み合わせに関して、実際に異常が生じているかどうかに関わらず定常的に異常状態が検知される場合であっても、監視対象装置の異常を検知可能である。より具体的には、運用管理装置１００は、特定の性能指標（メトリック）の組み合わせに関して検知される状態が正常状態から異常状態に変化した場合に、監視対象装置における異常の発生を検知し、かつその異常箇所を適切に特定可能である。以上より、本実施形態における運用管理装置１００によれば、監視対象システムに関する特定の異常（障害）状態が継続的に検出される状況において、監視対象システムにおいて実際に異常（障害）が発生しているか否かを判定可能な情報を提供可能である。

上記説明した本実施形態に係る運用管理装置１００は、例えば、相関モデルの生成時と、実際の運用時とにおいて、監視対象装置に関する条件が異なる場合にも有効である。例えば、相関モデルが、監視対象装置の定常状態におけるデータを用いて生成される場合を仮定する。このように生成された相関モデルが、監視対象装置の立ち上げ時や停止時に適用されると、相関モデル生成時と適用時の状態の差異を異常（障害）と誤検知してしまうことがある。例えば、あるメトリックの実測値が、監視対象装置の立ち上げ状態や停止状態の際には正常な値であったとしても、定常状態において生成された相関モデルから出力される推定値とは乖離する場合がある。このような誤検知による異常状態は継続的に検知されることがあるが、本実施形態における運用管理装置１００を用いることにより、その影響を適切に除外することができる。また、相関モデルの生成時と適用時とにおいてデータ収集機構が異なる（例えばセンサデバイスを変えた場合や、センサデータに変換を施した場合等）場合にも、本実施形態における運用管理装置は有効である。

＜第１の実施形態の変形例＞
次に、上記説明した第１の実施形態の変形例について、図４を参照して説明する。図４は、本変形例における運用管理装置４００の機能的な構成を例示するブロック図である。なお、以下の説明において、上記第１の実施形態と同様の構成については、同様の参照符号を付すことにより、詳細な説明は省略する。

本変形例における運用管理装置４００は、上記第１の実施形態における運用管理装置１００と同様の構成要素に加えて、更に提示部４０６を備える。運用管理装置４００において、提示部４０６以外の他の構成は、上記第１の実施形態と同様としてよいので、詳細な説明を省略する。

提示部４０６は、異常スコア計算部１０５において算出された異常スコア等を、運用管理装置４００のユーザに対して提示する。より具体的には、提示部４０６は、特定のメトリック（あるいはその組み合わせ）及び当該メトリックに関する異常スコアを表示するよう、各種表示装置を制御する。表示装置は、例えば、液晶パネルやプロジェクタ等、ユーザに対して各種情報を表示する機能を有する装置であってよい。なお、図４に例示する構成においては、運用管理装置４００の外部に表示装置が設けられているが、本変形例はこれには限定されない。係る表示装置は、運用管理装置４００の一部として設けられてもよく、運用管理装置４００とは別に設けられてもよい。

提示部４０６は、例えば、図５あるいは図６に示すようなユーザ・インタフェースを生成し、係るユーザ・インタフェースを表示するように、表示装置を制御してもよい。図５及び図６に例示するユーザ・インタフェースにおいては、監視対象装置における監視対象要素（メトリック）と、異常スコアとが、関連付けて表示されている。

提示部４０６は、異常スコアを特定の基準に沿って並べ替えて表示するユーザ・インタフェースを生成し、係るユーザ・インタフェースを表示するように、表示装置を制御可能である。具体的には、提示部４０６は、例えば、異常スコアを、降順（あるいは昇順）で並べ替えたランキング形式で表示するユーザインタフェースを生成してもよい。例えば、提示部４０６が、ある監視対象装置に関するメトリックに対して算出された異常スコアを、その値が大きい順にランキング形式でユーザに提示する場合、ユーザは、障害が生じている可能性が高い監視対象装置を知ることができる。

提示部４０６は、例えば、上記説明した異常検出率を考慮することにより継続的な障害の影響が除去された異常スコア（第１の異常スコア）と、異常検出率を考慮せずに算出された異常スコア（第２の異常スコア)と、を共に表示可能なユーザ・インタフェースを生成してもよい（図５）。図５に例示するユーザインタフェースにおいては、符号５０１により示される領域に、第１の異常スコアに関する情報が表示され、符号５０２により示される領域に、第２の異常スコアに関する情報が表示される。

また、提示部４０６は、ユーザが第１の異常スコアと、第２の異常スコアとを切り替えて表示可能なユーザ・インタフェースを生成してもよい（図６）。図６に提示するユーザ・インタフェースにおいては、例えば、ユーザが「切り替え」ボタンを押下することにより、第１の異常スコアと、第２の異常スコアとが切り替えられて表示される。この場合、ユーザは、例えば、相関モデルの生成時と適用時の条件が類似している場合には第１の異常スコアを表示するよう、ユーザ・インタフェースを操作可能である。

上記のように構成された本変形例における運用管理装置４００は、特定の基準に沿って並べ替えた異常スコアを、ユーザに対して提示可能である。これより、本変形例における運用管理装置４００によれば、ユーザは、例えば、異常スコアが大きい（障害が生じている可能性が高い）監視対象装置を知ることが可能である。また、ユーザは、例えば、異常スコアが小さい（安定して稼働している可能性が高い）監視対象装置を知ることも可能である。これにより、ユーザは、例えば、異常スコアが大きい監視対象装置を優先して各種管理作業を実行可能である。

また、上記のように構成された本変形例による運用管理装置４００は、ユーザに対して、第１の異常スコアと、第２の異常スコアとを提示可能である。これにより、本変形例における運用管理装置４００によれば、ユーザは、状況に応じて（運用管理装置４００により監視対象装置を監視する場面に応じて）、参照する異常スコアを切り替えることが可能である。

以上より、本変形例における運用管理装置４００は、ユーザによる監視対象装置に関する各種管理作業を効率化可能である。また、本変形例における運用管理装置４００は、上記第１の実施形態における運用管理装置１００と同様の構成を備えることから、上記第１の実施形態における運用管理装置１００と同様の効果を奏する。

＜第２の実施形態＞
次に、本発明の第２の実施形態について、図７を参照して説明する。図７は、第２の実施形態における運用管理装置７００の機能的な構成を例示するブロック図である。

図７に例示するように、本実施形態における運用管理装置７００は、障害検出部７０１と、障害情報蓄積部７０２と、異常スコア計算部７０３とを備える。これらの構成要素は、適切な通信方法を用いて相互に通信可能に接続されていてもよい。以下、それぞれの構成要素について説明する。

障害検出部７０１（障害検出手段）は、監視対象システム（不図示）に関する性能指標（メトリック）の計測値を１以上取得する。監視対象システムは、１以上の監視対象装置から構成されてもよい。障害検出部７０１は、監視対象システムを構成する監視対象装置に関する性能指標（メトリック）の計測値を取得してもよい。障害検出部７０１は、相異なる２つの上記性能指標の関係を表す相関モデルを用いることにより、取得した計測値に基づいて、相異なる２つの性能指標に関する障害情報を検出する。係る障害検出部７０１は、例えば、上記各実施形態における障害検出部１０３と同様としてもよい。

障害情報蓄積部７０２（障害情報蓄積手段）は、上記障害検出部７０１において検出された障害に関する情報を時系列に保持する。障害情報蓄積部７０２は、例えば、ある性能指標（メトリック）の組み合わせに関する障害情報と、当該障害情報が検出された時刻とを関連付けて、時系列データとして保持してもよい。係る障害情報蓄積部７０２は、例えば、上記各実施形態における障害情報蓄積部１０４と同様としてもよい。

異常スコア計算部７０３（異常スコア計算手段）は、障害情報蓄積部７０２に保持された障害に関する情報に基づいて、相異なる２つの性能指標の組み合わせのうち、特定の性能指標を含む組み合わせについて、障害情報が継続して検出されたか否かを判定する。

異常スコア計算部７０３は、上記性能指標に関する異常の程度を表す、異常スコアを算出する。具体的には、異常スコア計算部７０３は、例えば、特定の性能指標を含み、障害情報が検出された１以上の上記組み合わせ（第１の組み合わせ）のうち、障害情報が継続して検出されたと判定された１以上の上記組み合わせ(第２の組み合わせ）に関する情報を取得する。また、異常スコア計算部７０３は、特定の性能指標を含む他の上記組み合わせに関する情報を取得する。そして、異常スコア計算部７０３は、上記取得した情報に基づいて、異常スコアを算出する。上記組み合わせに関する情報は、例えば、当該組み合わせの数に関する情報であってもよい。係る異常スコア計算部７０３は、例えば、上記各実施形態における異常スコア計算部１０５と同様としてもよい。

上記のように構成された本実施形態における運用管理装置７００は、異常スコア計算部７０３において異常スコアを計算する際、障害情報蓄積部７０２を参照して障害が継続しているかどうかを考慮する。即ち、本実施形態における運用管理装置７００は、監視対象システムの状態の時間変化を考慮して、当該監視対象システムに関する異常を検知するように構成されている。

これより、運用管理装置７００は、特定の性能指標（メトリック）の組み合わせに関して、実際に異常が生じているかどうかに関わらず定常的に異常状態が検知される場合であっても、監視対象システムの異常を検知可能である。より具体的には、運用管理装置７００は、特定の性能指標（メトリック）の組み合わせに関して検知される状態が正常状態から異常状態に変化した場合に、監視対象システムにおける異常の発生を検知し、かつその異常箇所を適切に特定可能である。以上より、本実施形態における運用管理装置７００によれば、監視対象システムに関する特定の異常（障害）状態が継続的に検出される状況において、監視対象システムにおいて実際に異常（障害）が発生しているか否かを判定可能な情報を提供可能である。

＜第３の実施形態＞
次に、本発明の第２の実施形態について、図８を参照して説明する。図８は、第２の実施形態における運用管理システム８００の機能的な構成を例示するブロック図である。

図８に例示するように、本実施形態における運用管理システム８００は、障害検出装置８０１と、障害情報蓄積装置８０２と、異常スコア計算装置８０３とを備える。これらの構成要素は、適切な通信方法を用いて相互に通信可能に接続されていてもよい。このような運用管理システム８００は、例えば、上記第２の実施形態における運用管理装置７００の各構成要素を単体の情報処理装置（コンピュータ等）により実現し、それらを相互に接続したシステムとして実現され得る。

即ち、障害検出装置８０１は、例えば、上記各実施形態における障害検出部１０３、あるいは、障害検出部７０１の機能を実現可能な、コンピュータ等の任意の情報処理装置である。

また、障害情報蓄積装置８０２は、上記各実施形態における障害情報蓄積部１０４、あるいは、障害情報蓄積部７０２の機能を実現可能な、コンピュータ等の任意の情報処理装置である。

また、異常スコア計算装置８０３は、例えば、上記各実施形態における異常スコア計算部１０５、あるいは、異常スコア計算部７０３の機能を実現可能な、コンピュータ等の任意の情報処理装置である。

上記のように構成された本実施形態における運用管理システム８００は、上記各実施形態と同様、異常スコア計算装置８０３において異常スコアを計算する際、障害情報蓄積装置８０２を参照して障害が継続しているかどうかを考慮する。即ち、本実施形態における運用管理システム８００は、監視対象システムの状態の時間変化を考慮して、当該監視対象システムに関する異常を検知するように構成されている。

これより、運用管理システム８００は、特定の性能指標（メトリック）の組み合わせに関して、実際に異常が生じているかどうかに関わらず定常的に異常状態が検知される場合であっても、監視対象システムの異常を検知可能である。より具体的には、運用管理システム８００は、特定の性能指標（メトリック）の組み合わせに関して検知される状態が正常状態から異常状態に変化した場合に、監視対象システムにおける異常の発生を検知し、かつその異常箇所を適切に特定可能である。以上より、本実施形態における運用管理システム８００によれば、監視対象システムに関する特定の異常（障害）状態が継続的に検出される状況において、監視対象システムにおいて実際に異常（障害）が発生しているか否かを判定可能な情報を提供可能である。

なお、上記説明においては、障害検出装置８０１と、障害情報蓄積装置８０２と、異常スコア計算装置８０３とがそれぞれ単体の情報処理装置により構成されるが、本実施形態はこれには限定されない。即ち、運用管理システム８００を構成するこれらの構成要素のうち、２以上の構成要素が、同一の情報処理装置により実現されてもよい。係る情報処理装置は、物理的なコンピュータ等の情報処理装置であってもよく、今日では一般的な仮想化技術を用いて実現された、仮想的な情報処理装置であってもよい。なお、係る情報処理装置は、図９に例示するハードウェア構成により実現可能である。

＜ハードウェア及びソフトウェア・プログラム（コンピュータ・プログラム）の構成＞
以下、上記説明した各実施形態を実現可能なハードウェア構成について説明する。

以下の説明において、上記各実施形態において説明した運用管理装置（１００、７００）をまとめて、単に「運用管理装置」と称する。また運用管理装置の構成要素（性能情報蓄積部１０１、相関モデル記憶部１０２、障害検出部（１０３、７０１）、障害情報蓄積部（１０４、７０２）、異常スコア計算部（１０５、７０３）、提示部４０６）を、単に「運用管理装置の構成要素」と称する。

上記各実施形態において説明した運用管理装置は、専用のハードウェア装置により構成してもよい。その場合、上記各図に示した各構成要素は、一部又は全部を統合したハードウェア（処理ロジックを実装した集積回路等）として実現してもよい。

例えば、各構成要素をハードウェアにより実現する場合、各構成要素は、それぞれの機能を提供可能な集積回路をＳｏＣ（ＳｙｓｔｅｍｏｎａＣｈｉｐ）等により実装されてもよい。この場合、例えば、各構成要素が保持するデータは、ＳｏＣとして統合されたＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）領域やフラッシュメモリ領域に記憶されてもよい。

また、この場合、各構成要素を接続する通信回線としては、周知の通信バスを採用してもよい。また、各構成要素を接続する通信回線はバス接続に限らず、それぞれの構成要素の間はピアツーピアで接続されてもよい。

また、上述した運用管理装置は、図９に例示するような汎用のハードウェアと、係るハードウェアによって実行される各種ソフトウェア・プログラム（コンピュータ・プログラム）とによって構成されてもよい。

図９における演算装置９０１は、汎用のＣＰＵ（中央処理装置：ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）やマイクロプロセッサ等の演算処理装置である。演算装置９０１は、例えば後述する不揮発性記憶装置９０３に記憶された各種ソフトウェア・プログラムを記憶装置９０２に読み出し、係るソフトウェア・プログラムに従って処理を実行してもよい。例えば、上記各実施形態における運用管理装置の構成要素は、演算装置９０１により実行されるソフトウェア・プログラムとして実現可能である。

記憶装置９０２は、演算装置９０１から参照可能な、ＲＡＭ等のメモリ装置であり、ソフトウェア・プログラムや各種データ等を記憶する。なお、記憶装置９０２は、揮発性のメモリ装置であってもよい。

不揮発性記憶装置９０３は、例えば磁気ディスクドライブや、フラッシュメモリによる半導体記憶装置のような、不揮発性の記憶装置である。不揮発性記憶装置９０３は、各種ソフトウェア・プログラムやデータ等を記憶可能である。

ネットワークインタフェース９０６は、通信ネットワークに接続するインタフェース装置であり、例えば有線及び無線のＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）接続用インタフェース装置等を採用してもよい。

ドライブ装置９０４は、例えば、後述する記録媒体９０５に対するデータの読み込みや書き込みを処理する装置である。

記録媒体９０５は、例えば光ディスク、光磁気ディスク、半導体フラッシュメモリ等、データを記録可能な任意の記録媒体である。

入出力インタフェース９０７は、外部装置との間の入出力を制御する装置である。

上述した各実施形態を例に説明した本発明における運用管理装置は、例えば、図９に例示したハードウェア装置により構成されてもよい。同様に、上述した運用管理システム８００の各構成要素も、例えば、図９に例示したハードウェア装置により構成されてもよい。この場合、係るハードウェア装置に対して、上記各実施形態において説明した機能を実現可能なソフトウェア・プログラムを供給することにより、本発明が実現されてもよい。より具体的には、例えば、係る装置に対して供給したソフトウェア・プログラムを、演算装置９０１が実行することによって、本発明が実現されてもよい。

上述した各実施形態において、上記各図（例えば、図１、図４、及び図７）に示した各部は、上述したハードウェアにより実行されるソフトウェア・プログラムの機能（処理）単位である、ソフトウェアモジュールとして実現することができる。ただし、これらの図面に示した各ソフトウェアモジュールの区分けは、説明の便宜上の構成であり、実装に際しては、様々な構成が想定され得る。

例えば、上記各部をソフトウェアモジュールとして実現する場合、これらのソフトウェアモジュールは、不揮発性記憶装置９０３に記憶されてもよい。そして、演算装置９０１が、それぞれの処理を実行する際に、これらのソフトウェアモジュールを記憶装置９０２に読み出してもよい。

また、これらのソフトウェアモジュールの間は、共有メモリやプロセス間通信等の適宜の方法により、相互に各種データを伝達できるように構成してもよい。このような構成により、これらのソフトウェアモジュールの間は、相互に通信可能に接続可能である。

更に、上記各ソフトウェア・プログラムは記録媒体９０５に記録されてもよい。この場合、上記各ソフトウェア・プログラムは、上記通信装置等の出荷段階、あるいは運用段階等において、適宜ドライブ装置９０４を通じて不揮発性記憶装置９０３に格納されるよう構成されてもよい。

なお、上記の場合において、上記運用管理装置への各種ソフトウェア・プログラムの供給方法は、出荷前の製造段階、あるいは出荷後のメンテナンス段階等において、適当な治具を利用して当該装置内にインストールする方法を採用してもよい。また、各種ソフトウェア・プログラムの供給方法は、インターネット等の通信回線を介して外部からダウンロードする方法等のように、現在では一般的な手順を採用してもよい。

そして、このような場合において、本発明は、係るソフトウェア・プログラムを構成するコード、あるいは係るコードが記録されたところの、コンピュータ読み取り可能な記録媒体によって構成されると捉えることができる。

また、上述した運用管理装置、あるいは、当運用管理装置の構成要素は、図９に例示するハードウェア装置を仮想化した仮想化環境と、当該仮想化環境において実行される各種ソフトウェア・プログラム（コンピュータ・プログラム）とによって構成されてもよい。この場合、図９に例示するハードウェア装置の構成要素は、当該仮想化環境における仮想デバイスとして提供される。なお、この場合も、図９に例示するハードウェア装置を物理的な装置として構成した場合と同様の構成にて、本発明を実現可能である。

同様に、上述した運用管理システム８００の各構成要素も、図９に例示するハードウェア装置を仮想化した仮想化環境と、当該仮想化環境において実行される各種ソフトウェア・プログラム（コンピュータ・プログラム）とによって実現可能である。

以上、本発明を、上述した模範的な実施形態に適用した例として説明した。しかしながら、本発明の技術的範囲は、上述した各実施形態に記載した範囲には限定されない。即ち、本発明は、本発明のスコープ内において、当業者が理解し得る様々な態様を適用することができる。当業者には、係る実施形態に対して多様な変更又は改良を加えることが可能であることは明らかである。そのような場合、係る変更又は改良を加えた新たな実施形態も、本発明の技術的範囲に含まれ得る。更に、上述した各実施形態、あるいは、係る変更又は改良を加えた新たな実施形態を組み合わせた実施形態も、本発明の技術的範囲に含まれ得る。そしてこのことは、請求の範囲に記載した事項から明らかである。この出願は、２０１４年１２月２２日に出願された日本出願特願２０１４−２５９１５８を基礎とする優先権を主張し、その開示の全てをここに取り込む。

１００運用管理装置
１０１性能情報蓄積部
１０２相関モデル記憶部
１０３障害検出部
１０４障害情報蓄積部
１０５異常スコア計算部
４０６提示部
７００運用管理装置
７０１障害検出部
７０２障害情報蓄積部
７０３異常スコア計算部
９０１演算装置
９０２記憶装置
９０３不揮発性記憶装置
９０４ドライブ装置
９０５記録媒体
９０６ネットワークインタフェース
９０７入出力インタフェース

Claims

監視対象システムに関する性能指標の計測値を１以上取得し、
相異なる２つの前記性能指標の関係を表す相関モデルを用いることにより、前記取得した計測値に基づいて、相異なる２つの前記性能指標の組み合わせに関する障害を示す障害情報を検出する障害検出手段と、
当該検出された前記障害情報を時系列に保持する障害情報蓄積手段と、
前記障害情報蓄積手段に保持された前記障害情報に基づいて、特定の前記性能指標を含む前記組み合わせについて、前記障害情報が継続して検出されたか否かを判定し、
特定の前記性能指標を含み前記障害情報が検出された前記組み合わせである１以上の第１の組み合わせのうち、前記障害情報が継続して検出されたと判定された前記組み合わせである１以上の第２の組み合わせに関する情報と、特定の前記性能指標を含む他の前記組み合わせに関する情報とに基づいて、前記性能指標に関する異常の程度を表す異常スコアを算出する異常スコア計算手段と、
を備える運用管理装置。
前記異常スコア計算手段は、
前記第１の組み合わせの数から、前記第２の組み合わせの数を除いた差分を算出し、
特定の前記性能指標を含む全ての前記組み合わせの数と、前記算出した差分との割合に基づいて、前記異常スコアを算出する
請求項１に記載の運用管理装置。
前記異常スコア計算手段は、
特定の前記性能指標を含む前記組み合わせについて、当該組み合わせに関して第１の期間の間に取得された前記計測値の数に対する、当該第１の期間の間に検知された前記障害情報の数の割合が、基準を超えた場合に、当該組み合わせに関する前記障害情報が継続して検出されたと判定する、請求項１または請求項２に記載の運用管理装置。
前記異常スコア計算手段は、
特定の前記性能指標を含む前記組み合わせについて、当該組み合わせに関して第１の期間の間に取得された前記計測値の数に対する、当該第１の期間に含まれる第２の期間の間に連続して検知された前記障害情報の数の割合が基準を超えた場合に、当該組み合わせに関する前記障害情報が継続して検出されたと判定する、請求項１または請求項２に記載の運用管理装置。
前記異常スコア計算手段は、
前記障害情報蓄積手段に保持された前記障害情報に基づいて、特定の前記性能指標を含む１以上の前記組み合わせについて、当該組み合わせに関する前記障害情報が継続して検出されたか否かを判定し、
前記障害情報が継続して検出されたと判定した場合に、前記第１の組み合わせの数から、前記第２の組み合わせの数を除いた差分を算出し、特定の前記性能指標を含む全ての前記組み合わせの数と、前記算出した差分との割合に基づいて第１の異常スコアを算出するとともに、
前記第１の組み合わせの数と、特定の前記性能指標を含む全ての前記組み合わせの数との割合に基づいて第２の異常スコアを算出する、請求項２乃至請求項４のいずれかに記載の運用管理装置。
前記異常スコアを提示可能な提示手段を更に備え、
前記提示手段は、前記異常スコア計算手段において算出された前記異常スコアが高い順に、当該異常スコアが算出された前記組み合わせに含まれる前記性能指標に関する異常箇所を提示する請求項１乃至請求項５のいずれかに記載の運用管理装置。
前記異常スコアを提示可能な提示手段を更に備え、
前記提示手段は、前記異常スコア計算手段において算出された前記第１の異常スコアが高い順、または、前記第２の異常スコアが高い順に、前記第１の異常スコアまたは前記第２の異常スコアが算出された前記組み合わせに含まれる前記性能指標に関する異常箇所を切り替えて提示する請求項５に記載の運用管理装置。
前記相関モデルは、１以上の前記組み合わせに含まれる２つの前記性能指標である、第１の性能指標と、第２の性能指標との間の相関関係を表す変換関数を含み、
前記障害検出手段は、前記取得した計測値に含まれる前記第１の性能指標の計測値に対して前記変換関数を適用することにより得られる前記第２の性能指標に関する推定値と、前記取得した計測値に含まれる前記第２の性能指標の計測値との差分あるいは当該差分に比例する値が基準を超える場合に、前記第１の性能指標と、前記第２の性能指標とに関する障害を検出する、請求項１乃至請求項７のいずれかに記載の運用管理装置。
情報処理装置が、
監視対象システムに関する性能指標の計測値を１以上取得し、
相異なる２つの前記性能指標の関係を表す相関モデルを用いることにより、前記取得した計測値に基づいて、相異なる２つの前記性能指標の組み合わせに関する障害を示す障害情報を検出し、
当該検出された前記障害情報を時系列に保持し、
当該保持された前記障害情報に基づいて、特定の前記性能指標を含む前記組み合わせについて、前記障害情報が継続して検出されたか否かを判定し、
特定の前記性能指標を含み、前記障害情報が検出された前記組み合わせである１以上の第１の組み合わせのうち、前記障害情報が継続して検出されたと判定された前記組み合わせである１以上の第２の組み合わせに関する情報と、特定の前記性能指標を含む他の前記組み合わせに関する情報とに基づいて、前記性能指標に関する異常の程度を表す異常スコアを算出する
運用管理方法。
コンピュータに、
監視対象システムに関する性能指標の計測値を１以上取得する処理と、
相異なる２つの前記性能指標の関係を表す相関モデルを用いることにより、前記取得した計測値に基づいて、相異なる２つの前記性能指標の組み合わせに関する障害を示す障害情報を検出する処理と、
当該検出された前記障害情報を時系列に保持する処理と、
当該保持された前記障害情報に基づいて、特定の前記性能指標を含む前記組み合わせについて、前記障害情報が継続して検出されたか否かを判定する処理と、
特定の前記性能指標を含み、前記障害情報が検出された前記組み合わせである１以上の第１の組み合わせのうち、前記障害情報が継続して検出されたと判定された前記組み合わせである１以上の第２の組み合わせに関する情報と、特定の前記性能指標を含む他の前記組み合わせに関する情報とに基づいて、前記性能指標に関する異常の程度を表す異常スコアを算出する処理と、を実行させる
コンピュータプログラムが記録された記録媒体。