JP2014153736A

JP2014153736A - 障害予兆検出方法、プログラムおよび装置

Info

Publication number: JP2014153736A
Application number: JP2013020110A
Authority: JP
Inventors: Akira Goto; 公後藤
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2013-02-05
Filing date: 2013-02-05
Publication date: 2014-08-25

Abstract

【課題】障害予兆検出で、監視対象の稼働状況に応じた閾値で障害予兆を判定できるようにする。
【解決手段】障害予兆検出装置１は、監視対象２について異常が検出されなかった期間の監視対象２の監視データを曜日、時間帯、日にち、または、週数毎に分類して記憶部（２３）に記憶し（１４）、記憶部に記憶された監視データの曜日、時間帯、日にち、または、週数毎の分布をもとに許容範囲を設定し、監視対象２から取得した監視データと、監視データの監視日時が属する曜日、時間帯、日にち、または、週数の監視データの分布にもとづく許容範囲とを比較し、監視データが該許容範囲の上限または下限を超える場合に監視対象２の障害予兆を検出する（１３）。
【選択図】図２

Description

本発明は、コンピュータシステム監視における障害予兆の検出技術に関する。

２４時間稼働するコンピュータシステムでは、障害によるシステム停止を極力短くする必要がある。そのため、コンピュータシステムが停止してから障害を検知するのではなく、障害の予兆を検知して、停止前の障害の回避や復旧作業の初動を早くすることが求められている。

従来のコンピュータシステムの障害監視では、コンピュータシステムの停止を検出した後または稼働状況が予め設定された閾値を超えた時に異常を通知するようにしていた。

障害検出の従来手法の１つとして、監視対象システムの性能を表す時系列データを一定周期で抽出し、過去の時系列データとして過去のメタデータに関連付けて格納し、リアルタイムの時系列データを示すメタデータと照合し、今後の変化を検出して障害を出力する手法が知られている。

また、別の従来手法として、障害管理の対象から出力されたログ情報と過去の障害発生時の障害ログ情報とを読み出し、ログ情報および障害ログ情報の類似度を判定し、類似度が高い障害ログ情報の障害関連情報を出力する手法が知られている。

さらに、別の従来手法として複数のネットワーク装置からの監視情報を初期監視情報として連続的に収集し、収集した連続情報の統計的な振舞いを監視し、通常の振舞いと異なる場合に異常発生の予兆の検出とみなして関連する複数の監視情報収集を指示する手法が知られている。

特開２００９−２８９２２１号公報特開２００６−０９９２４９号公報特開２００５−２８５０４０号公報

監視対象のコンピュータシステムで実際に障害が発生する前にその予兆を検知する必要がある。障害の予兆を閾値で判定する場合に、閾値の設定が問題となる。設定した閾値が低すぎれば誤検知が生じやすく、高すぎれば検知の直後に障害となる。

また、コンピュータシステムによっては夜間にバッチ処理を実行したり特定時機にシステムを一時停止したりすることがあり、コンピュータシステムの稼働状況は常に一定であるとは限らない。そのため、変動する稼働状況に応じて閾値を変える必要がある。

さらに、コンピュータシステムでは障害のない運用が期待されているため、障害が実際に発生する前から適切な閾値を設定する必要がある。

しかしながら、従来手法では、監視対象の稼働状況に応じた閾値で障害予兆を検出することができず、また、実際に障害が発生しなければ適切な閾値を得ることができなかった。

１つの側面では、本発明は、監視対象の通常時の稼働情報から監視時の稼働状況に応じた閾値を設定して障害予兆を検出できる障害予兆検出を実行する方法、プログラムおよび装置を提供することである。さらに、本発明の前記ならびに他の目的と新規な特徴は、明細書の記述および添付図面から明らかにされるであろう。

１実施態様に係る障害予兆検出方法は、監視対象システムについて異常が検出されなかった期間における該監視対象システムの監視データを曜日、時間帯、日にち、または、週数毎に分類して記憶部に記憶し、前記記憶部に記憶された監視データの曜日、時間帯、日にち、または、週数毎の分布をもとに許容範囲を設定し、前記監視対象システムから現在取得した監視データと、該現在の日時が属する曜日、時間帯、日にち、または、週数の監視データの分布にもとづく許容範囲とを比較し、該取得した監視データが該許容範囲の上限または下限を超える場合に前記監視対象システムの障害予兆を検出する、処理をコンピュータが実行するものである。

監視対象のコンピュータシステムの稼働状況に応じた適切な閾値を用いて障害予兆を検出する処理を実現することができる。

障害予兆検出装置の一実施例におけるハードウェア構成例を示す図である。開示する障害予兆検出装置の一実施例における機能ブロック例を示す図である。監視結果ログテーブルの一実施例におけるデータ構成例を示す図である。監視閾値テーブルの一実施例におけるデータ構成例を示す図である。正常稼働情報テーブルの一実施例におけるデータ構成例を示す図である。稼働システムテーブルの一実施例におけるデータ構成例を示す図である。障害予兆検出装置の一実施例における障害予兆の検出処理フローを示す図である。障害予兆検出装置が取得する監視結果と許容範囲との関係例を示す図である。障害予兆検出装置の一実施例における閾値設定処理フローを示す図である。

以下、本発明の一態様として開示する障害予兆検出方法を実行する障害予兆検出装置について説明する。

図１は、障害予兆検出装置１の一実施例におけるハードウェア構成例を示す図である。

障害予兆検出装置１は、ＣＰＵ１０１、短期記憶部（ＤＲＡＭ）１０２、長期記憶部（ＨＤＤ）１０３、ネットワークインタフェース１０４、入力装置（キーボード、マウス等）１０５、出力装置（ディスプレイ、プリンタ等）１０６が内部ネットワーク等で接続されたコンピュータとして実施することができる。

障害予兆検出装置１は、監視対象のコンピュータシステムの障害予兆を検出する処理に必要な情報をファイルとして長期記憶部１０３に記憶し、入力装置１０５から実行プログラムを起動し、起動された実行プログラムが、短期記憶部１０２にロードされ、ネットワークインタフェース１０４で受信した監視対象のコンピュータシステムの正常時の稼働状況を示す情報（正常稼働情報）をもとに障害予兆の検出処理を実行する。

障害予兆検出装置１は、必要に応じて情報を長期記憶部１０３から短期記憶部１０２に読み出しながら障害予兆検出処理を進める。障害予兆検出装置１は、監視対象の正常稼働情報を日時情報と対応付けて記憶し、記憶した正常稼働情報をもとに監視時に対応する許容範囲を示す閾値（上限値、下限値）を設定し、リアルタイムで取得した稼働情報が監視時の許容範囲を超えた場合に障害予兆検出を出力する。

障害予兆検出装置１は、正常稼働情報として、監視対象のコンピュータシステムの正常時の稼働状況における情報、例えば、監視対象のコンピュータシステムを構成する各システムを実行するコンピュータ装置のＣＰＵ使用率、記憶領域使用率、未処理データ件数等の情報を用いる。

なお、障害予兆検出処理の実行プログラムは、ＣＤ−ＲＯＭ、ＣＤ−ＲＷ、ＤＶＤ−Ｒ、ＤＶＤ−ＲＡＭ、ＤＶＤ−ＲＷ等やフレキシブルディスク等の記録媒体だけでなく、通信回線の先に備えられた他の記憶装置やコンピュータのハードディスク等に記憶されるものであってもよい。

図２は、開示する障害予兆検出装置１の一実施例における機能ブロック例を示す図である。

障害予兆検出装置１は、一実施例において、医療機関に設置されたコンピュータシステムを監視対象２とし、そのコンピュータシステムを構成する各システムを監視対象システム２Ａ〜２Ｃについて障害予兆を検出する。

障害予兆検出装置１は、上記処理を実行するため、監視結果取得部１１、監視結果比較部１２、正常稼働情報比較部１３、正常稼働情報算出部１４、予兆検知通知部１５を備え、データ保管場所として、監視結果ログテーブル２１、監視閾値テーブル２２、正常稼働情報テーブル２３を備える。

さらに、障害予兆検出装置１は、稼働システム比較部１６、閾値設定部１７、データ保管場所の稼働システムテーブル２４を備えてもよい。

監視結果取得部１１は、監視対象２であるコンピュータシステムの各監視対象システム２Ａ〜２Ｃそれぞれから正常時の稼働状況を示すデータである監視結果データを取得し、監視データに監視対象および監視日時を付けた監視結果ログデータを監視結果ログテーブル２１に記録する。なお、監視結果データは、監視対象システム２Ａ〜２Ｃを実行する各コンピュータ装置に常駐する監視プログラム等により生成され障害予兆検出装置１へ送信されるものとする。

図３は、監視結果ログテーブル２１のデータ構成例を示す図である。

監視結果ログテーブル２１は、施設、監視日時、監視対象機器、監視項目および監視結果のデータ項目を有する。「施設」は監視対象２のコンピュータシステムが設置されている場所を識別する情報である。「監視日時」は、監視結果データを取得した日時を示す情報、「監視対象機器」は監視対象２のコンピュータシステムの各監視対象システムを実行するコンピュータ装置等の機器を識別する情報である。

「監視項目」は、監視対象２に対して監視する稼働状況の項目を示す情報であり、例えば、ＣＰＵ使用率、記憶領域の使用率（ディスク使用率）、処理するデータのうち未処理のデータの件数（未処理データ件数）等が予め設定される。「監視結果」は、監視項目の状況について監視日時に取得された値である。

図３に示す監視結果ログテーブル２１の例では、先頭データが、“Ａ病院”に設置された監視対象２のコンピュータシステムを構成する“電子カルテサーバ”で“２０１２年０２月２０日００時００分”取得した“ＣＰＵ使用率”の監視結果が“３２％”であることを表している。

監視結果比較部１２は、監視結果ログテーブル２１に現時点で取得した監視結果ログデータが記録されると、監視閾値テーブル２２に記憶された監視結果ログデータの監視結果を監視閾値と比較し、監視結果が対応する監視閾値を超過する場合に「異常検知」を出力する。

図４は、監視閾値テーブル２２のデータ構成例を示す図である。

監視閾値テーブル２２は、施設、監視対象機器、監視項目、閾値ｔｈ１、閾値ｔｈ２のデータ項目を有する。

監視閾値テーブル２２の「施設」、「監視対象機器」、「監視項目」は、監視結果ログテーブル２１の同名のデータ項目と同じ情報である。監視閾値の「閾値ｔｈ１」および「閾値ｔｈ２」は、異常検知を出力するかを判定する情報である。監視閾値は、１つが設定されていればよく、図４に示すように、異常の段階に応じて複数の閾値が設定されていてもよい。

図４に示す監視閾値テーブル２２の先頭データは、“Ａ病院”に設置された監視対象２のコンピュータシステムの監視対象システム“電子カルテサーバ”の“ＣＰＵ使用率”について、閾値ｔｈ１＝８５％および閾値ｔｈ２＝９０％が設定されていることを表している。

監視結果比較部１２は、監視結果ログテーブル２１にリアルタイムで取得された監視結果ログデータが記録されると、監視閾値テーブル２２から、その監視結果ログデータと施設、監視対象機器、および監視項目が一致する閾値ｔｈ１および閾値ｔｈ２を抽出し、その監視結果ログデータの監視結果が閾値ｔｈ１または閾値ｔｈ２のいずれかを超過したと判断した場合に「異常検知」を出力する。

正常稼働情報比較部１３は、監視結果ログデータの監視結果が対応する監視閾値（閾値ｔｈ１および閾値ｔｈ２）を超過しなかった場合に、その監視結果ログデータの監視日時と日時にもとづく条件（曜日、日にち、週数、または時間帯）が一致する正常稼働情報から算出された許容範囲と監視結果ログデータの監視結果と比較して、監視結果が許容範囲を超過する場合に「障害予兆検知」を出力する。

図５は、正常稼働情報テーブル２３のデータ構成例を示す図である。

正常稼働情報テーブル２３は、施設、監視対象機器、監視項目、条件区分条件、監視時間、許容範囲のデータ項目を有する。

正常稼働情報テーブル２３の「施設」、「監視対象機器」、「監視項目」は、監視結果ログテーブル２１の同名のデータ項目と同じ情報が記録される。

「条件区分」は、許容範囲を適用するための条件であって、監視日時の月日に対する区分である。「条件区分」は、例えば、曜日、週数、日にち等の区分が設定される。「曜日」の条件区分では「日曜日」〜「土曜日」までの各曜日が、「週数」の条件区分では１年単位での各週の週番号が、「日にち」の条件区分では月単位の第何番目の日、月末等が、その条件としてそれぞれ設定される。

「監視時間」は、監視日時の時刻に対する区分であり、監視時間帯の中央時刻を示す情報である。例えば、「監視時間」が“０：００”である場合は、時刻０：００を中央とする前後所定の時間帯が監視日時の条件となる。

「許容範囲」は、日時に基づく条件で分類された通常の稼働状況での監視結果の分布から求められた正常と許容できる範囲である。図５では、“下限値”〜“上限値”として表している。なお、許容範囲の算出については後述する。

図５に示す正常稼働情報テーブル２３の先頭データは、“Ａ病院”に設置された監視対象２のコンピュータシステムの“電子カルテサーバ”の“ＣＰＵ使用率”について、監視日時が“日曜日”かつ“０：００”前後に得られた監視結果が“３０％〜３５％”を超過する場合に、障害予兆が検出されたと判定されることを表している。

正常稼働情報比較部１３は、監視結果ログデータの監視日時が属する条件区分毎の区分（曜日、週番号、監視時間）を特定する。ここで、監視日時から、“日曜日”、“第１週”、“０：００”が特定されたとする。

正常稼働情報比較部１３は、特定した監視日時の区分と正常稼働情報テーブル２３の条件とをつきあわせ、該当する１または複数の許容範囲の最大上限値および最小下限値を求め、監視結果ログデータの監視結果が、最大上限値および最小下限値を超過している場合に「障害予兆検知」を出力する。

正常稼働情報算出部１４は、監視結果が許容範囲を超過しなかった監視結果ログデータ、すなわち異常や障害予兆が検出されなかった監視結果ログデータを、その監視日時をもとに予め定められた条件区分（曜日、日にち、週数）毎の該当する条件および監視時間（時間帯）で分類し、条件区分毎の監視結果の分布をもとに、各条件での許容範囲を算出し正常稼働情報テーブル２３に記録する。正常稼働情報算出部１４は、分類した正常稼働情報の監視結果についての所定の区分（例えば、５分毎）での度数分布を算出し、分布が最大となる区分（範囲）の監視結果を求め、求めた監視結果から一定の上限値および下限値を決定して許容範囲とする。

予兆検知通知部１５は、監視結果比較部１２が「異常検知」を出力した場合または正常稼働情報比較部１３が「障害予兆検知」を出力した場合に、監視対象２の監視対象システムの異常を示す情報として、出力された「異常検知」または「障害予兆検知」を予め設定された監視システムや管理者端末等の通知先へ通知する。

稼働システム比較部１６は、新しい施設に設置されたコンピュータシステムが監視対象２となる場合に、新しく監視対象２とするコンピュータシステムのシステム構成および利用機能に関する情報を取得して稼働システムテーブル２４に追加する。そして、稼働システム比較部１６は、追加したコンピュータシステムが備える稼働システムの構成を、既存の監視対象２のコンピュータシステムが備える稼働システムの構成および利用機能と比較し、新しく監視対象２のコンピュータシステムの稼働システムの構成と高い割合で一致する既存のコンピュータシステムを特定する。

図６は、稼働システムテーブル２４のデータ構成例を示す図である。

稼働システムテーブル２４は、施設、稼働システム構成、利用機能のデータ項目を有する。

「施設」は監視対象２が設置されている場所である。「稼働システム」は、監視対象２となっているコンピュータシステムが備える稼働システムを識別する情報である。「稼働システム」は、コンピュータシステムを構成する機器、装置等のハードウェアだけでなく、ＯＳ、アプリケーションプログラム等のソフトウェアの構成であってもよい。

「利用機能」は、監視対象２となるコンピュータシステムが備える稼働システムの機能の利用状態を示す情報であり、全機能が利用されている状態（全機能）、機能の一部が未使用である状態（一部機能は未使用）等が記録されている。

図６に示す稼働システムテーブル２４では、第１番目〜第３番目のデータは、“Ａ病院”に設置された監視対象２のコンピュータシステムに電子カルテシステム、医事会計システム、給食システムの稼働システムが含まれ、各稼働システムで全機能が利用されていることを表している。また、稼働システムテーブル２４の第４番目〜第６番目のデータは、“Ｂ病院”に設置された監視対象２のコンピュータシステムに電子カルテシステム、医事会計システム、検査システムが含まれ、検査システムでは一部の機能が未使用であることを表している。

閾値設定部１７は、新しく監視対象２とするコンピュータシステムの稼働システムの構成と高い割合で一致する既存のコンピュータシステムが稼働システムテーブル２４で特定できた場合に、監視閾値テーブル２２および正常稼働情報テーブル２３から特定した監視対象２のコンピュータシステムの稼働システムに対する監視閾値および正常稼働情報を抽出し、新しく監視対象２とするコンピュータシステムの監視閾値および正常稼働情報に情報を複写する。

新しい監視対象２として、稼働システムテーブル２４に“Ｃ病院”に設置されたコンピュータシステムが追加されたとする。また、監視対象同士の一致を判断する際に、一致する割合が１００％（完全一致）で設定されているとする。この場合に、図６に示す稼働システムテーブル２４において、“Ｃ病院”のコンピュータシステムの構成が、既存の監視対象２の“Ａ病院”のコンピュータシステムと「稼働システム」および「利用機能」が一致している。閾値設定部１７は、監視閾値テーブル２２および正常稼働情報テーブル２３から“Ａ病院”のコンピュータシステムに対する監視閾値および正常稼働情報を抽出して“Ｃ病院”の監視閾値のデータおよび正常稼働情報に複写する。

一方、新しい監視対象２として、稼働システムテーブル２４に“Ｄ病院”に設置されたコンピュータシステムが追加された場合に、“Ｄ病院”のコンピュータシステムと“Ａ病院”のコンピュータシステムと「稼働システム構成」が同一であるが「利用機能」の一部が一致していない。したがって、閾値設定部１７は、“Ｄ病院”のコンピュータシステムの監視閾値データおよび正常稼働情報を他の既存の監視対象２の情報を利用せず、所定の初期値を設定して生成する。

図７は、障害予兆検出装置１の一実施例における障害予兆の検出処理フローを示す図である。

障害予兆検出装置１の監視結果取得部１１が、一定時間毎に、監視対象２のコンピュータシステムの各監視対象システムを実行する監視対象機器から、施設、監視対象機器、監視日時、監視項目と監視結果を含む監視結果データを取得し管理結果ログテーブル２１を更新する（ステップＳ１）。

監視結果比較部１２が、追加された監視結果ログデータに対応する監視閾値（閾値ｔｈ１、閾値ｔｈ２）を監視閾値テーブル２２から取得し（ステップＳ２）、監視結果ログデータの監視結果が監視閾値を超過しているかを判定する（ステップＳ３）。

監視結果が、監視閾値を超過していない場合に（ステップＳ３のＮ）、正常稼働情報比較部１３が、監視閾値を超過しなかった監視結果ログデータに対応する正常稼働情報の許容範囲を正常稼働情報テーブル２３から取得し（ステップＳ４）、監視結果が取得した正常稼働情報の許容範囲（上限値または下限値）を超過しているかを判定する（ステップＳ５）。

監視結果が取得された許容範囲（上限値および下限値）を超過していない場合は（ステップＳ５のＮ）、正常稼働情報算出部１４は、監視結果ログデータに、その監視日時に対応する条件および監視時間を設定し、同じ正常稼働情報の許容範囲（上限値および下限値）を設定した正常稼働情報を算出し（ステップＳ６）、算出した正常稼働情報で正常稼働情報テーブル２３を更新する（ステップＳ７）。

ステップＳ３の処理で、監視結果データの監視結果が監視閾値（閾値ｔｈ１または閾値ｔｈ２）のいずれかを超過しているか（ステップＳ３のＹ）、もしくは、ステップＳ５の処理で、監視結果が許容範囲（上限値または下限値）のいずれかを超過していれば（ステップＳ５のＹ）、予兆検知通知部１５は、出力された異常検知または障害予兆検知を含む異常情報を所定の通知先へ通知する（ステップＳ８）。

図８は、障害予兆検出装置１が取得する監視結果と許容範囲との関係例を示す図である。

図８に示すグラフは、障害予兆検出装置１が、病院に設置された監視対象のある１日（０時〜２４時）に取得した監視結果ログデータの「ＣＰＵ使用率」の監視結果（ｎ％）の時間的変化と許容範囲との関係を表している。グラフの横軸は時間経過を、縦軸は「ＣＰＵ使用率（％）」を示している。

図８のグラフに示すように、１２時辺り（昼休み時間に該当）のシステムの稼働率がその前後の時間帯に比べて低く、監視対象２から得る監視結果（ＣＰＵ使用率）もこのような状況を反映する。したがって、この監視対象２では、午前１２時辺りの許容範囲の閾値もその前後の時間帯に比べて低く設定しなければ、障害予兆を正確に検知することができない。

障害予兆検出装置１では、日時に基づく条件区分および監視時間で区分した正常稼働情報、すなわち正常時の稼働状況を示す計測値をもとに対応する許容範囲を決定している。したがって、障害予兆検出装置１では、図８に示すように、ある１日の単位では、監視対象２の正常な稼働状況の時間に応じた変動が許容範囲の設定に反映される。図８に示すグラフを、特定の曜日や日にちの１日の時間帯毎の変動を示すグラフとしても、また、横軸をある月単位や週単位における日毎の変動を示すグラフとしても、同様に、障害予兆検出装置１は、監視対象２の正常な稼働状況に応じた許容範囲を設定することができる。

図９は、障害予兆検出装置１の一実施例における閾値設定処理フローを示す図である。

障害予兆検出装置１の稼働システム比較部１６は、稼働システムテーブル２４から監視対象２の稼働システムを示す情報（稼働システム情報）を取得し（ステップＳ１１）、新しく監視対象２とするコンピュータシステムの稼働システムの構成が、取得した既存の監視対象２の稼働システム情報（稼働システムの構成）と高い割合で一致するかを判定する（ステップＳ１２）。

新規の監視対象２の稼働システムの構成が取得した既存の監視対象２の稼働システム情報と高い割合で一致すると判定された場合に（ステップＳ１２のＹ）、閾値設定部１７は、取得した既存の監視対象２の各稼働システムに対応する監視対象機器の監視閾値と正常稼働情報を監視閾値テーブル２２および正常稼働情報テーブル２３からそれぞれ取得し（ステップＳ１３）、取得した監視閾値および正常稼働情報をもとに新規の監視対象２の稼働システムに対する監視閾値データと正常稼働情報を生成して監視閾値テーブル２２および正常稼働情報テーブル２３を更新する（ステップＳ１４）。

新規の監視対象２の稼働システムの構成が取得した既存の監視対象２の稼働システム情報と高い割合で一致すると判定されなければ（ステップＳ１２のＮ）、そのまま処理を終了する。

以上説明したように、開示した障害予兆検出装置１は、監視対象構成する稼働システム毎に日時により変化する稼働状況に応じた許容範囲を設定することができる。

また、障害予兆検出装置１は、異常状態が生じることなく運用されている監視対象２に対しても、正常時の稼働状況のみをもとに稼働状況に応じた許容範囲を設定することができる。

よって、障害予兆検出装置１によれば、監視対象の稼働状況に対応した閾値をもとに監視結果が正常とみなせる許容範囲であるかの判断を行えるため、より精度の高い障害予兆検知を実現することができる。

以上説明した障害予兆検出装置１は、構成する要素が任意の組合せで実現されてもよい。複数の構成要素が１つの部材として実現されてもよく、１つの構成要素が複数の部材から構成されてもよい。また、障害予兆検出装置１は、上述した実施形態に限定されず、本発明の要旨を逸脱しない範囲において各種の改良および変更を行ってもよいことは当然である。

１障害予兆検出装置
１１監視結果取得部
１２監視結果比較部
１３正常稼働情報比較部
１４正常稼働情報算出部
１５予兆検知通知部
１６稼働システム比較部
１７閾値設定部
２１監視結果ログテーブル
２２監視閾値テーブル
２３正常稼働情報テーブル
２４稼働システムテーブル
２監視対象
２Ａ〜２Ｃ監視対象システム

Claims

監視対象システムについて異常が検出されなかった期間における該監視対象システムの監視データを曜日、時間帯、日にち、または、週数毎に分類して記憶部に記憶し、
前記記憶部に記憶された監視データの曜日、時間帯、日にち、または、週数毎の分布をもとに許容範囲を設定し、
前記監視対象システムから現在取得した監視データと、該現在の日時が属する曜日、時間帯、日にち、または、週数の監視データの分布にもとづく許容範囲とを比較し、該取得した監視データが該許容範囲の上限または下限を超える場合に前記監視対象システムの障害予兆を検出する、
処理をコンピュータが実行することを特徴とする障害予兆検出方法。
前記監視対象システムの構成を前記記憶部に記憶し、
新たに監視対象とするシステムの構成が前記監視対象システムの構成と高い割合で一致する場合に、前記記憶部に記憶された前記監視対象システムの監視データの曜日、時間帯、日にち、または、週数毎の分布にもとづく許容範囲を、該新たに監視対象とするシステムの許容範囲として使用する、
ことを特徴とする請求項１に記載の障害予兆検出方法。
監視対象システムについて異常が検出されなかった期間における該監視対象システムの監視データを曜日、時間帯、日にち、または、週数毎に分類して記憶部に記憶し、
前記記憶部に記憶された監視データの曜日、時間帯、日にち、または、週数毎の分布をもとに許容範囲を設定し、
前記監視対象システムから現在取得した監視データと、該現在の日時が属する曜日、時間帯、日にち、または、週数の監視データの分布にもとづく許容範囲とを比較し、該監視データが該許容範囲の上限または下限を超える場合に前記監視対象システムの障害予兆を検出する、
処理をコンピュータに実行させることを特徴とする障害予兆検出プログラム。
監視対象システムについて異常が検出されなかった期間における該監視対象システムの監視データを曜日、時間帯、日にち、または、週数毎に分類して記憶する記憶部と、
前記記憶部に記憶された監視データの曜日、時間帯、日にち、または、週数毎の分布をもとに許容範囲を設定する正常稼働情報算出部と、
前記監視対象システムから現在取得した監視データと、該現在の日時が属する曜日、時間帯、日にち、または、週数の監視データの分布にもとづく許容範囲とを比較し、該現在取得した監視データが該許容範囲の上限または下限を超える場合に前記監視対象システムの障害予兆を検出する正常稼働情報比較部と、
を備えることを特徴とする障害予兆検出装置。