JP2014153852A - 閾値超過率を管理する情報処理装置、閾値超過率管理方法、及びそのためのプログラム - Google Patents

閾値超過率を管理する情報処理装置、閾値超過率管理方法、及びそのためのプログラム Download PDF

Info

Publication number
JP2014153852A
JP2014153852A JP2013022121A JP2013022121A JP2014153852A JP 2014153852 A JP2014153852 A JP 2014153852A JP 2013022121 A JP2013022121 A JP 2013022121A JP 2013022121 A JP2013022121 A JP 2013022121A JP 2014153852 A JP2014153852 A JP 2014153852A
Authority
JP
Japan
Prior art keywords
excess rate
threshold
threshold excess
resource usage
calculated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013022121A
Other languages
English (en)
Inventor
Ikudai Ajiro
育大 網代
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2013022121A priority Critical patent/JP2014153852A/ja
Publication of JP2014153852A publication Critical patent/JP2014153852A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

【課題】 リソース使用量の閾値に対する超過率を管理することが難しい場合がある。
【解決手段】 閾値超過率管理装置が、被管理装置の単位時間毎のリソース使用量の履歴に基づいてその被管理装置の特定期間毎の閾値超過率観測値を算出し、その履歴に基づいて算出したその被管理装置毎のかつその特定期間毎のリソース使用量の平均と散乱度とに基づいて、そのリソース使用量の分布が正規分布であると仮定した場合の、閾値超過率推定値を算出し、その閾値超過率観測値とその閾値超過率推定値との関係についての回帰分析を実行した結果に基づいて回帰式のパラメタを算出し、出力する。
【選択図】 図1

Description

本発明は、コンピュータやサーバのリソース使用量を管理するための技術に関し、特に、リソース使用量の閾値に対する超過率を管理する情報処理装置、閾値超過率管理方法、及びそのためのプログラムに関する。
リソース使用量を管理するための、さまざまな関連技術が知られている。
例えば、特許文献1は、情報処理システムの運用管理装置を開示する。その運用管理装置は、情報処理装置群の作業負荷の履歴を保存するデータベースと、その履歴から作業負荷の指標値を計算する手段と、その指標値を閾値の範囲に収めつつ、電力効率の高い情報処理装置を優先して作業負荷を割り当てる手段とを備える。ここで、その指標値は、その履歴に基づいて算出される、作業負荷の代表値(例えば、平均値)とその作業負荷の散布度(例えば、標準偏差)の所定倍との和である。
作業負荷が正規分布に近いという前提の下においては、その作業負荷がその代表値とその散布度の所定倍との和の範囲に収まる確率を計算することができる。これにより、情報処理装置群のシステム処理性能を的確に確保した上で、その情報処理装置群の総電力消費を削減することが可能となる。
また、サーバ等の情報処理装置を運用する際には、CPU(Central Processing Unit)使用率に代表されるサーバリソースの使用量をサンプリング等によって計測し、その平均値がある所定の閾値を超えないように管理するのが一般的である。尚、サーバリソースの使用量は、作業負荷に線形に対応するものと考えられる。
再特WO2010/050249号公報
しかしながら、上述した特許文献1に記載された技術においては、リソース使用量の閾値に対する超過率を管理することが難しい場合があるという問題点がある。
その推定が難しい理由は、特許文献1に記載された技術は、作業負荷が正規分布に近いという前提が成り立たない場合においては、その作業負荷がその代表値とその散布度の所定倍との和の範囲に収まる正確な確率を計算することができないからである。換言すると、その技術は、サーバの実際のリソース使用量が正規分布に従わない場合に、リソース使用量の閾値に対する超過率を、適切に算出(推定)できないからである。
本発明の目的は、上述した問題点を解決する情報処理装置、閾値超過率管理方法、及びそのためのプログラムを提供することにある。
本発明の情報処理装置は、被管理装置の単位時間毎のリソース使用量の履歴に基づいて、前記被管理装置の特定期間毎の、前記リソース使用量が閾値を超過した時間の割合を示す、閾値超過率観測値を算出する閾値超過率観測値算出部と、
前記履歴に基づいて、前記被管理装置毎のかつ前記特定期間毎の前記リソース使用量の平均と散乱度とを算出し、前記算出した平均と前記算出した散乱度とに基づいて、前記リソース使用量の分布が正規分布であると仮定した場合の、前記リソース使用量が前記閾値を超過すると推定される時間の割合を示す、閾値超過率推定値を算出する閾値超過率推定値算出部と、
前記閾値超過率観測値と前記閾値超過率推定値との関係についての回帰分析を実行した結果に基づいて回帰式のパラメタを算出し、出力する回帰分析部と、を含む。
本発明の閾値超過率管理方法は、コンピュータが、
被管理装置の単位時間毎のリソース使用量の履歴に基づいて、前記被管理装置の特定期間毎の、前記リソース使用量が閾値を超過した時間の割合を示す、閾値超過率観測値を算出し、
前記履歴に基づいて、前記被管理装置毎のかつ前記特定期間毎の前記リソース使用量の平均と散乱度とを算出し、前記算出した平均と前記算出した散乱度とに基づいて、前記リソース使用量の分布が正規分布であると仮定した場合の、前記リソース使用量が前記閾値を超過すると推定される時間の割合を示す、閾値超過率推定値を算出し、
前記閾値超過率観測値と前記閾値超過率推定値との関係についての回帰分析を実行した結果に基づいて回帰式のパラメタを算出し、出力する。
本発明のプログラムは、被管理装置の単位時間毎のリソース使用量の履歴に基づいて、前記被管理装置の特定期間毎の、前記リソース使用量が閾値を超過した時間の割合を示す、閾値超過率観測値を算出し、
前記履歴に基づいて、前記被管理装置毎のかつ前記特定期間毎の前記リソース使用量の平均と散乱度とを算出し、前記算出した平均と前記算出した散乱度とに基づいて、前記リソース使用量の分布が正規分布であると仮定した場合の、前記リソース使用量が前記閾値を超過すると推定される時間の割合を示す、閾値超過率推定値を算出し、
前記閾値超過率観測値と前記閾値超過率推定値との関係についての回帰分析を実行した結果に基づいて回帰式のパラメタを算出し、出力する処理をコンピュータに実行させる。
本発明は、仮想化サーバのリソース使用量が正規分布に従わない場合であっても、閾値の超過率を管理することを可能にするという効果がある。
図1は、第1の実施形態に係る閾値超過率管理装置の構成を示すブロック図である。 図2は、第1の実施形態に係る閾値超過率管理装置を実現するコンピュータのハードウェア構成を示すブロック図である。 図3は、第1の実施形態におけるリソース使用量履歴の一例を示す図である。 図4は、特定期間毎の平均CPU使用率と閾値超過率観測値との関係の一例を示す散布図である。 図5は、特定期間毎のCPU使用率の平均と分散との関係の一例を示す散布図である。 図6は、閾値超過率推定値と閾値超過率観測値との対応及び回帰分析結果の一例を示す図である。 図7は、仮想マシンから採取したCPU使用率の頻度分布の一例である。 図8は、仮想化サーバから採取したCPU使用率の頻度分布の一例である。 図9は、第1の実施形態における閾値超過率管理装置の動作を示すフローチャートである。 図10は、第2の実施形態に係る閾値超過率管理装置の構成を示すブロック図である。 図11は、第2の実施形態における閾値超過率管理装置の動作を示すフローチャートである。 図12は、第3の実施形態に係る閾値超過率管理装置の構成を示すブロック図である。 図13は、出力部が出力するグラフの一例を示す図である。 図14は、出力部が出力するグラフの一例を示す図である。 図15は、出力部が出力するグラフの一例を示す図である。 図16は、第3の実施形態における閾値超過率管理装置の動作を示すフローチャートである。
本発明を実施するための形態について図面を参照して詳細に説明する。尚、各図面及び明細書記載の各実施形態において、同様の構成要素には同様の符号を付与し、適宜説明を省略する。
[第1の実施形態]
図1は、本発明の第1の実施形態に係る閾値超過率管理装置(情報処理装置とも呼ばれる)100の構成を示すブロック図である。
図1を参照すると、本実施形態に係る閾値超過率管理装置100は、閾値超過率観測値算出部110と、閾値超過率推定値算出部120と、回帰分析部130とを含む。尚、図1に示す構成要素は、ハードウェア単位の構成要素でも、コンピュータ装置の機能単位に分割した構成要素でもよい。即ち、閾値超過率管理装置100は、コンピュータであってよい。ここでは、図1に示す構成要素は、コンピュータの機能単位に分割した構成要素とする。
次に、閾値超過率管理装置100を実現するコンピュータについて説明する。
図2は、本実施形態における閾値超過率管理装置100を実現するコンピュータ700のハードウェア構成を示す図である。
図2に示すように、コンピュータ700は、CPU(Central Processing Unit)701、記憶部702、記憶装置703、入力部704、出力部705及び通信部706を含む。更に、コンピュータ700は、外部から供給される記録媒体(または記憶媒体)707を含む。記録媒体707は、情報を非一時的に記憶する不揮発性記録媒体であってもよい。
CPU701は、オペレーティングシステム(不図示)を動作させて、コンピュータ700の、全体の動作を制御する。また、CPU701は、例えば記憶装置703に装着された記録媒体707から、プログラムやデータを読み込み、読み込んだプログラムやデータを記憶部702に書き込む。例えばそのプログラムは、例えば、後述の図9に示すフローチャートの動作をコンピュータ700に実行させるプログラムである。
そして、CPU701は、読み込んだプログラムに従って、また読み込んだデータに基づいて、図1に示す閾値超過率観測値算出部110、閾値超過率推定値算出部120及び回帰分析部130として各種の処理を実行する。
尚、CPU701は、通信網(不図示)に接続されている外部コンピュータ(不図示)から、通信部706を経由して、記憶部702にプログラムやデータをダウンロードするようにしてもよい。
記憶部702は、プログラムやデータ(例えば、後述するリソース使用量履歴203及び正規分布関数)を記憶する。
記憶装置703は、例えば、光ディスク、フレキシブルディスク、磁気光ディスク、外付けハードディスク及び半導体メモリであって、記録媒体707を含む。記憶装置703(記録媒体707)は、プログラムをコンピュータ読み取り可能に記憶する。また、記憶装置703は、データ(例えば、後述するリソース使用量履歴203及び正規分布関数)を記憶してもよい。
入力部704は、例えばマウスやキーボード、内蔵のキーボタンなど及びそれらの制御手段で実現され、入力操作に用いられる。入力部704は、マウスやキーボード、内蔵のキーボタンに限らず、例えばタッチパネル及びその制御手段などでもよい。入力部704は、閾値超過率観測値算出部110及び閾値超過率推定値算出部120の一部として含まれてよい。
出力部705は、例えばディスプレイとその制御手段で実現され、出力を確認するために用いられる。出力部705は、回帰分析部130の一部として含まれてよい。
通信部706は、図示しない外部装置とのインタフェースを実現する。通信部706は、閾値超過率観測値算出部110、閾値超過率推定値算出部120及び回帰分析部130のそれぞれの一部として含まれてよい。
以上説明したように、図1に示す閾値超過率管理装置100の機能単位のブロックは、図2に示すハードウェア構成のコンピュータ700によって実現される。但し、コンピュータ700が備える各部の実現手段は、上記に限定されない。すなわち、コンピュータ700は、物理的に結合した1つの装置により実現されてもよいし、物理的に分離した2つ以上の装置を有線または無線で接続し、これら複数の装置により実現されてもよい。
尚、上述のプログラムのコードを記録した記録媒体707が、コンピュータ700に供給され、CPU701は、記録媒体707に格納されたプログラムのコードを読み出して実行するようにしてもよい。或いは、CPU701は、記録媒体707に格納されたプログラムのコードを、記憶部702、記憶装置703またはその両方に格納するようにしてもよい。すなわち、本実施形態は、コンピュータ700(CPU701)が実行するプログラム(ソフトウェア)を、一時的にまたは非一時的に、記憶する記録媒体707の実施形態を含む。
以上が、本実施形態における閾値超過率管理装置100を実現するコンピュータ700の、ハードウェアについての説明である。
次に、図1に戻って、閾値超過率管理装置100が備える各構成要素について詳細に説明する。
===閾値超過率観測値算出部110===
閾値超過率観測値算出部110は、被管理装置の単位時間毎のリソース使用量の履歴に基づいて、その被管理装置の特定期間毎の、そのリソース使用量が閾値を超過した時間の割合を示す、閾値超過率観測値を算出する。
ここで、その被管理装置は、例えば、仮想化サーバである。その仮想化サーバは、複数の仮想マシンが動作する、物理的なサーバである。以後、その被管理装置は、仮想化サーバであるものとして説明する。
その単位時間毎のリソース使用量の履歴は、例えば1週間程度から1ヶ月以上までの比較的長期に渡って、1台または複数台の仮想化サーバから採取された、その単位時間毎のリソース使用量の時系列データである。その単位時間、即ち時系列データの採取間隔は、例えば、数秒から数分程度である。そのリソース使用量は、CPU使用率やディスクビジー率、ディスクやネットワークのその単位時間あたりのデータ転送量などといった、物理リソースの使用量である。
図3は、その単位時間毎のリソース使用量の履歴である、リソース使用量履歴203の一例を示す図である。図3に示すように、リソース使用量履歴203は、サーバ識別子、利益採取時刻及びCPU使用率[%]から成る複数のレコード(リソース使用量)を含む。
尚、仮想化サーバが複数ある場合、それらの上で動作するアプリケーションやサービスは同種のものとする。
例えば、閾値超過率管理装置100は、図2に示す記憶部702或いは記憶装置703に、予め記憶されたリソース使用量履歴203を使用する。また、閾値超過率管理装置100は、図2に示す記録媒体707に格納されたリソース使用量履歴203を読み出して、使用するようにしてもよい。また、閾値超過率管理装置100は、図2に示す通信部706を介して、図示しない外部装置からリソース使用量履歴203を取得し、使用するようにしてもよい。また、閾値超過率管理装置100は、図2に示す入力部704を介して、オペレータの入力したリソース使用量履歴203を取得し、利用するようにしてもよい。
その特定期間は、例えば、1日や、1日のうちの営業時間帯(9時から17時)等である。
その閾値は、リソース使用量がCPU使用率である場合、例えば、「90%」である。その閾値は任意の値であってよいが、リソース使用量としてCPU使用率を用いる場合、その閾値は50%から90%の間が適当である場合が多い。尚、そのリソース使用量及びその閾値は、仮想化サーバ上で仮想的に動作する仮想マシンに対応するものではなく、その仮想化サーバのリソース使用量及び閾値である。
例えば、閾値超過率管理装置100は、図2に示す入力部704を介して、オペレータの入力した閾値を取得し、利用する。また、閾値超過率管理装置100は、図2に示す記憶部702或いは記憶装置703に、予め記憶された閾値を利用するようにしてもよい。また、閾値超過率管理装置100は、図2に示す記録媒体707に格納された閾値を読み出して、利用するようにしてもよい。また、閾値超過率管理装置100は、図2に示す通信部706を介して、図示しない外部装置から閾値を取得し、利用するようにしてもよい。
また、閾値超過率観測値は、その特定期間に採取されたリソース使用量のうち、その閾値を超えているCPU使用率を含むリソース使用量の割合である。ここで、リソース使用量は、例えば、リソース使用量履歴203の各レコードに含まれるCPU使用率のそれぞれである。例えば、CPU使用率が1分間隔で採取されていて、その特定期間が「9時から17時までの8時間」である場合、ある1台の仮想サーバについて、8×60=480個のリソース使用量の履歴が採取される。このうち、CPU使用率がその閾値である「90%」を超えている、履歴の個数が30個であれば、閾値超過率は30/480=0.0625(6.25%)である。
換言すると、閾値超過率観測値は、その仮想サーバのその特定期間毎の、そのリソース使用量が閾値を超過した時間の割合を示す。
閾値超過率観測値算出部110は、例えば「サーバSV001の2013年1月10日の9時から17時までの間のCPU使用率の閾値超過率(閾値超過率観測値)」を「0.0575」のように算出する。このようにして、閾値超過率観測値算出部110は、サーバ識別子で区別される仮想サーバ毎に、かつ日付で区別される特定期間毎に、複数の閾値超過率観測値を算出する。
図4は、特定期間毎のCPU使用率の平均値(以後、平均CPU使用率とも呼ぶ)と閾値超過率観測値との関係の一例を示す散布図である。図4に示す特定期間毎の平均CPU使用率と閾値超過率観測値とは、実際に稼働する25台のサーバから19日間に渡って実データを採取した実施例の、CPU使用率の時系列データに基づいている。
図4において、図中の1つの点は、その内の1台のサーバにおける1つの特定期間(ある日の9時から17時まで)の、時系列データから算出された平均CPU使用率と閾値超過率観測値との対応を表している。この時系列データは、25台のサーバにおける、平日19日分のデータである。従って、平均CPU使用率の点の数は合計25×19=475個である。つまりこの場合、閾値超過率観測値算出部110は、閾値超過率観測値として475個の値を算出する。
上述の実データを採取した実施例において、サーバは全て、仮想マシン型のシンクライアントサービスを提供する仮想化サーバである。また、1サーバあたりの仮想マシンの平均稼働数は、40個である。また、CPU使用率の採取間隔は、15秒である。
図4を参照すると、平均CPU使用率が40%を超えたあたりから、閾値超過率観測値が急激に上昇していることがわかる。また、同じような平均CPU使用率であっても、閾値超過率観測値が高い場合と低い場合があることもわかる。これは、特定期間毎の時系列データの、散乱度(具体的には分散や標準偏差)の違いによるものである。換言すると、比較的近い平均CPU使用率をもつ特定期間毎の時系列データであっても、採取されたCPU使用率が比較的均質な場合と散らばっている場合とがあるためである。
===閾値超過率推定値算出部120===
閾値超過率推定値算出部120は、統計値算出部121と閾値超過率推定部122とを含む。
閾値超過率推定値算出部120の統計値算出部121は、リソース使用量履歴203に基づいて、その仮想化サーバ(被管理装置)それぞれとその特定期間それぞれとの組み合わせ毎の、そのリソース使用量の平均と散乱度とを算出する。
統計値算出部121は、そのリソース使用量の平均と散乱度とを、例えば「サーバSV001の、2013年1月10日の9時から17時までの間について、CPU使用率の平均が55.7%、分散が336」のように算出する。統計値算出部121は、各仮想化サーバと各日付との組み合わせに対応する、上述のような複数の統計値(そのリソース使用量の平均と散乱度)を算出する。ここでは、分散とその正の平方根である標準偏差とを総称して散乱度と呼ぶ。
図5は、図4の場合と同様の実施例における、複数のサーバから採取したCPU使用率の時系列データから、その特定期間毎のCPU使用率の平均と分散との関係の一例を示す散布図である。図5において、図中の1つの点は、その内の1台のサーバにおける1つの特定期間の、時系列データから算出されたCPU使用率の平均と分散との対応を表している。それらの点の個数は図4の場合と同様に、475個である。図5を参照すると、平均CPU使用率の上昇に従って、分散も上昇する点のグループと、分散が比較的上昇しない点のグループとがあることがわかる。これらの図5における分散が上昇しない点のグループは、図4において存在する、平均CPU使用率が高くても閾値超過率観測値が低い点のグループに対応する。
尚、統計値算出部121は、分散に替えて、標準偏差を算出するようにしてもよい。その場合、図5は、分散の代わりに標準偏差を用いてプロットすることもできる。その理由は、データの散乱度(ちらかり具合)を表すという意味では、分散も標準偏差も同じであるからである。
閾値超過率推定値算出部120の閾値超過率推定部122は、統計値算出部121が算出した平均と散乱度とに基づいて、更にリソース使用量の分布が正規分布であると仮定した場合の、閾値超過率推定値を算出する。ここで、閾値超過率推定値は、そのリソース使用量がその閾値を超過すると推定される時間帯の割合を示す値である。
以下に閾値超過率推定値の算出方法を示す。正規分布は平均と分散との2つをパラメタとしてもつ確率分布であり、その累積分布関数は、式(1)で表現される。
Figure 2014153852
ここで、式中の関数「erf」は誤差関数であり、式(2)で定義される。
Figure 2014153852
累積分布関数のF(x)は、その正規分布のデータの値がx以下となる確率pを表している。従って、その閾値をxとしたとき、その正規分布のデータの値がx(閾値)を超える確率q(即ち、閾値超過率推定値)は、q=1−pと表せる。例えば、ある数値のグループが正規分布にしたがっており、それらの数値の平均が「55.7」、分散が「336」の場合、それらの数値のそれぞれが「90」を超える確率は、式(1)を利用して、以下の式(3)のように計算される。
Figure 2014153852
尚、この式(3)に示すような計算は、コンピュータの各種プログラミング言語に用意されたライブラリや、数値解析ソフトウェア、統計処理ソフトウェア等を用いて簡単に行うことができる。計算に必要な関数定義や関数呼び出しのための関数名は、例えば、正規分布関数として図2に示す記憶部702或いは記憶装置703に予め格納される。
閾値超過率推定部122は、上述の式(3)に示す計算と同様の計算により、1台のサーバにおける1つの特定期間の閾値超過率推定値を、算出する。例えば、閾値超過率推定部122は、「サーバSV001の、2013年1月10日の9時から17時までの間の、CPU使用率の閾値超過率(閾値超過率推定値)」を「0.0307」のように算出する。閾値超過率推定部122は、各仮想化サーバと各日付との組み合わせに対応する、上述のような複数の閾値超過率推定値を算出する。
こうして、閾値超過率推定値算出部120は、各仮想化サーバと各日付との組み合わせについて、閾値超過率観測値算出部110が算出した閾値超過率観測値のそれぞれに対応する、閾値超過率推定値を算出する。
===回帰分析部130===
回帰分析部130は、閾値超過率観測値算出部110が算出した閾値超過率観測値と閾値超過率推定値算出部120が算出した閾値超過率推定値との関係についての回帰分析を実行し、その結果として回帰式のパラメタを算出する。回帰分析部130は、閾値超過率観測値を目的変数、閾値超過率推定値を説明変数として、回帰分析を行う。
図6は、図4及び図5の場合と同様の実施例における、閾値超過率推定値と閾値超過率観測値との対応及び回帰分析結果の一例を示す図である。図6において、図中の1つの点は、その内の1台のサーバにおける1つの特定期間の、閾値超過率推定値と閾値超過率観測値との対応を表している。それらの点の個数は図4及び図5の場合と同様に、475個である。
閾値超過率推定値をq、閾値超過率観測値をrとしたとき、r=qであれば、サーバのCPU使用率の分布は正規分布であると見做せる。
しかし、上述の実データに基づいて算出した閾値超過率推定値と閾値超過率観測値とについて、実データを用いて回帰分析(線形回帰)を実行した結果、回帰式はr=2.37q+0.0102となった。そして、その場合の相関係数は0.969であり、算出した回帰式にデータが極めてよくフィットしていた。
即ち、仮想化サーバにおけるCPU使用率の分布は正規分布ではないが、正規分布を仮定して推定した閾値超過率推定値qと実際の超過率である閾値超過率観測値rとは、線形の関係にあると推察できる。この推察に基づいて、閾値超過率推定値qと閾値超過率観測値rが、以下の式(4)の関係にあると見做すことができる。
Figure 2014153852
尚、累積分布関数の計算同様、このような回帰分析も各種プログラミング言語に用意されたライブラリや、数値解析ソフトウェア、統計処理ソフトウェア等を用いて行うことができる。
回帰分析部130は、回帰分析の結果である回帰式(4)を、出力する。前述の例では、r=2.37q+0.0102が出力される。尚、出力部250は、パラメタであるa、bの値だけを出力するようにしてもよい。また、出力部250は、回帰式とともに、図6に示す散布図や回帰直線を一緒に出力するようにしてもよい。
ここで、回帰分析の結果について補足する。一般のサーバのリソース使用量が正規分布に従う保証はどこにもないが、比較的多数の仮想マシンを収容した仮想化サーバの場合は、正規分布に近い分布となる可能性が高い。これは、確率統計の分野で知られる中心極限定理によるものである。
中心極限定理は、(正規分布以外の)任意の分布に従う複数の値から成るデータに対して、多数のデータを結合すると、その結合したデータの値の分布は正規分布に従うことを保証する定理である。仮想化サーバの場合、仮想化サーバのCPU使用率は、その上で動作する仮想マシンのCPU使用率の和に仮想化のオーバヘッドを加えたものである。従って、各仮想マシンの分布が類似しており、仮想化オーバヘッドが小さければ、収容する仮想マシンの数が多くなるほど、仮想化サーバのCPU使用率は正規分布に近づくことになる。
図7は、シンクライアントサービスにおける、ある仮想マシンから採取したCPU使用率の頻度分布を調べた結果の一例を示す図である。図8は、その仮想マシンを収容する仮想化サーバから採取したCPU使用率の頻度分布を調べた結果の一例を示す図である。
図7の仮想マシンに関する頻度分布は正規分布とはまったく異なる。
一方、図8の仮想化サーバに関する頻度分布は比較的正規分布に近いように見える。しかしながら、よくみると左右対称でないほか、シャピロ・ウィルク検定やコルモゴロフ・スミルノフ検定といった正規分布との適合度検定を行うと、ごく少数のサーバを除いて、適合しているという結果は得られない。この原因としては、仮想化オーバヘッドの存在や、CPU使用率の値の範囲が0から100%までに限定されている、その他未だ明らかではない理由が考えられる。
以上が、回帰分析の結果についての補足である。
本実施形態は、上記で説明した「実際に稼働する25台のサーバから19日間に渡って実データを採取した実施例」から得られた、閾値超過率推定値と閾値超過率観測値とが図6に示すような線形の関係にあるという知見に基づいてなされている。
以上が、閾値超過率管理装置100の機能単位の各構成要素についての説明である。
次に本実施形態の動作について、図1〜図9を参照して詳細に説明する。
図9は、本実施形態の動作を示すフローチャートである。尚、このフローチャートによる処理は、前述したCPU701によるプログラム制御に基づいて、実行されても良い。また、処理のステップ名については、S601のように、記号で記載する。
閾値超過率観測値算出部110は、リソース使用量の履歴に基づいて、各サーバの特定期間毎の閾値超過率観測値を算出する(ステップS02)。
次に、閾値超過率推定値算出部120の統計値算出部121は、そのリソース使用量の履歴に基づいて、その仮想化サーバそれぞれとその特定期間それぞれとの組み合わせ毎のリソース使用量の平均と散乱度とを算出する(ステップS03)。
次に、閾値超過率推定値算出部120の閾値超過率推定部122は、統計値算出部121によって算出された平均と散乱度から、リソース使用量の分布が正規分布であると仮定して、閾値超過率推定値を算出する(ステップS04)。
次に、回帰分析部130は、閾値超過率観測値と閾値超過率推定値との関係についての回帰分析を実行し、その結果を出力する(ステップS05)。
以上に説明したように、本実施形態の閾値超過率管理装置100は、リソース使用率の閾値超過率観測値を、リソース使用量の時系列データの平均と散乱度とから算出する際に有用な回帰式の情報を出力する。利用者は、その回帰式の情報を利用することにより、実際の閾値超過率を一定以下に抑えるために、そのリソース使用量の平均と散乱度とをどの程度に抑えたらよいかを見積もることが可能となる。換言すると、利用者は、まずリソース使用量の平均及び分散に基づいて閾値超過率推定値を算出する。そして、利用者は、この算出した閾値超過率推定値に基づいて、その回帰式を利用して将来の運用時の閾値超過率を予測することができる。その将来の運用時の閾値超過率は、その閾値超過率推定値に対応する閾値超過率観測値の予測値(以後、閾値超過率予測値と呼ぶ)である。
仮想化サーバの場合、リソース使用量の平均や散乱度は、その上で動作する仮想マシンのリソース使用量の平均や散乱度に強く依存する。各仮想マシンのリソース使用量がそれぞれ独立に変動する場合、平均や分散の性質から、仮想化サーバの平均や分散は、それぞれ仮想マシンの平均の和や、分散の和に近い値となる。そのため、閾値超過率予測値(閾値超過率観測値)の算出式(回帰式)は、仮想マシンを仮想化サーバに割り当てる際の判断基準として有用である。
上述した本実施形態における効果は、仮想化サーバのリソース使用量が正規分布に従わない場合であっても、閾値の超過率を管理することを可能にする点である。
その理由は、以下の構成を含む閾値超過率管理装置100が、閾値超過率予測値の算出式(閾値超過率観測値と閾値超過率推定値との関係を示す回帰式)を出力するようにしたからである。第1に、閾値超過率観測値算出部110が閾値超過率観測値を算出する。第2に、閾値超過率推定値算出部120が閾値超過率推定値を算出する。第3に、回帰分析部130が、閾値超過率観測値と閾値超過率推定値との関係についての回帰分析を実行し、その結果を出力する
[第2の実施形態]
次に、本発明の第2の実施形態について図面を参照して詳細に説明する。以下、本実施形態の説明が不明確にならない範囲で、前述の説明と重複する内容については説明を省略する。
図10は、本発明の第2の実施形態に係る閾値超過率管理装置200の構成を示すブロック図である。
図10に示すように、閾値超過率管理装置200は、処理装置201と記憶装置202と入力装置205と出力装置206とを含む。閾値超過率管理装置200は、例えば、図2に示すコンピュータ700である。また、閾値超過率管理装置200は、ハードウェア及びソフトウェアで実現される専用装置であってもよい。
===処理装置201===
処理装置201は、閾値超過率観測値算出部210、閾値超過率推定値算出部220、回帰分析部230、閾値取得部240及び出力部250を含む。閾値超過率観測値算出部210、閾値超過率推定値算出部220、回帰分析部230、閾値取得部240及び出力部250は、図2に示すCPU701が、例えば図2に示す記録媒体707に格納されたプログラムを実行することにより、実現される。
===閾値超過率観測値算出部210===
閾値超過率観測値算出部210は、記憶装置202から、リソース使用量履歴203を取得する。また、閾値超過率観測値算出部210は、閾値取得部240から、閾値を取得する。
次に、閾値超過率観測値算出部210は、そのリソース使用量履歴203に基づいて、その被管理装置の特定期間毎の、そのリソース使用量がその閾値を超過した時間の割合を示す、閾値超過率観測値を算出する。
===閾値超過率推定値算出部220===
閾値超過率推定値算出部220は、統計値算出部221と閾値超過率推定部222とを含む。
閾値超過率推定値算出部220の統計値算出部221は、記憶装置202から、リソース使用量履歴203を取得する。
次に、統計値算出部221は、そのリソース使用量履歴203に基づいて、その仮想化サーバそれぞれとその特定期間それぞれとの組み合わせ毎の、そのリソース使用量の平均と散乱度とを算出する。
閾値超過率推定値算出部220の閾値超過率推定部222は、閾値取得部240から、閾値を取得する。また、閾値超過率推定部222は、記憶装置202から、正規分布関数204を取得する。ここで、その正規分布関数204は、例えば、式(1)に示す累積分布関数や式(2)に示す誤差関数などの関数定義、及び関数呼び出しのための関数名などの総称である。
次に、閾値超過率推定部222は、統計値算出部221が算出したそのリソース使用量の平均と散乱度とに基づいて、その正規分布関数204を利用して、そのリソース使用量がその閾値を超過すると推定される時間帯の割合を示す、閾値超過率推定値を算出する。
===回帰分析部230===
回帰分析部230は、閾値超過率観測値算出部210が算出した閾値超過率観測値と閾値超過率推定値算出部220が算出した閾値超過率推定値との関係についての回帰分析を実行し、その結果として回帰式のパラメタを算出する。
次に、回帰分析部230は、その回帰分析の結果(例えば、そのパラメタやそのパラメタを含む回帰式など)を、出力部250に出力する。
===閾値取得部240===
閾値取得部240は、入力装置205を介して閾値を取得し、その閾値を閾値超過率観測値算出部210及び閾値超過率推定値算出部220に出力する。
===出力部250===
出力部250は、回帰分析部230からその回帰分析の結果を受け取り、出力装置206へ出力する。
===記憶装置202===
記憶装置202は、リソース使用量履歴203と正規分布関数204とを記憶する。
ここで、正規分布関数204は、上述したように正規分布に関連する累積分布関数等の関数定義や関数呼び出しのための情報などの総称である。
===入力装置205===
入力装置205は、図2に示す入力部704に対応する。
===出力装置206===
出力装置206は、図2に示す出力部705に対応する。
次に本実施形態の動作について、図面を参照して詳細に説明する。
図11は、本実施形態の動作を示すフローチャートである。尚、このフローチャートによる処理は、第1の実施形態と同様、図2に示すCPU701によるプログラム制御に基づいて、実行されても良い。
閾値超過率観測値算出部210は、記憶装置202から、リソース使用量履歴203を取得する(ステップS021)。
次に、閾値取得部240は、入力装置205を介して閾値を取得し、閾値超過率観測値算出部210及び閾値超過率推定部222に出力する(ステップS022)。
次に、閾値超過率観測値算出部210は、リソース使用量履歴203に基づいて、各サーバの特定期間毎の閾値超過率観測値を算出する(ステップS023)。
次に、閾値超過率推定値算出部220の統計値算出部221は、記憶装置202から、リソース使用量履歴203を取得する(ステップS031)。
次に、統計値算出部221は、そのリソース使用量履歴203に基づいて、その仮想化サーバそれぞれとその特定期間それぞれとの組み合わせ毎の、そのリソース使用量の平均と散乱度とを算出する(ステップS032)。
次に、閾値超過率推定部222は、記憶装置202から、正規分布関数204を取得する(ステップS042)。
次に、閾値超過率推定部222は、統計値算出部221によって算出された平均と散乱度とに基づいて、その正規分布関数204を利用して、閾値超過率推定値を算出する(ステップS043)。
次に、回帰分析部230は、閾値超過率観測値算出部210が算出した閾値超過率観測値と閾値超過率推定値算出部220が算出した閾値超過率推定値との関係についての回帰分析を実行し、その結果として回帰式のパラメタを算出する(ステップS051)。
次に、回帰分析部230は、その回帰分析の結果を、出力部250に出力する(ステップS052)。
上述した本実施形態における効果は、第1の実施形態の効果と同様である。
[第3の実施形態]
次に、本発明の第3の実施形態について図面を参照して詳細に説明する。以下、本実施形態の説明が不明確にならない範囲で、前述の説明と重複する内容については説明を省略する。
図12は、本発明の第3の実施形態に係る閾値超過率管理装置300の構成を示すブロック図である。
図12を参照すると、本実施形態における閾値超過率管理装置300は、第2の実施形態の閾値超過率管理装置200と比べて、処理装置201に替えて処理装置301を含む。
===処理装置301===
処理装置301は、図10に示す処理装置201と比べて、基準超過率取得部360、モデル補正部370を更に含み、出力部250に替えて出力部350を含む。
===基準超過率取得部360===
基準超過率取得部360は、入力装置205を介して基準超過率を取得し、その基準超過率をモデル補正部370に出力する。
ここで、基準超過率は、閾値超過率を管理する際の基準となる閾値超過率である。例えば、基準超過率は、実際の運用における閾値超過率の許容値である。また、基準超過率は、「0.05」や「0.10」などのきりのよい数値であってよい。
===モデル補正部370===
モデル補正部370は、回帰分析部230が出力する回帰式を、正規分布の関数定義(例えば、前述の式(1))に代入することでその関数定義を補正する。続けて、モデル補正部370は、その基準超過率を閾値超過率観測値と見做した場合の標準偏差及び分散のうちの任意のものを算出する式を生成し、出力する。尚、モデル補正部370は、基準超過率取得部360を含むようにしてもよい。
例えば、補正の対象となる閾値超過率推定値のモデルは、平均μ、分散σ及び閾値xと、閾値超過率推定値q(q=1−pであることより)との関係を表す式(1)である。
ここで、閾値超過率推定値qと実際の閾値超過率に対応する閾値超過率観測値rとは等価ではなく、前述のように式(4)の関係にあるとする。
モデル補正部370は、以下の第1から第5の手順で、正しい閾値超過率推定値のモデルを生成する。
第1に、モデル補正部370は、式(1)を、閾値xを示す式に変形して式(5)を生成する。
Figure 2014153852
ここでerf−1は、式(2)に示す誤差関数の、逆関数である。
第2に、モデル補正部370は、q=1−pと式(4)とから式(6)を生成する。
Figure 2014153852
第3に、モデル補正部370は、式(5)及び式(6)に基づいて、補正後の閾値超過率推定値のモデルを示す、式(7)を生成する。
Figure 2014153852
第4に、モデル補正部370は、式(7)を、標準偏差σを示す式に変形して式(8)を生成する。標準偏差や分散は以下のように表される。
Figure 2014153852
第5に、モデル補正部370は、式(8)を、分散σを示す式に変形して式(9)を生成する。
Figure 2014153852
ここで、閾値超過率観測値rを基準超過率と見做すと、式(8)は、平均が与えられたときに、閾値超過率予測値(閾値超過率観測値r)が基準超過率と等しくなる標準偏差σの算出式である。同様に、式(9)は、平均が与えられたときに、閾値超過率予測値(閾値超過率観測値r)が基準超過率と等しくなる分散σの算出式である。換言すると、散乱度(標準偏差σ及び分散σ)が式(8)及び式(9)のそれぞれの値を超えると、閾値超過率予測値は基準超過値を上回る。また、散乱度が式(8)及び式(9)の値以下であれば、閾値超過率予測値は基準超過値以下となる。
===出力部350===
出力部350は、モデル補正部370が関数定義を補正して生成した式(式(8)または式(9))の、リソース使用量の平均と散乱度とを軸とするグラフを生成し、出力する。
図13は、図4乃至図6の場合と同様の実施例における、閾値xが90、基準超過率rが0.05の場合の、関数定義が補正されて生成された式のグラフの一例を示す図である。図13中の点線が式(9)によってプロットされる平均と分散との関係である。このグラフは、点線の上方では閾値超過率予測値が基準値を超え、下方では基準値以下となることを意味している。
このグラフから、ある特定期間(例えば、現在)のリソース使用量の平均と分散が与えられたときに、利用者は、その特定期間中や近い将来の閾値超過率予測値が基準と比べて高いか低いかを直感的に把握することができる。
また、出力部350は、その特定期間毎のCPU使用率の平均と散乱度との関係を示す散布図(例えば図5に示す散布図)を、上述のグラフに重ねてプロットし、出力する。
図14は、図5に示すその特定期間毎のCPU使用率の平均と散乱度との関係を、図13に示す式(9)のグラフ上に、重ねてプロットした場合の例を示す図である。換言すると、図14は、特定期間毎のCPU使用率の平均と分散との関係の一例に基準超過率に対応する、関数定義が補正されて生成された式のグラフの一例を重ねた図である。尚、図14には、本実施形態の理解を助けるために、補正前の式(例えば、式(1))に対応する点線も同時に、プロットされている。
補正前の点線では、大多数の点(サーバと一定期間の組)に関して閾値超過率観測値が基準超過率の5%を超えていないように見える。しかし、補正後の点線では相当数の点が5%を超えていることがわかる。図4の散布図からもわかるように、補正後の点線が正しい基準超過率の関係を表している。
また、出力部350は、複数の基準超過率のそれぞれに対応して関数定義が補正されて生成された式の、グラフを生成し、出力する。
図15は、基準超過率を「3%」及び「5%」として、生成した式(9)のグラフを同時にプロットした場合の一例を示す図である。換言すると、図15は、特定期間毎のCPU使用率の平均と分散との関係の一例に複数の基準超過率に対応する、関数定義が補正されて生成された複数の式のグラフを重ねた図である。
尚、出力部350は、図13、図14及び図15を、分散の代わりに標準偏差を用いてプロットするようにしてもよい。
このように、閾値超過率管理装置300は、観測データ(リソース使用量履歴203)から得られた平均と散乱度との関係と、閾値超過率予測値の基準値の境界とを重ねて表示する。こうすることで、閾値超過率管理装置300は、各仮想サーバの各特定期間のリソース使用量が、どの程度基準を満たしているかを直感的に把握することが可能な情報を出力できる。
次に本実施形態の動作について、図面を参照して詳細に説明する。
図16は、本実施形態の動作を示すフローチャートである。尚、このフローチャートによる処理は、第1の実施形態と同様、図2に示すCPU701によるプログラム制御に基づいて、実行されても良い。
尚、図16に示すフローチャートのステップS023〜S052の処理は、図11のステップS023〜S052と同じであるため、詳細な記載を省略する。
閾値超過率観測値算出部210は、記憶装置202から、リソース使用量履歴203を取得する(ステップS021)。
次に、閾値取得部240は、入力装置205を介して閾値を取得し、閾値超過率観測値算出部210、閾値超過率推定部222及びモデル補正部370に出力する(ステップS322)。
次のステップS023〜S052の処理は、図11のステップS023〜S052と同じである。
次に、基準超過率取得部360は、入力装置205を介して基準超過率を取得し、モデル補正部370に出力する(ステップS361)。
次に、モデル補正部370は、関数定義を補正し、その基準超過率を閾値超過率観測値と見做した場合の散乱度(標準偏差、分散)を算出する式を生成し、出力する(ステップS362)。尚、モデル補正部370は、複数の基準超過率のそれぞれに対応する、複数のその式を生成するようにしてもよい。 次に、出力部350は、モデル補正部370が生成した式のグラフを生成し、出力する(ステップS363)。
次に、出力部350は、その特定期間毎のCPU使用率の平均と散乱度との関係を示す散布図を、モデル補正部370が生成した式のグラフに重ねてプロットし、出力する(ステップS364)。
本実施形態の変形例として、処理装置301は、出力部350を含まないようにしてもよい。この場合、閾値超過率管理装置300は、出力部350が出力する図は出力しない。
上述した本実施形態における第1の効果は、第1の実施形態の効果に加えて、より正確に閾値の超過率を管理することを可能にする点である。
その理由は、モデル補正部370が、回帰分析部230が出力する回帰式を、正規分布の関数定義に代入することでその関数定義を補正し、その基準超過率を閾値超過率観測値と見做した場合の散乱度を算出する式を生成し、出力するようにしたからである。
上述した本実施形態における第2の効果は、各仮想サーバの各特定期間のリソース使用量が、どの程度基準を満たしているかを直感的に把握することが可能な情報を出力することを可能にする点である。
その理由は、出力部350が、モデル補正部370の出力に基づいて生成したさまざまなグラフを出力するようにしたからである。
以上の各実施形態で説明した各構成要素は、必ずしも個々に独立した存在である必要はない。例えば、各構成要素は、複数の構成要素が1個のモジュールとして実現されてよい。また、各構成要素は、1つの構成要素が複数のモジュールで実現されてもよい。また、各構成要素は、ある構成要素が他の構成要素の一部であるような構成であってよい。また、各構成要素は、ある構成要素の一部と他の構成要素の一部とが重複するような構成であってもよい。
以上説明した各実施形態における各構成要素及び各構成要素を実現するモジュールは、必要に応じ、可能であれば、ハードウェア的に実現されてよい。また、各構成要素及び各構成要素を実現するモジュールは、コンピュータ及びプログラムで実現されてよい。また、各構成要素及び各構成要素を実現するモジュールは、ハードウェア的なモジュールとコンピュータ及びプログラムとの混在により実現されてもよい。
そのプログラムは、例えば、磁気ディスクや半導体メモリなど、不揮発性のコンピュータ可読記録媒体に記録されて提供され、コンピュータの立ち上げ時などにコンピュータに読み取られる。この読み取られたプログラムは、そのコンピュータの動作を制御することにより、そのコンピュータを前述した各実施形態における構成要素として機能させる。
また、以上説明した各実施形態では、複数の動作をフローチャートの形式で順番に記載してあるが、その記載の順番は複数の動作を実行する順番を限定するものではない。このため、各実施形態を実施するときには、その複数の動作の順番は内容的に支障しない範囲で変更することができる。
更に、以上説明した各実施形態では、複数の動作は個々に相違するタイミングで実行されることに限定されない。例えば、ある動作の実行中に他の動作が発生したり、ある動作と他の動作との実行タイミングが部分的に乃至全部において重複していたりしていてもよい。
更に、以上説明した各実施形態では、ある動作が他の動作の契機になるように記載しているが、その記載はある動作と他の動作との全ての関係を限定するものではない。このため、各実施形態を実施するときには、その複数の動作の関係は内容的に支障のない範囲で変更することができる。また各構成要素の各動作の具体的な記載は、各構成要素の各動作を限定するものではない。このため、各構成要素の具体的な各動作は、各実施形態を実施する上で機能的、性能的、その他の特性に対して支障をきたさない範囲内で変更されて良い。
以上、各実施形態及び実施形態を参照して本発明を説明したが、本発明は上記実施形態及び実施形態に限定されるものではない。本発明の構成や詳細には、本発明のスコープ内で当業者が理解しえるさまざまな変更をすることができる。
本発明は、仮想化サーバなどにおけるリソース使用量等を管理する装置、システム、方法及びプログラムに適用できる。
100 閾値超過率管理装置
110 閾値超過率観測値算出部
120 閾値超過率推定値算出部
121 統計値算出部
122 閾値超過率推定部
130 回帰分析部
200 閾値超過率管理装置
201 処理装置
202 記憶装置
203 リソース使用量履歴
204 正規分布関数
205 入力装置
206 出力装置
210 閾値超過率観測値算出部
220 閾値超過率推定値算出部
221 統計値算出部
222 閾値超過率推定部
230 回帰分析部
240 閾値取得部
250 出力部
300 閾値超過率管理装置
301 処理装置
350 出力部
360 基準超過率取得部
370 モデル補正部
700 コンピュータ
701 CPU
702 記憶部
703 記憶装置
704 入力部
705 出力部
706 通信部
707 記録媒体

Claims (9)

  1. 被管理装置の単位時間毎のリソース使用量の履歴に基づいて、前記被管理装置の特定期間毎の、前記リソース使用量が閾値を超過した時間の割合を示す、閾値超過率観測値を算出する閾値超過率観測値算出部と、
    前記履歴に基づいて、前記被管理装置毎のかつ前記特定期間毎の前記リソース使用量の平均と散乱度とを算出し、前記算出した平均と前記算出した散乱度とに基づいて、前記リソース使用量の分布が正規分布であると仮定した場合の、前記リソース使用量が前記閾値を超過すると推定される時間の割合を示す、閾値超過率推定値を算出する閾値超過率推定値算出部と、
    前記閾値超過率観測値と前記閾値超過率推定値との関係についての回帰分析を実行した結果に基づいて回帰式のパラメタを算出し、出力する回帰分析部と、
    を含む情報処理装置。
  2. 前記回帰式を前記正規分布の関数定義に代入することで前記関数定義を補正し、閾値超過率を管理する際の基準となる基準超過率を前記閾値超過率観測値と見做した場合の前記散乱度を算出する式を生成し、出力するモデル補正部を、更に含む
    ことを特徴とする請求項1記載の情報処理装置。
  3. 前記関数定義が補正されて生成された式の、平均と散乱度とを軸とするグラフを生成し、出力する出力部を、更に含む
    ことを特徴とする請求項2記載の情報処理装置。
  4. 前記出力部は、更に、前記算出された前記被管理装置のそれぞれの前記特定期間毎のリソース使用量の平均と散乱度との関係を、前記グラフ上に重ねてプロットし、出力する
    ことを特徴とする請求項3記載の情報処理装置。
  5. 前記出力部は、複数の前記基準超過率のそれぞれに対応して前記関数定義が補正されて生成された式の、前記グラフを生成し、出力する
    ことを特徴とする請求項3または4記載の情報処理装置。
  6. 前記リソース使用量はCPU使用率である
    ことを特徴とする請求項1乃至5のいずれか1項に記載の情報処理装置。
  7. 前記散乱度は、分散または標準偏差のうちのいずれかである
    ことを特徴とする請求項1乃至6のいずれか1項に記載の情報処理装置。
  8. コンピュータが、
    被管理装置の単位時間毎のリソース使用量の履歴に基づいて、前記被管理装置の特定期間毎の、前記リソース使用量が閾値を超過した時間の割合を示す、閾値超過率観測値を算出し、
    前記履歴に基づいて、前記被管理装置毎のかつ前記特定期間毎の前記リソース使用量の平均と散乱度とを算出し、前記算出した平均と前記算出した散乱度とに基づいて、前記リソース使用量の分布が正規分布であると仮定した場合の、前記リソース使用量が前記閾値を超過すると推定される時間の割合を示す、閾値超過率推定値を算出し、
    前記閾値超過率観測値と前記閾値超過率推定値との関係についての回帰分析を実行した結果に基づいて回帰式のパラメタを算出し、出力する、
    閾値超過率管理方法。
  9. 被管理装置の単位時間毎のリソース使用量の履歴に基づいて、前記被管理装置の特定期間毎の、前記リソース使用量が閾値を超過した時間の割合を示す、閾値超過率観測値を算出し、
    前記履歴に基づいて、前記被管理装置毎のかつ前記特定期間毎の前記リソース使用量の平均と散乱度とを算出し、前記算出した平均と前記算出した散乱度とに基づいて、前記リソース使用量の分布が正規分布であると仮定した場合の、前記リソース使用量が前記閾値を超過すると推定される時間の割合を示す、閾値超過率推定値を算出し、
    前記閾値超過率観測値と前記閾値超過率推定値との関係についての回帰分析を実行した結果に基づいて回帰式のパラメタを算出し、出力する処理をコンピュータに実行させる
    プログラム。
JP2013022121A 2013-02-07 2013-02-07 閾値超過率を管理する情報処理装置、閾値超過率管理方法、及びそのためのプログラム Pending JP2014153852A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013022121A JP2014153852A (ja) 2013-02-07 2013-02-07 閾値超過率を管理する情報処理装置、閾値超過率管理方法、及びそのためのプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013022121A JP2014153852A (ja) 2013-02-07 2013-02-07 閾値超過率を管理する情報処理装置、閾値超過率管理方法、及びそのためのプログラム

Publications (1)

Publication Number Publication Date
JP2014153852A true JP2014153852A (ja) 2014-08-25

Family

ID=51575683

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013022121A Pending JP2014153852A (ja) 2013-02-07 2013-02-07 閾値超過率を管理する情報処理装置、閾値超過率管理方法、及びそのためのプログラム

Country Status (1)

Country Link
JP (1) JP2014153852A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017029785A1 (ja) * 2015-08-19 2017-02-23 日本電気株式会社 仮想計算機システムの性能予測装置、性能予測方法およびプログラム記憶媒体
CN111275466A (zh) * 2018-12-04 2020-06-12 北京京东尚科信息技术有限公司 一种超期单量预警的方法和装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017029785A1 (ja) * 2015-08-19 2017-02-23 日本電気株式会社 仮想計算機システムの性能予測装置、性能予測方法およびプログラム記憶媒体
US10866830B2 (en) 2015-08-19 2020-12-15 Nec Corporation Virtual computer system performance prediction device, performance prediction method, and program storage medium
CN111275466A (zh) * 2018-12-04 2020-06-12 北京京东尚科信息技术有限公司 一种超期单量预警的方法和装置
CN111275466B (zh) * 2018-12-04 2023-12-05 北京京东振世信息技术有限公司 一种超期单量预警的方法和装置

Similar Documents

Publication Publication Date Title
Shahidinejad et al. An elastic controller using Colored Petri Nets in cloud computing environment
US10831633B2 (en) Methods, apparatuses, and systems for workflow run-time prediction in a distributed computing system
US9213503B2 (en) Service provider management of virtual instances corresponding to hardware resources managed by other service providers
Li et al. Performance modeling and predictive scheduling for distributed stream data processing
Zhou et al. Monetary cost optimizations for hosting workflow-as-a-service in IaaS clouds
JP6025753B2 (ja) パフォーマンス・メトリックを監視するためのコンピュータによって実施される方法、コンピュータ可読記憶媒体、およびシステム
Morais et al. Autoflex: Service agnostic auto-scaling framework for iaas deployment models
US10616139B1 (en) Reducing quota access
Lim et al. MRCP-RM: a technique for resource allocation and scheduling of MapReduce jobs with deadlines
US8606905B1 (en) Automated determination of system scalability and scalability constraint factors
Djemame et al. PaaS-IaaS inter-layer adaptation in an energy-aware cloud environment
US11171825B2 (en) Context-based resource allocation with extended user concepts
US10367649B2 (en) Smart scheduling and reporting for teams
JP2019057236A (ja) 情報提供プログラム、情報提供装置および情報提供方法
US20120158925A1 (en) Monitoring a model-based distributed application
US20190347603A1 (en) Optimizing turnaround based on combined critical paths
Ludwig et al. rSLA: Monitoring SLAs in dynamic service environments
JP2018005896A (ja) シミュレーションジョブを実行するためのシステム、コントローラ、方法、及びプログラム
CN112764890A (zh) 调度备份任务的方法、设备和计算机程序产品
Kulshrestha et al. An efficient host overload detection algorithm for cloud data center based on exponential weighted moving average
Cortellessa et al. Managing the evolution of a software architecture at minimal cost under performance and reliability constraints
US9513873B2 (en) Computer-assisted release planning
JP2014153852A (ja) 閾値超過率を管理する情報処理装置、閾値超過率管理方法、及びそのためのプログラム
Bertot et al. Improving cloud simulation using the monte-carlo method
Nguyen et al. Role-based templates for cloud monitoring