JP2009205208A - 運用管理装置、運用管理方法ならびにプログラム - Google Patents

運用管理装置、運用管理方法ならびにプログラム Download PDF

Info

Publication number
JP2009205208A
JP2009205208A JP2008043858A JP2008043858A JP2009205208A JP 2009205208 A JP2009205208 A JP 2009205208A JP 2008043858 A JP2008043858 A JP 2008043858A JP 2008043858 A JP2008043858 A JP 2008043858A JP 2009205208 A JP2009205208 A JP 2009205208A
Authority
JP
Japan
Prior art keywords
information
performance
abnormality
computer
performance information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008043858A
Other languages
English (en)
Other versions
JP4761229B2 (ja
Inventor
Keisuke Yamaguchi
啓介 山口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2008043858A priority Critical patent/JP4761229B2/ja
Publication of JP2009205208A publication Critical patent/JP2009205208A/ja
Application granted granted Critical
Publication of JP4761229B2 publication Critical patent/JP4761229B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

【課題】障害の誤検知などの問題点を解決することができる運用管理装置を提供すること。
【解決手段】性能情報収集部は、ホスト計算機上で仮想的に実現されるゲスト計算機の負荷性能を値で表す情報を収集し、性能情報として出力する。性能異常分析部は、性能情報を受け取って、性能情報が表す値と閾値とを比較し、ゲスト計算機上の負荷に異常があると判定した場合、その旨を表す異常メッセージを出力する。資源情報収集部は、ホスト計算機上でゲスト計算機に割り当てられた資源の数を表す情報を収集し、資源情報として出力する。資源割当分析部は、資源情報と性能情報とを受け取り、自然数と調整倍率とを複数対応付ける調整データを参照して、複数の調整倍率の中から、資源情報が表す数に対応する選択調整倍率を選択し、性能情報が表す値を選択調整倍率に応じて調整し、性能情報として性能異常分析部に出力する。
【選択図】図2

Description

本発明は、仮想計算機(VM;Virtual Machine)を利用する運用管理装置に関する。
仮想計算機(VM)を利用することにより、システムを構成するサーバをソフトウェア的に制御することが可能な運用管理装置が開発されている。従来の運用管理装置では、ハードウェア上の制約を超えて、サーバの作製や複製、稼動場所の移動や動的な処理性能の変更といったことが容易に行えるため、環境変化に追随した柔軟なサービス提供を実現できるものとして期待されている。
しかし、従来の運用管理装置では、VMで構成されたサーバ(ゲスト計算機)の監視エージェントから収集した性能情報のみで障害判定を行う。このため、ホスト計算機上で動的に行われた資源割り当ての変更を把握できず、ゲストの性能異常を正確に検出できなくなる。このことから、障害の誤検知や検知漏れが発生し、運用管理作業の効率が大幅に低下してしまうという問題があった。
ここで、運用管理に関連する技術について紹介する。
特開2006−65430号公報には、仮想計算機性能変更方法が記載されている(特許文献1)。仮想計算機性能変更方法は、仮想計算機の命令実行部分に含まれるダミーサイクルの値を仮想計算機の負荷の変動に応じて変更させることで仮想計算機のCPU性能を動的に変更することを特徴としている。
特開2002−32244号公報には、仮想計算機が記載されている(特許文献2)。仮想計算機は、障害情報の採取手段を有する複数のゲストオペレーティングシステムを制御する仮想計算機制御手段を備えている。仮想計算機は、仮想計算機制御手段が自身の障害によって、ゲストオペレーティングシステムを制御できなくなったとき、仮想計算機制御手段自身が動作中のゲストオペレーティングシステムの動作メモリ領域をロックし、動作メモリ領域のメモリイメージを外部記憶に退避した後、自身をアボートする手段を更に備えることを特徴としている。
特開2005−115751号公報には、車載用電子機器が記載されている(特許文献3)。計算機システムは、第1のOSと、該第1のOS上で動作し通常の業務処理を行うサービスアプリケーションと、第1のOSとは異なる第2のOSと、該第2のOS上で動作する解析予測アプリケーションとを備えている。第1のOSは、自OSの状態情報と動作記録情報とを保持し、解析予測アプリケーションは、第1のOSが保持する情報の内容を解析して障害の兆候を検知することを特徴としている。
特開2006−39763号公報には、ゲストOSデバッグ支援方法が記載されている(特許文献4)。ゲストOSデバッグ支援方法は、仮想計算機マネージャによって提供される仮想計算機実行環境で動作するゲストOSのデバッグを支援するものである。ゲストOSデバッグ支援方法は、第1のゲストOSが動作する第1の仮想計算機実行環境とは異なる第2の仮想計算機実行環境を仮想計算機マネージャが構築するステップと、仮想計算機マネージャが、第1のゲストOSを、当該第1のゲストOSの実行状態及び当該第1のゲストOSが使用するメモリの状態を含めて、第2の仮想計算機実行環境にコピーすることにより、第1のゲストOSのコピーである第2のゲストOSを第2の仮想計算機実行環境に生成するステップと、第2の仮想計算機実行環境に生成された第2のゲストOSを停止状態にして当該第2のゲストOSの状態を保存するステップと、を具備することを特徴としている。
特開2006−344025号公報には、稼動性能データ取得方法が記載されている(特許文献5)。稼動性能データ取得方法は、コンピューティングシステムを用いて、稼動性能データ取得するものである。コンピューティングシステムは、各種のプログラムを実行する複数の計算機と、プログラムを計算機に割り当て、割り当てた計算機にプログラムの実行を要求する業務サーバと、プログラムの実行環境に関連する稼動性能データを計算機から収集し、稼動性能データに基づいて計算機の性能を監視する性能監視サーバとを含んでいる。稼動性能データ取得方法は、業務サーバが、割り当てられた当該プログラムを示す業務情報と、そのプログラムを実行する計算機を識別する計算機識別情報とを含み、当該プログラムの収集命令を生成するステップと、性能監視サーバが、収集命令に含まれる業務情報に対応する収集項目をメモリから読み出して、計算機識別情報を有する計算機に配布するステップと、計算機が、配布された収集項目に関する稼動性能データを収集するステップと、性能監視サーバが、収集項目を配布したことによりその収集項目に関する稼動性能データを収集した計算機から、当該収集項目に関する稼動性能データを取得するステップと、を有することを特徴としている。
特開2006−65430号公報(請求項1) 特開2002−32244号公報(請求項1) 特開2005−115751号公報(請求項1) 特開2006−39763号公報(請求項1) 特開2006−344025号公報(請求項1)
従来の運用管理装置では、次のような問題点が挙げられる。
第1の問題点として、ホスト計算機上で資源割り当てを変更するとゲスト計算機上の負荷の変動幅が変化してしまう性能情報の場合、従来の運用管理装置では、このような資源割り当ての変更によって予期せぬ閾値越え(障害の誤検知)が発生してしまうという問題があった。また、動的に変動幅が変化させられる性能情報に対して適切な監視閾値を設定できないという問題があった。
第2の問題点として、従来の運用管理装置では、ゲスト計算機上の負荷をホスト計算機上で検出するため、ゲスト計算機に割り当てられた資源の利用率は正確に検出できるものの、実際にゲスト計算機上でどう検出されているかがわからないため、ゲスト計算機上のAPなど他の要素との相関分析が正確に行えないという問題があった。
例えば、CPU負荷は、一般的に検出時間間隔の平均値として算出される。ホスト計算機上はすべての処理時間を元に正確に値が検出できるが、ゲスト計算機にCPU資源が割り当てられない状態では、ゲスト計算機上ではカウントする時間情報自体がホスト計算機と異なる(間引かれた時間情報になる)。このため、ゲスト計算機上でAPがインターバル時間に基づく割り込み処理等を行っている場合、ホスト計算機上で検出できる計測できる負荷の異常状態と、ゲスト計算機上で検出可能な負荷に従って処理したAPの処理メッセージを比較しても、正確な障害判定が行えない場合がある。
本発明の課題は、上記の問題点を解決することができる運用管理装置を提供することにある。
本発明の運用管理装置は、性能情報収集部と、性能異常分析部と、資源情報収集部と、資源割当分析部と、を具備している。性能情報収集部は、ホスト計算機上で仮想的に実現されるゲスト計算機の負荷性能を値で表す情報を収集し、性能情報として出力する。性能異常分析部は、性能情報を受け取って、性能情報が表す値と閾値とを比較し、ゲスト計算機上の負荷に異常があると判定した場合、その旨を表す異常メッセージを出力する。資源情報収集部は、ホスト計算機上でゲスト計算機に割り当てられた資源の数を表す情報を収集し、資源情報として出力する。資源割当分析部は、資源情報と性能情報とを受け取り、自然数と調整倍率とを複数対応付ける調整データを参照して、複数の調整倍率の中から、資源情報が表す数に対応する選択調整倍率を選択し、性能情報が表す値を選択調整倍率に応じて調整し、性能情報として性能異常分析部に出力する。
従来の運用管理装置では、このような資源割り当ての変更が把握できないため、障害を誤検知することになる。本発明の運用管理装置では、資源割り当ての変更が把握できるため、このような誤検知が抑制され、正確な障害判定を行うことができる。また、割り当ての変化によらず、一定の閾値で判定することができるため、閾値設定が容易になる。このことから、第1の問題点を解決できる。
また、本発明の運用管理装置では、ゲスト計算機上で検出された性能情報に基づいて調整された情報から異常判定を行うため、ゲスト計算機上で検出可能な状態に従って他の要素の異常状態と適切に相関分析を行うことができる。このことから、第2の問題点を解決できる。
以下に添付図面を参照して、本発明の実施形態による運用管理装置について詳細に説明する。
(第1実施形態)
[構成]
図1は、本発明の実施形態による運用管理装置の構成を説明するための図である。図2は、本発明の実施形態による運用管理装置の構成を示すブロック図である。
図1に示されるように、本発明の実施形態による運用管理装置は、性能情報収集部1、性能異常分析部2、障害分析部3、管理者対話部4を具備している。
性能異常分析部2、障害分析部3、管理者対話部4は、コンピュータである管理マネージャ200に設けられ、そのコンピュータに実行されるコンピュータプログラムである。性能情報収集部1は、コンピュータであるホスト計算機100上で仮想的に実現されるゲスト計算機110に設けられ、そのコンピュータに実行されるコンピュータプログラムである。ゲスト計算機110は、ソフトウェア的に生成されている。
性能情報収集部1は、ゲスト計算機110の負荷性能を値で表す情報を収集し、性能情報として出力する。性能異常分析部2は、性能情報収集部1から性能情報を受け取って、以下に示す異常判定を行う第1機能を有している。性能異常分析部2(第1機能)は、性能情報を受け取って、性能情報が表す値と閾値とを比較し、比較の結果に基づいて、ゲスト計算機110上の負荷に異常があるか否かを分析する。ここで、性能情報が表す値が閾値を超えている場合(閾値超過である場合)、性能異常分析部2は、ゲスト計算機110上の負荷に異常があると判定し、その旨を表す異常メッセージを出力する(異常判定)。障害分析部3は、異常メッセージの発生順序や組み合わせによってシステム全体に障害があるか否かを分析し、システム全体に障害があると判定した場合、その旨を表す障害状態情報を生成する(障害判定)。この場合、障害状態情報を、管理者対話部4を介して管理者に通知する。管理者対話部4は、障害状態情報を管理者に提示するとともに管理者の指示を受け取る。
図2に示されるように、本発明の実施形態による運用管理装置は、は、更に、資源情報収集部5、資源割当分析部6を具備している。資源情報収集部5は、ホスト計算機100に設けられ、コンピュータ(ホスト計算機100)に実行されるコンピュータプログラムである。資源割当分析部6は、管理マネージャ200に設けられ、コンピュータ(管理マネージャ200)に実行されるコンピュータプログラムである。
資源情報収集部5は、ホスト計算機100上でゲスト計算機110に割り当てられた資源の数を表す情報を収集し、資源情報として出力する。資源割当分析部6は、自然数と調整倍率とを複数対応付ける調整データ(図5参照)を保持している。資源割当分析部6は、資源情報と性能情報とを受け取る。このとき、資源割当分析部6は、調整データを参照して、複数の調整倍率の中から、資源情報が表す数に対応する調整倍率(選択調整倍率とする)を選択し、性能情報が表す値を選択調整倍率に応じて調整し、上記の性能情報として性能異常分析部2に出力する。
性能異常分析部2は、第1機能に加えて、資源割当分析部6からの性能情報を受け取って、上述の異常判定を行う第2機能を更に有している。即ち、性能異常分析部2は、資源割当分析部6からの性能情報を受け取ったとき、性能情報が表す値と閾値とを比較する。このとき、性能情報が表す値が閾値超過である場合、ゲスト計算機110に異常があると判定し、その旨を表す異常メッセージを出力する(異常判定)。
性能情報収集部1、性能異常分析部2、障害分析部3、管理者対話部4、資源情報収集部5、資源割当分析部6は、コンピュータ(運用管理装置)に実行されるコンピュータプログラムであってもよい。
[動作]
図2〜図6を参照して、ホスト計算機100上の資源割り当ての変更で、ゲスト計算機110上の負荷が変動する場合の動作について説明する。
図3は、本発明の実施形態による運用管理装置の動作を示すフローチャートである。図4は、資源割当分析部6の動作(調整後の性能情報の生成)を説明するための図である。図5は、上述の調整データを示し、自然数と調整倍率との関係を示している。図6は、図3の障害判定処理を示している。
以下では、性能情報としてゲスト計算機110上のCPU(Central Processing Unit)負荷を用い、資源情報としてホスト計算機100上で実行されるゲスト計算機数{仮想計算機(VM;Virtual Machine)の数}を用いて説明するが、その例に限定されるものではない。
資源割当分析部6は、資源情報収集部5から資源情報として、ホスト計算機100上のVMの数(図4の下段)を受け取る(図3のステップ901)。ホスト計算機100上でVM数が増加すると、各ゲスト計算機110に割り当てられるCPU資源は減少する。例えば、VMの数が2の場合は、ホスト計算機100上での資源を2分の1ずつ割り当て、VMの数が3の場合は、3分の1ずつ割り当てる。例えば、図4では時刻t1から時刻t2の間、VMの数が2から3に増えているため、ゲスト計算機110では、同時刻の間は一定量の資源減少が発生することになる。
また、資源割当分析部6は、性能情報収集部1から性能情報として、ゲスト計算機110上のCPU負荷の値(図4の中段)を受け取る(ステップ902)。ゲスト計算機110では、時刻t1から時刻t2の間、トータルのCPU資源が減少しているため、他の時刻と同様な処理を行うための負荷の%値が増加している。
資源割当分析部6は、このVM数によるトータル資源減少に従って、CPU負荷の値を時刻t1から時刻t2の間だけ一定割合減少させた調整後のCPU負荷(図4の上段)を生成する(ステップ903)。この場合、VM数に応じて調整される性能情報の倍率はホスト計算機100の能力によって異なる。図5に示される調整データは、このような調整倍率の一例であり、例えば、ホスト計算機100のCPUが複数ある場合、一定のVM数までは高い処理能力があるが、それ以上数が増えるに従って急激に低下することになる。ここでは、VM数が2の場合の調整倍率(この場合の選択調整倍率)とVM数が3の場合の調整倍率(この場合の選択調整倍率)の違いを考慮して、調整後のCPU負荷が生成される。
性能異常分析部2は、予め与えられた閾値に従って、CPU負荷が異常かどうかを判定する(ステップ904)。図6を参照すると、障害判定処理904は、例えば、設定された閾値によって異常を判定(ステップ951)し、閾値超過があった場合(ステップ952−YES)には、異常メッセージを生成する(ステップ953)。閾値超過がない場合(ステップ952−NO)には、ステップ953の処理をスキップする。障害分析部3は、例えばAPから直接出力される異常メッセージなど、性能値以外の異常メッセージとの組み合わせを分析して、システム全体の異常を判定する(ステップ954)。
障害分析部3は、システム全体に障害があると判定した場合(ステップ905−YES)、その旨を表す障害状態情報を生成し、管理者対話部4を介して管理者に通知する(ステップ906)。その後、ステップ901の処理に戻る。システム全体に障害がないと判定した場合(ステップ905−NO)、ステップ906の処理をスキップし、ステップ901の処理に戻る。
図7は、本発明の実施形態による運用管理装置の性能異常分析部2の動作(閾値判定)を説明するための図である。
図7に示されるように、例えば、上限となる閾値を設定し、それを超えた場合に過負荷と判定して異常メッセージを生成する。従来の運用管理装置では資源割当によって変動したCPU負荷(図7の下段)を用いて異常判定を行うため、CPU資源が減少した時刻t1から時刻t2の間で閾値越えが発生している。これに対して、本発明の実施形態による運用管理装置では、調整後のCPU負荷(図7の上段)は、割り当て資源量に応じてCPU負荷が調整されており、閾値越えが発生していない。
このようなCPU資源の割り当て変更では、ゲスト計算機110上で実際に行われている処理にはなんら変化が無く、検出された値の尺度が変化したものである。また、この負荷の増加は、ホスト計算機100上での割り当て制御により正常に戻ることになるため、この期間の負荷増加を障害として管理者に提示する必要はないものである。
従来の運用管理装置では、このような資源割り当ての変更が把握できないため、障害を誤検知することになる。本発明の実施形態による運用管理装置では、資源割り当ての変更が把握できるため、このような誤検知が抑制され、正確な障害判定を行うことができる。また、割り当ての変化によらず、一定の閾値で判定することができるため、閾値設定が容易になる。このことから、第1の問題点を解決できる。
また、本発明の実施形態による運用管理装置では、ゲスト計算機110上で検出された性能情報に基づいて調整された情報から異常判定を行うため、ゲスト計算機110上で検出可能な状態に従って他の要素の異常状態と適切に相関分析を行うことができる。このことから、第2の問題点を解決できる。
(第2実施形態)
第2実施形態では、第1実施形態と重複する説明を省略する。
前述の第1及び第2の問題点に続く第3の問題点として、ホスト計算機上で資源割り当てを変更してもゲスト計算機上ではその変更が検知できない性能情報の場合、従来の運用管理装置では、ホスト計算機上の負荷増大等によって、ゲスト計算機に必要となる資源が割り当てられない状態になっても、ゲスト計算機上では性能異常ではないため、障害の検知漏れとなってしまうという問題がある。
上記の問題点と本実施形態とを併せて説明するために、図8、図9を参照して、ホスト計算機100上の資源割り当ての変更で、ゲスト計算機110上の負荷が影響を受けない場合の動作について説明する。
図8は、資源割当分析部6の動作(調整後の性能情報の生成)を説明するための図である。図9は、性能異常分析部2の動作(閾値判定)を説明するための図である。
図8、図9を用いて説明した動作と同様に、資源割当分析部6は、資源情報としてVM数(図8の下段)と、性能情報としてCPU負荷(図8の中段)を受け取り、調整後のCPU負荷(図8の上段)を生成する。この場合、時刻t3から時刻t4の間、VM数が2から4に増加しているが、ゲスト計算機110上のCPU負荷のピーク値には特に変化が見られない。これは、CPU資源の制御にCPUクロック数を用いる場合などであり、ゲスト計算機110上では、与えられたCPU資源のトータルは変化していないように見えるが、CPUが割り当てられる時間が減少していることになる。実際にゲスト計算機110上で行われる処理は、CPU時間が割り当てられていないため遅れているが、ゲスト計算機110上の性能情報収集部1では、そのことを検知することができない。
図9に示されるように、従来の運用管理装置の異常判定(図9の下段)では、負荷のピーク量に変化がみられないため、異常を検出することができない。本発明における調整後のCPU負荷による異常判定(図9の上段)では、時刻t3から時刻t4の間の処理量が低下していることが検知できる。例えば、ピーク負荷の下限閾値を設けることで、資源割り当て不足による処理不良といった障害を管理者に提示することができる。このことから、第3の問題点を解決できる。
即ち、第1実施形態において、性能異常分析部2(第1、2機能)は、性能情報が表す値が、閾値(上限閾値)を超えている場合、ゲスト計算機110上の負荷に異常があると判定し、その旨を表す異常メッセージを出力する第1、2機能を有している。これに対して、第2実施形態において、性能異常分析部2は、性能情報が表す値が、上限閾値よりも低い下限閾値に満たない場合、ゲスト計算機110上の負荷に異常があると判定し、その旨を表す異常メッセージを出力する第3機能を更に有している。これにより、第3の問題点を解決できる。
また、ホスト計算機100上のVM数の代わりに、各ゲストOSに割り当てられたCPUリソースの割合を元に、ゲストOSのCPU負荷を補正することも出来る。この場合、通常は動的に変化することが無いため、監視対象としていない実CPUクロックを監視することで、実現が可能である。
また、CPU負荷以外にも、ゲスト計算機110上のあらゆるリソースに対する性能情報監視に対してしても本発明を適用することが可能である。
以上、本発明の第1、第2実施形態による運用管理装置について、ソフトウェア的にゲスト計算機110が生成されている場合に従って説明したが、他の実施形態として、図10に示されるように、ハードウェア的に機能部品を組み替えられるIO仮想化計算機400であっても良い。IO仮想化計算機400は、上述のホスト計算機100に対応する。このIO仮想化計算機400(ホスト計算機)は、上述のゲスト計算機110に対応する処理部310と、メモリ320と、HDD330と、処理部310、メモリ320及びHDD330に接続されたIO割当制御部300と、を備えている。この場合、ホスト計算機には容易に資源情報収集部5を組み込むことができないため、監視マネージャ200上でIO割当制御部300を介して処理部310、メモリ320、HDD330を遠隔から監視する資源情報収集部5を有することで、本発明が実現できる。
本発明の実施形態による運用管理装置の構成を説明するための図である(第1、第2実施形態)。 本発明の実施形態による運用管理装置の構成を示すブロック図である(第1、第2実施形態)。 本発明の実施形態による運用管理装置の動作を示すフローチャートである(第1、第2実施形態)。 本発明の実施形態による運用管理装置の資源割当分析部6の動作(調整後の性能情報の生成)を説明するための図である(第1実施形態)。 本発明の実施形態における調整データを示し、自然数と調整倍率との関係を示している(第1、第2実施形態)。 図3の障害判定処理を示している(第1実施形態)。 本発明の実施形態による運用管理装置の性能異常分析部2の動作(閾値判定)を説明するための図である(第1、第2実施形態)。 本発明の実施形態による運用管理装置の資源割当分析部6の動作(調整後の性能情報の生成)を説明するための図である(第2実施形態)。 本発明の実施形態による運用管理装置の性能異常分析部2の動作(閾値判定)を説明するための図である(第2実施形態)。 本発明の実施形態による運用管理装置の別の構成を示すブロック図である(第1、第2実施形態)。
符号の説明
1 性能情報収集部、
2 性能異常分析部、
3 障害分析部、
4 管理者対話部、
5 資源情報収集部、
6 資源割当分析部、
100 ホスト計算機、
110 ゲスト計算機、
200 監視マネージャ、

Claims (14)

  1. ホスト計算機上で仮想的に実現されるゲスト計算機の負荷性能を値で表す情報を収集し、性能情報として出力する性能情報収集部と、
    前記性能情報を受け取って、前記性能情報が表す値と閾値とを比較し、比較の結果に基づいて、前記ゲスト計算機上の負荷に異常があるか否かを分析し、前記ゲスト計算機上の負荷に異常があると判定した場合、その旨を表す異常メッセージを出力する性能異常分析部と、
    前記ホスト計算機上で前記ゲスト計算機に割り当てられた資源の数を表す情報を収集し、資源情報として出力する資源情報収集部と、
    前記資源情報と前記性能情報とを受け取り、自然数と調整倍率とを複数対応付ける調整データを参照して、前記複数の調整倍率の中から、前記資源情報が表す数に対応する選択調整倍率を選択し、前記性能情報が表す値を前記選択調整倍率に応じて調整し、前記性能情報として前記性能異常分析部に出力する資源割当分析部と、
    を具備する運用管理装置。
  2. 前記性能異常分析部は、
    前記性能情報が表す値が、前記閾値を超えている場合、前記ゲスト計算機上の負荷に異常があると判定し、その旨を表す前記異常メッセージを出力する、
    請求項1に記載の運用管理装置。
  3. 前記性能異常分析部は、
    前記性能情報が表す値が、前記閾値である上限閾値よりも低い下限閾値に満たない場合、前記ゲスト計算機上の負荷に異常があると判定し、その旨を表す前記異常メッセージを出力する、
    請求項2に記載の運用管理装置。
  4. 前記異常メッセージの発生順序や組み合わせによってシステム全体に障害があるか否かを分析し、前記システム全体に障害があると判定した場合、その旨を表す障害状態情報を生成する障害分析部と、
    前記障害状態情報を管理者に提示する管理者対話部と、
    を更に具備する請求項1〜3のいずれかに記載の運用管理装置。
  5. 前記ゲスト計算機は、ソフトウェア的に生成されている、
    請求項1〜4のいずれかに記載の運用管理装置。
  6. 前記ゲスト計算機は、ハードウェア的に構成されている、
    請求項1〜4のいずれかに記載の運用管理装置。
  7. ホスト計算機上で仮想的に実現されるゲスト計算機の負荷性能を値で表す情報を収集し、性能情報として出力するステップと、
    前記性能情報を受け取って、前記性能情報が表す値と閾値とを比較し、比較の結果に基づいて、前記ゲスト計算機上の負荷に異常があるか否かを分析し、前記ゲスト計算機上の負荷に異常があると判定した場合、その旨を表す異常メッセージを出力するステップと、
    前記ホスト計算機上で前記ゲスト計算機に割り当てられた資源の数を表す情報を収集し、資源情報として出力するステップと、
    前記資源情報と前記性能情報とを受け取り、自然数と調整倍率とを複数対応付ける調整データを参照して、前記複数の調整倍率の中から、前記資源情報が表す数に対応する選択調整倍率を選択し、前記性能情報が表す値を前記選択調整倍率に応じて調整し、前記性能情報として出力するステップと、
    を具備する運用管理方法。
  8. 前記異常メッセージを出力するステップは、
    前記性能情報が表す値が、前記閾値を超えている場合、前記ゲスト計算機上の負荷に異常があると判定し、その旨を表す前記異常メッセージを出力するステップ、
    を含む請求項7に記載の運用管理方法。
  9. 前記異常メッセージを出力するステップは、
    前記性能情報が表す値が、前記閾値である上限閾値よりも低い下限閾値に満たない場合、前記ゲスト計算機上の負荷に異常があると判定し、その旨を表す前記異常メッセージを出力するステップ、
    を更に含む請求項8に記載の運用管理方法。
  10. 前記異常メッセージの発生順序や組み合わせによってシステム全体に障害があるか否かを分析し、前記システム全体に障害があると判定した場合、その旨を表す障害状態情報を生成するステップと、
    前記障害状態情報を管理者に提示するステップと、
    を更に具備する請求項7〜9のいずれかに記載の運用管理方法。
  11. ホスト計算機上で仮想的に実現されるゲスト計算機の負荷性能を値で表す性能情報を受け取って、前記性能情報が表す値と閾値とを比較し、比較の結果に基づいて、前記ゲスト計算機上の負荷に異常があるか否かを分析し、前記ゲスト計算機上の負荷に異常があると判定した場合、その旨を表す異常メッセージを出力するステップと、
    前記ホスト計算機上で前記ゲスト計算機に割り当てられた資源の数を表す資源情報と、前記性能情報とを受け取り、自然数と調整倍率とを複数対応付ける調整データを参照して、前記複数の調整倍率の中から、前記資源情報が表す数に対応する選択調整倍率を選択し、前記性能情報が表す値を前記選択調整倍率に応じて調整し、前記性能情報として出力するステップと、
    の各ステップをコンピュータに実行させるコンピュータプログラム。
  12. 前記異常メッセージを出力するステップは、
    前記性能情報が表す値が、前記閾値を超えている場合、前記ゲスト計算機上の負荷に異常があると判定し、その旨を表す前記異常メッセージを出力するステップ、
    を含む請求項11に記載のコンピュータプログラム。
  13. 前記異常メッセージを出力するステップは、
    前記性能情報が表す値が、前記閾値である上限閾値よりも低い下限閾値に満たない場合、前記ゲスト計算機上の負荷に異常があると判定し、その旨を表す前記異常メッセージを出力するステップ、
    を更に含む請求項12に記載のコンピュータプログラム。
  14. 前記異常メッセージの発生順序や組み合わせによってシステム全体に障害があるか否かを分析し、前記システム全体に障害があると判定した場合、その旨を表す障害状態情報を生成するステップと、
    前記障害状態情報を管理者に提示するステップと、
    の各ステップを更に前記コンピュータに実行させる請求項11〜13のいずれかに記載のコンピュータプログラム。
JP2008043858A 2008-02-26 2008-02-26 運用管理装置、運用管理方法ならびにプログラム Active JP4761229B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008043858A JP4761229B2 (ja) 2008-02-26 2008-02-26 運用管理装置、運用管理方法ならびにプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008043858A JP4761229B2 (ja) 2008-02-26 2008-02-26 運用管理装置、運用管理方法ならびにプログラム

Publications (2)

Publication Number Publication Date
JP2009205208A true JP2009205208A (ja) 2009-09-10
JP4761229B2 JP4761229B2 (ja) 2011-08-31

Family

ID=41147439

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008043858A Active JP4761229B2 (ja) 2008-02-26 2008-02-26 運用管理装置、運用管理方法ならびにプログラム

Country Status (1)

Country Link
JP (1) JP4761229B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011070522A (ja) * 2009-09-28 2011-04-07 Nec Corp 仮想計算機管理システム,仮想計算機管理方法及びプログラム
JP2011198262A (ja) * 2010-03-23 2011-10-06 Hitachi Ltd 計算機システムにおけるシステム管理方法、及び管理システム
WO2013069138A1 (ja) * 2011-11-10 2013-05-16 株式会社日立製作所 稼働情報予測計算機、稼働情報予測方法及びプログラム
JP2015114770A (ja) * 2013-12-10 2015-06-22 三菱電機ビルテクノサービス株式会社 機器状態判定装置及びプログラム
CN115150460A (zh) * 2022-06-30 2022-10-04 济南浪潮数据技术有限公司 一种节点安全注册方法、装置、设备及可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003263342A (ja) * 2002-03-07 2003-09-19 Telecommunication Advancement Organization Of Japan 情報処理装置の監視装置および監視方法並びにそのプログラム
JP2006301852A (ja) * 2005-04-19 2006-11-02 Nec Corp 計算資源運用管理装置およびシステム
WO2007148371A1 (ja) * 2006-06-19 2007-12-27 Nec Corporation 仮想マシンのための性能管理システムと性能管理方法
JP2008293117A (ja) * 2007-05-22 2008-12-04 Hitachi Ltd 仮想計算機の性能監視方法及びその方法を用いた装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003263342A (ja) * 2002-03-07 2003-09-19 Telecommunication Advancement Organization Of Japan 情報処理装置の監視装置および監視方法並びにそのプログラム
JP2006301852A (ja) * 2005-04-19 2006-11-02 Nec Corp 計算資源運用管理装置およびシステム
WO2007148371A1 (ja) * 2006-06-19 2007-12-27 Nec Corporation 仮想マシンのための性能管理システムと性能管理方法
JP2008293117A (ja) * 2007-05-22 2008-12-04 Hitachi Ltd 仮想計算機の性能監視方法及びその方法を用いた装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011070522A (ja) * 2009-09-28 2011-04-07 Nec Corp 仮想計算機管理システム,仮想計算機管理方法及びプログラム
JP2011198262A (ja) * 2010-03-23 2011-10-06 Hitachi Ltd 計算機システムにおけるシステム管理方法、及び管理システム
WO2013069138A1 (ja) * 2011-11-10 2013-05-16 株式会社日立製作所 稼働情報予測計算機、稼働情報予測方法及びプログラム
JP2015114770A (ja) * 2013-12-10 2015-06-22 三菱電機ビルテクノサービス株式会社 機器状態判定装置及びプログラム
CN115150460A (zh) * 2022-06-30 2022-10-04 济南浪潮数据技术有限公司 一种节点安全注册方法、装置、设备及可读存储介质

Also Published As

Publication number Publication date
JP4761229B2 (ja) 2011-08-31

Similar Documents

Publication Publication Date Title
JP5851503B2 (ja) 高可用性仮想機械環境におけるアプリケーションの高可用性の提供
US8949671B2 (en) Fault detection, diagnosis, and prevention for complex computing systems
US9335998B2 (en) Multi-core processor system, monitoring control method, and computer product
US7865782B2 (en) I/O device fault processing method for use in virtual computer system
KR101438990B1 (ko) 시스템 테스트 방법
US20100043004A1 (en) Method and system for computer system diagnostic scheduling using service level objectives
CN102521098B (zh) Cpu死机监控的处理方法和装置
US9519869B2 (en) Predictive computer system resource monitoring
EP3591485B1 (en) Method and device for monitoring for equipment failure
JP4761229B2 (ja) 運用管理装置、運用管理方法ならびにプログラム
US10379931B2 (en) Computer system
JP2010079811A (ja) 計算機システム、計算機システムの障害の予兆検知方法及びプログラム
JP2008234520A (ja) ソフトウェア挙動監視装置、ソフトウェア挙動監視システム及びそのプログラム
JP2011108201A (ja) 情報処理装置、診断方法および診断プログラム
JP2010086364A (ja) 情報処理装置、動作状態監視装置および方法
US8332069B2 (en) Fault tolerance method and apparatus for robot software component
JP4992740B2 (ja) マルチプロセッサシステム、障害検出方法および障害検出プログラム
US20050033952A1 (en) Dynamic scheduling of diagnostic tests to be performed during a system boot process
JP5014179B2 (ja) Os優先度変更装置及びos優先度変更プログラム
JP2010134557A (ja) 仮想マシン運用管理システム、その運用管理方法、及びプログラム
JP2011243012A (ja) 仮想計算機システムのメモリダンプ取得方法
TWI469573B (zh) 系統錯誤處理方法與使用其之伺服器系統
Volk et al. Towards intelligent management of very large computing systems
JP2009032052A (ja) 情報処理装置、情報処理方法及びプログラム
JP6555131B2 (ja) 並列処理装置、ジョブ監視方法及びジョブ監視プログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100820

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100825

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101022

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101111

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110105

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110125

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110419

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20110422

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110513

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110526

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140617

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4761229

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150