JP2009129134A - ストレージ管理システム、性能監視方法及び管理サーバ - Google Patents

ストレージ管理システム、性能監視方法及び管理サーバ Download PDF

Info

Publication number
JP2009129134A
JP2009129134A JP2007302472A JP2007302472A JP2009129134A JP 2009129134 A JP2009129134 A JP 2009129134A JP 2007302472 A JP2007302472 A JP 2007302472A JP 2007302472 A JP2007302472 A JP 2007302472A JP 2009129134 A JP2009129134 A JP 2009129134A
Authority
JP
Japan
Prior art keywords
performance
storage
threshold
business process
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2007302472A
Other languages
English (en)
Inventor
Tomoaki Kakeda
知章 掛田
Nobuo Kureyama
伸夫 紅山
一樹 ▲高▼松
Kazuki Takamatsu
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2007302472A priority Critical patent/JP2009129134A/ja
Priority to US12/020,925 priority patent/US20090138884A1/en
Publication of JP2009129134A publication Critical patent/JP2009129134A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0727Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a storage system, e.g. in a DASD or network based storage system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • G06F11/0754Error or fault detection not based on redundancy by exceeding limits
    • G06F11/0757Error or fault detection not based on redundancy by exceeding limits by exceeding a time limit, i.e. time-out, e.g. watchdogs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • G06F11/3419Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment by assessing time
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3485Performance evaluation by tracing or monitoring for I/O devices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/81Threshold

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Debugging And Monitoring (AREA)

Abstract

【課題】実行中の業務処理に応じて、SAN環境下におけるストレージリソースに関し、性能監視閾値の設定及び性能の監視を適切に実現することを課題とする。
【解決手段】本発明は、ホスト計算機と、ストレージ装置0104と、ストレージネットワークと、管理サーバ0105と、を備えて構成されるストレージ管理システムである。管理サーバ0105は、ストレージ資源に関する現在の性能値を収集する性能情報収集部と、複数の業務処理の構成比率に対応する構成区分を判定する構成区分判定部と、1つ以上の前記ストレージ資源に対して、構成区分に応じて性能監視閾値を記憶する閾値情報記憶部と、現在の性能値、及び、性能監視閾値に基づいて、ストレージ資源の性能判定を行う性能判定部と、を備える。
【選択図】図2

Description

本発明は、ストレージ装置及びストレージネットワークにおける性能を監視する技術に関する。
近年、ディスク装置等からなる大規模記憶装置であるストレージ装置(以下、単に「ストレージ」ともいう。)とサーバとの間に専用ネットワークであるSAN(Storage Area Network)を構築することにより、ストレージ環境を統合し、ストレージの管理コストの低減やストレージ容量の有効利用が期待されている。
上記のSAN環境において業務システムの性能監視やチューニングをするためには、業務システムで利用しているストレージやSAN上のネットワーク装置といった、ネットワーク上に分散配置されるストレージリソース(ストレージ資源)の性能監視が重要となってきている。
これに対し、従来、ネットワーク(SAN)上に分散したストレージやネットワーク装置等の性能監視対象の時系列の性能情報を、管理ネットワークにより接続された管理サーバ上の運用管理ソフトにおいて収集し、これを元に性能監視を行うのが一般的になっている。また、こうして収集した性能値を、事前に設定した閾値を基準に監視することで、性能問題を予測し事前に検出する方法が一般に用いられている。
なお、特許文献1では、SAN環境におけるものではないが、ネットワーク上における複数サーバの性能情報を収集し監視、レポートする方法及びシステムが公開されている。
米国特許第6505248号明細書
しかしながら、従来の方法において収集した性能情報におけるストレージリソースの性能値が適切であるか否かの判断は、ストレージ管理者にとっても困難なものであった。これは、以下のような理由による。
理由(1) 業務処理の性能要件に応じて、ストレージリソースに求める要求性能値が異なる。例えば、ストレージへの入出力処理が業務処理の処理時間の多くの割合を占める場合においては、ストレージへの要求性能は高まる。
理由(2) 業務処理によってストレージに対する入出力特性が異なるので、業務処理の性能要件を満足するストレージリソースの要求性能値は簡単には求められない。例えば、1回の入出力処理で扱うデータ量や、複数回の入出力処理間でのデータ領域へのアクセスパターン(ランダム領域や連続領域)に応じて、応答性能やスループット(データ量、入出力回数)に対する要求性能値は様々である。
理由(3) 複数種類の業務処理が同じストレージリソースを共用している場合、更に状況は複雑になる。何れの業務処理が主に性能監視対象のストレージリソースを使用しているか等について、各業務処理の処理量の構成は時間と共に動的に変化するため、現時点での適切な性能値を判断することは更に困難となる。
こうした理由から、業務処理の性能問題を引き起こすストレージ性能劣化を、ストレージリソースの性能値を監視することで予測して事前に検出するために適切な閾値を事前に決定することは難しい。
上記事情を鑑みて、本発明は、実行中の業務処理に応じて、SAN環境下におけるストレージリソースに関し、性能監視閾値の設定及び性能の監視を適切に実現することを課題とする。
前記課題を解決するために、本発明は、ホスト計算機と、ストレージ装置と、ストレージネットワークと、管理サーバと、を備えて構成されるストレージ管理システムである。
管理サーバは、ストレージ資源に関する現在の性能値を収集する性能情報収集部と、複数の業務処理の構成比率に対応する構成区分を判定する構成区分判定部と、1つ以上の前記ストレージ資源に対して、構成区分に応じて性能監視閾値を記憶する閾値情報記憶部と、現在の性能値、及び、性能監視閾値に基づいて、ストレージ資源の性能判定を行う性能判定部と、を備える。その他の手段については後記する。
本発明によれば、実行中の業務処理に応じて、SAN環境下におけるストレージリソースに関し、性能監視閾値の設定及び性能の監視を適切に実現することができる。
以下、図面を参照(言及図以外の図も適宜参照)して、まず、発明の概要について説明し、その後、本発明を実施するための最良の形態(以下、実施形態という。)について説明する。
<概要>
本発明は、上記課題を解決するために、以下の手段を用いて、SAN環境における性能の監視を適切に実現するものである。
手段(1) 業務サーバ(ホスト計算機)から、性能監視対象であるストレージリソース(ストレージ資源)を使用する業務処理の性能情報(応答時間、実行回数などの処理量、等)を収集する。また、業務処理に対する性能要件を事前に設定する。
手段(2) 時系列に収集した業務処理の性能値、及び業務処理から使用するストレージリソースの性能値を用いて、業務処理の性能値が事前に設定した性能要件を満足する時、もしくは満足しない時のストレージリソースの性能値を特定し、ストレージリソースの性能監視閾値(以下、単に「閾値」ともいう。)として設定する。
手段(3) 複数種類の業務処理が同じストレージリソースを共用している場合、当該ストレージリソースを使用する業務処理の処理量を業務処理の種類毎に調べ、当該ストレージリソースを使用する複数種類の業務処理の処理量の構成区分(業務処理構成区分)を判定する。
手段(4) 前記判定された業務処理構成区分毎に、手段(2)におけるストレージリソースの性能監視閾値を保持する。ストレージリソースの性能監視閾値の設定は手段(2)に従うが、当該ストレージリソースを共用する全ての業務処理の性能値を考慮する。また、性能監視時には、現在の業務処理構成区分に設定された性能監視閾値を用いてストレージリソースの現在の性能値が適切か否かを判定する。
図1は、本発明の基本概念を、特に前記手段(3),(4)を中心に表したものである。
まず、「発明が解決しようとする課題」で示した理由(1),(2)を、具体例を挙げて説明する。
ここでは、図2に示すように、アプリケーションプログラム(以下、アプリケーションという。)0110は、業務サーバ0102において業務処理を実行するプログラムであり、必要に応じてストレージ装置0104におけるデータの記憶領域である論理ボリューム0121に読み書きのアクセスを行うものとする。
図1に戻って、アプリケーション0110は、種類の異なる業務処理A0211と、業務処理B0212とからなる。
業務処理A0211は、システム要件から業務処理あたりの業務処理要求性能0215a(0215)が2.8秒となっている。また、ある時点での業務処理A0211の実処理時間(実際の処理時間)0213a(0213)は2秒であり、その処理中に論理ボリューム0121に対して入出力を行い、その実応答時間(実際の応答時間)0217a(0217)は1ミリ秒であったことを示している。
業務処理B0212は、システム要件から業務処理あたりの業務処理要求性能0215b(0215)が7秒となっている。また、ある時点での業務処理B0212の実処理時間0213b(0213)は5秒であり、その処理中に論理ボリューム0121に対して入出力を行い、その実応答時間0217b(0217)は5ミリ秒であったことを示している。
ここで、例えば、業務処理B0212は業務処理A0211と比べて論理ボリューム0121へ要求する一回の入出力のデータサイズが大きいため、入出力にかかる時間も業務処理A0211の場合よりも長くなるとする。そして、実応答時間0217の違いは、論理ボリューム0121に対する入出力特性(この場合、一回の入出力のデータサイズ)のみによって生じており、業務処理の実処理時間0213とは直接の関連はない。また、業務処理におけるストレージ(論理ボリューム0121)への入出力サイズについて事前に情報を得ることは難しい。さらに、この例のように、業務処理の要求性能のみからストレージリソースの要求性能を判断することは、ストレージ(論理ボリューム0121)への入出力特性に大きく依存するために難しく、性能監視閾値の設定も困難となる。
次に、「発明が解決しようとする課題」で示した理由(3)を、具体例を挙げて説明する。
図1において、業務処理A0211と業務処理B0212とは同一の論理ボリューム0121に対して入出力を行っている。この場合、論理ボリューム0121の実応答時間0221は、ある単位時間における両業務処理(業務処理A、業務処理B)の入出力における平均応答時間として求められる。そのため、業務処理A0211と、業務処理B0212との入出力が混在する論理ボリューム0121の実応答時間0221は、業務処理A0211と、業務処理B0212のある単位時間における実行比率と、それぞれの業務処理が論理ボリューム0121に対して発行する入出力の実応答時間とによって決定される。しかしながら、業務処理A0211と業務処理B0212の処理量は時間と共に変化し、したがって論理ボリューム0121の性能監視閾値(応答時間監視閾値0222)を、適切に決定することは難しい。
以上の理由による課題を解決する方法として、本発明では以下の3つの手法によってストレージリソースの性能監視を行う。
(a)過去に監視した業務処理とストレージリソースの性能情報と、業務処理に対するシステム要件とから、過去における業務処理のシステム要件違反の検出可否によって性能監視閾値を決定する。
(b)ストレージリソースを使用する業務処理の構成区分毎に性能監視閾値を設定する。
(c)ストレージリソースを使用している業務処理の構成区分毎に性能監視閾値を選択し、性能を監視する。
図1を用いて、本発明における(b)と(c)における性能監視閾値の設定と、性能監視閾値に基づいた性能監視の例を以下に記す。なお、(a)における、性能監視閾値の決定については図22及び図23を用いて後記する。
図1において、性能監視閾値は次の形で保持する。性能監視閾値テーブル0220は、業務処理A0211と業務処理B0212の処理量の比率である業務処理A比率0223及び業務処理B比率0224と、性能監視閾値0225と、閾値超過時影響業務処理0226とをカラムに持つテーブルである。
すなわち、本発明の基本的なアイデアの一つは、業務処理A0211と業務処理B0212との処理量の比率の区分(業務処理構成区分)毎に、業務処理の処理量の構成によって変化する論理ボリューム0121の性能監視閾値0225を管理できるようにすることである。例えば、業務処理A0211と業務処理B0212の処理量の比率が9:1の時の論理ボリューム0121の適切な性能値は1.4ms(ミリ秒)未満でなければならず、性能監視閾値0225(応答時間)は1.4msとなる。同様に、処理量の比率が8:2の場合には、性能監視閾値0225は1.8msとなる。
そのため、論理ボリューム0121の性能監視閾値の設定時(性能監視閾値テーブル0220の作成時)には、論理ボリューム0121を共有している業務処理A0211と業務処理B0212の性能監視閾値を決定した時点での処理量の比率を調べ、該当する比率に対してその決定した性能監視閾値0225を設定する。
逆に、論理ボリューム0121の性能の監視は、論理ボリューム0121を共有している業務処理A0211と業務処理B0212の現在の実行比率を調べ、該当する比率の性能監視閾値0225と論理ボリューム0121の実応答時間0221を比較することによって行う。実応答時間0221が性能監視閾値0225を上回った場合には、ユーザに通知する。
閾値超過時影響業務処理0226のカラムは、論理ボリューム0121の性能が性能監視閾値を違反した場合に、その違反がどの業務処理で起きた可能性が高いかを表すカラムである。過去に、論理ボリューム0121を共用する業務処理の何れかで実際の業務処理性能が要求性能を満たせなかった場合に、その時点の論理ボリューム0121の実応答時間を性能監視閾値として設定すると共に、性能要件を満たせなくなった業務処理を併せて記録しておく。これにより、論理ボリューム0121の実応答性能が性能監視閾値を満たせなかった場合に、性能問題を起こす可能性が高い業務処理を併せてユーザに通知することが可能となる。
次に、図22及び図23を用いて(a)の例を説明する。簡単のため一種類の業務処理しか論理ボリューム0121にアクセスしない例を用いることとする。この場合において、前記業務処理構成区分は1つとなる。図22のストレージシステムにおいて、アプリケーション0110は業務処理A0211からなる。また、論理ボリューム0121は、業務処理A0211のみから入出力を受け付ける。業務処理A0211の実処理時間0213に対してシステム要件より要求性能0215が要求されている。また、論理ボリューム0121の実応答時間0221に対しては、応答時間監視閾値0222を設定し性能の監視を行う。性能監視における状態を表したテーブル2201(以下、テーブル2201という。)は、業務処理A0211の実処理時間0213及び要求性能0215の関係と、論理ボリューム0121の実応答時間0221及び応答時間監視閾値0222の関係とを表している。
テーブル2201のセル2202は、業務処理A0211の実処理時間0213が要求性能0215を満たしており、且つ、論理ボリューム0121の実応答時間0221が応答時間監視閾値0222を満たしている場合を表し、両者の整合がとれているので、論理ボリューム0121の応答時間監視閾値0222が適切である(正しく性能監視できている)ことを表している。
セル2203は、業務処理A0211の実処理時間0213が要求性能0215を満たしておらず、且つ、論理ボリューム0121の実応答時間0221が応答時間監視閾値0222を満たしている場合を表し、論理ボリューム0121の応答時間監視閾値0222が緩く設定されていることを表している。セル2203の場合においては、論理ボリューム0121の実応答時間0221が応答時間監視閾値0222を満たさないように、応答時間監視閾値0222を強く設定し直す。
セル2204は、業務処理A0211の実処理時間0213が要求性能0215を満たしており、且つ、論理ボリューム0121の実応答時間0221が応答時間監視閾値0222を満たしていない場合を表し、論理ボリューム0121の応答時間監視閾値0222が強く設定されていることを表している。セル2204の場合においては、論理ボリューム0121の実応答時間0221が応答時間監視閾値0222を満たすように、応答時間監視閾値0222を緩く設定し直す。
セル2205は、業務処理A0211の実処理時間0213が要求性能0215を満たしておらず、且つ、論理ボリューム0121の実応答時間0221が応答時間監視閾値0222を満たしていない場合を表し、両者の整合がとれているので、論理ボリューム0121の応答時間監視閾値0222が適切である(正しく性能監視できている)ことを表している。
図23は、図22のストレージシステムの性能を監視した際の監視結果を時系列で表した図である。図23の2つの時系列グラフのうち、上側は業務処理Aの実処理時間0213を表すグラフであり、下側は論理ボリューム0121の実応答時間0221を表すグラフである。
時点A2301における性能監視閾値は応答時間監視閾値A0222Aであった。
時点B2302において、実応答時間0221は応答時間監視閾値A0222Aを上回っている(満たしていない)が、実処理時間0213は要求性能0215を満たしている。つまり、テーブル2201におけるセル2204の場合に該当し、時点B2302における実応答時間0221を性能監視閾値とする。応答時間監視閾値B0222Bは時点Bにおいて設定された性能監視閾値である。
時点C2303において、業務処理A0211の実処理時間0213は要求性能0215を満たしておらず、要求性能違反2311が発生した。しかし、実応答時間0221は応答時間監視閾値B0222Bを満たしており、テーブル2201のセル2202の場合に該当し、時点C2303における実応答時間0221を性能監視閾値とする。
時点C2303において設定された応答時間監視閾値C0222Cを時点Dにおいて実応答時間0221は満たしておらず、且つ、要求性能0215は実処理時間0213を満たしている。テーブル2201におけるセル2204の場合にあたるが、時点C2303において応答時間監視閾値0222を一度強化したため、応答時間監視閾値0222を緩和しない(緩和してもよい)。この例のように、本発明では、性能監視閾値を緩和又は強化することによって適切な性能監視閾値を求めて設定(動的に設定)する。
<実施形態>
以下、本発明の実施形態を、図面を用いて詳細に説明する。
図2は、本実施形態のストレージシステムの全体構成を表した図である。ストレージシステムS(ストレージ管理システム)は、業務サーバ0102と、ストレージ装置0104と、管理サーバ0105と、管理クライアント0106と、SANスイッチ0107とにより構成されている。そして、業務サーバ0102と、ストレージ装置0104とはSAN0103(ストレージネットワーク)によって接続されている。また、業務サーバ0102と、ストレージ装置0104と、管理サーバ0105と、管理クライアント0106とはLAN(Local Area Network)0101によって接続されている。
次に、業務サーバ0102の構成について詳述する。なお、図2のストレージシステムSは1台の業務サーバ0102によって構成されているが、1台に限られるものではなく複数の業務サーバ0102によって構成されていてもよい。
業務サーバ0102は、アプリケーション0110を稼動させるためのものであり、CPU(Central Processing Unit)0108と、メモリ0109を備える。業務サーバ0102はSANポート0116を有し、SANポート0116によってSAN0103に接続されている。また、業務サーバ0102はLANポート0137を有し、LANポート0137によってLAN0101に接続されている。
CPU0108は、記憶部0114に格納されたプログラムを読み出してメモリ0109に展開して実行すること等によって、各種処理を行う。ただし、以下において、記載を簡略化するために、CPU0108ではなく各プログラムを動作主体として記載することもある。
メモリ0109は、CPU0108の動作領域である。
記憶部0114は、アプリケーション0110と、データベース管理ソフトウェア(以下、DBMS(Database Management System)という。)0111と、OS(Operating System)0112と、サーバ情報取得プログラム0113とを格納している。
アプリケーション0110は、業務処理を実行するプログラムであり、業務処理に応じてDBMS0111にデータの追加や参照を要求する。
DBMS0111は、アプリケーション0110からの要求に応じ、ストレージ装置0104に格納されたデータの定義や操作を行う。
サーバ情報取得プログラム0113は、アプリケーション0110の実行する業務処理と、DBMS0111と、OS0112と、SANポート0116とに関する情報を収集し、取得した情報を管理サーバ0105に送信する。
次に、ストレージ装置0104の構成について詳述する。なお、図2のストレージシステムSは1台のストレージ装置0104によって構成されているが、1台に限られるものではなく複数のストレージ装置0104によって構成されていてもよい。
ストレージ装置0104は、CPU0119と、メモリ0120と、論理ボリューム0121とを備える。ストレージ装置0104はSANポート0118を有し、SANポート0118によってSAN0103に接続されている。また、ストレージ装置0104はLANポート0128を有し、LANポート0128によってLAN0101に接続されている。
CPU0119とメモリ0120は、ストレージ装置0104のディスク入出力(データの入出力)を司るともに、CPU0119と、メモリ0120と、論理ボリューム0121に関する管理情報を収集し管理サーバ0105に送信する。
メモリ0120は、主にストレージ装置0104が入出力するデータを一時的に記憶する機能(キャッシュ)を提供する。
論理ボリューム0121は、ストレージ装置0104におけるデータの記憶領域であり、データをブロック単位によって読み書きが行われる。論理ボリューム0121は、実際には一つ又は複数の外部記憶装置0126からRAID(Redundant Arrays of Inexpensive Disks)グループ0122を構成し、一つ又は複数の論理的な記憶領域である論理ボリュームを構成する。外部記憶装置0126は、例えばFC(Fibre Channel)ディスク等がある。
次に、SANスイッチ0107の構成について詳述する。なお、図2のストレージシステムSは1台のSANスイッチ0107によって構成されているが、1台に限られるものではなく複数のSANスイッチ0107によって構成されてもよい。
SANスイッチ0107は、業務サーバ0102とストレージ装置0104間のデータ通信を中継するネットワークデバイスであり、SANポート0151,0152を備える。また、SANスイッチ0107はLANポート0148を有し、LANポート0148によってLAN0101に接続されている。
次に、管理サーバ0105の構成について詳述する。
管理サーバ0105は、CPU0145と、メモリ0146と、入力部0143と、表示部0144と、記憶部0135と、外部記憶装置0123とを備える。管理サーバ0105は、LANポート0127を有し、LANポート0127によってLAN0101に接続されている。
CPU0145は、記憶部0135に格納されたプログラムを読み出してメモリ0146に展開して実行すること等によって、各種処理を行う。更に、CPU0145は、各種処理過程でユーザとのインタラクションを必要とする情報を表示部0144に表示する。また、CPU0145は、前記インタラクションを通じて、入力部0143から入力された情報を処理する。
記憶部0135は、性能管理ソフト0136と、ストレージ装置情報取得プログラム0133と、SANスイッチ情報取得プログラム0134とを格納している。
外部記憶装置0123は、後記する性能管理ソフト0136が収集や管理する情報を格納している。
性能管理ソフト0136は、情報収集プログラム0124と、性能監視プログラム0125とによって構成されている。情報収集プログラム0124は、サーバ情報取得プログラム0113とストレージ装置情報取得プログラム0133と、SANスイッチ情報取得プログラム0134から管理情報を受信し、外部記憶装置0123へその取得した管理情報を格納する。また、性能監視プログラム0125は、外部記憶装置0123に格納された管理情報に基づき監視対象に対して性能監視閾値を設定する機能と、性能監視閾値に基づき性能を監視する機能と、性能に問題が起きる可能性のある場合または問題が起きた場合に管理クライアント0106へ通知する機能とを有する。
ストレージ装置情報取得プログラム0133は、ストレージ装置0104から後記する情報を取得し、情報収集プログラム0124へ送信する。
SANスイッチ情報取得プログラム0134は、SANスイッチ0107から後記する情報を取得し、情報収集プログラム0124へ送信する。
次に、管理クライアント0106の構成について詳述する。なお、図2のストレージシステムSは1台の管理クライアント0106によって構成されているが、1台に限られるものではなく複数の管理クライアント0106によって構成されてもよい。
管理クライアント0106は、管理サーバ0105のユーザインタフェースを提供する装置であり、CPU0138と、メモリ0139を備える。また、管理クライアント0106は、LANポート0129を有し、LANポート0129によってLAN0101に接続されている。
CPU0138は、メモリ0139に格納されている管理クライアント0106の情報をユーザに伝える処理を行う。例えば、Webブラウザを動作させることによりユーザインタフェースを提供する。
メモリ0139は、管理クライアント0106の情報と、ユーザインタフェースを提供するソフトに関する情報を格納する。
図3は、本実施形態におけるプログラムのモジュール構成を表す図である。図3を用いて、本実施形態におけるプログラムのモジュールの役割を説明する。
情報取得プログラム0301は、ストレージシステムSにおける監視対象から情報を収集するプログラムで、構成情報取得部0311と、構成情報送出部0312と、性能情報取得部0313(性能情報収集部)と、性能情報送出部0314とを備える。また、情報取得プログラム0301は、図2におけるサーバ情報取得プログラム0113と、ストレージ装置情報取得プログラム0133と、SANスイッチ情報取得プログラム0134における共通の構成を表したものであり、情報取得プログラム0301における情報取得方法や送出方法の詳細は取得対象の装置によって異なる。
構成情報取得部0311は、情報取得プログラム0301のスケジューリング設定から呼び出され処理を実行する。構成情報取得部0311は、呼び出された後に監視対象装置から構成情報を取得し、構成情報送出部0312へ前記構成情報を渡す。ここで、監視対象装置とは、図2における業務サーバ0102と、ストレージ装置0104と、SANスイッチ0107とを指す。それぞれの監視対象装置から取得する構成情報の詳細については、図4〜図7を用いて後記する。
構成情報送出部0312は、構成情報取得部0311から渡されたデータを情報収集プログラム0124の構成情報取得部0321に送信する。
性能情報取得部0313は、情報取得プログラム0301のスケジューリング設定から呼び出され処理を実行する。性能情報取得部0313は、起動後に監視装置の性能情報を取得し、性能情報送出部0314へ前記性能情報を渡す。監視装置は構成情報取得部0311の場合と同様である。また、取得する性能情報の詳細については、図9と図10とを用いて後記する。
性能情報送出部0314は、性能情報取得部0313から渡されたデータを情報収集プログラム0124の性能情報取得部0322(性能情報収集部)に送信する。
情報収集プログラム0124は、このように、構成情報取得部0321と性能情報取得部0322とを備え、情報取得プログラム0301が各監視対象装置から収集した情報を外部記憶装置0123の記憶部に格納する。
外部記憶装置0123は、構成情報記憶部0331と、性能情報記憶部0332と、閾値情報記憶部0333と、業務処理構成区分情報記憶部0334とを備える。情報収集プログラム0124の構成情報取得部0321は、情報取得プログラム0301から受信した各監視対象装置の構成情報を構成情報記憶部0331に格納し、前記格納した構成情報に基づいてストレージリソースを使用するアプリケーションとの関連を検索し、検索結果を構成情報記憶部0331に格納する。
性能情報取得部0322は、情報取得プログラム0301から受信した各監視対象装置の性能情報を性能情報記憶部0332に格納し、格納後に性能監視プログラム0125の性能判定部0341を起動させる。なお、性能情報記憶部0332に格納する性能情報の詳細は、図9と図10とを用いて後記する。
性能監視プログラム0125は、性能判定部0341と、情報参照部0342と、業務処理構成区分判定部0343(構成区分判定部)と、閾値設定部0344と、クライアント通知部0345とを備える。性能監視プログラム0125は、性能監視閾値の設定と、前記性能監視閾値及び性能情報に基づく性能の判定と、問題の発生等のクライアントへの通知との機能を提供する。
性能判定部0341は、性能情報取得部0322によって起動され、ストレージリソースの性能に問題があるかの判定を現在の業務処理構成区分に応じた性能監視閾値を用いて判定する。また、性能判定部0341は、必要に応じて判定結果をクライアント通知部0345へ通知し、また、性能監視閾値を設定する場合に閾値設定部0344を呼び出す。性能判定部0341は、業務処理構成区分判定部0343を呼び出すことにより、業務処理構成区分判定部0343から業務処理構成区分の情報を取得する。また、性能判定部0341は、情報参照部0342からストレージリソースの性能情報と、ストレージリソースの現在の業務処理構成区分に応じた性能監視閾値を取得する。
性能判定部0341は、情報参照部0342と、業務処理構成区分判定部0343とから取得した情報に基づいて性能の判定を行い、問題があるもしくは起こりうると判定した場合にクライアント通知部0345を呼び出し、判定結果をクライアントへ通知する。また、性能判定部0341は、性能監視閾値が設定されていなかった場合と、性能監視閾値の修正が必要な場合とには、閾値設定部0344を呼び出し性能監視閾値の設定を行う。判定処理の詳細については、図15〜図21を用いて後記する。
情報参照部0342は、性能判定部0341と、業務処理構成区分判定部0343と、閾値設定部0344から呼び出され、構成情報記憶部0331と、性能情報記憶部0332と、閾値情報記憶部0333とから情報を取得する。取得する情報の詳細については後記する。
業務処理構成区分判定部0343は、性能判定部0341から呼び出され、ストレージリソースを使用している業務処理の処理量に応じて業務処理構成区分を判定する。業務処理構成区分判定部0343は、情報参照部0342からストレージリソースを使用する業務処理の処理量を取得する。業務処理構成区分判定部0343の詳細については、図16を用いて後記する。
閾値設定部0344は、性能判定部0341から呼び出され、ストレージリソースの業務処理構成区分に応じた性能監視閾値を設定する。閾値設定部0344の詳細については、図19と図21とを用いて後記する。
クライアント通知部0345は、性能判定部0341から呼び出され、性能問題が発生したこともしくは、発生する可能性があることを管理クライアント0106に通知する。
管理クライアント0106は、クライアント通知部0345から通知された情報を受信し、ユーザインタフェース(表示部等)を用いてユーザに提示する。
外部記憶装置0123は、情報を格納し、格納した情報を読み出す機能を提供する。
構成情報記憶部0331は、構成情報取得部0321からの指示により構成情報を格納する機能と、構成情報を読み出す機能とを提供する。また、構成情報記憶部0331は、情報参照部0342の構成情報を読み出す機能を提供する。構成情報記憶部0331が格納する情報の詳細については、図4〜図8を用いて後記する。
性能情報記憶部0332は、性能情報取得部0322からの指示により性能情報を格納する機能と、情報参照部0342からの指示により性能情報を読み出す機能とを提供する。性能情報記憶部0332が格納する情報の詳細については、図9と図10とを用いて後記する。
閾値情報記憶部0333は、閾値設定部0344からの指示により性能監視閾値を格納する機能と、情報参照部0342からの指示により性能監視閾値を読み出す機能とを提供する。閾値情報記憶部0333が格納する情報の詳細については、図11〜図13を用いて後記する。
業務処理構成区分情報記憶部0334は、業務処理構成区分判定部0343からの指示によりストレージリソースに関連する業務処理構成に応じた区分を格納及び読み出す機能を提供する。業務処理構成区分情報記憶部0334が格納する情報の詳細については、図14を用いて後記する。
図4は、アプリケーションを構成する業務処理を表す、アプリケーションの業務処理テーブル0401である。アプリケーションの業務処理テーブル0401は、アプリケーション名0402と、業務処理名0403と、データ取得時刻0404とをカラムに持つテーブルである。アプリケーションの業務処理テーブル0401の情報は、アプリケーション0110〜構成情報取得部0311〜構成情報送出部0312〜構成情報取得部0321〜構成情報記憶部0331の経路で取得し格納されたものである。
図5は、アプリケーションとそのアプリケーションを構成するデバイスファイルの関連を表す、アプリケーションとデバイスファイルの関連テーブル0501である。アプリケーションとデバイスファイルの関連テーブル0501は、アプリケーション名0502と、デバイスファイルID(IDentification)0503と、データ取得時刻0504とをカラムに持つテーブルである。アプリケーションとデバイスファイルの関連テーブル0501の情報は、アプリケーション0110及びDBMS0111〜構成情報取得部0311〜構成情報送出部0312〜構成情報取得部0321〜構成情報記憶部0331の経路で取得し格納されたものである。また、アプリケーションとデバイスファイルのマッピングは、サーバ情報取得プログラム0113がアプリケーション0110と、DBMS0111とから収集した構成情報に基づいて、構成情報取得部0311が作成する。
図6は、デバイスファイルと、WWN(World Wide Name)及びLUN(Logical Unit Number)との関連を表す、デバイスファイルと(WWN、LUN)の関連テーブル0601である。デバイスファイルと(WWN、LUN)の関連テーブル0601は、デバイスファイルID0602と、WWN0603と、LUN0604と、データ取得時刻0605をカラムに持つテーブルである。デバイスファイルと(WWN、LUN)の関連テーブル0601の情報は、OS0112〜構成情報取得部0311〜構成情報送出部0312〜構成情報取得部0321〜構成情報記憶部0331の経路で取得し格納されたものである。
図7は、論理ボリューム0121と、WWN及びLUNとの関連を表す、論理ボリュームと(WWN、LUN)の関連テーブル0701である。論理ボリュームと(WWN、LUN)の関連テーブル0701は、論理ボリュームID0702と、WWN0703と、LUN0704と、データ取得時刻0705をカラムに持つテーブルである。論理ボリュームと(WWN、LUN)の関連テーブル0701の情報は、ストレージ装置0104〜構成情報取得部0311〜構成情報送出部0312〜構成情報取得部0321〜構成情報記憶部0331の経路で取得し格納されたものである。
図8は、アプリケーションとそのアプリケーションの使用するストレージリソースとの関連を表す、アプリケーションとリソースの関連テーブル0801である。アプリケーションとリソースの関連テーブル0801は、アプリケーション名0802と、リソースID0803と、デバイスファイルID0804と、データ取得時刻0805とをカラムに持つテーブルである。図8ではリソースとして論理ボリュームを示しており、構成情報取得部0321が構成情報記憶部0331から図5〜図7で示した情報を取得し、加工処理し、構成情報記憶部0331に格納した情報である。
図9は、アプリケーション0110の各業務処理における性能値の種別と性能値を表す、業務処理性能テーブル0901である。業務処理性能テーブル0901は、アプリケーション名0902と、業務処理名0903と、性能指標分類0907と、性能指標種別0904と、性能値0905と、データ取得時刻0906とをカラムに持つテーブルである。業務処理性能テーブル0901に格納される性能値は、処理量(業務処理構成区分を算出するための性能値)、もしくは、業務処理の要求性能、として指定する。処理量、または、業務処理の要求性能として指定可能か否かは、性能値の性能指標分類0907に依存している。
性能指標分類0907は3分類(応答時間(レスポンスタイム)、スループット、業務サーバ使用量)あり、分類毎に異なる性能指標種別0904がある。処理量として指定できる性能指標分類0907は、スループットと、業務サーバ使用量である。業務処理の要求性能として指定できる性能指標分類0907は、応答時間と、スループットと、業務サーバ使用量である。各性能指標分類0907の性能指標種別0904を以下に記す。
性能指標分類0907が応答時間の性能指標種別0904には、応答時間(業務処理あたりの応答時間)がある。性能指標分類0907がスループットの性能指標種別0904には、転送速度と処理回数(業務処理の単位時間あたりの実行数)がある。性能指標分類0907が業務サーバ使用量の性能指標種別0904には、CPU利用時間と、CPU使用率と、メモリ使用率と、CPUのキュー長(CPUの待ち行列にあるスレッド数)等がある。業務処理性能テーブル0901は、サーバ情報取得プログラム0113が取得する情報で、アプリケーション0110〜性能情報取得部0313〜性能情報送出部0314〜性能情報取得部0322〜性能情報記憶部0332の経路で取得し格納される。
図10は、ストレージリソースにおける性能値の種別と性能値を表す、リソース性能テーブル1001である。リソース性能テーブル1001は、リソースID1002と、性能指標種別1003と、性能値1004と、データ取得時刻1005とをカラムに持つテーブルである。リソース性能テーブル1001は、情報取得プログラム0301が取得する情報で、各監視対象装置〜性能情報取得部0313〜性能情報送出部0314〜性能情報取得部0322〜性能情報記憶部0332の経路で格納される。
図11は、アプリケーションの業務処理毎に対するシステム要件を表す、業務処理要求性能テーブル1101である。業務処理要求性能テーブル1101は、アプリケーション名1102と、業務処理名1103と、性能指標種別1104と、要求性能1105とをカラムに持つテーブルである。業務処理要求性能テーブル1101は、サーバ情報取得プログラム0113が起動時にアプリケーション0110から業務処理の要求性能を取得する情報で、閾値情報記憶部0333に格納される。
図12は、リソースの業務処理構成区分に応じた性能監視閾値を表す、リソース性能監視閾値テーブル1201である。リソース性能監視閾値テーブル1201は、リソースID1202と、業務処理構成区分1203と、性能指標種別1204と、性能監視閾値1205とをカラムに持つテーブルである。リソース性能監視閾値テーブル1201は、過去における業務処理のシステム要件を満たさなかったことをリソースの性能を監視することにより検出できるような性能監視閾値を、閾値設定部0344が閾値情報記憶部0333を呼び出し格納する。性能監視閾値の決定の詳細については、図19と図21とを用いて後記する。
図13は、リソースのある業務処理構成区分において性能監視閾値の違反を検出した場合に、要求性能を違反している可能性の高い業務処理を表す、リソースの性能監視閾値と業務処理の要求性能違反の関連テーブル1301(以下、関連テーブル1301という。)である。関連テーブル1301は、リソースID1302と、業務処理構成区分1303と、性能指標種別1304と、アプリケーション名1305と、要求性能違反業務処理1306と、違反指標1307と、データ取得時刻1308とをカラムに持つテーブルである。関連テーブル1301は、過去のある時点において、業務処理がシステム要求性能を満たさなかったことを、性能監視閾値によって検出したこと、もしくは、検出可能であったことを、閾値設定部0344が閾値情報記憶部0333を呼び出し格納したものである。
図14は、リソースの業務処理構成区分における業務処理の構成を表す、リソースの業務処理構成区分テーブル1401である。リソースの業務処理構成区分テーブル1401は、リソースID1402と、アプリケーション名1403と、業務処理種別1404と、業務処理種別構成1405と、業務処理構成区分1406とをカラムに持つテーブルである。リソースの業務処理構成区分テーブル1401は、過去のある時点においてリソースを使用していた業務処理の構成を区分し、業務処理構成区分判定部0343が業務処理構成区分情報記憶部0334を呼び出し格納したものである。
図15は、性能監視閾値の設定及び性能監視閾値を用いた性能監視の処理全体をフローチャートで表したものである。本処理は、性能監視プログラム0125が行い、特に性能判定部0341が全体の流れを管理する。
まず、性能判定部0341は業務処理構成区分判定部0343を呼び出し、リソースの業務処理構成区分を取得する。業務処理構成区分判定部0343は、リソースを使用する各業務処理の処理量を取得する(ステップS1501)。ステップS1501では、アプリケーションとリソースの関連テーブル0801から、リソースに関連するアプリケーションを調べる。次に、前記アプリケーションの実行する業務処理を、アプリケーションの業務処理テーブル0401から調べる。前記アプリケーション及びその実行する業務処理の処理量を業務処理性能テーブル0901から取得する。なお、前記したように、処理量とは、業務処理性能テーブル0901の性能指標分類0907におけるスループットや業務サーバ使用量に関する量のことである。
次に、業務処理構成区分判定部0343はステップS1501で取得した業務処理の処理量を用いて、業務処理構成区分判定処理を行い(ステップS1502)、業務処理構成区分を取得し、前記取得した業務処理構成区分を性能判定部0341に渡す。ステップS1502の詳細な手順は、図16を用いて後記する。
性能判定部0341は、ステップS1502にて取得した業務処理構成区分に該当する性能監視閾値を取得する(ステップS1503)。ステップS1503では、情報参照部0342を用い、リソース性能監視閾値テーブル1201から、リソースID及び前記業務処理構成区分が等しい(一致する)性能監視閾値を取得する。
性能判定部0341は、情報参照部0342を用いてリソースの性能値を取得する(ステップS1504)。ステップS1504では、情報参照部0342を用い、リソース性能テーブル1001から、リソースIDが等しいリソースの性能値を取得する。
性能判定部0341は、ステップS1503及びS1504で取得した性能監視閾値及び性能値を用い、リソース閾値判定処理を行う(ステップS1505)。ステップS1505の詳細な手順は、図17を用いて後記する。
ステップS1501〜S1505までの処理をリソース毎に実行する(ステップS1510〜S1511)。
性能判定部0341は、リソースの性能監視閾値によっては検出できなかった業務処理要求性能違反を検出できるように性能監視閾値を設定する、業務処理性能問題未検出判定処理(ステップS1506)を実行する。ステップS1506の詳細な手順は、図20を用いて後記する。性能判定部0341は、ステップS1506の処理を業務処理毎に実行する(ステップS1512,S1513)。
図16は、業務処理構成区分判定部0343がリソースを使用している業務処理の処理量から現在の業務処理構成区分を判定する処理(ステップS1502)を表したものである。業務処理構成区分判定部0343は、ステップS1501で取得した業務処理の処理量から業務処理種別構成を求め、業務処理種別構成から該当する業務処理構成区分を取得する。業務処理構成区分を決定する業務処理種別構成を求める方法としては、各業務処理種別の絶対量によって決定する方法、又は、各業務処理種別の処理量の比率によって決定する方法がある。本実施形態においては、各業務処理種別の処理量の比率を用いている。
業務処理構成区分判定部0343は、情報参照部0342を用い、前記求めた業務処理種別構成と同一の業務処理種別構成が、リソースの業務処理構成区分テーブル1401に定義されているかを調べる(ステップS1601)。ステップS1601で、同一の業務処理種別構成が定義されていた場合(Yes)には、リソースの業務処理構成区分テーブル1401の該当する業務処理構成区分1406を業務処理構成区分判定処理(ステップS1502)の戻り値とする(ステップS1602)。
ステップS1601において、同一の業務処理種別構成が定義されていなかった場合(No)には、業務処理構成区分判定部0343は、リソースの業務処理構成区分テーブル1401に、前記求めた業務処理種別構成とそれに対応する業務処理構成区分を新規に定義する(ステップS1603)。
ステップS1603において、ステップS1603で新規に定義した業務処理構成区分を業務処理構成区分判定処理(ステップS1502)の戻り値とする(ステップS1604)。
ステップS1602またはS1604で戻り値とした業務処理構成区分を、性能判定部0341に戻り値として返し、業務処理構成区分判定処理(ステップS1502)を終了する。
図17は、リソースの性能を現在の業務処理構成区分の閾値と比較することにより、管理クライアント0106へ通知するか、または性能監視閾値を緩和するかを判定する、リソース閾値判定処理(ステップS1505)を表したものである。
性能判定部0341は、ステップS1503及びS1504で取得したリソースの性能値及び性能監視閾値を比較し、リソースの性能が性能監視閾値を満たしているか判定する(ステップS1701)。
性能判定部0341は、ステップS1701においてリソースの性能が性能監視閾値を満たしている場合(Yes)には、事前アラート判定処理(ステップS1702)を行う。事前アラート判定処理(ステップS1702)の詳細な手順は、図18を用いて後記する。
ステップS1701でリソースの性能が性能監視閾値を満たしていない場合(No)は、リソースを使用する業務処理の要求性能を取得する(ステップS1703)。ステップS1703において、性能判定部0341は、ステップS1501で調べたリソースを使用する業務処理の要求性能を、情報参照部0342を用いて業務処理要求性能テーブル1101から取得する。
性能判定部0341は、ステップS1703で要求性能を取得した業務処理、且つステップS1703で取得した要求性能と同一の性能指標種別の性能値を、情報参照部0342を用いて業務処理性能テーブル0901から取得する(ステップS1704)。
性能判定部0341は、ステップS1703及びS1704で取得した要求性能及び性能値を比較し、業務処理の性能が要求性能を満たしているか判定する(ステップS1705)。
ステップS1705で、全ての業務処理において性能値が要求性能を満たしている場合(Yes)には、性能判定部0341は、ステップS1703及びS1704で取得した要求性能及び性能値を比較し、全ての業務処理の性能がそれぞれの要求性能を余裕幅を持って満たしているか判定する(ステップS1706)。ここで、余裕幅を持って満たしているとは、例えば、性能値が要求性能を要求性能の30%分の余裕を持って満たしていること、あるいは、性能値及び要求性能の性能指標が応答時間であれば性能値が要求性能を2ミリ秒分の余裕をもって満たしていること、などを表す。
ステップS1706において、全ての業務処理の性能がそれぞれの要求性能を余裕幅をもって満たしていた場合(Yes)には、性能判定部0341は閾値設定部0344を用いて性能監視閾値の緩和処理(ステップS1707)を行い、性能監視閾値を緩和する。性能監視閾値の緩和処理(ステップS1707)の詳細な手順は、図19を用いて後記する。
ステップS1705において、性能値が要求性能を満たしていない業務処理が一つでもあった場合(No)には、その業務処理を記録する(ステップS1708)。ステップS1708において、性能判定部0341は閾値設定部0344を用いて、関連テーブル1301に、性能監視閾値を満たしていないリソースと要求性能を違反している業務処理を関連付けて格納する。
ステップS1708の後、性能判定部0341は、クライアント通知部0345を呼び出し、管理クライアント0106へ問題発生アラートを発行する(ステップS1709)。ステップS1709において、クライアント通知部0345は、性能監視閾値を違反しているリソースと、要求性能を違反しているまたは要求性能に対し性能に余裕幅がない業務処理とを通知する。
図18は、事前アラート判定処理(ステップS1702)を表しており、性能問題が起こりうるか判定し、問題が起こりうる場合にはクライアント通知部0345を呼び出すことで管理クライアント0106へ通知する。まず、ステップS1503及びS1504で取得したリソースの性能値及び性能監視閾値を用いて、リソースの性能値が性能監視閾値を余裕幅を持って満たしているか判定する(ステップS1801)。ここで、余裕幅を持って満たしているとは、例えば、性能値が性能監視閾値を性能監視閾値の30%分の余裕を持って満たしていること、あるいは、性能値及び性能監視閾値の性能指標が応答性能であれば性能値が要求性能を2ミリ秒分の余裕をもって満たしていること、などを表す。
ステップS1801において満たしていると判定した場合(Yes)には、事前アラート判定処理(ステップS1702)を終了する。
ステップS1801において満たしていないと判定した場合(No)には、ステップS1801で満たしていないと判定した性能監視閾値及び業務処理構成区分によって、過去において要求性能違反を検出できた業務処理を取得する(ステップS1802)。ステップS1802は、リソースIDと、業務処理構成区分と、ステップS1801で満たしていなかった性能監視閾値の指標種別とが同一のレコードを、関連テーブル1301から検索し、要求性能違反業務処理と違反指標とを取得する。
ステップS1802で取得した要求性能違反業務処理と違反指標とを、管理クライアント0106へ問題予告アラートで通知する(ステップS1803)。ステップS1803は、クライアント通知部0345を用いて管理クライアント0106へ通知する。
図19は、性能監視閾値の条件を緩和することにより、業務処理の性能が要求性能を下回っていない場合に、リソースの性能値及び性能監視閾値から性能問題が発生したと判断(余剰検出)することを減らし、性能監視閾値の精度を高めるための処理(ステップS1707)である。
まず、現在の性能監視閾値を用いてリソースの性能を監視することで、リソースを使用する業務処理が要求性能を満たさなかったことを検出できる過去の業務処理の要求性能違反、及び余剰検出した件数を調べる(ステップS1901)。ステップS1901では、性能判定部0341は、まず情報参照部0342を用いて、リソース性能テーブル1001から、リソースIDが等しいリソースの性能値をある期間分取得する。
また、性能判定部0341は、業務処理性能テーブル0901から、情報参照部0342を用いて、ステップS1703で要求性能を取得した業務処理、且つステップS1703で取得した要求性能と同一の性能指標種別の性能値をある期間分取得する。ここで、前記のある期間分とは、閾値の緩和処理において過去の性能情報を考慮する期間を表しており、例えば1週間とすると、過去1週間分のリソース及び業務処理の性能を閾値の決定において考慮することを表す。次に、前記取得した業務処理の性能と要求性能を比較する。業務処理の性能が要求性能を満たしていた場合は、問題がなかったと判定し、業務処理の性能が要求性能を満たしていなかった場合には、問題があったと判定する。
また、リソースの性能も性能閾値と比較し、性能が性能閾値を満たしていた場合は、問題がなかったと判定し、満たしていなかった場合には、問題があったと判定する。ある時点において、リソースを使用する業務処理の一つ又は複数で問題があり、リソースでも問題があったと判定した場合は、業務処理の要求性能違反を検出したとする。また、リソースを使用する全ての業務処理で問題がないが、リソースで問題があったと判定した場合は、余剰検出したとする。上記、性能要求違反の検出と余剰検出をある期間にわたり調べ、それぞれの合計を求め、それぞれを性能要求違反検出の件数と、余剰検出の件数と定義する。
現在の閾値と比べ、ステップS1901で求めた検出可能な過去の業務処理の要求性能違反の件数が変わらない、且つ、余剰検出の件数が最も少なくなる性能監視閾値の範囲を調べる(ステップS1902)。ステップS1902は、下記(A)における性能監視閾値を変更して下記(A)から(C)を繰り返し、性能要求違反検出の件数がステップS1901で調べた件数と等しく、余剰検出の件数が最も少なくなる性能監視閾値の範囲を調べる。
(A)現在の性能監視閾値の条件を緩める方向に変更し、ステップS1901と同様にして性能要求違反検出の件数と余剰検出の件数とを調べる。
(B)上記Aにおいて調べた性能要求違反検出の件数がステップS1901で調べた性能要求違反検出の件数と同一であるか比較する。
(C)Bで同一であった場合には、Aにおいて調べた余剰検出の件数がステップS1901で調べた余剰検出の件数より少ないか比較し、同じもしくは少なかった場合にAで設定した性能監視閾値を性能監視閾値の範囲とする。
ステップS1902で調べた性能監視閾値の範囲の中で最も条件が緩い値を新しい性能監視閾値とする(ステップS1903)。ステップS1903は、ステップS1902で求めた性能監視閾値の範囲の中で最も条件が緩い値を用いて、リソース性能監視閾値テーブル1201のリソースIDと、業務処理構成区分と、性能指標種別とが等しいレコードの性能監視閾値1205を上書きする。性能監視閾値の範囲がなかった場合には性能監視閾値を変更しない。
図20は、リソースの性能監視によって検出できなかった、業務処理が要求性能を満たさなかったことを判定して、リソースの性能監視閾値の条件を強化することにより検出できるようにする処理(ステップS1506)である。
性能判定部0341は、情報参照部0342を用いて、業務処理要求性能テーブル1101から要求性能を取得する(ステップS2001)。
性能判定部0341は、情報参照部0342を用いて、業務処理性能テーブル0901から直近の業務処理の性能値を取得する(ステップS2002)。
性能判定部0341は、ステップS2001及びS2002で取得した業務処理の要求性能及び性能値から、業務処理の性能が要求性能を満たしているか判定する(ステップS2003)。
ステップS2003において、業務処理の性能が要求性能を満たしている場合(Yes)には、業務処理性能問題未検出判定処理(ステップS1506)を終了する。
ステップS2003において、業務処理の性能が要求性能を満たしていないと判定した場合(No)には、性能判定部0341は、関連テーブル1301に記録されているかを調べる(ステップS2004)。ステップS2004は、情報参照部0342を用いて、ステップS2002で取得したアプリケーション名と、業務処理名と、性能指標種別と、データ取得時刻とが、関連テーブル1301において、アプリケーション名1305と、要求性能違反業務処理1306と、違反指標1307と、データ取得時刻1308との各カラムの情報に一致するレコードがあるかを調べる。
ステップS2004において、前記一致するレコードがなかった場合(Yes)には、閾値の強化処理を行う(ステップS2005)。ステップS2005の詳細な手順については、図21を用いて後記する。
ステップS2004において、前記一致するレコードがあった場合(No)には、業務処理性能問題未検出判定処理(ステップS1506)を終了する。
図21は、検出できなかった業務処理の要求性能違反を検出できたように、リソースの性能監視閾値を設定する、閾値設定部0344が実行する処理(ステップS2005)を表している。
まず、検出できなかった業務処理の要求性能違反を検出可能な、リソース及びその性能種別を調べる(ステップS2101)。例えば、ステップS2101は、要求性能を違反した性能指標種別の性能と、業務処理の使用するリソースの性能との最も相関の高いものを、業務処理性能問題を検出可能なリソース及び性能指標種別とする。
ステップS2101で選択した、リソース及びその性能指標種別において、検出できなかった業務処理性能問題を検出可能で、且つ、余剰検出数が最も少なくなる性能監視閾値の範囲を調べる(ステップS2102)。ステップS2102は、下記(D)における性能監視閾値を変更してから下記(D)と(E)を繰り返し、余剰検出の件数が最も少なくなる性能監視閾値の範囲を調べる。
(D)性能監視閾値について、前記検出できなかった業務処理の要求性能違反を検出できるか調べる。検出できなかった場合には、性能監視閾値を条件が厳しくなるように変更し、再びステップ(D)を行う。
(E)上記ステップ(D)において、前記検出できなかった業務処理を検出できた性能監視閾値に対して、余剰検出の件数を求める。余剰検出の件数が最小の性能監視閾値を性能監視閾値の範囲とする。
ステップS2102で調べた性能監視閾値の範囲の中で、最も条件を満たすことが難しい値を閾値候補とする(ステップS2103)。
閾値設定部0344は、選択した閾値候補のリソース及び性能指標種別が、業務処理の要求性能違反が検出できなかった際の業務処理構成区分において既に設定されているかを調べる(ステップS2104)。ステップS2104において閾値設定部0344は、情報参照部0342を用いて、ステップS2103において選択した閾値候補のリソースの業務処理構成区分を取得する。閾値設定部0344は、情報参照部0342を用いて、前記取得した業務処理構成区分と、ステップS2103において閾値候補としたリソースと、閾値候補の性能指標種別とが同一のレコードがリソース性能監視閾値テーブル1201に格納されているかを調べる。
ステップS2104において、既にリソース性能監視閾値テーブル1201に格納されている場合(Yes)には、閾値設定部0344は、リソース性能監視閾値テーブル1201に格納されているその性能監視閾値を閾値候補で更新する(ステップS2105)。
ステップS2104においてリソース性能監視閾値テーブル1201に格納されていない場合(No)には、閾値設定部0344は、リソース性能監視閾値テーブル1201に閾値候補を性能監視閾値として格納(追加)する(ステップS2106)。
ステップS2105またはステップS2106の後、閾値設定部0344は、関連テーブル1301に、ステップS2105またはS2106で設定した性能監視閾値と要求性能違反をした業務処理とを関連付けて格納する、つまり、問題が発生した業務処理を記録する(ステップS2107)。
このように、本実施形態のストレージシステムSによれば、実行中の業務処理に応じて、SAN環境下におけるストレージリソースに対して性能監視閾値の設定及び性能の監視を適切に実現することができる。つまり、論理ボリューム0121に関する性能監視閾値を適切に強化したり緩和したりすることで、業務サーバ0102とストレージ装置0104との間で、論理ボリューム0121に関する性能監視の結果についての整合がとれるようになる。
以上で実施形態の説明を終えるが、本発明の態様はこれらに限定されるものではない。
例えば、論理ボリューム0121を共有する業務処理は、2つではなく3つ以上であってもよい。
その他、ハードウェア、プログラムなどの具体的な構成について、本発明の主旨を逸脱しない範囲で適宜変更が可能である。
本発明の基本概念を示す図である。 本実施形態のストレージシステムの全体構成を示す図である。 本実施形態のプログラムのモジュールを示す図である。 本実施形態におけるアプリケーションの業務処理テーブルを示す図である。 本実施形態におけるアプリケーションとデバイスファイルの関連テーブルを示す図である。 本実施形態におけるデバイスファイルと(WWN,LUN)の関連テーブルを示す図である。 本実施形態における論理ボリュームと(WWN,LUN)の関連テーブルを示す図である。 本実施形態におけるアプリケーションとリソースの関連テーブルを示す図である。 本実施形態における業務処理性能テーブルを示す図である。 本実施形態におけるリソース性能テーブルを示す図である。 本実施形態における業務処理要求性能テーブルを示す図である。 本実施形態におけるリソース性能監視閾値テーブルを示す図である。 本実施形態におけるリソースの性能監視閾値と業務処理の要求性能違反の関連テーブルを示す図である。 本実施形態におけるリソースの業務処理構成区分テーブルを示す図である。 本実施形態における性能判定処理を示すフローチャートである。 本実施形態における業務処理構成区分判定処理を示すフローチャートである。 本実施形態におけるリソース閾値判定処理を示すフローチャートである。 本実施形態における事前アラート処理を示すフローチャートである。 本実施形態における性能監視閾値の緩和処理を示すフローチャートである。 本実施形態における業務処理性能問題未検出判定処理を示すフローチャートである。 本実施形態における閾値の強化処理を示すフローチャートである。 本発明において性能監視閾値を設定し直す場合の説明図である。 本発明において性能監視結果の例を時系列で表した図である。
符号の説明
0102 業務サーバ
0103 SAN
0104 ストレージ装置
0105 管理サーバ
0106 管理クライアント
0121 論理ボリューム
0313 性能情報取得部(性能情報収集部)
0322 性能情報取得部(性能情報収集部)
0332 性能情報記憶部
0333 閾値情報記憶部
0341 性能判定部
0343 業務処理構成区分判定部(構成区分判定部)
0344 閾値設定部
S ストレージシステム(ストレージ管理システム)

Claims (20)

  1. 業務処理を実行するホスト計算機と、
    前記業務処理の実行時に使用される記憶領域を提供するストレージ装置と、
    前記ホスト計算機と前記ストレージ装置との間のデータ通信に利用されるストレージネットワークと、
    前記ホスト計算機と前記ストレージ装置とに接続された管理サーバと、を備えて構成されるストレージ管理システムであって、
    前記管理サーバは、
    前記業務処理に関するスループットまたはレスポンスタイムに基づく性能値に関係する前記ストレージ装置及び前記ストレージネットワークにおける性能情報収集対象であるストレージ資源に関する現在の性能値を収集する性能情報収集部と、
    前記ストレージ資源を共用している複数の前記業務処理の処理量に基づいて、複数の前記業務処理の構成比率に対応する構成区分を判定する構成区分判定部と、
    1つ以上の前記ストレージ資源に対して、前記構成区分に応じて前記性能値の閾値を性能監視閾値として記憶する閾値情報記憶部と、
    前記性能情報収集部が収集した前記現在の性能値、及び、前記構成区分判定部が判定した現在の構成区分に対応して前記閾値情報記憶部から読み出した前記性能監視閾値に基づいて、前記ストレージ資源の性能判定を行う性能判定部と、を備える
    ことを特徴とするストレージ管理システム。
  2. 前記性能判定部は、
    前記現在の性能値が、前記構成区分判定部が判定した現在の構成区分に対応した前記性能監視閾値を満たしていない場合であっても、
    前記ストレージ資源を共用する各前記業務処理の性能値が、前記業務処理について予め設定された要求性能値をそれぞれ所定の余裕幅を持って満たしているときには、性能問題が発生していないと判定する
    ことを特徴とする請求項1に記載のストレージ管理システム。
  3. 前記性能判定部は、
    前記要求性能値の絶対量又は前記要求性能値の比率に基づいて、前記所定の余裕幅を決定する
    ことを特徴とする請求項2に記載のストレージ管理システム。
  4. 前記構成区分判定部は、
    複数の前記業務処理の処理量の絶対量に基づいて前記構成区分を判定する
    ことを特徴とする請求項1に記載のストレージ管理システム。
  5. 前記構成区分判定部は、
    複数の前記業務処理の処理量の比率に基づいて前記構成区分を判定する
    ことを特徴とする請求項1に記載のストレージ管理システム。
  6. 前記性能判定部は
    前記現在の性能値が、前記構成区分判定部が判定した現在の構成区分に対応した前記性能監視閾値を所定の余裕幅を持って満たしていない場合には、性能問題が発生する可能性があることを、前記管理サーバに接続された管理クライアントに通知する
    ことを特徴とする請求項1に記載のストレージ管理システム。
  7. 前記閾値情報記憶部は、前記業務処理について予め設定された要求性能値を過去に満たさなかったことと、前記満たさなかったことを検出可能な前記構成区分に対応した前記性能監視閾値と、を組み合わせて記憶しており、
    前記性能判定部は、
    性能問題が発生する可能性があることを前記管理クライアントに通知する際に、
    前記閾値情報記憶部を検索して、前記構成区分及び前記性能監視閾値が同じで過去に性能問題が起きた業務処理をあわせて通知する
    ことを特徴とする請求項6に記載のストレージ管理システム。
  8. 前記性能判定部は
    前記性能監視閾値の絶対量又は前記性能監視閾値の比率に基づいて、前記所定の余裕幅を決定する
    ことを特徴とする請求項6に記載のストレージ管理システム。
  9. 前記管理サーバは、前記ストレージ資源に対して前記構成区分に対応した性能監視閾値を設定する閾値設定部を、さらに備え、
    前記閾値設定部は、前記性能情報収集部の収集した性能値と、前記ストレージ資源を使用する前記業務処理の予め設定された要求性能値と、に基づいて前記ストレージ資源の性能監視閾値を設定する
    ことを特徴とする請求項1に記載のストレージ管理システム。
  10. 前記閾値設定部は、
    前記ストレージ資源を使用する前記業務処理の前記性能値が前記要求性能値を満足しない場合に、前記性能判定部が前記ストレージ資源の性能の不足していることを検出しないときに、前記満足しなかった時点で前記閾値情報記憶部の前記性能監視閾値を強く設定し直し、
    前記ストレージ資源を使用する前記業務処理の前記性能値が前記要求性能値を満足している場合に、前記性能判定部が前記ストレージ資源の性能の不足していることを検出するときに、前記満足している時点で前記閾値情報記憶部の前記性能監視閾値を緩く設定し直す
    ことを特徴とする請求項9に記載のストレージ管理システム。
  11. 前記閾値設定部は、
    前記閾値情報記憶部の前記性能監視閾値を強く設定し直す際に、前記満足しない時点での前記ストレージ資源の性能値を前記性能監視閾値とし、
    前記閾値情報記憶部の前記性能監視資源の閾値を緩く設定し直す際に、前記満足している時点での前記ストレージ資源の性能値を前記性能監視閾値とする
    ことを特徴とする請求項10に記載のストレージ管理システム。
  12. 前記管理サーバは、前記性能情報収集部が収集した性能値を記憶する性能情報記憶部を、さらに備え、
    前記閾値設定部は、
    前記性能情報記憶部が記憶する性能情報及び前記要求性能値に基づいて、過去において前記業務処理が性能要件を満たさなかったこと全てを前記ストレージ資源の性能から検出できるように前記閾値情報記憶部の前記性能監視閾値を設定し直す
    ことを特徴とする請求項9に記載のストレージ管理システム。
  13. 業務処理を実行するホスト計算機と、
    前記業務処理の実行時に使用される記憶領域を提供するストレージ装置と、
    前記ホスト計算機と前記ストレージ装置との間のデータ通信に利用されるストレージネットワークと、
    前記ホスト計算機と前記ストレージ装置とに接続され、前記業務処理に関するスループットまたはレスポンスタイムに基づく性能値に関係する前記ストレージ装置及び前記ストレージネットワークにおける性能情報収集対象である1つ以上の前記ストレージ資源を共用している複数の前記業務処理の構成比率に対応する構成区分に応じて前記性能値の閾値を性能監視閾値として記憶している閾値情報記憶部を有する管理サーバと、
    を備えて構成されるストレージ管理システムによる性能監視方法であって、
    前記管理サーバにおいて、
    性能情報収集部が、前記ストレージ資源に関する現在の性能値を収集し、
    構成区分判定部が、前記ストレージ資源を共用している複数の前記業務処理の処理量に基づいて、複数の前記業務処理の現在の構成区分を判定し、
    性能判定部が、前記性能情報収集部が収集した前記現在の性能値、及び、前記構成区分判定部が判定した前記現在の構成区分に対応して前記閾値情報記憶部から読み出した前記性能監視閾値、に基づいて、前記ストレージ資源の性能判定を行う
    ことを特徴とする性能監視方法。
  14. 前記性能判定部は、
    前記現在の性能値が、前記構成区分判定部が判定した現在の構成区分に対応した前記性能監視閾値を満たしていない場合であっても、
    前記ストレージ資源を共用する各前記業務処理の性能値が、前記業務処理について予め設定された要求性能値をそれぞれ所定の余裕幅を持って満たしているときには、性能問題が発生していないと判定する
    ことを特徴とする請求項13に記載の性能監視方法。
  15. 前記性能判定部は、
    前記要求性能値の絶対量又は前記要求性能値の比率に基づいて、前記所定の余裕幅を決定する
    ことを特徴とする請求項14に記載の性能監視方法。
  16. 前記構成区分判定部は、
    複数の前記業務処理の処理量の絶対量に基づいて前記構成区分を判定する
    ことを特徴とする請求項13に記載の性能監視方法。
  17. 業務処理を実行するホスト計算機と、
    前記業務処理の実行時に使用される記憶領域を提供するストレージ装置と、
    前記ホスト計算機と前記ストレージ装置との間のデータ通信に利用されるストレージネットワークと、
    前記ホスト計算機と前記ストレージ装置とに接続された管理サーバと、
    を備えて構成されるストレージ管理システムにおける管理サーバであって、
    前記管理サーバは、
    前記業務処理に関するスループットまたはレスポンスタイムに基づく性能値に関係する前記ストレージ装置及び前記ストレージネットワークにおける性能情報収集対象であるストレージ資源に関する現在の性能値を収集する性能情報収集部と、
    前記ストレージ資源を共用している複数の前記業務処理の処理量に基づいて、複数の前記業務処理の構成比率に対応する構成区分を判定する構成区分判定部と、
    1つ以上の前記ストレージ資源に対して、前記構成区分に応じて前記性能値の閾値を性能監視閾値として記憶する閾値情報記憶部と、
    前記性能情報収集部が収集した前記現在の性能値、及び、前記構成区分判定部が判定した現在の構成区分に対応して前記閾値情報記憶部から読み出した前記性能監視閾値、に基づいて、前記ストレージ資源の性能判定を行う性能判定部と、を備える
    ことを特徴とする管理サーバ。
  18. 前記性能判定部は、
    前記現在の性能値が、前記構成区分判定部が判定した現在の構成区分に対応した前記性能監視閾値を満たしていない場合であっても、
    前記ストレージ資源を共用する各前記業務処理の性能値が、前記業務処理について予め設定された要求性能値をそれぞれ所定の余裕幅を持って満たしているときには、性能問題が発生していないと判定する
    ことを特徴とする請求項17に記載の管理サーバ。
  19. 前記性能判定部は、
    前記要求性能値の絶対量又は前記要求性能値の比率に基づいて、前記所定の余裕幅を決定する
    ことを特徴とする請求項18に記載の管理サーバ。
  20. 前記構成区分判定部は、
    複数の前記業務処理の処理量の絶対量に基づいて前記構成区分を判定する
    ことを特徴とする請求項17に記載の管理サーバ。
JP2007302472A 2007-11-22 2007-11-22 ストレージ管理システム、性能監視方法及び管理サーバ Withdrawn JP2009129134A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2007302472A JP2009129134A (ja) 2007-11-22 2007-11-22 ストレージ管理システム、性能監視方法及び管理サーバ
US12/020,925 US20090138884A1 (en) 2007-11-22 2008-01-28 Storage management system, a method of monitoring performance and a management server

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007302472A JP2009129134A (ja) 2007-11-22 2007-11-22 ストレージ管理システム、性能監視方法及び管理サーバ

Publications (1)

Publication Number Publication Date
JP2009129134A true JP2009129134A (ja) 2009-06-11

Family

ID=40670858

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007302472A Withdrawn JP2009129134A (ja) 2007-11-22 2007-11-22 ストレージ管理システム、性能監視方法及び管理サーバ

Country Status (2)

Country Link
US (1) US20090138884A1 (ja)
JP (1) JP2009129134A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012043407A (ja) * 2010-08-20 2012-03-01 Hitachi Ltd 疎結合複数ストレージ環境のための階層式ストレージプール管理及び制御
WO2012032658A1 (ja) * 2010-09-10 2012-03-15 株式会社日立製作所 計算機システムに対する処理のタスクでありユーザ操作に基づくタスクを管理するシステム、及び、その種のタスクに関する情報を表示する方法
JP2016511463A (ja) * 2013-02-28 2016-04-14 株式会社日立製作所 動的ストレージサービスレベル・モニタリングの管理システムおよび方法
WO2017068623A1 (ja) * 2015-10-19 2017-04-27 株式会社日立製作所 管理計算機及び閾値設定方法

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010072854A (ja) * 2008-09-17 2010-04-02 Canon Inc 情報処理装置の支援装置、支援方法、およびコンピュータプログラム
US8090833B2 (en) * 2009-08-31 2012-01-03 Red Hat, Inc. Systems and methods for abstracting storage views in a network of computing systems
US8458719B2 (en) * 2009-12-17 2013-06-04 International Business Machines Corporation Storage management in a data processing system
US8990732B2 (en) * 2010-05-14 2015-03-24 Sap Se Value interval selection on multi-touch devices
US20120297216A1 (en) * 2011-05-19 2012-11-22 International Business Machines Corporation Dynamically selecting active polling or timed waits
WO2013171807A1 (en) * 2012-05-18 2013-11-21 Hitachi, Ltd. Management system and management method
JP6168635B2 (ja) * 2014-03-28 2017-07-26 株式会社日立製作所 データベース管理システム、計算機、データベース管理方法
WO2017151710A1 (en) 2016-03-01 2017-09-08 The Procter & Gamble Company Diaper adapted for collection of uncontaminated and intact stool sample from an infant
US11134925B2 (en) 2016-03-01 2021-10-05 The Procter & Gamble Company Diaper adapted for collection of urine sample from an infant
US11246571B2 (en) 2017-06-27 2022-02-15 The Procter & Gamble Company Configurable absorbent articles having improved bodily exudate separation and sampling
US11135104B2 (en) 2017-06-27 2021-10-05 The Procter & Gamble Company Diaper product adapted for collection of exudate sample from an infant

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6505248B1 (en) * 1999-03-24 2003-01-07 Gte Data Services Incorporated Method and system for monitoring and dynamically reporting a status of a remote server
JP2001337790A (ja) * 2000-05-24 2001-12-07 Hitachi Ltd 記憶システム及びその階層管理制御方法
US7886031B1 (en) * 2002-06-04 2011-02-08 Symantec Operating Corporation SAN configuration utility
US7496661B1 (en) * 2004-03-29 2009-02-24 Packeteer, Inc. Adaptive, application-aware selection of differentiated network services
US7499994B2 (en) * 2004-03-30 2009-03-03 Emc Corporation System and method of providing performance information for a communications network
US20060095907A1 (en) * 2004-10-29 2006-05-04 International Business Machines Corporation Apparatus and method for autonomic problem isolation for a software application
US7703094B2 (en) * 2004-12-30 2010-04-20 Intel Corporation Adaptive and dynamic filtering of threaded programs
US8086708B2 (en) * 2005-06-07 2011-12-27 International Business Machines Corporation Automated and adaptive threshold setting
US8037365B2 (en) * 2009-11-03 2011-10-11 International Busniss Machines coporation System and method for automated and adaptive threshold setting to separately control false positive and false negative performance prediction errors

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012043407A (ja) * 2010-08-20 2012-03-01 Hitachi Ltd 疎結合複数ストレージ環境のための階層式ストレージプール管理及び制御
US9286200B2 (en) 2010-08-20 2016-03-15 Hitachi, Ltd. Tiered storage pool management and control for loosely coupled multiple storage environment
WO2012032658A1 (ja) * 2010-09-10 2012-03-15 株式会社日立製作所 計算機システムに対する処理のタスクでありユーザ操作に基づくタスクを管理するシステム、及び、その種のタスクに関する情報を表示する方法
JP5400226B2 (ja) * 2010-09-10 2014-01-29 株式会社日立製作所 計算機システムに対する処理のタスクでありユーザ操作に基づくタスクを管理するシステム、及び、その種のタスクに関する情報を表示する方法
US9286246B2 (en) 2010-09-10 2016-03-15 Hitachi, Ltd. System for managing task that is for processing to computer system and that is based on user operation and method for displaying information related to task of that type
JP2016511463A (ja) * 2013-02-28 2016-04-14 株式会社日立製作所 動的ストレージサービスレベル・モニタリングの管理システムおよび方法
WO2017068623A1 (ja) * 2015-10-19 2017-04-27 株式会社日立製作所 管理計算機及び閾値設定方法

Also Published As

Publication number Publication date
US20090138884A1 (en) 2009-05-28

Similar Documents

Publication Publication Date Title
JP2009129134A (ja) ストレージ管理システム、性能監視方法及び管理サーバ
US9672085B2 (en) Adaptive fault diagnosis
US9503517B1 (en) Data volume placement techniques
US9246996B1 (en) Data volume placement techniques
US9823840B1 (en) Data volume placement techniques
JP4560367B2 (ja) ストレージネットワーク性能情報の収集・保存方法及び計算機システム並びにプログラム
US7502971B2 (en) Determining a recurrent problem of a computer resource using signatures
US8171060B2 (en) Storage system and method for operating storage system
US9804993B1 (en) Data volume placement techniques
US10698605B2 (en) Multipath storage device based on multi-dimensional health diagnosis
US20060179220A1 (en) Method and apparatus for adjusting performance of logical volume copy destination
US20080195369A1 (en) Diagnostic system and method
US8527238B2 (en) Storage input/output utilization associated with a software application
JP2005157933A (ja) ストレージネットワークの性能情報を収集する方法およびプログラム
US9348685B2 (en) Intermediate database management layer
Tang et al. Recommending resolutions for problems identified by monitoring
US10402298B2 (en) System and method for comprehensive performance and availability tracking using passive monitoring and intelligent synthetic transaction generation in a transaction processing system
US20030014507A1 (en) Method and system for providing performance analysis for clusters
Vazhkudai et al. GUIDE: a scalable information directory service to collect, federate, and analyze logs for operational insights into a leadership HPC facility
US11663094B2 (en) Reducing recovery time of an application
US7962692B2 (en) Method and system for managing performance data
JP5779548B2 (ja) 情報処理システム運用管理装置、運用管理方法及び運用管理プログラム
US11392442B1 (en) Storage array error mitigation
CN116414661B (zh) 分布式存储的固态硬盘处理方法和装置
US8103685B1 (en) Methods and apparatus for capturing last discovery time of managed objects

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100127

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20110704