JP2009087332A - ダンプ・データを収集する装置、システム、方法およびプログラム - Google Patents

ダンプ・データを収集する装置、システム、方法およびプログラム Download PDF

Info

Publication number
JP2009087332A
JP2009087332A JP2008231162A JP2008231162A JP2009087332A JP 2009087332 A JP2009087332 A JP 2009087332A JP 2008231162 A JP2008231162 A JP 2008231162A JP 2008231162 A JP2008231162 A JP 2008231162A JP 2009087332 A JP2009087332 A JP 2009087332A
Authority
JP
Japan
Prior art keywords
dump
data
odd
buffer space
scan
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008231162A
Other languages
English (en)
Other versions
JP5224982B2 (ja
Inventor
David Hatfield Brian
ブライアン・デーヴィッド・ハットフィールド
Ii Ivan Ronald Olguin
イヴァン・ロナルド・オルギン・セカンド
Griswold Sherman William
ウイリアム・グリスウォルド・シャーマン
William Dewey Douglas
ダグラス・ウイリアム・デウェイ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2009087332A publication Critical patent/JP2009087332A/ja
Application granted granted Critical
Publication of JP5224982B2 publication Critical patent/JP5224982B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0778Dumping, i.e. gathering error/state information after a fault for later diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0727Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a storage system, e.g. in a DASD or network based storage system

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Debugging And Monitoring (AREA)

Abstract

【課題】ダンプ・データを収集する装置、システム、方法およびプログラムを提供すること。
【解決手段】ダンプ・データを収集する装置100は、オンデマンド・データ(ODD)ダンプ・リクエストを受取り、1個もしくはそれ以上の走査ループを休止し、ダンプ・データをODDダンプ・バッファ空間260に転送し、前記走査ループを休止解除し、かつ前記ODDダンプ・バッファ空間260からストレージにダンプ・データをオフロードするように構成される。この装置はまたODDダンプ・バッファ空間260に転送するためにダンプ・データを優先順序付けし、前記ODDダンプ・バッファ空間260に転送するためダンプ・データをロード・バランスし、前記ODDダンプ・バッファ空間260から不揮発性ストレージへのダンプ・データのオフロードをスケジュールするように構成してもよい。
【選択図】図1

Description

本発明はデータ回復のためのシステム、装置および方法に関し、特にダンプ・データを収集するシステム、装置および方法に関する。
ダンプ・データは処理エラーもしくは故障のときにディジタル・システム(ストレージ・コントローラなど)の揮発性メモリに配置されるデータを多くの場合に含む。ダンプ・データはディジタル・システムのパフォーマンスを評価(アセス)するときに貴重である。ダンプ・データはディジタル・システムの1個もしくはそれ以上のハードウエアおよび/もしくはソフトウエアのコンポーネントのパフォーマンスと直接関連付けられてもよい。ダンプ・データの値はクリアだが、ダンプ・データを収集する今日の解決策は幾つかの欠点を含む。
例えば、多くのダンプ・データ収集策はウォームスタートと一般に呼ばれるディジタル・システムを不適切に再スタートすることを含む。ウォームスタートはダンプ・データを収集するには効率的である。なぜならウォームスタートは揮発性のメモリ・データを収集することができる前にそれが変えられてしまわないよう確保するためにイベント・ループもしくはワーク・ディスパッチャとも呼ばれる走査ループの動作を中断する( suspend)からである。時間を必要とすることに加えて、ディジタル装置をウォームスタートすると、ストレージ・コントローラのビジー信号が多くの場合はその関連するホスト・コンピュータに伝送されてシステム動作を中断する結果となる。システム動作を中断するというのは複数のホスト・コンピュータ、ストレージ・コントローラおよびストレージ装置を含むシステムではもっと厳しいことになる。
本発明は今日の技術水準に応じて開発された。特に現在利用できる故障データ収集策によって完全に解決されてはいない従来技術のニーズおよび課題に応じて開発された。従って、本発明はダンプ・データを収集するための装置、システムおよび方法を提供するために開発された。
本発明の一つの側面では、ダンプ・データ収集システムがストレージ・コントローラと通信する1個もしくはそれ以上のホスト・コンピュータを含む。各ストレージ・コントローラはオンデマンド・データ(ODD)ダンプ・リクエストを受け取り、1個もしくはそれ以上のストレージ・コントローラ走査ループを休止し、ODDダンプ・バッファ空間にダンプ・データを転送し、その走査ループを休止解除し(unpause)、そしてそのODDダンプ空間からストレージ装置へのダンプ・データをオフロードしてもよい。
本発明の他の側面では、ダンプ・データ収集装置が、オンデマンド・データ(ODD)ダンプ・リクエストを受取る通信モジュールと、ODDダンプ・リクエストに応答して1個もしくはそれ以上の走査ループを休止させる走査ループ管理モジュールと、ODDダンプ・バッファ空間にダンプ・データを転送するダンプ・データ転送モジュールとを含むことができる。前記走査ループ管理モジュールは、通常の動作を再開するように前記走査ループを能動化するため走査ループを休止解除することもできる。また前記ダンプ・データ転送モジュールは、ODDダンプ・バッファ空間からストレージにダンプ・データをオフロードすることもできる。
或る実施例では、前記走査ループ管理モジュールは、1個もしくはそれ以上の走査ループを休止し、走査ループ休止タイマーを初期化し、前記走査ループ休止タイマーが時間切れになる前に、残りの走査ループがあればその残りの走査ループを休止しようと試み、そして前記走査ループ休止タイマーが時間切れになる前に全ての走査ループが休止されないなら全ての走査ループを休止解除することもできる。或る実施例では、前記走査ループ管理モジュールは、リセット・タイマーが時間切れになるときに、全ての走査ループを休止するように再度試み、前記走査ループの休止タイマーを再度初期化することもできる。
或る実施例では、前記装置は、ダンプ・データが前記ODDダンプ・バッファ空間に転送される前にダンプ・データの優先順序付けするダンプ・データ優先順序付けモジュールを含むことができる。或る実施例では、前記ダンプ・データ優先順序付けモジュールは、ダンプ・データ優先順序付けを促進するためにリアルタイムで、見込みのダンプ・データ(perspective dump data)を登録しまた登録解除するように更に構成されてもよい。或る実施例では、前記装置は、前記ODDダンプ・バッファ空間の個別の(distinct)セグメントにダンプ・データを同時に転送する複数の処理スレッドの間でロード(負荷)をバランスさせるロード・バランス・モジュールを含む。
或る実施例では、前記ダンプ・データ転送モジュールは、ダンプ・データ転送タイマーが時間切れになるまで前記ODDダンプ・バッファ空間にダンプ・データを転送する。或る実施例では、前記走査ループ管理モジュールは、また不完全なデータのダンプにも係らず、前記走査ループを通常の処理に再始動する。或る実施例では、前記装置は、パフォーマンスを最大化するように前記ODDダンプ・バッファ空間からストレージへの前記ダンプ・データのオフローディングをスケジュールするオフロード・スケジュール・モジュールを含む。
本発明の方法はまたダンプ・データを収集するために提供される。ここに開示される実施例の方法は、前述のシステムおよび装置に関連して前述した機能を実行する必要のある動作を実質的に含む。一実施例では、この方法は、オンデマンド・データ(ODD)ダンプ・リクエストを受け取るステップと、1個もしくはそれ以上の走査ループを休止するステップと、ダンプ・データをODDダンプ・バッファ空間に転送するステップと、前記走査ループを休止解除するステップと、前記ODDダンプ・バッファ空間からストレージにダンプ・データをオフロードするステップとを含む。
更に、本発明の記述された特徴、効果および特性は1個もしくはそれ以上の実施例に任意の適切な態様で組み合わされても良い。当業者は本発明が特定の実施例の1個もしくはそれ以上の特定の特徴および効果を持たずに実施されてもよいことが理解するであろう。他の例において、本発明の全ての実施例には存在しないかもしれない追加的な特徴および効果がある種の実施例に認められてもよい。本発明のこれらの特徴および効果は以下の記述および特許請求の範囲から一層明確になるであろうし、また以下に開示するような本発明の実施によって習得されることもできよう。
この明細書では多くの機能的なユニットをモジュールと名づけているが、これはそれらの実施態様が独立であることを強調するためである。例えば、モジュールは、カスタム仕様(特別注文)のVLSI回路やゲート・アレイ、既製品の半導体、例えば論理チップ、トランジスタ、又は他の個別のコンポーネントを含むハードウエア回路として実施できる。モジュールはフィールド・プログラマブル・ゲート・アレイ、プログラマブル・アレイ論理、プログラマブル論理装置などのプログラム可能なハードウエア装置で実施されてもよい。
モジュールは、いろいろな型のプロセッサによって実行されるソフトウエアで実施されてもよい。実行可能コードからなる識別されたモジュールは、例えば目的、手順、機能として構成される1個若しくはそれ以上の物理的または論理的なブロックであってコンピュータ命令からなるブロックを含むことができる。この識別されたモジュールの実行可能コードは物理的に一緒に位置づけられる必要はなく、異なる離れた箇所に格納された異種の命令を含んでいてもよい。それらの実行可能コードは論理的に互いに結合されるとき、そのモジュールを構成し、その記述した目的を達成する。
実際、実行可能コードからなるモジュールは単一の命令であっても、多数の命令であってもよく、また幾つかの異なるコード・セグメントに亘って、異なるプログラム間に、また幾つかのメモリ装置に亘って分散していてもよい。同様に、操作可能なデータがモジュール中に、ここで明らかにし、また説明するようにして存在し、そして適当な型のデータ構造中に任意の適当な形態で組み込まれ、構成されることが可能である。またその操作可能なデータは、単一のデータ・セットとして集められていても、異なる複数個のストレージ装置を含む異なる箇所に亘って分散していてもよく、少なくとも部分的にシステムやネットワーク上で電子信号としてのみ存在していてもよい。
本明細書中、「一実施例」、「実施例」あるいは同様な用語で言及するものは、その実施例と関連して説明される特定の特徴、構造、特性が本発明の少なくとも一つの実施例に含まれることを意味する。従って、本明細書中の「一実施例に於ける」、「実施例に於ける」という句あるいは同様な用語で表されるものは、必ずしも必要というわけではないが、全て同じ実施例のことであってもよい。
コンピュータ読取り可能媒体については、信号を発生することのできる任意の形態をとることができ、一つの信号を発生させ、或いはマシン読取り可能な命令のプログラムをディジタル処理装置で実行させる。コンピュータ読取り可能媒体は、伝送線、コンパクト・ディスク、ディジタル・ビデオ・ディスク、磁気テープ、ベルヌーイのドライブ、磁気ディスク、ホログラフィック・ディスクもしくはテープ、パンチカード、フラッシュ・メモリ、磁気抵抗メモリ、集積回路、又は他のディジタル処理装置のメモリ装置によって実施されてもよい。
更に、本発明の前述の特徴、構造、特性は一つ以上の実施例に於いて適当な態様で組み合わせることができる。しかし、当業者は、一つ以上の詳細を示さなくても、他の方法、コンポーネント、材料などで、本発明を実施できることを理解できよう。他の実施例では、よく知られた構造や材料、動作を場合により省略しているが、本発明のいろいろな側面が見えにくくなるのを回避するためである。
図1は本発明によるダンプ・データ収集システム100の一実施例を示す図式的なブロック図である。ここで示すダンプ・データ収集システム100はホスト・コンピュータ110、ストレージ・コントローラ120およびデータ・ストレージ装置130を含む。ダンプ・データ収集システム100のこれらのコンポーネントはダンプ・データを収集するように協働する。
或る実施例では、ホスト・コンピュータ110が通信し、ストレージ・コントローラ120を介してデータ・ストレージ装置130に対応する入出力動作を実行する。或る実施例では、ストレージ・コントローラ120がオンデマンド・データ(ODD)ダンプ・リクエストを受取る。ODDダンプ・リクエストに応答して、ストレージ・コントローラ120がストレージ・コントローラ120の不揮発性メモリ中のデータが変らないことを確保するために、ストレージ・コントローラ走査ループがあればそれを休止させてもよい。
或る実施例では、ストレージ・コントローラ120がダンプ・データをОDDダンプ・バッファ空間260(図2参照)に転送し、通常の動作を実行するためにその走査ループが休止されないようにしてもよい。ストレージ・コントローラ120はODDダンプ・バッファ空間260からデータ・ストレージ装置130へのダンプ・データを長期のストレージ(格納)および分析のためにオフロードしてもよい。こうして、ストレージ・コントローラ200のコンポーネントは通常のストレージ・コントローラ・プロセスのパフォーマンスを実質的に低減させずにダンプ・データを収集しストア(格納)するように協働する。
図2は本発明によるストレージ・コントローラ200の実施例の図式的なブロック図である。図示のストレージ・コントローラ200は、通信モジュール210、走査ループ管理モジュール220、ダンプ・データ優先順序付けモジュール230、ロード・バランス・モジュール240、ダンプ・データ転送モジュール250、ODD(オンデマンド・データ)ダンプ・バッファ空間260、オフロード・スケジュール・モジュール270およびダンプ・データ・オフロード・モジュール280を含む。或る実施例では、ストレージ・コントローラ200が図1のストレージ・コントローラ120に対応する。
或る実施例では、通信モジュール210がODDダンプ・リクエストを受取る。このODDダンプ・リクエストはユーザー/オペレータ、ホスト・コンピュータ110、コンパニオン・ストレージ・コントローラ(図6参照)のようないろいろなソースが発生源であってもよいし、あるいはストレージ・コントローラ120により検出される選択された内部環境が引き金になってもよい。このODDダンプ・リクエストに応答して、走査ループ管理モジュール220はそのダンプ・データの完全性を保持するためにストレージ・コントローラ200内の走査ループ動作を休止してもよい。図4の記述は走査ループを休止することについての更なる説明である。或る実施例では、ODDダンプ・リクエストの時点でストレージ・コントローラ200の揮発性メモリに置かれた何らかのあるいはすべてのデータをそのダンプ・データが含んでいてもよい。
或る実施例では、ダンプ・データ優先順序付けモジュール230がそのダンプ・データの優先順位を決定する。ダンプ・データの優先順序付けは、ODDダンプ・バッファ空間260に最優先のダンプ・データが最初に転送されるのを確保する。図5の記述がダンプ・データ優先順序付けの追加的な説明である。ロード・バランス・モジュール240は、ODDダンプ・バッファ空間260へのダンプ・データの効率的な転送を最大化するために、ODDダンプ・バッファ空間260に転送されるべきダンプ・データを複数の処理スレッド間でバランスさせることができる。ダンプ・データ転送モジュール250は、ダンプ・データをODDダンプ・バッファ空間260に転送させることができる。或る実施例では、不所望に長い期間、走査ループが休止されないよう確保するためにダンプ・データ転送タイマーが時間切れになるまでダンプ・データ転送モジュール250がODDダンプ・バッファ空間260にダンプ・データを転送する。
ODDダンプ・バッファ空間260は、ダンプ・データを一時的にストアするために、選択されたボリュームの揮発性メモリを含むことができる。走査ループ管理モジュール220は、ダンプ・データがODDダンプ・バッファ空間260に転送されてしまったので、走査ループを通常の動作を再開するのを可能にするために走査ループを休止解除し再スタートすることができる。ODDダンプ・バッファ空間260を提供することによって、ダンプ・データを一時的にストアするための効率的な再配置が可能となり、そしてダンプ・データ・オフロード・モジュール280による変更なしにダンプ・データが不揮発性のストレージに転送されることができるよう確保する。オフロード・スケジュール・モジュール270は、ストレージ・コントローラ200のパフォーマンスへの負担をできるだけ小さくするようにストレージへのダンプ・データの転送をスケジュールすることができる。こうして本発明はオンデマンド・データ(ODD)ダンプを行うための効果的な解決策を提供する。
図3は本発明によるダンプ・データ収集方法300の一実施例を示すフローチャートである。ここに示された方法300は、ODDダンプ・リクエストを受取るステップ310、走査ループを休止するステップ320、ダンプ・データを優先順序付けするステップ330、ダンプ・データをロード・バランスするステップ340、ODDダンプ・バッファ空間260にダンプ・データを転送するステップ350、走査ループを休止解除するステップ360、ダンプ・データのオフロードをスケジュールするステップ370、およびダンプ・データをオフロードするステップ380を含む。この方法300の動作は、不揮発性ストレージのボリュームにダンプ・データを効率的に収集するように協働する。
ODDダンプ・リクエストを受取るステップ310は、ホスト・コンピュータ110もしくはストレージ・コントローラのオペレータからODDダンプ・リクエストを受取るステップを含むことができる。走査ループを休止するステップ320は、揮発性メモリに置かれたデータが変更されないようにストレージ・コントローラと協働する1個もしくはそれ以上の走査ループを休止させるステップを含むことができる。ダンプ・データを優先順序付けするステップ330は、ODDダンプ・バッファ空間260に最優先のデータが最初に転送されるのを確保するために、選択された優先順位の命令に従って揮発性メモリのボリュームにおいてデータを優先順序付けするステップを含むことができる。ダンプ・データをロード・バランスする方法340は、データ転送を効率よく最大化するためにODDダンプ・バッファ空間に転送されるべきダンプ・データをいずれかのもしくは全ての処理スレッド間でバランスするステップを含むことができる。
ODDダンプ・バッファ空間260にダンプ・データを転送するステップ350は、ダンプ・データ転送タイマーの期間、ダンプ・データ・バッファとして動作するように特定された、選択された揮発性メモリのボリュームに、もっと汎用的に使用されるように特定された揮発性メモリのボリュームからダンプ・データを転送するステップを含む。或る実施例では、ダンプ・データ転送タイマーを提供することによって、ストレージ・コントローラが受容れ可能な時間内に通常の動作状態に戻されるのを確保する。
走査ループを休止解除するステップ360は、通常の動作を再スタートしもしくは再開するように走査ループを能動化(イネーブル)するステップを含む。バッファ空間からストレージへのダンプ・データのオフロードをするスケジュールするステップ370は、ストレージ・コントローラの通常の入出力動作中にストレージ・コントローラのパフォーマンスに殆どもしくは全く影響を及ぼさずにダンプ・データのオフロードをスケジュールするステップを含むことができる。ダンプ・データをオフロードするステップ380は、ODDダンプ・バッファ空間から不揮発性ストレージのボリュームへのストレージのためにダンプ・データを転送するステップを含むことができる。
図4は、本発明による1個もしくはそれ以上の走査ループを休止させる方法400の一実施例のフローチャートを示す。図示の方法400はODDダンプ・リクエストを受取るステップ410、第1の走査ループを休止するステップ420、走査ループ休止タイマーを初期化するステップ430、何か残りの走査ループがあればそれを休止するよう試みるステップ435、残りの走査ループのどれかビジーなものがあるか決定するステップ440、すべての走査ループを休止解除するステップ450、残りのタイマーを初期化するステップ455、残りのタイマーの時間切れを待つステップ460、および残りのODDダンプ動作があればそれを実行するステップ470を含む。この方法400の動作は複数の走査ループを休止する一つの解決策を提供する。
ODDダンプ・リクエストを受取るステップ410は、ホスト・コンピュータ、オペレータもしくはストレージ・コントローラからODDダンプ・リクエストを受取るステップを含むことができる。第1の走査ループを休止するステップ420は、ODDダンプ・リクエストの受け取りを処理する走査ループを休止するステップを含むことができる。走査ループ休止タイマーを初期化するステップ430は、残りの走査ループを休止するよう試みるためのタイマーを初期化するステップを含むことができる。走査ループ休止タイマーは、このシステムが不所望に長い期間、残りの走査ループを休止しようとする不毛な試みをしないよう確保する。残りの走査ループを休止するよう試みるステップ435は、揮発性メモリ中のダンプ・データの完全性を維持するために入出力リクエストの処理を続行しないよう任意の他の走査ループに命令するステップを含むことができる。
いずれかの残りの走査ループがビジーであるか決定するステップ440は、ステップ435により開始された走査ループ休止タイマーの時間切れのときに、残りの走査ループを休止する試みが成功したか決定するステップを含むことができる。残りの走査ループのうちの少なくとも一つが(おそらくは、優先度の高い命令を走査ループが処理している故に)ビジーであると仮定すると、その休止された走査ループを通常の状態に能動化するために全ての走査ループを休止解除するステップ450が入出力動作を再開する。
休止タイマーを初期化するステップ455および休止タイマーの時間切れを待つステップ460は、第1の走査ループやその他を休止するよう再度試みる前に所与の期間、通常の入出力動作をその走査ループが実行するのを許容するステップを含むことができる。一旦全ての走査ループが成功裡に休止されると、その方法400は図3に記したような残りのODDダンプ動作を実行するステップ470に続く。こうして本発明は揮発性メモリ中にダンプ・データを維持するため複数の走査ループを休止する解決策を提供する。
図5は、本発明によりダンプ・データを優先順序付けする方法500の一実施例のフローチャートである。この図示された方法500は、コンポーネントの優先順位を決定するステップ510、コンポーネントのバッファ空間の最小量を決定するステップ520、フリーなバッファ空間を決定するステップ530、およびコンポーネントのバッファ空間の最大量を決定するステップ540の動作を含む。この方法500の動作は、ODDダンプ・バッファ空間260に転送するためにダンプ・データを優先順序付けする解決策の一例を提供する。
コンポーネントの優先順位を決定するステップ510は、ユーザー/オペレータからコンポーネント優先順序付け命令を受取るステップを含むことができる。或る実施例では、優先順序付け命令は一つのコンポーネントが他のコンポーネントに対してどのように優先順序付けされるか、そして各コンポーネントに対応するダンプ・データが優先順序付けされるべきかを含むことができる。或る実施例では、オペレータがデータの優先順序付けを促進するためにリアルタイムで見込みのダンプ・データに対応する優先順序付け情報を登録しもしくは登録解除してもよい。これは開発者がその開発サイクルに亘って、異なるタイプのダンプ・データに焦点を絞るのを可能にする。
コンポーネントのバッファ空間の最小量を決定するステップ520は、任意のコンポーネントが必要なものよりも多くのバッファ空間を割り当てたか決定するステップを含むことができる。フリーなバッファ空間を決定するステップ530は、そのコンポーネントのバッファ空間の最小量に既に割り当てられたバッファ空間を決定するステップを含むことができる。フリーなバッファ空間は、コンポーネントの優先順位に従って、ODDダンプ・バッファ空間にダンプ・データを転送するときに他のコンポーネントに動的に割り当てられることも可能である。コンポーネントのバッファ空間の最大量を決定するステップ540は、最高の優先順位をもつコンポーネントがフリーなバッファ空間の全てには割り当てられないことを確保するために、各コンポーネントが使用してもよいバッファ空間の最大量を決定するステップを含むことができる。
このように、ODDダンプ・バッファ空間にダンプ・データが転送されるとき、ステップ510の動作により決定される優先順序付けに従って、最初はコンポーネントのバッファ空間の最小量について、それからコンポーネントの優先順位およびコンポーネントのバッファ空間の最大量に従うフリーなバッファ空間について、データが転送されることができる。或る実施例において、このもっと一般的な優先順序付け方法500が、ODDダンプ・リクエストのソース、ODDダンプ・リクエスト(ユーザーが特定したテスト・ケース)のタイプ、もしくはストレージ・コントローラにより実行されていた動作のタイプに従って変更されてもよいことは当業者が認めるであろう。
図6は本発明によるダンプ・データ収集システム600の一実施例を示す図式的なブロック図である。図示のダンプ・データ収集システム600は、ホスト・コンピュータ610、ストレージ・コントローラ620およびデータ・ストレージ装置630を含む。このダンプ・データ収集システム600は、図1のホスト・コンピュータ110、ストレージ・コントローラ120およびデータ・ストレージ装置130の夫々に対応付けることができる複数のホスト・コンピュータ610、複数のストレージ・コントローラ620および複数のデータ・ストレージ装置630のために解決策を提供する。
ホスト・コンピュータ610はストレージ・コントローラ620と通信することができ、これによってデータ・ストレージ装置630に関する入出力動作を実行する。ストレージ・コントローラ620はホスト・コンピュータ610、オペレータ/ユーザー、もしくはストレージ・コントローラ620からのODDダンプ・リクエストを受取ることができる。同様に、ストレージ・コントローラは、収集されたダンプ・データをいずれかのデータ・ストレージ装置630中にストアすることができる。このようにして、本発明は複数のコンポーネントでもっておよびローカルのもしくは分散されたネットワーク上に導入されることができる。
本発明はその趣旨またはその基本的な特性から逸脱することなく他の特定の形態でも実施できる。ここで説明した実施例は全ての点で説明のためのものであり、本発明を制限するものと理解してはならない。従って、本発明の範囲は、前述の説明によってではなく、特許請求の範囲によって示される。その特許請求の範囲から等価な意味及び範囲内にある全ての変更は本発明の範囲に包含される。
本発明の効果が容易に分るようにするため、前述した本発明のもっと具体的な記述が、添付図面に描かれた特定の実施例を参照することによって得られる。これらの図面が本発明の典型的な実施例だけを示し、従って本発明の範囲を限定するものとは考えられないことを理解した上で、本発明が添付図面を使用することにより一層具体的にそして詳細に記述され説明される。
本発明によるダンプ・データ収集システムの一実施例を示す図式的ブロック図である。 本発明によるストレージ・コントローラの一実施例を示す図式的ブロック図である。 本発明によるダンプ・データ収集システム方法の一実施例を示すフローチャートである。 本発明による1個もしくはそれ以上の走査ループを休止させるための一実施例の方法のフローチャートである。 本発明によるダンプ・データに優先順序付けするための一実施例の方法のフローチャートである。 本発明によるダンプ・データ収集システムの一実施例を示す図式的ブロック図である。
符号の説明
100 ダンプ・データ収集システム
110 ホスト・コンピュータ
120 ストレージ・コントローラ
130 データ・ストレージ装置
200 ストレージ・コントローラ
210 通信(コミュニケーション)モジュール
220 走査ループ管理モジュール
230 ダンプ・データ優先順序付けモジュール
240 ロード・バランス・モジュール
250 ダンプ・データ転送モジュール
260 オンデマンド・データ(ODD)ダンプ・バッファ空間
270 オフロード・スケジュール・モジュール
280 ダンプ・データ・オフロード・モジュール
600 ダンプ・データ収集システム
610 ホスト・コンピュータ
620 ストレージ・コントローラ
630 データ・ストレージ装置

Claims (20)

  1. オンデマンド・データ(ODD)ダンプ・リクエストを受取るように構成された通信モジュールと、
    前記ODDダンプ・リクエストを受取るのに応答して少なくとも1個の走査ループを休止するように構成された走査ループ管理モジュールであって、前記少なくとも1個の走査ループを休止解除するように構成された前記走査ループ管理モジュールと、
    ダンプ・データをODDダンプ・バッファ空間に転送するように構成されたダンプ・データ転送モジュールと、
    前記ODDダンプ・バッファ空間からストレージにダンプ・データをオフロードするように構成されたダンプ・データ・オフロード・モジュールとを含む、
    ダンプ・データを収集する装置。
  2. 前記走査ループ管理モジュールは、前記少なくとも1個の走査ループ休止し、走査ループ休止タイマーを初期化し、前記走査ループ休止タイマーの時間切れ前に任意の残りの走査ループを休止するよう試み、かつ、前記走査ループ休止タイマーの時間切れ前に全ての走査ループが休止されていないなら全ての走査ループを休止解除するように更に構成された、請求項1に記載の装置。
  3. 前記走査ループ管理モジュールが、休止タイマーの時間切れのときに全ての休止ループを休止するように再度試みて、前記走査ループ休止タイマーを再度初期化するように更に構成された、請求項2に記載の装置。
  4. ダンプ・データが前記ODDダンプ・バッファ空間に転送される前にダンプ・データを優先順序付けするように構成されたダンプ・データ優先順序付けモジュールを更に含む、請求項1に記載の装置。
  5. 前記ダンプ・データ優先順序付けモジュールが、ダンプ・データ優先順序付けを促進するためにリアルタイムで見込みのダンプ・データを登録しもしくは登録解除するように更に構成された、請求項4に記載の装置。
  6. 前記ODDダンプ・バッファ空間の個別のセグメントにダンプ・データを同時に転送するように構成された複数の処理スレッドの間でダンプ・データをバランスするように構成されたロード・バランス・モジュールを更に含む、請求項1に記載の装置。
  7. ダンプ・データ転送タイマーの時間切れまでに前記ODDダンプ・バッファ空間にダンプ・データを転送するように更に構成された、請求項1に記載の装置。
  8. 前記走査ループ管理モジュールが、不完全なデータ・ダンプにも拘わらず前記少なくとも1個の走査ループを通常の処理のため再スタートするように更に構成された、請求項7に記載の装置。
  9. 前記ODDダンプ・バッファ空間からストレージへのダンプ・データのオフロードをスケジュールするように構成されたオフロード・スケジューリング・モジュールを更に含む、請求項1に記載の装置。
  10. オンデマンド・データ(ODD)ダンプ・リクエストを受取るステップと、
    少なくとも1個の走査ループを休止するステップと、
    ダンプ・データをODDダンプ・バッファ空間に転送するステップと、
    前記少なくとも1個の走査ループを休止解除するステップと、
    前記ODDダンプ・バッファ空間からストレージにダンプ・データをオフロードするステップとを含む、
    コンピュータ実行可能なプログラム。
  11. 前記少なくとも1個の走査ループを休止するステップが、
    第1の走査ループを休止するステップと、
    走査ループ休止タイマーを初期化するステップと、
    前記走査ループ休止タイマーの時間切れ前に任意の残りの走査ループを休止させるように試みるステップと、
    前記走査ループ休止タイマーの時間切れ前に全ての走査ループが休止していないなら全ての走査ループを休止解除するステップとを含む、
    請求項10に記載のコンピュータ実行可能なプログラム。
  12. 前記少なくとも1個の走査ループを休止するステップが、
    休止タイマーの時間切れの際に走査ループ休止タイマーを休止するよう再度試み、前記走査ループ休止タイマーを再度初期化するステップを更に含む、
    請求項11に記載のコンピュータ実行可能なプログラム。
  13. 前記ODDダンプ・バッファ空間にダンプ・データを転送する前にダンプ・データを優先順序付けするステップを更に含む、
    請求項1に記載のコンピュータ実行可能なプログラム。
  14. 適正な優先順序付けを促進するために見込みのダンプ・データをリアルタイムで登録しもしくは登録解除するステップを更に含む、
    請求項4に記載のコンピュータ実行可能なプログラム。
  15. 前記ODDダンプ・バッファ空間の個別のセグメントにダンプ・データを同時に転送するように構成された複数の処理スレッドの間でダンプ・データをバランスするステップを更に含む、
    請求項1に記載のコンピュータ実行可能なプログラム。
  16. 前記ODDダンプ・バッファ空間にダンプ・データを転送するステップが、ダンプ・データ転送タイマーの時間切れまでに前記ODDダンプ・バッファ空間にダンプ・データを転送するステップを含む、請求項1に記載のコンピュータ実行可能なプログラム。
  17. 不完全なデータ・ダンプにも拘わらず前記少なくとも1個の走査ループを通常の処理のため再スタートするステップを更に含む、請求項7に記載のコンピュータ実行可能なプログラム。
  18. 前記ODDダンプ・バッファ空間からストレージへのダンプ・データのオフロードをスケジュールするステップを更に含む、請求項1に記載のコンピュータ実行可能なプログラム。
  19. オンデマンド・データ(ODD)ダンプ・リクエストを受取るステップと、
    少なくとも1個の走査ループを休止するステップと、
    ダンプ・データをODDダンプ・バッファ空間に転送するステップと、
    前記少なくとも1個の走査ループを休止解除するステップと、
    前記ODDダンプ・バッファ空間からストレージにダンプ・データをオフロードするステップとを含む、
    ダンプ・データを収集する方法。
  20. 少なくとも1個のストレージ・コントローラと通信するように構成された複数個のホスト・コンピュータと、
    データ担持媒体上にデータをストアするように構成された少なくとも1個のストレージ装置とを含み、前記少なくとも1個のストレージ・コントローラが、
    オンデマンド・データ(ODD)ダンプ・リクエストを受取り、
    少なくとも1個の走査ループを休止し、
    ダンプ・データをODDダンプ・バッファ空間に転送し、
    前記少なくとも1個の走査ループを休止解除し、かつ
    前記ODDダンプ・バッファ空間からストレージにダンプ・データをオフロードするように構成された、ダンプ・データを収集するためのシステム。
JP2008231162A 2007-10-01 2008-09-09 ダンプ・データを収集する装置、システム、方法およびプログラム Expired - Fee Related JP5224982B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/865559 2007-10-01
US11/865,559 US8812443B2 (en) 2007-10-01 2007-10-01 Failure data collection system apparatus and method

Publications (2)

Publication Number Publication Date
JP2009087332A true JP2009087332A (ja) 2009-04-23
JP5224982B2 JP5224982B2 (ja) 2013-07-03

Family

ID=40509570

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008231162A Expired - Fee Related JP5224982B2 (ja) 2007-10-01 2008-09-09 ダンプ・データを収集する装置、システム、方法およびプログラム

Country Status (4)

Country Link
US (1) US8812443B2 (ja)
JP (1) JP5224982B2 (ja)
CN (1) CN101403984B (ja)
TW (1) TW200921378A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012004902A1 (ja) * 2010-07-08 2012-01-12 株式会社日立製作所 計算機システム及び計算機システムの系切替制御方法

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110225459A1 (en) * 2010-03-09 2011-09-15 Microsoft Corporation Generating a debuggable dump file for a virtual machine
US20110225458A1 (en) * 2010-03-09 2011-09-15 Microsoft Corporation Generating a debuggable dump file for an operating system kernel and hypervisor
KR101785007B1 (ko) * 2011-06-14 2017-11-07 삼성전자주식회사 멀티-비트 메모리 장치를 포함한 데이터 저장 시스템 및 그것의 온-칩 버퍼 프로그램 방법
US9348533B2 (en) 2013-03-14 2016-05-24 Microsoft Technology Licensing, Llc Memory image capture via memory write from a running system
US9430415B2 (en) * 2013-06-14 2016-08-30 Globalfoundries Inc. Concurrent dumping of large address space
US9176804B2 (en) * 2013-06-27 2015-11-03 International Business Machines Corporation Memory dump optimization in a system
US9317356B2 (en) * 2013-10-15 2016-04-19 Globalfoundries Inc. Device state capture during operating system dump
WO2016139774A1 (ja) * 2015-03-04 2016-09-09 富士通株式会社 情報処理装置、情報処理システム
US10013299B2 (en) 2015-09-16 2018-07-03 Microsoft Technology Licensing, Llc Handling crashes of a device's peripheral subsystems
US9946592B2 (en) 2016-02-12 2018-04-17 International Business Machines Corporation Dump data collection management for a storage area network
US10606714B2 (en) * 2017-09-05 2020-03-31 International Business Machines Corporation Stopping central processing units for data collection based on event categories of events
US10740030B2 (en) 2017-09-06 2020-08-11 International Business Machines Corporation Stopping a plurality of central processing units for data collection based on attributes of tasks
KR102331926B1 (ko) * 2017-11-17 2021-11-29 삼성전자주식회사 저장 장치를 포함하는 호스트 시스템의 동작 방법 및 저장 장치 제어기의 동작 방법
US11379290B2 (en) 2019-07-17 2022-07-05 International Business Machines Corporation Prioritizing and parallelizing the capture of data for debugging computer programs
US11614890B2 (en) * 2019-07-30 2023-03-28 Micron Technology, Inc. Handling of host-initiated requests in memory sub-systems
US11010230B2 (en) * 2019-09-10 2021-05-18 International Business Machines Corporation Dynamic logging and prioritization of error incident data
US11157373B2 (en) * 2019-11-04 2021-10-26 Lenovo Enterprise Solutions (Singapore) Pte. Ltd. Prioritized transfer of failure event log data

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0247735A (ja) * 1988-08-08 1990-02-16 Nec Corp 計算機装置
JPH05134906A (ja) * 1991-11-11 1993-06-01 Nec Corp メモリ情報収集方式
JPH05189254A (ja) * 1992-01-14 1993-07-30 Fujitsu Ltd 仮想計算機の制御情報収集装置および方法
JPH05210608A (ja) * 1992-01-31 1993-08-20 Nec Corp 通信処理装置メモリダンプ採取方式
JP2002073585A (ja) * 2000-08-29 2002-03-12 Nec Software Hokuriku Ltd デバッグ支援装置、デバッグ支援方法、および記録媒体
US6848106B1 (en) * 1999-10-05 2005-01-25 Veritas Operating Corporation Snapshot restore of application chains and applications
JP2007193414A (ja) * 2006-01-17 2007-08-02 Nec Corp コンピュータシステムおよびコンピュータシステムにおけるメモリダンプ制御方法
JP2007523404A (ja) * 2004-01-26 2007-08-16 ネットワーク・アプライアンス・インコーポレイテッド コアダンプに関係するパートナリソースのテイクオーバのためのシステム及び方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5287496A (en) * 1991-02-25 1994-02-15 International Business Machines Corporation Dynamic, finite versioning for concurrent transaction and query processing
US5581749A (en) * 1992-12-21 1996-12-03 Thedow Chemical Company System and method for maintaining codes among distributed databases using a global database
US5682523A (en) * 1993-12-15 1997-10-28 International Business Machines Corporation System and method for collecting and retrieving network problem determination data with a generic collection subsystem reporting to an agent on demand
US6150679A (en) * 1998-03-13 2000-11-21 Hewlett Packard Company FIFO architecture with built-in intelligence for use in a graphics memory system for reducing paging overhead
US7062677B1 (en) * 2001-08-09 2006-06-13 Cisco Tech Inc Method for capturing core dump of a service module
US20030220948A1 (en) * 2002-01-22 2003-11-27 Columbia Data Products, Inc. Managing snapshot/backup collections in finite data storage
US7236165B2 (en) * 2002-07-11 2007-06-26 Raytheon Company System and method for asynchronous storage and playback of a system state
US6792518B2 (en) * 2002-08-06 2004-09-14 Emc Corporation Data storage system having mata bit maps for indicating whether data blocks are invalid in snapshot copies
US7613945B2 (en) * 2003-08-14 2009-11-03 Compellent Technologies Virtual disk drive system and method
US7376674B2 (en) * 2004-05-14 2008-05-20 Oracle International Corporation Storage of multiple pre-modification short duration copies of database information in short term memory
US20060047926A1 (en) * 2004-08-25 2006-03-02 Zheng Calvin G Managing multiple snapshot copies of data
CN100359477C (zh) * 2004-12-16 2008-01-02 中兴通讯股份有限公司 一种嵌入式***的数据收集和还原方法
JP5313099B2 (ja) * 2009-09-25 2013-10-09 日立建機株式会社 機械の異常監視装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0247735A (ja) * 1988-08-08 1990-02-16 Nec Corp 計算機装置
JPH05134906A (ja) * 1991-11-11 1993-06-01 Nec Corp メモリ情報収集方式
JPH05189254A (ja) * 1992-01-14 1993-07-30 Fujitsu Ltd 仮想計算機の制御情報収集装置および方法
JPH05210608A (ja) * 1992-01-31 1993-08-20 Nec Corp 通信処理装置メモリダンプ採取方式
US6848106B1 (en) * 1999-10-05 2005-01-25 Veritas Operating Corporation Snapshot restore of application chains and applications
JP2002073585A (ja) * 2000-08-29 2002-03-12 Nec Software Hokuriku Ltd デバッグ支援装置、デバッグ支援方法、および記録媒体
JP2007523404A (ja) * 2004-01-26 2007-08-16 ネットワーク・アプライアンス・インコーポレイテッド コアダンプに関係するパートナリソースのテイクオーバのためのシステム及び方法
JP2007193414A (ja) * 2006-01-17 2007-08-02 Nec Corp コンピュータシステムおよびコンピュータシステムにおけるメモリダンプ制御方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012004902A1 (ja) * 2010-07-08 2012-01-12 株式会社日立製作所 計算機システム及び計算機システムの系切替制御方法

Also Published As

Publication number Publication date
TW200921378A (en) 2009-05-16
CN101403984A (zh) 2009-04-08
JP5224982B2 (ja) 2013-07-03
US8812443B2 (en) 2014-08-19
CN101403984B (zh) 2012-08-08
US20090089336A1 (en) 2009-04-02

Similar Documents

Publication Publication Date Title
JP5224982B2 (ja) ダンプ・データを収集する装置、システム、方法およびプログラム
US7734833B2 (en) Method for scheduling operations called by a task on a real-time or non-real time processor
JP4456490B2 (ja) Dma装置
US20090019449A1 (en) Load balancing method and apparatus in symmetric multi-processor system
JP5214537B2 (ja) マルチプロセッサシステム
US20130104137A1 (en) Multiprocessor system
US20080140896A1 (en) Processor and interrupt controlling method
KR20070097538A (ko) 운영체제에 친숙한 부트로더
US20100050184A1 (en) Multitasking processor and task switching method thereof
CN109343862B (zh) 应用的资源数据的调度方法及装置
US8495345B2 (en) Computing apparatus and method of handling interrupt
US20060146864A1 (en) Flexible use of compute allocation in a multi-threaded compute engines
US9606879B2 (en) Multi-partition networking device and method therefor
WO2022042127A1 (zh) 一种协程切换的方法、装置及设备
US9804911B2 (en) Concurrent validation of hardware units
CN111831408A (zh) 异步任务处理方法、装置、电子设备及介质
US7877535B2 (en) Processor and interrupt handling method
JPH11353291A (ja) マルチプロセッサシステム及びタスク交換プログラムを記録した媒体
CN113220442B (zh) 数据调度方法、装置及电子设备
KR20150083558A (ko) 저장 장치의 데이터 처리 방법 및 저장 장치
US20230385102A1 (en) Hardware event triggered pipeline control
KR102268796B1 (ko) 하이퍼바이저 기반 plc 서비스 처리 장치
US11314686B2 (en) Hardware for supporting time triggered load anticipation in the context of a real time OS
JP2010044699A (ja) 情報処理装置
JP5455152B2 (ja) 画像処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110805

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130118

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130129

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130201

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130219

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130312

R150 Certificate of patent or registration of utility model

Ref document number: 5224982

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160322

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees