JP2000035906A - データ収集方法 - Google Patents

データ収集方法

Info

Publication number
JP2000035906A
JP2000035906A JP10204094A JP20409498A JP2000035906A JP 2000035906 A JP2000035906 A JP 2000035906A JP 10204094 A JP10204094 A JP 10204094A JP 20409498 A JP20409498 A JP 20409498A JP 2000035906 A JP2000035906 A JP 2000035906A
Authority
JP
Japan
Prior art keywords
data
memory
standby
virtual
address
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10204094A
Other languages
English (en)
Inventor
Toshiyuki Kondo
敏之 近藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Communication Systems Ltd
Original Assignee
NEC Communication Systems Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Communication Systems Ltd filed Critical NEC Communication Systems Ltd
Priority to JP10204094A priority Critical patent/JP2000035906A/ja
Publication of JP2000035906A publication Critical patent/JP2000035906A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

(57)【要約】 【課題】 運用中のサービス処理に影響を与えることな
く、障害解析に必要なデータを迅速に収集するデータ収
集方法を実現する。 【解決手段】 現用系b−1および待機系b−2が同期
運転する二重化オンラインシステムにおいて、障害発生
時の全メモリデータを収集するためのデータ圧縮処理
を、待機系b−2にて行うようにして現用系b−1側が
運用中のサービス処理への影響を少なくする一方、この
待機系b−2側にて前記データ圧縮処理を施して収集し
た全メモリデータを、現用系b−1を経由して他のオフ
ラインシステムFにて解析させるべくメモリダンプ空間
を仮想空間アドレスで指定する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、障害発生時のメモ
リダンプに用いて好適なデータ収集方法に関する。
【0002】
【従来の技術】従来より、コンピュータシステムで障害
が発生した場合、その原因を究明する為、メモリダンプ
することが知られている。通常は障害発生後にメモリか
ら該当するエリアのデータを収集してコンピュータシス
テムの磁気ディスク等に確保する。こうしたダンプ採取
を確実に行う為には、障害が発生してからダンプファイ
ルを置く場所を割当てる訳には行かず、予め空き領域を
確保しておくようにしている。
【0003】
【発明が解決しようとする課題】ところで、従来のデー
タ収集方法では、障害解析時に必要であろう部分のデー
タのみを特定し、システム上影響のない程度のサイズの
メモリエリア(資源)を確保して、その限りあるサイズ
分のみ収集していた。このため複雑な問題が生じたとき
は、従来とる障害解析データ部分だけではデータの漏れ
があり不十分な場合があった。漏れのないデータを取る
には全実装分のメモリデータを収集するしかないのだ
が、全実装分のメモリデータを取るにはその膨大な量の
データの転送/収集する時間、そのデータを保管する記
憶装置の容量を考慮する必要があった。
【0004】その為、従来ではデータ圧縮によるダンプ
を行っているが、このデータ圧縮を行うことにより、シ
ステム上で運用されている他のサービス処理の妨げにな
るという問題がある。そこで本発明は、このような事情
に鑑みてなされたもので、運用中のサービス処理に影響
を与えることなく、障害解析に必要なデータを迅速に収
集し得るデータ収集方法を提供することを目的としてい
る。
【0005】
【課題を解決するための手段】上記目的を達成するた
め、請求項1に記載の発明では、現用系および待機系が
同期運転する二重化オンラインシステムにおいて、障害
発生時の全メモリデータを収集するためのデータ圧縮処
理を、待機系にて行うようにして現用系側が運用中のサ
ービス処理への影響を少なくする一方、この待機系側に
て前記データ圧縮処理を施して収集した全メモリデータ
を、現用系を経由して他のオフラインシステムにて解析
させるべくメモリダンプ空間を仮想空間アドレスで指定
することを特徴とする。
【0006】また、上記請求項1に従属する請求項2に
記載の発明によれば、前記データ圧縮処理では、アドレ
ス、サイズおよび分割数からなるヘッダ情報を圧縮デー
タに付加することを特徴とする。
【0007】さらに、上記請求項1に従属する請求項3
に記載の発明によれば、前記他のオフラインシステムで
は仮想/物理変換テーブルを備え、この仮想/物理変換
テーブルの物理アドレスと圧縮データに付加されるヘッ
ダ情報とを参照して解凍すべき圧縮データを特定するこ
とを特徴とする。
【0008】本発明では、障害発生時の全メモリデータ
を収集するためのデータ圧縮処理を、待機系にて行うよ
うにして現用系側が運用中のサービス処理への影響を少
なくする一方、この待機系側にて前記データ圧縮処理を
施して収集した全メモリデータを、現用系を経由して他
のオフラインシステムにて解析させるべくメモリダンプ
空間を仮想空間アドレスで指定するので、運用中のサー
ビス処理に影響を与えることなく、障害解析に必要なデ
ータを迅速に収集することが可能になる。
【0009】
【発明の実施の形態】以下、本発明の実施の一形態につ
いて図面を参照して説明する。まず、図1は本発明の実
施の一形態によるオンラインシステムの概略構成を示す
ブロック図である。このオンラインシステムを構成する
複数の情報処理装置A,B,C,…はいずれもCPUお
よびその周辺回路(ROM,RAM等)が現用系と待機
系とに分れるプロセッサ2重化構成をなす。
【0010】すなわち、情報処理装置Bを例に挙げて、
その構成を説明すると、例えば、待機系b−2側のRO
Mにデータ圧縮プログラムを記憶させておき、一方の現
用系b−1側には待機系b−2のROMのデータ圧縮プ
ログラムを起動させたり、圧縮されたダンプデータを転
送するプログラムを備えさせておく。情報処理装置Aに
は、記憶装置D(例えば、磁気ディスク等の外部記憶装
置)や、他のシステム(オフラインシステムF等)にデ
ータ転送できるよう磁気テープ装置Eが設けられてい
る。オフラインシステムFは圧縮されたデータを解凍し
て表示するツールを備える。
【0011】本発明の要旨は、このような構成におい
て、障害発生時の全メモリデータ収集を効率良く行うた
めのデータ圧縮処理を、待機系b−2を使用して行うこ
とにより現用系b−1側が運用中のサービス処理への影
響を少なくする一方、待機系b−2によって収集した全
メモリデータを、オフラインシステムFで解析できる様
にするために実機以外のマシンで仮想空間制御するよう
にしたことにある。以下、こうした点について詳述す
る。
【0012】図2(イ)に示すように、現用系b−1お
よび待機系b−2が同期運転中にある場合には、両系の
メモリ内容は同一状態を維持している。そして、このよ
うな状態において、例えば、情報処理装置Bにおいてソ
フトウェア障害が発生すると、同図(ロ)に示すよう
に、同期運転を解除し、現用系b−1はリスタート処理
を開始する一方で、待機系b−2が障害時のデータを保
留したまま切り離される。これにより障害発生時のデー
タが待機系b−2のメモリに保存される。次いで、同図
(ハ)に示すように、現用系b−1ではリスタート処理
が完了してサービス開始状態に復帰する。これに対し、
待機系b−2では同図(ニ)に示す通り、メモリ保存さ
れた障害発生時のデータを収集すべくデータ収集処理を
開始する。
【0013】このデータ収集処理は、例えば、図1に図
示した待機系b−2における*b2のデータを、最初に
(のルート)情報処理装置Bより情報処理装置Aを経
由して、記憶装置D装置に転送収集することにより、圧
縮作業エリア*b2として確保する。他のエリアのデー
タはこの圧縮作業エリア*b2を使用して圧縮してから
圧縮データとして転送収集する。これにより転送収集時
間と記憶装置Dの記憶容量の節約を計ることが可能にあ
る。
【0014】ここで、図3を参照してデータ圧縮処理に
ついて説明する。まず、現用系b−1側のメモリに展開
されているプログラムに基づき、待機系b−2側のメモ
リデータの(若番からの)アドレスとサイズを指定し、
待機系b−2のROMの圧縮処理プログラムを起動する
ことにより、圧縮作業エリア*b2を使用して圧縮デー
タを作成する。このときアドレス、サイズ、分割版数等
をヘッダとして圧縮データに付加させる。これにより、
図4に図示するように、解析時に必要部分の圧縮データ
のみ解凍可能になる。つまり、現用系b−1側で待機系
b−2側の圧縮処理プログラムの完了を確認したら、圧
縮作業エリア*b2の圧縮データを転送収集する。
【0015】データ解析時は独自のツールを作成してお
り、オフラインシステム上で解析できるようにしてい
る。このツールはメモリの仮想空間を意識していて、収
集したデータの物理/仮想変換テーブル部分のデータを
参照する。よって、物理/仮想変換テーブルの物理アド
レスが必要なので予め用意する。通常、物理/仮想変換
テーブルのデータは最重要部分なので、仮想アドレスで
なく固定の物理アドレスに割付けられている。具体的に
は、図5に示す手順で解析に必要な部分のデータの仮想
アドレスとサイズを指定してツールを実行することによ
り圧縮データ群より必要な圧縮データを特定してそのデ
ータのみ解凍し、圧縮前のイメージでデータ表示する。
【0016】このように、本発明によれば、障害発生時
の全メモリデータ収集を効率良く行うためのデータ圧縮
処理を、待機系b−2を使用して行うことにより現用系
b−1側が運用中のサービス処理への影響を少なくする
一方、待機系b−2によって収集した全メモリデータ
を、オフラインシステムFで解析できる様にするために
実機以外のマシンで仮想空間制御するので、以下に示す
効果を奏する。
【0017】つまり、メモリデータを圧縮することによ
り、転送収集する時間、記憶装置の保存容量を節約する
ことができる。また、全メモリのデータを収集すること
により、障害解析時に必要なデータの漏れがなくなり、
従来の障害解析データのみでは解析出来なかったものが
出来るようになることを期待できる。さらに、データ圧
縮処理を非運用面のみで行うことにより、運用面でのサ
ービス処理に影響なくデータを収集することができる。
【0018】また、データを磁気テープ等に転送するこ
とにより、運用しているシステム自身で解析する必要が
なく、他の離れた(記憶装置の容量に余裕のある)オフ
ラインシステム上で解析が可能となる。加えて、オフラ
インのツールでメモリの仮想空間で意識できるようにし
ているので、必要である解析データ部分を素早く見つけ
出すことが可能で早急な問題の対応ができる。
【0019】
【発明の効果】本発明によれば、障害発生時の全メモリ
データを収集するためのデータ圧縮処理を、待機系にて
行うようにして現用系側が運用中のサービス処理への影
響を少なくする一方、この待機系側にて前記データ圧縮
処理を施して収集した全メモリデータを、現用系を経由
して他のオフラインシステムにて解析させるべくメモリ
ダンプ空間を仮想空間アドレスで指定するので、運用中
のサービス処理に影響を与えることなく、障害解析に必
要なデータを迅速に収集することができる。
【図面の簡単な説明】
【図1】 本発明の実施の一形態の構成を示すブロック
図である。
【図2】 全体動作を説明するための図である。
【図3】 データ圧縮処理を示すフローチャートであ
る。
【図4】 データ圧縮形態を説明するための図である。
【図5】 圧縮/解凍操作手順を示す図である。
【符号の説明】
A〜C 情報処理装置 b−1 現用系 b−2 待機系 D 記憶装置 E 磁気テープ装置 F オフラインシステム
─────────────────────────────────────────────────────
【手続補正書】
【提出日】平成11年4月23日(1999.4.2
3)
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】特許請求の範囲
【補正方法】変更
【補正内容】
【特許請求の範囲】
請求項1現用系および待機系が同期運転する二重
化オンラインシステムにおいて、障害発生時の全メモリ
データを収集するためのデータ圧縮処理を、待機系にて
行うようにして現用系側が運用中のサービス処理への影
響を少なくする一方、この待機系側にて前記データ圧縮
処理を施して収集した全メモリデータを、現用系を経由
して他のオフラインシステムにて解析させるべくメモリ
ダンプ空間を仮想空間アドレスで指定し、前記データ圧
縮処理では、アドレス、サイズおよび分割数からなるヘ
ッダ情報を圧縮データに付加することを特徴とするデー
タ収集方法。
請求項2現用系および待機系が同期運転する二重
化オンラインシステムにおいて、障害発生時の全メモリ
データを収集するためのデータ圧縮処理を、待機系にて
行うようにして現用系側が運用中のサービス処理への影
響を少なくする一方、この待機系側にて前記データ圧縮
処理を施して収集した全メモリデータを、現用系を経由
して他のオフラインシステムにて解析させるべくメモリ
ダンプ空間を仮想空間アドレスで指定し、前記他のオフ
ラインシステムでは仮想/物理変換テーブルを備え、こ
の仮想/物理変換テーブルの物理アドレスと圧縮データ
に付加されるヘッダ情報とを参照して解凍すべき圧縮デ
ータを特定することを特徴とするデータ収集方法。
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】0005
【補正方法】削除
【手続補正3】
【補正対象書類名】明細書
【補正対象項目名】0006
【補正方法】変更
【補正内容】
【0006】
【課題を解決するための手段】上記目的を達成するた
め、請求項1に記載の発明では、現用系および待機系が
同期運転する二重化オンラインシステムにおいて、障害
発生時の全メモリデータを収集するためのデータ圧縮処
理を、待機系にて行うようにして現用系側が運用中のサ
ービス処理への影響を少なくする一方、この待機系側に
て前記データ圧縮処理を施して収集した全メモリデータ
を、現用系を経由して他のオフラインシステムにて解析
させるべくメモリダンプ空間を仮想空間アドレスで指定
し、 前記データ圧縮処理では、アドレス、サイズおよび
分割数からなるヘッダ情報を圧縮データに付加すること
を特徴とする。
【手続補正4】
【補正対象書類名】明細書
【補正対象項目名】0007
【補正方法】変更
【補正内容】
【0007】また、請求項2に記載の発明では、現用系
および待機系が同期運転する二重化オンラインシステム
において、障害発生時の全メモリデータを収集するため
のデータ圧縮処理を、待機系にて行うようにして現用系
側が運用中のサービス処理への影響を少なくする一方、
この待機系側にて前記データ圧縮処理を施して収集した
全メモリデータを、現用系を経由して他のオフラインシ
ステムにて解析させるべくメモリダンプ空間を仮想空間
アドレスで指定し、前記他のオフラインシステムでは仮
想/物理変換テーブルを備え、この仮想/物理変換テー
ブルの物理アドレスと圧縮データに付加されるヘッダ情
報とを参照して解凍すべき圧縮データを特定することを
特徴とする。

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 現用系および待機系が同期運転する二重
    化オンラインシステムにおいて、障害発生時の全メモリ
    データを収集するためのデータ圧縮処理を、待機系にて
    行うようにして現用系側が運用中のサービス処理への影
    響を少なくする一方、この待機系側にて前記データ圧縮
    処理を施して収集した全メモリデータを、現用系を経由
    して他のオフラインシステムにて解析させるべくメモリ
    ダンプ空間を仮想空間アドレスで指定することを特徴と
    するデータ収集方法。
  2. 【請求項2】 前記データ圧縮処理では、アドレス、サ
    イズおよび分割数からなるヘッダ情報を圧縮データに付
    加することを特徴とする請求項1記載のデータ収集方
    法。
  3. 【請求項3】 前記他のオフラインシステムでは仮想/
    物理変換テーブルを備え、この仮想/物理変換テーブル
    の物理アドレスと圧縮データに付加されるヘッダ情報と
    を参照して解凍すべき圧縮データを特定することを特徴
    とする請求項1記載のデータ収集方法。
JP10204094A 1998-07-17 1998-07-17 データ収集方法 Pending JP2000035906A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10204094A JP2000035906A (ja) 1998-07-17 1998-07-17 データ収集方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10204094A JP2000035906A (ja) 1998-07-17 1998-07-17 データ収集方法

Publications (1)

Publication Number Publication Date
JP2000035906A true JP2000035906A (ja) 2000-02-02

Family

ID=16484701

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10204094A Pending JP2000035906A (ja) 1998-07-17 1998-07-17 データ収集方法

Country Status (1)

Country Link
JP (1) JP2000035906A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7519779B2 (en) 2002-08-26 2009-04-14 International Business Machines Corporation Dumping using limited system address space
JP2014010693A (ja) * 2012-06-29 2014-01-20 Fujitsu Ltd ストレージシステムおよびストレージシステムの制御方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7519779B2 (en) 2002-08-26 2009-04-14 International Business Machines Corporation Dumping using limited system address space
JP2014010693A (ja) * 2012-06-29 2014-01-20 Fujitsu Ltd ストレージシステムおよびストレージシステムの制御方法

Similar Documents

Publication Publication Date Title
US6687849B1 (en) Method and apparatus for implementing fault-tolerant processing without duplicating working process
JP3481737B2 (ja) ダンプ採取装置およびダンプ採取方法
US20020029359A1 (en) Method and apparatus for getting dump of a computer system
JP2000035906A (ja) データ収集方法
JP2001290677A (ja) 高速ダンプ採取方法
JPH0594353A (ja) データベース管理方式
JPH05189254A (ja) 仮想計算機の制御情報収集装置および方法
JPH1040123A (ja) ジョブ管理方式と方法
JPH05120088A (ja) メモリダンプ採取装置
JP2000357130A (ja) 周辺制御処理装置、障害解析情報保持方式及び障害解析情報保持方法
JPS6316343A (ja) 対話形式機能テスト時のバツチによるテスト方式
JPS62284440A (ja) 端末装置のソフトウエア資源保守方式
JPH03255547A (ja) メモリダンプ出力方式
JPH10116262A (ja) 並列計算機、プロセッサ要素ネットワーク、および並列計算機用プログラムを記録した記録媒体
JPH08221287A (ja) 系切り替え制御方法
JPH03230231A (ja) スタンドアロンダンプ処理方式
JPH02292640A (ja) メモリダンプ採取方式
JPH0430244A (ja) 分散システムのシステムファイル切替方式
JPH04352042A (ja) メモリダンプ収集方式
JPH0573520A (ja) 再開情報収集方式
JPH08235029A (ja) システム障害情報保存方法
JPH05114035A (ja) 応答情報処理方式
JPH04369067A (ja) 障害処理装置
JPH07146835A (ja) 通信処理装置障害復旧方式
JPH05197606A (ja) リカバリジョブ自動作成システム

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20000509