JP2007249490A - 障害ログ自動選択収集方法および装置 - Google Patents
障害ログ自動選択収集方法および装置 Download PDFInfo
- Publication number
- JP2007249490A JP2007249490A JP2006070811A JP2006070811A JP2007249490A JP 2007249490 A JP2007249490 A JP 2007249490A JP 2006070811 A JP2006070811 A JP 2006070811A JP 2006070811 A JP2006070811 A JP 2006070811A JP 2007249490 A JP2007249490 A JP 2007249490A
- Authority
- JP
- Japan
- Prior art keywords
- log
- failure
- information
- collection
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
Abstract
【解決手段】障害が表出した時点で実行されていた障害モジュールが構成表において占める位置を特定する障害位置特定手順と、障害モジュールに対応する節点から遡って構成表を探索することにより、障害モジュールに至る経路を構成表上の節点の連なりとして推定し、経路上に位置する構成表の節点をログ収集対象の節点として選択する選択手順と、再現試験の際に、ソフトウェアを構成する各モジュールの実行に応じてモジュールにかかわるログ情報を収集するログ収集手順と、ログ収集手順で収集されたログ情報がログ収集対象の節点に対応するか否かを判定する判定手順と、収集されたログ情報がログ収集対象の節点に対応しない旨の判定結果に応じて、ログ情報に至るまでの経路について収集されたログ情報を廃棄するログ廃棄手順とを備える。
【選択図】 図1
Description
このために、例えば、障害の原因を探るために再現試験を行う際などに、プログラムを構成する各モジュール間の関係を示すコールツリー(あるいは構成表)の各節点の通過に応じて履歴を示すログ情報を収集する方法が用いられている。また、呼び出された処理プログラムの処理から呼出元の処理プログラムの処理に戻る際に、呼出先の処理プログラムにおけるエラーコードを通知することにより、エラーが発生したプログラムが属する階層にかかわらず、最上位の階層の処理プログラムにおいて、エラー内容を把握できるようにした技術も提案されている(特許文献1参照)。
従来から、このようなログ情報の収集は、一定の容量を持つバッファをリングバッファとして、収集したログ情報を循環的に書き込むことによって行われるのが一般的である。
とはいえ、情報処理装置に備えられているメモリなどの資源は有限であるので、収集されるログ情報の全てを格納可能なほどの大容量のバッファを設けることは明らかに現実的でない。
本発明にかかわる障害ログ自動選択収集方法の原理は、以下の通りである。
情報処理システムによって実行されるソフトウェアにかかわる障害の原因を特定するための再現試験で障害にかかわる過程を表す障害ログ情報を収集する障害ログ自動選択収集方法において、障害位置特定手順は、ソフトウェアの実行にかかわる障害の表出に応じて、障害の表出した時点で実行されていた障害モジュールがソフトウェアを構成する複数のプログラムエントリおよびこれらのプログラムエントリを構成する複数のモジュール相互の関係を示す構成表において占める位置を特定する。選択手順は、障害モジュールに対応する節点から遡って構成表を探索することにより、障害モジュールに至る経路を構成表上の節点の連なりとして推定し、経路上に位置する構成表の節点をログ収集対象の節点として選択する。ログ収集手順は、再現試験の際に、ソフトウェアを構成する各モジュールの実行に応じてモジュールにかかわるログ情報を収集する。判定手順は、ログ収集手順で収集されたログ情報がログ収集対象の節点に対応するか否かを判定する。ログ廃棄手順は、収集されたログ情報がログ収集対象の節点に対応しない旨の判定結果に応じて、ログ情報に至るまでの経路について収集されたログ情報を廃棄する。
ソフトウェアの実行中の障害の発生に応じて、障害位置特定手順と選択手順とにより、このソフトウェアの構成表において、障害が発生したて障害モジュールに至る経路を構成する節点がログ収集対象として選択される。
そして、再現試験の際に、ログ収集手段によって新たなログ情報が収集されるごとに、判定手順により、この新たなログ情報がログ収集対象の節点に対応するか否かが判定され、ログ収集対象の節点に対応しないと判定された場合には、この新たなログ情報に先立って該当する経路に沿って収集されたログ情報がログ廃棄手順によって廃棄される。
本発明にかかわる第1の障害ログ自動選択収集装置の原理は、以下の通りである。
情報処理システムによって実行されるソフトウェアにかかわる障害の原因を特定するための再現試験で障害にかかわる過程を表す障害ログ情報を収集する障害ログ自動選択収集装置において、構成表は、ソフトウェアを構成する複数のプログラムエントリおよびこれらのプログラムエントリを構成する複数のモジュール相互の関係を示す。障害位置特定手段は、ソフトウェアの実行にかかわる障害の表出に応じて、障害の表出した時点で実行されていた障害モジュールが構成表において占める位置を特定する情報を取得する。選択手段は、障害モジュールに対応する節点から遡って構成表を探索することにより、障害モジュールに至る経路を構成表上の節点の連なりとして推定し、経路上に位置する構成表の節点をログ収集対象の節点として選択する。選択情報保持手段は、構成表を構成する各節点について、選択手段によってログ収集対象として選択されたか否かを示す選択情報を保持する。ログ収集手段は、再現試験の際に、ソフトウェアを構成する各モジュールの実行に応じてモジュールにかかわるログ情報を収集し、バッファに蓄積する。判定手段は、選択情報保持手段に保持された選択情報に基づいて、ログ収集手段で収集されたログ情報がログ収集対象の節点に対応するか否かを判定する。ログ廃棄手段は、収集されたログ情報がログ収集対象の節点に対応しない旨の判定結果に応じて、ログ情報に至るまでの経路についてバッファに蓄積されたログ情報を廃棄する。
ソフトウェアの実行中に何らかの障害が発生すると、障害位置特定手段により、障害が発生した障害モジュールが構成表において占める位置が特定され、選択手段により、この障害モジュールに至る経路上にあるログ収集対象の節点が選択されて、これらの節点を示す選択情報が選択情報保持手段に保持される。
本発明にかかわる第2の障害ログ自動選択収集装置の原理は、以下の通りである。
上述した第1の障害ログ自動選択収集装置において、選択情報保持手段は、設定レジスタの一部を用いて構成される。
例えば、設定レジスタの各ビットが構成表の各節点に対応付けられ、選択手段による選択結果に応じて、各節点に対応する設定レジスタのビットをセットすることにより、ログ収集対象の節点が示される。
本発明にかかわる第3の障害ログ自動選択収集装置は、上述した第1の障害ログ自動選択収集総理において、エラー情報収集手段と、種類決定手段とを備え、ログ収集手段に要素情報収集手段を備えて構成される。
上述した第1の障害ログ自動選択収集装置において、エラー情報収集手段は、障害の発生に応じて、障害に関するエラー情報を収集する。種類決定手段は、エラー情報収集手段によって収集されたエラー情報に基づいて、それぞれ要素情報の組み合わせが異なる複数種類のログ情報セットから適切なログ情報セットを決定し、決定したログ情報セットを示す情報をログ収集手段に通知する。要素情報収集手段は、ログ収集手段は、種類決定手段からの通知で指定された情報によって示されるログ情報セットに含まれる各要素情報をそれぞれ収集する。
障害の発生に応じてエラー情報収集手段によって収集されたエラー情報に基づいて、種類決定手段により、発生したエラーに対応する要素情報の組み合わせを示すログ情報セットが決定され、ログ収集手段に通知される。このログ情報セットで示される少なくとも一つの要素情報が、対応する要素情報収集手段によってログ情報の一部として収集され、バッファに蓄積される。
したがって、現実的な容量をログ収集用のバッファに割り当てることにより、確実に障害の原因となった事象を示すログ情報を収集することができるので、障害発生の原因究明に要する労力を大幅に削減し、迅速に対策を講じることが可能となる。
更に、発生した障害に応じて、適切な要素情報の組み合わせからなるログ情報を収集することにより、障害の解析に有用な情報を選択的に収集することができるので、ログ情報を蓄積するバッファの容量を更に有効に利用することができる。
(第1の実施形態)
図1に、本発明にかかわる障害ログ自動選択収集装置の第1の実施形態を示す。
図1に示した障害ログ自動選択収集装置210は、モジュール処理部201から受け取ったエラー通知とモジュール処理部201に渡されるモジュールコールに基づいて、後述するようにしてエラー通知にかかわるプログラムモジュールにかかわるログ情報を選択的に収集する。
このとき、ルート追跡処理部212は、図2(a)に示すように、モジュール特定部211から通知されたプログラムモジュール(例えば、図2(a)において、符号FB22で示す関数B22)から遡って、呼出元のプログラムエントリ(図2(a)において符号PEで示した)に至るまで構成表の木構造を辿っていき、このとき通過した節点にあたるプログラムモジュール(図2(a)において黒い丸印を付して示したFB2、FB)に対応する選択フラグをセットする。
モジュール処理部201に送られるモジュールコールに応じて、このモジュールコールで指定されたプログラムモジュールに関するログ情報が図1に示したログ取得部215によって取得され、ログ選択収集部216のログ判別部217を介してバッファ218に蓄積される。
図1に示したモジュール処理部201に渡されるモジュールコールに応じて、ログ取得部215により、該当するログ情報が取得され(図3のステップ301,302参照)、ログ選択収集部216に渡される。
図1に示したログ判別部217は、選択フラグ保持部214に上述したモジュールコールで指定されるプログラムモジュールに対応して保持された選択フラグを参照し、渡されたログ情報がログ情報収集対象のプログラムモジュールに対応するか否かを判定する(図3のステップ303参照)。
例えば、上述した関数Bに対応するプログラムモジュールを指定したモジュールコールに続いて、関数B2に対応するプログラムモジュールを指定したモジュールコールが入力されると、これに応じて、図1に示したログ取得部215によって取得されたログ情報は、図4(a)に示すように、関数Bに対応するログ情報FBに続いてバッファ218に蓄積される。
一方、上述したようにして、関数B、関数B2に対応するプログラムモジュールにかかわるログ情報が蓄積された後に、関数B21に対応するプログラムモジュールを指定したモジュールコールが入力されると、このプログラムモジュールに対応する選択フラグに基づいて、図1に示したログ判別部217により、このログ情報は収集対象ではないと判断される(ステップ303の否定判定)。
(第2の実施形態)
図5に、本発明にかかわる障害ログ自動選択収集装置の第2の実施形態を示す。
図5に示したエラー情報収集部221は、モジュール処理部201からのエラー通知に応じて、通知されたエラーに関するエラー情報を収集し、ログ種別判定部222の処理に供する。
例えば、ログ種別判定部222は、アクセス先のアドレスの履歴に注目するログ種別や書込データの履歴に注目するログ種別とこれらのログ種別ごとに収集対象の要素情報を示す種別フラグを用意しておき、エラー情報に基づいて、必要とされる要素情報の組み合わせに最も近い組み合わせに対応する種別フラグを種別フラグ保持部223に格納する。
このようにして、障害の解析に必要とされる要素情報のみからなるログ情報をログ選択収集部216に渡すことにより、このログ選択収集部216に備えられたバッファ218に蓄積されるログ情報の情報量を更に圧縮することが可能となる。
210 障害ログ自動選択収集装置
211 モジュール特定部
212 ルート追跡処理部
213 構成表保持部
214 選択フラグ保持部
215 ログ取得部
216 ログ選択収集部
217 ログ判別部
218 バッファ
219 ログ廃棄部
221 エラー情報収集部
222 ログ種別判定部
223 種別フラグ保持部
224 ログ編成部
Claims (4)
- 情報処理システムによって実行されるソフトウェアにかかわる障害の原因を特定するための再現試験で障害にかかわる過程を表す障害ログ情報を収集する障害ログ自動選択収集方法において、
前記ソフトウェアの実行にかかわる障害の表出に応じて、前記障害の表出した時点で実行されていた障害モジュールが前記ソフトウェアを構成する複数のプログラムエントリおよびこれらのプログラムエントリを構成する複数のモジュール相互の関係を示す構成表において占める位置を特定する障害位置特定手順と、
前記障害モジュールに対応する節点から遡って前記構成表を探索することにより、前記障害モジュールに至る経路を前記構成表上の節点の連なりとして推定し、前記経路上に位置する前記構成表の節点をログ収集対象の節点として選択する選択手順と、
再現試験の際に、前記ソフトウェアを構成する各モジュールの実行に応じて前記モジュールにかかわるログ情報を収集するログ収集手順と、
前記ログ収集手順で収集されたログ情報が前記ログ収集対象の節点に対応するか否かを判定する判定手順と、
収集されたログ情報が前記ログ収集対象の節点に対応しない旨の判定結果に応じて、前記ログ情報に至るまでの経路について収集されたログ情報を廃棄するログ廃棄手順と
を備えたことを特徴とする障害ログ自動選択収集方法。 - 情報処理システムによって実行されるソフトウェアにかかわる障害の原因を特定するための再現試験で障害にかかわる過程を表す障害ログ情報を収集する障害ログ自動選択収集装置において、
前記ソフトウェアを構成する複数のプログラムエントリおよびこれらのプログラムエントリを構成する複数のモジュール相互の関係を示す構成表と、
前記ソフトウェアの実行にかかわる障害の表出に応じて、前記障害の表出した時点で実行されていた障害モジュールが前記構成表において占める位置を特定する情報を取得する障害位置特定手段と、
前記障害モジュールに対応する節点から遡って前記構成表を探索することにより、前記障害モジュールに至る経路を前記構成表上の節点の連なりとして推定し、前記経路上に位置する前記構成表の節点をログ収集対象の節点として選択する選択手段と、
前記構成表を構成する各節点について、前記選択手段によってログ収集対象として選択されたか否かを示す選択情報を保持する選択情報保持手段と、
再現試験の際に、前記ソフトウェアを構成する各モジュールの実行に応じて前記モジュールにかかわるログ情報を収集し、バッファに蓄積するログ収集手段と、
前記選択情報保持手段に保持された選択情報に基づいて、前記ログ収集手段で収集されたログ情報が前記ログ収集対象の節点に対応するか否かを判定する判定手段と、
収集されたログ情報が前記ログ収集対象の節点に対応しない旨の判定結果に応じて、前記ログ情報に至るまでの経路について前記バッファに蓄積されたログ情報を廃棄するログ廃棄手段と
を備えたことを特徴とする障害ログ自動選択収集装置。 - 請求項2に記載の障害ログ自動選択収集装置において、
前記選択情報保持手段は、設定レジスタの一部を用いて構成される
ことを特徴とする障害ログ自動選択収集装置。 - 請求項2に記載の障害ログ自動選択収集装置において、
障害の発生に応じて、前記障害に関するエラー情報を収集するエラー情報収集手段と、
前記エラー情報収集手段によって収集されたエラー情報に基づいて、それぞれ要素情報の組み合わせが異なる複数種類のログ情報セットから適切なログ情報セットを決定し、決定したログ情報セットを示す情報を前記ログ収集手段に通知する種類決定手段とを備え、
前記ログ収集手段は、前記種類決定手段からの通知で指定された情報によって示されるログ情報セットに含まれる各要素情報をそれぞれ収集する要素情報収集手段を備えた
ことを特徴とする障害ログ自動選択収集装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006070811A JP5040129B2 (ja) | 2006-03-15 | 2006-03-15 | 障害ログ自動選択収集方法および装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006070811A JP5040129B2 (ja) | 2006-03-15 | 2006-03-15 | 障害ログ自動選択収集方法および装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007249490A true JP2007249490A (ja) | 2007-09-27 |
JP5040129B2 JP5040129B2 (ja) | 2012-10-03 |
Family
ID=38593728
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006070811A Expired - Fee Related JP5040129B2 (ja) | 2006-03-15 | 2006-03-15 | 障害ログ自動選択収集方法および装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5040129B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009230301A (ja) * | 2008-03-21 | 2009-10-08 | Fujitsu Ltd | ログデータの取得のための制御方法および装置、並びにコンピュータプログラム |
JP2010191527A (ja) * | 2009-02-16 | 2010-09-02 | Nec Corp | プログラム修正システム、端末装置、サーバ装置、プログラム修正方法、エラー検出プログラム及び管理プログラム |
US10664340B2 (en) | 2017-02-16 | 2020-05-26 | Fujitsu Limited | Failure analysis program, failure analysis device, and failure analysis method |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02294845A (ja) * | 1989-05-10 | 1990-12-05 | Fujitsu Ltd | プログラムトレース装置 |
JPH103403A (ja) * | 1996-06-18 | 1998-01-06 | Toshiba Corp | 計算機システムおよびデバッグ方法 |
JP2000089977A (ja) * | 1998-09-10 | 2000-03-31 | Toshiba Corp | デバッグシステム |
JP2003076578A (ja) * | 2001-09-03 | 2003-03-14 | Mitsubishi Electric Corp | マイクロコンピュータ及びデバッグシステム並びにトレース情報収集方法 |
-
2006
- 2006-03-15 JP JP2006070811A patent/JP5040129B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02294845A (ja) * | 1989-05-10 | 1990-12-05 | Fujitsu Ltd | プログラムトレース装置 |
JPH103403A (ja) * | 1996-06-18 | 1998-01-06 | Toshiba Corp | 計算機システムおよびデバッグ方法 |
JP2000089977A (ja) * | 1998-09-10 | 2000-03-31 | Toshiba Corp | デバッグシステム |
JP2003076578A (ja) * | 2001-09-03 | 2003-03-14 | Mitsubishi Electric Corp | マイクロコンピュータ及びデバッグシステム並びにトレース情報収集方法 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009230301A (ja) * | 2008-03-21 | 2009-10-08 | Fujitsu Ltd | ログデータの取得のための制御方法および装置、並びにコンピュータプログラム |
JP2010191527A (ja) * | 2009-02-16 | 2010-09-02 | Nec Corp | プログラム修正システム、端末装置、サーバ装置、プログラム修正方法、エラー検出プログラム及び管理プログラム |
US10664340B2 (en) | 2017-02-16 | 2020-05-26 | Fujitsu Limited | Failure analysis program, failure analysis device, and failure analysis method |
Also Published As
Publication number | Publication date |
---|---|
JP5040129B2 (ja) | 2012-10-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109542889B (zh) | 流式数据列存储方法、装置、设备和存储介质 | |
US20080065928A1 (en) | Technique for supporting finding of location of cause of failure occurrence | |
US8132051B2 (en) | Method and system for sampling input data | |
CN109710439B (zh) | 故障处理方法和装置 | |
CN106980572B (zh) | 分布式***的在线调试方法和*** | |
CN103488563A (zh) | 并行程序的数据竞争检测方法、装置及多核处理*** | |
CN108628740A (zh) | 一种文件描述符泄露检测方法及装置 | |
CN111314158B (zh) | 大数据平台监控方法、装置及设备、介质 | |
JP2013206147A (ja) | ロギング装置、ロギング方法及びプログラム | |
CN110196792B (zh) | 故障预测方法、装置、计算设备及存储介质 | |
JP5040129B2 (ja) | 障害ログ自動選択収集方法および装置 | |
US20090217108A1 (en) | Method, system and computer program product for processing error information in a system | |
CN112579327B (zh) | 一种故障检测方法、装置及设备 | |
CN107783879B (zh) | 一种用于分析工作流执行路径的方法与设备 | |
CN111274060A (zh) | 一种确定内存异常的方法、装置、设备和存储介质 | |
JP2006350876A (ja) | ヒープダンプ取得方法 | |
JP2010122959A (ja) | テスト支援システム、方法、及び、プログラム | |
CN101706752B (zh) | 一种软件错误现场定位的方法及装置 | |
CN111901172B (zh) | 基于云计算环境下的应用服务监控方法及*** | |
JP2009110318A (ja) | 障害情報出力制御装置及びそれらに用いる障害情報出力制御方法並びにそのプログラム | |
JP4894567B2 (ja) | トレース情報出力装置、および、トレース情報出力方法 | |
JP2009217617A (ja) | メモリリーク箇所の特定方法及び装置 | |
CN110955710B (zh) | 一种数据交换作业中脏数据的处理方法及装置 | |
CN112114987B (zh) | 运行环境的异常检测方法、装置、智能终端及存储介质 | |
CN113485859A (zh) | 故障定位方法、装置、电子设备和计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080911 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100826 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110712 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110912 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120131 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120425 |
|
A911 | Transfer of reconsideration by examiner before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20120502 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120612 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120625 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150720 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |