JP4992740B2 - マルチプロセッサシステム、障害検出方法および障害検出プログラム - Google Patents
マルチプロセッサシステム、障害検出方法および障害検出プログラム Download PDFInfo
- Publication number
- JP4992740B2 JP4992740B2 JP2008015330A JP2008015330A JP4992740B2 JP 4992740 B2 JP4992740 B2 JP 4992740B2 JP 2008015330 A JP2008015330 A JP 2008015330A JP 2008015330 A JP2008015330 A JP 2008015330A JP 4992740 B2 JP4992740 B2 JP 4992740B2
- Authority
- JP
- Japan
- Prior art keywords
- processor
- watchdog
- daemon
- cpu
- failure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
Description
待機中のタスクが実行権を獲得した際に動作するプロセッサの識別子が対応するタスクごとに格納されているプロセッサ情報と、ウォッチドッグデーモンが動作するプロセッサを順次移動させて巡回させるためのルールであるプロセッサ移動ルールと、を格納するための記憶手段と、
ウォッチドッグデーモンのタスクに対応する前記プロセッサ情報を前記プロセッサ移動ルールに基づいて更新し、更新後のプロセッサ情報を前記記憶手段に書き込むウォッチドッグ管理手段と、
を備えることを特徴とするマルチプロセッサシステム。
前記ウォッチドッグ起動履歴に基づいて、所定の時間を超えてウォッチドッグデーモンが動作していないプロセッサがあると判断した場合には、そのプロセッサに障害が発生したことを示す障害発生を通知するウォッチドッグ起動監視手段と、
をさらに備えることを特徴とする付記1に記載のマルチプロセッサシステム。
をさらに備え、
前記ウォッチドッグ管理手段が、前記変更要求に基づいて前記プロセッサ移動ルールを書き換えることを特徴とする付記1または2に記載のマルチプロセッサシステム。
をさらに備えることを特徴とする付記1、2または3に記載のマルチプロセッサシステム。
ウォッチドッグデーモンが動作するプロセッサを順次移動させて巡回させるためのルールであるプロセッサ移動ルールを格納するプロセッサ移動ルール格納ステップと、
待機中のタスクが実行権を獲得した際に動作するプロセッサの識別子が対応するタスクごとに格納されているプロセッサ情報のうち、ウォッチドッグデーモンのタスクに対応するプロセッサ情報を、前記プロセッサ移動ルールに基づいて更新するウォッチドッグ管理ステップと、
を含むことを特徴とする障害検出方法。
前記ウォッチドッグ起動履歴に基づいて、所定の時間を超えてウォッチドッグデーモンが動作していないプロセッサがあると判断した場合には、そのプロセッサに障害が発生したことを示す障害発生を通知するウォッチドッグ起動監視ステップと、
をさらに含むことを特徴とする付記6に記載の障害検出方法。
前記変更要求に基づいて前記プロセッサ移動ルールを書き換えるステップと、
をさらに含むことを特徴とする付記6または7に記載の障害検出方法。
をさらに含むことを特徴とする付記6、7または8に記載の障害検出方法。
ウォッチドッグデーモンが動作するプロセッサを順次移動させて巡回させるためのルールであるプロセッサ移動ルールを記憶部に格納するプロセッサ移動ルール格納手順と、
記憶部からプロセッサ移動ルールを読み出し、さらに待機中のタスクが実行権を獲得した際に動作するプロセッサの識別子が対応するタスクごとに格納されているプロセッサ情報のうち、ウォッチドッグデーモンのタスクに対応するプロセッサ情報を記憶部から読み出し、読み出したプロセッサ情報を前記プロセッサ移動ルールに基づいて更新し、更新後のプロセッサ情報を記憶部に書き込むウォッチドッグ管理手順と、
をコンピュータに実行させることを特徴とする障害検出プログラム。
記憶部からウォッチドッグ起動履歴を読み出し、読み出したウォッチドッグ起動履歴に基づいて、所定の時間を超えてウォッチドッグデーモンが動作していないプロセッサがあると判断した場合には、そのプロセッサに障害が発生したことを示す障害発生を通知するウォッチドッグ起動監視手順と、
をさらに含むことを特徴とする付記11に記載の障害検出プログラム。
前記変更要求に基づいて前記プロセッサ移動ルールを書き換える手順と、
をさらに含むことを特徴とする付記11または12に記載の障害検出プログラム。
をさらに含むことを特徴とする付記11、12または13に記載の障害検出プログラム。
2 一次記憶装置
3 出力先装置
10 スケジューラ
11 WDデーモン
12,12a WD管理部
13 ダンプファイル出力部
14 WD履歴記録部
15 WD起動監視部
16 WD挙動指定部
17 プログラム走行履歴記録部
18 ダンプファイル出力先指定部
31 ディスク
32 パケット処理装置
33 標準出力装置
34 メモリ
Claims (7)
- 複数のプロセッサと、計数した時間が所定の時間を超過した場合には、障害発生を通知する1つのウォッチドッグタイマとを備えるマルチプロセッサシステムにおいて、
待機中のタスクが実行権を獲得した際に動作するプロセッサの識別子が対応するタスクごとに格納されているプロセッサ情報と、前記プロセッサにより実行された場合には、前記ウォッチドッグタイマが計数した時間をクリアするウォッチドッグデーモンが動作するプロセッサを順次移動させて巡回させるためのルールであるプロセッサ移動ルールと、を格納するための記憶手段と、
ウォッチドッグデーモンのタスクに対応する前記プロセッサ情報を前記プロセッサ移動ルールに基づいて更新し、更新後のプロセッサ情報を前記記憶手段に書き込むウォッチドッグ管理手段と、
を備えることを特徴とするマルチプロセッサシステム。 - 前記記憶手段に、ウォッチドッグデーモンが動作したプロセッサの識別子とウォッチドッグデーモンがウォッチドッグタイマをクリアした時刻とを対応付けてウォッチドッグ起動履歴として格納するウォッチドッグ履歴記録手段と、
前記ウォッチドッグ起動履歴に基づいて、所定の時間を超えてウォッチドッグデーモンが動作していないプロセッサがあると判断した場合には、そのプロセッサに障害が発生したことを示す障害発生を通知するウォッチドッグ起動監視手段と、
をさらに備えることを特徴とする請求項1に記載のマルチプロセッサシステム。 - 前記プロセッサ移動ルールに対するユーザーからの変更要求を受け付けるウォッチドッグデーモン挙動指定手段、
をさらに備え、
前記ウォッチドッグ管理手段が、前記変更要求に基づいて前記プロセッサ移動ルールを書き換えることを特徴とする請求項1または2に記載のマルチプロセッサシステム。 - 障害発生の通知が行われた場合、実行命令を含むレジスタ情報、タスク情報、スタック情報を含むプログラム走行情報を、障害発生を検出してから所定の期間収集し、収集したプログラム走行情報を前記記憶手段へ書き込むプログラム走行履歴記録手段、
をさらに備えることを特徴とする請求項1、2または3に記載のマルチプロセッサシステム。 - 前記プログラム走行履歴の出力先の装置を変更可能とすることを特徴とする請求項4に記載のマルチプロセッサシステム。
- 複数のプロセッサと、計数した時間が所定の時間を超過した場合には、障害発生を通知する1つのウォッチドッグタイマとを備えるマルチプロセッサシステムが実行する障害検出方法であって、
前記プロセッサにより実行された場合には、前記ウォッチドッグタイマが計数した時間をクリアするウォッチドッグデーモンが動作するプロセッサを順次移動させて巡回させるためのルールであるプロセッサ移動ルールを格納するプロセッサ移動ルール格納ステップと、
待機中のタスクが実行権を獲得した際に動作するプロセッサの識別子が対応するタスクごとに格納されているプロセッサ情報のうち、ウォッチドッグデーモンのタスクに対応するプロセッサ情報を、当該ウォッチドッグデーモンが動作するプロセッサを順次移動させて巡回させるためのルールであるプロセッサ移動ルールに基づいて更新するウォッチドッグ管理ステップと
を含むことを特徴とする障害検出方法。 - 複数のプロセッサと、計数した時間が所定の時間を超過した場合には、障害発生を通知する1つのウォッチドッグタイマとを備えるコンピュータが実行する障害検出プログラムであって、
前記プロセッサにより実行された場合には、前記ウォッチドッグタイマが計数した時間をクリアするウォッチドッグデーモンが動作するプロセッサを順次移動させて巡回させるためのルールであるプロセッサ移動ルールを記憶部に格納するプロセッサ移動ルール格納手順と、
記憶部からプロセッサ移動ルールを読み出し、さらに待機中のタスクが実行権を獲得した際に動作するプロセッサの識別子が対応するタスクごとに格納されているプロセッサ情報のうち、ウォッチドッグデーモンのタスクに対応するプロセッサ情報を記憶部から読み出し、読み出したプロセッサ情報を、当該ウォッチドッグデーモンが動作するプロセッサを順次移動させて巡回させるためのルールであるプロセッサ移動ルールに基づいて更新するウォッチドッグ管理手順と
をコンピュータに実行させることを特徴とする障害検出プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008015330A JP4992740B2 (ja) | 2008-01-25 | 2008-01-25 | マルチプロセッサシステム、障害検出方法および障害検出プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008015330A JP4992740B2 (ja) | 2008-01-25 | 2008-01-25 | マルチプロセッサシステム、障害検出方法および障害検出プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009176146A JP2009176146A (ja) | 2009-08-06 |
JP4992740B2 true JP4992740B2 (ja) | 2012-08-08 |
Family
ID=41031140
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008015330A Expired - Fee Related JP4992740B2 (ja) | 2008-01-25 | 2008-01-25 | マルチプロセッサシステム、障害検出方法および障害検出プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4992740B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107391174A (zh) * | 2017-06-15 | 2017-11-24 | 广州视源电子科技股份有限公司 | 一种***在线升级的控制方法及控制装置 |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5440073B2 (ja) | 2009-09-30 | 2014-03-12 | 富士通株式会社 | 情報処理装置,情報処理装置の制御方法および制御プログラム |
JP6191211B2 (ja) * | 2013-04-16 | 2017-09-06 | 株式会社リコー | 電子機器、画像処理装置及び信号送信方法 |
CN104572332B (zh) * | 2015-02-09 | 2018-08-21 | 华为技术有限公司 | 处理***崩溃的方法和装置 |
JP6562744B2 (ja) | 2015-07-13 | 2019-08-21 | キヤノン株式会社 | システム、及び制御方法 |
JP7304732B2 (ja) * | 2019-04-16 | 2023-07-07 | ローム株式会社 | 監視装置 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0253169A (ja) * | 1988-08-17 | 1990-02-22 | Hitachi Ltd | マルチマイクロプロセッサシステムの故障検知装置 |
JPH07114518A (ja) * | 1993-10-15 | 1995-05-02 | Fujitsu Ltd | マルチプロセッサシステムにおけるタスクスケジューリング方式 |
JPH11282780A (ja) * | 1998-03-26 | 1999-10-15 | Omron Corp | Faネットワークシステム |
JPH11288406A (ja) * | 1998-04-02 | 1999-10-19 | Toshiba Corp | 動作監視機能付きマルチプロセッサシステム |
JP2000293407A (ja) * | 1999-04-09 | 2000-10-20 | Nec Eng Ltd | 監視制御装置及びcpu監視方法並びにプログラム記録媒体 |
JP2002351702A (ja) * | 2001-05-25 | 2002-12-06 | Nec Soft Ltd | オンライン利用の端末稼働統計データ作成方法及び装置 |
-
2008
- 2008-01-25 JP JP2008015330A patent/JP4992740B2/ja not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107391174A (zh) * | 2017-06-15 | 2017-11-24 | 广州视源电子科技股份有限公司 | 一种***在线升级的控制方法及控制装置 |
CN107391174B (zh) * | 2017-06-15 | 2020-12-04 | 广州视源电子科技股份有限公司 | 一种***在线升级的控制方法及控制装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2009176146A (ja) | 2009-08-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4489802B2 (ja) | マルチcpuコンピュータおよびシステム再起動方法 | |
US9335998B2 (en) | Multi-core processor system, monitoring control method, and computer product | |
US8935698B2 (en) | Management of migrating threads within a computing environment to transform multiple threading mode processors to single thread mode processors | |
JP5259714B2 (ja) | 実行順序決定装置、実行順序決定プログラム、実行順序決定回路及び情報処理装置 | |
US8448013B2 (en) | Failure-specific data collection and recovery for enterprise storage controllers | |
US20090193298A1 (en) | System and method of fault detection, diagnosis and prevention for complex computing systems | |
US20090144742A1 (en) | Method, system and computer program to optimize deterministic event record and replay | |
JP4992740B2 (ja) | マルチプロセッサシステム、障害検出方法および障害検出プログラム | |
US20090089554A1 (en) | Method for tuning chipset parameters to achieve optimal performance under varying workload types | |
JP6288275B2 (ja) | 仮想化基盤管理装置、仮想化基盤管理システム、仮想化基盤管理方法、及び、仮想化基盤管理プログラム | |
US20120180057A1 (en) | Activity Recording System for a Concurrent Software Environment | |
JP2006277115A (ja) | 異常検出プログラムおよび異常検出方法 | |
JP2011108201A (ja) | 情報処理装置、診断方法および診断プログラム | |
US20130227586A1 (en) | Recording Activity of Software Threads in a Concurrent Software Environment | |
JP5623557B2 (ja) | 診断データを収集するためのマルチスレッド化コンピューティング環境における方法、装置、およびコンピュータ・プログラム | |
US20140373029A1 (en) | Recording Activity of Software Threads in a Concurrent Software Environment | |
JP2013206379A (ja) | クラスタ監視装置、クラスタ監視方法、及びプログラム | |
JP4761229B2 (ja) | 運用管理装置、運用管理方法ならびにプログラム | |
JP5440073B2 (ja) | 情報処理装置,情報処理装置の制御方法および制御プログラム | |
WO2009123343A1 (ja) | 競合分析装置、競合分析方法、及びプログラム | |
JP6677021B2 (ja) | 情報処理装置、情報処理方法、プログラム | |
US6658510B1 (en) | Software method to retry access to peripherals that can cause bus timeouts during momentary busy periods | |
WO2009147738A1 (ja) | 情報処理装置及びその制御方法並びにモニタプログラム | |
JPH11353284A (ja) | ジョブ再実行方法 | |
JPH11288406A (ja) | 動作監視機能付きマルチプロセッサシステム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100820 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110926 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111004 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111202 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120410 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120423 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150518 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |