JP2008217191A - 障害処理方法、プログラム及び情報処理装置 - Google Patents

障害処理方法、プログラム及び情報処理装置 Download PDF

Info

Publication number
JP2008217191A
JP2008217191A JP2007051045A JP2007051045A JP2008217191A JP 2008217191 A JP2008217191 A JP 2008217191A JP 2007051045 A JP2007051045 A JP 2007051045A JP 2007051045 A JP2007051045 A JP 2007051045A JP 2008217191 A JP2008217191 A JP 2008217191A
Authority
JP
Japan
Prior art keywords
hardware resource
initialization
information
time
mounting position
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007051045A
Other languages
English (en)
Other versions
JP5019252B2 (ja
Inventor
Hirotaka Arai
拡貴 荒井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2007051045A priority Critical patent/JP5019252B2/ja
Publication of JP2008217191A publication Critical patent/JP2008217191A/ja
Application granted granted Critical
Publication of JP5019252B2 publication Critical patent/JP5019252B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Hardware Redundancy (AREA)

Abstract

【課題】本発明の目的は、ハードウエア構成が変更され得る情報処理装置における障害からの自動回復に好適な障害処理方法、プログラム及び情報処理装置を提供することである。
【解決手段】障害処理方法は、情報処理装置(1)を対象とする。前記情報処理装置は、第1ハードウエア資源(30−K)と、前記第1ハードウエア資源を過去に初期化したときにかかった第1初期化時間を示す第1初期化時間情報(26c)を記憶した記憶部(23)とを具備する。本発明による障害処理方法は、(a)前記情報処理装置の起動時に、前記第1ハードウエア資源の初期化を開始するステップ(S4)と、(b)前記第1ハードウエア資源の初期化を開始してからの第1経過時間を測定するステップ(S5)と、(c)前記第1ハードウエア資源の初期化が完了する前に前記第1経過時間が前記第1初期化時間を超えた場合、前記第1ハードウエア資源の異常を検出するステップ(S6)とを具備する。
【選択図】図4

Description

本発明は、障害から自動で回復するための障害処理方法、プログラム及び情報処理装置に関する。
従来、情報処理装置の起動時に障害が発生した場合、故障が発生した部位を特定し、その部位を切り離して障害から自動で回復することが行われている。しかし、故障が発生した部位を明確に特定することができない場合、情報処理装置が起動不能となることがある。故障が発生した部位が明確に特定できない場合であっても、起動不能障害から自動で回復するための技術が必要とされている。
特許文献1は、ウオッチドッグタイマを開示している。ウオッチドッグタイマは、CPU(中央演算装置)による初期化が必要なシステムに搭載される。ウオッチドッグタイマは、システムの起動後にCPUから繰り返し入力されるクリア命令が、所定時間経過しても入力されないときに、CPUが暴走したと認識し、異常検知信号を出力する。ウオッチドッグタイマは、システムの起動直後は第1の監視間隔でCPUからのクリア命令を監視し、CPUからクリア命令が入力された後は、第1の監視間隔でCPUからのクリア命令を監視することを特徴としている。ウオッチドッグタイマは、システムの初期化処理に要する時間を考慮する必要がなく、しかも、システム初期化時におけるCPUの暴走を確実に検出することができるという効果を奏する。
特許文献2は、自動預金支払機(ATM)の起動状態を監視する起動監視装置を開示している。起動監視装置は、起動監視手段と、時間計測手段と、再起動制御手段とを備える。起動監視手段は、システム起動時の初期化処理を分割し、分割した初期化処理毎の起動状態を監視する。時間計測手段は、起動監視手段が監視した初期化処理毎の時間を計測する。再起動制御手段は、時間計測手段で計測した時間が設定された起動許容時間を超えたとき、再起動を行う。起動監視装置によれば、システム起動時の初期化処理毎の起動状態を複数段階に分けて時間監視するため、起動不可発生時には直ちに再起動をすることができる。特に、システム構成を考慮した余裕時間を設定する必要がなくなるため、無駄な設定時間を省略して短時間に正確な起動可否を検知することができる。
ATMの場合、通常そのハードウエア構成はユーザによって変更されない。一方、パーソナルコンピュータのような情報処理装置の場合、ユーザがハードウエア構成を自由に変更することが可能である。すなわち、起動不能障害から回復するための回復手段を情報処理装置に組み込んだ後に、情報処理装置のハードウエア構成が変更されることが起こり得る。
特開2005−122424号公報 特開平10−171546号公報
本発明の目的は、ハードウエア構成が変更され得る情報処理装置における障害からの自動回復に好適な障害処理方法、プログラム及び情報処理装置を提供することである。
以下に、(発明を実施するための最良の形態)で使用される番号を用いて、課題を解決するための手段を説明する。これらの番号は、(特許請求の範囲)の記載と(発明を実施するための最良の形態)との対応関係を明らかにするために付加されたものである。ただし、それらの番号を、(特許請求の範囲)に記載されている発明の技術的範囲の解釈に用いてはならない。
本発明による障害処理方法は、情報処理装置(1)の障害処理方法である。前記情報処理装置は、第1ハードウエア資源(30−K)と、前記ハードウエア資源を過去に初期化したときにかかった第1初期化時間を示す第1初期化時間情報(26c)を記憶した記憶部(23)とを具備する。本発明による障害処理方法は、(a)前記情報処理装置の起動時に、前記第1ハードウエア資源の初期化を開始するステップ(S4)と、(b)前記第1ハードウエア資源の初期化を開始してからの第1経過時間を測定するステップ(S4)と、(c)前記第1ハードウエア資源の初期化が完了する前に前記第1経過時間が前記第1初期化時間を超えた場合、前記第1ハードウエア資源の異常を検出するステップ(S6)とを具備する。
本発明においては、ハードウエア資源の初期化中の経過時間とハードウエア資源を過去に初期化した際の初期化時間との比較に基づいてハードウエア資源の異常が検出される。したがって、ハードウエア資源が交換された場合であっても、誤って異常が検出されることが防がれる。また、本発明においては、以下に記載するように、ハードウエア資源から受け取った自己情報と、記憶されている識別情報とを比較することが好ましい。自己情報と識別情報とが一致しない場合、経過時間と初期化時間とを比較しなければ、誤って異常が検出されることが防がれる。
前記第1ハードウエア資源は、第1実装位置(40−K)に実装されていることが好ましい。前記記憶部は、前記第1ハードウエア資源を示す第1識別情報(26b)と前記第1初期化時間情報とを、前記第1実装位置を示す第1実装位置情報(26a)に対応付けて記憶していることが好ましい。本発明による障害処理方法は、(d)前記第1ハードウエア資源が自己を示す第1自己情報を出力するステップ(S1)と、(e)前記第1自己情報と前記第1識別情報とを比較するステップ(S1)とを具備することが好ましい。
前記(c)ステップにおいて、前記第1ハードウエア資源の初期化が完了する前に前記第1経過時間が前記第1初期化時間に所定のマージンを加えた時間を超えた場合、前記第1ハードウエア資源の異常を検出することが好ましい。
本発明による障害処理方法は、(f)前記第1ハードウエア資源を論理的に切り離すステップ(S9、S10)を具備することが好ましい。
前記情報処理装置は、第2ハードウエア資源(30−L)を具備することが好ましい。前記第1ハードウエア資源は、第1実装位置(40−K)に実装されている。前記第2ハードウエア資源は、第2実装位置(40−L)に実装されている。前記記憶部は、前記第2実装位置を示す第2実装位置情報(29a)と前記第1実装位置を示す第1実装位置情報(29a)とを関連付けて記憶することが好ましい。本発明による障害処理方法は、(g)前記第1ハードウエア資源及び前記第2ハードウエア資源を論理的に切り離すステップを具備することが好ましい。
前記情報処理装置は、第3実装位置(40−1)に実装された第3ハードウエア資源(30−1’)を具備することが好ましい。前記記憶部は、第3識別情報(26b)及び第3初期化時間を示す第3初期化時間情報(26c)を、前記第3実装位置を示す第3実装位置情報(26a)に対応付けて記憶することが好ましい。本発明による障害処理方法は、(h)前記第3ハードウエア資源が自己を示す第3自己情報を出力するステップ(S1)と、(i)前記第3自己情報と前記第3識別情報とを比較するステップ(S1)と、(j)前記第3ハードウエア資源の初期化を開始するステップ(S4)と、(k)前記第3ハードウエア資源の初期化を開始してからの第3経過時間を測定するステップ(S4)と、(l)前記第3ハードウエア資源の初期化が完了する前に前記第3経過時間が前記第3初期化時間を超えたとき、前記第3自己情報と前記第3識別情報とが一致している場合に前記第3ハードウエア資源の異常を検出し、一致していない場合に前記第3ハードウエア資源の異常を検出しないステップ(S6)と、(m)前記第3ハードウエア資源を示すように前記第3識別情報を更新し、前記第3ハードウエア資源の初期化が完了したときの前記第3経過時間を示すように前記第3初期化時間情報を更新するステップ(S7)とを具備することが好ましい。
本発明によるプログラムは、上記障害処理方法のいずれかをコンピュータ(1)に実行させる。
本発明による情報処理装置(1)は、制御部(20)と、第1ハードウエア資源(30−K)と、前記制御部が前記第1ハードウエア資源を過去に初期化したときにかかった第1初期化時間を示す第1初期化時間情報(26c)を記憶した記憶部(23)とを具備する。前記制御部は、前記情報処理装置の起動時に、前記第1ハードウエア資源の初期化を開始し、前記第1ハードウエア資源の初期化を開始してからの第1経過時間を測定し、前記第1ハードウエア資源の初期化が完了する前に前記第1経過時間が前記第1初期化時間を超えた場合、前記第1ハードウエア資源の異常を検出する。
本発明によれば、ハードウエア構成が変更され得る情報処理装置における障害からの自動回復に好適な障害処理方法、プログラム及び情報処理装置が提供される。
添付図面を参照して、本発明による障害処理方法、プログラム及び情報処理装置を実施するための最良の形態を以下に説明する。
(第1の実施形態)
図1は、本発明の第1の実施形態に係る情報処理装置1のブロック図を示している。情報処理装置1は、制御部20と、記憶部23と、入力部25と、ハードウエア資源30−1乃至30−Nとを具備する。Nは2以上の自然数をあらわす。制御部20は、初期化時間測定部21と、初期化時間比較部22と、障害部位切り離し部24とを備える。障害部位切り離し部24は、切り離しモード設定情報28とブロック設定テーブル29とを記憶している。記憶部23は、初期化時間テーブル26とプログラム27とを記憶している。ハードウエア資源30−1乃至ハードウエア資源30−Nは、実装位置40−1乃至40−Nに実装されている。例えば、ハードウエア資源30−1は実装位置40−1に実装され、ハードウエア資源30−Kは実装位置40−Kに実装され、ハードウエア資源30−Lは実装位置40−Lに実装され、ハードウエア資源30−Nは実装位置40−Nに実装されている。Kは、1からNまでの自然数のいずれかである。Lは、1からNまでの自然数のいずれかである。KとLとは異なる。ハードウエア資源30−1乃至30−Nは、情報処理装置1の構成要素である。
制御部20は、プログラム27に基づいて、情報処理装置1の起動時に実装位置40−1乃至40−Nに実装されたハードウエア資源、例えばハードウエア資源30−1乃至30−Nを初期化し、障害処理方法を実行する。制御部20は、必要に応じて実装位置40−1乃至40−Nに実装されたハードウエア資源を論理的に切り離すことで、起動時に発生する障害から情報処理装置1を回復させる。
図2は、初期化時間テーブル26のデータ構成を示している。初期化時間テーブル26は、実装位置情報26aと、ハードウエア資源識別情報26bと、初期化時間情報26cとを含む。実装位置情報26a「40−K」は実装位置40−Kを示している。ハードウエア資源識別情報26b「SNK」は実装位置40−Kに実装されていたハードウエア資源を示している。ここで、実装位置40−Kに実装されていたハードウエア資源は、ハードウエア資源30−Kの場合もあるし、他のハードウエア資源の場合もある。初期化時間情報26c「TK秒」は制御部20が実装位置40−Kに実装されていたハードウエア資源を前回初期化したときにかかった時間がTK秒であることを示している。ハードウエア資源識別情報26b「SNK」及び初期化時間情報26c「TK秒」は、実装位置情報26a「40−K」に対応付けられている。ここで、「SNK」は、例えば、実装位置40−Kに実装されていたハードウエア資源のシリアル番号である。
切り離しモード設定情報28は、切り分け優先モード又は起動優先モードのいずれかを設定している。切り分け優先モードにおいては、起動後の情報処理装置1の能力の高さが情報処理装置1の起動の速さよりも優先されている。起動優先モードにおいては、情報処理装置1の起動の速さが起動後の情報処理装置1の能力の高さよりも優先されている。切り分け優先モードにおいては、制御部20は、ハードウエア資源30−1乃至30−Nのうち異常が検出されたものだけを論理的に切り離す。起動優先モードにおいては、制御部20は、ハードウエア資源30−1乃至30−Nのうち異常が検出されたものとこれと関連付けられたものとを同時に切り離す。ユーザは、入力部25を操作して、切り離しモード設定情報28が切り分け優先モード又は起動優先モードのどちらを設定しているかを変更することが可能である。
図3は、ブロック設定テーブル29のデータ構成を示している。ブロック設定テーブル29は、実装位置情報29aと、ブロック情報29bとを含む。ブロック情報29b「第1ブロック」が実装位置情報29a「40−K」に対応付けられている。実装位置情報29a「40−K」は、実装位置40−Kを示している。ブロック情報29b「第1ブロック」が実装位置情報29a「40−L」に対応付けられている。実装位置情報29a「40−L」は実装位置40−Lを示している。ブロック設定テーブル29は、実装位置40−K及び実装位置40−Lが第1ブロックに属することを示している。すなわち、ブロック設定テーブル29は、実装位置40−Kと実装位置40−Lとを関連付けている。ユーザは、入力部25を操作して、ブロック設定テーブル29を自由に設定することが可能である。ユーザは、例えば、一の実装位置に実装されたハードウエア資源に異常がある場合に他の実装位置に実装されたハードウエア資源に異常がある確率が高い場合に、一の実装位置と他の実装位置とを同じブロックに属するように設定することが好ましい。また、ユーザは、一の実装位置に実装されたハードウエア資源と他の実装位置に実装されたハードウエア資源とが必ず同時に使用され、各々単独では使用されない場合に、一の実装位置と他の実装位置とを同じブロックに属するように設定することが好ましい。更に、ユーザは、最小単位での起動を優先してブロック設定テーブル29を設定することが好ましい。
次に、情報処理装置1が実行する障害処理方法について図4を参照して説明する。
図4は、情報処理装置1の起動時における動作フローを示している。初期状態において、後述する比較フラグはON状態である。
ステップS1において、制御部20は、実装位置40−Kに実装されたハードウエア資源30−Kにハードウエア資源識別情報を要求する。ハードウエア資源30−Kは、自己を示すハードウエア資源識別情報「30−K」を制御部20に出力する。制御部20は、ハードウエア資源30−Kが出力したハードウエア資源識別情報「30−K」とハードウエア資源識別情報26b「SNK」とを比較する。ハードウエア資源識別情報「30−K」とハードウエア資源識別情報26b「SNK」とが一致する場合(図4においてNO)ステップS2に進み、一致しない場合(図4においてYES)ステップS3に進む。
ステップS2において、制御部20は、初期化時間テーブル26を参照して実装位置情報26a「40−K」に対応付けられた初期化時間情報26cが存在するか否かを確認する。存在する場合(図4においてYES)、ステップS4に進む。存在しない場合(図4においてNO)、ステップS3に進む。
ステップS3において、制御部20は、比較フラグをOFF状態にする。次に、ステップS4に進む。
ステップS4において、制御部20は、ハードウエア資源30−Kの初期化を開始する。初期化時間測定部21は、ハードウエア資源30−Kの初期化を開始してからの経過時間の測定を開始する。初期化時間測定部21は、経過時間を初期化時間比較部22にリアルタイムで通知する。次に、ステップS5に進む。
ステップS5において、制御部20は、ハードウエア資源30−Kの初期化が完了したか否かを確認する。初期化が完了している場合(図4においてYES)、ステップS7に進む。初期化が完了していない場合(図4においてNO)、ステップS6に進む。
ステップS6において、初期化時間比較部22は、比較フラグがON状態である場合、経過時間と初期化時間情報26cが示す初期化時間(TK秒)に所定のマージンを加えた基準時間とを比較する。経過時間が基準時間より大きい場合、ステップS8に進む。経過時間が基準時間より大きくない場合、ステップS5に戻る。比較フラグがOFF状態である場合、初期化時間比較部22が経過時間と基準時間とを比較しないでステップS5に戻る。
ステップS7において、初期化時間比較部22は、初期化が完了したときの経過時間を示す経過時間情報を記憶部23に出力する。ここでは、初期化にTK1秒かかった場合について説明する。記憶部23は、初期化が完了したときの経過時間(TK1秒)を示すように初期化時間情報26cを更新する。また、記憶部23は、ハードウエア資源識別情報「30−K」を示すようにハードウエア資源識別情報26bを更新する。次に、ステップS11に進む。
ステップS8において、障害部位切り離し部24は、切り離しモード設定情報28が切り分け優先モード又は起動優先モードのどちらを設定しているかを確認する。切り分け優先モードに設定されている場合、ステップS9に進む。起動優先モードに設定されている場合、ステップS10に進む。
ステップS9において、障害部位切り離し部24は、ハードウエア資源30−Kを論理的に切り離す。次に、ステップS11に進む。
ステップS10において、障害部位切り離し部24は、ブロック設定テーブル29を参照して実装位置40−Kに関連付けられた実装位置を検出する。障害部位切り離し部24は、実装位置40−Kと実装位置40−Lの両者が第1ブロックに属しているため、実装位置40−Lを検出する。障害部位切り離し部24は、実装位置40−K及び実装位置40−Lに実装されたハードウエア資源30−K及びハードウエア資源30−Lを論理的に切り離す。次に、ステップS11に進む。
ステップS11において、制御部20は、比較フラグをON状態にする。ステップS11において、全てのハードウエア資源の初期化が完了している場合(図4においてYES)、障害処理方法を終了する。全てのハードウエア資源の初期化が完了していない場合(図4においてNO)、残りのハードウエア資源について、ステップS1〜ステップS10を実行する。
本実施形態においては、ハードウエア資源の初期化中の経過時間とハードウエア資源が正常に初期化された際の初期化時間との比較に基づいてハードウエア資源の異常が検出されている。また、ハードウエア資源から受け取ったハードウエア資源識別情報と、記憶されているハードウエア資源識別情報とが一致しない場合、経過時間と初期化時間(基準時間)とは比較されない。したがって、ハードウエア資源が交換された場合であっても、誤って異常が検出されることが防がれる。
次に、情報処理装置1が実行する障害処理方法について具体例を用いて説明する。
情報処理装置1の起動開始前において、初期化時間テーブル26は図5に示すデータ構成を有している。実装位置情報26a「40−1」は実装位置40−1を示している。ハードウエア資源識別情報26b「30−1」はハードウエア資源30−1を示している。初期化時間情報26c「T1秒」は制御部20が実装位置40−Kに実装されていたハードウエア資源30−1を前回初期化したときにかかった時間がT1秒であることを示している。
ステップS1において、制御部20は、実装位置40−1に実装されたハードウエア資源30−1にハードウエア資源識別情報を要求する。ハードウエア資源30−1は、自己を示すハードウエア資源識別情報「30−1」を制御部20に出力する。制御部20は、ハードウエア資源30−1が出力したハードウエア資源識別情報「30−1」と図5のハードウエア資源識別情報26b「30−1」とを比較する。ハードウエア資源30−1が出力したハードウエア資源識別情報「30−1」とハードウエア資源識別情報26b「30−1」とが一致しているため、ステップS2に進む。
ステップS2において、制御部20は、図5の初期化時間テーブル26を参照して実装位置情報26a「40−1」に対応付けられた初期化時間情報26cが存在するか否かを確認する。存在するため、ステップS4に進む。
ステップS4において、制御部20は、ハードウエア資源30−1の初期化を開始する。初期化時間測定部21は、ハードウエア資源30−1の初期化を開始してからの経過時間の測定を開始する。初期化時間測定部21は、経過時間を初期化時間比較部22にリアルタイムで通知する。
ステップS5において、制御部20は、ハードウエア資源30−1の初期化が完了したか否かを確認する。初期化が完了している場合、ステップS7に進む。初期化が完了していない場合、ステップS6に進む。
ステップS6において、初期化時間比較部22は、比較フラグがON状態であるため、経過時間と図5の初期化時間情報26cが示す初期化時間T1秒に所定のマージンを加えた基準時間とを比較する。経過時間が基準時間より大きい場合、ステップS8に進む。経過時間が基準時間より大きくない場合、ステップS5に戻る。
以下、経過時間が基準時間を超える前にハードウエア資源30−1の初期化が完了した場合について説明する。
ステップS5において、制御部20は、ハードウエア資源30−1の初期化が完了したことを検出する。
ステップS7において、初期化時間比較部22は、初期化が完了したときの経過時間を示す経過時間情報を記憶部23に出力する。ここでは、初期化にT1’秒かかった場合について説明する。記憶部23は、初期化が完了したときの経過時間(T1’秒)を示すように図5の初期化時間情報26cを更新する。記憶部23は、ハードウエア資源30−1が出力したハードウエア資源識別情報「30−1」を示すように図5のハードウエア資源識別情報26bを更新する。なお、ステップS1において「NO」であった場合、ハードウエア資源識別情報26b「30−1」を更新しなくてもよい。図6は、更新後の初期化時間テーブル26を示している。
次に、ステップS11に進む。更に、ハードウエア資源30−2〜ハードウエア資源30−NについてステップS1〜ステップS10を実行する。
その後、ユーザがハードウエア資源30−1を実装位置40−1から取り外し、ハードウエア資源30−1’を実装位置40−1に実装した後に情報処理装置1を起動した場合について以下に説明する。
図7は、ハードウエア資源30−1がハードウエア資源30−1’で置き換えられた情報処理装置1を示している。
ステップS1において、制御部20は、実装位置40−1に実装されたハードウエア資源30−1’にハードウエア資源識別情報を要求する。ハードウエア資源30−1’は、自己を示すハードウエア資源識別情報「30−1’」を制御部20に出力する。制御部20は、ハードウエア資源30−1’が出力したハードウエア資源識別情報「30−1’」と図6のハードウエア資源識別情報26b「30−1」とを比較する。ハードウエア資源識別情報「30−1’」とハードウエア資源識別情報26b「30−1」とが一致しないため、ステップS3に進む。
ステップS3において、制御部20は、比較フラグをOFF状態にする。
ステップS4において、制御部20は、ハードウエア資源30−1’の初期化を開始する。初期化時間測定部21は、ハードウエア資源30−1’の初期化を開始してからの経過時間の測定を開始する。初期化時間測定部21は、経過時間を初期化時間比較部22にリアルタイムで通知する。
ステップS5において、制御装置20は、ハードウエア資源30−1’の初期化が完了したか否かを確認する。初期化が完了している場合、ステップS7に進む。初期化が完了していない場合、ステップS6に進む。
ステップS6において、比較フラグがOFF状態であるため、初期化時間比較部22が経過時間と基準時間とを比較しないでステップS5に戻る。
ステップS5において、制御装置20は、ハードウエア資源30−1の初期化が完了したことを検出する。
ステップS7において、初期化時間比較部22は、初期化が完了したときの経過時間を示す経過時間情報を記憶部23に出力する。ここでは、初期化にT1”秒かかった場合について説明する。記憶部23は、初期化が完了したときの経過時間(T1”秒)を示すように図6の初期化時間情報26cを更新する。記憶部23は、ハードウエア資源30−1’が出力したハードウエア資源識別情報「30−1’」を示すように図6のハードウエア資源識別情報26bを更新する。図8は、更新後の初期化時間テーブル26を示している。
次に、ステップS11に進む。更に、ハードウエア資源30−2〜ハードウエア資源30−NについてステップS1〜ステップS10を実行する。
本実施形態においては、簡易な制御機能を制御部20に持たせるだけで、故障発生部位を明確に特定できないような場合でも、故障の発生が疑われる部位の切り離しを自動で行うことが可能である。また、情報処理装置1の起動時にハードウエア資源識別情報が変更されているかどうかの確認を行うため、増設や保守交換によりハードウエア資源の初期化時間が長くなった場合であっても故障の誤検出が防がれる。さらに、ユーザが切り離しモードを変更できるようになっているため、ユーザの要望に柔軟に対応することが可能である。
図1は、本発明の第1の実施形態に係る情報処理装置のブロック図である。 図2は、初期化時間テーブルを示す図である。 図3は、ブロック設定テーブルを示す図である。 図4は、情報処理装置が実行する障害処理方法のフロー図である。 図5は、初期化時間テーブルを示す図である。 図6は、更新された初期化時間テーブルを示す図である。 図7は、ハードウエア資源の構成が変更された情報処理装置のブロック図である。 図8は、更に更新された初期化時間テーブルを示す図である。
符号の説明
1…情報処理装置
20…制御部
21…初期化時間測定部
22…初期化時間比較部
23…記憶部
24…障害部位切り離し部
25…入力部
26…初期化時間テーブル
26a…実装位置情報
26b…ハードウエア資源識別情報
26c…初期化時間情報
27…プログラム
28…切り離しモード設定情報
29…ブロック設定テーブル
29a…実装位置情報
29b…ブロック情報
30−1〜30−N、30−1’…ハードウエア資源
40−1〜40−N…実装位置

Claims (8)

  1. 情報処理装置の障害処理方法であって、
    前記情報処理装置は、
    第1ハードウエア資源と、
    前記第1ハードウエア資源を過去に初期化したときにかかった第1初期化時間を示す第1初期化時間情報を記憶した記憶部と
    を具備し、
    (a)前記情報処理装置の起動時に、前記第1ハードウエア資源の初期化を開始するステップと、
    (b)前記第1ハードウエア資源の初期化を開始してからの第1経過時間を測定するステップと、
    (c)前記第1ハードウエア資源の初期化が完了する前に前記第1経過時間が前記第1初期化時間を超えた場合、前記第1ハードウエア資源の異常を検出するステップと
    を具備する
    障害処理方法。
  2. 前記第1ハードウエア資源は、第1実装位置に実装され、
    前記記憶部は、前記第1ハードウエア資源を示す第1識別情報と前記第1初期化時間情報とを、前記第1実装位置を示す第1実装位置情報に対応付けて記憶し、
    (d)前記第1ハードウエア資源が自己を示す第1自己情報を出力するステップと、
    (e)前記第1自己情報と前記第1識別情報とを比較するステップと
    を具備する
    請求項1の障害処理方法。
  3. 前記(c)ステップにおいて、前記第1ハードウエア資源の初期化が完了する前に前記第1経過時間が前記第1初期化時間に所定のマージンを加えた時間を超えた場合、前記第1ハードウエア資源の異常を検出する
    請求項1又は2の障害処理方法。
  4. (f)前記第1ハードウエア資源を論理的に切り離すステップを具備する
    請求項1乃至3のいずれかに記載の障害処理方法。
  5. 前記情報処理装置は、第2ハードウエア資源を具備し、
    前記第1ハードウエア資源は、第1実装位置に実装され、
    前記第2ハードウエア資源は、第2実装位置に実装され、
    前記記憶部は、前記第2実装位置を示す第2実装位置情報と前記第1実装位置を示す第1実装位置情報とを関連付けて記憶し、
    (g)前記第1ハードウエア資源及び前記第2ハードウエア資源を論理的に切り離すステップを具備する
    請求項1の障害処理方法。
  6. 前記情報処理装置は、第3実装位置に実装された第3ハードウエア資源を具備し、
    前記記憶部は、第3識別情報及び第3初期化時間を示す第3初期化時間情報を、前記第3実装位置を示す第3実装位置情報に対応付けて記憶し、
    (h)前記第3ハードウエア資源が自己を示す第3自己情報を出力するステップと、
    (i)前記第3自己情報と前記第3識別情報とを比較するステップと、
    (j)前記第3ハードウエア資源の初期化を開始するステップと、
    (k)前記第3ハードウエア資源の初期化を開始してからの第3経過時間を測定するステップと、
    (l)前記第3ハードウエア資源の初期化が完了する前に前記第3経過時間が前記第3初期化時間を超えたとき、前記第3自己情報と前記第3識別情報とが一致している場合に前記第3ハードウエア資源の異常を検出し、一致していない場合に前記第3ハードウエア資源の異常を検出しないステップと、
    (m)前記第3ハードウエア資源を示すように前記第3識別情報を更新し、前記第3ハードウエア資源の初期化が完了したときの前記第3経過時間を示すように前記第3初期化時間情報を更新するステップと
    を具備する
    請求項1乃至5のいずれかに記載の障害処理方法。
  7. 請求項1乃至6のいずれかに記載の障害処理方法をコンピュータに実行させるプログラム。
  8. 制御部と、
    第1ハードウエア資源と、
    前記制御部が前記第1ハードウエア資源を過去に初期化したときにかかった第1初期化時間を示す第1初期化時間情報を記憶した記憶部と
    を具備し、
    前記制御部は、
    前記情報処理装置の起動時に、前記第1ハードウエア資源の初期化を開始し、
    前記第1ハードウエア資源の初期化を開始してからの第1経過時間を測定し、
    前記第1ハードウエア資源の初期化が完了する前に前記第1経過時間が前記第1初期化時間を超えた場合、前記第1ハードウエア資源の異常を検出する
    情報処理装置。
JP2007051045A 2007-03-01 2007-03-01 障害処理方法、プログラム及び情報処理装置 Expired - Fee Related JP5019252B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007051045A JP5019252B2 (ja) 2007-03-01 2007-03-01 障害処理方法、プログラム及び情報処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007051045A JP5019252B2 (ja) 2007-03-01 2007-03-01 障害処理方法、プログラム及び情報処理装置

Publications (2)

Publication Number Publication Date
JP2008217191A true JP2008217191A (ja) 2008-09-18
JP5019252B2 JP5019252B2 (ja) 2012-09-05

Family

ID=39837190

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007051045A Expired - Fee Related JP5019252B2 (ja) 2007-03-01 2007-03-01 障害処理方法、プログラム及び情報処理装置

Country Status (1)

Country Link
JP (1) JP5019252B2 (ja)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04178871A (ja) * 1990-11-14 1992-06-25 Pfu Ltd 初期化処理装置
JPH04270403A (ja) * 1991-02-26 1992-09-25 Nec Corp コンピュータシステムにおけるipl管理方法及びその装置
JPH0659701A (ja) * 1992-08-10 1994-03-04 Fujitsu Ltd 切替制御方式
JPH07219913A (ja) * 1994-01-28 1995-08-18 Fujitsu Ltd マルチプロセッサシステムの制御方法及び装置
JPH07295670A (ja) * 1994-04-27 1995-11-10 Chubu Nippon Denki Software Kk 計算機システムの起動方式
JPH10171546A (ja) * 1996-12-12 1998-06-26 Omron Corp 起動監視装置
JP2005122424A (ja) * 2003-10-16 2005-05-12 Canon Inc ウオッチドッグタイマ

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04178871A (ja) * 1990-11-14 1992-06-25 Pfu Ltd 初期化処理装置
JPH04270403A (ja) * 1991-02-26 1992-09-25 Nec Corp コンピュータシステムにおけるipl管理方法及びその装置
JPH0659701A (ja) * 1992-08-10 1994-03-04 Fujitsu Ltd 切替制御方式
JPH07219913A (ja) * 1994-01-28 1995-08-18 Fujitsu Ltd マルチプロセッサシステムの制御方法及び装置
JPH07295670A (ja) * 1994-04-27 1995-11-10 Chubu Nippon Denki Software Kk 計算機システムの起動方式
JPH10171546A (ja) * 1996-12-12 1998-06-26 Omron Corp 起動監視装置
JP2005122424A (ja) * 2003-10-16 2005-05-12 Canon Inc ウオッチドッグタイマ

Also Published As

Publication number Publication date
JP5019252B2 (ja) 2012-09-05

Similar Documents

Publication Publication Date Title
US20240012706A1 (en) Method, system and apparatus for fault positioning in starting process of server
US9471435B2 (en) Information processing device, information processing method, and computer program
US10068015B2 (en) Monitoring a monitoring-target process
CN106776282A (zh) 一种bios程序的异常处理方法及装置
WO2016206514A1 (zh) 启动处理方法及装置
JP2008262538A (ja) 入出力(i/o)エラーをハンドリングするための方法及びシステム
US10275330B2 (en) Computer readable non-transitory recording medium storing pseudo failure generation program, generation method, and generation apparatus
JP2007241832A (ja) コンピュータシステム、起動監視方法および起動監視プログラム
US10824517B2 (en) Backup and recovery of configuration files in management device
JP5212357B2 (ja) マルチcpu異常検出復旧システム、方法及びプログラム
JP4886558B2 (ja) 情報処理装置
US20170242760A1 (en) Monitoring device, fault-tolerant system, and control method
JP6880961B2 (ja) 情報処理装置、およびログ記録方法
CN116266150A (zh) 一种业务恢复方法、数据处理单元及相关设备
US20180081762A1 (en) Information processing device
CN105159810B (zh) 对计算机***的bios进行测试的方法及装置
JP5019252B2 (ja) 障害処理方法、プログラム及び情報処理装置
CN109086085B (zh) 一种操作***启动管理方法和装置
JP5369945B2 (ja) 構成情報設定方法及び情報処理装置
JP2009245391A (ja) 情報処理装置、エラー処理方法及びプログラム
JP2006065440A (ja) プロセス管理システム
JP6835423B1 (ja) 情報処理システム及びその初期化方法
JP2015106226A (ja) 二重化システム
US10108499B2 (en) Information processing device with watchdog timer
CN116340957B (zh) 程序启动方法、装置、服务器及非易失性存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100218

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120203

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120309

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120427

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120521

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120603

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150622

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees