JP2009217435A - 制御方法、情報処理装置及びストレージシステム - Google Patents

制御方法、情報処理装置及びストレージシステム Download PDF

Info

Publication number
JP2009217435A
JP2009217435A JP2008059183A JP2008059183A JP2009217435A JP 2009217435 A JP2009217435 A JP 2009217435A JP 2008059183 A JP2008059183 A JP 2008059183A JP 2008059183 A JP2008059183 A JP 2008059183A JP 2009217435 A JP2009217435 A JP 2009217435A
Authority
JP
Japan
Prior art keywords
processor
bus
information processing
abnormality
processing apparatus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008059183A
Other languages
English (en)
Other versions
JP4644720B2 (ja
Inventor
Akihisa Soda
彰久 曽田
Yoshiyuki Tokumitsu
善之 徳光
Yuji Fukuoka
雄治 福岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2008059183A priority Critical patent/JP4644720B2/ja
Priority to US12/397,736 priority patent/US20090228745A1/en
Publication of JP2009217435A publication Critical patent/JP2009217435A/ja
Application granted granted Critical
Publication of JP4644720B2 publication Critical patent/JP4644720B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1666Error detection or correction of the data by redundancy in hardware where the redundant component is memory or memory area
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2038Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with a single idle spare processing component

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

【課題】プロセッサに接続されたバス等の異常によりエラーが発生した場合であっても、確実にエラー状況の収集してエラー要因の切り分けを可能とすることを目的とする。
【解決手段】第1及び第2のプロセッサと複数の装置部分を有する情報処理装置の制御方法において、第1のプロセッサと第1のバスを介して接続された装置部分間の異常を第1のプロセッサにより検知し、第1のプロセッサが異常を検知すると、第1のプロセッサと第2のバスを介して接続された第2のプロセッサに対して第1のプロセッサから異常通知を行い、異常通知に基づいて異常に関するエラーログを第2のプロセッサにより第2のバスを介して取得する。
【選択図】図2

Description

本発明は、制御方法、情報処理装置及びストレージシステムに係り、特にサーバ等の情報処理装置の制御方法、そのような制御方法を用いる情報処理装置、及びそのような情報処理装置を含むストレージシステムに関する。
近年、サーバ等の情報処理装置(又は、コンピュータ)が大型化するに伴い、情報処理装置に搭載される集積回路(IC:Integrated Circuit)の種類及び数量は増加の一途をたどっている。
図1は、従来の情報処理装置の一例を示すブロック図である。図1に示す情報処理装置1は、外部インタフェース(I/F:Interface)2を介して外部装置3に接続されておりストレージシステムの一部を構成する。外部装置3は、例えばホスト装置又はストレージ装置である。外部装置3が情報処理装置1と同じ構成を有する場合には、多重化されたストレージシステムが構成される。
情報処理装置1は、図1に示す如く接続されたプロセッサ11、ブリッジ回路12、メモリ13、大規模集積回路(LSI:Large Scale Integrated Circuit)14−1〜14−M(Mは0を除く自然数)、スイッチ回路15−1〜15−N(Nは0を除く自然数)、データバス16,17、サイドバンドI/F18、及び内部I/F19を有する。MとNは、M=NであってもM≠Nであっても良い。
図1において、F1はプロセッサ11とブリッジ回路12との間のデータバス16で発生した異常、F2はブリッジ回路12とLSI14−1との間のデータバス17で発生した異常を示す。異常F1,F2のように、プロセッサ11に接続された主となるデータバス16,17に影響を及ぼすエラーが発生した場合、プロセッサ11からデータバス16,17を用いて情報処理装置1内の全ての装置部分のエラー要因情報を取得することが難しい。このような場合には、メモリ13にエラーログが残らない可能性が高く、エラー要因の切り分けが難しくなる。
又、データバス16,17等にエラーが発生した場合、プロセッサ11がエラーの発生しているデータバスを用いてLSI14−1〜14−Mにアクセスしようとすると、一旦バスリセットをかける必要がある。しかし、バスリセットをかけてしまうと、LSI14−1〜14−M中のエラー情報等もリセットされる可能性がある。このため、バスリセット後にプロセッサ11がLSI14−1〜14−Mをアクセスしても、エラー情報を取得できない場合がある。
単一部位の故障によりシステム停止とならないようにするバス制御装置の一例が特許文献1にて提案されている。又、高機能・高性能なストレージシステムの持つ機能を安価なストレージシステム内で実現させるデータ処理システムの一例が特許文献2にて提案されている。
特開平8−305641号公報 特開2006−65709号公報
従来の情報処理装置では、プロセッサに接続された主となるデータバス等の異常によりエラーが発生した場合、エラー状況の収集ができないとエラー要因の切り分けが困難であるという問題があった。
そこで、本発明は、プロセッサに接続されたバス等の異常によりエラーが発生した場合であっても、確実にエラー状況を収集してエラー要因の切り分けを可能とする制御方法、情報処理装置及びストレージシステムを提供することを目的とする。
本発明の一観点によれば、第1及び第2のプロセッサと複数の装置部分を有する情報処理装置の制御方法であって、該第1のプロセッサと第1のバスを介して接続された該装置部分間の異常を該第1のプロセッサにより検知するステップと、該第1のプロセッサが該異常を検知すると、該第1のプロセッサと第2のバスを介して接続された該第2のプロセッサに対して該第1のプロセッサから異常通知を行うステップと、該異常通知に基づいて該異常に関するエラーログを該第2のプロセッサにより該第2のバスを介して取得するステップとを含む制御方法が提供される。
本発明の一観点によれば、第1のプロセッサと、第1のバスと、該第1のプロセッサと該第1のバスを介して接続された複数の装置部分と、第2のバスと、該第1のプロセッサ及び該複数の装置部分と該第2のバスを介して接続された第2のプロセッサとを備え、該第1のプロセッサは、該第1のプロセッサと該第1のバスを介して接続された該装置部分間の異常を検知すると、該第2のバスを介して該第2のプロセッサに対して異常通知を行い、該第2のプロセッサは、該異常通知に基づいて該異常に関するエラーログを該第2のバスを介して取得する情報処理装置が提供される。
本発明の一観点によれば、記憶装置と、該記憶装置へのアクセスを制御をする情報処理装置とを備え、該情報処理装置は、第1のプロセッサと、第1のバスと、該第1のプロセッサと該第1のバスを介して接続された複数の装置部分と、第2のバスと、該第1のプロセッサ及び該複数の装置部分と該第2のバスを介して接続された第2のプロセッサとを有し、該第1のプロセッサは、該第1のプロセッサと該第1のバスを介して接続された該装置部分間の異常を検知すると、該第2のバスを介して該第2のプロセッサに対して異常通知を行い、該第2のプロセッサは、該異常通知に基づいて該異常に関するエラーログを該第2のバスを介して取得するストレージシステムが提供される。
開示の制御方法、情報処理装置及びストレージシステムによれば、プロセッサに接続されたバス等の異常によりエラーが発生した場合であっても、確実にエラー状況の収集してエラー要因の切り分けを可能とすることができる。
第1及び第2のプロセッサと複数の装置部分を有する情報処理装置を制御する際に、第1のプロセッサと第1のバスを介して接続された装置部分間の異常を第1のプロセッサにより検知する。第1のプロセッサが異常を検知すると、第1のプロセッサと第2のバスを介して接続された第2のプロセッサに対して第1のプロセッサから異常通知を行う。第2のプロセッサは、異常通知に基づいて異常に関するエラーログを第2のバスを介して取得する。
これにより、第1のプロセッサに接続された第1のバス等の異常によりエラーが発生した場合であっても、確実にエラー状況の収集してエラー要因の切り分けを可能とすることができる。
以下に、本発明の制御方法、情報処理装置及びストレージシステムの各実施例を、図2以降と共に説明する。
図2は、本発明の第1実施例を示すブロック図である。図2に示す情報処理装置21−1は、外部インタフェース(I/F:Interface)22(又は、外部バス22)を介して外部装置23に接続されている。外部装置23は、例えばホスト装置又はストレージ装置である。外部装置23が情報処理装置21−1と同じ構成を有する場合には、情報処理装置21−1及び外部装置23により多重化されたストレージシステムが構成可能となる。情報処理装置21−1は、情報処理装置21−1自体でストレージシステムを構成するものであっても、ストレージシステムの一部を構成するものであっても良い。
情報処理装置21−1は、図2に示す如く接続された主プロセッサ211、ブリッジ回路212、メモリ213、大規模集積回路(LSI:Large Scale Integrated Circuit)214−1〜214−M(Mは0を除く自然数)、スイッチ回路215−1〜215−N(Nは0を除く自然数)、データバス216,217、サイドバンドI/F(又は、サイドバンドバス)218、内部I/F(又は、内部バス)219、副プロセッサ221、メモリ223及び制御線240を有する。主プロセッサ211及び副プロセッサ221は、いずれも汎用プロセッサにより実現できる。MとNは、M=NであってもM≠Nであっても良い。
主プロセッサ211は、情報処理装置21−1全体の動作を制御する。情報処理装置21−1がストレージシステムを構成する場合には、主プロセッサ211はLSI214−1〜214−M内の記憶装置及び/又は外部装置23内の記憶装置へのアクセスを制御して、所望の記憶装置へデータを書き込んだり、所望の記憶装置からデータを読み出したりする。ブリッジ回路212は、主プロセッサ211とメモリ213及び各LSI214−1〜214−Mとを相互接続する。メモリ213は、主プロセッサ211が採取したエラーログ等を格納する。LSI214−1〜214−Mは、各種回路により実現可能であり、回路自体の種類及び動作は特に限定されない。各LSI214−1〜214−Mは、例えばメモリ等の記憶装置を含んでも良い。又、LSI214−1〜214−Mは、互いに異なる動作を実行可能な異なる構成の回路であっても、同じ動作を実行可能な同じ構成の回路であっても良い。LSI214−1〜214−Mが同じ動作を事項可能な同じ構成の回路で構成されている場合には、情報処理装置21−1内で冗長構成を有する回路部を実現できる。スイッチ回路215−1〜215−Nは、情報処理装置21−1と外部装置23の外部I/F22を介した接続、即ち、情報処理装置21−1と外部I・F22との接続を切り離す機能を有し、同様の機能を有するリピータ回路等の接続制御回路で置き換えられても良い。
主プロセッサ211と副プロセッサ221は、サイドバンドI/F218を介して接続されている。サイドバンドI/F218は、既存の汎用プロセッサに設けられている既存のI/Fであり、通常は制御対象デバイスの設定等の比較的低速の動作で使用されるものである。本実施例では、このサイドバンドI/F218を有効利用する。
このようなサイドバンドI/F218の規格としては、例えばPhilips
Semiconductor社によってI2C-Bus Specification Version 2.1で規格化されたI2C(又は、IC,Interface Integrated Circuit)、又は、一般化されたTWI(Two-Wire
Interface)等が知られている。I2Cは半二重、マルチドロップで100kHz〜400kHzの比較的低速で動作し、クロック(SCL:Serial Clock Line)とデータ(SDA:Serial Data Lines)の2本の信号線(接地線は除く)を転送される信号により制御される。
副プロセッサ221は、主となるデータバス216,217とは独立しており、これらのデータバス216,217を監視して制御する。副プロセッサ221は、サイドバンドI/F218を介して主プロセッサ211やLSI214−1〜214−M等を含む情報処理装置21−1内の各装置部分の情報にアクセス可能である。各装置部分の情報は、各装置部分の状態に関する情報等を含み、各装置部分内に設けられたレジスタ(図示せず)に格納されているので、各装置部分の情報はこのレジスタにアクセスすることで取得可能である。図2の例では、副プロセッサ221は、サイドバンドI/F218を介して主プロセッサ211、ブリッジ回路212、LSI214−1〜214−M及びスイッチ回路215−1〜215−Nの情報にアクセス可能である。
例えば、図2において主となるデータバス216,217で故障等を含む異常が発生した場合、副プロセッサ221はサイドバンドI/F218より情報処理装置21−1内の各装置部分の情報を取得すると共に、イネーブル(Enable)制御信号を制御線240を介してスイッチ回路215−1〜215−Nに供給してスイッチ回路215−1〜215−Nをオフ状態に制御することで外部I/F22から切り離す。イネーブル制御信号には、既存の一般的なデバイスで用いられているイネーブル制御信号と同様の信号を使用できる。
サイドバンドI/F218のデータ転送速度は、データバス216,217のデータ転送速度と比べると低速である。このように、転送速度の異なるデータバス(又は、I/F)を情報処理装置21−1内で組み合わせ、データバス上を転送されるデータの特性や量等に応じた回路設計を行うことで、比較的低コストの情報処理装置21−1を実現することができる。又、転送速度の異なるデータバスを情報処理装置21−1内で適切に組み合わせることで、データバス上のエラーの伝播を抑制することもできる。
図3は、本実施例の副プロセッサ221の動作を説明するフローチャートである。図3において、ステップS1は、サイドバンドI/F218を介して情報処理装置21−1の各装置部分からエラー通知を受信したか否かを判定すると共に、受信したエラー通知が示すエラーの種類を判別する。エラー通知は、例えば主プロセッサ211とブリッジ回路212を接続するデータバス216で発生した異常、或いは、ブリッジ回路212と各LSI214−1〜214−Mを接続するデータバス217で発生した異常によりデータバス216又はデータバス217に影響を及ぼすエラーが発生した場合に行われる。又、エラー通知は、情報処理装置21−1の各装置部分(例えば、主プロセッサ211)自体の異常によりエラーが発生した場合に行われる。
ステップS1の判定結果がYESであると、ステップS2は、サイドバンドI/F218を介して主プロセッサ211から受けた通知に基づき、主プロセッサ211が情報処理装置21−1と外部I/F22との接続を切り離すことができるか否かを判定する。副プロセッサ221が主プロセッサ211から受ける通知には、主プロセッサ211がスイッチ回路215−1〜215−Nをオフ状態に制御可能であるか否かを示す情報が含まれる。
ステップS1においてエラーの種類が例えば主となるデータバス216又は217に起因しないものであると判別されており、ステップS2の判定結果がYESであると、ステップS3は、主プロセッサ211による制御線240を介したスイッチ回路215−1〜215−Nのオフ状態への制御、即ち、情報処理装置21−1と外部I/F22との接続の切り離しを許容し、副プロセッサ221からのスイッチ回路215−1〜215−Nの制御は行わない。
一方、ステップS1においてエラーの種類が例えば主となるデータバス216又は217に起因するものであると判別されており、ステップS2の判定結果がNOであると、ステップS4は、副プロセッサ221による制御線240を介したスイッチ回路215−1〜215−Nのオフ状態への制御、即ち、情報処理装置21−1と外部I/F22との接続の切り離しを行う。ステップS3又はS4の後、処理はステップS5へ進む。尚、主プロセッサ211がスイッチ回路215−1〜215−Nをオフ状態に制御可能であるか否かを示す情報を含む通知が得られない場合も、ステップS2の判定結果はNOとなることは言うまでもない。
ステップS5は、サイドバンドI/F218を介して主プロセッサ211から受けた通知に基づき、主プロセッサ211がエラーログを採取可能であるか否かを判定する。副プロセッサ221が主プロセッサ211から受ける通知には、主プロセッサ211がエラーログを採取可能であるか否かを示す情報が含まれる。
ステップS5の判定結果がYESであると、ステップS6は、主プロセッサ211によるデータバス216,217及び/又はサイドバンドI/F218を介したエラーログの採取を許容し、主プロセッサ211が情報処理装置21−1内の対象装置部分をアクセスして採取したエラーログはメモリ213に格納される。通常、副プロセッサ221より主プロセッサ211の方がエラーログのより詳細な情報を採取可能であるため、主プロセッサ211によるエラーログの採取が可能な場合には他の障害と同様に主プロセッサ211からエラーログを採取する。一方、ステップS5の判定結果がNOであると、ステップS7は、副プロセッサ221によりサイドバンドI/F218を介して情報処理装置21−1内の対象装置部分をアクセスしてエラーログを採取し、採取したエラーログをメモリ223に格納する。ステップS6又はS7の後、処理は終了する。エラーログには、エラー要因を含む情報が含まれる。
このように、本実施例によれば、サイドバンドI/F218を用いることで、例えば主となるデータバス216又は217の異常によりエラーが発生した場合であっても、情報処理装置21−1内の多くの装置部分のレジスタはサイドバンドI/F218からアクセスすることが可能であるため、異常に起因するエラー状況を確実に収集してエラー要因の切り分けを行うことが可能となる。
ところで、図1に示す従来例では、主プロセッサ11に接続された主となるデータバス16又は17に起因するエラーが発生した後に、外部I/F2を介して壊れたデータや誤ったデータ等の不正データを出力したり、情報処理装置1内でエラーが発生している状態であるにもかかわらず情報処理装置1が外部装置3からの要求に応答してしまう可能性がある。又、主となるデータバス16,17に影響を及ぼすエラーが発生した場合、外部装置3との通信を速やかに切断しなければ誤ったデータ等が外部装置3へ出力されて例えばストレージシステム全体に悪影響を及ぼす可能性がある。
これに対し、本実施例では、例えば主となるデータバス216又は217で異常が発生した場合、情報処理装置21−1と外部I/F22の接続を切り離すことで、外部I/F22を介して不正データを出力したり、情報処理装置21−1内でエラーが発生している状態であるにもかかわらず情報処理装置21−1が外部装置23からの要求に応答してしまうことを確実に防止できる。
図4は、本実施例の動作を説明するタイムチャートである。図4は、主プロセッサ211が情報処理装置21−1内のエラーを検知するタイミング、エラーの発生後に内部I/F219を介して転送される不正データ、副プロセッサ221が情報処理装置21−1内のエラーを検知するタイミング、スイッチ回路215−1〜215−Nが副プロセッサ221によりオン/オフされるタイミング、外部I/F22を介して転送されるデータを示す。図4に示すように、副プロセッサ221がエラーを検知してスイッチ回路215−1〜215−Nをオフ状態に制御することで、たとえ内部I/F219を介して不正データが転送されていても、情報処理装置21−1と外部I/F22の接続が切り離されることにより不正データが外部I/F22を介して外部装置23へ出力されることはない。又、情報処理装置21−1と外部I/F22の接続が切り離されることにより、情報処理装置21−1が外部装置23からの要求に応答してしまうこともない。
このように、本実施例では、サイドバンドI/F218を用いるため、エラー情報を取得するためにバスリセットをかける必要がなく、LSI214−1〜214−M等の装置部分の状態に関する情報がバスリセットによりリセットされることもないので、エラー情報を含む装置部分の状態に関する情報を確実に取得することができる。又、本実施例によれば、外部I/F22を介して不正データを出力したり外部装置23からの要求に不要な応答をしたりすることなく、且つ、エラー要因を含む情報が含まれるエラーログを確実に取得することが可能となる。このため、データの信頼性を向上することができ、エラー発生時のデータ解析が容易になると共に、情報処理装置21−1及び例えばストレージシステム全体の信頼性を向上することができる。
図5は、本発明の第2実施例を示すブロック図である。図5中、図2と同一部分には同一符号を付し、その説明は省略する。
本実施例では、情報処理装置21−2の副プロセッサ221は、各LSI214−1〜214−Mを同時にイネーブル状態又はディセーブル(Disable)状態に制御する制御信号を信号線241を介して出力する。従って、副プロセッサ221が図3のような動作を行う場合、ステップS4において外部I/F22をディセーブル状態にする制御に加え、各LSI214−1〜214−Mを同時にディセーブル状態にする制御を行う。このように、各LSI214−1〜214−Mもディセーブル状態に制御することで、外部装置23への不正データの出力及び外部装置23からの要求への不要な応答をより確実に防止することができる。又、LSI214−1〜214−Mからブリッジ回路212に対して誤った制御を行うことも防止できる。
本実施例によれば、上記第1実施例と比較すると、データの信頼性を更に向上することができ、エラー発生時のデータ解析が更に容易になると共に、情報処理装置21−1及び例えばストレージシステム全体の信頼性を更に向上することができる。
図6は、本発明の第3実施例を示すブロック図である。図5中、図2と同一部分には同一符号を付し、その説明は省略する。
本実施例では、情報処理装置21−3の副プロセッサ221は、各LSI214−1〜214−Mを個別にイネーブル状態又はディセーブル状態に制御する制御信号を信号線242を介して出力する。従って、副プロセッサ221が図3のような動作を行う場合、ステップS4において外部I/F22をディセーブル状態にする制御に加え、各LSI214−1〜214−Mを個別にディセーブル状態にする制御を行う。
例えば、ブリッジ回路212とLSI214−1〜214−M間の主となるデータバス217で異常が発生した場合、異常が発生した主となるデータバス217に対応する外部I/F22上に挿入されているスイッチ回路215及びLSI214のみをディセーブル状態に制御し、異常が発生したデータバス217の外部I/F22のみを情報処理装置21−3から切り離す。しかし、異常が発生していない正常なデータバス217に対応する外部I/F22上に挿入されているスイッチ回路215及びLSI214はそのまま使用する。つまり、正常系のみ動作を有効にする(即ち、活性化する)と共に異常が発生した異常系の動作は停止する(即ち、非活性化する)ことで、情報処理装置21−3から切り離す外部I/F22の範囲を最小限に抑えることができる。従って、情報処理装置21−3及び例えばストレージシステムの性能は多少低下するが、システムダウンという最悪の事態は防げる。又、スイッチ回路215等がディセーブル状態となったことによるLSI214の誤動作を防ぐことで、有効な外部I/F22のみを用いて情報処理装置21−3と外部装置23とで通信を行うことが可能となる。
このように、各LSI214−1〜214−Mも個別にディセーブル状態に制御することで、システムダウンの状態を発生することなく外部装置23への不正データの出力及び外部装置23からの要求への不要な応答をより確実に防止することができる。又、LSI214−1〜214−Mからブリッジ回路212に対して誤った制御を行うことも防止できる。
本実施例によれば、上記第1実施例と比較すると、データの信頼性を更に向上することができ、エラー発生時のデータ解析が更に容易になると共に、情報処理装置21−1及び例えばストレージシステム全体の信頼性を更に向上することができる。又、異常系のみの動作を停止して正常系の動作は維持することで、システムダウンを防ぐことができる。
尚、本発明は、以下に付記する発明をも包含するものである。
(付記1)
第1及び第2のプロセッサと複数の装置部分を有する情報処理装置の制御方法であって、
該第1のプロセッサと第1のバスを介して接続された該装置部分間の異常を該第1のプロセッサにより検知するステップと、
該第1のプロセッサが該異常を検知すると、該第1のプロセッサと第2のバスを介して接続された該第2のプロセッサに対して該第1のプロセッサから異常通知を行うステップと、
該異常通知に基づいて該異常に関するエラーログを該第2のプロセッサにより該第2のバスを介して取得するステップと
を含む制御方法。
(付記2)
該異常通知に基づいて該情報処理装置と外部装置との接続を該第2のプロセッサにより制御するステップを更に含む、付記1記載の制御方法。
(付記3)
該異常通知に基づいて該異常の影響を受ける装置部分と該外部装置との接続のみを該第2のプロセッサにより制御するステップを更に含む、付記2記載の制御方法。
(付記4)
該異常通知に基づいて該装置部分の動作を該第2のプロセッサにより停止するステップを更に含む、付記1乃至3のいずれか1項記載の制御方法。
(付記5)
該異常通知に基づいて該異常の影響を受ける装置部分のみの動作を該第2のプロセッサにより停止するステップを更に含む、付記4記載の制御方法。
(付記6)
該エラーログを該第2のプロセッサにより取得するステップは、該第1のプロセッサにより該エラーログの取得ができない場合にのみ行われる、付記1乃至5のいずれか1項記載の制御方法。
(付記7)
第1のプロセッサと、
第1のバスと、
該第1のプロセッサと該第1のバスを介して接続された複数の装置部分と、
第2のバスと、
該第1のプロセッサ及び該複数の装置部分と該第2のバスを介して接続された第2のプロセッサとを備え、
該第1のプロセッサは、該第1のプロセッサと該第1のバスを介して接続された該装置部分間の異常を検知すると該第2のバスを介して該第2のプロセッサに対して異常通知を行い、
該第2のプロセッサは、該異常通知に基づいて該異常に関するエラーログを該第2のバスを介して取得する、
情報処理装置。
(付記8)
該情報処理装置を外部装置と接続する接続制御回路を更に備え、
該第2のプロセッサは、該異常通知に基づいて該接続制御回路を制御することで該情報処理装置と外部装置との接続を制御する、付記7記載の情報処理装置。
(付記9)
該第2のプロセッサは、該異常通知に基づいて該接続制御回路を制御することで該異常の影響を受ける装置部分と該外部装置との接続のみを制御する、付記8記載の情報処理装置。
(付記10)
該第2のプロセッサは、該異常通知に基づいて該装置部分の動作を停止する、付記7乃至9のいずれか1項記載の情報処理装置。
(付記11)
該第2のプロセッサは、該異常通知に基づいて該異常の影響を受ける装置部分のみの動作を停止する、付記10記載の情報処理装置。
(付記12)
該第2のプロセッサは、該第1のプロセッサにより該エラーログの取得ができない場合にのみ該エラーログを取得する、付記7乃至11のいずれか1項記載の情報処理装置。
(付記13)
該第2のバスのデータ転送速度は該第1のバスのデータ転送速度より低い、付記7乃至12のいずれか1項記載の情報処理装置。
(付記14)
該第2のバスは、I2C(又は、IC,Interface Integrated Circuit)、又は、TWI(Two-Wire Interface)の規格に準拠している、付記13記載の情報処理装置。
(付記15)
該第2のプロセッサが取得した該エラーログを格納するメモリを更に備えた、
付記7乃至14のいずれか1項記載の情報処理装置。
(付記16)
記憶装置と、
該記憶装置へのアクセスを制御をする情報処理装置とを備え、
該情報処理装置は、
第1のプロセッサと、
第1のバスと、
該第1のプロセッサと該第1のバスを介して接続された複数の装置部分と、
第2のバスと、
該第1のプロセッサ及び該複数の装置部分と該第2のバスを介して接続された第2のプロセッサとを有し、
該第1のプロセッサは、該第1のプロセッサと該第1のバスを介して接続された該装置部分間の異常を検知すると、該第2のバスを介して該第2のプロセッサに対して異常通知を行い、
該第2のプロセッサは、該異常通知に基づいて該異常に関するエラーログを該第2のバスを介して取得する、
ストレージシステム。
(付記17)
該情報処理装置は、該情報処理装置を外部装置と接続する接続制御回路を更に有し、
該第2のプロセッサは、該異常通知に基づいて該接続制御回路を制御することで該情報処理装置と外部装置との接続を制御する、付記16記載のストレージシステム。
(付記18)
該第2のプロセッサは、該異常通知に基づいて該接続制御回路を制御することで該異常の影響を受ける装置部分と該外部装置との接続のみを制御する、付記17記載のストレージシステム。
(付記19)
該第2のプロセッサは、該異常通知に基づいて該装置部分の動作を停止する、付記16乃至18のいずれか1項記載のストレージシステム。
(付記20)
該第2のプロセッサは、該異常通知に基づいて該異常の影響を受ける装置部分のみの動作を停止する、付記19記載のストレージシステム。
(付記21)
該第2のプロセッサは、該第1のプロセッサにより該エラーログの取得ができない場合にのみ該エラーログを取得する、付記16乃至20のいずれか1項記載のストレージシステム。
(付記22)
該第2のバスのデータ転送速度は該第1のバスのデータ転送速度より低い、付記16乃至21のいずれか1項記載のストレージシステム。
(付記23)
該第2のバスは、I2C(又は、IC,Interface Integrated Circuit)、又は、TWI(Two-Wire Interface)の規格に準拠している、付記22記載のストレージシステム。
(付記24)
該情報処理装置は、該第2のプロセッサが取得した該エラーログを格納するメモリを更に有する、
付記16乃至23のいずれか1項記載のストレージシステム。
(付記25)
該記憶装置は、該情報処理装置内に設けられている、付記16記載のストレージシステム。
(付記26)
該記憶装置は、該外部装置内に設けられている、付記17記載のストレージ装置。
以上、本発明を実施例により説明したが、本発明は上記実施例に限定されるものではなく、本発明の範囲内で種々の変形及び改良が可能であることは言うまでもない。
従来の情報処理装置の一例を示すブロック図である。 本発明の第1実施例を示すブロック図である。 第1実施例における副プロセッサの動作を説明するフローチャートである。 第1実施例の動作を説明するタイムチャートである。 本発明の第2実施例を示すブロック図である。 本発明の第3実施例を示すブロック図である。
符号の説明
21−1,21−2,21−3 情報処理装置
22 外部I/F
23 外部装置
211 主プロセッサ
212 ブリッジ回路
213,223 メモリ
214−1〜214−M LSI
215−1〜215−N スイッチ回路
216,217 データバス
218 サイドバンドI/F
219 内部I/F
221 副プロセッサ
240 制御線

Claims (8)

  1. 第1及び第2のプロセッサと複数の装置部分を有する情報処理装置の制御方法であって、
    該第1のプロセッサと第1のバスを介して接続された該装置部分間の異常を該第1のプロセッサにより検知するステップと、
    該第1のプロセッサが該異常を検知すると、該第1のプロセッサと第2のバスを介して接続された該第2のプロセッサに対して該第1のプロセッサから異常通知を行うステップと、
    該異常通知に基づいて該異常に関するエラーログを該第2のプロセッサにより該第2のバスを介して取得するステップと
    を含む制御方法。
  2. 第1のプロセッサと、
    第1のバスと、
    該第1のプロセッサと該第1のバスを介して接続された複数の装置部分と、
    第2のバスと、
    該第1のプロセッサ及び該複数の装置部分と該第2のバスを介して接続された第2のプロセッサとを備え、
    該第1のプロセッサは、該第1のプロセッサと該第1のバスを介して接続された該装置部分間の異常を検知すると該第2のバスを介して該第2のプロセッサに対して異常通知を行い、
    該第2のプロセッサは、該異常通知に基づいて該異常に関するエラーログを該第2のバスを介して取得する、
    情報処理装置。
  3. 該情報処理装置を外部装置と接続する接続制御回路を更に備え、
    該第2のプロセッサは、該異常通知に基づいて該接続制御回路を制御することで該情報処理装置と外部装置との接続を制御する、請求項2記載の情報処理装置。
  4. 該第2のプロセッサは、該異常通知に基づいて該接続制御回路を制御することで該異常の影響を受ける装置部分と該外部装置との接続のみを制御する、請求項3記載の情報処理装置。
  5. 該第2のプロセッサは、該異常通知に基づいて該装置部分の動作を停止する、請求項2乃至4のいずれか1項記載の情報処理装置。
  6. 該第2のプロセッサは、該異常通知に基づいて該異常の影響を受ける装置部分のみの動作を停止する、請求項5記載の情報処理装置。
  7. 該第2のバスのデータ転送速度は該第1のバスのデータ転送速度より低い、請求項2乃至6のいずれか1項記載の情報処理装置。
  8. 記憶装置と、
    該記憶装置へのアクセスを制御をする情報処理装置とを備え、
    該情報処理装置は、
    第1のプロセッサと、
    第1のバスと、
    該第1のプロセッサと該第1のバスを介して接続された複数の装置部分と、
    第2のバスと、
    該第1のプロセッサ及び該複数の装置部分と該第2のバスを介して接続された第2のプロセッサとを有し、
    該第1のプロセッサは、該第1のプロセッサと該第1のバスを介して接続された該装置部分間の異常を検知すると、該第2のバスを介して該第2のプロセッサに対して異常通知を行い、
    該第2のプロセッサは、該異常通知に基づいて該異常に関するエラーログを該第2のバスを介して取得する、
    ストレージシステム。
JP2008059183A 2008-03-10 2008-03-10 制御方法、情報処理装置及びストレージシステム Expired - Fee Related JP4644720B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008059183A JP4644720B2 (ja) 2008-03-10 2008-03-10 制御方法、情報処理装置及びストレージシステム
US12/397,736 US20090228745A1 (en) 2008-03-10 2009-03-04 Error backup method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008059183A JP4644720B2 (ja) 2008-03-10 2008-03-10 制御方法、情報処理装置及びストレージシステム

Publications (2)

Publication Number Publication Date
JP2009217435A true JP2009217435A (ja) 2009-09-24
JP4644720B2 JP4644720B2 (ja) 2011-03-02

Family

ID=41054850

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008059183A Expired - Fee Related JP4644720B2 (ja) 2008-03-10 2008-03-10 制御方法、情報処理装置及びストレージシステム

Country Status (2)

Country Link
US (1) US20090228745A1 (ja)
JP (1) JP4644720B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012029147A1 (ja) * 2010-09-01 2012-03-08 富士通株式会社 システムおよび障害処理方法
EP2713273A2 (en) 2012-08-30 2014-04-02 Fujitsu Limited Information processing apparatus and fault processing method for information processing apparatus

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080043366A1 (en) * 2003-06-26 2008-02-21 Spectra Logic Corporation Tape cartridge auxiliary memeory based library
CN113468029A (zh) * 2021-09-06 2021-10-01 成都数之联科技有限公司 日志管理方法、装置、电子设备和可读存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5775336A (en) * 1980-10-28 1982-05-11 Fujitsu Ltd Separating system of faulty device
JPS581249A (ja) * 1981-06-26 1983-01-06 Fujitsu Ltd エラ−割込み方式
JPH0273431A (ja) * 1988-09-09 1990-03-13 Nec Corp 障害処理方式
JPH02183852A (ja) * 1989-01-11 1990-07-18 Nec Corp データ処理装置
JPH03111945A (ja) * 1989-09-26 1991-05-13 Mitsubishi Electric Corp プログラマブル制御装置
JPH06342387A (ja) * 1993-05-31 1994-12-13 Nec Corp 情報処理装置に於ける障害情報採取方式
JPH0981420A (ja) * 1995-09-11 1997-03-28 Fujitsu Ltd エラーログ装置
JP2003242048A (ja) * 2002-02-14 2003-08-29 Hitachi Ltd バスシステム
JP2007133826A (ja) * 2005-11-14 2007-05-31 Fujitsu Ltd サイドバンド・バス設定回路

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5157667A (en) * 1990-04-30 1992-10-20 International Business Machines Corporation Methods and apparatus for performing fault isolation and failure analysis in link-connected systems
US6032266A (en) * 1996-04-05 2000-02-29 Hitachi, Ltd. Network system having function of changing route upon failure
DE19836347C2 (de) * 1998-08-11 2001-11-15 Ericsson Telefon Ab L M Fehlertolerantes Computersystem
FR2787900B1 (fr) * 1998-12-28 2001-02-09 Bull Cp8 Circuit integre intelligent
GB9907254D0 (en) * 1999-03-29 1999-05-26 Sgs Thomson Microelectronics Synchronous data adaptor
US7454664B2 (en) * 2003-06-30 2008-11-18 International Business Machines Corporation JTAGchain bus switching and configuring device
JP4646574B2 (ja) * 2004-08-30 2011-03-09 株式会社日立製作所 データ処理システム
FR2881306B1 (fr) * 2005-01-21 2007-03-23 Meiosys Soc Par Actions Simpli Procede de journalisation non intrusive d'evenements externes aupres d'un processus applicatif, et systeme mettant en oeuvre ce procede
FR2881308B1 (fr) * 2005-01-21 2007-03-23 Meiosys Soc Par Actions Simpli Procede d'acceleration de la transmission de donnees de journalisation en environnement multi ordinateurs et systeme utilisant ce procede
US20060253749A1 (en) * 2005-05-09 2006-11-09 International Business Machines Corporation Real-time memory verification in a high-availability system
US7908606B2 (en) * 2005-05-20 2011-03-15 Unisys Corporation Usage metering system
US7653633B2 (en) * 2005-11-12 2010-01-26 Logrhythm, Inc. Log collection, structuring and processing
US7502992B2 (en) * 2006-03-31 2009-03-10 Emc Corporation Method and apparatus for detecting presence of errors in data transmitted between components in a data storage system using an I2C protocol
US7594144B2 (en) * 2006-08-14 2009-09-22 International Business Machines Corporation Handling fatal computer hardware errors
US7620854B2 (en) * 2007-01-30 2009-11-17 Hewlett-Packard Development Company, L.P. Method and system for handling input/output (I/O) errors

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5775336A (en) * 1980-10-28 1982-05-11 Fujitsu Ltd Separating system of faulty device
JPS581249A (ja) * 1981-06-26 1983-01-06 Fujitsu Ltd エラ−割込み方式
JPH0273431A (ja) * 1988-09-09 1990-03-13 Nec Corp 障害処理方式
JPH02183852A (ja) * 1989-01-11 1990-07-18 Nec Corp データ処理装置
JPH03111945A (ja) * 1989-09-26 1991-05-13 Mitsubishi Electric Corp プログラマブル制御装置
JPH06342387A (ja) * 1993-05-31 1994-12-13 Nec Corp 情報処理装置に於ける障害情報採取方式
JPH0981420A (ja) * 1995-09-11 1997-03-28 Fujitsu Ltd エラーログ装置
JP2003242048A (ja) * 2002-02-14 2003-08-29 Hitachi Ltd バスシステム
JP2007133826A (ja) * 2005-11-14 2007-05-31 Fujitsu Ltd サイドバンド・バス設定回路

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012029147A1 (ja) * 2010-09-01 2012-03-08 富士通株式会社 システムおよび障害処理方法
JP5370591B2 (ja) * 2010-09-01 2013-12-18 富士通株式会社 システムおよび障害処理方法
US8832501B2 (en) 2010-09-01 2014-09-09 Fujitsu Limited System and method of processing failure
EP2713273A2 (en) 2012-08-30 2014-04-02 Fujitsu Limited Information processing apparatus and fault processing method for information processing apparatus

Also Published As

Publication number Publication date
JP4644720B2 (ja) 2011-03-02
US20090228745A1 (en) 2009-09-10

Similar Documents

Publication Publication Date Title
US7543191B2 (en) Method and apparatus for isolating bus failure
US7409580B2 (en) System and method for recovering from errors in a data processing system
TW440755B (en) Method and system for environmental sensing and control within a computer system
US20060161714A1 (en) Method and apparatus for monitoring number of lanes between controller and PCI Express device
US8700835B2 (en) Computer system and abnormality detection circuit
US7406632B2 (en) Error reporting network in multiprocessor computer
JP6098778B2 (ja) 冗長化システム、冗長化方法、冗長化システムの可用性向上方法、及びプログラム
JP5541368B2 (ja) アクセス方法、およびマルチコアプロセッサシステム
US20110043323A1 (en) Fault monitoring circuit, semiconductor integrated circuit, and faulty part locating method
WO2001080009A2 (en) Fault-tolerant computer system with voter delay buffer
JP4644720B2 (ja) 制御方法、情報処理装置及びストレージシステム
CN112650612A (zh) 一种内存故障定位方法及装置
US7774690B2 (en) Apparatus and method for detecting data error
US20060212749A1 (en) Failure communication method
JP2001356968A (ja) 故障許容データ格納システムおよび故障許容データ格納システムの動作方法
EP3321814B1 (en) Method and apparatus for handling outstanding interconnect transactions
JP2008176477A (ja) 計算機システム
JP4299634B2 (ja) 情報処理装置及び情報処理装置の時計異常検出プログラム
US7243257B2 (en) Computer system for preventing inter-node fault propagation
CN107451028A (zh) 错误状态储存方法及服务器
JP5561790B2 (ja) ハードウェア障害被疑特定装置、ハードウェア障害被疑特定方法、及びプログラム
JP2001007893A (ja) 情報処理システム及びそれに用いる障害処理方式
CN108415788B (zh) 用于对无响应处理电路作出响应的数据处理设备和方法
JP5381151B2 (ja) 情報処理装置、バス制御回路、バス制御方法及びバス制御プログラム
JP6992295B2 (ja) 電子装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091215

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100215

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101124

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101206

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131210

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees