JP5488693B2 - マルチクラスタシステム - Google Patents

マルチクラスタシステム Download PDF

Info

Publication number
JP5488693B2
JP5488693B2 JP2012507910A JP2012507910A JP5488693B2 JP 5488693 B2 JP5488693 B2 JP 5488693B2 JP 2012507910 A JP2012507910 A JP 2012507910A JP 2012507910 A JP2012507910 A JP 2012507910A JP 5488693 B2 JP5488693 B2 JP 5488693B2
Authority
JP
Japan
Prior art keywords
system storage
storage device
connection
cluster
circuit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012507910A
Other languages
English (en)
Other versions
JPWO2011121666A1 (ja
Inventor
好次 佐野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JPWO2011121666A1 publication Critical patent/JPWO2011121666A1/ja
Application granted granted Critical
Publication of JP5488693B2 publication Critical patent/JP5488693B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/2028Failover techniques eliminating a faulty processor or activating a spare
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2094Redundant storage or storage space

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Hardware Redundancy (AREA)
  • Debugging And Monitoring (AREA)

Description

開示の技術は、複数のクラスタがネットワークにより複数のシステム記憶装置に接続されたマルチクラスタシステムに関する。
マルチクラスタシステムは複数の計算機、即ちクラスタにより構成される。マルチクラスタシステムは、複数のクラスタにより共有される例えばシステム記憶装置を用いて、例えばデータベース処理を実行する。複数のクラスタ及び複数のシステム記憶装置間は、例えば電気ケーブル又は光ケーブルを介して接続されている。
なお、複数のシステム記憶装置には、多重化のために同一のデータが格納されている。そのため、複数のシステム記憶装置の1つが故障となっても、他のシステム記憶装置を代わりに用いることができる。他のシステム記憶装置を用いることにより、マルチクラスタシステム全体としては連続的に稼働できる。複数のシステム記憶装置を多重化するために、お互いのシステム記憶装置は等価性を保証するために同一のデータを保持する必要がある。
一方、各クラスタと各システム記憶装置間との論理的な接続状態は、システム記憶装置に備えられた、各クラスタとの論理的接続状態を示す接続状態フラグにより判断される。また、複数のクラスタ間の生存状態は、例えば所定の間隔で行われるクラスタ間のパケット通信により確認される。複数のクラスタ間におけるパケット通信は、システム記憶装置を介して相互に行われる。複数のクラスタ間の経路において接続障害が発生してクラスタ間のパケット通信が出来なくなった場合、一方のクラスタは、生存途絶が検出された他方のクラスタとシステム記憶装置との間のパスを論理的に切り離す。パスが論理的に切り離されたシステム記憶装置は、他のシステム記憶装置とはクラスタの接続構成が異なるため、他のシステム記憶装置と同一のデータを保持することができない。
多重化されている複数のシステム記憶装置を使用しているクラスタは、マスタとなるシステム記憶装置を介して複数のクラスタ間の生存監視のチェックを、オペレーションシステム(Operation System、OS)により所定の間隔で行っている。システム記憶装置との間のパスが切り離されたクラスタは、切り離したシステム記憶装置を介して接続された他方のクラスタの生存確認を実施することができない。生存確認が確認できないクラスタは、マルチクラスタシステムから切り離される。クラスタが切り離される現象をクラスタダウンという。クラスタダウンが発生すると、処理を実施するクラスタ数が減少するため、マルチクラスタシステム全体の処理が遅延する問題が発生する。
従来技術として、下記の文献がある。
特開平5−46580号公報 特開平4−23149号公報
(発明が解決しようとする課題)
開示の技術は、接続障害が検出されたシステム記憶装置を切り離す際にクラスタの接続状態を維持するマルチクラスタシステムを提供することを目的とする。
(課題を解決するための手段)
本発明の課題を解決するため、開示の技術の第1の側面によれば、
プログラムを実行する複数のクラスタと、
それぞれが前記複数のクラスタに接続された複数のシステム記憶装置と、を有し、
少なくとも1つのシステム記憶装置は、
接続されているクラスタとの間に生じた接続障害を示す接続障害情報を含む接続情報を検出する第1回路と、
前記第1回路で検出された接続情報を、前記システム記憶装置に接続された複数のクラスタに通知する第2回路と、を有し、
前記クラスタは、
接続されている複数のシステム記憶装置のそれぞれから接続情報を受信する第3回路と、
前記第3回路で受信した各システム記憶装置からの接続情報に基づいて、前記システム記憶装置を切り離す処理を実行する第4回路と、
を有することを特徴とするマルチクラスタシステムを提供する。
本発明の課題を解決するため、開示の技術の第2の側面によれば、
プログラムを実行する複数のクラスタと、
それぞれが前記複数のクラスタに接続された複数のシステム記憶装置と、を有し、
少なくとも1つのクラスタは、
接続されているシステム記憶装置との間に生じた接続障害を示す接続障害情報を含む接続情報を検出する第1回路と、
前記第1回路で検出された第1接続情報を、前記システム記憶装置に接続された複数のクラスタに通知する第2回路と、を有し、
前記クラスタは、
接続されている複数のシステム記憶装置のそれぞれから接続情報を受信する第3回路と、
前記第3回路で受信した各システム記憶装置からの接続情報に基づいて、前記システム記憶装置を切り離す処理を実行する第4回路と、
を有することを特徴とするマルチクラスタシステムを提供する。
(発明の効果)
開示の技術によれば、クラスタは接続されている複数のシステム記憶装置のそれぞれから接続情報を受信し、受信した各システム記憶装置からの接続情報に基づいて、接続障害が検出されたシステム記憶装置を切り離す処理を実行することができる。そのため、各クラスタの接続障害が検出されていないシステム記憶装置に対する接続状態を維持して接続障害が検出されたシステム記憶装置の切り離しを実施することができる。更に、クラスタの切り離しを防止して処理を実施するクラスタ数の減少を抑制できるため、処理を実施するクラスタ数の減少を抑制できるため、マルチクラスタシステム全体の処理の遅延を抑制できる。
図1は、実施例1に係るマルチクラスタシステムの概略図を示す図である。 図2は、実施例1に係るマルチクラスタシステムの構成図を示す図である。 図3は、実施例1に係るインタフェース回路の内部構成の一部を示す図である。 図4は、実施例1に係るインタフェース回路の内部構成の一部を示す図である。 図5は、実施例1に係るマルチクラスタシステムの動作例を示すシーケンス図である。 図6は、実施例1に係るマルチクラスタシステムの動作例を示すシーケンス図である。 図7は、実施例1に係るマルチクラスタシステムの通信命令処理の一例を示すタイムチャートである。 図8は、実施例1に係るマルチクラスタシステムの通信命令処理の一例を示すタイムチャートである。 図9は、実施例1に係るマルチクラスタシステムの通信命令処理の一例を示すタイムチャートである。 図10は、実施例2に係るマルチクラスタシステムの動作例を示すシーケンス図である。
以下、開示の技術の実施例1及び実施例2に係るマルチクラスタシステム1000及びマルチクラスタシステム1000の制御方法が説明される。ただし、開示の技術は各実施例に限定されるものではない。
(実施例1)
図1から図9では、実施例1に係るマルチクラスタシステム1000及びマルチクラスタシステム1000の制御方法が説明される。
図1は、実施例1に係るマルチクラスタシステム1000の概略構成図を示す。マルチクラスタシステム1000は、システム記憶装置100、システム記憶装置200、クラスタ300、クラスタ400、接続線11、接続線12、接続線21及び接続線22を備える。システム記憶装置100及びシステム記憶装置200は同一の構成を備える。システム記憶装置200において、システム記憶装置100で説明した構成と同様の構成には同一符号を付し、説明を省略する。クラスタ300及びクラスタ400は同一の構成を備える。クラスタ400において、クラスタ300で説明した構成と同様の構成には同一の符号を付し、説明を省略する。
接続線11、接続線12、接続線21及び接続線22は、例えば電気ケーブル又は光ケーブルを用いることができる。システム記憶装置100及びクラスタ300は接続線11を介して接続されている。システム記憶装置100及びクラスタ400は接続線21を介して接続されている。システム記憶装置200及びクラスタ300は接続線12を介して接続されている。システム記憶装置200及びクラスタ400は接続線22を介して接続されている。クラスタ300及びクラスタ400は、システム記憶装置100及びシステム記憶装置200に格納されるデータを読出し、又はシステム記憶装置100及びシステム記憶装置200にデータを書込み、必要な処理を行う。
システム記憶装置100は、インタフェース回路110、システム構成制御回路120、優先制御回路130、複数のメモリアクセスコントローラ140、サービスプロセッサ150、メモリ160及びバス170を備える。インタフェース回路110、システム構成制御回路120、優先制御回路130、メモリアクセスコントローラ140及びメモリ160は、バス170を介して互いに接続されている。
システム記憶装置100は、システム記憶装置100が格納するデータの破損防止を保証するためにシステム記憶装置200と多重化されている。システム記憶装置100は、システム記憶装置200が格納するデータおよびプログラムと同一のデータ及びプログラムを格納する。システム記憶装置100は、接続線11及び接続線21を介してクラスタ300及びクラスタ400に共有されるように接続されている。システム記憶装置100は、システム記憶装置100に接続されているクラスタ300及びクラスタ400の接続を中継する。
インタフェース回路110は、システム記憶装置100をクラスタ300及びクラスタ400と接続するために設けられる。インタフェース回路110は、クラスタ300及びクラスタ400から送信された受信パケットの解析を行い、システム構成制御回路120及び優先制御回路130に対しコマンド及びデータを送信する。インタフェース回路110は、コマンド及びデータがクラスタ300及びクラスタ400と比較してどちらが優先してアクセスされるか設定する。インタフェース回路110は、クラスタ300及びクラスタ400からパケット化されたコマンド及びデータを受信し、またクラスタ300及びクラスタ400に対してパケット化したコマンド及びデータを送信する。
システム構成制御回路120は、インタフェース回路110を介して受信したクラスタ300及びクラスタ400からのコマンドを解析して、システム記憶装置100の構成を解析したコマンドと対応させて設定する。
優先制御回路130は、メモリアクセスコントローラ140に対するアクセス制御を行う。優先制御回路130は、アクセスの優先順位をメモリアクセスコントローラ140に通知する。
メモリアクセスコントローラ140は、優先制御回路130によって通知されたアクセスの優先順位に応じて、メモリ160に対するアクセスの制御を行う。
サービスプロセッサ150は、例えば、マルチクラスタシステム1000の運転及び保守診断の制御を含むシステム制御を行う。サービスプロセッサ150は、例えばオペレータコンソール機能を備える。
メモリ160は、例えば、クラスタ300及びクラスタ400で使用されるデータ、クラスタ300及びクラスタ400に実行させるOSのプログラム及び演算プログラム160Aの少なくとも一部を一時的に格納する。演算プログラム160Aは、実施例1に係る演算処理を実施するためのプログラムである。演算プログラム160Aは、クラスタ300及びクラスタ400によって実行される。クラスタ300又は400がダウン又は接続障害により使用できなくなった場合、演算プログラム160Aの処理は、システム記憶装置100及び200に接続された不図示の待機系クラスタにより実行される。
なお、演算プログラム160Aは、必ずしもメモリ160に記憶させておく必要は無い。演算プログラム160Aは、例えば、システム記憶装置100に挿入されるフレキシブルディスク(FD)、CD−ROM、MOディスク、DVDディスク、光磁気ディスク及びICカードなどの「可搬用の物理的な記憶媒体」に記憶される。また、演算プログラム160Aは、システム記憶装置100の内外に備えられるディスク装置、あるいは公衆回線やインターネット、LAN、WANなどを介してシステム記憶装置100に接続される「他のコンピュータ(またはサーバ)」の記憶媒体に記憶される。システム記憶装置100は、上記記憶媒体から演算プログラム160Aを読み出して実行することができる。
システム記憶装置200は、インタフェース回路210、システム構成制御回路220、優先制御回路230、メモリアクセスコントローラ240、サービスプロセッサ250、メモリ260及びバス270を備える。インタフェース回路210、システム構成制御回路220、優先制御回路230、メモリアクセスコントローラ240及びメモリ260は、バス270を介して互いに接続されている。
システム記憶装置200は、システム記憶装置200が格納するデータの破損防止を保証するためにシステム記憶装置100と多重化されている。システム記憶装置200は、システム記憶装置100と同一のデータ及びプログラムを格納する。システム記憶装置200は、接続線12及び接続線22を介してクラスタ300及びクラスタ400に共有されるように接続されている。また、システム記憶装置200は、システム記憶装置200に接続されているクラスタ300及びクラスタ400間の接続を中継する。
クラスタ300は、インタフェース回路310、システム記憶転送部320、チャネル装置330、システムコントローラ340、主記憶装置350、サービスプロセッサ360、複数の中央処理装置370及びバス380を備える。インタフェース回路310、システム記憶転送部320、チャネル装置330、システムコントローラ340、主記憶装置350及び中央処理装置370は、バス380を介して互いに接続されている。
インタフェース回路310は、クラスタ300がシステム記憶装置100及びシステム記憶装置200と接続するために設けられる。インタフェース回路310は、システム記憶装置100及びシステム記憶装置200から送信された受信パケットの解析を行い、システム記憶転送部320に対する命令の応答やデータの転送を行う。インタフェース回路310は、システム記憶転送部320に対し、コマンド及びデータのアクセスの優先順位を設定する。インタフェース回路310は、システム記憶転送部320から受信したコマンド及びデータをパケット化し、システム記憶装置100及びシステム記憶装置200に対してパケット化されたコマンド及びデータを送信する。
システム記憶転送部320は、インタフェース回路310と主記憶装置350との間のデータ転送の制御を行う。システム記憶転送部320は、インタフェース回路310及びシステム記憶装置200のインタフェース回路210を介して接続されるクラスタ400との通信の制御を行う。
チャネル装置330は、システム記憶転送部320を介して主記憶装置350からデータを読み出して中央処理装置370へデータ転送を行う。
システムコントローラ340は、システム記憶転送部320、チャネル装置330、主記憶装置350及び中央処理装置370間のデータ転送を制御する。
主記憶装置350は、システム記憶転送部320及び中央処理装置370からの要求により、データの記憶及び保持を行う。
サービスプロセッサ360は、システム記憶装置100に係るサービスプロセッサ150と同様に、マルチクラスタシステム1000の運転及び保守診断の制御を含むシステム制御を行う。
中央処理装置370は、クラスタ300に係る演算処理を実行する。中央処理装置370は、システム記憶転送部320、チャネル装置330、システムコントローラ340及び主記憶装置350を制御する。
クラスタ400は、インタフェース回路410、システム記憶転送部420、チャネル装置430、システムコントローラ440、主記憶装置450、サービスプロセッサ460、中央処理装置470及びバス480を備える。インタフェース回路410、システム記憶転送部420、チャネル装置430、システムコントローラ440、主記憶装置450及び中央処理装置470は、バス480を介して互いに接続されている。
図2は、図1のマルチクラスタシステム1000において、一点鎖線で示した箇所Aの構成図を示す図である。なお、図1に示すマルチクラスタシステム1000において、図1で説明した構成と同様の構成には同一の符号を付し、説明を省略する。
以下の説明では、システム記憶装置100がマスタ、システム記憶装置200がスレーブとして動作しているものとする。マスタであるシステム記憶装置100が現用装置として動作する。
システム記憶装置100に係るインタフェース回路110は、障害検出通知回路110A1及び障害検出通知回路110A2を備える。障害検出通知回路110A1は、クラスタ300に備えられた障害検出通知回路310A1に、接続線11を介して接続されている。障害検出通知回路110A2は、クラスタ400に備えられた障害検出通知回路410A1に、接続線21を介して接続されている。
システム記憶装置100のインタフェース回路110に設けられた障害検出通知回路110A1及び障害検出通知回路110A2は、システム記憶装置100と対応するクラスタとの間の接続障害を検出する。具体的には、障害検出通知回路110A1はクラスタ300から、障害検出通知回路110A2はクラスタ400からそれぞれ通知される接続障害情報を受信する。障害検出通知回路110A1、110A2はまた、対応するクラスタ送信されるパケットの解析及びチェックを行い、インタフェース回路110において対応するクラスタとの間の接続障害を検出する。なお、クラスタから受信したデータのエラーをチェックした結果、データチェックに問題が無い場合でも、データをシステム記憶装置100の内部に取り込むまでの経路上で接続障害が発生する場合がある。そのため、障害検出通知回路110A1及び障害検出通知回路110A2は、システム記憶装置100の内部にデータを取り込むまでの経路で発生する接続障害を、全てインタフェース回路110における接続障害として検出する。
システム記憶装置100に係るシステム構成制御回路120は、接続状態フラグ120A1及び接続状態フラグ120A2を記憶する領域を備える。接続状態フラグ120A1は、クラスタ300とシステム記憶装置100との論理的な接続状態を示すフラグである。接続状態フラグ120A1は、障害検出通知回路110A1によりクラスタ300とシステム記憶装置100との間の接続障害が検出されるとオフされる。接続状態フラグ120A2は、クラスタ400とシステム記憶装置100との論理的な接続状態を示すフラグである。接続状態フラグ120A2は、障害検出通知回路110A2によりクラスタ400とシステム記憶装置100との間の接続障害が検出されるとオフされる。システム構成制御回路120では、オフされた接続状態フラグ120A1及び接続状態フラグ120A2に対応するクラスタとの接続を論理的に切断する。
システム記憶装置100に係る優先制御回路130は、インタフェース障害通知回路130Aを備える。インタフェース障害通知回路130Aは、障害検出通知回路110A1及び障害検出通知回路110A2に接続される。例えば、クラスタ300との間の接続障害が障害検出通知回路110A1からインタフェース障害通知回路130Aに通知された場合、インタフェース障害通知回路130Aは障害検出通知回路110A1から受信した接続障害を、クラスタ400に接続された障害検出通知回路110A2に通知する。
システム記憶装置200に設けられた各部の機能は、システム記憶装置100に設けられた各部の機能と基本的に同一であるため、詳細説明は省略する。
クラスタ300に係るインタフェース回路310は、障害検出通知回路310A1、障害検出通知回路310A2、接続状態受信回路310B及びコマンド生成発行回路310Cを備える。
障害検出通知回路310A1は、システム記憶装置100に備えられた障害検出通知回路110A1に、接続線11を介して接続されている。障害検出通知回路310A2は、システム記憶装置200に備えられた障害検出通知回路210A1に、接続線21を介して接続されている。
障害検出通知回路310A1及び障害検出通知回路310A2は、接続されたシステム記憶装置との間の接続障害を検出する。具体的には、障害検出通知回路310A1はシステム記憶装置100から、障害検出通知回路310A2はシステム記憶装置200からそれぞれ接続障害情報を受信する。また、障害検出通知回路310A1、310A2は、対応するしステム記憶装置から送信されるパケットの解析及びチェックを行い、対応するシステム記憶装置との間の接続障害を検出する。なお、データチェックに問題が無い場合でも、データをクラスタ300の内部に取り込むまでの経路上に接続障害が発生する場合がある。障害検出通知回路310A1及び障害検出通知回路310A2は、クラスタ300の内部に取り込むまでの経路で生じた接続障害を、全てインタフェース回路310における接続障害として検出する。
接続状態受信回路310Bは、障害検出通知回路310A1又は障害検出通知回路310A2から対応するシステム記憶装置との間の接続状態を示す接続情報を受信する。対応するシステム記憶装置との間の接続障害を検出した、インタフェース回路310の障害検出通知回路からの接続情報は、接続障害を示す情報が含まれる。システム記憶装置との間に接続障害が発生した場合、接続状態受信回路310Bは、接続障害を検出した障害検出通知回路からの接続情報と、接続障害を検出していない障害検出通知回路からの接続情報とを受信する。
障害検出通知回路310A1と310A2とのいずれかの障害検出通知回路から、対応するシステム記憶装置との間の接続障害が通知された場合、接続状態受信回路310Bは、接続障害が検出されていない、他方のシステム記憶装置とクラスタ300との間の接続状態に基づいて、クラスタ300に接続されているシステム記憶装置間の等価性が保証されている状態にあるか否かを判断する。
接続障害が検出されていない他方のシステム記憶装置がクラスタ300とは論理的に接続されていない場合、接続状態受信回路310Bは、接続障害が検出されたシステム記憶装置と他方のシステム記憶装置とに同一のデータ及びプログラムが格納されていると判断する。即ち、接続状態受信回路310Bは接続障害が検出されたシステム記憶装置と他のシステム記憶装置との等価性が保証されていると判断する。
一方、接続障害が検出されていない他方のシステム記憶装置がクラスタ300と論理的に接続されている場合、接続状態受信回路310Bは、接続障害が検出されたシステム記憶装置には、他のシステム記憶装置と同一のデータ及びプログラムが格納されていないと判断する。即ち、接続状態受信回路310Bは、接続障害が検出されたシステム記憶装置と他方のシステム記憶装置との等価性が保証されていないと判断する。
接続状態受信回路310Bは、判断した結果を受信情報としてコマンド生成発行回路310Cに通知する。
コマンド生成発行回路310Cは、接続状態受信回路310Bから得られた受信情報に基づいて、クラスタ300から切り離すシステム記憶装置に対する切り離し要求コマンドを生成し、発行する。具体的には、コマンド生成発行回路310Cは、障害検出通知回路310A1又は障害検出通知回路310A2のうち、対応するシステム記憶装置との間に接続障害が発生した障害検出通知回路に対して、対応するシステム記憶装置を切り離すための要求コマンドを発行する。要求コマンドは、例えばパケット化されたコマンド及びデータを使用することができる。
クラスタ400に係るインタフェース回路410は、障害検出通知回路410A1、障害検出通知回路410A2、接続状態受信回路410B及びコマンド生成発行回路410Cを備える。各部の基本的な機能はクラスタ300の各部と同様であるため、詳細説明は省略する。
図3は、図1のクラスタ300において、破線で示した箇所Bのインタフェース回路310とシステム記憶転送部320との構成を示す図である。なお、図3に示すマルチクラスタシステム1000において、図1で説明した構成と同様の構成には同一の符号を付し、説明を省略する。
インタフェース回路310は、システム記憶装置100に対応するインタフェース回路310−1及びシステム記憶装置200に対応するインタフェース回路310−2を備える。
インタフェース回路310−1は、障害検出通知回路310−1A、接続状態受信回路310−1B、コマンド生成発行回路310−1C、フリップフロップ310−1D、巡回冗長検査回路310−1E、パケット間隔監視回路310−1F、誤り訂正符号生成回路310−1G、Random Access Memory(RAM)310−1H、誤り訂正符号検査回路310−1I、コマンド解析回路310−1J、コマンド生成回路310−1K、コマンド優先選択回路310−1L、コマンド保持レジスタ回路310−1M、パケット生成回路310−1N及びフリップフロップ310−1Oを備える。
なお、図3の障害検出通知回路310−1A、図2の障害検出通知回路310A1、310A2は同じ要素である。図3の接続状態受信回路310−1B、図2の接続状態受信回路310B1、310B2は同じ要素である。図3のコマンド生成発行回路310−1C、図2のコマンド生成発行回路310C1、310C2は同じ要素である。
フリップフロップ310−1Dは、システム記憶装置100から転送されたデータのパケットを受信し、巡回冗長検査回路310−1Eに送信する。データのパケットは、システム記憶装置100とクラスタ300との間の接続情報を含む。システム記憶装置100によって接続障害が検出された場合、システム記憶装置100から障害検出情報を含むパケットが送信される。
巡回冗長検査回路310−1Eは、フリップフロップ310−1Dから転送されたパケットに基づいて、パケットのエラーを検出するエラー検出、例えばCyclic Redundancy Check(CRC)を実行後、RAM310−1Hに送信する。また、巡回冗長検査回路310−1Eは、CRCを実行後、パケット間隔監視回路310−1F及び誤り訂正符号生成回路310−1Gに送信する。
パケット間隔監視回路310−1Fは、転送されたパケットの通信間隔を監視し、一定時間パケットの受信が途絶えた場合に接続障害通知を障害検出通知回路310−1Aに送信する。
誤り訂正符号生成回路310−1Gは、データに係る符号の誤りが発生した場合に付与する誤り訂正符号を生成し、RAM310−1Hに送信する。
RAM310−1Hは、巡回冗長検査回路310−1Eによりチェックされたデータ、及び誤り訂正符号生成回路310−1Gにより生成された誤り訂正符号を書き込み、書き込まれた情報を誤り訂正符号検査回路310−1I及びコマンド解析回路310−1Jに送信する。
誤り訂正符号検査回路310−1Iは、データに係る符号の誤りが発生した場合に、接続障害通知を障害検出通知回路310−1Aに送信する。
コマンド解析回路310−1Jは、RAM310−1Hから受信したコマンドを解析する。コマンド解析回路310−1Jは、解析の結果得られたシステム記憶装置100とクラスタ300との間の接続情報を、システム記憶装置200に対応するインタフェース回路310−2に送信する。また、コマンド解析回路310−1Jは、システム記憶装置100とクラスタ300との間における接続障害、即ちエラー情報を接続状態受信回路310−1Bに送信する。
接続状態受信回路310−1Bは、コマンド解析回路310−1Jから送信されたシステム記憶装置100とクラスタ300との間の接続障害と、システム記憶装置200に対応するインタフェース回路310−2から送信されたシステム記憶装置200とクラスタ300との間の接続情報とを受信する。接続状態受信回路310−1Bは、システム記憶装置100から接続障害が通知され、且つインタフェース回路310−2から送信されているシステム記憶装置200から接続情報が通知されている場合、システム記憶装置100とシステム記憶装置200は同一のデータを保持していないと判断する。システム記憶装置100とシステム記憶装置200が同一のデータを保持していない場合、システム記憶装置100とシステム記憶装置200との等価性は保証されていない。即ち、システム記憶装置100は、システム記憶装置200との等価性が保証されていないと判断する。システム記憶装置100とシステム記憶装置200との等価性が保証されていない場合、接続状態受信回路310−1Bは、システム記憶装置100の接続障害検出信号をコマンド保持レジスタ回路310−1Mに送信する。
障害検出通知回路310−1Aは、誤り訂正符号検査回路310−1Iから送信された、RAM310-1Hから読み出したデータの2ビットエラー及びパケット間隔監視回路310−1Fによって検出されたパケット通信間隔のタイムアウトエラーを受信する。障害検出通知回路310−1Aは、2ビットエラー又はタイムアウトエラーを受信した場合、コマンド生成発行回路310−1Cにコマンドを送信する。コマンド生成発行回路310−1Cに送信されるコマンドは、システム記憶装置100とクラスタ300との間の接続障害を含む。送信されるコマンドは、障害検出通知回路310−1Aに保持される。
コマンド生成回路310−1Kは、各システム記憶装置との間のデータ転送及びパケット転送に必要なコマンドを生成する。コマンド生成回路310−1Kにより生成された各種コマンドは、コマンド保持レジスタ回路310−1Mに送信され、コマンド保持レジスタ回路310−1Mに保持される。
コマンド保持レジスタ回路310−1Mは、接続状態受信回路310−1Bにより送信された切り離しコマンドを保持する。コマンド保持レジスタ回路310−1Mは、このときに、切り離しの対象となるシステム記憶装置の情報も保持する。コマンド保持レジスタ回路310−1Mは、障害検出通知回路310−1Aから受信したシステム記憶装置100とクラスタ300との間の接続障害を含むコマンドを保持する。コマンド保持レジスタ回路310−1Mは、システム記憶転送部320から受信したデータを保持する。コマンド保持レジスタ回路310−1Mは、コマンド生成発行回路310−1Cからのリセット指示によりコマンド生成された保持レジスタをリセットする。コマンド保持レジスタ回路310−1Mは、保持している各コマンド及び指示をコマンド優先選択回路310−1Lに送信する。
コマンド優先選択回路310−1Lは、コマンド保持レジスタ回路310−1Mにより保持されているコマンドのうち、どのコマンドを優先するか選択する。コマンド優先選択回路310−1Lは、例えば、コマンド保持レジスタ回路310−1Mにより保持された、システム記憶装置を切り離すためのコマンドを選択する。コマンド優先選択回路310−1Lは、選択されたコマンド生成発行回路310−1Cに送信する。
コマンド生成発行回路310−1Cは、コマンド優先選択回路310−1Lにより選択されたコマンドを実行する際に必要なデータを選択し、パケット生成回路310−1Nに送信する。システム記憶装置を切り離すためのコマンドをコマンド優先選択回路310−1Lが選択した場合、コマンド生成発行回路310−1Cは、コマンド優先選択回路310−1Lにより選択されたシステム記憶装置を切り離すためのコマンドを実行する際に必要なデータを選択し、パケット生成回路310−1Nに送信する。また、コマンド生成発行回路310−1Cは、システム記憶装置を切り離す際に必要なデータが生成された後、コマンド保持レジスタ回路310−1Mのコマンドの保持をリセットする命令をコマンド保持レジスタ回路310−1Mに送信する。
パケット生成回路310−1Nは、コマンド生成発行回路310−1Cから送信されたシステム記憶装置を切り離すためのデータに基づきパケットを生成する。パケット生成回路310−1Nは、生成したパケットをフリップフロップ310−1Oに送信する。
フリップフロップ310−1Oは、パケット生成回路310−1Nからパケットを受信する。パケットは、システム記憶装置100及びクラスタ300間を切り離すための切り離し情報を含む。フリップフロップ310−1Oは、システム記憶装置100に対し、システム記憶装置100及びクラスタ300間を切り離すためのパケットを送信する。
インタフェース回路310−2は、システム記憶装置200とパケットの送受信を行う。インタフェース回路310−2は、インタフェース回路310−1と同一の構成を備える。
図4は、図3に係るインタフェース回路310−1のうち、破線で示した箇所Cのインタフェース回路310−1の構成図を示す図である。図4は、インタフェース回路310−1のうち、コマンド保持レジスタ回路310−1M、コマンド優先選択回路310−1L、コマンド生成発行回路310−1C及びパケット生成回路310−1Nを示す。なお、図4に示すインタフェース回路310−1において、図3で説明した構成と同様の構成には同様の符号を付し、説明を省略する。
コマンド保持レジスタ回路310−1Mは、切離コマンド生成フラグ310−1M1及び切離選択レジスタ郡310−1M2を備える。
切離コマンド生成フラグ310−1M1は、接続状態受信回路310−1Bから接続障害検出信号を受信すると、システム記憶装置をクラスタ300及び400から切離すためのコマンドを生成する。切離コマンド生成フラグ310−1M1は、生成したコマンドをコマンド優先選択回路310−1Lに送信する。
切離選択レジスタ郡310−1M2は、接続状態受信回路310−1Bから接続障害検出信号を受信すると、クラスタ300からの切り離しの対象となるシステム記憶装置を選択するための選択コマンドを生成する。切離選択レジスタ郡310−1M2は、生成した選択コマンドをコマンド生成発行回路310−1Cに送信する。
コマンド生成発行回路310−1Cは、タイミングシフトレジスタ310−1C1〜310−1C4を備える。
タイミングシフトレジスタ310−1C1〜310−1C4は、例えばフリップフロップを備える。タイミングシフトレジスタ310−1C1〜310−1C4は、コマンド優先選択回路310−1Lから、切り離しの対象となるシステム記憶装置を切離すために必要なコマンドを受信する。タイミングシフトレジスタ310−1C1〜310−1C4は、例えば切離の対象となるシステム記憶装置を選択するために必要なデータ及びシステム記憶装置の切離箇所を選択するために必要なデータを生成する。
コマンド生成発行回路310−1Cは、データ生成後、コマンド保持レジスタ回路310−1Mに対して保持しているコマンドのリセットを指示するリセット命令を送信する。コマンド生成発行回路310−1Cは、システム記憶装置を切り離すためのコマンドを実行する際に必要なデータをタイミングシフトレジスタ310−1C1〜310−1C4から選択する。データの選択は、タイミングシフトレジスタ310−1C1〜310−1C4により任意のタイミングで行われる。コマンド生成発行回路310−1Cは、選択されたデータをパケット生成回路310−1Nに送信する。
図5及び図6は、実施例1に係るマルチクラスタシステム1000の動作例を示すシーケンス図である。図5に示す処理は図6のAに続いている。図5及び図6に示す処理は、システム記憶装置100の障害検出通知回路110A1で、システム記憶装置100とクラスタ300との間の接続障害が検出された際の処理を示す図である。なお、図5および図6でも、システム記憶装置100がマスタとして動作し、システム記憶装置200がスレーブとして動作するものとする。
図5に示すように、システム記憶装置100は、障害検出通知回路110A1でクラスタ300との間の接続障害を検出する(OP1)。
クラスタ300との間の接続状態検出に応じて、システム記憶装置100は、システム構成制御回路120によりクラスタ300に対応する接続状態フラグをオフにする(OP2)。
システム記憶装置100は、優先制御回路130により、クラスタ300及びクラスタ400に対して、システム記憶装置100とクラスタ300との間に接続障害が発生したことを示す接続障害情報を含む接続情報を通知する(OP3)。以下は、システム記憶装置100とクラスタ400との間の処理を示す。
一方、システム記憶装置200も、接続されているクラスタ300、クラスタ400の双方に対し接続情報を通知する(OP4)。接続されているクラスタ300、400との間の接続障害をシステム記憶装置200が検出していない場合には、システム記憶装置200から各クラスタ300、400に通知される接続情報には、接続障害を示す情報は含まれていない。
クラスタ400は、システム記憶装置100からの接続情報と、システム記憶装置200から接続情報とを、インタフェース回路410を介して受信する。インタフェース回路410の接続状態受信回路410Bは、システム記憶装置100からの接続情報と、システム記憶装置200からの接続情報を参照し、いずれかのシステム記憶装置から受信した接続情報に接続障害情報が含まれているか否かを判断する。接続状態受信回路410Bはまた、いずれかのシステム記憶装置から受信した接続情報に接続障害情報が含まれていた場合、他方のシステム記憶装置から受信した接続情報を参照して、他方のシステム記憶装置とクラスタ400との論理的な接続状態を判断する(OP11)。OP11において、システム記憶装置100からの接続情報に接続障害情報が含まれ、且つシステム記憶装置200の接続情報からクラスタ400とシステム記憶装置200とが論理的に接続されていると判断され、クラスタ400は次にOP12の処理を行う。
クラスタ400は、コマンド生成発行回路410Cを用いて、システム記憶装置100に対する切離し命令を生成する(OP12)。
クラスタ400は、コマンド生成発行回路410Cを用いて、生成した切り離し命令をシステム記憶装置100に対して発行する(OP13)。
システム記憶装置100の障害検出通知回路110A2は、クラスタ400からシステム記憶装置の切離し命令を受信する。
クラスタ300も、クラスタ400と同様に各システム記憶装置からの接続情報に基づいて、システム記憶装置100に対する切り離し命令を生成するが、クラスタ300とシステム記憶装置100との間には接続障害が生じているため、システム記憶装置100はクラスタ300からの切り離し命令を受けることは出来ない。
クラスタ400から切り離し命令を受信したシステム記憶装置100は、障害検出通知回路110A1を介して、接続されている全クラスタに対応する接続状態フラグをオフにする。この例では、障害検出通知回路110A1は接続状態フラグ120A1及び接続状態フラグ120A2をオフにする(OP14)。
システム記憶装置100は、クラスタ300及びクラスタ400をシステム記憶装置100から論理的に切り離す(OP15)。
なお、図6に係るOP11において、システム記憶装置100及びシステム記憶装置200の接続情報に基づいて、システム記憶装置200がクラスタ400に対して論理的に接続されていないと判断されると、クラスタ400は、システム記憶装置100から受信した障害通知を無視する(OP16)。
図7から図9は、実施例1に係るマルチクラスタシステム1000の通信命令処理の一例を示すタイムチャートである。図7から図9に示す横軸は時刻tを示す。横軸における1目盛は1クロックを示す。図7から図9に係る処理は、システム記憶装置100とクラスタ300との間の接続障害を検出する処理を示す。
図7は、クラスタ300のインタフェース回路310における通信命令処理の一例を示すタイムチャートである。
図7に示すように、障害検出通知回路310−1Aは、システム記憶装置100とクラスタ300間の接続障害を検出する(T1)。
コマンド生成発行回路310−1Cは、障害通知コマンド生成フラグの生成を開始する(T2)。
コマンド生成発行回路310−1Cは、障害通知コマンド生成フラグの生成を開始する(T3)。コマンド生成発行回路310−1Cは、コマンド保持レジスタ回路310−1Mに対してパケット生成回路310−1Nに対してコマンドを送信した後、コマンド保持のリセット命令を送信する(T3’)。障害通知コマンド生成フラグが生成される間、コマンド生成発行回路310−1Cにおいて他のコマンドは選択されない。
タイミングシフトレジスタ310−1C1〜310−1C7は、選択されたシステム記憶装置100を切離すために必要なデータのみパケット生成回路310−1Nに送信する(T4)。
パケット生成回路310−1Nは、コマンド生成発行回路310−1Cからデータを受信しパケット化する(T5)。
パケット生成回路310−1Nは、パケット化されたデータを出力する(T6)。パケット生成回路310−1Nは、入力データに対してパケット転送のために必要なデータを追加してシステム記憶装置100に送信する。
図8は、システム記憶装置100の障害検出通知回路110A1及び障害検出通知回路110A2における通信命令処理の一例を示すタイムチャートである。図8は、クラスタ300の障害検出通知回路310A1から、システム記憶装置100の障害検出通知回路110A2に対して障害検出情報を含むデータの受信を開始する際の処理である。なお、システム記憶装置100の障害検出通知回路110A1はクラスタ300の障害検出通知回路310A1に対応している。システム記憶装置100の障害検出通知回路110A2はクラスタ400の障害検出通知回路410A2に対応している。
障害検出通知回路110A1は、クラスタ300から受信した入力データのコマンド解析を行う(T11)。入力データは、クラスタ300の障害検出通知回路310A1とシステム記憶装置100の障害検出通知回路110A1との間の障害検出情報を含む。
障害検出通知回路110A1は、コマンド解析を行った後、システム記憶装置100の他の障害検出通知回路110A2にインタフェース障害通知回路130Aを経由して接続障害を送信する(T12)。
障害検出通知回路110A2は、110A1から接続障害を受信した後、システム記憶装置100とクラスタ300との間で接続障害が検出されたことをクラスタ400に送信する(T13)。
図9は、クラスタ400のインタフェース回路410における通信命令処理の一例を示すタイムチャートである。図9は、システム記憶装置100の障害検出通知回路110A2から、クラスタ400の障害検出通知回路410A2に対する障害検出情報を含むデータを受信する際の処理である。なお、クラスタ400の障害検出通知回路410A1は、システム記憶装置100の障害検出通知回路110A2に対応している。なお、クラスタ400のインタフェース回路410の構成は、図2〜図4で説明したクラスタ300のインタフェース回路310の構成と同じであるため、説明を省略する。
図9に示すように、コマンド解析回路410−1Jは、システム記憶装置100から受信した入力データの解析を行う(T21)。入力データは、クラスタ300の障害検出通知回路310A1とシステム記憶装置100の障害検出通知回路110A1との間の障害検出情報を含む。
コマンド解析回路410−1Jは、システム記憶装置100からデータを受信する。コマンド解析回路410−1Jは、システム記憶装置100とクラスタ300との間の接続障害を解析し受信する(T22)。
接続状態受信回路410−1Bは、システム記憶装置200とクラスタ400との間の接続情報を障害検出通知回路410A2から受信する(T23)。
接続状態受信回路410−1Bは、コマンド解析回路410−1Jから送信されたシステム記憶装置100及びクラスタ300間の接続障害を含む接続情報と、障害検出通知回路410A2から通知されたシステム記憶装置200とクラスタ400との間の接続情報を受信する。各々の接続情報に基づいて、システム記憶装置100及びシステム記憶装置200との等価性が保証されていないと判断された場合、接続状態受信回路410−1Bは、コマンド保持レジスタ回路410−1Mに対してシステム記憶装置100の接続障害を含む接続情報を送信する(T24)。
コマンド生成発行回路410−1Cは、接続状態受信回路410−1Bから受信した接続情報に基づいて、障害通知コマンド生成フラグをセットする(T25)。
コマンド生成発行回路410−1Cはまた、障害通知コマンド生成フラグをセットする(T26)。コマンド生成発行回路410−1Cは、コマンド保持レジスタ回路410−1Mに対してパケット生成回路410−1Nに対してコマンドを送信した後、コマンド保持のリセット命令を送信する(T26’)。障害通知コマンド生成フラグがセットされている間、コマンド生成発行回路410−1Cにおいて他のコマンドは選択されない。
タイミングシフトレジスタ410−1C1〜410−1C7は、選択されたシステム記憶装置100を切離すために必要なデータのみパケット生成回路410−1Nに送信する(T27)。
パケット生成回路410−1Nは、コマンド生成発行回路410−1Cからデータを受信しパケット化する(T28)。
パケット生成回路410−1Nは、パケット化されたデータが出力される(T28)。パケット生成回路410−1Nは、入力データに対してパケット転送のために必要なデータを追加してシステム記憶装置100に送信する。システム記憶装置100は、クラスタ300及び400から切り離される。
実施例1におけるマルチクラスタシステム1000及びマルチクラスタシステム1000の制御方法によれば、クラスタ400はシステム記憶装置100により通知された接続障害を含む接続情報と、システム記憶装置200により通知された接続情報とに基づいて、システム記憶装置100を切り離すことができる。そのため、クラスタ300及びクラスタ400のシステム記憶装置200に対する接続状態を維持して接続障害が検出されたシステム記憶装置100の切り離しを実施することができる。更に、クラスタ300の切り離しを防止して処理を実施するクラスタ数の減少を抑制できるため、マルチクラスタシステム1000全体の処理の遅延を抑制できる。
(実施例2)
図10では、実施例2に係るマルチクラスタシステム1000及びマルチクラスタシステム1000の制御方法が説明される。実施例2に係るマルチクラスタシステム1000の構成は、実施例1に係るマルチクラスタシステム1000の構成と同一であるため説明を省略する。
図10は、実施例2に係るマルチクラスタシステム1000の動作例を示すシーケンス図である。図10に示す処理は、クラスタ300の障害検出通知回路310A1で、システム記憶装置100とクラスタ300との間の接続障害が検出された際の処理を示す図である。
図10に示すように、クラスタ300は障害検出通知回路310A1で、システム記憶装置100とクラスタ300との間の接続障害を検出したものとする(OP21)。
OP21による接続障害検出により、クラスタ300は、障害検出通知回路310A1からシステム記憶装置100の障害検出通知回路110A1に対して、システム記憶装置100とクラスタ300との間に接続障害が生じたことを示す接続障害情報を含む接続情報を通知する(OP22)。
クラスタ300からの接続情報を受信したシステム記憶装置100は、優先制御回路130により、システム記憶装置100とクラスタ300との間に接続障害が発生したことを示す情報を含む接続情報を、クラスタ400に対して通知する(OP23)。
一方、システム記憶装置200も、接続されているクラスタ300、クラスタ400の双方に対し接続情報を通知する(OP24)。接続されているクラスタ300、400との間の接続障害をシステム記憶装置200が検出していない場合には、システム記憶装置200から各クラスタ300、400に通知される接続情報には、接続障害を示す情報は含まれていない。
クラスタ400は、OP23、OP24の処理によってシステム記憶装置100、200から接続情報を受信した後、実施例1のOP11〜OP15と同様の処理を実行する(OP25)。即ち、クラスタ400によるシステム記憶装置100の切り離し処理が行われる。
実施例2におけるマルチクラスタシステム1000及びマルチクラスタシステム1000の制御方法によれば、クラスタ300により通知されたシステム記憶装置100−クラスタ300間の接続障害を含む接続情報と、クラスタ400のインタフェース回路410から通知された接続情報とに基づいて、システム記憶装置100を切り離すことができる。
なお、実施例1及び実施例2ではシステム記憶装置100及び200、クラスタ300及び400を有するマルチクラスタシステムについて説明した。しかし、マルチクラスタシステムに係るシステム記憶装置及びクラスタの数は2台に限定されない。開示の技術は、2台以上である任意の数の複数のシステム記憶装置及びクラスタを有するマルチクラスタシステムに適用することができる。
開示の技術によれば、クラスタ400は接続されている複数のシステム記憶装置100、200のそれぞれから接続情報を受信し、受信した各システム記憶装置100、200からの接続情報に基づいて、接続障害が検出されたシステム記憶装置100を切り離す処理を実行することができる。そのため、各クラスタ300、400の接続障害が検出されていないシステム記憶装置200に対する接続状態を維持して接続障害が検出されたシステム記憶装置の切り離しを実施することができる。更に、クラスタ300の切り離しを防止して処理を実施するクラスタ数の減少を抑制できるため、処理を実施するクラスタ数の減少を抑制できるため、マルチクラスタシステム1000全体の処理の遅延を抑制できる。
11、12、21、22 接続線
100、200 システム記憶装置
110、210,310、410 インタフェース回路
110A1、110A2、210A1、210A2、310A1、310A2、410A1、410A2 障害検出通知回路
120,220 システム構成制御回路
120A1、120A2、220A1、220A2 接続状態フラグ
130、230 優先制御回路
130A、230A インタフェース障害通知回路
300、400 クラスタ
310B、410B 接続状態受信回路
310C、410C コマンド生成発行回路
320、420 システム記憶転送部
340、440 システムコントローラ
1000 マルチクラスタシステム

Claims (9)

  1. プログラムを実行する複数のクラスタと、
    それぞれが前記複数のクラスタに接続された複数のシステム記憶装置と、を有し、
    少なくとも1つのシステム記憶装置は、
    接続されているクラスタとの間に生じた接続障害を検出する第1回路と、
    接続されているクラスタとの接続状態を示す接続情報であって、前記第1回路で前記接続障害が検出された場合に対応するクラスタとの間に生じた接続障害を示す接続障害情報が含まれた接続情報を、前記システム記憶装置に接続された複数のクラスタに通知する第2回路と、を有し、
    前記クラスタは、
    接続されている複数のシステム記憶装置のそれぞれから接続情報を受信する第3回路と、
    前記第3回路で受信した各システム記憶装置からの接続情報に基づいて、前記システム記憶装置を切り離す処理を実行する第4回路と、を有し、
    前記システム記憶装置は、
    接続されているクラスタとの論理的な接続状態が接続障害を示す場合、対応するクラスタを当該システム記憶装置から切り離す第5回路を更に備える、
    ことを特徴とするマルチクラスタシステム。
  2. 前記第5回路は、
    対応するクラスタとの論理的な接続状態を示す接続フラグが設定され、
    接続されたクラスタとの間の接続障害を前記第1回路が検出した場合、前記接続フラグを接続障害を示す状態に設定し、
    前記接続フラグが接続障害を示す状態に設定された場合、対応するクラスタを当該システム記憶装置から切り離すことを特徴とする、請求項1記載のマルチクラスタシステム。
  3. 前記クラスタは、
    接続されているシステム記憶装置の少なくとも一方から、当該システム記憶装置といずれかのクラスタとの間に接続障害が生じたことを示す接続情報を受信した場合、当該接続情報を送信したシステム記憶装置以外のシステム記憶装置と自身との間の接続状態を判別し、
    接続状態の判別結果に基づいて、当該接続情報を送信したシステム記憶装置に対して切り離しを指示する、請求項1記載のマルチクラスタシステム。
  4. プログラムを実行する複数のクラスタと、
    それぞれが前記複数のクラスタに接続された複数のシステム記憶装置と、を有し、
    少なくとも1つのクラスタは、
    接続されているシステム記憶装置との間に生じた接続障害を検出する第1回路と、
    前記第1回路で前記接続障害が検出された場合に対応するシステム記憶装置との間に生じた接続障害を示す情報を、前記対応するシステム記憶装置に通知する第2回路と、を有し、
    少なくとも1つのシステム記憶装置は、前記接続障害を示す情報を受信した場合に、該情報を送信したクラスタ以外の当該システム記憶装置に接続されている他のクラスタに該情報を送信したクラスタとの間に接続障害が発生したことを示す接続障害情報を含む接続情報を通知し、
    前記クラスタは、
    接続されている複数のシステム記憶装置のそれぞれから接続情報を受信する第3回路と、
    前記第3回路で受信した各システム記憶装置からの接続情報に基づいて、前記システム記憶装置を切り離す処理を実行する第4回路と、
    を有することを特徴とするマルチクラスタシステム。
  5. 前記システム記憶装置は、対応するクラスタとの論理的な接続状態を示す接続フラグが設定される第5回路を更に備え、
    接続されたクラスタとの間の接続障害を前記第1回路が検出した場合、前記接続フラグを接続障害を示す状態に設定し、
    前記第5回路は、前記接続フラグが接続障害を示す状態に設定された場合、対応するクラスタを当該システム記憶装置から切り離すことを特徴とする、請求項4記載のマルチクラスタシステム。
  6. 前記クラスタは、
    接続されているシステム記憶装置の少なくとも一方から、当該システム記憶装置といずれかのクラスタとの間に接続障害が生じたことを示す接続情報を受信した場合、当該接続情報を送信したシステム記憶装置以外のシステム記憶装置と自身との間の接続状態を判別し、
    接続状態の判別結果に基づいて、当該接続情報を送信したシステム記憶装置に対して切り離しを指示する、請求項4記載のマルチクラスタシステム。
  7. 情報処理を行う複数の情報処理装置と、
    それぞれ前記複数の情報処理装置に接続され、接続された複数の情報処理装置によって共有される複数のシステム記憶装置とを有し、
    前記システム記憶装置は、
    接続された複数の情報処理装置のそれぞれとの間の接続障害の有無を検出するとともに、接続された情報処理装置と当該システム記憶装置との間の接続状態を示す接続情報を接続されている情報処理装置に送信する障害検出部と、
    前記障害検出部からの接続障害通知を受信し、接続されている情報処理装置への前記接続障害通知の転送を前記障害検出部に指示する障害通知部と、
    前記障害検出部によって接続障害が検出された情報処理装置を当該システム記憶装置から切り離す構成制御部と、を備え、
    前記情報処理装置は、
    複数のシステム記憶装置が接続され、対応するシステム記憶装置から当該システム記憶装置と情報処理装置との間の接続情報を受信する障害検出部と、
    前記障害検出部が受信した各システム記憶装置からの接続情報に基づいて、障害が検出されたシステム記憶装置の切離し要否を判断する切離し処理部とを備える、情報処理システム。
  8. 前記構成制御部は、
    対応する情報処理装置との論理的な接続状態を示す接続フラグが設定され、
    接続された情報処理装置との間の接続障害を前記障害検出部が検出した場合、前記接続フラグを接続障害を示す状態に設定し、
    前記接続フラグが接続障害を示す状態に設定された場合、対応する情報処理装置を当該システム記憶装置から切り離すことを特徴とする、請求項7記載の情報処理システム。
  9. 前記情報処理装置は、
    接続されているシステム記憶装置の少なくとも一方から、当該システム記憶装置といずれかの情報処理装置との間に接続障害が生じたことを示す接続情報を受信した場合、当該接続情報を送信したシステム記憶装置以外のシステム記憶装置と自身との間の接続状態を判別し、接続状態の判別結果に基づいて、当該接続情報を送信したシステム記憶装置に対して切り離しを指示する、請求項7記載の情報処理システム。
JP2012507910A 2010-03-31 2010-03-31 マルチクラスタシステム Expired - Fee Related JP5488693B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2010/002375 WO2011121666A1 (ja) 2010-03-31 2010-03-31 マルチクラスタシステム

Publications (2)

Publication Number Publication Date
JPWO2011121666A1 JPWO2011121666A1 (ja) 2013-07-04
JP5488693B2 true JP5488693B2 (ja) 2014-05-14

Family

ID=44711463

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012507910A Expired - Fee Related JP5488693B2 (ja) 2010-03-31 2010-03-31 マルチクラスタシステム

Country Status (4)

Country Link
US (1) US20120331334A1 (ja)
EP (1) EP2555116A1 (ja)
JP (1) JP5488693B2 (ja)
WO (1) WO2011121666A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10874462B2 (en) * 2017-06-30 2020-12-29 Biosense Webster (Israel) Ltd. Network sniffer for system watchdog and diagnostic

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5870495A (ja) * 1981-10-22 1983-04-26 Nec Corp 多重化記憶装置の制御装置
JP2941387B2 (ja) * 1990-08-31 1999-08-25 富士通株式会社 多重化装置の一致化制御方式

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0457308B1 (en) * 1990-05-18 1997-01-22 Fujitsu Limited Data processing system having an input/output path disconnecting mechanism and method for controlling the data processing system
JP2716571B2 (ja) 1990-05-18 1998-02-18 富士通株式会社 二重化データ保全装置
JPH0546580A (ja) 1991-08-21 1993-02-26 Fujitsu Ltd 拡張記憶の高信頼性データ更新方式
US7739541B1 (en) * 2003-07-25 2010-06-15 Symantec Operating Corporation System and method for resolving cluster partitions in out-of-band storage virtualization environments
JP4387968B2 (ja) * 2005-03-28 2009-12-24 富士通株式会社 障害検出装置および障害検出方法
US7913117B2 (en) * 2007-08-10 2011-03-22 International Business Machines Corporation Providing removable storage management services using removable storage error information
JP4982304B2 (ja) * 2007-09-04 2012-07-25 株式会社日立製作所 電源障害の発生を把握するストレージシステム
JP4738438B2 (ja) * 2008-04-17 2011-08-03 株式会社日立製作所 外部接続ストレージシステムのパス管理及び障害箇所検出方法
US8380951B1 (en) * 2008-10-01 2013-02-19 Symantec Corporation Dynamically updating backup configuration information for a storage cluster
US8392496B2 (en) * 2008-12-19 2013-03-05 Watchguard Technologies, Inc. Cluster architecture for network security processing

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5870495A (ja) * 1981-10-22 1983-04-26 Nec Corp 多重化記憶装置の制御装置
JP2941387B2 (ja) * 1990-08-31 1999-08-25 富士通株式会社 多重化装置の一致化制御方式

Also Published As

Publication number Publication date
EP2555116A1 (en) 2013-02-06
JPWO2011121666A1 (ja) 2013-07-04
WO2011121666A1 (ja) 2011-10-06
US20120331334A1 (en) 2012-12-27

Similar Documents

Publication Publication Date Title
JP5851503B2 (ja) 高可用性仮想機械環境におけるアプリケーションの高可用性の提供
US9189316B2 (en) Managing failover in clustered systems, after determining that a node has authority to make a decision on behalf of a sub-cluster
KR101231558B1 (ko) 마이크로프로세서에서의 전압 및 주파수의 신뢰성있는 설정
US8880768B2 (en) Storage controller system with data synchronization and method of operation thereof
JP2015153075A (ja) 伝送装置および制御ユニット
JP2004152298A (ja) バスを機能強化する方法および装置
CN103718535A (zh) 硬件故障的缓解
US10102088B2 (en) Cluster system, server device, cluster system management method, and computer-readable recording medium
US9830263B1 (en) Cache consistency
JP5488693B2 (ja) マルチクラスタシステム
TWI439856B (zh) 具故障備援以管理共享資源之方法與多電腦系統
JP6134720B2 (ja) 接続方法
JP2009217435A (ja) 制御方法、情報処理装置及びストレージシステム
US10365618B2 (en) Method for operating a redundant automation system
JP5516569B2 (ja) 情報処理装置及び制御方法
JP2010186302A (ja) マルチノードシステム、異常処理方法、スイッチ、ノード及びプログラム
JP2011253285A (ja) 診断システム、診断装置及び診断プログラム
JP2006178786A (ja) マルチノードシステム、ノード装置、ノード間クロスバスイッチ及び障害処理方法
JP5561790B2 (ja) ハードウェア障害被疑特定装置、ハードウェア障害被疑特定方法、及びプログラム
JP2009003613A (ja) バス障害検出方法及びバスシステム
WO2008062511A1 (fr) Système multiprocesseur
JP2009104391A (ja) メモリ二重化システム及び情報処理装置
KR101615577B1 (ko) 클러스터 시스템에서 클러스터를 처리하기 위한 방법과 장치 및 시스템
US20110228681A1 (en) Input/output connection device, information processing device, and method for inspecting input/output device
JP2011159086A (ja) 端末、端末監視システムおよび端末監視プログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130910

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131111

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131217

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140107

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140128

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140210

R150 Certificate of patent or registration of utility model

Ref document number: 5488693

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees