JP5488693B2 - マルチクラスタシステム - Google Patents
マルチクラスタシステム Download PDFInfo
- Publication number
- JP5488693B2 JP5488693B2 JP2012507910A JP2012507910A JP5488693B2 JP 5488693 B2 JP5488693 B2 JP 5488693B2 JP 2012507910 A JP2012507910 A JP 2012507910A JP 2012507910 A JP2012507910 A JP 2012507910A JP 5488693 B2 JP5488693 B2 JP 5488693B2
- Authority
- JP
- Japan
- Prior art keywords
- system storage
- storage device
- connection
- cluster
- circuit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2023—Failover techniques
- G06F11/2028—Failover techniques eliminating a faulty processor or activating a spare
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2053—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
- G06F11/2094—Redundant storage or storage space
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Hardware Redundancy (AREA)
- Debugging And Monitoring (AREA)
Description
開示の技術は、接続障害が検出されたシステム記憶装置を切り離す際にクラスタの接続状態を維持するマルチクラスタシステムを提供することを目的とする。
本発明の課題を解決するため、開示の技術の第1の側面によれば、
プログラムを実行する複数のクラスタと、
それぞれが前記複数のクラスタに接続された複数のシステム記憶装置と、を有し、
少なくとも1つのシステム記憶装置は、
接続されているクラスタとの間に生じた接続障害を示す接続障害情報を含む接続情報を検出する第1回路と、
前記第1回路で検出された接続情報を、前記システム記憶装置に接続された複数のクラスタに通知する第2回路と、を有し、
前記クラスタは、
接続されている複数のシステム記憶装置のそれぞれから接続情報を受信する第3回路と、
前記第3回路で受信した各システム記憶装置からの接続情報に基づいて、前記システム記憶装置を切り離す処理を実行する第4回路と、
を有することを特徴とするマルチクラスタシステムを提供する。
プログラムを実行する複数のクラスタと、
それぞれが前記複数のクラスタに接続された複数のシステム記憶装置と、を有し、
少なくとも1つのクラスタは、
接続されているシステム記憶装置との間に生じた接続障害を示す接続障害情報を含む接続情報を検出する第1回路と、
前記第1回路で検出された第1接続情報を、前記システム記憶装置に接続された複数のクラスタに通知する第2回路と、を有し、
前記クラスタは、
接続されている複数のシステム記憶装置のそれぞれから接続情報を受信する第3回路と、
前記第3回路で受信した各システム記憶装置からの接続情報に基づいて、前記システム記憶装置を切り離す処理を実行する第4回路と、
を有することを特徴とするマルチクラスタシステムを提供する。
開示の技術によれば、クラスタは接続されている複数のシステム記憶装置のそれぞれから接続情報を受信し、受信した各システム記憶装置からの接続情報に基づいて、接続障害が検出されたシステム記憶装置を切り離す処理を実行することができる。そのため、各クラスタの接続障害が検出されていないシステム記憶装置に対する接続状態を維持して接続障害が検出されたシステム記憶装置の切り離しを実施することができる。更に、クラスタの切り離しを防止して処理を実施するクラスタ数の減少を抑制できるため、処理を実施するクラスタ数の減少を抑制できるため、マルチクラスタシステム全体の処理の遅延を抑制できる。
図1から図9では、実施例1に係るマルチクラスタシステム1000及びマルチクラスタシステム1000の制御方法が説明される。
以下の説明では、システム記憶装置100がマスタ、システム記憶装置200がスレーブとして動作しているものとする。マスタであるシステム記憶装置100が現用装置として動作する。
システム記憶装置200に設けられた各部の機能は、システム記憶装置100に設けられた各部の機能と基本的に同一であるため、詳細説明は省略する。
接続障害が検出されていない他方のシステム記憶装置がクラスタ300とは論理的に接続されていない場合、接続状態受信回路310Bは、接続障害が検出されたシステム記憶装置と他方のシステム記憶装置とに同一のデータ及びプログラムが格納されていると判断する。即ち、接続状態受信回路310Bは接続障害が検出されたシステム記憶装置と他のシステム記憶装置との等価性が保証されていると判断する。
接続状態受信回路310Bは、判断した結果を受信情報としてコマンド生成発行回路310Cに通知する。
なお、図3の障害検出通知回路310−1A、図2の障害検出通知回路310A1、310A2は同じ要素である。図3の接続状態受信回路310−1B、図2の接続状態受信回路310B1、310B2は同じ要素である。図3のコマンド生成発行回路310−1C、図2のコマンド生成発行回路310C1、310C2は同じ要素である。
一方、システム記憶装置200も、接続されているクラスタ300、クラスタ400の双方に対し接続情報を通知する(OP4)。接続されているクラスタ300、400との間の接続障害をシステム記憶装置200が検出していない場合には、システム記憶装置200から各クラスタ300、400に通知される接続情報には、接続障害を示す情報は含まれていない。
クラスタ300も、クラスタ400と同様に各システム記憶装置からの接続情報に基づいて、システム記憶装置100に対する切り離し命令を生成するが、クラスタ300とシステム記憶装置100との間には接続障害が生じているため、システム記憶装置100はクラスタ300からの切り離し命令を受けることは出来ない。
クラスタ400から切り離し命令を受信したシステム記憶装置100は、障害検出通知回路110A1を介して、接続されている全クラスタに対応する接続状態フラグをオフにする。この例では、障害検出通知回路110A1は接続状態フラグ120A1及び接続状態フラグ120A2をオフにする(OP14)。
図10では、実施例2に係るマルチクラスタシステム1000及びマルチクラスタシステム1000の制御方法が説明される。実施例2に係るマルチクラスタシステム1000の構成は、実施例1に係るマルチクラスタシステム1000の構成と同一であるため説明を省略する。
一方、システム記憶装置200も、接続されているクラスタ300、クラスタ400の双方に対し接続情報を通知する(OP24)。接続されているクラスタ300、400との間の接続障害をシステム記憶装置200が検出していない場合には、システム記憶装置200から各クラスタ300、400に通知される接続情報には、接続障害を示す情報は含まれていない。
100、200 システム記憶装置
110、210,310、410 インタフェース回路
110A1、110A2、210A1、210A2、310A1、310A2、410A1、410A2 障害検出通知回路
120,220 システム構成制御回路
120A1、120A2、220A1、220A2 接続状態フラグ
130、230 優先制御回路
130A、230A インタフェース障害通知回路
300、400 クラスタ
310B、410B 接続状態受信回路
310C、410C コマンド生成発行回路
320、420 システム記憶転送部
340、440 システムコントローラ
1000 マルチクラスタシステム
Claims (9)
- プログラムを実行する複数のクラスタと、
それぞれが前記複数のクラスタに接続された複数のシステム記憶装置と、を有し、
少なくとも1つのシステム記憶装置は、
接続されているクラスタとの間に生じた接続障害を検出する第1回路と、
接続されているクラスタとの接続状態を示す接続情報であって、前記第1回路で前記接続障害が検出された場合に対応するクラスタとの間に生じた接続障害を示す接続障害情報が含まれた接続情報を、前記システム記憶装置に接続された複数のクラスタに通知する第2回路と、を有し、
前記クラスタは、
接続されている複数のシステム記憶装置のそれぞれから接続情報を受信する第3回路と、
前記第3回路で受信した各システム記憶装置からの接続情報に基づいて、前記システム記憶装置を切り離す処理を実行する第4回路と、を有し、
前記システム記憶装置は、
接続されているクラスタとの論理的な接続状態が接続障害を示す場合、対応するクラスタを当該システム記憶装置から切り離す第5回路を更に備える、
ことを特徴とするマルチクラスタシステム。 - 前記第5回路は、
対応するクラスタとの論理的な接続状態を示す接続フラグが設定され、
接続されたクラスタとの間の接続障害を前記第1回路が検出した場合、前記接続フラグを接続障害を示す状態に設定し、
前記接続フラグが接続障害を示す状態に設定された場合、対応するクラスタを当該システム記憶装置から切り離すことを特徴とする、請求項1記載のマルチクラスタシステム。 - 前記クラスタは、
接続されているシステム記憶装置の少なくとも一方から、当該システム記憶装置といずれかのクラスタとの間に接続障害が生じたことを示す接続情報を受信した場合、当該接続情報を送信したシステム記憶装置以外のシステム記憶装置と自身との間の接続状態を判別し、
接続状態の判別結果に基づいて、当該接続情報を送信したシステム記憶装置に対して切り離しを指示する、請求項1記載のマルチクラスタシステム。 - プログラムを実行する複数のクラスタと、
それぞれが前記複数のクラスタに接続された複数のシステム記憶装置と、を有し、
少なくとも1つのクラスタは、
接続されているシステム記憶装置との間に生じた接続障害を検出する第1回路と、
前記第1回路で前記接続障害が検出された場合に対応するシステム記憶装置との間に生じた接続障害を示す情報を、前記対応するシステム記憶装置に通知する第2回路と、を有し、
少なくとも1つのシステム記憶装置は、前記接続障害を示す情報を受信した場合に、該情報を送信したクラスタ以外の当該システム記憶装置に接続されている他のクラスタに該情報を送信したクラスタとの間に接続障害が発生したことを示す接続障害情報を含む接続情報を通知し、
前記クラスタは、
接続されている複数のシステム記憶装置のそれぞれから接続情報を受信する第3回路と、
前記第3回路で受信した各システム記憶装置からの接続情報に基づいて、前記システム記憶装置を切り離す処理を実行する第4回路と、
を有することを特徴とするマルチクラスタシステム。 - 前記システム記憶装置は、対応するクラスタとの論理的な接続状態を示す接続フラグが設定される第5回路を更に備え、
接続されたクラスタとの間の接続障害を前記第1回路が検出した場合、前記接続フラグを接続障害を示す状態に設定し、
前記第5回路は、前記接続フラグが接続障害を示す状態に設定された場合、対応するクラスタを当該システム記憶装置から切り離すことを特徴とする、請求項4記載のマルチクラスタシステム。 - 前記クラスタは、
接続されているシステム記憶装置の少なくとも一方から、当該システム記憶装置といずれかのクラスタとの間に接続障害が生じたことを示す接続情報を受信した場合、当該接続情報を送信したシステム記憶装置以外のシステム記憶装置と自身との間の接続状態を判別し、
接続状態の判別結果に基づいて、当該接続情報を送信したシステム記憶装置に対して切り離しを指示する、請求項4記載のマルチクラスタシステム。 - 情報処理を行う複数の情報処理装置と、
それぞれ前記複数の情報処理装置に接続され、接続された複数の情報処理装置によって共有される複数のシステム記憶装置とを有し、
前記システム記憶装置は、
接続された複数の情報処理装置のそれぞれとの間の接続障害の有無を検出するとともに、接続された情報処理装置と当該システム記憶装置との間の接続状態を示す接続情報を接続されている情報処理装置に送信する障害検出部と、
前記障害検出部からの接続障害通知を受信し、接続されている情報処理装置への前記接続障害通知の転送を前記障害検出部に指示する障害通知部と、
前記障害検出部によって接続障害が検出された情報処理装置を当該システム記憶装置から切り離す構成制御部と、を備え、
前記情報処理装置は、
複数のシステム記憶装置が接続され、対応するシステム記憶装置から当該システム記憶装置と情報処理装置との間の接続情報を受信する障害検出部と、
前記障害検出部が受信した各システム記憶装置からの接続情報に基づいて、障害が検出されたシステム記憶装置の切離し要否を判断する切離し処理部とを備える、情報処理システム。 - 前記構成制御部は、
対応する情報処理装置との論理的な接続状態を示す接続フラグが設定され、
接続された情報処理装置との間の接続障害を前記障害検出部が検出した場合、前記接続フラグを接続障害を示す状態に設定し、
前記接続フラグが接続障害を示す状態に設定された場合、対応する情報処理装置を当該システム記憶装置から切り離すことを特徴とする、請求項7記載の情報処理システム。 - 前記情報処理装置は、
接続されているシステム記憶装置の少なくとも一方から、当該システム記憶装置といずれかの情報処理装置との間に接続障害が生じたことを示す接続情報を受信した場合、当該接続情報を送信したシステム記憶装置以外のシステム記憶装置と自身との間の接続状態を判別し、接続状態の判別結果に基づいて、当該接続情報を送信したシステム記憶装置に対して切り離しを指示する、請求項7記載の情報処理システム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2010/002375 WO2011121666A1 (ja) | 2010-03-31 | 2010-03-31 | マルチクラスタシステム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2011121666A1 JPWO2011121666A1 (ja) | 2013-07-04 |
JP5488693B2 true JP5488693B2 (ja) | 2014-05-14 |
Family
ID=44711463
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012507910A Expired - Fee Related JP5488693B2 (ja) | 2010-03-31 | 2010-03-31 | マルチクラスタシステム |
Country Status (4)
Country | Link |
---|---|
US (1) | US20120331334A1 (ja) |
EP (1) | EP2555116A1 (ja) |
JP (1) | JP5488693B2 (ja) |
WO (1) | WO2011121666A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10874462B2 (en) * | 2017-06-30 | 2020-12-29 | Biosense Webster (Israel) Ltd. | Network sniffer for system watchdog and diagnostic |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5870495A (ja) * | 1981-10-22 | 1983-04-26 | Nec Corp | 多重化記憶装置の制御装置 |
JP2941387B2 (ja) * | 1990-08-31 | 1999-08-25 | 富士通株式会社 | 多重化装置の一致化制御方式 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0457308B1 (en) * | 1990-05-18 | 1997-01-22 | Fujitsu Limited | Data processing system having an input/output path disconnecting mechanism and method for controlling the data processing system |
JP2716571B2 (ja) | 1990-05-18 | 1998-02-18 | 富士通株式会社 | 二重化データ保全装置 |
JPH0546580A (ja) | 1991-08-21 | 1993-02-26 | Fujitsu Ltd | 拡張記憶の高信頼性データ更新方式 |
US7739541B1 (en) * | 2003-07-25 | 2010-06-15 | Symantec Operating Corporation | System and method for resolving cluster partitions in out-of-band storage virtualization environments |
JP4387968B2 (ja) * | 2005-03-28 | 2009-12-24 | 富士通株式会社 | 障害検出装置および障害検出方法 |
US7913117B2 (en) * | 2007-08-10 | 2011-03-22 | International Business Machines Corporation | Providing removable storage management services using removable storage error information |
JP4982304B2 (ja) * | 2007-09-04 | 2012-07-25 | 株式会社日立製作所 | 電源障害の発生を把握するストレージシステム |
JP4738438B2 (ja) * | 2008-04-17 | 2011-08-03 | 株式会社日立製作所 | 外部接続ストレージシステムのパス管理及び障害箇所検出方法 |
US8380951B1 (en) * | 2008-10-01 | 2013-02-19 | Symantec Corporation | Dynamically updating backup configuration information for a storage cluster |
US8392496B2 (en) * | 2008-12-19 | 2013-03-05 | Watchguard Technologies, Inc. | Cluster architecture for network security processing |
-
2010
- 2010-03-31 JP JP2012507910A patent/JP5488693B2/ja not_active Expired - Fee Related
- 2010-03-31 EP EP10848848A patent/EP2555116A1/en not_active Withdrawn
- 2010-03-31 WO PCT/JP2010/002375 patent/WO2011121666A1/ja active Application Filing
-
2012
- 2012-09-04 US US13/602,804 patent/US20120331334A1/en not_active Abandoned
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5870495A (ja) * | 1981-10-22 | 1983-04-26 | Nec Corp | 多重化記憶装置の制御装置 |
JP2941387B2 (ja) * | 1990-08-31 | 1999-08-25 | 富士通株式会社 | 多重化装置の一致化制御方式 |
Also Published As
Publication number | Publication date |
---|---|
EP2555116A1 (en) | 2013-02-06 |
JPWO2011121666A1 (ja) | 2013-07-04 |
WO2011121666A1 (ja) | 2011-10-06 |
US20120331334A1 (en) | 2012-12-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5851503B2 (ja) | 高可用性仮想機械環境におけるアプリケーションの高可用性の提供 | |
US9189316B2 (en) | Managing failover in clustered systems, after determining that a node has authority to make a decision on behalf of a sub-cluster | |
KR101231558B1 (ko) | 마이크로프로세서에서의 전압 및 주파수의 신뢰성있는 설정 | |
US8880768B2 (en) | Storage controller system with data synchronization and method of operation thereof | |
JP2015153075A (ja) | 伝送装置および制御ユニット | |
JP2004152298A (ja) | バスを機能強化する方法および装置 | |
CN103718535A (zh) | 硬件故障的缓解 | |
US10102088B2 (en) | Cluster system, server device, cluster system management method, and computer-readable recording medium | |
US9830263B1 (en) | Cache consistency | |
JP5488693B2 (ja) | マルチクラスタシステム | |
TWI439856B (zh) | 具故障備援以管理共享資源之方法與多電腦系統 | |
JP6134720B2 (ja) | 接続方法 | |
JP2009217435A (ja) | 制御方法、情報処理装置及びストレージシステム | |
US10365618B2 (en) | Method for operating a redundant automation system | |
JP5516569B2 (ja) | 情報処理装置及び制御方法 | |
JP2010186302A (ja) | マルチノードシステム、異常処理方法、スイッチ、ノード及びプログラム | |
JP2011253285A (ja) | 診断システム、診断装置及び診断プログラム | |
JP2006178786A (ja) | マルチノードシステム、ノード装置、ノード間クロスバスイッチ及び障害処理方法 | |
JP5561790B2 (ja) | ハードウェア障害被疑特定装置、ハードウェア障害被疑特定方法、及びプログラム | |
JP2009003613A (ja) | バス障害検出方法及びバスシステム | |
WO2008062511A1 (fr) | Système multiprocesseur | |
JP2009104391A (ja) | メモリ二重化システム及び情報処理装置 | |
KR101615577B1 (ko) | 클러스터 시스템에서 클러스터를 처리하기 위한 방법과 장치 및 시스템 | |
US20110228681A1 (en) | Input/output connection device, information processing device, and method for inspecting input/output device | |
JP2011159086A (ja) | 端末、端末監視システムおよび端末監視プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130910 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131111 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131217 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140107 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140128 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140210 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5488693 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |