JP2014081880A - 診断回路診断装置、診断回路診断システム、診断回路診断方法、及び、診断回路診断プログラム - Google Patents

診断回路診断装置、診断回路診断システム、診断回路診断方法、及び、診断回路診断プログラム Download PDF

Info

Publication number
JP2014081880A
JP2014081880A JP2012230936A JP2012230936A JP2014081880A JP 2014081880 A JP2014081880 A JP 2014081880A JP 2012230936 A JP2012230936 A JP 2012230936A JP 2012230936 A JP2012230936 A JP 2012230936A JP 2014081880 A JP2014081880 A JP 2014081880A
Authority
JP
Japan
Prior art keywords
diagnostic
diagnosis
unit
management information
circuit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012230936A
Other languages
English (en)
Inventor
Yoshifumi Horie
祥文 堀江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Computertechno Ltd
Original Assignee
NEC Computertechno Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Computertechno Ltd filed Critical NEC Computertechno Ltd
Priority to JP2012230936A priority Critical patent/JP2014081880A/ja
Publication of JP2014081880A publication Critical patent/JP2014081880A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)

Abstract

【課題】複数の診断回路を包含するシステムにおいて、各々の診断回路を効率よく確実に診断することができるようにする診断回路診断装置を提供する。
【解決手段】本願発明の診断回路診断装置は、複数の診断手段が互いに診断するときの、診断主体の前記診断手段の識別情報と、当該診断手段が診断対象とする前記診断手段の識別情報との対応関係を、診断管理情報として記憶手段に格納し、前記診断管理情報をもとに、前記診断手段に対して、互い同士の診断を指示する指示手段を備える。
【選択図】 図1

Description

本願発明は、複数の診断回路を包含するシステムにおいて、各々の診断回路を診断するための診断回路診断装置、診断回路診断システム、診断回路診断方法、及び、診断回路診断プログラムに関する。
データセンターをはじめとする情報処理システムの大規模化が急速に進行する中、大規模情報処理システムの障害監視、および、障害復旧を効率よく確実に行うための技術の重要性が益々高まってきている。
このような障害監視、および、障害復旧に関する関連技術として、特許文献1には、情報処理装置の診断回路の障害により、診断回路が動作できない状態になったときに、既存の回路のシリアルインタフェースを利用し、外部から情報処理装置内のデバイスをアクセスして適切な制御を行うためのシステムが公開されている。
また、特許文献2には、1台の外部端末からシステム内の複数の情報処理装置の診断回路へ、無線通信インタフェースによりアクセスし、システム管理を行うためのシステムが公開されている。
また、特許文献3には、情報処理装置を再起動させるためのリセットパケットを定義しておくことで、障害が発生している情報処理装置が遠隔に位置している場合であっても、当該情報処理装置を再起動させて、障害を復旧させるための装置が公開されている。
特開2006-268742号公報 特開2002-27027号公報 特開2001-223743号公報
システム内の各情報処理装置の診断回路で障害が発生した場合、システムの正常な運用の保障ができなくなる。したがって、診断回路の診断を効率よく確実に行うことが、システム運用上重要な課題となるが、上述の特許文献1乃至3は、この課題を解決するためのものではない。
本願発明の目的は、上述の課題を解決した診断回路診断装置、診断回路診断システム、診断回路診断方法、及び、診断回路診断プログラムを提供することである。
本願発明の一実施形態の診断回路診断装置は、複数の診断手段が互いに診断するときの、診断主体の前記診断手段の識別情報と、当該診断手段が診断対象とする前記診断手段の識別情報との対応関係を、診断管理情報として記憶手段に格納し、前記診断管理情報をもとに、前記診断手段に対して、互い同士の診断を指示する指示手段を備える。
本願発明の一実施形態の診断回路診断方法は、複数の診断手段が互いに診断するときの、診断主体の前記診断手段の識別情報と、当該診断手段が診断対象とする前記診断手段の識別情報との対応関係を、診断管理情報として記憶域に格納し、前記診断管理情報をもとに、前記診断手段に対して、互い同士の診断を指示する。
本願発明の一実施形態の診断回路診断プログラムは、複数の診断手段が互いに診断するときの、診断主体の前記診断手段の識別情報と、当該診断手段が診断対象とする前記診断手段の識別情報との対応関係を、診断管理情報として記憶域に格納する格納処理と、前記診断管理情報をもとに、前記診断手段に対して、互い同士の診断を指示する指示処理と、をコンピュータに実行させる。
本願発明は、複数の診断回路を包含するシステムにおいて、各々の診断回路を効率よく確実に診断することができるようにする。
本願発明の第1の実施形態の診断回路診断システムの構成を示すブロック図である。 本願発明における診断部で障害が発生したときの第1の実施形態の動作を示すフローチャートである。 本願発明における診断部が新規追加されたときの第1の実施形態の動作を示すフローチャートである。 本願発明の第1の実施形態における診断管理情報の構成例である。 本願発明の第2の実施形態の診断回路診断装置の構成を示すブロック図である。
本願発明の第1の実施の形態について図面を参照して詳細に説明する。
図1は本実施形態の診断回路診断システムの構成を示すブロック図である。
本実施形態の診断回路診断システム1は、診断回路診断装置10と、サーバ20−1乃至20−nとを包含している。ここでnは2以上の整数である。以降、n=4と仮定する。
サーバ20−1乃至20−4は、診断回路診断装置10に接続されている。
診断回路診断装置10は、診断部11−1乃至11−4と、指示部12と、記憶部13とを包含している。診断部11−1乃至11−4と、指示部12は、電子回路の場合もあれば、コンピュータプログラムの場合もある。記憶部13は、電子回路、あるいは、コンピュータプログラムによりデータの読み書きが行われるディスク装置、あるいは、メモリである。
診断部11−1乃至11−4はそれぞれ、サーバ20−1乃至20−4の動作状態を監視して診断動作を行うとともに、指示部12からの指示に基づき、互い同士の診断動作も行い、診断結果を指示部12へ送信する。
診断部11−1乃至11−4には、それぞれIPアドレスとして、100.100.100.100乃至100.100.100.103が割り当てられている。診断部11−1乃至11−4は、それぞれ、サーバ20−1乃至20−4に包含される場合もある。また、指示部12、および、記憶部13は、クライアント端末装置(図示せず)に包含される場合もある。
診断部11−1乃至11−4は、診断対象の診断部で障害が発生した場合、障害が発生した診断部を一度リセットして再度診断し、それでも障害から復旧しない場合は、診断対象の診断部で障害が発生したことを、指示部12へ送信する。
指示部12は、記憶部13が記憶している診断管理情報130に基づき、診断部11−1乃至11−4に対して、互い同士の診断の実行を指示する。診断管理情報130の構成例を図4に示す。
診断管理情報130のレコードは、診断主体の診断部のIPアドレス、および、ステータスの情報と、当該診断主体の診断対象となる診断部のIPアドレス、および、ステータスの情報を包含している。図4の例の場合、IPアドレスが100.100.100.100である診断部11−1が、IPアドレスが100.100.100.101である診断部11−2と、IPアドレスが100.100.100.102である診断部11−3の診断を実施する。同様に、IPアドレスが100.100.100.101である診断部11−2が、IPアドレスが100.100.100.100である診断部11−1と、IPアドレスが100.100.100.103である診断部11−4の診断を実施する。
診断管理情報130の最初の設定は、診断部11−1乃至11−4の全てが、自分以外の何れかの診断部により診断されるように、診断回路診断システム1のシステム管理者が設定する場合もあれば、診断回路診断装置10が、所定の基準で設定する場合もある。
指示部12は、診断主体である診断部11−1乃至11−2から診断結果を受信して、診断管理情報130のステータスの項目を更新する。図4の例の場合、診断部11−1で発生した障害を診断部11−2が検出して、診断部11−1のIPアドレスと障害発生の情報を指示部12へ報告する。指示部12は、診断管理情報130における診断部11−1のIPアドレスに対応するステータスの項目を障害に設定する。
指示部12は、障害が発生した診断部が診断主体の診断部である場合、当該診断部の診断対象である診断部の新たな診断主体として、診断対象診断部とIPアドレスの値が最も近い、正常動作中の診断部を割り当てて、診断管理情報130を更新する。
図4の例の場合、指示部12は、障害が発生した診断部11−1の診断対象であった診断部11−2の新たな診断主体として、IPアドレスの値が診断部11−2と最も近く、正常動作している診断部11−3を割り当てる。指示部12は同様に、障害が発生した診断部11−1の診断対象であった診断部11−3の新たな診断主体として、診断部11−4を割り当てる。尚、診断部11−3とIPアドレスの値が最も近くて正常動作している診断部は、診断部11−4の他にも診断部11−2があるが、診断部11−2は既に診断部11−1と診断部11−4の診断主体となっているため、指示部12は、負荷分散を考慮して、診断部11−4の方を診断部11−3の新たな診断主体に割り当てる。
指示部12は、診断部11−3乃至11−4に対して、それぞれ、診断部11−2乃至11−3の診断動作を開始するように指示する。
指示部12は、また、診断回路診断システム1へサーバが新規追加された場合、新規追加サーバの診断部から受信したIPアドレスにより、診断部が新規追加されたことを検知すると、当該診断部とIPアドレスが最も近くて正常動作している診断部を、新規に追加された診断部の診断主体に割り当てる。指示部12は、診断管理情報130を更新して、診断主体に割り当てた診断部に対して、新規に追加された診断部の診断動作を開始するように指示する。
次に、図2のフローチャートを参照して、診断部で障害が発生したときの本実施形態の動作について詳細に説明する。
指示部12は、記憶部13の診断管理情報130を参照して、診断部11−1乃至11−4における診断主体として登録されている診断部に対して、診断対象の診断部の診断を指示する(S101)。診断部11−1乃至11−4における診断主体の診断部は、指示部12からの指示により、診断対象の診断部を診断する(S102)。
診断部11−i(iは1〜4のいずれかの整数)で障害が発生していない場合(S103でNo)、処理はS102へ戻る。診断部11−iで障害が発生した場合(S103でYes)、診断部11−iの診断主体の診断部11−j(jはiを除く1〜4のいすれかの整数)は、診断部11−iをリセットし、診断部11−iを再度診断する(S104)。
診断部11−iが障害から復旧した場合(S105でYes)、処理はS102へ戻る。診断部11−iが障害から復旧しない場合(S105でNo)、診断部11−jは、診断部11−iの障害発生を指示部12へ送信する(S106)。
指示部12は、診断管理情報130を参照して、診断部11−iが診断主体として登録されているかどうかを確認する(S107)。診断部11−iが診断主体として登録されていない場合(S108でNo)、処理はS102へ戻る。
診断部11−iが診断主体として登録されている場合(S108でYes)、指示部12は、診断部11−iの診断対象診断部について、当該診断対象診断部とIPアドレスの値が最も近い、診断部11−iを除く診断部を、当該診断対象診断部の新たな診断主体に設定し、診断管理情報130を更新する(S109)。指示部12は、新たに設定した診断主体の診断部に対して、診断対象の診断部の診断を指示し(S110)、処理はS102へ戻る。
次に、図3のフローチャートを参照して、診断部が新規追加されたときの本実施形態の動作について詳細に説明する。
サーバ20−1乃至20−3が稼動している状態で、サーバ20−4が立ち上がる(S201)。診断部11−4は、自分のIPアドレスを、指示部12へ報告する(S202)。指示部12は、記憶部13の診断管理情報130を参照して、診断部11−4のIPアドレスが、診断対象として登録されているかどうかを確認する(S203)。
診断部11−4が診断対象として登録されている場合(S204でYes)、処理はS206へ進む。診断部11−4が診断対象として登録されていない場合(S204でNo)、指示部12は、診断部11−4とIPアドレスの値が最も近い診断部11−3を、診断部11−4の診断主体に設定し、診断管理情報130を更新する(S205)。
指示部12は、診断管理情報130に登録されている、診断部11−4の診断主体の診断部に対して、診断部11−4の診断を指示する(S206)。診断部11−4の診断主体の診断部は、診断部11−4の診断を開始し(S207)、全体の処理は終了する。
本実施形態には、システムが包含する複数の診断回路を、効率よく確実に診断する効果がある。その理由は、指示部12が、診断管理情報130に基づき、診断部11−1乃至11−4に対して、互い同士で診断を行うように指示するからである。
もし、システム内の診断部自体の診断動作が行われない場合、診断部の診断結果が正しいかどうかの保証ができないため、システムの正常動作を保証することができなくなる。診断部の正常動作を保証するため、診断部を多重化した場合は、ハードウェア量が増加し、システムのコストが増加する。また、ある特定の診断部に、システム内の全ての診断部を診断する機能を持たせた場合は、システムの規模が大きくなるに従い、前述のある特定の診断部の診断対象の数が多くなるため、診断に要する負荷が増大し、システムの運用に支障をきたすことになる。
本実施形態では、既存の複数の診断部が、互い同士で診断を行うため、ハードウェア量が増加することがなく、また、ある特定の診断部に負荷が集中することもないため、効率よくシステム内の全ての診断部の診断を行うことが可能となる。
また、何れかの診断部で障害が発生した場合、指示部12が、障害が発生した診断部の診断対象の診断部について、当該診断部とIPアドレスの値が最も近い正常動作中の診断部を、新たな診断主体として割り当てて診断開始を指示するため、システム内の何れかの診断部の診断が正常に行われなくなることを回避できる。
指示部12が、IPアドレスの値が最も近い診断部を新たな診断主体として割り当てるのは、一般的なシステムでは、IPアドレスの値が近い情報処理装置は、物理的にも近い位置に設置されていることが多く、物理的に近い位置にある診断部同士で診断させるほうが、通信品質や保守の観点で好ましいからである。
さらに、本実施形態では、システムに内に新しい情報処理装置を追加した場合、指示部12は、当該情報処理装置の診断部の診断主体を、IPアドレスの値を基に割り当てて診断開始を指示するため、システム内の全ての診断部の診断を確実に行うことが可能となる。
尚、本実施形態では、いずれかの診断部における障害発生時や診断部の新規追加時に、指示部12が、IPアドレスの値を基に新たな診断主体の診断部の割り当てを行っているが、指示部12が、IPアドレスの値以外の別の基準を使用する場合もある。
<第2の実施形態>
次に、本願発明の第2の実施形態について図面を参照して詳細に説明する。
図5は本願発明の第2の実施形態の診断回路診断装置の構成を示すブロック図である。本実施形態の診断回路診断装置10は、診断部11−1乃至11−n(nは2以上の整数)と、指示部12と、記憶部13とを包含している。
診断部11−1乃至11−nは、電子装置を診断するとともに、互い同士を診断する。前述の電子装置は、第1の実施形態のようなサーバである場合もあれば、1つのサーバ内の個別の電子回路である場合もある。
指示部12は、診断部11−1乃至11−nが互いに診断するときの、診断主体となる診断部の識別情報と、当該診断部が診断対象とする診断部の識別情報との対応関係を、診断管理情報として記憶部13に格納し、診断管理情報をもとに、診断部11−1乃至11−nに対して、互い同士の診断を指示する。
診断部の識別情報としては、第1の実施形態のようにIPアドレスの値を使用する場合もあれば、当該診断部の診断対象のサーバのホスト名などを使用する場合もある。
本実施形態には、第1の実施形態と同様に、システムが包含する複数の診断回路を、効率よく確実に診断する効果がある。その理由は、指示部12が、診断管理情報に基づき、診断部11−1乃至11−nに対して、互い同士で診断を行うように指示するからである。
指示部12の指示により、既存の診断部11−1乃至11−nが、互い同士で診断することで、ハードウェアの追加を伴わずに、診断のための負荷を分散させて全ての診断部の診断を行うことが可能となる。
以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されたものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
1 診断回路診断システム
10 診断回路診断装置
11−1乃至11−n 診断部
12 指示部
13 記憶部
130 診断管理情報
20−1乃至20−n サーバ

Claims (10)

  1. 複数の診断手段が互いに診断するときの、診断主体の前記診断手段の識別情報と、当該診断手段が診断対象とする前記診断手段の識別情報との対応関係を、診断管理情報として記憶手段に格納し、前記診断管理情報をもとに、前記診断手段に対して、互い同士の診断を指示する指示手段
    を備える診断回路診断装置。
  2. 前記指示手段は、診断主体の前記診断手段から、何れかの診断対象の前記診断手段で障害が発生したことを受信したときに、前記診断管理情報を参照して、障害が発生した前記診断手段により診断される前記診断手段が存在する場合は、当該診断手段の診断主体を、障害が発生した前記診断手段から、所定の基準で別の診断手段に変更して、前記診断管理情報を更新する
    請求項1の診断回路診断装置。
  3. 前記診断手段は、診断対象の前記診断手段で障害が発生した場合、当該診断手段をリセットし、リセット後も前記障害が解消しなかった場合に、当該診断手段の障害を前記指示手段に報告する
    請求項2の診断回路診断装置。
  4. 前記指示手段は、システムに新規追加された前記診断手段から、当該診断手段の識別情報を受信して、当該診断手段を診断する前記診断手段を所定の基準で決定し、新規追加された前記診断手段の識別情報と、当該診断手段を診断する前記診断手段の識別情報とを対応付けて、前記診断管理情報を更新する
    請求項1乃至3の診断回路診断装置。
  5. 前記指示手段は、前記診断手段の識別情報として当該診断手段のネットワークアドレスを使用し、前記診断手段における障害発生の場合、あるいは、前記診断手段の新規追加の場合に、障害発生の前記診断手段を除いて、診断対象の前記診断手段の前記ネットワークアドレスと最も近い値の前記ネットワークアドレスを有する前記診断手段を、診断対象の前記診断手段の診断主体に設定する
    請求項2乃至4の診断回路診断装置。
  6. 請求項1乃至5の診断回路診断装置と、前記電子装置とを包含する、診断回路診断システム。
  7. 複数の診断手段が互いに診断するときの、診断主体の前記診断手段の識別情報と、当該診断手段が診断対象とする前記診断手段の識別情報との対応関係を、診断管理情報として記憶域に格納し、前記診断管理情報をもとに、前記診断手段に対して、互い同士の診断を指示する
    診断回路診断方法。
  8. 診断主体の前記診断手段から、何れかの診断対象の前記診断手段で障害が発生したことを受信したときに、前記診断管理情報を参照して、障害が発生した前記診断手段により診断される前記診断手段が存在する場合は、当該診断手段の診断主体を、障害が発生した前記診断手段から、所定の基準で別の診断手段に変更して、前記診断管理情報を更新する
    請求項7の診断回路診断方法。
  9. 複数の診断手段が互いに診断するときの、診断主体の前記診断手段の識別情報と、当該診断手段が診断対象とする前記診断手段の識別情報との対応関係を、診断管理情報として記憶域に格納する格納処理と、
    前記診断管理情報をもとに、前記診断手段に対して、互い同士の診断を指示する指示処理と、
    をコンピュータに実行させる診断回路診断プログラム。
  10. 前記指示処理は、診断主体の前記診断手段から、何れかの診断対象の前記診断手段で障害が発生したことを受信したときに、前記診断管理情報を参照して、障害が発生した前記診断手段により診断される前記診断手段が存在する場合は、当該診断手段の診断主体を、障害が発生した前記診断手段から、所定の基準で別の診断手段に変更して、前記診断管理情報を更新する
    請求項9の診断回路診断プログラム。
JP2012230936A 2012-10-18 2012-10-18 診断回路診断装置、診断回路診断システム、診断回路診断方法、及び、診断回路診断プログラム Pending JP2014081880A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012230936A JP2014081880A (ja) 2012-10-18 2012-10-18 診断回路診断装置、診断回路診断システム、診断回路診断方法、及び、診断回路診断プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012230936A JP2014081880A (ja) 2012-10-18 2012-10-18 診断回路診断装置、診断回路診断システム、診断回路診断方法、及び、診断回路診断プログラム

Publications (1)

Publication Number Publication Date
JP2014081880A true JP2014081880A (ja) 2014-05-08

Family

ID=50785993

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012230936A Pending JP2014081880A (ja) 2012-10-18 2012-10-18 診断回路診断装置、診断回路診断システム、診断回路診断方法、及び、診断回路診断プログラム

Country Status (1)

Country Link
JP (1) JP2014081880A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019061481A1 (zh) * 2017-09-30 2019-04-04 西门子公司 一种数控机床的故障诊断方法和装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019061481A1 (zh) * 2017-09-30 2019-04-04 西门子公司 一种数控机床的故障诊断方法和装置
US11474495B2 (en) 2017-09-30 2022-10-18 Siemens Aktiengesellschaft Fault diagnosis method and apparatus for numerical control machine tool

Similar Documents

Publication Publication Date Title
EP2828765B1 (en) Cluster wide consistent detection of interconnect failures
US8910172B2 (en) Application resource switchover systems and methods
JP5678717B2 (ja) 監視装置、監視システムおよび監視方法
JP4572250B2 (ja) 計算機切り替え方法、計算機切り替えプログラム及び計算機システム
WO2009110111A1 (ja) サーバ装置及びサーバ装置の異常検知方法及びサーバ装置の異常検知プログラム
EP2273371A2 (en) Failover procedure for server system
CN104798349A (zh) 响应于端口故障的故障转移
CN102223394A (zh) 远程直接存储设备访问
JP2008035456A (ja) 運用管理方法、運用管理プログラム、運用管理システムおよび運用管理装置
JP2013097553A (ja) 切替制御装置、切替制御方法、情報処理装置および切替制御プログラム
EP3648405B1 (en) System and method to create a highly available quorum for clustered solutions
JP5617304B2 (ja) スイッチング装置、情報処理装置および障害通知制御プログラム
US9092396B2 (en) Standby system device, a control method, and a program thereof
EP2069934B1 (en) Fault-tolerant medium access control (mac) address assignment in network elements
CN107145399B (zh) 一种共享内存管理方法及共享内存管理设备
JP5531487B2 (ja) サーバシステム及びサーバシステムの管理方法
WO2020233001A1 (zh) 双控构架分布式存储***、数据读取方法、装置和存储介质
JPWO2011051999A1 (ja) 情報処理装置及び情報処理装置の制御方法
JP2014081880A (ja) 診断回路診断装置、診断回路診断システム、診断回路診断方法、及び、診断回路診断プログラム
JP4806382B2 (ja) 冗長化システム
CN114124803B (zh) 设备管理方法、装置、电子设备及存储介质
TW201201013A (en) Method and multiple computer system with a failover support to manage shared resources
JP2019153055A (ja) クラスタシステム、情報処理装置、クラスタ監視方法及びクラスタ監視プログラム
TW201408885A (zh) 風扇共用控制系統及方法
JP2016200961A (ja) サーバー障害監視システム

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20140822