JP2001292143A - 障害検出システム - Google Patents

障害検出システム

Info

Publication number
JP2001292143A
JP2001292143A JP2000103974A JP2000103974A JP2001292143A JP 2001292143 A JP2001292143 A JP 2001292143A JP 2000103974 A JP2000103974 A JP 2000103974A JP 2000103974 A JP2000103974 A JP 2000103974A JP 2001292143 A JP2001292143 A JP 2001292143A
Authority
JP
Japan
Prior art keywords
message
failure
msg
pattern
fault
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000103974A
Other languages
English (en)
Other versions
JP3450264B2 (ja
Inventor
Koichi Tsuda
幸一 津田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Software Shizuoka Ltd
Original Assignee
NEC Software Shizuoka Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Software Shizuoka Ltd filed Critical NEC Software Shizuoka Ltd
Priority to JP2000103974A priority Critical patent/JP3450264B2/ja
Publication of JP2001292143A publication Critical patent/JP2001292143A/ja
Application granted granted Critical
Publication of JP3450264B2 publication Critical patent/JP3450264B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)
  • Multi Processors (AREA)
  • Small-Scale Networks (AREA)

Abstract

(57)【要約】 【課題】 複数のサーバ、ワークステーションがネット
接続されたシステムで監視手段に通知されるMSG(メ
ッセージ)の内から障害MSGを区分して利用者に通知
し、障害発生装置切り分けを含め障害対応が迅速に行わ
れる様にする。 【解決手段】 上記システムで、接続ノードの装置よ
り、障害MSGを含む運転状況MSGを受け利用者に通
知する監視手段(監視装置1)を備え、監視手段は通知
される可能性のある障害MSGについてその特徴が予め
登録された周辺装置障害用パターンファイル15、ノー
ド装置障害用パターンファイル16を有し、MSG取得
部13が通信制御部122より取得したMSGを、MS
G解析通知部14でパターンファイル15、16の個々
パターンと比較し周辺装置障害MSG/ノード障害MS
G/その他MSGを判定し、明確に区別して利用者に通
知する。又、周辺装置障害MSGでは、抽出した障害状
態の装置名も併せ通知する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は障害検出システムに
関し、特に複数のサーバ、ワークステーション装置がネ
ットワークで接続されたシステムの監視装置の障害メッ
セージの検出システムとその出力を利用し障害発生装置
を推定するシステムに関する。
【0002】
【従来の技術】図11は、複数のサーバやワークステー
ションがネットワーク9で接続され、各ノード装置の運
転状況を監視する監視装置50を有するシステムの従来
例を示したものである。ノード#1装置60には、監視
プログラム(S)(Sはスレーブの略)62を常駐させ
ておき、運用AP(A)63、運用AP(B)64、オ
ペレーティングシステム61のカーネル612や周辺装
置制御部613から障害メッセージ(以下メッセージを
MSGと省略)を含む運転状況MSGを受信ないし収集
する。
【0003】この際、ノード#1装置60の下位に接続
された複数の周辺装置66、・・、69からのMSGは
周辺装置制御部613を通じて通知される。監視プログ
ラム(S)62は、これらのMSGを通信制御部61
1、ネットワーク9、通信制御部522を通じて監視プ
ログラム(M)(Mはマスタの略)51に通知する。
【0004】監視プログラム(M)51は受信したMS
Gを到着順に表示制御部521を介しディスプレイ10
に表示し、監視装置の利用者(管理者)90に通知す
る。この際、MSGに発信元のノード番号を付与して通
知するが、MSGの緊急度や、種別(障害通知/警告/
通常の処理状況)を明確に区別して通知はしない。
【0005】これは、監視装置も含め各ノードの装置
が、オペレーテイングシステムあるいはメーカ、機種が
多様であり、MSGの内容上の形式が統一されてないの
で、監視プログラム(S)62や監視プログラム(M)
51がMSGの緊急度や、種別を認識出来ないからであ
る。
【0006】従って、利用者90は、障害MSGが極め
て希に画面表示ないし通知されても、見落とすこともあ
る。又、システムのプログラムや、ハードウェア及びそ
れらが通知する広範囲のMSGの意味をよく理解し、訓
練されてない限り的確に障害の内容を把握出来ない。即
ち、システムが障害MSGを出力後の、障害が起きてい
る旨の把握、障害発生装置の把握は利用者90の判断に
よる。
【0007】
【発明が解決しようとする課題】従って、この従来技術
には、次の様な問題点があった。第1の問題点は、障害
が迅速に検出出来ないことである。その理由は、障害情
報と障害以外の情報が区別なく通知され、そのままで
は、通知された情報が障害情報かを利用者が判断する必
要があり、そのため、障害を検出する迄に時間が掛かる
為である。
【0008】第2の問題点は、障害が発生した場合、ノ
ード障害か周辺装置障害かが分からないことである。そ
の理由は、発生した情報を、全てノードで発生した情報
としていた為である。
【0009】第3の問題点は、装置間の通信障害が発生
した場合、障害を検出したノード(装置)は分かるが、
発生装置を特定するのに時間がかかり、対応処置が遅れ
ることである。
【0010】これらの問題の解決手段として、上記を鑑
みMSG内容の統一が考えられるがこの様なMSGを通
信上のプロトコルだけでなく内容も含めて、グローバル
な標準で統一するのは、機能や設計上の制約となり旨く
ない。
【0011】
【課題を解決するための手段】本発明の第1の障害検出
システムは、複数のサーバ装置やワークステーション装
置がネットワークで接続されたシステムに於いて、ネッ
トワークのノードである前記接続された装置より、障害
メッセージを含む運転状況メッセージを受け利用者に通
知する監視手段を備え、前記監視手段は通知される可能
性のある障害メッセージについてその特徴が予め登録さ
れたパターンファイルを有し、前記運転状況メッセージ
を受けると、そのメッセージを前記パターンファイルの
個々のパターンと比較し障害メッセージか否かを判定
し、障害メッセージとそれ以外のメッセージを明確に区
別して利用者に通知することを特徴とする。
【0012】本発明の第2の障害検出システムは、前記
第1の障害検出システムにおいて、前記ネットワークノ
ード装置は、配下に周辺装置を接続し、周辺装置の障害
メッセージも含めて前記監視手段に通知し、前記監視手
段はノード障害用パターンファイルと、周辺装置障害用
パターンファイルとを有し、前記運転状況メッセージを
受けると、そのメッセージを前記周辺装置障害用パター
ンファイル及びノード障害用パターンファイルと比較
し、そのメッセージが周辺装置障害メッセージ、ノード
障害メッセージ、それら以外のメッセージの何れである
か判定し、これら種別を明確に区別してメッセージを利
用者に通知することを特徴とする。
【0013】本発明の第3の障害検出システムは、前記
第2の障害検出システムにおいて、前記周辺装置障害用
パターンファイルは個々のパターン毎に、対応する周辺
装置障害メッセージがメッセージ中の何処に障害状態の
周辺装置を特定する情報を含むかを示す位置情報を付随
し、前記監視手段が、受信メッセージを周辺装置障害メ
ッセージと判定した場合、判定に用いたパターンに付随
する前記位置情報に従い周辺装置特定情報を取出し、特
定した周辺装置の障害である旨を追記し利用者に通知す
ることを特徴とする。
【0014】本発明の第4の障害検出システムは、前記
第2の障害検出システムにおいて、前記パターンファイ
ルは、個々のパターンを、パターン対応の障害メッセー
ジの先頭文字をキーとしてブロック化した形で登録して
おき、前記監視手段が、受信メッセージをその先頭文字
に従って、前記パターンファイルの対応ブロックと比較
し、障害メッセージか否かを判定することを特徴とす
る。
【0015】本発明の第5の障害検出システムは、複数
のサーバ装置やワークステーション装置がネットワーク
で接続されたシステムに於いて、ネットワークのノード
である前記接続された装置より、障害メッセージを含む
運転状況メッセージを受け、障害メッセージとそれ以外
のメッセージを区別して利用者に通知し、障害メッセー
ジ通知時は推定される障害発生装置も通知する監視手段
を備え、前記監視手段は通知される可能性のある障害メ
ッセージについてその特徴と、他装置に起因し検出され
た障害メッセージであるか、自装置の内部動作で検出さ
れた障害であるかを示す自他区分情報と、その区分情報
が他の場合に相手装置を特定する情報をメッセージの何
処に含むかを示す相手特定情報位置とが予め登録された
パターンファイルと、障害装置推定手段とを有し、前記
運転状況メッセージ受信時、メッセージを前記パターン
ファイルの個々の特徴パターンと比較し障害メッセージ
か判定し、障害メッセージとそれ以外のメッセージを明
確に区別して利用者に通知し、前記判定された障害メッ
セージと、前記自他区分情報と、相手特定情報位置を障
害装置推定手段に渡し、前記障害装置推定手段は一組以
上の前記渡された情報を用い障害発生装置を推定し利用
者に通知することを特徴とする。
【0016】本発明の第6の障害検出システムは、前記
第5の障害検出システムにおいて、前記監視手段は、通
知される可能性のある障害メッセージについてその特徴
と、前記自他区分情報と、その区分情報が他の場合、前
記相手特定情報位置の他に、相手特定情報が相手装置の
通信用のアドレスであるか、相手装置の通信先プログラ
ム名であるか、相手と通信する自装置のプログラム名で
あるかを識別可能な相手特定情報の属性とが予め登録さ
れたパターンファイルと、通信用のアドレスと装置識別
情報の対応を示すアドレス表と、プログラム名とそれを
搭載している装置の識別情報の対応を示すプログラム表
と、障害装置推定手段とを有し、前記運転状況メッセー
ジ受信時、メッセージを前記パターンファイルの個々の
特徴パターンと比較し障害メッセージか判定し、障害メ
ッセージとそれ以外のメッセージを明確に区別して利用
者に通知し、前記判定された障害メッセージと、前記自
他区分情報と、相手特定情報位置と、相手特定情報属性
とを障害装置推定手段に渡し、前記障害装置推定手段は
一組以上の前記渡された情報、前記アドレス表、前記プ
ログラム表を用い障害発生装置を推定し利用者に通知す
ることを特徴とする。
【0017】本発明の第7の障害検出システムは、前記
第1、第2、又は第4の障害検出システムにおいて、前
記監視手段に通知される可能性のある障害メッセージに
ついて、予めメセージの一つ乃至複数毎にその特徴を抽
出しパターンデータを作成し、これをパターンファイル
の構成単位として登録するパターン作成部を有し、パタ
ーン作成部は、障害メッセージの追加、削除に伴ってパ
ターンファイルを前記構成単位で追加、削除することを
特徴とする。
【0018】本発明の第8の障害検出システムは、前記
第3、第5、又は第6の障害検出システムにおいて、前
記監視手段に通知される可能性のある障害メッセージに
ついて、予めメセージの一つ乃至複数毎にその特徴を抽
出したパターンデータと、パターンデータに付随する情
報を作成し、これらをパターンファイルの構成単位とし
て登録するパターン作成部を有し、パターン作成部は、
障害メッセージの追加、削除に伴ってパターンファイル
を前記構成単位で追加、削除することを特徴とする。
【0019】
【発明の実施の形態】次に、本発明の第1実施形態につ
いて図面を参照し説明する。図1は、複数のサーバやワ
ークステーションがネットワーク9で接続され、各ノー
ド装置の運転状況を監視する監視装置1を有するシステ
ムの例を示したものである。監視装置1には本発明の障
害検出システムが搭載されている。ネットワーク9のノ
ード#1、#2、・・#Nには、監視装置1、通信サー
バ2、サーバ3、サーバ4、ワークステーション5、・
・ワークステーション8が接続され、例えばオンライン
の業務システムを構成している。
【0020】通信サーバ2は外部回線にも接続され、外
部回線とシステムの各装置との通信を仲介する。サーバ
3は、顧客からの商品購入オーダをオンラインで受付け
キューイングすると共に、配下に周辺装置31(ハード
ディスク)や、周辺装置34(磁気テープ装置)を接続
しオーダ受付処理や、販売商品の代金入金処理のデータ
ベースを更新管理している。サーバ4は商品の生産管理
処理や、部材発注処理を行い、配下に周辺装置41(ハ
ードディスク)や、周辺装置44(プリンタ装置)を接
続し、関連ファイルを更新管理し、発注伝票等の印刷を
行っている。
【0021】ワークステーション5、・・8は業務処理
を遂行するための端末で、それぞれ利用者が分担して操
作している。例えば、ワークステーション5は顧客から
の購入オーダの受付け処理をし、ワークステーション6
は販売品の決済処理をし、ワークステーション7は商品
の生産指示をオンラインで行い、ワークステーション8
は商品生産用の部材手配をオンラインで処理している。
【0022】従って、ワークステーション5のオーダレ
セプションAPからは、サーバ3の対応APや、データ
ベースにはアクセス出来、サーバ4の生産計画ファイル
には参照のみ可能である。同様にワークステーション6
の決済APからは、サーバ3の対応APや、データベー
スにはアクセス出来、オーダレセプションの一部のファ
イルは参照のみ出来る。ワークステーション7の生産管
理APからは、サーバ4の対応APや、関連ファイルに
はアクセス出来、オーダレセプションの一部のファイル
は参照のみ出来る。即ち、ワークステーション5〜8は
それぞれ搭載APが異なっており、通信出来るサーバも
制限されておりフリーではない。このことは、装置間の
通信障害検出時、相手側に起因して障害検出したことが
分かれば、相手装置の識別情報そのものが障害MSGで
通知されなくとも、AP名を手がかりとし相手を特定す
るのに役立つ。
【0023】尚、ノード#2〜#Nの各装置の構成は、
図11のノード#1装置の構成と同様である。ここで好
適には監視プログラム(S)62が各装置に搭載されて
いるが、必須ではない。即ち、業務APやオペレーティ
ングシステム(OS)のカーネル、周辺制御部613、
通信制御部611がそれぞれ監視装置1に直接MSGを
送る場合には不要である。
【0024】又、ノード#2〜#Nの各装置のOS、機
種、等は統一されている必要はなく、最低限ネットワー
ク通信上の互換が有ればよい。
【0025】次に図2を参照し、監視装置1の構成を説
明する。OS12は通信制御部122、表示制御部12
1を含む。通信制御部122はノード#2〜#Nの各装
置の通信制御部と通信をするトランスポート層迄の通信
手段である。
【0026】MSG取得部13は、ノード#2〜#Nの
各装置ノードで発生した障害MSGを含む運転状況MS
Gを取得する。好適には監視プログラム(S)62が収
集あるいは受信したMSGを受け取る。
【0027】パターン作成部17は、障害MSGを識別
するためのパターンを事前に作成する。パターンは障害
を表す単語の組合せである。パターンファイル15、1
6には、パターン作成部17で作成した周辺装置障害
用、ノード装置障害用パターンを登録しておく。
【0028】MSG解析通知部14は、取得したMSG
とパターンファイル15、16のマッチングを行い、ノ
ード装置障害MSG、周辺装置障害MSG、その他のM
SG(通常の運転状況MSG)の識別をし、障害MSG
に明確な区分情報を付加しMSGを表示制御部121に
渡す。
【0029】10は運転状況MSGを表示したり、パタ
ーン作成の為に事前収集したMSGや、作成パターンを
表示するためのディスプレイである。11はこれらの指
示、操作を行う為のキーボードである。
【0030】次に図3を参照し、MSG解析通知部14
の詳細構成を説明する。周辺装置障害マッチング部14
ー1は、MSG取得部13で取得したMSGが周辺装置
障害MSGかを周辺装置用のパターンファイル15をも
とに判断する。
【0031】周辺装置特定部14−2は、周辺装置障害
用のパターンファイル15にある周辺装置名位置情報を
用いてMSGから周辺装置名を取り出す。周辺装置障害
通知部14−3は、周辺装置の障害を通知する。
【0032】ノード障害振り分け部14−4は、ノード
障害用の全てのパターンとマッチングを行わず、MSG
の先頭の文字によるマッチング対象の振り分けを行う。
【0033】ノード障害マッチング部14−5は、MS
Gがノード障害MSGかの判断をパターンファイル16
の上記先頭文字対応のブロックのパターン情報をもとに
行う。ノード置障害通知部14−6は、ノード装置障害
を通知する。
【0034】次に、本発明の実施の形態の動作について
図面を参照して説明する。図4は、図2のパターン作成
部17に対応したパターン作成処理例を示すものであ
る。
【0035】先ず、ノードが出力する障害MSGを、障
害発生前に情報収集する。同時に、ノードが出力する障
害MSG以外のMSGも収集しておく(ステップA
1)。具体的には、CD−ROM化されたMSG集より
障害MSG、それ以外のMSGに区分して入力する。C
D−ROM化されていない場合には各装置のメーカより
該当のテキスト情報をオンライン転送乃至フロッピー
(登録商標)ディスクや光磁気ディスク媒体で入手す
る。乃至はマニュアルのMSG集より収集しテキスト情
報化する。
【0036】収集した障害MSGをノード用、周辺装置
用に分ける(ステップA2)。次にステップA2で分け
られたノード用の障害MSG一つ一つから障害を表しそ
うな文字列を三つ取り出して一つのパターン(組合せ)
とする。その際、MSGの先頭の文字によりa(又は
A)〜z(又はZ)及びその他の27種類のパターン群
に振り分ける(ステップA3)。
【0037】ステップA2で分けられた周辺装置用の障
害MSG一つ一つから周辺装置の障害を表しそうな文字
列を三つ取り出して一つのパターンとする。その障害M
SGには周辺装置名が表示される位置が決まっているた
め、その周辺装置名の位置情報も取り出し、パターンの
付随情報として追加する(ステップA4)。
【0038】ここで、ノード障害MSG用パターンは、
周辺装置障害MSGや障害以外のMSGにマッチしない
ことを確認しておく(ステップA5)。マッチするMS
Gが存在する場合は、そのノード障害MSG用パターン
を手直しマッチしない様にする(ステップA6)。
【0039】同様に、周辺装置障害MSG用パターン
は、ノード障害MSGや障害以外のMSGにマッチしな
いことを確認しておく(ステップA7)。マッチするM
SGが存在する場合は、その周辺装置障害MSG用パタ
ーンを手直しマッチしない様にする(ステップA8)。
【0040】ステップA5で確認されたパターンからノ
ード障害用の編集可能なパターンファイル16を、ステ
ップA7で確認されたパターンと位置情報からは周辺装
置障害用の編集可能なパターンファイル15を作成す
る。例えば一つのパターン、或いは一つのパターンと位
置情報を1レコードとしてレコードを集積しファイルを
構成すればよい。
【0041】又、新機種装置の増設や、置換等で障害情
報の増(減)が生じた場合には、ノード障害用パターン
ファイル16、周辺装置用パターンファイル15にパタ
ーンデータ、位置情報をレコード単位で追加(削除)す
る(ステップA10)。
【0042】図5に、図11に示すMSG発生元、図3
のMSG取得部13〜ノード障害通知部14−6が行う
障害検出処理フローを示す。以下、本フロチャートに従
って説明する。
【0043】ノードでノード障害MSG、周辺装置障害
MSG、又はその他(通常の運転状況)MSGが発生す
る(ステップB1)。MSG取得部13は発生したMS
Gを取得する(ステップB2)。
【0044】周辺装置障害マッチング部14−1で取得
MSGに対し、先ず周辺装置用の障害パターンとマッチ
ングを行う(ステップB3)。マッチングが成功した場
合、周辺装置特定部14−2は、一致したパターンと共
に保持している単語位置情報を元にMSGから周辺装置
名を取得する(ステップB4)。
【0045】周辺装置障害通知部14−3は、取得した
周辺装置名と共に、周辺装置障害である旨を追記しこの
MSGを通知する(ステップB5)。
【0046】ステップB3でマッチングしなかった場
合、ノード障害振り分け部14−4が呼び出されMSG
の先頭の文字を基にマッチング対象を27種類のノード
障害用のパターン群に振り分ける(ステップB6)。振
り分けられたマッチング対象とMSGとのマッチング
を、ノード障害マッチング部14ー5で行う(ステップ
B7)。
【0047】マッチングが成功した場合、ノード障害通
知部14−6がノード障害である旨を追記しこのMSG
を通知する(ステップB8)。ステップB7でマッチン
グが成功しなかった場合、障害MSGである旨の追記は
行わず、MSGをそのまま通知する(ステップB9)。
【0048】尚、上記例では周辺装置障害用パターンと
のマッチングでは、MSGの先頭文字等による振り分け
は行ってないが、MSG数が多い場合にはノード障害用
パターンのマッチングと同様に行えば、高速される。
【0049】次に、MSGの具体例を用い説明する。図
6の(A)は障害MSG例を示し、(B)はそれらMS
Gに対し予め用意されたパターンデータと付随情報を示
す。
【0050】MSGの(1)は周辺装置31が出力する
ディスク障害MSGの一例であり、パターンデータとし
ては(B)の上段に示す様に、DISC、error、
frequentの3語とする。
【0051】又、MSGの5番目のワードがHDU31
と言う周辺装置名を含むので周辺装置名位置情報はW5
と登録する。
【0052】MSGの(3)は通信サーバ2が出力する
受信データのエラーが規定回数超えて発生した旨のMS
Gである。パターンデータとしては(B)の下段に示す
様に、over、limit、errorの3語とす
る。そしてこのMSGの先頭文字は「O」で有るため、
パターンファイル16の「O」のブロックに登録する。
【0053】これらの障害MSGがそれぞれ周辺装置障
害MSG、ノード障害MSGと識別された際のディスプ
レイ10での表示例を図7に示す。(1)のMSGであ
れば「*周辺装置障害MSG(HDU31)*」の追記
をし表示する。この追記部分乃至MSG全体の文字色を
他と区別し、利用者の注意を喚起するために例えば赤色
とする。或いは「*」をブリンキング表示する。
【0054】又、図示してないが、上記追記された障害
MSGを通常の運転状況MSGとは別のウインドウに表
示するようにしてもよい。
【0055】又、周辺装置名位置情報はMSGの先頭か
らの文字位置で保持するようにしても良い。例えば、
(1)のMSGではCH32〜CH35とする。
【0056】又、周辺装置障害時の障害状態周辺装置の
識別情報としては、周辺装置名の代わりにノード番号
と、ノード装置上の接続ポート番号としてもよい。
【0057】次に、本発明の第2実施形態について図面
を参照し説明する。図8は本実施形態の監視装置1Aの
構成を示したブロック図である。図2の監視装置1と異
なる点は、障害装置推定部18を有し、ノード障害用パ
ターンファイル26はパターンデータの他に付随情報を
持つ点である。
【0058】付随情報としては、対応するMSGが装置
の内部動作により検出された自装置障害MSGである
か、他装置と通信中に検出され他装置に起因し検出され
た障害MSGであるかを示す自他区分情報と、他区分の
場合の相手特定情報の属性、MSG内の位置が登録され
ている。
【0059】属性としては、通信上の相手のIP(イン
ターネットプロトコル)アドレス、MAC(メディアア
クセスコントロール)アドレス、相手プログラム名、自
プログラム名に対応して、「1」、「2」、「4」、
「8」のコードがアサインされている。又相手特定情報
を含まない場合は「0」とする。
【0060】又、障害装置推定部18は、各装置の通信
部が有している通信上のアドレスと装置のノード番号の
対応を保持するアドレス表181と、プログラム名と、
それが搭載されている装置のノード番号の対応情報を保
持するプログラム表182と、各プログラムの通信相手
プログラムを示したプログラム間通信表183を有して
いる。
【0061】次に、本実施形態の動作について図面を参
照し説明する。図9に、前記図6のノード障害MSG例
(3)〜(5)に対する、パターンデータと付随情報を
示す。(3)のMSGに対しては、他装置からの受信デ
ータのエラーにつき自他区分を他を示す「2」とし、又
MSG中に相手IPアドレス(133.121.1.
1)を含むので、属性を「1」とし相手特定情報位置を
W10とする。
【0062】同様に、(5)のMSGに対しては、他装
置のプログラムと接続出来ないので自他区分を「2」と
し、又MSG中に相手プログラム(Partssyst
em)を含むので、属性を「4」とし相手特定情報位置
をW6とする。
【0063】(4)のMSGに対しては、自装置の内部
動作で検出したエラーにつき自他区分を自を示す「1」
とする。
【0064】MSG(3)が、MSG解析通知部24に
入力されノード障害MSGと識別されると、その旨の付
加情報が追記され表示制御部121に渡され、表示され
る。同時にMSG(3)と、上記付随情報が障害装置推
定部18に渡される。障害装置推定部18は、相手特定
情報位置によりMSG(3)より相手特定情報を取り出
し、属性コードよりこれをIPアドレスと見なし、アド
レス表181を索引し相手ノード番号を得る。
【0065】MSG(5)が入力された場合も同様に動
作するが、障害装置推定部18は、相手特定情報位置に
よりMSGより相手特定情報を取り出し、属性コードよ
りこれを相手のプログラム名と見なし、プログラム表1
82を索引し相手ノード番号を得る。尚、属性コードが
「8」であれば、MSGより自プログラム名を取りだ
し、プログラム通信表183を索引し、相手プログラム
名を得て、プログラム表182を索引し相手ノード番号
を得る。
【0066】障害装置推定部18は、最初の障害MSG
を受けると所定時間(数秒から数十秒)内に受けた後続
の障害MSGも含めて、それぞれの障害MSGに対し上
記前処理を行い、その結果を総合判定し障害発生装置を
特定ないし推定し利用者に通知する。
【0067】総合判定の例を図10に示す。項1はノー
ド#Iより周辺装置障害MSGのみ受けた場合で、これ
はそのままノード#I配下の周辺装置を障害発生装置と
特定し通知する。項2の周辺装置障害MSGにそのノー
ドの自装置障害MSGが伴う場合も同様にその周辺装置
を障害発生装置と通知する。
【0068】項3の自装置障害MSGのみの場合や、項
4のノード#Iの自装置障害MSGとノード#Jのノー
ド#I装置を指摘した他装置障害MSGでは、ノード#
I装置を障害発生装置と特定し通知する。
【0069】項5の、ノード#I、#Jの装置が共にノ
ード#Kを指摘した他装置障害MSGを受けると、障害
発生装置の第1候補はノード#K装置で、第2候補はノ
ード#I、#J、#Kに係わるネットワーク(ケーブ
ル、リピータ等)と推定される旨利用者に通知する。
【0070】項6の、ノード#I、#Jの装置がそれぞ
れノード#K、ノード#Lを指摘した他装置障害MSG
の組み合わせでは、障害発生装置としてはノード#I、
#J、#K、#Lに係わるネットワークと推定される旨
を利用者に通知する。
【0071】項7の、ノード#Iの装置によるノード#
J指摘の他装置障害MSGのみの場合は、障害発生装置
の第1候補はノード#J装置で、第2候補はノード#
I、#Jに係わるネットワークと推定される旨を利用者
に通知する。
【0072】項8の、ノード#Iの装置による相手装置
不明の他装置障害MSGのみの場合は、「ノード#Iの
装置が他装置との通信による障害を検出しましたが相手
装置は推定出来ません。障害MSGの前後のMSG、シ
ステム及び各装置の通信ログ等により推定して下さい」
と通知する。
【0073】以上の説明では、監視手段を監視装置1或
いは1Aに搭載された例で説明したが、図1の通信サー
バ2、サーバ3、サーバ4、ワークステーション5から
8のいずれかの装置に、その装置の本来のプログラムと
ともに監視手段が併せて搭載されている場合でも本発明
の障害検出システムは構成出来る。
【0074】
【発明の効果】本発明の第1実施形態によれば、利用者
に通知されるMSGを、事前作成された周辺装置障害M
SG用パターン、ノード障害MSG用パターンによりM
SGの種類を識別し、障害MSGの場合その識別結果を
追記し明確に利用者に通知するので、障害が発生した場
合、迅速に障害の切り分けを行える効果がある。
【0075】又、周辺装置障害用パターンに付随し周辺
装置を特定するための単語位置情報を備えているので、
周辺装置に障害が発生した場合、障害が発生した周辺装
置を特定できる効果を有す。
【0076】又、障害MSGを識別する為のパターン群
をa(又はA)〜z(又はZ)及びその他の27種類に
ブロック分けしておき、MSGの先頭文字に対応するブ
ロックのパターンとのみ比較解析するので、より高速に
上記識別通知を行ない利用者に通知出来る。
【0077】更に、パターンファイルは個々の障害MS
Gに対応したパターン及び付随情報を一つの構成単位
(レコード)としているので、障害MSGの増減に応
じ、パターンファイルを容易に再編集出来る効果も有
す。
【0078】本発明の第2実施形態によれば、前記ノー
ド障害MSG用パターンに付随し、自他区分、相手特定
情報位置、属性を備え、装置間の通信障害等のMSGよ
り相手特定情報を抽出し、これをアドレス表、プログラ
ム表及びプログラム通信表により相手装置のノード番号
に変換するので、障害発生装置を特定乃至推定し、利用
者に通知するので、障害対応処置をより迅速に行える効
果を有す。
【図面の簡単な説明】
【図1】本発明の障害検出システムを含む情報処理シス
テム全体の構成図。
【図2】図1の監視装置1の構成を示すブロック図。
【図3】図2のMSG解析通知部14の詳細構成とその
周辺を示すブロック図。
【図4】図3のパターン作成部17の処理を示すフロー
チャート。
【図5】本発明の第1実施形態の、障害検出処理を示す
フロチャート。
【図6】障害MSGの具体例と、対応するパターンデー
タと付随情報を示す図。
【図7】周辺装置障害MSG、ノード障害MSGの画面
表示例を示す図。
【図8】本発明の第2実施形態における、監視装置1A
の構成を示すブロック図。
【図9】本発明の第2実施形態における、ノード障害用
パターンデータと付随情報を示す図。
【図10】本発明の第2実施形態における、障害装置推
定部18の障害発生装置判定条件及び結果を示す図。
【図11】従来の監視装置を含む情報処理システム全体
の構成図。
【符号の説明】
1、1A 監視装置 2 通信サーバ 3、4 サーバ 5、8 ワークステーション 9 ネットワーク 10 ディスプレイ 11 キーボード 12 オペレーティングシステム(OS) 13 MSG取得部 14、24 MSG解析通知部 15 パターンファイル(周辺装置障害用) 16、26 パターンファイル(ノード障害用) 17、27 パターン作成部 18 障害装置推定部 121 表示制御部 122 通信制御部 181 アドレス表 182 プログラム表 183 プログラム間通信表

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 複数のサーバ装置やワークステーション
    装置がネットワークで接続されたシステムに於いて、ネ
    ットワークのノードである前記接続された装置より、障
    害メッセージを含む運転状況メッセージを受け利用者に
    通知する監視手段を備え、前記監視手段は通知される可
    能性のある障害メッセージについてその特徴が予め登録
    されたパターンファイルを有し、前記運転状況メッセー
    ジを受けると、そのメッセージを前記パターンファイル
    の個々のパターンと比較し障害メッセージか否かを判定
    し、障害メッセージとそれ以外のメッセージを明確に区
    別して利用者に通知することを特徴とする障害検出シス
    テム。
  2. 【請求項2】 前記ネットワークノード装置は、配下に
    周辺装置を接続し、周辺装置の障害メッセージも含めて
    前記監視手段に通知し、前記監視手段はノード障害用パ
    ターンファイルと、周辺装置障害用パターンファイルと
    を有し、前記運転状況メッセージを受けると、そのメッ
    セージを前記周辺装置障害用パターンファイル及びノー
    ド障害用パターンファイルと比較し、そのメッセージが
    周辺装置障害メッセージ、ノード障害メッセージ、それ
    ら以外のメッセージの何れであるか判定し、これら種別
    を明確に区別してメッセージを利用者に通知することを
    特徴とする請求項1記載の障害検出システム。
  3. 【請求項3】 前記周辺装置障害用パターンファイルは
    個々のパターン毎に、対応する周辺装置障害メッセージ
    がメッセージ中の何処に障害状態の周辺装置を特定する
    情報を含むかを示す位置情報を付随し、前記監視手段
    が、受信メッセージを周辺装置障害メッセージと判定し
    た場合、判定に用いたパターンに付随する前記位置情報
    に従い周辺装置特定情報を取出し、特定した周辺装置の
    障害である旨を追記し利用者に通知することを特徴とす
    る請求項2記載の障害検出システム。
  4. 【請求項4】 前記パターンファイルは、個々のパター
    ンを、パターン対応の障害メッセージの先頭文字をキー
    としてブロック化した形で登録しておき、前記監視手段
    が、受信メッセージをその先頭文字に従って、前記パタ
    ーンファイルの対応ブロックと比較し、障害メッセージ
    か否かを判定することを特徴とする請求項2記載の障害
    検出システム。
  5. 【請求項5】 複数のサーバ装置やワークステーション
    装置がネットワークで接続されたシステムに於いて、ネ
    ットワークのノードである前記接続された装置より、障
    害メッセージを含む運転状況メッセージを受け、障害メ
    ッセージとそれ以外のメッセージを区別して利用者に通
    知し、障害メッセージ通知時は推定される障害発生装置
    も通知する監視手段を備え、前記監視手段は通知される
    可能性のある障害メッセージについてその特徴と、他装
    置に起因し検出された障害メッセージであるか、自装置
    の内部動作で検出された障害であるかを示す自他区分情
    報と、その区分情報が他の場合に相手装置を特定する情
    報をメッセージの何処に含むかを示す相手特定情報位置
    とが予め登録されたパターンファイルと、障害装置推定
    手段とを有し、前記運転状況メッセージ受信時、メッセ
    ージを前記パターンファイルの個々の特徴パターンと比
    較し障害メッセージか判定し、障害メッセージとそれ以
    外のメッセージを明確に区別して利用者に通知し、前記
    判定された障害メッセージと、前記自他区分情報と、相
    手特定情報位置を障害装置推定手段に渡し、前記障害装
    置推定手段は一組以上の前記渡された情報を用い障害発
    生装置を推定し利用者に通知することを特徴とする障害
    検出システム。
  6. 【請求項6】 前記監視手段は、通知される可能性のあ
    る障害メッセージについてその特徴と、前記自他区分情
    報と、その区分情報が他の場合、前記相手特定情報位置
    の他に、相手特定情報が相手装置の通信用のアドレスで
    あるか、相手装置の通信先プログラム名であるか、相手
    と通信する自装置のプログラム名であるかを識別可能な
    相手特定情報の属性とが予め登録されたパターンファイ
    ルと、通信用のアドレスと装置識別情報の対応を示すア
    ドレス表と、プログラム名とそれを搭載している装置の
    識別情報の対応を示すプログラム表と、障害装置推定手
    段とを有し、前記運転状況メッセージ受信時、メッセー
    ジを前記パターンファイルの個々の特徴パターンと比較
    し障害メッセージか判定し、障害メッセージとそれ以外
    のメッセージを明確に区別して利用者に通知し、前記判
    定された障害メッセージと、前記自他区分情報と、相手
    特定情報位置と、相手特定情報属性とを障害装置推定手
    段に渡し、前記障害装置推定手段は一組以上の前記渡さ
    れた情報、前記アドレス表、前記プログラム表を用い障
    害発生装置を推定し利用者に通知することを特徴とする
    請求項5記載の障害検出システム。
  7. 【請求項7】 前記監視手段に通知される可能性のある
    障害メッセージについて、予めメセージの一つ乃至複数
    毎にその特徴を抽出しパターンデータを作成し、これを
    パターンファイルの構成単位として登録するパターン作
    成部を有し、パターン作成部は、障害メッセージの追
    加、削除に伴ってパターンファイルを前記構成単位で追
    加、削除することを特徴とする請求項1、2、又は4記
    載の障害検出システム。
  8. 【請求項8】 前記監視手段に通知される可能性のある
    障害メッセージについて、予めメセージの一つ乃至複数
    毎にその特徴を抽出したパターンデータと、パターンデ
    ータに付随する情報を作成し、これらをパターンファイ
    ルの構成単位として登録するパターン作成部を有し、パ
    ターン作成部は、障害メッセージの追加、削除に伴って
    パターンファイルを前記構成単位で追加、削除すること
    を特徴とする請求項3、5、又は6記載の障害検出シス
    テム。
JP2000103974A 2000-04-05 2000-04-05 障害検出システム Expired - Fee Related JP3450264B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000103974A JP3450264B2 (ja) 2000-04-05 2000-04-05 障害検出システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000103974A JP3450264B2 (ja) 2000-04-05 2000-04-05 障害検出システム

Publications (2)

Publication Number Publication Date
JP2001292143A true JP2001292143A (ja) 2001-10-19
JP3450264B2 JP3450264B2 (ja) 2003-09-22

Family

ID=18617597

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000103974A Expired - Fee Related JP3450264B2 (ja) 2000-04-05 2000-04-05 障害検出システム

Country Status (1)

Country Link
JP (1) JP3450264B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006318071A (ja) * 2005-05-11 2006-11-24 Fujitsu Ltd メッセージ異常自動判別装置、方法、及びプログラム
WO2012066650A1 (ja) * 2010-11-17 2012-05-24 富士通株式会社 情報処理装置、メッセージ抽出方法およびメッセージ抽出プログラム
US8751874B2 (en) 2010-12-10 2014-06-10 Fujitsu Limited Managing apparatus, managing method
US10360090B2 (en) 2013-11-15 2019-07-23 Fujitsu Limited Determination method, determination apparatus, and recording medium

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006318071A (ja) * 2005-05-11 2006-11-24 Fujitsu Ltd メッセージ異常自動判別装置、方法、及びプログラム
US8332503B2 (en) 2005-05-11 2012-12-11 Fujitsu Limited Message abnormality automatic detection device, method and program
WO2012066650A1 (ja) * 2010-11-17 2012-05-24 富士通株式会社 情報処理装置、メッセージ抽出方法およびメッセージ抽出プログラム
JP5423904B2 (ja) * 2010-11-17 2014-02-19 富士通株式会社 情報処理装置、メッセージ抽出方法およびメッセージ抽出プログラム
US8676568B2 (en) 2010-11-17 2014-03-18 Fujitsu Limited Information processing apparatus and message extraction method
US8751874B2 (en) 2010-12-10 2014-06-10 Fujitsu Limited Managing apparatus, managing method
US10360090B2 (en) 2013-11-15 2019-07-23 Fujitsu Limited Determination method, determination apparatus, and recording medium

Also Published As

Publication number Publication date
JP3450264B2 (ja) 2003-09-22

Similar Documents

Publication Publication Date Title
US10536323B2 (en) On-demand fault reduction framework
US8583779B2 (en) Root cause analysis approach with candidate elimination using network virtualization
WO2020029407A1 (zh) 告警数据的管理方法、装置、计算机设备及存储介质
JP4598065B2 (ja) 監視シミュレーション装置,方法およびそのプログラム
US7818283B1 (en) Service assurance automation access diagnostics
JPH11184781A (ja) ネットワーク監視機構
JPWO2004061681A1 (ja) 運用管理方法および運用管理サーバ
US10437695B2 (en) Fault information providing server and fault information providing method for users of in-vehicle terminals
US20210019323A1 (en) Information processing apparatus, data management system, data management method, and non-temporary computer readable medium including data management program
EP3326068A1 (en) System and method for monitoring and managing objects across data centers
CN111181775B (zh) 基于自动发现主机资产的一体化运维管理告警方法
JP2010009411A (ja) 仮想化環境運用支援システム及び仮想環境運用支援プログラム
JP5651381B2 (ja) 障害原因判定ルール検証装置及びプログラム
US20120078565A1 (en) Methods, Systems, and Products for Reflective Maintenance
CN103518192A (zh) 大规模服务的实时诊断流水线
US20200184386A1 (en) Systems to resolve shipment delays
JP2001292143A (ja) 障害検出システム
JP2005242988A (ja) ログ情報管理システム、サービス提供システム、ログ情報管理プログラムおよびサービス提供プログラム、並びにログ情報管理方法およびサービス提供方法
US6966014B2 (en) Method for system obstacle correspondence support
JP3241648B2 (ja) ネットワーク接続機器管理アプリケーション開発方式
JP7392852B2 (ja) ルール生成装置、ルール生成方法およびプログラム
CN107995065A (zh) 端口状态通告方法、装置及以太网设备
JP2022178869A (ja) 運用支援プログラム、情報処理装置および運用支援方法
JP2007156869A (ja) アラーム管理装置及びアラーム管理方法
JP2009182934A (ja) 障害監視装置及び障害監視方法並びにそのためのプログラム

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20030624

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees