JP2014199618A - 故障監視システム - Google Patents

故障監視システム Download PDF

Info

Publication number
JP2014199618A
JP2014199618A JP2013075252A JP2013075252A JP2014199618A JP 2014199618 A JP2014199618 A JP 2014199618A JP 2013075252 A JP2013075252 A JP 2013075252A JP 2013075252 A JP2013075252 A JP 2013075252A JP 2014199618 A JP2014199618 A JP 2014199618A
Authority
JP
Japan
Prior art keywords
maintenance
failure
equipment
monitoring
staff
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013075252A
Other languages
English (en)
Inventor
勝博 高橋
Katsuhiro Takahashi
勝博 高橋
智祐 畠山
Tomohiro Hatakeyama
智祐 畠山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Network and System Integration Corp
Original Assignee
NEC Network and System Integration Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Network and System Integration Corp filed Critical NEC Network and System Integration Corp
Priority to JP2013075252A priority Critical patent/JP2014199618A/ja
Publication of JP2014199618A publication Critical patent/JP2014199618A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Debugging And Monitoring (AREA)

Abstract

【課題】コンピュータシステムの保守監視業務にて、障害が発生した場合、復旧の為に逐次適切な人員及び機材を手配し、早急なシステムの復旧を実現する故障監視システム。
【解決手段】
保守対象システムに障害が発生した場合、障害情報による各種メッセージ、アラーム、障害ログと、監視員/保守員の入力情報によって、監視サーバは、過去の障害ログ及び過去の監視員/保守員入力情報から、障害復旧作業に必要なスキルを持つ最適な保守員及び、最適な保守機材を選出して手配予約すると共に、また、保守員が保守実行(暫定対処)時に、故障原因解析の情報を監視サーバに送信することにより、監視サーバは、最新の情報に基づいて、故障回復のために、更に手配予約した中から、追加保守員及び保守機材を選出し、保守員システム及び保守機材システムに手配することができるために、追加保守員決定までの時間が短縮でき、障害復旧を早期に実現する。
【選択図】図3

Description

本発明は、コンピュータシステムの保守監視業務において、障害が発生した場合、復旧の為に逐次適切な人員及び機材を手配し、早急なシステムの復旧を実現する保守管理システムに関する。
コンピュータシステムは、保守管理のため、管理センター等でオペレータの監視下、24時間体制で監視が行われている。コンピュータシステムに異常や故障が発した場合は、各種メッセージ、アラームがコンピュータシステムから管理センターの端末機に通知され、監視オペレータがこれらの内容を確認の後、コンピュータシステムを正常な状態に回復するために、保守員の手配等を行うのが一般的である。
特許文献1には、第1のサーバ装置が、保守卓から通知される故障と警報に対して対応する保守・復旧のシナリオをデータとして予め、記憶装置に記憶されており、前記保守卓から故障又は警報の通知を受けると、前記故障又は警報に対応したシナリオを決定し、前記シナリオの規定に基づき、前記第2のサーバ装置及び/又は前記第3のサーバ装置に対応を指示し、前記第2のサーバ装置は、前記第1のサーバ装置からの指示を受けると、前記指示に基づき、電話又はメールにて保守に必要な要員の手配を行う手段を備え、前記第3のサーバ装置は、前記第1のサーバ装置からの指示を受けると、前記指示に基づき、保守で必要な部品の在庫の問い合わせと取り出し、さらに、前記部品の発注が必要と判断した場合、前記部品の発注を行う手段を備えた保守システムについて開示されている。
特開2012−129674号公報
しかしながら、コンピュータシステムは様々な複数の機器から構成され、特にコンピュータシステムの規模が大きい場合には、一箇所の故障が原因となって、様々な箇所へ影響を及ぼし、その結果、根本原因となる故障箇所以外からも、各種の障害情報が通知され、故障原因の特定が非常に困難であった。また、障害状況によっては、一の故障を解消すると新たな障害が発生したりと、初期の要員(保守員)及び部品(保守機材)では故障の復旧が困難になり、新たな保守員及び保守機材が必要になる場合がある。このような場合、特許文献1のような、現在のシステムでは、根本原因となる故障の解消まで、継続的な対処方法についての対応が不十分である場合が多い。
そこで、本発明は、保守対象システムに障害が発生した場合、障害情報である各種メッセージ、アラームと、障害ログ、監視員/保守員の入力情報によって、監視サーバは、過去の各種メッセージ、アラーム、障害ログ及び過去の監視員/保守員入力情報から、例えば、一次的な保守実行(暫定対処)時に、根本的な故障原因を特定するのに必要なスキルを持つ最適な保守員及び、最適な保守機材を選出して手配すると共に、過去のナレッジ情報から必要と推定されるスキルを持つ最適な一又は複数の保守員及び、最適な一又は複数の保守機材を手配予約し、保守員が保守実行(暫定対処)時に、根本的な真の故障原因もしくは新たに判明した故障原因解析の情報を監視サーバに送信することにより、監視サーバは、最新の情報に基づいて、故障回復のために、更に追加保守員及び追加保守機材を選出し、保守員システム及び保守機材システムに手配する際、既に手配予約しているために、根本的な真の原因特定と、その対処のために必要な追加保守員および追加保守機材決定までの時間が短縮でき、障害復旧を早期に実現することができる監視システムを提供することを目的とする。
本発明に係る故障監視システムは監視サーバと、監視サーバ用データベースを有する故障監視システムにおいて、監視サーバ用データベースは、過去の故障ログ及び過去の監視員/保守員の入力情報からなる障害分析テーブルを有し、前記監視サーバは、故障発生時の保守対象システムから送信されてくる故障ログと、監視員/保守員からの入力情報を検索キーとして前記障害分析テーブルを検索し、障害解析に必要と推定される複数の保守員及び/又は複数の保守機材を決定し、前記決定した保守員を、当該保守員を管理する保守員システムに手配予約をする通知を行い、及び/又は前記決定した保守機材を、当該保守機材を管理する保守機材システムに手配予約をする通知を行ない、前記監視サーバは、前記監視員/保守員が故障対応中の対応状況によって適時入力する最新の入力情報を検索キーとして前記障害分析テーブルを検索し、必要に応じて前記手配予約した前記複数の保守員及び/又は前記複数の保守機材の中から、追加保守員及び/又は追加保守機材を決定し、前記決定した追加保守員及び/又は前記追加保守機材を前記保守員システム及び/又は前記保守機材システムに手配をする通知を行うことを特徴とする。
本発明に係る故障監視システムに係る前記監視サーバは、前記手配予約した前記複数の保守員及び/又は前記複数の保守機材の中から、前記追加保守員及び/又は前記追加保守機材の決定と、前記追加保守員及び/又は追加保守機材を前記保守員システム及び/又は前記保守機材システムに手配をする通知を、前記保守対象システムから故障復旧通知が送信されるまで繰り返すことを特徴とする。
本発明に係る故障監視システムに係る前記監視サーバは、前記保守対象システムから前記故障復旧通知が送信された場合、手配済みの前記追加保守員及び/又は前記追加保守機材のキャンセルを決定し、前記手配済みの追加保守員及び/又は前記手配済みの追加保守機材のキャンセルを前記保守員システム及び/又は前記保守機材システムに通知を行うことを特徴とする。
本発明に係る故障監視システムに係る、前記監視サーバ用データベースの前記障害分析テーブルにおける、前記過去の故障ログ及び前記過去の監視員/保守員の前記入力情報は、ナレッジ情報であること、を特徴とする。
本発明によれば、保守対象システムに障害が発生した場合、障害情報による各種メッセージ、アラーム、障害ログと、監視員/保守員の入力情報によって、監視サーバは、過去の障害情報である各種メッセージ、アラーム、障害ログ及び過去の監視員/保守員入力情報から、障害復旧作業に必要なスキルを持つ最適な保守員及び、最適な保守機材を選出することができるので、保守員および保守機材決定までの時間が短縮でき、早期の障害復旧を行うことができる。
また、監視サーバは、選出した保守員及び、保守機材を手配するために、保守員システム及び保守機材システムに自動的に手配の通知を行うので、初動までの時間が短縮でき、早期の障害復旧を行うことができる。
また、監視サーバは、障害解析に必要と推定される保守員及び、保守機材を手配予約するため、保守員が保守実行(暫定対処)時に、暫定対処中に判明した真の故障原因や新たに発生した故障解析の情報を監視サーバに送信する(監視サーバ用データベースに登録する)ことにより、監視サーバは、最新の情報に基づいて、故障回復のために更に追加保守員及び追加保守機材を選出し、手配予約に基づいて保守員システム及び保守機材システムに手配することができるために、追加保守員決定及び保守機材の搬入までの時間が短縮でき、障害復旧を早期に実現することができる。
また、障害回復の際には、障害回復の情報を監視サーバに送信する(監視サーバ用データベースに登録する)ことにより、監視サーバは、保守員システム及び保守機材システムに対して、保守員及び保守機材の手配予約をキャンセルする通知をするので、障害復旧後の後処理を効率よく行うことができる。
また、保守対象システムに障害が発生した場合、障害情報による各種メッセージ、アラームと、障害ログと、及び監視員/保守員の入力情報を、ナレッジ情報として監視サーバ用データベースに蓄積することで、このナレッジ情報を使用することで、精度の高い最適な保守員及び、最適な保守機材を選出することができる。
本発明の故障監視システムの全体を示す、システム概要図である。 本発明の故障監視システムに係るデータベースのテーブル構成図である。 本発明の故障監視システムのシーケンス図である。
[故障監視システムの構成]
以下、図面1及び図2を用いて、本発明の故障監視システムの構成について説明する。
図1は本発明の概要を示す、システム概要図である。図2は、本発明のデータベースのテーブル構成図である。図3は、本発明のシーケンス図である。
図1に示すように、コンピュータシステム1は、通信ネットワーク2、コンピュータ4、周辺機器5、通信機器6、監視システム10、保守員システム20、及び保守機材システム30からなる。
通信ネットワーク2はインターネットを用いても良いが、社内LAN(Local Area Network)や外部と独立したスタンドアロン式のネットワークでも利用可能である。独立したネットワークは機密性が高く、外部からの侵入、又は情報の漏洩や破壊等を防止することができるからである。
コンピュータ4は、監視の対象となる一又は複数のコンピュータである。通信ネットワーク2に接続され、搭載したソフトウェア、ハードウェアの状態を定期的にチェックし、その状態の情報を監視システム10に送信したり、何らかの障害/不具合が生じた場合、障害/不具合情報に関するエラーコードや障害情報等を、各種メッセージやアラームに付して、監視システム10に送信するための状態監視用ソフトウェア(図示せず)を搭載している。
周辺機器5はコンピュータ4に接続されている一又は複数の外部接続用周辺機器、例えば、ハードディスク、プリンタ等の機器である、これらの機器も、何らかの障害/不具合が生じた場合に、障害/不具合情報に関するエラーコードや障害情報等を、各種メッセージやアラームに付して、監視システム10に送信する。
通信機器6は、通信ネットワーク2〜コンピュータ4間や、コンピュータ4〜コンピュータ4間の通信接続のために設置される、例えば、一又は複数のHUB、ルーター等の機器である。これらの通信機器6は、コンピュータ4を介さずに、何らかの障害/不具合が生じた場合に、障害/不具合情報に関するエラーコードや障害情報等を、各種メッセージやアラームに付して、監視システム10に送信する。
以下、コンピュータ4、周辺機器5及び通信機器6から構成される一連のシステムを称して、保守対象システム7と呼称する。
監視システム10は、監視サーバ11と、一又は複数の監視端末12と、監視サーバ用データベース14等を有する。
監視サーバ11は通信ネットワーク2を通じて、保守対象システム7を監視する機能、また、各種メッセージやアラームに付して送られてくる障害/不具合情報に関するエラーコードや障害情報等を受信する機能、前記受信した情報を検索キーとして、監視サーバ用データベース14を検索する機能、前記検索結果から保守に必要な保守員及び保守機材を選出する機能、選出した保守員システム及び/又は保守機材システムに必要な保守員及び保守機材の手配する機能を有する。
監視端末12は、監視サーバ11で処理する情報を表示し、また、監視サーバ11に対する操作を入力する端末機である。一又は複数の監視員は監視端末12を使用し、これらの監視サーバ11の処理状況を確認することで、24時間又は定められた期間内において、保守対象システム7の監視を行う。
監視サーバ用データベース14は、データベーステーブル15乃至18を有し、過去に発生した保守対象システム7の過去のアラーム、メッセージ、過去の障害ログ及び過去の監視員/保守員入力情報(ナレッジ情報)、故障対処方法、保守員のスキル、保守機材等の情報を格納している。監視サーバ11は、保守対象システム7から送信されてくる最新情報をキーとして、データベーステーブル15乃至18の検索を実行し、最適な故障の対象方法、必要な保守員、保守機材を検出する。
ここでナレッジとは、障害/不具合情報等の単なる情報やデータではなく、何らかの対象についての体系立った知識や、目的の解決に直接役立つような見識、ノウハウや経験則といった暗黙の値を、言語化・数値化により、可視化するようにしたものである。本発明では、過去のアラーム、メッセージ、過去の障害ログ及び過去の監視員/保守員入力情報をナレッジ情報と称する。
障害分析テーブル15は検索キー(入力情報)として各種のアラーム・メッセージ15a、監視員/保守員入力情報15b、障害ログ15cを有し、前記入力情報を検索キーとし、保守対象システム7の機器が保有する、ナレッジ情報として過去の障害ログ15e、過去の監視員/保守員入力情報15f、及び出力情報として障害ID15gを有しており、障害が発生した場合の状況の把握及び、原因の究明のために使用されるデータを入力、及び検索するためのテーブルである。
アラーム・メッセージ15aは保守対象システム7から送信されてくる故障発生中の故障情報を、収集してデータベースに格納した各種アラーム、メッセージ情報の蓄積である。
監視員/保守員入力情報15bは、監視端末12に表示された発生中の障害/不具合情報に関するエラーコードや障害情報等や、監視者又は保守員のノウハウや経験側による見解を入力した物である。
障害ログ15cは保守対象システム7から送信されてくる故障発生中の故障情報や、監視員/保守員が障害対応を実施した際に収集して、データベースに格納したログ情報の蓄積である。
過去のアラーム・メッセージ15d、過去の障害ログ15eは、既に故障状態からの復旧が完了した障害に係る各種アラーム・メッセージ、及びログの蓄積である。過去の監視員/保守員入力情報15fもまた、既に故障状態からの復旧が終了している、障害に係る監視員/保守員入力情報の過去情報の蓄積である。
新たに保守対象システムに障害が発生した場合の入力情報としての各種アラームやメッセージ15a、監視員/保守員入力情報15b、及び障害ログ15cは、障害復旧後、過去のアラーム・メッセージ15d、過去の障害ログ15e、及び過去の監視員/保守員入力情報15fとなって蓄積されていくため、保守対象システム7の障害復旧を実施するたびに、ナレッジ情報が蓄積され、次に障害が発生した場合の保守員及び保守機材の選出の精度が向上していくこととなる。
障害ID15gは、発生した障害毎に付与される整理番号である。
障害処理テーブル16は、監視サーバ用データベース14の検索キーとして、障害ID16a、出力情報として、保守員スキル16b、及び保守機材16cを有している。発生中の障害を復旧させるための保守員及び保守機材の選出に使用するテーブルである。障害ID16aは、発生した障害毎に付与される整理番号であり、障害ID15eと同一の番号である。
保守員スキル16bは、障害ID16aを付与された障害を復旧するために必要な保守員の有するスキルについて、ナレッジ情報をもとに、監視サーバ11が判断した結果の値である。監視員が値を設定するようにしても良い。保守機材16cは、障害を復旧するために必要な機材を、ナレッジ情報をもとに、監視サーバ11が判断した値である。
保守員テーブルは、監視サーバ用データベース14の検索キーとして、保守員スキル17a及び、出力情報として、保守員連絡先17bを有する。保守員個々が取得している故障復旧のためのスキルと、その保守員の連絡先を記録した値である。
部材テーブルは、監視サーバ用データベース14の検索キーとして、保守機材18a及び、出力情報として、機材手配先18bを有する。保守員が故障復旧のために使用する機材の情報(名称、型番等)と、その保管先を記録した値である。
[故障監視システムの動作概要]
次に、図3を用いて、本故障監視システムの動作概要を説明する。図3は、本故障監視システムに係るシーケンス図である。
[障害発生時]
まず、保守対象システム7で障害が発生した場合(ステップS1)、故障の障害情報(1〜N)が、保守対象システム7から監視システム10の監視サーバ11に送信され(ステップS2)、又は監視端末機12を操作する監視者が、定期的に送信され又は保守対象システム7に保存する各種ログ情報の中から、異常を発見しても良い。障害情報は1機器からのみならず、1つの真の原因に起因して、複数の機器から同時に複数(1〜N個)送信される。また、1回のみならず、発生頻度に応じて複数回(1〜N回)送信される場合もある。監視サーバ11は、受信した障害情報に障害ID15gを付与し、障害ID15gに紐づけて各種アラームやメッセージ15a、障害ログ15c、監視員/保守員入力情報15bに振り分けて一時的に蓄積又は監視サーバ用データベース14の障害分析テーブル15に保存する。
次に、監視サーバ11は、受信した各種アラーム・メッセージ15a及び監視員/保守員入力情報15b、障害ログ15cを検索キーとして、ナレッジ情報の過去の障害ログ15e、及び過去の監視員/保守員入力情報15fを検索し、過去に今回と同一又は類似の障害が発生していたか否かを検索する(ステップS3)。検索結果には、障害の類似度を表示するようにしても良い。
監視サーバ11は、検索結果を基に、発生した障害の最適な対処を行うべく、当該障害対応に必要な保守員及び保守機材を選出する。選出には、監視サーバ用データベース14のナレッジ情報の検索結果を用いて、当該障害に対応可能な保守員スキルと、特に真の障害原因が特定されていない場合には、障害復旧に必要と推定される複数の保守機材を決定する。次に、決定した保守員スキルを検索キーとして、保守員テーブル17を検索し、所望の保守員スキルを有する保守員を選出し、その保守員の氏名及び連絡先を取得する。また、決定した保守機材を検索キーとして部材テーブル18を検索し、保守対象システム7の障害復旧に使用する保守機材の機材手配先を取得する(ステップS4)。
次に監視サーバ11は、取得した保守員の氏名及び連絡先から、保守員システム20に対して、必要と推定される複数の保守員の全てについて、障害復旧に出動の予約をする手配(手配予約)として保守員手配通知を連絡する(ステップS5)。連絡には、電子メールや、グループウェア等を使用する。連絡は、監視サーバ11が自動的に行う、又は、監視員の確認の後に行うようにしても良い。保守員システム20の監視員(オペレータ)は受信した連絡を元に、選出された保守員を、保守対象システム7の設置現場に派遣する手続を行う(ステップS6)。
また、監視サーバは、取得した保守機材の機材手配先から、保守機材システムに対して、必要と推定される複数の保守機材の全てについて、障害復旧に出動の予約をする手配(手配予約)として保守機材手配通知を連絡する(ステップS7)。保守機材システムのオペレータは受信した連絡を元に、選出された保守機材を、保守対象システムの設置現場に配送する手続を行う(ステップS8)。
なお、ステップS1乃至ステップS8の処理は、必要な回数分(1〜N回)繰り返し行っても良い。
[障害対処実施中]
次に、保守対象システム7の設置現場に派遣された保守員Mが保守対象システム7の故障対処として、真の故障箇所の原因特定や、暫定対処を行う(ステップS11)。保守員Mは、前記対処において解明した真の故障原因および新たに判明した故障原因を監視システム10の監視サーバ11に原因解析連絡として送信する(ステップS12)。
監視サーバ11は、当該原因解析連絡の内容を検索キーとして、ナレッジ情報の過去のアラーム・メッセージ15d、過去の障害ログ15e、及び過去の監視員/保守員入力情報15fを検索し、過去に今回と同一又は類似の障害が発生していたか、暫定対処が行われていたか、否かを検索する(ステップS13)。検索結果には、障害の類似度を表示するようにしても良い。
監視サーバ11は、検索結果を基に、対処中の障害に対して次の回復手段の対処を行うべく、保守員M及び保守機材Mに続いて当該障害対応に必要な追加保守員及び追加保守機材を選出する。選出には、監視サーバ用データベース14のナレッジ情報の検索結果を用いて、当該障害に対応可能な保守員スキルと、保守機材を決定する。次に、決定した保守員スキルを検索キーとして、保守員テーブル17を検索し、ステップS5で手配予約された保守員の中から、所望の保守員スキルを有する次の保守作業に係る追加保守員を選出し、その追加保守員の氏名及び連絡先を取得する。(ステップS14)。
次に監視サーバ11は、取得した次の保守作業に係る追加保守員の氏名及び連絡先から、保守員システム20に対して、保守員手配通知Mを連絡する(ステップS15)。連絡には、電子メールや、グループウェア等を使用する。保守員システム20のオペレータは受信した連絡を元に、追加保守員Nを、保守対象システム7の設置現場に派遣する手続を行う(ステップS16)。
また、監視サーバ11は、ステップS3で選出し、ステップS7で手配予約された障害復旧に必要と想定される複数の保守機材のうち、追加保守員Nが使用する物について、保守機材システム30に対して、保守機材手配通知Mを連絡する(ステップS17)。保守機材システムのオペレータは受信した連絡を元に、使用する保守機材がまだ保守対象システムの設置現場に配送されていない場合、配送する手続を行う(ステップS18)。
なお、ステップS11乃至ステップS18の処理は、暫定処理が終了する迄、必要な回数分繰り返し行っても良い。
[障害回復処理]
そして、保守対象システム7の設置現場に派遣された保守員Nの対応によって、保守対象システム7の故障が回復した場合(ステップS21)、保守対象システム7は故障復旧通知を監視システム10の監視サーバ11に送信する(ステップS22)。また、保守員Nは、解明した故障原因、対処方法等を監視システム10の監視サーバ11に保守員情報連絡として送信する(ステップS23)。監視サーバ11は、故障復旧通知を障害ログ15cに保存し、保守員情報連絡を監視員/保守員入力情報15bとして保存する。また、入力後、障害が復旧した障害ID15gに紐づけられた、ステップS2で蓄積されたアラーム・メッセージ15a、監視員/保守員入力情報15b及び障害ログ15cを、それぞれ過去のアラーム・メッセージ15dで、過去の障害ログ15e、及び過去の監視員/保守員入力情報15fに編入することで、ナレッジ情報の保存を行う(ステップS24)。
また、監視サーバ11は、故障復旧通知を受信して、保守員システム20に対して、障害復旧通知を連絡する(ステップS25)。連絡には、電子メールや、グループウェア等を使用する。保守員システム20のオペレータは受信した連絡を元に、既に手配されている保守員1〜N、Mのキャンセルを行う(ステップS26)。
また、監視サーバ11は、故障復旧通知を受信して、保守機材システム30に対して、故障復旧通知を連絡する(ステップS27)。保守機材システムのオペレータは受信した連絡を元に、既に手配予約されている及び、保守機器1〜N、Mのキャンセルを行う(ステップS28)。
以上のように、監視システム10は、保守対象システム7の故障発生から、故障回復までの一連の処理を行う。
以上のように、本発明によれば、保守対象システムに障害が発生した場合、障害情報による各種メッセージ、アラーム、障害ログと、監視員/保守員の入力情報によって、監視サーバは、過去の障害情報である各種メッセージ、アラーム、障害ログ及び過去の監視員/保守員入力情報から、障害復旧作業に必要なスキルを持つ最適な保守員及び、最適な保守機材を選出することができるので、保守員決定までの時間が短縮でき、早期の障害復旧を行うことができる。
また、監視サーバは、選出した保守員及び、保守機材を手配予約するために、保守員システム及び保守機材システムに自動的に手配の通知を行うので、初動までの時間が短縮でき、早期の障害復旧を行うことができる。
また、保守員が保守実行(暫定対処)時に、暫定対処中に判明した真の故障原因や新たに発生した故障解析の情報を監視サーバに送信する(監視サーバ用データベースに登録する)ことにより、監視サーバは、最新の情報に基づいて、故障回復のために更に手配予約の中から追加保守員及び追加保守機材を選出し、保守員システム及び保守機材システムに手配することができるために、追加保守員決定までの時間が短縮でき、障害復旧を早期に実現することができる。
また、障害回復の際には、障害回復の情報を監視サーバに送信する(監視サーバ用データベースに登録する)ことにより、監視サーバは、保守員システム及び保守機材システムに対して、保守員及び保守機材の手配をキャンセルする通知するので、障害復旧後の後処理を効率よく行うことができる。
また、保守対象システムに障害が発生した場合、障害情報による各種メッセージ、アラームと、障害ログと、監視員/保守員の入力情報を、ナレッジ情報として監視サーバ用データベースに蓄積することで、このナレッジ情報を使用することで、精度の高い最適な保守員及び、最適な保守機材を選出することができる。
この発明は、その本質的特性から逸脱することなく数多くの形式のものとして具体化することができる。よって、上述した実施形態は専ら説明上のものであり、本発明を制限するものではないことは言うまでもない。
1 コンピュータシステム
2 通信ネットワーク
4 コンピュータ
5 周辺機器
6 通信機器
7 保守対象システム
10 監視システム
11 監視サーバ
12 監視端末
14 監視サーバ用データベース
15 障害分析テーブル
15a アラーム・メッセージ
15b 保守員入力情報
15c 障害ログ
15d アラーム・メッセージ
15e 障害ログ
15f 保守員入力情報
15g 障害ID
16 障害情報テーブル
16a 障害ID
16b 保守員スキル
16c 保守機材
17 保守員テーブル
17a 保守員スキル
17b 保守員連絡先
18 部材テーブル
18a 保守機材
18b 機材手配先
20 保守員システム
30 保守機材システム

Claims (4)

  1. 監視サーバと、監視サーバ用データベースを有する故障監視システムにおいて、
    監視サーバ用データベースは、過去の故障ログ及び過去の監視員/保守員の入力情報からなる障害分析テーブルを有し、
    前記監視サーバは、故障発生時の保守対象システムから送信されてくる故障ログと、監視員/保守員からの入力情報を検索キーとして前記障害分析テーブルを検索し、障害解析に必要と推定される複数の保守員及び/又は複数の保守機材を決定し、
    前記決定した保守員を、当該保守員を管理する保守員システムに手配予約をする通知を行い、及び/又は前記決定した保守機材を、当該保守機材を管理する保守機材システムに手配予約をする通知を行ない、
    前記監視サーバは、前記監視員/保守員が故障対応中の対応状況によって適時入力する最新の入力情報を検索キーとして前記障害分析テーブルを検索し、必要に応じて前記手配予約した前記複数の保守員及び/又は前記複数の保守機材の中から、追加保守員及び/又は追加保守機材を決定し、
    前記決定した追加保守員及び/又は前記追加保守機材を前記保守員システム及び/又は前記保守機材システムに手配をする通知を行うこと
    を特徴とする故障監視システム。
  2. 前記監視サーバは、前記手配予約した前記複数の保守員及び/又は前記複数の保守機材の中から、前記追加保守員及び/又は前記追加保守機材の決定と、前記追加保守員及び/又は追加保守機材を前記保守員システム及び/又は前記保守機材システムに手配をする通知を、前記保守対象システムから故障復旧通知が送信されるまで繰り返すこと
    を特徴とする請求項1に記載の故障監視システム。
  3. 前記監視サーバは、前記保守対象システムから前記故障復旧通知が送信された場合、手配済みの前記追加保守員及び/又は前記追加保守機材のキャンセルを決定し、前記手配済みの追加保守員及び/又は前記手配済みの追加保守機材のキャンセルを前記保守員システム及び/又は前記保守機材システムに通知を行うこと
    を特徴とする請求項1又は請求項2に記載の故障監視システム。
  4. 前記監視サーバ用データベースの前記障害分析テーブルにおける、前記過去の故障ログ及び前記過去の監視員/保守員の前記入力情報は、ナレッジ情報であること、
    を特徴とする請求項1乃至請求項3のうち、何れか1に記載の故障監視システム。
JP2013075252A 2013-03-29 2013-03-29 故障監視システム Pending JP2014199618A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013075252A JP2014199618A (ja) 2013-03-29 2013-03-29 故障監視システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013075252A JP2014199618A (ja) 2013-03-29 2013-03-29 故障監視システム

Publications (1)

Publication Number Publication Date
JP2014199618A true JP2014199618A (ja) 2014-10-23

Family

ID=52356453

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013075252A Pending JP2014199618A (ja) 2013-03-29 2013-03-29 故障監視システム

Country Status (1)

Country Link
JP (1) JP2014199618A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107209511A (zh) * 2015-02-24 2017-09-26 东芝三菱电机产业***株式会社 监视控制装置
WO2017175378A1 (ja) * 2016-04-08 2017-10-12 三菱電機株式会社 情報処理装置、情報処理方法及び情報処理プログラム
WO2019116485A1 (ja) * 2017-12-14 2019-06-20 三菱電機ビルテクノサービス株式会社 設備管理用ローカルサーバ及び代行管理用センターサーバ
JP2019128754A (ja) * 2018-01-24 2019-08-01 三菱電機ビルテクノサービス株式会社 不具合対応システム
KR20200034472A (ko) * 2018-09-21 2020-03-31 대우조선해양 주식회사 선박의 원격 유지 보수 방법

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107209511A (zh) * 2015-02-24 2017-09-26 东芝三菱电机产业***株式会社 监视控制装置
WO2017175378A1 (ja) * 2016-04-08 2017-10-12 三菱電機株式会社 情報処理装置、情報処理方法及び情報処理プログラム
JPWO2017175378A1 (ja) * 2016-04-08 2018-08-30 三菱電機株式会社 情報処理装置、情報処理方法及び情報処理プログラム
CN108885724A (zh) * 2016-04-08 2018-11-23 三菱电机株式会社 信息处理装置、信息处理方法和信息处理程序
CN108885724B (zh) * 2016-04-08 2022-02-25 三菱电机株式会社 信息处理装置、信息处理方法和计算机可读的记录介质
WO2019116485A1 (ja) * 2017-12-14 2019-06-20 三菱電機ビルテクノサービス株式会社 設備管理用ローカルサーバ及び代行管理用センターサーバ
JPWO2019116485A1 (ja) * 2017-12-14 2020-07-02 三菱電機ビルテクノサービス株式会社 設備管理用ローカルサーバ及び代行管理用センターサーバ
JP2019128754A (ja) * 2018-01-24 2019-08-01 三菱電機ビルテクノサービス株式会社 不具合対応システム
JP6994962B2 (ja) 2018-01-24 2022-01-14 三菱電機ビルテクノサービス株式会社 不具合対応システム
KR20200034472A (ko) * 2018-09-21 2020-03-31 대우조선해양 주식회사 선박의 원격 유지 보수 방법
KR102574935B1 (ko) * 2018-09-21 2023-09-05 한화오션 주식회사 선박의 원격 유지 보수 방법

Similar Documents

Publication Publication Date Title
JP4774929B2 (ja) 監視装置、監視システム
JP6837427B2 (ja) 昇降機故障診断システム
JP2014199618A (ja) 故障監視システム
US20090157455A1 (en) Instruction system and method for equipment problem solving
CN108764725A (zh) 基于历史维修记录的派单分类维修装置、***以及方法
CN108564280A (zh) 基于历史维修记录的派单分类维修装置
CN105549508B (zh) 一种基于信息合并的报警方法及装置
JP6812312B2 (ja) プラント支援評価システム及びプラント支援評価方法
US20140136258A1 (en) Pt2776
KR20120111376A (ko) 실시간 지능형 장비 유지보수 관리 시스템
CN109995558B (zh) 故障信息处理方法、装置、设备及存储介质
JP5121381B2 (ja) 保守・管理サービス支援システムにおける品質評価システム
JP2003108222A (ja) 設備管理システム
JP4842738B2 (ja) 障害管理支援システム及びその情報管理方法
KR20140028163A (ko) 산업용 로봇 관리 시스템
JP2018180801A (ja) 監視システム及び監視システムにおける情報端末装置
WO2020170807A1 (ja) アラーム制御装置及びアラーム制御方法
JP2007264907A (ja) 障害通報システム、障害通報方法及び障害通報プログラム
KR101639713B1 (ko) 정전 관리 시스템
JP2009093522A (ja) 保守・管理サービス支援システム
CN114693023A (zh) 一种设备点检***及其操作方法
JP2008134691A (ja) 保守管理システム
JP2003271238A (ja) リモートメンテナンス方法及びシステム
KR20170106616A (ko) 비상재난통신 관리시스템의 관리방안
JP2017182371A (ja) 故障予測装置、故障予測方法、及び故障予測プログラム