JP2014199618A - Fault monitoring system - Google Patents

Fault monitoring system Download PDF

Info

Publication number
JP2014199618A
JP2014199618A JP2013075252A JP2013075252A JP2014199618A JP 2014199618 A JP2014199618 A JP 2014199618A JP 2013075252 A JP2013075252 A JP 2013075252A JP 2013075252 A JP2013075252 A JP 2013075252A JP 2014199618 A JP2014199618 A JP 2014199618A
Authority
JP
Japan
Prior art keywords
maintenance
failure
equipment
monitoring
staff
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013075252A
Other languages
Japanese (ja)
Inventor
勝博 高橋
Katsuhiro Takahashi
勝博 高橋
智祐 畠山
Tomohiro Hatakeyama
智祐 畠山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Network and System Integration Corp
Original Assignee
NEC Network and System Integration Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Network and System Integration Corp filed Critical NEC Network and System Integration Corp
Priority to JP2013075252A priority Critical patent/JP2014199618A/en
Publication of JP2014199618A publication Critical patent/JP2014199618A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a fault monitoring system for achieving quick restoration of a system by successively and appropriately arranging manpower and equipment for restoration when a fault occurs in a maintenance monitoring job of a computer system.SOLUTION: When a fault occurs in a system to be maintained, a monitoring server selects and makes a reservation for optimum maintenance equipment and optimum maintenance persons having a skill required for fault recovery operations from input information of past fault logs and past guards/maintenance persons on the basis of input information of various kinds of messages, alarms, fault logs, and guards/maintenance persons by fault information. Further, the monitoring server selects additional maintenance persons and maintenance equipment from those reserved so as to be arranged for a maintenance person system and maintenance equipment system for the purpose of a failure recovery on the basis of the latest information by the maintenance persons transmitting information of a failure cause analysis to the monitoring server at the execution time of the maintenance (tentative counter measure). Thus, the time up to a decision of additional maintenance persons can be shortened, and the fault recovery can be achieved in an early stage.

Description

本発明は、コンピュータシステムの保守監視業務において、障害が発生した場合、復旧の為に逐次適切な人員及び機材を手配し、早急なシステムの復旧を実現する保守管理システムに関する。   The present invention relates to a maintenance management system that, when a failure occurs in a maintenance monitoring operation of a computer system, arranges appropriate personnel and equipment sequentially for recovery and realizes quick system recovery.

コンピュータシステムは、保守管理のため、管理センター等でオペレータの監視下、24時間体制で監視が行われている。コンピュータシステムに異常や故障が発した場合は、各種メッセージ、アラームがコンピュータシステムから管理センターの端末機に通知され、監視オペレータがこれらの内容を確認の後、コンピュータシステムを正常な状態に回復するために、保守員の手配等を行うのが一般的である。   The computer system is monitored 24 hours a day under the supervision of an operator at a management center or the like for maintenance management. When an abnormality or failure occurs in the computer system, various messages and alarms are notified from the computer system to the terminal in the management center, and after the monitoring operator confirms these contents, the computer system is restored to a normal state. In addition, it is common to arrange maintenance personnel.

特許文献1には、第1のサーバ装置が、保守卓から通知される故障と警報に対して対応する保守・復旧のシナリオをデータとして予め、記憶装置に記憶されており、前記保守卓から故障又は警報の通知を受けると、前記故障又は警報に対応したシナリオを決定し、前記シナリオの規定に基づき、前記第2のサーバ装置及び/又は前記第3のサーバ装置に対応を指示し、前記第2のサーバ装置は、前記第1のサーバ装置からの指示を受けると、前記指示に基づき、電話又はメールにて保守に必要な要員の手配を行う手段を備え、前記第3のサーバ装置は、前記第1のサーバ装置からの指示を受けると、前記指示に基づき、保守で必要な部品の在庫の問い合わせと取り出し、さらに、前記部品の発注が必要と判断した場合、前記部品の発注を行う手段を備えた保守システムについて開示されている。   In Patent Document 1, the first server device stores in advance a storage / recovery scenario corresponding to a failure and an alarm notified from the maintenance console as data. Alternatively, upon receiving a notification of an alarm, a scenario corresponding to the failure or the alarm is determined, and based on the definition of the scenario, the second server device and / or the third server device is instructed to respond, and the first When receiving the instruction from the first server apparatus, the second server apparatus includes means for arranging personnel necessary for maintenance by telephone or mail based on the instruction, and the third server apparatus includes: Upon receiving an instruction from the first server device, based on the instruction, inquires and retrieves the inventory of parts necessary for maintenance, and further orders the parts when it is determined that the parts need to be ordered. It discloses a maintenance system including a stage.

特開2012−129674号公報JP 2012-129664 A

しかしながら、コンピュータシステムは様々な複数の機器から構成され、特にコンピュータシステムの規模が大きい場合には、一箇所の故障が原因となって、様々な箇所へ影響を及ぼし、その結果、根本原因となる故障箇所以外からも、各種の障害情報が通知され、故障原因の特定が非常に困難であった。また、障害状況によっては、一の故障を解消すると新たな障害が発生したりと、初期の要員(保守員)及び部品(保守機材)では故障の復旧が困難になり、新たな保守員及び保守機材が必要になる場合がある。このような場合、特許文献1のような、現在のシステムでは、根本原因となる故障の解消まで、継続的な対処方法についての対応が不十分である場合が多い。   However, the computer system is composed of various devices, and particularly when the scale of the computer system is large, a failure at one location causes various locations, resulting in a root cause. Various fault information was also notified from other than the fault location, and it was very difficult to identify the cause of the fault. In addition, depending on the failure status, if one failure is resolved, a new failure will occur, and it will be difficult for the initial personnel (maintenance personnel) and parts (maintenance equipment) to recover from the failure. Equipment may be required. In such a case, in the current system such as Patent Document 1, it is often insufficient to cope with a continuous countermeasure until the root cause of the failure is resolved.

そこで、本発明は、保守対象システムに障害が発生した場合、障害情報である各種メッセージ、アラームと、障害ログ、監視員/保守員の入力情報によって、監視サーバは、過去の各種メッセージ、アラーム、障害ログ及び過去の監視員/保守員入力情報から、例えば、一次的な保守実行(暫定対処)時に、根本的な故障原因を特定するのに必要なスキルを持つ最適な保守員及び、最適な保守機材を選出して手配すると共に、過去のナレッジ情報から必要と推定されるスキルを持つ最適な一又は複数の保守員及び、最適な一又は複数の保守機材を手配予約し、保守員が保守実行(暫定対処)時に、根本的な真の故障原因もしくは新たに判明した故障原因解析の情報を監視サーバに送信することにより、監視サーバは、最新の情報に基づいて、故障回復のために、更に追加保守員及び追加保守機材を選出し、保守員システム及び保守機材システムに手配する際、既に手配予約しているために、根本的な真の原因特定と、その対処のために必要な追加保守員および追加保守機材決定までの時間が短縮でき、障害復旧を早期に実現することができる監視システムを提供することを目的とする。   Therefore, when a failure occurs in the maintenance target system, the present invention enables the monitoring server to perform various past messages, alarms, alarms, and various messages and alarms that are failure information based on the failure log and input information of the monitoring personnel / maintenance personnel. From the failure log and past monitoring personnel / maintenance personnel input information, for example, the optimal maintenance personnel with the skills necessary to identify the root cause of the failure at the time of primary maintenance execution (provisional countermeasure) and the optimal Select and arrange maintenance equipment, and arrange and reserve the optimal maintenance personnel or personnel with skills estimated to be necessary from past knowledge information, and the optimal maintenance equipment or maintenance machinery, and maintenance personnel maintain During execution (provisional countermeasure), the monitoring server sends the information about the fundamental true failure cause or newly discovered failure cause analysis to the monitoring server. In order to recover from a failure, additional maintenance personnel and additional maintenance equipment are selected, and when making arrangements with the maintenance personnel system and maintenance equipment system, since the arrangement has already been reserved, the root cause is identified and the countermeasures are taken. It is an object of the present invention to provide a monitoring system that can shorten the time required to determine additional maintenance personnel and additional maintenance equipment necessary for the maintenance, and can realize failure recovery at an early stage.

本発明に係る故障監視システムは監視サーバと、監視サーバ用データベースを有する故障監視システムにおいて、監視サーバ用データベースは、過去の故障ログ及び過去の監視員/保守員の入力情報からなる障害分析テーブルを有し、前記監視サーバは、故障発生時の保守対象システムから送信されてくる故障ログと、監視員/保守員からの入力情報を検索キーとして前記障害分析テーブルを検索し、障害解析に必要と推定される複数の保守員及び/又は複数の保守機材を決定し、前記決定した保守員を、当該保守員を管理する保守員システムに手配予約をする通知を行い、及び/又は前記決定した保守機材を、当該保守機材を管理する保守機材システムに手配予約をする通知を行ない、前記監視サーバは、前記監視員/保守員が故障対応中の対応状況によって適時入力する最新の入力情報を検索キーとして前記障害分析テーブルを検索し、必要に応じて前記手配予約した前記複数の保守員及び/又は前記複数の保守機材の中から、追加保守員及び/又は追加保守機材を決定し、前記決定した追加保守員及び/又は前記追加保守機材を前記保守員システム及び/又は前記保守機材システムに手配をする通知を行うことを特徴とする。   The failure monitoring system according to the present invention is a failure monitoring system having a monitoring server and a monitoring server database. The monitoring server database includes a failure analysis table including past failure logs and past monitor / maintenance person input information. The monitoring server searches the failure analysis table using the failure log transmitted from the maintenance target system at the time of the failure and the input information from the monitoring personnel / maintenance personnel as a search key, and is necessary for failure analysis. A plurality of estimated maintenance personnel and / or a plurality of maintenance equipments are determined, the determined maintenance personnel are notified to make arrangement reservations to a maintenance personnel system that manages the maintenance personnel, and / or the determined maintenance is performed. Notification is made to arrange and reserve the equipment to the maintenance equipment system that manages the maintenance equipment, and the monitoring server is in trouble with the monitoring staff / maintenance staff The failure analysis table is searched using the latest input information input in a timely manner according to the response status as a search key, and an additional maintenance worker is selected from the plurality of maintenance personnel and / or the plurality of maintenance equipments reserved as necessary. And / or determining additional maintenance equipment, and notifying the determined additional maintenance staff and / or the additional maintenance equipment to the maintenance staff system and / or the maintenance equipment system.

本発明に係る故障監視システムに係る前記監視サーバは、前記手配予約した前記複数の保守員及び/又は前記複数の保守機材の中から、前記追加保守員及び/又は前記追加保守機材の決定と、前記追加保守員及び/又は追加保守機材を前記保守員システム及び/又は前記保守機材システムに手配をする通知を、前記保守対象システムから故障復旧通知が送信されるまで繰り返すことを特徴とする。   The monitoring server according to the failure monitoring system according to the present invention is configured to determine the additional maintenance staff and / or the additional maintenance equipment from among the plurality of maintenance staff and / or the plurality of maintenance equipment reserved for arrangement. The notification of arranging the additional maintenance staff and / or the additional maintenance equipment to the maintenance staff system and / or the maintenance equipment system is repeated until a failure recovery notice is transmitted from the maintenance target system.

本発明に係る故障監視システムに係る前記監視サーバは、前記保守対象システムから前記故障復旧通知が送信された場合、手配済みの前記追加保守員及び/又は前記追加保守機材のキャンセルを決定し、前記手配済みの追加保守員及び/又は前記手配済みの追加保守機材のキャンセルを前記保守員システム及び/又は前記保守機材システムに通知を行うことを特徴とする。   When the failure recovery notification is transmitted from the maintenance target system, the monitoring server according to the failure monitoring system according to the present invention determines to cancel the arranged additional maintenance staff and / or the additional maintenance equipment, The maintenance staff system and / or the maintenance equipment system is notified of cancellation of the arranged additional maintenance staff and / or the arranged additional maintenance equipment.

本発明に係る故障監視システムに係る、前記監視サーバ用データベースの前記障害分析テーブルにおける、前記過去の故障ログ及び前記過去の監視員/保守員の前記入力情報は、ナレッジ情報であること、を特徴とする。   In the failure analysis table of the monitoring server database according to the failure monitoring system of the present invention, the past failure log and the input information of the past monitor / maintenance personnel are knowledge information. And

本発明によれば、保守対象システムに障害が発生した場合、障害情報による各種メッセージ、アラーム、障害ログと、監視員/保守員の入力情報によって、監視サーバは、過去の障害情報である各種メッセージ、アラーム、障害ログ及び過去の監視員/保守員入力情報から、障害復旧作業に必要なスキルを持つ最適な保守員及び、最適な保守機材を選出することができるので、保守員および保守機材決定までの時間が短縮でき、早期の障害復旧を行うことができる。   According to the present invention, when a failure occurs in the maintenance target system, the monitoring server uses the various messages based on the failure information, the alarm, the failure log, and the input information of the monitoring personnel / maintenance personnel to display various messages that are past failure information. From the alarm, failure log, and past monitor / maintenance worker input information, it is possible to select the most suitable maintenance personnel and the most appropriate maintenance equipment with skills necessary for failure recovery work. Can be shortened, and early failure recovery can be performed.

また、監視サーバは、選出した保守員及び、保守機材を手配するために、保守員システム及び保守機材システムに自動的に手配の通知を行うので、初動までの時間が短縮でき、早期の障害復旧を行うことができる。   In addition, the monitoring server automatically notifies the maintenance personnel system and the maintenance equipment system to arrange the selected maintenance personnel and maintenance equipment, so the time until the first action can be shortened and early failure recovery is possible. It can be performed.

また、監視サーバは、障害解析に必要と推定される保守員及び、保守機材を手配予約するため、保守員が保守実行(暫定対処)時に、暫定対処中に判明した真の故障原因や新たに発生した故障解析の情報を監視サーバに送信する(監視サーバ用データベースに登録する)ことにより、監視サーバは、最新の情報に基づいて、故障回復のために更に追加保守員及び追加保守機材を選出し、手配予約に基づいて保守員システム及び保守機材システムに手配することができるために、追加保守員決定及び保守機材の搬入までの時間が短縮でき、障害復旧を早期に実現することができる。   In addition, since the monitoring server arranges and reserves maintenance personnel and maintenance equipment that are estimated to be necessary for failure analysis, when the maintenance personnel perform maintenance (provisional countermeasures), the true cause of failure or new By sending the information of the failure analysis that has occurred to the monitoring server (registering it in the monitoring server database), the monitoring server selects additional maintenance personnel and additional maintenance equipment for failure recovery based on the latest information. In addition, since it is possible to make arrangements for the maintenance staff system and the maintenance equipment system based on the arrangement reservation, it is possible to shorten the time until the determination of the additional maintenance staff and the delivery of the maintenance equipment, and the failure recovery can be realized at an early stage.

また、障害回復の際には、障害回復の情報を監視サーバに送信する(監視サーバ用データベースに登録する)ことにより、監視サーバは、保守員システム及び保守機材システムに対して、保守員及び保守機材の手配予約をキャンセルする通知をするので、障害復旧後の後処理を効率よく行うことができる。   In the event of failure recovery, the monitoring server sends maintenance information to the monitoring server (registers it in the monitoring server database), so that the monitoring server can perform maintenance and maintenance for the maintenance personnel system and maintenance equipment system. Since the notification of canceling the equipment arrangement reservation is made, post-processing after the failure recovery can be performed efficiently.

また、保守対象システムに障害が発生した場合、障害情報による各種メッセージ、アラームと、障害ログと、及び監視員/保守員の入力情報を、ナレッジ情報として監視サーバ用データベースに蓄積することで、このナレッジ情報を使用することで、精度の高い最適な保守員及び、最適な保守機材を選出することができる。   In addition, when a failure occurs in the maintenance target system, various messages, alarms, failure logs, and monitoring / maintenance personnel input information based on the failure information are stored in the monitoring server database as knowledge information. By using the knowledge information, it is possible to select the optimum maintenance staff with high accuracy and the optimum maintenance equipment.

本発明の故障監視システムの全体を示す、システム概要図である。It is a system outline figure showing the whole failure monitoring system of the present invention. 本発明の故障監視システムに係るデータベースのテーブル構成図である。It is a table | surface block diagram of the database which concerns on the failure monitoring system of this invention. 本発明の故障監視システムのシーケンス図である。It is a sequence diagram of the failure monitoring system of the present invention.

[故障監視システムの構成]
以下、図面1及び図2を用いて、本発明の故障監視システムの構成について説明する。
[Fault monitoring system configuration]
Hereinafter, the configuration of the failure monitoring system of the present invention will be described with reference to FIGS. 1 and 2.

図1は本発明の概要を示す、システム概要図である。図2は、本発明のデータベースのテーブル構成図である。図3は、本発明のシーケンス図である。   FIG. 1 is a system outline diagram showing an outline of the present invention. FIG. 2 is a table configuration diagram of the database of the present invention. FIG. 3 is a sequence diagram of the present invention.

図1に示すように、コンピュータシステム1は、通信ネットワーク2、コンピュータ4、周辺機器5、通信機器6、監視システム10、保守員システム20、及び保守機材システム30からなる。   As shown in FIG. 1, the computer system 1 includes a communication network 2, a computer 4, a peripheral device 5, a communication device 6, a monitoring system 10, a maintenance staff system 20, and a maintenance equipment system 30.

通信ネットワーク2はインターネットを用いても良いが、社内LAN(Local Area Network)や外部と独立したスタンドアロン式のネットワークでも利用可能である。独立したネットワークは機密性が高く、外部からの侵入、又は情報の漏洩や破壊等を防止することができるからである。   The communication network 2 may use the Internet, but can also be used as an in-house LAN (Local Area Network) or a stand-alone network independent of the outside. This is because an independent network has high confidentiality and can prevent intrusion from outside or leakage or destruction of information.

コンピュータ4は、監視の対象となる一又は複数のコンピュータである。通信ネットワーク2に接続され、搭載したソフトウェア、ハードウェアの状態を定期的にチェックし、その状態の情報を監視システム10に送信したり、何らかの障害/不具合が生じた場合、障害/不具合情報に関するエラーコードや障害情報等を、各種メッセージやアラームに付して、監視システム10に送信するための状態監視用ソフトウェア(図示せず)を搭載している。   The computer 4 is one or a plurality of computers to be monitored. The status of the installed software and hardware connected to the communication network 2 is checked periodically, and information on the status is sent to the monitoring system 10 or if any failure / failure occurs, an error related to the failure / failure information It includes state monitoring software (not shown) for sending codes, fault information, etc. to the monitoring system 10 with various messages and alarms.

周辺機器5はコンピュータ4に接続されている一又は複数の外部接続用周辺機器、例えば、ハードディスク、プリンタ等の機器である、これらの機器も、何らかの障害/不具合が生じた場合に、障害/不具合情報に関するエラーコードや障害情報等を、各種メッセージやアラームに付して、監視システム10に送信する。   The peripheral device 5 is one or a plurality of external connection peripheral devices connected to the computer 4, for example, devices such as a hard disk, a printer, etc. These devices also have a failure / failure when some failure / failure occurs. An error code or failure information related to the information is attached to various messages and alarms and transmitted to the monitoring system 10.

通信機器6は、通信ネットワーク2〜コンピュータ4間や、コンピュータ4〜コンピュータ4間の通信接続のために設置される、例えば、一又は複数のHUB、ルーター等の機器である。これらの通信機器6は、コンピュータ4を介さずに、何らかの障害/不具合が生じた場合に、障害/不具合情報に関するエラーコードや障害情報等を、各種メッセージやアラームに付して、監視システム10に送信する。   The communication device 6 is a device such as one or a plurality of HUBs or routers installed for communication connection between the communication network 2 and the computer 4 or between the computer 4 and the computer 4. These communication devices 6 attach error codes, failure information, etc. relating to failure / failure information to various messages and alarms to the monitoring system 10 when any failure / failure occurs without going through the computer 4. Send.

以下、コンピュータ4、周辺機器5及び通信機器6から構成される一連のシステムを称して、保守対象システム7と呼称する。   Hereinafter, a series of systems including the computer 4, the peripheral device 5, and the communication device 6 are referred to as a maintenance target system 7.

監視システム10は、監視サーバ11と、一又は複数の監視端末12と、監視サーバ用データベース14等を有する。   The monitoring system 10 includes a monitoring server 11, one or a plurality of monitoring terminals 12, a monitoring server database 14, and the like.

監視サーバ11は通信ネットワーク2を通じて、保守対象システム7を監視する機能、また、各種メッセージやアラームに付して送られてくる障害/不具合情報に関するエラーコードや障害情報等を受信する機能、前記受信した情報を検索キーとして、監視サーバ用データベース14を検索する機能、前記検索結果から保守に必要な保守員及び保守機材を選出する機能、選出した保守員システム及び/又は保守機材システムに必要な保守員及び保守機材の手配する機能を有する。   The monitoring server 11 has a function of monitoring the maintenance target system 7 through the communication network 2 and a function of receiving error codes and failure information relating to failure / failure information sent with various messages and alarms. A function for searching the monitoring server database 14 using the information obtained as a search key, a function for selecting maintenance personnel and maintenance equipment necessary for maintenance from the search results, a maintenance required for the selected maintenance staff system and / or maintenance equipment system It has a function to arrange personnel and maintenance equipment.

監視端末12は、監視サーバ11で処理する情報を表示し、また、監視サーバ11に対する操作を入力する端末機である。一又は複数の監視員は監視端末12を使用し、これらの監視サーバ11の処理状況を確認することで、24時間又は定められた期間内において、保守対象システム7の監視を行う。   The monitoring terminal 12 is a terminal that displays information to be processed by the monitoring server 11 and inputs an operation on the monitoring server 11. One or a plurality of monitoring personnel use the monitoring terminal 12 to check the processing status of these monitoring servers 11 to monitor the maintenance target system 7 within 24 hours or a predetermined period.

監視サーバ用データベース14は、データベーステーブル15乃至18を有し、過去に発生した保守対象システム7の過去のアラーム、メッセージ、過去の障害ログ及び過去の監視員/保守員入力情報(ナレッジ情報)、故障対処方法、保守員のスキル、保守機材等の情報を格納している。監視サーバ11は、保守対象システム7から送信されてくる最新情報をキーとして、データベーステーブル15乃至18の検索を実行し、最適な故障の対象方法、必要な保守員、保守機材を検出する。   The monitoring server database 14 includes database tables 15 to 18, and includes past alarms, messages, past failure logs, past monitoring staff / maintenance staff input information (knowledge information) of the maintenance target system 7 that occurred in the past, Stores information such as troubleshooting methods, maintenance staff skills, and maintenance equipment. The monitoring server 11 searches the database tables 15 to 18 using the latest information transmitted from the maintenance target system 7 as a key, and detects an optimal failure target method, necessary maintenance personnel, and maintenance equipment.

ここでナレッジとは、障害/不具合情報等の単なる情報やデータではなく、何らかの対象についての体系立った知識や、目的の解決に直接役立つような見識、ノウハウや経験則といった暗黙の値を、言語化・数値化により、可視化するようにしたものである。本発明では、過去のアラーム、メッセージ、過去の障害ログ及び過去の監視員/保守員入力情報をナレッジ情報と称する。   Here, knowledge is not just information or data such as failure / fault information, but systematic knowledge about some target, insights that are directly useful for solving the purpose, know-how and rules of thumb, etc. Visualization is realized by digitization and digitization. In the present invention, past alarms, messages, past failure logs, and past supervisor / maintenance worker input information are referred to as knowledge information.

障害分析テーブル15は検索キー(入力情報)として各種のアラーム・メッセージ15a、監視員/保守員入力情報15b、障害ログ15cを有し、前記入力情報を検索キーとし、保守対象システム7の機器が保有する、ナレッジ情報として過去の障害ログ15e、過去の監視員/保守員入力情報15f、及び出力情報として障害ID15gを有しており、障害が発生した場合の状況の把握及び、原因の究明のために使用されるデータを入力、及び検索するためのテーブルである。   The failure analysis table 15 has various alarm messages 15a, monitor / maintenance worker input information 15b, and failure log 15c as search keys (input information). It has the past failure log 15e as knowledge information, past monitor / maintenance worker input information 15f, and failure ID 15g as output information, and grasps the situation when a failure occurs and investigates the cause It is a table for inputting and retrieving data used for the purpose.

アラーム・メッセージ15aは保守対象システム7から送信されてくる故障発生中の故障情報を、収集してデータベースに格納した各種アラーム、メッセージ情報の蓄積である。   The alarm message 15a is an accumulation of various alarm and message information collected from the failure information transmitted during the failure transmission sent from the maintenance target system 7 and stored in the database.

監視員/保守員入力情報15bは、監視端末12に表示された発生中の障害/不具合情報に関するエラーコードや障害情報等や、監視者又は保守員のノウハウや経験側による見解を入力した物である。   The monitoring person / maintenance person input information 15b is an input of an error code or trouble information related to the trouble / fault information being displayed displayed on the monitoring terminal 12, and the know-how of the monitoring person or the maintenance person and the opinions of the experience side. is there.

障害ログ15cは保守対象システム7から送信されてくる故障発生中の故障情報や、監視員/保守員が障害対応を実施した際に収集して、データベースに格納したログ情報の蓄積である。   The failure log 15c is an accumulation of failure information during failure occurrence transmitted from the maintenance target system 7, and log information that is collected and stored in the database when the monitoring staff / maintenance personnel implements the failure handling.

過去のアラーム・メッセージ15d、過去の障害ログ15eは、既に故障状態からの復旧が完了した障害に係る各種アラーム・メッセージ、及びログの蓄積である。過去の監視員/保守員入力情報15fもまた、既に故障状態からの復旧が終了している、障害に係る監視員/保守員入力情報の過去情報の蓄積である。   The past alarm message 15d and the past failure log 15e are accumulations of various alarm messages and logs related to failures that have already been recovered from the failure state. The past monitoring staff / maintenance staff input information 15f is also an accumulation of past information of monitoring staff / maintenance staff input information related to a fault that has already been recovered from the failure state.

新たに保守対象システムに障害が発生した場合の入力情報としての各種アラームやメッセージ15a、監視員/保守員入力情報15b、及び障害ログ15cは、障害復旧後、過去のアラーム・メッセージ15d、過去の障害ログ15e、及び過去の監視員/保守員入力情報15fとなって蓄積されていくため、保守対象システム7の障害復旧を実施するたびに、ナレッジ情報が蓄積され、次に障害が発生した場合の保守員及び保守機材の選出の精度が向上していくこととなる。   Various alarms and messages 15a as input information when a failure newly occurs in the maintenance target system, monitor / maintenance worker input information 15b, and failure log 15c are stored in the past alarm message 15d, past Since the failure log 15e and the past monitor / maintenance worker input information 15f are accumulated, knowledge information is accumulated every time the failure recovery of the maintenance target system 7 is performed, and the next failure occurs The accuracy of selecting maintenance personnel and maintenance equipment will be improved.

障害ID15gは、発生した障害毎に付与される整理番号である。   The failure ID 15g is a reference number assigned to each failure that has occurred.

障害処理テーブル16は、監視サーバ用データベース14の検索キーとして、障害ID16a、出力情報として、保守員スキル16b、及び保守機材16cを有している。発生中の障害を復旧させるための保守員及び保守機材の選出に使用するテーブルである。障害ID16aは、発生した障害毎に付与される整理番号であり、障害ID15eと同一の番号である。   The failure processing table 16 has a failure ID 16a as a search key of the monitoring server database 14, and maintenance personnel skills 16b and maintenance equipment 16c as output information. It is a table used for selecting maintenance personnel and maintenance equipment for recovering a failure that has occurred. The failure ID 16a is a serial number assigned to each failure that has occurred, and is the same number as the failure ID 15e.

保守員スキル16bは、障害ID16aを付与された障害を復旧するために必要な保守員の有するスキルについて、ナレッジ情報をもとに、監視サーバ11が判断した結果の値である。監視員が値を設定するようにしても良い。保守機材16cは、障害を復旧するために必要な機材を、ナレッジ情報をもとに、監視サーバ11が判断した値である。   The maintenance worker skill 16b is a value obtained as a result of the monitoring server 11 determining, based on the knowledge information, the skill of the maintenance worker necessary for recovering the failure given the failure ID 16a. The monitor may set the value. The maintenance equipment 16c is a value determined by the monitoring server 11 based on the knowledge information about the equipment necessary to recover from the failure.

保守員テーブルは、監視サーバ用データベース14の検索キーとして、保守員スキル17a及び、出力情報として、保守員連絡先17bを有する。保守員個々が取得している故障復旧のためのスキルと、その保守員の連絡先を記録した値である。   The maintenance staff table has maintenance staff skills 17a as search keys of the monitoring server database 14 and maintenance staff contact information 17b as output information. This is a value that records the failure recovery skills acquired by individual maintenance personnel and the contact information of the maintenance personnel.

部材テーブルは、監視サーバ用データベース14の検索キーとして、保守機材18a及び、出力情報として、機材手配先18bを有する。保守員が故障復旧のために使用する機材の情報(名称、型番等)と、その保管先を記録した値である。   The member table has a maintenance equipment 18a as a search key of the monitoring server database 14 and an equipment arrangement destination 18b as output information. This is a value in which information (name, model number, etc.) of the equipment used by the maintenance staff for failure recovery and the storage location are recorded.

[故障監視システムの動作概要]
次に、図3を用いて、本故障監視システムの動作概要を説明する。図3は、本故障監視システムに係るシーケンス図である。
[Operation overview of the fault monitoring system]
Next, an outline of the operation of the fault monitoring system will be described with reference to FIG. FIG. 3 is a sequence diagram according to the fault monitoring system.

[障害発生時]
まず、保守対象システム7で障害が発生した場合(ステップS1)、故障の障害情報(1〜N)が、保守対象システム7から監視システム10の監視サーバ11に送信され(ステップS2)、又は監視端末機12を操作する監視者が、定期的に送信され又は保守対象システム7に保存する各種ログ情報の中から、異常を発見しても良い。障害情報は1機器からのみならず、1つの真の原因に起因して、複数の機器から同時に複数(1〜N個)送信される。また、1回のみならず、発生頻度に応じて複数回(1〜N回)送信される場合もある。監視サーバ11は、受信した障害情報に障害ID15gを付与し、障害ID15gに紐づけて各種アラームやメッセージ15a、障害ログ15c、監視員/保守員入力情報15bに振り分けて一時的に蓄積又は監視サーバ用データベース14の障害分析テーブル15に保存する。
[When an error occurs]
First, when a failure occurs in the maintenance target system 7 (step S1), failure information (1 to N) of failure is transmitted from the maintenance target system 7 to the monitoring server 11 of the monitoring system 10 (step S2) or monitored. A supervisor who operates the terminal 12 may find an abnormality from various log information that is periodically transmitted or stored in the maintenance target system 7. Failure information is transmitted not only from one device but also from a plurality of devices (1 to N) simultaneously due to one true cause. Moreover, it may be transmitted not only once but a plurality of times (1 to N times) according to the occurrence frequency. The monitoring server 11 assigns a failure ID 15g to the received failure information, associates it with the failure ID 15g, sorts it into various alarms and messages 15a, a failure log 15c, and monitoring / maintenance personnel input information 15b, and temporarily stores or monitors it. And stored in the failure analysis table 15 of the database 14 for use.

次に、監視サーバ11は、受信した各種アラーム・メッセージ15a及び監視員/保守員入力情報15b、障害ログ15cを検索キーとして、ナレッジ情報の過去の障害ログ15e、及び過去の監視員/保守員入力情報15fを検索し、過去に今回と同一又は類似の障害が発生していたか否かを検索する(ステップS3)。検索結果には、障害の類似度を表示するようにしても良い。   Next, the monitoring server 11 uses the received various alarm messages 15a, monitoring person / maintenance person input information 15b, and the trouble log 15c as search keys, the past trouble log 15e of knowledge information, and the past monitoring person / maintenance person. The input information 15f is searched, and it is searched whether or not the same or similar failure has occurred in the past (step S3). You may make it display the similarity of a failure in a search result.

監視サーバ11は、検索結果を基に、発生した障害の最適な対処を行うべく、当該障害対応に必要な保守員及び保守機材を選出する。選出には、監視サーバ用データベース14のナレッジ情報の検索結果を用いて、当該障害に対応可能な保守員スキルと、特に真の障害原因が特定されていない場合には、障害復旧に必要と推定される複数の保守機材を決定する。次に、決定した保守員スキルを検索キーとして、保守員テーブル17を検索し、所望の保守員スキルを有する保守員を選出し、その保守員の氏名及び連絡先を取得する。また、決定した保守機材を検索キーとして部材テーブル18を検索し、保守対象システム7の障害復旧に使用する保守機材の機材手配先を取得する(ステップS4)。   Based on the search result, the monitoring server 11 selects maintenance personnel and maintenance equipment necessary for handling the failure in order to optimally handle the failure that has occurred. For the selection, using the search result of the knowledge information in the monitoring server database 14, it is estimated that maintenance personnel skills capable of dealing with the failure and especially the cause of the failure are not necessary for the failure recovery. Determine the maintenance equipment to be used. Next, the maintenance engineer table 17 is searched using the determined maintenance engineer skill as a search key, a maintenance engineer having a desired maintenance engineer skill is selected, and the name and contact information of the maintenance engineer are acquired. Further, the member table 18 is searched using the determined maintenance equipment as a search key, and the equipment arrangement destination of the maintenance equipment used for the failure recovery of the maintenance target system 7 is acquired (step S4).

次に監視サーバ11は、取得した保守員の氏名及び連絡先から、保守員システム20に対して、必要と推定される複数の保守員の全てについて、障害復旧に出動の予約をする手配(手配予約)として保守員手配通知を連絡する(ステップS5)。連絡には、電子メールや、グループウェア等を使用する。連絡は、監視サーバ11が自動的に行う、又は、監視員の確認の後に行うようにしても良い。保守員システム20の監視員(オペレータ)は受信した連絡を元に、選出された保守員を、保守対象システム7の設置現場に派遣する手続を行う(ステップS6)。   Next, the monitoring server 11 makes arrangements for making reservations for dispatching for failure recovery for all of the plurality of maintenance personnel estimated to be necessary to the maintenance personnel system 20 from the name and contact information of the acquired maintenance personnel. As a reservation, a maintenance staff arrangement notice is notified (step S5). For communication, e-mail or groupware is used. The contact may be made automatically by the monitoring server 11 or after confirmation by the supervisor. The supervisor (operator) of the maintenance staff system 20 performs a procedure of dispatching the selected maintenance staff to the installation site of the maintenance target system 7 based on the received communication (step S6).

また、監視サーバは、取得した保守機材の機材手配先から、保守機材システムに対して、必要と推定される複数の保守機材の全てについて、障害復旧に出動の予約をする手配(手配予約)として保守機材手配通知を連絡する(ステップS7)。保守機材システムのオペレータは受信した連絡を元に、選出された保守機材を、保守対象システムの設置現場に配送する手続を行う(ステップS8)。   In addition, the monitoring server provides an arrangement (arrangement reservation) for making reservations for dispatching all of the multiple maintenance equipment estimated to be necessary for the maintenance equipment system from the equipment arrangement destination for the acquired maintenance equipment. A maintenance equipment arrangement notice is notified (step S7). The operator of the maintenance equipment system performs a procedure for delivering the selected maintenance equipment to the installation site of the maintenance target system based on the received communication (step S8).

なお、ステップS1乃至ステップS8の処理は、必要な回数分(1〜N回)繰り返し行っても良い。   In addition, you may repeat the process of step S1 thru | or step S8 as many times as necessary (1-N times).

[障害対処実施中]
次に、保守対象システム7の設置現場に派遣された保守員Mが保守対象システム7の故障対処として、真の故障箇所の原因特定や、暫定対処を行う(ステップS11)。保守員Mは、前記対処において解明した真の故障原因および新たに判明した故障原因を監視システム10の監視サーバ11に原因解析連絡として送信する(ステップS12)。
[Under troubleshooting]
Next, the maintenance worker M dispatched to the installation site of the maintenance target system 7 specifies the cause of the true failure and makes provisional countermeasures as a countermeasure for the maintenance target system 7 (step S11). The maintenance worker M transmits the true cause of failure and the newly found cause of failure as revealed in the above countermeasure to the monitoring server 11 of the monitoring system 10 as cause analysis communication (step S12).

監視サーバ11は、当該原因解析連絡の内容を検索キーとして、ナレッジ情報の過去のアラーム・メッセージ15d、過去の障害ログ15e、及び過去の監視員/保守員入力情報15fを検索し、過去に今回と同一又は類似の障害が発生していたか、暫定対処が行われていたか、否かを検索する(ステップS13)。検索結果には、障害の類似度を表示するようにしても良い。   The monitoring server 11 searches the past alarm message 15d of the knowledge information, the past failure log 15e, and the past monitor / maintenance worker input information 15f using the content of the cause analysis report as a search key. It is searched whether or not the same or similar failure has occurred or provisional countermeasures have been taken (step S13). You may make it display the similarity of a failure in a search result.

監視サーバ11は、検索結果を基に、対処中の障害に対して次の回復手段の対処を行うべく、保守員M及び保守機材Mに続いて当該障害対応に必要な追加保守員及び追加保守機材を選出する。選出には、監視サーバ用データベース14のナレッジ情報の検索結果を用いて、当該障害に対応可能な保守員スキルと、保守機材を決定する。次に、決定した保守員スキルを検索キーとして、保守員テーブル17を検索し、ステップS5で手配予約された保守員の中から、所望の保守員スキルを有する次の保守作業に係る追加保守員を選出し、その追加保守員の氏名及び連絡先を取得する。(ステップS14)。   Based on the search result, the monitoring server 11 follows the maintenance staff M and the maintenance equipment M and additional maintenance personnel and additional maintenance necessary for handling the failure in order to deal with the next recovery means for the failure being handled. Select equipment. For the selection, maintenance staff skills and maintenance equipment that can cope with the failure are determined using the search result of the knowledge information in the monitoring server database 14. Next, the maintenance staff table 17 is searched using the determined maintenance staff skill as a search key, and the additional maintenance staff for the next maintenance work having the desired maintenance staff skill is selected from the maintenance staff arranged and reserved in step S5. And obtain the name and contact information of the additional maintenance personnel. (Step S14).

次に監視サーバ11は、取得した次の保守作業に係る追加保守員の氏名及び連絡先から、保守員システム20に対して、保守員手配通知Mを連絡する(ステップS15)。連絡には、電子メールや、グループウェア等を使用する。保守員システム20のオペレータは受信した連絡を元に、追加保守員Nを、保守対象システム7の設置現場に派遣する手続を行う(ステップS16)。   Next, the monitoring server 11 notifies the maintenance personnel arrangement notification M to the maintenance personnel system 20 from the name and contact information of the additional maintenance personnel related to the acquired next maintenance work (step S15). For communication, e-mail or groupware is used. Based on the received communication, the operator of the maintenance staff system 20 performs a procedure for dispatching the additional maintenance staff N to the installation site of the maintenance target system 7 (step S16).

また、監視サーバ11は、ステップS3で選出し、ステップS7で手配予約された障害復旧に必要と想定される複数の保守機材のうち、追加保守員Nが使用する物について、保守機材システム30に対して、保守機材手配通知Mを連絡する(ステップS17)。保守機材システムのオペレータは受信した連絡を元に、使用する保守機材がまだ保守対象システムの設置現場に配送されていない場合、配送する手続を行う(ステップS18)。   In addition, the monitoring server 11 selects the maintenance equipment N to be used by the additional maintenance staff N among the plurality of maintenance equipments selected in step S3 and assumed to be necessary for the failure recovery arranged and reserved in step S7. A maintenance equipment arrangement notice M is communicated to it (step S17). Based on the received communication, the maintenance equipment system operator performs a delivery procedure when the maintenance equipment to be used has not been delivered to the installation site of the maintenance target system (step S18).

なお、ステップS11乃至ステップS18の処理は、暫定処理が終了する迄、必要な回数分繰り返し行っても良い。   Note that the processing from step S11 to step S18 may be repeated as many times as necessary until the provisional processing is completed.

[障害回復処理]
そして、保守対象システム7の設置現場に派遣された保守員Nの対応によって、保守対象システム7の故障が回復した場合(ステップS21)、保守対象システム7は故障復旧通知を監視システム10の監視サーバ11に送信する(ステップS22)。また、保守員Nは、解明した故障原因、対処方法等を監視システム10の監視サーバ11に保守員情報連絡として送信する(ステップS23)。監視サーバ11は、故障復旧通知を障害ログ15cに保存し、保守員情報連絡を監視員/保守員入力情報15bとして保存する。また、入力後、障害が復旧した障害ID15gに紐づけられた、ステップS2で蓄積されたアラーム・メッセージ15a、監視員/保守員入力情報15b及び障害ログ15cを、それぞれ過去のアラーム・メッセージ15dで、過去の障害ログ15e、及び過去の監視員/保守員入力情報15fに編入することで、ナレッジ情報の保存を行う(ステップS24)。
[Disaster recovery processing]
Then, when the failure of the maintenance target system 7 is recovered by the response of the maintenance staff N dispatched to the installation site of the maintenance target system 7 (step S21), the maintenance target system 7 sends a failure recovery notification to the monitoring server of the monitoring system 10. 11 (step S22). In addition, the maintenance staff N transmits the elucidated cause of failure, countermeasures, and the like as maintenance staff information communication to the monitoring server 11 of the monitoring system 10 (step S23). The monitoring server 11 saves the failure recovery notification in the failure log 15c, and saves the maintenance staff information communication as the monitoring staff / maintenance staff input information 15b. Further, after the input, the alarm message 15a, the supervisor / maintenance worker input information 15b, and the failure log 15c accumulated in step S2, which are associated with the failure ID 15g in which the failure has been recovered, are respectively stored in the past alarm message 15d. The knowledge information is stored by incorporation into the past failure log 15e and the past supervisor / maintenance worker input information 15f (step S24).

また、監視サーバ11は、故障復旧通知を受信して、保守員システム20に対して、障害復旧通知を連絡する(ステップS25)。連絡には、電子メールや、グループウェア等を使用する。保守員システム20のオペレータは受信した連絡を元に、既に手配されている保守員1〜N、Mのキャンセルを行う(ステップS26)。   The monitoring server 11 receives the failure recovery notification and notifies the maintenance staff system 20 of the failure recovery notification (step S25). For communication, e-mail or groupware is used. The operator of the maintenance personnel system 20 cancels the maintenance personnel 1 to N and M already arranged based on the received communication (step S26).

また、監視サーバ11は、故障復旧通知を受信して、保守機材システム30に対して、故障復旧通知を連絡する(ステップS27)。保守機材システムのオペレータは受信した連絡を元に、既に手配予約されている及び、保守機器1〜N、Mのキャンセルを行う(ステップS28)。   The monitoring server 11 receives the failure recovery notification and notifies the maintenance equipment system 30 of the failure recovery notification (step S27). The operator of the maintenance equipment system cancels the maintenance equipment 1 to N and M based on the received communication and has already made an arrangement reservation (step S28).

以上のように、監視システム10は、保守対象システム7の故障発生から、故障回復までの一連の処理を行う。   As described above, the monitoring system 10 performs a series of processes from occurrence of a failure in the maintenance target system 7 to failure recovery.

以上のように、本発明によれば、保守対象システムに障害が発生した場合、障害情報による各種メッセージ、アラーム、障害ログと、監視員/保守員の入力情報によって、監視サーバは、過去の障害情報である各種メッセージ、アラーム、障害ログ及び過去の監視員/保守員入力情報から、障害復旧作業に必要なスキルを持つ最適な保守員及び、最適な保守機材を選出することができるので、保守員決定までの時間が短縮でき、早期の障害復旧を行うことができる。   As described above, according to the present invention, when a failure occurs in the maintenance target system, the monitoring server can identify the past failure according to various messages, alarms, failure logs based on the failure information, and input information of the monitoring personnel / maintenance personnel. Because it is possible to select the most appropriate maintenance personnel and the most appropriate maintenance equipment with the skills necessary for failure recovery work from various information such as messages, alarms, failure logs, and past monitor / maintenance worker input information, maintenance is possible. It can shorten the time required to determine the number of employees and can perform early failure recovery.

また、監視サーバは、選出した保守員及び、保守機材を手配予約するために、保守員システム及び保守機材システムに自動的に手配の通知を行うので、初動までの時間が短縮でき、早期の障害復旧を行うことができる。   In addition, the monitoring server automatically notifies the maintenance personnel system and maintenance equipment system of the arrangement in order to arrange and reserve the selected maintenance personnel and maintenance equipment. Recovery can be performed.

また、保守員が保守実行(暫定対処)時に、暫定対処中に判明した真の故障原因や新たに発生した故障解析の情報を監視サーバに送信する(監視サーバ用データベースに登録する)ことにより、監視サーバは、最新の情報に基づいて、故障回復のために更に手配予約の中から追加保守員及び追加保守機材を選出し、保守員システム及び保守機材システムに手配することができるために、追加保守員決定までの時間が短縮でき、障害復旧を早期に実現することができる。   In addition, when maintenance personnel perform maintenance (provisional countermeasures), by sending information about the true cause of failure found during provisional countermeasures and newly generated failure analysis information to the monitoring server (registering it in the monitoring server database), The monitoring server adds additional maintenance personnel and additional maintenance equipment from the arrangement reservation for failure recovery based on the latest information, and can arrange them to the maintenance personnel system and maintenance equipment system. The time to determine maintenance personnel can be shortened, and failure recovery can be realized early.

また、障害回復の際には、障害回復の情報を監視サーバに送信する(監視サーバ用データベースに登録する)ことにより、監視サーバは、保守員システム及び保守機材システムに対して、保守員及び保守機材の手配をキャンセルする通知するので、障害復旧後の後処理を効率よく行うことができる。   In the event of failure recovery, the monitoring server sends maintenance information to the monitoring server (registers it in the monitoring server database), so that the monitoring server can perform maintenance and maintenance for the maintenance personnel system and maintenance equipment system. Since the notification of canceling the arrangement of the equipment is given, the post-processing after the failure recovery can be performed efficiently.

また、保守対象システムに障害が発生した場合、障害情報による各種メッセージ、アラームと、障害ログと、監視員/保守員の入力情報を、ナレッジ情報として監視サーバ用データベースに蓄積することで、このナレッジ情報を使用することで、精度の高い最適な保守員及び、最適な保守機材を選出することができる。   In addition, when a failure occurs in the maintenance target system, this knowledge can be stored by accumulating various messages, alarms, failure logs, and monitoring / maintenance worker input information as failure information in the monitoring server database. By using the information, it is possible to select the optimum maintenance staff with high accuracy and the optimum maintenance equipment.

この発明は、その本質的特性から逸脱することなく数多くの形式のものとして具体化することができる。よって、上述した実施形態は専ら説明上のものであり、本発明を制限するものではないことは言うまでもない。   The present invention can be embodied in many forms without departing from its essential characteristics. Therefore, it is needless to say that the above-described embodiment is exclusively for description and does not limit the present invention.

1 コンピュータシステム
2 通信ネットワーク
4 コンピュータ
5 周辺機器
6 通信機器
7 保守対象システム
10 監視システム
11 監視サーバ
12 監視端末
14 監視サーバ用データベース
15 障害分析テーブル
15a アラーム・メッセージ
15b 保守員入力情報
15c 障害ログ
15d アラーム・メッセージ
15e 障害ログ
15f 保守員入力情報
15g 障害ID
16 障害情報テーブル
16a 障害ID
16b 保守員スキル
16c 保守機材
17 保守員テーブル
17a 保守員スキル
17b 保守員連絡先
18 部材テーブル
18a 保守機材
18b 機材手配先
20 保守員システム
30 保守機材システム
1 Computer system 2 Communication network 4 Computer 5 Peripheral device 6 Communication device 7 Maintenance target system 10 Monitoring system 11 Monitoring server 12 Monitoring terminal 14 Monitoring server database 15 Failure analysis table 15a Alarm message 15b Maintenance staff input information 15c Failure log 15d Alarm -Message 15e Failure log 15f Maintenance personnel input information 15g Failure ID
16 Failure information table 16a Failure ID
16b Maintenance staff skill 16c Maintenance equipment 17 Maintenance staff table 17a Maintenance staff skill 17b Maintenance staff contact 18 Member table 18a Maintenance equipment 18b Equipment arrangement place 20 Maintenance staff system 30 Maintenance equipment system

Claims (4)

監視サーバと、監視サーバ用データベースを有する故障監視システムにおいて、
監視サーバ用データベースは、過去の故障ログ及び過去の監視員/保守員の入力情報からなる障害分析テーブルを有し、
前記監視サーバは、故障発生時の保守対象システムから送信されてくる故障ログと、監視員/保守員からの入力情報を検索キーとして前記障害分析テーブルを検索し、障害解析に必要と推定される複数の保守員及び/又は複数の保守機材を決定し、
前記決定した保守員を、当該保守員を管理する保守員システムに手配予約をする通知を行い、及び/又は前記決定した保守機材を、当該保守機材を管理する保守機材システムに手配予約をする通知を行ない、
前記監視サーバは、前記監視員/保守員が故障対応中の対応状況によって適時入力する最新の入力情報を検索キーとして前記障害分析テーブルを検索し、必要に応じて前記手配予約した前記複数の保守員及び/又は前記複数の保守機材の中から、追加保守員及び/又は追加保守機材を決定し、
前記決定した追加保守員及び/又は前記追加保守機材を前記保守員システム及び/又は前記保守機材システムに手配をする通知を行うこと
を特徴とする故障監視システム。
In a failure monitoring system having a monitoring server and a monitoring server database,
The monitoring server database has a failure analysis table including past failure logs and past monitor / maintenance person input information,
The monitoring server searches the failure analysis table using the failure log transmitted from the maintenance target system at the time of the failure and the input information from the monitoring staff / maintenance personnel as a search key, and is estimated to be necessary for failure analysis. Determine multiple maintenance personnel and / or multiple maintenance equipment,
Notification of making arrangement reservations for the determined maintenance personnel to the maintenance personnel system that manages the maintenance personnel, and / or notification for making arrangement reservations for the determined maintenance equipment to the maintenance equipment system that manages the maintenance equipment Do
The monitoring server searches the failure analysis table using the latest input information that the monitoring staff / maintenance staff inputs timely according to the handling status during failure handling as a search key, and the plurality of maintenance reserved as necessary Determining additional maintenance personnel and / or additional maintenance equipment from the maintenance personnel and / or the plurality of maintenance equipment,
A failure monitoring system that performs notification to arrange the determined additional maintenance staff and / or the additional maintenance equipment to the maintenance staff system and / or the maintenance equipment system.
前記監視サーバは、前記手配予約した前記複数の保守員及び/又は前記複数の保守機材の中から、前記追加保守員及び/又は前記追加保守機材の決定と、前記追加保守員及び/又は追加保守機材を前記保守員システム及び/又は前記保守機材システムに手配をする通知を、前記保守対象システムから故障復旧通知が送信されるまで繰り返すこと
を特徴とする請求項1に記載の故障監視システム。
The monitoring server determines the additional maintenance staff and / or the additional maintenance equipment from the plurality of maintenance staff and / or the plurality of maintenance equipment reserved for the arrangement, and the additional maintenance staff and / or additional maintenance. The failure monitoring system according to claim 1, wherein notification for arranging equipment to the maintenance staff system and / or the maintenance equipment system is repeated until a failure recovery notification is transmitted from the maintenance target system.
前記監視サーバは、前記保守対象システムから前記故障復旧通知が送信された場合、手配済みの前記追加保守員及び/又は前記追加保守機材のキャンセルを決定し、前記手配済みの追加保守員及び/又は前記手配済みの追加保守機材のキャンセルを前記保守員システム及び/又は前記保守機材システムに通知を行うこと
を特徴とする請求項1又は請求項2に記載の故障監視システム。
When the failure recovery notification is transmitted from the maintenance target system, the monitoring server determines to cancel the arranged additional maintenance staff and / or the additional maintenance equipment, and arranges the arranged additional maintenance staff and / or The failure monitoring system according to claim 1 or 2, wherein the maintenance staff system and / or the maintenance equipment system are notified of cancellation of the arranged additional maintenance equipment.
前記監視サーバ用データベースの前記障害分析テーブルにおける、前記過去の故障ログ及び前記過去の監視員/保守員の前記入力情報は、ナレッジ情報であること、
を特徴とする請求項1乃至請求項3のうち、何れか1に記載の故障監視システム。
In the failure analysis table of the monitoring server database, the past failure log and the input information of the past monitor / maintenance personnel are knowledge information,
The fault monitoring system according to any one of claims 1 to 3, wherein:
JP2013075252A 2013-03-29 2013-03-29 Fault monitoring system Pending JP2014199618A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013075252A JP2014199618A (en) 2013-03-29 2013-03-29 Fault monitoring system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013075252A JP2014199618A (en) 2013-03-29 2013-03-29 Fault monitoring system

Publications (1)

Publication Number Publication Date
JP2014199618A true JP2014199618A (en) 2014-10-23

Family

ID=52356453

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013075252A Pending JP2014199618A (en) 2013-03-29 2013-03-29 Fault monitoring system

Country Status (1)

Country Link
JP (1) JP2014199618A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107209511A (en) * 2015-02-24 2017-09-26 东芝三菱电机产业***株式会社 Monitor control device
WO2017175378A1 (en) * 2016-04-08 2017-10-12 三菱電機株式会社 Information processing device, information processing method, and information processing program
WO2019116485A1 (en) * 2017-12-14 2019-06-20 三菱電機ビルテクノサービス株式会社 Facility management local server and proxy management center server
JP2019128754A (en) * 2018-01-24 2019-08-01 三菱電機ビルテクノサービス株式会社 Failure response system
KR20200034472A (en) * 2018-09-21 2020-03-31 대우조선해양 주식회사 Method for remote maintenance of vessel

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107209511A (en) * 2015-02-24 2017-09-26 东芝三菱电机产业***株式会社 Monitor control device
WO2017175378A1 (en) * 2016-04-08 2017-10-12 三菱電機株式会社 Information processing device, information processing method, and information processing program
JPWO2017175378A1 (en) * 2016-04-08 2018-08-30 三菱電機株式会社 Information processing apparatus, information processing method, and information processing program
CN108885724A (en) * 2016-04-08 2018-11-23 三菱电机株式会社 Information processing unit, information processing method and message handling program
CN108885724B (en) * 2016-04-08 2022-02-25 三菱电机株式会社 Information processing apparatus, information processing method, and computer-readable recording medium
WO2019116485A1 (en) * 2017-12-14 2019-06-20 三菱電機ビルテクノサービス株式会社 Facility management local server and proxy management center server
JPWO2019116485A1 (en) * 2017-12-14 2020-07-02 三菱電機ビルテクノサービス株式会社 Local server for facility management and center server for proxy management
JP2019128754A (en) * 2018-01-24 2019-08-01 三菱電機ビルテクノサービス株式会社 Failure response system
JP6994962B2 (en) 2018-01-24 2022-01-14 三菱電機ビルテクノサービス株式会社 Defect handling system
KR20200034472A (en) * 2018-09-21 2020-03-31 대우조선해양 주식회사 Method for remote maintenance of vessel
KR102574935B1 (en) * 2018-09-21 2023-09-05 한화오션 주식회사 Method for remote maintenance of vessel

Similar Documents

Publication Publication Date Title
JP4774929B2 (en) Monitoring device, monitoring system
JP6837427B2 (en) Elevator failure diagnosis system
JP2014199618A (en) Fault monitoring system
US20090157455A1 (en) Instruction system and method for equipment problem solving
CN108764725A (en) Worksheet processing classification maintenance unit, system and method based on history maintenance record
CN108564280A (en) Worksheet processing classification maintenance unit based on history maintenance record
CN105549508B (en) A kind of alarm method and device merged based on information
WO2008114217A1 (en) A method and system for full-automatic event monitoring and alert notification
US20140136258A1 (en) Pt2776
CN109995558B (en) Fault information processing method, device, equipment and storage medium
KR20120111376A (en) Realtime and intelligent management system for devices
JP2003108222A (en) Facility management system
WO2018235399A1 (en) Plant assistance assessment system and plant assistance assessment method
JP4842738B2 (en) Fault management support system and information management method thereof
KR20140028163A (en) Management system for industrial robot
KR101179359B1 (en) Work system and Method for managing mobile communication system
JP2018180801A (en) Monitoring system and information terminal device in monitoring system
JP4364879B2 (en) Failure notification system, failure notification method and failure notification program
WO2020170807A1 (en) Alarm control device and alarm control method
KR101639713B1 (en) Outage-management system
JP2009093522A (en) Maintenance-management service support system
CN114693023A (en) Equipment point inspection system and operation method thereof
JP2007201798A (en) System and method for managing telecommunication facilities
JP2008134691A (en) Maintenance management system
JP2003271238A (en) Remote maintenance method and system thereof