JP2014164628A - 情報処理装置、情報処理方法および情報処理プログラム並びに統合監視サーバ及び監視システム - Google Patents

情報処理装置、情報処理方法および情報処理プログラム並びに統合監視サーバ及び監視システム Download PDF

Info

Publication number
JP2014164628A
JP2014164628A JP2013036486A JP2013036486A JP2014164628A JP 2014164628 A JP2014164628 A JP 2014164628A JP 2013036486 A JP2013036486 A JP 2013036486A JP 2013036486 A JP2013036486 A JP 2013036486A JP 2014164628 A JP2014164628 A JP 2014164628A
Authority
JP
Japan
Prior art keywords
alarm
notification destination
operator
excluded
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013036486A
Other languages
English (en)
Inventor
Norikazu Nakamura
紀和 仲村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2013036486A priority Critical patent/JP2014164628A/ja
Publication of JP2014164628A publication Critical patent/JP2014164628A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

【課題】障害発生状況を適正なオペレータに対して効率的かつ効果的に提供すること。
【解決手段】情報処理装置であって、監視対象装置で発生したイベントについて、イベントの内容を示すアラームを受信するアラーム受信手段と、テンプレートファイルを参照して、受信したアラームが、通知対象から除外すべきアラームか否かを判定する判定手段と、テンプレートファイルを参照して、アラームを通知すべき通知先オペレータを決定する決定手段と、除外すべきアラームか否か示す情報、および通知先オペレータ情報を、アラームに付加する付加手段と、統合監視サーバが、除外すべきではないアラームを指定された通知先オペレータに対して通知するように、除外すべきアラームか否か示す情報、および通知先オペレータ情報が付加されたアラームを統合監視サーバに転送する転送手段と、を備えた。
【選択図】 図1

Description

本発明は、システムに生じたイベントのアラート技術に関する。
上記技術分野において、特許文献1には、ポリシーに応じてアラームの通知先を設定する技術が開示されている(段落0031、0032)。
特開2009-169657号公報
しかしながら、上記文献に記載の技術では、発生したアラームの全てを通知先に設定されたオペレータに通知する。そのため、オペレータの負荷が大きく、障害発生状況の効率的かつ効果的な把握ができなかった。
本発明の目的は、上述の課題を解決する技術を提供することにある。
上記目的を達成するため、本発明に係る装置は、
監視対象装置で発生したイベントについて、前記監視対象装置から前記イベントの内容を示すアラームを受信するアラーム受信手段と、
通知するアラームの除外条件およびアラームの通知先を設定したテンプレートファイルを参照して、前記監視対象装置から受信したアラームが、通知対象から除外すべきアラームか否かを判定する判定手段と、
前記テンプレートファイルを参照して、前記監視対象装置から受信したアラームを通知すべき通知先オペレータを決定する決定手段と、
除外すべきアラームか否か示す情報、およびアラームの通知先オペレータを示す通知先オペレータ情報を、前記アラームに付加する付加手段と、
統合監視サーバが、除外すべきではないアラームを指定された通知先オペレータに対して通知するように、前記除外すべきアラームか否か示す情報、および前記通知先オペレータ情報を付加された前記アラームを統合監視サーバに転送する転送手段と、
を備えた。
上記目的を達成するため、本発明に係る統合監視サーバは、
上記情報処理装置から、除外すべきアラームか否か示す情報、およびアラームの通知先オペレータを付加された前記アラームを受信する情報付加アラーム受信手段と、
情報付加アラーム受信手段で受信した前記アラームを分析して、前記除外すべきではないアラームを、指定された通知先オペレータに対して通知する通知手段と、
を備えた。
上記目的を達成するため、本発明に係る他の統合監視サーバは、
上記情報処理装置から、前記重複したアラームか否か示す情報、前記除外すべきアラームか否か示す情報、およびアラームの通知先オペレータを付加された前記アラームを受信する情報付加アラーム受信手段と、
前記情報付加アラーム受信手段で受信した前記アラームを分析して、重複もせず除外すべきでもないアラームを、指定された通知先オペレータに対して通知する通知手段と、
を備えた。
上記目的を達成するため、本発明に係る他の統合監視システムは、
上記の情報処理装置と上記の統合監視サーバとを含む。
上記目的を達成するため、本発明に係る方法は、
監視対象装置で発生したイベントについて、前記監視対象装置から前記イベントの内容を示すアラームを受信するアラーム受信ステップと、
通知するアラームの除外条件およびアラームの通知先を設定したテンプレートファイルを参照して、前記監視対象装置から受信したアラームが、通知対象から除外すべきアラームか否かを判定する判定ステップと、
前記テンプレートファイルを参照して、前記監視対象装置から受信したアラームを通知すべき通知先オペレータを決定する決定ステップと、
除外すべきアラームか否か示す情報、およびアラームの通知先オペレータを示す通知先オペレータ情報を、前記アラームに付加する付加ステップと、
統合監視サーバが、除外すべきではないアラームを指定された通知先オペレータに対して通知するように、前記除外すべきアラームか否か示す情報、および前記通知先オペレータ情報を付加された前記アラームを統合監視サーバに転送する転送ステップと、
を含む。
上記目的を達成するため、本発明に係るプログラムは、
監視対象装置で発生したイベントについて、前記監視対象装置から前記イベントの内容を示すアラームを受信するアラーム受信ステップと、
通知するアラームの除外条件およびアラームの通知先を設定したテンプレートファイルを参照して、前記監視対象装置から受信したアラームが、通知対象から除外すべきアラームか否かを判定する判定ステップと、
前記テンプレートファイルを参照して、前記監視対象装置から受信したアラームを通知すべき通知先オペレータを決定する決定ステップと、
除外すべきアラームか否か示す情報、およびアラームの通知先オペレータを示す通知先オペレータ情報、前記アラームに付加する付加ステップと、
統合監視サーバが、除外すべきではないアラームを指定された通知先オペレータに対して通知するように、前記除外すべきアラームか否か示す情報、および前記通知先オペレータ情報を付加された前記アラームを統合監視サーバに転送する転送ステップと、
を実行する。
本発明によれば、障害発生状況を適正なオペレータに対して効率的かつ効果的に提供できる。
本発明の第1実施形態に係る情報処理装置の構成を示すブロック図である。 本発明の第2実施形態に係る監視システムの概略構成を示すブロック図である。 本発明の第2実施形態に係る監視システムの概略動作を示すブロック図である。 本発明の第2実施形態に係る監視システムで用いられるテンプレートファイルを示す図である。 本発明の第2実施形態に係る監視システムで用いられるテンプレートファイルの内容を示す図である。 本発明の第2実施形態に係る監視システムで用いられるテンプレートファイルの内容を示す図である。 本発明の第2実施形態に係る監視システムで用いられるテンプレートファイルの内容を示す図である。 本発明の第2実施形態に係る監視システムで用いられるテンプレートファイルの内容を示す図である。 本発明の第2実施形態に係る監視システムで用いられるテンプレートファイルの内容を示す図である。 本発明の第2実施形態に係る現地監視サーバでの処理の流れを示すフローチャートである。 本発明の第2実施形態に係る統合監視サーバでの処理の流れを示すフローチャートである。 本発明の第3実施形態に係る監視システムで用いられるテンプレートファイルを示す図である。 本発明の第3実施形態に係る監視システムで用いられる監視対象装置グループの内容を示す図である。 本発明の第2実施形態に係る監視システムで用いられるアラームグループの内容を示す図である。 本発明の第3実施形態に係る現地監視サーバでの処理の流れを示すフローチャートである。 本発明の第4実施形態に係る監視システムの概略構成を示すブロック図である。 本発明の第4実施形態に係る監視システムで用いられるテンプレートファイルを示す図である。 本発明の第4実施形態に係る監視システムで用いられる転送先統合監視サーバテーブルの内容を示す図である。 本発明の第4実施形態に係る現地監視サーバでの処理の流れを示すフローチャートである。
以下に、図面を参照して、本発明の実施の形態について例示的に詳しく説明する。ただし、以下の実施の形態に記載されている構成要素はあくまで例示であり、本発明の技術範囲をそれらのみに限定する趣旨のものではない。
[第1実施形態]
本発明の第1実施形態としての情報処理装置100について、図1を用いて説明する。情報処理装置100は、監視対象装置130から受信したアラームについて、効率的かつ効果的に通知先オペレータに伝えるための装置である。
図1に示すように、情報処理装置100は、アラーム受信部101と、通知先決定部102と除外判定部103と情報付加部104と転送部105とを含む。
アラーム受信部101は、監視対象装置130で発生したイベントについて、監視対象装置130からイベントの内容を示すアラームを受信する。
除外判定部102は、通知するアラームの除外条件およびアラームの通知先を設定したテンプレートファイルを参照して、監視対象装置130から受信したアラームが、通知対象から除外すべきアラームか否かを判定する。
通知先決定部103は、テンプレートファイルを参照して、監視対象装置130から受信したアラームを通知すべき通知先オペレータを決定する。
情報付加部104は、除外すべきアラームか否か示す判定結果情報、およびアラームの通知先オペレータを示す通知先オペレータ情報を、アラームに付加する。
さらに転送部105は、判定結果情報、および通知先オペレータ情報を付加された情報付加アラームを統合監視サーバ150に転送する。これにより、統合監視サーバ150は、除外すべきではないアラームを、指定された通知先オペレータ170に対して通知する。
以上のように、本実施形態によれば、除外アラームおよび通知先に関する情報を統合監視サーバに送り、統合監視サーバは、必要アラームを指定通知先オペレータに通知するため、適正なオペレータに対して効率的かつ効果的に障害発生状況を提供できる。
[第2実施形態]
本発明の第2実施形態として、VoIPサービスに用いられるコンピュータシステムを監視する監視システムについて例示的に説明する。
VoIPサービスは、処理要求にリアルタイムで応じるために、高い信頼性が要求される。障害発生時は即座に復旧処理をしなければならず、オペレータが容易かつ迅速に状況把握できる仕組みにする必要がある。監視システムを構築して常時システムの異常やリソースの使用状況を監視することが望ましい。しかし、単純に発生したアラームの全てを通知先に設定されたオペレータに通知する方式だと以下の問題がある。
一般的に監視対象のシステム内部のステータスが変わるとイベントが発生する。イベントが発生すると、アラームが生成される。イベントが大量に発生すると、アラームの数も膨大になる。イベントは復旧作業が必要な障害情報であるとは限らない。例えば、オペレータがシステムにログイン、ログアウトするとステータス変更のイベントが発生する。このようなアラームにアクションを起こす必要はないためオペレータは保守の目的に応じてアラームの対処要否の切り分け作業をしなければならない。そのため即座に障害発生状況を把握することが困難である。
監視対象装置の追加、削除をすると設定変更作業をしなければならない。監視対象が数百ある大規模システムや装置の追加、削除が頻繁に発生するシステムでは、作業が煩雑になりシステム管理者の作業ミスを誘発するおそれがある。そのため、システム管理者の作業は極力少ないほうがよい。
複数のオペレータで保守をしている場合、時間帯によって保守業務を実施しているオペレータと休止しているオペレータが存在することがある。その区別をしないと監視システムは本来不要なアラーム転送処理も実施しなければならなくなり、サーバ処理の負担となる。また監視システム、オペレータ作業端末間の送受信データが多いとネットワーク負荷も大きくなるため処理遅延が発生する可能性がある。そのため、サーバやネットワーク負荷軽減の仕組みが必要である。
そのため、本実施形態では、あらかじめ通知するアラームを設定し、オペレータが保守に必要なアラームか否かを判断する手間を排除し、ひいては、障害発生時に復旧処理時間を軽減することができる。さらに、権限のないオペレータにはアラームが通知されないので、機密性も高くなる。
保守管理者をアクセスレベルに応じて複数設定することにより、保守性を高める。例えばハード障害はサーバ保守管理者に、ネットワーク障害はネットワーク保守管理者にといった目的に合わせてアラーム通知の権限を設定することで監視対象装置の状況をより容易に把握して迅速な復旧作業の対応をする。
(システム概要)
図2は、本実施形態に係る監視システムの概要を示す図である。図2において、監視システム200は、監視対象装置211〜213からアラームを受信する現地監視サーバ201、202と、現地監視サーバ201、202で収集した情報を統合管理する統合監視サーバ203とを含む。
なお、現地監視サーバ201、202は、それぞれ同じ監視目的のサーバでも、サーバ機能監視、ネットワーク機能監視など目的が異なるサーバのどちらでもよい。
図2では、現地監視サーバ201、202の監視対象として、ネットワーク機器211、サーバ212およびシステムサーバ群213を図示している。また、統合監視サーバ203が統合したアラーム情報は、保守網220を介して、オペレータ端末232、233、234に送られる。いずれかのオペレータ端末232、233、234にアラーム情報が送信された場合、シグナル231が、点灯する。
(システム構成)
図3は、本実施形態に係るシステムの構成および、イベント発生からの処理の流れを示す図である。
現地監視サーバ201には、統合監視サーバ203により、エージェントソフト(以下エージェント)301があらかじめインストールされている。
エージェント301は、監視対象装置211〜213で発生したイベントについて、監視対象装置211〜213から、イベントの内容を示すアラームを受信するアラーム受信部311を備えている。また、エージェント301は、テンプレートファイル316を備えており、テンプレートファイル316には、あらかじめオペレータの属性ごとに通知するアラームポリシーとアラームの重複条件、除外条件が設定されている。エージェント301は、通知するアラームの除外条件およびアラームの通知先を設定したテンプレートファイル316を参照して、監視対象装置211〜213から受信したアラームが、通知対象から除外すべきアラームか否かを判定する判定部312を備えている。この判定部312は、さらに、テンプレートファイル316を参照して、監視対象装置211〜213から受信したアラームが、他のアラームと重複しているアラームか否かを判定する。
エージェント301は、さらに、テンプレートファイル316を参照して、監視対象装置211〜213から受信したアラームを通知すべき通知先オペレータを決定する通知先決定部313を備える。エージェント301は、また、除外すべきアラームか否か示す情報、およびアラームの通知先オペレータを示す通知先オペレータ情報を、アラームに付加する情報付加部314を備える。
エージェント301はさらに、アラーム転送部315を備えている。アラーム転送部315は、統合監視サーバ203が、除外すべきではないアラームを指定された通知先オペレータに対して通知するように、除外すべきアラームか否か示す情報と通知先オペレータ情報とを付加されたアラームを統合監視サーバ203に転送する。
なお、図3の現地監視サーバ201の各機能構成部は、独立したハードウェアで構成されてもよいし、メモリやストレージに記憶されたプログラムをCPU(Central Processing Unit)で実行することにより、実現されてもよい。ソフトウェアで実現する場合、例えば、データベースはストレージに格納され、各処理に必要なデータはメモリに一時記憶される。
(処理の流れ)
監視対象装置211〜213の内部のステータスが変わるとイベントが発生する(S301)。イベントが発生すると、アラームが生成される。
監視対象装置211〜213からエージェント301にアラームが通知されると、エージェント301は相関処理を実施する。そして、情報付加部314が、重複するアラーム1つのアラームにまとめるための情報、さらに内容に応じて通知するオペレータの情報をアラームに付加する(S302)。さらに、アラーム転送部315が情報付加アラームを統合監視サーバ203に通知する(S303)。統合監視サーバ203は受け取った全アラームを履歴データベース321に蓄積する(S304)。一方で、除外すべきアラームおよび重複アラームを除外し、通知すべきアラームを一行だけ残す(S305)。その後、統合監視サーバ203は、エージェント301から受け取ったアラームをアラームポリシーと比較して、通知対象となるオペレータにのみ通知をする(S306)。通知済みのアラームは通知済みアラームデータベース322に保存される(S307)。オペレータは必要に応じて、リード権を持つ監視対象装置のアラームのログを履歴データベース321からも確認することができる(S308)。
(テンプレートファイル)
図4Aは、テンプレートファイル316の内容を説明するための図である。テンプレートファイル316には、監視対象装置名401、条件ステータス402、担当マネージャ403、担当マネージャ要約404、通知先オペレータ情報405、除外アラームポリシー406、重複アラームポリシー407、が設定されている。
図4Bは、監視対象装置名401を導くテーブルである。アラームに含まれる属性情報(所定のビットの組合せ)を判別することにより、監視対象装置名を導くことができる。
図4Cは、条件ステータス402を導くテーブルである。アラームに含まれる属性情報(所定のビットの組合せ)を判別することにより、どのような条件で発生したアラームかを示す条件ステータスを導くことができる。
図4Dは、通知先オペレータ情報405を決定するテーブルである。アラームに含まれる属性情報(所定のビットの組合せ)を判別することにより、どのような条件で発生したアラームかを示す条件ステータスを導くことができる。
図4Eは、除外アラームポリシー406を定義するテーブルである。このテーブルには、除外アラームとしての情報を付加すべきアラームを決定する属性情報(所定のビットの組合せ)が登録されている。
図4Fは、重複アラームポリシー407を定義するテーブルである。このテーブルには、重複アラームとしての情報を付加する対象となるアラームを識別するための判断基準が重複アラームポリシーとして定義されている。エージェント301は、ここに定義された属性を有するアラームをカウントし、所定時間内に所定回数以上起こった場合には、その所定回数以上のアラームに対して、重複アラームであることを示す情報を付加する。または、ここでは単純に、図4Eと同様に重複アラームとしての情報を付加すべきアラームを決定する属性情報(所定のビットの組合せ)が登録されていてもよい。その場合、現地監視サーバ201、202ではなく統合監視サーバ203で重複アラームのカウントを行なうことになる。
(現地監視サーバでの処理の流れ)
図5は、現地監視サーバ201、202における処理の流れを示すフローチャートである。
現地監視サーバ201、202は、ステップS502において、監視対象装置からアラームを受信すると、ステップS503に進みテンプレートファイル316を確認する。確認の結果、除外アラームまたは重複アラームであると判断した場合には、ステップS504からステップS505に進み、アラームにアラーム条件を追加する。
ここでアラーム条件とは、除外アラーム、重複アラームであることを示す情報および、そのアラームをオペレータに通知する条件を示す情報である。
次にステップS506では、テンプレートファイル316を参照して、受信したアラームのオペレータ条件を確認する。オペレータ条件とは、通知先のオペレータを決める条件である。図4Dのようにアラームの属性情報に応じて、通知先オペレータを決定する。通知先オペレータの指定が無い場合には、ステップS508に進み、通知先オペレータの指定がある場合には、ステップS507に進んでアラームに通知先オペレータを指定するアラーム条件を追加する。
ステップS508では、エージェント301が統合監視サーバ203へ、情報付加アラームを転送する。
(統合監視サーバでの処理の流れ)
図6は、統合監視サーバ203における処理の流れを示すフローチャートである。
統合監視サーバ203は、ステップS601で、現地監視サーバ201、202からアラームを受信すると、ステップS605で、アラームに付加された付加情報であるアラーム条件を解析する。具体的にはキーワードとあらかじめ用意されたテンプレートとを比較する。
重複アラームであれば、ステップS607に進み、その重複アラームをカウントして、ステップS609に進み、カウント値が所定値(例えば2)以上であれば、ステップS615に進んで、ログ保存し、対象オペレータへの転送を回避する。図4Fのように重複アラームについての詳しい条件(カウント)を現地監視サーバ201、202で判断している場合、ステップS607のようなカウントは不要であり、重複アラームの付加情報があればすぐにステップS615に進めばよい。
次に、ステップS611では、除外アラームか否かを判定し、除外アラームであれば、ステップS615に進んでログ保存する。除外アラームで無ければ、ステップS613に進み、通知先オペレータを確認する。指定の通知先がなければ、ステップS615に進みログ保存する。指定の通知先があれば、ステップS617に進み、対象オペレータのブラウザに転送する。
以上のように、本実施形態によれば、不要なアラームをオペレータに通知せず、必要なアラームと予期せぬアラームのみオペレータに通知する。オペレータは担当業務のアラームのみ受け取るので、アラーム発生箇所の特定、対処要否などの切り分け作業が容易になる。オペレータには担当業務外のアラームが通知されないので、保守性だけでなく機密性を高めることもできる。
VoIPサービスはリアルタイムで処理を実施しなければならないため、保守業務を迅速かつ適切に処理する仕組みが必要であるが、本実施形態によれば、システム管理者、保守オペレータ、サーバの負荷を軽減することで保守業務効率化できる。
また、エージェントは、現地監視サーバで共通とし、テンプレートファイルのみ、ローカルに合わせてカスタマイズすれば、システム構成を非常に簡便なものとすることができる。また、アラームの切り分けおよび情報付加をローカルに行なうので、センターに処理が集中せず、効率のよいシステム構成を実現できる。
[第3実施形態]
次に本発明の第3実施形態に係る監視システムについて、図7〜図8を用いて説明する。図7は、本実施形態に係る監視システムで用いられるテンプレートファイル701を説明するための図である。本実施形態に係る現地監視サーバは、上記第2実施形態と比べると、テンプレートファイル701において、監視対象装置グループ711、アラームグループ712を定義する点で異なる。その他の構成および動作は、第2実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
監視対象装置グループ711は、ある共通する特徴ごとに監視対象装置を論理的にグループ化したものである。1つの監視対象装置は1つ以上のグループに属するとし、監視対象装置グループ自体も他の監視対象装置グループに属することができる。特定の監視対象装置グループの全てのシステムに同じグループポリシーを割り当てる。その後、監視対象装置グループに新しい監視対象装置を追加すると、監視対象装置グループに割り当てられているポリシーが自動的に新しい監視対象装置に割り当てられる。
アラームグループ712は、同じ機能や作業に関連するアラームをグループ化して分類したものである。例えば、バックアップやデータの保存に関連する全てのメッセージ(ネットワークバックアッププログラムからのメッセージ、バックアップや保存操作に使用されるハードウェアからのメッセージなど)をBackupというメッセージグループにまとめる。アラームグループ712もテンプレートファイルに登録することでシステム管理者は、アラームポリシーに変更があってもテンプレートファイルに変更を加える必要はないので管理作業を軽減させることができる。
図7Bは、監視対象装置グループ711の内容を示すテーブルである。グループ名に対して、グループの特徴、監視対象装置、監視対象装置IPアドレス、親のグループ名、オプションなどが関連付けて登録されている。
親のグループとは、他のグループを内包するグループのことである。例えば、グループAとグループBが、グループCでグループ化されている場合、グループCを親のグループ、グループAとグループBは子のグループと認識される。
図7Cは、アラームグループ712の内容を示すテーブルである。アラームグループ名に対して、1つ以上のトラップ名、アラームレベル、処理優先順序、監視対象装置名、除外アラームポリシー、重複アラームポリシーが関連付けて登録されている。
(現地監視サーバでの処理の流れ)
図8は、本実施形態に係る現地監視サーバにおける処理の流れを示すフローチャートである。
現地監視サーバ201、202は、ステップS502において、監視対象装置からアラームを受信すると、ステップS503に進みテンプレートファイル701を確認する。そして、ステップS801に進み、監視対象装置グループの読込を行ない、さらにステップS803においてアラームグループの読込を行なう。
ここでグループの読込とは、図7B、図7Cのようなテーブルの確認処理を示す。これにより、受信したアラームに関するグループを特定し、グループごとに定義された除外アラームポリシー、重複アラームポリシーおよびオペレータ条件を確認することができる。
確認の結果、除外アラームまたは重複アラームであると判断した場合には、ステップS504からステップS505に進み、アラームにアラーム条件を追加する。
ここでアラーム条件とは、除外アラーム、重複アラームであることを示す情報および、そのアラームをオペレータに通知する条件を示す情報である。
次にステップS506では、テンプレートファイル316を参照して、受信したアラームのオペレータ条件を確認する。オペレータ条件とは、通知先のオペレータを決める条件である。図4Dのようにアラームの属性情報に応じて、通知先オペレータを決定する。通知先オペレータの指定が無い場合には、ステップS508に進み、通知先オペレータの指定がある場合には、ステップS507に進んでアラームに通知先オペレータを指定するアラーム条件を追加する。
ステップS508では、エージェント301が統合監視サーバ203へ、情報付加アラームを転送する。
以上の様に、監視対象装置やアラームを同じ機能や設置場所、作業などに関連付けてグループ化することで、サーバの管理業務を効率化できる。つまり、システム管理者は監視対象装置の追加、削除があってもグループ割り当ての変更だけでよく、テンプレートファイルの書き換え、監視サーバへの再配布をする必要がない。設定変更手順が少ないので、監視システム管理者の作業時間短縮、オペレーションミス減少につなげることができる。
[第4実施形態]
次に本発明の第4実施形態に係る監視システムについて、図9〜図11を用いて説明する。図9は、本実施形態に係る監視システム900の概要を示す図である。本実施形態に係る監視システム900は、上記第2実施形態と比べると、現地監視サーバ921〜923に対して、統合監視サーバが複数用意されている点で異なる。図9では、オペレータ901、902に通知する統合監視サーバ911、オペレータ903、904に通知する統合監視サーバ912が示されている。その他の構成および動作は、第2実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
例えば、エージェントソフトがインストールされた現地監視サーバ921は、6時から18時までに発生したアラームは同じタイムゾーンで監視をしている統合監視サーバ911に送信する。統合監視サーバ911の通知先であるオペレータ901の業務終了時間になると、現地監視サーバ921はアラームを統合監視サーバ912に送信する。このようにしてアラーム送信先のサーバを自動で切り替えることで、常に日勤業務のオペレータが環境全体を監視することができる。さらに、現地監視サーバは一部の統合監視サーバにのみアラーム通知をすればよいので、小容量のネットワークでも対応することが可能である。
図10Aは、本実施形態に係る監視システムで用いられるテンプレートファイル1001を説明するための図である。
本実施形態では、現地監視サーバ921〜923にインストールされたエージェントソフトが有するテンプレートファイル1001において、時刻に関するポリシー1011を設定する。
図10Bは、時刻に関するポリシー1011の詳しい内容を表わすテーブル1002を示す図である。テーブル1002では、それぞれの時刻に対して、転送先の統合監視サーバが定義されている。言い換えれば、転送時刻に応じた転送先としての統合監視サーバが定義されている。これにより現地監視サーバは、時間帯により異なる統合監視サーバにアラーム通知を行なう。
(現地監視サーバでの処理の流れ)
図11は、本実施形態に係る現地監視サーバにおける処理の流れを示すフローチャートである。
現地監視サーバ921−923は、ステップS502において、監視対象装置からアラームを受信すると、ステップS503に進みテンプレートファイル1001を確認する。そして、ステップS801に進み、監視対象装置グループの読込を行ない、さらにステップS803においてアラームグループの読込を行なう。
ここでグループの読込とは、図7B、図7Cのようなテーブルの確認処理を示す。これにより、受信したアラームに関するグループを特定し、グループごとに定義された除外アラームポリシー、重複アラームポリシーおよびオペレータ条件を確認することができる。
確認の結果、除外アラームまたは重複アラームであると判断した場合には、ステップS504からステップS505に進み、アラームにアラーム条件を追加する。
ここでアラーム条件とは、除外アラーム、重複アラームであることを示す情報および、そのアラームをオペレータに通知する条件を示す情報である。
次にステップS506では、テンプレートファイル316を参照して、受信したアラームのオペレータ条件を確認する。オペレータ条件とは、通知先のオペレータを決める条件である。図4Dのようにアラームの属性情報に応じて、通知先オペレータを決定する。通知先オペレータの指定が無い場合には、ステップS508に進み、通知先オペレータの指定がある場合には、ステップS507に進んでアラームに通知先オペレータを指定するアラーム条件を追加する。
次に、ステップS1101において、現在時刻を取得し、さらにステップS1103に進み、時刻に関するポリシー1011を確認し、転送先となる統合監視サーバを決定する。
ステップS508では、エージェント301が統合監視サーバ203へ、情報付加アラームを転送する。
以上のように時間帯によってアラーム転送先を切り替えることで、アラームが発生する確率が高い時間に稼働率を上げたり、複数の拠点で保守をしているときにアラーム通知先のオペレータを切り替えることができるので、サーバ、ネットワークリソースの効率化になる。
[他の実施形態]
以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。また、それぞれの実施形態に含まれる別々の特徴を如何様に組み合わせたシステムまたは装置も、本発明の範疇に含まれる。
また、本発明は、複数の機器から構成されるシステムに適用されてもよいし、単体の装置に適用されてもよい。さらに、本発明は、実施形態の機能を実現する情報処理プログラムが、システムあるいは装置に直接あるいは遠隔から供給される場合にも適用可能である。したがって、本発明の機能をコンピュータで実現するために、コンピュータにインストールされるプログラム、あるいはそのプログラムを格納した媒体、そのプログラムをダウンロードさせるWWW(World Wide Web)サーバも、本発明の範疇に含まれる。特に、少なくとも、非一時的コンピュータ可読媒体(non-transitory computer readable medium)は本発明の範疇に含まれる。
[実施形態の他の表現]
上記の実施形態の一部または全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1)
監視対象装置で発生したイベントについて、前記監視対象装置から前記イベントの内容を示すアラームを受信するアラーム受信手段と、
通知するアラームの除外条件およびアラームの通知先を設定したテンプレートファイルを参照して、前記監視対象装置から受信したアラームが、通知対象から除外すべきアラームか否かを判定する判定手段と、
前記テンプレートファイルを参照して、前記監視対象装置から受信したアラームを通知すべき通知先オペレータを決定する決定手段と、
除外すべきアラームか否か示す情報、およびアラームの通知先オペレータを示す通知先オペレータ情報を、前記アラームに付加する付加手段と、
統合監視サーバが、除外すべきではないアラームを指定された通知先オペレータに対して通知するように、前記除外すべきアラームか否か示す情報、および前記通知先オペレータ情報が付加された前記アラームを統合監視サーバに転送する転送手段と、
を備えた情報処理装置。
(付記2)
前記判定手段は、さらに、オペレータの属性ごとに、通知するアラームの重複条件を設定したテンプレートファイルを参照して、前記監視対象装置から受信したアラームが、他のアラームと重複しているアラームか否かを判定し、
前記付加手段は、さらに、重複したアラームか否か示す情報を、前記アラームに付加し、
統合監視サーバが、重複せず、除外すべきではないアラームを、指定された通知先オペレータに対して通知するように、前記転送手段は、前記重複したアラームか否か示す情報、前記除外すべきアラームか否か示す情報、およびアラームの通知先オペレータを付加された前記アラームを、統合監視サーバに送信する付記1に記載の情報処理装置。
(付記3)
共通する特徴を有する複数の監視対象装置を含む装置グループを定義し、共通する特徴を有する複数のアラームを含むアラームグループを定義し、前記装置グループ内の全ての監視対象装置に同じグループポリシーを割り当て、前記アラームグループごとに、通知対象から除外すべきアラームグループか否かを登録し、
前記判定手段は、前記装置グループと前記アラームグループとの組合せから、オペレータに通知すべきか否か、およびいずれのオペレータに通知すべきかを判定する付記1、または2に記載の情報処理装置。
(付記4)
前記テンプレートファイルは、転送先として、複数の統合監視サーバを、異なる時刻に割り当てる転送先時刻情報と含み、
前記転送手段は、前記テンプレートファイルを参照して、転送時刻に応じた転送先としての統合監視サーバに、前記アラームを転送する付記1乃至3のいずれか1項に記載の情報処理装置
(付記5)
付記1に記載の情報処理装置から、前記除外すべきアラームか否か示す情報、およびアラームの通知先オペレータを付加された前記アラームを受信する情報付加アラーム受信手段と、
前記情報付加アラーム受信手段で受信した前記アラームを分析して、前記除外すべきではないアラームを、指定された通知先オペレータに対して通知する通知手段と、
を備えた統合監視サーバ。
(付記6)
付記2に記載の情報処理装置から、前記重複したアラームか否か示す情報、前記除外すべきアラームか否か示す情報、およびアラームの通知先オペレータを付加された前記アラームを受信する情報付加アラーム受信手段と、
前記情報付加アラーム受信手段で受信した前記アラームを分析して、重複もせず除外すべきでもないアラームを、指定された通知先オペレータに対して通知する通知手段と、
を備えた統合監視サーバ。
(付記6)
付記1に記載の情報処理装置と付記5に記載の前記統合監視サーバとを含む監視システム。
(付記7)
付記2に記載の情報処理装置と付記6に記載の前記統合監視サーバとを含む監視システム。
(付記8)
監視対象装置で発生したイベントについて、前記監視対象装置から前記イベントの内容を示すアラームを受信するアラーム受信ステップと、
通知するアラームの除外条件およびアラームの通知先を設定したテンプレートファイルを参照して、前記監視対象装置から受信したアラームが、通知対象から除外すべきアラームか否かを判定する判定ステップと、
前記テンプレートファイルを参照して、前記監視対象装置から受信したアラームを通知すべき通知先オペレータを決定する決定ステップと、
除外すべきアラームか否か示す情報、およびアラームの通知先オペレータを示す通知先オペレータ情報を、前記アラームに付加する付加ステップと、
統合監視サーバが、除外すべきではないアラームを指定された通知先オペレータに対して通知するように、前記除外すべきアラームか否か示す情報、および前記通知先オペレータ情報を付加された前記アラームを統合監視サーバに転送する転送ステップと、
を含む情報処理方法。
(付記9)
監視対象装置で発生したイベントについて、前記監視対象装置から前記イベントの内容を示すアラームを受信するアラーム受信ステップと、
通知するアラームの除外条件およびアラームの通知先を設定したテンプレートファイルを参照して、前記監視対象装置から受信したアラームが、通知対象から除外すべきアラームか否かを判定する判定ステップと、
前記テンプレートファイルを参照して、前記監視対象装置から受信したアラームを通知すべき通知先オペレータを決定する決定ステップと、
除外すべきアラームか否か示す情報、およびアラームの通知先オペレータを示す通知先オペレータ情報、前記アラームに付加する付加ステップと、
統合監視サーバが、除外すべきではないアラームを指定された通知先オペレータに対して通知するように、前記除外すべきアラームか否か示す情報、および前記通知先オペレータ情報を付加された前記アラームを統合監視サーバに転送する転送ステップと、
を実行する情報処理プログラム。

Claims (10)

  1. 監視対象装置で発生したイベントについて、前記監視対象装置から前記イベントの内容を示すアラームを受信するアラーム受信手段と、
    通知するアラームの除外条件およびアラームの通知先を設定したテンプレートファイルを参照して、前記監視対象装置から受信したアラームが、通知対象から除外すべきアラームか否かを判定する判定手段と、
    前記テンプレートファイルを参照して、前記監視対象装置から受信したアラームを通知すべき通知先オペレータを決定する決定手段と、
    除外すべきアラームか否か示す情報、およびアラームの通知先オペレータを示す通知先オペレータ情報を、前記アラームに付加する付加手段と、
    統合監視サーバが、除外すべきではないアラームを指定された通知先オペレータに対して通知するように、前記除外すべきアラームか否か示す情報、および前記通知先オペレータ情報が付加された前記アラームを前記統合監視サーバに転送する転送手段と、
    を備えた情報処理装置。
  2. 前記判定手段は、さらに、オペレータの属性ごとに、通知するアラームの重複条件を設定したテンプレートファイルを参照して、前記監視対象装置から受信したアラームが、他のアラームと重複しているアラームか否かを判定し、
    前記付加手段は、さらに、重複したアラームか否か示す情報を、前記アラームに付加し、
    前記統合監視サーバが、重複せず、除外すべきではないアラームを、指定された通知先オペレータに対して通知するように、前記転送手段は、前記重複したアラームか否か示す情報、前記除外すべきアラームか否か示す情報、およびアラームの通知先オペレータを付加された前記アラームを、統合監視サーバに送信する請求項1に記載の情報処理装置。
  3. 共通する特徴を有する複数の監視対象装置を含む装置グループを定義し、共通する特徴を有する複数のアラームを含むアラームグループを定義し、前記アラームグループごとに、通知対象から除外すべきアラームグループか否かを登録し、
    前記判定手段は、前記装置グループと前記アラームグループとの組合せから、オペレータに通知すべきか否か、およびいずれのオペレータに通知すべきかを判定する請求項1、または2に記載の情報処理装置。
  4. 前記テンプレートファイルは、転送先として、複数の統合監視サーバを、異なる時刻に割り当てる転送先時刻情報と含み、
    前記転送手段は、前記テンプレートファイルを参照して、転送時刻に応じた転送先としての統合監視サーバに、前記アラームを転送する請求項1乃至3のいずれか1項に記載の情報処理装置。
  5. 請求項1に記載の情報処理装置から、前記除外すべきアラームか否か示す情報、およびアラームの通知先オペレータを付加された前記アラームを受信する情報付加アラーム受信手段と、
    前記情報付加アラーム受信手段で受信した前記アラームを分析して、前記除外すべきではないアラームを、指定された通知先オペレータに対して通知する通知手段と、
    を備えた統合監視サーバ。
  6. 請求項2に記載の情報処理装置から、前記重複したアラームか否か示す情報、前記除外すべきアラームか否か示す情報、およびアラームの通知先オペレータを付加された前記アラームを受信する情報付加アラーム受信手段と、
    前記情報付加アラーム受信手段で受信した前記アラームを分析して、重複もせず除外すべきでもないアラームを、指定された通知先オペレータに対して通知する通知手段と、
    を備えた統合監視サーバ。
  7. 請求項1に記載の情報処理装置と請求項5に記載の前記統合監視サーバとを含む監視システム。
  8. 請求項2に記載の情報処理装置と請求項6に記載の前記統合監視サーバとを含む監視システム。
  9. 監視対象装置で発生したイベントについて、前記監視対象装置から前記イベントの内容を示すアラームを受信するアラーム受信ステップと、
    通知するアラームの除外条件およびアラームの通知先を設定したテンプレートファイルを参照して、前記監視対象装置から受信したアラームが、通知対象から除外すべきアラームか否かを判定する判定ステップと、
    前記テンプレートファイルを参照して、前記監視対象装置から受信したアラームを通知すべき通知先オペレータを決定する決定ステップと、
    除外すべきアラームか否か示す情報、およびアラームの通知先オペレータを示す通知先オペレータ情報を、前記アラームに付加する付加ステップと、
    統合監視サーバが、除外すべきではないアラームを指定された通知先オペレータに対して通知するように、前記除外すべきアラームか否か示す情報、および前記通知先オペレータ情報を付加された前記アラームを前記統合監視サーバに転送する転送ステップと、
    を含む情報処理方法。
  10. 監視対象装置で発生したイベントについて、前記監視対象装置から前記イベントの内容を示すアラームを受信するアラーム受信ステップと、
    通知するアラームの除外条件およびアラームの通知先を設定したテンプレートファイルを参照して、前記監視対象装置から受信したアラームが、通知対象から除外すべきアラームか否かを判定する判定ステップと、
    前記テンプレートファイルを参照して、前記監視対象装置から受信したアラームを通知すべき通知先オペレータを決定する決定ステップと、
    除外すべきアラームか否か示す情報、およびアラームの通知先オペレータを示す通知先オペレータ情報、前記アラームに付加する付加ステップと、
    統合監視サーバが、除外すべきではないアラームを指定された通知先オペレータに対して通知するように、前記除外すべきアラームか否か示す情報、および前記通知先オペレータ情報を付加された前記アラームを前記統合監視サーバに転送する転送ステップと、
    を実行する情報処理プログラム。
JP2013036486A 2013-02-26 2013-02-26 情報処理装置、情報処理方法および情報処理プログラム並びに統合監視サーバ及び監視システム Pending JP2014164628A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013036486A JP2014164628A (ja) 2013-02-26 2013-02-26 情報処理装置、情報処理方法および情報処理プログラム並びに統合監視サーバ及び監視システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013036486A JP2014164628A (ja) 2013-02-26 2013-02-26 情報処理装置、情報処理方法および情報処理プログラム並びに統合監視サーバ及び監視システム

Publications (1)

Publication Number Publication Date
JP2014164628A true JP2014164628A (ja) 2014-09-08

Family

ID=51615157

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013036486A Pending JP2014164628A (ja) 2013-02-26 2013-02-26 情報処理装置、情報処理方法および情報処理プログラム並びに統合監視サーバ及び監視システム

Country Status (1)

Country Link
JP (1) JP2014164628A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101554981B1 (ko) * 2014-12-16 2015-10-06 (주)엔와이인포텍 상수도 관망 관리 서버, 상수도 관망 관리 시스템 및 이를 이용한 관망 관리 방법
CN111506446A (zh) * 2020-04-10 2020-08-07 聚好看科技股份有限公司 接口故障检测方法及服务器
KR102668325B1 (ko) * 2023-09-14 2024-05-23 인스피언 주식회사 인터페이스 관리 방법, 인터페이스 거버넌스 시스템, 및 인터페이스를 관리하는, 컴퓨터로 실행가능한 프로그램을 저장하는 저장매체

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101554981B1 (ko) * 2014-12-16 2015-10-06 (주)엔와이인포텍 상수도 관망 관리 서버, 상수도 관망 관리 시스템 및 이를 이용한 관망 관리 방법
CN111506446A (zh) * 2020-04-10 2020-08-07 聚好看科技股份有限公司 接口故障检测方法及服务器
CN111506446B (zh) * 2020-04-10 2023-10-27 聚好看科技股份有限公司 接口故障检测方法及服务器
KR102668325B1 (ko) * 2023-09-14 2024-05-23 인스피언 주식회사 인터페이스 관리 방법, 인터페이스 거버넌스 시스템, 및 인터페이스를 관리하는, 컴퓨터로 실행가능한 프로그램을 저장하는 저장매체

Similar Documents

Publication Publication Date Title
CN109412870B (zh) 告警监控方法及平台、服务器、存储介质
CA2835446C (en) Data analysis system
JP5747615B2 (ja) 通信システム、及び通信方法
JP2004021549A (ja) ネットワーク監視システムおよびプログラム
EP3072260A1 (en) Methods, systems, and computer readable media for a network function virtualization information concentrator
CA2983306C (en) System and method for handling events involving computing systems and networks using fabric monitoring system
CN112764956B (zh) 数据库的异常处理***、数据库的异常处理方法及装置
US20090070425A1 (en) Data processing system, method of updating a configuration file and computer program product
CN108632106A (zh) 监控服务设备的***
JP5342082B1 (ja) ネットワーク障害解析システムおよびネットワーク障害解析プログラム
US8554908B2 (en) Device, method, and storage medium for detecting multiplexed relation of applications
JP2014164628A (ja) 情報処理装置、情報処理方法および情報処理プログラム並びに統合監視サーバ及び監視システム
JP2007249829A (ja) 内部ネットワーク間通信システム及び情報処理装置及び中継情報処理装置及び通信制御プログラム及び内部ネットワーク間における通信制御方法及び遠隔障害管理システム及び被管理装置及び管理装置
US8677323B2 (en) Recording medium storing monitoring program, monitoring method, and monitoring system
CN113411209A (zh) 一种分布式的密码服务全链路检测***及方法
JP2003330758A (ja) 集約機能付障害情報通知システム及びマシンを集約機能付障害情報通知手段として機能させるためのプログラム
CN105763371B (zh) 一种告警处理方法及装置
JP2014228932A (ja) 障害通知装置、障害通知プログラムならびに障害通知方法
JP6269004B2 (ja) 監視支援プログラム、監視支援方法および監視支援装置
JP2009089111A (ja) 監視サーバ、監視システムおよび監視システムにおける通信方法。
JP2024030371A (ja) 処理装置、処理プログラム、処理方法
JP2008217682A (ja) 監視システムおよび監視方法ならびにプログラム
JP2016100816A (ja) 仮想ネットワーク管理装置及び方法
JP3984181B2 (ja) エラー情報通知および処理方法
JP2003323361A (ja) ネットワーク装置監視システム、管理装置、ネットワーク装置及びネットワーク装置監視方法