JP2009017393A - トラフィック監視システム - Google Patents
トラフィック監視システム Download PDFInfo
- Publication number
- JP2009017393A JP2009017393A JP2007178777A JP2007178777A JP2009017393A JP 2009017393 A JP2009017393 A JP 2009017393A JP 2007178777 A JP2007178777 A JP 2007178777A JP 2007178777 A JP2007178777 A JP 2007178777A JP 2009017393 A JP2009017393 A JP 2009017393A
- Authority
- JP
- Japan
- Prior art keywords
- traffic
- fluctuation rate
- state
- traffic volume
- alarm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012544 monitoring process Methods 0.000 title claims abstract description 58
- 238000005259 measurement Methods 0.000 claims description 23
- 238000011084 recovery Methods 0.000 claims description 12
- 238000001514 detection method Methods 0.000 abstract description 29
- 238000012423 maintenance Methods 0.000 abstract description 10
- 230000007704 transition Effects 0.000 description 17
- 238000010586 diagram Methods 0.000 description 12
- 230000004044 response Effects 0.000 description 9
- 238000000034 method Methods 0.000 description 8
- 230000008859 change Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 230000007423 decrease Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 1
Images
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
【解決手段】トラフィック量の測定箇所について設定された下限閾値に基づいて監視を行うトラフィック監視システムにおいて、格納部23は測定箇所でのトラフィック量に関するトラフィック情報を定期的に取得する。この取得したトラフィック情報に基づき、所定の基準トラフィック量に対する、測定箇所でのトラフィック量の割合であるトラフィック変動率を算出する。算出値が下限閾値より低下した場合に判定部25は、測定箇所について警報発生状態であるとみなす。保守者が認識できなかったサイレント故障を監視システム側から通知することによって、故障検出の可能性を高めることができ、サービスの中断時間を短縮できる。
【選択図】 図1
Description
上記方法では、機器から警報を上げることのできないような故障(以下、サイレント故障と呼ぶ)が起きた場合、その故障を保守者に認識されずサービス中断が継続してしまう可能性があり、ユーザに対して迷惑をかけることがある。
ところで、特許文献1には、監視対象となるネットワークに含まれるルータごとのトラフィックデータを得て、輻輳の監視を行う構成が記載されている。
そもそも一般的に、ルータなどの通信機器は自身で故障を検知し監視システムに通知するという仕組みを備えている。しかしながら、上記故障は通信機器自身が故障を検知できないために起こる現象であり、通信機器側での対応は難しいと言える。そのため、監視対象機器から定期的に収集する情報の中で、補完的に検知できる監視システムの実現が望まれる。
また、警報の数を増やすことは保守者に対応を求めることと等しいため、むやみに増やすということは保守性の低下を招きかねない。従って、保守性を保ちながら新たな故障を認識させるためにはある程度の誤判定のケースを想定し、この場合には警報として出力しないような工夫が必要である。
本発明は上述した従来技術の問題点を解決するためになされたものであり、その目的はサイレント故障を早期に検出するためのトラフィック監視システムを提供することである。
前記トラフィック変動率を算出するトラフィック変動率算出手段(例えば、図3中のステップS305に対応)を更に含み、前記トラフィック変動率算出手段によって算出されたトラフィック変動率が前記下限閾値より低下した場合に前記判定部は前記測定箇所について警報発生状態であるとみなすことを特徴とする。このような構成によれば、算出されたトラフィック変動率に基づいてサイレント故障を検出でき、監視システム側から保守者に通知することによって、故障検出の可能性を高め、サービスの中断時間を短縮できる。
また、警報発生状態になる前のトラフィック量を基準トラフィック量としてトラフィック変動率を算出し、そのトラフィック変動率が下限閾値以上になった場合に警報発生状態から回復したとみなすことにより、むやみに回復したとみなすことはなく、警報の発生検出と回復検出とを繰返す事態を防止できる。
(実施の形態)
図1は、本発明の実施形態によるトラフィック監視システムの構成例を示すブロック図である。同図を参照すると、本実施形態にかかるトラフィック監視システム20の監視対象10は、例えばルータである。トラフィック監視システム20は、監視対象10へ状態取得要求を行うことによりトラフィック量を取得するトラフィック管理部21と、トラフィック管理部21より状態遷移要求を受け、監視対象10の状態を更新し、監視端末30へ状態変化を通知する状態管理部22とを含んで構成されている。
以上の構成において、トラフィック監視システム20で監視している監視対象10のトラフィック量が定期的に取得され、格納部23に保持される。
トラフィック変動率は、トラフィック量の測定箇所での送信データ、受信データについての変動率であり、本例では最新のトラフィック量と変動率算出基準トラフィック量とを用いて算出される。変動率算出基準トラフィック量は、変動率算出のために設定される。この変動率算出基準トラフィック量は、原則、保守者が設定した指定周期前の値とする。ただし、データが欠落した場合や、前周期までにすでに警報検出状態にある場合は、警報発生直前に使用されたトラフィック量を基準トラフィック量として採用する。このようにすることで、精度の高い判定が行えるようになる。
なお、基準データ保持部24には、本システムの処理に必要な各種設定値を含むファイルが保持されている。
判定部25は、上記基準トラフィックを元にトラフィック変動率を算出し、算出されたトラフィック変動率の値が予め設定された下限閾値より低下した場合、状態管理部22に対し状態遷移要求を行う。
図2は、格納部23による、定期的な状態取得処理の内容を示すシーケンス図である。同図において、格納部23は、監視処理の登録時に予め設定された周期(例えば、5分)に基づき監視対象10へ状態取得要求が定期的に送信される(ステップS201)。この場合、例えば、SNMP(Simple Network Management Protocol)によるGETが、監視対象10へ定期的に送信される。
状態取得要求が送信されることによって、格納部23は、監視対象10のトラフィック量を状態取得応答(すなわちRESPONSE)として取得でき、そのトラフィック量は格納部23自身に格納される(ステップS202)。
図3は、判定部25による、トラフィック変動率の算出処理の内容を示すシーケンス図である。同図において、変動率算出を行うために必要な変動率算出基準トラフィックが定義され、基準データ保持部24に、その値が保持されている。
判定部25は、最新データ読出要求を格納部23へ送信し(ステップS301)、格納部23に格納されている最新のトラフィック量を最新データ読出応答によって取得する(ステップS302)。
判定部25では上記基準トラフィックの値を元にトラフィック変動率を算出する(ステップS305)。算出されたトラフィック変動率が、予め設定された閾値を超える場合、判定部25は、状態管理部22に対し状態遷移要求を送信する。
また、状態管理部22から監視端末30へ、状態変化通知が送信される(ステップS402)。これにより、監視端末30は、監視対象10が通常状態から障害状態(つまり警報検出状態)に遷移したと認識する。
以上の処理を経ることによって、監視端末30において、警報の発生を確認できる。
次に、警報検出状態から通常状態への回復について説明する。
通常、トラフィック量が下限閾値以内の値に戻ることで、警報検出状態から通常状態へ回復したとみなすことができる。しかしながら、回復したかどうかを、数周期前の状態との比較に基づいて判定する場合、以下の問題が生じる。すなわち、本システムにおける監視対象は、トラフィック量が0で落ち着いてしまうという状態になるので、同じ基準トラフィックで閾値判定をすると実際に回復しているかどうかを問わず、数周期後には回復したとみなされることになる。例えば、2周期前の状態との比較に基づいて判定する場合、トラフィック量が0で落ち着いてしまうため、必ず2周期後に回復したとみなされてしまう。つまり、M周期前(Mは自然数)の状態との比較に基づいて判定する場合、トラフィック量が0で落ち着くと、必ずM周期後に回復したとみなされてしまう。なお、Mの値については、過去のデータに基づいて経験によって定められる。
以上の理由により、警報検出状態からの回復については、別基準による処理で判定を行う。この別基準による処理について、図5を参照して説明する。
判定部25は、最新データ読出要求を格納部23へ送信し(ステップS503)、格納部23に格納されている最新のトラフィック量を最新データ読出応答によって取得する(ステップS504)。
基準データ保持部24では障害状態(つまり警報検出状態)における変動率算出基準トラフィックの値を、通常状態の値とは別に保持している。この障害状態における変動率算出基準トラフィックの値は、判定部25から送信される基準データ読出要求に対する基準データ読出応答によって格納部23へ送信される(ステップS505、S506)。
また、状態管理部22から監視端末30へ、状態変化通知が送信される(ステップS509)。
以上の処理を経ることによって、監視端末30において、警告検出状態から通常状態へ回復したことを確認できる。
ここで、トラフィック変動率を算出する機能について説明する。この機能は、トラフィック測定が設定されたトラフィック測定箇所について測定周期毎に式(1)により、トラフィック変動率を測定する機能である。トラフィック変動率については、送信バイト、受信バイトでそれぞれ個別に算出が行われる。
トラフィック変動率[%]
=(最新のトラフィック[byte] /変動率算出基準トラフィック[byte])*100
…(1)
1周期前のトラフィック変動率が警報検出状態(つまり警告または障害)に相当する値である場合は、
変動率算出基準トラフィック=警報発生時にトラフィック変動率算出に使用した変動率算出基準トラフィック
とする。そして、上記以外の場合は、
変動率算出基準トラフィック=N周期前のトラフィック(Nは設定ファイルの変動率算出周期で指定された値)とする。なお、トラフィック変動率は整数とし、小数点以下の数値は切り上げとする。
警告から重度障害へ状態遷移した場合、変動率算出基準トラフィックは警告を検出した際のトラフィックを変動率算出に使用することとし、重度障害を検出した際のN周期前のトラフィックは変動率算出に使用しない。
トラフィック変動率の計算例を以下に示す。
図6は、警報発生後のトラフィック変動率の算出例を説明するための、トラフィック量の遷移例を示す図である。同図において、横軸は時間、縦軸はトラフィック量[Kbyte]である。同図は、時間T3から時間T4に遷移する時にトラフィック量の低下が発生し、時間T4で警報を検出する場合である。
変動率算出周期=2周期
変動率算出周期最大値=3周期
とする。同図において、時間T4のトラフィック変動率を計算する場合、
トラフィック変動率_時間T4=時間T4のトラフィック量/時間T2のトラフィック量*100
となる。また、時間T5のトラフィック変動率を計算する場合、
トラフィック変動率_時間T5=時間T5のトラフィック量/時間T2のトラフィック量*100
となる。この場合、時間T4で警報が発生しているため、時間T4の計算で使用した変動率算出基準トラフィック量(つまり時間T2のトラフィック量)を使用して計算する。
計算時に使用する各パラメータは以下とする。すなわち、
変動率算出周期=2周期
変動率算出周期最大値=3周期
とする。同図において、時間T6のトラフィック変動率を計算する場合、
トラフィック変動率_時間T6=時間T6のトラフィック量/時間T1のトラフィック量*100…(2)
となる。ここで、式(2)においては、時間T1のトラフィック量を変動率算出基準トラフィック量として用いている。式(2)においては、本来、時間T4のトラフィック量が変動率算出基準トラフィック量として使用されることになるが、本例では時間T4のトラフィック測定データが欠落している。このため、最大3周期分(本例では、時間T3から時間T1まで)さかのぼり、トラフィック測定データが欠落していない有効トラフィック量を検索する。本例では、時間T3、時間T2のトラフィック測定データは欠落しているため、時間T1のトラフィック測定データが変動率算出基準トラフィック量として使用される。なお、時間T2から時間T4までの間については、データが欠落しているため、トラフィック変動率の算出は行われない。
さらに図8および図9を参照して、トラフィック量の推移の例について説明する。
図8は、トラフィック量の推移の例を示す図である。同図においては、時間T1から時間T2までの1周期(以下、「T1⇒T2」のように記載する)のトラフィック量は、「9」から「10」に推移している。同様に、T1⇒T2のトラフィック量は「10」から「1」、T2⇒T3のトラフィック量は「10」から「1」、T3⇒T4のトラフィック量は「1」から「1」、T4⇒T5のトラフィック量は「1」から「3」、T5⇒T6のトラフィック量は「3」から「8」、T6⇒T7のトラフィック量は「8」から「9」、にそれぞれ推移している。そして、時間T3において通常状態から警報発生状態に遷移し、時間T6において警報発生状態から通常状態に遷移している。
1周期前のトラフィック変動率が警報検出状態に相当する値である場合は、
変動率算出基準トラフィック量=警報発生時にトラフィック変動率算出に使用した変動率算出基準トラフィック量
とする。そして、上記以外の場合は、
変動率算出基準トラフィック量=1周期前のトラフィック量
とする。なお、トラフィック変動率は整数とし、小数点以下の数値は切り上げとする。
また、T2⇒T3の変動率算出基準トラフィック量は時間T2のトラフィック量である「10」であり、変動率は1/10=10[%]となる。ここで、通常状態から警報発生状態に遷移する。
以上説明したように、本システムでは、故障しているにもかかわらず、アラームを上げない(出力しない)機器の状態を検出できる。このため、本発明では、トラフィック量が減少するもしくは0となる状態に基づき、その状態を検出する構成を採用している。一度、トラフィック量が0となったとしても、故障でない場合には、自然に回復することがあり、故障していた場合でも自動リブート(再起動)によって復旧する場合もある。この場合も含め、本発明によれば、アラームを上げない機器の状態を検出できる。
20 トラフィック監視システム
21 トラフィック管理部
22 状態管理部
23 格納部
24 基準データ保持部
25 判定部
30 監視端末
Claims (3)
- トラフィック量の測定箇所について設定された下限閾値に基づいて監視を行うトラフィック監視システムであって、前記測定箇所でのトラフィック量に関するトラフィック情報を定期的に取得するトラフィック情報取得手段と、前記トラフィック情報取得手段によって取得したトラフィック情報に基づいて算出される算出値が前記下限閾値より低下した場合に前記測定箇所について警報発生状態であるとみなす判定手段とを含むことを特徴とするトラフィック監視システム。
- 前記算出値は、所定の基準トラフィック量に対する、前記測定箇所でのトラフィック量の割合であるトラフィック変動率であり、
前記トラフィック変動率を算出するトラフィック変動率算出手段を更に含み、前記トラフィック変動率算出手段によって算出されたトラフィック変動率が前記下限閾値より低下した場合に前記判定部は前記測定箇所について警報発生状態であるとみなすことを特徴とする請求項1記載のトラフィック監視システム。 - 前記警報発生状態であるとみなされている状態においては、前記トラフィック変動率算出手段は、前記警報発生状態になる前のトラフィック量を前記基準トラフィック量としてトラフィック変動率を算出し、前記トラフィック変動率算出手段によって算出されたトラフィック変動率が前記下限閾値以上になった場合に前記判定部は前記警報発生状態から回復したとみなすことを特徴とする請求項2記載のトラフィック監視システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007178777A JP4852486B2 (ja) | 2007-07-06 | 2007-07-06 | トラフィック監視システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007178777A JP4852486B2 (ja) | 2007-07-06 | 2007-07-06 | トラフィック監視システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009017393A true JP2009017393A (ja) | 2009-01-22 |
JP4852486B2 JP4852486B2 (ja) | 2012-01-11 |
Family
ID=40357695
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007178777A Active JP4852486B2 (ja) | 2007-07-06 | 2007-07-06 | トラフィック監視システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4852486B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013125189A1 (ja) | 2012-02-20 | 2013-08-29 | 株式会社 東芝 | ネットワーク監視装置およびネットワーク監視方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004030287A (ja) * | 2002-06-26 | 2004-01-29 | Ntt Data Corp | 双方向型ネットワーク侵入検知システムおよび双方向型侵入検知プログラム |
JP2006229477A (ja) * | 2005-02-16 | 2006-08-31 | Fujitsu Ltd | 障害検出装置 |
JP2007074383A (ja) * | 2005-09-07 | 2007-03-22 | Yokogawa Electric Corp | 情報システム |
-
2007
- 2007-07-06 JP JP2007178777A patent/JP4852486B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004030287A (ja) * | 2002-06-26 | 2004-01-29 | Ntt Data Corp | 双方向型ネットワーク侵入検知システムおよび双方向型侵入検知プログラム |
JP2006229477A (ja) * | 2005-02-16 | 2006-08-31 | Fujitsu Ltd | 障害検出装置 |
JP2007074383A (ja) * | 2005-09-07 | 2007-03-22 | Yokogawa Electric Corp | 情報システム |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013125189A1 (ja) | 2012-02-20 | 2013-08-29 | 株式会社 東芝 | ネットワーク監視装置およびネットワーク監視方法 |
Also Published As
Publication number | Publication date |
---|---|
JP4852486B2 (ja) | 2012-01-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5418250B2 (ja) | 異常検出装置、プログラム、及び異常検出方法 | |
CN108418710B (zh) | 一种分布式监控***、方法及装置 | |
JP2014068283A (ja) | ネットワーク障害検出システムおよびネットワーク障害検出装置 | |
EP3724761B1 (en) | Failure handling in a cloud environment | |
JP2008206135A (ja) | 遠隔監視装置及び遠隔監視システム | |
JP4919935B2 (ja) | 警備システム | |
JP6007988B2 (ja) | 予備系装置、運用系装置、冗長構成システム、及び負荷分散方法 | |
JP4852486B2 (ja) | トラフィック監視システム | |
WO2016065751A1 (zh) | 恢复链路通讯的方法、业务线卡及*** | |
JP2008181458A (ja) | 遠隔監視システム | |
CN108616423B (zh) | 一种脱网设备监测方法以及装置 | |
EP3035602A1 (en) | Equipment and network health monitoring using security systems | |
JP2007028118A (ja) | ノード装置の故障判断方法 | |
JP5623449B2 (ja) | 報告書作成装置、報告書作成プログラムおよび報告書作成方法 | |
JP2007096610A (ja) | 監視情報取得装置 | |
CN108023741B (zh) | 一种监控资源使用方法及服务器 | |
CN114296979A (zh) | 一种检测物联网设备异常状态的方法及装置 | |
CN109831342A (zh) | 一种基于分布式***的故障恢复方法 | |
JP2006325118A (ja) | 監視データ収集システム | |
JP3892836B2 (ja) | 故障推定装置及び故障推定方法 | |
JP2011030094A (ja) | 移動体無線通信システム及びその障害処理方法 | |
JP4428230B2 (ja) | 機器状態変化報知方法、該方法を用いたローカル機器コントローラ及び該ローカル機器コントローラを用いた遠隔監視システム | |
CN116056123B (zh) | 一种设备检测方法、装置、电子设备及存储介质 | |
JP5884918B2 (ja) | ネットワーク管理装置、システム、および方法 | |
JP7226733B2 (ja) | 警備センタ及び警備センタの制御方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100224 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110706 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110719 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110826 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111004 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111024 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4852486 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141028 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141028 Year of fee payment: 3 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: R3D04 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |