JP2006059266A - 障害解析方法及びその装置 - Google Patents

障害解析方法及びその装置 Download PDF

Info

Publication number
JP2006059266A
JP2006059266A JP2004242659A JP2004242659A JP2006059266A JP 2006059266 A JP2006059266 A JP 2006059266A JP 2004242659 A JP2004242659 A JP 2004242659A JP 2004242659 A JP2004242659 A JP 2004242659A JP 2006059266 A JP2006059266 A JP 2006059266A
Authority
JP
Japan
Prior art keywords
pattern
failure
network
component names
function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2004242659A
Other languages
English (en)
Inventor
Kenichi Shitamachi
健一 下町
Takeshi Naka
剛 中
Norio Kamon
憲男 嘉門
Hiroko Yokota
裕子 横田
Toshimitsu Handa
利光 半田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2004242659A priority Critical patent/JP2006059266A/ja
Publication of JP2006059266A publication Critical patent/JP2006059266A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Test And Diagnosis Of Digital Computers (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

【課題】 本発明は、オペレーションシステム及びネットワーク構成要素において発生した障害を短時間かつ容易に解析できる障害解析方法及びその装置を提供することを目的とする。
【解決手段】 オペレーションシステムの機能毎に、正常に動作した場合のオペレーションシステムを構成する複数のコンポーネント及びネットワーク構成要素の処理シーケンスをコンポーネント名及びネットワーク構成要素名の時系列の並びとしてパターン化した正常パターンと、過去に発生した障害におけるコンポーネント名及びネットワーク構成要素名の時系列の並びとしてパターン化した異常パターンを保持しておき、複数のコンポーネント及びネットワーク構成要素がそれぞれ独自に取得している処理の履歴から、障害が発生した機能の処理シーケンスをコンポーネント名及びネットワーク構成要素名の時系列の並びとして抽出し検索パターンを作成し、障害が発生した機能の検索パターンと、障害が発生した機能に対応する機能として保持されている前記正常パターン及び異常パターンとを照合して障害解析を行う。
【選択図】 図2

Description

本発明は、障害解析方法及びその装置に関し、伝送装置を含むネットワーク構成要素を制御するオペレーションシステムにおける障害発生時の障害解析方法及びその装置に関する。
従来から、ネットワークを構成する伝送装置やルータ等のネットワーク構成要素をオペレーションシステムで管理し制御することが行われている。
図1は、オペレーションシステムの一例のブロック構成図を示す。同図中、オペレーションシステムは、画面表示および操作を行う複数のGUI(Graphic User Interface)端末10〜10を有するGUI部10、GUI部10から要求を受け必要な情報を取得/設定し、要求された処理を実行するためのシーケンス管理を行っている制御部12、データベースの制御やネットワーク20を構成する複数の伝送装置22〜22に対してコマンド要求などを行う基本部14、伝送装置とオペレーションシステムとの情報の送受信管理を行う通信部16、警報の管理や伝送装置の状態の管理などを行う監視部18などの複数のコンポーネントから構成されている。
ここで、保守者がGUI端末を用いて制御を行うと、オペレーションシステム内では、最初にGUI部10、次に制御部12、基本部14、通信部16、……と各コンポーネントが順次処理を行う。その際、各コンポーネントでは処理を実施したタイミングで、それぞれが独自に履歴を記録して管理する。
障害が発生した場合には、保守者はGUI部10の履歴を解析し、GUI部10として正常な処理を行っているか、即ち、正常な値を設定し、次のコンポーネントに渡しているかなどを確認する。次に、保守者は制御部12の履歴を解析し、制御部12として正常な処理を行っているかを確認する。このように、処理の流れを追い、GUI部10から通信部16に至るまでの全ての履歴を順に解析することで障害が発生している箇所を特定していた。
なお、特許文献1には、故障を申告したユーザサービスを利用する際の設備モデルを作成し、この設備モデルを構成する各サービス構成要素が故障したときの通信シーケンスを生成し、各通信シーケンスと故障申告時の観測情報を比較して故障したサービス構成要素を推定することが記載されている。
また、特許文献2には、オペレーションシステムとネットワークエレメント間で送受信される設定命令の手順と運用保守情報を詳細ログデータとして保持するとともに、装置構成情報と設定情報の内容を構成データベース内に蓄積することが記載されている。
また、特許文献3には、任意のネットワークエレメントのイベントが他のネットワークエレメントに発生させる様子をモデル化し、あるネットワークエレメントで故障が発生した場合に、故障のイベントから故障伝搬モデルを辿り、故障原因を探索することが記載されている。
特開平10−200527号公報 特開2002−318736号公報 特開平07−245609号公報
従来の技術のような履歴の取得方法では、各々の処理内容の履歴を取得することはできるが、オペレーションシステム全体の処理が記録された履歴を取得することはできない。また、障害発生時に、どの部位で問題が発生しているのかが予め分かっている場合は、履歴を取得しているため解析が容易であるが、どの部位で問題が発生しているのかが予め分からない場合は、全ての履歴を順に解析する必要があり、解析に多大な工数を必要とする。
それに加え、各コンポーネントで取得するログ取得フォーマットは、各コンポーネントによって取得したい情報がまちまちで共通化が図れないために、これもまた解析に多大な工数が必要となる要因になっている。また、規模が大きいシステムほど、システムを構成するコンポーネント数は増加するため、取得するログの種類や取得量は増加し、問題解析はより複雑さを増すという問題があった。
このような問題が発生している状況は大抵の場合が緊急事態であるため、顧客は早期問題改修を望むために、多くの時間を費やして解析を行うことが許されない場合がほとんどである。
本発明は、上記の点に鑑みなされたものであり、オペレーションシステム及びネットワーク構成要素において発生した障害を短時間かつ容易に解析できる障害解析方法及びその装置を提供することを目的とする。
請求項1に記載の発明は、通信ネットワークシステムを構成する複数のネットワーク構成要素それぞれを制御かつ監視するオペレーションシステムの障害解析方法において、
前記オペレーションシステムの機能毎に、正常に動作した場合の前記オペレーションシステムを構成する複数のコンポーネント及びネットワーク構成要素の処理シーケンスをコンポーネント名及びネットワーク構成要素名の時系列の並びとしてパターン化した正常パターンと、過去に発生した障害におけるコンポーネント名及びネットワーク構成要素名の時系列の並びとしてパターン化した異常パターンを保持しておき、
前記複数のコンポーネント及びネットワーク構成要素がそれぞれ独自に取得している処理の履歴から、障害が発生した機能の処理シーケンスをコンポーネント名及びネットワーク構成要素名の時系列の並びとして抽出し検索パターンを作成し、
前記障害が発生した機能の検索パターンと、前記障害が発生した機能に対応する機能として保持されている前記正常パターン及び異常パターンとを照合して障害解析を行うことにより、オペレーションシステム及びネットワーク構成要素において発生した障害を短時間かつ容易に解析することができる。
請求項2に記載の発明は、請求項1記載の障害解析方法において、
前記複数のコンポーネント及びネットワーク構成要素がそれぞれ独自に取得している処理の履歴は、処理対象のネットワーク構成要素名、及び取得した日時、及び処理内容のフォーマットを共通化したことにより、検索パターンを容易に作成することができる。
請求項3に記載の発明は、通信ネットワークシステムを構成する複数のネットワーク構成要素それぞれを制御かつ監視するオペレーションシステムの障害解析装置において、
前記オペレーションシステムの機能毎に、正常に動作した場合の前記オペレーションシステムを構成する複数のコンポーネント及びネットワーク構成要素の処理シーケンスをコンポーネント名及びネットワーク構成要素名の時系列の並びとしてパターン化した正常パターンと、過去に発生した障害におけるコンポーネント名及びネットワーク構成要素名の時系列の並びとしてパターン化した異常パターンを保持するパターン保持手段と、
前記複数のコンポーネント及びネットワーク構成要素がそれぞれ独自に取得している処理の履歴から、障害が発生した機能の処理シーケンスをコンポーネント名及びネットワーク構成要素名の時系列の並びとして抽出し検索パターンを作成する検索パターン作成手段と、
前記障害が発生した機能の検索パターンと、前記障害が発生した機能に対応する機能として保持されている前記正常パターン及び異常パターンとを照合して障害解析を行う照合手段を有することにより、オペレーションシステム及びネットワーク構成要素において発生した障害を短時間かつ容易に解析することができる。
請求項4に記載の発明は、請求項3記載の障害解析装置において、
前記複数のコンポーネント及びネットワーク構成要素がそれぞれ独自に取得している処理の履歴は、処理対象のネットワーク構成要素名、及び取得した日時、及び処理内容のフォーマットを共通化したことにより、検索パターンを容易に作成することができる。
請求項5に記載の発明は、請求項3または4記載の障害解析装置において、
前記照合手段における前記検索パターンと前記正常パターン及び異常パターンとの照合結果が不一致の場合、前記検索パターンを新たな異常パターンとして前記パターン保持手段に追加保持する追加保持手段を有することにより、予め想定することができなかった新たな異常に対しても、それ以降、同じ異常が発生した場合には、迅速な対応が可能となる。
本発明によれば、オペレーションシステム及びネットワーク構成要素において発生した障害を短時間かつ容易に解析できる。
以下、図面に基づいて本発明の実施形態について説明する。
図2は、本発明の障害解析方法の一実施形態を説明するためのオペレーションシステムを含むブロック構成図を示す。同図中、オペレーションシステムは、画面表示および操作を行う複数のGUI(Graphic User Interface)端末30〜30を有するGUI部30、GUI部30から要求を受け必要な情報を取得/設定し、要求された処理を実行するためのシーケンス管理を行っている制御部32、データベースの制御やネットワーク40を構成する複数の伝送装置42〜42に対してコマンド要求などを行う基本部34、伝送装置とオペレーションシステムとの情報の送受信管理を行う通信部36、警報の管理や伝送装置の状態の管理などを行う監視部38などの複数のコンポーネントから構成されている。
GUI部30は処理を実施する毎にGUI履歴31に履歴を記録して管理し、制御部32は処理を実施する毎に制御部履歴33に履歴を記録して管理し、基本部34は処理を実施する毎に基本部履歴35に履歴を記録して管理し、通信部36は処理を実施する毎に通信部履歴37に履歴を記録して管理し、監視部38は処理を実施する毎に監視部履歴39に履歴を記録して管理する。また、各伝送装置42〜42それぞれは処理を実施する毎に伝送装置履歴43〜43それぞれに履歴を記録して管理する。
この際に、各コンポーネント及び伝送装置は履歴の先頭にヘッダ情報を付加して記録する。図3は、GUI履歴31におけるヘッダの一実施形態を示す。同図中、ヘッダは処理を行った日時と、処理対象の伝送装置番号である対象装置と、どのような処理を行ったかを表わす処理内容が設定されている。なお、各ヘッダの先頭には例えば「###」等のヘッダ識別子が設けられている。制御部履歴33、基本部履歴35、通信部履歴37、監視部履歴39、伝送装置履歴43〜43それぞれのヘッダ情報についても図3のGUI履歴31と同様である。
図2に示す履歴解析部44は、例えば障害発生時に、GUI履歴31、制御部履歴33、基本部履歴35、通信部履歴37、監視部履歴39、伝送装置履歴43〜43それぞれをアクセスして処理対象に関するヘッダ情報を抽出して時系列に並べることで検索パターンを作成する。そして、この検索パターンをデータベース46に登録されているシーケンスパターンと照合(マッチング)して正常/異常判定を行う。
データベース46には、オペレーションシステムに、システムとして提供している機能(制御)の処理をパターン化したシーケンスパターンが格納されている。シーケンスパターンは、図4に示すように、機能名と、対象装置番号1、対象装置番号2(処理によっては複数の装置に対して制御を行うものも存在するため)、履歴名(コンポーネント名及び伝送装置名)、処理内容、シーケンス番号が記録されており、機能毎に予め生成された正常パターンと、過去に起きた一または複数の異常パターンが格納されている。更に、異常パターンには、問題概要や障害原因や対処方法等を任意に記録できる。
履歴解析部44において、検索スパターンが正常パターンと一致した場合には当該機能の処理は正常であり、異常パターンと一致した場合はその異常パターンに記録されている問題概要や障害原因や対処方法等を参照して、保守作業に即座に対応することが可能となる。
ここで、伝送装置42(#1)に対してパッケージを装着して使用可能とするPKG登録を行い正常終了した場合の処理シーケンスを図5に示す。
図5において、GUI部30にてPKG登録要求を行う(1)。なお、括弧内はシーケンス番号を示す。次に、制御部32はPKG登録要求のパラメータ設定を行い(2)、このPKG登録要求を基本部34に通知する(3)。基本部34はPKG登録要求を通信部36に通知し(4)、通信部36はPKG登録要求を伝送装置42に通知する(5)。
伝送装置42はPKG登録を実行し(6)、PKG登録の応答を行う(7)。通信部36はPKG登録応答を基本部34に通知する(8)。基本部34はPKG登録応答を自装置のデータベースに登録を行い(9)、PKG登録応答を制御部32に通知する(10)。制御部32はPKG登録応答をGUI部30に通知し(11)、GUI部30はPKG登録結果の表示を行う(12)。
次に、伝送装置42で警報が発生すると(13)、通信部36は警報を基本部34に通知する(14)。基本部34は警報を監視部38に通知し(15)、監視部38は警報を自装置のデータベースに登録を行い(16)、警報をGUI部30に通知する(17)。GUI部30は警報の表示を行う(18)。
図5に示す処理シーケンスを実行した場合には、図6に示すシーケンスパターンが生成されて正常パターンとしてデータベース46に格納される。また、図5に示すPKG登録の処理シーケンスを行った場合、GUI部30の履歴は図3の日時(2004/05/06/20:00:00)の3つのレコードに示すようになる。なお、図3においては、伝送装置42(#2)のPKG削除を行ったのち、伝送装置42(#1)のPKG登録を2回連続して行った場合を示している。
図7は、履歴解析部44が実行する処理のフローチャートを示す。ステップS10で解析情報を指定する。解析情報としては、対象装置番号と機能名と実施時間(開始日時と終了日時)が入力され、この他に付加情報が指定される場合もある。
ステップS12で履歴解析部44はGUI履歴31、制御部履歴33、基本部履歴35、通信部履歴37、監視部履歴39、伝送装置履歴43〜43それぞれをアクセスして対象装置が解析情報の対象装置番号と一致し、かつ、日時が解析情報の実施時間(開始日時と終了日時)内にあるヘッダ情報を抽出し、抽出したヘッダ情報の日時が昇順となるよう時系列に並べ、この時系列に並べたヘッダ情報に対応する(即ち、読み出した)履歴名の並びを検索パターンとして抽出する。
次に、ステップS14で上記検索パターンをデータベース46に格納されている対象装置番号と機能名が対応する正常パターンと照合し、ステップS16で検索パターンが正常パターンと一致したか否かを判別する。ここで検索パターンが正常パターンと一致した場合には、当該対象装置番号と機能名についての実施時間内の処理が正常であるとして、この処理を終了する。
一方、検索パターンが正常パターンと不一致の場合には、ステップS20でデータベース46に格納されている対象装置番号と機能名が対応する異常パターンの中から1つの異常パターンを選択し、検索パターンを選択した異常パターンと照合し、ステップS22で検索パターンがこの異常パターンと一致したか否かを判別する。ここで検索パターンが異常パターンと一致した場合には、ステップS24で当該異常パターンに記録されている問題概要や障害原因や対処方法等を参照して障害箇所を特定する。
また、ステップS22で検索パターンが異常パターンと不一致の場合には、ステップS26でまだ照合を行っていない他の異常パターンがあるか否かを判別し、まだ照合を行っていない他の異常パターンがあればステップS28で他の異常パターンを選択してステップS20に進み、ステップS20〜S26を繰り返す。
ステップS26で照合を行っていない他の異常パターンがない場合にはステップS30で検索パターンを、対象装置番号と機能名が対応する新たな異常パターンとしてデータベース46に格納し処理を終了する。なお、この新たな異常パターンの問題概要や障害原因や対処方法等は新たな異常パターンの更なる解析を行ったのち記録する。
ここで、データベース46に、伝送装置のPKG登録における正常パターンとして図8(A)に示すパターンが格納され、伝送装置のPKG登録における第1異常パターンとして図8(B)に示すパターンが格納され、伝送装置のPKG登録における第2異常パターンとして図8(C)に示すパターンが格納されているものとする。
伝送装置42(#1)のPKG登録を行ったが異常終了したために、履歴解析部44で図7の処理を行い、ステップS12で図9に示す検索パターンが得られた場合、この図9の検索パターンはステップS16で図8(A)の正常パターンと不一致となる。また、ステップS22で図8(B)に示す異常パターンと不一致となるが、再度のステップS22で図8(C)に示す異常パターンと一致する。このため、ステップS24では伝送装置42(#1)にタイムアウト異常が発生した旨の異常診断がなされる。
このように、検索パターンと正常または異常パターンとの履歴名同士を順次照合して順次解析を行うことで、パターン内の全ての情報を比較する手間が省け、正常時もしくは障害発生時の識別を高速に行うことが可能となる。
ところで、対象装置番号と機能名毎の図8(B),(C)に示すような複数の異常パターンについて、保守者が予め優先順位をつける。例えば最優先の優先順位1の異常パターンは3パターン、優先順位2の異常パターンは3パターン、優先順位3の異常パターンは5パターンとする。そして、図7のステップS10で付加情報として優先度nを指定し、ステップS14,S28では優先順位1のものから順に異常パターンを選択し、優先順位が優先度nとなるまで検索パターンと異常パターンとの照合を行い、優先順位が上記優先度nを超えたとき照合を終了する構成とする。
この場合は、図10に示すように、ある対象装置番号と機能名について、20パターンの異常パターンが存在する場合にも、優先度n=2が指定されると、優先順位2までの例えば6パターンの異常パターンが検索パターンと照合される。これによって、照合に用いる異常パターン数を規定することで簡易的な障害解析が可能となる。
更に、対象装置番号と機能名毎の異常パターンに保守者が予め優先順位をつける代りに、照合によって検索パターンと一致した回数を異常パターン毎にカウントしておく。なお、異常パターンがデータベース46に登録された時点では、そのカウント値は0とする。図7の処理を開始する前に、検索パターンと一致した回数(頻度)が多い異常パターンから順に優先順位をつける。即ち、検索一致頻度が最大の異常パターンに優先順位1を付け、検索一致頻度が2番目の異常パターンに優先順位2を付け、検索一致頻度が3番目の異常パターンに優先順位3を付ける。
この場合は、図11に示すように、ある対象装置番号と機能名について、20パターンの異常パターンが存在し、第1異常パターンの照合一致回数が1であり、第2異常パターンの照合一致回数が5であり、第3異常パターンの照合一致回数が2であり、残りの異常パターンの照合一致回数が0の場合、優先度n=3が指定されると、最初に第2異常パターンが検索パターンと照合される。これが不一致の場合には第3異常パターンが検索パターンと照合され、更に不一致のとき第1異常パターンが検索パターンと照合される。
このように、照合一致回数が多い、即ち、一致する確率の高い異常パターンから順に検索パターンと照合されるため、障害解析に要する時間を短縮することができる。
本発明によれば、検索パターンが正常パターンと一致すると処理は正常であり、過去に発生し履歴として管理されている異常パターンと一致した場合には、その異常パターンによって障害要因が特定できるので、適切な対処方法を迅速に保守者に通知することができる。その結果、従来では1つの障害あたり保守者が2〜3日の解析時間を費やしていたものが、例えば分オーダで障害解析が可能となる。更に、障害発生時に注入する社内リソースを最小限に抑えるだけでなく、障害の早期解決を希望する顧客要望をも満たすことが可能となる。
また、検索パターンが正常パターンと全ての異常パターンと一致しなかった場合においても、この検索パターンを新たなパターンとして保持管理することにより、予め想定することができなかった新たな異常に対しても、それ以降、同じ異常が発生した場合には、迅速な対応が可能となる。
なお、データベース46が請求項記載のパターン保持手段に対応し、ステップS12が検索パターン作成手段に対応し、ステップS14,S20が照合手段に対応し、ステップS30が追加保持手段に対応する。
(付記1)
通信ネットワークシステムを構成する複数のネットワーク構成要素それぞれを制御かつ監視するオペレーションシステムの障害解析方法において、
前記オペレーションシステムの機能毎に、正常に動作した場合の前記オペレーションシステムを構成する複数のコンポーネント及びネットワーク構成要素の処理シーケンスをコンポーネント名及びネットワーク構成要素名の時系列の並びとしてパターン化した正常パターンと、過去に発生した障害におけるコンポーネント名及びネットワーク構成要素名の時系列の並びとしてパターン化した異常パターンを保持しておき、
前記複数のコンポーネント及びネットワーク構成要素がそれぞれ独自に取得している処理の履歴から、障害が発生した機能の処理シーケンスをコンポーネント名及びネットワーク構成要素名の時系列の並びとして抽出し検索パターンを作成し、
前記障害が発生した機能の検索パターンと、前記障害が発生した機能に対応する機能として保持されている前記正常パターン及び異常パターンとを照合して障害解析を行うことを特徴とする障害解析方法。
(付記2)
付記1記載の障害解析方法において、
前記複数のコンポーネント及びネットワーク構成要素がそれぞれ独自に取得している処理の履歴は、処理対象のネットワーク構成要素名、及び取得した日時、及び処理内容のフォーマットを共通化したことを特徴とする障害解析方法。
(付記3)
通信ネットワークシステムを構成する複数のネットワーク構成要素それぞれを制御かつ監視するオペレーションシステムの障害解析装置において、
前記オペレーションシステムの機能毎に、正常に動作した場合の前記オペレーションシステムを構成する複数のコンポーネント及びネットワーク構成要素の処理シーケンスをコンポーネント名及びネットワーク構成要素名の時系列の並びとしてパターン化した正常パターンと、過去に発生した障害におけるコンポーネント名及びネットワーク構成要素名の時系列の並びとしてパターン化した異常パターンを保持するパターン保持手段と、
前記複数のコンポーネント及びネットワーク構成要素がそれぞれ独自に取得している処理の履歴から、障害が発生した機能の処理シーケンスをコンポーネント名及びネットワーク構成要素名の時系列の並びとして抽出し検索パターンを作成する検索パターン作成手段と、
前記障害が発生した機能の検索パターンと、前記障害が発生した機能に対応する機能として保持されている前記正常パターン及び異常パターンとを照合して障害解析を行う照合手段を
有することを特徴とする障害解析装置。
(付記4)
付記3記載の障害解析装置において、
前記複数のコンポーネント及びネットワーク構成要素がそれぞれ独自に取得している処理の履歴は、処理対象のネットワーク構成要素名、及び取得した日時、及び処理内容のフォーマットを共通化したことを特徴とする障害解析装置。
(付記5)
付記3または4記載の障害解析装置において、
前記照合手段における前記検索パターンと前記正常パターン及び異常パターンとの照合結果が不一致の場合、前記検索パターンを新たな異常パターンとして前記パターン保持手段に追加保持する追加保持手段を
有することを特徴とする障害解析装置。
(付記6)
付記3乃至5のいずれか記載の障害解析装置において、
前記パターン保持手段に機能毎に保持されている各異常パターンに予め優先順位を付け、
前記照合手段は、優先順位の高い異常パターンから順に前記検索パターンと照合することを特徴とする障害解析装置。
(付記7)
付記6記載の障害解析装置において、
前記パターン保持手段に機能毎に保持されている各異常パターンに予め優先順位を付け、
前記照合手段は、優先順位の高い異常パターンから順に前記検索パターンと照合し、異常パターンの優先順位が付加情報として指定された優先度より低くなると照合を終了することを特徴とする障害解析装置。
(付記8)
付記3乃至5のいずれか記載の障害解析装置において、
前記パターン保持手段に機能毎に保持されている各異常パターンについて検索パターンとの照合で一致した頻度を保持し、
前記照合手段は、前記頻度の高い異常パターンから順に前記検索パターンと照合することを特徴とする障害解析装置。
(付記9)
付記8記載の障害解析装置において、
前記照合手段は、前記頻度の高い順に各異常パターンに予め優先順位を付け、優先順位の高い異常パターンから順に前記検索パターンと照合し、異常パターンの優先順位が付加情報として指定された優先度より低くなると照合を終了することを特徴とする障害解析装置。
(付記10)
付記3乃至8のいずれか記載の障害解析装置において、
前記パターン保持手段は、各異常パターンに対応した問題概要及び対処方法の少なくともいずれか一方を前記各異常パターンに対応して保持することを特徴とする障害解析装置。
オペレーションシステムの一例のブロック構成図である。 本発明の障害解析方法の一実施形態を説明するためのオペレーションシステムを含むブロック構成図である。 GUI履歴におけるヘッダの一実施形態を示す図である。 データベースに格納されているシーケンスパターンを示す図である。 PKG登録の処理シーケンスを示す図である。 PKG登録のシーケンスパターンを示す図である。 履歴解析部が実行する処理のフローチャートである。 PKG登録の正常パターンと異常パターンを示す図である。 検索パターンを示す図である。 優先度指定の照合処理を説明するための図である。 頻度に応じた順の照合処理を説明するための図である。
符号の説明
30 GUI部
30〜30 GUI端末
31 GUI履歴
32 制御部
33 制御部履歴
34 基本部
35 基本部履歴
36 通信部
37 通信部履歴
38 監視部
39 監視部履歴
40 ネットワーク
42〜42 伝送装置
43〜43 伝送装置履歴
44 履歴解析部
46 データベース

Claims (5)

  1. 通信ネットワークシステムを構成する複数のネットワーク構成要素それぞれを制御かつ監視するオペレーションシステムの障害解析方法において、
    前記オペレーションシステムの機能毎に、正常に動作した場合の前記オペレーションシステムを構成する複数のコンポーネント及びネットワーク構成要素の処理シーケンスをコンポーネント名及びネットワーク構成要素名の時系列の並びとしてパターン化した正常パターンと、過去に発生した障害におけるコンポーネント名及びネットワーク構成要素名の時系列の並びとしてパターン化した異常パターンを保持しておき、
    前記複数のコンポーネント及びネットワーク構成要素がそれぞれ独自に取得している処理の履歴から、障害が発生した機能の処理シーケンスをコンポーネント名及びネットワーク構成要素名の時系列の並びとして抽出し検索パターンを作成し、
    前記障害が発生した機能の検索パターンと、前記障害が発生した機能に対応する機能として保持されている前記正常パターン及び異常パターンとを照合して障害解析を行うことを特徴とする障害解析方法。
  2. 請求項1記載の障害解析方法において、
    前記複数のコンポーネント及びネットワーク構成要素がそれぞれ独自に取得している処理の履歴は、処理対象のネットワーク構成要素名、及び取得した日時、及び処理内容のフォーマットを共通化したことを特徴とする障害解析方法。
  3. 通信ネットワークシステムを構成する複数のネットワーク構成要素それぞれを制御かつ監視するオペレーションシステムの障害解析装置において、
    前記オペレーションシステムの機能毎に、正常に動作した場合の前記オペレーションシステムを構成する複数のコンポーネント及びネットワーク構成要素の処理シーケンスをコンポーネント名及びネットワーク構成要素名の時系列の並びとしてパターン化した正常パターンと、過去に発生した障害におけるコンポーネント名及びネットワーク構成要素名の時系列の並びとしてパターン化した異常パターンを保持するパターン保持手段と、
    前記複数のコンポーネント及びネットワーク構成要素がそれぞれ独自に取得している処理の履歴から、障害が発生した機能の処理シーケンスをコンポーネント名及びネットワーク構成要素名の時系列の並びとして抽出し検索パターンを作成する検索パターン作成手段と、
    前記障害が発生した機能の検索パターンと、前記障害が発生した機能に対応する機能として保持されている前記正常パターン及び異常パターンとを照合して障害解析を行う照合手段を
    有することを特徴とする障害解析装置。
  4. 請求項3記載の障害解析装置において、
    前記複数のコンポーネント及びネットワーク構成要素がそれぞれ独自に取得している処理の履歴は、処理対象のネットワーク構成要素名、及び取得した日時、及び処理内容のフォーマットを共通化したことを特徴とする障害解析装置。
  5. 請求項3または4記載の障害解析装置において、
    前記照合手段における前記検索パターンと前記正常パターン及び異常パターンとの照合結果が不一致の場合、前記検索パターンを新たな異常パターンとして前記パターン保持手段に追加保持する追加保持手段を
    有することを特徴とする障害解析装置。
JP2004242659A 2004-08-23 2004-08-23 障害解析方法及びその装置 Withdrawn JP2006059266A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004242659A JP2006059266A (ja) 2004-08-23 2004-08-23 障害解析方法及びその装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004242659A JP2006059266A (ja) 2004-08-23 2004-08-23 障害解析方法及びその装置

Publications (1)

Publication Number Publication Date
JP2006059266A true JP2006059266A (ja) 2006-03-02

Family

ID=36106669

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004242659A Withdrawn JP2006059266A (ja) 2004-08-23 2004-08-23 障害解析方法及びその装置

Country Status (1)

Country Link
JP (1) JP2006059266A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010067048A (ja) * 2008-09-11 2010-03-25 Fujitsu Ltd メッセージパターン生成プログラム、方法及び装置
JP2011199883A (ja) * 2011-05-12 2011-10-06 Buffalo Inc 無線lanアクセスポイント装置、不正マネジメントフレーム検出方法
US8448025B2 (en) 2008-03-07 2013-05-21 Nec Corporation Fault analysis apparatus, fault analysis method, and recording medium
JP2014102717A (ja) * 2012-11-21 2014-06-05 Mitsubishi Electric Corp システム試験支援装置
JP5529351B1 (ja) * 2013-03-26 2014-06-25 三菱電機株式会社 エンジニアリングツール
US9612898B2 (en) 2013-06-03 2017-04-04 Nec Corporation Fault analysis apparatus, fault analysis method, and recording medium
JP2018508167A (ja) * 2015-01-26 2018-03-22 ノキア ソリューションズ アンド ネットワークス オサケユキチュア シグナリングセット又はコールの分析及び分類

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8448025B2 (en) 2008-03-07 2013-05-21 Nec Corporation Fault analysis apparatus, fault analysis method, and recording medium
JP2010067048A (ja) * 2008-09-11 2010-03-25 Fujitsu Ltd メッセージパターン生成プログラム、方法及び装置
JP2011199883A (ja) * 2011-05-12 2011-10-06 Buffalo Inc 無線lanアクセスポイント装置、不正マネジメントフレーム検出方法
JP2014102717A (ja) * 2012-11-21 2014-06-05 Mitsubishi Electric Corp システム試験支援装置
JP5529351B1 (ja) * 2013-03-26 2014-06-25 三菱電機株式会社 エンジニアリングツール
WO2014155517A1 (ja) * 2013-03-26 2014-10-02 三菱電機株式会社 エンジニアリングツール
CN105051701A (zh) * 2013-03-26 2015-11-11 三菱电机株式会社 设计工具
US9612898B2 (en) 2013-06-03 2017-04-04 Nec Corporation Fault analysis apparatus, fault analysis method, and recording medium
JP2018508167A (ja) * 2015-01-26 2018-03-22 ノキア ソリューションズ アンド ネットワークス オサケユキチュア シグナリングセット又はコールの分析及び分類

Similar Documents

Publication Publication Date Title
CN107451040B (zh) 故障原因的定位方法、装置及计算机可读存储介质
US8219548B2 (en) Data processing method and data analysis apparatus
US20090271351A1 (en) Rules engine test harness
JP5223413B2 (ja) Itシステムのトラブル対処装置、トラブル対処方法およびそのためのプログラム
US7756971B2 (en) Method and system for managing programs in data-processing system
US8990372B2 (en) Operation managing device and operation management method
CN110377481B (zh) 日志管理方法、装置、设备及存储介质
EP3059676B1 (en) A method and apparatus for analyzing the availability of a system, in particular of a safety critical system
CN110851324B (zh) 基于日志的巡检处理方法、装置以及电子设备、存储介质
JP2018173703A (ja) 障害解析装置、障害解析方法および障害解析プログラム
US20140330756A1 (en) Automated alerting rules recommendation and selection
CN112463588A (zh) 一种自动化测试***及方法、存储介质、计算设备
CN106815137A (zh) 用户界面测试方法与装置
JP2006059266A (ja) 障害解析方法及びその装置
CN108650123B (zh) 故障信息记录方法、装置、设备和存储介质
CN111752819B (zh) 一种异常监控方法、装置、***、设备和存储介质
US10430300B2 (en) Predictive analysis, scheduling and observation system for use with loading multiple files
CN111124828B (zh) 一种数据处理方法、装置、设备及存储介质
JP4886404B2 (ja) ソースコード修正優先度付けシステムおよびその優先度付け方法
CN110489256B (zh) 一种宕机定位修复方法及***
JP2012256143A (ja) 保守管理システム、作業優先順位算出方法およびプログラム
CN115098378A (zh) 基于异常断点分类聚合日志片段的方法、装置
JP4575020B2 (ja) 障害解析装置
Chan et al. Debugging incidents in Google's distributed systems
CN113285824A (zh) 一种监控网络配置命令安全性的方法及装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20071106