JPWO2019116418A1 - 障害分析装置、障害分析方法および障害分析プログラム - Google Patents

障害分析装置、障害分析方法および障害分析プログラム Download PDF

Info

Publication number
JPWO2019116418A1
JPWO2019116418A1 JP2019559425A JP2019559425A JPWO2019116418A1 JP WO2019116418 A1 JPWO2019116418 A1 JP WO2019116418A1 JP 2019559425 A JP2019559425 A JP 2019559425A JP 2019559425 A JP2019559425 A JP 2019559425A JP WO2019116418 A1 JPWO2019116418 A1 JP WO2019116418A1
Authority
JP
Japan
Prior art keywords
cause
attribute
failure
occurred
discriminant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019559425A
Other languages
English (en)
Inventor
秋元 一郎
一郎 秋元
洋介 本橋
洋介 本橋
澤田 直樹
直樹 澤田
横井 大輔
大輔 横井
雅之 池田
雅之 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2019116418A1 publication Critical patent/JPWO2019116418A1/ja
Priority to JP2021202972A priority Critical patent/JP7173273B2/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2132Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on discrimination criteria, e.g. discriminant analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/40Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass for recovering from a failure of a protocol instance or entity, e.g. service redundancy protocols, protocol state redundancy or protocol service redirection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computer Security & Cryptography (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Debugging And Monitoring (AREA)
  • Maintenance And Management Of Digital Transmission (AREA)

Abstract

障害分析装置10は、所定の障害の原因に対応付けられた属性である原因属性が用いられて学習された所定の障害の発生の有無を判別するためのモデルである学習モデルと属性の値とに基づいて所定の障害が発生したか否かを判別し、発生したと判別された所定の障害の原因および対処方法を特定する特定部11を備える。

Description

本発明は、障害分析装置、障害分析方法および障害分析プログラムに関する。
図9は、通信サービスを提供するために使用される通信システムの構成例を示すブロック図である。図9に示すように、通信システムは、ペアをなす通信機器を含む。また、通信システムは、基地局およびルータと通信可能に接続されている。
上述したような通信システムが世界各地で運用されているが、運用中には様々な障害が発生する場合がある。発生する障害には、例えば、通信システムを経由するパケットデータが設計されたスループット以下のスループットでしか転送されないような低スループット障害がある。
また、例えば、通信システムを経由するパケットデータの一部が欠落するようなパケットロスがある。また、例えば、送信機と受信機との間でパケットデータが殆ど転送されないようなゼロトラフィック障害がある。
発生した障害に迅速に対応するためには、障害の原因を速やかに特定することが重要である。本明細書では、障害の原因を「内的原因」、「外的原因」のいずれかに分類して考える。
「内的原因」には、例えば、ペアをなす通信機器の間で発生した原因が該当する。具体的には、一方の通信機器が備えるアンテナの向きと他方の通信機器が備えるアンテナの向きがずれている事象が、内的原因として考えられる。
また、LOS(Line of Sight)に木等の障害物が存在する事象や、ペアをなす通信機器の間の無線電波が干渉される無線干渉が生じる事象も、内的原因として考えられる。
また、無線回線における変調方式に対する自動最適化機能が頻発する事象(品質劣化)、Burst Traffic が発生する事象、およびQoS(Quality of Service) の設定ミスも、内的原因として考えられる。
「外的原因」には、例えば、ペアをなす通信機器の外側(換言すれば、ペアをなす通信機器の間以外)で発生した原因が該当する。具体的には、通信システムと通信可能に接続するルータや基地局の故障が、外的原因として考えられる。
また、コンピュータウイルスを含むデータのような受信対象として想定されていないデータが受信される事象も、外的原因として考えられる。また、無線通信に支障を来すようなイベントの開催等、通信システムが設置されている地域に特有の事象も、外的原因として考えられる。
上記のように、通信システムの運用中に発生する障害の原因として、多くの候補が考えられる。考えられる候補が真の原因であるか否かに関して、各候補に対して人手で検証する方法は、多くの時間を要するため現実的に採用され得る方法ではない。
障害の原因を分析できるモデルを生成する技術、または障害の発生を予測できるモデルを生成する技術が、例えば特許文献1〜3に記載されている。
特許文献1には、接続端末に発生する異常の発生原因として複数の原因を想定し、想定された原因によって引き起こされる端末の状態を予め学習し、各接続端末の状態を示す情報を各接続端末から収集する異常発生原因特定装置が記載されている。
特許文献1に記載されている異常発生原因特定装置は、異常検出装置において異常が検出された際に、異常の発生に関係のある端末の状態が学習済みの状態のうち、どの状態に最も近いかを統計学に基づく判別分析によって推定し、その状態が属する原因を異常が発生した原因として特定する。
また、特許文献2には、入力された障害部位と障害現象を検索キーとして事例データベースを検索し、検索により得られた事例レコードの原因部位と頻度を基に障害の原因を推定して提示するネットワーク障害推定方法が記載されている。
また、特許文献3には、学習サーバが受信した時系列のセンサデータを教師データとして監視対象機器の故障を予測する学習モデルを生成する故障予測システムが記載されている。
特許文献3に記載されている故障予測装置は、監視対象機器に故障が発生したときに監視対象機器が故障するまでの時系列のセンサデータを学習サーバに送信する。また、故障予測装置は、学習モデルを用いて監視対象機器から受信した時系列のセンサデータを入力として監視対象機器が故障する確率を予測する。
また、特許文献4には、異種混合学習技術を用いて学習モデルを生成する学習器の例が記載されている。
特開2007−189644号公報 特開2005−269238号公報 特開2016−173782号公報 米国特許出願公開第2014/0222741号明細書
障害が発生した可能性がある場合、速やかに原因を特定できることが好ましい。また、特定された原因への対処方法も併せて特定できることが好ましい。
[発明の目的]
そこで、本発明は、上述した課題を解決する、発生した障害の原因および対処方法を速やかに特定できる障害分析装置、障害分析方法および障害分析プログラムを提供することを目的とする。
本発明による障害分析装置は、所定の障害の原因に対応付けられた属性である原因属性が用いられて学習された所定の障害の発生の有無を判別するためのモデルである学習モデルと属性の値とに基づいて所定の障害が発生したか否かを判別し、発生したと判別された所定の障害の原因および対処方法を特定する特定部を備えることを特徴とする。
本発明による障害分析方法は、所定の障害の原因に対応付けられた属性である原因属性が用いられて学習された所定の障害の発生の有無を判別するためのモデルである学習モデルと属性の値とに基づいて所定の障害が発生したか否かを判別し、発生したと判別された所定の障害の原因および対処方法を特定することを特徴とする。
本発明による障害分析プログラムは、コンピュータに、所定の障害の原因に対応付けられた属性である原因属性が用いられて学習された所定の障害の発生の有無を判別するためのモデルである学習モデルと属性の値とに基づいて所定の障害が発生したか否かを判別する判別処理、および発生したと判別された所定の障害の原因および対処方法を特定する特定処理を実行させることを特徴とする。
本発明によれば、発生した障害の原因および対処方法を速やかに特定できる。
本発明による障害分析装置の第1の実施形態の構成例を示すブロック図である。 データ記憶部102が記憶する教師データの例を示す説明図である。 障害の原因、原因属性、および対処方法の例を示す説明図である。 モデル生成部103が生成する異種混合学習によって得られる学習モデルの例を示す説明図である。 モデル生成部103が生成する決定木の例を示す説明図である。 第1の実施形態の障害分析装置100による障害分析処理の動作を示すフローチャートである。 本発明による障害分析装置のハードウェア構成例を示す説明図である。 本発明による障害分析装置の概要を示すブロック図である。 通信サービスを提供するために使用される通信システムの構成例を示すブロック図である。
実施形態1.
[構成の説明]
以下、本発明の実施形態を、図面を参照して説明する。図1は、本発明による障害分析装置の第1の実施形態の構成例を示すブロック図である。
図1に示すように、本実施形態の障害分析装置100は、データ受信部101と、データ記憶部102と、モデル生成部103と、モデル記憶部104と、特定部105とを備える。
データ受信部101は、障害分析対象の装置から送信された取得対象のデータを受信する機能を有する。例えば、データ受信部101は、モバイル通信で使用されているネットワーク機器が出力するログ情報を所定の時間間隔で受信する。
データ受信部101は、受信されたデータをデータ記憶部102に入力する。また、データ受信部101は、パケットロス等の障害が発生した可能性がある時に受信されたデータを特定部105に入力する。
データ記憶部102は、データ受信部101から入力されたデータを教師データとして記憶する機能を有する。データ記憶部102は、障害分析対象の装置の過去のログ情報、および障害の発生有無に関する情報を記憶する。
図2は、データ記憶部102が記憶する教師データの例を示す説明図である。データ記憶部102が記憶する教師データの一部は、過去に発生した障害である過去障害の内容を示す情報である。
図2に示す教師データは、日付と、時刻と、属性と、障害発生情報とを含む。日付および時刻は、例えば障害分析対象の装置が取得対象のデータを記録した日付および時刻である。
また、図2に示すように、属性には、原因属性と、原因属性ではない属性とが含まれる。原因属性には、「第1原因属性」〜「第5原因属性」が含まれる。
本実施形態では、原因に対応付けられた属性を原因属性と記す。図3は、障害の原因、原因属性、および対処方法の例を示す説明図である。図3に示す障害の原因は、いずれも低スループット障害の原因である。
図3に示すように、管理者は、低スループット障害の原因ごとに、原因に対応する属性を予め原因属性として定める。また、管理者は、原因に対応する対処方法も予め定める。管理者は、事前に定められた関係を示す情報を、例えばモデル記憶部104に記憶させる。
例えば、管理者は、「アンテナの方向ずれ」という原因に「回線断やエラーが6時間以上継続して発生」、「受信レベルが通常状態の閾値より減少」等の原因属性と、「現地に作業員を派遣」という対処方法とを対応付ける。
なお、図3に示すように「アンテナの方向ずれ」という原因に対して「天候依存性は小さい」ため、学習されるモデルにおける天候依存性を示す原因属性の値は、比較的小さくなる。
また、管理者は、「無線回線における変調方式の自動最適化機能の頻発(品質劣化)」という原因に「電波受信強度が大きく変動」、「パフォーマンスモニタのエラーが散発的に発生」等の原因属性と、「増速」、「アンテナ交換・方向調整」等の対処方法とを対応付ける。
なお、図3に示すように「無線回線における変調方式の自動最適化機能の頻発(品質劣化)」という原因に対して「天候依存性は大きい」ため、学習されるモデルにおける天候依存性を示す原因属性の値は、比較的大きくなる。
また、管理者は、「Burst Traffic の発生」という原因に「回線断が発生していない状況におけるパケットロスの発生」という原因属性と、「増速」、「対向装置のQoS 設定」等の対処方法とを対応付ける。
また、管理者は、「QoS 設定ミス」という原因に「所定の閾値以上の帯域使用率におけるパケットロスの発生」という原因属性と、「設定変更」という対処方法とを対応付ける。
また、管理者は、「イベントの発生、当該機器以外での故障・障害発生」という原因に「前週分からのトラフィックの急激な変化」という原因属性と、「キャンペーン等の実施確認」、「他機器管理部門への確認」等の対処方法とを対応付ける。管理者は、上記の各対応関係を示す情報を、例えばモデル記憶部104に記憶する。
図2に示すように、「第1原因属性」は、「回線断やエラーが6時間以上継続して発生」である。「第1原因属性」には、パフォーマンスモニタおよびトラフィック情報を基に「1」か「0」が記録される。パフォーマンスモニタおよびトラフィック情報は、実行されている無線通信の性能をそれぞれ示す情報である。
例えば、6時間以上無線通信において回線断やエラーが継続して発生していたことがパフォーマンスモニタおよびトラフィック情報から確認された場合、「第1原因属性」に「1」が記録される。
また、6時間以上無線通信において回線断やエラーが継続して発生していたことがパフォーマンスモニタおよびトラフィック情報から確認されなかった場合、「第1原因属性」に「0」が記録される。「第2原因属性」〜「第5原因属性」にも、同様に「1」か「0」が記録される。
なお、図2に示す原因属性には「0」か「1」が記録されているが、実数が記録される可能性がある属性が原因属性として定められてもよい。
また、原因属性ではない属性には、「機種」、「平日である」、「湿度」、「トラフィック量」が例として含まれている。
「機種」には、「1」等の障害分析対象の装置の機種が記録される。機種の記録には、障害分析対象の装置の位置、機種、設定を示す情報であるインベントリ情報が使用される。
また、インベントリ情報を用いて、例えば、寒冷地等の障害分析対象の装置の位置を示す情報が教師データに記録されてもよい。また、設定に特別な内容が含まれている等の障害分析対象の装置の設定を示す情報が教師データに記録されてもよい。
「平日である」には、平日に記録されたデータであるか否かが記録される。平日に記録されたデータである場合、「平日である」には「Yes 」が記録される。また、平日以外の日に記録されたデータである場合、「平日である」には「No」が記録される。
平日に記録されたデータであるか否かの記録には、各年月日の曜日、休日に該当する曜日、休日に該当する年月日、祝日に該当する年月日、および行事日(例えば、クリスマスやハロウィン等の年中行事が行われる日)を示す情報であるカレンダ情報が使用される。
カレンダ情報によって、各年月日が休日であるか平日であるか否かが判断される。また、カレンダ情報によって、各年月日が祝日に該当するか否かの判断や、各年月日に年中行事が行われるか否かの判断も可能となる。
「湿度」には、装置が設置されている地域の取得対象のデータが記録された当日の湿度(例えば、40(%) )が記録される。湿度の記録には、障害分析対象の装置が設置されている地域の天気の情報を示す天気情報が使用される。
天気情報は、例えば「晴れ」、「曇り」または「雨」等の種類を示す情報や、降水量、気温、湿度を示す。これらの情報は例示であり、個々の装置で使用される天気情報に、例示した天気の情報が全て含まれていなくてもよい。また、天気の情報として他の情報が、個々の装置で使用される天気情報に含まれていてもよい。
「トラフィック量」には、障害分析対象の装置で実行されている無線通信のトラフィック量が記録される。トラフィック量の記録には、パフォーマンスモニタおよびトラフィック情報が使用される。
インベントリ情報、カレンダ情報、天気情報、パフォーマンスモニタ、およびトラフィック情報以外にも、イベントの発生の有無を示すイベント情報や、キャンペーンの有無を示すキャンペーン情報が使用されて教師データが作成されてもよい。
また、装置同士の関連を示すネットワークトポロジ情報や、装置間のネットワーク回線の品質を示す回線品質情報が使用されて教師データが作成されてもよい。ネットワークトポロジ情報は、具体的には、装置同士の接続関係や接続されている装置間のトラフィックのフローの向きを示す有効グラフとして表される。
ネットワークトポロジ情報が使用されると、教師データには、例えば隣接する装置(隣接する装置にさらに隣接する装置でもよい。)の属性を示す情報が記録される。また、ネットワークトポロジ情報には、例えば、モデル生成対象装置と他の装置との接続形態(スター型、双方向型、リング型等)や、通信方法(無線、光等)、装置の接続数等が含まれてもよい。
また、装置が設置されている地域の人口動態を示す情報が使用されて教師データが作成されてもよい。都市計画が定められている場合には、人口動態を示す情報として都市計画を用いてもよい。都市計画は、人口動態を示す情報の一態様であると言うことができる。
障害発生情報は、障害の発生の有無を示す情報である。図2には、障害発生情報の例として低スループット障害の発生の有無を示す「低スループット発生」が記載されている。なお、障害発生情報は、例えばパケットロスの発生の有無、QoS ロス(Discard) 障害の発生の有無、無線ロス障害の発生の有無、または無線リンクダウン障害の発生の有無のいずれかを示してもよい。
障害発生情報として、対処方法を特定すべき障害の発生の有無を示す情報が用いられる。本実施形態では、低スループット障害への対処方法を特定する場合を例に説明する。
例えば、低スループット障害が発生していた場合、低スループット発生には「1」が記録される。また、低スループット障害が発生していなかった場合、低スループット発生には「0」が記録される。
なお、データ受信部101が取得したデータから図2に示す教師データに記録される値への加工処理は、データ受信部101が実行してもよいし、データ記憶部102が実行してもよい。
モデル生成部103は、データ記憶部102に記憶されている教師データを用いて所定の障害の発生を特定するモデルを学習する機能を有する。以下、モデル生成部103が教師データを用いて学習を実行することによって得られたモデルを学習モデルと呼ぶ。
モデル生成部103は、例えば低スループット障害の発生の有無を判別するための学習モデルを学習する場合、低スループット障害が発生している時の教師データと、低スループット障害が発生していない時の教師データとをそれぞれ所定の割合(例えば、1:1)で用いる。
モデル生成部103は、例えば各属性の値が属性に対応する説明変数にそれぞれ代入されるような学習モデルを生成する。学習モデルが生成されることによって、他の説明変数が持つ係数(重み)よりも大きな係数を持つ説明変数が、障害の発生に大きな影響を与える説明変数として特定される。本実施形態では、特定された説明変数に対応する原因属性から、発生した障害の原因が特定される。
以下、本実施形態のモデル生成部103が生成する3種類の学習モデルをそれぞれ説明する。
(1)異種混合学習によって得られる学習モデル
モデル生成部103は、特許文献4に記載されている異種混合学習を行うことによって学習モデルを生成できる。図4は、モデル生成部103が異種混合学習によって生成する学習モデルの例を示す説明図である。図4に示す楕円は、属性(説明変数)に対応する条件での分岐を表す。分岐で使用される条件を門関数と呼ぶ。
図4に示すように、異種混合学習によって得られる学習モデルは、二分木の形式で表される学習モデルである。二分木は、属性に対応する条件での分岐を表すノードと、判別式を表す葉ノードとで構成されている。
すなわち、モデル生成部103は、各属性に対応する条件での分岐が複数回行われた後、適切な判別式が提示される学習モデルを生成する。図4に示す例であれば、属性から「天候が悪化していた」→「平日である」→「回線断やエラーが6時間以上継続して発生した」→・・・と判定されると、学習モデルは、第1判別式を提示する。判別式は、例えば以下のように表される式である。
y = a1・x1 + a2・x2 + ・・・ + an・xn + b ・・・式(1)
なお、式(1)におけるx1〜xnが説明変数、y が目的変数にそれぞれ対応する。また、式(1)におけるa1〜anが説明変数の係数、b が定数項である。
提示される各判別式は、いずれも低スループット障害の発生の有無を示す判別式である。例えば、属性の値が与えられた第1判別式から「1」に近い値が得られた場合、低スループット障害が発生していると特定される。
なお、教師データにおける全ての属性が門関数として使用されなくてもよい。例えば、門関数で用いられる属性が原因属性のみに限定されてもよいし、あるいは門関数で用いられる属性が特に限定されなくてもよい。
(2)決定木
モデル生成部103は、異種混合学習によって得られる学習モデルの代わりに決定木を生成してもよい。図5は、モデル生成部103が生成する決定木の例を示す説明図である。図5に示す楕円は、属性に対応する条件での分岐を表す。
図5に示すように、決定木は、属性に対応する条件での分岐を表すノードと、障害の発生の有無を表す葉ノードとで構成されている。
すなわち、モデル生成部103は、各属性に対応する条件での分岐が複数回行われた後、障害の発生の有無を判定するような学習モデルを生成する。図5に示す例であれば、属性から「天候が悪化していた」→「平日である」→「回線断やエラーが6時間以上継続して発生した」→・・・と判定されると、学習モデルは、低スループット障害が発生していると判定する。
また、図5に示す決定木の「1」の葉ノードは、いずれも低スループット障害の発生に対応している。例えば、属性の値が与えられた学習モデルが「1」の葉ノードを提示した場合、低スループット障害が発生していると特定される。決定木は、図4に示す異種混合学習によって得られる学習モデル程に障害の原因を細分化することが要求されない場合に使用されるモデルである。
(3)判別式
モデル生成部103は、異種混合学習によって得られる学習モデルや決定木のようなツリー構造のモデルを生成する代わりに、単に式(1)のような判別式を生成してもよい。
例えば、属性の値が与えられた判別式から所定値(例えば、0.5)以上の値が得られた場合、低スループット障害が発生していると特定されてもよい。
なお、生成される判別式は、異種混合学習によって得られる学習モデル内の判別式に比べて項の数が多くなる。判別式は、属性の種類が比較的少ない場合に使用されるモデルである。
上記のようにモデル生成部103が生成する3種類の学習モデルを説明したが、モデル生成部103は、他の種類の学習モデルを生成してもよい。
また、モデル生成部103が生成する学習モデルは、障害の原因の代わりに、上述した「内的原因」、「外的原因」のような障害の原因の種類を提示してもよい。モデル生成部103は、生成された学習モデルをモデル記憶部104に記憶する。
特定部105は、モデル記憶部104に記憶されている異種混合学習によって得られた学習モデル内の生成された各判別式に対応する障害の原因、および障害の原因への対処方法を特定する。例えば、判別式において閾値以上の係数を持つ説明変数に対応する原因属性に対応付けられている原因、および対処方法を特定する。
例えば、判別式において、原因属性に対応する説明変数の係数が閾値以上である場合、特定部105は、その判別式に対応する原因および対処方法として、その原因属性に対応する原因および対処方法を特定する。
例えば、x1が「回線断やエラーが6時間以上継続して発生」という原因属性に対応しているとする。また、第1判別式において係数a1が閾値以上であったとする。この場合、特定部105は、第1判別式に対応する原因および対処方法として、図3に示す対応関係を基に「アンテナの方向ずれ」、「現地に作業員を派遣」をそれぞれ特定し、学習モデルに追加する。
また、特定部105は、モデル記憶部104に記憶されている決定木の各「1」の葉ノードに対応する障害の原因、および障害の原因への対処方法を特定する。特定部105は、「1」の葉ノードからルートノードまでのノードが表す属性の中で原因属性があれば、その原因属性に対応する原因と対処方法をそれぞれ特定し、学習モデルに追加する。
なお、特定部105は、「0」の葉ノードに対して原因と対処方法を学習モデルに追加しなくてもよい。
また、特定部105は、モデル記憶部104に記憶されている判別式に対応する障害の原因、および障害の原因への対処方法を特定する。例えば、判別式において、原因属性に対応する説明変数の係数が閾値以上である場合、特定部105は、その判別式に対応する原因および対処方法として、その原因属性に対応する原因および対処方法を特定する。特定部105は、特定された原因と対処方法を学習モデルに追加する。
また、特定部105は、モデル記憶部104に記憶されている学習モデルを用いて、障害(本例では、低スループット障害)が発生しているか否か、障害の原因、および原因に応じた対処方法を特定する機能を有する。特定部105には、障害が発生した可能性がある時におけるデータがデータ受信部101から入力される。入力されるデータの形式は、例えば図2に示すデータの形式と同様である。
特定部105は、入力されたデータ内の属性の値と学習モデルとに基づいて、障害(低スループット障害)が発生しているか否かを特定し、発生している場合には追加済みの障害の原因および対処方法を特定する。
異種混合学習によって得られた学習モデルを使用する場合、特定部105は、ツリー構造を構成する分岐に従って使用される判別式を選択する。次いで、特定部105は、選択された判別式の説明変数に属性の値を代入する。例えば、第1判別式が選択されたとする。
例えば、属性の値が代入された第1判別式から「1」に近い値が得られた場合、特定部105は、低スループット障害が発生していると特定する。また、属性の値が代入された第1判別式から「0」に近い値が得られた場合、特定部105は、低スループット障害が発生していると特定しない。
例えば、第1判別式から0.5以上の値が得られた場合、特定部105は、低スループット障害が発生していると特定する。また、第1判別式から0.5未満の値が得られた場合、特定部105は、低スループット障害が発生していると特定しない。
低スループット障害が発生していると特定した後、特定部105は、原因属性に対応する説明変数の係数が閾値以上であるならば、その原因属性に対応付けられている追加済みの原因(低スループット障害の原因)を特定する。また、特定部105は、追加済みの対処方法(低スループット障害の対処方法)も併せて特定する。
決定木を使用する場合、特定部105は、ツリー構造を構成する分岐に従って葉ノードを選択する。例えば、「1」の葉ノードが選択された場合、特定部105は、低スループット障害が発生していると特定する。また、「0」の葉ノードが選択された場合、特定部105は、低スループット障害が発生していないと特定する。
低スループット障害が発生していると特定した後、特定部105は、葉ノードが選択されるまでに経由されたノードが表す分岐の条件が対応する原因属性を基に、追加済みの低スループット障害の原因を特定する。また、特定部105は、特定された障害の原因への追加済みの対処方法も併せて特定する。
判別式を使用する場合、特定部105は、判別式の説明変数に属性の値を代入する。例えば、所定値以上の値が判別式から得られた場合、特定部105は、低スループット障害が発生していると特定する。また、0に近い値が判別式から得られた場合、特定部105は、低スループット障害が発生していないと特定する。
例えば、判別式から0.5以上の値が得られた場合、特定部105は、低スループット障害が発生していると特定する。また、判別式から0.5未満の値が得られた場合、特定部105は、低スループット障害が発生していると特定しない。
低スループット障害が発生していると特定した後、特定部105は、原因属性に対応する説明変数の係数が閾値以上であるならば、その原因属性に対応付けられている追加済みの原因(低スループット障害の原因)を特定する。また、特定部105は、追加済みの対処方法(低スループット障害の対処方法)も併せて特定する。
上記の例の他に、本実施形態の障害分析装置100のモデル生成部103は、例えば説明変数を対象機器の過去ログ情報における接続ユーザ数やトラフィック量、目的変数をパケットロス有無とし、異種混合学習技術を用いてモデルを学習してもよい。
また、対象機器でパケットロスが発生すると、特定部105は、パケットロスが発生した可能性がある時のログ情報の属性の値を学習モデルに与える。与えられた属性の値に基づいて判別式が選択されるため、特定部105は、選択された判別式においてパケットロスの発生に大きな影響を与える説明変数を特定する。
なお、本実施形態の障害分析装置100は、対処方法が設計変更であれば、特定された対処方法を実行する障害対処部を備えてもよい。障害対処部は、特定された対処方法をネットワーク機器等に対して自動で実行してもよい。
例えば、障害対処部は、設計変更を実行するために、変更用のコマンドやスクリプト等を発行する。障害対処部を備える障害分析装置100は、受信データを解析して障害の原因を究明し、原因に応じた対策を実行することによって、障害を自動で解決できる。
[動作の説明]
以下、本実施形態の障害分析装置100が障害を分析する動作を図6を参照して説明する。図6は、第1の実施形態の障害分析装置100による障害分析処理の動作を示すフローチャートである。
管理者は、低スループット障害の各原因に応じて、原因属性と対処方法との対応関係を事前に定義する。管理者は、定義された対応関係を示す情報をモデル記憶部104に記憶する(ステップS101)。
次いで、データ受信部101は、障害分析対象の装置から送信された取得対象のデータを受信する(ステップS102)。次いで、データ受信部101は、受信されたデータをデータ記憶部102に入力する。
次いで、データ記憶部102は、データ受信部101から入力されたデータやモデル記憶部104に記憶されている対応関係等を用いて、教師データを記憶する。データ記憶部102は、教師データを蓄積する(ステップS103)。
次いで、モデル生成部103は、データ記憶部102に記憶されている教師データを用いて学習を実行することによって、学習モデルを生成する(ステップS104)。
モデル生成部103は、例えば、異種混合学習によって得られる学習モデル、決定木、または判別式のいずれかを学習モデルとして生成する。次いで、モデル生成部103は、生成された学習モデルをモデル記憶部104に記憶する(ステップS105)。
次いで、データ受信部101は、障害分析対象の装置から送信された障害が発生した可能性がある時のデータを受信する(ステップS106)。次いで、データ受信部101は、受信されたデータ等を特定部105に入力する。
次いで、特定部105は、モデル記憶部104に記憶されている学習モデルを用いて、入力されたデータを基に発生している障害の原因と対処方法を特定する(ステップS107)。
次いで、特定部105は、ステップS107で特定された情報を出力する(ステップS108)。特定された情報を出力した後、障害分析装置100は、障害分析処理を終了する。
[効果の説明]
本実施形態の障害分析装置100のモデル生成部103は、判別式ごとに各説明変数の影響度が算出される異種混合学習によって得られる学習モデルを生成できる。よって、特定部105は、算出された説明変数の影響度を用いて、発生した障害の原因を速やかに特定できる。
また、モデル生成部103が決定木を生成する場合であっても、特定部105は、原因属性を絞り込むことができる。よって、特定部105は、発生した障害の原因を速やかに特定できる。
また、モデル生成部103が判別式を生成する場合であっても、特定部105は、障害に影響する説明変数を絞り込むことができる。よって、特定部105は、学習モデルの説明変数を基に発生した障害の原因を速やかに特定できる。
以下、本実施形態の障害分析装置100のハードウェア構成の具体例を説明する。図7は、本発明による障害分析装置のハードウェア構成例を示す説明図である。
図7に示す障害分析装置100は、CPU(Central Processing Unit )111と、主記憶部112と、通信部113と、補助記憶部114とを備える。また、ユーザが操作するための入力部115や、ユーザに処理結果または処理内容の経過を提示するための出力部116を備えてもよい。
主記憶部112は、データの作業領域やデータの一時退避領域として用いられる。主記憶部112は、例えばRAM(Random Access Memory)である。
通信部113は、有線のネットワークまたは無線のネットワーク(情報通信ネットワーク)を介して、周辺機器との間でデータを入力および出力する機能を有する。
補助記憶部114は、一時的でない有形の記憶媒体である。一時的でない有形の記憶媒体として、例えば磁気ディスク、光磁気ディスク、CD−ROM(Compact Disk Read Only Memory )、DVD−ROM(Digital Versatile Disk Read Only Memory )、半導体メモリが挙げられる。
入力部115は、データや処理命令を入力する機能を有する。入力部115は、例えばキーボードやマウス等の入力デバイスである。
出力部116は、データを出力する機能を有する。出力部116は、例えば液晶ディスプレイ装置等の表示装置、またはプリンタ等の印刷装置である。
また、図7に示すように、障害分析装置100において、各構成要素は、システムバス117に接続されている。
補助記憶部114は、例えば、図1に示すデータ受信部101、モデル生成部103、および特定部105を実現するためのプログラムを記憶している。
また、主記憶部112は、例えば、データ記憶部102の記憶領域、およびモデル記憶部104の記憶領域として利用される。また、データ受信部101は、通信部113を介して、取得対象データを受信する。
なお、障害分析装置100は、ハードウェアにより実現されてもよい。例えば、障害分析装置100は、内部に図1に示すような機能を実現するプログラムが組み込まれたLSI(Large Scale Integration )等のハードウェア部品が含まれる回路が実装されてもよい。
また、障害分析装置100は、図7に示すCPU111が図1に示す各構成要素が有する機能を提供するプログラムを実行することによって、ソフトウェアにより実現されてもよい。
ソフトウェアにより実現される場合、CPU111が補助記憶部114に格納されているプログラムを、主記憶部112にロードして実行し、障害分析装置100の動作を制御することによって、各機能がソフトウェアにより実現される。
また、各構成要素の一部または全部は、汎用の回路(circuitry )または専用の回路、プロセッサ等やこれらの組み合わせによって実現されてもよい。これらは、単一のチップによって構成されてもよいし、バスを介して接続される複数のチップによって構成されてもよい。各構成要素の一部または全部は、上述した回路等とプログラムとの組み合わせによって実現されてもよい。
各構成要素の一部または全部が複数の情報処理装置や回路等により実現される場合には、複数の情報処理装置や回路等は集中配置されてもよいし、分散配置されてもよい。例えば、情報処理装置や回路等は、クライアントアンドサーバシステム、クラウドコンピューティングシステム等、各々が通信ネットワークを介して接続される形態として実現されてもよい。
次に、本発明の概要を説明する。図8は、本発明による障害分析装置の概要を示すブロック図である。本発明による障害分析装置10は、所定の障害の原因に対応付けられた属性である原因属性が用いられて学習された所定の障害の発生の有無を判別するためのモデルである学習モデルと属性の値とに基づいて所定の障害が発生したか否かを判別し、発生したと判別された所定の障害の原因および対処方法を特定する特定部11(例えば、特定部105)を備える。
そのような構成により、障害分析装置は、発生した障害の原因および対処方法を速やかに特定できる。
また、障害分析装置10は、原因属性を含む複数の属性の値と所定の障害が発生していたか否かを示す情報である障害発生情報との組を複数含む教師データを用いて、学習モデルを学習する学習部(例えば、モデル生成部103)を備えてもよい。
そのような構成により、障害分析装置は、障害の原因の特定に使用される学習モデルを学習できる。
また、学習部は、属性に関する条件を葉ノード以外のノードとし、所定の障害の発生の有無を判別するための判別式を葉ノードとする二分木を学習モデルとして生成し、特定部11は、属性の値を用いて二分木の葉ノードに相当する判別式を特定し、属性の値と、判別式とに基づいて所定の障害が発生したか否かを判別し、発生したと判別された所定の障害の原因を、判別式に含まれている原因属性に対応する説明変数の係数値に基づいて特定し、予め原因に対応付けられている対処方法を特定してもよい。
そのような構成により、障害分析装置は、異種混合学習によって得られる学習モデルを用いて障害の原因および対処方法を速やかに特定できる。
また、学習部は、属性に関する条件を葉ノード以外のノードとし、所定の障害の発生の有無を示す情報を葉ノードとする決定木を学習モデルとして生成し、特定部11は、属性の値と決定木とに基づいて、属性の値に応じた葉ノードが所定の障害が発生したことを示しているか否かを判定し、所定の障害が発生したことを示している葉ノードからルートノードまでのノードにおいて条件として用いられている原因属性に予め対応付けられている所定の障害の原因および対処方法を特定してもよい。
そのような構成により、障害分析装置は、二分木を用いて障害の原因および対処方法を速やかに特定できる。
また、学習部は、所定の障害の発生の有無を判別するための判別式を学習モデルとして生成し、特定部11は、属性の値と判別式とに基づいて、所定の障害が発生したか否かを判別し、発生したと判別された所定の障害の原因を、判別式に含まれている原因属性に対応する説明変数の係数値に基づいて特定し、予め原因に対応付けられている対処方法を特定してもよい。
そのような構成により、障害分析装置は、判別式を用いて障害の原因および対処方法を速やかに特定できる。
また、障害分析装置10は、予め対応付けられた所定の障害の原因と、原因属性と、対処方法との組を記憶する記憶部(例えば、モデル記憶部104)を備えてもよい。
そのような構成により、障害分析装置は、事前に所定の障害の原因と、原因属性と、対処方法との関係を記憶できる。
以上、実施形態および実施例を参照して本願発明を説明したが、本願発明は上記実施形態および実施例に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
また、上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下に限られない。
(付記1)所定の障害の原因に対応付けられた属性である原因属性が用いられて学習された前記所定の障害の発生の有無を判別するためのモデルである学習モデルと属性の値とに基づいて前記所定の障害が発生したか否かを判別し、発生したと判別された前記所定の障害の原因および対処方法を特定する特定部を備えることを特徴とする障害分析装置。
(付記2)原因属性を含む複数の属性の値と所定の障害が発生していたか否かを示す情報である障害発生情報との組を複数含む教師データを用いて、学習モデルを学習する学習部を備える付記1記載の障害分析装置。
(付記3)学習部は、属性に関する条件を葉ノード以外のノードとし、所定の障害の発生の有無を判別するための判別式を葉ノードとする二分木を学習モデルとして生成し、特定部は、属性の値を用いて前記二分木の葉ノードに相当する判別式を特定し、前記属性の値と、前記判別式とに基づいて前記所定の障害が発生したか否かを判別し、発生したと判別された前記所定の障害の原因を、前記判別式に含まれている原因属性に対応する説明変数の係数値に基づいて特定し、予め前記原因に対応付けられている対処方法を特定する付記2記載の障害分析装置。
(付記4)学習部は、属性に関する条件を葉ノード以外のノードとし、所定の障害の発生の有無を示す情報を葉ノードとする決定木を学習モデルとして生成し、特定部は、属性の値と前記決定木とに基づいて、前記属性の値に応じた葉ノードが前記所定の障害が発生したことを示しているか否かを判定し、前記所定の障害が発生したことを示している葉ノードからルートノードまでのノードにおいて前記条件として用いられている原因属性に予め対応付けられている前記所定の障害の原因および対処方法を特定する付記2記載の障害分析装置。
(付記5)学習部は、所定の障害の発生の有無を判別するための判別式を学習モデルとして生成し、特定部は、属性の値と前記判別式とに基づいて、前記所定の障害が発生したか否かを判別し、発生したと判別された前記所定の障害の原因を、前記判別式に含まれている原因属性に対応する説明変数の係数値に基づいて特定し、予め前記原因に対応付けられている対処方法を特定する付記2記載の障害分析装置。
(付記6)予め対応付けられた所定の障害の原因と、原因属性と、対処方法との組を記憶する記憶部を備える付記1から付記5のうちのいずれか1項に記載の障害分析装置。
(付記7)所定の障害の原因に対応付けられた属性である原因属性が用いられて学習された前記所定の障害の発生の有無を判別するためのモデルである学習モデルと属性の値とに基づいて前記所定の障害が発生したか否かを判別し、発生したと判別された前記所定の障害の原因および対処方法を特定することを特徴とする障害分析方法。
(付記8)原因属性を含む複数の属性の値と所定の障害が発生していたか否かを示す情報である障害発生情報との組を複数含む教師データを用いて、学習モデルを学習する付記7記載の障害分析方法。
(付記9)属性に関する条件を葉ノード以外のノードとし、所定の障害の発生の有無を判別するための判別式を葉ノードとする二分木を学習モデルとして生成し、属性の値を用いて前記二分木の葉ノードに相当する判別式を特定し、前記属性の値と、前記判別式とに基づいて前記所定の障害が発生したか否かを判別し、発生したと判別された前記所定の障害の原因を、前記判別式に含まれている原因属性に対応する説明変数の係数値に基づいて特定し、予め前記原因に対応付けられている対処方法を特定する付記8記載の障害分析方法。
(付記10)属性に関する条件を葉ノード以外のノードとし、所定の障害の発生の有無を示す情報を葉ノードとする決定木を学習モデルとして生成し、属性の値と前記決定木とに基づいて、前記属性の値に応じた葉ノードが前記所定の障害が発生したことを示しているか否かを判定し、前記所定の障害が発生したことを示している葉ノードからルートノードまでのノードにおいて前記条件として用いられている原因属性に予め対応付けられている前記所定の障害の原因および対処方法を特定する付記8記載の障害分析方法。
(付記11)所定の障害の発生の有無を判別するための判別式を学習モデルとして生成し、属性の値と前記判別式とに基づいて、前記所定の障害が発生したか否かを判別し、発生したと判別された前記所定の障害の原因を、前記判別式に含まれている原因属性に対応する説明変数の係数値に基づいて特定し、予め前記原因に対応付けられている対処方法を特定する付記8記載の障害分析方法。
(付記12)コンピュータに、所定の障害の原因に対応付けられた属性である原因属性が用いられて学習された前記所定の障害の発生の有無を判別するためのモデルである学習モデルと属性の値とに基づいて前記所定の障害が発生したか否かを判別する判別処理、および発生したと判別された前記所定の障害の原因および対処方法を特定する特定処理を実行させるための障害分析プログラム。
(付記13)コンピュータに、原因属性を含む複数の属性の値と所定の障害が発生していたか否かを示す情報である障害発生情報との組を複数含む教師データを用いて、学習モデルを学習する学習処理を実行させる付記12記載の障害分析プログラム。
(付記14)コンピュータに、学習処理で、属性に関する条件を葉ノード以外のノードとし、所定の障害の発生の有無を判別するための判別式を葉ノードとする二分木を学習モデルとして生成させ、特定処理で、属性の値を用いて前記二分木の葉ノードに相当する判別式を特定させ、前記属性の値と、前記判別式とに基づいて前記所定の障害が発生したか否かを判別させ、発生したと判別された前記所定の障害の原因を、前記判別式に含まれている原因属性に対応する説明変数の係数値に基づいて特定させ、予め前記原因に対応付けられている対処方法を特定させる付記13記載の障害分析プログラム。
(付記15)コンピュータに、学習処理で、属性に関する条件を葉ノード以外のノードとし、所定の障害の発生の有無を示す情報を葉ノードとする決定木を学習モデルとして生成させ、特定処理で、属性の値と前記決定木とに基づいて、前記属性の値に応じた葉ノードが前記所定の障害が発生したことを示しているか否かを判定させ、前記所定の障害が発生したことを示している葉ノードからルートノードまでのノードにおいて前記条件として用いられている原因属性に予め対応付けられている前記所定の障害の原因および対処方法を特定させる付記13記載の障害分析プログラム。
(付記16)コンピュータに、学習処理で、所定の障害の発生の有無を判別するための判別式を学習モデルとして生成させ、特定処理で、属性の値と前記判別式とに基づいて、前記所定の障害が発生したか否かを判別させ、発生したと判別された前記所定の障害の原因を、前記判別式に含まれている原因属性に対応する説明変数の係数値に基づいて特定させ、予め前記原因に対応付けられている対処方法を特定させる付記13記載の障害分析プログラム。
産業上の利用の可能性
本発明は、通信システムの保守作業の用途に好適に適用される。
10、100 障害分析装置
11、105 特定部
101 データ受信部
102 データ記憶部
103 モデル生成部
104 モデル記憶部
111 CPU
112 主記憶部
113 通信部
114 補助記憶部
115 入力部
116 出力部
117 システムバス

Claims (16)

  1. 所定の障害の原因に対応付けられた属性である原因属性が用いられて学習された前記所定の障害の発生の有無を判別するためのモデルである学習モデルと属性の値とに基づいて前記所定の障害が発生したか否かを判別し、発生したと判別された前記所定の障害の原因および対処方法を特定する特定部を備える
    ことを特徴とする障害分析装置。
  2. 原因属性を含む複数の属性の値と所定の障害が発生していたか否かを示す情報である障害発生情報との組を複数含む教師データを用いて、学習モデルを学習する学習部を備える
    請求項1記載の障害分析装置。
  3. 学習部は、属性に関する条件を葉ノード以外のノードとし、所定の障害の発生の有無を判別するための判別式を葉ノードとする二分木を学習モデルとして生成し、
    特定部は、
    属性の値を用いて前記二分木の葉ノードに相当する判別式を特定し、
    前記属性の値と、前記判別式とに基づいて前記所定の障害が発生したか否かを判別し、
    発生したと判別された前記所定の障害の原因を、前記判別式に含まれている原因属性に対応する説明変数の係数値に基づいて特定し、
    予め前記原因に対応付けられている対処方法を特定する
    請求項2記載の障害分析装置。
  4. 学習部は、属性に関する条件を葉ノード以外のノードとし、所定の障害の発生の有無を示す情報を葉ノードとする決定木を学習モデルとして生成し、
    特定部は、
    属性の値と前記決定木とに基づいて、前記属性の値に応じた葉ノードが前記所定の障害が発生したことを示しているか否かを判定し、
    前記所定の障害が発生したことを示している葉ノードからルートノードまでのノードにおいて前記条件として用いられている原因属性に予め対応付けられている前記所定の障害の原因および対処方法を特定する
    請求項2記載の障害分析装置。
  5. 学習部は、所定の障害の発生の有無を判別するための判別式を学習モデルとして生成し、
    特定部は、
    属性の値と前記判別式とに基づいて、前記所定の障害が発生したか否かを判別し、
    発生したと判別された前記所定の障害の原因を、前記判別式に含まれている原因属性に対応する説明変数の係数値に基づいて特定し、
    予め前記原因に対応付けられている対処方法を特定する
    請求項2記載の障害分析装置。
  6. 予め対応付けられた所定の障害の原因と、原因属性と、対処方法との組を記憶する記憶部を備える
    請求項1から請求項5のうちのいずれか1項に記載の障害分析装置。
  7. 所定の障害の原因に対応付けられた属性である原因属性が用いられて学習された前記所定の障害の発生の有無を判別するためのモデルである学習モデルと属性の値とに基づいて前記所定の障害が発生したか否かを判別し、
    発生したと判別された前記所定の障害の原因および対処方法を特定する
    ことを特徴とする障害分析方法。
  8. 原因属性を含む複数の属性の値と所定の障害が発生していたか否かを示す情報である障害発生情報との組を複数含む教師データを用いて、学習モデルを学習する
    請求項7記載の障害分析方法。
  9. 属性に関する条件を葉ノード以外のノードとし、所定の障害の発生の有無を判別するための判別式を葉ノードとする二分木を学習モデルとして生成し、
    属性の値を用いて前記二分木の葉ノードに相当する判別式を特定し、
    前記属性の値と、前記判別式とに基づいて前記所定の障害が発生したか否かを判別し、
    発生したと判別された前記所定の障害の原因を、前記判別式に含まれている原因属性に対応する説明変数の係数値に基づいて特定し、
    予め前記原因に対応付けられている対処方法を特定する
    請求項8記載の障害分析方法。
  10. 属性に関する条件を葉ノード以外のノードとし、所定の障害の発生の有無を示す情報を葉ノードとする決定木を学習モデルとして生成し、
    属性の値と前記決定木とに基づいて、前記属性の値に応じた葉ノードが前記所定の障害が発生したことを示しているか否かを判定し、
    前記所定の障害が発生したことを示している葉ノードからルートノードまでのノードにおいて前記条件として用いられている原因属性に予め対応付けられている前記所定の障害の原因および対処方法を特定する
    請求項8記載の障害分析方法。
  11. 所定の障害の発生の有無を判別するための判別式を学習モデルとして生成し、
    属性の値と前記判別式とに基づいて、前記所定の障害が発生したか否かを判別し、
    発生したと判別された前記所定の障害の原因を、前記判別式に含まれている原因属性に対応する説明変数の係数値に基づいて特定し、
    予め前記原因に対応付けられている対処方法を特定する
    請求項8記載の障害分析方法。
  12. コンピュータに、
    所定の障害の原因に対応付けられた属性である原因属性が用いられて学習された前記所定の障害の発生の有無を判別するためのモデルである学習モデルと属性の値とに基づいて前記所定の障害が発生したか否かを判別する判別処理、および
    発生したと判別された前記所定の障害の原因および対処方法を特定する特定処理
    を実行させるための障害分析プログラム。
  13. コンピュータに、
    原因属性を含む複数の属性の値と所定の障害が発生していたか否かを示す情報である障害発生情報との組を複数含む教師データを用いて、学習モデルを学習する学習処理を実行させる
    請求項12記載の障害分析プログラム。
  14. コンピュータに、
    学習処理で、属性に関する条件を葉ノード以外のノードとし、所定の障害の発生の有無を判別するための判別式を葉ノードとする二分木を学習モデルとして生成させ、
    特定処理で、
    属性の値を用いて前記二分木の葉ノードに相当する判別式を特定させ、
    前記属性の値と、前記判別式とに基づいて前記所定の障害が発生したか否かを判別させ、
    発生したと判別された前記所定の障害の原因を、前記判別式に含まれている原因属性に対応する説明変数の係数値に基づいて特定させ、
    予め前記原因に対応付けられている対処方法を特定させる
    請求項13記載の障害分析プログラム。
  15. コンピュータに、
    学習処理で、属性に関する条件を葉ノード以外のノードとし、所定の障害の発生の有無を示す情報を葉ノードとする決定木を学習モデルとして生成させ、
    特定処理で、
    属性の値と前記決定木とに基づいて、前記属性の値に応じた葉ノードが前記所定の障害が発生したことを示しているか否かを判定させ、
    前記所定の障害が発生したことを示している葉ノードからルートノードまでのノードにおいて前記条件として用いられている原因属性に予め対応付けられている前記所定の障害の原因および対処方法を特定させる
    請求項13記載の障害分析プログラム。
  16. コンピュータに、
    学習処理で、所定の障害の発生の有無を判別するための判別式を学習モデルとして生成させ、
    特定処理で、
    属性の値と前記判別式とに基づいて、前記所定の障害が発生したか否かを判別させ、
    発生したと判別された前記所定の障害の原因を、前記判別式に含まれている原因属性に対応する説明変数の係数値に基づいて特定させ、
    予め前記原因に対応付けられている対処方法を特定させる
    請求項13記載の障害分析プログラム。
JP2019559425A 2017-12-11 2017-12-11 障害分析装置、障害分析方法および障害分析プログラム Pending JPWO2019116418A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021202972A JP7173273B2 (ja) 2017-12-11 2021-12-15 障害分析装置、障害分析方法および障害分析プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2017/044309 WO2019116418A1 (ja) 2017-12-11 2017-12-11 障害分析装置、障害分析方法および障害分析プログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2021202972A Division JP7173273B2 (ja) 2017-12-11 2021-12-15 障害分析装置、障害分析方法および障害分析プログラム

Publications (1)

Publication Number Publication Date
JPWO2019116418A1 true JPWO2019116418A1 (ja) 2020-12-17

Family

ID=66820799

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019559425A Pending JPWO2019116418A1 (ja) 2017-12-11 2017-12-11 障害分析装置、障害分析方法および障害分析プログラム

Country Status (4)

Country Link
US (1) US11586981B2 (ja)
EP (1) EP3726437A4 (ja)
JP (1) JPWO2019116418A1 (ja)
WO (1) WO2019116418A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7415714B2 (ja) * 2020-03-23 2024-01-17 富士通株式会社 障害原因特定システム、障害原因特定方法および障害原因特定プログラム
US11188411B1 (en) 2020-11-19 2021-11-30 Capital One Services, Llc Computer-based systems and/or computing devices configured for root cause analysis of computing incidents using machine learning
EP4228221A1 (en) 2020-11-19 2023-08-16 Nippon Telegraph And Telephone Corporation Estimation device, estimation method, and estimation program
WO2023012898A1 (ja) * 2021-08-03 2023-02-09 日本電気株式会社 情報処理システム、情報処理装置、及び情報処理方法
CN114490303B (zh) * 2022-04-07 2022-07-12 阿里巴巴达摩院(杭州)科技有限公司 故障根因确定方法、装置和云设备
CN115865625A (zh) * 2022-11-28 2023-03-28 武汉烽火技术服务有限公司 一种通信设备故障根因的分析方法和装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005223906A (ja) * 2004-01-30 2005-08-18 Microsoft Corp 障害検出および診断
JP2010218301A (ja) * 2009-03-17 2010-09-30 Taiyo Nippon Sanso Corp 異常診断装置、異常診断方法及び異常診断プログラム
JP2012003713A (ja) * 2010-06-21 2012-01-05 Hitachi Solutions Ltd 障害原因判定ルール変化検知装置及びプログラム
CN106257872A (zh) * 2015-06-22 2016-12-28 埃森哲环球服务有限公司 Wi‑fi接入点性能管理
CN106301522A (zh) * 2016-08-20 2017-01-04 航天恒星科技有限公司 遥感卫星地面站数据接收任务的可视化故障诊断方法及***
CN106909478A (zh) * 2015-12-22 2017-06-30 曹圣航 一种基于wmi技术与决策树分类算法的智能维修***
JP2017120649A (ja) * 2015-07-31 2017-07-06 ファナック株式会社 故障条件を学習する機械学習方法及び機械学習装置、並びに該機械学習装置を備えた故障予知装置及び故障予知システム

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4445300B2 (ja) 2004-03-18 2010-04-07 富士通株式会社 ネットワーク障害推定方法及びネットワーク障害推定装置
JP2007165721A (ja) 2005-12-15 2007-06-28 Omron Corp プロセス異常分析装置及びプログラム
JP4559974B2 (ja) 2006-01-16 2010-10-13 三菱電機株式会社 管理装置及び管理方法及びプログラム
JP5299267B2 (ja) 2007-03-22 2013-09-25 日本電気株式会社 診断装置
JP5803469B2 (ja) 2011-09-15 2015-11-04 富士通株式会社 予測方法及び予測プログラム
US8909582B2 (en) 2013-02-04 2014-12-09 Nec Corporation Hierarchical latent variable model estimation device, hierarchical latent variable model estimation method, and recording medium
JP6380169B2 (ja) 2015-03-04 2018-08-29 株式会社デンソー 故障診断装置および端末装置
JP2016173782A (ja) 2015-03-18 2016-09-29 エヌ・ティ・ティ・コミュニケーションズ株式会社 故障予測システム、故障予測方法、故障予測装置、学習装置、故障予測プログラム及び学習プログラム
DE102016008987B4 (de) 2015-07-31 2021-09-16 Fanuc Corporation Maschinenlernverfahren und Maschinenlernvorrichtung zum Lernen von Fehlerbedingungen, und Fehlervorhersagevorrichtung und Fehlervorhersagesystem, das die Maschinenlernvorrichtung einschließt
JP6811018B2 (ja) 2016-03-07 2021-01-13 三菱重工業株式会社 品質評価システム、品質評価方法及びプログラム

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005223906A (ja) * 2004-01-30 2005-08-18 Microsoft Corp 障害検出および診断
JP2010218301A (ja) * 2009-03-17 2010-09-30 Taiyo Nippon Sanso Corp 異常診断装置、異常診断方法及び異常診断プログラム
JP2012003713A (ja) * 2010-06-21 2012-01-05 Hitachi Solutions Ltd 障害原因判定ルール変化検知装置及びプログラム
CN106257872A (zh) * 2015-06-22 2016-12-28 埃森哲环球服务有限公司 Wi‑fi接入点性能管理
JP2017120649A (ja) * 2015-07-31 2017-07-06 ファナック株式会社 故障条件を学習する機械学習方法及び機械学習装置、並びに該機械学習装置を備えた故障予知装置及び故障予知システム
CN106909478A (zh) * 2015-12-22 2017-06-30 曹圣航 一种基于wmi技术与决策树分类算法的智能维修***
CN106301522A (zh) * 2016-08-20 2017-01-04 航天恒星科技有限公司 遥感卫星地面站数据接收任务的可视化故障诊断方法及***

Also Published As

Publication number Publication date
EP3726437A4 (en) 2020-12-16
EP3726437A1 (en) 2020-10-21
WO2019116418A1 (ja) 2019-06-20
US11586981B2 (en) 2023-02-21
US20210019653A1 (en) 2021-01-21

Similar Documents

Publication Publication Date Title
JPWO2019116418A1 (ja) 障害分析装置、障害分析方法および障害分析プログラム
US10069684B2 (en) Core network analytics system
WO2020001642A1 (zh) 一种运维***及方法
US11153144B2 (en) System and method of automated fault correction in a network environment
US11409962B2 (en) System and method for automated insight curation and alerting
US20200401936A1 (en) Self-aware service assurance in a 5g telco network
KR102432284B1 (ko) It관리대상의 이벤트 알람이나 장애 문제를 실시간 자동으로 조치하는 시스템 및 그 운용방법
US10659312B2 (en) Network anomaly detection
US9860109B2 (en) Automatic alert generation
US20210311468A1 (en) Real-time alerts and transmission of selected signal samples under a dynamic capacity limitation
US20180121889A1 (en) Method and system for dynamically managing waste water treatment process for optimizing power consumption
US11704186B2 (en) Analysis of deep-level cause of fault of storage management
US20230419202A1 (en) METHODS, INTERNET OF THINGS (IoT) SYSTEMS, AND MEDIUMS FOR MANAGING TIMELINESS OF SMART GAS DATA
JP2023547849A (ja) ラベルなしセンサデータを用いた産業システム内の稀な障害の自動化されたリアルタイムの検出、予測、及び予防に関する、方法または非一時的コンピュータ可読媒体
US20220209876A1 (en) Weather impact modeling of satellite based services
JP7173273B2 (ja) 障害分析装置、障害分析方法および障害分析プログラム
US20230011129A1 (en) Log analyzer for fault detection
CN114546256A (zh) 从时间序列数据导出的用于kpi的基于数据质量的置信度计算
White et al. MMRCA: multimodal root cause analysis
US20240171505A1 (en) Predicting impending change to Interior Gateway Protocol (IGP) metrics
US20240171486A1 (en) Leveraging temporal-based datapoints for predicting network events
US20230370350A1 (en) System and method for outage prediction
US20230188408A1 (en) Enhanced analysis and remediation of network performance
US20240097970A1 (en) Network incident root-cause analysis
EP3772834A1 (en) A method of predicting the time course of a plurality of data relative to a telephony infrastructure for network function virtualization

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200608

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210511

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20210921

C60 Trial request (containing other claim documents, opposition documents)

Free format text: JAPANESE INTERMEDIATE CODE: C60

Effective date: 20211214

C22 Notice of designation (change) of administrative judge

Free format text: JAPANESE INTERMEDIATE CODE: C22

Effective date: 20220426

C13 Notice of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: C13

Effective date: 20220628

C22 Notice of designation (change) of administrative judge

Free format text: JAPANESE INTERMEDIATE CODE: C22

Effective date: 20220802

C23 Notice of termination of proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C23

Effective date: 20220927

C03 Trial/appeal decision taken

Free format text: JAPANESE INTERMEDIATE CODE: C03

Effective date: 20221025

C30A Notification sent

Free format text: JAPANESE INTERMEDIATE CODE: C3012

Effective date: 20221025