JP6512646B1 - 保守管理装置、システム及びプログラム - Google Patents

保守管理装置、システム及びプログラム Download PDF

Info

Publication number
JP6512646B1
JP6512646B1 JP2018023017A JP2018023017A JP6512646B1 JP 6512646 B1 JP6512646 B1 JP 6512646B1 JP 2018023017 A JP2018023017 A JP 2018023017A JP 2018023017 A JP2018023017 A JP 2018023017A JP 6512646 B1 JP6512646 B1 JP 6512646B1
Authority
JP
Japan
Prior art keywords
sequence
log
time
information
incident
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018023017A
Other languages
English (en)
Other versions
JP2019139556A (ja
Inventor
鈴木 亮
亮 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Platforms Ltd
Original Assignee
NEC Platforms Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Platforms Ltd filed Critical NEC Platforms Ltd
Priority to JP2018023017A priority Critical patent/JP6512646B1/ja
Priority to PCT/JP2018/042517 priority patent/WO2019159460A1/ja
Priority to US16/969,023 priority patent/US20210027254A1/en
Application granted granted Critical
Publication of JP6512646B1 publication Critical patent/JP6512646B1/ja
Publication of JP2019139556A publication Critical patent/JP2019139556A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/20Administration of product repair or maintenance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3476Data logging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/40Data acquisition and logging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3452Performance evaluation by statistical analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/835Timestamp

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Quality & Reliability (AREA)
  • Human Resources & Organizations (AREA)
  • Databases & Information Systems (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computer Hardware Design (AREA)
  • Strategic Management (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Debugging And Monitoring (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】インシデントの発生を予測することが可能な保守管理装置、システム、方法及びプログラムを提供すること。【解決手段】本開示に係る保守管理装置11は、ログ情報を識別するログ識別子とログ情報の時刻情報とを関連付けて記憶する記憶部112と、複数のログ識別子を時刻情報に基づいてまとめたログシーケンスを作成し、ログシーケンスの開始時刻と終了時刻との差分からシーケンス時間を算出し、ログシーケンスとシーケンス時間とを関連付けたシーケンスグループにグループ化する分析部113と、を備える。分析部113は、シーケンスグループが予め登録された正常シーケンスグループ及び異常シーケンスグループと一致しない場合、予め登録されたインシデント予兆グループのうち、シーケンスグループと最も適合率の高いシーケンスグループに基づいてインシデント発生見込み時間を算出する。【選択図】図1

Description

本発明は、保守管理装置、システム、方法及びプログラムに関するものであり、特に、インシデントの発生を予測することが可能な保守管理装置、システム、方法及びプログラムに関する。
情報処理システムにおいては、情報処理システムを継続して運用すること、すなわち、可用性確保がますます重要になっている。しかしながら、情報処理システムの保守管理においては、インシデント予兆を検出してインシデントの発生を予測することが難しいという問題があった。特に、今まで発生したことのない新しい未知のインシデントが発生した場合等では、対応が後追いになるという問題があった。
特許文献1には、監視対象システムが出力するログの相関関係から、監視対象システムのシステム状態の変化が反映された相関関係の変化を監視・検出することが記載されている。また、特許文献1には、監視システムの処理は、監視対象システムが出力した正常時のログから相関値が所定の値以上となるログのペア(組合わせ)を監視対象として選定することが記載されている。また、特許文献1には、監視対象システムを構成する各装置から収集したOS(Operating System)やミドルウェアのログを解析し、ログに含まれる単語や熟語等の連語(言語表現)、あるいは、IP(Internet Protocol)アドレスなどの計算機固有の表現を抽出し、辞書に登録し、登録した表現にID(IDentification)付けすることが記載されている。しかしながら、特許文献1には、システムのインシデント予兆を検出することは記載されていない。
特許文献2には、ログ分析システムにおいて、ログの構成パターンが正常パターンと一致せず、異常パターンとも一致しない場合には、そのログと、そのログに付随する参考情報とを異常パターン生成部に出力することが記載されている。また、特許文献2には、異常パターン生成部が判定条件に従って、受信したそのログから異常パターンを生成することが記載されている。しかしながら、特許文献2には、システムのインシデント予兆を検出することは記載されていない。
特許文献3には、判定条件学習処理部が、イベント情報テーブルに登録された所定期間に発生したイベントを検索する第1工程と、該第1工程により検索したイベント中の種別が情報及び警告のイベントを検索する第2工程と、該第2工程により検索したイベントの「発生迄分数」を計算式により算出する第3工程と、該第3工程により「発生迄分数」を算出したイベントをホスト名でグルーピングして同一ホストグループを設定する第4工程と、該第4工程により同一ホストグループに設定したイベントのレコードを予兆情報テーブルにスコア「5」及び使用「○」の初期値で登録する第5工程とを実行することによって、所定期間内に発生したホスト名をグルーピングし、予兆情報テーブルにスコア「5」及び使用「○」の初期値を登録することが記載されている。しかしながら、特許文献3には、システムのインシデント予兆を検出することは記載されていない。
国際公開第2017/037801号 国際公開第2016/132717号 特開2016−201060号公報
上記のように、情報処理システムの保守管理においては、インシデント予兆を検出してインシデントの発生を予測することが難しいという問題があった
本開示の目的は、上述した課題のいずれかを解決する保守管理装置、システム、方法及びプログラムを提供することにある。
本開示に係る保守管理装置は、
ログ情報を収集する収集部と、
前記ログ情報を識別するログ識別子と前記ログ情報の時刻情報とを関連付けて記憶する記憶部と、
複数の前記ログ識別子を前記時刻情報に基づいてまとめたログシーケンスを作成し、前記ログシーケンスの開始時刻と終了時刻との差分からシーケンス時間を算出し、前記ログシーケンスと前記シーケンス時間とを関連付けたシーケンスグループにグループ化する分析部と、
を備え、
前記分析部は、前記シーケンスグループが予め登録された正常シーケンスグループ及び異常シーケンスグループと一致しない場合、予め登録されたインシデント予兆グループのうち、前記シーケンスグループと最も適合率の高いシーケンスグループに基づいてインシデント発生までのインシデント発生見込み時間を算出する。
本開示に係るシステムは、
顧客サイトに設置された保守管理装置と、前記顧客サイトの保守管理装置に接続され、保守センターに設置された保守管理装置と、を備え、
前記保守センターに設置された保守管理装置は、
ログ情報を収集する収集部と、
前記ログ情報を識別するログ識別子と前記ログ情報の時刻情報とを関連付けて記憶する記憶部と、
複数の前記ログ識別子を前記時刻情報に基づいてまとめたログシーケンスを作成し、前記ログシーケンスの開始時刻と終了時刻との差分からシーケンス時間を算出し、前記ログシーケンスと前記シーケンス時間とを関連付けたシーケンスグループにグループ化する分析部と、を有し、
前記分析部は、前記シーケンスグループが予め登録された正常シーケンスグループ及び異常シーケンスグループと一致しない場合、予め登録されたインシデント予兆グループのうち、前記シーケンスグループと最も適合率の高いシーケンスグループに基づいてインシデント発生までのインシデント発生見込み時間を算出する。
本開示に係る方法は、
ログ情報を収集し、
前記ログ情報を識別するログ識別子と前記ログ情報の時刻情報とを関連付けて記憶し、
複数の前記ログ識別子を前記時刻情報に基づいてまとめたログシーケンスを作成し、前記ログシーケンスの開始時刻と終了時刻との差分からシーケンス時間を算出し、前記ログシーケンスと前記シーケンス時間とを関連付けたシーケンスグループにグループ化し、
前記シーケンスグループが予め登録された正常シーケンスグループ及び異常シーケンスグループと一致しない場合、予め登録されたインシデント予兆グループのうち、前記シーケンスグループと最も適合率の高いシーケンスグループに基づいてインシデント発生までのインシデント発生見込み時間を算出する。
本開示に係るプログラムは、
ログ情報を収集し、
前記ログ情報を識別するログ識別子と前記ログ情報の時刻情報とを関連付けて記憶し、
複数の前記ログ識別子を前記時刻情報に基づいてまとめたログシーケンスを作成し、前記ログシーケンスの開始時刻と終了時刻との差分からシーケンス時間を算出し、前記ログシーケンスと前記シーケンス時間とを関連付けたシーケンスグループにグループ化し、
前記シーケンスグループが予め登録された正常シーケンスグループ及び異常シーケンスグループと一致しない場合、予め登録されたインシデント予兆グループのうち、前記シーケンスグループと最も適合率の高いシーケンスグループに基づいてインシデント発生までのインシデント発生見込み時間を算出する、
ことをコンピュータに実行させる。
本開示によれば、インシデントの発生を予測することが可能な保守管理装置、システム、方法及びプログラムを提供することができる。
実施の形態に係る保守管理装置を例示するブロック図である。 実施の形態に係るシステムを例示するブロック図である。 実施の形態に係る保守管理装置の動作を例示するフローチャートである。 実施の形態に係るログ情報の分析の様子を例示する模式図である。 実施の形態に係る保守管理装置の動作を例示するフローチャートである。 実施の形態に係るログ情報の分析の様子を例示する模式図である。 実施の形態に係る保守管理装置の動作を例示するフローチャートである。 実施の形態に係るログ情報の分析の様子を例示する模式図である。
以下、図面を参照して本発明の実施の形態について説明する。各図面において、同一又は対応する要素には同一の符号が付されており、説明の明確化のため、必要に応じて重複説明を省略する。
[実施の形態]
図1は、実施の形態に係る保守管理装置を例示するブロック図である。
図2は、実施の形態に係るシステムを例示するブロック図である。
図1及び図2に示すように、システム10sは、保守センター10に設置された保守管理装置11と、お客様サイト20に設置された保守管理装置21と、を備える。また、システム10sは、お客様サイト30に設置された保守管理装置31と、お客様サイト40に設置された保守管理装置41と、をさらに備える。保守管理装置11は、保守管理装置21と保守管理装置31とに接続される。お客様サイトを顧客サイトと称することもある。
保守管理装置11と保守管理装置21と保守管理装置31とは、通信回線60を介して接続される。保守管理装置11は、保守管理装置21から通信回線60を経由して、お客様サイト20のログ情報等を含む保守情報を収集する。また、保守管理装置11は、保守管理装置31から通信回線60を経由して、お客様サイト30のログ情報等を含む保守情報を収集する。
保守管理装置41は通信回線60に接続していないので、保守拠点50の保守員51が保守管理装置41を使用してお客様サイト40のログ情報等を含む保守情報を採取する。保守管理装置11は、保守員51が採取したお客様サイト40のログ情報等を含む保守情報を収集する。
保守管理装置11は、収集部111と記憶部112と分析部113とログ分類部114と異常シーケンス生成部115と分析結果出力部116とを備える。
収集部111は、複数のお客様サイト(お客様サイト20とお客様サイト30とお客様サイト40)のそれぞれの各種ログ情報を収集する。収集部111は、ログ読み込み部1111と送受信部1112とを有する。送受信部1112は、通信回線60を経由して、お客様サイト20とお客様サイト30のそれぞれのログ情報を収集する。送受信部1112は、このようにして、お客様サイト20とお客様サイト30で発生した障害事象の通報情報や障害発生時のログ情報を定期的に収集する。
通信回線60に接続していないお客様サイト40のログ情報は、保守拠点50から出動した保守員51によって採取され、保守管理装置11へ送信される。ログ読み込み部1111は、保守員51が採取したお客様サイト40のログ情報等を含む保守情報を読み込んで収集する。
ログ分類部114は、収集したログ情報をトークンに分離する。ログ情報は、ログ情報を識別するためのログ識別子と、ログ情報が収集された時刻である時刻情報と、を有する。時刻情報をタイプスタンプと称することもある。ログ分類部114は、ログ情報のタイムスタンプ以外の情報に対して、クラスタリングアルゴリズムを適用してログ情報を分類する。ログ分類部114は、ログ識別子記憶部1121を参照し、受信したログ情報に対応するログ識別子を確認する。ログ分類部114は、対応するログ識別子が未登録である場合、新たなログ識別子を付与する。
記憶部112は、ログ識別子記憶部1121とログシーケンス記憶部1122とを有する。ログ識別子記憶部1121は、ログ分類部114が分類した後のログ識別子と、ログ情報の時刻情報と、を関連付けて記憶する。
分析部113は、ログ分析部1131と正常分析部1132と異常分析部1133とを有する。ログ分析部1131は、複数のログ識別子を時刻情報に基づいてまとめたログシーケンスを作成する。すなわち、ログ分析部1131は、時刻情報からログ情報(ログ識別子)の出力順序情報を取得し、出力順序情報に基づいてログ識別子をシーケンス化してログシーケンスを作成する。シーケンス化されたログ識別子をログシーケンスと称する。
ログ分析部1131は、ログシーケンスの開始時刻と終了時刻との差分からシーケンス時間を算出する。ログ分析部1131は、ログシーケンスと、算出したシーケンス時間と、を関連付けたシーケンスグループにグループ化する。
すなわち、ログ分析部1131は、シーケンス開始からシーケンス完了までの最大時間を含めてグループ化する。グループ化したログシーケンス(シーケンスグループ)は、ログシーケンス記憶部1122に記憶される。シーケンス時間は、シーケンス開始からシーケンス完了までの最大時間である。シーケンス時間を、シーケンス最大時間、又はシーケンス完了最大時間と称することもある。
正常分析部1132は、シーケンスグループを所定の時間毎にシーケンス時間までずらしながら、シーケンスグループと予め記憶された正常シーケンスグループとを比較して正常シーケンスグループに対する適合率を算出する。すなわち、シーケンス開始時刻からシーケンス終了時刻まで所定の時間毎にずらしながら、シーケンスグループと正常シーケンスグループとを比較する。正常分析部1132は、正常シーケンスグループと一致しているシーケンスグループを正常と判断する。
異常分析部1133は、正常シーケンスグループと一致しないシーケンスグループに対して、予め記憶された異常シーケンスグループと一致するか否かを判断する。具体的には、異常分析部1133は、シーケンスグループを所定の時間毎にシーケンス時間までずらしながら、シーケンスグループと予め記憶された異常シーケンスグループとを比較して異常シーケンスグループに対する適合率を算出する。
異常分析部1133は、正常シーケンスグループと一部だけ一致し、他は一致しないシーケンスグループを異常と判断する。また、異常分析部1133は、正常シーケンスと一致せず、異常シーケンスグループと一致するシーケンスグループを異常と判断してもよい。
分析部113は、シーケンスグループが予め登録された正常シーケンスグループと一致せず、且つ、予め登録された異常シーケンスグループとも一致しない場合、予め登録されたインシデント予兆グループと比較する。
分析部113は、シーケンスグループとインシデント予兆グループとを、所定の時間毎にシーケンス時間までずらしながら、シーケンスグループとインシデント予兆グループとを比較して適合率を算出する。
分析部113は、比較した結果、インシデント予兆グループのうち、シーケンスグループと最も適合率の高いシーケンスグループに基づいてインシデント発生までのインシデント発生見込み時間を算出する。
正常シーケンスグループとは、シーケンス開始からシーケンス完了まで正常に動作したシーケンスグループである。異常シーケンスグループとは、シーケンス開始からシーケンス完了までの間に何等かの理由(インシデンドの発生等)により、シーケンスが停止したりして正常に動作しなかったシーケンスグループである。
インシデント予兆グループは、正常シーケンスグループに含まれず、異常シーケンスグループにも含まれないシーケンスグループである。インシデント予兆グループには、今までインシデントが発生したことは無いが、今後、新規のインシデントが発生し、異常シーケンスグループになる可能性が高いシーケンスグループが含まれる。
異常シーケンス生成部115は、今まで発生したことのない新規のインシデントが発生した場合、このインシデントが発生したシーケンスを、新規の異常シーケンスグループの1つとして生成する。また、異常シーケンス生成部115は、今後、新規のインシデントが発生し、異常シーケンスグループになる可能性が高いインシデント予兆グループを生成する。
異常分析部1133が異常と判断したシーケンスグループがログシーケンス記憶部1122に記憶されていない場合、異常シーケンス生成部115は、異常と判断されたシーケンスグループに基づいて新たなシーケンスグループを生成する。生成された新たなシーケンスグループのうち、インシデントの発生時刻よりも前のシーケンスグループは、インシデント予兆グループとしてログシーケンス記憶部1122に記憶される。
分析結果出力部116は、分析部113が分析した結果を出力し表示する。分析結果出力部116は、例えば、分析部113が算出した正常ログシーケンスグループに対する適合率とインシデント発生見込み時間とを出力する。また、分析結果出力部116は、インシデントの発生の契機と異常シーケンスの発生期間とを表示してもよい。
システム10sの保守者は、インシデントが発生した場合、動作の把握やインシデント発生の原因究明のため、お客様サイトの保守管理装置から出力されるログ情報を収集する。保守者は、収集したログ情報を分析して状態判断や原因調査を行うことにより、インシデント発生の原因を究明する。
図3は、実施の形態に係る保守管理装置の動作を例示するフローチャートである。
図4は、実施の形態に係るログ情報の分析の様子を例示する模式図である。
図3及び図4に示すように、収集部111がログ情報を受信すると、ログ分類部114は、ログ情報をトークンに分離する(ステップS101)。図4に示す「2017/11/11 15:35:53」は、ログ情報の時刻情報(タイムスタンプ)である。ログ分類部114は、トークンに分離したログ情報に対してクラスタリングアルゴリズムを適用する(ステップS102)。一度、トークンに分離されたログ情報は、ログ分類部114により再びトークンの一部が結合されて複数のクラスタになる。
ログ分類部114は、ログ識別子記憶部1121を参照し、受信したログ情報に対応するログ識別子が、ログ識別子記憶部1121に記憶(登録)済みか否かを確認する(ステップS103)。
ログ分類部114は、ログ情報に対応するログ識別子が未登録である場合、受信したログ情報に新たなログ識別子を付与する(ステップS104)。図4に示す「SID00001」は、ログ情報に付与された新たなログ識別子である。ログ識別子と時刻情報とは、ログ識別子記憶部1121に記憶され登録される(ステップS105)。
図5は、実施の形態に係る保守管理装置の動作を例示するフローチャートである。
図6は、実施の形態に係るログ情報の分析の様子を例示する模式図である。
図5及び図6に示すように、分析部113のログ分析部1131は、ログ識別子とログの出力順序に従い、ログ識別子をシーケンス化する(ステップS201)。
図6で、簡単のため、複数のログ情報のうちの2つのログ情報を示す。1つ目は、ログ識別子が「SID00010」であり、ログ情報の時刻情報が「2017/11/11 15:25:50」である。2つ目は、ログ識別子が「SID00001」であり、ログ情報の時刻情報が「2017/11/11 15:35:53」である。これらは、ステップS201によって、「SID00010→SID00001」のようにシーケンス化される。
ログ分析部1131は、ログシーケンスの開始時刻とログシーケンスの終了時刻との差分からシーケンス完了までの最大時間を算出する(ステップS202)。図6に示す「00:10:03」は、シーケンス完了までの最大時間を示す。シーケンス完了までの最大時間をシーケンス完了最大時間、シーケンス最大時間、又はシーケンス時間と称する。
ログ分析部1131は、ログシーケンスと、シーケンス完了最大時間と、をまとめてシーケンスグループにグループ化する(ステップS203)。図6に示す「SID00010」と「SID00001」と「00:10:03」とは、グループ化されたシーケンスグループを示す。
インシデントが発生していないシーケンスグループ(ログシーケンス)は、正常シーケンスグループであると判断され、ログシーケンス記憶部1122に記憶(登録)される。正常シーケンスグループであると判断されたシーケンスグループは、後述するステップS301において、正常シーケンスグループによる分析が行われる。
図7は、実施の形態に係る保守管理装置の動作を例示するフローチャートである。
図8は、実施の形態に係るログ情報の分析の様子を例示する模式図である。
図7に示すように、分析部113の正常分析部1132は、シーケンスグループ(ログシーケンス)を受信した後、ログシーケンス記憶部1122に記憶された正常シーケンスグループを参照し、正常シーケンスグループによる分析を行う(ステップS301)。
正常分析部1132は、受信したシーケンスグループが正常シーケンスグループと一致する場合、受信したシーケンスグループを正常と判断する(ステップS302:Yes)。
分析結果出力部116は、シーケンスグループが正常と判断された場合(ステップS302:Yes)、シーケンスグループが正常である旨の分析結果を出力する(ステップS311)。
正常分析部1132は、受信したシーケンスグループが正常シーケンスグループと一致しない場合(ステップS302:No)、シーケンス完了最大時間の範囲における適合率(類似度)を算出する(ステップS303)。
正常分析部1132は、シーケンスグループと正常シーケンスグループとを、所定の時間毎にシーケンス完了最大時間までずらしながら比較してそれらの適合率を算出する。適合率には、ログ識別子適合率とシーケンス順序適合率とがある。ログ識別子適合率は、シーケンスグループ(ログシーケンス)中の適合するログ識別子の数に基づいて算出される。シーケンス順序適合率は、適合するログ識別子の順序に基づいて算出される。
図8に示すように、記憶されている正常シーケンスグループが「SID00002→SID00010→SID00100」であり、受信した新規のシーケンスグループが「SID00001→SID00100→SID00010」である場合を考える。このような場合、新規のシーケンスグループの中の3つのログ識別子のうち、「SID00100」と「SID00010」とが、正常シーケンスグループにも存在する。3つのログ識別子のうち2つのログ識別子が同じである。これに基づいて、例えば、ログ識別子適合率は、66.7%(パーセント)と算出される。
ステップS303の後、異常分析部1133は、ログシーケンス記憶部1122に記憶された異常シーケンスグループを参照し、異常シーケンスグループによる分析を行う(ステップS304)。
異常分析部1133は、受信したシーケンスグループが異常シーケンスグループと一致する場合、受信したシーケンスグループを異常と判断する(ステップS305:Yes)。
分析結果出力部116は、受信したシーケンスグループが異常と判断された場合(ステップS305:Yes)、受信したシーケンスグループが異常である旨の分析結果を出力する(ステップS311)。
ステップS302で正常と判断されず(ステップS302:No)、且つ、ステップS305で異常と判断されない(ステップS305:No)シーケンスグループは、今までとは異なる新規の(未知の)シーケンスグループである。
異常シーケンス生成部115は、未知のシーケンスグループに対してステップS303で算出した正常シーケンスグループとの適合率を含む付加情報を付加し、未知のシーケンスグループに基づいて新たな異常シーケンスグループを生成する(ステップS306)。すなわち、異常シーケンス生成部115は、受信したシーケンスグループが正常シーケンスグループと一部だけ一致し、異常シーケンスグループと一致しない場合、受信したシーケンスグループに基づいて新たな異常シーケンスグループを生成する。
ステップS306の後、分析部113は、受信したシーケンスグループが、インシデントが発生した時刻よりも前のシーケンスグループか否かを判断する(ステップS307)。
分析部113は、受信したシーケンスグループのうち、インシデントが発生した時刻よりも前のシーケンスグループを、インシデント予兆グループとしてログシーケンス記憶部1122に記憶する。インシデント予兆グループは、異常シーケンスグループとは異なり、今までインシデントが発生したことは無いが、今後、新規のインシデントが発生し、異常シーケンスグループになる可能性が高いシーケンスグループである。
分析部113は、インシデント予兆グループとされたシーケンスグループに、インシデント予兆グループの情報を追加で付与する(ステップS308)。インシデント予兆グループの情報とは、例えば、現在時刻とインシデントの発生時刻との差分の時間である。この差分の時間を、インシデント猶予時間と称することもある。
分析部113は、受信したシーケンスグループがログシーケンス記憶部1122に予め登録されたインシデント予兆グループと一致した場合(同一のものがあった場合)、統計解析を行いインシデント発生見込み時間を算出する(ステップS309)。
分析部113は、シーケンスグループとインシデント予兆グループとを比較し、インシデント予兆グループのうち、最も適合率の高いシーケンスグループに基づいてインシデント発生見込み時間を算出してもよい。
シーケンスグループとインシデント発生見込み時間とは、ログシーケンス記憶部1122に記憶される(ステップS310)。
また、分析部113は、インシデントが発生した後のシーケンスグループを、インシデント発生中やインシデント発生後の後処理で出力された参考のシーケンスグループとして、ログシーケンス記憶部1122に記憶してもよい。
分析結果出力部116は、ログシーケンス記憶部1122に新たに記憶されたシーケンスグループの分析結果を出力する(ステップS311)。
分析結果出力部116が出力した出力結果は、保守センター10と保守拠点50に在籍する保守員51に通知される。このため、保守員51は、インシデント発生後、即座に保守作業に取り掛かることができる。
また、出力結果には、インシデント予兆グループとインシデント発生見込み時間とが含まれる。このため、保守員51は、インシデントが発生する前において、事前の対処を行うことができる。
実施の形態に係る保守管理装置11は、予め登録されたインシデント予兆グループのうち、受信したログシーケンスのシーケンスグループと最も適合率の高いシーケンスグループに基づいてインシデント発生見込み時間を算出する。すなわち、保守管理装置11は、インシデント予兆グループを使用してインシデントの発生を予測し、インシデント発生見込み時間を算出しこれを出力する。これにより、インシデントの発生を予測することが可能な保守管理装置、システム、方法及びプログラムを提供することができる。
また、実施の形態に係る保守管理装置11は、受信したログシーケンスがどの装置(お客様サイト)から送信されたものかを把握できるので、インシデントが発生すると予測される装置(箇所)を特定することができる。
また、実施の形態に係る保守管理装置11は、ログを解析するためにログ情報の代わりにログ識別子と時刻情報とを記憶する。これにより、保守管理装置11は、全てのログ情報を記憶する場合と比べて、ログ情報の情報量を低減し、記憶容量を低減し、運用管理コストを低減することができる。
また、実施の形態に係る保守管理装置11は、インシデントが発生する時刻を予測するので、その予測時刻に合わせて保守員51を予め待機させておくことができる。これにより、インシデントの発生から解決までの時間を短縮することができる。
また、実施の形態に係るシステム10sは、1台の保守管理装置11を使用してシステム10s全体の保守管理を行う。これにより、システム10sは、ホスト単位で保守管理する場合と比べて保守管理のためのコストを低減することができる。
尚、実施の形態では、保守管理装置11がインシデントの発生を予測することを例に挙げて説明したが、これには限定されない。実施の形態は、保守センター10等において、インシデントの発生を分析するプログラムが動作できる環境を有する装置であれば、どのような情報処理システム、情報処理装置、ソフトウェアにも適用することができる。
また、上記の実施の形態では、本発明をハードウェアの構成として説明したが、本発明はこれに限定されるものではない。本発明は、各構成要素の処理を、CPU(Central Processing Unit)にコンピュータプログラムを実行させることにより実現することも可能である。
上記の実施の形態において、プログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実態のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば光磁気ディスク)、CD−ROM(Read Only Memory)、CD−R、CD−R/W、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM))、フラッシュROM、RAM(Random Access Memory)を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。
なお、本発明は上記実施の形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。
10…保守センター
10s…システム
11…保守管理装置
111…収集部
1111…ログ読み込み部
1112…送受信部
112…記憶部
1121…ログ識別子記憶部
1122…ログシーケンス記憶部
113…分析部
1131…ログ分析部
1132…正常分析部
1133…異常分析部
114…ログ分類部
115…異常シーケンス生成部
116…分析結果出力部
20、30、40…お客様サイト
21、31、41…保守管理装置
22、23、32、42…ログ情報記憶部
50…保守拠点
51…保守員
60…通信回線

Claims (9)

  1. ログ情報を収集する収集部と、
    前記ログ情報を識別するログ識別子と前記ログ情報の時刻情報とを関連付けて記憶する記憶部と、
    複数の前記ログ識別子を前記時刻情報に基づいてまとめたログシーケンスを作成し、前記ログシーケンスの開始時刻と終了時刻との差分からシーケンス時間を算出し、前記ログシーケンスと前記シーケンス時間とを関連付けたシーケンスグループにグループ化する分析部と、
    を備え、
    前記分析部は、前記シーケンスグループが予め登録された正常シーケンスグループ及び異常シーケンスグループと一致しない場合、予め登録されたインシデント予兆グループのうち、前記シーケンスグループと最も適合率の高いシーケンスグループに基づいてインシデント発生までのインシデント発生見込み時間を算出する、
    保守管理装置。
  2. 前記インシデント発生見込み時間を出力する分析結果出力部をさらに備える、
    請求項1に記載の保守管理装置。
  3. 前記分析部は、前記時刻情報から前記ログ情報の出力順序情報を取得し、前記出力順序情報に基づいて前記ログ識別子をシーケンス化して前記ログシーケンスを作成する
    請求項1又は2に記載の保守管理装置。
  4. 前記ログ情報に対応するログ識別子が未登録である場合、前記ログ情報に新たなログ識別子が付与される、
    請求項1乃至3のいずれか1つに記載の保守管理装置。
  5. 前記分析部は、前記シーケンスグループと前記インシデント予兆グループとを、所定の時間毎に前記シーケンス時間までずらしながら、前記シーケンスグループと前記インシデント予兆グループとを比較して前記適合率を算出する、
    請求項1乃至4のいずれか1つに記載の保守管理装置。
  6. 前記時刻情報は、前記ログ情報が収集された時刻である、
    請求項1乃至5のいずれか1つに記載の保守管理装置。
  7. 顧客サイトに設置された保守管理装置と、前記顧客サイトの保守管理装置に接続され、保守センターに設置された保守管理装置と、を備え、
    前記保守センターに設置された保守管理装置は、
    ログ情報を収集する収集部と、
    前記ログ情報を識別するログ識別子と前記ログ情報の時刻情報とを関連付けて記憶する記憶部と、
    複数の前記ログ識別子を前記時刻情報に基づいてまとめたログシーケンスを作成し、前記ログシーケンスの開始時刻と終了時刻との差分からシーケンス時間を算出し、前記ログシーケンスと前記シーケンス時間とを関連付けたシーケンスグループにグループ化する分析部と、を有し、
    前記分析部は、前記シーケンスグループが予め登録された正常シーケンスグループ及び異常シーケンスグループと一致しない場合、予め登録されたインシデント予兆グループのうち、前記シーケンスグループと最も適合率の高いシーケンスグループに基づいてインシデント発生までのインシデント発生見込み時間を算出する、
    システム。
  8. 前記インシデント発生見込み時間を出力する分析結果出力部をさらに備える、
    請求項7に記載のシステム。
  9. ログ情報を収集し、
    前記ログ情報を識別するログ識別子と前記ログ情報の時刻情報とを関連付けて記憶し、
    複数の前記ログ識別子を前記時刻情報に基づいてまとめたログシーケンスを作成し、前記ログシーケンスの開始時刻と終了時刻との差分からシーケンス時間を算出し、前記ログシーケンスと前記シーケンス時間とを関連付けたシーケンスグループにグループ化し、
    前記シーケンスグループが予め登録された正常シーケンスグループ及び異常シーケンスグループと一致しない場合、予め登録されたインシデント予兆グループのうち、前記シーケンスグループと最も適合率の高いシーケンスグループに基づいてインシデント発生までのインシデント発生見込み時間を算出する、
    ことをコンピュータに実行させるプログラム。
JP2018023017A 2018-02-13 2018-02-13 保守管理装置、システム及びプログラム Active JP6512646B1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2018023017A JP6512646B1 (ja) 2018-02-13 2018-02-13 保守管理装置、システム及びプログラム
PCT/JP2018/042517 WO2019159460A1 (ja) 2018-02-13 2018-11-16 保守管理装置、システム、方法及び非一時的なコンピュータ可読媒体
US16/969,023 US20210027254A1 (en) 2018-02-13 2018-11-16 Maintenance management apparatus, system, method, and non-transitory computer readable medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018023017A JP6512646B1 (ja) 2018-02-13 2018-02-13 保守管理装置、システム及びプログラム

Publications (2)

Publication Number Publication Date
JP6512646B1 true JP6512646B1 (ja) 2019-05-15
JP2019139556A JP2019139556A (ja) 2019-08-22

Family

ID=66530870

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018023017A Active JP6512646B1 (ja) 2018-02-13 2018-02-13 保守管理装置、システム及びプログラム

Country Status (3)

Country Link
US (1) US20210027254A1 (ja)
JP (1) JP6512646B1 (ja)
WO (1) WO2019159460A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110990387B (zh) * 2019-11-29 2024-02-27 广东电网有限责任公司 一种电能计量设备停电记录错误处理方法及装置
JP7182586B2 (ja) * 2020-10-07 2022-12-02 エヌ・ティ・ティ・コムウェア株式会社 学習装置、推定装置、シーケンス推定システムおよび方法、プログラム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6353902B1 (en) * 1999-06-08 2002-03-05 Nortel Networks Limited Network fault prediction and proactive maintenance system
JP5011174B2 (ja) * 2008-03-12 2012-08-29 株式会社日立製作所 情報機器管理方法
WO2012103541A2 (en) * 2011-01-28 2012-08-02 Schlumberger Canada Limited Pipe damage interpretation system
WO2012127588A1 (ja) * 2011-03-18 2012-09-27 富士通株式会社 対処支援プログラム、対処支援装置および対処支援方法
CN103793284B (zh) * 2012-10-29 2017-06-20 伊姆西公司 基于共同序列模式的、用于智能客户服务的分析***和方法
JP6152788B2 (ja) * 2013-12-02 2017-06-28 富士通株式会社 障害予兆検知方法、情報処理装置およびプログラム
US10514974B2 (en) * 2015-02-17 2019-12-24 Nec Corporation Log analysis system, log analysis method and program recording medium

Also Published As

Publication number Publication date
WO2019159460A1 (ja) 2019-08-22
JP2019139556A (ja) 2019-08-22
US20210027254A1 (en) 2021-01-28

Similar Documents

Publication Publication Date Title
EP2523115B1 (en) Operation management device, operation management method, and program storage medium
CN108445410B (zh) 一种监测蓄电池组运行状态的方法及装置
EP3131234B1 (en) Core network analytics system
JP5874936B2 (ja) 運用管理装置、運用管理方法、及びプログラム
EP2490126B1 (en) System operation management device, system operation management method, and program storage medium
US20160378583A1 (en) Management computer and method for evaluating performance threshold value
JP5855036B2 (ja) 設備点検順位設定装置
CN103392176B (zh) 用于预测网络事件泛滥的装置和方法
JP2007172131A (ja) 障害予測システム、障害予測方法、障害予測プログラム
JP2010526352A (ja) 統計的な分析を利用した性能障害管理システム及びその方法
CN104583968A (zh) 管理***及管理程序
JP6413537B2 (ja) 障害予兆通報装置および予兆通報方法、予兆通報プログラム
JP5387779B2 (ja) 運用管理装置、運用管理方法、及びプログラム
JP2016024786A (ja) ログ解析装置
US20200233587A1 (en) Method, device and computer product for predicting disk failure
JP6512646B1 (ja) 保守管理装置、システム及びプログラム
JP2014134956A (ja) 障害分析支援装置、障害分析支援方法、及びプログラム
KR101444250B1 (ko) 개인정보 접근감시 시스템 및 그 방법
JP2006039650A (ja) 対応優先順位決定装置、及びその方法
CN115102838B (zh) 服务器宕机风险的应急处理方法和装置、电子设备
CN114297034A (zh) 云平台监控方法及云平台
JP5380386B2 (ja) 機器情報管理システム及び方法
JP7303461B2 (ja) 復旧判定装置、復旧判定方法、および、復旧判定プログラム
WO2020150987A1 (zh) 一种硬件故障预测方法及预测装置
JP3795483B2 (ja) メッセージ抽出装置及びメッセージ抽出方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181105

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190108

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190225

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190312

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190404

R150 Certificate of patent or registration of utility model

Ref document number: 6512646

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150