JP7147495B2 - 復旧支援装置、復旧支援方法及びプログラム - Google Patents
復旧支援装置、復旧支援方法及びプログラム Download PDFInfo
- Publication number
- JP7147495B2 JP7147495B2 JP2018214190A JP2018214190A JP7147495B2 JP 7147495 B2 JP7147495 B2 JP 7147495B2 JP 2018214190 A JP2018214190 A JP 2018214190A JP 2018214190 A JP2018214190 A JP 2018214190A JP 7147495 B2 JP7147495 B2 JP 7147495B2
- Authority
- JP
- Japan
- Prior art keywords
- recovery
- index value
- work
- safety
- work sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000011084 recovery Methods 0.000 title claims description 178
- 238000000034 method Methods 0.000 title claims description 56
- 230000008859 change Effects 0.000 claims description 49
- 230000005856 abnormality Effects 0.000 claims description 48
- 238000004891 communication Methods 0.000 claims description 43
- 238000004364 calculation method Methods 0.000 claims description 33
- 230000006870 function Effects 0.000 description 17
- 238000001514 detection method Methods 0.000 description 14
- 238000005516 engineering process Methods 0.000 description 11
- 238000012545 processing Methods 0.000 description 11
- 230000007704 transition Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- FTGYKWAHGPIJIT-UHFFFAOYSA-N hydron;1-[2-[(2-hydroxy-3-phenoxypropyl)-methylamino]ethyl-methylamino]-3-phenoxypropan-2-ol;dichloride Chemical compound Cl.Cl.C=1C=CC=CC=1OCC(O)CN(C)CCN(C)CC(O)COC1=CC=CC=C1 FTGYKWAHGPIJIT-UHFFFAOYSA-N 0.000 description 4
- 230000015654 memory Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000012806 monitoring device Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000007257 malfunction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000013396 workstream Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0654—Management of faults, events, alarms or notifications using network fault recovery
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/60—Business processes related to postal services
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0604—Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time
- H04L41/0627—Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time by acting on the notification or alarm source
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0631—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
- H04L41/0645—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis by additionally acting on or stimulating the network after receiving notifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/50—Network service management, e.g. ensuring proper service fulfilment according to agreements
- H04L41/5061—Network service management, e.g. ensuring proper service fulfilment according to agreements characterised by the interaction between service providers and their network customers, e.g. customer relationship management
- H04L41/5074—Handling of user complaints or trouble tickets
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Entrepreneurship & Innovation (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Debugging And Monitoring (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Computer And Data Communications (AREA)
Description
本発明の実施の形態では上記の非特許文献1又は2に記載されている自動生成技術によって各異常に対して複数の復旧作業列が生成されるが、復旧作業列が定型的であるか否かにより正確性を判定することができると考えられる。そこで、安定性を「復旧作業列の一意性」と定義する。この一意性を計算することで、復旧作業列の安定性が得られる。
異常から復旧するための作業の中には、通信の遮断が発生したり、システムが高負荷となったりするものがある(例えば、システムの再起動やシステム全体への文字列検索等)。このため、予期せずに顧客サービスが利用不可となったり、他のサービスに何等かの影響が発生したりする場合がある(すなわち、復旧作業によって二次災害が発生する場合がある。)。
安全性の定義(その1)では、安全性を「復旧作業列を構成する各作業xi s(i=1,・・・,N)の各々がシステムの性能値に与える影響度と通信ネットワークの疎通性に与える影響度との合計値に応じた値」と定義する。この合計値に応じた値を計算することで、復旧作業列の安全性が得られる。
V. Vapnik, A. Lerner. "Pattern recognition using generalized portrait method", Automation and Remote Control, 24, 1963.
[参考文献2]
D. S. Broomhead, David Lowe, "Radial basis functions, multi-variable functional interpolation and adaptive networks", (Technical report). RSRE. No. 4148,1988.
ここで、影響度(つまり、システムの性能値に与える影響度及び通信ネットワークの疎通性に与える影響度)はオペレータが任意に決定することができるが、例えば、単位時間あたりの性能値の変化量(以降、「性能値変化量」とも表す。)や単位時間あたりの疎通性の変化量(以降、「疎通性変化量」とも表す。)に基づいて決定することが好ましい。これにより、影響度を、作業が実行された場合におけるシステム及び通信ネットワークへの影響を事前に予測することが可能な指標とすることができる。なお、性能値変化量は、例えば、sar(System Admin Reporter)コマンドにより取得することができる。また、疎通性変化量は、例えば、ping等により取得することができる。通信インタフェースのdown/upは、例えば、システムからのアラート等から取得することができる。
安全性の定義(その1)では安全性を「復旧作業列を構成する各作業xi s(i=1,・・・,N)の各々がシステムの性能値に与える影響度と通信ネットワークの疎通性に与える影響度との合計値に応じた値」と定義した。したがって、オペレータは、学習データを作成する際に、例えば、性能値変化量や疎通性変化量から影響度を決定した上で、各作業xi sに対して正解データを付与する必要がある。このため、大量の学習データを作成する場合には、オペレータの稼働が多大となることがある。
次に、本発明の実施の形態におけるシステムの全体構成について、図1を参照しながら説明する。図1は、本発明の実施の形態におけるシステムの全体構成の一例を示す図である。
次に、機器群20に含まれる機器で異常が発生した場合に、当該異常からの復旧を支援する処理(復旧支援処理)について、図2を参照しながら説明する。図2は、本発明の実施の形態における復旧支援処理の一例を示すフローチャートである。
ここで、安定性及び安全性の計算の具体例を図3のワークフローを用いて説明する。図3に示すワークフローは、或る異常sが発生した場合に、過去のトラブルチケットを用いて、上記の非特許文献1に記載された技術によって可視化されたワークフロー(つまり、復旧作業に関するワークフロー)の一例である。
ワークフローA:作業ノード1→作業ノード2→作業ノード4→作業ノード7と各作業ノードを経由する。このため、作業ノード1→作業ノード2へ遷移する頻度を用いて、作業ノード2の作業の確率は4/5となる。同様に、作業ノード2→作業ノード4へ遷移する頻度を用いて、作業ノード4の作業の確率は1/4となる。同様に、作業ノード4→作業ノード7へ遷移する頻度を用いて、作業ノード7の作業の確率は1となる。これにより、ワークフローAの安定性は、log(4/5)+log(1/4)=-log5となる。
図3に示す例では、簡単のため、f(作業A-4)=5、f(作業E-6)=3、f(作業B-5)=f(作業C-5)=f(作業D-5)=10、f(作業A-7)=f(作業B-7)=f(作業C-7)=f(作業D-7)=1、f(その他の作業)=0と関数fが事前に学習されているものとする。
最後に、本発明の実施の形態における復旧支援装置10のハードウェア構成について、図4を参照しながら説明する。図4は、本発明の実施の形態における復旧支援装置10のハードウェア構成の一例を示す図である。
20 機器群
101 異常検知部
102 復旧作業列生成部
103 指標値計算部
104 UI部
105 乖離度計算部
106 再学習指示部
110 過去事例DB
120 変化量DB
Claims (7)
- 通信ネットワークを構成する機器群で発生した異常から復旧するための作業手順を示す復旧作業列に基づいて、前記復旧作業列に対する所定の指標値を計算する指標値計算手段と、
前記指標値計算手段により計算された指標値を所定の出力先に出力する出力手段と、
を有し、
前記指標値計算手段は、
前記指標値として、前記復旧作業列の実行によって前記異常から復旧可能な確実性を示す安定性と、前記復旧作業列の実行によって前記機器群の性能値及び前記通信ネットワークの疎通性に与える影響を示す安全性とのうちの少なくとも一方を計算し、
前記復旧作業列に含まれる各作業が実行された場合における前記性能値に対する影響度と前記疎通性に対する影響度との合計値が予め学習された関数を用いて、前記安全性を計算する、ことを特徴とする復旧支援装置。 - 通信ネットワークを構成する機器群で発生した異常から復旧するための作業手順を示す復旧作業列に基づいて、前記復旧作業列に対する所定の指標値を計算する指標値計算手段と、
前記指標値計算手段により計算された指標値を所定の出力先に出力する出力手段と、
を有し、
前記指標値計算手段は、
前記指標値として、前記復旧作業列の実行によって前記異常から復旧可能な確実性を示す安定性と、前記復旧作業列の実行によって前記機器群の性能値及び前記通信ネットワークの疎通性に与える影響を示す安全性とのうちの少なくとも一方を計算し、
前記復旧作業列に含まれる各作業が実行された場合における前記性能値の変化量と前記疎通性の変化量とが予め学習された関数を用いて、前記安全性を計算する、ことを特徴とする復旧支援装置。 - 前記指標値計算手段は、
前記関数としてSVR又はDNNを用いて、前記安全性を計算する、ことを特徴とする請求項1又は2に記載の復旧支援装置。 - 前記指標値計算手段は、
前記復旧作業列に含まれる各作業が実行される確率、エントロピー又はパープレキシティを用いて、前記安定性を計算する、ことを特徴とする請求項1乃至3の何れか一項に記載の復旧支援装置。 - 通信ネットワークを構成する機器群で発生した異常から復旧するための作業手順を示す復旧作業列に基づいて、前記復旧作業列に対する所定の指標値を計算する指標値計算手順と、
前記指標値計算手順で計算された指標値を所定の出力先に出力する出力手順と、
をコンピュータが実行し、
前記指標値計算手順は、
前記指標値として、前記復旧作業列の実行によって前記異常から復旧可能な確実性を示す安定性と、前記復旧作業列の実行によって前記機器群の性能値及び前記通信ネットワークの疎通性に与える影響を示す安全性とのうちの少なくとも一方を計算し、
前記復旧作業列に含まれる各作業が実行された場合における前記性能値に対する影響度と前記疎通性に対する影響度との合計値が予め学習された関数を用いて、前記安全性を計算する、ことを特徴とする復旧支援方法。 - 通信ネットワークを構成する機器群で発生した異常から復旧するための作業手順を示す復旧作業列に基づいて、前記復旧作業列に対する所定の指標値を計算する指標値計算手順と、
前記指標値計算手順で計算された指標値を所定の出力先に出力する出力手順と、
をコンピュータが実行し、
前記指標値計算手順は、
前記指標値として、前記復旧作業列の実行によって前記異常から復旧可能な確実性を示す安定性と、前記復旧作業列の実行によって前記機器群の性能値及び前記通信ネットワークの疎通性に与える影響を示す安全性とのうちの少なくとも一方を計算し、
前記復旧作業列に含まれる各作業が実行された場合における前記性能値の変化量と前記疎通性の変化量とが予め学習された関数を用いて、前記安全性を計算する、ことを特徴とする復旧支援方法。 - コンピュータを、請求項1乃至4の何れか一項に記載の復旧支援装置における各手段として機能させるためのプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018214190A JP7147495B2 (ja) | 2018-11-14 | 2018-11-14 | 復旧支援装置、復旧支援方法及びプログラム |
US17/291,050 US11595244B2 (en) | 2018-11-14 | 2019-11-01 | Recovery support apparatus, recovery support method and program |
PCT/JP2019/043084 WO2020100634A1 (ja) | 2018-11-14 | 2019-11-01 | 復旧支援装置、復旧支援方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018214190A JP7147495B2 (ja) | 2018-11-14 | 2018-11-14 | 復旧支援装置、復旧支援方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020086474A JP2020086474A (ja) | 2020-06-04 |
JP7147495B2 true JP7147495B2 (ja) | 2022-10-05 |
Family
ID=70730487
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018214190A Active JP7147495B2 (ja) | 2018-11-14 | 2018-11-14 | 復旧支援装置、復旧支援方法及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US11595244B2 (ja) |
JP (1) | JP7147495B2 (ja) |
WO (1) | WO2020100634A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7147495B2 (ja) * | 2018-11-14 | 2022-10-05 | 日本電信電話株式会社 | 復旧支援装置、復旧支援方法及びプログラム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006031488A (ja) | 2004-07-16 | 2006-02-02 | Univ Of Electro-Communications | 設計支援方法 |
JP2008009842A (ja) | 2006-06-30 | 2008-01-17 | Hitachi Ltd | コンピュータシステムの制御方法及びコンピュータシステム |
JP2018170618A (ja) | 2017-03-29 | 2018-11-01 | Kddi株式会社 | 障害自動復旧システム、制御装置、手順作成装置およびプログラム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4894709B2 (ja) * | 2007-10-04 | 2012-03-14 | 株式会社Ihi | 製品設計支援システム及びコンピュータにおける製品設計支援のための動作方法 |
CN108322406B (zh) * | 2017-12-28 | 2021-10-08 | 广东电网有限责任公司电力调度控制中心 | 一种基于链路性能和流分类的sdn数据平面故障恢复方法 |
JP7147495B2 (ja) * | 2018-11-14 | 2022-10-05 | 日本電信電話株式会社 | 復旧支援装置、復旧支援方法及びプログラム |
WO2021240695A1 (ja) * | 2020-05-27 | 2021-12-02 | 日本電信電話株式会社 | 光受信装置及びクロック同期方法 |
-
2018
- 2018-11-14 JP JP2018214190A patent/JP7147495B2/ja active Active
-
2019
- 2019-11-01 US US17/291,050 patent/US11595244B2/en active Active
- 2019-11-01 WO PCT/JP2019/043084 patent/WO2020100634A1/ja active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006031488A (ja) | 2004-07-16 | 2006-02-02 | Univ Of Electro-Communications | 設計支援方法 |
JP2008009842A (ja) | 2006-06-30 | 2008-01-17 | Hitachi Ltd | コンピュータシステムの制御方法及びコンピュータシステム |
JP2018170618A (ja) | 2017-03-29 | 2018-11-01 | Kddi株式会社 | 障害自動復旧システム、制御装置、手順作成装置およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
US11595244B2 (en) | 2023-02-28 |
JP2020086474A (ja) | 2020-06-04 |
WO2020100634A1 (ja) | 2020-05-22 |
US20210392036A1 (en) | 2021-12-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8140914B2 (en) | Failure-model-driven repair and backup | |
US7870424B2 (en) | Parallel computer system | |
US7496795B2 (en) | Method, system, and computer program product for light weight memory leak detection | |
JP6988304B2 (ja) | 運用管理システム、監視サーバ、方法およびプログラム | |
CN110737924B (zh) | 一种数据保护的方法和设备 | |
WO2018109825A1 (ja) | バージョン管理システムおよびバージョン管理方法 | |
JP5942481B2 (ja) | 運用作業管理システム、方法、及びプログラム | |
JP7147495B2 (ja) | 復旧支援装置、復旧支援方法及びプログラム | |
CN106875018B (zh) | 一种超大规模机器自动化维修的方法和装置 | |
JP6880961B2 (ja) | 情報処理装置、およびログ記録方法 | |
JP7193701B2 (ja) | 障害対処プログラム及び障害対処方法 | |
Nikiforov | Clustering-based anomaly detection for microservices | |
JP7263206B2 (ja) | 情報処理システム、情報処理システムの制御方法、情報処理装置、及びプログラム | |
JP6787873B2 (ja) | 異常種別判定装置、異常種別判定方法及びプログラム | |
CN108073450A (zh) | 一种任务调度方法、装置及*** | |
JP6835702B2 (ja) | 異常推定装置、異常推定方法及びプログラム | |
US20220398143A1 (en) | Network monitoring apparatus, method, and program | |
JP6835688B2 (ja) | 分析管理システムおよび分析管理方法 | |
JP2020135739A (ja) | 障害予兆検知システム | |
JP7296426B2 (ja) | 情報システムを管理する管理システム及び管理方法 | |
JP6508202B2 (ja) | 情報処理装置、情報処理方法、及び、プログラム | |
JP7180319B2 (ja) | 情報処理装置、及び情報処理装置のダンプ管理方法 | |
CN106293897B (zh) | 组件自动化调度*** | |
JP6797789B2 (ja) | 状態推定装置、状態推定方法及びプログラム | |
Vafaie et al. | A New Statistical Method for Anomaly Detection in Distributed Systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210215 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220412 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220609 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220823 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220905 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7147495 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |