JP7380830B2 - 障害対処装置及びシステム、ルールリスト生成方法並びにプログラム - Google Patents
障害対処装置及びシステム、ルールリスト生成方法並びにプログラム Download PDFInfo
- Publication number
- JP7380830B2 JP7380830B2 JP2022503695A JP2022503695A JP7380830B2 JP 7380830 B2 JP7380830 B2 JP 7380830B2 JP 2022503695 A JP2022503695 A JP 2022503695A JP 2022503695 A JP2022503695 A JP 2022503695A JP 7380830 B2 JP7380830 B2 JP 7380830B2
- Authority
- JP
- Japan
- Prior art keywords
- execution
- condition
- failure
- list
- handling
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 46
- 238000013024 troubleshooting Methods 0.000 title claims description 4
- 230000001629 suppression Effects 0.000 claims description 109
- 230000008569 process Effects 0.000 claims description 35
- 230000014509 gene expression Effects 0.000 claims description 31
- 230000004044 response Effects 0.000 claims description 15
- 238000001514 detection method Methods 0.000 claims description 4
- 230000009471 action Effects 0.000 description 150
- 230000000875 corresponding effect Effects 0.000 description 35
- 238000010586 diagram Methods 0.000 description 32
- 230000005764 inhibitory process Effects 0.000 description 31
- 238000012545 processing Methods 0.000 description 23
- 238000012544 monitoring process Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 10
- 238000011084 recovery Methods 0.000 description 7
- 238000004590 computer program Methods 0.000 description 6
- 238000000605 extraction Methods 0.000 description 6
- 239000000284 extract Substances 0.000 description 5
- 230000010365 information processing Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000012806 monitoring device Methods 0.000 description 3
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- OHVLMTFVQDZYHP-UHFFFAOYSA-N 1-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)-2-[4-[2-[[3-(trifluoromethoxy)phenyl]methylamino]pyrimidin-5-yl]piperazin-1-yl]ethanone Chemical compound N1N=NC=2CN(CCC=21)C(CN1CCN(CC1)C=1C=NC(=NC=1)NCC1=CC(=CC=C1)OC(F)(F)F)=O OHVLMTFVQDZYHP-UHFFFAOYSA-N 0.000 description 1
- WZFUQSJFWNHZHM-UHFFFAOYSA-N 2-[4-[2-(2,3-dihydro-1H-inden-2-ylamino)pyrimidin-5-yl]piperazin-1-yl]-1-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)ethanone Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)N1CCN(CC1)CC(=O)N1CC2=C(CC1)NN=N2 WZFUQSJFWNHZHM-UHFFFAOYSA-N 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0766—Error or fault reporting or storing
- G06F11/0772—Means for error signaling, e.g. using interrupts, exception flags, dedicated error registers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0751—Error or fault detection not based on redundancy
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0709—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0766—Error or fault reporting or storing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0766—Error or fault reporting or storing
- G06F11/0775—Content or structure details of the error report, e.g. specific table structure, specific error fields
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0793—Remedial or corrective actions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/30—Creation or generation of source code
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Software Systems (AREA)
- Computer Hardware Design (AREA)
- Debugging And Monitoring (AREA)
Description
情報システムから検出された障害メッセージに応じた対処内容と、当該対処内容を前記情報システムに対して実行するための実行条件とが対応付けられた複数の障害対処ルールのリストを記憶する記憶部と、
前記障害メッセージを取得する取得部と、
前記リスト内の前記複数の障害対処ルールのそれぞれについて、前記取得した障害メッセージから抽出された抽出情報が前記実行条件に該当するか否かを判定する判定部と、
前記該当すると判定された実行条件に対応付けられた対処内容を特定し、当該特定した対処内容を前記情報システムに対して実行させる実行制御部と、
を備え、
前記実行条件における条件情報の指定を受け付ける受付部と、
前記指定された条件情報に基づく条件式のプログラムコードを生成するコード生成部と、
前記抽出情報を前記プログラムコードに基づいて判定するための判定対象値及び前記対処内容の入力欄を含めた前記複数の障害対処ルールの入力テンプレートを生成するテンプレート生成部と、
前記入力テンプレートに対する入力値を前記入力欄に設定して前記リストとして前記記憶部に格納するリスト生成部と、
をさらに備える。
情報システムから障害メッセージを検出する検出部と、
前記検出された障害メッセージに応じた対処内容と、当該対処内容を前記情報システムに対して実行するための実行条件とが対応付けられた複数の障害対処ルールのリストを記憶する記憶部と、
前記障害メッセージを取得する取得部と、
前記リスト内の前記複数の障害対処ルールのそれぞれについて、前記取得した障害メッセージから抽出された抽出情報が前記実行条件に該当するか否かを判定する判定部と、
前記該当すると判定された実行条件に対応付けられた対処内容を特定し、当該特定した対処内容を前記情報システムに対して実行させるように指示を行う実行制御部と、
前記指示に応じて前記特定した対処内容を前記情報システムに対して実行する実行部と、
を備え、
前記実行条件における条件情報の指定を受け付ける受付部と、
前記指定された条件情報に基づく条件式のプログラムコードを生成するコード生成部と、
前記抽出情報を前記プログラムコードに基づいて判定するための判定対象値及び前記対処内容の入力欄を含めた前記複数の障害対処ルールの入力テンプレートを生成するテンプレート生成部と、
前記入力テンプレートに対する入力値を前記入力欄に設定して前記リストとして前記記憶部に格納するリスト生成部と、
をさらに備える。
情報システムから検出された障害メッセージに応じた対処内容と、当該対処内容を前記情報システムに対して実行するための実行条件とが対応付けられた複数の障害対処ルールのリストを記憶する記憶部と、
前記障害メッセージを取得する取得部と、
前記リスト内の前記複数の障害対処ルールのそれぞれについて、前記取得した障害メッセージから抽出された抽出情報が前記実行条件に該当するか否かを判定する判定部と、
前記該当すると判定された実行条件に対応付けられた対処内容を特定し、当該特定した対処内容を前記情報システムに対して実行させる実行制御部と、
を備える障害対処装置が、
前記実行条件における条件情報の指定を受け付け、
前記指定された条件情報に基づく条件式のプログラムコードを生成し、
前記抽出情報を前記プログラムコードに基づいて判定するための判定対象値及び前記対処内容の入力欄を含めた前記複数の障害対処ルールの入力テンプレートを生成し、
前記入力テンプレートに対する入力値を前記入力欄に設定して前記リストとして前記記憶部に格納する。
情報システムから検出された障害メッセージに応じた対処内容を前記情報システムに対して実行するための実行条件における条件情報の指定を受け付ける処理と、
前記指定された条件情報に基づく条件式のプログラムコードを生成する処理と、
前記障害メッセージから抽出される抽出情報を前記プログラムコードに基づいて判定するための判定対象値及び前記対処内容の入力欄を含めた複数の障害対処ルールの入力テンプレートを生成する処理と、
前記入力テンプレートに対する入力値を前記入力欄に設定して前記複数の障害対処ルールのリストとして記憶装置に格納する処理と、
前記障害メッセージを取得する処理と、
前記リスト内の前記複数の障害対処ルールのそれぞれについて、前記取得した障害メッセージから抽出された抽出情報が前記実行条件に該当するか否かを判定する処理と、
前記該当すると判定された実行条件に対応付けられた対処内容を特定し、当該特定した対処内容を前記情報システムに対して実行させる処理と、
をコンピュータに実行させる。
図1は、本実施形態1にかかる障害対処装置100の構成を示すブロック図である。障害対処装置100は、監視対象の情報システム(不図示)において障害メッセージが検出された場合に所定の対処を実行することで、情報システムの復旧や運用の継続を行うための情報処理装置又はシステムである。
本実施形態2は、上述した実施形態1の具体的な実施例である。図4は、本実施形態2にかかる障害対処システム1000を含む全体構成を示すブロック図である。障害対処システム1000は、情報システム1を監視する情報システムであり、監視ツール2と障害対処装置3と対処実行ツール4を備える。情報システム1は、監視対象の情報システムであり、1以上のコンピュータにより構成される。監視ツール2は、情報システム1の出力メッセージを監視し、所定の障害メッセージを検出した場合、検出した障害メッセージを障害対処装置3へ通知する。監視ツール2は、検出部の一例である。障害対処装置3は、上述した障害対処装置100の一例であり、監視ツール2から取得した障害メッセージ及びルールリストに基づきアクションコマンドを生成し、生成したアクションコマンドを対処実行ツール4へ出力する。障害対処装置3は、ルールエンジンと呼ぶこともできる。例えば、障害対処装置3は、ルールリストを解析してリスト内の複数のルールのそれぞれについて実行条件を解釈し、取得した障害メッセージが該当する実行条件に対応するルールのアクション(コマンド)を実行させる。対処実行ツール4は、障害対処装置3から入力されたアクションコマンドを指定された宛先に対して実行する。例えば、宛先が情報システム1の場合、対処実行ツール4は、情報システム1においてアクションコマンドを実行する。また、宛先がメールサーバ5の場合、対処実行ツール4は、アクションコマンド実行により送信メールを運用端末6へ出力する。対処実行ツール4は、実行部の一例である。尚、監視ツール2及び対処実行ツール4は、障害対処装置3と同一又は異なるコンピュータ上で実行されるコンピュータプログラムにより実現される。
メモリ33は、RAM(Random Access Memory)等の揮発性記憶装置であり、制御部32の動作時に一時的に情報を保持するための記憶領域である。通信部34は、障害対処装置3の外部との入出力を行うインタフェースである。例えば、通信部34は、運用端末6から処理要求等を受け付け、受け付けた処理要求を制御部32へ出力する。また、通信部34は、制御部32からの指示に応じて、出力を行う。または、通信部34は、監視ツール2から障害メッセージを受け付け、受け付けた障害メッセージを制御部32へ出力する。また、通信部34は、制御部32からアクションコマンドを受け付け、対処実行ツール4へ出力する。
本実施形態3は、上述した実施形態2の改良例である。すなわち、ルールリスト生成部321は、特定の障害対処ルールについての実行抑止条件の入力を受け付けた場合、当該特定の障害対処ルールの実行条件に当該実行抑止条件をさらに対応付けてルールリストを更新する。そして、判定部323は、該当すると判定された実行条件に実行抑止条件が対応付けられている場合、当該実行抑止条件を満たすか否かを判定する。実行指示部325は、実行抑止条件を満たす場合、特定した対処内容の実行を抑止する。逆に言うと、実行指示部325は、実行条件を満たし、かつ、実行抑止条件を満たさない場合に、特定した対処内容の実行を指示する。例えば、実行条件を満たした場合であっても、障害の特性や対処後の情報システムの状態によっては、対処を抑止するなど、対処の実行を柔軟に制御できる。
尚、上述の実施形態では、ハードウェアの構成として説明したが、これに限定されるものではない。本開示は、任意の処理を、CPUにコンピュータプログラムを実行させることにより実現することも可能である。
(付記A1)
情報システムから検出された障害メッセージに応じた対処内容と、当該対処内容を前記情報システムに対して実行するための実行条件とが対応付けられた複数の障害対処ルールのリストを記憶する記憶部と、
前記障害メッセージを取得する取得部と、
前記リスト内の前記複数の障害対処ルールのそれぞれについて、前記取得した障害メッセージから抽出された抽出情報が前記実行条件に該当するか否かを判定する判定部と、
前記該当すると判定された実行条件に対応付けられた対処内容を特定し、当該特定した対処内容を前記情報システムに対して実行させる実行制御部と、
を備え、
前記実行条件における条件情報の指定を受け付ける受付部と、
前記指定された条件情報に基づく条件式のプログラムコードを生成するコード生成部と、
前記抽出情報を前記プログラムコードに基づいて判定するための判定対象値及び前記対処内容の入力欄を含めた前記複数の障害対処ルールの入力テンプレートを生成するテンプレート生成部と、
前記入力テンプレートに対する入力値を前記入力欄に設定して前記リストとして前記記憶部に格納するリスト生成部と、
をさらに備える障害対処装置。
(付記A2)
前記リスト生成部は、
特定の障害対処ルールについての実行抑止条件の入力を受け付けた場合、当該特定の障害対処ルールの前記実行条件に当該実行抑止条件をさらに対応付けて前記リストを更新し、
前記判定部は、
前記該当すると判定された実行条件に前記実行抑止条件が対応付けられている場合、当該実行抑止条件を満たすか否かを判定し、
前記実行制御部は、
前記実行抑止条件を満たす場合、前記特定した対処内容の実行を抑止する
付記A1に記載の障害対処装置。
(付記A3)
前記実行抑止条件は、対応付けられている前記対処内容を単位時間あたりに実行させる上限回数を含み、
前記判定部は、
前記対処内容の単位時間あたりの実行回数が前記上限回数を超えていると判定した場合、前記実行抑止条件を満たすと判定する
付記A2に記載の障害対処装置。
(付記A4)
前記実行抑止条件は、対応付けられている前記対処内容の実行を抑止する間隔を含み、
前記判定部は、
前記対処内容が直前に実行された後、前記間隔が経過していないと判定した場合、前記実行抑止条件を満たすと判定する
付記A2又はA3に記載の障害対処装置。
(付記A5)
前記実行抑止条件は、対応付けられている前記対処内容の実行を抑止する時間帯を含み、
前記判定部は、
現在時刻が前記時間帯に含まれていると判定した場合、前記実行抑止条件を満たすと判定する
付記A2乃至A4のいずれか1項に記載の障害対処装置。
(付記A6)
前記記憶部は、サービス種別ごとに前記リストを記憶し、
前記判定部は、
前記抽出情報からサービス種別を判定し、
前記判定されたサービス種別に対応する前記リストを特定し、
前記特定されたリスト内の前記複数の障害対処ルールのそれぞれについて、前記取得した障害メッセージから抽出された抽出情報が前記実行条件に該当するか否かを判定する
付記A1乃至A5のいずれか1項に記載の障害対処装置。
(付記B1)
情報システムから障害メッセージを検出する検出部と、
前記検出された障害メッセージに応じた対処内容と、当該対処内容を前記情報システムに対して実行するための実行条件とが対応付けられた複数の障害対処ルールのリストを記憶する記憶部と、
前記障害メッセージを取得する取得部と、
前記リスト内の前記複数の障害対処ルールのそれぞれについて、前記取得した障害メッセージから抽出された抽出情報が前記実行条件に該当するか否かを判定する判定部と、
前記該当すると判定された実行条件に対応付けられた対処内容を特定し、当該特定した対処内容を前記情報システムに対して実行させるように指示を行う実行制御部と、
前記指示に応じて前記特定した対処内容を前記情報システムに対して実行する実行部と、
を備え、
前記実行条件における条件情報の指定を受け付ける受付部と、
前記指定された条件情報に基づく条件式のプログラムコードを生成するコード生成部と、
前記抽出情報を前記プログラムコードに基づいて判定するための判定対象値及び前記対処内容の入力欄を含めた前記複数の障害対処ルールの入力テンプレートを生成するテンプレート生成部と、
前記入力テンプレートに対する入力値を前記入力欄に設定して前記リストとして前記記憶部に格納するリスト生成部と、
をさらに備える障害対処システム。
(付記B2)
前記リスト生成部は、
特定の障害対処ルールについての実行抑止条件の入力を受け付けた場合、当該特定の障害対処ルールの前記実行条件に当該実行抑止条件をさらに対応付けて前記リストを更新し、
前記判定部は、
前記該当すると判定された実行条件に前記実行抑止条件が対応付けられている場合、当該実行抑止条件を満たすか否かを判定し、
前記実行制御部は、
前記実行抑止条件を満たす場合、前記特定した対処内容の実行を抑止する
付記B1に記載の障害対処システム。
(付記C1)
情報システムから検出された障害メッセージに応じた対処内容と、当該対処内容を前記情報システムに対して実行するための実行条件とが対応付けられた複数の障害対処ルールのリストを記憶する記憶部と、
前記障害メッセージを取得する取得部と、
前記リスト内の前記複数の障害対処ルールのそれぞれについて、前記取得した障害メッセージから抽出された抽出情報が前記実行条件に該当するか否かを判定する判定部と、
前記該当すると判定された実行条件に対応付けられた対処内容を特定し、当該特定した対処内容を前記情報システムに対して実行させる実行制御部と、
を備える障害対処装置が、
前記実行条件における条件情報の指定を受け付け、
前記指定された条件情報に基づく条件式のプログラムコードを生成し、
前記抽出情報を前記プログラムコードに基づいて判定するための判定対象値及び前記対処内容の入力欄を含めた前記複数の障害対処ルールの入力テンプレートを生成し、
前記入力テンプレートに対する入力値を前記入力欄に設定して前記リストとして前記記憶部に格納する、
ルールリスト生成方法。
(付記D1)
情報システムから検出された障害メッセージに応じた対処内容を前記情報システムに対して実行するための実行条件における条件情報の指定を受け付ける処理と、
前記指定された条件情報に基づく条件式のプログラムコードを生成する処理と、
前記障害メッセージから抽出される抽出情報を前記プログラムコードに基づいて判定するための判定対象値及び前記対処内容の入力欄を含めた複数の障害対処ルールの入力テンプレートを生成する処理と、
前記入力テンプレートに対する入力値を前記入力欄に設定して前記複数の障害対処ルールのリストとして記憶装置に格納する処理と、
前記障害メッセージを取得する処理と、
前記リスト内の前記複数の障害対処ルールのそれぞれについて、前記取得した障害メッセージから抽出された抽出情報が前記実行条件に該当するか否かを判定する処理と、
前記該当すると判定された実行条件に対応付けられた対処内容を特定し、当該特定した対処内容を前記情報システムに対して実行させる処理と、
をコンピュータに実行させるプログラム。
11 記憶部
110 リスト
111 障害対処ルール
1111 対処内容
1112 実行条件
11m 障害対処ルール
12 取得部
13 判定部
14 実行制御部
15 受付部
16 コード生成部
17 テンプレート生成部
18 リスト生成部
1000 障害対処システム
1 情報システム
2 監視ツール
3 障害対処装置
31 記憶部
310 プログラム
311 ルールリスト
3110 サービス種別
40 ヘッダ部
401 ヘッダコード部
402 条件コード部
403 条件ヘッダ部
404 アクションコード部
405 アクションヘッダ部
41 ルール
411 条件部
412 アクション部
4m ルール
31n ルールリスト
32 制御部
321 ルールリスト生成部
322 メッセージ解析部
323 判定部
324 アクションコマンド生成部
325 実行指示部
33 メモリ
34 通信部
4 対処実行ツール
5 メールサーバ
6 運用端末
50 条件部定義画面
51 移動部
52 条件名
521 条件名入力欄
53 条件式
531 条件式選択欄
54 削除
55 条件式追加ボタン
56 閉じるボタン
57 追加ボタン
Claims (10)
- 情報システムから検出された障害メッセージに応じた対処内容と、当該対処内容を前記情報システムに対して実行するための実行条件とが対応付けられた複数の障害対処ルールのリストを記憶する記憶手段と、
前記障害メッセージを取得する取得手段と、
前記リスト内の前記複数の障害対処ルールのそれぞれについて、前記取得した障害メッセージから抽出された抽出情報が前記実行条件に該当するか否かを判定する判定手段と、
前記該当すると判定された実行条件に対応付けられた対処内容を特定し、当該特定した対処内容を前記情報システムに対して実行させる実行制御手段と、
を備え、
前記実行条件における条件情報の指定を受け付ける受付手段と、
前記指定された条件情報に基づく条件式のプログラムコードを生成するコード生成手段と、
前記抽出情報を前記プログラムコードに基づいて判定するための判定対象値及び前記対処内容の入力欄を含めた前記複数の障害対処ルールの入力テンプレートを生成するテンプレート生成手段と、
前記入力テンプレートに対する入力値を前記入力欄に設定して前記リストとして前記記憶手段に格納するリスト生成手段と、
をさらに備える障害対処装置。 - 前記リスト生成手段は、
特定の障害対処ルールについての実行抑止条件の入力を受け付けた場合、当該特定の障害対処ルールの前記実行条件に当該実行抑止条件をさらに対応付けて前記リストを更新し、
前記判定手段は、
前記該当すると判定された実行条件に前記実行抑止条件が対応付けられている場合、当該実行抑止条件を満たすか否かを判定し、
前記実行制御手段は、
前記実行抑止条件を満たす場合、前記特定した対処内容の実行を抑止する
請求項1に記載の障害対処装置。 - 前記実行抑止条件は、対応付けられている前記対処内容を単位時間あたりに実行させる上限回数を含み、
前記判定手段は、
前記対処内容の単位時間あたりの実行回数が前記上限回数を超えていると判定した場合、前記実行抑止条件を満たすと判定する
請求項2に記載の障害対処装置。 - 前記実行抑止条件は、対応付けられている前記対処内容の実行を抑止する間隔を含み、
前記判定手段は、
前記対処内容が直前に実行された後、前記間隔が経過していないと判定した場合、前記実行抑止条件を満たすと判定する
請求項2又は3に記載の障害対処装置。 - 前記実行抑止条件は、対応付けられている前記対処内容の実行を抑止する時間帯を含み、
前記判定手段は、
現在時刻が前記時間帯に含まれていると判定した場合、前記実行抑止条件を満たすと判定する
請求項2乃至4のいずれか1項に記載の障害対処装置。 - 前記記憶手段は、サービス種別ごとに前記リストを記憶し、
前記判定手段は、
前記抽出情報からサービス種別を判定し、
前記判定されたサービス種別に対応する前記リストを特定し、
前記特定されたリスト内の前記複数の障害対処ルールのそれぞれについて、前記取得した障害メッセージから抽出された抽出情報が前記実行条件に該当するか否かを判定する
請求項1乃至5のいずれか1項に記載の障害対処装置。 - 情報システムから障害メッセージを検出する検出手段と、
前記検出された障害メッセージに応じた対処内容と、当該対処内容を前記情報システムに対して実行するための実行条件とが対応付けられた複数の障害対処ルールのリストを記憶する記憶手段と、
前記障害メッセージを取得する取得手段と、
前記リスト内の前記複数の障害対処ルールのそれぞれについて、前記取得した障害メッセージから抽出された抽出情報が前記実行条件に該当するか否かを判定する判定手段と、
前記該当すると判定された実行条件に対応付けられた対処内容を特定し、当該特定した対処内容を前記情報システムに対して実行させるように指示を行う実行制御手段と、
前記指示に応じて前記特定した対処内容を前記情報システムに対して実行する実行手段と、
を備え、
前記実行条件における条件情報の指定を受け付ける受付手段と、
前記指定された条件情報に基づく条件式のプログラムコードを生成するコード生成手段と、
前記抽出情報を前記プログラムコードに基づいて判定するための判定対象値及び前記対処内容の入力欄を含めた前記複数の障害対処ルールの入力テンプレートを生成するテンプレート生成手段と、
前記入力テンプレートに対する入力値を前記入力欄に設定して前記リストとして前記記憶手段に格納するリスト生成手段と、
をさらに備える障害対処システム。 - 前記リスト生成手段は、
特定の障害対処ルールについての実行抑止条件の入力を受け付けた場合、当該特定の障害対処ルールの前記実行条件に当該実行抑止条件をさらに対応付けて前記リストを更新し、
前記判定手段は、
前記該当すると判定された実行条件に前記実行抑止条件が対応付けられている場合、当該実行抑止条件を満たすか否かを判定し、
前記実行制御手段は、
前記実行抑止条件を満たす場合、前記特定した対処内容の実行を抑止する
請求項7に記載の障害対処システム。 - 情報システムから検出された障害メッセージに応じた対処内容と、当該対処内容を前記情報システムに対して実行するための実行条件とが対応付けられた複数の障害対処ルールのリストを記憶する記憶手段と、
前記障害メッセージを取得する取得手段と、
前記リスト内の前記複数の障害対処ルールのそれぞれについて、前記取得した障害メッセージから抽出された抽出情報が前記実行条件に該当するか否かを判定する判定手段と、
前記該当すると判定された実行条件に対応付けられた対処内容を特定し、当該特定した対処内容を前記情報システムに対して実行させる実行制御手段と、
を備える障害対処装置が、
前記実行条件における条件情報の指定を受け付け、
前記指定された条件情報に基づく条件式のプログラムコードを生成し、
前記抽出情報を前記プログラムコードに基づいて判定するための判定対象値及び前記対処内容の入力欄を含めた前記複数の障害対処ルールの入力テンプレートを生成し、
前記入力テンプレートに対する入力値を前記入力欄に設定して前記リストとして前記記憶手段に格納する、
ルールリスト生成方法。 - 情報システムから検出された障害メッセージに応じた対処内容を前記情報システムに対して実行するための実行条件における条件情報の指定を受け付ける処理と、
前記指定された条件情報に基づく条件式のプログラムコードを生成する処理と、
前記障害メッセージから抽出される抽出情報を前記プログラムコードに基づいて判定するための判定対象値及び前記対処内容の入力欄を含めた複数の障害対処ルールの入力テンプレートを生成する処理と、
前記入力テンプレートに対する入力値を前記入力欄に設定して前記複数の障害対処ルールのリストとして記憶装置に格納する処理と、
前記障害メッセージを取得する処理と、
前記リスト内の前記複数の障害対処ルールのそれぞれについて、前記取得した障害メッセージから抽出された抽出情報が前記実行条件に該当するか否かを判定する処理と、
前記該当すると判定された実行条件に対応付けられた対処内容を特定し、当該特定した対処内容を前記情報システムに対して実行させる処理と、
をコンピュータに実行させるプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020032721 | 2020-02-28 | ||
JP2020032721 | 2020-02-28 | ||
PCT/JP2021/007116 WO2021172435A1 (ja) | 2020-02-28 | 2021-02-25 | 障害対処装置及びシステム、ルールリスト生成方法並びに非一時的なコンピュータ可読媒体 |
Publications (3)
Publication Number | Publication Date |
---|---|
JPWO2021172435A1 JPWO2021172435A1 (ja) | 2021-09-02 |
JPWO2021172435A5 JPWO2021172435A5 (ja) | 2022-10-06 |
JP7380830B2 true JP7380830B2 (ja) | 2023-11-15 |
Family
ID=77491581
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022503695A Active JP7380830B2 (ja) | 2020-02-28 | 2021-02-25 | 障害対処装置及びシステム、ルールリスト生成方法並びにプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US11907053B2 (ja) |
JP (1) | JP7380830B2 (ja) |
WO (1) | WO2021172435A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7369219B2 (ja) * | 2022-02-04 | 2023-10-25 | 株式会社日立製作所 | 運用管理装置及び方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005038223A (ja) | 2003-07-16 | 2005-02-10 | Nec Corp | 障害復旧装置および障害復旧方法ならびにプログラム |
JP2005346331A (ja) | 2004-06-02 | 2005-12-15 | Nec Corp | 障害復旧装置および障害復旧方法、マネージャ装置並びにプログラム |
WO2015040688A1 (ja) | 2013-09-18 | 2015-03-26 | 株式会社日立製作所 | 計算機システムを管理する管理システム及びその管理方法 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003114811A (ja) | 2001-10-05 | 2003-04-18 | Nec Corp | 自動障害復旧方法及びシステム並びに装置とプログラム |
US20050216241A1 (en) * | 2004-03-29 | 2005-09-29 | Gadi Entin | Method and apparatus for gathering statistical measures |
US8746548B2 (en) * | 2011-09-15 | 2014-06-10 | Dell Products L.P. | Dynamic multidimensional barcodes for information handling system service information |
US9292373B2 (en) * | 2013-03-15 | 2016-03-22 | International Business Machines Corporation | Query rewrites for data-intensive applications in presence of run-time errors |
JP6421600B2 (ja) * | 2015-01-05 | 2018-11-14 | 富士通株式会社 | 障害監視装置、障害監視プログラム、障害監視方法 |
US10839352B1 (en) * | 2018-02-05 | 2020-11-17 | CollectiveHealth, Inc. | Intelligent file-level validation |
WO2020061587A1 (en) * | 2018-09-22 | 2020-03-26 | Manhattan Engineering Incorporated | Error recovery |
US11243859B2 (en) * | 2019-10-09 | 2022-02-08 | Microsoft Technology Licensing, Llc | Baseboard management controller that initiates a diagnostic operation to collect host information |
JP7369219B2 (ja) * | 2022-02-04 | 2023-10-25 | 株式会社日立製作所 | 運用管理装置及び方法 |
-
2021
- 2021-02-25 JP JP2022503695A patent/JP7380830B2/ja active Active
- 2021-02-25 US US17/799,988 patent/US11907053B2/en active Active
- 2021-02-25 WO PCT/JP2021/007116 patent/WO2021172435A1/ja active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005038223A (ja) | 2003-07-16 | 2005-02-10 | Nec Corp | 障害復旧装置および障害復旧方法ならびにプログラム |
JP2005346331A (ja) | 2004-06-02 | 2005-12-15 | Nec Corp | 障害復旧装置および障害復旧方法、マネージャ装置並びにプログラム |
WO2015040688A1 (ja) | 2013-09-18 | 2015-03-26 | 株式会社日立製作所 | 計算機システムを管理する管理システム及びその管理方法 |
Non-Patent Citations (1)
Title |
---|
大野 允裕,自律運用管理に向けた障害対処ポリシの運用制御/流用手法,電子情報通信学会技術研究報告,日本,社団法人電子情報通信学会,2005年07月29日,Vol.105, No.227,pp. 13-18 |
Also Published As
Publication number | Publication date |
---|---|
US20230070080A1 (en) | 2023-03-09 |
WO2021172435A1 (ja) | 2021-09-02 |
JPWO2021172435A1 (ja) | 2021-09-02 |
US11907053B2 (en) | 2024-02-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104021043B (zh) | 批量应用程序的中断重入方法及*** | |
US9459989B2 (en) | Method and apparatus for reverse debugging source code using causal analysis | |
US20180322004A1 (en) | Systems and methods for detecting anomalies in execution of computer programs | |
US20130024466A1 (en) | System event logging system | |
JP7380830B2 (ja) | 障害対処装置及びシステム、ルールリスト生成方法並びにプログラム | |
US20210248231A1 (en) | Attack tree generation device, attack tree generation method, and computer readable medium | |
JP6244992B2 (ja) | 構成情報管理プログラム、構成情報管理方法、及び構成情報管理装置 | |
CN108369503A (zh) | 对外部场可更换单元(fru)过程的自动***响应 | |
US7979743B2 (en) | Determining correctness of job plans in a stream processing application | |
JP2019049802A (ja) | 障害解析支援装置、インシデント管理システム、障害解析支援方法及びプログラム | |
US20180121044A1 (en) | Run-time event handler generation in json environments | |
CN103679024A (zh) | 病毒的处理方法及设备 | |
JP7263206B2 (ja) | 情報処理システム、情報処理システムの制御方法、情報処理装置、及びプログラム | |
JP5453871B2 (ja) | イベント判別装置、イベント判別プログラム、イベント判別方法 | |
JP2009116618A (ja) | 情報処理装置 | |
JP6157375B2 (ja) | 操作手順フロー更新装置、方法及びプログラム | |
JP7147495B2 (ja) | 復旧支援装置、復旧支援方法及びプログラム | |
CN109445877B (zh) | 一种检测游戏服务器多线程使用同一虚拟机的方法 | |
JP5836316B2 (ja) | 障害監視システム、障害監視方法、及び障害監視プログラム | |
WO2021053801A1 (ja) | 情報分析装置、方法およびプログラム | |
WO2024135322A1 (ja) | 障害対処装置、システム、方法、及び、プログラム | |
WO2023281595A1 (ja) | 障害推定装置、方法およびプログラム | |
US20150135199A1 (en) | Medium, method, and apparatus | |
JP7259436B2 (ja) | 情報処理装置、情報処理方法、情報処理プログラム、及び情報処理システム | |
US20220318374A1 (en) | Diagnosis apparatus, diagnosis method, and computer-readable recording medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220812 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220812 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231003 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231016 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7380830 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |