JP7494656B2 - Information processing device and fault detection method - Google Patents

Information processing device and fault detection method Download PDF

Info

Publication number
JP7494656B2
JP7494656B2 JP2020142534A JP2020142534A JP7494656B2 JP 7494656 B2 JP7494656 B2 JP 7494656B2 JP 2020142534 A JP2020142534 A JP 2020142534A JP 2020142534 A JP2020142534 A JP 2020142534A JP 7494656 B2 JP7494656 B2 JP 7494656B2
Authority
JP
Japan
Prior art keywords
information
investigation
fault
processing device
configuration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020142534A
Other languages
Japanese (ja)
Other versions
JP2022038178A (en
Inventor
等 中山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2020142534A priority Critical patent/JP7494656B2/en
Publication of JP2022038178A publication Critical patent/JP2022038178A/en
Application granted granted Critical
Publication of JP7494656B2 publication Critical patent/JP7494656B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Description

本発明は、障害検出技術に関する。 The present invention relates to fault detection technology.

情報処理装置(コンピュータ)における障害発生時のトラブルシューティングを実施する場合、作業者は、システムイベントログ(System Event Log,SEL)に表示された障害内容及び障害発生箇所から関連する被疑箇所を推定し、障害原因を調査する。被疑箇所は、ハードウェア又はソフトウェアである。ソフトウェアには、ファームウェアも含まれる。 When troubleshooting a fault in an information processing device (computer), an operator infers a suspected part from the fault content and fault location displayed in the system event log (SEL) and investigates the cause of the fault. The suspected part can be hardware or software. Software also includes firmware.

情報処理装置のトラブルシューティングに関連して、IT(Information Technology)システムのトラブルの症状を入力すると症状に対する対処を出力するトラブル対処システムが知られている(例えば、特許文献1を参照)。 In relation to troubleshooting of information processing devices, a troubleshooting system is known that outputs a solution to a problem in an IT (Information Technology) system when the problem symptom is input (see, for example, Patent Document 1).

このトラブル対処システムは、ITシステムの構成情報を集めた第1データベース、トラブルの症状と症状を解決する対処を含むトラブル事例を集めた第2データベース、第1記憶部、構成情報類似度算出部、及び出力部を含む。 This trouble-shooting system includes a first database that collects configuration information of IT systems, a second database that collects trouble cases including trouble symptoms and measures to resolve the symptoms, a first storage unit, a configuration information similarity calculation unit, and an output unit.

第1記憶部は、第1データベースと第2データベースとから構成情報をキーにトラブル事例の構成情報を導出して格納する。構成情報類似度算出部は、入力されたトラブルを発生したITシステムの構成情報とトラブル事例の構成情報との間の類似度を算出する。出力部は、トラブルを発生したITシステムに対する対処を類似度と共に提示する。 The first storage unit derives configuration information of the trouble case from the first database and the second database using configuration information as a key, and stores the information. The configuration information similarity calculation unit calculates the similarity between the input configuration information of the IT system in which the trouble occurred and the configuration information of the trouble case. The output unit presents measures to be taken for the IT system in which the trouble occurred, together with the similarity.

計算機システムの構成が変化を示すイベントが検出された場合、必要なイベントについてのみ障害解析に用いるための情報を生成する管理方法も知られている(例えば、特許文献2を参照)。 There is also a known management method that, when an event indicating a change in the configuration of a computer system is detected, generates information to be used in fault analysis only for the necessary events (see, for example, Patent Document 2).

国際公開第2009/122525号パンフレットInternational Publication No. 2009/122525 国際公開第2012/131868号パンフレットInternational Publication No. 2012/131868

情報処理装置において、SELに表示されない障害が発生した場合、被疑箇所を推定するための情報が存在しないため、障害原因の調査に長い時間が費やされることがある。 When a fault occurs in an information processing device that is not displayed in the SEL, it can take a long time to investigate the cause of the fault because there is no information to estimate the suspected location.

なお、かかる問題は、SELに表示されない障害が発生した場合に限らず、様々な障害が発生した場合に生ずるものである。 This problem does not only occur when a fault not displayed on SEL occurs, but can also occur when a variety of faults occur.

1つの側面において、本発明は、情報処理装置において発生した障害の調査を支援することを目的とする。 In one aspect, the present invention aims to assist in investigating a fault that occurs in an information processing device.

1つの案では、情報処理装置は、記憶部、受付部、及び特定部を含む。記憶部は、障害調査情報及び構成変更情報を記憶する。 In one proposal, the information processing device includes a storage unit, a reception unit, and an identification unit. The storage unit stores fault investigation information and configuration change information.

障害調査情報は、情報処理装置における障害を示す障害情報と、情報処理装置に含まれる1つ又は複数の調査対象とを対応付けた情報である。構成変更情報は、情報処理装置において行われた構成変更に対応する調査対象を示す情報である。 The fault investigation information is information that associates fault information indicating a fault in an information processing device with one or more investigation targets included in the information processing device. The configuration change information is information that indicates an investigation target that corresponds to a configuration change made in the information processing device.

受付部は、情報処理装置において発生した障害を示す入力情報を受け付ける。特定部は、障害調査情報及び構成変更情報に基づいて、入力情報が示す障害に対応する1つ又は複数の調査対象のうち、構成変更に対応する調査対象を特定し、特定された構成変更に対応する調査対象を含む調査支援情報を出力する。 The reception unit receives input information indicating a fault that has occurred in the information processing device. The identification unit, based on the fault investigation information and the configuration change information, identifies an investigation target that corresponds to a configuration change from among one or more investigation targets corresponding to the fault indicated by the input information, and outputs investigation support information including the investigation target that corresponds to the identified configuration change.

1つの側面によれば、情報処理装置において発生した障害の調査を支援することができる。 According to one aspect, it is possible to assist in investigating a fault that occurs in an information processing device.

情報処理装置の機能的構成図である。FIG. 2 is a functional configuration diagram of an information processing device. 障害検出処理のフローチャートである。13 is a flowchart of a failure detection process. サーバのハードウェア構成図である。FIG. 2 is a diagram illustrating a hardware configuration of a server. BMCの機能的構成図である。FIG. 2 is a functional configuration diagram of a BMC. 構成変更情報を示す図である。FIG. 13 is a diagram showing configuration change information. 障害調査情報を示す図である。FIG. 11 is a diagram showing fault investigation information. 障害検出処理を示す図である。FIG. 13 illustrates a fault detection process. SELのメッセージを示す図である。FIG. 13 is a diagram showing a SEL message. SELに基づいて対象項目を特定する処理を示す図である。FIG. 13 is a diagram illustrating a process of identifying a target item based on SEL. 対象項目を含む調査支援情報を示す図である。FIG. 13 is a diagram showing survey support information including target items. 入力情報に基づいて調査対象を特定する処理を示す図である。FIG. 13 is a diagram illustrating a process of identifying a survey target based on input information. 調査対象を含む調査支援情報を示す図である。FIG. 13 is a diagram showing survey support information including a survey target. 構成変更情報を生成する生成処理のフローチャートである。13 is a flowchart of a generation process for generating configuration change information. 調査対象特定処理のフローチャート(その1)である。13 is a flowchart (part 1) of a survey target specification process. 調査対象特定処理のフローチャート(その2)である。13 is a flowchart (part 2) of the survey target specification process. BMCのハードウェア構成図である。FIG. 2 is a hardware configuration diagram of a BMC.

以下、図面を参照しながら、実施形態を詳細に説明する。 The following describes the embodiment in detail with reference to the drawings.

情報処理装置において障害が発生し、SELに基づいて障害原因が特定された場合、作業者は、障害原因に対する対処を行い、対処方法をトラブル事例として蓄積する。新たな障害が発生した場合、作業者は、蓄積されたトラブル事例の中から、SELに表示された障害と類似するトラブル事例を検索することで、障害原因を推定して対処方法を決定することができる。 When a fault occurs in an information processing device and the cause of the fault is identified based on the SEL, the worker takes action to address the cause of the fault and accumulates the countermeasures as a trouble case. When a new fault occurs, the worker can infer the cause of the fault and determine the countermeasures by searching the accumulated trouble cases for trouble cases similar to the fault displayed on the SEL.

しかしながら、SELに表示されない障害については、障害原因を推定することが難しい。SELに表示されない障害としては、AC(Alternating Current)電源が入らない、ログインできない、ブートできない、OS(Operating System)パニック、FAN高速回転等の現象が挙げられる。 However, it is difficult to deduce the cause of a fault that is not displayed on the SEL. Examples of faults that are not displayed on the SEL include AC (Alternating Current) power not turning on, inability to log in, inability to boot, OS (Operating System) panic, and high-speed fan rotation.

SELに表示されない障害が発生した場合、被疑箇所を推定するための情報が存在しないため、どこから調査を開始すればよいかが分からないことがある。この場合、障害原因の調査の方針を決めて再現試験を行い、被疑箇所を推定する作業に、長い時間が費やされる。例えば、1箇所の障害の調査に1週間以上かかることもある。 When a fault occurs that is not displayed in SEL, there is no information to estimate the suspected part, so it may be difficult to know where to start the investigation. In this case, it takes a long time to decide on a method of investigating the cause of the fault, perform reproduction tests, and estimate the suspected part. For example, it may take more than a week to investigate a single fault.

図1は、実施形態の情報処理装置の機能的構成例を示している。図1の情報処理装置101は、記憶部111、受付部112、及び特定部113を含む。記憶部111は、障害調査情報121及び構成変更情報122を記憶する。 FIG. 1 shows an example of the functional configuration of an information processing device according to an embodiment. The information processing device 101 in FIG. 1 includes a memory unit 111, a reception unit 112, and an identification unit 113. The memory unit 111 stores fault investigation information 121 and configuration change information 122.

障害調査情報121は、情報処理装置101における障害を示す障害情報と、情報処理装置101に含まれる1つ又は複数の調査対象とを対応付けた情報である。構成変更情報122は、情報処理装置101において行われた構成変更に対応する調査対象を示す情報である。受付部112及び特定部113は、障害調査情報121及び構成変更情報122を用いて、障害検出処理を行う。 The fault investigation information 121 is information that associates fault information indicating a fault in the information processing device 101 with one or more investigation targets included in the information processing device 101. The configuration change information 122 is information that indicates an investigation target corresponding to a configuration change made in the information processing device 101. The reception unit 112 and the identification unit 113 perform fault detection processing using the fault investigation information 121 and the configuration change information 122.

図2は、図1の情報処理装置101が行う障害検出処理の例を示すフローチャートである。まず、受付部112は、情報処理装置101において発生した障害を示す入力情報を受け付ける(ステップ201)。 Figure 2 is a flowchart showing an example of a fault detection process performed by the information processing device 101 of Figure 1. First, the reception unit 112 receives input information indicating a fault that has occurred in the information processing device 101 (step 201).

次に、特定部113は、記憶部111から障害調査情報121を取得し(ステップ202)、記憶部111から構成変更情報122を取得する(ステップ203)。次に、特定部113は、障害調査情報121及び構成変更情報122に基づいて、入力情報が示す障害に対応する1つ又は複数の調査対象のうち、構成変更に対応する調査対象を特定する(ステップ204)。そして、特定部113は、特定された構成変更に対応する調査対象を含む調査支援情報を出力する(ステップ205)。 Next, the identification unit 113 acquires the fault investigation information 121 from the storage unit 111 (step 202), and acquires the configuration change information 122 from the storage unit 111 (step 203). Next, based on the fault investigation information 121 and the configuration change information 122, the identification unit 113 identifies an investigation target that corresponds to a configuration change from among one or more investigation targets that correspond to the fault indicated by the input information (step 204). Then, the identification unit 113 outputs investigation support information that includes the investigation target that corresponds to the identified configuration change (step 205).

図1の情報処理装置101によれば、情報処理装置101において発生した障害の調査を支援することができる。 The information processing device 101 in FIG. 1 can assist in investigating a fault that occurs in the information processing device 101.

図3は、図1の情報処理装置101に対応するサーバのハードウェア構成例を示している。図3のサーバ301は、SB(System Board)311、通信部312、及びDU(Disk Unit)313を含む。通信部312は、図1の受付部112に対応する。 FIG. 3 shows an example of the hardware configuration of a server corresponding to the information processing device 101 in FIG. 1. The server 301 in FIG. 3 includes a system board (SB) 311, a communication unit 312, and a disk unit (DU) 313. The communication unit 312 corresponds to the reception unit 112 in FIG. 1.

サーバ301は、不図示のMMB(Management Board)、IOU(Input/Output Unit)、AC電源、FAN、PCI(Peripheral Component Interconnect)カード等をさらに含む。PCIカードは、PCI Expressバス用のFC(Fibre Channel)カード又はLAN(Local Area Network)カードであってもよい。 The server 301 further includes an MMB (Management Board), an IOU (Input/Output Unit), an AC power supply, a FAN, a PCI (Peripheral Component Interconnect) card, etc. (not shown). The PCI card may be a FC (Fibre Channel) card for a PCI Express bus or a LAN (Local Area Network) card.

SB311は、BMC(Baseboard Management Controller)321、CPU(Central Processing Unit)322-1、CPU322-2、メモリ323-1、及びメモリ323-2を含む。CPU322-1及びCPU322-2は、プロセッサと呼ばれることもある。 SB311 includes a BMC (Baseboard Management Controller) 321, a CPU (Central Processing Unit) 322-1, a CPU 322-2, a memory 323-1, and a memory 323-2. CPU 322-1 and CPU 322-2 are sometimes referred to as processors.

CPU322-1は、メモリ323-1を利用してプログラムを実行することで情報処理を行う。CPU322-2は、メモリ323-2を利用してプログラムを実行することで情報処理を行う。DU313は、情報処理に用いられるプログラム及びデータを記憶する。 CPU 322-1 performs information processing by executing programs using memory 323-1. CPU 322-2 performs information processing by executing programs using memory 323-2. DU 313 stores programs and data used in information processing.

メモリ323-1及びメモリ323-2は、DIMM(Dual Inline Memory Module)であってもよく、DU313は、RAID(Redundant Arrays of Inexpensive Disks)であってもよい。RAIDは、複数のHDD(Hard Disk Drive)を含む。 Memory 323-1 and memory 323-2 may be dual inline memory modules (DIMMs), and DU 313 may be redundant arrays of inexpensive disks (RAIDs). RAIDs include multiple hard disk drives (HDDs).

BIOS(Basic Input/Output System)又はUEFI(Unified Extensible Firmware Interface)は、CPU322-1又はCPU322-2によって実行される。OSもCPU322-1又はCPU322-2によって実行される。 The BIOS (Basic Input/Output System) or UEFI (Unified Extensible Firmware Interface) is executed by CPU322-1 or CPU322-2. The OS is also executed by CPU322-1 or CPU322-2.

BMC321は、サーバ301に含まれるハードウェアの監視及び管理を行う。BMC321は、IRMC(Integrated Remote Management Controller)であってもよい。作業者は、端末装置302を用いて、サーバ301において発生した障害の調査を行う。端末装置302は、コンソールPC(Personal Computer)であってもよい。通信部312は、通信ネットワークを介して端末装置302と通信する。サーバ301は、複数のSB311を含んでいてもよい。 The BMC 321 monitors and manages the hardware included in the server 301. The BMC 321 may be an IRMC (Integrated Remote Management Controller). An operator uses a terminal device 302 to investigate a fault that has occurred in the server 301. The terminal device 302 may be a console PC (Personal Computer). The communication unit 312 communicates with the terminal device 302 via a communication network. The server 301 may include multiple SBs 311.

図4は、図3のBMC321の機能的構成例を示している。図4のBMC321は、記憶部411、抽出部412、及び特定部413を含む。記憶部411及び特定部413は、図1の記憶部111及び特定部113にそれぞれ対応する。記憶部411は、ハードウェア構成情報421、ソフトウェア構成情報422、構成変更情報423、及び障害調査情報424を記憶する。 Figure 4 shows an example of the functional configuration of BMC 321 in Figure 3. BMC 321 in Figure 4 includes a memory unit 411, an extraction unit 412, and an identification unit 413. The memory unit 411 and the identification unit 413 correspond to the memory unit 111 and the identification unit 113, respectively, in Figure 1. The memory unit 411 stores hardware configuration information 421, software configuration information 422, configuration change information 423, and fault investigation information 424.

ハードウェア構成情報421及びソフトウェア構成情報422は、第1構成情報の一例である。構成変更情報423及び障害調査情報424は、図1の構成変更情報122及び障害調査情報121にそれぞれ対応する。 Hardware configuration information 421 and software configuration information 422 are examples of first configuration information. Configuration change information 423 and fault investigation information 424 correspond to configuration change information 122 and fault investigation information 121, respectively, in FIG. 1.

ハードウェア構成情報421は、サーバ301のハードウェア構成を表し、例えば、次のような情報を含む。 Hardware configuration information 421 represents the hardware configuration of server 301 and includes, for example, the following information:

(H1)サーバ301の種類
(H2)サーバ301に含まれる部品
(H3)各部品の種類及びシリアル番号
(H4)各部品のファームウェア版数
(H1) Type of server 301 (H2) Components included in server 301 (H3) Types and serial numbers of each component (H4) Firmware version of each component

ソフトウェア構成情報422は、サーバ301のソフトウェア構成を表し、例えば、次のような情報を含む。 The software configuration information 422 represents the software configuration of the server 301 and includes, for example, the following information:

(S1)OSの種類
(S2)OS版数
(S3)PCIカードのファームウェア版数
(S4)PCIカードのドライバ版数
(S5)PCIカードのシリアル番号
(S1) OS type (S2) OS version number (S3) PCI card firmware version number (S4) PCI card driver version number (S5) PCI card serial number

構成変更情報423は、サーバ301において過去に行われた構成変更に対応する調査対象を示す情報である。調査対象は、サーバ301に含まれるハードウェア又はソフトウェアを表す。 Configuration change information 423 is information indicating an investigation target corresponding to a configuration change that was previously made on server 301. The investigation target represents hardware or software included in server 301.

図5は、構成変更情報423の例を示している。図5の構成変更情報423は、検出日、対象項目、調査対象、ハードウェア種類、ファームウェア種類、OS種類、ドライバ種類、搭載箇所、変更前搭載箇所、変更後搭載箇所、及び型名を含む。構成変更情報423は、変更前シリアル番号、変更後シリアル番号、変更前ファームウェア版数、変更後ファームウェア版数、変更前ドライバ版数、変更後ドライバ版数、及び変更内容をさらに含む。 Figure 5 shows an example of configuration change information 423. The configuration change information 423 in Figure 5 includes the detection date, target item, investigation target, hardware type, firmware type, OS type, driver type, installation location, installation location before change, installation location after change, and model name. The configuration change information 423 further includes the pre-change serial number, post-change serial number, pre-change firmware version number, post-change firmware version number, pre-change driver version number, post-change driver version number, and change details.

検出日は、構成変更が検出された日を表し、対象項目は、構成変更が行われた調査対象の詳細情報を表し、調査対象は、構成変更が行われた調査対象の名称を表す。ハードウェア種類は、調査対象のハードウェアの種類を表し、ファームウェア種類は、調査対象のファームウェアの種類を表し、OS種類は、調査対象のOSの種類を表し、ドライバ種類は、調査対象のドライバの種類を表す。 The detection date indicates the date on which the configuration change was detected, the target item indicates detailed information about the target of investigation in which the configuration change was made, and the target of investigation indicates the name of the target of investigation in which the configuration change was made. The hardware type indicates the type of hardware being investigated, the firmware type indicates the type of firmware being investigated, the OS type indicates the type of OS being investigated, and the driver type indicates the type of driver being investigated.

搭載箇所は、調査対象が搭載されている部分を表す。変更前搭載箇所は、変更前の調査対象が搭載されていた部分を表し、変更後搭載箇所は、変更後の調査対象が搭載されている部分を表す。変更前搭載箇所及び変更後搭載箇所は、調査対象の搭載箇所が変更された場合に記録される。型名は、調査対象の型名を表す。 The installation location indicates the part in which the survey target is installed. The installation location before change indicates the part in which the survey target was installed before the change, and the installation location after change indicates the part in which the survey target is installed after the change. The installation location before change and the installation location after change are recorded when the installation location of the survey target is changed. The model name indicates the model name of the survey target.

変更前シリアル番号は、変更前の調査対象のシリアル番号を表し、変更後シリアル番号は、変更後の調査対象のシリアル番号を表す。変更前シリアル番号及び変更後シリアル番号は、調査対象がハードウェアであり、かつ、そのハードウェアが交換された場合に記録される。 The pre-change serial number indicates the serial number of the subject of investigation before the change, and the post-change serial number indicates the serial number of the subject of investigation after the change. The pre-change serial number and post-change serial number are recorded when the subject of investigation is hardware and that hardware has been replaced.

変更前ファームウェア版数は、変更前の調査対象のファームウェア版数を表し、変更後ファームウェア版数は、変更後の調査対象のファームウェア版数を表す。変更前ファームウェア版数及び変更後ファームウェア版数は、調査対象がファームウェアであり、かつ、そのファームウェアが交換された場合に記録される。 The firmware version before the change indicates the firmware version of the investigation target before the change, and the firmware version after the change indicates the firmware version of the investigation target after the change. The firmware version before the change and the firmware version after the change are recorded when the investigation target is firmware and that firmware has been replaced.

変更前ドライバ版数は、変更前の調査対象のドライバ版数を表し、変更後ドライバ版数は、変更後の調査対象のドライバ版数を表す。変更前ドライバ版数及び変更後ドライバ版数は、調査対象がドライバであり、かつ、そのドライバが交換された場合に記録される。変更内容は、検出された構成変更の内容を表す。 The pre-change driver version number indicates the driver version number of the driver being investigated before the change, and the post-change driver version number indicates the driver version number of the driver being investigated after the change. The pre-change driver version number and the post-change driver version number are recorded when the driver being investigated is a driver and the driver has been replaced. The change content indicates the content of the detected configuration change.

図5の“ハード”はハードウェアを表し、“ファーム”はファームウェアを表す。例えば、“2019/12/10”に検出された構成変更の変更内容は“RAID交換”であり、調査対象は“RAIDハード”である。“2019/12/20”に検出された構成変更の変更内容は“RAIDファームバージョンアップ”であり、調査対象は“RAIDファーム”である。 In Figure 5, "Hardware" represents hardware, and "Firmware" represents firmware. For example, the change in the configuration detected on "2019/12/10" is "RAID replacement" and the investigation target is "RAID hardware." The change in the configuration detected on "2019/12/20" is "RAID firmware upgrade" and the investigation target is "RAID firmware."

サーバ301において構成変更が行われた場合、その構成変更に起因して何らかの障害が発生することがある。例えば、RAID交換又はRAIDファームバージョンアップが行われた場合、そのRAIDを含むDUにおいてエラーが発生することがある。また、CPU交換、MMBファームバージョンアップ、又はBIOSファームバージョンアップが行われた場合、その構成変更に起因してブートができなくなることがある。 When a configuration change is made to server 301, some kind of failure may occur due to the configuration change. For example, when a RAID is replaced or a RAID firmware is upgraded, an error may occur in the DU that contains that RAID. Also, when a CPU is replaced, an MMB firmware is upgraded, or a BIOS firmware is upgraded, the configuration change may cause the server to be unable to boot.

そこで、構成変更情報423を利用して、過去に行われた構成変更に対応する調査対象の中から、被疑箇所の候補を選択することで、構成変更に起因する障害の原因を効率良く特定することができる。 Therefore, by using the configuration change information 423 to select suspected locations from among the investigation targets corresponding to configuration changes made in the past, it is possible to efficiently identify the cause of the failure resulting from the configuration change.

障害調査情報424は、サーバ301における障害を示す障害情報と、サーバ301に含まれる調査対象とを対応付けた情報である。 The fault investigation information 424 is information that associates fault information indicating a fault in the server 301 with the investigation target included in the server 301.

図6は、障害調査情報424の例を示している。図6の障害調査情報424は、現象、対象箇所、障害内容(キーワード)、調査対象、及び資料を含む。現象は、障害情報の一例であり、障害の発生に伴って現れる現象を表す。対象箇所は、調査対象が搭載されている部分を表す。 Figure 6 shows an example of fault investigation information 424. The fault investigation information 424 in Figure 6 includes the phenomenon, the target location, the fault content (keywords), the investigation target, and materials. The phenomenon is an example of fault information, and represents a phenomenon that appears when a fault occurs. The target location represents the part where the investigation target is installed.

障害内容は、障害原因を表し、障害内容の右側に併記された括弧内のキーワードは、障害発生部分を表す単語である。キーワードは、対象箇所を表す単語であってもよい。調査対象は、被疑箇所の候補となる調査対象の名称を表し、資料は、障害原因の調査において確認すべき情報を表す。 The fault description indicates the cause of the fault, and the keyword in parentheses written to the right of the fault description is a word that indicates the part where the fault occurred. The keyword may be a word that indicates the target part. The investigation target indicates the name of the investigation target that is a candidate for the suspected part, and the documents indicate the information that should be confirmed when investigating the cause of the fault.

例えば、“AC電源が入らない”という現象に対して対応付けられている調査対象は、“電源ハード”、“PSU(Power Supply Unit)ハード”、“MMBファーム”、及び“MMBハード”である。 For example, the investigation targets associated with the phenomenon of "AC power not turning on" are "power supply hardware," "PSU (Power Supply Unit) hardware," "MMB firmware," and "MMB hardware."

図7は、図3のサーバ301が行う障害検出処理の例を示している。抽出部412は、以下のような手順で構成変更情報423を生成する。 Figure 7 shows an example of the fault detection process performed by the server 301 in Figure 3. The extraction unit 412 generates the configuration change information 423 in the following procedure.

P1:抽出部412は、所定のタイミングで、BIOSの装置ログ701からハードウェア構成情報を取得するとともに、OSのログ702からソフトウェア構成情報を取得する。所定のタイミングは、1日1回であってもよく、2日以上の期間に1回であってもよい。装置ログ701は、configdataであってもよい。 P1: The extraction unit 412 acquires hardware configuration information from the BIOS device log 701 and software configuration information from the OS log 702 at a predetermined timing. The predetermined timing may be once a day or once every two or more days. The device log 701 may be configdata.

P2:抽出部412は、取得されたハードウェア構成情報と、記憶部411が記憶するハードウェア構成情報421とを比較し、両者の差分を抽出することで、その差分を表す構成変更を検出する。そして、抽出部412は、変更後の構成をハードウェア構成情報421に記録することで、ハードウェア構成情報421を更新する。 P2: The extraction unit 412 compares the acquired hardware configuration information with the hardware configuration information 421 stored in the storage unit 411, extracts the difference between the two, and detects a configuration change that represents the difference. The extraction unit 412 then updates the hardware configuration information 421 by recording the changed configuration in the hardware configuration information 421.

P3:抽出部412は、取得されたソフトウェア構成情報と、記憶部411が記憶するソフトウェア構成情報422とを比較し、両者の差分を抽出することで、その差分を表す構成変更を検出する。そして、抽出部412は、変更後の構成をソフトウェア構成情報422に記録することで、ソフトウェア構成情報422を更新する。 P3: The extraction unit 412 compares the acquired software configuration information with the software configuration information 422 stored in the storage unit 411, extracts the difference between the two, and detects a configuration change that represents the difference. The extraction unit 412 then updates the software configuration information 422 by recording the changed configuration in the software configuration information 422.

P4:抽出部412は、検出された構成変更に対応する調査対象を含む情報を、構成変更情報423に付加する。 P4: The extraction unit 412 adds information including the investigation target corresponding to the detected configuration change to the configuration change information 423.

このように、装置ログ701のハードウェア構成情報をハードウェア構成情報421と比較し、OSのログ702のソフトウェア構成情報をソフトウェア構成情報422と比較することで、構成変更情報423を生成することができる。 In this way, by comparing the hardware configuration information in the device log 701 with the hardware configuration information 421 and comparing the software configuration information in the OS log 702 with the software configuration information 422, configuration change information 423 can be generated.

サーバ301における障害の発生を示すSEL703をBMC321が採取した場合、特定部413は、以下のような手順で対象項目を特定する。 When the BMC 321 collects SEL 703 indicating the occurrence of a fault in the server 301, the identification unit 413 identifies the target item in the following procedure.

P11:特定部413は、メッセージ仕様書の情報を用いて、SEL703のメッセージから1つ又は複数の対象項目を特定する。対象項目は、調査対象の詳細情報を表す。メッセージ仕様書には、複数のSELそれぞれのメッセージに対応する1つ又は複数の対象項目が記載されている。 P11: The identification unit 413 uses the information in the message specification to identify one or more target items from the message of SEL 703. The target items represent detailed information about the subject of investigation. The message specification describes one or more target items that correspond to each of the messages of the multiple SELs.

P12:特定部413は、記憶部411から構成変更情報423を取得する。そして、特定部413は、構成変更情報423から、特定された対象項目を検索し、構成変更情報423に記録されている対象項目を、構成変更に対応する対象項目として特定する。 P12: The identification unit 413 acquires the configuration change information 423 from the storage unit 411. Then, the identification unit 413 searches for the identified target item from the configuration change information 423, and identifies the target item recorded in the configuration change information 423 as the target item corresponding to the configuration change.

P13:特定部413は、構成変更に対応する対象項目を含む調査支援情報425を生成して、記憶部411に格納する。 P13: The identification unit 413 generates research support information 425 including target items corresponding to the configuration change and stores it in the memory unit 411.

P14:特定部413は、通信部312を介して、調査支援情報425を端末装置302へ送信することで、調査支援情報425を端末装置302へ出力する。端末装置302は、受信した調査支援情報425を画面上に表示する。 P14: The identification unit 413 outputs the research support information 425 to the terminal device 302 by transmitting the research support information 425 to the terminal device 302 via the communication unit 312. The terminal device 302 displays the received research support information 425 on the screen.

図8は、SEL703のメッセージの例を示している。SEL801は、“IOU#1”に関連する障害を示し、SEL802は、“IOU#0”に関連する障害を示し、SEL803は、“DU#0”に関連する障害を示す。対象項目は、メッセージ仕様書に記載されている対象項目を表し、搭載箇所は、対象項目が示す調査対象が搭載されている部分を表す。 Figure 8 shows an example of a SEL703 message. SEL801 indicates a fault related to "IOU#1", SEL802 indicates a fault related to "IOU#0", and SEL803 indicates a fault related to "DU#0". The target item indicates the target item described in the message specification, and the installation location indicates the part where the investigation target indicated by the target item is installed.

図9は、図8のSEL803に基づいて対象項目を特定する処理の例を示している。図9(a)は、SEL803のメッセージから特定される搭載箇所及び対象項目を示している。SEL803のメッセージから特定される対象項目は、“DU#0_RAID#1_RAIDハード”及び“DU#0_RAID#1_RAIDファーム”であり、これらの対象項目の搭載箇所は“DU#0_RAID#1”である。 Figure 9 shows an example of a process for identifying target items based on SEL803 in Figure 8. Figure 9(a) shows the mounting location and target items identified from the SEL803 message. The target items identified from the SEL803 message are "DU#0_RAID#1_RAID hardware" and "DU#0_RAID#1_RAID firmware", and the mounting location of these target items is "DU#0_RAID#1".

図9(b)は、図5の構成変更情報423において、図9(a)の“DU#0_RAID#1_RAIDハード”を対象項目として含む情報と、“DU#0_RAID#1_RAIDファーム”を対象項目として含む情報を示している。図9(c)は、図9(b)の情報に含まれる対象項目を示している。 Figure 9(b) shows information in the configuration change information 423 of Figure 5 that includes "DU#0_RAID#1_RAID hardware" in Figure 9(a) as a target item, and information that includes "DU#0_RAID#1_RAID firmware" as a target item. Figure 9(c) shows the target items included in the information in Figure 9(b).

特定部413は、図5の構成変更情報423から図9(a)の対象項目を検索し、図9(b)の情報を抽出する。そして、特定部413は、図9(b)の情報から図9(c)の対象項目を特定し、特定された対象項目を含む調査支援情報425を生成する。 The identification unit 413 searches for the target items in FIG. 9(a) from the configuration change information 423 in FIG. 5, and extracts the information in FIG. 9(b). The identification unit 413 then identifies the target items in FIG. 9(c) from the information in FIG. 9(b), and generates research support information 425 that includes the identified target items.

図10は、端末装置302の画面上に表示された、図9(c)の対象項目を含む調査支援情報425の例を示している。図10の調査支援情報425は、図9(c)の対象項目以外に、搭載箇所、型名、シリアル番号、版数、検出日、及び変更内容を含んでいる。対象項目以外の情報は、ハードウェア構成情報421、ソフトウェア構成情報422、又は構成変更情報423から取得される。図10の2個の対象項目は、メッセージ仕様書に記載されている順序で表示されている。 Figure 10 shows an example of investigation support information 425 including the target items of Figure 9 (c) displayed on the screen of the terminal device 302. In addition to the target items of Figure 9 (c), the investigation support information 425 of Figure 10 includes the installation location, model name, serial number, version number, detection date, and change details. Information other than the target items is obtained from hardware configuration information 421, software configuration information 422, or configuration change information 423. The two target items in Figure 10 are displayed in the order described in the message specification.

作業者は、表示された対象項目の中から何れかの対象項目を選択し、障害原因を調査する。そして、障害原因が特定された場合、作業者は、メッセージ仕様書及びメンテナンスマニュアルを参照しながら、障害原因に対する対処を行う。 The worker selects one of the displayed target items and investigates the cause of the failure. If the cause of the failure is identified, the worker refers to the message specification and maintenance manual and takes action to address the cause of the failure.

サーバ301において障害が発生し、かつ、SEL703が採取されなかった場合、特定部413は、以下のような手順で調査対象を特定する。 If a failure occurs in server 301 and SEL 703 is not collected, the identification unit 413 identifies the target of investigation using the following procedure.

P21:作業者は、端末装置302を用いて、発生した障害を示す入力情報704を入力し、通信部312は、端末装置302から入力情報704を受信することで、入力情報704を受け付ける。 P21: The worker uses the terminal device 302 to input input information 704 indicating the fault that has occurred, and the communication unit 312 receives the input information 704 from the terminal device 302, thereby accepting the input information 704.

P22:特定部413は、記憶部411から構成変更情報423及び障害調査情報424を取得する。次に、特定部413は、障害調査情報424から、入力情報704が示す障害の現象を検索し、その現象に対応付けられた1つ又は複数の調査対象を特定する。そして、特定部413は、構成変更情報423から、特定された調査対象を検索し、構成変更情報423に記録されている調査対象を、構成変更に対応する調査対象として特定する。 P22: The identification unit 413 acquires the configuration change information 423 and the fault investigation information 424 from the storage unit 411. Next, the identification unit 413 searches the fault investigation information 424 for the fault phenomenon indicated by the input information 704, and identifies one or more investigation targets associated with the phenomenon. The identification unit 413 then searches the configuration change information 423 for the identified investigation targets, and identifies the investigation targets recorded in the configuration change information 423 as the investigation targets corresponding to the configuration change.

P23:特定部413は、構成変更に対応する調査対象を含む調査支援情報425を生成して、記憶部411に格納する。 P23: The identification unit 413 generates investigation support information 425 including investigation targets corresponding to the configuration change, and stores it in the memory unit 411.

P24:特定部413は、通信部312を介して、調査支援情報425を端末装置302へ送信することで、調査支援情報425を端末装置302へ出力する。端末装置302は、受信した調査支援情報425を画面上に表示する。 P24: The identification unit 413 outputs the research support information 425 to the terminal device 302 by transmitting the research support information 425 to the terminal device 302 via the communication unit 312. The terminal device 302 displays the received research support information 425 on the screen.

入力情報704としては、例えば、図6に示した現象及びキーワードの組み合わせが用いられる。キーワードが不明である場合、入力情報704は、現象のみを含んでいてもよい。例えば、「UEFIブートできない」という入力情報704の場合、“ブートできない”が現象に対応し、“UEFI”がキーワードに対応する。 As the input information 704, for example, a combination of the phenomenon and keyword shown in FIG. 6 is used. If the keyword is unknown, the input information 704 may include only the phenomenon. For example, in the case of the input information 704 being "Unable to boot into UEFI", "unable to boot" corresponds to the phenomenon, and "UEFI" corresponds to the keyword.

図11は、この入力情報704に基づいて調査対象を特定する処理の例を示している。図11(a)は、図6の障害調査情報424において、“ブートできない”に対応付けられた6個の調査対象を示している。“ブートできない”に対応する調査対象は、“MMBファーム”、“MMBハード”、“BIOSファーム”、“CPUハード”、“HDDハード”、及び“OS情報”である。 Figure 11 shows an example of a process for identifying an investigation target based on this input information 704. Figure 11(a) shows six investigation targets associated with "unable to boot" in the fault investigation information 424 of Figure 6. The investigation targets corresponding to "unable to boot" are "MMB firmware", "MMB hardware", "BIOS firmware", "CPU hardware", "HDD hardware", and "OS information".

特定部413は、図6の障害調査情報424から、“ブートできない”という現象を検索し、図11(a)の6個の調査対象を特定する。そして、特定部413は、各調査対象のポイントとして“1”を付与する。調査対象に付与されたポイントは、調査対象に付与された重みの一例であり、調査対象の優先順位を表す。 The identification unit 413 searches for the phenomenon of "unable to boot" from the fault investigation information 424 in FIG. 6, and identifies the six investigation targets in FIG. 11(a). The identification unit 413 then assigns a point of "1" to each investigation target. The points assigned to the investigation targets are an example of the weight assigned to the investigation targets, and represent the priority order of the investigation targets.

図11(b)は、図11(a)の6個の調査対象のうち、障害調査情報424のキーワードに“UEFI”が含まれている2個の調査対象に、ポイントを加算した結果を示している。キーワードに“UEFI”が含まれている調査対象は、“BIOSファーム”及び“CPUハード”である。 Figure 11 (b) shows the result of adding points to two of the six investigation targets in Figure 11 (a) whose keywords in the fault investigation information 424 include "UEFI." The investigation targets whose keywords include "UEFI" are "BIOS firmware" and "CPU hardware."

特定部413は、図6の障害調査情報424から、“UEFI”というキーワードを検索し、“BIOSファーム”及び“CPUハード”を特定する。そして、特定部413は、“BIOSファーム”及び“CPUハード”のポイントに“1”を加算する。これにより、“BIOSファーム”及び“CPUハード”のポイントが“2”に変更される。 The identification unit 413 searches for the keyword "UEFI" from the fault investigation information 424 in FIG. 6, and identifies "BIOS firmware" and "CPU hardware". The identification unit 413 then adds "1" to the points for "BIOS firmware" and "CPU hardware". As a result, the points for "BIOS firmware" and "CPU hardware" are changed to "2".

図11(c)は、図5の構成変更情報423において、図11(a)の何れかの調査項目を含む情報を示している。図11(a)の6個の調査対象のうち、図5の構成変更情報423に含まれる調査対象は、“MMBファーム”、“BIOSファーム”、及び“CPUハード”である。 Figure 11 (c) shows information in the configuration change information 423 of Figure 5 that includes any of the investigation items in Figure 11 (a). Of the six investigation targets in Figure 11 (a), the investigation targets included in the configuration change information 423 of Figure 5 are "MMB firmware", "BIOS firmware", and "CPU hardware".

図11(d)は、図11(a)の6個の調査対象のうち、図5の構成変更情報423に含まれている3個の調査対象にポイントを加算した結果を示している。 Figure 11 (d) shows the result of adding points to three of the six survey targets in Figure 11 (a), which are included in the configuration change information 423 in Figure 5.

特定部413は、図5の構成変更情報423から図11(a)の各調査対象を検索し、図11(c)の情報を抽出して、“MMBファーム”、“BIOSファーム”、及び“CPUハード”を特定する。そして、特定部413は、“MMBファーム”、“BIOSファーム”、及び“CPUハード”のポイントに“1”を加算する。これにより、“MMBファーム”のポイントが“2”に変更され、“BIOSファーム”及び“CPUハード”のポイントが“3”に変更される。 The identification unit 413 searches for each of the investigation targets in FIG. 11(a) from the configuration change information 423 in FIG. 5, extracts the information in FIG. 11(c), and identifies "MMB firmware", "BIOS firmware", and "CPU hardware". The identification unit 413 then adds "1" to the points of "MMB firmware", "BIOS firmware", and "CPU hardware". As a result, the point of "MMB firmware" is changed to "2", and the points of "BIOS firmware" and "CPU hardware" are changed to "3".

特定部413は、図11(d)の調査対象と、各調査対象に付与されたポイントとを含む、調査支援情報425を生成する。調査対象及びポイントを含む調査支援情報425は、調査対象を重みに従って画面上に表示する情報の一例である。 The identification unit 413 generates survey support information 425 including the survey targets in FIG. 11(d) and the points assigned to each survey target. Survey support information 425 including the survey targets and points is an example of information that displays the survey targets on the screen according to their weights.

図12は、端末装置302の画面上に表示された、図11(d)の調査対象を含む調査支援情報425の例を示している。図12の調査支援情報425は、図11(d)の調査対象及びポイント以外に、変更有無、搭載箇所、型名、シリアル番号、版数、検出日、及び変更内容を含んでいる。 Figure 12 shows an example of investigation support information 425 including the investigation target of Figure 11 (d) displayed on the screen of the terminal device 302. In addition to the investigation target and points of Figure 11 (d), the investigation support information 425 of Figure 12 includes whether or not there was a change, the installation location, the model name, the serial number, the version number, the detection date, and the details of the change.

変更有無の“有り”は、構成変更情報423に含まれている調査対象を示し、“無し”は、構成変更情報423に含まれていない調査対象を示す。調査対象、ポイント、及び変更有無以外の情報は、ハードウェア構成情報421、ソフトウェア構成情報422、又は構成変更情報423から取得される。図12の6個の調査対象は、ポイントの降順に表示されている。この場合、変更有無が“有り”である調査対象の順位は、変更有無が“無し”である調査対象の順位よりも高くなっている。 "Yes" in the Changes column indicates a survey target that is included in the configuration change information 423, while "No" indicates a survey target that is not included in the configuration change information 423. Information other than the survey target, points, and change status is obtained from the hardware configuration information 421, the software configuration information 422, or the configuration change information 423. The six survey targets in Figure 12 are displayed in descending order of points. In this case, the ranking of survey targets with a change status of "Yes" is higher than the ranking of survey targets with a change status of "No".

作業者は、表示された調査対象の中から何れかの調査対象を選択し、障害原因を調査する。そして、障害原因が特定された場合、作業者は、メッセージ仕様書及びメンテナンスマニュアルを参照しながら、障害原因に対する対処を行う。 The worker selects one of the investigation targets displayed and investigates the cause of the failure. If the cause of the failure is identified, the worker refers to the message specification and maintenance manual and takes action to address the cause of the failure.

図3のサーバ301によれば、SELに表示されない障害が発生した場合であっても、被疑箇所の候補となる調査対象が提示されるため、作業者は、障害原因の調査を直ちに開始することができる。被疑箇所の候補として、構成変更に対応する調査対象を提示することで、障害原因の調査が効率化される。 According to server 301 in FIG. 3, even if a failure not displayed in SEL occurs, the operator can immediately start investigating the cause of the failure because investigation targets that are candidates for the suspected location are presented. By presenting investigation targets that correspond to configuration changes as candidates for the suspected location, the investigation of the cause of the failure becomes more efficient.

さらに、複数の調査対象をポイントの降順に表示することで、優先度の高い調査対象を容易に認識することができるため、調査時間が短縮される。調査対象のポイントとして、入力情報704の現象に対するポイント、入力情報704のキーワードに対するポイント、及び構成変更情報423の構成変更に対するポイントの総和を用いることで、複数の調査対象の優先順位を異ならせることができる。 Furthermore, by displaying multiple investigation targets in descending order of points, investigation targets with high priority can be easily identified, thereby shortening investigation time. By using the sum of points for the phenomenon in the input information 704, points for the keywords in the input information 704, and points for the configuration change in the configuration change information 423 as the points for the investigation target, it is possible to differentiate the priorities of multiple investigation targets.

図13は、図4のBMC321が構成変更情報423を生成する生成処理の例を示すフローチャートである。まず、抽出部412は、所定のタイミングで、BIOSの装置ログ701からハードウェア構成情報を取得し(ステップ1301)、OSのログ702からソフトウェア構成情報を取得する(ステップ1302)。 Figure 13 is a flowchart showing an example of a generation process in which the BMC 321 in Figure 4 generates the configuration change information 423. First, the extraction unit 412 acquires hardware configuration information from the BIOS device log 701 at a predetermined timing (step 1301), and acquires software configuration information from the OS log 702 (step 1302).

次に、抽出部412は、取得されたハードウェア構成情報と、記憶部411が記憶するハードウェア構成情報421とを比較し、取得されたソフトウェア構成情報と、記憶部411が記憶するソフトウェア構成情報422とを比較する。そして、抽出部412は、ハードウェア構成又はソフトウェア構成に変更が有るか否かをチェックする(ステップ1303)。 Next, the extraction unit 412 compares the acquired hardware configuration information with the hardware configuration information 421 stored in the storage unit 411, and compares the acquired software configuration information with the software configuration information 422 stored in the storage unit 411. The extraction unit 412 then checks whether there has been a change in the hardware configuration or software configuration (step 1303).

ハードウェア構成又はソフトウェア構成に変更が無い場合(ステップ1303,NO)、抽出部412は、ステップ1301以降の処理を繰り返す。 If there is no change in the hardware configuration or software configuration (step 1303, NO), the extraction unit 412 repeats the processing from step 1301 onwards.

ハードウェア構成又はソフトウェア構成に変更が有る場合(ステップ1303,YES)、抽出部412は、変更後の構成をハードウェア構成情報421又はソフトウェア構成情報422に記録する(ステップ1304)。これにより、ハードウェア構成情報421又はソフトウェア構成情報422が更新される。次に、抽出部412は、構成変更に対応する調査対象を含む情報を、構成変更情報423に付加する(ステップ1305)。 If there is a change in the hardware configuration or software configuration (step 1303, YES), the extraction unit 412 records the changed configuration in the hardware configuration information 421 or software configuration information 422 (step 1304). This updates the hardware configuration information 421 or software configuration information 422. Next, the extraction unit 412 adds information including the investigation target corresponding to the configuration change to the configuration change information 423 (step 1305).

図14A及び図14Bは、図4のBMC321が行う調査対象特定処理の例を示すフローチャートである。まず、特定部413は、SEL703が採取されたか否かをチェックする(ステップ1401)。SEL703が採取された場合(ステップ1401,YES)、特定部413は、SEL703を取得し(ステップ1402)、メッセージ仕様書の情報を用いて、SEL703のメッセージから1つ又は複数の対象項目を特定する(ステップ1403)。 Figures 14A and 14B are flowcharts showing an example of a survey target identification process performed by the BMC 321 in Figure 4. First, the identification unit 413 checks whether SEL 703 has been collected (step 1401). If SEL 703 has been collected (step 1401, YES), the identification unit 413 acquires SEL 703 (step 1402) and identifies one or more target items from the message of SEL 703 using information in the message specification (step 1403).

次に、特定部413は、構成変更情報423から各対象項目を検索し、構成変更情報423に何れかの対象項目が存在するか否かをチェックする(ステップ1404)。構成変更情報423に何れかの対象項目が存在する場合(ステップ1404,YES)、特定部413は、その対象項目を含む調査支援情報425を生成する(ステップ1405)。そして、特定部413は、通信部312を介して、調査支援情報425を端末装置302へ送信する(ステップ1406)。 Next, the identification unit 413 searches for each target item in the configuration change information 423 and checks whether any target items exist in the configuration change information 423 (step 1404). If any target items exist in the configuration change information 423 (step 1404, YES), the identification unit 413 generates research support information 425 including the target items (step 1405). Then, the identification unit 413 transmits the research support information 425 to the terminal device 302 via the communication unit 312 (step 1406).

SEL703が採取されていない場合(ステップ1401,NO)、特定部413は、端末装置302から入力情報704を受信したか否かをチェックする(ステップ1407)。入力情報704を受信していない場合(ステップ1407,NO)、特定部413は、処理を終了する。 If SEL703 has not been collected (step 1401, NO), the identification unit 413 checks whether input information 704 has been received from the terminal device 302 (step 1407). If input information 704 has not been received (step 1407, NO), the identification unit 413 ends the process.

入力情報704を受信した場合(ステップ1407,YES)、特定部413は、障害調査情報424から、入力情報704に含まれる現象を検索し、障害調査情報424に現象が存在するか否かをチェックする(ステップ1408)。 When input information 704 is received (step 1407, YES), the identification unit 413 searches the fault investigation information 424 for the phenomenon contained in the input information 704 and checks whether the phenomenon exists in the fault investigation information 424 (step 1408).

障害調査情報424に現象が存在する場合(ステップ1408,YES)、特定部413は、現象に対応する1つ又は複数の調査対象を特定する(ステップ1409)。そして、特定部413は、各調査対象のポイントとして“1”を付与する(ステップ1410)。 If the phenomenon exists in the fault investigation information 424 (step 1408, YES), the identification unit 413 identifies one or more investigation targets corresponding to the phenomenon (step 1409). Then, the identification unit 413 assigns a point of "1" to each investigation target (step 1410).

次に、特定部413は、障害調査情報424から、入力情報704に含まれるキーワードを検索し、そのキーワードが、特定された各調査対象に対応付けられているか否かをチェックする(ステップ1411)。キーワードが何れかの調査対象に対応付けられている場合(ステップ1411,YES)、特定部413は、その調査対象のポイントに“1”を加算する(ステップ1412)。 Next, the identification unit 413 searches the fault investigation information 424 for keywords contained in the input information 704, and checks whether the keywords are associated with each of the identified investigation targets (step 1411). If the keyword is associated with any of the investigation targets (step 1411, YES), the identification unit 413 adds "1" to the points of that investigation target (step 1412).

次に、特定部413は、構成変更情報423から、特定された各調査対象を検索し、構成変更情報423に何れかの調査対象が存在するか否かをチェックする(ステップ1413)。構成変更情報423に何れかの調査対象が存在する場合(ステップ1413,YES)、特定部413は、その調査対象のポイントに“1”を加算する(ステップ1414)。 Next, the identification unit 413 searches for each of the identified investigation targets from the configuration change information 423 and checks whether any of the investigation targets are present in the configuration change information 423 (step 1413). If any of the investigation targets are present in the configuration change information 423 (step 1413, YES), the identification unit 413 adds "1" to the point of that investigation target (step 1414).

次に、特定部413は、ポイントが付与された調査対象を含む調査支援情報425を生成し(ステップ1405)、調査支援情報425を端末装置302へ送信する(ステップ1406)。 Next, the identification unit 413 generates survey support information 425 including the survey subjects to which points have been assigned (step 1405) and transmits the survey support information 425 to the terminal device 302 (step 1406).

障害調査情報424に現象が存在しない場合(ステップ1408,NO)、特定部413は、通信部312を介して、障害調査情報424の修正を指示する修正依頼を端末装置302へ送信する(ステップ1415)。 If the phenomenon does not exist in the fault investigation information 424 (step 1408, NO), the identification unit 413 sends a correction request to the terminal device 302 via the communication unit 312 to instruct the terminal device 302 to correct the fault investigation information 424 (step 1415).

端末装置302は、受信した修正依頼を画面上に表示し、作業者は、修正依頼に従って、入力情報704に対応する補充情報を入力する。補充情報は、現象、対象箇所、障害内容(キーワード)、調査対象、及び資料を含む。通信部312は、入力された補充情報を端末装置302から受信し、特定部413は、受信した補充情報を障害調査情報424に追加する。そして、特定部413は、ステップ1408以降の処理を繰り返す。 The terminal device 302 displays the received correction request on the screen, and the worker inputs supplemental information corresponding to the input information 704 in accordance with the correction request. The supplemental information includes the phenomenon, the target location, the fault content (keywords), the investigation target, and materials. The communication unit 312 receives the input supplemental information from the terminal device 302, and the identification unit 413 adds the received supplemental information to the fault investigation information 424. The identification unit 413 then repeats the processing from step 1408 onwards.

入力情報704にキーワードが含まれていない場合、又はキーワードが何れの調査対象にも対応付けられていない場合(ステップ1411,NO)、特定部413は、ステップ1415以降の処理を行う。入力情報704にキーワードが含まれていない場合、又はキーワードが何れの調査対象にも対応付けられていない場合、特定部413は、ステップ1415以降の処理の代わりに、ステップ1413以降の処理を行ってもよい。 If the input information 704 does not include a keyword, or if the keyword does not correspond to any of the research subjects (step 1411, NO), the identification unit 413 performs the processes from step 1415 onwards. If the input information 704 does not include a keyword, or if the keyword does not correspond to any of the research subjects, the identification unit 413 may perform the processes from step 1413 onwards instead of the processes from step 1415 onwards.

構成変更情報423に何れの調査対象も存在しない場合(ステップ1413,NO)、特定部413は、ステップ1405以降の処理を行う。構成変更情報423に何れの対象項目も存在しない場合(ステップ1404,NO)、特定部413は、ステップ1407以降の処理を行う。 If there are no investigation targets in the configuration change information 423 (step 1413, NO), the identification unit 413 performs the processes from step 1405 onwards. If there are no target items in the configuration change information 423 (step 1404, NO), the identification unit 413 performs the processes from step 1407 onwards.

図1の情報処理装置101及び図3のサーバ301の構成は一例に過ぎず、情報処理装置101又はサーバ301の用途又は条件に応じて、一部の構成要素を省略又は変更してもよい。例えば、図3のサーバ301は、複数のSBを含んでいてもよく、各SBは、CPU及びメモリ以外のハードウェアを含んでいてもよい。 The configurations of the information processing device 101 in FIG. 1 and the server 301 in FIG. 3 are merely examples, and some components may be omitted or changed depending on the purpose or conditions of the information processing device 101 or the server 301. For example, the server 301 in FIG. 3 may include multiple SBs, and each SB may include hardware other than a CPU and memory.

図4のBMC321の構成は一例に過ぎず、サーバ301の構成又は条件に応じて、一部の構成要素を省略又は変更してもよい。 The configuration of BMC321 in FIG. 4 is merely an example, and some components may be omitted or modified depending on the configuration or conditions of server 301.

図2、図13、図14A、及び図14Bのフローチャートは一例に過ぎず、情報処理装置101又はサーバ301の構成又は条件に応じて一部の処理を省略又は変更してもよい。例えば、図14A及び図14Bの調査対象特定処理において、入力情報704にキーワードが含まれていない場合は、ステップ1411及びステップ1412の処理を省略することができる。 The flowcharts in Figures 2, 13, 14A, and 14B are merely examples, and some processes may be omitted or changed depending on the configuration or conditions of the information processing device 101 or the server 301. For example, in the survey target identification process in Figures 14A and 14B, if the input information 704 does not contain a keyword, the processes of steps 1411 and 1412 can be omitted.

図5に示した構成変更情報423及び図6に示した障害調査情報424は一例に過ぎず、構成変更情報423及び障害調査情報424は、サーバ301の構成に応じて変化する。図7に示した障害検出処理は一例に過ぎず、BMC321は、別の手順で障害検出処理を行ってもよい。 The configuration change information 423 shown in FIG. 5 and the fault investigation information 424 shown in FIG. 6 are merely examples, and the configuration change information 423 and the fault investigation information 424 change depending on the configuration of the server 301. The fault detection process shown in FIG. 7 is merely an example, and the BMC 321 may perform the fault detection process using a different procedure.

図8に示したSELのメッセージは一例に過ぎず、SELのメッセージは、発生した障害に応じて変化する。図9及び図10に示した対象項目は一例に過ぎず、特定される対象項目は、SELに応じて変化する。図11及び図12に示した調査対象は一例に過ぎず、特定される調査対象は、入力情報に応じて変化する。 The SEL message shown in FIG. 8 is merely an example, and the SEL message changes depending on the failure that has occurred. The target items shown in FIG. 9 and FIG. 10 are merely an example, and the identified target items change depending on SEL. The investigation targets shown in FIG. 11 and FIG. 12 are merely an example, and the identified investigation targets change depending on the input information.

図15は、図3のBMC321のハードウェア構成例を示している。図15のBMC321は、CPU1511及びメモリ1512を含む。 Figure 15 shows an example of the hardware configuration of the BMC 321 in Figure 3. The BMC 321 in Figure 15 includes a CPU 1511 and a memory 1512.

メモリ1512は、例えば、ROM(Read Only Memory)、RAM(Random Access Memory)、フラッシュメモリ等の半導体メモリであり、処理に用いられるプログラム及びデータを格納する。メモリ1512は、図4の記憶部411として動作する。 The memory 1512 is, for example, a semiconductor memory such as a read only memory (ROM), a random access memory (RAM), or a flash memory, and stores programs and data used in processing. The memory 1512 operates as the storage unit 411 in FIG. 4.

CPU1511は、例えば、メモリ1512を利用してプログラムを実行することにより、図4の抽出部412及び特定部413として動作する。 The CPU 1511 operates as the extraction unit 412 and the identification unit 413 in FIG. 4, for example, by executing a program using the memory 1512.

オペレータ又はユーザは、不図示の可搬型記録媒体にプログラム及びデータを格納しておき、それらをメモリ1512にロードして使用することができる。可搬型記録媒体としては、メモリデバイス、フレキシブルディスク、光ディスク、光磁気ディスク等が用いられる。可搬型記録媒体は、CD-ROM(Compact Disk Read Only Memory)、DVD(Digital Versatile Disk)、USBメモリ等であってもよい。 An operator or user can store programs and data in a portable recording medium (not shown) and load them into memory 1512 for use. Examples of portable recording media include memory devices, flexible disks, optical disks, and magneto-optical disks. Portable recording media may also be CD-ROMs (Compact Disk Read Only Memory), DVDs (Digital Versatile Disks), USB memory, etc.

このように、処理に用いられるプログラム及びデータを格納するコンピュータ読み取り可能な記録媒体は、メモリ1512又は可搬型記録媒体のような、物理的な(非一時的な)記録媒体である。 In this manner, the computer-readable recording medium that stores the programs and data used in the processing is a physical (non-transitory) recording medium, such as memory 1512 or a portable recording medium.

なお、図15のBMC321の構成は一例に過ぎず、サーバ301の構成又は条件に応じて一部の構成要素を省略又は変更してもよい。 Note that the configuration of BMC321 in FIG. 15 is merely an example, and some components may be omitted or changed depending on the configuration or conditions of server 301.

開示の実施形態とその利点について詳しく説明したが、当業者は、特許請求の範囲に明確に記載した本発明の範囲から逸脱することなく、様々な変更、追加、省略をすることができるであろう。 Although the disclosed embodiments and their advantages have been described in detail, it will be understood that those skilled in the art may make various modifications, additions, and omissions without departing from the scope of the present invention as expressly set forth in the claims.

図1乃至図15を参照しながら説明した実施形態に関し、さらに以下の付記を開示する。
(付記1)
情報処理装置における障害を示す障害情報と、前記情報処理装置に含まれる1つ又は複数の調査対象とを対応付けた障害調査情報を記憶するとともに、前記情報処理装置において行われた構成変更に対応する調査対象を示す構成変更情報を記憶する記憶部と、
前記情報処理装置において発生した障害を示す入力情報を受け付ける受付部と、
前記障害調査情報と前記構成変更情報とに基づいて、前記入力情報が示す障害に対応する1つ又は複数の調査対象のうち、前記構成変更に対応する調査対象を特定し、特定された前記構成変更に対応する調査対象を含む調査支援情報を出力する特定部と、
を備えることを特徴とする情報処理装置。
(付記2)
前記特定部は、前記障害調査情報と前記構成変更情報とに基づいて、前記入力情報が示す障害に対応する1つ又は複数の調査対象それぞれに重みを付与し、前記入力情報が示す障害に対応する1つ又は複数の調査対象を前記重みに従って画面上に表示する情報を、前記調査支援情報として出力し、
前記入力情報が示す障害に対応する1つ又は複数の調査対象それぞれに付与された前記重みのうち、前記構成変更に対応する調査対象に付与された前記重みは、前記構成変更に対応することを示す重みを含むことを特徴とする付記1記載の情報処理装置。
(付記3)
前記障害調査情報は、前記情報処理装置に含まれる1つ又は複数の調査対象それぞれに対応付けられた障害発生部分を示す情報をさらに含み、
前記入力情報は、前記情報処理装置において発生した障害の障害発生部分を示す情報をさらに含み、
前記入力情報が示す障害に対応する1つ又は複数の調査対象それぞれに付与された前記重みのうち、前記入力情報に含まれる前記障害発生部分に対応する調査対象に付与された前記重みは、前記入力情報に含まれる前記障害発生部分に対応することを示す重みを含むことを特徴とする付記2記載の情報処理装置。
(付記4)
前記記憶部は、前記情報処理装置の構成を示す第1構成情報をさらに記憶し、
前記情報処理装置は、前記情報処理装置の構成を示す第2構成情報を取得し、前記第2構成情報と前記第1構成情報との差分を抽出し、前記差分を表す構成変更に対応する調査対象を前記構成変更情報に付加する抽出部をさらに備えることを特徴とする付記1乃至3の何れか1項に記載の情報処理装置。
(付記5)
前記障害情報に含まれる前記調査対象及び前記構成変更情報に含まれる前記調査対象は、前記情報処理装置に含まれるハードウェア又はソフトウェアであることを特徴とする付記1乃至4の何れか1項に記載の情報処理装置。
(付記6)
情報処理装置において発生した障害を示す入力情報を受け付け、
前記情報処理装置における障害を示す障害情報と、前記情報処理装置に含まれる1つ又は複数の調査対象とを対応付けた障害調査情報を取得し、
前記情報処理装置において行われた構成変更に対応する調査対象を示す構成変更情報を取得し、
前記障害調査情報と前記構成変更情報とに基づいて、前記入力情報が示す障害に対応する1つ又は複数の調査対象のうち、前記構成変更に対応する調査対象を特定し、
特定された前記構成変更に対応する調査対象を含む調査支援情報を出力する、
処理を前記情報処理装置が実行することを特徴とする障害検出方法。
(付記7)
前記構成変更に対応する調査対象を特定する処理は、前記障害調査情報と前記構成変更情報とに基づいて、前記入力情報が示す障害に対応する1つ又は複数の調査対象それぞれに重みを付与する処理を含み、
前記調査支援情報を出力する処理は、前記入力情報が示す障害に対応する1つ又は複数の調査対象を前記重みに従って画面上に表示する情報を、前記調査支援情報として出力する処理を含み、
前記入力情報が示す障害に対応する1つ又は複数の調査対象それぞれに付与された前記重みのうち、前記構成変更に対応する調査対象に付与された前記重みは、前記構成変更に対応することを示す重みを含むことを特徴とする付記6記載の障害検出方法。
(付記8)
前記障害調査情報は、前記情報処理装置に含まれる1つ又は複数の調査対象それぞれに対応付けられた障害発生部分を示す情報をさらに含み、
前記入力情報は、前記情報処理装置において発生した障害の障害発生部分を示す情報をさらに含み、
前記入力情報が示す障害に対応する1つ又は複数の調査対象それぞれに付与された前記重みのうち、前記入力情報に含まれる前記障害発生部分に対応する調査対象に付与された前記重みは、前記入力情報に含まれる前記障害発生部分に対応することを示す重みを含むことを特徴とする付記7記載の障害検出方法。
(付記9)
前記情報処理装置の構成を示す第1構成情報を取得し、
前記情報処理装置の構成を示す第2構成情報を取得し、
前記第2構成情報と前記第1構成情報との差分を抽出し、
前記差分を表す構成変更に対応する調査対象を前記構成変更情報に付加する、
処理を前記情報処理装置がさらに実行することを特徴とする付記6乃至8の何れか1項に記載の障害検出方法。
(付記10)
前記障害情報に含まれる前記調査対象及び前記構成変更情報に含まれる前記調査対象は、前記情報処理装置に含まれるハードウェア又はソフトウェアであることを特徴とする付記6乃至9の何れか1項に記載の障害検出方法。
The following supplementary notes are further disclosed regarding the embodiment described with reference to FIGS.
(Appendix 1)
a storage unit that stores fault investigation information that associates fault information indicating a fault in an information processing device with one or more investigation targets included in the information processing device, and stores configuration change information that indicates an investigation target corresponding to a configuration change made in the information processing device;
a reception unit that receives input information indicating a failure that has occurred in the information processing device;
a specification unit that specifies an investigation target corresponding to the configuration change among one or more investigation targets corresponding to the failure indicated by the input information based on the failure investigation information and the configuration change information, and outputs investigation support information including the specified investigation target corresponding to the configuration change;
An information processing device comprising:
(Appendix 2)
the identifying unit assigns a weight to each of one or more investigation targets corresponding to the failure indicated by the input information based on the failure investigation information and the configuration change information, and outputs, as the investigation support information, information for displaying on a screen the one or more investigation targets corresponding to the failure indicated by the input information in accordance with the weight;
An information processing device as described in Appendix 1, characterized in that, among the weights assigned to each of one or more investigation targets corresponding to a fault indicated by the input information, the weight assigned to an investigation target corresponding to the configuration change includes a weight indicating that the investigation target corresponds to the configuration change.
(Appendix 3)
the fault investigation information further includes information indicating a faulty part associated with one or more investigation targets included in the information processing device,
the input information further includes information indicating a faulty part of the information processing device,
An information processing device as described in Appendix 2, characterized in that, among the weights assigned to each of one or more investigation targets corresponding to a fault indicated by the input information, the weights assigned to investigation targets corresponding to the fault-occurring part included in the input information include a weight indicating that the investigation targets correspond to the fault-occurring part included in the input information.
(Appendix 4)
the storage unit further stores first configuration information indicating a configuration of the information processing device;
The information processing device described in any one of appendices 1 to 3, further comprising an extraction unit that acquires second configuration information indicating a configuration of the information processing device, extracts a difference between the second configuration information and the first configuration information, and adds an investigation target corresponding to the configuration change representing the difference to the configuration change information.
(Appendix 5)
5. An information processing device according to any one of claims 1 to 4, characterized in that the investigation target included in the fault information and the investigation target included in the configuration change information are hardware or software included in the information processing device.
(Appendix 6)
receiving input information indicating a fault that has occurred in the information processing device;
acquiring fault investigation information in which fault information indicating a fault in the information processing device is associated with one or more investigation targets included in the information processing device;
acquiring configuration change information indicating a survey target corresponding to a configuration change made in the information processing device;
Identifying an investigation target corresponding to the configuration change from among one or more investigation targets corresponding to the failure indicated by the input information based on the failure investigation information and the configuration change information;
outputting investigation support information including an investigation target corresponding to the identified configuration change;
A fault detection method, characterized in that the processing is executed by the information processing device.
(Appendix 7)
the process of identifying an investigation target corresponding to the configuration change includes a process of assigning a weight to each of one or more investigation targets corresponding to the failure indicated by the input information, based on the failure investigation information and the configuration change information;
the process of outputting the investigation support information includes a process of outputting, as the investigation support information, information for displaying on a screen one or more investigation targets corresponding to the fault indicated by the input information in accordance with the weights;
The fault detection method described in Appendix 6, characterized in that, among the weights assigned to each of one or more investigation targets corresponding to a fault indicated by the input information, the weight assigned to an investigation target corresponding to the configuration change includes a weight indicating that the investigation target corresponds to the configuration change.
(Appendix 8)
the fault investigation information further includes information indicating a faulty part associated with one or more investigation targets included in the information processing device,
the input information further includes information indicating a faulty part of the information processing device,
The fault detection method described in Appendix 7, characterized in that, among the weights assigned to each of one or more investigation targets corresponding to the fault indicated by the input information, the weights assigned to the investigation targets corresponding to the fault-occurring part included in the input information include a weight indicating that the investigation targets correspond to the fault-occurring part included in the input information.
(Appendix 9)
acquiring first configuration information indicating a configuration of the information processing device;
acquiring second configuration information indicating a configuration of the information processing device;
extracting a difference between the second configuration information and the first configuration information;
adding a survey target corresponding to the configuration change indicating the difference to the configuration change information;
9. The fault detection method according to any one of claims 6 to 8, further comprising the step of: executing processing by the information processing device.
(Appendix 10)
A fault detection method as described in any one of appendices 6 to 9, characterized in that the investigation target included in the fault information and the investigation target included in the configuration change information are hardware or software included in the information processing device.

101 情報処理装置
111、411 記憶部
112 受付部
113、413 特定部
121、424 障害調査情報
122、423 構成変更情報
301 サーバ
302 端末装置
311 SB
312 通信部
313 DU
321 BMC
322-1、322-2、1511 CPU
323-1、323-2、1512 メモリ
412 抽出部
421 ハードウェア構成情報
422 ソフトウェア構成情報
425 調査支援情報
701 装置ログ
702 OSのログ
703、801~803 SEL
704 入力情報
101 Information processing device 111, 411 Storage unit 112 Reception unit 113, 413 Identification unit 121, 424 Fault investigation information 122, 423 Configuration change information 301 Server 302 Terminal device 311 SB
312 Communication unit 313 DU
321 BMC
322-1, 322-2, 1511 CPU
323-1, 323-2, 1512 Memory 412 Extraction unit 421 Hardware configuration information 422 Software configuration information 425 Investigation support information 701 Device log 702 OS log 703, 801 to 803 SEL
704 Input information

Claims (5)

情報処理装置における障害を示す障害情報と、前記情報処理装置に含まれる1つ又は複数の調査対象とを対応付けた障害調査情報を記憶するとともに、前記情報処理装置において行われた構成変更に対応する調査対象を示す構成変更情報を記憶する記憶部と、
前記情報処理装置において発生した障害を示す入力情報を受け付ける受付部と、
前記障害調査情報と前記構成変更情報とに基づいて、前記入力情報が示す障害に対応する1つ又は複数の調査対象のうち、前記構成変更に対応する調査対象を特定し、特定された前記構成変更に対応する調査対象を含む調査支援情報を出力する特定部と、
を備えることを特徴とする情報処理装置。
a storage unit that stores fault investigation information that associates fault information indicating a fault in an information processing device with one or more investigation targets included in the information processing device, and stores configuration change information that indicates an investigation target corresponding to a configuration change made in the information processing device;
a reception unit that receives input information indicating a failure that has occurred in the information processing device;
a specification unit that specifies an investigation target corresponding to the configuration change among one or more investigation targets corresponding to the failure indicated by the input information based on the failure investigation information and the configuration change information, and outputs investigation support information including the specified investigation target corresponding to the configuration change;
An information processing device comprising:
前記特定部は、前記障害調査情報と前記構成変更情報とに基づいて、前記入力情報が示す障害に対応する1つ又は複数の調査対象それぞれに重みを付与し、前記入力情報が示す障害に対応する1つ又は複数の調査対象を前記重みに従って画面上に表示する情報を、前記調査支援情報として出力し、
前記入力情報が示す障害に対応する1つ又は複数の調査対象それぞれに付与された前記重みのうち、前記構成変更に対応する調査対象に付与された前記重みは、前記構成変更に対応することを示す重みを含むことを特徴とする請求項1記載の情報処理装置。
the identifying unit assigns a weight to each of one or more investigation targets corresponding to the failure indicated by the input information based on the failure investigation information and the configuration change information, and outputs, as the investigation support information, information for displaying on a screen the one or more investigation targets corresponding to the failure indicated by the input information in accordance with the weight;
2. The information processing device according to claim 1, characterized in that, among the weights assigned to each of one or more investigation targets corresponding to a fault indicated by the input information, the weight assigned to an investigation target corresponding to the configuration change includes a weight indicating that the investigation target corresponds to the configuration change.
前記障害調査情報は、前記情報処理装置に含まれる1つ又は複数の調査対象それぞれに対応付けられた障害発生部分を示す情報をさらに含み、
前記入力情報は、前記情報処理装置において発生した障害の障害発生部分を示す情報をさらに含み、
前記入力情報が示す障害に対応する1つ又は複数の調査対象それぞれに付与された前記重みのうち、前記入力情報に含まれる前記障害発生部分に対応する調査対象に付与された前記重みは、前記入力情報に含まれる前記障害発生部分に対応することを示す重みを含むことを特徴とする請求項2記載の情報処理装置。
the fault investigation information further includes information indicating a faulty part associated with one or more investigation targets included in the information processing device,
the input information further includes information indicating a faulty part of the information processing device,
3. The information processing device according to claim 2, characterized in that, among the weights assigned to each of one or more investigation targets corresponding to a fault indicated by the input information, the weights assigned to investigation targets corresponding to the fault-occurring part included in the input information include a weight indicating that the investigation targets correspond to the fault-occurring part included in the input information.
前記記憶部は、前記情報処理装置の構成を示す第1構成情報をさらに記憶し、
前記情報処理装置は、前記情報処理装置の構成を示す第2構成情報を取得し、前記第2構成情報と前記第1構成情報との差分を抽出し、前記差分を表す構成変更に対応する調査対象を前記構成変更情報に付加する抽出部をさらに備えることを特徴とする請求項1乃至3の何れか1項に記載の情報処理装置。
the storage unit further stores first configuration information indicating a configuration of the information processing device;
The information processing device according to any one of claims 1 to 3, characterized in that the information processing device further comprises an extraction unit that acquires second configuration information indicating a configuration of the information processing device, extracts a difference between the second configuration information and the first configuration information, and adds an investigation target corresponding to the configuration change representing the difference to the configuration change information.
情報処理装置において発生した障害を示す入力情報を受け付け、
前記情報処理装置における障害を示す障害情報と、前記情報処理装置に含まれる1つ又は複数の調査対象とを対応付けた障害調査情報を取得し、
前記情報処理装置において行われた構成変更に対応する調査対象を示す構成変更情報を取得し、
前記障害調査情報と前記構成変更情報とに基づいて、前記入力情報が示す障害に対応する1つ又は複数の調査対象のうち、前記構成変更に対応する調査対象を特定し、
特定された前記構成変更に対応する調査対象を含む調査支援情報を出力する、
処理を前記情報処理装置が実行することを特徴とする障害検出方法。
receiving input information indicating a fault that has occurred in the information processing device;
acquiring fault investigation information in which fault information indicating a fault in the information processing device is associated with one or more investigation targets included in the information processing device;
acquiring configuration change information indicating a survey target corresponding to a configuration change made in the information processing device;
Identifying an investigation target corresponding to the configuration change from among one or more investigation targets corresponding to the failure indicated by the input information based on the failure investigation information and the configuration change information;
outputting investigation support information including an investigation target corresponding to the identified configuration change;
A fault detection method, characterized in that the processing is executed by the information processing device.
JP2020142534A 2020-08-26 2020-08-26 Information processing device and fault detection method Active JP7494656B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020142534A JP7494656B2 (en) 2020-08-26 2020-08-26 Information processing device and fault detection method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020142534A JP7494656B2 (en) 2020-08-26 2020-08-26 Information processing device and fault detection method

Publications (2)

Publication Number Publication Date
JP2022038178A JP2022038178A (en) 2022-03-10
JP7494656B2 true JP7494656B2 (en) 2024-06-04

Family

ID=80497846

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020142534A Active JP7494656B2 (en) 2020-08-26 2020-08-26 Information processing device and fault detection method

Country Status (1)

Country Link
JP (1) JP7494656B2 (en)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001344130A (en) 2000-03-31 2001-12-14 Fujitsu Ltd Remote maintenance device, terminal connected thereto, remote maintenance processing program, and recording medium therefor
US20110314138A1 (en) 2010-06-21 2011-12-22 Hitachi, Ltd. Method and apparatus for cause analysis configuration change
JP2012003647A (en) 2010-06-21 2012-01-05 Hitachi Ltd Method and apparatus for cause analysis configuration change
US20120030346A1 (en) 2010-07-29 2012-02-02 Hitachi, Ltd. Method for inferring extent of impact of configuration change event on system failure
JP2015115018A (en) 2013-12-16 2015-06-22 株式会社日立製作所 Management server and management server control method
JP2016012193A (en) 2014-06-27 2016-01-21 富士通株式会社 Extraction method, device, and program

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001344130A (en) 2000-03-31 2001-12-14 Fujitsu Ltd Remote maintenance device, terminal connected thereto, remote maintenance processing program, and recording medium therefor
US20110314138A1 (en) 2010-06-21 2011-12-22 Hitachi, Ltd. Method and apparatus for cause analysis configuration change
JP2012003647A (en) 2010-06-21 2012-01-05 Hitachi Ltd Method and apparatus for cause analysis configuration change
US20120030346A1 (en) 2010-07-29 2012-02-02 Hitachi, Ltd. Method for inferring extent of impact of configuration change event on system failure
JP2015115018A (en) 2013-12-16 2015-06-22 株式会社日立製作所 Management server and management server control method
JP2016012193A (en) 2014-06-27 2016-01-21 富士通株式会社 Extraction method, device, and program

Also Published As

Publication number Publication date
JP2022038178A (en) 2022-03-10

Similar Documents

Publication Publication Date Title
JP6048038B2 (en) Information processing apparatus, program, and information processing method
CN102597962B (en) Method and system for fault management in virtual computing environments
US8140907B2 (en) Accelerated virtual environments deployment troubleshooting based on two level file system signature
US7100085B2 (en) System for automated problem detection, diagnosis, and resolution in a software driven system
US20050081118A1 (en) System and method of generating trouble tickets to document computer failures
CN109522095B (en) Cloud host abnormal fault detection and recovery system and method and cloud platform
US7159146B2 (en) Analyzing system error messages
JPWO2004061681A1 (en) Operation management method and operation management server
US20060130071A1 (en) Method, system and program product for correlating data between operating environments
Talagala et al. An analysis of error behavior in a large storage system
JP6561212B2 (en) Inquiry handling system and method
JP5083051B2 (en) Monitoring system, monitoring device, monitored device, and monitoring method
US10275330B2 (en) Computer readable non-transitory recording medium storing pseudo failure generation program, generation method, and generation apparatus
US8027992B2 (en) Build automation and verification for modular servers
US20210294683A1 (en) Recording medium, failure cause identifying apparatus, and failure cause identifying method
US9021078B2 (en) Management method and management system
EP2819020A1 (en) Information system management device and information system management method and program
JP7494656B2 (en) Information processing device and fault detection method
US8504869B2 (en) Kernel swapping systems and methods for recovering a network device
US20150281140A1 (en) Identifying reports to address network issues
JP5696492B2 (en) Failure detection apparatus, failure detection method, and failure detection program
JP2009087136A (en) Fault repair system and fault repair method
JP2020119115A (en) Information processing device, information providing program, and information providing system
ChuahM et al. Failure diagnosis for cluster systems using partial correlations
JP7478003B2 (en) GENERATION APPARATUS, GENERATION METHOD, AND GENERATION PROGRAM

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230511

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20231024

TRDD Decision of grant or rejection written
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20240417

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240423

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240506

R150 Certificate of patent or registration of utility model

Ref document number: 7494656

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150