JP2015130023A - Information recording device, information processor, information recording method and information recording program - Google Patents

Information recording device, information processor, information recording method and information recording program Download PDF

Info

Publication number
JP2015130023A
JP2015130023A JP2014000794A JP2014000794A JP2015130023A JP 2015130023 A JP2015130023 A JP 2015130023A JP 2014000794 A JP2014000794 A JP 2014000794A JP 2014000794 A JP2014000794 A JP 2014000794A JP 2015130023 A JP2015130023 A JP 2015130023A
Authority
JP
Japan
Prior art keywords
information
bios
processing apparatus
failure
information recording
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014000794A
Other languages
Japanese (ja)
Inventor
裕子 若木
Yuko Wakagi
裕子 若木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Platforms Ltd
Original Assignee
NEC Platforms Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Platforms Ltd filed Critical NEC Platforms Ltd
Priority to JP2014000794A priority Critical patent/JP2015130023A/en
Publication of JP2015130023A publication Critical patent/JP2015130023A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide an information recording device capable of easily identifying the cause of a fault.SOLUTION: An information recording device includes: common memory means capable of being written by an external unit; fault detection means that detects an occurrence of a fault on the external unit; and information acquisition means that acquires a piece of operation information representing processing history written on the common memory means by the external unit.

Description

本発明は、障害の発生原因の特定を容易にすることが可能な、情報記録装置、情報処理装置、情報記録方法、及び情報記録プログラムに関する。   The present invention relates to an information recording apparatus, an information processing apparatus, an information recording method, and an information recording program that can easily identify the cause of failure.

「ファームウェア」とは、ハードウェアを制御するためのプログラムである。ファームウェアは、通常、ROM(Read-only Memory)等のハードウェアに書き込まれた状態で、電子機器に組み込まれる。   “Firmware” is a program for controlling hardware. The firmware is usually incorporated in an electronic device in a state written in hardware such as a ROM (Read-only Memory).

「BIOS(Basic Input/Output System)」とは、ファームウェアの一つで、コンピュータ等の装置に搭載されたプログラムのうち、ハードウェアとの間で、最も低レベルな入出力を行うためのプログラムである。BIOSは、装置の電源投入時に実行される。   "BIOS (Basic Input / Output System)" is one of the firmware and is the program for performing the lowest level input / output with the hardware among the programs installed in devices such as computers. is there. The BIOS is executed when the device is turned on.

BIOSの機能には、装置のハードウェアの初期化や、記憶装置からのブートローダの呼び出しがある。BIOSは、その他に、キーボードやディスプレイ等の入出力装置とプログラムとが相互に作用するための抽象化されたインタフェースを提供することもある。   BIOS functions include initializing the hardware of the device and calling the boot loader from the storage device. In addition, the BIOS may provide an abstracted interface for allowing an input / output device such as a keyboard and a display to interact with a program.

「ブート」とは、装置の起動を意味し、電源を投入時のOS(Operating System)等、装置の動作環境を立ち上げるまでの処理がこれに該当する。また、「ブートローダ」とは、ブート時に、装置の動作環境の立ち上げに必要なプログラムの読み込みを行うプログラムである。   “Boot” means activation of the device, and corresponds to processing up to starting up the operating environment of the device, such as an OS (Operating System) when the power is turned on. The “boot loader” is a program that reads a program necessary for starting up the operating environment of the apparatus at the time of booting.

BIOSを用いる装置には、各種の課題がある。第1の課題は、BIOSの動作時の障害に関する情報の記憶のための記憶容量の課題である。   There are various problems in the apparatus using the BIOS. The first problem is a problem of storage capacity for storing information related to a failure during operation of the BIOS.

BIOSには、障害発生時の原因を調査するために、BIOSが実行する処理の情報をログ(BIOSトレース)に記録したり、CPU(Central Processing Unit)のレジスタ情報やBIOSへの設定情報をログ(CPUログ)に記録したりするものがある。   In the BIOS, in order to investigate the cause at the time of the failure occurrence, information of processing executed by the BIOS is recorded in a log (BIOS trace), or register information of CPU (Central Processing Unit) and setting information in the BIOS are logged. Some of them are recorded in (CPU log).

ところが、BIOSトレースやCPUログには、記憶領域の容量に限りがあるため、BIOSトレースやCPUログをあまり詳細に記録することはできない。そのため、BIOSトレースやCPUログを粗く記録すると、ユーザは障害の詳細を掴むことができない。逆に、容量が許す限り、BIOSトレースやCPUログを詳細に記録しても、ユーザは障害の全体の流れを掴むことができない。このように、BIOSトレースやCPUログの記憶には、その記憶の詳細度合いを適正にすることが困難であるという問題がある。   However, since the BIOS trace and CPU log have a limited storage area capacity, the BIOS trace and CPU log cannot be recorded in detail. Therefore, if the BIOS trace or CPU log is recorded roughly, the user cannot grasp the details of the failure. Conversely, as long as the capacity permits, even if the BIOS trace and CPU log are recorded in detail, the user cannot grasp the entire flow of the failure. As described above, there is a problem in storing the BIOS trace and the CPU log that it is difficult to make the degree of detail of the storage appropriate.

障害発生時の原因を調査するためのトレースデータ記憶回路の記憶容量を必要以上に大きくすることなく、トレースデータの解析を容易にする技術の一例が、特許文献1に開示されている。   An example of a technique that facilitates analysis of trace data without increasing the storage capacity of the trace data storage circuit for investigating the cause at the time of occurrence of a failure more than necessary is disclosed in Patent Document 1.

特許文献1のトレースデータ記憶回路は、第1のデータ記憶部と、抽出情報記憶部と、選択部と、第2のデータ記憶部とを含む。   The trace data storage circuit of Patent Document 1 includes a first data storage unit, an extraction information storage unit, a selection unit, and a second data storage unit.

特許文献1のトレースデータ記憶回路は、以下のように動作する。第1のデータ記憶部は、入力するトレースデータDiを時系列的に順次記憶する。抽出情報記憶部は、入力されるトレースデータDiの内、必要とするトレースデータを抽出するための抽出情報Dsを予め記憶する。選択部は、入力したトレースデータDiに含まれる記号と抽出情報Dsとを照合し、該当するトレースデータのみを選択する。第2のデータ記憶部は、選択されたトレースデータDoを記憶する。   The trace data storage circuit of Patent Document 1 operates as follows. The first data storage unit sequentially stores the input trace data Di in time series. The extraction information storage unit stores in advance extraction information Ds for extracting necessary trace data from the input trace data Di. The selection unit collates the symbols included in the input trace data Di with the extraction information Ds, and selects only the corresponding trace data. The second data storage unit stores the selected trace data Do.

以上の動作の結果、特許文献1のトレースデータ記憶回路では、第1のデータ記憶部1には障害発生時の詳細なトレースデータが記憶されるので、詳細な動作がトレースされる。第2のデータ記憶部には必要とするトレースデータのみが抽出されて記憶されるので、動作の大きな流れがトレースされる。従って、特許文献1のトレースデータ記憶回路は、トレースデータ記憶回路の記憶容量を必要以上に大きくすることなく、トレースデータの解析を容易にする。   As a result of the above operation, in the trace data storage circuit of Patent Document 1, detailed trace data at the time of the failure is stored in the first data storage unit 1, so that detailed operation is traced. Since only necessary trace data is extracted and stored in the second data storage unit, a large flow of operation is traced. Therefore, the trace data storage circuit of Patent Document 1 facilitates analysis of trace data without increasing the storage capacity of the trace data storage circuit more than necessary.

BIOSを用いる装置の第2の課題は、BIOSストール発生時の障害対策の課題である。   A second problem of the apparatus using the BIOS is a problem of measures against a failure when a BIOS stall occurs.

情報処理装置立ち上げ中にハードウェアの故障や初期不良によるBIOSストールが起きた場合には、たとえ情報処理装置をリセットしたとしても、情報処理装置はBIOSストールを繰り返すだけで、BIOSストールから復旧できるとは限らない。つまり、BIOSストールが起きた場合に、BIOSストールに対する適切な復旧処理がないことがあるという問題がある。   If a BIOS stall occurs due to a hardware failure or initial failure during startup of the information processing apparatus, even if the information processing apparatus is reset, the information processing apparatus can recover from the BIOS stall only by repeating the BIOS stall. Not necessarily. That is, when a BIOS stall occurs, there is a problem that there is no appropriate recovery process for the BIOS stall.

「ストール」とは、ソフトウェアの動作が停止して、コンピュータ等の情報処理装置が操作を受け付けなくなる状態のことである。   “Stall” means a state in which the operation of software stops and an information processing apparatus such as a computer cannot accept an operation.

BIOSの起動をすること自体ができなかった場合と、BIOSの起動後の処理中にストールした場合とで、異なる復旧処理を行う技術の一例が、特許文献2に開示されている。   Patent Document 2 discloses an example of a technique for performing different recovery processing depending on whether the BIOS itself could not be started and when stalled during the processing after starting the BIOS.

特許文献2のBIOSストール障害時復旧装置は、第1のウォッチドッグタイマーと、第2のウォッチドッグタイマーと、BIOS領域切替スイッチと、リセット回路と、通常動作用BIOSデータ領域と、バックアップ用BIOSデータ領域とを含む。   The BIOS stall failure recovery device of Patent Document 2 includes a first watchdog timer, a second watchdog timer, a BIOS area changeover switch, a reset circuit, a normal operation BIOS data area, and a backup BIOS data. Area.

特許文献2のBIOSストール障害時復旧装置は、以下のように動作する。第1のウォッチドッグタイマーは、BIOSが起動不可能の場合、タイムアウトを発生し、リセット回路を通じて、BIOSストール障害時復旧装置の動作のリセットを実行する。それと同時に、第1のウォッチドッグタイマーは、BIOSデータ領域切替スイッチに指示を出し、通常動作用BIOSデータ領域ではなく、バックアップ用BIOSデータ領域を使用してBIOSを起動する。第2のウォッチドッグタイマーは、BIOSが処理中にストールした場合、タイムアウトを発生し、リセット回路を通じて、BIOSストール障害時復旧装置のリセットを実行する。   The BIOS stall failure recovery device of Patent Document 2 operates as follows. The first watchdog timer generates a time-out when the BIOS cannot be started, and resets the operation of the recovery apparatus at the time of BIOS stall failure through the reset circuit. At the same time, the first watchdog timer issues an instruction to the BIOS data area changeover switch, and activates the BIOS using the backup BIOS data area instead of the normal operation BIOS data area. When the BIOS stalls during processing, the second watchdog timer generates a timeout, and resets the recovery device at the time of BIOS stall failure through the reset circuit.

以上の動作の結果、特許文献2のBIOSストール障害時復旧装置は、BIOSの起動をすること自体ができなかった場合と、BIOSの起動後の処理中にストールした場合とで、異なる復旧処理を行う。つまり、情報処理装置のリセットによりBIOSストールから復旧できる可能性が高い場合には単にリセットを実行し、情報処理装置のリセットによりBIOSストールから復旧できる可能性が低い場合には他の対策(BIOSデータ領域切替)と共にリセットを実行する。従って、特許文献2のBIOSストール障害時復旧装置は、情報処理装置がBIOSストールから復旧できる可能性を高める。   As a result of the above operation, the recovery device at the time of BIOS stall failure in Patent Document 2 performs different recovery processing depending on whether the BIOS itself could not be started or when stalled during the processing after the BIOS startup. Do. That is, if there is a high possibility that recovery from the BIOS stall is caused by resetting the information processing apparatus, the reset is simply executed. If there is low possibility that recovery from the BIOS stall is caused by resetting the information processing apparatus, other countermeasures (BIOS data) Reset is executed at the same time. Therefore, the BIOS stall failure recovery apparatus disclosed in Patent Document 2 increases the possibility that the information processing apparatus can recover from the BIOS stall.

上記の第2の課題に関して、BIOSストール時には、BIOSは外部からの操作に対して応答しないので、ストールの状況を示す情報を得ることができないため、ストール原因の特定が困難であるという問題がある。   Regarding the second problem, when the BIOS is stalled, the BIOS does not respond to an operation from the outside, and therefore, there is a problem that it is difficult to identify the cause of the stall because information indicating the stall status cannot be obtained. .

CPUに重大なエラーが発生して動作不能になった場合に、動作不能になったCPUの障害原因の推定に利用するために、動作不能になったCPU以外のCPUのエラーログを取得する技術の一例が、特許文献3に開示されている。   A technique for acquiring an error log of a CPU other than the CPU that has become inoperable in order to estimate the cause of failure of the CPU that has become inoperable when a serious error occurs in the CPU An example is disclosed in Patent Document 3.

特許文献3の情報処理装置は、以下のように動作する。各CPUがI/O(Input/Output)ハブから割り込み信号を受信すると、CPUは割り込みハンドラを起動する。割り込みハンドラは、CPU毎に設けられた状態レジスタに所定の値を書き込み、所定の時間の経過後に各状態レジスタの値が所定の値に一致したか否かに基づいて、複数のCPUの何れかに障害が発生したか否かを判定する。割り込みハンドラは、複数のCPUの何れかに障害が発生した可能性が高いと判定すると、自CPUのログを取得して情報処理装置の管理手段に送信する。   The information processing apparatus of Patent Document 3 operates as follows. When each CPU receives an interrupt signal from an input / output (I / O) hub, the CPU activates an interrupt handler. The interrupt handler writes a predetermined value to a state register provided for each CPU, and determines whether any of the plurality of CPUs is based on whether the value of each state register matches the predetermined value after a predetermined time has elapsed. It is determined whether or not a failure has occurred. If the interrupt handler determines that there is a high possibility that a failure has occurred in any of the plurality of CPUs, the interrupt handler acquires the log of the CPU and transmits it to the management unit of the information processing apparatus.

以上の動作の結果、特許文献3の情報処理装置は、動作不能になったCPU以外のCPUのエラーログを取得する。   As a result of the above operation, the information processing apparatus of Patent Literature 3 acquires an error log of a CPU other than the CPU that has become inoperable.

特開平06−168164号公報(第2ページ、図1)Japanese Patent Laid-Open No. 06-168164 (second page, FIG. 1) 特開2008−225858号公報(第5−8ページ、図1、2)JP 2008-225858 A (page 5-8, FIGS. 1 and 2) 特開2013−025440号公報(第4−8ページ、図1−4)Japanese Patent Laying-Open No. 2013-255440 (page 4-8, FIGS. 1-4)

特許文献1のトレースデータ記憶回路は、トレースデータ記憶回路の記憶容量を必要以上に大きくすることなく、トレースデータの解析を容易にする。ところが、ストールが発生したBIOSは外部からの操作に対して応答しないので、特許文献1のトレースデータ記憶回路には、ストールが発生したBIOSのBIOSトレースを取得することが困難であるという問題がある。   The trace data storage circuit of Patent Document 1 facilitates analysis of trace data without increasing the storage capacity of the trace data storage circuit more than necessary. However, since the BIOS in which the stall has occurred does not respond to an operation from the outside, the trace data storage circuit of Patent Document 1 has a problem that it is difficult to obtain the BIOS trace of the BIOS in which the stall has occurred. .

特許文献2のBIOSストール障害時復旧装置は、情報処理装置がBIOSストールから復旧できる可能性を高める。ところが、特許文献2のBIOSストール障害時復旧装置には、BIOSストールの発生原因を特定することができないという問題がある。   The recovery device at the time of BIOS stall failure of patent document 2 increases the possibility that the information processing device can recover from the BIOS stall. However, the recovery device at the time of BIOS stall failure of Patent Document 2 has a problem that the cause of occurrence of the BIOS stall cannot be specified.

特許文献3の情報処理装置は、複数のCPUの何れかに障害が発生したときに、障害が発生していないCPUのログを記録する。ところが、障害が発生したCPUのログは記録されない。つまり、ユーザは、障害が発生していないCPUのログを利用して、障害が発生したCPUにおける障害発生の原因を推定しなければならない。従って、特許文献3の技術には、ストールが発生した際に、ストールの発生原因の特定が容易ではないという問題がある。
(発明の目的)
本発明の目的は、障害が発生した際に、障害の発生原因の特定を容易にすることが可能な、情報記録装置、情報処理装置、情報記録方法、及び情報記録プログラムを提供することにある。
The information processing apparatus of Patent Literature 3 records a log of a CPU in which no failure has occurred when any of the plurality of CPUs has a failure. However, the log of the CPU in which the failure has occurred is not recorded. That is, the user must estimate the cause of the failure in the CPU in which the failure has occurred, using the log of the CPU in which no failure has occurred. Therefore, the technique of Patent Document 3 has a problem that when a stall occurs, it is not easy to identify the cause of the stall.
(Object of invention)
An object of the present invention is to provide an information recording device, an information processing device, an information recording method, and an information recording program that can easily identify the cause of the failure when the failure occurs. .

本発明の情報記録装置は、外部の装置による書き込みが可能な共有メモリ手段と、外部の装置における障害の発生を検出する障害検出手段と、外部の装置により共有メモリ手段に書き込まれた外部の装置が実行した処理の履歴を示す動作情報を取得する情報取得手段とを備えることを特徴とする。   An information recording apparatus according to the present invention includes a shared memory means writable by an external device, a failure detection means for detecting the occurrence of a failure in the external device, and an external device written in the shared memory means by the external device And an information acquisition means for acquiring operation information indicating a history of processing executed by the system.

本発明の情報処理装置は、CPUと、メモリと、I/Oと、I/Oを介した書き込みが可能な共有メモリ手段、障害の発生をI/Oを介して検出する障害検出手段、及び共有メモリ手段に書き込まれた処理の履歴を示す動作情報をI/Oを介して取得する情報取得手段を有する情報記録装置とを備えることを特徴とする。   An information processing apparatus according to the present invention includes a CPU, a memory, an I / O, a shared memory means capable of writing via the I / O, a fault detecting means for detecting the occurrence of a fault via the I / O, and And an information recording device having information acquisition means for acquiring operation information indicating the history of processing written in the shared memory means via the I / O.

本発明の情報記録方法は、外部の装置における障害の発生を検出し、外部の装置により共有メモリに書き込まれた外部の装置が実行した処理の履歴を示す動作情報を取得することを特徴とする。   The information recording method of the present invention is characterized by detecting occurrence of a failure in an external device and acquiring operation information indicating a history of processing executed by the external device written in the shared memory by the external device. .

本発明の情報記録プログラムは、外部の装置による書き込みが可能な共有メモリを備えた情報記録装置が備えるコンピュータを、外部の装置における障害の発生を検出する障害検出手段と、外部の装置により共有メモリに書き込まれた外部の装置が実行した処理の履歴を示す動作情報を取得する情報取得手段として機能させることを特徴とする。   An information recording program according to the present invention includes a failure detection means for detecting the occurrence of a failure in an external device, a computer including the shared memory writable by an external device, and a shared memory by the external device. It is made to function as an information acquisition means which acquires the operation information which shows the history of the processing which the external apparatus written in (2) performed.

本発明によれば、障害が発生した際に、障害の発生原因の特定を容易にすることができるという効果がある。   According to the present invention, when a failure occurs, it is possible to easily identify the cause of the failure.

本発明の第1の実施形態における情報記録装置の構成の一例を示すブロック図である。It is a block diagram which shows an example of a structure of the information recording device in the 1st Embodiment of this invention. 本発明の第1の実施形態における情報記録装置の動作を示すフローチャートである。It is a flowchart which shows operation | movement of the information recording device in the 1st Embodiment of this invention. 本発明の第1の実施形態における情報記録装置の処理手順の具体例を説明するためのシーケンス図である。It is a sequence diagram for demonstrating the specific example of the process sequence of the information recording device in the 1st Embodiment of this invention. 本発明の第2の実施形態における情報処理装置の構成の一例を示すブロック図である。It is a block diagram which shows an example of a structure of the information processing apparatus in the 2nd Embodiment of this invention. 本発明の第2の実施形態における情報処理装置のBIOSの正常時の動作を示す図である。It is a figure which shows operation | movement at the time of normal BIOS of the information processing apparatus in the 2nd Embodiment of this invention. 本発明の第2の実施形態における情報処理装置のBIOSトレースの具体例を説明するための図である。It is a figure for demonstrating the specific example of the BIOS trace of the information processing apparatus in the 2nd Embodiment of this invention. 本発明の第2の実施形態における情報処理装置のBIOSの詳細動作を示す図である。It is a figure which shows detailed operation | movement of BIOS of the information processing apparatus in the 2nd Embodiment of this invention. 本発明の第2の実施形態における情報処理装置のBMCファームウェアの動作を示す図である。It is a figure which shows operation | movement of the BMC firmware of the information processing apparatus in the 2nd Embodiment of this invention. 本発明の第2の実施形態における情報処理装置のSMIハンドラの動作を示す図である。It is a figure which shows operation | movement of the SMI handler of the information processing apparatus in the 2nd Embodiment of this invention. 本発明の第3の実施形態における情報処理装置のBMCファームウェアの動作を示す図である。It is a figure which shows operation | movement of the BMC firmware of the information processing apparatus in the 3rd Embodiment of this invention.

以下、本発明の実施形態について図面を参照して詳細に説明する。尚、すべての図面において、同等の構成要素には同じ符号を付し、適宜説明を省略する。
(第1の実施形態)
本実施形態の情報記録装置の構成について説明する。
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. In all the drawings, equivalent components are denoted by the same reference numerals, and description thereof will be omitted as appropriate.
(First embodiment)
The configuration of the information recording apparatus of this embodiment will be described.

図1は、本実施形態の情報記録装置100の構成の一例を示すブロック図である。   FIG. 1 is a block diagram showing an example of the configuration of the information recording apparatus 100 of the present embodiment.

本実施形態の情報記録装置100は、外部のコンピュータ等の、外部の情報処理装置200から、障害発生検出用信号140と動作情報記録信号150を入力する。そして、情報記録装置100は、動作情報記録信号150に含まれる動作情報を記録する、電子機器、又は他の電子機器に組み込まれる電子機器である。情報記録装置100は、情報処理装置200に接続される。   The information recording apparatus 100 of this embodiment receives a failure occurrence detection signal 140 and an operation information recording signal 150 from an external information processing apparatus 200 such as an external computer. The information recording apparatus 100 is an electronic device that records the operation information included in the operation information recording signal 150, or an electronic device incorporated in another electronic device. The information recording device 100 is connected to the information processing device 200.

情報記録装置100は、共有メモリ130と、障害検出手段110と、情報取得手段120とを含む。   The information recording apparatus 100 includes a shared memory 130, a failure detection unit 110, and an information acquisition unit 120.

共有メモリ130には、情報処理装置200から、データを書き込むことができる。すなわち、共有メモリ130は、情報記録装置100と情報処理装置200とに共有される記憶手段である。   Data can be written to the shared memory 130 from the information processing apparatus 200. That is, the shared memory 130 is a storage unit that is shared by the information recording apparatus 100 and the information processing apparatus 200.

障害検出手段110は、外部の情報処理装置からの障害発生検出用信号140を監視し、情報処理装置おける障害の発生を検出する。例えば、障害検出手段110は、所定の時間、障害発生検出用信号140の入力がない場合、情報処理装置200において障害が発生したものと判断する。あるいは、障害発生検出用信号140は、情報処理装置200が自身の障害の発生を示す信号であってもよい。例えば、情報処理装置200が内部にウォッチドッグタイマー(図示なし)を備える場合であれば、ウォッチドッグタイマーのタイムアウト出力信号を障害発生検出用信号140として使用することができる。この場合、障害検出手段110は、障害発生検出用信号140の受信を、情報処理装置200における障害の発生の通知と判断することができる。   The failure detection means 110 monitors a failure occurrence detection signal 140 from an external information processing device and detects the occurrence of a failure in the information processing device. For example, the failure detection unit 110 determines that a failure has occurred in the information processing apparatus 200 when the failure occurrence detection signal 140 is not input for a predetermined time. Alternatively, the failure occurrence detection signal 140 may be a signal indicating that the information processing apparatus 200 has caused its failure. For example, if the information processing apparatus 200 includes a watchdog timer (not shown) inside, the time-out output signal of the watchdog timer can be used as the failure occurrence detection signal 140. In this case, the failure detection unit 110 can determine that the reception of the failure occurrence detection signal 140 is a notification of failure occurrence in the information processing apparatus 200.

尚、情報処理装置200における障害とは、例えば、情報処理装置200のBIOSのストールである。   The failure in the information processing apparatus 200 is, for example, a BIOS stall of the information processing apparatus 200.

情報取得手段120は、情報処理装置200により共有メモリ130に書き込まれた動作情報を取得する。動作情報は、情報処理装置200が実行した各処理の順序を示す情報である。動作情報は、情報処理装置200の、プログラム、ハードウェア、CPU等の状態に関する情報等を更に含んでもよい。例えば、動作情報は、情報処理装置200により実行された処理を識別可能な時系列の情報である。処理識別情報とは、例えば、実行されたプログラムのアドレスである。動作情報としてのアドレスは、実行されたプログラムが格納されていたすべてのアドレスである必要はなく、分岐の前後のアドレス等のみに、適宜、省略されてもよい。処理識別情報は、識別子の時系列中の各識別子に関連付けられた時刻等の情報を更に含んでもよい。あるいは、処理識別情報は、実行された処理又は実行された処理のグループの、名前、番号、説明等であってもよい。   The information acquisition unit 120 acquires the operation information written in the shared memory 130 by the information processing apparatus 200. The operation information is information indicating the order of each process executed by the information processing apparatus 200. The operation information may further include information regarding the state of the information processing apparatus 200 such as a program, hardware, and CPU. For example, the operation information is time-series information that can identify the process executed by the information processing apparatus 200. The process identification information is, for example, the address of the executed program. The address as the operation information does not have to be all the addresses where the executed program is stored, and may be appropriately omitted only for the addresses before and after the branch. The process identification information may further include information such as time associated with each identifier in the identifier time series. Alternatively, the process identification information may be a name, a number, a description, or the like of an executed process or a group of executed processes.

情報取得手段120は、情報処理装置200がストールした場合にも、共有メモリ130に書き込まれたデータ動作情報を取得することができる。上記の通り、動作情報は情報処理装置200が実行した各処理の順序を示す情報なので、障害の発生原因の解析に用いることができる。尚、情報取得手段120は、取得した動作情報を、更に、出力装置、記憶装置、又は別の情報処理装置に出力してもよい。   The information acquisition unit 120 can acquire the data operation information written in the shared memory 130 even when the information processing apparatus 200 is stalled. As described above, since the operation information is information indicating the order of each process executed by the information processing apparatus 200, it can be used for analyzing the cause of the failure. The information acquisition unit 120 may further output the acquired operation information to an output device, a storage device, or another information processing device.

情報記録装置100は、内部にCPU(Central Processing Unit)と記憶手段を備えてもよい。そして、CPUが記憶手段に格納されたプログラムを実行することによって、障害検出手段110および情報取得手段120を実現してもよい。   The information recording apparatus 100 may include a CPU (Central Processing Unit) and storage means inside. Then, the failure detection unit 110 and the information acquisition unit 120 may be realized by the CPU executing a program stored in the storage unit.

次に、本実施形態の情報記録装置100の動作について説明する。   Next, the operation of the information recording apparatus 100 of this embodiment will be described.

図2は、情報記録装置100の動作を示すフローチャートである。   FIG. 2 is a flowchart showing the operation of the information recording apparatus 100.

情報記録装置100の障害検出手段110は、情報処理装置200からの障害発生検出用信号を監視する(ステップS11)。   The failure detection unit 110 of the information recording device 100 monitors a failure occurrence detection signal from the information processing device 200 (step S11).

障害検出手段110は、障害発生検出用信号に基づき、情報処理装置200における障害の発生の有無を判定する(ステップS12)。   The failure detection unit 110 determines whether or not a failure has occurred in the information processing apparatus 200 based on the failure occurrence detection signal (step S12).

情報処理装置200における障害の発生がなければ(ステップS12:No)、障害検出手段110は、ステップS11の処理に戻る。   If no failure occurs in the information processing apparatus 200 (step S12: No), the failure detection unit 110 returns to the process of step S11.

情報処理装置200における障害の発生があれば(ステップS12:Yes)、情報記録装置100の情報取得手段120は、情報処理装置200により共有メモリ130に書き込まれたデータを取得し(ステップS13)、処理を終了する。   If a failure occurs in the information processing apparatus 200 (step S12: Yes), the information acquisition unit 120 of the information recording apparatus 100 acquires the data written in the shared memory 130 by the information processing apparatus 200 (step S13). The process ends.

次に、本実施形態の情報記録装置200の処理手順の具体例について説明する。   Next, a specific example of the processing procedure of the information recording apparatus 200 of this embodiment will be described.

図3は、情報記録装置200の処理手順の具体例を説明するためのシーケンス図である。前述のように、障害発生検出用信号140は、情報処理装置200の障害発生の検出の有無に関係なく、定期的に情報処理装置200から出力されてもよい。あるいは、障害発生検出用信号140は、情報処理装置200に障害が発生したときのみ出力されてもよい。本具体例では、情報処理装置200は、自身の障害発生を検出したとき、障害発生検出用信号140を出力するものとしている。   FIG. 3 is a sequence diagram for explaining a specific example of the processing procedure of the information recording apparatus 200. As described above, the failure detection signal 140 may be periodically output from the information processing device 200 regardless of whether or not the failure of the information processing device 200 is detected. Alternatively, the failure occurrence detection signal 140 may be output only when a failure occurs in the information processing apparatus 200. In this specific example, the information processing apparatus 200 outputs a failure occurrence detection signal 140 when it detects the occurrence of its own failure.

情報処理装置200上のプログラムは、適宜、共有メモリ130に動作情報を書き込む(ステップS81−82)。   The program on the information processing device 200 writes operation information to the shared memory 130 as appropriate (steps S81-82).

共有メモリ130には、動作情報が書き込まれる(ステップS91−92)。   Operation information is written in the shared memory 130 (steps S91-92).

情報記録装置100の障害検出手段110は、情報処理装置200からの障害発生検出用信号を監視する(ステップS11)。障害発生検出用信号140が、定期的に情報処理装置200から出力される場合は、障害検出手段110は、本処理を繰り返せばよい。   The failure detection unit 110 of the information recording device 100 monitors a failure occurrence detection signal from the information processing device 200 (step S11). When the failure occurrence detection signal 140 is periodically output from the information processing apparatus 200, the failure detection unit 110 may repeat this process.

情報処理装置200において障害が発生し、情報処理装置200は障害発生検出用信号140を出力する(ステップS83)。   A failure occurs in the information processing apparatus 200, and the information processing apparatus 200 outputs a failure occurrence detection signal 140 (step S83).

情報記録装置100の障害検出手段110は、情報処理装置200から障害発生検出用信号140を受信すると、情報処理装置200において障害が発生したものと判断する(ステップS12:Yes)。   Upon receiving the failure occurrence detection signal 140 from the information processing apparatus 200, the failure detection unit 110 of the information recording apparatus 100 determines that a failure has occurred in the information processing apparatus 200 (step S12: Yes).

情報処理装置200が、定期的に障害発生検出用信号140を出力する場合は、障害検出手段110は、障害発生検出用信号140を一定時間、受信をしないときに、情報処理装置200において障害が発生したものと判断すればよい。   When the information processing device 200 periodically outputs the failure occurrence detection signal 140, the failure detection unit 110 detects that the failure has occurred in the information processing device 200 when the failure occurrence detection signal 140 is not received for a certain period of time. It may be determined that it has occurred.

情報記録装置100の情報取得手段120は、情報処理装置200により共有メモリ130に書き込まれた動作情報を取得する(ステップS13)。   The information acquisition unit 120 of the information recording device 100 acquires the operation information written in the shared memory 130 by the information processing device 200 (step S13).

共有メモリ130は、情報記録装置100に動作情報を返す(ステップS93)。   The shared memory 130 returns operation information to the information recording device 100 (step S93).

以上説明したように、本実施形態の情報記録装置100では、障害検出手段110は情報処理装置200の障害を検出し、情報取得手段120は共有メモリ130に記録された情報処理装置200の動作に関する情報を取得する。つまり、情報処理装置200に障害が発生した際に、情報処理装置200の障害の発生原因の特定に役立つ、共有メモリ130に記録された情報処理装置200の動作に関する情報を取得することができる。従って、情報記録装置100には、障害が発生した際に、障害の発生原因の特定を容易にするという効果がある。   As described above, in the information recording apparatus 100 of this embodiment, the failure detection unit 110 detects a failure of the information processing apparatus 200, and the information acquisition unit 120 relates to the operation of the information processing apparatus 200 recorded in the shared memory 130. Get information. That is, when a failure occurs in the information processing apparatus 200, information regarding the operation of the information processing apparatus 200 recorded in the shared memory 130 that is useful for identifying the cause of the failure of the information processing apparatus 200 can be acquired. Therefore, the information recording apparatus 100 has an effect of facilitating identification of the cause of the failure when the failure occurs.

尚、本実施形態では、情報記録装置100が情報処理装置200から独立した装置である場合について説明した。しかしながら、本実施形態の情報記録装置100は、必ずしも情報処理装置200から分離された単独の装置に限定されない。情報記録装置100は、情報処理装置200と統合された複合的な装置であってもよい。
(第2の実施形態)
本発明の情報記録装置の例として、情報記録装置であるBMCが組み込まれた情報処理装置の例を第2の実施形態として示す。尚、第1の実施形態の情報記録装置100の障害検出手段110及び情報取得手段120は、本実施形態においては、BMCファームウェアが有する機能として実装される。
In the present embodiment, the case where the information recording apparatus 100 is an apparatus independent of the information processing apparatus 200 has been described. However, the information recording apparatus 100 of this embodiment is not necessarily limited to a single apparatus separated from the information processing apparatus 200. The information recording apparatus 100 may be a composite apparatus integrated with the information processing apparatus 200.
(Second Embodiment)
As an example of the information recording apparatus of the present invention, an example of an information processing apparatus incorporating a BMC as an information recording apparatus will be described as a second embodiment. In the present embodiment, the failure detection unit 110 and the information acquisition unit 120 of the information recording apparatus 100 according to the first embodiment are implemented as functions of the BMC firmware.

「BMC(Baseboard Management Controller)」とは、情報処理装置の管理用のプロセッサ(チップセット)である。BMCは、通常、情報処理装置本体とは独立した電源を有し、情報処理装置のハードウェアの状態の監視、記録等を行う。BMCの標準仕様は、IPMI(Intelligent Platform Management Interface)として規定されている。   “BMC (Baseboard Management Controller)” is a processor (chip set) for managing information processing apparatuses. The BMC usually has a power source independent of the information processing apparatus main body, and monitors and records the hardware status of the information processing apparatus. The standard specification of BMC is defined as IPMI (Intelligent Platform Management Interface).

本実施形態の情報記録装置105の構成について説明する。   A configuration of the information recording apparatus 105 of the present embodiment will be described.

図4は、情報処理装置105の構成の一例を示すブロック図である。   FIG. 4 is a block diagram illustrating an example of the configuration of the information processing apparatus 105.

情報処理装置105は、CPU160と、PCH170と、BMC180と、メモリ190と、共有メモリ135とを含む。   The information processing apparatus 105 includes a CPU 160, a PCH 170, a BMC 180, a memory 190, and a shared memory 135.

CPU160上で動作するファームウェアを「BIOS」という。BMC180上で動作するファームウェアを「BMCファームウェア」という。   Firmware that operates on the CPU 160 is referred to as “BIOS”. Firmware that operates on the BMC 180 is referred to as “BMC firmware”.

「PCH」とは、周辺I/O(Input/Output)制御用のプロセッサである。PCHは、「I/Oハブ」、「I/Oコントローラーハブ」、「ICH」、「プラットフォームコントローラーハブ」、「サウスブリッジ」ともいわれる。   “PCH” is a processor for peripheral I / O (Input / Output) control. The PCH is also referred to as “I / O hub”, “I / O controller hub”, “ICH”, “platform controller hub”, and “south bridge”.

BIOSは、情報処理装置105の電源が投入されると、CPU160、PCH170、メモリ190、およびCPU160のその他の周辺ハードウェア(図示なし)等のハードウェア(以降、これらをまとめて「周辺ハードウェア」という。)の初期化処理を実行する。BIOSは、周辺ハードウェアの初期化処理の終了後に、付加機能の初期化処理を実行する。付加機能の初期化処理は、SMIハンドラの初期化処理を含む。   When the information processing apparatus 105 is powered on, the BIOS collects hardware such as the CPU 160, the PCH 170, the memory 190, and other peripheral hardware (not shown) of the CPU 160 (hereinafter referred to as “peripheral hardware”. )) Is executed. The BIOS executes the initialization process of the additional function after the initialization process of the peripheral hardware is completed. The additional function initialization process includes an SMI handler initialization process.

「SMI(System Management Interrupt)」とは、システム管理のために使用される割り込みである。SMIは、ハードウェアエミュレーション等の拡張機能を提供するためにも使用される。   “SMI (System Management Interrupt)” is an interrupt used for system management. SMI is also used to provide extended functions such as hardware emulation.

SMIハンドラは、BIOSの機能の一部で、SMIを処理するプログラムである。SMIハンドラは、BIOS、BMCファームウェア、又は周辺ハードウェアからの割り込みを契機として起動される。SMIハンドラは、BIOSが通常使用するメモリ190とは別の共有メモリ135を使用して動作する。そのため、SMIハンドラの動作は、BIOSがストールしているか否かには影響を受けない。   The SMI handler is a part of the BIOS function and is a program for processing the SMI. The SMI handler is activated in response to an interrupt from the BIOS, BMC firmware, or peripheral hardware. The SMI handler operates using a shared memory 135 different from the memory 190 normally used by the BIOS. Therefore, the operation of the SMI handler is not affected by whether or not the BIOS is stalled.

BMC180は、情報処理装置105がストールしているか否かを監視する。ストールの監視は、IPMIにおけるWatchdog Timerコマンドを用いて実行される。BIOSは、POST(Power On Self Test)を開始するときにWatchdog Timerコマンドでタイマーをセットし、POSTを完了するときにWatchdog Timerコマンドでタイマーをリセットする。BMC180は、予め決められた時間内でWatchdog Timerがリセットされない場合に、BIOSがストールしたものと判断する。Watchdog Timerコマンドによる監視機能の詳細はIntelligent Platform management Interface Specificationで定義される業界標準の仕様であるため、本書では説明しない。   The BMC 180 monitors whether the information processing apparatus 105 is stalled. Stall monitoring is executed using a Watchdog Timer command in IPMI. The BIOS sets a timer with the Watchdog Timer command when starting POST (Power On Self Test), and resets the timer with the Watchdog Timer command when completing POST. The BMC 180 determines that the BIOS has stalled when the Watchdog Timer is not reset within a predetermined time. The details of the monitoring function using the Watchdog Timer command are industry standard specifications defined in the Intelligent Platform management Interface Specification, and are not described in this document.

メモリ190はCPU160が使用するメインメモリであり、共有メモリ135はBMC180が使用するメインメモリである。   The memory 190 is a main memory used by the CPU 160, and the shared memory 135 is a main memory used by the BMC 180.

BIOSは、PCH170、BMC180を介して、BMC180のメインメモリである共有メモリ135にMMIO(Memory-Mapped I/O)アクセスすることができる。共有メモリ135は、BIOSとBMCファームウェアの両方がアクセスできるメモリである。BIOSトレース及びCPUログは、共有メモリ135を用いて保持される。BIOSは、共有メモリ135内に確保された2つの領域、BIOSトレース領域及びCPUログ領域に書き込みを行う。   The BIOS can make MMIO (Memory-Mapped I / O) access to the shared memory 135 that is the main memory of the BMC 180 via the PCH 170 and the BMC 180. The shared memory 135 is a memory that can be accessed by both BIOS and BMC firmware. The BIOS trace and CPU log are held using the shared memory 135. The BIOS writes in two areas reserved in the shared memory 135, the BIOS trace area and the CPU log area.

BMCファームウェアは、BMCファームウェアがBIOSのストールを検知したとき、粒度が異なる2種類のBIOSトレースを採取する。1つはBIOSが実行した処理の概要を示す粒度のBIOSトレース(以降、「概要BIOSトレース」という。)である。他の1つはBIOSが障害発生の直前に実行していた処理の詳細を示す粒度のBIOSトレース(以降、「詳細BIOSトレース」という。)である。   When the BMC firmware detects a BIOS stall, the BMC firmware collects two types of BIOS traces having different granularities. One is a BIOS trace having a granularity indicating an outline of processing executed by the BIOS (hereinafter referred to as “summary BIOS trace”). The other is a BIOS trace having a granularity indicating details of processing executed by the BIOS immediately before the occurrence of the failure (hereinafter referred to as “detailed BIOS trace”).

概要BIOSトレースには、BIOSがストールするまでにBIOSが実行した処理の履歴が記録される。概要BIOSトレースにおいて、処理の履歴は機能単位で記録される。概要BIOSトレースは、実行した機能のロードアドレスやエラーの情報を更に含んでもよい。   The overview BIOS trace records a history of processes executed by the BIOS until the BIOS stalls. In the overview BIOS trace, the processing history is recorded in units of functions. The summary BIOS trace may further include information on the load address and error of the executed function.

詳細BIOSトレースには、BIOSがストールする直前に実行した処理の履歴が記録される。詳細BIOSトレースにおいて、処理の履歴は機能単位が更に細分割された単位(例えば、ソースコードと照らし合わせてBIOSが実行した処理が詳細に分かる単位)で記録される。   The detailed BIOS trace records a history of processing executed immediately before the BIOS stalls. In the detailed BIOS trace, the processing history is recorded in a unit in which the functional unit is further subdivided (for example, a unit in which the processing executed by the BIOS in comparison with the source code is known in detail).

BIOSは、BMCファームウェアがSMIを発生させたことを契機として、CPUログを採取する。採取されるCPUログには、CPUのレジスタ情報等、内部状態や、CPUが実行したプログラムのアドレス、BIOSの設定情報等が含まれる。   The BIOS collects a CPU log when the BMC firmware generates an SMI. The collected CPU log includes an internal state such as CPU register information, an address of a program executed by the CPU, and BIOS setting information.

その他の構成要素については、第1の実施形態と同じである。   Other components are the same as those in the first embodiment.

次に、本実施形態情報処理装置105の動作について説明する。   Next, the operation of the information processing apparatus 105 according to the present embodiment will be described.

図5は、情報処理装置105のBIOSの正常時の動作を示す図である。   FIG. 5 is a diagram illustrating an operation when the BIOS of the information processing apparatus 105 is normal.

まず、BIOSは、情報処理装置105の電源が投入されると、SMIハンドラを初期化する(ステップS22)。SMIハンドラの初期化では、BIOSが、SMIの発生を契機としてCPUログの採取を行うSMIハンドラの初期設定を行う。   First, when the information processing apparatus 105 is powered on, the BIOS initializes the SMI handler (step S22). In the initialization of the SMI handler, the BIOS initializes the SMI handler that collects the CPU log when the SMI occurs.

次に、BIOSは、ある機能(機能1、機能2、機能N)に属する処理を実行する(ステップS23、S24、S25)。各機能(機能1、機能2、機能N)に属する各処理の実行中に、BIOSは、必要に応じて概要BIOSトレース又は詳細BIOSトレースに各処理の履歴を記録する。   Next, the BIOS executes processing belonging to a certain function (function 1, function 2, function N) (steps S23, S24, S25). During execution of each process belonging to each function (function 1, function 2, function N), the BIOS records the history of each process in the summary BIOS trace or the detailed BIOS trace as necessary.

図6は、情報処理装置105のBIOSトレースの具体例を説明するための図である。   FIG. 6 is a diagram for explaining a specific example of the BIOS trace of the information processing apparatus 105.

BIOSトレースとは、BIOSの処理が行われた時刻、及びBIOSの処理を表すコードを含む情報で、BMC180が持つ共有メモリ135に書き込まれる。BIOSトレースには、上記のように、概要BIOSトレースと、詳細BIOSトレースとの2種類がある。   The BIOS trace is information including the time when the BIOS processing is performed and a code representing the BIOS processing, and is written in the shared memory 135 of the BMC 180. As described above, there are two types of BIOS traces: a general BIOS trace and a detailed BIOS trace.

2種類のBIOSトレースが保持される領域(BIOSトレース領域)は、共有メモリ135上に個別にマッピングされる。2種類のBIOSトレース領域の、フォーマット及び使い方は、両方のBIOSトレースで同じである。   An area (BIOS trace area) where two types of BIOS traces are held is individually mapped on the shared memory 135. The format and usage of the two types of BIOS trace areas are the same for both BIOS traces.

まず、BIOSトレース領域のフォーマットについて説明する。BIOSトレース領域は、図6(1)に示されるように、ヘッダ部とデータ部とを含む。   First, the format of the BIOS trace area will be described. The BIOS trace area includes a header part and a data part as shown in FIG.

ヘッダ部は、“Signature”、“Max Entry Number”、“Write Pointer”の3つの領域を含む。   The header part includes three areas of “Signature”, “Max Entry Number”, and “Write Pointer”.

領域“Signature”には、16バイトまでの文字列が格納される。図6(2)の使用例では、領域“Signature”には、文字列“BIOSTRC\0”が格納されている。領域“Signature”に格納された文字列に基づいて、BIOSトレースの領域が有効であるか否かを判定する。   In the region “Signature”, a character string of up to 16 bytes is stored. In the usage example of FIG. 6B, the character string “BIOSTRC \ 0” is stored in the area “Signature”. Based on the character string stored in the area “Signature”, it is determined whether the area of the BIOS trace is valid.

領域“Max Entry Number”は8バイトのデータ長を有し、BIOSトレース領域に残すことができるエントリ(処理の履歴の格納場所)の最大数(最大エントリ数)を示す。図6(2)の使用例では、値“400h”(=1024)が格納されており、最大1024個の処理の履歴を格納することができる。   The area “Max Entry Number” has a data length of 8 bytes, and indicates the maximum number (maximum number of entries) of entries (processing history storage locations) that can be left in the BIOS trace area. In the usage example of FIG. 6B, the value “400h” (= 1024) is stored, and a history of a maximum of 1024 processes can be stored.

領域“Write Pointer”は8バイトのデータ長を有し、何個目のエントリに次の処理の履歴を書き込むかを示す番号である。領域“Write Pointer”は、BIOSトレースのエントリとして処理の履歴が1つ書き込まれる度に、1つ増加される。領域“Write Pointer”の値+1が最大エントリ数に達した場合は、領域“Write Pointer”の値を0に戻す。図6(2)では、領域“Max Entry Number”の値が“1024”(400h)なので、領域“Write Pointer”の値は、“1023”個目のエントリへの書き込みが終了すると“0”に戻される。また、図6(2)では、領域“Write Pointer”の値は“0001h”なので、次回の処理の履歴は、“0001h”個目のエントリに上書きされる。   The area “Write Pointer” has a data length of 8 bytes, and is a number indicating to which entry the history of the next process is written. The area “Write Pointer” is incremented by one each time a processing history is written as a BIOS trace entry. When the value “+1” of the area “Write Pointer” reaches the maximum number of entries, the value of the area “Write Pointer” is returned to zero. In FIG. 6B, since the value of the area “Max Entry Number” is “1024” (400h), the value of the area “Write Pointer” is set to “0” when the writing to the “1023” -th entry is completed. Returned. In FIG. 6B, since the value of the area “Write Pointer” is “0001h”, the history of the next process is overwritten on the “0001h” -th entry.

データ部について説明する。図6(1)に示すように、1つのエントリは、8バイトの処理の履歴を記録した日時(領域“Data/Time”)と、8バイトの処理コード(領域“Code”)を含む。   The data part will be described. As shown in FIG. 6A, one entry includes the date and time (area “Data / Time”) when an 8-byte processing history is recorded, and an 8-byte processing code (area “Code”).

領域“Data/Time”には、処理の履歴を記録した日時を記録する。図6(2)の“Entry0000”は、2013年9月19日10時に記録されたことを示す。   In the area “Data / Time”, the date and time when the processing history is recorded is recorded. “Entry0000” in FIG. 6B indicates that it was recorded at 10:00 on September 19, 2013.

領域“Code”は、処理コードを示す。上位1バイトで処理に対応する機能を示し、残りのバイトで処理の内容を示す。処理の内容を表すコードは、処理に対応する機能毎に定義され、処理に対応する機能内で一意に決まる。   An area “Code” indicates a processing code. The upper 1 byte indicates the function corresponding to the process, and the remaining bytes indicate the contents of the process. A code representing the content of the process is defined for each function corresponding to the process, and is uniquely determined in the function corresponding to the process.

図7は、本実施形態の情報処理装置105のBIOSの詳細動作を示す図である。図7の処理は、図5の機能1−Nに対する各処理(ステップS23−S25)に対応する。図7では、各処理において、BIOSトレースの処理の履歴が記録されるタイミングについて説明する。   FIG. 7 is a diagram illustrating a detailed operation of the BIOS of the information processing apparatus 105 according to the present embodiment. The process of FIG. 7 corresponds to each process (steps S23 to S25) for the function 1-N of FIG. FIG. 7 describes the timing at which the history of BIOS trace processing is recorded in each processing.

BIOSは、概要BIOSトレース1を記録する(ステップS31)。概要BIOSトレースはBIOSが実行した機能の概要が分かるように記録することが目的なので、BIOSは特定の機能(例えば、“機能1”)の実行開始直後に処理の履歴を記録する。また、エラーが起きた場合、BIOSはエラーの内容を記録する。   The BIOS records the summary BIOS trace 1 (step S31). Since the purpose of the outline BIOS trace is to record the outline of the function executed by the BIOS, the BIOS records the processing history immediately after the execution of a specific function (for example, “function 1”). If an error occurs, the BIOS records the error content.

ステップS32、S34、S36は、特定の機能内における一連の処理を示す。一連の処理とは、例えば、“機能1”の処理として順次実行される、3つの内部処理、“処理1”、“処理2”、“処理3”である。   Steps S32, S34, and S36 show a series of processes within a specific function. The series of processes includes, for example, three internal processes, “Process 1”, “Process 2”, and “Process 3”, which are sequentially executed as “Function 1” processes.

ステップS33、S35、S37は、詳細BIOSトレースの記録を示す。詳細BIOSトレースで記録される内容及び方式は、ステップS31における概要BIOSトレースで記録する内容及び方式と同じである。詳細BIOSトレースはBIOSが実行した処理がソースコードレベルで分かるように記録することが目的なので、処理の履歴は関数の実行直後やソースコードの分岐直後に記録される。このように記録することで、詳細BIOSトレースから、BIOSがソースコードにおいてどの経路に対応する処理を実行したのかが判別可能になる。   Steps S33, S35, and S37 show recording of a detailed BIOS trace. The contents and method recorded in the detailed BIOS trace are the same as the contents and method recorded in the overview BIOS trace in step S31. Since the detailed BIOS trace is intended to record the process executed by the BIOS so that it can be understood at the source code level, the history of the process is recorded immediately after the execution of the function or immediately after the branch of the source code. By recording in this way, it becomes possible to determine which path the BIOS has executed in the source code from the detailed BIOS trace.

次に、異常時(BIOSストール発生時)のBMCファームウェアの動作について説明する。図5のステップS24の後に、何らかの原因でBIOSのストールが発生した場合について説明する。   Next, the operation of the BMC firmware at the time of abnormality (when a BIOS stall occurs) will be described. A case where a BIOS stall occurs for some reason after step S24 of FIG. 5 will be described.

図8は、本実施形態の情報処理装置のBMCファームウェアの動作を示す図である。   FIG. 8 is a diagram illustrating the operation of the BMC firmware of the information processing apparatus according to the present embodiment.

BMCファームウェアは、Watchdog Timerにより、BIOSがストールしたことを検知する(ステップS41)。   The BMC firmware detects that the BIOS has stalled by the Watchdog Timer (step S41).

BMCファームウェアは、共有メモリ135に保持される、概要BIOSトレース及び詳細BIOSトレースをファイルに保存する(ステップS42)。   The BMC firmware saves the general BIOS trace and the detailed BIOS trace held in the shared memory 135 in a file (step S42).

BMCファームウェアは、BIOSによるCPUログ採取を起動するために、SMIを発生させる(ステップS43)。SMIが発生した後のBIOSの動作については、後述する(図9)。   The BMC firmware generates an SMI in order to activate CPU log collection by the BIOS (step S43). The operation of the BIOS after the occurrence of SMI will be described later (FIG. 9).

BMCファームウェアは、BIOSが採取したCPUログを、受信する(ステップS44)。   The BMC firmware receives the CPU log collected by the BIOS (step S44).

BMCファームウェアは、ステップS42と同じ方法で、再度BIOSトレースを採取する(ステップS45)。再度のBIOSトレースの採取は、CPUログ採取中のBIOSの処理の履歴を取得するために行われる。   The BMC firmware collects the BIOS trace again by the same method as step S42 (step S45). The collection of the BIOS trace again is performed in order to acquire the history of the BIOS processing during the CPU log collection.

BMCファームウェアは、情報処理装置105の電源切断を実行する(ステップS46)。   The BMC firmware executes power-off of the information processing apparatus 105 (step S46).

最後に、SMIハンドラの処理について説明する。   Finally, the processing of the SMI handler will be described.

図9は、本実施形態の情報処理装置105のSMIハンドラの動作を示す図である。   FIG. 9 is a diagram illustrating the operation of the SMI handler of the information processing apparatus 105 according to the present embodiment.

BIOSのSMIハンドラは、図8のステップS43でBMCファームウェアが発生させたSMIを、受信する(ステップS51)。   The SMI handler of the BIOS receives the SMI generated by the BMC firmware in step S43 in FIG. 8 (step S51).

SMIハンドラは、SMIの要因をBMCファームウェアへIPMIコマンドを発行することにより取得し、SMIの要因がCPUログの採取であるか否かを判定する(ステップS52)。尚、SMIの要因をBMCファームウェアから取得するためのコマンド(IPMIコマンド)は、IPMIにおいて定義されている。SMIが発生すると、SMIハンドラは、SMIの要因によって実行すべき処理を決定する。   The SMI handler acquires the SMI factor by issuing an IPMI command to the BMC firmware, and determines whether or not the SMI factor is collection of a CPU log (step S52). A command (IPMI command) for acquiring the SMI factor from the BMC firmware is defined in IPMI. When the SMI occurs, the SMI handler determines a process to be executed according to the SMI factor.

SMIの要因がCPUログ採取である場合には(ステップS52:Yes)、SMIハンドラは、CPUログを採取し(ステップS53)、採取したログをBMC180に送る(ステップS54)。   If the SMI factor is CPU log collection (step S52: Yes), the SMI handler collects the CPU log (step S53) and sends the collected log to the BMC 180 (step S54).

SMIの要因がCPUログ採取以外である場合には(ステップS52:No)、SMIハンドラはCPUログ採取を行わず、処理を終了する。   If the SMI factor is other than CPU log collection (step S52: No), the SMI handler does not collect CPU log and ends the process.

尚、ステップS53において、BIOSが採取するログは、例えば、CPUのレジスタ情報や実行アドレス情報、BIOSの設定情報である。   In step S53, the log collected by the BIOS is, for example, CPU register information, execution address information, and BIOS setting information.

更に尚、ステップS54におけるログの送信は、IPMIコマンドを用いて実行する。ログ送信用のIPMIコマンドは、ログ送信用に新たに定義される。   Furthermore, the log transmission in step S54 is executed using an IPMI command. The IPMI command for log transmission is newly defined for log transmission.

更に尚、ステップS51−S54の処理中にBIOSがストールすることも考えられる。そのため、概要BIOSトレースと詳細BIOSトレースの記録は停止せず、継続的に行われる。そして、SMIハンドラによる処理中にBIOSがストールした場合、BIOSはCPUログの採取を完了することができない。この場合、BMCファームウェアはBIOSのストールを検知し、BIOSトレースを採取した後、電源を切断する(図8のステップS45、S46)。   Furthermore, it is conceivable that the BIOS stalls during the processing of steps S51 to S54. Therefore, the recording of the summary BIOS trace and the detailed BIOS trace is continuously performed without being stopped. If the BIOS stalls during processing by the SMI handler, the BIOS cannot complete the collection of the CPU log. In this case, the BMC firmware detects a BIOS stall, collects a BIOS trace, and then turns off the power (steps S45 and S46 in FIG. 8).

以上説明したように、本実施形態の情報処理装置105は、BMCファームウェアがBIOSのストールを検出した場合に、BIOSトレースとCPUログを採取する。BIOSトレースには、ソースコードと照らし合わせてBIOSが実行した処理を詳細に示すように記録される。従って、情報処理装置105では、障害が発生した際の障害の発生原因の特定を容易にするという効果がある。   As described above, the information processing apparatus 105 according to the present embodiment collects a BIOS trace and a CPU log when the BMC firmware detects a BIOS stall. The BIOS trace is recorded so as to show in detail the processing executed by the BIOS against the source code. Therefore, the information processing apparatus 105 has an effect of facilitating identification of the cause of the failure when the failure occurs.

また、本実施形態の情報処理装置105は、2種類の粒度のBIOSトレースを記録する。従って、情報処理装置105では、BIOS処理の全体の流れと、BIOSの詳細な動きを掴むことが容易であるという効果がある。   Further, the information processing apparatus 105 according to the present embodiment records two types of granularity BIOS traces. Therefore, the information processing apparatus 105 has an effect that it is easy to grasp the entire flow of the BIOS processing and the detailed movement of the BIOS.

また、本実施形態の情報処理装置105のBMCファームウェアは、BIOSのストールを検出すると、SMIを発生させてBIOSが採取するCPUのログ情報を収集する。CPUのログ情報には、BIOSのストール時のCPUのレジスタ情報や実行アドレス、BIOSの設定情報が含まれる。従って、情報処理装置105では、ストールの発生原因を速やかに特定することができるという効果がある。   When the BMC firmware of the information processing apparatus 105 according to the present embodiment detects a BIOS stall, the BMC firmware generates SMI and collects log information of the CPU collected by the BIOS. The CPU log information includes CPU register information, execution address, and BIOS setting information when the BIOS is stalled. Therefore, the information processing apparatus 105 has an effect that the cause of the stall can be quickly identified.

更に、情報処理装置105では、BIOSトレース及びSMIハンドラで採取したCPUログを合わせて解析することで、ストールするまでの動作及び、ストール時のBIOSの状況を多面的に把握できる。従って、情報処理装置105では、ストール原因の詳細な分析が可能という効果がある。   Further, the information processing apparatus 105 can analyze the BIOS trace and the CPU log collected by the SMI handler together to understand the operation until the stall and the status of the BIOS at the time of stall. Therefore, the information processing apparatus 105 has an effect that detailed analysis of the cause of the stall is possible.

尚、情報処理装置105が備えるべき最小の構成は、図4に示した構成である。CPU、PCH、BMC、又はメモリの、個数又は実装方法は限定されない。情報処理装置105は、CPU、PCH、BMCと同様の機能を持つ他の構成要素であれば、それぞれ、CPU、PCH、BMCの代わりに構成要素として含んでもよい。   The minimum configuration that the information processing apparatus 105 should have is the configuration shown in FIG. The number or mounting method of the CPU, PCH, BMC, or memory is not limited. The information processing apparatus 105 may include other components having functions similar to those of the CPU, PCH, and BMC, as components instead of the CPU, PCH, and BMC, respectively.

また、情報処理装置105が有するBIOSトレースが含む情報は、CPUのレジスタ情報や及び命令ポインタ実行アドレス情報、BIOSの設定情報に限定されない。   Further, the information included in the BIOS trace included in the information processing apparatus 105 is not limited to CPU register information, instruction pointer execution address information, and BIOS setting information.

また、BIOSトレースの種類、目的、フォーマット、記録されるデータは図6に示された具体例に限定されない。   Further, the type, purpose, format, and recorded data of the BIOS trace are not limited to the specific example shown in FIG.

また、BIOSは、BMCファームウェアに対して、BIOSトレースの採取を指示してもよい。BIOSによるBMCファームウェアに対するBIOSトレースの採取指示は、IPMIコマンドや割り込み等を利用して、実現されてもよい。BIOSによりBIOSトレース採取を指示されたBMCファームウェアは、図8のステップS42と同じ方法で、BIOSトレースを採取してもよい。
(第3の実施形態)
BMCファームウェアが検出する異常はBIOSストールに限定されない。例えば、BIOSが異常を検出して情報処理装置のリセットを指示する場合にも本発明を適用できる。本発明の情報記録装置の例として、BIOSによるリセット指示を障害として検出する情報記録装置の例を第3の実施形態として示す。
Also, the BIOS may instruct the BMC firmware to collect a BIOS trace. The BIOS trace collection instruction to the BMC firmware by the BIOS may be realized using an IPMI command, an interrupt, or the like. The BMC firmware instructed to collect the BIOS trace by the BIOS may collect the BIOS trace by the same method as step S42 in FIG.
(Third embodiment)
The abnormality detected by the BMC firmware is not limited to the BIOS stall. For example, the present invention can also be applied to a case where the BIOS detects an abnormality and gives an instruction to reset the information processing apparatus. As an example of the information recording apparatus of the present invention, an example of an information recording apparatus that detects a reset instruction by BIOS as a failure is shown as a third embodiment.

「リセット」とは、コンピュータ等の情報処理装置を強制的に再起動することである。リセットは、情報処理装置がハードウェアの異常等の原因で制御不能になった場合に再起動するために行われる。リセットにより、情報処理装置は電源投入時と同じ状態になり、再び使用可能になる。以下では、BMCファームウェアが、情報処理装置のリセット指示を受け取って、情報処理装置のリセットを実行する場合について説明する。   “Reset” is to forcibly restart an information processing apparatus such as a computer. The reset is performed in order to restart the information processing apparatus when it becomes uncontrollable due to a hardware abnormality or the like. By resetting, the information processing apparatus is in the same state as when the power is turned on, and can be used again. In the following, a case where the BMC firmware receives a reset instruction for the information processing apparatus and executes a reset of the information processing apparatus will be described.

BMCファームウェアがBIOSのリセット指示を検出する情報処理装置の例を第3の実施形態として示す。   An example of an information processing apparatus in which the BMC firmware detects a BIOS reset instruction will be described as a third embodiment.

本実施形態の情報処理装置106構成について説明する。   The configuration of the information processing apparatus 106 according to this embodiment will be described.

情報処理装置106の構成は、第2の実施形態の情報処理装置105の構成と同じである。   The configuration of the information processing apparatus 106 is the same as the configuration of the information processing apparatus 105 of the second embodiment.

次に、情報処理装置106動作について説明する。   Next, the operation of the information processing apparatus 106 will be described.

情報処理装置106のBMCファームウェアの動作は、第2の実施形態の情報処理装置105のBMCファームウェアの動作と異なる。   The operation of the BMC firmware of the information processing apparatus 106 is different from the operation of the BMC firmware of the information processing apparatus 105 of the second embodiment.

情報処理装置106のその他の構成要素の動作は、第2の実施形態の情報処理装置105のその他の構成要素の動作と同じである。   The operations of the other components of the information processing apparatus 106 are the same as the operations of the other components of the information processing apparatus 105 of the second embodiment.

図10は、情報処理装置106のBMCファームウェアの動作を示す図である。   FIG. 10 is a diagram illustrating the operation of the BMC firmware of the information processing apparatus 106.

本実施形態のBMCファームウェアは、BIOSによるBMCファームウェアに対するリセット指示を検出する(ステップS61)。   The BMC firmware of this embodiment detects a reset instruction for the BMC firmware by the BIOS (step S61).

BMCファームウェアは、2種類のBIOSトレース(概要BIOSトレース及び詳細BIOSトレース)を採取する(ステップS62)。   The BMC firmware collects two types of BIOS traces (outline BIOS trace and detailed BIOS trace) (step S62).

BMCファームウェアは、情報処理装置106のリセットを実行する(ステップS63)。   The BMC firmware executes a reset of the information processing apparatus 106 (step S63).

以上説明したように、本実施形態の情報処理装置106のBMCファームウェアは、リセットを実行する前にBIOSトレースを採取する。すなわち、情報処理装置106は、リセットを実行する直前のBIOSの処理の履歴を記録することができる。つまり、BIOSの処理の履歴を分析することにより、BIOSのリセット指示が発生した際に、BIOSのリセットが必要になった原因を判別することができる。従って、情報処理装置106では、障害が発生した際に、障害の発生原因の特定を容易にすることができるという効果がある。   As described above, the BMC firmware of the information processing apparatus 106 according to the present embodiment collects the BIOS trace before executing the reset. That is, the information processing apparatus 106 can record a history of BIOS processing immediately before executing the reset. In other words, by analyzing the history of BIOS processing, it is possible to determine the cause of the necessity for BIOS reset when a BIOS reset instruction is issued. Therefore, the information processing apparatus 106 has an effect that when a failure occurs, it is possible to easily identify the cause of the failure.

尚、図2、5、7、8、9、10の情報記録装置の各処理は、ソフトウェアによって実行されてもよい。すなわち、各処理を行うためのコンピュータプログラムが、情報記録装置が備えるCPU(図2:13)によって読み込まれ、実行されてもよい。プログラムを用いて各処理を行っても、上述の実施形態の処理と同内容の処理を行うことができる。そして、上記のプログラムは、ROM(Read Only Memory)、RAM(Random Access Memory)、フラッシュメモリ等の半導体記憶装置、光ディスク、磁気ディスク、光磁気ディスク等、非一時的な媒体に格納されてもよい。   Each process of the information recording apparatus of FIGS. 2, 5, 7, 8, 9, and 10 may be executed by software. That is, a computer program for performing each process may be read and executed by a CPU (FIG. 2:13) provided in the information recording apparatus. Even if each process is performed using a program, the same process as the process of the above-described embodiment can be performed. The above program may be stored in a non-transitory medium such as a ROM (Read Only Memory), a RAM (Random Access Memory), a semiconductor memory device such as a flash memory, an optical disk, a magnetic disk, or a magneto-optical disk. .

あるいは、各処理は、個別の回路等の構成要素によって実行されてもよい。   Alternatively, each process may be executed by a component such as an individual circuit.

尚、本願発明は、上述の実施形態に限定されるものではなく、本願発明の要旨を逸脱しない範囲で種々変更、変形して実施することができる。   In addition, this invention is not limited to the above-mentioned embodiment, It can implement in various changes and deformation | transformation in the range which does not deviate from the summary of this invention.

本発明の情報記録装置は、例えば、情報処理装置、サーバ等の、障害解析及び情報収集のために利用可能である。   The information recording apparatus of the present invention can be used for failure analysis and information collection, such as information processing apparatuses and servers.

140 障害発生検出用信号
150 動作情報記録信号
140 Fault occurrence detection signal 150 Operation information recording signal

Claims (9)

外部の装置による書き込みが可能な共有メモリ手段と、
前記外部の装置における障害の発生を検出する障害検出手段と、
前記外部の装置により前記共有メモリ手段に書き込まれた前記外部の装置が実行した処理の履歴を示す動作情報を取得する情報取得手段と、
を備えることを特徴とする情報記録装置。
Shared memory means writable by an external device;
Fault detection means for detecting the occurrence of a fault in the external device;
Information acquisition means for acquiring operation information indicating a history of processing executed by the external apparatus written in the shared memory means by the external apparatus;
An information recording apparatus comprising:
前記動作情報は、機能単位での処理の履歴を示す第1の動作情報と、機能が細分化された単位での処理の履歴を示す第2の動作情報とを含む
ことを特徴とする請求項1に記載の情報記録装置。
The operation information includes first operation information indicating a history of processing in units of functions and second operation information indicating a history of processing in units of divided functions. The information recording apparatus according to 1.
前記情報取得手段は、前記情報処理装置に指示して前記情報処理装置が有するCPU(Central Processing Unit)の内部状態またはプログラムの実行履歴を示す情報を更に取得する
ことを特徴とする請求項1又は2に記載の情報記録装置。
The information acquisition unit further instructs the information processing apparatus to further acquire information indicating an internal state of a CPU (Central Processing Unit) included in the information processing apparatus or an execution history of a program. 2. The information recording apparatus according to 2.
前記動作に関する情報は、前記情報処理装置のハードウェアの初期化を行うプログラムの動作記録である
ことを特徴とする請求項1乃至3のいずれか1項に記載の情報記録装置。
The information recording apparatus according to claim 1, wherein the information related to the operation is an operation record of a program for initializing hardware of the information processing apparatus.
前記障害検出手段は、前記障害の発生として、前記情報処理装置のBIOSのストールを検出する
ことを特徴とする請求項1乃至4のいずれか1項に記載の情報記録装置。
The information recording apparatus according to claim 1, wherein the failure detection unit detects a BIOS stall of the information processing apparatus as the occurrence of the failure.
前記障害検出手段は、前記障害の発生として、前記情報処理装置のBIOSからのリセット指示を検出する
ことを特徴とする請求項1乃至5のいずれか1項に記載の情報記録装置。
The information recording apparatus according to claim 1, wherein the failure detection unit detects a reset instruction from a BIOS of the information processing apparatus as the occurrence of the failure.
CPUと、
メモリと、
I/Oと、
前記I/Oを介した書き込みが可能な共有メモリ手段、障害の発生を前記I/Oを介して検出する障害検出手段、及び前記共有メモリ手段に書き込まれた動作情報を前記I/Oを介して取得する情報取得手段を有する情報記録装置と、
を備えることを特徴とする情報処理装置。
CPU,
Memory,
I / O,
Shared memory means capable of writing via the I / O, failure detecting means for detecting occurrence of a failure via the I / O, and operation information written to the shared memory means via the I / O An information recording device having information acquisition means for acquiring
An information processing apparatus comprising:
外部の装置における障害の発生を検出し、
前記外部の装置により共有メモリに書き込まれた前記外部の装置が実行した処理の履歴を示す動作情報を取得する
ことを特徴とする情報記録方法。
Detects the occurrence of failures in external devices,
An information recording method for acquiring operation information indicating a history of processing executed by the external device written in a shared memory by the external device.
外部の装置による書き込みが可能な共有メモリを備えた情報記録装置が備えるコンピュータを、
前記外部の装置における障害の発生を検出する障害検出手段と、
前記外部の装置により共有メモリに書き込まれた前記外部の装置が実行した処理の履歴を示す動作情報を取得する情報取得手段と、
して機能させるための情報記録プログラム。
A computer provided in an information recording device including a shared memory writable by an external device;
Fault detection means for detecting the occurrence of a fault in the external device;
Information acquisition means for acquiring operation information indicating a history of processing executed by the external device written in a shared memory by the external device;
Information recording program to make it function.
JP2014000794A 2014-01-07 2014-01-07 Information recording device, information processor, information recording method and information recording program Pending JP2015130023A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014000794A JP2015130023A (en) 2014-01-07 2014-01-07 Information recording device, information processor, information recording method and information recording program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014000794A JP2015130023A (en) 2014-01-07 2014-01-07 Information recording device, information processor, information recording method and information recording program

Publications (1)

Publication Number Publication Date
JP2015130023A true JP2015130023A (en) 2015-07-16

Family

ID=53760711

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014000794A Pending JP2015130023A (en) 2014-01-07 2014-01-07 Information recording device, information processor, information recording method and information recording program

Country Status (1)

Country Link
JP (1) JP2015130023A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019156062A1 (en) * 2018-02-07 2019-08-15 Necプラットフォームズ株式会社 Information processing system, information processing device, bios updating method for information processing device, and bios updating program for information processing device
JP2020154705A (en) * 2019-03-20 2020-09-24 Necプラットフォームズ株式会社 Information processing device, failure monitoring method, and failure monitoring computer program

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05334138A (en) * 1992-06-03 1993-12-17 Hitachi Ltd Program maintenance information acquiring system
JP2003022201A (en) * 2001-07-06 2003-01-24 Mitsubishi Electric Corp Method for debugging program
JP2011159136A (en) * 2010-02-02 2011-08-18 Seiko Epson Corp Control device, failure detection and recovery method thereof, and electronic apparatus
JP2011258032A (en) * 2010-06-10 2011-12-22 Contec Co Ltd Information processing unit
JP2012008672A (en) * 2010-06-23 2012-01-12 Lenovo Singapore Pte Ltd Backup method of main memory and data protection system

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05334138A (en) * 1992-06-03 1993-12-17 Hitachi Ltd Program maintenance information acquiring system
JP2003022201A (en) * 2001-07-06 2003-01-24 Mitsubishi Electric Corp Method for debugging program
JP2011159136A (en) * 2010-02-02 2011-08-18 Seiko Epson Corp Control device, failure detection and recovery method thereof, and electronic apparatus
JP2011258032A (en) * 2010-06-10 2011-12-22 Contec Co Ltd Information processing unit
JP2012008672A (en) * 2010-06-23 2012-01-12 Lenovo Singapore Pte Ltd Backup method of main memory and data protection system

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019156062A1 (en) * 2018-02-07 2019-08-15 Necプラットフォームズ株式会社 Information processing system, information processing device, bios updating method for information processing device, and bios updating program for information processing device
JP2019139373A (en) * 2018-02-07 2019-08-22 Necプラットフォームズ株式会社 Information processing system and information processor and bios update method of information processor and bios update program of information processor
JP7002358B2 (en) 2018-02-07 2022-01-20 Necプラットフォームズ株式会社 Information processing system, information processing device, BIOS update method of information processing device, and BIOS update program of information processing device
US11314665B2 (en) 2018-02-07 2022-04-26 Nec Platforms, Ltd. Information processing system, information processing device, BIOS updating method for information processing device, and BIOS updating program for information processing device
JP2020154705A (en) * 2019-03-20 2020-09-24 Necプラットフォームズ株式会社 Information processing device, failure monitoring method, and failure monitoring computer program
JP7001236B2 (en) 2019-03-20 2022-01-19 Necプラットフォームズ株式会社 Information processing equipment, fault monitoring method, and fault monitoring computer program

Similar Documents

Publication Publication Date Title
CN105938450B (en) The method and system that automatic debugging information is collected
US9158628B2 (en) Bios failover update with service processor having direct serial peripheral interface (SPI) access
US8468389B2 (en) Firmware recovery system and method of baseboard management controller of computing device
CN107122321B (en) Hardware repair method, hardware repair system, and computer-readable storage device
TWI229796B (en) Method and system to implement a system event log for system manageability
CN111767184A (en) Fault diagnosis method and device, electronic equipment and storage medium
TWI470420B (en) Dubugging method and computer system using the smae
US8041936B2 (en) Persisting value relevant to debugging of computer system during reset of computer system
US20140068350A1 (en) Self-checking system and method using same
US8595552B2 (en) Reset method and monitoring apparatus
TWI632462B (en) Switching device and method for detecting i2c bus
US7783872B2 (en) System and method to enable an event timer in a multiple event timer operating environment
CN107111595B (en) Method, device and system for detecting early boot errors
US6725396B2 (en) Identifying field replaceable units responsible for faults detected with processor timeouts utilizing IPL boot progress indicator status
JP5609242B2 (en) Information processing apparatus and memory dump collection method
US8909989B2 (en) Method for outputting power-on self test information, virtual machine manager, and processor
JP2017078998A (en) Information processor, log management method, and computer program
JP2015130023A (en) Information recording device, information processor, information recording method and information recording program
CN115599617B (en) Bus detection method and device, server and electronic equipment
JP2004302731A (en) Information processor and method for trouble diagnosis
CN107133130B (en) Computer operation monitoring method and device
KR101100894B1 (en) error detection and recovery method of embedded System
US10108499B2 (en) Information processing device with watchdog timer
WO2019169615A1 (en) Method for accessing code sram, and electronic device
US11900150B2 (en) Methods and systems for collection of system management interrupt data

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20150901

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151105

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20151113

A912 Removal of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20160122