JP2013206046A

JP2013206046A - 情報処理装置、起動時診断方法、及びプログラム

Info

Publication number: JP2013206046A
Application number: JP2012073278A
Authority: JP
Inventors: Izumi Watanabe; 泉渡邊
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2012-03-28
Filing date: 2012-03-28
Publication date: 2013-10-07

Abstract

【課題】システム立ち上げ時のデバイスの異常診断を簡易な方法により行う。
【解決手段】ＢＩＯＳ立ち上げ時に障害診断が行われる各デバイスごとに、前回のＢＩＯＳ立ち上げ時における障害診断の実行時間と、今回のＢＩＯＳ立ち上げ時における障害診断の実行時間とを比較し、所定時間以上の時間差がある場合に、当該デバイスに異常があると判定する。
【選択図】図１

Description

本発明は、サーバなどの情報処理装置、起動時診断方法、及びプログラムに関する。

サーバなどの情報処理装置には、ＢＩＯＳ（ＢａｓｉｃＩｎｐｕｔ／ＯｕｔｐｕｔＳｙｓｔｅｍ）と呼ばれる制御ファームウェアが、システム立ち上げ時にＰＯＳＴ（ＰＯｗｅｒＯｎＳｅｌｆＴｅｓｔ；電源オン自己試験）により自己診断を行うものがある。例えば、関連する情報処理装置が特許文献１に開示されている。この特許文献１に記載の情報処理装置は、システム立ち上げ時にＰＯＳＴごとの時間計測を行い、立ち上げ時間の監視を行うことにより、特別なハードウェアを必要とすることなく、マルチプロセッサシステムでの障害診断動作を実行するようにしている。

また、関連する診断プログラム起動方式が特許文献２に開示されている。この特許文献２に記載の診断プログラム起動方式は、ログファイルに記録されている情報を有効に活用し、早期に装置の異常を発見することを目的としている。

また、関連するスペクトラム拡散無線を使用したパルス幅比例制御遠隔操縦方式が特許文献３に開示されている。この特許文献３に記載のパルス幅比例制御遠隔操縦方式は、位置情報を取得する際に、前回データと今回データの隔たりが大きければエラーと見なして前回データを生かすようにしている。

特開２００４−３０２７３１号公報特開平４−３４９５４１号公報特開平１０−０５１８６０号公報

サーバなどの情報処理装置では、特許文献１に記載の情報処理装置にように、システムの立ち上げ時に、システムの障害状況を診断するタスクを実行し、その実行時間を監視することにより、ＣＰＵやメモリやＩＯ等のデバイス（機器や部品）の障害診断を行っている技術がある。しかし、例えば、間欠障害であるような場合には、所定回数以内のリトライで救済される場合に、ＰＯＳＴ結果が正常と判断され、障害検出ができない場合もあった。

なお、ＢＩＯＳブート時の異常監視に関しては、ＩＰＭＩ（IｎｔｅｌｌｉｇｅｎｔＰｌａｔｆｏｒｍＭａｎａｇｅｍｅｎｔＩｎｔｅｒｆａｃｅ）のＷＤＴタイマ（ウォッチドッグタイマ）を用いた監視方法が一般的に用いられるが、この方法は、監視対象範囲が広いため、どの部品の初期化で時間がかかったのかの特定が難しい。
またタイムスタンプ情報を確認して時間監視を行う方法も考えられるが、この方法は、ＢＩＯＳの立ち上げ時にコンソールの初期化が完了していないフェーズが含まれるため、実用的とは言えない。一方、ＰＯＳＴ自身を強化し、間欠障害対応の障害診断機能をサポートする方法もあるが、この方法は、コストがかさみ、かつ立ち上げ実行時間が増加するというデメリットがある。

本発明は、上述の課題を解決することのできる、情報処理装置、起動時診断方法、及びプログラムを提供することにある。

本発明の情報処理装置は、ＢＩＯＳ立ち上げ時に、障害診断の対象となる各デバイスごとに障害診断に要した実行時間を計測する実行時間計測手段と、前回のＢＩＯＳ立ち上げ時における前記実行時間の計測情報を、トレースログ旧として記憶部へ退避するとともに、今回のＢＩＯＳ立ち上げ時における前記実行時間の計測情報を、トレースログ新として記憶部に保存するトレースログ保存手段と、前記トレースログ旧と前記トレースログ新とを基に、各デバイスについての今回の障害診断に要した実行時間と前回の障害診断に要した実行時間とを比較し、所定時間以上の時間差がある場合に、当該デバイスに異常があると判定する時間比較分析手段と、を備えることを特徴とする。

また本発明の起動時診断方法は、情報処理装置の起動時診断方法であって、ＢＩＯＳ立ち上げ時に障害診断が行われる各デバイスごとに、前回のＢＩＯＳ立ち上げ時における障害診断の実行時間と、今回のＢＩＯＳ立ち上げ時における障害診断の実行時間とを比較し、所定時間以上の時間差がある場合に、当該デバイスに異常があると判定することを特徴とする。

また、本発明のコンピュータプログラムは、情報処理装置内のコンピュータに、ＢＩＯＳ立ち上げ時に、障害診断の対象となる各デバイスごとに障害診断に要した実行時間を計測する実行時間計測手順と、前回のＢＩＯＳ立ち上げ時における前記実行時間の計測情報を、トレースログ旧として記憶部へ退避するとともに、今回のＢＩＯＳ立ち上げ時における前記実行時間の計測情報を、トレースログ新として記憶部に保存するトレースログ保存手順と、前記トレースログ旧と前記トレースログ新とを基に、各デバイスについての今回の障害診断に要した実行時間と前回の障害診断に要した実行時間とを比較し、所定時間以上の時間差がある場合に、当該デバイスに異常があると判定する時間比較分析手順と、を実行させるためのコンピュータプログラムである。

本発明の情報処理装置、及び起動時診断方法は、ＢＩＯＳ立ち上げ時におけるデバイスの障害診断を簡易な方法により行うことができる。

本発明の情報処理装置の基本概念について説明するための図である。本発明の実施形態に係わるサーバの構成を示すブロック図である。システム立ち上げ時の処理フローを示す図である。異常判定処理の具体例を示す図である。

（概要）
本発明の情報処理装置は、ＢＩＯＳ立ち上げ時に障害診断が行われる各デバイスごとに、前回のＢＩＯＳ立ち上げ時における障害診断の実行時間と、今回のＢＩＯＳ立ち上げ時における障害診断の実行時間とを比較し、所定時間以上の時間差がある場合に、当該デバイスに異常があると判定する。これにより、本発明の情報処理装置は、ＢＩＯＳ立ち上げ時におけるデバイスの障害診断を簡易な方法により行うことができる。

図１は、本発明の情報処理装置の基本概念について説明するための図である。図１に示す情報処理装置１は、システムの立ち上げ時に、ＢＩＯＳ３が、各デバイス（ＣＰＵ／メモリ／ＩＯデバイス等）２を立ち上げる（起動する）。このシステム立ち上げの際に、ＢＩＯＳ３は、各デバイス２についての障害診断（例えば、ＰＯＳＴによる障害診断）を行うとともに、トレース情報を採取しトレースログとして記憶部７に記録する。

このＢＩＯＳ３は、実行時間計測手段４と、トレースログ保存手段５と、時間比較分析手段６と、を有している。実行時間計測手段４は、各デバイス２についての障害診断を行う際に、障害診断の対象となる各デバイス２ごとに障害診断に要した実行時間（診断の開示から終了するまでの時間）を計測する。ＢＩＯＳ３は、各デバイス２ごとの障害診断に要した実行時間の情報を含むトレース情報を生成する。
トレースログ保存手段５は、ＢＩＯＳ４の起動の際に、前回のＢＩＯＳ３の起動時におけるトレース情報を、トレースログ旧Ｔ１として記憶部７へ退避するとともに、今回のＢＩＯＳ立ち上げ時におけるトレース情報をトレースログ新Ｔ２として記憶部７に保存する。

時間比較分析手段６は、トレースログ旧Ｔ１とトレースログ新Ｔ２とを参照し、各デバイス２についての今回の障害診断に要した実行時間と、前回の障害診断に要した実行時間とを比較し、時間差が大きいデバイス２がある場合に、当該デバイス２に異常があると判定する。
ＢＩＯＳ３は、デバイス２に異常が発生していると判定された場合に、障害通報をおこない、この異常が発生しているデバイスを、原因究明を行う保守対象の候補とする。

このように、本発明の情報処理装置１は、ＢＩＯＳ立ち上げ時のトレース情報を２世代分採取し、各デバイスごとに、今回のＢＩＯＳ立ち上げ時の障害診断の実行時間と、前回のＢＩＯＳ立ち上げ時の障害診断の実行時間前回との差分を観測することにより、情報処理装置１内のデバイス（機器や部品）の障害診断をシンプルなロジックで行うことができる。特に、情報処理装置１は、間欠障害により、障害診断の実行時間が遅延しているデバイスの障害検出に有効である。

（サーバの構成例）
図２は、本発明の実施形態に係わる情報処理装置の構成を示す図であり、サーバの構成例を示す図である。また、図３は、本発明の特徴をなす部分である、システム立ち上げ時の処理フローを示す図である。図４は、立ち上げ時の処理フロー中で実施される異常判定処理の具体例を示す図である。

図２に示すサーバ１０は、複数のプロセッサ１１及びプロセッサ１１Ａを備えるサーバの例である。このサーバ１０は、不揮発性記憶部２０と、サービスプロセッサ３０と、主記憶部４０と、システム状態表示部５０と、を備える。
このサーバ１０において、プロセッサ１１は、サーバ１０の起動を行うＢＳＰ（ＢａｓｅＳｙｓｔｅｍＰｒｏｃｅｓｓｏｒ）プロセッサであり、このプロセッサ１１には時間計測のための内蔵タイマ１２が組み込まれている。サービスプロセッサ３０は、サーバ１０のシステムの構成情報３１と環境情報３２とを取得し、ＢＩＯＳ４１へ通知する機能と、システムの状態（例えば、障害発生情報）をシステム状態表示部５０に通報して表示させるシステム状態通報手段３３（システム情報通報手段）とを備えている。

また、主記憶部４０には、ＢＩＯＳ４１を実行するための制御プログラムが記憶されており、この制御プログラムがプロセッサ１１により実行されることにより、ＢＩＯＳ４１の機能が実現される。このＢＩＯＳ４１は、トレースログ保存手段４２と、ＰＯＳＴタスク制御部４３とを備えている。
このＰＯＳＴタスク制御部４３は、ＰＯＳＴ起動手段４４と、実行時間計測手段４５と、構成／環境確認手段４６と、ＰＯＳＴ時間比較分析手段４７と、を有している。ＰＯＳＴタスク制御部４３は、システム立ち上げ時（ＢＩＯＳ４１の立ち上げ時）に、各デバイス（ＣＰＵ／メモリ／ＩＯデバイス等）のそれぞれについてＰＯＳＴによる診断を行うとともに、実行時間計測手段４５により、各デバイスについてのＰＯＳＴごとの実行時間（診断に要した時間）を、タイマ１２により計測する。

また、不揮発性記憶部２０は、トレースログ格納領域２１を有している。このトレースログ格納領域２１には、トレースログ保存手段４２により、前回のシステム立ち上げ時（ＢＩＯＳ立ち上げ時）のトレースログが「トレースログ旧Ｔ１」として記録（退避）される。また、このトレースログ格納領域２１には、トレースログ保存手段４２により、今回のシステム立ち上げ時（ＢＩＯＳ立ち上げ時）のトレースログが「トレースログ新Ｔ２」として記録される。

図２に示すサーバ１０の構成において、ＢＩＯＳ４１は、システム立ち上げ時に、前回のシステム立ち上げ時のＰＯＳＴごとのそれぞれの実行時間のトレース情報を、バックアップエリアとなるトレースログ格納領域４１へ「トレースログ旧Ｔ１」として退避する。
この「トレースログ旧Ｔ１」をトレースログ格納領域４１へ退避した後、ＢＩＯＳ４１は、新たに、今回のトレース情報採取を開始する。このトレース情報としては、例えば、ＰＯＳＴごとの開始及び終了時間と、構成情報と、環境情報（温度等）と、が採取される。そして、今回採取されたトレース情報は、「トレースログ新Ｔ２」としてトレースログ格納領域２１へ記録される。

トレースログ格納領域２１に新たにトレースログ新Ｔ２が記録されると、ＰＯＳＴ時間比較分析手段４７は、トレースログ新Ｔ２を参照し、今回のＰＯＳＴごとの開始及び終了時間の計測結果から、今回のシステム立ち上げ時のＰＯＳＴごとの実行時間を算出する。また、ＰＯＳＴ時間比較分析手段４７は、トレースログ旧Ｔ１を参照し、前回のＰＯＳＴごとの開始及び終了時間の計測結果から、前回のシステム立ち上げ時のＰＯＳＴごとの実行時間を算出する。

そして、ＰＯＳＴ時間比較分析手段４７は、各デバイスごとに、前回のＰＯＳＴの実行時間と、今回のＰＯＳＴの実行時間とを比較する。そして、ＰＯＳＴ時間比較分析手段４７は、前回のシステム立ち上げ時のシステム構成情報や、環境情報に差がないにもかかわらず、ＰＯＳＴの実行時間に時間差が大きいものがある場合は、対応する試験（ＰＯＳＴ）対象のデバイスに何らかの異常があると判定する。そして、ＢＩＯＳ４１は、いずれかのデバイスに異常が発生していると判定された場合に、システム状態表示部５０により障害通報をおこない、この異常が発生しているデバイスを原因究明を行う保守対象の候補とする。

（システム立ち上げ時の動作の説明）
次に、図３の処理フローを参照して、本実施形態のサーバ１０におけるシステム立ち上げ時の処理の流れについて説明する。
なお、本実施形態のサーバ１０は、複数のプロセッサ１１及び１１Ａを搭載しており、その複数のプロセッサ１１及び１１ＡのうちのＢＳＰプロセッサであるプロセッサ１１が、メモリ、Ｉ／ＯデバイスについてのＰＯＳＴ（ＰＯＳＴ＿Ａ、ＰＯＳＴ＿Ｂ、及びＰＯＳＴ＿Ｃ）を代表して実行するケースを想定している。

サーバ１０の立ち上げ開始（ステップＳ１０１）に伴い、プロセッサ１１が起動され、プロセッサ１１は、内蔵タイマ１２の更新を開始する。次に、ＢＩＯＳ４１が立ち上げられ（起動され）、ＢＩＯＳ４１は、不揮発性記憶部２０のトレースログ格納領域２１に格納されたトレースログ新Ｔ２をトレースログ旧Ｔ１へコピーし、トレースログ新Ｔ２のエリアをクリアする（ステップＳ１０２）

その後、ＰＯＳＴタスク制御部４３に含まれるＰＯＳＴ起動手段４４により、ＰＯＳＴ＿Ａ、ＰＯＳＴ＿Ｂ、ＰＯＳＴ＿Ｃの順にＰＯＳＴが起動される。また、実行時間計測手段４５により、タイマ１２のタイマ値（計測時間）の読み込みが開始される（ステップＳ１０３）。
そして、実行時間計測手段４５は、ＰＯＳＴ＿Ａの起動時に、まず、タイマ１２の値を読み、トレースログ新Ｔ２のＰＯＳＴ＿Ａの開始タイマ値（Ｔ２Ａ＿Ｓ）として、主記憶部４０に記憶する。また、実行時間計測手段４５は、ＰＯＳＴ＿Ａ終了時のタイマ１２を読み、終了タイマ値（Ｔ２Ａ＿Ｅ）として主記憶部４０に記憶する。
実行時間計測手段４５は、後続のＰＯＳＴ＿Ｂ、ＰＯＳＴ＿Ｃについても同様に開始、終了時間を計測して主記憶部４０に記憶する。その後、トレースログ保存手段４２は、実行時間計測手段４５により計測された計測時間（タイマ値）をまとめてトレースログ格納領域２１内の「トレースログ新Ｔ２」に記録する（ステップＳ１０４）。

次に、構成／環境確認手段４６が起動され、構成／環境確認手段４６は、サービスプロセッサ３０から、構成情報３１と環境情報３２とを入手する。トレースログ保存手段４２は、構成情報３１と環境情報３２とを、トレースログ格納領域２１の「トレースログ新Ｔ２」に、構成情報Ｔ２２と環境情報Ｔ２３として記録する（ステップＳ１０５）。なお、トレースログ旧Ｔ１」には、前回のシステム立ち上げ時の構成情報３１と環境情報３２とが、構成情報Ｔ１２と環境情報Ｔ１３として記録されている。

次に、ＰＯＳＴ時間比較分析手段４７が起動される。ＰＯＳＴ時間比較分析手段４７は、トレースログ格納領域２１に保存された「トレースログ旧Ｔ１」と「トレースログ新Ｔ２」とを参照し、ＰＯＳＴ＿Ａ、ＰＯＳＴ＿Ｂ、及びＰＯＳＴ＿ＣのそれぞれについてＰＯＳＴ実行時間を比較する（ステップＳ１０６）。この実行時間の比較結果を基に、ＰＯＳＴ時間比較分析手段４７は、ＰＯＳＴ＿Ａ、ＰＯＳＴ＿Ｂ、及びＰＯＳＴ＿Ｃのそれぞれが対象とするデバイスの異常の有無を判定する（ステップＳ１０７）。

そして、ＰＯＳＴ時間比較分析手段４７は、ステップＳ１０７の判定処理において異常があると判定された場合に（ステップＳ１０７；Ｙｅｓ）、サービスプロセッサ３０のシステム状態通報手段３３を介して、システム状態表示部５０にシステム状態の通報を行う（ステップＳ１０８）。このステップＳ１０８の処理の終了後に、ＢＩＯＳ４１は、ブート（ＢＯＯＴ）処理を完了する（ステップＳ１０９）。
また、ＢＩＯＳ４１は、ステップＳ１０７の判定処理においてＰＯＳＴ時間比較分析手段４７により異常がないと判定された場合に（ステップＳ１０７；Ｎｏ）、ブート（ＢＯＯＴ）処理を完了する（ステップＳ１０９）。

次に、図４を参照して、ＰＯＳＴ時間比較分析手段４７において行われる異常判定処理の具体例について説明する。なお、この図４に示す例は、異常発生の判定基準として、以下の基準を用いている。
第１の判定基準は、システムの構成及び環境が同じであれば、システム立ち上げ時のＰＯＳＴの実行時間に大きな差は生じないはずであるので、この実行時間に大きな差がない場合に対象デバイスが正常と判定する。
第２の判定基準は、システムの構成及び環境が同じであるにも係わらず、システム立ち上げ時のＰＯＳＴの実行時間に大きな差が生じる場合に、ＰＯＳＴ中のエラーリトライ救済等による対象デバイス（例えば、ＵＳＢポート）に何らかの異常が発生した可能性があると判定する。

上記の判定基準のもと、ＰＯＳＴ時間比較分析手段４７は、トレースログ格納領域２１格納された「トレースログ旧Ｔ１」と「トレースログ新Ｔ２」とを、主記憶部４０へ読み込み、比較を開始する。
構成／環境確認手段４６は、まず、トレースログ旧Ｔ１の構成情報（旧）Ｔ１２と、トレースログ新Ｔ２の構成情報（新）Ｔ２２とを比較し、構成情報に変更があれば、比較分析を終了する。
次に、構成／環境確認手段４６は、環境情報（旧）Ｔ１３と、環境情報（新）Ｔ２３とを比較し、環境情報の差が大きい場合（例えば、吸気温度の差が１０度以上の場合）も比較分析を終了する。

構成／環境確認手段４６により、新旧の構成情報及び環境情報に差分がほとんどないと判定された場合に、ＰＯＳＴ時間比較分析手段４７は、ＰＯＳＴ＿Ａ、ＰＯＳＴ＿Ｂ、及びＰＯＳＴ＿ＣのそれぞれについてＰＯＳＴ実行時間を比較する。

図４に示す例では、ＰＯＳＴ時間比較分析手段４７は、最初に、トレースログ新Ｔ２内のＰＯＳＴ＿Ａ（以下、「新ＰＯＳＴ＿Ａ」とも呼ぶ）のログＴ２１Ａと、トレースログ旧Ｔ１内のＰＯＳＴ＿Ａ（以下、「旧ＰＯＳＴ＿Ａ」とも呼ぶ）のログＴ１１Ａとを基に、新旧それぞれのＰＯＳＴ＿Ａの実行時間を比較する。

この場合、新ＰＯＳＴ＿Ａは、実行開始時のタイマスタート値が「Ｓ：０」であり、実行終了時のタイマ値が「Ｅ：２９０」であり、その差分値「２９０−０＝２９０」により、新ＰＯＳＴ＿Ａの実行時間は、２９０ｍｓｅｃとなる。
一方、旧ＰＯＳＴ＿Ａは、実行開始時のタイマスタート値が「Ｓ：０」であり、実行終了時のタイマ値が「Ｅ：３００」であり、その差分値「３００−０＝３００」により、旧ＰＯＳＴ＿Ａの実行時間は、３００ｍｓｅｃとなる。
このため、新ＰＯＳＴ＿Ａの実行時間（２９０ｍｓｅｃ）と旧ＰＯＳＴ＿Ａの実行時間（３００ｍｓｅｃ）とは、ほぼ等しく、ＰＯＳＴ時間比較分析手段４７は、ＰＯＳＴ＿Ａの実行時に、異常が発生しなかったと判定する。

次に、ＰＯＳＴ時間比較分析手段４７は、トレースログ新Ｔ２内のＰＯＳＴ＿Ｂ（以下、「新ＰＯＳＴ＿Ｂ」とも呼ぶ）のログＴ２１Ｂと、トレースログ旧Ｔ１内のＰＯＳＴ＿Ｂ（以下、「旧ＰＯＳＴ＿Ｂ」とも呼ぶ）のログＴ１１Ｂとを基に、新旧それぞれのＰＯＳＴ＿Ｂの実行時間を比較する。

この場合、新ＰＯＳＴ＿Ｂは、実行開始時のタイマスタート値が「Ｓ：３００」であり、実行終了時のタイマ値が「Ｅ：６００」であり、その差分値「６００−３００＝３００」により、新ＰＯＳＴ＿Ｂの実行時間は、３００ｍｓｅｃとなる。
一方、旧ＰＯＳＴ＿Ｂは、実行開始時のタイマスタート値が「Ｓ：３１０」であり、実行終了時のタイマ値が「Ｅ：４００」であり、その差分値「４００−３１０＝９０」により、旧ＰＯＳＴ＿Ｂの実行時間は、９０ｍｓｅｃとなる。
このため、ＰＯＳＴ時間比較分析手段４７は、新ＰＯＳＴ＿Ｂの実行時間（３００ｍｓｅｃ）と旧ＰＯＳＴ＿Ｂの実行時間（９０ｍｓｅｃ）とは、実行時間の時間差が大きく、ＰＯＳＴ＿Ｂの実行時に、何らかの異常が発生して遅延が生じたと判定する。

次に、トレースログ新Ｔ２内のＰＯＳＴ＿Ｃ（以下、「新ＰＯＳＴ＿Ｃ」とも呼ぶ）のログＴ２１Ｃと、トレースログ旧Ｔ１内のＰＯＳＴ＿Ｃ（以下、「旧ＰＯＳＴ＿Ｃ」とも呼ぶ）のログＴ１１Ｃとを基に、新旧それぞれのＰＯＳＴ＿Ｃの実行時間を比較する。

この場合、新ＰＯＳＴ＿Ｃは、実行開始時のタイマスタート値が「Ｓ：６１０」であり、実行終了時のタイマ値が「Ｅ：６５０」であり、その差分値「６５０−６１０＝４０」により、新ＰＯＳＴ＿Ｃの実行時間は、４０ｍｓｅｃとなる。
一方、旧ＰＯＳＴ＿Ｃは、実行開始時のタイマスタート値が「Ｓ：４１０」であり、実行終了時のタイマ値が「Ｅ：４５０」であり、その差分値「４５０−４１０＝４０」により、旧ＰＯＳＴ＿Ｃの実行時間は、４０ｍｓｅｃとなる。
このため、新ＰＯＳＴ＿Ｃの実行時間（４０ｍｓｅｃ）と旧ＰＯＳＴ＿Ｃの実行時間（４０ｍｓｅｃ）とは、ほぼ等しく、ＰＯＳＴ時間比較分析手段４７は、ＰＯＳＴ＿Ｃの実行時に、異常が発生しなかったと判定する。

このように、ＰＯＳＴ時間比較分析手段４７は、トレースログ新Ｔ２とトレースログ旧Ｔ１との比較を行うことにより、ＰＯＳＴ＿Ｂの時間差が大きいと判定された場合に、ＰＯＳＴ＿Ｂの実行時に何らかの異常が発生して遅延が生じた疑いがあると判定することができる。

以上説明したように、通常の場合、ＰＯＳＴは、診断対象のデバイスごとに設定されており、ＰＯＳＴ時間比較分析手段４７は、前回と今回のＰＯＳＴの実行時間を比較することにより、異常が発生したデバイスの把握が可能になる。例えば、図４の例では、構成情報、構成情報には差がほとんどないため、本来は、システム立ち上げ毎に立ち上げ時間に時間差が生じるはずはないにも係わらず（第１の判定基準）、ＰＯＳＴ＿Ｂのみの実行時間に大きな時間が生じている。
したがって、ＰＯＳＴ＿ＢがＵＳＢポート診断に対応する場合は、ＵＳＢポートに何らかの異常が発生していると判定できる（第２の判定基準）。この異常検出時には、ＢＩＯＳ４１は、サービスプロセッサ３０内のシステム状態通報手段３３を介して、システム状態表示部５０によりシステム状態通報を行う。

このように、サーバ１０は、ＢＩＯＳ立ち上げ時のトレース情報を２世代分採取し、今回のＢＩＯＳ立ち上げ時のＰＯＳＴごとの実行時間と、前回のＰＯＳＴごとの実行時間との差分を観測することにより、サーバ１０のデバイス（機器や部品）の異常時の障害診断をシンプルなロジックで行うことが可能になる。これにより、本発明における起動時診断方法は、特に、間欠障害によりＰＯＳＴの実行時間が遅延している場合の障害検出に有効である。

なお、上述した実施形態では、サーバ１０が、各デバイスについてのＰＯＳＴごとの実行時間を計測することにより異常判定（障害診断）を行う例を示したが、これに加えて、トレースログの観測対象を増やして障害診断を行うようにしてもよい。例えば、サーバ１０は、ＰＯＳＴを実行する際のエラーリトライ回数を計数することにより、障害診断を行うこともできる。

また、上述した実施形態では、サーバ１０が、トレースログの世代を２世代（新、旧）に渡り計測することにより、障害診断を行う例を示したが、トレースログの世代を３世代以上に増やすこともできる。このトレースログの世代を３世代以上用いる方法では、３世代以上のＰＯＳＴの実行時間の平均値と、最新のＰＯＳＴの実行時間とを比較することにより、デバイスの障害診断を行うことになる。

以上、本発明の実施の形態について説明したが、上述のサーバ１０内のプロセッサ１１，１１Ａおよびサービスプロセッサ３０は、内部にコンピュータシステムを有している。そして、上述した処理に関する一連の処理の過程は、プログラムの形式でコンピュータ読み取り可能な記録媒体に記憶されており、このプログラムをコンピュータが読み出して実行することによって、上記処理が行われる。すなわち、ＢＩＯＳ４１等における、各処理は、ＣＰＵ等の中央演算処理装置が上記プログラムを読み出して、情報の加工、演算処理を実行することにより、実現されるものである。

ここでコンピュータ読み取り可能な記録媒体とは、磁気ディスク、光磁気ディスク、ＣＤ−ＲＯＭ、ＤＶＤ−ＲＯＭ、半導体メモリ等をいう。また、このコンピュータプログラムを通信回線によってコンピュータに配信し、この配信を受けたコンピュータが当該プログラムを実行するようにしても良い。

以上、本発明の実施の形態について説明したが、本発明の情報処理装置は、上述の図示例にのみ限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々変更を加え得ることは勿論である。

１…情報処理装置、２…デバイス、３…ＢＩＯＳ、４…時間計測手段、５…トレースログ保存手段、６…時間比較分析手段、７…記憶部、１０…サーバ、１１，１１Ａ…プロセッサ、１２…タイマ、２０…不揮発性記憶部、２１…トレースログ格納領域、３０…サービスプロセッサ、３１…構成情報、３２…環境情報、３３…システム状態通報手段、４０…主記憶部、４１…ＢＩＯＳ、４２…トレースログ保存手段、４３…ＰＯＳＴタスク制御部、４４…ＰＯＳＴ起動手段、４５…実行時間計測手段、４６…構成／環境確認手段、４７…ＰＯＳＴ時間比較分析手段、Ｔ１…トレースログ旧、Ｔ２…トレースログ新

Claims

ＢＩＯＳ立ち上げ時に、障害診断の対象となる各デバイスごとに障害診断に要した実行時間を計測する実行時間計測手段と、
前回のＢＩＯＳ立ち上げ時における前記実行時間の計測情報を、トレースログ旧として記憶部へ退避するとともに、今回のＢＩＯＳ立ち上げ時における前記実行時間の計測情報を、トレースログ新として記憶部に保存するトレースログ保存手段と、
前記トレースログ旧と前記トレースログ新とを基に、各デバイスについての今回の障害診断に要した実行時間と前回の障害診断に要した実行時間とを比較し、所定時間以上の時間差がある場合に、当該デバイスに異常があると判定する時間比較分析手段と、
を備えることを特徴とする情報処理装置。
前記ＢＩＯＳは、障害診断の対象となる各デバイスの障害診断を、各デバイスのそれぞれに対応するＰＯＳＴごとに行うＰＯＳＴタスク制御部を備え、
前記実行時間計測手段は、
前記ＢＩＯＳ立ち上げ時に、障害診断の対象となる各デバイスのそれぞれに対応するＰＯＳＴごとの実行時間を計測し、
前記トレースログ保存手段は、
前回のＢＩＯＳ立ち上げ時における前記ＰＯＳＴごとの実行時間を含むトレース情報を、トレースログ旧として記憶部へ退避するとともに、今回のＢＩＯＳ立ち上げ時における前記ＰＯＳＴごとの実行時間を含むトレース情報を、トレースログ新として記憶部に保存し、
前記時間比較分析手段は、
前記トレースログ旧と前記トレースログ新とを基に、各デバイスごとに今回のＰＯＳＴの実行時間と前回のＰＯＳＴの実行時間とを比較し、所定時間以上の時間差がある場合に、当該デバイスに異常があると判定する
ことを特徴とする請求項１に記載の情報処理装置。
前記トレースログ保存手段は、
前記トレース情報として、診断対象となる各デバイスのＰＯＳＴごとの実行時間とともに、システムの構成情報と環境情報とを保存し、
前記時間比較分析手段は、
前回のＢＩＯＳ立ち上げ時における前記構成情報及び環境情報と、今回のＢＩＯＳ立ち上げ時における前記構成情報及び環境情報と、に差がないにもかかわらず、前回のＰＯＳＴの実行時間と今回のＰＯＳＴの実行時間との時間差が所定時間以上大きいデバイスがある場合に、当該デバイスに異常があると判定する
ことを特徴とする請求項２に記載の情報処理装置。
前記時間比較分析手段により、デバイスに異常があると判定された場合に、
当該デバイスに異常があることをシステム状態表示部に表示させるシステム情報通報手段を備える
ことを特徴とする請求項１から３のいずれか１項に記載の情報処理装置。
情報処理装置の起動時診断方法であって、
ＢＩＯＳ立ち上げ時に障害診断が行われる各デバイスごとに、前回のＢＩＯＳ立ち上げ時における障害診断の実行時間と、今回のＢＩＯＳ立ち上げ時における障害診断の実行時間とを比較し、所定時間以上の時間差がある場合に、当該デバイスに異常があると判定することを特徴とする起動時診断方法。
情報処理装置内のコンピュータに、
ＢＩＯＳ立ち上げ時に、障害診断の対象となる各デバイスごとに障害診断に要した実行時間を計測する実行時間計測手順と、
前回のＢＩＯＳ立ち上げ時における前記実行時間の計測情報を、トレースログ旧として記憶部へ退避するとともに、今回のＢＩＯＳ立ち上げ時における前記実行時間の計測情報を、トレースログ新として記憶部に保存するトレースログ保存手順と、
前記トレースログ旧と前記トレースログ新とを基に、各デバイスについての今回の障害診断に要した実行時間と前回の障害診断に要した実行時間とを比較し、所定時間以上の時間差がある場合に、当該デバイスに異常があると判定する時間比較分析手順と、
を実行させるためのコンピュータプログラム。