TW201535109A - 基板管理控制器啟動狀態檢測方法及系統 - Google Patents

基板管理控制器啟動狀態檢測方法及系統 Download PDF

Info

Publication number
TW201535109A
TW201535109A TW103104230A TW103104230A TW201535109A TW 201535109 A TW201535109 A TW 201535109A TW 103104230 A TW103104230 A TW 103104230A TW 103104230 A TW103104230 A TW 103104230A TW 201535109 A TW201535109 A TW 201535109A
Authority
TW
Taiwan
Prior art keywords
bmc
value
response value
remote management
management console
Prior art date
Application number
TW103104230A
Other languages
English (en)
Inventor
A-Nan Sun
Original Assignee
Hon Hai Prec Ind Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hon Hai Prec Ind Co Ltd filed Critical Hon Hai Prec Ind Co Ltd
Priority to TW103104230A priority Critical patent/TW201535109A/zh
Publication of TW201535109A publication Critical patent/TW201535109A/zh

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本發明提供一種基板管理控制器啟動狀態檢測方法及系統,該方法包括步驟:控制遠端管理控制台發送自身狀態檢測指令至基板管理控制器BMC;判斷遠端管理控制台是否在一個預設時間內接收到來自BMC的回應值;當遠端管理控制台在所述預設時間內接收到回應值時,判斷所述回應值是否為一個預設值;當所述回應值為所述預設值時,判定BMC為正常啟動;當所述回應值不為所述預設值時,判定BMC為非正常啟動;及當遠端管理控制台在所述預設時間內沒有接收到回應值時,判定BMC啟動失敗。

Description

基板管理控制器啟動狀態檢測方法及系統
本發明涉及一種基板管理控制器檢測方法及系統,尤其是涉及一種檢測基板管理控制器的啟動狀態的方法及系統。
目前在伺服器機櫃(例如機架式機櫃)開機時,機櫃每片主機板開機啟動過程中,如果主機板的基板管理控制器(Baseboard Management Controller,BMC)啟動失敗,主機板無法及時報告該處異常,且BIOS(Basic Input Output System,基本輸入輸出系統)不會採取任何措施。此時,需要維護人員來瞭解BMC初始化出現的問題。當今的伺服器架構多採用總體電源供電和風扇牆調節伺服器機櫃溫度,而電力的消耗和溫度大小這些資料均由遠端管理控制台(Remote Management Console,RMC)在BMC正常啟動後收集,若BMC在啟動過程中缺乏必要的監控手段,則BMC在啟動過程中當機時,會對伺服器機櫃的穩定性和安全性產生嚴重的影響。
鑒於以上內容,有必要提供一種基板管理控制器啟動狀態檢測方法及系統,可以透過遠端管理控制台來實現BMC啟動狀態的及時檢測。
一種基板管理控制器啟動狀態檢測方法,應用於伺服器機櫃中,該方法包括步驟:(a)控制遠端管理控制台發送自身狀態檢測指令至基板管理控制器BMC,該自身狀態檢測指令用於控制BMC在啟動過程中返回一個回應值至遠端管理控制台;(b)判斷遠端管理控制台是否在一個預設時間內接收到回應值;(c)當遠端管理控制台在所述預設時間內接收到回應值時,判斷所述回應值是否為一個預設值;(d)當所述回應值為所述預設值時,判定BMC為正常啟動;(e)當所述回應值不為所述預設值時,判定BMC為非正常啟動;及(f)當遠端管理控制台在所述預設時間內沒有接收到回應值時,判定BMC啟動失敗。
一種基板管理控制器啟動狀態檢測系統,運行於伺服器機櫃中,該系統包括:控制模組,用於控制遠端管理控制台發送自身狀態檢測指令至基板管理控制器BMC,該自身狀態檢測指令用於控制BMC在啟動過程中返回一個回應值至遠端管理控制台;判斷模組,用於判斷遠端管理控制台是否在一個預設時間內接收到回應值;所述判斷模組,還用於當遠端管理控制台在所述預設時間內接收到回應值時,判斷所述回應值是否為一個預設值;狀態判定模組,用於當所述回應值為所述預設值時,判定BMC為正常啟動;所述狀態判定模組,還用於當所述回應值不為所述預設值時,判定BMC為非正常啟動;及所述狀態判定模組,還用於當遠端管理控制台在所述預設時間內沒有接收到回應值時,判定BMC啟動失敗。
相較於習知技術,利用本發明所提供之基板管理控制器啟動狀態檢測方法及系統,可以控制遠端管理控制台發送自身狀態檢測指令至BMC,並根據BMC的回應值來確定BMC的啟動狀態,以實現BMC啟動狀態的及時檢測,從而提高了伺服器機櫃的穩定性和安全性。
圖1係本發明基板管理控制器啟動狀態檢測系統較佳實施例之硬體架構圖。
圖2係本發明基板管理控制器啟動狀態檢測系統較佳實施例之功能模組圖。
圖3係本發明基板管理控制器啟動狀態檢測方法較佳實施例之作業流程圖。
參閱圖1所示,係本發明基板管理控制器啟動狀態檢測系統較佳實施例之硬體架構圖。該基板管理控制器啟動狀態檢測系統10運行於伺服器機櫃100中,該伺服器機櫃100可以是機架式(Rack Mount)機櫃等。該伺服器機櫃100還包括部件,如遠端管理控制台(Remote Management Console,RMC)20、多個主機板30及儲存設備40。伺服器機櫃100的部件10-40透過系統匯流排進行通訊。
每個主機板30包括一個基板管理控制器(Baseboard Management Controller,BMC)31,該BMC31用於監控伺服器機櫃100的電力消耗及溫度大小。所述BMC31與遠端管理控制台20透過智慧平台管理介面(Intelligent Platform Management Interface,IPMI)或I2C(Inter-Integrated Circuit)匯流排連接。所述遠端管理控制台20用於發送自身狀態檢測(Get Self Test Result)指令至主機板30,以使BMC31在啟動過程中返回一個回應值。此時,BMC31的啟動狀態不同,BMC31所產生的回應值不同,例如,當BMC31為正常啟動時,回應值為一個預設值(例如55h),當BMC31為非正常啟動時,回應值為不是所述預設值的值(例如57h或58h),當BMC31啟動失敗時,無回應值。
所述遠端管理控制台20包括快閃記憶體21,該快閃記憶體21用於儲存BMC31在啟動失敗或非正常啟動時所產生的系統事件日誌(System Event Log,SEL)。該SEL用於記錄BMC31在非正常啟動及啟動失敗時的錯誤資訊,該錯誤資訊包括時間、錯誤原因等。所述儲存設備40用於儲存BMC31在非正常啟動時,其返回值與錯誤類型的對應關係,例如,當返回值為57h時,錯誤類型為不可獲得資料或設備,當返回值為58h時,錯誤類型為需要更換或修復的硬體致命錯誤。
所述基板管理控制器啟動狀態檢測系統10用於控制遠端管理控制台20發送自身狀態檢測指令至BMC31,並根據BMC31的回應值來實現BMC31啟動狀態的檢測。
參閱圖2所示,係本發明基板管理控制器啟動狀態檢測系統較佳實施例之功能模組圖。該基板管理控制器啟動狀態檢測系統10包括控制模組11、判斷模組12、狀態判定模組13及提示模組14。模組11-14包括電腦化程式指令。
在伺服器機櫃100開機時,控制模組11用於控制遠端管理控制台20發送自身狀態檢測指令至BMC31,其中,該自身狀態檢測指令用於控制BMC31在啟動過程中返回一個回應值至遠端管理控制台20。在本較佳實施例中,對應BMC31的啟動狀態不同,BMC31所產生的回應值不同。
判斷模組12用於判斷遠端管理控制台20是否在一個預設時間內接收到回應值。所述預設時間由伺服器機櫃100的性能決定,如為45秒。
所述判斷模組12還用於當遠端管理控制台20在所述預設時間內接收到回應值時,判斷該回應值是否為所述預設值。該預設值由BMC31所支持的行業標準決定,如為55h。
狀態判定模組13用於當所述回應值為所述預設值時,判定BMC31為正常啟動。
所述狀態判定模組13還用於當所述回應值不為所述預設值時,判定BMC31為非正常啟動,根據儲存設備40中儲存的返回值與錯誤類型的對應關係來確定BMC31的錯誤類型,並將該錯誤類型及BMC31所產生的SEL儲存至遠端管理控制台20的快閃記憶體21中。
所述狀態判定模組13還用於當遠端管理控制台20在所述預設時間內沒有接收到回應值時,判定BMC31啟動失敗,並將BMC31所產生的SEL儲存至遠端管理控制台20的快閃記憶體21中。
提示模組14用於控制伺服器機櫃100顯示提示資訊,以提示BMC31的啟動狀態。所述提示資訊可以為伺服器機櫃100的顯示螢幕所顯示的文字,或伺服器機櫃100上的發光器件所顯示的不同顏色等。
本發明控制遠端管理控制台20發送自身狀態檢測指令至BMC31,並根據BMC31的返回值來判定BMC31的啟動狀態,在BMC31為非正常啟動或啟動失敗時,提供SEL予維護人員進行分析,從而可以實現BMC31啟動過程中錯誤的快速確定,提高了伺服器機櫃的穩定性和安全性。
參閱圖3所示,係本發明基板管理控制器啟動狀態檢測方法較佳實施例之流程圖。
步驟S10,在伺服器機櫃100開機時,控制模組11控制遠端管理控制台20發送自身狀態檢測指令至BMC31,該自身狀態檢測指令用於控制BMC31在啟動過程中返回一個回應值至遠端管理控制台20。
步驟S20,判斷模組12判斷遠端管理控制台20是否在一個預設時間內接收到回應值。當遠端管理控制台20在所述預設時間內接收到回應值時,執行步驟S30,否則,執行步驟S60。
步驟S30,判斷模組12判斷該回應值是否為所述預設值。當該回應值為所述預設值時,執行步驟S40,否則,執行步驟S50。
步驟S40,狀態判定模組13判定BMC31為正常啟動。
步驟S50,狀態判定模組13判定BMC31為非正常啟動,根據儲存設備40中儲存的返回值與錯誤類型的對應關係來確定BMC31的錯誤類型,並將該錯誤類型及BMC31所產生的SEL儲存至遠端管理控制台20的快閃記憶體21中。
步驟S60,狀態判定模組13判定BMC31啟動失敗,並將BMC31所產生的SEL儲存至遠端管理控制台20的快閃記憶體21中。
步驟S70,提示模組14控制伺服器機櫃100顯示提示資訊,以提示BMC31的啟動狀態。
綜上所述,本發明符合發明專利要件,爰依法提出專利申請。惟,以上所述者僅爲本發明之較佳實施例,本發明之範圍並不以上述實施例爲限,舉凡熟悉本案技藝之人士爰依本發明之精神所作之等效修飾或變化,皆應涵蓋於以下申請專利範圍內。
100‧‧‧伺服器機櫃
10‧‧‧基板管理控制器啟動狀態檢測系統
11‧‧‧控制模組
12‧‧‧判斷模組
13‧‧‧狀態判定模組
14‧‧‧提示模組
20‧‧‧遠端管理控制台
21‧‧‧快閃記憶體
30‧‧‧主機板
31‧‧‧基板管理控制器
40‧‧‧儲存設備
S10‧‧‧控制遠端管理控制台發送自身狀態檢測指令至BMC
S20‧‧‧遠端管理控制台是否在一個預設時間內接收到回應值
S30‧‧‧所述回應值是否為一個預設值
S40‧‧‧BMC正常啟動
S50‧‧‧BMC非正常啟動
S60‧‧‧BMC啟動失敗
S70‧‧‧控制伺服器機櫃顯示提示資訊以提示BMC的啟動狀態
S10‧‧‧控制遠端管理控制台發送自身狀態檢測指令至BMC
S20‧‧‧遠端管理控制台是否在一個預設時間內接收到回應值
S30‧‧‧所述回應值是否為一個預設值
S40‧‧‧BMC正常啟動
S50‧‧‧BMC非正常啟動
S60‧‧‧BMC啟動失敗
S70‧‧‧控制伺服器機櫃顯示提示資訊以提示BMC的啟動狀態

Claims (10)

  1. 一種基板管理控制器啟動狀態檢測方法,應用於伺服器機櫃中,該方法包括:
    控制步驟:控制遠端管理控制台發送自身狀態檢測指令至基板管理控制器BMC,該自身狀態檢測指令用於控制BMC在啟動過程中返回一個回應值至遠端管理控制台;
    第一判斷步驟:判斷遠端管理控制台是否在一個預設時間內接收到回應值;
    第二判斷步驟:當遠端管理控制台在所述預設時間內接收到回應值時,判斷所述回應值是否為一個預設值;
    第一狀態判定步驟:當所述回應值為所述預設值時,判定BMC為正常啟動;
    第二狀態判定步驟:當所述回應值不為所述預設值時,判定BMC為非正常啟動;及
    第三狀態判定步驟:當遠端管理控制台在所述預設時間內沒有接收到回應值時,判定BMC啟動失敗。
  2. 如申請專利範圍第1項所述之基板管理控制器啟動狀態檢測方法,還包括提示步驟:
    控制伺服器機櫃顯示提示資訊以提示BMC的啟動狀態。
  3. 如申請專利範圍第1項所述之基板管理控制器啟動狀態檢測方法,所述第二狀態判定步驟還包括:
    根據返回值與錯誤類型的對應關係確定BMC的錯誤類型,並將該錯誤類型及BMC所產生的系統事件日誌儲存至遠端管理控制台的快閃記憶體中。
  4. 如申請專利範圍第1項所述之基板管理控制器啟動狀態檢測方法,所述第三狀態判定步驟還包括:
    將BMC所產生的系統事件日誌儲存至遠端管理控制台的快閃記憶體中。
  5. 如申請專利範圍第1項所述之基板管理控制器啟動狀態檢測方法,所述BMC的啟動狀態不同,BMC所產生的回應值不同,當BMC為正常啟動時,回應值為所述預設值,當BMC為非正常啟動時,回應值為不是所述預設值的值,當BMC啟動失敗時,無回應值。
  6. 一種基板管理控制器啟動狀態檢測系統,運行於伺服器機櫃中,該系統包括:
    控制模組,用於控制遠端管理控制台發送自身狀態檢測指令至基板管理控制器BMC,該自身狀態檢測指令用於控制BMC在啟動過程中返回一個回應值至遠端管理控制台;
    判斷模組,用於判斷遠端管理控制台是否在一個預設時間內接收到回應值;
    所述判斷模組,還用於當遠端管理控制台在所述預設時間內接收到回應值時,判斷所述回應值是否為一個預設值;
    狀態判定模組,用於當所述回應值為所述預設值時,判定BMC為正常啟動;
    所述狀態判定模組,還用於當所述回應值不為所述預設值時,判定BMC為非正常啟動;及
    所述狀態判定模組,還用於當遠端管理控制台在所述預設時間內沒有接收到回應值時,判定BMC啟動失敗。
  7. 如申請專利範圍第6項所述之基板管理控制器啟動狀態檢測系統,該系統還包括:
    提示模組,用於控制伺服器機櫃顯示提示資訊以提示BMC的啟動狀態。
  8. 如申請專利範圍第6項所述之基板管理控制器啟動狀態檢測系統,所述狀態判定模組還用於當所述回應值不為所述預設值時,根據返回值與錯誤類型的對應關係確定BMC的錯誤類型,並將該錯誤類型及BMC所產生的系統事件日誌儲存至遠端管理控制台的快閃記憶體中。
  9. 如申請專利範圍第6項所述之基板管理控制器啟動狀態檢測系統,所述狀態判定模組還用於當遠端管理控制台在所述預設時間內沒有接收到回應值時,將BMC所產生的系統事件日誌儲存至遠端管理控制台的快閃記憶體中。
  10. 如申請專利範圍第6項所述之基板管理控制器啟動狀態檢測系統,所述BMC的啟動狀態不同,BMC所產生的回應值不同,當BMC為正常啟動時,回應值為所述預設值,當BMC為非正常啟動時,回應值為不是所述預設值的值,當BMC啟動失敗時,無回應值。
TW103104230A 2014-02-10 2014-02-10 基板管理控制器啟動狀態檢測方法及系統 TW201535109A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW103104230A TW201535109A (zh) 2014-02-10 2014-02-10 基板管理控制器啟動狀態檢測方法及系統

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW103104230A TW201535109A (zh) 2014-02-10 2014-02-10 基板管理控制器啟動狀態檢測方法及系統

Publications (1)

Publication Number Publication Date
TW201535109A true TW201535109A (zh) 2015-09-16

Family

ID=54695212

Family Applications (1)

Application Number Title Priority Date Filing Date
TW103104230A TW201535109A (zh) 2014-02-10 2014-02-10 基板管理控制器啟動狀態檢測方法及系統

Country Status (1)

Country Link
TW (1) TW201535109A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI582585B (zh) * 2015-11-18 2017-05-11 神雲科技股份有限公司 機櫃的監控系統

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI582585B (zh) * 2015-11-18 2017-05-11 神雲科技股份有限公司 機櫃的監控系統

Similar Documents

Publication Publication Date Title
CN106648958B (zh) 基本输入输出***回复管理***及其方法以及程序产品
US6760869B2 (en) Reporting hard disk drive failure
US8886998B2 (en) Server and power supply test method
TWI589135B (zh) 伺服器系統及其操作方法
US20160147604A1 (en) Server system
US8538720B2 (en) Cold boot test system and method for electronic devices
US20130110926A1 (en) Method for Controlling Rack System
JP2009238066A (ja) 多数の電子機器をラック搭載した電子機器システム及び電子機器システムの電子機器の特定処理方法。
TWI668567B (zh) 伺服器及自動檢修基板管理控制器的方法
US20120137027A1 (en) System and method for monitoring input/output port status of peripheral devices
TW201715331A (zh) 伺服器及自動檢修基板管理控制器的方法
TW200917018A (en) Monitor apparatus and a monitoring method thereof
TW201417536A (zh) 伺服器自動管理方法及系統
US20140189103A1 (en) System for monitoring servers and method thereof
TW201506613A (zh) 固件檢測系統及方法
TW202036293A (zh) 電腦系統及其偵錯方法
CN104809044A (zh) 基板管理控制器启动状态检测方法及***
JP4886558B2 (ja) 情報処理装置
TW201516672A (zh) 伺服器監控系統及方法
JP2016071635A (ja) Ecuの異常監視回路
TW201308072A (zh) 伺服器穩定性測試方法及系統
TW201516665A (zh) 伺服器之系統錯誤資訊偵測系統及方法
US9596149B2 (en) Server information handling system NFC ticket management and fault storage
TW201535109A (zh) 基板管理控制器啟動狀態檢測方法及系統
TW201522971A (zh) 風扇測試系統及方法