CN111078452A - 一种bmc固件镜像恢复方法与装置 - Google Patents

一种bmc固件镜像恢复方法与装置 Download PDF

Info

Publication number
CN111078452A
CN111078452A CN201911285896.1A CN201911285896A CN111078452A CN 111078452 A CN111078452 A CN 111078452A CN 201911285896 A CN201911285896 A CN 201911285896A CN 111078452 A CN111078452 A CN 111078452A
Authority
CN
China
Prior art keywords
bmc
flash memory
firmware image
response
starting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201911285896.1A
Other languages
English (en)
Inventor
王龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN201911285896.1A priority Critical patent/CN111078452A/zh
Publication of CN111078452A publication Critical patent/CN111078452A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • G06F11/0754Error or fault detection not based on redundancy by exceeding limits
    • G06F11/0757Error or fault detection not based on redundancy by exceeding limits by exceeding a time limit, i.e. time-out, e.g. watchdogs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/1441Resetting or repowering

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Stored Programmes (AREA)

Abstract

本发明公开了一种BMC固件镜像恢复方法与装置包括:使用主闪存的固件镜像启动BMC并等待接收喂狗信号;响应于在预定时间内未接收到喂狗信号而超时复位BMC并使用备用闪存的固件镜像启动BMC,并在BMC启动之后,响应于BMC的超时复位次数小于预定次数而主动复位BMC并再次使用主闪存的固件镜像启动BMC;响应于BMC的超时复位次数大于等于预定次数而使用备用闪存的固件镜像覆盖主闪存的固件镜像;响应于固件镜像覆盖失败而使用备用闪存的固件镜像使BMC执行开机流程,并输出主闪存损坏的健康事件。本发明能够方便地快速恢复可用的BMC固件镜像,节省成本和人工并且提升产品稳定性。

Description

一种BMC固件镜像恢复方法与装置
技术领域
本发明涉及服务器领域,更具体地,特别是指一种BMC固件镜像恢复方法与装置。
背景技术
BMC(基板管理控制器)是服务器特有的管理控制器,可以自动监控服务器运行状态,并及时根据当前状态进行调控。BMC固件一般会存储在主板的Flash(闪存)中。由于为了添加功能或解决问题,BMC会按需要进行更新,一般可以通过带外网络传输或带内***下传输的办法对Flash进行擦除及重新写入。通过带内***下的工具可以实现对Flash的直接刷新,不需要Flash中的BMC处在工作状态;而通过带外网络传输的办法刷新则需要BMC处于正在工作中。
但实际情况是,BMC更新时可能因为不正常断电导致BMC更新不完全,或是更新版本无法正常工作,或出于不明原因无法接受指令通过网络进行更新,使得BMC处于失效状态。一般遇到这种情况,运维人员可以通过带内***下工具对BMC的flash直接进行擦除及重新写入。但这种操作限制条件较多:有时客户***运行保密业务不允许访问;有些机器比如存储机器,只用来放硬盘,主板上只有BMC,没有办法通过带内进行刷新。
针对现有技术中带外带内传输更新困难、维护成本高的问题,目前尚无有效的解决方案。
发明内容
有鉴于此,本发明实施例的目的在于提出一种BMC固件镜像恢复方法与装置,能够方便地快速恢复可用的BMC固件镜像,节省成本和人工并且提升产品稳定性。
基于上述目的,本发明实施例的第一方面提供了一种BMC固件镜像恢复方法,包括由BMC的看门狗执行以下步骤:
使用主闪存的固件镜像启动BMC并等待接收喂狗信号,并响应于在预定时间内接收到喂狗信号使BMC执行开机流程;
响应于在预定时间内未接收到喂狗信号而超时复位BMC并使用备用闪存的固件镜像启动BMC,并在BMC启动之后,响应于BMC的超时复位次数小于预定次数而主动复位BMC并再次使用主闪存的固件镜像启动BMC;
响应于BMC的超时复位次数大于等于预定次数而使用备用闪存的固件镜像覆盖主闪存的固件镜像,并响应于固件镜像覆盖成功而主动复位BMC并再次使用主闪存的固件镜像启动BMC;
响应于固件镜像覆盖失败而使用备用闪存的固件镜像使BMC执行开机流程,并输出主闪存损坏的健康事件。
在一些实施方式中,方法还包括:
响应于在主闪存的固件镜像启动BMC时接收到强制恢复信号而主动复位BMC并使用备用闪存的固件镜像启动BMC;
响应于在备用闪存的固件镜像启动BMC后持续接收到强制恢复信号而使用备用闪存的固件镜像覆盖主闪存的固件镜像;
响应于固件镜像覆盖成功并且不再接收到强制恢复信号而主动复位BMC并再次使用主闪存的固件镜像启动BMC。
在一些实施方式中,BMC的通用输入输出引脚和地线上跨接有强制恢复跨接器,强制恢复跨接器在被手动激活时通过将通用输入输出引脚和地线短路来发出强制恢复信号。
在一些实施方式中,还包括:在主闪存和备用闪存中的一个超时复位或主动复位BMC时,通过芯片引导程序中的逻辑函数引导使用在主闪存和备用闪存中的另一个来启动BMC。
在一些实施方式中,方法还包括:响应于使用主闪存的固件镜像成功执行开机流程而重置超时复位次数。
本发明实施例的第二方面提供了一种BMC固件镜像恢复装置,包括:
处理器;和
存储器,存储有处理器可运行的程序代码,程序代码在被运行时分别由BMC的看门狗执行以下步骤:
使用主闪存的固件镜像启动BMC并等待接收喂狗信号,并响应于在预定时间内接收到喂狗信号使BMC执行开机流程;
响应于在预定时间内未接收到喂狗信号而超时复位BMC并使用备用闪存的固件镜像启动BMC,并在BMC启动之后,响应于BMC的超时复位次数小于预定次数而主动复位BMC并再次使用主闪存的固件镜像启动BMC;
响应于BMC的超时复位次数大于等于预定次数而使用备用闪存的固件镜像覆盖主闪存的固件镜像,并响应于固件镜像覆盖成功而主动复位BMC并再次使用主闪存的固件镜像启动BMC;
响应于固件镜像覆盖失败而使用备用闪存的固件镜像使BMC执行开机流程,并输出主闪存损坏的健康事件。
在一些实施方式中,方法还包括:
响应于在主闪存的固件镜像启动BMC时接收到强制恢复信号而主动复位BMC并使用备用闪存的固件镜像启动BMC;
响应于在备用闪存的固件镜像启动BMC后持续接收到强制恢复信号而使用备用闪存的固件镜像覆盖主闪存的固件镜像;
响应于固件镜像覆盖成功并且不再接收到强制恢复信号而主动复位BMC并再次使用主闪存的固件镜像启动BMC。
在一些实施方式中,BMC的通用输入输出引脚和地线上跨接有强制恢复跨接器,强制恢复跨接器在被手动激活时通过将通用输入输出引脚和地线短路来发出强制恢复信号。
在一些实施方式中,还包括:在主闪存和备用闪存中的一个超时复位或主动复位BMC时,通过芯片引导程序中的逻辑函数引导使用在主闪存和备用闪存中的另一个来启动BMC。
在一些实施方式中,方法还包括:响应于使用主闪存的固件镜像成功执行开机流程而重置超时复位次数。
本发明具有以下有益技术效果:本发明实施例提供的BMC固件镜像恢复方法与装置,通过使用主闪存的固件镜像启动BMC并等待接收喂狗信号,并响应于在预定时间内接收到喂狗信号使BMC执行开机流程;响应于在预定时间内未接收到喂狗信号而超时复位BMC并使用备用闪存的固件镜像启动BMC,并在BMC启动之后,响应于BMC的超时复位次数小于预定次数而主动复位BMC并再次使用主闪存的固件镜像启动BMC;响应于BMC的超时复位次数大于等于预定次数而使用备用闪存的固件镜像覆盖主闪存的固件镜像,并响应于固件镜像覆盖成功而主动复位BMC并再次使用主闪存的固件镜像启动BMC;响应于固件镜像覆盖失败而使用备用闪存的固件镜像使BMC执行开机流程,并输出主闪存损坏的健康事件的技术方案,能够方便地快速恢复可用的BMC固件镜像,节省成本和人工并且提升产品稳定性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的BMC固件镜像恢复方法的流程示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明实施例进一步详细说明。
需要说明的是,本发明实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一”“第二”仅为了表述的方便,不应理解为对本发明实施例的限定,后续实施例对此不再一一说明。
基于上述目的,本发明实施例的第一个方面,提出了一种能够方便地快速恢复可用的BMC固件镜像的方法的一个实施例。图1示出的是本发明提供的BMC固件镜像恢复方法的流程示意图。
所述BMC固件镜像恢复方法,如图1所示,包括由BMC的看门狗执行以下步骤:
步骤S101:使用主闪存的固件镜像启动BMC并等待接收喂狗信号,并响应于在预定时间内接收到喂狗信号使BMC执行开机流程;
步骤S103:响应于在预定时间内未接收到喂狗信号而超时复位BMC并使用备用闪存的固件镜像启动BMC,并在BMC启动之后,响应于BMC的超时复位次数小于预定次数而主动复位BMC并再次使用主闪存的固件镜像启动BMC;
步骤S105:响应于BMC的超时复位次数大于等于预定次数而使用备用闪存的固件镜像覆盖主闪存的固件镜像,并响应于固件镜像覆盖成功而主动复位BMC并再次使用主闪存的固件镜像启动BMC;
步骤S107:响应于固件镜像覆盖失败而使用备用闪存的固件镜像使BMC执行开机流程,并输出主闪存损坏的健康事件。
本发明具有自动恢复和强制恢复两种功能。***开机时BMC自动检测主开机快闪存储器(Flash0)是否执行,并完成开机;若Flash0失效,备用快闪存储器(Flash1)会将自身的影像覆写到Flash0并再次交由Flash0开机,自动恢复以确保***正常运作。当BMC因为不明原因,无法正常执行或进行更新时,维护人员可以停机启动强制恢复,此时Flash1会强制将自身影像覆写到Flash0,以迅速回复BMC的功能。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(ROM)或随机存储记忆体(RAM)等。所述计算机程序的实施例,可以达到与之对应的前述任意方法实施例相同或者相类似的效果。
在一些实施方式中,方法还包括:
响应于在主闪存的固件镜像启动BMC时接收到强制恢复信号而主动复位BMC并使用备用闪存的固件镜像启动BMC;
响应于在备用闪存的固件镜像启动BMC后持续接收到强制恢复信号而使用备用闪存的固件镜像覆盖主闪存的固件镜像;
响应于固件镜像覆盖成功并且不再接收到强制恢复信号而主动复位BMC并再次使用主闪存的固件镜像启动BMC。
在一些实施方式中,BMC的通用输入输出引脚和地线上跨接有强制恢复跨接器,强制恢复跨接器在被手动激活时通过将通用输入输出引脚和地线短路来发出强制恢复信号。
在一些实施方式中,还包括:在主闪存和备用闪存中的一个超时复位或主动复位BMC时,通过芯片引导程序中的逻辑函数引导使用在主闪存和备用闪存中的另一个来启动BMC。
在一些实施方式中,方法还包括:响应于使用主闪存的固件镜像成功执行开机流程而重置超时复位次数。
根据本发明实施例公开的方法还可以被实现为由CPU(中央处理器)执行的计算机程序,该计算机程序可以存储在计算机可读存储介质中。在该计算机程序被CPU执行时,执行本发明实施例公开的方法中限定的上述功能。上述方法步骤以及***单元也可以利用控制器以及用于存储使得控制器实现上述步骤或单元功能的计算机程序的计算机可读存储介质实现。
下面根据具体实施例来进一步阐述本发明的具体实施方式。
在硬件设计上准备两个闪存储存BMC影像(主开机快闪存储器Flash0和备用快闪存储器Flash1)。两个闪存上的影像在出厂时是同一版本,Flash0可藉由软件升级更新成更新的版本。BMC芯片AST2500中包括硬件看门狗,利用这个功能来实现自动恢复。上电时看门狗是开启的,BMC正常启动后会开始喂狗,如果没有及时喂狗,芯片一段时间后超时复位重启。可以设置为从一颗Flash启动后,如果一段时间内没有开始喂狗,则重启并从另一颗Flash启动。该部分的设置,可以通过修改芯片引导程序(uboot),在uboot中添加逻辑函数实现。
另外,强制恢复跨接器(Jumper)连接AST2500上的GPIO(通用输入输出引脚)信号和另一端接地,平时跨接器不插上。BMC在开机时,藉由侦测GPIO电压位准,决定强制恢复功能是否启动,当跨接器插上时GPIO接地,启动强制恢复功能。
自动恢复的执行流程如下:
开机时***默认从Flash0启动,如果Flash0无法启动,等待看门狗超时复位BMC,然后从Flash1启动。Flash1启动后会检查看门狗超时复位次数,若少于3次,Flash1会利用看门狗超时复位BMC机制,将控制权交回Flash0再重开机一次。若Flash1检查超时复位次数大于3次,确定Flash0确定无法开机。Flash1将自身的影像从Flash1复制到Flash0,这过程将需要数分钟,自动恢复完成后,Flash1复位BMC,再次将控制权交回Flash0并重开机。
如果无法执行Flash0恢复(如Flash0已毁损或未安装),BMC将直接从Flash1启动,并记录Flash0损坏的健康事件。在开机成功后,看门狗超时复位次数将被清除。
强制恢复的执行流程如下:
***停机打开机壳,将强制恢复跨接器插上,激活强制恢复功能。跨接器插上后必须上电等待强制恢复功能自动执行完成。上电后BMC从Flash0启动,Flash0侦测到强制恢复功能已被激活,便复位BMC重启,将控制权交给Flash1。当BMC复位后,BMC从Flash1启动。如果强制恢复仍然激活,BMC会将Flash1的镜像复制到Flash0。等待数分钟强制恢复完成后,BMC将闪烁心跳LED灯(0.5Hz),用户需要移除强制恢复的跨接器,Flash1侦测到强制恢复功能已被关闭,复位重启BMC,将控制权交回给Flash0,从Flash0启动。
从上述实施例可以看出,本发明实施例提供的BMC固件镜像恢复方法,通过使用主闪存的固件镜像启动BMC并等待接收喂狗信号,并响应于在预定时间内接收到喂狗信号使BMC执行开机流程;响应于在预定时间内未接收到喂狗信号而超时复位BMC并使用备用闪存的固件镜像启动BMC,并在BMC启动之后,响应于BMC的超时复位次数小于预定次数而主动复位BMC并再次使用主闪存的固件镜像启动BMC;响应于BMC的超时复位次数大于等于预定次数而使用备用闪存的固件镜像覆盖主闪存的固件镜像,并响应于固件镜像覆盖成功而主动复位BMC并再次使用主闪存的固件镜像启动BMC;响应于固件镜像覆盖失败而使用备用闪存的固件镜像使BMC执行开机流程,并输出主闪存损坏的健康事件的技术方案,能够方便地快速恢复可用的BMC固件镜像,节省成本和人工并且提升产品稳定性。
需要特别指出的是,上述BMC固件镜像恢复方法的各个实施例中的各个步骤均可以相互交叉、替换、增加、删减,因此,这些合理的排列组合变换之于BMC固件镜像恢复方法也应当属于本发明的保护范围,并且不应将本发明的保护范围局限在所述实施例之上。
基于上述目的,本发明实施例的第二个方面,提出了一种能够方便地快速恢复可用的BMC固件镜像的装置的一个实施例。BMC固件镜像恢复装置包括:
处理器;和
存储器,存储有处理器可运行的程序代码,程序代码在被运行时分别由BMC的看门狗执行以下步骤:
使用主闪存的固件镜像启动BMC并等待接收喂狗信号,并响应于在预定时间内接收到喂狗信号使BMC执行开机流程;
响应于在预定时间内未接收到喂狗信号而超时复位BMC并使用备用闪存的固件镜像启动BMC,并在BMC启动之后,响应于BMC的超时复位次数小于预定次数而主动复位BMC并再次使用主闪存的固件镜像启动BMC;
响应于BMC的超时复位次数大于等于预定次数而使用备用闪存的固件镜像覆盖主闪存的固件镜像,并响应于固件镜像覆盖成功而主动复位BMC并再次使用主闪存的固件镜像启动BMC;
响应于固件镜像覆盖失败而使用备用闪存的固件镜像使BMC执行开机流程,并输出主闪存损坏的健康事件。
在一些实施方式中,方法还包括:
响应于在主闪存的固件镜像启动BMC时接收到强制恢复信号而主动复位BMC并使用备用闪存的固件镜像启动BMC;
响应于在备用闪存的固件镜像启动BMC后持续接收到强制恢复信号而使用备用闪存的固件镜像覆盖主闪存的固件镜像;
响应于固件镜像覆盖成功并且不再接收到强制恢复信号而主动复位BMC并再次使用主闪存的固件镜像启动BMC。
在一些实施方式中,BMC的通用输入输出引脚和地线上跨接有强制恢复跨接器,强制恢复跨接器在被手动激活时通过将通用输入输出引脚和地线短路来发出强制恢复信号。
在一些实施方式中,还包括:在主闪存和备用闪存中的一个超时复位或主动复位BMC时,通过芯片引导程序中的逻辑函数引导使用在主闪存和备用闪存中的另一个来启动BMC。
在一些实施方式中,方法还包括:响应于使用主闪存的固件镜像成功执行开机流程而重置超时复位次数。
从上述实施例可以看出,本发明实施例提供的BMC固件镜像恢复装置,通过使用主闪存的固件镜像启动BMC并等待接收喂狗信号,并响应于在预定时间内接收到喂狗信号使BMC执行开机流程;响应于在预定时间内未接收到喂狗信号而超时复位BMC并使用备用闪存的固件镜像启动BMC,并在BMC启动之后,响应于BMC的超时复位次数小于预定次数而主动复位BMC并再次使用主闪存的固件镜像启动BMC;响应于BMC的超时复位次数大于等于预定次数而使用备用闪存的固件镜像覆盖主闪存的固件镜像,并响应于固件镜像覆盖成功而主动复位BMC并再次使用主闪存的固件镜像启动BMC;响应于固件镜像覆盖失败而使用备用闪存的固件镜像使BMC执行开机流程,并输出主闪存损坏的健康事件的技术方案,能够方便地快速恢复可用的BMC固件镜像,节省成本和人工并且提升产品稳定性。
需要特别指出的是,上述BMC固件镜像恢复装置的实施例采用了所述BMC固件镜像恢复方法的实施例来具体说明各模块的工作过程,本领域技术人员能够很容易想到,将这些模块应用到所述BMC固件镜像恢复方法的其他实施例中。当然,由于所述BMC固件镜像恢复方法实施例中的各个步骤均可以相互交叉、替换、增加、删减,因此,这些合理的排列组合变换之于所述BMC固件镜像恢复装置也应当属于本发明的保护范围,并且不应将本发明的保护范围局限在所述实施例之上。
以上是本发明公开的示例性实施例,但是应当注意,在不背离权利要求限定的本发明实施例公开的范围的前提下,可以进行多种改变和修改。根据这里描述的公开实施例的方法权利要求的功能、步骤和/或动作不需以任何特定顺序执行。此外,尽管本发明实施例公开的元素可以以个体形式描述或要求,但除非明确限制为单数,也可以理解为多个。
应当理解的是,在本文中使用的,除非上下文清楚地支持例外情况,单数形式“一个”旨在也包括复数形式。还应当理解的是,在本文中使用的“和/或”是指包括一个或者一个以上相关联地列出的项目的任意和所有可能组合。上述本发明实施例公开实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本发明实施例公开的范围(包括权利要求)被限于这些例子;在本发明实施例的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,并存在如上所述的本发明实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。因此,凡在本发明实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明实施例的保护范围之内。

Claims (10)

1.一种BMC固件镜像恢复方法,其特征在于,包括由BMC的看门狗执行以下步骤:
使用主闪存的固件镜像启动BMC并等待接收喂狗信号,并响应于在预定时间内接收到所述喂狗信号使BMC执行开机流程;
响应于在预定时间内未接收到所述喂狗信号而超时复位BMC并使用备用闪存的固件镜像启动BMC,并在BMC启动之后,响应于BMC的超时复位次数小于预定次数而主动复位BMC并再次使用所述主闪存的固件镜像启动BMC;
响应于BMC的超时复位次数大于等于预定次数而使用所述备用闪存的固件镜像覆盖所述主闪存的固件镜像,并响应于固件镜像覆盖成功而主动复位BMC并再次使用所述主闪存的固件镜像启动BMC;
响应于固件镜像覆盖失败而使用所述备用闪存的固件镜像使BMC执行开机流程,并输出所述主闪存损坏的健康事件。
2.根据权利要求1所述的方法,其特征在于,还包括:
响应于在所述主闪存的固件镜像启动BMC时接收到强制恢复信号而主动复位BMC并使用所述备用闪存的固件镜像启动BMC;
响应于在所述备用闪存的固件镜像启动BMC后持续接收到所述强制恢复信号而使用所述备用闪存的固件镜像覆盖所述主闪存的固件镜像;
响应于固件镜像覆盖成功并且不再接收到所述强制恢复信号而主动复位BMC并再次使用所述主闪存的固件镜像启动BMC。
3.根据权利要求2所述的方法,其特征在于,所述BMC的通用输入输出引脚和地线上跨接有强制恢复跨接器,所述强制恢复跨接器在被手动激活时通过将通用输入输出引脚和地线短路来发出所述强制恢复信号。
4.根据权利要求1所述的方法,其特征在于,还包括:在所述主闪存和所述备用闪存中的一个超时复位或主动复位BMC时,通过芯片引导程序中的逻辑函数引导使用在所述主闪存和所述备用闪存中的另一个来启动BMC。
5.根据权利要求1所述的方法,其特征在于,还包括:响应于使用所述主闪存的固件镜像成功执行开机流程而重置所述超时复位次数。
6.一种BMC固件镜像恢复装置,其特征在于,包括:
处理器;和
存储器,存储有处理器可运行的程序代码,所述程序代码在被运行时由BMC的看门狗执行以下步骤:
使用主闪存的固件镜像启动BMC并等待接收喂狗信号,并响应于在预定时间内接收到所述喂狗信号使BMC执行开机流程;
响应于在预定时间内未接收到所述喂狗信号而超时复位BMC并使用备用闪存的固件镜像启动BMC,并在BMC启动之后,响应于BMC的超时复位次数小于预定次数而主动复位BMC并再次使用所述主闪存的固件镜像启动BMC;
响应于BMC的超时复位次数大于等于预定次数而使用所述备用闪存的固件镜像覆盖所述主闪存的固件镜像,并响应于固件镜像覆盖成功而主动复位BMC并再次使用所述主闪存的固件镜像启动BMC;
响应于固件镜像覆盖失败而使用所述备用闪存的固件镜像使BMC执行开机流程,并输出所述主闪存损坏的健康事件。
7.根据权利要求6所述的装置,其特征在于,还包括:
响应于在所述主闪存的固件镜像启动BMC时接收到强制恢复信号而主动复位BMC并使用所述备用闪存的固件镜像启动BMC;
响应于在所述备用闪存的固件镜像启动BMC后持续接收到所述强制恢复信号而使用所述备用闪存的固件镜像覆盖所述主闪存的固件镜像;
响应于固件镜像覆盖成功并且不再接收到所述强制恢复信号而主动复位BMC并再次使用所述主闪存的固件镜像启动BMC。
8.根据权利要求7所述的装置,其特征在于,所述BMC的通用输入输出引脚和地线上跨接有强制恢复跨接器,所述强制恢复跨接器在被手动激活时通过将通用输入输出引脚和地线短路来发出所述强制恢复信号。
9.根据权利要求6所述的装置,其特征在于,还包括:在所述主闪存和所述备用闪存中的一个超时复位或主动复位BMC时,通过芯片引导程序中的逻辑函数引导使用在所述主闪存和所述备用闪存中的另一个来启动BMC。
10.根据权利要求6所述的装置,其特征在于,还包括:响应于使用所述主闪存的固件镜像成功执行开机流程而重置所述超时复位次数。
CN201911285896.1A 2019-12-13 2019-12-13 一种bmc固件镜像恢复方法与装置 Withdrawn CN111078452A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911285896.1A CN111078452A (zh) 2019-12-13 2019-12-13 一种bmc固件镜像恢复方法与装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911285896.1A CN111078452A (zh) 2019-12-13 2019-12-13 一种bmc固件镜像恢复方法与装置

Publications (1)

Publication Number Publication Date
CN111078452A true CN111078452A (zh) 2020-04-28

Family

ID=70314494

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911285896.1A Withdrawn CN111078452A (zh) 2019-12-13 2019-12-13 一种bmc固件镜像恢复方法与装置

Country Status (1)

Country Link
CN (1) CN111078452A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114116280A (zh) * 2021-11-11 2022-03-01 苏州浪潮智能科技有限公司 交互式bmc自恢复方法、***、终端及存储介质
WO2024109360A1 (zh) * 2022-11-21 2024-05-30 苏州元脑智能科技有限公司 基板管理控制器固件故障恢复方法、***、设备及介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109766221A (zh) * 2019-01-09 2019-05-17 郑州云海信息技术有限公司 一种bmc镜像切换方法与装置
CN110442386A (zh) * 2019-06-25 2019-11-12 苏州浪潮智能科技有限公司 一种bmc启动方法、***、电子设备及计算机存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109766221A (zh) * 2019-01-09 2019-05-17 郑州云海信息技术有限公司 一种bmc镜像切换方法与装置
CN110442386A (zh) * 2019-06-25 2019-11-12 苏州浪潮智能科技有限公司 一种bmc启动方法、***、电子设备及计算机存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114116280A (zh) * 2021-11-11 2022-03-01 苏州浪潮智能科技有限公司 交互式bmc自恢复方法、***、终端及存储介质
CN114116280B (zh) * 2021-11-11 2023-08-18 苏州浪潮智能科技有限公司 交互式bmc自恢复方法、***、终端及存储介质
WO2024109360A1 (zh) * 2022-11-21 2024-05-30 苏州元脑智能科技有限公司 基板管理控制器固件故障恢复方法、***、设备及介质

Similar Documents

Publication Publication Date Title
US9921915B2 (en) Baseboard management controller recovery
CN111045866B (zh) 一种bmc故障处理方法、装置、电子设备及存储介质
RU2602378C1 (ru) Стойка с множеством модулей управления стойкой и способ обновления встроенного программного обеспечения, используемого для стойки
WO2018095107A1 (zh) 一种bios程序的异常处理方法及装置
KR100952585B1 (ko) 운영체제(os) 자동복구기능을 갖는 임베디드 시스템 및운영체제 자동복구 방법
TW201843583A (zh) 自動回復基本輸入輸出系統映像檔的方法及電腦系統
JP2003208314A (ja) オペレーティングシステムの自動入れ替え可能な計算機システムおよびそのシステムを利用したオペレーションシステムの自動入れ替え方法
CN112612524A (zh) Linux***启动的方法、装置、设备及存储介质
CN108874459B (zh) 基于虚拟化技术的快速启动方法和装置
CN114116280B (zh) 交互式bmc自恢复方法、***、终端及存储介质
WO2021103745A1 (zh) 一种引导程序的保护设计方法
CN108345464A (zh) 一种安卓***的启动方法及安卓车机
CN105468390B (zh) Boot在线升级装置及方法
CN106775674B (zh) 一种基于通用引导加载程序的设备及其启动方法
CN111800304A (zh) 进程运行的监测方法、存储介质和虚拟装置
CN109976886B (zh) 内核远程切换方法及装置
CN111078452A (zh) 一种bmc固件镜像恢复方法与装置
CN115658113A (zh) 服务器自启动方法、装置、可读存储介质及电子设备
US10824517B2 (en) Backup and recovery of configuration files in management device
TWI764454B (zh) 韌體損壞恢復技術
CN107391174B (zh) 一种***在线升级的控制方法及控制装置
JP6073710B2 (ja) 情報処理装置、起動障害からの自動復旧方法、及び起動障害からの自動復旧プログラム
CN116185510A (zh) 分区切换启动方法、阵列服务器和计算机可读存储介质
CN114911641A (zh) 一种bios更新过程中发生断电的处理方法及装置
US9529581B2 (en) Circuit and method for writing program codes of basic input/output system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20200428

WW01 Invention patent application withdrawn after publication