CN108038019B - 一种基板管理控制器的故障自动恢复方法及*** - Google Patents

一种基板管理控制器的故障自动恢复方法及*** Download PDF

Info

Publication number
CN108038019B
CN108038019B CN201711424949.4A CN201711424949A CN108038019B CN 108038019 B CN108038019 B CN 108038019B CN 201711424949 A CN201711424949 A CN 201711424949A CN 108038019 B CN108038019 B CN 108038019B
Authority
CN
China
Prior art keywords
programmable logic
complex programmable
logic device
management controller
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711424949.4A
Other languages
English (en)
Other versions
CN108038019A (zh
Inventor
胡远明
赵熠琳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dawning Information Industry Beijing Co Ltd
Dawning Information Industry Co Ltd
Original Assignee
Dawning Information Industry Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dawning Information Industry Beijing Co Ltd filed Critical Dawning Information Industry Beijing Co Ltd
Priority to CN201711424949.4A priority Critical patent/CN108038019B/zh
Publication of CN108038019A publication Critical patent/CN108038019A/zh
Application granted granted Critical
Publication of CN108038019B publication Critical patent/CN108038019B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/24Resetting means

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明提供一种基板管理控制器的故障自动恢复方法及***,所述方法包括:由所述基板管理控制器执行初始化进程;由所述复杂可编程逻辑器接收启动信号;将基板管理控制器的心跳信号发送至复杂可编程逻辑器,并将所述心跳信号作为所述复杂可编程逻辑器的监测信号;由所述复杂可编程逻辑器检测所述心跳信号是否输出预设频率;当所述心跳信号输出预设频率时,则继续由所述复杂可编程逻辑器检测所述心跳信号是否输出预设频率;当所述心跳信号不是输出预设频率时,则由所述复杂可编程逻辑器向所述基板管理控制器发送重启信号,以使所述基板管理控制器重启并完成故障恢复。本发明能够提升服务器的维护效率以及所述管理控制器管理的稳定性。

Description

一种基板管理控制器的故障自动恢复方法及***
技术领域
本发明涉及计算机技术领域,尤其涉及一种基板管理控制器的故障自动恢复方法及***。
背景技术
随着互联网、云计算以及大数据等技术的兴起,服务器已经成为战略性基础设施。服务器需求量快速增长的大环境下,服务器可管理性、可维护性、稳定性等都越来越重要。其中,服务器部署和管理使用基板管理控制器(BMC:Baseboard Management Controller)作为带外管理***主控的方案占了绝对多数,这也给BMC带外***稳定性提出了更高的要求。BMC带外管理***作为一套独立的***,与服务器***一样也会出现低概率当机等情况,出现当机等情况后如果没有一种故障自动恢复方法,就将影响整个服务器的管理及运维,影响服务器***的稳定以及造成客户维护不便。
当前的服务器***,关于BMC故障恢复方法可通过在服务器产品服务器BMC设计软件watchdog模式恢复BMC故障,在BMC功能模块异常的情况下通过软件watchdog重启BMC,达到故障恢复的目的。但是上述软件故障模式需要依赖BMC内部时钟,如果BMC时钟出现问题,软件watchdog将无法生效;或者,在服务器中设计BMC重启按钮,在BMC服务出现故障,可以通过按重启按钮重启BMC。但是由于服务器与台式机或者笔记本不同,服务器都放置在机房中,要使用按钮重启BMC就需要进机房进行操作,对于运维来说,所述故障恢复方案非常低效;再或者部分整机柜服务器使用机架管理控制(RMC:Rack Management Control)模块对BMC进行故障恢复,但是,由于RMC模块其实也是一套BMC管理方案,其核心部件也是BMC芯片,区别只是在于BMC只管理本计算结点(一台服务器),而RMC模块与所有结点的BMC进行通信,管理整个机架内所有结点(多台服务器),既然RMC都存在故障风险,同样RMC也一样会存在故障风险,RMC如果和BMC同时出现故障,那么BMC故障恢复将不能实现的问题。
发明内容
本发明提供的基板管理控制器的故障自动恢复方法及***,能够提升服务器的维护效率以及所述管理控制器管理的稳定性。
第一方面,本发明提供一种基板管理控制器的故障自动恢复方法,包括:
由所述基板管理控制器执行初始化进程;
由所述复杂可编程逻辑器接收启动信号;
将基板管理控制器的心跳信号发送至复杂可编程逻辑器,并将所述心跳信号作为所述复杂可编程逻辑器的监测信号;
由所述复杂可编程逻辑器检测所述心跳信号是否输出预设频率;
当所述复杂可编程逻辑器检测所述心跳信号输出预设频率时,则继续由所述复杂可编程逻辑器检测所述心跳信号是否输出预设频率;
当所述复杂可编程逻辑器检测所述心跳信号不是输出预设频率时,则由所述复杂可编程逻辑器向所述基板管理控制器发送重启信号,以使所述基板管理控制器重启并完成故障恢复。
可选地,所述由所述复杂可编程逻辑器接收启动信号包括:
由平台控制单元经通用输入/输出接口向所述复杂可编程逻辑器发送启动信号;
根据所述启动信号控制所述复杂可编程逻辑器开启或关闭基板管理控制器的故障自动恢复功能。
可选地,在所述由所述基板管理控制器执行初始化进程之后,所述方法还包括:
判断所述初始化进程是否执行成功,如果所述初始化进程执行成功,则向所述复杂可编程逻辑器发送初始化成功信号,并执行下一步;如果所述初始化进程未执行成功,则向所述复杂可编程逻辑器发送初始化失败信号,并由所述复杂可编程逻辑器关闭基板管理控制器的故障自动恢复功能。
可选地,在所述向所述复杂可编程逻辑器发送初始化成功信号之后,所述方法还包括:
由所述复杂可编程逻辑器检测在设定时间内所述心跳信号是否有输出预设频率;
如果在设定时间内所述心跳信号有输出预设频率,则继续由所述复杂可编程逻辑器检测所述心跳信号是否输出预设频率;
如果在设定时间内所述心跳信号持续不是输出预设频率,则由所述复杂可编程逻辑器向所述基板管理控制器发送重启信号,以使所述基板管理控制器重启并完成故障恢复。
第二方面,本发明提供一种基板管理控制器的故障自动恢复***,包括:
基板管理控制器,用于执行初始化进程以及将心跳信号发送至复杂可编程逻辑器,并将所述心跳信号作为所述复杂可编程逻辑器的监测信号;
复杂可编程逻辑器,用于接收启动信号以及检测所述心跳信号是否输出预设频率;当所述心跳信号输出预设频率时,则继续检测所述心跳信号是否输出预设频率;当所述心跳信号不是输出预设频率时,则向所述基板管理控制器发送重启信号,以使所述基板管理控制器重启并完成故障恢复。
可选地,所述***还包括:
平台控制单元,用于经通用输入/输出接口向所述复杂可编程逻辑器发送开启信号,并根据所述信号控制所述复杂可编程逻辑器开启或关闭基板管理控制器的故障自动恢复功能。
可选地,所述复杂可编程逻辑器包括:
信号接收模块,用于接收所述基板管理控制器所发送的心跳信号;
信号检测模块,用于检测所述心跳信号是否输出预设频率;
信号发送模块,用于向所述基板管理控制器发送重启信号。
本发明实施例提供的基板管理控制器的故障自动恢复方法及***,利用复杂可编程逻辑器(CPLD:Complex Programmable Logic Device)控制所述基板管理控制器进行故障自动恢复,其中,主要是通过将所述基板管理控制器的心跳信号作为所述复杂可编程逻辑器的监测信号,例如,所述监测信号为所述复杂可编程逻辑器的watchdog信号;并由所述复杂可编程逻辑器对所述心跳信号进行实时检测,并根据所述心跳信号控制所述基板管理控制器的故障自动恢复功能。
其中,所述方法主要是通过所述复杂可编程逻辑器检测所述心跳信号的输出频率,并将所述心跳信号的输出频率与输出预设频率进行对比,根据对比结果控制是否由所述复杂可编程逻辑器向所述基板管理控制器发送重启信号,以使所述基板管理控制器重启并完成故障恢复。
同时,本实施例中所述方法还可通过所述基板管理控制器也可侦测自身各模块状态是否异常,比如侦测到网络一直处于动态主机配置协议(DHCP:Dynamic HostConfiguration Protocol)状态,而无法获得IP地址,就可以控制心跳信号不再输出预设频率,进而使得所述复杂可编程逻辑器在短时间内完成对基板管理控制器及周边模块的重启完成故障的自动恢复。
因此,本实施例所述方法通过使用所述复杂可编程逻辑器实现基板管理控制器的故障自动恢复功能,所述方法不仅提升了服务器的维护效率;同时,还提升了所述服基板管理控制器管理稳定性。
附图说明
图1为本发明一实施例基板管理控制器的故障自动恢复方法的流程图;
图2为本发明另一实施例基板管理控制器的故障自动恢复方法的流程图;
图3为本发明一实施例基板管理控制器的故障自动恢复***的结构示意图;
图4为本发明另一实施例基板管理控制器的故障自动恢复***的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供一种基板管理控制器的故障自动恢复方法,如图1所示,所述方法包括:
S01、由所述基板管理控制器执行初始化进程;
S10、由所述复杂可编程逻辑器接收启动信号;
S11、将基板管理控制器的心跳信号发送至复杂可编程逻辑器,并将所述心跳信号作为所述复杂可编程逻辑器的监测信号;
S12、由所述复杂可编程逻辑器检测所述心跳信号是否输出预设频率;
S13、当所述复杂可编程逻辑器检测所述心跳信号输出预设频率时,则继续由所述复杂可编程逻辑器检测所述心跳信号是否输出预设频率;
S14、当所述复杂可编程逻辑器检测所述心跳信号不是输出预设频率时,则由所述复杂可编程逻辑器向所述基板管理控制器发送重启信号,以使所述基板管理控制器重启并完成故障恢复。
本发明实施例提供的基板管理控制器的故障自动恢复方法利用复杂可编程逻辑器控制所述基板管理控制器进行故障自动恢复,其中,主要是通过将所述基板管理控制器的心跳信号作为所述复杂可编程逻辑器的监测信号,例如,所述监测信号为所述复杂可编程逻辑器的watchdog信号;并由所述复杂可编程逻辑器对所述心跳信号进行实时检测,并根据所述心跳信号控制所述基板管理控制器的故障自动恢复功能。
其中,所述方法主要是通过所述复杂可编程逻辑器检测所述心跳信号的输出频率,并将所述心跳信号的输出频率与输出预设频率进行对比,根据对比结果控制是否由所述复杂可编程逻辑器向所述基板管理控制器发送重启信号,以使所述基板管理控制器重启并完成故障恢复。
同时,本实施例中所述方法还可通过所述基板管理控制器也可侦测自身各模块状态是否异常,比如侦测到网络一直处于动态主机配置协议状态,而无法获得IP地址,就可以控制心跳信号不再输出预设频率,进而使得所述复杂可编程逻辑器在短时间内完成对基板管理控制器及周边模块的重启完成故障的自动恢复。
因此,本实施例所述方法通过使用所述复杂可编程逻辑器实现基板管理控制器的故障自动恢复功能,所述方法不仅提升了服务器的维护效率;同时,还提升了所述服基板管理控制器管理稳定性。
可选地,如图2所示,所述由所述复杂可编程逻辑器接收启动信号包括:
S101、由平台控制单元经通用输入/输出接口向所述复杂可编程逻辑器发送启动信号;
S102、根据所述启动信号控制所述复杂可编程逻辑器开启或关闭基板管理控制器的故障自动恢复功能。
具体的,本实施例中平台控制单元经通用输入/输出接口输入给所述复杂可编程逻辑器一个启动信号,确认是否要开启自动恢复(重启)所述基板管理控制器功能;由于所述基板管理控制器在自我更新所述基板管理控制器固件时,所述心跳信号和所述输入/输出接口都处于不确定状态,需要所述复杂可编程逻辑器关闭所述基板管理控制器故障自动恢复功能;因此,本实施例所述方法通过所述平台控制单元向所述复杂可编程逻辑器发送启动信号进行确认,防止所述复杂可编程逻辑器收到错误信号误触发重启所述基板管理控制器,进而导致所述基板管理控制器固件升级失败,所述基板管理控制器将无法再正常工作。
其中,本实施例所述方法中所述平台控制单元的通用输入/输出接口只需通过高低电平即可控制所述复杂可编程逻辑器打开或者关闭所述基板管理控制器故障自动恢复功能;例如,选择高电平(假设3.3伏)作为打开自动恢复功能,那么低电平(0伏)即为关闭自动恢复功能。
可选地,在所述由所述基板管理控制器执行初始化进程之后,所述方法还包括:
S02、判断所述初始化进程是否执行成功,如果所述初始化进程执行成功,则向所述复杂可编程逻辑器发送初始化成功信号,并执行下一步;如果所述初始化进程未执行成功,则向所述复杂可编程逻辑器发送初始化失败信号,并由所述复杂可编程逻辑器关闭基板管理控制器的故障自动恢复功能。
具体的,本实施例所述方法在满足所述初始化进程执行成功且所述启动信号控制所述复杂可编程逻辑器开启基板管理控制器的故障自动恢复功能之后,再执行步骤S12。
可选地,在所述向所述复杂可编程逻辑器发送初始化成功信号之后,所述方法还包括:
由所述复杂可编程逻辑器检测在设定时间内所述心跳信号是否有输出预设频率;
如果在设定时间内所述心跳信号有输出预设频率,则继续由所述复杂可编程逻辑器检测所述心跳信号是否输出预设频率;
如果在设定时间内所述心跳信号持续不是输出预设频率,则由所述复杂可编程逻辑器向所述基板管理控制器发送重启信号,以使所述基板管理控制器重启并完成故障恢复。
具体的,本实施例中所述方法还可以在所述向所述复杂可编程逻辑器发送初始化成功信号之后,由所述复杂可编程逻辑器检测在设定时间内所述心跳信号是否有输出预设频率控制所述基板管理控制器的故障自动恢复功能。
例如,所述方法当所述基板管理控制器执行完初始化进程后,所述基板管理控制器软件接管所述心跳信号,并输出预设固定频率的方波,例如1HZ,同时所述基板管理控制器的通用输入/输出接口向所述复杂可编程逻辑器发送初始化成功信号,例如3.3V高电平(初始化未完成则为0V低电平)。在所述基板管理控制器初始化进程执行完成后,如果所述心跳信号持续一段时间不是1Hz方波,例如,在设定时间20S内持续检测,则由所述复杂可编程逻辑器发信号重启所述基板管理控制器及所述基板管理控制器相关***芯片,完成所述基板管理控制器故障自动恢复。所述方法还能够通过所述基板管理控制器的通用输入/输出接口所发送的初始化成功信号,进一步保证所述基板管理控制器软件已经初始化完成,避免由于所述基板管理控制器上电或者重启初始化需要一定时间,如果没有这个信号作为判断基准,导致所述复杂可编程逻辑器误触发重启基板管理控制器,进而形成死循环导致所述基板管理控制器无法工作。
本发明实施例还提供一种基板管理控制器的故障自动恢复***,如图3所示,所述***包括:
基板管理控制器11,用于执行初始化进程以及将心跳信号发送至复杂可编程逻辑器,并将所述心跳信号作为所述复杂可编程逻辑器的监测信号;
复杂可编程逻辑器12,用于接收启动信号以及检测所述心跳信号是否输出预设频率;当所述心跳信号输出预设频率时,则继续检测所述心跳信号是否输出预设频率;当所述心跳信号不是输出预设频率时,则向所述基板管理控制器发送重启信号,以使所述基板管理控制器重启并完成故障恢复。
本发明实施例提供的基板管理控制器的故障自动恢复***利用复杂可编程逻辑器控制所述基板管理控制器进行故障自动恢复,其中,主要是通过将所述基板管理控制器的心跳信号作为所述复杂可编程逻辑器的监测信号,例如,所述监测信号为所述复杂可编程逻辑器的watchdog信号;并由所述复杂可编程逻辑器对所述心跳信号进行实时检测,并根据所述心跳信号控制所述基板管理控制器的故障自动恢复功能。
其中,所述***主要是通过所述复杂可编程逻辑器检测所述心跳信号的输出频率,并将所述心跳信号的输出频率与输出预设频率进行对比,根据对比结果控制是否由所述复杂可编程逻辑器向所述基板管理控制器发送重启信号,以使所述基板管理控制器重启并完成故障恢复。
同时,本实施例中所述***还可通过所述基板管理控制器也可侦测自身各模块状态是否异常,比如侦测到网络一直处于动态主机配置协议状态,而无法获得IP地址,就可以控制心跳信号不再输出预设频率,进而使得所述复杂可编程逻辑器在短时间内完成对基板管理控制器及周边模块的重启完成故障的自动恢复。
因此,本实施例所述***通过使用所述复杂可编程逻辑器实现基板管理控制器的故障自动恢复功能,所述方法不仅提升了服务器的维护效率;同时,还提升了所述服基板管理控制器管理稳定性。
可选地,如图4所示,所述***还包括:
平台控制单元13,用于经通用输入/输出接口向所述复杂可编程逻辑器发送开启信号,并根据所述信号控制所述复杂可编程逻辑器开启或关闭基板管理控制器的故障自动恢复功能。
可选地,所述复杂可编程逻辑器包括:
信号接收模块121,用于接收所述基板管理控制器所发送的心跳信号;
信号检测模块122,用于检测所述心跳信号是否输出预设频率;
信号发送模块123,用于向所述基板管理控制器发送重启信号。
本实施例的***,可以用于执行上述方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (6)

1.一种基板管理控制器的故障自动恢复方法,其特征在于,包括:
由所述基板管理控制器执行初始化进程;
由复杂可编程逻辑器接收启动信号;
将基板管理控制器的心跳信号发送至复杂可编程逻辑器,并将所述心跳信号作为所述复杂可编程逻辑器的监测信号;
由所述复杂可编程逻辑器检测所述心跳信号是否输出预设频率;
当所述复杂可编程逻辑器检测所述心跳信号输出预设频率时,则继续由所述复杂可编程逻辑器检测所述心跳信号是否输出预设频率;
当所述复杂可编程逻辑器检测所述心跳信号不是输出预设频率时,则由所述复杂可编程逻辑器向所述基板管理控制器发送重启信号,以使所述基板管理控制器重启并完成故障恢复;
在所述由所述基板管理控制器执行初始化进程之后,所述方法包括:
判断所述初始化进程是否执行成功,如果所述初始化进程执行成功,则向所述复杂可编程逻辑器发送初始化成功信号,并执行下一步;如果所述初始化进程未执行成功,则向所述复杂可编程逻辑器发送初始化失败信号,并由所述复杂可编程逻辑器关闭基板管理控制器的故障自动恢复功能。
2.根据权利要求1所述的方法,其特征在于,所述由所述复杂可编程逻辑器接收启动信号包括:
由平台控制单元经通用输入/输出接口向所述复杂可编程逻辑器发送启动信号;
根据所述启动信号控制所述复杂可编程逻辑器开启或关闭基板管理控制器的故障自动恢复功能。
3.根据权利要求1所述的方法,其特征在于,在所述向所述复杂可编程逻辑器发送初始化成功信号之后,所述方法还包括:
由所述复杂可编程逻辑器检测在设定时间内所述心跳信号是否有输出预设频率;
如果在设定时间内所述心跳信号有输出预设频率,则继续由所述复杂可编程逻辑器检测所述心跳信号是否输出预设频率;
如果在设定时间内所述心跳信号持续不是输出预设频率,则由所述复杂可编程逻辑器向所述基板管理控制器发送重启信号,以使所述基板管理控制器重启并完成故障恢复。
4.一种基板管理控制器的故障自动恢复***,其特征在于,包括:
基板管理控制器,用于执行初始化进程以及将心跳信号发送至复杂可编程逻辑器,并将所述心跳信号作为所述复杂可编程逻辑器的监测信号;
复杂可编程逻辑器,用于接收启动信号以及检测所述心跳信号是否输出预设频率;当所述心跳信号输出预设频率时,则继续检测所述心跳信号是否输出预设频率;当所述心跳信号不是输出预设频率时,则向所述基板管理控制器发送重启信号,以使所述基板管理控制器重启并完成故障恢复;
所述基板管理控制器的故障自动恢复***还用于在所述由所述基板管理控制器执行初始化进程之后,判断所述初始化进程是否执行成功,如果所述初始化进程执行成功,则向所述复杂可编程逻辑器发送初始化成功信号,并执行下一步;如果所述初始化进程未执行成功,则向所述复杂可编程逻辑器发送初始化失败信号,并由所述复杂可编程逻辑器关闭基板管理控制器的故障自动恢复功能。
5.根据权利要求4所述的***,其特征在于,所述***还包括:
平台控制单元,用于经通用输入/输出接口向所述复杂可编程逻辑器发送开启信号,并根据所述信号控制所述复杂可编程逻辑器开启或关闭基板管理控制器的故障自动恢复功能。
6.根据权利要求4或5所述的***,其特征在于,所述复杂可编程逻辑器包括:
信号接收模块,用于接收所述基板管理控制器所发送的心跳信号;
信号检测模块,用于检测所述心跳信号是否输出预设频率;
信号发送模块,用于向所述基板管理控制器发送重启信号。
CN201711424949.4A 2017-12-25 2017-12-25 一种基板管理控制器的故障自动恢复方法及*** Active CN108038019B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711424949.4A CN108038019B (zh) 2017-12-25 2017-12-25 一种基板管理控制器的故障自动恢复方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711424949.4A CN108038019B (zh) 2017-12-25 2017-12-25 一种基板管理控制器的故障自动恢复方法及***

Publications (2)

Publication Number Publication Date
CN108038019A CN108038019A (zh) 2018-05-15
CN108038019B true CN108038019B (zh) 2021-06-11

Family

ID=62101154

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711424949.4A Active CN108038019B (zh) 2017-12-25 2017-12-25 一种基板管理控制器的故障自动恢复方法及***

Country Status (1)

Country Link
CN (1) CN108038019B (zh)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109032639A (zh) * 2018-07-19 2018-12-18 郑州云海信息技术有限公司 一种整机逻辑***升级方法、***及独立逻辑装置
CN109254894B (zh) * 2018-08-20 2022-03-11 中科曙光信息产业成都有限公司 芯片的心跳监测装置及方法
CN109240851A (zh) * 2018-08-24 2019-01-18 郑州云海信息技术有限公司 一种自主式实现批量bmc自恢复的方法及***
CN109032362A (zh) * 2018-08-31 2018-12-18 苏州竹原信息科技有限公司 一种基于vr的教学***及其控制方法
CN109656739A (zh) * 2018-12-10 2019-04-19 英业达科技有限公司 服务方法、***、主板及计算机可读存储介质
CN109669711B (zh) * 2018-12-14 2021-10-29 郑州云海信息技术有限公司 一种服务器自主刷新cpld的方法及bmc
TWI697768B (zh) * 2019-03-07 2020-07-01 神雲科技股份有限公司 重置基板管理控制器的控制方法
CN111913551B (zh) * 2019-05-08 2024-04-19 佛山市顺德区顺达电脑厂有限公司 重置基板管理控制器的控制方法
CN110213136B (zh) * 2019-06-24 2022-03-04 山信软件股份有限公司 一种通讯控制方法及***
CN111124849A (zh) * 2019-11-08 2020-05-08 苏州浪潮智能科技有限公司 一种服务器故障告警的方法、设备及介质
CN111367700A (zh) * 2020-02-28 2020-07-03 苏州浪潮智能科技有限公司 一种bmc宕住后的强制恢复方法、***及相关组件
CN111813600A (zh) * 2020-06-29 2020-10-23 中国长城科技集团股份有限公司 一种控制器的恢复方法、装置、终端和介质
CN111966559B (zh) * 2020-07-14 2023-12-15 中国长城科技集团股份有限公司 一种故障恢复方法、装置、电子设备和存储介质
CN111984464B (zh) * 2020-07-25 2023-01-10 苏州浪潮智能科技有限公司 一种可编程逻辑器件监控重启方法、装置及***
CN112000995B (zh) * 2020-08-06 2022-12-09 苏州浪潮智能科技有限公司 一种新型的机箱入侵警告***及方法
CN113359967B (zh) * 2021-04-15 2022-04-22 山东英信计算机技术有限公司 一种设备启动方法和装置
CN113918383A (zh) * 2021-10-12 2022-01-11 北京百度网讯科技有限公司 核心板复位方法、装置、设备、存储介质以及程序产品
CN116974829A (zh) * 2022-04-24 2023-10-31 富联精密电子(天津)有限公司 基板管理控制器检测***及方法
CN115237644B (zh) * 2022-06-16 2024-04-23 广州汽车集团股份有限公司 ***故障处理方法、中央运算单元以及车辆
CN116820827B (zh) * 2023-08-28 2024-01-23 苏州浪潮智能科技有限公司 一种节点服务器的基板管理控制器的控制方法及其***

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW201227272A (en) * 2010-12-22 2012-07-01 Inventec Corp A detect device of the peripheral component
CN103835972A (zh) * 2012-11-20 2014-06-04 英业达科技有限公司 风扇转速控制***及用以控制风扇转速的方法
CN103885860A (zh) * 2014-03-21 2014-06-25 浪潮集团有限公司 一种应用ipmi命令实现bmc双管理热冗余的方法
CN105959151A (zh) * 2016-06-22 2016-09-21 中国工商银行股份有限公司 一种高可用的流式处理***及方法
CN107145428A (zh) * 2017-05-26 2017-09-08 郑州云海信息技术有限公司 一种服务器及服务器监控方法
CN206647293U (zh) * 2017-03-03 2017-11-17 郑州云海信息技术有限公司 一种基于cpld的服务器风扇转速控制***

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010026677A (ja) * 2008-07-17 2010-02-04 Hitachi Ltd ファイル共有装置及びファイル共有システム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW201227272A (en) * 2010-12-22 2012-07-01 Inventec Corp A detect device of the peripheral component
CN103835972A (zh) * 2012-11-20 2014-06-04 英业达科技有限公司 风扇转速控制***及用以控制风扇转速的方法
CN103885860A (zh) * 2014-03-21 2014-06-25 浪潮集团有限公司 一种应用ipmi命令实现bmc双管理热冗余的方法
CN105959151A (zh) * 2016-06-22 2016-09-21 中国工商银行股份有限公司 一种高可用的流式处理***及方法
CN206647293U (zh) * 2017-03-03 2017-11-17 郑州云海信息技术有限公司 一种基于cpld的服务器风扇转速控制***
CN107145428A (zh) * 2017-05-26 2017-09-08 郑州云海信息技术有限公司 一种服务器及服务器监控方法

Also Published As

Publication number Publication date
CN108038019A (zh) 2018-05-15

Similar Documents

Publication Publication Date Title
CN108038019B (zh) 一种基板管理控制器的故障自动恢复方法及***
US9798632B2 (en) Providing boot data in a cluster network environment
US9582373B2 (en) Methods and systems to hot-swap a virtual machine
CN107171833B (zh) 一种通过bmc实现服务器bmc和bios批量升级方法
US10866623B2 (en) Information handling system and method to detect and recover from no power/no post failures
US10404538B1 (en) Remote platform configuration
US20190266011A1 (en) Task processing method, apparatus, and system based on distributed system
WO2018095414A1 (zh) 虚拟机故障的检测和恢复方法及装置
US20200310933A1 (en) Device fault processing method, apparatus, and system
JP2020035430A (ja) ホットバックアップシステム、ホットバックアップ方法、及びコンピュータ機器
TW201502774A (zh) 協調分散式系統中的故障復原
CN110109782B (zh) 一种故障PCIe设备的更换方法、装置及***
TWI576706B (zh) 用於早期啟動階段之方法及相關裝置
CN105607972B (zh) 一种异常修复的方法及装置
RU2614569C2 (ru) Стойка с функцией автоматического восстановления и способ автоматического восстановления для этой стойки
CN105260274A (zh) 一种基于linux下的硬盘随机热拔插稳定性检测方法
CN105204955A (zh) 一种虚拟机故障修复方法和装置
CN113656147A (zh) 一种集群部署方法、装置、设备及存储介质
CN114116280A (zh) 交互式bmc自恢复方法、***、终端及存储介质
CN115766405B (zh) 一种故障处理方法、装置、设备和存储介质
US9715423B1 (en) Automatic mapping out of the faulty device/drivers during system boot-up
CN106484442B (zh) 服务器***及更新开机映像档的方法
CN111078454A (zh) 一种云平台配置恢复方法及装置
CN111090537A (zh) 集群启动方法、装置、电子设备及可读存储介质
US11714687B2 (en) Dynamic preparation of a new network environment, and subsequent monitoring thereof

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220810

Address after: 100089 building 36, courtyard 8, Dongbeiwang West Road, Haidian District, Beijing

Patentee after: Dawning Information Industry (Beijing) Co.,Ltd.

Patentee after: DAWNING INFORMATION INDUSTRY Co.,Ltd.

Address before: 100193 No. 36 Building, No. 8 Hospital, Wangxi Road, Haidian District, Beijing

Patentee before: Dawning Information Industry (Beijing) Co.,Ltd.