CN107643965A - 一种服务器诊断方法、***、设备及计算机存储机介质 - Google Patents

一种服务器诊断方法、***、设备及计算机存储机介质 Download PDF

Info

Publication number
CN107643965A
CN107643965A CN201710912249.3A CN201710912249A CN107643965A CN 107643965 A CN107643965 A CN 107643965A CN 201710912249 A CN201710912249 A CN 201710912249A CN 107643965 A CN107643965 A CN 107643965A
Authority
CN
China
Prior art keywords
mcu
server
hardware
status information
bmc
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710912249.3A
Other languages
English (en)
Inventor
梁锐
李冠广
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201710912249.3A priority Critical patent/CN107643965A/zh
Publication of CN107643965A publication Critical patent/CN107643965A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种服务器诊断方法、***、设备及计算机存储介质,其中该方法包括:微控制单元MCU实时监测并记录服务器中与该MCU的多个管脚连接的硬件的状态信息;在BMC的触发下,MCU通过BMC的一个管脚将状态信息发送至BMC,以供外界通过BMC基于状态信息诊断引起服务器宕机的硬件问题。本发明提供的一种服务器诊断方法,借助MCU实现了通过BMC的一个管脚对多个硬件进行监测,使得BMC为外界提供的硬件的状态信息比现有技术多,从而可以为外界诊断引起服务器宕机的硬件问题提供更多的诊断依据,在一定程度上提高了对硬件问题引起的服务器宕机事件的诊断效率。本发明公开的一种服务器诊断***、设备及计算机存储介质也解决了相应技术问题。

Description

一种服务器诊断方法、***、设备及计算机存储机介质
技术领域
本发明涉及服务器诊断技术领域,更具体地说,涉及一种服务器诊断方法、***、设备及计算机存储介质。
背景技术
随着服务器提供的业务的增长以及业务稳定性要求的提高,对服务器的稳定性的要求越来越高。而服务器宕机会影响服务器的稳定性,服务器宕机的原因可能为软件问题,也可能为硬件问题,需要对引起服务器宕机的问题进行定位。
现有的服务器诊断方法可以对BIOS(Basic Input Output System,基本输入输出***)等软件问题造成的服务器宕机事件进行诊断;可以通过BMC(Baseboard ManagementController,基板管理控制器)对服务器的硬件进行监测,为外界诊断引起服务器宕机的硬件问题提供诊断依据。
然而,BMC只能通过自身的管脚与硬件连接,一个管脚连接一个硬件,受限于BMC的管脚数量,BMC只能对少数硬件进行监测,无法做到对大量硬件的监测,从而无法为外界提供充足的诊断依据,使得对硬件问题引起的服务器宕机事件的诊断效率较低。
综上所述,如何提高对硬件问题引起的服务器宕机事件的诊断效率是目前本领域技术人员亟待解决的问题。
发明内容
本发明的目的是提供一种服务器诊断方法,其能在一定程度上解决如何提高对硬件问题引起的服务器宕机事件的诊断效率的技术问题。本发明还提供了一种服务器诊断***、设备及计算机存储介质。
为了实现上述目的,本发明提供如下技术方案:
一种服务器诊断方法,包括:
微控制单元MCU实时监测并记录服务器中与该MCU的多个管脚连接的硬件的状态信息,所述MCU的管脚总数量为N;
在BMC的触发下,所述MCU通过所述BMC的一个管脚将所述状态信息发送至所述BMC,以供外界通过所述BMC基于所述状态信息诊断引起所述服务器宕机的硬件问题。
优选的,所述微控制单元MCU实时监测并记录服务器中与该MCU的多个管脚连接的硬件的状态信息,包括:
微控制单元MCU实时监测并记录服务器中与该MCU的多个管脚连接的硬件的状态信息,所述状态信息包括每一个硬件的电压信息及温度信息。
优选的,所述微控制单元MCU实时监测并记录服务器中与该MCU的多个管脚连接的硬件的状态信息,包括:
微控制单元MCU实时监测服务器中与该MCU的多个管脚连接的硬件的状态信息,并实时将所述状态信息记录至自身的预设表格中。
本发明还提供了一种服务器诊断***,包括:微控制单元MCU、BMC;
所述MCU,用于实时监测并记录服务器中与该MCU的多个管脚连接的硬件的状态信息,所述MCU的管脚总数量为N;以及用于在BMC的触发下,通过所述BMC的一个管脚将所述状态信息发送至所述BMC,以供外界通过所述BMC基于所述状态信息诊断引起所述服务器宕机的硬件问题。
优选的,所述MCU还用于实时监测并记录服务器中与该MCU的多个管脚连接的硬件的状态信息,所述状态信息包括每一个硬件的电压信息及温度信息。
优选的,所述MCU还用于实时监测服务器中与该MCU的多个管脚连接的硬件的状态信息,并实时将所述状态信息记录至自身的预设表格中。
本发明还提供了一种服务器诊断设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上任一项所述的一种服务器诊断方法的步骤。
本发明还提供了一种计算机存储介质,所述计算机存储介质上存有计算机程序,所述计算机程序被执行时实现如上任一项所述的一种服务器诊断方法的步骤。
本发明提供的一种服务器诊断方法,包括:微控制单元MCU实时监测并记录服务器中与该MCU的多个管脚的硬件的状态信息,MCU的管脚总数量为N;在BMC的触发下,MCU通过BMC的一个管脚将状态信息发送至BMC,以供外界通过BMC基于状态信息诊断引起服务器宕机的硬件问题。本发明提供的一种服务器诊断方法,MCU先实时监测并记录服务器中与该MCU的多个管脚连接的硬件的状态信息,MCU的管脚总数量为N;然后在BMC的触发下,MCU通过BMC的一个管脚将状态信息发送至BMC,以供外界通过BMC基于状态信息诊断引起服务器宕机的硬件问题。本发明提供的一种服务器诊断方法,借助MCU实时监测并记录服务器中与该MCU的多个管脚连接的硬件的状态信息,然后,在BMC的触发下,MCU通过BMC的一个管脚将状态信息发送至BMC;由于MCU有N个管脚,可以对N个硬件进行监测,而MCU只需通过BMC的一个管脚便可将监测的多个硬件的状态信息发送至BMC,相当于将BMC的一个管脚扩展为N个管脚,与现有技术中BMC一个管脚连接一个硬件相比,借助MCU实现了BMC的一个管脚连接N个硬件,从而使得BMC为外界提供的的硬件的状态信息比现有技术多,从而可以为外界诊断引起服务器宕机的硬件问题提供更多的诊断依据,进而可以提高诊断效率。综上所述,本发明提供的一种服务诊断方法在一定程度上解决了如何提高对硬件问题引起的服务器宕机事件的诊断效率的技术问题。本发明提供的一种服务器诊断***、设备及计算机存储介质也解决了相应的技术问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种服务器诊断方法的流程图;
图2为本发明实施例提供的一种服务器诊断***的结构示意图;
图3为实际应用中本发明实施例提供的一种服务器诊断***中一个BMC与两个MCU连接的结构示意图;
图4为本发明实施例提供的一种服务器诊断设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,图1为本发明实施例提供的一种服务器诊断方法的流程图。
本发明实施例提供的一种服务器诊断方法,可以包括以下步骤:
步骤S101:微控制单元MCU实时监测并记录服务器中与该MCU的多个管脚连接的硬件的状态信息,MCU的管脚总数量为N。
实际应用中,微控制单元MCU(Microcontroller Unit)先实时监测并记录服务器中的硬件的状态信息,MCU有N个管脚,每一个管脚可以与一个硬件连接,MCU的管脚总数量N可以根据实际需要确定;被监测的硬件的数量可以是根据实际需要预先确定的,比如外界根据以往的诊断经验确定的,之后便可以将待监测的硬件与对应的MCU的管脚连接,借助MCU实现对多个硬件的状态信息的监测。
步骤S102:在BMC的触发下,MCU通过BMC的一个管脚将状态信息发送至BMC,以供外界通过BMC基于状态信息诊断引起服务器宕机的硬件问题。
由于MCU实时监测并记录服务器中硬件的状态信息,这样,在服务器宕机时,便可以在BMC的触发下通过BMC的一个管脚将记录的状态信息发送至BMC,以供外界通过BMC基于状态信息诊断引起服务器宕机的硬件问题。实际应用中,一个MCU通过BMC的一个管脚与该BMC连接,MCU借助BMC的该管脚将监测的硬件的状态信息发送至BMC,由于MCU对N个硬件进行监测,而只需要BMC的一个管脚便可将被监测的硬件的状态信息发送至BMC,借助MCU相当于实现了利用BMC的一个管脚对N个硬件进行监测。外界基于状态信息诊断引起服务器宕机的硬件问题的诊断方法可以是,比较每一个硬件的状态信息是否超出预设的阈值,这里的阈值可以是根据实际情况预先确定的每一个硬件的状态信息所能达到的最大值和/或最小值,若是,则确认该硬件存在硬件问题,若否,则该硬件正常。当然还可以有其他诊断方法,本发明在这里不做具体限定。
本发明提供的一种服务器诊断方法,包括:微控制单元MCU实时监测并记录服务器中与该MCU的多个管脚连接的硬件的状态信息,MCU的管脚总数量为N;在BMC的触发下,MCU通过BMC的一个管脚将状态信息发送至BMC,以供外界通过BMC基于状态信息诊断引起服务器宕机的硬件问题。本发明提供的一种服务器诊断方法,MCU先实时监测并记录服务器中与该MCU的多个管脚连接的硬件的状态信息,MCU的管脚总数量为N;然后在BMC的触发下,MCU通过BMC的一个管脚将状态信息发送至BMC,以供外界通过BMC基于状态信息诊断引起服务器宕机的硬件问题。本发明提供的一种服务器诊断方法,借助MCU实时监测并记录服务器中与该MCU的多个管脚连接的硬件的状态信息,然后,在BMC的触发下,MCU通过BMC的一个管脚将状态信息发送至BMC;由于MCU有N个管脚,可以对N个硬件进行监测,而MCU只需通过BMC的一个管脚便可将监测的多个硬件的状态信息发送至BMC,相当于将BMC的一个管脚扩展为N个管脚,与现有技术中BMC一个管脚连接一个硬件相比,借助MCU实现了BMC的一个管脚连接N个硬件,从而使得BMC为外界提供的硬件的状态信息比现有技术多,从而可以为外界诊断引起服务器宕机的硬件问题提供更多的诊断依据,进而可以提高诊断效率。综上所述,本发明提供的一种服务诊断方法在一定程度上解决了如何提高对硬件问题引起的服务器宕机事件的诊断效率的技术问题。
本发明实施例提供的一种服务器诊断方法中,微控制单元MCU实时监测并记录服务器中与该MCU的多个管脚连接的硬件的状态信息,可以包括:
微控制单元MCU实时监测并记录服务器中与该MCU的多个管脚连接的硬件的状态信息,状态信息包括每一个硬件的电压信息及温度信息。
实际应用中,本发明实施例提供的一种服务器诊断方法中,MCU实时监测并记录的硬件的状态信息可以包括硬件的电压信息和温度信息,当然还可以根据实际情况监测并记录其他信息,本发明在这里不做具体限定。
本发明实施例提供的一种服务器诊断方法中,微控制单元MCU实时监测并记录服务器中与该MCU的多个管脚连接的硬件的状态信息,可以包括:
微控制单元MCU实时监测服务器中与该MCU的多个管脚连接的硬件的状态信息,并实时将状态信息记录至自身的预设表格中。
实际应用中,MCU可以借助表格来记录硬件的状态信息,这样可以使得记录的状态信息条理化,当然还可以有其他记录状态信息的方式,比如以脚本的形式记录状态信息等,本发明在这里不做具体限定。
本发明还提供了一种服务器诊断***,其具有本发明实施例提供的一种服务器诊断方法具有的对应效果。请参阅图2,图2为本发明实施例提供的一种服务器诊断***的结构示意图。
本发明实施例提供的一种服务器诊断***,包括:微控制单元MCU201、BMC202;
MCU201用于实时监测并记录服务器中与该MCU201的多个管脚连接的硬件的状态信息;以及用于在BMC202的触发下,通过BMC202的一个管脚将状态信息发送至BMC202,以供外界通过BMC202基于状态信息诊断引起服务器宕机的硬件问题。
实际应用中,可以按照本发明的原理,在一个BMC上连接多个MCU,其中,BMC的每个管脚连接一个MCU,实现对更多硬件的监测。下面以一个BMC连接两个MCU为例进行说明,请参阅图3,图3为实际应用中本发明实施例提供的一种服务器诊断***中一个BMC与两个MCU连接的结构示意图。其中,第一个MCU302与BMC301的第一个管脚304连接,第二个MCU303与BMC301的第二个管脚305连接。
本发明实施例提供的一种服务器诊断***中,MCU还用于实时监测并记录服务器中与该MCU的管脚连接的硬件的状态信息,状态信息包括每一个硬件的电压信息及温度信息。
本发明实施例提供的一种服务器诊断***中,MCU还用于实时监测服务器中与该MCU的多个管脚连接的硬件的状态信息,并实时将状态信息记录至自身的预设表格中。
本发明还提供了一种服务器诊断设备及计算机存储介质,其均具有本发明实施例提供的一种服务器诊断方法具有的对应效果。请参阅图4,图4为本发明实施例提供的一种服务器诊断设备的结构示意图。
本发明实施例提供的一种服务器诊断设备可以包括:
存储器B1,用于存储计算机程序;
处理器B2,用于执行计算机程序时实现如上任一项所述的一种服务器诊断方法的步骤。
本发明实施例提供的一种计算机存储介质,该计算机存储介质上存有计算机程序,计算机程序被执行时实现如上任一项所述的一种服务器诊断方法的步骤。
本发明实施例提供的一种服务器诊断***、设备及计算机存储介质中相关部分的说明请参见本发明实施例提供的一种服务器诊断方法中对应部分的详细说明,在此不再赘述。另外,本发明实施例提供的上述技术方案中与现有技术中对应技术方案实现原理一致的部分并未详细说明,以免过多赘述。
对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (8)

1.一种服务器诊断方法,其特征在于,包括:
微控制单元MCU实时监测并记录服务器中与该MCU的多个管脚连接的硬件的状态信息,所述MCU的管脚总数量为N;
在BMC的触发下,所述MCU通过所述BMC的一个管脚将所述状态信息发送至所述BMC,以供外界通过所述BMC基于所述状态信息诊断引起所述服务器宕机的硬件问题。
2.根据权利要求1所述的方法,其特征在于,所述微控制单元MCU实时监测并记录服务器中与该MCU的多个管脚连接的硬件的状态信息,包括:
微控制单元MCU实时监测并记录服务器中与该MCU的多个管脚连接的硬件的状态信息,所述状态信息包括每一个硬件的电压信息及温度信息。
3.根据权利要求2所述的方法,其特征在于,所述微控制单元MCU实时监测并记录服务器中与该MCU的多个管脚连接的硬件的状态信息,包括:
微控制单元MCU实时监测服务器中与该MCU的多个管脚连接的硬件的状态信息,并实时将所述状态信息记录至自身的预设表格中。
4.一种服务器诊断***,其特征在于,包括:微控制单元MCU、BMC;
所述MCU,用于实时监测并记录服务器中与该MCU的多个管脚连接的硬件的状态信息,所述MCU的管脚总数量为N;以及用于在BMC的触发下,通过所述BMC的一个管脚将所述状态信息发送至所述BMC,以供外界通过所述BMC基于所述状态信息诊断引起所述服务器宕机的硬件问题。
5.根据权利要求4所述的***,其特征在于,所述MCU还用于实时监测并记录服务器中与该MCU的多个管脚连接的硬件的状态信息,所述状态信息包括每一个硬件的电压信息及温度信息。
6.根据权利要求5所述的***,其特征在于,所述MCU还用于实时监测服务器中与该MCU的多个管脚连接的硬件的状态信息,并实时将所述状态信息记录至自身的预设表格中。
7.一种服务器诊断设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至3任一项所述的一种服务器诊断方法的步骤。
8.一种计算机存储介质,其特征在于,所述计算机存储介质上存有计算机程序,所述计算机程序被执行时实现如权利要求1至3任一项所述的一种服务器诊断方法的步骤。
CN201710912249.3A 2017-09-29 2017-09-29 一种服务器诊断方法、***、设备及计算机存储机介质 Pending CN107643965A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710912249.3A CN107643965A (zh) 2017-09-29 2017-09-29 一种服务器诊断方法、***、设备及计算机存储机介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710912249.3A CN107643965A (zh) 2017-09-29 2017-09-29 一种服务器诊断方法、***、设备及计算机存储机介质

Publications (1)

Publication Number Publication Date
CN107643965A true CN107643965A (zh) 2018-01-30

Family

ID=61122716

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710912249.3A Pending CN107643965A (zh) 2017-09-29 2017-09-29 一种服务器诊断方法、***、设备及计算机存储机介质

Country Status (1)

Country Link
CN (1) CN107643965A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110609778A (zh) * 2019-08-16 2019-12-24 苏州浪潮智能科技有限公司 一种保存服务器宕机日志的方法及***
CN114328104A (zh) * 2021-12-25 2022-04-12 深圳市锐宝智联信息有限公司 一种工控整机健康状态监测方法、***、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101126995A (zh) * 2006-08-14 2008-02-20 国际商业机器公司 处理严重硬件错误的方法及设备
CN104123213A (zh) * 2014-08-08 2014-10-29 浪潮电子信息产业股份有限公司 一种sas硬盘背板远程管理***
CN104320308A (zh) * 2014-11-12 2015-01-28 浪潮(北京)电子信息产业有限公司 一种服务器异常检测的方法及装置
CN105487959A (zh) * 2015-12-09 2016-04-13 浪潮电子信息产业股份有限公司 一种intel NVMe硬盘的管理方法
CN106960689A (zh) * 2017-03-27 2017-07-18 联想(北京)有限公司 控制提示灯的方法及***

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101126995A (zh) * 2006-08-14 2008-02-20 国际商业机器公司 处理严重硬件错误的方法及设备
CN104123213A (zh) * 2014-08-08 2014-10-29 浪潮电子信息产业股份有限公司 一种sas硬盘背板远程管理***
CN104320308A (zh) * 2014-11-12 2015-01-28 浪潮(北京)电子信息产业有限公司 一种服务器异常检测的方法及装置
CN105487959A (zh) * 2015-12-09 2016-04-13 浪潮电子信息产业股份有限公司 一种intel NVMe硬盘的管理方法
CN106960689A (zh) * 2017-03-27 2017-07-18 联想(北京)有限公司 控制提示灯的方法及***

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110609778A (zh) * 2019-08-16 2019-12-24 苏州浪潮智能科技有限公司 一种保存服务器宕机日志的方法及***
CN114328104A (zh) * 2021-12-25 2022-04-12 深圳市锐宝智联信息有限公司 一种工控整机健康状态监测方法、***、设备及存储介质
CN114328104B (zh) * 2021-12-25 2023-05-16 深圳市锐宝智联信息有限公司 一种工控整机健康状态监测方法、***、设备及存储介质

Similar Documents

Publication Publication Date Title
CN104813622B (zh) 数据收集-转发装置
EP2696534B1 (en) Method and device for monitoring quick path interconnect link
US20140136896A1 (en) Diagnosing distributed applications using application logs and request processing paths
CN103728514B (zh) 一种低压变频器故障诊断方法
TW200403563A (en) Method and system to implement a system event log for system manageability
DE112010002778T5 (de) Rauschunterdrückung zur Begrenzung von falschem Wecken
DE102007052180A1 (de) Verfahren, Rechnersystem und Computerprogrammprodukt
CN105974252B (zh) 一种pwm输出故障诊断方法及***
CN107643965A (zh) 一种服务器诊断方法、***、设备及计算机存储机介质
CN107967195A (zh) 一种基于双控存储的故障修复方法及***
CN109587331A (zh) 云手机故障自动修复的方法与***
CN106598700A (zh) 基于pacemaker的虚拟机的秒级高可用实现方法
CN109697142A (zh) 一种云计算环境下裸金属服务器的检测方法及设备
CN106909307A (zh) 一种管理双活存储阵列的方法及装置
CN109213659A (zh) 一种设备内存状态的监测方法、装置及存储介质
CN109947636A (zh) 异常线程定位方法及装置
CN106899436A (zh) 一种云平台故障预测诊断***
CN110502376A (zh) 一种硬盘上下电测试方法与装置
CN108600007A (zh) 一种云平台责任追溯方法和***
CN106897189A (zh) 一种基于数据实时推送的日志监控***
CN108108276A (zh) 一种针对日志报警功能的通用测试方法及装置
CN109933479A (zh) 故障模拟与仿真方法以及相关设备
CN106416133B (zh) 最优心跳周期的确定方法、装置和设备
CN116775376A (zh) 处理NVMe盘链路故障的方法、***、设备和存储介质
CN106155793A (zh) 一种资源调度方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180130

RJ01 Rejection of invention patent application after publication