CN115934446A - 一种自检方法、服务器、设备和存储介质 - Google Patents

一种自检方法、服务器、设备和存储介质 Download PDF

Info

Publication number
CN115934446A
CN115934446A CN202211676913.6A CN202211676913A CN115934446A CN 115934446 A CN115934446 A CN 115934446A CN 202211676913 A CN202211676913 A CN 202211676913A CN 115934446 A CN115934446 A CN 115934446A
Authority
CN
China
Prior art keywords
self
bmc
bus interface
state information
sensor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211676913.6A
Other languages
English (en)
Inventor
季银涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202211676913.6A priority Critical patent/CN115934446A/zh
Publication of CN115934446A publication Critical patent/CN115934446A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Test And Diagnosis Of Digital Computers (AREA)

Abstract

本发明实施例提供了一种自检方法、服务器、设备和存储介质,该方法包括:在总线接口功能正常的情况下,自检模块向BMC发送第一请求;自检模块接收第一应答信息,第一应答信息包括BMC发送的传感器的状态信息和硬件模块的状态信息;自检模块根据传感器采集的硬件模块的运行状态数据,确认传感器的功能是否正常,以及根据硬件模块的连接状态信息和启动状态信息,确认硬件模块是否正常启动。通过自检模块对BMC服务器中的传感器以及硬件模块的状态进行检查,可以及时发现BMC服务器的故障状态和故障位置,便于维护人员提前发现并解决故障问题,降低用户使用过程中出现故障的概率,提高BMC服务器稳定性。

Description

一种自检方法、服务器、设备和存储介质
技术领域
本发明涉及服务器技术领域,特别是涉及一种自检方法、一种服务器、一种自检设备和一种自检存储介质。
背景技术
基板管理控制器(Baseboard Manager Controller,简称BMC)是服务器中具有硬件管理和监控功能的管理控制器,具有最高的物理设备和网络访问权限。随着计算机网络的不断发展,服务器客户业务量不断增加,部署的服务器数量也不断增加,BMC是服务器中具有硬件管理和监控功能的管理控制器,具有最高的物理设备和网络访问权限。随着服务器数量的增加,运维人员管理服务器的难度也在增大,出现宕机等问题时的分析成本越来越高。例如,在i2c总线(Inter-Integrated Circuit,一种同步、半双工的通信总线)、GPIO总线(General-purpose input/output,通用输入/输出口)等基础链路的健康状态未知的情况下发起数据处理、部件监控等进程,会出现复杂的故障情况,后续分析过程困难且易陷入误区。
发明内容
鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种自检方法、一种服务器、一种自检设备和一种自检存储介质。
为了解决上述问题,本发明实施例公开了一种自检方法,应用于基板管理控制器BMC服务器,所述BMC服务器包括自检模块、BMC、总线接口、与所述总线接口连接的传感器和与所述总线接口连接的硬件模块,所述方法包括:
在所述总线接口功能正常的情况下,所述自检模块向所述BMC发送第一请求;所述第一请求用于指示获取所述传感器的状态信息和所述硬件模块的状态信息;
所述自检模块接收第一应答信息,所述第一应答信息包括所述BMC发送的所述传感器的状态信息和所述硬件模块的状态信息;所述传感器的状态信息包括采集的所述硬件模块的运行状态数据;所述硬件模块的状态信包括连接状态信息和启动状态信息;
所述自检模块根据所述传感器采集的所述硬件模块的运行状态数据,确认所述传感器的功能是否正常,以及根据所述硬件模块的连接状态信息和启动状态信息,确认所述硬件模块是否正常启动。
可选地,还包括:
所述自检模块向所述BMC发送第二请求,以检测所述总线接口功能是否正常;所述第二请求为对所述总线接口进行检测的请求;
所述自检模块接收第二应答信息,所述第二应答信息为所述BMC发送的用于应答所述总线接口功能为正常或异常的信息。
可选地,所述总线接口包括通用输入/输出GPIO总线接口,所述自检模块向所述BMC发送第二请求,以检测所述总线接口功能是否正常,包括:
所述自检模块向所述BMC发送对所述GPIO总线接口进行读或写的命令,以检测所述GPIO总线接口功能是否正常。
可选地,所述总线接口包括内部集成电路i2c总线接口,所述自检模块向所述BMC发送第二请求,以检测所述总线接口功能是否正常,包括:
所述自检模块向所述BMC发送对所述i2c总线接口进行读或写的命令,以检测所述i2c总线接口功能是否正常。
可选地,所述第一请求包括对所述传感器进行读的命令和对所述硬件模块进行读/写的命令;所述对所述传感器进行读的命令用于指示获取所述传感器的状态信息;所述对所述硬件模块进行读/写的命令用于指示获取所述硬件模块的状态信息。
可选地,还包括:
所述自检模块根据所述第一请求、所述第一应答信息、所述第二请求、所述第二应答信息,生成自检报告。
可选地,还包括:
所述自检模块向所述BMC发送基础输入输出***BIOS的重启命令,以使所述BIOS根据所述重启命令进行开机自检,并将开机自检结果发送至所述自检模块;
所述自检模块接收所述开机自检结果并对所述自检结果进行分析。
本发明实施例还公开了一种服务器,包括:自检模块、基板管理控制器BMC、总线接口、与所述总线接口连接的传感器和与所述总线接口连接的硬件模块;
所述自检模块用于在所述总线接口功能正常的情况下,向所述BMC发送第一请求;所述第一请求用于指示获取所述传感器的状态信息和所述硬件模块的状态信息;接收第一应答信息,所述第一应答信息包括所述BMC发送的所述传感器的状态信息和所述硬件模块的状态信息;所述传感器的状态信息包括采集的所述硬件模块的运行状态数据;所述硬件模块的状态信包括连接状态信息和启动状态信息;根据所述传感器采集的所述硬件模块的运行状态数据,确认所述传感器的功能是否正常,以及根据所述硬件模块的连接状态信息和启动状态信息,确认所述硬件模块是否正常启动。
可选地,所述自检模块还用于向所述BMC发送第二请求,以检测所述总线接口功能是否正常;所述第二请求为对所述总线接口进行检测的请求;接收第二应答信息,所述第二应答信息为所述BMC发送的用于应答所述总线接口功能为正常或异常的信息。
可选地,所述总线接口包括通用输入/输出GPIO总线接口,所述自检模块用于向所述BMC发送对所述GPIO总线接口进行读或写的命令,以检测所述GPIO总线接口功能是否正常。
可选地,所述总线接口包括内部集成电路i2c总线接口,所述自检模块用于向所述BMC发送对所述i2c总线接口进行读或写的命令,以检测所述i2c总线接口功能是否正常。
可选地,所述第一请求包括对所述传感器进行读的命令和对所述硬件模块进行读/写的命令;所述对所述传感器进行读的命令用于指示获取所述传感器的状态信息;所述对所述硬件模块进行读/写的命令用于指示获取所述硬件模块的状态信息。
可选地,所述自检模块还用于根据所述第一请求、所述第一应答信息、所述第二请求、所述第二应答信息,生成自检报告。
可选地,所述自检模块还用于向所述BMC发送基础输入输出***BIOS的重启命令,以使所述BIOS根据所述重启命令进行开机自检,并将开机自检结果发送至所述自检模块;接收所述开机自检结果并对所述自检结果进行分析。
本发明实施例还公开了一种电子设备,包括:处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上述的自检方法的步骤。
本发明实施例还公开了一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如上述的自检方法的步骤。
本发明实施例包括以下优点:
在本发明实施例中,在总线接口功能正常的情况下,自检模块向BMC发送第一请求;第一请求用于指示获取传感器的状态信息和硬件模块的状态信息;自检模块接收第一应答信息,第一应答信息包括BMC发送的传感器的状态信息和硬件模块的状态信息;传感器的状态信息包括采集的硬件模块的运行状态数据;硬件模块的状态信包括连接状态信息和启动状态信息;自检模块根据传感器采集的硬件模块的运行状态数据,确认传感器的功能是否正常,以及根据硬件模块的连接状态信息和启动状态信息,确认硬件模块是否正常启动。通过自检模块对BMC服务器中的传感器以及硬件模块的状态进行检查,可以及时发现BMC服务器的故障状态和故障位置,便于维护人员提前发现并解决故障问题,降低用户使用过程中出现故障的概率,提高BMC服务器稳定性。
附图说明
图1是本发明实施例提供的一种自检方法的步骤流程图;
图2是本发明实施例提供的另一种自检方法的步骤流程图;
图3是本发明实施例提供的一种服务器的结构框图;
图4是本发明实施例提供的一种电子设备;
图5是本发明实施例提供的一种计算机可读存储介质。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
现有技术中,BMC服务器的启动过程中不包括自检过程,无法确认与BMC服务器的总线接口通信连接的BMC服务器中的各硬件装置以及传感器的状态,不利于维护人员及时发现服务器的故障状态和故障位置,BMC服务器稳定性低,用户使用过程中出现故障的概率较高。
本发明实施例的核心构思之一在于,在BMC服务器启动过程中,通过自检模块对BMC服务器中的传感器以及硬件设备的状态进行检查,可以尽早发现服务器的故障状态和故障位置,便于维护人员提前发现并解决故障问题,降低客户使用过程中出现故障的概率,提高服务器稳定性。
参照图1,示出了本发明实施例提供的一种自检方法的步骤流程图,应用于基板管理控制器BMC服务器,所述BMC服务器包括自检模块、BMC、总线接口、与所述总线接口连接的硬件模块和与所述总线接口连接的传感器所述方法具体可以包括如下步骤:
步骤101,在所述总线接口功能正常的情况下,所述自检模块向所述BMC发送第一请求;所述第一请求用于指示获取所述传感器的状态信息和所述硬件模块的状态信息。
在本发明实施例中,BMC服务器可以包括BMC、自检模块、总线接口、与总线接口连接的硬件模块和与总线接口连接的传感器。
作为一种示例,硬件模块可以包括BMC服务器中的CPU、GPU、内存、电源、风扇等等硬件设备,本发明实施例在此不做限制。
作为一种示例,传感器可以包括电压传感器、温度传感器、功耗传感器等等,不同类型的传感器可以为多个,可以分别采集不同硬件的状态信息。本领域技术人员可以根据实际情况进行灵活设置,本发明实施例在此不做限制。
作为一种示例,BMC服务器可以通过总线接口与多个硬件模块或多个传感器进行通信。
示例性地,在总线接口功能正常的情况下,自检模块可以向BMC发送获取传感器的状态信息请求以及硬件模块的状态信息的请求。
步骤102,所述自检模块接收第一应答信息,所述第一应答信息包括所述BMC发送的所述传感器的状态信息和所述硬件模块的状态信息;所述传感器的状态信息包括采集的所述硬件模块的运行状态数据;所述硬件模块的状态信包括连接状态信息和启动状态信息。
示例性地,在总线的接口功能正常的情况下,自检组件可以向BMC控制器发送第一请求,以使BMC控制器根据第一请求,获取传感器的状态信息和硬件模块的状态信息,并将传感器的状态信息和硬件模块的状态信息作为第一应答信息发送至自检组件。
作为一种示例,传感器的状态信息可以包括采集的硬件模块的运行状态数据。例如,采集BMC服务器中的CPU的温度数据、BMC服务器中的风扇的功耗数据、BMC服务器中的电池的电压数据等等。
作为一种示例,硬件模块的状态信可以包括连接状态信息和启动状态信息。其中,连接状态信息可以指与总线接口连接的传感器或设备是否连通,启动状态信息可以指与总线接口连接的传感器或设备是否启动正常。
步骤103,所述自检模块根据所述传感器采集的所述硬件模块的运行状态数据,确认所述传感器的功能是否正常,以及根据所述硬件模块的连接状态信息和启动状态信息,确认所述硬件模块是否正常启动。
示例性地,自检模块可以根据传感器采集的硬件模块的运行状态数据,确认传感器的功能是否正常,以及可以根据硬件模块的连接状态信息和启动状态信息,确认硬件模块是否正常启动。
在本发明实施例中,在总线接口功能正常的情况下,自检模块向BMC发送第一请求;第一请求用于指示获取传感器的状态信息和硬件模块的状态信息;自检模块接收第一应答信息,第一应答信息包括BMC发送的传感器的状态信息和硬件模块的状态信息;传感器的状态信息包括采集的硬件模块的运行状态数据;硬件模块的状态信包括连接状态信息和启动状态信息;自检模块根据传感器采集的硬件模块的运行状态数据,确认传感器的功能是否正常,以及根据硬件模块的连接状态信息和启动状态信息,确认硬件模块是否正常启动。通过自检模块对BMC服务器中的传感器以及硬件模块的状态进行检查,可以及时发现BMC服务器的故障状态和故障位置,便于维护人员提前发现并解决故障问题,降低用户使用过程中出现故障的概率,提高BMC服务器稳定性。
参照图2,示出了本发明实施例提供的另一种自检方法的步骤流程图,应用于基板管理控制器BMC服务器,所述BMC服务器包括BMC、自检模块、总线接口、与所述总线接口连接的硬件模块和与所述总线接口连接的传感器所述方法具体可以包括如下步骤:
步骤201,所述自检模块向所述BMC发送第二请求,以检测所述总线接口功能是否正常;所述第二请求为对所述总线接口进行检测的请求。
作为一种示例,自检模块可以通过向BMC发送第二请求,以检测总线接口功能是否正常。
例如,向BMC发送检测i2c总线接口的命令,以检测BMC服务器上的i2c总线接口功能是否正常;向BMC发送检测GPIO总线接口的命令,以检测BMC服务器上的GPIO总线接口功能是否正常。
在本发明的一种实施例中,所述总线接口包括通用输入/输出GPIO总线接口,所述自检模块向所述BMC发送第二请求,以检测所述总线接口功能是否正常,包括:所述自检模块向所述BMC发送对所述GPIO总线接口进行读或写的命令,以检测所述GPIO总线接口功能是否正常。
通用输入输出(general porpose intput output,GPIO)总线接口,STM32芯片的GPIO引脚与外部设备连接起来,用户可以通过GPIO口和硬件进行数据交互(如UART),控制硬件工作(如LED、蜂鸣器等),读取硬件的工作状态信号(如中断信号)等。
作为一种示例,自检模块可以向BMC发送对GPIO总线接口进行读或写的命令,以检测所述GPIO总线接口功能是否正常。
在本发明的一种实施例中,所述总线接口包括内部集成电路i2c总线接口,所述自检模块向所述BMC发送第二请求,以检测所述总线接口功能是否正常,包括:所述自检模块向所述BMC发送对所述i2c总线接口进行读或写的命令,以检测所述i2c总线接口功能是否正常。
内部集成电路(Inter-Integrated Circuit,i2c)总线接口,一种同步、半双工的通信总线,可以通过串行数据线和串行时钟线在连结于总线上的器件之间传送信息。
作为一种示例,自检模块可以向BMC发送对i2c总线接口进行读或写的命令,以检测i2c总线接口功能是否正常。
步骤202,所述自检模块接收第二应答信息,所述第二应答信息为所述BMC发送的用于应答所述总线接口功能为正常或异常的信息。
在本发明实施例中,BMC在接收到自检模块发送的第二请求后,可以根据第二请求向自检模块发送对应的第二应答信息。
作为一种示例,BMC可以根据对总线接口进行检测的第二请求,返回总线接口功能为正常或异常的第二应答信息。
作为一种示例,自检模块可以接收BMC发送的第二应答信息,从而可以确定总线接口功能的正常或异常情况。
例如,自检模块可以向BMC发送对GPIO总线接口进行读或写的命令,若BMC服务器根据该命令,向自检模块返回正确的对GPIO总线接口读取或写入的数据,则可以确定GPIO总线接口功能正常。若BMC服务器根据该命令,向自检模块返回错误的对GPIO总线接口读取或写入的数据,则可以确定GPIO总线接口功能异常。
例如,自检模块可以向BMC发送对i2c总线接口进行读或写的命令,若BMC服务器根据该命令,向自检模块返回正确的对i2c总线接口读取或写入的数据,则可以确定i2c总线接口功能正常。若BMC服务器根据该命令,向自检模块返回错误的对i2c总线接口读取或写入的数据,则可以确定i2c总线接口功能异常。
步骤203,在所述总线接口功能正常的情况下,所述自检模块向所述BMC发送第一请求;所述第一请求用于指示获取所述传感器的状态信息和所述硬件模块的状态信息。
在具体实现中,在总线接口功能正常的情况下,自检模块可以向BMC发送获取传感器的状态信息和硬件模块的状态信息第一请求,与前述实施例中步骤101类似,可以相互参照,本实施例对此不再赘述。
在本发明的一种实施例中,所述第一请求包括对所述传感器进行读的命令和对所述硬件模块进行读/写的命令;所述对所述传感器进行读的命令用于指示获取所述传感器的状态信息;所述对所述硬件模块进行读/写的命令用于指示获取所述硬件模块的状态信息。
作为一种示例,在总线接口功能正常的情况下,自检模块可以向BMC发送对传感器进行读的命令,以使BMC根据对传感器进行读的命令,获取传感器的状态信息。
作为一种示例,在总线接口功能正常的情况下,自检模块可以向BMC发送对硬件模块进行读/写的命令,以使BMC根据对硬件模块进行读/写的命令,获取硬件模块的状态信息。
步骤204,所述自检模块接收第一应答信息,所述第一应答信息包括所述BMC发送的所述传感器的状态信息和所述硬件模块的状态信息;所述传感器的状态信息包括采集的所述硬件模块的运行状态数据;所述硬件模块的状态信包括连接状态信息和启动状态信息。
作为一种示例,BMC根据对传感器进行读的命令,获取传感器采集的BMC服务器中的硬件模块的运行状态数据,如各硬件模块的温度、功耗、电压等等。
作为一种示例,BMC根据对硬件模块进行读/写的命令,获取硬件模块的连接状态信息和启动状态信息,如获取BMC服务器中的风扇是否与i2c总线接口连通、风扇是否正常启动等等。
步骤205,所述自检模块根据所述传感器采集的所述硬件模块的运行状态数据,确认所述传感器的功能是否正常,以及根据所述硬件模块的连接状态信息和启动状态信息,确认所述硬件模块是否正常启动。
在具体的实现中,自检模块可以根据传感器和硬件模块状态数据判断传感器的功能是否正常、硬件模块是否正常启动,与前述实施例中步骤103类似,可以相互参照,本实施例对此不再赘述。
在本发明的一种实施例中,所述自检模块向所述BMC发送基础输入输出***BIOS的重启命令,以使所述BIOS根据所述重启命令进行开机自检,并将开机自检结果发送至所述自检模块;所述自检模块接收所述开机自检结果并对所述自检结果进行分析。
在本发明实施例中,自检模块可以向BMC发送基础输入输出***BIOS的重启命令,以使BIOS根据重启命令进行开机自检,并将开机自检结果发送至自检模块。自检模块可以接收开机自检结果并对自检结果进行分析。
基本输入输出***(Basic Input Output System,BIOS),是集成在主板上的一个ROM芯片,其中保存有微机***最重要的基本输入/输出程序、***信息设置、开机上电自检程序和***启动自检程序。开机后BIOS最先被启动,然后对服务器中的硬件模块进行完全的检验和测试。
智能平台管理接口(Intelligent Platform Management Interface,IPMI),作为一个专用芯片/控制器(BMC),独立于操作***、BIOS和处理器,属于带外管理设备。可以通过BMC来控制或者获取IPMI中的各种信息。
在本发明实施例中,BMC可以通过IPMI与BIOS进行通信。
作为一种示例,自检模块可以向BMC发送基础输入输出***BIOS的重启命令,BMC可以根据BIOS的重启命令,通过IPMI向BIOS发送重启命令,以使BIOS进行开机自检。BIOS可以将开机自检结果发送给自检模块,自检模块可以记录自检结果并分析自检结果。
步骤206,所述自检模块根据所述第一请求、所述第一应答信息、所述第二请求、所述第二应答信息,生成自检报告。
在本发明实施例中,自检模块可以记录每次向BMC发送的请求和BMC返回的应答信息。
示例性地,自检模块可以根据第一请求、第一应答信息、第二请求、以及第二应答信息,生成自检报告。
作为一种示例,可以将生成的自检报告存放在BMC文件***中,以便用户通过BMCweb下载或者***存储设备导出。
在本发明实施例中,在总线接口功能正常的情况下,自检模块向BMC发送第一请求;第一请求用于指示获取传感器的状态信息和硬件模块的状态信息;自检模块接收第一应答信息,第一应答信息包括BMC发送的传感器的状态信息和硬件模块的状态信息;传感器的状态信息包括采集的硬件模块的运行状态数据;硬件模块的状态信包括连接状态信息和启动状态信息;自检模块根据传感器采集的硬件模块的运行状态数据,确认传感器的功能是否正常,以及根据硬件模块的连接状态信息和启动状态信息,确认硬件模块是否正常启动。通过自检模块对BMC服务器中的传感器以及硬件模块的状态进行检查,可以及时发现BMC服务器的故障状态和故障位置,便于维护人员提前发现并解决故障问题,降低用户使用过程中出现故障的概率,提高BMC服务器稳定性。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
参照图3,示出了本发明实施例提供的一种服务器30的结构框图,具体可以包括:自检模块301、基板管理控制器BMC302、总线接口303、与所述总线接口连接的传感器304与和所述总线接口连接的硬件模块305;
所述自检模块301用于在所述总线接口303功能正常的情况下,向所述BMC302发送第一请求;所述第一请求用于指示获取所述传感器304的状态信息和所述硬件模块305的状态信息;接收第一应答信息,所述第一应答信息包括所述BMC302发送的所述传感器304的状态信息和所述硬件模块305的状态信息;所述传感器304的状态信息包括采集的所述硬件模块305的运行状态数据;所述硬件模块305的状态信包括连接状态信息和启动状态信息;根据所述传感器304采集的所述硬件模块305的运行状态数据,确认所述传感器304的功能是否正常,以及根据所述硬件模块305的连接状态信息和启动状态信息,确认所述硬件模块305是否正常启动。
在一种可选的实施例中,所述自检模块还用于向所述BMC发送第二请求,以检测所述总线接口功能是否正常;所述第二请求为对所述总线接口进行检测的请求;接收第二应答信息,所述第二应答信息为所述BMC发送的用于应答所述总线接口功能为正常或异常的信息。
在一种可选的实施例中,所述总线接口包括通用输入/输出GPIO总线接口,所述自检模块用于向所述BMC发送对所述GPIO总线接口进行读或写的命令,以检测所述GPIO总线接口功能是否正常。
在一种可选的实施例中,所述总线接口包括内部集成电路i2c总线接口,所述自检模块用于向所述BMC发送对所述i2c总线接口进行读或写的命令,以检测所述i2c总线接口功能是否正常。
在一种可选的实施例中,所述第一请求包括对所述传感器进行读的命令和对所述硬件模块进行读/写的命令;所述对所述传感器进行读的命令用于指示获取所述传感器的状态信息;所述对所述硬件模块进行读/写的命令用于指示获取所述硬件模块的状态信息。
在一种可选的实施例中,所述自检模块还用于根据所述第一请求、所述第一应答信息、所述第二请求、所述第二应答信息,生成自检报告。
在一种可选的实施例中,所述自检模块还用于向所述BMC发送基础输入输出***BIOS的重启命令,以使所述BIOS根据所述重启命令进行开机自检,并将开机自检结果发送至所述自检模块;接收所述开机自检结果并对所述自检结果进行分析。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本发明实施例还提供了一种电子设备40,包括:
包括处理器401、存储器402及存储在所述存储器上并能够在所述处理器上运行的计算机程序4021,该计算机程序被处理器执行时实现上述自检方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本发明实施例还提供了一种计算机可读存储介质50,计算机可读存储介质上存储计算机程序501,计算机程序被处理器执行时实现上述自检方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的一种自检方法、一种服务器、一种自检设备和一种自检存储介质,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种自检方法,其特征在于,应用于基板管理控制器BMC服务器,所述BMC服务器包括自检模块、BMC、总线接口、与所述总线接口连接的传感器和与所述总线接口连接的硬件模块,所述方法包括:
在所述总线接口功能正常的情况下,所述自检模块向所述BMC发送第一请求;所述第一请求用于指示获取所述传感器的状态信息和所述硬件模块的状态信息;
所述自检模块接收第一应答信息,所述第一应答信息包括所述BMC发送的所述传感器的状态信息和所述硬件模块的状态信息;所述传感器的状态信息包括采集的所述硬件模块的运行状态数据;所述硬件模块的状态信包括连接状态信息和启动状态信息;
所述自检模块根据所述传感器采集的所述硬件模块的运行状态数据,确认所述传感器的功能是否正常,以及根据所述硬件模块的连接状态信息和启动状态信息,确认所述硬件模块是否正常启动。
2.根据权利要求1所述的方法,其特征在于,还包括:
所述自检模块向所述BMC发送第二请求,以检测所述总线接口功能是否正常;所述第二请求为对所述总线接口进行检测的请求;
所述自检模块接收第二应答信息,所述第二应答信息为所述BMC发送的用于应答所述总线接口功能为正常或异常的信息。
3.根据权利要求2所述的方法,其特征在于,所述总线接口包括通用输入/输出GPIO总线接口,所述自检模块向所述BMC发送第二请求,以检测所述总线接口功能是否正常,包括:
所述自检模块向所述BMC发送对所述GPIO总线接口进行读或写的命令,以检测所述GPIO总线接口功能是否正常。
4.根据权利要求2所述的方法,其特征在于,所述总线接口包括内部集成电路i2c总线接口,所述自检模块向所述BMC发送第二请求,以检测所述总线接口功能是否正常,包括:
所述自检模块向所述BMC发送对所述i2c总线接口进行读或写的命令,以检测所述i2c总线接口功能是否正常。
5.根据权利要求1所述的方法,其特征在于,所述第一请求包括对所述传感器进行读的命令和对所述硬件模块进行读/写的命令;所述对所述传感器进行读的命令用于指示获取所述传感器的状态信息;所述对所述硬件模块进行读/写的命令用于指示获取所述硬件模块的状态信息。
6.根据权利要求2所述的方法,其特征在于,还包括:
所述自检模块根据所述第一请求、所述第一应答信息、所述第二请求、所述第二应答信息,生成自检报告。
7.根据权利要求1所述的方法,其特征在于,还包括:
所述自检模块向所述BMC发送基础输入输出***BIOS的重启命令,以使所述BIOS根据所述重启命令进行开机自检,并将开机自检结果发送至所述自检模块;
所述自检模块接收所述开机自检结果并对所述自检结果进行分析。
8.一种服务器,其特征在于,包括:自检模块、基板管理控制器BMC、总线接口、与所述总线接口连接的传感器和与所述总线接口连接的硬件模块;
所述自检模块用于在所述总线接口功能正常的情况下,向所述BMC发送第一请求;所述第一请求用于指示获取所述传感器的状态信息和所述硬件模块的状态信息;接收第一应答信息,所述第一应答信息包括所述BMC发送的所述传感器的状态信息和所述硬件模块的状态信息;所述传感器的状态信息包括采集的所述硬件模块的运行状态数据;所述硬件模块的状态信包括连接状态信息和启动状态信息;根据所述传感器采集的所述硬件模块的运行状态数据,确认所述传感器的功能是否正常,以及根据所述硬件模块的连接状态信息和启动状态信息,确认所述硬件模块是否正常启动。
9.一种电子设备,其特征在于,包括:处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1-7中任一项所述的自检方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述的自检方法的步骤。
CN202211676913.6A 2022-12-26 2022-12-26 一种自检方法、服务器、设备和存储介质 Pending CN115934446A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211676913.6A CN115934446A (zh) 2022-12-26 2022-12-26 一种自检方法、服务器、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211676913.6A CN115934446A (zh) 2022-12-26 2022-12-26 一种自检方法、服务器、设备和存储介质

Publications (1)

Publication Number Publication Date
CN115934446A true CN115934446A (zh) 2023-04-07

Family

ID=86698967

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211676913.6A Pending CN115934446A (zh) 2022-12-26 2022-12-26 一种自检方法、服务器、设备和存储介质

Country Status (1)

Country Link
CN (1) CN115934446A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118138400A (zh) * 2024-04-29 2024-06-04 苏州元脑智能科技有限公司 一种设备降速提醒方法、产品、设备及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118138400A (zh) * 2024-04-29 2024-06-04 苏州元脑智能科技有限公司 一种设备降速提醒方法、产品、设备及存储介质

Similar Documents

Publication Publication Date Title
CN111752776B (zh) 一种服务器的循环上下电测试方法和***
CN112286709B (zh) 一种服务器硬件故障的诊断方法、诊断装置及诊断设备
CN109189627B (zh) 一种硬盘故障监控检测方法、装置、终端及存储介质
CN111124775A (zh) 一种上电时序异常检测方法、装置、mcu及存储介质
CN116107819A (zh) 一种服务器启动故障检测***、方法、装置以及介质
US10691562B2 (en) Management node failover for high reliability systems
CN109375956B (zh) 一种重启操作***的方法、逻辑设备以及控制设备
CN117251333A (zh) 一种硬盘信息获取方法、装置、设备及存储介质
CN115934446A (zh) 一种自检方法、服务器、设备和存储介质
CN116680101A (zh) 一种操作***宕机检测方法及装置、消除方法及装置
US9158646B2 (en) Abnormal information output system for a computer system
CN113076210B (zh) 服务器故障诊断结果通知方法、***、终端及存储介质
CN112783721B (zh) 一种i2c总线监控的方法、装置、***及存储介质
US8391162B2 (en) Apparatus and method for testing SMNP cards
CN115543872A (zh) 一种设备管理方法、装置及计算机存储介质
CN116010141A (zh) 一种多路服务器启动异常定位方法、装置及其介质
CN115728665A (zh) 一种电源故障检测电路、方法及***
CN115098342A (zh) ***日志收集方法、***、终端及存储介质
CN114253573A (zh) PCIe设备固件批量升级方法、***、终端及存储介质
CN113608939A (zh) 性能测试中服务器启动计时方法、装置、终端及存储介质
CN111694587A (zh) 服务器pnor固件升级方法、装置、设备及存储介质
CN113868036B (zh) 服务器时序异常监测方法、***、终端及存储介质
CN114328044B (zh) 一种AIC+box拓扑的测试方法、装置和***
CN117311769B (zh) 服务器日志生成方法和装置、存储介质及电子设备
CN111290920B (zh) 基于peci总线测试cpu温度的***、方法及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination