CN109032901A - 一种远程带外ssd的监控方法、装置及受控终端 - Google Patents

一种远程带外ssd的监控方法、装置及受控终端 Download PDF

Info

Publication number
CN109032901A
CN109032901A CN201810684778.7A CN201810684778A CN109032901A CN 109032901 A CN109032901 A CN 109032901A CN 201810684778 A CN201810684778 A CN 201810684778A CN 109032901 A CN109032901 A CN 109032901A
Authority
CN
China
Prior art keywords
hard disk
ssd hard
ssd
accumulative
disk failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810684778.7A
Other languages
English (en)
Inventor
张兆义
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201810684778.7A priority Critical patent/CN109032901A/zh
Publication of CN109032901A publication Critical patent/CN109032901A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3037Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a memory, e.g. virtual memory, cache
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • G06F11/0754Error or fault detection not based on redundancy by exceeding limits
    • G06F11/076Error or fault detection not based on redundancy by exceeding limits by exceeding a count or rate limit, e.g. word- or bit count limit
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请实施例提供一种远程带外SSD的监控方法、装置及受控终端,所述方法包括:BMC接收BIOS发送的故障信号,并重启SSD硬盘;确定SSD硬盘故障累计重启次数,当SSD硬盘故障累计重启次数超过设定阈值,发送故障报警信号,否则继续累计SSD硬盘故障重启次数;本申请BMC可通过操作GPIO电平方式重启SSD硬盘,时当SD硬盘故障发生故障时,BIOS发送故障信号告知BMC进行SSD硬盘重启,准确地监控SSD硬盘状态,同时只有当SSD硬盘重启累积次数超过一定的数量时,才通知工程师查看现场,减少了人为参与,实用性强,大大节约了时间成本和人力成本。

Description

一种远程带外SSD的监控方法、装置及受控终端
技术领域
本发明涉及计算机技术领域,特别是涉及一种远程带外SSD的监控方法、装置及受控终端。
背景技术
随着半导体工业的发展,Flash集成度愈来愈高,成本不断下降,在采用多通道并行等技术下,SSD盘以其读写速度快、发热量低、工作温度范围大、绿色省电、抗震能力强和无机械部件可靠性高,在高端服务器、存储和便携机中愈来愈广泛使用。SSD即固态硬盘(Solid State Disk或Solid State Drive),也称作电子硬盘或者固态电子盘,是由控制单元和固态存储单元(DRAM或FLASH芯片)组成的存储设备,目前支持SATA、FC、SAS接口,可以替代普通的机械硬盘。
目前SSD状态获取主要是通过I2C接口直接与SDD硬盘进行通信Dump相应的寄存器,但是极可能出现I2C无法获取对应设备地址的现象,造成不能正常通信,此时SSD硬盘读写正常,但SSD硬盘状态无法被准确地监控。此外,在SSD固件硬盘使用过程中,不可避免出现SSD硬盘故障、SSD硬盘死机、无法检测到盘符或者其他SSD异常情况,这些均需要工程师到达机房现场查看实际状况,可以通过更换SSD硬盘设备,或者简单重启SSD硬盘来解决问题。而大部分情况,只需重启SSD硬盘即可,便需要工程师奔赴现场,极大地浪费了人力和财力资源。
因此,在服务器更改配置后,如何保证SSD硬盘状态能够被准确地监控,同时SSD硬盘故障、死机、无法检测到盘符或者其他SSD异常情况时能够自动重启,问题无法解决时通知工程师奔赴现场,是目前亟待解决的问题。
发明内容
针对现有技术的不足,本发明提供了一种远程带外SSD的监控方法、装置及受控终端,能够准确地监控SSD硬盘状态,并在SSD硬盘故障、死机、无法检测到盘符或者其他SSD异常情况时能够自动重启,当SSD硬盘故障超过一定的数量,通知工程师查看现场解决问题。
第一方面,提供一种远程带外SSD的监控方法,所述方法包括:
BMC接收BIOS发送的故障信号,并重启SSD硬盘;
确定SSD硬盘故障累计重启次数,当SSD硬盘故障累计重启次数超过设定阈值,发送故障报警信号,否则继续累计SSD硬盘故障重启次数。
结合第一方面,在第一方面的第一种可能的实现方式中,所述BMC接收BIOS发送的故障信号,并重启SSD硬盘,包括:
所述BMC接收BIOS发送的SSD硬盘故障、死机、无法检测到盘符或者其他SSD异常情况时,重启SSD硬盘。
结合第一方面及其上述实现方式,在第一方面的第二种可能的实现方式中,所述BMC接收BIOS发送的故障信号,并重启SSD硬盘,包括:
BMC接收BIOS发送的故障信号,通过拉低PWDIS引脚,重启SSD硬盘。
结合第一方面及其上述实现方式,在第一方面的第三种可能的实现方式中,所述确定SSD硬盘故障累计重启次数,当SSD硬盘故障累计重启次数超过设定阈值,发送故障报警信号,否则继续累计SSD硬盘故障重启次数,包括:
确定SSD硬盘故障累计重启次数,当SSD硬盘故障累计重启次数超过10次,发送故障报警信号,否则继续累计SSD硬盘故障重启次数。
结合第一方面及其上述实现方式,在第一方面的第四种可能的实现方式中,所述确定SSD硬盘故障累计重启次数,当SSD硬盘故障累计重启次数超过设定阈值,发送故障报警信号,否则继续累计SSD硬盘故障重启次数,包括:
在服务器上设置由BMC控制的LED灯,作为SSD硬盘故障灯,确定SSD硬盘故障累计重启次数,当SSD硬盘故障累计重启次数超过设定阈值,SSD硬盘故障灯发送故障报警信号,否则继续累计SSD硬盘故障重启次数。
第二方面,提供一种用于远程带外SSD的监控的装置,包括:
接收单元,所述接收单元用于BMC接收BIOS发送的故障信号,并重启SSD硬盘;
确定单元,所述确定单元用于确定SSD硬盘故障累计重启次数,当SSD硬盘故障累计重启次数超过设定阈值,发送故障报警信号,否则继续累计SSD硬盘故障重启次数。
结合第二方面,在第二方面的第一种可能的实现方式中,所述接收单元具体用于:
BMC接收BIOS发送的SSD硬盘故障、死机、无法检测到盘符或者其他SSD异常情况时,重启SSD硬盘。
结合第二方面及其上述实现方式,在第二方面的第二种可能的实现方式中,所述接收单元具体用于:
BMC接收BIOS发送的故障信号,通过拉低PWDIS引脚,重启SSD硬盘。
结合第二方面及其上述实现方式,在第二方面的第三种可能的实现方式中,所述确定单元具体用于:
确定SSD硬盘故障累计重启次数,当SSD硬盘故障累计重启次数超过10次,发送故障报警信号,否则继续累计SSD硬盘故障重启次数。
结合第二方面及其上述实现方式,在第二方面的第四种可能的实现方式中,所述确定单元具体用于:
在服务器上设置由BMC控制的LED灯,作为SSD硬盘故障灯,确定SSD硬盘故障累计重启次数,当SSD硬盘故障累计重启次数超过设定阈值,SSD硬盘故障灯发送故障报警信号,否则继续累计SSD硬盘故障重启次数。
第三方面,提供一种受控终端,包括:
处理器、存储器,其中,
该存储器用于存储计算机程序,该处理器用于从存储器中调用并运行该计算机程序,使得终端设备执行上述的终端设备的方法。
第四方面,提供了一种计算机存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述各方面所述的方法。
第五方面,提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述各方面所述的方法。
因此,本申请实施例BMC可通过操作GPIO电平方式重启SSD硬盘,时当SD硬盘故障发生故障时,BIOS发送故障信号告知BMC进行SSD硬盘重启,准确地监控SSD硬盘状态,同时只有当SSD硬盘重启累积次数超过一定的数量时,才通知工程师查看现场,大大减少了人为参与,实用性强,大大节约了时间成本和人力成本。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一个实施例的方法的示意性流程图。
图2是本申请另一个实施例的方法的示意性流程图。
图3是本申请一个实施例的装置的示意性框图。
图4为本发明实施例提供的一种受控终端的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
下面对本申请中出现的关键术语进行解释。
BIOS(Basic Input/ouput system):表示基本输入输出***,是一组固化到计算机内主板上一个ROM芯片上的程序,它保存着计算机最重要的基本输入输出的程序、开机后自检程序和***自启动程序,它可从CMOS中读写***设置的具体信息,其主要功能是为计算机提供最底层的、最直接的硬件设置和控制。
BMC(Baseboard Management Controller):表示基板管理控制器,是电脑进行数模信号转换的设备,承担输出显示图形的任务。显卡接在电脑主板上,它将电脑的数字信号转换成模拟信号让显示器显示出来。
GPIO(General Purpose Input Output):表示通用输入/输出或总线扩展器,当微控制器或芯片组没有足够的I/O端口,或当***需要采用远端串行通信或控制时,GPIO产品能够提供额外的控制和监视功能。
PWDIS(Power Disable):表示断电,即利用了台式电脑SATA接口中用不到的3.3V输出针脚,将Pin3作为断电信号。
应理解,文中描述的第一、第二只是为了指代和区别不同的信号、指令等,其中,第一、第二不具有先后顺序的限定。
图1是本申请一个实施例的方法的示意性流程图。其中,图1执行主体可以为远程带外SSD的监控方法的装置。
如图1所示,该方法100包括:
步骤110,BMC接收BIOS发送的故障信号,并重启SSD硬盘;
步骤120,确定SSD硬盘故障累计重启次数,当SSD硬盘故障累计重启次数超过设定阈值,发送故障报警信号,否则继续累计SSD硬盘故障重启次数。
可选地,作为本申请一个实施例,所述BMC接收BIOS发送的故障信号,并重启SSD硬盘,包括:
所述BMC接收BIOS发送的SSD硬盘故障、死机、无法检测到盘符或者其他SSD异常情况时,重启SSD硬盘。
可选地,作为本申请一个实施例,所述BMC接收BIOS发送的故障信号,并重启SSD硬盘,包括:
BMC接收BIOS发送的故障信号,通过拉低PWDIS引脚,重启SSD硬盘。
可选地,作为本申请一个实施例,所述确定SSD硬盘故障累计重启次数,当SSD硬盘故障累计重启次数超过设定阈值,发送故障报警信号,否则继续累计SSD硬盘故障重启次数,包括:
确定SSD硬盘故障累计重启次数,当SSD硬盘故障累计重启次数超过10次,发送故障报警信号,否则继续累计SSD硬盘故障重启次数。
可选地,作为本申请一个实施例,所述确定SSD硬盘故障累计重启次数,当SSD硬盘故障累计重启次数超过设定阈值,发送故障报警信号,否则继续累计SSD硬盘故障重启次数,包括:
在服务器上设置由BMC控制的LED灯,作为SSD硬盘故障灯,确定SSD硬盘故障累计重启次数,当SSD硬盘故障累计重启次数超过设定阈值,SSD硬盘故障灯发送故障报警信号,否则继续累计SSD硬盘故障重启次数。
具体的,图2示出了本申请一个实施例的方法的示意图。
(1)硬件上BMC的GPIO引脚直接连接至三星SSD接口PWDIS,BMC的I2C通道连接至三星SSD的I2C接口;
(2)服务器上电,BMC正常运行,通过I2C发送OEM命令使能PWDIS功能;
(3)当SSD硬盘故障、死机、无法检测到盘符或者其他SSD异常情况时,BIOS发送故障信号至BMC,通知BMC达到SSD状态门限;
(4)BMC通过拉低PWDIS引脚,重启SSD硬盘,进行短暂的恢复;
(5)对SSD硬盘故障重启次数进行累计,记录次数;
(6)当SSD硬盘故障重启次数累积超过设定阈值例如10次,便是无法恢复的情况,SSD硬盘故障灯发送故障报警信号告知工程师现场支持,否则继续累计SSD硬盘故障重启次数。
因此,本申请实施例BMC可通过操作GPIO电平方式重启SSD硬盘,时当SD硬盘故障发生故障时,BIOS发送故障信号告知BMC进行SSD硬盘重启,准确地监控SSD硬盘状态,同时只有当SSD硬盘重启累积次数超过一定的数量时,才通知工程师查看现场,大大减少了人为参与,实用性强,大大节约了时间成本和人力成本。
图3示出了本申请一个实施例的装置的示意性框图。
如图3所示,该装置300包括:
接收单元310,所述接收单元用于BMC接收BIOS发送的故障信号,并重启SSD硬盘;
确定单元320,所述确定单元用于确定SSD硬盘故障累计重启次数,当SSD硬盘故障累计重启次数超过设定阈值,发送故障报警信号,否则继续累计SSD硬盘故障重启次数。
可选地,作为本申请一个实施例,所述接收单元310具体用于:
BMC接收BIOS发送的SSD硬盘故障、死机、无法检测到盘符或者其他SSD异常情况时,重启SSD硬盘。
可选地,作为本申请一个实施例,所述接收单元310具体用于:
BMC接收BIOS发送的故障信号,通过拉低PWDIS引脚,重启SSD硬盘。
可选地,作为本申请一个实施例,所述确定单元320具体用于:
确定SSD硬盘故障累计重启次数,当SSD硬盘故障累计重启次数超过10次,发送故障报警信号,否则继续累计SSD硬盘故障重启次数。
可选地,作为本申请一个实施例,所述确定单元320具体用于:
在服务器上设置由BMC控制的LED灯,作为SSD硬盘故障灯,确定SSD硬盘故障累计重启次数,当SSD硬盘故障累计重启次数超过设定阈值,SSD硬盘故障灯发送故障报警信号,否则继续累计SSD硬盘故障重启次数。
图4为本发明实施例提供的一种受控终端400的结构示意图,该受控终端400可以用于执行本申请实施例提供的远程带外SSD的监控示出的方法。
其中,该受控终端400可以包括:处理器410、存储器420及通信单元430。这些组件通过一条或多条总线进行通信,本领域技术人员可以理解,图中示出的服务器的结构并不构成对本申请的限定,它既可以是总线形结构,也可以是星型结构,还可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
其中,该存储器420可以用于存储处理器410的执行指令,存储器420可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。当存储器420中的执行指令由处理器410执行时,使得终端400能够执行以下上述方法实施例中的部分或全部步骤。
处理器410为存储设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或执行存储在存储器420内的软件程序和/或模块,以及调用存储在存储器内的数据,以执行电子设备的各种功能和/或处理数据。所述处理器可以由集成电路(Integrated Circuit,简称IC)组成,例如可以由单颗封装的IC所组成,也可以由连接多颗相同功能或不同功能的封装IC而组成。举例来说,处理器410可以仅包括中央处理器(Central Processing Unit,简称CPU)。在本申请实施方式中,CPU可以是单运算核心,也可以包括多运算核心。
通信单元430,用于建立通信信道,从而使所述存储设备可以与其它设备进行通信。接收其他设备发送的用户数据或者向其他设备发送用户数据。
本申请还提供一种计算机存储介质,
其中,该计算机存储介质可存储有程序,该程序执行时可包括本申请提供的各实施例中的部分或全部步骤。所述的存储介质可为磁碟、光盘、只读存储记忆体(英文:read-only memory,简称:ROM)或随机存储记忆体(英文:random access memory,简称:RAM)等。
本领域的技术人员可以清楚地了解到本申请实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中如U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者第二设备、网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
本说明书中各个实施例之间相同相似的部分互相参见即可。尤其,对于终端实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例中的说明即可。
在本申请所提供的几个实施例中,应该理解到,所揭露的***、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
尽管通过参考附图并结合优选实施例的方式对本发明进行了详细描述,但本发明并不限于此。在不脱离本发明的精神和实质的前提下,本领域普通技术人员可以对本发明的实施例进行各种等效的修改或替换,而这些修改或替换都应在本发明的涵盖范围内/任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种远程带外SSD的监控方法,其特征在于,包括:
BMC接收BIOS发送的故障信号,并重启SSD硬盘;
确定SSD硬盘故障累计重启次数,当SSD硬盘故障累计重启次数超过设定阈值,发送故障报警信号,否则继续累计SSD硬盘故障重启次数。
2.根据权利要求1所述的方法,其特征在于,所述BMC接收BIOS发送的故障信号,并重启SSD硬盘,包括:
所述BMC接收BIOS发送的SSD硬盘故障、死机、无法检测到盘符或者其他SSD异常情况时,重启SSD硬盘。
3.根据权利要求1或2所述的方法,其特征在于,所述BMC接收BIOS发送的故障信号,并重启SSD硬盘,包括:
BMC接收BIOS发送的故障信号,通过拉低PWDIS引脚,重启SSD硬盘。
4.根据权利要求1中所述的方法,其特征在于,所述确定SSD硬盘故障累计重启次数,当SSD硬盘故障累计重启次数超过设定阈值,发送故障报警信号,否则继续累计SSD硬盘故障重启次数,包括:
确定SSD硬盘故障累计重启次数,当SSD硬盘故障累计重启次数超过10次,发送故障报警信号,否则继续累计SSD硬盘故障重启次数。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述确定SSD硬盘故障累计重启次数,当SSD硬盘故障累计重启次数超过设定阈值,发送故障报警信号,否则继续累计SSD硬盘故障重启次数,包括:
在服务器上设置由BMC控制的LED灯,作为SSD硬盘故障灯,确定SSD硬盘故障累计重启次数,当SSD硬盘故障累计重启次数超过设定阈值,SSD硬盘故障灯发送故障报警信号,否则继续累计SSD硬盘故障重启次数。
6.一种用于监控远程带外SSD的装置,其特征在于,包括:
接收单元,所述接收单元用于BMC接收BIOS发送的故障信号,并重启SSD硬盘;
确定单元,所述确定单元用于确定SSD硬盘故障累计重启次数,当SSD硬盘故障累计重启次数超过设定阈值,发送故障报警信号,否则继续累计SSD硬盘故障重启次数。
7.根据权利要求6所述的装置,其特征在于,所述接收单元具体用于:
BMC接收BIOS发送的SSD硬盘故障、死机、无法检测到盘符或者其他SSD异常情况时,重启SSD硬盘。
8.根据权利要求6或7所述的装置,其特征在于,所述接收单元具体用于:
BMC接收BIOS发送的故障信号,通过拉低PWDIS引脚,重启SSD硬盘。
9.根据权利要求6至8中任一项所述的装置,其特征在于,所述确定单元具体用于:
在服务器上设置由BMC控制的LED灯,作为SSD硬盘故障灯,确定SSD硬盘故障累计重启次数,当SSD硬盘故障累计重启次数超过设定阈值,SSD硬盘故障灯发送故障报警信号,否则继续累计SSD硬盘故障重启次数。
10.一种受控终端,其特征在于,包括:
处理器;
用于存储处理器的执行指令的存储器;
其中,所述处理器被配置为执行权利要求1-5任一项所述的方法。
CN201810684778.7A 2018-06-28 2018-06-28 一种远程带外ssd的监控方法、装置及受控终端 Pending CN109032901A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810684778.7A CN109032901A (zh) 2018-06-28 2018-06-28 一种远程带外ssd的监控方法、装置及受控终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810684778.7A CN109032901A (zh) 2018-06-28 2018-06-28 一种远程带外ssd的监控方法、装置及受控终端

Publications (1)

Publication Number Publication Date
CN109032901A true CN109032901A (zh) 2018-12-18

Family

ID=65522045

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810684778.7A Pending CN109032901A (zh) 2018-06-28 2018-06-28 一种远程带外ssd的监控方法、装置及受控终端

Country Status (1)

Country Link
CN (1) CN109032901A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109710193A (zh) * 2018-12-27 2019-05-03 郑州云海信息技术有限公司 一种控制m.3 ssd中pwdis信号的***及方法
CN110347555A (zh) * 2019-07-09 2019-10-18 英业达科技有限公司 硬盘运作状态判定方法
CN111858262A (zh) * 2019-04-29 2020-10-30 安图斯科技股份有限公司 警示灯控制方法与电子装置
CN113013920A (zh) * 2021-03-08 2021-06-22 射阳汉鼎新能源科技有限公司 一种光伏发电智能控制***
CN114924929A (zh) * 2022-04-22 2022-08-19 苏州浪潮智能科技有限公司 一种NVMe硬盘故障预警方法、***和计算机设备

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104317712A (zh) * 2014-10-23 2015-01-28 浪潮电子信息产业股份有限公司 一种基于linux的存储服务器疲劳测试方法
CN105302687A (zh) * 2015-12-10 2016-02-03 浪潮电子信息产业股份有限公司 一种基于linux下的硬盘盘序检测方法
CN106100884A (zh) * 2016-06-17 2016-11-09 国网辽宁省电力有限公司锦州供电公司 变电站监控设备运行异常的告警方法
CN106295131A (zh) * 2016-07-29 2017-01-04 武汉联影医疗科技有限公司 一种监管软件运行的方法及装置
CN106844110A (zh) * 2017-02-09 2017-06-13 郑州云海信息技术有限公司 一种raid组中故障磁盘数据重建的方法
CN107273257A (zh) * 2017-06-23 2017-10-20 郑州云海信息技术有限公司 一种Linux***下自动进行硬盘乱序检验的方法
CN107590017A (zh) * 2017-09-21 2018-01-16 联想(北京)有限公司 一种电子设备的检测方法和装置
CN107833160A (zh) * 2017-11-24 2018-03-23 河北三川科技有限公司 一种酒店入住广告播放故障自检方法及***

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104317712A (zh) * 2014-10-23 2015-01-28 浪潮电子信息产业股份有限公司 一种基于linux的存储服务器疲劳测试方法
CN105302687A (zh) * 2015-12-10 2016-02-03 浪潮电子信息产业股份有限公司 一种基于linux下的硬盘盘序检测方法
CN106100884A (zh) * 2016-06-17 2016-11-09 国网辽宁省电力有限公司锦州供电公司 变电站监控设备运行异常的告警方法
CN106295131A (zh) * 2016-07-29 2017-01-04 武汉联影医疗科技有限公司 一种监管软件运行的方法及装置
CN106844110A (zh) * 2017-02-09 2017-06-13 郑州云海信息技术有限公司 一种raid组中故障磁盘数据重建的方法
CN107273257A (zh) * 2017-06-23 2017-10-20 郑州云海信息技术有限公司 一种Linux***下自动进行硬盘乱序检验的方法
CN107590017A (zh) * 2017-09-21 2018-01-16 联想(北京)有限公司 一种电子设备的检测方法和装置
CN107833160A (zh) * 2017-11-24 2018-03-23 河北三川科技有限公司 一种酒店入住广告播放故障自检方法及***

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109710193A (zh) * 2018-12-27 2019-05-03 郑州云海信息技术有限公司 一种控制m.3 ssd中pwdis信号的***及方法
CN109710193B (zh) * 2018-12-27 2022-02-18 郑州云海信息技术有限公司 一种控制m.3 ssd中pwdis信号的***及方法
CN111858262A (zh) * 2019-04-29 2020-10-30 安图斯科技股份有限公司 警示灯控制方法与电子装置
CN110347555A (zh) * 2019-07-09 2019-10-18 英业达科技有限公司 硬盘运作状态判定方法
CN113013920A (zh) * 2021-03-08 2021-06-22 射阳汉鼎新能源科技有限公司 一种光伏发电智能控制***
CN114924929A (zh) * 2022-04-22 2022-08-19 苏州浪潮智能科技有限公司 一种NVMe硬盘故障预警方法、***和计算机设备

Similar Documents

Publication Publication Date Title
CN109032901A (zh) 一种远程带外ssd的监控方法、装置及受控终端
JP6530774B2 (ja) ハードウェア障害回復システム
CN105938450B (zh) 自动除错信息收集的方法及***
CN107526665B (zh) 机箱管理***及机箱管理方法
CN103473167B (zh) 服务器的故障显示方法及装置
US8521929B2 (en) Virtual serial port management system and method
CN110083494B (zh) 在多核心环境中管理硬件错误的方法和装置
US10846159B2 (en) System and method for managing, resetting and diagnosing failures of a device management bus
EP2913754B1 (en) Memory data migration computer and method
US8397053B2 (en) Multi-motherboard server system
US9806959B2 (en) Baseboard management controller (BMC) to host communication through device independent universal serial bus (USB) interface
CN109032888A (zh) 一种服务器启动过程故障检测方法、装置及受控终端
US20160239371A1 (en) System and method for peripheral bus device failure management
CN102331959A (zh) 伺服器***
US10922162B2 (en) Capturing video data and serial data during an information handling system failure
JP2020053017A (ja) ハイブリッド電源のシステム及び方法
CN109976926A (zh) 一种屏蔽重启保护bmc更新过程的方法、电路、终端及存储介质
US9946552B2 (en) System and method for detecting redundant array of independent disks (RAID) controller state from baseboard management controller (BMC)
US20070011487A1 (en) Method and infrastructure for recognition of the resources of a defective hardware unit
CN115098294B (zh) 异常事件的处理方法、电子设备及管理终端
US11126486B2 (en) Prediction of power shutdown and outage incidents
CN115599617A (zh) 总线检测方法、装置、服务器及电子设备
CN109189638A (zh) 一种gpu驱动检测方法、装置、终端及存储介质
CN114924998A (zh) 内存信息读取装置及方法、计算设备主板、设备和介质
CN115774645A (zh) 闪存监控***、方法及其电脑***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20181218

RJ01 Rejection of invention patent application after publication