CN110321265A - 一种服务器监控管理装置、方法及*** - Google Patents

一种服务器监控管理装置、方法及*** Download PDF

Info

Publication number
CN110321265A
CN110321265A CN201910384768.6A CN201910384768A CN110321265A CN 110321265 A CN110321265 A CN 110321265A CN 201910384768 A CN201910384768 A CN 201910384768A CN 110321265 A CN110321265 A CN 110321265A
Authority
CN
China
Prior art keywords
bmc
server
heartbeat message
configuration data
server monitoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201910384768.6A
Other languages
English (en)
Inventor
王友富
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Wave Intelligent Technology Co Ltd
Original Assignee
Suzhou Wave Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Wave Intelligent Technology Co Ltd filed Critical Suzhou Wave Intelligent Technology Co Ltd
Priority to CN201910384768.6A priority Critical patent/CN110321265A/zh
Publication of CN110321265A publication Critical patent/CN110321265A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1629Error detection by comparing the output of redundant processing systems
    • G06F11/165Error detection by comparing the output of redundant processing systems with continued operation after detection of the error
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Telephonic Communication Services (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请所提供的一种服务器监控管理装置,包括:分别与服务器监控管理中心及服务器连接的第一BMC,用于监控管理服务器中各个部件的运行状态,并将服务器的配置数据、各部件的运行状态信息及第一BMC的心跳信息发送至第二BMC;分别与服务器监控管理中心、第一BMC及服务器连接的第二BMC,用于保存配置数据及运行状态信息,并在根据心跳信息确定第一BMC发生故障后,接替第一BMC进行相应的工作。该服务器监控管理装置中设有两个BMC,分别是主BMC和从BMC。当从BMC根据心跳信息确定主BMC发生故障后,接替主BMC进行相应的工作。该服务器监控管理装置能够在主BMC发生故障时继续监控管理服务器。本申请还提供一种服务器监控管理方法及***,均具有上述有益效果。

Description

一种服务器监控管理装置、方法及***
技术领域
本申请涉及服务器监控领域,特别涉及一种服务器监控管理装置、方法及***。
背景技术
随着技术的更新迭代,对于服务器监控管理的要求也愈发的严格起来。传统的服务器监控管理中心基本都是采用单BMC(Baseboard ManagementController,基板管理控制器)监控管理服务器各部件的运行状况以及数据,一旦此BMC芯片出现故障或者BMC的代码因某些不可预估的因素遭到擦除或破坏,此时BMC就会挂掉,无法重启以及切换到slave镜像继续监控管理服务器,这就给服务器的正常运行带来非常大的影响,让客户无法及时有效的监控管理服务器。
因此,如何能够在BMC发生故障时继续监控管理服务器是本领域技术人员亟需解决的技术问题。
发明内容
本申请的目的是提供一种服务器监控管理装置、方法及***,能够在BMC发生故障时继续监控管理服务器。
为解决上述技术问题,本申请提供一种服务器监控管理装置,包括:
分别与服务器监控管理中心及服务器连接的第一BMC,用于监控管理所述服务器中各个部件的运行状态,并将所述服务器的配置数据、各所述部件的运行状态信息及所述第一BMC的心跳信息发送至第二BMC;其中,所述第二BMC从属于所述第一BMC;
分别与所述服务器监控管理中心、所述第一BMC及所述服务器连接的所述第二BMC,用于保存所述配置数据及所述运行状态信息,并在根据所述心跳信息确定所述第一BMC发生故障后,接替所述第一BMC进行相应的工作。
优选地,所述第一BMC和所述第二BMC通过LPC总线连接于所述服务器监控管理中心。
优选地,第一BMC和所述第二BMC通过I2C总线连接于所述服务器。
优选地,所述第一BMC通过Serial总线连接于所述第二BMC。
优选地,所述第一BMC和所述第一BMC均为BMC150芯片。
本申请还提供一种服务器监控管理方法,包括:
第一BMC在获取与所述第一BMC连接的服务器的配置数据及所述服务器中各部件的运行状态信息后,将所述配置数据、所述运行状态信息及所述第一BMC的心跳信息发送至第二BMC;其中,所述第二BMC从属于所述第一BMC;
所述第二BMC保存所述配置数据及所述运行状态信息,并在根据所述心跳信息确定所述第一BMC发生故障后,接替所述第一BMC进行相应的工作。
优选地,所述根据所述心跳信息确定所述第一BMC发生故障,包括:
所述第二BMC对所述心跳信息进行解析,得到解析结果;
根据所述解析结果,确定所述第一BMC发生故障。
优选地,所述确定所述第一BMC发生故障之后,还包括:
所述第二BMC获取并保存所述第一BMC的日志数据。
优选地,所述接替所述第一BMC进行相应的工作,包括:
所述第二BMC在获取所述配置数据及所述运行状态信息后,将所述配置数据、所述运行状态信息及所述第二BMC的心跳信息发送至第三BMC;其中,所述第三BMC从属于所述第二BMC。
本申请还提供一种服务器监控管理***,包括:
如上述所述的服务器监控管理装置、服务器监控管理中心及服务器。
本申请所提供的一种服务器监控管理装置,包括:
分别与服务器监控管理中心及服务器连接的第一BMC,用于监控管理所述服务器中各个部件的运行状态,并将所述服务器的配置数据、各所述部件的运行状态信息及所述第一BMC的心跳信息发送至第二BMC;其中,所述第二BMC从属于所述第一BMC;分别与所述服务器监控管理中心、所述第一BMC及所述服务器连接的所述第二BMC,用于保存所述配置数据及所述运行状态信息,并在根据所述心跳信息确定所述第一BMC发生故障后,接替所述第一BMC进行相应的工作。
该服务器监控管理装置中设有两个BMC,其中一个BMC从属于第二个BMC,也即一个是主BMC,一个是从BMC。从BMC接收主BMC发送的心跳信息,当从BMC根据心跳信息确定主BMC发生故障后,接替主BMC进行相应的工作。可见,该服务器监控管理装置能够在主BMC发生故障时继续监控管理服务器。本申请还提供一种服务器监控管理方法及***,均具有上述有益效果,在此不再赘述。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例所提供的一种服务器监控管理装置的结构示意图;
图2为本申请实施例所提供的一种服务器监控管理方法的流程图。
具体实施方式
本申请的核心是提供一种服务器监控管理装置,能够在BMC发生故障时继续监控管理服务器。本申请的另一核心是提供一种服务器监控管理方法及***。
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
随着技术的更新迭代,对于服务器监控管理的要求也愈发的严格起来。传统的服务器监控管理中心基本都是采用单BMC(Baseboard ManagementController,基板管理控制器)监控管理服务器各部件的运行状况以及数据,一旦此BMC芯片出现故障或者BMC的代码因某些不可预估的因素遭到擦除或破坏,此时BMC就会挂掉,无法重启以及切换到slave镜像继续监控管理服务器,这就给服务器的正常运行带来非常大的影响,让客户无法及时有效的监控管理服务器。本申请提供的一种服务器监控管理装置,能够在BMC发生故障时继续监控管理服务器,具体请参考图1,图1为本申请实施例所提供的一种服务器监控管理装置的结构示意图,该服务器监控管理装置具体包括:
分别与服务器监控管理中心11及服务器12连接的第一BMC13,用于监控管理服务器12中各个部件的运行状态,并将服务器12的配置数据、各部件的运行状态信息及第一BMC13的心跳信息发送至第二BMC14;其中,第二BMC14从属于第一BMC13;
分别与服务器监控管理中心11、第一BMC13及服务器12连接的第二BMC14,用于保存配置数据及运行状态信息,并在根据心跳信息确定第一BMC13发生故障后,接替第一BMC13进行相应的工作。
本申请实施例中服务器监控管理中心11及服务器12,在此均不作具体限定,需根据实际情况而定,只要满足要求即可。在此对第一BMC13和第二BMC14也不做具体限定,两者可以为相同型号的芯片,也可以为不相同型号的芯片。若第一BMC13和第二BMC14为不相同型号的芯片,则通过需要根据两者的GPIO来区分主从BMC,并将主BMC确定为第一BMC13,从BMC确定为第二BMC14;若第一BMC13和第二BMC14为相同型号的芯片,例如均为BMC150芯片,则需预先设定两者的从属关系。第一BMC13监控管理服务器12中各个部件的运行状态,在此对上述部件的数量不作具体限定,应由本领域技术人员根据实际情况作出相应的设定。在此对上述配置数据中各参数信息、运行状态信息及反映第一BMC13运行状态的心跳信息均不作具体限定,应由本领域技术人员根据实际情况作出相应的设定。本申请实施例中第一BMC13将配置数据及运行状态信息发送至第二BMC14的目的是为了获得数据的同步及保存。而本申请实施例中第一BMC13通常是每隔预设周期向第二BMC14发送心跳信息,在此对该预设周期不作具体限定,应由本领域技术人员根据实际情况作出相应的设定。
本申请实施例中第二BMC14在接收到配置数据、各部件的运行状态信息及第一BMC13的心跳信息后,将配置数据和各部件的运行状态信息进行保存,并在根据心跳信息确定第一BMC13发生故障后,接替第一BMC13进行相应的工作。其中,上述根据心跳信息确定第一BMC13发生故障,具体可以为:第二BMC14对心跳信息进行解析,得到解析结果;根据解析结果,确定第一BMC13发生故障。或,第二BMC14根据已经达到预设时长却仍没有接收到第一BMC13发送的心跳信息,确定第一BMC13发生故障。在此对预设时长不作具体限定,应由本领域技术人员根据实际情况作出相应的设定,例如该预设时长具体可以为秒级别时间。上述接替第一BMC13进行相应的工作,具体包括:第二BMC14监控管理服务器12中各个部件的运行状态,并获取服务器12的配置数据、各部件的运行状态信息。若该服务器监控管理装置还设有从属于第二BMC14的第三BMC,则第二BMC14将服务器12的配置数据、各部件的运行状态信息及第二BMC14的心跳信息发送至第三BMC。
本申请实施例对于第一BMC13分别与服务器监控管理中心11及服务器12的连接媒介、第二BMC14分别与服务器监控管理中心11及服务器12的连接媒介、第一BMC13与第二BMC14之间的连接媒介,在此均不作具体限定,需根据实际情况而定。具体地,第一BMC13和第二BMC14通常通过LPC总线连接于服务器监控管理中心11,第一BMC13和第二BMC14通常通过I2C总线连接于服务器12,第一BMC13通常通过Serial总线连接于第二BMC14。
本申请实施例所提供的服务器监控管理装置中设有两个BMC,其中一个BMC从属于第二个BMC,也即一个是主BMC,一个是从BMC。从BMC接收主BMC发送的心跳信息,当从BMC根据心跳信息确定主BMC发生故障后,接替主BMC进行相应的工作。可见,该服务器监控管理装置能够在主BMC发生故障时继续监控管理服务器12。
下面对本申请实施例提供的一种服务器监控管理方法、服务器监控管理***进行介绍,下文描述的服务器监控管理方法、服务器监控管理***与上文描述的服务器监控管理装置可相互对应参照。
请参考图2,图2为本申请实施例所提供的一种服务器监控管理方法的流程图,该服务器监控管理方法包括:
S201、第一BMC在获取与第一BMC连接的服务器的配置数据及服务器中各部件的运行状态信息后,将配置数据、运行状态信息及第一BMC的心跳信息发送至第二BMC;其中,第二BMC从属于第一BMC;
本申请实施例在此对上述配置数据中各参数信息、运行状态信息及反映第一BMC运行状态的心跳信息均不作具体限定,应由本领域技术人员根据实际情况作出相应的设定。本申请实施例中第一BMC将配置数据及运行状态信息发送至第二BMC的目的是为了获得数据的同步及保存。而本申请实施例中第一BMC通常是每隔预设周期向第二BMC发送心跳信息,在此对该预设周期不作具体限定,应由本领域技术人员根据实际情况作出相应的设定。
S202、第二BMC保存配置数据及运行状态信息,并在根据心跳信息确定第一BMC发生故障后,接替第一BMC进行相应的工作。
本申请实施例中第二BMC在接收到配置数据、各部件的运行状态信息及第一BMC的心跳信息后,将配置数据和各部件的运行状态信息进行保存,并在根据心跳信息确定第一BMC发生故障后,接替第一BMC进行相应的工作。其中,上述根据心跳信息确定第一BMC发生故障,具体可以为:第二BMC对心跳信息进行解析,得到解析结果;根据解析结果,确定第一BMC发生故障;或,第二BMC根据已经达到预设时长却仍没有接收到第一BMC发送的心跳信息,确定第一BMC发生故障。在此对预设时长不作具体限定,应由本领域技术人员根据实际情况作出相应的设定,例如该预设时长具体可以为秒级别时间。
进一步地,确定第一BMC发生故障之后,通常还可以包括:第二BMC获取并保存第一BMC的日志数据。将第一BMC的日志数据(即log数据)保存下来,是为了方便维护人员进行查看分析,并对发生故障的第一BMC进行强制刷新。
进一步地,接替第一BMC进行相应的工作,通常包括:第二BMC在获取配置数据及运行状态信息后,将配置数据、运行状态信息及第二BMC的心跳信息发送至第三BMC;其中,第三BMC从属于第二BMC。
本申请实施例提供的一种服务器监控管理方法,在第一BMC发生故障时,第二BMC能够接替第一BMC进行相应的工作,大大降低了服务器运行中因BMC的芯片被损坏或者代码因不可预估因素遭到破坏或擦除带来的风险因素,加强了安全性,保证服务器正常的运行做到真正意义的冗余,且适用于各类服务器。
本申请还提供一种服务器监控管理***,包括:如上述任意实施例的服务器监控管理装置、服务器监控管理中心及服务器。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例提供的***而言,由于其与实施例提供的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本申请所提供的一种服务器监控管理装置、方法及***进行了详细介绍。本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。

Claims (10)

1.一种服务器监控管理装置,其特征在于,包括:
分别与服务器监控管理中心及服务器连接的第一BMC,用于监控管理所述服务器中各个部件的运行状态,并将所述服务器的配置数据、各所述部件的运行状态信息及所述第一BMC的心跳信息发送至第二BMC;其中,所述第二BMC从属于所述第一BMC;
分别与所述服务器监控管理中心、所述第一BMC及所述服务器连接的所述第二BMC,用于保存所述配置数据及所述运行状态信息,并在根据所述心跳信息确定所述第一BMC发生故障后,接替所述第一BMC进行相应的工作。
2.根据权利要求1所述的服务器管理装置,其特征在于,所述第一BMC和所述第二BMC通过LPC总线连接于所述服务器监控管理中心。
3.根据权利要求1所述的服务器管理装置,其特征在于,第一BMC和所述第二BMC通过I2C总线连接于所述服务器。
4.根据权利要求1所述的服务器管理装置,其特征在于,所述第一BMC通过Serial总线连接于所述第二BMC。
5.根据权利要求1所述的服务器管理装置,其特征在于,所述第一BMC和所述第一BMC均为BMC150芯片。
6.一种服务器监控管理方法,其特征在于,包括:
第一BMC在获取与所述第一BMC连接的服务器的配置数据及所述服务器中各部件的运行状态信息后,将所述配置数据、所述运行状态信息及所述第一BMC的心跳信息发送至第二BMC;其中,所述第二BMC从属于所述第一BMC;
所述第二BMC保存所述配置数据及所述运行状态信息,并在根据所述心跳信息确定所述第一BMC发生故障后,接替所述第一BMC进行相应的工作。
7.根据权利要求6所述的服务器监控管理方法,其特征在于,所述根据所述心跳信息确定所述第一BMC发生故障,包括:
所述第二BMC对所述心跳信息进行解析,得到解析结果;
根据所述解析结果,确定所述第一BMC发生故障。
8.根据权利要求7所述的服务器监控管理方法,其特征在于,所述确定所述第一BMC发生故障之后,还包括:
所述第二BMC获取并保存所述第一BMC的日志数据。
9.根据权利要求6所述的服务器监控管理方法,其特征在于,所述接替所述第一BMC进行相应的工作,包括:
所述第二BMC在获取所述配置数据及所述运行状态信息后,将所述配置数据、所述运行状态信息及所述第二BMC的心跳信息发送至第三BMC;其中,所述第三BMC从属于所述第二BMC。
10.一种服务器监控管理***,其特征在于,包括:
如权利要求1至5任一项所述的服务器监控管理装置、服务器监控管理中心及服务器。
CN201910384768.6A 2019-05-09 2019-05-09 一种服务器监控管理装置、方法及*** Withdrawn CN110321265A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910384768.6A CN110321265A (zh) 2019-05-09 2019-05-09 一种服务器监控管理装置、方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910384768.6A CN110321265A (zh) 2019-05-09 2019-05-09 一种服务器监控管理装置、方法及***

Publications (1)

Publication Number Publication Date
CN110321265A true CN110321265A (zh) 2019-10-11

Family

ID=68119321

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910384768.6A Withdrawn CN110321265A (zh) 2019-05-09 2019-05-09 一种服务器监控管理装置、方法及***

Country Status (1)

Country Link
CN (1) CN110321265A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111045866A (zh) * 2019-12-06 2020-04-21 锐捷网络股份有限公司 一种bmc故障处理方法、装置、电子设备及存储介质
CN111308990A (zh) * 2020-03-15 2020-06-19 武汉天富海科技发展有限公司 一种舰用电站控制***双cpu混成式故障检测***及方法
CN111475218A (zh) * 2020-04-26 2020-07-31 中国长城科技集团股份有限公司 一种服务器的开机方法、服务器及计算机可读存储介质
CN111694710A (zh) * 2020-06-10 2020-09-22 浪潮商用机器有限公司 基板管理控制器故障监控方法、装置、设备及存储介质
CN111737037A (zh) * 2020-06-12 2020-10-02 浪潮(北京)电子信息产业有限公司 基板管理控制方法、主从异构bmc控制***及存储介质
CN113655829A (zh) * 2021-08-23 2021-11-16 浪潮商用机器有限公司 一种温度调控***和服务器
CN113905055A (zh) * 2021-09-11 2022-01-07 苏州浪潮智能科技有限公司 一种bmc之间数据同步传输的方法、装置、设备及可读介质
CN115514624A (zh) * 2022-09-21 2022-12-23 中国农业银行股份有限公司 监控方法、装置、电子设备及存储介质
CN115529261A (zh) * 2022-08-31 2022-12-27 苏州浪潮智能科技有限公司 一种多bmc的通信方法、装置、设备和存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104317677A (zh) * 2014-09-29 2015-01-28 浪潮电子信息产业股份有限公司 一种基于Brickland的冗余监控管理***及方法
CN109508279A (zh) * 2018-11-28 2019-03-22 郑州云海信息技术有限公司 一种服务器监控装置、方法及其***

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104317677A (zh) * 2014-09-29 2015-01-28 浪潮电子信息产业股份有限公司 一种基于Brickland的冗余监控管理***及方法
CN109508279A (zh) * 2018-11-28 2019-03-22 郑州云海信息技术有限公司 一种服务器监控装置、方法及其***

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111045866A (zh) * 2019-12-06 2020-04-21 锐捷网络股份有限公司 一种bmc故障处理方法、装置、电子设备及存储介质
CN111308990A (zh) * 2020-03-15 2020-06-19 武汉天富海科技发展有限公司 一种舰用电站控制***双cpu混成式故障检测***及方法
CN111308990B (zh) * 2020-03-15 2021-03-23 武汉天富海科技发展有限公司 一种舰用电站控制***双cpu混成式故障检测***及方法
CN111475218A (zh) * 2020-04-26 2020-07-31 中国长城科技集团股份有限公司 一种服务器的开机方法、服务器及计算机可读存储介质
CN111694710A (zh) * 2020-06-10 2020-09-22 浪潮商用机器有限公司 基板管理控制器故障监控方法、装置、设备及存储介质
CN111737037A (zh) * 2020-06-12 2020-10-02 浪潮(北京)电子信息产业有限公司 基板管理控制方法、主从异构bmc控制***及存储介质
CN113655829A (zh) * 2021-08-23 2021-11-16 浪潮商用机器有限公司 一种温度调控***和服务器
CN113905055A (zh) * 2021-09-11 2022-01-07 苏州浪潮智能科技有限公司 一种bmc之间数据同步传输的方法、装置、设备及可读介质
CN115529261A (zh) * 2022-08-31 2022-12-27 苏州浪潮智能科技有限公司 一种多bmc的通信方法、装置、设备和存储介质
CN115514624A (zh) * 2022-09-21 2022-12-23 中国农业银行股份有限公司 监控方法、装置、电子设备及存储介质
CN115514624B (zh) * 2022-09-21 2024-04-30 中国农业银行股份有限公司 监控方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN110321265A (zh) 一种服务器监控管理装置、方法及***
US6314512B1 (en) Automatic notification of connection or system failure in asynchronous multi-tiered system by monitoring connection status using connection objects
US6986076B1 (en) Proactive method for ensuring availability in a clustered system
CN104102559B (zh) 一种基于冗余心跳链路和对端重启链路的双控制器存储***
JP2005209201A (ja) 高可用性クラスタにおけるノード管理
CN102546135B (zh) 主备服务器切换***及方法
CN105045533B (zh) 适用于双控高可用存储***的磁盘心跳收发方法
CN106603319B (zh) 一种故障处理的方法、管理服务器以及逻辑服务器
CN109274544A (zh) 一种分布式存储***的故障检测方法及装置
US20090049332A1 (en) Method and Apparatus for Expressing High Availability Cluster Demand Based on Probability of Breach
CN108984320A (zh) 一种消息队列集群防脑裂方法及装置
CN109391691A (zh) 一种单节点故障下nas服务的恢复方法及相关装置
CN111796959B (zh) 宿主机容器自愈方法、装置及***
JP2006014310A (ja) 冗長接続サービスの提供方法および装置
CN105159851A (zh) 多控存储***
CN109117322A (zh) 一种服务器主备冗余的控制方法、***、设备及存储介质
CN109885151A (zh) 一种服务器电源监控方法及***
CN108304296A (zh) 一种服务器监控方法、***、设备及计算机可读存储介质
CN114844809B (zh) 基于网络心跳和内核磁盘心跳的多因子仲裁方法、装置
CN106874214A (zh) 云硬盘资源的回收方法及相关装置
US10842041B2 (en) Method for remotely clearing abnormal status of racks applied in data center
US10754722B1 (en) Method for remotely clearing abnormal status of racks applied in data center
CN109842526A (zh) 一种容灾方法和装置
CN111381770B (zh) 一种数据存储切换方法、装置、设备及存储介质
CN116455830A (zh) 实现存储网关高可用分布式qos的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20191011