CN114826962A - 一种链路故障检测方法、装置、设备及机器可读存储介质 - Google Patents

一种链路故障检测方法、装置、设备及机器可读存储介质 Download PDF

Info

Publication number
CN114826962A
CN114826962A CN202210327368.3A CN202210327368A CN114826962A CN 114826962 A CN114826962 A CN 114826962A CN 202210327368 A CN202210327368 A CN 202210327368A CN 114826962 A CN114826962 A CN 114826962A
Authority
CN
China
Prior art keywords
protocol
pcie
acquisition command
state
mctp
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210327368.3A
Other languages
English (en)
Inventor
黄微卫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New H3C Information Technologies Co Ltd
Original Assignee
New H3C Information Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by New H3C Information Technologies Co Ltd filed Critical New H3C Information Technologies Co Ltd
Priority to CN202210327368.3A priority Critical patent/CN114826962A/zh
Publication of CN114826962A publication Critical patent/CN114826962A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/26Special purpose or proprietary protocols or architectures

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Environmental & Geological Engineering (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本公开提供一种链路故障检测方法、装置、设备及机器可读存储介质,该方法包括:判断目标PCIE设备是否支持MCTP协议;向支持MCTP协议的目标PCIE设备发送状态获取命令;尝试接收反馈报文,根据接收反馈报文的结果,判断关联于目标PCIE设备的PCIE链路的状态;所述反馈报文是目标PCIE设备在接收到状态获取命令后,响应于状态获取命令发送的反馈报文。通过本公开的技术方案,向支持MCTP协议的PCIE设备发送状态获取命令,以协议通信的方式判断PCIE链路是否存在故障有异常,若无法正常接收反馈报文则说明PCIE链路存在异常,简化了故障检测流程,直观方便且高效。

Description

一种链路故障检测方法、装置、设备及机器可读存储介质
技术领域
本公开涉及通信技术领域,尤其是涉及一种链路故障检测方法、装置、设备及机器可读存储介质。
背景技术
BMC(Baseboard Management Controller,基板管理控制器),可以在机器未开机的状态下,对机器进行固件升级、查看机器设备、等一些操作。
管理组件传输协议(MCTP)是一种与媒体无关的协议,用于在被管理计算机***的平台管理子***内的智能设备之间进行相互通信。该协议独立于底层物理总线及总线上的“数据链路”层消息,也就是仅定义了传输层的消息,对于下面的传输层,视为自身协议的传输层消息。
PCIE(PCI-Express,peripheral component interconnect express)是一种高速串行计算机扩展总线标准,属于高速串行点对点双通道高带宽传输,所连接的设备分配独享通道带宽,不共享总线带宽,主要支持主动电源管理,错误报告,端对端的可靠性传输,热插拔以及服务质量(QOS)等功能。
NCSI(Network Controller Sideband Interface,网络控制器边带接口)个由分布式管理任务组定义的用于支持服务器带外管理的边带接口网络控制器的工业标准。
一种服务器检测PCIE异常的方案通过MCA硬件机制,在发现硬件错误的时候发出中断或异常。通过MCA,***可以探测硬件错误,如***总线错误,ECC错误,奇偶校验错误,cache错误,TLB错误等,MCA硬件机制,处理上需要对现有的错误记录,并解析,流程上较为复杂,效率较低。
发明内容
有鉴于此,本公开提供一种链路故障检测方法、装置及电子设备、机器可读存储介质,以改善上述故障检测效率低的问题。
具体地技术方案如下:
本公开提供了一种链路故障检测方法,应用于BMC设备,所述方法包括:判断目标PCIE设备是否支持MCTP协议;向支持MCTP协议的目标PCIE设备发送状态获取命令;尝试接收反馈报文,根据接收反馈报文的结果,判断关联于目标PCIE设备的PCIE链路的状态;所述反馈报文是目标PCIE设备在接收到状态获取命令后,响应于状态获取命令发送的反馈报文。
作为一种技术方案,所述向支持MCTP协议的目标PCIE设备发送状态获取命令,尝试接收反馈报文,根据接收反馈报文的结果,判断关联于目标PCIE设备的PCIE链路的状态,包括:若接收反馈报文失败,则在预设延迟后重新执行向支持MCTP协议的目标PCIE设备发送状态获取命令的步骤,并记录本次接收反馈报文失败的结果;若记录的接收反馈报文失败的结果达到指定次数,则判断关联于目标PCIE设备的PCIE链路的状态异常。
作为一种技术方案,所述向支持MCTP协议的目标PCIE设备发送状态获取命令,包括:通过MCTP协议封装包含有状态获取命令的指定协议的报文,向支持MCTP协议的目标PCIE设备发送该报文;所述指定协议包括NCSI协议或PLDM协议或VDM协议。
作为一种技术方案,所述尝试接收反馈报文,根据接收反馈报文的结果,判断关联于目标PCIE设备的PCIE链路的状态,包括:若判断关联于目标PCIE设备的PCIE链路的状态异常,则上报告警。
本公开同时提供了一种链路故障检测装置,应用于BMC设备,所述装置包括:协议模块,用于判断目标PCIE设备是否支持MCTP协议;命令模块,用于向支持MCTP协议的目标PCIE设备发送状态获取命令;处理模块,用于尝试接收反馈报文,根据接收反馈报文的结果,判断关联于目标PCIE设备的PCIE链路的状态;所述反馈报文是目标PCIE设备在接收到状态获取命令后,响应于状态获取命令发送的反馈报文。
作为一种技术方案,所述向支持MCTP协议的目标PCIE设备发送状态获取命令,尝试接收反馈报文,根据接收反馈报文的结果,判断关联于目标PCIE设备的PCIE链路的状态,包括:若接收反馈报文失败,则在预设延迟后重新执行向支持MCTP协议的目标PCIE设备发送状态获取命令的步骤,并记录本次接收反馈报文失败的结果;若记录的接收反馈报文失败的结果达到指定次数,则判断关联于目标PCIE设备的PCIE链路的状态异常。
作为一种技术方案,所述向支持MCTP协议的目标PCIE设备发送状态获取命令,包括:通过MCTP协议封装包含有状态获取命令的指定协议的报文,向支持MCTP协议的目标PCIE设备发送该报文;所述指定协议包括NCSI协议或PLDM协议或VDM协议。
作为一种技术方案,所述尝试接收反馈报文,根据接收反馈报文的结果,判断关联于目标PCIE设备的PCIE链路的状态,包括:若判断关联于目标PCIE设备的PCIE链路的状态异常,则上报告警。
本公开同时提供了一种电子设备,包括处理器和机器可读存储介质,所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令,处理器执行所述机器可执行指令以实现前述的链路故障检测方法。
本公开同时提供了一种机器可读存储介质,所述机器可读存储介质存储有机器可执行指令,所述机器可执行指令在被处理器调用和执行时,所述机器可执行指令促使所述处理器实现前述的链路故障检测方法。
本公开提供的上述技术方案至少带来了以下有益效果:
向支持MCTP协议的PCIE设备发送状态获取命令,以协议通信的方式判断PCIE链路是否存在故障有异常,若无法正常接收反馈报文则说明PCIE链路存在异常,简化了故障检测流程,直观方便且高效。
附图说明
为了更加清楚地说明本公开实施方式或者现有技术中的技术方案,下面将对本公开实施方式或者现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开中记载的一些实施方式,对于本领域普通技术人员来讲,还可以根据本公开实施方式的这些附图获得其他的附图。
图1是本公开一种实施方式中的链路故障检测方法的流程图;
图2是本公开一种实施方式中的链路故障检测装置的结构图;
图3是本公开一种实施方式中的电子设备的硬件结构图。
具体实施方式
在本公开实施方式使用的术语仅仅是出于描述特定实施方式的目的,而非限制本公开。本公开和权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其它含义。还应当理解,本文中使用的术语“和/或”是指包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本公开实施方式可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本公开范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,此外,所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
本公开提供一种链路故障检测方法、装置及电子设备、机器可读存储介质,以改善上述故障检测效率低的问题。
具体地技术方案如后述。
在一种实施方式中,本公开提供了一种链路故障检测方法,应用于BMC设备,所述方法包括:判断目标PCIE设备是否支持MCTP协议;向支持MCTP协议的目标PCIE设备发送状态获取命令;尝试接收反馈报文,根据接收反馈报文的结果,判断关联于目标PCIE设备的PCIE链路的状态;所述反馈报文是目标PCIE设备在接收到状态获取命令后,响应于状态获取命令发送的反馈报文。
具体地,如图1,包括以下步骤:
步骤S11,判断目标PCIE设备是否支持MCTP协议;
步骤S12,向支持MCTP协议的目标PCIE设备发送状态获取命令;
步骤S13,尝试接收反馈报文,根据接收反馈报文的结果,判断关联于目标PCIE设备的PCIE链路的状态。
向支持MCTP协议的PCIE设备发送状态获取命令,以协议通信的方式判断PCIE链路是否存在故障有异常,若无法正常接收反馈报文则说明PCIE链路存在异常,简化了故障检测流程,直观方便且高效。
在一种实施方式中,所述向支持MCTP协议的目标PCIE设备发送状态获取命令,尝试接收反馈报文,根据接收反馈报文的结果,判断关联于目标PCIE设备的PCIE链路的状态,包括:若接收反馈报文失败,则在预设延迟后重新执行向支持MCTP协议的目标PCIE设备发送状态获取命令的步骤,并记录本次接收反馈报文失败的结果;若记录的接收反馈报文失败的结果达到指定次数,则判断关联于目标PCIE设备的PCIE链路的状态异常。
在一种实施方式中,所述向支持MCTP协议的目标PCIE设备发送状态获取命令,包括:通过MCTP协议封装包含有状态获取命令的指定协议的报文,向支持MCTP协议的目标PCIE设备发送该报文;所述指定协议包括NCSI协议或PLDM协议或VDM协议。
在一种实施方式中,所述尝试接收反馈报文,根据接收反馈报文的结果,判断关联于目标PCIE设备的PCIE链路的状态,包括:若判断关联于目标PCIE设备的PCIE链路的状态异常,则上报告警。
在一种实施方式中,BMC通过PCIE总线与PCH相连,PCH连接CPU的PCIE总线控制器,CPU下挂PCIE设备。BMC通过PCIE链路与PCIE设备进行通信。BMC在协议报文的基础上封装NCSI或PLDM或VDM协议报文,然后再通过PCIE链路将报文发送给PCH,PCH将报文通过PCIE控制器转发给设备,设备收到报文后,会进行处理,并将回应传给BMC。
以支持NCSI OVER MCTP协议的网卡作为例,首先BMC会对每张网卡设置EID(endpoint ID)作为其自身的身份编号;然后BMC向网卡发送NCSI OVER MCTP的状态获取命令,如发送获取网卡link status的命令,网卡收到命令后,则通过PCIE链路向BMC作出回应,如回应端口的link status是up还是down,BMC收到网卡的回应后可以判断PCIE链路及设备都是正常的。如果在这个过程中,PCIE链路出现异常或PCIE设备有异常,都会导致命令的交互过程失败,即无法收到反馈报文。为了避免链路抖动而出现误判的情况,可以通过多次MCTP命令交互的失败来确认链路或设备异常,例如在首次接收反馈报文失败后,间隔5秒再次发送状态获取命令,以此重复三次,三次均无法正常接收反馈报文,则认为PCIE链路异常。
在一种实施方式中,本公开同时提供了一种链路故障检测装置,如图2,应用于BMC设备,所述装置包括:协议模块21,用于判断目标PCIE设备是否支持MCTP协议;命令模块22,用于向支持MCTP协议的目标PCIE设备发送状态获取命令;处理模块23,用于尝试接收反馈报文,根据接收反馈报文的结果,判断关联于目标PCIE设备的PCIE链路的状态;所述反馈报文是目标PCIE设备在接收到状态获取命令后,响应于状态获取命令发送的反馈报文。
在一种实施方式中,所述向支持MCTP协议的目标PCIE设备发送状态获取命令,尝试接收反馈报文,根据接收反馈报文的结果,判断关联于目标PCIE设备的PCIE链路的状态,包括:若接收反馈报文失败,则在预设延迟后重新执行向支持MCTP协议的目标PCIE设备发送状态获取命令的步骤,并记录本次接收反馈报文失败的结果;若记录的接收反馈报文失败的结果达到指定次数,则判断关联于目标PCIE设备的PCIE链路的状态异常。
在一种实施方式中,所述向支持MCTP协议的目标PCIE设备发送状态获取命令,包括:通过MCTP协议封装包含有状态获取命令的指定协议的报文,向支持MCTP协议的目标PCIE设备发送该报文;所述指定协议包括NCSI协议或PLDM协议或VDM协议。
在一种实施方式中,所述尝试接收反馈报文,根据接收反馈报文的结果,判断关联于目标PCIE设备的PCIE链路的状态,包括:若判断关联于目标PCIE设备的PCIE链路的状态异常,则上报告警。
装置实施方式与对应的方法实施方式相同或相似,在此不再赘述。
在一种实施方式中,本公开提供了一种电子设备,包括处理器和机器可读存储介质,所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令,处理器执行所述机器可执行指令以实现前述的链路故障检测方法,从硬件层面而言,硬件架构示意图可以参见图3所示。
在一种实施方式中,本公开提供了一种机器可读存储介质,所述机器可读存储介质存储有机器可执行指令,所述机器可执行指令在被处理器调用和执行时,所述机器可执行指令促使所述处理器实现前述的链路故障检测方法。
这里,机器可读存储介质可以是任何电子、磁性、光学或其它物理存储装置,可以包含或存储信息,如可执行指令、数据,等等。例如,机器可读存储介质可以是:RAM(RadomAccess Memory,随机存取存储器)、易失存储器、非易失性存储器、闪存、存储驱动器(如硬盘驱动器)、固态硬盘、任何类型的存储盘(如光盘、dvd等),或者类似的存储介质,或者它们的组合。
上述实施方式阐明的***、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机,计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本公开时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本公开的实施方式可提供为方法、***、或计算机程序产品。因此,本公开可采用完全硬件实施方式、完全软件实施方式、或结合软件和硬件方面的实施方式的形式。而且,本公开实施方式可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本公开是参照根据本公开实施方式的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可以由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其它可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其它可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
而且,这些计算机程序指令也可以存储在能引导计算机或其它可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或者多个流程和/或方框图一个方框或者多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其它可编程数据处理设备上,使得在计算机或者其它可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其它可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本领域技术人员应明白,本公开的实施方式可提供为方法、***或计算机程序产品。因此,本公开可以采用完全硬件实施方式、完全软件实施方式、或者结合软件和硬件方面的实施方式的形式。而且,本公开可以采用在一个或者多个其中包含有计算机可用程序代码的计算机可用存储介质(可以包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上所述仅为本公开的实施方式而已,并不用于限制本公开。对于本领域技术人员来说,本公开可以有各种更改和变化。凡在本公开的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本公开的权利要求范围之内。

Claims (10)

1.一种链路故障检测方法,其特征在于,应用于BMC设备,所述方法包括:
判断目标PCIE设备是否支持MCTP协议;
向支持MCTP协议的目标PCIE设备发送状态获取命令;
尝试接收反馈报文,根据接收反馈报文的结果,判断关联于目标PCIE设备的PCIE链路的状态;
所述反馈报文是目标PCIE设备在接收到状态获取命令后,响应于状态获取命令发送的反馈报文。
2.根据权利要求1所述的方法,其特征在于,所述向支持MCTP协议的目标PCIE设备发送状态获取命令,尝试接收反馈报文,根据接收反馈报文的结果,判断关联于目标PCIE设备的PCIE链路的状态,包括:
若接收反馈报文失败,则在预设延迟后重新执行向支持MCTP协议的目标PCIE设备发送状态获取命令的步骤,并记录本次接收反馈报文失败的结果;
若记录的接收反馈报文失败的结果达到指定次数,则判断关联于目标PCIE设备的PCIE链路的状态异常。
3.根据权利要求1所述的方法,其特征在于,所述向支持MCTP协议的目标PCIE设备发送状态获取命令,包括:
通过MCTP协议封装包含有状态获取命令的指定协议的报文,向支持MCTP协议的目标PCIE设备发送该报文;
所述指定协议包括NCSI协议或PLDM协议或VDM协议。
4.根据权利要求1所述的方法,其特征在于,所述尝试接收反馈报文,根据接收反馈报文的结果,判断关联于目标PCIE设备的PCIE链路的状态,包括:
若判断关联于目标PCIE设备的PCIE链路的状态异常,则上报告警。
5.一种链路故障检测装置,其特征在于,应用于BMC设备,所述装置包括:
协议模块,用于判断目标PCIE设备是否支持MCTP协议;
命令模块,用于向支持MCTP协议的目标PCIE设备发送状态获取命令;
处理模块,用于尝试接收反馈报文,根据接收反馈报文的结果,判断关联于目标PCIE设备的PCIE链路的状态;
所述反馈报文是目标PCIE设备在接收到状态获取命令后,响应于状态获取命令发送的反馈报文。
6.根据权利要求5所述的装置,其特征在于,所述向支持MCTP协议的目标PCIE设备发送状态获取命令,尝试接收反馈报文,根据接收反馈报文的结果,判断关联于目标PCIE设备的PCIE链路的状态,包括:
若接收反馈报文失败,则在预设延迟后重新执行向支持MCTP协议的目标PCIE设备发送状态获取命令的步骤,并记录本次接收反馈报文失败的结果;
若记录的接收反馈报文失败的结果达到指定次数,则判断关联于目标PCIE设备的PCIE链路的状态异常。
7.根据权利要求5所述的装置,其特征在于,所述向支持MCTP协议的目标PCIE设备发送状态获取命令,包括:
通过MCTP协议封装包含有状态获取命令的指定协议的报文,向支持MCTP协议的目标PCIE设备发送该报文;
所述指定协议包括NCSI协议或PLDM协议或VDM协议。
8.根据权利要求5所述的装置,其特征在于,所述尝试接收反馈报文,根据接收反馈报文的结果,判断关联于目标PCIE设备的PCIE链路的状态,包括:
若判断关联于目标PCIE设备的PCIE链路的状态异常,则上报告警。
9.一种电子设备,其特征在于,包括:处理器和机器可读存储介质,所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令,所述处理器执行所述机器可执行指令,以实现权利要求1-4任一所述的方法。
10.一种机器可读存储介质,其特征在于,所述机器可读存储介质存储有机器可执行指令,所述机器可执行指令在被处理器调用和执行时,所述机器可执行指令促使所述处理器实现权利要求1-4任一所述的方法。
CN202210327368.3A 2022-03-30 2022-03-30 一种链路故障检测方法、装置、设备及机器可读存储介质 Pending CN114826962A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210327368.3A CN114826962A (zh) 2022-03-30 2022-03-30 一种链路故障检测方法、装置、设备及机器可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210327368.3A CN114826962A (zh) 2022-03-30 2022-03-30 一种链路故障检测方法、装置、设备及机器可读存储介质

Publications (1)

Publication Number Publication Date
CN114826962A true CN114826962A (zh) 2022-07-29

Family

ID=82533610

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210327368.3A Pending CN114826962A (zh) 2022-03-30 2022-03-30 一种链路故障检测方法、装置、设备及机器可读存储介质

Country Status (1)

Country Link
CN (1) CN114826962A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116137603A (zh) * 2023-02-23 2023-05-19 苏州浪潮智能科技有限公司 链路故障的检测方法和装置、存储介质及电子装置
CN116582471A (zh) * 2023-07-14 2023-08-11 珠海星云智联科技有限公司 Pcie设备、pcie数据捕获***和服务器

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012100724A1 (zh) * 2011-01-28 2012-08-02 成都市华为赛门铁克科技有限公司 在pcie总线上传输报文的方法、设备和***
US20190361763A1 (en) * 2018-05-25 2019-11-28 Qualcomm Incorporated Safe handling of link errors in a peripheral component interconnect express (pcie) device
CN110958132A (zh) * 2019-10-31 2020-04-03 苏州浪潮智能科技有限公司 监控网卡设备的方法、基板管理控制器及网卡设备
CN113010381A (zh) * 2021-03-12 2021-06-22 山东英信计算机技术有限公司 一种部件管理的方法和设备
CN113868058A (zh) * 2021-09-28 2021-12-31 新华三技术有限公司 一种外设组件高速互联设备故障检测方法、装置及服务器

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012100724A1 (zh) * 2011-01-28 2012-08-02 成都市华为赛门铁克科技有限公司 在pcie总线上传输报文的方法、设备和***
US20190361763A1 (en) * 2018-05-25 2019-11-28 Qualcomm Incorporated Safe handling of link errors in a peripheral component interconnect express (pcie) device
CN110958132A (zh) * 2019-10-31 2020-04-03 苏州浪潮智能科技有限公司 监控网卡设备的方法、基板管理控制器及网卡设备
CN113010381A (zh) * 2021-03-12 2021-06-22 山东英信计算机技术有限公司 一种部件管理的方法和设备
CN113868058A (zh) * 2021-09-28 2021-12-31 新华三技术有限公司 一种外设组件高速互联设备故障检测方法、装置及服务器

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116137603A (zh) * 2023-02-23 2023-05-19 苏州浪潮智能科技有限公司 链路故障的检测方法和装置、存储介质及电子装置
CN116582471A (zh) * 2023-07-14 2023-08-11 珠海星云智联科技有限公司 Pcie设备、pcie数据捕获***和服务器
CN116582471B (zh) * 2023-07-14 2023-09-19 珠海星云智联科技有限公司 Pcie设备、pcie数据捕获***和服务器

Similar Documents

Publication Publication Date Title
US9141491B2 (en) Highly available server system based on cloud computing
CN114826962A (zh) 一种链路故障检测方法、装置、设备及机器可读存储介质
WO2021027481A1 (zh) 故障处理方法、装置、计算机设备、存储介质及存储***
EP3142011A1 (en) Anomaly recovery method for virtual machine in distributed environment
CN106502814B (zh) 一种记录pcie设备错误信息的方法及装置
CN107729213B (zh) 一种后台任务监控方法及装置
CN113595836A (zh) 一种高可用集群的心跳检测方法、存储介质和计算节点
CN103559124A (zh) 故障快速检测方法及装置
CN109101371B (zh) 一种容灾切换方法及装置
CN105357069A (zh) 分布式节点服务状态监测的方法、装置及***
US9092396B2 (en) Standby system device, a control method, and a program thereof
CN110912985B (zh) 一种网络链路调度方法及相关设备
TW201428487A (zh) 監測系統及監測方法
US11704180B2 (en) Method, electronic device, and computer product for storage management
CN114218037A (zh) 一种硬盘管理方法、装置、设备及机器可读存储介质
CN113868058A (zh) 一种外设组件高速互联设备故障检测方法、装置及服务器
CN107391036B (zh) 一种存储的vpd信息访问方法及***
CN109828945A (zh) 一种业务报文处理方法及***
CN110224872B (zh) 一种通信方法、装置及存储介质
CN114880266B (zh) 故障处理的方法、装置、计算机设备和存储介质
CN112804115B (zh) 一种虚拟网络功能的异常检测方法、装置及设备
CN114449037A (zh) 一种异步通信推送***
CN112383471A (zh) 一种刀箱链路管理方法、装置、设备及机器可读存储介质
CN113032106A (zh) 计算节点io悬挂异常自动检测方法及装置
CN112162909A (zh) 一种硬盘故障处理方法、装置、设备及机器可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination