CN108958989A - 一种***故障恢复方法及装置 - Google Patents

一种***故障恢复方法及装置 Download PDF

Info

Publication number
CN108958989A
CN108958989A CN201710417137.0A CN201710417137A CN108958989A CN 108958989 A CN108958989 A CN 108958989A CN 201710417137 A CN201710417137 A CN 201710417137A CN 108958989 A CN108958989 A CN 108958989A
Authority
CN
China
Prior art keywords
board
system failure
failure recovery
self
recovery
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710417137.0A
Other languages
English (en)
Other versions
CN108958989B (zh
Inventor
笪禹
卜弋天
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Orion Star Technology Co Ltd
Original Assignee
Beijing Orion Star Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Orion Star Technology Co Ltd filed Critical Beijing Orion Star Technology Co Ltd
Priority to CN201710417137.0A priority Critical patent/CN108958989B/zh
Publication of CN108958989A publication Critical patent/CN108958989A/zh
Application granted granted Critical
Publication of CN108958989B publication Critical patent/CN108958989B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/1438Restarting or rejuvenating

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Hardware Redundancy (AREA)

Abstract

本申请实施例提供了一种***故障恢复方法及装置,涉及计算机技术领域,应用于智能设备中的第一板卡,其中,上述方法包括:确定第二板卡出现***故障后,广播所述第二板卡出现***故障的故障信息,其中,所述第二板卡为:所述智能设备中除所述第一板卡外的一个板卡;在接收到所述智能设备中除所述第一板卡外的其他板卡广播的所述第二板卡出现***故障的故障信息的情况下,判断自身是否能够用于对所述第二板卡进行***故障恢复;若为是,对所述第二板卡进行***故障恢复。应用本申请实施例提供的方案进行***故障恢复,能够简化操作,提高故障恢复效率。

Description

一种***故障恢复方法及装置
技术领域
本申请涉及计算机技术领域,特别是涉及一种***故障恢复方法及装置。
背景技术
随着硬件技术的快速发展,机器人等智能设备越来越多的走进人们的生活。可以理解的,这些智能设备一般包括众多功能模块,例如,机器人包括:人机交互模块、图像识别模块、语音识别模块、机械控制模块、电源管理模块、运动控制模块等等,这些功能模块分布于不同的板卡上,而各个板卡上的软件***可能是不同的,如,这些软件***可以是:Android***、Linux***、bear-metal***等等。
智能设备在运行过程中可能会由于用户操作或者其他原因导致各个板卡上的软件***故障,进而导致智能设备无法正常运行。现有技术中出现上述情况时,一般需要维修人员通过PC机或者笔记本电脑连接故障板卡,通过专门的工具对故障板卡进行***故障恢复。
可见,应用现有技术中的方式对板卡进行***故障恢复时,操作复杂、故障恢复效率低。
发明内容
本申请实施例的目的在于提供一种***故障恢复方法及装置,以简化对板卡进行***故障恢复时的操作,提高故障恢复效率。具体技术方案如下:
一种***故障恢复方法,应用于智能设备中的第一板卡,所述方法包括:
确定第二板卡出现***故障后,广播所述第二板卡出现***故障的故障信息,其中,所述第二板卡为:所述智能设备中除所述第一板卡外的一个板卡;
在接收到所述智能设备中除所述第一板卡外的其他板卡广播的所述第二板卡出现***故障的故障信息的情况下,判断自身是否能够用于对所述第二板卡进行***故障恢复;
若为是,对所述第二板卡进行***故障恢复。
在本申请的一种实现方式中,通过以下方式确定所述第二板卡出现***故障:
从所述智能设备的总线中确定目标总线;
通过各个目标总线向第二板卡发送故障探测消息;
监测是否均未通过各个目标总线接收到来自所述第二板卡的故障探测响应;
若为是,确定所述第二板卡出现***故障;
所述广播所述第二板卡出现***故障的故障信息的步骤,包括:
通过各个目标总线广播所述第二板卡出现***故障的故障信息。
在本申请的一种实现方式中,所述判断自身是否能够用于对所述第二板卡进行***故障恢复的步骤,包括:
广播自身的自荐信息,并监听其他板卡广播的自荐信息;
在监听到其他板卡广播的自荐信息时,根据自身的自荐信息和接收的自荐信息,判断自身是否能够用于对所述第二板卡进行***故障恢复;
在未监听到其他板卡广播的自荐信息时,确定自能能够用于对所述第二板卡进行***故障恢复。
在本申请的一种实现方式中,在所述广播自身的自荐信息的步骤之前,还包括:
获得自身硬件状态信息,并判断自身硬件状态信息是否满足第一自荐条件;
若满足所述第一自荐条件,获得自身业务场景;
判断自身业务场景是否满足第二自荐条件;
若满足所述第二自荐条件,执行所述广播自身的自荐信息的步骤。
在本申请的一种实现方式中,在所述对所述第二板卡进行***故障恢复的步骤之前,还包括:
发送***故障恢复提示信息;
获得用户针对所述***故障恢复提示信息的响应信息;
在所述响应信息表明用户同意进行***故障恢复的情况下,执行所述对所述第二板卡进行***故障恢复的步骤。
在本申请的一种实现方式中,所述对所述第二板卡进行***故障恢复的步骤,包括:
关闭所述第二板卡的电源;
通过板卡间连接的I/O管脚控制所述第二板卡上的***进入故障恢复模式,以使得所述第二板卡进行***故障恢复;
接收所述第二板卡在***故障恢复完成后发送的***故障恢复完成通知;
根据所述***故障恢复完成通知确定所述第二板卡是否完成***故障恢复;
若为是,关闭所述第二板卡的电源,并重新开启所述第二板卡的电源,以使得所述第二板卡进行***重启。
在本申请的一种实现方式中,所述对所述第二板卡进行***故障恢复的步骤,包括:
通过设置硬件I/O状态,将所述第二板卡的启动设备切换至所述第二板卡的备份设备;
对所述第二板卡进行复位操作,以使得:所述第二板卡复位启动并在读取硬件I/O状态后将启动设备切换至所述备份设备,将所述备份设备中用于进行***故障恢复的文件恢复至所述第二板卡的主设备上;
接收所述第二板卡在***故障恢复完成后发送的***故障恢复完成通知;
根据所述***故障恢复完成通知确定所述第二板卡是否完成***故障恢复;
若为是,清除硬件I/O状态;
向所述第二板卡发送复位通知,以使得所述第二板卡进行复位启动。
在本申请的一种实现方式中,所述对所述第二板卡进行***故障恢复的步骤,包括:
通过设置硬件I/O状态,切换所述第二板卡的启动模式为预设升级模式;
对所述第二板卡进行复位操作,以使得:所述第二板卡复位启动并在读取硬件I/O状态后进入所述预设升级模式;
按照所述预设升级模式,对所述第二板卡进行升级;
确定完成对所述第二板卡的升级后,清除硬件I/O状态;
向所述第二板卡发送复位通知,以使得所述第二板卡进行复位启动。
在本申请的一种实现方式中,所述对所述第二板卡进行***故障恢复的步骤,包括:
通过运行预设闪存烧写程序对所述第二板卡进行升级;
确定完成对所述第二板卡的升级后,对所述第二板卡进行复位操作,以使得所述第二板卡进行复位启动。
一种***故障恢复装置,应用于智能设备中的第一板卡,所述装置包括:
信息广播模块,用于确定第二板卡出现***故障后,广播所述第二板卡出现***故障的故障信息,其中,所述第二板卡为:所述智能设备中除所述第一板卡外的一个板卡;
恢复判断模块,用于在接收到所述智能设备中除所述第一板卡外的其他板卡广播的所述第二板卡出现***故障的故障信息的情况下,判断自身是否能够用于对所述第二板卡进行***故障恢复,若为是,触发故障恢复模块;
所述故障恢复模块,用于对所述第二板卡进行***故障恢复。
在本申请的一种实现方式中,所述***故障恢复装置还包括:故障确定模块;
所述故障确定模块,用于确定所述第二板卡是否出现***故障;
所述故障确定模块,包括:
总线确定子模块,用于从所述智能设备的总线中确定目标总线;
消息发送子模块,用于通过各个目标总线向第二板卡发送故障探测消息;
响应检测子模块,用于监测是否均未通过各个目标总线接收到来自所述第二板卡的故障探测响应,若为是,触发故障确定子模块;
所述故障确定子模块,用于确定所述第二板卡出现***故障;
所述信息广播模块,具体用于通过各个目标总线广播所述第二板卡出现***故障的故障信息。
在本申请的一种实现方式中,所述恢复判断模块,包括:
信息接收确定子模块,用于确定接收到所述智能设备中除所述第一板卡外的其他板卡广播的所述第二板卡出现***故障的故障信息;
信息广播子模块,用于广播自身的自荐信息,并监听其他板卡广播的自荐信息,在监听到其他板卡广播的自荐信息时,触发恢复判断子模块,在未监听到其他板卡广播的自荐信息时,触发恢复确定子模块;
所述恢复判断子模块,用于根据自身的自荐信息和接收的自荐信息,判断自身是否能够用于对所述第二板卡进行***故障恢复;
所述恢复确定子模块,用于确定自能能够用于对所述第二板卡进行***故障恢复。
在本申请的一种实现方式中,所述恢复判断模块,还包括:
状态信息获得子模块,用于在所述信息接收确定子模块确定接收到故障信息后,获得自身硬件状态信息,并判断自身硬件状态信息是否满足第一自荐条件,若满足所述第一自荐条件,触发场景获得子模块;
所述场景获得子模块,用于获得自身业务场景;
条件判断子模块,用于判断自身业务场景是否满足第二自荐条件,若满足所述第二自荐条件,触发所述信息广播子模块。
在本申请的一种实现方式中,所述***故障恢复装置还包括:
信息发送模块,用于发送***故障恢复提示信息;
信息获得模块,用于获得用户针对所述***故障恢复提示信息的响应信息,在所述响应信息表明用户同意进行***故障恢复的情况下,触发所述故障恢复模块。
在本申请的一种实现方式中,所述故障恢复模块,具体用于关闭所述第二板卡的电源;通过板卡间连接的I/O管脚控制所述第二板卡上的***进入故障恢复模式,以使得所述第二板卡进行***故障恢复;接收所述第二板卡在***故障恢复完成后发送的***故障恢复完成通知;根据所述***故障恢复完成通知确定所述第二板卡是否完成***故障恢复;若为是,关闭所述第二板卡的电源,并重新开启所述第二板卡的电源,以使得所述第二板卡进行***重启。
在本申请的一种实现方式中,所述故障恢复模块,具体用于通过设置硬件I/O状态,将所述第二板卡的启动设备切换至所述第二板卡的备份设备;对所述第二板卡进行复位操作,以使得:所述第二板卡复位启动并在读取硬件I/O状态后将启动设备切换至所述备份设备,将所述备份设备中用于进行***故障恢复的文件恢复至所述第二板卡的主设备上;接收所述第二板卡在***故障恢复完成后发送的***故障恢复完成通知;根据所述***故障恢复完成通知确定所述第二板卡是否完成***故障恢复;若为是,清除硬件I/O状态;向所述第二板卡发送复位通知,以使得所述第二板卡进行复位启动。
在本申请的一种实现方式中,所述故障恢复模块,具体用于通过设置硬件I/O状态,切换所述第二板卡的启动模式为预设升级模式;对所述第二板卡进行复位操作,以使得:所述第二板卡复位启动并在读取硬件I/O状态后进入所述预设升级模式;按照所述预设升级模式,对所述第二板卡进行升级;确定完成对所述第二板卡的升级后,清除硬件I/O状态;向所述第二板卡发送复位通知,以使得所述第二板卡进行复位启动。
在本申请的一种实现方式中,所述故障恢复模块,具体用于通过运行预设闪存烧写程序对所述第二板卡进行升级;确定完成对所述第二板卡的升级后,对所述第二板卡进行复位操作,以使得所述第二板卡进行复位启动。
一种电子设备,所述电子设备为智能设备中的第一板卡,包括:处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现本申请实施例提供的所述的***故障恢复方法步骤。
一种计算机可读存储介质,所述计算机可读存储介质为智能设备中第一板卡的可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现本申请实施例提供的所述***故障恢复方法步骤。
由以上可见,本申请实施例提供的方案中,智能设备中的多个板卡协同确定智能设备中的某一个板卡是否出现***故障,当确定该板卡出现***故障时,由智能设备中一个未出现***故障的板卡对上述出现故障的板卡进行故障恢复。可见应用本申请实施例提供的方案进行故障恢复时,无需维修人员手动操作,简化了对板卡进行***故障恢复时的操作,进而提高了故障恢复效率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种***故障恢复方法的流程示意图;
图2为本申请实施例提供的另一种***故障恢复方法的流程示意图;
图3为本申请实施例提供的一种***故障恢复方法的信令流程示意图;
图4为本申请实施例提供的另一种***故障恢复方法的信令流程示意图;
图5为本申请实施例提供的再一种***故障恢复方法的信令流程示意图;
图6为本申请实施例提供的一种***故障恢复装置的结构示意图;
图7为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
图1为本申请实施例提供的一种***故障恢复方法的流程示意图,该方法应用于智能设备中的第一板卡,其中,上述智能设备包括至少两个板卡,第一板卡为智能设备中的任一板卡。
具体的,上述方法包括:
S101:确定第二板卡出现***故障后,广播第二板卡出现***故障的故障信息。
其中,上述第二板卡为:智能设备中除第一板卡外的一个板卡。
本申请的一种实现方式中,可以通过以下方式确定第二板卡是否出现***故障:从智能设备的总线中确定目标总线;通过各个目标总线向第二板卡发送故障探测消息;监测是否均未通过各个目标总线接收到来自第二板卡的故障探测响应;若为是,确定第二板卡出现***故障;若监测到通过各个目标总线中的至少一个接收到来自第二板卡的故障探测响应,则一定程度上说明第二板卡未出现***故障,所以不能确定第二板卡出现***故障。
这种情况下,广播第二板卡出现***故障的故障信息时,可以通过各个目标总线广播第二板卡出现***故障的故障信息。
可以理解的,智能设备中可能会设置有多种总线,本申请实施例中,可以根据各种总线的具体状态从智能设备的多种总线中选择一种或者多种总线向第二板卡发送故障探测消息。较佳的,可以选择两种及其以上种总线作为目标总线,这样可以有效防止通过一种总线发送故障探测消息过程中由于数据传输延迟等原因导致第二板卡无法收到故障探测消息,第二板卡也就是不会向第一板卡反馈故障探测响应,进而误判第二板卡出现***故障。
另外,上述故障探测消息可以理解为:用于探测板卡是否出现***故障的消息。
故障探测响应可以理解为:板卡A接收到故障探测消息后用于通知板卡B板卡A未出现***故障的消息,其中,板卡B为向板卡A发送故障探测消息的板卡。
也就是说,若板卡A未出现***故障,板卡A一般能够正常接收到板卡B发送的故障探测消息,进而向板卡B反馈故障探测响应;而若板卡A出现***故障,板卡A无法正常工作,则板卡A无法接收到板卡B发送的故障探测消息,或者接收到板卡B发送的故障探测消息后无法响应该故障探测消息,进而这两种情况下,板卡A不会向板卡B发送故障探测响应。
S102:在接收到智能设备中除第一板卡外的其他板卡广播的第二板卡出现***故障的故障信息的情况下,判断自身是否能够用于对第二板卡进行***故障恢复,若为是,执行S103。
第一板卡确定第二板卡存在***故障后,为保证智能设备正常运行,需要对第二板卡进行***故障恢复。本申请实施例中摒弃了现有技术中由维修人员手动对故障板卡进行***故障恢复的方式,选择由智能设备中未出现***故障的板卡,也就是由处于正常状态的板卡对故障板卡进行***故障恢复。鉴于此,第一板卡需确认自身是否具有对第二板卡进行***故障恢复的能力,若具有能力,则对第二板卡进行***故障恢复,若不具有能力,则第一板卡放弃对第二板卡进行***故障恢复,由智能设备中的其他板卡对第二板卡进行***故障恢复。
本领域内技术人员可以理解的是,上述第一板卡为智能设备中的任一板卡,也就是说本申请实施例提供的***故障恢复方法适应于智能设备中的任一板卡,基于此,第一板卡确认第二板卡是否出现***故障的同时,其他板卡也会确认第二板卡是否出现***故障,当其他板卡确定第二板卡出现***故障时,可以采取与第一板卡相同的操作,广播第二板卡出现***故障的故障信息,因此,第一板卡有可能会接收到其他板卡广播的第二板卡出现***故障的故障信息。
另外,第一板卡自身确认第二板卡是否出现***故障的过程中,由于通信延时等原因可能会判定第二板卡出现***故障,从而带来判断误差,但是本实施例中,接收到其他板卡广播的第二板卡出现***故障的故障信息后,也就是,其他板卡也确认第二版卡存在***故障后,才判断自身是否能够用于对第二板卡进行***故障恢复,这样第一板卡并非仅仅在自己确认第二板卡出现***故障后即确定自己是否要对第二板卡进行***故障恢复,而是与其他板卡一起联合确认第二板卡是否出现了***故障,也就是多板卡联合确认第二板卡是否出现了***故障,这样能够有效降低误判第二板卡出现***故障的概率。
本申请的一种实现方式中,判断自身是否能够用于对第二板卡进行***故障恢复时,可以广播自身的自荐信息,并监听其他板卡广播的自荐信息;在监听到其他板卡广播的自荐信息时,根据自身的自荐信息和接收的自荐信息,判断自身是否能够用于对第二板卡进行***故障恢复;在未监听到其他板卡广播的自荐信息时,确定自能能够用于对第二板卡进行***故障恢复。
其中,上述自荐信息可以理解为:智能设备中一板卡向其他板卡推荐自己对智能设备中的故障板卡进行***故障恢复的信息。具体的,上述自荐信息中可以包含:CPU占用率、业务场景等信息,本申请仅仅以此为例进行说明,并不对上述自荐信息中包含的具体内容进行限定。
具体的,第一板卡根据自身的自荐信息和接收的自荐信息,判断自身是否能够用于对第二板卡进行***故障恢复时,可以根据自身的自荐信息和接收的自荐信息,确定第一板卡与所接收自荐信息对应的各个板卡之间的优先级,然后判断优先级最高的板卡是否为第一板卡自身,若为是,确定第一板卡自身能够用于对第二板卡进行***故障恢复,若为否,放弃对第二板卡进行***故障恢复。
例如,可以按照CPU占用率越低优先级越高的方式确定第一板卡与所接收自荐信息对应的各个板卡之间的优先级等等。
本申请的一种实现方式中,在广播自身的自荐信息之前,还可以获得自身硬件状态信息,并判断自身硬件状态信息是否满足第一自荐条件;若满足第一自荐条件,获得自身业务场景;并判断自身业务场景是否满足第二自荐条件;若满足第二自荐条件,执行上述广播自身的自荐信息的步骤。
具体的,上述硬件状态信息可以包括:CPU占用率、内存占用率等等。
上述第一自荐条件为与硬件状态信息相关的条件,可以依据硬件状态信息的不同而不同,例如,上述硬件状态信息包含CPU占用率时,若CPU占用率高,说明板卡处于忙碌状态,可能没有足够的资源对故障板卡进行***故障恢复,这种情况下可以放弃对故障板卡进行***故障恢复,而不广播自荐信息;反之,若CPU占用率低,说明板卡中的空闲资源比较丰富,可能有足够的资源对故障板卡进行***故障恢复,这种情况下可以向智能设备中的其他板卡推荐自己,看自己是否能够对故障板卡进行***故障恢复。鉴于上述情况,上述第一自荐条件可以为:CPU占用率小于预设数值,如,40%等等。
上述第二自荐条件为与业务场景相关的条件。可以理解的是,不同业务场景对资源的整体需求不同,一些业务场景对资源的整体需求较高,这种情况下,为保证业务的正常执行,可能无法提供足够的资源对故障板卡进行***故障恢复,这种情况下可以不向智能设备中的其他板卡推荐自己对故障板卡进行***故障恢复;另外,一些业务场景对资源的整体需求较低,这种情况下,可能能够提供足够的资源对故障板卡进行***故障恢复,可以向智能设备中的其他板卡推荐自己对故障板卡进行***故障恢复。鉴于上述情况,上述第二自荐条件可以为:业务场景为预设业务场景等等。
S103:对第二板卡进行***故障恢复。
对第二板卡进行***故障恢复的方式,受第二板卡上***类型的影响可以存在多种方式,具体情况可以参见图3-图5所示的各个实施例提供的方式,这里暂不详述。
由以上可见,上述各个实施例提供的方案中,智能设备中的多个板卡协同确定智能设备中的某一个板卡是否出现***故障,当确定该板卡出现***故障时,由智能设备中一个未出现***故障的板卡对上述出现故障的板卡进行故障恢复。可见应用上述各个实施例提供的方案进行故障恢复时,无需维修人员手动操作,简化了对板卡进行***故障恢复时的操作,进而提高了故障恢复效率。
下面通过一个具体实施例对本申请实施例提供的***故障恢复方法进行说明,参见图2,提供了另一种***故障恢复方法的流程示意图,该方法应用于智能设备中的第一板卡,包括:
S201:从智能设备的总线中确定目标总线。
S202:通过各个目标总线向第二板卡发送故障探测消息。
S203:监测是否均未通过各个目标总线接收到来自第二板卡的故障探测响应,若为是,执行S204。
S204:确定第二板卡出现***故障。
S205:通过各个目标总线广播第二板卡出现***故障的故障信息。
S206:在接收到智能设备中除第一板卡外的其他板卡广播的第二板卡出现***故障的故障信息的情况下,获得自身硬件状态信息,并判断自身硬件状态信息是否满足第一自荐条件,若满足,执行S207。
S207:获得自身业务场景。
S208:判断自身业务场景是否满足第二自荐条件,若满足,执行S209。
S209:广播自身的自荐信息,并监听其他板卡广播的自荐信息。
S210:在监听到其他板卡广播的自荐信息时,根据自身的自荐信息和接收的自荐信息,判断自身是否能够用于对第二板卡进行***故障恢复,若能够,执行S212。
S211:在未监听到其他板卡广播的自荐信息时,确定自能能够用于对第二板卡进行***故障恢复,并执行S212。
S212:对第二板卡进行***故障恢复。
本申请的一种实现方式中,在对第二板卡进行***故障恢复的之前,还可以发送***故障恢复提示信息;获得用户针对***故障恢复提示信息的响应信息;在上述响应信息表明用户同意进行***故障恢复的情况下,执行上述对第二板卡进行***故障恢复的步骤。
对第二板卡进行***故障恢复之前,可以提示用户要对第二板卡进行***故障恢复,这种情况下,若用户同意对第二板卡进行***故障恢复,则执行前述S103步骤对第二板卡进行***故障恢复,若用户不同意对第二板卡进行***故障恢复,可以推迟对第二板卡进行***故障恢复,这样能够兼顾用户的意愿对故障板卡进行***故障恢复,可以大大提高用户体验。
具体的,上述故障恢复提示信息可以是语音形式的***故障恢复提示信息,还可以是文字、图形等形式的***故障恢复提示信息,本申请并不对此进行限定。
当上述故障恢复提示信息为语音形式的***故障恢复提示信息时,第一板卡发送***故障恢复提示信息,可以是将***故障恢复提示信息发送至智能设备中的语音处理模块,由语音处理模块为用户播放***故障恢复提示信息,另外,还可以由语音处理模块获得用户的语音响应,并对语音响应进行语音识别等处理后,将处理结果发送至第一板卡,进而第一板卡获得用户针对上述***故障恢复提示信息的响应信息。
当上述***故障恢复提示信息为文字、图形等形式的***故障恢复提示信息时,第一板卡发送***故障恢复提示信息,可以是将***故障恢复提示信息发送至智能设备中的界面展示模块,由界面展示模块为用户展示***故障恢复提示信息,另外,还可以由界面展示模块获得用户输入的响应,并将用户输入的响应发送至第一板卡,进而第一板卡获得用户针对上述***故障恢复提示信息的响应信息。
具体的,可以根据以下信息中的至少一种确定用户是否同意进行***故障恢复:
用户针对语音形式的***故障恢复提示信息的响应信息;
用户针对文字、图形等形式的***故障恢复提示信息的响应信息。
由于对故障板卡进行***故障恢复的方式,受故障板卡上***类型的影响,当前又存在多种***类型,下面通过不同实施例对第一板卡对第二板卡进行***故障恢复的不同方式进行介绍。
本申请的一种实现方式中,参见图3,提供了一种***故障恢复方法的信令流程示意图,该方法包括:
第一板卡关闭第二板卡的电源(S301),这时第二板卡掉电(S302),第一板卡通过板卡间连接的I/O管脚控制第二板卡上的***进入故障恢复模式(S303),这样第二板卡上电并进入故障恢复模式(S304),然后第二板卡即可开始进行***故障恢复(S305),第二板卡在***故障恢复完成后向第一板卡发送***故障恢复完成通知(S306),通知第一板卡***故障恢复完成,第一板卡接收上述***故障恢复完成通知,并根据上述***故障恢复完成通知确定第二板卡是否完成***故障恢复(S307),若为是,关闭第二板卡的电源(S308),这时,第二板卡掉电(S309),然后,第一板卡重新开启第二板卡的电源(S310),第二板卡进行***重启(S311),至此第一板卡完整完成对第二板卡的***故障恢复。
具体的,发明人经过实验验证上述方式可以应用于第二板卡上***为Android***的情况。
每一板卡上一般会具有主设备和备份设备,其中,主设备用于存储板卡上***的***文件等信息,板卡上***的运行依托于主设备中的***文件,板卡出现***故障时,可以理解为主设备中存储的***文件存现故障;备份设备用于存储板卡上***的备份文件。
基于上述情况,本申请的一种实现方式中,参见图4,提供了另一种***故障恢复方法的信令流程示意图,该方法包括:
第一板卡通过设置硬件I/O状态,将第二板卡的启动设备切换至第二板卡的备份设备(S401),对第二板卡进行复位操作(S402),这样第二板卡复位启动(S403)并在读取硬件I/O状态(S404)后将启动设备切换至上述备份设备(S405),将上述备份设备中用于进行***故障恢复的文件恢复至第二板卡的主设备上(S406),第二板卡在***故障恢复完成后向第一板卡发送***故障恢复完成通知(S407),通知第一板卡***故障恢复完成,第一板卡接收上述***故障恢复完成通知,并根据上述***故障恢复完成通知确定第二板卡是否完成***故障恢复(S408),若为是,清除硬件I/O状态(S409),向第二板卡发送复位通知(S410),第二板卡进行复位启动(S411),至此第一板卡完整完成对第二板卡的***故障恢复。
具体的,发明人经过实验验证上述方式可以应用于第二板卡上***为Linux***的情况。
本申请的一种实现方式中,参见图5,提供了再一种***故障恢复方法的信令流程示意图,该方法包括:
第一板卡通过设置硬件I/O状态,切换第二板卡的启动模式为预设升级模式(S501),对第二板卡进行复位操作(S502),这样第二板卡复位启动(503)并在读取硬件I/O状态(S504)后进入上述预设升级模式(S505),第一板卡按照上述预设升级模式,对第二板卡进行升级(S506),确定完成对第二板卡的升级(S507)后,清除硬件I/O状态(S508),向第二板卡发送复位通知(S509),第二板卡进行复位启动(S510),至此第一板卡完整完成对第二板卡的***故障恢复。
上述预设升级模式可以是:ISP升级模式。
具体的,发明人经过实验验证上述方式可以应用于第二板卡上***为bear-metal***、且第二板卡支持ISP升级的情况。
本申请的一种实现方式中,还可以通过以下方式实现对第二板卡进行***故障恢复:
通过运行预设闪存烧写程序对第二板卡进行升级;
确定完成对第二板卡的升级后,对第二板卡进行复位操作,以使得第二板卡进行复位启动。
上述预设闪存烧写程序可以是:JTAG程序。
具体的,发明人经过实验验证上述方式可以应用于第二板卡上***为bear-metal***、且第二板卡支持JTAG升级的情况。
与上述***故障恢复方法相对应,本申请实施例还提供了一种***故障恢复装置。
图6为本申请实施例提供的一种***故障恢复装置的结构示意图,该装置应用于智能设备中的第一板卡,包括:
信息广播模块601,用于确定第二板卡出现***故障后,广播所述第二板卡出现***故障的故障信息,其中,所述第二板卡为:所述智能设备中除所述第一板卡外的一个板卡;
恢复判断模块602,用于在接收到所述智能设备中除所述第一板卡外的其他板卡广播的所述第二板卡出现***故障的故障信息的情况下,判断自身是否能够用于对所述第二板卡进行***故障恢复,若为是,触发故障恢复模块603;
所述故障恢复模块603,用于对所述第二板卡进行***故障恢复。
具体的,所述***故障恢复装置还可以包括:故障确定模块;
所述故障确定模块,用于确定所述第二板卡是否出现***故障;
所述故障确定模块,包括:
总线确定子模块,用于从所述智能设备的总线中确定目标总线;
消息发送子模块,用于通过各个目标总线向第二板卡发送故障探测消息;
响应检测子模块,用于监测是否均未通过各个目标总线接收到来自所述第二板卡的故障探测响应,若为是,触发故障确定子模块;
所述故障确定子模块,用于确定所述第二板卡出现***故障;
所述信息广播模块,具体用于通过各个目标总线广播所述第二板卡出现***故障的故障信息。
具体的,所述恢复判断模块602可以包括:
信息接收确定子模块,用于确定接收到所述智能设备中除所述第一板卡外的其他板卡广播的所述第二板卡出现***故障的故障信息;
信息广播子模块,用于广播自身的自荐信息,并监听其他板卡广播的自荐信息,在监听到其他板卡广播的自荐信息时,触发恢复判断子模块,在未监听到其他板卡广播的自荐信息时,触发恢复确定子模块;
所述恢复判断子模块,用于根据自身的自荐信息和接收的自荐信息,判断自身是否能够用于对所述第二板卡进行***故障恢复;
所述恢复确定子模块,用于确定自能能够用于对所述第二板卡进行***故障恢复。
具体的,所述恢复判断模块602还可以包括:
状态信息获得子模块,用于在所述信息接收确定子模块确定接收到故障信息后,获得自身硬件状态信息,并判断自身硬件状态信息是否满足第一自荐条件,若满足所述第一自荐条件,触发场景获得子模块;
所述场景获得子模块,用于获得自身业务场景;
条件判断子模块,用于判断自身业务场景是否满足第二自荐条件,若满足所述第二自荐条件,触发所述信息广播子模块。
具体的,所述***故障恢复装置还可以包括:
信息发送模块,用于发送***故障恢复提示信息;
信息获得模块,用于获得用户针对所述***故障恢复提示信息的响应信息,在所述响应信息表明用户同意进行***故障恢复的情况下,触发所述故障恢复模块。
具体的,所述故障恢复模块603,具体用于关闭所述第二板卡的电源;通过板卡间连接的I/O管脚控制所述第二板卡上的***进入故障恢复模式,以使得所述第二板卡进行***故障恢复;接收所述第二板卡在***故障恢复完成后发送的***故障恢复完成通知;根据所述***故障恢复完成通知确定所述第二板卡是否完成***故障恢复;若为是,关闭所述第二板卡的电源,并重新开启所述第二板卡的电源,以使得所述第二板卡进行***重启。
具体的,所述故障恢复模块603,具体用于通过设置硬件I/O状态,将所述第二板卡的启动设备切换至所述第二板卡的备份设备;对所述第二板卡进行复位操作,以使得:所述第二板卡复位启动并在读取硬件I/O状态后将启动设备切换至所述备份设备,将所述备份设备中用于进行***故障恢复的文件恢复至所述第二板卡的主设备上;接收所述第二板卡在***故障恢复完成后发送的***故障恢复完成通知;根据所述***故障恢复完成通知确定所述第二板卡是否完成***故障恢复;若为是,清除硬件I/O状态;向所述第二板卡发送复位通知,以使得所述第二板卡进行复位启动。
具体的,所述故障恢复模块603,具体用于通过设置硬件I/O状态,切换所述第二板卡的启动模式为预设升级模式;对所述第二板卡进行复位操作,以使得:所述第二板卡复位启动并在读取硬件I/O状态后进入所述预设升级模式;按照所述预设升级模式,对所述第二板卡进行升级;确定完成对所述第二板卡的升级后,清除硬件I/O状态;向所述第二板卡发送复位通知,以使得所述第二板卡进行复位启动。
具体的,所述故障恢复模块603,具体用于通过运行预设闪存烧写程序对所述第二板卡进行升级;确定完成对所述第二板卡的升级后,对所述第二板卡进行复位操作,以使得所述第二板卡进行复位启动。
由以上可见,上述各个实施例提供的方案中,智能设备中的多个板卡协同确定智能设备中的某一个板卡是否出现***故障,当确定该板卡出现***故障时,由智能设备中一个未出现***故障的板卡对上述出现故障的板卡进行故障恢复。可见应用上述各个实施例提供的方案进行故障恢复时,无需维修人员手动操作,简化了对板卡进行***故障恢复时的操作,进而提高了故障恢复效率。
本申请实施例还提供了一种电子设备,该电子设备为智能设备中的第一板卡,如图7所示,包括:处理器701、通信接口702、存储器703和通信总线704,其中,处理器701,通信接口702,存储器703通过通信总线704完成相互间的通信,
存储器703,用于存放计算机程序;
处理器701,用于执行存储器703上所存放的程序时,实现本申请实施例提供的***故障恢复方法。
具体的,上述***故障恢复方法,包括:
确定第二板卡出现***故障后,广播所述第二板卡出现***故障的故障信息,其中,所述第二板卡为:所述智能设备中除所述第一板卡外的一个板卡;
在接收到所述智能设备中除所述第一板卡外的其他板卡广播的所述第二板卡出现***故障的故障信息的情况下,判断自身是否能够用于对所述第二板卡进行***故障恢复;
若为是,对所述第二板卡进行***故障恢复。
上述***故障恢复方法的其他实施例与前述方法部分提及的实施例相同,这里不再赘述。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Ne twork Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Applica tion SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
由以上可见,本实施例提供的方案中,智能设备中的多个板卡协同确定智能设备中的某一个板卡是否出现***故障,当确定该板卡出现***故障时,由智能设备中一个未出现***故障的板卡对上述出现故障的板卡进行故障恢复。可见应用本实施例提供的方案进行故障恢复时,无需维修人员手动操作,简化了对板卡进行***故障恢复时的操作,进而提高了故障恢复效率。
本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质为智能设备中第一板卡的可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现本申请实施例提供的***故障恢复方法。
具体的,上述***故障恢复方法,包括:
确定第二板卡出现***故障后,广播所述第二板卡出现***故障的故障信息,其中,所述第二板卡为:所述智能设备中除所述第一板卡外的一个板卡;
在接收到所述智能设备中除所述第一板卡外的其他板卡广播的所述第二板卡出现***故障的故障信息的情况下,判断自身是否能够用于对所述第二板卡进行***故障恢复;
若为是,对所述第二板卡进行***故障恢复。
上述***故障恢复方法的其他实施例与前述方法部分提及的实施例相同,这里不再赘述。
由以上可见,本实施例提供的方案中,执行计算机可读存储介质中存储的计算机程序后,智能设备中的多个板卡协同确定智能设备中的某一个板卡是否出现***故障,当确定该板卡出现***故障时,由智能设备中一个未出现***故障的板卡对上述出现故障的板卡进行故障恢复。可见应用本实施例提供的方案进行故障恢复时,无需维修人员手动操作,简化了对板卡进行***故障恢复时的操作,进而提高了故障恢复效率。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备、计算机可读存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本申请的较佳实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本申请的保护范围内。

Claims (10)

1.一种***故障恢复方法,其特征在于,应用于智能设备中的第一板卡,所述方法包括:
确定第二板卡出现***故障后,广播所述第二板卡出现***故障的故障信息,其中,所述第二板卡为:所述智能设备中除所述第一板卡外的一个板卡;
在接收到所述智能设备中除所述第一板卡外的其他板卡广播的所述第二板卡出现***故障的故障信息的情况下,判断自身是否能够用于对所述第二板卡进行***故障恢复;
若为是,对所述第二板卡进行***故障恢复。
2.根据权利要求1所述的方法,其特征在于,通过以下方式确定所述第二板卡出现***故障:
从所述智能设备的总线中确定目标总线;
通过各个目标总线向第二板卡发送故障探测消息;
监测是否均未通过各个目标总线接收到来自所述第二板卡的故障探测响应;
若为是,确定所述第二板卡出现***故障;
所述广播所述第二板卡出现***故障的故障信息的步骤,包括:
通过各个目标总线广播所述第二板卡出现***故障的故障信息。
3.根据权利要求1或2所述的方法,其特征在于,所述判断自身是否能够用于对所述第二板卡进行***故障恢复的步骤,包括:
广播自身的自荐信息,并监听其他板卡广播的自荐信息;
在监听到其他板卡广播的自荐信息时,根据自身的自荐信息和接收的自荐信息,判断自身是否能够用于对所述第二板卡进行***故障恢复;
在未监听到其他板卡广播的自荐信息时,确定自能能够用于对所述第二板卡进行***故障恢复。
4.根据权利要求3所述的方法,其特征在于,在所述广播自身的自荐信息的步骤之前,还包括:
获得自身硬件状态信息,并判断自身硬件状态信息是否满足第一自荐条件;
若满足所述第一自荐条件,获得自身业务场景;
判断自身业务场景是否满足第二自荐条件;
若满足所述第二自荐条件,执行所述广播自身的自荐信息的步骤。
5.根据权利要求1所述的方法,其特征在于,在所述对所述第二板卡进行***故障恢复的步骤之前,还包括:
发送***故障恢复提示信息;
获得用户针对所述***故障恢复提示信息的响应信息;
在所述响应信息表明用户同意进行***故障恢复的情况下,执行所述对所述第二板卡进行***故障恢复的步骤。
6.根据权利要求1所述的方法,其特征在于,所述对所述第二板卡进行***故障恢复的步骤,包括:
关闭所述第二板卡的电源;
通过板卡间连接的I/O管脚控制所述第二板卡上的***进入故障恢复模式,以使得所述第二板卡进行***故障恢复;
接收所述第二板卡在***故障恢复完成后发送的***故障恢复完成通知;
根据所述***故障恢复完成通知确定所述第二板卡是否完成***故障恢复;
若为是,关闭所述第二板卡的电源,并重新开启所述第二板卡的电源,以使得所述第二板卡进行***重启。
7.根据权利要求1所述的方法,其特征在于,所述对所述第二板卡进行***故障恢复的步骤,包括:
通过设置硬件I/O状态,将所述第二板卡的启动设备切换至所述第二板卡的备份设备;
对所述第二板卡进行复位操作,以使得:所述第二板卡复位启动并在读取硬件I/O状态后将启动设备切换至所述备份设备,将所述备份设备中用于进行***故障恢复的文件恢复至所述第二板卡的主设备上;
接收所述第二板卡在***故障恢复完成后发送的***故障恢复完成通知;
根据所述***故障恢复完成通知确定所述第二板卡是否完成***故障恢复;
若为是,清除硬件I/O状态;
向所述第二板卡发送复位通知,以使得所述第二板卡进行复位启动。
8.根据权利要求1所述的方法,其特征在于,所述对所述第二板卡进行***故障恢复的步骤,包括:
通过设置硬件I/O状态,切换所述第二板卡的启动模式为预设升级模式;
对所述第二板卡进行复位操作,以使得:所述第二板卡复位启动并在读取硬件I/O状态后进入所述预设升级模式;
按照所述预设升级模式,对所述第二板卡进行升级;
确定完成对所述第二板卡的升级后,清除硬件I/O状态;
向所述第二板卡发送复位通知,以使得所述第二板卡进行复位启动。
9.根据权利要求1所述的方法,其特征在于,所述对所述第二板卡进行***故障恢复的步骤,包括:
通过运行预设闪存烧写程序对所述第二板卡进行升级;
确定完成对所述第二板卡的升级后,对所述第二板卡进行复位操作,以使得所述第二板卡进行复位启动。
10.一种***故障恢复装置,其特征在于,应用于智能设备中的第一板卡,所述装置包括:
信息广播模块,用于确定第二板卡出现***故障后,广播所述第二板卡出现***故障的故障信息,其中,所述第二板卡为:所述智能设备中除所述第一板卡外的一个板卡;
恢复判断模块,用于在接收到所述智能设备中除所述第一板卡外的其他板卡广播的所述第二板卡出现***故障的故障信息的情况下,判断自身是否能够用于对所述第二板卡进行***故障恢复,若为是,触发故障恢复模块;
所述故障恢复模块,用于对所述第二板卡进行***故障恢复。
CN201710417137.0A 2017-06-06 2017-06-06 一种***故障恢复方法及装置 Active CN108958989B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710417137.0A CN108958989B (zh) 2017-06-06 2017-06-06 一种***故障恢复方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710417137.0A CN108958989B (zh) 2017-06-06 2017-06-06 一种***故障恢复方法及装置

Publications (2)

Publication Number Publication Date
CN108958989A true CN108958989A (zh) 2018-12-07
CN108958989B CN108958989B (zh) 2021-09-17

Family

ID=64495057

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710417137.0A Active CN108958989B (zh) 2017-06-06 2017-06-06 一种***故障恢复方法及装置

Country Status (1)

Country Link
CN (1) CN108958989B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111538613A (zh) * 2020-04-28 2020-08-14 浙江大华技术股份有限公司 一种集群***异常恢复处理方法及装置
CN114185603A (zh) * 2021-11-08 2022-03-15 深圳云天励飞技术股份有限公司 一种智能加速卡的控制方法、服务器及智能加速卡

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6128555A (en) * 1997-05-29 2000-10-03 Trw Inc. In situ method and system for autonomous fault detection, isolation and recovery
CN101135984A (zh) * 2007-01-08 2008-03-05 中兴通讯股份有限公司 硬件信息备份装置、运行信息备份及检测信息保存方法
CN102968352A (zh) * 2012-12-14 2013-03-13 杨晓松 进程监控及多级恢复***和方法
US20130166981A1 (en) * 2011-12-22 2013-06-27 Somansa Co., Ltd. Apparatus and security system for data loss prevention, and operating method of data loss prevention apparatus
CN103618618A (zh) * 2013-11-13 2014-03-05 福建星网锐捷网络有限公司 基于分布式pcie***的线卡故障恢复方法及相关设备
CN104102572A (zh) * 2013-04-01 2014-10-15 中兴通讯股份有限公司 一种***故障检测及处理方法、装置
CN104635718A (zh) * 2013-11-12 2015-05-20 沈阳新松机器人自动化股份有限公司 一种机器人故障修复***及方法
CN105005395A (zh) * 2015-07-18 2015-10-28 成都生辉电子科技有限公司 一种智能设备备用按键设置方法
CN105071968A (zh) * 2015-08-18 2015-11-18 大唐移动通信设备有限公司 一种通信设备的业务面和控制面的隐性故障修复方法和装置
CN105550056A (zh) * 2015-12-11 2016-05-04 中国航空工业集团公司西安航空计算技术研究所 一种基于***重构的故障自愈***及其实现方法
CN106375114A (zh) * 2016-08-26 2017-02-01 迈普通信技术股份有限公司 一种热插拔故障恢复方法及分布式设备
CN106370949A (zh) * 2016-08-31 2017-02-01 北京术锐技术有限公司 一种手术机器人不完全运行状态故障检测方法
CN106789306A (zh) * 2016-12-30 2017-05-31 深圳市风云实业有限公司 通信设备软件故障检测收集恢复方法和***

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6128555A (en) * 1997-05-29 2000-10-03 Trw Inc. In situ method and system for autonomous fault detection, isolation and recovery
CN101135984A (zh) * 2007-01-08 2008-03-05 中兴通讯股份有限公司 硬件信息备份装置、运行信息备份及检测信息保存方法
US20130166981A1 (en) * 2011-12-22 2013-06-27 Somansa Co., Ltd. Apparatus and security system for data loss prevention, and operating method of data loss prevention apparatus
CN102968352A (zh) * 2012-12-14 2013-03-13 杨晓松 进程监控及多级恢复***和方法
CN104102572A (zh) * 2013-04-01 2014-10-15 中兴通讯股份有限公司 一种***故障检测及处理方法、装置
CN104635718A (zh) * 2013-11-12 2015-05-20 沈阳新松机器人自动化股份有限公司 一种机器人故障修复***及方法
CN103618618A (zh) * 2013-11-13 2014-03-05 福建星网锐捷网络有限公司 基于分布式pcie***的线卡故障恢复方法及相关设备
CN105005395A (zh) * 2015-07-18 2015-10-28 成都生辉电子科技有限公司 一种智能设备备用按键设置方法
CN105071968A (zh) * 2015-08-18 2015-11-18 大唐移动通信设备有限公司 一种通信设备的业务面和控制面的隐性故障修复方法和装置
CN105550056A (zh) * 2015-12-11 2016-05-04 中国航空工业集团公司西安航空计算技术研究所 一种基于***重构的故障自愈***及其实现方法
CN106375114A (zh) * 2016-08-26 2017-02-01 迈普通信技术股份有限公司 一种热插拔故障恢复方法及分布式设备
CN106370949A (zh) * 2016-08-31 2017-02-01 北京术锐技术有限公司 一种手术机器人不完全运行状态故障检测方法
CN106789306A (zh) * 2016-12-30 2017-05-31 深圳市风云实业有限公司 通信设备软件故障检测收集恢复方法和***

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111538613A (zh) * 2020-04-28 2020-08-14 浙江大华技术股份有限公司 一种集群***异常恢复处理方法及装置
CN111538613B (zh) * 2020-04-28 2023-06-13 浙江大华技术股份有限公司 一种集群***异常恢复处理方法及装置
CN114185603A (zh) * 2021-11-08 2022-03-15 深圳云天励飞技术股份有限公司 一种智能加速卡的控制方法、服务器及智能加速卡
CN114185603B (zh) * 2021-11-08 2024-01-05 深圳云天励飞技术股份有限公司 一种智能加速卡的控制方法、服务器及智能加速卡

Also Published As

Publication number Publication date
CN108958989B (zh) 2021-09-17

Similar Documents

Publication Publication Date Title
CN113014634B (zh) 集群选举处理方法、装置、设备及存储介质
CN109743358A (zh) 异步消息接口熔断控制方法、装置、计算机设备及存储介质
CN103838648A (zh) 一种终端及数据备份方法
CN105446827A (zh) 一种数据库故障时的数据存储方法和设备
CN112269694A (zh) 一种管理节点确定方法、装置、电子设备及可读存储介质
CN104270339A (zh) 一种tcp连接断线重连方法、设备及***
CN112291082B (zh) 机房容灾处理方法、终端及存储介质
CN108958989A (zh) 一种***故障恢复方法及装置
CN108959139A (zh) 一种cpld管脚复用方法与装置
CN103823727B (zh) 一种直播录制的备份方法和装置
CN102902574B (zh) 一种多信息流节点的协同处理方法及装置
CN109462646A (zh) 一种异常响应的方法及设备
CN107526652B (zh) 一种数据同步方法及存储设备
CN113412480B (zh) 挂载处理方法、装置、电子设备及计算机可读取存储介质
CN114647531B (zh) 故障解决方法、故障解决***、电子设备及存储介质
CN111030871A (zh) 基于双机热备***的配置信息同步方法和装置
JP2011145861A (ja) 災害時自動切換えシステムとその処理方法
CN109740306A (zh) 基于混合方案对应用软件进行授权的方法及装置
CN109388544A (zh) 一种故障监测方法、装置及电子设备
CN113688111A (zh) 跨区域消息复制方法、***、电子设备及可读存储介质
CN111147400B (zh) 一种命令行配置同步的方法、装置及电子设备
CN108319679B (zh) 一种主键的生成方法及装置
CN114726711A (zh) 设备间协同处理业务的方法及***
CN109587409B (zh) 视频处理器自适应级联方法、装置及***
CN109634787B (zh) 分布式文件***监控器切换方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant