CN107517110A - 一种分布式***中单板配置自恢复方法及装置 - Google Patents

一种分布式***中单板配置自恢复方法及装置 Download PDF

Info

Publication number
CN107517110A
CN107517110A CN201610421458.3A CN201610421458A CN107517110A CN 107517110 A CN107517110 A CN 107517110A CN 201610421458 A CN201610421458 A CN 201610421458A CN 107517110 A CN107517110 A CN 107517110A
Authority
CN
China
Prior art keywords
veneer
master control
control borad
frame picture
current state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610421458.3A
Other languages
English (en)
Other versions
CN107517110B (zh
Inventor
程寒杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN201610421458.3A priority Critical patent/CN107517110B/zh
Priority to PCT/CN2017/086396 priority patent/WO2017215441A1/zh
Publication of CN107517110A publication Critical patent/CN107517110A/zh
Application granted granted Critical
Publication of CN107517110B publication Critical patent/CN107517110B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0659Management of faults, events, alarms or notifications using network fault recovery by isolating or reconfiguring faulty entities
    • H04L41/0661Management of faults, events, alarms or notifications using network fault recovery by isolating or reconfiguring faulty entities by reconfiguring faulty entities

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明公开了一种分布式***中单板配置自恢复方法及装置,涉及通信技术领域,所述方法包括:主控板将各单板的配置信息发送至相应单板,并对所述相应单板的配置信息进行缓存;主控板根据单板的在前状态和当前状态,确定所述单板在前是否发生过故障;若确定所述单板在前发生过故障,则将在前缓存的配置信息发送至所述单板,以供所述单板恢复单板业务。通过准确检测单板故障,实现将在前缓存的单板配置信息发送至相应单板,保证单板业务恢复正常。

Description

一种分布式***中单板配置自恢复方法及装置
技术领域
本发明涉及通信技术领域,特别涉及一种分布式***中单板配置自恢复方法及装置。
背景技术
通信***中的分组传送网(Packet Transport Network,PTN)设备通常为分布式***,***中包含主控板、背板和若干单板。单板包括虚拟单板和物理单板,其中:虚拟单板不占用物理槽位,其代理进程运行在主控中央处理器(Central Processing Unit,CPU);物理单板则通过背板与主控板相连接,物理单板上独立运行相关程序。具体应用时,统一由主控板管理平面和控制平面程序发送配置报文分别对各个单板进行参数配置、业务配置。
单板可能会被拔插到其他槽位乃至其他设备使用,单板通常也不会保存配置主控板原有的配置信息,因此单板掉电后原先由主控板发送的配置信息会丢失。在单板因各种软硬件原因发生复位、或应用程序重启,导致单板配置丢失时,主控板必须要检测到这种故障,进而重新下发单板原有的各种配置信息,从而保证单板业务能够恢复正常。
通过分析发现,目前通信设备主要通过以下两类方式来检测单板运行状态:
(1)在背板上设计专门的硬件电路来检测单板运行状态;
(2)使用握手机制,即通过主控上的维护程序定时向单板发送握手报文,如果单板程序在预先设定的时间或者周期内没有返回应答报文,则判断单板发生故障。
上述两类方法中,主控板在感知单板已因各种软硬件原因发生复位或者应用程序已经发生重启等方面存在如下不足:
硬件电路存在的问题如下:
(1)需要占用额外的硬件资源;
(2)专用硬件电路缺乏灵活性,当单板上某个应用进程异常发生重启时,固化的硬件电路有可能检测不到重启,而此时单板的配置信息已经丢失,导致业务无法恢复正常。
通过主控程序定时向单板发送握手报文存在的问题如下:
(1)双方握手报文的交互需要占用CPU资源,在定时器设置的间隔很短且单板数量众多的情况下,会占用过多的***资源;
(2)握手机制通常需要超时判断条件,即需要等待若干周期后后方可判断单板出现故障,从而避免因为报文短时间内存在阻塞而导致误判的问题。如果单板故障在超时判定时间之内恢复正常,该机制将无法检测到单板应用程序重启、复位等故障,从而导致单板配置丢失,业务无法恢复正常。
发明内容
根据本发明实施例提供的技术方案解决的技术问题是当单板因软硬件故障复位或应用进程重启等导致单板配置丢失时,实现单板配置信息的自恢复。
根据本发明实施例提供的一种分布式***中单板配置自恢复方法,包括:
主控板将各单板的配置信息发送至相应单板,并对所述相应单板的配置信息进行缓存;
主控板根据单板的在前状态信息和当前状态信息,确定所述单板在前是否发生过故障;
若确定所述单板在前发生过故障,则将在前缓存的配置信息发送至所述单板,以供所述单板恢复单板业务。
优选地,在所述主控板根据单板的在前状态信息和当前状态信息,确定所述单板在前是否发生过故障的步骤之前,还包括:
所述主控板接收来自单板的机架图报文,并通过解析所述机架图报文,得到所述单板的当前状态信息;
获取在前通过解析所述单板的上一机架图报文而得到并保存的在前状态信息。
优选地,所述主控板根据单板的在前状态信息和当前状态信息,确定所述单板在前是否发生过故障的步骤包括:
所述主控板根据所述当前状态信息中的单板类型,确定单板类型是否发生改变;
若单板类型未发生改变,则比较所述当前状态信息中的机架图序列号与在前状态信息中的机架图序列号;
若所述当前状态信息中的机架图序列号小于所述在前状态信息中的机架图序列号,且所述当前状态信息中的机架图序列号不等于零,则确定所述单板在前发生过故障。
优选地,在所述主控板根据单板的在前状态信息和当前状态信息,确定所述单板在前是否发生过故障的步骤之后,利用所述当前状态信息中的机架图序列号,更新所述主控板保存的所述在前状态信息中的机架图序列号。
优选地,还包括:若单板类型发生改变,则所述主控板不向所述单板发送在前缓存的配置信息。
根据本发明实施例提供的存储介质,其存储用于实现上述分布式***中单板配置自恢复方法的程序。
根据本发明实施例提供的一种分布式***中单板配置自恢复装置,包括:
主控板报文转发模块,用于将各单板的配置信息发送至相应单板,并对所述相应单板的配置信息进行缓存;
主控板控制模块,用于根据单板的在前状态信息和当前状态信息,确定所述单板在前是否发生过故障;
其中,若所述主控板控制模块确定所述单板在前发生过故障,则所述主控板报文转发模块将在前缓存的配置信息发送至所述单板,以供所述单板恢复单板业务。
优选地,所述主控板控制模块还用于对收到的来自单板的机架图报文进行解析,得到所述单板的当前状态信息,获取在前通过解析所述单板的上一机架图报文而得到并保存的在前状态信息。
优选地,所述主控板控制模块根据所述当前状态信息中的单板类型,确定单板类型是否发生改变,若单板类型未发生改变,则比较所述当前状态信息中的机架图序列号与在前状态信息中的机架图序列号,若所述当前状态信息中的机架图序列号小于所述在前状态信息中的机架图序列号,且所述当前状态信息中的机架图序列号不等于零,则确定所述单板在前发生过故障。
优选地,所述主控板控制模块根据单板的在前状态信息和当前状态信息,确定所述单板在前是否发生过故障之后,利用所述当前状态信息中的机架图序列号,更新所述主控板保存的所述在前状态信息中的机架图序列号。
优选地,所述主控板控制模块在单板类型发生改变时,不向所述单板发送在前缓存的配置信息。
本发明实施例提供的技术方案具有如下有益效果:
主控板能够准确检测出单板配置丢失问题,进而将预先缓存的配置信息重新下发到单板,从而实现单板上已经丢失的各种配置信息的自恢复,保证单板业务恢复正常。
附图说明
图1是本发明实施例提供的分布式***中单板配置自恢复方法框图;
图2是本发明实施例提供的分布式***中单板配置自恢复装置框图;
图3是本发明实施例提供的分布式***的***架构图;
图4是本发明实施例提供的主控板程序判断单板在位状态的状态机示意图;
图5是本发明实施例提供的主控板报文转发模块的工作流程图;
图6是本发明实施例提供的单板S口配置报文自恢复的过程示意图。
具体实施方式
以下结合附图对本发明的优选实施例进行详细说明,应当理解,以下所说明的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
图1是本发明实施例提供的分布式***中单板配置自恢复方法框图,如图1所示,步骤包括:
步骤S101:主控板将各单板的配置信息发送至相应单板,并对所述相应单板的配置信息进行缓存。
所述单板的配置信息包括参数配置信息和业务配置信息。
步骤S102:主控板根据单板的在前状态信息和当前状态信息,确定所述单板在前是否发生过故障。
所述主控板接收来自单板的机架图报文,并通过解析所述机架图报文,得到所述单板的当前状态信息,获取在前通过解析所述单板的上一机架图报文而得到并保存的在前状态信息。所述主控板根据所述当前状态信息中的单板类型,确定单板类型是否发生改变,若单板类型发生改变,则不向所述单板发送在前缓存的配置信息,若单板类型未发生改变,则通过比较所述单板的当前状态信息与在前状态信息,确定所述单板在前是否发生过故障,具体地说,若某一单板的当前状态信息中的机架图序列号小于在前状态信息中的机架图序列号,且所述当前状态信息中的机架图序列号不等于零,则说明该单板在位状态异常,此时确定所述单板在前发生过故障。在确定单板在前是否发生过故障之后,利用所述当前状态信息,更新所述主控板保存的所述在前状态信息,例如使用当前状态信息中的机架图序列号替换主控板所保存的在前状态信息中的机架图序列号,从而使主控板能够保存最新的状态信息。
步骤S103:若确定所述单板在前发生过故障,则将在前缓存的配置信息发送至所述单板,以供所述单板恢复单板业务。
背板上具有多个插槽,每个插槽中***的单板是预先已设定的,且主控板保存每个插槽及其对应的单板类型信息,以及相应单板的配置信息。当主控板从插在某个插槽的单板收到机架图报文时,通过解析该机架图报文,得到单板类型与机架图序列号。主控板将单板类型与其保存的该插槽对应的单板类型匹配,若不一致说明***该插槽的单板发生变化,即单板类型发生改变,此时主控板不向该单板发送配置信息,直至***该插槽的单板恢复为设定的单板,主控板确定***该插槽的单板从单板类型不一致的状态转换为运行正常状态,向该设定的单板发送在前缓存的配置信息。将单板类型与其保存的该插槽对应的单板类型匹配,若一致说明***该插槽的单板未发生变化,即单板类型未发生改变,此后利用该机架图序列号与在前状态信息中的机架图序列号,确定所述单板在前是否发生过故障。例如,假设插槽1中应***单板1,主控板保存单板1的配置信息。主控板周期性接收***插槽1中的单板1的机架图报文,并保存最新的机架图序列号。1、当主控板根据当前收到的机架图报文中的单板类型,确定插槽1中***的为单板2时,确定单板类型不一致,此时不向单板2发送配置报文。直至主控板根据后续收到的机架图报文中的单板类型,确定插槽1中重新***单板1时,向单板1发送在前缓存的单板1的配置信息。2、当主控板根据当前收到的机架图报文中的单板类型,确定插槽1中***的为单板1时,确定单板类型一致,此时主控板将当前收到的机架图报文中的机架图序列号与其保存的最新的机架图序列号进行比较,并根据比较结果,确定单板1在前是否发生过故障,若在前发生过故障,则向单板1发送在前缓存的单板1的配置信息。
本发明实施例可以使用软件方式准确地检测出单板整体复位、单板应用程序重启等导致单板配置报文(即配置信息)丢失的运行故障,并将预先缓存的配置信息下发到存在过运行故障的单板。即本发明实施例实现了分布式***中单板故障检测及配置信息自恢复。
本发明实施例的主控板检测到单板故障后,可以将事先保存的单板配置信息重新下发给单板,保证业务能够恢复正常。具有以下优点:
1、不依赖专门的硬件电路即可检测出单板运行故障,能够降低成本,提高灵活度和准确度;
2、解决了常见的握手机制可能导致的CPU消耗及故障漏检测问题;
3、保证单板因故障丢失的配置信息可以自动恢复。
本领域普通技术人员可以理解,实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于计算机可读取存储介质中,该程序在执行时,包括步骤S101至步骤S103。其中,所述的存储介质可以为ROM/RAM、磁碟、光盘等。
图2是本发明实施例提供的分布式***中单板配置自恢复装置框图,如图2所示,包括主控板控制模块10和主控板报文转发模块20。
主控板报文转发模块20,用于将各单板的配置信息发送至相应单板,并对所述相应单板的配置信息进行缓存。
主控板控制模块10,用于根据单板的在前状态信息和当前状态信息,确定所述单板在前是否发生过故障。具体地说,主控板控制模块10通过对收到的来自单板的机架图报文进行解析,得到所述单板的当前状态信息,获取在前通过解析所述单板的上一机架图报文而得到并保存的在前状态信息。主控板控制模块10根据所述当前状态信息中的单板类型,确定单板类型是否发生改变,若单板类型发生改变,则不向所述单板发送在前缓存的配置信息,若单板类型未发生改变,则通过比较所述单板的当前状态信息与在前状态信息,确定所述单板在前是否发生过故障,进一步说,若当前状态信息中的机架图序列号小于所述在前状态信息中的机架图序列号,且所述当前状态信息中的机架图序列号不等于零,则确定所述单板在前发生过故障,然后利用所述当前状态信息中的机架图序列号,更新所述主控板保存的所述在前状态信息中的机架图序列号。
其中,若所述主控板控制模块10确定所述单板在前发生过故障,则所述主控板报文转发模块20将在前缓存的配置信息发送至所述单板,以供所述单板恢复单板业务。
图3是本发明实施例提供的分布式***的***架构图,如图3所示,***中包含主控板、背板和若干单板(例如单板A、单板B和单本C)。其中,主控板与单板之间通过背板连接,主控板的控制平面和管理平面程序通过其报文转发模块(相当于图2中的主控板报文转发模块20)向相应的单板发送配置报文,从而对各个单板进行参数配置、业务配置。单板在主控板的配置下,运行相关的单板应用程序。
本发明采用以下技术方案:
主控板的控制程序(实现图2中主控板控制模块10的功能)通过报文转发模块将配置报文通过S口发送到指定单板。转发模块(即报文转发模块)需要以单板地址为关键字缓存发送到单板的参数配置、业务配置报文,并能够对命令码相同的配置报文进行合并处理。
报文转发模块是运行在主控上的进程或任务,当单板运行状态信息(即状态信息)发生变化时,报文转发模块提供接口用于将缓存的指定单板的配置报文重新发送到单板。
其中,单板运行状态信息用于指示单板运行状态,包括运行正常、运行异常、单板类型不一致三种状态。单板运行状态由运行异常转换为运行正常,或者由单板类型不一致转换为运行正常时,需要通知报文转发模块重新下发单板配置报文。
图4是本发明实施例提供的主控板程序判断单板在位状态的状态机示意图,如图4所示,主控板将单板的初始状态确定为运行正常,然后等待单板新上报的机架图S口报文(即机架图报文),解析该报文得到单板类型和机架图序列号。判断单板类型是否变化,若单板类型变化,则说明单板运行状态为单板类型不一致,并等待新上报的机架图S口报文,否则判断机架图序列号是否增大;若机架图序列号增大,则说明单板运行状态为运行正常,并等待新上报的机架图S口报文,否则判断是否机架图序列号变小且不为0;若机架图序列号变小且不为0,则说明单板运行状态为运行异常,并等待新上报的机架图S口报文,否则说明机架图序列号变小且为0,此时说明单板运行状态为运行正常,并等待新上报的机架图S口报文。
也就是说,单板应用程序启用定时器定时向主控板发送机架图S口报文。主控板的控制程序接收到单板机架图报文后,解析出单板类型、机架图序列号信息并与上一次保存的值进行比较。如果单板类型发生变化,则判定单板在位状态为单板类型不一致;如果当前值(即当前的机架图序列号)大于之前的值,则判定单板在位状态正常;如果当前值小于上一次保存的值,且取值为溢出值0,则判定单板在位状态正常。如果当前值小于上一次保存的值,且不等于溢出值0,则判定单板在位状态异常。每次完成上述判定之后,将主控板保存的单板机架图索引号(即机架图序列号)更新为单板最新上报的值。
通过上述判定,如果主控板检测到单板在位状态(即运行状态)发生变化,且当前值为在位状态正常,可以认为单板程序发生过异常重启,单板配置信息已经丢失,需要立即通知报文转发模块重新下发单板配置报文,从而确保单板运行需要的配置信息能够自恢复。
S口报文是一种通信报文,用于在主控板内、单板内、主控板和单板间的各个进程之间进行消息交互。
本发明实施例能够解决单板整体复位、单板应用程序重启等原因导致单板配置报文丢失的问题。
下面结合典型实施例对主控板控制程序如何检测单板运行状态并重新发送单板配置报文的详细过程进行描述。
图5是本发明实施例提供的主控板的报文转发模块的工作流程图,如图5所示,步骤包括:
步骤S201:报文转发模块等待主控板的控制程序配置报文。
步骤S202:报文转发模块收到S口配置报文(即配置报文)。
步骤S203:报文转发模块将该S口配置报文发送到指定单板。
步骤S204:判断是否是注册过的报文,若是则执行步骤S205,否则执行步骤S201。
在初始化阶段可以指定关于某些单板、命令码、操作符的配置报文为注册过的报文,例如指定单板A的配置报文均为注册过的报文,那么在步骤S204中,如果该配置报文是发送给单板A的,则该报文为注册过的报文。
步骤S205:是否是修改操作,若是,执行步骤S206,否则执行步骤S207。
步骤S206:将S口配置报文进行合并处理。
例如将某一配置参数的参数值由2000修改为1000时,将所述S口配置报文与在前保存的S口配置报文合并,使得新的S口配置报文中的参数值为1000。
步骤S207:将S口配置报文进行缓存。
也就是说,主控板报文转发模块的处理为:主控板上专门设计一个报文转发模块,该模块是主控板控制程序与各个单板程序进行S口报文交互的中间枢纽。报文转发模块可以转发S口配置报文,同时还提供接口用于对指定单板、指定命令码、指定操作符的配置报文进行注册,只有注册过的报文才会进行缓存。针对操作符为修改操作的报文,提供报文合并功能,即将配置信息更新为最新值。主控板控制程序将单板配置信息发送到报文转发模块后,报文转发模块首先将S口报文转发到单板,之后根据S口报文中的命令码和操作符判断该配置报文是否注册过。如果注册过,且操作符为修改,则进行合并、缓存处理;如果注册过,且操作符为添加,则直接进行缓存处理;如果没有注册,则直接跳过。此外,报文转发模块还需要提供接口,用于将指定单板已经缓存的S口配置报文全部重新下发到单板。
图6是本发明实施例提供的单板S口配置报文自恢复的过程示意图,如图6所示,步骤包括:
步骤S301:主控板控制程序等待单板的机架图报文。
步骤S302:接收并解析机架图报文。
步骤S303:判断是否是第一次收到该单板的机架图报文,若是执行步骤S304,否则执行步骤S305。
以该单板的单板地址为关键字查询单板软件表项,若未查询到该单板的单板软件表项,则说明是第一次收到该单板的机架图报文。
步骤S304:创建该单板的单板软件表项。
步骤S305:判断单板类型是否发生变化,若是执行步骤S301,否则执行步骤S306。
步骤S306:判断当前机架图序列号是否小于之前的值,若是执行步骤S307,否则执行步骤S301。
步骤S307:判断当前机架图序列号是否为溢出值0,若是执行步骤S301,否则执行步骤S308。
步骤S308:通知主控板的报文转发模块重新下发该单板的S口配置报文。
也就是说,主控板的控制程序的处理为:当主控板的控制程序第一次收到某个单板上报的机架图报文时,需要创建以单板地址为关键字的软件表项,用于对单板信息进行记录。表项中的单板类型初始值即为该单板首次上报机架图时所携带的值,单板在线运行状态信息初始化为运行正常,机架图序列号初始化为1。当主控板控制程序再次收到某个单板机架图报文后,以单板地址为关键字查询上述表项。如果查询失败,表示该单板对应的表项尚未创建,按照上述方式创建相应的单板软件表项;如果查询成功,表示单板软件表项已经创建成功,需要将当前单板信息与之前保存的表项信息进行比较,比较过程描述如下。如果当前单板类型与之前保存的单板类型不相同,则可以判断单板运行状态为单板类型不一致;如果当前序列号取值大于之保存的值,则判定单板在位状态正常;如果当前序列号取值小于上一次保存的值,则判定单板在位状态异常。在本实施例中序列号的取值可以保证运行设备运行上百年不会溢出,因此,不需要考虑序列号溢出的情况。完成上述比较之后,即可捕捉单板运行状态变化情况。之后,还需要更新主控板保存的单板机架图序列号更新为最近一次上报的值。经过上述判断后,主控板的控制程序可以知道单板运行状态的变化情况。如果判断结果是:单板在位状态发生变化,且当前值为在位状态正常,则可以认为单板程序发生过异常重启,单板配置信息已经丢失,需要立即通知报文转发模块重新下发单板配置报文,从而确保单板运行需要的配置信息能够自恢复。
单板应用程序的处理为:单板上电后,单板应用程序启用定时器(例如5s定时器),定时向主控板发送机架图S口报文,其中S口报文头部中包含了主控板地址信息、单板地址信息、报文序列号等信息,单板地址作为单板的关键字使用。本实施例中,报文索引号为32位无符号数,根据应用的需要也可以设置为16位、32位或者64位数据。序列号初始化为1,从1开始计数,之后每上报一次就进行一次加1操作。
综上所述,本发明的实施例具有以下技术效果:
本发明实施例的主控板可以通过准确地检测出单板运行故障,进而重新将事先缓存的单板配置信息发送到相应单板,保证单板业务可以恢复正常,即主控板可以缓存指定单板配置信息,其在准确地检测出单板复位、单板应用程序重启等导致单板配置报文丢失的故障时,重新下发单板配置信息,保证单板业务可以恢复正常。
尽管上文对本发明进行了详细说明,但是本发明不限于此,本技术领域技术人员可以根据本发明的原理进行各种修改。因此,凡按照本发明原理所作的修改,都应当理解为落入本发明的保护范围。

Claims (10)

1.一种分布式***中单板配置自恢复方法,包括:
主控板将各单板的配置信息发送至相应单板,并对所述相应单板的配置信息进行缓存;
主控板根据单板的在前状态信息和当前状态信息,确定所述单板在前是否发生过故障;
若确定所述单板在前发生过故障,则将在前缓存的配置信息发送至所述单板,以供所述单板恢复单板业务。
2.根据权利要求1所述的方法,在所述主控板根据单板的在前状态信息和当前状态信息,确定所述单板在前是否发生过故障的步骤之前,还包括:
所述主控板接收来自单板的机架图报文,并通过解析所述机架图报文,得到所述单板的当前状态信息;
获取在前通过解析所述单板的上一机架图报文而得到并保存的在前状态信息。
3.根据权利要求1或2所述的方法,所述主控板根据单板的在前状态信息和当前状态信息,确定所述单板在前是否发生过故障的步骤包括:
所述主控板根据所述当前状态信息中的单板类型,确定单板类型是否发生改变;
若单板类型未发生改变,则比较所述当前状态信息中的机架图序列号与在前状态信息中的机架图序列号;
若所述当前状态信息中的机架图序列号小于所述在前状态信息中的机架图序列号,且所述当前状态信息中的机架图序列号不等于零,则确定所述单板在前发生过故障。
4.根据权利要求3所述的方法,在所述主控板根据单板的在前状态信息和当前状态信息,确定所述单板在前是否发生过故障的步骤之后,利用所述当前状态信息中的机架图序列号,更新所述主控板保存的所述在前状态信息中的机架图序列号。
5.根据权利要求3所述的方法,还包括:
若单板类型发生改变,则所述主控板不向所述单板发送在前缓存的配置信息。
6.一种分布式***中单板配置自恢复装置,包括:
主控板报文转发模块,用于将各单板的配置信息发送至相应单板,并对所述相应单板的配置信息进行缓存;
主控板控制模块,用于根据单板的在前状态信息和当前状态信息,确定所述单板在前是否发生过故障;
其中,若所述主控板控制模块确定所述单板在前发生过故障,则所述主控板报文转发模块将在前缓存的配置信息发送至所述单板,以供所述单板恢复单板业务。
7.根据权利要求6所述的装置,所述主控板控制模块还用于对收到的来自单板的机架图报文进行解析,得到所述单板的当前状态信息,获取在前通过解析所述单板的上一机架图报文而得到并保存的在前状态信息。
8.根据权利要求6或7所述的装置,所述主控板控制模块根据所述当前状态信息中的单板类型,确定单板类型是否发生改变,若单板类型未发生改变,则比较所述当前状态信息中的机架图序列号与在前状态信息中的机架图序列号,若所述当前状态信息中的机架图序列号小于所述在前状态信息中的机架图序列号,且所述当前状态信息中的机架图序列号不等于零,则确定所述单板在前发生过故障。
9.根据权利要求8所述的装置,所述主控板控制模块根据单板的在前状态信息和当前状态信息,确定所述单板在前是否发生过故障之后,利用所述当前状态信息中的机架图序列号,更新所述主控板保存的所述在前状态信息中的机架图序列号。
10.根据权利要求8所述的装置,所述主控板控制模块在单板类型发生改变时,不向所述单板发送在前缓存的配置信息。
CN201610421458.3A 2016-06-15 2016-06-15 一种分布式***中单板配置自恢复方法及装置 Active CN107517110B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201610421458.3A CN107517110B (zh) 2016-06-15 2016-06-15 一种分布式***中单板配置自恢复方法及装置
PCT/CN2017/086396 WO2017215441A1 (zh) 2016-06-15 2017-05-27 一种分布式***中单板配置自恢复方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610421458.3A CN107517110B (zh) 2016-06-15 2016-06-15 一种分布式***中单板配置自恢复方法及装置

Publications (2)

Publication Number Publication Date
CN107517110A true CN107517110A (zh) 2017-12-26
CN107517110B CN107517110B (zh) 2022-07-12

Family

ID=60662968

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610421458.3A Active CN107517110B (zh) 2016-06-15 2016-06-15 一种分布式***中单板配置自恢复方法及装置

Country Status (2)

Country Link
CN (1) CN107517110B (zh)
WO (1) WO2017215441A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109062839A (zh) * 2018-07-18 2018-12-21 郑州云海信息技术有限公司 一种检测hba卡的方法、装置和计算机可读存储介质
CN109462502A (zh) * 2018-10-30 2019-03-12 新华三技术有限公司合肥分公司 配置信息保存指令的控制方法、装置及sdn控制器
CN109639509A (zh) * 2019-01-21 2019-04-16 新华三技术有限公司合肥分公司 一种网络设备配置方法及装置
CN110177372A (zh) * 2019-04-16 2019-08-27 武汉虹信通信技术有限责任公司 基站版权许可验证方法及装置
CN110519098A (zh) * 2019-08-30 2019-11-29 新华三信息安全技术有限公司 一种异常单板的处理方法及装置
CN111432085A (zh) * 2020-03-13 2020-07-17 深圳震有科技股份有限公司 一种控制用户账号注册的方法、存储介质、语音网关

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113206698B (zh) * 2021-03-22 2022-08-16 深圳震有科技股份有限公司 一种卫星媒体资源冗余保护方法、智能终端及存储介质
CN113824631B (zh) * 2021-09-10 2023-04-07 烽火通信科技股份有限公司 报文转发方法、装置、通信设备及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080100975A1 (en) * 2006-10-31 2008-05-01 No-Gil Myoung Distribution automation system
CN101324877A (zh) * 2007-06-14 2008-12-17 国际商业机器公司 通过处理器构造连接的处理器卡的多节点配置的***和制造方法
CN101621396A (zh) * 2008-07-01 2010-01-06 中兴通讯股份有限公司 单板自动管理装置及方法
CN102355368A (zh) * 2011-10-08 2012-02-15 大连环宇移动科技有限公司 一种网络设备的故障处理方法及***
CN103618618A (zh) * 2013-11-13 2014-03-05 福建星网锐捷网络有限公司 基于分布式pcie***的线卡故障恢复方法及相关设备
CN104618136A (zh) * 2014-12-25 2015-05-13 曙光信息产业(北京)有限公司 用于刀片服务器的配置管理方法和装置
CN105357023A (zh) * 2014-08-22 2016-02-24 中兴通讯股份有限公司 一种机架图展示方法和装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100421381C (zh) * 2004-08-30 2008-09-24 华为技术有限公司 一种获取网络设备运行和故障状态信息的方法及装置
CN101883013B (zh) * 2010-07-09 2014-07-02 中兴通讯股份有限公司 可选模式单板自动配置方法和***

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080100975A1 (en) * 2006-10-31 2008-05-01 No-Gil Myoung Distribution automation system
CN101324877A (zh) * 2007-06-14 2008-12-17 国际商业机器公司 通过处理器构造连接的处理器卡的多节点配置的***和制造方法
CN101621396A (zh) * 2008-07-01 2010-01-06 中兴通讯股份有限公司 单板自动管理装置及方法
CN102355368A (zh) * 2011-10-08 2012-02-15 大连环宇移动科技有限公司 一种网络设备的故障处理方法及***
CN103618618A (zh) * 2013-11-13 2014-03-05 福建星网锐捷网络有限公司 基于分布式pcie***的线卡故障恢复方法及相关设备
CN105357023A (zh) * 2014-08-22 2016-02-24 中兴通讯股份有限公司 一种机架图展示方法和装置
CN104618136A (zh) * 2014-12-25 2015-05-13 曙光信息产业(北京)有限公司 用于刀片服务器的配置管理方法和装置

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109062839A (zh) * 2018-07-18 2018-12-21 郑州云海信息技术有限公司 一种检测hba卡的方法、装置和计算机可读存储介质
CN109462502A (zh) * 2018-10-30 2019-03-12 新华三技术有限公司合肥分公司 配置信息保存指令的控制方法、装置及sdn控制器
CN109639509A (zh) * 2019-01-21 2019-04-16 新华三技术有限公司合肥分公司 一种网络设备配置方法及装置
CN109639509B (zh) * 2019-01-21 2021-12-07 新华三技术有限公司合肥分公司 一种网络设备配置方法及装置
CN110177372A (zh) * 2019-04-16 2019-08-27 武汉虹信通信技术有限责任公司 基站版权许可验证方法及装置
CN110177372B (zh) * 2019-04-16 2021-12-14 中信科移动通信技术股份有限公司 基站版权许可验证方法及装置
CN110519098A (zh) * 2019-08-30 2019-11-29 新华三信息安全技术有限公司 一种异常单板的处理方法及装置
CN110519098B (zh) * 2019-08-30 2022-06-21 新华三信息安全技术有限公司 一种异常单板的处理方法及装置
CN111432085A (zh) * 2020-03-13 2020-07-17 深圳震有科技股份有限公司 一种控制用户账号注册的方法、存储介质、语音网关

Also Published As

Publication number Publication date
WO2017215441A1 (zh) 2017-12-21
CN107517110B (zh) 2022-07-12

Similar Documents

Publication Publication Date Title
CN107517110A (zh) 一种分布式***中单板配置自恢复方法及装置
US11068266B2 (en) Handling an input/output store instruction
CN110807064B (zh) Rac分布式数据库集群***中的数据恢复装置
CN106506490B (zh) 一种分布式计算控制方法以及分布式计算***
CN109714239B (zh) 一种管理消息的下发方法、vnfm设备和服务器
CN106331065B (zh) 一种用于具有服务容器的主机***的代理应用以及***
US20100023667A1 (en) High availability system and execution state control method
CN110795395B (zh) 文件部署***和文件部署方法
CN102983990A (zh) 虚拟机的管理方法和装置
WO2013019339A1 (en) Hardware failure mitigation
EP2723017A1 (en) Method, apparatus and system for implementing distributed auto-incrementing counting
CN111478796B (zh) 一种ai平台的集群扩容异常处理方法
CN106095483A (zh) 服务的自动化部署方法及装置
CN106354566A (zh) 一种命令处理的方法以及服务器
CN107623581B (zh) 服务列表生成方法、装置及***,获取、上报方法及装置
CN108509296B (zh) 一种处理设备故障的方法和***
CN110083653B (zh) 一种订单数据的操作方法、装置、计算机设备和存储介质
CN112069032A (zh) 一种虚拟机的可用性检测方法、***及相关装置
US7607051B2 (en) Device and method for program correction by kernel-level hardware monitoring and correlating hardware trouble to a user program correction
CN100550844C (zh) 还原重定向报文特征信息的方法
CN109669814A (zh) 一种元数据服务的恢复方法、装置、设备及可读存储介质
JPH0591108A (ja) メツセージ通信制御方法および通信システム
CN111831490A (zh) 一种冗余主备用节点之间内存同步方法及***
US7770054B2 (en) Apparatus, system, and method to prevent queue stalling
KR100237395B1 (ko) 폴트의 수집 및 관리방법

Legal Events

Date Code Title Description
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant