CN105703950A - 一种控制平面异常导致设备脱管的容错方法 - Google Patents

一种控制平面异常导致设备脱管的容错方法 Download PDF

Info

Publication number
CN105703950A
CN105703950A CN201610051450.2A CN201610051450A CN105703950A CN 105703950 A CN105703950 A CN 105703950A CN 201610051450 A CN201610051450 A CN 201610051450A CN 105703950 A CN105703950 A CN 105703950A
Authority
CN
China
Prior art keywords
management
configuration
network element
business
safe mode
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610051450.2A
Other languages
English (en)
Other versions
CN105703950B (zh
Inventor
丁毅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fiberhome Telecommunication Technologies Co Ltd
Original Assignee
Fiberhome Telecommunication Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fiberhome Telecommunication Technologies Co Ltd filed Critical Fiberhome Telecommunication Technologies Co Ltd
Priority to CN201610051450.2A priority Critical patent/CN105703950B/zh
Publication of CN105703950A publication Critical patent/CN105703950A/zh
Application granted granted Critical
Publication of CN105703950B publication Critical patent/CN105703950B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种控制平面异常导致设备脱管的容错方法,包括以下步骤:在网元设备内部添加接入管理通信网络的管理安全模式;解耦管理配置与业务配置;当管理安全模式的触发条件构成,网元设备进入管理安全模式,忽略业务配置启动,仅加载管理配置,使***恢复所在网元设备的管理通信网络通信能力。本发明通过引入管理安全模式的概念和定义触发管理安全模式的条件进入管理安全模式,将控制与管理合一的***中的管理配置与业务配置分离,使***在出现故障后能恢复所在网元的管理配置以及管理通信网络网元通信能力,避免网元脱管,最大程度减少网元脱管后下站维护的成本。

Description

一种控制平面异常导致设备脱管的容错方法
技术领域
本发明涉及管理通信网络,具体涉及一种控制平面异常导致设备脱管的容错方法。
背景技术
管理通信网络采用独立的逻辑通路实现运营商对设备的远程管理;设备作为网元在管理通信网络中需要与相邻网元进行通信,通过路由逐跳发布与网管服务器实现远程互通;
常规网元设备实现管理网络通信功能,可以通过独立的协议实例或进程实现独立的管理平面;这种情况下如果发生控制平面失效,由于管理平面独立,因此可以不受控制平面失效影响,减小脱管风险;但在常规网元设备实现管理网络通信功能时,由于控制平面与管理平面有较多信息需要共享和交互,所以部分功能的实现复杂度较高;同时随着通信网络向减少代码维护、统一协议栈及平台等趋势发展,管理平面在技术发展过程中逐步与控制平面融合已成为趋势;在融合情况下,当控制平面出现问题导致***重启无法恢复时,就将影响管理平面,导致其远程管理的网元持续脱管,从而不得不下站进行维护,增加运维成本。
发明内容
本发明所要解决的技术问题是在管理平面与控制平面融合的情况下,控制平面失效导致管理平面远程管理的网元持续脱管无法恢复的问题。
为了解决上述技术问题,本发明所采用的技术方案是提供一种控制平面异常导致设备脱管的容错方法,包括以下步骤:
在网元设备内部添加接入管理通信网络的管理安全模式;
解耦管理配置与业务配置;
当管理安全模式的触发条件构成,网元设备进入管理安全模式,忽略业务配置启动,仅加载管理配置,使***恢复所在网元设备的管理通信网络通信能力。
在上述方法中,所述管理安全模式的触发条件包括但不限于:
控制平面因为软件异常导致重启,且重启次数超过门限次数;
控制平面启动后,业务配置校验失败。
在上述方法中,网元设备进入管理安全模式后,业务配置不与业务单盘进行配置校核。
在上述方法中,所述网元设备的***正常启动,业务配置与管理配置按序分别进行加载。
本发明通过引入管理安全模式的概念和定义触发管理安全模式的条件进入管理安全模式,将控制与管理合一的***中的管理配置与业务配置分离,使***在出现故障后,仅加载管理配置,在不影响现有业务配置情况下,恢复所在网元的管理配置以及管理通信网络网元通信能力,避免网元脱管,最大程度减少网元脱管后下站维护的成本,同时由于***空配置启动后仅加载管理配置文件,还极大降低因业务配置错误触发的各种导致控制平面重启的问题。
附图说明
图1为本发明提供的一种控制平面异常导致设备脱管的容错方法的流程图;
图2为本发明中非管理安全模式下业务配置与管理配置顺序加载过程示意图;
图3为本发明中管理安全模式下业务配置与管理配置顺序加载过程示意图;
图4为常规配置校核过程示意图;
图5为本发明在嵌入式实施环境下的工作流程图。
具体实施方式
下面结合说明书附图和具体实施例对本发明做出详细的说明。
本发明提供的一种控制平面异常导致设备脱管的容错方法,如图1所示,包括以下步骤:
第一步、在网元设备内部添加接入管理通信网络的管理安全模式。
由于各运营商有各自的管理通信网络协议标准,本发明不对所需支持的协议标准进行具体说明,在网元设备内部抽象出的管理安全模式能恢复所在网元的管理通信网络配置和管理通信网络网元通信能力。
第二步、将控制与管理公共平面的配置数据解耦为管理配置与业务配置;通常情况下,网元设备的业务配置与管理配置有部分依赖关系,例如管理配置依赖缺省的MCC接口加入VPN,如果要通过不执行业务配置,仅执行管理配置来达到恢复管理通信网络互通能力的要求,必须从设计上满足管理配置与业务配置解耦的要求。
彻底解耦后的业务配置与管理配置,在正常***启动时(非管理安全模式)分别进行顺序加载,完成业务配置与管理配置的分别恢复(如图2所示);
第三步、当管理安全模式的触发条件构成,网元设备进入管理安全模式,忽略业务配置启动,仅加载管理配置,将其***恢复到管理配置重启前的状态,之后在各业务实体按管理网络对应配置恢复工作后,实现所在网元设备的管理网络通信能力恢复(如图3所示);本发明由于仅加载管理配置文件,极大降低因业务配置错误触发的各种导致控制平面重启的问题(包括触发的业务告警上报后的处理错误、错误配置异常、内存不足等)。
管理安全模式的触发条件包括不限于:
(1)控制平面因为软件异常导致重启,且重启次数超过门限次数;在实际应用中,外界触发的控制平面软件缺陷可能导致控制平面***异常重启,如果重启后***不能正常恢复,而出现持续的重启,将会导致下游网元设备脱管,因此可以设置重启次数超过门限次数为进入管理安全模式触发条件;
(2)控制平面启动后,业务配置校验失败;由于网元设备接入管理通信网络,都具备特定的管理通信网络的管理配置,这些配置必须依赖基本的***业务配置,如果出现业务配置与预期管理配置不一致的情况,则可能导致网管脱管,因此如果识别出发生了业务配置校验不一致的情况,则需进入管理安全模式。
在本发明中,由于网元设备进入管理安全模式后,仅加载了管理配置,其***缺乏完整的业务配置,为避免对业务的影响,此时不能与业务单盘进行常规配置校核,常规配置校核过程如图4所示。
如图5所示,在嵌入式实施环境下,本发明提供的一种控制平面异常导致设备脱管的容错方法的具体工作流程如下:
步骤S101、***启动;
步骤S102、判断是否满足进入管理安全模式的触发条件,如果满足,执行步骤S104;否则执行步骤S103;
步骤S103、分别加载业务配置和管理配置,然后执行步骤S107;
步骤S104、设备***进入管理安全模式,且仅加载管理配置;
步骤S105、判断当前是否已进入管理安全模式,如果是,执行步骤S107,否则执行步骤S106;
步骤S106、配置恢复完成后按需要与单盘进行配置校核;
步骤S107、结束程序。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (4)

1.一种控制平面异常导致设备脱管的容错方法,其特征在于,包括以下步骤:
在网元设备内部添加接入管理通信网络的管理安全模式;
解耦管理配置与业务配置;
当管理安全模式的触发条件构成,网元设备进入管理安全模式,忽略业务配置启动,仅加载管理配置,使***恢复所在网元设备的管理通信网络通信能力。
2.如权利要求1所述的方法,其特征在于,所述管理安全模式的触发条件包括但不限于:
控制平面因为软件异常导致重启,且重启次数超过门限次数;
控制平面启动后,业务配置校验失败。
3.如权利要求1所述的方法,其特征在于,网元设备进入管理安全模式后,业务配置不与业务单盘进行配置校核。
4.如权利要求1所述的方法,其特征在于,所述网元设备的***正常启动,业务配置与管理配置按序分别进行加载。
CN201610051450.2A 2016-01-26 2016-01-26 一种控制平面异常导致设备脱管的容错方法 Active CN105703950B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610051450.2A CN105703950B (zh) 2016-01-26 2016-01-26 一种控制平面异常导致设备脱管的容错方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610051450.2A CN105703950B (zh) 2016-01-26 2016-01-26 一种控制平面异常导致设备脱管的容错方法

Publications (2)

Publication Number Publication Date
CN105703950A true CN105703950A (zh) 2016-06-22
CN105703950B CN105703950B (zh) 2020-04-21

Family

ID=56228609

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610051450.2A Active CN105703950B (zh) 2016-01-26 2016-01-26 一种控制平面异常导致设备脱管的容错方法

Country Status (1)

Country Link
CN (1) CN105703950B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090168710A1 (en) * 2007-11-15 2009-07-02 Thakare Kiran Logical protocol architecture for wireless metropolitan area networks
CN102255799A (zh) * 2011-06-23 2011-11-23 中国人民解放军国防科学技术大学 一种支持转发和控制分离的内部网络接口映射方法及装置
CN104270341A (zh) * 2014-09-03 2015-01-07 烽火通信科技股份有限公司 在ipran中的数据协议转发***及方法
US8990365B1 (en) * 2004-09-27 2015-03-24 Alcatel Lucent Processing management packets
CN204291012U (zh) * 2014-12-19 2015-04-22 深圳市邦彦信息技术有限公司 一种业务数据和管理数据分离的MicroTCA 平台
CN204859198U (zh) * 2015-08-13 2015-12-09 国网智能电网研究院 一种olt设备管理***

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8990365B1 (en) * 2004-09-27 2015-03-24 Alcatel Lucent Processing management packets
US20090168710A1 (en) * 2007-11-15 2009-07-02 Thakare Kiran Logical protocol architecture for wireless metropolitan area networks
US8050219B2 (en) * 2007-11-15 2011-11-01 Telefonaktiebolaget Lm Ericsson (Publ) Logical protocol architecture for wireless metropolitan area networks
CN102255799A (zh) * 2011-06-23 2011-11-23 中国人民解放军国防科学技术大学 一种支持转发和控制分离的内部网络接口映射方法及装置
CN104270341A (zh) * 2014-09-03 2015-01-07 烽火通信科技股份有限公司 在ipran中的数据协议转发***及方法
CN204291012U (zh) * 2014-12-19 2015-04-22 深圳市邦彦信息技术有限公司 一种业务数据和管理数据分离的MicroTCA 平台
CN204859198U (zh) * 2015-08-13 2015-12-09 国网智能电网研究院 一种olt设备管理***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
福建星网锐捷网络有限公司: "交换机数据平面、控制平面、管理平面分离设计——网络设备稳定的重要技术***", 《道客巴巴》 *

Also Published As

Publication number Publication date
CN105703950B (zh) 2020-04-21

Similar Documents

Publication Publication Date Title
CN107608706B (zh) 一种基于功能模块的应用程序自动热更新方法
CN100518082C (zh) 一种具有自恢复功能的远程在线升级方法
CN102238093B (zh) 防止业务中断的方法和装置
US20080183862A1 (en) Network communication management system including network with improved safety and reliability
TWI740158B (zh) 伺服器系統、集中式快閃記憶體模組以及更新快閃韌體映像檔的方法
CN105303103A (zh) 保护移动终端中的服务进程的方法和移动终端
CN106095474A (zh) 用于更新运输工具中的软件的方法和装置
KR20130037977A (ko) 로봇 컴포넌트 관리 장치 및 방법
CN106909382B (zh) 输出不同类型***启动信息的方法及装置
CN111090537B (zh) 集群启动方法、装置、电子设备及可读存储介质
CN105703950A (zh) 一种控制平面异常导致设备脱管的容错方法
CN105027083A (zh) 使用诊断结果的恢复程序
Cisco Operational Traps
Cisco Operational Traps
Cisco Operational Traps
Cisco Operational Traps
Cisco Operational Traps
Cisco Operational Traps
Cisco Operational Traps
Cisco Operational Traps
Cisco Operational Traps
Cisco Operational Traps
Cisco Operational Traps
Cisco Operational Traps
Cisco Operational Traps

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant