CN111654435B - 一种基于lacp的链路保护故障处理***及方法 - Google Patents

一种基于lacp的链路保护故障处理***及方法 Download PDF

Info

Publication number
CN111654435B
CN111654435B CN202010489393.2A CN202010489393A CN111654435B CN 111654435 B CN111654435 B CN 111654435B CN 202010489393 A CN202010489393 A CN 202010489393A CN 111654435 B CN111654435 B CN 111654435B
Authority
CN
China
Prior art keywords
link
fault
lacp
module
port
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010489393.2A
Other languages
English (en)
Other versions
CN111654435A (zh
Inventor
刘凯
赵羚钧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CETC Avionics Co Ltd
Original Assignee
CETC Avionics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CETC Avionics Co Ltd filed Critical CETC Avionics Co Ltd
Priority to CN202010489393.2A priority Critical patent/CN111654435B/zh
Publication of CN111654435A publication Critical patent/CN111654435A/zh
Application granted granted Critical
Publication of CN111654435B publication Critical patent/CN111654435B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/28Routing or path finding of packets in data switching networks using route fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/12Shortest path evaluation
    • H04L45/123Evaluation of link metrics
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/14Routing performance; Theoretical aspects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/22Alternate routing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/70Routing based on monitoring results
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/24Multipath
    • H04L45/245Link aggregation, e.g. trunking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/06Notations for structuring of protocol data, e.g. abstract syntax notation one [ASN.1]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Small-Scale Networks (AREA)
  • Maintenance And Management Of Digital Transmission (AREA)

Abstract

本发明公开了一种基于LACP的链路保护故障处理***及方法,本***包括LACP模块、端口管理模块、链路故障检测模块,链路故障检测模块与LACP模块运行于同一设备上;链路故障检测模块,用于周期性查看各个端口异常报文统计信息、端口链路link状态,实时检测是否存在链路故障;当检测到故障后,对自身异常链路对应的端口进行处理,并触发向对端发送包含故障信息的协议报文,发送故障信息的端口选择当前优先级最高的非异常链路进行发送;对端接收到信息后,根据故障信息采取启用备用链路或主动剔除故障链路处理。本发明通过主动实时故障检测与处理,保证在链路上的业务报文稳定传输,实现高可靠性和稳定性,尤其适合应用于航空领域。

Description

一种基于LACP的链路保护故障处理***及方法
技术领域
本发明涉及航空通信技术领域,尤其涉及一种基于LACP的链路保护故障处理***及方法。
背景技术
随着通信和网络技术的发展,用户对网络带宽的需求日益增长,使得对单链路带宽的需求也逐步升高,在此需求下,链路聚合为单链路带宽提升提供了一个廉价的手段,链路聚合技术是将多个物理端口聚合成一个虚拟端口,从而实现增加链路带宽的方法,基于IEEE 802.3ad的LACP(Link Aggregation Control Protocol,即链路聚合控制协议)协议是用于实现动态链路聚合和解聚合的协议。
根据LACP协议中的定义,协议报文LACPDU(Link Aggregation Control ProtocolData Unit,即链路聚合控制协议单元)是在端口直接进行传输,其中主动发送的端口称为本端(theActor),接收报文的端口称为对端(the Actor’s protocol Partner),本端和对端通过LACPDU将信息发送到对方,本端和对端两方的设备可以对所有端口所接收到的LACPDU报文进行识别,判断哪些端口是可以组成一个聚合,通过这种方式实现动态链路聚合。
在LACP协议中定义了链路聚合的最大链路数量,如果一个聚合中的链路超过这个数量,那么优先级最低的链路就会作为备份链路,在工作链路出现异常时可以替代异常链路,从而起到链路保护的作用。而端口是否在一个聚合中是依赖于接收到的LACPDU中的信息的,如果接收到的LACPDU信息不发生改变且端口link状态不发生改变的情况下,端口对接收的LACPDU信息是否有效是依赖老化时间进行判断的,即如果在一定时间内(短超时为3秒,长超时为90秒)内不能收到LACPDU才认为对端异常,从而将该条链路从聚合中删除,这种机制是一种被动机制,对于一些链路故障是无法进行处理的,比如链路中的数据报文出现概率性的CRC校验错误包、超长包、超短包以及因为链路不稳定引起的概率性丢包都是无法解决的,当上述场景出现时,不但在该条链路上的业务报文无法保证稳定传输,甚至该条链路还可能反复加入和离开聚合,影响整个聚合的工作,这在一些需要高可靠性的应用领域(如航空领域)会产生很大的影响。
发明内容
本发明所要解决的技术问题是航空领域中现有的链路保护故障处理***、方法大多采用被动机制,即如果在一定时间内不能收到LACPDU报文才认为对端异常,从而将该条链路从聚合中删除,这种被动机制对于一些链路故障是无法进行处理的,比如链路中的数据报文出现概率性的CRC校验错误包、超长包、超短包以及因为链路不稳定引起的概率性丢包都是无法解决的,当上述场景出现时,不但在该条链路上的业务报文无法保证稳定传输,甚至该条链路还可能反复加入和离开聚合,影响整个聚合的工作,这在一些需要高可靠性的应用领域(如航空领域)会产生很大的影响。
本发明提供了解决上述问题的一种基于LACP的链路保护故障处理***及方法,该***增加了运行链路故障检测模块,在运行LACP协议的设备上运行链路故障检测模块,链路故障检测模块能够通过查看端口异常报文统计信息、端口链路link状态等方式,实时的检测是否存在链路故障;当检测到故障后,通过子类型字段是reserve字段的慢速协议报文(即以太类型为0x8809)将故障信息通过优先级最高的稳定链路发送到对端,对端接收到信息后,根据故障信息采取启用备用链路或主动剔除故障链路等处理手段。
本发明通过下述技术方案实现:
一种基于LACP的链路保护故障处理***,包括LACP模块、端口管理模块,所述LACP模块与端口管理模块之间双向通信连接;
还包括链路故障检测模块,所述链路故障检测模块与端口管理模块之间双向通信连接,链路故障检测模块与LACP模块单向通信连接,所述链路故障检测模块与所述LACP模块运行于同一设备上;
所述链路故障检测模块,用于周期性查看各个端口异常报文统计信息、端口链路link状态(即端口链路物理状态)等方式,实时检测是否存在链路故障;当检测到故障后,对自身异常链路对应的端口进行处理,并触发向对端发送包含故障信息的协议报文,本端的处理方式和对端接收到异常信息报文后的处理方式一致,本端发送故障信息的端口选择当前优先级最高的非异常链路进行发送;对端接收到信息后,根据故障信息采取启用备用链路或主动剔除故障链路处理。
进一步地,所述包含故障信息的协议报文,协议报文为慢速协议报文;
所述包含故障信息的协议报文包括目的MAC字段、源MAC字段、以太类型字段、子类型字段、和若干故障信息TLV字段;一个报文,通过多个故障信息TLV字段来实现多个故障信息的传输;其中:
所述故障信息TLV字段包括故障类型Type、TLV长度Length和故障信息内容Value。
进一步地,所述包含故障信息的协议报文中,目的MAC字段为01:80:c2:00:00:02,源MAC字段为设备自身MAC,以太类型字段为0x8809,子类型字段(subtype)使用reserve数值0xf;
每个故障信息TLV字段包含一个故障的全部信息,其中,故障类型Type包括CRC校验错误报文、超长包、超短包。
另一方面,本发明还提供了一种基于LACP的链路保护故障处理方法,包括以下步骤:
S1:在运行LACP协议的设备上,运行链路故障检测模块;
S2:链路故障检测模块周期性的查看各个端口的异常报文统计信息、端口链路link状态(即端口链路物理状态)等方式,实时检测是否存在链路故障;
S3:当存在链路异常,立刻对自身异常链路对应的端口进行处理,并触发向对端发送包含故障信息的协议报文,本端的处理方式和对端接收到异常信息报文后的处理方式一致,发送故障信息的端口选择当前优先级最高的非异常链路进行发送;
S4:对端接收到故障信息协议报文,进行异常端口处理;通过LACP协议所定义的相关参数,间接影响动态聚合中的链路;处理后通过最高优先级端口发送回复报文;
S5:异常链路的两端在完成故障信息处理后,进行告警以提示有链路出现故障,并由运维人员排除故障后再手动恢复链路。
进一步地,步骤S3中,链路异常包括:
针对异常报文进行统计,当异常报文数量或比例超过预定值,则认为链路出现异常;异常报文统计信息包括CRC校验错误报文、超长包、超短包;
针对端口链路link状态,当出现链路震荡现象,则认为链路异常。
进一步地,步骤S4中对端接收到故障信息协议报文,进行异常端口处理;其中,进行异常端口处理是不会对LACP协议的运行进行直接干涉,而是通过LACP协议所定义的相关参数,间接的影响动态聚合中的链路,具体步骤如下:
当存在备份链路时,直接设置异常链路对应端口的优先级字段为最低优先级,引起LACP协议启动备份链路替代当前链路,异常链路则转变为备份链路,不再转发业务数据,从而保证链路聚合能够正常的进行工作;
当不存在备份链路时,首先会设置异常链路对应端口的优先级字段为最低优先级,同时链路对应聚合的最大链路数量大于1时,将聚合所支持的最大链路数量设置为当前最大链路数量减1,即如果当前链路总数为4,如果其中一条链路异常,则设置最大链路数量为3,通过这种方式,降低了链路聚合的总带宽,但是保证当前工作的链路都是可靠的。
进一步地,步骤S3中包含故障信息的协议报文,协议报文为慢速协议报文;
所述包含故障信息的协议报文包括目的MAC字段、源MAC字段、以太类型字段、子类型字段、和若干故障信息TLV字段;一个报文,通过多个故障信息TLV字段来实现多个故障信息的传输;其中:
所述故障信息TLV字段包括故障类型Type、TLV长度Length和故障信息内容Value。
进一步地,所述包含故障信息的协议报文中,目的MAC字段为01:80:c2:00:00:02,源MAC字段为设备自身MAC,以太类型字段为0x8809,子类型字段(subtype)使用reserve数值0xf。
本发明与现有技术相比,具有如下的优点和有益效果:
1、本发明***增加了运行链路故障检测模块,在运行LACP协议的设备上运行链路故障检测模块,模块间的结构如附图1所示,链路故障检测模块能够通过查看端口异常报文统计信息、端口链路link状态等方式,实时的检测是否存在链路故障;当检测到故障后,通过子类型字段是reserve字段的慢速协议报文(即以太类型为0x8809)将故障信息通过优先级最高的稳定链路发送到对端,对端接收到信息后,根据故障信息采取启用备用链路或主动剔除故障链路等处理手段;
2、本发明方法对链路聚合中的异常链路进行动态检测,并自动实现异常链路的处理并能够对运维人员进行告警提示,保证异常链路修复之前聚合链路的正常运行;同时本发明方法是基于标准LACP协议的扩展,不对LACP协议本身进行修改,因此可以与其他只支持标准LACP协议的设备互通,不会影响链路聚合本身的正常工作;最后,链路故障检测模块中检测故障的方法可以进行无限制的扩展,这一特性使得本发明***及方法能够满足特殊的网络场景需求;
3、本发明***及方法,通过主动实时故障检测与处理,能够解决链路中的数据报文出现概率性的CRC校验错误包、超长包、超短包以及因为链路不稳定引起的概率性丢包的场景出现时,保证在该条链路上的业务报文稳定传输,实现高可靠性和稳定性,尤其适合应用于航空领域。
附图说明
此处所说明的附图用来提供对本发明实施例的进一步理解,构成本申请的一部分,并不构成对本发明实施例的限定。在附图中:
图1为本发明一种基于LACP的链路保护故障处理***中链路故障检测模块与LACP模块结构图。
图2为本发明包含故障信息的协议报文结构图。
图3为本发明方法中故障信息检测发送流程图。
图4为本发明方法中故障信息协议报文接收处理流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。
实施例1
如图1至图4所示,本发明一种基于LACP的链路保护故障处理***,包括LACP模块、端口管理模块,所述LACP模块与端口管理模块之间双向通信连接;
还包括链路故障检测模块,所述链路故障检测模块与端口管理模块之间双向通信连接,链路故障检测模块与LACP模块单向通信连接,所述链路故障检测模块与所述LACP模块运行于同一设备上;
所述链路故障检测模块,用于周期性查看各个端口异常报文统计信息、端口链路link状态(即端口链路物理状态)等方式,实时检测是否存在链路故障;当检测到故障后,对自身异常链路对应的端口进行处理,并触发向对端发送包含故障信息的协议报文,本端的处理方式和对端接收到异常信息报文后的处理方式一致,本端发送故障信息的端口选择当前优先级最高的非异常链路进行发送;对端接收到信息后,根据故障信息采取启用备用链路或主动剔除故障链路处理。
本端在检测到链路故障后,处理流程如图1所示,其每一步处理如下:
S1.1:链路故障发现,链路故障检测模块会周期性检测端口链路状态(检测方式根据芯片实际能力进行,本实施例不做具体要求),当检测到链路故障后,会开始链路保护故障处理。
S1.2:LACP模块控制,当链路故障检测到后,链路故障检测模块会通过配置LACP协议的参数,从而控制LACP协议中链路聚合组中的端口,主要通过配置端口的优先级以及聚合组中最大端口数量来实现控制,当需要使用备用链路时,通过降低故障链路优先级,提升备选链路的优先级即可触发LACP协议模块完成备用链路启用;当需要剔除链路时,通过降低故障链路优先级并减小最大链路数量,即可完成链路剔除。
S1.3:LACP协议处理,在经过S1.2步骤后,由于链路的优先级和聚合组最大链路数量发生了变化,因此LACP模块会运行LACP协议完成处理。
S1.4:信息发送,在处理完成后需要将故障信息通过协议报文通过优先级最高的端口发送到对端,使得对端也进行同步处理,保证两端的状态同步。
对端在接收到包含故障信息的协议报文后,处理流程也与本端一致,如图1所示,其每一步处理流程如下:
S1.1:故障信息接收,链路故障检测模块在接收到包含故障信息的协议报文后,就会开始链路保护故障处理。
S1.2:LACP模块控制,对端会根据协议报文中的故障信息,同步的对LACP模块进行配置,其配置方式如本端处理流程中的S1.2一致,都是通过配置端口的优先级以及聚合组中最大端口数量来实现控制,当需要使用备用链路时,通过降低故障链路优先级,提升备选链路的优先级即可触发LACP协议模块完成备用链路启用;当需要剔除链路时,通过降低故障链路优先级并减小最大链路数量,即可完成链路剔除。
S1.3:LACP协议处理,在经过S1.2步骤后,由于链路的优先级和聚合组最大链路数量发生了变化,因此LACP模块会运行LACP协议完成处理。
S1.4:信息回复,在处理完成后将包含处理完成的协议报文通过优先级最高的端口发送回本端。
具体地,所述包含故障信息的协议报文,协议报文为慢速协议报文;如图2所示:
所述包含故障信息的协议报文包括目的MAC字段、源MAC字段、以太类型字段、子类型字段、和若干故障信息TLV字段;一个报文,通过多个故障信息TLV字段来实现多个故障信息的传输;其中:
所述故障信息TLV字段包括故障类型Type、TLV长度Length和故障信息内容Value。
具体地,所述包含故障信息的协议报文中,目的MAC字段为01:80:c2:00:00:02,源MAC字段为设备自身MAC,以太类型字段为0x8809,子类型字段(subtype)使用reserve数值0xf;
每个故障信息TLV字段包含一个故障的全部信息,其中,故障类型Type包括CRC校验错误报文、超长包、超短包。
工作原理如下:
航空领域中现有的链路保护故障处理***、方法大多采用被动机制,即如果在一定时间内不能收到LACPDU报文才认为对端异常,从而将该条链路从聚合中删除,这种被动机制对于一些链路故障是无法进行处理的,比如链路中的数据报文出现概率性的CRC校验错误包、超长包、超短包以及因为链路不稳定引起的概率性丢包都是无法解决的,当上述场景出现时,不但在该条链路上的业务报文无法保证稳定传输,甚至该条链路还可能反复加入和离开聚合,影响整个聚合的工作,这在一些需要高可靠性的应用领域(如航空领域)会产生很大的影响。
因此,本发明***增加了运行链路故障检测模块,在运行LACP协议的设备上运行链路故障检测模块,模块间的结构如附图1所示,链路故障检测模块能够通过查看端口异常报文统计信息、端口链路link状态等方式,实时的检测是否存在链路故障;当检测到故障后,通过子类型字段是reserve字段的慢速协议报文(即以太类型为0x8809)将故障信息通过优先级最高的稳定链路发送到对端,对端接收到信息后,根据故障信息采取启用备用链路或主动剔除故障链路等处理手段。
本发明***通过主动实时故障检测与处理,能够解决链路中的数据报文出现概率性的CRC校验错误包、超长包、超短包以及因为链路不稳定引起的概率性丢包的场景出现时,保证在该条链路上的业务报文稳定传输,尤其适合应用于航空领域。
实施例2
如图2所示,本实施例与实施例1的区别在于,本实施例提供了一种基于LACP的链路保护故障处理方法,包括以下步骤:
S1:在运行LACP协议的设备上,运行链路故障检测模块;
S2:链路故障检测模块块周期性的查看各个端口的异常报文统计信息、端口链路link状态(即端口链路物理状态)等方式,实时检测是否存在链路故障;
S3:当存在链路异常,立刻对自身异常链路对应的端口进行处理,并触发向对端发送包含故障信息的协议报文,本端的处理方式和对端接收到异常信息报文后的处理方式一致,发送故障信息的端口选择当前优先级最高的非异常链路进行发送;
具体地,步骤S3中,链路异常包括:
针对异常报文进行统计,当异常报文数量或比例超过预定值,则认为链路出现异常;异常报文统计信息包括CRC校验错误报文、超长包、超短包;
针对端口链路link状态,当出现链路震荡现象,则认为链路异常。
具体地,步骤S3中包含故障信息的协议报文,协议报文为慢速协议报文;包含故障信息的协议报文如图2所示,所述包含故障信息的协议报文包括目的MAC字段、源MAC字段、以太类型字段、子类型字段、和若干故障信息TLV字段;一个报文,通过多个故障信息TLV字段来实现多个故障信息的传输;其中:所述故障信息TLV字段包括故障类型Type、TLV长度Length和故障信息内容Value。
本实施例中,所述包含故障信息的协议报文中,目的MAC字段为01:80:c2:00:00:02,源MAC字段为设备自身MAC,以太类型字段为0x8809,子类型字段(subtype)使用reserve数值0xf。
S4:对端接收到故障信息协议报文,进行异常端口处理;通过LACP协议所定义的相关参数,间接影响动态聚合中的链路;处理后通过最高优先级端口发送回复报文;
具体地,步骤S4中对端接收到故障信息协议报文,进行异常端口处理;其中,进行异常端口处理是不会对LACP协议的运行进行直接干涉,而是通过LACP协议所定义的相关参数,间接的影响动态聚合中的链路,具体步骤如下:
当存在备份链路时,直接设置异常链路对应端口的优先级字段为最低优先级,引起LACP协议启动备份链路替代当前链路,异常链路则转变为备份链路,不再转发业务数据,从而保证链路聚合能够正常的进行工作;
当不存在备份链路时,首先会设置异常链路对应端口的优先级字段为最低优先级,同时链路对应聚合的最大链路数量大于1时,将聚合所支持的最大链路数量设置为当前最大链路数量减1,即如果当前链路总数为4,如果其中一条链路异常,则设置最大链路数量为3,通过这种方式,降低了链路聚合的总带宽,但是保证当前工作的链路都是可靠的。
S5:接收到故障信息协议报文的端口在完成上述处理后,回复一个故障信息的协议报文,其TLV的type为异常已处理,以确保该异常传递的闭环,如果故障信息发送的一端在一定时间内没有收到该回复报文,则重传故障信息协议报文;
异常链路的两端在完成故障信息处理后,进行告警以提示有链路出现故障,异常链路不会自动的恢复运行,需要由运维人员排除故障后再手动恢复链路。
图3为故障信息检测发送流程图,如图3所示,故障信息检测发送流程为:链路故障检测模块根据检测异常报文统计、检测link状态异常来判断链路是否异常,若存在有链路异常,则处理故障链路对应端口;否则,返回开始检测异常报文统计、检测link状态异常。
处理故障链路对应端口,并组成故障信息协议报文,通过最高优先级链路发送报文,若链路故障检测模块在超时时间内收到回复,返回开始重新检测;若超时时间内没有收到回复,继续判断超时次数是否到上限,若是则返回开始重新检测,若否重新发送回复报文。
图4为故障信息协议报文接收处理流程图,如图4所示,链路故障检测模块根据接收到的故障信息协议报文,并解析报文获取故障信息,处理异常链路对应的端口,处理后通过最高优先级端口发送回复报文即可。
实施时:开启设备的LACP功能,配置端口使能动态链路聚合,并配置LACP协议相关的优先级、超时时间、链路聚合最大链路数量等参数;然后在该设备上同时运行链路故障检测模块,对支持动态链路聚合的端口进行检测;连接所需要链路聚合的端口,完成动态链路聚合。
采用上述方法,可以对链路聚合中的异常链路进行动态检测,并自动实现异常链路的处理并能够对运维人员进行告警提示,保证异常链路修复之前聚合链路的正常运行;同时本发明方法是基于标准LACP协议的扩展,不对LACP协议本身进行修改,因此可以与其他只支持标准LACP协议的设备互通,不会影响链路聚合本身的正常工作;最后,链路故障检测模块中检测故障的方法可以进行无限制的扩展,这一特性使得本发明***及方法能够满足特殊的网络场景需求。
本发明方法通过主动实时故障检测与处理,能够解决链路中的数据报文出现概率性的CRC校验错误包、超长包、超短包以及因为链路不稳定引起的概率性丢包的场景出现时,保证在该条链路上的业务报文稳定传输,实现高可靠性和稳定性,尤其适合应用于航空领域。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种基于LACP的链路保护故障处理***,其特征在于,该***包括本端和对端,所述本端包括本端LACP模块、本端链路故障检测模块、本端端口管理模块,所述本端LACP模块与本端端口管理模块之间双向通信连接;所述本端链路故障检测模块与本端端口管理模块之间双向通信连接,本端链路故障检测模块与本端LACP模块单向通信连接,所述本端链路故障检测模块与所述本端LACP模块运行于本端同一设备上;
所述对端包括对端LACP模块、对端链路故障检测模块、对端端口管理模块,所述对端LACP模块与对端端口管理模块之间双向通信连接;所述对端链路故障检测模块与对端端口管理模块之间双向通信连接,对端链路故障检测模块与对端LACP模块单向通信连接,所述对端链路故障检测模块与所述对端LACP模块运行于对端同一设备上;
所述本端链路故障检测模块,用于周期性检测端口链路状态,当检测到链路故障后,通过配置LACP协议的参数,从而控制LACP协议中链路聚合组中的端口;触发向所述对端发送包含故障信息的协议报文;
所述本端LACP模块,用于通过配置端口的优先级以及聚合组中最大端口数量来实现控制,当需要使用备用链路时,通过降低故障链路优先级,提升备用链路的优先级即可触发本端LACP模块完成备用链路启用;当需要剔除链路时,通过降低故障链路优先级并减小最大链路数量,即可完成链路剔除;及运行LACP协议完成处理;
所述对端链路故障检测模块,用于接收到所述包含故障信息的协议报文,根据协议报文中的故障信息,同步的对对端LACP模块进行配置,通过配置LACP协议的参数,从而控制LACP协议中链路聚合组中的端口;
所述对端LACP模块,用于通过配置端口的优先级以及聚合组中最大端口数量来实现控制,当需要使用备用链路时,通过降低故障链路优先级,提升备用链路的优先级即可触发对端LACP模块完成备用链路启用;当需要剔除链路时,通过降低故障链路优先级并减小最大链路数量,即可完成链路剔除;及运行LACP协议完成处理;
所述包含故障信息的协议报文,协议报文为慢速协议报文;
所述包含故障信息的协议报文包括子类型字段,子类型字段使用reserve数值0xf。
2.根据权利要求1所述的一种基于LACP的链路保护故障处理***,其特征在于,所述包含故障信息的协议报文还包括目的MAC字段、源MAC字段、以太类型字段和若干故障信息TLV字段;一个报文,通过多个故障信息TLV字段来实现多个故障信息的传输;其中:
所述故障信息TLV字段包括故障类型Type、TLV长度Length和故障信息内容Value。
3.根据权利要求1所述的一种基于LACP的链路保护故障处理***,其特征在于,所述包含故障信息的协议报文中,目的MAC字段为01:80:c2:00:00:02,源MAC字段为设备自身MAC,以太类型字段为0x8809;
每个故障信息TLV字段包含一个故障的全部信息,其中,故障类型Type包括CRC校验错误报文、超长包、超短包。
4.一种基于LACP的链路保护故障处理方法,其特征在于,该方法应用于如权利要求1至3中任一所述的一种基于LACP的链路保护故障处理***,该方法包括以下步骤:
本端在检测到链路故障后,处理流程如下:
S1.1:链路故障发现:本端链路故障检测模块周期性检测端口链路状态,当检测到链路故障后,开始链路保护故障处理;
S1.2:本端LACP模块控制,当链路故障检测到后,本端链路故障检测模块通过配置LACP协议的参数,从而控制LACP协议中链路聚合组中的端口,通过配置端口的优先级以及聚合组中最大端口数量来实现控制,当需要使用备用链路时,通过降低故障链路优先级,提升备用链路的优先级即可触发本端LACP模块完成备用链路启用;当需要剔除链路时,通过降低故障链路优先级并减小最大链路数量,即可完成链路剔除;
S1.3:LACP协议处理,在经过S1.2步骤后,链路的优先级和聚合组最大链路数量发生了变化,本端LACP模块运行LACP协议完成处理;
S1.4:信息发送,在处理完成后将故障信息通过协议报文通过优先级最高的端口发送到对端,使得对端也进行同步处理,保证两端的状态同步;
对端在接收到包含故障信息的协议报文后,处理流程如下:
S1.1:故障信息接收,对端链路故障检测模块在接收到包含故障信息的协议报文后,开始链路保护故障处理;
S1.2:对端LACP模块控制,对端根据协议报文中的故障信息,同步的对对端LACP模块进行配置,其配置方式如本端处理流程中的S1.2一致;
S1.3:LACP协议处理,在经过S1.2步骤后,链路的优先级和聚合组最大链路数量发生了变化,对端LACP模块运行LACP协议完成处理;
S1.4:信息回复,在处理完成后将包含处理完成的协议报文通过优先级最高的端口发送回本端。
5.根据权利要求4所述的一种基于LACP的链路保护故障处理方法,其特征在于,针对异常报文进行统计,当异常报文数量或比例超过预定值,则认为链路出现异常;异常报文统计信息包括CRC校验错误报文、超长包、超短包;
针对端口链路link状态,当出现链路震荡现象,则认为链路异常。
6.根据权利要求4所述的一种基于LACP的链路保护故障处理方法,其特征在于,当存在备用链路时,直接设置异常链路对应端口的优先级字段为最低优先级,引起LACP协议启动备用链路替代当前链路,异常链路则转变为备用链路,不再转发业务数据,从而保证链路聚合能够正常的进行工作;
当不存在备用链路时,首先会设置异常链路对应端口的优先级字段为最低优先级,同时链路对应聚合的最大链路数量大于1时,将聚合所支持的最大链路数量设置为当前最大链路数量减1。
7.根据权利要求4所述的一种基于LACP的链路保护故障处理方法,其特征在于,所述包含故障信息的协议报文还包括目的MAC字段、源MAC字段、以太类型字段和若干故障信息TLV字段;一个报文,通过多个故障信息TLV字段来实现多个故障信息的传输;其中:
所述故障信息TLV字段包括故障类型Type、TLV长度Length和故障信息内容Value。
8.根据权利要求7所述的一种基于LACP的链路保护故障处理方法,其特征在于,所述包含故障信息的协议报文中,目的MAC字段为01:80:c2:00:00:02,源MAC字段为设备自身MAC,以太类型字段为0x8809;
每个故障信息TLV字段包含一个故障的全部信息,其中,故障类型Type包括CRC校验错误报文、超长包、超短包。
CN202010489393.2A 2020-06-02 2020-06-02 一种基于lacp的链路保护故障处理***及方法 Active CN111654435B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010489393.2A CN111654435B (zh) 2020-06-02 2020-06-02 一种基于lacp的链路保护故障处理***及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010489393.2A CN111654435B (zh) 2020-06-02 2020-06-02 一种基于lacp的链路保护故障处理***及方法

Publications (2)

Publication Number Publication Date
CN111654435A CN111654435A (zh) 2020-09-11
CN111654435B true CN111654435B (zh) 2022-03-18

Family

ID=72351080

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010489393.2A Active CN111654435B (zh) 2020-06-02 2020-06-02 一种基于lacp的链路保护故障处理***及方法

Country Status (1)

Country Link
CN (1) CN111654435B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115022235B (zh) * 2022-05-07 2023-05-26 烽火通信科技股份有限公司 一种基于cspf的链路保护方法及***
CN115002023B (zh) * 2022-06-08 2024-04-19 邦彦技术股份有限公司 一种链路聚合方法、链路聚合装置、电子设备及存储介质
CN115643202A (zh) * 2022-09-28 2023-01-24 北京东土军悦科技有限公司 一种链路选择控制协议切换方法、装置、设备及介质
CN115996191A (zh) * 2022-11-21 2023-04-21 迈普通信技术股份有限公司 端口状态控制方法、装置、网络通信设备及存储介质

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1913414A (zh) * 2006-08-29 2007-02-14 华为技术有限公司 利用链路聚合实施保护的方法、设备和***
EP1921808B1 (en) * 2006-11-10 2014-06-18 Alcatel Lucent Preemptive transmission protection scheme for data services
CN101110663B (zh) * 2007-08-31 2010-10-27 华为技术有限公司 实现链路故障处理的方法、***及装置
EP2243255B1 (en) * 2008-02-01 2013-10-02 Allied Telesis Holdings K.K. Method and system for dynamic link failover management
CN102711163B (zh) * 2012-07-11 2015-08-19 烽火通信科技股份有限公司 一种ip-ran设备快速检测告警链路故障的方法
CN104219075B (zh) * 2013-05-31 2017-10-24 新华三技术有限公司 一种基于开放流协议的lacp环路检测方法和装置
CN103560898B (zh) * 2013-07-30 2016-12-28 北京华为数字技术有限公司 一种端口状态设置方法、端口优先级的选择方法及装置
WO2017000096A1 (zh) * 2015-06-27 2017-01-05 华为技术有限公司 一种链路恢复方法和网络设备
CN106302146A (zh) * 2016-10-17 2017-01-04 杭州迪普科技有限公司 链路聚合的收敛方法及装置
CN111030877A (zh) * 2019-12-26 2020-04-17 杭州迪普科技股份有限公司 主备设备切换方法和装置

Also Published As

Publication number Publication date
CN111654435A (zh) 2020-09-11

Similar Documents

Publication Publication Date Title
CN111654435B (zh) 一种基于lacp的链路保护故障处理***及方法
US7719956B2 (en) Trunk network system for multipoint-to-multipoint relay
US7260066B2 (en) Apparatus for link failure detection on high availability Ethernet backplane
US7835265B2 (en) High availability Ethernet backplane architecture
US8098682B2 (en) System and method for interfacing with a management system
JP5534026B2 (ja) 通信システムの制御方法、通信システム、通信装置
FI115271B (fi) Menetelmä ja järjestelmä nopean elpymisprosessin toteuttamiseksi lähiverkossa
CN102315975B (zh) 一种基于irf***的故障处理方法及其设备
CN102014019B (zh) 聚合链路切换方法及装置
EP2458797A1 (en) Method, device and system for updating ring network topology information
US9385944B2 (en) Communication system, path switching method and communication device
WO2007092132A2 (en) System and method for detecting and recovering from virtual switch link failures
CN111490903B (zh) 一种网络数据采集处理方法和装置
US9007228B2 (en) Transmission system using dying gasp
CN103227725A (zh) 一种防火墙双机备份的方法及装置
CN101051957B (zh) 捆绑链路状态动态调整方法和装置
CN113645312B (zh) 一种基于erps协议的子环网链路保护方法与装置
CN104243199A (zh) 分组传送网的数据传输方法及保护装置
CN102025437B (zh) 保护倒换的方法、***及设备
US7746949B2 (en) Communications apparatus, system and method of creating a sub-channel
CN102271049B (zh) 通信设备状态设置方法、装置和***
CN102014054A (zh) 保活报文的发送方法和设备
WO2021098477A1 (zh) 信号劣化处理方法、装置及***
CN111224803A (zh) 一种堆叠***中多主检测方法及堆叠***
CN103795557A (zh) 一种设备间端口模式同步方法、设备及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant