CN101505270B - 分布式交换机聚合链路快速收敛的方法 - Google Patents

分布式交换机聚合链路快速收敛的方法 Download PDF

Info

Publication number
CN101505270B
CN101505270B CN2009100808313A CN200910080831A CN101505270B CN 101505270 B CN101505270 B CN 101505270B CN 2009100808313 A CN2009100808313 A CN 2009100808313A CN 200910080831 A CN200910080831 A CN 200910080831A CN 101505270 B CN101505270 B CN 101505270B
Authority
CN
China
Prior art keywords
port
polymerization
link
message
integrated circuit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2009100808313A
Other languages
English (en)
Other versions
CN101505270A (zh
Inventor
陈振光
何庆宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Digital China Networks Beijing Co Ltd
Original Assignee
Digital China Networks Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Digital China Networks Beijing Co Ltd filed Critical Digital China Networks Beijing Co Ltd
Priority to CN2009100808313A priority Critical patent/CN101505270B/zh
Publication of CN101505270A publication Critical patent/CN101505270A/zh
Application granted granted Critical
Publication of CN101505270B publication Critical patent/CN101505270B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)
  • Small-Scale Networks (AREA)

Abstract

一种分布式交换机聚合链路实现快速收敛的方法,它包括以下步骤:1、一个成员端口链路断掉down,产生快速中断;2、在中断中通过驱动发消息告诉其它成员端口所在业务板卡,并且本端口所在板卡直接设置交换芯片,将该端口从聚合中删除,然后再通知聚合协议模块处理;3、其余各个板卡收到消息后,设置交换芯片,聚合成员端口少了一个;4、聚合对端设备的phy芯片接收不到端口信号后,端口链路断掉down,会重复上述一、二、三的操作。本发明可快速将down的成员端口从聚合中删除,减少了链路的丢报,实现了链路的快速收敛。本发明可以将收敛时间缩短到22ms内,满足了电信级设备快速收敛的要求,为电信级服务提供更加可靠的保障。

Description

分布式交换机聚合链路快速收敛的方法
技术领域
本发明涉及通讯领域,特别指一种分布式交换机聚合链路实现快速收敛的方法。 
背景技术
在交换机中,链路聚合是一种增加链路带宽,提高设备之间可靠性通信的技术。它是一种逻辑上的抽象过程,将一组具有相同属性的物理端口,抽象成一个逻辑端口;该逻辑链路的带宽为各物理链路的带宽之和;可以在不同的交换机之间连接多个虚拟局域网(VLAN),可以将VLAN扩展到整个网络;链路聚合(Trunk)可以捆绑任何相关的端口,也可以随时取消设置,这样提供了很高的灵活性;Trunk可以提供负载均衡能力以及***容错,由于Trunk实时平衡各个交换机端口和服务器接口的流量,一旦某个端口出现故障,它会自动把故障端口从Trunk组中撤消,进而重新分配各个Trunk端口的流量,从而实现***容错,从而为交换机之间的可靠性通信提供保障。然而,对于分布式交换机,当跨板聚合的一个成员端口链路断掉(down)时,报文如何快速的从这条down的物理链路切换到连通的物理链路上,减少交换机之间的报文丢失,这是链路聚合一个指标。 
由于交换芯片(如:bcm5662x)无法处理跨板聚合的快速切换,只能由软件完成。目前的方法:当聚合的一个端口链路断掉down时,端口所在 单板会把端口链路断掉down消息通知协议模块,协议模块再通过板间通信通知到主控板卡;然后主控板卡通过板间消息通知所有的业务板卡的协议栈模块,聚合的某个成员端口链路断掉down,协议栈模块然后才通知交换芯片(bcm5662x);设置交换芯片,将该端口从聚合中删除。 
以上所述的的方法虽然能达到链路切换的要求,切换时间大约在几百毫秒,为交换机之间的可靠性通信提供保证,但是对于电信级设备,要求切换时间不能高于50ms,因此这种方法是远远不能满足电信级设备的要求的。此外,上述方法大部分时间花费在协议栈模块的处理以及业务板卡和主控板卡之间的交互过程。 
发明内容:
本发明提供了一种分布式交换机聚合链路实现快速收敛的方法,它是一种聚合成员端口链路断掉down链路快速收敛的方法,减少链路之间的丢包,特别对于跨板聚合优势更明显,它为电信级设备之间使用聚合的可靠性提供了保证。 
交换机端口经常会由于链路故障,人为插拔等原因导致端口链路断掉down,为了在端口down之后能迅速通知上层做出相应的处理,并形成新的链路,就对端口的down状态的响应速度提出了比较高的要求,需要相应的修改端口检测的机制以适应这种要求,中断机制可以达到快速响应的目的。 
本发明的技术方案是: 
一种分布式交换机聚合链路快速收敛的方法,它包括以下步骤: 
步骤一:一个成员端口链路断掉down,产生快速中断; 
步骤二:在中断中通过驱动发消息告诉链路聚合的其余成员端口所在业务板卡,并且本端口所在板卡直接设置交换芯片,将该端口从聚合中删除,然后再通知聚合协议栈模块处理; 
步骤三:链路聚合的其余各个板卡收到消息后,设置交换芯片,将down的端口从聚合中删除; 
步骤四:聚合对端设备的phy芯片(bcm54980)接收不到端口信号后,判断端口链路断掉down,重复上述步骤一、二、三的操作。 
上述的实现聚合成员端口down链路快速收敛的方法,其特征在于:它包括: 
1)成员端口链路断掉down,phy芯片具有链路链路断掉down快速探测功能,通过逻辑产生快速中断; 
2)直接CPU间通信,不经过任何协议模块的处理;第一时间发广播消息通知聚合其它成员端口所在板卡; 
3)其它板卡快速处理接收的聚合成员端口链路断掉down的信息,将down的端口从聚合中删除。 
其中,在所述方法步骤中,实现端口链路断掉down所在单板如何快速的将聚合成员端口从交换芯片(bcm5662x)中删除;交换机板卡如何快速的接收到其它板卡发过来的聚合成员端口down的信息,它包括以下具体步骤: 
a)设置计数信号量;phy芯片快速探测到链路断掉down,会产生快速中断,在中断中对端口链路断掉down消息做处理,即释放计数信号量;同时将该消息写入消息队列中; 
b)交换机发起一个高优先级任务;在任务中获取信号量;然后从消息队列中读取消息;处理消息内容,将聚合成员端口从交换芯片聚合信息中删除; 
c)直接发送CPU间通信,而且此消息必须是广播的;保证其它单板同时收到。 
本发明可快速将down的成员端口从聚合中删除,减少了链路的丢报,实现了链路的快速收敛。本发明可以将收敛时间缩短到22ms内,满足了电信级设备快速收敛的要求,为电信级服务提供更加可靠的保障。 
附图说明:
图1是两台分布式交换机通过多条物理链路相连聚合的情况; 
图2是本发明聚合成员端口down所在单板的处理流程; 
图3是现有技术中聚合成员端口down板间消息的处理流程; 
图4是本发明聚合成员端口down板间消息的处理流程; 
图5是本发明聚合成员端口down,链路聚合的其余成员端口所在业务板卡的处理流程。 
具体实施方式:
下面结合说明书附图及实施例,对本发明作进一步的说明。 
如图1所示,两台分布式交换机通过多条物理链路相连聚合情况: 
图1中S1称为聚合的本端设备,S2称为聚合的对端设备,相应的端口称为本端端口和对端端口。其中,S1的前两个个端口在同一块业务板卡上, 后两个端口分布在不同的业务板卡上(其中非聚合端口没有画出来);S2的四个端口分布在不同的业务板卡上,这四条物理链路聚合成一条逻辑链路。图中S1称为聚合的本端设备,S2成为聚合的对端设备,相应的端口成为本端端口和对端端口。 
如图2所示,本发明聚合成员端口down所在业务板卡的处理流程: 
S1的phy芯片通过接收端口信号来判断端口link状态信息;打开端口扫描后,获得端口link状态信息,将需要逻辑扫描的端口添加到口位图中,添加进端口位图的端口将响应端口的link状态变化中断,当添加进端口扫描位图的端口产生link状态改变的时候,就会产生中断; 
(1)链路故障或者人为插拔等原因导致聚合成员端口链路断掉down; 
(2)S1通过phy芯片的快速链路检测功能(bcm54980能达到1毫秒),检测到端口down; 
(3)S1产生快速中断,在中断中将down的聚合端口信息写入队列中,释放计数信号量触发任务执行; 
(4)然后down的端口所在业务单板发送直接板间信息告诉其它的业务单板; 
(5)S1通过获取信号量方式告诉聚合端口down快速处理任务,该任务具有很高的优先级;本板需要处理的是:在端口down信息处理任务中,获取计数信号量; 
(6)如果能获取信号量,就从队列中读取down的聚合端口信息; 
(7)直接设置交换芯片,将down的端口从聚合中删除。 
如图3所示,现有技术中聚合成员端口down板间消息的处理流程: 
当聚合的一个端口down时,端口所在单板驱动聚合模块会把端口down消息通知协议栈模块,协议栈模块处理之后(主要时一些数据结构和软件信息的保存),再通过驱动板件通信模块发送板间通信消息通知到主控板卡;然后主控板卡的聚合协议栈模块处理完成之后,在任务中通过板间消息通知所有的业务板卡的协议栈模块,聚合的某个成员端口down,业务板卡的协议栈模块进行聚合相应的处理,最后才通知驱动聚合模块,设置交换芯片,将该端口从聚合中删除;其它业务板卡才真正从交换芯片中删除聚合的某个成员端口;之前经历了两次板间通信的过程,也经历了3次协议栈模块的处理,并不能达到快速的要求。 
如图4所示,本发明聚合成员端口down板间消息的处理流程图: 
一种聚合成员端口链路断掉down板间消息的处理方法,它可快速地通知聚合其它成员端口所在业务板卡,聚合端口down的信息,它包括:当聚合的一个端口down时,端口所在单板直接通过驱动聚合模块发送广播通信信息告诉其它的业务板卡,保证其它单板同时收到板间消息;主控板卡的处理只是将两个业务板卡的带外通道连通而已;将down的端口从聚合中删除;其它的业务板卡收到板间通信消息后直接由驱动聚合模块设置交换芯片;在其它的业务板卡设置交换芯片之前,这个流程节约了3次协议栈模块的处理,同时也节约了1次板间通信的过程;设置完交换芯片后,各个单板再通知相应的协议模块进行处理。 
如图5所示,本发明聚合成员端口down,链路聚合的其余成员端口所在业务板卡的处理流程图: 
一种聚合成员端口down链路聚合的其余成员端口所在业务板卡的处理方法,它包括: 
(1)其它业务板卡收到直接板间通信消息后; 
(2)判断是否是聚合成员端口down的信息; 
(3)如果是聚合成员端口down的信息:设置交换芯片,将down的端口从聚合中删除; 
(4)最后通知聚合相关协议栈模块处理; 
(5)如果不是聚合成员端口down的信息,则为其它消息处理。 
图2到图5是本端设备S1的处理流程,对端设备S2的处理流程和本端一样。当某个业务板卡的本端端口down后,本端和对端的phy芯片几乎同时接收不到端口信号,进行快速的处理;当从本端聚合端口其它业务板上来的流量,进行流量分担计算的时候,能够迅速的把down掉的链路的端口不计入流量分担计算。 

Claims (6)

1.一种分布式交换机聚合链路快速收敛的方法,其特征在于:它包括以下步骤:
步骤一:一个成员端口链路断掉down,产生中断;
步骤二:在中断中通过驱动发消息告诉链路聚合的其余成员端口所在业务板卡,并且本端口所在板卡直接设置交换芯片,将该端口从聚合中删除,然后再通知聚合协议栈模块处理;
步骤三:链路聚合的其余各个板卡收到消息后,设置交换芯片,将down的端口从聚合中删除;
步骤四:聚合对端设备的phy芯片接收不到端口信号后,判断端口链路断掉down,重复上述步骤一、二、三的操作。
2.一种实现聚合成员端口链路断掉down链路快速收敛的方法,其特征在于:它包括:
A)、成员端口down后,phy芯片具有链路down快速探测功能,通过逻辑产生快速中断;
B)、直接CPU间通信,不经过任何协议模块的处理;第一时间发广播消息通知聚合其它成员端口所在板卡;
C)、其它板卡处理接收的聚合成员端口down的信息,将down的端口从聚合中删除。
3.根据权利要求2所述的实现聚合成员端口链路断掉down链路快速收敛的方法,其特征在于:在所述方法步骤中,实现端口链路断掉down所在单板快速的将聚合成员端口从交换芯片中删除;聚合其余成员端口所在业务板卡快速的接收到聚合成员端口链路断掉down的信息,它包括以下具体步骤:
a)、设置计数信号量;phy芯片快速探测到链路断掉down,会产生快速中断,在中断中对端口链路断掉down消息做处理,即释放计数信号量;同时将该消息写入消息队列中;
b)、交换机发起一个高优先级任务;在任务中获取信号量;然后从消息队列中读取消息;处理消息内容,将聚合成员端口从交换芯片聚合信息中删除;
c)、直接发送CPU间通信,此消息必须是广播的;保证其它单板同时收到。
4.根据权利要求2或3所述的实现聚合成员端口链路断掉down链路快速收敛的方法,其特征在于:在所述方法步骤中,快速将down的成员端口从聚合中删除,减少链路的丢报,实现链路的快速收敛,其收敛时间达到22ms以内。
5.一种聚合成员端口链路断掉down板间消息的处理方法,它可快速地通知链路聚合的其余成员端口所在业务板卡,聚合端口down的信息,其特征在于:它包括:
当聚合的一个端口down时,端口所在单板直接通过驱动聚合模块发送广播通信信息告诉其它的业务板卡,保证其它单板同时收到板间消息;主控板卡的处理只是将两个业务板卡的带外通道连通而已;其它的业务板卡收到板间通信消息后直接由驱动聚合模块设置交换芯片;将down的端口从聚合中删除;设置交换芯片后,各个单板再通知相应的协议模块进行处理。
6.一种聚合成员端口down链路聚合的其余成员端口所在业务板卡的处理方法,其特征在于:它包括:
A)、其它业务板卡收到直接板间通信消息后;
B)、判断是否是聚合成员端口down的信息;
C)、如果是聚合成员端口down的信息:设置交换芯片,将down的端口从聚合中删除;
D)、最后通知聚合相关协议栈模块处理;
E)、如果不是聚合成员端口down的信息,则为其它消息处理。
CN2009100808313A 2009-03-24 2009-03-24 分布式交换机聚合链路快速收敛的方法 Active CN101505270B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2009100808313A CN101505270B (zh) 2009-03-24 2009-03-24 分布式交换机聚合链路快速收敛的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009100808313A CN101505270B (zh) 2009-03-24 2009-03-24 分布式交换机聚合链路快速收敛的方法

Publications (2)

Publication Number Publication Date
CN101505270A CN101505270A (zh) 2009-08-12
CN101505270B true CN101505270B (zh) 2012-04-11

Family

ID=40977344

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009100808313A Active CN101505270B (zh) 2009-03-24 2009-03-24 分布式交换机聚合链路快速收敛的方法

Country Status (1)

Country Link
CN (1) CN101505270B (zh)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101674240B (zh) * 2009-09-24 2012-05-09 中兴通讯股份有限公司 用于分布式***的单节点双归的实现方法和装置
CN102075343B (zh) * 2009-11-20 2013-03-27 杭州华三通信技术有限公司 一种实现带外管理的方法、***和带外管理交换机
CN101867495A (zh) * 2010-06-25 2010-10-20 神州数码网络(北京)有限公司 以太网自动保护链路故障快速切换方法
CN102843285A (zh) * 2011-06-24 2012-12-26 中兴通讯股份有限公司 一种分布式链路聚合方法及实现该方法的节点
CN103166840A (zh) * 2011-12-09 2013-06-19 国家电网公司 服务器与交换机的数据传输方法与***
CN102739535A (zh) * 2012-06-26 2012-10-17 中兴通讯股份有限公司 一种线卡离线的保护方法和***
CN102857419B (zh) * 2012-10-12 2015-07-22 华为技术有限公司 链路聚合端口故障的处理方法和装置
CN103685079A (zh) * 2014-01-02 2014-03-26 武汉迈威实达软件有限公司 自适应的以太网单环网算法
CN105323139B (zh) * 2015-04-29 2019-07-09 上海博达数据通信有限公司 一种用于虚拟交换机***的虚拟链路协商方法
CN105591794B (zh) * 2015-07-10 2019-05-17 新华三技术有限公司 管理网络设备的方法和装置
CN108696365A (zh) * 2017-02-17 2018-10-23 中兴通讯股份有限公司 一种实现带外管理的方法及装置
CN107547452B (zh) * 2017-07-11 2020-09-25 新华三技术有限公司 一种分布式通信设备及其报文转发方法和装置
CN108471390B (zh) * 2018-03-20 2020-12-15 深圳市风云实业有限公司 业务报文跨板处理***及业务报文的重定向方法
WO2020089964A1 (ja) * 2018-10-29 2020-05-07 三菱電機株式会社 通信システム、通信装置、方法、及びプログラム
CN109951324B (zh) * 2019-02-28 2022-04-26 新华三技术有限公司 一种网板隔离实现方法及装置
CN110611715B (zh) * 2019-09-23 2023-11-28 国云科技股份有限公司 一种服务链路集合云监控信息的***和方法
CN112583709B (zh) * 2019-09-27 2024-05-28 深圳市中兴微电子技术有限公司 一种链路聚合的选路方法、***、交换设备及介质
CN111064815B (zh) * 2019-11-06 2022-02-18 深圳震有科技股份有限公司 多单板共用一个ip的方法及装置、计算机设备、介质
CN111131024A (zh) * 2019-12-09 2020-05-08 盛科网络(苏州)有限公司 聚合链路的处理方法及装置
CN112165429B (zh) * 2020-09-11 2022-07-22 烽火通信科技股份有限公司 分布式交换设备的链路聚合收敛方法和设备
CN113612590B (zh) * 2021-08-20 2023-10-24 锐捷网络股份有限公司 基于交换板卡变更的自适应调整方法及装置
CN114615148A (zh) * 2022-03-16 2022-06-10 芯河半导体科技(无锡)有限公司 一种快速的链路聚合失效转移方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101035047A (zh) * 2007-04-03 2007-09-12 中兴通讯股份有限公司 环网保护的处理方法
CN101119161A (zh) * 2006-08-04 2008-02-06 中兴通讯股份有限公司 一种传输设备中的故障处理***及方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101119161A (zh) * 2006-08-04 2008-02-06 中兴通讯股份有限公司 一种传输设备中的故障处理***及方法
CN101035047A (zh) * 2007-04-03 2007-09-12 中兴通讯股份有限公司 环网保护的处理方法

Also Published As

Publication number Publication date
CN101505270A (zh) 2009-08-12

Similar Documents

Publication Publication Date Title
CN101505270B (zh) 分布式交换机聚合链路快速收敛的方法
CN101355466B (zh) 连续性检查消息报文的传输方法和装置
CN102299846B (zh) 一种bfd报文传输方法和设备
CN103095568B (zh) 机架式交换设备实现堆叠的***及方法
CN1825836B (zh) 避免网络设备拥塞的***和方法
CN102724030A (zh) 一种高可靠性的堆叠***
CN102857419A (zh) 链路聚合端口故障的处理方法和装置
CN101610212A (zh) 实现数据平面可靠通信的方法和板卡
CN106301840B (zh) 双向转发检测bfd报文的发送方法及装置
CN103152210A (zh) 修复生成树协议转发状态异常的方法及堆叠设备
US20080008181A1 (en) Packet transferring node
CN101610143B (zh) 链路数据的保护方法、***及装置
CN105871614A (zh) 一种通信设备中板卡的保护方法和装置
US9166868B2 (en) Distributed control plane for link aggregation
CN103248567B (zh) 一种bfd会话报文传输方法和设备
CN108804260A (zh) 一种srio***倒换的方法和装置
CN100466591C (zh) 主从设备***
CN100428684C (zh) 带外通道方法
CN103036724B (zh) 状态信息传输方法、网络设备及组合设备
CN101867495A (zh) 以太网自动保护链路故障快速切换方法
CN102209028A (zh) 控制cpu流量的装置和方法
CN110031722B (zh) 一种实时故障报告粘连的处理方法及其装置
CN101635683A (zh) 基于链路聚合的业务下发方法及装置
CN102857436A (zh) 一种基于irf网络的流量传输方法和设备
CN107179970B (zh) 一种分布式设备中大规模oam检测***及方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant