CN109936518A - 交换芯片通道故障的检测方法和分布式机架交换机 - Google Patents

交换芯片通道故障的检测方法和分布式机架交换机 Download PDF

Info

Publication number
CN109936518A
CN109936518A CN201711366802.4A CN201711366802A CN109936518A CN 109936518 A CN109936518 A CN 109936518A CN 201711366802 A CN201711366802 A CN 201711366802A CN 109936518 A CN109936518 A CN 109936518A
Authority
CN
China
Prior art keywords
channel
detection messages
source
exchange chip
chip
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711366802.4A
Other languages
English (en)
Other versions
CN109936518B (zh
Inventor
王强
陈烈
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Maipu Communication Technology Co Ltd
Original Assignee
Maipu Communication Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Maipu Communication Technology Co Ltd filed Critical Maipu Communication Technology Co Ltd
Priority to CN201711366802.4A priority Critical patent/CN109936518B/zh
Publication of CN109936518A publication Critical patent/CN109936518A/zh
Application granted granted Critical
Publication of CN109936518B publication Critical patent/CN109936518B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Debugging And Monitoring (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请公开了一种交换芯片通道故障的检测方法和分布式机架交换机,涉及通信领域,用于降低通道故障检测时的CPU负荷。该方法包括:源CPU控制所述源交换芯片,通过所述通道组中的一个通道向所述目的交换芯片发送检测报文;如果所述目的交换芯片从所述一个通道接收所述检测报文,则从所述一个通道返回所述检测报文;如果所述源交换芯片从所述一个通道接收所述检测报文,则统计所述一个通道接收到检测报文的次数,并通过所述通道组中的下一通道向所述目的交换芯片发送所述检测报文;如果所述一个通道为所述通道组中最后一个通道,则将所述检测报文返回给所述源CPU。本申请实施例应用于通道故障检测。

Description

交换芯片通道故障的检测方法和分布式机架交换机
技术领域
本发明涉及通信领域,尤其涉及一种交换芯片通道故障的检测方法和分布式机架交换机。
背景技术
分布式机架交换机中通常将控制单元、业务单元、交换矩阵做成独立的板卡,例如控制板卡、业务板卡和交换矩阵板卡等。业务板卡和交换矩阵板卡通常包含中央处理器(Central Process Unit,CPU)和交换芯片。交换芯片之间通常以内部连线进行连接,构成交换芯片之间的数据通道。交换芯片之间的通道提供了数据转发的基础,因此其通道的运行状态非常重要。为此,在软件***中一般都会启用专门的软件模块来进行通道状态的检测和修复处理。
在通常的检测方案中,如图1所示,源板卡10的CPU S将检测报文发送给交换芯片CHIP S,CHIP S将检测报文从通道发送给目的板卡20的交换芯片CHIP D。CHIP D收到检测报文之后,上交检测报文给目的板卡20的CPU D。反向地,CPU D通过CHIP D、CHIP S将检测报文发送回CPU S。通过这个过程,CPU S收到了自己发出的检测报文,从而判断交换芯片CHIP S与CHIP D之间的通道是双向正常的。
通过上述的流程可以看到,除了发起检测的CPU S、CHIP S和CHIP D参与外,还需要目的板卡20的CPU D参与完成检测过程,当目的板卡20的CPU D比较繁忙时,CPU S在规定的时间内收不到返回的检测报文,误判通道出现状态异常。并且,如果CHIP S和CHIP D之间有多条物理通道,CPU S需要针对每条通道发送检测报文,当CHIP S与CHIP D之间的通道数量较多时,CPU S和CPU D需要发送和接收的检测报文数量与通道数量相同,CPU的负荷会比较重。
发明内容
本申请的实施例提供一种交换芯片通道故障的检测方法和分布式机架交换机,用于降低通道故障检测时的CPU负荷。
为达到上述目的,本申请的实施例采用如下技术方案:
第一方面,提供了一种交换芯片通道故障的检测方法,应用于分布式机架交换机,所述交换机包括源板卡和目的板卡,所述源板卡上设置有源中央处理器CPU和源交换芯片,所述目的板卡上设置有目的交换芯片,所述源交换芯片与所述目的交换芯片之间包括至少一个通道组,所述通道组包括一个或多个通道,该方法包括:
所述源CPU控制所述源交换芯片,通过所述通道组中的一个通道向所述目的交换芯片发送检测报文;
如果所述目的交换芯片从所述一个通道接收所述检测报文,则从所述一个通道返回所述检测报文;
如果所述源交换芯片从所述一个通道接收所述检测报文,则统计所述一个通道接收到检测报文的次数,并通过所述通道组中的下一通道向所述目的交换芯片发送所述检测报文;如果所述一个通道为所述通道组中最后一个通道,则将所述检测报文返回给所述源CPU;
所述源CPU根据是否接收到所述检测报文以及所述通道组中各个通道接收到检测报文的次数判断通道是否发生故障。
第二方面,提供了一种分布式机架交换机,包括:源板卡和目的板卡,所述源板卡上设置有源中央处理器CPU和源交换芯片,所述目的板卡上设置有目的交换芯片,所述源交换芯片与所述目的交换芯片之间包括一个或多个通道,
所述源CPU用于,控制所述源交换芯片,通过所述通道组中的一个通道向所述目的交换芯片发送检测报文;
所述目的交换芯片,用于如果从所述一个通道接收所述检测报文,则从所述一个通道返回所述检测报文;
所述源交换芯片,用于如果从所述一个通道接收所述检测报文,则统计所述一个通道接收到检测报文的次数,并通过所述通道组中的下一通道向所述目的交换芯片发送所述检测报文;如果所述一个通道为所述通道组中最后一个通道,则将所述检测报文返回给所述源CPU;
所述源CPU,还用于根据是否接收到所述检测报文以及所述通道组中各个通道接收到检测报文的次数判断通道是否发生故障。
第三方面,提供了一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,所述指令当被计算机执行时使所述计算机执行第一方面所述的方法。
本申请实施例提供的交换芯片通道故障的检测方法和分布式机架交换机,首先,目的板卡的CPU不用参加检测过程,其负荷为0。其次,源板卡的通道检测结果不再受目的板卡的CPU的工作状态影响。而在原来的方案中,可能由于目的板卡的CPU工作繁忙,不能及时回应检测报文。使得源端板卡的通道检测模块的检测时间超时,误认为通道异常,将进行转发通道切换或者复位,最终此误报将会影响数据的正常转发。最后,源端板卡的检测模块通过CPU发送和接收一次报文可完成一组通道的状态检测,提升了检测效率,并且与原来的检测方式相比能较大程度减轻了源CPU的负荷。综上所述,本申请可以降低通道故障检测时的CPU负荷。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为本申请的实施例提供的分布式机架交换机的结构示意图一;
图2为本申请的实施例提供的分布式机架交换机的结构示意图二;
图3为本申请的实施例提供的交换芯片通道故障的检测方法的流程示意图;
图4为本申请的实施例提供的分布式机架交换机的报文流向示意图。
具体实施方式
下面结合附图,对本申请的实施例进行描述。
本申请实施例中,交换芯片标识(CHIP ID),用于表示交换芯片的标识。通道(CHANNEL),用于表示交换芯片之间直接相连的物理通道。通道标识(CHANNEL ID),用于标记交换芯片之间直接相连的通道。通道组(CHANNEL GROUP),用于表示两颗交换芯片之间的通道集合,可能包括一个或者一个以上的通道。通道组标识(CHANNEL GROUP ID),用于表示一个通道组,可以用通道组中第一个通道的通道标识来表示。
参照图2中所示,本申请实施例提供了一种分布式机架交换机,包括:控制板卡30、源板卡10和目的板卡20。源板卡10作为检测发起者,目的板卡20作为检测发起者的对联板卡。控制板卡30上设置有控制CPU——CPU C。源板卡10上设置有源CPU——CPU S和源交换芯片CHIP S。目的板卡20上设置有目的CPU——CPU D和目的交换芯片CHIP D。源交换芯片CHIP S与目的交换芯片CHIP D之间包括至少一个通道组CHANNEL GROUP,该通道组包括一个或多个通道CHANNEL。
CPU C的功能:
控制板卡30的CPU C统一管理整个分布式机架交换机,将业务板卡和交换矩阵板卡上的交换芯片统一进行标识,形成芯片标识表,关键字段为{CHIP i},其中,i表示交换芯片的标识。
对各个交换芯片之间的通道进行标识,形成通道标识表,关键字段为{CHIP i,CHIP k,CHANNEL ID},其中,i和k表示交换芯片的标识CHIP ID,{CHIP i,CHIP k,CHANNELID}表示CHIP i与CHIP k之间的通道,标识为CHANNEL ID。
对通道{CHIP i,CHIP k,CHANNEL ID}进行编组形成通道组表。将{CHIP i,CHIPk}相同的CHANNEL ID编为一组CHANNEL GROUP,CHANNEL GROUP ID可以使用该组中CHANNELID的最小值。为了简洁起见,CHANNEL ID和CHIP ID都连续标识。
CPU C完成了这些标识信息之后,将相关的芯片标识表、通道标识表和通道组表通过控制通道发送给源板卡10的CPU S和目的板卡20的CPU D。
CPU D的功能:
CPU D收到来自CPU C的芯片标识表、通道标识表和通道组表后,将对所在板卡的交换芯片进行转发配置。CPU D查找芯片标识表中的所有芯片,记录与其直接有物理连接的交换芯片集合。当从某个CHANNEL收到检测报文,且检测报文的目的交换芯片为与其直接相连的交换芯片时,将此检测报文通过该CHANNEL转发回去,也就是从收到该检测报文的CHANNEL“回弹”检测报文。
CPU S的功能:
CPU S收到来自CPU C的芯片标识表、通道标识表和通道组表后,将对所在板卡的交换芯片进行转发配置。首先,将进行通道状态检测的CHANNEL按照本端芯片和与其直接物理相连的对端芯片进行分组和标识,形成列表{CHIP S,CHIP D,1},…,{CHIP S,CHIP D,K-1},{CHIP S,CHIP D,K},…,{CHIP S,CHIP D,N},作为一组通道组CHANNEL GROUP。CHIP S为本端的交换芯片标识,CHIP D为目的板卡的交换芯片标识。N为这两颗芯片之间的通道总数。由于源板卡10上可能含有多颗交换芯片,也可能目的板卡20上有多颗交换芯片,也可能存在多张目的板卡20的多颗芯片,因此CPU S根据情况需要处理多个CHANNEL组。
下面描述CPU S对于一个通道组的配置过程:
CPU S对通道1,…,N-1进行转发表项的配置。使得当CHIP S从这些CHANNEL收到目的芯片为CHIP S的检测报文时,将该检测报文从通道组的下一CHANNEL转发出去。
CPU S对第N条通道进行转发表项配置。使得当CHIP S从第N个通道收到目的芯片为CHIP S的检测报文时,将该检测报文直接上交到所在板卡的CPU S。
除了配置转发行为以外,CPU S还包括配置交换芯片CHIP S对通道1,2,…,N的统计功能。当CHIP S从对应通道收到目的芯片为CHIP S的检测报文时,需要对该报文进行统计。如果有多个通道组,则循环配置各个通道组。
参照图3中所示,本申请实施例提供的交换芯片通道故障的检测方法,包括:
S101、源CPU控制源交换芯片,通过通道组中的一个通道向目的交换芯片发送检测报文
源CPU以源板卡10的CPU S为例进行说明。CPU S进行检测报文的封装。检测报文中包括下述字段:检测类型、目的交换芯片标识CHIP ID和通道组标识CHANNEL GROUP ID。其中,检测类型设置为指定的报文检测类型。目的交换芯片标识CHIP ID设置为源板卡10的交换芯片CHIP S对应的CHIP ID。通道组标识CHANNEL GROUP ID设置为需要检测的通道组中第1~N个通道的第1个通道的通道标识CHANNEL ID。
CPU S要求交换芯片CHIP S从上述指定的通道CHANNEL将检测报文发送出去。示例性的,参照图4中所示,CPU S将检测报文发送给交换芯片CHIP S的过程如箭头A所示。CHIPS将检测报文发送给CHIP D的过程如箭头1所示。
S102、如果目的交换芯片从一个通道接收检测报文,则从该一个通道返回检测报文。
CHIP D收到该检测报文以后,解析得到如下信息:通道检测报文,目的交换芯片为CHIP S,CHANNEL GROPU ID。根据CHIP D的配置,将此报文通过接收此报文的通道CHANNEL“回弹”(重新发送)给CHIP S,具体参照图4中的箭头1’。对CHIP D来说,对于其余通道2,…,N收到该检测报文的行为都是类似的,将检测报文通过接收报文的通道CHANNEL回弹给CHIPS,如图4中的箭头K-1’、K’、N’所示。
S103、如果源交换芯片从该一个通道接收检测报文,则统计该一个通道接收到检测报文的次数,并通过通道组中的下一通道向目的交换芯片发送检测报文;如果该一个通道为通道组中最后一个通道,则将检测报文返回给源CPU。
当CHIP S从CHANNEL 1收到CHIP D“回弹”的检测报文以后,通过解析发现该报文目的为CHIP S的CHANNEL GROUP的检测报文,则将检测报文从CHANNEL GROUP中的下一个通道CHANNEL重新发送给CHIP D,即按照通道组中通道顺序依次发送检测报文。对于通过通道2,…,N-1发送此检测报文,CHIP S的行为与通过通道1发送此检测报文是类似的,具体参照图4中的箭头K-1,K,N等所示。
当CHIP S从通道组中最后一个通道CHANNEL N接收到此检测报文时,通过解析发现该报文目的为CHIP S的CHANNEL GROUP的检测报文,则根据配置将此报文上交给CPU S,具体参照图4中的箭头A’所示。CHIP S除了转发报文以外,当从通道1,…,N收到检测报文后,还需要针对接收到检测报文的次数进行统计。
S104、源CPU根据是否接收到所述检测报文以及所述通道组中各个通道接收到检测报文的次数判断通道是否发生故障。
具体的,如果在一定时间内源CPU未接收到检测报文,则判断该通道组发生故障;并可以根据通道组中各个通道接收到检测报文的次数判断通道组中哪一个通道发生故障。
当CPU S收到来自CHIP S的检测报文以后,通过解析得到报文的信息包括:目的芯片为CHIP S,通道组为CHANNGEL GROPU ID的检测报文。到此为止,CHANNEL GROUP ID对应的CHANNEL 1,…,N和CPU与CHIP S之间通道双向都是正常的。一次检测过程结束。
CPU S通过设置超时时间T来判定通道是否存在状态异常。T需要根据CPU S与CHIPS,CHIP S与CHIP D之间的多次发送延时进行设置。当CPU S发送了一个检测报文以后,超过了时间T后仍然未收到报文,则此次检测失败,判定对应的CHANNEL GROUP工作状态异常,需要进行修复处理。
其中,因为CHANNEL GROUP中有N个通道,是哪个通道发生了状态异常,需要通过进一步确定。具体的,如果通道组中前一通道接收到检测报文的次数大于后一通道接收到检测报文的次数,则判断该后一通道发生故障;如果通道组中所有通道接收到检测报文的次数相同,则判断CPU S与CHIP S之间的通道发生故障。例如CPU S从CHIP S中读取通道1,2,…,K-1,K,…,N收到的对应所在通道组的检测报文的次数。如果通道K的收包统计值<通道K-1的收包统计值,则判定通道K发生了故障,需要进行相应的修复处理。如果通道1,…,N的收包统计值都相等,那么说明CPU S和CHIP S之间的该通道组出现了故障,需要进行修复。
CPU S在修复过程中,需要对通道1,…,N的接收报文次数清零,使得能够支持下一个阶段的检测过程。
另外,如果源CPU确定通道组中一通道发生故障,则将该一通道移除出通道组,待故障恢复后将该一通道重新加入通道组,使得源板卡在转发检测报文时,跳过出现状态异常的通道。例如,当通道组中的通道K出现故障时,使得通道K+1,…,N在当前检测过程中没有被检测到。因此需要将通道K隔离。具体的,将通道K从该通道组中移除,在源板卡上针对该通道组重新进行交换芯片CHIP S的配置。配置后的效果是,当从通道K-1收到目的芯片为CHIP S且为该通道组的检测报文时,不再通过通道K转发,而是通过通道K+1转发给目的板卡CHIP D。通过此隔离操作,在后续的检测过程将针对通道组的剩余所有通道进行状态检测。
被隔离的通道K经过修复处理且状态正常之后,重新加入原通道组,使得源板卡在转发检测报文时,也从修复正常的通道转发检测报文。具体的,在源板卡上针对原通道组重新进行交换芯片CHIP S的配置。配置后的效果是,当从通道K-1收到目的芯片为CHIP S且为该通道组的检测报文时,恢复通过通道K转发检测报文。
在上面的流程描述中是按照通道状态检测的角色来描述的。每张板卡都可以同时承担源板卡和目的板卡的双重角色,即分别通过两个角色进行计算和对交换芯片进行相应的配置。
本申请实施例提供的交换芯片通道故障的检测方法和分布式机架交换机,首先,目的板卡的CPU不用参加检测过程,其负荷为0。其次,源板卡的通道检测结果不再受目的板卡的CPU的工作状态影响。而在原来的方案中,可能由于目的板卡的CPU工作繁忙,不能及时回应检测报文。使得源端板卡的通道检测模块的检测时间超时,误认为通道异常,将进行转发通道切换或者复位,最终此误报将会影响数据的正常转发。最后,源端板卡的检测模块通过CPU发送和接收一次报文可完成一组通道的状态检测,提升了检测效率,并且与原来的检测方式相比能较大程度减轻了源CPU的负荷。综上所述,本申请可以降低通道故障检测时的CPU负荷。
综合上述,此方法的参与部件数量更少,源和目的板卡的CPU负荷明显降低。检测方法效率更高,造成误判的可能性更小,可靠性更高。
本申请实施例提供一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,所述指令当被计算机执行时使所述计算机执行如图3所述的方法。
应理解,在本申请的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的***、设备和方法,可以通过其它的方式实现。例如,以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件程序实现时,可以全部或部分地以计算机程序产品的形式来实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或者数据中心通过有线(例如同轴电缆、光纤、数字用户线(Digital Subscriber Line,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可以用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如,软盘、硬盘、磁带),光介质(例如,DVD)、或者半导体介质(例如固态硬盘(Solid State Disk,SSD))等。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

Claims (9)

1.一种交换芯片通道故障的检测方法,应用于分布式机架交换机,所述交换机包括源板卡和目的板卡,所述源板卡上设置有源中央处理器CPU和源交换芯片,所述目的板卡上设置有目的交换芯片,所述源交换芯片与所述目的交换芯片之间包括至少一个通道组,所述通道组包括一个或多个通道,其特征在于,所述方法包括:
所述源CPU控制所述源交换芯片,通过所述通道组中的一个通道向所述目的交换芯片发送检测报文;
如果所述目的交换芯片从所述一个通道接收所述检测报文,则从所述一个通道返回所述检测报文;
如果所述源交换芯片从所述一个通道接收所述检测报文,则统计所述一个通道接收到检测报文的次数,并通过所述通道组中的下一通道向所述目的交换芯片发送所述检测报文;如果所述一个通道为所述通道组中最后一个通道,则将所述检测报文返回给所述源CPU;
所述源CPU根据是否接收到所述检测报文以及所述通道组中各个通道接收到检测报文的次数判断通道是否发生故障。
2.根据权利要求1所述的方法,其特征在于,所述源CPU根据是否接收到所述检测报文以及所述通道组中各个通道接收到检测报文的次数判断通道发生故障,包括:
如果在一定时间内所述源CPU未接收到所述检测报文,则判断所述通道组发生故障;并根据所述通道组中各个通道接收到检测报文的次数判断所述通道组中哪一个通道发生故障。
3.根据权利要求2所述的方法,其特征在于,所述根据所述通道组中各个通道接收到检测报文的次数判断所述通道组中哪一个通道发生故障,包括:
如果所述通道组中前一通道接收到检测报文的次数大于后一通道接收到检测报文的次数,则判断所述后一通道发生故障;
如果所述通道组中所有通道接收到检测报文的次数相同,则判断所述源CPU与所述源交换芯片之间的通道发生故障。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
如果所述源CPU确定所述通道组中一通道发生故障,则将所述一通道移除出所述通道组,待故障恢复后将所述一通道重新加入所述通道组。
5.一种分布式机架交换机,包括:源板卡和目的板卡,所述源板卡上设置有源中央处理器CPU和源交换芯片,所述目的板卡上设置有目的交换芯片,所述源交换芯片与所述目的交换芯片之间包括一个或多个通道,其特征在于,
所述源CPU用于,控制所述源交换芯片,通过所述通道组中的一个通道向所述目的交换芯片发送检测报文;
所述目的交换芯片,用于如果从所述一个通道接收所述检测报文,则从所述一个通道返回所述检测报文;
所述源交换芯片,用于如果从所述一个通道接收所述检测报文,则统计所述一个通道接收到检测报文的次数,并通过所述通道组中的下一通道向所述目的交换芯片发送所述检测报文;如果所述一个通道为所述通道组中最后一个通道,则将所述检测报文返回给所述源CPU;
所述源CPU,还用于根据是否接收到所述检测报文以及所述通道组中各个通道接收到检测报文的次数判断通道是否发生故障。
6.根据权利要求5所述的交换机,其特征在于,所述源CPU具体用于:
如果在一定时间内所述源CPU未接收到所述检测报文,则判断所述通道组发生故障;并根据所述通道组中各个通道接收到检测报文的次数判断所述通道组中哪一个通道发生故障。
7.根据权利要求6所述的交换机,其特征在于,所述源CPU具体用于:
如果所述通道组中前一通道接收到检测报文的次数大于后一通道接收到检测报文的次数,则判断所述后一通道发生故障;
如果所述通道组中所有通道接收到检测报文的次数相同,则判断所述源CPU与所述源交换芯片之间的通道发生故障。
8.根据权利要求5所述的交换机,其特征在于,所述源CPU还用于:
如果确定所述通道组中一通道发生故障,则将所述一通道移除出所述通道组,待故障恢复后将所述一通道重新加入所述通道组。
9.一种存储一个或多个程序的计算机可读存储介质,其特征在于,所述一个或多个程序包括指令,所述指令当被计算机执行时使所述计算机执行如权利要求1至4任一项所述的方法。
CN201711366802.4A 2017-12-18 2017-12-18 交换芯片通道故障的检测方法和分布式机架交换机 Active CN109936518B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711366802.4A CN109936518B (zh) 2017-12-18 2017-12-18 交换芯片通道故障的检测方法和分布式机架交换机

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711366802.4A CN109936518B (zh) 2017-12-18 2017-12-18 交换芯片通道故障的检测方法和分布式机架交换机

Publications (2)

Publication Number Publication Date
CN109936518A true CN109936518A (zh) 2019-06-25
CN109936518B CN109936518B (zh) 2022-02-11

Family

ID=66982807

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711366802.4A Active CN109936518B (zh) 2017-12-18 2017-12-18 交换芯片通道故障的检测方法和分布式机架交换机

Country Status (1)

Country Link
CN (1) CN109936518B (zh)

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0846382A1 (en) * 1996-02-22 1998-06-10 Fujitsu Limited Interconnect fault detection and localization method and apparatus
US20030081556A1 (en) * 2001-10-25 2003-05-01 Woodall Thomas R. System and method for real-time fault reporting in switched networks
US20040190686A1 (en) * 2003-03-31 2004-09-30 Adtran, Inc. Method of detecting remote ground condition
CN1791007A (zh) * 2004-12-02 2006-06-21 华为技术有限公司 一种通信设备及其内部链路故障的定位方法
CN101072136A (zh) * 2007-06-25 2007-11-14 华为技术有限公司 检测通信网元内部通道故障的方法、装置和***
CN101192998A (zh) * 2006-11-21 2008-06-04 中兴通讯股份有限公司 基于网络处理器的数据线路侦测方法
CN101626324A (zh) * 2009-08-19 2010-01-13 杭州华三通信技术有限公司 转发路径检测方法和设备
CN102664755A (zh) * 2012-04-20 2012-09-12 杭州华三通信技术有限公司 控制通道故障确定方法及其装置
CN102694692A (zh) * 2012-06-18 2012-09-26 杭州华三通信技术有限公司 一种分布式设备的故障检测方法和装置
CN105591894A (zh) * 2015-07-01 2016-05-18 杭州华三通信技术有限公司 一种分布式***的单板提高板间数据通道可靠性的方法和装置
US20160219646A1 (en) * 2015-01-22 2016-07-28 Samsung Electronics Co., Ltd. Method for preserving a radio resource control state of a user equipment
EP3057334A1 (en) * 2015-02-16 2016-08-17 Juniper Networks, Inc. Multi-stage switch fabric fault detection and handling
CN105871614A (zh) * 2016-03-31 2016-08-17 国网山西省电力公司信息通信分公司 一种通信设备中板卡的保护方法和装置
WO2017174519A1 (en) * 2016-04-04 2017-10-12 Gemalto Sa Method, chip and system for detecting a failure or a drop in a pdp context or an eps pdn connection

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0846382A1 (en) * 1996-02-22 1998-06-10 Fujitsu Limited Interconnect fault detection and localization method and apparatus
US20030081556A1 (en) * 2001-10-25 2003-05-01 Woodall Thomas R. System and method for real-time fault reporting in switched networks
US20040190686A1 (en) * 2003-03-31 2004-09-30 Adtran, Inc. Method of detecting remote ground condition
CN1791007A (zh) * 2004-12-02 2006-06-21 华为技术有限公司 一种通信设备及其内部链路故障的定位方法
CN101192998A (zh) * 2006-11-21 2008-06-04 中兴通讯股份有限公司 基于网络处理器的数据线路侦测方法
CN101072136A (zh) * 2007-06-25 2007-11-14 华为技术有限公司 检测通信网元内部通道故障的方法、装置和***
CN101626324A (zh) * 2009-08-19 2010-01-13 杭州华三通信技术有限公司 转发路径检测方法和设备
CN102664755A (zh) * 2012-04-20 2012-09-12 杭州华三通信技术有限公司 控制通道故障确定方法及其装置
CN102694692A (zh) * 2012-06-18 2012-09-26 杭州华三通信技术有限公司 一种分布式设备的故障检测方法和装置
US20160219646A1 (en) * 2015-01-22 2016-07-28 Samsung Electronics Co., Ltd. Method for preserving a radio resource control state of a user equipment
EP3057334A1 (en) * 2015-02-16 2016-08-17 Juniper Networks, Inc. Multi-stage switch fabric fault detection and handling
CN105591894A (zh) * 2015-07-01 2016-05-18 杭州华三通信技术有限公司 一种分布式***的单板提高板间数据通道可靠性的方法和装置
CN105871614A (zh) * 2016-03-31 2016-08-17 国网山西省电力公司信息通信分公司 一种通信设备中板卡的保护方法和装置
WO2017174519A1 (en) * 2016-04-04 2017-10-12 Gemalto Sa Method, chip and system for detecting a failure or a drop in a pdp context or an eps pdn connection

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
QIANG YE等: ""Switch Design and Implementation for network-on-chip"", 《2005 CONFERENCE ON HIGH DENSITY MICROSYSTEM DESIGN AND PACKAGING AND COMPONENT》 *
金平: ""分布式***业务通道检测的研究与实现"", 《东南大学》 *

Also Published As

Publication number Publication date
CN109936518B (zh) 2022-02-11

Similar Documents

Publication Publication Date Title
US7289436B2 (en) System and method for providing management of fabric links for a network element
EP1853003B1 (en) System and method for monitoring a data network segment
US7936767B2 (en) Systems and methods for monitoring high speed network traffic via sequentially multiplexed data streams
US20070180103A1 (en) Facilitating event management and analysis within a communications environment
US7843836B2 (en) Systems, methods and computer program products for controlling high speed network traffic in server blade environments
CN107547249A (zh) 链路切换方法、装置、sdn交换机、控制器及存储介质
CN102111310A (zh) Cdn设备状态监控方法和***
EP1333615A2 (en) System and method of identifying a faulty component in a network element
US20110173504A1 (en) Communication system, a communication method and a program thereof
US20120051263A1 (en) Network System, Network Management Server, and OAM Test Method
CN102761479A (zh) 链路选择方法和装置
CN101299685B (zh) 交换网测试方法和***以及测试发起模块
CN103684818A (zh) 检测网络通道故障的方法及装置
CN108632099A (zh) 一种链路聚合的故障检测方法及装置
CN101378333A (zh) 实现连续性检查消息报文收发的***、装置及方法
JP5531831B2 (ja) 通信装置、及び通信方法
US9712395B2 (en) Method for the exchange of data between nodes of a server cluster, and server cluster implementing said method
US20100246425A1 (en) Packet processing apparatus, interface unit and method thereof
CN108400900A (zh) 报文检测、配置、转发、统计方法及设备、控制器和***
CN109936518A (zh) 交换芯片通道故障的检测方法和分布式机架交换机
CN114205263B (zh) 用于Ether CAT网络的通信方法、***和存储介质
CN110351148A (zh) 一种网络三层转发路径诊断方法和***
US20170026278A1 (en) Communication apparatus, control apparatus, and communication system
JP5659869B2 (ja) ネットワーク管理装置及び方法
JP2017034403A (ja) サービス影響原因推定装置、サービス影響原因推定プログラム、及びサービス影響原因推定方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant