CN101277196A - 一种基于pcie交换网的通信***、通信方法及线卡板 - Google Patents

一种基于pcie交换网的通信***、通信方法及线卡板 Download PDF

Info

Publication number
CN101277196A
CN101277196A CNA2007100909940A CN200710090994A CN101277196A CN 101277196 A CN101277196 A CN 101277196A CN A2007100909940 A CNA2007100909940 A CN A2007100909940A CN 200710090994 A CN200710090994 A CN 200710090994A CN 101277196 A CN101277196 A CN 101277196A
Authority
CN
China
Prior art keywords
pcie
message
control device
card board
cable card
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2007100909940A
Other languages
English (en)
Other versions
CN101277196B (zh
Inventor
杨武
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New H3C Technologies Co Ltd
Original Assignee
Hangzhou H3C Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou H3C Technologies Co Ltd filed Critical Hangzhou H3C Technologies Co Ltd
Priority to CN2007100909940A priority Critical patent/CN101277196B/zh
Priority to PCT/CN2007/070413 priority patent/WO2008119221A1/zh
Publication of CN101277196A publication Critical patent/CN101277196A/zh
Application granted granted Critical
Publication of CN101277196B publication Critical patent/CN101277196B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Small-Scale Networks (AREA)

Abstract

本发明提供了一种基于PCIE交换网的通信***,包括:主控板、线卡板和PCIE交换设备,所述线卡板包括控制装置和适配装置;所述适配装置,将来自本线卡板控制装置的报文转换为PCIE报文,通过所述PCIE交换设备发送到主控板或其它线卡板;并接收主控板或其它线卡板通过所述PCIE交换设备发送来的PCIE报文,转换为所述控制装置适配的报文发送给所述控制装置。本发明还提供了一种基于PCIE交换网的通信方法及线卡板。本发明的实施例中,在如网关、路由器等通信设备的PCIE交换器和线卡板控制装置之间增加一个适配装置,实现控制装置的接口总线和PCIE总线的适配,使PCIE总线对于线卡板的控制装置是透明的。

Description

一种基于PCIE交换网的通信***、通信方法及线卡板
技术领域
本发明涉及网络交换技术领域,尤其涉及一种基于PCIE交换网的通信***、通信方法及线卡板。
背景技术
随着PCIE(PCI Express,PCI扩展)规范的发布,越来越多的厂家开始推出基于PCI(Peripheral Component Interconnect,外设部件互连)Express规范的芯片,例如:基于PCIE的交换器;及路由器、交换机、网关等基于PCIE交换器的通信设备。
参考图1,为现有技术中基于PCIE交换器的分布式***架构,主控板和线卡板之间通过PCIE总线实现数据承载平面。PCIE交换器提供多个PCIE接口连接到主控板和线卡板,主控板CPU(Central Processor Unit,中央处理器)完成PCIE交换器的配置和线卡板的PCIE终端空间的配置,确保不同的线卡板可以通过PCIE交换网进行数据通信,线卡板报文处理引擎可以采用CPU、NP(Networks Processor Unit,网络处理器)或ASIC(Application Specific IntegratedCircuit,专用集成电路)等。
由于PCIE规范为新发布的规范,业界基于PCIE接口的芯片大多是计算机***使用,基于通信设备的芯片还是比较少,尤其是高性能的基于PCIE接口的CPU、NP、ASIC芯片更少,即使有些芯片带PCIE接口,但性能不能满足需求或者其他接口不能满足通信设备的需求。
发明内容
本发明实施例提供一种基于PCIE交换网的通信***、通信方法及线卡板,以解决现有技术的通信设备不易兼容PCIE的缺陷。
为达到上述目的,本发明实施例提供了一种基于PCIE交换网的通信***,包括:主控板、线卡板和PCIE交换设备,所述线卡板包括控制装置和适配装置;
所述适配装置,将来自本线卡板控制装置的报文转换为PCIE报文,通过所述PCIE交换设备将PCIE报文发送到主控板或其它线卡板;并接收主控板或其它线卡板通过所述PCIE交换设备发送来的PCIE报文,将PCIE报文转换为所述控制装置适配的报文发送给所述控制装置。
所述适配装置包括上行适配单元和下行适配单元,
所述上行适配单元,将来自本线卡板控制装置的报文转换为PCIE报文,通过所述PCIE交换设备发送到主控板或其它线卡板;
所述下行适配单元,接收主控板或其它线卡板通过所述PCIE交换设备发送来的PCIE报文,转换为所述控制装置适配的报文发送给所述控制装置。
所述上行适配单元具体包括:
拆分子单元,用于将所述控制装置发来的报文拆分成多个PCIE标准长度的报文;
PCIE头封装子单元,分别将所述多个PCIE特定长度的报文加PCIE报文头,生成一组PCIE报文,发送到PCIE交换设备。
所述上行适配单元还包括目标线卡板地址获取子单元,从所述控制装置发送的报文中获取目标线卡板地址,通过所述PCIE头封装子单元封装在PCIE报文头中。
所述下行适配单元具体包括:
PCIE头解封装子单元,将来自PCIE交换设备的PCIE报文去掉PCIE报文头,获得一组PCIE报文;
组帧子单元,将所述PCIE报文组装成适配所述控制装置的报文发送给所述控制装置。
所述下行适配单元还包括组帧检测子单元,用于检测从PCIE交换设备发来的PCIE报文是否为一组完整报文。
所述主控板中包括带PCIE接口的控制装置,或不带PCIE接口的控制装置加带PCIE接口的北桥芯片。
所述适配装置与所述控制装置集成一体或分离。
本发明实施例还提供了一种基于PCIE交换网的线卡板,包括控制装置和适配装置;
所述适配装置,将来自本线卡板控制装置的报文转换为PCIE报文,通过所述PCIE交换设备将所述PCIE报文发送到主控板或其它线卡板;并接收主控板或其它线卡板通过所述PCIE交换设备发送来的PCIE报文,将所述PCIE报文转换为所述控制装置适配的报文发送给所述控制装置。
所述适配装置包括上行适配单元和下行适配单元,
所述上行适配单元,将来自本线卡板控制装置的报文转换为PCIE报文,通过所述PCIE交换设备发送到主控板或其它线卡板;
所述下行适配单元,接收主控板或其它线卡板通过所述PCIE交换设备发送来的PCIE报文,转换为所述控制装置适配的报文发送给所述控制装置。
所述上行适配单元具体包括:
拆分子单元,用于将所述控制装置发来的报文拆分成多个PCIE特定长度的报文;
PCIE头封装子单元,分别将所述多个PCIE特定长度的报文加PCIE报文头,生成一组PCIE报文,发送到PCIE交换设备。
所述上行适配单元还包括目标线卡板地址获取子单元,接收所述控制装置发送给所述适配装置的携带目标线卡板的地址信息的报文,并从所述报文中获取目标线卡板地址,通过所述PCIE头封装子单元封装在PCIE报文头中。
所述上行适配单元还包括优先级分类单元,所述控制装置发送给所述适配装置的报文中还携带优先级信息,所述优先级分类单元通过所述优先级信息确定所述报文的优先级级别,将相应优先级标识通过所述PCIE头封装子单元封装到所述PCIE报文头中。
所述目标线卡板地址获取子单元获取所述地址信息或所述优先级分类单元获取优先级信息后,将所述报文中的所述地址信息或优先级信息删除。
所述下行适配单元具体包括:
PCIE头解封装子单元,将来自PCIE交换设备的PCIE报文去掉PCIE报文头,获得一组PCIE报文;
组帧子单元,将所述PCIE报文组装成适配所述控制装置的报文发送给所述控制装置。
所述下行适配单元还包括组帧检测子单元,用于检测从PCIE交换设备发来的PCIE报文是否为一组完整报文。
所述检测条件包括:PCIE报文头中地址不连续、报文长度小于特定长度或预设时间内没有收到下一个报文。
所述下行适配单元还包括多个队列子单元,分别存储来自其它线卡板和主控板的PCIE报文。
本发明实施例还提供了一种基于PCIE交换网的通信方法,包括:
将来自本线卡板控制装置的报文转换为PCIE报文,通过所述PCIE交换设备发送到主控板或其它线卡板;
并接收主控板或其它线卡板通过所述PCIE交换设备发送来的PCIE报文,转换为所述控制装置适配的报文发送给所述控制装置。
将所述控制装置发来的报文拆分成多个PCIE特定长度的报文;分别将所述多个PCIE特定长度的报文加PCIE报文头,生成一组PCIE报文,发送到PCIE交换设备;
将来自PCIE交换设备的PCIE报文去掉PCIE报文头,获得一组特定长度的PCIE报文;然后将所述PCIE报文组装成适配所述控制装置的报文发送给所述控制装置。
从所述控制装置发送的报文中获取目标线卡板地址,通过所述PCIE头封装子单元封装在PCIE报文头中。
从所述控制装置发送的报文中获取优先级信息,确定所述报文的优先级级别,将对应的优先级标识通过所述PCIE头封装子单元封装到所述PCIE报文头中。
所述将来自PCIE交换设备的PCIE报文去掉PCIE报文头之前还包括:检测从PCIE交换设备发来的PCIE报文是否为一组完整报文,其中,所述检测条件包括:PCIE报文头中地址不连续、报文长度小于标准长度或预设时间内没有收到下一个报文。
所述将来自PCIE交换设备的PCIE报文去掉PCIE报文头之前还包括:将来自其它线卡板和主控板的PCIE报文分别存储到不同的队列中。
与现有技术相比,本发明实施例具有以下优点:
本发明的实施例中,在如网关、路由器等通信设备的PCIE交换器和线卡板控制装置之间增加一个适配装置,实现控制装置的接口总线和PCIE总线的适配,使PCIE总线对于线卡板的控制装置是透明的。
附图说明
图1是现有技术中基于PCIE交换网的结构图;
图2是本发明实施例一种基于PCIE总线和以太网的分布式交换网通信***结构图;
图3是本发明实施例中一种主控板结构图;
图4是本发明实施例中一种线卡板中的控制装置不携带PCIE接口功能的通信***结构图;
图5是本发明图4实施例中线卡板的数据转发流程图;
图6是本发明图4实施例中适配装置结构图;
图7是本发明图4实施例中控制装置发送报文格式结构图;
图8是本发明图4实施例中对来源不同报文进入不同队列示意图;
图9是本发明图4实施例报文转换示意图;
图10是本发明图4实施例中PCIE报文格式图;
图11是本发明图4实施例中另一种基于PCIE交换网的通信***总线适配图。
具体实施方式
本发明实施例提供了一种基于PCI Express(简称PCIE)总线和以太网的分布式交换网通信***,如图2所示,包括:主控板、线卡板和交换设备,其中,交换设备包括PCIE交换单元和以太网交换单元。PCIE交换单元提供多个PCIE接口连接到主控板和线卡板的控制单元,主控板的控制单元通过PCIE总线对PCIE交换单元和线卡板的PCIE的空间进行配置;以太网交换单元提供多个以太网接口,连接到主控板和线卡板的控制单元,主控板的控制单元通过以太网接口和线卡板的控制单元通信,对线卡板路由地址信息进行配置,确保不同的线卡板可以通过PCIE交换单元进行通信。其中,主控板的控制单元为CPU,业务板的控制单元为CPU或NP或ASIC。
正常情况下,由以太网交换单元构成的控制平面主要是完成线卡板的配置、路由转发表的维护、管理等功能,不进行数据报文转发,需要的带宽比较小,一般中高端通信设备使用千兆以太网就可以满足,也可以采用快速以太网或万兆以太网等代替千兆以太网。PCIE交换单元承载数据平面信息,在主控板对PCIE交换单元和线卡板的PCIE总线的空间配置后,各个线卡板直接通过PCIE交换单元完成数据的转发,无需通过主控板,这种分布式的转发使主控板只做控制平面的业务,从而保证***高效、可靠运行,尤其使用两个主控板互相作为备份后,***的可靠性进一步得到加强。
PCIE交换单元和以太网交换单元连接到所有的线卡板和主控板,正常情况下,通过PCIE交换单元进行数据转发,以太网交换单元进行控制通道信息转发;当PCIE交换单元因出现故障不能使用时,以太网交换单元(此时采用万兆以太网交换单元尤佳)可以承载所有的数据平面和控制平面的数据,而且数据平面的转发仍然可以做到分布式转发;当以太网交换芯片不能使用时,PCIE交换单元可以承载所有的数据平面和控制平面的业务;为了保证实现的可靠性,防止数据平面业务拥塞了控制平面数据,这些种情况下,可以限制数据平面流量。
本发明实施例中,PCIE交换单元可以提供多个独立的PCIE串行总线,这些独立的串行总线既可以独立成为一个PCIE线路,也可以多个线路捆绑在一个逻辑串行线路上,每个线卡板通过一个逻辑串行线路与交换单元连接。为了满足转发性能,捆绑线路的数据依据***需要提供的带宽决定,如PCIExpress 1.0规范中,1个通道可以支持2.5Gbps,4个通道可以支持10Gbps,16个通道可以支持40Gbps的带宽;如PCIE2.0规范中,1个通道可以支持5Gbps,4个通道可以支持20Gbps的带宽,逻辑串行线路可以依据用户的需求进行设计。
本发明实施例中,主控板如图3所示,包括:控制单元、RAM(Random-Access Memory,随机存取存储器)和FLASH(闪存),其中,控制单元进一步包括CPU、PCIE根联合体子单元和以太网媒体控制子单元。PCIE根联合体(PCI Express Root complex)单元,提供PCIE总线接口;以太网媒体控制单元实现千兆以太网接口,用于提供以太网交换接口。CPU通过PCIE根联合体子单元及PCIE交换单元对线卡板数据平面配置;通过以太网媒体控制单元及以太网交换单元实现对线卡板控制平面配置。上述控制单元可以用带以太网接口功能和PCIE接口功能的SoC(System on Chip)处理器实现,当然SoC处理器也可以不带PCIE总线接口和以太网接口,可以与提供PCIE总线和以太网接口的外置北桥设备组合实现。但一般情况下集成PCIE根联合体功能和以太网媒体控制接口功能的SoC芯片更便宜,性价比更优,但处理效率相对低些。
本发明实施例中,线卡板采用NP、ASIC、CPU或者多核CPU作为控制单元时,整个***能达到很高的性能。因此,线卡板进一步包括:控制单元、RAM和FLASH,其中,控制单元具体包括:CPU、PCIE终端、以太网媒体控制子单元和对外接口子单元;CPU控制PCIE终端与主控板的PCIE根联合体子单元通信;并控制以太网媒体控制子单元通过以太网交换单元与主控板进行控制平面通信;并控制对外接口子单元与外部通信。
如果上述实施例中的CPU、NP和ASIC等都不支持PCIE接口功能,则可以通过在线卡板上增加适配装置,达到在线卡板上使用不支持PCIE接口功能的CPU、NP和ASIC等控制装置,即PCIE终端置于控制装置的外部。该种基于PCIE交换网的通信***,如图4,包括:主控板、线卡板和PCIE交换设备,该PCIE交换设备为图2中只有PCIE交换单元的交换设备,线卡板包括控制装置和适配装置,线卡板的控制装置可以为CPU、NP或ASIC芯片,芯片不提供PCIE总线接口,例如线卡板控制装置的接口为SPI4(System Packet Interface Level 4,***包接口第4级)、XGMII(10G Media Independent Interface,10G介质无关接口)等总线,可以通过适配装置完成控制装置到PCIE总线适配。主控板中的控制装置可以是提供PCIE总线接口的CPU(Central Processor Unit,中央处理单元),也可以是不提供PCIE总线接口的CPU,当使用不提供PCIE总线接口的CPU时,***性能比提供PCIE总线接口的CPU时好,但需要增加适配装置。适配装置可以由FPGA、ASIC或其它软件程序或硬件电路实现,即通过CPU+北桥的方式实现。
图4中线卡板的数据转发过程如图5所示,线卡板的控制装置接收到报文后,查找转发表,增加目标线卡板地址信息和报文优先级信息在当前报文的前面,构成新的报文通过SPI4、XGMII等接口发送到线卡板的适配装置,适配装置从接收到的报文中提取目标线卡板地址信息和报文优先级信息后,删除掉被线卡板控制装置增加的信息,拆分为特定长度的报文,并依据提取的目标线卡板地址信息和报文优先级等信息组成PCIE头信息,加在报文前面,封装为PCIE报文,通过PCIE交换设备发送到另外一个线卡板,该另一线卡板适配装置接收到PCIE报文后,去掉PCIE头信息,再经过组帧,提取出来原来的报文,通过SPI4、XGMII等接口转发给该另一线卡板的控制装置,而后将报文转发出去。对于线卡板控制装置,发送出去是SPI4/XGMII报文,接收到也是SPI4/XGMII报文,PCIE就像一个隧道,线卡板的控制装置不关心PCIE交换设备如何实现流量控制、服务质量保证等。
适配装置结构如图6所示,具体包括上行适配单元和下行适配单元。上行适配单元,将来自本线卡板控制装置的报文转换为PCIE报文,通过PCIE交换设备发送到主控板或其它线卡板;下行适配单元,接收主控板或其它线卡板通过PCIE交换设备发送来的PCIE报文,转换为控制装置适配的报文发送给控制装置。
其中,上行适配单元具体包括:物理层和链路层接收子单元1、拆分子单元、PCIE头封装子单元及物理层和链路层发送子单元2;其中,物理层和链路层接收子单元1,处理控制装置发送出来的报文的物理层和链路层,不同的控制装置接口需要不同的物理层和链路层处理子单元,如控制装置是SPI4接口,则此物理层和链路层接收处理子单元1完成SPI4报文的识别,提取协议层报文;如果控制装置是XGMII接口,则物理层和链路层接收子单元1完成10GE以太网报文的物理层和链路层处理。拆分子单元用于将报文拆分成多个PCIE标准长度的报文。PCIE头封装子单元,分别将多个PCIE特定长度的报文加PCIE报文头,生成一组PCIE报文。物理层和链路层发送子单元2处理PCIE接口的物理层和链路层处理,并实现PCIE终端功能,将PCIE报文发送到PCIE交换设备。
下行适配单元具体包括:物理层和链路层发送子单元1、组帧子单元、PCIE头解封装子单元及物理层和链路层接收子单元2。物理层和链路层发送子单元1完成协议层报文的物理层和链路层封装,发送到控制装置的SPI4接口;PCIE头解封装子单元,将来自PCIE交换设备的PCIE报文去掉PCIE报文头,获得一组标准长度的PCIE报文;组帧子单元,将所述PCIE报文组装成适配所述控制装置的报文,即依据携带在PCIE报文头中的源ID(由发送端的总线号、设备号、功能号组成)信息和地址信息重组报文。物理层和链路层接收子单元2处理PCIE接口的物理层和链路层,并实现PCIE终端功能,将适配所述控制装置的报文发送给该控制装置。
上行适配单元还包括目标线卡板地址获取子单元,从所述控制装置发送的报文中获取目标线卡板地址,通过所述PCIE头封装子单元封装在PCIE报文头中。由于适配装置不识别控制装置发送的报文,为了满足PCIE报文正确在交换网转发,要求在控制装置发送报文头上携带一个目的地址,如图7中所示报文头部增加了PCIE地址头和保留字节,此目的地址为基于PCIE交换设备分配给目标线卡板的地址(即把PCIE的地址信息携带在控制装置发送的报文中,这个报文是非PCIE报文,本文中把地址信息放置到报文头部,任何调整地址位置,或者不违背这个原则的改动都是本专利保护的范围),以便封装在发送到PCIE交换设备的PCIE报文头中,线卡板报文头地址来自于***的控制平面。
上行适配单元还包括优先级分类单元,确定所述报文的优先级级别,将相应的优先级标识通过所述PCIE头封装子单元封装到所述PCIE报文头中。如图7中所示,保留字节是为了保证字节对齐和兼容以后扩充功能,如扩充QoS(Quality of Service,服务质量)功能,控制报文优先级等。如在扩充功能中定义报文的优先级,适配装置把这个优先级映射到PCIE报文头的TC(Traffic Class,流量分类),从而入交换网的不同虚拟通道VC(Virtual Channel,虚拟通道),实现分级分类处理不同线路板的不同的数据报文和业务报文,实现不同的QoS。
下行适配单元还包括组帧检测子单元,用于检测从PCIE交换设备发来的PCIE报文是否为一组完整报文。其中,检测条件包括:PCIE报文头中地址不连续、报文长度小于标准长度或预设时间内没有收到下一个报文。
为了保证组帧的正确性,要求来自同一个线卡板的报文在PCIE交换网中不能错乱顺序,接收线卡板需要识别来自交换设备的不同来源的报文,因此,接收线卡板下行适配单元要求包括多个队列,如图8所示,队列的数量要求不少于线卡板和主控板的数量减1,每一个队列对应一个源ID,当接收PCIE报文头中的Requester ID字段和该队列的源ID相同时,PCIE报文进入该队列,保证了组帧的完成。
本发明还提供了一种交换网通信实现方法,包括以下步骤:
步骤s101,主控板对PCIE交换单元和线卡板的PCIE总线进行空间配置。其中,PCIE交换单元提供多个PCIE接口连接到主控板和线卡板的控制单元,主控板的控制单元通过PCIE总线对PCIE交换单元和线卡板的PCIE的空间进行配置;主控板的控制单元通过以太网接口和线卡板的控制单元通信,对线卡板路由地址信息进行配置,确保不同的线卡板可以通过PCIE交换单元进行通信。其中,主控板的控制单元为CPU,业务板的控制单元为CPU或NP或ASIC。
另外,PCIE交换单元对于不同线路板的报文传输按照地址访问寻址方式,对于每个物理线路获得不少于一个VC和TC通道,最优的VC和TC的数量不少于***支持线卡板和主控板的数量;并通过设置VC、TC与不同物理通道的对应关系,或者与线卡板的映射关系,或者与数据报文的映射关系,实现分级分类处理不同线卡板的不同的数据报文和业务报文,实现不同的QoS。
步骤s102,线卡板通过PCIE交换单元进行数据平面通信。PCIE交换单元承载数据平面信息,在主控板对PCIE交换单元和线卡板的PCIE总线的空间配置后,各个线卡板直接通过PCIE交换单元完成数据的转发,无需通过主控板,这种分布式的转发使主控板只做控制平面的业务,从而保证***高效、可靠运行,尤其使用两个主控板互相作为备份后,***的可靠性进一步得到加强。
其中,线卡板进行数据平面通信可以分为两个方向,一个是上行方向:由线卡板向PCIE交换单元发送数据;另一个是下行方向,由线卡板接收来自PCIE交换单元的数据。在上行方向将来自本线卡板控制装置的报文转换为PCIE报文,通过PCIE交换单元发送到主控板或其它线卡板。具体包括:将控制装置发来的报文拆分成多个PCIE特定长度的报文,分别将多个PCIE报文加PCIE报文头,生成一组PCIE报文,发送到PCIE交换单元。PCIE报文头中包括控制装置发送的报文中携带的目标线卡板地址和优先级信息。
在下行方向接收主控板或其它线卡板通过PCIE交换单元发送来的PCIE报文,转换为控制装置适配的报文发送给控制装置。具体包括:将来自其它线卡板和主控板的PCIE报文分别存储到不同的队列中;将每个队列中来自PCIE交换单元的PCIE报文去掉PCIE报文头,获得一组标准长度的PCIE报文;然后将PCIE报文组装成适配控制装置的报文发送给控制装置。
由于PCIE标准规范规定,PCIE交换单元支持的最大报文长度为4K字节,报文长度从0到4K字节的范围内变动,报文突发变化比较大,对PCIE交换单元的冲击较大,很容易造成PCIE交换单元拥塞或效率低,因此,本发明实施例中要求适配装置对接收到的报文在进入PCIE交换单元之前进行拆分,如拆分为长度128字节或256字节等特定长度。拆分后的报文被添加了PCIE报文头,以便构成标准的PCIE报文,能在PCIE交换单元中被识别和转发。另外一方面,封装成PCIE报文被转发到另外一个线卡板时,此线卡板适配装置必须能识别PCIE报文,并对拆分的报文进行组帧,组帧成原来的报文到相应的控制装置中。
为了简化设计,同时为了降低总线适配器成本和满足业务处理的质量服务保证,本发明实施例简化了PCIE规范中定义的处理层数据报文路由方式,只需要支持存储器写方式,这种方式能保证PCIE带宽得到最优的利用率,并且对于不同的线路板的报文传输按照基于地址访问寻址方式。为了简化设计,对于控制装置发送出来的处理层数据报文不做任何识别,只需要把报文当作净荷(Payload)处理,至到转发到另外一个线卡板的控制装置,PCIE交换单元对于处理层报文就像一个隧道。
下面以切片长度为256字节为例对报文拆分、PCIE报文头封装过程,以及PCIE报文组帧过程进行说明,如图9所示。发送到PCIE交换单元的所有报文(除了切片的最后一个报文)的净荷都是256字节,PCIE报文头中包含的地址信息依次增加256,PCIE交换单元接收到PCIE报文后,依据报文的地址信息转发到相应的线卡板上,线卡板接收到报文后,依据报文PCIE报文头中携带的源ID(由发送端的总线号、设备号、功能号组成)入不同的队列。适配装置可以根据如下三种措施来判断是否一个完整的组帧:PCIE报文头中地址不是连续增加256时,为一个组帧报文结束;PCIE报文长度小于256字节时,为一个组帧报文结束;地址虽然连续,报文长度为256字节,但预定时间内没有接收到下一个报文,为一个组帧报文结束。
图10是PCIE标准规范定义的数据报文格式,图7和图9的地址信息对应图10的Address地址字段,Requester ID即为本端口的总线号、设备号、功能号组成的数据,以便在报文从PCIE交换单元出来,适配装置根据报文不同来源进入不同的队列,便于组帧。
更进一步,为了保证***的向后扩展性,保护用户的投资,本发明实施例中适配装置与控制装置可以集成一体或分离。当高性能的基于PCIE接口的控制装置出现时,在当前的线卡板中使用带PCIE接口的扩展控制装置。如图11左侧两个线卡板,通过使用带扩展的控制装置,可以兼容当前***,该两个线卡板中分别使用扩展的控制装置,该控制装置集成了本发明中的控制装置和适配装置的功能,支持PCIE终端的物理层和链路层协议、具有完成报文的切片和组帧功能,当此线卡板要发送报文时,控制装置把要发送的报文切割为256字节大小,封装PCIE报文头,并且同一个报文地址增加256,报文头中携带本单板的PCIE源ID信息。而原来的线卡板为XGMII接口的以太网报文进行拆分封装通过交换网发送过来,控制装置接收到报文后,依据PCIE报文头的地址和PCIE源ID信息,报文存储到不同的内存空间中,通过软件或者硬件完成报文的组帧。
另外,为了保证***的稳定性,当检测到数据通道发生故障时,通知主控板和线卡板将数据平面通信切换到以太网交换单元;检测到控制通道发生故障时,通知主控板和线卡板将控制平面通信切换到PCIE交换单元。
本发明实施例通过隧道技术简化PCIE总线设计,降低总线适配成本和提高整个交换网的QoS;并且通过在适配装置中实现线卡板报文拆分和组帧,并使拆分的报文完全嵌套在PCIE数据帧中,从而使线卡板的控制装置完全从PCIE协议中解放出来,提高了控制装置的利用率,并且拆分后的报文更有利于在PCIE交换网中传输,减少突发传输带宽,保证了交换网的稳定性,为服务质量保证服务提供了可靠的交换环境。
以上公开的仅为本发明的几个具体实施例,但是,本发明并非局限于此,任何本领域的技术人员能思之的变化都应落入本发明的保护范围。

Claims (24)

1. 一种基于PCIE交换网的通信***,包括:主控板、线卡板和PCIE交换设备,其特征在于,所述线卡板包括控制装置和适配装置;
所述适配装置,将来自本线卡板控制装置的报文转换为PCIE报文,通过所述PCIE交换设备将所述PCIE报文发送到主控板或其它线卡板;并接收主控板或其它线卡板通过所述PCIE交换设备发送来的PCIE报文,将所述PCIE报文转换为所述控制装置适配的报文发送给所述控制装置。
2. 如权利要求1所述基于PCIE交换网的通信***,其特征在于,所述适配装置包括上行适配单元和下行适配单元,
所述上行适配单元,将来自本线卡板控制装置的报文转换为PCIE报文,通过所述PCIE交换设备发送到主控板或其它线卡板;
所述下行适配单元,接收主控板或其它线卡板通过所述PCIE交换设备发送来的PCIE报文,转换为所述控制装置适配的报文发送给所述控制装置。
3. 如权利要求2所述基于PCIE交换网的通信***,其特征在于,所述上行适配单元具体包括:
拆分子单元,用于将所述控制装置发来的报文拆分成多个PCIE特定长度的报文;
PCIE头封装子单元,分别将所述多个PCIE特定长度的报文加PCIE报文头,生成一组PCIE报文,发送到PCIE交换设备。
4. 如权利要求3所述基于PCIE交换网的通信***,其特征在于,所述上行适配单元还包括目标线卡板地址获取子单元,接收所述控制装置发送给所述适配装置的携带目标线卡板的地址信息的报文,并从所述报文中获取目标线卡板地址,通过所述PCIE头封装子单元封装在PCIE报文头中。
5. 如权利要求2所述基于PCIE交换网的通信***,其特征在于,所述下行适配单元具体包括:
PCIE头解封装子单元,将来自PCIE交换设备的PCIE报文去掉PCIE报文头,获得一组PCIE报文;
组帧子单元,将所述PCIE报文组装成适配所述控制装置的报文发送给所述控制装置。
6. 如权利要求5所述基于PCIE交换网的通信***,其特征在于,所述下行适配单元还包括组帧检测子单元,用于检测从PCIE交换设备发来的PCIE报文是否为一组完整报文。
7. 如权利要求1至6中任一项所述基于PCIE交换网的通信***,其特征在于,所述主控板中包括带PCIE接口的控制装置,或不带PCIE接口的控制装置加带PCIE接口的北桥芯片。
8. 如权利要求1至6中任一项所述基于PCIE交换网的通信***,其特征在于,所述适配装置与所述控制装置集成一体或分离。
9. 一种基于PCIE交换网的线卡板,其特征在于,包括控制装置和适配装置;
所述适配装置,将来自本线卡板控制装置的报文转换为PCIE报文,通过所述PCIE交换设备将所述PCIE报文发送到主控板或其它线卡板;并接收主控板或其它线卡板通过所述PCIE交换设备发送来的PCIE报文,将所述PCIE报文转换为所述控制装置适配的报文发送给所述控制装置。
10. 如权利要求9所述基于PCIE交换网的线卡板,其特征在于,所述适配装置包括上行适配单元和下行适配单元,
所述上行适配单元,将来自本线卡板控制装置的报文转换为PCIE报文,通过所述PCIE交换设备发送到主控板或其它线卡板;
所述下行适配单元,接收主控板或其它线卡板通过所述PCIE交换设备发送来的PCIE报文,转换为所述控制装置适配的报文发送给所述控制装置。
11. 如权利要求10所述基于PCIE交换网的线卡板,其特征在于,所述上行适配单元具体包括:
拆分子单元,用于将所述控制装置发来的报文拆分成多个PCIE特定长度的报文;
PCIE头封装子单元,分别将所述多个PCIE特定长度的报文加PCIE报文头,生成一组PCIE报文,发送到PCIE交换设备。
12. 如权利要求11所述基于PCIE交换网的线卡板,其特征在于,所述上行适配单元还包括目标线卡板地址获取子单元,接收所述控制装置发送给所述适配装置的携带目标线卡板的地址信息的报文,并从所述报文中获取目标线卡板地址,通过所述PCIE头封装子单元封装在PCIE报文头中。
13. 如权利要求12所述基于PCIE交换网的线卡板,其特征在于,所述上行适配单元还包括优先级分类单元,所述控制装置发送给所述适配装置的报文中还携带优先级信息,所述优先级分类单元通过所述优先级信息确定所述报文的优先级级别,将相应优先级标识通过所述PCIE头封装子单元封装到所述PCIE报文头中。
14. 如权利要求13所述基于PCIE交换网的线卡板,其特征在于,所述目标线卡板地址获取子单元获取所述地址信息或所述优先级分类单元获取优先级信息后,将所述报文中的所述地址信息或优先级信息删除。
15. 如权利要求10所述基于PCIE交换网的线卡板,其特征在于,所述下行适配单元具体包括:
PCIE头解封装子单元,将来自PCIE交换设备的PCIE报文去掉PCIE报文头,获得一组PCIE报文;
组帧子单元,将所述PCIE报文组装成适配所述控制装置的报文发送给所述控制装置。
16. 如权利要求15所述基于PCIE交换网的线卡板,其特征在于,所述下行适配单元还包括组帧检测子单元,用于检测从PCIE交换设备发来的PCIE报文是否为一组完整报文。
17. 如权利要求16所述基于PCIE交换网的线卡板,其特征在于,所述检测条件包括:PCIE报文头中地址不连续、报文长度小于特定长度或预设时间内没有收到下一个报文。
18. 如权利要求15所述基于PCIE交换网的线卡板,其特征在于,所述下行适配单元还包括多个队列子单元,分别存储来自其它线卡板和主控板的PCIE报文。
19. 一种基于PCIE交换网的通信方法,其特征在于,包括:
将来自本线卡板控制装置的报文转换为PCIE报文,通过所述PCIE交换设备发送到主控板或其它线卡板;
并接收主控板或其它线卡板通过所述PCIE交换设备发送来的PCIE报文,转换为所述控制装置适配的报文发送给所述控制装置。
20. 如权利要求19所述基于PCIE交换网的通信方法,其特征在于,
将所述控制装置发来的报文拆分成多个PCIE特定长度的报文;分别将所述多个PCIE特定长度的报文加PCIE报文头,生成一组PCIE报文,发送到PCIE交换设备;
将来自PCIE交换设备的PCIE报文去掉PCIE报文头,获得一组PCIE报文;然后将所述PCIE报文组装成适配所述控制装置的报文发送给所述控制装置。
21. 如权利要求20所述基于PCIE交换网的通信方法,其特征在于,从所述控制装置发送的报文中获取目标线卡板地址,通过所述PCIE头封装子单元封装在PCIE报文头中。
22. 如权利要求20所述基于PCIE交换网的通信方法,其特征在于,从所述控制装置发送的报文中获取优先级信息,确定所述报文的优先级级别,将对应的优先级标识通过所述PCIE头封装子单元封装到所述PCIE报文头中。
23. 如权利要求20所述基于PCIE交换网的通信方法,其特征在于,所述将来自PCIE交换设备的PCIE报文去掉PCIE报文头之前还包括:检测从PCIE交换设备发来的PCIE报文是否为一组完整报文,其中,所述检测条件包括:PCIE报文头中地址不连续、报文长度小于特定长度或预设时间内没有收到下一个报文。
24. 如权利要求20所述基于PCIE交换网的通信方法,其特征在于,所述将来自PCIE交换设备的PCIE报文去掉PCIE报文头之前还包括:将来自其它线卡板和主控板的PCIE报文分别存储到不同的队列中。
CN2007100909940A 2007-03-30 2007-03-30 一种基于pcie交换网的通信***、通信方法及线卡板 Expired - Fee Related CN101277196B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN2007100909940A CN101277196B (zh) 2007-03-30 2007-03-30 一种基于pcie交换网的通信***、通信方法及线卡板
PCT/CN2007/070413 WO2008119221A1 (fr) 2007-03-30 2007-08-03 Procédé d'échange de paquets de données, dispositif et carte de circuits imprimés

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2007100909940A CN101277196B (zh) 2007-03-30 2007-03-30 一种基于pcie交换网的通信***、通信方法及线卡板

Publications (2)

Publication Number Publication Date
CN101277196A true CN101277196A (zh) 2008-10-01
CN101277196B CN101277196B (zh) 2011-09-28

Family

ID=39996236

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007100909940A Expired - Fee Related CN101277196B (zh) 2007-03-30 2007-03-30 一种基于pcie交换网的通信***、通信方法及线卡板

Country Status (1)

Country Link
CN (1) CN101277196B (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101150527B (zh) * 2007-11-09 2010-09-01 杭州华三通信技术有限公司 一种pcie数据传输的方法、***及设备
CN101895398A (zh) * 2010-07-15 2010-11-24 华为技术有限公司 数据通信方法和装置
WO2011157138A2 (zh) * 2011-05-31 2011-12-22 华为技术有限公司 多核路由器
CN101604284B (zh) * 2009-07-24 2012-05-23 杭州华三通信技术有限公司 一种保存启动信息的方法及多单板设备
CN102495920A (zh) * 2011-11-21 2012-06-13 南京中兴特种软件有限责任公司 一种FPGA用基于PCIe的集成化逻辑分析模块
CN102821082A (zh) * 2011-06-10 2012-12-12 成都市华为赛门铁克科技有限公司 一种数据传输方法、装置和***
CN102870381A (zh) * 2012-06-29 2013-01-09 华为技术有限公司 一种pcie交换***、装置及交换方法
CN103023824A (zh) * 2012-12-11 2013-04-03 华为技术有限公司 基于周边组件接口快速通道PCIe的数据传输***及方法
CN106559255A (zh) * 2015-09-30 2017-04-05 联发科技股份有限公司 电路模块及与另一装置通信的方法
CN107547450A (zh) * 2017-07-28 2018-01-05 新华三技术有限公司 一种板间数据添加方法与装置
CN109347818A (zh) * 2018-10-12 2019-02-15 华东师范大学 一种协议可重构万兆通信的文件传输***
CN115617733A (zh) * 2022-12-19 2023-01-17 井芯微电子技术(天津)有限公司 RapidIO网络报文转换方法、***及设备

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100428684C (zh) * 2003-08-18 2008-10-22 华为技术有限公司 带外通道方法
CN1307560C (zh) * 2004-03-25 2007-03-28 威盛电子股份有限公司 数据撷取方法及***

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101150527B (zh) * 2007-11-09 2010-09-01 杭州华三通信技术有限公司 一种pcie数据传输的方法、***及设备
CN101604284B (zh) * 2009-07-24 2012-05-23 杭州华三通信技术有限公司 一种保存启动信息的方法及多单板设备
CN101895398A (zh) * 2010-07-15 2010-11-24 华为技术有限公司 数据通信方法和装置
CN101895398B (zh) * 2010-07-15 2012-07-25 华为技术有限公司 数据通信方法和装置
US8891526B2 (en) 2010-07-15 2014-11-18 Huawei Technologies Co., Ltd. Data communication method and data communication apparatus
WO2011157138A2 (zh) * 2011-05-31 2011-12-22 华为技术有限公司 多核路由器
WO2011157138A3 (zh) * 2011-05-31 2012-04-26 华为技术有限公司 多核路由器
CN102821082A (zh) * 2011-06-10 2012-12-12 成都市华为赛门铁克科技有限公司 一种数据传输方法、装置和***
CN102495920A (zh) * 2011-11-21 2012-06-13 南京中兴特种软件有限责任公司 一种FPGA用基于PCIe的集成化逻辑分析模块
CN102495920B (zh) * 2011-11-21 2014-06-25 南京中新赛克科技有限责任公司 一种FPGA用基于PCIe的集成化逻辑分析模块
WO2014000271A1 (zh) * 2012-06-29 2014-01-03 华为技术有限公司 一种pcie交换***、装置及交换方法
CN102870381A (zh) * 2012-06-29 2013-01-09 华为技术有限公司 一种pcie交换***、装置及交换方法
CN102870381B (zh) * 2012-06-29 2015-09-09 华为技术有限公司 一种pcie交换***、装置及交换方法
WO2014089980A1 (zh) * 2012-12-11 2014-06-19 华为技术有限公司 基于PCIe的数据传输***及方法
CN103023824A (zh) * 2012-12-11 2013-04-03 华为技术有限公司 基于周边组件接口快速通道PCIe的数据传输***及方法
CN103023824B (zh) * 2012-12-11 2015-08-26 华为技术有限公司 基于周边组件接口快速通道PCIe的数据传输***及方法
US9632963B2 (en) 2012-12-11 2017-04-25 Huawei Technologies Co., Ltd. System and method for transmitting data based on PCIe
CN106559255A (zh) * 2015-09-30 2017-04-05 联发科技股份有限公司 电路模块及与另一装置通信的方法
CN107547450A (zh) * 2017-07-28 2018-01-05 新华三技术有限公司 一种板间数据添加方法与装置
CN107547450B (zh) * 2017-07-28 2020-04-17 新华三技术有限公司 一种板间数据添加方法与装置
CN109347818A (zh) * 2018-10-12 2019-02-15 华东师范大学 一种协议可重构万兆通信的文件传输***
CN115617733A (zh) * 2022-12-19 2023-01-17 井芯微电子技术(天津)有限公司 RapidIO网络报文转换方法、***及设备

Also Published As

Publication number Publication date
CN101277196B (zh) 2011-09-28

Similar Documents

Publication Publication Date Title
CN101277195B (zh) 一种交换网通信***、实现方法及交换装置
CN101277196B (zh) 一种基于pcie交换网的通信***、通信方法及线卡板
CN101252537B (zh) 一种交换网通信***、方法和主控板
JP4040762B2 (ja) 媒体アクセスコントローラからのパケットデータを伝送するための方法および装置
US7042891B2 (en) Dynamic selection of lowest latency path in a network switch
EP1454440B1 (en) Method and apparatus for providing optimized high speed link utilization
US20020118692A1 (en) Ensuring proper packet ordering in a cut-through and early-forwarding network switch
EP1891778B1 (en) Electronic device and method of communication resource allocation.
US7324537B2 (en) Switching device with asymmetric port speeds
JP2004215267A (ja) イーサネットインターフェースとatmインターフェース間のシングル/マルチチャネルコンバータ/ブリッジとその操作方法
JP2000503828A (ja) データネットワーク上でデータパケットをスイッチングする方法および装置
EP0685951B1 (en) Line interface devices for fast-packet networks
KR20070069822A (ko) 가변 길이 데이터 패킷의 이종 네트워크 스위칭을 위한시스템 및 방법
JP2016501475A (ja) 受動相互接続及び分散型スイッチレススイッチングを行うルータ
JP2016501474A (ja) 分散型スイッチレス相互接続
CN1747606B (zh) 业务数据传输方法及装置
US9036640B2 (en) Encapsulation of data
US6330248B1 (en) Arrangement for transmitting data packets from a media access controller across multiple physical links
US9277300B2 (en) Passive connectivity optical module
US7164698B1 (en) High-speed line interface for networking devices
US8131854B2 (en) Interfacing with streams of differing speeds
US7042845B1 (en) System and method for time division multiplexed switching of data using a high-speed packet switch
WO2018196833A1 (zh) 报文发送方法和报文接收方法及装置
JP2009218940A (ja) 伝送装置
KR100334417B1 (ko) 점대점 구조를 갖는 백 플랜 시스템

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: 310052 Binjiang District Changhe Road, Zhejiang, China, No. 466, No.

Patentee after: Xinhua three Technology Co., Ltd.

Address before: 310053 Hangzhou hi tech Industrial Development Zone, Zhejiang province science and Technology Industrial Park, No. 310 and No. six road, HUAWEI, Hangzhou production base

Patentee before: Huasan Communication Technology Co., Ltd.

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110928

Termination date: 20200330