WO2014180446A1

WO2014180446A1 - 一种网络设备写表方法及装置

Info

Publication number: WO2014180446A1
Application number: PCT/CN2014/079890
Authority: WO
Inventors: 姜海明; 王治春
Original assignee: 中兴通讯股份有限公司
Priority date: 2013-12-23
Filing date: 2014-06-13
Publication date: 2014-11-13
Also published as: CN104731711A

Abstract

公开了一种网络设备写表方法及装置。其中，该方法包括：内核空间预先申请内存，将内核空间内存映射到用户空间，得到用户空间内存地址；用户空间向内核空间申请内核空间内存，得到对应的用户空间内存地址；将用户空间内存地址和消息大小记录在buffer描述符中传递给内核空间；内核空间将用户空间内存地址转换为内核空间内存地址，通过DMA控制器将消息写入芯片。解决了相关技术中网络设备写表方法对CPU的负担较大的问题，内核驱动和芯片之间的消息传递采用DMA机制，减少了CPU的负担。在网络设备驱动层面大量发送写表消息的应用中，可以极大提高写表性能，有效改进Linux下设备驱动的写表效率。

Description

一种网络设备写表方法及装置技术领域本发明涉及通信领域，特别是涉及一种网络设备写表方法及装置。背景技术现今网络发展速度惊人，网络流量的增长及新业务的出现，需要网络设备具有线速和灵活的处理能力。目前网络芯片包括集成电路（Application Specific Integrated Circuit, 简称为 ASIC) 和 P (网络处理器）两大类。网络芯片***接口非常丰富，如静态随机存储器（Static RAM, 简称为 SRAM)、三态内容寻址存储器（ternary content addressable memory, 简称为 TCAM)、同步动态随机存储器（Synchronous Dynamic Random Access Memory, 简称为 SDRAM) 等，这些存储器存放着各种业务表项，如端口表、介质访问控制（medium access control, 简称为 MAC) 表、路由表等；另外，芯片内部包括大量的寄存器。网络设备运行过程中，控制层软件会频繁的与芯片进行交互，比如下发业务配置等。对芯片而言，主要就是读写芯片存储器和内部寄存器。目前很多网络设备表项、寄存器配置是通过 CPU (中央处理器）与芯片进行消息交互实现的。目前 Linux操作***广泛应用于网络设备驱动中， Linux***分为用户态和内核态两个层面。芯片驱动层次如图 1所示的 Linux***设备驱动软件层次示意图，目前网络设备驱动发送消息的通常做法是用户态申请内存并将消息填充到用户态内存中，由于实际与芯片交互的是内核层，因此必须将消息从用户态的内存拷贝到内核态的内存中，然后从内核态的内存通过总线写入硬件芯片中。由于网络交换设备中消息交互非常频繁，极限情况每秒钟可能有上万条消息发送，因此这涉及了大量的内存申请，以及用户态、内核态的拷贝操作。这对网络设备的 CPU 是一个很大的负担，影响了网络设备的写表效率。针对相关技术中网络设备写表方法对 CPU的负担较大的问题，目前尚未提出有效的解决方案。发明内容针对相关技术中网络设备写表方法对 CPU的负担较大的问题，本发明实施例提供了一种网络设备写表方法及装置，用以解决上述技术问题。根据本发明的一个方面，本发明实施例提供了一种网络设备写表方法，其中，该方法包括：内核空间预先申请内存，将内核空间内存映射到用户空间，得到用户空间内存地址；上述用户空间向上述内核空间申请上述内核空间内存，得到对应的用户空间内存地址；将上述用户空间内存地址和消息大小记录在缓冲区 buffer描述符中传递给上述内核空间；上述内核空间将上述用户空间内存地址转换为内核空间内存地址，通过直接内存存取（Direct Memory Access, 简称为 DMA) 控制器将消息写入芯片。优选地，内核空间将内核空间内存映射到用户空间，得到用户空间内存地址之后，上述方法还包括：内核空间根据上述用户空间内存地址，计算上述用户空间内存地址相对于内核空间内存地址的偏移量；其中，上述偏移量 =内核空间内存地址一用户空间内存地址。优选地，用户空间向内核空间申请上述内核空间内存，得到上述用户空间内存地址，包括：用户空间向内核空间申请内核空间内存，得到其内核空间内存地址；用户空间根据上述偏移量和上述内核空间内存地址，计算得到用户空间内存地址。优选地，内核空间通过上述 DMA控制器将消息写入芯片，包括：内核空间将上述内核空间内存地址和上述消息大小，传递给上述 DMA控制器，内核空间的驱动通过上述 DMA控制器将消息写入芯片。优选地，用户空间将待释放的用户空间内存地址，记录到上述 buffer描述符中传递给内核空间；内核空间根据上述偏移量和上述用户空间内存地址，计算得到内核空间内存地址；内核空间将上述内核空间内存地址传递给内核空间的驱动；内核空间的驱动释放上述 buffer描述符。优选地，内核空间将上述内核空间内存映射到用户空间，包括：内核空间将上述内核空间内存，通过 mmap映射到用户空间。根据本发明的另一方面，本发明实施例还提供了一种网络设备写表装置，应用于内核空间，其中，该装置包括：内存申请模块，设置为预先申请内存，将内核空间内存映射到用户空间，得到用户空间内存地址；消息写入模块，设置为在接收到用户空间传递的用户空间内存地址后，将上述用户空间内存地址转换为内核空间内存地址，通过直接内存存取 DMA控制器将消息写入芯片。优选地，上述装置还包括：释放模块，设置为根据用户空间通过缓冲区 buffer描述符传递的用户空间内存地址，得到内核空间内存地址；将该内核空间内存地址传递给内核空间的驱动，以使上述驱动释放上述 buffer描述符。根据本发明的又一方面，本发明实施例还提供了一种网络设备写表装置，应用于用户空间，其中，该装置包括：申请内存模块，设置为向内核空间申请内核空间内存，得到对应的用户空间内存地址；描述符传递模块，设置为将上述用户空间内存地址和消息大小记录在缓冲区 buffer描述符中传递给内核空间。优选地，上述申请内存模块包括：第一处理单元，设置为向内核空间申请内核空间内存，得到其内核空间内存地址；第二处理单元，设置为根据偏移量和上述内核空间内存地址，计算得到用户空间内存地址；其中，上述偏移量是上述用户空间内存地址相对于内核空间内存地址的偏移量，上述偏移量 =内核空间内存地址一用户空间内存地址。通过本发明实施例提供的技术方案，预先申请内核态内存，并利用零拷贝技术，将内核态的内存映射到用户态，用户态发送消息时，直接通过 buffer描述符获得用户态内存地址，这样可以避免用户态申请内存，而且用户态、内核态之间只需要传递一个很小的 buffer描述符，省去了大量的内存拷贝操作。解决了相关技术中网络设备写表方法对 CPU的负担较大的问题，内核驱动和芯片之间的消息传递采用 DMA机制，减少了 CPU的负担。在网络设备驱动层面大量发送写表消息的应用中，可以极大提高写表性能，有效改进 Linux下设备驱动的写表效率。上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。附图说明图 1 是根据相关技术的 Linux***设备驱动软件层次示意图；图 2 是根据本发明实施例的网络设备写表方法的流程图；图 3 是根据本发明实施例的软件层次示意图; 图 4 是根据本发明实施例的 open***调用流程图；图 5 是根据本发明实施例的用户空间和内核空间内存单元内存映射示意图；图 6 是根据本发明实施例的消息发送流程图；图 7 是根据本发明实施例的应用于内核空间的网络设备写表装置的结构框图；以及图 8 是根据本发明实施例的应用于用户空间的网络设备写表装置的结构框图。具体实施方式为了解决现有技术中网络设备写表方法对 CPU的负担较大的问题，本发明提供了一种网络设备写表方法及装置，以下结合附图以及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不限定本发明。本实施例提供了一种网络设备写表方法，图 2是根据本发明实施例的网络设备写表方法的流程图，如图 2所示，该方法包括以下步骤（步骤 S202-步骤 S206): 步骤 S202, 内核空间预先申请内存，将内核空间内存映射到用户空间，得到用户空间内存地址。优选地，内核空间将内核空间内存，通过 mmap映射到用户空间。在此之后，内核空间根据用户空间内存地址，计算用户空间内存地址相对于内核空间内存地址的偏移量；其中，偏移量 =内核空间内存地址一用户空间内存地址。步骤 S204, 用户空间向内核空间申请内核空间内存，得到对应的用户空间内存地址；将用户空间内存地址和消息大小记录在缓冲区 buffer描述符中传递给内核空间。在该步骤中，用户空间向内核空间申请内核空间内存，得到用户空间内存地址，可以通过以下优选实施方式实现：用户空间向内核空间申请内核空间内存，得到其内核空间内存地址；用户空间根据偏移量和内核空间内存地址，计算得到用户空间内存地址。步骤 S206, 内核空间将用户空间内存地址转换为内核空间内存地址，通过直接内存存取 DMA控制器将消息写入芯片。具体地，内核空间将内核空间内存地址和消息大小，传递给 DMA控制器，内核空间的驱动通过 DMA控制器将消息写入芯片。本实施例还提供了一种优选实施方式，来介绍内存释放过程，即用户空间将待释放的用户空间内存地址，记录到 buffer描述符中传递给内核空间；内核空间根据偏移量和用户空间内存地址，计算得到内核空间内存地址；内核空间将内核空间内存地址传递给内核空间的驱动；内核空间的驱动释放 buffer描述符。图 3是根据本发明实施例的软件层次示意图，内核空间预先申请内核态内存，并利用零拷贝技术，将内核态的内存映射到用户态，用户态发送消息时，直接通过 buffer 描述符获得用户态内存地址，这样可以避免用户态申请内存，而且用户态、内核态之间只需要传递一个很小的 buffer描述符，省去了大量的内存拷贝操作。解决了相关技术中网络设备写表方法对 CPU的负担较大的问题，内核驱动和芯片之间的消息传递采用 DMA机制，减少了 CPU的负担。在网络设备驱动层面大量发送写表消息的应用中，可以极大提高写表性能，有效改进 Linux下设备驱动的写表效率。下面对芯片驱动程序的具体操作进行介绍。芯片驱动程序为字符设备驱动，即驱动程序将芯片作为文件进行操作，用户态驱动程序和内核态驱动程序通过文件流进行交互。芯片驱动首先要为芯片初始化 file_operation结构，该结构包括该字符设备的打开（open)、关闭（close)、写（write)、控制（ioctl)、映射 (mmap) 方法。具体地讲， 1、映射（mmap) 方法：提供将内核空间内存映射到用户空间内存的接口； 2、打开（open) 方法：申请内核态内存，并通过 mmap映射将内存块映射到用户空间，并且分割内存块为 N个内存单元 buf。该操作过程如图 4所示的 open***调用流程图，如图 4所示，该流程包括以下步骤（步骤 S402-步骤 S410)。步骤 S402，申请内核内存块，内核态内存起始地址为！^ 步骤 S404, 调用 mmap接口将内核空间内存映射到用户空间，得到的用户态内存起始地址为 U。步骤 S406，计算用户空间地址相对于内核空间地址的偏移量 0。 0=K-U。通常的，内核空间地址范围为 3G~4<¾用户空间地址范围为 0~3G。步骤 S408，内存块分割。由于 Linux为多进程操作***，同一时刻可能有多个进程进行写表，为了提升内核内存的利用率及写表性能，将内核内存块分割成一个一个小的 buffer ( buf0、 bufl, ...bum) . 由内核驱动程序管理维护这些 buffer单元。步骤 S410, 结束。经过 open***调用后，用户空间得到了与内核空间相关联 shadow映射。如图 5 所示的用户空间和内核空间内存单元内存映射示意图，内核空间每个 buffer单元在用户空间都有唯一确定的一个用户空间地址。

3、关闭（close) 方法：释放软件资源，将内核态申请的内存释放。 4、控制（ioctl) 方法：为用户态程序提供申请、释放内存的接口。入参为 buffer描述符。 Buffer描述符包括两个信息，用户态地址和消息大小。申请内存时，向内核驱动程序 "申请 " 空闲 buffer 单元，得到其内核态地址 Addr kernel, 根据用户空间地址和内核空间地址偏移量 0，计算得到其用户空间地址 Addr usr = Addr kernel - 0，并将 Addr_usr记录到 buffer描述符返回给用户空间。释放内存，用户空间将待释放的用户空间地址通过 buffer描述符传递给内核空间。内核空间根据地址偏移量 0计算得到相应的内核空间地址 Addr_kernel = Addr usr + 0。将 Addr_kernel传递给内核驱动程序，内核驱动负责 "释放 "该 buffer单元。注：这里的 "申请"、 "释放"只是为了便于理解使用的说法，并不是真实的向操作系统申请释放内存，而是内核驱动程序为了管理内核 buffer单元，记录每个 buffer单元的是否在使用中的一个状态。实际上，内存的申请、释放只会发生在设备的打开、关闭调用中。

5、写（write) 方法：用户程序将用户空间地址及消息大小通过 buffer描述符传递给内核空间。内核空间将用户地址转换成内核空间地址（Addr_kemel = Addr usr + 0)，将 Addr_kernel和消息大小传递给 DMA控制器，内核驱动通过 DMA将消息快速写入芯片。写表消息发送接口借助 ioctl和 write两个***调用实现，这两个***调用都通过一个 buffer描述符传递用户空间地址及消息长度。由于采用了 mmap映射，用户空间不需要申请内存，只需要调用 ioctl接口申请内核空间的空闲 buffer, 将消息内容填写到与内核 buffer地址映射的用户空间地址。填写完成，调用 write接口，内核态程序将用户空间地址进行转换得到内核态地址，从而通过 DMA写入芯片，如图 6所示的消息发送流程图，该流程包括以下步骤（步骤 S602-步骤 S610)。步骤 S602，内存申请。通过 IOCTL接口申请内核态内存单元，获取相应的用户空间地址。步骤 S604, 消息填充。将消息内容拷贝到用户空间地址中，并将消息大小和用户空间地址填到 buffer描述符中步骤 S606, 消息发送。通过 write接口，将 buffer描述符传递给内核空间。内核驱动将用户空间地址和消息大小传递给 DMA控制器，通过 DMA快速写入芯片步骤 S608, 内存释放。通过 IOCTL接口释放内核态内存单元，记录内核空间中相应 buffer单元为可用状态。步骤 S610, 结束。对应于上述实施例介绍的网络设备写表方法，本实施例提供了一种网络设备写表装置，该装置可以应用于内核空间，用以实现上述实施例。图 7是根据本发明实施例的应用于内核空间的网络设备写表装置的结构框图，如图 7所示，该装置包括：内存申请模块 10和消息写入模块 12。下面对该结构进行详细介绍。内存申请模块 10，设置为预先申请内存，将内核空间内存映射到用户空间，得到用户空间内存地址；消息写入模块 12，连接至内存申请模块 10，设置为在接收到用户空间传递的用户空间内存地址后，将用户空间内存地址转换为内核空间内存地址，通过直接内存存取 DMA控制器将消息写入芯片。优选地，该装置还包括：释放模块，设置为根据用户空间通过缓冲区 buffer描述符传递的用户空间内存地址，得到内核空间内存地址；将该内核空间内存地址传递给内核空间的驱动，以使驱动释放 buffer描述符。对应于上述实施例介绍的网络设备写表方法，本实施例提供了一种网络设备写表装置，该装置可以应用于用户空间，用以实现上述实施例。图 8是根据本发明实施例的应用于用户空间的网络设备写表装置的结构框图，如图 8所示，该装置包括：申请内存模块 20和描述符传递模块 22。下面对该结构进行详细介绍。申请内存模块 20，设置为向内核空间申请内核空间内存，得到对应的用户空间内存地址；描述符传递模块 22，连接至申请内存模块 20，设置为将用户空间内存地址和消息大小记录在缓冲区 buffer描述符中传递给内核空间。优选地，上述申请内存模块 10包括：第一处理单元，设置为向内核空间申请内核空间内存，得到其内核空间内存地址；第二处理单元，设置为根据偏移量和内核空间内存地址，计算得到用户空间内存地址；其中，偏移量是用户空间内存地址相对于内核空间内存地址的偏移量，偏移量 =内核空间内存地址一用户空间内存地址。从以上的描述中可以看出，本发明实施例预先在内核空间申请内存，并划分为一个个的内存单元，通过 mmap建立用户空间虚拟地址和内核空间内存地址的映射关系。这样用户空间和内核空间都不需要在消息过程中申请内存，并且避免了内存空间内存和内核空间内存的大量拷贝操作。内核驱动和芯片之间的消息传递采用 DMA机制，减少了 CPU的负担。在网络设备驱动层面大量发送写表消息的应用中，可以极大提高写表性能。尽管为示例目的，已经公开了本发明的优选实施例，本领域的技术人员将意识到各种改进、增加和取代也是可能的，因此，本发明的范围应当不限于上述实施例。

Claims

权利要求书、一种网络设备写表方法，包括：

内核空间预先申请内存，将内核空间内存映射到用户空间，得到用户空间内存地址；

所述用户空间向所述内核空间申请所述内核空间内存，得到对应的用户空间内存地址；将所述用户空间内存地址和消息大小记录在缓冲区 buffer描述符中传递给所述内核空间；

所述内核空间将所述用户空间内存地址转换为内核空间内存地址，通过直接内存存取 DMA控制器将消息写入芯片。、如权利要求 1所述的方法，其中，内核空间将内核空间内存映射到用户空间，得到用户空间内存地址之后，所述方法还包括：

内核空间根据所述用户空间内存地址，计算所述用户空间内存地址相对于内核空间内存地址的偏移量；其中，所述偏移量 =内核空间内存地址一用户空间内存地址。、如权利要求 2所述的方法，其中，用户空间向内核空间申请所述内核空间内存，得到所述用户空间内存地址，包括：

用户空间向内核空间申请内核空间内存，得到其内核空间内存地址；用户空间根据所述偏移量和所述内核空间内存地址，计算得到用户空间内存地址。、如权利要求 1所述的方法，其中，内核空间通过所述 DMA控制器将消息写入芯片，包括：

内核空间将所述内核空间内存地址和所述消息大小，传递给所述 DMA控制器，内核空间的驱动通过所述 DMA控制器将消息写入芯片。、如权利要求 2所述的方法，其中，所述方法还包括：

用户空间将待释放的用户空间内存地址，记录到所述 buffer描述符中传递给内核空间；内核空间根据所述偏移量和所述用户空间内存地址，计算得到内核空间内存地址；

内核空间将所述内核空间内存地址传递给内核空间的驱动；

内核空间的驱动释放所述 buffer描述符。、如权利要求 1所述的方法，其中，内核空间将所述内核空间内存映射到用户空间，包括：

内核空间将所述内核空间内存，通过 mmap映射到用户空间。、一种网络设备写表装置，应用于内核空间，所述装置包括：

内存申请模块，设置为预先申请内存，将内核空间内存映射到用户空间，得到用户空间内存地址；

消息写入模块，设置为在接收到用户空间传递的用户空间内存地址后，将所述用户空间内存地址转换为内核空间内存地址，通过直接内存存取 DMA控制器将消息写入芯片。、如权利要求 7所述的装置，其中，所述装置还包括：

释放模块，设置为根据用户空间通过缓冲区 buffer描述符传递的用户空间内存地址，得到内核空间内存地址；将该内核空间内存地址传递给内核空间的驱动，以使所述驱动释放所述 buffer描述符。、一种网络设备写表装置，应用于用户空间，所述装置包括：

申请内存模块，设置为向内核空间申请内核空间内存，得到对应的用户空间内存地址；

描述符传递模块，设置为将所述用户空间内存地址和消息大小记录在缓冲区 buffer描述符中传递给内核空间。 0、如权利要求 9所述的装置，其中，所述申请内存模块包括：

第一处理单元，设置为向内核空间申请内核空间内存，得到其内核空间内存地址；

第二处理单元，设置为根据偏移量和所述内核空间内存地址，计算得到用户空间内存地址；其中，所述偏移量是所述用户空间内存地址相对于内核空间内存地址的偏移量，所述偏移量 =内核空间内存地址一用户空间内存地址。