WO2020124609A1

WO2020124609A1 - 一种处理芯片、方法及相关设备

Info

Publication number: WO2020124609A1
Application number: PCT/CN2018/122946
Authority: WO
Inventors: 包雅林
Original assignee: 华为技术有限公司
Priority date: 2018-12-22
Filing date: 2018-12-22
Publication date: 2020-06-25
Also published as: CN113227984B; CN113227984A

Abstract

一种处理芯片、方法及相关设备，其中，处理芯片(10)包括：控制器(101)、与控制器(101)连接的第一存储器(102)；其中，第一存储器(102)包括N个存储块Block，每个Block包括M个一读一写1R1W存储器；N个Block中的第i个Block，用于存储与第i个Block对应的目标数据Si的数据长度，i＝1、2、3、……N；控制器(101)，用于在第j个Block对应的目标数据Sj的数据长度变化时，读取第j个Block的其中一个1R1W存储器中存储的Sj的数据长度，并根据Sj的数据长度变化，更新第j个Block的M个1R1W存储器中存储的M份Sj的数据长度。采用本方法可以提升多访问源的数据长度的计算效率。

Description

一种处理芯片、方法及相关设备

技术领域

本发明涉及芯片技术领域，尤其涉及一种处理芯片、方法及相关设备。

背景技术

在各类通讯、电子设备所使用的芯片中，有很多功能需要基于数据的长度(例如队列的深度或数据报文的长度等)做运算，比如，基于队列的长度丢弃报文，反压端口，计费等。

假设，***需要支持1M个数的用户队列，并基于用户队列的深度对各个用户队列进行调度。其中，不同用户之间的队列可以基于媒体访问控制地址(Media Access Control Address，MAC)、互联网协议地址(Internet Protocol Address，IP)地址或者传输控制协议(Transmission Control Protocol，TCP)连接关系等进行区分。而在实际监控调度过程中，每个时钟周期内，任意一个用户的队列深度可能会通过多个访问源(例如N个通道、数据接口、流水或平面)进行增加或减少。对于这类队列，若要在1个时钟周期内确定多个用户队列的实际深度，就需要涉及在芯片内实现N访问源的多个队列深度计算的实现方法。

因此，如何在芯片内部实现N访问源的数据长度的高效计算，是亟待解决的问题。

发明内容

本发明实施例所要解决的技术问题在于，提供一种处理芯片、方法及相关设备，以提升多访问源的数据长度的计算效率。

第一方面，本发明实施例提供了一种处理芯片，可包括：控制器、与所述控制器连接的第一存储器；其中，所述第一存储器包括N个存储块Block，每个Block包括M个一读一写1R1W存储器；N为大于1的整数，M为大于1的整数；所述N个Block中的第i个Block，用于存储与所述第i个Block对应的目标数据S _i的数据长度，i＝1、2、3、……N；其中，所述第i个Block中存储M份所述S _i的数据长度，且M份所述S _i的数据长度分别存储在所述第i个Block的M个1R1W存储器中，一个1R1W存储器存储一份所述S _i的数据长度；所述控制器，用于在第j个Block对应的目标数据S _j的数据长度变化时，读取所述第j个Block的其中一个1R1W存储器中存储的S _j的数据长度，并根据S _j的数据长度变化，更新所述第j个Block的M个1R1W存储器中存储的M份所述S _j的数据长度，其中，1≤j≤N，且j为整数。

本发明实施例提供的处理芯片，通过在第一存储器中的N个Block中的每一个Block中的M个1R1W存储器中，分别重复存储M份与该Block对应的目标数据的数据长度，当N个Block中的任意一个或多个Block对应的目标数据的数据长度发生变化时，读取对应的Block中的其中一个1R1W存储器中存储的初始长度，并更新该Block中的M个1R1W存储器中存储的初始长度。可选的，目标数据可以包括多类数据(例如包括多个用户的数据)。因此，在本发明实施例中，当某类数据通过N个访问源(例如N个通道、数据接口、流水或平面)中的一个或多个进行增加或减少时，由于该类数据的数据长度所存储于的 Block，在一个时钟周期内，最多被允许M次读操作和M次写操作，而M次读操作中的其中一次可用于读取该类数据的初始长度(以计算更新后的数据长度)，M次写操作则可用于写入该类数据的M份更新后的数据长度，以便于在同一个时钟周期内可以计算M类数据的总长度。即当需要在同一个时钟周期内计算M类数据通过N个访问源写入(除去读出的)的数据总长度时，则可以使用每一个Block中的M次读操作(每一次对应一类数据)读出在各个Block中的数据长度，最终进行求和得到数据总长度。因此，本发明实施例中的处理芯片，在一个时钟周期内，最多可以允许计算M类数据的总长度，在保证了目标数据的数据长度实时更新的情况下，实现了芯片内部的N访问源的M类数据长度的计算方法，提升了多访问源的多类数据的数据长度计算的效率和精确性。

在一种可能的实现方式中，所述芯片还包括：与所述控制器连接的第二存储器，以及与所述第二存储器连接的N个数据接口，所述N个数据接口与所述N个存储块Block一一对应；所述N个数据接口中的每个数据接口，用于向所述第二存储器写入数据，或从所述第二存储器中读出数据；所述第二存储器，用于存储通过所述N个数据接口写入的数据；其中，与所述第i个Block对应的目标数据S _i，具体为通过所述第i个Block对应的数据接口存储至所述第二存储器中的数据。

本发明实施例提供的处理芯片，还包括第二存储器以及与之连接的N个数据接口，且该N个数据接口与N个Block一一对应，因此，Block对应的目标数据即为通过该Block对应的数据接口写入或者读出的数据。该第二存储器用于存储通过N个数据接口写入的各类数据，且该N个数据接口可以看做是该处理芯片的N个访问源。当有数据通过某个数据接口写入或者读出时，则对该数据接口对应的Block中存储的数据长度进行读取和更新，以保证该数据的数据长度的精确性。

在一种可能的实现方式中，每个1R1W存储器包括K个位宽为W的存储单元；S _i包括K类数据，将第k类数据s _k通过第i个Block对应的数据接口存储至所述第二存储器中的数据长度记为L _ik，k＝1、2、3、……K；所述S _i的数据长度包括K个数据长度：L _i1，L _i2，L _i3……L _iK；所述第i个Block中的M个1R1W存储器中的每一个1R1W存储器存储所述K个数据长度，且所述K个数据长度一一对应的存储在一个1R1W存储器中的K个所述存储单元中；所述控制器，具体用于在第j个Block对应的数据接口有s _g写入或读出的情况下，读取所述第j个Block的其中一个1R1W存储器的对应存储单元中存储的L _jg，并根据s _g的长度变化，更新所述第j个Block中的M个1R1W存储器中的对应存储单元中存储的M份所述L _jg，其中，M取大于或者等于N的整数；其中，L _jg为第g类数据s _g通过第j个Block对应的数据接口存储至所述第二存储器中的数据长度，所述第g类数据为所述K类数据中的第g类数据，1≤g≤K，且g为整数。

本发明实施例提供的处理芯片，其第一存储器中的N个Block中的每一个Block中的M个1R1W存储器的深度均为K，位宽均为W。当目标数据包括K类数据时，则每一类数据通过某个数据接口存储至第二存储器中的数据长度，恰好存储于该数据接口对应的Block中的1R1W存储器中的其中一个存储单元中，且M份该数据的数据长度分别存储于该Block的M个1R1W存储器中。因此，当某个数据接口有数据传输(写入或读出)时，则通过控制器读取对应Block中的其中一个1R1W存储器中的存储单元(该类数据对应的固定的存储单元)中所存储的初始长度，以便于计算并更新M个1R1W存储器中对应的存储单元中存储的M份数据长度。综上，本发明实施例中的处理芯片可以实现，在同一个时钟周期内最多计算M类数据的数据总长度，且因为M取大于或者等于N的整数，因此，当N个数据接口均有数据传输(写入或读出)时，且分别为N个不同类数据时，则本发明实施例中的处理芯片可以同时支持计算N访问源的N类数据的数据总长度，提升了多访问源的数据长度的计算效率。

在一种可能的实现方式中，所述处理芯片还包括与所述控制器和所述第一存储器连接的计算单元：所述控制器，还用于在同一个时钟周期内，从所述N个Block中的每一个Block的其中一个1R1W存储器中读取s _g的数据长度，并发送至所述计算单元；包括L _1g，L _2g，L _3g……L _Ng；所述计算单元，用于根据读取的所述s _g的数据长度，计算s _g在所述第二存储器中的数据总长度S，其中，

1≤g≤K，且g为整数，i＝1、2、3、……N。

本发明实施例提供的处理芯片，还包括与控制器和第一存储器连接的计算单元，该计算单元接收控制器在同一个时钟周期内读取的某一类或几类数据在N个Block中的每一个Block中的数据长度，并根据接收到的数据长度计算该一类或者几类数据的数据总长度。

在一种可能的实现方式中，所述控制器，还用于根据所述s _g在所述第二存储器中的数据总长度S，控制所述s _g的写入或读出。

本发明实施例提供的处理芯片，控制器还根据计算单元计算的任意一类或几类数据的数据总长度对该类数据的读写进行控制，以实现不同场景下的基于数据长度的数据调度与控制。

在一种可能的实现方式中，所述处理芯片还包括与所述控制器和所述第一存储器连接的计算单元：所述控制器，还用于在同一个时钟周期内，分别从所述N个Block中的各个Block中读取T类数据存储的数据长度，并发送至所述计算单元；所述T类数据为在同一个时钟周期内分别通过所述N个数据接口中的T个数据接口写入或者读出的数据；其中，从所述N个Block中的任意一个Block中读取所述T类数据的数据长度，包括从所述任意一个Block的T个1R1W存储器中分别读出的所述T类数据的数据长度，且从一个1R1W存储器中读出一类数据的数据长度，所述T类数据为所述K类数据中的其中T类数据，其中，M取大于或者等于N的整数，2≤T≤M；所述计算单元，用于分别计算所述T类数据在所述第二存储器中的数据总长度。

本发明实施例提供的处理芯片，当同一个时钟周期内，N个数据接口中有T(2≤T≤M)类数据的传输时，那么控制器可以在同一个时钟周期内，读取该T类数据分别在N个Block中的数据长度，因而分别在N个Block中的每一个Block中产生T次读操作，以及T次写操作。由于每个Block中包括M个1R1W存储器，且M取大于或者等于N的整数，因此可以实现在同一个时钟周期内的T类数据的数据总长度的计算。可以理解的是，控制器向计算单元发送的T类数据分别在N个Block中的数据长度，可以是与M次写操作(更新对应Block中的每个1R1W存储器中的数据长度)在同一个时钟周期读取的，也可以是在M次写操作之后的时钟周期读取并发送的。前一种，可以理解为在未写入最新数据长度之前就读取当前数据长度，并结合控制器中获知的当前更新的长度计算最新的数据总长度，即将数据长度发送至计算单元和更新M个1R1W存储器是在同一个时钟周期；后一种可以理解为当更新了最新的数据长度之后，再将数据长度发送至计算单元计算数据的总长度，即更新M个1R1W存储器和将数据长度发送至计算单元是在不同时钟周期。综上，本发明实施例，在同一个时钟周期内最多可以计算M类数据的数据总长度，且因为M取大于或者等于N的整数，所以，当N个数据接口均有数据传输(写入或读出)时，且分别为N个不同类数据时，则本发明实施例中的处理芯片可以同时支持计算N类数据的数据总长度，比如，计算数据的总长度的触发条件为N个数据接口中任意一个或几个有数据传输。可选的，本发明实施例中的处理芯片也可以根据应用场景的不同，同时支持计算M类数据的数据总长度，比如，计算数据的总长度的触发条件不为数据接口有数据传输，而是周期性计算M类数据的数据总长度等。

第二方面，本申请提供一种处理方法，应用于处理装置，所述处理装置包括控制器、与所述控制器连接的第一存储器；其中，所述第一存储器包括N个存储块Block，每个Block包括M个一读一写1R1W存储器；N为大于1的整数，M为大于1的整数；所述方法可包括：在所述N个Block中的每个Block中，存储与所述第i个Block对应的目标数据S _i的数据长度，i＝1、2、3、……N；其中，所述第i个Block中存储M份所述S _i的数据长度，且M份所述S _i的数据长度分别存储在所述第i个Block的M个1R1W存储器中，一个1R1W存储器存储一份所述S _i的数据长度；在第j个Block对应的目标数据S _j的数据长度变化时，读取所述第j个Block的其中一个1R1W存储器中存储的S _j的数据长度，并根据S _j的数据长度变化，更新所述第j个Block的M个1R1W存储器中存储的M份所述S _j的数据长度，其中，1≤j≤N，且j为整数。

在一种可能的实现方式中，所述处理装置还包括：与所述控制器连接的第二存储器，以及与所述第二存储器连接的N个数据接口，所述N个数据接口与所述N个存储块Block一一对应；所述方法还包括：通过所述N个数据接口中的每个数据接口，向所述第二存储器写入数据，或从所述第二存储器中读出数据；将通过所述N个数据接口写入的数据存储至所述第二存储器；其中，与所述第i个Block对应的目标数据S _i，具体为通过所述第i个Block对应的数据接口存储至所述第二存储器中的数据。

在一种可能的实现方式中，每个1R1W存储器包括K个位宽为W的存储单元；S _i包括K类数据，将第k类数据s _k通过第i个Block对应的数据接口存储至所述第二存储器中的数据长度记为L _ik，k＝1、2、3、……K；所述S _i的数据长度包括K个数据长度：L _i1，L _i2，L _i3……L _iK；所述第i个Block中的M个1R1W存储器中的每一个1R1W存储器存储所述K个数据长度，且所述K个数据长度一一对应的存储在一个1R1W存储器中的K个所述存储单元中；在第j个Block对应的数据接口有s _g写入或读出的情况下，读取所述第j个Block的其中一个1R1W存储器的对应存储单元中存储的L _jg，并根据s _g的长度变化，更新所述第j个Block中的M个1R1W存储器中的对应存储单元中存储的M份所述L _jg；其中，M取大于或者等于N的整数，L _jg为第g类数据s _g通过第j个Block对应的数据接口存储至所述第二存储器中的数据长度，所述第g类数据为所述K类数据中的第g类数据，1≤g≤K，且g为整数。

在一种可能的实现方式中，所述方法还包括：在同一个时钟周期内，从所述N个Block 中的每一个Block的其中一个1R1W存储器中读取s _g的数据长度，并发送至所述计算单元；包括L _1g，L _2g，L _3g……L _Ng；根据读取的所述s _g的数据长度，计算s _g在所述第二存储器中的数据总长度S，其中，

1≤g≤K，且g为整数，i＝1、2、3、……N。

在一种可能的实现方式中，所述方法还包括：根据所述s _g在所述第二存储器中的数据总长度S，控制所述s _g的写入或读出。

在一种可能的实现方式中，所述方法还包括：在同一个时钟周期内，分别从所述N个Block中的各个Block中读取T类数据存储的数据长度，并发送至所述计算单元；所述T类数据为在同一个时钟周期内分别通过所述N个数据接口中的T个数据接口写入或者读出的数据；其中，从所述N个Block中的任意一个Block中读取所述T类数据的数据长度，包括从所述任意一个Block的T个1R1W存储器中分别读出的所述T类数据的数据长度，且从一个1R1W存储器中读出一类数据的数据长度，所述T类数据为所述K类数据中的其中T类数据，其中，M取大于或者等于N的整数，2≤T≤N；分别计算所述T类数据在所述第二存储器中的数据总长度。

第三方面，本申请提供一种片上***芯片，该片上***芯片包括上述第一方面的任意一种实现方式所提供的处理芯片。该片上***芯片，可以由处理芯片构成，也可以包含处理芯片和其他分立器件。

第四方面，本申请提供一种电子设备，包括上述第一方面中的任意一种实现方式所提供的处理芯片以及耦合于所述芯片的分立器件。

附图说明

为了更清楚地说明本发明实施例或背景技术中的技术方案，下面将对本发明实施例或背景技术中所需要使用的附图进行说明。

图1是本发明实施例提供的一种处理芯片的结构示意图；

图2是本发明实施例提供的另一种处理芯片的结构示意图；

图3是本发明实施例提供的一种Block的结构示意图；

图4为本发明实施例提供的K类数据在第一存储器中的存储形式示意图；

图5是本发明实施例提供的又一种处理芯片的结构示意图；

图6是本发明实施例提供的一种数据处理方法的流程示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例进行描述。

本申请的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象，而不是用于描述特定顺序。此外，术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、***、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

首先，对本申请中的部分用语进行解释说明，以便于本领域技术人员理解。

(1)寄存器，是中央处理器内的组成部份，它跟CPU有关。寄存器是有限存贮容量的高速存贮部件，它们可用来暂存指令、数据和位址。在中央处理器的控制部件中，包含的寄存器有指令寄存器(IR)和程序计数器(PC)。在中央处理器的算术及逻辑部件中，包含的寄存器有累加器(ACC)。

(2)存储器，范围较大，它几乎涵盖了所有关于存储的范畴。寄存器，内存，都是存储器中的一种。凡是有存储能力的硬件，都可以称之为存储器。硬盘则可以归入外存储器行列。

(3)缓存，就是数据交换的缓冲区(称作Cache)，当某一硬件要读取数据时，会首先从缓存中查找需要的数据，如果找到了则直接执行，找不到的话则从内存中找。由于缓存的运行速度比内存快得多，故缓存的作用就是帮助硬件更快地运行。因为缓存往往使用的是RAM(断电即掉的非永久储存)，所以在用完后还是会把文件送到硬盘等存储器里永久存储。

(3)内存，即内存储器，它也是存储器中的一种，包涵的范围也很大，一般分为只读存储器和随即存储器，以及高速缓冲存储器(CACHE)，只读存储器应用广泛，它通常是一块在硬件上集成的可读芯片，作用是识别与控制硬件，它的特点是只可读取，不能写入。随机存储器的特点是可读可写，断电后一切数据都消失，也即是通常所说的内存。CACHE是在CPU中速度非常块，而容量却很小的一种存储器。

(4)队列，是一种先进先出(FIFO)的线性表数据结构，常见的操作如在表的尾部***，在头部删除数据。队列的类型有链表结构、固定缓冲区结构等。常用的队列空间都是动态地从堆中申请，在数据量操作频繁的任务中，带来***实时性和内存碎片等问题。队列长度计算公式：nCount＝(rear-front+nSize)％nSize。其中，队尾：队列中指定了用来***数据的一端；队头：队列中指定了用来删除数据的一端；入队：数据的***动作；出队：数据的删除动作。

(5)栈和队列都是在一个特定范围的存储单元中存储的数据，这些数据都可以重新被取出使用。不同的是，栈就象一个很窄的桶先存进去的数据只能最后才能取出来，而队列则不一样，即“先进后出”。队列有点象日常排队买东西的人的“队列”先排队的人先买，后排队的人后买，即“先进先出”。有时在数据结构中还有可能出现按照大小排队或按照一定条件排队的数据队列，这时的队列属于特殊队列，就不一定按照“先进先出”的原则读取数据了。

(6)随机存取存储器(RAM-random access memory，RAM)随机存储器。存储单元的内容可按需随意取出或存入，且存取的速度与存储单元的位置无关的存储器。这种存储器在断电时将丢失其存储内容，故主要用于存储短时间使用的程序。按照存储信息的不同，随机存储器又分为静态随机存储器(Static RAM，SRAM)和动态随机存储器(Dynamic RAM，DRAM)。

(7)取模，就是求余数的运算，例如10除以4的余数是2，于是取模的结果就是2。对于整型数a，b来说，取模运算的方法都是：1、求整数商：c＝a/b；2、计算模：r＝a-c*b。

首先，基于背景技术中提出的技术缺陷，进一步分析本申请需要解决的技术问题及应用场景。实现N访问源的队列深度的芯片硬件实现方式，主要包括以下几种方法：

方法一：直接使用芯片生产工厂提供的多端口读写的缓存。例如，使用芯片生产厂家1个时钟周期N访问源可以同时读写的缓存。或者，使用芯片生产厂家定制化的硬核实现。

方法二：提高时钟频率，把原本在1个时钟周期的多次读写缓存分配到多个时钟周期完成。

方法三：在芯片中使用寄存器实现队列的深度计算。

综上所述，现有技术中主要存在以下缺陷。

1)方法一的缺点在于，需要芯片厂家提供定制化的缓存单元。现有芯片生产的工厂一般最多提供2R2W的缓存，N不能无限扩展。定制化的缓存单元不具有通用性，换一个芯片生产就不应有对应的缓存。定制的缓存单元面积大，功耗大，不便于专用集成电路(Application Specific Integrated Circuit，ASIC)集成，无法修改。

2)方法二的缺点在于，时钟频率提升有极限，不能无限的提高。

3)方法三的缺点在于，由于受到寄存器实现和物理限制，对于队列数目大的情况，芯片使用寄存器拥塞严重，无法实现；对于中等规模的队列数据，若可以实现，对应的芯片面积是使用缓存的5倍以上。

因此，本申请实际要解决的技术问题在于，如何尽可能的保证芯片内部的时钟频率、面积、功耗等均衡的情况下，灵活实现N访问源的数据长度的高效计算。

基于上述，本申请提供一种处理芯片。请参见图1，图1是本发明实施例提供的一种处理芯片的结构示意图，如图1中所示，处理芯片10包括控制器101、与控制器101连接的第一存储器102，其中，所述第一存储器102包括N个存储块Block，每个Block包括M个一读一写1R1W存储器；且N为大于1的整数，M为大于1的整数。其中，

所述N个Block中的第i个Block，用于存储与所述第i个Block对应的目标数据S _i的数据长度，i＝1、2、3、……N；其中，所述第i个Block中存储M份所述S _i的数据长度，且M份所述S _i的数据长度分别存储在所述第i个Block的M个1R1W存储器中，一个1R1W存储器存储一份所述S _i的数据长度。即每一个Block中都存储有M份相同的数据长度，该数据长度表征的是该Block所对应的目标数据的长度，具体存储形式为该M份相同的数据长度分别存储在该Block中的M个1R1W存储器中。可选的，与Block对应的目标数据可以是通过Block连接的数据接口所写入或者读出的数据，或者，是与Block预先建立了映射关系(如携带了与该Block绑定的MAC地址/IP地址/身份标识ID/或者TCP连接关系等)的数据。本发明实施例对此不作具体限定，即Block与目标数据之间的对应关系可以依据不同的应用场景进行不同的设置。

例如，第1个Block用于存储与该第1个Block(以图1中的Block1为例)对应的目标数据S ₁的数据长度，其中，Block1中一共存储有M份S ₁的数据长度，且M份所述S _i的数据长度分别存储在Block1的M个1R1W存储器中，如1R1W存储器1、1R1W存储器2、1R1W存储器3……1R1W存储器M中分别都存储有一份该S ₁的数据长度，以此类推。

控制器101，用于在第j个Block对应的目标数据S _j的数据长度变化时，读取所述第j个Block的其中一个1R1W存储器中存储的S _j的数据长度，并根据S _j的数据长度变化，更新所述第j个Block的M个1R1W存储器中存储的M份所述S _j的数据长度，其中，1≤j≤N，且j为整数。即当任意一个或者多个Block对应的目标数据的数据长度发生变化时(例如，有对应的目标数据的写入或者读出时)，则控制器101读取该变化的目标数据对应的Block中存储的该目标数据的数据长度，也即是该目标数据当前的初始长度；然后再将经过计算确定更新后的数据长度写入到该Block中的每一个1R1W存储器(一共M个1R1W存储器)中。

可选的，当目标数据的数据存储类型为队列时，目标数据的数据长度则为队列的深度(也可称之为队列的长度)，第一存储器102具体可以为队列深度存储器，其中，队列深度是指队列缓存的所有包的总字节数。当有包入队时，则控制器101从队列深度存储器中对应的Block的其中一个1R1W存储器中读出队列深度，加上当前入队的包长作为新的队列深度，再将新的队列深度写回对应的Block中的所有M个1R1W存储器中。当有包出队时，则控制器101从对应的Block的其中一个1R1W存储器中读出队列深度，减去当前出队的包长作为新的队列深度，再将新的队列深度写回对应的Block中的所有M个1R1W存储器中。可以理解的是，一个数据接口可以理解为一个访问源，对应一个出队端口或者一个入队端口，因此，当某个入队端口或出队端口收到了某个用户的数据包，控制器101则通过对应的Block去更新该用户通过该端口收或发的数据长度。

例如，第2个Block(以图1中的Block 2为例)对应的目标数据S ₂的数据长度变化时，比如通过数据接口写入了128个字节，此时，控制器101读取Block 2中的其中一个1R1W存储器(如1R1W存储器2)中存储的S ₂当前的数据长度为128个字节，然后通过计算确定出更新后的数据长度为256个字节后，则重新向Block 2中的所有1R1W存储器(包括1R1W存储器2)写入该目标数据S ₂的数据长度256(例如以二进制形式写入)。

需要说明的是，本发明实施例中的1R1W存储器(1R1W memory)即一读一写存储器，支持在一个时钟周期内进行一次读操作和一次写操作。例如，上述读取S _j的数据长度则是针对第j个Block中的一个1R1W存储器进行了一次读操作；上述更新M份S _j的数据长度，则是针对第j个Block中的每个1R1W存储器进行了一次写操作，一共M次写操作。即一次更新需要进行一读M写的操作，因此没有超出一个Block中的M个1R1W存储器在一个时钟周期内所能提供的M读M写的上限。可以理解的是，根据处理芯片10的实际应用需求，本申请中的1R1W存储器也可以是多读多写存储器，假设一个Block对应多个目标数据，则可以根据多读多写存储器的特性，同时读取多个目标数据的初始长度、以及更新多个目标数据的变化后的数据长度，其原理与上述一读一写存储器相同，在此不再赘述。

本发明实施例提供的处理芯片，通过在第一存储器中的N个Block中的每一个Block中的M个1R1W存储器中，分别重复存储M份与该Block对应的目标数据的数据长度，当 N个Block中的任意一个或多个Block对应的目标数据的数据长度发生变化时，读取对应的Block中的其中一个1R1W存储器中存储的初始长度，并更新该Block中的M个1R1W存储器中存储的初始长度。可选的，目标数据可以包括多类数据(例如包括多个用户的数据)。因此，在本发明实施例中，当某类数据通过N个访问源(例如N个通道、数据接口、流水或平面)中的一个或多个进行增加或减少时，由于该类数据的数据长度所存储于的Block，在一个时钟周期内，最多被允许M次读操作和M次写操作，而M次读操作中的其中一次可用于读取该类数据的初始长度(以计算更新后的数据长度)，M次写操作则可用于写入该类数据的M份更新后的数据长度，以便于在同一个时钟周期内可以计算M类数据的总长度。即当需要在同一个时钟周期内计算M类数据通过N个访问源写入(除去读出的)的数据总长度时，则可以使用每一个Block中的M次读操作(每一次对应一类数据)读出在各个Block中的数据长度，最终进行求和得到数据总长度。因此，本发明实施例中的处理芯片，在一个时钟周期内，最多可以允许计算M类数据的总长度，在保证了目标数据的数据长度实时更新的情况下，实现了芯片内部的N访问源的M类数据长度的计算方法，提升了多访问源的多类数据的数据长度计算的效率和精确性。

本申请提供另一种处理芯片。请参见图2，图2是本发明实施例提供的另一种处理芯片的结构示意图，如图2中所示，处理芯片10包除了包括控制器101、与控制器101连接的第一存储器102以外，还包括与控制器101连接的第二存储器103，以及与第二存储器103连接的N个数据接口，N为大于1的整数；其中，所述第一存储器102包括N个存储块Block，每个Block包括M个一读一写1R1W存储器；所述N个数据接口与所述N个存储块Block一一对应。可选的，M取大于或者等于N的整数。

所述N个数据接口中的每个数据接口，用于向所述第二存储器写入数据，或从所述第二存储器中读出数据。可选的，每个数据接口都与处理芯片10的外部接口连接，图2中以N个外部接口为例，N个外部接口可以同时输入相同或不同用户的数据报文，每个数据报文携带用户ID并具有一定的数据长度。控制器101可以基于某个用户的数据报文(即携带该用户ID的数据报文)在第二存储器103中的总存储量，对该用户的数据报文进行相关控制(例如丢弃报文、反压端口或计费等)。

第二存储器103，用于存储通过所述N个数据接口写入的数据。例如，在处理芯片10接收到各个接口的数据报文后，把数据报文缓存到第二存储器103中，同时把每个数据报文的用户ID和报文长度以及相关控制信息发送到控制器101。

所述N个Block中的第i个Block，用于存储通过所述第i个Block对应的数据接口存储至所述第二存储器103中的数据S _i的数据长度，i＝1、2、3、……N；其中，所述第i个Block中存储M份所述S _i的数据长度，且M份所述S _i的数据长度分别存储在所述第i个Block的M个1R1W存储器中，一个1R1W存储器存储一份所述S _i的数据长度。进一步地，第一存储器102中的N个Block的功能中可以参照上述图1中N个Block的相关描述，在此不再赘述。

控制器101，用于在第j个Block对应的数据接口有S _j的输入或者输出时，读取所述第j个Block的其中一个1R1W存储器中存储的S _j的数据长度，并根据S _j的数据长度变化，更新所述第j个Block的M个1R1W存储器中存储的M份所述S _j的数据长度，其中，1≤j≤N，且j为整数。即当所述N个数据接口中的任意一个或者多个数据接口有数据输入或者输出时，则控制器控制读取对应的Block中的其中一个1R1W存储器中存储的初始数据长度，并更新该Block中的M个1R1W存储器中存储的M份数据长度，以在一个时钟周期内最多允许M个访问源同时访问读取该Block中更新后的M份数据长度。进一步地，控制器101的功能可以参照上述图1中控制器101的相关描述，在此不再赘述。

作为对图1或图2中Block的细化，图3是本发明实施例提供的一种Block的结构示意图。Block可以为本申请中图1或图2提供的第一存储器102中的N个Block中的任意一个Block。其中，

如图3所示，每个Block包括M个1R1W存储器，每个1R1W存储器包括K个位宽为W的存储单元；第i个Block对应的目标数据S _i包括K类数据，且将第k类数据s _k通过第i个Block对应的数据接口存储至所述第二存储器103中的数据长度记为L _ik，k＝1、2、3、……K；所述S _i的数据长度包括K个数据长度：L _i1，L _i2，L _i3……L _iK；所述第i个Block中的M个1R1W存储器中的每一个1R1W存储器存储所述K个数据长度，且所述K个数据长度一一对应的存储在一个1R1W存储器中的K个所述存储单元中。

具体地，本申请中的1R1W存储器包含多个存储单元，每个存储单元存储的数据位宽相等且为该1R1W存储器的最小单元(本申请中假设存储单元所能存储的数据位宽为W)。因此，1R1W存储器在进行数据写入和读出时，会按照W进W出的读写方式进行实现，即1R1W存储器每个时钟周期只能将数据写入到一个存储单元中，同时也只能将一个存储单元中存储的数据读出。

可选的，当目标数据的数据存储类型为队列时，一般可以按照不同的用户、不同的业务进行队列分组。例如，所述目标数据为携带用户ID的数据报文，所述K类数据为K个不同用户(携带不同用户ID)的数据报文。第一存储器102具体可以为队列深度存储器，第二存储器具体可以为数据缓存器。并且队列深度存储器中的每个Block中的每个1R1W存储器深度为K(可以存储的队列数量)，位宽为W(用来保存一个队列的长度)，其中，位宽W大于每个用户的缓存量对应的队列长度的上限值即可。当有包出队时，则控制器101从对应的Block的其中一个1R1W存储器中的存储单元中读出队列深度，减去当前出队的包长作为新的队列深度，再将新的队列深度写回对应的Block中的所有M个1R1W存储器中对应的存储单元中；同理，当有包入队时，则加上当前入队的包长作为新的队列深度，并进行相关的队列深度的更新操作，此处不再赘述。进一步可选的，当队列的长度超过位宽W时，则可以通过循环计算的方式来解决长度翻转的问题，即对新的队列长度进行取模之后再存储。

如图4所示，图4为本发明实施例提供的K类数据在第一存储器中的存储形式示意图。例如，针对第一存储器中的N个Block中的任意一个Block，其M个1R1W存储器(包括1R1W存储器1、1R1W存储器2、……1R1W存储器M)中的每一个1R1W存储器中均存储有K类数据的数据长度，即同一个Block中的M个1R1W存储器之间存储的是M份重复的数据长度。N个Block中的任意一个1R1W存储器分别存储的数据长度为L _i1，L _i2，L _i3……L _iK，i＝1、2、3、……N。比如，第1个Block中的1R1W存储器1中的第一个存储单元中存储的是第1类数据通过数据接口1存储至第二存储器中的数据的数据长度L ₁₁，第2个Block中的1R1W存储器2中的第二个存储单元中存储的是第2类数据通过数据接口2存储至第二存储器中的数据长度L ₂₂，具体可参见图4中的标注，此处不再赘述。

控制器101，用于在第j个Block对应的数据接口有s _g写入或读出的情况下，读取所述第j个Block的其中一个1R1W存储器的对应存储单元中存储的L _jg，并根据s _g的长度变化，更新所述第j个Block中的M个1R1W存储器中的对应存储单元中存储的M份所述L _jg；其中，M取大于或者等于N的整数，L _jg为第g类数据s _g通过第j个Block对应的数据接口存储至所述第二存储器中的数据长度，所述第g类数据为所述K类数据中的第g类数据，1≤g≤K，且g为整数。

具体地，当任意一个数据接口有数据(假设为第g类数据)输入或输出时，控制器101则控制读取该数据接口对应的Block中的其中一个1R1W存储器中的对应的存储单元(第g类数据所对应的存储单元)中的数据长度。例如，当第2个数据接口中有第2类数据的输入时，则控制器101读取第2个Block中的其中一个1R1W存储器(假设为1R1W存储器1)中的存储单元2(假设第2类数据对应存储单元2)中的数据长度L ₂₂，并根据该第2类数据通过第2个数据接口输入的数据长度以及读取的L ₂₂，计算得到更新后的L ₂₂，最终，将更新后的L ₂₂写入到第2个Block中的每一个1R1W存储器中的第2个存储单元中。

例如，所述K类数据为K个用户的数据，每个用户的数据之间携带不同的用户ID，以区分不同用户之间的数据。每个用户数据通过数据接口存储在第二存储器中，而每个用户在第二存储器中的数据存储量(即数据长度)则存储在第一存储器中的各个Block中。当某个用户的数据通过某个数据接口写入至第二存储器中，或者从第二存储器中被读出后，则其在该数据接口对应的Block中所存储的数据长度需要及时更新。则对应的Block中需要经历一读M写的过程，因为，此时需要更新用户的数据长度，而更新之前，首先需要获知该用户的数据在该Block中所存储的初始长度，即需要进行至少一个1R1W存储器的读操作，进一步地，读取了该用户的初始数据长度之后，需要结合通过该接口写入或者读出的的数据的数据长度，更新该Block中所有的存储的长度，原因在于，本发明实施例提供的即使可以同时被M个访问源所读取，因为任意一个读取N个1R1W存储其中所存储的长度时，都要保证该用户的数据长度是最新的，因此，在更新的时候需要更新该Block中的N个1R1W存储中所存储的数据长度，即需要再同一个时钟周期内进行M个写的操作。

本发明实施例提供的处理芯片，其第一存储器中的N个Block中的每一个Block中的M个1R1W存储器的深度均为K，位宽均为W。当目标数据包括K类数据时，则每一类数据通过某个数据接口存储至第二存储器中的数据长度，恰好存储于该数据接口对应的Block 中的1R1W存储器中的其中一个存储单元中，且M份该数据的数据长度分别存储于该Block的M个1R1W存储器中。因此，当某个数据接口有数据传输(写入或读出)时，则通过控制器读取对应Block中的其中一个1R1W存储器中的存储单元(该类数据对应的固定的存储单元)中所存储的初始长度，以便于计算并更新M个1R1W存储器中对应的存储单元中存储的M份数据长度。综上，本发明实施例中的处理芯片可以实现，在同一个时钟周期内最多计算M类数据的数据总长度，且因为M取大于或者等于N的整数，因此，当N个数据接口均有数据传输(写入或读出)时，且分别为N个不同类数据时，则本发明实施例中的处理芯片可以同时支持计算N访问源的N类数据的数据总长度，提升了多访问源的数据长度的计算效率。

基于上述图3提供的处理芯片，进一步地，请参见图5，图5是本发明实施例提供的又一种处理芯片的结构示意图，如图5中所示，所述处理芯片还可以包括与所述控制器101和所述第一存储器102连接的计算单元104。其中，

控制器101，还用于在同一个时钟周期内，从所述N个Block中的每一个Block的其中一个1R1W存储器中读取s _g的数据长度，并发送至所述计算单元；包括L _1g，L _2g，L _3g……L _Ng；需要说明的是，每个时钟周期内，每个数据接口只能写入或者读出一个存储单元中的数据报文，当然数据报文的长度不是固定的，是可变的。因此当依据用户的不同来区分数据报文时，则每个始终周期内，每个数据接口则只能写入或者读出一个用户的数据报文。

计算单元104，用于根据读取的所述s _g的数据长度，计算s _g在所述第二存储器中的数据总长度S，其中，

1≤g≤K，且m为整数，i＝1、2、3、……N。例如，读取队列深度存放单元中的每个Block中的某个用户的队列长度，以及根据当前端口的数据报文的进出情况以及数据报文的长度，计算该用户在***中所占用的总缓存量(即总的队列长度)，最终根据缓存量进行相应的控制。

当处理芯片要计算某个用户的数据在第二存储器103中的总长度，则需要获知该用户的数据通过所述N个数据接口存储至第二存储器103中的数据总量，也即是需要获知N个Block中存储的该用户的数据的数据长度。因此，计算一个用户在第二存储器103中的数据总长度，需要在每个Block中进行一个读操作。由于本发明实施例中的处理芯片10包括N个数据接口，而每个数据接口在一个时钟周期内最多写入或者读出一个数据报文，因此本发明实施例中的处理芯片在同一个时钟周期内最多有N个用户的数据长度会发生变化。

假设计算每个用户的数据总长度的条件为该用户的数据长度发生变化时，则计算该用户数据的总长度，那么该处理芯片在一个时钟周期内最多需要计算N个用户的数据总长度。而每一个用户的数据总长度的计算需要占用一个Block中的一个读操作，因此计算N个用户的数据总长度占用一个Block中的N个读操作，而针对一个Block来说，该一个时钟周期内的N个读操作分布在M个1R1W存储器中的N个1R1W存储器中，即每个用户的数据长度从一个Block的其中一个1R1W存储器中的存储单元中，不同的用户的数据分布在不同的存储单元中，并且每个用户的数据长度存储在1R1W的不同存储单元(即不同的地址)中，因此互相之间不会干扰，所以可以在同一个时钟周期内每一个Block中都可以同时被N个访问源进行访问。

在一种可能的实现方式中，控制器101，还根据所述s _g在所述第二存储器中的数据总长度S，控制所述s _g的写入或读出。计算队列的深度，根据队列深度计算接口执行对报文的各类控制操作。用于把报文长度和用户ID发送到队列深度存放单元，同时支持N个用户ID访问，得到N个用户ID在缓存中的深度，把数据送到队列深度(用户ID)计算单元，

在一种可能的实现方式中，控制器101，还在同一个时钟周期内，分别从所述N个Block中的各个Block中读取T类数据存储的数据长度，并发送至所述计算单元；所述T类数据为在同一个时钟周期内分别通过所述N个数据接口中的T个数据接口写入或者读出的数据；其中，从所述N个Block中的任意一个Block中读取所述T类数据的数据长度，包括从所述任意一个Block的T个1R1W存储器中分别读出的所述T类数据的数据长度，且从一个1R1W存储器中读出一类数据的数据长度，所述T类数据为所述K类数据中的其中T类数据，其中，M取大于或者等于N的整数，2≤T≤M。即当控制器需要在同一个时钟周期内计算多类数据(T类数据)在第二存储器中的总长度时，可以在同一个时钟周期内获取该T类数据分别在N个Block中的数据长度，其中T的取值最大为M，因为任意一个Block中的M个1R1W存储器在一个时钟周期内最多提供M次读操作。M取大于或者等于N的整数。当T等于M，且M等于N时，则可以对应到，表示在同一个时钟周期内，需要计算N类数据的数据总长度

计算单元，用于分别计算所述T类数据在所述第二存储器中的数据总长度。即本发明实施例中的处理芯片，在一个时钟周期内最多可以获取T类数据分别在N个Block中的数据长度，因此计算单元可以根据控制器发送过来的数据分别计算所述T类数据在所述第二存储器中的数据总长度。

综上，在实际应用场景中，例如计算用户在***中的缓存量的场景中，针对某一个数据接口(也可以称之为访问源)来说，当某一个用户的数据报文(例如以队列存储方式存储)通过该数据接口入队或者是出队时，则作为***的控制器来讲，需要执行以下两项操作。

其一：针对该数据报文入队或者出队所通过的访问源所对应的Block，需要更新该用户通过该访问源所占有的缓存量，因此需要读取该Block中的针对该用户的当前缓存量对应的队列长度，然后再根据上述入队或者出队的情况，更新最新的队列长度，在此过程中，涉及到一读N写，其中一读，是指读取该Block中的任意一个1R1W存储器中的该用户对应队列长度，然后根据上述出队或者入队情况更新队列长度，此时更新队列长度，不是更新一个，而是更新M个，原因在于一个Block中存储了M份相同的队列长度信息，若需要保持信息的一致性以及后续同时计算M个用户的队列总长度，则需要更新M个Memory的关于该用户的当前的最新队列长度。

其二：从全局角度来讲，控制器的最终目的是需要计算该用户在整个***上当前的总的缓存量(因为同一个用户的数据可能会通过上述N个访问源中的任意一个访问源进行出队或者入队，因此每个访问源均可能对该用户在***上的缓存量产生影响，即该用户在整个***上的缓存量对应的队列长度受到到每个访问源的影响)，所以需要控制器读取每个Block中记录的该用户对应的队列长度，进行整体数据总长度的计算。

本申请中的第一存储器和第二存储器可以包括易失性存储器(volatile memory)，例如随机存取存储器(random-access memory，RAM)；也可以包括非易失性存储器(non-volatile memory)，例如只读存储器(read-only memory，ROM)，快闪存储器(flash memory)，硬盘(hard disk drive，HDD)或固态硬盘(solid-state drive，SSD)；还可以包括上述种类的存储器的组合。可以理解的是，本发明实施例中的处理芯片的结构包括但不仅限于上述图1-图5中的结构。

请参见图6，是本发明实施例提供的一种数据处理方法的流程示意图，可应用于上述图1-图5中所述的处理芯片，该方法可以应用于处理装置，所述处理装置包括控制器、与所述控制器连接的第一存储器；其中，所述第一存储器包括N个存储块Block，每个Block包括N个一读一写1R1W存储器；N为大于1的整数，M为大于1的整数；该处理方法包括以下步骤S101-步骤S103。

步骤S101：在所述N个Block中的每个Block中，存储与所述第i个Block对应的目标数据S _i的数据长度。

具体地，所述第i个Block中存储M份所述S _i的数据长度，且M份所述S _i的数据长度分别存储在所述第i个Block的M个1R1W存储器中，一个1R1W存储器存储一份所述S _i的数据长度，i＝1、2、3、……N。

步骤S102：在第j个Block对应的目标数据S _j的数据长度变化时，读取所述第j个Block的其中一个1R1W存储器中存储的S _j的数据长度，并根据S _j的数据长度变化，更新所述第j个Block的M个1R1W存储器中存储的M份所述S _j的数据长度，其中，1≤j≤N，且j 为整数。

在一种可能的实现方式中，所述处理装置还包括：与所述控制器连接的第二存储器，以及与所述第二存储器连接的N个数据接口，所述N个数据接口与所述N个存储块Block一一对应；所述方法还包括：

步骤S103：通过所述N个数据接口中的每个数据接口，向所述第二存储器写入数据，或从所述第二存储器中读出数据。

步骤S104：将通过所述N个数据接口写入的数据存储至所述第二存储器；其中，与所述第i个Block对应的目标数据S _i，具体为通过所述第i个Block对应的数据接口存储至所述第二存储器中的数据。

在一种可能的实现方式中，每个1R1W存储器包括K个位宽为W的存储单元；S _i包括K类数据，将第k类数据s _k通过第i个Block对应的数据接口存储至所述第二存储器中的数据长度记为L _ik，k＝1、2、3、……K；所述S _i的数据长度包括K个数据长度：L _i1，L _i2，L _i3……L _iK；所述第i个Block中的M个1R1W存储器中的每一个1R1W存储器存储所述K个数据长度，且所述K个数据长度一一对应的存储在一个1R1W存储器中的K个所述存储单元中；

步骤S105：在第j个Block对应的数据接口有s _g写入或读出的情况下，读取所述第j个Block的其中一个1R1W存储器的对应存储单元中存储的L _jm，并根据s _g的长度变化，更新所述第j个Block中的M个1R1W存储器中的对应存储单元中存储的M份所述L _jm。

其中，M取大于或者等于N的整数，L _jm为第m类数据s _g通过第j个Block对应的数据接口存储至所述第二存储器中的数据长度，所述第m类数据为所述K类数据中的第m类数据，1≤m≤K，且m为整数。

在一种可能的实现方式中，所述方法还包括：

步骤S106：在同一个时钟周期内，从所述N个Block中的每一个Block的其中一个1R1W存储器中读取s _g的数据长度，并发送至所述计算单元；包括L _1m，L _2m，L _3m……L _Nm；

步骤S107：根据读取的所述s _g的数据长度，计算s _g在所述第二存储器中的数据总长度S，其中，

1≤m≤K，且m为整数，i＝1、2、3、……N。

在一种可能的实现方式中，所述方法还包括：

步骤S108：根据所述s _g在所述第二存储器中的数据总长度S，控制所述s _g的写入或读出。

在一种可能的实现方式中，所述方法还包括：

步骤S109：在同一个时钟周期内，分别从所述N个Block中的各个Block中读取T类数据存储的数据长度，并发送至所述计算单元；

具体地，所述T类数据为在同一个时钟周期内分别通过所述N个数据接口中的T个数据接口写入或者读出的数据；其中，从所述N个Block中的任意一个Block中读取所述T类数据的数据长度，包括从所述任意一个Block的T个1R1W存储器中分别读出的所述T类数据的数据长度，且从一个1R1W存储器中读出一类数据的数据长度，所述T类数据为所述K类数据中的其中T类数据，其中，M取大于或者等于N的整数，2≤T≤N；

步骤S110：分别计算所述T类数据在所述第二存储器中的数据总长度。

需要说明的是，本发明实施例中所描述的处理方法中的具体流程以及处理装置的相关功能，可参见上述图1-图5中所述的处理芯片实施例中的相关描述，此处不再赘述。

以上所述仅为本发明的几个实施例，本领域的技术人员依据申请文件公开的可以对本发明进行各种改动或变型而不脱离本发明的精神和范围。例如本发明实施例的附图中的各个部件具体形状或结构是可以根据实际应用场景进行调整的。

在本申请所提供的几个实施例中，应该理解到，所揭露的***、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个***，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者通过所述计算机可读存储介质进行传输。所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line，DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，数字通用光盘(digital versatile disc，DVD))、或者半导体介质(例如固态硬盘(solid state disk，SSD))等。

Claims

一种处理芯片，其特征在于，包括：控制器、与所述控制器连接的第一存储器；其中，所述第一存储器包括N个存储块Block，每个Block包括M个一读一写1R1W存储器；N为大于1的整数，M为大于1的整数；

所述N个Block中的第i个Block，用于存储与所述第i个Block对应的目标数据S _i的数据长度，i＝1、2、3、……N；其中，所述第i个Block中存储M份所述S _i的数据长度，且M份所述S _i的数据长度分别存储在所述第i个Block的M个1R1W存储器中，一个1R1W存储器存储一份所述S _i的数据长度；

所述控制器，用于在第j个Block对应的目标数据S _j的数据长度变化时，读取所述第j个Block的其中一个1R1W存储器中存储的S _j的数据长度，并根据S _j的数据长度变化，更新所述第j个Block的M个1R1W存储器中存储的M份所述S _j的数据长度，其中，1≤j≤N，且j为整数。
如权利要求1的处理芯片，其特征在于，所述芯片还包括：与所述控制器连接的第二存储器，以及与所述第二存储器连接的N个数据接口，所述N个数据接口与所述N个存储块Block一一对应；

所述N个数据接口中的每个数据接口，用于向所述第二存储器写入数据，或从所述第二存储器中读出数据；

所述第二存储器，用于存储通过所述N个数据接口写入的数据；

其中，与所述第i个Block对应的目标数据S _i，具体为通过所述第i个Block对应的数据接口存储至所述第二存储器中的数据。
如权利要求2的处理芯片，其特征在于，每个1R1W存储器包括K个位宽为W的存储单元；S _i包括K类数据，将第k类数据s _k通过第i个Block对应的数据接口存储至所述第二存储器中的数据长度记为L _ik，k＝1、2、3、……K；所述S _i的数据长度包括K个数据长度：L _i1，L _i2，L _i3……L _iK；所述第i个Block中的M个1R1W存储器中的每一个1R1W存储器存储所述K个数据长度，且所述K个数据长度一一对应的存储在一个1R1W存储器中的K个所述存储单元中；

所述控制器，具体用于在第j个Block对应的数据接口有s _g写入或读出的情况下，读取所述第j个Block的其中一个1R1W存储器的对应存储单元中存储的L _jg，并根据s _g的长度变化，更新所述第j个Block中的M个1R1W存储器中的对应存储单元中存储的M份所述L _jg，其中，M取大于或者等于N的整数；

其中，L _jg为第g类数据s _g通过第j个Block对应的数据接口存储至所述第二存储器中的数据长度，所述第g类数据为所述K类数据中的第g类数据，1≤g≤K，且g为整数。
如权利要求3所述的处理芯片，其特征在于，所述处理芯片还包括与所述控制器和所述第一存储器连接的计算单元：

所述控制器，还用于在同一个时钟周期内，从所述N个Block中的每一个Block的其中一个1R1W存储器中读取s _g的数据长度，并发送至所述计算单元；包括L _1g，L _2g，L _3g……L _Ng；

所述计算单元，用于根据读取的所述s _g的数据长度，计算s _g在所述第二存储器中的数据总长度S，其中，
1≤g≤K，且g为整数，i＝1、2、3、……N。
如权利要求4所述的处理芯片，其特征在于，

所述控制器，还用于根据所述s _g在所述第二存储器中的数据总长度S，控制所述s _g的写入或读出。
如权利要求1-3任意一项所述的处理芯片，其特征在于，所述处理芯片还包括与所述控制器和所述第一存储器连接的计算单元：

所述控制器，还用于在同一个时钟周期内，分别从所述N个Block中的各个Block中读取T类数据存储的数据长度，并发送至所述计算单元；所述T类数据为在同一个时钟周期内分别通过所述N个数据接口中的T个数据接口写入或者读出的数据；其中，从所述N个Block中的任意一个Block中读取所述T类数据的数据长度，包括从所述任意一个Block的T个1R1W存储器中分别读出的所述T类数据的数据长度，且从一个1R1W存储器中读出一类数据的数据长度，所述T类数据为所述K类数据中的其中T类数据，其中，M取大于或者等于N的整数，2≤T≤M；

所述计算单元，用于分别计算所述T类数据在所述第二存储器中的数据总长度。
一种处理方法，其特征在于，应用于处理装置，所述处理装置包括控制器、与所述控制器连接的第一存储器；其中，所述第一存储器包括N个存储块Block，每个Block包括M个一读一写1R1W存储器；N为大于1的整数，M为大于1的整数；所述方法包括：

在所述N个Block中的每个Block中，存储与所述第i个Block对应的目标数据S _i的数据长度，i＝1、2、3、……N；其中，所述第i个Block中存储M份所述S _i的数据长度，且M份所述S _i的数据长度分别存储在所述第i个Block的M个1R1W存储器中，一个1R1W存储器存储一份所述S _i的数据长度；

在第j个Block对应的目标数据S _j的数据长度变化时，读取所述第j个Block的其中一个1R1W存储器中存储的S _j的数据长度，并根据S _j的数据长度变化，更新所述第j个Block的M个1R1W存储器中存储的M份所述S _j的数据长度，其中，1≤j≤N，且j为整数。
如权利要求7的处理方法，其特征在于，所述处理装置还包括：与所述控制器连接的第二存储器，以及与所述第二存储器连接的N个数据接口，所述N个数据接口与所述N个存储块Block一一对应；所述方法还包括：

通过所述N个数据接口中的每个数据接口，向所述第二存储器写入数据，或从所述第二存储器中读出数据；

将通过所述N个数据接口写入的数据存储至所述第二存储器；其中，与所述第i个Block对应的目标数据S _i，具体为通过所述第i个Block对应的数据接口存储至所述第二存储器中的数据。
如权利要求8的处理方法，其特征在于，每个1R1W存储器包括K个位宽为W的存储单元；S _i包括K类数据，将第k类数据s _k通过第i个Block对应的数据接口存储至所述第二存储器中的数据长度记为L _ik，k＝1、2、3、……K；所述S _i的数据长度包括K个数据长度：L _i1，L _i2，L _i3……L _iK；所述第i个Block中的M个1R1W存储器中的每一个1R1W存储器存储所述K个数据长度，且所述K个数据长度一一对应的存储在一个1R1W存储器中的K个所述存储单元中；

在第j个Block对应的数据接口有s _g写入或读出的情况下，读取所述第j个Block的其中一个1R1W存储器的对应存储单元中存储的L _jg，并根据s _g的长度变化，更新所述第j个Block中的M个1R1W存储器中的对应存储单元中存储的M份所述L _jg；其中，M取大于或者等于N的整数，L _jg为第g类数据s _g通过第j个Block对应的数据接口存储至所述第二存储器中的数据长度，所述第g类数据为所述K类数据中的第g类数据，1≤g≤K，且g为整数。
如权利要求9所述的处理方法，其特征在于，所述方法还包括：

在同一个时钟周期内，从所述N个Block中的每一个Block的其中一个1R1W存储器中读取s _g的数据长度，并发送至所述计算单元；包括L _1g，L _2g，L _3g……L _Ng；

根据读取的所述s _g的数据长度，计算s _g在所述第二存储器中的数据总长度S，其中，
1≤g≤K，且g为整数，i＝1、2、3、……N。
如权利要求10所述的处理方法，其特征在于，所述方法还包括：

根据所述s _g在所述第二存储器中的数据总长度S，控制所述s _g的写入或读出。
如权利要求7-9任意一项所述的处理方法，其特征在于，所述方法还包括：

在同一个时钟周期内，分别从所述N个Block中的各个Block中读取T类数据存储的数据长度，并发送至所述计算单元；所述T类数据为在同一个时钟周期内分别通过所述N个数据接口中的T个数据接口写入或者读出的数据；其中，从所述N个Block中的任意一个Block中读取所述T类数据的数据长度，包括从所述任意一个Block的T个1R1W存储器中分别读出的所述T类数据的数据长度，且从一个1R1W存储器中读出一类数据的数据长度，所述T类数据为所述K类数据中的其中T类数据，其中，M取大于或者等于N的整数，2≤T≤N；

分别计算所述T类数据在所述第二存储器中的数据总长度。
一种电子设备，其特征在于，包括：

如权利要求1至6任一所述的处理芯片，以及耦合于所述处理芯片的分立器件。