CN112559441A

CN112559441A - 一种数字信号处理器的控制方法

Info

Publication number: CN112559441A
Application number: CN202011453046.0A
Authority: CN
Inventors: 刘雷波; 王垚; 魏少军
Original assignee: Wuxi Research Institute of Applied Technologies of Tsinghua University
Current assignee: Wuxi Research Institute of Applied Technologies of Tsinghua University
Priority date: 2020-12-11
Filing date: 2020-12-11
Publication date: 2021-03-26

Abstract

本发明涉及通信基带电路技术领域，具体公开了一种数字信号处理器的控制方法，其中，数字信号处理器包括可重构处理器、配置控制器和数据存储器，可重构处理器包括多个处理单元阵列，每个处理器单元阵列均包括多个处理单元，配置控制器包括多个配置存储器单元和多个配置控制器单元，配置存储器单元与配置控制器单元一一对应，数据存储器包括多个共享存储器，控制方法包括：初始化共享存储器和配置存储器单元；启动处理单元阵列的任务调度器；在确定处理单元阵列的任务完成后，关闭计时器打印数据；将经过处理单元阵列处理完成的数据搬运至共享存储器。本发明提供的数字信号处理器的控制方法具有高性能低功耗的优势。

Description

一种数字信号处理器的控制方法

技术领域

本发明涉及通信基带电路技术领域，尤其涉及一种数字信号处理器的控制方法。

背景技术

近些年来，随着对环境保护的重视，人们越来越多地追求低碳的生活方式，这也对通信***提出了功耗的要求。除此之外，从物流、成本和电池技术的角度来看，不断增加电力消耗也是不能容忍的。在通信***及基带处理电路中，功耗提高比数据传输速率的数量级提高得少，才能保持能量效率提高。能量效率的提高对IoT（The Internet of Things，物联网）的应用至关重要，因为大多数的IoT通信设备是由电池供电的，并且需要在没有人为干预的情况下工作很长时间。这种情况下电池的使用周期一般要达到10年甚至更长。对于IoT、M2M（Machine-to-Machine/Man）通信***来说，除了提高能量效率之外，还需要一系列的能量管理技术来节约能量。除此之外，还可以利用可再生能源为设备供电，如太阳能电池等。如何提高通信***和电路的能量效率以及设备电池的使用周期是下一代通信技术亟待解决的问题。与此同时，通信基带电路设计中，面积的降低将会一定程度带来功耗和成本的降低。如何降低芯片面积也将是一个亟待解决的问题。

发明内容

本发明提供了一种数字信号处理器的控制方法，解决相关技术中存在的性能低且功耗高的问题。

作为本发明的一个方面，提供一种数字信号处理器的控制方法，其中，所述数字信号处理器包括可重构处理器、配置控制器和数据存储器，所述配置控制器和所述数据存储器均与所述可重构处理器通信连接，所述可重构处理器包括多个处理单元阵列，每个所述处理器单元阵列均包括多个处理单元，所述配置控制器包括多个配置存储器单元和多个配置控制器单元，所述配置存储器单元与所述配置控制器单元一一对应，所述数据存储器包括多个共享存储器，所述数字信号处理器的控制方法包括：

初始化所述共享存储器和配置存储器单元；

启动处理单元阵列的任务调度器；

在确定处理单元阵列的任务完成后，关闭计时器打印数据；

将经过处理单元阵列处理完成的数据搬运至所述共享存储器。

进一步地，所述数字信号处理器的控制方法还包括在所述启动处理单元阵列的任务调度器之后进行的：

所述处理单元阵列执行数据处理任务。

进一步地，所述处理单元阵列执行数据处理任务，包括：

确定所述处理单元阵列的迭代次数及数据采样率；

所述处理单元阵列中的每个处理单元均执行计算任务；

在确定所有所述处理单元阵列均完成计算后，输出处理单元阵列计算完成信号。

进一步地，所述处理单元阵列中的每个处理单元均执行计算任务，包括：

所述处理单元阵列中的每个处理单元均根据处理单元的数据以及操作码进行计算；

判断当前处理单元阵列中的每个处理单元是否均计算完成；

若均计算完成，则输出处理单元计算完成信号。

进一步地，所述处理单元阵列中的每个处理单元均执行计算任务还包括：

根据每个处理单元的数据采样率使能操作码确定每个所述处理单元的数据以及操作码。

根据每个处理单元的数据采样率将数据依赖无关的操作码前移，以确定每个所述处理单元的数据及操作码。

进一步地，所述处理单元阵列执行数据处理任务还包括：

在确定所述处理单元阵列并非全部完成计算后，返回所述处理单元阵列中的每个处理单元均执行计算任务的步骤。

本发明提供的数字信号处理器的控制方法，基于可重构处理器实现，具有灵活性高的优势，且通过对可重构处理器的控制实现数字信号处理，最终可以实现提高数字信号处理的性能，且能够降低功耗的目的。

附图说明

附图是用来提供对本发明的进一步理解，并且构成说明书的一部分，与下面的具体实施方式一起用于解释本发明，但并不构成对本发明的限制。

图1为本发明提供的数字信号处理器的控制方法的流程图。

图2为本发明提供的数字信号处理器的控制方法的一种具体地实施方式流程图。

图3为本发明提供的数字信号处理器的控制方法的另一种具体地实施方式流程图。

图4为本发明提供的处理单元阵列的可持续自适应配置信息图表。

图5为本发明提供的处理单元阵列的可持续自适应配置信息示意图。

图6为本发明提供的处理单元阵列的配置流程图。

具体实施方式

需要说明的是，在不冲突的情况下，本发明中的实施例及实施例中的特征可以相互结合。下面将参考附图并结合实施例来详细说明本发明。

为了使本领域技术人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包括，例如，包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

在本实施例中提供了一种数字信号处理器的控制方法，其中，所述数字信号处理器包括可重构处理器、配置控制器和数据存储器，所述配置控制器和所述数据存储器均与所述可重构处理器通信连接，所述可重构处理器包括多个处理单元阵列，每个所述处理器单元阵列均包括多个处理单元，所述配置控制器包括多个配置存储器单元和多个配置控制器单元，所述配置存储器单元与所述配置控制器单元一一对应，所述数据存储器包括多个共享存储器，图1是根据本发明实施例提供的数字信号处理器的控制方法的流程图，如图1所示，所述数字信号处理器的控制方法包括：

S110、初始化所述共享存储器和配置存储器单元；

S120、启动处理单元阵列的任务调度器；

S130、在确定处理单元阵列的任务完成后，关闭计时器打印数据；

S140、将经过处理单元阵列处理完成的数据搬运至所述共享存储器。

本发明实施例提供的数字信号处理器的控制方法，基于可重构处理器实现，具有灵活性高的优势，且通过对可重构处理器的控制实现数字信号处理，最终可以实现提高数字信号处理的性能，且能够降低功耗的目的。

具体地，所述数字信号处理器的控制方法还包括在所述启动处理单元阵列的任务调度器之后进行的：

所述处理单元阵列执行数据处理任务。

具体地，所述处理单元阵列执行数据处理任务，包括：

确定所述处理单元阵列的迭代次数及数据采样率；

所述处理单元阵列中的每个处理单元均执行计算任务；

具体地，如图2和图3所示，所述处理单元阵列中的每个处理单元均执行计算任务，包括：

判断当前处理单元阵列中的每个处理单元是否均计算完成；

若均计算完成，则输出处理单元计算完成信号。

在一些实施方式中，所述处理单元阵列中的每个处理单元均执行计算任务还包括：

需要说明的是，如图3和图4所示，所述处理单元阵列执行数据处理任务还包括：

下面对本发明实施例中的具体实现过程进行详细说明。

（1）PEA顶层配置信息(PEA_TOP)

在一个配置包中，有一行描述PEA状态的配置信息(PEA_TOP)，其中包括配置包的迭代次数(ITER_PEA,32比特)。它是负责处理迭代计算的。如果ITER_PEA是n(n≠0)，所有的PE都会完成所有的配置行的执行，并继续执行刚刚执行的配置包n次。在PEA_TOP配置信息的每一行中，有32位的保留位。通过保留位去确保相同配置只会加载一次。

（2）PE顶层配置信息(PE_TOP)

每个PE都有一个顶层的配置信息，包括该PE配置信息在配置包中的行数(COUNT，8位)、PE的迭代次数(ITER_PE，7位)、迭代中PE的起始行数(ITER_LINE，5位)和定点移位信息(FIX，6位)。每行有38位的保留位。ITER_PE用于更简单地描述具有复杂依赖关系的流水线。如果ITER_PE是n(n≠0)，则PE将完成所有配置行，并继续执行刚执行的PE配置行㼿次。然后完成配置包中该PE配置信息的执行。在由一系列PE组成的流水线中，通常会有一些位于流水线中间的PE在流水初始化空拍之后不间断地执行部分配置信息。此时，仅仅描述PE的顶层迭代次数是不够的，因为PE的每个迭代默认从第0行(初始行)开始。在每次迭代中，PE将再次执行初始化并产生流水初始化空拍，这将导致流水线无法流动起来。为了解决初始化和空拍对PE流水线的影响，在PE的顶层引入了ITER_LINE。如果ITER_LINE=㼿，则执行该PE配置信息时，除了第一次迭代需要从第0行配置信息开始执行外，其他的㼿次迭代都是将从第㼿行配置信息开始执行。另外，PE的顶层配置信息包括“FIX”字段，用于存储定点移位信息。此字段指定PE中复数乘法的移位信息。这样，PE中的所有复数乘法和移位配置信息都可以从两行缩减为一行。

（3）PE配置信息(PE_CONF)

每个配置信息行包含PE的三个输入和一个输出，即：输入1(IN2)、输入2(IN2)、输入3(IN3)和输出(OUT1)。每一个都是13位。IN1、IN2和OUT1的前4位是用来描述数据的不同来源，包括路由、SM、立即数、GR等。此外，还有一个5位的配置信息来描述ALU的不同功能(即操作码OpCode)。由于一个PEA可以访问两个SM，因此有1位配置信息(OUT1_s)来选择对应的SM。每个PE行中有本配置行迭代次数配置字(ITER，6位)，这可以压缩相同的配置信息行。如果该字段是n(n≠0)，那么该PE将继续重复执行刚才执行的配置行㼿次，随后才完成该行的配置信息的执行。为了更清楚和完全地描述迭代行为，在每一行中引入了迭代间隔(II，3位)字段来描述当数据依赖关系较强时的迭代处理。当II是n(n≠0)，该PE将在执行配置行后每次都空闲n个周期，随后再继续执行。如果ITER是0、II是1、n≠0，那么II字段仍然有效。在这个时候，该PE执行配置行，随后空闲n个周期再执行下一行配置信息。因此，II可以替换大部分空闲配置信息行。当64位不能完全表达配置信息时，配置信息可以通过是否存在配置信息行扩展字段(INC_EX，1位)来进行扩展。在PE配置信息扩展(PE_CONF_EX)中，包括IN1、IN2、OUT1、迭代次数、和迭代间隔字段。同时，为了支持在迭代过程中对地址的连续访问，一个5位的地址增量字段也包含在IN1、IN2和OUT1的扩展配置信息中。

数字信号处理算法有大量的矩阵和向量运算。在PEA计算过程中，不同PE需要同时访问存储器同一bank的不同地址。因此，会有大量的存储器访问冲突。矩阵向量乘法也有类似的存储器访问冲突问题。为了优化可重构结构以适应大量矩阵和向量运算，本节提出了一种基于PEA的自适应矩阵-向量脉动阵列(OMSA)结构。根据配置信息，所有PEA都被配置为脉动阵列。值得说明的是，SM仲裁器是解决不同PE需要同时访问存储器同一bank的相同地址的问题。而OMSA技术是解决存储器访问冲突的问题，即不同PE需要同时访问存储器同一bank的不同地址的问题。OMSA有五种类型，可以根据算法和计算规模进行选择。

PEA的一个任务被命名为配置包，它包含一行PEA顶层配置信息(PEA_TOP，64位)和16个PE的配置信息。每个PE的配置信息包含一行PE顶层配置信息(PE_TOP，64位)和一些PE配置信息行(PE_CONF，64位)。当64位不能完全表示配置信息时，采用扩展配置信息行。在扩展的配置信息中加入一些不常用的语义，如32位立即数、大于8的迭代间隔等，这样可以保证各种语义都能被充分表达，并且在常见情况下配置信息仍然是64位的。在接收到使能信号后，PE将从第0行依次执行PE的配置信息。为了压缩配置信息，实现算法中的一些不规则循环，在配置信息行中有迭代次数定义，从而可以重复执行配置信息行。三个迭代中的每一个都可以在配置信息中指定为常量或在GR中的值。PEA的配置信息如图4所示。

设计出用于数字信号处理的片上任务管理器，动态地协调不同粒度PE 阵列间和嵌入式控制器的关系，控制PE 阵列进行并发的配臵和运算；实现对数据流和配置信息流的管理。

考虑到数字信号处理中频繁出现抽取差值的情况，***主频与数据信号的实际频率不同，针对这种情况基于实际需求从低功耗和高性能2方面考虑，（1）低功耗，结合配置信息中PE_TOP及PE字段中定长循环及Wait，对PE配置中的ALU进行拆解，如多通道多项数字信号处理算法，当数据信号频率远小于***主频时可通过添加Wait让ALU中的乘法器disable，并通过PE分时复用基于PEA、PE任务调度，cycle级关闭打开PEA、PE阵列；（2）高性能，通过数据相关性分析，基于配置信息或任务调度器将没有数据相关的算法前移。

可以理解的是，以上实施方式仅仅是为了说明本发明的原理而采用的示例性实施方式，然而本发明并不局限于此。对于本领域内的普通技术人员而言，在不脱离本发明的精神和实质的情况下，可以做出各种变型和改进，这些变型和改进也视为本发明的保护范围。

Claims

1.一种数字信号处理器的控制方法，其特征在于，所述数字信号处理器包括可重构处理器、配置控制器和数据存储器，所述配置控制器和所述数据存储器均与所述可重构处理器通信连接，所述可重构处理器包括多个处理单元阵列，每个所述处理器单元阵列均包括多个处理单元，所述配置控制器包括多个配置存储器单元和多个配置控制器单元，所述配置存储器单元与所述配置控制器单元一一对应，所述数据存储器包括多个共享存储器，所述数字信号处理器的控制方法包括：

初始化所述共享存储器和配置存储器单元；

启动处理单元阵列的任务调度器；

在确定处理单元阵列的任务完成后，关闭计时器打印数据；

2.根据权利要求1所述的数字信号处理器的控制方法，其特征在于，所述数字信号处理器的控制方法还包括在所述启动处理单元阵列的任务调度器之后进行的：

所述处理单元阵列执行数据处理任务。

3.根据权利要求2所述的数字信号处理器的控制方法，其特征在于，所述处理单元阵列执行数据处理任务，包括：

确定所述处理单元阵列的迭代次数及数据采样率；

所述处理单元阵列中的每个处理单元均执行计算任务；

4.根据权利要求3所述的数字信号处理器的控制方法，其特征在于，所述处理单元阵列中的每个处理单元均执行计算任务，包括：

判断当前处理单元阵列中的每个处理单元是否均计算完成；

若均计算完成，则输出处理单元计算完成信号。

5.根据权利要求4所述的数字信号处理器的控制方法，其特征在于，所述处理单元阵列中的每个处理单元均执行计算任务还包括：

6.根据权利要求4所述的数字信号处理器的控制方法，其特征在于，所述处理单元阵列中的每个处理单元均执行计算任务还包括：

7.根据权利要求3所述的数字信号处理器的控制方法，其特征在于，所述处理单元阵列执行数据处理任务还包括：