CN114237548A

CN114237548A - 基于非易失性存储器阵列的复数点乘运算的方法及***

Info

Publication number: CN114237548A
Application number: CN202111382949.9A
Authority: CN
Inventors: 缪峰; 梁世军; 王聪; 阮恭杰
Original assignee: Nanjing University
Current assignee: Nanjing University
Priority date: 2021-11-22
Filing date: 2021-11-22
Publication date: 2022-03-25
Anticipated expiration: 2041-11-22
Also published as: CN114237548B

Abstract

本发明公开了一种基于非易失性存储器阵列的复数点乘运算的方法，包括以下步骤：(1)n维复数输入向量x转化为2n维实数向量X；(2)m*n维的复数输入矩阵h转化为2m*2n维的实数矩阵H；(3)根据矩阵H设计存内计算硬件阵列；(4)在阵列上实现矩阵向量点乘运算；(5)将2m维实数输出向量Y转化为m维复数向量y。本发明还公开一种基于非易失性存储器阵列的复数点乘运算的***。本发明基于存内计算硬件阵列完成了复数域上任意维的并行矩阵向量点乘运算，成功地将矩阵向量点乘运算从实数域推广到了复数域上，扩大了其适用范围，且这种方法具有普适性。

Description

基于非易失性存储器阵列的复数点乘运算的方法及***

技术领域

本发明涉及一种存内计算，尤其涉及一种基于非易失性存储器阵列的复数点乘运算的方法及***。

背景技术

随着社会对算力需求的剧增，现有的计算架构遭遇功耗墙、性能墙、内存墙、摩尔定律趋缓等挑战，迫切需要计算架构的创新，解决路径主要体现在两点：突破计算架构和打破存储墙，而存内计算就是一种属于打破存储墙的技术。

传统的冯诺伊曼架构是计算机的经典架构，同时也是目前计算机以及处理器芯片的主流架构。在冯诺伊曼架构中，计算(处理)单元和内存完全分离，在计算过程中，计算单元根据指令从内存中读取数据，在计算单元中完成计算，结果再存回内存。而存内计算与传统的冯诺伊曼架构的主要不同就是把计算嵌入到内存里面去，内存同时担任计算和存储的任务，在存储/读取数据的同时完成运算。存内计算的集成度高、功耗低等特性使其有望成为未来嵌入式人工智能(如智能IoT)的重要基础技术。

利用现有的存内计算技术进行矩阵向量点乘运算，无论是向量还是矩阵，都属于实数域范畴，所以现有的存内计算技术不具备在复数域上进行并行矩阵向量点乘运算的能力，这一完备性的缺失大大限制了存内计算技术的适用范围和应用场景。

发明内容

发明目的：本发明旨在提供一种基于非易失性存储器阵列的复数点乘运算的方法及***，解决无法在复数域上实现并行矩阵向量点乘运算的问题。

技术方案：本发明所述的基于非易失性存储器阵列的复数点乘运算的方法，包括以下步骤：

(1)n维复数输入向量x转化为2n维实数向量X；

(2)m*n维的复数输入矩阵h转化为2m*2n维的实数矩阵H；

(3)根据矩阵H设计存内计算硬件阵列；

(4)在阵列上实现矩阵向量点乘运算；

(5)将2m维实数输出向量Y转化为m维复数输出向量y。

步骤(1)中包括以下步骤：

(11)令输入向量x的第a个复数向量元x_a＝x_ar+jx_ai，

其中，x_ar为x_a的实部，x_ai为x_a的虚部，j为虚数单位，从1到n遍历a；

(12)将x_ar作为实数向量X的第2a-1个向量元X_2a-1，将x_ai作为实数向量X的第2a个向量元X_2a。

步骤(2)中包括以下步骤：

(21)令m*n维的复数输入矩阵h的每个复数矩阵元h_bc＝h_bcr+jh_bci，

其中，h_bc表示矩阵h第b行第c列的矩阵元，h_bcr为h_bc的实部，h_bci为h_bc的虚部，j为虚数单位；从1到m遍历b，从1到n遍历c；

(22)将h_bcr作为矩阵H第2b-1行第2c-1列的矩阵元H_2b-1，2c-1和第2b行第2c列的矩阵元H_2b，2c，将h_bci作为矩阵H第2b行第2c-1列的矩阵元H_2b，2c-1，将-h_bci作为矩阵H第2b-1行第2c列的矩阵元H_2b-1，2c。

步骤(3)中包括以下步骤：

(31)矩阵H取转置得到决定阵列结构的矩阵G，即G＝H^T；

(32)由2n*2m个存储器单元构成2n行2m列的阵列，其中第d行第e列的存储器单元的电导由矩阵G的矩阵元G_de决定，其中G_de表示矩阵G第d行第e列的矩阵元；从1到2n遍历d，从1到2m遍历e。

步骤(4)中包括以下步骤：

(41)令阵列第g行输入等于2n维实数输入向量X的第g个向量元X_g大小的电压；从1到2n遍历g；

(42)获得第k列电流大小作为2m维实数输出向量Y的第k个向量元Y_k，从1到2m遍历k。

步骤(5)中将2m维实数输出向量Y的第2f-1个向量元记为Y_fr，第2f个向量元记为Y_fi，用Y的第2f-1个实数向量元Y_fr和第2f个实数向量元Y_fi组合成一个复数y_f＝Y_fr+jY_fi，

其中，Y_fr为y_f的实部，Y_fi为y_f的虚部，j为虚数单位；然后将y_f作为复数输出向量y的第f个向量元，从1到m遍历f。

本发明所述的基于非易失性存储器阵列的复数点乘运算的***，包括输入向量转化单元、输入矩阵转化单元、存内计算阵列单元、点乘运算单元和输出向量转化单元；

所述输入向量转化单元将n维复数输入向量x转化为2n维实数向量X；所述输入矩阵转化单元将m*n维的复数输入矩阵h转化为2m*2n维的实数矩阵H；所述存内计算阵列单元根据矩阵H设计；所述点乘运算单元在阵列上实现X和H矩阵向量点乘运算，获得2m维实数输出向量Y；所述输出向量转化单元将2m维实数输出向量Y转化为m维复数输出向量y。

所述存内计算阵列单元为非易失性存储器阵列，所述阵列结构矩阵G等于矩阵H的转置，即G＝H^T。

所述输入向量转换单元包括可编程多通道信号源，对所述信号源编程，当计算机输入n维复数向量x时，信号源并行输出2n路直流电压，第2k-1路电压的大小等于x_kr，第2k路电压大小等于x_ki，从1到n遍历k；第k路的直流电压作为存内计算硬件阵列第k行的输入电压。

所述输出向量转换单元包括可编程多通道示波器，对所述示波器编程，当示波器接收到2m路直流电流后，在计算机上输出一m维复数向量y。

有益效果：与现有技术相比，本发明具有如下显著优点：基于存内计算硬件阵列完成了复数域上任意维的并行矩阵向量点乘运算，成功地将矩阵向量点乘运算从实数域推广到了复数域上，扩大了其适用范围，且这种方法具有普适性。

附图说明

图1为本发明方法的示意图；

图2为本发明***的示意图；

图3为本发明实施例的示意图。

具体实施方式

下面结合附图对本发明的技术方案作进一步说明。

由图1可知，本发明所述基于非易失性存储器阵列的复数点乘运算的方法，其特征在于：包括以下步骤：

步骤(1)将n维复数输入向量x转化为2n维实数向量X；具体包括以下步骤：

(11)令输入向量x的第a个复数向量元x_a＝x_ar+jx_ai，

步骤(2)将m*n维的复数输入矩阵h转化为2m*2n维的实数矩阵H；具体包括以下步骤：

步骤(3)根据矩阵H设计存内计算硬件阵列；具体包括以下步骤：

(31)矩阵H取转置得到决定阵列结构的矩阵G，即G＝H^T；

步骤(4)在阵列上实现矩阵向量点乘运算；具体包括以下步骤：

步骤(5)将2m维实数输出向量Y转化为m维复数输出向量y。

将2m维实数输出向量Y的第2f-1个向量元记为Y_fr，第2f个向量元记为Y_fi，用Y的第2f-1个实数向量元Y_fr和第2f个实数向量元Y_fi组合成一个复数y_f＝Y_fr+jY_fi，其中，Y_fr为y_f的实部，Y_fi为y_f的虚部，j为虚数单位；然后将y_f作为复数输出向量y的第f个向量元，从1到m遍历f。

由图2可知，本发明所述的基于非易失性存储器阵列的复数点乘运算的***，包括输入向量转化单元、输入矩阵转化单元、存内计算阵列单元、点乘运算单元和输出向量转化单元；

所述输入向量转化单元将n维复数输入向量x转化为2n维实数向量X；所述输入矩阵转化单元将m*n维的复数输入矩阵h转化为2m*2n维的实数矩阵H；所述存内计算阵列单元根据矩阵H设计；所述点乘运算单元在阵列上实现X和H矩阵向量点乘运算，获得2m维实数输出向量Y；所述输出向量转化单元将2m维实数输出向量Y转化为m维复数输出向量y。所述点乘运算单元为非易失性存储器阵列，阵列结构矩阵G等于矩阵H的转置，即G＝H^T。

本实施例中，输入向量转化单元由一可编程多通道信号源实现，对信号源进行编程，当计算机输入一复数向量

时，信号源并行输出2n路直流电压，第2k-1路电压的大小等于x_kr，第2k路电压大小等于x_ki，从1到n遍历k。

第k路的直流电压作为存内计算硬件阵列第k行的输入电压。

本实施例中，输出向量转化单元由一可编程多通道示波器实现，对示波器进行编程，当示波器接收到2m路直流电流后，在计算机上输出一m维复数向量y：

其中y_sr为第2s-1路电流的大小，y_si为第2s路电流的大小，从1到m遍历s。

其中，第s路的直流电流即为存内计算硬件阵列第s列的输出电流。

如图3所示，本实施例中实现了一个四行四列的存内计算硬件阵列，该阵列对应的复数点乘运算过程如下：

步骤(1)输入向量的变形。

二维复数输入向量x设为

则变形后的四维实数向量X为

步骤(2)输入矩阵的变形：

2*2维的复数输入矩阵h设为

则变形后的4*4维的实数矩阵H为

步骤(3)存内计算硬件阵列的设计：

对矩阵H取转置得到决定阵列结构的矩阵G，即

步骤(4)在阵列上进行矩阵向量点乘运算：

利用工作在实数域的存内计算硬件阵列来并行计算实数向量X和实数矩阵H的点积。

步骤(5)输出向量的变形：

四维的实数输出向量Y为

则变形后的二维复数输出向量y为

通过在上述存内计算硬件阵列上加并行电压、得并行电流的方式，实现了复数域上的矩阵向量点乘运算。

Claims

1.一种基于非易失性存储器阵列的复数点乘运算的方法，其特征在于：包括以下步骤：

(1)n维复数输入向量x转化为2n维实数向量X；

(2)m*n维的复数输入矩阵h转化为2m*2n维的实数矩阵H；

(3)根据矩阵H设计存内计算硬件阵列；

(4)在存内计算硬件阵列上实现矩阵向量点乘运算；

(5)将2m维实数输出向量Y转化为m维复数向量y。

2.根据权利要求1所述的基于非易失性存储器阵列的复数点乘运算的方法，其特征在于：步骤(1)中包括以下步骤：

(11)令输入向量x的第a个复数向量元x_a＝x_ar+jx_ai，

3.根据权利要求1所述的基于非易失性存储器阵列的复数点乘运算的方法，其特征在于：步骤(2)中包括以下步骤：

4.根据权利要求1所述的基于非易失性存储器阵列的复数点乘运算的方法，其特征在于：步骤(3)中包括以下步骤：

(31)矩阵H取转置得到决定阵列结构的矩阵G，即G＝H^T；

5.根据权利要求1所述的基于非易失性存储器阵列的复数点乘运算的方法，其特征在于：步骤(4)中包括以下步骤：

6.根据权利要求1所述的基于非易失性存储器阵列的复数点乘运算的方法，其特征在于：步骤(5)中将2m维实数输出向量Y的第2f-1个向量元记为Y_fr，第2f个向量元记为Y_fi，用Y的第2f-1个实数向量元Y_fr和第2f个实数向量元Y_fi组合成一个复数y_f＝Y_fr+jY_fi，

7.一种基于非易失性存储器阵列的复数点乘运算的***，其特征在于：包括输入向量转换单元、输入矩阵转换单元、存内计算阵列单元、点乘运算单元和输出向量转换单元；

所述输入向量转换单元将n维复数输入向量x转化为2n维实数向量X；

所述输入矩阵转换单元将m*n维的复数输入矩阵h转化为2m*2n维的实数矩阵H；

所述存内计算阵列单元根据矩阵H设计；

所述点乘运算单元在阵列上实现X和H矩阵向量点乘运算，获得2m维实数输出向量Y；

所述输出向量转换单元将2m维实数输出向量Y转化为m维复数输出向量y。

8.根据权利要求7所述的基于非易失性存储器阵列的复数点乘运算的***，其特征在于：所述存内计算阵列单元为非易失性存储器阵列，所述阵列结构矩阵G等于矩阵H的转置，即G＝HT。

9.根据权利要求7所述的基于非易失性存储器阵列的复数点乘运算的***，其特征在于：所述输入向量转换单元包括可编程多通道信号源，对所述信号源编程，当计算机输入n维复数向量x时，信号源并行输出2n路直流电压，第2k-1路电压的大小等于x_kr，第2k路电压大小等于x_ki，从1到n遍历k；第k路的直流电压作为存内计算硬件阵列第k行的输入电压。

10.根据权利要求7所述的基于非易失性存储器阵列的复数点乘运算的***，其特征在于：所述输出向量转换单元包括可编程多通道示波器，对所述示波器编程，当示波器接收到2m路直流电流后，在计算机上输出m维复数向量y。