CN107229596B - 非流水线式快速傅立叶转换处理器及其运算控制方法 - Google Patents

非流水线式快速傅立叶转换处理器及其运算控制方法 Download PDF

Info

Publication number
CN107229596B
CN107229596B CN201610177927.1A CN201610177927A CN107229596B CN 107229596 B CN107229596 B CN 107229596B CN 201610177927 A CN201610177927 A CN 201610177927A CN 107229596 B CN107229596 B CN 107229596B
Authority
CN
China
Prior art keywords
register
data
result
stores
subtraction result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610177927.1A
Other languages
English (en)
Other versions
CN107229596A (zh
Inventor
董旭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ali Corp
Original Assignee
Ali Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ali Corp filed Critical Ali Corp
Priority to CN201610177927.1A priority Critical patent/CN107229596B/zh
Publication of CN107229596A publication Critical patent/CN107229596A/zh
Application granted granted Critical
Publication of CN107229596B publication Critical patent/CN107229596B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/141Discrete Fourier transforms
    • G06F17/142Fast Fourier transforms, e.g. using a Cooley-Tukey type algorithm

Landscapes

  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Discrete Mathematics (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Complex Calculations (AREA)

Abstract

本发明提供一种非流水线式快速傅立叶转换处理器及其运算控制方法。转换处理器包括一控制逻辑电路、一第一处理核心及一第二处理核心。第一处理核心耦接控制逻辑电路。第二处理核心耦接控制逻辑电路及第一处理核心。控制逻辑电路分别提供一第一控制指令以及一第二控制指令至第一处理核心及第二处理核心。第一处理核心受控于第一控制指令以依据多个同相运算数据及多个正交中间数据进行快速傅立叶转换。第二处理核心受控于第二控制指令以依据多个正交运算数据及多个同相中间数据进行快速傅立叶转换。

Description

非流水线式快速傅立叶转换处理器及其运算控制方法
技术领域
本发明是有关于一种快速傅立叶转换处理器,且特别是有关于一种非流水线式快速傅立叶转换处理器及其运算控制方法。
背景技术
由于具有传输效率或频谱效率高、抗多径干扰能力强、信号通道估计性能良好、适于移动接收等优势,地面数字多媒体/电视广播***(DTMB)逐渐成为中国的数字多媒体/电视传输标准。并且,3780点傅立叶转换(FFT)和逆傅立叶转换(IFFT)模块已成为中国地面数字多媒体/电视广播***的重要模块之一。由于上述模块无法直接利用成熟的基2(base-2)和基4(base-4)等演算法进行转换,因此3780点傅立叶转换和逆傅立叶转换模块需要一个具有好的计算效率和合理的硬件资源的演算法和硬件电路实现方法。
发明内容
本发明提供一种非流水线式快速傅立叶转换处理器及其运算控制方法,非流水线式快速傅立叶转换处理器可降低的硬件成本。
本发明的非流水线式快速傅立叶转换处理器,包括一控制逻辑电路、一第一处理核心及一第二处理核心。第一处理核心耦接控制逻辑电路。第二处理核心耦接控制逻辑电路及第一处理核心。控制逻辑电路分别提供一第一控制指令以及一第二控制指令至第一处理核心及第二处理核心。第一处理核心接收多个同相运算数据及来自第二处理核心之多个正交中间数据,且受控于第一控制指令以依据这些同相运算数据及这些正交中间数据依序进行3点、4点、5点、7点及9点快速傅立叶转换,并且依序提供多个同相中间数据及多个同相转换数据。第二处理核心接收多个正交运算数据及这些同相中间数据,且受控于第二控制指令以依据这些正交运算数据及这些同相中间数据进行3点、4点、5点、7点及9点快速傅立叶转换,并且依序提供这些正交中间数据及多个正交转换数据。
本发明的非流水线式快速傅立叶转换处理器的运算控制方法,包括下列步骤。透过一控制逻辑电路分别提供一第一控制指令以及一第二控制命令至一第一处理核心及一第二处理核心。透过第一控制指令控制第一处理核心,且第一处理核心依据多个同相运算数据及来自第二处理核心的多个正交中间数据依序进行3点、4点、5点、7点及9点快速傅立叶转换,以依序提供多个同相中间数据及多个同相转换数据。透过第二控制指令控制第二处理核心,且第二处理核心依据多个正交运算数据及这些同相中间数据进行3点、4点、5点、7点及9点快速傅立叶转换,且依序提供这些正交中间数据及多个正交转换数据。
基于上述,由于非流水线式快速傅立叶转换处理器不需要缓存中间结果,本发明非流水线式快速傅立叶转换处理器及其运算控制方法,可减少大量的存储器使用。并且,本发明的第一处理核心及第二处理核心是完全重复使用,亦即第一处理核心及第二处理核心都可以进行3点、4点、5点、7点及9点快速傅立叶转换,因此可节省电路的逻辑门数目。
为让本发明的上述特征和优点能更明显易懂,下文特举实施例,并配合所附图式作详细说明如下。
附图说明
图1为依据本发明一实施例的非流水线式快速傅立叶转换处理器的***示意图。
图2为依据本发明一实施例的第一处理核心及第二处理核心的***示意图。
图3为依据本发明一实施例的第一处理核心执行同相运算数据的5点快速傅立叶转换的运算控制时序示意图。
图4为依据本发明一实施例的第二处理核心执行正交运算数据的5点快速傅立叶转换的运算控制时序示意图。
图5为依据本发明一实施例的非流水线式快速傅立叶转换处理器的运算控制方法的流程图。
附图标记说明
100:非流水线式快速傅立叶转换处理器
110:状态主控电路
120:输入输出控制电路
130:储存单元
140:地址映射电路
150:第一缓存电路
160:第一处理核心
170:第二处理核心
180:控制逻辑电路
190:第二缓存电路
210:第一加法器阵列
220:第一乘法器阵列
230:第一寄存器组
240:第二加法器阵列
250:第二乘法器阵列
260:第二寄存器组
A11、A21:第一加法器
a11、a21:第一相加结果
A12、A22:第二加法器
a12、a22:第二相加结果
A13、A23:第三加法器
a13、a23:第三相加结果
A14、A24:第四加法器
a14、a24:第四相加结果
a15、a25:第五相加结果
a16、a26:第六相加结果
a17、b27:第七相加结果
a18、a28:第八相加结果
b11、b21:第一相减结果
b12、b22:第二相减结果
b13、b23:第三相减结果
b14、b24:第四相减结果
b15、b25:第五相减结果
b16、b26:第六相减结果
b17、b27:第七相减结果
b18、b28:第八相减结果
b19、b29:第九相减结果
CM1:第一控制指令
CM2:第二控制指令
D1~D3780:输入数据
DIB:同相中间数据
DOI:同相运算数据
DOQ:正交运算数据
DQB:正交中间数据
DTI:同相转换数据
DTQ:正交转换数据
I1、Q1:第一运算数据
I2、Q2:第二运算数据
I3、Q3:第三运算数据
I4、Q4:第四运算数据
I5、Q5:第五运算数据
IB1:第一同相中间数据
IB2:第二同相中间数据
IT1:第一同相转换数据
IT2:第二同相转换数据
IT3:第三同相转换数据
IT4:第四同相转换数据
IT5:第五同相转换数据
m11、m21:第一相乘结果
M11、M21:第一乘法器
m12、m22:第二相乘结果
M12、M22:第二乘法器
m13、m23:第三相乘结果
M13、M23:第三乘法器
m14、m24:第四相乘结果
m15、m25:第五相乘结果
QB1:第一正交中间数据
QB2:第二正交中间数据
QT1:第一正交转换数据
QT2:第二正交转换数据
QT3:第三正交转换数据
QT4:第四正交转换数据
QT5:第五正交转换数据
R11、R21:第一寄存器
R12、R22:第二寄存器
R13、R23:第三寄存器
R14、R24:第四寄存器
R15、R25:第五寄存器
R16、R26:第六寄存器
步骤S510、S520、S530:
具体实施方式
图1为依据本发明一实施例的非流水线式快速傅立叶转换处理器的***示意图。请参照图1,在本实施例中,非流水线式快速傅立叶转换处理器100包括状态主控电路110、输入输出控制电路120、储存单元130、地址映射电路140、第一缓存电路150、第一处理核心160、第二处理核心170、控制逻辑电路180及第二缓存电路190。
状态主控电路110耦接输入输出控制电路120及地址映射电路140,以控制输入输出控制电路120及地址映射电路140的数据读取及数据传送的动作。输入输出控制电路120耦接储存单元130及状态主控电路110,并且接收3780点输入数据D1~D3780,以受控于状态主控电路110储存或读取3780点输入数据D1~D3780于储存单元130。地址映射电路140耦接储存单元130及状态主控电路110,受控于状态主控电路110读取储存单元130,以提供同相运算数据DOI及正交运算数据DOQ,进而储存同相转换数据DTI及正交转换数据DTQ于储存单元130。
第一缓存电路150耦接地址映射电路140、第一处理核心160及第二处理核心170,以缓存同相运算数据DOI及正交运算数据DOQ。第一处理核心160耦接第一缓存电路150、第二处理核心170及控制逻辑电路180,以接收来自第一缓存电路150的同相运算数据DOI、来自第二处理核心170之多个正交中间数据DQB及控制逻辑电路180提供的第一控制指令CM1。第二处理核心170耦接第一缓存电路150、第一处理核心160及控制逻辑电路180,以接收来自第一缓存电路150的正交运算数据DOQ、来自第一处理核心160之多个同相中间数据DIB及控制逻辑电路180提供的。
在本实施例中,是利用质数因数演算法(prime factor algorithm,PFA)将3780点(对应3780点输入数据D1~D3780)分解成35点和108点,再分别将35点分解成5点和7点;108点分解成4点和27点,最后将27点分解成9点和3点。换言之,透过质数因数演算法,第一处理核心160及第二处理核心170执行3点、4点、5点、7点及9点快速傅立叶转换就可以转换完3780点输入数据D1~D3780。其中,3、4、5及7为互质,因此不需要旋转因数,但是3及9不互质,因此需要27个(亦即9×3)旋转因数。
因此,第一处理核心160会受控于第一控制指令CM1以依据同相运算数据DOI及正交中间数据DQB依序进行3点、4点、5点、7点及9点快速傅立叶转换,并且依序提供多个同相中间数据DIB及多个同相转换数据DTI;同样地,第二处理核心170也会受控于第二控制指令CM2以依据正交运算数据DOQ及同相中间数据DIB进行3点、4点、5点、7点及9点快速傅立叶转换,并且依序提供正交中间数据DQB及多个正交转换数据DTQ。其中,第一处理核心160及第二处理核心170可利用Winograd Small-N算法进行3点、4点、5点、7点及9点快速傅立叶转换。
第二缓存电路190耦接地址映射电路140、第一处理核心160及第二处理核心170,以缓存同相转换数据DTI及正交转换数据DTQ。
依据上述,由于非流水线式快速傅立叶转换处理器100不需要缓存中间结果,可减少大量的存储器使用。并且,本发明的第一处理核心160及第二处理核心170是完全重复使用,亦即第一处理核心160及第二处理核心170都可以进行3点、4点、5点、7点及9点快速傅立叶转换,因此可节省非流水线式快速傅立叶转换处理器100的逻辑门数目。
图2为依据本发明一实施例的第一处理核心及第二处理核心的***示意图。请参照图1及图2,在本实施例中,第一处理核心160包括第一加法器阵列210、第一乘法器阵列220及第一寄存器组230。第一寄存器组230耦接控制逻辑电路180,且受控于第一控制指令CM1依序提供同相中间数据DIB至第二处理核心170及输出同相转换数据DTI。
第一加法器阵列210耦接控制逻辑电路180及第一寄存器组230,且接收同相运算数据DOI及正交中间数据DQB。第一加法器阵列受控于第一控制指令CM1对同相运算数据DOI、正交中间数据DQB及第一寄存器组230的数据进行加法运算,并且将相加结果储存于第一寄存器组230中。第一乘法器阵列220耦接控制逻辑电路180及第一寄存器组230,且受控于第一控制指令CM1对第一寄存器230的数据进行乘法运算,并且将相乘结果储存于第一寄存器组230中。
第二处理核心170包括第二加法器阵列240、第二乘法器阵列250及第二寄存器组260。第二寄存器组260耦接控制逻辑电路180,且受控于第二控制指令CM2依序提供正交中间数据DQB至第一处理核心160及输出正交转换数据DTQ。第二加法器阵列240耦接控制逻辑电路180及第二寄存器组260,且接收正交运算数据DOQ及同相中间数据DIB。第二加法器阵列240受控于第二控制指令CM2对正交运算数据DOQ、同相中间数据DIB及第二寄存器260的数据进行加法运算,并且将相加结果储存于第二寄存器组260中。
第二乘法器阵列250耦接控制逻辑电路180及第二寄存器组260,且受控于第二控制指令CM2对第二寄存器260的数据进行乘法运算,并且将相乘结果储存于第二寄存器组260中。
图3为依据本发明一实施例的第一处理核心执行同相运算数据的5点快速傅立叶转换的运算控制时序示意图。请参照图2及图3,在本实施例中,每一行(row)代表一个资源,每一列(column)代表一个运算时脉期间,每一列的运算及储存动作则对应一个第一控制指令CM1,并且第一处理核心160执行同相运算数据DOI的5点快速傅立叶转换。
同相运算数据DOI包括第一运算数据I1、第二运算数据I2、第三运算数据I3、第四运算数据I4及第五运算数据I5,正交中间数据DQB包括第一正交中间数据QB1及第二正交中间数据QB2,第一加法器阵列210包括第一加法器A11、第二加法器A12、第三加法器A13及第四加法器A14,第一乘法器阵列220包括第一乘法器M11、第二乘法器M12、第三乘法器M13,第一寄存器组230包括第一寄存器R11、第二寄存器R12、第三寄存器R13、第四寄存器R14、第五寄存器R15及第六寄存器R16。
在第一运算时脉期间(标记为“0”),第一加法器A11将第二运算数据I2与第五运算数据I5的第一相加结果a11储存于第一寄存器R11,第二加法器A12将第二运算数据I2减去第五运算数据I5后的第一相减结果b11储存于第二寄存器R12,第三加法器A13将第三运算数据I3与第四数据I4的第二相加结果a12储存于第三寄存器R13,第四加法器A14将第三运算数据I3减去第四数据I4后的第二相减结果b12储存于第四寄存器R14。
在第二运算时脉期间(标记为“1”),第一加法器A11将第二寄存器R12的第一相减结果b11与第四寄存器R14的第二相减结果b12的第三相加结果a13储存于第一寄存器R11,第二加法器A12将第一寄存器R11的第一相加结果a11减去第三寄存器R13的第二相加结果a12后的第三相减结果b13储存于第二寄存器R12,第三加法器A13将第一寄存器R11的第一相加结果a11与第三寄存器R13的第二相加结果a12的第四相加结果a14储存于第三寄存器R13,第一乘法器M11将第二寄存器R12的第一相减结果b11乘以786的第一相乘结果m11储存于第四寄存器R14,第二乘法器M12将第四寄存器R14的第二相减结果b12乘以186的第二相乘结果m12储存于第五寄存器R15。
在第三运算时脉期间(标记为“2”),第一加法器A11将第一运算数据I1与第三寄存器R13的第四相加结果a14的第五相加结果a15储存于第一寄存器R11,第一乘法器M11将第一寄存器R11的第三相加结果a13乘以486的第三相乘结果m13储存于第二寄存器R12,第二乘法器M12将第二寄存器R12的第三相减结果b13乘以286的第四相乘结果m14储存于第三寄存器R13,第三乘法器M13将第三寄存器R13的第四相加结果a14乘以128的第五相乘结果m15储存于第六寄存器R16。
在第四运算时脉期间(标记为“3”),第一加法器A11将第一运算数据I1减去第六寄存器R16的第五相乘结果m15后的第四相减结果b14储存于第二寄存器R12,第二加法器A12将第二寄存器R12的第三相乘结果m13减去第五寄存器R15的第二相乘结果m12后的第五相减结果b15储存于第四寄存器R14,第三加法器A13将第四寄存器R14的第一相乘结果m11减去第二寄存器R12的第三相乘结果m13的第六相减结果b16储存于第五寄存器R15。其中,第五相减结果b15及第六相减结果b16被提供以作为同相中间数据QIB的第一同相中间数据IB1及第二同相中间数据IB2。
在第五运算时脉期间(标记为“4”),第一加法器A11将第二寄存器R12的第四相减结果b14与第三寄存器R13的第四相乘结果m14的第六相加结果a16储存于第二寄存器R12,第二加法器A12将第二寄存器R12的第四相减结果b14减去第三寄存器R13的第四相乘结果m14后的第七相减结果b17储存于第三寄存器R13。
在第六运算时脉期间(标记为“5”),第一加法器A11将第二寄存器R12的第六相加结果a16与第一正交中间数据QB1的第七相加结果a17储存于第二寄存器R12,第二加法器A12将第三寄存器R13的第七相减结果b17与第二正交中间数据QB2的第八相加结果a18储存于第三寄存器R13,第三加法器A13将第三寄存器R13的第七相减结果b17减去第二正交中间数据QB2后的第八相减结果b18储存于第四寄存器R14,第四加法器A14将第二寄存器R12的第六相加结果a16减去第一正交中间数据QB1后的第九相减结果b19储存于第四寄存器R14。
其中,在第六运算时脉期间后,第五相加结果a15、第七相加结果a17、第八相加结果a18、第八相减结果b18及九相减结果b19被提供以作为同相转换数据DTI中的第一同相转换数据IT1、第二同相转换数据IT2、第三同相转换数据IT3、第四同相转换数据IT4及第五同相转换数据IT5。并且,第一运算时脉期间(标记为“0”)、第二运算时脉期间(标记为“1”)、第三运算时脉期间(标记为“2”)、第四运算时脉期间(标记为“3”)、第五运算时脉期间(标记为“4”)、第六运算时脉期间(标记为“5”)为依序排列。
图4为依据本发明一实施例的第二处理核心执行正交运算数据的5点快速傅立叶转换的运算控制时序示意图。请参照图2至图4,在本实施例中,每一行(row)代表一个资源,每一列(column)代表一个运算时脉期间,每一列的运算及储存动作则对应一个第二控制指令CM2,并且第二处理核心170执行正交运算数据DOQ的5点快速傅立叶转换。
正交运算数据DOQ包括第一运算数据Q1、第二运算数据Q2、第三运算数据Q3、第四运算数据Q4及第五运算数据Q5,同相中间数据DIB包括第一同相中间数据IB1及第二同相中间数据IB2,第一加法器阵列210包括第一加法器A21、第二加法器A22、第三加法器A23及第四加法器A24,第一乘法器阵列220包括第一乘法器M21、第二乘法器M22、第三乘法器M23,第一寄存器组230包括第一寄存器R21、第二寄存器R22、第三寄存器R23、第四寄存器R24、第五寄存器R25及第六寄存器R26。
在第一运算时脉期间(标记为“0”),第一加法器A21将第二运算数据Q2与第五运算数据Q5的第一相加结果a21储存于第一寄存器R21,第二加法器A22将第二运算数据Q2减去第五运算数据Q5后的第一相减结果b21储存于第二寄存器R22,第三加法器A23将第三运算数据Q3与第四数据Q4的第二相加结果a22储存于第三寄存器R23,第四加法器A24将第三运算数据Q3减去第四数据Q4后的第二相减结果b22储存于第四寄存器R24。
在第二运算时脉期间(标记为“1”),第一加法器A21将第二寄存器R22的第一相减结果b21与第四寄存器R24的第二相减结果b22的第三相加结果a23储存于第一寄存器R21,第二加法器A22将第一寄存器R21的第一相加结果a21减去第三寄存器R23的第二相加结果a22后的第三相减结果b23储存于第二寄存器R22,第三加法器A23将第一寄存器R21的第一相加结果a21与第三寄存器R23的第二相加结果a22的第四相加结果a24储存于第三寄存器R23,第一乘法器M21将第二寄存器R22的第一相减结果b21乘以786的第一相乘结果m21储存于第四寄存器R24,第二乘法器M22将第四寄存器R24的第二相减结果b22乘以186的第二相乘结果m22储存于第五寄存器R25。
在第三运算时脉期间(标记为“2”),第一加法器A21将第一运算数据Q1与第三寄存器R23的第四相加结果a24的第五相加结果a25储存于第一寄存器R21,第一乘法器M21将第一寄存器R21的第三相加结果a23乘以486的第三相乘结果m23储存于第二寄存器R22,第二乘法器M22将第二寄存器R22的第三相减结果b23乘以286的第四相乘结果m24储存于第三寄存器R23,第三乘法器M23将第三寄存器R23的第四相加结果a24乘以128的第五相乘结果m25储存于一第六寄存器R26。
在第四运算时脉期间(标记为“3”),第一加法器A21将第一运算数据Q1减去第六寄存器R26的第五相乘结果m25后的第四相减结果b24储存于第二寄存器R22,第二加法器A22将第二寄存器R22的第三相乘结果m23减去第五寄存器R25的第二相乘结果m22后的第五相减结果b25储存于第四寄存器R24,第三加法器A23将第四寄存器R24的第一相乘结果m21减去第二寄存器R22的第三相乘结果m23的第六相减结果b26储存于第五寄存器R25。其中,第五相减结果b25及第六相减结果b26被提供以作为正交中间数据DQB的第一正交中间数据QB1及第二正交中间数据QB2。
在第五运算时脉期间(标记为“4”),第一加法器A21将第二寄存器R22的第四相减结果b24与第三寄存器R23的第四相乘结果m24的第六相加结果a26储存于第二寄存器R22,第二加法器A22将第二寄存器R22的第四相减结果b24减去第三寄存器R23的第四相乘结果m24后的第七相减结果b27储存于第三寄存器R23。
在第六运算时脉期间(标记为“5”),第一加法器A21将第二寄存器R22的第六相加结果a26减去第一同相中间数据IB1后的第八相减结果b28储存于第二寄存器R22,第二加法器A22将第三寄存器R23的第七相减结果b27减去第二同相中间数据IB2后的第九相减结果b29储存于第三寄存器R23,第三加法器A23将第三寄存器R23的第七相减结果b27与第二同相中间数据IB2的第七相加结果a27储存于第四寄存器R24,第四加法器A24将第二寄存器R22的第六相加结果a26与第一同相中间数据IB1的第八相加结果a28储存于第四寄存器R24。
其中,在第六运算时脉期间后,第五相加结果a25、第八相减结果b28、第九相减结果b29、第七相加结果a27及第八相加结果a28被提供以作为正交转换数据DTQ中的第一正交转换数据QT1、第二正交转换数据QT2、第三正交转换数据QT3、第四正交转换数据QT4及第五正交转换数据QT5。并且,第一运算时脉期间(标记为“0”)、第二运算时脉期间(标记为“1”)、第三运算时脉期间(标记为“2”)、第四运算时脉期间(标记为“3”)、第五运算时脉期间(标记为“4”)、第六运算时脉期间(标记为“5”)为依序排列。
图5为依据本发明一实施例的非流水线式快速傅立叶转换处理器的运算控制方法的流程图。请参照图1,在本实施例中,运算控制方法包括下列步骤。首先,会透过一控制逻辑电路分别提供一第一控制指令以及一第二控制命令至一第一处理核心及一第二处理核心(步骤S510)。接着,透过第一控制指令控制第一处理核心,且第一处理核心依据多个同相运算数据及来自第二处理核心的多个正交中间数据依序进行3点、4点、5点、7点及9点快速傅立叶转换,以依序提供多个同相中间数据及多个同相转换数据(步骤S520)。最后,透过第二控制指令控制第二处理核心,且第二处理核心依据多个正交运算数据及这些同相中间数据进行3点、4点、5点、7点及9点快速傅立叶转换,且依序提供这些正交中间数据及多个正交转换数据(步骤S530)。其中,步骤S510、S520及S530的顺序为用以说明,本发明实施例不以此为限。并且,步骤S510、S520及S530的细节可参照图1、图2、图3及图4实施例所示,在此则不再赘述。
综上所述,本发明非流水线式快速傅立叶转换处理器及其运算控制方法,由于非流水线式快速傅立叶转换处理器不需要缓存中间结果,可减少大量的存储器使用。并且,本发明的第一处理核心及第二处理核心是完全重复使用,亦即第一处理核心及第二处理核心都可以进行3点、4点、5点、7点及9点快速傅立叶转换,因此可节省电路的逻辑门数目。
虽然本发明已以实施例揭露如上,然其并非用以限定本发明,任何所属技术领域中具有通常知识者,在不脱离本发明的精神和范围内,当可作些许的更动与润饰,故本发明的保护范围当视后附的权利要求所界定者为准。

Claims (17)

1.一种非流水线式快速傅立叶转换处理器,包括:
一控制逻辑电路;
一第一处理核心,耦接该控制逻辑电路;以及
一第二处理核心,耦接该控制逻辑电路及该第一处理核心;
其中,该控制逻辑电路分别提供一第一控制指令以及一第二控制指令至该第一处理核心及该第二处理核心,
该第一处理核心接收多个同相运算数据及来自该第二处理核心之多个正交中间数据,并且受控于该第一控制指令以依据该些同相运算数据及该些正交中间数据依序进行3点、4点、5点、7点及9点快速傅立叶转换,并且依序提供多个同相中间数据及多个同相转换数据,
该第二处理核心接收多个正交运算数据及该些同相中间数据,且受控于该第二控制指令以依据该些正交运算数据及该些同相中间数据进行3点、4点、5点、7点及9点快速傅立叶转换,并且依序提供该些正交中间数据及多个正交转换数据。
2.如权利要求1所述的非流水线式快速傅立叶转换处理器,其特征在于,该第一处理核心及该第二处理核心利用Winograd Small-N算法进行3点、4点、5点、7点及9点快速傅立叶转换。
3.如权利要求1所述的非流水线式快速傅立叶转换处理器,其特征在于,该第一处理核心包括:
一第一寄存器组,依序提供该些同相中间数据及该些同相转换数据;
一第一加法器阵列,耦接该控制逻辑电路及该第一寄存器组,且接收该些同相运算数据及该些正交中间数据,该第一加法器阵列受控于该第一控制指令对该些同相运算数据、该些正交中间数据及该第一寄存器组的数据进行加法运算,并且将相加结果储存于该第一寄存器组中;以及
一第一乘法器阵列,耦接该控制逻辑电路及该第一寄存器组,且受控于该第一控制指令对该第一寄存器组的数据进行乘法运算,并且将相乘结果储存于该第一寄存器组中。
4.如权利要求3所述的非流水线式快速傅立叶转换处理器,其特征在于,该第一处理核心执行该些同相运算数据的5点快速傅立叶转换,该些同相运算数据包括一第一运算数据、一第二运算数据、一第三运算数据、一第四运算数据及一第五运算数据,该些正交中间数据包括一第一正交中间数据及一第二正交中间数据,且其中,
在一第一运算时脉期间,一第一加法器将该第二运算数据与该第五运算数据的一第一相加结果储存于一第一寄存器,一第二加法器将该第二运算数据减去该第五运算数据后的一第一相减结果储存于一第二寄存器,一第三加法器将该第三运算数据与该第四运算数据的一第二相加结果储存于一第三寄存器,一第四加法器将该第三运算数据减去该第四运算数据后的一第二相减结果储存于一第四寄存器,
在一第二运算时脉期间,该第一加法器将该第二寄存器的该第一相减结果与该第四寄存器的该第二相减结果的一第三相加结果储存于该第一寄存器,该第二加法器将该第一寄存器的该第一相加结果减去该第三寄存器的该第二相加结果后的一第三相减结果储存于该第二寄存器,该第三加法器将该第一寄存器的该第一相加结果与该第三寄存器的该第二相加结果的一第四相加结果储存于该第三寄存器,一第一乘法器将该第二寄存器的该第一相减结果乘以786的一第一相乘结果储存于该第四寄存器,一第二乘法器将该第四寄存器的该第二相减结果乘以186的一第二相乘结果储存于一第五寄存器,
在一第三运算时脉期间,该第一加法器将该第一运算数据与该第三寄存器的该第四相加结果的一第五相加结果储存于该第一寄存器,该第一乘法器将该第一寄存器的该第三相加结果乘以486的一第三相乘结果储存于该第二寄存器,该第二乘法器将该第二寄存器的该第三相减结果乘以286的一第四相乘结果储存于该第三寄存器,一第三乘法器将该第三寄存器的该第四相加结果乘以128的一第五相乘结果储存于一第六寄存器,
在一第四运算时脉期间,该第一加法器将该第一运算数据减去该第六寄存器的该第五相乘结果后的一第四相减结果储存于该第二寄存器,该第二加法器将该第二寄存器的该第三相乘结果减去该第五寄存器的该第二相乘结果后的一第五相减结果储存于该第四寄存器,该第三加法器将该第四寄存器的该第一相乘结果减去该第二寄存器的该第三相乘结果的一第六相减结果储存于该第五寄存器,其中该第五相减结果及该第六相减结果被提供以作为该些同相中间数据的一第一同相中间数据及一第二同相中间数据,
在一第五运算时脉期间,该第一加法器将该第二寄存器的该第四相减结果与该第三寄存器的该第四相乘结果的一第六相加结果储存于该第二寄存器,该第二加法器将该第二寄存器的该第四相减结果减去该第三寄存器的该第四相乘结果后的一第七相减结果储存于该第三寄存器,
在一第六运算时脉期间,该第一加法器将该第二寄存器的该第六相加结果与该第一正交中间数据的一第七相加结果储存于该第二寄存器,该第二加法器将该第三寄存器的该第七相减结果与该第二正交中间数据的一第八相加结果储存于该第三寄存器,该第三加法器将该第三寄存器的该第七相减结果减去该第二正交中间数据后的一第八相减结果储存于该第四寄存器,该第四加法器将该第二寄存器的该第六相加结果减去该第一正交中间数据后的一第九相减结果储存于该第四寄存器,
其中,在该第六运算时脉期间后,该第五相加结果、该第七相加结果、该第八相加结果、该第八相减结果及该第九相减结果被提供以作为该些同相转换数据中的一第一同相转换数据、一第二同相转换数据、一第三同相转换数据、一第四同相转换数据及一第五同相转换数据。
5.如权利要求4所述的非流水线式快速傅立叶转换处理器,其特征在于,该第一运算时脉期间、该第二运算时脉期间、该第三运算时脉期间、该第四运算时脉期间、该第五运算时脉期间、该第六运算时脉期间为依序排列。
6.如权利要求1所述的非流水线式快速傅立叶转换处理器,其特征在于,该第二处理核心包括:
一第二寄存器组,依序提供该些正交中间数据及该些正交转换数据;
一第二加法器阵列,耦接该控制逻辑电路及该第二寄存器组,且接收该些正交运算数据及该些同相中间数据,该第二加法器阵列受控于该第二控制指令对该些正交运算数据、该些同相中间数据及该第二寄存器组的数据进行加法运算,并且将相加结果储存于该第二寄存器组中;以及
一第二乘法器阵列,耦接该控制逻辑电路及该第二寄存器组,且受控于该第二控制指令对该第二寄存器组的数据进行乘法运算,并且将相乘结果储存于该第二寄存器组中。
7.如权利要求6所述的非流水线式快速傅立叶转换处理器,其特征在于,该第二处理核心执行该些正交运算数据的5点快速傅立叶转换,该些正交运算数据包括一第一运算数据、一第二运算数据、一第三运算数据、一第四运算数据及一第五运算数据,该些同相中间数据包括一第一同相中间数据及一第二同相中间数据,且其中,
在一第一运算时脉期间,一第一加法器将该第二运算数据与该第五运算数据的一第一相加结果储存于一第一寄存器,一第二加法器将该第二运算数据减去该第五运算数据后的一第一相减结果储存于一第二寄存器,一第三加法器将该第三运算数据与该第四运算数据的一第二相加结果储存于一第三寄存器,一第四加法器将该第三运算数据减去该第四运算数据后的一第二相减结果储存于一第四寄存器,
在一第二运算时脉期间,该第一加法器将该第二寄存器的该第一相减结果与该第四寄存器的该第二相减结果的一第三相加结果储存于该第一寄存器,该第二加法器将该第一寄存器的该第一相加结果减去该第三寄存器的该第二相加结果后的一第三相减结果储存于该第二寄存器,该第三加法器将该第一寄存器的该第一相加结果与该第三寄存器的该第二相加结果的一第四相加结果储存于该第三寄存器,一第一乘法器将该第二寄存器的该第一相减结果乘以786的一第一相乘结果储存于该第四寄存器,一第二乘法器将该第四寄存器的该第二相减结果乘以186的一第二相乘结果储存于一第五寄存器,
在一第三运算时脉期间,该第一加法器将该第一运算数据与该第三寄存器的该第四相加结果的一第五相加结果储存于该第一寄存器,该第一乘法器将该第一寄存器的该第三相加结果乘以486的一第三相乘结果储存于该第二寄存器,该第二乘法器将该第二寄存器的该第三相减结果乘以286的一第四相乘结果储存于该第三寄存器,一第三乘法器将该第三寄存器的该第四相加结果乘以128的一第五相乘结果储存于一第六寄存器,
在一第四运算时脉期间,该第一加法器将该第一运算数据减去该第六寄存器的该第五相乘结果后的一第四相减结果储存于该第二寄存器,该第二加法器将该第二寄存器的该第三相乘结果减去该第五寄存器的该第二相乘结果后的一第五相减结果储存于该第四寄存器,该第三加法器将该第四寄存器的该第一相乘结果减去该第二寄存器的该第三相乘结果的一第六相减结果储存于该第五寄存器,其中该第五相减结果及该第六相减结果被提供以作为该些正交中间数据的一第一正交中间数据及一第二正交中间数据,
在一第五运算时脉期间,该第一加法器将该第二寄存器的该第四相减结果与该第三寄存器的该第四相乘结果的一第六相加结果储存于该第二寄存器,该第二加法器将该第二寄存器的该第四相减结果减去该第三寄存器的该第四相乘结果后的一第七相减结果储存于该第三寄存器,
在一第六运算时脉期间,该第一加法器将该第二寄存器的该第六相加结果减去该第一同相中间数据后的一第八相减结果储存于该第二寄存器,该第二加法器将该第三寄存器的该第七相减结果减去该第二同相中间数据后的一第九相减结果储存于该第三寄存器,该第三加法器将该第三寄存器的该第七相减结果与该第二同相中间数据的一第七相加结果储存于该第四寄存器,该第四加法器将该第二寄存器的该第六相加结果与该第一同相中间数据的一第八加相结果储存于该第四寄存器,
其中,在该第六运算时脉期间后,该第五相加结果、该第八相减结果、该第九相减结果、该第七相加结果及该第八相加结果被提供以作为该些正交转换数据中的一第一正交转换数据、一第二正交转换数据、一第三正交转换数据、一第四正交转换数据及一第五正交转换数据。
8.如权利要求7所述的非流水线式快速傅立叶转换处理器,其特征在于,该第一运算时脉期间、该第二运算时脉期间、该第三运算时脉期间、该第四运算时脉期间、该第五运算时脉期间、该第六运算时脉期间为依序排列。
9.如权利要求1所述的非流水线式快速傅立叶转换处理器,其特征在于,更包括:
一状态主控电路;
一输入输出控制电路,耦接一储存单元及该状态主控电路,接收3780点输入数据,以受控于该状态主控电路储存或读取该3780点输入数据于该储存单元;以及
一地址映射电路,耦接该储存单元及该状态主控电路,受控于该状态主控电路读取该储存单元,以提供该些同相运算数据及该些正交运算数据,进而储存该些同相转换数据及该些正交转换数据于该储存单元。
10.如权利要求9所述的非流水线式快速傅立叶转换处理器,其特征在于,更包括:
一第一缓存电路,耦接该地址映射电路、该第一处理核心及该第二处理核心,以缓存该些同相运算数据及该些正交运算数据;
一第二缓存电路,耦接该地址映射电路、该第一处理核心及该第二处理核心,以缓存该些同相转换数据及该些正交转换数据。
11.一种非流水线式快速傅立叶转换处理器的运算控制方法,其特征在于,包括:
透过一控制逻辑电路分别提供一第一控制指令以及一第二控制命令至一第一处理核心及一第二处理核心;
透过该第一控制指令控制该第一处理核心,且该第一处理核心依据多个同相运算数据及来自该第二处理核心的多个正交中间数据依序进行3点、4点、5点、7点及9点快速傅立叶转换,以依序提供多个同相中间数据及多个同相转换数据;以及
透过该第二控制指令控制该第二处理核心,且该第二处理核心依据多个正交运算数据及该些同相中间数据进行3点、4点、5点、7点及9点快速傅立叶转换,且依序提供该些正交中间数据及多个正交转换数据。
12.如权利要求11所述的非流水线式快速傅立叶转换处理器的运算控制方法,其特征在于,该第一处理核心及该第二处理核心利用Winograd Small-N算法进行3点、4点、5点、7点及9点快速傅立叶转换。
13.如权利要求11所述的非流水线式快速傅立叶转换处理器的运算控制方法,其特征在于,该些同相运算数据包括一第一运算数据、一第二运算数据、一第三运算数据、一第四运算数据及一第五运算数据,该些正交中间数据包括一第一正交中间数据及一第二正交中间数据,并且该第一处理核心执行该些同相运算数据的5点快速傅立叶转换的步骤包括:
在一第一运算时脉期间,一第一加法器将该第二运算数据与该第五运算数据的一第一相加结果储存于一第一寄存器,一第二加法器将该第二运算数据减去该第五运算数据后的一第一相减结果储存于一第二寄存器,一第三加法器将该第三运算数据与该第四运算数据的一第二相加结果储存于一第三寄存器,一第四加法器将该第三运算数据减去该第四运算数据后的一第二相减结果储存于一第四寄存器;
在一第二运算时脉期间,该第一加法器将该第二寄存器的该第一相减结果与该第四寄存器的该第二相减结果的一第三相加结果储存于该第一寄存器,该第二加法器将该第一寄存器的该第一相加结果减去该第三寄存器的该第二相加结果后的一第三相减结果储存于该第二寄存器,该第三加法器将该第一寄存器的该第一相加结果与该第三寄存器的该第二相加结果的一第四相加结果储存于该第三寄存器,一第一乘法器将该第二寄存器的该第一相减结果乘以786的一第一相乘结果储存于该第四寄存器,一第二乘法器将该第四寄存器的该第二相减结果乘以186的一第二相乘结果储存于一第五寄存器;
在一第三运算时脉期间,该第一加法器将该第一运算数据与该第三寄存器的该第四相加结果的一第五相加结果储存于该第一寄存器,该第一乘法器将该第一寄存器的该第三相加结果乘以486的一第三相乘结果储存于该第二寄存器,该第二乘法器将该第二寄存器的该第三相减结果乘以286的一第四相乘结果储存于该第三寄存器,一第三乘法器将该第三寄存器的该第四相加结果乘以128的一第五相乘结果储存于一第六寄存器;
在一第四运算时脉期间,该第一加法器将该第一运算数据减去该第六寄存器的该第五相乘结果后的一第四相减结果储存于该第二寄存器,该第二加法器将该第二寄存器的该第三相乘结果减去该第五寄存器的该第二相乘结果后的一第五相减结果储存于该第四寄存器,该第三加法器将该第四寄存器的该第一相乘结果减去该第二寄存器的该第三相乘结果的一第六相减结果储存于该第五寄存器,其中该第五相减结果及该第六相减结果被提供以作为该些同相中间数据的一第一同相中间数据及一第二同相中间数据;
在一第五运算时脉期间,该第一加法器将该第二寄存器的该第四相减结果与该第三寄存器的该第四相乘结果的一第六相加结果储存于该第二寄存器,该第二加法器将该第二寄存器的该第四相减结果减去该第三寄存器的该第四相乘结果后的一第七相减结果储存于该第三寄存器;以及
在一第六运算时脉期间,该第一加法器将该第二寄存器的该第六相加结果与该第一正交中间数据的一第七相加结果储存于该第二寄存器,该第二加法器将该第三寄存器的该第七相减结果与该第二正交中间数据的一第八相加结果储存于该第三寄存器,该第三加法器将该第三寄存器的该第七相减结果减去该第二正交中间数据后的一第八相减结果储存于该第四寄存器,该第四加法器将该第二寄存器的该第六相加结果减去该第一正交中间数据后的一第九相减结果储存于该第四寄存器;
在该第六运算时脉期间后,该第五相加结果、该第七相加结果、该第八相加结果、该第八相减结果及该第九相减结果被提供以作为该些同相转换数据中的一第一同相转换数据、一第二同相转换数据、一第三同相转换数据、一第四同相转换数据及一第五同相转换数据。
14.如权利要求13所述的非流水线式快速傅立叶转换处理器的运算控制方法,其特征在于,该第一运算时脉期间、该第二运算时脉期间、该第三运算时脉期间、该第四运算时脉期间、该第五运算时脉期间、该第六运算时脉期间为依序排列。
15.如权利要求11所述的非流水线式快速傅立叶转换处理器的运算控制方法,其特征在于,该些正交运算数据包括一第一运算数据、一第二运算数据、一第三运算数据、一第四运算数据及一第五运算数据,该些同相中间数据包括一第一同相中间数据及一第二同相中间数据,并且该第二处理核心执行该正交运算数据的5点快速傅立叶转换的步骤包括:
在一第一运算时脉期间,一第一加法器将该第二运算数据与该第五运算数据的一第一相加结果储存于一第一寄存器,一第二加法器将该第二运算数据减去该第五运算数据后的一第一相减结果储存于一第二寄存器,一第三加法器将该第三运算数据与该第四运算数据的一第二相加结果储存于一第三寄存器,一第四加法器将该第三运算数据减去该第四运算数据后的一第二相减结果储存于一第四寄存器;
在一第二运算时脉期间,该第一加法器将该第二寄存器的该第一相减结果与该第四寄存器的该第二相减结果的一第三相加结果储存于该第一寄存器,该第二加法器将该第一寄存器的该第一相加结果减去该第三寄存器的该第二相加结果后的一第三相减结果储存于该第二寄存器,该第三加法器将该第一寄存器的该第一相加结果与该第三寄存器的该第二相加结果的一第四相加结果储存于该第三寄存器,一第一乘法器将该第二寄存器的该第一相减结果乘以786的一第一相乘结果储存于该第四寄存器,一第二乘法器将该第四寄存器的该第二相减结果乘以186的一第二相乘结果储存于一第五寄存器;
在一第三运算时脉期间,该第一加法器将该第一运算数据与该第三寄存器的该第四相加结果的一第五相加结果储存于该第一寄存器,该第一乘法器将该第一寄存器的该第三相加结果乘以486的一第三相乘结果储存于该第二寄存器,该第二乘法器将该第二寄存器的该第三相减结果乘以286的一第四相乘结果储存于该第三寄存器,一第三乘法器将该第三寄存器的该第四相加结果乘以128的一第五相乘结果储存于一第六寄存器;
在一第四运算时脉期间,该第一加法器将该第一运算数据减去该第六寄存器的该第五相乘结果后的一第四相减结果储存于该第二寄存器,该第二加法器将该第二寄存器的该第三相乘结果减去该第五寄存器的该第二相乘结果后的一第五相减结果储存于该第四寄存器,该第三加法器将该第四寄存器的该第一相乘结果减去该第二寄存器的该第三相乘结果的一第六相减结果储存于该第五寄存器,其中该第五相减结果及该第六相减结果被提供以作为该些正交中间数据的一第一正交中间数据及一第二正交中间数据;
在一第五运算时脉期间,该第一加法器将该第二寄存器的该第四相减结果与该第三寄存器的该第四相乘结果的一第六相加结果储存于该第二寄存器,该第二加法器将该第二寄存器的该第四相减结果减去该第三寄存器的该第四相乘结果后的一第七相减结果储存于该第三寄存器;以及
在一第六运算时脉期间,该第一加法器将该第二寄存器的该第六相加结果减去该第一同相中间数据后的一第八相减结果储存于该第二寄存器,该第二加法器将该第三寄存器的该第七相减结果减去该第二同相中间数据后的一第九相减结果储存于该第三寄存器,该第三加法器将该第三寄存器的该第七相减结果与该第二同相中间数据的一第七相加结果储存于该第四寄存器,该第四加法器将该第二寄存器的该第六相加结果与该第一同相中间数据的一第八加相结果储存于该第四寄存器;
在该第六运算时脉期间后,该第五相加结果、该第八相减结果、该第九相减结果、该第七相加结果及该第八相加结果被提供以作为该些正交转换数据中的一第一正交转换数据、一第二正交转换数据、一第三正交转换数据、一第四正交转换数据及一第五正交转换数据。
16.如权利要求15所述的非流水线式快速傅立叶转换处理器的运算控制方法,其特征在于,该第一运算时脉期间、该第二运算时脉期间、该第三运算时脉期间、该第四运算时脉期间、该第五运算时脉期间、该第六运算时脉期间为依序排列。
17.如权利要求11所述的非流水线式快速傅立叶转换处理器的运算控制方法,其特征在于,更包括:
透过一输入输出控制电路储存或读取3780点输入数据于储存单元;以及
透过一地址映射电路读取该储存单元,以提供该些同相运算数据及该些正交运算数据,进而储存该些同相转换数据及该些正交转换数据于该储存单元。
CN201610177927.1A 2016-03-25 2016-03-25 非流水线式快速傅立叶转换处理器及其运算控制方法 Active CN107229596B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610177927.1A CN107229596B (zh) 2016-03-25 2016-03-25 非流水线式快速傅立叶转换处理器及其运算控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610177927.1A CN107229596B (zh) 2016-03-25 2016-03-25 非流水线式快速傅立叶转换处理器及其运算控制方法

Publications (2)

Publication Number Publication Date
CN107229596A CN107229596A (zh) 2017-10-03
CN107229596B true CN107229596B (zh) 2020-07-31

Family

ID=59932702

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610177927.1A Active CN107229596B (zh) 2016-03-25 2016-03-25 非流水线式快速傅立叶转换处理器及其运算控制方法

Country Status (1)

Country Link
CN (1) CN107229596B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111338695B (zh) * 2018-12-19 2022-05-17 中科寒武纪科技股份有限公司 基于流水线技术的数据处理方法及相关产品

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8615538B1 (en) * 2010-03-09 2013-12-24 The United States Of America As Represented By The Secretary Of The Navy Sub-filtering finite impulse response (FIR) filter for frequency search capability
CN103631759A (zh) * 2012-08-22 2014-03-12 中兴通讯股份有限公司 一种实现快速傅立叶变换/离散傅立叶变换的装置及方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8615538B1 (en) * 2010-03-09 2013-12-24 The United States Of America As Represented By The Secretary Of The Navy Sub-filtering finite impulse response (FIR) filter for frequency search capability
CN103631759A (zh) * 2012-08-22 2014-03-12 中兴通讯股份有限公司 一种实现快速傅立叶变换/离散傅立叶变换的装置及方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
On the baseband compensation of IQ imbalances in OFDM systems;Alireza Tarighat et al.;《2004 IEEE International Conference on Acoustics, Speech, and Signal Processing》;20040517;第1021-1024页 *
基于快速傅里叶变换的遥测信号载波估计算法;冯欣 等;《探测与控制学报》;20130831;第35卷(第4期);第36-39页,第43页 *

Also Published As

Publication number Publication date
CN107229596A (zh) 2017-10-03

Similar Documents

Publication Publication Date Title
US10140251B2 (en) Processor and method for executing matrix multiplication operation on processor
US9275014B2 (en) Vector processing engines having programmable data path configurations for providing multi-mode radix-2x butterfly vector processing circuits, and related vector processors, systems, and methods
CN103440121B (zh) 一种面向向量处理器的三角矩阵乘法向量化方法
US9104584B2 (en) Apparatus and method for performing a complex number operation using a single instruction multiple data (SIMD) architecture
US11874896B2 (en) Methods and apparatus for job scheduling in a programmable mixed-radix DFT/IDFT processor
KR20090018042A (ko) 파이프라인 고속 푸리에 변환 구조 및 방법
US8386552B2 (en) Fourier transform processing and twiddle factor generation
EP4102354B1 (en) Method, circuit, and soc for performing matrix multiplication operation
Kumar et al. Area and frequency optimized 1024 point Radix-2 FFT processor on FPGA
CN107229596B (zh) 非流水线式快速傅立叶转换处理器及其运算控制方法
CN114996638A (zh) 一种顺序架构的可配置快速傅里叶变换电路
CN112799634B (zh) 一种基于基22mdc ntt结构的高性能环多项式乘法器
US10127040B2 (en) Processor and method for executing memory access and computing instructions for host matrix operations
Cho et al. Pipelined FFT for wireless communications supporting 128–2048/1536-point transforms
CN104360986B (zh) 一种并行化矩阵求逆硬件装置的实现方法
Chin et al. Implementation of a two-dimensional FFT/IFFT processor for real-time high-resolution synthetic aperture radar imaging
US9087003B2 (en) Vector NCO and twiddle factor generator
CN111756478A (zh) 一种低复杂度实现矩阵qr分解的方法及装置
Karlsson et al. Cost-efficient mapping of 3-and 5-point DFTs to general baseband processors
CN111404858A (zh) 应用于宽带卫星通信***的高效的fft处理方法和装置
CN109117454B (zh) 3780点快速傅立叶转换处理器及其运作方法
CN1937605B (zh) 一种相位获取装置
US20230237121A1 (en) Method for accelerating fast fourier transform based on field programmable gate array
CN115033205B (zh) 一种低延迟高精度定值除法器
Zhu et al. A configurable distributed systolic array for QR decomposition in MIMO-OFDM systems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant