CN114647399B - 一种低能耗高精度近似并行定宽乘法累加装置 - Google Patents
一种低能耗高精度近似并行定宽乘法累加装置 Download PDFInfo
- Publication number
- CN114647399B CN114647399B CN202210541757.6A CN202210541757A CN114647399B CN 114647399 B CN114647399 B CN 114647399B CN 202210541757 A CN202210541757 A CN 202210541757A CN 114647399 B CN114647399 B CN 114647399B
- Authority
- CN
- China
- Prior art keywords
- partial product
- bit
- approximate
- adder
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000009825 accumulation Methods 0.000 title claims abstract description 14
- 238000005265 energy consumption Methods 0.000 title claims abstract description 14
- 230000006835 compression Effects 0.000 claims abstract description 79
- 238000007906 compression Methods 0.000 claims abstract description 79
- 238000000034 method Methods 0.000 claims abstract description 19
- 238000012545 processing Methods 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 7
- 230000014509 gene expression Effects 0.000 claims description 7
- 238000011084 recovery Methods 0.000 claims description 6
- 239000013598 vector Substances 0.000 claims description 2
- 229910002056 binary alloy Inorganic materials 0.000 claims 1
- 239000000047 product Substances 0.000 description 71
- 238000013461 design Methods 0.000 description 7
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 230000003044 adaptive effect Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000004335 scaling law Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F7/38—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
- G06F7/48—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
- G06F7/544—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices for evaluating functions by calculation
- G06F7/5443—Sum of products
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computational Mathematics (AREA)
- Computing Systems (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Analogue/Digital Conversion (AREA)
Abstract
Description
技术领域
本发明涉及近似算术运算电路设计技术领域,具体而言涉及一种低能耗高精度近似并行定宽乘法累加装置。
背景技术
自2007年以来,摩尔定律、登纳德缩放定律等一系列半导体规律逐渐失效,在维持芯片同样能耗的情况下持续提高其性能变得十分困难。且现如今大数据处理和人工智能的重要性不断提高,这些应用需要海量的数据和复杂的计算,也就对高能效、高性能的通用计算引擎以及专用集成电路提出了更高的要求。现有许多应用如模式识别、视频处理、数据挖掘其本身存在容错能力,在此类应用存在的前提下,近似计算将计算精度作为新的维度引入设计空间,以满足应用要求为前提降低硬件开销和功耗,作为一种新的高能效设计方法被采用以缓解上述问题。
乘法累加单元作为数字信号处理器的重要计算单元,在卷积神经网络等类似应用中使用广泛。串行乘法累加单元由于其较小的硬件开销而备受青睐,但在对时延要求高的应用中的使用效果不尽如人意。仅管存在并行乘法累加单元,但针对这方面的研究较少,多通过复制单个乘法器和加法器来实现并行,硬件开销太大。发表于IEEE TRANSACTIONS ONCIRCUITS AND SYSTEMS的论文《A High-Performance and Energy-Efficient FIRAdaptive Filter Using Approximate Distributed Arithmetic Circuits》公开了一种基于分布式算法的自适应滤波器设计方法,其中误差计算模块与并行乘法累加单元的设计思路吻合,但近似手段较为粗糙,未能实现精度与硬件开销之间的有效平衡。
发明内容
本发明针对现有技术中的不足,提供一种低能耗高精度近似并行定宽乘法累加装置,目的是在原有设计上改进近似和截断策略,降低功耗,减小硬件开销,并维持较高精度。
为实现上述目的,本发明采用以下技术方案:
一种低能耗高精度近似并行定宽乘法累加装置,所述乘法累加装置包括输入截断补偿电路、基-8布斯编码器和解码器电路、一级部分积压缩电路、二级部分积压缩电路和超前进位加法器电路;
所述基-8布斯编码器和解码器电路包括N组基-8布斯编码器、近似解码加法器和传统解码器;基-8布斯编码器将其中一组输入截断补偿电路的输出按三位一组划分进行编码,将编码结果输出到传统解码器;近似解码加法器对另一组输入截断补偿电路的输出进行计算;传统解码器对基-8布斯编码器与近似解码加法器的结果进行处理以生成部分积,输出到一级部分积压缩电路中;
所述一级部分积压缩电路包含个一级***树,每一个一级华莱
士树的大小都为,每一个一级***树均为规则矩形;将每个一级***
树分三段做近似处理,对一权重为的一级***树,截断低位,次低2位使用近似
4_2压缩器压缩,剩余高位用精确加法器压缩成两行,仅将所有一级***树的精确加法器
压缩结果输出到二级部分积压缩电路;
所述二级部分积压缩电路包含二级***树和概率常数补偿模块,概率常数补偿
模块用于对一级部分积截断、使用近似4_2压缩器产生的误差、二级部分积截断进行补偿,
得到截断和近似的常数补偿部分数据;二级***树使用精确加法器将接收到的输入数据
与常数补偿部分数据压缩成两行,取位输出到超前进位加法器电路;
为优化上述技术方案,采取的具体措施还包括:
进一步地,所述近似解码加法器对输入数据的低位做两位一组的近似累加,p
为根据精度要求决定的非负整数,公式为:,,,其
中表示输入y的第位,为输入进位,为输出进位,为最终和的第位;对输入数据
的第和低位附加误差恢复电路,公式为:,,,其中为最终和的第位的误差恢复信号,和
分别为恢复后的第位最终和和输出进位;使用行波进位加法器对输入数据的高位做累
加。
进一步地,在一级部分积压缩电路中使用的近似4_2压缩器公式为:,,其中为***树第i列的四个输
入;精确加法器包括精确全加器和精确半加器;每一行部分积的符号补偿位不计入***
树,通过常数补偿方法减小误差。
进一步地,所述二级部分积压缩电路在确定输入符号的情况下对符号位做统一处理:在仅保留数值位的前提下,在一级部分积压缩器的最低位压缩树任意一输出的高位添加111,次低位和次高位压缩树任意一输出的高位添加110。
进一步地,所述一级部分积截断的补偿的过程包括:
假设输入呈均匀分布:
对其中一组操作数做基-8布斯编码,根据编码规则在最低位补0,编码结果概率如下:
进一步地,所述对使用近似4_2压缩器的补偿包括:
进一步地,所述一级部分积压缩电路和二级部分积压缩电路采用符号拓展消除法。所述的符号拓展消除法利用2进制运算非0即1的特点,对部分积压缩电路的输入的符号位做统一处理,将负值转换到最高的一位,便于随后的全正值的压缩处理。
本发明的有益效果是:
本发明的低能耗高精度近似并行定宽乘法累加装置,采用分布式算法提高乘法累加单元的并行度,有效提高了电路性能,同时采用截断和近似手段,减少电路复杂度的同时降低功耗,采用常数补偿策略以极小的硬件开销换取精度。截断部分积不仅节省了压缩器,缩短了超前进位加法器的关键路径长度,还节省了生成被截断部分积的传统布斯解码器,大大节省了硬件开销。
附图说明
图1是本发明的低能耗高精度近似并行定宽乘法累加装置的结构示意图。
具体实施方式
现在结合附图对本发明作进一步详细的说明。
需要注意的是,发明中所引用的如“上”、“下”、“左”、“右”、“前”、“后”等的用语,亦仅为便于叙述的明了,而非用以限定本发明可实施的范围,其相对关系的改变或调整,在无实质变更技术内容下,当亦视为本发明可实施的范畴。
图1是本发明的低能耗高精度近似并行定宽乘法累加装置的结构示意图。参见图1,该乘法累加装置包括输入截断补偿电路、基-8布斯编码器和解码器电路、一级部分积压缩电路、二级部分积压缩电路和超前进位加法器电路。
一级部分积压缩电路包含个***树,每一个***树的大小都
为,每一个一级***树均为规则矩形,将一级***树分三段做近似处
理,对一权重为的***树,截断低位,次低2位使用近似4_2压缩器压缩,剩余高
位用精确加法器压缩成两行,仅将所有***树的精确加法器压缩结果输出到二级部分积
压缩电路。
(一)基-8布斯编码器和解码器电路
基-8布斯编码器和解码器电路包括基-8布斯编码器、近似解码加法器和传统解码器。
(二)一级部分积压缩电路
(三)二级部分积压缩电路
二级部分积压缩电路中的常数概率补偿包括三部分,分别是对一级部分积截断的补偿,对使用近似4_2压缩器产生误差的补偿和对二级部分积截断的补偿。
(1)第一部分:对一级部分积截断的补偿。
假设输入呈均匀分布,即(此处省略下标,因为所有输入的概率均相同):
对其中一组操作数做基-8布斯编码,根据编码规则需在最低位补0。由于最低位编码输入的低两位恒为(1,0),因此与其他位编码结果概率不同,需分开考虑。编码结果概率如下(正负概率相同):
根据上式可计算出部分积的期望如下:
(2)第二部分:对使用近似4_2压缩器的补偿。
(3)第三部分:对二级部分积截断的补偿。
(四)超前进位加法器
输入截断补偿电路是将并行乘法累加单元的两组长度为16的输入截断低5位,并在第4位上补1,最终12位结果输出到基-8布斯编码器和解码器电路。只需对其中一组输入做基-8编码,按照三位一组划分,另一组输入同时送入近似解码加法器,计算3x,接着将他们送入传统解码器,仅产生一级部分积压缩电路压缩的部分,结果根据编码权重送入对应权重不同的一级***压缩树,如图1所示。图1中一级***树-0表示一级部分积压缩电路中的最低位***树,一级***树-1表示一级部分积压缩电路中的次低位***树,以此类推。该一级部分积压缩电路共有4个***树,每个***树为14*8的矩形,如图2a-图2d所示。将一级部分积压缩电路的结果根据权重进行移位,输入二级部分积压缩电路,使用精确加法器压缩至两行,最终取低16位送入超前进位加法器,结果也取低16位为最终定宽输出。
基-8布斯编码器有五个输出信号,表达式为:
如图2a-图2d所示,对一级部分积压缩电路的四个***树均做符号拓展处理,最终控制两个输出符号为一正一负。最低位压缩树截断低8位,次低位压缩树截断低5位,次高位压缩树截断低2位,最高位压缩树不截断,除最高位压缩树以外,所有压缩树的次高2位使用近似4_2压缩器,最高位压缩树的最低1位使用近似4_2压缩器,其余高位用精确加法器压缩成两行,仅将所有压缩树的精确加法器压缩结果输入到二级部分积压缩电路。
作为本实施方式的进一步优化方案,二级部分积压缩电路在确定输入符号的情况下对符号位做统一处理:在仅保留数值位的前提下,在一级部分积压缩器的最低位压缩树任意一输出的高位添加“111”,次低位和次高位压缩树任意一输出的高位添加“110”,如图3所示。
作为本实施方式的进一步优化方案,二级部分积压缩器包含对截断与近似的常数补偿部分,该常数补偿由理论概率推导得到:在二级部分积压缩树的第2位和第4位补1,如图3所示。最终16位结果送入超前进位加法器。
超前进位加法器输入为16位,分为四位一组,组内为行波进位加法器,组间为超前进位加法器,取低16位作为最终近似乘法累加单元的定宽结果。
最终该改进设计相比原设计功率延时积降低25%,比全精度副本功率延时积降低80%,比未采用补偿的副本平均错误距离降低58%。
尽管已描述了本说明书实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本说明书实施例范围的所有变更和修改。
显然,本领域的技术人员可以对本说明书实施例进行各种改动和变型而不脱离本说明书实施例的精神和范围。这样,倘若本说明书实施例的这些修改和变型属于本说明书实施例权利要求及其等同技术的范围之内,则本说明书实施例也意图包含这些改动和变型在内。
Claims (9)
1.一种低能耗高精度近似并行定宽乘法累加装置,其特征在于,所述乘法累加装置包括输入截断补偿电路、基-8布斯编码器和解码器电路、一级部分积压缩电路、二级部分积压缩电路和超前进位加法器电路;
所述基-8布斯编码器和解码器电路包括N组基-8布斯编码器、近似解码加法器和传统解码器;基-8布斯编码器将其中一组输入截断补偿电路的输出按三位一组划分进行编码,将编码结果输出到传统解码器;近似解码加法器对另一组输入截断补偿电路的输出进行计算;传统解码器对基-8布斯编码器与近似解码加法器的结果进行处理以生成部分积,输出到一级部分积压缩电路中;
所述一级部分积压缩电路包含个一级***树,每一个一级***树的大小都为,每一个一级***树均为规则矩形;将每个一级***树分三段做近似处理,对一权重为的一级***树,截断低位,次低2位使用近似4_2压缩器压缩,剩余高位用精确加法器压缩成两行,仅将所有一级***树的精确加法器压缩结果输出到二级部分积压缩电路;
所述二级部分积压缩电路包含二级***树和概率常数补偿模块,概率常数补偿模块用于对一级部分积截断、使用近似4_2压缩器产生的误差、二级部分积截断进行补偿,得到截断和近似的常数补偿部分数据;二级***树使用精确加法器将接收到的输入数据与常数补偿部分数据压缩成两行,取位输出到超前进位加法器电路;
5.根据权利要求1所述的低能耗高精度近似并行定宽乘法累加装置,其特征在于,所述二级部分积压缩电路在确定输入符号的情况下对符号位做统一处理:在仅保留数值位的前提下,在一级部分积压缩器的最低位压缩树任意一输出的高位添加111,次低位和次高位压缩树任意一输出的高位添加110。
6.根据权利要求1所述的低能耗高精度近似并行定宽乘法累加装置,其特征在于,所述一级部分积截断的补偿的过程包括:
假设输入呈均匀分布:
对其中一组操作数做基-8布斯编码,根据编码规则在最低位补0,编码结果概率如下:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210541757.6A CN114647399B (zh) | 2022-05-19 | 2022-05-19 | 一种低能耗高精度近似并行定宽乘法累加装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210541757.6A CN114647399B (zh) | 2022-05-19 | 2022-05-19 | 一种低能耗高精度近似并行定宽乘法累加装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114647399A CN114647399A (zh) | 2022-06-21 |
CN114647399B true CN114647399B (zh) | 2022-08-16 |
Family
ID=81997301
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210541757.6A Active CN114647399B (zh) | 2022-05-19 | 2022-05-19 | 一种低能耗高精度近似并行定宽乘法累加装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114647399B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115407965B (zh) * | 2022-11-01 | 2023-03-24 | 南京航空航天大学 | 一种基于泰勒展开的高性能近似除法器及误差补偿方法 |
CN116048455B (zh) * | 2023-03-07 | 2023-06-02 | 南京航空航天大学 | 一种***型的近似乘法累加器 |
CN117170623B (zh) * | 2023-11-03 | 2024-01-30 | 南京美辰微电子有限公司 | 面向神经网络计算的多位宽重构近似张量乘加方法与*** |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7346643B1 (en) * | 1999-07-30 | 2008-03-18 | Mips Technologies, Inc. | Processor with improved accuracy for multiply-add operations |
CN110673823A (zh) * | 2019-09-30 | 2020-01-10 | 上海寒武纪信息科技有限公司 | 乘法器、数据处理方法及芯片 |
CN114115803A (zh) * | 2022-01-24 | 2022-03-01 | 南京航空航天大学 | 一种基于部分积概率分析的近似浮点乘法器 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7315879B2 (en) * | 2001-02-16 | 2008-01-01 | Texas Instruments Incorporated | Multiply-accumulate modules and parallel multipliers and methods of designing multiply-accumulate modules and parallel multipliers |
US6978426B2 (en) * | 2002-04-10 | 2005-12-20 | Broadcom Corporation | Low-error fixed-width modified booth multiplier |
CN111258633B (zh) * | 2018-11-30 | 2022-08-09 | 上海寒武纪信息科技有限公司 | 乘法器、数据处理方法、芯片及电子设备 |
-
2022
- 2022-05-19 CN CN202210541757.6A patent/CN114647399B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7346643B1 (en) * | 1999-07-30 | 2008-03-18 | Mips Technologies, Inc. | Processor with improved accuracy for multiply-add operations |
CN110673823A (zh) * | 2019-09-30 | 2020-01-10 | 上海寒武纪信息科技有限公司 | 乘法器、数据处理方法及芯片 |
CN114115803A (zh) * | 2022-01-24 | 2022-03-01 | 南京航空航天大学 | 一种基于部分积概率分析的近似浮点乘法器 |
Non-Patent Citations (2)
Title |
---|
一种低功耗常系数乘法器的设计;李京等;《计算机工程与应用》;20070601(第30期);全文 * |
定宽截断式并行乘法器的实现研究;孙凌等;《中国集成电路》;20071215(第12期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN114647399A (zh) | 2022-06-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114647399B (zh) | 一种低能耗高精度近似并行定宽乘法累加装置 | |
CN109934331B (zh) | 用于执行人工神经网络正向运算的装置和方法 | |
CN109214509B (zh) | 一种用于深度神经网络高速实时量化结构和运算实现方法 | |
CN111832719A (zh) | 一种定点量化的卷积神经网络加速器计算电路 | |
CN111488133B (zh) | 高基数近似布斯编码方法和混合基数布斯编码近似乘法器 | |
CN111221499B (zh) | 基于近似6-2和4-2压缩器的近似乘法器及计算方法 | |
CN109144473B (zh) | 一种基于冗余odds数的十进制3:2压缩器结构 | |
CN114115803B (zh) | 一种基于部分积概率分析的近似浮点乘法器 | |
CN116400883A (zh) | 一种可切换精度的浮点乘加器 | |
CN110955403B (zh) | 近似基-8布斯编码器及混合布斯编码的近似二进制乘法器 | |
CN110825346B (zh) | 一种低逻辑复杂度的无符号近似乘法器 | |
US5944776A (en) | Fast carry-sum form booth encoder | |
CN111966323B (zh) | 基于无偏压缩器的近似乘法器及计算方法 | |
US7840628B2 (en) | Combining circuitry | |
CN111897513A (zh) | 一种基于反向极性技术的乘法器及其代码生成方法 | |
CN113778377B (zh) | 一种基于基8布斯折叠编码的平方器结构 | |
CN115826913A (zh) | 基于静态分段补偿方法的近似二进制乘法器 | |
CN112860219B (zh) | 并行乘法器及其工作方法 | |
CN116048455B (zh) | 一种***型的近似乘法累加器 | |
CN112926287B (zh) | 一种基于树状压缩的十进制至二进制数转换器 | |
CN116011512A (zh) | 一种面向神经网络的高精度低功耗近似移位乘法器 | |
JeevanaJyothi et al. | Approximate Multiplier Design Using Novel 4: 2 Compressor Design With Improved Accuracy | |
WO2022178861A1 (zh) | 并行乘法器及其工作方法 | |
CN116762056A (zh) | 脉动阵列中的乘法器和加法器 | |
CN118210473A (zh) | 一种近似乘法器任意截断位宽下补偿电路设计方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |