JP7016559B1 - 正規化浮動小数点数に対する誤差不偏近似乗算器及びその実現方法 - Google Patents

正規化浮動小数点数に対する誤差不偏近似乗算器及びその実現方法 Download PDF

Info

Publication number
JP7016559B1
JP7016559B1 JP2021065061A JP2021065061A JP7016559B1 JP 7016559 B1 JP7016559 B1 JP 7016559B1 JP 2021065061 A JP2021065061 A JP 2021065061A JP 2021065061 A JP2021065061 A JP 2021065061A JP 7016559 B1 JP7016559 B1 JP 7016559B1
Authority
JP
Japan
Prior art keywords
module
output
result
exponential
approximation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021065061A
Other languages
English (en)
Other versions
JP2022048965A (ja
Inventor
成 卓
闖涛 陳
勳▲ヂャオ▼ 尹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Application granted granted Critical
Publication of JP7016559B1 publication Critical patent/JP7016559B1/ja
Publication of JP2022048965A publication Critical patent/JP2022048965A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/38Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
    • G06F7/48Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
    • G06F7/52Multiplying; Dividing
    • G06F7/523Multiplying only
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/38Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
    • G06F7/48Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
    • G06F7/483Computations with numbers represented by a non-linear combination of denominational numbers, e.g. rational numbers, logarithmic number system or floating-point numbers
    • G06F7/487Multiplying; Dividing
    • G06F7/4876Multiplying

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Nonlinear Science (AREA)
  • Complex Calculations (AREA)

Abstract

【課題】IEEE754標準下の正規化浮動小数点数の乗法演算を対象とし、精度レベルが制御できる場合に、誤差分布が不偏であるとともに、面積、速度、エネルギー効率の向上が明らかであるので、画像処理、機械学習などの用途に適用できる誤差不偏近似乗算器及びその実現方法にを提供する【解決手段】正規化浮動小数点数に対する差不偏近似乗算器は、符号と指数桁モジュールa、仮数近似モジュールb及び正規化モジュールcを含む。符号と指数桁モジュールは、浮動小数点数の符号演算と指数桁演算を処理する。仮数近似モジュールは、マルチレベル誤差補正モジュールの結果の求和によって、異なった精度要求下の仮数近似結果を得る。正規化モジュールは、仮数の演算結果に基づいて指数桁を調整するとともに、指数桁のオーバーフローを処理して最終の積結果を得る。【選択図】図1

Description

本発明は、低電力消費設計、近似計算、画像処理、機械学習などの工程技術の分野に関し、特に正規化浮動小数点数に対する誤差不偏近似乗算器及びその実現方法に関する。
インターネットオブシングスの機器の急速な発展につれて、インテリジェントモバイルとウェアラブル機器の電力消費は、ビデオ画像処理などの計算集約型応用効果を制限する要因の1つになっている。乗法はビデオ画像処理、畳み込みニューラルネットワークなどの応用内の重要操作であるだけではなく、電力消費を低減するカギでもある。マルチメディア処理、ニューラルネットワークのような特定の応用が誤差を許容する特性を持つのは、計算中の近似の結果への影響が非常に小さいことを意味し、これらの特性により、乗算器の精度を下げて、電力消費、面積を大幅に低減するとともに速度を高めることができる。
近年、近似乗算器の研究の多くは、近似の乗法又は加法モジュールのような近似回路モジュールの設計を対象とし、改めて加法モジュールの論理回路を設計することで回路の複雑さを低下させ、例えば、既存の加法回路の代わりに近似の4-2、15-4 Compressorsモジュールを使用した。また、Parag Kulkarniらは、2×2近似乗算器を提案し、3bitを使用して乗法結果(誤差確率1/16)を表し、該近似乗算器で補正誤差を生成し、且つシフトを追加してより大きなビット幅の乗算器を構築する。これらの近似乗算器は、その固定の論理設計のために精度を調節できなく、且つ一般に平均誤差が比較的大きい。
他の近似方法、例えばDRUM乗算器は、長さがkである仮数を取り込んで、該部分の仮数の乗法結果を仮数の積に近似し、kの値を調節することによって結果精度を調節でき、取り込まれた仮数の後に1を追加して結果誤差を不偏にする。CFPU、RMACは浮動小数点数に対する近似乗算器であり、両者が近似乗算器と精確乗算器を混合する方法を採用し、近似計算が誤差要求を満たせない場合、精確乗法計算を採用し、両者の誤差要求の閾値を調整できるが、近似部分の精度を調整できない。以上の3通りの近似乗算器は依然として精確乗算器を必要とする。ApproxLPは、入力された線形反復操作で非線形乗法操作を置換することで、精確乗算器によらずに精度をリアルタイムで調節できる。従来の乗算器に対して、ApproxLPは、精度、面積などがいずれも向上したが、厳しい理論的サポートと一般的設計方法が欠けているため、その線形反復方法の精度は最適化を達成できない。
以上をまとめると、低誤差、低面積、低電力消費の近似乗算器の一般的設計方法を提供するのは、インテリジェントモバイルとウェアラブル機器の発展にとって極めて重要である。
本発明は、現在の近似乗算器のエネルギー効率に関する従来技術の不足について、正規化浮動小数点数に対する誤差不偏近似乗算器及びその実現方法を提供することを目的とする。理論分析から、平均二乗絶対誤差を標準として、この近似乗算器の線形誤差反復方法は、理論最適性を持ち、且つ相対的誤差が小さく、誤差分布が不偏で、面積の消費が小さく、計算速度が速く、電力消費が小さいという利点を有することがわかる。
本発明の目的は、以下の技術的解決策によって実現される。
正規化浮動小数点数に対する誤差不偏近似乗算器において、誤差不偏近似乗算器は、符号と指数桁モジュール、仮数近似モジュール、及び正規化モジュールを備え、
符号と指数桁モジュールは、入力された正規化浮動小数点数の符号桁に対して排他的論理和処理をし、指数桁に対して加法操作をし且つ2-1のオフセット量を差し引き、ここでnは指数桁の桁数であり、
仮数近似モジュールは0級近似モジュールとマルチレベル誤差補正モジュールを含み、0級近似モジュールとマルチレベル誤差補正モジュールはいずれも浮動小数点数の仮数を入力とし、ここで各誤差補正モジュールはさらに許可信号を必要とし、0級近似モジュールは基礎的な近似仮数乗法結果を生成し、即ちα=1.5×(X+Y)-2.25であり、誤差補正モジュールは許可時に漸進的な誤差補正を出力し、該誤差補正は入力仮数のシフトと1つの定数に対して求和を行い、即ち
Figure 0007016559000002
であり、αは第i級の誤差補正モジュールの出力結果であり、X、Yは入力浮動小数点数仮数で代表された実際値を表し、正規化された浮動小数点数に対して、その範囲は[1,2)であり、A、Bは右シフトの桁数であり、Cは浮動小数点数のオフセット値であり、仮数近似モジュールは0級近似モジュールと許可された誤差補正モジュールの結果を出力して求和を行って、近似の仮数積結果を得、
正規化モジュールは近似の仮数積結果を調整してそれを正規化して、その範囲を[1,2)にするとともに、符号と指数桁モジュールの出力に対して対応した調整を行って、出力される予定の指数結果を得、最後に出力される予定の指数結果に対してオーバーフロー判断を行い、指数桁が上方へオーバーフローすると、結果にIEEE754標準下の無限大の値を与え、指数桁が下方へオーバーフローすると、結果にIEEE754標準下のゼロの値を与え、オーバーフローが発生しないと、現在の符号桁、出力される予定の指数結果、及び近似の仮数積結果を出力として、両正規化浮動小数点数近似乗法の最終の結果を得る。
さらに、指数桁に対して2-1のオフセット量を差し引くことについて、具体的に、IEEE754標準下の32ビットの浮動小数点数に対して、n=8であり、64ビット浮動小数点数に対して、n=11である。
さらに、誤差不偏近似乗算器は、異なった数量の誤差補正モジュールを許可することによって、計算中に近似精度をリアルタイムで調整する。
さらに、符号と指数桁モジュールの指数桁出力結果は、入力された正規化浮動小数点数の指数桁に対して求和を行い、オフセット値2-1を差し引き、指数桁が上位へ2桁拡張して、上方と下方へのオーバーフローを判断することであり、上方へのオーバーフローが発生する時、最上の2桁は01であり、この場合Z-(2-1)>(2-1)になり、符号と指数桁モジュールの指数桁出力結果は大きすぎて表示できない数、即ち正負無限大であり、ここでZは出力される予定の指数結果を表し、下方へのオーバーフローが発生する時、最上の2桁は11であり、この場合Z-(2-1)<0になり、符号と指数桁モジュールの指数桁出力結果は小さすぎて表示できない数、即ち正負ゼロであり、オーバーフローが発生しない時、最上の2桁は00である。
さらに、仮数近似モジュールにおいてデフォルトで入力浮動小数点数は正規化浮動小数点数であり、仮数の前に1を追加して、[1,2)の範囲の仮数実際値を得、且つ最上位に桁拡張をして、即ち0を追加して、仮数の表示範囲を[0,4)にし、0級近似モジュールは基礎的な近似仮数乗法結果を生成し、誤差補正モジュールは、仮数に対して線形処理を行う方法を採用し、誤差補正モジュール内の符号、シフト桁数及びオフセット値は、モジュールレベル、入力仮数の所属範囲によって決定される。
さらに、誤差補正モジュールは両入力浮動小数点数の仮数区間に対して方形区分を行い、第k級の誤差補正モジュールは仮数の範囲[1,2)を2個の等しい区間に区分し、仮数の最初のk桁で仮数の所属区間を判断する必要があり、両入力仮数の所属区間の区分は互いに独立しており、即ちモジュールは[1,2)×[1,2)の入力区間を4個の同じ方形に区分するとともに、異なったレベルの誤差補正モジュールは互いに独立しており、即ち、各モジュールの操作は他のモジュールの結果に依存していない。
さらに、誤差補正モジュールの線形化近似法は、線形代数の極小化問題原理に基づいて、方形区分の場合における最低の平均二乗誤差結果及び不偏の誤差分布を得る。
さらに、正規化モジュールは、仮数近似モジュールの出力結果及び符号と指数桁モジュールの出力結果に対して処理を行い、具体的に、仮数近似モジュールの出力結果に2を乗ずるか、それを2で除するか又はそれをそのままにすることによって、その数値を[1,2)の範囲にし、仮数近似モジュールの出力結果が2以上の場合、仮数近似モジュールの出力結果を右シフトさせ、符号と指数桁モジュールが出力した指数結果部分から1を差し引き、仮数近似モジュールの出力結果が1未満の場合、仮数近似モジュールの出力結果を左シフトさせ、符号と指数桁モジュールが出力した指数部分に1を追加し、仮数近似モジュールの出力結果が[1,2)の範囲にある場合、仮数近似モジュール及び符号と指数桁モジュールの出力結果をそのままにし、正規化モジュールは、仮数近似モジュールの出力結果及び符号と指数桁モジュールの出力結果に対して処理を行った後、処理後の仮数近似モジュールの出力結果を出力される予定の仮数結果とし、処理後の符号と指数桁モジュールの指数部分を出力される予定の指数結果とする。
さらに、正規化モジュールは出力される予定の指数結果に対してオーバーフロー判断をし、出力される予定の指数結果の上2桁が01の場合は、上方へのオーバーフローが発生することを表し、結果にIEEE754標準に該当する無限大の値を与え、即ち指数桁はすべて1であり、仮数桁はすべて0であり、出力される予定の指数結果の上2桁が11の場合は、下方へのオーバーフローが発生することを表し、結果にIEEE754標準のゼロの値を与え、即ち指数桁と仮数桁はすべて0であり、出力される予定の指数結果の上2桁が00の場合、オーバーフローが発生することはなく、符号と指数桁モジュール出力内の符号桁を出力符号桁とし、出力される予定の指数結果の上2桁を削除したものを出力される指数桁とし、出力される予定の仮数結果の上2桁を削除したものを出力される仮数桁とする。
本発明はまた、正規化浮動小数点数に対する誤差不偏近似乗算器の実現方法を提供し、該方法は、具体的に以下のステップによって実現される。
(1)符号と指数桁モジュールは、入力された正規化浮動小数点数内の乗数と被乗数の符号桁に対して排他的論理和処理をし、指数桁に対して上位へ2桁拡張して、乗数と被乗数の指数桁に対して求和を行い、2-1のオフセット量を差し引いて、符号と指数桁モジュールの指数桁結果を得る。
(2)仮数近似モジュール内の0級近似モジュールとマルチレベル誤差補正モジュールはいずれも浮動小数点数の仮数を入力とし、各誤差補正モジュールはさらに1つの許可信号を必要とし、0級近似モジュールの出力はα=1.5×(X+Y)-2.25であり、第i級の誤差補正モジュールの出力は
Figure 0007016559000003
であり、仮数近似モジュールは、0級近似モジュールと許可された誤差補正モジュールの結果出力に対して求和を行って、近似の仮数積結果を得る。
(3)正規化モジュールは符号と指数桁モジュール、仮数近似モジュールの出力を入力とし、仮数近似モジュールの出力結果に2を乗ずるか、それを2で除するか又はそれをそのままにすることによって、その数値を[1,2)の範囲にし、仮数近似モジュールの出力を2で除する場合、符号と指数桁モジュール出力内の指数部分に1を追加し、仮数近似モジュールの出力に2を乗ずる場合、符号と指数桁モジュール出力内の指数部分から1を差し引き、仮数近似モジュールの出力をそのままにする場合、符号と指数桁モジュール出力内の指数部分もそのままにし、正規化モジュールは、出力される予定の仮数結果と出力される予定の指数結果を得る。
(4)出力される予定の指数結果の上2桁に対してオーバーフロー判断をし、上2桁が01の場合、上方へオーバーフローし、結果にIEEE754標準下の無限大の値を与え、上2桁が11の場合、下方へオーバーフローし、結果にIEEE754標準下のゼロの値を与え、上2桁が00の場合、結果にはオーバーフローが発生することはなく、符号と指数桁モジュール出力内の符号桁を出力符号桁とし、出力される予定の指数結果の上2桁を削除したものを出力される指数桁とし、出力される予定の仮数結果の上2桁を削除したものを出力される仮数桁とする。
本発明の有利な効果は次のとおりである。
1)本発明は、規約形式の浮動小数点数に対する近似乗算器を実現しており、精度レベルを制御して、面積、速度、エネルギー効率を著しく向上させることができ、画像処理、機械学習などの用途に適用できる。
2)シフトと加法で誤差に対して反復補正を行うことにより、計算中に近似誤差をリアルタイムで調節できる。
3)線形代数の極小化問題で反復過程における係数を得ることにより、独立した判断を入力する場合の最適化近似を達成するとともに、誤差の不偏の分布を確保する。
図1は、本発明が提案した、a)符号と指数桁モジュールと、b)仮数近似モジュールと、c)正規化モジュールとを含む、正規化浮動小数点数に対する誤差不偏近似乗算器の全体構造の模式図である。 図2は、本発明が提案した近似乗算器とApproxLPとの仮数近似部分における構造的な違いを示す図であり、この図において、a)はApproxLPの仮数近似モジュールの構造図であり、b)は本発明が提案した近似乗算器の仮数近似モジュールの構造図である。 図3は、均一に分布したランダム浮動小数点数入力の場合の、本発明が提案した近似乗算器の異なった近似レベルでの平均二乗誤差MSE、平均絶対誤差MAE、及び最大誤差Max Errorを示す模式図である。
以下、図面と具体的な実施例を参照して、本発明を詳細に説明する。
図1に示すように、本発明が提案した正規化浮動小数点数に対する誤差不偏近似乗算器は、以下のモジュールを含む。
(1)符号と指数桁モジュール:入力された正規化浮動小数点数の符号桁に対して次の排他的論理和操作をする。
Figure 0007016559000004
とyはそれぞれ、入力された両乗数の符号桁を表し、zは、符号桁への排他的論理和操作の結果である。
入力指数桁に対して求和操作をし、そしてオフセット値を差し引いて、符号桁と指数桁の指数結果tを得る。
=x+y-(2-1)
とyはそれぞれ、両乗数の入力指数桁を表し、結果をn+2桁に拡張して次のオーバーフロー判断を行う。上方へのオーバーフローが発生し、即ちx+y-(2-1)>(2-1)である場合、最上の2桁は01になり、下方へのオーバーフローが発生し、即ちx+y-(2-1)<0である場合、最上の2桁は11になる。ここで、nは指数桁の桁数であり、IEEE754標準下の32ビット浮動小数点数に対して、n=8であり、64ビット浮動小数点数に対して、n=11である。
(2)仮数近似モジュール:0級近似モジュールとマルチレベル誤差補正モジュールが含まれており、これらのモジュールはいずれも浮動小数点数の仮数を入力とし、各誤差補正モジュールはさらに1つの許可信号を必要とし、誤差不偏近似乗算器は、異なった数量の誤差補正モジュールを許可することで、計算中に近似精度をリアルタイムで調整する。仮数近似モジュールは、入力仮数への線形操作により、非線形の乗法操作に近似する。線形操作は、
Figure 0007016559000005
を指し、ここでA′、B′、C′は定数であり、Zは近似結果であり、X、Yは入力浮動小数点数の仮数で代表された実際値を表し、規約化された浮動小数点数に対して、その範囲は[1,2)である。定数の再導入と入力された乗法操作を回避するために、最初の2つの係数は2のべき乗または比較的少ない数量の2のべき乗の組み合わせでなければならなく、且つ乗法操作を、入力に対するシフトと加法操作に変換する。仮数近似モジュールは、0級近似モジュールと許可された誤差補正モジュールの結果出力に対して求和を行って、近似の仮数積結果を得る。
本発明が提案した近似乗算器について、第k級の近似は、入力仮数の範囲[1,2)を2個の等しい区間に区分し、その所属区間の必要とされる仮数の最初のk桁を判断し、両入力仮数の所属区間の区分は互いに独立しており、即ちモジュールは、[1,2)×[1,2)の入力区間を4個の同じ方形に区分し、最初のk桁で代表された実際値をXとYとして表すと、その所属区間の中点値はX+(1/(2k+1))とY+(1/(2k+1))になり、即ち第k+1位の小数において追加を行い、
Figure 0007016559000006

Figure 0007016559000007
と表記する。例えば、入力仮数X=1.101011・・・(二進化十進表現)、第4級近似の場合、Xの小数位の最初の4桁を必要とし、X=1.1010になり、Xの所属区間は[1.1010,1.1011)であり、この区間の中点値は
Figure 0007016559000008
である。第k級近似の近似乗法結果はsと表記し、極小化問題に基づいて次式を得ることができる。
Figure 0007016559000009
特に、0級近似モジュールがk=0の場合、α=1.5x+1.5y-2.25になる。k≠0の場合、α=s-sk+1になって、各級モジュール結果の求和
Figure 0007016559000010
を確保する。また、計算αの式は次のとおりである。
Figure 0007016559000011
各級の誤差補正モジュールは、入力仮数のシフト操作のみに関し、第i級の誤差補正モジュールは、入力をi+1桁右シフトさせ、X[i]?(1):(-1)の式について、X[i]が1の場合、この式の結果は1になり、X[i]が0の場合、この式の結果は-1になり、即ち正負記号は、他方の入力された第i位の値によって決定される。
Figure 0007016559000012
のオフセット項は、入力された所属区間に関連付けられ、iが大きくない場合、それを定数として予め計算することにより、論理ユニットを省くことができる。
例えば、第1級誤差補正モジュールでは、入力区間が{[1,1.5],[1.5,2)}×{[1,1.5],[1.5,2)}の4つの区間に区分され、異なった区間のオフセット項の値は次のとおりである。
Figure 0007016559000013
図2は、本発明が提案した近似乗算器とApproxLPとの仮数近似部分における構造的な違いを示す模式図である。図2のa)はApproxLPの仮数近似モジュールの構造図であり、高レベルの誤差補正モジュールは、低レベルの誤差補正モジュールの判断結果に依存している。図2のb)は本発明が提案した近似乗算器の仮数近似モジュールの構造図であり、異なったレベルのモジュールの間に依存関係がない。ApproxLP近似乗算器に比べて、本発明が提案した近似乗算器は、両浮動小数点数入力に対して独立した判断をし、且つ異なったレベルのモジュールの判断は互いに独立しており、高レベルの誤差補正モジュールは低レベルの誤差補正モジュールの判断結果に依存せず、各モジュールの領域に対する判断はすべての桁を使用する必要がないため、判断論理と回路延時を単純化している。加えて、図3に示すように、均一に分布したランダム浮動小数点数入力について、近似レベルによって、本発明が提案した近似乗算器は、近似レベルが多ければ多いほど、平均二乗誤差MSE、平均絶対誤差MAE、及び最大誤差Max Errorが小さくなる。
区間数のそれぞれには、1つの予め設定されたオフセット値が要求されるため、低レベルのモジュールでは非常に便利で簡潔であるが、この数量はモジュールレベルの複雑さとともに指数関数的に増大するため、高レベルの誤差補正モジュールに対して、以下の最適化方法を提案する。
第i級の誤差補正結果は以下の形式に等しい。
Figure 0007016559000014
上記の形式を採用する近似モジュールは、加法操作を2回、シフトと排他的論理和操作を1回追加しているが、予めオフセット値を算出する必要がないので、近似レベルが比較的高い場合に回路の複雑さを大幅に低減できる。
(3)正規化モジュール:正規化モジュールは、仮数近似モジュールの出力結果の範囲に対して、それが正規化要求を満たすように調整を行う。正規化浮動小数点数の仮数範囲は[1,2)であり、近似計算のために、両仮数の近似積の範囲は(0.5,4)であり、仮数積結果が(0.5,1)の範囲にある場合、最上の2桁は00になり、結果を1桁左シフトさせて出力される予定の仮数結果とし、仮数積結果が[2,4)の範囲にある場合、最上位は1であり、結果を1桁右シフトさせて出力される予定の仮数結果とし、符号桁と指数桁の指数結果に1を足して出力される予定の指数結果とし、仮数積結果が[1,2)の範囲にある場合、最上の2桁は01になり、シフトすることなく直接出力される予定の仮数結果とし、且つ直接指数桁の指数結果を出力される予定の指数結果とする。
上記操作後、出力される予定の指数結果に対して以下の判断を行う。出力される予定の指数結果の上2桁が01の場合は、上方へのオーバーフローが発生することを表し、即ち大きすぎて表示できない表示数となり、結果にIEEE754標準に該当する無限大の値を与え、即ち指数桁はすべて1であり、仮数桁はすべて0であり、最終の指数結果の上2桁が11の場合は、下方へのオーバーフローが発生することを表し、即ち小さすぎて表示できない数であり、結果にIEEE754標準のゼロの値を与え、即ち指数桁と仮数はすべて0である。オーバーフローが発生しないと、符号と指数桁モジュール出力内の符号桁を出力符号桁とし、出力される予定の指数結果の上2桁を削除したものを出力される指数桁とし、仮数近似モジュールの出力される小数部分を出力した仮数桁とする。
本発明はまた、正規化浮動小数点数に対する誤差不偏近似乗算器の実現方法を提供し、それを実現する具体的なステップは次のとおりである。
(1)符号と指数桁モジュールは、入力された正規化浮動小数点数内の乗数と被乗数の符号桁に対して排他的論理和処理をし、指数桁に対して上位へ2桁拡張して、乗数と被乗数の指数桁に対して求和を行い、2-1のオフセット量を差し引いて、符号と指数桁モジュールの指数桁結果を得る。
(2)仮数近似モジュール内の0級近似モジュールとマルチレベル誤差補正モジュールはいずれも浮動小数点数の仮数を入力とし、各誤差補正モジュールはさらに1つの許可信号を必要とし、0級近似モジュールの出力はα=1.5×(X+Y)-2.25であり、第i級の誤差補正モジュールの出力は
Figure 0007016559000015
であり、X、Yは入力浮動小数点数仮数で代表された実際値を表し、正規化された浮動小数点数に対して、その範囲は[1,2)であり、A、Bは右シフトの桁数であり、Cは浮動小数点数のオフセット値であり、プラスマイナス記号とA、B、Cの値は、入力した浮動小数点数の仮数区間に対して方形区分分割後、線形代数極小化問題を用いて決定される。前記方形区分は、具体的には、第k段階の誤差補正モジュールが仮数の範囲[1,2)を2個の等しい区間に区分し、仮数の上位kビットが端数の所属区間を判断する必要があり、仮数近似モジュールは、0級近似モジュールと許可された誤差補正モジュールの結果出力に対して求和を行って、近似の仮数積結果を得る。
(3)正規化モジュールは符号と指数桁モジュール、仮数近似モジュールの出力を入力とし、仮数近似モジュールの出力結果に2を乗ずるか、それを2で除するか又はそれをそのままにすることによって、その数値を[1,2)の範囲にし、仮数近似モジュールの出力を2で除する場合、符号と指数桁モジュール出力内の指数部分に1を追加し、仮数近似モジュールの出力に2を乗ずる場合、符号と指数桁モジュール出力内の指数部分から1を差し引き、仮数近似モジュールの出力をそのままにする場合、符号と指数桁モジュール出力内の指数部分もそのままにし、正規化モジュールは、出力される予定の仮数結果と出力される予定の指数結果を得る。
(4)出力される予定の指数結果の上2桁に対してオーバーフロー判断をし、上2桁が01の場合、上方へオーバーフローし、結果にIEEE754標準下の無限大の値を与え、上2桁が11の場合、下方へオーバーフローし、結果にIEEE754標準下のゼロの値を与え、上2桁が00の場合、結果にはオーバーフローが発生することはなく、符号と指数桁モジュール出力内の符号桁を出力符号桁とし、出力される予定の指数結果の上2桁を削除したものを出力される指数桁とし、出力される予定の仮数結果の上2桁を削除したものを出力される仮数桁とする。
本特許は、上述した最良の実施形態に限定されなく、誰でも本特許に開示された実施形態から他の様々な形式の配置可能な近似乗算器及びその実現方法を得ることができ、本発明の請求範囲により行った同等な変化と修飾の全ては本特許の範囲内に含まれる。
(付記)
(付記1)
誤差不偏近似乗算器は、符号と指数桁モジュール、仮数近似モジュール、及び正規化モジュールを備え、
前記符号と指数桁モジュールは、入力された正規化浮動小数点数の符号桁に対して排他的論理和処理をし、指数桁に対して加法操作をし且つ2-1のオフセット量を差し引き、ここでnは指数桁の桁数であり、
前記仮数近似モジュールは0級近似モジュールとマルチレベル誤差補正モジュールを含み、前記0級近似モジュールとマルチレベル誤差補正モジュールはいずれも浮動小数点数の仮数を入力とし、ここで各誤差補正モジュールはさらに許可信号を必要とし、0級近似モジュールは基礎的な近似仮数乗法結果を生成し、即ちα=1.5×(X+Y)-2.25であり、誤差補正モジュールは許可時に漸進的な誤差補正を出力し、該誤差補正は入力仮数のシフトと1つの定数に対して求和を行い、即ち
Figure 0007016559000016
であり、αは第i級の誤差補正モジュールの出力結果であり、X、Yは入力浮動小数点数仮数で代表された実際値を表し、正規化された浮動小数点数に対して、その範囲は[1,2)であり、A、Bは右シフトの桁数であり、Cは浮動小数点数のオフセット値であり、仮数近似モジュールは0級近似モジュールと許可された誤差補正モジュールの結果を出力して求和を行って、近似の仮数積結果を得、
前記正規化モジュールは近似の仮数積結果を調整してそれを正規化して、その範囲を[1,2)にするとともに、符号と指数桁モジュールの出力に対して対応した調整を行って、出力される予定の指数結果を得、最後に出力される予定の指数結果に対してオーバーフロー判断を行い、指数桁が上方へオーバーフローすると、結果にIEEE754標準下の無限大の値を与え、指数桁が下方へオーバーフローすると、結果にIEEE754標準下のゼロの値を与え、オーバーフローが発生しないと、現在の符号桁、出力される予定の指数結果、及び近似の仮数積結果を出力として、両正規化浮動小数点数近似乗法の最終の結果を得ることを特徴とする、
正規化浮動小数点数に対する誤差不偏近似乗算器。
(付記2)
指数桁に対して2-1のオフセット量を差し引くことについて、具体的に、IEEE754標準下の32ビットの浮動小数点数に対して、n=8であり、64ビット浮動小数点数に対して、n=11であることを特徴とする、
付記1に記載の正規化浮動小数点数に対する誤差不偏近似乗算器。
(付記3)
誤差不偏近似乗算器は、異なった数量の誤差補正モジュールを許可することによって、計算中に近似精度をリアルタイムで調整することを特徴とする、
付記1に記載の正規化浮動小数点数に対する誤差不偏近似乗算器。
(付記4)
符号と指数桁モジュールの指数桁出力結果は、入力された正規化浮動小数点数の指数桁に対して求和を行い、オフセット値2-1を差し引き、指数桁が上位へ2桁拡張して、上方と下方へのオーバーフローを判断することであり、上方へのオーバーフローが発生する時、最上の2桁は01であり、この場合Z-(2-1)>(2-1)になり、符号と指数桁モジュールの指数桁出力結果は大きすぎて表示できない数、即ち正負無限大であり、ここでZは出力される予定の指数結果を表し、下方へのオーバーフローが発生する時、最上の2桁は11であり、この場合Z-(2-1)<0になり、符号と指数桁モジュールの指数桁出力結果は小さすぎて表示できない数、即ち正負ゼロであり、オーバーフローが発生しない時、最上の2桁は00であることを特徴とする、
付記1に記載の正規化浮動小数点数に対する誤差不偏近似乗算器。
(付記5)
前記仮数近似モジュールにおいてデフォルトで入力浮動小数点数は正規化浮動小数点数であり、仮数の前に1を追加して、[1,2)の範囲の仮数実際値を得、且つ最上位に桁拡張をして、即ち0を追加して、仮数の表示範囲を[0,4)にし、0級近似モジュールは基礎的な近似仮数乗法結果を生成し、誤差補正モジュールは、仮数に対して線形処理を行う方法を採用し、誤差補正モジュール内の符号、シフト桁数及びオフセット値は、モジュールレベル、入力仮数の所属範囲によって決定されることを特徴とする、
付記1に記載の正規化浮動小数点数に対する誤差不偏近似乗算器。
(付記6)
誤差補正モジュールは両入力浮動小数点数の仮数区間に対して方形区分を行い、第k級の誤差補正モジュールは仮数の範囲[1,2)を2個の等しい区間に区分し、仮数の最初のk桁で仮数の所属区間を判断する必要があり、両入力仮数の所属区間の区分は互いに独立しており、即ちモジュールは[1,2)×[1,2)の入力区間を4個の同じ方形に区分するとともに、異なったレベルの誤差補正モジュールは互いに独立していることを特徴とする、
付記1に記載の正規化浮動小数点数に対する誤差不偏近似乗算器。
(付記7)
誤差補正モジュールの線形化近似法は、線形代数の極小化問題原理に基づいて、方形区分の場合における最低の平均二乗誤差結果及び不偏の誤差分布を得ることを特徴とする、
付記6に記載の正規化浮動小数点数に対する誤差不偏近似乗算器。
(付記8)
正規化モジュールは、仮数近似モジュールの出力結果及び符号と指数桁モジュールの出力結果に対して処理を行い、具体的に、仮数近似モジュールの出力結果に2を乗ずるか、それを2で除するか又はそれをそのままにすることによって、その数値を[1,2)の範囲にし、仮数近似モジュールの出力結果が2以上の場合、仮数近似モジュールの出力結果を右シフトさせ、符号と指数桁モジュールが出力した指数結果部分から1を差し引き、仮数近似モジュールの出力結果が1未満の場合、仮数近似モジュールの出力結果を左シフトさせ、符号と指数桁モジュールが出力した指数部分に1を追加し、仮数近似モジュールの出力結果が[1,2)の範囲にある場合、仮数近似モジュール及び符号と指数桁モジュールの出力結果をそのままにし、正規化モジュールは、仮数近似モジュールの出力結果及び符号と指数桁モジュールの出力結果に対して処理を行った後、処理後の仮数近似モジュールの出力結果を出力される予定の仮数結果とし、処理後の符号と指数桁モジュールの指数部分を出力される予定の指数結果とすることを特徴とする、
付記1に記載の正規化浮動小数点数に対する誤差不偏近似乗算器。
(付記9)
正規化モジュールは出力される予定の指数結果に対してオーバーフロー判断をし、出力される予定の指数結果の上2桁が01の場合は、上方へのオーバーフローが発生することを表し、結果にIEEE754標準に該当する無限大の値を与え、即ち指数桁はすべて1であり、仮数桁はすべて0であり、出力される予定の指数結果の上2桁が11の場合は、下方へのオーバーフローが発生することを表し、結果にIEEE754標準のゼロの値を与え、即ち指数桁と仮数桁はすべて0であり、出力される予定の指数結果の上2桁が00の場合、オーバーフローが発生することはなく、符号と指数桁モジュール出力内の符号桁を出力符号桁とし、出力される予定の指数結果の上2桁を削除したものを出力される指数桁とし、出力される予定の仮数結果の上2桁を削除したものを出力される仮数桁とすることを特徴とする、
付記1に記載の正規化浮動小数点数に対する誤差不偏近似乗算器。
(付記10)
(1)符号と指数桁モジュールは、入力された正規化浮動小数点数内の乗数と被乗数の符号桁に対して排他的論理和処理をし、指数桁に対して上位へ2桁拡張して、乗数と被乗数の指数桁に対して求和を行い、2-1のオフセット量を差し引いて、符号と指数桁モジュールの指数桁結果を得るステップと、
(2)仮数近似モジュール内の0級近似モジュールとマルチレベル誤差補正モジュールはいずれも浮動小数点数の仮数を入力とし、各誤差補正モジュールはさらに1つの許可信号を必要とし、0級近似モジュールの出力はα=1.5×(X+Y)-2.25であり、第i級の誤差補正モジュールの出力は
Figure 0007016559000017
であり、仮数近似モジュールは、0級近似モジュールと許可された誤差補正モジュールの結果出力に対して求和を行って、近似の仮数積結果を得るステップと、
(3)正規化モジュールは符号と指数桁モジュール、仮数近似モジュールの出力を入力とし、仮数近似モジュールの出力結果に2を乗ずるか、それを2で除するか又はそれをそのままにすることによって、その数値を[1,2)の範囲にし、仮数近似モジュールの出力を2で除する場合、符号と指数桁モジュール出力内の指数部分に1を追加し、仮数近似モジュールの出力に2を乗ずる場合、符号と指数桁モジュール出力内の指数部分から1を差し引き、仮数近似モジュールの出力をそのままにする場合、符号と指数桁モジュール出力内の指数部分もそのままにし、正規化モジュールは、出力される予定の仮数結果と出力される予定の指数結果を得るステップと、
(4)出力される予定の指数結果の上2桁に対してオーバーフロー判断をし、上2桁が01の場合、上方へオーバーフローし、結果にIEEE754標準下の無限大の値を与え、上2桁が11の場合、下方へオーバーフローし、結果にIEEE754標準下のゼロの値を与え、上2桁が00の場合、結果にはオーバーフローが発生することはなく、符号と指数桁モジュール出力内の符号桁を出力符号桁とし、出力される予定の指数結果の上2桁を削除したものを出力される指数桁とし、出力される予定の仮数結果の上2桁を削除したものを出力される仮数桁とするステップとによって実現されることを特徴とする、
付記1に記載の正規化浮動小数点数に対する誤差不偏近似乗算器に基づく実現方法。

Claims (10)

  1. 誤差不偏近似乗算器は、符号と指数桁モジュール、仮数近似モジュール、及び正規化モジュールを備え、
    前記符号と指数桁モジュールは、入力された正規化浮動小数点数の符号桁に対して排他的論理和処理をし、指数桁に対して加法操作をし且つ2-1のオフセット量を差し引き、ここでnは指数桁の桁数であり、
    前記仮数近似モジュールは0級近似モジュールとマルチレベル誤差補正モジュールを含み、前記0級近似モジュールとマルチレベル誤差補正モジュールはいずれも浮動小数点数の仮数を入力とし、ここで各誤差補正モジュールはさらに許可信号を必要とし、0級近似モジュールは基礎的な近似仮数乗法結果を生成し、即ちα=1.5×(X+Y)-2.25であり、誤差補正モジュールは許可時に漸進的な誤差補正を出力し、該誤差補正は入力仮数のシフトと1つの定数に対して求和を行い、即ち
    Figure 0007016559000018
    であり、αは第i級の誤差補正モジュールの出力結果であり、X、Yは入力浮動小数点数仮数で代表された実際値を表し、正規化された浮動小数点数に対して、その範囲は[1,2)であり、A、Bは右シフトの桁数であり、Cは浮動小数点数のオフセット値であり、仮数近似モジュールは0級近似モジュールと許可された誤差補正モジュールの結果を出力して求和を行って、近似の仮数積結果を得、
    前記正規化モジュールは近似の仮数積結果を調整してそれを正規化して、その範囲を[1,2)にするとともに、符号と指数桁モジュールの出力に対して対応した調整を行って、出力される予定の指数結果を得、最後に出力される予定の指数結果に対してオーバーフロー判断を行い、指数桁が上方へオーバーフローすると、結果にIEEE754標準下の無限大の値を与え、指数桁が下方へオーバーフローすると、結果にIEEE754標準下のゼロの値を与え、オーバーフローが発生しないと、現在の符号桁、出力される予定の指数結果、及び近似の仮数積結果を出力として、2つの正規化浮動小数点数近似乗法の最終の結果を得ることを特徴とする、
    正規化浮動小数点数に対する誤差不偏近似乗算器。
  2. 指数桁に対して2-1のオフセット量を差し引くことについて、具体的に、IEEE754標準下の32ビットの浮動小数点数に対して、n=8であり、64ビット浮動小数点数に対して、n=11であることを特徴とする、
    請求項1に記載の正規化浮動小数点数に対する誤差不偏近似乗算器。
  3. 誤差不偏近似乗算器は、異なった数量の誤差補正モジュールを許可することによって、計算中に近似精度をリアルタイムで調整することを特徴とする、
    請求項1に記載の正規化浮動小数点数に対する誤差不偏近似乗算器。
  4. 符号と指数桁モジュールの指数桁出力結果は、入力された正規化浮動小数点数の指数桁に対して求和を行い、オフセット値2-1を差し引き、指数桁が上位へ2桁拡張して、上方と下方へのオーバーフローを判断することであり、上方へのオーバーフローが発生する時、最上の2桁は01であり、この場合Z-(2-1)>(2-1)になり、符号と指数桁モジュールの指数桁出力結果は大きすぎて表示できない数、即ち正負無限大であり、ここでZは出力される予定の指数結果を表し、下方へのオーバーフローが発生する時、最上の2桁は11であり、この場合Z-(2-1)<0になり、符号と指数桁モジュールの指数桁出力結果は小さすぎて表示できない数、即ち正負ゼロであり、オーバーフローが発生しない時、最上の2桁は00であることを特徴とする、
    請求項1に記載の正規化浮動小数点数に対する誤差不偏近似乗算器。
  5. 前記仮数近似モジュールにおいてデフォルトで入力浮動小数点数は正規化浮動小数点数であり、仮数の前に1を追加して、[1,2)の範囲の仮数実際値を得、且つ最上位に桁拡張をして、即ち0を追加して、仮数の表示範囲を[0,4)にし、0級近似モジュールは基礎的な近似仮数乗法結果を生成し、誤差補正モジュールは、仮数に対して線形処理を行う方法を採用し、誤差補正モジュール内の符号、シフト桁数及びオフセット値は、モジュールレベル、入力仮数の所属範囲によって決定されることを特徴とする、
    請求項1に記載の正規化浮動小数点数に対する誤差不偏近似乗算器。
  6. 誤差補正モジュールは両入力浮動小数点数の仮数区間に対して方形区分を行い、第k級の誤差補正モジュールは仮数の範囲[1,2)を2個の等しい区間に区分し、仮数の最初のk桁で仮数の所属区間を判断する必要があり、両入力仮数の所属区間の区分は互いに独立しており、即ちモジュールは[1,2)X[1,2)の入力区間を4個の同じ方形に区分するとともに、異なったレベルの誤差補正モジュールは互いに独立していることを特徴とする、
    請求項1に記載の正規化浮動小数点数に対する誤差不偏近似乗算器。
  7. 誤差補正モジュールの線形化近似法は、線形代数の極小化問題原理に基づいて、方形区分の場合における最低の平均二乗誤差結果及び不偏の誤差分布を得ることを特徴とする、
    請求項6に記載の正規化浮動小数点数に対する誤差不偏近似乗算器。
  8. 正規化モジュールは、仮数近似モジュールの出力結果及び符号と指数桁モジュールの出力結果に対して処理を行い、具体的に、仮数近似モジュールの出力結果に2を乗ずるか、それを2で除するか又はそれをそのままにすることによって、その数値を[1,2)の範囲にし、仮数近似モジュールの出力結果が2以上の場合、仮数近似モジュールの出力結果を右シフトさせ、符号と指数桁モジュールが出力した指数結果部分から1を差し引き、仮数近似モジュールの出力結果が1未満の場合、仮数近似モジュールの出力結果を左シフトさせ、符号と指数桁モジュールが出力した指数部分に1を追加し、仮数近似モジュールの出力結果が[1,2)の範囲にある場合、仮数近似モジュール及び符号と指数桁モジュールの出力結果をそのままにし、正規化モジュールは、仮数近似モジュールの出力結果及び符号と指数桁モジュールの出力結果に対して処理を行った後、処理後の仮数近似モジュールの出力結果を出力される予定の仮数結果とし、処理後の符号と指数桁モジュールの指数部分を出力される予定の指数結果とすることを特徴とする、
    請求項1に記載の正規化浮動小数点数に対する誤差不偏近似乗算器。
  9. 正規化モジュールは出力される予定の指数結果に対してオーバーフロー判断をし、出力される予定の指数結果の上2桁が01の場合は、上方へのオーバーフローが発生することを表し、結果にIEEE754標準に該当する無限大の値を与え、即ち指数桁はすべて1であり、仮数桁はすべて0であり、出力される予定の指数結果の上2桁が11の場合は、下方へのオーバーフローが発生することを表し、結果にIEEE754標準のゼロの値を与え、即ち指数桁と仮数桁はすべて0であり、出力される予定の指数結果の上2桁が00の場合、オーバーフローが発生することはなく、符号と指数桁モジュール出力内の符号桁を出力符号桁とし、出力される予定の指数結果の上2桁を削除したものを出力される指数桁とし、出力される予定の仮数結果の上2桁を削除したものを出力される仮数桁とすることを特徴とする、
    請求項1に記載の正規化浮動小数点数に対する誤差不偏近似乗算器。
  10. (1)符号と指数桁モジュールは、入力された正規化浮動小数点数内の乗数と被乗数の符号桁に対して排他的論理和処理をし、指数桁に対して上位へ2桁拡張して、乗数と被乗数の指数桁に対して求和を行い、2-1のオフセット量を差し引いて、符号と指数桁モジュールの指数桁結果を得るステップと、
    (2)仮数近似モジュール内の0級近似モジュールとマルチレベル誤差補正モジュールはいずれも浮動小数点数の仮数を入力とし、各誤差補正モジュールはさらに1つの許可信号を必要とし、0級近似モジュールの出力はα=1.5×(X+Y)-2.25であり、第i級の誤差補正モジュールの出力は
    Figure 0007016559000019
    であり、仮数近似モジュールは、0級近似モジュールと許可された誤差補正モジュールの結果出力に対して求和を行って、近似の仮数積結果を得るステップと、
    (3)正規化モジュールは符号と指数桁モジュール、仮数近似モジュールの出力を入力とし、仮数近似モジュールの出力結果に2を乗ずるか、それを2で除するか又はそれをそのままにすることによって、その数値を[1,2)の範囲にし、仮数近似モジュールの出力を2で除する場合、符号と指数桁モジュール出力内の指数部分に1を追加し、仮数近似モジュールの出力に2を乗ずる場合、符号と指数桁モジュール出力内の指数部分から1を差し引き、仮数近似モジュールの出力をそのままにする場合、符号と指数桁モジュール出力内の指数部分もそのままにし、正規化モジュールは、出力される予定の仮数結果と出力される予定の指数結果を得るステップと、
    (4)出力される予定の指数結果の上2桁に対してオーバーフロー判断をし、上2桁が01の場合、上方へオーバーフローし、結果にIEEE754標準下の無限大の値を与え、上2桁が11の場合、下方へオーバーフローし、結果にIEEE754標準下のゼロの値を与え、上2桁が00の場合、結果にはオーバーフローが発生することはなく、符号と指数桁モジュール出力内の符号桁を出力符号桁とし、出力される予定の指数結果の上2桁を削除したものを出力される指数桁とし、出力される予定の仮数結果の上2桁を削除したものを出力される仮数桁とするステップとによって実現されることを特徴とする、
    請求項1に記載の正規化浮動小数点数に対する誤差不偏近似乗算器に基づく実現方法。
JP2021065061A 2020-09-15 2021-04-07 正規化浮動小数点数に対する誤差不偏近似乗算器及びその実現方法 Active JP7016559B1 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010969041.7 2020-09-15
CN202010969041.7A CN111930342B (zh) 2020-09-15 2020-09-15 一种针对规格化浮点数的误差无偏近似乘法器及其实现方法

Publications (2)

Publication Number Publication Date
JP7016559B1 true JP7016559B1 (ja) 2022-02-07
JP2022048965A JP2022048965A (ja) 2022-03-28

Family

ID=73333525

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021065061A Active JP7016559B1 (ja) 2020-09-15 2021-04-07 正規化浮動小数点数に対する誤差不偏近似乗算器及びその実現方法

Country Status (3)

Country Link
US (1) US11429347B2 (ja)
JP (1) JP7016559B1 (ja)
CN (1) CN111930342B (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114860190B (zh) * 2022-04-28 2023-03-24 中国人民解放军战略支援部队信息工程大学 一种针对高性能计算函数库中浮点算术表达式在指定区间内误差较大子区间划分方法及***

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019121398A (ja) 2018-01-09 2019-07-22 三星電子株式会社Samsung Electronics Co.,Ltd. ルックアップテーブルを利用して加速化されたコンピューティングの方法及びシステム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63259720A (ja) * 1988-03-25 1988-10-26 Hitachi Ltd 浮動小数点乗算回路
JP3201097B2 (ja) * 1993-09-02 2001-08-20 理化学研究所 乗算器における乗算処方方法
CN104011706B (zh) * 2011-12-31 2018-04-10 英特尔公司 包括对数和反对数单元的图形照明引擎
US10042607B2 (en) * 2016-08-22 2018-08-07 Altera Corporation Variable precision floating-point multiplier
CN107153522B (zh) * 2017-04-21 2020-10-02 东南大学 一种面向人工神经网络计算的动态精度可配近似乘法器
US10474458B2 (en) * 2017-04-28 2019-11-12 Intel Corporation Instructions and logic to perform floating-point and integer operations for machine learning
CN109901814A (zh) * 2019-02-14 2019-06-18 上海交通大学 自定义浮点数及其计算方法和硬件结构

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019121398A (ja) 2018-01-09 2019-07-22 三星電子株式会社Samsung Electronics Co.,Ltd. ルックアップテーブルを利用して加速化されたコンピューティングの方法及びシステム

Also Published As

Publication number Publication date
US20220083313A1 (en) 2022-03-17
JP2022048965A (ja) 2022-03-28
CN111930342B (zh) 2021-01-19
US11429347B2 (en) 2022-08-30
CN111930342A (zh) 2020-11-13

Similar Documents

Publication Publication Date Title
CN105468331B (zh) 独立的浮点转换单元
CN111768002A (zh) 一种基于弹性有效位的深度神经网络量化方法
CN111984227B (zh) 一种针对复数平方根的近似计算装置及方法
CN112051980B (zh) 一种基于牛顿迭代法的非线性激活函数计算装置
Qin et al. A novel approximation methodology and its efficient vlsi implementation for the sigmoid function
CN110852434A (zh) 基于低精度浮点数的cnn量化方法、前向计算方法及装置
CN108196822A (zh) 一种双精度浮点开方运算的方法及***
JP7016559B1 (ja) 正規化浮動小数点数に対する誤差不偏近似乗算器及びその実現方法
CN109165006B (zh) Softmax函数的设计优化及硬件实现方法及***
De Caro et al. Accurate fixed-point logarithmic converter
Chen et al. A cordic-based architecture with adjustable precision and flexible scalability to implement sigmoid and tanh functions
CN117032625A (zh) 一种低延时的浮点平方根函数硬件实现方法
JPH09325955A (ja) 二乗和の平方根演算回路
Chandra A novel method for scalable VLSI implementation of hyperbolic tangent function
CN110879697B (zh) 一种近似计算tanh函数的装置
CN110837624A (zh) 一种针对sigmoid函数的近似计算装置
CN115936076A (zh) 一种适配深度学习硬件加速器的可重构激活函数硬件装置
Chen et al. Stochastic computing using amplitude and frequency encoding
CN115526131A (zh) 多级编码近似计算Tanh函数的方法及装置
WO2023004799A1 (zh) 电子设备及神经网络量化方法
Vani et al. VLSI design of a novel area efficient fir filter design using roba multiplier
CN117372296B (zh) 一种经济型gamma校正方法及装置
Yuan Resource-saving Design Scheme Based on Look-Up Table for Activation Functions
CN113515259B (zh) 一种适用于浮点格式的复数的近似取模实现电路及方法
Mahima et al. Reconfigurable Rounding based Approximate Multiplier for Floating Point Numbers

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210616

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20210616

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210907

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211206

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211221

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220119

R150 Certificate of patent or registration of utility model

Ref document number: 7016559

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150