JP7368512B2

JP7368512B2 - 計算装置、集積回路チップ、ボードカード、電子デバイスおよび計算方法

Info

Publication number: JP7368512B2
Application number: JP2021576558A
Authority: JP
Inventors: ▲しん▼ 喩; 少礼劉; 勁樺陶
Original assignee: 寒武紀（西安）集成電路有限公司
Priority date: 2020-06-30
Filing date: 2021-05-19
Publication date: 2023-10-24
Anticipated expiration: 2041-05-19
Also published as: JP2022542217A; CN113867793A; WO2022001455A1; US20230297387A1

Description

技術技術

＜関連出願＞
本出願は、２０２０年０６月３０日に出願され、出願番号が第２０２０１０６１９４８１Xで、名称が「計算装置、集積回路チップ、ボードカード、電子デバイスおよび計算方法」である中国特許出願の優先権を主張しており、同出願の内容の全ては、ここに参照として取り込まれる。

本開示は、通常、計算分野に関する。より具体的に、本開示は、計算装置、集積回路チップ、ボードカード、電子デバイスおよび計算方法に関する。

計算システムにおいて、命令セットは、計算の実行と計算システムへの制御に用いられる一連の命令のセットであり、かつ計算システムにおける計算チップ（例えば、プロセッサ）の性能を向上させる方面でキーポイントとなる役割を果たしている。現在の様々な計算チップ（特に、人工知能分野のチップ）は、関連付けられている命令セットを使用して、様々な汎用または特定の制御操作とデータ処理操作を完了することができる。
しかし、現在の命令セットには多くの欠陥が存在する。例えば、既存の命令セットは、ハードウェアアーキテクチャによって制限されており、柔軟性の方面で比較的に劣っている。さらに、多くの命令は単一の操作しか完了できず、通常、複数の操作を実行するには複数の命令が必要であり、それは、オンチップI／Ｏのデータのスループットの増大を潜在的に齎す。また、現在の命令は、実行速度、実行効率およびチップによって引き起こされる消費電力の点で、改善される余地がある。

上記の先行技術に存在する問題を少なくとも解決するために、本開示は、多段パイプライン演算をサポートする１組または複数組のパイプライン演算回路を備えるハードウェアアーキテクチャを提供する。本開示の解決策は、該ハードウェアアーキテクチャを使用して、計算命令を実行することによって、ハードウェアの処理性能の補強、電力消費の低減、計算操作の実行効率の向上、および計算オーバヘッドの回避などを含む複数の方面で技術的利点を得ることができる。

第１の態様において、本開示は計算装置を提供する。前記計算装置は、多段パイプライン演算を実行するように配置された１組または複数組のパイプライン演算回路を含み、各組の前記パイプライン演算回路は、１つの多段演算パイプラインを構成し、前記多段演算パイプラインには、段階的に設けられた複数の演算回路が含まれており、複数の演算命令の受信に応答して、前記多段演算パイプラインにおける各段演算回路は、前記複数の演算命令のうちの対応する１つの演算命令を実行するように配置されており、前記複数の演算命令は、前記計算装置によって受信された計算命令を解析することにより得られる。

第２の態様において、本開示は、上記のように記載され、かつ以下の複数の実施例で説明される計算装置を含む、集積回路チップを提供する。

第３の態様において、本開示は、上記のように記載され、かつ以下の複数の実施例で説明される集積回路チップを含む、ボードカードを提供する。

第４の態様において、本開示は、上記のように記載され、かつ以下の複数の実施例で説明される集積回路チップを含む、電子デバイスを提供する。

第５の態様において、本開示は、前述の計算装置を使用して計算を実行する方法を提供する。前記計算装置は、１組または複数組のパイプライン演算回路を含み、前記方法は、前記１組または複数組のパイプライン演算回路における各組を、多段パイプライン演算を実行するように配置しており、各組の前記パイプライン演算回路は、１つの多段演算パイプラインを構成し、該多段演算パイプラインには、段階的に設けられた複数の演算回路が含まれていること、および複数の演算命令の受信に応答して、前記多段演算パイプラインにおける各段演算回路を、前記複数の演算命令のうちの対応する１つの演算命令を実行するように配置することを含んでおり、前記複数の演算命令は、前記計算装置によって受信された計算命令を解析することにより得られる。

本開示の計算装置、集積回路チップ、ボードカード、電子デバイスおよび方法を使用することによって、パイプライン演算、特に人工知能分野における様々な多段パイプライン演算を効率的に実行することができる。さらに、本開示の解決策は、独特のハードウェアアーキテクチャにより効率的な演算操作を実現することができ、それにより、ハードウェアの全体的な性能を向上させ、計算オーバーヘッドを削減させることができる。

本開示の例示的な実施形態の上記内容および他の目的、特徴と利点は、添付図面を参照して、以下の詳細な説明を読むことによって容易に理解される。添付図面において、本開示のいくつかの実施形態は、限定的ではなく例示的なもので示され、同じまたは対応する符号は、同じまたは対応する部分を示している。

本開示の一実施例に係る計算装置を示すブロック図である。本開示の別の一実施例に係る計算装置を示すブロック図である。本開示の実施例におけるデータ変換回路によって実施されたマトリックス変換を示す模式図である。本開示の実施例におけるデータ変換回路によって実施されたマトリックス変換を示す模式図である。本開示の実施例におけるデータ変換回路によって実施されたマトリックス変換を示す模式図である。本開示の実施例に係る計算システムを示すブロック図である。本開示の実施例に係る計算装置を使用して演算操作を実行する方法を示す簡単なフローチャートである。本開示の実施例に係る複合処理装置を示す構造図である。本開示の実施例に係るボードカードの構造を示す模式図である。

本開示の解決策では、多段パイプライン演算をサポートするハードウェアアーキテクチャが提供される。該ハードウェアアーキテクチャが計算装置において実現される場合、該計算装置は、少なくとも１組または複数組のパイプライン演算回路を含み、そのうち、各組の前記パイプライン演算回路は、本開示の１つの多段演算パイプラインを構成することができる。該多段演算パイプラインにおいて、複数の演算回路を段階的に設けることができる。一実施形態において、複数の演算命令を受信した場合、前述の多段演算パイプラインにおける各段演算回路は、前記複数の演算命令のうちの対応する１つの演算命令を実行するように配置できる。本開示のハードウェアアーキテクチャおよび演算命令により、並列パイプライン操作を効率的に実行し、計算の応用シーンを拡張し、かつ計算オーバーヘッドを低減することができる。

本開示の実施例における技術的解決策は、以下、本開示の実施例における添付図面を参照して、明確、完全に説明される。明らかに、説明される実施例は、本開示の全ての実施形態ではなく、一部の実施例である。本開示の実施例に基づいて、当業者が創造的な労力を払わない前提で得られたすべての他の実施例は、いずれも本開示の保護の範囲に属する。

図１は、本開示の一実施例に係る計算装置１００を示すブロック図である。図１に示すように、該計算装置１００は、図に示すような第１組のパイプライン演算回路１０２、第２組のパイプライン演算回路１０４および第３組のパイプライン演算回路１０６などの１組または複数組のパイプライン演算回路を含むことができる。そのうち、各組の前記パイプライン演算回路は、本開示の文脈における１つの多段演算パイプラインを構成することができる。第１の多段演算パイプラインを構成する第１組のパイプライン演算回路１０２を例として、それは、第１－１段パイプライン演算、第１－２段パイプライン演算、第１－３段パイプライン演算……第１－Ｎ段パイプライン演算を含む、合計Ｎ段のパイプライン演算を実行することができる。同様に、第２組および第３組のパイプライン演算回路は、Ｎ段パイプライン演算をサポートする構造を備える。このような例示的なアーキテクチャを通じて、当業者は、本開示の複数組のパイプライン演算回路が複数の多段演算パイプラインを構成できるとともに、前記複数の多段演算パイプラインが各々の複数の演算命令を並行に実行できることが理解されてもよい。

上記の各段パイプライン演算を実行するために、１つまたは複数の演算器を含む演算回路を各段に設けて、対応する演算命令を実行することによって、該段での演算操作を実現することができる。一実施例において、複数の演算命令の受信に応答して、本開示の１組または複数組のパイプライン演算回路は、例えば単一命令複数データ（「ＳＩＭＤ」）命令を実行するなどの複数のデータ演算を実行するように配置されることができる。一実施例において、前述の複数の演算命令は、計算装置１００により受信された計算命令を解析することによって取得することができ、該計算命令の操作コードは、前記多段演算パイプラインによって実行される複数の操作を表すことができる。別の一実施例では、多段演算パイプラインにおいて段階的に設けられた複数の演算回路によりサポートされる機能に基づいて、前記操作コードおよびそれにより代表される前記複数の操作を予め決定することができる。

本開示の解決策において、各組のパイプライン演算回路は、それにより構成された１つの多段演算パイプラインにおける段階的演算操作を実行することに加えて、複数の演算命令に基づいて選択的に接続されるように配置されることによって、対応する複数の演算命令を完了する。一実現シーンにおいて、本開示の前記複数の多段演算パイプラインは、第１の多段演算パイプラインおよび第２の多段演算パイプラインを含むことができ、前記第１の多段演算パイプラインの１つまたは複数段の演算回路の出力端は、前記演算命令に基づいて、前記第２の多段演算パイプラインの１つまたは複数段の演算回路の入力端に接続するように配置される。例えば、図に示される第１の多段演算パイプラインにおける第１－２段パイプライン演算は、演算命令に基づいて、第２の多段演算パイプラインにおける第２－３段のパイプライン演算に、その演算結果を入力することができる。同様に、図に示される第２の多段演算パイプラインにおける第２－１段パイプライン演算は、演算命令に基づいて、第３の多段演算パイプラインにおける第３－３段パイプライン演算に、その演算結果を入力することができる。いくつかのシーンにおいて、演算命令の不同によって、異なる演算パイプラインにおける２段のパイプライン演算は、例えば、示されている第２の多段演算パイプラインにおける第２－２段パイプライン演算と第３の多段演算パイプラインにおける第３－２段パイプライン演算との間の、双方向の演算結果を伝送することができる。

上記から分かるように、同一の演算パイプラインと異なる演算パイプラインとの間でデータを伝送するために、本開示の複数組の演算パイプラインにおける各段演算回路は、該演算回路で入力されるデータを受信する入力端と、該段の演算回路の操作結果を出力する出力端とを備えることができる。１つの多段演算パイプラインの内部において、１つまたは複数段の演算回路の出力端は、演算命令に基づいて他の１つまたは他の複数段の演算回路の入力端に接続するように配置されることによって、前記演算命令を実行する。例えば、第１の演算パイプラインの内部で、演算命令に基づいて第１－１段パイプライン演算の結果を該演算パイプラインの内部の第１－３段パイプライン演算に入力するすることができる。

本開示の文脈において、前述の複数の演算命令は、計算装置（または処理回路、プロセッサ）の内部で動作するマイクロ命令または制御信号であってもよく、それは、計算装置によって実行される必要がある１つまたは複数の演算操作を含む（または指示する）ことができる。異なる演算シーンに応じて、演算操作は、加算操作、乗算操作、畳み込み演算操作、プーリング操作など様々な操作を含むことができるが、これらに限定されない。多段パイプライン演算を実現するために、各段パイプライン演算を実行する各段演算回路には、乱数処理回路、加減算回路、減算回路、テーブルルックアップ回路、パラメータ配置回路、乗算器、プーラー、コンパレータ、絶対値取得回路、論理演算器、位置インデックス回路またはフィルターのうちの１つまたは複数の演算器または回路が含まれることができるが、これらに限定されない。ここではプーラーを例として、これは、ニューラルネットワークのプーリング操作を実行するために、例示的に加算器、除算器、コンパレータなどの演算装置によって構成できる。

多段のパイプライン演算を実現するために、本開示は、多段パイプライン演算の演算回路によりサポートされる演算に基づいて、対応する計算命令を提供することができる。演算シーンの不同によって、本開示の計算命令は、複数の操作コードを含むことができ、該操作コードは、演算回路によって実行される複数の操作を表すことができる。例えば、図１のＮ＝４（即ち、４段パイプライン演算を実行する場合）の際、本開示の解決策による計算命令は、以下の式（１）で表す。

Ｒｅｓｕｌｔ＝（（（（ｓｃｒ０ｏｐ０ｓｃｒ１）ｏｐ１ｓｒｃ２）ｏｐ２ｓｒｃ３）ｏｐ３ｓｒｃ４）（１）

ただし、ｓｃｒ０～ｓｃｒ４はソースオペランドであり、ｏｐ０～ｏｐ３は操作コードである。異なるパイプライン演算回路のアーキテクチャおよびサポートされる操作に基づいて、本開示の計算命令の操作コードのタイプ、順番および数は変更できる。

いくつかの応用シーンにおいて、本開示の多段パイプライン演算は単項演算（即ち、入力データの項目が１つしかない場合）をサポートすることができる。ニューラルネットワークにおけるｓｃａｌｅ層＋ｒｅｌｕ層での演算操作を例として、実行待ちの計算命令がｒｅｓｕｌｔ＝ｒｅｌｕ（ａ＊ｉｎａ＋ｂ)として表されると仮定する場合、ｉｎａは入力データ（例えば、ベクトルまたはマトリックスであってよい）であり、ａ、ｂはいずれも演算定数である。該計算命令について、本開示の乗算器、加算器、非線形演算器を含む１組の３段パイプライン演算回路を使用して、演算を実行することができる。具体的には、第１段パイプラインの乗算器を使用して、入力データｉｎａとａの積を計算することによって、第１段パイプライン演算結果を取得することができる。次に、第２段パイプラインの加算器を使用して、該第１段パイプライン演算結果である（ａ＊ｉｎａ）とｂに対して加算演算を実行し、第２段パイプライン演算結果を取得することができる。最後に、第３段パイプラインのｒｅｌｕ活性化関数を使用して、該第２段パイプライン演算結果（ａ＊ｉｎａ＋ｂ）の活性化操作を行うことによって、最終の演算結果ｒｅｓｌｕｔを取得することができる。

いくつかの応用シーンにおいて、本開示の多段パイプライン演算回路は、２項演算（例えば、畳み込み計算命令ｒｅｓｌｕｔ＝ｃｏｎｖ(ｉｎａ、ｉｎｂ））または３項演算（例えば、畳み込み計算命令ｒｅｓｌｕｔ＝ｃｏｎｖ（ｉｎａ、ｉｎｂ、ｂｉａｓ））をサポートすることができ、そのうち、入力データｉｎａ、ｉｎｂおよびｂｉａｓは、ベクトル（例えば、整数型、固定小数点型または浮動小数点型のデータであってよい）であってよく、マトリックスであってもよい。ここで、畳み込み計算命令ｒｅｓｌｕｔ＝ｃｏｎｖ（ｉｎａ、ｉｎｂ）を例として、３段パイプライン演算回路の構造に含まれる複数の乗算器、少なくとも１つの加算ツリーおよび少なくとも１つの非線形演算器を使用して、該計算命令により表される畳み込み演算を実行することができる。そのうち、２つの入力データｉｎａおよびｉｎｂは、ニューロンデータなどであってよい。具体的には、まず、３段パイプライン演算回路における第１段パイプライン乗算器を用いて計算を行い、それにより、第１段パイプライン演算結果ｐｒｏｄｕｃｔ＝ｉｎａ＊ｉｎｂ（乗算操作に対応する演算命令における１つのマイクロ命令として見なされる）を取得することができる。続いて、第２段パイプライン演算回路における加算ツリーを用いて、第１段パイプライン演算結果「ｐｒｏｄｕｃｔ」の加算操作を実行することによって、第２段パイプライン演算結果ｓｕｍを得ることができる。最後に、第３段パイプライン演算回路の非線形演算器を用いて「ｓｕｍ」の活性化操作を実行し、それにより、最終の畳み込み演算結果を得る。

いくつかの応用シーンにおいて、前記のように、本開示の解決策は、演算操作で使用されていない１段または多段パイプライン演算回路に対してバイパス操作することができ、即ち、演算操作のニーズに応じて、演算操作が全ての多段パイプライン操作を経る必要はなく、多段パイプライン演算回路の１段または多段を選択的に使用することができる。ユークリッド距離を計算する演算操作を例として、その計算命令をｄｉｓ＝ｓｕｍ（（ｉｎａ－ｉｎｂ）^２)で表すと仮定する場合、加算器、乗算器、加算ツリーおよびアキュムレータで構成された若干段のパイプライン演算回路のみを使用して演算することによって、最終の演算結果を取得することができ、未使用のパイプライン演算回路については、パイプライン演算操作の前または操作過程においてバイパスすることができる。

図２は、本開示の別の一実施例に係る計算装置２００を示すブロック図である。図により分かるように、計算装置２００は、計算装置１００と同じの２組のパイプライン演算回路１０２およびパイプライン演算回路１０４に加えて、さらに制御回路２０２およびデータ処理回路２０４を付加的に含む。一実施例において、制御回路２０２は、上記に記載された計算命令を取得して計算命令を解析するように配置されることによって、例えば、式（１）に表すような、前記操作コードで表される複数の操作に対応する、前記複数の演算命令を取得することができる。

一実施例において、データ処理ユニット２０４は、データ変換回路２０６とデータ接合回路２０８とを含むことができる。計算命令が、データ変換操作またはデータ接合操作などのパイプライン演算操作の前処理操作を含む場合、データ変換回路２０６またはデータ接合回路２０８は、対応する計算命令に基づいて対応する変換操作または接合操作を実行する。以下、変換操作と接合操作を例として説明する。

データ変換操作に関しては、データ変換回路に入力されるデータビット幅が比較的に高い場合（例えば、データビット幅が１０２４ビットのビット幅である場合）、データ変換回路は、演算要件に基づいて入力データを比較的に低いビットのビット幅のデータ（例えば、出力データのビット幅が５１２ビットのビット幅である）に変換する。異なる応用シーンに基づいて、データ変換回路は、様々なデータタイプ間での変換をサポートすることができ、例えば、ＦＰ１６（浮動小数点数１６ビット）、ＦＰ３２（浮動小数点数３２位）、ＦＩＸ８（固定小数点数８ビット）、ＦＩＸ４（固定小数点数４ビット）、ＦＩＸ１６（固定小数点数１６ビット）など異なるビットのビット幅を有するデータタイプ間で変換することができる。データ変換回路への入力データがマトリックスである場合、データ変換操作は、マトリックス素子の配列位置に対する転換であってよい。該転換は、例えば、マトリックス転置およびミラーリング（図３ａ乃至図３ｃを参照して後で説明する）、マトリックスが所定の角度（例えば、９０度、１８０度または２７０度）に従う回転およびマトリックス次元の変換を含むことができる。

データ接合操作について、データ接合回路は、命令などにおいて設定されたビット長に基づいて、データから抽出したデータブロックに対してパリティ接合などの操作を行うことができる。例えば、データビット長が３２ビットのビット幅である場合、データ接合回路は、４ビットのビット幅の長さに従って、データを１～８の合計８つのデータブロックに分割し、その後、データブロック１、３、５および７の合計４つのデータブロックを接合し、かつデータ２、４、６および８の合計４つのデータブロックを接合して、演算に用いられる。

他のいくつかの応用シーンにおいて、演算実行後に取得したデータＭ（例えば、ベクトルであってよい）に対して、上記のデータ接合操作を実行することができる。データ接合回路が、先に８ビットのビット幅を１つのユニットデータとして、データＭの偶数行の下位２５６ビットを分割することによって、３２個の偶数行のユニットデータ（それぞれは、Ｍ_２ｉ_０乃至Ｍ_２ｉ_３１と表す）を得ることができると仮定する。同様に、８ビットのビット幅を１つのユニットデータとして、データＭの奇数行の下位２５６ビットも分割することによって、３２個の奇数行のユニットデータ（それぞれは、Ｍ_(２ｉ＋１)_０乃至Ｍ_(２ｉ＋１)_３１と表す）を得ることができる。さらに、低いものから高いものへのデータビットの順に基づいて、先に偶数行、次に奇数行の順番に分割後の３２個の奇数行のユニットデータと３２個の偶数行のユニットデータが交互に配置される。具体的に、偶数行のユニットデータ０（Ｍ_２ｉ_０）を下位に設け、次に奇数行のユニットデータ０（Ｍ_(２ｉ＋１)_０）を順番に設ける。次に、偶数行のユニットデータ１（Ｍ_２ｉ_１）……を設ける。このように類推して、奇数行のユニットデータ３１（Ｍ_(２ｉ＋１)_３１）の設けが完了するとき、６４個のユニットデータが接合されて１つの５１２ビットのビット幅を持つ新しいデータを形成する。

異なる応用シーンに応じて、データ処理ユニットにおけるデータ変換回路とデータ接合回路とを組合わせて使用することによって、データの前処理または後処理をより柔軟に行うことができる。例えば、計算命令に含まれる異なる操作に基づいて、データ処理ユニットは、データ接合操作なしでデータ変換のみを実行するか、データ変換なしでデータ接合操作のみを実行するか、または、データ変換とデータ接合操作の両方を実行することができる。いくつかのシーンにおいて、前記計算命令にはパイプライン演算操作の前処理操作が含まれていない場合、データ処理ユニットは、前記データ変換回路およびデータ接合回路を無効にするように配置されることができる。他のいくつかのシーンにおいて、前記計算命令にはパイプライン演算操作の後処理操作が含まれている場合、データ処理ユニットは、前記データ変換回路およびデータ接合回路を有効にして中間結果データに対する後処理を実行するように配置され、それにより、最終の演算結果を得ることができる。

データの記憶操作を実現するために、計算装置２００は、さらに記憶回路２１０を含む。一実現シーンにおいて、本開示の記憶回路は、主記憶モジュールおよび／または主キャッシュモジュールを含むことができ、そのうち、前記主記憶モジュールは、多段パイプライン演算を実行するデータと、演算を実行した後の演算結果を記憶するように配置されており、前記主キャッシュモジュールは、前記多段パイプライン演算で演算を実行した後の、中間演算結果をキャッシュするように配置される。さらに、記憶回路は、オフチップ記憶媒体とデータを伝送するインターフェースをさらに備えており、それにより、オンチップシステムとオフチップシステムとの間のデータ転送を実現することができる。

図３ａ、３ｂおよび３ｃは、本開示の実施例に係るデータ変換回路によって実行されるマトリックス変換を示す模式図である。データ変換回路２０６によって実行される変換操作をよりよく理解するために、以下、例として、元のマトリックスによって行われる転置操作と水平ミラーリング操作をさらに説明する。

図３ａに示すように、元のマトリックスは、（Ｍ＋１）行×（Ｎ＋１）列のマトリックスである。応用シーンのニーズに応じて、データ変換回路は、図３aに示される元のマトリックスに対して転置操作の変換を行うことによって、図３ｂに示すようなマトリックスを得ることができる。具体的には、データ変換回路は、元のマトリックスの素子の行番号と列番号の交換操作を行うことによって、転置マトリックスを形成することができる。具体的には、図３aに示される元のマトリックスの座標が第１行第０列である素子「１０」の、図３ｂで示される転置マトリックスにおける座標は、第０行第１列である。このように類推すると、図３aに示される元のマトリックスの座標が第Ｍ＋１行第０列である素子「Ｍ０」の、図３ｂで示される転置マトリックスにおける座標は、第０行第Ｍ＋１列である。

図３ｃに示すように、データ変換回路は、図３aに示される元のマトリックスに対して水平ミラーリング操作を行うことによって、水平ミラーマトリックスを形成することができる。具体的には、前記データ変換回路は、水平ミラーリング操作により、元のマトリックスの最初の行要素から最後の行要素への配列順番を、最後の行要素から最初の行要素への配列順番に変換し、元のマトリックスの要素の列番号は変更しない。具体的には、図３aに示される元のマトリックスの座標がそれぞれ第０行第０列である要素「００」と、第１行第０列である要素「１０」の、図３ｃに示される水平ミラーマトリックスにおける座標は、それぞれ第Ｍ＋１行第０列と第Ｍ行第０列である。このように類推すると、図３ａに示される元のマトリックスにおける座標が第Ｍ＋１行第０列である要素「Ｍ０」の、図３ｃに示される水平ミラーマトリックスにおける座標は、第０行第０列である。

上記の図３のハードウェアアーキテクチャに基づいて、本開示の計算装置は、前述の予備処理および後処理を含む計算命令を実行することができる。以下、本開示の解決策に基づく計算命令の２つの例示的な例を提供する。

例１：ＭＵＡＤ＝（ＦＰＭＵＬＴ）＋（ＦＰＡＤＤ／ＦＰＳＵＢ）＋（ＲＥＬＵ）＋（ＣＯＮＶＥＲＴＦＰ２ＦＩＸ（２）

上記式（２）に表された１つの計算命令は、三項オペランドを入力して、単項オペランドを出力する計算命令であり、それは、本開示の３段パイプライン演算（即ち、乗算＋加／減算＋活性化演算）を含む１組のパイプライン演算回路により実現されるマイクロ命令を含む。具体的には、三項操作はＡ＊Ｂ＋Ｃであり、そのうち、ＦＰＭＵＬＴのマイクロ命令は、オペランドＡとＢ間の浮動小数点数の乗算操作を完了することによって積値を取得することであり、即ち、第１段パイプライン演算である。次に、ＦＰＡＤＤまたはＦＰＳＵＢのマイクロ命令を実行して前述積値とＣの浮動小数点数の加算または減算操作を完了することによって和または差の結果を取得することであり、即ち、第２段パイプライン演算である。その後、前段の結果に対して活性化操作ＲＥＬＵを実行することができることであり、即ち、第３段パイプライン演算である。該３段パイプライン演算の後、最後に、上記のタイプ変換回路を介してマイクロ命令ＣＯＮＶＥＲＴＦＰ２ＦＩＸを実行し、それにより、活性化操作後の結果データのタイプを、浮動小数点数から固定小数点数に変換して、最終の結果として出力したり、または中間結果として固定小数点演算器に入力して、さらなる計算操作を行うことができる。

例２：ＳＥＣＭＵＡＤＣ＝ＳＥＡＲＣＨ＋ＭＵＬＴ＋ＡＤＤ（３）

上式（３）に表された１つの計算命令は、三項オペランドを入力し、単項オペランドを出力する計算命令であり、それは、本開示の３段パイプライン演算（即ち、テーブルルックアップ＋乗算＋加算）を含む１組のパイプライン演算回路により実現されるマイクロ命令を含む。具体的には、三項操作はＳＴ（Ａ）＊Ｂ＋Ｃであり、そのうち、ＳＥＡＲＣＨのマイクロ命令は、第１段パイプライン演算におけるテーブルルックアップ回路によって完了されることによって、テーブルルックアップ結果Ａを得ることができる。次に、第２段パイプライン演算によってオペランドＡとＢ間の乗算操作を完了することによって、積値を取得する。その後、ＡＤＤのマイクロ命令を実行して前述積値とＣの加算操作を完了することによって、和の結果を取得することであり、即ち、第３段パイプライン演算である。

上記のように、本開示の計算命令は、計算の要件に基づいて柔軟に設計および決定することができ、それにより、本開示の複数の演算パイプラインを含むハードウェアアーキテクチャは、計算命令およびそれに含まれる様々なマイクロ命令（またはマイクロ操作）によって設計および接続され、それにより、１つの計算命令で様々な計算操作を完了することができ、よって、命令の実行効率を向上させ、計算オーバーヘッドを低減することができる。

図４は、本開示の実施例に係る計算システム４００を示すブロック図である。図により分かるように、該計算システムは、計算装置２００に加えて、複数のスレーブ処理回路４０２、および計算装置２００と複数のスレーブ処理回路４０２とを接続する相互接続ユニット４０４をさらに含む。

１つの演算シーンにおいて、本開示のスレーブ処理回路は、計算命令（例えば、１つまたは複数のマイクロ命令または制御信号として実現される）に基づいて、計算装置で前処理操作を実行するためのデータを演算することによって、期待の演算結果を取得する。他の１つの演算シーンにおいて、スレーブ処理回路は、その演算後に取得した中間結果（例えば、相互接続ユニットを経由して）を計算装置のデータ処理ユニットに送信することによって、データ処理ユニットのデータ変換回路によって、中間結果に対してデータタイプ変換を実行するか、またはデータ処理ユニットのデータ接合回路によって、中間結果に対してデータの分割および接合操作を実行し、それにより、最終の演算結果を取得する。

図５は、本開示の実施例に係る計算装置を使用して演算操作を実行する方法５００を示す簡単なフローチャートである。前述の説明に基づいて、ここでの計算装置は、図１乃至図４を参照して説明した計算装置であってもよく、それは示されている内部接続関係を備え、かつ様々な付加操作をサポートすることが理解できる。

図５示されるように、ステップ５０２において、方法５００は、前記１組または複数組のパイプライン演算回路における各組を、多段パイプライン演算を実行するように配置し、そのうち、各組の前記パイプライン演算回路は、１つの多段演算パイプラインを構成し、かつ該多段演算パイプラインには、段階的に設けられた複数の演算回路が含まれる。次に、ステップ５０４において、方法５００は、複数の演算命令の受信に応答して、前記多段演算パイプラインにおける各段演算回路を、前記複数の演算命令のうちの対応する１つの演算命令を実行するように配置し、そのうち、前記複数の演算命令は、前記計算装置によって受信された計算命令を解析することにより得られる。

以上、簡略化するために、図５のみを参照して本開示の計算方法を説明する。当業者は、本開示の開示内容に基づいて、本方法がより多くのステップを含むことができ、これらのステップの実行は、図１乃至図４を参照して上記で説明された本開示の様々な操作を実現できることが想到できるため、ここでは繰り返さない。

図６は、本開示の実施例に係る複合処理装置６００を示す構造図である。図６に示すように、該複合処理装置６００は、計算処理装置６０２、インターフェース装置６０４、他の処理装置６０６および記憶装置６０８を含む。異なる応用シーンによって、計算処理装置には、１つまたは複数の計算装置６１０が含まれてもよく、該計算装置は、図１乃至５を参照して本明細書で説明された操作を実行するように配置されることができる。

異なる実施例において、本開示の計算処理装置は、ユーザによって指定された操作を実行するように配置されることができる。例示的な応用において、該計算処理装置は、シングルコア人工知能プロセッサまたはマルチコア人工知能プロセッサとして実現できる。同様に、計算処理装置の内部に含まれる１つまたは複数の計算装置は、人工智能プロセッサコアまたは人工智能プロセッサコアの一部のハードウェア構造として実現できる。複数の計算装置が人工智能プロセッサコアまたは人工智能プロセッサコアの一部のハードウェア構造として実現される場合、本開示の計算処理装置について、シングルコア構造またはホモジニアスマルチコア構造を有するものとみなされることができる。

例示的な操作において、本開示の計算処理装置は、インターフェース装置を介して、他の処理装置とインタラクションして、ユーザによって指定された操作を共同で完了することができる。実現方法の不同によって、本開示の他の処理装置は、中央処理装置（ＣｅｎｔｒａｌＰｒｏｃｅｓｓiｎｇＵｎiｔ、ＣＰＵ）、グラフィックスプロセッサ（ＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｎｉｔ、ＧＰＵ）、人工知能処理装置などの汎用処理装置および／または専用処理装置のうちの１つまたは様々なタイプの処理装置を含むことができる。これらの処理装置は、デジタル信号プロセッサ（ＤｉｇｉｔａｌＳｉｇｎａｌＰｒｏｃｅｓｓｏｒ、ＤＳＰ）、特定用途向け集積回路（ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ、ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（Ｆｉｅｌｄ－ＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ、ＦＰＧＡ）または他のプログラムブル論理デバイス、ディスクリートゲートまたはトランジスタ論理デバイス、ディスクリートハードウェアコンポーネンなどを含むことができるが、これらに限定されず、また、その数は、実際のニーズに応じて決定することができる。上記のように、本開示の計算処理装置についてのみ、シングルコア構造またはホモジニアスマルチコア構造を備えるものとみなされることができる。しかし、計算処理装置と他の処理装置を共通に考慮すると、両者はヘテロジニアスマルチコア構造を形成するものとみなすことができる。

１つまたは複数の実施例において、該他の処理装置は、本開示の計算処理装置（これは、ニューラルネットワーク演算などの人工知能に関連する演算装置として具体化することができる）の外部データおよび制御とのインターフェースとして、データの転送、計算装置のオンおよび／またはオフなどを含むがこれらに限定されない基本的な制御を実行することができる。別の実施例において、他の処理装置は、該計算処理装置と協力して共同に演算タスクを完了することもできる。

１つまたは複数の実施例において、該インターフェース装置は、計算処理装置と他の処理装置との間で、データおよび制御命令を伝送することができる。例えば、該計算処理装置は、前記インターフェース装置を経由して、他の処理装置から入力データを取得し、該計算処理装置のオンチップの記憶装置（またはメモリと称す）に書き込むことができる。さらに、該計算処理装置は、前記インターフェース装置を経由して、他の処理装置から制御命令を取得し、計算処理装置のオンチップの制御キャッシュに書き込むことができる。代替的にまたは選択的に、インターフェース装置は、計算処理装置の記憶装置におけるデータを読み取り、他の処理装置に伝送することもできる。

付加的または選択的に、本開示の複合処理装置は、記憶装置をさらに含むことができる。図に示すように、該記憶装置は、それぞれ、前記計算処理装置および前記他の処理装置に接続される。１つまたは複数の実施例において、記憶装置は、前記計算処理装置および／または前記他の処理装置のデータを保存することができる。例えば、該データは、計算処理装置または他の処理装置の内部またはオンチップの記憶装置に全て保存できないデータであってよい。

いくつかの実施例において、本開示では、チップ（例えば、図７に示されているチップ７０２）がさらに開示される。一実施形態において、該チップは、システムオンチップ（ＳｙｓｔｅｍｏｎＣｈｉｐ、ＳｏＣ）であり、１つまたは複数の、図６に示すような複合処理装置が集積化されている。該チップは、外部インターフェース装置（図７に示されている外部インターフェース装置７０６）を介して、他の関連部品に接続されることができる。該関連部品は、例えば、ウェブカメラ、ディスプレー、マウス、キーボード、ネットワークカードまたはｗｉｆｉインターフェースであってよい。いくつかの応用シーンにおいて、該チップには、他の処理ユニット（例えば、ビデオコーデック）および／またはインターフェースモジュール（例えば、ＤＲＡＭインターフェース）などが集積化されていてもよい。いくつかの実施例において、本開示は、上記チップを含むチップパッケージ構造をさらに開示する。いくつかの実施例において、本開示は、上記のチップパッケージ構造を含むボードカードをさらに開示する。以下、図７を参照して、該ボードカードを詳細に説明する。

図７は、本開示の実施例に係るボードカード７００の構造を示す模式図である。図７に示すように、該ボードカードは、データを記憶するための記憶素子７０４を含み、記憶素子７０４は、１つまたは複数の記憶ユニット７１０を含む。該記憶素子は、バスなどの方式にて、制御素子７０８および上記に記載のチップ７０２と接続およびデータの伝送を行うことができる。さらに、該ボードカードは、チップ（または、チップパッケージ構造におけるチップ）と外部装置７１２（例えば、サーバーまたはコンピューターなど）との間のデータ中継またはスイッチング機能をするように配置された外部インターフェース装置７０６をさらに含む。例えば、処理待ちのデータは、外部装置によって、外部インターフェース装置を介してチップに伝達されることができる。また、例えば、前記チップの計算結果は、前記外部インターフェース装置を経由して外部装置に送り返すことができる。異なる応用シーンによって、前記外部インターフェース装置は、例えば、標準ＰＣIＥインターフェースなどを使用した、異なるインターフェース形態を備えることができる。

１つまたは複数の実施例において、本開示のボードカードにおける制御素子は、前記チップの状態を調整制御するように配置されることができる。このために、一応用シーンにおいて、該制御素子は、前記チップの作業状態を調整制御するように、マイクロコントローラーユニット（ＭｉｃｒｏＣｏｎｔｒｏｌｌｅｒＵｎｉｔ、ＭＣＵ）を含むことができる。

図６および図７を参照した上記の説明に基づいて、当業者は、本開示が、１つまたは複数の上記ボードカード、１つまたは複数の上記チップおよび／または１つまたは複数の上記複合処理装置を含む、電子デバイスまたは装置も開示していることが理解できる。

異なる応用シーンによって、本開示の電子デバイスまたは装置は、サーバー、クラウドサーバー、サーバークラスター、データ処理装置、ロボット、コンピューター、プリンター、スキャナー、タブレット、スマート端末、ＰＣデバイス、IｏＴ端末、モバイル端末、携帯電話、ドライビングレコーダー、ナビゲーター、センサー、ウェブカメラ、カメラ、ビデオカメラ、プロジェクター、時計、ヘッドセット、モバイルストレージ、ウェアラブルデバイス、ビジュアル端末、自動運転端末、交通手段、家電製品、および／または医療機器を含むことができいる。前記交通手段には、飛行機、船および／または車両が含まれる。前記家電製品には、テレビ、エアコン、電子レンジ、冷蔵庫、炊飯器、加湿器、洗濯機、電灯、ガスストーブ、レンジフードが含まれる。前記医療機器には、核磁気共鳴計、超音波計および／または心電計が含まれる。本開示の電子デバイスまたは装置は、インターネット、IｏＴ、データセンター、エネルギー、交通、公共管理、製造、教育、送電網、電気通信、金融、小売、建設現場、医療などの分野にも応用できる。さらに、本開示の電子デバイスまたは装置は、クラウド、エッジ、端末などの人工知能、ビッグデータおよび／またはクラウドコンピューティングに関連する応用シーンに使用されることができる。１つまたは複数の実施例において、本開示の解決策に基づく高い計算能力の電子デバイスまたは装置は、クラウドデバイス（例えば、クラウドサーバー）に応用することができ、低電力消費の電子デバイスまたは装置は、端末デバイスおよび／またはエッジデバイス（例えば、スマートフォンまたはウェブカメラ）に応用されることができる。１つまたは複数の実施例において、クラウドデバイスのハードウェア情報と端末デバイスおよび／またはエッジデバイスのハードウェア情報は互いに互換性があり、それにより、端末デバイスおよび／またはエッジデバイスのハードウェア情報に基づいて、クラウドデバイスのハードウェア資源から適切なハードウェア資源をマッチングして、端末デバイスおよび／またはエッジデバイスのハードウェア資源をシミュレートし、端末とクラウドとを一体化しまたはクラウドとエッジと端末とを一体化する統一管理、スケジューリングと協同作業を完了することができる。

なお、簡略化するために、本開示は、いくつかの方法およびその実施例を一連の動作およびその組み合わせとして表現するが、当業者は、本開示の解決策が説明されている動作の順番によって限定されないことが理解できることに留意されたい。したがって、本開示の開示または教示に基づいて、当業者は、その中のいくつかのステップが他の順番で実行されるか、または同時に実行され得ることが理解できる。さらに、当業者は、本開示に説明されている実施例は任意の実施例とみなすことができること、即ち、その中で及んでいる動作またはモジュールが、必ずしも本開示の１つまたはいくつかの解決策の実現に必要なものではないことが理解できる。また、異なる解決策に基づいて、本開示におけるいくつかの実施例の説明は、それ自体の焦点も有する。これを鑑みて、当業者は、本開示の特定の実施例において詳細に説明されていない部分が、他の実施例の関連する説明も参照できることが理解できる。

具体的な実施において、本開示の開示および教示に基づいて、当業者は、本開示に開示されているいくつかの実施例は、本明細書に開示されていない他の方法で実施されることが理解できる。例えば、上記に記載の電子デバイスまたは装置の実施例における各ユニットについては、本明細書では論理機能を考慮した上で区分しているが、実際に実現する場合、別の区分方式があり得る。また、例えば、複数のユニットまたはコンポーネントを別の１つのシステムに組合せまたは集積化したり、またはユニットまたはコンポーネントにおける一部の特征または機能を、選択的に無効にしたりすることができる。異なるユニットまたはコンポーネントの間の接続関係については、添付図面を参照して前述した接続は、ユニットまたはコンポーネントの間の直接的または間接的な結合であってよい。いくつかのシーンにおいて、前述の直接的または間接的な結合は、インタフェースを用いた通信接続に関して、その中の通信インタフェースは電気的、光学的、音響学的、磁気的または他の形態の信号伝送をサポートすることができる。

本開示において、分離部品として説明されたユニットは、物理的に分離されているものであってもよいし、物理的に分離されているものでなくてもよい。ユニットとして示される部品は、物理的ユニットであってもよいし、物理的ユニットでなくてもよい。上記部品またはユニットは、同じ位置に位置することができ、複数のネットワークユニットに分散されることもできる。また、実際のニーズに応じて、その一部または全てのユニットを選択して、本開示の実施例に記載の解決策の目的を実現することができる。また、いくつかのシーンにおいて、本開示の実施例における複数のユニットが１つのユニットに集積化するか、または各ユニットが物理的に個別に存在することができる。

いくつかの実現シーンにおいて、上記集積化されたユニットは、ソフトウェアプログラムモジュールの形態として実現されることができる。ソフトウェアプログラムモジュールの形態で実現され、かつ独立した製品として販売または使用される場合、前記集積化されたユニットは、コンピューターの読み取り可能なメモリに格納されることができる。これに基づいて、本開示の解決策がソフトウェア製品（例えば、コンピューターの読み可能な記憶媒体）の形態で具体化される場合、該ソフトウェア製品は、メモリに記憶されることができ、これは、コンピューター装置（例えば、パーソナルコンピューター、サーバーまたはネットワーク装置など）に本開示の実施例に記載されている方法の一部または全てのステップを実行させるためのいくつかの命令を含むことができる。前述のメモリは、Ｕディスク、フラッシュメモリ、読み取り専用メモリ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ、ＲＯＭ）、ランダムアクセスメモリ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ、ＲＡＭ）、モバイルハードディスク、磁気ディスクまたは光ディスクなどの、プログラムコードが記憶できる様々な媒体を含むが、これらに限定されない。

別のいくつかの実現シーンにおいて、上記集積化されたユニットは、ハードウェアの形態で実現されることができ、即ち、デジタル回路および／またはアナログ回路などを含むことができる具体的なハードウェア回路である。回路のハードウェア構造の物理的実現は、物理的素子を含んでよいが、これらに限定されず、物理的素子は、トランジスタまたはメモリスターなどの素子を含んでもよいが、これらに限定されない。これを鑑みて、本明細書に記載されている様々な装置（例えば、計算装置または他の処理装置）は、例えば、ＣＰＵ、ＧＰＵ、ＦＰＧＡ、ＤＳＰおよびＡＳＩＣなどの適切なハードウェアプロセッサを介して実現されることができる。さらに、前述の前記記憶ユニットまたは記憶装置は、任意の適切な記憶媒体（磁気記憶媒体または光磁気記憶媒体などを含む）であってもよく、これは、例えば、抵抗変化型メモリ（ＲｅｓｉｓｔｉｖｅＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ、ＲＲＡＭ）、ダイナミックランダムアクセスメモリ（ＤｙｎａｍｉｃＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ、ＤＲＡＭ）、スタティックランダムアクセスメモリ（ＳｔａｔｉｃＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ、ＳＲＡＭ）、強化されたダイナミックランダムアクセスメモリ（ＥｎｈａｎｃｅｄＤｙｎａｍｉｃＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ、ＥＤＲＡＭ）、高帯域メモリ（ＨｉｇｈＢａｎｄｗｉｄｔｈＭｅｍｏｒｙ、ＨＢＭ）、ハイブリッドメモリキューブ（ＨｙｂｒｉｄＭｅｍｏｒｙＣｕｂｅ、ＨＭＣ）、ＲＯＭおよびＲＡＭなどであってよい。

上記の内容は、以下の条項によってよりよく理解できる。

条項１、計算装置は、
多段パイプライン演算を実行するように配置された１組または複数組のパイプライン演算回路を含み、各組の前記パイプライン演算回路は、１つの多段演算パイプラインを構成し、前記多段演算パイプラインには、段階的に設けられた複数の演算回路が含まれており、
複数の演算命令の受信に応答して、前記多段演算パイプラインにおける各段演算回路は、前記複数の演算命令のうちの対応する１つの演算命令を実行するように配置されており、
前記複数の演算命令は、前記計算装置によって受信された計算命令を解析することにより得られる。

条項２、条項１に記載の計算装置によれば、前記計算命令の操作コードは、前記多段演算パイプラインにより実行された複数の操作を表し、前記計算装置は、前記計算命令を取得、解析して、前記複数の操作に対応する前記複数の演算命令を取得するように配置される制御回路をさらに含む

条項３、条項２に記載の計算装置によれば、多段演算パイプラインにおいて段階的に設けられた複数の演算回路によりサポートされる機能に基づいて、前記操作コードおよび前記操作コードによって代表される前記複数の操作を予め決定する。

条項４、条項１に記載の計算装置によれば、前記多段演算パイプラインにおける各段演算回路は、前記複数の演算命令に基づいて選択的に接続されるように配置されることによって、前記複数の演算命令を実行する。

条項５、条項１に記載の計算装置によれば、前記複数組のパイプライン演算回路は、複数の多段演算パイプラインを構成するとともに、前記複数の多段演算パイプラインは、各々の複数の演算命令を並行に実行する。

条項６、条項１または５に記載の計算装置によれば、前記多段演算パイプラインにおける各段の演算回路は、該段の演算回路で入力されるデータを受信する入力端と、該段の演算回路の操作結果を出力する出力端とを備える。

条項７、条項６に記載の計算装置によれば、１つの多段演算パイプラインの内部において、１つまたは複数段の演算回路の出力端は、演算命令に基づいて他の１つまたは他の複数段の演算回路の入力端に接続する配置されることによって、前記演算命令を実行する。

条項８、条項６に記載の計算装置によれば、前記複数の多段演算パイプラインは、第１の多段演算パイプラインおよび第２の多段演算パイプラインを含んでおり、前記第１の多段演算パイプラインの１つまたは複数段の演算回路の出力端は、前記演算命令に基づいて、前記第２の多段演算パイプラインの１つまたは複数段の演算回路の入力端に接続するように配置される。

条項９、条項１に記載の計算装置によれば、各段の演算回路は、乱数処理回路、加減算回路、減算回路、テーブルルックアップ回路、パラメータ配置回路、乗算器、プーラー、コンパレータ、絶対値取得回路、論理演算器、位置インデックス回路またはフィルターのうちの１つまたは複数の演算器または回路を含む。

条項１０、条項１に記載の計算装置によれば、データタイプ変換操作を実行するタイプ変換回路および/またはデータ接合操作を実行するデータ接合回路を含む、データ処理回路をさらに含む。

条項１１、条項１０に記載の計算装置によれば、前記タイプ変換回路は、様々な異なるデータタイプ間で計算データを変換する１つまたは複数の変換器を含む。

条項１２、条項１０に記載の計算装置によれば、前記データ接合回路は、計算データを所定のビット長で分割し、分割後に取得された複数のデータブロックを所定の順番に従って接合するように配置される。

条項１３、条項１乃至１２のいずれか１項に記載の計算装置を含む集積回路チップである。

条項１４、条項１３に記載の集積回路チップを含むボードカードである。

条項１５、条項１３に記載の集積回路チップを含む電子デバイスである。

条項１６、計算装置を使用して計算操作を実行する方法であって、
前記計算装置は、１組または複数組のパイプライン演算回路を含み、
前記方法は、
前記１組または複数組のパイプライン演算回路における各組を、多段パイプライン演算を実行するように配置しており、各組の前記パイプライン演算回路は、１つの多段演算パイプラインを構成し、該多段演算パイプラインには、段階的に設けられた複数の演算回路が含まれていること、および
複数の演算命令の受信に応答して、前記多段演算パイプラインにおける各段演算回路を、前記複数の演算命令のうちの対応する１つの演算命令を実行するように配置することを含んでおり、
前記複数の演算命令は、前記計算装置によって受信された計算命令を解析することにより得られる。

条項１７、条項１６に記載の方法によれば、前記計算命令の操作コードは、前記多段演算パイプラインによって実行された複数の操作を表し、前記計算装置は制御回路をさらに含み、前記方法は、該制御回路を、前記計算命令を取得、解析して、前記複数の操作に対応する前記複数の演算命令を取得するように配置することを含む。

条項１８、条項１７に記載の方法によれば、多段演算パイプラインにおいて段階的に設けられた複数の演算回路によりサポートされる機能に基づいて、前記操作コードおよび前記操作コードによって代表される前記複数の操作を予め決定する。

条項１９、条項１６に記載の方法によれば、前記多段演算パイプラインにおける各段の演算回路を、前記複数の演算命令に基づいて選択的に接続されるように配置することによって、前記複数の演算命令を実行する。

条項２０、条項１６に記載の方法によれば、前記複数組のパイプライン演算回路は、複数の多段演算パイプラインを構成するとともに、前記複数の多段演算パイプラインは、各々の複数の演算命令を並行に実行する。

条項２１、条項１６または２０に記載の方法によれば、前記多段演算パイプラインにおける各段演算回路は、該段の演算回路で入力されるデータを受信する入力端と、該段の演算回路の操作結果を出力する出力端とを備える。

条項２２、条項２１に記載の方法によれば、１つの多段演算パイプラインの内部において、１つまたは複数段の演算回路の出力端を、演算命令に基づいて他の１つまたは他の複数段の演算回路の入力端に接続するように配置することによって、前記演算命令を実行する。

条項２３、条項２１に記載の方法によれば、前記複数の多段演算パイプラインは、第１の多段演算パイプラインおよび第２の多段演算パイプラインを含んでおり、前記方法は、前記第１の多段演算パイプラインの１つまたは複数段の演算回路の出力端を、前記演算命令に基づいて、前記第２の多段演算パイプラインの１つの段または複数の段の演算回路の入力端に接続するように配置する。

条項２４、条項１６に記載の方法によれば、各段の演算回路は、乱数処理回路、加減算回路、減算回路、テーブルルックアップ回路、パラメータ配置回路、乗算器、プーラー、コンパレータ、絶対値取得回路、論理演算器、位置インデックス回路またはフィルターのうちの１つまたは複数の演算器または回路を含む。

条項２５、条項１６に記載の方法によれば、データタイプ変換操作を実行するタイプ変換回路および/またはデータ接合操作を実行するデータ接合回路を含む、データ処理回路をさらに含む。

条項２６、条項２５に記載の方法によれば、前記タイプ変換回路は、様々な異なるデータタイプ間で計算データを変換する１つまたは複数の変換器を含む。

条項２７、条項２５に記載の方法によれば、前記データ接合回路は、計算データを所定のビット長で分割し、分割後に取得された複数のデータブロックを所定の順番に従って接合するように配置される。

本開示の複数の実施例を本明細書において示し、説明しているが、このような実施例は例示的な形態としてのみ提供されることが、当業者にとって明らかである。当業者は、本開示の思想および精神から逸脱することなく、多くの改正、変更および代替の方法を想到できる。本開示を実施する過程において、本明細書に説明された本開示の実施例に対する様々な代替案を採用することができることを理解すべきである。添付の特許請求の範囲は、本開示の保護範囲を限定することを意図しており、したがって、これらの特許請求の範囲内の同等物または代替案をカバーする。

Claims

多段パイプライン演算を実行するように配置された１組または複数組のパイプライン演算回路を含み、各組の前記パイプライン演算回路は、１つの多段演算パイプラインを構成し、前記多段演算パイプラインには、段階的に設けられた複数の演算回路が含まれており、
複数の演算命令の受信に応答して、前記多段演算パイプラインにおける各段演算回路は、前記複数の演算命令のうちの対応する１つの演算命令を実行するように配置されており、
前記複数の演算命令は、計算装置によって受信された計算命令を解析することにより得られ、
前記多段演算パイプラインにおける各段演算回路は、前記複数の演算命令に基づいて選択的に接続されるように配置されることによって、前記複数の演算命令を実行し、
前記選択的に接続されることには、１つの多段演算パイプラインの内部において、１つまたは複数段の演算回路の演算結果が、他の１つまたは他の複数段の演算回路に入力されること、及び、一つの多段演算パイプラインの１つまたは複数段の演算回路の演算結果が、他の多段演算パイプラインの１つまたは複数段の演算回路に入力されることが含まれる、ことを特徴とする計算装置。
前記計算命令のコードは、前記多段演算パイプラインにより実行される複数の演算を表し、前記計算装置は、前記計算命令を取得、解析して、前記複数の演算に対応する前記複数の演算命令を取得するように配置される制御回路をさらに含む
請求項１に記載の計算装置。
多段演算パイプラインにおいて段階的に設けられた複数の演算回路によりサポートされる機能に基づいて、前記コードおよび前記コードによって代表される前記複数の演算を予め決定する
請求項２に記載の計算装置。
前記複数組のパイプライン演算回路は、複数の多段演算パイプラインを構成するとともに、前記複数の多段演算パイプラインは、各々の複数の演算命令を並行に実行する
請求項１に記載の計算装置。
前記多段演算パイプラインにおける各段の演算回路は、該段の演算回路で入力されるデータを受信する入力端と、該段の演算回路の操作結果を出力する出力端とを備える
請求項１または４に記載の計算装置。
各段の演算回路は、乗算器、加算器、および、非線形演算器のうちの１つまたは複数を含む
請求項１に記載の計算装置。
請求項１乃至６のいずれか１項に記載の計算装置を含む
集積回路チップ。
計算装置を使用して計算操作を実行する方法であって、
前記計算装置は、１組または複数組のパイプライン演算回路を含み、
前記方法は、
前記１組または複数組のパイプライン演算回路における各組を、多段パイプライン演算を実行するように配置しており、各組の前記パイプライン演算回路は、１つの多段演算パイプラインを構成し、該多段演算パイプラインには、段階的に設けられた複数の演算回路が含まれていること、および
複数の演算命令の受信に応答して、前記多段演算パイプラインにおける各段演算回路を、前記複数の演算命令のうちの対応する１つの演算命令を実行するように配置することを含んでおり、
前記複数の演算命令は、前記計算装置によって受信された計算命令を解析することにより得られ、
前記多段演算パイプラインにおける各段の演算回路を、前記複数の演算命令に基づいて選択的に接続されるように配置することによって、前記複数の演算命令を実行し、
前記選択的に接続されることには、１つの多段演算パイプラインの内部において、１つまたは複数段の演算回路の演算結果が、他の１つまたは他の複数段の演算回路に入力されること、及び、一つの多段演算パイプラインの１つまたは複数段の演算回路の演算結果が、他の多段演算パイプラインの１つまたは複数段の演算回路に入力されることが含まれる、ことを特徴とする方法。
前記計算命令のコードは、前記多段演算パイプラインによって実行される複数の演算を表し、前記計算装置は制御回路をさらに含み、前記方法は、該制御回路を、前記計算命令を取得、解析して、前記複数の演算に対応する前記複数の演算命令を取得するように配置することを含む
請求項８に記載の方法。
多段演算パイプラインにおいて段階的に設けられた複数の演算回路によりサポートされる機能に基づいて、前記コードおよび前記コードによって代表される前記複数の演算を予め決定する
請求項９に記載の方法。
前記複数組のパイプライン演算回路は、複数の多段演算パイプラインを構成するとともに、前記複数の多段演算パイプラインは、各々の複数の演算命令を並行に実行する
請求項８に記載の方法。
前記多段演算パイプラインにおける各段演算回路は、該段の演算回路で入力されるデータを受信する入力端と、該段の演算回路の演算結果を出力する出力端とを備える
請求項８または１１に記載の方法。
各段の演算回路は、乗算器、加算器、および、非線形演算器のうちの１つまたは複数を含む
請求項８に記載の方法。