JP7132043B2 - リコンフィギュラブルプロセッサ - Google Patents
リコンフィギュラブルプロセッサ Download PDFInfo
- Publication number
- JP7132043B2 JP7132043B2 JP2018168697A JP2018168697A JP7132043B2 JP 7132043 B2 JP7132043 B2 JP 7132043B2 JP 2018168697 A JP2018168697 A JP 2018168697A JP 2018168697 A JP2018168697 A JP 2018168697A JP 7132043 B2 JP7132043 B2 JP 7132043B2
- Authority
- JP
- Japan
- Prior art keywords
- circuit
- matrix
- processing
- elements
- memory
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/76—Architectures of general purpose stored program computers
- G06F15/78—Architectures of general purpose stored program computers comprising a single central processing unit
- G06F15/7867—Architectures of general purpose stored program computers comprising a single central processing unit with reconfigurable architecture
- G06F15/7871—Reconfiguration support, e.g. configuration loading, configuration switching, or hardware OS
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Computer Hardware Design (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Microcomputers (AREA)
- Logic Circuits (AREA)
- Complex Calculations (AREA)
Description
本実施形態に係るリコンフィギュラブルプロセッサのハードウェア構成について説明する。図1は、リコンフィギュラブルプロセッサのハードウェア構成を示すブロック図である。図2は、リコンフィギュラブル回路のハードウェア構成を示すブロック図である。
上述したハードウェア構成によるリコンフィギュラブルプロセッサは行列の乗算を行うものである。行列の乗算においては、後述するようにメモリアクセスがボトルネックとなる。ここで、行列の乗算におけるメモリアクセスについて説明する。図3は、演算対象とする行列を示す図である。
制御回路の機能構成について説明する。図4は、制御回路の機能構成を示すブロック図である。
行列の乗算に係る制御回路の全体動作について説明する。図5は、行列の乗算に係る制御回路の全体動作を示すフローチャートである。
上述の全体動作におけるステップS102,S105において実行される転置制御処理について説明する。図6は、転置制御処理の動作を示すフローチャートである。
上述の転置制御処理におけるステップS205において実行される動作制御処理の動作について説明する。図7は、動作制御処理の動作を示すフローチャートである。
第1演算制御処理について説明する。図8は、第1演算制御処理の動作を示すフローチャートである。図9は、第1の回路を示すブロック図である。図10は、第2の回路を示すブロック図である。
第2演算処理について説明する。図11は、第2演算制御処理の動作を示すフローチャートである。図12は、第3の回路構成を示すブロック図である。
2 外部メモリ
10 リコンフィギュラブル回路
12 制御回路
PE プロセッシングユニット
121 サイズ判定部
123 パラメータ変更部
125 回路構成部
126 処理制御部
Claims (4)
- 複数のプロセッシングエレメントを有し、該複数のプロセッシングエレメントによる回路構成を動的に再構成可能なリコンフィギュラブル回路と、該リコンフィギュラブル回路に構成される回路構成を示す複数の構成情報を記憶するコンフィギュレーションメモリと、前記リコンフィギュラブル回路と前記コンフィギュレーションメモリとを制御する制御回路とを備え、接続された外部メモリに記憶された行列の乗算を行うリコンフィギュラブルプロセッサであって、
前記制御回路は、
前記外部メモリに記憶された一方の行列における少なくとも1つの所定の行または少なくとも1つの所定の列に含まれる全要素をバッファメモリに保持する第1の回路を示す第1の構成情報と、前記外部メモリに記憶された他方の行列の全要素と前記バッファメモリに保持された全要素とに基づく積和処理を実行する第2の回路を示す第2の構成情報とを前記外部メモリから前記コンフィギュレーションメモリにロードするロード処理部と、
前記コンフィギュレーションメモリにロードされた前記第1の構成情報に基づいて前記リコンフィギュラブル回路に構成された前記第1の回路による処理動作と、前記コンフィギュレーションメモリにロードされた前記第2の構成情報に基づいて前記第1の回路とは異なるタイミングにおいて前記リコンフィギュラブル回路に構成された前記第2の回路による処理動作とを、前記一方の行列の全要素と前記他方の行列の全要素との積和処理が終了するまで繰り返し実行する処理制御部とを備えることを特徴とするリコンフィギュラブルプロセッサ。 - 前記ロード処理部は、前記外部メモリに記憶された一方の行列における少なくとも1つの所定の行または少なくとも1つの所定の列に含まれる全要素をバッファメモリに保持するとともに、前記外部メモリに記憶された他方の行列の全要素と前記バッファメモリに保持された全要素とに基づく積和処理を実行する第3の回路を示す第3の構成情報を前記外部メモリから前記コンフィギュレーションメモリにロードすることを特徴とする請求項1に記載のリコンフィギュラブルプロセッサ。
- 前記制御回路は、該制御回路により前記一方の行列の全要素と前記他方の行列の全要素との積和処理を行う演算部を更に備えることを特徴とする請求項2に記載のリコンフィギュラブルプロセッサ。
- 前記制御回路は、前記行列のデータサイズが第1の閾値以上であるか否かを判定するとともに、前記行列のデータサイズが前記第1の閾値より小さい第2の閾値以上であるか否かを判定するサイズ判定部を更に備え、
前記処理制御部は、前記行列のデータサイズが前記第1の閾値以上である場合、前記第1の回路による処理動作と前記第2の回路による処理動作とを行い、前記行列のデータサイズが前記第1の閾値未満且つ前記第2の閾値以上である場合、前記コンフィギュレーションメモリにロードされた前記第3の構成情報に基づいて前記リコンフィギュラブル回路に構成された前記第3の回路による処理動作を行い、
前記演算部は、前記行列のデータサイズが前記第2の閾値未満である場合、前記一方の行列の全要素と前記他方の行列の全要素との積和処理を行うことを特徴とする請求項3に記載のリコンフィギュラブルプロセッサ。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018168697A JP7132043B2 (ja) | 2018-09-10 | 2018-09-10 | リコンフィギュラブルプロセッサ |
CN201910783093.2A CN110888832A (zh) | 2018-09-10 | 2019-08-23 | 可重构处理器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018168697A JP7132043B2 (ja) | 2018-09-10 | 2018-09-10 | リコンフィギュラブルプロセッサ |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020042479A JP2020042479A (ja) | 2020-03-19 |
JP7132043B2 true JP7132043B2 (ja) | 2022-09-06 |
Family
ID=69745891
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018168697A Active JP7132043B2 (ja) | 2018-09-10 | 2018-09-10 | リコンフィギュラブルプロセッサ |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP7132043B2 (ja) |
CN (1) | CN110888832A (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112507284B (zh) * | 2020-12-18 | 2022-08-12 | 清华大学 | 稀疏矩阵乘法在可重构处理器阵列上的实现方法及装置 |
CN112286864B (zh) * | 2020-12-24 | 2021-06-04 | 北京清微智能科技有限公司 | 加速可重构处理器运行的稀疏化数据处理方法及*** |
US11556337B2 (en) | 2021-04-12 | 2023-01-17 | Analog Devices International Unlimited Company | Parallel matrix multiplication technique optimized for memory fetches |
CN115221101B (zh) * | 2021-04-16 | 2023-12-19 | 中科寒武纪科技股份有限公司 | 用于优化片上***的矩阵乘操作的方法和相关产品 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007524905A (ja) | 2003-06-18 | 2007-08-30 | エス・アール・シィ・コンピューターズ・インコーポレイテッド | 再構成可能なハードウェアにおいてメモリバンド幅の効率および利用率を高めるシステムおよび方法 |
JP2009026308A (ja) | 2007-07-19 | 2009-02-05 | Itt Manufacturing Enterprises Inc | 高速かつ効率的な行列乗算ハードウェアモジュール |
JP2013125378A (ja) | 2011-12-14 | 2013-06-24 | Tokyo Keiki Inc | リコンフィギュラブルプロセッサの制御方法及びリコンフィギュラブルプロセッサのコンフィギュレーション情報を生成する方法及びコンフィギュレーション情報生成ツール |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0446721B1 (en) * | 1990-03-16 | 2000-12-20 | Texas Instruments Incorporated | Distributed processing memory |
-
2018
- 2018-09-10 JP JP2018168697A patent/JP7132043B2/ja active Active
-
2019
- 2019-08-23 CN CN201910783093.2A patent/CN110888832A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007524905A (ja) | 2003-06-18 | 2007-08-30 | エス・アール・シィ・コンピューターズ・インコーポレイテッド | 再構成可能なハードウェアにおいてメモリバンド幅の効率および利用率を高めるシステムおよび方法 |
JP2009026308A (ja) | 2007-07-19 | 2009-02-05 | Itt Manufacturing Enterprises Inc | 高速かつ効率的な行列乗算ハードウェアモジュール |
JP2013125378A (ja) | 2011-12-14 | 2013-06-24 | Tokyo Keiki Inc | リコンフィギュラブルプロセッサの制御方法及びリコンフィギュラブルプロセッサのコンフィギュレーション情報を生成する方法及びコンフィギュレーション情報生成ツール |
Non-Patent Citations (1)
Title |
---|
林崎 弘成 他,Sakura-C:超並列計算機向けC言語と最適化,情報処理学会研究報告,社団法人情報処理学会,第2007巻 第80号,第7頁-第12頁 |
Also Published As
Publication number | Publication date |
---|---|
JP2020042479A (ja) | 2020-03-19 |
CN110888832A (zh) | 2020-03-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7132043B2 (ja) | リコンフィギュラブルプロセッサ | |
CN105703765B (zh) | 基于dram的可重构装置 | |
US11386644B2 (en) | Image preprocessing for generalized image processing | |
KR102380776B1 (ko) | 가속기 컨트롤러 및 그것의 가속기 로직 로딩 방법 | |
US10515135B1 (en) | Data format suitable for fast massively parallel general matrix multiplication in a programmable IC | |
WO2018160773A1 (en) | Matrix transfer accelerator system and method | |
US10114795B2 (en) | Processor in non-volatile storage memory | |
US10289787B2 (en) | Control program and control method for programmable logic device and information processing apparatus including the same | |
US11705207B2 (en) | Processor in non-volatile storage memory | |
JP5007838B2 (ja) | 情報処理装置および情報処理プログラム | |
CN112712457B (zh) | 数据处理方法以及人工智能处理器 | |
JP2006302132A (ja) | 信号処理装置及び再構成可能論理回路装置及び再構成可能順序回路 | |
JP2022074442A (ja) | 演算装置および演算方法 | |
JP2008293226A (ja) | 半導体装置 | |
GB2521029A (en) | Data processing device and method for interleaved storage of data elements | |
US20210288650A1 (en) | Semiconductor device and circuit layout method | |
WO2022230674A1 (ja) | 演算処理装置 | |
JP7346235B2 (ja) | 半導体装置 | |
JP6349995B2 (ja) | データ処理装置 | |
Pinhao et al. | Sparse matrix multiplication on a reconfigurable many-core architecture | |
CN116721006A (zh) | 特征图处理方法和装置 | |
JP2008219728A (ja) | 再構成可能な演算処理回路 | |
JP2019061347A (ja) | プロセッサエレメント、プログラマブルデバイス及びプロセッサエレメントの制御方法 | |
JP2015091045A (ja) | プログラマブルロジックデバイスおよびこれを用いたコンピュータ |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210601 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220512 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220621 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220720 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220802 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220825 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7132043 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |