JP7011627B2 - 人工知能チップ及び人工知能チップに用いられる命令実行方法 - Google Patents
人工知能チップ及び人工知能チップに用いられる命令実行方法 Download PDFInfo
- Publication number
- JP7011627B2 JP7011627B2 JP2019125661A JP2019125661A JP7011627B2 JP 7011627 B2 JP7011627 B2 JP 7011627B2 JP 2019125661 A JP2019125661 A JP 2019125661A JP 2019125661 A JP2019125661 A JP 2019125661A JP 7011627 B2 JP7011627 B2 JP 7011627B2
- Authority
- JP
- Japan
- Prior art keywords
- instruction
- execution component
- code block
- artificial intelligence
- general
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013473 artificial intelligence Methods 0.000 title claims description 140
- 238000000034 method Methods 0.000 title claims description 57
- 230000015654 memory Effects 0.000 claims description 226
- 238000012545 processing Methods 0.000 claims description 41
- 238000010586 diagram Methods 0.000 claims description 39
- 230000004044 response Effects 0.000 claims description 34
- 238000003062 neural network model Methods 0.000 claims description 20
- 238000001514 detection method Methods 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 15
- 230000005540 biological transmission Effects 0.000 claims description 9
- 238000013507 mapping Methods 0.000 claims description 8
- 230000003068 static effect Effects 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 description 12
- 238000004891 communication Methods 0.000 description 10
- 238000013528 artificial neural network Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 230000008569 process Effects 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 5
- 230000004913 activation Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 210000003792 cranial nerve Anatomy 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012067 mathematical method Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000000053 physical method Methods 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/063—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/461—Saving or restoring of program or task context
- G06F9/463—Program control block organisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
- G06F9/3877—Concurrent instruction execution, e.g. pipeline or look ahead using a slave processor, e.g. coprocessor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
- G06F9/3885—Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units
- G06F9/3889—Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units controlled by multiple instructions, e.g. MIMD, decoupled access or execute
- G06F9/3891—Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units controlled by multiple instructions, e.g. MIMD, decoupled access or execute organised in groups of units sharing resources, e.g. clusters
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/52—Program synchronisation; Mutual exclusion, e.g. by means of semaphores
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Neurology (AREA)
- Advance Control (AREA)
- Stored Programmes (AREA)
- Multimedia (AREA)
Description
Claims (20)
- 命令メモリ、データメモリ、少なくとも一つの汎用実行コンポーネント及び少なくとも一つの専用実行コンポーネントを備える人工知能チップであって、
命令メモリは、中央処理ユニットから送信されたカーネルコードを受信するように構成され、前記カーネルコードは少なくとも一つのコードブロックを含み、前記少なくとも一つのコードブロックにおけるコードブロックは汎用実行コンポーネント及び専用実行コンポーネントと関連し、
汎用実行コンポーネントは、コードブロックを受信し、受信されたコードブロックに関連する専用実行コンポーネントを専有化するようにロックするとともに、受信されたコードブロックにおける命令を、ロックされた専用実行コンポーネントに送信するように構成され、
専用実行コンポーネントは、汎用実行コンポーネントから送信された命令を受信し、受信された命令を実行するとともに、実行結果をデータメモリに記憶するように構成され、
データメモリは、専用実行コンポーネントから送信された実行結果を記憶するように構成され、
前記少なくとも一つのコードブロックにおけるコードブロックは、受信されたコードブロックに関連する専用実行コンポーネントをロックするように汎用実行コンポーネントに指示するための第1命令を含む、
人工知能チップ。 - 前記少なくとも一つのコードブロックにおけるコードブロックは、前記第1命令に続いて実行される第2命令セットをさらに含み、
汎用実行コンポーネントは具体的に、
コードブロックが受信されたことに応答して、第1命令を実行することで、受信されたコードブロックに関連する専用実行コンポーネントをロックし、
第2命令セットにおける第2命令を、ロックされた専用実行コンポーネントに順次送信するように構成される請求項1に記載の人工知能チップ。 - 前記少なくとも一つのコードブロックにおけるコードブロックは、第1命令及び第2命令セットを含み、
汎用実行コンポーネントは具体的に、
コードブロックが受信されたことに応答して、第1命令を実行することで、受信されたコードブロックに関連する少なくとも一つの専用実行コンポーネントをロックし、
第2命令セットにおける第2命令に対して、ロックされた専用実行コンポーネントから、当該第2命令を実行するための専用実行コンポーネントを確定し、確定された専用実行コンポーネントに当該第2命令を送信するように構成される請求項1に記載の人工知能チップ。 - 前記人工知能チップは、少なくとも一つのローカル変数の値が記憶されたローカル制御メモリをさらに備え、
ローカル制御メモリは、
汎用実行コンポーネントから送信された、所定ローカル変数の目標値を含むローカル変数更新請求を受信し、
前記所定ローカル変数の値を前記目標値に更新するように構成される請求項1に記載の人工知能チップ。 - ローカル制御メモリはさらに、前記少なくとも一つの汎用実行コンポーネントに、前記所定ローカル変数の更新通知を送信するように構成され、
前記所定ローカル変数の更新を待機する汎用実行コンポーネントはさらに、前記通知が受信されたことに応答して、受信されたコードブロックにおける命令を継続して実行するように構成される請求項4に記載の人工知能チップ。 - 汎用実行コンポーネントはさらに、
目標ローカル変数の値が更新されているか否かをポーリング方式で検出し、
前記目標ローカル変数の値の更新が検出されたことに応答して、受信されたコードブロックにおける命令を継続して実行するように構成される請求項4に記載の人工知能チップ。 - 前記人工知能チップは、少なくとも一つの計算クラスタをさらに備え、前記少なくとも一つの計算クラスタにおける計算クラスタ、データメモリ、少なくとも一つの汎用実行コンポーネント及び少なくとも一つの専用実行コンポーネントを含む請求項1に記載の人工知能チップ。
- 前記人工知能チップはグローバル制御メモリをさらに備え、計算クラスタはローカル制御メモリをさらに備え、前記グローバル制御メモリに少なくとも一つのグローバル変数の値が記憶され、ローカル制御メモリに少なくとも一つのローカル変数の値が記憶され、
前記グローバル制御メモリは、
計算クラスタから送信された、所定グローバル変数の目標値を含むグローバル変数更新請求を受信し、
前記所定グローバル変数の値を前記目標値に更新するように構成される請求項7に記載の人工知能チップ。 - 前記グローバル制御メモリはさらに、少なくとも一つの前記ローカル制御メモリに前記所定グローバル変数の更新通知を送信するように構成され、
前記所定グローバル変数の更新を待機するローカル制御メモリはさらに、前記通知が受信されたことに応答して、前記所定グローバル変数に関連するローカル変数の値を更新するように構成される請求項8に記載の人工知能チップ。 - ローカル制御メモリはさらに、
目標グローバル変数の値が更新されているか否かをポーリング方式で検出し、
前記目標グローバル変数の値の更新が検出されたことに応答して、前記所定グローバル変数に関連するローカル変数の値を更新するように構成される請求項8に記載の人工知能チップ。 - 前記カーネルコードが実行される間は、汎用実行コンポーネントによりロックされた専用実行コンポーネントはロック解除されない請求項1に記載の人工知能チップ。
- 汎用実行コンポーネントはさらに、第1命令を実行した後、第2命令セットを循環実行するように構成される請求項2又は3に記載の人工知能チップ。
- 前記カーネルコードは、入力されたデータフロー図を前記中央処理ユニットにより所定のプログラミングプロトコルに基づいて解析して得られたものであり、前記データフロー図は、ニューラルネットワークモデルの静的ダイアグラムをデータフロー図にマッピングして得られたものである請求項1に記載の人工知能チップ。
- 人工知能チップに用いられる命令実行方法であって、前記人工知能チップは、命令メモリ、データメモリ、少なくとも一つの汎用実行コンポーネント及び少なくとも一つの専用実行コンポーネントを備え、命令メモリは中央処理ユニットに通信可能に接続され、
前記方法は、
汎用実行コンポーネントが前記命令メモリからのコードブロックを受信するステップであって、前記コードブロックは、前記中央処理ユニットから送信されたカーネルコードの中から前記命令メモリにより取得されたものであり、前記コードブロックは専用実行コンポーネントと関連する、ステップと、
汎用実行コンポーネントが前記コードブロックに関連する専用実行コンポーネントを専有化するようにロックするステップと、
汎用実行コンポーネントが前記コードブロックの中の命令を、ロックされた専用実行コンポーネントに送信するステップであって、専用実行コンポーネントは、受信された命令を実行するとともに、実行結果を前記データメモリに記憶するように構成されている、ステップとを含み、
前記少なくとも一つのコードブロックにおけるコードブロックは、受信されたコードブロックに関連する専用実行コンポーネントをロックするように汎用実行コンポーネントに指示するための第1命令を含む、
人工知能チップに用いられる命令実行方法。 - 前記人工知能チップは、少なくとも一つのローカル変数の値が記憶されたローカル制御メモリをさらに備え、
前記方法は、
目標ローカル変数の更新通知が受信されたことに応答して、前記コードブロック中の命令を継続して実行することをさらに含む請求項14に記載の方法。 - 前記人工知能チップは、少なくとも一つのローカル変数の値が記憶されたローカル制御メモリをさらに備え、
前記方法は、
目標ローカル変数の値が更新されているか否かをポーリング方式で検出することと、
前記目標ローカル変数の値の更新が検出されたことに応答して、前記コードブロック中の命令を継続して実行することとをさらに含む請求項14に記載の方法。 - 人工知能チップに用いられる命令実行装置であって、前記人工知能チップは、命令メモリ、データメモリ、少なくとも一つの汎用実行コンポーネント及び少なくとも一つの専用実行コンポーネントを備え、命令メモリは中央処理ユニットに通信可能に接続され、
前記装置は、
汎用実行コンポーネントにより前記命令メモリからのコードブロックを受信するように構成されたコード受信ユニットであって、前記コードブロックは、前記中央処理ユニットから送信されたカーネルコードの中から前記命令メモリにより取得されたものであり、前記コードブロックは専用実行コンポーネントと関連する、コード受信ユニットと、
汎用実行コンポーネントにより前記コードブロックに関連する専用実行コンポーネントを専有化するようにロックするように構成されたロックユニットと、
汎用実行コンポーネントにより前記コードブロック中の命令を、ロックされた専用実行コンポーネントに送信するように構成された命令送信ユニットであって、専用実行コンポーネントは、受信された命令を実行するとともに、実行結果を前記データメモリに記憶するように構成されている、命令送信ユニットとを含み、
前記少なくとも一つのコードブロックにおけるコードブロックは、受信されたコードブロックに関連する専用実行コンポーネントをロックするように汎用実行コンポーネントに指示するための第1命令を含む、
人工知能チップに用いられる命令実行装置。 - コンピュータプログラムが記憶されたコンピュータ可読媒体であって、前記コンピュータプログラムが請求項14から16のいずれか1項に記載の人工知能チップの汎用実行コンポーネントにより実行されるときに当該請求項に記載の方法を実現する、コンピュータ可読媒体。
- 中央処理ユニット、記憶装置および少なくとも一つの請求項1~13のいずれか1項に記載の人工知能チップを備える電子機器。
- コンピュータプログラムであって、
前記コンピュータプログラムが請求項14~16のいずれか一項に記載の人工知能チップの汎用実行コンポーネントにより実行されると、当該請求項に記載の方法を実現させるコンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810910206.6 | 2018-08-10 | ||
CN201810910206.6A CN110825514B (zh) | 2018-08-10 | 2018-08-10 | 人工智能芯片以及用于人工智能芯片的指令执行方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020027613A JP2020027613A (ja) | 2020-02-20 |
JP7011627B2 true JP7011627B2 (ja) | 2022-01-26 |
Family
ID=69405892
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019125661A Active JP7011627B2 (ja) | 2018-08-10 | 2019-07-05 | 人工知能チップ及び人工知能チップに用いられる命令実行方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US11372673B2 (ja) |
JP (1) | JP7011627B2 (ja) |
KR (1) | KR102407220B1 (ja) |
CN (1) | CN110825514B (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110825530B (zh) * | 2018-08-10 | 2022-12-23 | 昆仑芯(北京)科技有限公司 | 用于人工智能芯片的指令执行方法和装置 |
US11860782B2 (en) * | 2019-08-13 | 2024-01-02 | Neuroblade Ltd. | Compensating for DRAM activation penalties |
US11055003B2 (en) * | 2019-08-20 | 2021-07-06 | Micron Technology, Inc. | Supplemental AI processing in memory |
CN111752887B (zh) * | 2020-06-22 | 2024-03-15 | 深圳鲲云信息科技有限公司 | 人工智能芯片和基于人工智能芯片的数据处理方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001167058A (ja) | 1999-12-07 | 2001-06-22 | Matsushita Electric Ind Co Ltd | 情報処理装置 |
JP2006260377A (ja) | 2005-03-18 | 2006-09-28 | Seiko Epson Corp | 並列処理装置および情報処理方法 |
WO2011148920A1 (ja) | 2010-05-26 | 2011-12-01 | 日本電気株式会社 | マルチプロセッサシステム、実行制御方法、実行制御プログラム |
JP2017507398A (ja) | 2014-01-06 | 2017-03-16 | ジョンソン コントロールズ テクノロジー カンパニーJohnson Controls Technology Company | 複数のユーザインターフェース動作ドメインを有する車両 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2962241B2 (ja) * | 1996-09-10 | 1999-10-12 | 日本電気株式会社 | 階層型マルチプロセッサにおける並列処理方法 |
ATE557343T1 (de) * | 1998-08-24 | 2012-05-15 | Microunity Systems Eng | Prozessor und verfahren zur durchführung eines breitschaltungsbefehls mit breitem operand |
US7516456B2 (en) * | 2003-09-25 | 2009-04-07 | International Business Machines Corporation | Asymmetric heterogeneous multi-threaded operating system |
US8321849B2 (en) | 2007-01-26 | 2012-11-27 | Nvidia Corporation | Virtual architecture and instruction set for parallel thread computing |
US9772853B1 (en) * | 2007-09-17 | 2017-09-26 | Rocket Software, Inc | Dispatching a unit of work to a specialty engine or a general processor and exception handling including continuing execution until reaching a defined exit point or restarting execution at a predefined retry point using a different engine or processor |
US8156275B2 (en) | 2009-05-13 | 2012-04-10 | Apple Inc. | Power managed lock optimization |
CN102073618A (zh) * | 2010-12-07 | 2011-05-25 | 浪潮(北京)电子信息产业有限公司 | 一种异构计算***及其处理方法 |
US9135213B2 (en) | 2011-01-13 | 2015-09-15 | Xilinx, Inc. | Extending a processor system within an integrated circuit and offloading processes to process-specific circuits |
CN102708009B (zh) * | 2012-04-19 | 2014-04-02 | 华为技术有限公司 | 一种基于cuda实现多任务共享gpu的方法 |
CN103905310B (zh) * | 2014-03-24 | 2017-04-19 | 华为技术有限公司 | 报文处理的方法及转发设备 |
CN110874212B (zh) * | 2015-06-30 | 2021-08-20 | 华为技术有限公司 | 一种硬件加速方法、编译器以及设备 |
JP6044691B2 (ja) | 2015-10-01 | 2016-12-14 | 国立研究開発法人情報通信研究機構 | 論理推論システム、計算学習装置および論理推論方法 |
CN107766079B (zh) * | 2016-08-19 | 2022-03-11 | 北京百度网讯科技有限公司 | 处理器以及用于在处理器上执行指令的方法 |
US11010338B2 (en) * | 2017-04-06 | 2021-05-18 | Shanghai Cambricon Information Technology Co., Ltd | Data screening device and method |
-
2018
- 2018-08-10 CN CN201810910206.6A patent/CN110825514B/zh active Active
-
2019
- 2019-07-05 JP JP2019125661A patent/JP7011627B2/ja active Active
- 2019-07-08 US US16/505,127 patent/US11372673B2/en active Active
- 2019-07-09 KR KR1020190082871A patent/KR102407220B1/ko active IP Right Grant
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001167058A (ja) | 1999-12-07 | 2001-06-22 | Matsushita Electric Ind Co Ltd | 情報処理装置 |
JP2006260377A (ja) | 2005-03-18 | 2006-09-28 | Seiko Epson Corp | 並列処理装置および情報処理方法 |
WO2011148920A1 (ja) | 2010-05-26 | 2011-12-01 | 日本電気株式会社 | マルチプロセッサシステム、実行制御方法、実行制御プログラム |
JP2017507398A (ja) | 2014-01-06 | 2017-03-16 | ジョンソン コントロールズ テクノロジー カンパニーJohnson Controls Technology Company | 複数のユーザインターフェース動作ドメインを有する車両 |
Non-Patent Citations (1)
Title |
---|
Hisa Ando,GPUを支える技術,第1版,株式会社技術評論社,2017年07月13日,第113頁-第145頁 |
Also Published As
Publication number | Publication date |
---|---|
CN110825514B (zh) | 2023-05-23 |
CN110825514A (zh) | 2020-02-21 |
JP2020027613A (ja) | 2020-02-20 |
US20200050476A1 (en) | 2020-02-13 |
KR102407220B1 (ko) | 2022-06-08 |
KR20200018234A (ko) | 2020-02-19 |
US11372673B2 (en) | 2022-06-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7011627B2 (ja) | 人工知能チップ及び人工知能チップに用いられる命令実行方法 | |
CN109426574B (zh) | 分布式计算***,分布式计算***中数据传输方法和装置 | |
US11010313B2 (en) | Method, apparatus, and system for an architecture for machine learning acceleration | |
JP7012689B2 (ja) | コマンド実行方法及び装置 | |
US20110265093A1 (en) | Computer System and Program Product | |
US11880715B2 (en) | Method and system for opportunistic load balancing in neural networks using metadata | |
US11694075B2 (en) | Partitioning control dependency edge in computation graph | |
KR20210080009A (ko) | 가속기, 가속기의 동작 방법 및 가속기를 포함한 디바이스 | |
US11941528B2 (en) | Neural network training in a distributed system | |
US11366690B2 (en) | Scheduling commands in a virtual computing environment | |
JP7001643B2 (ja) | 人工知能チップに用いられる命令実行方法及び装置 | |
US20190318229A1 (en) | Method and system for hardware mapping inference pipelines | |
US20190354833A1 (en) | Method and system for reducing communication frequency in neural network systems | |
US20120246656A1 (en) | Scheduling of tasks to be performed by a non-coherent device | |
JP2001195346A (ja) | 並列に転送寸法計算と無効化決定を実行するデータ転送コントローラ | |
CN116710891A (zh) | 子图的编译、执行方法及相关设备 | |
US11061654B1 (en) | Synchronization of concurrent computation engines | |
KR20190104997A (ko) | 무상태 메시지 프로토콜을 위한 트랜잭션 자원 | |
US20230145253A1 (en) | Reducing latency in highly scalable hpc applications via accelerator-resident runtime management | |
WO2024016894A1 (zh) | 一种神经网络的训练方法以及相关设备 | |
JP2007048019A (ja) | エミュレーション方法、エミュレータ、コンピュータ組込型デバイスおよびエミュレータ用プログラム | |
CN118036776A (zh) | 一种模型训练方法及相关装置 | |
KR20220077484A (ko) | 능동적 스케줄링 방법과 컴퓨팅 장치 | |
WO2024145354A1 (en) | Dynamic control of work scheduling | |
JP2007048020A (ja) | エミュレーション方法、エミュレータ、コンピュータ組込型デバイスおよびエミュレータ用プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190705 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190705 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200812 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200923 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201221 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210603 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210830 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20211018 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20211018 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220107 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220114 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7011627 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |