JP6749358B2 - 演算処理装置 - Google Patents
演算処理装置 Download PDFInfo
- Publication number
- JP6749358B2 JP6749358B2 JP2018051544A JP2018051544A JP6749358B2 JP 6749358 B2 JP6749358 B2 JP 6749358B2 JP 2018051544 A JP2018051544 A JP 2018051544A JP 2018051544 A JP2018051544 A JP 2018051544A JP 6749358 B2 JP6749358 B2 JP 6749358B2
- Authority
- JP
- Japan
- Prior art keywords
- storage device
- array
- processing
- stored
- summation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/15—Correlation function computation including computation of convolution operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/15—Correlation function computation including computation of convolution operations
- G06F17/153—Multidimensional correlation or convolution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/063—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Neurology (AREA)
- Complex Calculations (AREA)
- Semiconductor Memories (AREA)
- Image Processing (AREA)
Description
第1実施形態による演算処理装置について図1乃至図7を参照して説明する。この第1実施形態の演算処理装置は、複数の処理層の畳み込みニューラルネットワーク回路を実現し、その概要を図1に示す。この演算処理装置1は、処理層30と、処理層60とを有し、処理層30は、記憶装置20に格納されたデータに対して畳み込み処理を行い、処理結果を記憶装置50に格納する。処理層60は、記憶装置50に格納されたデータに対して畳み込み処理を行い、処理結果を記憶装置70に格納する。
次に、処理層30における畳み込み処理の一部の処理(第1処理)について図2乃至図7を参照して説明する。この畳み込み処理には、図2に示す3個の核W1〜W3が用いられる。核W1〜W3はそれぞれ、8個のアレイを有し、それぞれのアレイは4行4列に配置された要素を有している。例えば、核W1は、8個のアレイW1 1〜W1 8を有し、各アレイW1 i(i=1,・・・,8)は、4行4列に配置された要素(メモリ素子)を有する。各アレイW1 i(i=1,・・・,8)における第j(j=1,・・・,4)行第k(k=1,・・・,4)列に配置された要素をW1 i(j,k)と表す。要素W1 i(j,k)(j,k=1.・・・、4)は、この要素に格納されるデータ(重みとも云う)をも表す。その他の核W2、W3の要素も同様な表示とする。
ΣΣΣ(Ai(j,k)×W1 i(j,k))
と表される。最初の総和記号Σはiに対しての総和を求め、2番目に示す総和記号Σはjに対しての総和を求め、3番目に示す総和記号Σはkに対しての総和を求める。この総和は、図3に示す演算処理部6によって求められる。この処理に於いて各々のi(i=1,・・・,8)に対する総和の算出は並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。そして、求めた総和に、処理層30のバイアス値B11を加え、必要に応じて発火関数処理を施した値を図1に示す記憶装置50のアレイC1の要素C1(1,1)に格納する(図5)。
ΣΣΣ(Ai(j,k+1)×W1 i(j,k))
と表される。1番目の総和記号Σはiに対しての総和を求め、2番目に示す総和記号Σはjに対しての総和を求め、3番目に示す総和記号Σはkに対しての総和を求める。この総和は、図3に示す演算処理部6によって求められる。この処理に於いて各々のi(i=1,・・・,8)に対する積和の算出は並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。そして、求めた総和に、処理層30のバイアス値B11を加え、必要に応じて発火関数処理を施した値を図1に示す記憶装置50のアレイC1の要素C1(1,2)に格納する(図6)。
ΣΣΣAi(j+p−1,k+q−1)×Wr i(j,k)
と表される。1番目の総和記号Σはiに対しての総和を求め、2番目に示す総和記号Σはjに対しての総和を求め、3番目に示す総和記号Σはkに対しての総和を求める。この総和は、図3に示す演算処理部6によって求められる。なお、この総和は、p(1≦p≦8)、q(1≦q≦8)、r(1≦r≦3)の組それぞれに対して求められる。この処理に於いて各々のr(r=1,2,3)に対する総和の算出は並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。そして、p(1≦p≦8)、q(1≦q≦8)、r(1≦r≦3)の組それぞれに対して求めた総和に処理層30のバイアス値B1rを加え、必要に応じて発火関数処理を施した値を図1に示す記憶装置50のアレイCrの要素Cr(p、q)に格納する(図7)。この状態で、p(1≦p≦8)、q(1≦q≦8)、r(1≦r≦3)の組それぞれに対して、記憶装置50のアレイCrの要素Cr(p,q)には処理層30の出力の深さがrの値と同一の値が格納されている。
続いて処理層60の処理の一部(第1処理)を行う。処理層30の場合と同様に処理層60に用いられる核F1〜F9の重みの数値も、図3に示す読み取り部2によって外部記憶装置202から読み出され、この読み出された値が演算処理装置1の内の数値記憶部4にある記憶装置55に格納される(図8)。核Fi(i=1,・・・,9)は、3個のアレイFi 1、Fi 2、Fi 3を有し、各アレイFi j(j=1,2,3)は、3行3列に配置された要素(メモリ素子)を有している。各アレイFi j(j=1,2,3)の第p(p=1,2,3)行第q(q=1,2,3)列の要素はFi j(p,q)と表され、この要素に格納される数値(重み)もFi j(p,q)と表される。
ΣΣΣCi(j,k)×V1 i(j,k)
と表される。1番目の総和記号Σはiに対しての総和を求め、2番目の総和記号Σはjに対しての総和を求め、3番目の総和記号Σはkに対しての総和を求める。この総和は図3に示す演算処理部6によって求められる。そして、上記総和は、記憶装置70のアレイD1の要素D1(1,1)に格納される。この処理に於いて各々のi(i=1,2,3)に対する積和の算出は並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。
ΣΣΣCi(j,k+1)×V1 i(j,k)
と表される。1番目の総和記号Σはiに対しての総和を求め、2番目の総和記号Σはjに対しての総和を求め、3番目の総和記号Σはkに対しての総和を求める。この総和は図3に示す演算処理部6によって求められる。そして、上記総和は、記憶装置70のアレイD1の要素D1(1,2)に格納される。この処理に於いて各々のi(i=1,2,3)に対する積和の算出は並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。
ΣΣΣCi(j+p−1,k+q−1)×Vr i(j,k)
と表される。1番目の総和記号Σはiに対しての総和を求め、2番目の総和記号Σはjに対しての総和を求め、3番目の総和記号Σはkに対しての総和を求める。この総和は、図3に示す演算処理部6によって、p(1≦p≦6)、q(1≦q≦6)、r(1≦r≦9)の組のそれぞれに対して求められ、記憶装置70のアレイDrの要素Dr(p,q)に格納される。この処理の終了した状態を図11に示す。この処理に於いて各々のi(i=1.2.3)に対する積和の算出は並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。また、各々のr(r=1,・・・,9)に対する処理も並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。
引き続いて、処理層30の一部の処理(第2処理)を行う。i(1≦i≦8)、j(1≦j≦3)、k,m(1≦k,m≦4)に対して数値記憶部4の記憶装置35に格納されている核Ej+3のアレイEj+3 iの要素Ej+3 i(k、m)の数値を、図3に示す読み取り部5を用いて読み取り、記憶装置40の核WjのアレイWj iの要素Wj i(k、m)に格納する。
ΣΣΣAi(j+p−1,k+q−1)×Wr i(j,k)
と表される。1番目の総和記号Σはiに対しての総和を求め、2番目の総和記号Σはjに対しての総和を求め、3番目の総和記号Σはkに対しての総和を求める。この総和は、図3に示す演算処理部6によって、p(1≦p≦8)、q(1≦q≦8)、r(1≦r≦3)の組それぞれに対して求められる。この処理に於いて各々のi(i=1,・・・,8)に対する積和の算出は並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。そして、p(1≦p≦8)、q(1≦q≦8)、r(1≦r≦3)の組それぞれに対して求めた値に、処理層30のバイアスB1r+3を加え、必要に応じて発火関数処理を施した値を記憶装置50のアレイCrの要素Cr(p,q)に格納する。なお、これらの処理に於いて各々のr(r=1.2.3)に対する処理は並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。この状態でp(1≦p≦8)、q(1≦q≦8)、r(1≦r≦3)の組それぞれに対して、記憶装置50のアレイCrの要素Cr(p,q)には処理層30の出力の内の深さがr+3の値と同一の値が格納されている。
次に、i(1≦i≦3)、j(1≦j≦9)、k、m(1≦k,m≦3)に対して、図3に示す数値記憶部4の記憶装置55に格納されている核Fjの要素Fj i+3(k,m)の数値を、図3に示す読み取り部5を用いて読み取り、記憶装置58に格納される核Vjの要素Vj i(k,m)に格納する。
ΣΣΣCi(j+p−1,k+q−1)×Vr i(j,k)
と表される。1番目の総和記号Σはiに対しての総和を求め、2番目の総和記号Σはjに対しての総和を求め、3番目の総和記号Σはkに対しての総和を求める。
引き続いて、i(1≦i≦8)、j(1≦j≦3)、k、m(1≦k,m≦4)に対して、図3に示す数値記憶部4の記憶装置35に格納されている核Ej+6の要素Ej+6 i(k,m)の数値を、図3に示す読み取り部5を用いて読み取り、記憶装置40の核Wjの要素Wj i(k,m)に格納する。
ΣΣΣAi(j+p−1,k+q−1)×Wr i(j,k)
と表される。1番目の総和記号Σはiに対しての総和を求め、2番目の総和記号Σはjに対しての総和を求め、3番目の総和記号Σはkに対しての総和を求める。この処理に於いて各々のi(i=1,・・・,8)に対する積和の算出は並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。そして、p(1≦p≦8)、q(1≦q≦8)、r(1≦r≦3)の組のそれぞれに対して算出した総和に処理層30のバイアス値B1r+6を加え、必要に応じて発火関数処理を施した値を記憶装置50のアレイCrの要素Cr(p,q)に格納する。なお、これらの処理に於いて各々のr(r=1,2,3)に対する処理は並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。この状態で、p(1≦p≦8)、q(1≦q≦8)、r(1≦r≦3)の組それぞれに対して、記憶装置50のアレイCrの要素Cr(p,q)には処理層30の出力の内の深さがr+6の値と同一の値が格納されている。
次に、i(1≦i≦3)、j(1≦j≦9)、k、m(1≦k,m≦3)に対して、図3に示す数値記憶部4の記憶装置55の要素Fj i+6(k,m)に格納されている数値を、図3に示す読み取り部5を用いて読み取り、記憶装置58の核Vjの要素Vj i(k,m)に格納する。
ΣΣΣCi(j+p−1,k+q−1)×Vr i(j,k)
と表される。1番目の総和記号Σはiに対しての総和を求め、2番目の総和記号Σはjに対しての総和を求め、3番目の総和記号Σはkに対しての総和を求める。この処理に於いて各々のiに対する積和の算出は並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。そして、p(1≦p≦8)、q(1≦q≦8)、r(1≦r≦3)の組のそれぞれに対して算出した総和と、記憶装置70のアレイDrの要素Dr(p,q)に格納されている数値との和を改めて要素Dr(p,q)に格納する。この処理に於いて各々のi(i=1,2,3)に対する積和の算出は並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。また、各々のr(r=1,・・・,9)に対する処理も並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。
引き続いて、i(1≦i≦8)、j(1≦j≦3)、k、m(1≦k,m≦4)に対して、図3に示す数値記憶部4の記憶層35の要素Ej+9 i(k,m)に格納されている数値を、図3に示す読み取り部5を用いて読み取り、記憶装置40の要素Wj i(k,m)に格納する。
ΣΣΣAi(j+p−1,k+q−1)×Wr i(j,k)
と表される。1番目の総和記号Σはiに対しての総和を求め、2番目の総和記号Σはjに対しての総和を求め、3番目の総和記号Σはkに対しての総和を求める。この処理に於いて各々のi(i=1,・・・,8)に対する積和の算出は並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。
次に、i(1≦i≦3)、j(1≦j≦9)、k、m(1≦k,m≦3)に対して、図3に示す数値記憶部4の記憶装置55の要素Fj i+9(k,m)に格納されている数値を、図3に示す読み取り部5を用いて読み取り、記憶装置58の要素Vj i(k,m)に格納する。
ΣΣΣCi(j+p−1,k+q−1)×Vr i(j,k)
と表される。1番目の総和記号Σはiに対しての総和を求め、2番目の総和記号Σはjに対しての総和を求め、3番目の総和記号Σはkに対しての総和を求める。この処理に於いて各々のi(i=1,2,3)に対する積和の算出は並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。
第2実施形態による演算処理装置について図12乃至図19を参照して説明する。この第2実施形態の演算処理装置1は、図1乃至図11に示す第1実施形態の演算処理装置において処理層30に用いられる核の深さすなわち核に含まれるアレイの個数が異なっている。第1実施形態においては、記憶装置40に格納される核に含まれるアレイの個数(=8)は、処理層30の入力の深さすなわち、記憶装置20に格納されたアレイの個数(=8)に等しかった。図12に示すように、第2実施形態においては、処理層30に用いられ、記憶装置40に格納される核の個数は3であって、核はそれぞれ2個のアレイを有している。各アレイは、4行×4列に配置されたメモリ素子を有する。すなわち、第1実施形態とは、処理層30に用いられる核の深さが異なっている。
まず、i(1≦i≦2)、j(1≦j≦3)、k、m(1≦k,m≦4)に対して、図3に示す数値記憶部4の記憶装置35に格納されている核の要素Ej i(k,m)に格納されている数値を、図3に示す読み取り部5を用いて読み取り、記憶装置40に格納されている核Wjの要素Wj i(k,m)に格納する。
ΣΣΣAi(j,k)×W1 i(j,k)
と表される。1番目の総和記号Σはiに対しての総和を求め、2番目の総和記号Σはjに対しての総和を求め、3番目の総和記号Σはkに対しての総和を求める。そして、この総和は、記憶装置50のアレイC1の要素C1(1,1)に格納される。この処理に於いて各々のi(i=1,2)に対する積和の算出は並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。
ΣΣΣAi(j,k+1)×W1 i(j,k)
と表される。1番目の総和記号Σはiに対しての総和を求め、2番目の総和記号Σはjに対しての総和を求め、3番目の総和記号Σはkに対しての総和を求める。そして、この総和は、記憶装置50のアレイC1の要素C1(1,2)に格納される。この処理に於いて各々のi(i=1,2)に対する積和の算出は並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。
ΣΣΣAi(j+p−1,k+q−1)×W1 i(j,k)
と表される。1番目の総和記号Σはiに対しての総和を求め、2番目の総和記号Σはjに対しての総和を求め、3番目の総和記号Σはkに対しての総和を求める。そして、この総和は、p(1≦p≦8)、q(1≦q≦8)の組のそれぞれに対して求められ、記憶装置50のアレイC1の要素C1(p,q)に格納される。この処理に於いて各々のi(i=1,2)に対する積和の算出は並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。この処理の終了した状態を図15に示す。
ΣΣΣAi(j+p−1,k+q−1)×W2 i(j,k)
と表される。1番目の総和記号Σはiに対しての総和を求め、2番目の総和記号Σはjに対しての総和を求め、3番目の総和記号Σはkに対しての総和を求める。そして、この総和は、p(1≦p≦8)、q(1≦q≦8)の組のそれぞれに対して求められ、記憶装置50のアレイC2の要素C2(p,q)に格納される。この処理に於いて各々のi(i=1,2)に対する積和の算出は並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。この処理の終了した状態を図16に示す。
ΣΣΣAi(j+p−1,k+q−1)×W3 i(j,k)
と表される。1番目の総和記号Σはiに対しての総和を求め、2番目の総和記号Σはjに対しての総和を求め、3番目の総和記号Σはkに対しての総和を求める。そして、この総和は、p(1≦p≦8)、q(1≦q≦8)の組のそれぞれに対して求められ、記憶装置50のアレイC3の要素C3(p,q)に格納される。この処理に於いて各々のi(i=1,2)に対する積和の算出は並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。この処理の終了した状態を図17に示す。なお、図13乃至図15を参照して説明した処理、図16を参照して説明した処理、および図17を参照して説明した処理は並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。
ΣΣΣAi+2(j+p−1,k+q−1)×Wr i(j,k)
と求められる。1番目の総和記号Σはiに対しての総和を求め、2番目の総和記号Σはjに対しての総和を求め、3番目の総和記号Σはkに対しての総和を求める。そして、p(1≦p≦8)、q(1≦q≦8)、r(1≦r≦3)の組それぞれに対して求めた総和と、記憶装置50のアレイCrの要素Cr(p,q)との和を改めてCr(p,q)に格納する。この処理に於いて各々のi(i=1,2)に対する積和の算出は並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。また、これらの処理に於いて各々のr(r=1,2,3)に対する処理は並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。この処理の終了した状態を図18に示す。
ΣΣΣAi+4(j+p−1,k+q−1)×Wr i(j,k)
と求められる。1番目の総和記号Σはiに対しての総和を求め、2番目の総和記号Σはjに対しての総和を求め、3番目の総和記号Σはkに対しての総和を求める。そして、p(1≦p≦8)、q(1≦q≦8)、r(1≦r≦3)の組それぞれに対して求めた総和と、記憶装置50のアレイCrの要素Cr(p,q)に格納された値との和を改めて要素Cr(p,q)に格納する。この処理に於いて各々のi(i=1,2)に対する積和の算出は並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。また、これらの処理に於いて各々のr(r=1,2,3)に対する処理は並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。
ΣΣΣAi+6(j+p−1,k+q−1)×Wr i(j,k)
と求められる。1番目の総和記号Σはiに対しての総和を求め、2番目の総和記号Σはjに対しての総和を求め、3番目の総和記号Σはkに対しての総和を求める。そして、p(1≦p≦8)、q(1≦q≦8)、r(1≦r≦3)の組それぞれに対して求めた総和と、記憶装置50に格納されたアレイCrの要素Cr(p,q)との和を算出する。そして、上記和に処理層30のバイアス値B1rを加え、必要に応じて発火関数処理を施した値を改めてアレイCrの要素Cr(p,q)に格納する。この処理に於いて各々のi(i=1,2)に対する積和の算出は並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。また、これらの処理に於いて各々のr(r=1,2,3)に対する処理は並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。この状態で、p(1≦p≦8)、q(1≦q≦8)、r(1≦r≦3)の組それぞれに対してアレイCrの要素Cr(p,q)には処理層30の出力の内の深さがrの値と同一の値が格納されている。
引き続いて、i(1≦i≦3)、j(1≦j≦9)、k,m(1≦k,m≦3)に対して、図3に示す数値記憶部4の記憶装置55に格納されているアレイFj iの要素Fj i(k,m)の数値を、図3に示す読み取り部5を用いて読み取り、記憶装置58のアレイVj iの要素Vj i(k,m)に格納する。
ΣΣΣCi(j+p−1,k+q−1)×Vr i(j,k)
と表される。1番目の総和記号Σはiに対しての総和を求め、2番目の総和記号Σはjに対しての総和を求め、3番目の総和記号Σはkに対しての総和を求める。そして、p(1≦p≦6)、q(1≦q≦6)、r(1≦r≦9)の組それぞれに対して算出した総和は、記憶装置70のアレイDrの要素Dr(p,q)に格納する。この処理の終了した状態を図19に示す。この処理に於いて各々のi(i=1,2,3)に対する積和の算出は並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。また、各々のr(r=1,・・・,9)に対する処理も並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。
次に、i(1≦i≦2)、j(1≦j≦3)、k、m(1≦k,m≦4)に対して、図13乃至図18を参照して説明した処理に関して、アレイEj iの要素Ej i(k,m)に格納されている数値の読み取りに於いて、アレイEj iの要素Ej i(k,m)を要素Ej+3 i(k,m)と読み替えた処理を行う。この処理の終了した状態で、p(1≦p≦8)、q(1≦q≦8)、r(1≦r≦3)の組それぞれに対して、記憶装置50のアレイCrの要素Cr(p,q)には処理層30の出力の内の深さがr+3の値と同一の値が格納されている。
次に、i(1≦i≦3)、j(1≦j≦9)、k、m(1≦k,m≦3)に対して、図3に示す数値記憶部4の記憶装置55に格納されているアレイFj i+3の要素Fj i+3(k,m)の数値を、図3に示す読み取り部5を用いて読み取り、記憶装置58のアレイVj iの要素Vj i(k,m)に格納する。
ΣΣΣCi(j+p−1,k+q−1)×Vr i(j,k)
と表される。1番目の総和記号Σはiに対しての総和を求め、2番目の総和記号Σはjに対しての総和を求め、3番目の総和記号Σはkに対しての総和を求める。そして、p(1≦p≦6)、q(1≦q≦6)、r(1≦r≦9)の組それぞれに対して算出した総和と、記憶装置70のアレイDrの要素Dr(p,q)に格納されている数値との和を改めて要素Dr(p,q)に格納する。この処理に於いて各々のi(i=1,2,3)に対する積和の算出は並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。また、各々のr(r=1,・・・,9)に対する処理も並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。
そして、図13乃至図18を参照して説明した処理に関して、記憶装置35に格納されているアレイEj iの要素Ej i(k,m)の数値の読み取りに於いて要素Ej i(k,m)を要素Ej+6 i(k,m)と読み替えた処理を行う。この処理の終了した状態で、p(1≦p≦8)、q(1≦q≦8)、r(1≦r≦3)の組それぞれに対して、記憶装置50のアレイCrの要素Cr(p,q)には処理層30の出力の内の深さがr+6の値と同一の値が格納されている。
次に、i(1≦i≦3)、j(1≦j≦9)、k、m(1≦k,m≦3)に対して、図3に示す数値記憶部4の記憶装置55に格納されているアレイFj i+6の要素Fj i+6(k,m)の数値を、図3に示す読み取り部5を用いて読み取り、記憶装置58のアレイVの要素Vj i(k,m)に格納する。
ΣΣΣCi(j+p−1,k+q−1)×Vr i(j,k)
と表される。1番目の総和記号Σはiに対しての総和を求め、2番目の総和記号Σはjに対しての総和を求め、3番目の総和記号Σはkに対しての総和を求める。そして、p(1≦p≦6)、q(1≦q≦6)、r(1≦r≦9)の組それぞれに対して算出された総和と、記憶装置70のアレイDrの要素Dr(p,q)に格納されている数値との和を改めて要素Dr(p,q)に格納する。この処理に於いて各々のi(i=1,2,3)に対する積和の算出は並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。また、各々のr(r=1,・・・,9)に対する処理も並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。
そして、1≦i≦2、1≦j≦3、1≦k,m≦4に対して、図13乃至図18を参照して説明した処理に於ける、アレイEj iの要素Ej i(k,m)に格納されている数値の読み取りに関して、要素Ej i(k,m)を要素Ej+9 i(k,m)と読み替えた処理を行う。この処理の終了した状態で、p(1≦p≦8)、q(1≦q≦8)、r(1≦r≦3)の組それぞれに対して、記憶装置50のアレイCrの要素Cr(p,q)には処理層30の出力の内の深さがr+9の値と同一の値が格納されている。
次に、i(1≦i≦3)、j(1≦j≦9)、k。m(1≦k,m≦3)に対して、図3に示す数値記憶部4の記憶装置55に格納されているアレイFj i+9の要素Fj i+9(k,m)の数値を、図3に示す読み取り部5を用いて読み取り、記憶装置58のアレイVj iの要素Vj i(k,m)に格納する。
ΣΣΣCi(j+p−1,k+q−1)×Vr i(j,k)
と表される。1番目の総和記号Σはiに対しての総和を求め、2番目の総和記号Σはjに対しての総和を求め、3番目の総和記号Σはkに対しての総和を求める。そして、p(1≦p≦6)、q(1≦q≦6)、r(1≦r≦9)の組それぞれに対して算出された値と、記憶装置70のアレイDrの要素Dr(p,q)に格納されている数値との和が算出される。この処理に於いて各々のi(i=1.2.3)に対する積和の算出は並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。そして、上記和に処理層60のバイアス値B2rを加え、必要に応じて発火関数処理を施した値を改めて要素Dr(p,q)に格納する。なお、これらの処理に於いて各々のr(r=1.・・・,9)に対する処理は並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。この状態で、p(1≦p≦6)、q(1≦q≦6)、r(1≦r≦9)の組それぞれに対して、記憶装置70に格納されているアレイDrの要素Dr(p,q)には処理層60の出力の内の深さがrの値と同一の値が格納されている。
第3実施形態による演算処理装置1について図20乃至図23を参照して説明する。この実施形態の演算処理装置は、第1実施形態の演算処理装置1に於いて、記憶装置58の核の個数が異なっている。第1実施形態においては、記憶装置58の核の個数は処理層60の出力の深さ、すなわち記憶装置70のアレイの深さに等しかった。しかし、第3実施形態に於いては、図20に示す様に、記憶装置58に格納される核の個数が3であるとしている。記憶装置58に格納される核Vi(i=1,2,3)はそれぞれ、3行3列に配置されたアレイVi 1、Vi 2、Vi 3を有している。
先ず、i(1≦i≦8)、j(1≦j≦3)、k、m(1≦k,m≦4)に対して、図3に示す数値記憶部4の記憶装置35に格納されているアレイEj iの要素Ej i(k,m)の数値を、図3に示す読み取り部5を用いて読み取り、記憶装置40に格納されるアレイWj iの要素Wj i(k,m)に格納する。
ΣΣΣAi(j+p−1,k+q−1)×Wr i(j,k)
と表される。1番目の総和記号Σはiに対しての総和を求め、2番目の総和記号Σはjに対しての総和を求め、3番目の総和記号Σはkに対しての総和を求める。この総和は、p(1≦p≦8)、q(1≦q≦8)、r(1≦r≦3)の組それぞれに対して求められる。この処理に於いて各々のi(i=1,・・・,8)に対する積和の算出は並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。そして、上記総和に処理層30のバイアス値B1rを加え、必要に応じて発火関数処理を施した値を、記憶装置50のアレイC1の要素Cr(p,q)に格納する。なお、これらの処理に於いて各々のr(r=1,2,3)に対する処理は並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。この状態で、p(1≦p≦8)、q(1≦q≦8)、r(1≦r≦3)の組それぞれに対して、記憶装置50のアレイCrの要素Cr(p,q)には処理層30の出力の内の深さがrの値と同一の値が格納されている。
次に、i(1≦i≦3)、j(1≦j≦3)、k、m(1≦k,m≦3)に対して、図3に示す数値記憶部4の記憶装置55に格納されているアレイFj iの要素Fj i(k,m)の数値を、図3に示す読み取り部5を用いて読み取り、記憶装置58のアレイVj iの要素Vj i(k,m)に格納する。
ΣΣΣCi(j+p−1,k+q−1)×Vr i(j,k)
と表される。1番目の総和記号Σはiに対しての総和を求め、2番目の総和記号Σはjに対しての総和を求め、3番目の総和記号Σはkに対しての総和を求める。p(1≦p≦6)、q(1≦q≦6)、r(1≦r≦3)の組それぞれに対して算出した総和は、記憶装置70のアレイDrの要素Dr(p,q)に格納する。この処理の終了した状態を図21に示す。この処理に於いて各々のi(i=1,2,3)に対する積和の算出は並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。また、各々のr(r=1,2,3)に対する処理も並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。
ΣΣΣCi(j+p−1,k+q−1)×Vr i(j,k)
と表される。1番目の総和記号Σはiに対しての総和を求め、2番目の総和記号Σはjに対しての総和を求め、3番目の総和記号Σはkに対しての総和を求める。p(1≦p≦6)、q(1≦q≦6)、r(1≦r≦3)の組それぞれに対して算出した総和は、記憶装置70のアレイDr+3の要素Dr+3(p,q)に格納する。この処理の終了した状態を図22に示す。この処理に於いて各々のi(i=1,2,3)に対する積和の算出は並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。また、各々のr(r=1,2,3)に対する処理も並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。
ΣΣΣCi(j+p−1,k+q−1)×Vr i(j,k)
と表される。1番目の総和記号Σはiに対しての総和を求め、2番目の総和記号Σはjに対しての総和を求め、3番目の総和記号Σはkに対しての総和を求める。p(1≦p≦6)、q(1≦q≦6)、r(1≦r≦3)の組それぞれに対して求めた値は、記憶装置70のアレイDr+6の要素Dr+6(p,q)に格納する。この処理の終了した状態を図23に示す。この処理に於いて各々のi(i=1,2,3)に対する積和の算出は並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。また、各々のr(r=1,2,3)に対する処理も並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。
引き続いて、i(1≦i≦8)、j(1≦j≦3)、k,m(1≦k,m≦4)に対して、図3に示す数値記憶部4の記憶装置35に格納されたアレイEj+3 iの要素Ej+3 i(k,m)の数値を、図3に示す読み取り部5を用いて読み取り、記憶装置40のアレイWj iの要素Wj i(k,m)に格納する。
ΣΣΣAi(j+p−1,k+q−1)×Wr i(j,k)
と表される。1番目の総和記号Σはiに対しての総和を求め、2番目の総和記号Σはjに対しての総和を求め、3番目の総和記号Σはkに対しての総和を求める。この処理に於いて各々のi(i=1,・・・,8)に対する積和の算出は並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。そして、p(1≦p≦8)、q(1≦q≦8)、r(1≦r≦3)の組それぞれに対して算出した値に処理層30のバイアス値B1r+3を加え、必要に応じて発火関数処理を施した値を、記憶装置50のアレイCrの要素Cr(p,q)に格納する。なお、これらの処理に於いて各々のr(r=1,2,3)に対する処理は並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。この状態で、p(1≦p≦8)、q(1≦q≦8)、r(1≦r≦3)の組それぞれに対して、記憶装置50のアレイCrの要素Cr(p,q)には処理層30の出力の内の深さがr+3の値と同一の値が格納されている。
次に、i(1≦i≦3)、j(1≦j≦3)、k、m(1≦k,m≦3)に対して、図3に示す数値記憶部4の記憶装置55のアレイFj i+3の要素Fj i+3(k,m)の数値を、図3に示す読み取り部5を用いて読み取り、記憶装置58のアレイVj iの要素Vj i(k,m)に格納する。
ΣΣΣCi(j+p−1,k+q−1)×Vr i(j,k)
と表される。1番目の総和記号Σはiに対しての総和を求め、2番目の総和記号Σはjに対しての総和を求め、3番目の総和記号Σはkに対しての総和を求める。p(1≦p≦6)、q(1≦q≦6)、r(1≦r≦3)の組それぞれに対して求めた値と、記憶装置70のアレイDrの要素Dr(p,q)との和を改めて要素Dr(p,q)に格納する。この処理に於いて各々のi(i=1,2,3)に対する積和の算出は並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。また、各々のr(r=1,2,3)に対する処理も並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。
ΣΣΣCi(j+p−1,k+q−1)×Vr i(j,k)
と表される。1番目の総和記号Σはiに対しての総和を求め、2番目の総和記号Σはjに対しての総和を求め、3番目の総和記号Σはkに対しての総和を求める。p(1≦p≦6)、q(1≦q≦6)、r(1≦r≦3)の組それぞれに対して求めた値と記憶装置70のアレイDrの要素Dr+3(p,q)との和を改めて要素Dr+3(p,q)に格納する。この処理に於いて各々のi(i=1,2、3)に対する積和の算出は並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。また、各々のr(r=1,2,3)に対する処理も並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。
ΣΣΣCi(j+p−1,k+q−1)×Vr i(j,k)
と表される。1番目の総和記号Σはiに対しての総和を求め、2番目の総和記号Σはjに対しての総和を求め、3番目の総和記号Σはkに対しての総和を求める。p(1≦p≦6)、q(1≦q≦6)、r(1≦r≦3)の組それぞれに対して求められた値と、記憶装置70のアレイDrの要素Dr+6(p,q)との和を改めて要素Dr+6(p,q)に格納する。この処理に於いて各々のi(i=1,2,3)に対する積和の算出は並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。また、各々のr(r=1,2,3)に対する処理も並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。
引き続いて、i(1≦i≦8)、j(1≦j≦3)、k。m(1≦k,m≦4)に対して、図3に示す数値記憶部4の記憶装置35のアレイEj+6 iの要素Ej+6 i(k,m)の数値を、図3に示す読み取り部5を用いて読み取り、記憶装置40のアレイWj iの要素Wj i(k,m)に格納する。
ΣΣΣAi(j+p−1,k+q−1)×Wr i(j,k)
と表される。1番目の総和記号Σはiに対しての総和を求め、2番目の総和記号Σはjに対しての総和を求め、3番目の総和記号Σはkに対しての総和を求める。この処理に於いて各々のi(i=1,・・・,8)に対する積和の算出は並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。そして、p(1≦p≦8)、q(1≦q≦8)、r(1≦r≦3)の組それぞれに対して算出した値に処理層30のバイアス値B1r+6を加え、必要に応じて発火関数処理を施した値を記憶装置50のアレイCrの要素Cr(p,q)に格納する。なお、これらの処理に於いて各々のr(r=1,2,3)に対する処理は並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。この状態で、p(1≦p≦8)、q(1≦q≦8)、r(1≦r≦3)に対して、記憶装置Crの要素Cr(p,q)には処理層30の出力の内の深さがr+6の値と同一の値が格納されている。
次に、i(1≦i≦3)、j(1≦j≦3)、k,m(1≦k,m≦3)に対して、図3に示す数値記憶部4の記憶装置55のアレイFj i+6の要素Fj i+6(k,m)の数値を、図3に示す読み取り部5を用いて読み取り、記憶装置58のアレイVj iの要素Vj i(k,m)に格納する。
ΣΣΣCi(j+p−1,k+q−1)×Vr i(j,k)
と表される。1番目の総和記号Σはiに対しての総和を求め、2番目の総和記号Σはjに対しての総和を求め、3番目の総和記号Σはkに対しての総和を求める。そして、p(1≦p≦6)、q(1≦q≦6)、r(1≦r≦3)の組それぞれに対して求めた値と、記憶装置70に格納されたアレイDrの要素Dr(p,q)との和を改めて要素Dr(p,q)に格納する。この処理に於いて各々のi(i=1,2,3)に対する積和の算出は並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。また、各々のr(r=1,2,3)に対する処理も並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。
ΣΣΣCi(j+p−1,k+q−1)×Vr i(j,k)
と表される。1番目の総和記号Σはiに対しての総和を求め、2番目の総和記号Σはjに対しての総和を求め、3番目の総和記号Σはkに対しての総和を求める。そして、p(1≦p≦6)、q(1≦q≦6)、r(1≦r≦3)の組それぞれに対して求めた値と、記憶装置70のアレイDrの要素Dr+3(p,q)との和を改めて要素Dr+3(p,q)に格納する。この処理に於いて各々のi(i=1,2,3)に対する積和の算出は並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。また、各々のr(r=1,2,3)に対する処理も並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。
ΣΣΣCi(j+p−1,k+q−1)×Vr i(j,k)
と表される。1番目の総和記号Σはiに対しての総和を求め、2番目の総和記号Σはjに対しての総和を求め、3番目の総和記号Σはkに対しての総和を求める。そして、p(1≦p≦6)、q(1≦q≦6)、r(1≦r≦3)の組それぞれに対して求めた値と、記憶装置70のアレイDrの要素Dr+6(p,q)との和を改めて要素Dr+6(p,q)に格納する。この処理に於いて各々のi(i=1,2,3)に対する積和の算出は並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。また、各々のr(r=1,2,3)に対する処理も並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。
引き続いて、i(1≦i≦8)、j(1≦j≦3)、k.m(1≦k,m≦4)に対して、図3に示す数値記憶部4の記憶装置35のアレイEj+9 iの要素Ej+9 i(k,m)の数値を、図3に示す読み取り部5を用いて読み取り、記憶装置40のアレイWj iの要素Wj i(k,m)に格納する。
ΣΣΣAi(j+p−1,k+q−1)×Wr i(j,k)
と表される。1番目の総和記号Σはiに対しての総和を求め、2番目の総和記号Σはjに対しての総和を求め、3番目の総和記号Σはkに対しての総和を求める。この処理に於いて各々のi(i=1,・・・,8)に対する積和の算出は並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。そして、p(1≦p≦8)、q(1≦q≦8)、r(1≦r≦3)の組それぞれに対して算出した値に処理層30のバイアス値B1r+9を加え、必要に応じて発火関数処理を施した値を、記憶装置50のアレイCrの要素Cr(p,q)に格納する。なお、これらの処理に於いて各々のr(r=1,2,3)に対する処理は並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。この状態で、p(1≦p≦8)、q(1≦q≦8)、r(1≦r≦3)の組それぞれに対して、記憶装置50のアレイCrの要素Cr(p,q)には処理層30の出力の内の深さがr+9の値と同一の値が格納されている。
次に、i(1≦i≦3)、j(1≦j≦3)、k、m(1≦k,m≦3)に対して、図3に示す数値記憶部4の記憶装置55に格納されたアレイFj i+9の要素Fj i+9(k,m)の数値を、図3に示す読み取り部5を用いて読み取り、記憶装置58のアレイVj iの要素Vj i(k,m)に格納する。
ΣΣΣCi(j+p−1,k+q−1)×Vr i(j,k)
と表される。1番目の総和記号Σはiに対しての総和を求め、2番目の総和記号Σはjに対しての総和を求め、3番目の総和記号Σはkに対しての総和を求める。そして、p(1≦p≦6)、q(1≦q≦6)、r(1≦r≦3)の組それぞれに対して求めた値と、記憶装置70のアレイDrの要素Dr(p,q)との和を算出する。その後、この和に処理層60のバイアス値B2rを加え、必要に応じて発火関数処理を施した値を改めて要素Dr(p,q)に格納する。この処理に於いて各々のi(i=1,2,3)に対する積和の算出は並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。また、各々のr(r=1,2,3)に対する処理も並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。
ΣΣΣCi(j+p−1,k+q−1)×Vr i(j,k)
と表される。1番目の総和記号Σはiに対しての総和を求め、2番目の総和記号Σはjに対しての総和を求め、3番目の総和記号Σはkに対しての総和を求める。そして、p(1≦p≦6)、q(1≦q≦6)、r(1≦r≦3)の組それぞれに対して求めた値と、記憶装置70に格納されたアレイDrの要素Dr+3(p,q)との和を算出する。その後、上記和に、処理層60のバイアス値B2r+3を加え、必要に応じて発火関数処理を施した値を改めて要素Dr+3(p,q)に格納する。この処理に於いて各々のi(i=1,2,3)に対する積和の算出は並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。また、各々のr(r=1,2,3)に対する処理も並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。
ΣΣΣCi(j+p−1,k+q−1)×Vr i(j,k)
と表される。1番目の総和記号Σはiに対しての総和を求め、2番目の総和記号Σはjに対しての総和を求め、3番目の総和記号Σはkに対しての総和を求める。そして、p(1≦p≦6)、q(1≦q≦6)、r(1≦r≦3)に対して求めた値と、記憶装置70のアレイDrの要素Dr+6(p,q)との和を算出する。その後、上記和に処理層60のバイアス値B2r+6を加え、必要に応じて発火関数処理を施した値を改めて要素Dr+6(p,q)に格納する。この処理に於いて各々のi(i=1,2,3)に対する積和の算出は並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。また、各々のr(r=1,2,3)に対する処理も並列に行うことも可能であり、その場合には処理時間の短縮すなわち動作の高速化が図られるという利点が得られる。この処理の終了した状態で、p(1≦p≦6)、q(1≦q≦6)、r(1≦r≦9)に対して、アレイDrの要素Dr(p,q)には処理層60の出力の内の深さがrの値と同一の値が格納されている。
Claims (10)
- 第1方向および前記第1方向に交差する第2方向に配列されたメモリ素子を有する第1アレイを少なくとも1個備えた組をm(m≧2)個有する第1記憶装置と、
前記第1方向および前記第2方向に配置されたメモリ素子を有する第2アレイを少なくとも1個備えた組をn(m>n≧1)個有する第2記憶装置と、
前記第1記憶装置の前記第1アレイのm個の組から前記第1アレイのn個の組を選択し、この選択した組に含まれる第1アレイのメモリ素子に記憶されたデータを読み出し、前記第2記憶装置の前記第2アレイのメモリ素子に格納する第1読み取り装置と、
前記第1方向および前記第2方向に配置されたメモリ素子を有する第3アレイを少なくとも1個備えた第3記憶装置と、
前記第1方向および前記第2方向に配置されたメモリ素子を有する第4アレイをk(m>k≧1)個有する第4記憶装置と、
前記第2記憶装置の前記第2アレイのメモリ素子に格納されたデータを用いて前記第3記憶装置の前記第3アレイに対して畳み込み処理を行い、前記第4記憶装置の前記第4アレイのメモリ素子に格納する第1処理層と、
を備えた演算処理装置。 - nはk以下である請求項1記載の演算処理装置。
- 前記第2記憶装置の各組における前記第2アレイの個数は、前記第1記憶装置の各組における前記第1アレイの個数以下である請求項1または2記載の演算処理装置。
- 前記第2アレイは前記第1および前記第2方向に配列されたメモリ素子の個数がそれぞれ前記第1アレイの前記第1および前記第2方向に配列されたメモリ素子の個数と同じである請求項1乃至3のいずれかに記載の演算処理装置。
- 前記第1方向および前記第2方向に配列されたメモリ素子を有する第5アレイを少なくとも1個備えた組をp(p≧2)個有する第5記憶装置と、
前記第1方向および前記第2方向に配置されたメモリ素子を有する第6アレイを少なくとも1個備えた組をq(p>q≧1)個有する第6記憶装置と、
前記第5記憶装置の前記第5アレイのp個の組から前記第5アレイのq個の組を選択し、この選択した組に含まれる第5アレイのメモリ素子に記憶されたデータを読み出し、前記第6記憶装置の前記第6アレイのメモリ素子に格納する第2読み取り装置と、
前記第1方向および前記第2方向に配置されたメモリ素子を有する第7アレイをr(p>r≧1)個有する第7記憶装置と、
前記第6記憶装置の前記第6アレイのメモリ素子に格納されたデータを用いて前記第4記憶装置の前記第4アレイに対して畳み込み処理を行い、前記第7記憶装置の前記第7アレイのメモリ素子に格納する第2処理層と、
を更に備え、
前記第6記憶装置の各組における前記第6アレイの個数は、前記第1記憶装置の各組における第1アレイの個数よりも少ない請求項1乃至4のいずれかに記載の演算処理装置。 - qはr以下である請求項5記載の演算処理装置。
- 前記第6記憶装置の各組における前記第6アレイの個数は、前記第4記憶装置の前記第4アレイの個数以下である請求項5または6記載の演算処理装置。
- 前記第6アレイは前記第1および前記第2方向に配列されたメモリ素子の個数がそれぞれ前記第5アレイの前記第1および前記第2方向に配列されたメモリ素子の個数と同じである請求項5乃至7のいずれかに記載の演算処理装置。
- 前記第2記憶装置における前記第2アレイの組の個数と、前記第4記憶装置の前記第4アレイの個数と、前記第6記憶装置の各組の前記第6アレイの個数と、が相等しい請求項7または8記載の演算処理装置。
- 前記第2記憶装置における前記第2アレイの組の個数は、前記第1記憶装置における前記第1アレイの組の個数の約数である請求項1乃至9のいずれかに記載の演算処理装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018051544A JP6749358B2 (ja) | 2018-03-19 | 2018-03-19 | 演算処理装置 |
US16/126,006 US10754920B2 (en) | 2018-03-19 | 2018-09-10 | Arithmetic processing device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018051544A JP6749358B2 (ja) | 2018-03-19 | 2018-03-19 | 演算処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019164520A JP2019164520A (ja) | 2019-09-26 |
JP6749358B2 true JP6749358B2 (ja) | 2020-09-02 |
Family
ID=67905630
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018051544A Active JP6749358B2 (ja) | 2018-03-19 | 2018-03-19 | 演算処理装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US10754920B2 (ja) |
JP (1) | JP6749358B2 (ja) |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AUPP779998A0 (en) * | 1998-12-18 | 1999-01-21 | Canon Kabushiki Kaisha | Continuous kernel image interpolation |
JP6314628B2 (ja) | 2014-04-28 | 2018-04-25 | 株式会社デンソー | 演算処理装置 |
JP6658033B2 (ja) | 2016-02-05 | 2020-03-04 | 富士通株式会社 | 演算処理回路、および情報処理装置 |
JP6708044B2 (ja) | 2016-07-28 | 2020-06-10 | 富士通株式会社 | 画像認識装置、画像認識プログラム、画像認識方法および認識装置 |
US20180046898A1 (en) * | 2016-08-11 | 2018-02-15 | Vivante Corporation | Zero Coefficient Skipping Convolution Neural Network Engine |
US10366328B2 (en) * | 2017-09-19 | 2019-07-30 | Gyrfalcon Technology Inc. | Approximating fully-connected layers with multiple arrays of 3x3 convolutional filter kernels in a CNN based integrated circuit |
US10817587B2 (en) * | 2017-02-28 | 2020-10-27 | Texas Instruments Incorporated | Reconfigurable matrix multiplier system and method |
US10558386B2 (en) * | 2017-09-22 | 2020-02-11 | Kabushiki Kaisha Toshiba | Operation device and operation system |
JP6839641B2 (ja) | 2017-11-17 | 2021-03-10 | 株式会社東芝 | 演算処理装置 |
US10803379B2 (en) * | 2017-12-12 | 2020-10-13 | Amazon Technologies, Inc. | Multi-memory on-chip computational network |
-
2018
- 2018-03-19 JP JP2018051544A patent/JP6749358B2/ja active Active
- 2018-09-10 US US16/126,006 patent/US10754920B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2019164520A (ja) | 2019-09-26 |
US10754920B2 (en) | 2020-08-25 |
US20190286685A1 (en) | 2019-09-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3373210B1 (en) | Transposing neural network matrices in hardware | |
JP7279226B2 (ja) | 代替ループ限界値 | |
US20230195831A1 (en) | Methods and systems for implementing a convolution transpose layer of a neural network | |
US10534607B2 (en) | Accessing data in multi-dimensional tensors using adders | |
CN111247527B (zh) | 在卷积神经网络模型中确定特征图像的方法和装置 | |
EP3602280B1 (en) | Accessing prologue and epilogue data | |
CN108304922B (zh) | 用于神经网络计算的计算设备和计算方法 | |
US10846365B2 (en) | Sparse matrix multiplication in associative memory device | |
JP7234185B2 (ja) | データを処理する方法及びその装置 | |
US9946539B1 (en) | Accessing data in multi-dimensional tensors using adders | |
US11562229B2 (en) | Convolution accelerator using in-memory computation | |
US20190228307A1 (en) | Method and apparatus with data processing | |
JP6839641B2 (ja) | 演算処理装置 | |
EP3093757B1 (en) | Multi-dimensional sliding window operation for a vector processor | |
JP7435602B2 (ja) | 演算装置および演算システム | |
JP6749358B2 (ja) | 演算処理装置 | |
KR101989793B1 (ko) | 컨볼루션 신경망을 위한 가속기 인식 가지 치기 방법 및 기록 매체 | |
CN111507456A (zh) | 具有卷积神经网络处理的方法和装置 | |
US20220230064A1 (en) | Calibration of analog circuits for neural network computing | |
CN111221500B (zh) | 大规模并行关联乘法器-累加器 | |
US10802799B2 (en) | Semiconductor device having plural operation circuits including multiplier and accumulator | |
US12026617B2 (en) | Neural network method and apparatus | |
US20210174178A1 (en) | Method and apparatus for processing data | |
JP7501617B2 (ja) | グループ化畳み込み処理定義変更装置、グループ化畳み込み処理定義変更方法およびグループ化畳み込み処理定義変更プログラム | |
US20230274140A1 (en) | Neural network method and apparatus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190819 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200514 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200710 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200811 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6749358 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |