JP5853794B2 - 転置装置、転置方法、および転置プログラム - Google Patents
転置装置、転置方法、および転置プログラム Download PDFInfo
- Publication number
- JP5853794B2 JP5853794B2 JP2012062285A JP2012062285A JP5853794B2 JP 5853794 B2 JP5853794 B2 JP 5853794B2 JP 2012062285 A JP2012062285 A JP 2012062285A JP 2012062285 A JP2012062285 A JP 2012062285A JP 5853794 B2 JP5853794 B2 JP 5853794B2
- Authority
- JP
- Japan
- Prior art keywords
- axis
- arrays
- arithmetic
- transposition
- target data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T15/00—3D [Three Dimensional] image rendering
- G06T15/10—Geometric effects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/14—Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
- G06F17/141—Discrete Fourier transforms
- G06F17/142—Fast Fourier transforms, e.g. using a Cooley-Tukey type algorithm
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F7/76—Arrangements for rearranging, permuting or selecting data according to predetermined rules, independently of the content of the data
- G06F7/78—Arrangements for rearranging, permuting or selecting data according to predetermined rules, independently of the content of the data for changing the order of data flow, e.g. matrix transposition or LIFO buffers; Overflow or underflow handling therefor
- G06F7/785—Arrangements for rearranging, permuting or selecting data according to predetermined rules, independently of the content of the data for changing the order of data flow, e.g. matrix transposition or LIFO buffers; Overflow or underflow handling therefor having a sequence of storage locations each being individually accessible for both enqueue and dequeue operations, e.g. using a RAM
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computational Mathematics (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Analysis (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Algebra (AREA)
- Discrete Mathematics (AREA)
- Geometry (AREA)
- Computer Graphics (AREA)
- Complex Calculations (AREA)
- Measuring Magnetic Variables (AREA)
Description
図2は、実施の形態にかかる電磁界解析システムの一例を示す説明図である。電磁界解析システム200は、転置装置100と1または複数の演算装置Cとユーザ端末201とを含む。転置装置100は、演算装置Cとユーザ端末201と接続されている。
図3は、実施の形態にかかる転置装置100のハードウェア構成例を示すブロック図である。図3において、転置装置100は、CPU(Central Processing Unit)301と、ROM(Read Only Memory)302と、RAM(Random Access Memory)303と、磁気ディスクドライブ304と、磁気ディスク305と、光ディスクドライブ306と、光ディスク307と、ディスプレイ308と、I/F(Interface)309と、キーボード310と、マウス311と、スキャナ312と、プリンタ313と、を備えている。また、各構成部はバス320によってそれぞれ接続されている。
次に、図4を用いて、転置装置100の機能的構成例について説明する。
次に、図5を用いて、転置装置100による解析空間Aのデータの転置の実施例1について説明する。実施例1は、演算素子PEの使用効率が向上するように解析空間Aの単位空間Bを転置する具体例である。
次に、図6を用いて、剰余単位空間Bの割り振り順序について説明する。剰余単位空間Bとは、複数の演算素子PEの配列位置に対応するように解析空間Aを分割する場合に、同数に分割できずに余った単位空間Bである。
次に、図7〜図9を用いて、転置装置100が演算素子PEに実行させる電磁界解析について説明する。転置装置100は、演算素子PEに、下記式(1)〜式(6)に示すFDTD法の演算式を解かせることにより、割り振った空間に含まれる各単位空間Bにおける電磁界の値を算出させる。
次に、図10〜図12を用いて、実施例1にかかる電磁界解析処理の詳細な処理手順について説明する。
次に、図13を用いて、実施例1にかかる転置装置100による転置処理の詳細な処理手順について説明する。転置処理は、図10のステップS1003に示した処理である。
次に、図14を用いて、転置装置100による方向変換パターン決定処理の詳細な処理手順について説明する。
次に、図15および図16を用いて、転置装置100による解析空間Aのデータの転置の実施例2について説明する。実施例2は、演算素子PEの使用効率が向上するように解析空間Aの単位空間Bを転置する具体例である。
次に、実施例2にかかる電磁界解析処理の詳細な処理手順について説明する。ここで、実施例2にかかる電磁界解析処理は、図10〜図12を用いて説明した実施例1にかかる電磁界解析処理と同様の処理手順であるため、説明を省略する。
次に、図17を用いて、実施例2にかかる転置装置100による転置処理の詳細な処理手順について説明する。転置処理は、図10のステップS1003に示した処理である。
前記3次元解析対象データについて、前記3次元座標系の第1軸の方向の格子の配列数、第2軸の方向の格子の配列数、および第3軸の方向の格子の配列数を検出する検出部と、
前記検出部によって検出された各配列数と、前記複数の演算素子のうち行方向の演算素子群の配列数および列方向の演算素子群の配列数と、に基づいて、前記3次元解析対象データの格子群を転置する転置部と、
前記転置部によって転置された3次元解析対象データを前記演算装置に出力する出力部と、
を有することを特徴とする転置装置。
各配列数のうち最小配列数が、前記行方向の演算素子群の配列数および前記列方向の演算素子群の配列数よりも大きい場合、最大配列数になる前記3次元解析対象データの格子列の方向が、前記第1軸、前記第2軸および前記第3軸のうち、前記行方向および前記列方向のいずれにも対応していない軸の方向となるように、前記3次元解析対象データの格子群を転置することを特徴とする付記1に記載の転置装置。
最小配列数になる前記3次元解析対象データの格子列の方向が、前記第1軸、前記第2軸および前記第3軸のうち、前記行方向の演算素子群の配列数および前記列方向の演算素子群の配列数のうち配列数が最小となる配列方向に対応する軸の方向となるように、前記3次元解析対象データの格子群を転置することを特徴とする付記2に記載の転置装置。
各配列数のうち最大配列数が、前記行方向の演算素子群の配列数および前記列方向の演算素子群の配列数よりも小さい場合、最大配列数になる前記3次元解析対象データの格子列の方向が、前記第1軸、前記第2軸および前記第3軸のうち、前記行方向の演算素子群の配列数および前記列方向の演算素子群の配列数のうち配列数が最大となる配列方向に対応する軸の方向となるように、前記3次元解析対象データの格子群を転置することを特徴とする付記1に記載の転置装置。
最小配列数になる前記3次元解析対象データの格子列の方向が、前記第1軸、前記第2軸および前記第3軸のうち、前記行方向および前記列方向のいずれにも対応していない軸の方向となるように、前記3次元解析対象データの格子群を転置することを特徴とする付記4に記載の転置装置。
前記行方向の演算素子群および前記列方向の演算素子群のうち演算素子が多い第1の配列数が、各配列数のうち最小配列数よりも大きく、前記行方向の演算素子群および前記列方向の演算素子群のうち演算素子が少ない第2の配列数が、各配列数のうち最大配列数よりも小さい場合、最大配列数以下かつ最小配列数以上の中間配列数、および最大配列数のうち、前記第1の配列数に近い配列数になる前記3次元解析対象データの格子列の方向が、前記第1軸、前記第2軸および前記第3軸のうち、前記第1の配列数の配列方向に対応する軸の方向となるように、前記3次元解析対象データの格子群を転置することを特徴とする付記1に記載の転置装置。
中間配列数および最小配列数のうち、前記第2の配列数に近い配列数になる前記3次元解析対象データの格子列の方向が、前記第1軸、前記第2軸および前記第3軸のうち、前記第2の配列数の配列方向に対応する軸の方向となるように、前記3次元解析対象データの格子群を転置することを特徴とする付記6に記載の転置装置。
前記3次元解析対象データについて、前記3次元座標系の第1軸の方向の格子の配列数、第2軸の方向の格子の配列数、および第3軸の方向の格子の配列数を検出し、
検出された各配列数と、前記複数の演算素子のうち行方向の演算素子群の配列数および列方向の演算素子群の配列数と、に基づいて、前記3次元解析対象データの格子群を転置し、
転置された3次元解析対象データを前記演算装置に出力する、
処理を実行することを特徴とする転置方法。
前記3次元解析対象データについて、前記3次元座標系の第1軸の方向の格子の配列数、第2軸の方向の格子の配列数、および第3軸の方向の格子の配列数を検出し、
検出された各配列数と、前記複数の演算素子のうち行方向の演算素子群の配列数および列方向の演算素子群の配列数と、に基づいて、前記3次元解析対象データの格子群を転置し、
転置された3次元解析対象データを前記演算装置に出力する、
処理を実行させることを特徴とする転置プログラム。
C 演算装置
201 ユーザ端末
PE 演算素子
M 記憶装置
401 検出部
402 転置部
403 出力部
Claims (8)
- 行列状に配列された複数の演算素子と各演算素子に接続された記憶装置とを有し3次元座標系に存在する格子状の3次元解析対象データの電磁界解析処理を実行する演算装置を制御するコンピュータであって、
前記3次元解析対象データについて、前記3次元座標系の第1軸の方向の格子の配列数、第2軸の方向の格子の配列数、および第3軸の方向の格子の配列数を検出する検出部と、
前記検出部によって検出された各配列数のうち最小配列数が、前記複数の演算素子のうち行方向の演算素子群の配列数および列方向の演算素子群の配列数よりも大きい場合、最大配列数になる前記3次元解析対象データの格子列の方向が、前記第1軸、前記第2軸および前記第3軸のうち、前記行方向に対応する軸、および前記列方向に対応する軸のいずれとも異なる軸の方向となるように、前記3次元解析対象データの格子群を転置する転置部と、
前記転置部によって転置された3次元解析対象データを前記演算装置に出力する出力部と、
を有することを特徴とする転置装置。 - 前記転置部は、
最小配列数になる前記3次元解析対象データの格子列の方向が、前記第1軸、前記第2軸および前記第3軸のうち、前記行方向の演算素子群の配列数および前記列方向の演算素子群の配列数のうち配列数が最小となる配列方向に対応する軸の方向となるように、前記3次元解析対象データの格子群を転置することを特徴とする請求項1に記載の転置装置。 - 行列状に配列された複数の演算素子と各演算素子に接続された記憶装置とを有し3次元座標系に存在する格子状の3次元解析対象データの電磁界解析処理を実行する演算装置を制御するコンピュータであって、
前記3次元解析対象データについて、前記3次元座標系の第1軸の方向の格子の配列数、第2軸の方向の格子の配列数、および第3軸の方向の格子の配列数を検出する検出部と、
前記検出部によって検出された各配列数のうち最大配列数が、前記複数の演算素子のうち行方向の演算素子群の配列数および列方向の演算素子群の配列数よりも小さい場合、最大配列数になる前記3次元解析対象データの格子列の方向が、前記第1軸、前記第2軸および前記第3軸のうち、前記行方向の演算素子群の配列数および前記列方向の演算素子群の配列数のうち配列数が最大となる配列方向に対応する軸の方向となるように、前記3次元解析対象データの格子群を転置する転置部と、
前記転置部によって転置された3次元解析対象データを前記演算装置に出力する出力部と、
を有することを特徴とする転置装置。 - 前記転置部は、
最小配列数になる前記3次元解析対象データの格子列の方向が、前記第1軸、前記第2軸および前記第3軸のうち、前記行方向に対応する軸、および前記列方向に対応する軸のいずれとも異なる軸の方向となるように、前記3次元解析対象データの格子群を転置することを特徴とする請求項3に記載の転置装置。 - 行列状に配列された複数の演算素子と各演算素子に接続された記憶装置とを有し3次元座標系に存在する格子状の3次元解析対象データの電磁界解析処理を実行する演算装置を制御するコンピュータが、
前記3次元解析対象データについて、前記3次元座標系の第1軸の方向の格子の配列数、第2軸の方向の格子の配列数、および第3軸の方向の格子の配列数を検出し、
検出された各配列数のうち最小配列数が、前記複数の演算素子のうち行方向の演算素子群の配列数および列方向の演算素子群の配列数よりも大きい場合、最大配列数になる前記3次元解析対象データの格子列の方向が、前記第1軸、前記第2軸および前記第3軸のうち、前記行方向に対応する軸、および前記列方向に対応する軸のいずれとも異なる軸の方向となるように、前記3次元解析対象データの格子群を転置し、
転置された3次元解析対象データを前記演算装置に出力する、
処理を実行することを特徴とする転置方法。 - 行列状に配列された複数の演算素子と各演算素子に接続された記憶装置とを有し3次元座標系に存在する格子状の3次元解析対象データの電磁界解析処理を実行する演算装置を制御するコンピュータが、
前記3次元解析対象データについて、前記3次元座標系の第1軸の方向の格子の配列数、第2軸の方向の格子の配列数、および第3軸の方向の格子の配列数を検出し、
検出された各配列数のうち最大配列数が、前記複数の演算素子のうち行方向の演算素子群の配列数および列方向の演算素子群の配列数よりも小さい場合、最大配列数になる前記3次元解析対象データの格子列の方向が、前記第1軸、前記第2軸および前記第3軸のうち、前記行方向の演算素子群の配列数および前記列方向の演算素子群の配列数のうち配列数が最大となる配列方向に対応する軸の方向となるように、前記3次元解析対象データの格子群を転置し、
転置された3次元解析対象データを前記演算装置に出力する、
処理を実行することを特徴とする転置方法。 - 行列状に配列された複数の演算素子と各演算素子に接続された記憶装置とを有し3次元座標系に存在する格子状の3次元解析対象データの電磁界解析処理を実行する演算装置を制御するコンピュータに、
前記3次元解析対象データについて、前記3次元座標系の第1軸の方向の格子の配列数、第2軸の方向の格子の配列数、および第3軸の方向の格子の配列数を検出し、
検出された各配列数のうち最小配列数が、前記複数の演算素子のうち行方向の演算素子群の配列数および列方向の演算素子群の配列数よりも大きい場合、最大配列数になる前記3次元解析対象データの格子列の方向が、前記第1軸、前記第2軸および前記第3軸のうち、前記行方向に対応する軸、および前記列方向に対応する軸のいずれとも異なる軸の方向となるように、前記3次元解析対象データの格子群を転置し、
転置された3次元解析対象データを前記演算装置に出力する、
処理を実行させることを特徴とする転置プログラム。 - 行列状に配列された複数の演算素子と各演算素子に接続された記憶装置とを有し3次元座標系に存在する格子状の3次元解析対象データの電磁界解析処理を実行する演算装置を制御するコンピュータに、
前記3次元解析対象データについて、前記3次元座標系の第1軸の方向の格子の配列数、第2軸の方向の格子の配列数、および第3軸の方向の格子の配列数を検出し、
検出された各配列数のうち最大配列数が、前記複数の演算素子のうち行方向の演算素子群の配列数および列方向の演算素子群の配列数よりも小さい場合、最大配列数になる前記3次元解析対象データの格子列の方向が、前記第1軸、前記第2軸および前記第3軸のうち、前記行方向の演算素子群の配列数および前記列方向の演算素子群の配列数のうち配列数が最大となる配列方向に対応する軸の方向となるように、前記3次元解析対象データの格子群を転置し、
転置された3次元解析対象データを前記演算装置に出力する、
処理を実行させることを特徴とする転置プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012062285A JP5853794B2 (ja) | 2012-03-19 | 2012-03-19 | 転置装置、転置方法、および転置プログラム |
EP13150596.8A EP2642404A3 (en) | 2012-03-19 | 2013-01-09 | Transposing apparatus, method, and program |
US13/750,117 US9424683B2 (en) | 2012-03-19 | 2013-01-25 | Transposing apparatus, transposing method, and computer product |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012062285A JP5853794B2 (ja) | 2012-03-19 | 2012-03-19 | 転置装置、転置方法、および転置プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013196323A JP2013196323A (ja) | 2013-09-30 |
JP5853794B2 true JP5853794B2 (ja) | 2016-02-09 |
Family
ID=47594516
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012062285A Expired - Fee Related JP5853794B2 (ja) | 2012-03-19 | 2012-03-19 | 転置装置、転置方法、および転置プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US9424683B2 (ja) |
EP (1) | EP2642404A3 (ja) |
JP (1) | JP5853794B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103605633B (zh) * | 2013-09-22 | 2016-08-03 | 西安交通大学 | 一种粗网格大时间步时域有限差分方法 |
JP6544965B2 (ja) * | 2015-03-31 | 2019-07-17 | キヤノン株式会社 | 情報処理装置、情報処理方法およびプログラム |
CN111144042B (zh) * | 2019-12-09 | 2022-06-03 | 中山大学 | 片上时钟树电磁场仿真方法、***、装置和存储介质 |
US20230194636A1 (en) * | 2020-04-20 | 2023-06-22 | Bionaut Labs Ltd. | Systems and methods for magnetic configuration optimization |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06243113A (ja) * | 1993-02-19 | 1994-09-02 | Fujitsu Ltd | 並列計算機における計算モデルのマッピング法 |
JP3860514B2 (ja) | 2002-07-19 | 2006-12-20 | ソニー株式会社 | 回路解析システム及びその解析方法 |
JP2005252009A (ja) | 2004-03-04 | 2005-09-15 | Renesas Technology Corp | 粒子シミュレーション方法、プログラム及び粒子シミュレーション装置 |
US8117288B2 (en) * | 2004-10-12 | 2012-02-14 | International Business Machines Corporation | Optimizing layout of an application on a massively parallel supercomputer |
EP2116944A4 (en) | 2006-12-28 | 2014-09-03 | Fujitsu Ltd | SIMULATION SYSTEM AND PROGRAM AND RECORDING MEDIUM FOR THE PROGRAM |
US7979672B2 (en) * | 2008-07-25 | 2011-07-12 | International Business Machines Corporation | Multi-core processors for 3D array transposition by logically retrieving in-place physically transposed sub-array data |
JP5531420B2 (ja) | 2009-02-27 | 2014-06-25 | 日本電気株式会社 | プロセス割当システム、プロセス割当方法、プロセス割当プログラム |
JP5577745B2 (ja) * | 2010-02-25 | 2014-08-27 | 日本電気株式会社 | クラスタシステム、プロセス配置方法、及びプログラム |
-
2012
- 2012-03-19 JP JP2012062285A patent/JP5853794B2/ja not_active Expired - Fee Related
-
2013
- 2013-01-09 EP EP13150596.8A patent/EP2642404A3/en not_active Withdrawn
- 2013-01-25 US US13/750,117 patent/US9424683B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
EP2642404A2 (en) | 2013-09-25 |
EP2642404A3 (en) | 2016-01-27 |
JP2013196323A (ja) | 2013-09-30 |
US9424683B2 (en) | 2016-08-23 |
US20130241924A1 (en) | 2013-09-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5371221B2 (ja) | 粒子法シミュレーションのためのスライスデータ構造、およびスライスデータ構造を利用した粒子法シミュレーションのgpuへの実装方法 | |
EP2656208B1 (en) | Agile communication operator | |
JP5853794B2 (ja) | 転置装置、転置方法、および転置プログラム | |
JP6601222B2 (ja) | 行列演算プログラム、行列分割方法、及び並列処理装置 | |
JP2015530636A (ja) | 粒子流動のシミュレーションシステム及びその方法 | |
Meister et al. | Parallel memory-efficient adaptive mesh refinement on structured triangular meshes with billions of grid cells | |
JP7098793B2 (ja) | 因果関係表示システム及び方法 | |
Weber et al. | Efficient parallel extraction of crack-free isosurfaces from adaptive mesh refinement (AMR) data | |
JP2017162326A (ja) | 計算機、行列分解方法、及び行列分解プログラム | |
Brunhart-Lupo et al. | Simulation exploration through immersive parallel planes | |
CN113850917B (zh) | 三维模型体素化方法、装置、电子设备及存储介质 | |
Zhang et al. | Implementation of the system thermal-hydraulic code TRACE into SALOME platform for multi-scale coupling | |
JP2006285922A (ja) | 設計支援装置および設計支援方法 | |
EP3887953A1 (en) | Parallel processor data processing system with reduced latency | |
Salleh et al. | Computing for numerical methods using visual C++ | |
CN110556169A (zh) | 全堆芯子通道热工水力模拟的求解域划分方法 | |
JP6942007B2 (ja) | 画像処理装置、及びプログラム | |
Hamza et al. | An explicit level-set approach for structural topology optimization | |
JP5910230B2 (ja) | 設計支援プログラム、設計支援方法、および設計支援装置 | |
Sigrist et al. | Homogenisation method for the dynamic analysis of a complete nuclear steam generator with fluid–structure interaction | |
JP2017167581A (ja) | 並列計算機、fft演算プログラムおよびfft演算方法 | |
WO2020149919A1 (en) | Inertial damping for enhanced simulation of elastic bodies | |
CN112052516B (zh) | 基于序列摆放的组件布局随机采样方法 | |
Jamroz et al. | Asynchronous communication in spectral-element and discontinuous Galerkin methods for atmospheric dynamics–a case study using the High-Order Methods Modeling Environment (HOMME-homme_dg_branch) | |
Bauer et al. | In Situ and Post-Processing Volume Rendering with Cinema |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20141204 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150715 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150825 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151026 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20151110 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20151123 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5853794 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |