CN103810137A - 一种基于多fpga平台的ncs算法并行化的方法 - Google Patents
一种基于多fpga平台的ncs算法并行化的方法 Download PDFInfo
- Publication number
- CN103810137A CN103810137A CN201410004881.4A CN201410004881A CN103810137A CN 103810137 A CN103810137 A CN 103810137A CN 201410004881 A CN201410004881 A CN 201410004881A CN 103810137 A CN103810137 A CN 103810137A
- Authority
- CN
- China
- Prior art keywords
- processing
- aperture
- sub
- fpga
- ncs
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 10
- 238000010586 diagram Methods 0.000 description 3
- 238000003384 imaging method Methods 0.000 description 2
- 230000017105 transposition Effects 0.000 description 2
- 208000004350 Strabismus Diseases 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
Images
Landscapes
- Stored Programmes (AREA)
Abstract
本发明涉及一种基于多FPGA平台的NCS算法并行化的方法,包括子孔径处理与合成孔径处理,所述子孔径处理与合成孔径处理通过两级流水线并行处理;所述子孔径处理中采用流水并行处理方式;所述子孔径处理与合成孔径处理中相互独立的若干数据处理任务分配在若干个芯片中并行执行。有益效果为:利用了多核硬件架构,将将运算任务划分为多个子任务分配到不同芯片的处理单元中分别处理,从而实现任务处理的并行化,有效的提高了片上软件的效率。
Description
技术领域
本发明涉及NCS算法的并行化方法,尤其涉及一种基于多FPGA平台的NCS算法并行化的方法。
背景技术
合成孔径雷达(SAR)成像已经广泛运用在国民经济和军事各个领域。常规的SAR成像算法有RD算法以及CS算法等,但是RD算法难以满足对分辨率要求高的大场景、大斜视的雷达成像要求,而CS算法在大斜视角的情况下将引起很大的散焦,因此NCS算法在此基础上应运而生。传统的串行算法效率比较低,很难达到实时成像的要求。引入子孔径结构的NCS算法,可以更好的适应更大的斜视角,并能更容易的进行任务并行化,提高效率。但是现有的NCS算法片上软件的运算效率低下,对存储器的读取速度以及处理器性能要求较高。
发明内容
本发明目的在于克服以上现有技术之不足,提供一种基于多FPGA平台的NCS算法并行化的方法,具体有以下技术方案实现:
所述基于多FPGA平台的NCS算法并行化的方法,包括子孔径处理与合成孔径处理,
所述子孔径处理与合成孔径处理通过两级流水线并行处理;
所述子孔径处理中采用流水并行处理方式;
所述子孔径处理与合成孔径处理中相互独立的若干数据处理任务分配在若干个芯片中并行执行。
所述基于多FPGA平台的NCS算法并行化的方法的进一步设计在于,所述芯片为FPGA芯片。
所述基于多FPGA平台的NCS算法并行化的方法的进一步设计在于,所述FPGA芯片为四片。
所述基于多FPGA平台的NCS算法并行化的方法的进一步设计在于,采用两片FPGA芯片做子孔径处理,另外两片做合成孔径,形成两级流水.
所述基于多FPGA平台的NCS算法并行化的方法的进一步设计在于,每片FPGA芯片内部集成4个运算簇单元,所述子孔径处理与合成孔径处理中的数据处理平均分配至各运算簇单元处理。
所述基于多FPGA平台的NCS算法并行化的方法的进一步设计在于,处理孔径部分的两片FPGA芯片,每片芯片处理半幅图的源数据,每次子孔径完成4M Byte的数据处理。
所述基于多FPGA平台的NCS算法并行化的方法的进一步设计在于,处理孔径部分的两片FPGA芯片分别处理奇数次的子孔径运算与偶数次的子孔径运算。
本发明的优点如下:
本发明提供的基于多FPGA平台的NCS算法并行化的方法充分利用了多核硬件架构,将将运算任务划分为多个子任务分配到不同芯片的处理单元中分别处理,从而实现任务处理的并行化,有效的提高了片上软件的效率。
附图说明
图1是多FPGA平台全互联示意图。
图2是NCS算法整体流程图。
图3是子孔径和合成孔径的流水图。
图4是子孔径流水图。
图5是子孔径并行化后的流程图。
图6是合成孔径并行化后的流程图。
具体实施方式
下面结合附图对本发明方案进行详细说明。
本实施例基于由4片Xilinx XC6VLX550T FPGA芯片构成的多FPGA平台,如图1所示,每片FPGA芯片内设计有基于4*4 2D mesh架构的异构多核原型芯片,数据位宽64位,通过FPGA间的高速通道将4*4 2D mesh架构扩展成16*16 2D mesh架构。每片FPGA芯片内集成4个运算簇单元和1个转置簇单元,完成NCS算法中的大量计算和转置。NCS算法的整体软件流程如图2所示。下面结合NCS算法,以数据量为32M Byte的图像规模为例,具体说明流水方法以及任务并行化方法。
本实施例提供的基于多FPGA平台的NCS算法并行化的方法,包括子孔径处理与合成孔径处理。其中,子孔径处理与合成孔径处理通过两级流水线并行处理;子孔径处理中采用流水并行处理方式;子孔径处理与合成孔径处理中相互独立的若干数据处理任务分配在若干个芯片中并行执行。
根据子孔径和合成孔径各自处理的数据量的大小,结合多FPGA平台现有硬件资源,采用两片FPGA做子孔径,另外两片做合成孔径,形成两级流水,流水方式见图3,实际成图时间将大大缩短。
另外子孔径部分由两片FPGA芯片完成,也是流水操作,每片芯片处理半幅图的源数据,每次子孔径完成4M Byte的数据处理。第一片FPGA芯片完成一幅图的第1,3,5,7次子孔径运算,第二片FPGA芯片完成一幅图的第2,4,6,8次子孔径运算,大大提高了处理数据的效率,子孔径流水方式如图4所示。
算法中涉及的大量运算由FPGA芯片内的运算簇单元完成,每片FPGA内有4个同构的运算簇单元,所以在任务划分时,综合考虑负载平衡以及通信调度等方面的问题,可以将运算任务平均划分到4个运算簇内,子孔径任务划分如图5,合成孔径任务划分如图6所示。
本实施例提供的基于多FPGA平台的NCS算法并行化的方法充分利用了多核硬件架构,将将运算任务划分为多个子任务分配到不同芯片的处理单元中分别处理,从而实现任务处理的并行化,有效的提高了片上软件的效率。
Claims (7)
1.一种基于多FPGA平台的NCS算法并行化的方法,特征在于包括子孔径处理与合成孔径处理,
所述子孔径处理与合成孔径处理通过两级流水线并行处理;
所述子孔径处理中采用流水并行处理方式;
所述子孔径处理与合成孔径处理中相互独立的若干数据处理任务分配在若干个芯片中并行执行。
2.根据权利要求1所述的基于多FPGA平台的NCS算法并行化的方法,其特征在于所述芯片为FPGA芯片。
3.根据权利要求1所述的基于多FPGA平台的NCS算法并行化的方法,其特征在于所述FPGA芯片为四片。
4.根据权利要求3所述的基于多FPGA平台的NCS算法并行化的方法,其特征在于采用两片FPGA芯片做子孔径处理,另外两片做合成孔径,形成两级流水。
5.根据权利要求4所述的基于多FPGA平台的NCS算法并行化的方法,其特征在于每片FPGA芯片内部集成4个运算簇单元,所述子孔径处理与合成孔径处理中的数据处理平均分配至各运算簇单元处理。
6.根据权利要求4所述的基于多FPGA平台的NCS算法并行化的方法,其特征在于对于处理孔径部分的两片FPGA芯片,每片芯片处理半幅图的源数据,每次子孔径完成4M Byte的数据处理。
7.根据权利要求6所述的基于多FPGA平台的NCS算法并行化的方法,其特征在于处理孔径部分的两片FPGA芯片分别处理奇数次的子孔径运算与偶数次的子孔径运算。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410004881.4A CN103810137A (zh) | 2014-01-07 | 2014-01-07 | 一种基于多fpga平台的ncs算法并行化的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410004881.4A CN103810137A (zh) | 2014-01-07 | 2014-01-07 | 一种基于多fpga平台的ncs算法并行化的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103810137A true CN103810137A (zh) | 2014-05-21 |
Family
ID=50706927
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410004881.4A Pending CN103810137A (zh) | 2014-01-07 | 2014-01-07 | 一种基于多fpga平台的ncs算法并行化的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103810137A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105824780A (zh) * | 2016-04-01 | 2016-08-03 | 浪潮电子信息产业股份有限公司 | 一种基于单机多fpga的并行开发方法 |
CN110399221A (zh) * | 2019-07-23 | 2019-11-01 | 江苏鼎速网络科技有限公司 | 数据处理方法、***及终端设备 |
CN111142938A (zh) * | 2019-11-20 | 2020-05-12 | 深圳先进技术研究院 | 一种异构芯片的任务处理方法、任务处理装置及电子设备 |
CN111736966A (zh) * | 2020-05-11 | 2020-10-02 | 深圳先进技术研究院 | 基于多板fpga异构***的任务部署方法及设备 |
CN113127173A (zh) * | 2021-04-21 | 2021-07-16 | 浙江大学 | 一种异构感知的集群调度方法及装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008127335A1 (en) * | 2007-04-13 | 2008-10-23 | Raytheon Company | Spotlight synthetic aperture radar system using fpga and corresponding method |
CN103116872A (zh) * | 2013-01-25 | 2013-05-22 | 西安电子科技大学 | 基于并行dsp的sar图像高速处理***及其方法 |
-
2014
- 2014-01-07 CN CN201410004881.4A patent/CN103810137A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008127335A1 (en) * | 2007-04-13 | 2008-10-23 | Raytheon Company | Spotlight synthetic aperture radar system using fpga and corresponding method |
CN103116872A (zh) * | 2013-01-25 | 2013-05-22 | 西安电子科技大学 | 基于并行dsp的sar图像高速处理***及其方法 |
Non-Patent Citations (2)
Title |
---|
吴勇 等: "大斜视SAR的改进NCS算法", 《***工程与电子技术》, vol. 32, no. 4, 30 April 2010 (2010-04-30), pages 749 - 753 * |
黄炎 等: "NCS算法的并行化设计实现", 《计算机工程与设计》, vol. 34, no. 11, 30 November 2013 (2013-11-30), pages 3867 - 3872 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105824780A (zh) * | 2016-04-01 | 2016-08-03 | 浪潮电子信息产业股份有限公司 | 一种基于单机多fpga的并行开发方法 |
CN110399221A (zh) * | 2019-07-23 | 2019-11-01 | 江苏鼎速网络科技有限公司 | 数据处理方法、***及终端设备 |
CN111142938A (zh) * | 2019-11-20 | 2020-05-12 | 深圳先进技术研究院 | 一种异构芯片的任务处理方法、任务处理装置及电子设备 |
WO2021097962A1 (zh) * | 2019-11-20 | 2021-05-27 | 深圳先进技术研究院 | 一种异构芯片的任务处理方法、任务处理装置及电子设备 |
WO2021115052A1 (zh) * | 2019-11-20 | 2021-06-17 | 深圳先进技术研究院 | 一种异构芯片的任务处理方法、任务处理装置及电子设备 |
CN111736966A (zh) * | 2020-05-11 | 2020-10-02 | 深圳先进技术研究院 | 基于多板fpga异构***的任务部署方法及设备 |
CN111736966B (zh) * | 2020-05-11 | 2022-04-19 | 深圳先进技术研究院 | 基于多板fpga异构***的任务部署方法及设备 |
CN113127173A (zh) * | 2021-04-21 | 2021-07-16 | 浙江大学 | 一种异构感知的集群调度方法及装置 |
CN113127173B (zh) * | 2021-04-21 | 2021-09-24 | 浙江大学 | 一种异构感知的集群调度方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110458279B (zh) | 一种基于fpga的二值神经网络加速方法及*** | |
CN108229645B (zh) | 卷积加速和计算处理方法、装置、电子设备及存储介质 | |
CN103810137A (zh) | 一种基于多fpga平台的ncs算法并行化的方法 | |
US11797853B2 (en) | Processing for multiple input data sets | |
CN108108809B (zh) | 一种针对卷积神经元网络进行推理加速的硬件架构及其工作方法 | |
CN108416437B (zh) | 用于乘加运算的人工神经网络的处理***及方法 | |
US10394929B2 (en) | Adaptive execution engine for convolution computing systems | |
Fan et al. | Fully sparse 3d object detection | |
US11989638B2 (en) | Convolutional neural network accelerating device and method with input data conversion | |
CN110751280A (zh) | 一种应用于卷积神经网络的可配置卷积加速器 | |
US11315344B2 (en) | Reconfigurable 3D convolution engine | |
Li et al. | An FPGA design framework for CNN sparsification and acceleration | |
US11789733B2 (en) | Instruction processing apparatus, acceleration unit, and server | |
JP6680454B2 (ja) | Lsiチップ積層システム | |
Gao et al. | IELAS: An ELAS-based energy-efficient accelerator for real-time stereo matching on FPGA platform | |
CN103257341A (zh) | 基于fpga的自聚焦算法快速实现方法 | |
CN110110849B (zh) | 基于图分割的行固定数据流映射方法 | |
CN104281636B (zh) | 海量报表数据并发分布式处理方法 | |
CN113158132A (zh) | 一种基于非结构化稀疏的卷积神经网络加速*** | |
WO2020232666A1 (zh) | 一种图像处理方法、终端、***以及计算机可读存储介质 | |
WO2023184754A1 (zh) | 可配置实时视差点云计算装置及方法 | |
CN116012657A (zh) | 一种基于神经网络的3d点云数据处理方法及加速器 | |
CN108564644B (zh) | 机载主被动三维影像实时成像装置及方法 | |
US20220343144A1 (en) | Server and accelerator for neural network computations | |
CN118014031A (zh) | 针对多个输入数据集的处理 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20140521 |