CN103810137A - 一种基于多fpga平台的ncs算法并行化的方法 - Google Patents

一种基于多fpga平台的ncs算法并行化的方法 Download PDF

Info

Publication number
CN103810137A
CN103810137A CN201410004881.4A CN201410004881A CN103810137A CN 103810137 A CN103810137 A CN 103810137A CN 201410004881 A CN201410004881 A CN 201410004881A CN 103810137 A CN103810137 A CN 103810137A
Authority
CN
China
Prior art keywords
processing
aperture
sub
fpga
ncs
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410004881.4A
Other languages
English (en)
Inventor
潘红兵
钱禹
李丽
郑昱
李磊
余慧
徐峰
黄炎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University
CETC 14 Research Institute
Original Assignee
Nanjing University
CETC 14 Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University, CETC 14 Research Institute filed Critical Nanjing University
Priority to CN201410004881.4A priority Critical patent/CN103810137A/zh
Publication of CN103810137A publication Critical patent/CN103810137A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Stored Programmes (AREA)

Abstract

本发明涉及一种基于多FPGA平台的NCS算法并行化的方法,包括子孔径处理与合成孔径处理,所述子孔径处理与合成孔径处理通过两级流水线并行处理;所述子孔径处理中采用流水并行处理方式;所述子孔径处理与合成孔径处理中相互独立的若干数据处理任务分配在若干个芯片中并行执行。有益效果为:利用了多核硬件架构,将将运算任务划分为多个子任务分配到不同芯片的处理单元中分别处理,从而实现任务处理的并行化,有效的提高了片上软件的效率。

Description

一种基于多FPGA平台的NCS算法并行化的方法
技术领域
本发明涉及NCS算法的并行化方法,尤其涉及一种基于多FPGA平台的NCS算法并行化的方法。
背景技术
合成孔径雷达(SAR)成像已经广泛运用在国民经济和军事各个领域。常规的SAR成像算法有RD算法以及CS算法等,但是RD算法难以满足对分辨率要求高的大场景、大斜视的雷达成像要求,而CS算法在大斜视角的情况下将引起很大的散焦,因此NCS算法在此基础上应运而生。传统的串行算法效率比较低,很难达到实时成像的要求。引入子孔径结构的NCS算法,可以更好的适应更大的斜视角,并能更容易的进行任务并行化,提高效率。但是现有的NCS算法片上软件的运算效率低下,对存储器的读取速度以及处理器性能要求较高。
发明内容
本发明目的在于克服以上现有技术之不足,提供一种基于多FPGA平台的NCS算法并行化的方法,具体有以下技术方案实现:
所述基于多FPGA平台的NCS算法并行化的方法,包括子孔径处理与合成孔径处理,
所述子孔径处理与合成孔径处理通过两级流水线并行处理;
所述子孔径处理中采用流水并行处理方式;
所述子孔径处理与合成孔径处理中相互独立的若干数据处理任务分配在若干个芯片中并行执行。
所述基于多FPGA平台的NCS算法并行化的方法的进一步设计在于,所述芯片为FPGA芯片。
所述基于多FPGA平台的NCS算法并行化的方法的进一步设计在于,所述FPGA芯片为四片。
所述基于多FPGA平台的NCS算法并行化的方法的进一步设计在于,采用两片FPGA芯片做子孔径处理,另外两片做合成孔径,形成两级流水.
所述基于多FPGA平台的NCS算法并行化的方法的进一步设计在于,每片FPGA芯片内部集成4个运算簇单元,所述子孔径处理与合成孔径处理中的数据处理平均分配至各运算簇单元处理。
所述基于多FPGA平台的NCS算法并行化的方法的进一步设计在于,处理孔径部分的两片FPGA芯片,每片芯片处理半幅图的源数据,每次子孔径完成4M Byte的数据处理。
所述基于多FPGA平台的NCS算法并行化的方法的进一步设计在于,处理孔径部分的两片FPGA芯片分别处理奇数次的子孔径运算与偶数次的子孔径运算。
本发明的优点如下:
本发明提供的基于多FPGA平台的NCS算法并行化的方法充分利用了多核硬件架构,将将运算任务划分为多个子任务分配到不同芯片的处理单元中分别处理,从而实现任务处理的并行化,有效的提高了片上软件的效率。
附图说明
图1是多FPGA平台全互联示意图。
图2是NCS算法整体流程图。
图3是子孔径和合成孔径的流水图。
图4是子孔径流水图。
图5是子孔径并行化后的流程图。
图6是合成孔径并行化后的流程图。
具体实施方式
下面结合附图对本发明方案进行详细说明。
本实施例基于由4片Xilinx XC6VLX550T FPGA芯片构成的多FPGA平台,如图1所示,每片FPGA芯片内设计有基于4*4 2D mesh架构的异构多核原型芯片,数据位宽64位,通过FPGA间的高速通道将4*4 2D mesh架构扩展成16*16 2D mesh架构。每片FPGA芯片内集成4个运算簇单元和1个转置簇单元,完成NCS算法中的大量计算和转置。NCS算法的整体软件流程如图2所示。下面结合NCS算法,以数据量为32M Byte的图像规模为例,具体说明流水方法以及任务并行化方法。
本实施例提供的基于多FPGA平台的NCS算法并行化的方法,包括子孔径处理与合成孔径处理。其中,子孔径处理与合成孔径处理通过两级流水线并行处理;子孔径处理中采用流水并行处理方式;子孔径处理与合成孔径处理中相互独立的若干数据处理任务分配在若干个芯片中并行执行。
根据子孔径和合成孔径各自处理的数据量的大小,结合多FPGA平台现有硬件资源,采用两片FPGA做子孔径,另外两片做合成孔径,形成两级流水,流水方式见图3,实际成图时间将大大缩短。
另外子孔径部分由两片FPGA芯片完成,也是流水操作,每片芯片处理半幅图的源数据,每次子孔径完成4M Byte的数据处理。第一片FPGA芯片完成一幅图的第1,3,5,7次子孔径运算,第二片FPGA芯片完成一幅图的第2,4,6,8次子孔径运算,大大提高了处理数据的效率,子孔径流水方式如图4所示。
算法中涉及的大量运算由FPGA芯片内的运算簇单元完成,每片FPGA内有4个同构的运算簇单元,所以在任务划分时,综合考虑负载平衡以及通信调度等方面的问题,可以将运算任务平均划分到4个运算簇内,子孔径任务划分如图5,合成孔径任务划分如图6所示。
本实施例提供的基于多FPGA平台的NCS算法并行化的方法充分利用了多核硬件架构,将将运算任务划分为多个子任务分配到不同芯片的处理单元中分别处理,从而实现任务处理的并行化,有效的提高了片上软件的效率。

Claims (7)

1.一种基于多FPGA平台的NCS算法并行化的方法,特征在于包括子孔径处理与合成孔径处理,
所述子孔径处理与合成孔径处理通过两级流水线并行处理;
所述子孔径处理中采用流水并行处理方式;
所述子孔径处理与合成孔径处理中相互独立的若干数据处理任务分配在若干个芯片中并行执行。
2.根据权利要求1所述的基于多FPGA平台的NCS算法并行化的方法,其特征在于所述芯片为FPGA芯片。
3.根据权利要求1所述的基于多FPGA平台的NCS算法并行化的方法,其特征在于所述FPGA芯片为四片。
4.根据权利要求3所述的基于多FPGA平台的NCS算法并行化的方法,其特征在于采用两片FPGA芯片做子孔径处理,另外两片做合成孔径,形成两级流水。
5.根据权利要求4所述的基于多FPGA平台的NCS算法并行化的方法,其特征在于每片FPGA芯片内部集成4个运算簇单元,所述子孔径处理与合成孔径处理中的数据处理平均分配至各运算簇单元处理。
6.根据权利要求4所述的基于多FPGA平台的NCS算法并行化的方法,其特征在于对于处理孔径部分的两片FPGA芯片,每片芯片处理半幅图的源数据,每次子孔径完成4M Byte的数据处理。
7.根据权利要求6所述的基于多FPGA平台的NCS算法并行化的方法,其特征在于处理孔径部分的两片FPGA芯片分别处理奇数次的子孔径运算与偶数次的子孔径运算。
CN201410004881.4A 2014-01-07 2014-01-07 一种基于多fpga平台的ncs算法并行化的方法 Pending CN103810137A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410004881.4A CN103810137A (zh) 2014-01-07 2014-01-07 一种基于多fpga平台的ncs算法并行化的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410004881.4A CN103810137A (zh) 2014-01-07 2014-01-07 一种基于多fpga平台的ncs算法并行化的方法

Publications (1)

Publication Number Publication Date
CN103810137A true CN103810137A (zh) 2014-05-21

Family

ID=50706927

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410004881.4A Pending CN103810137A (zh) 2014-01-07 2014-01-07 一种基于多fpga平台的ncs算法并行化的方法

Country Status (1)

Country Link
CN (1) CN103810137A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105824780A (zh) * 2016-04-01 2016-08-03 浪潮电子信息产业股份有限公司 一种基于单机多fpga的并行开发方法
CN110399221A (zh) * 2019-07-23 2019-11-01 江苏鼎速网络科技有限公司 数据处理方法、***及终端设备
CN111142938A (zh) * 2019-11-20 2020-05-12 深圳先进技术研究院 一种异构芯片的任务处理方法、任务处理装置及电子设备
CN111736966A (zh) * 2020-05-11 2020-10-02 深圳先进技术研究院 基于多板fpga异构***的任务部署方法及设备
CN113127173A (zh) * 2021-04-21 2021-07-16 浙江大学 一种异构感知的集群调度方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008127335A1 (en) * 2007-04-13 2008-10-23 Raytheon Company Spotlight synthetic aperture radar system using fpga and corresponding method
CN103116872A (zh) * 2013-01-25 2013-05-22 西安电子科技大学 基于并行dsp的sar图像高速处理***及其方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008127335A1 (en) * 2007-04-13 2008-10-23 Raytheon Company Spotlight synthetic aperture radar system using fpga and corresponding method
CN103116872A (zh) * 2013-01-25 2013-05-22 西安电子科技大学 基于并行dsp的sar图像高速处理***及其方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
吴勇 等: "大斜视SAR的改进NCS算法", 《***工程与电子技术》, vol. 32, no. 4, 30 April 2010 (2010-04-30), pages 749 - 753 *
黄炎 等: "NCS算法的并行化设计实现", 《计算机工程与设计》, vol. 34, no. 11, 30 November 2013 (2013-11-30), pages 3867 - 3872 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105824780A (zh) * 2016-04-01 2016-08-03 浪潮电子信息产业股份有限公司 一种基于单机多fpga的并行开发方法
CN110399221A (zh) * 2019-07-23 2019-11-01 江苏鼎速网络科技有限公司 数据处理方法、***及终端设备
CN111142938A (zh) * 2019-11-20 2020-05-12 深圳先进技术研究院 一种异构芯片的任务处理方法、任务处理装置及电子设备
WO2021097962A1 (zh) * 2019-11-20 2021-05-27 深圳先进技术研究院 一种异构芯片的任务处理方法、任务处理装置及电子设备
WO2021115052A1 (zh) * 2019-11-20 2021-06-17 深圳先进技术研究院 一种异构芯片的任务处理方法、任务处理装置及电子设备
CN111736966A (zh) * 2020-05-11 2020-10-02 深圳先进技术研究院 基于多板fpga异构***的任务部署方法及设备
CN111736966B (zh) * 2020-05-11 2022-04-19 深圳先进技术研究院 基于多板fpga异构***的任务部署方法及设备
CN113127173A (zh) * 2021-04-21 2021-07-16 浙江大学 一种异构感知的集群调度方法及装置
CN113127173B (zh) * 2021-04-21 2021-09-24 浙江大学 一种异构感知的集群调度方法及装置

Similar Documents

Publication Publication Date Title
CN110458279B (zh) 一种基于fpga的二值神经网络加速方法及***
CN108229645B (zh) 卷积加速和计算处理方法、装置、电子设备及存储介质
CN103810137A (zh) 一种基于多fpga平台的ncs算法并行化的方法
US11797853B2 (en) Processing for multiple input data sets
CN108108809B (zh) 一种针对卷积神经元网络进行推理加速的硬件架构及其工作方法
CN108416437B (zh) 用于乘加运算的人工神经网络的处理***及方法
US10394929B2 (en) Adaptive execution engine for convolution computing systems
Fan et al. Fully sparse 3d object detection
US11989638B2 (en) Convolutional neural network accelerating device and method with input data conversion
CN110751280A (zh) 一种应用于卷积神经网络的可配置卷积加速器
US11315344B2 (en) Reconfigurable 3D convolution engine
Li et al. An FPGA design framework for CNN sparsification and acceleration
US11789733B2 (en) Instruction processing apparatus, acceleration unit, and server
JP6680454B2 (ja) Lsiチップ積層システム
Gao et al. IELAS: An ELAS-based energy-efficient accelerator for real-time stereo matching on FPGA platform
CN103257341A (zh) 基于fpga的自聚焦算法快速实现方法
CN110110849B (zh) 基于图分割的行固定数据流映射方法
CN104281636B (zh) 海量报表数据并发分布式处理方法
CN113158132A (zh) 一种基于非结构化稀疏的卷积神经网络加速***
WO2020232666A1 (zh) 一种图像处理方法、终端、***以及计算机可读存储介质
WO2023184754A1 (zh) 可配置实时视差点云计算装置及方法
CN116012657A (zh) 一种基于神经网络的3d点云数据处理方法及加速器
CN108564644B (zh) 机载主被动三维影像实时成像装置及方法
US20220343144A1 (en) Server and accelerator for neural network computations
CN118014031A (zh) 针对多个输入数据集的处理

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20140521