CN110378834A - 一种基于异构并行架构的快速通视分析方法 - Google Patents

一种基于异构并行架构的快速通视分析方法 Download PDF

Info

Publication number
CN110378834A
CN110378834A CN201910673306.6A CN201910673306A CN110378834A CN 110378834 A CN110378834 A CN 110378834A CN 201910673306 A CN201910673306 A CN 201910673306A CN 110378834 A CN110378834 A CN 110378834A
Authority
CN
China
Prior art keywords
detected
flux
vector splitting
memory
target area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910673306.6A
Other languages
English (en)
Inventor
郭茂耘
安翼尧
梁皓星
汪梦倩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University
Original Assignee
Chongqing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University filed Critical Chongqing University
Priority to CN201910673306.6A priority Critical patent/CN110378834A/zh
Publication of CN110378834A publication Critical patent/CN110378834A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/20Processor architectures; Processor configuration, e.g. pipelining
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/60Memory management

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Instructional Devices (AREA)

Abstract

本发明涉及一种基于异构并行架构的快速通视分析方法,一种基于异构并行架构的快速通视分析方法。该方法步骤为:通过检测待分析区域内地理高程数据,利用适用于异构并行加速的通视分析方法,通过异构通用计算编程架构在GPU中进行通视分析处理,以实现对目标区域快速进行通视分析的目的,以保证场景真实性,提高场景检测效率,充分利用GPU多处理器资源。本发明通过异构通用计算编程架构在GPU中进行通视分析处理,以实现对目标区域快速进行通视分析的目的,以保证场景真实性,提高场景检测效率,充分利用GPU多处理器资源。

Description

一种基于异构并行架构的快速通视分析方法
技术领域
本发明属于通视分析领域,涉及一种基于异构并行架构的快速通视分析方法。
背景技术
传统的通视分析是通过逐点检测中心点可视性,直至整个检测区域内的所有点都完成分析。可是传统方法并不适用于大范围的检测环境中,由于以这样的方法在大规模通视分析过程中,检测所需时间过长。
发明内容
有鉴于此,本发明的目的在于提供一种基于异构并行架构的快速通视分析方法。
为达到上述目的,本发明提供如下技术方案:
一种基于异构并行架构的快速通视分析方法,该方法步骤为:利用适用于异构并行加速的通视分析方法,获取选定的待检测目标区域内的地理高程数据并利用显示存储器进行高程数据提取与存储,通过基于图形处理器GPU的通用计算方法,简化通视分析处理过程,允许选定的待检测目标区域中心点与各待检测目标点同时进行通视分析处理;
具体为:
S1:设置待检测目标区域中心点位置存储器与待检测目标点位置存储器,分别用于存储待检测目标区域中心点与待检测目标点所在位置,为后续通视分析作为支撑;
S2:根据位置存储器中数据,在待检测目标区域中心点与待检测目标点间构建连接线,判断在连线段上是否发生地形穿越,并将检测结果存储于通视分析结果存储器中;
S3:根据结果存储器中的结果,判断待检测目标区域中心点与待检测目标点间能否通视。
进一步,所述获取选定的待检测目标区域内的地理高程数据并利用显示存储器进行高程数据提取与存储为:
在主机端,首先通过对选定的待检测目标区域进行遍历获取场景中相应的地理高程数据,再将待处理的高程数据存储在高速存储器中,当进行通视分析时,直接从纹理寄存器中提取和调用数据。
进一步,所述基于图形处理器GPU的通用计算方法:
根据异构并行通用计算编程架构,进行数据结构的安排,待检测目标区域中心点与每个待检测目标点对应一个单一的线程块Block,而各线程块有统一的构成一个网格,在进行通视分析过程中,每个Thread均对应于Kernel程序,从而使各个线程并行完成待检测目标区域中心点与每个待检测目标点的通视分析。
进一步,还包括以下步骤:
S41:在主机端对待检测目标区域进行高程数据遍历,获取整个区域内地理高程数据,拷贝到设备端等待处理;
S42:根据待检测目标区域内高程数据量,在设备端分配存储空间,即按照高程数据量分配存储块,设待检测目标点个数为n,在设备端分配n个存储单元,每一个存储单元对应存储一个待检测目标点与区域中心点;由GPU中线程与存储块的关系得到,每一个存储块由多个存储单元构成;每一对通视检测点都对应一个存储单元,每一个存储块对应一个线程块,一个待检测目标点与区域中心点的通视分析检测过程对应于线程块中的一个处理线程;
S43:当设备端存储空间分配结束,利用通视分析的相关算法,对每个处理线程进行计算,以完成相关的通视分析检测操作;
S44:待通视分析处理结束,将设备端的实验结果拷贝回主机端,并显示结果相关检测结果。
本发明的有益效果在于:本发明通过异构通用计算编程架构在GPU中进行通视分析处理,以实现对目标区域快速进行通视分析的目的,以保证场景真实性,提高场景检测效率,充分利用GPU多处理器资源
附图说明
为了使本发明的目的、技术方案和有益效果更加清楚,本发明提供如下附图进行说明:
图1为适用于异构并行加速的通视分析方法流程图;
图2为基于CUDA算法的快速通视分析流程简图;
图3为设备端存储空间分配。
具体实施方式
下面将结合附图,对本发明的优选实施例进行详细的描述。
一种基于异构并行架构的快速通视分析方法,该方法步骤为:利用适用于异构并行加速的通视分析方法,获取选定的待检测目标区域内的地理高程数据并利用显示存储器进行高程数据提取与存储,通过基于图形处理器GPU的通用计算方法,简化通视分析处理过程,允许选定的待检测目标区域中心点与各待检测目标点同时进行通视分析处理;
具体为:
S1:设置待检测目标区域中心点位置存储器与待检测目标点位置存储器,分别用于存储待检测目标区域中心点与待检测目标点所在位置,为后续通视分析作为支撑;
S2:根据位置存储器中数据,在待检测目标区域中心点与待检测目标点间构建连接线,判断在连线段上是否发生地形穿越,并将检测结果存储于通视分析结果存储器中;
S3:根据结果存储器中的结果,判断待检测目标区域中心点与待检测目标点间能否通视。
所在选定的待检测目标区域内获取相应的地理高程数据并利用显示存储器进行高程数据提取与存储为:在主机端,首先通过对选定的待检测目标区域进行遍历获取场景中相应的地理高程数据,再将待处理的高程数据存储在高速存储器中,当进行通视分析时,直接从纹理寄存器中提取和调用数据。
所述基于图形处理器GPU的通用计算方法为:根据异构并行通用计算编程架构,进行数据结构的安排,待检测目标区域中心点与每个待检测目标点对应一个单一的线程块Block,而各线程块有统一的构成一个网格,在进行通视分析过程中,每个Thread均对应于Kernel程序,从而使各个线程并行完成待检测目标区域中心点与每个待检测目标点的通视分析。
该方法还包括以下步骤:
S41:在主机端对待检测目标区域进行高程数据遍历,获取整个区域内地理高程数据,拷贝到设备端等待处理;
S42:根据待检测目标区域内高程数据量,在设备端分配存储空间,即按照高程数据量分配存储块,设待检测目标点个数为n,在设备端分配n个存储单元,每一个存储单元对应存储一个待检测目标点与区域中心点;由GPU中线程与存储块的关系得到,每一个存储块由多个存储单元构成;每一对通视检测点都对应一个存储单元,每一个存储块对应一个线程块,一个待检测目标点与区域中心点的通视分析检测过程对应于线程块中的一个处理线程;
S43:当设备端存储空间分配结束,利用通视分析的相关算法,对每个处理线程进行计算,以完成相关的通视分析检测操作;
S44:待通视分析处理结束,将设备端的实验结果拷贝回主机端,并显示结果相关检测结果。
实施例
首先,设置待检测目标区域中心点位置存储器与待检测目标点位置存储器,分别用于存储待检测目标区域中心点与待检测目标点所在位置,为后续通视分析作为支撑。
其次,根据位置存储器中数据,在待检测目标区域中心点与待检测目标点间构建连接线,判断在连线段上是否发生地形穿越,并将检测结果存储于通视分析结果存储器中。
之后,根据结果存储器中的结果,判断待检测目标区域中心点与待检测目标点间能否通视。
最后说明的是,以上优选实施例仅用以说明本发明的技术方案而非限制,尽管通过上述优选实施例已经对本发明进行了详细的描述,但本领域技术人员应当理解,可以在形式上和细节上对其作出各种各样的改变,而不偏离本发明权利要求书所限定的范围。
最后说明的是,以上优选实施例仅用以说明本发明的技术方案而非限制,尽管通过上述优选实施例已经对本发明进行了详细的描述,但本领域技术人员应当理解,可以在形式上和细节上对其作出各种各样的改变,而不偏离本发明权利要求书所限定的范围。

Claims (4)

1.一种基于异构并行架构的快速通视分析方法,其特征在于:该方法步骤为:利用适用于异构并行加速的通视分析方法,获取选定的待检测目标区域内的地理高程数据并利用显示存储器进行高程数据提取与存储,通过基于图形处理器GPU的通用计算方法,简化通视分析处理过程,允许选定的待检测目标区域中心点与各待检测目标点同时进行通视分析处理;
具体为:
S1:设置待检测目标区域中心点位置存储器与待检测目标点位置存储器,分别用于存储待检测目标区域中心点与待检测目标点所在位置,为后续通视分析作为支撑;
S2:根据位置存储器中数据,在待检测目标区域中心点与待检测目标点间构建连接线,判断在连线段上是否发生地形穿越,并将检测结果存储于通视分析结果存储器中;
S3:根据结果存储器中的结果,判断待检测目标区域中心点与待检测目标点间能否通视。
2.根据权利要求1所述的一种基于异构并行架构的快速通视分析方法,其特征在于:所述获取选定的待检测目标区域内的地理高程数据并利用显示存储器进行高程数据提取与存储为:
在主机端,首先通过对选定的待检测目标区域进行遍历获取场景中相应的地理高程数据,再将待处理的高程数据存储在高速存储器中,当进行通视分析时,直接从纹理寄存器中提取和调用数据。
3.根据权利要求1所述的一种基于异构并行架构的快速通视分析方法,其特征在于:所述基于图形处理器GPU的通用计算方法:
根据异构并行通用计算编程架构,进行数据结构的安排,待检测目标区域中心点与每个待检测目标点对应一个单一的线程块Block,而各线程块有统一的构成一个网格,在进行通视分析过程中,每个Thread均对应于Kernel程序,从而使各个线程并行完成待检测目标区域中心点与每个待检测目标点的通视分析。
4.根据权利要求1~3中任一项所述的一种基于异构并行架构的快速通视分析方法,其特征在于:还包括以下步骤:
S41:在主机端对待检测目标区域进行高程数据遍历,获取整个区域内地理高程数据,拷贝到设备端等待处理;
S42:根据待检测目标区域内高程数据量,在设备端分配存储空间,即按照高程数据量分配存储块,设待检测目标点个数为n,在设备端分配n个存储单元,每一个存储单元对应存储一个待检测目标点与区域中心点;由GPU中线程与存储块的关系得到,每一个存储块由多个存储单元构成;每一对通视检测点都对应一个存储单元,每一个存储块对应一个线程块,一个待检测目标点与区域中心点的通视分析检测过程对应于线程块中的一个处理线程;
S43:当设备端存储空间分配结束,利用通视分析的相关算法,对每个处理线程进行计算,以完成相关的通视分析检测操作;
S44:待通视分析处理结束,将设备端的实验结果拷贝回主机端,并显示结果相关检测结果。
CN201910673306.6A 2019-07-24 2019-07-24 一种基于异构并行架构的快速通视分析方法 Pending CN110378834A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910673306.6A CN110378834A (zh) 2019-07-24 2019-07-24 一种基于异构并行架构的快速通视分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910673306.6A CN110378834A (zh) 2019-07-24 2019-07-24 一种基于异构并行架构的快速通视分析方法

Publications (1)

Publication Number Publication Date
CN110378834A true CN110378834A (zh) 2019-10-25

Family

ID=68255637

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910673306.6A Pending CN110378834A (zh) 2019-07-24 2019-07-24 一种基于异构并行架构的快速通视分析方法

Country Status (1)

Country Link
CN (1) CN110378834A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115794414A (zh) * 2023-01-28 2023-03-14 中国人民解放军国防科技大学 基于并行计算的卫星对地通视分析方法、装置和设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102880509A (zh) * 2012-09-17 2013-01-16 北京大学 基于cuda的格网数字高程模型邻域分析的***和方法
CN103809937A (zh) * 2014-01-26 2014-05-21 北京仿真中心 一种基于gpu的通视并行处理方法
US20150294233A1 (en) * 2014-04-10 2015-10-15 Derek W. Aultman Systems and methods for automatic metadata tagging and cataloging of optimal actionable intelligence
CN106971369A (zh) * 2017-03-02 2017-07-21 南京师范大学 一种基于gpu的地形可视域分析的数据调度与分发方法
CN109118583A (zh) * 2018-08-23 2019-01-01 中国科学院电子学研究所苏州研究院 一种基于cpu和gpu混合的高速并行地形遮蔽计算方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102880509A (zh) * 2012-09-17 2013-01-16 北京大学 基于cuda的格网数字高程模型邻域分析的***和方法
CN103809937A (zh) * 2014-01-26 2014-05-21 北京仿真中心 一种基于gpu的通视并行处理方法
US20150294233A1 (en) * 2014-04-10 2015-10-15 Derek W. Aultman Systems and methods for automatic metadata tagging and cataloging of optimal actionable intelligence
CN106971369A (zh) * 2017-03-02 2017-07-21 南京师范大学 一种基于gpu的地形可视域分析的数据调度与分发方法
CN109118583A (zh) * 2018-08-23 2019-01-01 中国科学院电子学研究所苏州研究院 一种基于cpu和gpu混合的高速并行地形遮蔽计算方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
张刚;汤国安;宋效东;杨坤: "基于DEM的分布式并行通视分析算法研究", 《地理与地理信息科学》 *
张慧杰等: "大规模三维地形可视化算法研究进展", 《计算机科学》 *
范国忠等: "基于CUDA和DEM数据的地杂波快速仿真", 《现代雷达》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115794414A (zh) * 2023-01-28 2023-03-14 中国人民解放军国防科技大学 基于并行计算的卫星对地通视分析方法、装置和设备

Similar Documents

Publication Publication Date Title
CN106203277B (zh) 基于sift特征聚类的固定镜头实时监控视频特征提取方法
CN103336959B (zh) 一种基于gpu多核并行加速的车辆检测方法
US9633467B2 (en) Stencil mapped shadowing system
CN105426375B (zh) 一种关系网络的计算方法及装置
Huang et al. An efficient optical flow based motion detection method for non-stationary scenes
CN110032916A (zh) 一种检测目标物体的方法和装置
CN111915665B (zh) 一种计算机上使用简化求交计算的点在多边形内判定方法
CN110263680A (zh) 图像处理方法、装置和***及存储介质
CN110378834A (zh) 一种基于异构并行架构的快速通视分析方法
CN108615262A (zh) 一种基于gpu的海量模型并行碰撞检测方法
CN102810133B (zh) 网络游戏中的射线查询方法和场景服务器
US10580198B2 (en) System and method for optimized sparse volume rendering
CN108009223A (zh) 一种交易数据的一致性检测方法及装置
Bäuerle et al. Spatial modeling of habitat trees based on line transect sampling and point pattern reconstruction
CN108228351B (zh) Gpu的性能均衡调度方法、存储介质及电子终端
CN109949337A (zh) 基于高斯混合背景模型的运动目标检测方法及装置
WO2021036454A1 (zh) 一种基于屏幕分割的人机相似轨迹检测方法及装置
CN103837135A (zh) 工件检测方法及其***
CN102663958A (zh) 一种顾及拓扑关系的大规模矢量地图快速综合的方法
US9117306B2 (en) Method of stencil mapped shadowing
US7590792B2 (en) Cache memory analyzing method
Luo et al. Accelerating Harris algorithm with GPU for corner detection
CN106484539A (zh) 一种处理器缓存特性的检测分析方法
CN106548512A (zh) 网格模型数据的生成方法
CN112784914B (zh) 一种基于云端处理的管廊视频智能属性检测方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20191025