CN112100300A - 矢量地表覆盖图斑空间拓扑关系快速构建方法及存储介质 - Google Patents
矢量地表覆盖图斑空间拓扑关系快速构建方法及存储介质 Download PDFInfo
- Publication number
- CN112100300A CN112100300A CN202010852684.3A CN202010852684A CN112100300A CN 112100300 A CN112100300 A CN 112100300A CN 202010852684 A CN202010852684 A CN 202010852684A CN 112100300 A CN112100300 A CN 112100300A
- Authority
- CN
- China
- Prior art keywords
- task
- associated object
- arc segment
- object list
- arc
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Probability & Statistics with Applications (AREA)
- Fuzzy Systems (AREA)
- Remote Sensing (AREA)
- Processing Or Creating Images (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种矢量地表覆盖图斑空间拓扑关系快速构建方法及其存储介质,包括构建任务接图表的边缘拓扑关系网,提取任务区内拓扑关系的构建与边缘关系,对任务区之间拓扑关系进行接边和存储。本发明利用基于散列表结构的数据结构来构建接图表以及任务区的拓扑关系,通过把关键码值映射到表中一个位置来访问记录,以加快查找的速度。根据空间图形数据本身的索引结构——任务分区接图表,构建数以千计的子任务,可利用多机、多处理器进行并行驱动,实现加速处理,降低任务耗时。
Description
技术领域
本发明涉及地理信息领域,具体的,涉及一种矢量地表覆盖图斑空间拓扑关系快速构建方法及存储介质。
背景技术
拓扑关系是指满足拓扑几何学原理的各空间数据间的相互关系。即用结点、弧段和多边形所表示的实体之间的邻接、关联、包含和连通关系。如:点与点的邻接关系、点与面的包含关系、线与面的相离关系、面与面的重合关系等。其中,邻接关系、关联关系是其中广泛使用且构建过程最为耗时的基础空间关系。随着空间数据在不同领域的广泛应用,侧重于空间数据的二三维浏览应用需求日渐广泛,这类需求往往无需使用拓扑关系。与自含拓扑关系的空间数据模型相比,无拓扑结构的数据组织有一定的冗余,但数据访问更为简单,且在64位操作***下数据存储不再是技术瓶颈。今天广泛使用的对象化存储模型,采用无拓扑信息存储,格式简单,便于交换,数据更新维护方便,在图形***中被普遍采用,如ESRI的Shape文件、FileGDB文件、AutoCAD的dxf文件,以及一些主流的空间数据库***等。
空间数据的拓扑邻接关系对数据处理和空间分析具有重要的意义:
(1)根据拓扑关系,不需要利用坐标或距离,可以确定一种空间实体相对于另一种空间实体的位置关系。拓扑关系能清楚地反应实体之间的逻辑结构关系,它比集合数据具有更强的稳定性,不随地图投影而变化。
(2)根据拓扑关系,可辅助空间要素的查询,例如,查询某条铁路通过哪些地区,查询某区县与哪些区县邻接,查询河流流经或辐射区域,查询湖泊周围土地类型并进行生态评价等。
(3)根据拓扑关系,可以重建地理实体。例如,根据共享弧段构建同类型图斑,实现面状道路路网提取、面状森林图斑筛选等,避免了大规模数据融合的高额时间代价。
对于依赖空间拓扑关系的分析算法而言,应对大规模矢量面状图斑数据时,必须设计高效的拓扑关系快速构建方法,以满足对象化模型对拓扑信息的实时输入需求。目前,拓扑关系构建方法包括多边形搜索算法、基于不规则三角网的面状图斑拓扑关系构建方法、坐标链栅格化方法等,主要存在以下两个方面问题:
(1)拓扑关系构建过程过于复杂,普通作业人员难以快速掌握
既有的拓扑关系构建方法一般需要组合多项专业技术或算法来辅助提取图斑之间的共享边关系。例如,利用空间索引搜索临近多边形、利用栅格化技术来确定共享边、或利用不规则三角网建立节点与弧段的拓扑关系等。这些技术往往超出普通作业人员的技术水平,难以对复杂的图斑数据依次完成拓扑关系提取、存储组织和应用分析。
(2)主流软件提供的拓扑邻接表计算功能效率较低,不支持分布式部署
在应对大规模矢量图斑数据时,常规的计算软件无法提供任务分治能力。换言之,分区处理结果无法实现统一拼接和管理。ESRI公司的ArcGIS软件提供了拓扑邻接表生成功能,但随着数据规模的增加性能显著下降。在应对亿级规模矢量图斑时,虽然可以在ArcGIS软件基础上开发并行模块进行独立分区的并行处理,但无法对分区边缘的面状图斑进行标识和统一接边处理。
常态化自然资源监测会按照工作任务要求,每年生产覆盖我国陆域国土范围的全覆盖矢量面状图斑数据,如国土三调、地理国情监测等。单一年度的数据规模将在1亿至10亿之间。考虑到坡度、海拔、地貌类型数据的叠加,图斑规模可能超过10亿。根据自然资源的数据共享与计算服务需求
因此,如何能够应对大范围矢量面状图斑拓扑关系的生成难题,建立亿级规模图斑拓扑关系的构建和分布式存储管理;提高拓扑邻接的计算效率,进一步的能够支持分布式部署,成为现有技术亟需解决的技术问题。
发明内容
本发明的目的在于提出一种矢量地表覆盖图斑空间拓扑关系快速构建方法及存储介质,能够利用大数据集的分治处理方法、拓扑关系无缝拼接、拓扑关系一致性计算与更新等实现基于亿级规模的大范围矢量面状图斑,快速构建空间拓扑关系以及支撑拓扑查询、统计应用服务。
为达此目的,本发明采用以下技术方案:
一种矢量地表覆盖图斑空间拓扑关系快速构建方法,其特征在于,包括如下步骤:
任务接图表的边缘拓扑关系网构建步骤S110:
遍历任务接图表中各个图斑,对各个图斑执行图斑操作,所述图斑具体包括:
遍历各个图斑的弧段,将每个弧段两端的坐标以及图斑对应的唯一性编码以二元组结构<Key,Value>的形式存储至散列表中,形成“接图表-弧段-关联对象列表”,其中所述“接图表-弧段-关联对象列表”中的Key为弧段坐标关键字,所述弧段坐标关键字为弧段两个端点的坐标,Value为以弧段坐标为组成边的多边形图斑的唯一性编码;利用所述“接图表-弧段-关联对象列表”,提取其中的图斑关联信息,存储在以二元组结构<Key,Value>的形式存储至散列表中,形成“接图表-对象-关联对象列表”,其中“接图表-对象-关联对象列表”中的Key为当前图斑的唯一性编码,Value为当前图斑的全部关联图斑;
任务区内拓扑关系的构建与边缘关系提取步骤S120:
1).根据图斑集合所在的一个任务区图斑,提取全部弧段,形成“任务区-边缘弧段列表”,该弧段列表对应了一个接图表多边形的全部边缘弧段;
2).对任务区内的图斑集合内进行弧段遍历,遍历每个弧段时,从“任务区-边缘弧段列表”中进行查找,如存在,则以二元组结构<Key,Value>的形式进行组织,存储至散列表中,Key为边缘弧段的弧段坐标关键字,Value为当前边缘弧段在任务区内侧的一个关联对象标识,结果存储至“任务区-边缘弧段-关联对象列表”;
3).对任务区内的图斑集合内进行弧段遍历,提取“任务区-弧段-关联对象列表”中的图斑关联信息,以二元组结构<Key,Value>的形式对弧段和关联对象进行组织,存储至散列表中,形成”任务区-弧段-关联对象列表”,Key为为弧段的坐标关键字,Value为当前弧段在任务区的关联对象标识,存储至”任务区-对象-关联对象列表”;
4).将”任务区-边缘弧段-关联对象列表”和”任务区-对象-关联对象列表”分别进行存储;
任务区之间拓扑关系接边与存储步骤S130:
根据步骤S110中得到“接图表-对象-关联对象列表”得知相应的任务区,并利用相邻任务区的“任务区-弧段-关联对象列表”和“任务区-对象-关联对象列表”,并对相邻任务区进行“逐对”接边处理,全部对象更新完结果后,完成接图表范围内全部矢量图斑的拓扑邻接关系构建与接边处理。
可选的,在上述的各个步骤中,在弧段遍历之前需要对弧段坐标数据进行预处理,使得其按照相同的方向进行存储。
3.根据权利要求1或2所述的矢量地表覆盖图斑空间拓扑关系快速构建方法,其特征在于:
对于上述步骤中的各个列表,在存储的时候以序列化的方式进行存储;
在调用的时候,首先对所存储的文件进行反序列化。
可选的,在步骤S110中,对于“接图表-弧段-关联对象列表”的形成过程具体为:
首先按照“X1,Y1,X2,Y2”对“接图表-弧段-关联对象列表”进行搜索,如不存在,则将“X1,Y1,X2,Y2”和图斑的唯一性编码分别作为Key和Value一起纳入“接图表-弧段-关联对象列表”;如存在,则补充至关联对象列表Value中;
对于“接图表-弧段-关联对象列表”的形成过程,可以对“接图表-弧段-关联对象列表”中关联对象列表大小等于2的记录,读取其中两个唯一性编码,分别各做一次Key项与Value项纳入“接图表-弧段-关联对象列表”以达到对称性。
可选的,对于步骤S120,不同任务区的操作过程完全独立,能够通过多线程或多进程技术实现并行处理,从而将大任务分解为多个独立子任务,利用多机、多处理器进行并行驱动,实现加速处理,降低任务耗时。
可选的,在步骤S130中,对相邻任务区进行“逐对”接边处理具体为:
遍历两个相邻任务区的“任务区-弧段-关联对象列表”,查找是否都具有相应的边缘弧段,如果有则对“任务区-弧段-关联对象列表”和“任务区-对象-关联对象列表”均进行更新,将相应的关联对象标识纳入另外一个任务区的关联对象标识中。
一种最小图斑阈值限定的统计计算,利用上述的矢量地表覆盖图斑空间拓扑关系快速构建方法构建拓扑邻近关系,通过地类图斑的邻接搜索,获知具有相同地类属性的相邻图斑,从而进行面积核算。
一种基础设施临近性分析,利用上述的矢量地表覆盖图斑空间拓扑关系快速构建方法构建拓扑邻近关系,以特定图斑标识为基础,查询与其存在邻接关系的其他图斑。
本发明还公开了一种存储介质,用于存储计算机可执行指令,其特征在于:
所述计算机可执行指令在被处理器执行时执行上述的矢量地表覆盖图斑拓扑关系快速构建方法。
本发明利用基于散列表结构的数据结构来构建接图表以及任务区的拓扑关系,通过把关键码值映射到表中一个位置来访问记录,以加快查找的速度。根据空间图形数据本身的索引结构——任务分区接图表,构建数以千计的子任务,可利用多机、多处理器进行并行驱动,实现加速处理,降低任务耗时。
附图说明
图1是根据本发明具体实施例的矢量地表覆盖图斑空间拓扑关系快速构建方法的流程图;
图2是任务接图表与矢量图斑集合构成关系示意图;
图3是根据本发明具体实施例的任务接图表的边缘拓扑关系网构建过程示例;
图4是根据本发明具体实施例的任务区内拓扑关系的构建与边缘关系提取过程示例;
图5是根据本发明具体实施例的任务区之间拓扑关系接边处理示例;
图6是根据本发明具体实施例的最小图斑阈值限定的统计计算的示例;
图7是根据本发明具体实施例的基础设施临近性分析的示例。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
本发明在于:利用基于散列表结构的数据结构来构建接图表以及任务区的拓扑关系,通过把关键码值映射到表中一个位置来访问记录,以加快查找的速度。根据空间图形数据本身的索引结构——任务分区接图表,构建数以千计的子任务,可利用多机、多处理器进行并行驱动,实现加速处理,降低任务耗时。
基于散列表的数据结构,其构建和查找的过程基本相同,这意味着查询过程可以在常量规模时间内完成。基于散列表的数据结构可快速识别并标识子任务边缘的弧段及其相应图斑,通过与接图表的弧段序列进行比较,可直接建立起跨任务区图斑之间的拓扑邻接关系。而由于能够构建数以千计的子任务,可以将大规模矢量面状图斑的处理通过适宜的分治策略,将高耗时大任务拆解为多项相互独立的子任务。
具体的,参见图1,示出了根据本发明具体实施例的矢量地表覆盖图斑空间拓扑关系快速构建方法的流程图,包括如下步骤:
任务接图表的边缘拓扑关系网构建步骤S110:
该步骤用于构建任务接图表的拓扑关系,其中任务接图表是矢量图斑集合的外部轮廓线,用于限定不同作业队伍实施生产任务时的工作范围。矢量图斑集合不会超出接图表的范围,处于边缘处的图斑会与接图表边线存在共线关系,即拓扑关系中的“邻接关系”,其余图斑则是“包含关系”,构成关系见附图2。
遍历任务接图表中各个图斑,对各个图斑执行图斑操作,所述图斑具体包括:
遍历各个图斑的弧段,将每个弧段两端的坐标以及图斑对应的唯一性编码以二元组结构<Key,Value>的形式存储至散列表(又称哈希表)中,形成“接图表-弧段-关联对象列表”,其中所述“接图表-弧段-关联对象列表”中的Key为弧段坐标关键字,所述弧段坐标关键字为弧段两个端点的坐标,Value为以弧段坐标为组成边的多边形图斑的唯一性编码;然后利用所述“接图表-弧段-关联对象列表”,提取其中的图斑关联信息,设计结果存储在以二元组结构<Key,Value>的形式存储至散列表(又称哈希表)中,形成“接图表-对象-关联对象列表”,其中“接图表-对象-关联对象列表”中的Key为当前图斑的唯一性编码,Value为当前图斑的全部关联图斑。
示例性的,表1示出了“接图表-弧段-关联对象列表”所存储的哈希表结构,Key为字符串类型,Value为字符串类型的列表。
表1“接图表-弧段-关联对象列表”的哈希表存储结构
具体的,存储过程中,首先按照“X1,Y1,X2,Y2”对“接图表-弧段-关联对象列表”进行搜索,如不存在,则将“X1,Y1,X2,Y2”和图斑的唯一性编码分别作为Key和Value一起纳入“接图表-弧段-关联对象列表”;如存在,则补充至关联对象列表Value中。
由于同一个弧段有可能位于边缘,此时对应的Value包括一个多边形图斑的唯一性编码;同一个弧段也有可能位于两个多边形图斑的边界位置,此时,对应的Value包括两个多边形图斑的唯一性编码。
对于“接图表-弧段-关联对象列表”的形成过程,可以对“接图表-弧段-关联对象列表”中关联对象列表大小等于2的记录,读取其中两个唯一性编码,分别各做一次Key项与Value项纳入“接图表-弧段-关联对象列表”以达到对称性。此外,纳入过程中,应做重复性校验,避免重复记录键值对出现。
示例性的,表2示出了“接图表-弧段-关联对象列表”的哈希表存储结构。
表2“接图表-图斑-关联对象列表”的哈希表存储结构
序号 | 字段名称 | 备注 |
1 | Key | 图斑唯一性编码,当前图斑的标识关键字 |
2 | Value | 关联对象列表,当前图斑的全部关联图斑 |
示例性的,图3中示出了任务接图表的边缘拓扑关系网构建过程示例。以任务接图表中的各图斑的弧段为Key,提取不同接图表对象的关联关系,存储为Value,形成“接图表-弧段-关联对象列表”;在此基础上,以接图表中各对象的唯一性标识为Key,通过查询“接图表-弧段-关联对象列表”中的关联对象列表,得到各对象的其他多个关联对象,形成“接图表-图斑-关联对象列表”。
由于任务接图表是矢量图斑集合的外部轮廓线,本步骤相当于形成了整个矢量图斑的总的数据。该步骤计算量较低,无需通过并行计算完成。
任务区内拓扑关系的构建与边缘关系提取步骤S120:
任务区内的矢量图斑集合是拓扑关系构建的主体,数据规模决定了整体耗时。
1).根据图斑集合所在的一个任务区图斑,提取全部弧段,形成“任务区-边缘弧段列表”,该弧段列表对应了一个接图表多边形的全部边缘弧段。例如丰台区的外边线弧段。该列表可以包括弧段的前后端点的坐标位置。
2).对任务区内的图斑集合内进行弧段遍历。遍历每个弧段时,从“任务区-边缘弧段列表”中进行查找,如存在,则以二元组结构<Key,Value>的形式进行组织,存储至散列表(又称哈希表)中,Key为边缘弧段的弧段坐标关键字,Value为当前边缘弧段在任务区内侧的一个关联对象标识,例如任务区内的图斑序号,结果存储至“任务区-边缘弧段-关联对象列表”。
例如,对象标识采用“任务区编码+图斑序号”方式确定,例如“110106_1571”代表110106区县中的第1571号图斑。一个关联对象的列表可以存储多个对象标识。
3).对任务区内的图斑集合内进行弧段遍历,提取“任务区-弧段-关联对象列表”中的图斑关联信息,以二元组结构<Key,Value>的形式对弧段和关联对象进行组织,存储至散列表(又称哈希表)中,形成”任务区-弧段-关联对象列表”,Key为弧段的坐标关键字,Value为当前弧段在任务区的关联对象标识,存储至“任务区-对象-关联对象列表”。
4).将”任务区-边缘弧段-关联对象列表”和”任务区-对象-关联对象列表”分别进行存储。
例如,以序列化的方式进行存储,将其保存为文本文件,在文本文件中以一定的格式进行保存。相应的,在调用的时候,可以对其进行反序列化。
示例性的,“任务区-边缘弧段-关联对象列表”的文件结构为“弧段字符串#关联对象列表”(#为分隔符,关联对象列表中,不同关联对象按照“,”进行分割),逐行存储,文件命名按照“任务区编码_边缘.txt”,例如“110106_边缘.txt”。“任务区-对象-关联对象列表”的文件结构为“当前对象标识:关联对象1标识,关联对象2标识,…”。对象标识采用“任务区编码+图斑序号”方式确定。
过程参见附图4。以一个接图表对象为例,将其弧段提取并存储至“任务区-边缘弧段列表”。遍历该接图表对象内部的全部图斑集合,通过判别弧段是否在“任务区-边缘弧段列表”中来识别边缘弧段,并记录相应的图斑对象,形成“任务区-边缘弧段-关联对象列表”。遍历该接图表对象内部的全部图斑集合,记录全部弧段的关联对象,形成“任务区-弧段-关联对象列表”。最后,类似于步骤S110,提取各对象的其他多个关联对象,形成“任务区-对象-关联对象列表”。
本步骤中,不同任务区的操作过程完全独立,极为容易通过多线程或多进程技术实现并行处理。根据实际测试,可较容易实现多机环境下并行构建拓扑关系,各自形成独立的序列化存储文件。由于任务区内的矢量图斑集合是拓扑关系构建的主体,数据规模决定了整体耗时。因此,通过步骤S120能够将高耗时大任务分解为多个独立子任务,提供了多处理资源并行处理的前提条件,根据空间图形数据本身的索引结构——任务分区接图表,构建数以千计的子任务,可利用多机、多处理器进行并行驱动,实现加速处理,降低任务耗时。
任务区之间拓扑关系接边与存储步骤S130:
根据步骤S110中得到“接图表-对象-关联对象列表”得知相应的任务区,并利用相邻任务区的“任务区-弧段-关联对象列表”和“任务区-对象-关联对象列表”,并对相邻任务区进行“逐对”接边处理,全部对象更新完结果后,完成接图表范围内全部矢量图斑的拓扑邻接关系构建与接边处理。
具体的:遍历两个相邻任务区的“任务区-弧段-关联对象列表”,查找是否都具有相应的边缘弧段,如果有则对“任务区-弧段-关联对象列表”和“任务区-对象-关联对象列表”均进行更新,将相应的关联对象标识纳入另外一个任务区的关联对象标识中。
以相邻任务区A与B为例:
1)分别从任务区存储文件反序列化“任务区-边缘弧段-关联对象列表”,形成(例如)A_map_border和B_map_border,分别从任务区存储文件反序列化“任务区-对象-关联对象列表”,形成A_map_objects和B_map_objects。
2)遍历查找A_map_border中相应的边缘弧段是否在B_map_border中,如存在,则分别更新更新A_map_border和B_map_border,A_map_objects和B_map_objects。
具体更新过程为:首先根据A_map_border中的边缘弧段Key,在B_map_border进行查找和定位,然后将A_map_border中的关联对象标识(例如:AID)纳入至B_map_border的关联对象列表,同时将B_map_border中的关联对象标识(例如:BID)纳入至A_map_border中的关联对象列表;然后以AID为Key将BID纳入至A_map_objects中,以BID为Key将AID纳入<AID,BID>和B_map_objects。
3)更新结束后,将A_map_border、A_map_objects、B_map_border、B_map_objects以此序列化至对应的存储文件,过程同步骤S120中的过程。
示例性的,在图5中示出了根据本发明具体实施例的任务区之间拓扑关系接边处理示例。
进一步的,对于同一个包含(X1,Y1,)和(X2,Y2)的弧段,其坐标存储可能以“X1,Y1,X2,Y2”的形式,也可能为“X2,Y2,X1,Y1”的形式,虽然是相同的弧段,但可能表达的数据结构不同。因此,为了避免错误的被认定为不同的弧段,在弧段遍历之前需要对弧段坐标数据进行预处理,使得其按照相同的方向进行存储。
在一个可选的实施例中,使得其按照相同的方向进行存储可以依次记录两端坐标“X1,Y1,X2,Y2”,如X1>X2,则交换“X1,Y1”与“X2,Y2”顺序,如X1=X2且Y1>Y2,同样交换顺序。
当然,本领域技术人员可以知道,也可以按照相反的方式存储弧段两点的坐标。
在本发明中对于弧段的所有遍历之前,均对弧段坐标数据进行预处理,使得其按照相同的方向进行存储。
通过上述步骤对全国亿级矢量地表覆盖图斑的拓扑邻接关系的构建,以下通过示例说明在地理信息***的应用中具有广泛的应用。
实施例1:最小图斑阈值限定的统计计算
在实施空间统计时,一般会对参与面积计算的图斑大小进行限制。而由于数据生产时多按照不同的分区(接图表)进行,导致位于接边处本属于相同地类的真实地块被划分至不同的任务区内。在面积计算时,边缘图斑由于接图表或行政单元界线的划分导致细碎图斑产生继而被略去计算,造成整体统计结果偏小。一般的处理***多采用空间并集(Union)的方法对相同地类进行图斑融合,但该过程极为耗时,主流的ArcGIS软件尚难以支持百万级以上规模的图斑融合处理。基于本专利的方法,无需进行空间融合,只需对各个图斑的关联对象列表进行查询即可还原原始的真实的地块图斑进行计算。
参见图6,在已经构建拓扑邻接关系的基础上,通过地类图斑的邻接搜索,可知图斑A、C、D、E相邻且具有相同的地类属性(地类属性从原始数据中获取),进而按照同一地块进行面积核算。在统计区域森林覆盖率时,有连续图斑面积大于0.5公顷的约束。当上述ACDE的面积之和大于0.5公顷时,视为一个完整的森林统计斑块。
实施例2:基础设施临近性分析
在全覆盖地表要素中,常常需要统计耕地、林地、牧草地的图斑与河流或道路的临近性。即,哪些地块可以直接与河网或道路网直接相邻,这作为衡量、评价地块质量和区位条件的重要参数。
基于本发明方法构建拓扑邻接关系后,可直接以河网、路网的图斑标识为基础,查询与其存在邻接关系的其他图斑。如图7所示,与河流K直接邻接的耕地有B、C、G地块,属于优质耕地,而J则相聚较远,无法直接进行灌溉。
本发明还公开了一种存储介质,用于存储计算机可执行指令,其特征在于:
所述计算机可执行指令在被处理器执行时执行上述的矢量地表覆盖图斑拓扑关系快速构建方法。
本发明针对亿级规模矢量地表面状图斑拓扑关系的快速构建需求,设计与解决了如下的技术难题:
(1)解决了大范围矢量面状图斑拓扑关系的生成难题
传统的ArcGIS软件难以完成千万及以上规模图斑的邻接关系生成,以多个地市级规模的图斑集合为例进行实际测试,发现70%以上无法返回计算结果。基于散列表哈希键值对结构,可以为共享弧段的矢量图斑建立起精确的匹配关系。针对接图表和任务区图斑,构建两级拓扑关系维护机制,一方面可根据接图表建立起图斑集合之间的边缘性邻接关系,另一方面提供了接图表内部图斑集合的拓扑邻接关系提取和存储方法,最后通过边缘图斑接边处理完成大范围、亿级规模图斑拓扑关系的构建和分布式存储管理。
(2)解决了矢量地理图斑拓扑关系的计算效率问题
矢量图斑拓扑关系构建具有较高的时间复杂度,传统处理方法难以充分利用分布式计算资源对大规模矢量面状图斑的拓扑关系进行分治构建。首先,以接图表作为任务划分依据,将高耗时大任务分解为多个独立子任务,提供了多处理资源并行处理的前提条件。然后,以散列表结构对一维化的弧段关键字进行存储,在较低内存使用率基础上,将查找复杂度降低为常量规模,规避了传统空间索引、栅格化等间接方法实现精确判别的高额代价。
本发明为解决亿级矢量面状图斑的拓扑邻接关系构建提供了切实可行的技术方法体系,将复杂的统计业务流程有效拆解,并具有如下的优点:
本发明可显著提高大规模矢量面状图斑拓扑邻接关系构建的计算效率。常规构建方法,如不规则三角网,往往过于繁杂,难以对百万乃至千万规模数据进行快速处理,且无法有效支持分布式数据集的拓扑关系拼接。对于本发明,经实际测试发现,单机单颗CPU环境下,利用本发明的方法处理某一区县全部面状图斑(218368个)的拓扑邻接关系构建共耗时为121秒,明显优于通过学术渠道搜索到的其它技术方法;三台高性能计算节点(60颗CPU核心)环境下,处理三个相邻省份约3.3千万个图斑数据时,约耗时679秒来完成多任务区的内部拓扑关系并行构建和边缘图斑拓扑关系串行拼接。
本发明可应用于实施有关图斑最小面积约束的统计分析应用。例如,计算区域森林覆盖率时,有连续图斑面积大于0.5公顷的约束,而林地图斑往往因各类行政界线、自然界线影响被划分为多个独立图斑,因此需耗费大量的时间实施图斑融合操作。本发明通过预先构建拓扑关系,可较容易提取出同地类的相邻图斑以进行连续面积约束检查,避免了计算前的数据融合操作。该发明目前已应用于森林覆盖率计算。
本发明可应用于空间要素的关联查询,例如,京港澳高速公路沿线区域,直接相邻或影响的地类图斑有哪些(拓扑邻接关系查询);受污染河流与人口聚居地的关联强度(拓扑关联关系查询)等。
显然,本领域技术人员应该明白,上述的本发明的各单元或各步骤可以用通用的计算装置来实现,它们可以集中在单个计算装置上,可选地,他们可以用计算机装置可执行的程序代码来实现,从而可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件的结合。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施方式仅限于此,对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单的推演或替换,都应当视为属于本发明由所提交的权利要求书确定保护范围。
Claims (9)
1.一种矢量地表覆盖图斑空间拓扑关系快速构建方法,其特征在于,包括如下步骤:
任务接图表的边缘拓扑关系网构建步骤S110:
遍历任务接图表中各个图斑,对各个图斑执行图斑操作,所述图斑具体包括:
遍历各个图斑的弧段,将每个弧段两端的坐标以及图斑对应的唯一性编码以二元组结构<Key,Value>的形式存储至散列表中,形成“接图表-弧段-关联对象列表”,其中所述“接图表-弧段-关联对象列表”中的Key为弧段坐标关键字,所述弧段坐标关键字为弧段两个端点的坐标,Value为以弧段坐标为组成边的多边形图斑的唯一性编码;利用所述“接图表-弧段-关联对象列表”,提取其中的图斑关联信息,存储在以二元组结构<Key,Value>的形式存储至散列表中,形成“接图表-对象-关联对象列表”,其中“接图表-对象-关联对象列表”中的Key为当前图斑的唯一性编码,Value为当前图斑的全部关联图斑;
任务区内拓扑关系的构建与边缘关系提取步骤S120:
1).根据图斑集合所在的一个任务区图斑,提取全部弧段,形成“任务区-边缘弧段列表”,该弧段列表对应了一个接图表多边形的全部边缘弧段;
2).对任务区内的图斑集合内进行弧段遍历,遍历每个弧段时,从“任务区-边缘弧段列表”中进行查找,如存在,则以二元组结构<Key,Value>的形式进行组织,存储至散列表中,Key为边缘弧段的弧段坐标关键字,Value为当前边缘弧段在任务区内侧的一个关联对象标识,结果存储至“任务区-边缘弧段-关联对象列表”;
3).对任务区内的图斑集合内进行弧段遍历,提取“任务区-弧段-关联对象列表”中的图斑关联信息,以二元组结构<Key,Value>的形式对弧段和关联对象进行组织,存储至散列表中,形成”任务区-弧段-关联对象列表”,Key为为弧段的坐标关键字,Value为当前弧段在任务区的关联对象标识,存储至”任务区-对象-关联对象列表”;
4).将”任务区-边缘弧段-关联对象列表”和”任务区-对象-关联对象列表”分别进行存储;
任务区之间拓扑关系接边与存储步骤S130:
根据步骤S110中得到“接图表-对象-关联对象列表”得知相应的任务区,并利用相邻任务区的“任务区-弧段-关联对象列表”和“任务区-对象-关联对象列表”,并对相邻任务区进行“逐对”接边处理,全部对象更新完结果后,完成接图表范围内全部矢量图斑的拓扑邻接关系构建与接边处理。
2.根据权利要求1所述的矢量地表覆盖图斑空间拓扑关系快速构建方法,其特征在于:
在上述的各个步骤中,在弧段遍历之前需要对弧段坐标数据进行预处理,使得其按照相同的方向进行存储。
3.根据权利要求1或2所述的矢量地表覆盖图斑空间拓扑关系快速构建方法,其特征在于:
对于上述步骤中的各个列表,在存储的时候以序列化的方式进行存储;
在调用的时候,首先对所存储的文件进行反序列化。
4.根据权利要求2或3所述的矢量地表覆盖图斑空间拓扑关系快速构建方法,其特征在于:
在步骤S110中,对于“接图表-弧段-关联对象列表”的形成过程具体为:
首先按照“X1,Y1,X2,Y2”对“接图表-弧段-关联对象列表”进行搜索,如不存在,则将“X1,Y1,X2,Y2”和图斑的唯一性编码分别作为Key和Value一起纳入“接图表-弧段-关联对象列表”;如存在,则补充至关联对象列表Value中;
对于“接图表-弧段-关联对象列表”的形成过程,可以对“接图表-弧段-关联对象列表”中关联对象列表大小等于2的记录,读取其中两个唯一性编码,分别各做一次Key项与Value项纳入“接图表-弧段-关联对象列表”以达到对称性。
5.根据权利要求2所述的矢量地表覆盖图斑空间拓扑关系快速构建方法,其特征在于:
对于步骤S120,不同任务区的操作过程完全独立,能够通过多线程或多进程技术实现并行处理,从而将大任务分解为多个独立子任务,利用多机、多处理器进行并行驱动,实现加速处理,降低任务耗时。
6.根据权利要求2所述的矢量地表覆盖图斑空间拓扑关系快速构建方法,其特征在于:
在步骤S130中,对相邻任务区进行“逐对”接边处理具体为:
遍历两个相邻任务区的“任务区-弧段-关联对象列表”,查找是否都具有相应的边缘弧段,如果有则对“任务区-弧段-关联对象列表”和“任务区-对象-关联对象列表”均进行更新,将相应的关联对象标识纳入另外一个任务区的关联对象标识中。
7.一种最小图斑阈值限定的统计计算,其特征在于:
利用权利要求1-6中任意一项所述的矢量地表覆盖图斑空间拓扑关系快速构建方法构建拓扑邻近关系,通过地类图斑的邻接搜索,获知具有相同地类属性的相邻图斑,从而进行面积核算。
8.一种基础设施临近性分析,其特征在于:
利用权利要求1-6中任意一项所述的矢量地表覆盖图斑空间拓扑关系快速构建方法构建拓扑邻近关系,以特定图斑标识为基础,查询与其存在邻接关系的其他图斑。
9.一种存储介质,用于存储计算机可执行指令,其特征在于:
所述计算机可执行指令在被处理器执行时执行权利要求1-6中任意一项所述的矢量地表覆盖图斑拓扑关系快速构建方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010852684.3A CN112100300B (zh) | 2020-08-22 | 2020-08-22 | 矢量地表覆盖图斑空间拓扑关系快速构建方法及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010852684.3A CN112100300B (zh) | 2020-08-22 | 2020-08-22 | 矢量地表覆盖图斑空间拓扑关系快速构建方法及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112100300A true CN112100300A (zh) | 2020-12-18 |
CN112100300B CN112100300B (zh) | 2022-02-18 |
Family
ID=73753167
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010852684.3A Active CN112100300B (zh) | 2020-08-22 | 2020-08-22 | 矢量地表覆盖图斑空间拓扑关系快速构建方法及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112100300B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112948518A (zh) * | 2021-03-05 | 2021-06-11 | 苍穹数码技术股份有限公司 | 对象处理方法、装置、电子设备和计算机存储介质 |
CN113032404A (zh) * | 2021-05-20 | 2021-06-25 | 中国测绘科学研究院 | 一种面向地表覆盖数据的图斑变化轨迹提取方法与*** |
CN113268544A (zh) * | 2021-05-31 | 2021-08-17 | 新华三技术有限公司 | 一种数据处理方法及装置 |
CN114244595A (zh) * | 2021-12-10 | 2022-03-25 | 北京达佳互联信息技术有限公司 | 权限信息的获取方法、装置、计算机设备及存储介质 |
CN115359149A (zh) * | 2022-08-24 | 2022-11-18 | 中国测绘科学研究院 | 一种泛化拓扑结构约束下的连续图斑化简方法 |
CN115564672A (zh) * | 2022-09-22 | 2023-01-03 | 中国测绘科学研究院 | 一种带状面要素数据实体修复方法 |
CN116416340A (zh) * | 2023-03-16 | 2023-07-11 | 中国测绘科学研究院 | 一种连续铺盖数据的拓扑快速构建算法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101251929A (zh) * | 2008-02-29 | 2008-08-27 | 浙江大学 | 基于Delaunay三角网技术的区域拓扑关系构建方法 |
US20130238649A1 (en) * | 2011-07-08 | 2013-09-12 | Annie Shum | Visual and context-oriented curation and knowledge/insight discovery platform |
CN103412863A (zh) * | 2013-06-05 | 2013-11-27 | 东南大学 | 面向嵌入式设备的大容量矢量地图快速可视化实现方法 |
CN104298734A (zh) * | 2014-09-30 | 2015-01-21 | 东南大学 | 土地利用现状变更调查中变更图斑移动更新方法 |
CN106649777A (zh) * | 2016-12-27 | 2017-05-10 | 中科宇图科技股份有限公司 | 一种在全景矢量数据中构建路口拓扑关系的方法 |
CN107103061A (zh) * | 2017-04-14 | 2017-08-29 | 中国科学院遥感与数字地球研究所 | 一种室内空间单元的动态邻接矩阵的构建方法及装置 |
CN108985309A (zh) * | 2017-05-31 | 2018-12-11 | 腾讯科技(深圳)有限公司 | 一种数据处理方法以及装置 |
-
2020
- 2020-08-22 CN CN202010852684.3A patent/CN112100300B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101251929A (zh) * | 2008-02-29 | 2008-08-27 | 浙江大学 | 基于Delaunay三角网技术的区域拓扑关系构建方法 |
US20130238649A1 (en) * | 2011-07-08 | 2013-09-12 | Annie Shum | Visual and context-oriented curation and knowledge/insight discovery platform |
CN103412863A (zh) * | 2013-06-05 | 2013-11-27 | 东南大学 | 面向嵌入式设备的大容量矢量地图快速可视化实现方法 |
CN104298734A (zh) * | 2014-09-30 | 2015-01-21 | 东南大学 | 土地利用现状变更调查中变更图斑移动更新方法 |
CN106649777A (zh) * | 2016-12-27 | 2017-05-10 | 中科宇图科技股份有限公司 | 一种在全景矢量数据中构建路口拓扑关系的方法 |
CN107103061A (zh) * | 2017-04-14 | 2017-08-29 | 中国科学院遥感与数字地球研究所 | 一种室内空间单元的动态邻接矩阵的构建方法及装置 |
CN108985309A (zh) * | 2017-05-31 | 2018-12-11 | 腾讯科技(深圳)有限公司 | 一种数据处理方法以及装置 |
Non-Patent Citations (1)
Title |
---|
赵珂等: "基于ArcEngi玳的空间分析关键技术的研究与应用", 《南昌航空大学学报》 * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112948518A (zh) * | 2021-03-05 | 2021-06-11 | 苍穹数码技术股份有限公司 | 对象处理方法、装置、电子设备和计算机存储介质 |
CN112948518B (zh) * | 2021-03-05 | 2024-05-14 | 苍穹数码技术股份有限公司 | 对象处理方法、装置、电子设备和计算机存储介质 |
CN113032404A (zh) * | 2021-05-20 | 2021-06-25 | 中国测绘科学研究院 | 一种面向地表覆盖数据的图斑变化轨迹提取方法与*** |
CN113268544A (zh) * | 2021-05-31 | 2021-08-17 | 新华三技术有限公司 | 一种数据处理方法及装置 |
CN114244595A (zh) * | 2021-12-10 | 2022-03-25 | 北京达佳互联信息技术有限公司 | 权限信息的获取方法、装置、计算机设备及存储介质 |
CN114244595B (zh) * | 2021-12-10 | 2024-03-12 | 北京达佳互联信息技术有限公司 | 权限信息的获取方法、装置、计算机设备及存储介质 |
CN115359149A (zh) * | 2022-08-24 | 2022-11-18 | 中国测绘科学研究院 | 一种泛化拓扑结构约束下的连续图斑化简方法 |
CN115564672A (zh) * | 2022-09-22 | 2023-01-03 | 中国测绘科学研究院 | 一种带状面要素数据实体修复方法 |
CN116416340A (zh) * | 2023-03-16 | 2023-07-11 | 中国测绘科学研究院 | 一种连续铺盖数据的拓扑快速构建算法 |
CN116416340B (zh) * | 2023-03-16 | 2023-09-26 | 中国测绘科学研究院 | 一种连续铺盖数据的拓扑快速构建算法 |
Also Published As
Publication number | Publication date |
---|---|
CN112100300B (zh) | 2022-02-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112100300B (zh) | 矢量地表覆盖图斑空间拓扑关系快速构建方法及存储介质 | |
Matai et al. | Traveling salesman problem: an overview of applications, formulations, and solution approaches | |
Ding | The Complex Network Theory‐Based Urban Land‐Use and Transport Interaction Studies | |
CN105630988A (zh) | 一种快速检测空间数据变化并更新的方法及*** | |
Bendechache et al. | Efficient large scale clustering based on data partitioning | |
Ghosh et al. | Traj-cloud: a trajectory cloud for enabling efficient mobility services | |
Xiong | A three-stage computational approach to network matching | |
Pande et al. | SkyGraph: Retrieving regions of interest using skyline subgraph queries | |
Bembenik et al. | Methods for mining co–location patterns with extended spatial objects | |
Karsznia et al. | Using machine learning and data enrichment in the selection of roads for small-scale maps | |
CN114723108B (zh) | 城市路网海量公共服务设施可达性计算方法与装置 | |
Bahrdt et al. | Searching OSM Planet with context-aware spatial relations | |
Alemi et al. | KTMiner: distributed k-truss detection in big graphs | |
Pendyala | Development of GIS-based conflation tools for data integration and matching | |
Zhang et al. | Railway wagon flow routing locus pattern intelligent recognition algorithm based on SST | |
Zhao et al. | A framework for group converging pattern mining using spatiotemporal trajectories | |
Santos et al. | Comparative performance evaluation of relational and NoSQL databases for spatial and mobile applications | |
Malerba et al. | Spatial clustering of structured objects | |
Yang et al. | Matching road network combining hierarchical strokes and probabilistic relaxation method | |
Bembenik et al. | Discovering collocation rules and spatial association rules in spatial data with extended objects using Delaunay diagrams | |
Ranjith et al. | Privacy-preserving data mining in spatiotemporal databases based on mining negative association rules | |
Choe et al. | Framework and workflows for spatial database generalization | |
KR20010057053A (ko) | 지도정보 좌표값을 이용한 다조건 최적경로 산출방법 | |
Hardy | Active Objects And Dynamic Topology For Spatial Data Re-Engineering And Rich Data Modelling | |
CN117827961B (zh) | 一种基于大数据的国土空间规划方法及相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |